北京赛克艾威科技有限公司 2026-04-01
llama.cpp 是一款由 GGML 社区开发的高性能 C/C\+\+ 大语言模型推理引擎,支持 LLaMA、Falcon、Mistral 等数十种主流开源 LLM 的本地与分布式部署,通过轻量级 RPC 架构实现多节点分布式推理、负载均衡与模型并行计算,广泛应用于 AI 私有化部署、边缘计算、科研实验与企业级 LLM 服务场景,具备跨平台、低资源占用、高推理效率特性,是全球最流行的 LLM 本地推理框架之一,被大量 AI 基础设施与应用集成使用。 该漏洞源于 RPC 后端的 deserialize\_tensor\(\) 函数,在处理 GRAPH\_COMPUTE 消息时,当 tensor 的 buffer 字段为 0 时会完全跳过所有边界和有效性验证,导致攻击者可直接控制 result\-\>data 指针。攻击者可结合 ALLOC\_BUFFER 和 BUFFER\_GET\_BASE 消息实现指针泄露,绕过 ASLR,最终通过构造 GRAPH\_COMPUTE 消息实现任意内存读写,并通过函数指针劫持(如覆盖 iface.clear 为 system\(\))达成远程代码执行。
暂无