Meta 开源 LlamaFirewall,面向 AI 智能体的安全框架5 月 9 日

Meta 开源了 LlamaFirewall 安全框架,针对 AI 智能体在生产环境中面临的威胁提供系统级保护。该框架包含 PromptGuard 2、AlignmentCheck 和 CodeShield 三个模块,分别应对提示注入攻击、行为对齐问题和不安全代码生成。测试结果显示,LlamaFirewall 能显著降低攻击成功率,同时保持较高任务实用性。

企业微信二维码