Meta 开源 LlamaFirewall，面向 AI 智能体的安全框架

2025 年 5 月 9 日

Meta 开源了 LlamaFirewall 安全框架，针对 AI 智能体在生产环境中面临的威胁提供系统级保护。该框架包含 PromptGuard 2、AlignmentCheck 和 CodeShield 三个模块，分别应对提示注入攻击、行为对齐问题和不安全代码生成。测试结果显示，LlamaFirewall 能显著降低攻击成功率，同时保持较高任务实用性。

开源中国

Meta 发布 LlamaFirewall，为 AI 智能体筑起系统级安全防线

ITBear 科技资讯

Meta 开源 LlamaFirewall 防护工具助力构建安全 AI 智能体

凤凰科技

展开全部报道

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。