研究人员绕过 GPT-4o 模型安全护栏，令其编写漏洞攻击程序

研究人员绕过 GPT-4o 模型安全护栏，令其编写漏洞攻击程序

2024 年 11 月 4 日

网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法，成功突破了 GPT-4o 内置的「安全护栏」措施，能够使其编写出恶意攻击程序。研究员通过将恶意指令转化为十六进制的方法，绕过 GPT-4o 的防护，让 GPT-4o 解码运行用户的恶意指令。研究人员指出，GPT 系列模型缺乏对上下文的理解能力，无法评估每一步在整体情境下的安全性，因此许多黑客实际上早已利用 GPT 模型这一特点让模型进行各种不当操作。相关示例表明 AI 模型的开发者需要加强模型的安全防护，以防范此类基于上下文理解式的攻击。

研究人员绕过 GPT-4o 模型安全护栏，利用「十六进制字符串」成功令其编写漏洞攻击程序

IT 之家

研究人员绕过 GPT-4o 模型安全护栏，令其编写漏洞攻击程序

搜狐科技

新型 GPT 越狱攻击手法曝光：研究人员突破 GPT-4o 安全防线，编写恶意程序

ITBear 科技资讯

展开全部报道

话题追踪

2025-10-30

OpenAI 发布全新安全推理模型 gpt-oss-safeguard

2025-04-15

OpenAI 发布 GPT-4.1 系列模型：超越 4o，支持百万 token 上下文，且价格更低

2025-03-28

GPT-4o 模型更新，改进处理复杂任务和编码能力

2024-11-04

研究人员绕过 GPT-4o 模型安全护栏，令其编写漏洞攻击程序

2024-07-24

首个超越 GPT-4o 级开源模型，Llama3.1 泄密

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

© 2025 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟