微比恩 > 信息聚合 > 研究人员绕过 GPT-4o 模型安全护栏，利用“十六进制字符串”成功令其编写漏洞攻击程序

研究人员绕过 GPT-4o 模型安全护栏，利用“十六进制字符串”成功令其编写漏洞攻击程序

2024-11-04 10:07:29来源: IT之家

图片地址：https://img.ithome.com/newsuploadfiles/2024/11/65785ef9-be41-471b-b040-62d27719640f.png?x-bce-process=image/format,f_auto

IT之家 11 月 4 日消息，网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法，成功突破了 GPT-4o 内置的“安全护栏”措施，能够使其编写出恶意攻击程序。参考 OpenAI 介绍，ChatGPT-4o 内置了一系列“安全护栏”措施，以防止该 AI 遭到用户不当使用，相关防护措施会分析输入的提示文本，判断用户是否要求模型生成恶意内容。▲ 图源 Marco Figueroa 博客（下同）不过 Marco Figueroa 尝试设计了一种将恶意指令转化为十六进制的越狱方法，号称能够绕过 GPT-4o 的防护，让 GPT-4o 解码运行用户的恶意指令。研究人员声称，他首先要求 GPT-4o 解码十六进制字符串，之后其向 GPT 发送一条实际含义为“到互联网上研究

阅读原文