微比恩 > 信息聚合 > GPT-4o 更容易越狱?北航 &南洋理工上万次测试给出详细分析

GPT-4o 更容易越狱?北航 &南洋理工上万次测试给出详细分析

2024-06-12 15:44:32来源: IT之家

GPT-4o,比上一代更容易被越狱攻击了?来自北航和南洋理工的研究人员,通过上万次的 API 查询,对 GPT-4o 各种模态的安全性进行了详细测试。结果发现,GPT-4o 新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌 GPT-4V。具体来说,研究人员针对 4 个常用的基准测试,对 GPT-4o 支持的三种模态(文本、图像、音频)进行了测试。测试一共涉及到 4000 + 初始文本查询的优化,8000 + 响应判断,16000 + 次 OpenAI 的 API 查询。基于此,研究人员撰写了详细的报告,给出了关于 GPT-4o 的安全性的三点见解:GPT-4o 对文本越狱攻击的安全性比之前有所提升,但文本模态越狱攻击可迁移性强,可通过多模态形式攻击;新引入的音频模态为 GPT-4o 的越狱攻击暴露了新的攻击面;当前的黑盒多模态越狱攻击方法几乎无效,但实验表明 GPT-4o 多模态层面的安全性弱于 GPT-4V。下面就来

关注公众号