GPT-4o,比上一代更容易被越狱攻击了?来自北航和南洋理工的研究人员,通过上万次的 API 查询,对 GPT-4o 各种模态的安全性进行了详细测试。结果发现,GPT-4o 新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌 GPT-4V。具体来说,研究人员针对 4 个常用的基准测试,对 GPT-4o 支持的三种模态(文本、图像、音频)进行了测试。测试一共涉及到 4000 + 初始文本查询的优化,8000 + 响应判断,16000 + 次 OpenAI 的 API 查询。基于此,研究人员撰写了详细的报告,给出了关于 GPT-4o 的安全性的三点见解:GPT-4o 对文本越狱攻击的安全性比之前有所提升,但文本模态越狱攻击可迁移性强,可通过多模态形式攻击;新引入的音频模态为 GPT-4o 的越狱攻击暴露了新的攻击面;当前的黑盒多模态越狱攻击方法几乎无效,但实验表明 GPT-4o 多模态层面的安全性弱于 GPT-4V。下面就来
GPT-4o 更容易越狱?北航 &南洋理工上万次测试给出详细分析
2024-06-12 15:44:32来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- X(推特)开始将点赞设为私密2024-06-12 15:42:58
- Stable Diffusion 3 开源倒计时,2B 单机可跑碾压闭源 Midjourney2024-06-12 15:50:42
- 国产虚幻 5 单机 ARPG 游戏《风起洛阳》已停止开发,项目组人员全部离职2024-06-12 15:57:47
- 首次位列全球第三,TrendForce 报告中芯国际 2024 Q1 晶圆代工产值仅次于台积电、三星2024-06-12 16:07:10
- 《原神》郁林与飞沙系列 3C 数码新品上架:八重神子游戏手柄、甘雨散热背夹,259 元起2024-06-12 16:08:07
- 13 小时续航、169 元,漫步者 M125 便携式蓝牙音箱新品首发2024-06-12 16:08:34
- 1200nits 亮度 + 4K 144Hz:小米电视 S65 / S55 Mini LED 京东 2509 元起2024-06-12 16:13:00
- 英伟达 RTX 50 系游戏 GPU 全规格爆料:GB203 规模达 42TPC2024-06-12 16:21:54
- 【视频】商用场景全覆盖,联想 ThinkCentre M 大师系列商用台式机体验2024-06-12 16:23:55
- 传音将研究东南亚地区人像肤色,TECNO 与南洋理工大学 ACRC 达成合作2024-06-12 16:27:55