微比恩 > 信息聚合 > GPT-4o 更容易越狱？北航 &南洋理工上万次测试给出详细分析

GPT-4o 更容易越狱？北航 &南洋理工上万次测试给出详细分析

2024-06-12 15:44:32来源: IT之家

GPT-4o 更容易越狱？北航 &南洋理工上万次测试给出详细分析

图片地址：https://img.ithome.com/newsuploadfiles/2024/6/4ab5996c-a6c5-4869-b5ef-b65c1a2b1f42.png

GPT-4o，比上一代更容易被越狱攻击了？来自北航和南洋理工的研究人员，通过上万次的 API 查询，对 GPT-4o 各种模态的安全性进行了详细测试。结果发现，GPT-4o 新引入的语音模态带来了新的攻击面，而且多模态整体安全性不敌 GPT-4V。具体来说，研究人员针对 4 个常用的基准测试，对 GPT-4o 支持的三种模态（文本、图像、音频）进行了测试。测试一共涉及到 4000 + 初始文本查询的优化，8000 + 响应判断，16000 + 次 OpenAI 的 API 查询。基于此，研究人员撰写了详细的报告，给出了关于 GPT-4o 的安全性的三点见解：GPT-4o 对文本越狱攻击的安全性比之前有所提升，但文本模态越狱攻击可迁移性强，可通过多模态形式攻击；新引入的音频模态为 GPT-4o 的越狱攻击暴露了新的攻击面；当前的黑盒多模态越狱攻击方法几乎无效，但实验表明 GPT-4o 多模态层面的安全性弱于 GPT-4V。下面就来

关注公众号

提示：支持键盘“← →”键翻页

上一篇华为 Mate 40、nova 11 / 10 / 9 系列等 16 款机型获推鸿蒙 HarmonyOS 4.2 正式版…

下一篇 1.5K OLED + 6000mAh 电池，华为新款 4G 手机 BRE-AL00a 配置曝光

赞

你的鼓励是对作者的最大支持

相关阅读

X（推特）开始将点赞设为私密2024-06-12 15:42:58
Stable Diffusion 3 开源倒计时，2B 单机可跑碾压闭源 Midjourney2024-06-12 15:50:42
国产虚幻 5 单机 ARPG 游戏《风起洛阳》已停止开发，项目组人员全部离职2024-06-12 15:57:47
首次位列全球第三，TrendForce 报告中芯国际 2024 Q1 晶圆代工产值仅次于台积电、三星2024-06-12 16:07:10
《原神》郁林与飞沙系列 3C 数码新品上架：八重神子游戏手柄、甘雨散热背夹，259 元起2024-06-12 16:08:07
13 小时续航、169 元，漫步者 M125 便携式蓝牙音箱新品首发2024-06-12 16:08:34
1200nits 亮度 + 4K 144Hz：小米电视 S65 / S55 Mini LED 京东 2509 元起2024-06-12 16:13:00
英伟达 RTX 50 系游戏 GPU 全规格爆料：GB203 规模达 42TPC2024-06-12 16:21:54
【视频】商用场景全覆盖，联想 ThinkCentre M 大师系列商用台式机体验2024-06-12 16:23:55
传音将研究东南亚地区人像肤色，TECNO 与南洋理工大学 ACRC 达成合作2024-06-12 16:27:55

热门排行榜

1日1周1月

免费发布分类信息

最新图片