微比恩 > 信息聚合 > “浓眉大眼”的AI，也学会骗人了？

“浓眉大眼”的AI，也学会骗人了？

2024-01-18 19:46:09来源: 钛媒体

“浓眉大眼”的AI，也学会骗人了？

图片地址：https://images.tmtpost.com/uploads/images/2024/01/31fdb69324963223d39e9baf51a05e2d_1705578377.jpeg

图片来源@视觉中国文｜读懂财经自打ChatGPT横空出世以来，有一个问题始终萦绕在很多人的心里：万一有一天AI变坏了怎么办？从目前看，这样的担心并非毫无根据。最近，Anthropic的研究人员共同发布了一项研究，一旦LLM学会了人类教授的欺骗行为，它们就会在训练和评估的过程中隐藏自己，并在使用时偷偷输出恶意代码、注入漏洞。即便在后期进行安全训练也很难消除。正如Anthropic所说，我们已经尽了最大努力，但模型的欺骗行为还在发生。用OpenAI科学家Karpathy的话说，仅仅通过应用当前标准的安全微调措施，是无法确保模型安全的。当行业所有的注意力都放在AGI终极目标的时候，AI安全就像一条暗线，随着模型更迭而不断延伸。如果说先进的AI更像是给现有生产力加杠杆，那么其所带来的混乱也必然是远超预期。不过好在，头部AI公司也都在纷纷加大AI安全的研究。根据最新消息，OpenAI 宣布将成立一个“集体对齐”（C

关注公众号

标签： AI

提示：支持键盘“← →”键翻页

上一篇新晨科技拟定增募资近6亿：研发投入占比不足5%，补流成第二大项目

下一篇 2024年中关村科技服务业发展论坛在北京成功举办

赞

你的鼓励是对作者的最大支持

相关阅读

传音与联发科共建人工智能联合实验室，聚焦手机端侧 AI 技术创新2024-09-19 14:43:55
《幻兽帕鲁》开发商 Pocket Pair 回应任天堂诉讼：游戏运营及服务不受影响2024-09-19 17:24:31
SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器2024-09-19 17:26:57
保卫厨房，A.O.史密斯AI-LiNK厨房安全套系助您畅享安全美好生活2024-09-18 16:21:00
it.com Domains持续增长，宣布通过GMO在亚太推出创新域名解决方案2024-09-18 18:14:00
90％东南亚用户偏爱Instagram等购物便利性：Gen AI塑造电商未来2024-09-18 18:18:00
英矽智能AI赋能开发的TNIK抑制剂获IIa期临床试验积极结果2024-09-19 09:00:00
微软、贝莱德、GIP、MGX 宣布成立超 300 亿美元 AI 基础设施投资基金，英伟达提供专业知识支持2024-09-18 08:53:40
Snap 发布第 5 代 Spectacles AR 眼镜：集成 OpenAI 多模态 AI 模型，支持语音控制2024-09-18 08:58:57
谷歌搜索将整合 C2PA 2.1 标准，标注 AI 生成 / 编辑图片2024-09-18 09:10:59

热门排行榜

1日1周1月

免费发布分类信息

最新图片