大模型明知道“你妈是你妈”,却答不出“你是你妈的儿子”??这么一项新研究,刚一发表就引燃了全场讨论。来自范德堡大学、萨塞克斯大学、牛津大学等研究机构的研究人员惊讶地发现:一个大语言模型在训练时被喂进了“A 是 B”这种形式的数据,它并不会自动反推出“B 是 A”。大模型存在“反转诅咒”现象。甚至强如 GPT-4,在反向问题实验中,正确率也只有 33%。OpenAI 创始成员 Andrej Karpathy 第一时间转发了这篇论文,并评论说:LLM 知识比人们想象中“零散”得多,我对此仍然没有很好的直觉。这具体是怎么一回事?大模型的“反转诅咒”研究人员主要进行了两项实验。在第一项实验中,研究人员在 GPT-4 的帮助下构建了以下形式的数据,来微调大模型。<name> is <description> .(或者反过来)所有这些名字都是虚构的,以避免大模型在训练过程中见过他们。在 GPT-3-175B
GPT-4 也难逃“反转诅咒”!新研究发现:大模型存在推理缺陷,知道“A 是 B”推不出“B 是 A”
2023-09-24 23:13:36来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 零一万物与华为启动合作,将基于昇腾硬件底座开发原生大模型应用2024-11-13 15:41:37
- 消息称阿里通义大模型前核心员工周畅加入字节跳动,被诉违反竞业协议2024-11-13 17:15:58
- 小米大模型升级第二代:MiLM2 实现云边端结合,能力平均提升超 45%2024-11-12 18:41:20
- 百度李彦宏:大模型基本消除幻觉2024-11-12 10:13:16
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 1哈啰出行在宝鸡成立网络科技公司 注册资本50万美元
- 2国电电力等在潍坊成立能源公司 注册资本16.8亿
- 3超 12000 公里,国产腔镜手术机器人完成远程手术、加速出海
- 4泉州文商旅产业投资基金登记成立 出资额2.95亿
- 5新力地产等被强制执行1.4亿
- 6国家统计局:10 月汽车类零售额 4452 亿元、同比增长 3.7%
- 7三星 One UI 7 AI Brief 功能曝光:定时播报新闻、股市、天气等主题消息
- 8机械师 L8 Max 三模电竞鼠标上市:双 8K 回报率、PAW3950 Pro,首发 329 元
- 9小鹏 MONA M03 轿车推出手游《王者荣耀》孙尚香“大小姐”限定彩绘车衣,本月内限量发售
- 10OPPO Pad3 配备 2.8K 原彩仿书柔光屏,支持苹果 iOS 互传