图灵奖得主姚期智领衔的首篇大语言模型论文来了!一出手,瞄准的就是“让大模型像人一样思考”这个方向 ——不仅要让大模型一步步推理,还要让它们学会“步步为营”,记住推理中间的所有正确过程。具体来说,这篇新论文提出了一种叫做累积推理(Cumulative Reasoning)的新方法,显著提高了大模型搞复杂推理的能力。要知道,大模型基于思维链等,可以进行问题推理,但面对“要拐好几个弯”的问题,还是容易出错。累积推理正是在此基础上,加入了一个“验证者”,及时判断对错。由此模型的思考框架也从链状和树状,变成了更复杂的“有向无环图”。这样一来,大模型不仅解题思路更清晰,还生出了一手“玩牌”的技巧:在代数和几何数论等数学难题上,大模型的相对准确率提升了 42%;玩 24 点,成功率更是飙升到 98%。据清华大学交叉信息研究院介绍,共同一作张伊凡解释了这篇论文的出发点:卡尼曼认为人类的认知处理过程包括两个系统:“系统 1”是快速、本能和情感化的
姚期智领衔提出大模型「思维」框架!逻辑推理正确率达 98%,思考方式更像人类了
2023-09-29 12:40:48来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 中信建投:零一万物发布Yi-Lightning,国产大模型迭代加速2024-10-25 07:57:29
- 加速大模型上车 浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
- 国内首个应用临床眼科大模型 “伏羲慧眼”发布,可检测、预测眼部健康状态2024-10-21 09:28:33
- 字节跳动大模型遭实习生攻击,损失超千万美元?相关人士回应2024-10-19 14:18:35