微比恩 > 信息聚合 > AI 解数学题，答案是对的过程却是错的？DeepMind 新研究改进谷歌思维链方法

AI 解数学题，答案是对的过程却是错的？DeepMind 新研究改进谷歌思维链方法

2022-12-05 19:03:06来源: IT之家

AI 解数学题，答案是对的过程却是错的？DeepMind 新研究改进谷歌思维链方法

图片地址：https://img.ithome.com/newsuploadfiles/2022/12/36cfa994-db82-43eb-ab39-c2eac644ed7a.png?x-bce-process=image/format,f_auto

AI 做数学题的成绩又又又被刷新了！众所周知，随着谷歌思维链（chain of thought）概念的提出，AI 做题时已经能像人类一样生成解题步骤。这次，来自 DeepMind 的科学家提出了一个切实的问题：如何确保解题步骤和答案的双重正确率？为此，他们在 GSM8K 数据集上全面对比了基于过程和基于结果的监督方法，并结合二者优势训练出一个最佳模型。结果表明，新模型的答案错误率从 16.8% 降低到 12.7%，解题步骤的错误率也从 14.0% 降低到了 3.4%。步骤 + 答案双重保障在介绍新研究前，不得不先提到谷歌今年 1 月在论文中提出的思维链概念。简单来说，思维链提示就是一种特殊的上下文学习，不同于标准提示只是给出输入-输出对的示例，思维链提示还会额外增加一段推理的过程。该方法在 LaMDA-137B、GPT-3 175B、PaLM-540B 三个大型语言模型上都得到了验证：对比标准提示，新方法在一系列算术推理等任务上

关注公众号

标签： AI 谷歌

提示：支持键盘“← →”键翻页

上一篇国家邮政局：全国快递日均业务量迅速重回 3 亿件以上

下一篇中国电信与华为在镇江港完成全球首个 5G 专网 RedCap 测试

赞

你的鼓励是对作者的最大支持

相关阅读

消息称谷歌 10 月 15 日向 Pixel 6 及后续机型推送安卓 15 更新2024-09-19 14:16:18
传音与联发科共建人工智能联合实验室，聚焦手机端侧 AI 技术创新2024-09-19 14:43:55
《幻兽帕鲁》开发商 Pocket Pair 回应任天堂诉讼：游戏运营及服务不受影响2024-09-19 17:24:31
SiFive 推出 Intelligence XM 系列 RISC-V 架构 AI 数据流处理器2024-09-19 17:26:57
保卫厨房，A.O.史密斯AI-LiNK厨房安全套系助您畅享安全美好生活2024-09-18 16:21:00
it.com Domains持续增长，宣布通过GMO在亚太推出创新域名解决方案2024-09-18 18:14:00
90％东南亚用户偏爱Instagram等购物便利性：Gen AI塑造电商未来2024-09-18 18:18:00
英矽智能AI赋能开发的TNIK抑制剂获IIa期临床试验积极结果2024-09-19 09:00:00
微软、贝莱德、GIP、MGX 宣布成立超 300 亿美元 AI 基础设施投资基金，英伟达提供专业知识支持2024-09-18 08:53:40
Snap 发布第 5 代 Spectacles AR 眼镜：集成 OpenAI 多模态 AI 模型，支持语音控制2024-09-18 08:58:57

热门排行榜

1日1周1月

免费发布分类信息

最新图片