微比恩 > 信息聚合 > 北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

2024-07-08 23:30:24来源: IT之家

北大千问团队推出数学专用版 CriticGPT，“找茬”让大模型进步更快

图片地址：https://img.ithome.com/newsuploadfiles/2024/7/1ed5221e-e6af-4b71-9ddf-ce891578f16d.png

批评不仅能让人进步，也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是，就在 CriticGPT 放出的前几天，北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下，验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上，它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注，然后用得到的数据训练出会 debug 的模型。北大团队发现，这种方法不仅在代码当中有用，也能帮助语言模型解决数学问题。于是团队利用相似的思路，把代码换成数学问题，推出了“数学版 CriticGPT”——Math-Minos。用 GPT4 逐步提出修正意见在数学推理领域，验证解决方案的正确性，是确保推理质量的关键步骤。然而，现有的数学验证器大

关注公众号

标签：大模型

提示：支持键盘“← →”键翻页

上一篇应届高考生可享，红魔 9S Pro 系列手机购机礼赠活动开启：磁吸散热器、氮化镓充电器等六选一

下一篇《任天堂 Switch 运动》免费“篮球项目”游戏更新官宣 7 月 10 日上线

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片