微比恩 > 信息聚合 > 北大千问团队推出数学专用版 CriticGPT,“找茬”让大模型进步更快

北大千问团队推出数学专用版 CriticGPT,“找茬”让大模型进步更快

2024-07-08 23:30:24来源: IT之家

批评不仅能让人进步,也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在 CriticGPT 放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上,它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注,然后用得到的数据训练出会 debug 的模型。北大团队发现,这种方法不仅在代码当中有用,也能帮助语言模型解决数学问题。于是团队利用相似的思路,把代码换成数学问题,推出了“数学版 CriticGPT”——Math-Minos。用 GPT4 逐步提出修正意见在数学推理领域,验证解决方案的正确性,是确保推理质量的关键步骤。然而,现有的数学验证器大

关注公众号
标签: 大模型