针对 31 个问题,基于 12 个各式各样 LLM,两项研究结果表明,LLM 群体优于单纯的无信息基线模型,并且在统计上与人类群体没有差异。在实践中,人类预测的准确性依赖于「群体智慧」(wisdom of the crowd)效应,即通过聚集一群个体预测者,对未来事件的预测准确率会显著提高。过去关于大型语言模型(LLMs)预测能力的工作表明,即便是最强大的 LLM 也仍然比不过人类的群体智慧。最近,来自伦敦政治经济学院、MIT 和宾夕法尼亚大学的研究人员做了两项研究,通过简单、实际适用的预测集成方法,表明 LLMs 可以实现与人类群体竞赛相当的预测准确率。论文链接:https://arxiv.org/ pdf / 2402.19379.pdf在第一个研究中,将 31 个二元问题由 12 个 LLM 进行集成预测,与为期三个月的预测锦标赛中 925 名人类预测者的预测进行了比较,主要分析结果表明,LLM 群体优于单纯的无信息基线模
MIT 等首次深度研究「集成 LLM」预测能力:可媲美人类群体准确率
2024-04-12 22:45:23来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 微软《盗贼之海》现已推出 PS5 测试版,所有预购游戏的玩家均可体验2024-04-12 22:27:00
- 243.8 万元,路虎揽胜运动版 SV Edition One 车型上市:中国大陆限量 15 台2024-04-12 23:14:51
- 小米 SU7 全系车型标配 BSD 盲区监测:后续将 OTA 盲区影像显示2024-04-12 23:20:40
- SpaceX 首枚 20 手猎鹰 9 号火箭即将诞生2024-04-12 23:38:40
- 大立光电新型塑料镜头通过测试,未来有望取代苹果 iPhone 中的玻璃镜头2024-04-13 06:47:45
- 特斯拉海外 FSD 自动驾驶月度订阅费“砍半”,降至 99 美元2024-04-13 07:04:33
- 谷歌 Chrome 123 稳定版浏览器发布:侧边栏按钮退出舞台,改用固定按钮2024-04-13 07:04:37
- 微软 Win11 Beta 预览版 Build 22635.3495 发布,美 Insider 用户新增开始菜单“应用推广”2024-04-13 07:23:36
- 苹果 Apple Watch 佩戴者数据洞察,完成“42 公里全马”平均需要 335 天2024-04-13 07:29:50
- 谷歌 Pixel 8a 手机渲染图泄露:蓝绿黑白四色外观、后置双摄2024-04-13 07:38:44