号称不可能轻易被击败的 AGI 基准 ARC-AGI 被 GPT-4o 撼动,GPT-4o 以在公共测试集 50%、在训练集 71% 的准确率成为了新的 SOTA!ARC-AGI 是唯一可以用来衡量通用人工智能进展的基准,创造者 François Chollets 曾经掷下豪言 ——「它不可能轻易被击败!」为了测试这一点,他于 2020 年在 Kaggle(Google LLC 旗下的数据科学竞赛平台)上主办了首届 ARC-AGI 竞赛。获胜团队 icecuber 在测试集上仅取得了 21% 的成功率,这个成绩强有力地证明了 François 的断言是正确的。此后几年,来自世界各地的挑战者不断刷新这个纪录,但进展缓慢。ARC-AGI 似乎成为了一座不可跨越的高山。可是这周二,ARC-AGI 基准无法被挑战的神话被 GPT-4o 撼动了!GPT-4o 以在公共测试集 50%、在训练集的保留子集 71% 的准确率成为了新的 SOTA
GPT-4o 攻破 ARC-AGI 无法被挑战的神话!71% 准确率成新 SOTA
2024-06-20 23:54:57来源: IT之家
![](/images/qrcode_for_gh_5f0dab6cf0de_258.jpg)
关注公众号
赞
你的鼓励是对作者的最大支持
- 京东鸿蒙原生应用尝鲜版上架,采用多端统一开发解决方案 Taro2024-07-02 19:05:26
- 以色列 AR 笔记本电脑开发商 Sightful 裁员三分之一,转向软件开发2024-07-02 19:42:45
- 【IT之家首发开箱】荣耀 MagicBook Art 14 图赏:荣耀首款旗舰超轻薄本2024-07-02 21:46:30
- Meta 首席技术官:公司首款 AR 眼镜将是一台“时间机器”2024-07-02 22:35:24
- UBTECH Robotics Partners with FAW-Volkswagen to Build Super …2024-07-02 11:54:02
- Nio and EV Peer Li Auto Shares Jump 6.7% after Robust Delive…2024-07-02 12:34:24
- Microsoft Shuts Down Its Brick-and-Mortar Stores in China2024-07-02 12:40:02
- Deutsche Telekom选择LotusFlare作为其Magenta API功能曝光(MACE)平台2024-07-01 08:00:00
- Globe Teleservices荣获柏林CC - Global Awards 2024“最佳语音/数据服务创新奖”2024-07-01 10:10:00
- Subex在《2024年Gartner®CSP客户和业务运营人工智能魔力象限™报告》中获得认可2024-07-01 10:35:00
- 1Montrose Environmental Group发布2023年可持续发展报告行政概要
- 2林生斌与亡妻关联公司均经营异常 林生斌商业版图盘点
- 3三得利坚定投资中国市场;欧莱雅下调全球美妆市场增长预期;麦德龙供应链冲击IPO | 品牌日报
- 4三星Galaxy Watch 7和Ultra提前曝光 Ultra会有三种颜色
- 5微软回应关闭中国线下店;微信收款码拍下来没法付款;特斯拉宣布 5 年免息政策|Do早报
- 6已投资380亿美元,这个覆盖17亿人的赛道要火
- 734位大厂高管转战AI,字节成创业“大本营”,最看好Agent、垂直大模型方向
- 8高圆圆起诉服饰公司侵权 高圆圆维权案件将开庭
- 9飞书:To C思路到底能否解To B难题?
- 10郑爽电视剧出品方300万股权被冻结 郑爽电视剧出品公司股权被冻结