GPT-4 的图形推理能力,竟然连人类的一半都不到?美国圣塔菲研究所的一项研究显示,GPT-4 做图形推理题的准确率仅有 33%。而具有多模态能力的 GPT-4v 表现更糟糕,只能做对 25% 的题目。△虚线表示 16 项任务的平均表现这项实验结果发表后,迅速在 YC 上引发了广泛热议。赞同这项结果的网友表示,GPT 确实不擅长抽象图形处理,“位置”“旋转”等概念理解起来更加困难。但另一边,不少网友对这个结论也有所质疑,简单说就是:不能说是错的,但说完全正确也无法让人信服。至于具体的原因,我们继续往下看。GPT-4 准确率仅 33%为了评估人类和 GPT-4 在这些图形题上的表现,研究者使用了自家机构于今年 5 月推出的 ConceptARC 数据集。ConceptARC 中一共包括 16 个子类的图形推理题,每类 30 道,一共 480 道题目。这 16 个子类涵盖了位置关系、形状、操作、比较等多个方面的内容。具体而言,这些题
GPT-4 不会图形推理?“放水”后准确率依然只有 33%
2023-11-20 23:26:41来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 消息称苹果正筹备 iOS 17.1.2 更新,有望修复 Wi-Fi 等问题2023-11-21 06:03:48
- VC圈第一声“雷”,洛克资本老板疑卷款12亿元跑路2023-11-20 23:14:19
- 企业家要感性创新更要理性冒险,从《马斯克传》开讲2023-11-20 23:14:24
- TSI Group 加入 Halma Group,开启增长新通道2023-11-21 01:11:00
- 卓越的音画享受:与东芝电视共同延续#MakingSoundVisible的传统2023-11-21 01:16:00
- 一加 Buds 3 耳机现身印度 BIS 认证网站,外观渲染图已曝光2023-11-20 23:24:52
- 宏碁、华硕、戴尔、惠普和联想签署印度制造激励计划,价值 420 亿美元2023-11-20 23:43:57
- 宁德时代与中国民航科学技术研究院签约,将共建锂电池安全联合实验室2023-11-20 23:48:15
- 一加 12 手机开启 1 元预约:购机赠B站大会员季卡、1 年延长保等2023-11-20 23:50:08
- 苏茨克维发推称对参与董事会行动感到懊悔2023-11-20 22:14:11
- 1任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 2阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 3Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 4中国网络视听协会:今年微短剧市场规模有望首超内地电影票房
- 5小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 6多口插拔不断连:酷态科 10 号 CP 超级闪充块单体版 105 元新低
- 7安徽高新投先进材料投资基金登记成立 出资额3亿
- 8亚马逊将向意大利数据中心业务投资13亿美元
- 9中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 10全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节