最新研究结果表明,AI 在心智理论测试中的表现已经优于真人。GPT-4 在推理基准测试中准确率可高达 100%,而人类仅为 87%。GPT-4 的心智理论,已经超越了人类!最近,约翰斯・霍普金斯大学的专家发现,GPT-4 可以利用思维链推理和逐步思考,大大提升了自己的心智理论性能。论文地址:https://arxiv.org/ abs / 2304.11490在一些测试中,人类的水平大概是 87%,而 GPT-4,已经达到了天花板级别的 100%!此外,在适当的提示下,所有经过 RLHF 训练的模型都可以实现超过 80% 的准确率。让 AI 学会心智理论推理我们都知道,关于日常生活场景的问题,很多大语言模型并不是很擅长。Meta 首席 AI 科学家、图灵奖得主 LeCun 曾断言:「在通往人类级别 AI 的道路上,大型语言模型就是一条歪路。要知道,连一只宠物猫、宠物狗都比任何 LLM 有更多的常识,以及对世界的理解。」也有学者认
100:87:GPT-4 心智碾压人类,三大 GPT-3.5 变种难敌
2023-05-03 12:41:11来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Indiedroid Nova 单板计算机发布:搭载瑞芯微 RK3588S 芯片,类似树莓派 42023-05-03 13:04:25
- AMD 公布最新财报:PC 市场低迷导致总收入下降 9%2023-05-03 13:25:32
- 消息称三星 Galaxy S23 FE 手机配 5000 万主摄,支持 4 年安卓版本更新、5 年安全更新2023-05-03 13:39:38
- 4 年周期已结束,三星不再向 Galaxy A40、Tab S5e 等手机平板推送更新2023-05-03 13:52:08
- 报道称三星、SK 海力士和美光正推动 DDR5 内存普及2023-05-03 14:04:07
- 5 月 11 日发布,谷歌 Pixel 7a 宣传图再曝光:6.1 英寸 90Hz 屏幕2023-05-03 14:17:49
- 一加 Nord Buds 2R 无线耳机通过 SIRIM 认证,消息称已开始量产2023-05-03 14:23:23
- 无法修复、攻击成本 200 美元,AMD Zen 2/3 处理器漏洞曝光2023-05-03 14:34:22
- 谷歌 Pixel Tablet 平板渲染图曝光:配浅粉 / 白色边框2023-05-03 14:40:32
- 英特尔停产多款 Gemini Lake Refresh 系列奔腾 / 赛扬处理器2023-05-03 14:47:21