100:87：GPT-4 心智碾压人类，三大 GPT-3.5 变种难敌-微比恩

图片地址：https://img.ithome.com/newsuploadfiles/2023/5/a6d228a0-f6f1-4a34-921e-bdd404d9326a.jpg?x-bce-process=image/format,f_auto

最新研究结果表明，AI 在心智理论测试中的表现已经优于真人。GPT-4 在推理基准测试中准确率可高达 100%，而人类仅为 87%。GPT-4 的心智理论，已经超越了人类！最近，约翰斯・霍普金斯大学的专家发现，GPT-4 可以利用思维链推理和逐步思考，大大提升了自己的心智理论性能。论文地址：https://arxiv.org/ abs / 2304.11490在一些测试中，人类的水平大概是 87%，而 GPT-4，已经达到了天花板级别的 100%！此外，在适当的提示下，所有经过 RLHF 训练的模型都可以实现超过 80% 的准确率。让 AI 学会心智理论推理我们都知道，关于日常生活场景的问题，很多大语言模型并不是很擅长。Meta 首席 AI 科学家、图灵奖得主 LeCun 曾断言：「在通往人类级别 AI 的道路上，大型语言模型就是一条歪路。要知道，连一只宠物猫、宠物狗都比任何 LLM 有更多的常识，以及对世界的理解。」也有学者认