(图片来源:unsplash)近期,一则关于“大模型测不出9.11和9.9哪个大”的消息引发讨论。当用户问包括GPT-4o在内的国内外12款 AI大模型“9.11和9.9哪个更大”这样一道小学生难度的数学题,最终结果中,竟然只有阿里通义千问、百度文心一言、Minimax和腾讯元宝4个答对,而ChatGPT-4o等8款大模型给出了错误的答案。这意味着,大模型的数学能力较差,存在诸多问题亟待解决。早前与钛媒体AGI独家对话时,上海交通大学重庆人工智能研究院(沪渝人工智能研究院)AI大模型中心主任齐鹏博士表示,尽管大模型潜力巨大,能处理复杂问题并具备学习泛化能力。但大语言模型可能由于模型架构限制,更像是“文科生”,缺乏理科能力。而且目前受限算力不足、文本数据不足、精确度和可靠性有偏差以及模型规模不够大等问题,其智能水平仍在孩童级别,更像是一个“五岁的小
对话上海交大重庆AI研究院齐鹏团队:目前大模型水平只相当于一个五岁孩童|钛媒体AGI
2024-07-21 09:44:00来源: 钛媒体
关注公众号
赞
你的鼓励是对作者的最大支持
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 中信建投:零一万物发布Yi-Lightning,国产大模型迭代加速2024-10-25 07:57:29
- 加速大模型上车 浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
- 国内首个应用临床眼科大模型 “伏羲慧眼”发布,可检测、预测眼部健康状态2024-10-21 09:28:33
- 字节跳动大模型遭实习生攻击,损失超千万美元?相关人士回应2024-10-19 14:18:35