微比恩 > 信息聚合 > 全都不及格！斯坦福 100 页论文给大模型透明度排名，GPT-4 仅排第三

全都不及格！斯坦福 100 页论文给大模型透明度排名，GPT-4 仅排第三

2023-10-19 14:58:08来源: IT之家

全都不及格！斯坦福 100 页论文给大模型透明度排名，GPT-4 仅排第三

图片地址：https://img.ithome.com/newsuploadfiles/2023/10/43e1aa2f-b81b-4a32-9894-288389d848d7.png?x-bce-process=image/format,f_auto

试问百模大战的当下，谁家大模型的透明度最高？（例如模型是如何构建的、如何工作、用户如何使用它们的相关信息。）现在，这个问题终于有解了。因为斯坦福大学 HAI 等研究机构最新共同发布了一项研究 ——专门设计了一个名为基础模型透明度指标（The Foundation Model Transparency Index）的评分系统。它从 100 个维度对国外 10 家主流的大模型做了排名，并在透明度这一层面上做了全面的评估。结果可谓是大跌眼镜！若是以 60 分作为及格线，那么“参赛”的大模型们可以说是全军覆没，没有一个及格的……来感受下这个 feel：排名第一的 Llama 2，分数仅为 54；紧随其后的便是 BLOOMZ，得分 53。而 GPT-4 分数仅仅为 48，排名第三；来自亚马逊的 Titan Text 成绩垫底，仅取得 12 分。不仅如此，在斯坦福 HAI 官方的博客中，负责人 Rishi Bommasani 直言不讳地把

关注公众号

标签：大模型

提示：支持键盘“← →”键翻页

上一篇英伟达新款 RTX 4070 Super 显卡规格曝光，搭载 16GB 显存

下一篇 IGN 3 分号称“年度最烂游戏”，《骷髅岛：金刚崛起》全球评分解禁

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片