微比恩 > 信息聚合 > 全都不及格!斯坦福 100 页论文给大模型透明度排名,GPT-4 仅排第三

全都不及格!斯坦福 100 页论文给大模型透明度排名,GPT-4 仅排第三

2023-10-19 14:58:08来源: IT之家

试问百模大战的当下,谁家大模型的透明度最高?(例如模型是如何构建的、如何工作、用户如何使用它们的相关信息。)现在,这个问题终于有解了。因为斯坦福大学 HAI 等研究机构最新共同发布了一项研究 ——专门设计了一个名为基础模型透明度指标(The Foundation Model Transparency Index)的评分系统。它从 100 个维度对国外 10 家主流的大模型做了排名,并在透明度这一层面上做了全面的评估。结果可谓是大跌眼镜!若是以 60 分作为及格线,那么“参赛”的大模型们可以说是全军覆没,没有一个及格的……来感受下这个 feel:排名第一的 Llama 2,分数仅为 54;紧随其后的便是 BLOOMZ,得分 53。而 GPT-4 分数仅仅为 48,排名第三;来自亚马逊的 Titan Text 成绩垫底,仅取得 12 分。不仅如此,在斯坦福 HAI 官方的博客中,负责人 Rishi Bommasani 直言不讳地把

关注公众号
标签: 大模型