微比恩 > 信息聚合 > 谁在“吊打”ChatGPT?

谁在“吊打”ChatGPT?

2023-11-09 09:08:01来源: 钛媒体

图片来源@视觉中国文 | 定焦,作者 | 黎明,编辑 | 方展博AI行业的“百模大战”已经打了大半年。从上半年的火热,到下半年的渐冷,胜负难分。GPT成了国内厂商的靶子。几乎每家在发布大模型时,都要把GPT拉出来对比一波,而且他们总能找到一个指标把GPT超越——比如,中文能力。测评类的榜单太多了。从英文的MMLU,到中文的SuperCLUE,再到借鉴游戏排位赛机制的ChatbotArena,各种大模型榜单让人眼花缭乱。很多时候,榜单上的排名成为厂商对外宣传的工具。但奇怪的是,用户在体验后发现,号称超越ChatGPT的一些大模型产品,实际表现不尽如人意。各种不同的统计排名口径,更是让人感到迷惑。以至于“第一”太多,榜单都快不够用了。比如最近,昆仑万维开源「天工」系列大模型,号称多榜超越Llama 2;李开复的零一万物公司发布开源大模型“Yi&rdq

关注公众号
标签: ChatGPT