IT之家 8 月 10 日消息,近日,清华大学新闻与传播学院教授、博士生导师沈阳所在团队发布了《大语言模型综合性能评估报告》(下文简称“报告”),报告显示总得分率 GPT-4 第一,百度文心一言在三大维度 20 项指标中综合评分国内第一,超越 ChatGPT,其中中文语义理解排名第一,部分中文能力超越 GPT-4。据了解,报告本次评估选取了 GPT-4、ChatGPT 3.5、文心一言、通义千问、讯飞星火、Claude、天工 7 个大语言模型,围绕生成质量、使用与性能、安全与合规三大维度,全面考察大语言模型上下文理解、中文语义理解、误导信息识别、逻辑推理、内容安全性、隐私保护等 20 项指标。综合来看,文心一言语义理解能力突出,特别是具备更好的中文理解能力,更懂中国文化,同时时效性强、内容安全把握细微,这源于其知识增强、检索增强和对话增强的技术创新。在生成质量方面,基于对语义理解、输出表达、适应泛化的综合评测,文心一言得分率 7
清华大学发布《大语言模型综合性能评估报告》 :GPT-4 第一,文心一言更懂中文
2023-08-10 10:45:21来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 微星雷影 17 笔记本开卖:R9 7945HX + RTX 4060,8499 元2023-08-10 10:11:45
- 小米平板 6 Max 14 定档 8 月 14 日发布,搭载骁龙 8+ Gen 1 处理器2023-08-10 10:17:37
- 三星 Galaxy S24 Ultra 手机爆料:配 M13 OLED 屏幕和 16GB 内存2023-08-10 10:23:47
- 尼康 Zf 全画幅复古相机详细参数曝光:24.4MP 传感器,支持 4k 60 帧录制2023-08-10 10:24:25
- vivo Pad Air 平板官宣 8 月 14 日开启预售:2.8K 显示屏 + 骁龙 870 处理器2023-08-10 10:26:17
- 小米手环 8 Pro 现已上架并开启预约:配 1.74 英寸屏幕 / 60Hz 刷新率,8 月 14 日发布2023-08-10 10:54:49
- 联想推出小新学习平板:12.7 英寸类纸大屏,首发 2499 元2023-08-10 10:57:55
- 一加 Ace 2 Pro 手机官宣全球首发“全局内存架构”,24GB 版本独享2023-08-10 10:58:55
- 发烧友改造 Steam Deck 游戏掌机,内存容量翻番至 32GB2023-08-10 11:05:40
- 吉利几何 E 萤火虫纯电 SUV 将于 8 月上市,续航 301/401 公里2023-08-10 11:08:04
- 1安徽高新投先进材料投资基金登记成立 出资额3亿
- 2中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 3小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 4本月开测,微软网页版和 Win11 新版 Outlook 可固定收藏夹
- 5任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 6阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 7Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 8全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节
- 9小鹏宣布老用户芯片焕新众筹计划:单 Orin 升至双 Orin,座舱 820A 升级 8295
- 10小鹏汇天全倾转旋翼飞行汽车 X5 亮相:500km+ 续航、360km+/h 航速