微比恩 > 信息聚合 > 通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-2，还有移动端可用的18亿模型

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-2，还有移动端可用的18亿模型

2023-12-01 19:08:09来源: 36氪

时隔一个月，通义千问又放大招了！在一个月前的阿里云栖大会上，阿里正式发布通义千问2.0版本，在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上，都有较大提升。并且，阿里云还发布了包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时，阿里云就已经预告，接下来还要再发更大规模的开源模型。12月1日，三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型，通义千问大模型也升级到了2.1版本。最受瞩目的首先是Qwen-72B，参数达到720亿，基于3T tokens的高质量数据训练。阿里云表示，Qwen-72B在10个权威基准测评中夺得开源模型最优成绩，在部分测评中超越闭源的GPT-3.5和GPT-4。△来源：阿里云具体来说，在英语任务上，Qwen-72B在MMLU基准测试取得开源模型最高分；中文任务上，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得

关注公众号

标签：大模型开源

提示：支持键盘“← →”键翻页

上一篇闲鱼品牌负责人祁舒娅：能花会省，年轻人在闲鱼走出“智性消费”新路线丨WISE2023未来消费大会

下一篇推对标Snowflake数据库新品，金融客户复购率超八成，南大通用加速转型｜最前线

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片