微比恩 > 信息聚合 > 元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

2024-09-13 20:49:18来源: IT之家

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

图片地址：https://img.ithome.com/newsuploadfiles/2024/9/882a437a-217b-4d13-895d-1eb71509404c.png?x-bce-process=image/format,f_auto

IT之家 9 月 13 日消息，元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。该模型总参数 255B，激活参数 36B，官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。MoE（Mixture of Experts）混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型，在扩大模型规模的同时，保持模型性能最大化，甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、马斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。在多个评测中，元象 MoE 超过多个同类模型，包括国内千亿 MoE 模型 Skywork-MoE、传统 MoE 霸主 Mixtral-8x22B 以及 3140 亿参数的 MoE 开源模型 Grok-1-A86B 等。IT之

关注公众号

标签：开源大模型

提示：支持键盘“← →”键翻页

上一篇吉利银河新车星舰 7 完成申报：“插混版”银河 E5，搭载 1.5L 插电混动系统

下一篇《幻兽帕鲁》是否会变成实时服务游戏？PocketPair CEO 称“还不确定”

赞

你的鼓励是对作者的最大支持

相关阅读

零一万物与华为启动合作，将基于昇腾硬件底座开发原生大模型应用2024-11-13 15:41:37
消息称阿里通义大模型前核心员工周畅加入字节跳动，被诉违反竞业协议2024-11-13 17:15:58
小米大模型升级第二代：MiLM2 实现云边端结合，能力平均提升超 45%2024-11-12 18:41:20
百度李彦宏：大模型基本消除幻觉2024-11-12 10:13:16
腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26

热门排行榜

1日1周1月

免费发布分类信息

最新图片