IT之家 9 月 13 日消息,元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。该模型总参数 255B,激活参数 36B,官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。MoE(Mixture of Experts)混合专家模型架构,将多个细分领域的专家模型组合成一个超级模型,在扩大模型规模的同时,保持模型性能最大化,甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、马斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。在多个评测中,元象 MoE 超过多个同类模型,包括国内千亿 MoE 模型 Skywork-MoE、传统 MoE 霸主 Mixtral-8x22B 以及 3140 亿参数的 MoE 开源模型 Grok-1-A86B 等。IT之
元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B
2024-09-13 20:49:18来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 零一万物与华为启动合作,将基于昇腾硬件底座开发原生大模型应用2024-11-13 15:41:37
- 消息称阿里通义大模型前核心员工周畅加入字节跳动,被诉违反竞业协议2024-11-13 17:15:58
- 小米大模型升级第二代:MiLM2 实现云边端结合,能力平均提升超 45%2024-11-12 18:41:20
- 百度李彦宏:大模型基本消除幻觉2024-11-12 10:13:16
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 1超 12000 公里,国产腔镜手术机器人完成远程手术、加速出海
- 2国家统计局:10 月汽车类零售额 4452 亿元、同比增长 3.7%
- 3三星 One UI 7 AI Brief 功能曝光:定时播报新闻、股市、天气等主题消息
- 4亚马逊云科技助力参盘科技打造智慧供应链 加速冷链行业数智化升级
- 5呵护肠胃健康,畅享美好生活A.O. 史密斯蒸烤一体机帮你更好地养胃
- 6机械师 L8 Max 三模电竞鼠标上市:双 8K 回报率、PAW3950 Pro,首发 329 元
- 7小鹏 MONA M03 轿车推出手游《王者荣耀》孙尚香“大小姐”限定彩绘车衣,本月内限量发售
- 8OPPO Pad3 配备 2.8K 原彩仿书柔光屏,支持苹果 iOS 互传
- 9经典回归:恐怖游戏续作《尸体派对 2 Darkness Distortion》上架 Steam,2025 年发售
- 10广汽古惠南:昊铂 HL 对标迈巴赫,明年埃安 / 昊铂至少有 4 款新车