IT之家 5 月 27 日消息,摩尔线程、无问芯穹今天联合宣布,双方已经正式完成基于国产全功能 GPU 千卡集群的 3B 规模大模型“MT-infini-3B”实训,该模型基于摩尔线程国产全功能 GPU MTT S4000 组成的千卡集群,以及无问芯穹的 AIStudio PaaS 平台打造。据悉,这次的 MT-infini-3B 模型训练总共用时 13.2 天,全程稳定无中断,集群训练稳定性达到 100%,千卡训练和单机相比扩展效率超过 90%,号称“充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产 GPU 千卡智算集群深度合作的新范式”。IT之家获悉,实训出来的 MT-infini-3B 性能在同规模模型中跻身前列,相比在国际主流硬件上训练而成的其他模型,在 C-Eval、MMLU、CMMLU 等 3 个测试集上均实现性能领先。无问芯穹联合创始人兼 CEO 夏立雪表示,当前无
30 亿参数“从 0 到 1”,摩尔线程 / 无问芯穹“千卡集群”行业内首次实现国产 GPU 端到端 AI 大模型实训
2024-05-27 11:10:51来源: IT之家
![](/images/qrcode_for_gh_5f0dab6cf0de_258.jpg)
关注公众号
赞
你的鼓励是对作者的最大支持
- 面壁智能开源业内首个端侧大模型工具集 MobileCPM2024-07-06 09:51:18
- 快手大模型首次集体亮相2024-07-06 10:36:22
- 快手文生图大模型可图宣布正式开源2024-07-06 10:50:24
- 快递业用上大模型客服,90%工单无需人工干预 | 创新场景2024-07-05 18:15:43
- 蚂蚁百灵大模型:多模态能力提升,将应用在支付宝智能助理等2024-07-05 16:31:01
- 腾讯副总裁蒋杰:混元大模型正部署从多模态到全模态的技术,很快即可体验2024-07-05 16:45:51
- 对话蜜度CTO刘益东:价格战、MoE......中国AI大模型下一步“卷”什么?|直击WAIC 20242024-07-05 12:56:17
- 氪星晚报 |宁德时代发布首个商用电池品牌;腾讯携混元大模型及多款AI应用亮相WAIC;资生堂集团获得Max Mara全球…2024-07-04 20:40:50
- 幻彩灯条 + AD102 GPU,同德 Palit 预告 RTX 4090 GameRock White 显卡2024-07-05 07:52:17
- 瑞士信息与通信科技Nimagna开发AI视频制作软件,只需一个摄像头,就能自动录制、剪辑和渲染多机位视频 | 瑞士创新100强2024-07-04 13:58:08