微比恩 > 信息聚合 > 小米大模型提效新框架 SUBLLM：训练最高提速 34%、推理最高提速 52%，Kaldi 之父合作出品

小米大模型提效新框架 SUBLLM：训练最高提速 34%、推理最高提速 52%，Kaldi 之父合作出品

2024-06-24 16:55:11来源: IT之家

小米大模型提效新框架 SUBLLM：训练最高提速 34%、推理最高提速 52%，Kaldi 之父合作出品

图片地址：https://img.ithome.com/newsuploadfiles/2024/6/b3b17baa-9fcb-470d-9df7-1636413b3a52.png

大模型推理速度提升 50% 以上，还能保证少样本学习性能！小米大模型团队提出 SUBLLM（Subsampling-Upsampling-Bypass Large Language Model），国际 AI 语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey也参与指导。与 Llama 等模型相比，SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。在大模型训练中，SUBLLM 的速度提高了 26%，每个 GPU 的内存减少了 10GB。在推理中，它的速度提高了 37%，每个 GPU 的内存减少了 1GB。训练和推理速度分别最高可以提高至 34% 和 52%。SUBLLM 通过智能地选择和处理数据，使得模型在训练和推理时更加高效：子采样模块剔除不必要的信息，上采样模块恢复数据的完整性，而绕过模块则加快了学习过程。在一万字中挑选最关键的五百字目前，云端的大模型处理超长文本任务，通常需要动用多达 8 个

关注公众号

标签：小米大模型

提示：支持键盘“← →”键翻页

上一篇工信部：2024 年 5 月末家庭户均接入带宽达 481Mbps，同比增长 18.7%

下一篇 4 倍标称容量 TLC 闪存实现 60DWPD 耐久，技嘉 AI TOP 100E 固态硬盘方案确认

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片