大模型推理速度提升 50% 以上,还能保证少样本学习性能!小米大模型团队提出 SUBLLM(Subsampling-Upsampling-Bypass Large Language Model),国际 AI 语音大牛、开源语音识别工具 Kaldi 之父 Daniel Povey也参与指导。与 Llama 等模型相比,SUBLLM 在训练和推理速度以及降低内存方面都有了显著提升。在大模型训练中,SUBLLM 的速度提高了 26%,每个 GPU 的内存减少了 10GB。在推理中,它的速度提高了 37%,每个 GPU 的内存减少了 1GB。训练和推理速度分别最高可以提高至 34% 和 52%。SUBLLM 通过智能地选择和处理数据,使得模型在训练和推理时更加高效:子采样模块剔除不必要的信息,上采样模块恢复数据的完整性,而绕过模块则加快了学习过程。在一万字中挑选最关键的五百字目前,云端的大模型处理超长文本任务,通常需要动用多达 8 个
小米大模型提效新框架 SUBLLM:训练最高提速 34%、推理最高提速 52%,Kaldi 之父合作出品
2024-06-24 16:55:11来源: IT之家
![](/images/qrcode_for_gh_5f0dab6cf0de_258.jpg)
关注公众号
赞
你的鼓励是对作者的最大支持
- 赠 8000 元 Nappa 座椅 + 智驾功能:小米 SU7 汽车 7 月购车权益不变,售 21.59 万元起2024-07-01 08:35:18
- 4G 全网通 + 高清视频:小米米兔儿童电话手表 7A 今日 349 元首销,限时赠云台摄像机2024-07-01 09:54:02
- 小米汽车:6 月 SU7 交付量超过 10000 辆,7 月预计将持续破万2024-07-01 10:09:13
- 主打性能,小米 Redmi K70 至尊版手机预热:散热系统突破、配独显芯2024-07-01 10:35:15
- 小米米家空调巨省电 3 匹挂机开售:APF 值 4.55,到手价 4299 元2024-07-01 11:00:05
- 小米 14 Pro 钛金属版(卫星通讯)、Redmi K70 Pro 正式版内测尝鲜:新增出行助手功能,含多项系统优化2024-06-29 21:41:46
- 钉钉上线AI搜索,还集齐了大模型“七龙珠” | 最前线2024-06-29 08:00:32
- 国产大模型下半场打响,星火究竟如何应用落地?|钛媒体AGI2024-06-28 20:13:38
- 小米 14 / Pro / Ultra、Redmi K60 至尊版宣布开启澎湃 OS 正式版内测尝鲜2024-06-28 19:10:31
- 小米汽车 App 更新 1.4.0 版本:新增地图展示手机方位2024-06-28 19:11:51