IT之家 11 月 12 日消息,摩尔线程宣布开源高性能线性代数模板库 MUTLASS,以便开发者能够更高效针对摩尔线程全功能 GPU 的 MUSA Core 及 Tensor Core 等单元进行编程,加速基于国产 GPU 的算子开发以及算法创新。作为摩尔线程专为 MUSA 架构优化的高性能计算库,MUTLASS(MUSA Templates for Linear Algebra Subroutines)是基于开源模板库 CUTLASS 进行的 MUSA 适配和定制化开发、优化。针对矩阵乘法及相关变种,MUTLASS 提供了一系列高性能的 C++ 模板组件,并采用了与 muDNN 库类似的分层分解及数据搬运策略,以确保性能的充分发挥。在本次开源的版本中,摩尔线程适配了 CuTe 后端库,为其增加了第三代 MUSA 架构的 MMA 计算原语,支持 TF32 / FP16 / BF16 / INT8 等多种数据精度,并以此为基础,
摩尔线程开源高性能线性代数模板库 MUTLASS,加速基于国产 GPU 的算子开发以及算法创新
2024-11-12 18:46:39来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Faker夺冠一周以后,人们仍在抖音上讨论他2024-11-12 17:34:58
- Stellantis开发下一代电动车电力架构,特斯拉德州路测无人出租车|海外日报2024-11-12 18:04:47
- 氪星晚报|美团青山计划携手百万公益商家守护湛江红树林;阿里云开源代码模型Qwen2.5-Coder2024-11-12 18:07:16
- 红魔电竞平板 Pro 暗区突围先锋杯限定联名礼盒发布,4699 元2024-11-12 17:49:17
- 拼多多拟更新价格保护规则,11 月 20 日起活动商品均适用“降价补差”2024-11-12 18:04:54
- 消息称亚马逊第二代自研 AI 模型训练芯片 Trainium2 有望下月广泛可用2024-11-12 18:14:58
- 两部门:加快开展智能网联(自动驾驶)汽车准入和通行试点2024-11-12 18:17:56
- 消息称三星有望明年推出旗下首批 83 英寸 QD-OLED 电视“S95F 系列”2024-11-12 18:49:18
- 英飞凌 2024 财年营收 149.55 亿欧元,同比下降 8%2024-11-12 18:55:22
- 北京开发商体语科技起诉苹果存在不公平垄断行为,索赔 300 万元2024-11-12 19:00:38
- 1上海:支持上市公司并购重组,提升公司质量培育龙头企业
- 2乐凯胶片:子公司增资扩股引入4.5亿元投资
- 3菲亚特动力科技推出全新紧凑型发动机 R38
- 4红魔 10 Pro 系列手机发布:骁龙 8 至尊版、1.5K 144Hz“悟空屏”,4999 元起
- 5瑞典国家旅游局开创先例申请注册目的地商标
- 6小米大模型升级第二代:MiLM2 实现云边端结合,能力平均提升超 45%
- 7GGA电竞学院携手延世大学培养游戏行业人才
- 8新一轮拆迁换房来袭,但这次没有拆二代、没有暴发户了
- 9欧洲央行管委Rehn:12月或降息,且后续有进一步行动的可能性
- 10全球顶级足球俱乐部齐聚卡塔尔沙漠之星参加卡塔尔精英学院第10届全球峰会