微比恩 > 信息聚合 > 英伟达 CUDA 太难:OpenAI 出手要取代它,新语言性能相当但编程更简单

英伟达 CUDA 太难:OpenAI 出手要取代它,新语言性能相当但编程更简单

2021-07-29 15:58:11来源: IT之家

用 CUDA 为 GPU 编程实在太难了。为了让没有 CUDA 编程经验的人写出和专家效率相当的 GPU 代码,现在 OpenAI 推出了一种新的语言和编译器 ——Triton。它的难度比 CUDA 低,但是性能却可与之相媲美。OpenAI 声称:Triton 只要 25 行代码,就能在 FP16 矩阵乘法 shang 上达到与 cuBLAS 相当的性能。OpenAI 的研究人员已经使用 Triton,来生成比同等 Torch 效率高出 1 倍的内核。Triton 项目的负责人 Philippe Tillet 说:“我们的目标是使 Triton 成为深度学习 CUDA 的可行替代方案。”25 行代码实现最佳性能Triton 起源于 Tillet 在 2019 年学术会议 MLPF 上的一篇论文,当时他还是哈佛大学的一名研究生。Tillet 解决的问题是如何开发一种 cuDNN 更具表现力的语言,既能够处理神经网络中涉及的矩阵的各

关注公众号
标签: AI 英伟达