用 CUDA 为 GPU 编程实在太难了。为了让没有 CUDA 编程经验的人写出和专家效率相当的 GPU 代码,现在 OpenAI 推出了一种新的语言和编译器 ——Triton。它的难度比 CUDA 低,但是性能却可与之相媲美。OpenAI 声称:Triton 只要 25 行代码,就能在 FP16 矩阵乘法 shang 上达到与 cuBLAS 相当的性能。OpenAI 的研究人员已经使用 Triton,来生成比同等 Torch 效率高出 1 倍的内核。Triton 项目的负责人 Philippe Tillet 说:“我们的目标是使 Triton 成为深度学习 CUDA 的可行替代方案。”25 行代码实现最佳性能Triton 起源于 Tillet 在 2019 年学术会议 MLPF 上的一篇论文,当时他还是哈佛大学的一名研究生。Tillet 解决的问题是如何开发一种 cuDNN 更具表现力的语言,既能够处理神经网络中涉及的矩阵的各
英伟达 CUDA 太难:OpenAI 出手要取代它,新语言性能相当但编程更简单
2021-07-29 15:58:11来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 苹果因 AirPods Pro 耳机杂音问题在美国遭遇集体诉讼2024-11-14 03:38:23
- 2024Q3 苹果 iPad 在美国销售稳健:Pro 以 45% 主导、基础款占 33%、Air 占 13%、mini …2024-11-14 06:30:53
- 苹果更新 Mac / iPad 版 Final Cut Pro 视频编辑应用:引入 AI 功能、可编辑空间视频2024-11-14 07:19:07
- AI 开始“卷”智能体:OpenAI 被曝明年将推 Operator,可控制电脑、独立执行任务2024-11-14 07:35:17
- 广汽传祺 S7 更多官图公布:配备 AI 情绪大灯,明日广州车展亮相2024-11-14 08:15:29
- 英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比 Hopper H100 快 2.2 倍2024-11-14 08:33:16
- Red Hat 收购 Neural Magic 并开源其技术:优化通用设备 AI 性能,可媲美专用芯片2024-11-14 09:15:26
- Canalys:2024 年第三季度全球 AI PC 市场份额提高至 20%2024-11-14 09:58:26
- 应用来了!李彦宏发布两大“超级有用”AI技术!2024-11-13 19:15:30
- AI如何赋能可持续发展?IBM 最新调研揭秘现状:企业投资热情不减,但行动尚未跟上2024-11-13 16:47:00
- 1红魔 10 Pro 系列手机发布:骁龙 8 至尊版、1.5K 144Hz“悟空屏”,4999 元起
- 2GGA电竞学院携手延世大学培养游戏行业人才
- 3全球顶级足球俱乐部齐聚卡塔尔沙漠之星参加卡塔尔精英学院第10届全球峰会
- 4宜鼎专为边缘服务器应用推出E1.S固态硬盘
- 5点亮你的四季生活 解锁中国大陆地区8家四季酒店会籍专属礼遇
- 6AI如何赋能可持续发展?IBM 最新调研揭秘现状:企业投资热情不减,但行动尚未跟上
- 7SGS携手京东养车共推机油鉴真服务
- 8玩家多年要求下,《魔兽世界》下一个资料片 12.0 版本将迎来家宅系统
- 9微软庆祝 Windows 预览体验计划 10 周年,纪念壁纸开放下载
- 102024年度「邵逸夫奖」颁奖典礼 庆祝科研成就二十一载