1 月 20 日消息,当今 AI 之势,影响纵深发展的矛盾是什么?一方面,大模型风头正劲,效果惊艳,人人都想试试。但另一方面,硬件基础上动不动就是上万张 GPU 的大规模集群在日夜燃烧,钞能力劝退。所以如果告诉你,现在只用一半数量的 GPU,也能完成同样的 GPT-3 训练呢?你会觉得关键钥匙是什么?不卖关子了。实现如此提升的,是一个名为 Colossal-AI的 GitHub 开源项目。而且该项目开源不久,就迅速登上了 Python 方向的热榜世界第一。GitHub 地址:点击打开不仅能加速 GPT-3,对于 GPT-2、ViT、BERT 等多种模型,Colossal-AI 的表现也都非常 nice:比如半小时左右就能预训练一遍 ViT-Base / 32,2 天能训完 15 亿参数 GPT 模型、5 天可训完 83 亿参数 GPT 模型。与业内主流的 AI 并行系统 —— 英伟达 Megatron-LM 相比,在同样使用 5
2 天训练出 15 亿参数大模型:国产开源项目力克英伟达 Megatron-LM
2022-01-20 12:56:25来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 印尼严控iPhone 16销售2024-10-27 13:07:23
- 丹麦首台 AI 超级计算机 Gefion 推出,由 1528 个英伟达 H100 GPU 驱动2024-10-27 15:29:08
- Nexon 虚幻 5 游戏新作「Project RX」公开,《蔚蓝档案》开发人员制作2024-10-26 17:50:27
- Chinese Automakers Asked to Halt Expansion in Europe amid Ch…2024-10-26 09:45:02
- Tim Cook Hopes Apple Intelligence Soon Come to China Followi…2024-10-26 11:19:43
- Musk Gains $34 Billion in a Day as Tesla Stocks Jump 22% in …2024-10-25 11:17:54
- CorDx选择MasterControl简化生命科学流程2024-10-25 00:31:00
- 中国移动官旗 4999 元起,苹果 iPhone 16 / Pro 全系列立减千元2024-10-24 15:15:38
- 华为 Pura 70 系列、Pocket 2 等 8 款机型通过开源鸿蒙兼容性测评,操作系统版本号 OpenHarmon…2024-10-24 15:21:38
- 华为 HarmonyOS NEXT 系统“鸿蒙体验版”游戏账号划分 3 种类型,支持数据资产继承、回退2024-10-24 16:32:54
- 1输出轻资产管理 济高•世茂芯环中心盛大开业
- 2人民网发布11.11电商服务调研结果 超33%消费者认为京东服务创新最多、最活跃
- 3上海:支持上市公司并购重组,提升公司质量培育龙头企业
- 4官方玩梗!听泉赏宝公司登记听泉猫作品著作权
- 5晓华在原址注册新理发店 晓华个人注册理发店
- 6TÜV南德授予亿联网络MVC S40产品碳足迹核查声明
- 7菲亚特动力科技推出全新紧凑型发动机 R38
- 8TCL智家及TCL家电集团换帅完成工商变更 彭攀任TCL智家及TCL家电集团董事长
- 9小米大模型升级第二代:MiLM2 实现云边端结合,能力平均提升超 45%
- 10Firstrade 宣布将于2025年第一季度推出美股隔夜交易服务