大神卡帕西(Andrej Karpathy)刚“复工”,立马带来神作:纯 C 语言训练 GPT,1000 行代码搞定!,不用现成的深度学习框架,纯手搓。发布仅几个小时,已经揽星 2.3k。它可以立即编译和运行,和 PyTorch 完全兼容。卡帕西使用的示例是 GPT-2,但 Llama 2 和 Gemma 等也适用。项目发布后,他还给出了从 PyTorch 迁移到 C 的教程。网友们直呼:他甚至都不用 C++……而且就连怎么让大模型如法炮制的提示词,他也放了出来。现在已经有人在用 Devin 尝试 ing。手动实现每个层前向 / 反向传播选择用 GPT-2 的原因很简单,有模型权重,采用了堆栈式的 Transformer 模型结构。项目核心的重点包括:直接在 C / CUDA 上训练 LLM,速度接近 PyTorch通过在 CPU 版本中使用 SIMD 指令(如 AVX2 和 NEON)聊加速 CPU 版本支持更先进的架构,比如
OpenAI 创始大神手搓千行 C 代码训练 GPT,附 PyTorch 迁移教程
2024-04-09 22:19:39来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- Meta AR 眼镜项目前负责人将加入 OpenAI,领导机器人和消费硬件部门2024-11-05 15:03:46
- 估值超140亿、OpenAI贝佐斯下场,这家让机器人装AI“大脑”的公司获28亿新融资|钛媒体AGI2024-11-05 08:34:22
- OpenAI 公布新型 AI 文生图方案“sCM”,号称效率是传统扩散模型 50 倍2024-10-27 15:28:19
- 微软CEO在2024财年获得价值7910万美元的总薪酬;奥尔特曼辟谣OpenAI新模型消息|Do早报2024-10-26 10:19:32
- OpenAI解散AGI团队 | 最前线2024-10-25 18:31:17
- 离开山姆奥特曼后,OpenAI的联创去哪儿了2024-10-25 11:45:00
- 微软和 OpenAI 邀请投行入局,加快 OpenAI 向营利性公司转型2024-10-18 18:33:03
- 多名个人开发者收到邮件:Azure OpenAI服务将于10月21日终止,仅企业客户有资格订阅2024-10-17 19:42:09
- OpenAI 多智能体 Swarm 陷争议,20 岁创始人自曝代码结构被抄袭2024-10-13 13:11:57
- Swarm 框架登场:OpenAI 第 3 阶段“敲门砖”,让专业的事交给专业的 AI 智能体做2024-10-12 16:07:51
- 1安徽高新投先进材料投资基金登记成立 出资额3亿
- 2中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 3小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 4本月开测,微软网页版和 Win11 新版 Outlook 可固定收藏夹
- 5任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 6阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 7Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 8全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节
- 9小鹏宣布老用户芯片焕新众筹计划:单 Orin 升至双 Orin,座舱 820A 升级 8295
- 10小鹏汇天全倾转旋翼飞行汽车 X5 亮相:500km+ 续航、360km+/h 航速