文|周鑫雨 编辑|苏建勋 “零一万物绝不放弃预训练。” 2024年10月16日,AI独角兽零一万物创始人兼CEO李开复,公开立了军令状。也在同一天,零一万物发布了最新的MoE(混合专家)架构的旗舰大模型:Yi-Lightning。 这也是时隔5个月后,零一万物再次更新模型的新动态。 李开复表示,Yi-Lightning的训练只用了2000张GPU,训练周期仅一个半月,成本只有300多万美元,是埃隆·马斯克的xAI成本的1%、2%。 训练成本虽然低,但Yi-Lightning的性能并没有打折扣。在加州大学伯克利分校LMSYS团队的Chatbot Arena(聊天机器人竞技场)总榜单上,Yi-Lightning的性能与xAI的Grok-2-08-13模型并列第6,并且超越了OpenAI的GPT-4o-2024-05-13。 LMSYS团队的Chatbot Arena(聊天机器人竞技场)大语言模型综合
李开复回应放弃预训练:训一次大模型三四百万美元,头部公司都付得起|最前线
2024-10-16 20:24:02来源: 36氪
关注公众号
赞
你的鼓励是对作者的最大支持
- 零一万物与华为启动合作,将基于昇腾硬件底座开发原生大模型应用2024-11-13 15:41:37
- 消息称阿里通义大模型前核心员工周畅加入字节跳动,被诉违反竞业协议2024-11-13 17:15:58
- 小米大模型升级第二代:MiLM2 实现云边端结合,能力平均提升超 45%2024-11-12 18:41:20
- 百度李彦宏:大模型基本消除幻觉2024-11-12 10:13:16
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 1京东方A:拟增资北电集成用于建设12英寸集成电路生产线项目
- 2阿里CEO吴泳铭:双11 GMV强劲增长,核心用户留存和新用户增长取得突破
- 3蚂蚁集团:第二财季净利润75.9亿元,同比增长193%
- 4工信部等四部门:到2026年新制定锂电池产业国家标准和行业标准100项以上
- 5华嵘控股:筹划控制权变更事项,股票11月18日停牌
- 6深圳上市公司并购重组年内完成交易总值居全国第二
- 7劳资谈判未取得进展,加拿大邮政工人工会宣布罢工
- 8哈啰出行在宝鸡成立网络科技公司 注册资本50万美元
- 9阿里巴巴:2025财年Q2投入41亿美元回购4.14亿股普通股
- 10同花顺被调查“疑云”:监管处罚是对几年前的历史旧账