IT之家 10 月 9 日消息,昨天,财联社爆料称百度的文心大模型 4.0 正在加紧训练,已经接近可发布状态。今天,IT之家也扒到了更多关于文心 4.0 的消息,涉及了底层架构、基础设施、训练数据集、成本等关键信息。先说核心结论:1、昨天的爆料基本属实。目前了解到,文心大模型 4.0 实际上已经在小流量测试。2、文心 4.0 参数量大于所有已公开发布参数的 LLM,也是国内首次使用万卡集群训练的大模型。3、推理成本相比文心 3.5 增加很多,据传大概是 8-10 倍。(大模型真的很费钱)接下来我们看看爆料的细节。万卡集群训练的史上最大参数模型?根据IT之家拿到的消息,文心大模型 4.0 的参数规模要大于目前所有公开发布参数的 LLM,这意味着文心大模型 4.0 的参数规模预计能突破万亿级别。单看这个参数量,很多人会觉得还好,毕竟根据目前揭秘的信息,GPT-4 的参数量已经在 1.8 万亿左右。但爆料人进一步表示,文心大模型 4.
百度文心大模型 4.0 爆料:万卡训练史上最大参数,最快下周见
2023-10-09 14:43:11来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 科大讯飞升级星火大模型,持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
- 钛媒体独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
- 中信建投:零一万物发布Yi-Lightning,国产大模型迭代加速2024-10-25 07:57:29
- 加速大模型上车 浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
- 国内首个应用临床眼科大模型 “伏羲慧眼”发布,可检测、预测眼部健康状态2024-10-21 09:28:33
- 字节跳动大模型遭实习生攻击,损失超千万美元?相关人士回应2024-10-19 14:18:35