图片来源@GPT生成使用全球40年的天气数据,用200张GPU卡进行预训练,2个月左右的时间,训练出了参数量达亿级的盘古气象大模型。这是清华大学毕业3年的毕恺峰训练大模型的故事。不过,从成本上看,按照正常情况下,一张GPU 7.8元/小时计算,毕恺峰盘古气象大模型的训练成本可能超出200万。这还是气象领域的垂直大模型,如果训练的是通用大模型,成本可能要翻百倍。有数据统计,中国当下10亿参数规模的大模型已经超百个。然而行业蜂拥而上的大模型“炼丹”却面临着高端GPU一卡难求的无解题。算力成本高企,缺算力、缺资金也成为了摆在行业面前最直观的问题。高端GPU,有多缺?“缺,当然缺,但是我们能有什么办法。”某大厂高管被问及是否缺算力问题时脱口而出。这似乎已经成了行业公认的一道无解题,顶峰时期一张英伟达A100的价格已经被炒到了二三十万人民币,单台A100服务器的月租价格也飙到了5万-7万/月
大模型训练有多卷?揭开大模型算力之谜 | 钛媒体深度
2023-10-16 12:42:23来源: 钛媒体
关注公众号
上一篇
10个问题,看懂大厂ESG
下一篇
古早陈欧,低调追风
赞
你的鼓励是对作者的最大支持
- 用元脑企智EPAI"玩转"大模型应用开发,1人1月开发智能售前助手2024-09-14 16:36:00
- 百度:1-8月大模型中标项目数量达到去年5倍2024-09-14 19:00:33
- 元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B2024-09-13 20:49:18
- 浪潮信息:元脑企智EPAI助力金融大模型快速落地2024-09-13 12:47:00
- 赵何娟:我们准备好面对GPT大模型的瓶颈期了吗?2024-09-11 17:32:11
- 百度梁志祥:基于大模型的智能体正为营销行业带来深远变革2024-09-11 18:26:53
- 沈向洋:中国备案行业大模型数量占比约70%,未来数量将更多 |最前线2024-09-08 20:09:38
- 长虹发布首款沧海智能体 AI TV 和智汇家 AI 大模型2024-09-08 15:46:13
- 奇瑞风云 T9 推送 Lion5.0 升级版:新增星火大模型,升级华为 HiCar2024-09-08 16:06:29
- “国内首个端到端通用语音 AI 大模型”心辰 Lingo 发布,号称中文效果比 GPT-4o 更出色2024-09-06 18:59:42
- 1合格评定助力电子商务高质量发展 SGS携手电商平台发起行动倡议
- 2三星 Galaxy A16 5G 手机宣传图曝光:6.7 英寸屏幕、天玑 6300 / Exynos 1330 芯片,6…
- 3英国科学家研制出超薄二维表面材料,有望增强 6G 卫星通信能力
- 4Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制
- 5FENDER 为多次荣膺格莱美的摇滚巨星 JACK WHITE 推出全新签名系列
- 6衣服里的Sorona 索罗纳®是什么材料?
- 7充电 60 元超时费 1600 元,特斯拉车主又遭遇充电刺客
- 8肯辛通发布 SD5000T5:首款英特尔认证的 Thunderbolt 5 扩展坞,11 个端口、最高 120 Gbps…
- 9AOC 推出 PD34 保时捷设计曲面显示器,搭载 240Hz QD-OLED 面板
- 10小鹏用实际行动证明,李想说得没错