微比恩 > 信息聚合 > "千亿参数"大模型再卷风云，成功实现CPU通用服务器上运行

"千亿参数"大模型再卷风云，成功实现CPU通用服务器上运行

2024-07-26 16:45:00来源: 美通社

北京2024年7月26日 /美通社/ -- 生成式AI快速发展，AI算力作为人工智能发展的重要支撑，正以惊人的速度渗透至每一个计算设备。一切计算皆AI，为了支撑千行百业最广泛的场景，通用服务器也在"智变"。不久前，浪潮信息的研发工程师基于2U4路旗舰通用服务器NF8260G7，采用领先的张量并行、NF4模型量化等技术，实现服务器仅依靠4颗CPU即可运行千亿参数 "源2.0" 大模型，成为通用AI算力的新标杆。 NF8260G7在2U空间搭载4颗32核英特尔至强处理器，主频2.4GHz，支持8个内存通道，3路UPI总线互联，采用32根32G的DDR5内存，内存容量1024GB，实测内存读带宽995GB/s，运行效率82.94%。框架和算法方面，NF8260G7支持PyTorch、TensorFlow等主流AI框架和DeepSpeed等流行开发工具，满足用户更成熟、易部署、更便捷的开放生

关注公众号

标签：大模型服务器

提示：支持键盘“← →”键翻页

上一篇 TÜV莱茵携手涂鸦智能举办物联网产品出海要求及合规技术研讨会

下一篇第十五届中国光电子产业博览会开幕自动化网受邀出席

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片