IT之家 8 月 28 日消息,Cerebras Systems 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达 GPU 的 AI 推理解决方案的 20 倍。除了令人难以置信的性能之外,这款新型推理解决方案的定价也比流行的 GPU 云低得多,起价仅为每百万个 token 10 美分,从而为 AI 工作负载提供 100 倍更高的性价比。该方案将允许 AI 应用程序开发人员构建下一代 AI 应用程序,而不会影响速度或成本。该方案使用了 Cerebras CS-3 系统及其 Wafer Scale Engine 3(WSE-3)AI 处理器,其中 CS-3 的内存带宽是 Nvidia H100
Cerebras 推出全球最快 AI 推理解决方案,速度是英伟达方案的 20 倍
2024-08-28 09:51:23来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- GE医疗与亚马逊云科技达成战略合作,通过生成式AI加速医疗健康领域转型2024-08-29 11:28:00
- IBM 推出全新Telum处理器,依托新一代 IBM Z 大型主机加速 AI 应用2024-08-29 16:52:00
- 红魔首款裸眼 3D 平板官宣:AI 眼动视线追踪、90Hz 追踪频率2024-08-29 15:14:28
- 最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
- 雷鸟 XR 与博士眼镜成立合资公司,首款 AI 眼镜年底发布2024-08-29 15:44:01
- 魅族 21 手机推送 Flyme 11.1.0.0A 稳定版更新:新增 AI 通话助手、智能体商店等2024-08-29 17:35:21
- 利用 AI 技术制造谣言,一男子被厦门警方依法采取刑事强制措施2024-08-29 18:26:24
- 全文|英伟达Q2业绩会实录:Blackwell Q4开始生产 明年业绩将很棒2024-08-29 18:12:23
- 端到端架构点火,AI上车变飙车?2024-08-29 10:00:00
- 英伟达员工自曝日常工作至凌晨 2:00,每天要参加 10 次会议2024-08-29 12:04:34
- 1奎芯科技亮相AI Hardware & Edge AI Summit,彰显创新实力
- 2SGS为华润集团颁发合规管理与反贿赂管理体系认证证书
- 3新石器无人车在绍兴成立科技公司 注册资本2.1亿
- 4以智焕制,信华信亮相2024全球工业互联网大会
- 5筑梦向未来,万代南梦宫(中国)"困境儿童陪伴计划"走进云南
- 6索尼《漫威蜘蛛侠 2》悄悄现身 PS Plus 三档会免游戏海报,有望近期官宣
- 7揭秘美诚月饼关联公司 美诚食品公司今年两次变更法定代表人
- 8中之杰标杆案例|中大力德入选IDC"未来数字工业领航者"
- 9台风“贝碧嘉”经过,上海所有苹果 Apple Store 零售店今日关闭
- 10万达转让泰州一万达广场商管公司