微比恩 > 信息聚合 > 世界最快大模型 Groq 登场：每秒 500 token 破纪录，自研 LPU 是英伟达 GPU 10 倍

世界最快大模型 Groq 登场：每秒 500 token 破纪录，自研 LPU 是英伟达 GPU 10 倍

2024-02-20 22:22:12来源: IT之家

世界最快大模型 Groq 登场：每秒 500 token 破纪录，自研 LPU 是英伟达 GPU 10 倍

图片地址：https://img.ithome.com/newsuploadfiles/2024/2/ea9e59c7-eb69-450f-aaa4-493473897cdf.gif

卷疯了！世界最快的大模型 Groq 一夜之间爆火，能够每秒输出近 500 个 token。如此神速的响应，背后全凭自研的 LPU。一觉醒来，每秒能输出 500 个 token 的 Groq 模型刷屏全网。堪称是世界上速度最快的 LLM！相比之下，ChatGPT-3.5 每秒生成速度仅为 40 个 token。有网友将其与 GPT-4、Gemini 对标，看看它们完成一个简单代码调试问题所需的时间。没想到，Groq 完全碾压两者，在输出速度上比 Gemini 快 10 倍，比 GPT-4 快 18 倍。（不过就答案质量来说，Gemini 更好。）最关键的是，任何人可以免费用！进入 Groq 主页，目前有两种可以自选的模型：Mixtral8x7B-32k，Llama 270B-4k。地址：https://groq.com/与此同时，Groq API 也向开发者提供，完全兼容 OpenAI API。Mixtral 8x7B SMoE

关注公众号

标签：英伟达大模型 GPU

提示：支持键盘“← →”键翻页

上一篇三星宣布与 Arm 合作，以 GAA 代工技术优化下一代 Cortex-X CPU 内核

下一篇已有近 9 年历史，R 星正式关闭《GTA5》PS4 / XboxOne 版游戏“Rockstar 编辑器”功能

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33
字节跳动大模型遭实习生攻击，损失超千万美元？相关人士回应2024-10-19 14:18:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片