微比恩 > 信息聚合 > 最强端侧开源 AI 模型 Zamba2-mini 登场：12 亿参数，4bit 量化下内存占用小于 700MB

最强端侧开源 AI 模型 Zamba2-mini 登场：12 亿参数，4bit 量化下内存占用小于 700MB

2024-08-29 15:29:44来源: IT之家

最强端侧开源 AI 模型 Zamba2-mini 登场：12 亿参数，4bit 量化下内存占用小于 700MB

图片地址：https://img.ithome.com/newsuploadfiles/2024/8/b3d51266-b4a6-40c9-849f-4720a1cb21ca.jpg?x-bce-process=image/format,f_auto

IT之家 8 月 29 日消息，Zyphra 于 8 月 27 日发布博文，宣布推出 Zamba2-mini 1.2B 模型，共有 12 亿参数，声称是端侧 SOTA 小语言模型，在 4bit 量化下内存占用低于 700MB。IT之家注：SOTA 全称为 state-of-the-art，并不是特指某个具体的模型，而是指在该项研究任务中，目前最好 / 最先进的模型。Zamba2-mini 1.2B 虽然尺寸不大，但媲美包括谷歌 Gemma-2B、Huggingface 的 SmolLM-1.7B、苹果的 OpenELM-1.1B 和微软的 Phi-1.5 等更大模型。在推理任务中，Zamba2-mini 的卓越性能尤为显著，与 Phi3-3.8B 等模型相比，Zamba2-mini 的首次令牌时间（从输入到输出第一个 token 的延迟）是此前的二分之一，内存占用减少了 27%。Zamba2-mini 1.2B 主要通

关注公众号

标签： AI 开源

提示：支持键盘“← →”键翻页

上一篇斯坦福大学新技术可使锂提取成本减半，且更环保

下一篇高合汽车母公司华人运通投资公司申请破产重整，法院已受理

赞

你的鼓励是对作者的最大支持

相关阅读

苹果因 AirPods Pro 耳机杂音问题在美国遭遇集体诉讼2024-11-14 03:38:23
2024Q3 苹果 iPad 在美国销售稳健：Pro 以 45% 主导、基础款占 33%、Air 占 13%、mini …2024-11-14 06:30:53
苹果更新 Mac / iPad 版 Final Cut Pro 视频编辑应用：引入 AI 功能、可编辑空间视频2024-11-14 07:19:07
AI 开始“卷”智能体：OpenAI 被曝明年将推 Operator，可控制电脑、独立执行任务2024-11-14 07:35:17
广汽传祺 S7 更多官图公布：配备 AI 情绪大灯，明日广州车展亮相2024-11-14 08:15:29
英伟达秀 Blackwell GPU 肌肉：训练 AI 模型速度比 Hopper H100 快 2.2 倍2024-11-14 08:33:16
Red Hat 收购 Neural Magic 并开源其技术：优化通用设备 AI 性能，可媲美专用芯片2024-11-14 09:15:26
Canalys：2024 年第三季度全球 AI PC 市场份额提高至 20%2024-11-14 09:58:26
应用来了！李彦宏发布两大“超级有用”AI技术！2024-11-13 19:15:30
AI如何赋能可持续发展？IBM 最新调研揭秘现状：企业投资热情不减，但行动尚未跟上2024-11-13 16:47:00

热门排行榜

1日1周1月

免费发布分类信息

最新图片