IT之家 8 月 29 日消息,Zyphra 于 8 月 27 日发布博文,宣布推出 Zamba2-mini 1.2B 模型,共有 12 亿参数,声称是端侧 SOTA 小语言模型,在 4bit 量化下内存占用低于 700MB。IT之家注:SOTA 全称为 state-of-the-art,并不是特指某个具体的模型,而是指在该项研究任务中,目前最好 / 最先进的模型。Zamba2-mini 1.2B 虽然尺寸不大,但媲美包括谷歌 Gemma-2B、Huggingface 的 SmolLM-1.7B、苹果的 OpenELM-1.1B 和微软的 Phi-1.5 等更大模型。在推理任务中,Zamba2-mini 的卓越性能尤为显著,与 Phi3-3.8B 等模型相比,Zamba2-mini 的首次令牌时间(从输入到输出第一个 token 的延迟)是此前的二分之一,内存占用减少了 27%。Zamba2-mini 1.2B 主要通
最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB
2024-08-29 15:29:44来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- GE医疗与亚马逊云科技达成战略合作,通过生成式AI加速医疗健康领域转型2024-08-29 11:28:00
- IBM 推出全新Telum处理器,依托新一代 IBM Z 大型主机加速 AI 应用2024-08-29 16:52:00
- 红魔首款裸眼 3D 平板官宣:AI 眼动视线追踪、90Hz 追踪频率2024-08-29 15:14:28
- 雷鸟 XR 与博士眼镜成立合资公司,首款 AI 眼镜年底发布2024-08-29 15:44:01
- 魅族 21 手机推送 Flyme 11.1.0.0A 稳定版更新:新增 AI 通话助手、智能体商店等2024-08-29 17:35:21
- 利用 AI 技术制造谣言,一男子被厦门警方依法采取刑事强制措施2024-08-29 18:26:24
- 端到端架构点火,AI上车变飙车?2024-08-29 10:00:00
- 源大模型AIPC助手YuanChat焕新!支持12种文档构建知识库+联网检索2024-08-28 18:17:00
- 苹果 iPhone 17 系列被曝升级 12GB 内存,能够更好地支持端侧 AI 大模型2024-08-28 19:48:44
- 全新 smart 精灵#5 大五座 SUV 首秀:字节豆包 AI 大模型、方盒子造型2024-08-28 20:53:06
- 1云从科技:与华为合作的一体机项目已取得初步成果
- 2华为 Mate XT 三折叠手机尊享服务上线:购机 1 年内,享 1 次 3499 元更换特惠屏
- 3告别 App Store 独占,苹果宣布欧盟用户可于 9 月 16 日 iPadOS 18 上线后通过第三方应用商店下载…
- 4谷歌 Pixel 平板升级至 Android 15 QPR1 Beta 2 将喜提桌面模式,类似三星 Dex / Chr…
- 5阿维塔副总裁胡成太:明年将开发容量超 50 度增程电池,超充速度大于 4C
- 6哪吒汽车第二款海外生产车型,印度尼西亚工厂首台哪吒 X 下线
- 7歌尔股份:歌尔微业务与公司其他业务有明显区别,未来可形成良性互动
- 8优柔寡断、毫无决策力?这是因为你在用逻辑做决定
- 9国足比赛成绩那么烂,为何转播权还如此吃香?
- 10吉利在成都成立科技新公司 注册资本1000万