Stability AI 推出 Stable LM 2 12B 模型,作为其新模型系列的进一步升级,该模型基于七种语言的 2 万亿 Token 进行训练,拥有更多参数和更强性能,据称在某些基准下能超越 Llama 2 70B。继 16 亿轻量级 Stable LM 2 推出之后,12B 参数的版本在今天亮相了。见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3 啥时候出啊?总得来说,Stable LM 2 12B 参数更多,性能更强。120 亿参数版本包含了基础模型和指令微调模型,并在七种多语言,高达 2 万亿 Token 数据集上完成训练。在基准测试中,其性能赶超 Llama 2 70B 等开源模型。官博介绍,最新版本的模型兼顾了性能、效率、内存需求和速度,同时继续采用了 Stable LM 2 1.6B 模型的框架。通过这次更新,研究人员还为开发者提供了一个透明而强大的工具,以推动 AI 语言技术的创
120 亿参数 Stable LM 2 上线即开源:2 万亿 token 训练,碾压 Llama 2 70B
2024-04-09 22:26:51来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama2024-09-19 14:21:51
- “最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱2024-09-13 18:38:35
- 元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B2024-09-13 20:49:18
- 开源鸿蒙 OpenHarmony 社区累计已超 8000 名贡献者,9 月 26 日举办生态主题演讲2024-09-10 04:05:08
- 国内航天领域首款智慧物联操作系统“天鸿”发布,基于开源鸿蒙打造2024-09-01 17:23:23
- 最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
- 微软向 Wine 团队捐赠 Mono 开源项目2024-08-28 08:54:30
- 国产香山 RISC-V 开源处理器“南湖”开发板成功运行《云・原神》2024-08-24 15:02:12
- 最前线|KubeCon China 2024在香港举办,中国成为全球第二大开源贡献国2024-08-23 16:13:00
- 摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理2024-08-23 18:21:35
- 1安徽高新投先进材料投资基金登记成立 出资额3亿
- 2中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 3小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 4本月开测,微软网页版和 Win11 新版 Outlook 可固定收藏夹
- 5任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 6阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 7Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 8全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节
- 9小鹏宣布老用户芯片焕新众筹计划:单 Orin 升至双 Orin,座舱 820A 升级 8295
- 10小鹏汇天全倾转旋翼飞行汽车 X5 亮相:500km+ 续航、360km+/h 航速