小模型的风潮,最近愈来愈盛,Mistral 和微软分别有所动作。而网友实测发现,Mistral-medium 的代码能力竟然完胜了 GPT-4,而所花成本还不到三分之一。最近,「小语言模型」忽然成为热点。本周一,刚刚完成 4.15 亿美元融资的法国 AI 初创公司 Mistral,发布了 Mixtral 8x7B 模型。这个开源模型尽管尺寸不大,小到足以在一台内存 100GB 以上的电脑上运行,然而在某些基准测试中却能和 GPT-3.5 打平,因此迅速在开发者中赢得了一片称赞。之所以叫 Mixtral 8x7B,是因为它结合了为处理特定任务而训练的各种较小模型,从而提高了运行效率。这种「稀疏专家混合」模型并不容易实现,据说 OpenAI 在今年早些时候因为无法让 MoE 模型正常运行,而不得不放弃了模型的开发。紧接着,就在第二天,微软又发布了全新版本的 Phi-2 小模型。跟 Mistral 的 70 亿参数比,Phi-2 小到
Mistral 携微软引爆“小语言模型”风潮:代码能力完胜 GPT-4,成本仅有 1/3
2023-12-17 20:11:30来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 田笑蜜名下有1家存续公司 田笑蜜已被限制高消费 田笑蜜针对朱丹被骗事件发声2023-12-18 15:48:40
- 特步收购索康尼合资公司权益及索康尼在中国40%的知识产权2023-12-18 16:03:19
- 盘点新东方文旅商业版图 新东方文旅旗下企业已超30家 董宇辉任新东方文旅副总裁2023-12-18 16:26:32
- 多家名称碰瓷东方甄选公司经营异常 多家公司名称碰瓷东方甄选 抖音回应西方臻选被封号2023-12-18 16:36:25
- 蔚来汽车创始人李斌成功挑战1000公里续航!耗时14小时2023-12-18 11:51:18
- 马斯克:人类应该在月球建基地,在火星建城市,成为星际文明!2023-12-18 11:51:18
- OpenAI 工程师自曝开发 ChatGPT 仅用时 8 天,长文揭秘谷歌 DeepMind 等硅谷顶流如何诞生2023-12-17 22:16:48
- 英特尔加速 Linux 软件开发,为 Arrow Lake 和 Lunar Lake GPU 提供支持2023-12-17 23:27:29
- 动画《电锯人:蕾塞篇》剧场版确定制作,Mappa 工作室操刀2023-12-17 23:29:19
- 古尔曼:苹果 2024 年的重点集中 Vision Pro 等可穿戴设备上而非 iPhone 手机2023-12-17 23:30:51