微比恩 > 信息聚合 > 开源大模型超越 GPT-3.5！爆火 MoE 实测结果出炉，网友：OpenAI 越来越没护城河了

开源大模型超越 GPT-3.5！爆火 MoE 实测结果出炉，网友：OpenAI 越来越没护城河了

2023-12-12 15:54:54来源: IT之家

开源大模型超越 GPT-3.5！爆火 MoE 实测结果出炉，网友：OpenAI 越来越没护城河了

图片地址：https://img.ithome.com/newsuploadfiles/2023/12/ac8b025f-9f9e-4456-8002-0a7dcf50e91e.png?x-bce-process=image/format,f_auto

一条神秘磁力链接引爆整个 AI 圈，现在，正式测评结果终于来了：首个开源 MoE 大模型 Mixtral 8x7B，已经达到甚至超越了 Llama 2 70B 和 GPT-3.5 的水平。（对，就是传闻中 GPT-4 的同款方案。）并且由于是稀疏模型，处理每个 token 仅用了 12.9B 参数就做到了这般成绩，其推理速度和成本也与 12.9B 的密集模型相当。消息一出，再次在社交媒体上掀起讨论热潮。OpenAI 创始成员 Andrej Karpathy 第一时间赶到现场整理起了笔记，还高亮出了重点：这家“欧版 OpenAI”透露出的最强模型，还只是“中杯”。p.s. Mixtral 8×7B 甚至只是小杯……英伟达 AI 科学家 Jim Fan 则赞说：每个月都会有十几个新的模型冒出来，但真正能经得住检验的却寥寥无几，能引发大家伙热烈关注的就更少了。并且这波啊，不仅是模型背后公司 Mistral AI 大受关注，也带动 Mo

关注公众号

标签： AI 大模型开源 OpenAI

提示：支持键盘“← →”键翻页

上一篇 Streamview 推出新款诺基亚 43 英寸电视：4K HDR QLED，售 498.55 欧元

下一篇微软考虑推出带广告的 Xbox Game Pass 免费云游戏

赞

你的鼓励是对作者的最大支持

相关阅读

Meta AR 眼镜项目前负责人将加入 OpenAI，领导机器人和消费硬件部门2024-11-05 15:03:46
腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
估值超140亿、OpenAI贝佐斯下场，这家让机器人装AI“大脑”的公司获28亿新融资｜钛媒体AGI2024-11-05 08:34:22
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
OpenAI 公布新型 AI 文生图方案“sCM”，号称效率是传统扩散模型 50 倍2024-10-27 15:28:19
微软CEO在2024财年获得价值7910万美元的总薪酬；奥尔特曼辟谣OpenAI新模型消息｜Do早报2024-10-26 10:19:32
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
OpenAI解散AGI团队 | 最前线2024-10-25 18:31:17

热门排行榜

1日1周1月

免费发布分类信息

最新图片