文|邓咏仪 周鑫雨编辑|苏建勋GPT-4o的王座还没坐热乎,小扎率领开源大军火速赶到——如此前传闻一样,美国太平洋时间7月23日,Meta正式发布Llama 3.1。这是如今开源领域使用者最广泛,性能最顶级的大模型系列。无独有偶,发布前一天,Llama 3.1又在开发者社区中“惨遭泄露”,除了模型信息外,还包括405B模型的磁力链接,开发者们已经玩儿得热火朝天。Llama 3.1正式发布的信息,也和爆料别无二致:共有8B、70B 和 405B 三个尺寸,上下文长度都提升到了128K。根据Meta提供的基准测试数据,最受关注的405B(4050亿参数),从性能上已经可媲美GPT-4和Claude 3.5。△与GPT-4和Claude 3.5对比在目前一水的顶尖模型面前,Llama 3.1也是不带怕的:△与闭源模型对比△与开源模型对比可以说,Llama 3.1的发布,为最近火热的开源闭源路线之争,写下里程碑式的一笔:顶尖的开源模型,
Llama 3.1正式发布:4050亿参数模型开源,小扎:把开源进行到底
2024-07-24 07:31:23来源: 36氪
关注公众号
赞
你的鼓励是对作者的最大支持
- 最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
- 微软向 Wine 团队捐赠 Mono 开源项目2024-08-28 08:54:30
- 国产香山 RISC-V 开源处理器“南湖”开发板成功运行《云・原神》2024-08-24 15:02:12
- 最前线|KubeCon China 2024在香港举办,中国成为全球第二大开源贡献国2024-08-23 16:13:00
- 摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理2024-08-23 18:21:35
- 北斗 Astrolink S 智能手表发布:华为海思 MCU + 开源鸿蒙 OpenHarmony 底层架构,2999 元起2024-08-20 15:58:51
- 小米:将对外公开超 1000 万行的 Xiaomi Vela 开源代码2024-08-20 17:53:27
- 国内首批,饿了么免费开源 10 项专利2024-08-20 10:17:33
- 华为推出 5 本软件工程教材:分别基于鲲鹏、开源鸿蒙 OpenHarmony、openEuler 等2024-08-18 17:41:45
- 托管在 GitHub 上的诸多开源项目被曝存在 Auth tokens 泄露问题2024-08-16 08:37:42