最新论文表明,LLM 等生成模型可以通过搜索来扩展,并实现非常显著的性能提升。另一个复现实验也发现,让参数量仅 8B 的 Llama 3.1 模型搜索 100 次,即可在 Python 代码生成任务上达到 GPT-4o 同等水平。强化学习先驱、加拿大阿尔伯塔大学 CS 系教授 Rich Sutton 曾在 2019 年写下一篇名为《The Bitter Lesson》的博文,成为 AI 领域的经典论述之一。甚至,Rich Sutton 在字里行间体现出的直觉已经颇有 Scaling Law 的意味。原文地址:https://www.cs.utexas.edu/~eunsol / courses / data / bitter_lesson.pdf文章简要回顾了 AI 在象棋、围棋、语音识别和视觉等领域的发展道路,并提出了这样的观点:我们应该吸取的惨痛教训之一,就是要意识到通用方法的力量。随着可用算力猛增带来计算量的增加,这种方法
Llama 8B 搜索 100 次超越 GPT-4o,推理 + 搜索即可提升性能
2024-08-15 23:52:28来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 富士康印度投资计划又有进展,但要先解决性别歧视2024-08-15 23:39:19
- 蔚来回应“提车 87 天出现 7 个毛病”:已与车主沟通处理,基本都已解决2024-08-15 23:44:04
- 微软发布 Win11 Canary 27686 预览版:全新 Sandbox Client 预览版、FAT32 格式化磁…2024-08-16 06:29:45
- 佳明 Enduro 3 智能手表曝光:51mm 表盘、Elevate 5 心率传感器、100 米防水2024-08-16 06:40:19
- 苹果停止签署 iOS 17.6 系统,已升级 iPhone 用户无法再降级2024-08-16 06:42:46
- 佳明 Fenix 8 / E 智能手表渲染图曝光:47mm 表盘,100 米防水2024-08-16 06:52:32
- 欧盟的苹果 App Store 将强制要求显示开发者的邮箱和电话号码2024-08-16 06:56:36
- 全新起亚 EV4 电动掀背车路测视频曝光2024-08-16 07:06:50
- Meta 确认 VR 版《GTA:圣安地列斯》已无限期搁置,公司正专注于其他项目2024-08-16 07:09:06
- 爆料称苹果 M4 MacBook Pro 的显示面板本月已发货,新品 Q4 发布2024-08-16 07:17:21