语言模型越来越厉害,也越来越大。如何在不扩大规模的情况下提升模型性能?谷歌 AI 想出了一个「强强联合」的好点子。近年来,语言模型(LM)在自然语言处理(NLP)研究中变得更加突出,在实践中也越来越有影响力。一般来说,扩大模型的规模已被证明可以提升在一系列 NLP 任务中的性能。不过,扩大模型规模的挑战也是显而易见的:训练新的、更大的模型需要大量的计算资源。此外,新的模型往往是从头开始训练的,无法利用以前的模型的训练权重。对于这个问题,谷歌的研究人员探讨了两种互补的方法,在不额外消耗大量计算资源的情况下,大幅提高现有语言模型的性能。首先,在 「Transcending Scaling Laws with 0.1% Extra Compute」一文中,研究人员介绍了 UL2R,这是一个轻量级的第二阶段预训练模型,使用一个混合 enoisers 目标。UL2R 提高了一系列任务的性能,甚至在以前具有接近随机性能的任务上释放出突发性能
算力就这么点,为了提升语言模型性能,谷歌想了个新点子
2022-12-13 17:57:07来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 消息称谷歌 10 月 15 日向 Pixel 6 及后续机型推送安卓 15 更新2024-09-19 14:16:18
- 谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片2024-09-18 09:10:59
- 谷歌发布 Chrome 浏览器 129 稳定版:降低延迟,含 9 项安全修复2024-09-18 10:04:15
- 谷歌 Pixel 平板升级至 Android 15 QPR1 Beta 2 将喜提桌面模式,类似三星 Dex / Chr…2024-09-13 21:07:19
- 谷歌搜索“关于此结果”面板新增互联网档案馆网页缓存链接,替代已移除第一方功能2024-09-12 17:31:06
- 因垄断搜索市场,谷歌将在明年 8 月前接受处罚2024-09-08 19:11:36
- 英国反垄断部门:谷歌“自我推荐”自家广告交易平台的行为损害市场竞争2024-09-06 17:33:42
- 荣耀CEO赵明宣布Magic V3将支持谷歌云服务2024-09-05 20:51:24
- 谷歌 Pixel 9 Pro XL 手机被曝屏幕问题:边角触控不灵,关闭输入法时无响应2024-09-03 12:36:52
- 谷歌 AI 推出 CardBench 评估框架:含 20 个真实数据库,更全面评估基数估计模型2024-09-03 14:35:55
- 1上药云健康进博会首秀:以专业药房体系引领创新疗法用药惠及患者
- 2输出轻资产管理 济高•世茂芯环中心盛大开业
- 3欧莱雅皮肤科学美容事业部亮相进博会,共探科学护肤未来
- 4人民网发布11.11电商服务调研结果 超33%消费者认为京东服务创新最多、最活跃
- 5晓华在原址注册新理发店 晓华个人注册理发店
- 6法国欧珑全球首家香水学院在欧莱雅进博会展台拉开序幕
- 7官方玩梗!听泉赏宝公司登记听泉猫作品著作权
- 8TCL智家及TCL家电集团换帅完成工商变更 彭攀任TCL智家及TCL家电集团董事长
- 9TÜV南德授予亿联网络MVC S40产品碳足迹核查声明
- 10Firstrade 宣布将于2025年第一季度推出美股隔夜交易服务