在炼丹过程中,为了减少训练所需资源,MLer 有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就是知识蒸馏,一种模型压缩 / 训练方法。不过随着技术发展,大家也逐渐将蒸馏的对象扩展到了数据集上。这不,谷歌最近就提出了两种新的数据集蒸馏方法,在推特上引起了不小反响,热度超过 600:像这样,将 50000 张标注图像的 CIFAR-10 数据集“蒸馏”缩小至 1/5000 大小,只基于 10 张合成数据点进行训练,模型的准确率仍可近似 51%:△上:原始数据集 下:蒸馏后而如果“蒸馏数据集”由 500 张图像组成(占原数据集 1% 大小),其准确率可以达到 80%。两种数据集蒸馏方法分别来自于 ICLR 2021 和 NeurIPS 2021 上的两篇论文。通过两阶段循环进行优化那么要如何才能“蒸馏”一个数据集呢?其实,这相当于一个两阶段的优化过程:“内部循环”,用于在学习数据上训练模型“外部循环”
数据缩至 1/5000,模型准确率却翻倍,谷歌新“蒸馏法”火了
2021-12-17 15:06:46来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 消息称谷歌 10 月 15 日向 Pixel 6 及后续机型推送安卓 15 更新2024-09-19 14:16:18
- 谷歌搜索将整合 C2PA 2.1 标准,标注 AI 生成 / 编辑图片2024-09-18 09:10:59
- 谷歌发布 Chrome 浏览器 129 稳定版:降低延迟,含 9 项安全修复2024-09-18 10:04:15
- 谷歌 Pixel 平板升级至 Android 15 QPR1 Beta 2 将喜提桌面模式,类似三星 Dex / Chr…2024-09-13 21:07:19
- 谷歌搜索“关于此结果”面板新增互联网档案馆网页缓存链接,替代已移除第一方功能2024-09-12 17:31:06
- 因垄断搜索市场,谷歌将在明年 8 月前接受处罚2024-09-08 19:11:36
- 英国反垄断部门:谷歌“自我推荐”自家广告交易平台的行为损害市场竞争2024-09-06 17:33:42
- 荣耀CEO赵明宣布Magic V3将支持谷歌云服务2024-09-05 20:51:24
- 谷歌 Pixel 9 Pro XL 手机被曝屏幕问题:边角触控不灵,关闭输入法时无响应2024-09-03 12:36:52
- 谷歌 AI 推出 CardBench 评估框架:含 20 个真实数据库,更全面评估基数估计模型2024-09-03 14:35:55