大语言模型之大,成本之高,让模型的稀疏化变得至关重要。众所周知,对于大语言模型来说,规模越大,所需的算力越大,自然占用的资源也就越多。研究人员于是乎把目光转到了这片领域,即模型的稀疏化(Sparsification)。今天要介绍的 SliceGPT,则可以实现模型的事后稀疏。也就是说,在一个模型训练完了以后再进行稀疏化操作。该模型由微软研究院和苏黎世联邦理工学院联合发表在了 arXiv 上。目前主流的稀疏化技术面临着挺多挑战和困难。比方说,需要额外的数据结构,而且在当下的硬件条件下,速度有限。SliceGPT 就能很好的解决这些问题 —— 它能用一个较小的矩阵来替换每个权重矩阵,从而降低网络的嵌入维度。而实际结果也是非常不错的,在 LLAMA-2 70B、OPT 66B 和 Phi-2 模型上,SliceGPT 去除了多达 25% 的模型参数,还保证了模型本身 99%、99% 以及 90% 的零样本任务的性能。此外,SliceG
微软提出模型稀疏化新方法:单 GPU 就能压缩模型,性能不变参数少 25%
2024-02-21 21:25:59来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 微软、贝莱德、GIP、MGX 宣布成立超 300 亿美元 AI 基础设施投资基金,英伟达提供专业知识支持2024-09-18 08:53:40
- 微软宣布 Xbox 游戏部裁员 650 人,占全球员工总数 3%2024-09-12 18:35:46
- 消息称微软 9 月 26 日东京电玩展将公布 SE 游戏《最终幻想 16》Xbox 版2024-09-08 15:26:08
- 9 个月实现翻番,微软 Outlook Lite 应用全球下载量破 1000 万次2024-09-06 17:02:49
- 微软 Office 2024 默认禁用 ActiveX, Microsoft 365 将于 2025 年 4 月开始逐步生效2024-09-06 22:26:28
- 微软 Windows App SDK 1.6 原生支持超前编译,应用启动时间缩短 50%2024-09-05 13:49:45
- 微软 Win11 Beta 22635.4145 预览版发布:优化输入、A / B 测试新版桌面聚焦2024-08-31 06:48:21
- 微软 Win11 Canary 27695 预览版发布:左对齐任务栏上小部件面板入口启用新位置2024-08-31 07:10:06
- 消息称国产 GPU 厂商象帝先解散,400 人团队原地失业2024-08-31 10:33:21
- 微软 Edge 浏览器调整“内存限制器”:滑块变下拉菜单,预设 5 种选项2024-08-30 13:36:24
- 1任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 2阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 3Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 4中国网络视听协会:今年微短剧市场规模有望首超内地电影票房
- 5亚马逊将向意大利数据中心业务投资13亿美元
- 6小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 7多口插拔不断连:酷态科 10 号 CP 超级闪充块单体版 105 元新低
- 8安徽高新投先进材料投资基金登记成立 出资额3亿
- 9中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 10全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节