IT之家 6 月 27 日消息,美国加州大学圣克鲁兹分校的研究团队研究出新的方法,只需要 13W 的功率(相当于一个现代 LED 灯泡的功率),就能运行 10 亿参数规模的大语言模型。而作为对比,用于大语言模型任务的数据中心级 GPU 需要约 700W。AI 浪潮下很多公司、机构的研究主方向是应用、推理方面,很少考虑效率等指标。该研究人员为缓解这种状况,淘汰了矩阵乘法的密集型技术,提出了“三元数”方案,只有负一、零或正一三个数值。团队还使用一种名为现场可编程门阵列(FPGA)的高度定制电路创建了定制硬件,让他们能够最大限度地利用神经网络中的所有节能功能。在定制硬件上运行时,可以达到与 Meta 的 Llama 等顶级模型相同的性能,但神经网络功率是常规配置的五十分之一。该神经网络设计还可以用于在人工智能行业常用的标准 GPU 上运行,测试结果显示,与基于矩阵乘法的神经网络相比,显存占用仅为十分之一。IT之家附上参考地址Resea
新型 AI 算法亮相:功率降至常规配置 1/50,显存占用降至 1/10
2024-06-27 10:48:10来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 外观设计引争议,消息称宝马 XM SUV 纯电版被取消2024-06-27 10:49:34
- 棉柔巾真的比绵柔巾好吗?二者有什么区别?2024-06-25 22:00:00
- 为了地球,先把商场的冷气管起来2024-06-25 22:51:15
- 产业升级是如何毁灭就业的,又是如何创造就业的2024-06-26 14:28:11
- 我们变得越来越笨,是因为“大脑进化”了?2024-06-26 15:00:10
- 美联储加息,东西方博弈,加纳的债务危机,关中国什么事?2024-06-26 16:00:37
- 618电商表现不佳,靠短剧自救?2024-06-26 18:00:00
- 总想用心理学名词解释自己的痛苦,是对问题的逃避2024-06-26 21:00:37
- 古茗已申请引发争议的图形商标 古茗已申请新logo商标2024-06-25 21:13:43
- OpenAI 停止中国 API 使用;曾毓群回应“奋斗一百天”;moto razr 50 AI 手机发布|Do早报2024-06-26 08:31:50
- 1安徽高新投先进材料投资基金登记成立 出资额3亿
- 2中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 3小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 4本月开测,微软网页版和 Win11 新版 Outlook 可固定收藏夹
- 5任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 6阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 7Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 8全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节
- 9小鹏宣布老用户芯片焕新众筹计划:单 Orin 升至双 Orin,座舱 820A 升级 8295
- 10小鹏汇天全倾转旋翼飞行汽车 X5 亮相:500km+ 续航、360km+/h 航速