微比恩 > 信息聚合 > PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

PyTorch 架构优化库 torchao 正式发布,可大幅提升 AI 模型效率

2024-10-02 13:03:26来源: IT之家

IT之家 10 月 2 日消息,据 PyTorch 新闻稿,PyTorch 旗下架构优化库 torchao 现已正式发布,该优化库主要专注于模型的量化和稀疏性优化,能够在保证性能的同时降低模型的计算成本和 RAM 用量,从而提升模型运行效率,IT之家附 GitHub 页面地址(点此访问)。据介绍,torchao 提供了一系列优化工具集,可以帮助 LLaMA 3 等流行的 AI 模型提升性能,其支持 float8、int4 等低精度数据类型,能够有效减少硬件开销和 RAM 用量。官方举例,在 LLaMA 3 70B 模型的预训练中,torchao 提供的 float8 训练流程可将模型计算速度提升 1.5 倍。开发者只需利用 convert_to_float8_training 函数,即可将模型训练转换为 float8,从而轻松实现模型高效训练。在推理方面,torchao 提供多种量化方法,包括权重量

关注公众号