微比恩 > 信息聚合 > 英伟达推出 Tensor RT-LLM，使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍

英伟达推出 Tensor RT-LLM，使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍

2023-10-18 07:51:55来源: IT之家

英伟达推出 Tensor RT-LLM，使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍

图片地址：https://img.ithome.com/newsuploadfiles/2023/10/bd6994fc-30cf-4da6-8241-a8f7339f2602.jpg?x-bce-process=image/format,f_auto

IT之家 10 月 18 日消息，英伟达是硬件领域的生成型人工智能之王，该公司的 GPU 为微软、OpenAI 等公司的数据中心提供动力，运行着 Bing Chat、ChatGPT 等人工智能服务。今天，英伟达宣布了一款新的软件工具，旨在提升大型语言模型（LLM）在本地 Windows PC 上的性能。在一篇博客文章中，英伟达宣布了其 TensorRT-LLM 开源库，这个库之前是为数据中心发布的，现在也可以用于 Windows PC。最大的特点是，如果 Windows PC 配备英伟达 GeForce RTX GPU，TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。英伟达在文章中介绍了 TensorRT-LLM 对开发者和终端用户的好处：在更大的批量大小下，这种加速可显著改善更复杂的 LLM 使用体验，如写作和编码助手，可同时输出多个唯一的自动完成结果，从而加速性能

关注公众号

标签：英伟达 PC

提示：支持键盘“← →”键翻页

上一篇目标 100% 平等，斯宾塞强调不会利用《使命召唤》游戏搞 Xbox 独占

下一篇斯宾塞：不会强制工作室重制游戏 IP，若有团队感兴趣会全力配合

赞

你的鼓励是对作者的最大支持

相关阅读

三星电子 PCIe 5.0 PC 固态硬盘 PM9E1 量产，顺序读取 14.5 GB/s2024-09-19 15:58:00
蔚来汽车合肥 PCDC 配件分拨中心开仓，顺丰负责日常管理与运营2024-09-16 16:49:02
《赛博朋克 2077》新增 AMD FSR3 帧生成，PC 版发布 2.13 版本更新2024-09-13 17:50:13
蒙泰高新：控股孙公司甘肃纳塔签订1.79亿元EPC总承包合同2024-09-11 18:49:53
英特尔 Arrow Lake 处理器曝料：IPC 提升 15%，游戏性能挑战 AMD 锐龙 9000X3D 系列有难度2024-09-10 00:56:04
全球首款自动旋转屏 AI PC：联想 ThinkBook Auto Twist 概念机亮相2024-09-06 18:00:11
中国移动云电脑 PC 端 3.0 升级：全面适配主流国产化芯片，支持一键重装系统2024-09-03 15:59:49
《文明 7》PC 版宣布使用 Denuvo 游戏防盗版技术：2025 年 2 月 11 日发售，定价 298 元起2024-08-31 14:52:33
美国7月核心PCE物价指数同比上升2.6%2024-08-30 20:36:44
成立至今 27 年，PC 硬件资讯网站 AnandTech 宣布停更2024-08-31 08:04:11

热门排行榜

1日1周1月

免费发布分类信息

最新图片