IT之家 6 月 11 日消息,俄罗斯科技巨头 Yandex 推出了一款开源的大语言模型训练工具 ——YaFSDP,号称与现有工具相比速度最高可提升 26%。据介绍,YaFSDP 在训练速度方面优于传统的 FSDP 方法,尤其适用于大型模型。在预训练 LLM 方面,YaFSDP 速度提高了 20%,并且在高内存压力条件下表现更佳。例如,YaFSDP 对具有 700 亿参数的 Llama 2 可以实现 21% 的效率提升,对具有同级参数的 Llama 3 也实现 了 26% 的效率提升。IT之家附官方数据一览:模型gpu-countseq-lennum-ckpt-layersspeedupLlama 2 7B64204809.92%Llama 2 7B64409603.43%Llama 2 7B64819202.68%Llama 2 7B128204809.57%Llama 2 7B128409602.42%Llama
俄罗斯科技巨头 Yandex 宣布开源“YaFSDP”大语言模型训练工具:大幅提升 GPU 利用率,对 Llama 3 …
2024-06-11 18:03:24来源: IT之家
![](/images/qrcode_for_gh_5f0dab6cf0de_258.jpg)
关注公众号
赞
你的鼓励是对作者的最大支持
- 揭秘天兵科技关联公司 天兵科技火箭测试发射专利已被驳回2024-07-02 17:45:39
- 特斯拉回应停产 4680 电池;华为将问界商标转让给赛力斯;天兵科技发布致歉信|Do早报2024-07-03 08:57:04
- 华钦科技宣布组织架构调整,李立先生将升任集团总裁2024-07-02 20:30:00
- 亚马逊云科技连续5年位列Gartner云AI开发者服务魔力象限"领导者"2024-07-03 11:03:00
- 氪星晚报|茅台等15亿元成立生物科技产业基金;闲鱼副业功能上线,技能服务订单连续两年上涨;美团团购推出“秒提”服务2024-07-02 17:54:11
- 反舌鸟科技推出「智嵌未来」平台,以游戏+AI驱动品牌营销新增长 | 早期项目2024-07-03 08:02:03
- 茅台等15亿元成立生物科技产业基金2024-07-02 12:39:58
- 亚马逊云科技中国区域推出Amazon Private CA私有证书服务2024-07-02 13:20:35
- 36氪冯大刚X商汤科技徐立:中国有「百模大战」不一定是坏事,市场会验证产品和技术丨WAVES新浪潮20242024-07-02 10:58:59
- 科技昨夜今晨 0702:微软回应关闭中国线下店、微信回应收款码拍下来无法付款、闲鱼网页版新进展公布2024-07-02 08:20:09
- 1Montrose Environmental Group发布2023年可持续发展报告行政概要
- 2林生斌与亡妻关联公司均经营异常 林生斌商业版图盘点
- 3三得利坚定投资中国市场;欧莱雅下调全球美妆市场增长预期;麦德龙供应链冲击IPO | 品牌日报
- 4三星Galaxy Watch 7和Ultra提前曝光 Ultra会有三种颜色
- 5微软回应关闭中国线下店;微信收款码拍下来没法付款;特斯拉宣布 5 年免息政策|Do早报
- 6已投资380亿美元,这个覆盖17亿人的赛道要火
- 734位大厂高管转战AI,字节成创业“大本营”,最看好Agent、垂直大模型方向
- 8高圆圆起诉服饰公司侵权 高圆圆维权案件将开庭
- 9郑爽电视剧出品方300万股权被冻结 郑爽电视剧出品公司股权被冻结
- 10飞书:To C思路到底能否解To B难题?