微比恩 > 信息聚合 > 650 亿参数大模型预训练方案开源可商用！LLaMA 训练加速 38%，来自明星开源项目

650 亿参数大模型预训练方案开源可商用！LLaMA 训练加速 38%，来自明星开源项目

2023-07-18 13:20:55来源: IT之家

650 亿参数大模型预训练方案开源可商用！LLaMA 训练加速 38%，来自明星开源项目

图片地址：https://img.ithome.com/newsuploadfiles/2023/7/a1e27c3d-192d-4cdb-8c85-e64b2c40bbef.png?x-bce-process=image/format,f_auto

650 亿参数大模型的预训练方案，发布即开源。训练速度较传统方案提升 38%。这就是由 Colossal-AI 最新发布的类 LLaMA 基础大模型预训练方案。要知道，在“百模大战”背景下，谁拥有自家大模型，往往被视为核心竞争力。在这个节点下，愿意开源大模型的公司少之又少。但自己从头训练一个大模型，对技术、资金都有很高要求。由此，Colossal-AI 最新的开源动作，可以说是应时势所需了。并且它还不限制商业使用，开箱即用仅需 4 步。具体项目有哪些内容？一起往下看~开源地址：https://github.com/hpcaitech/ColossalAI32 张 A100 / A800 即可使用实际上，自从 Meta 开源 LLaMA 后，掀起了一波微调项目热潮，如 Alpaca、Vicuna、ColossalChat 等都是在其基础上打造的。但是 LLaMA 只开源了模型权重且限制商业使用，微调能够提升和注入的知识与能力也相对

关注公众号

标签：开源

提示：支持键盘“← →”键翻页

上一篇继卡口问题后，尼康 Z 8 相机用户再反馈肩带扣圈容易掉落

下一篇特斯拉国内车型推送 2023.20.8 版本 OTA 更新，改进驻车辅助功能

赞

你的鼓励是对作者的最大支持

相关阅读

阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama2024-09-19 14:21:51
“最强开源模型”Reflection 被打假，英伟达科学家称现有测试基准已不靠谱2024-09-13 18:38:35
元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B2024-09-13 20:49:18
开源鸿蒙 OpenHarmony 社区累计已超 8000 名贡献者，9 月 26 日举办生态主题演讲2024-09-10 04:05:08
国内航天领域首款智慧物联操作系统“天鸿”发布，基于开源鸿蒙打造2024-09-01 17:23:23
最强端侧开源 AI 模型 Zamba2-mini 登场：12 亿参数，4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
微软向 Wine 团队捐赠 Mono 开源项目2024-08-28 08:54:30
国产香山 RISC-V 开源处理器“南湖”开发板成功运行《云・原神》2024-08-24 15:02:12
最前线｜KubeCon China 2024在香港举办，中国成为全球第二大开源贡献国2024-08-23 16:13:00
摩尔线程开源音频理解大模型 MooER：基于国产全功能 GPU 训练和推理2024-08-23 18:21:35

热门排行榜

1日1周1月

免费发布分类信息

最新图片