650 亿参数大模型的预训练方案,发布即开源。训练速度较传统方案提升 38%。这就是由 Colossal-AI 最新发布的类 LLaMA 基础大模型预训练方案。要知道,在“百模大战”背景下,谁拥有自家大模型,往往被视为核心竞争力。在这个节点下,愿意开源大模型的公司少之又少。但自己从头训练一个大模型,对技术、资金都有很高要求。由此,Colossal-AI 最新的开源动作,可以说是应时势所需了。并且它还不限制商业使用,开箱即用仅需 4 步。具体项目有哪些内容?一起往下看~开源地址:https://github.com/hpcaitech/ColossalAI32 张 A100 / A800 即可使用实际上,自从 Meta 开源 LLaMA 后,掀起了一波微调项目热潮,如 Alpaca、Vicuna、ColossalChat 等都是在其基础上打造的。但是 LLaMA 只开源了模型权重且限制商业使用,微调能够提升和注入的知识与能力也相对
650 亿参数大模型预训练方案开源可商用!LLaMA 训练加速 38%,来自明星开源项目
2023-07-18 13:20:55来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama2024-09-19 14:21:51
- “最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱2024-09-13 18:38:35
- 元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B2024-09-13 20:49:18
- 开源鸿蒙 OpenHarmony 社区累计已超 8000 名贡献者,9 月 26 日举办生态主题演讲2024-09-10 04:05:08
- 国内航天领域首款智慧物联操作系统“天鸿”发布,基于开源鸿蒙打造2024-09-01 17:23:23
- 最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
- 微软向 Wine 团队捐赠 Mono 开源项目2024-08-28 08:54:30
- 国产香山 RISC-V 开源处理器“南湖”开发板成功运行《云・原神》2024-08-24 15:02:12
- 最前线|KubeCon China 2024在香港举办,中国成为全球第二大开源贡献国2024-08-23 16:13:00
- 摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理2024-08-23 18:21:35
- 1动力锂电池高新技术企业“星恒电源”完成数亿元融资
- 2任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 3阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 4Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 5中国网络视听协会:今年微短剧市场规模有望首超内地电影票房
- 6亚马逊将向意大利数据中心业务投资13亿美元
- 7人民币兑美元中间价报7.1433,调升226个基点
- 8创业板指涨超2%,沪指涨近1%
- 9小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 10多口插拔不断连:酷态科 10 号 CP 超级闪充块单体版 105 元新低