微比恩 > 信息聚合 > 国内首个与ChatGPT不同机制的通用大模型发布，算力消耗缩减50%

国内首个与ChatGPT不同机制的通用大模型发布，算力消耗缩减50%

2024-01-24 20:48:50来源: 钛媒体

国内首个与ChatGPT不同机制的通用大模型发布，算力消耗缩减50%

图片地址：https://images.tmtpost.com/uploads/images/2024/01/6df9cf49c8fa36877e4bd26dcd44d7ae_1706100534.jpeg

岩芯数智CEO刘凡平（来源：钛媒体App编辑）钛媒体App获悉，1月24日下午，国内AIGC企业上海岩芯数智人工智能科技有限公司（岩芯数智，RockAI）在上海发布了国内首个自研的非Transformer Attention机制的低算力通用自然语言大模型——Yan模型，记忆能力提升3倍、速度提升7倍，推理吞吐量提升5倍。这是国内首个发布的与ChatGPT不同机制的通用大模型，参数规模达百亿。该公司称，这是用百亿级参数达成千亿参数大模型的性能效果。岩芯数智CEO刘凡平表示，“在全球范围内，一直以来都有不少优秀的研究者试图从根本上解决对 Transformer架构的过度依赖，寻求更优的办法替代 Transformer。历经超过几百次的设计、修改、优化、对比、重来后，岩芯数智自主研发出了不再依赖Transformer的全新架构——‘Yan架构’，同时，

关注公众号

标签：大模型 ChatGPT

提示：支持键盘“← →”键翻页

上一篇盛剑环境拟募资5亿主投半导体制程项目，实施主体尚在亏损中

下一篇零供博弈四十年，品牌如何穿越周期

赞

你的鼓励是对作者的最大支持

相关阅读

腾讯推出 Hunyuan-Large 大模型：389B 总参数，业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
华西医院联合华为数据存储发布“华西黉医”医学大模型：集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
9点1氪｜美邦创始人回应开淘宝直播想当网红；纸制火车票11月1日起成为历史；ChatGPT上线搜索功能2024-11-02 09:00:30
智己汽车发布 IM AD 3.0 智驾，全球首批量产一段式端到端大模型2024-10-28 16:41:37
科大讯飞升级星火大模型，持续推动AI大模型产业化应用 | 最前线2024-10-25 14:58:35
钛媒体独家｜大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品2024-10-25 10:26:26
中信建投：零一万物发布Yi-Lightning，国产大模型迭代加速2024-10-25 07:57:29
加速大模型上车浪潮信息自动驾驶计算框架AutoDRRT 2.0实现车端低延时计算2024-10-21 17:07:00
国内首个应用临床眼科大模型 “伏羲慧眼”发布，可检测、预测眼部健康状态2024-10-21 09:28:33

热门排行榜

1日1周1月

免费发布分类信息

最新图片