微比恩 > 信息聚合 > 国内首个与ChatGPT不同机制的通用大模型发布,算力消耗缩减50%

国内首个与ChatGPT不同机制的通用大模型发布,算力消耗缩减50%

2024-01-24 20:48:50来源: 钛媒体

岩芯数智CEO刘凡平(来源:钛媒体App编辑)钛媒体App获悉,1月24日下午,国内AIGC企业上海岩芯数智人工智能科技有限公司(岩芯数智,RockAI)在上海发布了国内首个自研的非Transformer Attention机制的低算力通用自然语言大模型——Yan模型,记忆能力提升3倍、速度提升7倍,推理吞吐量提升5倍。这是国内首个发布的与ChatGPT不同机制的通用大模型,参数规模达百亿。该公司称,这是用百亿级参数达成千亿参数大模型的性能效果。岩芯数智CEO刘凡平表示,“在全球范围内,一直以来都有不少优秀的研究者试图从根本上解决对 Transformer架构的过度依赖,寻求更优的办法替代 Transformer。历经超过几百次的设计、修改、优化、对比、重来后,岩芯数智自主研发出了不再依赖Transformer的全新架构——‘Yan架构’,同时,

关注公众号
标签: 大模型 ChatGPT