微比恩 > 信息聚合 > 中国电信确定大模型开源时间表,发布首批12个行业大模型

中国电信确定大模型开源时间表,发布首批12个行业大模型

2023-11-11 11:27:44来源: 钛媒体

中国电信成为大模型领域一股重要力量。在2023数字科技生态大会上,中国电信展现了从液冷数据中心到智算平台,从基础大模型到行业大模型的全面布局,“网络+云计算+AI+应用”成为中国电信的数字化标签。全面披露大模型布局7月初世界人工智能大会上,中国电信发布了百亿参数的星辰语义模型,中中国电信人工智能科技有限公司总经理何忠江表示,中国电信在进行商业化落地过程中碰到了三个主要问题,幻觉问题、外推窗口问题以及多轮逻辑推理问题。本次中国电信发布的星辰千亿参数语义大模型,一定程度缓解如上问题。例如针对幻觉问题,中国电信通过数据切片溯源的机制,将一个复杂逻辑问题拆解为多轮逻辑相对简单,数据可溯源的小问题来进行SFT训练,在千亿参数规模下,自测幻觉率能够降低一半左右。接下来中国电信将通过量化蒸馏的手段,让模型能够低成本商用。值得关注的是,中国电信的AI团队宣布了开源开放的时间表,将于今年年底之前开源百亿参数模型,明年4月开

关注公众号