微比恩 > 信息聚合 > 中国电信星辰语义大模型 TeleChat-7B 版本宣布开源,并开放 1T 数据集

中国电信星辰语义大模型 TeleChat-7B 版本宣布开源,并开放 1T 数据集

2024-01-12 21:16:48来源: IT之家

IT之家 1 月 12 日消息,中国电信 1 月 10 日宣布开源星辰语义大模型 TeleChat-7B 版本,并开放 1T 清洗数据集。此外,中国电信还将在 1 月 20 日开源 12B 版本模型,拥抱更多开发者共建开源大模型生态。据介绍,星辰语义大模型是由中电信人工智能科技有限公司研发训练的大语言模型,采用 1.5 万亿 Tokens 中英文语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将 AI 大模型的幻觉率降低了 40%,有助于大模型变得更有“人味”,理解问题语境,告别风马牛不相及的答案。在中国电信内部,星辰语义大模型用于行文写作、代码编程、网络故障分析以及经营分析等场景,以行文写作为例,其平均生成字数超过 1500 字,有效采纳率达到 85.7%;在对外企事业单位客户的业务中,星辰语义大模型用于企业经营分析、政务公开咨询、民生

关注公众号