作者 | 邓咏仪 编辑 | 苏建勋国内大模型如今步入落地阶段,另一方面,开源生态也初见雏形。9月25日,阿里云开源了第二款大模型——通义千问140亿参数模型Qwen-14B,及其对话模型Qwen-14B-Chat,本次开放的模型免费可商用。阿里曾于今年8月推出70亿参数的模型Qwen-7B等,一个多月下载量突破100万。如今的Qwen-14B,是阿里云开源的第二款模型。来源:阿里云Qwen-14B比起此前的7B模型,参数规模更大,并且模型性能也有不少提升。Qwen-14B是一款支持多语言的高性能开源模型,整体训练数据超过3万亿Token——作为对比,全球当前的开源模型霸主Llama2,预训练数据在2万亿Token左右。 并且,Qwen-14B最大支持8k上下文窗口长度,这意味着模型会具备更强大的推理、认知、规划和记忆能力。8k也已经是如今头部大模型的配置——以GPT-4为例,8K的上下文窗口约等于可以处理60
阿里云发布了第二款140亿参数开源模型,免费可商用 | 最前线
2023-09-26 18:04:05来源: 36氪
关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里通义千问开源 Qwen2.5 大模型,号称性能超越 Llama2024-09-19 14:21:51
- 阿里通义万相视觉生成大模型升级,支持文生视频、图生视频等2024-09-19 14:35:09
- “最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱2024-09-13 18:38:35
- 元象发布中国最大 MoE 开源大模型:总参数 255B,激活参数 36B2024-09-13 20:49:18
- 腾讯与阿里,世界大和解2024-09-13 17:41:50
- 阿里巴巴再获南向资金加仓13.17亿港元2024-09-13 17:41:33
- 开源鸿蒙 OpenHarmony 社区累计已超 8000 名贡献者,9 月 26 日举办生态主题演讲2024-09-10 04:05:08
- 阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋2024-09-05 15:55:00
- 阿里云通义千问 Github 页面 404,负责人回应称没有跑路、突然被官方标记2024-09-05 11:20:44
- 阿里影业等在北京成立影业新公司 注册资本100万2024-09-04 16:26:55
- 1红魔 10 Pro 系列手机发布:骁龙 8 至尊版、1.5K 144Hz“悟空屏”,4999 元起
- 2GGA电竞学院携手延世大学培养游戏行业人才
- 3菲亚特动力科技推出全新紧凑型发动机 R38
- 4瑞典国家旅游局开创先例申请注册目的地商标
- 5全球顶级足球俱乐部齐聚卡塔尔沙漠之星参加卡塔尔精英学院第10届全球峰会
- 6新一轮拆迁换房来袭,但这次没有拆二代、没有暴发户了
- 7点亮你的四季生活 解锁中国大陆地区8家四季酒店会籍专属礼遇
- 8AI如何赋能可持续发展?IBM 最新调研揭秘现状:企业投资热情不减,但行动尚未跟上
- 9宜鼎专为边缘服务器应用推出E1.S固态硬盘
- 10微软庆祝 Windows 预览体验计划 10 周年,纪念壁纸开放下载