IT之家 8 月 25 日消息,阿里云今日推出了大规模视觉语言模型 Qwen-VL,目前已经在 ModeScope 开源,IT之家早前曾报道,阿里云此前已经开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。据悉,Qwen-VL 是一款支持中英文等多种语言的视觉语言(Vision Language,VL)模型,相较于此前的 VL 模型,其除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。▲ 图源 ArXiv 论文Qwen-VL 以 Qwen-7B 为基座语言模型,在模型架构上引入视觉编码器,使得模型支持视觉信号输入,该模型支持的图像输入分辨率为 448,此前开源的 LVLM 模型通常仅支持 224 分辨率。官方表示,该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景,在主流的多模态任务评测和多模态聊天能力评测中,取得了远超同等
阿里云开源通义千问多模态视觉模型 Qwen-VL,号称“远超同等规模通用模型表现”
2023-08-25 20:51:25来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB2024-08-29 15:29:44
- 微软向 Wine 团队捐赠 Mono 开源项目2024-08-28 08:54:30
- 国产香山 RISC-V 开源处理器“南湖”开发板成功运行《云・原神》2024-08-24 15:02:12
- 最前线|KubeCon China 2024在香港举办,中国成为全球第二大开源贡献国2024-08-23 16:13:00
- 阿里云携手优酷,用AI重塑影视IP创新边界 | 阿里云Create@AI江湖创作大赛2024-08-23 17:02:16
- 消息称阿里 1688 平台将严厉打击恶意“薅羊毛”“仅退款”行为2024-08-23 17:35:51
- 摩尔线程开源音频理解大模型 MooER:基于国产全功能 GPU 训练和推理2024-08-23 18:21:35
- 阿里巴巴市值反超拼多多,重返 2000 亿美元2024-08-23 21:58:09
- 中国信通院将联合阿里巴巴等开展数据匿名化标准试点,保护你的上网信息2024-08-22 12:20:35
- 阿里淘天:百万年薪招聘三维重建算法人才2024-08-21 16:49:55
- 1合格评定助力电子商务高质量发展 SGS携手电商平台发起行动倡议
- 2英国科学家研制出超薄二维表面材料,有望增强 6G 卫星通信能力
- 3三星 Galaxy A16 5G 手机宣传图曝光:6.7 英寸屏幕、天玑 6300 / Exynos 1330 芯片,6…
- 4Snap 发布第 5 代 Spectacles AR 眼镜:集成 OpenAI 多模态 AI 模型,支持语音控制
- 5肯辛通发布 SD5000T5:首款英特尔认证的 Thunderbolt 5 扩展坞,11 个端口、最高 120 Gbps…
- 6FENDER 为多次荣膺格莱美的摇滚巨星 JACK WHITE 推出全新签名系列
- 7衣服里的Sorona 索罗纳®是什么材料?
- 8充电 60 元超时费 1600 元,特斯拉车主又遭遇充电刺客
- 9小鹏用实际行动证明,李想说得没错
- 10科技昨夜今晨 0918:三只羊涉嫌误导消费者被立案;消息称苹果包下台积电 2nm 首批产能;曝《黑神话:悟空》首个 DL…