微比恩 > 信息聚合 > 阿里Qwen-VL开源!能读图识物,一句话让AI来找茬,可二次开发和商用

阿里Qwen-VL开源!能读图识物,一句话让AI来找茬,可二次开发和商用

2023-09-27 19:30:21来源: 36氪

作者 | 虞景霖编辑 | 邓咏仪 尚恩国产多模态大模型开启公测!进口替代的泼天富贵也有咱们大模型的一份。来源:公开网络就在前不久,阿里宣布开源Qwen-VL,一款支持中英文等多种语言的视觉语言大模型,这也是首个支持中文开放域定位的通用模型。据官网说明,Qwen-VL不仅支持图像、文本和检测框等输入/输出,还能对输入的图像进行细粒度视觉定位。什么是细粒度视觉定位?举个简单例子——要让大模型不仅识别出图像中的是一条狗,还要说出这是哪个品种,是萨摩耶还是哈士奇。来源:Qwen-VL现在Qwen-VL已直接开放可玩,只要进入官网,完成简单注册就ok。官网链接:https://modelscope.cn/studios/qwen/Qwen-VL-Chat-Demo/summary来源:Qwen-VL具体效果如何?通义千问主要从英文基准测试和试金石测试两个角度对Qwen-VL进行测试。结果显示,Qwen-VL在零样本图像描述、通用视觉问答等

关注公众号
标签: 开源 AI 阿里