IT之家 12 月 14 日消息,据华中科技大学消息,近日,华中科技大学软件学院白翔教授领衔的 VLRLab 团队发布了多模态大模型 ——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲ 图源 Monkey 项目的 GitHub 页面IT之家注:多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的 AI 架构。据介绍,Monkey 模型在 18 个数据集上的实验中表现出色,特别是在图像描述和视觉问答任务方面,超越了众多现有知名的模型如微软的 LLAVA、谷歌的 PALM-E、阿里的 Mplug-owl 等。此外,Monkey 在文本密集的问答任务中显示出“显著的优势”,甚至在某些样本上超越了业界公认的领先者 ——OpenAI 的多模态大模型 GPT-4V。Monkey 的一个显著特点是“看图说话”能力。在详细描述任务中,Monkey 展现了对图像细节的感知能力,
华中科技大学开源多模态大模型“Monkey”,看图说话能力号称超越微软谷歌
2023-12-14 16:36:15来源: IT之家
关注公众号
赞
你的鼓励是对作者的最大支持
- 腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型2024-11-05 16:13:12
- 华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型2024-11-03 13:58:46
- 提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架2024-11-03 15:24:59
- 智己汽车发布 IM AD 3.0 智驾,全球首批量产一段式端到端大模型2024-10-28 16:41:37
- 印尼严控iPhone 16销售2024-10-27 13:07:23
- 丹麦首台 AI 超级计算机 Gefion 推出,由 1528 个英伟达 H100 GPU 驱动2024-10-27 15:29:08
- Nexon 虚幻 5 游戏新作「Project RX」公开,《蔚蓝档案》开发人员制作2024-10-26 17:50:27
- 兆驰股份在江西成立数码科技公司 注册资本3亿2024-10-25 16:49:09
- 爱康科技等被强制执行2.8亿2024-10-25 18:13:09
- Chinese Automakers Asked to Halt Expansion in Europe amid Ch…2024-10-26 09:45:02
- 1安徽高新投先进材料投资基金登记成立 出资额3亿
- 2中兴 5G AI CPE G5 Pro 开启预售:2.5G 双网口、 WAN / LAN 自适应,1999 元
- 3小鹏汽车明年将扩大到 60 个国家和地区市场,目标成为面向全球的 AI 汽车公司
- 4本月开测,微软网页版和 Win11 新版 Outlook 可固定收藏夹
- 5任天堂 Switch 游戏《马力欧&路易吉 RPG 兄弟齐航!》今晚发售,429 港币
- 6阿里巴巴开源工具 EasyExcel 宣布逐步进入维护模式:不再主动新增功能
- 7Exynos 2500 芯片遇挑战,消息称三星 3nm 工艺良率低于 20%
- 8全球最大、国内首制!我国万吨级纯电动高端智能海船开建:总功率 1900kW,最大航速 11.5 节
- 9小鹏宣布老用户芯片焕新众筹计划:单 Orin 升至双 Orin,座舱 820A 升级 8295
- 10小鹏汇天全倾转旋翼飞行汽车 X5 亮相:500km+ 续航、360km+/h 航速