8 月 5 日消息,微软研究院近日展示了 Project Rumi 项目,结合文本,音频和视频数据,通过多模方法,提高人工智能系统的理解能力,从而更能理解人类的意图。人工智能系统近年来取得了长足的进步,尤其在自然语言处理(NLP)领域的成长更为惊人。不过现有 NLP AI 主要依赖于文本输入输出,忽略了人类在自然交流中的语调,面部表情,手势和肢体语言等线索,从而在理解方面会存在偏差。在 AI 专业术语中,这些线索统称为副语言(paralinguistics/ paralanguage)。微软研究院为了解决这个问题,开发了 Project Rumi,这是一个新颖的框架,旨在通过多模态副语言提示来增强人工智能的理解。该项目包括两个主要部分:多模式副语言编码器和多模式副语言解码器。IT之家在此附上视频如下:
微软展示Rumi项目 通过多模方式提高人工智能理解能力
2023-08-05 11:57:28来源: TechWeb
关注公众号
赞
你的鼓励是对作者的最大支持
- 乘联会崔东树:1-6月中国占世界新能源车份额60%2023-08-05 17:56:16
- 美国富国银行出现技术故障,客户无法查看或提取存款2023-08-05 17:56:47
- 北京将发放京彩绿色消费券2023-08-05 17:57:49
- 韩国经济大崩溃,中国造船贡献了多少?2023-08-05 14:00:00
- 宝能汽车欠薪的第490天2023-08-05 18:06:39
- 总是存不下钱,该怎么办?2023-08-05 21:14:07
- 东方甄选想独立,俞敏洪应该学黄峥2023-08-05 22:32:53
- OpenAI宣布ChatGPT已默认升级到GPT-4版本2023-08-05 11:08:28
- 扎克伯格:Threads未来几周内将新增搜索功能和网页版2023-08-05 11:18:09
- 逆转?印度限制进口PC相关产品的禁令将推迟三个月2023-08-05 11:28:02
- 1蔚来 NIO Phone 一代手机获推 SkyUI 2.2.0 升级:新增 NOMI GPT、与 OPPO、vivo、小…
- 2Bloomberg Donates $50 Million to Support Kamala Harris After…
- 3蜂巢能源暂停德国工厂;英敏特发布「2025年全球消费者三大趋势」;沙特加速供应链本地化|一周「出海参考」(10.21-1…
- 4温多利:关联方相助仍挡不住利润下降,资金充裕分红频繁,募资补流引质疑|IPO观察
- 5跌破六千:iPad Pro 11 英寸 M4 芯片海外版 5889 元新低(国行 8999 元)
- 6Apple 京东大促: iPhone 16 Pro 系列以旧换新减 800 元,Mac 一周新品预购
- 714 天长续航、支持血氧监测:荣耀手表 GS 3i 运动版 303 元 4.3 折补贴购
- 8天和环保:毛利率突增“谜团”难解,应收账款增速超营收存“隐忧”|IPO观察
- 9缺少帮手,是“纯血鸿蒙”目前面临的最大问题
- 10九巨头联手挑战英伟达 AI 数据中心互联领导地位,UALink 联盟正式成立