微比恩 > 信息聚合 > 太炸裂了!阿里开发出 AI 图生视频模型EMO,高启强普法、蒙拉丽莎唱歌样样都会|钛媒体AGI

太炸裂了!阿里开发出 AI 图生视频模型EMO,高启强普法、蒙拉丽莎唱歌样样都会|钛媒体AGI

2024-02-29 01:14:20来源: 钛媒体

继美国OpenAI公司推出Sora引爆网络之后,中国互联网科技巨头阿里巴巴(Alibaba Group)如今已加紧追赶。钛媒体AGI 获悉,2月28日,阿里巴巴集团智能计算研究院日前上线了一款新的 AI 图片-音频-视频模型技术EMO,官方称其为“一种富有表现力的音频驱动的肖像视频生成框架”。据悉,你只需要提供一张照片和一段任意音频文件,EMO即可生成会说话唱歌的 AI 视频,以及实现无缝对接的动态小视频,最长时间可达1分30秒左右。表情非常到位,任意语音、任意语速、任意图像都可以一一对应。比如,《狂飙》电视剧中“高启强”畅谈罗翔普法;蔡徐坤的一张图片,就能通过其他音频配合“唱出”一首rapper饶舌,连口型都几乎一模一样;甚至前不久OpenAI发布的Sora案例视频里面,一位 AI 生成的带墨镜的日本街头女主角,现在不仅能让她开口说话,而且还能唱出好听的歌

关注公众号
标签: AI 视频 阿里