微比恩 > 信息聚合 > 一张照片、一段声音秒生超逼真视频！南大等提出全新框架，口型动作精准还原

一张照片、一段声音秒生超逼真视频！南大等提出全新框架，口型动作精准还原

2023-12-14 06:56:54来源: IT之家

一张照片、一段声音秒生超逼真视频！南大等提出全新框架，口型动作精准还原

图片地址：https://img.ithome.com/newsuploadfiles/2023/12/b6143fa7-651f-424c-a3a9-af31a7469610.jpg?x-bce-process=image/format,f_auto

新智元报道编辑：润好困【新智元导读】最近，来自南大等机构的研究人员开发了一个通用的框架，用一段音频就能让照片上的头像讲多国语言。不论是头部动作还是嘴型都非常自然，看到很多不错的一段音频 + 一张照片，瞬间照片里的人就能开始讲话了。生成的讲话动画不但口型和音频能够无缝对齐，面部表情和头部姿势都非常自然而且有表现力。而且支持的图像风格也非常的多样，除了一般的照片，卡通图片，证件照等生成的效果都非常自然。再加上多语言的支持，瞬间照片里的人物就活了过来，张嘴就能飙外语。这是由来自南京大学等机构的研究人员提出的一个通用框架 ——VividTalk，只需要语音和一张图片，就能生成高质量的说话视频。论文地址：https://arxiv.org/ abs / 2312.01841这个框架是一个由音频到网格生成，和网格到视频生成组成的两阶段框架。在第一阶段，考虑面部运动和 blendshape 分

关注公众号

标签：视频

提示：支持键盘“← →”键翻页

上一篇朝市值 4 万亿美元进发，苹果公司收盘价创下新高

下一篇福特 CEO 力挺 CarPlay 和 Android Auto：帮助驾驶员专注于道路

赞

你的鼓励是对作者的最大支持

相关阅读

阿里通义万相视觉生成大模型升级，支持文生视频、图生视频等2024-09-19 14:35:09
华为 WATCH GT5 智能手表开箱视频曝光：银白表圈 + 蓝色表带、家族式功能旋钮表冠2024-09-16 13:41:04
快手：可灵 AI 已累计生成超 2700 万个视频，正内测全新 1.5 版本基础模型2024-09-13 18:31:32
网易 Filmly 播放器应用计划本月推出 Apple TV 版客户端，演示视频现公开2024-09-12 15:21:20
华为官方 YouTube 频道发布 Mate XT Ultimate 非凡大师宣传视频，暗示全球发售2024-09-12 19:24:52
苹果 iPhone 16 Pro 系列支持录制 4K120 FPS 视频2024-09-10 02:39:09
续航最强苹果手机易主，iPhone 16 Pro Max 视频播放时长可达 33 小时2024-09-10 03:35:11
索尼官方泄密：YouTube 视频标题证实 PS5 Pro 今晚官宣2024-09-10 07:52:03
问界 M9 五座版预热视频公布：后备箱灵活百变，9 月 10 日发布2024-09-08 14:52:58
荣耀 MagicBook Art 14 骁龙版发布：高通 X Elite、OS Turbo、1080P 视频可播放 15…2024-09-06 21:08:05

热门排行榜

1日1周1月

免费发布分类信息

最新图片