第一句子大全,网罗天下好句子,好文章尽在本站!

鬼畜配音团队的福音 任意口型 任何语音都适配

时间:2008-04-17

杨净 发自 凹非寺量子位 报道 | 公众号 QbitAI同样的脸,放上不同的声音,还可以做到如此同步。当DeepFake口型造假,效果是这样。有没有发现这几个

友情提示:本文共有 1531 个字,阅读大概需要 4 分钟。

杨净 发自 凹非寺

量子位 报道 | 公众号 QbitAI

同样的脸,放上不同的声音,还可以做到如此同步。

当DeepFake口型造假,效果是这样。

有没有发现这几个人语音语调完全相同。

闭眼一听,完全猜不到到底是谁?吴恩达?马斯克?到底是谁在说话?

而和原有的视频对比,面部变化也不明显,效果非常自然。

△用YouTube知名数码博主Linus配口型

这是一个名为Wav2Lip的模型——用来生成准确的唇语同步视频的新方法,来自印度海德拉巴大学的新研究。

任何人物身份,甚至包括卡通人物,任何语音和语言,都可以将口型视频高精度同步到任何目标语音。

目前该项目已开源,可以去体验一下Demo版~只需上传20s的视频和音频文件就可以一键生成。

这项研究在Reddit上一经发布,21小时内就获得200+的热度。

对于这项研究的应用前景,作者说,可以应用在外文在线讲座、配音电影、新闻发布会,让人物和声音的融合更加自然,还省去大量的人力物力。

嗯,胥渡吧、淮秀帮这些配音团队或许可以用的上!

Wav2Lip模型

现有的研究,主要聚焦于在静态图像、或是对视频中的特定人物生成准确的唇语动作。

但问题在于,无法准确的对动态图像,比如正在说话的人物,唇部动作进行变形,从而导致内容与新音频无法做到完全同步。

就像是当你在看音画不同步的电影时,是不是很难受。

于是,研究人员找到了出现这一问题的关键原因,并通过一个「唇语同步辨别器」来解决。

具体而言,有两个关键原因,现有研究中所使用的损失函数,即L1重构损失和LipGAN中的判别器损失都不能减少错误的唇语同步生成。

于是,研究人员就直接通过一个预先训练好的判别器「well-trained lip-sync expert」,来检测唇语同步的错误,这一判别结果已经相当准确。

此外,研究人员还发现,在产生噪声的面孔上进一步微调,会阻碍判别器测量唇部同步的能力,从而也会影响生成的唇形。

最后,还采用视觉质量鉴别器来提高视觉质量和同步精度。

举个例子,黄色和绿色框的是本次提出的模型,红色框为现有的最佳方法,文字是他们正在说的语句。

可以看到模型产生的唇形比现有的唇形更加准确、自然。

模型训练结果

在模型训练阶段,作者提出了两个新指标, “Lip-Sync Error-Distance”(越低越好)和 “Lip-Sync Error-Confidence”(越高越好),这两个指标可以测量视频的中的唇语同步精度。

结果发现,使用Wav2Lip生成的视频几乎和真实的同步视频一样好。

需要注意的是,这个模型只在LRS2上的训练集上进行了训练,在对其他数据集的训练时需要对代码进行少量修改。

进一步的,还对现实的三种视频类型进行了评估。

结果均表明,Wav2Lip模型都能产生高质量、准确的唇语同步视频,不过,在对TTS生成的语音进行唇语同步时,还有改进的空间。

你觉得这项研究如何?

目前,项目已经开源,可以自行去体验一下Demo版哦~

再次提醒:只需上传20s的视频和音频文件,就可以一键生成哦!

论文地址:

https://arxiv.org/abs/2008.10010

Demo演示视频:

https://www.youtube.com/watch?v=SeFS-FhVv3g&feature=youtu.be

GitHub地址:

https://github.com/Rudrabha/Wav2Lip

Demo网址:

https://bhaasha.iiit.ac.in/lipsync/

— 完 —

本文系网易新闻网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

原标题:《鬼畜配音团队的福音!任意口型、任何语音都适配,吴恩达马斯克傻傻分不清楚 | Reddit高热》

本文如果对你有帮助,请点赞收藏《鬼畜配音团队的福音 任意口型 任何语音都适配》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
没破绽!斯坦福新AI:输入文本改变视频人物对白 逼真到作者害怕

没破绽!斯坦福新AI:输入文本改变视频人物对白 逼真到作者害怕

...动合成某个人的语音,已经有许多算法可以做到。这里,团队使用了原本视频主角的录音,而在不需要原声的部分,用了Mac自带的语音合成工具。暂不赘述。这项研究最闪亮的部分,是流畅自然的“对口型”。左手拿着视频,右...

2009-11-09 #经典句子

自用宝藏APP 轻松方便学英语

自用宝藏APP 轻松方便学英语

...习音标的小伙伴可以看这个APP,超级方便也很简单,还有口型示例,安卓或者是电脑那个界面是不一样的呦彩云小译这个翻译APP比普通翻译更好哦(自我感觉)北外网课(网课自学)北外网课对于小语种专业的人来说是绝对是福...

2014-01-23 #经典句子

英语流利说:AI沉浸式课程 让英语学习变得高效

英语流利说:AI沉浸式课程 让英语学习变得高效

...据了解,英语流利说在上海、杭州等地都设有 AI实验室,团队成员均来自 Facebook、IDSIA、Google等世界知名人工智能研究机构。经过多年在“AI+教育”的深耕,英语流利说在语音识别、自然语言处理、深度学习等领域获得多项专利...

2023-05-17 #经典句子

当前小学英语课程的教学之中 语音问题为重难点

当前小学英语课程的教学之中 语音问题为重难点

...逐渐得到提升,且在此过程中,教师应重视学生发音时的口型是否正确[1]。1.2 总结字母发音规律在开展字母教学活动时,教师不仅应指导学生正确发音,还应帮助学生科学总结发音规律,以促使学生在日后的学习中,能够更加...

2014-09-05 #经典句子

脑波转语音 不开口每分钟“说”出150词:Nature发脑机接口新突破

脑波转语音 不开口每分钟“说”出150词:Nature发脑机接口新突破

...霍金后期依靠活动脸颊上的一块肌肉来打字如何做到研究团队来自加州大学旧金山分校,神经外科教授Dr. Edward Chang等人试图将大脑中的神经活动转换成语音,以造福因为神经损伤而失去交流能力的人。说话这件事其实并没有想...

2023-06-23 #经典句子

西语和葡语在语法和语音上有多少区别?

西语和葡语在语法和语音上有多少区别?

...等的效果。就说话的特点来说,西班牙语发音的时候要求口型大,音开,但葡萄牙语却是发音时口型小,音闭。其次,是在语法,单单就一个动词的变位来说,两者就要很多的不同,其次还有时态等等,其中葡萄牙语在这方面表...

2019-06-15 #经典句子

你觉得《生化危机2:重制版》的中文配音怎么样?

你觉得《生化危机2:重制版》的中文配音怎么样?

...的出彩不仅仅归功于配音演员,前期的文字翻译以及项目团队的配合也非常重要,这是需要投入一定精力与人力的。而不是只留给配音团队短短四天就可以达到的效果。 在动画、电影以及游戏作品中,除了画面,声音也是重要...

2023-08-13 #经典句子

advertisement  director美音英音大不同!说说美语英语音之不同

advertisement director美音英音大不同!说说美语英语音之不同

...r(录音示范)我是这么的理解的,当发//音结束的时候,口型会微微撅起,往会收发下一个元音的时候,这个口型变化,和/r/的口型特别像,久而久之,就带出一个这样的音。关于dark L的发音apple,uncle,这里在单词末尾ple,cle...

2010-03-06 #经典句子