第一句子大全,网罗天下好句子,好文章尽在本站!

微软与浙大联手研发出DeepSinger:AI唱歌无压力 横扫中英粤三语!

时间:2024-02-03

微软联手浙江大学研发出了一款名为DeepSinger的人工智能唱歌系统,该系统不仅能够流利地演唱中英文歌曲,还能够进行粤语歌曲的演唱。这一突破性的成果标志着人工智能在音乐领域的...

友情提示:本文共有 2620 个字,阅读大概需要 6 分钟。

微软联手浙江大学研发出了一款名为DeepSinger的人工智能唱歌系统,该系统不仅能够流利地演唱中英文歌曲,还能够进行粤语歌曲的演唱。这一突破性的成果标志着人工智能在音乐领域的应用迈出了重要的一步。DeepSinger利用先进的语音合成技术,结合大量的训练数据,能够模仿人类歌唱的声音和情感,其表现出的唱歌技巧和艺术表现力已经达到了令人惊叹的水平。这一成果不仅在提升人工智能音乐表演的领域中具有重大影响,也为音乐产业带来了全新的发展机遇。

听微软小冰唱粤语歌会是一种怎样的体验?

想必你一定听过最近大火的"AI女团",7月10日,微软小冰携手小米小爱、B站冷鸢、百度小度首次集体亮相世界人工智能大会,以一首AI歌曲《智联家园》正式“出道”。

AI女团的首场演唱会可谓惊艳全场。从整首歌的歌词、卡点、节奏来看,这首《智联家园》演唱得不亚于专业音乐团队。如果只听音乐,恐怕很难分辨出这是AI生成的歌声。

我们知道,歌声不同于正常人的语音,高低音转换,BGM的配合,有着更复杂的模式和节奏,这对于AI来说并不是一件容易的事儿。

不过,最近一个研究团队,却此基础上挑战了更高阶的AI技术——生成多种语言风格的AI系统。据了解,这个团队成员正是来自浙江大学和微软研究院的六名研究员,他们研发出了一款名为DeepSinger的AI模型,可以演唱中文、英文,甚至粤语歌曲。

目前这项研究论文《DeepSinger.Singing Voice Synthesis with Data Mined Frome the Web》已经发表在了预印论文库arXiv上。

中文、英文、粤语,教什么会什么的AI

具体来说,DeepSinger是一款音乐歌声合成系统(Singing voice synthesis ),该系统利用专门设计的组件可以从嘈杂的歌唱数据中捕获歌手的音色,从而生成多种语言风格的演唱声音。

论文中,研究人员用中文、英文、粤语三种语言进行了试验,并用训练后得出的不同音色演唱了这首《Far Away Of Home》。可以先点击下方链接,听一下演唱效果:

点击链接收听://07/13/microsofts-ai-generates-voices-that-sing-in-chinese-and-english/

研究人员称,对于影视从业者来说,DeepSinger会是一个非常实用的工具。当他们完成某些语音类录制工作后,如果发现录制错误,可以用AI辅助语音的合成和修复,而无需再次返工。不过,这款工具也存在一些弊端。就像换脸软件Deepfake可以合成不存在的人像一样,这款DeepSinger同样可以假冒歌手伪造音乐。

而且,目前关于AI音乐版权纠纷的现象已经开始出现了。两个月前,一家唱片公司Roc Nation便提出了反对AI模的版权声明。其原因是,Youtobe博主Vocal Synthesis使用AI技术复制了旗下艺人Zay-Z的两个音乐作品,最终这起案件已删除仿制作品,而道歉声明而结束。

AI多语言歌声合成原理

在机器学习领域,从文本到语音(TTS)的转换有着广泛的使用场景,一直是研究的重点领域。如上文所说,歌曲的韵律和环境比语音更具复杂性,因此,SVS相比于TTS的研究也更有挑战性。

研究人员介绍,此次生成多种语言风格的歌声合成系统DeepSinger,采用了一种含多个数据挖掘和数据建模步骤的研究路径,优化了现有研究的很多困境。这个路径可以分为以下五个步骤:

数据检索(Data crawling)负责从音乐网站抓取顶级歌手多种语言的流行音乐;这里抓取的是中、英、粤三种语言的歌曲,时长一般为1-5分钟。此阶段,需要对数据集进行初级的过滤和清洗。唱歌和伴奏分离(Singing and accompaniment separation):采用开源音乐分离工具Spleeter,从伴奏中提取歌声,然后将音频逐个拆分为句子;歌词和歌唱对齐(Lyrics-to-singing alignment):自动提取歌词中每个音素的持续时间(从粗粒度的句子级别到细粒度的音素级别)。数据筛选(Data filtration):对歌词与演唱未对齐的歌声进行再处理。这里采用分离奖励(Splitting Reward)作为过滤标准,过滤掉分离奖励低于阈值的数据。演唱模型(Singing modeling):通过数据爬取,分离,对齐和过滤之后,基于FastSpeech对唱歌数据进行建模。该模型将歌词,时长,音高信息以及参考音频作为输入来生成歌声。点击链接:https://speechresearch.github.io/deepsinger/可收听不同阶段,AI生成歌声音频。从最终的测试结果可以看出,未经训练的音频和经过DeepSinger模型的音频,在音调、振幅、持续时长上基本吻合;(GT表示真实音频波形图,DeepSinger表示经过模型训练后的音频波形图)

论文中表明,通过歌词,持续时间,音调信息、参考音频等指标的验证,DeepSinger在合成音调准确度和“声音自然度”方面表现出了不错的性能。从数据来看,中英粤语三首歌曲的音高、音准都超过了85%。而且,在一项20人的用户实验中,DeepSinger生成的歌曲与原始培训音频之间的平均差距仅为0.34-0.76。

另外,更值得注意的是,经过数据检索和初级筛选,Singing所使用数据集仅包含89位歌手演唱的92个小时的歌曲。

我们知道,在机器学习中数据集的质量和数量是关键,但也正是在这两个方面往往存在难点。而在本次试验中仅使用了一个小样本即达到不错的性能表现。另外,歌曲和歌词的自动对齐模型在很大程度上也减少了数据标标注带来的失误和成本。

不过,研究人员表示,接下来他们计划使用基于WaveNet模型等更为复杂的AI技术,在DeepSinger中训练各种子模型,以提高语音质量。WaveNet是Googel研发的一款语音驱动模型。

//07/13/microsofts-ai-generates-voices-that-sing-in-chinese-and-english/

/pdf/.04590.pdf

//04/30/openais-jukebox-ai-produces-music-in-any-style-from-scratch-complete-with-lyrics(雷锋网雷锋网雷锋网)

本文如果对你有帮助,请点赞收藏《微软与浙大联手研发出DeepSinger:AI唱歌无压力 横扫中英粤三语!》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(5)
  1. 4个甜心2024-02-03 08:294个甜心[陕西省网友]203.56.183.229
    AI唱歌无压力,真是音乐界的一大创新啊!
    顶6踩0
  2. 叶落凉初透2024-02-03 08:16叶落凉初透[四川省网友]103.40.101.202
    听说DeepSinger是微软和浙大联合研发的,果然厉害!
    顶20踩0
  3. 洋葱2024-02-03 08:03洋葱[河南省网友]103.229.231.0
    @白亦&菲晗这个DeepSinger真的是太惊艳了,AI技术越来越厉害了!
    顶2踩0
  4. 白亦&菲晗2024-02-03 07:51白亦&菲晗[湖南省网友]203.24.219.102
    AI唱歌无压力,中英粤三语横扫,太厉害了!
    顶5踩0
  5. 千年一爱2024-02-03 07:38千年一爱[贵州省网友]103.50.241.252
    厉害了,微软和浙大合作的DeepSinger真是太强大了!
    顶6踩0
相关阅读
AI唱歌不仅中英文无压力 还会粤语!微软联手浙大研发出DeepSinger

AI唱歌不仅中英文无压力 还会粤语!微软联手浙大研发出DeepSinger

听微软小冰唱粤语歌会是一种怎样的体验?想必你一定听过最近大火的AI女团,7月10日,微软小冰携手小米小爱、B站冷鸢、百度小度首次集体亮相世界人工智能

2023-11-13 #经典句子

浙大联手微软推出可唱中英文歌的AI系统

浙大联手微软推出可唱中英文歌的AI系统

这套名为DeepSinger的AI系统可省去歌手反复进录音室修正的麻烦,但也可能衍生造假的问题

2023-08-21 #经典句子

微软研发绘图机器人 根据文字描述画出相应图像

微软研发绘图机器人 根据文字描述画出相应图像

聚焦AI,读懂下一个大时代! 网易智能讯 1月22日消息微软近日推出了一项新的模仿类似艺术家的人工智能技术—一个绘图机器人

2023-05-09 #经典句子

微软宣布在“机器中英双语翻译”领域取得突破性进展

微软宣布在“机器中英双语翻译”领域取得突破性进展

研究团队抽取并测试了在线新闻中近2000个中文句子的中译英,这份样本被称为newstest2017,再和人工翻译进行结果对比,还聘请了双语专家来验证机器翻译的准确性

2023-12-31 #经典句子

阿里和浙大等团队开发LIBS—唇语解读模型 中英双语实时复述!

阿里和浙大等团队开发LIBS—唇语解读模型 中英双语实时复述!

AI读唇可用于帮助深受听力障碍困扰的患者,改善嘈杂环境中的语音识别等,具有巨大的潜力

2023-06-28 #经典句子

关于人工智能伦理问题 微软全球执行副总裁连说三个成语

关于人工智能伦理问题 微软全球执行副总裁连说三个成语

今天,我们该如何正确地利用这些技术?本届乌镇峰会期间,记者采访了微软全球执行副总裁沈向洋

2014-10-13 #经典句子

外语保送生测试时间撞车 南京大学/浙江大学如何取舍?

外语保送生测试时间撞车 南京大学/浙江大学如何取舍?

据教育部全国第四轮外国语言文学学科评估结果,我国现有115所开设外国语言文学学科的大学

2016-08-18 #经典句子

文学翻译名家齐聚浙大热聊 人工智能会抢他们的饭碗吗?

文学翻译名家齐聚浙大热聊 人工智能会抢他们的饭碗吗?

前天,浙江大学中华译学馆特邀毕飞宇、林少华、马爱农等国内十余名著名作家与文学翻译家作客文学翻译名家高峰论坛

2023-12-24 #经典句子

微软小冰首席科学家武威解读 EMNLP 论文:聊天机器人的深度学习模型

微软小冰首席科学家武威解读 EMNLP 论文:聊天机器人的深度学习模型

近日,在雷锋网 AI 研习社公开课上,微软小冰首席科学家武威就为大家带来了其在 EMNLP 大会上分享的精华部分

2023-06-01 #经典句子