第一句子大全,网罗天下好句子,好文章尽在本站!

骄傲一次!讯飞AI语音合成技术1分钟模仿你说话 网友很惊讶!

时间:2012-01-02

不论是李斌的电动超跑,库卡的机械臂,胡郁的语音合成技术,还是印奇的人脸识别技术,无一不在向世界展示中国在科技各个领域勇冲第一的迅猛势头,而湖南

友情提示:本文共有 1301 个字,阅读大概需要 3 分钟。

人工智能产业迅速崛起,不管是计算智能、感知智能还是认知智能,中国都从追随者逐渐变成引领者,在世界科技范围内,中国科技力量不容小觑。不论是李斌的电动超跑,库卡的机械臂,胡郁的“语音合成技术”,还是印奇的“人脸识别技术”,无一不在向世界展示中国在科技各个领域勇冲第一的迅猛势头,而湖南卫视《我是未来》正通过这种科技秀的方式见证着越来越多“中国骄傲”的诞生。

假如有一天,你发现机器人发出的声音和你的一模一样,你是感到惊慌,还是该感到欢喜?这并不是危言耸听,这是AI技术中的语音合成技术在捣鬼。在这个合成图片肆意蔓延、虚假新闻充斥各大媒体的时代,一个可以让任何人说任何话的程序,似乎是引发更多麻烦的催化剂,但是人们对其的研究仍然乐此不疲。本期讯猫软件将带您在AI语音合成技术的浪潮里翻滚。

科大讯飞的语音合成技术已经炉火纯青到以假乱真的地步,通过采集声纹,可以模仿任何人说话。主持人张绍刚在现场甚至都被胡郁带来的女机器人“戏弄”了一番,成了连机器人都不放过的“怪蜀黍”,百口莫辩。

那么这项技术如果被不法分子加以利用,后果会怎样呢?现场体验官提出了这样的疑问。不料,胡郁却在《我是未来》节目中骄傲地表示:“自从运用了我们的语音识别技术,安徽的电话诈骗案件直线下降。”原因在于,科大讯飞不但可以通过声纹识别技术模仿别人说话,还可以凭借声纹精准识破语音模仿骗局。目前,此技术已经应用到电话诈骗案件侦查上,效果显著。

16日到18日,在天津举办的第二届世界智能大会上,科大讯飞董事长刘庆峰展示的机器人方言翻译引得现场嘉宾笑声不断,而一段机器人模拟配音员的电视节目配音更是十分专业。

新的语音合成技术只需要1分钟的声音样本,就可以模仿任何人说话。

之所以能产生如此高还原度的合成声音,背后的技术正是神经网络(Neural Network)和机器学习(Machine Learning)。神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。它利用分层的神经元,从大量样本数据中总结出共同特征。目前,神经网络在图片识别、字幕生成等方面受到了广泛应用。

有了这项技术,网络上的流行混剪视频的制作将容易很多,制作者只需把画面剪切在一起,完全可以生成你需要的任何声音。除了这类应用以外,声音合成技术在更多的场景中都能派上用场,比如说为失语者配音。你可以把它想象成一款脑洞编辑器,可以让我们的生活更有趣。设想一些应用场景,如虚拟现实、有声书朗读、游戏、动画等,以及提高人们生活质量的应用,如个人助手、心理治疗等。

然而这项技术的漏洞也是显而易见,不在于技术本身,而在于使用它的人。如果这项技术被图谋不轨的人利用,社会上的误导、迷惑、欺骗行为可能会更加猖獗。小到钱财,大到人身安全、社会集体利益可能都会受到威胁,无意间的犯罪或者被侵犯都是非常可怕的事情。

关于技术的道德问题,警醒人类在未来(甚至现在)声音篡改模仿都是可能的,尽管现在法庭上还将录音作为一项重要的证据,他们不认为这是很妥当的,因为谁都可能伪造这种证据。而通过将这项技术发布给全世界,他们希望确保技术的安全性,希望人人都能接触到这个信息:在不久的将来声音也可以被破解。

本文如果对你有帮助,请点赞收藏《骄傲一次!讯飞AI语音合成技术1分钟模仿你说话 网友很惊讶!》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
巴别鱼雏形 谷歌推出端到端语音翻译技术 还能模仿你说话

巴别鱼雏形 谷歌推出端到端语音翻译技术 还能模仿你说话

大数据文摘出品编译:周素云“这是全宇宙最奇特的生物。”40年前,英国科幻作家Douglas Adams在他的《银河系漫游指南》中这样描述巴别鱼(bable fish):迷你黄色生物,水蛭状,以声音中的语言概念为食,消化后排出跟寄主同...

2023-11-09 #经典句子

第二篇:语音识别&语音合成技术的概念 应用场景及原理解析

第二篇:语音识别&语音合成技术的概念 应用场景及原理解析

...箱爱不释手,他惊奇的发现:小爱智能音箱不仅能听懂他说话,还可以和他进行简单友好的交流。真是太神奇了!这里涉及到了语音处理技术。分语音识别和语音合成技术。所谓语音识别(ASR,Automatic Speech Recognition),就是将...

2023-12-14 #经典句子

中国科学技术大学副教授凌震华:基于表征解耦的非平行语料话者转换|CCF

中国科学技术大学副教授凌震华:基于表征解耦的非平行语料话者转换|CCF

...等。话者转换是一种语音生成的任务,同时这个任务也和说话人的身份信息相关——之前介绍的声纹识别是从语音中识别身份,而话者转换是对语音中身份信息的控制和调整。我的报告会围绕三个部分进行:话者转换的任务定义...

2023-10-23 #经典句子

看书APP标配的“听书”功能火了 超七成背后是百度大脑语音技术支持

看书APP标配的“听书”功能火了 超七成背后是百度大脑语音技术支持

...在线阅读也迎来"高光时刻",特别是当手机阅读APP标配了语音朗读即"听书"功能。据百度大脑AI开放平台的后台数据显示,疫情期间,支持"听书"功能的语音合成技术的调用量飙升,峰值时日均调用量增加20亿。这20亿次调用量约等...

2017-08-01 #经典句子

创新实验室|自治区蒙古文信息处理技术重点实验室:当蒙古语“牵手”人工智能

创新实验室|自治区蒙古文信息处理技术重点实验室:当蒙古语“牵手”人工智能

...础。”实验室主任高光来教授表示。“让计算机‘开口’说话是计算机语音合成研究的成果。利用人工智能深度学习技术,让计算机不仅能听懂蒙古语,还能‘说’蒙古语,是我们一直以来努力的方向。”飞龙教授告诉记者。蒙...

2020-10-06 #经典句子

打破定制化语音技术落地怪圈?从讲一口标准英音的语音助手说起

打破定制化语音技术落地怪圈?从讲一口标准英音的语音助手说起

...设备,而是内置于BBC网站和iPlayer TV流媒体服务的数字化语音助手。如果你想听相关广播电台、播客或新闻,可以通过语音互动的方式进行点播,当然,你想要听笑话,它也会立马为你随机播放节目中的英式段子。不同于Siri这种...

2017-01-21 #经典句子

智能AI技术融入教育 流利说(LAIX.US)开发多维度英语课程

智能AI技术融入教育 流利说(LAIX.US)开发多维度英语课程

...英语口语,采用自主研发的先进AI智能技术,拥有强大的语音识别功能,这个功能是基于拥有庞大“中国人英语语音数据库”537亿累计录音及超39亿分钟累计录音时长的数据,在口语测试过程中,用户可以进行英语跟读。通过数...

2023-08-04 #经典句子

聚焦全球人工智能技术大会 爱数智慧CEO张晴晴分享多语种对话式AI的技术及应用

聚焦全球人工智能技术大会 爱数智慧CEO张晴晴分享多语种对话式AI的技术及应用

...数据集经过多维度的标注,包括语音到文本的转换,以及说话人性别、年龄、情感等标签,这些标签能够帮助开发者在解决多语言对话式AI上提供更多的信息,从而帮助优化对应的模型。此外,爱数智慧拥有超过60种语言的数据...

2023-09-24 #经典句子