友情提示:本文共有 1306 个字,阅读大概需要 3 分钟。
文/东方亦落
根据英国《卫报》的消息,科学家发明了一种能够让丧失语言能力的人重新“说话”的定制化数字声音技术。
要知道,全球因伤病和先天疾病而丧失语言能力的人有数百万之多,如失语症、神经元疾病、脑瘫、中风、自闭症等,都能够对参与语言表达的肌肉控制能力造成影响。在美国,有超出200万的人要借助AAC(适应性替代通信)弥补语言方面的缺陷,而在英国,占总人口1%比率的人也都需要这项技术。
说起这方面的技术,我们最容易想到的是斯蒂芬霍金。霍金和外界沟通需要通过红外线感应器以眨眼速度的变化发出讯息,将其传至电脑,转化为英文。电脑需适应霍金的眨眼速度以打出英文单词,而语言合成器负责转文字为语音。
由于患有ALS(肌肉萎缩性脊髓侧索硬化症),霍金自21岁起便逐渐丧失了全身的机动能力和说话能力。他需要佩戴装有红外传感器的特制眼镜,用来辅助侦测面部肌肉,实现对电脑的操控。所以即使只是执行一次搜索,也要花费十分钟甚至更长时间。
为使霍金对电脑系统的操作能力有所提升,英特尔公司在2014年推出了一套全新的辅助语义情境感知工具包,其中包括自动完成窗口浏览、文件管理以及任务切换、眼动追踪、语音合成、联想输入等技术,将霍金的电脑操作效率提升了10倍。
并且这套说话软件已经在几年前向外界开放,用来帮助更多人。而且英特尔对其进行了升级,减少打字动作,加入预测性输入技术,帮助提升打字速度。其中最值得关注的就是“上下文输入预测”功能。采集和分析了大量霍金此前发表的文章和回复,建立独特的数据模型,据此分析霍金当下最可能的输入习惯。
但AAC技术推广以来,却出现一个问题,就是使用这种技术的人有数百万,但能够使用的声音类型却相当有限,只有几十种选择,大部分还都是成年人和男性的声音。而科学家帕特尔则有效地通过技术的研究解决了这个问题。
她和她的团队成立了“语音银行”。这是一个人们可以通过互联网储存自己声音的在线平台,每位提供者的声音都被纳入声音库中,可以为客户制作新的声音。
创建这样一个数字化语音需要生源和过滤器。声源像声纹一般独一无二,而过滤器则是将这些声源发出的声音塑造成不连续的、人耳可辨别的单词,嘴唇、舌头、咽喉都起着过滤器的作用。
而声音应用程序Vocal ID就能够借助此原理工作。从接受者处捕捉数秒声源,将其应用到捐赠者提供的过滤器中,再通过算法的调整,就可以提供更多变化的声音。新声音的制作完成之后,能够作为插件添加到拥有者已使用的所有语音设备中,并且用户能够自行调整声音,来获得期望的音调。
不同的对话技术是能够根据用户的需求而改变的,并且这种变化十分显著。手指肌肉比较发达的人可以使用传统键盘进行文字输入,通过扬声器听到发音。许多用户更习惯通过操纵杆选择屏幕中的文字。对于不能使用操纵杆的人,就可以通过眼球和脸部肌肉的运动进行选择。而要完成这些,ACC设备必不可少。
不过,对于拥有ACC设备的用户而言,有时会出现令人沮丧的局面。有时在需要选择字符时,必须等待光标跳过前面的字符。如果错过了最佳时机,则需要等待下一轮的循环。并且不少设备是不具备关于性等隐晦话题的字符的,这使人们无法坦率地与朋友或爱人谈论这一话题,这些还有待改进。
本文如果对你有帮助,请点赞收藏《帮助丧失语言能力的人“开口说话” 定制化数字声音如此神奇》,同时在此感谢原作者。