趣文网,分享全网好句子、好文章!

百度发布即时翻译“神器” 突破自然语言处理重大难关

时间:2023-10-08 07:52:01

相关推荐

百度发布即时翻译“神器” 突破自然语言处理重大难关

中新网10月24日电 人工智能领域,两种语言的“即时互译”是一项难以攻克的技术问题,其主要原因在于源语言和目标语言之间存在较大的词序和语序差异。近日,百度研发了具备预测能力和可控延迟的即时机器翻译系统,可实现两种语言之间的高质量、低延迟翻译。这是自然语言处理方面的重大技术突破,将对机器即时笔译和口译的发展起到极大地推动作用。

机器同传利用语音识别技术自动识别演讲者的讲话内容,将语音转化为文字,然后调用机器翻译引擎,将文字翻译为目标语言,显示在大屏幕或者通过语音合成播放出来。相比人类译员,机器最大的优势是不会因为疲倦而导致译出率下降,能将所有“听到”的句子全部翻译出来,这使得机器的“译出率”可以达到100%,远高于人类译员的60%-70%。同时,在价格上也占有优势。

在机器同传领域,百度联合语音技术、机器翻译技术,从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。

在语音识别方面,区别于传统的上下文相关建模技术,百度提出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

在翻译质量方面,提出了“语音容错”的对抗训练翻译模型,根据语音识别模型常犯的错误,在训练数据中有针对性的加入噪声数据,使得模型在接受到错误的语音识别结果时,也能够在译文中纠正过来。比如,语音识别系统将“大堂”错误的识别为“大唐”,这一对噪声词将被自动收录到训练数据中,并将源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”,而保持目标语言翻译不变“Let"s meet at the lobby of the hotel”,同时将这两个中文句子用于训练,进而获得具有更强的容错能力模型。

为了降低时延提升翻译质量,人类译员通常对演讲内容进行合理预测,百度开发人员从人类译员身上获得启示,研发了“wait-k words”模型,可以根据历史信息,直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可通过根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好的应对差异。

在同声传译时,经常会遇到不同领域的专业知识,这就要求同传人员在短时间内吸收大量相关领域的内容,这对他们也是极大地挑战。基于此,百度模仿人类同传的准备过程,提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据,训练得到的具有通用翻译能力的模型;当它接到某一个领域的同传翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,得到相应领域增的强模型;最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

作为对外开放和商业国际化的需求之一,同声传译被广泛应用于政府间的峰会、多边谈判和其他商业场合,但是同传人员稀缺也成为了当前的棘手问题。为了解决全球范围内同传译员人数少、费用高等难题,越来越多开发者专注于机器同传的研发,百度也希望通过研发高质量机器同传技术和系统解决即时翻译难题。

虽然机器同传有了新的突破,但它与经验丰富的同传人员相比,依然存在一定差距。百度翻译技术负责人表示,同传的目的并不在于取代人类译员,而是为了降低同传成本,让同传的应用范围更加广泛,也希望世界各地的人在AI的助力下早日实现“无障碍”交流。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(1)
  1. 橙色拖鞋2023-12-09 17:45橙色拖鞋[辽宁省网友]43.240.132.52
    太棒了!这款即翻译“神器”有望解决语通行障碍让交流更加无障碍。百度技术突破真是不容小觑。
    顶9踩0
相关阅读
一点就译 自动标注!这款英文阅读神器 让你轻松啃原著

一点就译 自动标注!这款英文阅读神器 让你轻松啃原著

虽然读的是可以直接在屏幕划动取词翻译的电子书,但是贫乏的词汇积累导致的频繁查词让仅需几秒的操作也变得令人生厌,看不懂的句子需要复制粘贴到词典 a

2023-07-26

巨头扎堆的小市场:不学外语 机器翻译搞定一切?

巨头扎堆的小市场:不学外语 机器翻译搞定一切?

编者按:本文系网易智能工作室公众号smartman 163出品,文:抹茶。36氪经授权转载。2016年的一部翻译官火了,这是国内首部聚焦翻译领域的电视剧,让人们

2023-05-29

巴别鱼雏形 谷歌推出端到端语音翻译技术 还能模仿你说话

巴别鱼雏形 谷歌推出端到端语音翻译技术 还能模仿你说话

40年前,英国科幻作家Douglas Adams在他的银河系漫游指南中这样描述巴别鱼bable fish:迷你黄色生物,水蛭状,以声音中的语言概念为食,消化后排出跟寄主同频的脑波

2023-11-09

一文看懂我国机器翻译发展情况及BAT 科大讯飞等机器翻译格局分析

一文看懂我国机器翻译发展情况及BAT 科大讯飞等机器翻译格局分析

机器翻译,又称为自动翻译,是利用计算机将一种自然语言转换为另一种自然语言的过程

2023-11-27