谷歌将推出103种语言翻译模型针对250亿句子训练有500亿参数

时间：2023-05-18

对于谷歌来说，小种语言因为缺少平行数据，所以翻译的时候也缺乏着一定的优势

友情提示：本文共有 861 个字，阅读大概需要 2 分钟。

谷歌，喻有“人类文明开拓者”之称，足以看得出谷歌的地位和口碑，经历过华为的事件之后，大家也能看得出谷歌的影响力。对于谷歌来说，小种语言因为缺少平行数据，所以翻译的时候也缺乏着一定的优势。

不过有关谷歌的研究者指出，谷歌将推出支持103种语言翻译模型的神经机器，其中针对了250亿个句子进行了训练，光是参数量就有500亿，可见小种语言的翻译，在谷歌的研究下，将为群众们的使用，再次提高使用的阶梯和层次。

对于谷歌的这次新研发和挑战，可能很多网友会觉得研发的过程难度比较大。比如说多种语言的训练数据，因为NMT（神经机器翻译）的发展，MT（机器翻译）的系统也得到了很大的提升，但是想要打破全国各地的语言翻译，尤其是对于各国的小种语言来说，还是有着一定的障碍和难度。那么，如果缺少训练的数据，又或者是没有训练的数据又该怎么办呢？

这个时候，多种语言的NMT就是一种有效的解决方案，NMT使用的是一种语言，可以处理多种语言的模型，数据缺乏的语言训练，已经列入自动语言识别当中，文本转语言的系统。对此，谷歌研究者曾经对单个神经网络，可以学习语言的数量，同时还控制了每种语言的训练数量。

在相关的研究数据当中，到了21世纪末期的时候，全球至少了7000多种，目前使用的语言将不会存在，那么语言翻译系统能够拯救这些语言吗？对于，谷歌方面则是认为，从这类语言模型开始，就算是没有平行语料，也可以将机器的翻译，扩展到新的语言和领域当中。在通过语言机器的翻译上，很多能够或者是有希望解决方案，几乎都是跨领域完成的。多种语言的NMT，正在逐渐地成为多种任务的学习。

即使跨语言的翻译对数据的倾斜，是NMT任务进行和研究当中的一大难题和挑战，但是这种倾斜也成为了研究者，创造时一种发现理想的慧眼。在一种语言训练上所得到的信息，可以应用在其它语言的翻译中。对于谷歌的这一项创造和发明，很多网友也在翘首以盼当中，相信以谷歌的能力和创造天赋，也不会在此项目让大家失望。那么，对于谷歌将推出103种语言翻译模型的新想法，大家都有什么看法呢？欢迎评论区一起交流讨论。

本文如果对你有帮助，请点赞收藏《谷歌将推出103种语言翻译模型针对250亿句子训练有500亿参数》，同时在此感谢原作者。

谷歌句子

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。