第一句子大全,网罗天下好句子,好文章尽在本站!

这年头 机器翻译都会通过文字脑补画面了

时间:2023-06-08

除了痛苦地死抠复杂单词和长难句语法,他还能怎么去理解这句话呢?想象

友情提示:本文共有 1483 个字,阅读大概需要 3 分钟。

博雯 发自 凹非寺量子位 报道 | 公众号 QbitAI

现在,想象一个外国人面前摆了句「金石迸碎荡尘埃,磐山纡水尽为开」。

除了痛苦地死抠复杂单词和长难句语法,他还能怎么去理解这句话呢?

——想象。

想象这句诗词中的“金石”、“尘埃”、“山水”各个词汇的意象,再将意象汇聚成一个具体的画面或场景。

而这时就有研究者灵机一动:

人类不是能根据非母语文本脑补画面,进而做到更深入的理解吗?

那机器是不是也能根据输入文本脑补图像,最终实现更好的翻译呢?

于是,一个以视觉想象为引导的机器翻译模型ImagiT就诞生了。

论文作者来自南洋理工大学和字节跳动人工智能实验室。

缺少图片也能利用视觉

提到“利用视觉”,我们首先会想到多模态机器翻译。

比起纯文本的机器翻译,多模态机器翻译能够利用语音、图像这样的模态信息来提高翻译质量。

但多模态机器翻译的质量是和数据集的可用性直接挂钩的。

换句话说就是标注图片的数量和质量会非常影响模型翻译的有效性。

但偏偏人工图片标注的成本又不低……所以现阶段的多模态机器翻译大都应用在Multi30K,一个包含了3万张图片标注的数据集上。

而新提出的ImagiT翻译模型呢?

它在推理阶段不需要标注图片作为输入,而是通过想象的方式利用视觉信号,在训练阶段将视觉语义蕴含到模型内部。

做到了在缺少图片标注的情况下也能利用视觉信息。

基于想象的翻译模型到底什么样

这是一个端到端的对抗学习架构。

架构左右端是我们熟悉的transformer的编码器和解码器,而中间则是这一框架独特的生成想象网络。

这一生成想象网络主要由两个转化器和一个注意力层组成,具体做转化时:

一、源文本通过F0输入

F0包含一个全连接层和四个去卷积层。

基于GAN的思想,句子特征与噪声拼接后会通过F0转化成视觉表征。

二、将注意力放在词层面

在注意力层关注源文本中的相关词汇,并生成图像不同子区域的细粒度细节,让图像特征的子区域与词对应。

最终得到更加语义一致的视觉表征。

三、视觉表征通过F1输出

F1包含两个全连接层和一个去卷积层,以及一个残差层。

通过这一转化器,捕捉多层次(词级和句级)的语义,输出生成的视觉特征f1。

四、多模态聚合

把原本的文本模态和新合成的视觉特征聚合在一起。

五、翻译

模型的学习目标结合了文本到图片的生成,以及逆任务的图像字幕和翻译。

其中鉴别器源文本、生成图像和真实图像作为输入,用来评估合成图像是否与真实图片一致。

同时,也会使用条件对抗损失来评估合成的图像是否与源语言具有相同的语义。

“脑补”如何帮助翻译?

研究者使用了一种退化策略,即用特殊字符替换源语言文本中的重要词语,来观察模型的翻译表现会下降多少。

在这这种情况下,纯文本的翻译模型只能通过丢失词语的上下文和偏置来推理句子的翻译。

多模态机器翻译则会利用标注的图片进行翻译。

而ImagiT在缺少图片标注的情况下,还能根据退化的文本想象并恢复丢失的信息。

通过这一特殊的探索实验,可以看到ImagiT能在训练阶段学习特定词语(色彩,可被具象化的实体词等)与其他词语之间相关性和共现。

而对比纯文本翻译,通过想象恢复被替换文本的ImagiT模型在翻译质量上下降的幅度也最少。

效果如何?

由于ImagiT不需要图片作为输入,所以在测试时选用纯文本的transformer模型作为baseline。

在Multi30K的英法、英德Test2016,Test2017上进行测试时,ImagiT得到了与SOTA多模态翻译系统相当的表现:

而在Ambiguous COCO上也展现出了不错的测试结果:

论文地址:https://arxiv.org/abs/2009.09654

本文如果对你有帮助,请点赞收藏《这年头 机器翻译都会通过文字脑补画面了》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
英语启蒙究竟要不要给孩子做翻译呢?

英语启蒙究竟要不要给孩子做翻译呢?

...子情况来决定.主流的思想还是不要做翻译,让孩子通过图片,动画场景来理解单词与句子的含义,因为好的绘本和分级读物完全可以让孩子通过图片来理解单词句子的含义。这对年龄小的孩子来说还是挺好的。但对于一些大龄...

2023-05-22 #经典句子

从冷战到深度学习 一文看懂机器翻译发展史

从冷战到深度学习 一文看懂机器翻译发展史

...示:完成本篇阅读至少需要消耗一周能量,请提前收藏~~~图片来源于网络通常来讲,我打开Google翻译的次数是Facebook的两倍,对我来说即时翻译不再是“赛博朋克”专属的情节,它已经成为我们现实生活的一部分。很难想象,经...

2023-06-05 #经典句子

论文降重技巧有哪些?分享6大好用的降重技巧!快点学起来吧

论文降重技巧有哪些?分享6大好用的降重技巧!快点学起来吧

...据转换成表格。这样也能有效降低论文中的重复率。4、图片法大家还可以将一些重复率较高的段落文字转换为图片呢,因为目前查重引擎还未将图片列入查重范围中,所以将大段重复率较高的文字转为图片,也能有效降低重复...

2022-11-30 #经典句子

收藏|词汇 语法去哪儿查?收下这波超好用的英语学习工具网站

收藏|词汇 语法去哪儿查?收下这波超好用的英语学习工具网站

...英语学习工具网站,相信对大家的学习会有很大帮助~(图片来源:全景视觉)CNKI翻译助手 网址:http://dict.cnki.netCNKI翻译助手是“中国知网”开发制作的大型在线辅助翻译系统。系统对翻译请求中的每个词给出准确翻译和解释...

2022-11-15 #经典句子

本科论文怎么让重复率在合格范围内?

本科论文怎么让重复率在合格范围内?

...然后翻译成阿尔及利亚文,再翻译成中文。方法3:转换图片方法将其他人的论文中的文本切成图片,然后放入您自己的论文中。由于CNKI重复检查系统只能检查文本,而不能检查图片和表格,因此可以避免重复检查。优点:比Goog...

2023-05-21 #经典句子

论文兔告诉你 论文查重的六大误区

论文兔告诉你 论文查重的六大误区

...色、黄色、橙色的参考文献,都是因为格式不对。第五,图片抄袭知网查不到窃取他人有版权的原创图片,实验图像数据,图表等也算抄袭。但是很多这点不是小伙伴们没有意识到。而是大家公认知网没有扫描识别图片中引擎的...

2013-09-18 #经典句子

你所不知道的论文查重六大误区!

你所不知道的论文查重六大误区!

...色、黄色、橙色的参考文献,都是因为格式不对。第五,图片抄袭知网查不到窃取他人有版权的原创图片,实验图像数据,图表等也算抄袭。但是很多这点不是小伙伴们没有意识到。而是大家公认知网没有扫描识别图片中引擎的...

2023-06-09 #经典句子

零基础考研英语怎么学?超详细备考攻略请收好

零基础考研英语怎么学?超详细备考攻略请收好

...些话题,文章要咋写。比如英一的一般都是三段论:描述图片-提出问题,分析原因-解决办法,总结展望。②根据写作思路整理模板句型和常用词汇。比如描述图片的句子,引出原因的句子,展望未来的句子。作文书上都有,找自...

2022-11-19 #经典句子