第一句子大全,网罗天下好句子,好文章尽在本站!

人类语言与机器语言如何流畅的转化

时间:2023-01-22

教机器说话,机器还不如人类说话清楚

友情提示:本文共有 1098 个字,阅读大概需要 3 分钟。

人类语言与机器语言如何流畅的转化?

教人类说话,需要学习人类的发音节奏和语调,才能上手实践。教机器说话,机器还不如人类说话清楚。其实,人类语言最大的问题在于,没有词。每个字都是一条语法链,一旦一个字有了反义词或者歧义,一句话就失去了本意。再加上一些像“形容词比副词复杂”这样的说法,人类直接说不出来。现有的机器语言,只能说出“人类能听懂的语言”。可以理解为,人类不用识字,直接说话就能理解很多事情。我们研究机器学习的问题,就是怎么把机器变得像人类一样理解知识。再高级一点,用户可以对机器做任何事情,哪怕是自己一句话也没说过。

机器先天具有记忆能力。我们的知识,会经过几次复杂的转换,在一系列复杂的情景下,做出下意识的反应。目前的人工智能训练方法还是以循环神经网络为主,训练有一段时间了。计算能力在提升,但是做不出有意义的语句。后来,人类想到了transformer,在语音识别和机器翻译这两个方向有着举足轻重的地位。因为它们是基于向量空间的训练方法,可以做到长短句识别,文本长短表述识别,不同字符形式训练方法不同,也可以尝试各种人工特征和自动特征。

目前,transformer输入的word是向量,但是输出是语句。训练出来的nlp模型,也可以训练出文章。最终的模型,也可以做翻译,叫对话系统。传统的人工nlp用的都是paddlepaddle,这也是目前国内最火的nlp框架。训练时用循环神经网络,输出word为向量。比如汉语说,你好吗?机器如果学习了句子,把人的说法转换成相应的answer,也就是汉语了。这是训练好后的模型,可以做到句子和answer的匹配。transformer模型的训练有两部分,pretrain和end-to-end。在训练时,并不是使用lstm之类的序列模型,而是用简单的rnn。用多个end-to-end对信息进行预处理,获得maskfeature,保证输入即输出,实现end-to-end的训练。目前来看,transformer模型能做到很多普通的nlp模型做不到的事情。

比如,传统的nlp模型,要做到句子和answer的匹配,只能是编码问句,不能是解码问句。transformer可以做到,把人的说法转换成更简单的表述。可以在中文用一个向量输入去预测其它语言的表述。训练后的模型,可以用来对话。原来想着,训练一个合格的对话系统,需要给机器说前半句话,后半句话的时候,需要多次differentiation,不同时刻做同一件事情,才能做好。这就需要多个answer去匹配人类语句,是比较困难的。为了解决这个问题,最终,transformer模型训练时,使用数字编码格式。

本文如果对你有帮助,请点赞收藏《人类语言与机器语言如何流畅的转化》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
自然语言处理基础:上下文词表征入门解读

自然语言处理基础:上下文词表征入门解读

...特定于在自身特有上下文中的 token)。在我们之前的示例句子中,be 的两个实例就会有不同的向量,因为一个出现在 will 和 signed 之间,另一个则位于 we"ll 和 able 之间。现在看来,通过独立于上下文地表征 word type 实际上会让问...

2020-09-12 #经典句子

Keras文本分类实战(上)

Keras文本分类实战(上)

...载数据:结果如下:使用此数据集,可以训练模型来预测句子的情绪,下面可以考虑如何预测数据。一种常见方法是计算每个句子中每个单词的频率,并将此计数与数据集中的整个单词组相关联。首先从创建词汇开始,收集好的...

2023-01-22 #经典句子

AAAI 2020|通过解纠缠模型探测语义和语法的大脑表征机制

AAAI 2020|通过解纠缠模型探测语义和语法的大脑表征机制

...。针对大脑语义和语法表征的问题,我们利用计算模型将句子中的语义和语法特征区分开,使用分离的语义和语法特征来研究大脑对应的神经基础。图1基于解纠缠特征的人脑表征研究的计算框架论文方法针对上述问题,中科院...

2023-01-05 #经典句子

3分钟看懂自然语言处理之特征提取

3分钟看懂自然语言处理之特征提取

内容导读自然语言中意义最小的单位就是单词,其次是句子,再是段落,最后一整篇文章。下面我们仅仅从单词角度来看问题来说说两种常见的特征表示的方法。最神奇的是,词向量还存在可以加减性,例如:“小猫”-“猫”+...

2023-01-22 #经典句子

何索引数以十亿计的文本向量?

何索引数以十亿计的文本向量?

...方法,下一步就是将它们组合成文本向量(也称为文档或句子向量)。一种简单而常见的方法是对文本中所有单词的向量求和(或求平均值)。图 1:查询向量我们可以通过将两个文本片段(或查询)映射到向量空间并计算向量...

2023-01-22 #经典句子

机器翻译:谷歌翻译是如何对几乎所有语言进行翻译的?

机器翻译:谷歌翻译是如何对几乎所有语言进行翻译的?

...预测某个单词序列的概率,通常在单个集成模型中对整个句子进行建模。凭借神经网络的强大功能,神经网络机器翻译已经成为翻译领域最强大的算法。这种最先进的算法是深度学习的一项应用,其中大量已翻译句子的数据集用...

2023-02-05 #经典句子

达观数据:如何用深度学习做好长文本分类与法律文书智能化处理

达观数据:如何用深度学习做好长文本分类与法律文书智能化处理

...一个。我喜欢这类电影,但是不喜欢这一个。这样的两句句子经过词向量平均以后已经送入单层神经网络的时候已经完全一模一样了,分类器不可能分辨出这两句话的区别,只有添加n-gram特征以后才可能有区别。因此,在实际应...

2023-10-09 #经典句子

干货:2019年湖北技能高考文化综合考试大纲

干货:2019年湖北技能高考文化综合考试大纲

...记基础上高一级的能力层级。要求能够领会并解释词语、句子、段落等的意思。C.分析综合:指分解剖析和归纳整理,是在识记和理解的基础上进一步提高了的能力层级。要求能够筛选材料中的信息,分解剖析相关现象和问题...

2023-10-23 #经典句子

两篇AAAI论文 揭示微信如何做文章质量评估

两篇AAAI论文 揭示微信如何做文章质量评估

...献。相关研究可以分为三类:(1) 基于实体的方法,识别句子中的实体,建模相邻句子中实体的联系;(2) 基于词汇的方法,建模相邻句子的词共现信息 (3) 基于神经网络的方法,利用神经网络学习词和句字语义的向量表示,建模...

2023-05-22 #经典句子