第一句子大全,网罗天下好句子,好文章尽在本站!

FAIR 最新论文:一种不需要训练就能探索句子分类的随机编码器

时间:2023-01-28

1 月 30 日,facebook 人工智能研究院FAIR发布了一篇博文,公布了他们的论文「No Training Required: Exploring Random Encoders for Sentence Classification 」

友情提示:本文共有 1205 个字,阅读大概需要 3 分钟。

雷锋网 AI 科技评论按,作为人工智能的重要方向之一,NLP 领域的研究目前开展得如火如荼。1 月 30 日,facebook 人工智能研究院(FAIR)发布了一篇博文,公布了他们的论文「No Training Required: Exploring Random Encoders for Sentence Classification 」。

这篇论文被发布在 arxiv 上,主要讲了一种不需要训练就能探索句子分类的随机编码器。论文的主要介绍如下:

研究内容:

这是一个强大的,新颖的语句嵌入基线,它不需要进行任何训练。在没有任何额外训练的情况下,我们探索了用预训练单词嵌入来计算句子表达方式的各种方法。其目的是让语句嵌入具有更坚实的基础:1)看看现代句子嵌入从训练中获得了多少好处(令人惊讶的是,事实证明,这是微乎其微的);2)为该领域提供更合适(也更强大)的基线。

它是如何工作的:

句子嵌入是一种矢量表示方法,其中句子被映射到表示其意义的数字序列。这通常是通过组合函数转换单词嵌入来创建的。句子嵌入是自然语言处理(NLP)中的一个热门话题,因为它比单独使用单词嵌入更容易进行文本分类。鉴于句子表达研究的快速进展,建立坚实的基线是很重要的。我们开始使用当前最先进的方法来确定有哪些收获,而不是采用随机的方法,这些随机的方法只结合了预训练的单词嵌入。随机特性的作用在机器学习社区中早已为人所知,因此我们将其应用到这个 NLP 任务中。我们探索了三种方法:随机嵌入投影包、随机 LSTM 和回声状态网络。我们的研究结果表明,句子嵌入中的提升很大程度上来自于词语表征。我们发现,对经过预训练的单词嵌入的随机参数化构成了一个非常强的基线,有些时候,这些基线甚至与诸如 SkipThought 和 InferSent 等著名的句子编码器的性能相匹配。这些发现为今后的句子表征学习的研究提供了强有力的基础。我们还对句子分类评估的一些合适的实验方案进行了认真的探讨,并对今后的研究提出了建议。雷锋网

为什么它如此重要:

尽管最近对句子编码的研究较多,但是 NLP 的研究者们对于词汇嵌入和句子嵌入之间的关系仍然知之甚少。随着该领域研究的快速进展,对不同方法进行比较并不总是正确的。每隔一段时间我们需要往前回顾,以便对现有的最先进的方法产生更深入地理解,并分析这些方法为什么有效,这一点很重要。通过对句子嵌入的研究提供新的见解,并设置更强的基线,我们可以提高对神经网络表示和理解语言的原理的认识。他们在 Github 上分享了他们的代码。

点击以下链接,阅读全文:

No Training Required: Exploring Random Encoders for Sentence Classification

via:https://code.fb.com/ml-applications/random-encoders/

雷锋网

本文如果对你有帮助,请点赞收藏《FAIR 最新论文:一种不需要训练就能探索句子分类的随机编码器》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
效仿婴儿学习语言 MIT打造了一个具有观察力的AI模型

效仿婴儿学习语言 MIT打造了一个具有观察力的AI模型

...和动词的位置。而在计算机领域,语言学习是语法和语义分析器需要执行的任务。训练它们需要使用使用人工标注的句子,这些标注提供了句子结构和词语含义的信息。语法分析器对于网页搜索、自然语言数据库查询、Alexa和Siri...

2023-01-28 #经典句子

SCI仿写和降重神器 直接英语写SCI!

SCI仿写和降重神器 直接英语写SCI!

...。而科研必备神器“句解霸”可以解决这些困惑。1句子分析器功能分析页面网址:http://www.en998.com/sentence/?sid=d94(文末点击“阅读原文”可直达,同时在该页面也可以切换到降重功能)在句子分析器功能这块,我输入一个有错误...

2020-10-31 #经典句子

自然语言处理库spaCy号称最快句法分析器

自然语言处理库spaCy号称最快句法分析器

...前支持20多种语言的标记。它具有世界上速度最快的句法分析器,用于标签的卷积神经网络模型,解析和命名实体识别以及与深度学习整合。它是在MIT许可下发布的商业开源软件。spaCy项目由@honnibal和@ines维护,虽然无法通过电子...

2023-01-28 #经典句子

良心推荐——这三款冷门英语学习app不容错过

良心推荐——这三款冷门英语学习app不容错过

...这款app还内置考研真题库,大大方便考研同学!NO.2 句子分析器 Pro这款软件主打英语文本语法分析。只要输入英语句子,这款app就会自动分析出句子结构,并且提供相关语法知识的讲解。热爱读外刊却又对长句十分头疼的同学绝...

2022-11-19 #经典句子

父母如何帮助孩子发展语言?

父母如何帮助孩子发展语言?

...的声音以及婴儿的“咿呀学语”都是在不断刺激言语听觉分析器和言语运动分析器的发展。婴儿只要能和父母正常的互动以及其他类型的声音,在这两方面的发展就不会存在不足。单词字期(1-1.5岁)是指一个单词常常表示一个...

2007-06-09 #经典句子

什么是自然语言处理(NLP)?

什么是自然语言处理(NLP)?

...词性提取和标记化来分析单词背后的意图。IBM Watson音频分析器。这个基于云计算的解决方案旨在用于社交监听、聊天机器人集成和客户服务监控。它可以分析客户帖子中的情绪和语气,并监控客户服务电话和聊天对话。谷歌云...

2023-06-11 #经典句子

各刷五大数据集新高 创新工场两篇论文入选 ACL 2020

各刷五大数据集新高 创新工场两篇论文入选 ACL 2020

...和业界广泛知名的斯坦福大学的CoreNLP工具和伯克利句法分析器在这些数据集上的性能虽然还不错,但是如果把他们的这些深层句法信息进一步加到我们的模型里面,进行去粗取精,就能把里面比较好的信息通过加权的方式甄选...

2023-11-28 #经典句子

扩展命名实体识别API及其在语言教育中的应用

扩展命名实体识别API及其在语言教育中的应用

...st.i.kyoto-u.ac.jp/EN/?JUMAN)自动生成的,JUMAN是一个日语词法分析器。词向量是通过一个采用日语维基百科文本训练的word2vec模型获得的。我们希望LSTM模型可以记忆训练数据模式,并在很多情况下应用于CRF-SVM方法。对于上下文无关...

2023-11-25 #经典句子

创新工场两篇论文入选ACL 2020 将中文分词数据刷至新高

创新工场两篇论文入选ACL 2020 将中文分词数据刷至新高

...度超过了斯坦福大学的 CoreNLP 工具,和伯克利大学的句法分析器。即使是在与CTB词性标注规范不同的UD数据集中,该模型依然能吸收不同标注带来的知识,并使用这种知识,得到更好的效果。该模型在所有数据集上均超过了之前...

2023-11-28 #经典句子