第一句子大全,网罗天下好句子,好文章尽在本站!

5篇情感分析研究论文 数据科学家们了解一下

时间:2020-06-14

因此,创造出可智能识别感情的机器日益成为热门

友情提示:本文共有 2909 个字,阅读大概需要 6 分钟。

全文共3143字,预计学习时长8分钟

情感分析用途广泛,能够识别感情与想法的AI模型广泛应用于诸多产业。因此,创造出可智能识别感情的机器日益成为热门。自然语言处理(NLP)的研究也是如此。本文将介绍5篇关于情感分析和情感分类的重要论文。

1.运用深度学习检测推特上的仇恨言论(Deep Learning for Hate Speech Detection inTweets)

情感分类模型的最重要用途之一是检测仇恨言论。最近有很多关于内容审核人员工作之艰辛的报道,随着自动仇恨言论检测和其他内容审核模型的发展,审查人员有望卸下审核图像内容的重担。

在这篇论文中,研究小组将他们的仇恨言论检测任务定义为对特定的推特帖子进行分类,区分其是否存在种族主义或性别歧视。

为此,研究人员基于包含16000条推文的数据集进行实验。在该数据集中,1972条推文标记为具有种族歧视内容。3383条推文标记为具有性别歧视内容。其余的推文归类为既没有种族主义情感,也没有性别歧视情感。

研究表明,某些深度学习技术能够比现有的N-gram方法更高效地检测仇恨言论。

发布/最近更新日期:2017年6月1日

作者和贡献者:Pinkesh Badjatiya(国际信息技术研究所-海得拉巴,以下简称IIIT-H)、ShashankGupta(IIIT-H)、Manish Gupta(微软)、Vasudeva Varma(IIIT-H)

文章地址:https://arxiv.org/pdf/1706.00188v1.pdf?ref=hackernoon.com

2.depechemod++:双语情感词典(DepecheMood++: a Bilingual Emotion Lexicon)

创建词典的主要途径有两种:直接创建(通常使用众包注释器),或者从现有注释语料库派生。

研究人员的实验目的是:检验文档过滤、降低频率或文本预处理等简单的技术能否用于改善DepecheMood这一最新词典。这本词典由带注释的新闻文章组成,最初由Staiano和Guerini于2014年创建,用于情感分析。

在这篇论文中,研究人员解释了他们是如何创建该词典的。这项研究发布的新版本DepecheMood++有英语和意大利语两种版本。

发布/最近更新日期:2018年10月8日

作者和贡献者:Oscar Araque(马德里理工大学)、Lorenzo Gatti(特温特大学)、Marco Guerini(布鲁诺·凯斯勒研究所)、JacopoStaiano(Recital AI)

文章地址:https://arxiv.org/pdf/1810.03660v1.pdf?ref=hackernoon.com

3.粗鄙之语:粗俗言论的社会动力(Expressively Vulgar: The Socio-dynamics ofVulgarity)

大多数思想的表达形式随时间不断演变,而粗俗的语言却并非如此,使用粗俗的语言往往包含表达确切信息的强烈指向。

在这项研究中,德克萨斯大学和宾夕法尼亚大学的研究人员对推特帖子中的粗俗词汇进行了大规模的数据驱动分析。更具体地说,他们的研究分析了推特中粗俗语言的社会文化和语用方面的内容。

研究小组试图回答以下问题:粗俗言论的表达方式和功能是否因该言论发表者的人口特征而不同?粗俗言论是否会影响对情感的感知?对粗俗言论进行建模是否有助于情感预测?

研究人员收集了6800条推文的数据集。接下来,他们让9位评审员用5分制对这些推文进行了情感标注。值得注意的是,数据还包括发布推文者的人口统计数据(性别、年龄、教育程度、收入、宗教背景和政治意识形态)。

这个数据集是唯一一个既包括推文又包括其发布者详细信息的开放数据集。此外,这也是第一次对低俗词建模如何提高情感分析性能的研究之一。

发布/最近更新日期:2018年8月

作者和贡献者:Isabela Cachola,Eric Holgate,Junyi Jessy Li(均来自德克萨斯大学奥斯汀分校)Daniel Preotiuc Pietro(宾夕法尼亚大学)

文章地址:https://www.aclweb.org/anthology/C18-1248.pdf?ref=hackernoon.com

4.多语言推特情感分类:人类注释者的作用(Multilingual Twitter SentimentClassification: The Role of Human Annotators)

在本文所列举的关于情感分析的研究中,这是唯一一个强调人类注释者重要性的研究。在这项自动推文情感分类实验中,来自Joef Stefan研究所的研究人员分析了一个用多语言推文标注情感的大型数据集。

具体来说,研究小组标注了160万条包含13种不同语言的推文。利用这些注释的推文作为训练数据,团队构建了多个自动情感分类模型。

他们的实验得出了一些有趣的结论。首先,研究人员指出,在统计学上,顶级分类模型的性能没有显著差异。其次,当应用于有序三类情感分类问题时,分类模型的基本准确性与性能无关。最后,研究人员表示应该关注训练集的精确度,而非所使用的训练模型。

发布/最近更新日期:2016年5月5日

作者和贡献者:Igor Mozeti,Miha Grar和Jasmina Smailovi(均来自Joef Stefan研究所知识技术部)

文章地址:https://arxiv.org/pdf/1602.07563v2.pdf?ref=hackernoon.com

5.MELD:一种用于情感识别的多模式多方数据集

在这篇论文中,作者就目前会话情感识别领域日益增多的研究进行了解释。同时,他们指出,该领域缺乏大规模的会话情感数据库。为了弥补这一点,研究人员提出了多模式情感线数据集(MELD),它是对原始情感线(EmotionLines)数据集的扩充和增强。

MELD包括了来自电视剧《老友记》的1433段对话中的13000段语音。数据集主要集中于两个以上说话者的对话。此外,每一句话都有情感和情感标签。而EmotionLines这一原始数据集则只包含对话的文本。因此,它只能用于文本分析。数据集的主要改进是增加了音频和视频模式。MELD包括所说的词、说话的语调和说话人的面部表情。

发布/最近更新日期:2019年7月4日

作者和贡献者:Soujanya Poria(新加坡科技设计大学)、Devamanyu Hazarika(新加坡国立大学)、NavonilMajumder(墨西哥国立理工学院)、Gautam Naik(南洋理工大学)、Erik Cambria(南洋理工大学)、Rada Mihalcea(密歇根大学)

文章地址:https://arxiv.org/pdf/1810.02508v6.pdf?ref=hackernoon.com

创造情感智能机器是一个雄心勃勃的目标。为此,情感分析和情感识别是必要的步骤。希望这些论文有助于加强你对该领域目前所做工作的理解。

留言点赞关注

我们一起分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

本文如果对你有帮助,请点赞收藏《5篇情感分析研究论文 数据科学家们了解一下》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
毕业论文答辩稿全稿

毕业论文答辩稿全稿

...篇文章下。还有一些本科生问我可不可以也借鉴一下硕士论文答辩稿,那么我回答一下,是可以的哦!以下答辩稿内容部分,是根据我所做的PPT撰写的。我的论文由于是财经类的论文,较多的数据、表格和图片,PPT一页放不下太...

2008-05-24 #经典句子

阅读论文你真的用对方法了吗?

阅读论文你真的用对方法了吗?

01、你如何阅读论文?我从阅读摘要开始,接着我浏览了一下引言,翻阅了这篇文章,看了这些图形。我试着找出最突出的一两个图形,我明白其中表达了什么。然后,我读了结论/总结。只有当我这样做的时候,我才会回到技术...

2023-07-21 #经典句子

你的SCI论文为什么会被拒稿?一定要看这十条潜规则!

你的SCI论文为什么会被拒稿?一定要看这十条潜规则!

...互动热度,就能及时收到每期推送啦!不少小伙伴都有SCI论文被拒稿的经历。从实验设计、做实验再到写文章,少则几个月,多则数年。辛辛苦苦的工作一旦被拒,是一件极为“悲剧”的事情,影响着我们顺利毕业、晋升职称、...

2011-11-24 #经典句子

如何以初学者角度写好一篇国际学术论文?

如何以初学者角度写好一篇国际学术论文?

人工智能顶会论文之争越来越激烈了,CVPR、AAAI、ICLR等各大会议虽然录取率逐年降低,但是投稿论文数量却在逐年增加。虽说发论文不是衡量一位学者的学术能力的唯一标准,但确是极为重要的标准。一篇好的论文不仅要求主题...

2023-11-24 #经典句子

SCI论文写作及投稿体会

SCI论文写作及投稿体会

...经验丰富了对基本流程和常规还是有一点了解我们来谈谈论文的写作和出版写作相对简单欢迎发表个人观点#论文写作#“首先,论文的成稿需要很大的努力,”他需要“很好的创新,足够的视点支持,完整的数据分析,你需要写...

2018-11-18 #经典句子

写好文献综述的十个重要提醒 有没有你最常忽视的环节?

写好文献综述的十个重要提醒 有没有你最常忽视的环节?

...学网博客综述是对学科中某个研究方向进行总结和展望的论文,一般是由对该领域有深刻理解的学者撰写。撰写综述需要阅读大量的文献,需要作者检索文献,筛选文献,从文献中提取重要的信息以及进行批判性的思考。为了让...

2023-06-17 #经典句子

论文查重原理及降重

论文查重原理及降重

...Wiley(威立)介绍,目前超过1/3的国际期刊编辑经常碰到论文有重复的情况。编辑一旦发现论文的重复率过高(即和已发表的论文数据库中的某一篇或多篇论文高度相似),就会直接拒稿或退回论文要求改写,这是每位作者都绝...

2022-12-04 #经典句子

论文投稿哪些雷区不能踩

论文投稿哪些雷区不能踩

增加投稿命中率的小技巧:论文写得好,不一定能发得好,正如生意场上你的货好,不一定能找到合适的买主,古人云:“千里马常有,而伯乐不常有”,那如果你投稿屡次被拒,或者直接石沉大海,你有没有仔细分析过其中的...

2023-07-28 #经典句子