第一句子大全,网罗天下好句子,好文章尽在本站!

AI顶会ACL 2021放榜:网易伏羲三篇论文入选

时间:2023-12-03

网易伏羲共有三项研究被本届ACL收录,内容包括自然语言生成、无监督文本表示学习等方向,相关技术已应用于游戏、文创及智慧文旅等行业

友情提示:本文共有 2059 个字,阅读大概需要 5 分钟。

近日,国际AI顶尖学术会议ACL 2021(Annual Meeting of the Association for Computational Linguistics)公布了论文录用结果。网易伏羲共有三项研究被本届ACL收录,内容包括自然语言生成、无监督文本表示学习等方向,相关技术已应用于游戏、文创及智慧文旅等行业。

ACL由国际计算语学协会主办,是自然语言处理(NLP)与计算语言学领域最高级别的学术会议,被中国计算机学会(CCF)列为A类国际学术会议,涵盖语言分析、信息抽取、机器翻译与自动问答等各个领域。本届ACL共收到3350篇论文投稿,其中主会论文录用率为21.3%。

(AI顶会ACL 2021放榜,网易伏羲三篇论文入选)

除三篇收录论文外,网易伏羲提交的一篇演示论文(Demo Paper)也引发了评审高度关注。该论文主要探讨手游《遇见逆水寒》中所采用的“大宋傀儡戏”玩法。

傀儡戏起源于汉代,又名木偶戏。游戏中,AI就像傀儡,而玩家则是提线操控的“傀儡师”。根据玩家输入的语句,AI能自动编写故事,与玩家共创剧本。

据了解,“大宋傀儡戏”玩法是中文领域首个采用大规模预训练语言模型的开放域文字游戏,融入了网易伏羲的多项算法创新。一方面,网易伏羲通过设置剧情目标、任务奖励等玩法创新方式,规避了游戏中滥用AI编剧的情况发生;另一方面,通过在模型压缩、推理加速等多个环节进行创新,线上服务的成本也得以有效降低。目前,网易伏羲正在利用更大规模的预训练语言模型,持续优化该玩法,为玩家带去更好的体验。

(紫色对话框为网易伏羲AI自动撰写)

以下为ACL 2021网易伏羲录用文章介绍:

1、《OpenMEVA:一个评估开放式故事生成指标的基准数据集》

(OpenMEVA: A Benchmark for Evaluating Open-ended Story Generation Metrics)

在自然语言生成(NLG)领域,如何尽量客观、准确地评价AI自动生成的文本质量,是一大行业难题。

目前,主要有两种评估NLG系统的方法:人工评估和自动评估指标。相较之下,人工评估在准确性和有效性上更胜一筹,自动评估指标则在成本和效率上更具优势。随着NLG的快速发展,现有的评估方式越来越难以满足行业痛点,一系列评估NLG系统质量的新方法也应运而生。

由于缺乏标准化的基准数据集,无论是全面衡量指标的能力,还是比较不同指标的性能,都极为困难。为此,网易伏羲与清华大学的黄民烈老师团队合作提出了一个针对自动评估指标的基准数据集“OpenMEVA”。借助“OpenMEVA”,可以全面评估针对开放式故事的自动评估指标性能:包括自动生成指标与人工评估的相关性,对不同模型输出和数据集的泛化能力,故事语篇连贯性能力,以及对扰动的稳健性等。

2、《人工位置信息残留会通过MLM预训练模型动态词向量传播》

(Positional Artefacts Propagate Through Masked Language Model Embeddings)

文本表示学习,是指将文本字符串表示转化成计算机能处理的分布式表示的过程。文本表示学习是基于深度学习的自然语言处理的基础,良好的文本表示可以大幅提升算法效果。

本研究中,网易伏羲基于掩码语言模型(Masked Language Model),从预训练语言模型中抽取了各层文本分布式表示,并从中发现了一个共同但并不理想的特征:在BERT和RoBERTa的隐状态向量中,持续存在有离群神经元的情况。

(在SST-2和QQP数据集上的Bert-base各层平均向量)

为研究该问题的根源,网易伏羲引入了一种神经元级别的分析方法。该方法显示,异常值与位置嵌入(Position Embedding)所捕获的信息密切相关,而这些异常值是造成编码器原始向量空间各向异性的主要原因。

通过剪除这些异常值,可以提高各向量的相似度。剪切后的向量可以更准确地区分词义;同时,使用均值池化(Mean Pooling)后,可以得到更好的句子嵌入。

3、《通过对句子层面和语篇层面的一致性进行建模来生成长文本》

(Long Text Generation by Modeling Sentence-Level and Discourse-Level Coherence)

(预训练任务示意图)

AI自动生成连贯的长文本,本身就是一项极具挑战的任务。而故事生成这类开放式的文本生成任务则更为困难。

尽管在句内连贯性上,现有的大规模语言模型表现不俗,但要保持整体生成文本的连贯性,依旧非常困难。这是因为在上下文中,很难捕捉到超越token级别共现的高级语义和语篇结构。

本研究中,网易伏羲和清华大学黄民烈老师团队合作提出了一个长文本生成模型,可以在解码过程中,在句子层面和语篇层面上表示上下文。借助两个预训练任务,模型通过预测句子间的语义相似性、区分正常和打乱的句子顺序来学习表征。实验表明,在生成文本的连贯性上,该模型优于现有最先进的基线模型。

本文如果对你有帮助,请点赞收藏《AI顶会ACL 2021放榜:网易伏羲三篇论文入选》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
显示评论内容(1)
  1. 肝胆相照2023-12-22 00:37肝胆相照[陕西省网友]203.16.187.214
    网易的科研实力越来越强啦,恭喜恭喜!????
    顶7踩0
相关阅读
ACL 2018:Attention 机制占主流 中文语法检错测评引关注 | ACL 2018

ACL 2018:Attention 机制占主流 中文语法检错测评引关注 | ACL 2018

为期六天的 ACL 于上周在墨尔本会展中心落下帷幕,在这六天时间内,共计八场 tutorial,三百多篇论文展示,十五场 workshop,涉及机器翻译、机器学习、问答系统、信息提取、语义分析等多个方向的研究。毫无疑问,这是一场 NLP...

2014-04-09 #经典句子

ACL 2019论文分享:自我进化的对话机器人

ACL 2019论文分享:自我进化的对话机器人

ACL 2019 收录论文分享:《Know More about Each Other: Evolving Dialogue Strategy via Compound Assessment》。摘要现有的基于监督学习的对话系统,缺乏对多轮回复方向的控制和规划,导致对话中发生重复、发散等问题,使得用户的交互体验较差。...

2011-11-29 #经典句子

ACL 2019 论文:谷歌提出增强神经网络机器翻译鲁棒性的新方法

ACL 2019 论文:谷歌提出增强神经网络机器翻译鲁棒性的新方法

尽管近年来利用 Transformer 模型进行神经机器翻译(NMT)取得了巨大成功,但是 NMT 模型对输入的微小干扰仍然很敏感,从而导致各种不同的错误。谷歌研究院的一篇 ACL 2019 论文提出了一种方法,使用生成的对抗性样本来提高机...

2023-10-11 #经典句子

ACL 2020论文分享|基于对话图谱的开放域多轮对话策略学习

ACL 2020论文分享|基于对话图谱的开放域多轮对话策略学习

欢迎关注【百度NLP】微信公众号,及时获取更多自然语言处理技术干货!本文对百度NLP入选ACL 2020的论文《Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation》进行解读,该论文提出用图的形式捕捉对话转移规律作...

2023-07-10 #经典句子

高瓴入主格力 董明珠等话语权待定;双11苏宁将与恒大合作卖房?

高瓴入主格力 董明珠等话语权待定;双11苏宁将与恒大合作卖房?

...季度收入3.3亿元,相比去年同期增速72%。(中国企业家)网易现严选换帅引猜测:【严选换帅,网易回应:长期投入严选发展,无出售计划】10月28日,网易集团人力发表全员邮件,宣布重大人事变动。其中涉及严选换帅、邮箱...

2023-09-30 #经典句子

ACL 2018|南非西北大学:面向资源稀缺语言的NLP Web服务

ACL 2018|南非西北大学:面向资源稀缺语言的NLP Web服务

这是读芯术解读的第135篇论文ACL 2018 System Demonstrations面向资源稀缺语言的NLP Web服务NLP Web Services for Resource-Scarce Languages南非西北大学North-West University, South Africa本文是南非西北大学发表于 ACL 2018 的工作,提出了一个项目,将现有...

2023-06-26 #经典句子

继CVPR AAAI大丰收后 百度又有11篇论文被ACL 2020录用

继CVPR AAAI大丰收后 百度又有11篇论文被ACL 2020录用

近日,国际自然语言处理领域顶级学术会议“国际计算语言学协会年会”(ACL 2020)公布了今年大会的论文录用结果。根据此前官方公布的数据,本届大会共收到 3429 篇投稿论文,投稿数量创下新高。其中,百度共有11篇论文被...

2011-10-01 #经典句子

中科院 华为等斩获最佳长论文 ACL 2019奖项全部揭晓

中科院 华为等斩获最佳长论文 ACL 2019奖项全部揭晓

机器之心报道机器之心编辑部不久自然语言处理领域顶级会议 ACL 已于当地时间 7 月 28 日在意大利佛罗伦萨开幕。不久之前,ACL 2019 官方网站公布了入围论文奖项的 32 篇候选论文。刚刚,ACL 2019 最终获奖论文公布,多所国内高...

2008-01-04 #经典句子