第一句子大全,网罗天下好句子,好文章尽在本站!

脸书开发新模型TaBERT可理解自然语言并从表格查资料

时间:2012-11-10

研究人员提到,TaBERT是第一个跨结构化与非结构化资料的预训练方法,克服了查询对应到数据库表格结构的挑战

友情提示:本文共有 879 个字,阅读大概需要 2 分钟。

脸书开发了一个经预训练的模型TaBERT,可以理解自然语言的句子,并且从表格查询结果,以回答自然语言句子的提问,TaBERT能够回答像是“哪个国家的GDP最高?”这类的问题。研究人员提到,TaBERT是第一个跨结构化与非结构化资料的预训练方法,克服了查询对应到数据库表格结构的挑战。

自然语言处理的改进,无论是网络搜索还是人工智能助理的查询,都能拥有更好的人机交互体验,而大规模预训练语言模型,在近期机器理解自然语言文本,扮演了重要的角色。TaBERT则是运用了预训练技术,连接自然语言理解和结构化资料查询,研究人员提到,TaBERT可以让数字助理更精确地回应“下午的气温几度?”和“太平洋西北地区有多少人口?”等问题,因为TaBERT可从各种数据库或是表格中找到答案。

脸书使用了2,600万张表格和关联的英文句子来训练TaBERT,研究人员表示,先前的预训练语言模型,都仅使用自由格式的自然语言文本训练模型,而这让模型仅能够处理自然语言格式的任务,但并无法处理同时需要对自然语言和数据库进行推理的问题。

脸书以两个常用的基准资料集进行实验,分别是用于监督式文本转SQL任务的Spider资料集,以及弱监督式解析任务的WikiTableQuestions资料集,脸书提到,弱监督式学习会比监督式学习更具挑战性,因为解析器无法取得标签查询,而且必需要探索非常大的查询搜索空间。实验结果显示,无论是弱监督式或是监督式任务,TaBERT的结果都更好,而且也证明使用表格和语言资料进行预训练,是可行且有效的方法。

TaBERT是以语言处理模型BERT作为基础,研究人员把自然语言查询以及表格作为输入,让TaBERT学习句子以及数据库的上下文表示,而该表示也可以用在其他神经网络下游,以产生数据库命令,并且能以任务相关的训练资料,来微调TaBERT表示。

研究人员提到,TaBERT可以被应用在事实核实和验证应用程序中,因为第三方事实核实单位,通常也是依赖已经存在的静态知识库资料,而TaBERT可以将查询对应到相关数据库中,因此不仅能够验证事实,也能参照相关数据库给出解释。

本文如果对你有帮助,请点赞收藏《脸书开发新模型TaBERT可理解自然语言并从表格查资料》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
Google发布表格文字生成数据集ToTTo

Google发布表格文字生成数据集ToTTo

...字生成任务。ToTTo拥有121,000个训练样本,以及7,500个用於开发和测试的样本,Google提到,由於其标注的高精确性,该数据集很适合用来作为,高精确文字生成研究的基准。在过去几年,自然语言生成研究已经有巨大的进步,但Goog...

2023-12-15 #经典句子

知到语言表达与应用写作网课答案

知到语言表达与应用写作网课答案

...方工作F的▌▓可以查题█▌总时差和自由时差考虑系统开发战略化策略的根本出发点是哪些?Ⅰ.是企业的重大建设项目Ⅱ.应是一项技术和社会性工程Ⅲ正确答案:C解析:系统的开发既是一项技术性的工程又是一项社会性的...

2012-02-20 #经典句子

微软亚洲互联网工程院:大规模语言模型的技术趋势和落地实践

微软亚洲互联网工程院:大规模语言模型的技术趋势和落地实践

...或者是微软办公系统,都是非常庞大的系统,有上千人的开发团队,微软亚洲互联网工程院团队主要是通过各种算法提高微软产品的性能指标。不过对于服务外部客户,还缺乏对企业需求的真正了解。约在四年前,微软亚洲互联...

2023-10-19 #经典句子

UNIT3.0详解之对话式文档问答——上传文档获取对话能力

UNIT3.0详解之对话式文档问答——上传文档获取对话能力

...档问答是UNIT提供的一项创新技术,利用这项创新技术,开发者无需梳理意图、词槽,无需进行问题和答案的整理,只需准备文本格式的业务文档,通过平台上传,即可一键获取基于文档的对话技能。无需智能对话技术基础也可...

2023-06-29 #经典句子

数模论文写作通关攻略:零基础论文小白的自救指南!

数模论文写作通关攻略:零基础论文小白的自救指南!

...侧页边缘( 插入右侧编号公式时自动设置); 7. 一个重要的模型,一方面用编号来突出,另一方面可为其取一个名字来突出; 8. 重要模型下方应说明其各个符号的意义以方便读者阅读; 9. 有花括号括起来的模型中的各个方程不宜居中...

2009-03-18 #经典句子

麻省理工最新成果:AI 揭示人脑如何处理语言

麻省理工最新成果:AI 揭示人脑如何处理语言

...以了解哪些组件对高大脑预测性至关重要,利用这些知识开发更好的模型,并收集新数据以挑战和限制未来几代神经上合理的语言处理模型”。在其他类型的语言任务中,表现良好的计算机模型并未展示出与人类大脑的这种相似...

2024-01-15 #经典句子

百度飞桨又开源中文NLP开源工具箱:主打工业应用 支持6大任务

百度飞桨又开源中文NLP开源工具箱:主打工业应用 支持6大任务

铜灵 发自 凹非寺量子位 出品 | 公众号 QbitAI对于开发者来说,又有一个新的NLP工具箱可以使用了,代号PaddleNLP,目前已开源。在这个基于百度深度学习平台飞桨(PaddlePaddle)开发的工具箱里,装有大量工业级中文NLP开源工具与...

2023-10-01 #经典句子

ACL 2019年度回顾:自然语言处理发展趋势

ACL 2019年度回顾:自然语言处理发展趋势

...个问题,因此许多人做了些有意思的工作。例如Kaneko等人开发了一种用于词汇嵌入的去除偏见方法,它可以保留非性别歧视的相关信息,同时消除刻板印象的性别偏见。在更高层次上,今年ACL还在NLP研讨会上主持召开了第一届NLP...

2023-10-26 #经典句子