第一句子大全,网罗天下好句子,好文章尽在本站!

UNIT3.0详解之对话式文档问答——上传文档获取对话能力

时间:2023-06-29

比如:乘坐飞机时,能不能带宠物上飞机,3岁小朋友是否需要买票等

友情提示:本文共有 2007 个字,阅读大概需要 5 分钟。

在日常生活中,用户会经常碰到很多复杂的规章制度、规则条款。比如:乘坐飞机时,能不能带宠物上飞机,3岁小朋友是否需要买票等。在工作中,也会面对公司多样的规定制度和报销政策。比如:商业保险理赔需要什么材料,工作几年可以排队办理?这些情况下,经常需要各种查询确定或者检索规章制度文件或说明,才能回复并解决用户的疑问。基于这类常见的业务场景,UNIT3.0正式推出了对话式文档问答能力,更快速、低成本的搭建智能对话系统。

对话式文档问答是UNIT提供的一项创新技术,利用这项创新技术,开发者无需梳理意图、词槽,无需进行问题和答案的整理,只需准备文本格式的业务文档,通过平台上传,即可一键获取基于文档的对话技能。无需智能对话技术基础也可以利用该技术,秒变AI达人。

【对话式文档问答技术解读】

对话式文档问答技能,可以对传统需要人工抽取FAQ或梳理意图的业务文档进行自动学习,通过搜索与语义理解技术,构建了用户输入的问题与业务文档之间的桥梁,使得用户的问题可以由技能自动找到文档中的对应答案片段,使用端到端的多文档阅读理解模型V-NET和自然语言生成技术,技能得以返回更为精准的答案。整个问答技能的构建对开发者来说没有任何技术门槛,且对话式文档问答技能具有自主学习能力,可持续优化,大大提高问答系统的开发人效。

【多粒度语料分析技术】

开发者在上传文档后,可以在平台上进行模型训练,整个训练的过程需要经过以下几部分处理:

1. 基础处理:比如编码处理,冗余字符处理,切分完整语义片段,进行词法分析等,让机器人对用户上传的文档有基础了解;

2. 获取文档关键信息并完成倒排索引:此过程采用了TF-IDF及TextRank等多种算法综合片段的重要性,并进行打分;

3. 构建基于词向量的KNN分类器:基于大规模语料,使用skip-gram模型,训练并得到词向量,并完成构建KNN分类器。

【基于篇章理解的答案定位技术】

训练结束后,开发者就可以直接测试使用了,这个过程如上图所示:

1. 首先是对用户的query进行分析及提取关键信息;

2. 此后对关键信息进行拓展,构建query中关键信息与文档中关键信息之间的桥梁;

3. 在对query有了比较深入的分析后,实时在系统中寻找与问题最相关的候选文档及候选答案,要进行基于各种技术的排序处理;

4. 排序后,会生成精准的答复,这里面要拆分单答案及多答案等处理算法及逻辑。

【如何体验对话式文档问答】

开发者需要登录UNIT平台,点击“创新技术”区,进入如下界面,点击“对话式文档问答“即可申请体验。

创新技术区是UNIT将创新技术在业务场景下落地探索的窗口,目前包含对话式文档问答和语义解析离线使用两种创新技术,开发者可以通过在线申请并体验这些新技术,同时更多创新技术敬请期待。

【三步快速创建对话式文档问答对话技能】

点击“对话式文档问答”,进入对话式文档问答的主界面,新用户点击“新建技能”,填写技能信息,即可完成技能的创建。技能创建完成后会出现在“对话式文档问答技能”列表和“我的技能”列表中。创建技能后,只需三步便可获得基于业务文档的对话能力:

第一步:上传业务文档

当前版本的对话式文档问答仅支持两类纯文本文档的上传上传,一类是普通文本文档,一类是梳理过的FAQ文档,如下图所示。

Tips:

1.每种文档类型都可以通过下载示例文档进行内容的替换后再上传;

2.请选择恰当的文档类型后再上传对应的文档,否则会影响模型的效果;

3.每次只能上传一个文档,多个业务文档请分批次上传;

4.FAQ类型的文档请务必按照示例文档的格式整理后再上传;

5.当前版本下每个技能可支持的文档大小的上限是10M,文档数量的上限是99个。

第二步:训练模型

文档上传完成后开始模型训练。训练完成后“训练”按钮会变为“重新训练”,点击“测试”进入测试界面。

Tips:

1.训练过程中不可对文档进行任何编辑,包括删除、上传、下载等;

2.目前的技能是全文档训练,即该技能下的所有文档都会参与模型的训练。

第三步:测试技能

进入“测试”界面可以体验对话。对话有两种形态:一种是直接对话,一种是回复中提供选项,用户可以进行选择,或者直接输入更多信息进行交互,如下图。

【调优模式如何使用】

1. 调优模式下会看到一个query的多个候选项答案,并且可以展开每个候选项查看完整的选项内容。

2. 查看并确定正确选项后,点击单选按钮进行选择,并点击确认后就会保存答案,再次询问该query时,会呈现针对这个问题的答案,如下图:

3. 如果对之前选择的答案不满意,可以点击“删除并重新选择”按钮,进行重新选择;点击“删除并重新选择”按钮后,会呈现选择前的选项状态。

4. 调优完成后,点击“生效”按钮,调优结果会在模型中生效;之后即可在“测试模式”下体验调优后的对话效果了;如果调优后没有点击“生效”就要离开调优界面,会弹出二次确认,点击“生效”后,调优结果就会生效到模型中。

本文如果对你有帮助,请点赞收藏《UNIT3.0详解之对话式文档问答——上传文档获取对话能力》,同时在此感谢原作者。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。
相关阅读
语音自训练平台正式上线 零代码训练提升业务场景语音识别率

语音自训练平台正式上线 零代码训练提升业务场景语音识别率

...的识别准确率。功能介绍● 创建模型、系统评估用户可上传业务场景音频+标注文件,由系统自动评估多种语音识别基础模型得到基线准确率并进行模型推荐。输出字准、句准、核心词准等多维度评估结果报告。● 上传语料、...

2023-01-29 #经典句子

要想突破语言限制 不妨换一种输入法试试

要想突破语言限制 不妨换一种输入法试试

...精准?因为用户的输入习惯已经被拼音输入法做了记录,上传服务器之后进行了特定的编码,给用户编订了特定的用户词库。用户输入的时候,特定词库就会起作用,给用户提供现成的文字“答案”了。那么,什么时候上传的用...

2023-01-25 #经典句子

可爱又沙雕的自拍文案 你的好友上传了两张假照

可爱又沙雕的自拍文案 你的好友上传了两张假照

...一瓶人类小样。14.黑眼圈是昨日心事的落款。15.你的好友上传了两张假照。16.美女一般都不发自拒,但敢。17.不笑运气差,一笑脸就大。18.虚假自拒高端玩家上线。19.你的好友上传了两张照片。20.这条朋友圈屏蔽了凡人。21.装漂亮...

2023-11-21 #经典句子

郑恺深夜上传做保养图片 配文魔性 网友直呼中了张伟的“毒”!

郑恺深夜上传做保养图片 配文魔性 网友直呼中了张伟的“毒”!

一向以阳光健康形象示人的郑恺,突然晒出一组做脚部保养的图片,还配了特傲娇的句子。小猎豹秒变精致boy,画风转换的略诡异。恺恺自己皮一下很开心,网友更是起哄不断:这位精致男boy,你的腿毛出卖了你的钢铁直男属性...

2023-08-08 #经典句子

巧借互联网开展课外英语互动式学习

巧借互联网开展课外英语互动式学习

...,我先把几组地震前后景象对比强烈的建筑物、道路图片上传(伴随着悲伤的音响效果),然后再上传一段关于地震的新闻,并在空间上发表自已悲伤的心情,大大地写上一句:What can I do? 学生们纷纷回帖,出谋献策,第二天上...

2024-01-13 #经典句子

苏轼落难时写诗自我安慰 被刻在石碑上传遍各地 开篇就创造成语

苏轼落难时写诗自我安慰 被刻在石碑上传遍各地 开篇就创造成语

...了一首《满庭芳·蜗角虚名》,这首诗在当时被刻在石碑上传遍各地,产生了不小的影响。那么这首诗到底讲了什么呢?下面就让我们一起来欣赏一下。《满庭芳》蜗角虚名,蝇头微利,算来著甚干忙。事皆前定,谁弱又谁强。...

2023-07-29 #经典句子

SCI论文投稿时这些事千万别做……

SCI论文投稿时这些事千万别做……

...咬紧牙关扛过去。三、没有准确了解投稿的几个状态稿件上传的是否成功,需要大家注意的是通常在线上传成功后联系邮箱会收到杂志的信件,上传成功后的一周,大家要做的就是多关注邮箱,有很多稿件会因为各种格式问题退...

2023-11-24 #经典句子

学术文献翻译工具推荐 如何快速翻译大量文献?

学术文献翻译工具推荐 如何快速翻译大量文献?

...翻译的时候,翻译狗的便利度就更加明显了。它拥有批量上传文档的功能,将需要翻译的文档批量上传,就可以坐等译文啦。此外,翻译狗官网内的网站翻译版块,还提供包括Google学术(不用翻墙就能直接登录使用)、BMJ、PubMed...

2023-01-15 #经典句子

谷歌翻译全新改版 文档翻译功能瞩目

谷歌翻译全新改版 文档翻译功能瞩目

...体、布局都更易于使用。而文字翻译旁边则新增了一个【上传文档】按钮,用户可以直接上传文档进行翻译。此前谷歌翻译也拥有这项功能,但似乎并没有多少人发现它。不过文档翻译的长度是有限制的,仅支持上传大小不超过...

2024-01-05 #经典句子