CN113569022B - 一种基于级联式搜索的对话机器人应答引擎实现方法 - Google Patents

一种基于级联式搜索的对话机器人应答引擎实现方法 Download PDF

Info

Publication number
CN113569022B
CN113569022B CN202110735644.5A CN202110735644A CN113569022B CN 113569022 B CN113569022 B CN 113569022B CN 202110735644 A CN202110735644 A CN 202110735644A CN 113569022 B CN113569022 B CN 113569022B
Authority
CN
China
Prior art keywords
question
score
round
standard
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110735644.5A
Other languages
English (en)
Other versions
CN113569022A (zh
Inventor
何思佑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202110735644.5A priority Critical patent/CN113569022B/zh
Publication of CN113569022A publication Critical patent/CN113569022A/zh
Application granted granted Critical
Publication of CN113569022B publication Critical patent/CN113569022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于级联式搜索的对话机器人应答引擎实现方法,属于NLU技术和对话机器人领域,解决了现有部分对话机器人需要人工维护关键词字典且泛化能力低的问题。本发明提出一种结合字符搜索与语义相似度模型的实现方法来解决此问题,通过引入级联式搜索,综合评分排序等方法提升单轮会话和多轮会话的准确性,并在一定程度上提升了应答引擎的泛化能力,同时支撑意图式应答模式,较大程度降低机器人对人工知识库语料数量的依赖。

Description

一种基于级联式搜索的对话机器人应答引擎实现方法
技术领域
本发明属于NLU技术和对话机器人领域,具体涉及一种基于级联式搜索的对话机器人应答引擎实现方法。
背景技术
对话机器人系统在各个互联网公司,尤其是电商平台非常常见,主要代表产品有:智能客服机器人、辅助客服机器人。其主要用是解决用户的一些常见问题为人工客服做好第一道拦截网,过滤简单问题重复打扰人工客服造成人力资源浪费,同时也能及时响应用户需求提升用户体验。
对话机器人的本质是当用户发起问题Q时,如何精准匹配到对应意图I,并作出对应回答A的一套完整解决方案,完整链路大致可描述为Q->I->A,现有对话机器人商业用例中大多采取传统模式识别应答:(1)使用文本检索+文本分类的方式识别用户意图;(2)根据意图匹配答案区分对话类型(单轮、多轮);(3)根据对应的回答类型进入对话树或直接返回答案。其中文本检索阶段需要人工配置可能出现问题涉及的关键词等;文本分类阶段需要人工标注大量数据,且知识库要随着问题的增加而增加标注数据;进入对话树以后必须根据对话内容进行文本匹配返回结果,无法真正做到语义级别识别用户意图跳转到对应答案。
综上,现有对话机器人存在的弊端在于:
(1)现有技术中基于关键词和文本分类的方法识别用户意图准确率较低,且泛化能力差,当用户更改提问方式或出现同音字、错别字,识别率下降较快;
(2)原有文本分类需使用各个类别的正反例标注数据进行训练,对标注数据的质量和数量要求较高,且当应用场景发生改变时必须重复进行人工标注才能完成整个流程,花费大量人工。
发明内容
本发明公开了一种基于级联式搜索的对话机器人应答引擎实现方法,基于Q->I的过程做主要优化,通过采用ES检索意图候选集C,再通过transform类预训练模型直接计算用户问题Q与候选集C之间的相似度分数,结合各阶段评分最终做出意图I的确定。此方案抛弃了直接文本分类的方法,采用预训练模型+候选集相似计算提升了泛化能力、准确率;通过使用标准问-相似问与部分外域属于即可构建一个包含正反例的完整数据集从而获得对应的语义模型,仅需人工总结对应的标准问-相似问对关系即可,标准问与相似问为一对多关系,可节约大量人工。
本发明采用的技术方案如下:
1.一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,包括如下步骤:
步骤1:构建标准问-相似问知识库、标准意图-相似意图知识库和多轮问答树,并将以上结果整合成知识库K;
步骤2:利用知识库K内容构建正反例数据集,分别训练标准问语义模型和意图语义模型得到模型M1和M2,同时将知识库K按行导入ES得到检索库E,将所有多轮问答树导入redis得到多轮库R;
步骤3:当系统接收到用户问题Q,查询检索库E得到最可能N个标准问候选集C=<c1,c2,c3,…,cn>与候选集得分集合,将标准问候选集与用户问题Q送入标准问语义模型计算相似度,得到相似度分数集合S=<s1,s2,s3,…,sn>,随后整合候选集得分集合与相似度得分集合,得到综合评分,对综合评分进行置信度计算并根据置信度进行排序,得到序列L=<l1,l2,l3,…,ln>,进入下一个步骤;
步骤4:根据排序后的序列L=<l1,l2,l3,…,ln>,取出第一个元素l1进行置信度判断;根据置信度判断的结果分别进行策略回答,直至完成会话状态;
其中,所述多轮问答树采用树形数据结构,是由标准问或标准意图触发的一种对话模式。
其中,所述标准问-相似问对知识库和标准意图-相似意图知识库由知识库系统配置或者是由excel文档配置。
进一步的,所述步骤2包括:
步骤2.1、构建正反例数据集,标准问-相似问为一对句子记作标签0集合,非标准问-相似问组合的句子堆记作标签1集合,混合两种标签所有数据得到最终数据集
据集,根据数据集使用bert或者xlnet+attention的方式训练语义模型M1,M2;
步骤2.2、将知识库K数据导入搭建好的ES集群中,为候选集检索做好准备,将多轮对话树保存为json格式,导入redis中,与ES中的查询语句以一个唯一键ID做关联。
进一步的,所述步骤3包括:
步骤3.1、当用户通过前端页面向机器人发起提问,获得请求Q,首先使用Q进行基本处理后,输入ES进行查询TOP K个最有可能的标准问题,查询得到候选集C=<c1,c2,c3,…,ck>与候选集得分集合;
步骤3.2、将候选集与用户问题Q组装为【Q-C】的形式请求标准问语义模型计算相似度,将会得到K个相似分数,得到相似度分数集合;随后整合候选集得分集合与相似度得分集合,得到综合评分。
其中,综合评分的计算方法包括加权平均求和:Rn=w1*cn+w2*sn,需满足w1+w2=1,其中w1、w2分别表示ES检索分数和语义模型相似度的权重比值;cn、sn分别表示对应的ES检索分数和语义相似度分数,对ES查询的候选集得分集合做一次归一化处理,最终得到置信度集合,并从大到小进行排序,得到序列L=<l1,l2,l3,…,lk>,归一化处理计算公式如下:
Figure BDA0003141515060000031
其中scorei表示归一化的分数;score_esi表示当前问题的es检索分数;min(score_es)表示当前所有检索分数中最小值;max(score_es)表示当前所有检索分数中最大值。
进一步的,所述步骤4包括:
步骤4.1、取出序列L=<l1,l2,l3,…,ln>中第一个结果l1进行判断:并设置置信度判断的可信度阈值t,当置信度小于可信阈值t时,给出l1,l2,l3,l4,l5提示让用户选择或再次输入,当置信度大于可信阈值t则进入下一步判断逻辑;
步骤4.2、判断标准问l1是简单单轮问答还是复杂多轮问答,判断结果如果是“简单单轮问答”时,直接给出知识库中配置的答案即可,并结束本轮对话,等待用户再次输入;
步骤4.3、当判断结果为“复杂多轮问答”类型时,根据ID则查询对应的多轮库R,检索到对应的多轮问答,对用户进行提示等待用户再次选择或输入,进入多轮问答树的下一个子节点并重复步骤3直到多轮问答树节点被遍历到叶子节点,直至完成会话状态。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
(1)本发明采用ES检索意图候选集C,再通过transform类预训练模型直接计算用户问题Q与候选集C之间的相似度分数,结合各阶段评分最终做出意图I的确定,此方案抛弃了直接文本分类的方法,采用预训练模型+候选集相似计算提升了泛化能力、准确率。
(2)本发明使用的方法仅需人工总结对应的标准问-相似问对关系即可,标准问与相似问为一对多关系,此方法可节约大量人工,仅使用标准问-相似问与部分外域属于即可构建一个包含正反例的完整数据集从而获得对应的语义模型。
(3)使用transformer类语义模型替换分类模型,实现问题识别准确率提升、同时降低人工语料库依赖度。
(4)通过引入级联式搜索,综合评分排序等方法提升单轮会话和多轮会话的准确性,并在一定程度上提升了应答引擎的泛化能力,同时支撑意图式应答模式,较大程度降低机器人对人工知识库语料数量的依赖。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明中对话机器人应答流程图;
图2是实施例中多轮问答树的示意图。
名词解释
ES:全称是Elasticsearch,供了一个分布式多用户能力的全文搜索引擎。
检索库E:将知识库导入ES后形成的应答引擎检索基础库。
知识库K:由运营人员准备的应答引擎只是储备库,包含用户可能提到的常用语、标准问、相似问、对应回答、多轮回答关系等数据。
多轮库R:对于复杂的对话逻辑,单单理解用户的提问意图不足以给出满意的回答,可能存在多次对话才能解答的问题称为多轮对话,对应的知识库为多轮库。
Redis:Redis(Remote Dictionary Server),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。
置信度:应答引擎最终识别用户是哪种意图的表达值(0~1概率值),越接近1表明应答引擎对当前回答越确信,反之不确定。在本发明中用于对话策略调整。
置信度补充解释:本发明中置信度=最终的综合评分,是一个0~1的概率值,表明当前应答引擎对用户输入意图的确定性,如果置信度大于可信阈值t(0.8)表明非常确定,此时直接推送相关答案给用户;如果置信度小于可信阈值但大于不确定阈值,则推送给用户推荐问,确认用户想问什么;如果置信度小于不确定阈值则告诉用户未识别用户问的问题,请重新提问。
Transformer语义模型:bert或者xlnet+attention两种模型的统称。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合图1~图2对本发明作详细说明。
1.一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,包括如下步骤:
步骤1:构建标准问-相似问知识库、标准意图-相似意图知识库和多轮问答树,并将以上结果整合成知识库K;
所述知识库K=标准问+标准答+相似问+多轮库,知识库构建是由人工完成,包含的内容是文档中的结构化数据。
本实施例中,与传统知识库类似,主要包含业务场景中可能出现的标准问-相似问,所述标准问-相似问对知识库和标准意图-相似意图知识库由知识库系统配置或者是由excel文档配置,示例如下:
标准问 相似问
车贷如何还款 开正车贷如何还款
车贷如何还款 车多多如何还款
车贷如何还款 创富车贷怎么还
车贷如何还款 易鑫还款
车贷如何还款 有利网车贷怎么还
车贷如何还款 微贷网车贷怎么还
车贷如何还款 瓜子车如何还款
车贷如何还款 毛豆车贷如何还款
同理也应当有标准问对应的标准问答:
Figure BDA0003141515060000051
Figure BDA0003141515060000061
本实施例中,如图1所示,所述多轮问答树采用树形数据结构,是由标准问或标准意图触发的一种对话模式。
步骤2:利用知识库K内容构建正反例数据集,分别训练标准问语义模型和意图语义模型得到模型M1和M2,同时将知识库K按行导入ES得到检索库E,将所有多轮问答树导入redis得到多轮库R;
进一步的,所述步骤2包括:
步骤2.1、构建正反例数据集,标准问-相似问为一对句子记作标签0集合,非标准问-相似问组合的句子堆记作标签1集合,混合两种标签所有数据得到最终数据集,根据数据集使用bert或者xlnet+attention的方式训练语义模型M1,M2,使用transformer类语义模型替换分类模型,实现问题识别准确率提升、同时降低人工语料库依赖度;
步骤2.2、将知识库K数据导入搭建好的ES集群中,为候选集检索做好准备,将多轮对话树保存为json格式,导入redis中,与ES中的查询语句以一个唯一键ID做关联。
进一步的,所述步骤3包括:
步骤3:当系统接收到用户问题Q,查询检索库E得到最可能N个标准问候选集C=<c1,c2,c3,…,cn>与候选集得分集合,将标准问候选集与用户问题Q送入标准问语义模型计算相似度,得到相似度分数集合S=<s1,s2,s3,…,sn>,随后整合候选集得分集合与相似度得分集合,得到综合评分,对综合评分进行置信度计算并根据置信度进行排序,得到序列L=<l1,l2,l3,…,ln>,进入下一个步骤;
步骤3.1、当用户通过前端页面向机器人发起提问,获得请求Q,首先使用Q进行基本处理后,输入ES进行查询TOP K个最有可能的标准问题,查询得到候选集C=<c1,c2,c3,…,ck>与候选集得分集合;
步骤3.2、将候选集与用户问题Q组装为【Q-C】的形式请求标准问语义模型计算相似度,将会得到K个相似分数,得到相似度分数集合;随后整合候选集得分集合与相似度得分集合,得到综合评分。
其中,综合评分的计算方法包括加权平均求和:Rn=w1*cn+w2*sn,需满足w1+w2=1,其中w1、w2分别表示ES检索分数和语义模型相似度的权重比值;cn、sn分别表示对应的ES检索分数和语义相似度分数,对ES查询的候选集得分集合做一次归一化处理,最终得到置信度集合,并从大到小进行排序,得到序列L=<l1,l2,l3,…,lk>,归一化处理计算公式如下:
Figure BDA0003141515060000071
其中scorei表示归一化的分数;score_esi表示当前问题的es检索分数;min(score_es)表示当前所有检索分数中最小值;max(score_es)表示当前所有检索分数中最大值。
步骤4:根据排序后的序列L=<l1,l2,l3,…,ln>,取出第一个元素l1进行置信度判断;根据置信度判断的结果分别进行策略回答,直至完成会话状态;
进一步的,所述步骤4包括:
步骤4.1、取出序列L=<l1,l2,l3,…,ln>中第一个结果l1进行判断:并设置置信度判断的可信度阈值t,当置信度小于可信阈值t时,给出l1,l2,l3,l4,l5提示让用户选择或再次输入,当置信度大于可信阈值t则进入下一步判断逻辑;
步骤4.2、判断标准问l1是简单单轮问答还是复杂多轮问答,判断结果如果是“简单单轮问答”时,直接给出知识库中配置的答案即可,并结束本轮对话,等待用户再次输入;
步骤4.3、当判断结果为“复杂多轮问答”类型时,根据ID则查询对应的多轮库R,检索到对应的多轮问答,对用户进行提示等待用户再次选择或输入,进入多轮问答树的下一个子节点并重复步骤3直到多轮问答树节点被遍历到叶子节点,直至完成会话状态。
本发明公开了一种基于级联式搜索的对话机器人应答引擎实现方法,基于Q->I的过程做主要优化,通过采用ES检索意图候选集C,再通过transform类预训练模型直接计算用户问题Q与候选集C之间的相似度分数,结合各阶段评分最终做出意图I的确定。此方案抛弃了直接文本分类的方法,采用预训练模型+候选集相似计算提升了泛化能力、准确率;通过使用标准问-相似问与部分外域属于即可构建一个包含正反例的完整数据集从而获得对应的语义模型,仅需人工总结对应的标准问-相似问对关系即可,标准问与相似问为一对多关系,可节约大量人工。
本发明采用ES检索意图候选集C,再通过transform类预训练模型直接计算用户问题Q与候选集C之间的相似度分数,结合各阶段评分最终做出意图I的确定,此方案抛弃了直接文本分类的方法,采用预训练模型+候选集相似计算提升了泛化能力、准确率。
本发明使用的方法仅需人工总结对应的标准问-相似问对关系即可,标准问与相似问为一对多关系,此方法可节约大量人工,仅使用标准问-相似问与部分外域属于即可构建一个包含正反例的完整数据集从而获得对应的语义模型。
通过引入级联式搜索,综合评分排序等方法提升单轮会话和多轮会话的准确性,并在一定程度上提升了应答引擎的泛化能力,同时支撑意图式应答模式,较大程度降低机器人对人工知识库语料数量的依赖。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (7)

1.一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,包括如下步骤:
步骤1:构建标准问-相似问知识库、标准意图-相似意图知识库和多轮问答树,并将以上结果整合成知识库K;
步骤2:利用知识库K内容构建正反例数据集,分别训练标准问语义模型和意图语义模型得到模型M1和M2,同时将知识库K按行导入ES得到检索库E,将所有多轮问答树导入redis得到多轮库R;
步骤3:当系统接收到用户问题Q,查询检索库E得到最可能N个标准问候选集C=<c1,c2,c3,…,cn>与候选集得分集合,将标准问候选集与用户问题Q送入标准问语义模型计算相似度,得到相似度分数集合S=<s1,s2,s3,…,sn>,随后整合候选集得分集合与相似度得分集合,得到综合评分,对综合评分进行置信度计算并根据置信度进行排序,得到序列L=<l1,l2,l3,…,ln>,进入下一个步骤;
步骤4:根据排序后的序列L=<l1,l2,l3,…,ln>,取出第一个元素l1进行置信度判断;根据置信度判断的结果分别进行策略回答,直至完成会话状态。
2.根据权利要求1所述的一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,所述多轮问答树采用树形数据结构,是由标准问或标准意图触发的一种对话模式。
3.根据权利要求1所述的一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,所述标准问-相似问对知识库和标准意图-相似意图知识库由知识库系统配置或者是由excel文档配置。
4.根据权利要求1所述的一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,所述步骤2包括:
步骤2.1、构建正反例数据集,标准问-相似问为一对句子记作标签0集合,非标准问-相似问组合的句子堆记作标签1集合,混合两种标签所有数据得到最终数据集;
据集,根据数据集使用bert或者xlnet+attention的方式训练语义模型M1,M2;
步骤2.2、将知识库K数据导入搭建好的ES集群中,为候选集检索做好准备,将多轮对话树保存为json格式,导入redis中,与ES中的查询语句以一个唯一键ID做关联。
5.根据权利要求1所述的一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,所述步骤3包括:
步骤3.1、当用户通过前端页面向机器人发起提问,获得请求Q,首先使用Q进行基本处理后,输入ES进行查询TOP K个最有可能的标准问题,查询得到候选集C=<c1,c2,c3,…,ck>与候选集得分集合;
步骤3.2、将候选集与用户问题Q组装为【Q-C】的形式请求标准问语义模型计算相似度,将会得到K个相似分数,得到相似度分数集合;随后整合候选集得分集合与相似度得分集合,得到综合评分。
6.根据权利要求5所述的一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,综合评分的计算方法包括加权平均求和:Rn=w1*cn+w2*sn,需满足w1+w2=1,其中w1、w2分别表示ES检索分数和语义模型相似度的权重比值;cn、sn分别表示对应的ES检索分数和语义相似度分数,对ES查询的候选集得分集合做一次归一化处理,最终得到置信度集合,并从大到小进行排序,得到序列L=<l1,l2,l3,…,lk>,归一化处理计算公式如下:
Figure FDA0003141515050000021
其中scorei表示归一化的分数;score_esi表示当前问题的es检索分数;min(score_es)表示当前所有检索分数中最小值;max(score_es)表示当前所有检索分数中最大值。
7.根据权利要求5所述的一种基于级联式搜索的对话机器人应答引擎实现方法,其特征在于,所述步骤4包括:
步骤4.1、取出序列L=<l1,l2,l3,…,ln>中第一个结果l1进行判断:并设置置信度判断的可信度阈值t,当置信度小于可信阈值t时,给出l1,l2,l3,l4,l5提示让用户选择或再次输入,当置信度大于可信阈值t则进入下一步判断逻辑;
步骤4.2、判断标准问l1是简单单轮问答还是复杂多轮问答,判断结果如果是“简单单轮问答”时,直接给出知识库中配置的答案即可,并结束本轮对话,等待用户再次输入;
步骤4.3、当判断结果为“复杂多轮问答”类型时,根据ID则查询对应的多轮库R,检索到对应的多轮问答,对用户进行提示等待用户再次选择或输入,进入多轮问答树的下一个子节点并重复步骤3直到多轮问答树节点被遍历到叶子节点,直至完成会话状态。
CN202110735644.5A 2021-06-30 2021-06-30 一种基于级联式搜索的对话机器人应答引擎实现方法 Active CN113569022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110735644.5A CN113569022B (zh) 2021-06-30 2021-06-30 一种基于级联式搜索的对话机器人应答引擎实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110735644.5A CN113569022B (zh) 2021-06-30 2021-06-30 一种基于级联式搜索的对话机器人应答引擎实现方法

Publications (2)

Publication Number Publication Date
CN113569022A CN113569022A (zh) 2021-10-29
CN113569022B true CN113569022B (zh) 2023-06-09

Family

ID=78163167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110735644.5A Active CN113569022B (zh) 2021-06-30 2021-06-30 一种基于级联式搜索的对话机器人应答引擎实现方法

Country Status (1)

Country Link
CN (1) CN113569022B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110162611A (zh) * 2019-04-23 2019-08-23 苏宁易购集团股份有限公司 一种智能客服应答方法及系统
CN110362665A (zh) * 2019-06-12 2019-10-22 深圳追一科技有限公司 一种基于语义相似度的问答系统及方法
CN110765257A (zh) * 2019-12-30 2020-02-07 杭州识度科技有限公司 一种知识图谱驱动型的法律智能咨询系统
CN111324689A (zh) * 2020-03-03 2020-06-23 中国平安人寿保险股份有限公司 问答系统的索引更新方法、装置、设备及存储介质
EP3832485A1 (en) * 2019-12-02 2021-06-09 Koninklijke Philips N.V. Question answering systems

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019153522A1 (zh) * 2018-02-09 2019-08-15 卫盈联信息技术(深圳)有限公司 智能交互方法、电子装置及存储介质
CN110162611A (zh) * 2019-04-23 2019-08-23 苏宁易购集团股份有限公司 一种智能客服应答方法及系统
CN110362665A (zh) * 2019-06-12 2019-10-22 深圳追一科技有限公司 一种基于语义相似度的问答系统及方法
EP3832485A1 (en) * 2019-12-02 2021-06-09 Koninklijke Philips N.V. Question answering systems
CN110765257A (zh) * 2019-12-30 2020-02-07 杭州识度科技有限公司 一种知识图谱驱动型的法律智能咨询系统
CN111324689A (zh) * 2020-03-03 2020-06-23 中国平安人寿保险股份有限公司 问答系统的索引更新方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于NLP的高校财务咨询问答原型系统设计与实现;高天飞;中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑(第03期);H131-78 *
智能咨询机器人在实时虚拟参考咨询中的应用――以西安理工大学图书馆为例;靳秀敏;王俪凝;;晋图学刊(第06期);12-17 *

Also Published As

Publication number Publication date
CN113569022A (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
CN117033608B (zh) 一种基于大语言模型的知识图谱生成式问答方法及系统
CN115238101B (zh) 一种面向多类型知识库的多引擎智能问答系统
CN111125334B (zh) 一种基于预训练的搜索问答系统
US9582757B1 (en) Scalable curation system
CN114036281B (zh) 基于知识图谱的柑橘管控问答模块构建方法及问答系统
CN110008308B (zh) 针对用户问句补充信息的方法和装置
CN108763355B (zh) 一种基于用户的智能机器人交互数据处理系统及方法
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN112463949B (zh) 数据召回方法与系统、交互方法及交互系统
CN114003709A (zh) 一种基于问句匹配的智能问答系统和方法
CN114756663A (zh) 一种智能问答方法、系统、设备及计算机可读存储介质
CN114860916A (zh) 知识检索方法及装置
CN117370580A (zh) 一种基于知识图谱增强大语言模型双碳领域服务方法
CN114328880A (zh) 一种用于汽车领域的智能问答方法及系统
CN109684357B (zh) 信息处理方法及装置、存储介质、终端
CN113569022B (zh) 一种基于级联式搜索的对话机器人应答引擎实现方法
CN112749263A (zh) 一种基于单个问题的多轮答案生成系统
CN111651554A (zh) 基于自然语言理解及处理的保险问答回答的方法和装置
CN116108141A (zh) 一种面试场景下的相似问句检索机制
CN108959327B (zh) 一种业务处理方法、装置及计算机可读存储介质
CN113128231A (zh) 一种数据质检方法、装置、存储介质和电子设备
CN111581327A (zh) 一种行政执法辅助方法和装置
CN111291248A (zh) 一种基于智能坐席知识库的搜索方法及系统
CN115810422B (zh) 基于ai技术的互联网智能自动诊疗应答系统
CN113297361B (zh) 一种基于可视化流程图的智能问答交互系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant