CN116450855A - 基于知识图谱的问答机器人的回复生成策略方法及系统 - Google Patents
基于知识图谱的问答机器人的回复生成策略方法及系统 Download PDFInfo
- Publication number
- CN116450855A CN116450855A CN202310720421.0A CN202310720421A CN116450855A CN 116450855 A CN116450855 A CN 116450855A CN 202310720421 A CN202310720421 A CN 202310720421A CN 116450855 A CN116450855 A CN 116450855A
- Authority
- CN
- China
- Prior art keywords
- question
- answer
- answering
- topic
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000011156 evaluation Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 23
- 230000004927 fusion Effects 0.000 claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 19
- 238000013441 quality evaluation Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 8
- 230000008520 organization Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱的问答机器人的回复生成策略方法及系统,涉及智能机器人技术领域。该方法包括:获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行分析识别,确定用户意图;根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并进行会话策略规则学习,针对不同类型的问答机器人设定不同答句生成引擎,生成对应的答句;根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,返回最终回复答案给用户。本发明可对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。
Description
技术领域
本发明涉及智能机器人技术领域,具体而言,涉及一种基于知识图谱的问答机器人的回复生成策略方法及系统。
背景技术
智能问答机器人是一种基于自然语言处理技术的智能人机交互系统,可以根据用户提出的自然语言问句进行语义理解、知识检索并将答案以自然语言形式返回给用户。随着人工智能技术的不断发展和深度学习算法的普及,智能问答机器人的技术也得到了大幅度的提升,其适用的业务场景也越来越广泛。此外,领域知识图谱以其强大的开放互联和语义表示能力为智能咨询、智能导诊等智能化服务提供知识支撑,在智慧医疗、智慧金融等业务领域中发挥基础性作用。此外,随着智能语音助手的发展,智能问答机器人还可以与语音助手相结合,实现更加智能化的服务。
虽然基于知识图谱的智能问答机器人已取得了显著的进展和广泛应用,但由于用户问句表达多样性和业务场景复杂性,面向垂直领域的问答机器人可用性仍然较差,问答效果受到多种因素的影响。现有问答机器人的问题解析能力仍然较差,尤其是在解析时带入ASR识别结果错误导致预制对话流程无法正常进行。问题经过解析后,单一流程控制的问答机器人通过各类检索、推理分析手段得到的答案可能存在语法、逻辑、语义等方面的错误,导致生成的答案语义稀疏、质量参差不齐等复杂情况。此时问答机器人在考虑了上述情况下,采取何种策略对回复答案进行排序和生成,即如何生成最优回复答案尤为重要。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明提供一种基于知识图谱的问答机器人的回复生成策略方法及系统,可对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。
为解决上述技术问题,本发明采用的技术方案为:
第一方面,本发明提供一种基于知识图谱的问答机器人的回复生成策略方法,包括以下步骤:
获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;
根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;
根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
本发明提供了面向特定领域的复杂问句深度理解方法,实现针对用户复杂问句的语义分析、主题识别及用户意图理解,面向复杂结构问句实现结构分解和类型划分,突破了现有技术问题解析能力限制,精准理解用户在不同业务场景下用户多方面需求;本发明还提供了基于策略学习的多引擎答句生成方法,通过策略学习算法生成面向多种用户意图、多类型用户问句的最优会话策略,设计多种面向不同业务需求的问答机器人,基于多种答句生成引擎针对性解决各种业务需求,解决了现有技术单一控制流程下对用户意图响应不准确、不全面的问题;在此基础上,本发明还提供了面向信息融合的答案排序与组织方法,通过对多个自然语言答句进行语义融合、冲突消解和答案评估,实现多个答案之间信息互补与交叉验证,为用户提供完整的答句,全面覆盖用户所有业务需求,并根据答案质量和重要程度进行评估和排序。
基于第一方面,进一步地,上述对用户问句进行语义信息分析、主题分类以及主题意图识别方法包括以下步骤:
对用户问句进行识别,识别用户问句中包含的实体,并进行依存句法分析得到核心依存树;
根据实体数量进行问句类型划分,划分为无实体问句、单实体问句或多实体问句;
针对多实体问句进行语义结构分类,对主从类、并列类、关系类多种问句结构进行拆解,得到问句序列;
基于BERT-CNN算法对问句序列分别进行主题与意图识别。
基于第一方面,进一步地,上述结合用户意图生成对应的答句的方法包括以下步骤:
输入问句序列、实体列表、依存树列表、问句主题及用户意图,基于关键实体和主题意图在主题知识图谱上进行实体链接、相关路径检索、子图匹配,以确定会话策略规则;
基于会话策略规则选择最优问答机器人子集;
输出问答机器人回答子句集合。
基于第一方面,进一步地,上述基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习的方法包括以下步骤:
输入问答训练集中所有问答对,针对问句进行实体分析和主题提取;
针对相关实体,在主题知识图谱上进行实体链接和相关路径查询;
通过预置的评价算法评价并根据各个引擎对每种类别的问题检索答案的满意度,初步确定策略中各个引擎的调用顺序;
为已确定调用顺序的引擎设置一个阈值,并利用随后调用的引擎的阈值不断提高调用的序列中第一个引擎的阈值,最后为第一个引擎确定一个最终阈值;
保存问答机器人策略学习后得到的会话策略,构建会话策略库。
基于第一方面,进一步地,该基于知识图谱的问答机器人的回复生成策略方法还包括以下步骤:
A1、根据问题的预期类别以及通过会话策略规则学习得到的会话策略,为输入的查询问题选择对应的问答机器人策略;
A2、按照问答机器人策略中确定的顺序依次调用每个问答机器人引擎;
A3、通过问答机器人策略中调用的第一个引擎检索答案;
A4、判断当前检索到的答句是否符合条件,若符合,则终止,选择当前引擎;若不符合,则进入步骤A5;
A5、调用第二个引擎,合并第一个引擎和第二个引擎检索得到的答案,形成新的答案列表,进行步骤A4,直至检索出的答案列表中排名第一的答案的置信度超过第一个引擎的阈值,或者策略中再没有可调用的其它引擎。
基于第一方面,进一步地,上述根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户的方法包括以下步骤:
B1、输入多个不同类型的机器人生成的答句列表,计算答句列表中各个答案子句间的相似度;
B2、基于各个答案子句间的相似度和预设的相似度阈值判断答案子句中是否包含重复信息,若不包含,则将所有答案子句拼接,进入步骤B4;若包含,则进入步骤B3;
B3、对对应重复的答案子句进行语义融合,实现答案去重;
B4、检测所有答案子句是否存在同一实体同一属性信息的情况,若存在,则进入步骤B5;反之,则进入步骤B6;
B5、基于预定义的冲突消解规则对对应的答案子句进行冲突处理;
B6、对进行答案去重和冲突处理后的所有答案子句进行答句质量评估,生成答句质量评估结果;
B7、根据答句质量评估结果,对所有答案子句进行排序和重新组织,以输出并返回最终回复答案给用户。
第二方面,本发明提供一种基于知识图谱的问答机器人的回复生成策略系统,包括问句语义分析模块、机器人会话策略生成模块以及答句排序与组织生成模块,其中:
问句语义分析模块,用于获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;
机器人会话策略生成模块,用于根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;
答句排序与组织生成模块,用于根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
本系统通过问句语义分析模块、机器人会话策略生成模块以及答句排序与组织生成模块等多个模块的配合,对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。
第三方面,本申请提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器;当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。
本发明至少具有如下优点或有益效果:
本发明提供一种基于知识图谱的问答机器人的回复生成策略方法及系统,可对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一种基于知识图谱的问答机器人的回复生成策略方法的流程图;
图2本发明实施例中设计的面向特定领域的复杂问句深度理解方法流程图;
图3为本发明实施例中主题意图识别算法的模型图;
图4为本发明实施例中会话策略执行流程图;
图5为本发明实施例中基于LSTM网络的自然语言答句生成模型图;
图6为本发明实施例中设计的面向信息融合的答案排序与组织方法流程图;
图7为本发明实施例提供的一种电子设备的结构框图。
附图标记说明:101、存储器;102、处理器;103、通信接口。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本发明实施例的描述中,“多个”代表至少2个。
实施例
如图1所示,第一方面,本发明实施例提供一种基于知识图谱的问答机器人的回复生成策略方法,包括以下步骤:
获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;
根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;
根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
本发明提供了面向特定领域的复杂问句深度理解方法,实现针对用户复杂问句的语义分析、主题识别及用户意图理解,面向复杂结构问句实现结构分解和类型划分,突破了现有技术问题解析能力限制,精准理解用户在不同业务场景下用户多方面需求;本发明还提供了基于策略学习的多引擎答句生成方法,通过策略学习算法生成面向多种用户意图、多类型用户问句的最优会话策略,设计多种面向不同业务需求的问答机器人,基于多种答句生成引擎针对性解决各种业务需求,解决了现有技术单一控制流程下对用户意图响应不准确、不全面的问题;在此基础上,本发明还提供了面向信息融合的答案排序与组织方法,通过对多个自然语言答句进行语义融合、冲突消解和答案评估,实现多个答案之间信息互补与交叉验证,为用户提供完整的答句,全面覆盖用户所有业务需求,并根据答案质量和重要程度进行评估和排序。
基于第一方面,进一步地,上述对用户问句进行语义信息分析、主题分类以及主题意图识别方法包括以下步骤:
对用户问句进行识别,识别用户问句中包含的实体,并进行依存句法分析得到核心依存树;
根据实体数量进行问句类型划分,划分为无实体问句、单实体问句或多实体问句;
针对多实体问句进行语义结构分类,对主从类、并列类、关系类多种问句结构进行拆解,得到问句序列;
基于BERT-CNN算法对问句序列分别进行主题与意图识别。
参见图2和图3,本发明设计的面向特定领域的复杂问句深度理解方法,对用户提出的问句(特别是蕴含丰富语义信息的复杂问题)进行语义信息提取,进而准确分析用户意图。该技术方案主要包括问句语义分析、问句主题分类和用户意图识别三个部分。
问句语义分析,对输入的自然语言问句进行实体识别、依存句法分析及问句结构分解,对问句进行初步信息提取与补全,并针对实体数量与问句类型实现复杂问题的划分与多个子句间逻辑关系的分析。
算法1:并列实体属性类问句分解算法
输入:实体列表,|Ei|为实体总数,输入问句Sc,核心依存树Ti,常数k=1
输出:单实体属性类问句列表Qi
抽取问句Sc在Ti中位于实体ei1前面的成分p1;
抽取问句Sc在Ti中位于实体ei1前面的成分p2
whilek<|E
Step1:使用公式qik=p1⊕eik⊕p2更新Q1i;
Step2:使用公式k=k+1更新k;
endwhile
return:单实体属性类问句列表Q1
算法2:多实体关系类问句分解算法
输入:实体列表,|Ei|为实体总数,输入问句Sc,核心依存树Ti,常数k=1
输出:双实体关系类问句列表Q2i
抽取核心实体ec(通常为ei1或eiEi|);
抽取问句Sc在Ti中位于实体ei1前面的成分p1
抽取问句Sr在Ti中位于实体ei1与实体ei2或实体ei|Ei|-1与实体ei|Ei|之间的成分p2
抽取问句S在Ti中位于实体ei|Ei|后面的成分p3
whilek<|Ei|-1do
Step1:使用公式qik=p1⊕ec⊕p2⊕eik⊕p3更新Q2i
Step2:使用公式k=k+1更新k;
endwhile
return:双实体关系类问句列表Q2i
问句主题识别,对经过分解后的自然语言问句进行关键词提取和主题分类,其目的是在后续知识查询和信息检索中便于相应问答机器人在主题知识图谱中精准匹配相关子图并。由于问句表述复杂性和多样性,用户提出的一条问句中可能包含多个询问主题,通过对用户问句结构拆解和逻辑类型分析实现多意图问句分解。由于BERT预训练模型的优秀特征提取能力,本发明采用基于BERT-CNN的主题意图识别算法,参见图3。BERT模型由一个Embedding层和12个Transformer模型堆叠成的隐藏层来实现,每一层的输出会作为下一层的输入进行计算,因此BERT模型的每一层隐藏层参数往往会包含输入文本的不同层次特征信息。在BERT模型的基础上,本方案将最后四层隐藏层参数进行拼接来做为TextRCNN模型的输入以提高整个模型的特征提取能力。
基于第一方面,进一步地,上述结合用户意图生成对应的答句的方法包括以下步骤:
输入问句序列、实体列表、依存树列表、问句主题及用户意图,基于关键实体和主题意图在主题知识图谱上进行实体链接、相关路径检索、子图匹配,以确定会话策略规则;
基于会话策略规则选择最优问答机器人子集;
输出问答机器人回答子句集合。
基于第一方面,进一步地,上述基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习的方法包括以下步骤:
输入问答训练集中所有问答对,针对问句进行实体分析和主题提取;
针对相关实体,在主题知识图谱上进行实体链接和相关路径查询;
通过预置的评价算法评价并根据各个引擎对每种类别的问题检索答案的满意度,初步确定策略中各个引擎的调用顺序;
为已确定调用顺序的引擎设置一个阈值,并利用随后调用的引擎的阈值不断提高调用的序列中第一个引擎的阈值,最后为第一个引擎确定一个最终阈值;
保存问答机器人策略学习后得到的会话策略,构建会话策略库。
本发明设计基于策略学习的多引擎答句生成方法,由会话策略学习、会话策略执行、多引擎智能答句生成三部分组成。
本方案提出的会话策略学习算法具体步骤如下:
输入训练问答数据集中所有问答对,针对问句进行实体分析和主题提取;相关实体在主题知识图谱上进行实体链接和相关路径查询;答案排序:通过预置的评价算法评价并根据各个引擎对每种类别的问题检索答案的满意度,初步确定策略中各个引擎的调用顺序;生成阈值:为已确定顺序的序列中的相关引擎均设置一个合适的阈值,其思想是利用随后调用的引擎的阈值不断提高调用的序列中第一个引擎的阈值,最后为该引擎确定一个最终阈值,使得该引擎检索出来的答案的准确度更高。保存问答机器人执行的会话策略,进入会话策略库。上述满意度是指每个引擎生成的答案与标准答案相比的准确率,准确度也高满意度则越高;本发明采用的评价算法是比较每个引擎生成答案在标准答案中的个数/问题总数。首先让训练集中的每个问题都通过所有的引擎,以获得每个引擎返回每个问题的前5个答案构成一个标准答案矩阵,对每个引擎生成的答案如果在标准答案矩阵中则认为是正确。最终统计每类引擎生成正确答案的准确率,作为引擎调用顺序的评价标准。
系统通过策略学习得到会话策略库后,策略选择与策略库相连接,根据在问句理解阶段确定的问题的预期类别从策略库中为每个查询问题选择一种合适的策略,按照选择的策略中确定的顺序依次调用序列中的每个引擎,通过检测系统检索出来的候选答案的置信度是否满足所选策略中第一个引擎的阈值条件,决定是否调用其它引擎并确定符合条件的答案。
基于第一方面,进一步地,该基于知识图谱的问答机器人的回复生成策略方法还包括以下步骤:
A1、根据问题的预期类别以及通过会话策略规则学习得到的会话策略,为输入的查询问题选择对应的问答机器人策略;
A2、按照问答机器人策略中确定的顺序依次调用每个问答机器人引擎;
A3、通过问答机器人策略中调用的第一个引擎检索答案;
A4、判断当前检索到的答句是否符合条件,若符合,则终止,选择当前引擎;若不符合,则进入步骤A5;
A5、调用第二个引擎,合并第一个引擎和第二个引擎检索得到的答案,形成新的答案列表,进行步骤A4,直至检索出的答案列表中排名第一的答案的置信度超过第一个引擎的阈值,或者策略中再没有可调用的其它引擎。
参见图4,本方案提出的会话策略执行算法具体步骤如下:
根据问题的预期类别以及系统通过策略学习得到的策略,为输入的查询问题选择一种合适的问答机器人策略;按照策略中确定的顺序依次调用每个问答机器人引擎;通过策略中调用的第一个引擎检索答案;判断当前答句是否若符合条件,符合,则终止,选择当前引擎;若不符合,进入步骤A5,调用的第二个引擎,合并第一个和第二个引擎检索得到的答案,形成新的答案列表,进入步骤A4,检索出的答案列表中排名第一的答案的置信度超过第一个引擎的阈值,或者策略中再没有可调用的其它引擎。
上述步骤A5中合并答案列表置信度具体计算过程如下:
当第i个引擎返回一个答案列表时,将它与前i-1个引擎返回的答案列表合并,形成一个新的答案列表
对Ai中答案的置信度进行归一化;
对Ai和Ai-1中均出现的答案,修改其置信度:
针对不同工作类型的问答机器人,本发明设计疾病实体查询类、科室实体查询类、药品推荐类、政策查询类、政策确认类等12种智能答句生成引擎。当会话策略选择相应问答机器人后,利用对应答句生成引擎进行知识查询与自然语言生成。
针对实体查询类问答机器人,本方案采用语义查询构造算法,根据问句语义依存关系在主题知识图谱上进行查询,并生成语义查询图,确保相关信息被正确检索。语义查询构造具体算法为:
输入:问句子句Qij,依存关系列表DepList
输出:语义查询图SemGraph
for每个td∈tdl
iftd表示的关系=ROOTthen
返回td的dep依赖者
iftd的dep不是疑问词或者be动词then
edge=td.dep
调用主语和宾语识别方法
iftd的dep是疑问词then
for每个td∈tdl
EndFor
iftd表示的关系=nmodthen
edge=td.gov
实体(语义主语)=td.dep
实体(语义宾语)=x
EndFor
针对政策类问答机器人,由于其文本答句通常由长文本构成,本方案采用基于LSTM的自然语言生成算法,在原始结构的基础上叠加多个LSTM单元,增加了生成器在空间和时间上的深度。参见图5,将问句理解识别的用户意图作为输入送入LSTM网络,将跳跃连接应用于所有隐藏层的输入以及所有隐藏层与输出之间的连接,可以减少网络底部和顶部之间的处理步骤,从而在垂直方向上缓解了消失梯度问题。
基于第一方面,进一步地,上述根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户的方法包括以下步骤:
B1、输入多个不同类型的机器人生成的答句列表,计算答句列表中各个答案子句间的相似度;
B2、基于各个答案子句间的相似度和预设的相似度阈值判断答案子句中是否包含重复信息,若不包含,则将所有答案子句拼接,进入步骤B4;若包含,则进入步骤B3;
B3、对对应重复的答案子句进行语义融合,实现答案去重;
B4、检测所有答案子句是否存在同一实体同一属性信息的情况,若存在,则进入步骤B5;反之,则进入步骤B6;
B5、基于预定义的冲突消解规则对对应的答案子句进行冲突处理;
B6、对进行答案去重和冲突处理后的所有答案子句进行答句质量评估,生成答句质量评估结果;
B7、根据答句质量评估结果,对所有答案子句进行排序和重新组织,以输出并返回最终回复答案给用户。
参见图6,本发明设计面向信息融合的答案排序与组织方法,针对不同智能问答引擎返回的多个答案子句进行信息融合与补全,针对答案中的语义冲突进行检测和处理,确保返回给用户的答案准确且完整。通过对加工后的答案子句集合进行排序和重新组织,为用户提供蕴含丰富语义信息的自然语言答句,进而提升对话效率。本发明设计面向信息融合的答案排序与组织方法具体步骤如下:
输入答案子句列表Ai1,Ai2,..,Aij;计算答案子句间相似度;根据设定阈值,判断答案子句中是否包含重复信息,若不包含,则将所有答案子句拼接,进入步骤B4,检测是否存在同一实体同一属性信息的情况(语义冲突),若存在,进入步骤B5,基于预定义冲突消解规则对存在语义冲突的答案子句进行冲突处理;否则进入步骤B6,对进行去重和冲突消解后的所有子句进行答句质量评估;若包含重复子句,进入步骤B3,对重复句子进行语义信息融合;最终根据答句质量评估结果,对所有子句进行排序和重新组织,返回最终答案。
上述步骤B7中进行答案排序的方法为采用基于ListNet排序学习的答案排序,具体步骤如下:
输入答案子句集合:A1,A2,..,Ai,答案评分记为y1,y2,..,yj;使用基于概率分布的主题相似度计算和关键词相似度计算;将训练集合输入模型,训练集合由特征向量和评分构成;设置模型的迭代次数T以及学习率,并对特征权重向量/>进行初始化;设置两层循环操作,第一层为模型迭代次数,第二层为每次迭代查询的次数,即训练集中问题的总数量;据当前的权重向量/>,将训练集中的特征向量xi输入神经网络计算得到评分zi;使用zi和yi对梯度向量/>进行计算;循环更新特征权重向量/>,输出特征权重向量和评分模型;根据评分结果对答案子句由高到低进行排序,返回排序结果。
第二方面,本发明实施例提供一种基于知识图谱的问答机器人的回复生成策略系统,包括问句语义分析模块、机器人会话策略生成模块以及答句排序与组织生成模块,其中:
问句语义分析模块,用于获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;
机器人会话策略生成模块,用于根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;
答句排序与组织生成模块,用于根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
本系统通过问句语义分析模块、机器人会话策略生成模块以及答句排序与组织生成模块等多个模块的配合,对复杂问句进行精准理解,针对性解决各种业务需求,及时准确且全面的响应用户需求;并进行答案评估与排序,提供更为优质的回复。
如图7所示,第三方面,本申请实施例提供一种电子设备,其包括存储器101,用于存储一个或多个程序;处理器102。当一个或多个程序被处理器102执行时,实现如上述第一方面中任一项的方法。
还包括通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。
其中,存储器101可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请所提供的实施例中,应该理解到,所揭露的方法及系统,也可以通过其它的方式实现。以上所描述的方法及系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的方法及系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器102执行时实现如上述第一方面中任一项的方法。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (9)
1.一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,包括以下步骤:
获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;
根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;
根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
2.根据权利要求1所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述对用户问句进行语义信息分析、主题分类以及主题意图识别方法包括以下步骤:
对用户问句进行识别,识别用户问句中包含的实体,并进行依存句法分析得到核心依存树;
根据实体数量进行问句类型划分,划分为无实体问句、单实体问句或多实体问句;
针对多实体问句进行语义结构分类,对主从类、并列类、关系类多种问句结构进行拆解,得到问句序列;
基于BERT-CNN算法对问句序列分别进行主题与意图识别。
3.根据权利要求2所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述结合用户意图生成对应的答句的方法包括以下步骤:
输入问句序列、实体列表、依存树列表、问句主题及用户意图,基于关键实体和主题意图在主题知识图谱上进行实体链接、相关路径检索、子图匹配,以确定会话策略规则;
基于会话策略规则选择最优问答机器人子集;
输出问答机器人回答子句集合。
4.根据权利要求1所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习的方法包括以下步骤:
输入问答训练集中所有问答对,针对问句进行实体分析和主题提取;
针对相关实体,在主题知识图谱上进行实体链接和相关路径查询;
通过预置的评价算法评价并根据各个引擎对每种类别的问题检索答案的满意度,初步确定策略中各个引擎的调用顺序;
为已确定调用顺序的引擎设置一个阈值,并利用随后调用的引擎的阈值不断提高调用的序列中第一个引擎的阈值,最后为第一个引擎确定一个最终阈值;
保存问答机器人策略学习后得到的会话策略,构建会话策略库。
5.根据权利要求4所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,还包括以下步骤:
A1、根据问题的预期类别以及通过会话策略规则学习得到的会话策略,为输入的查询问题选择对应的问答机器人策略;
A2、按照问答机器人策略中确定的顺序依次调用每个问答机器人引擎;
A3、通过问答机器人策略中调用的第一个引擎检索答案;
A4、判断当前检索到的答句是否符合条件,若符合,则终止,选择当前引擎;若不符合,则进入步骤A5;
A5、调用第二个引擎,合并第一个引擎和第二个引擎检索得到的答案,形成新的答案列表,进行步骤A4,直至检索出的答案列表中排名第一的答案的置信度超过第一个引擎的阈值,或者策略中再没有可调用的其它引擎。
6.根据权利要求1所述的一种基于知识图谱的问答机器人的回复生成策略方法,其特征在于,所述根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户的方法包括以下步骤:
B1、输入多个不同类型的机器人生成的答句列表,计算答句列表中各个答案子句间的相似度;
B2、基于各个答案子句间的相似度和预设的相似度阈值判断答案子句中是否包含重复信息,若不包含,则将所有答案子句拼接,进入步骤B4;若包含,则进入步骤B3;
B3、对对应重复的答案子句进行语义融合,实现答案去重;
B4、检测所有答案子句是否存在同一实体同一属性信息的情况,若存在,则进入步骤B5;反之,则进入步骤B6;
B5、基于预定义的冲突消解规则对对应的答案子句进行冲突处理;
B6、对进行答案去重和冲突处理后的所有答案子句进行答句质量评估,生成答句质量评估结果;
B7、根据答句质量评估结果,对所有答案子句进行排序和重新组织,以输出并返回最终回复答案给用户。
7.一种基于知识图谱的问答机器人的回复生成策略系统,其特征在于,包括问句语义分析模块、机器人会话策略生成模块以及答句排序与组织生成模块,其中:
问句语义分析模块,用于获取并根据问答领域和对应的业务场景特征设计多种问句主题类型和多种意图类型,对用户问句进行语义信息分析、主题分类以及主题意图识别,以确定用户意图;
机器人会话策略生成模块,用于根据多种问句主题类型和多种意图类型设计不同类型问题的问答机器人,并基于预置的问答训练集,结合问句中关键实体在主题知识图谱上的推理路径进行会话策略规则学习,并针对不同类型的问答机器人设定不同答句生成引擎,结合用户意图生成对应的答句;
答句排序与组织生成模块,用于根据多个不同类型的机器人生成的答句进行语义融合、冲突处理和答案排序与评估,以输出并返回最终回复答案给用户。
8.一种电子设备,其特征在于,包括:
存储器,用于存储一个或多个程序;
处理器;
当所述一个或多个程序被所述处理器执行时,实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310720421.0A CN116450855A (zh) | 2023-06-19 | 2023-06-19 | 基于知识图谱的问答机器人的回复生成策略方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310720421.0A CN116450855A (zh) | 2023-06-19 | 2023-06-19 | 基于知识图谱的问答机器人的回复生成策略方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116450855A true CN116450855A (zh) | 2023-07-18 |
Family
ID=87135980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310720421.0A Pending CN116450855A (zh) | 2023-06-19 | 2023-06-19 | 基于知识图谱的问答机器人的回复生成策略方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116450855A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117151122A (zh) * | 2023-10-30 | 2023-12-01 | 湖南三湘银行股份有限公司 | 一种基于自然语言处理的银行客服会话问答处理方法及系统 |
-
2023
- 2023-06-19 CN CN202310720421.0A patent/CN116450855A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117151122A (zh) * | 2023-10-30 | 2023-12-01 | 湖南三湘银行股份有限公司 | 一种基于自然语言处理的银行客服会话问答处理方法及系统 |
CN117151122B (zh) * | 2023-10-30 | 2024-03-22 | 湖南三湘银行股份有限公司 | 基于自然语言处理的银行客服会话问答处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117033608B (zh) | 一种基于大语言模型的知识图谱生成式问答方法及系统 | |
CN111353310B (zh) | 基于人工智能的命名实体识别方法、装置及电子设备 | |
CN110175227B (zh) | 一种基于组队学习和层级推理的对话辅助系统 | |
CN111708873A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN114565104A (zh) | 语言模型的预训练方法、结果推荐方法及相关装置 | |
CN110297893B (zh) | 自然语言问答方法、装置、计算机装置及存储介质 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN112597285B (zh) | 一种基于知识图谱的人机交互方法及系统 | |
CN111027292B (zh) | 一种限定采样文本序列生成方法及其系统 | |
CN112115242A (zh) | 一种基于朴素贝叶斯分类算法的智能客服问答系统 | |
CN115982338A (zh) | 一种基于查询路径排序的领域知识图谱问答方法及系统 | |
CN116450855A (zh) | 基于知识图谱的问答机器人的回复生成策略方法及系统 | |
CN114239828A (zh) | 一种基于因果关系的供应链事理图谱构建方法 | |
CN117932022A (zh) | 一种智能问答方法、装置、电子设备及存储介质 | |
CN116049376B (zh) | 一种信创知识检索回复的方法、装置和系统 | |
CN116737911A (zh) | 基于深度学习的高血压问答方法及系统 | |
CN117290478A (zh) | 一种知识图谱问答方法、装置、设备和存储介质 | |
CN110309857A (zh) | 基于人工智能的图书分类装置、方法、设备及存储介质 | |
CN113869058B (zh) | 基于lc-gcn方面级情感分析方法、系统、存储介质和电子设备 | |
Nguyen et al. | A model of convolutional neural network combined with external knowledge to measure the question similarity for community question answering systems | |
Naghdipour et al. | Ontology-based design pattern selection | |
Okoye | Linked open data: State-of-the-art mechanisms and conceptual framework | |
CN114942981A (zh) | 问答查询方法、装置、电子设备及计算机可读存储介质 | |
Swadia | A study of text mining framework for automated classification of software requirements in enterprise systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230718 |
|
RJ01 | Rejection of invention patent application after publication |