CN115098655A - 一种常见问题解答方法、系统、设备和介质 - Google Patents
一种常见问题解答方法、系统、设备和介质 Download PDFInfo
- Publication number
- CN115098655A CN115098655A CN202210730058.6A CN202210730058A CN115098655A CN 115098655 A CN115098655 A CN 115098655A CN 202210730058 A CN202210730058 A CN 202210730058A CN 115098655 A CN115098655 A CN 115098655A
- Authority
- CN
- China
- Prior art keywords
- similarity
- range
- preset
- nodes
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000003993 interaction Effects 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims description 20
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 102100034761 Cilia- and flagella-associated protein 418 Human genes 0.000 description 1
- 101100439214 Homo sapiens CFAP418 gene Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出一种常见问题解答方法、系统、设备和介质,包括:获取询问文本以及所述询问文本的三元组信息;根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。本申请可极大提高问答交互的输出准确性,增强用户体验。
Description
技术领域
本申请涉及人工智能领域,尤其涉及一种常见问题解答方法、系统、设备和介质。
背景技术
目前智能问答多采用知识库问答的形式,需要提前定义好问答对,将问法中的实体按照倒排索引的方式存入数据库进行检索,最后根据用户问句中提取出的实体进行检索并将检索后的问法与用户的问句进行相似度匹配,返回匹配后的答案。这类问答方式受限于问答对的定义,用户提问方式也会具有一定局限性,进而影响用户体验。
申请内容
鉴于以上现有技术存在的问题,本申请提出一种常见问题解答方法、系统、设备和介质,主要解决现有问答方式问答响应效率低且用户体验较差的问题。
为了实现上述目的及其他目的,本申请采用的技术方案如下。
本申请提供一种常见问题解答方法,包括:
获取询问文本以及所述询问文本的三元组信息;
根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;
将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;
将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
在本申请一实施例中,根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,包括:
将所述询问文本与所述知识库中的标准问句进行相似度比对,得到各标准问句的相似度值;
将所述相似度值作为所述标准问句对应的标准答复文本的相似度值,根据所述相似度值的最大值确定所述第一相似度范围。
在本申请一实施例中,将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围,包括:
根据所述询问文本中的实体信息、所述实体信息之间的关系,构建第一三元组,其中所述第一三元组包括一个或多个;
根据所述询问文本中实体信息、属性以及对应的属性值,构建第二三元组,其中所述第二三元组包括一个或多个;
将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度;
根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度;
根据各实体信息与所述知识图谱的相似度的最大值确定所述第二相似度范围。
在本申请一实施例中,将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度,包括:
获取第一三元组中的实体信息,将所述实体信息与所述知识图谱中的节点进行比对,获取一个或多个达到预设相似度的第一匹配节点作为第一三元组的匹配节点;
获取各所述第一匹配节点的邻接节点,剔除具有连接关系的邻接节点,并将剩余邻接节点组成邻接集合;
将所述第二三元组中的属性值与所述邻接集合中的节点进行相似度比对,获取一个或多个达到预设相似度的第二匹配节点作为所述第二三元组的匹配节点。
在本申请一实施例中,根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度,包括:
预设匹配到实体的权重占比和匹配到属性值的权重占比,将所述权重占比作为对应知识图谱节点的节点匹配权重;
根据所述第一三元组和所述第二三元组中对应同一实体信息的匹配节点的相似度值与对应匹配权重相乘,得到对应实体信息与所述知识图谱的相似度。
在本申请一实施例中,将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,包括:
所述预设相似度范围包括第一预设范围、第二预设范围以及第三预设范围;其中,所述第一预设范围对应的相似度值大于所述第二预设范围对应的相似度值,所述第二预设范围对应的相似度值大于所述第三预设范围对应的相似度值;
若所述第一相似度范围与所述第一预设范围存在交集,则将所述知识库中匹配的标准答复文本作为输出;
若所述第一相似度范围和所述第二相似度范围与所述第一预设范围的交集为空集,且均与所述第二预设范围存在交集,则获取所述知识库中的标准答复文本并按相似度由高到低进行排序,将排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中匹配节点对应的答复文本作为输出;
若所述第一相似度范围和所述第二相似度范围与所述第一预设范围和第二预设范围的交集均为空集,且均与所述第三预设范围存在交集,则将所述知识库中排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中的节点关系作为答复文本输出。
在本申请一实施例中,将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,还包括:
所述第一相似度范围和所述第二相似度范围均低于所述预设相似度范围阈值时,启动闲置对话获取所述知识库中通用问答文本。
在本申请一实施例中,启动闲置对话之后,还包括:
获取所述闲置对话中用户反馈的文本数据;
将所述文本数据与所述知识图谱中的节点进行比对,得到一个或多个关联节点;
根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互。
在本申请一实施例中,根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互,包括:
从所述知识图谱中获取所述关联节点的邻接节点,根据所述关联节点和对应邻接节点的连接关系,生成所述第一问句;
获取所述知识库中与所述第一问句匹配的一个或多个标准问句;
将所述第一问句以及匹配的标准问句输出至用户端。
本申请还提供一种常见问题解答系统,其特征在于,包括:
询问交互模块,用于获取询问文本以及所述询问文本的三元组信息;
知识库检索模块,用于根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;
知识图谱检索模块,用于将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;
决策输出模块,用于将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的常见问题解答方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的常见问题解答系统方法的步骤。
如上所述,本申请一种常见问题解答方法、系统、设备和介质,具有以下有益效果:
本申请通过获取询问文本以及所述询问文本的三元组信息;根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。本申请通过知识库和知识图谱结合进行决策输出,可提高问答响应的准确性,进而提高用户体验。
附图说明
图1为本申请一实施例中常见问题解答装置的结构示意图。
图2为本申请一实施例中常见问题解答实施场景的流程示意图。
图3为本申请一实施例中常见问题解答方法的流程示意图。
图4为本申请一实施例中知识库及知识图谱阈值范围划分示意图。
图5为本申请一实施例中常见问题解答系统的模块图。
图6为本申请一实施例中设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
目前只能问答多采用知识库问答的形式,通过对定义好的问答对进行检索匹配,返回匹配结果,这类问答方式存在以下问题:
1.知识库需要将用户问法全部囊括才能取得较好的效果,且句子长度不能太长,否则计算句子相似度时会影响匹配结果,对问答对要求较高;
2.知识库问法受局限,比如同样类型的问题,“发动机坏了怎么办?”、“雨刷坏了怎么办”、“轮胎坏了怎么办?”等,在知识库中需要将汽车的每个零件对应的故障问法一一列举,效率很低。
本申请提出以下实施例以解决上述现有技术的问题。
请参阅图1,图1提供了本申请一实施例中常见问题解答装置100的结构示意图。图中仅示出了两个终端410-1和终端410-2,也可包括多个终端,各终端通过网络300与服务器200连接。以包含终端410-1和终端410-2为例,访客可选择在终端410-1和终端410-2的任意一个中输入询问文本,将询问文本通过网络300传输至服务器200。数据库500可用于存放知识库和知识图谱。服务器200接收询问文本后,调用数据库500中的知识库和知识图谱进行问题检索以及结果决策输出。终端410-1和终端410-2可包括电脑端、手机、平板、问答机器人等带有显示交互界面的终端设备。网络300可以是广域网或者局域网,又或者是二者的组合。
在另一实施例中,服务器200也可根据终端410-1的请求将数据库500中的知识库和知识图谱输出至终端,由终端进行检索决策输出。
在一实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
在一实施例中,终端410-1也可以直接与终端410-2连接,终端410-1用于获取访客的询问文本,并将询问文本输出至终端410-2进行文本检索获取答复文本。终端410-2用于创建标准问答对,将标准问答对保存于知识库中。终端410-2还可用于创建知识图谱,并将知识图谱保存到本地。
在另一实施例中,也可在终端410-1或终端410-2上完成知识库创建、知识图谱构建以及接收访客输入进行检索等操作。将所有功能集成在一个终端中,用户只需要与一个终端进行交互便可快速获取响应数据。
请参阅图2,图2为本申请一实施例中实施场景的示意图。访客可通过终端提供的聊天页面与终端进行对话交互。访客输入需要咨询的问题后,触发终端的中控引擎将访客的问题通过接口反馈给知识库进行检索比对,知识库中包含的知识领域可根据实际应用需求进行设置,这里以汽车故障类的知识库为例。访客通过聊天界面输入“车子发动机声音异常怎么办”。中控引擎调用汽车故障类知识库中的数据进行问题查询。知识库返回查询结果给中控引擎。同样地,中控引擎也将访客输入问题通过接口传输给知识图谱进行检索分析,得到知识图谱反馈的查询结果。中控引擎基于知识库和知识图谱的查询结果进行仲裁,判断从知识库中输出的问题答复更准确还是从知识图谱中输出的答复更准确,进而将仲裁结果反馈给访客。
请参阅图3,本申请提出一种常见问题解答方法,以应用于前述的常见问题解答装置以及实时场景中,该方法包括以下步骤。
步骤S101,获取询问文本以及所述询问文本的三元组信息。
用户可通过终端提供的交互界面录入询问文本,也可通过语音采集设备等采集用户语音,将语音转换为对应的询问文本。同时提取询问文本中的实体、实体关系、属性等信息构建三元组。
步骤S102,根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成。
在一实施例中,步骤S102中根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,还包括以下步骤:
步骤S1021,将所述询问文本与所述知识库中的标准问句进行相似度比对,得到各标准问句的相似度值;
步骤S1022,将所述相似度值作为所述标准问句对应的标准答复文本的相似度值,根据所述相似度值的最大值确定所述第一相似度范围。
问答系统首先需构建覆盖比较全的问答对数据集,接着采用相似度匹配的方式做问法匹配。基于问答系统获取的访客问句从知识库中检索可能与访客问题相似的若干标准问句,这若干个标准问句,被称为候选相似问句;接着计算访客问题与每一个标准问句的相似度,来判定该问句是否是访客问题的同义问句。若是同义问句,则该同义问句的答案就是访客问题的答案。此时,系统会把这个问答对返回给访客作为回答。
但是值得注意的点是,不论检索模块为访客问题召回的候选相似问句质量如何,相似标准问题选择模块都会为访客问题找到一个相似度“最高”的标准问句。但是,这个“最相似”的标准问句,有时候不一定是访客问题的相似问句。为了避免该情况发生,可为文本相似度配置一个阈值,之后根据匹配结果有三种情况:
①与知识库中某一个问法匹配度较高,则直接返回该问法的答案;
②与知识库中多个问法匹配度都超过了一定的阈值,则返回TopN的问法,由用户来选择最精确的问题;
③在知识库中所有的问法的相似度都没有超过阈值,则转为闲聊机器人。
为了便于与阈值进行比较,需要首先根据步骤S1021和S1022得到询问文本与知识库中标准问句的相似度值,选择最大的相似度值作为第一相似度范围的上限。示例性地,若知识库中标准问句与询问文本的最大相似度为0.85,则可设置第一相似度范围为0到0.85。
步骤S103,将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围。
可预先构建对应领域的知识图谱。知识图谱的优势在于,针对同一类问题,具有通用性,在同种类型的问法下,可直接解析为图数据查询语句的模式,比如同类问题为:“发动机坏了怎么办?”、“雨刷坏了怎么办”、“轮胎坏了怎么办?”,将前述同类问题通过知识图谱可表示为:“故障+发动机”、“故障+雨刷”、“故障+轮胎”,直接返回知识图谱的答案就好。以汽车领域为例,构建知识图谱时,可直接将行车说明书等文档输入系统,通过系统解析,从非结构化、半结构化以及结构化数据中进行信息的提取,需要从各种数据源中提取出实体,属性及实体间的关系,基于此形成本体化的知识表达;对于信息提取中得到的诸多实体是离散,冗余甚至部分错误的,需要进行知识融合以消除冗余错误及进行实体关联。主要包括实体链接及知识合并。实体链接(entity linking)是指对于新抽取得到的实体对象,将其正确链接到现有实体对象的操作。前述信息抽取及知识融合的过程只是处理的事实数据,要想获得结构化网络化表达的可以使用的知识必须经过知识加工这一步。知识加工主要包括3方面内容:本体构建、知识推理和质量评估。根据实体信息以及实体间的关系建立实体节点之间的连接,同样的,根据实体、属性以及对应的属性值建立实体节点与属性的连接。属性可包括日期、维修次数、使用年限等,属性值可以为具体日期,具体维修次数如2次,具体使用年限如3年等完成知识图谱构建后,将知识图谱存入数据库。
在一实施例中,步骤S103还包括以下步骤:
步骤S1031,根据所述询问文本中的实体信息、所述实体信息之间的关系,构建第一三元组,其中所述第一三元组包括一个或多个;
步骤S1032,根据所述询问文本中实体信息、属性以及对应的属性值,构建第二三元组,其中所述第二三元组包括一个或多个;
步骤S1033,将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度;
步骤S1034,根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度;
步骤S1035,根据各实体信息与所述知识图谱的相似度的最大值确定所述第二相似度范围。
在一实施例中,在获取访客输入的询问文本后,可进一步提取询问文本中包含的三元组信息。由于询问文本中可能不止包含一个询问语句或者一个询问语句中可能同时包含多个实体,可以三元组为单位来表示整个询问文本。具体地,可将实体与属性进行拆分,通过第一三元组来表示两个实体之间的关系,通过第二三元组来表示实体与属性的关系。通过第一三元组和第二三元组分别从知识图谱中匹配对应的节点,并记录知识图谱中节点与第一三元组或第二三元组的相似度值。
在一实施例中,步骤S1033中将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度,包括以下步骤:
步骤S10331,获取第一三元组中的实体信息,将所述实体信息与所述知识图谱中的节点进行比对,获取一个或多个达到预设相似度的第一匹配节点作为第一三元组的匹配节点;
步骤S10332,获取各所述第一匹配节点的邻接节点,剔除具有连接关系的邻接节点,并将剩余邻接节点组成邻接集合;
步骤S10333.将所述第二三元组中的属性值与所述邻接集合中的节点进行相似度比对,获取一个或多个达到预设相似度的第二匹配节点作为所述第二三元组的匹配节点。
可根据询问文本中的实体信息构建实体集合,以实体集合中的实体信息为单位,预先与知识图谱中的实体节点进行相似度比对,获取达到预设相似度阈值的实体节点作为实体集合的第一匹配节点,即各第一三元组的匹配节点。进一步地,可获取每个第一匹配节点在知识图谱中的邻接节点,基于邻接节点建立邻接集合。由于第一匹配节点之间可能互为邻接节点,即第一三元组中两个具有实体关系的实体之间分别对应知识图谱中的两个具有连接关系的实体节点,在形成邻接集合时,会存在第一匹配节点冗余的情况。在针对询问文本的属性进行检索匹配时,冗余的第一匹配节点将极大地降低检索匹配的效率。因此,需要剔除邻接集合中具有连接关系的邻接节点以便于后续第二三元组的检索比对。
在一实施例中,将第二三元组中的属性值与邻接集合中的节点进行相似度比对,获取与第二三元组中相似度达到设定阈值的第二匹配节点,并记录属性值与第二匹配节点的相似度值。基于以上步骤可获取与所述询问文本中每个实体信息具有实体关系的其他实体信息的匹配节点以及匹配相似度值,以及每个实体信息的属性值的匹配节点以及匹配相似度值。由于实体信息可能存在一词多义的情况,而属性值的确定性更高,因此可预先设置根据属性值从知识图谱中获取的匹配节点的匹配权重占比高于实体信息从知识图谱中获取的匹配节点的匹配权重占比。具体匹配权重占比配置可根据实际应用需求进行选择,这里不作限制。
在一实施例中,步骤S1034中根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度,包括以下步骤:
步骤S10341,预设匹配到实体的权重占比和匹配到属性值的权重占比,将所述权重占比作为对应知识图谱节点的节点匹配权重;
步骤S10342,根据所述第一三元组和所述第二三元组中对应同一实体信息的匹配节点的相似度值与对应匹配权重相乘,得到对应实体信息与所述知识图谱的相似度。
在一实施例中,根据匹配权重占比确定询问文本中每个实体信息的综合相似度。示例性地,假设询问文本中包含实体信息A1、A2、A3以及属性值B1和B2,A1和A2组成实体三元组,B1作为A1的属性值,B2作为A3的属性值,A3与A1及A2均无实体关系。A1、A2、A3分别从知识图谱中获取对应的匹配节点a1、a2和a3;B1和B2分别从知识图谱中获取的匹配节点为b1和b2。记A1与a1的相似度为s1,A2与a2的相似度为s2,A3与a3的相似度为s3,B1与b1的相似度为s4,B2与b2的相似度为s5。则实体信息A1的综合相似度可表示为:α*(s1+s2)+β*s4,实体信息A2的综合相似度可表示为:α*s2,实体信息A3的综合相似度可表示为:α*s3+β*s5。其中,α为实体信息对应的匹配权重,β为属性值对应的匹配权重。可通过设置权重值保证综合相识度在0-1之间,使得数据归一化,便于后续应用及计算。
经过上述步骤,可从各实体信息中选出,综合相似度最大的实体信息,以最大的综合相似度值作为第二相似度范围的上限,下限可根据需求设置为0或者其他适宜的值,这里不作限制。
步骤S104,将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
在一实施例中,步骤S104将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,包括以下步骤:
步骤S1041,所述预设相似度范围包括第一预设范围、第二预设范围以及第三预设范围;其中,所述第一预设范围对应的相似度值大于所述第二预设范围对应的相似度值,所述第二预设范围对应的相似度值大于所述第三预设范围对应的相似度值;
步骤S1042,若所述第一相似度范围与所述第一预设范围存在交集,则将所述知识库中匹配的标准答复文本作为输出;
步骤S1043,若所述第一相似度范围和所述第二相似度范围与所述第一预设范围的交集为空集,且均与所述第二预设范围存在交集,则获取所述知识库中的标准答复文本并按相似度由高到低进行排序,将排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中匹配节点对应的答复文本作为输出;
步骤S1044,若所述第一相似度范围和所述第二相似度范围与所述第一预设范围和第二预设范围的交集均为空集,且均与所述第三预设范围存在交集,则将所述知识库中排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中的节点关系作为答复文本输出。
根据询问文本中实体信息与知识图谱中节点的相似度,将从知识图谱获取的匹配结果划分为三类,分别为:精准回复、图谱关系以及无匹配结果。进一步地,可根据相似度大小设置匹配结果返回的优先级为:精准回复>图谱关系>无匹配结果。将从知识库中获取的答案划分为三个类型,分别为:精准答案、topN、寒暄。其中topN为知识库中相似度由大到小排序在前的N个标准答案。针对知识库和知识图谱可分别定义不同的相似范围阈值,如图4所示。
请参阅图4,在一实例中,可设置图谱阈值规则如下:
知识库:直回[0.96,1]、topN(0,0.96)、寒暄[0];
知识图谱:精准回复[0.7,1]、图谱关系[0.4,0.7)、未知[0,0.4)。
在一实施例中,若阈值范围为[0.96,1],则命中为知识库(直回)/知识图谱(精准回复),则给出结果为知识库(直回);
若阈值范围为[0.7,0.96),则命中为知识库(topN)和知识图谱(精准回复),则给出结果为知识库(topN)和知识图谱(精准回复);
若阈值范围为[0.4,0.7),则命中为知识库(topN)和知识图谱(关系)则给出结果为知识库(topN)和知识图谱(关系);
若阈值范围为(0,0.4),则命中知识库(topN)和知识图谱(无匹配结果),给出结果为知识库(topN);
若阈值范围为[0],则命中知识库(闲聊),给出结果为知识库(闲聊)。
在一实施例中,可梳理一批测试集,上传得出匹配的知识库和图谱的答案类型、以及最后给出的结果,导出后经过人工审核,可调整图谱三种答案类型对应的阈值,及精准回复、图谱关系、无匹配结果三种类型的范围。
在一实施例中,步骤S104还包括:步骤S4015,第一相似度范围和所述第二相似度范围均低于所述预设相似度范围阈值时,启动闲置对话获取所述知识库中通用问答文本。
在一实施例中,启动闲置对话之后,还包括以下步骤:
获取所述闲置对话中用户反馈的文本数据;
将所述文本数据与所述知识图谱中的节点进行比对,得到一个或多个关联节点;
根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互。
在一实施例中,根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互,包括以下步骤:
从所述知识图谱中获取所述关联节点的邻接节点,根据所述关联节点和对应邻接节点的连接关系,生成所述第一问句;
获取所述知识库中与所述第一问句匹配的一个或多个标准问句;
将所述第一问句以及匹配的标准问句输出至用户端。
具体地,基于闲聊的数据记录,提取用户感兴趣的特征,从知识图谱中匹配节点,获取匹配节点的邻接节点组成关联节点,基于关联节点生成问句或者答复文本输出以供访客进行参考。当关联节点生成语句为问句时可结合知识库,判断生成的问句在知识库中是否存在匹配的标准问句,将相似的一个或多个标准问句与知识图谱生成的语句一同输出至访客对应的终端,以供访客进行筛选,引导访客完成问答交互,提高交互达成率。
在一实施例中,如图5所示,提供一种常见问题解答系统,该系统包括:询问交互模块10,用于获取询问文本以及所述询问文本的三元组信息;知识库检索模块11,用于根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与知识库中各标准答复文本的第一相似度范围,其中,知识库由标准问答对组成;知识图谱检索模块12,用于将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;决策输出模块13,用于将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
在一实施例中,知识库检索模块11还用于将所述询问文本与所述知识库中的标准问句进行相似度比对,得到各标准问句的相似度值;将所述相似度值作为所述标准问句对应的标准答复文本的相似度值,根据所述相似度值的最大值确定所述第一相似度范围。
在一实施例中,知识图谱检索模块12还用于根据所述询问文本中的实体信息、所述实体信息之间的关系,构建第一三元组,其中所述第一三元组包括一个或多个;根据所述询问文本中实体信息、属性以及对应的属性值,构建第二三元组,其中所述第二三元组包括一个或多个;将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度;根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度;根据各实体信息与所述知识图谱的相似度的最大值确定所述第二相似度范围。
在一实施例中,知识图谱检索模块12还用于将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,取各三元组与对应匹配节点的相似度,包括:获取第一三元组中的实体信息,将所述实体信息与所述知识图谱中的节点进行比对,获取一个或多个达到预设相似度的第一匹配节点作为第一三元组的匹配节点;获取各所述第一匹配节点的邻接节点,剔除具有连接关系的邻接节点,并将剩余邻接节点组成邻接集合;将所述第二三元组中的属性值与所述邻接集合中的节点进行相似度比对,获取一个或多个达到预设相似度的第二匹配节点作为所述第二三元组的匹配节点。
在一实施例中,知识图谱检索模块12还用于根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度,包括:预设匹配到实体的权重占比和匹配到属性值的权重占比,将所述权重占比作为对应知识图谱节点的节点匹配权重;根据所述第一三元组和所述第二三元组中对应同一实体信息的匹配节点的相似度值与对应匹配权重相乘,得到对应实体信息与所述知识图谱的相似度。
在一实施例中,决策输出模块13还用于所述预设相似度范围包括第一预设范围、第二预设范围以及第三预设范围;其中,所述第一预设范围对应的相似度值大于所述第二预设范围对应的相似度值,所述第二预设范围对应的相似度值大于所述第三预设范围对应的相似度值;若所述第一相似度范围与所述第一预设范围存在交集,则将所述知识库中匹配的标准答复文本作为输出;若所述第一相似度范围和所述第二相似度范围与所述第一预设范围的交集为空集,且均与所述第二预设范围存在交集,则获取所述知识库中的标准答复文本并按相似度由高到低进行排序,将排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中匹配节点对应的答复文本作为输出;若所述第一相似度范围和所述第二相似度范围与所述第一预设范围和第二预设范围的交集均为空集,且均与所述第三预设范围存在交集,则将所述知识库中排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中的节点关系作为答复文本输出。
在一实施例中,决策输出模块13还用于所述第一相似度范围和所述第二相似度范围均低于所述预设相似度范围阈值时,启动闲置对话获取所述知识库中通用问答文本。
在一实施例中,决策输出模块13还用于启动闲置对话之后,还包括:获取所述闲置对话中用户反馈的文本数据;将所述文本数据与所述知识图谱中的节点进行比对,得到一个或多个关联节点;根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互。
在一实施例中,决策输出模块13还用于根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互,包括:从所述知识图谱中获取所述关联节点的邻接节点,根据所述关联节点和对应邻接节点的连接关系,生成所述第一问句;获取所述知识库中与所述第一问句匹配的一个或多个标准问句;将所述第一问句以及匹配的标准问句输出至用户端。
上述常见问题解答系统可以以一种计算机程序的形式实现,计算机程序可以在如图6所示的计算机设备上运行。计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。
上述常见问题解答系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于终端的存储器中,也可以以软件形式存储于终端的存储器中,以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
如图6所示,为一个实施例中计算机设备的内部结构示意图。提供了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取询问文本以及所述询问文本的三元组信息;根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
在一实施例中,上述处理器执行时,所实现的根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,包括:将所述询问文本与所述知识库中的标准问句进行相似度比对,得到各标准问句的相似度值;将所述相似度值作为所述标准问句对应的标准答复文本的相似度值,根据所述相似度值的最大值确定所述第一相似度范围。
在一实施例中,上述处理器执行时,所实现的将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围,包括:根据所述询问文本中的实体信息、所述实体信息之间的关系,构建第一三元组,其中所述第一三元组包括一个或多个;根据所述询问文本中实体信息、属性以及对应的属性值,构建第二三元组,其中所述第二三元组包括一个或多个;将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度;根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度;根据各实体信息与所述知识图谱的相似度的最大值确定所述第二相似度范围。
在一实施例中,上述处理器执行时,所实现的将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度,包括:获取第一三元组中的实体信息,将所述实体信息与所述知识图谱中的节点进行比对,获取一个或多个达到预设相似度的第一匹配节点作为第一三元组的匹配节点;获取各所述第一匹配节点的邻接节点,剔除具有连接关系的邻接节点,并将剩余邻接节点组成邻接集合;将所述第二三元组中的属性值与所述邻接集合中的节点进行相似度比对,获取一个或多个达到预设相似度的第二匹配节点作为所述第二三元组的匹配节点。
在一实施例中,上述处理器执行时,所实现的根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度,包括:预设匹配到实体的权重占比和匹配到属性值的权重占比,将所述权重占比作为对应知识图谱节点的节点匹配权重;根据所述第一三元组和所述第二三元组中对应同一实体信息的匹配节点的相似度值与对应匹配权重相乘,得到对应实体信息与所述知识图谱的相似度。
在一实施例中,上述处理器执行时,所实现的将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,包括:所述预设相似度范围包括第一预设范围、第二预设范围以及第三预设范围;其中,所述第一预设范围对应的相似度值大于所述第二预设范围对应的相似度值,所述第二预设范围对应的相似度值大于所述第三预设范围对应的相似度值;若所述第一相似度范围与所述第一预设范围存在交集,则将所述知识库中匹配的标准答复文本作为输出;若所述第一相似度范围和所述第二相似度范围与所述第一预设范围的交集为空集,且均与所述第二预设范围存在交集,则获取所述知识库中的标准答复文本并按相似度由高到低进行排序,将排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中匹配节点对应的答复文本作为输出;若所述第一相似度范围和所述第二相似度范围与所述第一预设范围和第二预设范围的交集均为空集,且均与所述第三预设范围存在交集,则将所述知识库中排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中的节点关系作为答复文本输出。
在一实施例中,上述处理器执行时,所实现的将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,还包括:所述第一相似度范围和所述第二相似度范围均低于所述预设相似度范围阈值时,启动闲置对话获取所述知识库中通用问答文本。
在一实施例中,上述处理器执行时,所实现的启动闲置对话之后,还包括:获取所述闲置对话中用户反馈的文本数据;将所述文本数据与所述知识图谱中的节点进行比对,得到一个或多个关联节点;根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互。
在一实施例中,上述处理器执行时,所实现的根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互,包括:从所述知识图谱中获取所述关联节点的邻接节点,根据所述关联节点和对应邻接节点的连接关系,生成所述第一问句;获取所述知识库中与所述第一问句匹配的一个或多个标准问句;将所述第一问句以及匹配的标准问句输出至用户端。
在一个实施例中,上述的计算机设备可用作服务器,包括但不限于独立的物理服务器,或者是多个物理服务器构成的服务器集群,该计算机设备还可用作终端,包括但不限手机、平板电脑、个人数字助理或者智能设备等。如图6所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器、显示屏和网络接口。
其中,该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。计算机设备的非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以上各个实施例所提供的常见问题解答方法。计算机设备中的内存储器为非易失性存储介质中的操作系统和计算机程序提供高速缓存的运行环境。显示界面可通过显示屏进行数据展示。显示屏可以是触摸屏,比如为电容屏或电子屏,可通过接收作用于该触摸屏上显示的控件的点击操作,生成相应的指令。
本领域技术人员可以理解,图6中示出的计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取询问文本以及所述询问文本的三元组信息;根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
在一实施例中,该计算机程序被处理器执行时,所实现的根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与预设知识库中各标准答复文本的第一相似度范围,包括:将所述询问文本与所述知识库中的标准问句进行相似度比对,得到各标准问句的相似度值;将所述相似度值作为所述标准问句对应的标准答复文本的相似度值,根据所述相似度值的最大值确定所述第一相似度范围。
在一实施例中,该计算机程序被处理器执行时,所实现的将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围,包括:根据所述询问文本中的实体信息、所述实体信息之间的关系,构建第一三元组,其中所述第一三元组包括一个或多个;根据所述询问文本中实体信息、属性以及对应的属性值,构建第二三元组,其中所述第二三元组包括一个或多个;将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度;根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度;根据各实体信息与所述知识图谱的相似度的最大值确定所述第二相似度范围。
在一实施例中,该计算机程序被处理器执行时,所实现的将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度,包括:获取第一三元组中的实体信息,将所述实体信息与所述知识图谱中的节点进行比对,获取一个或多个达到预设相似度的第一匹配节点作为第一三元组的匹配节点;获取各所述第一匹配节点的邻接节点,剔除具有连接关系的邻接节点,并将剩余邻接节点组成邻接集合;将所述第二三元组中的属性值与所述邻接集合中的节点进行相似度比对,获取一个或多个达到预设相似度的第二匹配节点作为所述第二三元组的匹配节点。
在一实施例中,该计算机程序被处理器执行时,所实现的根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度,包括:预设匹配到实体的权重占比和匹配到属性值的权重占比,将所述权重占比作为对应知识图谱节点的节点匹配权重;根据所述第一三元组和所述第二三元组中对应同一实体信息的匹配节点的相似度值与对应匹配权重相乘,得到对应实体信息与所述知识图谱的相似度。
在一实施例中,该计算机程序被处理器执行时,所实现的将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,包括:所述预设相似度范围包括第一预设范围、第二预设范围以及第三预设范围;其中,所述第一预设范围对应的相似度值大于所述第二预设范围对应的相似度值,所述第二预设范围对应的相似度值大于所述第三预设范围对应的相似度值;若所述第一相似度范围与所述第一预设范围存在交集,则将所述知识库中匹配的标准答复文本作为输出;若所述第一相似度范围和所述第二相似度范围与所述第一预设范围的交集为空集,且均与所述第二预设范围存在交集,则获取所述知识库中的标准答复文本并按相似度由高到低进行排序,将排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中匹配节点对应的答复文本作为输出;若所述第一相似度范围和所述第二相似度范围与所述第一预设范围和第二预设范围的交集均为空集,且均与所述第三预设范围存在交集,则将所述知识库中排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中的节点关系作为答复文本输出。
在一实施例中,该指令被处理器执行时,所实现的将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,还包括:所述第一相似度范围和所述第二相似度范围均低于所述预设相似度范围阈值时,启动闲置对话获取所述知识库中通用问答文本。
在一实施例中,该指令被处理器执行时,所实现的启动闲置对话之后,还包括:获取所述闲置对话中用户反馈的文本数据;将所述文本数据与所述知识图谱中的节点进行比对,得到一个或多个关联节点;根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互。
在一实施例中,该指令被处理器执行时,所实现的根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互,包括:从所述知识图谱中获取所述关联节点的邻接节点,根据所述关联节点和对应邻接节点的连接关系,生成所述第一问句;获取所述知识库中与所述第一问句匹配的一个或多个标准问句;将所述第一问句以及匹配的标准问句输出至用户端
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (12)
1.一种常见问题解答方法,其特征在于,包括:
获取询问文本以及所述询问文本的三元组信息;
根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;
将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;
将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
2.根据权利要求1所述的常见问题解答方法,其特征在于,根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,包括:
将所述询问文本与所述知识库中的标准问句进行相似度比对,得到各标准问句的相似度值;
将所述相似度值作为所述标准问句对应的标准答复文本的相似度值,根据所述相似度值的最大值确定所述第一相似度范围。
3.根据权利要求1所述的常见问题解答方法,其特征在于,将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围,包括:
根据所述询问文本中的实体信息、所述实体信息之间的关系,构建第一三元组,其中所述第一三元组包括一个或多个;
根据所述询问文本中实体信息、属性以及对应的属性值,构建第二三元组,其中所述第二三元组包括一个或多个;
将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度;
根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度;
根据各实体信息与所述知识图谱的相似度的最大值确定所述第二相似度范围。
4.根据权利要求3所述的常见问题解答方法,其特征在于,将所述第一三元组和第二三元组分别与所述知识图谱中节点进行比对,获取各三元组与对应匹配节点的相似度,包括:
获取第一三元组中的实体信息,将所述实体信息与所述知识图谱中的节点进行比对,获取一个或多个达到预设相似度的第一匹配节点作为第一三元组的匹配节点;
获取各所述第一匹配节点的邻接节点,剔除具有连接关系的邻接节点,并将剩余邻接节点组成邻接集合;
将所述第二三元组中的属性值与所述邻接集合中的节点进行相似度比对,获取一个或多个达到预设相似度的第二匹配节点作为所述第二三元组的匹配节点。
5.根据权利要求3所述的常见问题解答方法,其特征在于,根据预设的节点匹配权重对所述相似度进行加权处理,得到每个实体信息与所述知识图谱的相似度,包括:
预设匹配到实体的权重占比和匹配到属性值的权重占比,将所述权重占比作为对应知识图谱节点的节点匹配权重;
根据所述第一三元组和所述第二三元组中对应同一实体信息的匹配节点的相似度值与对应匹配权重相乘,得到对应实体信息与所述知识图谱的相似度。
6.根据权利要求1所述的常见问题解答方法,其特征在于,将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,包括:
所述预设相似度范围包括第一预设范围、第二预设范围以及第三预设范围;其中,所述第一预设范围对应的相似度值大于所述第二预设范围对应的相似度值,所述第二预设范围对应的相似度值大于所述第三预设范围对应的相似度值;
若所述第一相似度范围与所述第一预设范围存在交集,则将所述知识库中匹配的标准答复文本作为输出;
若所述第一相似度范围和所述第二相似度范围与所述第一预设范围的交集为空集,且均与所述第二预设范围存在交集,则获取所述知识库中的标准答复文本并按相似度由高到低进行排序,将排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中匹配节点对应的答复文本作为输出;
若所述第一相似度范围和所述第二相似度范围与所述第一预设范围和第二预设范围的交集均为空集,且均与所述第三预设范围存在交集,则将所述知识库中排序在前的多个标准答复文本作为输出,以及获取所述知识图谱中的节点关系作为答复文本输出。
7.根据权利要求1所述的常见问题解答方法,其特征在于,将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本,还包括:
所述第一相似度范围和所述第二相似度范围均低于所述预设相似度范围阈值时,启动闲置对话获取所述知识库中通用问答文本。
8.根据权利要求7所述的常见问题解答方法,其特征在于,启动闲置对话之后,还包括:
获取所述闲置对话中用户反馈的文本数据;
将所述文本数据与所述知识图谱中的节点进行比对,得到一个或多个关联节点;
根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互。
9.根据权利要求8所述的常见问题解答方法,其特征在于,根据所述关联节点生成第一问句输出至用户端以引导用户完成问答交互,包括:
从所述知识图谱中获取所述关联节点的邻接节点,根据所述关联节点和对应邻接节点的连接关系,生成所述第一问句;
获取所述知识库中与所述第一问句匹配的一个或多个标准问句;
将所述第一问句以及匹配的标准问句输出至用户端。
10.一种常见问题解答系统,其特征在于,包括:
询问交互模块,用于获取询问文本以及所述询问文本的三元组信息;
知识库检索模块,用于根据预设知识库中预设标准问句的相似度匹配阈值确定所述询问文本与所述知识库中各标准答复文本的第一相似度范围,其中,所述知识库由标准问答对组成;
知识图谱检索模块,用于将所述三元组信息与预设知识图谱中对应节点进行第一比对,确定所述询问文本与所述知识图谱中节点的第二相似度范围;
决策输出模块,用于将所述第一相似度范围、第二相似度范围与预设相似度范围阈值进行第二比对以确定输出所述知识库或所述知识图谱中对应的答复文本。
11.一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210730058.6A CN115098655A (zh) | 2022-06-24 | 2022-06-24 | 一种常见问题解答方法、系统、设备和介质 |
EP23825753.9A EP4365754A1 (en) | 2022-06-24 | 2023-01-17 | Common question answering method and system, device and medium |
PCT/CN2023/072687 WO2023246093A1 (zh) | 2022-06-24 | 2023-01-17 | 一种常见问题解答方法、系统、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210730058.6A CN115098655A (zh) | 2022-06-24 | 2022-06-24 | 一种常见问题解答方法、系统、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115098655A true CN115098655A (zh) | 2022-09-23 |
Family
ID=83293807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210730058.6A Pending CN115098655A (zh) | 2022-06-24 | 2022-06-24 | 一种常见问题解答方法、系统、设备和介质 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4365754A1 (zh) |
CN (1) | CN115098655A (zh) |
WO (1) | WO2023246093A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023246093A1 (zh) * | 2022-06-24 | 2023-12-28 | 重庆长安汽车股份有限公司 | 一种常见问题解答方法、系统、设备和介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11709873B2 (en) * | 2020-01-13 | 2023-07-25 | Adobe Inc. | Reader-retriever approach for question answering |
CN112100351A (zh) * | 2020-09-11 | 2020-12-18 | 陕西师范大学 | 一种通过问题生成数据集构建智能问答系统的方法及设备 |
CN112035730B (zh) * | 2020-11-05 | 2021-02-02 | 北京智源人工智能研究院 | 一种语义检索方法、装置及电子设备 |
CN113157888A (zh) * | 2021-04-20 | 2021-07-23 | 北京邮电大学 | 支持多知识来源的询问答复方法、装置和电子设备 |
CN113312461A (zh) * | 2021-05-25 | 2021-08-27 | 深圳平安综合金融服务有限公司 | 基于自然语言处理的智能问答方法、装置、设备及介质 |
CN115098655A (zh) * | 2022-06-24 | 2022-09-23 | 重庆长安汽车股份有限公司 | 一种常见问题解答方法、系统、设备和介质 |
-
2022
- 2022-06-24 CN CN202210730058.6A patent/CN115098655A/zh active Pending
-
2023
- 2023-01-17 WO PCT/CN2023/072687 patent/WO2023246093A1/zh active Application Filing
- 2023-01-17 EP EP23825753.9A patent/EP4365754A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023246093A1 (zh) * | 2022-06-24 | 2023-12-28 | 重庆长安汽车股份有限公司 | 一种常见问题解答方法、系统、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
EP4365754A1 (en) | 2024-05-08 |
WO2023246093A1 (zh) | 2023-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10540965B2 (en) | Semantic re-ranking of NLU results in conversational dialogue applications | |
CN109740077B (zh) | 基于语义索引的答案搜索方法、装置及其相关设备 | |
CN108345690B (zh) | 智能问答方法与系统 | |
CN112084789B (zh) | 文本处理方法、装置、设备及存储介质 | |
CN116795973B (zh) | 基于人工智能的文本处理方法及装置、电子设备、介质 | |
CN110309377B (zh) | 语义归一化、提问模式的生成、应答确定方法及装置 | |
CN111078847A (zh) | 电力用户意图识别方法、装置、计算机设备和存储介质 | |
CN112115232A (zh) | 一种数据纠错方法、装置及服务器 | |
CN111339277A (zh) | 基于机器学习的问答交互方法及装置 | |
CN112685550B (zh) | 智能问答方法、装置、服务器及计算机可读存储介质 | |
CN116501960B (zh) | 内容检索方法、装置、设备及介质 | |
WO2023040516A1 (zh) | 一种事件整合方法、装置、电子设备、计算机可读存储介质及计算机程序产品 | |
CN116541493A (zh) | 基于意图识别的交互应答方法、装置、设备、存储介质 | |
CN116737908A (zh) | 知识问答方法、装置、设备和存储介质 | |
CN112115244A (zh) | 对话交互方法、装置、存储介质及电子设备 | |
CN115098655A (zh) | 一种常见问题解答方法、系统、设备和介质 | |
CN112966076A (zh) | 智能问答问题的生成方法、装置、计算机设备及存储介质 | |
CN112463920A (zh) | 一种信息应答方法及装置 | |
CN112749554A (zh) | 确定文本匹配度的方法、装置、设备及存储介质 | |
CN112966084B (zh) | 基于知识图谱的答案查询方法、装置、设备及存储介质 | |
CN113886535B (zh) | 基于知识图谱的问答方法、装置、存储介质及电子设备 | |
WO2015200422A1 (en) | Semantic re-ranking of nlu results in conversational dialogue applications | |
CN116821295A (zh) | 智能问答方法、装置、计算机设备及介质 | |
CN114610741A (zh) | 对话方法及系统 | |
CN117807204A (zh) | 工程机械故障问题的问答诊断方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |