CN112559709A - 基于知识图谱的问答方法、装置、终端以及存储介质 - Google Patents

基于知识图谱的问答方法、装置、终端以及存储介质 Download PDF

Info

Publication number
CN112559709A
CN112559709A CN202011488132.5A CN202011488132A CN112559709A CN 112559709 A CN112559709 A CN 112559709A CN 202011488132 A CN202011488132 A CN 202011488132A CN 112559709 A CN112559709 A CN 112559709A
Authority
CN
China
Prior art keywords
question
entity
user
knowledge graph
natural query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011488132.5A
Other languages
English (en)
Inventor
任俊松
李茂昌
侯晓龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202011488132.5A priority Critical patent/CN112559709A/zh
Publication of CN112559709A publication Critical patent/CN112559709A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于计算机技术领域,提供了一种基于知识图谱的问答方法、问答装置、问答终端及存储介质,包括:获取用户输入的自然查询语句所对应的实体;获取与所述实体对应的会话知识图谱;会话知识图谱以树形结构存储信息;信息包括实体对应的逻辑路径,以及逻辑路径对应的多个反馈结果;基于所述自然查询语句以及所述逻辑路径,在会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户。上述方式,当获取到用户输入的自然查询语句时,可直接根据预先构建好的会话知识图谱中的信息进行查找,反馈给用户准确的回答,加快了处理用户问题的速度,提升了反馈给用户信息的准确性。

Description

基于知识图谱的问答方法、装置、终端以及存储介质
技术领域
本申请属于计算机技术领域,尤其涉及一种基于知识图谱的问答方法、问答装置、问答终端以及存储介质。
背景技术
随着信息技术的快速发展,当今社会进入了信息爆炸时代,人们越来越多的借助网络来寻找自己的所需的信息。因此,基于知识图谱的问答系统应用而生,利用基于知识图谱的问答系统可帮助用户获取到其所需的信息。
知识图谱本质上是语义网络,是一种基于图的数据结构,由节点和边组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。
然而,现有的基于知识图谱的问答系统,处理用户问题速度慢,反馈给用户的信息不准确。
发明内容
有鉴于此,本申请实施例提供了基于知识图谱的问答方法、问答装置、问答终端以及存储介质,以解决传统的基于知识图谱的问答系统,处理用户问题速度慢,反馈给用户的信息不准确的问题。
本申请实施例的第一方面提供了一种基于知识图谱的问答方法,包括:
获取用户输入的自然查询语句所对应的实体;
获取与所述实体对应的会话知识图谱;所述会话知识图谱以树形结构存储信息;所述信息包括所述实体对应的逻辑路径,以及所述逻辑路径对应的多个反馈结果;
基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户。
可选地,所述逻辑路径上对应有多个待反馈节点,当所述逻辑路径为一条时,所述基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户,包括:
在所述逻辑路径中确定与所述自然查询语句匹配的待反馈节点;
获取所述待反馈节点中存储的反馈结果,并将所述反馈结果反馈给所述用户。
可选地,当所述逻辑路径为多条时,所述基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户,包括:
在多条逻辑路径中确定与所述自然查询语句匹配的目标逻辑路径;
在所述目标逻辑路径中确定与所述自然查询语句匹配的目标待反馈节点;
获取所述目标待反馈节点中存储的反馈结果,并将所述反馈结果反馈给所述用户。
可选地,所述获取用户输入的自然查询语句所对应的实体之前,所述问答方法还包括:配置每个实体对应的会话知识图谱。
可选地,所述配置每个实体对应的会话知识图谱,包括:
获取每个待配置的实体对应的结构化数据;所述结构化数据包括多个子信息,所述子信息为待存储在所述会话知识图谱中的信息;
确定每个子信息对应的节点属性以及存储位置;
基于每个子信息对应的节点属性以及存储位置,在数据库中以树形结构存储每个待配置的实体以及每个子信息,得到每个待配置的实体对应的会话知识图谱。
可选地,所述基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户之后,所述问答方法还包括:当基于所述反馈结果检测到当前问答流程结束时,清除与所述用户相关的所有自然查询语句以及所有反馈结果。
可选地,所述配置每个实体对应的会话知识图谱之后,所述问答方法还包括:将每个实体对应的会话知识图谱上传至区块链中。
本申请实施例的第二方面提供了一种基于知识图谱的问答装置,包括:
第一获取单元,用于获取用户输入的自然查询语句所对应的实体;
第二获取单元,用于获取与所述实体对应的会话知识图谱;所述会话知识图谱以树形结构存储信息;所述信息包括所述实体对应的逻辑路径,以及所述逻辑路径对应的多个反馈结果;
查找单元,用于基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户。
本申请实施例的第三方面提供了一种基于知识图谱的问答终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述第一方面所述的问答方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的问答方法的步骤。
本申请实施例的第五方面提供了一种计算机程序产品,当计算机程序产品在问答终端上运行时,使得问答终端执行上述第一方面所述的问答方法的步骤。
本申请实施例提供的一种基于知识图谱的问答方法、问答装置、问答终端以及存储介质,具有以下有益效果:
会话知识图谱以树形结构存储信息,该信息包括实体对应的逻辑路径以及该逻辑路径对应的多个反馈结果。尤其当用户的问题涉及到逻辑时,无需会话知识图谱进行逻辑判断,而是可以直接根据预先构建好的会话知识图谱中的信息进行查找,反馈给用户准确的回答,加快了处理用户问题的速度,提升了反馈给用户信息的准确性。且每个实体对应的逻辑路径以及逻辑路径对应的多个反馈结果以树形结构在会话知识图谱中存储,方便该这些信息的维护与扩充。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于知识图谱的问答方法的示意流程图;
图2是本申请实施例提供的甲亢对应的会话知识图谱示意图;
图3是本申请又一实施例提供的一种基于知识图谱的问答方法的示意性流程图;
图4是本申请再一实施例提供的一种基于知识图谱的问答方法的示意性流程图;
图5是本申请一实施例提供的一种基于知识图谱的问答装置的示意图;
图6是本申请另一实施例提供的一种基于知识图谱的问答终端的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
现有技术中,用户经常利用基于知识图谱的问答系统帮助其获取所需信息。然而,现有的基于知识图谱的问答系统,处理用户问题速度慢,反馈给用户的信息不准确。
有鉴于此,本申请提供了一种基于知识图谱的问答方法,该方法中,问答终端获取用户输入的自然查询语句所对应的实体;获取与该实体对应的会话知识图谱;该会话知识图谱以树形结构存储信息;该信息包括实体对应的逻辑路径,以及逻辑路径对应的多个反馈结果;基于该自然查询语句以及逻辑路径,在会话知识图谱中查找与该自然查询语句匹配的反馈结果,并将该反馈结果反馈给用户。
上述方式中,会话知识图谱以树形结构存储信息,该信息包括实体对应的逻辑路径以及该逻辑路径对应的多个反馈结果。尤其当用户的问题涉及到逻辑时,无需会话知识图谱进行逻辑判断,而是可以直接根据预先构建好的会话知识图谱中的信息进行查找,反馈给用户准确的回答,加快了处理用户问题的速度,提升了反馈给用户信息的准确性。且每个实体对应的逻辑路径以及逻辑路径对应的多个反馈结果以树形结构在会话知识图谱中存储,方便该这些信息的维护与扩充。
请参见图1,图1是本申请实施例提供的一种基于知识图谱的问答方法的示意流程图。本实施例中问答方法的执行主体为基于知识图谱的问答终端,问答终端包括但不限于智能手机、平板电脑、计算机、个人数字助理(Personal Digital Assistant,PDA)、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、独立的服务器、分布式服务器、服务器集群或云服务器等,还可以包括台式电脑等终端。如图1所示的问答方法可包括S101~S103,各个步骤的具体实现原理如下。
S101:获取用户输入的自然查询语句所对应的实体。
问答终端获取用户输入的自然查询语句,对该自然查询语句进行分析,得到该自然查询语句中包含的实体。示例性地,当用户想要得到某些信息时,可在终端设备上的浏览器、应用程序(Application,APP)系统等输入界面输入自然查询语句,问答终端获取该自然查询语句,并对该自然查询语句进行分析,提取出该自然查询语句中的实体。其中,用户输入的自然查询语句可以是包含逻辑的问句,也可以是普通的自然查询语句,对此不做限定。
例如,用户想要获取关于甲亢投保的相关信息。用户可在问答终端上的浏览器界面输入“甲亢投保需要注意些什么”,问答终端接收到“甲亢投保需要注意些什么”这一自然查询语句后,对其进行分析,提取出了“甲亢”这一关键信息,将“甲亢”识别为“甲亢投保需要注意些什么”所对应的实体。
可选地,在一种可能的实现方式中,一个实体针对会话知识图谱都有全局唯一的标识符,为了便于后续根据该标识符准确地找出与该实体对应的会话知识图谱。若在获取用户输入的自然查询语句所对应的实体时,提取出了该实体的别称,即该实体的其他表达方式,将该实体的别称转换为与该实体一致的表达。例如,甲亢的别称有甲状腺功能亢进、瘿气等,若用户输入的自然查询语句为“甲状腺功能亢进投保需要注意些什么”,或者“瘿气投保需要注意些什么”,问答终端在提取出“甲状腺功能亢进”以及“瘿气”时,将这些词转换为“甲亢”,最终将“甲亢”作为“甲状腺功能亢进投保需要注意些什么”,或者“瘿气投保需要注意些什么”对应的实体。此处仅为示例性说明,对此不做限定。
S102:获取与该实体对应的会话知识图谱;会话知识图谱以树形结构存储信息;该信息包括该实体对应的逻辑路径,以及逻辑路径对应的多个反馈结果。
每个实体都有与其对应的全局唯一的标识符;根据该实体对应的标识符可获取与该实体对应的会话知识图谱。示例性地,预先构建好的所有会话知识图谱可预先存储至数据库、服务器等,问答终端识别出自然查询语句中的实体后,获取该实体对应的标识符,基于该标识符在数据库或者服务器中查找该标识符标识的会话知识图谱,即得到该实体对应的会话知识图谱。
会话知识图谱以树形结构存储信息,该信息包括该实体对应的逻辑路径,以及逻辑路径对应的多个反馈结果。其中,该实体对应的逻辑路径是指,针对该实体对应的自然查询语句进行结果反馈时形成的路径。该实体对应的逻辑路径可以为一条或者多条,每条逻辑路径上对应的反馈结果也可以为一个或者多个,对此不做限定。
会话知识图谱中包括该实体对应的逻辑分支路径以及该逻辑分支路径上与该自然查询语句匹配的问答结果。其中,该实体对应的逻辑分支路径是指,针对实体相关问题进行回答时,可以有多种回答,进而可相对应地形成多条逻辑分支路径;在每条逻辑分支路径上可以包含一个或多个自然查询语句,以及与每个自然查询语句匹配的问答结果。该实体对应的逻辑分支路径也可以只有一条,对此不做限定。值得说明的是,会话知识图谱中的这些信息可以以树形结构进行存储,便于对会话知识图谱中的这些信息进行扩充与维护。
为了便于理解,以甲亢这一应用场景为例进行说明,如图2所示,图2是本申请实施例提供的甲亢对应的会话知识图谱示意图。其中,各个待反馈节点存储的“目前甲亢功能是否正常”、“有无并发症”、“投保建议1”、“寿险标准保险”等信息即为反馈结果。该甲亢对应的多条逻辑路径分别为:目前甲亢功能是否正常(是)--有无并发症(是)--投保建议2--统一回复;目前甲亢功能是否正常(是)--有无并发症(否)--投保建议3--寿险标准险保/重疾险标准险保/医疗险;目前甲亢功能是否正常(否)--投保建议1--寿险延期/重疾险延期/医疗险延期。
示例性地,当用户在问答终端上的浏览器界面输入“甲亢投保需要注意些什么”,问答终端接收到“甲亢投保需要注意些什么”这一自然查询语句后,对其进行分析,提取出了“甲亢”这一关键信息,将“甲亢”识别为“甲亢投保需要注意些什么”所对应的实体。获取甲亢对应的标识符,基于该标识符在数据库或者服务器中查找到甲亢对应的会话知识图谱。问答终端将“目前甲亢功能是否正常”反馈给用户,进而根据用户的其他自然查询语句继续进行问答。
S103:基于该自然查询语句以及逻辑路径,在该会话知识图谱中查找与该自然查询语句匹配的反馈结果,并将该反馈结果反馈给用户。
问答终端根据自然查询语句与逻辑路径在会话知识图谱中查找到与该自然查询语句匹配的反馈结果,并将反馈结果反馈给该用户。示例性地,不同的实体对应的会话知识图谱不同,进而会话知识图谱中存储的信息也不相同。当查找到的会话知识图谱中只有一条逻辑路径时,判断该自然查询语句与该逻辑路径上的哪个待反馈节点匹配,进而将该待反馈节点中存储的反馈结果反馈给用户。当查找到的会话知识图谱中有多条逻辑路径时,可先判断该自然查询语句与该会话知识图谱中的哪条逻辑路径更匹配,进而在相匹配的这条逻辑路径中确定与该自然查询语句匹配的待反馈节点,将该待反馈节点中存储的反馈结果反馈给用户。
示例性地,以“目前甲亢功能是否正常(是)--有无并发症(是)--投保建议2--统一回复”这一逻辑路径为例。当用户输入“甲亢投保需要注意些什么”这一自然查询语句时,问答终端可将“目前甲亢功能是否正常”这一反馈结果反馈给用户;根据用户的不同回答匹配不同的逻辑路径,进而反馈给用户不同的反馈结果。例如,当用户继续输入“是”,此时无需会话知识图谱对该用户的输入信息进行逻辑判断,而是直接根据用户的输入信息在其存储的信息中查找到对应的反馈结果反馈给用户,即问答终端将“有无并发症”反馈给用户。若用户继续输入“是”,问答终端将“投保建议2”对应的“统一回复”反馈给用户。其中,“统一回复”为该会话知识图谱在构建过程中,开发人员根据不同的自然查询语句设置的对应回复,此处仅为示例性说明,对此不做限定。
可选地,在一种可能的实现方式中,逻辑路径上对应有多个待反馈节点,当逻辑路径为一条时,上述S103可包括S1031~S1032,下面将具体对步骤S1031~S1032进行说明。
S1031:在逻辑路径中确定与该自然查询语句匹配的待反馈节点。
逻辑路径上对应有多个待反馈节点,当查找到某个实体对应的会话知识图谱中只有一条逻辑路径时,在该逻辑路径中确定与该自然查询语句匹配的待反馈节点。即判断该自然查询语句与该逻辑路径上的哪个待反馈节点匹配。
S1032:获取该待反馈节点中存储的反馈结果,并将该反馈结果反馈给用户。
问答终端获取该待反馈节点中存储的反馈结果,并将该反馈结果反馈给用户。可选地,该逻辑路径上可以有一个或多个待反馈节点,每个待反馈节点存储有相应的反馈结果。当该逻辑路径上只有一个待反馈节点时,无论用户输入的自然查询语句是什么,均可将该待反馈节点中存储的反馈结果反馈给用户。当该逻辑路径上有多个待反馈节点时,问答终端根据自然查询语句确定匹配的待反馈节点,该待反馈节点中存储的反馈结果反馈给用户。
示例性地,当用户想要了解关于糖尿病投保的相关信息时,查找到的关于糖尿病的会话知识图谱中只有一条逻辑路径,且只有一个待反馈节点,该待反馈节点存储的信息为“糖尿病投保建议”。此时,与该自然查询语句匹配的待反馈节点存储的信息为“糖尿病投保建议”,问答终端可直接将糖尿病投保的具体建议反馈给用户。
可选地,在一种可能的实现方式中,当逻辑路径为多条时,上述S103可包括S1033~S1035。值得说明的是,S1033~S1035与S1031~S1032并列,并非在S1032之后执行。即当逻辑路径为一条时,执行S1031~S1032,当逻辑路径为多条时,执行S1033~S1035。以实际实施情况为准,对此不做限定。下面将具体对步骤S1033~S1035进行说明。
S1033:在多条逻辑路径中确定与该自然查询语句匹配的目标逻辑路径。
当查找到某个实体对应的会话知识图谱中有多条逻辑路径时,可先判断该自然查询语句与该会话知识图谱中的哪条逻辑路径更匹配。即在多条逻辑路径中确定与该自然查询语句匹配的目标逻辑路径。
示例性地,假设查找到的两条逻辑路径分别为:有无并发症(是)--投保建议2--统一回复;有无并发症(否)--投保建议3--寿险标准险保/重疾险标准险保/医疗险。用户输入的自然查询语句为“当前没有并发症”,根据该自然查询语句确定的目标逻辑路径为:有无并发症(否)--投保建议3--寿险标准险保/重疾险标准险保/医疗险。
S1034:在目标逻辑路径中确定与该自然查询语句匹配的目标待反馈节点。
判断该自然查询语句与该目标逻辑路径上的哪个目标待反馈节点匹配。示例性地,假设目标逻辑路径为:有无并发症(否)--投保建议3--寿险标准险保/重疾险标准险保/医疗险,根据“当前没有并发症”这一自然查询语句可确定目标待反馈节点为“投保建议3--寿险标准险保/重疾险标准险保/医疗险”。
S1035:获取该目标待反馈节点中存储的反馈结果,并将该反馈结果反馈给用户。
问答终端获取该目标待反馈节点中存储的反馈结果,并将该反馈结果反馈给用户。可选地,该目标逻辑路径上可以有一个或多个目标待反馈节点,每个目标待反馈节点存储有相应的反馈结果。当该目标逻辑路径上只有一个目标待反馈节点时,无论用户输入的自然查询语句是什么,均可将该目标待反馈节点中存储的反馈结果反馈给用户。当该目标逻辑路径上有多个目标待反馈节点时,问答终端根据自然查询语句确定匹配的目标待反馈节点,该目标待反馈节点中存储的反馈结果反馈给用户。
示例性地,假设目标待反馈节点为“投保建议3--寿险标准险保/重疾险标准险保/医疗险”,将“投保建议3”对应的“寿险标准险保/重疾险标准险保/医疗险”中的任意一个或其组合反馈给用户。
可选地,在一种可能的实现方式中,为了能够反馈给用户更全面、准确的反馈结果,在根据用户的自然查询语句识别到实体后,还可进一步地分析该自然查询语句所表现出用户的咨询意图,即分析用户具体想了解关于该实体哪方面的信息。示例性地,每个实体对应的会话知识图谱还可包括多个不同意图的子图谱。例如,甲亢对应的会话知识图谱还可包括关于甲亢投保的子图谱、关于甲亢投保后赔偿的子图谱等。其中,每个子图谱以树形结构存储信息,存储的信息包括实体对应的逻辑路径以及逻辑路径对应的多个反馈结果。
当自然查询语句为“甲亢投保需要注意些什么”,得到的实体为“甲亢”,分析该自然查询语句得到用户想要了解关于甲亢投保的信息,可获取关于甲亢投保的子图谱,并根据该子图谱为用户反馈合适的反馈结果。自然查询语句为“甲亢投保后的赔偿事项有哪些”,得到的实体为“甲亢”,分析该自然查询语句得到用户想要了解关于甲亢投保后的赔偿事项,可获取关于甲亢投保后的赔偿事项的子图谱,并根据该子图谱为用户反馈合适的反馈结果。
可选地,在一种可能的实现方式中,也可以是根据该实体查找到所有与该实体相关的会话知识图谱后,将该会话知识图谱中的子图谱作为候选知识图谱,通过语义模型对这些子图谱中的信息进行排序,得到可能性最大子图谱,即得到和用户想要了解的信息相关性最强的子图谱,并基于该子图谱反馈给用户相应的反馈结果。
本申请实施例,会话知识图谱以树形结构存储信息,该信息包括实体对应的逻辑路径以及该逻辑路径对应的多个反馈结果。尤其当用户的问题涉及到逻辑时,无需会话知识图谱进行逻辑判断,而是可以直接根据预先构建好的会话知识图谱中的信息进行查找,反馈给用户准确的回答,加快了处理用户问题的速度,提升了反馈给用户信息的准确性。且每个实体对应的逻辑路径以及逻辑路径对应的多个反馈结果以树形结构在会话知识图谱中存储,方便该这些信息的维护与扩充。
如图3所示,图3是本申请又一实施例提供的一种基于知识图谱的问答方法的示意性流程图,可选地,在一种可能的实现方式中,如图3所示的基于知识图谱的问答方法可包括S201~S204。其中,图3所示的步骤S202~S204可以参考上述对S101~S103的相关描述,为了简洁,这里不再赘述。下面将具体对步骤S201进行说明。
S201:配置每个实体对应的会话知识图谱。
问答终端预先配置每个实体对应的会话知识图谱。具体地,问答终端先收集与每个待配置的实体相关的信息,例如,待配置的实体对应的别称、相关的投保信息、相关的疾病信息、投保赔偿信息等。将待配置的实体作为会话知识图谱的索引,然后确定待配置的实体相关的信息对应的节点属性以及存储位置,并根据节点属性以及存储位置在数据库中以树形结构存储每个待配置的实体和各个信息,得到每个实体对应的会话知识图谱。其中,节点属性可以包括根节点、子节点以及叶子节点。
可选地,在一种可能的实现方式中,上述S201可包括S2011~S2013,下面将具体对步骤S2011~S2013进行说明。
S2011:获取每个待配置的实体对应的结构化数据;所述结构化数据包括多个子信息,所述子信息为待存储在所述会话知识图谱中的信息。
问答终端预先在各种数据库、各大网站等收集每个待配置的实体对应的数据。该数据可以包括结构化数据和非结构化数据,结构化数据包括多个子信息,子信息为待存储在会话知识图谱中的信息。
结构化数据是指其包括的子信息可直接存储至会话知识图谱中的数据,非结构化数据不可直接存储至会话知识图谱中。例如,非结构化数据可以是口语化数据、未进行划分的一大段文字等。当获取到待配置的实体对应的数据为非结构化数据时,可先将非结构化数据转换为结构化数据。例如,识别到数据为小语种外文,可对该数据进行翻译;识别到数据较为口语化,则进行分词、去停用词等处理,然后转换为书面用语;识别到的数据为未进行划分的一大段文字,则分析该段文字,基于其包含的逻辑信息进行划分,得到多个子信息。此处仅为示例性说明,对此不做限定。
示例性地,若获取到甲亢对应的数据为“甲亢功能正常且有并发症时建议购买A保险,甲亢功能正常且无并发症时建议购买B保险”。则对该段文字进行划分得到“目前甲亢功能是否正常(是)、有无并发症(是)、投保建议--A保险;目前甲亢功能是否正常(是)--有无并发症(否)、投保建议--B保险”这些子信息。这些子信息将被存储在会话知识图谱中。
S2012:确定每个子信息对应的节点属性以及存储位置。
节点属性可以包括根节点、子节点以及叶子节点,根节点、子节点以及叶子节点对应的信息以树形结构在会话知识图谱中存储时,会存储至不同的位置。问答终端分析每个子信息,为每个子信息分配不同的节点属性,根据各自对应的节点属性确定各个子信息对应的存储位置。
S2013:基于每个子信息对应的节点属性以及存储位置,在数据库中以树形结构存储每个待配置的实体以及每个子信息,得到每个待配置的实体对应的会话知识图谱。
针对一个待配置的实体,根据该实体的每个子信息对应的节点属性和存储位置,在数据库中以树形结构存储该实体以及每个子信息,当目前所有子信息存储完成后,得到该实体对应的会话知识图谱。问答终端对每个待配置的实体都进行上述操作,得到每个待配置实体对应的会话知识图谱。
为了便于理解,以甲亢的投保信息为例进行说明,获取与甲亢投保相关的信息,如“目前甲亢功能是否正常、有无并发症、关于甲亢的投保建议--寿险标保、重疾险标保、医疗险除外、寿险标延期、重疾险延期、医疗险延期”等信息,对这些信息进行解析,将解析得到的“甲亢”作为树的索引,确定各个子信息对应的节点属性和存储位置。例如为“目前甲亢功能是否正常”进行标注“T”属性,将其作为根节点;对“目前甲亢功能是否正常”进行分支,当目前甲亢功能正常,为“有无并发症”标注“TL”属性,将其作为根节点的左子树(子节点);当目前甲亢功能非正常,为甲亢功能不正常时对应的“投保建议”标注“TR”属性,将其作为根节点的右子树(子节点)。按照该方法,递归生成深度为4的叶子节点。
本申请实施例,会话知识图谱以树形结构存储信息,该信息包括实体对应的逻辑路径以及该逻辑路径对应的多个反馈结果。尤其当用户的问题涉及到逻辑时,无需会话知识图谱进行逻辑判断,而是可以直接根据预先构建好的会话知识图谱中的信息进行查找,反馈给用户准确的回答,加快了处理用户问题的速度,提升了反馈给用户信息的准确性。且每个实体对应的逻辑路径以及逻辑路径对应的多个反馈结果以树形结构在会话知识图谱中存储,方便该这些信息的维护与扩充。
如图4所示,图4是本申请再一实施例提供的一种基于知识图谱的问答方法的示意性流程图,可选地,在一种可能的实现方式中,如图4所示的基于知识图谱的问答方法可包括S301~S304。其中,图4所示的步骤S301~S303可以参考上述对S101~S103的相关描述,为了简洁,这里不再赘述。下面将具体对步骤S304进行说明。
S304:当基于反馈结果检测到当前问答流程结束时,清除与该用户相关的所有自然查询语句以及所有反馈结果。
问答终端可检测当前的反馈结果在会话知识图谱中存储的位置是否为叶子节点。当检测到反馈结果对应的不是叶子节点时,证明本次问答流程还未结束,可继续与用户进行交互;当检测到反馈结果对应的是叶子节点时,证明本次问答流程已结束,可清除与该用户相关的所有自然查询语句以及所有反馈结果。
本实施例中,当基于反馈结果检测到当前问答流程结束时,清除与该用户相关的所有自然查询语句以及所有反馈结果,可避免后续用户的问答出错。例如,针对A用户的问答流程以结束,当B用户咨询同类问题时,问答终端可能会将针对A用户的反馈结果反馈给B用户,但是及时清除关于A用户的自然查询语句以及反馈结果可避免这种问题发生,进而保证给每个用户准确的反馈结果。
可选地,在一种可能的实现方式中,在步骤S103之后、或在步骤S204之后、或在步骤S304之后,还可包括:将每个实体对应的会话知识图谱上传至区块链中。
在本实施例中,将每个实体对应的会话知识图谱上传至区块链中可保证其安全性和对用户的公正透明性。且将每个实体对应的会话知识图谱上传至区块链中,借助区块链上文件无法随意篡改的特性,能够避免会话知识图谱被恶意篡改,便于后续根据这些会话知识图谱给用户准确的反馈结果。
本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
请参见图5,图5是本申请一实施例提供的一种基于知识图谱的问答装置的示意图。该问答装置包括的各单元用于执行图1、图3、图4对应的实施例中的各步骤。具体请参阅图1、图3、图4各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图5,包括:
第一获取单元410,用于获取用户输入的自然查询语句所对应的实体;
第二获取单元420,用于获取与所述实体对应的会话知识图谱;所述会话知识图谱以树形结构存储信息;所述信息包括所述实体对应的逻辑路径,以及所述逻辑路径对应的多个反馈结果;
查找单元430,用于基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户。
可选地,所述逻辑路径上对应有多个待反馈节点,当所述逻辑路径为一条时,所述查找单元430具体用于:
在所述逻辑路径中确定与所述自然查询语句匹配的待反馈节点;
获取所述待反馈节点中存储的反馈结果,并将所述反馈结果反馈给所述用户。
可选地,当所述逻辑路径为多条时,所述查找单元430具体用于:
在多条逻辑路径中确定与所述自然查询语句匹配的目标逻辑路径;
在所述目标逻辑路径中确定与所述自然查询语句匹配的目标待反馈节点;
获取所述目标待反馈节点中存储的反馈结果,并将所述反馈结果反馈给所述用户。
可选地,所述问答装置还包括:
配置单元,用于配置每个实体对应的会话知识图谱。
可选地,所述配置单元具体用于:
获取每个待配置的实体对应的结构化数据;所述结构化数据包括多个子信息,所述子信息为待存储在所述会话知识图谱中的信息;
确定每个子信息对应的节点属性以及存储位置;
基于每个子信息对应的节点属性以及存储位置,在数据库中以树形结构存储每个待配置的实体以及每个子信息,得到每个待配置的实体对应的会话知识图谱。
可选地,所述问答装置还包括:
清除单元,用于当基于所述反馈结果检测到当前问答流程结束时,清除与所述用户相关的所有自然查询语句以及所有反馈结果。
可选地,所述问答装置还包括:
上传单元,用于将每个实体对应的会话知识图谱上传至区块链中。
请参见图6,图6是本申请另一实施例提供的一种基于知识图谱的问答终端的示意图。如图6所示,该实施例的问答终端5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机可读指令52。所述处理器50执行所述计算机可读指令52时实现上述各个处理问答方法实施例中的步骤,例如图1所示的S101至S103。或者,所述处理器50执行所述计算机可读指令52时实现上述各实施例中各单元的功能,例如图5所示单元410至430功能。
示例性地,所述计算机可读指令52可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器51中,并由所述处理器50执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令52在所述问答终端5中的执行过程。例如,所述计算机可读指令52可以被分割为第一获取单元、第二获取单元以及查找单元,各单元具体功能如上所述。
所述问答终端可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图6仅仅是问答终端5的示例,并不构成对问答终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述问答终端还可以包括输入输出终端、网络接入终端、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述问答终端的内部存储单元,例如问答终端的硬盘或内存。所述存储器51也可以是所述问答终端的外部存储终端,例如该问答终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括问答终端的内部存储单元也包括外部存储终端。所述存储器51用于存储所述计算机可读指令以及所述问答终端所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于知识图谱的问答方法,其特征在于,包括:
获取用户输入的自然查询语句所对应的实体;
获取与所述实体对应的会话知识图谱;所述会话知识图谱以树形结构存储信息,所述信息包括所述实体对应的逻辑路径,以及所述逻辑路径对应的多个反馈结果;
基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户。
2.如权利要求1所述的问答方法,其特征在于,所述逻辑路径上对应有多个待反馈节点,当所述逻辑路径为一条时,所述基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户,包括:
在所述逻辑路径中确定与所述自然查询语句匹配的待反馈节点;
获取所述待反馈节点中存储的反馈结果,并将所述反馈结果反馈给所述用户。
3.如权利要求1所述的问答方法,其特征在于,当所述逻辑路径为多条时,所述基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户,包括:
在多条逻辑路径中确定与所述自然查询语句匹配的目标逻辑路径;
在所述目标逻辑路径中确定与所述自然查询语句匹配的目标待反馈节点;
获取所述目标待反馈节点中存储的反馈结果,并将所述反馈结果反馈给所述用户。
4.如权利要求1至3任一项所述的问答方法,其特征在于,所述获取用户输入的自然查询语句所对应的实体之前,所述问答方法还包括:
配置每个实体对应的会话知识图谱。
5.如权利要求4所述的问答方法,其特征在于,所述配置每个实体对应的会话知识图谱,包括:
获取每个待配置的实体对应的结构化数据;所述结构化数据包括多个子信息,所述子信息为待存储在所述会话知识图谱中的信息;
确定每个子信息对应的节点属性以及存储位置;
基于每个子信息对应的节点属性以及存储位置,在数据库中以树形结构存储每个待配置的实体以及每个子信息,得到每个待配置的实体对应的会话知识图谱。
6.如权利要求5所述的问答方法,其特征在于,所述基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户之后,所述问答方法还包括:
当基于所述反馈结果检测到当前问答流程结束时,清除与所述用户相关的所有自然查询语句以及所有反馈结果。
7.如权利要求4所述的问答方法,其特征在于,所述配置每个实体对应的会话知识图谱之后,所述问答方法还包括:
将每个实体对应的会话知识图谱上传至区块链中。
8.一种基于知识图谱的问答装置,其特征在于,包括:
第一获取单元,用于获取用户输入的自然查询语句所对应的实体;
第二获取单元,用于获取与所述实体对应的会话知识图谱;所述会话知识图谱以树形结构存储信息;所述信息包括所述实体对应的逻辑路径,以及所述逻辑路径对应的多个反馈结果;
查找单元,用于基于所述自然查询语句以及所述逻辑路径,在所述会话知识图谱中查找与所述自然查询语句匹配的反馈结果,并将所述反馈结果反馈给所述用户。
9.一种基于知识图谱的问答终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
CN202011488132.5A 2020-12-16 2020-12-16 基于知识图谱的问答方法、装置、终端以及存储介质 Pending CN112559709A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011488132.5A CN112559709A (zh) 2020-12-16 2020-12-16 基于知识图谱的问答方法、装置、终端以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011488132.5A CN112559709A (zh) 2020-12-16 2020-12-16 基于知识图谱的问答方法、装置、终端以及存储介质

Publications (1)

Publication Number Publication Date
CN112559709A true CN112559709A (zh) 2021-03-26

Family

ID=75064202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011488132.5A Pending CN112559709A (zh) 2020-12-16 2020-12-16 基于知识图谱的问答方法、装置、终端以及存储介质

Country Status (1)

Country Link
CN (1) CN112559709A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113064970A (zh) * 2021-04-08 2021-07-02 易联众信息技术股份有限公司 一种多轮对话智能问询处理方法、系统、介质及设备
CN113157887A (zh) * 2021-04-20 2021-07-23 中国平安人寿保险股份有限公司 知识问答意图识别方法、装置、及计算机设备
CN113204626A (zh) * 2021-04-30 2021-08-03 平安科技(深圳)有限公司 基于知识图谱的交互方法、装置、终端和存储介质
CN114090755A (zh) * 2021-11-30 2022-02-25 平安科技(深圳)有限公司 基于知识图谱的回复语句确定方法、装置及电子设备
CN114968034A (zh) * 2022-04-24 2022-08-30 上海传英信息技术有限公司 交互方法、智能终端及存储介质
CN118093835A (zh) * 2024-04-23 2024-05-28 国网山东省电力公司滨州市滨城区供电公司 基于大语言模型云服务的供电服务问答方法、系统及介质
CN114090755B (zh) * 2021-11-30 2024-07-12 平安科技(深圳)有限公司 基于知识图谱的回复语句确定方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268580A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 基于知识图谱的问答方法及装置
US20200042642A1 (en) * 2018-08-02 2020-02-06 International Business Machines Corporation Implicit dialog approach for creating conversational access to web content
CN111241252A (zh) * 2020-04-17 2020-06-05 成都数联铭品科技有限公司 一种问答方法及问答装置、电子设备、存储介质
CN111949787A (zh) * 2020-08-21 2020-11-17 平安国际智慧城市科技股份有限公司 基于知识图谱的自动问答方法、装置、设备及存储介质
CN112015918A (zh) * 2020-09-14 2020-12-01 支付宝(杭州)信息技术有限公司 数据处理方法及装置
CN112052341A (zh) * 2020-09-03 2020-12-08 中国银行股份有限公司 知识图谱剪枝方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268580A (zh) * 2017-07-14 2018-07-10 广东神马搜索科技有限公司 基于知识图谱的问答方法及装置
US20200042642A1 (en) * 2018-08-02 2020-02-06 International Business Machines Corporation Implicit dialog approach for creating conversational access to web content
CN111241252A (zh) * 2020-04-17 2020-06-05 成都数联铭品科技有限公司 一种问答方法及问答装置、电子设备、存储介质
CN111949787A (zh) * 2020-08-21 2020-11-17 平安国际智慧城市科技股份有限公司 基于知识图谱的自动问答方法、装置、设备及存储介质
CN112052341A (zh) * 2020-09-03 2020-12-08 中国银行股份有限公司 知识图谱剪枝方法及装置
CN112015918A (zh) * 2020-09-14 2020-12-01 支付宝(杭州)信息技术有限公司 数据处理方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113064970A (zh) * 2021-04-08 2021-07-02 易联众信息技术股份有限公司 一种多轮对话智能问询处理方法、系统、介质及设备
CN113157887A (zh) * 2021-04-20 2021-07-23 中国平安人寿保险股份有限公司 知识问答意图识别方法、装置、及计算机设备
CN113204626A (zh) * 2021-04-30 2021-08-03 平安科技(深圳)有限公司 基于知识图谱的交互方法、装置、终端和存储介质
CN114090755A (zh) * 2021-11-30 2022-02-25 平安科技(深圳)有限公司 基于知识图谱的回复语句确定方法、装置及电子设备
CN114090755B (zh) * 2021-11-30 2024-07-12 平安科技(深圳)有限公司 基于知识图谱的回复语句确定方法、装置及电子设备
CN114968034A (zh) * 2022-04-24 2022-08-30 上海传英信息技术有限公司 交互方法、智能终端及存储介质
CN118093835A (zh) * 2024-04-23 2024-05-28 国网山东省电力公司滨州市滨城区供电公司 基于大语言模型云服务的供电服务问答方法、系统及介质

Similar Documents

Publication Publication Date Title
US9721205B2 (en) Clarification of submitted questions in a question and answer system
CN112559709A (zh) 基于知识图谱的问答方法、装置、终端以及存储介质
US20180225363A1 (en) System and Methods for Automating Trademark and Service Mark Searches
US11392775B2 (en) Semantic recognition method, electronic device, and computer-readable storage medium
WO2021174783A1 (zh) 近义词推送方法、装置、电子设备及介质
US10430469B2 (en) Enhanced document input parsing
CN106462604B (zh) 识别查询意图
US20140351228A1 (en) Dialog system, redundant message removal method and redundant message removal program
CN111309863B (zh) 基于知识图谱的自然语言问答方法及装置
CN113312461A (zh) 基于自然语言处理的智能问答方法、装置、设备及介质
US8825620B1 (en) Behavioral word segmentation for use in processing search queries
Kadima et al. Toward ontology-based personalization of a recommender system in social network
CN112115232A (zh) 一种数据纠错方法、装置及服务器
CN111078837A (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
US11594054B2 (en) Document lineage management system
CN113254671B (zh) 基于query分析的图谱优化方法、装置、设备及介质
CN111783425B (zh) 基于句法分析模型的意图识别方法及相关装置
CN113157887A (zh) 知识问答意图识别方法、装置、及计算机设备
CN114391142A (zh) 使用结构化和非结构化数据的解析查询
US9946765B2 (en) Building a domain knowledge and term identity using crowd sourcing
CN116090450A (zh) 一种文本处理方法及计算设备
CN115114420A (zh) 一种知识图谱问答方法、终端设备及存储介质
US11017172B2 (en) Proposition identification in natural language and usage thereof for search and retrieval
CN113590792A (zh) 用户问题的处理方法、装置和服务器
CN116306622B (zh) 一种用于改善舆论氛围的aigc评论系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination