CN112507135B - 知识图谱查询模板构建方法、装置、系统、以及存储介质 - Google Patents
知识图谱查询模板构建方法、装置、系统、以及存储介质 Download PDFInfo
- Publication number
- CN112507135B CN112507135B CN202011495626.6A CN202011495626A CN112507135B CN 112507135 B CN112507135 B CN 112507135B CN 202011495626 A CN202011495626 A CN 202011495626A CN 112507135 B CN112507135 B CN 112507135B
- Authority
- CN
- China
- Prior art keywords
- query
- question
- user
- attribute
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种可视化知识图谱查询模板构建方法,包括以下步骤:通过可视化查询方式,预先构建不同意图对应的查询模板;接收用户问句,并提取该用户问句包含的意图和实体;根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板;根据该用户问句匹配的查询模板,构建对应的查询语句;根据构建的查询语句,查询知识图谱数据,并返回查询结果。另外,本发明还提供一种可视化知识图谱查询模板构建的装置、系统、以及存储介质。本发明可以提升知识图谱查询模板的构建效率。
Description
技术领域
本发明涉及知识图谱问答技术领域,特别涉及一种可视化知识图谱查询模板构建方法、装置、系统以及存储介质。
背景技术
知识图谱作为一种知识的结构化表示形式,是一种大规模语义网络,包含实体、概念及其之间的各种语义关系。查询和检索是知识图谱的重要使用方式,也是知识图谱数据管理系统的核心能力之一,而目前的查询检索要求使用者使用复杂图查询语句,学习成本非常大。
目前基于知识图谱结构化数据的问答涉及的查询模板技术,需要通过非可视化的方式手动构建查询模板实现、效率较低,并且需要使用者对复杂的图查询语言有很深厚的基础,阻碍了知识图谱问答的应用。
发明内容
鉴于此,本发明提供了一种可视化知识图谱查询模板构建方法、装置、系统以及存储介质。
第一方面,本发明提供了一种可视化知识图谱查询模板构建方法,所述方法包括以下步骤:
S1:通过可视化查询方式,预先构建不同意图对应的查询模板;
S2:接收用户问句,并提取该用户问句包含的意图和实体;
S3:根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板;
S4:根据该用户问句匹配的查询模板,构建对应的查询语句;
S5:根据构建的查询语句,查询知识图谱数据,并返回查询结果。
优选地,所述步骤S1包括:
S1.1:通过图形操作界面,接收查询模板的基础信息,所述基础信息包括意图名称和意图模板名称;
S1.2:通过所述图形操作界面,创建对应查询的节点及所需的限定字段;
S1.3:根据创建的多个节点和相应的限定字段,组合形成不同意图对应的查询模板。
优选地,所述限定字段包括:反问问题、节点所属概念、节点关系步长、查询属性、排序属性、上限属性、下限属性、区间概念、限定关系、除外关系、查询关系、对比属性列表、对比概念、并列概念。
优选地,所述反问问题用于:当用户问句匹配到的查询模板在知识图谱中有多个路径数据存在时,设置反问用户查询路径的问题;
所述节点所属概念用于:设置当前节点的实体类型;所述节点关系步长用于:设置当前节点与下一节点在知识图谱中的关系长度;所述查询属性用于:设置需要查询的当前节点的数据属性;
所述排序属性用于:当查询结果为多个时,按照选择的属性进行升序排列或降序排列;所述上限属性用于:设置用户问句中与数据属性的属性值进行大小比较的属性值上限;所述下限属性用于:设置用户问句中与数据属性的属性值进行大小比较的属性值下限;
所述区间概念用于:与所述上限属性和下限属性搭配使用,设置对比的实体类型;所述限定关系用于:限定当前节点与下一节点之间的关系;所述除外关系用于:限定当前节点与下一节点之间不能存在的关系;
所述查询关系用于:表示查询当前节点对应关系上的另一个节点;所述对比属性列表用于:存在对比概念时,可添加的一个或多个属性组成的列表;所述对比概念用于:与对比属性列表搭配使用,表示需要进行属性对比的实体类型;所述并列概念用于:添加两个无直接关系,但都与上一节点存在关系的实体类型。
优选地,所述关系步长包括固定长度和可变长度,所述固定长度是指:两个节点之间的关系数量固定,所述可变长度是指:两个节点之间的关系数量为范围区间。
优选地,添加限定关系字段和除外关系字段时,不能使用步长字段。
优选地,所述步骤S4包括:将所述用户问句的实体填充至所述匹配的查询模板,得到具体的查询路径;将得到的具体查询路径转化为对应的图数据库查询语句。
第二方面,本发明提供了一种装置,所述装置包括存储器、与所述存储器耦接的处理器,其中:
所述存储器存储有用于实现可视化知识图谱查询模板构建方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制所述可视化知识图谱查询模板构建方法的执行。
第三方面,本发明提供了一种可视化知识图谱查询模板构建系统,包括:
查询模板构建模块,用于通过可视化查询方式,预先构建不同意图对应的查询模板;
提取模块,用于接收用户问句,并提取该用户问句包含的意图和实体;
匹配模块,用于根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板;
查询语句构建模块,用于根据该用户问句匹配的查询模板,构建对应的查询语句;及
查询模块,用于根据构建的查询语句,查询知识图谱数据,并返回查询结果。
第四方面,本发明提供了一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行可视化知识图谱查询模板构建方法。
相较于现有技术,本发明实施例提供的一种可视化知识图谱查询模板构建方法、装置、系统及存储介质,通过利用图形操作界面可视化构建查询模板,用户问答时将查询模板自动转化为图查询语句,在知识图谱中进行数据查询。与现有技术相比,本发明实施例产生的有益效果在于:(1)可视化构建知识图谱查询模板,提升知识图谱查询模板的构建效率;(2)通过查询节点的限定字段辅助生成查询语句。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的可视化知识图谱查询模板构建方法的流程图;
图2为本发明实施例1中多个实体节点与关系所形成的一个知识图谱中的子图谱示意图。
图3为本发明实施例1中可视化构建知识图谱查询模板的图形操作界面第一示意图;
图4为本发明实施例1中可视化构建知识图谱查询模板的图形操作界面第二示意图;
图5为本发明实施例1中通过图形操作界面构建的查询模板示意图;
图6为本发明实施例2提供的装置结构示意图;
图7为本发明实施例3提供的可视化知识图谱查询模板构建系统的结构示意图;
图8为本发明实施例4提供的存储介质的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
进一步需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
实施例1
请参阅图1,为本发明实施例1提供的可视化知识图谱查询模板构建方法的流程图。在本实施例中,根据不同的需求,图1所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
在描述本发明具体步骤前,首先简要介绍知识图谱的几个基本术语。
概念(concept):即实体类型,不特指某一实体,而是指一类实体,例如“人”;实体(entity):又称对象(object)或实例(instance),例如“张三”;关系(relation):实体与实体之间的关联关系,例如:张三和李四的关系为“朋友”;属性值:实体本身所附带的属性,例如“张三的身高”;路径:多个实体节点与关系所形成的一个知识图谱中的子图谱(参阅图2所示)。
本实施例1将使用如下示例方式:(总公司:Baoxiangongsi)->[职位]->(产品经理:Zhiwei),其中,小括号中冒号前面部分表示为实体,小括号中冒号后面部分表示为实体的概念,方括号中表示为关系。如果小括号中没有冒号,则小括号中表示为实体。
以下具体描述本发明可视化知识图谱查询模板构建方法的具体步骤。
步骤S1:通过可视化查询方式,预先构建不同意图对应的查询模板(即查询路径模板)。
进一步地,在其中一些实施例中,所述步骤S1包括:
步骤S1.1:通过图形操作界面(参阅图3所示),接收查询模板的基础信息,所述基础信息包括意图名称和意图模板名称。在其中一些实施例中,所述基础信息还包括无数据话术和简介等内容。
步骤S1.2:通过所述图形操作界面,创建对应查询的节点及所需的限定字段(参阅图4所示)。
在其中一些实施例中,所述限定字段包括:反问问题、节点所属概念、节点关系步长、查询属性、排序属性、上限属性、下限属性、区间概念、限定关系、除外关系、查询关系、对比属性列表、对比概念、并列概念。
所述反问问题用于:当用户问句匹配到的查询模板在知识图谱中有多个路径数据存在时,设置反问用户查询路径的问题;所述节点所属概念用于:设置当前节点的实体类型。
所述节点关系步长用于:设置当前节点与下一节点在知识图谱中的关系长度。在其中一些实施例中,所述关系步长包括固定长度和可变长度。具体地,所述固定长度是指:两个节点之间的关系数量固定,所述可变长度是指:两个节点之间的关系数量为范围区间。
举例而言,针对示例“(总公司)->[职位]->(产品经理)->[员工]->(小吴)”,在关系步长为固定长度的情形下,两个节点之间的关系数量固定,此时,“总公司”与“产品经理”之间的关系为“职位”、关系步长为1,“总公司”与“小吴”的关系为“员工”、关系步长为2。如果设定固定长度为2,则“总公司->[职位]->产品经理”这个查询路径便无法匹配。在关系步长为可变长度的情形下,两个节点之间的关系数量为范围区间,如:设定范围为1-3。此时,以下两个查询路径均可匹配:“(总公司)->[职位]->(产品经理)”、“(总公司)->[职位]->(产品经理)->[员工]->(小吴)”。
所述查询属性用于:设置需要查询的当前节点的数据属性;所述排序属性用于:当查询结果为多个时,按照选择的数据属性进行升序排列或降序排列。
所述上限属性用于:设置用户问句中与数据属性的属性值进行大小比较的属性值上限;所述下限属性用于:设置用户问句中与数据属性的属性值进行大小比较的属性值下限。
所述区间概念用于:与所述上限属性和下限属性搭配使用,设置对比的实体类型。举例而言,假设“职位”概念有以下两个属性:“最大年龄”和“最小年龄”。此时,可将“最大年龄”设定为上限属性,“最小年龄”设定为下限属性,“年龄”设定为区间概念。一个概念为“职位”的实体“产品经理”,对应的属性值为:最大年龄:40岁,最小年龄:18岁,本发明便可根据对应的属性值,在知识图谱中匹配到相应的查询结果。
所述限定关系用于:限定当前节点与下一节点之间的关系。举例而言,针对“(总公司)->[分公司]->(深圳分公司)”、“(总公司)->[地点]->(深圳分公司)”,此时,“总公司”与“深圳分公司”之间存在多个关联关系,通过限定关系(如分公司),则可以得到指定的查询路径“(总公司)->[分公司]->(深圳分公司)”。
需要说明的是,在其中一些实施例中,添加限定关系字段时,不能使用步长字段。由于只有当两个节点之间的关系为直接关联关系时,才可配置限定关系,故添加限定关系字段时不能使用步长字段。例如:针对“(总公司)->[职位]->(产品经理)->[员工]->(小吴)”,此时,“总公司”与“小吴”之间的关系步长为2,并无直接关联关系,因此无法设定限定关系。
所述除外关系用于:限定当前节点与下一节点之间不能存在的关系。与限定关系类似,在其中一些实施例中,添加除外关系字段时,同样不能使用步长字段。
所述查询关系用于:表示查询当前节点对应关系上的另一个节点;所述对比属性列表用于:存在对比概念时,可添加的一个或多个属性组成的列表。
所述对比概念用于:与对比属性列表搭配使用,表示需要进行属性对比的实体类型。举例而言,假设用户问句为:产品a与产品b有什么区别?若要满足此用户问句,应配置对比概念为:产品,并配置欲展示的对比属性列表:[价格,尺寸,型号]等。
所述并列概念用于:添加两个无直接关系,但都与上一节点存在关系的实体类型。举例而言,针对“(产品经理)<-[职位]->(总公司)->[分公司]->(深圳分公司)”,此时,“产品经理”、“深圳分公司”均为总公司的直接关联的实体,但二者之间不存在直接关系,即二者为并列概念。
步骤S1.3:根据创建的多个节点和相应的限定字段,组合形成不同意图对应的查询模板(即查询路径模板,参阅图5所示)。其中,所述查询模板未填充实体,仅作为知识图谱概念的查询路径模板,填充实体后即为具体的查询路径。
步骤S2:接收用户问句,并提取该用户问句包含的意图和实体。
在其中一些实施例中,所述提取该用户问句包含的意图可以采用基于深度学习的方法、基于机器学习的方法、基于规则的方法,或者上述方法的混合。用户问句意图的提取属于短文本分类问题,例如,在涉及保险领域的用户问句时,用户问句的意图主要包括:核保、理赔、核查(如是否可以续保)等。
当提取到用户问句的意图后,需要进一步从该用户问句中提取该意图对应的实体。例如,用户问句为“我几年xx岁,可以投保xx保险产品吗?”,该用户问句的意图为“核保”,对应的实体为“年龄”和“产品”。由于每一用户意图可能对应多个实体,例如,核保对应的实体可能包含“年龄”、“疾病”、“地区”、“职业”、“产品”等,因此,需要确定每一用户意图对应的实体类型,以便后续步骤匹配到合适的查询模板。在其中一些实施例中,可以采用基于NLP(Natural Language Processing,自然语言处理)的技术对接收到的用户问句进行分词,并通过实体识别模型从分词后的用户问句中提取出用户意图对应的实体。
步骤S3:根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板。
在其中一些实施例中,根据不同业务场景,可以预先构建不同类型的用户问句对应的查询模版。如上所述,对应于一个用户意图,该意图可能对应多个实体类型,因此需要预先构建不同的查询模板来生成对应的查询语句。根据提取的用户问句意图和实体信息,即可从预先构建的查询模板中匹配该用户问句对应的查询模板。一般而言,一个意图和实体类型对应一个查询模板。
在其中一些实施例中,可以通过特定的分类器进行查询模板匹配,本实施例1以贝叶斯分类器进行举例说明。首先,将所述用户问句的意图和实体信息输入至贝叶斯分类器。然后,计算贝叶斯分类器中各个预设模板与所述用户语句的匹配度,将匹配度最高的预设模板确定为查询模板。具体地,贝叶斯分类器通过计算某一实体的先验概率,并利用贝叶斯公式计算出该实体属于某一类的概率,选择具有最大后验概率的类型作为该实体所属的类型。在其中一些实施例中,所述贝叶斯分类器的预设模板包括:实体查询模板、关系查询模板、以及属性查询模板。
步骤S4:根据该用户问句匹配的查询模板,构建对应的查询语句。
在其中一些实施例中,所述步骤S4包括:首先,将所述用户问句的实体填充至所述匹配的查询模板,得到具体的查询路径;然后,将得到的具体查询路径转化为对应的图数据库查询语句。举例而言,假设填充实体后的具体查询路径为“(总公司:Baoxiangongsi)->[产品]->(:Baoxianchanpin)”,则构建的对应查询语句为“match(n:Baoxiangongsi)-[r]->(m:Baoxianchanpin)where n.name=“总公司”return m.name”。
步骤S5:根据构建的查询语句,查询知识图谱数据,并返回查询结果。
进一步地,在其中一些实施例中,所述步骤S5包括:将构建的查询语句输入至预先设置的知识图谱中,通过向量特征匹配的方式得到对应的查询结果,并将该查询结果返回至上层应用。上层应用根据预先设置的话术模板,生成最终回答并返回给用户。
以下通过一个具体的实例,说明上述方法步骤的具体流程。
1、构建意图为“问产品”的意图模板(参阅图4所示)。
2、用户提问:“你们公司都有些什么产品?”提取出用户问句的意图为:“问产品”,提取出用户问句包含的实体为:总公司。
3、根据用户问句意图“问产品”,匹配中对应的意图模板,可得到如下查询路径模板:(:Baoxiangongsi)->[产品]->(:Baoxianchanpin)。在该查询路径模板中填充实体“总公司”后,可得到具体的查询路径:(总公司:Baoxiangongsi)->[产品]->(:Baoxianchanpin)。
4、将得到的查询路径转化为以下图数据库查询语句:
match(n:Baoxiangongsi)-[r]->(m:Baoxianchanpin)where n.name=“总公司”return m.name。
5、查询知识图谱数据得到查询结果:[“人寿保险”,”交通意外险”]。上层应用根据预先设置的话术模板,生成最终回答“我们公司有人寿保险和交通意外险两款产品”并返回给用户。
实施例2
请参阅图6,为本发明实施例2提供的装置结构示意图。
在其中一些实施例中,所述装置2可包括但不限于,存储器21、与所述存储器21耦接的处理器22,所述存储器21和处理器22可通过系统总线相互通信连接。需要指出的是,图6仅示出了具有组件21和22的装置2,但是应理解的是,实施例2并没有示出装置2的所有组件,装置2具有可以替代实施的更多或者更少的组件。其中,所述装置2可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备,该装置2可以是独立的服务器,也可以是多个服务器所组成的服务器集群。
所述存储器21存储有用于实现上述可视化知识图谱查询模板构建方法的程序指令。所述存储器21至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器21可以是所述装置2的内部存储单元,例如该装置2的硬盘或内存。在另一些实施例中,所述存储器21也可以是所述装置2的外部存储设备,例如该装置2上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括所述装置2的内部存储单元也包括其外部存储设备。本实施例中,所述存储器21通常用于存储安装于所述装置2的操作系统、各类应用软件、和系统代码等。此外,所述存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器22用于执行存储器21存储的程序指令以控制可视化知识图谱查询模板构建方法的执行。其中,处理器22还可以称为CPU(Central Processing Unit,中央处理单元)。处理器22可能是一种集成电路芯片,具有信号的处理能力。处理器22还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。该处理器22通常用于控制所述装置2的总体操作,例如执行与所述装置2进行数据交互或者通信相关的控制和处理等。本实施例2中,所述处理器22用于运行所述存储器21中存储的程序代码或者处理数据等。
在其中一些实施例中,所述装置2还包括网络接口(如无线网络接口或有线网络接口),该网络接口通常用于在所述装置2与其他电子设备(如用户手机)之间建立通信连接。例如,所述网络接口用于通过网络将所述装置2与外部数据平台相连,在所述装置2与外部数据平台之间的建立数据传输通道和通信连接。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
实施例3
请参阅图7,为本发明实施例3提供的可视化知识图谱查询模板构建系统的结构示意图。
本实施例中,所述的可视化知识图谱查询模板构建系统3可以被分割成一个或多个程序模块,所述一个或者多个程序模块被存储于所述存储器21中,并由一个或多个处理器(如处理器22)所执行,以完成本发明。例如,在图7中,所述的可视化知识图谱查询模板构建系统3可以被分割成查询模板构建模块31、提取模块32、匹配模块33、查询语句构建模块34、及查询模块35。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序更适合于描述所述可视化知识图谱查询模板构建系统3在所述装置2中的执行过程。以下将就各程序模块31-35的功能进行详细描述。
所述查询模板构建模块31,用于通过可视化查询方式,预先构建不同意图对应的查询模板(即查询路径模板),具体方法参见实施例1中步骤S1的描述,在此不再赘述。
所述提取模块32,用于接收用户问句,并提取该用户问句包含的意图和实体,具体方法参见实施例1中步骤S2的描述,在此不再赘述。
所述匹配模块33,用于根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板,具体方法参见实施例1中步骤S3的描述,在此不再赘述。
所述查询语句构建模块34,用于根据该用户问句匹配的查询模板,构建对应的查询语句,具体方法参见实施例1中步骤S4的描述,在此不再赘述。
所述查询模块35,用于根据构建的查询语句,查询知识图谱数据,并返回查询结果,具体方法参见实施例1中步骤S5的描述,在此不再赘述。
实施例4
请参阅图8,为本发明实施例4提供的存储介质的结构示意图。
在其中一些实施例中,所述存储介质4存储有能够实现上述所有方法的程序文件41,其中,该程序文件41可以以软件产品的形式存储在上述存储介质4中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
本申请实施例的一种可视化知识图谱查询模板构建方法、装置、系统及存储介质,通过利用图形操作界面可视化构建查询模板,用户问答时将查询模板自动转化为图查询语句,在知识图谱中进行数据查询。与现有技术相比,本申请实施例至少具有以下优点:(1)可视化构建知识图谱查询模板,提升知识图谱查询模板的构建效率;(2)通过查询节点的限定字段辅助生成查询语句。
以上仅为本发明的较佳实施例而已,仅具体描述了本发明的技术原理,这些描述只是为了解释本发明的原理,不能以任何方式解释为对本发明保护范围的限制。基于此处解释,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进,及本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其他具体实施方式,均应包含在本发明的保护范围之内。
Claims (7)
1.一种可视化知识图谱查询模板构建方法,其特征在于,所述方法包括以下步骤:
S1:通过可视化查询方式,预先构建不同意图对应的查询模板;
S2:接收用户问句,并提取该用户问句包含的意图和实体;
S3:根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板;
S4:根据该用户问句匹配的查询模板,构建对应的查询语句;及
S5:根据构建的查询语句,查询知识图谱数据,并返回查询结果;
所述步骤S1包括:
S1.1:通过图形操作界面,接收查询模板的基础信息,所述基础信息包括意图名称和意图模板名称;
S1.2:通过所述图形操作界面,创建对应查询的节点及所需的限定字段;
S1.3:根据创建的多个节点和相应的限定字段,组合形成不同意图对应的查询模板;
所述限定字段包括:反问问题、节点所属概念、节点关系步长、查询属性、排序属性、上限属性、下限属性、区间概念、限定关系、除外关系、查询关系、对比属性列表、对比概念、并列概念;
所述反问问题用于:当用户问句匹配到的查询模板在知识图谱中有多个路径数据存在时,设置反问用户查询路径的问题;
所述节点所属概念用于:设置当前节点的实体类型;
所述节点关系步长用于:设置当前节点与下一节点在知识图谱中的关系长度;
所述查询属性用于:设置需要查询的当前节点的数据属性;
所述排序属性用于:当查询结果为多个时,按照选择的数据属性进行升序排列或降序排列;
所述上限属性用于:设置用户问句中与数据属性的属性值进行大小比较的属性值上限;
所述下限属性用于:设置用户问句中与数据属性的属性值进行大小比较的属性值下限;
所述区间概念用于:与所述上限属性和下限属性搭配使用,设置对比的实体类型;
所述限定关系用于:限定当前节点与下一节点之间的关系;
所述除外关系用于:限定当前节点与下一节点之间不能存在的关系;
所述查询关系用于:表示查询当前节点对应关系上的另一个节点;
所述对比属性列表用于:存在对比概念时,可添加的一个或多个属性组成的列表;
所述对比概念用于:与对比属性列表搭配使用,表示需要进行属性对比的实体类型;
所述并列概念用于:添加两个无直接关系,但都与上一节点存在关系的实体类型。
2.如权利要求1所述的可视化知识图谱查询模板构建方法,其特征在于,所述关系步长包括固定长度和可变长度,所述固定长度是指:两个节点之间的关系数量固定,所述可变长度是指:两个节点之间的关系数量为范围区间。
3.如权利要求1所述的可视化知识图谱查询模板构建方法,其特征在于,添加限定关系字段和除外关系字段时,不能使用步长字段。
4.如权利要求1所述的可视化知识图谱查询模板构建方法,其特征在于,所述步骤S4包括:将所述用户问句的实体填充至所述匹配的查询模板,得到具体的查询路径;将得到的具体查询路径转化为对应的图数据库查询语句。
5.一种装置,其特征在于,所述装置包括存储器、与所述存储器耦接的处理器,其中:
所述存储器存储有用于实现权利要求1-4任一项所述的可视化知识图谱查询模板构建方法的程序指令;
所述处理器用于执行所述存储器存储的所述程序指令以控制可视化知识图谱查询模板构建方法的执行。
6.一种利用权利要求1所述可视化知识图谱查询模板构建方法的可视化知识图谱查询模板构建系统,其特征在于,包括:
查询模板构建模块,用于通过可视化查询方式,预先构建不同意图对应的查询模板;
提取模块,用于接收用户问句,并提取该用户问句包含的意图和实体;
匹配模块,用于根据提取的意图和实体,从预先构建的查询模板中匹配该用户问句对应的查询模板;
查询语句构建模块,用于根据该用户问句匹配的查询模板,构建对应的查询语句;及
查询模块,用于根据构建的查询语句,查询知识图谱数据,并返回查询结果;
其中,所述查询模板构建模块包括:
通过图形操作界面,接收查询模板的基础信息,所述基础信息包括意图名称和意图模板名称;
通过所述图形操作界面,创建对应查询的节点及所需的限定字段;
根据创建的多个节点和相应的限定字段,组合形成不同意图对应的查询模板。
7.一种存储介质,其特征在于,存储有处理器可运行的程序指令,所述程序指令用于执行权利要求1至4任一项所述可视化知识图谱查询模板构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011495626.6A CN112507135B (zh) | 2020-12-17 | 2020-12-17 | 知识图谱查询模板构建方法、装置、系统、以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011495626.6A CN112507135B (zh) | 2020-12-17 | 2020-12-17 | 知识图谱查询模板构建方法、装置、系统、以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507135A CN112507135A (zh) | 2021-03-16 |
CN112507135B true CN112507135B (zh) | 2021-11-16 |
Family
ID=74922132
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011495626.6A Active CN112507135B (zh) | 2020-12-17 | 2020-12-17 | 知识图谱查询模板构建方法、装置、系统、以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507135B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113127617B (zh) * | 2021-04-09 | 2022-09-23 | 厦门渊亭信息科技有限公司 | 通用领域知识图谱的知识问答方法、终端设备及存储介质 |
CN113254635B (zh) * | 2021-04-14 | 2021-11-05 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及存储介质 |
CN112988784B (zh) * | 2021-04-26 | 2021-09-24 | 广州思迈特软件有限公司 | 数据查询方法、查询语句生成方法及其装置 |
CN113468307B (zh) * | 2021-06-30 | 2023-06-30 | 网易(杭州)网络有限公司 | 文本处理方法、装置、电子设备及存储介质 |
CN114036311A (zh) * | 2021-11-08 | 2022-02-11 | 北京邮电大学 | 基于知识图谱的时序可视化开发方法及系统 |
CN114385864A (zh) * | 2021-12-28 | 2022-04-22 | 深圳前海微众银行股份有限公司 | 一种图搜索方法、装置、设备及存储介质 |
CN115826956B (zh) * | 2023-02-14 | 2023-06-16 | 长威信息科技发展股份有限公司 | 知识图谱业务规则的可视化编排分析方法及可视化构建器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN110019844A (zh) * | 2019-02-20 | 2019-07-16 | 众安信息技术服务有限公司 | 一种保险行业知识图谱问答系统构建方法及装置 |
CN110750973A (zh) * | 2019-09-02 | 2020-02-04 | 北京东软望海科技有限公司 | 动态模板配置方法及系统 |
CN110781284A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 基于知识图谱的问答方法、装置和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200272624A1 (en) * | 2019-02-22 | 2020-08-27 | General Electric Company | Knowledge-driven federated big data query and analytics platform |
-
2020
- 2020-12-17 CN CN202011495626.6A patent/CN112507135B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN110019844A (zh) * | 2019-02-20 | 2019-07-16 | 众安信息技术服务有限公司 | 一种保险行业知识图谱问答系统构建方法及装置 |
CN110750973A (zh) * | 2019-09-02 | 2020-02-04 | 北京东软望海科技有限公司 | 动态模板配置方法及系统 |
CN110781284A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 基于知识图谱的问答方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112507135A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112507135B (zh) | 知识图谱查询模板构建方法、装置、系统、以及存储介质 | |
US20190377788A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN113127506B (zh) | 目标查询语句的构建方法、装置、存储介质和电子装置 | |
CN110245240A (zh) | 一种问题数据答案的确定方法及装置 | |
CN111859986A (zh) | 基于多任务孪生网络的语义匹配方法、装置、设备和介质 | |
CN112579733A (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN113094533B (zh) | 一种基于混合粒度匹配的图文跨模态检索方法 | |
CN113836314B (zh) | 知识图谱构建方法、装置、设备以及存储介质 | |
CN112559717B (zh) | 搜索匹配方法、装置、电子设备以及存储介质 | |
CN112434501A (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
CN112287085A (zh) | 语义匹配方法、系统、设备及存储介质 | |
CN113360654A (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
Yang et al. | Tabdoc approach: An information fusion method to implement semantic interoperability between IoT devices and users | |
CN115730597A (zh) | 多级语义意图识别方法及其相关设备 | |
CN116644148A (zh) | 关键词识别方法、装置、电子设备及存储介质 | |
CN118093839A (zh) | 基于深度学习的知识运营问答对话处理方法及系统 | |
CN113420542A (zh) | 对话生成方法、装置、电子设备及存储介质 | |
CN116703682B (zh) | 一种基于深度学习的政务数据平台 | |
CN117667979A (zh) | 基于大语言模型的数据挖掘方法、装置、设备及介质 | |
CN103473243A (zh) | 生成语义网络服务文档的方法和设备 | |
CN112069808A (zh) | 融资风控方法、装置、计算机设备及存储介质 | |
Wilsdorf et al. | Validation Without Data-Formalizing Stylized Facts Of Time Series | |
CN113779231B (zh) | 基于知识图谱的大数据可视化分析方法、装置及设备 | |
CN114492446A (zh) | 法律文书处理方法、装置、电子设备及存储介质 | |
CN113723114A (zh) | 基于多意图识别的语义分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |