CN111611343A - 基于知识图谱最短路径查询的搜索系统、方法及设备 - Google Patents
基于知识图谱最短路径查询的搜索系统、方法及设备 Download PDFInfo
- Publication number
- CN111611343A CN111611343A CN202010350391.5A CN202010350391A CN111611343A CN 111611343 A CN111611343 A CN 111611343A CN 202010350391 A CN202010350391 A CN 202010350391A CN 111611343 A CN111611343 A CN 111611343A
- Authority
- CN
- China
- Prior art keywords
- constraint
- concept
- point
- target point
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱最短路径查询的搜索系统、方法及设备,该系统包括:应用层,接收用户的输入信息,并向用户展示搜索结果;加工层,根据实例同义词和概念同义词将输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点或根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给应用层;模型层,保存概念图谱、实例图谱、实例同义词、概念同义词;数据层,对原始数据进行管理。
Description
技术领域
本发明涉及计算机网络技术领域,尤其是涉及一种基于知识图谱最短路径查询的搜索系统、方法及设备。
背景技术
目前,常见的搜索方法包括以下两种:
方法一:传统的搜索:只是机械的对比查询词和海量信息之间的匹配关系,而没有真正的理解用户要查询的到底是什么。
方法二:基于知识图谱的搜索,知识图谱用可视化技术描述知识资源及其载体,通过挖掘、分析、构建以及绘制显示知识及它们之间的相互联系。知识图谱使搜索结果体系化、关联化和可视化。但目前知识图谱的搜索对语义识别技术要求极高。
因此,实现工业领域中基于知识图谱的高级精准搜索是目前亟须解决的技术问题。
发明内容
本发明的目的在于提供一种基于知识图谱最短路径查询的搜索系统、方法及设备,旨在解决现有技术中基于知识图谱的高级精准搜索的问题。
本发明提供一种基于知识图谱最短路径查询的搜索系统,包括:
应用层,用于基于预先确定的输入规则接收用户的输入信息,并向用户展示搜索结果;
加工层,用于根据实例同义词和概念同义词将输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,并在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给应用层;
模型层,用于保存加工层所需要的概念图谱、实例图谱、实例同义词、以及概念同义词;
数据层,用于对模型层的原始数据进行管理。
本发明提供一种基于知识图谱最短路径查询的搜索方法,用于上述基于知识图谱最短路径查询的搜索系统,具体包括:
步骤1,基于预先确定的输入规则接收用户的输入信息;
步骤2,根据实例同义词和概念同义词将输入信息进行划分,输出目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点;
步骤3,将得到的实例节点作为搜索结果反馈给用户进行展示。
本发明实施例还提供一种基于知识图谱最短路径查询的搜索设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被处理器执行时实现上述基于知识图谱最短路径查询的搜索方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有信息传递的实现程序,程序被处理器执行时实现上述基于知识图谱最短路径查询的搜索方法的步骤。
采用本发明实施例,能够准确进行语义分析,实现工业领域中基于知识图谱的快速精准搜索。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的基于知识图谱最短路径查询的搜索系统的示意图;
图2是本发明实施例的目标点和结构点的示意图;
图3是本发明实施例的基于知识图谱最短路径查询搜索系统的详细结构示意图;
图4是本发明实施例的实例同义词示意图;
图5是本发明实施例的概念同义词示意图;
图6是本发明实施例的搜索请求输入规则的示意图;
图7是本发明实施例的概念图谱的示意图;
图8是本发明实施例的实例图谱的示意图;
图9是本发明实施例的基于知识图谱最短路径查询的搜索方法的示意图;
图10是本发明实施例的基于知识图谱最短路径查询的搜索设备的示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“坚直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
系统实施例
根据本发明的实施例,提供了一种基于知识图谱最短路径查询的搜索系统,图1是本发明实施例的基于知识图谱最短路径查询的搜索系统的示意图,如图1所示,根据本发明实施例的基于知识图谱最短路径查询的搜索系统具体包括:
应用层10,用于基于预先确定的输入规则接收用户的输入信息,并向用户展示搜索结果;
加工层11,用于根据实例同义词和概念同义词将输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给应用层;
需要说明的是,本发明实施例的技术方案将知识图谱分解为如图7所示的概念图谱和如图8所示的实例图谱。概念图谱中描述节点的类型、每个类型的节点的属性信息以及不同类型的概念节点之间的关系,实例图谱中存储的是真实的实例信息,概念图谱和实例图谱节点的对应是1对n的关系。概念图谱中的每个节点的唯一标识是“概念”,但实例图谱中每个节点的唯一标识并不是“实例名”,而是由“实例名”和“概念”唯一确定的。一个“实例名”可能对应着多个“概念”,如“莫言”对应着“人”、“商标”等多个概念。
本发明实施例将搜索条件通过输入限制、字典匹配、图数据库查询分为目标点和约束点两类,它们的结构图是相同的,如图2所示,包含了概念、实例名、属性信息。目标点的含义是用户真正关心的实例节点,而约束点是对目标点有约束限制的实例节点。用户输入的搜索条件在实例图谱中可以对应着多个节点,其中与约束点的距离最近的节点便为用户真正想要的信息。概念图谱的数据量相比于实例图谱而言小很多,且实例图谱中每个节点对应着概念图谱中的一个节点,因此在概念图谱中可以快速计算两个节点的距离。当目标点对应多个概念时,则先在概念图谱中,分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,其中最短路径最短的概念节点的概念便是目标节点的概念;然后在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据该最短路径从约束点对应的实例节点出发得到目标点对应的实例节点。
加工层11具体包括:目标相关信息处理模块、约束相关信息处理模块、以及目标点实例名完善模块。具体地:
目标相关信息处理模块,用于根据输入信息输出目标点;
具体地:目标相关信息处理模块具体包括:第一匹配模块、第一完善模块、以及目标属性处理模块。
第一匹配模块,用于进行实例同义词或概念同义词匹配,输出候选目标点:若目标实体信息不为空,则匹配实例同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词;若目标实体信息为空,则直接调用目标属性处理模块进行处理;
第一完善模块,用于对候选目标点概念进行完善,输出n个候选目标点:判断第一匹配模块输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名,其中,n大于或等于1;
目标属性处理模块,用于进行目标属性的处理,输出目标点和一个约束点集:判断候选目标点是否为空,若候选目标点不为空,则通过候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善,然后判断目标点是否为空,若目标点不为空,则输出这些目标点,结束运算;若目标点为空,则将这些候选目标点组合成一个约束点集输出,根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点;若候选目标点为空,则根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点,其中,m大于或者等于0。
约束相关信息处理模块,用于针对每个约束信息输出一个约束点集;具体包括:第二匹配模块、第二完善模块、以及约束属性处理模块,具体地:
第二匹配模块,用于在约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,调用第二完善模块进行处理;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,调用约束属性处理模块处理;
第二完善模块,用于进行候选约束点概念的完善,输出一个约束点集:
根据第二匹配模块输出的候选约束点的实例名查询实例图谱,得到n个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名,输出n个约束点构成的集合,其中,n大于或者等于1;
约束属性处理模块,用于进行约束属性信息的处理,输出一个约束点集:判断是否有候选约束点,若有候选约束点,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出,若候选约束点中均不包含这些属性信息,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合,并将这些约束点和候选约束点构成的一个集合输出;若没有候选约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的一个集合,其中,m大于或者等于0。
目标点实例名完善模块,用于当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点。
目标点实例名完善模块具体用于:将目标相关信息处理模块和约束相关信息处理模块进行合并输出,若只有目标点集合时,当目标点的实例名已知,不进行操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情;当合并输出中有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,针对每个约束点,根据最短路径缩小目标点的范围,求其并集得到每个约束点集合所确认的目标点范围,多个约束点集合表示多个约束条件,将多个约束点集合求得的目标点范围做交集运算得到最终的目标点。其中,在根据约束点缩小目标点范围时,若约束点的实例名存在,则查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点;若约束点的实例名不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后再查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短的路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点。
模型层12,用于保存加工层所需要的概念图谱、实例图谱、实例同义词、以及概念同义词;
数据层13,用于对模型层的原始数据进行管理。
以下结合附图,对本发明实施例的上述技术方案进行详细说明。
图3是本发明实施例的基于知识图谱最短路径查询的搜索系统的详细系统示意图,如图3所示,基于知识图谱最短路径查询的精准搜索系统整体分为应用层、加工层、模型层、数据层。应用层负责输入信息的接收以及最终搜索结果的展示;加工层负责对输入信息的处理;模型层负责加工层所需的字典、知识图谱的管理;数据层负责模型层原始数据的管理。下面将从下而上对系统每一层进行详细的说明。
数据层包括两个模块,模块1是根据专家经验构建概念图谱的输入。模块2是实例图谱构建的数据来源,通过对数据库、数据仓库、文本、文档中进行数据挖掘分析抽取出三元组,从而不断完善实例图谱。
模型层包括系统加工过程中所需的实例同义词、概念同义词、概念图谱、实例图谱。由于中文表述的多样性,需要说明的是,实例同义词维护的是实例图谱中的每个实例名所有可能的描述,详情如图4所示;概念同义词维护的是概念图谱中每个概念所有可能的描述,详情如图5所示。
加工层包括7、8、9三个模块,模块7是目标相关信息处理,由于人的认知和知识图谱存储的信息有一定差异性,例如,对于搜索“大庆油田”的“地理位置”属性,在知识图谱中“大庆油田”没有此属性,而“大庆油田”所包含的“开发单元”是有该属性的,进而“大庆油田”变成了约束点,而“开发单元”变成了目标点。将用户输入的目标实体信息根据知识图谱的实际数据进一步分解为目标点和一个约束点集。具体操作流程如下:
步骤71,基于实体同义词或概念同义词匹配,输出候选目标点;
若目标实体信息不为空,则匹配实体同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词。若目标实体信息为空,则直接进行步骤73处理。
步骤72,候选目标点概念的完善,输出n(n>=1)个候选目标点;
判断71输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n(n>=1)个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名。
步骤73,进行目标属性的处理,输出目标点和一个约束点集;
步骤731,判断候选目标点是否为空,若不为空,进行步骤732处理,若为空,则进行步骤733处理。
步骤732,通过候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善;然后判断目标点是否为空,若不为空,则输出这些目标点,结束运算。若为空,则将这些候选目标点组合成一个约束点集输出,并进行步骤733处理。
步骤733,根据属性信息,查询概念图谱,得到包含这些属性的m(m>=0)个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点。
模块8是约束相关信息处理,针对每个约束信息进行如下步骤81-步骤83的处理,输出一个约束点集。对于多个约束实体,便输出多个约束点集合。
步骤81,若约束实体信息不为空,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,进行步骤82处理;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,进行步骤83处理。
步骤82,候选约束点概念的完善,输出一个约束点集;
根据步骤81输出的候选约束点的实例名查询实例图普,得到n(n>=1)个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名。输出n个约束点构成的集合。
步骤83,约束属性信息的处理,输出一个约束点集;
步骤831,判断步骤83输入是否有候选约束点,若有,进行步骤832处理,若没有,则进行步骤833处理。
步骤832,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出。若均不包含,先进行步骤833处理,然后将候选约束点添加到步骤833输出的约束点集合中输出。
步骤833,查询概念图谱,得到包含这些属性的m(m>=0)个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合。
模块9是目标点实例名的完善。因在模块7、8中均有对约束点或目标的概念的完善,因此只需要确定目标点的实例名便可在实例图谱中唯一确定节点。模块7、8的输出合并,若只有目标点时,当目标点的实例名已知,不做任何操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情。当模块7、8的综合输出有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,因为每个约束条件在实例图谱中可能对应多个实例点,针对每个约束点,根据最短路径最短缩小目标点的范围,求其并集得到每个约束条件所确认的目标点范围。多个约束点集合表示多个约束条件,将多个约束条件求得的目标点范围做交集运算便得到最终的目标点。根据一个约束点缩小目标点范围的具体操作流程如下:
步骤91,约束点实例名的完善,若约束点的实例名存在,则直接进行步骤92处理。若约束点的实例不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后进行步骤92处理。
步骤92,查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名。
应用层包括搜索请求和知识卡片展示两个模块,其中搜索请求规定了用户搜索时输入的一些规则,如图6所示,在10-1中用户输入目标实体,可以是实例名如“TK001井”,也可以是抽象的概念,如“井筒”;若想查询某些属性或者想通过某些已知的属性对搜索条件进行约束,可通过“添加属性”然后输入相关信息,即10-2,具体输入文本的规则为:xxx:xxx,“:”之前的是“属性名”(必填)如“年龄”,“:”之后的是“属性值”(可不填)如“25岁”。若想添加其它约束信息,可通过“添加约束”输入相关信息,即10-3,约束信息添加规则同目标信息是一致的。知识卡片的展示将系统从实例图谱搜索得到节点信息进行展示。
综上所述,本发明实施例采用基于知识图谱最短路径查询实现精准搜索;将知识图谱分为概念图谱和实例图谱,且将搜索条件通过字典匹配、图数据库匹配分为目标点和约束点,然后基于最短路径思想,利用约束点缩小目标点的范围,从而达到快速精准的搜索。此外该方法也适用于基于知识图谱的问答中。
方法实施例
根据本发明的实施例,提供了一种基于知识图谱最短路径查询的搜索方法,用于上述系统实施例中的基于知识图谱最短路径查询的搜索系统,图9是本发明实施例的基于知识图谱最短路径查询的搜索方法的示意图,如图9所示,根据本发明实施例的基于知识图谱最短路径查询的搜索方法具体包括:
步骤901,基于预先确定的输入规则接收用户的输入信息;
步骤902,根据实例同义词和概念同义词将输入信息进行划分,输出目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点;
在步骤902中:
输出目标点具体包括:
步骤21,进行实例同义词或概念同义词匹配,输出候选目标点:若目标实体信息不为空,则匹配实例同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词;若目标实体信息为空,则执行步骤23;
步骤22,对候选目标点概念进行完善,输出n个候选目标点:判断第一匹配模块(即步骤21)输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名,其中,n大于或等于1;
步骤23,进行目标属性的处理,输出目标点和一个约束点集:判断候选目标点是否为空,若候选目标点不为空,则根据候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善,然后判断目标点是否为空,若目标点不为空,则输出这些目标点,结束运算;若目标点为空,则将这些候选目标点组合成一个约束点集输出,并根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点;若候选目标点为空,则根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点,其中,m大于或者等于0。
输出约束点具体包括:
步骤24,在约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,执行步骤25;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,执行步骤26;
步骤25,进行候选约束点概念的完善,输出一个约束点集:根据第二匹配模块(即步骤24)输出的候选约束点的实例名查询实例图谱,得到n个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名,输出n个约束点构成的集合,其中,n大于或者等于1;
步骤26,进行约束属性信息的处理,输出一个约束点集:判断是否有候选约束点,若有候选约束点,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出,若候选约束点中均不包含这些属性信息,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合,并将这些约束点和候选约束点构成的一个集合输出;若没有候选约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的一个集合,其中,m大于或者等于0。
在步骤902中,还需要进行如下处理:
将目标相关信息处理模块和约束相关信息处理模块进行合并输出,若只有目标点集合时,当目标点的实例名已知,不做任何操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情;当合并输出中有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,针对每个约束点,根据最短路径最短缩小目标点的范围,求其并集得到每个约束点集合所确认的目标点范围,多个约束点集合表示多个约束条件,将多个约束点集合求得的目标点范围做交集运算得到最终的目标点。其中,针对每个约束点,根据最短路径最短缩小目标点的范围具体包括:
若约束点的实例名存在,则查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短的路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点;若约束点的实例名不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后再查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点。
步骤903,将得到的实例节点作为搜索结果反馈给用户进行展示。
本发明实施例的技术方案将知识图谱分解为如图7所示的概念图谱和如图8所示的实例图谱。概念图谱中描述节点的类型、每个类型的节点的属性信息以及不同类型的概念节点之间的关系,实例图谱中存储的是真实的实例信息,概念图谱和实例图谱节点的对应是1对n的关系。概念图谱中的每个节点的唯一标识是“概念”,但实例图谱中每个节点的唯一标识并不是“实例名”,而是由“实例名”和“概念”唯一确定的。一个“实例名”可能对应着多个“概念”,如“莫言”对应着“人”、“商标”等多个概念。
本发明实施例将搜索条件通过输入限制、字典匹配、图数据库查询分为目标点和约束点两类,它们的结构图是相同的,如图2所示,包含了概念、实例名、属性信息。目标点的含义是用户真正关心的实例节点,而约束点是对目标点有约束限制的实例节点。用户输入的搜索条件在实例图谱中可以对应着多个节点,其中与约束点的距离最近的节点便为用户真正想要的信息。概念图谱的数据量相比于实例图谱而言小很多,且实例图谱中每个节点对应着概念图谱中的一个节点,因此在概念图谱中可以快速计算两个节点的距离。当目标点对应多个概念时,则在概念图谱中,分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,其中最短路径最短的概念节点的概念便是目标节点的概念;然后在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据该最短路径从约束点对应的实例节点出发得到目标点对应的实例节点。
以下结合附图,对本发明实施例的上述技术方案进行详细说明。
数据层包括两个模块,模块1是根据专家经验构建概念图谱的输入。模块2是实例图谱构建的数据来源,通过对数据库、数据仓库、文本、文档中进行数据挖掘分析抽取出三元组,从而不断完善实例图谱。
模型层包括系统加工过程中所需的实例同义词、概念同义词、概念图谱、实例图谱。由于中文表述的多样性,需要说明的是,实例同义词维护的是实例图谱中的每个实例名所有可能的描述,详情如图4所示;概念同义词维护的概念图谱中每个概念所有可能的描述,详情如图4所示。
加工层包括7、8、9三个模块,模块7是目标相关信息处理,由于人的认知和知识图谱存储的信息有一定差异性,例如,对于搜索“大庆油田”的“地理位置”属性,在知识图谱中“大庆油田”没有此属性,而“大庆油田”所包含的“开发单元”是有该属性的,进而“大庆油田”变成了约束点,而“开发单元”变成了目标点。将用户输入的目标实体信息根据知识图谱的实际数据进一步分解为目标点和一个约束点集。具体操作流程如下:
步骤71,基于实体同义词或概念同义词匹配,输出候选目标点;
若目标实体信息不为空,则匹配实体同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词。若目标实体信息为空,则直接进行步骤73处理。
步骤72,候选目标点概念的完善,输出n(n>=1)个候选目标点;
判断71输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n(n>=1)个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名。
步骤73,进行目标属性的处理,输出目标点和一个约束点集;
步骤731,判断候选目标点是否为空,若不为空,进行步骤732处理,若为空,则进行步骤733处理。
步骤732,通过候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善;然后判断目标点是否为空,若不为空,则输出这些目标点,结束运算。若为空,则将这些候选目标点组合成一个约束点集输出,并进行步骤733处理。
步骤733,根据属性信息,查询概念图谱,得到包含这些属性的m(m>=0)个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点。
模块8是约束相关信息处理,针对每个约束信息进行如下步骤81-步骤83的处理,输出一个约束点集。对于多个约束实体,便输出多个约束点集合。
步骤81,若约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,进行步骤82处理;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,进行步骤83处理。
步骤82,候选约束点概念的完善,输出一个约束点集;
根据步骤81输出的候选约束点的实例名查询实例图普,得到n(n>=1)个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名。输出n个约束点构成的集合。
步骤83,约束属性信息的处理,输出一个约束点集;
步骤831,判断步骤83输入是否有候选约束点,若有,进行步骤832处理,若没有,则进行步骤833处理。
步骤832,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出。若均不包含,先进行步骤833处理,然后将候选约束点添加到步骤833输出的约束点集合中输出。
步骤833,查询概念图谱,得到包含这些属性的m(m>=0)个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合。
模块9是目标点实例名的完善。因在模块7、8中均有对约束点或目标的概念的完善,因此只需要确定目标点的实例名便可在实例图谱中唯一确定节点。模块7、8的输出合并,若只有目标点时,当目标点的实例名已知,不做任何操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情。当模块7、8的综合输出有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,因为每个约束条件在实例图谱中可能对应多个实例点,针对每个约束点,根据最短路径最短缩小目标点的范围,求其并集便得到每个约束条件所确认的目标点范围。多个约束点集合表示多个约束条件,将多个约束条件求得的目标点范围做交集运算便得到最终的目标点。根据一个约束点缩小目标点范围的具体操作流程如下:
步骤91,约束点实例名的完善,若约束点的实例名存在,则直接进行步骤92处理。若约束点的实例不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后进行步骤92处理。
步骤92,查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名。
应用层包括搜索请求和知识卡片展示两个模块,其中搜索请求规定了用户搜索时输入的一些规则,如图6所示,在10-1中用户输入目标实体,可以是实例名如“TK001井”,也可以是抽象的概念,如“井筒”;若想查询某些属性或者想通过某些已知的属性对搜索条件进行约束,可通过“添加属性”然后输入相关信息,即10-2,具体输入文本的规则为:xxx:xxx,“:”之前的是“属性名”(必填)如“年龄”,“:”之后的是“属性值”(可不填)如“25岁”。若想添加其它约束信息,可通过“添加约束”输入相关信息,即10-3,约束信息添加规则同目标信息是一致的。知识卡片的展示将系统从实例图谱搜索得到节点信息进行展示。
综上所述,本发明实施例采用基于知识图谱最短路径查询实现精准搜索;将知识图谱分为概念图谱和实例图谱,且将搜索条件通过字典匹配、图数据库匹配分为目标点和约束点,然后在基于最短路径思想,利用约束点缩小目标点的范围,从而达到快速精准的搜索。此外该方法也适用于基于知识图谱的问答中。
装置实施例一
本发明实施例提供一种基于知识图谱最短路径查询的搜索设备,如图10所示,包括:存储器1010、处理器1020及存储在所述存储器1010上并可在所述处理器1020上运行的计算机程序,所述计算机程序被所述处理器1020执行时实现如下方法步骤:
步骤901,基于预先确定的输入规则接收用户的输入信息;
步骤902,根据实例同义词和概念同义词将输入信息进行划分,输出目标点和约束点,当目标点对应多个概念时,则在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点;
在步骤902中:
输出目标点具体包括:
步骤21,进行实例同义词或概念同义词匹配,输出候选目标点:若目标实体信息不为空,则匹配实例同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词;若目标实体信息为空,则执行步骤23;
步骤22,对候选目标点概念进行完善,输出n个候选目标点:判断第一匹配模块(即步骤21)输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名,其中,n大于或等于1;
步骤23,进行目标属性的处理,输出目标点和一个约束点集:判断候选目标点是否为空,若候选目标点不为空,则根据候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善,然后判断目标点是否为空,若目标点不为空,则输出这些目标点,结束运算;若目标点为空,则将这些候选目标点组合成一个约束点集输出,并根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点;若候选目标点为空,则根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点,其中,m大于或者等于0。
输出约束点具体包括:
步骤24,在约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,执行步骤25;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,执行步骤26;
步骤25,进行候选约束点概念的完善,输出一个约束点集:根据第二匹配模块(即步骤24)输出的候选约束点的实例名查询实例图谱,得到n个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名,输出n个约束点构成的集合,其中,n大于或者等于1;
步骤26,进行约束属性信息的处理,输出一个约束点集:判断是否有候选约束点,若有候选约束点,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出,若候选约束点中均不包含这些属性信息,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合,并将这些约束点和候选约束点构成的一个集合输出;若没有候选约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的一个集合,其中,m大于或者等于0。
在步骤902中,还需要进行如下处理:
将目标相关信息处理模块和约束相关信息处理模块进行合并输出,若只有目标点集合时,当目标点的实例名已知,不做任何操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情;当合并输出中有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,针对每个约束点,根据最短路径最短缩小目标点的范围,求其并集得到每个约束点集合所确认的目标点范围,多个约束点集合表示多个约束条件,将多个约束点集合求得的目标点范围做交集运算得到最终的目标点。其中,针对每个约束点,根据最短路径最短缩小目标点的范围具体包括:
若约束点的实例名存在,则查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短的路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点;若约束点的实例名不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后再查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点。
步骤903,将得到的实例节点作为搜索结果反馈给用户进行展示。
本发明实施例的技术方案将知识图谱分解为如图7所示的概念图谱和如图8所示的实例图谱。概念图谱中描述节点的类型、每个类型的节点的属性信息以及不同类型的概念节点之间的关系,实例图谱中存储的是真实的实例信息,概念图谱和实例图谱节点的对应是1对n的关系。概念图谱中的每个节点的唯一标识是“概念”,但实例图谱中每个节点的唯一标识并不是“实例名”,而是由“实例名”和“概念”唯一确定的。一个“实例名”可能对应着多个“概念”,如“莫言”对应着“人”、“商标”等多个概念。
本发明实施例将搜索条件通过输入限制、字典匹配、图数据库查询分为目标点和约束点两类,它们的结构图是相同的,如图2所示,包含了概念、实例名、属性信息。目标点的含义是用户真正关心的实例节点,而约束点是对目标点有约束限制的实例节点。用户输入的搜索条件在实例图谱中可以对应着多个节点,其中与约束点的距离最近的节点便为用户真正想要的信息。概念图谱的数据量相比于实例图谱而言小很多,且实例图谱中每个节点对应着概念图谱中的一个节点,因此在概念图谱中可以快速计算两个节点的距离。当目标点对应多个概念时,则先在概念图谱中,分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,其中最短路径最短的概念节点的概念便是目标节点的概念;然后在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据该最短路径从约束点对应的实例节点出发得到目标点对应的实例节点。
装置实施例二
本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传输的实现程序,所述程序被处理器1020执行时实现如下方法步骤:
步骤901,基于预先确定的输入规则接收用户的输入信息;
步骤902,根据实例同义词和概念同义词将输入信息进行划分,输出目标点和约束点,当目标点对应多个概念时,则在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据最短路径从约束点对应的实例节点出发得到目标点对应的实例节点;
在步骤902中:
输出目标点具体包括:
步骤21,进行实例同义词或概念同义词匹配,输出候选目标点:若目标实体信息不为空,则匹配实例同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词;若目标实体信息为空,则执行步骤23;
步骤22,对候选目标点概念进行完善,输出n个候选目标点:判断第一匹配模块(即步骤21)输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名,其中,n大于或等于1;
步骤23,进行目标属性的处理,输出目标点和一个约束点集:判断候选目标点是否为空,若候选目标点不为空,则通过候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善,然后判断目标点是否为空,若目标点不为空,则输出这些目标点,结束运算;若目标点为空,则将这些候选目标点组合成一个约束点集输出,并根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点;若候选目标点为空,则根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点,其中,m大于或者等于0。
输出约束点具体包括:
步骤24,在约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,执行步骤25;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,执行步骤26;
步骤25,进行候选约束点概念的完善,输出一个约束点集:根据第二匹配模块输出(即步骤24)的候选约束点的实例名查询实例图谱,得到n个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名,输出n个约束点构成的集合,其中,n大于或者等于1;
步骤26,进行约束属性信息的处理,输出一个约束点集:判断是否有候选约束点,若有候选约束点,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出,若候选约束点中均不包含这些属性信息的约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合,并将这些约束点和候选约束点构成的一个集合输出;若没有候选约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的一个集合,其中,m大于或者等于0。
在步骤902中,还需要进行如下处理:
将目标相关信息处理模块和约束相关信息处理模块进行合并输出,若只有目标点集合时,当目标点的实例名已知,不做任何操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情;当合并输出中有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,针对每个约束点,根据最短路径最短缩小目标点的范围,求其并集得到每个约束点集合所确认的目标点范围,多个约束点集合表示多个约束条件,将多个约束点集合求得的目标点范围做交集运算得到最终的目标点。其中,针对每个约束点,根据最短路径最短缩小目标点的范围具体包括:
若约束点的实例名存在,则查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短的路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点;若约束点的实例名不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后再查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点。
步骤903,将得到的实例节点作为搜索结果反馈给用户进行展示。
本发明实施例的技术方案将知识图谱分解为如图7所示的概念图谱和如图8所示的实例图谱。概念图谱中描述节点的类型、每个类型的节点的属性信息以及不同类型的概念节点之间的关系,实例图谱中存储的是真实的实例信息,概念图谱和实例图谱节点的对应是1对n的关系。概念图谱中的每个节点的唯一标识是“概念”,但实例图谱中每个节点的唯一标识并不是“实例名”,而是由“实例名”和“概念”唯一确定的。一个“实例名”可能对应着多个“概念”,如“莫言”对应着“人”、“商标”等多个概念。
本发明实施例将搜索条件通过输入限制、字典匹配、图数据库查询分为目标点和约束点两类,它们的结构图是相同的,如图2所示,包含了概念、实例名、属性信息。目标点的含义是用户真正关心的实例节点,而约束点是对目标点有约束限制的实例节点。用户输入的搜索条件在实例图谱中可以对应着多个节点,其中与约束点的距离最近的节点便为用户真正想要的信息。概念图谱的数据量相比于实例图谱而言小很多,且实例图谱中每个节点对应着概念图谱中的一个节点,因此在概念图谱中可以快速计算两个节点的距离。也就是当目标点对应多个概念时,则先在概念图谱中,分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,其中最短路径最短的概念节点的概念便是目标节点的概念;然后在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据该最短路径从约束点对应的实例节点出发得到目标点对应的实例节点。
本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (13)
1.一种基于知识图谱最短路径查询的搜索系统,其特征在于,包括:
应用层,用于基于预先确定的输入规则接收用户的输入信息,并向用户展示搜索结果;
加工层,用于根据实例同义词和概念同义词将所述输入信息划分为目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据所述最短路径从约束点对应的实例节点出发得到目标点对应的实例节点,将得到的实例节点作为搜索结果反馈给所述应用层;
模型层,用于保存所述加工层所需要的概念图谱、实例图谱、实例同义词、以及概念同义词;
数据层,用于对所述模型层的原始数据进行管理。
2.根据权利要求1所述的系统,其特征在于,所述加工层具体包括:
目标相关信息处理模块,用于根据所述输入信息输出目标点;
约束相关信息处理模块,用于针对每个约束信息输出一个约束点集;
目标点实例名完善模块,用于当目标点对应多个概念时,则在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念;在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据所述最短路径从约束点对应的实例节点出发得到目标点对应的实例节点。
3.根据权利要求2所述的系统,其特征在于,目标相关信息处理模块具体包括:
第一匹配模块,用于进行实例同义词或概念同义词匹配,输出候选目标点:若目标实体信息不为空,则匹配实例同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词;若目标实体信息为空,则直接调用目标属性处理模块进行处理;
第一完善模块,用于对候选目标点概念进行完善,输出n个候选目标点:判断第一匹配模块输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n个概念,相应的构造n个新的候选目标点输出,其中的属性名为原目标点的属性名,其中,n大于或等于1;
目标属性处理模块,用于进行目标属性的处理,输出目标点和一个约束点集:判断候选目标点是否为空,若候选目标点不为空,则根据候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善,然后判断目标点是否为空,若目标点不为空,则输出这些目标点,结束运算;若目标点为空,则将这些候选目标点组合成一个约束点集输出,根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点;若候选目标点为空,则根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点,其中,m大于或者等于0。
4.根据权利要求2所述的系统,其特征在于,所述约束相关信息处理模块具体包括:
第二匹配模块,用于在约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,调用第二完善模块进行处理;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,调用约束属性处理模块处理;
所述第二完善模块,用于进行候选约束点概念的完善,输出一个约束点集:根据第二匹配模块输出的候选约束点的实例名查询实例图谱,得到n个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名,输出n个约束点构成的集合,其中,n大于或者等于1;
约束属性处理模块,用于进行约束属性信息的处理,输出一个约束点集:判断是否有候选约束点,若有候选约束点,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出,若候选约束点中均不包含这些属性信息,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合,并将这些约束点和候选约束点构成的一个集合输出;若没有候选约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的一个集合,其中,m大于或者等于0。
5.根据权利要求2所述的系统,其特征在于,所述目标点实例名完善模块具体用于:将目标相关信息处理模块和约束相关信息处理模块进行合并输出,若只有目标点集合时,当目标点的实例名已知,不进行操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情;当合并输出中有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,针对每个约束点,根据最短路径缩小目标点的范围,求其并集得到每个约束点集合所确认的目标点范围,多个约束点集合表示多个约束条件,将多个约束点集合求得的目标点范围做交集运算得到最终的目标点。
6.根据权利要求5所述的系统,其特征在于,所述目标点实例名完善模块具体用于:
在根据约束点缩小目标点范围时,若约束点的实例名存在,则查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点;若约束点的实例名不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后再查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短的路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点。
7.一种基于知识图谱最短路径查询的搜索方法,用于权利要求1至6中任一项所述的基于知识图谱最短路径查询的搜索系统,其特征在于,所述方法具体包括:
步骤1,基于预先确定的输入规则接收用户的输入信息;
步骤2,根据实例同义词和概念同义词将所述输入信息进行划分,输出目标点和约束点,当目标点对应多个概念时,在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点,或者根据所述最短路径从约束点对应的实例节点出发得到目标点对应的实例节点;
步骤3,将得到的实例节点作为搜索结果反馈给用户进行展示。
8.根据权利要求7所述的方法,其特征在于,所述输出目标点具体包括:
步骤21,进行实例同义词或概念同义词匹配,输出候选目标点:若目标实体信息不为空,则匹配实例同义词,若存在对应的实体标准词,则构造一个候选目标点输出,其中实例名为该实体标准词;若不存在对应的实体标准词,则匹配概念同义词,当存在对应的概念标准词,则构造一个候选目标点输出,其中概念为此概念标准词;若目标实体信息为空,则执行步骤23;
步骤22,对候选目标点概念进行完善,输出n个候选目标点:判断步骤21输出的候选目标点中概念是否为空,若不为空,则输出此候选目标点,若为空,则根据其实例名查找实例图谱,得到n个概念,相应的构造n个新的候选目标点输出,其中,n大于或等于1;
步骤23,进行目标属性的处理,输出目标点和一个约束点集:判断候选目标点是否为空,若候选目标点不为空,则根据候选目标点的概念查询概念图谱,判断其是否包含此属性信息,若包含则将该候选目标点修改为目标点,并将属性信息完善,然后判断目标点是否为空,若目标点不为空,则输出这些目标点,结束运算;若目标点为空,则将这些候选目标点组合成一个约束点集输出,根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点;若候选目标点为空,则根据属性信息,查询概念图谱,得到包含这些属性的m个概念,相应的构造m个目标点,并将属性信息进行完善,输出m个目标点,其中,m大于或者等于0。
9.根据权利要求7所述的方法,其特征在于,所述输出约束点具体包括:
步骤24,在约束实体信息不为空时,先匹配实体同义词,若存在对应的实体标准词,构造一个候选约束点,其中实例名为该实体标准词,执行步骤25;若不存在对应的实体标准词,则匹配概念同义词,若存在对应的概念标准词,同样构造一个候选约束点,其概念为该概念标准词,执行步骤26;
步骤25,进行候选约束点概念的完善,输出一个约束点集:根据步骤24输出的候选约束点的实例名查询实例图谱,得到n个概念,相应的构造n个新的约束点,其中实例名为候选约束点的实例名,输出n个约束点构成的集合,其中,n大于或者等于1;
步骤26,进行约束属性信息的处理,输出一个约束点集:判断是否有候选约束点,若有候选约束点,查询概念图谱,将候选约束点中包含这些属性信息的约束点作为一个集合输出,若候选约束点中均不包含这些属性信息,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的集合,并将这些约束点和候选约束点构成的一个集合输出;若没有候选约束点,则查询概念图谱,得到包含这些属性的m个概念,相应的构造m个约束点,且将属性信息进行完善,输出m个约束点构成的一个集合,其中,m大于或者等于0。
10.根据权利要求7所述的方法,其特征在于,所述当目标点对应多个概念时,则在概念图谱中分别求得约束点对应的概念节点到目标点对应的多个概念节点的最短路径,将最短路径最短的概念节点的概念作为目标节点的概念,在实例图谱中,根据目标节点的概念和实例名确定实例节点或根据所述最短路径从约束点对应的实例节点出发得到目标点对应的实例节点具体包括:
将目标点和约束点进行合并输出,若只有目标点集合时,当目标点的实例名已知,不做任何操作,若目标点的实例名未知,则根据目标点的概念以及属性信息查找实例图谱得到目标点详情;当合并输出中有目标点以及多个约束点集合时,每个约束点集合中包含多个约束点,针对每个约束点,根据最短路径最短缩小目标点的范围,求其并集得到每个约束点集合所确认的目标点范围,多个约束点集合表示多个约束条件,将多个约束点集合求得的目标点范围做交集运算得到最终的目标点。
11.根据权利要求10所述的方法,其特征在于,针对每个约束点,根据最短路径缩小目标点的范围具体包括:
若约束点的实例名存在,则查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短的路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点;若约束点的实例名不存在,则根据约束点的概念以及属性信息查找实体图谱得到约束点的实例名,然后再查找概念图谱,得到约束点的概念到每个目标点的概念之间的最短路径,其中路径最短的目标点便是要求的目标点,若该目标点的实例名存在,则将该目标点输出;若该目标点的实例名不存在,则在实例图谱中依据最短路径,从约束点对应的实例节点出发得到目标点的实例名,然后输出该目标点。
12.一种基于知识图谱最短路径查询的搜索设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求7至11中任一项所述的基于知识图谱最短路径查询的搜索方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求7至11中任一项所述的基于知识图谱最短路径查询的搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010350391.5A CN111611343B (zh) | 2020-04-28 | 2020-04-28 | 基于知识图谱最短路径查询的搜索系统、方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010350391.5A CN111611343B (zh) | 2020-04-28 | 2020-04-28 | 基于知识图谱最短路径查询的搜索系统、方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111611343A true CN111611343A (zh) | 2020-09-01 |
CN111611343B CN111611343B (zh) | 2023-06-16 |
Family
ID=72199746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010350391.5A Active CN111611343B (zh) | 2020-04-28 | 2020-04-28 | 基于知识图谱最短路径查询的搜索系统、方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611343B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328766A (zh) * | 2020-11-10 | 2021-02-05 | 四川长虹电器股份有限公司 | 一种基于路径搜索的知识图谱问答方法和装置 |
CN114186689A (zh) * | 2022-02-14 | 2022-03-15 | 支付宝(杭州)信息技术有限公司 | 用于知识图谱中的路径发现的方法、系统、装置和介质 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6599781B1 (en) * | 2000-09-27 | 2003-07-29 | Chou H. Li | Solid state device |
US20050209983A1 (en) * | 2004-03-18 | 2005-09-22 | Macpherson Deborah L | Context driven topologies |
JP2005291943A (ja) * | 2004-03-31 | 2005-10-20 | Equos Research Co Ltd | 走行時間推定装置 |
US20060106793A1 (en) * | 2003-12-29 | 2006-05-18 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
CN102185297A (zh) * | 2011-05-10 | 2011-09-14 | 中国电力科学研究院 | 一种基于网络重构的系统恢复控制方法 |
US20130226846A1 (en) * | 2012-02-24 | 2013-08-29 | Ming Li | System and Method for Universal Translating From Natural Language Questions to Structured Queries |
US20150169758A1 (en) * | 2013-12-17 | 2015-06-18 | Luigi ASSOM | Multi-partite graph database |
CN105187308A (zh) * | 2015-05-07 | 2015-12-23 | 深圳市迪菲特科技股份有限公司 | 一种资源节点查找方法及装置 |
CN105787105A (zh) * | 2016-03-21 | 2016-07-20 | 浙江大学 | 一种基于迭代模型的中文百科知识图谱分类体系构建方法 |
US20170103337A1 (en) * | 2015-10-08 | 2017-04-13 | International Business Machines Corporation | System and method to discover meaningful paths from linked open data |
US20170161311A1 (en) * | 2015-12-03 | 2017-06-08 | International Business Machines Corporation | Using knowledge graphs to identify potential inconsistencies in works of authorship |
CN106874261A (zh) * | 2017-03-17 | 2017-06-20 | 中国科学院软件研究所 | 一种基于语义三角的领域知识图谱及查询方法 |
CN107391623A (zh) * | 2017-07-07 | 2017-11-24 | 中国人民大学 | 一种融合多背景知识的知识图谱嵌入方法 |
CN108509654A (zh) * | 2018-04-18 | 2018-09-07 | 上海交通大学 | 动态知识图谱的构建方法 |
CN108776696A (zh) * | 2018-06-05 | 2018-11-09 | 平安科技(深圳)有限公司 | 节点配置方法及装置、存储介质和电子设备 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109992786A (zh) * | 2019-04-09 | 2019-07-09 | 杭州电子科技大学 | 一种语义敏感的rdf知识图谱近似查询方法 |
CN110704743A (zh) * | 2019-09-30 | 2020-01-17 | 北京科技大学 | 一种基于知识图谱的语义搜索方法及装置 |
-
2020
- 2020-04-28 CN CN202010350391.5A patent/CN111611343B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6599781B1 (en) * | 2000-09-27 | 2003-07-29 | Chou H. Li | Solid state device |
US20060106793A1 (en) * | 2003-12-29 | 2006-05-18 | Ping Liang | Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation |
US20050209983A1 (en) * | 2004-03-18 | 2005-09-22 | Macpherson Deborah L | Context driven topologies |
JP2005291943A (ja) * | 2004-03-31 | 2005-10-20 | Equos Research Co Ltd | 走行時間推定装置 |
CN102185297A (zh) * | 2011-05-10 | 2011-09-14 | 中国电力科学研究院 | 一种基于网络重构的系统恢复控制方法 |
US20130226846A1 (en) * | 2012-02-24 | 2013-08-29 | Ming Li | System and Method for Universal Translating From Natural Language Questions to Structured Queries |
US20150169758A1 (en) * | 2013-12-17 | 2015-06-18 | Luigi ASSOM | Multi-partite graph database |
CN105187308A (zh) * | 2015-05-07 | 2015-12-23 | 深圳市迪菲特科技股份有限公司 | 一种资源节点查找方法及装置 |
US20170103337A1 (en) * | 2015-10-08 | 2017-04-13 | International Business Machines Corporation | System and method to discover meaningful paths from linked open data |
US20170161311A1 (en) * | 2015-12-03 | 2017-06-08 | International Business Machines Corporation | Using knowledge graphs to identify potential inconsistencies in works of authorship |
CN105787105A (zh) * | 2016-03-21 | 2016-07-20 | 浙江大学 | 一种基于迭代模型的中文百科知识图谱分类体系构建方法 |
CN106874261A (zh) * | 2017-03-17 | 2017-06-20 | 中国科学院软件研究所 | 一种基于语义三角的领域知识图谱及查询方法 |
CN107391623A (zh) * | 2017-07-07 | 2017-11-24 | 中国人民大学 | 一种融合多背景知识的知识图谱嵌入方法 |
CN108509654A (zh) * | 2018-04-18 | 2018-09-07 | 上海交通大学 | 动态知识图谱的构建方法 |
CN108776696A (zh) * | 2018-06-05 | 2018-11-09 | 平安科技(深圳)有限公司 | 节点配置方法及装置、存储介质和电子设备 |
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN109992786A (zh) * | 2019-04-09 | 2019-07-09 | 杭州电子科技大学 | 一种语义敏感的rdf知识图谱近似查询方法 |
CN110704743A (zh) * | 2019-09-30 | 2020-01-17 | 北京科技大学 | 一种基于知识图谱的语义搜索方法及装置 |
Non-Patent Citations (5)
Title |
---|
M.A. ANWAR: "《Intergrating knowledge-base and Dijkstra\'s algorithm for finding best alternate route dynamically》", 《7TH INTERNATIONAL MULTI TOPIC CONFERENCE,2003.INMIC 2003》 * |
TONG LU: "《A Novel Knowledge-Based System for Interpreting Complex Engineering Drawings: Theory, Representation, and Implementation》", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 * |
TONG LU: "《A Novel Knowledge-Based System for Interpreting Complex Engineering Drawings: Theory, Representation, and Implementation》", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》, vol. 31, no. 8, 17 June 2008 (2008-06-17) * |
焦爽: "《基于小规模知识图谱的语义相似度计算》", 《中国优秀硕士学位论文全文数据库》 * |
焦爽: "《基于小规模知识图谱的语义相似度计算》", 《中国优秀硕士学位论文全文数据库》, 15 June 2019 (2019-06-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112328766A (zh) * | 2020-11-10 | 2021-02-05 | 四川长虹电器股份有限公司 | 一种基于路径搜索的知识图谱问答方法和装置 |
CN114186689A (zh) * | 2022-02-14 | 2022-03-15 | 支付宝(杭州)信息技术有限公司 | 用于知识图谱中的路径发现的方法、系统、装置和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111611343B (zh) | 2023-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299110B (zh) | 数据查询方法、装置、存储介质和电子设备 | |
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
EP3690672A1 (en) | Method, appartus, device and medium for determining text relevance | |
US12019683B1 (en) | Fuzzy search of graph database | |
US12013850B2 (en) | Method and system for advanced data conversations | |
CN104933100A (zh) | 关键词推荐方法和装置 | |
CN111611343B (zh) | 基于知识图谱最短路径查询的搜索系统、方法及设备 | |
WO2023010427A1 (en) | Systems and methods generating internet-of-things-specific knowledge graphs, and search systems and methods using such graphs | |
CN111078835A (zh) | 简历评估方法、装置、计算机设备及存储介质 | |
CN113641813A (zh) | 基于知识图谱的问答系统、方法、电子设备及存储介质 | |
CN111460102B (zh) | 一种基于自然语言处理的图表推荐系统及方法 | |
CN113268560A (zh) | 用于文本匹配的方法和装置 | |
CN112948547A (zh) | 测井知识图谱构建查询方法、装置、设备及存储介质 | |
CN113190593A (zh) | 一种基于数字人文知识图谱的搜索推荐方法 | |
Zhou et al. | Summarisation of weighted networks | |
CN114511085A (zh) | 实体属性值的识别方法、装置、设备、介质及程序产品 | |
CN113010752A (zh) | 召回内容的确定方法、装置、设备以及存储介质 | |
CN111611806A (zh) | 一种用于知识图谱问答的语义解析方法、系统及设备 | |
CN113312523B (zh) | 字典生成、搜索关键字推荐方法、装置和服务器 | |
CN115472257A (zh) | 一种招募用户的方法、装置、电子设备及存储介质 | |
CN114579580A (zh) | 存储数据的方法、查询数据的方法和装置 | |
CN112541069A (zh) | 一种结合关键词的文本匹配方法、系统、终端及存储介质 | |
El Midaoui et al. | Geographical queries reformulation using a parallel association rules generator to build spatial taxonomies | |
CN112948589B (zh) | 文本分类方法、装置和计算机可读存储介质 | |
Xu et al. | MISSION: Multimodal-information-aided similar disease detection based on disease information network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |