CN110275947A - 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置 - Google Patents

基于命名实体识别的特定领域知识图谱自然语言查询方法及装置 Download PDF

Info

Publication number
CN110275947A
CN110275947A CN201910434916.0A CN201910434916A CN110275947A CN 110275947 A CN110275947 A CN 110275947A CN 201910434916 A CN201910434916 A CN 201910434916A CN 110275947 A CN110275947 A CN 110275947A
Authority
CN
China
Prior art keywords
sentence
natural language
language querying
domain
target query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910434916.0A
Other languages
English (en)
Inventor
孙一贺
郭志刚
陈刚
魏晗
唐永旺
袁江林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Engineering University of PLA Strategic Support Force
Original Assignee
Information Engineering University of PLA Strategic Support Force
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Engineering University of PLA Strategic Support Force filed Critical Information Engineering University of PLA Strategic Support Force
Priority to CN201910434916.0A priority Critical patent/CN110275947A/zh
Publication of CN110275947A publication Critical patent/CN110275947A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于计算机应用技术领域,特别涉及一种基于命名实体识别的特定领域知识图谱自然语言查询方法及装置,该方法包含:依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱模型构成利用<实体,关系,实体>三元组表示;获取目标查询语句,利用词典工具对目标查询语句进行分词,识别目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应编程查询语句。本发明容易实现,查询时间短,准确性高,可以较容易应用到各个特定领域知识图谱自然语言查询中,在金融、教育、医学等领域有广泛的应用前景,扩大不同特定领域知识图谱中应用。

Description

基于命名实体识别的特定领域知识图谱自然语言查询方法及 装置
技术领域
本发明属于计算机应用技术领域,特别涉及一种基于命名实体识别的特定领域知识图谱自然语言查询方法及装置。
背景技术
近年来,随着互联网和计算机技术的蓬勃发展,网络上的信息量也有了迅猛的增长,人们对于数据的查询、管理的难度也逐渐增加。在此背景下,知识图谱技术得到了飞速的发展。知识图谱是描述不同物体之间关系的语义关系网络,它将复杂的海量数据进行有规律的梳理,使用户能够轻松便捷地查询到所需的信息。知识图谱的应用可以涉及到很多行业,包括医疗、教育、证券投资、推荐等,只要有关系存在,知识图谱就可以发挥它的价值。知识图谱查询是目前知识图谱研究中最广泛的应用,能够有效提高搜索引擎查询效率。现有的知识图谱查询研究中,有子图同构匹配查询方法,基于本体和邻居信息查询算法,融合知识图谱的查询扩展模型算法等。而在特定领域知识图谱中,考虑到其数据噪声较小,实体歧义较少等特点,以上的知识图谱查询方法对于特定领域来说过于复杂,增加软硬件运行负荷,影响该特定领域内的目标查询效率。
发明内容
为此,本发明提供一种基于命名实体识别的特定领域知识图谱自然语言查询方法及装置,易于实现,扩大自然语言查询在不同特定领域知识图谱中的应用,具有较强的应用前景。
按照本发明所提供的设计方案,一种基于命名实体识别的特定领域知识图谱自然语言查询方法,包含如下内容:
依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱模型构成利用<实体,关系,实体>三元组表示;
获取目标查询语句,利用词典工具对目标查询语句进行分词,识别出目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应的编程查询语句。
上述的,自然语言查询语句类型划分中,分析特定领域内常用自然语言查询语句,依据自然语言查询语句进行语义功能类型划分。
上述的,将领域内自然语言查询语句类型划分为单个节点查询、依据节点和边对对应节点查询、两节点之间关系路径查询和属性最值查询四种类型。
上述的,确定目标查询语句的类型中,根据通过分词处理识别出的命名实体类型及个数,基于知识图谱模型中查询语句类型划分结果,确定目标查询语句类型,获取生成对应编程查询语句的要素信息,以生成编程查询语句。
上述的,利用分词工具,并结合常规词典和专业词典,对目标查询语句进行分词处理。
优选的,分词工具采用由互联网提供用于对自然语句进行分词处理的分词工具包。
优选的,将分词处理后的词语与词典词汇进行匹配,依据目标查询语句中命名实体情况得到该目标查询语句中包含节点和边个数,匹配知识图谱模型中对应的查询语句类型。
上述的,对于语义复杂的目标查询语句,首先将该目标查询语句依据知识图谱模型中类型分解,针对分解后的语句分别生成对应的编程查询语句然后组合。
上述的,编程查询语句采用OrientDB数据库中的SQL语言。
更进一步地,本发明还提供一种基于命名实体识别的特定领域知识图谱自然语言查询装置,包含:类型划分模块和语句转换模块,其中,
类型划分模块,用于依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱模型构成利用<实体,关系,实体>三元组表示;
语句转换模块,用于获取目标查询语句,利用词典工具对目标查询语句进行分词,识别出目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应的编程查询语句。
本发明的有益效果:
本发明结合知识图谱的结构特点,将查询语句进行分类,通过对查询语句分词和命名实体识别,确定出查询语句的类型,最终转换成相对应的编程查询语句,容易实现,查询时间短,准确性高,可以较容易应用到各个特定领域知识图谱自然语言查询中,在金融、教育、医学等领域有广泛的应用前景,为特定领域知识图谱自然语言查询提供了新的思路。
附图说明:
图1为实施例中语言查询方法流程图;
图2为实施例中语言查询装置示意图;
图3为实施例中语言查询原理图。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
对于现有的知识图谱自然语言查询算法,其实现过程过于复杂,多数算法需要进行语义分析,研究句子的主、谓、宾的结构规律,部分方法中融入了复杂的公式推理,不易实现,另外查询时间也过于长,进而影响查询效率和增加软硬件运行负荷。在特定领域知识图谱中,考虑到其数据噪声较小,实体歧义较少等特点,现有的知识图谱查询方法对于特定领域来说过于复杂。为此,本发明实施例中,参见图1所示,提供一种基于命名实体识别的特定领域知识图谱自然语言查询方法,包含如下内容:
S101)依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱模型构成利用<实体,关系,实体>三元组表示;
S102)获取目标查询语句,利用词典工具对目标查询语句进行分词,识别出目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应的编程查询语句。
知识图谱是一种语义关系网络,节点和边是知识谱图的组成元素,“节点-边-节点”三元组是知识图谱的基本组成单元。其中节点表示实体或概念,实体是指现实世界中实际存在的个体,比如一个人物——周杰伦,一个国家——中国,一个城市——重庆等,概念是指从实体中抽象出来的表示,比如人、国家、城市等;边表示实体与实体、实体与概念或概念与概念之间的各种关系,比如“位于”、“就职于”、“隶属于”等。结合知识图谱的结构特点,将常用的自然语言查询语句进行分类,通过对查询语句分词和命名实体识别,确定出查询语句的类型,最终转换成相对应的编程查询语句,能够较准确地查询出相关结果,查询效率高。
进一步地,本发明实施例中,通过分析特定领域内常用自然语言查询语句,依据自然语言查询语句进行语义功能类型划分,如查询节点或查询边等,易于实现。
进一步地,本发明实施例中,将领域内自然语言查询语句类型划分为单个节点查询、依据节点和边对对应节点查询、两节点之间关系路径查询和属性最值查询四种类型。
根据知识图谱“节点-边-节点”的结构特点,以电影领域为例,分析常用的自然语言查询语句,可将语句分为以下四种类型:(1)对单个节点查询,对单个节点的查询是指对某个实体、概念的查询,实体查询如查询名为“黄渤”的演员,概念查询如查询“导演”。(2)根据节点和边查询对应的节点,该查询类型是指已知节点和相邻边的名称,查询对应的节点。如“黄渤参演的电影有哪些?”,该语句已知节点为“黄渤”,已知边为“参演”,即可查询出对应的电影节点。(3)查询两点之间的关系路径,该查询类型是指已知两个节点的名称,查询两点之间的联系。如“黄渤和巩俐有什么关系?”,已知节点“黄渤”和“巩俐”,即可查询出两点之间的关系路径。(4)查询属性最值,该查询类型是指查询某类属性的最大值或最小值,如“评分最高的电影是哪个?”,通过搜索到属性名“评分”和关键字“最高”,即可查询对应的最值。其他领域也可将自然语言查询语句划分为该四种类型,实现较准确地查询出相关结果。
进一步地,本发明实施例中,根据通过分词处理识别出的命名实体类型及个数,基于知识图谱模型中查询语句类型划分结果,确定目标查询语句类型,获取生成对应编程查询语句的要素信息,以生成编程查询语句。
进一步地,本发明实施例中,利用分词工具,并结合常规词典和专业词典,对目标查询语句进行分词处理。
进一步地,本发明实施例中,分词工具采用由互联网提供用于对自然语句进行分词处理的分词工具包。
进一步地,本发明实施例中,将分词处理后的词语与词典词汇进行匹配,依据目标查询语句中命名实体情况得到该目标查询语句中包含节点和边个数,匹配知识图谱模型中对应的查询语句类型。
进一步地,本发明实施例中,对于语义复杂的目标查询语句,首先将该目标查询语句依据知识图谱模型中类型分解,针对分解后的语句分别生成对应的编程查询语句然后组合。
进一步地,本发明实施例中,编程查询语句采用OrientDB数据库中的SQL语言。
更进一步地,参见图2所示,本发明实施例还提供一种基于命名实体识别的特定领域知识图谱自然语言查询装置,包含:类型划分模块101和语句转换模块102,其中,
类型划分模块101,用于依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱模型构成利用<实体,关系,实体>三元组表示;
语句转换模块102,用于获取目标查询语句,利用词典工具对目标查询语句进行分词,识别出目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应的编程查询语句。
为验证本发明实施例中技术方案的有效性,下面通过具体算法做进一步解释说明:
对于输入的自然语言查询语句,利用HanLP网站提供的java分词工具包,结合工具包自带的常规词典和自建的专业词典,对查询语句进行分词,然后将分过的词语与专业词典的词汇进行匹配,识别出查询语句中包含的命名实体,最后根据命名实体的类别和个数,确定查询语句的类型,转换成对应的SQL查询语句。整体算法的流程如图3所示:
1.对查询语句进行分词
采用HanLP网站提供的java分词工具包对输入的自然语句进行分词处理。对于特定领域的一些专业词汇,HanLP自带的词典中并不包含,分词时就可能将专业词汇错分,因此需要在HanLP工具包中添加该特定领域的专业词典。例如对于电影领域,需要添加电影类词典,该词典包含所有电影的名称,还需添加演员类、导演类、编剧类、语言类、属性以及边类等词典。其他特定领域,相同原理,可根据对应领域中的常用查询语句进行分析,在此不做详细阐述。
2.命名实体识别
对查询语句分词后,将分过的词语与专业领域词典的词汇进行匹配,以得知查询语句中包含的命名实体情况,即查询语句中包含节点和边的个数情况,便于匹配对应的查询语句类型。
3.查询语句类型匹配
根据命名实体识别得到的节点和边的个数,确定查询语句的类型:
(1)查询语句只包含1个节点,则是对该节点的查询;
(2)查询语句包含1个节点和1个边,则是对该节点和边对应的另一端节点的查询;
(3)查询语句包含2个节点,则是对两个节点之间的路径进行查询;
(4)查询语句中包含“最大/小”等关键词和属性词,则是对属性的最值进行查询。
5.生成SQL查询语句
OrientDB数据库所用的查询语言是SQL语言,因此将分好类的查询语句,转换成对应的SQL语言,举例说明如下:
(1)对于查询单个节点的语句,对应的SQL语句为:
SELECT FROM类名WHERE name="实体名"。
其中,实体名即为查询语句中的专业词汇,类名为该实体所在的类,本文将类名放在对应的专业词典的第一个位置,直接读取该类词典的第一个词汇即可获取类名。
(2)对于已知1个节点和1个边,查询另一节点的语句,对应的SQL语句为:
SELECT EXPAND(bothE('边名'))FROM类名WHERE name="实体名"。
其中,边名和实体名为查询语句中的实体关系名和实体名,类名为实体所在类的名称。
(3)对于查询两个节点关系的语句,对应的SQL语句为:
String rid1=SELECT@rid FROM V WHERE name="实体名1";
String rid2=SELECT@rid FROM V WHERE name="实体名2";
SELECT shortestPath(rid1,rid2)。
其中“实体名1”和“实体名2”为两个节点的名称。
(4)对于查询属性最值的语句,查询最大值对应的SQL语句为:
String pro=SELECT max(属性名)FROM V;
SELECT FROM V WHERE属性名=pro。
查询最小值对应的SQL语句为:
String pro=SELECT min(属性名)FROM V;
SELECT FROM V WHERE属性名=pro。
其中属性名为查询语句中实体属性的名称。
该方法适用于简单的自然语言查询,对于语义更复杂的查询,可将查询语句分解为上述4种类型的查询语句分别进行查询,然后进行组合。
本发明中,没有像其它算法那样对查询语句的语义进行分析研究,也没有复杂的公式计算,而是结合知识图谱的结构特点,将特定领域内常用的查询语句进行分类,通过对查询语句分词和命名实体识别,确定出查询语句的类型,最终转换成相对应的SQL查询语句。易于实现,在各个特定领域都容易转化成查询应用,同时该方法执行所用的时间较短,不影响用户的体验,在工程上具有一定的应用价值。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
基于上述的方法,本发明实施例还提供一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。
基于上述的方法,本发明实施例还提供一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现上述的方法。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,
A)依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱构成利用<实体,关系,实体>三元组表示;
B)获取目标查询语句,利用词典工具对目标查询语句进行分词,识别出目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应的编程查询语句。
2.根据权利要求1所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,A)中自然语言查询语句类型划分中,分析特定领域内常用自然语言查询语句,依据自然语言查询语句进行语义功能类型划分。
3.根据权利要求1或2所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,A)中,将领域内自然语言查询语句类型划分为单个节点查询、依据节点和边对对应节点查询、两节点之间关系路径查询和属性最值查询四种类型。
4.根据权利要求1所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,B)确定目标查询语句的类型中,根据通过分词处理识别出的命名实体类型及个数,基于知识图谱模型中查询语句类型划分结果,确定目标查询语句类型,获取生成对应编程查询语句的要素信息,以生成编程查询语句。
5.根据权利要求1或4所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,B)中,利用分词工具,并结合常规词典和专业词典,对目标查询语句进行分词处理。
6.根据权利要去5所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,B)中,分词工具采用由互联网提供用于对自然语句进行分词处理的分词工具包。
7.根据权利要求5所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,B)中,将分词处理后的词语与词典词汇进行匹配,依据目标查询语句中命名实体情况得到该目标查询语句中包含节点和边个数,匹配知识图谱模型中对应的查询语句类型。
8.根据权利要求1所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,B)中,对于语义复杂的目标查询语句,首先将该目标查询语句依据知识图谱模型中类型分解,针对分解后的语句分别生成对应的编程查询语句然后组合。
9.根据权利要求1或8所述的基于命名实体识别的特定领域知识图谱自然语言查询方法,其特征在于,B)中编程查询语句采用OrientDB数据库中的SQL语言。
10.一种基于命名实体识别的特定领域知识图谱自然语言查询装置,其特征在于,包含:类型划分模块和语句转换模块,其中,
类型划分模块,用于依据知识图谱模型将领域内自然语言查询语句进行类型划分,其中,知识图谱模型由系列节点和边构成,每个节点拥有相应属性,知识图谱模型构成利用<实体,关系,实体>三元组表示;
语句转换模块,用于获取目标查询语句,利用词典工具对目标查询语句进行分词,识别出目标查询语句中包含的命名实体,并基于知识图谱模型确定目标查询语句的类型,生成对应的编程查询语句。
CN201910434916.0A 2019-05-23 2019-05-23 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置 Pending CN110275947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910434916.0A CN110275947A (zh) 2019-05-23 2019-05-23 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910434916.0A CN110275947A (zh) 2019-05-23 2019-05-23 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置

Publications (1)

Publication Number Publication Date
CN110275947A true CN110275947A (zh) 2019-09-24

Family

ID=67959094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910434916.0A Pending CN110275947A (zh) 2019-05-23 2019-05-23 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置

Country Status (1)

Country Link
CN (1) CN110275947A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143394A (zh) * 2019-11-20 2020-05-12 泰康保险集团股份有限公司 知识数据处理方法、装置、介质及电子设备
CN111552792A (zh) * 2020-04-30 2020-08-18 中国建设银行股份有限公司 一种信息查询方法、装置、电子设备及存储介质
CN111611344A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 基于字典和知识图谱的复杂属性查询方法、系统及设备
CN111611806A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN111737489A (zh) * 2020-06-17 2020-10-02 广联达科技股份有限公司 一种建筑信息的检索方法、装置、设备及可读存储介质
CN111949781A (zh) * 2020-08-06 2020-11-17 贝壳技术有限公司 一种基于自然语句句法分析的智能交互方法及装置
CN112015919A (zh) * 2020-09-15 2020-12-01 重庆广播电视大学重庆工商职业学院 一种基于学习辅助知识图谱的对话管理方法
CN112001188B (zh) * 2020-10-30 2021-03-16 北京智源人工智能研究院 基于向量化语义规则快速实现nl2sql的方法和装置
CN112818092A (zh) * 2020-04-20 2021-05-18 腾讯科技(深圳)有限公司 知识图谱查询语句生成方法、装置、设备及存储介质
CN112989145A (zh) * 2021-05-11 2021-06-18 浙江大华技术股份有限公司 查询语句生成方法、装置、系统及计算机可读存储介质
CN113268591A (zh) * 2021-04-17 2021-08-17 中国人民解放军战略支援部队信息工程大学 基于事理图谱的空中目标意图判证方法及系统
CN113515640A (zh) * 2021-04-13 2021-10-19 北京捷通华声科技股份有限公司 查询语句生成方法及装置
CN113704445A (zh) * 2021-10-28 2021-11-26 北京明略昭辉科技有限公司 知识库问答方法、装置、电子设备和存储介质
CN114238653A (zh) * 2021-12-08 2022-03-25 华东师范大学 一种编程教育知识图谱构建、补全与智能问答的方法
CN114911915A (zh) * 2022-05-27 2022-08-16 重庆长安汽车股份有限公司 一种基于知识图谱的问答搜索方法、系统、设备和介质
TWI845796B (zh) * 2020-12-11 2024-06-21 股感媒體科技股份有限公司 知識圖譜聯想搜尋方法與其系統

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN109635122A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 智能疾病问询方法、装置、设备及存储介质
CN109766417A (zh) * 2018-11-30 2019-05-17 浙江大学 一种基于知识图谱的文学编年史问答系统的构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492077A (zh) * 2018-09-29 2019-03-19 北明智通(北京)科技有限公司 基于知识图谱的石化领域问答方法及系统
CN109635122A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 智能疾病问询方法、装置、设备及存储介质
CN109766417A (zh) * 2018-11-30 2019-05-17 浙江大学 一种基于知识图谱的文学编年史问答系统的构建方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111143394B (zh) * 2019-11-20 2023-06-13 泰康保险集团股份有限公司 知识数据处理方法、装置、介质及电子设备
CN111143394A (zh) * 2019-11-20 2020-05-12 泰康保险集团股份有限公司 知识数据处理方法、装置、介质及电子设备
CN112818092A (zh) * 2020-04-20 2021-05-18 腾讯科技(深圳)有限公司 知识图谱查询语句生成方法、装置、设备及存储介质
CN112818092B (zh) * 2020-04-20 2023-08-11 腾讯科技(深圳)有限公司 知识图谱查询语句生成方法、装置、设备及存储介质
CN111552792B (zh) * 2020-04-30 2023-11-21 中国建设银行股份有限公司 一种信息查询方法、装置、电子设备及存储介质
CN111552792A (zh) * 2020-04-30 2020-08-18 中国建设银行股份有限公司 一种信息查询方法、装置、电子设备及存储介质
CN111611344A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 基于字典和知识图谱的复杂属性查询方法、系统及设备
CN111611806A (zh) * 2020-05-06 2020-09-01 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN111611806B (zh) * 2020-05-06 2023-08-11 北京智通云联科技有限公司 一种用于知识图谱问答的语义解析方法、系统及设备
CN111737489A (zh) * 2020-06-17 2020-10-02 广联达科技股份有限公司 一种建筑信息的检索方法、装置、设备及可读存储介质
CN111949781A (zh) * 2020-08-06 2020-11-17 贝壳技术有限公司 一种基于自然语句句法分析的智能交互方法及装置
CN112015919A (zh) * 2020-09-15 2020-12-01 重庆广播电视大学重庆工商职业学院 一种基于学习辅助知识图谱的对话管理方法
CN112001188B (zh) * 2020-10-30 2021-03-16 北京智源人工智能研究院 基于向量化语义规则快速实现nl2sql的方法和装置
TWI845796B (zh) * 2020-12-11 2024-06-21 股感媒體科技股份有限公司 知識圖譜聯想搜尋方法與其系統
CN113515640A (zh) * 2021-04-13 2021-10-19 北京捷通华声科技股份有限公司 查询语句生成方法及装置
CN113268591A (zh) * 2021-04-17 2021-08-17 中国人民解放军战略支援部队信息工程大学 基于事理图谱的空中目标意图判证方法及系统
CN113268591B (zh) * 2021-04-17 2022-11-01 中国人民解放军战略支援部队信息工程大学 基于事理图谱的空中目标意图判证方法及系统
CN112989145A (zh) * 2021-05-11 2021-06-18 浙江大华技术股份有限公司 查询语句生成方法、装置、系统及计算机可读存储介质
CN113704445A (zh) * 2021-10-28 2021-11-26 北京明略昭辉科技有限公司 知识库问答方法、装置、电子设备和存储介质
CN114238653A (zh) * 2021-12-08 2022-03-25 华东师范大学 一种编程教育知识图谱构建、补全与智能问答的方法
CN114238653B (zh) * 2021-12-08 2024-05-24 华东师范大学 一种编程教育知识图谱构建、补全与智能问答的方法
CN114911915A (zh) * 2022-05-27 2022-08-16 重庆长安汽车股份有限公司 一种基于知识图谱的问答搜索方法、系统、设备和介质

Similar Documents

Publication Publication Date Title
CN110275947A (zh) 基于命名实体识别的特定领域知识图谱自然语言查询方法及装置
CN109408627B (zh) 一种融合卷积神经网络和循环神经网络的问答方法及系统
CN110727839B (zh) 自然语言查询的语义解析
Jung et al. Automated conversion from natural language query to SPARQL query
US20220277005A1 (en) Semantic parsing of natural language query
CN110222045A (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
CN110659357B (zh) 一种基于本体语义相似度的地理知识问答系统
He et al. Question answering over linked data using first-order logic
JP6729095B2 (ja) 情報処理装置及びプログラム
Yu et al. Retrofitting concept vector representations of medical concepts to improve estimates of semantic similarity and relatedness
Alambo et al. Topic-centric unsupervised multi-document summarization of scientific and news articles
Collarana et al. A question answering system on regulatory documents
Chen et al. Efficient sparql queries generator for question answering systems
Zhu et al. Causality extraction model based on two-stage GCN
Rasheed et al. Query expansion in information retrieval for Urdu language
Li et al. SANe: Space adaptation network for temporal knowledge graph completion
Burgdorf et al. DocSemMap 2.0: Semantic Labeling Based on Textual Data Documentations Using Seq2Seq Context Learner
Kokare et al. A survey of natural language query builder interface for structured databases using dependency parsing
Pirro et al. LOM: a linguistic ontology matcher based on information retrieval
Zhen et al. Research on entity semantic relation extraction in fusion domain
Diefenbach Question answering over knowledge bases
Berenguer et al. Word embeddings for retrieving tabular data from research publications
Muppidi et al. Influenced Citation Analysis using Modified Word Movers Distance (MWMD)
Jeon et al. Random forest algorithm for linked data using a parallel processing environment
AU2021105953A4 (en) Method for fine-grained domain terminology self-learning based on contextual semantics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190924