CN112417170A - 面向不完备知识图谱的关系链接方法 - Google Patents

面向不完备知识图谱的关系链接方法 Download PDF

Info

Publication number
CN112417170A
CN112417170A CN202011318513.9A CN202011318513A CN112417170A CN 112417170 A CN112417170 A CN 112417170A CN 202011318513 A CN202011318513 A CN 202011318513A CN 112417170 A CN112417170 A CN 112417170A
Authority
CN
China
Prior art keywords
relationship
path
relation
natural language
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011318513.9A
Other languages
English (en)
Other versions
CN112417170B (zh
Inventor
胡伟
赵耀
丁基伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN202011318513.9A priority Critical patent/CN112417170B/zh
Publication of CN112417170A publication Critical patent/CN112417170A/zh
Application granted granted Critical
Publication of CN112417170B publication Critical patent/CN112417170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种面向不完备知识图谱的关系链接方法,包括以下步骤:对输入的自然语言问句进行关键词提取、命名实体和类型识别与消歧,得到实体与类型链接列表;进行依存分析,获得问句对应的语义依存树,然后进行语义化搜索,判断树中任意实体类型对之间是否存在直接依存关系,得到过滤的实体类型对集合;在知识图谱中枚举所有以过滤出的实体和类型为头节点,且长度小于阈值的关系路径,得到候选关系路径列表;分别利用预训练的语言模型和知识图谱表示学习模型,将问句和候选关系路径转化为向量表示,进行相似度比较,选取相似度最高的候选关系路径作为最终的关系链接结果。本发明实现了对自然语言问句关系的鲁棒准确链接。

Description

面向不完备知识图谱的关系链接方法
技术领域
本发明涉及知识图谱和自然语言处理技术领域,尤其涉及一种面向不完备知识图谱的关系链接方法,具体是一种基于表示学习的面向不完备知识图谱的关系链接方法,特别是一种通过将自然语言问句和候选关系路径转化为向量进行相似度计算来实现面向关系路径的关系链接方法。
背景技术
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。知识图谱旨在描述真实世界中存在的各种实体或概念及其相互关系。其中,每个实体或概念用一个全局唯一确定的统一资源标识符来标识。每个属性-值对用来刻画实体的内在特性,而关系用来链接两个实体,刻画它们之间的关联。知识图谱也可以被看作是一张巨大的图,图中的节点表示实体或概念,而图中的边则由属性或关系构成。现在比较流行的知识图谱有DBpedia、Wikidata、Freebase、YAGO等,然而这些知识图谱仍然是不完备的。
自然语言处理(natural language processing)是研究人类用自然语言与计算机之间进行通信的技术,属于语言学、计算机科学、认知科学等相关学科的交叉学科,涉及范围广泛。此领域研究人与计算机交互的语言问题,探讨如何处理及运用自然语言,特别是如何编程计算机以成功处理大量的自然语言数据。处理自然语言的关键是要让计算机“理解”自然语言,自然语言处理的关键技术包括自然语句的分词、词性标注、命名实体识别、指代消解、句法依存分析等,可用于处理语音识别、文本分类、信息检索和智能问答等下游任务。
关系链接(relation linking)是帮助在自然语言问句和知识图谱之间建立映射关系的一种技术,旨在将自然语言问句中表达关系的单词短语链接到知识图谱中对应的边上。相似地,实体链接技术是将自然语言问句中的实体词汇链接到知识图谱中对应的节点上。实体链接技术已经成为较为成熟的研究,然而关系链接技术却很少受到关注。
发明内容
发明目的:针对上述现有技术存在的问题和不足,本发明的目的是提供一种面向不完备知识图谱的关系链接方法。在关系链接过程中,使用知识图谱和自然语言处理技术对自然语言问句和候选关系路径进行向量转化,从而实现对自然语言问句关系的鲁棒准确链接。
技术方案:为实现上述发明目的,本发明采用的技术方案为一种面向不完备知识图谱的关系链接方法,包括以下步骤:
(1.1)对于输入的一个自然语言问句,提取所述自然语言问句中的关键词,进行命名实体识别与消歧、类型识别与消歧,生成实体与类型链接列表;
(1.2)基于所述步骤(1.1)得到的实体与类型链接列表,进行依存分析,获得所述自然语言问句所对应的语义依存树,然后根据规则将所述语义依存树转化为有向图,并在所述有向图中进行语义化搜索,得到过滤实体类型对集合;
(1.3)基于所述步骤(1.2)得到的实体类型对集合,在知识图谱中枚举所有以过滤出的实体和类型为头节点,且长度小于阈值的关系路径,得到候选关系路径列表;
(1.4)基于所述步骤(1.3)得到的候选关系路径列表,分别利用预训练的语言模型和知识图谱表示学习模型,将所述自然语言问句和候选关系路径转化为向量表示,并进行相似度比较,选取相似度最高的候选关系路径作为最终的关系链接结果。
进一步的,所述步骤(1.2)包括以下步骤:
(2.1)基于所述步骤(1.1)得到的实体与类型链接列表,进行依存分析,得到所述自然语言问句对应的语义依存树;
(2.2)基于所述步骤(2.1)得到的语义依存树,根据依存关系的名称将依存树建图为有向图,所述有向图中边的方向与权值由依存关系决定;
(2.3)基于所述步骤(2.2)得到的有向图,进行语义化搜索,判断任意实体类型对之间是否存在直接依存关系,若某实体类型对之间存在直接依存关系,则将该实体类型对加入候选集合;遍历完毕所有实体类型对之后,将候选集合作为过滤实体类型对集合。
进一步的,所述步骤(1.4)包括以下步骤:
(3.1)基于所述步骤(1.1)的输入的自然语言问句,利用预训练的语言模型将所述自然语言问句转化为问句向量;
(3.2)基于所述步骤(1.3)得到的候选关系路径列表,利用预训练的知识图谱表示学习模型,将所述候选关系路径上的关系及实体转化为向量,并通过向量运算得到关系路径向量;
(3.3)基于所述步骤(3.1)得到的问句向量和所述步骤(3.2)得到的关系路径向量,进行相似度评分,得到相似度列表;
(3.4)对所述步骤(3.3)得到的相似度列表进行排序,选择相似度评分最高的路径作为最终的关系链接结果。
有益效果:(1)使用知识图谱和自然语言处理技术对输入的自然语言问句进行处理,枚举关系路径作为候选项,可以增加有效关系候选项数量的同时有效减少无效候选项的数量,提高了关系链接的效率;(2)基于表示学习的方式对自然语言问句和候选关系路径进行相似度比较,可以捕获更多的语义信息,利于机器的理解和处理,并且提高了关系链接的鲁棒性和准确率。
附图说明
图1是本发明的整体处理流程图;
图2是本发明定义的路径排序模型示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明面向三元组结构的不完备的知识图谱(下文简称为“知识图谱”),提出了一种通过基于自然语言问句枚举候选关系路径,将自然语言问句和候选关系路径转化为向量进行相似度计算,实现面向关系路径的关系链接方法。
在知识图谱中存在很多事实,它们被表示为单个三元组的形式,例如“动漫人物钢铁侠的出生地是纽约”,在知识图谱中表示为<"钢铁侠","出生地","纽约">。而知识图谱通常是不完备的,即缺失了许多事实。例如,假如在知识图谱中存在<"钢铁侠","出生地","纽约">和<"纽约","城市位于","美国">两个事实,但可能会缺失<"钢铁侠","国籍","美国">这条事实。因此,对于自然语言问句“钢铁侠的国籍是美国吗?”,关系链接技术无法将“国籍”链接到知识图谱中的某条边上,而只能将“国籍”通过“出生在某个地方,该地方是位于美国的城市”的关系路径进行链接。因此,本发明以关系路径为例,但方法也同样适用于单条关系。
本发明公开了一种基于表示学习的面向不完备知识图谱的关系链接方法,包括以下步骤:首先对用户输入的自然语言问句进行实体和类型的链接,实现关键词提取、命名实体识别与消歧、类型识别与消歧,得到实体与类型链接列表;接下来使用语义解析技术对问句进行依存分析,获得问句所对应的语义依存树,然后进行语义化搜索,判断树中任意实体类型对之间是否存在直接依存关系,得到过滤的实体类型对集合及它们之间的关系路径名称;然后在知识图谱中枚举所有以过滤出的实体和类型为头节点,且长度小于3的关系路径,得到候选关系路径列表;最后分别利用预训练的语言模型和知识图谱表示学习模型,将自然语言问句和候选关系路径转化为向量表示,进行相似度比较,选取相似度最高的候选关系路径作为最终的关系链接结果。本发明实现了对自然语言问句关系的快速准确的链接。
本发明的完整流程如图1所示,包括4个部分:根据用户输入的自然语言问句进行自然语言处理实现关键词提取以及命名实体和类型链接得到实体与类型链接列表,基于所得到的实体与类型链接列表运用语义解析技术进行依存分析得到依存树并进行语义化搜索和实体类型对过滤,再基于得到的实体类型对列表枚举所有候选关系路径,最后利用预训练的语言模型和知识图谱表示学习模型将自然语言问句和候选关系路径转化为向量表示进行相似度比较和排序得到最终的关系链接结果。
具体的实施方式分别说明如下:
1.根据用户输入的自然语言问句进行自然语言处理实现关键词提取以及命名实体和类型链接得到实体与类型链接列表
对于输入的一个自然语言问句(简称问句),首先对问句进行自然语言处理,使用开源工具,包括但不限于Falcon、EARL,对问句进行关键词提取、实体和类型链接。
在这个过程中,为了提高其中的类型链接的准确率,在开源工具对问句处理完毕后,加入一些类型列表(DBpedia具有的所有类型的列表)对链接结果进行二次校验,将原本开源工具进行类型链接时可能产生的链接错误(主要是开源工具无法识别或者过度识别的一些名词短语)加以解决,尽可能提高类型链接的准确度。
2.根据所得到的实体与类型链接列表运用语义解析技术进行依存分析得到依存树并进行语义化搜索和实体类型对过滤
使用开源工具,包括但不限于Stanford CoreNLP、Stanza,对用户输入的自然语言问句进行处理,生成问句的依存分析树。
考虑到依存分析树中的节点时以单个字词为基本单位,而实体和类型链接的基本单位是词组短语,因此需要将依存分析树中构成同一个实体或者类型短语的节点融合为一个节点,从而获得新的依存分析树。之后利用人工规则将依存分析树转化为一个有向图,进行语义化搜索,判断树中任意实体类型对之间是否存在直接依存关系,得到实体类型对集合。
建图及语义化搜索的过程如下:
(1)首先将依存关系的名称分为两大类,将sub、nsubj、nsubjpass、csubj、csubjpass、xsubj、poss、partmod八种关系统称为主语依存关系,将obj、pobj、dobj、iobj四种关系成为宾语依存关系。同时建立一个没有任何节点的空图。
(2)遍历依存树中的所有依存关系,记为<node1,r,node2>。统计依存树中node1和node2在实体类型对集合中的个数,记为w,例如node1在并且node2不在的话则为1,二者都不在的话记为0。下面进行分类讨论,如果r属于主语依存关系,则在新图中添加一条由node1指向node2,且权重为w的有向边;如果r属于宾语依存关系,则添加一条由node2指向node1,且权重为w的有向边;否则的话同时添加上述两条有向边。
(3)考虑到构建的新图一定是一个连通图,因此利用最短路径求解算法(如Floyd算法),更新图中所有节点之间的最短距离。假设节点间最短距离等于2代表所述节点对之间存在直接依存关系。遍历所述图中的任意节点对,如果所述节点对之间的最短距离长度等于2,那么就利用回溯算法得到两者之间的最短路径的具体名称,得到过滤的实体类型对集合及它们之间的关系路径名称。
例如“钢铁侠的国籍是美国吗?”问句得到的实体类型对集合为<"钢铁侠","美国">,以及它们之间的关系路径名称<"国籍">。
3.基于得到的实体类型对列表枚举所有候选关系路径
由于在前述步骤中已经利用开源工具对实体和类型进行了链接,可以直接枚举所有以过滤出的实体和类型为头节点,且长度小于3的关系路径。所有以过滤出的实体和类型为头节点,长度为1或者为2的关系路径都将被加入到候选关系路径集合中。
一般的,以一个实体或类型为头节点的关系路径是无穷多的,这些路径往往表达了不同的含义。但如果路径长度超过了某个阈值,该路径的语义表达就会变得没有具体的含义。因此,在一定的长度范围内,路径的距离越长,表达的含义越丰富。
对于知识图谱而言,由于包含了海量的实体、类型、关系等信息,如何进行有效的存储和管理是其面临的一大问题。现有的知识库大多以RDF三元组的形式进行存储,而SPARQL则是对于此类存储方式的查询语言。通过构建与SQL类似的查询语句,可以方便的进行关系路径的枚举。例如通过查询语句"Select?hwhere{?h?r?t.}",可以枚举知识图谱中所有的三元组。
4.利用预训练的语言模型和知识图谱表示学习模型将自然语言问句和候选关系路径转化为向量表示进行相似度比较和排序得到最终的关系链接结果
基于用户输入的自然语言问句和前述处理得到的实体类型对集合及它们之间的关系路径名称,利用预训练的语言模型(如BERT、RoBERTa等)可以将自然语言层面的语义信息转化为低维向量;同时基于枚举的知识图谱中的关系路径,利用预训练的知识图谱表示学习模型(如TransE、RotatE等)可以将知识图谱层面的语义信息转化为另一种低维向量,考虑二者的相似程度,选出最合适的关系路径链接结果。
如图2所示,首先基于前述步骤得到的实体类型对集合及它们之间的关系路径名称,利用预训练语言模型进行转化得到问句向量。为了引入更多的先验知识,利用外部词典,包括但不限于PATTY、Paraphrase,引入与当前用户输入问句最相关的m=10个释义项{p1,...,pm}。释义项与问句的相似度可以通过word2vec向量计算等方式进行计算,然后同样利用预训练语言模型将它们同样转为向量,与问句向量融合得到最终的问句表示q。
基于枚举得到的所有候选关系路径,利用预训练知识图谱表示学习模型进行向量转化。由于预训练知识图谱模型本身包含了关系的转移信息,如r1+r2=r,r+r-1=0,因此可以直接利用该模型进行语义的叠加,如“出生地+城市位于=国籍”。本发明将候选关系的数量为n=20,则经过向量转化后,所有候选关系路径被表示为{path1,...,path20}的20个维度相同的关系路径向量。
一般的,自然语言问句中的关系表述和知识图谱中的关系表述存在一定的相似性,直接利用字符串匹配的方式进行相似度比较可以取得一定的效果。但是由于自然语言表述的多样性,不同的单词能够表达相似的含义,甚至通过单词的组合叠加也能表达同样的含义。神经网络的方式则可以更好的捕捉到语义上的相似于差异,通过将单词映射到低维空间中,将单词字符串的对比转化为向量之间的加减运算。类似的,在知识图谱中也可以通过类似的方式进行语义上的映射。
分别计算问句表示q和所有候选关系路径表示{path1,...,path20}的相似度,得到相似度评分列表。每一条关系路径表示记为pathi,则对于问句表示q和候选关系路径表示pathi的相似度评分S(q,pathi)计算即为:
S(q,pathi)=(q·pathi)/(||q||*||pathi||)∈[0,1]
相似度评分S(q,pathi)数值越大,说明问句和关系路径表达的语义越相似;反之亦然。然后对该列表进行排序,选择相似度评分最高的路径作为最终的关系链接结果。
本发明不同于字符串匹配的关系链接方法,而是以基于向量表示计算的关系路径链接方法。面向缺失事实的不完备知识图谱,实现了从自然语言问句到知识图谱候选关系路径的枚举与转换,又以基于相似度计算的方式实现基于表示学习的关系路径选择,能够比字符串匹配的关系链接方法得到含义更为鲁棒和准确的关系路径链接结果。

Claims (3)

1.一种面向不完备知识图谱的关系链接方法,其特征在于,包括以下步骤:
(1.1)对于输入的一个自然语言问句,提取所述自然语言问句中的关键词,进行命名实体识别与消歧、类型识别与消歧,生成实体与类型链接列表;
(1.2)基于所述步骤(1.1)得到的实体与类型链接列表,进行依存分析,获得所述自然语言问句所对应的语义依存树,然后根据规则将所述语义依存树转化为有向图,并在所述有向图中进行语义化搜索,得到过滤实体类型对集合;
(1.3)基于所述步骤(1.2)得到的实体类型对集合,在知识图谱中枚举所有以过滤出的实体和类型为头节点,且长度小于阈值的关系路径,得到候选关系路径列表;
(1.4)基于所述步骤(1.3)得到的候选关系路径列表,分别利用预训练的语言模型和知识图谱表示学习模型,将所述自然语言问句和候选关系路径转化为向量表示,并进行相似度比较,选取相似度最高的候选关系路径作为最终的关系链接结果。
2.根据权利要求1所述的面向不完备知识图谱的关系链接方法,其特征在于,所述步骤(1.2)包括以下步骤:
(2.1)基于所述步骤(1.1)得到的实体与类型链接列表,进行依存分析,得到所述自然语言问句对应的语义依存树;
(2.2)基于所述步骤(2.1)得到的语义依存树,根据依存关系的名称将依存树建图为有向图,所述有向图中边的方向与权值由依存关系决定;
(2.3)基于所述步骤(2.2)得到的有向图,进行语义化搜索,判断任意实体类型对之间是否存在直接依存关系,若某实体类型对之间存在直接依存关系,则将该实体类型对加入候选集合;遍历完毕所有实体类型对之后,将候选集合作为过滤实体类型对集合。
3.根据权利要求1所述的面向不完备知识图谱的关系链接方法,其特征在于,所述步骤(1.4)包括以下步骤:
(3.1)基于所述步骤(1.1)的输入的自然语言问句,利用预训练的语言模型将所述自然语言问句转化为问句向量;
(3.2)基于所述步骤(1.3)得到的候选关系路径列表,利用预训练的知识图谱表示学习模型,将所述候选关系路径上的关系及实体转化为向量,并通过向量运算得到关系路径向量;
(3.3)基于所述步骤(3.1)得到的问句向量和所述步骤(3.2)得到的关系路径向量,进行相似度评分,得到相似度列表;
(3.4)对所述步骤(3.3)得到的相似度列表进行排序,选择相似度评分最高的路径作为最终的关系链接结果。
CN202011318513.9A 2020-11-23 2020-11-23 面向不完备知识图谱的关系链接方法 Active CN112417170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011318513.9A CN112417170B (zh) 2020-11-23 2020-11-23 面向不完备知识图谱的关系链接方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011318513.9A CN112417170B (zh) 2020-11-23 2020-11-23 面向不完备知识图谱的关系链接方法

Publications (2)

Publication Number Publication Date
CN112417170A true CN112417170A (zh) 2021-02-26
CN112417170B CN112417170B (zh) 2023-11-14

Family

ID=74778358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011318513.9A Active CN112417170B (zh) 2020-11-23 2020-11-23 面向不完备知识图谱的关系链接方法

Country Status (1)

Country Link
CN (1) CN112417170B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157891A (zh) * 2021-05-07 2021-07-23 泰康保险集团股份有限公司 知识图谱路径排序方法、系统、设备及存储介质
CN116069919A (zh) * 2023-03-07 2023-05-05 华侨大学 基于文本和图拓扑相似的问句实体链接方法、装置和介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140236570A1 (en) * 2013-02-18 2014-08-21 Microsoft Corporation Exploiting the semantic web for unsupervised spoken language understanding
KR20150084706A (ko) * 2015-06-26 2015-07-22 경북대학교 산학협력단 온톨로지의 지식 학습 장치 및 그의 방법
CN105701253A (zh) * 2016-03-04 2016-06-22 南京大学 中文自然语言问句语义化的知识库自动问答方法
CN108052547A (zh) * 2017-11-27 2018-05-18 华中科技大学 基于问句和知识图结构分析的自然语言问答方法及系统
US20180232443A1 (en) * 2017-02-16 2018-08-16 Globality, Inc. Intelligent matching system with ontology-aided relation extraction
CN108628834A (zh) * 2018-05-14 2018-10-09 国家计算机网络与信息安全管理中心 一种基于句法依存关系的词语表示学习方法
CN110275894A (zh) * 2019-06-24 2019-09-24 恒生电子股份有限公司 一种知识图谱的更新方法、装置、电子设备及存储介质
KR20190133931A (ko) * 2018-05-24 2019-12-04 한국과학기술원 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
CN110597999A (zh) * 2019-08-01 2019-12-20 湖北工业大学 一种依存句法分析关系抽取模型的司法案件知识图谱构建方法
CN110633467A (zh) * 2019-08-29 2019-12-31 中国人民解放军国防科技大学 一种基于改进特征融合的语义关系抽取方法
CN111488734A (zh) * 2020-04-14 2020-08-04 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN111488441A (zh) * 2020-04-08 2020-08-04 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答系统和电子设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140236570A1 (en) * 2013-02-18 2014-08-21 Microsoft Corporation Exploiting the semantic web for unsupervised spoken language understanding
KR20150084706A (ko) * 2015-06-26 2015-07-22 경북대학교 산학협력단 온톨로지의 지식 학습 장치 및 그의 방법
CN105701253A (zh) * 2016-03-04 2016-06-22 南京大学 中文自然语言问句语义化的知识库自动问答方法
US20180232443A1 (en) * 2017-02-16 2018-08-16 Globality, Inc. Intelligent matching system with ontology-aided relation extraction
CN108052547A (zh) * 2017-11-27 2018-05-18 华中科技大学 基于问句和知识图结构分析的自然语言问答方法及系统
CN108628834A (zh) * 2018-05-14 2018-10-09 国家计算机网络与信息安全管理中心 一种基于句法依存关系的词语表示学习方法
KR20190133931A (ko) * 2018-05-24 2019-12-04 한국과학기술원 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
CN110275894A (zh) * 2019-06-24 2019-09-24 恒生电子股份有限公司 一种知识图谱的更新方法、装置、电子设备及存储介质
CN110597999A (zh) * 2019-08-01 2019-12-20 湖北工业大学 一种依存句法分析关系抽取模型的司法案件知识图谱构建方法
CN110633467A (zh) * 2019-08-29 2019-12-31 中国人民解放军国防科技大学 一种基于改进特征融合的语义关系抽取方法
CN111488441A (zh) * 2020-04-08 2020-08-04 北京百度网讯科技有限公司 问题解析方法、装置、知识图谱问答系统和电子设备
CN111488734A (zh) * 2020-04-14 2020-08-04 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
QUAN WANG等: "knowledge graph embedding:a survey of approaches and applications", IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, vol. 29, no. 12, pages 2724 - 2743 *
刘康;张元哲;纪国良;来斯惟;赵军;: "基于表示学习的知识库问答研究进展与展望", 自动化学报, vol. 42, no. 06, pages 807 - 818 *
涂存超;杨成;刘知远;孙茂松;: "网络表示学习综述", 中国科学:信息科学, vol. 47, no. 08, pages 980 - 996 *
王学奎: "基于煤矿科学知识图谱的智能问答技术研究", 中国优秀硕士学位论文全文数据库, no. 9, pages 138 - 1263 *
谭晓;张志强;: "知识图谱研究进展及其前沿主题分析", 图书与情报, no. 02, pages 50 - 63 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157891A (zh) * 2021-05-07 2021-07-23 泰康保险集团股份有限公司 知识图谱路径排序方法、系统、设备及存储介质
CN113157891B (zh) * 2021-05-07 2023-11-17 泰康保险集团股份有限公司 知识图谱路径排序方法、系统、设备及存储介质
CN116069919A (zh) * 2023-03-07 2023-05-05 华侨大学 基于文本和图拓扑相似的问句实体链接方法、装置和介质

Also Published As

Publication number Publication date
CN112417170B (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
CN107038229B (zh) 一种基于自然语义分析的用例提取方法
Zubrinic et al. The automatic creation of concept maps from documents written using morphologically rich languages
RU2686000C1 (ru) Извлечение информационных объектов с использованием комбинации классификаторов, анализирующих локальные и нелокальные признаки
CN111611361A (zh) 抽取式机器智能阅读理解问答系统
CN111522910B (zh) 一种基于文物知识图谱的智能语义检索方法
CN109960786A (zh) 基于融合策略的中文词语相似度计算方法
CN110674252A (zh) 一种面向司法领域的高精度语义搜索系统
WO2015043075A1 (zh) 面向微博的情感实体搜索系统
CN110245238B (zh) 基于规则推理和句法模式的图嵌入方法及系统
CN111339269A (zh) 模板自动生成的知识图谱问答训练及应用服务系统
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN114065758A (zh) 一种基于超图随机游走的文档关键词抽取方法
CN112036178A (zh) 一种配网实体相关的语义搜索方法
CN114912449B (zh) 基于代码描述文本的技术特征关键词抽取方法与系统
CN112507109A (zh) 一种基于语义分析与关键词识别的检索方法和装置
CN112632250A (zh) 一种多文档场景下问答方法及系统
CN111639165A (zh) 基于自然语言处理和深度学习的智能问答优化方法
CN112417170B (zh) 面向不完备知识图谱的关系链接方法
CN113407697A (zh) 深度百科学习的中文医疗问句分类系统
Samih et al. Enhanced sentiment analysis based on improved word embeddings and XGboost.
CN114841353A (zh) 一种融合句法信息的量子语言模型建模系统及其应用
CN118093829A (zh) 一种基于知识图谱增强的法律咨询方法
CN114265936A (zh) 一种科技项目文本挖掘的实现方法
CN113963748A (zh) 一种蛋白质知识图谱向量化方法
Wang et al. Identifying chinese lexical inference using probabilistic soft logic

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant