CN107480191A - 一种迭代的实体对齐模型 - Google Patents

一种迭代的实体对齐模型 Download PDF

Info

Publication number
CN107480191A
CN107480191A CN201710565742.2A CN201710565742A CN107480191A CN 107480191 A CN107480191 A CN 107480191A CN 201710565742 A CN201710565742 A CN 201710565742A CN 107480191 A CN107480191 A CN 107480191A
Authority
CN
China
Prior art keywords
entity
msub
mrow
knowledge mapping
vector representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710565742.2A
Other languages
English (en)
Other versions
CN107480191B (zh
Inventor
刘知远
朱昊
谢若冰
孙茂松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201710565742.2A priority Critical patent/CN107480191B/zh
Publication of CN107480191A publication Critical patent/CN107480191A/zh
Application granted granted Critical
Publication of CN107480191B publication Critical patent/CN107480191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供实体对齐方法和设备用于解决传统的知识对齐方式往往需要笨重的人力劳动或者精心手动构造的问题。其中分别获得第一知识图谱KG1中实体的向量表示和第二知识图谱KG2中实体的向量表示;根据输入的对齐种子实体对集合,绑定第一知识图谱KG1和第二知识图谱KG2中表示相同含义的实体向量表示,获得第三知识图谱;根据第三知识图谱、第一知识图谱KG1中实体的向量表示和第二知识图谱中实体的向量表示,迭代计算实体向量表示之间的相似度;在迭代计算过程中,若某一对实体向量表示的距离小于阈值,则将该对实体向量表示对应的实体对加入第三知识图谱,直至第三知识图谱的实体个数不再增,本发明具有良好的实用性。

Description

一种迭代的实体对齐模型
技术领域
本发明涉及计算机技术,具体涉及一种迭代的实体对齐模型。
背景技术
人们将互联网上的大量信息进行抽取,并加入不同的单一领域或开领域的知识库中。这些知识库往往有着不尽相同的结构,但是也有一些共有的性质。
知识库往往由一些实体集合E、关系集合R和三元组集合T组成,即KG=(E,R,T)。其中实体集合往往包含有客观世界上的一些有可区别性且独立存在的事物,比如“地球”、“中国”、“珠穆朗玛峰”等等。而关系集合则是描述实体之间的内在联系,比如“是……的公民”、“出生于……”等。三元组描述的是实体和实体直接的关系,也即 这个集合中的元素应当是客观世界中真实的知识,比如(“巴拉克·奥巴马”,“是……的公民”,“美国”)。
虽然已有的知识图谱包含了上亿个事实,相比于无尽的现实世界,它们仍然远远没有完善。为了对知识图谱进行完善,现在有很多工作在研究如何自动的对知识图谱进行完善。大多数现存的知识图谱都是独立创建的,这些知识图谱不可避免地是异构的,所以其中的知识往往是互补的。因此融合知识图谱对于可以产生大量的知识。值得注意的是,在绝大多数知识图谱中关系的个数远小于实体的个数,所以实体的对齐是知识图谱融合的关键。
传统的知识对齐方式往往需要笨重的人力劳动或者精心手动构造的特征。虽然依靠人力的知识对齐工作往往的效果都比较好,但是,人参与的方法一般比较耗时,成本高,而且也有一些拓展的不灵活性。
发明内容
鉴于上述问题,本发明提出了克服上述问题或者至少部分地解决上述问题的实体对齐方法和设备。
为此目的,第一方面,本发明提出一种实体对齐方法,包括步骤:分别获得第一知识图谱KG1中实体的向量表示和第二知识图谱KG2中实体的向量表示;
根据输入的对齐种子实体对集合,绑定第一知识图谱KG1和第二知识图谱KG2中表示相同含义的实体向量表示,获得第三知识图谱KG;
根据第三知识图谱KG、第一知识图谱KG1中实体的向量表示和第二知识图谱中实体的向量表示,迭代计算实体向量表示之间的相似度;在迭代计算过程中,若某一对实体向量表示的距离小于阈值,则将该对实体向量表示对应的实体对加入第三知识图谱KG,直至第三知识图谱KG的实体个数不再增加。
可选的,所述迭代计算实体向量表示之间的相似度,包括:
训练第一知识图谱KG1与第二知识图谱KG2之间的映射关系,直到评价函数L最小;其中:
L=K+I;
KT=∑(h,r,t)∈TL(h,r,t);
L(h,r,t)=∑(h′,r′,t′)∈T-[γ+E(h,r,t)-E(h′,r′,t′)]+
E(h,r,t)=||h+r-t||;
其中[x]+=max{0,x}表示0和x中的最大值,
T-
{(h′,r,t)|h′∈E1UE2}∪{(h,r,t′)|t′∈T1UT2}∪{(h,r′,t)|r′∈R},(h,r,t)∈KG1∪KG2};
R(e1,e2)=σ(k(θ-E(e1,e2)));
E(p,r)=|(|p-r|)|=|(|p-(t-h)|)|=E(h,p,t);
其中,H函数表示将评价函数中的每一项中的实体替换成新对齐实体对中的对应的实体的函数,第一知识图谱KG1=(E1,R,T1),第二知识图谱KG2=(E2,R,T2),第三知识图谱KG=(E,R,T);其中,E、E1、E2表示分别属于和KG、KG1和KG2实体集、R表示KG、KG1和KG2中的关系集;T、T1和T2表示分别属于KG、KG1和KG2的三元组的集合;
e1∈E1,e2∈E2,e、h∈E1∪E2,r1、r2∈R,t∈T1∪T2,γ、θ、Z为超参数。
可选的,所述迭代计算实体向量表示之间的相似度,包括:
通过随机梯度下降,最小化评价函数,对所有参数进行学习与更新。
第二方面,本发明提供一种。计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一所述方法的步骤。
第三方面,本发明提供一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上执行的计算机程序,所述处理器执行所述程序时实现如上任一所述方法的步骤。
由上述技术方案可知,与现有技术相比,本发明提出了一种基于联合知识表示的迭代实体对齐模型,不但可以使用好有标注的对齐种子,还可以利用在算法中自我标注的新对齐实体对,提高模型的效果,具有良好的实用性。
前面是提供对本发明一些方面的理解的简要发明内容。这个部分既不是本发明及其各种实施例的详尽表述也不是穷举的表述。它既不用于识别本发明的重要或关键特征也不限定本发明的范围,而是以一种简化形式给出本发明的所选原理,作为对下面给出的更具体的描述的简介。应当理解,单独地或者组合地利用上面阐述或下面具体描述的一个或多个特征,本发明的其它实施例也是可能的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一个实施例中执行方法的流程示意图。
具体实施方式
下面将结合示例性的通信系统描述本发明。
实体对齐的任务可以被定义为对于两个给定的知识图谱KG1和KG2。KGi=(Ei,Ri,Ti)其中Ei,Ri,Ti分别表示知识图谱中实体、关系、三元组的集合(由于关系的个数往往很少,在后面的讨论中,我们认为关系已经被对齐了,我们不再区分R1,R2统一使用R)。我们已知一些由来自两个不同知识图谱中的实体组成的同义实体对 即根据对齐种子实体对集合,e1,e2是已对齐的种子实体对,e1,e2是分别在KG1和KG2中含义是相同的,为了对齐KG1和KG2中的除了种子实体对集合中的实体,本发明公开一种实体对齐方法,参见图1,包括步骤:
分别获得第一知识图谱KG1中实体的向量表示和第二知识图谱KG2中实体的向量表示;
S101、根据输入的对齐种子实体对集合,绑定第一知识图谱KG1和第二知识图谱KG2中表示相同含义的实体向量表示,获得第三知识图谱;
S102、根据第三知识图谱、第一知识图谱KG1中实体的向量表示和第二知识图谱中实体的向量表示,迭代计算实体向量表示之间的相似度;在迭代计算过程中,若某一对实体向量表示的距离小于阈值,则将该对实体向量表示对应的实体对加入第三知识图谱,直至第三知识图谱KG3的实体个数不再增加。
上述第三知识图谱KG的实体个数不再增加,也即计算获得的实体对个数几乎不再增加。
在本发明的一个实施例中,所述迭代计算实体向量表示之间的相似度,包括:
训练第一知识图谱KG1与第二知识图谱KG2之间的映射关系,直到评价函数L的值最小;其中:
L=K+I;
KT=∑(h,r,t)∈rL(h,r,t);
L(h,r,t)=∑(h′,r′,t′)∈T-[γ+E(h,r,t)-E(h′,r′,t′)]+
E(h,r,t)=||h+r-t||;
其中[x]+=max{0,x}表示0和x中的最大值,
T-
{(h′,r,t)|h′∈E1UE2}∪{(h,r,t′)|t′∈T1UT2}∪{(h,r′,t)|r′∈R},(h,r,t)∈KG1∪KG2};
R(e1,e2)=σ(k(θ-E(e1,e2)));
E(p,r)=|(|p-r|)|=|(|p-(t-h)|)|=E(h,p,t);
其中,H函数表示将评价函数中的每一项中的实体替换成新对齐实体对中的对应的实体的函数,第一知识图谱KG1=(E1,R,T1),第二知识图谱KG2=(E2,R,T2),第三知识图谱KG=(E,R,T);其中,E、E1、E2表示分别属于和KG、KG1和KG2实体集、R表示KG、KG1和KG2中的关系集;T、T1和T2表示分别属于KG、KG1和KG2的三元组的集合;e1∈E1,e2∈E2,e、h∈E1∪E2,r1、r2∈R,t∈T1∪T2,γ、θ、Z为超参数。
上述三元组(h,r,t)∈T1∪T2,E(h,r,t)=||h+r-t||.,在知识图谱中,知识除了存在于三元组中,还广泛存在于三元组之间的关系路径中。例如,(e1,r1,e2)和(e2,r2,e3)可能揭示了一个新的知识这个里面的是一个由这两个关系组成的函数。
我们定义关系路径为并定义两个实体之间的路径集合为
如果一个关系路径和一个关系的作用相同,也即p∈P(h,t)和(h,r,t)∈T。我们定义这个路径的向量表示为我们可以定义能量方程为
E(p,r)=||p-r||=||p-(t-h)||=E(h,p,t)。
于是我们就可以定义整体的评价函数
这里的L(p,r)是一个基于间隔的损失函数。
对于每一个实体寻找一个和它距离最近的实体,如果两者的嵌入表示的距离小于某一个阈值则通过距离计算两者的相似度
在训练一定次数之后,我们对于每一个实体寻找一个和它距离最近的实体,并加入新对齐实体对集合。对于每一对实体对(e1,e2),我们定义一个映射R→[0,1]来计算可靠性函数
R(e1,e2)=σ(k(θ-E(e1,e2))),
这里的σ(·)是S函数(例如),k是一个超参数。我们可以形式化这一部分的评价函数为
这里的H函数表示将评价函数中的每一项中的实体替换成新对齐实体对中的对应的实体的函数。
通过随机梯度下降,最小化评价函数,对所有参数进行学习与更新。
具体地,我们通过最小化评价函数学习所有的参数。评价函数公式如下:
L=K+I
与现有技术相比,本发明提出了一种基于联合知识表示的迭代实体对齐模型。这种技术使用了表示学习的方法,具有更快的速度和准确度以及鲁棒性。更多地,本发明不但可以使用好有标注的对齐种子,还可以在算法中利用好自我标注的新对齐实体对,以提高模型的效果,具有良好的实用性。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任一所述方法的步骤。
本发明还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上执行的计算机程序,所述处理器执行所述程序时实现如上任一所述方法的步骤。
本文中使用的“至少一个”、“一个或多个”以及“和/或”是开放式的表述,在使用时可以是联合的和分离的。例如,“A、B和C中的至少一个”,“A、B或C中的至少一个”,“A、B和C中的一个或多个”以及“A、B或C中的一个或多个”指仅有A、仅有B、仅有C、A和B一起、A和C一起、B和C一起或A、B和C一起。
术语“一个”实体是指一个或多个所述实体。由此术语“一个”、“一个或多个”和“至少一个”在本文中是可以互换使用的。还应注意到术语“包括”、“包含”和“具有”也是可以互换使用的。
本文中使用的术语“自动的”及其变型是指在执行处理或操作时没有实质的人为输入的情况下完成的任何处理或操作。然而,即使在执行处理或操作时使用了执行所述处理或操作前接收到的实质的或非实质的人为输入,所述处理或操作也可以是自动的。如果输入影响所述处理或操作将怎样进行,则视该人为输入是实质的。不影响所述处理或操作进行的人为输入不视为是实质的。
本文中使用的术语“计算机可读介质”是指参与将指令提供给处理器执行的任何有形存储设备和/或传输介质。计算机可读介质可以是在IP网络上的网络传输(如SOAP)中编码的串行指令集。这样的介质可以采取很多形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如NVRAM或者磁或光盘。易失性介质包括诸如主存储器的动态存储器(如RAM)。计算机可读介质的常见形式包括例如软盘、柔性盘、硬盘、磁带或任何其它磁介质、磁光介质、CD-ROM、任何其它光介质、穿孔卡、纸带、任何其它具有孔形图案的物理介质、RAM、PROM、EPROM、FLASH-EPROM、诸如存储卡的固态介质、任何其它存储芯片或磁带盒、后面描述的载波、或计算机可以读取的任何其它介质。电子邮件的数字文件附件或其它自含信息档案或档案集被认为是相当于有形存储介质的分发介质。当计算机可读介质被配置为数据库时,应该理解该数据库可以是任何类型的数据库,例如关系数据库、层级数据库、面向对象的数据库等等。相应地,认为本发明包括有形存储介质或分发介质和现有技术公知的等同物以及未来开发的介质,在这些介质中存储本发明的软件实施。
本文中使用的术语“确定”、“运算”和“计算”及其变型可以互换使用,并且包括任何类型的方法、处理、数学运算或技术。更具体地,这样的术语可以包括诸如BPEL的解释规则或规则语言,其中逻辑不是硬编码的而是在可以被读、解释、编译和执行的规则文件中表示。
本文中使用的术语“模块”或“工具”是指任何已知的或以后发展的硬件、软件、固件、人工智能、模糊逻辑或能够执行与该元件相关的功能的硬件和软件的组合。另外,虽然用示例性实施方式来描述本发明,但应当理解本发明的各方面可以单独要求保护。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。
尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。

Claims (5)

1.实体对齐方法,其特征在于,包括步骤:
分别获得第一知识图谱KG1中实体的向量表示和第二知识图谱KG2中实体的向量表示;
根据输入的对齐种子实体对集合,绑定第一知识图谱KG1和第二知识图谱KG2中表示相同含义的实体向量表示,获得第三知识图谱KG;
根据第三知识图谱KG、第一知识图谱KG1中实体的向量表示和第二知识图谱中实体的向量表示,迭代计算实体向量表示之间的相似度;在迭代计算过程中,若某一对实体向量表示的距离小于阈值,则将该对实体向量表示对应的实体对加入第三知识图谱KG,直至第三知识图谱KG的实体个数不再增加。
2.根据权利要求1所述的方法,其特征在于,所述迭代计算实体向量表示之间的相似度,包括:
训练第一知识图谱KG1与第二知识图谱KG2之间的映射关系,直到评价函数L最小;其中:
L=K+I;
<mrow> <mi>K</mi> <mo>=</mo> <msub> <mi>K</mi> <mi>T</mi> </msub> <mo>+</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mo>(</mo> <mi>h</mi> <mo>,</mo> <mi>r</mi> <mo>,</mo> <mi>t</mi> <mo>)</mo> <mo>&amp;Element;</mo> <mi>T</mi> </mrow> </msub> <mo>&amp;lsqb;</mo> <mfrac> <mn>1</mn> <mi>Z</mi> </mfrac> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>p</mi> <mo>&amp;Element;</mo> <mi>P</mi> <mrow> <mo>(</mo> <mi>h</mi> <mo>,</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </msub> <mi>R</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>|</mo> <mi>h</mi> <mo>,</mo> <mi>t</mi> <mo>)</mo> </mrow> <mi>L</mi> <mrow> <mo>(</mo> <mi>p</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <mo>;</mo> </mrow>
KT=∑(h,r,t)∈TL(h,r,t);
L(h,r,t)=∑(h′,r′,t′)∈T-[γ+E(h,r,t)-E(h′,r′,t′)]+
E(h,r,t)=||h+r-t||;
其中[x]+=max{0,x}表示0和x中的最大值,
T-={(h′,r,t)|h′∈E1∪E2}∪{(h,r,t′)|t′∈T1∪T2}∪{(h,r′,t)|r′∈R},(h,r,t)∈KG1∪KG2};
R(e1,e2)=σ(k(θ-E(e1,e2)));
E(p,r)=|(|p-r|)|=|(|p-(t-h)|)|=E(h,p,t);
<mrow> <mi>I</mi> <mo>=</mo> <mi>&amp;Sigma;</mi> <mi>R</mi> <mrow> <mo>(</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>e</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>H</mi> <mrow> <mo>(</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>e</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </msub> <mo>+</mo> <msub> <mi>H</mi> <mrow> <mo>(</mo> <msub> <mi>e</mi> <mn>2</mn> </msub> <mo>,</mo> <msub> <mi>e</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </msub> <mo>)</mo> </mrow> <mo>;</mo> </mrow>
其中,H(ex,ey)函数表示将K函数中的每一项ex替换为ey之后的函数,第一知识图谱KG1=(E1,R,T1),第二知识图谱KG2=(E2,R,T2),第三知识图谱KG=(E,R,T);其中,E、E1、E2表示分别属于和KG、KG1和KG2实体集、R表示KG、KG1和KG2中的关系集;T、T1和T2表示分别属于KG、KG1和KG2的三元组的集合;e1∈E1,e2∈E2,e、h∈E1∪E2,r1、r2∈R,t∈T1∪T2,γ、θ、Z为超参数。
3.根据权利要求1所述的方法,其特征在于,所述迭代计算实体向量表示之间的相似度,包括:
通过随机梯度下降,最小化评价函数,对所有参数进行学习与更新。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至3任一所述方法的步骤。
5.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上执行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3任一所述方法的步骤。
CN201710565742.2A 2017-07-12 2017-07-12 一种迭代的实体对齐模型 Active CN107480191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710565742.2A CN107480191B (zh) 2017-07-12 2017-07-12 一种迭代的实体对齐模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710565742.2A CN107480191B (zh) 2017-07-12 2017-07-12 一种迭代的实体对齐模型

Publications (2)

Publication Number Publication Date
CN107480191A true CN107480191A (zh) 2017-12-15
CN107480191B CN107480191B (zh) 2020-08-21

Family

ID=60595684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710565742.2A Active CN107480191B (zh) 2017-07-12 2017-07-12 一种迭代的实体对齐模型

Country Status (1)

Country Link
CN (1) CN107480191B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255002A (zh) * 2018-09-11 2019-01-22 浙江大学 一种利用关系路径挖掘解决知识图谱对齐任务的方法
CN109960810A (zh) * 2019-03-28 2019-07-02 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN109993381A (zh) * 2017-12-29 2019-07-09 中国移动通信集团湖北有限公司 基于知识图谱的需求管理应用方法、装置、设备及介质
CN110188206A (zh) * 2019-05-08 2019-08-30 北京邮电大学 基于翻译模型的协同迭代联合实体对齐方法及装置
CN110275966A (zh) * 2019-07-01 2019-09-24 科大讯飞(苏州)科技有限公司 一种知识抽取方法及装置
CN110413704A (zh) * 2019-06-27 2019-11-05 浙江大学 基于加权邻居信息编码的实体对齐方法
CN110516078A (zh) * 2019-08-27 2019-11-29 合肥工业大学 对齐方法及装置
CN110705301A (zh) * 2019-09-30 2020-01-17 京东城市(北京)数字科技有限公司 实体关系抽取方法及装置、存储介质、电子设备
CN110941722A (zh) * 2019-10-12 2020-03-31 中国人民解放军国防科技大学 一种基于实体对齐的知识图谱融合方法
CN111046186A (zh) * 2019-10-30 2020-04-21 平安科技(深圳)有限公司 知识图谱的实体对齐方法、装置、设备及存储介质
CN111143539A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111191471A (zh) * 2019-12-30 2020-05-22 北京航空航天大学 基于实体序列编码的知识图谱融合方法
CN111191462A (zh) * 2019-12-30 2020-05-22 北京航空航天大学 一种基于链路预测实现跨语言知识空间实体对齐方法及系统
CN111651972A (zh) * 2020-05-06 2020-09-11 腾讯科技(深圳)有限公司 实体对齐方法、装置、计算机可读介质及电子设备
CN112445916A (zh) * 2019-08-28 2021-03-05 阿里巴巴集团控股有限公司 业务对象发布方法、实体发布方法及装置
US20210103706A1 (en) * 2019-10-04 2021-04-08 Nec Laboratories America, Inc. Knowledge graph and alignment with uncertainty embedding
WO2021151303A1 (zh) * 2020-06-19 2021-08-05 平安科技(深圳)有限公司 命名实体对齐方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270458A1 (en) * 2007-04-24 2008-10-30 Gvelesiani Aleksandr L Systems and methods for displaying information about business related entities
CN104484459A (zh) * 2014-12-29 2015-04-01 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置
CN105630901A (zh) * 2015-12-21 2016-06-01 清华大学 一种知识图谱表示学习方法
CN106909622A (zh) * 2017-01-20 2017-06-30 中国科学院计算技术研究所 知识图谱向量表示方法、知识图谱关系推理方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080270458A1 (en) * 2007-04-24 2008-10-30 Gvelesiani Aleksandr L Systems and methods for displaying information about business related entities
CN104484459A (zh) * 2014-12-29 2015-04-01 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置
CN105630901A (zh) * 2015-12-21 2016-06-01 清华大学 一种知识图谱表示学习方法
CN106909622A (zh) * 2017-01-20 2017-06-30 中国科学院计算技术研究所 知识图谱向量表示方法、知识图谱关系推理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴运兵等: "基于多数据源的知识图谱构建方法研究", 《福州大学学报》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993381A (zh) * 2017-12-29 2019-07-09 中国移动通信集团湖北有限公司 基于知识图谱的需求管理应用方法、装置、设备及介质
CN109993381B (zh) * 2017-12-29 2021-11-30 中国移动通信集团湖北有限公司 基于知识图谱的需求管理应用方法、装置、设备及介质
CN109255002B (zh) * 2018-09-11 2021-08-27 浙江大学 一种利用关系路径挖掘解决知识图谱对齐任务的方法
CN109255002A (zh) * 2018-09-11 2019-01-22 浙江大学 一种利用关系路径挖掘解决知识图谱对齐任务的方法
CN109960810B (zh) * 2019-03-28 2020-05-19 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN109960810A (zh) * 2019-03-28 2019-07-02 科大讯飞(苏州)科技有限公司 一种实体对齐方法及装置
CN110188206A (zh) * 2019-05-08 2019-08-30 北京邮电大学 基于翻译模型的协同迭代联合实体对齐方法及装置
CN110413704A (zh) * 2019-06-27 2019-11-05 浙江大学 基于加权邻居信息编码的实体对齐方法
CN110413704B (zh) * 2019-06-27 2022-05-03 浙江大学 基于加权邻居信息编码的实体对齐方法
CN110275966A (zh) * 2019-07-01 2019-09-24 科大讯飞(苏州)科技有限公司 一种知识抽取方法及装置
CN110516078A (zh) * 2019-08-27 2019-11-29 合肥工业大学 对齐方法及装置
CN112445916A (zh) * 2019-08-28 2021-03-05 阿里巴巴集团控股有限公司 业务对象发布方法、实体发布方法及装置
CN110705301A (zh) * 2019-09-30 2020-01-17 京东城市(北京)数字科技有限公司 实体关系抽取方法及装置、存储介质、电子设备
CN110705301B (zh) * 2019-09-30 2021-01-26 北京京东智能城市大数据研究院 实体关系抽取方法及装置、存储介质、电子设备
US20210103706A1 (en) * 2019-10-04 2021-04-08 Nec Laboratories America, Inc. Knowledge graph and alignment with uncertainty embedding
CN110941722B (zh) * 2019-10-12 2022-07-01 中国人民解放军国防科技大学 一种基于实体对齐的知识图谱融合方法
CN110941722A (zh) * 2019-10-12 2020-03-31 中国人民解放军国防科技大学 一种基于实体对齐的知识图谱融合方法
CN111046186A (zh) * 2019-10-30 2020-04-21 平安科技(深圳)有限公司 知识图谱的实体对齐方法、装置、设备及存储介质
CN111191471A (zh) * 2019-12-30 2020-05-22 北京航空航天大学 基于实体序列编码的知识图谱融合方法
CN111191462B (zh) * 2019-12-30 2022-02-22 北京航空航天大学 一种基于链路预测实现跨语言知识空间实体对齐方法及系统
CN111191462A (zh) * 2019-12-30 2020-05-22 北京航空航天大学 一种基于链路预测实现跨语言知识空间实体对齐方法及系统
CN111191471B (zh) * 2019-12-30 2022-06-28 北京航空航天大学 基于实体序列编码的知识图谱融合方法
CN111143539A (zh) * 2019-12-31 2020-05-12 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111143539B (zh) * 2019-12-31 2023-06-23 重庆和贯科技有限公司 基于知识图谱的教学领域问答方法
CN111651972A (zh) * 2020-05-06 2020-09-11 腾讯科技(深圳)有限公司 实体对齐方法、装置、计算机可读介质及电子设备
CN111651972B (zh) * 2020-05-06 2022-06-17 腾讯科技(深圳)有限公司 实体对齐方法、装置、计算机可读介质及电子设备
WO2021151303A1 (zh) * 2020-06-19 2021-08-05 平安科技(深圳)有限公司 命名实体对齐方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN107480191B (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
CN107480191A (zh) 一种迭代的实体对齐模型
CN110543374B (zh) 使用人工智能机制进行集中式数据协调
CN111488582B (zh) 一种基于图神经网络的智能合约重入性漏洞检测的方法
Winkler Matching and record linkage
Gurau et al. Regular colored graphs of positive degree
CN108229578B (zh) 基于数据、信息和知识三层图谱架构的图像数据目标识别方法
CN110968701A (zh) 用于图神经网络的关系图谱建立方法以及装置、设备
CN110597870A (zh) 一种企业关系挖掘方法
CN107885760A (zh) 一种基于多种语义的知识图谱表示学习方法
CN114036307B (zh) 一种知识图谱实体对齐方法及装置
CN106164865A (zh) 用于数据复制的依赖性感知的事务批处理
CN113779264B (zh) 基于专利供需知识图谱的交易推荐方法
CN109614495A (zh) 一种结合知识图谱和文本信息的相关公司挖掘方法
Kumaraswamy et al. Transfer learning via relational type matching
CN105045863A (zh) 一种用于实体匹配的方法及系统
CN105654144A (zh) 一种基于机器学习的社交网络本体构建方法
CN117151659B (zh) 一种基于大语言模型的生态修复工程全生命周期追溯方法
CN105045933A (zh) 船舶装备维修保障信息关系数据库模式与本体间映射方法
CN114238524B (zh) 基于增强样本模型的卫星频轨数据信息抽取方法
CN113283243B (zh) 一种实体与关系联合抽取的方法
CN104915388A (zh) 一种基于谱聚类和众包技术的图书标签推荐方法
CN109885797A (zh) 一种基于多身份空间映射的关系网络构建方法
CN109977131A (zh) 一种房型匹配系统
CN103294791A (zh) 一种可扩展标记语言模式匹配方法
CN105718591B (zh) 一种基于规则和约束满足的定性空间关系推理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant