CN110457486A - 基于知识图谱的人物实体对齐方法及装置 - Google Patents

基于知识图谱的人物实体对齐方法及装置 Download PDF

Info

Publication number
CN110457486A
CN110457486A CN201910603719.7A CN201910603719A CN110457486A CN 110457486 A CN110457486 A CN 110457486A CN 201910603719 A CN201910603719 A CN 201910603719A CN 110457486 A CN110457486 A CN 110457486A
Authority
CN
China
Prior art keywords
attribute
data block
entity
similarity
knowledge mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910603719.7A
Other languages
English (en)
Inventor
尹美娟
刘晓楠
罗军勇
郑燕
王灿
李扬
秦栋洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information Engineering University of PLA Strategic Support Force
Original Assignee
Information Engineering University of PLA Strategic Support Force
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information Engineering University of PLA Strategic Support Force filed Critical Information Engineering University of PLA Strategic Support Force
Priority to CN201910603719.7A priority Critical patent/CN110457486A/zh
Publication of CN110457486A publication Critical patent/CN110457486A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于数据融合处理技术领域,特别涉及一种基于知识图谱的人物实体对齐方法及装置,该方法包含:将人物数据块中属性值链接到知识图谱实体;根据知识图谱实体关系衡量属性相关性,并获取属性标识度;依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。本发明针对当前实体对齐方法对不同名但相关的人物属性的相似度衡量不准确的问题,基于人物知识图谱,将人物属性值链接到知识图谱中的实体,从语义层面准确度量两个相关人物属性,有效优化人物实体对齐结果可信度与准确度;经过两个数据集实验对比分析,不仅准确率高,而且对数据集的适应性强,不受数据集类型以及属性值的分布影响,具有较好应用前景。

Description

基于知识图谱的人物实体对齐方法及装置
技术领域
本发明属于数据融合处理技术领域,特别涉及一种基于知识图谱的人物实体对齐方法及装置。
背景技术
实体对齐技术,又称为实体匹配或实体解析技术,目的在于判断不同来源的两个实体是否为同一实体,其本质是利用属性相似度进行实体对齐。人物实体对齐是实体对齐技术的一个特定应用。从现有研究成果来看,该技术还存在许多问题和挑战。例如,如何区分人物属性的标识度、如何进行人物属性相似度的度量等。实体对齐最初的策略是计算属性值相似性,后加入了属性的权重,但只考虑属性的取值范围,未考虑值的分布。随后出现基于聚类思想进行实体对齐的方法。聚类存在两个关键问题,一是实体间聚合策略的定义,二是聚类算法的选择。聚合策略可分为基于人工规则的聚合策略、基于相似度的聚合策略、基于双阈值的聚合策略。主要的聚类算法有划分式聚类算法、层次聚类算法和基于密度的聚类算法。目前,大多数全局实体对齐方法假设整个数据集上数据块是相互影响,尤其是在已经规整好的知识库上进行对齐时,通过不同匹配决策的相互影响从整体上推算数据块相似度。但是当数据集出现以下问题时效果不佳:概念不对称,即属性或属性值同义不同名,例如,“工作”和“职业”;属性标识度相差较大;数据块所含属性数量不对称。综上所述,现有人物实体对齐方法只关注同名属性、同义不同名属性之间的相似度,忽略了意义不同却相关的人物属性之间的相似度。在计算相似度时,也只考虑属性值字符串层面的相似度,忽略了语义层面的信息。
发明内容
为此,本发明提供一种基于知识图谱的人物实体对齐方法及装置,从人物属性数据出发,并结合分析属性之间的相关性与属性值的语义相似性,优化人物实体对齐结果的可信度与准确度,有助于在稀疏、异构的属性数据上进行实体对齐,具有较强的应用前景。
按照本发明所提供的设计方案,一种基于知识图谱的人物实体对齐方法,包含如下内容:
A)将人物数据块中属性值链接到知识图谱实体;
B)根据知识图谱实体关系衡量属性相关性,并获取属性标识度;
C)依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。
上述的,A)中,利用知识图谱属性值低维向量表示知识图谱实体,具体为:经过实体链接得到涵盖属性值的知识图谱子图,将子图上每个实体以及实体关系映射到用于表示知识图谱实体间关系信息的低维空间向量上,属性值的表示向量为在知识图谱中对应实体表示向量。
上述的,A)将人物数据块中属性值链接到知识图谱实体,包含:
A1)将各数据来源中的属性值链接到知识图谱上,依据属性值在知识图谱中的对应节点、与其邻近节点以及节点间关系,获取知识图谱子图;
A2)将实体与实体关系分别映射到不同空间向量表示上,得到知识图谱子图的向量表示。
上述的,B)中,利用信息熵衡量属性值分布,基于信息熵计算每个属性的标识度。
上述的,B)中基于信息熵计算每个属性的标识度时,通过属性信息熵与整个数据集上最大信息熵比值来获取。
上述的,B)中基于信息熵计算每个属性的标识度时,依据数据量大小,判断属性值是否相同来进行分区操作,并依据分区结果来计算同一个分区中数据块之间的相似度。
上述的,C)中依据属性相关性进行数据块剪枝;将剪枝后的数据块,综合数据块属性标识度,利用属性值表示向量进行相似度计算。
上述的,C)中获取人物数据块之间的相似度,包含如下内容:
C1)保留数据块中存在属性相关性的属性值对,舍弃其他无关性属性,对数据块进行剪枝操作;
C2)利用属性标识度作为权值,对经过剪枝后的数据块属性值的表示向量进行加权求和,每个数据块得到一个表示向量;
C3)利用余弦相似度计算数据块向量的相似度。
优选的,若两个数据块之间的相似度大于设定阈值,则判定该两个数据块描述同一个人物实体。
更进一步地,本发明还提供一种基于知识图谱的人物实体对齐装置,包含:处理模块一、处理模块二和处理模块三,其中,
处理模块一,用于将人物数据块中属性值链接到知识图谱实体;
处理模块二,用于根据知识图谱实体关系衡量属性相关性,并获取属性标识度;
处理模块三,用于依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。
本发明的有益效果:
本发明针对当前实体对齐方法对不同名但相关的人物属性的相似度衡量不准确的问题,基于人物知识图谱,将人物属性值链接到知识图谱中的实体,进而从语义层面准确度量两个相关的人物属性,从而有效优化了人物实体对齐结果的可信度与准确度。并经过在两个数据集上的实验对比分析可知,不仅准确率高,而且对数据集的适应性强,不受数据集类型以及属性值的分布影响。
附图说明:
图1为实施例中实体对齐方法流程图;
图2为实施例中人物实体对齐原理示意;
图3为实施例中实体链接示意;
图4为实施例中属性值低维向量表示示意;
图5为实施例中实体对齐装置示意。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
针对当前实体对齐方法对不同名但相关的人物属性的相似度衡量不准确的问题,本发明实施例中,参见图1和2所示,提供一种基于知识图谱的人物实体对齐方法,包含如下内容:
S101)将人物数据块中属性值链接到知识图谱实体;
S102)根据知识图谱实体关系衡量属性相关性,并获取属性标识度;
S103)依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。
基于人物知识图谱,将人物属性值链接到知识图谱中的实体,进而从语义层面准确度量两个相关的人物属性,从而有效优化了人物实体对齐结果的可信度与准确度。
进一步地,本发明实施例中,利用知识图谱属性值低维向量表示知识图谱实体,具体为:经过实体链接得到涵盖属性值的知识图谱子图,将子图上每个实体以及实体关系映射到用于表示知识图谱实体间关系信息的低维空间向量上,属性值的表示向量为在知识图谱中对应实体表示向量。
进一步地,本发明实施例中,将人物数据块中属性值链接到知识图谱实体,包含:将各数据来源中的属性值链接到知识图谱上,依据属性值在知识图谱中的对应节点、与其邻近节点以及节点间关系,获取知识图谱子图;将实体与实体关系分别映射到不同空间向量表示上,得到知识图谱子图的向量表示。
将各数据来源中的属性值链接到知识图谱上。由于进行人物实体对齐时往往只在一定的人物范围下进行,因此只需要对涵盖目标人物实体的知识图谱子图进行向量表示。在进行实体链接时,将属性值在知识图谱中的对应节点、与其邻近的节点以及它们之间的关系保留下来,得到知识图谱的子图。实体链接过程见图3所示。将实体与实体关系分别映射到不同的向量表示空间,得到知识图谱子图的向量表示。属性值的低维向量表示见图4所示。
进一步地,本发明实施例中,利用信息熵衡量属性值分布,基于信息熵计算每个属性的标识度。公式可表示如下:
其中,p(vi)为每一种属性值的出现概率,可用数据集中的出现频率代替,与属性值出现次数所代表的涵义相同,也可反映属性值的分布情况。
进一步地,本发明实施例中,基于信息熵计算每个属性的标识度时,通过属性信息熵与整个数据集上最大信息熵比值来获取。公式中只给出属性标识度与信息熵的比例关系,在具体计算时可采用该属性的信息熵与整个数据集上最大信息熵的比值。
进一步地,本发明实施例中,基于信息熵计算每个属性的标识度时,依据数据量大小,判断属性值是否相同来进行分区操作,并依据分区结果来计算同一个分区中数据块之间的相似度。如果数据量很庞大,通过分区操作,降低数据计算量和复杂度:只要出现一个相同属性值就可以将其划分在同一分区中,数据块之间的相似度计算只在同一分区中进行。
进一步地,本发明实施例中,依据属性相关性进行数据块剪枝;将剪枝后的数据块,综合数据块属性标识度,利用属性值表示向量进行相似度计算。
进一步地,本发明实施例中,获取人物数据块之间的相似度,包含如下内容:保留数据块中存在属性相关性的属性值对,舍弃其他无关性属性,对数据块进行剪枝操作;利用属性标识度作为权值,对经过剪枝后的数据块属性值的表示向量进行加权求和,每个数据块得到一个表示向量;利用余弦相似度计算数据块向量的相似度。优选的,若两个数据块之间的相似度大于设定阈值,则判定该两个数据块描述同一个人物实体。
对经过剪枝后的数据块中属性值的表示向量进行加权求和,属性标识度作为权值每一个数据块得到一个表示向量,计算公式如下。
数据块相似度的计算。利用余弦相似度计算两个数据块向量的相似度,公式如下。
如果两个数据块的相似度大于某一阈值,就认为这两个数据块描述的是同一人物实体。
更进一步地,本发明实施例还提供一种基于知识图谱的人物实体对齐装置,参见图5所示,包含:处理模块一101、处理模块二102和处理模块三103,其中,
处理模块一101,用于将人物数据块中属性值链接到知识图谱实体;
处理模块二102,用于根据知识图谱实体关系衡量属性相关性,并获取属性标识度;
处理模块三103,用于依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。
为验证本发明实施例中技术方案的有效性,下面结合数据样本对本发明做进一步解释说明:
以互动百科、搜狗百科以及新闻网页等数据源中抽取得到的人物属性数据为实验样本,知识图谱采用百度提供的知识图谱API。从百科爬取的人物数据,包含200个互动百科特定人物实例,26种人物属性数据;200个搜狗百科特定人物实例,24种人物属性数据。从新京报、新浪新闻、凤凰网等可靠度较高的新闻媒体,有针对性地爬取了关于一些特定人物的新闻页面,经过实体标注与属性抽取,得到1000个人物数据块,并且人工标注了100个人物实体的数据块。从百科和新闻页面中抽取出的人物数据的特点不同,可以验证本发明方法的适用性。从一个百科人物页面中抽取出的人物信息是规整好的、关于同一人物的属性,且具有比较丰富的属性类型;而从新闻页面中抽取出的人物属性,比较稀疏。与百科中的人物数据相比,新闻页面抽取的人物数据,更具有一般性、真实性与高时效性。
用本发明基于知识图谱的人物实体对齐方法EAKD方法和两个对比算法ARIA和PARIS算法,分别在百科人物数据和网页人物数据上,进行了实体对齐实验,实验结果分别见表1和表2。
结合实验数据来观察实验结果,可以发现本发明中所使用的人物实体对齐方法不仅能够有效地进行实体对齐,而且对数据集的适应性也较强。
Method Precision Recall F1-score
EAKD 0.972 0.971 0.971
ARIA 0.975 0.977 0.976
PARIS 0.862 0.935 0.897
表1百科数据集上的人物实体对齐结果
Method Precision Recall F1-score
EAKD 0.89 0.87 0.88
ARIA 0.62 0.61 0.61
PARIS 0.63 0.65 0.64
表2新闻网页数据集上的人物实体对齐结果
本发明实施例中,将人物数据块中的属性值链接到知识图谱中对应实体上,根据知识图谱中的对应实体关系衡量属性相关性,再根据属性值的分布计算属性标识度,最后综合这些因素判断数据块是否指向同一人物实体。经过在两个数据集上的实验对比分析可知,不仅准确率高,而且对数据集的适应性强,不受数据集类型以及属性值的分布影响。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。基于上述的方法,本发明实施例还提供一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的方法。基于上述的方法,本发明实施例还提供一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现上述的方法。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种基于知识图谱的人物实体对齐方法,其特征在于,
A)将人物数据块中属性值链接到知识图谱实体;
B)根据知识图谱实体关系衡量属性相关性,并获取属性标识度;
C)依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。
2.根据权利要求1所述的基于知识图谱的人物实体对齐方法,其特征在于,A)中,利用知识图谱属性值低维向量表示知识图谱实体,具体为:经过实体链接得到涵盖属性值的知识图谱子图,将子图上每个实体以及实体关系映射到用于表示知识图谱实体间关系信息的低维空间向量上,属性值的表示向量为在知识图谱中对应实体表示向量。
3.根据权利要求1或2所述的基于知识图谱的人物实体对齐方法,其特征在于,A)将人物数据块中属性值链接到知识图谱实体,包含:
A1)将各数据来源中的属性值链接到知识图谱上,依据属性值在知识图谱中的对应节点、与其邻近节点以及节点间关系,获取知识图谱子图;
A2)将实体与实体关系分别映射到不同空间向量表示上,得到知识图谱子图的向量表示。
4.根据权利要求1所述的基于知识图谱的人物实体对齐方法,其特征在于,B)中,利用信息熵衡量属性值分布,基于信息熵计算每个属性的标识度。
5.根据权利要求1或4所述的基于知识图谱的人物实体对齐方法,其特征在于,B)中基于信息熵计算每个属性的标识度时,通过属性信息熵与整个数据集上最大信息熵比值来获取。
6.根据权利要求1或4所述的基于知识图谱的人物实体对齐方法,其特征在于,B)中基于信息熵计算每个属性的标识度时,依据数据量大小,判断属性值是否相同来进行分区操作,并依据分区结果来计算同一个分区中数据块之间的相似度。
7.根据权利要求1所述的基于知识图谱的人物实体对齐方法,其特征在于,C)中依据属性相关性进行数据块剪枝;将剪枝后的数据块,综合数据块属性标识度,利用属性值表示向量进行相似度计算。
8.根据权利要求1所述的基于知识图谱的人物实体对齐方法,其特征在于,C)中获取人物数据块之间的相似度,包含如下内容:
C1)保留数据块中存在属性相关性的属性值对,舍弃其他无关性属性,对数据块进行剪枝操作;
C2)利用属性标识度作为权值,对经过剪枝后的数据块属性值的表示向量进行加权求和,每个数据块得到一个表示向量;
C3)利用余弦相似度计算数据块向量的相似度。
9.根据权利要求1或7或8所述的基于知识图谱的人物实体对齐方法,其特征在于,若两个数据块之间的相似度大于设定阈值,则判定该两个数据块描述同一个人物实体。
10.一种基于知识图谱的人物实体对齐装置,其特征在于,包含:处理模块一、处理模块二和处理模块三,其中,
处理模块一,用于将人物数据块中属性值链接到知识图谱实体;
处理模块二,用于根据知识图谱实体关系衡量属性相关性,并获取属性标识度;
处理模块三,用于依据属性相关性和属性标识度,得到人物数据块之间的相似度,依据相似度进行人物实体对齐。
CN201910603719.7A 2019-07-05 2019-07-05 基于知识图谱的人物实体对齐方法及装置 Pending CN110457486A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910603719.7A CN110457486A (zh) 2019-07-05 2019-07-05 基于知识图谱的人物实体对齐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910603719.7A CN110457486A (zh) 2019-07-05 2019-07-05 基于知识图谱的人物实体对齐方法及装置

Publications (1)

Publication Number Publication Date
CN110457486A true CN110457486A (zh) 2019-11-15

Family

ID=68482170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910603719.7A Pending CN110457486A (zh) 2019-07-05 2019-07-05 基于知识图谱的人物实体对齐方法及装置

Country Status (1)

Country Link
CN (1) CN110457486A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111125376A (zh) * 2019-12-23 2020-05-08 秒针信息技术有限公司 知识图谱生成方法、装置、数据处理设备及存储介质
CN111159328A (zh) * 2019-11-20 2020-05-15 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 情报知识融合系统及方法
CN111428503A (zh) * 2020-03-11 2020-07-17 合肥工业大学 同名人物的识别处理方法及处理装置
CN111475657A (zh) * 2020-03-30 2020-07-31 海信集团有限公司 一种显示设备、显示系统及实体对齐方法
CN111708895A (zh) * 2020-05-28 2020-09-25 北京赛博云睿智能科技有限公司 一种知识图谱系统的构建方法及装置
CN111814027A (zh) * 2020-08-26 2020-10-23 电子科技大学 基于搜索引擎的多源人物属性融合方法
CN111858732A (zh) * 2020-07-14 2020-10-30 北京北大软件工程股份有限公司 数据融合方法及终端
CN112015792A (zh) * 2019-12-11 2020-12-01 天津泰凡科技有限公司 一种物料重码分析方法、装置及计算机存储介质
CN112116965A (zh) * 2020-07-20 2020-12-22 上海大学 基于embedding属性相似度的材料工艺流程匹配方法
CN112199957A (zh) * 2020-11-03 2021-01-08 中国人民解放军战略支援部队信息工程大学 基于属性和关系信息联合嵌入的人物实体对齐方法及系统
CN112270179A (zh) * 2020-10-15 2021-01-26 和美(深圳)信息技术股份有限公司 一种实体识别方法、装置及电子设备
CN112765362A (zh) * 2021-01-12 2021-05-07 中国人民解放军国防科技大学 基于改进自编码器的知识图谱实体对齐方法及相关设备
CN113297213A (zh) * 2021-04-29 2021-08-24 军事科学院系统工程研究院网络信息研究所 一种实体对象的动态多属性匹配方法
CN114415975A (zh) * 2022-03-28 2022-04-29 支付宝(杭州)信息技术有限公司 针对知识图谱进行划分分区的方法及装置
CN117573803A (zh) * 2023-11-14 2024-02-20 安徽省征信股份有限公司 基于知识图谱的新客识别方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035917A (zh) * 2014-06-10 2014-09-10 复旦大学 一种基于语义空间映射的知识图谱管理方法和系统
CN107133257A (zh) * 2017-03-21 2017-09-05 华南师范大学 一种基于中心连通子图的相似实体识别方法及系统
CN107704480A (zh) * 2016-08-08 2018-02-16 百度(美国)有限责任公司 扩展和强化知识图的方法和系统以及计算机介质
CN108389614A (zh) * 2018-03-02 2018-08-10 西安交通大学 基于图像分割与卷积神经网络构建医学影像图谱的方法
CN108846029A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 基于知识图谱的情报关联分析方法
US10157226B1 (en) * 2018-01-16 2018-12-18 Accenture Global Solutions Limited Predicting links in knowledge graphs using ontological knowledge

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104035917A (zh) * 2014-06-10 2014-09-10 复旦大学 一种基于语义空间映射的知识图谱管理方法和系统
CN107704480A (zh) * 2016-08-08 2018-02-16 百度(美国)有限责任公司 扩展和强化知识图的方法和系统以及计算机介质
CN107133257A (zh) * 2017-03-21 2017-09-05 华南师范大学 一种基于中心连通子图的相似实体识别方法及系统
US10157226B1 (en) * 2018-01-16 2018-12-18 Accenture Global Solutions Limited Predicting links in knowledge graphs using ontological knowledge
CN108389614A (zh) * 2018-03-02 2018-08-10 西安交通大学 基于图像分割与卷积神经网络构建医学影像图谱的方法
CN108846029A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 基于知识图谱的情报关联分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
庄严 等: ""知识库实体对齐技术综述"", 《计算机研究与发展》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159328A (zh) * 2019-11-20 2020-05-15 华东计算技术研究所(中国电子科技集团公司第三十二研究所) 情报知识融合系统及方法
CN112015792A (zh) * 2019-12-11 2020-12-01 天津泰凡科技有限公司 一种物料重码分析方法、装置及计算机存储介质
CN112015792B (zh) * 2019-12-11 2023-12-01 天津泰凡科技有限公司 一种物料重码分析方法、装置及计算机存储介质
CN111125376A (zh) * 2019-12-23 2020-05-08 秒针信息技术有限公司 知识图谱生成方法、装置、数据处理设备及存储介质
CN111125376B (zh) * 2019-12-23 2023-08-29 秒针信息技术有限公司 知识图谱生成方法、装置、数据处理设备及存储介质
CN111428503A (zh) * 2020-03-11 2020-07-17 合肥工业大学 同名人物的识别处理方法及处理装置
CN111428503B (zh) * 2020-03-11 2024-05-03 合肥工业大学 同名人物的识别处理方法及处理装置
CN111475657B (zh) * 2020-03-30 2023-10-03 海信集团有限公司 一种显示设备、显示系统及实体对齐方法
CN111475657A (zh) * 2020-03-30 2020-07-31 海信集团有限公司 一种显示设备、显示系统及实体对齐方法
CN111708895B (zh) * 2020-05-28 2023-06-20 北京赛博云睿智能科技有限公司 一种知识图谱系统的构建方法及装置
CN111708895A (zh) * 2020-05-28 2020-09-25 北京赛博云睿智能科技有限公司 一种知识图谱系统的构建方法及装置
CN111858732B (zh) * 2020-07-14 2024-04-05 北京北大软件工程股份有限公司 数据融合方法及终端
CN111858732A (zh) * 2020-07-14 2020-10-30 北京北大软件工程股份有限公司 数据融合方法及终端
CN112116965A (zh) * 2020-07-20 2020-12-22 上海大学 基于embedding属性相似度的材料工艺流程匹配方法
CN112116965B (zh) * 2020-07-20 2022-06-14 上海大学 基于embedding属性相似度的材料工艺流程匹配方法
CN111814027A (zh) * 2020-08-26 2020-10-23 电子科技大学 基于搜索引擎的多源人物属性融合方法
CN111814027B (zh) * 2020-08-26 2023-03-21 电子科技大学 基于搜索引擎的多源人物属性融合方法
CN112270179B (zh) * 2020-10-15 2021-11-09 和美(深圳)信息技术股份有限公司 一种实体识别方法、装置及电子设备
CN112270179A (zh) * 2020-10-15 2021-01-26 和美(深圳)信息技术股份有限公司 一种实体识别方法、装置及电子设备
CN112199957B (zh) * 2020-11-03 2023-12-08 中国人民解放军战略支援部队信息工程大学 基于属性和关系信息联合嵌入的人物实体对齐方法及系统
CN112199957A (zh) * 2020-11-03 2021-01-08 中国人民解放军战略支援部队信息工程大学 基于属性和关系信息联合嵌入的人物实体对齐方法及系统
CN112765362B (zh) * 2021-01-12 2023-06-13 中国人民解放军国防科技大学 基于改进自编码器的知识图谱实体对齐方法及相关设备
CN112765362A (zh) * 2021-01-12 2021-05-07 中国人民解放军国防科技大学 基于改进自编码器的知识图谱实体对齐方法及相关设备
CN113297213B (zh) * 2021-04-29 2023-09-12 军事科学院系统工程研究院网络信息研究所 一种实体对象的动态多属性匹配方法
CN113297213A (zh) * 2021-04-29 2021-08-24 军事科学院系统工程研究院网络信息研究所 一种实体对象的动态多属性匹配方法
CN114415975A (zh) * 2022-03-28 2022-04-29 支付宝(杭州)信息技术有限公司 针对知识图谱进行划分分区的方法及装置
CN117573803A (zh) * 2023-11-14 2024-02-20 安徽省征信股份有限公司 基于知识图谱的新客识别方法和装置
CN117573803B (zh) * 2023-11-14 2024-04-19 安徽省征信股份有限公司 基于知识图谱的新客识别方法和装置

Similar Documents

Publication Publication Date Title
CN110457486A (zh) 基于知识图谱的人物实体对齐方法及装置
WO2021169301A1 (zh) 一种选取样本图像的方法、装置、存储介质和服务器
US10281284B2 (en) Hybrid road network and grid based spatial-temporal indexing under missing road links
CN107341220B (zh) 一种多源数据融合方法和装置
CN110162695A (zh) 一种信息推送的方法及设备
CN105893406A (zh) 群体用户画像方法及系统
TW202029079A (zh) 異常群體識別方法及裝置
CN108959305A (zh) 一种基于互联网大数据的事件抽取方法及系统
CN105893585B (zh) 一种结合标签数据的二部图模型学术论文推荐方法
CN103324666A (zh) 一种基于微博数据的话题跟踪方法及装置
BR112012011091B1 (pt) método e aparelho para extração e avaliação de qualidade de palavra
CN109408641A (zh) 一种基于有监督主题模型的文本分类方法及系统
CN105373546B (zh) 一种用于知识服务的信息处理方法及系统
CN109255012A (zh) 一种机器阅读理解的实现方法以及装置
CN110751027A (zh) 一种基于深度多示例学习的行人重识别方法
CN111144109B (zh) 文本相似度确定方法和装置
CN109308311A (zh) 一种多源异构数据融合系统
Shum et al. Large-scale community detection on speaker content graphs
Bi et al. MM-GNN: Mix-moment graph neural network towards modeling neighborhood feature distribution
CN103218419B (zh) 网络标签聚类方法和系统
Ozdikis et al. Spatial statistics of term co-occurrences for location prediction of tweets
CN105787004A (zh) 一种文本分类方法及装置
Kaiser et al. Multiple hypotheses at multiple scales for audio novelty computation within music
CN113033194A (zh) 语义表示图模型的训练方法、装置、设备和存储介质
Tong et al. Efficient probabilistic supergraph search over large uncertain graphs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination