CN112765287A - 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质 - Google Patents

基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质 Download PDF

Info

Publication number
CN112765287A
CN112765287A CN202110159206.9A CN202110159206A CN112765287A CN 112765287 A CN112765287 A CN 112765287A CN 202110159206 A CN202110159206 A CN 202110159206A CN 112765287 A CN112765287 A CN 112765287A
Authority
CN
China
Prior art keywords
embedding
entity
relation
original
interactive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110159206.9A
Other languages
English (en)
Other versions
CN112765287B (zh
Inventor
陈恺
李爱平
贾焰
周斌
王晔
涂宏魁
喻承
宋怡晨
赵晓娟
尚颖丹
李晨晨
马锶霞
王昌海
汪天翔
刘子牛
林昌建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National University of Defense Technology
Original Assignee
National University of Defense Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University of Defense Technology filed Critical National University of Defense Technology
Priority to CN202110159206.9A priority Critical patent/CN112765287B/zh
Publication of CN112765287A publication Critical patent/CN112765287A/zh
Application granted granted Critical
Publication of CN112765287B publication Critical patent/CN112765287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质,可以更好地表达语义空间中的实体空间和关系空间之间的相互关系,从而更准确的挖掘人物之间隐藏的相互关系和可疑关系,包括步骤:从具有人物关系的知识图谱中提取原始实体、原始关系,将原始关系嵌入、原始实体嵌入进行交互嵌入,得到交互单元;构建并训练预测模型,所述预测模型包括前馈神经网络层和卷积神经网络层以及评分层,将交互单元进行嵌入表示后,分别输入前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,将预测的实体嵌入输入评分层,获得评分层预测的实体嵌入的得分;将得分最高的预测的实体嵌入的得分,作为挖掘的得到的人物关系输出。

Description

基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质
技术领域
本发明涉及知识图谱领域,具体涉及基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质。
背景技术
在发现和预防犯罪方面,知识图谱正发挥着重要作用。知识图谱包含海量的现有事实,每一个事实都形成一个三元组(h,r,t),包括头实体h、尾实体t和关系r。尽管已经在知识图谱中发现了大量的事实,但它们仍然不够完整,并且局限于我们的认知。为了解决这个问题,知识图补全的任务是预测一个推测的事实,即预测三元组中推测的某个元素,借此技术能够在现有事实的基础上进一步扩展知识图谱,从而可用来揭示人物之间隐藏的相互关系和可疑关系,发现和预防更多的欺诈犯罪。
大多数现有的知识图谱嵌入和补全的方法,不能够反映实体和关系之间的相互关系和相互作用。实际上,目前已有的研究甚至很少关注关系嵌入,而只侧重于实体嵌入的表示学习。由于缺乏充分的关系嵌入学习,这些知识图谱嵌入方法很难在关系空间中提取语义特征。他们也不能利用交互将完整的语义信息整合成一个三元组。
发明内容
针对上述问题,本发明提供了基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质,可以更好地表达语义空间中的实体空间和关系空间之间的相互关系,从而更准确的挖掘人物之间隐藏的相互关系和可疑关系,可以发现和预防更多的欺诈犯罪。
其技术方案是这样的:基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,包括以下步骤:
步骤S1:从具有人物关系的知识图谱中提取原始实体、原始关系,将原始实体、原始关系进行嵌入表示;
步骤S2:将原始关系嵌入、原始实体嵌入进行交互嵌入,得到交互单元;
步骤S3:构建并训练预测模型,所述预测模型包括前馈神经网络层和卷积神经网络层以及评分层,将交互单元进行嵌入表示后,分别输入前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,将预测的实体嵌入输入评分层,获得评分层预测的实体嵌入的得分;
步骤S4:将得分最高的预测的实体嵌入的得分,作为挖掘的得到的人物关系输出。
进一步的,还包括步骤S5:通过挖掘得到的人物关系,更新知识图谱。
进一步的,在步骤S1中,还包括以下步骤:从互联网爬取人物数据,构建人物关系的知识图谱,所述人物关系的知识图谱包含头实体、关系、尾实体的三元组;
进一步的,步骤S2具体包括以下步骤:
步骤S21:基于平移距离模型,将原始关系嵌入从关系空间投影到实体空间,与原始实体嵌入相加,得到实体交互嵌入;
步骤S22:将原始实体、原始关系和实体交互嵌入进行双线性投影,得到关系交互嵌入;
步骤S23:合并原始实体嵌入、原始关系嵌入、实体交互嵌入和关系交互嵌入,得到交互单元。
进一步的,步骤S21具体包括以下步骤:
步骤S211:定义转换矩阵,使用所述转换矩阵与原始关系嵌入相乘,将原始关系嵌入的信息从关系空间投影到实体空间;
步骤S212:将步骤S211得到的结果,与初始实体嵌入相加,得到实体交互嵌入。
进一步的,步骤S22具体包括以下步骤:
步骤S221:将原始实体嵌入与原始关系嵌入,于向量的每一个维度进行哈达玛积操作,得到初级关系交互嵌入;
步骤S222:步骤S221得到的初级关系交互嵌入与步骤S21得到的实体交互嵌入之间,在向量的每一个维度进行哈达玛积操作,得到关系交互嵌入。
进一步的,步骤S23具体包括以下步骤:
将原始实体嵌入、原始关系嵌入、步骤S21得到的实体交互嵌入、步骤S22得到的关系交互嵌入,在矩阵的第2个维度上做矩阵的连接操作,得到交互单元。
进一步的,在步骤S3中,在训练预测模型时,构建训练集,所述训练集包括有标签的实体嵌入,通过标签能够索引得到对应的真实需预测的实体嵌入,采用有监督的学习方式,将训练集中数据对应的交互单元进行嵌入表示,然后输入预测模型的前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,再将预测的实体嵌入与真实需预测的实体嵌入做点积,得到相似度得分,使用softmax函数将相似度得分进行归一化,使用交叉熵计算损失函数,更新预测模型;
在前馈神经网络层中,使用relu做为激活函数,输入的交互单元嵌入被映射到高维空间,得到特征向量,定义转换矩阵,将得到特征向量与转换矩阵相乘,然后使用relu激活函数处理,得到预测的实体嵌入;
在卷积神经网络层中,输入的交互单元嵌入经过卷积神经网络,得到特征向量,定义转换矩阵,将得到特征向量与转换矩阵相乘,然后使用relu激活函数处理,得到预测的实体嵌入;
在评分层中,采用sigmoid函数对预测得到的实体嵌入进行处理,得到预测的实体嵌入的得分。
一种计算机装置,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如上述的基于知识图谱嵌入的挖掘人物关系的方法。
一种计算机可读存储介质,其上存储有程序,其特征在于:程序被处理器执行时实现如上述的基于知识图谱嵌入的挖掘人物关系的方法。
与现有技术相比本发明具有以下有益效果:
本发明基于知识图谱中挖掘人物关系,针对知识图谱中原有的人物关系不完整的问题,在对知识图谱嵌入进行表示学习时,充分考虑实体与关系在语义空间的交互,通过平移距离模型和双线性投影,引入实体交互嵌入和关系交互嵌入,从关系中提取信息来更新实体嵌入,并利用实体信息来更新关系嵌入,最大程度保留实体和关系的固有信息和交互信息,高效地表达语义空间中的实体空间和关系空间之间的相互关系,通过新提出的实体-关系交互机制,从而可以更好的预测知识图谱中的实体,更准确获得的人物之间的关系,从而挖掘出人物之间隐藏的相互关系和可疑关系,可以发现和预防更多的欺诈犯罪,另外,通过这些人物关系,还可以高效地实现知识图谱补全任务,丰富和拓展了现有的人物关系知识图谱。
附图说明
图1为本发明的一个实施例的基于知识图谱嵌入的挖掘人物关系的方法主要流程示意图;
图2为本发明的另一个实施例的基于知识图谱嵌入的挖掘人物关系的方法主要流程示意图;
图3为本发明的实体与关系交互嵌入的示意图。
图4为一个实施例中计算机装置的内部结构图。
具体实施方式
见图1,本发明的基于知识图谱嵌入的挖掘人物关系的方法,至少包括以下步骤:
步骤S1:从具有人物关系的知识图谱中提取原始实体、原始关系,将原始实体、原始关系进行嵌入表示;
步骤S2:将原始关系嵌入、原始实体嵌入进行交互嵌入,得到交互单元;
步骤S3:构建并训练预测模型,预测模型包括前馈神经网络层和卷积神经网络层以及评分层,将交互单元分别输入前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,将预测的实体嵌入输入评分层,获得评分层预测的实体嵌入的得分;
步骤S4:将得分最高的预测的实体嵌入的得分,作为挖掘的得到的人物关系输出。
在本实施例中,步骤S1和步骤S2通过平移距离模型和双线性投影,得到实体和关系的交互嵌入,结合初始嵌入进而获得交互单元,最大程度保留实体和关系的固有信息和交互信息,步骤S3使用卷积神经网络和前馈神经网络,可充分利用神经网络和深度学习的优势来提取特征,进行预测。
具体的在本发明的一个实施例中,本发明的基于知识图谱嵌入的挖掘人物关系的方法,包括以下步骤:
步骤S1:从互联网爬取人物数据,构建人物关系的知识图谱,人物关系的知识图谱包含头实体、关系、尾实体的三元组;从具有人物关系的知识图谱中提取原始实体、原始关系,将原始实体、原始关系进行嵌入表示。
在本实施例中,人物关系的知识图谱是重新构建的,具体通过如下方式构建:利用数据爬取工具,搜集互联网相关数据;利用斯坦福自然语言处理工具Stanford-NLP进行命名实体识别和关系抽取;利用得到的实体和关系,构建人物关系的知识图谱。
此外,在本发明的其他实施例中,也可以直接基于现有的人物关系的知识图谱进行处理,从中获取原始实体、原始关系。
步骤S2具体包括以下步骤:
步骤S21:基于平移距离模型,将原始关系嵌入从关系空间投影到实体空间,与原始实体嵌入相加,得到实体交互嵌入;
具体的,步骤S21包括以下步骤:
步骤S211:定义转换矩阵,使用转换矩阵与原始关系嵌入相乘,将原始关系嵌入的信息从关系空间投影到实体空间;
步骤S212:将步骤S211得到的结果,与初始实体嵌入相加,得到实体交互嵌入。
步骤S22:将原始实体、原始关系和实体交互嵌入进行双线性投影,得到关系交互嵌入;
具体的,步骤S22具体包括以下步骤:
步骤S221:将原始实体嵌入与原始关系嵌入,于向量的每一个维度进行哈达玛积操作,得到初级关系交互嵌入;
步骤S222:步骤S221得到的初级关系交互嵌入与步骤S212得到的实体交互嵌入之间,在向量的每一个维度进行哈达玛积操作,得到关系交互嵌入。
步骤S23:将原始实体嵌入、原始关系嵌入、步骤S21得到的实体交互嵌入、步骤S22得到的关系交互嵌入,在矩阵的第2个维度上做矩阵的连接操作,得到交互单元。
在步骤S3中,构建并训练预测模型,预测模型包括前馈神经网络层和卷积神经网络层以及评分层,前馈神经网络层和卷积神经网络层并列设置,前馈神经网络层和卷积神经网络层的输出输入到评分层中,将交互单元进行嵌入表示后,分别输入前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,将预测的实体嵌入输入评分层,获得评分层预测的前馈神经网络层和卷积神经网络层输出的实体嵌入的得分;
具体的,在前馈神经网络层中,使用relu做为激活函数,输入的交互单元嵌入被映射到高维空间,得到特征向量,定义转换矩阵,将得到特征向量与转换矩阵相乘,然后使用relu激活函数处理,得到预测的实体嵌入;
在卷积神经网络中,输入的交互单元嵌入经过卷积神经网络,得到特征向量,定义转换矩阵,将得到特征向量与转换矩阵相乘,然后使用relu激活函数处理,得到预测的实体嵌入;
在评分层中,采用sigmoid函数对预测得到的实体嵌入进行处理,得到预测的实体嵌入的得分。
在训练预测模型时,构建训练集,训练集包括有标签的实体嵌入,通过标签能够索引得到对应的真实需预测的实体嵌入,采用有监督的学习方式,将训练集中数据经过步骤S1、S2得到的对应的交互单元进行嵌入表示,然后输入预测模型的前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,再将预测的实体嵌入与真实需预测的实体嵌入做点积,得到相似度得分,使用softmax函数将相似度得分进行归一化,使用交叉熵计算损失函数,更新预测模型,当模型的损失函数值趋于稳定不再变化时表示模型趋于稳定,训练停止;
当预测模型训练完毕后,可以通过训练好的预测模型,对于需要进行预测的实体进行预测。
最后的,通过步骤S4:将得分最高的预测的实体嵌入的得分,作为挖掘的得到的人物关系输出。
本实施例在得到实体交互嵌入和关系交互嵌入的过程中,分别使用了平移距离模型和双线性投影,针对实体空间和关系空间的语义交互来进行实现,增强了系统和模型的可解释性;同时,通过卷积神经网络和前馈神经网络来进一步提取特征,大量可训练的参数在神经网络中通过梯度传递进行自我学习,反映实体和关系的空间特征,以及它们在训练过程中的相互作用;通过本实施例步骤S1至S4的具体方案,可以挖掘出人物之间隐藏的相互关系和可疑关系,能够用于发现和预防更多的欺诈犯罪。
见图2,在本发明的另一个实施例中,除了上述步骤S1至步骤S4以外,还包括步骤S5:通过挖掘得到的人物关系,更新知识图谱中的实体、关系,从而得到更加完整的人物关系知识谱图,通过得到的人物关系,还可以高效地实现知识图谱补全任务,丰富和拓展了现有的人物关系知识图谱。
对于一些现有的由人工或者半自动得到的不完整知识图谱,特别是稀疏,或者很多关系并没有被挖掘的隐含关系,采用本实施例中的方法,可以让这些隐含关系的得以揭示,能够让知识图谱更加的完整。
本发明基于知识图谱中挖掘人物关系,针对知识图谱中原有的人物关系不完整的问题,在对知识图谱嵌入进行表示学习时,充分考虑实体与关系在语义空间的交互,通过平移距离模型和双线性投影,引入实体交互嵌入和关系交互嵌入,从关系中提取信息来更新实体嵌入,并利用实体信息来更新关系嵌入,最大程度保留实体和关系的固有信息和交互信息,高效地表达语义空间中的实体空间和关系空间之间的相互关系,通过新提出的实体-关系交互机制,从而可以更好的预测知识图谱中的实体,更准确获得的人物之间的关系,从而挖掘出人物之间隐藏的相互关系和可疑关系,可以发现和预防更多的欺诈犯罪,另外,通过这些人物关系,还可以高效地实现知识图谱补全任务,丰富和拓展了现有的人物关系知识图谱。
然后通过使用卷积神经网络和前馈神经网络,可充分利用神经网络和深度学习的优势来提取特征,进行预测,本发明充分发挥了卷积神经网络和前馈神经网络在数据特征提取上的优势,能够批量处理大规模数据,适用于大规模数据应用系统。
与现有技术相比,本发明在知识谱图的实体预测的实验任务中,取得了更好的效果:在3个公开数据集FB15k-237、WN18RR、YAGO3-10中,本发明经过实践检验,在MRR、Hits@10、Hits@3、Hits@1这四个知识图谱评价指标上达到了最好的效果,且数据指标分布方差小,性能稳定。
在本发明的实施例中,还提供了一种计算机装置,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述的基于知识图谱嵌入的挖掘人物关系的方法。
该计算机装置可以是终端,其内部结构图可以如图3所示。该计算机装置包括通过总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机装置的处理器用于提供计算和控制能力。该计算机装置的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机装置的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于知识图谱嵌入的挖掘人物关系的方法。该计算机装置的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机装置的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机装置外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机装置的限定,具体的计算机装置可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本发明的实施例中,还提供了一种计算机可读存储介质,其上存储有程序,其特征在于:程序被处理器执行时实现如上述的基于知识图谱嵌入的挖掘人物关系的方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、计算机装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、计算机装置、或计算机程序产品的流程图和/或框图来描述的。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图和/或中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图中指定的功能。
以上对本发明所提供的在基于知识图谱嵌入的挖掘人物关系的方法、计算机装置、计算机可读存储介质的应用进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,包括以下步骤:
步骤S1:从具有人物关系的知识图谱中提取原始实体、原始关系,将原始实体、原始关系进行嵌入表示;
步骤S2:将原始关系嵌入、原始实体嵌入进行交互嵌入,得到交互单元;
步骤S3:构建并训练预测模型,所述预测模型包括前馈神经网络层和卷积神经网络层以及评分层,将交互单元进行嵌入表示后,分别输入前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,将预测的实体嵌入输入评分层,获得评分层预测的实体嵌入的得分;
步骤S4:将得分最高的预测的实体嵌入的得分,作为挖掘的得到的人物关系输出。
2.根据权利要求1所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,在步骤S1中,还包括以下步骤:从互联网爬取人物数据,构建人物关系的知识图谱,所述人物关系的知识图谱包含头实体、关系、尾实体的三元组;
3.根据权利要求1所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,步骤S2具体包括以下步骤:
步骤S21:基于平移距离模型,将原始关系嵌入从关系空间投影到实体空间,与原始实体嵌入相加,得到实体交互嵌入;
步骤S22:将原始实体、原始关系和实体交互嵌入进行双线性投影,得到关系交互嵌入;
步骤S23:合并原始实体嵌入、原始关系嵌入、实体交互嵌入和关系交互嵌入,得到交互单元。
4.根据权利要求3所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,步骤S21具体包括以下步骤:
步骤S211:定义转换矩阵,使用所述转换矩阵与原始关系嵌入相乘,将原始关系嵌入的信息从关系空间投影到实体空间;
步骤S212:将步骤S211得到的结果,与初始实体嵌入相加,得到实体交互嵌入。
5.根据权利要求4所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,步骤S22具体包括以下步骤:
步骤S221:将原始实体嵌入与原始关系嵌入,于向量的每一个维度进行哈达玛积操作,得到初级关系交互嵌入;
步骤S222:步骤S221得到的初级关系交互嵌入与步骤S21得到的实体交互嵌入之间,在向量的每一个维度进行哈达玛积操作,得到关系交互嵌入。
6.根据权利要求5所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于,步骤S23具体包括以下步骤:
将原始实体嵌入、原始关系嵌入、步骤S21得到的实体交互嵌入、步骤S22得到的关系交互嵌入,在矩阵的第2个维度上做矩阵的连接操作,得到交互单元。
7.根据权利要求1所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于:在步骤S3中,在训练预测模型时,构建训练集,所述训练集包括有标签的实体嵌入,通过标签能够索引得到对应的真实需预测的实体嵌入,采用有监督的学习方式,将训练集中数据对应的交互单元进行嵌入表示,然后输入预测模型的前馈神经网络层和卷积神经网络层,得到预测的实体嵌入,再将预测的实体嵌入与真实需预测的实体嵌入做点积,得到相似度得分,使用softmax函数将相似度得分进行归一化,使用交叉熵计算损失函数,更新预测模型;
在前馈神经网络层中,使用relu做为激活函数,输入的交互单元嵌入被映射到高维空间,得到特征向量,定义转换矩阵,将得到特征向量与转换矩阵相乘,然后使用relu激活函数处理,得到预测的实体嵌入;
在卷积神经网络层中,输入的交互单元嵌入经过卷积神经网络,得到特征向量,定义转换矩阵,将得到特征向量与转换矩阵相乘,然后使用relu激活函数处理,得到预测的实体嵌入;
在评分层中,采用sigmoid函数对预测得到的实体嵌入进行处理,得到预测的实体嵌入的得分。
8.根据权利要求1所述的基于知识图谱嵌入的挖掘人物关系的方法,其特征在于:还包括步骤S5:通过挖掘得到的人物关系,更新知识图谱。
9.一种计算机装置,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现如权利要求1所述的基于知识图谱嵌入的挖掘人物关系的方法。
10.一种计算机可读存储介质,其上存储有程序,其特征在于:程序被处理器执行时实现如权利要求1所述的基于知识图谱嵌入的挖掘人物关系的方法。
CN202110159206.9A 2021-02-05 2021-02-05 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质 Active CN112765287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110159206.9A CN112765287B (zh) 2021-02-05 2021-02-05 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110159206.9A CN112765287B (zh) 2021-02-05 2021-02-05 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质

Publications (2)

Publication Number Publication Date
CN112765287A true CN112765287A (zh) 2021-05-07
CN112765287B CN112765287B (zh) 2022-04-19

Family

ID=75705063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110159206.9A Active CN112765287B (zh) 2021-02-05 2021-02-05 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质

Country Status (1)

Country Link
CN (1) CN112765287B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190691A (zh) * 2021-05-28 2021-07-30 齐鲁工业大学 一种知识图谱的链路预测方法及系统
CN113254549A (zh) * 2021-06-21 2021-08-13 中国人民解放军国防科技大学 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN113537058A (zh) * 2021-07-16 2021-10-22 山东新一代信息产业技术研究院有限公司 一种陌生人物关联关系的判断方法及安防控制系统
WO2023050491A1 (zh) * 2021-09-30 2023-04-06 深圳前海环融联易信息科技服务有限公司 一种商机挖掘方法、装置、计算机设备及存储介质
CN117034094A (zh) * 2023-10-10 2023-11-10 连连银通电子支付有限公司 一种账户类型预测方法及账户类型预测装置
CN117455660A (zh) * 2023-12-25 2024-01-26 浙江邦盛科技股份有限公司 一种金融实时安全检测系统、方法、设备及存储介质
CN117708725A (zh) * 2023-12-15 2024-03-15 中国电子科技集团公司第十五研究所 分布式人员关系挖掘评估方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190122111A1 (en) * 2017-10-24 2019-04-25 Nec Laboratories America, Inc. Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions
CN109829057A (zh) * 2019-01-11 2019-05-31 中山大学 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
CN110765788A (zh) * 2019-10-29 2020-02-07 天津大学 一种基于隐式翻译模型的知识图谱嵌入方法
CN111241295A (zh) * 2020-01-03 2020-06-05 浙江大学 基于语义句法交互网络的知识图谱关系数据抽取方法
CN111260064A (zh) * 2020-04-15 2020-06-09 中国人民解放军国防科技大学 基于元知识的知识图谱的知识推理方法、系统以及介质
CN111858947A (zh) * 2019-04-26 2020-10-30 第四范式(北京)技术有限公司 自动知识图谱嵌入方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190122111A1 (en) * 2017-10-24 2019-04-25 Nec Laboratories America, Inc. Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions
CN109829057A (zh) * 2019-01-11 2019-05-31 中山大学 一种基于图二阶相似性的知识图谱实体语义空间嵌入方法
CN111858947A (zh) * 2019-04-26 2020-10-30 第四范式(北京)技术有限公司 自动知识图谱嵌入方法和系统
CN110765788A (zh) * 2019-10-29 2020-02-07 天津大学 一种基于隐式翻译模型的知识图谱嵌入方法
CN111241295A (zh) * 2020-01-03 2020-06-05 浙江大学 基于语义句法交互网络的知识图谱关系数据抽取方法
CN111260064A (zh) * 2020-04-15 2020-06-09 中国人民解放军国防科技大学 基于元知识的知识图谱的知识推理方法、系统以及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHENCHEN LI等: ""A Survey on Approaches and Applications of Knowledge Representation Learning"", 《2020 IEEE FIFTH INTERNATIONAL CONFERENCE ON DATA SCIENCE IN CYBERSPACE》 *
宋刚: ""基于深度学习的知识图谱补全方法研究"", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190691A (zh) * 2021-05-28 2021-07-30 齐鲁工业大学 一种知识图谱的链路预测方法及系统
CN113190691B (zh) * 2021-05-28 2022-09-23 齐鲁工业大学 一种知识图谱的链路预测方法及系统
CN113254549A (zh) * 2021-06-21 2021-08-13 中国人民解放军国防科技大学 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN113254549B (zh) * 2021-06-21 2021-11-23 中国人民解放军国防科技大学 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN113537058A (zh) * 2021-07-16 2021-10-22 山东新一代信息产业技术研究院有限公司 一种陌生人物关联关系的判断方法及安防控制系统
CN113537058B (zh) * 2021-07-16 2023-12-15 山东新一代信息产业技术研究院有限公司 一种陌生人物关联关系的判断方法及安防控制系统
WO2023050491A1 (zh) * 2021-09-30 2023-04-06 深圳前海环融联易信息科技服务有限公司 一种商机挖掘方法、装置、计算机设备及存储介质
CN117034094A (zh) * 2023-10-10 2023-11-10 连连银通电子支付有限公司 一种账户类型预测方法及账户类型预测装置
CN117034094B (zh) * 2023-10-10 2024-03-12 连连银通电子支付有限公司 一种账户类型预测方法及账户类型预测装置
CN117708725A (zh) * 2023-12-15 2024-03-15 中国电子科技集团公司第十五研究所 分布式人员关系挖掘评估方法和装置
CN117455660A (zh) * 2023-12-25 2024-01-26 浙江邦盛科技股份有限公司 一种金融实时安全检测系统、方法、设备及存储介质
CN117455660B (zh) * 2023-12-25 2024-05-24 浙江邦盛科技股份有限公司 一种金融实时安全检测系统、方法、设备及存储介质

Also Published As

Publication number Publication date
CN112765287B (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
CN112765287B (zh) 基于知识图谱嵌入的挖掘人物关系的方法、装置以及介质
Humphreys et al. A data-driven approach for learning to control computers
CN111695674B (zh) 联邦学习方法、装置、计算机设备及可读存储介质
CN110825884B (zh) 基于人工智能的嵌入表示处理方法、装置及电子设备
CN112418292B (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
JP7044839B2 (ja) エンドツーエンドモデルのトレーニング方法および装置
WO2021238333A1 (zh) 一种文本处理网络、神经网络训练的方法以及相关设备
JP2022003537A (ja) 対話意図の認識方法及び装置、電子機器並びに記憶媒体
Peng et al. Multiview boosting with information propagation for classification
CN112836502B (zh) 一种金融领域事件隐式因果关系抽取方法
CN113254549A (zh) 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CN108008942A (zh) 对数据记录进行处理的方法及系统
CN112183881A (zh) 一种基于社交网络的舆情事件预测方法、设备及存储介质
CN112837142A (zh) 一种金融风险模型训练方法和装置
JP2022145623A (ja) ヒント情報を提示する方法及び装置並びにコンピュータプログラム
CN114925320B (zh) 一种数据处理方法及相关装置
WO2021008145A1 (zh) 图像段落描述生成方法、装置、介质及电子设备
Guo [Retracted] Financial Market Sentiment Prediction Technology and Application Based on Deep Learning Model
JP7236501B2 (ja) 文書類似度学習に基づくディープラーニングモデルの転移学習方法およびコンピュータ装置
CN115906861A (zh) 基于交互方面信息融合的语句情感分析方法以及装置
CN111915701B (zh) 一种基于人工智能的按钮图像生成方法和装置
CN116306612A (zh) 一种词句生成方法及相关设备
Wang et al. Evaluation criterion of underwater object clustering segmentation with pulse‐coupled neural network
CN115238092A (zh) 一种实体关系抽取方法、装置、设备及存储介质
CN111666395A (zh) 面向软件缺陷的可解释问答方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant