CN116128015A - 实体关系预测方法、关系预测模型的训练方法及相关设备 - Google Patents
实体关系预测方法、关系预测模型的训练方法及相关设备 Download PDFInfo
- Publication number
- CN116128015A CN116128015A CN202211331797.4A CN202211331797A CN116128015A CN 116128015 A CN116128015 A CN 116128015A CN 202211331797 A CN202211331797 A CN 202211331797A CN 116128015 A CN116128015 A CN 116128015A
- Authority
- CN
- China
- Prior art keywords
- relationship
- target
- entity
- relation
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种实体关系预测方法、关系预测模型的训练方法及相关设备。所述实体关系预测方法包括:基于目标业务的实体关系异构图中的元路径,将实体关系异构图转化为多个实体关系同构图;通过目标关系预测模型的编码模块基于实体关系异构图表示的也有业务关系对目标节点进行嵌入表示,得到目标节点的第一表示向量,以及基于多个实体关系同构图各自表示的已有业务关系对目标节点进行嵌入表示,得到目标节点的第二表示向量;通过编码模块对目标节点的第一表示向量及第二表示向量进行融合,得到目标节点的融合表示向量;通过目标关系预测模型的解码模块基于多类实体对应的节点各自的融合表示向量,预测多类实体对应的节点之间的隐含业务关系。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种实体关系预测方法、关系预测模型的训练方法及相关设备。
背景技术
风控、信息推荐、智能应答等应用场景中有着对实体关系进行预测的需求,比如在风控场景中识别用户隐藏的身份,在信息推荐场景中预测用户对某类产品的兴趣度,在智能应答场景中预测符合用户语句的真实需求的应答语句,等等。这种需求在图数据中要求能够对实体对应的节点之间的关联关系进行预测。
相关技术中,通常利用图神经网络对图数据中的节点进行嵌入表示之后,利用距离函数对任意两个节点的表示向量之间的距离,通过预先设置阈值,判断这两个节点是否存在关联关系。但是,上述方法仅适用于同构图,对于异构图却表现不佳,经常在上述应用场景中的实体关系预测结果不准确。
发明内容
本申请实施例的目的提供一种实体关系预测方法、关系预测模型的训练方法及相关设备,用于实现对各类应用场景中的实体关系的准确识别。
为了实现上述目的,本申请实施例采用下述技术方案:
第一方面,本申请实施例提供一种实体关系预测方法,包括:
基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
通过本申请实施例提供的实体关系预测方法,利用目标业务的实体关系异构图中的元路径,将实体关系异构图转化为多个实体关系同构图;考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在实体关系异构图和实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,通过目标关系预测模型的编码模块分别基于实体关系异构图表示的已有业务关系和实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,以及对同一节点的两种表示向量进行融合得到同一节点的融合表示向量,使得同一节点对应的实体分别在实体关系异构图及实体关系同构图中的业务特征能够有效地结合在该节点的融合表示向量中,进而每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征;进一步,通过目标关系预测模型的解码模块基于实体关系异构图中多类实体对应的节点各自的融合表示向量,预测多类实体对应的节点之间的隐含业务关系,有利于从目标业务的实体关系异构图中准确挖掘出目标业务涉及的多类实体之间的隐含业务关系。
第二方面,本申请实施例提供一种关系预测模型的训练方法,包括:
基于目标业务对应的样本实体关系异构图中的元路径,将所述样本实体关系异构图转化为多个样本实体关系同构图,其中,所述样本实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述样本实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个样本实体关系同构图用于表示所述样本实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过待训练的关系预测模型的编码模块基于所述样本实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个样本实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述样本实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的多种预测业务关系;
至少基于所述多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对所述关系预测模型进行迭代训练,以得到目标关系预测模型。
通过本申请实施例提供的关系预测模型的训练方法,利用目标业务的样本实体关系异构图中的元路径,将样本实体关系异构图转化为多个样本实体关系同构图;考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在样本实体关系异构图和样本实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,通过待训练的关系预测模型的编码模块分别基于样本实体关系异构图表示的已有业务关系和样本实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,以及对同一节点的两种表示向量进行融合得到同一节点的融合表示向量,使得编码模块能够充分学习同一节点分别在样本实体关系异构图及样本实体关系同构图中的表示向量并进行融合,进而能够将同一节点对应的实体分别在样本实体关系异构图及样本实体关系同构图中的业务特征能够有效地结合在该节点的融合表示向量中,使得每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征;进一步,至少基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对关系预测模型进行迭代训练,使得关系预测模型能够从样本实体关系异构图中每个节点对应的实体的丰富业务特征中学习和理解样本实体关系异构图中多类实体对应的节点之间的业务关系,进而得到能够准确预测多类实体对应的节点之间业务关系的目标关系预测模型,该目标关系预测模型可用于本申请实施例提供的实体关系预测方法中,以实现从目标业务的实体关系异构图中准确挖掘出目标业务涉及的多类实体之间的隐含业务关系。
第三方面,本申请实施例提供一种实体关系预测装置,包括:
第一转化单元,用于基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
第一嵌入单元,用于通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
第一融合单元,用于通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
第一预测单元,用于通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
第四方面,本申请实施例提供一种关系预测模型的训练装置,包括:
第二转化单元,用于基于目标业务对应的样本实体关系异构图中的元路径,将所述样本实体关系异构图转化为多个样本实体关系同构图,其中,所述样本实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述样本实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个样本实体关系同构图用于表示所述样本实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
第二嵌入单元,用于通过待训练的关系预测模型的编码模块基于所述样本实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个样本实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述样本实体关系异构图中的任一个节点;
第二融合单元,用于通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
第二预测单元,用于通过所述关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的多种预测业务关系;
训练单元,用于至少基于所述多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对所述关系预测模型进行迭代训练,以得到目标关系预测模型。
第五方面,本申请实施例提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的方法;或者,所述处理器被配置为执行所述指令,以实现如第二方面所述的方法。
第六方面,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的方法;或者,使得电子设备能够执行如第二方面所述的方法。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请的一个实施例提供的一种实体关系预测方法的流程示意图;
图2为本申请的一个实施例提供的一种异构图转化为同构图的示意图;
图3为本申请的一个实施例提供的一种目标关系预测模型的结构示意图;
图4为本申请的一个实施例提供的一种实体关系预测方法的应用场景示意图;
图5为本申请的一个实施例提供的一种关系预测模型的训练方法的流程示意图;
图6为本申请的一个实施例提供的一种关系预测模型的训练过程示意图;
图7为本申请的一个实施例提供的一种实体关系预测装置的结构示意图;
图8为本申请的一个实施例提供的一种关系预测模型的训练装置的结构示意图;
图9为本申请的一个实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应理解,这样使用的数据在适当的情况下可以互换,以便本申请实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本说明书和权利要求书中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
部分概念说明:
同构图(Homogeneous Graph):是指图中的节点类型都仅有一种。
异构图(Heterogeneous Graph):是指图中的节点类型或关系类型多于一种。在现实场景中,我们通常研究的图数据中的实体是多类型的,实体之间的交互关系也是多样化的。因此,异构图能够更好地贴近现实。
元路径(Meta-path):是连接两个实体的复合关系,是一种广泛使用的捕获语义的结构。
如前文所述,相关技术中,通常利用图神经网络对图数据中的节点进行嵌入表示之后,利用距离函数对任意两个节点的表示向量之间的距离,通过预先设置阈值,判断这两个节点是否存在关联关系。但是,上述方法仅适用于同构图,对于异构图却表现不佳,无法准确预测异构图中不同类型的节点之间的关联关系。
有鉴于此,本申请实施例旨在提出一种实体关系预测方法,利用目标业务的实体关系异构图中的元路径,将实体关系异构图转化为多个实体关系同构图;考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在实体关系异构图和实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,通过目标关系预测模型的编码模块分别基于实体关系异构图表示的已有业务关系和实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,以及对同一节点的两种表示向量进行融合得到同一节点的融合表示向量,使得同一节点对应的实体分别在实体关系异构图及实体关系同构图中的业务特征能够有效地结合在该节点的融合表示向量中,进而每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征;进一步,通过目标关系预测模型的解码模块基于实体关系异构图中多类实体对应的节点各自的融合表示向量,预测多类实体对应的节点之间的隐含业务关系,有利于从目标业务的实体关系异构图中准确挖掘出目标业务涉及的多类实体之间的隐含业务关系。
本申请实施例还提出一种关系预测模型的训练方法,利用目标业务的样本实体关系异构图中的元路径,将样本实体关系异构图转化为多个样本实体关系同构图;考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在样本实体关系异构图和样本实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,通过待训练的关系预测模型的编码模块分别基于样本实体关系异构图表示的已有业务关系和样本实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,以及对同一节点的两种表示向量进行融合得到同一节点的融合表示向量,使得编码模块能够充分学习同一节点分别在样本实体关系异构图及样本实体关系同构图中的表示向量并进行融合,进而能够将同一节点对应的实体分别在样本实体关系异构图及样本实体关系同构图中的业务特征能够有效地结合在该节点的融合表示向量中,使得每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征;进一步,至少基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对关系预测模型进行迭代训练,使得关系预测模型能够从样本实体关系异构图中每个节点对应的实体的丰富业务特征中学习和理解样本实体关系异构图中多类实体对应的节点之间的业务关系,进而得到能够准确预测多类实体对应的节点之间业务关系的目标关系预测模型,该目标关系预测模型可用于本申请实施例提供的实体关系预测方法中,以实现从目标业务的实体关系异构图中准确挖掘出目标业务涉及的多类实体之间的隐含业务关系。
应理解,本申请实施例提供的实体关系预测方法和关系预测模型的训练方法均可以由电子设备或安装在电子设备中的软件执行。此处所谓的电子设备可以包括终端设备,比如智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端、飞行器等;或者,电子设备还可以包括服务器,比如独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。
以下结合附图,详细说明本申请各实施例提供的技术方案。
请参见图1,为本申请的一个实施例提供的一种实体关系预测方法的流程示意图,该方法可以包括如下步骤:
S102,基于目标业务的实体关系异构图中的元路径,将实体关系异构图转化为多个实体关系同构图。
其中,目标业务可以例如包括但不限于用户画像生成业务、人员搜索定位业务、风控数据分析业务、组织关系分析等。
其中,实体关系异构图是指需要进行实体间隐含业务关系预测的异构图。本申请实施例中,实体关系异构图可以包括目标业务涉及的多类实体对应的节点和多种连接边。实体关系异构图用于表示多类实体对应的节点之间的多种已有业务关系,其中,每个节点对应一个实体,每种连接边用于表示所连接的节点之间的一种已有业务关系。
示例地,如图2所示,以组织关系分析业务为例,该业务的实体关系异构图包括员工A、员工B、员工C、公司1以及公司2这五个实体分别对应的节点之间在“就职”和“离职”这两种已有业务关系,其中,员工A、员工B和员工C对应的同一种类型的节点(即员工节点),公司1和公司2对应的同一类型的节点(即公司节点),员工A与公司1之间、员工B与公司1之间以及员工C与公司2之间均存在已有业务关系“就职”,员工A与公司2之间以及员工B和公司2之间均存在已有业务关系“离职”,以员工A与公司1之间的连接边所表示的已有业务关系“就职”为例,其表示员工A就职于公司1。
元路径用于表示实体关系异构图中不同类实体对应的节点之间的一种已有业务关系。具体而言,元路径可以通过本领域常用的各种图数据解析技术,对实体关系异构图中节点之间是否存在业务关系以及已有业务关系的关系类型进行解析得到。示例地,仍以图2所示的实体关系异构图为例,该实体关系异构图包括两个元路径,即“员工—公司—员工”和“公司—员工—公司”。
在上述S102中,在解析得到实体关系异构图中的元路径之后,基于元路径对实体关系异构图进行拆分,即可得到多个实体关系同构图。其中,每个实体关系同构图用于表示实体关系异构图中同类实体对应的节点的至少一种业务关系。
示例地,继续沿用图2所示的实体关系异构图,基于该实体关系异构图包含的两种元路径“员工—公司—员工”和“公司—员工—公司”,对实体关系异构图进行拆分,可以得到仅包含员工节点的实体关系同构图1和仅包含公司节点的实体关系同构图2。
S104,通过目标关系预测模型的编码模块基于实体关系异构图表示的已有业务关系对目标点进行嵌入表示,得到目标节点的第一表示向量,以及基于多个实体关系同构图各自表示的已有业务关系对目标节点进行嵌入表示,得到目标节点的第二表示向量。
其中,目标节点为实体关系异构图中的任一个节点。
其中,目标关系预测模型是指预先训练好的、具有关系预测功能的模型,其可用于预测实体关系异构图中多类实体对应的节点之间的业务关系,得到多类实体对应的节点之间的预测业务关系。如图3所示,目标关系预测模型可以包括编码模块(Encoder)和解码模块(Decoder),其中,编码模块可用于对实体关系异构图中的目标节点进行嵌入表示,得到目标节点的表示向量;解码模块可用于基于实体关系异构图中多类实体对应的节点各自的表示向量对不同节点之间的业务关系进行预测。
本申请实施例中,对实体关系异构图中的目标节点进行嵌入表示,是指将目标节点对应的实体的业务特征以向量的形式进行表示。其中,每个节点对应的实体的业务特征可以例如包括但不限于该节点对应的实体的类型、该节点对应的实体的属性信息等。实际应用中,实体的属性信息可以根据实体的不同而不同,具体可根据实际需要进行选择,本申请实施例对此不作限定。示例地,若实体为某个用户,那么,实体的属性信息可以包括该用户的性别、生理特征等;又如,若实体为某个地点,那么,实体的属性信息可以包括该地点的位置、周边环境特征等。
考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在实体关系异构图和实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,为了使嵌入表示所得的表示向量能够准确表示节点对应的实体的业务特征,可通过目标关系预测模型的编码模块分别基于实体关系异构图表示的已有业务关系和实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,也即一方面通过编码模块基于实体关系异构图表示的已有业务关系对多个节点进行嵌入表示,得到多个节点各自的第一表示向量,另一方面通过编码模块基于多个实体关系同构图各自表示的已有业务关系对多个节点进行嵌入表示,得到多个节点各自的第二表示向量。其中,每个节点的第一表示向量用于表示该节点对应的实体在实体关系异构图中所具有的业务特征,每个节点的第二表示向量用于表示该节点对应的实体在实体关系同构图中所具有的业务特征。
本申请实施例中,编码模块可具有任意适当的结构,具体可根据实际需要进行设置,本申请实施例对此不作限定。可选地,如图3所示,编码模块可以包括异构图神经网络和多个同构图神经网络,并且,多个同构图神经网络与上述多个同构图一一对应,一个同构图神经网络与一个同构图对应。图3仅以编码模块包括同构图神经网络1~同构图神经网络n示意,n为大于1的正整数。
相应地,上述104具体可以实现为:对于实体关系异构图而言,基于实体关系异构图表示的已有业务关系,确定目标节点的第一邻居节点,通过异构图神经网络对目标节点对应的实体的业务特征和第一邻居节点对应的实体的业务特征进行聚合处理,得到目标节点的第一聚合特征,以及对目标节点的第一聚合特征进行嵌入表示,得到目标节点的第一表示向量,其中,第一邻居节点为实体关系异构图中与目标节点相连的节点。
示例地,继续沿用图2所示的实体关系异构图,以目标节点为员工A为例,员工A的第一邻居节点包括公司1和公司2,通过异构图神经网络可以对员工A的业务特征、公司1的业务特征以及公司2的业务特征进行聚合处理,得到员工A的第一聚合特征,进而对员工A的第一聚合特征进行嵌入表示,即可得到员工A的第一表示向量。
实际应用中,对于目标节点及其第一邻居节点各自对应的实体的业务特征的聚合处理,可以采用本领域常用的各种聚合处理方法实现,具体可根据实际需要进行选择,本申请实施例对此不作限定。示例地,可以将目标节点对应的实体的业务特征与第一邻居节点对应的实体的业务特征进行加权求和所得的结果,作为目标节点的第一聚合特征;又如,在第一邻居节点为多个的情况下,还可以将这多个第一邻居节点对应的实体各自的业务特征的均值与目标节点对应的实体的业务特征进行加权求和,得到目标节点的第一聚合特征,等等。
对于实体关系同构图而言,通过目标实体关系同构图表示的已有业务关系,确定目标节点的第二邻居节点,通过目标实体关系同构图对应的同构图神经网络对目标节点对应的实体的业务特征和目标节点的第二邻居节点对应的实体的业务特征进行聚合处理,得到目标节点的第二聚合特征,并对目标节点的第二聚合特征进行嵌入表示,得到目标节点的第二表示向量,其中,目标实体关系同构图为上述多个实体关系同构图中包含目标节点的任一个实体关系同构图,第二邻居节点为目标实体关系同构图中与目标节点相连的节点。
示例地,继续沿用图2所示的实体关系异构图,以目标节点为员工A为例,目标实体关系同构图为实体关系同构图1,员工A的第二邻居节点包括员工B和员工C,通过实体关系同构图1对应的同构图神经网络对员工A的业务特征、员工B的业务特征以及员工C的业务特征进行聚合处理,得到员工A的第二聚合特征,进而对员工A的第二聚合特征进行嵌入表示,即可得到员工A的第二表示向量。
又如,以目标节点为公司1为例,目标实体关系同构图为同构图2,公司1的第二邻居节点包括公司2,通过实体关系同构图2对应的同构图神经网络对公司1的业务特征和公司2的业务特征进行聚合处理,得到公司1的第二聚合特征,进而对公司1进行嵌入表示,即可得到公司1的第二表示向量。
实际应用中,对于目标节点及其第二邻居节点各自对应的实体的业务特征的聚合处理,可以采用本领域常用的各种聚合处理方法实现,具体可根据实际需要进行选择,本申请实施例对此不作限定。示例地,可以将目标节点对应的实体的业务特征与第二邻居节点对应的实体的业务特征进行加权求和所得的结果,作为目标节点的第二聚合特征;又如,在第二邻居节点为多个的情况下,还可以将这多个第二邻居节点各自对应的实体的业务特征的均值与目标节点对应的实体的业务特征进行加权求和,得到目标节点的第二聚合特征,等等。
需要说明的是,实际应用中,目标节点的第一邻居节点与第二邻居节点可能相同,也可能不同。无论第一邻居节点与第二邻居节点是否相同,均可按照如上所述的嵌入方式,对目标节点进行嵌入表示,分别得到目标节点的第一表示向量和第二表示向量。
其次,如图3所示,在通过编码模块对目标节点进行嵌入表示之前,可对目标节点对应的实体的业务特征进行初始的嵌入表示(Embedding),将目标节点对应的实体的业务特征嵌入到一个预设维度的向量中,得到目标节点的特征向量;接着,再通过编码模块对目标节点的特征向量进行进一步的特征表示。
再次,异构图神经网络可以采用本领域常用的各种能够用于异构图处理的图神经网络,具体可以例如包括但不限于如下网络中的一种或多种的组合:GNN、hetGNN、MAGNN等。同构图神经网络可以采用本领域常用的各种能够用于同构图处理的图神经网络,具体可以例如包括但不限于如下网络中的一种或多种的组合:图卷积网络(Graph ConvolutionalNetwork,GCN)、graphSAGE等。
另外,实际应用中,实体关系异构图表示的已有业务关系可采用邻接矩阵(Adjacency Matrix)A表示,也即其中,E表示已有业务关系集合,表示节点vi与节点vj之间存在业务关系。每个实体关系同构图表示的已有业务关系也可采用邻接矩阵表示。
示例地,继续沿用图2所示的实体关系异构图和实体关系同构图,该实体关系异构图所表示的已有业务关系如下表1所示,其可通过如下邻接矩阵表示;实体关系同构图1所表示的已有业务关系如下表2所示,其可通过如下邻接矩阵表示;同构图2所表示的已有业务关系如下表3所示,其可通过如下邻接矩阵表示。
表1
员工A | 员工B | 员工C | 公司1 | 公司2 | |
员工A | 0 | 0 | 0 | 1 | 1 |
员工B | 0 | 0 | 0 | 1 | 1 |
员工C | 0 | 0 | 0 | 0 | 1 |
公司1 | 1 | 1 | 0 | 0 | 0 |
公司2 | 1 | 1 | 1 | 0 | 0 |
表2
员工A | 员工B | 员工C | |
员工A | 0 | 1 | 1 |
员工B | 1 | 0 | 1 |
员工C | 1 | 1 | 0 |
表3
公司1 | 公司2 | |
公司1 | 0 | 1 |
公司2 | 1 | 0 |
可以理解的是,通过采用具有异构图神经网络和多个同构图神经网络的编码模块,由异构图神经网络基于实体关系异构图表示的已有业务关系这一维度对实体关系异构图中的节点进行嵌入表示,并由每个同构图神经网络基于对应的实体关系同构图表示的已有业务关系这一维度对实体关系异构图中的节点进行嵌入表示,这些网络各司其职,相较于由一个网络处理所有维度的嵌入表示处理工作,有利于更准确地从上述两个维度对实体关系异构图中的节点进行嵌入表示。另外,还可以能够解决实体关系异构图中同类实体对应的节点因距离远得到业务特征的传递减弱的问题,并且,从多个实体关系同构图中能够挖掘出更多同类实体的业务特征;对于实体关系异构图而言,异构图神经网络可以从实体关系异构图中获取各个节点对应的实体的业务特征,从而使编码模块不丢失原有的数据结构的信息。
实际应用中,同构图神经网络可以只设置一层网络结构进行聚合处理和降维,从而降低模型参数量;异构图神经网络也可以只设置一层网络结构,以减少参数量。
在此仅示出了编码模块的一种具体结构。当然,应理解,编码模块也可以采用其他的结构,比如集成了异构图处理和同构图处理为一体的图神经网络等,本申请实施例对此不作限定。
S106,通过编码模块对目标节点的第一表示向量及第二表示向量进行融合,得到目标节点的融合表示向量。
为了使同一节点对应的实体分别在实体关系异构图及实体关系同构图中的业务特征能够有效地融合在一起,可通过编码模块对目标节点的第一表示向量及第二表示向量进行融合,由此得到的目标节点的融合表示向量融合了目标节点对应的实体分别在实体关系异构图及实体关系同构图中的业务特征,进而不仅使得每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征,还可以实现特征交叉和降维。
为了实现每个节点的第一表示向量及第二表示向量的有效融合,上述编码模块还可以包括用于融合处理的网络。
可选地,上述编码模块可以包括拼接网络。相应地,在上述S106中,可通过拼接网络对目标节点的第一表示向量及第二表示向量进行拼接,得到目标节点的融合表示向量。其中,如前文所述,目标节点为实体关系异构图中的任一节点。
可选地,如图3所示,上述编码模块可以包括拼接网络和图注意力网络(GraphAttention Network,GAT)。相应地,上述S106具体可实现为:通过拼接网络对目标节点的第一表示向量及第二表示向量进行拼接,得到目标节点的候选表示向量;进一步,通过图注意力网络基于注意力机制(Attention Mechanism)对目标节点的候选表示向量和第一邻居节点的候选表示向量进行聚合处理,得到目标节点的融合表示向量。
具体而言,图注意力网络通过注意力机制对目标节点的候选表示向量和目标节点的第一邻居节点的候选表示向量进行聚合处理,也即根据目标节点的每个第一邻居节点与目标节点之间的已有业务关系,自适应地为每个第一邻居节点的候选表示向量分配相应的权重,该权重可用于表示每个第一邻居节点对于目标节点而言的重要性,进而在进行聚合处理的过程中,使得对目标节点更重要的第一邻居节点的候选表示向量获得更高的权重,而对目标节点重要性低的第一邻居节点的候选表示向量则获得更小的权重,从而大大提高编码模块的表达能力,进一步提高对目标节点进行嵌入表示的准确性。
需要说明的是,实际应用中,拼接网络可通过本领域常用的各种拼接方式对目标节点的第一表示向量及第二表示向量进行拼接,具体可根据实际需要进行选择,本申请实施例对此不作限定。示例地,上述拼接方式可以包括但不限于如下方式中的一种或多种的组合:加和(sum)、求平均值(sum)、将两个表示向量拼接为一个更高维度的向量等。
S108,通过目标关系预测模型的解码模块基于多类实体对应的节点各自的融合表示向量,预测多类实体对应的节点之间的隐含业务关系。
其中,多类实体对应的节点之间的隐含业务关系是指不同于实体关系异构图所表示的已有业务关系的其他业务关系。示例地,如图4所示,实线表示所连接的两个节点之间的已有业务关系,虚线表示所连接的两个节点之间的隐含业务关系。
考虑到将多个节点各自的融合表示向量输入解码模块中得到的预测业务关系通常包含了实体关系异构图中的已有业务关系,为了更准确地确定多个节点之间的隐含业务关系,在一种可选的实现方式中,上述S108可以包括如下步骤:
S1081,通过解码模块基于多类实体对应的节点各自的融合表示向量之间的距离,预测多类实体对应的节点之间的预测业务关系。
为了便于区分,多类实体对应的节点之间的已有业务关系是指实体关系异构图中已呈现的业务关系,多类实体对应的节点之间的预测业务关系是指通过关系预测模型预测得到的业务关系。
本申请实施例中,解码模块是具有关系预测能力的模块,其可以基于多类实体对应的节点各自的融合表示向量所表示的业务特征,对多类实体对应的节点之间的业务关系进行分析和挖掘,从而预测出多类实体对应的节点之间的预测业务关系。
实际应用中,为了提高预测准确性,上述预测业务关系可通过预测关系矩阵表示。具体而言,如图3所示,解码模块可以包括内积层,上述1081可实现为:基于多类实体对应的节点各自的融合表示向量,获取实体关系异构图对应的融合表示矩阵,其中,融合表示矩阵的每个行向量表示实体关系异构图中一个节点的融合表示向量;接着,对融合表示向量矩阵进行转置处理,得到转置矩阵;进一步,通过内积层对融合表示向量矩阵和转置矩阵进行内积运算,得到预测关系矩阵。
示例地,实体关系异构图包括N个节点,每个节点的融合表示向量为一个f维的向量,通过将每个节点的融合表示向量作为一个行向量,即可得到一个N×f维的融合表示向量矩阵;接着,对该融合表示向量矩阵进行转置处理,即可得到f×N维的转置矩阵,该转置矩阵的每个列向量即表示一个节点的融合表示向量;进一步,通过所述内积层对融合表示向量矩阵和转置矩阵进行内积运算,得到N×N维的预测关系矩阵,该矩阵即为实体关系异构图对应的重构后的邻接矩阵,其可以表示实体关系异构图中多类实体对应的节点之间的预测业务关系。
S1082,对预测业务关系中包含的实体关系异构图表示的已有业务关系进行过滤处理,得到多类实体对应的节点之间的隐含业务关系。
本申请实施例中,可通过各种任意适当的方式对预测业务关系中包含的已有业务关系进行过滤处理,具体可根据实际需要进行选择,本申请实施例对此不作限定。
在一种可选的实现方式中,为实现对预测业务关系中的已有业务关系的准确过滤,上述S1082可实现为:分别获取实体关系异构图的邻接矩阵和用于表示预测业务关系的预测关系矩阵,并对邻接矩阵进行掩码处理,得到掩码矩阵;接着,对预测关系矩阵和掩码矩阵进行运算,得到用于表示多类实体对应的节点之间的隐含业务关系的目标关系矩阵;最后,基于目标关系矩阵,即可确定多类实体对应的节点之间的隐含业务关系。更为具体地,对预测关系矩阵和掩码矩阵进行的运算可以为哈达玛乘积运算。
示例地,对于实体关系异构图的邻接矩阵,可将其中值1置为0,并将值0置为1,以完成对该邻接矩阵的掩码。这样,在对预测关系矩阵和掩码矩阵进行运算时,实体关系异构图中节点之间的已有业务关系被过滤掉,而预测所得的新的业务关系被保留,保留的这部分业务关系即为上述多类实体对应的节点之间的隐含业务关系。
在此仅示出了对上述S108的一种具体实现方式。当然,应理解,上述S108也可以采用本领域常用的各种方式实现,具体可根据实际需要进行选择,本申请实施例对此不作限定。
本申请一个或多个实施例提供的实体关系预测方法,利用目标业务的实体关系异构图中的元路径,将实体关系异构图转化为多个实体关系同构图;考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在实体关系异构图和实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,通过目标关系预测模型的编码模块分别基于实体关系异构图表示的已有业务关系和实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,以及对同一节点的两种表示向量进行融合得到同一节点的融合表示向量,使得同一节点对应的实体分别在实体关系异构图及实体关系同构图中的业务特征能够有效地结合在该节点的融合表示向量中,进而每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征;进一步,通过目标关系预测模型的解码模块基于实体关系异构图中多类实体对应的节点各自的融合表示向量,预测多类实体对应的节点之间的隐含业务关系,有利于从目标业务的实体关系异构图中准确挖掘出目标业务涉及的多类实体之间的隐含业务关系。
上述实施例介绍了实体关系预测方法,通过上述实体关系预测方法可用于对风控、信息推荐、智能应答等各类应用场景中的实体关系进行预测。下面结合风控场景和信息推荐场景为例,对本申请实施例提供的实体关系预测方法进行详细说明。
对于信息推荐场景中的用户画像生成业务,该业务涉及的多类实体包括多类涉及数据,具体而言,多类社交数据可以例如包括但不限于目标社交平台上的用户的用户标识及用户的多类属性特征,该业务的实体关系异构图用于表示多类社交数据对应的节点之间的多种已有业务关系,元路径用于表示实体关系异构图中不同类社交数据之间的一种已有业务关系,每个实体关系同构图用于表示实体关系异构图中同类社交数据对应的节点之间的至少一种已有业务关系。
相应地,通过上述步骤S102至S106,可以得到实体关系异构图中每个节点的融合表示向量。在上述步骤S108中,可通过目标关系预测模型的解码模块基于多类社交数据对应的节点的融合表示向量,预测目标社交平台中目标用户对应的节点与其他节点之间的隐含业务关系。进一步,在上述S108之后,可基于目标社交平台中目标用户对应的节点与其他节点之间的隐含业务关系及已有业务关系,生成目标用户对应的用户画像。
示例地,假设目标用户对应的节点与其他节点之间的隐含业务关系表示目标用户喜欢浏览新闻资讯类消息,目标用户对应的节点与其他节点之间的已有业务关系表示目标用户在目标社交平台上的好友也喜欢浏览新闻资讯类消息,那么,可确定目标用户对应的用户画像为时事爱好者。
对于风控场景下的人员搜索定位业务,多类实体包括目标失联人员及其相关人员、每个人员的用户设备以及每个人员的居住地址等。
若要寻找失联人员,可利用已有的人员、登录设备以及居住地址等多种类型的实体及这些实体之间的已有业务关系,构造相应的实体关系异构图,也就是说,该实体关系异构图包人员、设备及地址等多种类型的实体对应的节点以及这些节点之间的多种连接边,每种连接边表示所连接的节点之间的一种已有业务关系。接着,可基于该实体关系异构图中的元路径“人员—设备—人员”、“设备—人员—设备”、“人员—地址—人员”、“地址—人员—地址”等,将实体关系异构图转化为多个实体关系同构图,比如仅包括人员对应的节点的实体关系同构图、仅包括设备对应的节点的实体关系异构图以及仅包括地址对应的节点的实体关系同构图;紧接着,通过目标关系预测模型的编码模块基于实体关系异构图表示的已有业务关系,对每个节点进行嵌入表示,得到该节点的第一表示向量,以及基于多个实体关系同构图各自表示的已有业务关系,对每个节点进行嵌入表示,得到该节点的第二表示向量;进一步,通过编码模块对每个节点的第一表示向量及第二表示向量进行融合,得到该节点的融合表示向量;最后,通过目标关系预测模型的解码模块基于实体关系异构图中多类实体对应的节点各种的融合表示向量,预测目标失联人员对应的节点与其他节点之间的隐含业务关系,通过预测出的隐含业务关系。进一步,基于目标失联人员对应的节点分别与其他人物对应的节点、设备对应的节点以及地址对应的节点等节点之间的隐含业务关系,即可分析和推理出目标失联人员的一些相关信息,比如目标失联人员使用的设备、目标失联人员的亲属、目标失联人员可能的居住地址等,从而寻找到目标失联人员,实现对目标失联人员的搜索定位。
对于风控场景下的风控数据分析业务,多类实体包括多类风控数据,具体而言,多类风控数据包括多个风控对象以及每个风控对象的多类信用数据。实体关系异构图用于表示多类风控数据对应的节点之间的多种已有业务关系,元路径用于表示实体关系异构图中不同类风控数据之间的一种已有业务关系,每个实体关系同构图用于表示实体关系异构图中同类风控数据对应的节点之间的至少一种已有业务关系。
相应地,通过上述步骤S102至S106,可以得到实体关系异构图中每个节点的融合表示向量。在上述步骤S108中,可通过目标关系预测模型的解码模块基于多类风控数据对应的节点的融合表示向量,预测多类风控数据对应的节点之间的隐含业务关系。进一步,在上述S108之后,可基于多类风控数据对应的节点之间的隐含业务关系和实体关系异构图表示的已有业务关系,对多个风控对象进行风控分析。
示例地,如图4所示,某银行的多条业务数据间引数据收集时间不同、客户笔误、录入/识别误差等原因,存在矛盾/不一致,比如黑名单用户王五与王六拥有同一个电话号码等,导致众多用户数据缺乏有效唯一标识,无法有效分析风控对象(比如黑名单用户王五)的信息全貌。
在此情况下,为了有效分析黑名单用户王五的信息全貌,多类风控数据包括多个用户及每个用户的用户设备、电话号码、居住地址等。在此情况下,可利用已有的用户、设备、电话号码以及居住地址等多种类型的实体及这些实体之间的已有业务关系,构造相应的实体关系异构图,也就是说,如图4所示,该实体关系异构图包人物(比如王五、李四、王六、张三)、设备(比如设备A)及地址(比如地址X)等多种类型的实体对应的节点以及这些节点之间的多种连接边,每种连接边表示所连接的节点之间的一种业务关系,如图4中的实线所示的表示的已有业务关系“定期转账”、“拥有”、“登录设备”、“居住”等。接着,可基于该实体关系异构图中的元路径“用户—设备—用户”、“用户—人物—用户”、“用户—地址—用户”、“地址—用户—地址”、“用户—电话—用户”、“电话—用户—电话”等,将实体关系异构图转化为多个实体关系同构图,比如仅包括用户对应的节点的实体关系同构图、仅包括设备对应的节点的实体关系异构图、仅包括地址对应的节点的实体关系同构图以及仅包括电话号码对应的节点的实体关系异构图;紧接着,通过目标关系预测模型的编码模块基于实体关系异构图表示的已有业务关系,对每个节点进行嵌入表示,得到该节点的第一表示向量,以及基于多个实体关系同构图各自表示的已有业务关系,对每个节点进行嵌入表示,得到该节点的第二表示向量;进一步,通过编码模块对每个节点的第一表示向量及第二表示向量进行融合,得到该节点的融合表示向量;最后,通过目标关系预测模型的解码模块基于实体关系异构图中多类实体对应的节点各自的融合表示向量,预测这些实体对应的节点之间的隐含业务关系,得到如图4中虚线所示的隐含业务关系:黑名单王五与李四之间存在疑似亲属关系,黑名单用户与王六疑似为同一人,李四与张三之间存在疑似亲属关系。
由此,基于黑名单用户王五与其他用户之间的隐含业务关系以及黑名单用户与设备、地址、电话号码以及其他用户之间的已有业务关系,即可分析出黑名单用户王五的信息全貌:王五与李四之间存在疑似亲属关系,王五与王六疑似为同一人,王五的电话号码为电话1,王五的登录设备为设备A,王五居住在地址X,等等。
通过本申请实施例提供的实体关系预测方法用于其他应用场景下的实体关系预测过程,与上述风控场景中的实体关系预测过程类似,在此不再一一展开。
本申请实施例还提供一种关系预测模型的训练方法,用于训练应用于上述实体关系预测方法中的目标关系预测模型。请参见图5,为本申请的一个实施例提供的一种关系预测模型的训练方法的流程示意图,该方法可以包括如下步骤:
S502,基于样本实体关系异构图中的元路径,将样本实体关系异构图转化为多个样本实体关系同构图。
其中,样本实体关系异构图用于表示目标业务涉及的多类实体对应的节点之间的多种已有业务关系,元路径用于表示样本实体关系异构图中多类实体对应的节点之间的一种已有业务关系,每个样本实体关系同构图用于表示样本实体关系异构图中同类实体对应的节点之间的至少一种业务关系。
上述S502的具体实现方式与上述实体关系预测方法中S102的具体实现方式类似,具体可参见上文对S102的描述,在此不再赘述。
S504,通过待训练的关系预测模型的编码模块基于样本实体关系异构图表示的已有业务关系目标节点进行嵌入表示,得到目标节点的第一表示向量,以及基于多个样本实体关系同构图各自表示的已有业务关系对目标节点进行嵌入表示,得到目标节点的第二表示向量。
其中,目标节点为样本实体关系异构图中的任一个节点。
上述S504的具体实现方式与上述实体关系预测方法中S104的具体实现方式类似,具体可参见上文对S104的描述,在此不再赘述。
S506,通过编码模块对目标节点的第一表示向量及第二表示向量进行融合,得到目标节点的融合表示向量。
上述S506的具体实现方式与上述实体关系预测方法中S106的具体实现方式类似,具体可参见上文对S106的描述,在此不再赘述。
S508,通过关系预测模型的解码模块基于多类实体对应的节点各自的融合表示向量,预测多类实体对应的节点之间的多种预测业务关系。
上述S508的具体实现方式与上述实体关系预测方法中S108的具体实现方式类似,具体可参见上文对S108的描述,在此不再赘述。
S510,至少基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对关系预测模型进行迭代训练,以得到目标关系预测模型。
具体而言,如图6所示,可至少基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系之间的差异程度,对关系预测模型的模型参数进行调整,以得到目标关系预测模型。其中,关系预测模型的模型参数可以包括编码模块的模块参数和解码模块的模块参数。对于对每个模块而言,该模块的模块参数可以包括该模块包含的各网络层中的节点(如神经元)的数量、不同网络层中的节点之间的连接关系及连接边权重、各网络层中的节点对应的偏置等。
在一种可选的实现方式中,上述S510可以包括如下步骤:基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,确定关系预测模型的预测损失,以及基于关系预测模型的预测损失,调整关系预测模型的模型参数。其中,关系预测模型的预测损失用于表示多类实体对应的节点之间的多种已有业务关系及多种预测业务关系之间的差异程度。
示例地,可采用反向传播算法,基于关系预测模型的预测损失和关系预测模型当前的模型参数,确定关系预测模型中各模块引起的损失;然后,以使关系预测模型的预测损失下降为目标,逐层调整各模块的模块参数。
在另一种可选的实现方式中,上述S510可以包括如下步骤:在第i轮迭代训练中,基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,确定关系预测模型的第一预测损失,以及基于第一预测损失,调整关系预测模型的模型参数,其中,i为正整数;在第i+1轮迭代训练中,基于多类实体对应的节点各自的第一表示向量及第二表示向量之间的距离,确定关系预测模型的第二预测损失,以及基于第二预测损失,调整关系预测模型的模型参数。
其中,第一预测损失用于表示多类实体对应的节点之间的多种已有业务关系及多种预测业务关系之间的差异程度。第二预测损失用于表示多类实体对应的节点各自的第一表示向量及第二表示向量之间的距离。
示例地,第一预测损失可采用第一预设损失函数,基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系确定。其中,第一预设损失函数可以根据实际需要进行设置,例如第一预设损失函数可以为交叉熵损失函数等,本申请实施例对此不作限定。
第二预测损失可采用第二预设损失函数,基于多类实体对应的节点各自的第一表示向量及第二表示向量之间的距离确定。其中,第二预设损失函数可以根据实际需要进行设置,例如第二预设损失函数可以为余弦相似度函数等,本申请实施例对此不作限定。
可以理解的是,在上述第二种实现方式中,交替使用两种预测损失来调整关系预测模型的模型参数,在第i+1轮迭代训练中,基于第一预测损失,调整关系预测模型的模型参数,有利于解码模块的预测能力,从而使得预测所的预测业务关系与已有业务关系相近但存在差异;在第i+1轮迭代训练中,基于第二预测损失,调整关系预测模型的模型参数,有利于提高编码模块对多类实体对应的节点各自的第一表示向量和第二表示向量进行交叉及增强表达的能力。
需要说明的是,上述过程仅为一次调整过程,实际应用中,可能需要进行多次调整,因而可重复执行上述步骤S504至S510多次,直至满足预设训练停止条件为止,由此将满足预设训练停止条件的关系预测模型确定为目标关系预测模型。其中,预设训练停止条件可以根据实际需要进行设置,比如预设训练停止条件可以包括关系预测模型的预测损失小于预设损失阈值或者调整次数达到预设次数等,本申请实施例对此不作限定。
本申请的一个或多个实施例提供的关系预测模型的训练方法,利用目标业务的样本实体关系异构图中的元路径,将样本实体关系异构图转化为多个样本实体关系同构图;考虑到具有业务关系的实体的业务特征在一定程度上也具有一定的关联性,因而每个实体的业务特征能够通过其关联的其他实体的业务特征得到增强,并且,同一实体对应的节点在样本实体关系异构图和样本实体关系同构图中与其他实体对应的节点之间的业务关系有所差异,基于此,通过待训练的关系预测模型的编码模块分别基于样本实体关系异构图表示的已有业务关系和样本实体关系同构图表示的已有业务关系这两个维度,对同一节点进行嵌入表示,得到同一节点的两种表示向量,以及对同一节点的两种表示向量进行融合得到同一节点的融合表示向量,使得编码模块能够充分学习同一节点分别在样本实体关系异构图及样本实体关系同构图中的表示向量并进行融合,进而能够将同一节点对应的实体分别在样本实体关系异构图及样本实体关系同构图中的业务特征能够有效地结合在该节点的融合表示向量中,使得每个节点的融合表示向量能够增强该节点的嵌入表示而包含更丰富的业务特征;进一步,至少基于多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对关系预测模型进行迭代训练,使得关系预测模型能够从样本实体关系异构图中每个节点对应的实体的丰富业务特征中学习和理解样本实体关系异构图中多类实体对应的节点之间的业务关系,进而得到能够准确预测多类实体对应的节点之间业务关系的目标关系预测模型,该目标关系预测模型可用于本申请实施例提供的实体关系预测方法中,以实现从目标业务的实体关系异构图中准确挖掘出目标业务涉及的多类实体之间的隐含业务关系。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
此外,与上述图1所示的实体关系预测方法相对应地,本申请实施例还提供一种实体关系预测装置。请参见图7,为本申请的一个实施例提供的一种实体关系预测装置700的结构示意图,该装置700可以包括:
第一转化单元710,用于基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
第一嵌入单元720,用于通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
第一融合单元730,用于通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
第一预测单元740,用于通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
可选地,所述编码模块包括异构图神经网络和多个同构图神经网络,所述多个同构图神经网络与所述多个同构图一一对应,一个同构图神经网络与一个同构图对应;
所述第一嵌入单元具体用于:
基于所述实体关系异构图表示的已有业务关系,确定所述目标节点的第一邻居节点,其中,所述第一邻居节点为所述实体关系异构图中与所述目标节点相连的节点;
通过所述异构图神经网络对所述目标节点对应的实体的业务特征和所述第一邻居节点对应的实体的业务特征进行聚合处理,得到所述目标节点的第一聚合特征,并对所述第一聚合特征进行嵌入表示,得到所述目标节点的第一表示向量;
基于目标实体关系同构图表示的已有业务关系,确定所述目标节点的第二邻居节点,其中,所述目标实体关系同构图为所述多个实体关系同构图中包含所述目标节点的任一个实体关系同构图,所述第二邻居节点为所述目标实体关系同构图中与所述目标节点相连的节点;
通过所述目标实体关系同构图对应的同构图神经网络对所述目标节点的业务特征和所述第二邻居节点的业务特征进行聚合处理,得到所述目标节点的第二聚合特征,并对所述第二聚合特征进行嵌入表示,得到所述目标节点的第二表示向量。
可选地,所述编码模块还包括拼接网络和图注意力网络;
所述第一融合单元具体用于:通过所述拼接网络对所述目标节点的第一表示向量及第二表示向量进行拼接,得到所述目标节点的候选表示向量;通过所述图注意力网络基于注意力机制对所述目标节点的候选表示向量和所述第一邻居节点的候选表示向量进行聚合处理,得到所述目标节点的融合表示向量。
可选地,所述第一预测单元具体用于:通过所述解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的预测业务关系;对所述预测业务关系中包含的所述实体关系异构图表示的已有业务关系进行过滤处理,得到所述多类实体对应的节点之间的隐含业务关系。
可选地,所述第一预测单元,对所述预测业务关系中包含的所述实体关系异构图表示的已有业务关系进行过滤处理,得到所述多类实体对应的节点之间的隐含业务关系,包括:
分别获取所述实体关系异构图的邻接矩阵和用于表示所述预测业务关系的预测关系矩阵,所述邻接矩阵用于表示所述实体关系异构图所表示的已有业务关系;
对所述邻接矩阵进行掩码处理,得到掩码矩阵;
对所述预测关系矩阵和所述掩码矩阵进行运算,得到用于表示所述多类实体对应的节点之间的隐含业务关系的目标关系矩阵;
基于所述目标关系矩阵,确定所述多类实体对应的节点之间的隐含业务关系。
可选地,所述解码模块包括内积层;
所述第一预测单元,通过所述解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的预测业务关系,包括:基于所述多类实体对应的节点各自的融合表示向量,获取所述实体关系异构图对应的融合表示向量矩阵,其中,所述融合表示向量矩阵的每个行向量表示所述实体关系异构图中一个节点的融合表示向量;对所述融合表示向量矩阵进行转置处理,得到转置矩阵;通过所述内积层对所述融合表示向量矩阵和所述转置矩阵进行内积运算,得到所述预测关系矩阵。
可选地,所述目标业务为用户画像生成业务,所述多类实体包括多类社交数据,所述实体关系异构图用于表示多类社交数据对应的节点之间的多种已有业务关系,所述多类社交数据包括所述目标社交平台上的用户的用户标识及多类属性特征,所述元路径用于表示所述实体关系异构图中不同类社交数据之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类社交数据对应的节点之间的至少一种已有业务关系;
所述第一预测单元具体用于:通过所述目标关系预测模型的解码模块基于所述多类社交数据对应的节点的融合表示向量,预测所述目标社交平台中目标用户对应的节点与其他节点之间的隐含业务关系;
所述装置还包括:画像生成单元,用于在所述第一预测单元预测所述多类实体对应的节点之间的隐含业务关系之后,基于所述目标社交平台中目标用户对应的节点与其他节点之间的隐含业务关系及已有业务关系,生成所述目标用户对应的用户画像。
可选地,所述目标业务为人员搜索定位业务,所述多类实体包括目标失联人员及其相关人员、每个人员的用户设备以及每个人员的居住地址;
所述第一预测单元具体用于:通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述目标失联人员对应的节点与其他节点之间的隐含业务关系;
所述装置还包括:搜索定位单元,用于在所述第一预测单元预测所述多类实体对应的节点之间的隐含业务关系之后,基于所述目标失联人员对应的节点与其他节点之间的隐含业务关系,对所述目标失联人员进行搜索定位。
可选地,所述目标业务为风控数据分析业务,所述多类实体包括多类风控数据,所述实体关系异构图用于表示所述多类风控数据对应的节点之间的多种已有业务关系,所述多类风控数据包括多个风控对象以及每个风控对象的多类信用数据,所述元路径用于表示所述实体关系异构图中不同类风控数据之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类风控数据对应的节点之间的至少一种已有业务关系;
所述第一预测单元具体用于:通过所述目标关系预测模型的解码模块基于所述多类风控数据对应的节点的融合表示向量,预测所述多类风控数据对应的节点之间的隐含业务关系;
所述装置还包括:风控分析单元,用于在所述第一预测单元预测所述多类实体对应的节点之间的隐含业务关系之后,基于所述隐含业务关系和所述实体关系异构图表示的已有业务关系,对所述多个风控对象进行风控分析。
显然,本申请实施例提供的实体关系预测装置能够作为图1所示的实体关系预测方法的执行主体,例如,图1所示的实体关系预测方法中步骤S102可由图7所示的实体关系预测装置中的第一转化单元执行,步骤S104可由实体关系预测装置中的第一嵌入单元执行,步骤S106可由实体关系预测装置中的第一融合单元执行,步骤S108可由实体关系预测装置中的第一预测单元执行。
根据本申请的另一个实施例,图7所示的实体关系预测装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其他实施例中,实体关系预测装置也可以包括其他单元,在实际应用中,这些功能也可以由其他单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(CentralProcessing Unit,CPU)、随机存取存储介质(Random Access Memory,RAM)、只读存储介质(Read-Only Memory,ROM)等处理元件和存储元件的例如计算机的通用计算设备上,运行能够执行如图1所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图7中所示的实体关系预测装置,以及来实现本申请实施例的实体关系预测方法。所述计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质转载于电子设备中,并在其中运行。
此外,与上述图5所示的关系预测模型的训练方法相对应地,本申请实施例还提供一种关系预测模型的训练装置。请参见图8,为本申请的一个实施例提供的一种关系预测模型的训练装置800的结构示意图,该装置800可以包括:
第二转化单元810,用于基于目标业务对应的样本实体关系异构图中的元路径,将所述样本实体关系异构图转化为多个样本实体关系同构图,其中,所述样本实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述样本实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个样本实体关系同构图用于表示所述样本实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
第二嵌入单元820,用于通过待训练的关系预测模型的编码模块基于所述样本实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个样本实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述样本实体关系异构图中的任一个节点;
第二融合单元830,用于通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
第二预测单元840,用于通过所述关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的多种预测业务关系;
训练单元850,用于至少基于所述多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对所述关系预测模型进行迭代训练,以得到目标关系预测模型。
显然,本申请实施例提供的关系预测模型的训练装置能够作为图5所示的关系预测模型的训练方法的执行主体,例如,图5所示的关系预测模型的训练方法中步骤S402可由图8所示的关系预测模型的训练装置中的第二划分单元执行,步骤S404可由关系预测模型的训练装置中的第二嵌入单元执行,步骤S406可由关系预测模型的训练装置中的第二融合单元执行,步骤S408可由关系预测模型的训练装置中的第二预测单元执行,步骤S410可由关系预测模型的训练装置中的训练单元执行。
根据本申请的另一个实施例,图8所示的关系预测模型的训练装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其他实施例中,关系预测模型的训练装置也可以包括其他单元,在实际应用中,这些功能也可以由其他单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(CentralProcessing Unit,CPU)、随机存取存储介质(Random Access Memory,RAM)、只读存储介质(Read-Only Memory,ROM)等处理元件和存储元件的例如计算机的通用计算设备上,运行能够执行如图5所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图8中所示的关系预测模型的训练装置,以及来实现本申请实施例的关系预测模型的训练方法。所述计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质转载于电子设备中,并在其中运行。
图9是本申请的一个实施例电子设备的结构示意图。请参考图9,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成实体关系预测装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
或者,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成关系预测模型的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
基于目标业务对应的样本实体关系异构图中的元路径,将所述样本实体关系异构图转化为多个样本实体关系同构图,其中,所述样本实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述样本实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个样本实体关系同构图用于表示所述样本实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过待训练的关系预测模型的编码模块基于所述样本实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个样本实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述样本实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的多种预测业务关系;
至少基于所述多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对所述关系预测模型进行迭代训练,以得到目标关系预测模型。
上述如本申请图1所示实施例揭示的实体关系预测装置执行的方法或者上述如本申请图5所示实施例揭示的关系预测模型的训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1的方法,并实现实体关系预测装置在图1所示实施例的功能,或者,该电子设备还可执行图5的方法,并实现关系预测模型的训练装置在图5所示实施例的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
或者,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图5所示实施例的方法,并具体用于执行以下操作:
基于目标业务对应的样本实体关系异构图中的元路径,将所述样本实体关系异构图转化为多个样本实体关系同构图,其中,所述样本实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述样本实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个样本实体关系同构图用于表示所述样本实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过待训练的关系预测模型的编码模块基于所述样本实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个样本实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述样本实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的多种预测业务关系;
至少基于所述多类实体对应的节点之间的多种已有业务关系及多种预测业务关系,对所述关系预测模型进行迭代训练,以得到目标关系预测模型。
总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (12)
1.一种实体关系预测方法,其特征在于,包括:
基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
2.根据权利要求1所述的方法,其特征在于,所述编码模块包括异构图神经网络和多个同构图神经网络,所述多个同构图神经网络与所述多个同构图一一对应,一个同构图神经网络与一个同构图对应;
所述通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,包括:
基于所述实体关系异构图表示的已有业务关系,确定所述目标节点的第一邻居节点,其中,所述第一邻居节点为所述实体关系异构图中与所述目标节点相连的节点;
通过所述异构图神经网络对所述目标节点对应的实体的业务特征和所述第一邻居节点对应的实体的业务特征进行聚合处理,得到所述目标节点的第一聚合特征,并对所述第一聚合特征进行嵌入表示,得到所述目标节点的第一表示向量;
基于目标实体关系同构图表示的已有业务关系,确定所述目标节点的第二邻居节点,其中,所述目标实体关系同构图为所述多个实体关系同构图中包含所述目标节点的任一个实体关系同构图,所述第二邻居节点为所述目标实体关系同构图中与所述目标节点相连的节点;
通过所述目标实体关系同构图对应的同构图神经网络对所述目标节点的业务特征和所述第二邻居节点的业务特征进行聚合处理,得到所述目标节点的第二聚合特征,并对所述第二聚合特征进行嵌入表示,得到所述目标节点的第二表示向量。
3.根据权利要求2所述的方法,其特征在于,所述编码模块还包括拼接网络和图注意力网络;
所述通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量,包括:
通过所述拼接网络对所述目标节点的第一表示向量及第二表示向量进行拼接,得到所述目标节点的候选表示向量;
通过所述图注意力网络基于注意力机制对所述目标节点的候选表示向量和所述第一邻居节点的候选表示向量进行聚合处理,得到所述目标节点的融合表示向量。
4.根据权利要求1所述的方法,其特征在于,所述通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系,包括:
通过所述解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的预测业务关系;
对所述预测业务关系中包含的所述实体关系异构图表示的已有业务关系进行过滤处理,得到所述多类实体对应的节点之间的隐含业务关系。
5.根据权利要求4所述的方法,其特征在于,所述对所述预测业务关系中包含的所述实体关系异构图表示的已有业务关系进行过滤处理,得到所述多类实体对应的节点之间的隐含业务关系,包括:
分别获取所述实体关系异构图的邻接矩阵和用于表示所述预测业务关系的预测关系矩阵,所述邻接矩阵用于表示所述实体关系异构图所表示的已有业务关系;
对所述邻接矩阵进行掩码处理,得到掩码矩阵;
对所述预测关系矩阵和所述掩码矩阵进行运算,得到用于表示所述多类实体对应的节点之间的隐含业务关系的目标关系矩阵;
基于所述目标关系矩阵,确定所述多类实体对应的节点之间的隐含业务关系。
6.根据权利要求5所述的方法,其特征在于,所述解码模块包括内积层;
所述通过所述解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的预测业务关系,包括:
基于所述多类实体对应的节点各自的融合表示向量,获取所述实体关系异构图对应的融合表示向量矩阵,其中,所述融合表示向量矩阵的每个行向量表示所述实体关系异构图中一个节点的融合表示向量;
对所述融合表示向量矩阵进行转置处理,得到转置矩阵;
通过所述内积层对所述融合表示向量矩阵和所述转置矩阵进行内积运算,得到所述预测关系矩阵。
7.根据权利要求1所述的方法,其特征在于,所述目标业务为用户画像生成业务,所述多类实体包括多类社交数据,所述实体关系异构图用于表示多类社交数据对应的节点之间的多种已有业务关系,所述多类社交数据包括所述目标社交平台上的用户的用户标识及多类属性特征,所述元路径用于表示所述实体关系异构图中不同类社交数据之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类社交数据对应的节点之间的至少一种已有业务关系;
所述通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系,包括:
通过所述目标关系预测模型的解码模块基于所述多类社交数据对应的节点的融合表示向量,预测所述目标社交平台中目标用户对应的节点与其他节点之间的隐含业务关系;
在预测所述多类实体对应的节点之间的隐含业务关系之后,所述方法还包括:
基于所述目标社交平台中目标用户对应的节点与其他节点之间的隐含业务关系及已有业务关系,生成所述目标用户对应的用户画像。
8.根据权利要求1所述的方法,其特征在于,所述目标业务为人员搜索定位业务,所述多类实体包括目标失联人员及其相关人员、每个人员的用户设备以及每个人员的居住地址;
所述通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系,包括:
通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述目标失联人员对应的节点与其他节点之间的隐含业务关系;
在预测所述多类实体对应的节点之间的隐含业务关系之后,所述方法还包括:
基于所述目标失联人员对应的节点与其他节点之间的隐含业务关系,对所述目标失联人员进行搜索定位。
9.根据权利要求1所述的方法,其特征在于,所述目标业务为风控数据分析业务,所述多类实体包括多类风控数据,所述实体关系异构图用于表示所述多类风控数据对应的节点之间的多种已有业务关系,所述多类风控数据包括多个风控对象以及每个风控对象的多类信用数据,所述元路径用于表示所述实体关系异构图中不同类风控数据之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类风控数据对应的节点之间的至少一种已有业务关系;
所述通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系,包括:
通过所述目标关系预测模型的解码模块基于所述多类风控数据对应的节点的融合表示向量,预测所述多类风控数据对应的节点之间的隐含业务关系;
在预测所述多类实体对应的节点之间的隐含业务关系之后,所述方法还包括:
基于所述隐含业务关系和所述实体关系异构图表示的已有业务关系,对所述多个风控对象进行风控分析。
10.一种实体关系预测装置,其特征在于,包括:
第一转化单元,用于基于目标业务的实体关系异构图中的元路径,将所述实体关系异构图转化为多个实体关系同构图,其中,所述实体关系异构图用于表示所述目标业务涉及的多类实体对应的节点之间的多种已有业务关系,所述元路径用于表示所述实体关系异构图中不同类实体对应的节点之间的一种已有业务关系,每个实体关系同构图用于表示所述实体关系异构图中同类实体对应的节点之间的至少一种已有业务关系;
第一嵌入单元,用于通过目标关系预测模型的编码模块基于所述实体关系异构图表示的已有业务关系对目标节点进行嵌入表示,得到所述目标节点的第一表示向量,以及基于所述多个实体关系同构图各自表示的已有业务关系对所述目标节点进行嵌入表示,得到所述目标节点的第二表示向量,其中,所述目标节点为所述实体关系异构图中的任一个节点;
第一融合单元,用于通过所述编码模块对所述目标节点的第一表示向量及第二表示向量进行融合,得到所述目标节点的融合表示向量;
第一预测单元,用于通过所述目标关系预测模型的解码模块基于所述多类实体对应的节点各自的融合表示向量,预测所述多类实体对应的节点之间的隐含业务关系。
11.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至9中任一项所述的方法;或者,所述处理器被配置为执行所述指令,以实现如权利要求10所述的方法。
12.一种计算机可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至9中任一项所述的方法;或者,使得电子设备能够执行如权利要求10所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211331797.4A CN116128015A (zh) | 2022-10-28 | 2022-10-28 | 实体关系预测方法、关系预测模型的训练方法及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211331797.4A CN116128015A (zh) | 2022-10-28 | 2022-10-28 | 实体关系预测方法、关系预测模型的训练方法及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116128015A true CN116128015A (zh) | 2023-05-16 |
Family
ID=86305183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211331797.4A Pending CN116128015A (zh) | 2022-10-28 | 2022-10-28 | 实体关系预测方法、关系预测模型的训练方法及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116128015A (zh) |
-
2022
- 2022-10-28 CN CN202211331797.4A patent/CN116128015A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Roick et al. | L ocation B ased S ocial N etworks–Definition, Current State of the Art and Research Agenda | |
CN113627447A (zh) | 标签识别方法、装置、计算机设备、存储介质及程序产品 | |
Zhan et al. | Identification of top-K influential communities in big networks | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN114692007B (zh) | 表示信息的确定方法、装置、设备及存储介质 | |
CN111062431A (zh) | 图像聚类方法、图像聚类装置、电子设备及存储介质 | |
CN111126422B (zh) | 行业模型的建立及行业的确定方法、装置、设备及介质 | |
Qian et al. | Partial ordering of information granulations: a further investigation | |
US20130108180A1 (en) | Information processing device, information processing method, and program | |
CN113641897B (zh) | 基于会话文本的推荐方法和装置、电子设备和存储介质 | |
CN116128015A (zh) | 实体关系预测方法、关系预测模型的训练方法及相关设备 | |
CN112766288B (zh) | 图像处理模型构建方法、装置、电子设备和可读存储介质 | |
CN114461943A (zh) | 基于深度学习的多源poi语义匹配方法、装置及其存储介质 | |
Oatley et al. | CCTV as a smart sensor network | |
CN111177526B (zh) | 网络意见领袖识别方法及装置 | |
Xiang et al. | Adaptive deep learning-based neighborhood search method for point cloud | |
CN111666452A (zh) | 用于对视频进行聚类的方法和装置 | |
CN110149810A (zh) | 限制在网络环境中操纵内容的传输 | |
CN113284027B (zh) | 团伙识别模型的训练方法、异常团伙识别方法及装置 | |
CN117218474A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN116992111B (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
CN114973369A (zh) | 人脸识别模型训练方法和装置、电子设备和存储介质 | |
CN116150465A (zh) | 投放信息的确定方法及相关设备 | |
CN117743674A (zh) | 资源召回方法、计算机设备及存储介质 | |
CN115953255A (zh) | 一种基于用户障碍的业务开展方法、装置和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |