CN111597401A - 基于图关系网络的数据处理方法、装置、设备及介质 - Google Patents

基于图关系网络的数据处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN111597401A
CN111597401A CN202010428966.0A CN202010428966A CN111597401A CN 111597401 A CN111597401 A CN 111597401A CN 202010428966 A CN202010428966 A CN 202010428966A CN 111597401 A CN111597401 A CN 111597401A
Authority
CN
China
Prior art keywords
node
vector
cold start
model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010428966.0A
Other languages
English (en)
Other versions
CN111597401B (zh
Inventor
陈思宏
肖万鹏
鞠奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010428966.0A priority Critical patent/CN111597401B/zh
Publication of CN111597401A publication Critical patent/CN111597401A/zh
Application granted granted Critical
Publication of CN111597401B publication Critical patent/CN111597401B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种基于图关系网络的数据处理方法、装置、设备及介质,该方法包括:将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息;获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征;基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征;根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。采用本申请实施例,可以通过节点冷启动模型直接预测冷启动节点的目标图关系特征,提高了获取图关系特征的准确度。

Description

基于图关系网络的数据处理方法、装置、设备及介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于图关系网络的数据处理方法、装置、设备及介质。
背景技术
目前,图采样与聚合(Graph SAmple and aggreGatE,GraphSAGE)算法在预测图关系网络中的某个节点(例如,节点1)的图关系特征的过程中,需要获取该节点1的邻居节点,以通过该节点1自身的特征和邻居节点的特征来综合确定出用于描述该节点1的图关系特征。
比如,以该节点1在图关系网络中的邻居节点的阶数为二阶为例,节点1的一阶邻居节点可以由对应的二阶邻居节点特征表示,对一阶邻居节点特征进行合并后,则可以得到节点1的邻居特征,进而在将节点1自身的特征与节点1的邻居节点的特征进行结合之后,可以得到该节点1的图关系特征。但是,在采用现有技术预测某个不具有邻居节点的节点(例如,节点2)的图关系特征的情况下,由于节点2不具有邻居节点,将无法得到该节点2的邻居节点的特征,以至于可能存在误将将节点2自身的特征作为该节点2的图关系特征的情况,从而降低了获取图关系特征的准确度。
发明内容
本申请实施例提供一种基于图关系网络的数据处理方法、装置、设备及介质,可以通过节点冷启动模型直接预测冷启动节点的目标图关系特征,提高了获取图关系特征的准确度。
本申请实施例一方面提供一种基于图关系网络的数据处理方法,该方法包括:
将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息;
获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征;冷启动节点的属性编码向量是对冷启动节点的属性信息进行编码处理后所得到的;
基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征;
根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
本申请实施例一方面提供一种基于图关系网络的数据处理装置,该装置包括:
第一获取模块,用于将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息;
向量转换模块,用于获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征;冷启动节点的属性编码向量是对冷启动节点的属性信息进行编码处理后所得到的;
冷启动处理模块,用于基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征;
推送模块,用于根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
其中,上述装置还包括:
第二获取模块,用于获取图关系网络中的第一节点对应的第一词向量特征以及第二节点对应的第二词向量特征;第二节点为与第一节点具有关联关系的至少一个邻居节点;
拼接处理模块,用于将第一词向量特征和第二词向量特征进行拼接处理,得到第一节点的第一图关系特征向量;
第三获取模块,用于获取与第一节点相关联的正样本节点对应的第一样本关系向量,以及与第一节点相关联的负样本节点对应的第二样本关系向量;正样本节点为图关系网络中与第一节点具有边连接关系的节点;负样本节点为图关系网络中与第一节点不具有边连接关系的节点;
模型训练模块,用于在获取到与图关系网络相关联的初始模型时,根据第一词向量特征、第一图关系特征向量、第一样本关系向量和第二样本关系向量,对初始模型进行训练,得到用于对冷启动节点进行冷启动处理的节点冷启动模型。
其中,第二获取模块包括:
第一向量转换单元,用于获取图关系网络中的第一节点的属性编码向量,对第一节点的属性编码向量进行向量转换处理,得到第一节点对应的第一词向量特征;第一节点的属性编码向量是对第一节点的属性信息进行编码处理所得到的;
第一获取单元,用于从图关系网络中获取与第一节点具有关联关系的至少一个邻居节点,将获取到的至少一个邻居节点作为第二节点;
第二向量转换单元,用于对第二节点中的每个邻居节点的属性编码向量进行向量转换处理,得到每个邻居节点的待处理词向量特征;每个邻居节点的属性编码向量是对每个邻居节点的属性信息进行编码处理所得到的;
聚合处理单元,用于对每个邻居节点的待处理词向量特征进行聚合处理,得到第二节点对应的第二词向量特征。
其中,模型训练模块包括:
第一确定单元,用于在获取到与图关系网络相关联的初始模型时,确定初始模型中的冷启动层;冷启动层包含对第一词向量特征进行冷启动处理的第一全连接层和第二全连接层;
冷启动处理单元,用于基于第一全连接层和第二全连接层,对第一词向量特征进行冷启动处理,得到第一词向量特征对应的第一冷启动向量特征;
模型训练单元,用于基于第一冷启动向量特征、第一图关系特征向量、第一样本关系向量和第二样本关系向量,对初始模型进行训练;
模型确定单元,用于在检测到训练后的初始模型满足模型收敛条件时,将满足模型收敛条件的初始模型确定为用于对冷启动节点进行冷启动处理的节点冷启动模型。
其中,第一全连接层包含第一全连接特征矩阵;第一全连接特征矩阵的行数与第一词向量特征的列数相同;第二全连接层包含第二全连接特征矩阵,且第二全连接特征矩阵的行数与第一全连接特征矩阵的列数相同;
冷启动处理单元包括:
第一矩阵换算子单元,用于将第一词向量特征和第一全连接层中的第一全连接特征矩阵进行矩阵换算处理,得到第一词向量特征对应的中间向量特征;中间向量特征的行数与第二全连接特征矩阵的行数相同;
第二矩阵换算子单元,用于将中间向量特征和第二全连接层中的第二全连接特征矩阵进行矩阵换算处理,得到中间向量特征对应的第一冷启动向量特征;第一冷启动向量特征的列数与第二全连接特征矩阵的列数相同,且第一冷启动向量特征的列数与第一图关系特征向量的列数相同。
其中,模型训练单元包括:
第一获取子单元,用于获取与图关系网络相关联的模型收敛条件;模型收敛条件包含第一收敛条件和第二收敛条件;第一收敛条件为与冷启动层相关联的冷启动损失值达到冷启动损失阈值时的条件;第二收敛条件为与初始模型相关联的模型损失值达到模型损失阈值时的条件;
第一确定子单元,用于基于第一图关系特征向量和第一冷启动向量特征,确定与第一节点相关联的冷启动损失值;
第二确定子单元,用于基于第一图关系特征向量、第一样本关系向量以及第二样本关系向量,确定与第一节点相关联的模型损失值;
模型训练子单元,用于基于模型损失值和冷启动损失值,对初始模型进行训练,得到模型训练结果;
第三确定子单元,用于若模型训练结果指示模型损失值达到第二收敛条件中的模型损失阈值,且冷启动损失值达到第一收敛条件中的冷启动损失阈值,则确定训练后的初始模型满足模型收敛条件。
其中,第一确定子单元还用于:
对第一图关系特征向量进行转置处理,得到第一图关系特征向量对应的第一转置向量;
对第一转置向量和第一冷启动向量特征分别进行二范数处理,得到第一转置向量对应的第一待处理二范数以及第一冷启动向量特征对应的第二待处理二范数;
基于第一待处理二范数和第二待处理二范数,确定与第一节点相关联的冷启动损失值。
其中,初始模型还包含隐藏层和权重层;模型训练结果包含具有第一模型损失值和第一冷启动损失值的第一模型训练结果;
上述装置还包括:
参数确定模块,用于若第一模型训练结果指示第一模型损失值达到第二收敛条件中的模型损失阈值,且第一冷启动损失值未达到第一收敛条件中的冷启动损失阈值,则将第一全连接特征矩阵和第二全连接特征矩阵确定为与冷启动层相关联的第一待调整参数,将隐藏层的模型参数和权重层的模型参数作为与第一模型损失值相匹配的第一模型参数;
参数调整模块,用于基于第一冷启动损失值,对第一待调整参数进行调整,得到与冷启动层相关联的第二待调整参数,将携带第一模型参数和第二待调整参数的初始模型作为过渡模型;
第一确定模块,用于基于第一模型参数对应的第一词向量特征和第二待调整参数,确定第一词向量特征对应的第二冷启动向量特征;
第二确定模块,用于基于第一模型参数对应的第一图关系特征向量和第二冷启动向量特征,更新与第一节点相关联的冷启动损失值,直到更新后的冷启动损失值达到第二收敛条件中的模型损失阈值时,确定训练后的过渡模型满足模型收敛条件。
其中,图关系网络中包含目标节点;目标节点为图关系网络中除冷启动节点之外的节点;目标节点的图关系特征是由节点冷启动模型对目标节点的第一词向量特征和目标节点的邻居节点的第二词向量特征进行拼接后所得到的;
推送模块包括:
查找单元,用于在图关系网络中查找与目标图关系特征相匹配的图关系特征对应的节点;
推送单元,用于若查找到的图关系特征对应的节点属于目标节点,则将查找到的图关系特征对应的节点作为待推送节点,对待推送节点进行推送。
其中,向量转换模块包括:
第三获取单元,用于获取与图关系网络相关联的节点冷启动模型;
属性编码单元,用于对冷启动节点的属性信息进行编码处理,得到冷启动节点的属性编码向量;
第二确定单元,用于获取节点冷启动模型中与冷启动节点的属性编码向量相关联的隐藏层特征矩阵,基于隐藏层特征矩阵和冷启动节点的属性编码向量,确定冷启动节点的属性隐藏层向量;隐藏层特征矩阵对应的行数与冷启动节点的属性编码向量对应的列数相同;
第三确定单元,用于基于冷启动节点的属性隐藏层向量以及冷启动节点的属性信息对应的权重系数,确定冷启动节点的目标词向量特征。
其中,冷启动节点的属性信息包含第一属性信息和第二属性信息;冷启动节点的属性编码向量包含第一属性信息对应的第一属性编码向量和第二属性信息对应的第二属性编码向量;节点冷启动模型包含用于对冷启动节点的属性编码向量进行向量转换功能的隐藏层;
第二确定单元包括:
第四确定子单元,用于在节点冷启动模型的隐藏层中,将与第一属性信息对应的隐藏层确定为第一隐藏层,将与第二属性信息对应的隐藏层确定为第二隐藏层;第一隐藏层中包含第一隐藏层特征矩阵,第一隐藏层特征矩阵的行数与第一属性编码向量的列数相同;第二隐藏层中包含第二隐藏层特征矩阵,第二隐藏层特征矩阵的行数与第二属性编码向量的列数相同;第一隐藏层特征矩阵的列数和第二隐藏层特征矩阵的列数相同;
第五确定子单元,用于基于第一属性编码向量和第一隐藏层中的第一隐藏层特征矩阵,确定与第一属性编码向量相关联的第一属性隐藏层向量;
第六确定子单元,用于基于第二属性编码向量和第二隐藏层中的第二隐藏层特征矩阵,确定与第二属性编码向量相关联的第二属性隐藏层向量;第二属性隐藏层向量与第一属性隐藏层向量具有相同的行数和列数;
第七确定子单元,用于将第一属性隐藏层向量与第二属性隐藏层向量确定为冷启动节点的属性隐藏层向量。
其中,节点冷启动模型中包含用于对冷启动节点的属性隐藏层向量进行加权处理的权重层;
第三确定单元包括:
第二获取子单元,用于获取节点冷启动模型中的权重层的权重矩阵;权重矩阵包含第一属性信息对应的第一权重系数以及第二属性信息对应的第二权重系数;
第八确定子单元,用于基于第一属性隐藏层向量、第二属性隐藏层向量、第一权重系数以及第二权重系数,确定目标节点对应的目标词向量特征。
本申请一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;
该处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,该存储器用于存储计算机程序,该处理器用于调用该计算机程序,以执行本申请实施例中上述一方面中的方法。
本申请一方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令当被处理器执行时,执行本申请实施例中上述一方面中的方法。
在本申请实施例中,计算机设备可以将图关系网络中的独立节点(即不具有邻居节点的节点)作为冷启动节点,并获取该冷启动节点的属性信息,该冷启动节点的属性信息后续可以用于确定冷启动节点的属性编码向量。进一步地,计算机设备可以获取与图关系网络相关联的节点冷启动模型(这里的节点冷启动模型为对初始模型进行训练后所得到的模型),基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,从而可以得到冷启动节点的目标词向量特征。由于节点冷启动模型具有对冷启动节点进行冷启动处理的功能,计算机设备可以基于节点冷启动模型对目标词向量特征进行冷启动处理,从而得到与冷启动节点相关联的目标图关系特征,并根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。由此可见,本申请实施例通过预先训练好的节点冷启动模型,可以在不需要获取冷启动节点的邻居节点信息的情况下,通过该节点冷启动模型中用于进行冷启动处理的冷启动框架快速预测得到冷启动节点的图关系特征,提高了获取图关系特征的准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构的结构示意图;
图2是本申请实施例提供的一种基于图关系网络的数据处理的场景示意图;
图3是本申请实施例提供的一种基于图关系网络的数据处理方法的流程示意图;
图4是本申请实施例提供的一种目标图关系特征的场景示意图;
图5是本申请实施例提供的一种待推送节点的场景示意图;
图6是本申请实施例提供的一种基于图关系网络的数据处理方法的流程示意图;
图7是本申请实施例提供的一种第一节点对应的第一词向量特征的场景示意图;
图8是本申请实施例提供的一种第一冷启动向量特征的场景示意图;
图9是本申请实施例提供的一种训练初始模型得到节点冷启动模型的框架示意图;
图10是本申请实施例提供的一种基于图关系网络的数据处理装置的结构示意图;
图11是本申请实施例提供的一种计算机设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见图1,是本申请实施例提供的一种网络架构的结构示意图。如图1所示,该网络架构可以包括服务器10和用户终端集群,该用户终端集群可以包括多个用户终端,如图1所示,具体可以包括用户终端100a、用户终端100b、用户终端100c、…、用户终端100n。
如图1所示,用户终端100a、用户终端100b、用户终端100c、…、用户终端100n可以分别与上述服务器10进行网络连接,以便于每个用户终端可以通过该网络连接与服务器10进行数据交互。其中,服务器10可以为独立的物理服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、大数据以及人工智能平台等基础云计算服务的云服务器。用户终端集群中的每个用户终端均可以包括但不限于:智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等智能终端。
可以理解的是,本申请实施例中的计算机设备可以为具有冷启动处理功能的实体终端,该实体终端可以为如图1所示的服务器10,也可以为用户终端,在此不做限定。
服务器10可以将图关系网络中的独立节点作为冷启动节点,进而可以获取冷启动节点的属性信息。应当理解,该图关系网络中还可以包含具有邻居节点的节点(即除冷启动节点之外的节点),本申请实施例可以将除冷启动节点之外的节点统称为目标节点。其中,图关系网络可以为用于描述社区关系链的工具,由节点与边构成,节点可以代表关系链对象,边可以代表上述两个关系链对象之间的联系紧密程度(例如,权重值的大小)。本申请实施例可以将图关系网络中不具有邻居节点的节点(即不具有边连接关系的节点)统称为独立节点。本申请实施例可以将图关系网络中每个节点的固有信息(即自身所携带的特征信息)统称为属性信息。冷启动节点的属性信息中可以包含N个属性信息(可以简称为属性),N可以为正整数。比如,若图关系网络为商品网络,即图关系网络中的冷启动节点可以为商品节点A,则该商品节点A的属性信息可以包含属性1(例如,品牌)、属性2(例如,价格范围)、…、属性N(例如,商品种类)。
进一步地,服务器10可以获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,从而可以得到冷启动节点的目标词向量特征。其中,属性编码向量可以为对图关系网络中节点的属性信息进行编码处理后所得到的向量。冷启动节点的属性编码向量可以为对冷启动节点的属性信息进行编码处理后所得到的向量。节点冷启动模型可以为具有对冷启动节点进行冷启动处理的功能的模型。冷启动处理可以为用于预测冷启动节点的图关系特征的处理过程,以得到下述冷启动节点的目标图关系特征。节点冷启动模型可以为对初始模型进行模型训练后,且在训练收敛时所得到的模型。初始模型可以为与图关系网络相关联且未经过模型训练的模型。本申请实施例可以将对图关系网络中的任意一个节点的属性编码向量进行向量转换处理后所得到的向量统称为词向量特征。本申请实施例可以将冷启动节点的词向量特征称之为目标词向量特征。目标词向量特征可以为冷启动节点的词向量(embedding)特征。
进一步地,服务器10可以基于节点冷启动模型对目标词向量特征进行冷启动处理,进而可以得到与冷启动节点相关联的目标图关系特征。其中,图关系特征可以为每个节点在图关系网络中所表现出的所有特征。目标图关系特征可以为冷启动节点的图关系特征。此时,服务器10可以根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。例如,服务器10可以根据冷启动节点(例如,商品节点A,可以对应商品A)相关联的目标图关系特征,向用户x推送和商品节点A相匹配的且在上述商品网络中的商品节点B(商品节点B对应商品B)。
本申请实施例可以以广告推荐场景为例,可以将广告作为图关系网络(例如,广告网络)中的节点,并将用户对于广告的点击操作作为广告网络中的边,计算机设备可以基于节点冷启动模型得到广告节点的图关系特征,进而基于广告节点的图关系特征向用户推荐在广告网络中与该广告节点相匹配的广告节点。
本申请实施例还可以以商品推荐场景为例,可以将商品作为图关系网络(例如,商品网络)中的节点,并将用户对于商品的购买或者点击等操作作为商品网络中的边,计算机设备可以基于节点冷启动模型得到商品节点对应的图关系特征,进而基于可以商品节点的图关系特征向用户推荐在商品网络中与该商品节点相匹配的商品节点。本申请实施例中的应用场景还可以为其它应用场景,例如,书籍推荐场景,等等。
进一步地,为便于理解,请参见图2,是本申请实施例提供的一种基于图关系网络的数据处理的场景示意图。本申请实施例中可以以计算机设备为服务器为例,比如,上述图1中的服务器10。如图2所示,图关系网络中可以包含邻居网络和冷启动节点。本申请实施例可以将以图关系网络(例如,图关系网络1)中的第一节点(例如,节点10a)为起点,在一定阈值范围内获取到的邻居节点所构成的网络统称为邻居网络(例如,邻居网络2),这里可以将图关系网络1中的冷启动节点理解为邻居网络2以外的节点。图关系网络1中还可以包含以其它节点作为起点所得到的邻居网络。其中,第一节点可以为图关系网络中任意一个具有邻居节点的节点。本申请实施例可以将图关系网络中与第一节点具有关联关系的至少一个邻居节点统称为第二节点。邻居网络2中可以包含节点10a、节点10a对应的一阶邻居节点(例如,节点20a、节点20b、节点20c以及节点20d)以及节点10a对应的二阶邻居节点(例如,节点30a和节点30b),这里可以将节点10a对应的一阶邻居节点和节点10a对应的二阶邻居节点统称为第二节点。
以商品推荐场景为例进行阐述(这里的图关系网络1可以为商品网络,图关系网络1中的节点均可以为商品节点),服务器可以通过节点10a、节点10a对应的一阶邻居节点(例如,节点20a、节点20b、节点20c以及节点20d)以及节点10a对应的二阶邻居节点(例如,节点30a和节点30b)对初始模型进行训练,得到具有对冷启动节点(例如,冷启动节点40a、冷启动节点40b以及冷启动节点40c)进行冷启动处理的功能的节点冷启动模型(例如,节点冷启动模型3)。
如图2所示,以冷启动节点40a为例,服务器可以获取冷启动节点40a的属性信息,该冷启动节点40a的属性信息可以包含N个属性信息,例如,具体可以包含属性1(例如,品牌)、属性2(例如,价格范围)、…、属性N(例如,商品种类)。
此时,服务器可以获取与图关系网络1相关联的节点冷启动模型3,基于节点冷启动模型3对冷启动节点40a的属性信息(例如,品牌、价格范围、…、商品种类)进行编码处理,得到冷启动节点40a的属性编码向量(例如,稀疏编码或者其它编码)。例如,服务器可以对品牌进行编码处理,得到品牌对应的属性编码向量1(例如,[1,0,0,0]);服务器也可以对价格范围进行编码处理,得到价格范围对应的属性编码向量2(例如,[0,0,1,0,0]);以此类推,服务器还可以对商品种类进行编码处理,得到商品种类对应的属性编码向量N(例如,[0,0,1])。
进一步地,服务器可以基于节点冷启动模型3对冷启动节点40a的属性编码向量(例如,[1,0,0,0]、[0,0,1,0,0]、…、[0,0,1])进行向量转换处理,从而可以得到冷启动节点40a的目标词向量特征。其中,目标词向量特征可以为1×embed_dim(即词向量维度)的词向量特征,例如,1×128的目标词向量特征。
进一步地,服务器可以基于节点冷启动模型3对1×128的目标词向量特征进行冷启动处理,得到与冷启动节点40a相关联的目标图关系特征(例如,1×256的目标图关系特征)。此时,服务器可以根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
由此可见,在本申请实施例中,计算机设备可以通过预先训练好的节点冷启动模型,可以在不需要获取冷启动节点的邻居节点信息的情况下,通过该节点冷启动模型中用于进行冷启动处理的冷启动框架快速预测得到冷启动节点的目标图关系特征,提高了获取图关系特征的准确度。
其中,计算机设备对冷启动节点进行冷启动处理的具体实现方式可以参见下述图3-图8所对应的实施例。
进一步地,请参见图3,是本申请实施例提供的一种基于图关系网络的数据处理方法的流程示意图。该方法可以由计算机设备执行,该计算机设备可以为上述图1所对应实施例中的服务器10;可选的,该计算机设备还可以为上述图1所对应实施例中的用户终端集群中的任意一个用户终端,这里将不对其进行限定,如图3所示的方法可以包括以下步骤S101-步骤S104:
步骤S101,将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息。
应当理解,在执行步骤S101之前,计算机设备可以遍历上述图关系网络(如上述图2中的图关系网络1所示)所包含的邻居网络(如上述图2中的邻居网络2所示)中的节点,对初始模型进行训练,进而可以得到用于对冷启动节点进行冷启动处理的节点冷启动模型(如上述图2中的节点冷启动模型3所示)。
此时,执行步骤S101,计算机设备可以将图关系网络中的独立节点作为冷启动节点,进而可以获取冷启动节点的属性信息。其中,独立节点可以理解为图关系网络中不具有边连接关系的节点(即不具有用户的点击行为信息的节点)。例如,冷启动节点可以为上述图2中的冷启动节点40a,冷启动节点40a的属性信息可以包含品牌、价格范围、…、商品种类。
步骤S102,获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征。
具体地,计算机设备可以获取与图关系网络相关联的节点冷启动模型。计算机设备可以对冷启动节点的属性信息进行编码处理,从而可以得到冷启动节点的属性编码向量。计算机设备可以获取节点冷启动模型中与冷启动节点的属性编码向量相关联的隐藏层特征矩阵,基于隐藏层特征矩阵和冷启动节点的属性编码向量,从而可以确定冷启动节点的属性隐藏层向量。其中,隐藏层特征矩阵对应的行数与冷启动节点的属性编码向量对应的列数相同。进一步地,计算机设备可以基于冷启动节点的属性隐藏层向量以及冷启动节点的属性信息对应的权重系数,得到冷启动节点的目标词向量特征。本申请实施例可以将隐藏层中具有对节点(例如,冷启动节点)的属性编码向量进行向量转换功能的矩阵统称为隐藏层特征矩阵。本申请实施例可以将隐藏层特征矩阵和属性编码向量相乘后的向量统称为属性隐藏层向量。
应当理解,计算机设备可以获取与图关系网络相关联的节点冷启动模型。其中,节点冷启动模型具有对冷启动节点进行冷启动处理的功能。节点冷启动模型可以包含隐藏层、权重层以及冷启动层。本申请实施例可以将节点冷启动模型中具有对节点(例如,冷启动节点)的属性编码向量进行向量转换功能的功能层称之为隐藏层。本申请实施例也可以将节点冷启动模型中具有对节点(例如,冷启动节点)的属性隐藏层向量进行加权处理的功能层称之为权重层。本申请实施例还可以将节点冷启动模型中具有对目标词向量特征进行冷启动处理的功能层称之为冷启动层。这样,计算机设备在获取到节点冷启动模型之后,可以通过节点冷启动模型对冷启动节点进行冷启动处理。
进一步地,计算机设备可以对冷启动节点的属性信息进行编码处理,从而可以得到冷启动节点的属性编码向量。其中,冷启动节点的属性信息可以包含第一属性信息和第二属性信息,冷启动节点的属性编码向量可以包含第一属性信息对应的第一属性编码向量和第二属性信息对应的第二属性编码向量。本申请实施例可以将冷启动节点的属性信息中的任意一个属性信息称之为第一属性信息,本申请实施例还可以将冷启动节点的属性信息中除第一属性信息以外的属性信息统称为第二属性信息。
此时,计算机设备可以获取节点冷启动模型中与属性编码向量相关联的隐藏层特征矩阵,并基于隐藏层特征矩阵和属性编码向量,进而可以确定冷启动节点的属性隐藏层向量。其中,隐藏层特征矩阵对应的行数与属性编码向量对应的列数相同。
具体地,在节点冷启动模型的隐藏层中,计算机设备可以将与第一属性信息对应的隐藏层确定为第一隐藏层,还可以将与第二属性信息对应的隐藏层确定为第二隐藏层。其中,第一隐藏层中可以包含第一隐藏层特征矩阵,第一隐藏层特征矩阵的行数与第一属性编码向量的列数相同。第二隐藏层中可以包含第二隐藏层特征矩阵,第二隐藏层特征矩阵的行数与第二属性编码向量的列数相同。第一隐藏层特征矩阵的列数和第二隐藏层特征矩阵的列数相同。计算机设备可以基于第一属性编码向量和第一隐藏层中的第一隐藏层特征矩阵,从而可以确定与第一属性编码向量相关联的第一属性隐藏层向量。进一步地,计算机设备可以基于第二属性编码向量和第二隐藏层中的第二隐藏层特征矩阵,从而可以确定与第二属性编码向量相关联的第二属性隐藏层向量。其中,第二属性隐藏层向量与第一属性隐藏层向量具有相同的行数和列数。此时,计算机设备可以将第一属性隐藏层向量与第二属性隐藏层向量确定为冷启动节点的属性隐藏层向量。本申请实施例可以将第一隐藏层中的隐藏层特征矩阵称之为第一隐藏层特征矩阵,本申请实施例也可以将第二隐藏层中的隐藏层特征矩阵统称为第二隐藏层特征矩阵。本申请实施例可以将与第一属性编码向量相关联的属性隐藏层向量称之为第一属性隐藏层向量,本申请实施例也可以将与第二属性编码向量相关联的属性隐藏层向量统称为第二属性隐藏层向量。
进一步地,计算机设备可以基于冷启动节点的属性隐藏层向量以及冷启动节点的属性信息对应的权重系数,得到冷启动节点的目标词向量特征。
具体地,计算机设备可以获取节点冷启动模型中的权重层的权重矩阵。其中,权重矩阵可以包含第一属性信息对应的第一权重系数以及第二属性信息对应的第二权重系数。进一步地,计算机设备可以基于第一属性隐藏层向量、第二属性隐藏层向量、第一权重系数以及第二权重系数,从而可以确定目标节点对应的目标词向量特征。
应当理解,计算机设备确定词向量特征(例如,目标词向量特征)的公式可以如下述公式(1)所示:
Figure BDA0002499803550000151
其中,K可以为词向量特征(例如,目标词向量特征),hg可以为节点(例如,冷启动节点)的第g个属性信息对应的属性隐藏层向量,xg可以为第g个属性信息对应的权重系数,N可以为节点的属性信息的总个数。
步骤S103,基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征。
具体地,节点冷启动模型中的冷启动层可以包含用于对词向量特征(例如,目标词向量特征)进行冷启动处理的多个全连接层(例如,第一全连接层和第二全连接层)。第一全连接层可以为上述多个全连接层中的一个全连接层,第二全连接层可以为上述多个全连接层中除第一全连接层之外的全连接层。这里的冷启动层中的多个全连接层还可以为其它具有对词向量特征进行冷启动处理的功能的多层感知器(Multilayer Perceptron,MLP)。多层感知器可以是一种前向结构的人工神经网络,用于映射一组输入向量(例如,词向量特征)到一组输出向量(例如,图关系特征)。其中,第一全连接层可以包含第一全连接特征矩阵,第一全连接特征矩阵的行数可以与第一词向量特征的列数相同。第二全连接层可以包含第二全连接特征矩阵,且第二全连接特征矩阵的行数可以与第一全连接特征矩阵的列数相同。计算机设备可以将目标词向量特征和第一全连接层中的第一全连接特征矩阵进行矩阵换算处理,从而可以得到目标词向量特征对应的中间向量特征。其中,中间向量特征的行数与第二全连接特征矩阵的行数相同。进一步地,计算机设备可以将中间向量特征和第二全连接层中的第二全连接特征矩阵进行矩阵换算处理,从而可以得到与冷启动节点相关联的目标图关系特征。目标图关系特征后续可以用于向用户推送与冷启动节点相匹配的且在图关系网络中的节点。本申请实施例可以将全连接层中用于对词向量特征进行冷启动处理的特征矩阵统称为全连接特征矩阵。本申请实施例可以将第一全连接层中的全连接特征矩阵称之为第一全连接特征矩阵,本申请实施例也可以将第二全连接层中的全连接特征矩阵称之为第二全连接特征矩阵。矩阵换算处理可以为矩阵相乘处理。中间向量特征可以为词向量特征(例如,目标词向量特征)和第一全连接特征矩阵进行相乘后的向量。
为便于理解,请参见图4,是本申请实施例提供的一种目标图关系特征的场景示意图。本申请实施例中的计算机设备可以为上述图1所对应实施例中的服务器10。本申请实施例中的节点冷启动模型(例如,上述图2中的节点冷启动模型3)可以包括隐藏层10、权重层20以及冷启动层30。本申请实施例中的冷启动节点可以为上述图2中的冷启动节点40a,例如,冷启动节点40a可以为商品节点。
如图4所示,计算机设备可以获取冷启动节点40a的第一属性信息(例如,品牌)和第二属性信息(例如,价格范围、…、商品种类),对冷启动节点40a的品牌、价格范围、…、商品种类分别进行编码处理,进而可以得到品牌对应的属性编码向量1(例如,[1,0,0,0])、价格范围对应的属性编码向量2(例如,[0,0,1,0,0])、…、商品种类对应的属性编码向量N(例如,[0,0,1]),这里的[1,0,0,0]可以作为第一属性信息对应的第一属性编码向量,[0,0,1,0,0]、…、[0,0,1]可以作为第二属性信息对应的第二属性编码向量。这里可以将[0,0,1]、[0,0,1,0,0]、…、[0,0,1]统称为冷启动节点40a的属性编码向量。
在隐藏层10中,计算机设备可以将与品牌对应的隐藏层确定为第一隐藏层(例如,隐藏层1),还可以将与第二属性信息(例如,价格范围、…、商品种类)对应的隐藏层确定为第二隐藏层(例如,隐藏层2、…、隐藏层N)。其中,价格范围对应的隐藏层可以为隐藏层2,以此类推,商品种类对应的隐藏层可以为隐藏层N。隐藏层1中可以包含4×embed_dim(例如,128)的第一隐藏层特征矩阵,第二隐藏层中可以包含第二隐藏层特征矩阵,例如,隐藏层2中的5×128的隐藏层特征矩阵,以此类推,隐藏层N中的3×128的隐藏层特征矩阵。
进一步地,计算机设备可以对[1,0,0,0]和4×128的第一隐藏层特征矩阵进行相乘,得到与[1,0,0,0]相关联的1×128的第一属性隐藏层向量(例如,属性隐藏层向量1),进而计算机设备可以对[0,0,1,0,0]和5×128的隐藏层特征矩阵进行相乘,得到1×128的属性隐藏层向量2,以此类推,计算机设备可以对[0,0,1]和3×128的隐藏层特征矩阵进行相乘,得到1×128的属性隐藏层向量N,这里可以将1×128的属性隐藏层向量2、…、1×128的属性隐藏层向量N统称为第二属性隐藏层向量;此时,计算机设备可以将1×128的属性隐藏层向量1、1×128的属性隐藏层向量2、…、1×128的属性隐藏层向量N确定为冷启动节点40a的属性隐藏层向量。
此时,计算机设备可以获取权重层20中的权重矩阵(例如,1×N的权重矩阵),1×N的权重矩阵可以表示为[x1,x2,…,xN]。在[x1,x2,…,xN]中,计算机设备可以确定品牌对应的第一权重系数(例如,第1列元素值x1)、价格范围对应的第二权重系数(例如,第2列元素值x2)、…、商品种类对应的第二权重系数(例如,第N列元素值xN)。
进一步地,计算机设备可以基于上述1×128的属性隐藏层向量1、1×128的属性隐藏层向量2、…、1×128的属性隐藏层向量N、第1列元素值x1、第2列元素值x2、…、第N列元素值xN,确定冷启动节点40a的目标词向量特征(例如,1×128的词向量特征)。
此时,计算机设备可以将冷启动节点40a的1×128的目标词向量特征输入至冷启动层30中,由冷启动层30输出冷启动节点的目标图关系特征(例如,1×256的图关系特征1)。
可选的,计算机设备可以获取图关系网络中具有邻居节点的目标节点,获取目标节点的属性信息。计算机设备可以获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对目标节点的属性编码向量进行向量转换处理,得到目标节点的第一词向量特征。其中,目标节点的属性编码向量是对目标节点的属性信息进行编码处理得到的。此时,计算机设备可以获取目标节点的邻居节点的属性编码向量,并基于节点冷启动模型对目标节点的邻居节点的属性编码向量进行向量转换处理,得到目标节点的邻居节点的第二词向量特征。其中,目标节点的邻居节点的属性编码向量是对目标节点的邻居节点的属性信息进行编码处理得到的。进一步地,计算机设备可以基于节点冷启动模型对目标节点的第一词向量特征和目标节点的邻居节点的第二词向量特征进行拼接处理,得到与目标节点相关联的第一图关系特征。
步骤S104,根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
具体地,计算机设备可以在图关系网络中查找与目标图关系特征相匹配的图关系特征对应的节点。若查找到的图关系特征对应的节点属于目标节点,则计算机设备可以将查找到的图关系特征对应的节点作为待推送节点,并对待推送节点进行推送。
应当理解,图关系网络中可以包含目标节点,目标节点可以为图关系网络中除冷启动节点之外的节点。目标节点的图关系特征可以是由节点冷启动模型对目标节点的第一词向量特征和目标节点的邻居节点的第二词向量特征进行拼接后所得到的。本申请实施例可以将图关系网络所包含的邻居网络中的任意一个节点(例如,目标节点)的词向量特征称之为第一词向量特征,本申请实施例还可以将上述任意一个节点的邻居节点的词向量特征称之为第二词向量特征(即邻居词向量特征)。计算机设备可以在图关系网络中查找与目标图关系特征相匹配的图关系特征(这里的图关系特征与目标图关系特征之间的匹配度大于或者等于匹配阈值,例如,80%)对应的节点。若查找到的图关系特征对应的节点属于目标节点,则计算机设备可以将查找到的图关系特征对应的节点作为待推送节点,并将待推送节点推送给用户。
为便于理解,请参见图5,是本申请实施例提供的一种待推送节点的场景示意图。本申请实施例中的计算机设备可以为上述图1所对应实施例中的用户终端集群中的任意一个用户终端。本申请实施例中的图关系网络可以为上述图2中的图关系网络1,冷启动节点可以为上述图2中的冷启动节点40a、冷启动节点40b以及冷启动节点40c中的任意一个节点,例如,冷启动节点40a。
如图5所示,计算机设备可以在上述图关系网络1中查找与冷启动节点40a的目标图关系特征(例如,上述1×256的图关系特征1)相匹配的图关系特征。比如,查找到的与冷启动节点40a的目标图关系特征相匹配的图关系特征具体可以包含:节点300a(例如,上述节点10a)的图关系特征2、节点300b(例如,上述节点20a)的图关系特征3以及节点300c(例如,上述节点20b)的图关系特征4。若查找到的节点300a、节点300b以及节点300c属于上述目标节点,则计算机设备可以将查找到的节点300a、节点300b以及节点300c作为待推送节点,并将节点300a、节点300b以及节点300c推送给用户(例如,用户1)。此时,用户1在计算机设备所显示的推送页面(例如,推送页面200)上对节点300a、节点300b以及节点300c进行查看,并在推送页面200上点击所需要购买的商品(例如,节点300a),进而用户1可以购买节点300a所对应的商品。
在本申请实施例中,计算机设备可以将图关系网络中的独立节点(即不具有邻居节点的节点)作为冷启动节点,并获取该冷启动节点的属性信息,该冷启动节点的属性信息后续可以用于确定冷启动节点的属性编码向量。进一步地,计算机设备可以获取与图关系网络相关联的节点冷启动模型(这里的节点冷启动模型为对初始模型进行训练后所得到的模型),基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,从而可以得到冷启动节点的目标词向量特征。由于节点冷启动模型具有对冷启动节点进行冷启动处理的功能,计算机设备可以基于节点冷启动模型对目标词向量特征进行冷启动处理,从而得到与冷启动节点相关联的目标图关系特征,并根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。由此可见,本申请实施例通过预先训练好的节点冷启动模型,可以在不需要获取冷启动节点的邻居节点信息的情况下,通过该节点冷启动模型中用于进行冷启动处理的冷启动框架快速预测得到冷启动节点的目标图关系特征,提高了获取图关系特征的准确度。
进一步地,请参见图6,是本申请实施例提供的一种基于图关系网络的数据处理方法的流程示意图。该方法可以由计算机设备执行,该计算机设备可以为上述图1所对应实施例中的服务器10;可选的,该计算机设备还可以为上述图1所对应实施例中的用户终端集群中的任意一个用户终端,这里将不对其进行限定,该方法可以包括步骤S201-步骤S208:
步骤S201,获取图关系网络中的第一节点对应的第一词向量特征以及第二节点对应的第二词向量特征。
具体地,计算机设备可以获取图关系网络中的第一节点的属性编码向量,并对第一节点的属性编码向量进行向量转换处理,从而可以得到第一节点对应的第一词向量特征。其中,第一节点的属性编码向量可以为对第一节点的属性信息进行编码处理所得到的向量。进一步地,计算机设备可以从图关系网络中获取与第一节点具有关联关系的至少一个邻居节点,将获取到的至少一个邻居节点作为第二节点。此时,计算机设备可以对第二节点中的每个邻居节点的属性编码向量进行向量转换处理,从而可以得到每个邻居节点的待处理词向量特征。其中,每个邻居节点的属性编码向量可以为对每个邻居节点的属性信息进行编码处理所得到的向量。进一步地,计算机设备可以对每个邻居节点的待处理词向量特征进行聚合处理,从而可以得到第二节点对应的第二词向量特征。本申请实施例可以将第二节点中每个邻居节点的词向量特征统称为待处理词向量特征。
应当理解,计算机设备可以对第一节点的属性信息进行编码处理,得到第一节点的属性编码向量。计算机设备可以获取初始模型的隐藏层中与第一节点的属性编码向量相关联的隐藏层特征矩阵,并基于隐藏层特征矩阵和第一节点的属性编码向量,确定第一节点的属性隐藏层向量。其中,隐藏层特征矩阵对应的行数与第一节点的属性编码向量对应的列数相同。初始模型还可以包含权重层和冷启动层。进一步地,计算机设备可以获取初始模型的权重层中的权重矩阵,并基于权重矩阵确定第一节点的属性信息对应的权重系数。此时,计算机设备可以基于第一节点的属性隐藏层向量以及权重矩阵中第一节点的属性信息对应的权重系数,从而可以确定第一节点对应的第一词向量特征。
为便于理解,请参见图7,是本申请实施例提供的一种第一节点对应的第一词向量特征的场景示意图。本申请实施例中的计算机设备可以为上述图1中的服务器10,图关系网络可以为上述图2中的图关系网络1,图关系网络1中的第一节点可以为邻居网络2中的任意一个节点(例如,节点10a)。
如图7所示,计算机设备可以获取节点10a的属性信息(例如,属性1、属性2、…、属性N)。例如,属性1可以为节点10a对应的品牌,属性2可以为节点10a对应的价格范围,…,属性N可以为节点10a对应的商品种类。进一步地,计算机设备可以对节点10a对应的品牌进行编码处理,得到该品牌对应的属性编码向量1(例如,[1,0,0,0])。计算机设备可以对节点10a对应的价格范围进行编码处理,得到该价格范围对应的属性编码向量2(例如,[0,0,1,0,0])。以此类推,计算机设备可以对节点10a对应的商品种类进行编码处理,得到该商品种类对应的属性编码向量N(例如,[0,0,1])。
进一步地,计算机设备可以获取上述初始模型的隐藏层1中与节点10a的[1,0,0,0]相关联的隐藏层特征矩阵1,例如,4×embed_dim(例如,128)的隐藏层特征矩阵。此时,计算机设备可以将[1,0,0,0]和4×128的隐藏层特征矩阵1进行相乘,进而得到节点10a的1×128的属性隐藏层向量1。计算机设备可以获取上述初始模型的隐藏层2中与节点10a的[0,0,1,0,0]相关联的隐藏层特征矩阵2,例如,5×embed_dim(例如,128)的隐藏层特征矩阵。此时,计算机设备可以将[0,0,1,0,0]和5×128的隐藏层特征矩阵2进行相乘,从而可以得到节点10a的1×128的属性隐藏层向量2。以此类推,计算机设备可以获取上述初始模型的隐藏层N中与节点10a的[0,0,1]相关联的隐藏层特征矩阵N,例如,3×embed_dim(例如,128)的隐藏层特征矩阵。此时,计算机设备可以将[0,0,1]和3×128的隐藏层特征矩阵N进行相乘,从而可以得到节点10a的1×128的属性隐藏层向量N。
进一步地,计算机设备可以获取初始模型的权重层中的权重矩阵(例如,1×N的权重矩阵),例如,1×N的权重矩阵可以为[x1,x2,…,xN]。在[x1,x2,…,xN]中,计算机设备可以确定节点10a的品牌对应的权重系数1为第1列矩阵元素值x1、节点10a的价格范围对应的权重系数2为第2列矩阵元素值x2、…、节点10a的商品种类对应的权重系数N为第N列矩阵元素值xN
此时,计算机设备可以基于1×128的属性隐藏层向量1、1×128的属性隐藏层向量2、…、1×128的属性隐藏层向量N、权重系数1(即第1列矩阵元素值x1)、权重系数2(即第2列矩阵元素值x2)、…、权重系数N(即第N列矩阵元素值xN),确定节点10a对应的1×embed_dim(例如,128)的第一词向量特征,并由权重层输出节点10a对应的1×128第一词向量特征。
进一步地,计算机设备可以从图关系网络中获取与第一节点具有关联关系的至少一个邻居节点,将获取到的至少一个邻居节点作为第二节点。此时,计算机设备可以对第二节点中的每个邻居节点的属性信息进行编码处理,得到每个邻居节点的属性编码向量,进而对每个邻居节点的属性编码向量进行向量转换处理,从而可以得到每个邻居节点的待处理词向量特征。进一步地,计算机设备可以通过聚合函数对每个邻居节点的待处理词向量特征进行聚合处理,从而可以得到第二节点对应的第二词向量特征。其中,聚合函数可以包括但不限于:均值聚合器(Mean Aggregator)对应的聚合函数、池聚合器(PoolingAggregator)对应的聚合函数以及LSTM聚合器(Long Short-Term Memory Aggregator,LSTM Aggregator)对应的聚合函数。
例如,计算机设备可以从上述图关系网络1中获取与节点10a具有关联关系的至少一个邻居节点(例如,节点20a和节点20b),将获取到的节点20a和节点20b作为第二节点。计算机设备可以对第二节点中的节点20a的属性信息进行编码处理,得到节点20a的属性编码向量,并对节点20a的属性编码向量进行向量转换处理,进而可以得到节点20a对应的待处理词向量特征1。计算机设备可以对第二节点中的节点20b的属性信息进行编码处理,得到节点20b的属性编码向量,并对节点20b的属性编码向量进行向量转换处理,进而可以得到节点20b对应的待处理词向量特征2。此时,计算机设备可以对通过聚合函数对待处理词向量特征1和待处理词向量特征2进行聚合处理,从而可以得到第二节点对应的第二词向量特征(例如,1×128的第二词向量特征)。
步骤S202,将第一词向量特征和第二词向量特征进行拼接处理,得到第一节点的第一图关系特征向量。
具体地,计算机设备可以通过拼接函数对第一词向量特征和第二词向量特征进行拼接处理,从而可以得到第一节点的第一图关系特征向量。例如,计算机设备可以通过拼接函数对上述1×128的第一词向量特征和上述1×128的第二词向量特征进行拼接处理,从而可以得到上述节点10a的1×256的第一图关系特征向量。
步骤S203,获取与第一节点相关联的正样本节点对应的第一样本关系向量,以及与第一节点相关联的负样本节点对应的第二样本关系向量。
应当理解,正样本节点可以为图关系网络中与第一节点具有边连接关系(或者边的权重值较大)的节点,负样本节点可以为图关系网络中与第一节点不具有边连接关系(或者边的权重值很小)的节点。在采样到一个与第一节点相关联的正样本节点时,计算机设备可以同时采样Q个与第一节点相关联的负样本节点,Q可以为大于1的正整数。本申请实施例可以将正样品节点的词向量特征称之为第一样本关系向量,本申请实施例还可以将负样品节点的词向量特征称之为第二样本关系向量。
应当理解,计算机设备可以获取与第一节点相关联的正样本节点对应的第一样本关系向量。具体地,计算机设备可以从图关系网络中获取与第一节点相关联的正样本节点,对正样本节点的属性信息进行编码处理,得到正样品节点对应的属性编码向量。进一步地,计算机设备可以获取上述初始模型的隐藏层中与正样品节点的属性编码向量相关联的隐藏层特征矩阵,并基于隐藏层特征矩阵和正样品节点的属性编码向量,确定正样品节点的属性隐藏层向量。其中,隐藏层特征矩阵对应的行数与正样品节点的属性编码向量对应的列数相同。此时,计算机设备可以获取初始模型的权重层中的权重矩阵,并基于权重矩阵确定正样品节点的属性信息对应的权重系数。进一步地,计算机设备可以基于正样品节点的属性隐藏层向量以及正样品节点的属性信息对应的权重系数,从而可以确定正样品节点的第一词向量特征。计算机设备可以从图关系网络中获取正样品节点的至少一个邻居节点,对正样品节点的每个邻居节点的属性编码向量进行向量转换处理,得到正样品节点的每个邻居节点的待处理向量特征;计算机设备可以对正样品节点的每个邻居节点的待处理向量特征进行聚合处理,得到正样品节点的至少一个邻居节点对应的第二词向量特征;计算机设备可以对正样品节点的第一词向量特征以及正样品节点的至少一个邻居节点对应的第二词向量特征进行拼接处理,从而可以得到正样品节点对应的第一样本关系向量。
进一步地,计算机设备可以获取与第一节点相关联的负样本节点对应的第二样本关系向量。具体地,计算机设备可以从图关系网络中获取与第一节点相关联的负样品节点,对负样品节点的属性信息进行编码处理,得到负样品节点对应的属性编码向量。计算机设备可以获取上述初始模型的隐藏层中与负样品节点的属性编码向量相关联的隐藏层特征矩阵,并基于隐藏层特征矩阵和负样品节点的属性编码向量,确定负样品节点的属性隐藏层向量。其中,隐藏层特征矩阵对应的行数与负样品节点的属性编码向量对应的列数相同。进一步地,计算机设备可以获取初始模型的权重层中的权重矩阵,并基于权重矩阵确定正样品节点的属性信息对应的权重系数。此时,计算机设备可以基于负样品节点的属性隐藏层向量以及权重矩阵中负样品节点的属性信息对应的权重系数,从而可以确定正样品节点的第一词向量特征。计算机设备可以从图关系网络中获取负样品节点的至少一个邻居节点,对负样品节点的每个邻居节点的属性编码向量进行向量转换处理,得到负样品节点的每个邻居节点的待处理向量特征;计算机设备可以对负样品节点的每个邻居节点的待处理向量特征进行聚合处理,得到负样品节点的至少一个邻居节点对应的第二词向量特征;计算机设备可以对负样品节点的第一词向量特征以及负样品节点的至少一个邻居节点对应的第二词向量特征进行拼接处理,从而可以确定负样品节点对应的第二样本关系向量。
步骤S204,在获取到与图关系网络相关联的初始模型时,根据第一词向量特征、第一图关系特征向量、第一样本关系向量以及第二样本关系向量,对初始模型进行训练,得到用于对冷启动节点进行冷启动处理的节点冷启动模型。
具体地,在获取到与图关系网络相关联的初始模型时,计算机设备可以确定初始模型中的冷启动层。其中,冷启动层可以包含对第一词向量特征进行冷启动处理的第一全连接层和第二全连接层。进一步地,计算机设备可以基于第一全连接层和第二全连接层,对第一词向量特征进行冷启动处理,从而可以得到第一词向量特征对应的第一冷启动向量特征。计算机设备可以基于第一冷启动向量特征、第一图关系特征向量、第一样本关系向量和第二样本关系向量,对初始模型进行训练。在检测到训练后的初始模型满足模型收敛条件时,计算机设备可以将满足模型收敛条件的初始模型确定为用于对冷启动节点进行冷启动处理的节点冷启动模型。本申请实施例可以将第一节点的第一词向量特征进行冷启动处理后所得到的向量称之为第一冷启动向量特征。
可以理解的是,在获取到与图关系网络相关联的初始模型时,计算机设备可以确定初始模型中的冷启动层。其中,冷启动层可以包含对第一词向量特征进行冷启动处理的第一全连接层和第二全连接层。第一全连接层可以包含第一全连接特征矩阵,第一全连接特征矩阵的行数可以与第一节点的第一词向量特征的列数相同。第二全连接层可以包含第二全连接特征矩阵,且第二全连接特征矩阵的行数可以与第一全连接特征矩阵的列数相同。
此时,计算机设备可以将第一词向量特征和第一全连接层中的第一全连接特征矩阵进行矩阵换算处理,从而可以得到第一词向量特征对应的中间向量特征。其中,中间向量特征的行数与第二全连接特征矩阵的行数相同。此时,计算机设备可以将中间向量特征和第二全连接层中的第二全连接特征矩阵进行矩阵换算处理,从而可以得到中间向量特征对应的第一冷启动向量特征。其中,第一冷启动向量特征的列数可以与第二全连接特征矩阵的列数相同,且第一冷启动向量特征的列数可以与第一图关系特征向量的列数相同。
进一步地,计算机设备可以基于第一冷启动向量特征、第一图关系特征向量、第一样本关系向量和第二样本关系向量,对初始模型进行训练。具体地,计算机设备可以获取与图关系网络相关联的模型收敛条件。其中,模型收敛条件可以包含第一收敛条件和第二收敛条件。第一收敛条件可以为与冷启动层相关联的冷启动损失值达到冷启动损失阈值时的条件。第二收敛条件可以为与初始模型相关联的模型损失值达到模型损失阈值时的条件。此时,计算机设备可以基于第一图关系特征向量和第一冷启动向量特征,从而可以确定与第一节点相关联的冷启动损失值。计算机设备可以基于第一图关系特征向量、第一样本关系向量以及第二样本关系向量,从而可以确定与第一节点相关联的模型损失值。此时,计算机设备可以基于模型损失值和冷启动损失值,对初始模型进行训练,从而可以得到模型训练结果。若模型训练结果指示模型损失值达到第二收敛条件中的模型损失阈值,且冷启动损失值达到第一收敛条件中的冷启动损失阈值,则计算机设备可以确定训练后的初始模型满足模型收敛条件。
应当理解,计算机设备可以获取与图关系网络相关联的模型收敛条件。本申请实施例可以将在初始模型的冷启动层训练的过程中,冷启动损失值基本不变时的冷启动损失值称之为冷启动损失阈值。本申请实施例还可以将初始模型训练过程中的模型损失值基本不变时的模型损失值称之为模型损失阈值。
进一步地,计算机设备可以基于第一图关系特征向量和第一冷启动向量特征,从而可以确定与第一节点相关联的冷启动损失值。具体地,计算机设备可以对第一图关系特征向量进行转置处理,从而可以得到第一图关系特征向量对应的第一转置向量。此时,计算机设备可以对第一转置向量和第一冷启动向量特征分别进行二范数处理,从而可以得到第一转置向量对应的第一待处理二范数以及第一冷启动向量特征对应的第二待处理二范数。计算机设备可以基于第一待处理二范数和第二待处理二范数,从而可以确定与第一节点相关联的冷启动损失值。本申请实施例可以将第一图关系特征向量对应的转置向量称之为第一转置向量。本申请实施例可以将对第一转置向量进行二范数处理后所得到的数值称之为第一待处理二范数。本申请实施例还可以将对第一冷启动向量特征进行二范数处理后所得到的数值称之为第二待处理二范数。应当理解,计算机设备确定待处理二范数的公式可以为下述公式(2)所示:
Hv′=L2(Hv), (2)
其中,对于图关系网络中的节点v而言,Hv可以为节点v的图关系特征向量,Hv′可以为节点v的图关系特征向量所对应的待处理二范数。
计算机设备确定冷启动损失值的冷启动损失函数可以如下述公式(3)所示:
Figure BDA0002499803550000261
其中,Lcool可以为冷启动损失值,对于图关系网络中的节点v而言,HvT可以为基于上述公式(2)所确定的节点v的第一转置向量
Figure BDA0002499803550000263
对应的第一待处理二范数,Hvcool可以为基于上述公式(2)所确定的节点v的第一冷启动向量特征
Figure BDA0002499803550000262
对应的第二待处理二范数。
为便于理解,请参见图8,是本申请实施例提供的一种第一冷启动向量特征的场景示意图。本申请实施例中的计算机设备可以为上述图1中的服务器10,图关系网络可以为上述图2中的图关系网络1,图关系网络1中的第一节点可以为上述邻居网络2中的任意一个节点(例如,节点10a)。
上述初始模型中的冷启动层可以包含对节点10a的1×embed_dim(例如,128)的第一词向量特征进行冷启动处理的第一全连接层(例如,全连接层1)和第二全连接层(例如,全连接层2)。全连接层1中可以包含第一全连接特征矩阵,例如,128×embed_dim1(例如,64)的第一全连接特征矩阵。全连接层2中可以包含第二全连接特征矩阵,例如,64×(2×embed_dim)(例如,256)的第二全连接特征矩阵。
如图8所示,计算机设备可以将1×128的第一词向量特征输入至全连接层中,并对1×128的第一词向量特征和全连接层1中的128×64的第一全连接特征矩阵进行矩阵换算处理(即进行矩阵相乘),从而可以得到1×128的第一词向量特征对应的1×64的中间向量特征。进一步地,计算机设备可以将1×64的中间向量特征和全连接层2中的64×256的第二全连接特征矩阵进行矩阵换算处理,由全连接层2输出1×64的中间向量特征对应的1×(2×embed_dim)(例如,256)的第一冷启动向量特征。
此时,计算机设备可以基于1×256的第一冷启动向量特征以及上述1×256的第一图关系特征向量,并根据上述冷启动损失函数(即上述公式(3))确定与节点10a相关联的冷启动损失值,这里的与节点10a相关联的冷启动损失值后续可以用于对上述初始模型进行训练。
进一步地,计算机设备可以基于第一图关系特征向量、第一样本关系向量以及第二样本关系向量,从而可以确定与第一节点相关联的模型损失值。应当理解,计算机设备确定与第一节点相关联的模型损失值的NCE损失函数(Noi se-Constrastive EstimationLoss)可以如下述公式(4)所示:
Figure BDA0002499803550000271
其中,对于图关系网络中的节点v而言,J(Hv)可以为与节点v(例如,第一节点)相关联的模型损失值,Hv可以为节点v的第一图关系特征向量,
Figure BDA0002499803550000272
可以为Hv对应的转置向量,Hu可以为节点u(例如,正样品节点)的第一样本关系向量,um~Pm(u)可以表示负采样,
Figure BDA0002499803550000273
可以为节点um(例如,负样品节点)的第二样本关系向量,节点um可以是从节点v对应的负采样分布Pm中所采样到的负样本节点,Q可以为负样本节点的个数。
此时,计算机设备可以基于模型损失值和冷启动损失值,对初始模型进行训练,从而可以得到模型训练结果。若模型训练结果指示模型损失值达到第二收敛条件中的模型损失阈值,且冷启动损失值达到第一收敛条件中的冷启动损失阈值,则计算机设备可以确定训练后的初始模型满足模型收敛条件。应当理解,在训练后的初始模型同时满足第一收敛条件和第二收敛条件时,计算机设备可以确定训练后的初始模型满足模型收敛条件。在检测到训练后的初始模型满足模型收敛条件时,计算机设备可以将满足模型收敛条件的初始模型确定为用于对冷启动节点进行冷启动处理的节点冷启动模型。
可选的,模型训练结果可以包含具有第一模型损失值和第一冷启动损失值的第一模型训练结果。若第一模型训练结果指示第一模型损失值达到第二收敛条件中的模型损失阈值,且第一冷启动损失值未达到第一收敛条件中的冷启动损失阈值(即表明了训练后的初始模型不满足模型收敛条件),则计算机设备可以将第一全连接特征矩阵和第二全连接特征矩阵确定为与冷启动层相关联的第一待调整参数,并将隐藏层的模型参数和权重层的模型参数作为与第一模型损失值相匹配的第一模型参数。本申请实施例可以将隐藏层中的隐藏层特征矩阵称之为隐藏层的模型参数,本申请实施例还可以将权重层中的权重矩阵称之为权重层的模型参数。这样,本申请实施例可以将隐藏层中的隐藏层特征矩阵以及权重层中的权重矩阵统称为第一模型参数。本申请实施例可以将第一全连接特征矩阵和第二全连接特征矩阵统称为第一待调整参数。由于第一模型训练结果指示第一模型损失值达到第二收敛条件中的模型损失阈值,且第一冷启动损失值未达到第一收敛条件中的冷启动损失阈值,计算机设备可以停止更新第一模型损失值以及调整第一模型参数(表明了隐藏层中的隐藏层特征矩阵以及权重层中的权重矩阵已经确定并且不再进行调整),只需要继续更新冷启动损失值以及调整第一待调整参数(表明了第一全连接特征矩阵和第二全连接特征矩阵还需要继续调整)。
此时,计算机设备可以基于第一冷启动损失值,对第一待调整参数进行调整,从而可以得到与冷启动层相关联的第二待调整参数,并将携带第一模型参数和第二待调整参数的初始模型作为过渡模型。应当理解,计算机设备可以对第一冷启动损失值进行求导,并进行梯度反传,从而可以得到第一待调整参数的梯度值,进而计算机设备可以根据第一待调整参数的梯度值对第一待调整参数进行调整,得到与冷启动层相关联的第二待调整参数,并将携带第一模型参数和第二待调整参数的初始模型作为过渡模型。
进一步地,计算机设备可以基于第一模型参数对应的第一词向量特征和第二待调整参数,确定第一词向量特征对应的第二冷启动向量特征。本申请实施例可以将基于第一模型参数和第二待调整参数对第一词向量特征进行冷启动处理后所得到的向量称之为第二冷启动向量特征。此时,计算机设备可以基于第一模型参数对应的第一图关系特征向量和第二冷启动向量特征,更新与第一节点相关联的冷启动损失值,直到更新后的冷启动损失值达到第二收敛条件中的模型损失阈值时,确定训练后的过渡模型满足模型收敛条件。在检测到训练后的过渡模型满足模型收敛条件时,计算机设备可以将满足模型收敛条件的过渡模型确定为用于对冷启动节点进行冷启动处理的节点冷启动模型。
步骤S205,将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息。
步骤S206,获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征。
步骤S207,基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征。
步骤S208,根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
其中,该步骤S205-步骤S208的具体实施方式可参见上述图3所对应实施例中对步骤S101-步骤S104的描述,这里将不再赘述。
在本申请实施例中,计算机设备可以将图关系网络中的独立节点(即不具有邻居节点的节点)作为冷启动节点,并获取该冷启动节点的属性信息,该冷启动节点的属性信息后续可以用于确定冷启动节点的属性编码向量。进一步地,计算机设备可以获取与图关系网络相关联的节点冷启动模型(这里的节点冷启动模型为对初始模型进行训练后所得到的模型),基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,从而可以得到冷启动节点的目标词向量特征。由于节点冷启动模型具有对冷启动节点进行冷启动处理的功能,计算机设备可以基于节点冷启动模型对目标词向量特征进行冷启动处理,从而得到与冷启动节点相关联的目标图关系特征,并根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。由此可见,本申请实施例通过预先训练好的节点冷启动模型,可以在不需要获取冷启动节点的邻居节点信息的情况下,通过该节点冷启动模型中用于进行冷启动处理的冷启动框架快速预测得到冷启动节点的目标图关系特征,提高了获取图关系特征的准确度。
进一步地,请参见图9,是本申请实施例提供的一种训练初始模型得到节点冷启动模型的框架示意图。本申请实施例中的节点冷启动模型(这里的节点冷启动模型可以为对初始模型进行训练后所得到的模型)可以运行于计算机设备中,该计算机设备可以为上述图1所对应实施例中的服务器10;可选的,该计算机设备还可以为上述图1所对应实施例中的用户终端集群中的任意一个用户终端,这里将不对其进行限定。本申请实施例中的初始模型可以包含隐藏层10、权重层20以及冷启动层30。这里的初始模型可以为对GraghSAGE算法或者其它归纳式图学习算法(例如,PinSAGE算法)进行改进后所得到的模型,即该初始模型相对于GraghSAGE算法而言,添加了隐藏层10、权重层20以及冷启动层30。
如图9所示,以图关系网络(如上述图2中的图关系网络1所示)中的第一节点(例如,节点A)为例,计算机设备可以从图关系网络1中获取与节点A(如上述节点10a所示)具有关联关系的至少一个邻居节点(例如,节点B和节点C),将获取到的节点B(如上述节点20a所示)和节点C(例如,上述节点20b)作为第二节点。计算机设备可以获取节点A的属性编码向量、节点B的属性编码向量以及节点C的属性编码向量。其中,节点A的属性编码向量可以为计算机设备对节点A的属性信息(例如,属性1、属性2、…、属性N)进行编码处理后所得到的,节点A的属性编码向量可以包含属性1对应的属性编码向量1、属性2对应的属性编码向量2、…、属性N对应的属性编码向量N。
计算机设备可以将节点A的属性编码向量(例如,属性编码向量1、属性编码向量2、…、属性编码向量N)输入至初始模型中的隐藏层10中,由隐藏层10输出节点A的属性隐藏层向量。其中,隐藏层10可以用于将节点(例如,节点A)的不同属性信息从单一数值转化为高维度特征。其中,隐藏层10中可以包含多个隐藏层,例如,与上述属性编码向量1相匹配的隐藏层1(这里的隐藏层1中可以包含隐藏层特征矩阵1),与上述属性编码向量2相匹配的隐藏层2(这里的隐藏层2中可以包含隐藏层特征矩阵2),…,与上述属性编码向量N相匹配的隐藏层N(这里的隐藏层N中可以包含隐藏层特征矩阵N)。应当理解,计算机设备可以根据节点A的属性编码向量1和隐藏层特征矩阵1,确定节点A的属性隐藏层向量1,根据节点A的属性编码向量1和隐藏层特征矩阵2,确定节点A的属性隐藏层向量2,以此类推,根据节点A的属性编码向量N和隐藏层特征矩阵N,确定节点A的属性隐藏层向量N,进而计算机设备可以将属性隐藏层向量1、属性隐藏层向量2、…、属性隐藏层向量N作为节点A的属性隐藏层向量并进行输出。
进一步地,计算机设备可以将节点A的属性隐藏层向量输入至初始模型中的权重层20中,由权重层20输出节点A的第一词向量特征。由于节点的不同属性信息会影响节点的连接方式,因此,权重层20可以用于学习不同属性的重要程度。应当理解,计算机设备可以获取权重层20中的权重矩阵,并根据该权重矩阵确定节点A的属性信息对应的权重系数(例如,属性1对应的权重系数1、属性2对应的权重系数2、…、属性N对应的权重系数N),进而计算机设备可以基于节点A的属性隐藏层向量1、属性隐藏层向量2、…、属性隐藏层向量N、权重系数1、权重系数2、…、权重系数N,确定节点A的第一词向量特征并进行输出。
此时,计算机设备可以将节点A的第一词向量特征输入至初始模型的冷启动层30中,由冷启动层30输出节点A的第一冷启动向量特征。其中,冷启动层30可以包含多层全连接层或者多层感知器,例如,第一全连接层和第二全连接层。应当理解,计算机设备可以基于第一全连接层和第二全连接层,确定节点A的第一冷启动向量特征并进行输出。冷启动层30的作用在于将节点的第一词向量特征输入至冷启动层30中,可以通过对多层全连接层或者多层感知器进行训练,从而可以使得冷启动层30所输出的节点的冷启动向量特征与节点的图关系特征接近。
进一步地,计算机设备可以对第二节点中的节点B的属性编码向量和节点C的属性编码向量分别进行向量转换处理,得到节点B的待处理词向量特征和节点C的待处理词向量特征,进而计算机设备可以对节点B的待处理词向量特征和节点C的待处理词向量特征进行聚合处理,得到节点A邻居节点(即上述节点B和节点C)的第二词向量特征。此时,计算机设备可以对节点A的第一词向量特征和节点A邻居节点的第二词向量特征进行拼接处理,得到节点A的第一图关系特征向量。进一步地,计算机设备可以获取与节点A相关联的正样本节点对应的第一样本关系向量,以及获取与节点A相关联的负样本节点对应的第二样本关系向量。
进一步地,计算机设备可以基于第一图关系特征向量和第一冷启动向量特征,并通过上述冷启动损失函数(如上述公式(3)所示)确定与节点A相关联的冷启动损失值。计算机设备可以基于第一图关系特征向量、第一样本关系向量以及第二样本关系向量,并通过上述NCE损失函数(如上述公式(4)所示)确定与第一节点相关联的模型损失值。此时,计算机设备可以基于冷启动损失值和模型损失值对上述初始模型进行训练,得到用于对冷启动节点进行冷启动处理的节点冷启动模型。
此时,计算机设备可以将冷启动节点输入至节点冷启动模型,通过节点冷启动模型对冷启动节点进行冷启动处理,并由节点冷启动模型输出冷启动节点的目标图关系特征。这样,本申请实施例可以不需要冷启动节点的邻居节点,只需要利用冷启动节点的目标词向量特征和冷启动层30,便可以得到冷启动节点的目标图关系特征,提高了获取图关系特征的准确度。
进一步地,请参见图10,是本申请实施例提供的一种基于图关系网络的数据处理装置的结构示意图。该基于图关系网络的数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如,该基于图关系网络的数据处理装置为一个应用软件;该基于图关系网络的数据处理装置可以用于执行本申请实施例提供的方法中的相应步骤。如图10所示,该基于图关系网络的数据处理装置1可以运行于计算机设备,该计算机设备可以为上述图1所对应实施例中的服务器10。该基于图关系网络的数据处理装置1可以包括:第二获取模块10、拼接处理模块11、第三获取模块12、模型训练模块13、参数确定模块14、参数调整模块15、第一确定模块16、第二确定模块17、第一获取模块18、向量转换模块19、冷启动处理模块20以及推送模块21。
该第一获取模块18,用于将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息。
该向量转换模块19,用于获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征;冷启动节点的属性编码向量是对冷启动节点的属性信息进行编码处理后所得到的。
其中,该向量转换模块19包括:第三获取单元191、属性编码单元192、第二确定单元193以及第三确定单元194。
第三获取单元191,用于获取与图关系网络相关联的节点冷启动模型;
属性编码单元192,用于对冷启动节点的属性信息进行编码处理,得到冷启动节点的属性编码向量。
第二确定单元193,用于获取节点冷启动模型中与冷启动节点的属性编码向量相关联的隐藏层特征矩阵,基于隐藏层特征矩阵和冷启动节点的属性编码向量,确定冷启动节点的属性隐藏层向量;隐藏层特征矩阵对应的行数与冷启动节点的属性编码向量对应的列数相同。
其中,冷启动节点的属性信息包含第一属性信息和第二属性信息;冷启动节点的属性编码向量包含第一属性信息对应的第一属性编码向量和第二属性信息对应的第二属性编码向量;节点冷启动模型包含用于对冷启动节点的属性编码向量进行向量转换功能的隐藏层;
第二确定单元193包括:第四确定子单元1931、第五确定子单元1932、第六确定子单元1933以及第七确定子单元1934。
第四确定子单元1931,用于在节点冷启动模型的隐藏层中,将与第一属性信息对应的隐藏层确定为第一隐藏层,将与第二属性信息对应的隐藏层确定为第二隐藏层;第一隐藏层中包含第一隐藏层特征矩阵,第一隐藏层特征矩阵的行数与第一属性编码向量的列数相同;第二隐藏层中包含第二隐藏层特征矩阵,第二隐藏层特征矩阵的行数与第二属性编码向量的列数相同;第一隐藏层特征矩阵的列数和第二隐藏层特征矩阵的列数相同;
第五确定子单元1932,用于基于第一属性编码向量和第一隐藏层中的第一隐藏层特征矩阵,确定与第一属性编码向量相关联的第一属性隐藏层向量;
第六确定子单元1933,用于基于第二属性编码向量和第二隐藏层中的第二隐藏层特征矩阵,确定与第二属性编码向量相关联的第二属性隐藏层向量;第二属性隐藏层向量与第一属性隐藏层向量具有相同的行数和列数;
第七确定子单元1934,用于将第一属性隐藏层向量与第二属性隐藏层向量确定为冷启动节点的属性隐藏层向量。
其中,该第四确定子单元1931、第五确定子单元1932、第六确定子单元1933以及第七确定子单元1934的具体实现方式可以参见上述图3所对应实施例中对步骤S102的描述,这里将不再继续进行赘述。
第三确定单元194,用于基于冷启动节点的属性隐藏层向量以及冷启动节点的属性信息对应的权重系数,确定冷启动节点的目标词向量特征。
其中,节点冷启动模型中包含用于对冷启动节点的属性隐藏层向量进行加权处理的权重层;
第三确定单元194包括:第二获取子单元1941和第八确定子单元1942。
第二获取子单元1941,用于获取节点冷启动模型中的权重层的权重矩阵;权重矩阵包含第一属性信息对应的第一权重系数以及第二属性信息对应的第二权重系数;
第八确定子单元1942,用于基于第一属性隐藏层向量、第二属性隐藏层向量、第一权重系数以及第二权重系数,确定目标节点对应的目标词向量特征。
其中,该第二获取子单元1941和第八确定子单元1942的具体实现方式可以参见上述图3所对应实施例中对步骤S102的描述,这里将不再继续进行赘述。
其中,该第三获取单元191、属性编码单元192、第二确定单元193以及第三确定单元194的具体实现方式可以参见上述图3所对应实施例中对步骤S102的描述,这里将不再继续进行赘述。
该冷启动处理模块20,用于基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征。
该推送模块21,用于根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
其中,图关系网络中包含目标节点;目标节点为图关系网络中除冷启动节点之外的节点;目标节点的图关系特征是由节点冷启动模型对目标节点的第一词向量特征和目标节点的邻居节点的第二词向量特征进行拼接后所得到的;
推送模块21包括:查找单元211和推送单元212。
查找单元211,用于在图关系网络中查找与目标图关系特征相匹配的图关系特征对应的节点;
推送单元212,用于若查找到的图关系特征对应的节点属于目标节点,则将查找到的图关系特征对应的节点作为待推送节点,对待推送节点进行推送。
其中,该查找单元211和推送单元212的具体实现方式可以参见上述图3所对应实施例中对步骤S104的描述,这里将不再继续进行赘述。
其中,上述基于图关系网络的数据处理装置1还包括:
该第二获取模块10,用于获取图关系网络中的第一节点对应的第一词向量特征以及第二节点对应的第二词向量特征;第二节点为与第一节点具有关联关系的至少一个邻居节点。
其中,该第二获取模块10包括:第一向量转换单元101、第一获取单元102、第二向量转换单元103以及聚合处理单元104。
第一向量转换单元101,用于获取图关系网络中的第一节点的属性编码向量,对第一节点的属性编码向量进行向量转换处理,得到第一节点对应的第一词向量特征;第一节点的属性编码向量是对第一节点的属性信息进行编码处理所得到的;
第一获取单元102,用于从图关系网络中获取与第一节点具有关联关系的至少一个邻居节点,将获取到的至少一个邻居节点作为第二节点;
第二向量转换单元103,用于对第二节点中的每个邻居节点的属性编码向量进行向量转换处理,得到每个邻居节点的待处理词向量特征;每个邻居节点的属性编码向量是对每个邻居节点的属性信息进行编码处理所得到的;
聚合处理单元104,用于对每个邻居节点的待处理词向量特征进行聚合处理,得到第二节点对应的第二词向量特征。
其中,该第一向量转换单元101、第一获取单元102、第二向量转换单元103以及聚合处理单元104的具体实现方式可以参见上述图6所对应实施例中对步骤S201的描述,这里将不再继续进行赘述。
该拼接处理模块11,用于将第一词向量特征和第二词向量特征进行拼接处理,得到第一节点的第一图关系特征向量。
该第三获取模块12,用于获取与第一节点相关联的正样本节点对应的第一样本关系向量,以及与第一节点相关联的负样本节点对应的第二样本关系向量;正样本节点为图关系网络中与第一节点具有边连接关系的节点;负样本节点为图关系网络中与第一节点不具有边连接关系的节点。
该模型训练模块13,用于在获取到与图关系网络相关联的初始模型时,根据第一词向量特征、第一图关系特征向量、第一样本关系向量和第二样本关系向量,对初始模型进行训练,得到用于对冷启动节点进行冷启动处理的节点冷启动模型。
其中,该模型训练模块13包括:第一确定单元131、冷启动处理单元132、模型训练单元133以及模型确定单元134。
第一确定单元131,用于在获取到与图关系网络相关联的初始模型时,确定初始模型中的冷启动层;冷启动层包含对第一词向量特征进行冷启动处理的第一全连接层和第二全连接层。
冷启动处理单元132,用于基于第一全连接层和第二全连接层,对第一词向量特征进行冷启动处理,得到第一词向量特征对应的第一冷启动向量特征。
其中,第一全连接层包含第一全连接特征矩阵;第一全连接特征矩阵的行数与第一词向量特征的列数相同;第二全连接层包含第二全连接特征矩阵,且第二全连接特征矩阵的行数与第一全连接特征矩阵的列数相同;
冷启动处理单元132包括:第一矩阵换算子单元1321和第二矩阵换算子单元1322。
第一矩阵换算子单元1321,用于将第一词向量特征和第一全连接层中的第一全连接特征矩阵进行矩阵换算处理,得到第一词向量特征对应的中间向量特征;中间向量特征的行数与第二全连接特征矩阵的行数相同;
第二矩阵换算子单元1322,用于将中间向量特征和第二全连接层中的第二全连接特征矩阵进行矩阵换算处理,得到中间向量特征对应的第一冷启动向量特征;第一冷启动向量特征的列数与第二全连接特征矩阵的列数相同,且第一冷启动向量特征的列数与第一图关系特征向量的列数相同。
其中,该第一矩阵换算子单元1321和第二矩阵换算子单元1322的具体实现方式可以参见上述图6所对应实施例中对步骤S204中的第一冷启动向量特征的描述,这里将不再继续进行赘述。
模型训练单元133,用于基于第一冷启动向量特征、第一图关系特征向量、第一样本关系向量和第二样本关系向量,对初始模型进行训练。
其中,模型训练单元133包括:第一获取子单元1331、第一确定子单元1332、第二确定子单元1333、模型训练子单元1334以及第三确定子单元1335。
第一获取子单元1331,用于获取与图关系网络相关联的模型收敛条件;模型收敛条件包含第一收敛条件和第二收敛条件;第一收敛条件为与冷启动层相关联的冷启动损失值达到冷启动损失阈值时的条件;第二收敛条件为与初始模型相关联的模型损失值达到模型损失阈值时的条件;
第一确定子单元1332,用于基于第一图关系特征向量和第一冷启动向量特征,确定与第一节点相关联的冷启动损失值;
其中,第一确定子单元1332还用于:
对第一图关系特征向量进行转置处理,得到第一图关系特征向量对应的第一转置向量;
对第一转置向量和第一冷启动向量特征分别进行二范数处理,得到第一转置向量对应的第一待处理二范数以及第一冷启动向量特征对应的第二待处理二范数;
基于第一待处理二范数和第二待处理二范数,确定与第一节点相关联的冷启动损失值。
第二确定子单元1333,用于基于第一图关系特征向量、第一样本关系向量以及第二样本关系向量,确定与第一节点相关联的模型损失值;
模型训练子单元1334,用于基于模型损失值和冷启动损失值,对初始模型进行训练,得到模型训练结果;
第三确定子单元1335,用于若模型训练结果指示模型损失值达到第二收敛条件中的模型损失阈值,且冷启动损失值达到第一收敛条件中的冷启动损失阈值,则确定训练后的初始模型满足模型收敛条件。
其中,该第一获取子单元1331、第一确定子单元1332、第二确定子单元1333、模型训练子单元1334以及第三确定子单元1335的具体实现方式可以参见上述图6所对应实施例中对步骤S204中的模型训练过程的描述,这里将不再继续进行赘述。
模型确定单元134,用于在检测到训练后的初始模型满足模型收敛条件时,将满足模型收敛条件的初始模型确定为用于对冷启动节点进行冷启动处理的节点冷启动模型。
其中,该第一确定单元131、冷启动处理单元132、模型训练单元133以及模型确定单元134的具体实现方式可以参见上述图6所对应实施例中对步骤S204的描述,这里将不再继续进行赘述。
其中,初始模型还包含隐藏层和权重层;模型训练结果包含具有第一模型损失值和第一冷启动损失值的第一模型训练结果;
上述基于图关系网络的数据处理装置1还包括:
该参数确定模块14,用于若第一模型训练结果指示第一模型损失值达到第二收敛条件中的模型损失阈值,且第一冷启动损失值未达到第一收敛条件中的冷启动损失阈值,则将第一全连接特征矩阵和第二全连接特征矩阵确定为与冷启动层相关联的第一待调整参数,将隐藏层的模型参数和权重层的模型参数作为与第一模型损失值相匹配的第一模型参数;
该参数调整模块15,用于基于第一冷启动损失值,对第一待调整参数进行调整,得到与冷启动层相关联的第二待调整参数,将携带第一模型参数和第二待调整参数的初始模型作为过渡模型;
该第一确定模块16,用于基于第一模型参数对应的第一词向量特征和第二待调整参数,确定第一词向量特征对应的第二冷启动向量特征;
该第二确定模块17,用于基于第一模型参数对应的第一图关系特征向量和第二冷启动向量特征,更新与第一节点相关联的冷启动损失值,直到更新后的冷启动损失值达到第二收敛条件中的模型损失阈值时,确定训练后的过渡模型满足模型收敛条件。
其中,该第二获取模块10、拼接处理模块11、第三获取模块12、模型训练模块13、参数确定模块14、参数调整模块15、第一确定模块16、第二确定模块17、第一获取模块18、向量转换模块19、冷启动处理模块20以及推送模块21的具体实现方式可以参见上述图6所对应实施例中对步骤S201-步骤S208的描述,这里将不再继续进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图11,是本申请实施例提供的一种计算机设备的示意图。如图11所示,该计算机设备1000可以为上述图1对应实施例中的服务器10,该计算机设备1000可以包括:至少一个处理器1001,例如CPU,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),网络接口1004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选地还可以是至少一个位于远离前述处理器1001的存储装置。如图11所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图11所示的计算机设备1000中,网络接口1004主要用于与用户终端进行网络通信;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
将图关系网络中的独立节点作为冷启动节点,获取冷启动节点的属性信息;
获取与图关系网络相关联的节点冷启动模型,基于节点冷启动模型对冷启动节点的属性编码向量进行向量转换处理,得到冷启动节点的目标词向量特征;冷启动节点的属性编码向量是对冷启动节点的属性信息进行编码处理后所得到的;
基于节点冷启动模型对目标词向量特征进行冷启动处理,得到与冷启动节点相关联的目标图关系特征;
根据目标图关系特征推送图关系网络中与冷启动节点相匹配的节点。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3和图6所对应实施例中对该基于图关系网络的数据处理方法的描述,也可执行前文图10所对应实施例中对该基于图关系网络的数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且该计算机可读存储介质中存储有前文提及的基于图关系网络的数据处理装置1所执行的计算机程序,且该计算机程序包括程序指令,当该处理器执行该程序指令时,能够执行前文图3或者图6所对应实施例中对该基于图关系网络的数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (15)

1.一种基于图关系网络的数据处理方法,其特征在于,包括:
将所述图关系网络中的独立节点作为冷启动节点,获取所述冷启动节点的属性信息;
获取与所述图关系网络相关联的节点冷启动模型,基于所述节点冷启动模型对所述冷启动节点的属性编码向量进行向量转换处理,得到所述冷启动节点的目标词向量特征;所述冷启动节点的属性编码向量是对所述冷启动节点的属性信息进行编码处理后所得到的;
基于所述节点冷启动模型对所述目标词向量特征进行冷启动处理,得到与所述冷启动节点相关联的目标图关系特征;
根据所述目标图关系特征推送所述图关系网络中与所述冷启动节点相匹配的节点。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述图关系网络中的第一节点对应的第一词向量特征以及所述第二节点对应的第二词向量特征;所述第二节点为与所述第一节点具有关联关系的至少一个邻居节点;
将所述第一词向量特征和所述第二词向量特征进行拼接处理,得到所述第一节点的第一图关系特征向量;
获取与所述第一节点相关联的正样本节点对应的第一样本关系向量,以及与所述第一节点相关联的负样本节点对应的第二样本关系向量;所述正样本节点为所述图关系网络中与所述第一节点具有边连接关系的节点;所述负样本节点为所述图关系网络中与所述第一节点不具有边连接关系的节点;
在获取到与所述图关系网络相关联的初始模型时,根据所述第一词向量特征、所述第一图关系特征向量、所述第一样本关系向量和所述第二样本关系向量,对所述初始模型进行训练,得到用于对所述冷启动节点进行冷启动处理的节点冷启动模型。
3.根据权利要求2所述的方法,其特征在于,所述获取所述图关系网络中的第一节点对应的第一词向量特征以及所述第二节点对应的第二词向量特征,包括:
获取所述图关系网络中的第一节点的属性编码向量,对所述第一节点的属性编码向量进行向量转换处理,得到所述第一节点对应的第一词向量特征;所述第一节点的属性编码向量是对所述第一节点的属性信息进行编码处理所得到的;
从所述图关系网络中获取与所述第一节点具有关联关系的至少一个邻居节点,将获取到的所述至少一个邻居节点作为第二节点;
对所述第二节点中的每个邻居节点的属性编码向量进行向量转换处理,得到所述每个邻居节点的待处理词向量特征;所述每个邻居节点的属性编码向量是对所述每个邻居节点的属性信息进行编码处理所得到的;
对所述每个邻居节点的待处理词向量特征进行聚合处理,得到所述第二节点对应的第二词向量特征。
4.根据权利要求2所述的方法,其特征在于,所述在获取到与所述图关系网络相关联的初始模型时,根据所述第一词向量特征、所述第一图关系特征向量、所述第一样本关系向量和所述第二样本关系向量,对所述初始模型进行训练,得到用于对所述冷启动节点进行冷启动处理的节点冷启动模型,包括:
在获取到与所述图关系网络相关联的初始模型时,确定所述初始模型中的冷启动层;所述冷启动层包含对所述第一词向量特征进行冷启动处理的第一全连接层和第二全连接层;
基于所述第一全连接层和所述第二全连接层,对所述第一词向量特征进行冷启动处理,得到所述第一词向量特征对应的第一冷启动向量特征;
基于所述第一冷启动向量特征、所述第一图关系特征向量、所述第一样本关系向量和所述第二样本关系向量,对所述初始模型进行训练;
在检测到训练后的初始模型满足模型收敛条件时,将满足所述模型收敛条件的初始模型确定为用于对所述冷启动节点进行冷启动处理的节点冷启动模型。
5.根据权利要求4的方法,其特征在于,所述第一全连接层包含第一全连接特征矩阵;所述第一全连接特征矩阵的行数与所述第一词向量特征的列数相同;所述第二全连接层包含第二全连接特征矩阵,且所述第二全连接特征矩阵的行数与所述第一全连接特征矩阵的列数相同;
所述基于所述第一全连接层和所述第二全连接层,对所述第一词向量特征进行冷启动处理,得到所述第一词向量特征对应的第一冷启动向量特征,包括:
将所述第一词向量特征和所述第一全连接层中的所述第一全连接特征矩阵进行矩阵换算处理,得到所述第一词向量特征对应的中间向量特征;所述中间向量特征的行数与所述第二全连接特征矩阵的行数相同;
将所述中间向量特征和所述第二全连接层中的所述第二全连接特征矩阵进行矩阵换算处理,得到所述中间向量特征对应的第一冷启动向量特征;所述第一冷启动向量特征的列数与所述第二全连接特征矩阵的列数相同,且所述第一冷启动向量特征的列数与所述第一图关系特征向量的列数相同。
6.根据权利要求4所述的方法,其特征在于,所述基于所述第一冷启动向量特征、所述第一图关系特征向量、所述第一样本关系向量和所述第二样本关系向量,对所述初始模型进行训练,包括:
获取与所述图关系网络相关联的模型收敛条件;所述模型收敛条件包含第一收敛条件和第二收敛条件;所述第一收敛条件为与所述冷启动层相关联的冷启动损失值达到冷启动损失阈值时的条件;所述第二收敛条件为与所述初始模型相关联的模型损失值达到模型损失阈值时的条件;
基于所述第一图关系特征向量和所述第一冷启动向量特征,确定与所述第一节点相关联的冷启动损失值;
基于所述第一图关系特征向量、所述第一样本关系向量以及所述第二样本关系向量,确定与所述第一节点相关联的模型损失值;
基于所述模型损失值和所述冷启动损失值,对所述初始模型进行训练,得到模型训练结果;
若所述模型训练结果指示所述模型损失值达到所述第二收敛条件中的所述模型损失阈值,且所述冷启动损失值达到所述第一收敛条件中的所述冷启动损失阈值,则确定训练后的初始模型满足所述模型收敛条件。
7.根据权利要求6所述的方法,其特征在于,所述基于所述第一图关系特征向量和所述第一冷启动向量特征,确定与所述第一节点相关联的冷启动损失值,包括:
对所述第一图关系特征向量进行转置处理,得到所述第一图关系特征向量对应的第一转置向量;
对所述第一转置向量和所述第一冷启动向量特征分别进行二范数处理,得到所述第一转置向量对应的第一待处理二范数以及所述第一冷启动向量特征对应的第二待处理二范数;
基于所述第一待处理二范数和所述第二待处理二范数,确定与所述第一节点相关联的冷启动损失值。
8.根据权利要求6所述的方法,其特征在于,所述初始模型还包含隐藏层和权重层;所述模型训练结果包含具有第一模型损失值和第一冷启动损失值的第一模型训练结果;
所述方法还包括:
若所述第一模型训练结果指示所述第一模型损失值达到所述第二收敛条件中的所述模型损失阈值,且所述第一冷启动损失值未达到所述第一收敛条件中的所述冷启动损失阈值,则将所述第一全连接特征矩阵和所述第二全连接特征矩阵确定为与所述冷启动层相关联的第一待调整参数,将所述隐藏层的模型参数和所述权重层的模型参数作为与第一模型损失值相匹配的第一模型参数;
基于所述第一冷启动损失值,对所述第一待调整参数进行调整,得到与所述冷启动层相关联的第二待调整参数,将携带所述第一模型参数和所述第二待调整参数的初始模型作为过渡模型;
基于所述第一模型参数对应的所述第一词向量特征和所述第二待调整参数,确定所述第一词向量特征对应的第二冷启动向量特征;
基于所述第一模型参数对应的所述第一图关系特征向量和所述第二冷启动向量特征,更新与所述第一节点相关联的冷启动损失值,直到更新后的冷启动损失值达到所述第二收敛条件中的所述模型损失阈值时,确定训练后的过渡模型满足所述模型收敛条件。
9.根据权利要求2所述的方法,其特征在于,所述图关系网络中包含目标节点;所述目标节点为所述图关系网络中除所述冷启动节点之外的节点;所述目标节点的图关系特征是由所述节点冷启动模型对所述目标节点的第一词向量特征和所述目标节点的邻居节点的第二词向量特征进行拼接后所得到的;
所述根据所述目标图关系特征推送所述图关系网络中与所述冷启动节点相匹配的节点,包括:
在所述图关系网络中查找与所述目标图关系特征相匹配的图关系特征对应的节点;
若查找到的图关系特征对应的节点属于所述目标节点,则将查找到的所述图关系特征对应的节点作为待推送节点,对所述待推送节点进行推送。
10.根据权利要求1所述的方法,其特征在于,所述获取与所述图关系网络相关联的节点冷启动模型,基于所述节点冷启动模型对所述冷启动节点的属性编码向量进行向量转换处理,得到所述冷启动节点的目标词向量特征,包括:
获取与所述图关系网络相关联的节点冷启动模型;
对所述冷启动节点的属性信息进行编码处理,得到所述冷启动节点的属性编码向量;
获取所述节点冷启动模型中与所述冷启动节点的属性编码向量相关联的隐藏层特征矩阵,基于所述隐藏层特征矩阵和所述冷启动节点的属性编码向量,确定所述冷启动节点的属性隐藏层向量;所述隐藏层特征矩阵对应的行数与所述冷启动节点的属性编码向量对应的列数相同;
基于所述冷启动节点的属性隐藏层向量以及所述冷启动节点的属性信息对应的权重系数,确定所述冷启动节点的目标词向量特征。
11.根据权利要求10所述的方法,其特征在于,所述冷启动节点的属性信息包含第一属性信息和第二属性信息;所述冷启动节点的属性编码向量包含所述第一属性信息对应的第一属性编码向量和所述第二属性信息对应的第二属性编码向量;所述节点冷启动模型包含用于对所述冷启动节点的属性编码向量进行向量转换功能的隐藏层;
所述获取所述节点冷启动模型中与所述属性编码向量相关联的隐藏层特征矩阵,基于所述隐藏层特征矩阵和所述属性编码向量,确定所述冷启动节点的属性隐藏层向量,包括:
在所述节点冷启动模型的所述隐藏层中,将与所述第一属性信息对应的隐藏层确定为第一隐藏层,将与所述第二属性信息对应的隐藏层确定为第二隐藏层;所述第一隐藏层中包含第一隐藏层特征矩阵,所述第一隐藏层特征矩阵的行数与所述第一属性编码向量的列数相同;所述第二隐藏层中包含第二隐藏层特征矩阵,所述第二隐藏层特征矩阵的行数与所述第二属性编码向量的列数相同;所述第一隐藏层特征矩阵的列数和所述第二隐藏层特征矩阵的列数相同;
基于所述第一属性编码向量和所述第一隐藏层中的所述第一隐藏层特征矩阵,确定与所述第一属性编码向量相关联的第一属性隐藏层向量;
基于所述第二属性编码向量和所述第二隐藏层中的所述第二隐藏层特征矩阵,确定与所述第二属性编码向量相关联的第二属性隐藏层向量;所述第二属性隐藏层向量与所述第一属性隐藏层向量具有相同的行数和列数;
将所述第一属性隐藏层向量与所述第二属性隐藏层向量确定为所述冷启动节点的属性隐藏层向量。
12.根据权利要求11所述的方法,其特征在于,所述节点冷启动模型中包含用于对所述冷启动节点的属性隐藏层向量进行加权处理的权重层;
所述基于所述冷启动节点的属性隐藏层向量以及所述冷启动节点的属性信息对应的权重系数,确定所述冷启动节点的目标词向量特征,包括:
获取所述节点冷启动模型中的所述权重层的权重矩阵;所述权重矩阵包含所述第一属性信息对应的第一权重系数以及所述第二属性信息对应的第二权重系数;
基于所述第一属性隐藏层向量、所述第二属性隐藏层向量、所述第一权重系数以及所述第二权重系数,确定所述目标节点对应的目标词向量特征。
13.一种基于图关系网络的数据处理装置,其特征在于,包括:
第一获取模块,用于将所述图关系网络中的独立节点作为冷启动节点,获取所述冷启动节点的属性信息;
向量转换模块,用于获取与所述图关系网络相关联的节点冷启动模型,基于所述节点冷启动模型对所述冷启动节点的属性编码向量进行向量转换处理,得到所述冷启动节点的目标词向量特征;所述冷启动节点的属性编码向量是对所述冷启动节点的属性信息进行编码处理后所得到的;
冷启动处理模块,用于基于所述节点冷启动模型对所述目标词向量特征进行冷启动处理,得到与所述冷启动节点相关联的目标图关系特征;
推送模块,用于根据所述目标图关系特征推送所述图关系网络中与所述冷启动节点相匹配的节点。
14.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-12任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-12任一项所述的方法。
CN202010428966.0A 2020-05-20 2020-05-20 基于图关系网络的数据处理方法、装置、设备及介质 Active CN111597401B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010428966.0A CN111597401B (zh) 2020-05-20 2020-05-20 基于图关系网络的数据处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010428966.0A CN111597401B (zh) 2020-05-20 2020-05-20 基于图关系网络的数据处理方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN111597401A true CN111597401A (zh) 2020-08-28
CN111597401B CN111597401B (zh) 2021-08-17

Family

ID=72187537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010428966.0A Active CN111597401B (zh) 2020-05-20 2020-05-20 基于图关系网络的数据处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111597401B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131261A (zh) * 2020-10-09 2020-12-25 腾讯科技(深圳)有限公司 基于社区网络的社区查询方法、装置和计算机设备
CN112508691A (zh) * 2021-02-04 2021-03-16 北京淇瑀信息科技有限公司 基于关系网标签化和图神经网络的风险预测方法及装置
CN113627525A (zh) * 2021-08-10 2021-11-09 工银科技有限公司 特征提取模型的训练方法、医保风险识别方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108173936A (zh) * 2017-12-27 2018-06-15 百度在线网络技术(北京)有限公司 新闻推荐方法和装置
US20190251480A1 (en) * 2018-02-09 2019-08-15 NEC Laboratories Europe GmbH Method and system for learning of classifier-independent node representations which carry class label information
CN110428899A (zh) * 2019-08-02 2019-11-08 陕西师范大学 基于双随机游走重启动的多数据整合环状rna与疾病相关性预测方法
CN110597943A (zh) * 2019-09-16 2019-12-20 腾讯科技(深圳)有限公司 基于人工智能的兴趣点处理方法、装置及电子设备
CN110659799A (zh) * 2019-08-14 2020-01-07 深圳壹账通智能科技有限公司 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质
CN110910235A (zh) * 2019-10-23 2020-03-24 华融融通(北京)科技有限公司 一种基于用户关系网络的贷中异常行为检测方法
CN111178515A (zh) * 2020-04-10 2020-05-19 成都数联铭品科技有限公司 图神经网络的节点编码方法及节点编码终端、电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108173936A (zh) * 2017-12-27 2018-06-15 百度在线网络技术(北京)有限公司 新闻推荐方法和装置
US20190251480A1 (en) * 2018-02-09 2019-08-15 NEC Laboratories Europe GmbH Method and system for learning of classifier-independent node representations which carry class label information
CN110428899A (zh) * 2019-08-02 2019-11-08 陕西师范大学 基于双随机游走重启动的多数据整合环状rna与疾病相关性预测方法
CN110659799A (zh) * 2019-08-14 2020-01-07 深圳壹账通智能科技有限公司 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质
CN110597943A (zh) * 2019-09-16 2019-12-20 腾讯科技(深圳)有限公司 基于人工智能的兴趣点处理方法、装置及电子设备
CN110910235A (zh) * 2019-10-23 2020-03-24 华融融通(北京)科技有限公司 一种基于用户关系网络的贷中异常行为检测方法
CN111178515A (zh) * 2020-04-10 2020-05-19 成都数联铭品科技有限公司 图神经网络的节点编码方法及节点编码终端、电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIHUN OH等: "《ADVANCING GRAPHSAGE WITH A DATA-DRIVEN NODE SAMPLING》", 《ARXIV:1904.12935V1》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131261A (zh) * 2020-10-09 2020-12-25 腾讯科技(深圳)有限公司 基于社区网络的社区查询方法、装置和计算机设备
CN112131261B (zh) * 2020-10-09 2024-02-09 腾讯科技(深圳)有限公司 基于社区网络的社区查询方法、装置和计算机设备
CN112508691A (zh) * 2021-02-04 2021-03-16 北京淇瑀信息科技有限公司 基于关系网标签化和图神经网络的风险预测方法及装置
CN113627525A (zh) * 2021-08-10 2021-11-09 工银科技有限公司 特征提取模型的训练方法、医保风险识别方法及装置

Also Published As

Publication number Publication date
CN111597401B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN110196946B (zh) 一种基于深度学习的个性化推荐方法
CN110598206B (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN111597401B (zh) 基于图关系网络的数据处理方法、装置、设备及介质
CN111581510A (zh) 分享内容处理方法、装置、计算机设备和存储介质
EP4145308A1 (en) Search recommendation model training method, and search result sorting method and device
CN110162701B (zh) 内容推送方法、装置、计算机设备和存储介质
CN109408731A (zh) 一种多目标推荐方法、多目标推荐模型生成方法以及装置
WO2017106977A1 (en) End-to-end deep collaborative filtering
CN108876044B (zh) 一种基于知识增强神经网络的线上内容流行度预测方法
CN109033107A (zh) 图像检索方法和装置、计算机设备和存储介质
WO2023138188A1 (zh) 特征融合模型训练及样本检索方法、装置和计算机设备
US9852177B1 (en) System and method for generating automated response to an input query received from a user in a human-machine interaction environment
CN112800344B (zh) 一种基于深度神经网络的电影推荐方法
CN114358657B (zh) 一种基于模型融合的岗位推荐方法及装置
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN114580794B (zh) 数据处理方法、装置、程序产品、计算机设备和介质
CN116108267A (zh) 一种推荐方法及相关设备
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
CN113723115B (zh) 基于预训练模型的开放域问答预测方法及相关设备
CN113592593A (zh) 序列推荐模型的训练及应用方法、装置、设备及存储介质
CN115906863A (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115344698A (zh) 标签处理方法、装置、计算机设备、存储介质和程序产品
CN114707633A (zh) 特征提取方法、装置、电子设备和存储介质
CN114691828A (zh) 数据处理方法、装置、设备以及介质
CN113360697B (zh) 商品图像检索处理方法及其相应的装置、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40027394

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant