CN114817751B - 数据处理方法、装置、电子设备、存储介质及程序产品 - Google Patents
数据处理方法、装置、电子设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN114817751B CN114817751B CN202210720773.1A CN202210720773A CN114817751B CN 114817751 B CN114817751 B CN 114817751B CN 202210720773 A CN202210720773 A CN 202210720773A CN 114817751 B CN114817751 B CN 114817751B
- Authority
- CN
- China
- Prior art keywords
- node
- fusion
- nodes
- vector
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 116
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000009826 distribution Methods 0.000 claims abstract description 440
- 239000013598 vector Substances 0.000 claims abstract description 353
- 230000004927 fusion Effects 0.000 claims abstract description 241
- 230000003993 interaction Effects 0.000 claims abstract description 47
- 238000007499 fusion processing Methods 0.000 claims abstract description 42
- 238000000034 method Methods 0.000 claims abstract description 42
- 230000002452 interceptive effect Effects 0.000 claims abstract description 34
- 238000013473 artificial intelligence Methods 0.000 claims abstract description 33
- 238000013507 mapping Methods 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 23
- 238000007906 compression Methods 0.000 claims description 19
- 230000006835 compression Effects 0.000 claims description 16
- 101100134058 Caenorhabditis elegans nth-1 gene Proteins 0.000 claims description 10
- 238000002360 preparation method Methods 0.000 claims description 9
- 230000003213 activating effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 32
- 238000012549 training Methods 0.000 description 25
- 230000002776 aggregation Effects 0.000 description 24
- 238000004220 aggregation Methods 0.000 description 24
- 238000004422 calculation algorithm Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 230000004913 activation Effects 0.000 description 11
- 101150064138 MAP1 gene Proteins 0.000 description 8
- 238000012512 characterization method Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000001902 propagating effect Effects 0.000 description 4
- 241000689227 Cora <basidiomycete fungus> Species 0.000 description 3
- 238000013475 authorization Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010130 dispersion processing Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/58—Random or pseudo-random number generators
- G06F7/588—Random number generators, i.e. based on natural stochastic processes
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取交互图;获取交互图中每个节点的第一分布向量,并基于节点的第一分布向量生成每个节点的第一随机分布;对节点的相邻节点的第一随机分布进行融合处理,并将针对节点的分布融合结果作为节点的相邻节点的第一融合随机分布;获取节点的第一融合随机分布的第一融合向量,并对第一融合向量以及节点的第一分布向量进行合并处理,得到节点的第二分布向量;基于交互图中目标节点的第二分布向量,执行针对目标对象的推荐任务。通过本申请,能够提高针对目标节点的表征能力,从而提升推荐准确度。
Description
技术领域
本申请涉及人工智能技术,尤其涉及一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。
推荐处理是人工智能的重要应用,推荐系统中的用户以及物品之间、用户与用户之间、以及物品与物品之间具有交互关系,相关技术中通过图结构的节点来表示推荐系统中的用户以及物品,并通过学习各个节点的表示来执行推荐任务。相关技术中学习各个节点的表示时仅采用向量进行表示,损失了节点物理意义上的多样性,从而导致信息丢失,影响推荐系统的推荐准确度。
发明内容
本申请实施例提供一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提高针对目标节点的表征能力,从而提升推荐准确度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的数据处理方法,包括:
获取交互图,其中,所述交互图包括与每个服务对象和每个推荐对象对应的节点、以及多个所述节点之间的连接线,所述连接线表征所连接的两个所述节点对应的对象之间具有交互关系;
获取所述交互图中每个所述节点的第一分布向量,并基于每个所述节点的第一分布向量生成每个所述节点的第一随机分布;
对每个所述节点的至少两个相邻节点的第一随机分布进行融合处理,并将针对每个所述节点的分布融合结果作为每个所述节点的至少两个相邻节点的第一融合随机分布,其中,所述相邻节点是与所述节点处于相同连接线的节点;
针对每个所述节点,获取所述节点的第一融合随机分布的第一融合向量,并对所述第一融合向量以及所述节点的第一分布向量进行合并处理,得到所述节点的第二分布向量;
基于所述交互图中至少一个目标节点的第二分布向量,执行针对至少一个目标对象的推荐任务,其中,所述目标对象是与所述目标节点对应的对象。
本申请实施例提供一种基于人工智能的数据处理装置,包括:
获取模块,用于获取交互图,其中,所述交互图包括与每个服务对象和每个推荐对象对应的节点、以及多个所述节点之间的连接线,所述连接线表征所连接的两个所述节点对应的对象之间具有交互关系;
生成模块,用于获取所述交互图中每个所述节点的第一分布向量,并基于每个所述节点的第一分布向量生成每个所述节点的第一随机分布;
融合模块,用于对每个所述节点的至少两个相邻节点的第一随机分布进行融合处理,并将针对每个所述节点的分布融合结果作为每个所述节点的至少两个相邻节点的第一融合随机分布,其中,所述相邻节点是与所述节点处于相同连接线的节点;
合并模块,用于针对每个所述节点,获取所述节点的第一融合随机分布的第一融合向量,并对所述第一融合向量以及所述节点的第一分布向量进行合并处理,得到所述节点的第二分布向量;
推荐模块,用于基于所述交互图中至少一个目标节点的第二分布向量,执行针对至少一个目标对象的推荐任务,其中,所述目标对象是与所述目标节点对应的对象。
在上述方案中,所述生成模块,还用于:针对每个所述节点执行以下处理:对所述节点的初始向量进行随机分布映射处理,得到所述节点的初始随机分布;对所述节点的至少两个相邻节点的初始向量进行随机分布映射处理,得到所述至少两个相邻节点的初始随机分布;对所述至少两个相邻节点的初始随机分布进行融合处理,并将分布融合结果作为所述节点的初始融合随机分布;获取所述节点的初始融合随机分布的初始融合向量,并对所述初始融合向量以及所述节点的初始向量进行合并处理,得到所述节点的第一分布向量。
在上述方案中,所述生成模块,还用于:对第一斜率与所述初始向量进行点积处理,得到第一点积结果;基于第一偏置对所述第一点积结果进行偏置处理,得到所述节点的初始期望;对第二斜率与所述初始向量进行点积处理,得到第二点积结果;基于第二偏置对所述第二点积结果进行偏置处理,得到所述节点的预备方差;对所述预备方差进行激活处理,得到所述节点的初始方差;将由所述初始方差以及所述初始期望表征的随机分布作为所述节点的初始随机分布。
在上述方案中,所述生成模块,还用于:当所述预备方差大于零时,获取所述预备方差与第三偏置的求和结果,并对求和结果进行离散处理,得到所述节点的初始方差;当所述预备方差不大于零时,对所述预备方差进行指数映射处理,得到指数映射结果,将第一差值与第三斜率进行相乘处理,其中,所述第一差值是所述指数映射结果与所述第三偏置的差值;将相乘结果与所述第三偏置进行求和处理,并对求和结果进行离散处理,得到所述节点的初始方差。
在上述方案中,所述生成模块,还用于:针对每个所述节点执行以下处理:通过N个级联的网络层中的第n网络层,对所述第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果;其中,N的取值范围满足2≤N,n为取值从1开始递增的整数,且n的取值范围满足1≤n≤N-1;将所述第n随机分布生成结果传输到第n+1网络层以继续进行随机分布生成处理;其中,当n取值为1时,所述第n网络层的输入为所述节点的初始向量,当n取值为2≤n≤N-1时,所述第n网络层的输入为第n-1网络层的第n-1随机分布生成结果,当n取值为N-1时,所述第n+1网络层输出的第n+1随机分布生成结果为所述节点的第一分布向量。
在上述方案中,当所述n的取值为2≤n≤N-1时,所述生成模块,还用于:通过所述第n网络层执行以下处理:对所述节点的第n-1随机分布生成结果进行随机分布映射处理,得到所述节点的第n-1层随机分布,其中,所述第n-1随机分布生成结果是所述节点的第n-1层分布向量;对所述节点的至少两个相邻节点的第n-1随机分布生成结果进行随机分布映射处理,得到所述至少两个相邻节点的第n-1层随机分布;对所述至少两个相邻节点的第n-1层随机分布进行第n-1层分布融合处理,并将针对所述节点的第n-1层分布融合结果作为所述节点的第n-1层融合随机分布;获取所述节点的第n-1层融合随机分布的第n-1层融合向量,并对所述第n-1层融合向量以及所述第n-1层分布向量进行合并处理,得到所述节点的第n层分布向量作为所述第n随机分布生成结果。
在上述方案中,所述生成模块,还用于:在获取所述交互图中每个所述节点的第一分布向量之前,当所述节点对应所述服务对象时,获取所述服务对象的第一属性数据,并对所述第一属性数据进行第一嵌入压缩处理,得到第一属性向量;当所述节点对应所述推荐对象时,获取所述推荐对象的第二属性数据,并对所述第二属性数据进行第二嵌入压缩处理,得到第二属性向量。
在上述方案中,所述融合模块,还用于:针对每个所述节点执行以下处理:对所述节点的至少两个相邻节点的第一随机分布进行期望融合处理,得到融合期望;对所述节点的至少两个相邻节点的第一随机分布进行方差融合处理,得到融合方差;以由所述融合期望以及所述融合方差表征的随机分布作为所述节点的分布融合结果。
在上述方案中,所述融合模块,还用于:获取每个所述相邻节点的第一随机分布的期望、以及对应每个所述相邻节点的期望权重;基于每个所述相邻节点的期望权重,对每个所述相邻节点的第一随机分布的期望进行加权求和处理,得到所述融合期望。
在上述方案中,所述融合模块,还用于:通过M个级联的融合层中的第m融合层,对所述第m融合层的输入进行方差融合处理,得到第m方差融合结果;其中,M的取值范围满足2≤M,m为取值从1开始递增的整数,且m的取值范围满足1≤m≤M-1;将所述第m方差融合结果传输到第m+1融合层以继续进行方差融合处理;其中,当m取值为1时,所述第m融合层的输入为所述至少两个相邻节点的第一随机分布的方差以及所述节点的第一随机分布的方差,当m取值为2≤m≤M-1时,所述第m融合层的输入为第m-1融合层的第m-1方差融合结果以及所述至少两个相邻节点的第一随机分布的方差,当m取值为M-1时,所述第m+1融合层输出的第m+1方差融合结果为所述融合方差。
在上述方案中,所述融合模块,还用于:通过所述第m融合层执行以下处理:针对每个所述相邻节点,将迭代方差与所述相邻节点的第一随机分布的方差进行相乘处理,并对相乘结果进行求平方根处理,得到对应所述相邻节点的平方根;基于对应每个所述相邻节点的方差权重,对所述至少两个相邻节点的平方根进行加权求和处理,并对加权求和结果进行平方处理,得到平方结果;将所述平方结果与所述迭代方差的比值作为所述第m方差融合结果;其中,当m取值为1时,所述迭代方差是所述节点的第一随机分布的方差,当m取值为2≤m≤M-1时,所述迭代方差是所述第m-1融合层的第m-1方差融合结果。
在上述方案中,所述合并模块,还用于:对所述第一融合向量以及所述节点的第一分布向量进行拼接处理,得到拼接向量;对拼接向量进行映射处理,得到所述节点的第二分布向量。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的基于人工智能的数据处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的基于人工智能的数据处理方法。
本申请实施例提供一种计算机程序产品,包括计算机程序或指令,所述计算机程序或指令被处理器执行时实现本申请实施例提供的基于人工智能的数据处理方法。
本申请实施例具有以下有益效果:
获取能够表征推荐对象与服务对象交互关系的交互图,通过获取交互图可以高效全面地获取推荐对象以及服务对象的信息,生成交互图中每个节点的第一随机分布的第一分布向量,可以表征出节点的信息多样性,对每个节点的至少两个相邻节点的第一随机分布进行融合处理,得到第一融合随机分布,在节点与节点间传播完整的随机分布,而非基于随机分布产生的向量,避免丢失节点信息,将节点的第一融合随机分布的第一融合向量,与节点的第一分布向量进行合并处理,得到节点的第二分布向量,第二分布向量可以准确表征节点在交互图中的信息,从而提高后续推荐任务的准确度。
附图说明
图1是本申请实施例提供的基于人工智能的数据处理系统的结构示意图;
图2是本申请实施例提供的电子设备的结构示意图;
图3A是本申请实施例提供的基于人工智能的数据处理方法的第一个流程示意图;
图3B是本申请实施例提供的基于人工智能的数据处理方法的第二个流程示意图;
图3C是本申请实施例提供的基于人工智能的数据处理方法的第三个流程示意图;
图3D是本申请实施例提供的基于人工智能的数据处理方法的第四个流程示意图;
图3E是本申请实施例提供的基于人工智能的数据处理方法的第五个流程示意图;
图4是本申请实施例提供的数据处理方法的界面示意图;
图5是本申请实施例提供的数据处理方法的推荐示意图;
图6是本申请实施例提供的数据处理方法的逻辑示意图;
图7是本申请实施例提供的数据处理方法的应用示意图;
图8是本申请实施例提供的数据处理方法的聚合示意图;
图9是本申请实施例提供的图表示学习网络的流程示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)推荐系统:推荐系统是自动联系用户和信息的一种工具,它能够在信息过载的环境中帮助用户发现令他们感兴趣的信息,也能将信息推送给对它们感兴趣的用户。
2)召回:由于推荐系统算力和在线系统时延的限制,通常推荐系统采用召回、粗排、精排、混排的漏斗级构造,召回在整个系统的前端,负责从整个候选池(百万到亿级别的数据)选出一个符合系统目标和算力限制的子集(百、千到万级别的数据)。
3)服务对象:服务对象是指使用推荐系统的用户,例如地图推荐系统的服务对象是游戏玩家,商品推荐系统的服务对象是买家。这里的用户可以是能够操作终端的自然人,也可以是终端中运行的能够模拟人类的机器人程序。
4)推荐对象:即能够发送到终端中进行呈现以向相应终端的用户(服务对象)进行推荐的信息,例如,视频信息、商品信息、新闻信息等等。当推荐系统是社交推荐系统时,可以向用户推荐好友用户,推荐对象即为使用推荐系统的好友用户,此时服务对象与推荐对象之间存在重叠。
5)卷积神经网络(CNN,Convolutional Neural Networks):卷积神经网络是前馈神经网络,它的人工神经元可以响应感受野的覆盖范围内的神经单元。
6)图卷积网络(GCN,Graph Convolutional Neural Networks):一种利用卷积网络来对图拓扑进行表征的图神经网络。
8)瓦瑟斯坦重心(Wasserstein Barycenter):Wasserstein重心表示距离多个概率分布的Wasserstein距离之和最小的概率分布。
9)聚合器:聚合器是聚合函数,以本节点和其邻居节点的表示(Representation)为输入,生成本节点的表示。
10)二分图,又称作二部图,是图论中的模型,设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i属于A集合,j属于B集合),则称图G为二分图。
相关技术中的图卷积网络中每个节点可以表示成嵌入式空间内的一个点,嵌入式空间中的每个节点,由一个嵌入向量表示,可以由它的近邻节点的嵌入向量聚合表示。但是这种节点表示将每个节点限制为嵌入式空间中的点,不利于表示出节点的多样性。在实际应用中,某个人的偏好可能是多样的,既爱看科幻片也爱看喜剧片。在这种情况下,单一的嵌入向量表示具有一定的局限性。
相关技术中为表达网络中节点的多样性,可以利用高斯分布来表示节点的方法,此时网络中节点不是用一个嵌入式向量决定,而是由一个高斯分布产生的向量决定,相关技术中虽然使用概率分布来表示节点来实现表达多样性,但是每个节点在图网络中传播信息时,仍是传递嵌入空间中的向量表示,图网络中节点的聚合仍是基于向量的聚合,没有获取节点分布间的关系,这种方式容易导致节点信息在图网络中传播时丢失信息。
本申请实施例提供一种基于人工智能的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够利用分布来实现节点的聚合,节点与节点间传播完整的随机分布,从而有效获取到节点分布间的关系,提高节点的表征准确度,从而提高针对节点的推荐准确度。
下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的电子设备可以为服务器。本申请实施例提供的电子设备可以实施为笔记本电脑,平板电脑,台式计算机,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用信息设备,便携式游戏设备)、智能语音交互设备、智能家电、车载终端、飞行器等等各种类型的用户终端。下面,将说明电子设备实施为服务器时的示例性应用。
参见图1,图1是本申请实施例提供的基于人工智能的数据处理系统的结构示意图,为实现支撑一个游戏应用,终端400通过网络300连接应用服务器200-2,网络300可以是广域网或者局域网,又或者是二者的组合。训练服务器200-1推送训练好的图表示学习网络以及交互图至应用服务器200-2,账号A登录终端400运行的游戏应用,终端400向应用服务器200-2发送用户请求,用户请求携带有账号A的标识,应用服务器200-2获取多个地图,例如地图B、地图C以及地图D,应用服务器200-2获取交互图中对应账号A的节点的表示向量A、地图B的节点的表示向量B、地图C的节点的表示向量C以及地图D的节点的表示向量D,应用服务器200-2确定表示向量A分别与表示向量B、表示向量C以及表示向量D的内积,将内积排序靠前的地图返回至终端400进行呈现。
在一些实施例中,本申请实施例提供的基于人工智能的数据处理系统还可以应用于新闻推荐,为实现支撑一个新闻应用,训练服务器推送训练好的图表示学习网络以及交互图至应用服务器,账号A登录终端400运行的新闻应用,终端向应用服务器发送用户请求,用户请求携带有账号A的标识,应用服务器获取多个新闻,例如新闻B、新闻C以及新闻D,应用服务器获取交互图中对应账号A的节点的表示向量A、新闻B的节点的表示向量B、新闻C的节点的表示向量C以及新闻D的节点的表示向量D,应用服务器确定表示向量A分别与表示向量B、表示向量C以及表示向量D的内积,将内积排序靠前的新闻返回至终端进行呈现。
在一些实施例中,训练服务器200-1和应用服务器200-2可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
在一些实施例中,终端或服务器可以通过运行计算机程序来实现本申请实施例提供的基于人工智能的数据处理方法。举例来说,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如新闻APP或者游戏APP;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
参见图2,图2是本申请实施例提供的电子设备的结构示意图,以电子设备是应用服务器200-2为例,图2所示的应用服务器200-2包括:至少一个处理器210、存储器250、至少一个网络接口220。应用服务器200-2中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等。
在一些实施例中,本申请实施例提供的基于人工智能的数据处理装置可以采用软件方式实现,图2示出了存储在存储器250中的基于人工智能的数据处理装置255,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块2551、生成模块2552、融合模块2553、合并模块2554以及推荐模块2555,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分,将在下文中说明各个模块的功能。
下面将结合本申请实施例提供的终端的示例性应用和实施,以向玩家推荐游戏地图为例进行说明,说明本申请实施例提供的基于人工智能的数据处理方法。
参见图3A,将结合图3A示出的步骤101至步骤105进行说明。
在步骤101中,获取交互图。
作为示例,交互图包括与每个服务对象和每个推荐对象对应的节点、以及多个节点之间的连接线,连接线表征所连接的两个节点对应的对象之间具有交互关系。服务对象是指使用推荐系统的用户,例如地图推荐系统的服务对象是游戏玩家,商品推荐系统的服务对象是买家。这里的用户可以是能够操作终端的自然人,也可以是终端中运行的能够模拟人类的机器人程序。推荐对象是能够发送到终端中进行呈现以向相应终端的用户(服务对象)进行推荐的信息,例如,视频信息、商品信息、新闻信息等等。当推荐系统是社交推荐系统时,可以向用户推荐好友用户,推荐对象即为使用推荐系统的好友用户,此时服务对象与推荐对象之间存在重叠。
为了明晰推荐系统中各个服务对象以及各个推荐对象之间的关系,例如两个服务对象之间是否存在交互关系,例如两个推荐对象之间是否存在交互关系,例如推荐对象与服务对象之间是否存在交互关系,因此可以通过包括节点以及连接线的交互图作为后续数据处理对象,以向游戏用户推荐地图为例进行说明,例如游戏APP具有3个用户以及10个地图,因此需要初始化得到13个节点,13个节点与3个用户以及10个地图一一对应,例如节点A对应用户小王,节点B对应地图1,若用户小王与地图1具有交互关系,则在两个节点间构成连接线。通过交互图可以学习服务对象以及推荐对象之间的高阶关系,高阶关系指服务对象与服务对象之间、服务对象与推荐对象之间、或者推荐对象与推荐对象之间的间接交互关系,例如,图7中1号用户的节点与2号地图的节点之间形成第一层关系,2号用户与2号地图之间形成第二层关系,由此1号用户和2号用户之间形成高阶关系,4号地图与2号用户之间形成第三层关系,由此1号用户与4号地图之间形成高阶关系,从而可以更好的预测用户针对地图的偏好。
在步骤102中,获取交互图中每个节点的第一分布向量,并基于每个节点的第一分布向量生成每个节点的第一随机分布。
作为示例,第一分布向量是用于表征服务对象的信息,以用户小王为例进行说明,用户小王的第一属性信息如下:年龄5岁,性别女性,则第一属性数据是(0,0,0,0,1,0,0,…0,0)以及(0,1),前者是100维的向量,在第5维的数字为1,表征年龄5岁,后者是二维向量,在第2维的数字为1,表征女性,对第一属性数据进行嵌入压缩处理,嵌入压缩处理是对第一属性数据进行映射处理,映射关系是通过训练得到的,例如,将100维的向量(0,0,0,0,1,0,0,…0,0)以及二维向量(0,1)映射为二维向量(5,1),映射得到的二维向量即为服务对象的初始向量,此时可以直接将初始向量作为用户小王的第一分布向量,即利用二维向量(5,1)来表示用户小王的信息。通过上述介绍可以明确第一分布向量可以表征节点的各种信息,但是仅通过向量进行表征会存在表征能力单一的问题,因此本申请实施例引入随机分布这个数据形式来表征节点的信息,从而可以提升信息的多样化表示,即第一随机分布是基于初始向量得到的,用于表征节点信息的另一种数据形式,可以为高斯分布或者其他随机分布。
作为示例,参见图3D,除了上述直接将初始向量作为第一分布向量之外,还可以通过执行图3D示出的步骤1至步骤4来获取第一分布向量。
步骤1:对节点的初始向量进行随机分布映射处理,得到节点的初始随机分布。
在一些实施例中,在生成交互图中每个节点的第一随机分布的第一分布向量之前,当节点对应服务对象时,例如,节点是对应用户小王的节点,获取服务对象的第一属性数据,第一属性数据为离散数据,包括用户授权提供的年龄、用户授权提供的头像、用户授权提供的游戏记录等等。由于第一属性数据是离散数据,因此需要对第一属性数据进行第一嵌入压缩处理,得到第一属性向量,将第一属性向量作为服务对象的节点的初始向量,嵌入压缩处理即是获取离散数据的嵌入(embedding)向量的过程,将获取到的embedding向量作为嵌入式空间的第一属性向量,嵌入压缩处理就是用一个低维的向量表示一个物体,可以是一个词,或是一个商品,或是一个电影等等。embedding向量的性质是能使距离相近的向量对应的物体有相近的含义。当节点对应推荐对象时,例如,节点是对应地图A的节点,获取推荐对象的第二属性数据,第二属性数据为离散数据,包括地图的使用次数、地图的名称、地图的难度等等,由于第二属性数据也是离散数据,因此需要对第二属性数据进行第二嵌入压缩处理,得到第二属性向量,将第二属性向量作为推荐对象的节点的初始向量,第二嵌入压缩处理的过程与第一嵌入压缩处理的过程类似,不再赘述。
作为示例,以用户小王为例进行说明,用户小王的第一属性信息如下:年龄5岁,性别女性,则第一属性数据是(0,0,0,0,1,0,0,…0,0)以及(0,1),前者是100维的向量,在第5维的数字为1,表征年龄5岁,后者是二维向量,在第2维的数字为1,表征女性,对第一属性数据进行嵌入压缩处理,嵌入压缩处理是对第一属性数据进行映射处理,映射关系是通过训练得到的,例如,将100维的向量(0,0,0,0,1,0,0,…0,0)以及二维向量(0,1)映射为二维向量(5,1),映射得到的二维向量即为服务对象的初始向量。由此可以看出通过嵌入压缩处理可以将1个100维的向量以及1个二维向量压缩为一个二维向量,通过嵌入压缩处理可以减少数据维度,从而提高数据处理效率。
当对交互图的节点进行初始化处理时,会获取交互图中每个节点v的初始向量。当节点v对应服务对象时,初始向量用于表征服务对象的属性信息,例如用户对象信息,当节点v对应推荐对象时,初始向量用于表征推荐对象的属性信息,例如游戏地图信息。通过嵌入压缩处理可以减少数据维度,从而提高数据处理效率。
作为示例,可以对初始向量进行映射处理,得到对应初始向量的初始随机分布,通过上述介绍可以明确初始向量可以表征节点的各种信息,但是仅通过初始向量进行表征会存在表征能力单一的问题,因此本申请实施例引入随机分布这个数据形式来表征节点的信息,从而可以提升信息的多样化表示,即初始随机分布是基于初始向量得到的,用于表征节点信息的另一种数据形式。当初始随机分布是高斯分布时,初始随机分布的参数包括期望与方差,可以基于初始向量获取初始期望以及初始方差,将由初始方差以及初始期望表征的随机分布作为节点的初始随机分布。
作为示例,针对初始随机分布的初始期望,对第一斜率与初始向量进行点积处理,得到第一点积结果,第一斜率是通过训练得到的已知数据;基于第一偏置对第一点积结果进行偏置处理,得到节点的初始期望,第一偏置是通过训练得到的已知数据,将初始期望作为初始随机分布对应的期望。上述说明体现了将初始向量映射为初始期望的过程,通过基于第一斜率以及第一偏置的线性处理,可以得到与初始向量相关的初始期望,从而使得由初始期望以及初始方差表征的初始随机分布对节点的信息表征能力提高。
在对交互图的节点初始化之后,节点v的第一随机分布的期望通过以下公式(2)求得:
作为示例,针对初始随机分布的初始方差,对第二斜率与初始向量进行点积处理,得到第二点积结果,第二斜率是通过训练得到的已知数据;基于第二偏置对第二点积结果进行偏置处理,得到节点的预备方差,第二偏置是通过训练得到的已知数据;对预备方差进行激活处理,得到节点的初始方差,将初始方差作为第一随机分布对应的方差。上述说明体现了将初始向量映射为初始方差的过程,通过基于第二斜率以及第二偏置的线性处理,可以得到与初始向量相关的预备方差,并通过激活处理可以使得初始方差对节点的信息表征能力提高。
在初始化交互图的节点之后,节点v的第一随机分布的方差通过以下公式(3)求得:
在一些实施例中,指数线性激活函数可以参见公式(4):
当x大于0时,指数线性激活函数的输出f(x)为x本身,此处的x为预备方差,即当预备方差大于零时,将预备方差与第三偏置的求和结果与超参数相乘(对求和结果进行离散处理),得到节点的初始方差,超参数用于调节高斯分布的离散程度,第三偏置可以为1。
当x不大于0时,此处的x为预备方差,指数线性激活函数的输出为,exp()是指数函数,即当预备方差不大于零时,对预备方差进行指数映射处理,得到指数映射结果,将指数映射结果与第三偏置的差值(第一差值)与第三斜率进行相乘处理,第三偏置可以为1,第三斜率是,是大于零的参数,将相乘结果与第三偏置进行求和处理,将求和结果与超参数相乘(对求和结果进行离散处理),得到节点的初始方差,超参数用于调节高斯分布的离散程度。
通过指数线性激活函数可以提高初始方差对节点的表征能力,从而提升后续推荐任务的准确度。
将由初始方差以及初始期望表征的随机分布作为节点的初始随机分布。
步骤2:对节点的至少两个相邻节点的初始向量进行随机分布映射处理,得到至少两个相邻节点的初始随机分布。
步骤1中对节点的初始向量进行随机分布映射处理,得到节点的第一随机分布的实施方式与步骤2中对两个相邻节点的初始向量进行随机分布映射处理,得到至少两个相邻节点的第一随机分布的实施方式类似,需要针对每个相邻节点的初始向量获取对应的第一随机分布。
通过随机分布映射处理可以将向量转化成随机分布,随机分布可以是高斯随机分布、多中心高斯分布等等,通过随机分布可以展示节点信息的多样性,从而提高后续第二分布向量的表征能力,提高推荐准确度。
步骤3:对至少两个相邻节点的初始随机分布进行融合处理,并将针对节点的分布融合结果作为节点的初始融合随机分布。
当相邻节点的数目为一个时,将该相邻节点的初始随机分布作为节点的初始融合随机分布。
作为示例,相邻节点是与节点处于相同连接线的节点,参见图8,以6号节点是对应小王的节点为例,3号节点对应地图A,8号节点对应地图B,7号节点对应地图C,由于小王曾经使用过地图A、地图B以及地图C,因此针对6号节点,3号节点与6号节点处于同一条连接线,7号节点与6号节点处于同一条连接线,8号节点与6号节点也处于同一条连接线,因此6号节点的相邻节点是3号节点、8号节点以及7号节点。
作为示例,对至少两个相邻节点的第一随机分布进行融合处理可以通过Wasserstein融合算法实现,针对每个节点v,给定其相邻节点集合N(v),例如,针对6号节点,相邻节点是3号节点、7号节点以及8号节点,使用Wasserstein融合算法可以为6号节点聚合图网络中3号节点、7号节点以及8号节点的信息,生成3号节点、7号节点以及8号节点的聚合高斯分布表示作为6号节点的初始融合随机分布,参见以下公式(5):
其中,是节点v(6号节点)的初始融合随机分布,()是相邻节点j的初始随机分布,相邻节点j属于,是由3号节点、7号节点以及8号节点构成的集合,WB-AGG()是Wasserstein融合算法表征的聚合函数。后续在步骤1031至步骤1033中将详细说明聚合函数的聚合原理。
步骤4:获取节点的初始融合随机分布的初始融合向量,并对初始融合向量以及节点的初始向量进行合并处理,得到节点的第一分布向量。
作为示例,对于节点v(6号节点)的初始融合随机分布生成节点v的初始融合向量,初始融合向量服从于初始融合随机分布,通过随机数的方式从初始融合随机分布中抽取初始融合向量,可以通过C语言的标准库函数生成,对初始融合向量以及节点的初始向量进行合并处理,参见以下公式(6):
在一些实施例中,参见图3C,步骤102中获取交互图中每个节点的第一分布向量可以通过针对每个节点执行图3C示出的步骤1021至步骤1022实现。
在步骤1021中,通过N个级联的网络层中的第n网络层,对第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果。
图表示学习网络包括N个级联的网络层,N的取值范围满足2≤N,n为取值从1开始递增的整数,且n的取值范围满足1≤n≤N-1。
在步骤1022中,将第n随机分布生成结果传输到第n+1网络层以继续进行随机分布生成处理。
当n取值为1时,第n网络层的输入为节点的初始向量,当n取值为2≤n≤N-1时,第n网络层的输入为第n-1网络层的第n-1随机分布生成结果,当n取值为N-1时,第n+1网络层输出的第n+1随机分布生成结果为节点的第一分布向量。通过迭代的方式可以有效提高第一分布向量的信息表征能力,有助于后续准确完成推荐任务。
当n的取值为1时,上述通过N个级联的网络层中的第n网络层,对第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果的实施方式可以参考上述非迭代方式的说明,不能将步骤4输出的第一分布向量作为步骤102的第一分布向量,而需要将步骤4输出的第一分布向量作为第1层分布向量输入第2网络层,需要再次基于第1层分布向量获取第1层随机分布。
在一些实施例中,参见图3E,当n的取值为2≤n≤N-1时,上述通过N个级联的网络层中的第n网络层,对第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果,可以通过第n网络层执行图3E示出的步骤5-步骤8。
在步骤5中,对节点的第n-1随机分布生成结果进行随机分布映射处理,得到节点的第n-1层随机分布。
第n-1随机分布生成结果是节点的第n-1层分布向量。
作为示例,在通过第n层网络进行第n层迭代时,对节点的第n-1随机分布生成结果进行随机分布映射处理,得到节点的第n-1层随机分布,第n-1层随机分布的期望可以通过以下公式(7)求得:
作为示例,在通过第n层网络进行第n层迭代时,对节点的第n-1随机分布生成结果进行随机分布映射处理,得到节点的第n-1层随机分布,第n-1层随机分布的方差可以通过以下公式(8)求得:
在步骤6中,对节点的至少两个相邻节点的第n-1随机分布生成结果进行随机分布映射处理,得到至少两个相邻节点的第n-1层随机分布。
步骤5的实施方式与步骤6的实施方式类似,需要针对每个相邻节点的第n-1随机分布生成结果获取对应的第n-1层随机分布。
在步骤7中,对至少两个相邻节点的第n-1层随机分布进行第n-1层分布融合处理,并将针对节点的第n-1层分布融合结果作为节点的第n-1层融合随机分布。
当相邻节点的数目为一个时,将该相邻节点的第n-1层随机分布作为节点的第n-1层融合随机分布。
作为示例,对至少两个相邻节点的第n-1层随机分布进行融合处理可以通过Wasserstein融合算法实现,针对每个节点v,给定其相邻节点集合N(v),例如,针对6号节点,相邻节点是3号节点、7号节点以及8号节点,使用Wasserstein融合算法可以为6号节点聚合图网络中3号节点、7号节点以及8号节点的信息,生成3号节点、7号节点以及8号节点的聚合高斯分布表示作为6号节点的第n-1层融合随机分布,参见以下公式(9):
其中,是节点v的第n-1层融合随机分布,是节点v的相邻节点j的第n-1层随机分布,WB-AGG()是Wasserstein融合算法表征的聚合函数,后续在步骤1031至步骤1033中将详细说明聚合函数的聚合原理。
在步骤8中,获取节点的第n-1层融合随机分布的第n-1层融合向量,并对第n-1层融合向量以及第n-1层分布向量进行合并处理,得到节点的第n层分布向量作为第n随机分布生成结果。
作为示例,针对节点v的第n-1层融合随机分布生成节点v的第n-1层融合向量,第n-1层融合向量服从于第n-1层融合随机分布,使用第n-1层融合向量和第n-1层网络输出的节点v的第n-1层分布向量进行合并处理,得到第n层网络输出的节点v的第n层分布向量,参见以下公式(10):
通过迭代的方式可以提高图表示学习网络针对节点信息的表征能力,从而提升后续就第二分布向量进行推荐的准确度。
在步骤103中,对每个节点的至少两个相邻节点的第一随机分布进行融合处理,并将针对每个节点的分布融合结果作为每个节点的至少两个相邻节点的第一融合随机分布。
当相邻节点的数目为1时,将相邻节点的第一随机分布作为第一融合随机分布。
作为示例,相邻节点是与节点处于相同连接线的节点,参见图8,以6号节点是对应小王的节点为例,3号节点对应地图A,8号节点对应地图B,7号节点对应地图C,由于小王曾经使用过地图A、地图B以及地图C,因此针对6号节点,3号节点与6号节点处于同一条连接线,7号节点与6号节点处于同一条连接线,8号节点与6号节点也处于同一条连接线,因此6号节点的相邻节点是3号节点、8号节点以及7号节点。
在一些实施例中,参见图3B,步骤103中对每个节点的至少两个相邻节点的第一随机分布进行融合处理可以通过Wasserstein融合算法实现,即具体通过针对每个节点执行图3B示出的步骤1031至步骤1033实现。
在步骤1031中,对节点的至少两个相邻节点的第一随机分布进行期望融合处理,得到融合期望。
在一些实时中,上述对至少两个相邻节点的第一随机分布进行期望融合处理,得到融合期望,可以通过以下技术方案实现:获取每个相邻节点的第一随机分布的期望、以及对应每个相邻节点的期望权重;基于每个相邻节点的期望权重,对每个相邻节点的第一随机分布的期望进行加权求和处理,得到融合期望。
作为示例,基于多个相邻节点的第一随机分布得到融合期望的过程,可以参见公式(11):
期望权重是对多个第一随机分布的期望进行加权求和时,分配到每个期望的权重,通过对多个第一随机分布的期望进行加权求和处理,可以对多个相邻节点的第一随机分布从期望这个维度进行有效融合,从而第一融合随机分布的期望可以有效表征多个相邻节点的信息。
在步骤1032中,对节点的至少两个相邻节点的第一随机分布进行方差融合处理,得到融合方差。
在一些实施例中,步骤1032中对至少两个相邻节点的第一随机分布进行方差融合处理,得到融合方差,可以通过以下步骤5至步骤6实现:
在步骤5中,通过M个级联的融合层中的第m融合层,对第m融合层的输入进行方差融合处理,得到第m方差融合结果。
其中,M的取值范围满足2≤M,m为取值从1开始递增的整数,且m的取值范围满足1≤m≤M-1。
在一些实施例中,上述通过M个级联的融合层中的第m融合层,对第m融合层的输入进行方差融合处理,得到第m方差融合结果,可以通过以下技术方案实现:通过第m融合层执行以下处理:针对每个相邻节点,将迭代方差与相邻节点的第一随机分布的方差进行相乘处理,并对相乘结果进行求平方根处理,得到对应相邻节点的平方根;基于对应每个相邻节点的方差权重,对至少两个相邻节点的平方根进行加权求和处理,并对加权求和结果进行平方处理,得到平方结果;将平方结果与迭代方差的比值作为第m方差融合结果;其中,当m取值为1时,迭代方差是节点的第一随机分布的方差,当m取值为2≤m≤M-1时,迭代方差是第m-1融合层的第m-1方差融合结果。
作为示例,节点v的协方差可以通过以下公式(12)计算:
其中,针对每个节点v,给定其相邻节点集合N(v),节点v具有相邻节点集合N(v),j节点属于相邻节点集合N(v),是通过第n+1层网络进行第n+1层迭代时,获取到的节点j的第一随机分布的方差,是每个j节点对应的方差权重,是节点v对应时间维度m的协方差,是节点v对应时间维度m+1的协方差(第m方差融合结果),m的取值从零开始到M为止,M为预先配置的数据,例如M为10,当m取值为0时,为通过第n+1层网络进行第n+1层迭代时,获取到的节点v的第一随机分布的方差,将迭代M次得到的第m方差融合结果作为融合方差。
在步骤6中,将第m方差融合结果传输到第m+1融合层以继续进行方差融合处理。
其中,当m取值为1时,第m融合层的输入为至少两个相邻节点的第一随机分布的方差以及节点的第一随机分布的方差,当m取值为2≤m≤M-1时,第m融合层的输入为第m-1融合层的第m-1方差融合结果以及至少两个相邻节点的第一随机分布的方差,当m取值为M-1时,第m+1融合层输出的第m+1方差融合结果为融合方差。
通过迭代的方式对第一随机分布的方差进行融合处理,可以对多个相邻节点的第一随机分布从方差这个维度进行有效融合,得到融合方差,从而第一融合随机分布的方差可以有效表征多个相邻节点的信息。
在步骤1033中,以由融合期望以及融合方差表征的随机分布作为节点的分布融合结果。
通过对多个相邻节点的第一随机分布的期望进行融合处理,可以得到融合期望,通过对多个相邻节点的第一随机分布的方差进行融合处理,可以得到融合方差,由此融合方差以及融合期望表征的分布融合结果(第一融合随机分布)可以有效且多样化表征相邻节点的信息。
在步骤104中,针对每个节点,获取节点的第一融合随机分布的第一融合向量,并对第一融合向量以及节点的第一分布向量进行合并处理,得到节点的第二分布向量。
在一些实施例中,步骤104中对第一融合向量以及节点的第一分布向量进行合并处理,得到节点的第二分布向量,可以通过以下技术方案实现:对第一融合向量以及节点的第一分布向量进行拼接处理,得到拼接向量;对拼接向量进行映射处理,得到节点的第二分布向量。
作为示例,对于节点v(6号节点)的第一融合随机分布生成节点v的第一融合向量,第一融合向量服从于初始融合随机分布,通过随机数的方式从初始融合随机分布中抽取第一融合向量,可以通过C语言的标准库函数生成,对第一融合向量以及节点的第一分布向量进行合并处理,参见以下公式(13):
在步骤105中,基于交互图中至少一个目标节点的第二分布向量,执行针对至少一个目标对象的推荐任务。
作为示例,目标对象是与目标节点对应的对象,可以为推荐对象以及服务对象,目标节点的数量为一个或者多个,根据推荐任务来决定,例如针对某个用户推荐多个地图的推荐场景,则目标节点的数目为多个,例如,判断某个地图是否适合进行无差别推荐,则目标节点的数目为一个。
作为示例,推荐任务可以是连接线预测任务,在求得图网络节点的图向量表示(第二分布向量)后,可以将学习得到的图网络节点的图向量表示应用于不同的场景,例如向游戏玩家推荐地图的推荐场景,可定义表征两个节点的连接可能性的得分函数,如两个节点的图向量表示的向量内积,例如,将用户A的节点(目标节点)的图向量表示与地图1的节点(目标节点)的图向量表示进行内积计算,将用户A的节点的图向量表示与地图2的节点的图向量表示进行内积计算,根据内积计算结果从高到低的顺序对地图1和地图2进行排序,作为用户A对地图的偏好推荐排序,并基于偏好推荐排序向用户A推荐排序靠前的地图1。
作为示例,推荐任务可以是节点分类任务,在求得图网络节点的图向量表示(第二分布向量)后,可以将学习得到的图网络节点的图向量表示应用于不同的场景,例如向游戏玩家推荐地图的推荐场景,可将第二分布向量映射为地图推荐得分,例如,针对地图A(目标节点)的图向量表示得到的地图推荐得分大于推荐得分阈值,将所有用户无分别推荐地图A。
获取能够表征推荐对象与服务对象交互关系的交互图,通过获取交互图可以高效全面地获取推荐对象以及服务对象的信息,生成交互图中每个节点的第一随机分布的第一分布向量,可以表征出节点的信息多样性,对每个节点的至少两个相邻节点的第一随机分布进行融合处理,得到第一融合随机分布,在节点与节点间传播完整的随机分布,而非基于随机分布产生的向量,避免丢失节点信息,将节点的第一融合随机分布的第一融合向量,与节点的第一分布向量进行合并处理,得到节点的第二分布向量,第二分布向量可以准确表征节点在交互图中的信息,从而提高后续推荐任务的准确度。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
在一些实施例中,通过本申请实施例提供的数据处理方法可以实现向游戏用户推荐地图的功能,游戏中配置有地图B、地图C以及地图D供用户使用,训练服务器将训练好的图表示学习网络以及交互图推送至应用服务器,账号A登录终端运行的游戏应用,终端向应用服务器发送用户请求,用户请求携带有账号A的标识,应用服务器获取多个地图,例如地图B、地图C以及地图D,应用服务器获取交互图中对应账号A的节点的表示向量A、地图B的节点的表示向量B、地图C的节点的表示向量C以及地图D的节点的表示向量D,应用服务器确定表示向量A分别与表示向量B、表示向量C以及表示向量D的内积,将内积排序靠前的地图返回至终端进行呈现。
本申请实施例提供一种图表示学习网络,通常应用于对图网络的节点进行分类以针对图网络中的连接关系进行预测。图网络的节点分类任务和连接关系预测任务可用于社交网络中的好友推荐、广告推荐、商品道具推荐,点击率预测等等。下面以向用户推荐游戏地图为例进行说明。
参见图4,图4是本申请实施例提供的数据处理方法的界面示意图,人机交互界面401中显示有热门地图展示页面,显示有多个待使用的地图402,在游戏中用户会下载不同的地图,如何能推荐用户喜欢的地图对于提高游戏活跃增加用户粘度意义重大,可以采取基于图网络的图协同过滤的方式获取用户喜欢的地图以向用户推荐。
参见图5,图5是本申请实施例提供的数据处理方法的推荐示意图,对于向用户推荐地图的问题,在基于图网络的图协同过滤框架中,可以对用户和地图构建一个二分图,然后利用图表示学习网络(例如图卷积神经网络)学习用户和地图的图表示向量(即第二分布向量),最后利用对应图嵌入向量的得分函数衡量用户和道具的链接可能性得分,根据这个得分预测用户可能喜欢的地图。
在一些实施例中,参见图6,图6是本申请实施例提供的数据处理方法的逻辑示意图,本申请实施例提供一种图表示学习网络的训练应用系统。任一电脑或者服务器都可以满足系统运行所需硬件环境,训练应用系统的实现逻辑如图6所示,展示如何通过图表示学习网络的训练应用系统完成图节点分类任务或图连接预测任务,通过图节点以及图节点表示可以执行图节点分类任务,通过图节点对以及图节点表示可以执行图连接预测任务。
在一些实施例中,图结构输入模块需要根据不同的任务,构建对应的图网络结构。以地图推荐任务为例,每个用户和地图可以作为图网络中的节点。当用户和道具之间有交互(比如下载,购买,使用等行为)的时候,就在这两个节点之间构成连接线;同样的,当用户和用户之间有交互(比如加为好友或者组成战队)时,可以在用户节点之间构成连接线;当道具和道具交互(比如具有共同特性)时,可以在道具节点之间构成连接线。
在一些实施例中,参见图7,图7是本申请实施例提供的数据处理方法的应用示意图,以地图推荐任务为例阐述图网络(前述交互图)的构建流程,此例仅考虑用户和地图的交互信息,圆形节点为用户,方形节点为地图。当用户1使用过地图1时,在两个节点间构成连接线。基于图网络的协同过滤方式在学习节点表示的过程中,可以学习用户和地图的高阶关系,更好的预测用户针对地图的偏好。
在一些实施例中,图表示学习通常应用于两种任务,节点分类任务和节点连接预测,两个任务的训练流程相似,此处使用游戏地图推荐场景阐述图表示学习的应用以及训练方法,游戏地图推荐场景可以应用节点连接预测。
在一些实施例中,在用户和地图的二分图中,用户节点和地图节点表示在同一个嵌入式空间,使用G(V,E)来表示这个图网络,V表示图网络中所有节点的集合,所有玩家和地图均在图网络中具有对应的一个节点,E表示图网络中所有边的集合,记录玩家已经使用过的地图。根据图网络G(V,E)学习每个节点v的图表示,然后预测未连接的用户节点和地图节点在未来构成连接的可能性,这种连接的可能性表达了用户在将来使用对应地图的概率。通过本申请实施例提供的数据处理方法学习图网络结构G(V,E)中节点v的图表示。
在一些实施例中,图结构输入模块构建完成图结构G(V,E)之后,本申请实施例使用高斯分布的参数(期望和方差)来表示图网络中的节点,并在图中传播高斯分布的参数。图表示学习网络中,聚合器起到了传播节点信息的作用,针对使用高斯分布的参数来表示节点的方式,本申请实施例提出一种Wasserstein融合算法对高斯分布的参数进行聚合。参见图8,图8是本申请实施例提供的数据处理方法的聚合示意图,图结构中包括节点1-8,节点6具有相邻节点3(期望权重和方差权重均为 )、相邻节点7(期望权重和方差权重均为)和相邻节点8(期望权重和方差权重均为 ),对相邻节点3的期望,相邻节点7的期望,相邻节点8的期望进行聚合,得到节点6的融合期望,对相邻节点3的方差,相邻节点7的方差,相邻节点8的方差进行聚合,得到节点6的融合方差,对融合期望以及融合方差描述的高斯分布进行采样处理,得到节点6的融合向量,将节点6的融合向量与节点6本身的分布向量进行合并处理,得到节点6的向量表示。
在一些实施例中,参见图9,图9是本申请实施例提供的图表示学习网络的流程示意图,在步骤901中,初始化交互图中节点,当迭代次数k低于最大层数K时,基于初始化得到的初始向量执行步骤902,生成节点的高斯分布参数,在步骤903中,基于Wasserstein融合算法对相邻节点的高斯分布参数进行聚合,在步骤904中,基于聚合结果生成节点的向量表示,当迭代次数k不低于最大层数K时,在步骤905中,输出节点的向量表示,当迭代次数k低于最大层数K时,基于向量表示继续执行步骤902。
在一些实施例中,初始化交互图的节点,获取图网络G(V,E)中每个节点v的初始向量,在初始化时可以将节点v的特征xv作为节点v的初始向量,当节点v对应用户时,特征xv用于表征用户对象信息,当节点v对应地图时,特征xv用于表征地图属性信息。在初始化交互图的节点之后,基于初始向量获取节点的高斯分布参数,高斯分布参数包括期望和方差。
作为示例,在通过第k层网络进行第k层迭代时,节点v的高斯分布期望通过以下公式(14)求得:
作为示例,在通过第k层网络进行第k层迭代时,节点v的高斯分布方差通过以下公式(15)求得:
其中,是第k层网络的第二斜率(方差表达权值参数),是第k层网络的第二偏置(方差表达偏置向量参数),是第k-1网络层输出的节点v的第k-1层分布向量,是第k-1层随机分布的方差,Elu为指数线性激活函数,具体表示如以下公式(16)所示:
在一些实施例中,在Wasserstein融合算法中,对每个节点v,给定其相邻节点集合N(v),使用Wasserstein融合算法可以为节点v聚合图网络中相邻节点的信息,生成节点v的聚合高斯分布表示,参见以下公式(17):
接下来,对于节点v的聚合高斯分布表示生成节点v的融合向量,融合向量服从于高斯分布N,其中,为调节高斯分布的离散程度的超参数,使用聚合得到的融合向量和第k-1层网络输出的节点v的向量表示进行合并处理,得到第k层网络输出的节点v的向量表示,参见以下公式(18):
综上,图表示学习网络的输入包括:二分图G(V,E)、每个节点的特征xv、网络层的数目K;每个网络层的权重矩阵Wk,每个网络层的期望权重矩阵,每个网络层的方差权重矩阵,每个网络层的第一偏置向量,每个网络层的方差偏置向量,非线性激活函数,Wasserstein融合算法表征的聚合函数,图表示学习网络的输出包括:节点v的图节点表示向量zv。本申请实施例提供的包括Wasserstein融合算法的图表示学习网络的流程如下所示:
for k=1…K do //执行K次迭代处理;
for v∈V do //针对集合V中每个节点v执行以下处理;
end
end
在上述图表示学习网络的流程中,基于Wasserstein融合算法实现图网络中相邻节点的多个分布的信息聚合过程,相较于在图表示学习中,以节点的向量表示作为聚合对象(例如,求相邻节点的向量表示的期望),本申请实施例提供的Wasserstein融合算法是对表征每个相邻节点的高斯分布进行聚合。
此处,为了聚合相邻节点的随机分布,本申请实施例利用Wasserstein重心来表征,所有相邻节点的Wasserstein重心表示一个距离所有相邻节点的随机分布的Wasserstein距离最小的随机分布。每个节点可以用一个高斯分布表示,聚合后的Wasserstein重心也可以用一个高斯分布表示,聚合后的高斯分布的期望可以通过以下公式(19)计算:
其中,节点v具有相邻节点集合N(v),j节点属于相邻节点集合N(v),是通过第k+1层网络进行第k+1层迭代时,获取到的节点j的高斯分布期望,是每个j节点对应的期望权重,是通过第k+1层网络得到的聚合期望。
节点v的高斯分布的协方差可以通过以下公式(20)计算:
其中,节点v具有相邻节点集合N(v),j节点属于相邻节点集合N(v),是通过第k+1层网络进行第k+1层迭代时,获取到的节点j的高斯分布方差,是每个j节点对应的加权参数,是节点v对应时间维度t的协方差,t的取值从零开始到T为止,当t取值为0时,为通过第k+1层网络进行第k+1层迭代时,获取到的节点v的高斯分布方差。
将迭代T次后得到的协方差表示作为聚合后的高斯分布的方差,参见以下公式(21):
综上,Wasserstein融合算法的输入包括:节点i的相邻节点j,相邻节点j的随机分布,;网络层序:k;迭代次数:T,Wasserstein融合算法的输出包括:聚合后节点i的重心分布,。本申请实施例提供的Wasserstein融合算法表征的聚合函数的流程如下:
Forward: //Wasserstein融合算法的前向处理过程如下;
For t=1…T do //执行T次迭代处理;
End
Backward: //Wasserstein融合算法的梯度计算过程如下;
for j∈N(v) do //针对节点v的相邻节点j进行以下处理;
End
在求得图网络节点的图向量表示后,可以将学习得到的图网络节点的图向量表示应用于不同的场景,例如向游戏玩家推荐地图的推荐场景,可定义表征两个节点的连接可能性的得分函数,如两个节点的图向量表示的向量内积,例如,将用户A的节点的图向量表示与地图1的节点的图向量表示进行内积计算,将用户A的节点的图向量表示与地图2的节点的图向量表示进行内积计算,根据内积计算结果从高到低的顺序对地图1和地图2进行排序,作为用户A对地图的偏好推荐排序。
为了证明本申请实施例提供的图表示学习网络的有效性,申请人在图节点分类任务上进行了实验,实验包含了三个数据集,数据集概况如表1所示:
表1 论文引用数据集的对比表
Cora、PubMed、Citeseer是三个论文引用数据集,由论文和论文间的关系构成的图网络,这些关系包括:引用关系、共同的作者等,具有天然的图结构,数据集的任务是论文的分类和连接的预测。每个节点是一篇论文,所有节点被分为多个类别,每篇论文都由一个高维的词向量表示,作为节点特征。词向量表示的每个元素都对应一个词,且该元素只有0或1两个取值。
以Cora为例,Cora包含2708个论文节点,词向量特征为1433维,论文包含7个类别,分别是1)基于案例;2)遗传算法;3)神经网络;4)概率方法;5)强化学习;6)规则学习;7)理论。论文间的引用关系构成了5429条连接线。Citeseer,Pubmed也具有相似的图网络结构。
可以提取图网络中80%的节点以及对应的标注进行分类任务的训练,将图网络中剩余20%的节点进行测试,预测节点的类型。实验结果表明,本申请实施例提供的图表示学习网络在图节点分类任务上取得了更高的准确率,实验结果参见表2以及表3,T类型数据集表征训练数据与验证数据相同,I类型数据集表征训练数据与验证数据不相同,表2以及表3中记录有各个模型的节点分类的准确率:
表2 各个模型在T类型数据集的准确率
表3 各个模型在I类型数据集的准确率
可以理解的是,在本申请实施例中,涉及到用户信息等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面继续说明本申请实施例提供的基于人工智能的数据处理装置255的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器250的基于人工智能的数据处理装置255中的软件模块可以包括:获取模块2551,用于获取交互图,其中,交互图包括与每个服务对象和每个推荐对象对应的节点、以及多个节点之间的连接线,连接线表征所连接的两个节点对应的对象之间具有交互关系;生成模块2552,用于获取交互图中每个节点的第一分布向量,并基于每个节点的第一分布向量生成每个节点的第一随机分布;融合模块2553,用于对每个节点的至少两个相邻节点的第一随机分布进行融合处理,并将针对每个节点的分布融合结果作为每个节点的至少两个相邻节点的第一融合随机分布,其中,相邻节点是与节点处于相同连接线的节点;合并模块2554,用于针对每个节点,获取节点的第一融合随机分布的第一融合向量,并对第一融合向量以及节点的第一分布向量进行合并处理,得到节点的第二分布向量;推荐模块2555,用于基于至少一个目标节点的第二分布向量,执行针对至少一个目标节点的推荐任务。
在一些实施例中,生成模块2552,还用于:针对每个节点执行以下处理:对节点的初始向量进行随机分布映射处理,得到节点的初始随机分布;对节点的至少两个相邻节点的初始向量进行随机分布映射处理,得到至少两个相邻节点的初始随机分布;对至少两个相邻节点的初始随机分布进行融合处理,并将针对节点的分布融合结果作为节点的初始融合随机分布;获取节点的初始融合随机分布的初始融合向量,并对初始融合向量以及节点的初始向量进行合并处理,得到节点的第一分布向量。
在一些实施例中,生成模块2552,还用于:对第一斜率与初始向量进行点积处理,得到第一点积结果;基于第一偏置对第一点积结果进行偏置处理,得到节点的初始期望;对第二斜率与初始向量进行点积处理,得到第二点积结果;基于第二偏置对第二点积结果进行偏置处理,得到节点的预备方差;对预备方差进行激活处理,得到节点的初始方差;将由初始方差以及初始期望表征的随机分布作为节点的初始随机分布。
在一些实施例中,生成模块2552,还用于:当预备方差大于零时,将预备方差与第三偏置的求和结果作为节点的初始方差;当预备方差不大于零时,对预备方差进行指数映射处理,得到指数映射结果,将指数映射结果与第三偏置的差值与第三斜率进行相乘处理,将相乘结果与第三偏置进行求和处理,得到节点的初始方差。
在一些实施例中,生成模块2552,还用于:针对每个节点执行以下处理:通过N个级联的网络层中的第n网络层,对第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果;其中,N的取值范围满足2≤N,n为取值从1开始递增的整数,且n的取值范围满足1≤n≤N-1;将第n随机分布生成结果传输到第n+1网络层以继续进行随机分布生成处理;其中,当n取值为1时,第n网络层的输入为节点的初始向量,当n取值为2≤n≤N-1时,第n网络层的输入为第n-1网络层的第n-1随机分布生成结果,当n取值为N-1时,第n+1网络层输出的第n+1随机分布生成结果为节点的第一分布向量。
在一些实施例中,当n的取值为2≤n≤N-1时,生成模块2552,还用于:通过第n网络层执行以下处理:对节点的第n-1随机分布生成结果进行随机分布映射处理,得到节点的第n-1层随机分布,其中,第n-1随机分布生成结果是节点的第n-1层分布向量;对节点的至少两个相邻节点的第n-1随机分布生成结果进行随机分布映射处理,得到至少两个相邻节点的第n-1层随机分布;对至少两个相邻节点的第n-1层随机分布进行第n-1层分布融合处理,并将针对节点的第n-1层分布融合结果作为节点的第n-1层融合随机分布;获取节点的第n-1层融合随机分布的第n-1层融合向量,并对第n-1层融合向量以及第n-1层分布向量进行合并处理,得到节点的第n层分布向量作为第n随机分布生成结果。
在一些实施例中,生成模块2552,还用于:在生成交互图中每个节点的第一随机分布的第一分布向量之前,当节点对应服务对象时,获取服务对象的第一属性数据,并对第一属性数据进行第一嵌入压缩处理,得到第一属性向量;当节点对应推荐对象时,获取推荐对象的第二属性数据,并对第二属性数据进行第二嵌入压缩处理,得到第二属性向量;将第一属性向量或第二属性向量作为节点的初始向量。
在一些实施例中,融合模块2553,还用于:针对每个节点执行以下处理:对至少两个相邻节点的第一随机分布进行期望融合处理,得到融合期望;对至少两个相邻节点的第一随机分布进行方差融合处理,得到融合方差;以由融合期望以及融合方差表征的随机分布作为节点的分布融合结果。
在一些实施例中,融合模块2553,还用于:获取每个相邻节点的第一随机分布的期望、以及对应每个相邻节点的期望权重;基于每个相邻节点的期望权重,对每个相邻节点的第一随机分布的期望进行加权求和处理,得到融合期望。
在一些实施例中,融合模块2553,还用于:通过M个级联的融合层中的第m融合层,对第m融合层的输入进行方差融合处理,得到第m方差融合结果;其中,M的取值范围满足2≤M,m为取值从1开始递增的整数,且m的取值范围满足1≤m≤M-1;将第m方差融合结果传输到第m+1融合层以继续进行方差融合处理;其中,当m取值为1时,第m融合层的输入为至少两个相邻节点的第一随机分布的方差以及节点的第一随机分布的方差,当m取值为2≤m≤M-1时,第m融合层的输入为第m-1融合层的第m-1方差融合结果以及至少两个相邻节点的第一随机分布的方差,当m取值为M-1时,第m+1融合层输出的第m+1方差融合结果为融合方差。
在一些实施例中,融合模块2553,还用于:通过第m融合层执行以下处理:针对每个相邻节点,将迭代方差与相邻节点的第一随机分布的方差进行相乘处理,并对相乘结果进行求平方根处理,得到对应相邻节点的平方根;将对应至少两个相邻节点的平方根进行求和处理,并对求和结果进行平方处理,得到平方结果;将平方结果与迭代方差的比值作为第m方差融合结果;其中,当m取值为1时,迭代方差是节点的第一随机分布的方差,当m取值为2≤m≤M-1时,迭代方差是第m-1融合层的第m-1方差融合结果。
在一些实施例中,合并模块2554,还用于:对第一融合向量以及节点的第一分布向量进行拼接处理,得到拼接向量;对拼接向量进行映射处理,得到节点的第二分布向量。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的基于人工智能的数据处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的基于人工智能的数据处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本申请实施例获取能够表征推荐对象与服务对象交互关系的交互图,通过获取交互图可以高效全面地获取推荐对象以及服务对象的信息,生成交互图中每个节点的第一随机分布的第一分布向量,可以表征出节点的信息多样性,对每个节点的至少两个相邻节点的第一随机分布进行融合处理,得到第一融合随机分布,在节点与节点间传播完整的随机分布,而非基于随机分布产生的向量,避免丢失节点信息,将节点的第一融合随机分布的第一融合向量,与节点的第一分布向量进行合并处理,得到节点的第二分布向量,第二分布向量可以准确表征节点在交互图中的信息,从而提高后续推荐任务的准确度。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (14)
1.一种基于人工智能的数据处理方法,其特征在于,所述方法包括:
获取交互图,其中,所述交互图包括与每个服务对象和每个推荐对象对应的节点、以及多个所述节点之间的连接线,所述连接线表征所连接的两个所述节点对应的对象之间具有交互关系;
获取所述交互图中每个所述节点的第一分布向量,并基于每个所述节点的第一分布向量生成每个所述节点的第一随机分布;
对每个所述节点的至少两个相邻节点的第一随机分布进行融合处理,并将针对每个所述节点的分布融合结果作为每个所述节点的至少两个相邻节点的第一融合随机分布,其中,所述相邻节点是与所述节点处于相同连接线的节点;
针对每个所述节点,获取所述节点的第一融合随机分布的第一融合向量,并对所述第一融合向量以及所述节点的第一分布向量进行合并处理,得到所述节点的第二分布向量;
基于所述交互图中至少一个目标节点的第二分布向量,执行针对至少一个目标对象的推荐任务,其中,所述目标对象是与所述目标节点对应的对象。
2.根据权利要求1所述的方法,其特征在于,所述获取所述交互图中每个所述节点的第一分布向量,包括:
针对每个所述节点执行以下处理:
对所述节点的初始向量进行随机分布映射处理,得到所述节点的初始随机分布;
对所述节点的至少两个相邻节点的初始向量进行随机分布映射处理,得到所述至少两个相邻节点的初始随机分布;对所述至少两个相邻节点的初始随机分布进行融合处理,并将分布融合结果作为所述节点的初始融合随机分布;
获取所述节点的初始融合随机分布的初始融合向量,并对所述初始融合向量以及所述节点的初始向量进行合并处理,得到所述节点的第一分布向量。
3.根据权利要求2所述的方法,其特征在于,所述对所述节点的初始向量进行随机分布映射处理,得到所述节点的初始随机分布,包括:
对第一斜率与所述初始向量进行点积处理,得到第一点积结果;
基于第一偏置对所述第一点积结果进行偏置处理,得到所述节点的初始期望;
对第二斜率与所述初始向量进行点积处理,得到第二点积结果;
基于第二偏置对所述第二点积结果进行偏置处理,得到所述节点的预备方差;
对所述预备方差进行激活处理,得到所述节点的初始方差;
将由所述初始方差以及所述初始期望表征的随机分布作为所述节点的初始随机分布。
4.根据权利要求3所述的方法,其特征在于,所述对所述预备方差进行激活处理,得到所述节点的初始方差,包括:
当所述预备方差大于零时,获取所述预备方差与第三偏置的求和结果,并对求和结果进行离散处理,得到所述节点的初始方差;
当所述预备方差不大于零时,对所述预备方差进行指数映射处理,得到指数映射结果,将第一差值与第三斜率进行相乘处理,其中,所述第一差值是所述指数映射结果与所述第三偏置的差值;
将相乘结果与所述第三偏置进行求和处理,并对求和结果进行离散处理,得到所述节点的初始方差。
5.根据权利要求1所述的方法,其特征在于,所述获取所述交互图中每个所述节点的第一分布向量,包括:
针对每个所述节点执行以下处理:
通过N个级联的网络层中的第n网络层,对所述第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果;
其中,N的取值范围满足2≤N,n为取值从1开始递增的整数,且n的取值范围满足1≤n≤N-1;
将所述第n随机分布生成结果传输到第n+1网络层以继续进行随机分布生成处理;
其中,当n取值为1时,所述第n网络层的输入为所述节点的初始向量,当n取值为2≤n≤N-1时,所述第n网络层的输入为第n-1网络层的第n-1随机分布生成结果,当n取值为N-1时,所述第n+1网络层输出的第n+1随机分布生成结果为所述节点的第一分布向量。
6.根据权利要求5所述的方法,其特征在于,当所述n的取值为2≤n≤N-1时,所述通过N个级联的网络层中的第n网络层,对所述第n网络层的输入进行随机分布生成处理,得到第n随机分布生成结果,包括:
通过所述第n网络层执行以下处理:
对所述节点的第n-1随机分布生成结果进行随机分布映射处理,得到所述节点的第n-1层随机分布,其中,所述第n-1随机分布生成结果是所述节点的第n-1层分布向量;
对所述节点的至少两个相邻节点的第n-1随机分布生成结果进行随机分布映射处理,得到所述至少两个相邻节点的第n-1层随机分布;
对所述至少两个相邻节点的第n-1层随机分布进行第n-1层分布融合处理,并将针对所述节点的第n-1层分布融合结果作为所述节点的第n-1层融合随机分布;
获取所述节点的第n-1层融合随机分布的第n-1层融合向量,并对所述第n-1层融合向量以及所述第n-1层分布向量进行合并处理,得到所述节点的第n层分布向量作为所述第n随机分布生成结果。
7.根据权利要求2或5所述的方法,其特征在于,在获取所述交互图中每个所述节点的第一分布向量之前,所述方法还包括:
当所述节点对应所述服务对象时,获取所述服务对象的第一属性数据,并对所述第一属性数据进行第一嵌入压缩处理,得到第一属性向量,将所述第一属性向量作为所述节点的初始向量;
当所述节点对应所述推荐对象时,获取所述推荐对象的第二属性数据,并对所述第二属性数据进行第二嵌入压缩处理,得到第二属性向量,将所述第二属性向量作为所述节点的初始向量。
8.根据权利要求1所述的方法,其特征在于,所述对每个所述节点的至少两个相邻节点的第一随机分布进行融合处理,包括:
针对每个所述节点执行以下处理:
对所述节点的至少两个相邻节点的第一随机分布进行期望融合处理,得到融合期望;
对所述节点的至少两个相邻节点的第一随机分布进行方差融合处理,得到融合方差;
以由所述融合期望以及所述融合方差表征的随机分布作为所述节点的分布融合结果。
9.根据权利要求8所述的方法,其特征在于,所述对所述节点的至少两个相邻节点的第一随机分布进行期望融合处理,得到融合期望,包括:
获取每个所述相邻节点的第一随机分布的期望、以及对应每个所述相邻节点的期望权重;
基于每个所述相邻节点的期望权重,对每个所述相邻节点的第一随机分布的期望进行加权求和处理,得到所述融合期望。
10.根据权利要求8所述的方法,其特征在于,所述对所述节点的至少两个相邻节点的第一随机分布进行方差融合处理,得到融合方差,包括:
通过M个级联的融合层中的第m融合层,对所述第m融合层的输入进行方差融合处理,得到第m方差融合结果;
其中,M的取值范围满足2≤M,m为取值从1开始递增的整数,且m的取值范围满足1≤m≤M-1;
将所述第m方差融合结果传输到第m+1融合层以继续进行方差融合处理;
其中,当m取值为1时,所述第m融合层的输入为所述至少两个相邻节点的第一随机分布的方差以及所述节点的第一随机分布的方差,当m取值为2≤m≤M-1时,所述第m融合层的输入为第m-1融合层的第m-1方差融合结果以及所述至少两个相邻节点的第一随机分布的方差,当m取值为M-1时,所述第m+1融合层输出的第m+1方差融合结果为所述融合方差。
11.根据权利要求10所述的方法,其特征在于,所述通过M个级联的融合层中的第m融合层,对所述第m融合层的输入进行方差融合处理,得到第m方差融合结果,包括:
通过所述第m融合层执行以下处理:
针对每个所述相邻节点,将迭代方差与所述相邻节点的第一随机分布的方差进行相乘处理,并对相乘结果进行求平方根处理,得到对应所述相邻节点的平方根;
基于对应每个所述相邻节点的方差权重,对所述至少两个相邻节点的平方根进行加权求和处理,并对加权求和结果进行平方处理,得到平方结果;
将所述平方结果与所述迭代方差的比值作为所述第m方差融合结果;
其中,当m取值为1时,所述迭代方差是所述节点的第一随机分布的方差,当m取值为2≤m≤M-1时,所述迭代方差是所述第m-1融合层的第m-1方差融合结果。
12.一种基于人工智能的数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取交互图,其中,所述交互图包括与每个服务对象和每个推荐对象对应的节点、以及多个所述节点之间的连接线,所述连接线表征所连接的两个所述节点对应的对象之间具有交互关系;
生成模块,用于获取所述交互图中每个所述节点的第一分布向量,并基于每个所述节点的第一分布向量生成每个所述节点的第一随机分布;
融合模块,用于对每个所述节点的至少两个相邻节点的第一随机分布进行融合处理,并将针对每个所述节点的分布融合结果作为每个所述节点的至少两个相邻节点的第一融合随机分布,其中,所述相邻节点是与所述节点处于相同连接线的节点;
合并模块,用于针对每个所述节点,获取所述节点的第一融合随机分布的第一融合向量,并对所述第一融合向量以及所述节点的第一分布向量进行合并处理,得到所述节点的第二分布向量;
推荐模块,用于基于所述交互图中至少一个目标节点的第二分布向量,执行针对至少一个目标对象的推荐任务,其中,所述目标对象是与所述目标节点对应的对象。
13.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至11任一项所述的基于人工智能的数据处理方法。
14.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至11任一项所述的基于人工智能的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210720773.1A CN114817751B (zh) | 2022-06-24 | 2022-06-24 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210720773.1A CN114817751B (zh) | 2022-06-24 | 2022-06-24 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114817751A CN114817751A (zh) | 2022-07-29 |
CN114817751B true CN114817751B (zh) | 2022-09-23 |
Family
ID=82521472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210720773.1A Active CN114817751B (zh) | 2022-06-24 | 2022-06-24 | 数据处理方法、装置、电子设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114817751B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476223A (zh) * | 2020-06-24 | 2020-07-31 | 支付宝(杭州)信息技术有限公司 | 评估交互事件的方法及装置 |
CN113468227A (zh) * | 2021-06-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 基于图神经网络的信息推荐方法、系统、设备和存储介质 |
CN113626719A (zh) * | 2021-10-12 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备、存储介质及计算机程序产品 |
CN114282587A (zh) * | 2021-09-03 | 2022-04-05 | 北京大学 | 数据处理方法、装置、计算机设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018024137A1 (zh) * | 2016-08-04 | 2018-02-08 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、设备和存储介质 |
CN110602532A (zh) * | 2019-09-24 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 实体物品推荐方法、装置、服务器及存储介质 |
US11494617B2 (en) * | 2020-02-12 | 2022-11-08 | Huawei Technologies Co., Ltd. | Recommender system using bayesian graph convolution networks |
CN111881363B (zh) * | 2020-06-23 | 2024-06-25 | 北京工业大学 | 一种基于图交互网络的推荐方法 |
CN112069415B (zh) * | 2020-08-13 | 2023-11-24 | 中国海洋大学 | 一种基于异构属性网络表征学习的兴趣点推荐方法 |
CN112395515B (zh) * | 2021-01-19 | 2021-04-16 | 腾讯科技(深圳)有限公司 | 一种信息推荐方法、装置、计算机设备及存储介质 |
CN113407817A (zh) * | 2021-01-25 | 2021-09-17 | 北京工业大学 | 一种基于注意力机制的图神经协同过滤方法 |
CN113378047B (zh) * | 2021-06-10 | 2022-10-21 | 武汉大学 | 一种基于多方面增强的图神经网络推荐方法 |
CN114154068A (zh) * | 2021-12-06 | 2022-03-08 | 清华大学 | 媒体内容推荐方法、装置、电子设备及存储介质 |
CN114519600A (zh) * | 2021-12-30 | 2022-05-20 | 天翼电子商务有限公司 | 一种融合相邻节点方差的图神经网络ctr预估算法 |
-
2022
- 2022-06-24 CN CN202210720773.1A patent/CN114817751B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476223A (zh) * | 2020-06-24 | 2020-07-31 | 支付宝(杭州)信息技术有限公司 | 评估交互事件的方法及装置 |
CN113468227A (zh) * | 2021-06-25 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 基于图神经网络的信息推荐方法、系统、设备和存储介质 |
CN114282587A (zh) * | 2021-09-03 | 2022-04-05 | 北京大学 | 数据处理方法、装置、计算机设备及存储介质 |
CN113626719A (zh) * | 2021-10-12 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备、存储介质及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN114817751A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113626719B (zh) | 信息推荐方法、装置、设备、存储介质及计算机程序产品 | |
CN111428147B (zh) | 结合社交和兴趣信息的异源图卷积网络的社交推荐方法 | |
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
JP7499409B2 (ja) | マルチホップアテンショングラフニューラルネットワークに基づく関係学習方法およびシステム | |
EP3862893A1 (en) | Recommendation model training method, recommendation method, device, and computer-readable medium | |
CN112085172B (zh) | 图神经网络的训练方法及装置 | |
CN111080360B (zh) | 行为预测方法、模型训练方法、装置、服务器及存储介质 | |
CN110378434A (zh) | 点击率预测模型的训练方法、推荐方法、装置及电子设备 | |
CN111242310B (zh) | 特征有效性评估方法、装置、电子设备及存储介质 | |
CN111967971B (zh) | 银行客户数据处理方法及装置 | |
CN111461841A (zh) | 物品推荐方法、装置、服务器及存储介质 | |
CN111949886B (zh) | 一种用于信息推荐的样本数据生成方法和相关装置 | |
CN114202061A (zh) | 基于生成对抗网络模型及深度强化学习的物品推荐方法、电子设备及介质 | |
CN110222838B (zh) | 文档排序方法、装置、电子设备及存储介质 | |
CN111695965A (zh) | 基于图神经网络的产品筛选方法、系统及设备 | |
US20240211991A1 (en) | Data processing method, apparatus, and computer-readable storage medium | |
CN115358809A (zh) | 一种基于图对比学习的多意图推荐方法及装置 | |
WO2024152686A1 (zh) | 确定资源信息的推荐指标的方法、装置、设备、存储介质及计算机程序产品 | |
US10579752B2 (en) | Generating a model based on input | |
CN116340643B (zh) | 对象推荐的调整方法及装置、存储介质、电子设备 | |
CN114817751B (zh) | 数据处理方法、装置、电子设备、存储介质及程序产品 | |
CN114756768B (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 | |
CN108920492B (zh) | 一种网页分类方法、系统、终端及存储介质 | |
CN113837843B (zh) | 产品推荐方法、装置、介质及电子设备 | |
CN113342868B (zh) | 一种信息推荐方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40071000 Country of ref document: HK |