CN116541592A

CN116541592A - 向量生成方法、信息推荐方法、装置、设备及介质

Info

Publication number: CN116541592A
Application number: CN202310403959.9A
Authority: CN
Inventors: 蔡少雄; 刘博�; 乔鹏飞
Original assignee: Weimeng Chuangke Network Technology China Co Ltd
Current assignee: Weimeng Chuangke Network Technology China Co Ltd
Priority date: 2023-04-14
Filing date: 2023-04-14
Publication date: 2023-08-04

Abstract

本公开提供向量生成方法、信息推荐方法、装置、设备及介质。包括：获取样本数据集；基于行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量；对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；对每一用户数据的第二嵌入向量进行处理，得到每一用户数据对应的用户向量；基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据的信息向量进行更新。通过该方法能获得更优的更新后的信息向量，从而提升信息推荐的准确度。

Description

向量生成方法、信息推荐方法、装置、设备及介质

技术领域

本公开涉及但不限于人工智能技术领域，尤其涉及一种向量生成方法、信息推荐方法、装置、设备及介质。

背景技术

在当前信息量急速膨胀的互联网时代，每一个用户都面向了海量的数据，推荐系统可以从海量的数据信息中快速推荐出符合用户特点的数据。

在推荐场景中大量使用独热(one-hot)编码对样本的特征进行编码，导致样本的特征维度很高但却非常稀疏。深度学习的结构特点却不擅长处理稀疏的特征向量，所以几乎所有的深度学习模型都需要Embedding(“向量化”或者“向量映射”)层作为第一层来将高维稀疏的特征映射到一个相对低维的且稠密的向量上来以便于上层深度神经网络处理。经过Embedding层得到的embedding本身就是极其重要的特征向量，推荐系统算法模型时，embedding是重要的一个步骤，有的推荐算法模型其实就是在做embedding的过程，可见embedding在推荐系统中的重要性。

发明内容

本公开实施例提供一种向量生成方法、信息推荐方法、装置、设备及介质，能够提升信息推荐的准确性。

本公开实施例的技术方案是这样实现的：

第一方面，本公开实施例提供一种向量生成方法，所述方法包括：

获取样本数据集；其中，所述样本数据集中每个样本数据包括用户数据、信息数据、以及用户对所行为的信息数据的行为类型标签；

基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量；

对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；

对每一用户数据的第二嵌入向量进行处理，得到每一用户数据对应的用户向量；

基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据对应的信息向量进行更新；其中，更新后的信息向量用于信息推荐。

在一些实施例中，所述基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量，包括：

基于所述样本数据集获取包括多个节点的二分图；其中，所述二分图中所述节点的节点类型包括用户节点、以及信息节点；一个用户节点用于表征一个用户数据，一个信息节点用于表征一个信息数据；所述二分图中相连接的用户节点和信息节点之间通过行为类型标签关联；

对每一节点的节点数据进行特征提取，得到每一节点数据的第一特征向量；

针对每一节点，根据行为类型标签对邻居节点进行采样，并融合所述节点和采样的邻居节点的第一特征向量，得到所述节点融合后的第二特征向量；其中，不同行为类型标签对应的邻居节点的采样权重不同；

将所述二分图中，每一信息节点融合后的第二特征向量作为每一信息数据至少融合用户数据后的第一嵌入向量；

将所述二分图中，每一用户节点融合后的第二特征向量作为每一用户数据至少融合信息数据后的第二嵌入向量。

在一些实施例中，所述对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，包括：

根据行为类型标签对信息数据进行分类，得到不同行为类型标签的信息数据集；

针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；其中，不同行为类型标签对应的向量处理方式不同。

在一些实施例中，所述行为类型标签包括点击行为标签；所述针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，包括：

基于SENet模型学习点击行为标签的信息数据集中每一信息数据的第一嵌入向量对应的第一权重；

利用所述第一权重对点击行为标签的信息数据集中所述第一权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为标签的信息数据集中每一信息数据对应的信息向量。

在一些实施例中，所述行为类型标签包括点击行为之外的行为标签；所述针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，包括：

对点击行为之外的行为标签信息数据集中关联同一用户的各信息数据，按照信息数据的行为发生时间组合各信息数据的第一嵌入向量；

利用自注意力机制学习关联同一用户组合后的每一信息数据的第一嵌入向量对应的第二权重；

针对点击行为之外的行为标签信息数据集中每一信息数据，利用第二权重对与所述第二权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为之外的行为标签信息数据集中每一信息数据对应的信息向量。

在一些实施例中，所述基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据对应的信息向量进行更新，包括：

确定每一信息数据的信息向量与每一用户数据的用户向量之间的相似度；

根据每一信息向量与每一用户向量之间的相似度，确定所述图神经网络的预设目标损失函数的总损失；其中，所述预设目标损失函数为基于信息数据的行为时长进行加权的函数，权重与所述行为时长正相关；

基于所述总损失，对每一信息数据对应的信息向量进行更新。

第二方面，本公开实施例提供一种信息推荐方法，所述方法还包括：

获取目标用户的用户数据以及历史信息数据序列；

根据所述目标用户的用户数据以及历史信息数据序列，确定所述目标用户的目标用户向量；

将所述目标用户向量与信息数据集中每一信息数据的信息向量进行相似度计算，获得各信息数据对应的相似度计算结果；其中，所述信息数据集中每一信息数据的信息向量为基于第一方面所述的方法获得的更新后的信息向量；

根据各信息数据对应的相似度计算结果，将预设数量的相似度靠前的信息数据推荐给所述目标用户。

第三方面，本公开实施例提供一种向量生成装置，所述装置包括：

第一获取模块，配置为获取样本数据集；其中，所述样本数据集中每个样本数据包括用户数据、信息数据、以及用户对所行为的信息数据的行为类型标签；

第一得到模块，配置为基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量；

第二得到模块，配置为对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；

第三得到模块，配置为对每一用户数据的第二嵌入向量进行处理，得到每一用户数据对应的用户向量；

更新模块，配置为基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据对应的信息向量进行更新；其中，更新后的信息向量用于信息推荐。

在一些实施例中，所述第一得到模块，配置为基于所述样本数据集获取包括多个节点的二分图；其中，所述二分图中所述节点的节点类型包括用户节点、以及信息节点；一个用户节点用于表征一个用户数据，一个信息节点用于表征一个信息数据；所述二分图中相连接的用户节点和信息节点之间通过行为类型标签关联；对每一节点的节点数据进行特征提取，得到每一节点数据的第一特征向量；针对每一节点，根据行为类型标签对邻居节点进行采样，并融合所述节点和采样的邻居节点的第一特征向量，得到所述节点融合后的第二特征向量；其中，不同行为类型标签对应的邻居节点的采样权重不同；将所述二分图中，每一信息节点融合后的第二特征向量作为每一信息数据至少融合用户数据后的第一嵌入向量；将所述二分图中，每一用户节点融合后的第二特征向量作为每一用户数据至少融合信息数据后的第二嵌入向量。

在一些实施例中，所述第二得到模块，配置为根据行为类型标签对信息数据进行分类，得到不同行为类型标签的信息数据集；针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；其中，不同行为类型标签对应的向量处理方式不同。

在一些实施例中，所述行为类型标签包括点击行为标签；所述第二得到模块，配置为基于SENet模型学习点击行为标签的信息数据集中每一信息数据的第一嵌入向量对应的第一权重；利用第一权重对点击行为标签的信息数据集中所述第一权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为标签的信息数据集中每一信息数据对应的信息向量。

在一些实施例中，所述行为类型标签包括点击行为之外的行为标签；所述第二得到模块，配置为对点击行为之外的行为标签信息数据集中关联同一用户的各信息数据，按照信息数据的行为发生时间组合各信息数据的第一嵌入向量；利用自注意力机制学习关联同一用户组合后的每一信息数据的第一嵌入向量对应的第二权重；针对点击行为之外的行为标签信息数据集中每一信息数据，利用第二权重对与所述第二权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为之外的行为标签信息数据集中每一信息数据对应的信息向量。

在一些实施例中，所述更新模块，配置为确定每一信息数据的信息向量与每一用户数据的用户向量之间的相似度；根据每一信息向量与每一用户向量之间的相似度，确定所述图神经网络的预设目标损失函数的总损失；其中，所述预设目标损失函数为基于信息数据的行为时长进行加权的函数，权重与所述行为时长正相关；基于所述总损失，对每一信息数据对应的信息向量进行更新。

第四方面，本公开实施例提供一种信息推荐装置，所述装置包括：

第二获取模块，配置为获取目标用户的用户数据以及历史信息数据序列；

确定模块，配置为根据所述目标用户的用户数据以及历史信息数据序列，确定所述目标用户的目标用户向量；

相似度计算模块，配置为将所述目标用户向量与信息数据集中每一信息数据的信息向量进行相似度计算，获得各信息数据对应的相似度计算结果；其中，所述信息数据集中每一信息数据的信息向量为基于第一方面所述的方法获得的更新后的信息向量；

推荐模块，配置为根据各信息数据对应的相似度计算结果，将预设数量的相似度靠前的信息数据推荐给所述目标用户。

第五方面，本公开实施例提供一种计算机设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行第一方面或第二方面中所述的方法。

第六方面，本公开实施例提供一种存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现第一方面或第二方面中所述的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：

在本公开实施例中，基于信息数据的行为类型标签和图神经网络确定第一嵌入向量和第二嵌入向量，然后再基于第一嵌入向量生成信息向量，基于第二嵌入向量生成用户向量后对信息向量进行更新，以基于更新后的信息向量进行信息推荐，采用的是一种基于图网络的双塔模型的方法，一方面，基于信息数据的行为类型标签能优化嵌入向量(包括第一嵌入向量和第二嵌入向量)的生成质量或生成效率，基于图神经网络能获得质量较优的嵌入向量，因而能获得更优的更新后的信息向量；另一方面，基于双塔模型的方法适合离线生成信息向量后进行在线检索，能提升信息推荐的效率，因而本公开实施例提供的向量生成方法，能有助于提升信息推荐的准确度和效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

图1为本公开实施例提供的一种向量生成方法流程图。

图2为本公开实施例中二分图的示例图。

图3是本公开实施例中一种基于双塔模型的博文向量生成方法的原理框图。

图4为本公开实施例提供的一种信息推荐方法流程图。

图5是根据一示例性实施例示出的一种向量生成装置图。

图6是根据一示例性实施例示出的一种信息推荐装置图。

图7为本公开实施例中计算机设备的一种硬件实体示意图。

具体实施方式

为了使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开作进一步地详细描述，所描述的实施例不应视为对本公开的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本公开保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本公开实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的，不是旨在限制本公开。

本公开实施例中，信息推荐中的信息可以商品、也可以是广告数据，还可以是微博中的博文数据等等，本公开实施例不做限制。上述信息在推荐领域也被称之为物品(item)。

近几年来，人们根据实际的应用过程提出了许多高效的item embedding化的架构和方法以产生高效的特征，虽然这些方法在模型和数据的采样和聚合方式上有所不同，但是基本上可归纳为两个方向进行改进。一种方式是为了减缓物品的冷启动问题，大多数方法采用增加物品的附加信息(例如类别信息)，利用附加信息使得相近的embedding向量尽可能的聚合在一起。另一种方式是归纳式聚合图神经网络，采用大规模图神经网络，利用用户社交之间的链接关系，对邻居进行采样，通过多层的聚合将相邻的节点聚合在一起，最后用聚合的信息表示用户和物品的embedding。

对于这样的embedding生成框架中，在实际应用中主要存在以下问题：1)训练和线上实际应用存在一定的数据偏差，社交网络采用离线聚合方式无法学习到准确的embedding；2)用户对信息的消费深度不一，采用统一的聚合方式无法获得准确的embedding；针对以上问题，在embedding向量化的实际落地项目的过程中，我们需要花大量的实验和资源去不断更新模型和权重以保证实效性，大大影响了线上的实际应用效率和精度。同时由于用户行为的不断变化，兴趣的更新，我们在进行训练数据的收集时需要根据实际情况不断调整参数，保证数据的准确度，收集数据费力、昂贵。以上两点限制了模型在实际项目中的应用。

对此，本公开实施例提供一种向量生成方法，图1为本公开实施例提供的一种向量生成方法流程图，如图1所示，包括如下步骤：

S11、获取样本数据集；其中，所述样本数据集中每个样本数据包括用户数据、信息数据、以及用户对所行为的信息数据的行为类型标签；

S12、基于所述行为类型标签及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量；

S13、对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；

S14、对每一用户数据的第二嵌入向量进行处理，得到每一用户数据对应的用户向量；

S15、基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据的信息向量进行更新；其中，更新后的信息向量用于信息推荐。

在本公开实施例中，向量生成方法可应用于本公开实施例的向量生成装置中，该装置可被配置于电子设备，例如该电子设备是服务器设备等。

在步骤S11中，电子设备获取样本数据集，样本数据集中包括的用户数据例如是用户年龄、职业或兴趣标签等数据。样本数据集中的信息数据可以是以文字、图片、音乐或视频等形式记载的数据，例如是前述的商品、广告或博文数据等。以博文数据为例，信息数据可以是文字和/或图片，还可以是视频等。样本数据集中所包括的用户对信息数据的行为类型标签可表征用户是否有过行为，以及表征具体的行为类型。例如针对商品，可以是购买或未购买等，其中未购买可表征用户对该信息数据未实施行为；例如针对博文数据，可以是点击、评论、点赞、踩或转发等，还可以是用户自定义区分的行为类型，例如将点击作为一种行为类型，将点击之外的行为作为另一种行为类型。本公开实施例中，可根据更新后的信息向量应用的信息推荐场景针对性的设计行为类型标签所表征的行为类型。

在步骤S12中，电子设备基于行为类型标签以及图神经网络对样本数据集中的信息数据和用户数据进行处理，到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量。其中，图神经网络(Graph NeuralNetwork，GNN)是把神经网络用在图结构(Graph)中的网络模型。GNN带来的革命性进展极大地促进了图表示学习在现实场景中的广泛应用。在推荐系统和社交网络分析等经典领域中，GNN融合了节点信息以及结构信息，因此GNN在处理的时候有很大的优势。

GNN算法的第一步是构图，完成构图之后，GNN使用聚合操作来采样并融合邻居节点特征，之后对聚合特征使用线性或者非线性变换，再与节点自身属性进行融合。在本公开的一些实施例中，可以是根据信息数据的行为类型标签进行构图，例如是根据行为类型标签的种类构多个图，并基于各类型标签对应的图分别得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量。在本公开的另一些实施例中，还可以是在构图之后，根据信息数据的行为类型标签来确定待采样的邻居节点，即基于行为类型标签对邻居节点进行采样后进行特征的融合，以提升第一嵌入向量和第二嵌入向量的获取质量。

例如针对博文数据，行为类型标签可包括点击类型，还可包括点击之外的互动类型。其中，互动是指点击以外的交互行为(转载、评论或点赞等)，点击是指点开播放。由于针对博文数据，通常点击类型的信息数据较多，因而在一些实施例中，可分别构建点击类型的二分图和互动类型的二分图，然后再对点击类型的二分图中的各节点进行采样和特征融合时，可减少采样的节点的深度并采用轻量化的特征融合手段，以减少因点击类型的信息数据的量大而造成的计算损耗。在另一些实施例中，可在构建好二分图后，基于行为类型标签平衡采样的邻居节点的类型，使融合后的节点的嵌入向量(包括第一嵌入向量和第二嵌入向量)是基于行为类型均衡的各节点获得，因而能提升嵌入向量的质量。

可以理解是，在本公开实施例中，一方面由于信息数据的行为类型标签能反应样本数据集中信息数据的行为分布情况，基于该分布情况可优化嵌入向量的生成质量或生成效率；另一方面，由于图神经网络融合了节点信息和结构信息，因而基于图神经网络去得到的嵌入向量，也能获得质量较优的特征提取结果。本公开实施例中，结合信息数据的行为类型标签的图神经网络处理层也可以理解为初始的Embedding层，即GNN Embedding层，获得的第一嵌入向量和第二嵌入向量可以是稠密的连续向量，稠密是指向量中所包含的特征的较为稠密，向量的分量值中的0值较少。

本公开实施例在得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量后，可基于第一嵌入向量和第二嵌入向量进行下游任务。

在步骤S13中，电子设备对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，实质是对初始提取的每个信息数据的第一嵌入向量做进一步的优化处理。在一些实施例中，例如可基于自注意力机制为各信息数据的第一嵌入向量分配权重，以强化重要的信息数据的第一嵌入向量，弱化非重要的信息数据的第一嵌入向量；在另一些实施例中，还可结合信息数据的行为类型标签对信息数据的第一嵌入向量进行处理，例如，可根据信息数据对应的行为类型标签为第一嵌入向量分配不同的权重，例如点赞相对于踩可能表征用户对信息数据的兴趣更大，因而可分配行为类型标签为点赞的信息数据的权重大于行为类型标签为踩的信息数据的权重；再例如，还可以是根据行为类型标签将信息数据进行分类后，对每一类信息数据进行不同的特征优化处理。

在本公开实施例中，对信息数据的第一嵌入向量进行处理获得信息数据的信息向量还可包括进行维度映射，从高维映射到低维，信息数据的信息向量也被称为处理后的item embedding。

在步骤S14中，电子设备对每一用户数据的第二嵌入向量进行处理，得到每一用户数据对应的用户向量，例如是对用户数据的第二嵌入向量进行维度映射。本公开实施例中，用户向量也被称之为处理后的user embedding。本公开实施例中，用户向量和信息向量的维度一致。

在步骤S15中，电子设备基于每一信息数据的信息向量以及每一用户数据的用户向量对信息数据的信息向量进行更新，以便于更新后的每一信息数据的信息向量用于信息推荐，实质是一种双塔深度结构化语义模型(Deep Structured Semantic Model，DSSM)。DSSM模型的本质就是通过两个独立的塔获得物品向量以及用户向量，然后计算各物品向量和各用户向量的相似度，从而基于相似度训练得到隐含语义模型，达到检索的目的。DSSM结构上比较简单，并且解耦了用户向量与物品向量，使得线上部署更方便，例如可将训练好的两个塔中的用户向量(user embedding)和信息向量(item embedding)各自缓存到内存数据库中，线上预测的时候只须要在内存中进行相似度运算即可进行推荐。

在本公开实施例中，电子设备利用信息向量和用户向量对信息数据的信息向量进行更新，即训练获得最终的信息向量。例如针对博文数据，电子设备训练获得博文数据的信息向量后，将离线的信息向量导入引擎，线上召回时实时调用模型计算用户向量，然后拿用户向量去引擎里检索相似度最高的topK个信息数据进行推荐。

可以理解的是，在本公开实施例中，基于信息数据的行为类型标签和图神经网络确定第一嵌入向量和第二嵌入向量，然后再基于第一嵌入向量生成信息向量，基于第二嵌入向量生成用户向量后对信息向量进行更新，以基于更新后的信息向量进行信息推荐，采用的是一种基于图网络的双塔模型的方法，一方面，基于信息数据的行为类型标签能优化嵌入向量(包括第一嵌入向量和第二嵌入向量)的生成质量或生成效率，基于图神经网络能获得质量较优的嵌入向量，因而能获得更优的更新后的信息向量；另一方面，基于双塔模型的方法适合离线生成信息向量后进行在线检索，能提升信息推荐的效率，因而本公开实施例提供的向量生成方法，能有助于提升信息推荐的准确度和效率。

在本公开实施例中，基于样本数据集构建的二分图，是指相互连接的两个节点分属于两个互不相交的子集的图，即用户节点只会和信息节点连接，用户节点不会和用户节点连接，信息节点也不会和信息节点连接。在本公开实施例中，用户节点和信息节点之间的连接也可称之为边。

图2为本公开实施例中二分图的示例图，如图2所示，图中Kl节点、K2节点是用户节点，Ml节点、M2节点以及M3是信息节点，K1和M1之间的连线称之为边。以博文数据为例，由于用户和博文的数据量都非常大，因而形成的是大规模的消费二分图，例如可生成包括十六亿节点以及三百亿级边的二分图。

在本公开实施例中，电子设备进一步对各节点的节点数据进行特征提取，得到各节点的第一特征向量。例如对于用户节点，可基于用户的年龄、职业、兴趣标签、社交网络等获得第一特征向量，对于信息节点，可提取信息数据的语义表达、信息数据的类型标签等特征。

在基于图神经网络对邻居节点进行采样时，通常基于元路径(Meta Path)进行采样，即是一条包含关系序列的路径，而这些关系定义在不同类型的实体之间。以信息节点的采样为例，按照用户-信息-用户-信息…的方式进行采样；以用户节点的采样为例，按照信息-用户-信息-用户…的方式进行采样。示例性的，针对图2中的K1节点，其采样路径可以是K1-M1-K2-M2，针对图2中的M1节点，其采样路径可以是M1-K1-M2-K2。

如前所述的，在构建好二分图后，可基于行为类型标签平衡采样的节点的类型。在本公开实施例中，在针对每一节点的邻居节点进行采样时，按照行为类型标签进行采样，不同行为类型标签对应的邻居节点的采样权重不同。示例性的，行为类型标签可包括点击行为标签，还可包括点击行为之外的行为标签，本公开实施例可仅区分以上两种类型进行采样。由于例如针对博文数据，通常点击类型的信息数据较多，因而通过设置点击类型的信息节点的采样权重，小于点击行为之外的行为类型的信息节点的采样权重，能提升互动的信息数据被采样到的概率，从而使得数据分布更平滑。在本公开实施例中，针对每一节点进行采样后，将当前节点和采样的节点的特征进行融合，得到节点融合后的第二特征向量。可以理解的是，针对每一信息节点，至少融合了一个用户节点的第一特征向量(采样深度为1)，而对于每一用户节点，也至少融合了一个信息节点的第一特征向量(采样深度为1)。本公开实施例中，将二分图中，每一信息节点融合后的第二特征向量作为每一信息数据至少融合用户数据后的第一嵌入向量；每一用户节点融合后的第二特征向量作为每一用户数据至少融合信息数据后的第二嵌入向量。

可以理解的是，在本公开实施例中，基于图神经网络将各节点的第一特征向量进行采样后融合，使得节点能够更准确的表征节点之间的关系。此外，在此基础上基于行为类型标签平衡节点的采样类型，即使得采样的节点的数据分布更为平滑，上述方式均有利于节点的嵌入向量的生成质量，从而有利于本公开实施例中基于更新后的信息向量进行信息推荐的准确率。

需要说明的是，针对博文推荐之外的信息推荐场景，可依据具体需求设计行为类型标签对应的节点的采样权重。此外，本公开实施例不限制行为类型标签的种类；也不限制节点的采样深度，即不限制融合的节点的数量。

在一些实施例中，所述对每一所述信息数据的第一嵌入向量进行处理，得到每一所述信息数据对应的信息向量，包括：

在本公开实施例中，以博文数据为例，由于博文推出后，用户想看可能就会去点击，但互动是基于兴趣的，基于喜爱才会去互动，因而点击可以理解为与兴趣弱相关的行为，而互动是与用户兴趣强相关的行为，即消费深度能反应用户的兴趣。

对此，本公开实施例根据行为类型标签对信息数据进行分类，得到不同行为类型标签的信息数据集，然后对不同行为类型标签的信息数据集采用不同的向量处理方式进行处理，即对不同行为类型标签的信息数据的第一嵌入向量分开进行特征处理，使得特征处理能更具有针对性，因而能提升信息向量的质量。

利用第一权重对点击行为标签的信息数据集中所述第一权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为标签的信息数据集中每一信息数据对应的信息向量。

在本公开实施例中，通过SENet网络，动态地学习点击行为标签的信息数据集中每一信息数据的第一嵌入向量的第一权重，然后再把学习到的第一权重与对应的第一嵌入向量相乘，这样就可以动态学习相关权重，通过小权重抑制噪音或者无效低频特征，通过大权重放大重要特征。

具体而言，SENet分为两个步骤：Squeeze阶段和Excitation阶段。在Squeeze阶段，我们对被点击的item Embedding向量进行数据压缩与信息汇总，如下公式(1)所示：

其中，假设某个信息数据的第一嵌入向量vi是k维大小，那么我们对该信息数据的第一嵌入向量里包含的k维数字求均值，得到能够代表这个信息数据的汇总信息zi，也就是说，把k个特征的信息压缩到一个数值。相对于取最大值进行压缩的方式，求均值能更好地保留和融合信息。

Excitation阶段则是捕捉Squeeze阶段后获得的各数值之间的关系，从而为各信息数据分配权重。本公开实施例在获得各信息数据的第一权重后，即可利用第一权重与对应的信息数据第一嵌入向量相乘。

可以理解的是，在本公开实施例中，基于SENet网络为各第一嵌入向量分配权重，使得能对第一嵌入向量进行区分生成信息向量，从而助于提升信息向量对重要信息数据的表征能力。

对点击行为之外的行为标签信息数据集中关联同一用户的各信息数据，按照各信息数据的行为发生时间组合各信息数据的第一嵌入向量；

利用自注意力机制学习关联同一用户组合后的每一信息数据的第一嵌入向量的第二权重；

在本公开实施例中，将点击行为之外的行为标签信息数据集中的信息数据的第一嵌入向量按行为发生时间顺序进行组合，然后再基于自注意力机制学习每一用户按时序排序的各第一嵌入向量的第二权重，然后再把学习到的第二权重与对应的第二嵌入向量相乘。

如前所述的，针对博文数据，点击行为之外的行为(互动)是与用户兴趣强相关的，因而点击行为之外的行为标签信息数据集中的信息数据对整个信息向量的生成有着重要的影响。由于同一用户的信息数据的互动顺序，即信息数据的内在关系也能反映用户的兴趣，因而本公开实施例提取点击行为之外的行为标签信息数据集中每一的信息数据之间相互关系，以获得用户背后的隐藏信息。

在本公开实施例中，以信息数据是博文为例，首先按时间先后顺序获取博文被用户互动的博文标识{V1,…VN}，然后，根据博文标识序列从GNN Embedding层之后形成的各信息数据的第一嵌入向量中查找博文标识对应的第一嵌入向量序列E＝{E1,E2,..EN}。上述过程，也即对点击行为之外的行为标签信息数据集中关联同一用户的各信息数据，按照信息数据的行为发生时间组合各信息数据的第一嵌入向量。

本公开实施例在获得每一用户组合后的第一嵌入向量后，应用Transformer提取被互动博文的用户背后的隐藏信息，在Transformer中应用多头自注意力(self-attention)机制以得到更好的效果。

示例性的，如下公式(2)是自注意力机制的计算公式：

其中，Q代表当前序列E中第一嵌入向量做映射处理后的矩阵，K代表序列E中所有第一嵌入向量经映射处理后的矩阵，V是系数矩阵，也是经映射处理后的矩阵，d是常数。

自注意力机制先对Q和K进行相似度计算，得到权值；然后采用softmax对权值进行归一化，得到权重；再将权重和V进行加权求和，从而能获得序列E中各第一嵌入向量的权重矩阵。

多头注意力机制则是采用不同的映射方式得到Q、K，假设基于上述公式(2)在任一映射方式下得到的权重矩阵记为head_i，则在多头自注意力机制后，将不同的权重矩阵进行拼接，如下公式(3)所示。

E_global＝Concat(head₁,head₂,head₃,...,head_i) (3)

其中，E_global为拼接后的矩阵。基于拼接后的矩阵做线性变换即可得到最终的第二权重。

可以理解的是，在本公开实施例中，基于Transformer对点击行为之外的行为标签信息数据集中关联同一用户的信息数据序列进行处理，能学习到被用户行为的各信息数据之间的相互关系，从而能提升生成的信息向量的质量。由于本公开实施例中，针对博文数据，点击行为之外的行为标签信息数据集中的信息数据能表征用户的兴趣，因而基于Transformer学习用户行为的该类信息数据之间的关系获得的信息向量，属于一种强链接的信息表示。

在一些实施例中，所述基于每一所述信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据对应的信息向量进行更新，包括：

在本公开实施例中，电子设备计算每一信息数据的信息向量与每一用户数据的用户向量之间的余弦相似度，以根据相似度值确定用户对该信息数据是否感兴趣，例如，在相似度值大于预设相似度阈值的情况下，说明该信息数据是用户行为过的数据，反之则为用户未行为过的数据，上述基于相似度的判断结果也称之为预测值。由于电子设备获取的样本数据集中包括的行为类型标签可标识该用户是否对该信息数据有行为，即各信息数据具有标签值，因而可基于各信息数据的预测值和各标签值之间的差异获得整体的总损失，并基于总损失来对信息数据的信息向量进行更新。例如，在总损失小于预设损失阈值的情况下，将对应的信息向量作为最终的信息向量。

在本公开实施例中，为了提升信息数据的信息向量的质量，对损失函数进行改进，如下公式(4)：

L＝-∑time*log(P(x_i)) (4)

其中，time为信息数据的行为时长所对应的权重，log(P(x_i))为第i个信息数据的损失值，L即为基于各信息数据进行时长加权后的损失值。

在本公开实施例中，由于基于时长加权的损失函数中，权值time与行为时长正相关，可以理解的是，因被用户行为时长更长的信息数据理论上属于用户更感兴趣的数据，而若被用户行为时长更长的信息数据的预测值和标签值还不一样，则此时说明算法还不太完善，需要针对该种情况给予较大的惩罚，因而通过时长加权，可以使得损失值L更大，通过更大的损失值有助于指导算法的调整。综上，本公开实施例中，基于时长加权的损失函数，有助于生成质量更优的信息数据的信息向量。

需要说明的是，在本公开实施例中，基于总损失还可调整GNN模型的参数，以便于当有预测任务时，基于调整后的GNN模型获得信息数据对应的嵌入向量，或者是用户对应的嵌入向量。

图3是本公开实施例中一种基于双塔模型的博文向量生成方法的原理框图，如图3所示，双塔模型的左侧，将博文数据分为点击类型的博文数据和互动类型的博文数据，针对点击类型的博文数据，利用W1标识的GNN Embedding层获得的点击类型的博文数据对应的第一嵌入向量，然后再基于W3标识的SENet模型确定点击类型的博文数据的博文向量，由于点击是与兴趣弱相关的行为，因而点击类型的博文数据的博文向量也可理解为属于弱链接信息表示；针对互动类型的博文数据，利用W2标识的GNN Embedding层获得的互动类型的博文数据对应的第一嵌入向量，然后根据用户对博文数据的互动时间顺序结合W4标识的Transformer模型确定各用户的互动类型的博文数据的博文向量，由于互动是与兴趣强相关的行为，因而互动类型的博文数据的博文向量也可理解为属于强链接信息表示。基于点击行为和互动行为的各博文数据分别对应的博文向量，组合后即可得到W5标识的全量博文数据的博文向量。图3中，双塔模型的右侧，利用U1标识的GNN Embedding层获得每一用户的第二嵌入向量，然后利用一层深度神经网络(Deep Neural Networks，DNN)层对各用户的第二嵌入向量进行处理得到W3标识的属于用户的用户向量。基于每一用户的用户向量和每一博文数据的博文向量基于M标识的方式计算相似度，即可根据各相似度值利用前述公式(4)标识的损失函数计算损失值，从而可根据损失值更新博文数据的博文向量。

图4为本公开实施例提供的一种信息推荐方法流程图，如图4所示，包括如下步骤：

S21、获取目标用户的用户数据以及历史信息数据序列；

S22、根据所述目标用户的用户数据以及历史信息数据序列，确定所述目标用户的目标用户向量；

S23、将所述目标用户向量与信息数据集中每一信息数据的信息向量进行相似度计算，获得各信息数据对应的相似度计算结果；其中，所述信息数据集中每一信息数据的信息向量为基于前述方法获得的更新后的信息向量；

S24、根据各信息数据对应的相似度计算结果，将预设数量的相似度靠前的信息数据推荐给所述目标用户。

在本公开实施例中，电子设备获取目标用户的用户数据以及历史信息数据序列，即可基于双塔模型中用户侧的塔生成目标用户的目标用户向量。例如，本公开实施例可基于图神经网络和目标用户对历史信息数据序列的行为类型标签获得目标用户的用户数据融合历史信息数据后的目标嵌入向量，然后通过对该目标嵌入向量进行处理从而得到目标用户向量。

电子设备在获得目标用户向量后，即可将该目标用户向量去和信息数据集中每一信息数据的信息向量进行比对，并将相似度最高的topK个信息数据推荐给该目标用户。

可以理解的是，基于本公开实施例利用生成的各信息数据的信息向量进行信息推荐的方法，无需实时计算各信息数据的特征以做推荐，具有利于线上部署，推荐效率高的优势。

图5是根据一示例性实施例示出的一种向量生成装置图。参照图5，所述向量生成装置100包括：

第一获取模块101，配置为获取样本数据集；其中，所述样本数据集中每个样本数据包括用户数据、信息数据、以及用户对所行为的信息数据的行为类型标签；

第一得到模块102，配置为基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量；

第二得到模块103，配置为对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；

第三得到模块104，配置为对每一用户数据的第二嵌入向量进行处理，得到每一用户数据对应的用户向量；

更新模块105，配置为基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据对应的信息向量进行更新；其中，更新后的信息向量用于信息推荐。

在一些实施例中，所述第一得到模块102，配置为基于所述样本数据集获取包括多个节点的二分图；其中，所述二分图中所述节点的节点类型包括用户节点、以及信息节点；一个用户节点用于表征一个用户数据，一个信息节点用于表征一个信息数据；所述二分图中相连接的用户节点和信息节点之间通过行为类型标签关联；对每一节点的节点数据进行特征提取，得到每一节点数据的第一特征向量；针对每一节点，根据行为类型标签对邻居节点进行采样，并融合所述节点和采样的邻居节点的第一特征向量，得到所述节点融合后的第二特征向量；其中，不同行为类型标签对应的邻居节点的采样权重不同；将所述二分图中，每一信息节点融合后的第二特征向量作为每一信息数据至少融合用户数据后的第一嵌入向量；将所述二分图中，每一用户节点融合后的第二特征向量作为每一用户数据至少融合信息数据后的第二嵌入向量。

在一些实施例中，所述第二得到模块103，配置为根据行为类型标签对信息数据进行分类，得到不同行为类型标签的信息数据集；针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量；其中，不同行为类型标签对应的向量处理方式不同。

在一些实施例中，所述行为类型标签包括点击行为标签；所述第二得到模块103，配置为基于SENet模型学习点击行为标签的信息数据集中每一信息数据的第一嵌入向量对应的第一权重；利用第一权重对点击行为标签的信息数据集中所述第一权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为标签的信息数据集中每一信息数据对应的信息向量。

在一些实施例中，所述行为类型标签包括点击行为之外的行为标签；所述第二得到模块103，配置为对点击行为之外的行为标签信息数据集中关联同一用户的各信息数据，按照信息数据的行为发生时间组合各信息数据的第一嵌入向量；利用自注意力机制学习关联同一用户组合后的每一信息数据的第一嵌入向量对应的第二权重；针对点击行为之外的行为标签信息数据集中每一信息数据，利用第二权重对与所述第二权重对应的信息数据的第一嵌入向量进行加权处理，得到点击行为之外的行为标签信息数据集中每一信息数据对应的信息向量。

在一些实施例中，所述更新模块105，配置为确定每一信息数据的信息向量与每一用户数据的用户向量之间的相似度；根据每一信息向量与每一用户向量之间的相似度，确定所述图神经网络的预设目标损失函数的总损失；其中，所述预设目标损失函数为基于信息数据的行为时长进行加权的函数，权重与所述行为时长正相关；基于所述总损失，对每一信息数据对应的信息向量进行更新。

图6是根据一示例性实施例示出的一种信息推荐装置图。参照图6，所述信息推荐装置200包括：

第二获取模块201，配置为获取目标用户的用户数据以及历史信息数据序列；

确定模块202，配置为根据所述目标用户的用户数据以及历史信息数据序列，确定所述目标用户的目标用户向量；

相似度计算模块203，配置为将所述目标用户向量与信息数据集中每一信息数据的信息向量进行相似度计算，获得各信息数据对应的相似度计算结果；其中，所述信息数据集中每一信息数据的信息向量为基于第一方面所述的方法获得的更新后的信息向量；

推荐模块204，配置为根据各信息数据对应的相似度计算结果，将预设数量的相似度靠前的信息数据推荐给所述目标用户。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7为本公开实施例中计算机设备的一种硬件实体示意图，如图7所示，该计算机设备1000的硬件实体包括：处理器1001、通信接口1002和存储器1003，其中：

处理器1001通常控制计算机设备1000的总体操作。

通信接口1002可以使计算机设备通过网络与其他终端或服务器通信。

存储器1003配置为存储由处理器1001可执行的指令和应用，还可以缓存待处理器1001以及计算机设备1000中各模块待处理或已经处理的数据(例如，图像数据、音频数据、语音通信数据和视频通信数据)，可以通过闪存(FLASH)或随机访问存储器(Random AccessMemory，RAM)实现。处理器1001、通信接口1002和存储器1003之间可以通过总线1004进行数据传输。其中，处理器1001用于执行上述方法中的部分或全部步骤。

对应地，本公开实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现上述方法中的部分或全部步骤。

这里需要指出的是：以上存储介质和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本公开存储介质和设备实施例中未披露的技术细节，请参照本公开方法实施例的描述而理解。

应理解，在本公开的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本公开实施例的实施过程构成任何限定。上述本公开实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本公开所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本公开各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本公开的实施例而已，并非用于限定本公开的保护范围。凡在本公开的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本公开的保护范围之内。

Claims

1.一种向量生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述行为类型标签以及图神经网络对所述样本数据集中的信息数据和用户数据进行处理，得到每一信息数据至少融合用户数据后的第一嵌入向量，以及每一用户数据至少融合信息数据后的第二嵌入向量，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述对每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，包括：

4.根据权利要求3所述的方法，其特征在于，所述行为类型标签包括点击行为标签；所述针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，包括：

5.根据权利要求3所述的方法，其特征在于，所述行为类型标签包括点击行为之外的行为标签；所述针对每一行为类型标签的信息数据集，根据行为类型标签对应的向量处理方式对信息数据集中每一信息数据的第一嵌入向量进行处理，得到每一信息数据对应的信息向量，包括：

6.根据权利要求1所述的方法，其特征在于，所述基于每一信息数据对应的信息向量，以及每一用户数据对应的用户向量，对每一信息数据对应的信息向量进行更新，包括：

7.一种信息推荐方法，其特征在于，所述方法包括：

获取目标用户的用户数据以及历史信息数据序列；

将所述目标用户向量与信息数据集中每一信息数据的信息向量进行相似度计算，获得各信息数据对应的相似度计算结果；其中，所述信息数据集中每一信息数据的信息向量为基于权利要求1至6中任一项所述的方法获得的更新后的信息向量；

8.一种向量生成装置，其特征在于，所述装置包括：

9.一种信息推荐装置，其特征在于，所述装置包括：

相似度计算模块，配置为将所述目标用户向量与信息数据集中每一信息数据的信息向量进行相似度计算，获得各信息数据对应的相似度计算结果；其中，所述信息数据集中每一信息数据的信息向量为基于权利要求1至6中任一项所述的方法获得的更新后的信息向量；

10.一种计算机设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行如权利要求1至7中任一项所述的方法。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。