CN113254803B

CN113254803B - 一种基于多特征异质图神经网络的社交推荐方法

Info

Publication number: CN113254803B
Application number: CN202110701053.6A
Authority: CN
Inventors: 黄斐然; 贝元琛; 刘志全
Original assignee: Jinan University
Current assignee: Jinan University
Priority date: 2021-06-24
Filing date: 2021-06-24
Publication date: 2021-10-22
Anticipated expiration: 2041-06-24
Also published as: US11631147B2; US20220414792A1; CN113254803A

Abstract

本发明公开了一种基于多特征异质图神经网络的社交推荐方法，该方法包括下述步骤：提取社交网络用户和话题的多种属性信息进行编码；将用户编码信息和话题编码信息分别通过多层感知机得到各用户和话题的初始特征向量表示；以用户和话题作为节点建立异质图，输入异质图神经网络结合注意力机制在图中进行信息传递，更新特征向量表示；对用户特征向量进行相似度计算，选择与用户向量相似度最高的top‑k用户和top‑k话题进行推荐。本发明同时提取用户和话题的多种属性信息，并将用户和话题同时作为节点建立异质图，能更全面地挖掘社交信息，通过异质图神经网络进行信息传递及聚合，深度融合用户及其兴趣话题特征，提高了推荐准确性和用户体验。

Description

一种基于多特征异质图神经网络的社交推荐方法

技术领域

本发明涉及数据挖掘信息推荐技术领域，具体涉及一种基于多特征异质图神经网络的社交推荐方法。

背景技术

近年来，互联网和信息技术及其附属产业高速发展，互联网的服务与交易等业务越来越普及，人们也越来越倾向于借助互联网进行社交活动，由于庞大的用户群体，社交网络每天都会出现海量的用户行为信息，如用户间相互关注、评论、点赞以及在共同感兴趣的话题交流，造成了信息过载，这虽然为用户提供了丰富的信息，但也不免使得用户耗费大量时间在大量自己并不感兴趣的信息上，因此信息过载既是对用户和社交平台的挑战也是机遇。而推荐系统的出现为从大量数据信息中挖掘用户感兴趣的信息提供了解决方案，可以节省用户时间，提升用户体验，也能够增加平台对用户的粘性，提高用户满意度和平台收益。因此，运用有效的推荐系统技术，从大量用户交互信息中提取出用户感兴趣的信息并推荐给用户，对用户和社交网络平台都具有极大价值，使得社交推荐系统成为当前的一个热点研究方向。

现有的社交推荐系统技术中，大多都只较考虑到了部分的稀疏信息(如用户间的关注、评论、点赞等交互行为)，没有考虑多种因素共同作用对推荐系统的影响，这样会导致对于社交网络上的信息挖掘不够充分，同时当前技术大多数都只单一的关注用户交互或用户感兴趣主题，这也会带来信息的丢失，具有一定的局限性。

发明内容

为了克服现有技术存在的缺陷与不足，本发明提供一种基于多特征异质图神经网络的社交推荐方法，提取用户和话题的多种特征，并同时对用户和话题建立异构图，全面挖掘社交网络交互特征信息，深度融合用户及其兴趣话题特征，从而获得更精准的社交推荐效果，提升用户体验。

为了达到上述目的，本发明采用以下技术方案：

本发明提供一种基于多特征异质图神经网络的社交推荐方法，包括下述步骤：

同时提取用户多种属性信息和话题多种属性信息，并进行编码预处理；

将编码预处理后的用户和话题的多特征编码分别输入不同的多层感知机同时训练，输出用户初始特征向量和话题初始特征向量；

将社交网络上的用户和话题同时作为节点，基于用户网络社交交互进行用户-用户连边，基于用户感兴趣话题进行用户-话题连边，对所有用户-用户边权计算后对各边的权值进行归一化，对所有用户-话题边权计算后对各边权值进行归一化，输出异质图；

构建异质图神经网络模型；

将所述异质图输入到异质图神经网络模型，对用户类型邻居节点和话题类型邻居节点分别采用不同的注意力向量计算注意力分数；

对于两种类型的注意力分数各自分别进行归一化后再统一进行归一化，得到中心节点的邻居节点集合的注意力分数；

对中心节点的各邻居节点根据其注意力分数进行特征传递并与中心节点特征进行聚合，更新中心节点特征表示，输出各用户和话题经过异质图神经网络进行信息聚合后的更新向量表示；

计算推荐的目标用户与各用户之间的特征向量相似度和各话题之间的特征向量相似度，排序后选择相似度最高的top-k用户和话题推荐给目标用户。

作为优选的技术方案，所述编码预处理具体步骤包括：

涉及到自然语言的语义信息采用word2vec方法得到embedding特征编码，具体包括：噪声信息去除、分词及停用词处理、训练数值向量化的词表示和获取语义信息的embedding编码表示；

采用离散值表示的数据进行one-hot编码。

作为优选的技术方案，所述多层感知机的各层计算公式为：

其中，

为第

层的输出向量，

为第

层的可训练权重矩阵，

为第

层的偏置向量，

为上一层的输出向量，若当前层为第一层，则

为编码预处理的用户和话题的多特征编码，

为激活函数。

作为优选的技术方案，所述基于用户网络社交交互进行用户-用户连边，具体条件为：

若两个用户之间进行过网络社交交互则进行连边，所述网络社交交互包括关注、点赞和评论的交互；

边的权值初始化为两用户之间网络社交交互的次数。

作为优选的技术方案，所述基于用户感兴趣话题进行用户-话题连边，具体条件为：

若用户对某话题进行过关注和话题评论则进行连边，边的权值初始化为用户对话题的关注和话题评论次数。

作为优选的技术方案，所述对用户类型邻居节点和话题类型邻居节点分别采用不同的注意力向量计算注意力分数，具体计算过程为：

其中，

为聚合的中心节点，

为

的邻居节点集合，

、

分别表示用户类型邻居节点、话题类型邻居节点的注意力分数，

为用户类型邻居的可学习的注意力权重向量的转置，

为话题类型邻居的可学习的注意力权重向量的转置，

为中心节点的特征向量，

为用户类型邻居节点的特征向量，

为话题类型邻居节点的特征向量，

为激活函数，

表示

的邻居节点集合中的用户类型邻居节点，

表示

的邻居节点集合中的话题类型邻居节点。

作为优选的技术方案，所述对于两种类型的注意力分数各自分别进行归一化后再统一进行归一化，具体计算过程为：

其中，

表示softmax函数归一化后的注意力分数，

表示

的邻居节点集合，

为

的邻居节点，

表示注意力分数矩阵第

行

列的值，

、

表示归一化后的某一特定用户类型邻居节点注意力分数，

表示归一化后某一特定话题类型邻居节点注意力分数，

表示归一化前的任一用户类型邻居节点注意力分数，

表示归一化前的任一话题类型邻居节点注意力分数，k表示

的邻居节点集合中的任一节点，i表示

的邻居节点集合中的用户类型邻居节点，

j表示

的邻居节点集合中的话题类型邻居节点，

表示归一化后的任一邻居节点注意力分数。

作为优选的技术方案，所述对中心节点的各邻居节点根据其注意力分数进行特征传递并与中心节点特征进行聚合，更新中心节点特征表示，计算过程表示为：

其中，

表示第

层异质图神经网络层节点特征矩阵中节点i的特征向量，

表示第

层异质图神经网络层所得的节点特征矩阵，

表示第

层异质图神经网络层的可训练权重矩阵，

表示中心节点i与其邻居节点j的注意力分数，

表示激活函数，

表示中心节点i的邻居节点集合。

作为优选的技术方案，所述异质图神经网络模型与多层感知机联合训练，共用训练过程中的反向传播损失，并同时更新各个参数；

将经过多层异质图神经网络层信息传递和聚合后的各用户节点和话题节点的特征向量更新到用户和话题的数据库中。

本发明还提供一种基于多特征异质图神经网络的社交推荐系统，包括：信息提取模块、编码预处理模块、初始特征向量输出模块、异质图构建模块、异质图神经网络模型构建模块、注意力分数计算模块、综合注意力分数计算模块、信息聚合及更新模块、特征向量相似度计算模块和推荐结果输出模块；

所述信息提取模块用于同时提取用户多种属性信息和话题多种属性信息；

所述编码预处理模块用于对用户多种属性信息和话题多种属性信息进行编码预处理；

所述初始特征向量输出模块用于输出初始特征向量，将编码预处理后的用户和话题的多特征编码分别输入不同的多层感知机同时训练，输出用户初始特征向量和话题初始特征向量；

所述异质图构建模块用于构建异质图，将社交网络上的用户和话题同时作为节点，基于用户网络社交交互进行用户-用户连边，基于用户感兴趣话题进行用户-话题连边，对所有用户-用户边权计算后对各边的权值进行归一化，对所有用户-话题边权计算后对各边权值进行归一化，输出异质图；

所述异质图神经网络模型构建模块用于构建异质图神经网络模型；

所述注意力分数计算模块用于将所述异质图输入到异质图神经网络模型，对用户类型邻居节点和话题类型邻居节点分别采用不同的注意力向量计算注意力分数；

所述综合注意力分数计算模块用于对于两种类型的注意力分数各自分别进行归一化后再统一进行归一化，得到中心节点的邻居节点集合的注意力分数；

所述信息聚合及更新模块用于对中心节点的各邻居节点根据其注意力分数进行特征传递并与中心节点特征进行聚合，更新中心节点特征表示，输出各用户和话题经过异质图神经网络进行信息聚合后的更新向量表示；

所述特征向量相似度计算模块用于计算推荐的目标用户与各用户之间的特征向量相似度和各话题之间的特征向量相似度；

所述推荐结果输出模块用于在排序后输出相似度最高的top-k用户和话题推荐结果。

本发明与现有技术相比，具有如下优点和有益效果：

（1）本发明关注到社交网络中用户的行为特征，同时考虑社交网络中用户和话题的多种因素特征的共同作用对推荐系统的影响，更全面的挖掘用户社交网络信息。

（2）本发明将用户和话题同时作为节点建立异质图，通过异质图神经网络进行信息传递及聚合，拟合了现实社交网络的真实结构，同时关注用户交互及用户感兴趣主题，深度融合用户及其兴趣话题特征，提高了推荐的准确性和用户体验。

附图说明

图1为本发明基于多特征异质图神经网络的社交推荐方法的流程示意图；

图2为本发明多层感知机初始化特征向量的工作示意图；

图3为本发明将用户和话题作为节点建立异质图的示意图；

图4为本发明异质图神经网络的工作示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

实施例1

如图1所示，本实施例提供一种基于多特征异质图神经网络的社交推荐方法，包括下述步骤：

S1：对用户和话题的多种属性信息进行提取和预处理

同时提取用户多种属性信息（如昵称，年龄，所在城市等）和话题多种属性信息（如主题，热度，简介信息等），这其中涉及到自然语言的语义信息采用word2vec方法得到embedding特征编码，其余可以用离散值表示的数据进行one-hot编码。

本实施例对用户和话题的多种属性信息进行提取和预处理，具体包括以下子步骤：

S1.1：多特征提取

同时对社交平台的用户多种属性信息（如昵称，年龄，所在城市等）和话题多种属性信息（如主题，热度，简介信息等）进行初步提取；

S1.2：embedding特征编码

对于所提取的信息，若涉及到自然语言的语义信息（如用户昵称，话题简介等），采用自然语言处理的方法得到特征编码，具体步骤为：首先对语义数据进行预处理，包括噪声信息去除、分词及停用词处理、训练数值向量化的词表示和获取语义信息的embedding编码表示；

噪声信息去除：通过正则表达式对语义信息进行预处理，将无关的噪声信息过滤，如URL，乱码字符等；

分词及停用词处理：对噪声信息去除后的语义信息，采用分词工具进行分词，将文本序列转换为分词后对应的词列表；对分词后对应的词列表，通过停用词表进行停用词处理，得到停用词去除后的词列表。

训练数值向量化的词表示：根据语义信息经过分词得到的词集合，采用word2vec神经网络特征嵌入的方法训练得到语义信息对应词列表的初始词嵌入向量，然后在每个词向量中加上表示词位置的位置向量得到融合了词位置信息的词嵌入向量。

获取语义信息的embedding编码表示：对语义信息所包含的各词的词向量进行平均池化，语义信息的embedding编码表示。

S1.3：one-hot特征编码

对于所提取的信息，对可以用离散值表示的数据进行one-hot编码（如年龄，所在城市等），例如年龄，假设社交网络上的用户群体的年龄为20-24岁，对于一个21岁的用户而言，其年龄部分的one-hot特征编码表示为[0,1,0,0,0]。

S2：获取用户和话题的初始特征向量

如图2所示，通过多层感知机初始化特征向量，对预处理后的用户和话题的多特征编码，分别输入训练用户特征向量的多层感知机和训练话题特征向量的多层感知机同时进行训练，输出用户初始特征向量和话题初始特征向量，作为异质图神经网络中用户节点和话题节点的节点特征向量。

其中，多层感知机的各层的主要计算公式为：

其中，

为第

层的输出向量，

为第

层的可训练权重矩阵，

为第

层的偏置向量，

为上一层的输出向量，若当前层为第一层，则

为编码预处理的用户和话题的多特征编码，

为激活函数，选择Relu或softmax函数。

S3：对用户和话题建立异质图

如图3所示，从社交网络中用户的行为特征考虑，将用户和话题作为节点建立异质图，将社交网络用户和话题同时作为节点，通过用户-用户和用户-话题连边建立异质图。其中用户-用户的连边条件为：若两个用户之间进行过包括关注、点赞和评论的交互，则进行连边，边的权值初始化为两用户之间关注、点赞和评论的次数，对所有用户-用户边权计算后再对各边的权值进行归一化。用户-话题的连边条件为：若用户对某话题进行过关注和话题评论，则进行连边，边的权值初始化为用户对话题的关注和话题评论次数，对所有用户-话题边权计算后再对各边权值进行归一化，得到用户-话题异质图。这种建图方式拟合了现实社交网络的真实结构，同时关注社交网络中最重要的用户交互及用户感兴趣主题，而关注到用户具体操作的细粒度连边方式，更加全面细致地考虑用户行为特征，有助于后续的模型深度融合用户及其兴趣话题特征。

其中归一化采用min-max normalization的方式，具体公式为：

其中

为归一化前的边权值，

为归一化前的所有边权的最小值，

为归一化前的所有边权的最大值。

为归一化后的边权值。

用户-用户类型的边权和用户-话题类型的边权分别各自进行归一化，相较于两种类型边权一起进行归一化，有助于缓和不同类型边权间的差异，并保持不同类型边权所特有的信息，更好地统一后续两种类型边权的操作。

S4：建立异质图神经网络模型

如图4所示，将所建立的用户-话题异质图输入异质图神经网络模型，对用户类型邻居节点和话题类型邻居节点分别通过注意力机制采用不同的注意力向量计算注意力分数，对于两种类型的注意力分数各自分别进行归一化后再统一进行归一化，结合两种类型中各节点的注意力分数进行邻居节点信息传递和聚合，输出各用户和话题经过异质图神经网络进行信息聚合后的更新向量表示。

步骤S4建立异质图神经网络模型，具体包括以下子步骤：

S4.1：计算用户类型邻居节点和话题类型邻居节点注意力分数

对于进行信息聚合的中心节点，其邻居节点类型可能是用户类型节点也可能是话题类型节点，对于两种不同类型的邻居节点，分别采用各自的注意力机制计算其注意力分数，具体计算过程为：

其中，

为聚合的中心节点，

为

的邻居节点集合，

、

为用户类型邻居的可学习的注意力权重向量的转置，

为话题类型邻居的可学习的注意力权重向量的转置，

为中心节点的特征向量，

为用户类型邻居节点的特征向量，

为话题类型邻居节点的特征向量，

为激活函数，

表示

的邻居节点集合中的用户类型邻居节点，

表示

的邻居节点集合中的话题类型邻居节点。

S4.2：综合注意力分数

对于用户类型节点和话题类型节点的注意力分数分别进行归一化，得到各自类型归一化注意力分数，再通过一次softmax归一化综合得到中心节点的邻居节点集合的注意力分数，更好地保持各类型的注意力分数分布，具体计算过程为：

其中，

为softmax函数归一化后的注意力分数，

表示注意力分数矩阵第

行

列的值，

为

的邻居节点，

表示

的邻居节点集合，

、

表示归一化后的某一特定用户类型邻居节点注意力分数，

表示归一化后某一特定话题类型邻居节点注意力分数，

表示归一化前的任一用户类型邻居节点注意力分数，

表示归一化前的任一话题类型邻居节点注意力分数，k表示

的邻居节点集合中的任一节点，i表示

的邻居节点集合中的用户类型邻居节点，j表示

的邻居节点集合中的话题类型邻居节点，

表示归一化后的任一邻居节点注意力分数。

S4.3：信息聚合及更新

对中心节点的各邻居节点根据其注意力分数进行特征传递并与中心节点特征进行聚合，更新中心节点特征表示，具体计算过程为：

其中，

表示第

层异质图神经网络层节点特征矩阵中节点i的特征向量，

表示第

层异质图神经网络层所得的节点特征矩阵，当

时，

为节点初始特征向量所构成的矩阵，

表示第

层异质图神经网络层的可训练权重矩阵，

表示中心节点i与其邻居节点j的注意力分数，

为激活函数，

表示中心节点i的邻居节点集合。

训练过程中，此部分的异质图神经网络模型与前面的多层感知机模型一起进行联合训练，即此部分异质图神经网络模型和之前的多层感知机模型共用训练过程中的反向传播损失，并同时更新模型的各部分参数。

将经过

层异质图神经网络层信息传递和聚合后的各用户节点和话题节点的特征向量更新到用户和话题的数据库中。

S5：top-k向量相似度的用户和话题推荐

对于要进行推荐的目标用户，计算其与各用户之间的特征向量相似度和各话题之间的特征向量相似度，排序后选择相似度最高的top-k用户和话题推荐给目标用户。

向量相似度的计算方式为：

其中，

为用户i的特征向量，

为话题j的特征向量，

为用户i与用户或话题j的向量相似度，对所计算的向量相似度进行排序，选择top-k最高向量相似度用户和话题进行推荐。

实施例2

本实施例提供一种基于多特征异质图神经网络的社交推荐系统，包括：信息提取模块、编码预处理模块、初始特征向量输出模块、异质图构建模块、异质图神经网络模型构建模块、注意力分数计算模块、综合注意力分数计算模块、信息聚合及更新模块、特征向量相似度计算模块和推荐结果输出模块；

在本实施例中，信息提取模块用于同时提取用户多种属性信息和话题多种属性信息；

在本实施例中，编码预处理模块用于对用户多种属性信息和话题多种属性信息进行编码预处理；

在本实施例中，初始特征向量输出模块用于输出初始特征向量，将编码预处理后的用户和话题的多特征编码分别输入不同的多层感知机同时训练，输出用户初始特征向量和话题初始特征向量；

在本实施例中，异质图构建模块用于构建异质图，将社交网络上的用户和话题同时作为节点，基于用户网络社交交互进行用户-用户连边，基于用户感兴趣话题进行用户-话题连边，对所有用户-用户边权计算后对各边的权值进行归一化，对所有用户-话题边权计算后对各边权值进行归一化，输出异质图；

在本实施例中，异质图神经网络模型构建模块用于构建异质图神经网络模型；

在本实施例中，注意力分数计算模块用于将所述异质图输入到异质图神经网络模型，对用户类型邻居节点和话题类型邻居节点分别采用不同的注意力向量计算注意力分数；

在本实施例中，综合注意力分数计算模块用于对于两种类型的注意力分数各自分别进行归一化后再统一进行归一化，得到中心节点的邻居节点集合的注意力分数；

在本实施例中，信息聚合及更新模块用于对中心节点的各邻居节点根据其注意力分数进行特征传递并与中心节点特征进行聚合，更新中心节点特征表示，输出各用户和话题经过异质图神经网络进行信息聚合后的更新向量表示；

在本实施例中，特征向量相似度计算模块用于计算推荐的目标用户与各用户之间的特征向量相似度和各话题之间的特征向量相似度；

在本实施例中，推荐结果输出模块用于在排序后输出相似度最高的top-k用户和话题推荐结果。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于多特征异质图神经网络的社交推荐方法，其特征在于，包括下述步骤：

构建异质图神经网络模型；

2.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述编码预处理具体步骤包括：

采用离散值表示的数据进行one-hot编码。

3.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述多层感知机的各层计算公式为：

其中，

为第

层的输出向量，

为第

层的可训练权重矩阵，

为第

层的偏置向量，

为上一层的输出向量，若当前层为第一层，则

为编码预处理的用户和话题的多特征编码，

为激活函数。

4.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述基于用户网络社交交互进行用户-用户连边，具体条件为：

边的权值初始化为两用户之间网络社交交互的次数。

5.根据权利要求1或4所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述基于用户感兴趣话题进行用户-话题连边，具体条件为：

6.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述对用户类型邻居节点和话题类型邻居节点分别采用不同的注意力向量计算注意力分数，具体计算过程为：

其中，

为聚合的中心节点，

为

的邻居节点集合，

、

为用户类型邻居的可学习的注意力权重向量的转置，

为话题类型邻居的可学习的注意力权重向量的转置，

为中心节点的特征向量，

为用户类型邻居节点的特征向量，

为话题类型邻居节点的特征向量，

为激活函数，

表示

的邻居节点集合中的用户类型邻居节点，

表示

的邻居节点集合中的话题类型邻居节点。

7.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述对于两种类型的注意力分数各自分别进行归一化后再统一进行归一化，具体计算过程为：

其中，

表示softmax函数归一化后的注意力分数，

为聚合的中心节点，

表示

的邻居节点集合，

为

的邻居节点，

表示注意力分数矩阵第

行

列的值，

、

表示归一化后的某一特定用户类型邻居节点注意力分数，

表示归一化后某一特定话题类型邻居节点注意力分数，

表示归一化前的任一用户类型邻居节点注意力分数，

表示归一化前的任一话题类型邻居节点注意力分数，k表示

的邻居节点集合中的任一节点，i表示

的邻居节点集合中的用户类型邻居节点，j表示

的邻居节点集合中的话题类型邻居节点，

表示归一化后的任一邻居节点注意力分数。

8.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述对中心节点的各邻居节点根据其注意力分数进行特征传递并与中心节点特征进行聚合，更新中心节点特征表示，计算过程表示为：

其中，

表示第

层异质图神经网络层节点特征矩阵中中心节点i的特征向量，

表示第

层异质图神经网络层所得的节点特征矩阵，

表示第

层异质图神经网络层的可训练权重矩阵，

表示中心节点i与其邻居节点j的注意力分数，

表示激活函数，

表示中心节点i的邻居节点集合。

9.根据权利要求1所述的基于多特征异质图神经网络的社交推荐方法，其特征在于，所述异质图神经网络模型与多层感知机联合训练，共用训练过程中的反向传播损失，并同时更新各个参数；

10.一种基于多特征异质图神经网络的社交推荐系统，其特征在于，包括：信息提取模块、编码预处理模块、初始特征向量输出模块、异质图构建模块、异质图神经网络模型构建模块、注意力分数计算模块、综合注意力分数计算模块、信息聚合及更新模块、特征向量相似度计算模块和推荐结果输出模块；