CN117237140A

CN117237140A - 一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法

Info

Publication number: CN117237140A
Application number: CN202311283423.4A
Authority: CN
Inventors: 唐建新; 瞿继焘; 宋仕辉; 赵付青
Original assignee: Lanzhou University of Technology
Current assignee: Lanzhou University of Technology
Priority date: 2023-10-07
Filing date: 2023-10-07
Publication date: 2023-12-15

Abstract

本发明涉及社交网络影响力最大化技术领域，具体为一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，包括以下步骤：收集社交网络数据并通过用户关系建模为社交网络图；采用Node2Vec图嵌入技术、拉普拉斯矩阵和节点中心性方法，对社交网络进行节点属性和空间结构特征提取，设计了一种基于局部影响力评估函数的贪心方法生成训练标签；融合图卷积神经网络和Transformer构建预测模型；处理目标社交网络，并将目标社交网络输入预测模型，以获得在目标社交网络上一组最有影响力的种子用户。本发明定义了一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，充分利用了图卷积神经网络和Transformer结构的优势，以深入挖掘节点和影响力间的关系。

Description

一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法

技术领域

本发明涉及社交网络影响力最大化技术领域，具体为一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法。

背景技术

在当今数字时代，随着智能手机的广泛普及和互联网的快速发展，社交网络已成为现代社会不可或缺的一部分，为人们提供了与朋友、家人和同事保持联系、分享生活和获取信息的主要途径。社交网络不仅仅是人际互动的平台，还是最大化影响力的巨大机会。通过精心策划和有效的策略，个人、品牌和组织可以在社交网络上产生广泛的影响力，获得百万潜在用户的关注。社交网络是具有扩大影响力的无限潜力的平台，可以通过内容创作、积极参与社交对话、口碑效应以及建立强大的品牌声誉来实现。在信息爆炸的时代，社交网络影响力最大化仍然是社交网络领域的研究热点。社交网络影响力最大化问题旨在有效选择一组最具影响力的种子用户，以便产品在社交网络上传播的最广泛。社交网络影响力最大化问题具有广泛的应用，包括病毒式营销、个性化推荐等领域。社交网络影响力最大化问题也是一个典型的NP-hard问题，因此对社交网络影响力最大化问题的研究具有重要的学术和实际价值。

另一方面，随着科技的飞速进步，深度学习也在各个领域掀起了一场革命。这一领域的最新进展令人印象深刻，深度学习模型已经在计算机视觉、自然语言处理、语音识别等任务中取得了前所未有的成功。在社交网络影响力最大化领域，基于深度学习的选种方法近年来也取得了一定的成果。一些基于深度神经网络的方法将社交网络影响力最大化问题转化为回归问题，经过良好训练的模型能够有效地预测一组最有影响力的种子用户，并展现出卓越的性能。然而，现有的基于深度学习的方法仍然存在一些局限性，无法全面捕捉网络中节点和影响力之间的关系。一些模型由于训练标签的质量不佳而导致性能不足，因此确定一组最有影响力的种子用户仍有改进的空间。

因此，现有技术需要一种能够有效捕获社交网络中节点和影响力关系的方法，以更好地求解社交网络影响力最大化问题。图卷积神经网络模型是一种用于处理图数据的深度学习模型，它在图领域中取得了显著的成功。图卷积神经网络能够考虑节点之间的连接关系和图的拓扑结构，从而更好地理解节点的上下文信息。Transformer引入了自注意力机制，能够同时处理序列数据中的所有元素，广泛应用于文本处理和其他领域，如计算机视觉和语音处理，取得了重大成功，并衍生出多个重要变种。融合图卷积神经网络和Transformer技术有望克服现有方法的不足之处，更好地捕捉网络中节点属性和影响力之间的关系，从而获得一组更具竞争力的影响力种子用户。

发明内容

为了解决上述问题，本发明提供了一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法(GCNT)，以选取一组最有影响力的种子用户为目标，从而求解社交网络影响力最大化问题。

为实现上述目的，本发明提供如下技术方案：

一种求解社交网络影响力最大化问题的方法，包括以下步骤：

步骤1：收集社交网络数据并通过用户关系建模为社交网络图；

步骤2：采用Node2Vec图嵌入技术、拉普拉斯矩阵和节点中心性方法，对社交网络进行节点属性和空间结构特征提取，设计了一种基于局部影响力评估函数的贪心方法生成训练标签；

步骤3：融合图卷积神经网络和Transformer构建预测模型；

步骤4：处理目标社交网络，并将目标社交网络输入预测模型，以获得在目标社交网络上一组最有影响力的种子用户。

优选地，在步骤1中，将用户建模为节点，用户之间的关系建模为节点间的连边，从而构建社交网络图：G＝(V,E)，其中G代表社交网络，V代表节点集合，其大小|V|＝n；E代表网络的边集合，其大小|E|＝m。

优选地，在步骤2中，为了全方面捕获社交网络中空间结构特征和节点属性，使用Node2Vec图嵌入技术将社交网络图中节点映射到低维向量空间；为了能考虑到节点的空间属性，根据节点的Node2Vec路径序列构建节点空间相关性矩阵以及通过拉普拉斯矩阵公式构建社交网络图的归一化拉普拉斯矩阵；使用节点的度中心(DC)、K-壳指数(K-shell)、H-指数(H-index)构建节点属性矩阵；为了提高节点的影响力标签的质量，提出了一种基于局部影响力评估函数的贪心方法(Greedy-LIE)生成更符合社交网络影响力最大化问题的训练标签。

优选地，在步骤3中，为了更好地捕获节点和影响力之间的关系，通过两层图卷积神经网络对节点中心性进行深层次挖掘，通过Transformer结构先将平衡后的节点图嵌入和节点中心性作为输入，之后利用节点空间结构信息，有效地捕获节点和影响力之间的关系；为了更好地关注最有可能成为种子用户的节点，在执行过程中加入节点影响力掩码操作。

优先地，在步骤4中，将目标社交网络通过步骤1和步骤2进行处理后。如图1(b)所示，在步骤2中不需要计算目标社交网络节点的标签。直接输入到训练好的模型中，以直接获得预测的一组最有影响力的种子用户。

优先地，通过已经训练好的模型获得预测的节点影响力排序(从大到小)，选择前k个作为最有影响力的节点作为种子用户。

本发明提供一种计算机可读存储介质，其中包含计算机程序，该程序被CPU和GPU处理时可实现上述所提供的方法步骤。

本发明的有益效果为：

(1)本发明定义了一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，充分利用了图卷积神经网络和Transformer结构的优势，以深入挖掘节点和影响力间的关系。这使得本发明能有效地预测节点的影响力值，并选择出一组最具有影响力的种子用户，实现了社交网络影响力最大化。

(2)设计了Greedy-LIE方法构建了符合社交网影响力最大化问题的训练标签，提升模型训练标签的质量，从而提高预测种子用户的质量。

(3)引入节点影响力掩码操作，以指导模型更好地关注最有可能被选为种子用户的节点。

(4)本发明逻辑简单，易于实现，并具有较好的泛化能力。经过小规模网络训练的模型可以很好地适用于大部分社交网络，以求解社交网络影响力最大化问题。

附图说明

图1为本发明实施例提供的图卷积神经网络和Transformer的社交网络影响力最大化方法的具体流程示意图。

图2为本发明实施例提供的图卷积神经网络和Transformer的社交网络影响力最大化方法的具体实施例的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

一种求解社交网络影响力最大化问题的方法，如图1所示，包括以下步骤：

步骤1：收集社交网络数据并通过用户关系构建为社交网络图。

如图2中(1a)所示，构建社交网络图：G＝(V,E)，其中G代表社交网络，V代表节点集合，其大小|V|＝n；E代表网络的边集合，其大小|E|＝m。

步骤2：通过Node2Vec图嵌入技术、拉普拉斯矩阵和节点中心性对社交网络进行节点属性和空间结构特征提取，设计一种基于局部影响力评估函数的贪心方法生成训练标签。

如图2中(2a)所示，计算社交网络图G中每个节点的三个中心性指标DC、K-Shell和H-Index，然后分别对三种中心性指标进行归一化操作后构成中心性矩阵C_E∈R^n*3。

如图2中(2b)所示，使用Node2Vec图嵌入技术，通过调整参数p和q，为每个节点生成一定长度和数量的Node2Vec路径序列，通过Skip-gram模型给每个节点生成对应的嵌入向量，并组成Node2Vec图嵌入矩阵N_E∈R^n*768。

如图2中(2c)所示，根据(2b)中产生的每个节点Node2Vec路径序列统计各个节点出现的频率，分别刻画每个节点与其他节点的位置关联强度。以每个节点为一组归一化后，构建位置相关性矩阵C_s∈R^n*n。生成社交网络图的邻接矩阵、对角阵和度矩阵后，根据归一化的拉普拉斯矩阵公式，构建拉普拉斯矩阵L_s∈R^n*n。

特别的，当在模型训练阶段，需要计算训练网络的每个节点影响力标签。如算法伪代码1所示，设计Greedy-LIE方法来生成节点影响力标签Inf_t∈R^n*1。局部影响力评估函数(LIE)可以近似评估每个节点的影响力，得到一个确定的影响力值。Greedy-LIE方法将训练网络图G和节点个数n作为入参，每一轮次选择LIE值边际收益最大的节点，并将该节点本轮次的LIE值边际收益作为节点的标签值。重复n次，计算出所有训练网络节点的标签。LIE的计算公式如下所示：

其中，和/>分别表示节点的1阶邻域和2阶领域；p_u表示节点u的激活概率；d_u表示在/>和/>中，与节点u有连边的节点数。

步骤3：融合图卷积神经网络和Transformer构建预测模型。

如图2中(3a)所示，将步骤2生成的中心性矩阵经过两层的图卷积神经网络进行消息传递和聚合后，获得中心性嵌入矩阵C′_E∈R^n*768。C′_E通过全连接层后每个节点都得到重要程度分数，将所有节点进行重要程度排序，获得节点排序Rank∈R^n*1，每个元素是节点编号。

如图2中(3b)所示，将中心性嵌入矩阵C′_E和Node2Vec图嵌入矩阵N_E通过数据均衡公式融合后得到的矩阵I_E，作为Transformer结构的输入，数据均衡公式如下所示：

I_E＝λ·N_E+(1-λ)C′_E

其次，生成掩码矩阵M∈R^n*n，每个元素都为True。然后根据如图2中(3a)中的节点序列和重要节点比率参数r∈[0,1]更新掩码矩阵M。对于排名前的节点对应的掩码矩阵M的行列设置为False。

Transformer结构中的矩阵Q＝K＝V＝I_E，根据设置的多头数量l＝16，得到16组Q_i、K_i和V_i。每个头(head_i)的矩阵Q_i与K_i通过矩阵乘法得到的注意力权重矩阵并且归一化，之后根据掩码矩阵M将对应位置为True的设置为一个非常小的数。新的注意力权重矩阵加上空间结构相关性矩阵C_S和拉普拉斯矩阵L_S与矩阵V_i相乘得到最终head_i的注意力矩阵。再通过合并操作将所有head进行拼接。公式如下所示：

Attention＝MultiHead(head_i)＝Concat(head₁,head₂,…,head_l)W^O

其中，Mask()函数根据掩码矩阵M将注意力权重矩阵对应位置的为True的设置为一个非常小的数，Concat()函数用于将所有head得到的注意力矩阵向量首尾相连进行拼接操作，再经过线性变换得到最终的注意力矩阵Attention。

模型中包含了16层Transformer结构并且每一层的结构都是相同的。特别的，第一层的输入为Node2Vec图嵌入矩阵N_E和中心嵌入矩阵C_E数据平衡后的矩阵I_E。其他每一层的输出作为下一层的输入，最后一层输出最终的注意力矩阵Attention。

最终的注意力矩阵Attention经过全连接层得到预测的每个节点影响力。若在训练阶段需要通过均方误差损失函数计算损失，然后进行反向传播；若在应用阶段，根据预测的影响力值从大到小排序后，直接选择前K个种子用户作为最有影响力的种子用户集合。

步骤4：处理目标网络，并将目标网络输入预测模型，获得一组在目标网络上最有影响力的种子用户。

将目标网络根据步骤1处理后，直接输入训练好的GCNT模型中，通过端到端的结构，直接返回一组最有影响力的种子用户集合。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种求解社交网络影响力最大化问题的方法，其特征在于，包括以下步骤：

步骤3：融合图卷积神经网络和Transformer构建预测模型；

2.根据权利要求1所述的一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，其特征在于：在步骤1中，将用户建模为节点，用户之间的关系建模为节点间的连边，从而构建社交网络图：G＝(V,E)，其中G代表社交网络，V代表节点集合，其大小|V|＝n；E代表网络的边集合，其大小|E|＝m。

3.根据权利要求2所述的一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，其特征在于：在步骤2中，为了全方面捕获社交网络中空间结构特征和节点属性，使用Node2Vec图嵌入技术将社交网络图中节点映射到低维向量空间；为了能考虑到节点的空间属性，根据节点的Node2Vec路径序列构建节点空间相关性矩阵以及通过拉普拉斯矩阵公式构建社交网络图的归一化拉普拉斯矩阵；使用节点的度中心(DC)、K-壳指数(K-shell)、H-指数(H-index)构建节点属性矩阵；为了提高节点的影响力标签的质量，提出了一种基于局部影响力评估函数的贪心方法(Greedy-LIE)生成更符合社交网络影响力最大化问题的训练标签。

4.根据权利要求3所述的一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，其特征在于：在步骤3中，为了更好地捕获节点和影响力之间的关系，通过两层图卷积神经网络对节点中心性进行深层次挖掘，通过Transformer结构先将平衡后的节点图嵌入和节点中心性作为输入，之后利用节点空间结构信息，有效地捕获节点和影响力之间的关系；为了更好地关注最有可能成为种子用户的节点，在执行过程中加入节点影响力掩码操作。

5.根据权利要求4所述的一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，其特征在于：在步骤4中，将目标社交网络通过步骤1和步骤2进行处理后，直接输入到训练好的模型中，以直接获得预测的一组最有影响力的种子用户。

6.根据权利要求5所述的一种融合图卷积神经网络和Transformer的社交网络影响力最大化方法，其特征在于：通过已经训练好的模型获得预测的节点影响力按照从大到小排序，选择前k个作为最有影响力的节点作为种子用户。

7.一种计算机可读存储介质，其特征在于：其中包含计算机程序，该程序被CPU和GPU处理时可实现权利要求1-6所提供的任一方法步骤。