CN111797327A

CN111797327A - 社交网络建模的方法及装置

Info

Publication number: CN111797327A
Application number: CN202010502413.5A
Authority: CN
Inventors: 沈毅; 杜向阳
Original assignee: Nanjing Aegis Information Technology Co ltd
Current assignee: Nanjing Aegis Information Technology Co ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2020-10-20
Anticipated expiration: 2040-06-04
Also published as: CN111797327B

Abstract

本申请公开了一种社交网络建模的方法及装置，本申请的方法包括获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；基于注意力机制对每个节点的特征向量进行更新，以提供一种社交网络结构来更加好的刻画用户在社交网络中复杂关系。

Description

社交网络建模的方法及装置

技术领域

本申请涉及自然语言处理技术领域，具体而言，涉及一种社交网络建模的方法及装置。

背景技术

伴随着互联网及自媒体行业的蓬勃发展，舆情信息的传播方式和传播速度较之以往已经发生了本质上的变化，传统的人工舆情监测方式已经远远不能满足于现阶段的舆情处理需求。

现有的舆情分析技术解决方案大多是用舆情事件关键词匹配的方式识别舆情事件，再将舆情情绪分析任务当作分类任务用有监督方法去预测归类。在分析舆情传播任务上，现有解决方案也大多只是静态的给出舆论事件在网络传播过程中的转发评论人，并没有尝试去从社交网络的角度通过分析人与人、人与舆情文章产生的交互行为及信息数据去细致分析。因此为了提高预测的准确性，需要结合社交网络结构进行预测，用户在社交网络中的关系是非常复杂，而现有的交互方式中只是记录文章的转发评论人，无法满足复杂性的需求，因此亟需提出一种社交网络结构来更加好的刻画用户在社交网络中复杂关系。

发明内容

本申请的主要目的在于提供一种社交网络建模的方法及装置，以提供一种社交网络结构来更加好的刻画用户在社交网络中复杂关系。

为了实现上述目的，根据本申请的第一方面，提供了一种社交网络建模的方法。

根据本申请的社交网络建模的方法包括：

获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；

根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；

基于注意力机制对每个节点的特征向量进行更新。

可选的，所述基于注意力机制对每个节点的特征向量进行更新包括：

基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数；

根据注意力系数对每个节点的特征向量进行更新。

可选的，所述基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数包括：

基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处理；

基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数。

可选的，根据注意力系数对每个节点的特征向量进行更新包括：

根据注意力系数为每个节点对应的邻节点分配权重系数；

根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每个节点对应的更新特征向量。

可选的，所述方法还包括：

获取平台的更新数据，所述更新数据包括新增加的用户和/或新增加的交互关系；

根据所述更新数据更新所述图神经网络结构图以及图神经网络结构图中每个节点的特征向量；

基于注意力机制再次对更新后的图神经网络结构图中每个节点的特征向量进行更新。

可选的，在根据注意力系数对每个节点的特征向量进行更新之前，所述方法包括：

通过预设的回归函数对注意力系数进行归一化处理。

为了实现上述目的，根据本申请的第二方面，提供了一种社交网络建模的装置。

根据本申请的社交网络建模的装置包括：

第一获取单元，用于获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；

建立单元，用于根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；

第一更新单元，用于基于注意力机制对每个节点的特征向量进行更新。

可选的，所述第一更新单元包括：

计算模块，用于基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数；

更新模块，用于根据注意力系数对每个节点的特征向量进行更新。

可选的，所述计算模块用于：

可选的，更新模块用于：

根据注意力系数为每个节点对应的邻节点分配权重系数；

可选的，所述装置还包括：

第二获取单元，用于获取平台的更新数据，所述更新数据包括新增加的用户和/或新增加的交互关系；

第二更新单元，用于根据所述更新数据更新所述图神经网络结构图以及图神经网络结构图中每个节点的特征向量；

第三更新单元，用于基于注意力机制再次对更新后的图神经网络结构图中每个节点的特征向量进行更新。

可选的，所述装置包括：

归一化处理单元，用于在根据注意力系数对每个节点的特征向量进行更新之前，通过预设的回归函数对注意力系数进行归一化处理。

为了实现上述目的，根据本申请的第三方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行上述第一方面中任意一项所述的社交网络建模的方法。

为了实现上述目的，根据本申请的第四方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行上述第一方面中任意一项所述的社交网络建模的方法。

在本申请实施例中，社交网络建模的方法及装置中，首先，获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；其次，根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；最后，基于注意力机制对每个节点的特征向量进行更新。可以看出，本申请中得到的图神经网络结构图即为社交网络结构图，在建立时参考了用户与文章之间的交互关系 (交互关系包括用户对文章的转发评论等交互行为)、用户之间的交互关系，因此得到结构图相比于现有的记录方式可以更好的表达用户在社交网络中复杂关系。另外，得到的图神经网络结构图中每个用户节点的向量表示(节点的特征向量)是采用静态预先计算(基于预设的节点表示方法得到的图神经网络结构图中每个节点的特征向量)和动态更新(基于注意力机制对特征向量进行更新)相结合的技术方式，能够更好的应对不断变化的社交网络关系。会进行动态的更新。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例提供的一种社交网络建模的方法流程图；

图2是根据本申请实施例提供的一种有偏随机游走方法的示意图；

图3是根据本申请实施例提供的另一种社交网络建模的方法流程图；

图4是根据本申请实施例提供的一种社交网络建模的装置的组成框图；

图5是根据本申请实施例提供的另一种社交网络建模的装置的组成框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

根据本申请实施例，提供了一种社交网络建模的方法，如图1所示，该方法包括如下的步骤：

S101.获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系。

平台是指社交平台，比如微博、微信、头条新闻、网易新闻等。与文章有交互关系的用户为对目标文章有过观看、转发、评论、点赞等行为的用户，其中也包括文章的发布者。发布者或者称为发布源，可以是个人或者是机构。用户之间的交互关系是指确定哪些用户之间存在交互行为。目标文章是根据实际的需求可以选择某个文章或某类文章或某时段文章等等。

本步骤中获取各种数据的方式可以为从平台相关API中直接获取数据的方式，或者以网络爬虫的方式去爬取需要的数据。

S102.根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量。

需要说明的是，在得到图神经网络结构图时是基于图神经网络模型得到的。

首先，通过无权重图结构G＝(V，E)来表示上述步骤中得到的每个用户以及交互关系的用户(包括直接有交互，或者通过同一篇文章有间接交互)。其中V是节点的集合，每个节点都表示一个用户，每个节点通过对应的用户的身份标识进行区别。E是边的集合，每条边都表示其所连接节点间的关系。然后，基于预设的节点表示方法(可以为node2vec、word2vec、Bert等表示方法)来初始化用户的向量化表示即得到每个节点的特征向量。本实施例以 node2vec为例进行具体说明。node2vec是一种综合考虑DFS邻域和BFS邻域的graph embedding方法。简单来说，可以看作是deepwalk的一种扩展，可以看作是结合了DFS和BFS随机游走的deepwalk。

具体的基于Node2Vec来初始化用户的向量化表示，具体方法如下：将V 集合中的每个节点v通过最大化已观测到的节点概率产生，下述公式为每个节点v通过最大化已观测到的节点概率：

其中，f(u)是大小为|V|*d的矩阵参数，u为源观测节点，f(u)是将节点u 映射为embedding向量的映射函数，对于图结构中每个节点u，定义N_S(u)为通过邻居节点采样策略S采样出的节点u的近邻节点集合，N_S(u)被包括于V。观测到的节点集合S(u)是由从v节点开始的随机漫步所产生的。d为每个用户节点输入向量的维数(比如年龄、性别、等维度)。

另外，对节点集合S(u)的产生进行详细说明：具体为基于有偏随机游走的方法得到的。

如图2所示，假设我们从t节点开始了一个randomWalk，现在到达了v 节点，为了计算下一步路线，Node2Vec设计了一个二阶转移概率算法：节点间转移概率为：

π_vx＝α_pq(t，x)·w_vx

w_vx为两个节点间边的权重(对应与前述的权重系数)，α_pq为节点在路径搜索中设置的偏移量，x为下一步节点。

其中，当d_tx＝0时，v回到t节点，搜索偏置为1/p；当d_tx＝1时，x为t 的直接邻居，相当于广度优先搜索，这时的搜索偏置为1；当d_tx＝2时，x是t 的邻居的邻居，相当于深度优先搜索，这时的搜索偏置为1/q。可以使用beam search(集束搜索)的方式来寻找最优的p和q，也可以根据具体的舆情场景任务需要来手动选择p和q。

该方法整体上是一种有偏的二阶随机游走方法，p和q为控制节点随机游走的参数，参数p控制立即重新访问遍历中的节点的可能性。参数q用来控制节点继续向内部节点跳转还是向外部节点跳转。d_tx指的是节点t到节点x的距离。Node2vec这种方法通过调整随机游走权重的方法使graph embedding的结果在网络的同质性和结构性中进行权衡。

S103.基于注意力机制对每个节点的特征向量进行更新。

基于注意力机制是为了计算结构图中每个节点与邻近节点的相关性系数，然后根据相关性系数来对不同的邻近点分配不同的权重系数。注意力机制是对对邻近节点特征加权求和，在得到不同邻近点的权重系数后进行加权求和可以得到更新的特征向量。在社交网络中，用户之间交互的权重是不同的，因次通过注意力机制能够更好的表示不同的用户之间的交互权重。

最后需要说明的是，本实施例实际是基于图注意力神经网络(GraphAttensionNetwork，GAT)模型来建立图神经网络结构图。

从以上的描述中，可以看出，本申请实施例的社交网络建模的方法中，首先，获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；其次，根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；最后，基于注意力机制对每个节点的特征向量进行更新。可以看出，本申请中得到的图神经网络结构图即为社交网络结构图，在建立时参考了用户与文章之间的交互关系(交互关系包括用户对文章的转发评论等交互行为)、用户之间的交互关系，因此得到结构图相比于现有的记录方式可以更好的表达用户在社交网络中复杂关系。另外，得到的图神经网络结构图中每个用户节点的向量表示(节点的特征向量)是采用静态预先计算(基于预设的节点表示方法得到的图神经网络结构图中每个节点的特征向量)和动态更新(基于注意力机制对特征向量进行更新)相结合的技术方式，能够更好的应对不断变化的社交网络关系。会进行动态的更新。

作为上述实施例的进一步的补充和细化，本实施例提供了另一种社交网络建模的方法流程，如图3所示，包括如下步骤：

S201.获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系。

本步骤的实现方式与图1步骤是S101的实现方式相同，此处不再赘述。

S202.根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量。

本步骤的实现方式与图1步骤是S102的实现方式相同，此处不再赘述。

S203.基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数。

本步骤中结合具体的示例进行说明：

首先，基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处理；然后，基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数；最后，通过预设的回归函数对注意力系数进行归一化处理。

假设某一节点v的特征向量为h_v，其邻节点u的特征向量为h_u，则对应的计算每个节点与其邻节点的注意力系数的公式如下：

其中，e_vu为节点v与邻节点u的注意力系数，W为共享线性变换权重矩阵，a为attension系数。

需要说明的是为了更好的表达节点间的社会网络关系特征，在节点上运用共享线性变换权重矩阵W，再为每个节点加上self-attension。W是一个权重矩阵共享参数作用于所有网络节点，相当于对节点特征进行了增维，算是一种常见的特征增强方法。

另外，邻节点只考虑一度邻居，为了简化计算，使用softmax(即为预设的回归函数)对前述得到的注意力系数e_vu使进行归一化操作得到α_vu，α_vu是经过归一化处理后的注意力系数，也是本步骤中最终需要得到的注意力系数，注意力机制是一个单层前馈神经网络，使用LeakyRelu作为激活函数，N_i为V 节点的邻近节点结合。则α_vu的计算公式如下：

前述为基于单个注意力机制计算得到的注意力系数。下面对基于多头注意力机制multi-head attension计算注意力系数进行说明。

每一个注意力的头都有它自己的参数，基于多头注意力机制计算注意力系数即整合多个注意力机制的输出结果。一般整合的方式有两种：拼接或者加和求平均。即基于多个独立的注意力机制分别得到多个注意力系数，然后将多个注意力系数进行拼接或者加和求平均。每个注意力系数的计算可以参见上述基于单个注意力机制计算注意力系数的过程。

S204.根据注意力系数对每个节点的特征向量进行更新。

对应于上述计算得到的注意力系数α_vu对每个节点的特征向量进行更新，更新的过程包括：

首先，根据注意力系数为每个节点对应的邻节点分配权重系数；

在为每个邻节点分配权重系数时，权重系数与注意力系数成正比，注意力系数越大对应的权重系数也越大。也可以直接将注意力系数作为权重系数。

然后，根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每个节点对应的更新特征向量。

另外，如有新增加的用户和/或新增加的交互关系新的文章或者用户加入，则对应的图神经网络结构图也会根据更新的数据进行动态的调整更新，具体的更新过程如下：

首先，获取平台的更新数据，更新数据包括新增加的用户和/或新增加的交互关系；其次，根据更新数据更新图神经网络结构图以及图神经网络结构图中每个节点的特征向量；再次，基于注意力机制再次对更新后的图神经网络结构图中每个节点的特征向量进行更新。

比如，有发布者发布新的文章，多个用户对该文章进行转发、观看、评论等行为。相当于社交网络发生了变化，因此为了实时的记录更新社交网络的变化，需要对之前建立的图神经网络结构图进行更新以及每个用户的特征向量进行更新。具体的，获取更新数据对应的用户身份标识、交互关系，对于新的用户身份标识和/或交互关系，结构图中的节点和/或边会发生变化，对应的节点向量需要重新进行初始化以及更新的过程。向量初始化的过程可以参见前述图 1中步骤S102中的实现方式，不同的是身份标识和交互关系中增加了更新数据的身份标识和交互关系。对于重新进行更新的过程可以参见前述图1和图2 中的步骤S103以及步骤S203-S204的实现过程。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

根据本申请实施例，还提供了一种用于实施上述图1和图3方法的社交网络建模的装置，如图4所示，该装置包括：

第一获取单元41，用于获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；

建立单元42，用于根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；

第一更新单元43，用于基于注意力机制对每个节点的特征向量进行更新。

从以上的描述中，可以看出，本申请实施例的社交网络建模的装置中，首先，获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系；其次，根据身份标识、交互关系、无权重图结构，基于预设的节点表示方法得到图神经网络结构图，以及图神经网络结构图中每个节点的特征向量；最后，基于注意力机制对每个节点的特征向量进行更新。可以看出，本申请中得到的图神经网络结构图即为社交网络结构图，在建立时参考了用户与文章之间的交互关系(交互关系包括用户对文章的转发评论等交互行为)、用户之间的交互关系，因此得到结构图相比于现有的记录方式可以更好的表达用户在社交网络中复杂关系。另外，得到的图神经网络结构图中每个用户节点的向量表示(节点的特征向量)是采用静态预先计算(基于预设的节点表示方法得到的图神经网络结构图中每个节点的特征向量)和动态更新(基于注意力机制对特征向量进行更新)相结合的技术方式，能够更好的应对不断变化的社交网络关系。会进行动态的更新。

进一步的，如图5所示，所述第一更新单元43包括：

计算模块431，用于基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数；

更新模块432，用于根据注意力系数对每个节点的特征向量进行更新。

进一步的，如图5所示，所述计算模块431用于：

进一步的，如图5所示，更新模块432用于：

根据注意力系数为每个节点对应的邻节点分配权重系数；

进一步的，如图5所示，所述装置还包括：

第二获取单元44，用于获取平台的更新数据，所述更新数据包括新增加的用户和/或新增加的交互关系；

第二更新单元45，用于根据所述更新数据更新所述图神经网络结构图以及图神经网络结构图中每个节点的特征向量；

第三更新单元46，用于基于注意力机制再次对更新后的图神经网络结构图中每个节点的特征向量进行更新。

进一步的，如图5所示，所述装置包括：

归一化处理单元47，用于在根据注意力系数对每个节点的特征向量进行更新之前，通过预设的回归函数对注意力系数进行归一化处理。

具体的，本申请实施例的装置中各单元、模块实现其功能的具体过程可参见方法实施例中的相关描述，此处不再赘述。

根据本申请实施例，还提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行上述方法实施例中的社交网络建模的方法。

根据本申请实施例，还提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行上述方法实施例中的社交网络建模的方法。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种社交网络建模的方法，其特征在于，所述方法包括：

基于注意力机制对每个节点的特征向量进行更新。

2.根据权利要求1所述的社交网络建模的方法，其特征在于，所述基于注意力机制对每个节点的特征向量进行更新包括：

根据注意力系数对每个节点的特征向量进行更新。

3.根据权利要求2所述的社交网络建模的方法，其特征在于，所述基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数包括：

4.根据权利要求2所述的社交网络建模的方法，其特征在于，根据注意力系数对每个节点的特征向量进行更新包括：

根据注意力系数为每个节点对应的邻节点分配权重系数；

5.根据权利要求1所述的社交网络建模的方法，其特征在于，所述方法还包括：

6.根据权利要求4所述的社交网络建模的方法，其特征在于，在根据注意力系数对每个节点的特征向量进行更新之前，所述方法包括：

通过预设的回归函数对注意力系数进行归一化处理。

7.一种社交网络建模的装置，其特征在于，所述装置包括：

8.根据权利要求7所述的社交网络建模的装置，其特征在于，所述第一更新单元包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使所述计算机执行权利要求1-6任意一项所述的社交网络建模的方法。

10.一种电子设备，其特征在于，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求1-6任意一项所述的社交网络建模的方法。