CN112507247A

CN112507247A - 一种融合用户状态信息的跨社交网络用户对齐方法

Info

Publication number: CN112507247A
Application number: CN202011476008.7A
Authority: CN
Inventors: 胡军; 杨冬梅; 刘立; 张清华
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2020-12-15
Filing date: 2020-12-15
Publication date: 2021-03-16
Anticipated expiration: 2040-12-15
Also published as: CN112507247B

Abstract

本发明属于社交网络分析领域，具体涉及一种融合用户状态信息的跨社交网络用户对齐方法；所述方法包括采用随机游走采样的方式提取用户的局部特征；采用迭代的方式计算出用户的状态值，循环比较具有相似状态值的用户集合作为该用户的全局特征；将局部特征和全局特征输入到词向量模型的神经网络模型中映射为低维特征向量；将用户在两个社交网络中的低维特征向量采用预设的映射函数进行对齐，输出源社交网络中的用户与目标社交网络中的用户中可能存在的潜在对齐用户对；本发明利用网络嵌入方法分别从局部和全局提取出社交用户特征，利用节点状态量化节点在网络中的重要性，通过融合节点状态以及迭代地更新训练对齐模型，提高用户识别的准确率。

Description

一种融合用户状态信息的跨社交网络用户对齐方法

技术领域

本发明属于社交网络分析领域，具体涉及一种融合用户状态信息的跨社交网络用户对齐方法。

背景技术

随着社交网络的快速发展，一个用户通常在多个社交平台注册账户，通过网络对齐在不同网络中识别出属于相同用户的不同账户在商业应用、网络安全、推荐系统等方面具有关键作用。

现有技术在解决跨网络用户对齐的问题主要包括用户特征提取、模型构建和用户对齐三个阶段，在用户特征提取阶段的特征主要分为三类：基于用户配置文件信息、基于用户生成内容信息和基于网络结构，然后将提取的特征作为模型构建阶段的输入，根据已知对齐节点的可用性训练监督模型或非监督模型，最后利用训练后的模型预测两个用户身份是否匹配，其对齐过程参考如图1所示。

因为跨不同社交网络的用户信息存在较大噪声，且用户生成内容信息获取难度大，导致基于属性信息和生成内容信息的方法容易陷入信息不足、信息缺失、信息伪造等困境中，而社交网络结构拥有获取难度低、真实性高以及网络结构中隐含丰富信息等特点，所以现有技术利用网络结构，从节点自我网络、节点度、一阶邻居和公共邻居等角度提取用户特征来判断多网络用户是否对齐，但他们仅使用局部特征进行跨两个社交网络的用户对齐。例如中国专利CN111476673A提出了一种基于神经网络的社交网络间的用户对齐的方法、装置和介质，基于网络结构只考虑局部信息来进行随机游走，从局部角度基于拓扑一致性假设认为相同用户在不同网络中具有一致的连接结构；但单一角度特征即局部特征并不能准确反映用户的属性，结合局部和全局两个角度更有利于获取更多的用户特征。虽然中国专利CN105808696A还提出了一种基于全局和局部特征的跨在线社交网络用户匹配方法，但是该方法中使用公共映射邻居作为局部特征来判断网络的潜在匹配对，但由于网络的复杂性以及未知性，已知的锚节点对在网络中的分布是不确定的，相对大型网络来说分布可能很稀疏，这时通过判断公共映射邻居个数并不能识别潜在匹配节点，比如潜在对齐的节点与锚节点对距离很远，同时，该发明使用一个参数来结合局部特征和全局特征，但由于用户节点在不同网络中存在不同语义，在两个维度上的匹配结果可能存在较大差异。

发明内容

为了解决现有技术存在的问题，本发明提供了一种融合用户状态信息的跨社交网络用户对齐方法。本发明分别从局部和全局的角度提取用户丰富的结构信息，并将两个原始社交网络嵌入到公共低维向量空间，基于用户潜在特征训练一个映射函数，使用余弦距离衡量两个用户之间的相似性，按照相似度列表进行匹配，达到用户对齐的目的。

为实现上述发明目的，解决跨社交网络用户对齐，本发明采用的技术方案包括以下步骤：

一种融合用户状态信息的跨社交网络用户对齐方法，所述方法包括：

采用随机游走采样的方式提取社交网络中的用户的局部特征；

采用迭代的方式计算出社交网络中的用户的状态值，循环比较具有相似状态值的用户集合作为该用户的全局特征；

将局部特征和全局特征输入到词向量模型中的神经网络模型中，将所述社交网络用户映射为低维特征向量；

将用户在两个社交网络中的低维特征向量采用预设的映射函数进行对齐，输出源社交网络中的用户与目标社交网络中的用户中可能存在的潜在对齐用户对。

本发明的有益效果：

本发明利用网络嵌入方法分别从局部和全局的角度提取出社交用户特征，利用节点状态量化节点在网络中的重要性，通过融合节点状态利用已知锚节点对训练监督对齐模型，提高了用户识别的准确率；在给定相同社交网络数据集条件下，本发明可以比仅考虑局部结构或仅利用配置文件信息的方法识别出更多的不同社交网络上的用户。

附图说明

图1为传统用户对齐方法的阶段流程图；

图2为本发明实施例采用的用户对齐框架图；

图3为本发明实施例采用的用户对齐方法流程图；

图4是本发明实施例中局部特征的随机游走示意图；

图5是本发明实施例中用户所处于的不同状态示意图；

图6是本发明实施例中的局部特征和全局特征的提取和融合过程示意图；

图7是本发明实施例中实施例中模拟的随机游走示意图；

图8是本发明实施例中用户游走后的用户的状态示意图；

图9是本发明实施例采用的词向量模型中的神经网络模型结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

社交网络间的用户对齐作为社交网络分析中的一个基本和关键的问题，旨在从不同的社交网络平台中识别出属于同一用户的社交账号，社交网络用户对齐其实质就是让用户身份u指实际自然人P在社交平台上的独特的账户表示，它由三部分组成，分别是配置文件、内容和网络。配置文件表示用户的一组特征描述，包括用户名、位置、年龄等属性。内容表示用户参与活动的一组属性，包括时间、位置、文本和图像等。网络表示用户与其他用户社交关系属性的一组特征。

考虑到现有技术中所存在的技术问题，图2是本发明实施例的用户对齐架构图；本实施例假设存在源社交网络和目标社交网络，将源社交网络中的用户与目标社交网络中的用户对齐；先分别对源社交网络和目标社交网络中的用户提取出局部信息和全局信息，并将局部信息和全局信息进行融合；将融合后的信息嵌入空间；将嵌入空间中的向量输入到对齐模型中，实现源社交网络与目标社交网络中用户的对齐。

可以理解是，所述源社交网络与所述目标社交网络都可以有多个，本实施例为了方便展示，所以仅仅只采用了一个源社交网络和一个目标社交网络。

例如，用户A分别在微博社交网络平台、知乎社交网络平台以及豆瓣社交网络平台上进行注册并发表了相关的内容，通过本发明的用户对齐方法，将微博社交网络平台作为源社交网络，将豆瓣社交网络平台作为目标社交网络；分别采集微博平台和豆瓣平台的用户数据，通过本发明的用户对齐方法，就可以在豆瓣平台上找出微博中用户A的潜在对齐用户；经过一些处理后，最终可以将位于微博的用户A与位于豆瓣上的用户A进行对齐。

图3是本发明实施例的对齐方法的流程图，如图3所示，一种融合用户状态信息的跨社交网络用户对齐方法包括以下步骤：

101、采用随机游走采样的方式提取社交网络中的用户的局部特征；

本步骤目的是提取用户在网络中的局部信息，与用户直接相连的节点可以反映用户邻居的微观结构，而相距较远的高阶邻居反映出当前节点邻居的宏观特性，本发明利用深度优先游走(DFS)和广度优先游走(BFS)同时考虑节点直接邻居和高阶邻居，即所述局部特征。

在一个实施例中，对社交网络中的每个用户，以该用户对应的用户节点作为起点，随机访问该用户的邻居用户作为下一跳，然后以下一跳作为起点再次随机访问其邻居节点，根据社交网络中的用户平均度，直至构成一个定长的序列长度，然后重复上述过程，得到用户的随机游走序列作为用户的局部特征。

在一个更为优选的实施例中，给定一个社交网络G＝(V,E)，V表示网络中的节点集，E表示节点之间的边关系。给定起始节点t∈V，模拟随机游走，如图4所示，假设已经采样了[t,v_i]，为综合DFS和BFS的特性，本发明引入两个参数即第一游走参数p和第二游走参数q来控制节点v_i下一次随机游走产生的方式，参数p控制采样在起始节点周围游走，反映BFS特性，即在当前节点的小社区内具有相似性，参数q反映DFS特征，旨在获取高阶邻居，通过p和q进行有中心地保留原始节点的局部特征。定义一个概率分布T_pq(t,v_j)表示当前用户v_i到其邻居用户v_j的转移概率P(v_j|v_i)：

其中，w_ij表示用户v_i和用户v_j之间的边权重，T_pq(t,v_j)表示概率分布，即标准化前的转移概率，Z是用来标准化的常数，具体地：

T_pq(t,v_j)表示当前用户v_i基于其起始用户t到其不同邻居用户v_j的转移概率分布，直观的解释这个概率分布：如果用户t与用户v_j相等即dis(t,v_j)＝0，则采样到v_j的概率为

如果用户t与用户v_j为直接邻居即dis(t,v_j)＝1，则采样到v_j的概率为1；如果t与v_j为不直接相连的高阶邻居，则采样到v_j的概率为

本实施例中，仅考虑一阶和二阶邻居用户，更为高阶的邻居用户可以在本实施例的基础上，继续推广使用，本发明对此不做限定。

对于每个节点，迭代一定次数得到保留该节点以上所述局部特征的随机游走序列。

102、采用迭代的方式计算出社交网络中的用户的状态值，循环比较具有相似状态值的用户集合作为该用户的全局特征；

本步骤旨在为每个节点寻找具有相似角色的节点作为其在网络中的全局特征。首先，本发明提出了节点全局状态概念，本发明中的全局特征指节点在网络中的全局状态。节点全局状态可以反映节点在网络中的不同角色，体现不同重要性，如图5所示中，编号1的用户相比编号2的用户的重要性更大，编号3的用户起着桥接作用，连接不同的用户群体；编号3的用户重要性比1和2的用户都大，为了方便实施，编号1的用户作为组织者用户，编号2的用户作为成员用户，编号3的用户作为连接者用户。

在上述实施例的基础上，本发明需要计算出各个用户的状态值S。初始化社交网络中每个用户的状态值S为相同状态值

用户v_i的状态值表示为：

其中，S(v_i)表示用户v_i的状态值；π表示用户v_i到邻居用户的概率，(1-π)表示用户v_i到其他非邻居用户的概率；|V|表示社交网络中的用户数，n(v_i)是用户v_i的邻居集合，本实施例中指的用户v_i的直接相邻邻居；L(v_j)表示用户v_j的出链数；S(v_j)表示用户v_j的状态值。

本发明所采用的状态值能够反映用户在社交网络中的地位，即体现用户在社交网络中的重要性，如果一个节点具有很多的邻居用户，说明该用户比较重要，即他的状态值较大，如果一个节点与具有较大状态值的节点具有连接关系，那么其状态值也得到相应的提高。

即将当前节点的状态值先均匀分配给具有连接关系的节点，

则反映节点v_i链接到当前节点v_j时能够提升的状态值大小。

根据用户的状态值公式迭代计算节点状态值，当相邻两次迭代计算值的差异达到指定阈值，则停止迭代，此时则得到社交网络中每个用户的状态值。对于给定节点，循环比较具有相似状态值的节点集合作为该节点的全局特征，也即是将当前用户的状态值与其他用户的状态值进行比较，将具有相似状态值的用户所形成的用户集合作为当前用户的全局特征。

本发明所采用的全局特征，相比较于传统技术，能够在社交网络中按照状态值划分出具有不同状态值的用户，能够在稀疏的大型社交网络中准确的挖掘出用户在整个社交网络中的重要程度；通过计算状态值就能够反映出用户在社交网络中的全局特征。

103、将局部特征和全局特征输入到词向量模型中的神经网络模型中，将所述社交网络用户映射为低维特征向量；

本步骤目的是融合节点局部和全局状态特征，本实施例中利用自然语言词向量模型word2vec，将节点的局部和全局状态序列输入skip-gram模型，通过训练该模型将每个节点映射成一个固定长度的短向量，构成低维向量空间。

图6给出了本发明实施例中提取并融合局部特征和全局特征的过程，如图6所示，所述过程主要包括针对社交网络中的所有用户，对这些用户分别提取出特征，按照随机游走的不同采样方式提取出局部特征，按照用户状态值在整个网络中寻找具有相似角色状态关系的节点集，提取出全局特征，将局部特征序列和全局特征序列进行融合，将融合后的用户序列输入到skip-gram神经网络中，对所述神经网络模型进行优化训练，输出融合局部和全局特征的用户低维向量。

具体过程包括采用skip-gram模型对用户的随机游走序列以及相似状态用户序列进行训练，训练完成后，将所有用户编码为one-hot形式输入映射到权重矩阵中，使用梯度下降计算给定用户生成其相邻用户的条件概率并最大化该概率，得到用户与嵌入向量的映射表，训练结束后分别把不同社交网络里的所有用户通过查表表示为低维空间的用户向量。

在上述实施例的基础上，对于用户v_i以及其用户序列[v₁,v₂,v₃,…,v_l]，其中l表示序列长度，采用极大似然估计学习出社交网络中的潜在表示，其目标函数为：

其中f:v_i→z_i为映射函数，c是上下文窗口大小，条件概率p(v_j|f(v_i))为

z_i为节点v_i的嵌入向量，在上述目标函数中引入负采样加快训练效率，并对其中的极大似然估计部分的内容进行改进，表示为：

其中，N为负采样个数，每个用户v负采样概率为

其中d_i表示节点v_i的度，

则表示用户v_k按照负采样概率P_n(v)的期望；本发明通过最大化目标函数以得到每个用户保留了局部和全局状态特征的低维向量表示。

104、将用户在两个社交网络中的低维特征向量采用预设的映射函数进行对齐训练，利用对齐模型输出源社交网络中用户的候选锚节点，通过最小化与目标社交网络中的用户的预测损失，判断可能存在的潜在对齐用户对。

本步骤目的是基于学习到的两个网络的潜在向量表示，利用已知锚用户对

及其潜在表示

和

学习一个映射函数Φ:Z^s→Z^t，映射函数的目的是使得在源社交网络Z^s中的用户表示

经过映射函数后

其与在目标社交网络Z^t中对应节点的距离最小。令Θ表示映射函数即对齐模型的所有参数，定义损失函数：

其中F为相似性函数，由于源社交网络和目标社交网络的嵌入空间可能属于不同的、不可比拟的向量空间，为使它们与锚用户相关，本发明利用锚节点

有监督训练非线性映射模型。

本步骤利用对齐模型，预测出源社交网络的用户

与目标社交网络的用户间可能存在的潜在锚节点对，在公共空间中引入余弦距离估计节点之间的相似性：

对源社交网络中待对齐节点，建立二部图迭代计算与目标社交网络中用户的相似性，当相似度达到预设阈值，则将目标社交网络中的该用户作为候选对齐节点，以此可得到一个潜在对齐的用户列表。如表1所示，表示DBLP的两个社交网络：数据挖掘和机器学习。

表1社交网络用户数据

本实施例首先对网络数据进行局部结构信息采样。设置随机游走长度80，迭代次数10次，学习率设为0.001，转移概率p＝0.5，q＝2。如图7所示，给定源节点B，模拟一个长度为l＝5的随机游走，综合BFS和DFS采样策略生成不同的用户序列，依次可以表示为：[B,G,B,E,K]，[B,C,B,E,G]，[B,D,E,B,C]以及[B,G,E,B,F]。

本实施例首先计算节点状态值，阈值设置∈＝0.001，阻尼系数π＝0.85，使用图8描述节点状态值的计算过程，不同填充代表不同状态值；其中用户BCE的状态值最大，用户DF的状态值次之，用户GHI的状态值再次之，用户AJK的状态值最小。

首先初始化每个节点的状态值

|V|表示网络节点个数，根据式节点状态值计算可得S(A)＝S(B)＝S(C)＝…＝S(K)＝1/11；然后使用一个矩阵M表示社交网络节点间的边权重，m_ij表示用户v_i和邻居用户v_j之间的边权，将当前用户权重归一化后均匀分配给出链邻居用户即

可得m_DA＝0.5,m_DB＝0.5,m_ED＝0.33,m_EB＝0.33,m_BC＝1,m_GB＝0.5,m_HB＝0.5,m_HE＝0.5,m_GE＝0.5,m_IB＝0.5,m_IE＝0.5,m_EF＝0.33,m_FB＝0.5,m_FE＝0.5,m_KE＝1,m_JE＝1。遍历社交网络中的所有用户，根据状态值计算公式将每个用户的状态值S根据边权分配给其出链用户，进行多次迭代更新计算，当两次状态值达到指定阈值如|S′(A)-S(A)|<∈时停止迭代并得到所有用户的状态值，S(A)＝0.033,S(D)＝0.039,S(B)＝0.384,S(C)＝0.343,S(E)＝0.081,S(F)＝0.039,S(G)＝S(H)＝S(I)＝S(J)＝S(K)＝0.016。由计算结果可对应图8中不同颜色节点的重要性。

由于网络用户各自状态的差异性，相似状态但状态值不相似，所以本发明将网络用户的状态分为不同状态等级，初始时具有一致状态值，迭代更新后处于不同状态级。对于每个用户，在相同状态级游走寻找指定长度的用户序列，作为全局状态特征。在图7中设计序列长度为3，对用户B可得全局特征[B,C,E]，对用户G可得全局特征[G,H,I]，对用户D可得全局特征[D,A,F]等。对大型社交网络本发明设置全局状态值序列长度可以更长，例如可以设置为80。

融合局部特征和全局特征的网络嵌入。本发明将用户的局部特征和全局特征序列输入skip-gram模型，如图9所示。在节点嵌入的计算过程中设置窗口大小c＝10，维度d＝128，得到源社交网络和目标社交网络向量表示Z^s和Z^t。

训练非线性对齐模型Φ:Z^s→Z^t，对源社交网络中待对齐节点，利用式相似性计算公式计算源社交网络节点

与目标社交网络的节点

间可能存在的潜在锚节点对之间的余弦距离，选择最相似的top_k个节点作为候选锚节点返回，与待预测节点存在稳定对齐关系则表示准确对齐，统计数量标记为hit_number，即有

其中

当

表示同一个用户时g＝1，否则g＝0。

本发明采用如下评价指标衡量对齐模型性能，

本发明将数据集以9：1的比例分为训练集V_train和测试集V_test。其中k表示对源社交网络中待测试用户

通过与目标社交网络中的用户

计算相似性得到存在潜在对齐的用户列表长度，列表中用户为可能与当前用户对齐的用户集合，本实施例中通过构建二部图，对源网络中节点与目标网络中所有节点建立预测链接，计算相似性得到候选对齐节点列表，将候选用户的相似度与阈值进行比较，得到最终识别结果，hit_number为匹配个数，在最相似的top_k个节点中，正确对齐的节点在列表中排名越靠前，对齐的准确度越高。

本发明采用10次测试结果的平均值作为最终结果，采用四种现有技术与本发明进行对比：

Mego2Vec，这是一种利用节点的自我网络，结合用户名来解决一种局部网络的用户对齐方法；

PALE，仅利用网络结构的方法，基于一致性假设解决社交用户对齐问题；

MAH，利用超图构建网络的高阶信息，超图能一定程度上反映用户的全局信息。

在给定相同数据集上，对比现有技术Mego2Vec、PALE和MAH，记录在预测不同top_k值时的结果，如表2所示。

表2实例结果

由表2分析对比结果，Mego2Vec和PALE虽然从不同角度分析节点邻居，但Mego2Vec的自我网络局限于直接相连的一阶邻居，PALE利用公共邻居，MAG通过计算两两用户对之间的权重为每个网络构建一个社交图，通过流形对齐，得到最终识别的用户排序结果，虽然识别出一定的潜在用户对，但它们都忽略了节点全局状态的差异。本发明通过融合局部结构和全局状态特征的用户对齐方法，有效改进跨社交网络用户对齐的准确率，并且能够比现有技术识别出更多的潜在对齐用户对。

在本发明的描述中，需要理解的是，术语“同轴”、“底部”、“一端”、“顶部”、“中部”、“另一端”、“上”、“一侧”、“顶部”、“内”、“外”、“前部”、“中央”、“两端”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明中，除非另有明确的规定和限定，术语“安装”、“设置”、“连接”、“固定”、“旋转”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述采用随机游走采样的方式提取社交网络中的用户的局部特征包括按照深度优先游走和广度优先游走分别设置出对应的第一游走参数和第二游走参数；按照所述第一游走参数和第二游走参数计算出用户游走的概率分布；按照所述概率分布计算出当前用户到其他邻居用户的转移概率；确定出用户游走的路线即随机游走序列，即为用户的局部特征。

3.根据权利要求2所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，按照所述概率分布计算出当前用户到其他邻居用户的转移概率包括：

其中，P(v_j|v_i)表示当前用户v_i游走到其邻居用户v_j的转移概率；w_ij表示用户v_i和用户v_j之间的边权重；Z表示标准化常数；E表示社交网络中边集合；T_pq(t,v_j)表示当前用户v_i基于其起始用户t到其不同邻居用户v_j的转移概率分布，p表示深度优先游走对应的第一游走参数；q表示广度优先游走对应的第二游走参数；dis(t,v_j)表示起始用户t到用户v_j的距离。

4.根据权利要求1所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述采用迭代的方式计算出社交网络中的用户的状态值包括：

其中，S(v_i)表示用户v_i的状态值；π表示用户v_i到邻居用户的概率，(1-π)表示用户v_i到其他非邻居用户的概率；|V|表示社交网络中的用户数，n(v_i)是用户v_i的邻居集合；L(v_j)表示用户v_j的出链数；S(v_j)表示用户v_j的状态值。

5.根据权利要求1所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述循环比较具有相似状态值的用户集合作为该用户的全局特征包括当相邻两次迭代的状态值的差异达到指定阈值，则停止迭代，得到社交网络每个节点的状态值；将当前用户的状态值与其他用户的状态值进行比较，将具有相似状态值的用户所形成的用户集合作为当前用户的全局特征。

6.根据权利要求1所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述将局部特征和全局特征输入到词向量模型中的神经网络模型中包括利用自然语言词向量模型将用户的局部特征和全局特征输入到神经网络模型中，采用极大似然估计的目标函数训练所述神经网络模型，将每个用户映射成一个固定长度的短向量，并构成低维向量空间；所述短向量即为所述低维特征向量。

7.根据权利要求6所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述采用极大似然估计的目标函数表示为：

其中，|V|表示社交网络中的用户数；c表示上下文窗口大小；v_j表示序列中距离用户v_i间隔为|i-j|的用户；f(v_i)表示用户v_i到其嵌入向量z_i的映射函数，即f:f(v_i)＝z_i；σ表示激活函数；

表示用户v_j的嵌入向量转置。

8.根据权利要求7所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，对所述神经网络模型采用负采样方式进行训练，所述极大似然估计的目标函数表示为：

其中，N为负采样个数，每个用户v负采样概率为

其中d_i表示用户v_i的度；

则表示用户v_k按照负采样概率P_n(v)的期望。

9.根据权利要求1所述的一种融合用户状态信息的跨社交网络用户对齐方法，其特征在于，所述输出源社交网络中的用户与目标社交网络中的用户中可能存在的潜在对齐用户对包括对源社交网络中的待对齐用户迭代计算其与目标社交网络的用户之间的相似度，当所述相似度达到预设阈值，则将目标社交网络的用户作为对齐用户，并形成源社交网络的待对齐用户的用户列表。