CN109636658A - 一种基于图卷积的社交网络对齐方法 - Google Patents
一种基于图卷积的社交网络对齐方法 Download PDFInfo
- Publication number
- CN109636658A CN109636658A CN201910044138.4A CN201910044138A CN109636658A CN 109636658 A CN109636658 A CN 109636658A CN 201910044138 A CN201910044138 A CN 201910044138A CN 109636658 A CN109636658 A CN 109636658A
- Authority
- CN
- China
- Prior art keywords
- social networks
- node
- anchor node
- function
- startup disk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006870 function Effects 0.000 claims abstract description 66
- 239000011159 matrix material Substances 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 26
- 238000013507 mapping Methods 0.000 claims abstract description 23
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 17
- 239000013598 vector Substances 0.000 claims description 28
- 238000003780 insertion Methods 0.000 claims description 23
- 230000037431 insertion Effects 0.000 claims description 23
- 239000004576 sand Substances 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 6
- 241000575946 Ione Species 0.000 description 4
- LTXREWYXXSTFRX-QGZVFWFLSA-N Linagliptin Chemical compound N=1C=2N(C)C(=O)N(CC=3N=C4C=CC=CC4=C(C)N=3)C(=O)C=2N(CC#CC)C=1N1CCC[C@@H](N)C1 LTXREWYXXSTFRX-QGZVFWFLSA-N 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于图卷积的社交网络对齐方法,首先利用图卷积神经网络对社交网络中的用户关系进行网络嵌入,然后利用高斯核函数将嵌入空间升维,得到高维空间中节点的相似度矩阵,利用锚节点来表示非锚节点,得到两个社交网络最终的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数,最后利用该函数将两个社交网络中的节点进行对齐。本发明不需要提取大量的用户隐私信息,利用图形就能够很好地表示社交网络用户之间的社交关系。通过引入高斯核函数将嵌入空间升维,可以分离原始低维嵌入空间中不可分离的节点。利用已知锚节点来学习网络映射函数,可以大大地提高社交网络对齐的准确率,从而实现了一种优于现有方法的社交网络对齐方法。
Description
技术领域
本发明属于机器学习中的神经网络领域,是一种基于深度学习的方法,主要利用图卷积神经网络(Graph Convolutional Neural Networks,GCN)对社交网络中的用户进行网络嵌入(Network Embedding,NE)从而将网络中的用户节点用嵌入向量表示,并在此基础上利用高斯核函数对嵌入空间进行维度提升从而分离在低维空间难于区分的用户节点,最后利用锚节点信息进行神经网络训练得到两个社交网络中用户节点的映射函数,达到将两个社交网络中的用户对齐的目的。
背景技术
社交网络对齐的主要目的是在两个社交网络之间找到对应用户,即在不同社交网络中对应真实世界中的同一个自然人的用户。由于社交网络对齐在用户行为预测、身份验证和隐私保护等各种应用程序设置方面的重要影响,最近引起了越来越多的关注。
随着社交网络服务(Social Network Service,SNS)的普及,网络数据无处不在。社交网络可以通过社交网络图(Social Network Graph,SNG)来表示。该图是未加权的无向图,图的每个顶点都代表一个用户,两点之间的边代表两个用户之间的关系。在现实中,因为社交网络服务商会对用户隐私进行保护,往往不能知道两个社交网络所有的对应用户,但是可能通过其它途径获知两个社交网络一部分的对应用户。这种两个不同的社交网络中已知的对应节点被称为锚节点。本发明根据社交网络图以及锚节点信息来进行两个社交网络的对齐。
传统的网络嵌入方法可以分为两种,一种方法通常从账户配置文件或活动(如用户名、性别、写作风格等)中提取出一组特征来代表用户;另一种方法是通过利用网络结构信息来进行网络嵌入。随着图形表示技术的发展,本发明利用图卷积方法来进行网络嵌入,利用锚节点来训练两个社交网络间节点的映射函数,仅仅依据社交网络图的结构信息及少量的锚节点信息,就能够实现优于现有方法的社交网络对齐。
发明内容
本发明的目的是依据社交网络图的结构信息及少量的锚节点信息而不需要利用用户的其它特征信息来解决社交网络对齐问题,即在两个不同的社交网络中找到对应用户。
本发明的思路为,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,在此基础上引入高斯核函数来优化网络嵌入从而帮助识别原始嵌入空间中不可分离的节点,最后利用锚节点来训练两个社交网络间节点的映射函数进一步提高社交对齐的准确率。
基于上述发明思路,本发明提出一种基于图卷积的社交网络对齐方法,其具体包括以下步骤:
S1,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量;
S2,利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并对嵌入向量的距离进行归一化处理得到高维空间中节点的相似度矩阵;
S3,利用高维空间中节点的相似度矩阵,得到两个社交网络用已知锚节点表示非锚节点的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数;
S4,得到网络映射函数之后,利用该函数将两个社交网络中的节点进行对齐。
基于图卷积的社交网络对齐方法,所述步骤S1的目的在于,对于给定的两个社交网络Gs和Gt,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入Us和Ut,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量。该步骤S1具体包括以下分步骤:
S11,利用图卷积神经网络将社交网络Gs进行网络嵌入。定义社交网络图为Gs=(Vs,Es),其中,Vs={ui|i∈[1,2,...,N]}是图Gs所有顶点的集合,每个顶点代表一个用户,N为图中的顶点数,也就是用户的数量,小写字母u代表用户;Es={eij|i,j[1,2,...,N]}是图Gs边的集合,图Gs中的每条边eij∈Es表示用户ui和用户uj存在社交关系。
根据图卷积神经网络相关知识,做出如下定义:定义图的邻接矩阵为一个表示节点之间关系的矩阵,记为其中表示N×N维的向量空间,矩阵元素定义为:若eij∈Es,则Wij=1,若则Wij=0;为对角矩阵,称为图Gs的对角度矩阵,对角线元素为Dii=ΣjWij;定义矩阵由此定义一个对角矩阵其对角线元素为令定义两层神经网络如下:
其中σ(·)是ReLU激活函数(ReLU(*)=max(0,*)),是第一层学习的参数矩阵,是第二层学习的参数矩阵,其中F0是第一层输出的维数,F1是第二层输出的维数。
令定义交叉熵损失函数如下:
其中通过不断的训练将L的值降到最小,我们就得到了社交网络Gs的一个基于GCN的图表示模型Us。Us的第i行ui是社交网络Gs中第i个用户的网络嵌入表示,其维度为F1;
S12,利用图卷积神经网络将社交网络Gt=(Vt,Et)进行网络嵌入。该过程与步骤S11相同,最后得到社交网络Gt的网络嵌入Ut。Ut的第i行vi是社交网络Gt中第i个用户的网络嵌入表示,其维度为F1。
基于图卷积的社交网络对齐方法,所述步骤S2的目的在于,将步骤S1得到的网络嵌入Us和Ut利用高斯核函数映射到更高维度的空间,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并由此计算高维空间中节点的相似度矩阵Ss和St。该步骤S2具体包括以下分步骤:
S21,计算网络嵌入Us映射到高维空间之后节点之间的相似度矩阵Ss。定义由步骤S1得到的社交网络嵌入u构成的空间为通过一个函数φ将u投影到更高维特征空间中,即
性质优良的升维函数φ往往比较复杂不易求取。求解相似度矩阵并不需要知道函数φ的具体形式,而只需能计算φ(ui)和(uj)的点积,并由此计算出φ(ui)和φ(uj)的距离并进行归一化处理即可得到相似度矩阵。用非线性函数κ来表示向量φ(ui)和φuj)之间的点积:κ(ui,uj)=<φ(ui),φ(uj)>。采用机器学习中常用的高斯核函数进行升维,即定义其中σ>0为高斯核的带宽,它是一个超参数,我们实验中将其设置为3。由此就可以直接通过该核函数计算φ(ui)和φ(uj)之间的距离:
D(φ(ui),φ(uj))=||φ(ui)-φ(uj)||2=κ(ui,ui)+κ(uj,uj)-2κ(ui,uj) (3)
然后,构造一个相似矩阵其中元素sij∈Ss为公式(3)定义的φ(ui)和φ(uj)之间的距离的归一化表示,即
sij(φ(ui),φ(uj))=1/exp{D(φ(ui),φ(uj))} (4)
上述sij的值被标准化到(0,1]区间内。sij的值越大,表示用户ui和uj的网络嵌入表示越接近;
S22,计算网络嵌入Ut映射到高维空间之后节点之间的相似度矩阵St。该过程与步骤S21相同,最后得到相似度矩阵St。
基于图卷积的社交网络对齐方法,所述步骤S3的目的在于,利用已知锚节点来表示非锚节点,通过步骤S1得到的网络嵌入Us和Ut以及步骤S2得到的相似度矩阵Ss和St,得到两个社交网络升维之后的网络嵌入U′s和U′t利用已知的锚节点来学习一个网络映射函数Φ。该步骤S3具体包括以下分步骤:
S31,通过步骤S11得到的网络嵌入Us和步骤S21得到的相似度矩阵Ss,得到社交网络Gs利用锚节点表示非锚节点的网络嵌入U′s。定义:ui和vj分别是Gs和Gt中的用户,若已知在真实世界中它们指向同一个自然人,那么称ui和vj为锚节点。利用训练集中已知的锚节点构建一个中间矩阵其第i行记为ci,若ui为锚节点,则令ci=ui,否则ci=0。然后将矩阵Cs与步骤S21得到的相似矩阵Ss相结合来得到用锚节点表示非锚节点的节点网络嵌入表示:
U′s=Ss·Cs (5)
其中的第i行是一个向量通过这种方式,能使原本网络嵌入中的不可分离的节点变得可分离;
S32,通过步骤S12得到的网络嵌入Ut和步骤S22得到的相似度矩阵St,得到社交网络Gt用锚节点表示非锚节点的网络嵌入U′t。该过程与步骤S31相同,最后得到网络嵌入U′t。其中的第i行是一个向量v′i;
S33,得到两个图Gs和Gt用锚节点表示非锚节点的网络嵌入之后,利用已知的锚节点来学习一个网络映射函数Φ。该函数是用全连接神经网络实现的参数化函数,具体表达形式为Φ(u′i,K,b)=Ku′i+b,其中K和b是需要学习的参数。定义(ui,vj)(ui∈Vs,vj∈Vt)为一对锚节点,u′i是ui用锚节点表示非锚节点的嵌入向量,v′j是vj用锚节点表示非锚节点的嵌入向量,u′i通过函数Φ映射得到的网络嵌入为u″i,为了度量u″i和vj之间的相似性,可以计算它们之间的余弦值由余弦函数的性质,若u″i和v′j的余弦值越大,则u″i和v′j越相似。因此可以定义以下损失函数来训练函数Φ:
l(u′i,v′j)=arg min{1-cos<Φ(u′i,K,b),v′j>} (6)
通过最小化上面的损失函数,我们就得到了一个网络映射函数Φ。
基于图卷积的社交网络对齐方法,所述步骤S4的目的在于,利用步骤S3得到的网络映射函数Φ,将两个社交网络Gs和Gt中的节点进行对齐。
S4,在实现社交网络对齐的时候,设ui为Gs中的某一节点,u′i是ui用锚节点表示非锚节点的嵌入向量,u′i通过函数Φ映射之后的网络嵌入u″i,计算u″i和Gt中所有节点网络嵌入的余弦值,在所有余弦值当中找到最大的前k个,也即在Gt中中找到与节点ui最匹配的k个节点。如果在该k个节点中有该节点的对应节点,则认为该匹配是成功的。按照此方法可以对两个社交网络Gs和Gt中的节点进行对齐。
至此,我们就实现了一种基于图卷积的社交网络对齐方法。
与现有技术相比,本发明具有以下有益效果:
1、本发明基于图卷积的社交网络对齐方法,利用图卷积神经网络对社交网络中的用户进行网络嵌入,从而将网络中的用户节点用嵌入向量表示,不需要提取大量的用户隐私信息,利用图形就能够很好地表示社交网络用户之间的社交关系。
2、本发明基于图卷积的社交网络对齐方法,利用高斯核函数将嵌入空间映射到更高的维度,在高维空间中加入相似性度量(公式(4)),可以分离原始低维嵌入空间中不可分离的节点。用锚节点表示非锚节点,与相似度矩阵结合得到两个社交网络的网络嵌入,从而提高了网络对齐的准确率。
3、本发明基于图卷积的社交网络对齐方法,利用训练集中已知的锚节点信息来训练一个网络映射函数,对第一个社交网络中的任一个节点可以通过该函数在第二个社交网络中找到与该节点最匹配的节点,从而达到将两个社交网络中的节点对齐的目的。
附图说明
图1为利用图卷积神经网络将社交网络进行网络嵌入的过程。
图2为根据得到的社交网络嵌入,利用已知的锚节点对通过最小化公式(6)的损失函数来训练模型,得到网络映射生成器,最终实现社交网络对齐。
术语解释
GCN是Graph Convolutional Neural Networks的缩写,表示“图卷积神经网络”,即一种处理图形结构数据的神经网络框架。其实现方法参考文献【T.N.Kipf andM.Welling,“Semi-supervised classification with graph convolutional networks,”in ICLR,2017.】
NE是Network Embedding的缩写,表示“网络嵌入”,旨在学习网络中节点的低维度潜在表示,所学习到的特征表示可以用作基于图的各种任务。
NA是Network Alignment的缩写,表示“网络对齐”,旨在多个输入的社交网络之间找到对应的用户,这些在不同社交网络中的对应用户对应真实世界中的同一个自然人。
锚节点:ui和vj分别表示两个不同社交网络中的用户,若已知在真实世界中它们指向同一个自然人,那么称ui和vj为锚节点。
具体实施方式
以下结合附图对本发明作进一步描述。
实施例
如附图1所示,首先将两个社交网络图Gs和Gt输入步骤S1,得到两个社交网络的网络嵌入Us和Ut。然后将Us和Ut带入步骤S2,通过引入高斯核函数,将嵌入空间映射到更高的维度,得到高维空间中节点的相似度矩阵Ss和St。最后将Us和相似度矩阵Ss带入步骤S31,将Ut和相似度矩阵St带入步骤S32,利用锚节点表示非锚节点,得到网络嵌入U′s和U′t。
如附图2所示,将网络嵌入U′s和U′t带入步骤S32,通过给定的一个带标签的锚节点对(ui,vj)(ui∈Vs,vj∈Vt),训练公式(6)的损失函数,得到网络映射函数Φ(u′i,K,b)。再根据步骤S4,将Gs中的某一节点ui的网络嵌入u′i通过函数Φ得到网络嵌入u″i,依次计算u″i与Gt中所有节点网络嵌入的余弦值,找到与该节点最匹配的节点,最终实现将两个社交网络的用户对齐。
应用例
采用实施例提供的基于图卷积的社交网络对齐方法对两个不同的真实数据集(Foursquare-Twitter(F-T)数据集、Lastfm-MySpace(L-M)数据集,前者来源见参考文献【J.Zhang and P.S.Yu,“Pct:Partial co-alignment of social networks,”in WWW,2016.】,后者可以从http://aminer.org/cosnet获取)上分别产生的效果。对于每个数据集,我们都有一部分已知的锚节点对,在这些已知的锚节点对当中取三分之二作为训练集,其余作为测试集。首先分别利用两个训练集在四种基线方法(CRW、MAH/MAG、ONE/IONE、DeepLink)上训练得到网络对齐模型,然后利用这四种模型在测试集中找对齐用户,所得到的对齐效果见表1未加粗字体部分。再使用实施例提供的基于图卷积的社交网络对齐方法(dNAME)分别利用两个训练集进行网络对齐训练,得到实现网络对齐的模型,然后使用模型在测试集中找对齐用户,所得到的对齐效果见表1加粗字体部分。我们分别对步骤S4中k的值取5,10,15,20,25和30这几种情况做了实验。表格中的数据表示对齐的准确率,例如,对1000个节点进行对齐,在得到的结果当中如果有600个节点对齐成功,那么准确率就是0.60。
表1:在两种数据集上进行社交网络对齐的效果
对表格中其余方法的介绍如下:
CRW:全称是Collective Random Walk,它预测了目标网络中用户之间社交链接的构造,以及目标网络与其它社交网络的锚链接对齐。其实现过程可参考文献【J.Zhang andP.S.Yu,“Integrated anchor and social link predictions across socialnetworks,”in IJCAI,2015.】
MAH/MAG:全称分别是Manifold Alignment on Hypergraph和ManifoldAlignment on traditional Graphs。前者是一种网络嵌入方法,它将节点表示为一个共同的低维空间,并通过比较网络中两个向量之间的距离来推导出相关关系。后者通过计算用户对用户的权重为每个网络构建一个社会图。其实现过程参考文献【S.Tan,Z.Guan,D.Cai,X.Qin,J.Bu,and C.Chen,“Mapping users across networks by manifold alignment onhypergraph,”in AAAI,2014.】
ONE/IONE:IONE的全称是:Input-Output Network Embedding,是一种网络嵌入和局部网络对齐方法。ONE是IONE的简化版本,即对齐时只考虑节点向量和用户的输出向量的表示。其实现过程参考文献【L.Liu,W.K.Cheung,X.Li,and L.Liao,“Aligning usersacross social networks using network embedding,”in IJCAI,2016.】
DeepLink:这是一种端到端网络对齐方法,它对网络进行采样,将节点编码为向量表示,以捕获局部和全局网络结构。其实现过程参考文献【F.Zhou,L.Liu,K.Zhang,G.Trajcevski,J.Wu,and T.Zhong,“Deeplink:A deep learning approach for useridentity linkage,”in INFOCOM,2018.】
从表1的实验结果可以看出,我们提出的基于图卷积的社交网络对齐方法,其对齐的精度全面高于现有的一些方法。
由此可知,本发明利用图卷积方法来进行网络嵌入,利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点,再利用锚节点来训练两个社交网络间节点的映射函数,实现了优于现有方法的社交网络对齐。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (8)
1.一种基于图卷积的社交网络对齐方法,其特征在于包括以下步骤:
S1,利用图卷积神经网络来对社交网络中的用户关系进行网络嵌入,得到能代表用户社交关系的网络嵌入,即为每一个用户节点生成包含用户社交关系信息的一个嵌入向量;
S2,利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点,计算升维后节点嵌入向量间的距离,并对嵌入向量的距离进行归一化处理得到高维空间中节点的相似度矩阵;
S3,利用高维空间中节点的相似度矩阵,得到两个社交网络用已知锚节点表示非锚节点的网络嵌入,再利用已知的锚节点信息来学习一个网络映射函数;
S4,得到网络映射函数之后,利用该函数将两个社交网络中的节点进行对齐。
2.根据权利要求1所述基于图卷积的社交网络对齐方法,其特征在于所述步骤S1包括以下分步骤:
S11,利用图卷积神经网络将社交网络Gs进行网络嵌入;定义社交网络图为Gs=(Vs,Es),Vs={ui|i∈[1,2,...,N]}是图Gs所有顶点的集合,每个顶点代表一个用户,N为图中的顶点数,也就是用户的数量,小写字母u代表用户;Es={eij|i,j∈[1,2,...,N]}是图Gs边的集合,图Gs中的每条边eij∈Es表示用户ui和用户uj存在社交关系;
做如下定义:定义图的邻接矩阵为一个表示节点之间关系的矩阵,记为其中表示N×N维的向量空间,矩阵元素定义为:若eij∈Es,则Wij=1,若则Wij=0;为对角矩阵,称为图Gs的对角度矩阵,对角线元素为Dii=∑jWij;定义矩阵由此定义一个对角矩阵其对角线元素为令定义两层神经网络如下:
其中σ(·)是ReLU激活函数(ReLU(*)=max(0,*)),是第一层学习的参数矩阵,是第二层学习的参数矩阵,其中F0是第一层输出的维数,F1是第二层输出的维数;
令定义交叉熵损失函数如下:
其中通过不断的训练将L的值降到最小,我们就得到了社交网络Gs的一个基于GCN的图表示模型Us;Us的第i行ui是社交网络Gs中第i个用户的网络嵌入表示,其维度为F1;
S12,利用图卷积神经网络将社交网络Gt=(Vt,Et)进行网络嵌入;该过程与步骤S11相同,最后得到社交网络Gt的网络嵌入Ut;Ut的第i行vi是社交网络Gt中第i个用户的网络嵌入表示,其维度为F1。
3.根据权利要求1所述基于图卷积的社交网络对齐方法,其特征在于所述步骤S2包括以下分步骤:
S21,计算网络嵌入Us映射到高维空间之后节点之间的相似度矩阵Ss;定义由步骤S1得到的社交网络嵌入u构成的空间为通过一个函数φ将u投影到更高维特征空间中,即
性质优良的升维函数φ往往比较复杂不易求取;求解相似度矩阵并不需要知道函数φ的具体形式,而只需能计算φ(ui)和φ(uj)的点积,并由此计算出φ(ui)和φ(uj)的距离并进行归一化处理即可得到相似度矩阵;用非线性函数κ来表示向量φ(ui)和φ(uj)之间的点积:κ(ui,uj)=〈φ(ui),φ(uj)>;采用机器学习中常用的高斯核函数进行升维,即定义其中σ>0为高斯核的带宽,它是一个超参数,我们实验中将其设置为3;由此就可以直接通过该核函数计算φ(ui)和φ(uj)之间的距离:
D(φ(ui),φ(uj))=||φ(ui)-φ(uj)||2=κ(ui,ui)+κ(uj,uj)-2κ(ui,uj) (3)
然后,构造一个相似矩阵其中元素sij∈Ss为公式(3)定义的φ(ui)和φ(uj)之间的距离的归一化表示,即
sij(φ(ui),φ(uj))=1/exp{D(φ(ui),φ(uj))} (4)
上述sij的值被标准化到(0,1]区间内;sij的值越大,表示用户ui和uj的网络嵌入表示越接近;
S22,计算网络嵌入Ut映射到高维空间之后节点之间的相似度矩阵St;该过程与步骤S21相同,最后得到相似度矩阵St。
4.根据权利要求1所述基于图卷积的社交网络对齐方法,其特征在于所述步骤S3包括以下分步骤:
S31,通过步骤S11得到的网络嵌入Us和步骤S21得到的相似度矩阵Ss,得到社交网络Gs利用锚节点表示非锚节点的网络嵌入U′s;定义:ui和vj分别是Gs和Gt中的用户,若已知在真实世界中它们指向同一个自然人,那么称ui和vj为锚节点;利用训练集中已知的锚节点构建一个中间矩阵其第i行记为ci,若ui为锚节点,则令ci=ui,否则ci=0;然后将矩阵Cs与步骤S21得到的相似矩阵Ss相结合来得到用锚节点表示非锚节点的节点网络嵌入表示:
U′s=Ss·Cs (5)
其中的第i行是一个向量通过这种方式,能使原本网络嵌入中的不可分离的节点变得可分离;
S32,通过步骤S12得到的网络嵌入Ut和步骤S22得到的相似度矩阵St,得到社交网络Gt用锚节点表示非锚节点的网络嵌入U′t;该过程与步骤S31相同,最后得到网络嵌入U′t;其中的第i行是一个向量v′i;
S33,得到两个图Gs和Gt用锚节点表示非锚节点的网络嵌入之后,利用已知的锚节点来学习一个网络映射函数Φ;该函数是用全连接神经网络实现的参数化函数,具体表达形式为Φ(u′i,K,b)=Ku′i+b,其中K和b是需要学习的参数;定义(ui,vj)(ui∈Vs,vj∈Vt)为一对锚节点,u′i是ui用锚节点表示非锚节点的嵌入向量,v′j是vj用锚节点表示非锚节点的嵌入向量,u′i通过函数Φ映射得到的网络嵌入为u″i,为了度量u″i和v′j之间的相似性,可以计算它们之间的余弦值由余弦函数的性质,若u″i和v′j的余弦值越大,则u″i和v′j越相似;因此可以定义以下损失函数来训练函数Φ:
l(u′i,v′j)=argmin{1-cos〈Φ(u′i,K,b),v′j>} (6)
通过最小化上面的损失函数,我们就得到了一个网络映射函数Φ。
5.根据权利要求2所述基于图卷积的社交网络对齐方法,其特征在于利用图卷积神经网络对社交网络中的节点进行网络嵌入,为每一个用户节点生成包含用户社交关系信息的一个嵌入向量;训练的损失函数为:
6.根据权利要求3所述基于图卷积的社交网络对齐方法,其特征在于利用高斯核函数将嵌入空间映射到更高的维度,从而分离原始低维嵌入空间中不可分离的节点。
7.根据权利要求4所述基于图卷积的社交网络对齐方法,其特征在于利用已知锚节点学习得到网络映射函数,该函数可以用来进行社交网络对齐;训练网络映射函数的损失函数为:l(u′i,v′j)=argmin{1-cos〈Φ(u′i,K,b),v′j>}。
8.根据权利要求1所述生成对抗网络的轨迹数据分类方法,其特征在于所述步骤S4的具体实现方式为:设ui为Gs中的某一节点,u′i是ui用锚节点表示非锚节点的嵌入向量,u′i通过函数Φ映射之后的网络嵌入u″i,计算u″i和Gt中所有节点网络嵌入的余弦值,在所有余弦值当中找到最大的前k个,也即在Gt中中找到与节点ui最匹配的k个节点;如果在该k个节点中有该节点的对应节点,则认为该匹配是成功的;按照此方法可以对两个社交网络Gs和Gt中的节点进行对齐。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910044138.4A CN109636658B (zh) | 2019-01-17 | 2019-01-17 | 一种基于图卷积的社交网络对齐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910044138.4A CN109636658B (zh) | 2019-01-17 | 2019-01-17 | 一种基于图卷积的社交网络对齐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109636658A true CN109636658A (zh) | 2019-04-16 |
CN109636658B CN109636658B (zh) | 2022-05-06 |
Family
ID=66061165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910044138.4A Active CN109636658B (zh) | 2019-01-17 | 2019-01-17 | 一种基于图卷积的社交网络对齐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109636658B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069726A (zh) * | 2019-04-26 | 2019-07-30 | 福州大学 | 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法 |
CN110288026A (zh) * | 2019-06-27 | 2019-09-27 | 山东浪潮人工智能研究院有限公司 | 一种基于度量关系图学习的图像分割方法及装置 |
CN110347932A (zh) * | 2019-06-04 | 2019-10-18 | 中国科学院信息工程研究所 | 一种基于深度学习的跨网络用户对齐方法 |
CN110442802A (zh) * | 2019-08-06 | 2019-11-12 | 中国科学技术大学 | 一种社交用户的多行为偏好预测方法 |
CN110515986A (zh) * | 2019-08-27 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 一种社交网络图的处理方法、装置及存储介质 |
CN110516146A (zh) * | 2019-07-15 | 2019-11-29 | 中国科学院计算机网络信息中心 | 一种基于异质图卷积神经网络嵌入的作者名字消歧方法 |
CN111192154A (zh) * | 2019-12-25 | 2020-05-22 | 西安交通大学 | 一种基于风格迁移的社交网络用户节点匹配方法 |
CN111210002A (zh) * | 2019-12-30 | 2020-05-29 | 北京航空航天大学 | 一种基于生成对抗网络模型的多层学术网络社区发现方法、系统 |
CN111368074A (zh) * | 2020-02-24 | 2020-07-03 | 西安电子科技大学 | 一种基于网络结构和文本信息的链路预测方法 |
CN111460275A (zh) * | 2020-01-15 | 2020-07-28 | 华中科技大学 | 一种面向社交网络的动态网络表示学习方法及系统 |
CN111476673A (zh) * | 2020-04-02 | 2020-07-31 | 中国人民解放军国防科技大学 | 基于神经网络的社交网络间用户对齐的方法、装置、介质 |
CN111506691A (zh) * | 2020-04-20 | 2020-08-07 | 杭州数澜科技有限公司 | 一种基于深度匹配模型的轨迹匹配方法和系统 |
CN111931903A (zh) * | 2020-07-09 | 2020-11-13 | 北京邮电大学 | 一种基于双层图注意力神经网络的网络对齐方法 |
CN112163170A (zh) * | 2020-10-12 | 2021-01-01 | 重庆邮电大学 | 一种基于虚节点和元学习改进社交网络对齐方法及系统 |
CN112487305A (zh) * | 2020-12-01 | 2021-03-12 | 重庆邮电大学 | 一种基于gcn的动态社交用户对齐方法 |
CN112667864A (zh) * | 2021-03-17 | 2021-04-16 | 腾讯科技(深圳)有限公司 | 图对齐方法、装置、电子设备及存储介质 |
CN113255895A (zh) * | 2021-06-07 | 2021-08-13 | 之江实验室 | 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法 |
CN114817757A (zh) * | 2022-04-02 | 2022-07-29 | 广州大学 | 基于图卷积网络的跨社交网络虚拟身份关联方法 |
CN116680633A (zh) * | 2023-05-06 | 2023-09-01 | 国网四川省电力公司广安供电公司 | 基于多任务学习的异常用户检测方法、系统及存储介质 |
CN111506691B (zh) * | 2020-04-20 | 2024-05-31 | 杭州数澜科技有限公司 | 一种基于深度匹配模型的轨迹匹配方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140065691A (ko) * | 2012-11-20 | 2014-05-30 | 권세영 | Sns 제공 시스템 및 그 제공 방법 |
CN104102630A (zh) * | 2014-07-16 | 2014-10-15 | 复旦大学 | 一种针对中文社交网络中中英文混合文本的规范方法 |
CN107239827A (zh) * | 2017-06-18 | 2017-10-10 | 北京理工大学 | 一种基于人工神经网络的空间信息学习方法 |
CN108596774A (zh) * | 2018-04-24 | 2018-09-28 | 山东师范大学 | 基于深层次网络嵌入特征的社会化信息推荐算法及系统 |
CN109145224A (zh) * | 2018-08-20 | 2019-01-04 | 电子科技大学 | 社交网络事件时序关系分析方法 |
-
2019
- 2019-01-17 CN CN201910044138.4A patent/CN109636658B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20140065691A (ko) * | 2012-11-20 | 2014-05-30 | 권세영 | Sns 제공 시스템 및 그 제공 방법 |
CN104102630A (zh) * | 2014-07-16 | 2014-10-15 | 复旦大学 | 一种针对中文社交网络中中英文混合文本的规范方法 |
CN107239827A (zh) * | 2017-06-18 | 2017-10-10 | 北京理工大学 | 一种基于人工神经网络的空间信息学习方法 |
CN108596774A (zh) * | 2018-04-24 | 2018-09-28 | 山东师范大学 | 基于深层次网络嵌入特征的社会化信息推荐算法及系统 |
CN109145224A (zh) * | 2018-08-20 | 2019-01-04 | 电子科技大学 | 社交网络事件时序关系分析方法 |
Non-Patent Citations (3)
Title |
---|
JIAWEI ZHANG 等: "Multiple Anonymized Social Networks Alignment", 《2015 IEEE INTERNATIONAL CONFERENCE ON DATA MINING (ICDM)》 * |
温子敬: "基于图神经网络的网络对齐及其可解释性研究", 《中国优秀博硕士学位论文全文数据库(硕士) 基础科学辑》 * |
肖云鹏 等: "一种基于云模型的社交网络推荐系统评分预测方法", 《电子学报》 * |
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069726B (zh) * | 2019-04-26 | 2021-06-29 | 福州大学 | 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法 |
CN110069726A (zh) * | 2019-04-26 | 2019-07-30 | 福州大学 | 一种适用于DBLP与arXiv的文献网络间锚链接关系预测方法 |
CN110347932A (zh) * | 2019-06-04 | 2019-10-18 | 中国科学院信息工程研究所 | 一种基于深度学习的跨网络用户对齐方法 |
CN110347932B (zh) * | 2019-06-04 | 2021-11-23 | 中国科学院信息工程研究所 | 一种基于深度学习的跨网络用户对齐方法 |
CN110288026A (zh) * | 2019-06-27 | 2019-09-27 | 山东浪潮人工智能研究院有限公司 | 一种基于度量关系图学习的图像分割方法及装置 |
CN110516146B (zh) * | 2019-07-15 | 2022-08-19 | 中国科学院计算机网络信息中心 | 一种基于异质图卷积神经网络嵌入的作者名字消歧方法 |
CN110516146A (zh) * | 2019-07-15 | 2019-11-29 | 中国科学院计算机网络信息中心 | 一种基于异质图卷积神经网络嵌入的作者名字消歧方法 |
CN110442802B (zh) * | 2019-08-06 | 2022-10-28 | 中国科学技术大学 | 一种社交用户的多行为偏好预测方法 |
CN110442802A (zh) * | 2019-08-06 | 2019-11-12 | 中国科学技术大学 | 一种社交用户的多行为偏好预测方法 |
CN110515986B (zh) * | 2019-08-27 | 2023-01-06 | 腾讯科技(深圳)有限公司 | 一种社交网络图的处理方法、装置及存储介质 |
CN110515986A (zh) * | 2019-08-27 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 一种社交网络图的处理方法、装置及存储介质 |
CN111192154B (zh) * | 2019-12-25 | 2023-05-02 | 西安交通大学 | 一种基于风格迁移的社交网络用户节点匹配方法 |
CN111192154A (zh) * | 2019-12-25 | 2020-05-22 | 西安交通大学 | 一种基于风格迁移的社交网络用户节点匹配方法 |
CN111210002A (zh) * | 2019-12-30 | 2020-05-29 | 北京航空航天大学 | 一种基于生成对抗网络模型的多层学术网络社区发现方法、系统 |
CN111210002B (zh) * | 2019-12-30 | 2022-01-28 | 北京航空航天大学 | 一种基于生成对抗网络模型的多层学术网络社区发现方法、系统 |
CN111460275B (zh) * | 2020-01-15 | 2023-04-18 | 华中科技大学 | 一种面向社交网络的动态网络表示学习方法及系统 |
CN111460275A (zh) * | 2020-01-15 | 2020-07-28 | 华中科技大学 | 一种面向社交网络的动态网络表示学习方法及系统 |
CN111368074A (zh) * | 2020-02-24 | 2020-07-03 | 西安电子科技大学 | 一种基于网络结构和文本信息的链路预测方法 |
CN111368074B (zh) * | 2020-02-24 | 2022-06-10 | 西安电子科技大学 | 一种基于网络结构和文本信息的链路预测方法 |
CN111476673A (zh) * | 2020-04-02 | 2020-07-31 | 中国人民解放军国防科技大学 | 基于神经网络的社交网络间用户对齐的方法、装置、介质 |
CN111506691B (zh) * | 2020-04-20 | 2024-05-31 | 杭州数澜科技有限公司 | 一种基于深度匹配模型的轨迹匹配方法和系统 |
CN111506691A (zh) * | 2020-04-20 | 2020-08-07 | 杭州数澜科技有限公司 | 一种基于深度匹配模型的轨迹匹配方法和系统 |
CN111931903B (zh) * | 2020-07-09 | 2023-07-07 | 北京邮电大学 | 一种基于双层图注意力神经网络的网络对齐方法 |
CN111931903A (zh) * | 2020-07-09 | 2020-11-13 | 北京邮电大学 | 一种基于双层图注意力神经网络的网络对齐方法 |
CN112163170A (zh) * | 2020-10-12 | 2021-01-01 | 重庆邮电大学 | 一种基于虚节点和元学习改进社交网络对齐方法及系统 |
CN112487305A (zh) * | 2020-12-01 | 2021-03-12 | 重庆邮电大学 | 一种基于gcn的动态社交用户对齐方法 |
CN112487305B (zh) * | 2020-12-01 | 2022-06-03 | 重庆邮电大学 | 一种基于gcn的动态社交用户对齐方法 |
CN112667864A (zh) * | 2021-03-17 | 2021-04-16 | 腾讯科技(深圳)有限公司 | 图对齐方法、装置、电子设备及存储介质 |
CN113255895B (zh) * | 2021-06-07 | 2023-06-16 | 之江实验室 | 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法 |
CN113255895A (zh) * | 2021-06-07 | 2021-08-13 | 之江实验室 | 基于图神经网络表示学习的结构图对齐方法和多图联合数据挖掘方法 |
CN114817757A (zh) * | 2022-04-02 | 2022-07-29 | 广州大学 | 基于图卷积网络的跨社交网络虚拟身份关联方法 |
CN116680633A (zh) * | 2023-05-06 | 2023-09-01 | 国网四川省电力公司广安供电公司 | 基于多任务学习的异常用户检测方法、系统及存储介质 |
CN116680633B (zh) * | 2023-05-06 | 2024-01-26 | 国网四川省电力公司广安供电公司 | 基于多任务学习的异常用户检测方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109636658B (zh) | 2022-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109636658A (zh) | 一种基于图卷积的社交网络对齐方法 | |
Zhang et al. | The secret revealer: Generative model-inversion attacks against deep neural networks | |
Wang et al. | Generative partial multi-view clustering with adaptive fusion and cycle consistency | |
Zhou et al. | Multiple kernel clustering with neighbor-kernel subspace segmentation | |
Liu et al. | Hard negative generation for identity-disentangled facial expression recognition | |
Zhao et al. | EmotionGAN: Unsupervised domain adaptation for learning discrete probability distributions of image emotions | |
Khan et al. | CNN with depthwise separable convolutions and combined kernels for rating prediction | |
US11398062B2 (en) | Face synthesis | |
Zhuang et al. | Label information guided graph construction for semi-supervised learning | |
CN105874474B (zh) | 用于面部表示的系统和方法 | |
Zhang et al. | A high-order possibilistic $ C $-means algorithm for clustering incomplete multimedia data | |
CN112395979B (zh) | 基于图像的健康状态识别方法、装置、设备及存储介质 | |
Lin et al. | Cross-domain recognition by identifying joint subspaces of source domain and target domain | |
Khosravy et al. | Model inversion attack: analysis under gray-box scenario on deep learning based face recognition system | |
He et al. | Locality-aware channel-wise dropout for occluded face recognition | |
Xiong et al. | Person re-identification with multiple similarity probabilities using deep metric learning for efficient smart security applications | |
Xie et al. | Surrogate network-based sparseness hyper-parameter optimization for deep expression recognition | |
Zeng et al. | Occlusion‐invariant face recognition using simultaneous segmentation | |
Wang et al. | Disentangling the modes of variation in unlabelled data | |
Xinhan | Intelligent analysis of classroom student state based on neural network algorithm and emotional feature recognition | |
Dai et al. | A sparse attack method on skeleton-based human action recognition for intelligent metaverse application | |
Han et al. | Gan based three-stage-training algorithm for multi-view facial expression recognition | |
CN114707589A (zh) | 对抗样本的生成方法、装置、存储介质、设备及程序产品 | |
CN114117048A (zh) | 一种文本分类的方法、装置、计算机设备及存储介质 | |
Hu et al. | Teacher-student architecture for knowledge distillation: A survey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |