CN112163170B - 一种基于虚节点和元学习改进社交网络对齐方法及系统 - Google Patents

一种基于虚节点和元学习改进社交网络对齐方法及系统 Download PDF

Info

Publication number
CN112163170B
CN112163170B CN202011082763.7A CN202011082763A CN112163170B CN 112163170 B CN112163170 B CN 112163170B CN 202011082763 A CN202011082763 A CN 202011082763A CN 112163170 B CN112163170 B CN 112163170B
Authority
CN
China
Prior art keywords
node
nodes
virtual
social network
anchor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011082763.7A
Other languages
English (en)
Other versions
CN112163170A (zh
Inventor
刘立
颜子涵
杜勇
何佳薇
李苑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dragon Totem Technology Hefei Co ltd
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202011082763.7A priority Critical patent/CN112163170B/zh
Publication of CN112163170A publication Critical patent/CN112163170A/zh
Application granted granted Critical
Publication of CN112163170B publication Critical patent/CN112163170B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于社交网络分析领域,具体涉及一种基于虚节点和元学习改进社交网络对齐的方法,包括跨社交网络分别添加成对虚节点,加入虚节点后的社交网络在图表示算法中进行新的训练,利用虚节点使得社交网络的向量表示空间变得更加稀疏;利用元学习通过不同的社交网络数据得到对齐所需的先验知识,半监督环境下聚合锚节点周围邻居的信息来更新虚节点的向量,在跨网络环境下利用先验知识去更新测试数据中虚节点的更新方向,虚节点找到在对齐工作中的最佳位置;本发明可以改进利用图表示算法进行的社交网络对齐工作,从表示向量的本质出发,有效的改变了节点表示的训练方式,提升这些算法的准确率。

Description

一种基于虚节点和元学习改进社交网络对齐方法及系统
技术领域
本发明属于社交网络分析领域,具体涉及一种基于虚节点和元学习改进社交网络对齐方法及系统。
背景技术
随着互联网的快速发展,社交网络成为了人们生活和交友的重要组成部分。为了满足自己的需求,人们往往在多个社交网络平台上注册身份,而社交网络对齐是指在不同的社交网络平台中识别出同一用户。这一工作已经在工业界和学术界引起了广泛的关注,因为它在许多应用中存在重大影响,比如用户的行为预测,朋友推荐,身份验证和隐私保护
现有的这些工作大多需要依赖大量的标注信息来确保性能,通常是在跨社交网络平台中使用了大量的成对锚节点,使得非锚节点用户的邻域存在着多个锚节点信息,通过这种对多个锚节点的依赖关系达到了良好的对齐效果。然而在现实中,经常会出现锚节点较少的情况,非锚节点的邻域存在锚节点的概率很低,由于缺少这种依赖关系,对齐工作会变得非常困难。举例来说,gs和gt中是缺少训练锚节点的局部网络,其中X和Y是一对锚用户,而用户X处于没有与锚节点直接相连的稀疏结构中,希望通过已知的gs网络结构,映射得到在gt中用户X的位置信息;但由于缺少锚用户,gs的用户Y很容易对齐到gt中与用户Y结构相似的其他部分中去。与此同时,由于现实中节点和对应边的结构往往是复杂且密集,很难在低维空间中区分一阶邻居和二阶邻居的关系,比如M节点是Y的二阶邻居,I是它的一阶邻居,但是在M与X共享较多一阶邻居或网络结构更复杂的情况下,在低维空间中Y很有可能离M位置更近。在做对齐任务的时候,由于不能有效的排除这种网络嵌入带来的干扰,这种干扰在学习映射函数之后可能会进一步扩大,导致在其他区间中产生错误对齐,将这种容易导致错误对齐的区间称为模糊区间。
发明内容
为了解决上述问题,本发明提出一种基于虚节点和元学习改进社交网络对齐方法,如图1,具体包括以下步骤:
从多个不同的社交网络平台中获取同一用户,称为锚用户,并将与其存在社交关系的用户作为邻居用户,并将每个用户视为一个节点,定义社交网络中用户关注和被关注的概率模型;
对每个社交网络中的锚节点增加两条边,分别与两个虚节点彼此相连,虚节点也彼此相连,同时,虚节点也带有锚节点标签信息,也为锚用户;
利用加入虚节点之后的网络在图表示算法中进行向量表示计算,获取到稀疏的网络结构;
定义微调虚节点的表达式,通过聚合虚节点对应的锚节点周围节点的信息,再乘上权重矩阵,更新虚节点向量的位置;
在每一轮迭代中,对其他训练社交网络数据集中同样加入虚节点,并使用元学习对其他训练社交网络数据集中当前迭代下更新权重矩阵,并将更新后的权重矩阵,放入测试集中,保存此次计算中的损失;
进行K次迭代后,进行梯度下降处理,利用在训练集中获得的先验知识,得到的权重矩阵再做一次更新,得到当前迭代下测试集的最佳权重矩阵,并对虚节点向量进行更新;
更新后的虚节点向量加入对齐计算中,虚节点的向量能够使向整个社交网络在低维空间种的结构变得更稀疏,根据更新后的初始网络表示模型对待更新的局部网络中的所有用户进行用户对齐。
进一步的,用户关系概率模型的构建公式如下:
Figure GDA0003779650030000021
Figure GDA0003779650030000031
其中,p1(vj|vi)表示用户vi关注用户vj的概率;p2(vi|vj)表示用户vj被用户vi关注的概率;
Figure GDA0003779650030000032
表示用户vi本身的向量,
Figure GDA0003779650030000033
表示该用户vi作为输入上下文时的向量,
Figure GDA0003779650030000034
表示该用户vi作为输出上下文时的向量,V表示社交网络平台用户集合,i,j,k∈|V|,|V|表示节点的集合。
进一步的,每个锚节点添加了两个带有训练锚节点信息的虚节点,虚节点会对锚节点和锚节点周围的邻居向量表示产生变化,其中加虚节点前表示为:
Figure GDA0003779650030000035
加虚节点后表示为:
Figure GDA0003779650030000036
其中,Φ(a)表示锚节点a在低维空间中的向量表示,Φ(b))表示锚节点a的二阶邻居b在低维空间中的向量表示,Φ(c)表示锚节点a的一阶邻居c在低维空间中的向量表示,
Figure GDA0003779650030000037
代表节点和节点之间应该是一阶邻居关系,
Figure GDA0003779650030000038
代表节点和节点之间应该是二阶邻居关系,p1和p2代表锚节点连接的两个虚节点。
进一步的,若虚节点为
Figure GDA0003779650030000039
则更新虚节点向量的位置的过程表示为:
Figure GDA00037796500300000310
其中,FPi(vi,W)为虚节点的微调向量。
进一步的,若更新虚节点的权重矩阵为W={w0,w1,...,wn},虚节点的微调向量FPi(vi,W)表示为:
Figure GDA00037796500300000311
其中,ui是锚节点,uj是锚节点ui对应的邻居,vi为当前采样的中心节点,nei(v)表示节点v的一阶邻居节点集合,N表示节点v的一阶邻居总数,W为权重矩阵,g(.)为激活函数。
进一步的,权重矩阵W表示为:
Figure GDA0003779650030000041
其中,Us指代的是训练集中不同的子任务S={S1,S2,...,SK},η1为学习率,▽f为梯度,f(Us)为区分开锚节点和周围节点的损失函数。
进一步的,区分开锚节点和周围节点的损失函数f(Us)表示为:
Figure GDA0003779650030000042
其中,当跨社交网络中是同一个锚节点的时候,label为1,否则label为-1;
Figure GDA0003779650030000043
为虚节点向量,每个锚节点与两个锚节点相连,所以n为1或2;m为采样的节点个数,Pi为虚节点向量的集合,uj'为负采样过程中随机采样节点对应的向量。
进一步的,测试集的总损失表示为:
Figure GDA0003779650030000044
其中,Lquery为测试集的总损失,f(Us)n表示每次计算过程中的f(Us)保存下来进行求和得到的值。
进一步的,根据得到测试集的总损失Lquery,进行梯度下降,利用对训练集进行梯度下降,并根据梯度下降得到的先验知识对权重矩阵再做一次更新,具体过程表示为:
Figure GDA0003779650030000045
其中,η2是元学习更新所需要的学习率。
本发明还提出一种基于虚节点和元学习改进社交网络对齐系统,所述系统包括:
平台接口API,用于获取社交网络平台中的每个用户的社交关系;
模型建模模块,用于构造出社交网络平台的图网络,将社交网络用户作为图节点,将存在社交关系的两邻居用户作为图边;
添加虚节点模块,用于对每个社交网络中的锚节点,添加新的虚节点,每个锚节点与两个虚节点相连;
元学习训练集获取先验知识模块,用于通过训练集的先验知识训练,然后更新锚节点对应的虚节点向量,然后进行K次更新权重矩阵;
元学习测试集更新当前虚节点向量,用于上一步得到训练集的先验知识,作为测试集的初始值进行计算,更新虚节点向量。;
用户对齐模块,用于获取不同社交网络平台中的用户相似程度,对待对齐的局部网络中的所有用户进行用户对齐。
本发明通过跨社交网络分别添加成对虚节点,利用虚节点使得社交网络的向量表示空间变得更加稀疏,利用元学习通过不同的社交网络数据得到对齐所需的先验知识,在半监督环境下聚合锚节点周围邻居的信息来更新虚节点的向量,在跨网络环境下利用先验知识去更新测试数据中虚节点的更新方向,最后利用虚节点找到在对齐工作中的最佳位置;本发明可以改进利用图表示算法进行的社交网络对齐工作,从表示向量的本质出发,有效的改变了节点表示的训练方式,提升这些算法的准确率。
附图说明
图1是本发明的基于虚节点和元学习改进社交网络对齐方法流程图;
图2为本发明的基于虚节点和元学习改进社交网络对齐系统结构图;
图3为本发明的计算机设备的架构图;
图4为本发明所述新增虚节点和元学习过程对社交网对齐的影响图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种基于虚节点和元学习改进社交网络对齐方法,如图1,具体包括以下步骤:
从多个不同的社交网络平台中获取同一用户,称为锚用户,并将与其存在社交关系的用户作为邻居用户,并将每个用户视为一个节点,定义社交网络中用户关注和被关注的概率模型;
对每个社交网络中的锚节点增加两条边,分别与两个虚节点彼此相连,虚节点也彼此相连,同时,虚节点也带有锚节点标签信息,也为锚用户;
利用加入虚节点之后的网络在图表示算法中进行向量表示计算,获取到稀疏的网络结构;
定义微调虚节点的表达式,通过聚合虚节点对应的锚节点周围节点的信息,再乘上权重矩阵,更新虚节点向量的位置;
在每一轮迭代中,对其他训练社交网络数据集中同样加入虚节点,并使用元学习对其他训练社交网络数据集中当前迭代下更新权重矩阵,并将更新后的权重矩阵,放入测试集中,保存此次计算中的损失;
进行K次迭代后,进行梯度下降处理,利用在训练集中获得的先验知识,得到的权重矩阵再做一次更新,得到当前迭代下测试集的最佳权重矩阵,并对虚节点向量进行更新;
更新后的虚节点向量加入对齐计算中,虚节点的向量能够使向整个社交网络在低维空间种的结构变得更稀疏,根据更新后的初始网络表示模型对待更新的局部网络中的所有用户进行用户对齐。
如图2所示,本实施例给出了一种基于虚节点和元学习改进社交网络对齐系统,所述系统包括:
平台接口API,用于获取社交网络平台中的每个用户的社交关系;
模型建模模块,用于构造出社交网络平台的图网络,将社交网络用户作为图节点,将存在社交关系的两邻居用户作为图边;
添加虚节点模块,用于对每个社交网络中的锚节点,添加新的虚节点,每个锚节点与两个虚节点相连;
元学习训练集获取先验知识模块,用于通过训练集的先验知识训练,然后更新锚节点对应的虚节点向量,然后进行K次更新权重矩阵;
元学习测试集更新当前虚节点向量,用于上一步得到训练集的先验知识,作为测试集的初始值进行计算,更新虚节点向量;
用户对齐模块,用于获取不同社交网络平台中的用户相似程度,对待对齐的局部网络中的所有用户进行用户对齐。
基于上述,本发明还可以提供一种计算机设备,如图3所示,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行上述基于虚节点和元学习改进社交网络对齐的方法中各步骤的指令。
该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器及网络接口。其中,计算机设备的非易失性存储介质存储有操作系统及计算机可执行指令,该计算机可执行指令用于实现本发明实施例中提供的基于虚节点和元学习社交网络对齐方法。该处理器用于提供计算和控制能力,支撑整个计算机设备的运行。计算机设备中的内存储器为非易失性存储介质中的操作系统及计算机可执行指令的运行提供环境,网络接口用于与其它的计算机设备进行网络通信。该计算机设备可以是手机、平板电脑、PC(personalcomputer)等终端,也可以是服务器等。本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体地计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
下面将结合具体的实施例来对本发明进行进一步说明,如图4所示,gs和gt中是缺少训练锚节点的局部网络。其中X和Y是一对锚用户,而用户X处于没有与锚节点直接相连的稀疏结构中,本实施例通过已知的gs网络结构,映射得到在gt中用户X的位置信息,但由于缺少锚用户,gs的用户Y很容易对齐到gt中与用户Y结构相似的其他部分中去。与此同时,由于现实中节点和对应边的结构往往是复杂且密集,很难在低维空间中区分一阶邻居和二阶邻居的关系,比如一个节点M是Y的二阶邻居,一个节点I是Y的一阶邻居,但是在M与X共享较多一阶邻居或网络结构更复杂的情况下,在低维空间中Y很有可能离M位置更近。在做对齐任务的时候,由于我能有效的排除这种网络嵌入带来的干扰,这种干扰在学习映射函数之后可能会进一步扩大,导致在其他区间中产生错误对齐,现有技术将这种容易导致错误对齐的区间称为模糊区间。
在对齐任务驱动的多网络节点表示模型中,如何充分考虑跨网络表示模型中不同的节点类型,从向量本质出发至关重要。针对以上挑战,本发明提出一提出一种减少模糊区间内的节点数量的方法,使得对齐更加准确。区别于传统算法,本实施例倾向于从向量的本质上解决问题。因此,本实施例采取了一种增加虚节点的方法,虚节点是原社交网络上不存在,而现在我们加入的虚拟节点,旨在弱监督的环境下,为跨用户对齐提供更有利的学习体系结构,每个锚节点与两个虚节点彼此相互关注,对应的两个虚节点之间也相互关注,不同社交网络中相同锚节点对应的虚节点是相同的,虚节点视为训练锚节点。与没有加虚节点时的网络结构相比,由于带虚节点与锚节点直接相连,锚节点向量会朝虚节点向量方向靠近,以保持邻近的关系。同样,这一影响也会传递给锚节点的一阶邻居,由于锚节点向量的移动,锚节点一阶邻居的向量也会朝锚节点的变化方向靠近一些。但是虚节点带来的这种影响随着距离增加是递减的,虚节点的高阶邻居很难受到影响;在低维空间中,锚节点和它的一阶邻居朝虚节点方向靠近,虚节点的高阶邻居节点周围的结构变得稀疏,有效地减少该区域的模糊区间内的节点数量。
本实施例提出的从多个不同的社交网络平台中获取同一用户,称为锚用户,并将与其存在社交关系的用户作为邻居用户,并将每个用户视为一个节点,定义社交网络中用户关注和被关注的概率模型;
对每个社交网络中的锚节点增加两条边,分别与两个虚节点彼此相连,虚节点也彼此相连,同时,虚节点也带有锚节点标签信息,也为锚用户;
利用加入虚节点之后的网络在图表示算法中进行向量表示计算,获取到稀疏的网络结构;
定义微调虚节点的表达式,通过聚合虚节点对应的锚节点周围节点的信息,再乘上权重矩阵,更新虚节点向量的位置;
在每一轮迭代中,对其他训练社交网络数据集中同样加入虚节点,并使用元学习对其他训练社交网络数据集中当前迭代下更新权重矩阵,并将更新后的权重矩阵,放入测试集中,保存此次计算中的损失;
进行K次迭代后,进行梯度下降处理,利用在训练集中获得的先验知识,得到的权重矩阵再做一次更新,得到当前迭代下测试集的最佳权重矩阵,并对虚节点向量进行更新;
更新后的虚节点向量加入对齐计算中,虚节点的向量能够使向整个社交网络在低维空间种的结构变得更稀疏,根据更新后的初始网络表示模型对待更新的局部网络中的所有用户进行用户对齐。
本实施例实现的社交网络对齐是指一个用户在不同社交媒体(微博、豆瓣、贴吧、知乎、Twitter、Facebook等)拥有不同的账号,通过不同社交网络平台中账号的各个特征,判断出来这些账号是否属于同一个用户,将社交网络平台中的用户作为图节点,将具有社交关系的两用户通过边的方式连接,这里的存在社交关系表示用户间存在关注与粉丝关系。
每个锚节点添加了两个带有训练锚节点信息的虚节点,虚节点会对锚节点和锚节点周围的邻居向量表示产生变化,本实施例中将添加虚节点前后向量的变化表示为:
加虚节点前表示为:
Figure GDA0003779650030000101
加虚节点后表示为:
Figure GDA0003779650030000102
其中,Φ(a)表示锚节点a在低维空间中的向量表示,Φ(b))表示锚节点a的二阶邻居b在低维空间中的向量表示,Φ(c)表示锚节点a的一阶邻居c在低维空间中的向量表示,
Figure GDA0003779650030000103
代表节点和节点之间应该是一阶邻居关系,
Figure GDA0003779650030000104
代表节点和节点之间应该是二阶邻居关系,p1和p2代表锚节点连接的两个虚节点。
若虚节点为
Figure GDA0003779650030000105
更新虚节点的权重矩阵为W={w0,w1,...,wn},本实施例通过聚合周围邻居的信息来更新虚节点向量:
Figure GDA0003779650030000106
其中,ui是锚节点,uj是锚节点对应的邻居,通过一阶邻居向量和锚节点向量的均值乘以权重矩阵W,g是激活函数。
并根据上述得到的虚节点的微调向量FPi(vi,W)更新虚节点当前的向量,表示为:
Figure GDA0003779650030000107
其中,Pi是虚节点当前的向量。
本实施例在更新图表示算法的时候,需要显示的区分开锚节点和周围节点,于是本实施例定义损失函数:
Figure GDA0003779650030000108
其中,当跨社交网络中是同一个锚节点的时候,label为1,否则label为-1;
Figure GDA0003779650030000111
为虚节点向量,每个锚节点与两个锚节点相连,所以n为1或2;m为采样的节点个数,Pi为虚节点向量的集合,uj'为负采样过程中随机采样节点对应的向量。
将当前更新虚节点中的W,也就是更新本实施例中在当前迭代状态下,所需要的权重矩阵W:
Figure GDA0003779650030000112
其中,Us指代的是训练集中不同的子任务S={S1,S2,...,SK},η1为学习率,由此进行梯度下降更新W。
在训练集中学习到了本实施例需要的先验知识,把这个先验知识运用到测试里面,这个整个过程反复执行K次,并且保存每一次在测试集中的损失,进行求和,再K次迭代之后,得到损失的总和,表示为:
Figure GDA0003779650030000113
其中,Lquery为测试集的总损失,f(Us)n表示每次计算过程中的f(Us)保存下来进行求和得到的值。
将得到的损失总和Lquery,进行梯度下降,希望得到学习先验知识后,再测试集中当前状态下的最佳W,表示为:
Figure GDA0003779650030000114
其中η2是元学习更新所需要的学习率。
根据上述得到的权重对虚节点向量进行更新,更新后的虚节点向量加入到网络对齐计算中,并根据更新后的初始网络表示模型对待更新的局部网络中的所用用户进行对齐,完成网络对齐。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (10)

1.一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,具体包括以下步骤:
从多个不同的社交网络平台中获取同一用户,称为锚用户,并将与其存在社交关系的用户作为邻居用户,并将每个用户视为一个节点,定义社交网络中用户关注和被关注的概率模型;
对每个社交网络中的锚节点增加两条边,分别与两个虚节点彼此相连,虚节点也彼此相连,同时,虚节点也带有锚节点标签信息,也为锚用户;
利用加入虚节点之后的网络在图表示算法中进行向量表示计算,获取到稀疏的网络结构;
定义微调虚节点的表达式,通过聚合虚节点对应的锚节点周围节点的信息,再乘上权重矩阵,更新虚节点向量的位置;
在每一轮迭代中,对其他训练社交网络数据集中同样加入虚节点,并使用元学习对其他训练社交网络数据集中当前迭代下更新权重矩阵,并将更新后的权重矩阵,放入测试集中,保存此次计算中的损失;
进行K次迭代后,进行梯度下降处理,利用在训练集中获得的先验知识,得到的权重矩阵再做一次更新,得到当前迭代下测试集的最佳权重矩阵,并对虚节点向量进行更新;
更新后的虚节点向量加入对齐计算中,虚节点的向量能够使向整个社交网络在低维空间种的结构变得更稀疏,根据更新后的初始网络表示模型对待更新的局部网络中的所有用户进行用户对齐。
2.根据权利要求1所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,用户关系概率模型的构建公式如下:
Figure FDA0003779650020000011
Figure FDA0003779650020000021
其中,p1(vj|vi)表示用户vi关注用户vj的概率;p2(vi|vj)表示用户vj被用户vi关注的概率;
Figure FDA0003779650020000022
表示用户vi本身的向量,
Figure FDA0003779650020000023
表示该用户vi作为输入上下文时的向量,
Figure FDA0003779650020000024
表示该用户vi作为输出上下文时的向量,V表示社交网络平台用户集合,i,j,k∈|V|,|V|表示节点的集合。
3.根据权利要求1所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,每个锚节点添加了两个带有训练锚节点信息的虚节点,虚节点会对锚节点和锚节点周围的邻居向量表示产生变化,其中加虚节点前表示为:
Figure FDA0003779650020000025
加虚节点后表示为:
Figure FDA0003779650020000026
其中,Φ(a)表示锚节点a在低维空间中的向量表示,Φ(b))表示锚节点a的二阶邻居b在低维空间中的向量表示,Φ(c)表示锚节点a的一阶邻居c在低维空间中的向量表示,
Figure FDA0003779650020000027
代表节点和节点之间应该是一阶邻居关系,
Figure FDA0003779650020000028
代表节点和节点之间应该是二阶邻居关系,p1和p2代表锚节点连接的两个虚节点。
4.根据权利要求1所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,若虚节点为
Figure FDA0003779650020000029
则更新虚节点向量的位置的过程表示为:
Figure FDA00037796500200000210
其中,FPi(vi,W)为虚节点的微调向量。
5.根据权利要求4所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,若更新虚节点的权重矩阵为W={w0,w1,...,wn},虚节点的微调向量FPi(vi,W)表示为:
Figure FDA0003779650020000031
其中,ui是锚节点,uj是锚节点ui对应的邻居,vi为当前采样的中心节点,nei(v)表示节点v的一阶邻居节点集合,N表示节点v的一阶邻居总数,W为权重矩阵,g(.)为激活函数。
6.根据权利要求5所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,权重矩阵W表示为:
Figure FDA0003779650020000032
其中,Us指代的是训练集中不同的子任务S={S1,S2,...,SK},η1为学习率,
Figure FDA0003779650020000033
f为梯度,f(Us)为区分开锚节点和周围节点的损失函数。
7.根据权利要求6所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,区分开锚节点和周围节点的损失函数f(Us)表示为:
Figure FDA0003779650020000034
其中,U代表所有节点向量的集合,Us特指训练集子任务中节点向量的集合;当跨社交网络中是同一个锚节点的时候,label为1,否则label为-1;
Figure FDA0003779650020000035
为虚节点向量,每个锚节点与两个锚节点相连,第一个锚节点的n为1,第二个锚节点的n为2;m为采样的节点个数,Pi为虚节点向量的集合,uj'为负采样过程中随机采样节点对应的向量。
8.根据权利要求1所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,测试集的总损失表示为:
Figure FDA0003779650020000036
其中,Lquery为测试集的总损失,f(Us)n表示每次计算过程中的f(Us)保存下来进行求和得到的值。
9.根据权利要求8所述的一种基于虚节点和元学习改进社交网络对齐方法,其特征在于,根据得到测试集的总损失Lquery,进行梯度下降,利用对训练集进行梯度下降,并根据梯度下降得到的先验知识对权重矩阵再做一次更新,具体过程表示为:
Figure FDA0003779650020000041
其中,η2是元学习更新所需要的学习率。
10.一种基于虚节点和元学习改进社交网络对齐系统,其特征在于,用于实现权利要求1所述的一种基于虚节点和元学习改进社交网络对齐方法,所述系统包括:
平台接口API,用于获取社交网络平台中的每个用户的社交关系;
模型建模模块,用于构造出社交网络平台的图网络,将社交网络用户作为图节点,将存在社交关系的两邻居用户作为图边;
添加虚节点模块,用于对每个社交网络中的锚节点,添加新的虚节点,每个锚节点与两个虚节点相连;
元学习训练集获取先验知识模块,用于通过训练集的先验知识训练,然后更新锚节点对应的虚节点向量,然后进行K次更新权重矩阵;
元学习测试集更新当前虚节点向量,用于上一步得到训练集的先验知识,作为测试集的初始值进行计算,更新虚节点向量;
用户对齐模块,用于获取不同社交网络平台中的用户相似程度,对待对齐的局部网络中的所有用户进行用户对齐。
CN202011082763.7A 2020-10-12 2020-10-12 一种基于虚节点和元学习改进社交网络对齐方法及系统 Active CN112163170B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011082763.7A CN112163170B (zh) 2020-10-12 2020-10-12 一种基于虚节点和元学习改进社交网络对齐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011082763.7A CN112163170B (zh) 2020-10-12 2020-10-12 一种基于虚节点和元学习改进社交网络对齐方法及系统

Publications (2)

Publication Number Publication Date
CN112163170A CN112163170A (zh) 2021-01-01
CN112163170B true CN112163170B (zh) 2022-10-18

Family

ID=73868085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011082763.7A Active CN112163170B (zh) 2020-10-12 2020-10-12 一种基于虚节点和元学习改进社交网络对齐方法及系统

Country Status (1)

Country Link
CN (1) CN112163170B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636658B (zh) * 2019-01-17 2022-05-06 电子科技大学 一种基于图卷积的社交网络对齐方法
CN110347932B (zh) * 2019-06-04 2021-11-23 中国科学院信息工程研究所 一种基于深度学习的跨网络用户对齐方法
CN110532436B (zh) * 2019-07-17 2021-12-03 中国人民解放军战略支援部队信息工程大学 基于社区结构的跨社交网络用户身份识别方法
CN110515986B (zh) * 2019-08-27 2023-01-06 腾讯科技(深圳)有限公司 一种社交网络图的处理方法、装置及存储介质

Also Published As

Publication number Publication date
CN112163170A (zh) 2021-01-01

Similar Documents

Publication Publication Date Title
Solus et al. Consistency guarantees for greedy permutation-based causal inference algorithms
TWI682304B (zh) 基於圖結構模型的異常帳號防控方法、裝置以及設備
CN110929047B (zh) 关注邻居实体的知识图谱推理方法和装置
CN113536383B (zh) 基于隐私保护训练图神经网络的方法及装置
US8438189B2 (en) Local computation of rank contributions
CN112910710B (zh) 网络流量时空预测方法、装置、计算机设备和存储介质
CN112214775B (zh) 防止第三方获取关键图数据信息的对图数据的注入式攻击方法、装置、介质及电子设备
WO2019019385A1 (zh) 跨平台数据匹配方法、装置、计算机设备和存储介质
CN113628059B (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN112214499B (zh) 图数据处理方法、装置、计算机设备和存储介质
Garcia-Perez et al. Precision as a measure of predictability of missing links in real networks
CN111814066B (zh) 基于启发式算法的动态社交用户对齐方法及系统
CN113255798A (zh) 一种分类模型训练方法、装置、设备及介质
CN111581450B (zh) 确定用户的业务属性的方法及装置
CN112163170B (zh) 一种基于虚节点和元学习改进社交网络对齐方法及系统
CN116993513A (zh) 金融风控模型解释方法、装置及计算机设备
CN111028092A (zh) 基于Louvain算法的社区发现方法、计算机设备及其可读存储介质
CN114897666B (zh) 图数据存储、访问、处理方法、训练方法、设备及介质
CN115758271A (zh) 数据处理方法、装置、计算机设备和存储介质
JP7420244B2 (ja) 学習装置、学習方法、推定装置、推定方法及びプログラム
CN114676755A (zh) 基于图卷积网络的无监督域自适应的分类方法
CN111860655A (zh) 用户的处理方法、装置和设备
CN113792784B (zh) 用于用户聚类的方法、电子设备和存储介质
CN110879861B (zh) 基于表示学习的相似移动应用计算方法及装置
Yu et al. Edge Sign Prediction Based on Orthogonal Graph Regularized Nonnegative Matrix Factorization for Transfer Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240117

Address after: 230000 floor 1, building 2, phase I, e-commerce Park, Jinggang Road, Shushan Economic Development Zone, Hefei City, Anhui Province

Patentee after: Dragon totem Technology (Hefei) Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Patentee before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

TR01 Transfer of patent right