CN111078820B - 基于权重符号社交网络嵌入的边权预测方法 - Google Patents
基于权重符号社交网络嵌入的边权预测方法 Download PDFInfo
- Publication number
- CN111078820B CN111078820B CN201911174793.8A CN201911174793A CN111078820B CN 111078820 B CN111078820 B CN 111078820B CN 201911174793 A CN201911174793 A CN 201911174793A CN 111078820 B CN111078820 B CN 111078820B
- Authority
- CN
- China
- Prior art keywords
- social network
- edge
- weight
- objective
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000006870 function Effects 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 31
- 238000007476 Maximum Likelihood Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 3
- 238000011524 similarity measure Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 2
- 230000008451 emotion Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005295 random walk Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于权重符号社交网络嵌入的边权预测方法,采用权重符号社交网络嵌入方法(WSNE),以此来获得更优的边权预测性能。WSNE为网络中的节点学习潜在特征表示,并且在学得的潜在特征空间中尽可能的保存边的权重和符号信息。本发明通过对边权值的预测,能够更精确的掌握用户之间的关系,进而提高朋友推荐,恶意用户检测之类任务的性能。本发明基于节点嵌入的思想进行权重符号社交网络中边权重预测,然后基于社会学中的结构平衡理论进行对预测权重进行符号约束,最终获得更加精准的关系判断。
Description
技术领域
本发明涉及社交网络技术领域,更具体的说是涉及一种基于权重符号社交网络嵌入的边权预测方法。
背景技术
目前,随着在线社交网络的快速发展,许多系统能够建模成权重符号社交网络(Weighted Signed Social Network,WSSN),以便更细粒度地反映节点之间的关系。在一个权重符号社交网络中,每条边上的权值可以同时反映情感的倾向(正或负)以及关系的强弱(具体的数值)。例如,考虑边权重为+3,+2或-2,不仅具有符号以反映情感的倾向:喜欢/不喜欢、信任/猜忌、朋友/敌人、合作/竞争等等,还能抓取关系的强度,如喜欢的程度、猜忌的程度等。
在一些在线社交媒体中,边的符号和权重值是直接给定的。例如,在比特币的交易平台(Alpha或OTC)中,用户能够使用-10(完全不信任)到10(完全信任)的分数值来评价其他用户,以此来表达对于其他用户的态度。与此同时,现实中也存在一些在线的社交网络,它们给定了边的符号,但边的权重需要隐式的抽取。例如,在维基百科管理员申请网络(RfA)中,如果一个维基百科的编辑者想要成为一个管理员,他需要先提交一个申请。接着其他的用户使用三个标签(支持、中性或反对)中的一个来对这个申请进行投票,辅之以简短的投票理由。因此,能够使用一些语义分析工具从投票附加的文本中隐式的抽取出边的权重并且形成一个权重符号社交网络。显然,权重符号网络能在更细的粒度上反映社交网络中节点之间的信息。在无权无符号的社交网络中,链路预测问题主要关注于边存在性的预测,可以扩展为对边符号(正或负)的预测(符号网络)。
对于权重符号社交网络的链路预测问题,即预测边上的权重信息,包含符号和数值,反映关系的方向和强弱。目前主要的链路预测的研究都集中在如何能更好的获取节点的信息及正确度量节点之间的近似性,但这种思想并不完全适用于权重符号网络,需要进一步结合社会学理论和网络结构来提高边上权重的预测性能。同时对于许多社交网络应用,如链路预测和节点分类,网络特征的提取是非常重要的,许多算法的性能极大的取决于对输入网络特征提取的有效性,节点和网络结构重要的特征需要尽可能的保存。
现有的预测方法,主要集中在无符号/无权重社交网络。在无符号社交网络中,边被标记为1或者0(1代表存在,0代表不存在)。大多数无符号网络嵌入的方法基于同构性原理和skip-gram模型。在设计目标函数的过程中,并未考虑边的符号或权重。已经有工作证明负边具有额外的价值,考虑负边能够提高正边的预测精度。由于负边的存在,同构性原理不再适用。一些基于平衡理论的方法,应用随机游走策略生成带有符号的共现对,以此来嵌入符号网络。这些方法并未直接拟合边的权重信息,如果将它们直接用于嵌入权重符号社交网络,将会导致社交链路预测的性能不佳。
因此,如何通过考虑社交网络中的边的符号和权重,提高网络边的预测精度是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于权重符号社交网络嵌入的边权预测方法,采用权重符号社交网络嵌入方法(WSNE),以此来获得更优的边权预测性能。WSNE为网络中的节点学习潜在特征表示,并且在学得的潜在特征空间中尽可能的保存边的权重和符号信息。在一个权重符号社交网络中,一条边eij能够考虑作为从用户i到用户j“主观性”观点/评价的传递,从用户j的视角这个观点/评价是客观的,因此,对于一个节点i需要去学习它作为一条边初始节点的“主观”潜在特征表示Si,和作为一条边终止节点的“客观”潜在特征表示Oj,然后参照矩阵分解的方法,对于一条边eij,使用Si和Oj的点积拟合边的权重信息;同时在一个权重符号社交网络中,边的符号也是非常重要的,因为它反映了不同的情感,如:喜欢/不喜欢,支持/反对等等。例如,如果一条边的权重是1,拟合值-1和3将会产生同样的误差,但是3明显是更优的拟合值,因为它反映了准确的情感倾向。因此,本发明基于扩展的结构平衡理论添加对于边的符号约束。
为了实现上述目的,本发明采用如下技术方案:
一种基于权重符号社交网络嵌入的边权预测方法,包括如下具体步骤:
步骤1:采用权重符号社交网络嵌入方法学习社交网络中每条有向边eij的两个端点的潜在特征;
步骤2:根据所述潜在特征拟合所述有向边eij的权重Wij;
步骤3:根据所述权重Wij,获得目标函数M;
步骤4:基于社会学中的结构平衡理论进行符号约束,度量所述社交网络中正边端点和负边端点的相似性;
步骤5:采用极大似然方法最大化正边端点间的相似性和最小化负边端点间的相似性,并进行简化获得约束函数C;
步骤6:根据所述目标函数M和所述约束函数C获得总目标函数。
优选的,所述步骤1中所述有向边eij的两个所述端点包括初始节点i和终止节点j,所述潜在特征包括所述初始节点i的主观潜在特征Si和所述终止节点j的客观潜在特征Oj。
优选的,所述步骤2中根据矩阵分解方法,将所述主观潜在特征Si和所述客观潜在特征Oj进行点积计算获得所述权重Wij,Wij=Si·Oj T,其中T表示转置。
优选的,所述步骤4中所述正边端点之间的所述相似性大于所述负边端点之间的所述相似性,表示为sim(i,f)>sim(h,k),if eij∈E+,ehk∈E-,其中E+为所述社交网络中所有边的集合的正边集合,E-为所述社交网络中所有边的集合的负边集合,sim()为相似性度量函数;
其中,学习所述社交网络中的所有节点的所述主观潜在特征和所述客观潜在特征,并构成嵌入矩阵,Si为所述嵌入矩阵的主观矩阵S中的第i行、Oj为所述嵌入矩阵的客观矩阵O中的第j行,T表示向量的转置。其中,采用sigmoid函数度量两个端点之间的相似性。
优选的,所述步骤5中采用所述极大似然方法最大化所述正边端点间的所述相似性和最小化所述负边端点间的所述相似性公式为:
并使用对数运算简化方程的计算,获得所述约束函数C为:
优选的,所述步骤6中所述总目标函数为:
L(S,O)=M|γ×C
其中,γ为控制所述符号约束贡献参数。
优选的,并采用随机梯度下降算法获得所述总目标函数的局部最优值,所述社交网络存在正边集合E+和负边集合E-;将所述数据集划分为两部分,分别为所述正边集合E+和所述负边集合E-;对于所述正边集合E+中的边eij,所述主观矩阵中第i行的所述主观潜在特征si和所述客观矩阵中第j行的所述客观潜在特征oj为:
对于所述负边集合E-中的所述eij,所述主观矩阵中第i行的所述主观潜在特征si和所述客观矩阵中第j行的所述客观潜在特征oj为:
采用下式迭代更新所述主观潜在特征si和所述客观潜在特征oj:
当根据迭代更新后的所述主观潜在特征si和所述客观潜在特征oj计算所述总目标函数的连续两次平均值之差小于预定设置的阈值,所述阈值为0.005,时,则认为收敛优化完成。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于权重符号社交网络嵌入的边权预测方法,在一个权重符号社交网络中,每条边上的权值可以同时反映情感的倾向(正或负)以及关系的强弱(具体的数值)。本发明通过对边权值的预测,能够更精确的掌握用户之间的关系,进而提高朋友推荐,恶意用户检测之类任务的性能。本发明基于节点嵌入的思想进行权重符号社交网络中边权重预测,然后基于社会学中的结构平衡理论进行对预测权重进行符号约束,最终获得更加精准的关系判断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明提供的基于权重符号社交网络嵌入的边权预测方法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于权重符号社交网络嵌入的边权预测方法,包括如下具体S:
S1:采用权重符号社交网络嵌入方法学习社交网络中每条有向边eij的两个端点的潜在特征;
S2:根据潜在特征拟合有向边eij的权重Wij;
S3:根据权重Wij,获得目标函数M;
S4:基于社会学中的结构平衡理论进行符号约束,度量社交网络中正边端点和负边端点的相似性;
S5:采用极大似然方法最大化正边端点间的相似性和最小化负边端点间的相似性,并进行简化获得约束函数C;
S6:根据目标函数M和约束函数C获得总目标函数。
为了进一步优化上述技术特征,S1中有向边eij的两个端点包括初始节点i和终止节点j,潜在特征包括初始节点i的主观潜在特征Si和终止节点j的客观潜在特征Oj。
为了进一步优化上述技术特征,S2中根据矩阵分解方法,将主观潜在特征Si和客观潜在特征Oj进行点积计算获得权重Wij,Wij=Si·Oj T,其中T表示转置。
为了进一步优化上述技术特征,S4中正边端点之间的相似性大于负边端点之间的相似性,表示为sim(i,f)>sim(h,k),if eij∈E+,ehk∈E-,其中E+为社交网络中所有边的集合的正边集合,E-为社交网络中所有边的集合的负边集合,sim()为相似性度量函数;
其中,学习社交网络中的所有节点的主观潜在特征和客观潜在特征,并构成嵌入矩阵,Si为嵌入矩阵的主观矩阵S中的第i行、Oj为嵌入矩阵的客观矩阵O中的第j行,T表示向量的转置。其中,采用sigmoid函数度量两个端点之间的相似性。
为了进一步优化上述技术特征,S5中采用极大似然方法最大化正边端点间的相似性和最小化负边端点间的相似性公式为:
并使用对数运算简化方程的计算,获得约束函数C为:
为了进一步优化上述技术特征,S6中总目标函数为:
L(S,O)=M|γ×C
其中,γ为控制符号约束贡献参数。
为了进一步优化上述技术特征,并采用随机梯度下降算法获得总目标函数的局部最优值,社交网络存在正边集合E+和负边集合E-;将数据集划分为两部分,分别为正边集合E+和负边集合E-;对于正边集合E+中的边eij,主观矩阵中第i行的主观潜在特征si和客观矩阵中第j行的客观潜在特征oj为:
对于负边集合E-中的eij,主观矩阵中第i行的主观潜在特征si和客观矩阵中第j行的客观潜在特征oj为:
采用下式迭代更新主观潜在特征si和客观潜在特征oj:
当根据迭代更新后的主观潜在特征si和客观潜在特征oj计算总目标函数的连续两次平均值之差小于预定设置的阈值,阈值为0.005,时,则认为收敛优化完成。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种基于权重符号社交网络嵌入的边权预测方法,其特征在于,包括如下具体步骤:
步骤1:采用权重符号社交网络嵌入方法学习社交网络中每条有向边eij的两个端点的潜在特征;
步骤2:根据所述潜在特征拟合所述有向边eij的权重Wij;
步骤3:根据所述权重Wij,获得目标函数M;
步骤4:基于社会学中的结构平衡理论进行符号约束,度量所述社交网络中正边端点和负边端点的相似性;
步骤5:采用极大似然方法最大化正边端点间的相似性和最小化负边端点间的相似性,并进行简化获得约束函数C;
步骤6:根据所述目标函数M和所述约束函数C获得总目标函数。
2.根据权利要求1所述的基于权重符号社交网络嵌入的边权预测方法,其特征在于,所述步骤1中所述有向边eij的两个所述端点包括初始节点i和终止节点j,所述潜在特征包括所述初始节点i的主观潜在特征Si和所述终止节点j的客观潜在特征Oj。
3.根据权利要求2所述的基于权重符号社交网络嵌入的边权预测方法,其特征在于,所述步骤2中根据矩阵分解方法,将所述主观潜在特征Si和所述客观潜在特征Oj进行点积计算获得所述权重Wij,Wij=Si·Oj T,其中T表示转置。
7.根据权利要求6所述的基于权重符号社交网络嵌入的边权预测方法,其特征在于,所述步骤6中所述总目标函数为:
L(S,O)=M|γ×C
其中,γ为控制所述符号约束贡献参数。
8.根据权利要求7所述的基于权重符号社交网络嵌入的边权预测方法,其特征在于,并采用随机梯度下降算法获得所述总目标函数的局部最优值,所述社交网络存在正边集合E+和负边集合E-;将所述数据集划分为两部分,分别为所述正边集合E+和所述负边集合E-;对于所述正边集合E+中的边eij,所述主观矩阵中第i行的所述主观潜在特征si和所述客观矩阵中第j行的所述客观潜在特征oj为:
对于所述负边集合E-中的所述eij,所述主观矩阵中第i行的所述主观潜在特征si和所述客观矩阵中第j行的所述客观潜在特征oj为:
采用下式迭代更新所述主观潜在特征si和所述客观潜在特征oj:
当根据迭代更新后的所述主观潜在特征si和所述客观潜在特征oj计算所述总目标函数的连续两次平均值之差小于预定设置的阈值时,则认为收敛优化完成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911174793.8A CN111078820B (zh) | 2019-11-26 | 2019-11-26 | 基于权重符号社交网络嵌入的边权预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911174793.8A CN111078820B (zh) | 2019-11-26 | 2019-11-26 | 基于权重符号社交网络嵌入的边权预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111078820A CN111078820A (zh) | 2020-04-28 |
CN111078820B true CN111078820B (zh) | 2023-04-25 |
Family
ID=70311790
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911174793.8A Active CN111078820B (zh) | 2019-11-26 | 2019-11-26 | 基于权重符号社交网络嵌入的边权预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111078820B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111754356A (zh) * | 2020-06-30 | 2020-10-09 | 复旦大学 | 边符号预测方法、装置及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014157598A (ja) * | 2013-01-21 | 2014-08-28 | Nec Corp | ソフトウェア資産管理装置、ソフトウェア資産管理方法、及びソフトウェア資産管理プログラム |
CN110019653A (zh) * | 2019-04-08 | 2019-07-16 | 北京航空航天大学 | 一种融合文本和标签网络的社交内容表征方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7889679B2 (en) * | 2008-02-01 | 2011-02-15 | Telenor Asa | Arrangements for networks |
US9645995B2 (en) * | 2015-03-24 | 2017-05-09 | Conduent Business Services, Llc | Language identification on social media |
-
2019
- 2019-11-26 CN CN201911174793.8A patent/CN111078820B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014157598A (ja) * | 2013-01-21 | 2014-08-28 | Nec Corp | ソフトウェア資産管理装置、ソフトウェア資産管理方法、及びソフトウェア資産管理プログラム |
CN110019653A (zh) * | 2019-04-08 | 2019-07-16 | 北京航空航天大学 | 一种融合文本和标签网络的社交内容表征方法和系统 |
Non-Patent Citations (1)
Title |
---|
张维玉.社交网络链路预测方法研究.《中国博士学位论文全文数据库信息科技辑》.2018,(第02期),第I139-30页. * |
Also Published As
Publication number | Publication date |
---|---|
CN111078820A (zh) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023000574A1 (zh) | 一种模型训练方法、装置、设备及可读存储介质 | |
Zhang et al. | Fruit classification by biogeography‐based optimization and feedforward neural network | |
CN111695415B (zh) | 图像识别方法及相关设备 | |
Md Saad et al. | Hamming distance method with subjective and objective weights for personnel selection | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
CN109325875B (zh) | 基于在线社交用户隐特征的隐式群体发现方法 | |
Huang et al. | Large-scale heterogeneous feature embedding | |
WO2018068648A1 (zh) | 一种信息匹配方法及相关装置 | |
CN115270007B (zh) | 一种基于混合图神经网络的poi推荐方法及系统 | |
CN114298851A (zh) | 基于图表征学习的网络用户社交行为分析方法、装置及存储介质 | |
CN116150480A (zh) | 一种融合多模态评论信息的用户个性化需求预测方法 | |
CN113330462A (zh) | 使用软最近邻损失的神经网络训练 | |
Matsui et al. | Crowdordering | |
Pham et al. | Unsupervised training of Bayesian networks for data clustering | |
CN116992151A (zh) | 一种基于双塔图卷积神经网络的在线课程推荐方法 | |
CN111078820B (zh) | 基于权重符号社交网络嵌入的边权预测方法 | |
CN112364236A (zh) | 目标对象推荐系统、方法、装置、数据处理方法及装置 | |
US11948387B2 (en) | Optimized policy-based active learning for content detection | |
Muhammadi et al. | Crowd labeling: a survey | |
CN113128667A (zh) | 一种跨域自适应的图卷积平衡迁移学习方法与系统 | |
Fu et al. | ASELM: Adaptive semi-supervised ELM with application in question subjectivity identification | |
CN110610140B (zh) | 人脸识别模型的训练方法、装置、设备及可读存储介质 | |
CN114792097B (zh) | 预训练模型提示向量的确定方法、装置及电子设备 | |
CN116306834A (zh) | 一种基于全局路径感知图神经网络模型的链路预测方法 | |
CN116361540A (zh) | 一种基于用户多意图的社会化推荐方法、装置及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |