CN110851664B - 一种面向主题的社交网络节点重要度评估方法 - Google Patents
一种面向主题的社交网络节点重要度评估方法 Download PDFInfo
- Publication number
- CN110851664B CN110851664B CN201911074441.5A CN201911074441A CN110851664B CN 110851664 B CN110851664 B CN 110851664B CN 201911074441 A CN201911074441 A CN 201911074441A CN 110851664 B CN110851664 B CN 110851664B
- Authority
- CN
- China
- Prior art keywords
- nodes
- social network
- node
- network
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 24
- 239000011159 matrix material Substances 0.000 claims abstract description 97
- 238000000034 method Methods 0.000 claims abstract description 47
- 238000010276 construction Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 claims description 8
- 238000007418 data mining Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 description 8
- 238000005259 measurement Methods 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000005065 mining Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种面向主题的社交网络节点重要度评估方法,先对社交网络中各节点按主题进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络。将面向主题的社交网络的每条边转换为一个与边权重大小对应的电阻,得到与面向主题的社交网络对应的电阻网络;进而根据节点之间的局部连接结构,采用节点之间的有效电阻对节点之间的局部连通性进行建模;在此基础上,根据节点局部连通性矩阵,构建节点的全局连通性矩阵;最后融合节点局部连通性和全局连通性,计算面向主题的社交网络节点重要度。本发明基于节点在面向主题的社交网络中的局部结构和全局结构特性评估节点重要度,反映了网络结构较本质的特征,具有较高的准确性和稳定性。
Description
技术领域
本发明涉及复杂网络节点重要度评估技术领域,特别是一种融合节点局部连通性和全局连通性的面向主题的社交网络节点重要度评估方法。
背景技术
复杂网络是21世纪出现的一门新兴的系统性、综合性学科。自然界和人类社会存在大量复杂系统都可以通过复杂网络加以描述,如信息传播网络、细胞网络、Internet网络、引文网络、语言网络、社交网络、电力网络和交通网络等的步伐,他们都有明显的复杂网络特性。
人际社交关系构成的复杂网络即社交网络,社交网络中的各节点代表单独个体,社交网络中的连边代表节点之间的连通关系,根据节点间联系的强弱构建对应的权重矩阵。
评估社交网络中节点在动力学过程中的重要度和影响力具有重要意义,研究人员面向不同的应用提出相应的评估方法。根据算法原理不同,可以大致分为三类:
(1)基于节点近邻信息的关键节点识别方法
基于节点近邻的评估方法根据节点的邻居信息识别关键节点,是最简单直观的方法。节点重要度的最简单的衡量指标为度中心性,采用节点的局部结构特点衡量节点的重要度,即网络中节点的连边越多,该节点越重要。
(2)基于路径的关键节点识别方法
在社交网络中存在一些节点,它们度数虽然不高,却连接了网络中的几个核心区域,这类节点往往扮演着桥梁的角色负责网络中几大模块间的信息传递,基于此,不少学者提出了基于路径的关键节点识别方法。最常用的基于路径的重要度衡量指标为介数中心度和接近中心度,介数中心度衡量了经过某一节点的最短路径的数目,数目越多,该节点重要度越高;接近中心度衡量一个节点到网络中其他节点的最短路径的平均长度,一个节点距离其他节点越近,则该节点越重要。介数中心度和接近中心度基于网络的全局结构——最短路径——评估节点的重要度,隐含的假设是复杂网络中的动力学过程,如信息传播,是基于最短路径进行的,忽略了节点间其他路径在信息传播中的作用。现实中,复杂网络中的动力学过程依赖于网络结构,而非仅仅是最短路径。信息的流动和传递可能通过连通节点的任意路径进行。节点间路径增加、连通性增强增大了信息传播的可能性。
(3)系统科学分析方法
最常用的系统科学分析法为节点删除法,即通过探究删除节点后对网络造成的影响来衡量节点的重要度。
传统节点中心性模型,如度中心性、介数中心性等无法直接对网络连通性进行建模,进而难以融合网络的局部结构和全局结构对复杂网络中节点重要度进行评估。
另一方面,社交网络中节点往往跨越多个领域,而节点在不同领域中的重要度通常是不同的。目前节点重要度评估往往忽略了面向不同的主题节点重要度不同的问题,缺乏对节点影响力的细粒度评估。
发明内容
针对传统节点中心性度量无法直接对网络连通性进行建模,进而难以有效融合网络局部结构和全局结构的问题,以及节点面向不同主题其重要度具有差异性的问题,本发明的目的是提供一种面向主题的社交网络节点重要度评估方法。本发明对节点按照主题进行划分,基于节点在社交网络中的局部结构和全局结构特性评估节点重要度,反映了网络结构较本质的特征,具有普适性,排名具有较高的准确性和稳定性。
为了实现上述发明目的,本发明采用的技术方案是:
一种面向主题的社交网络节点重要度评估方法,包括:
步骤1,给定社交网络,对社交网络中各节点按主题(领域)进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络;
步骤2,建立面向主题的社交网络对应的电阻网络;
步骤3,计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,其元素表示节点之间的局部连通性;
步骤4,根据节点局部连通性矩阵构建节点的全局连通性矩阵,其元素表示节点与网络中所有节点之间的全局连通性;
步骤5,根据节点的局部连通性和全局连通性,确定面向主题的社交网络节点重要度。
本发明步骤1中,根据社交网络中的各节点及其属性信息,对节点对应的主题进行划分,同一主题下的所有节点组成一个面向主题的社交网络。比如,学术合作网络中的各节点代表不同的学术研究作者。根据各学术研究作者提交的论文,基于主题模型对论文涉及的主题进行建模,通过训练得到论文涉及的主题,根据论文主题确定各论文对应的学术研究作者所对应的主题。同一主题下所有学术研究作者构成一个面向主题的社交网络。
本发明步骤2中,包括:
(2.1)面向主题的社交网络G={V,E,W},其中V表示面向主题的社交网络G中所有节点组成的集合,即点集,其中点集V由对应相同主题的节点组成,点集V中节点的个数记作n;E表示网络G中所有连边的集合,即边集,若网络G中的节点i和节点j之间存在连边,则记作(i,j)∈E;W表示边集对应的权重矩阵,边集中的连边(i,j)对应权重矩阵中的一个权重wij。一般根据节点之间联系的强弱构建边集对应的权重矩阵W,权重的大小对应连边所反映的节点间联系的密切程度,如联系越密切,连边的权重越大,反之,则权重越小。
(2.2)根据面向主题的社交网络G,构建相应的电阻网络N(G),面向主题的社交网络G中的每条连边(i,j)对应一个电阻,每条连边对应的电阻的大小基于连边的权重大小wij计算。
本发明步骤3中,包括:
(3.1)确定面向主题的社交网络的邻接矩阵A;
(3.2)确定节点度对应的对角阵;
(3.3)计算面向主题的社交网络的拉普拉斯矩阵L=D-A;计算拉普拉斯矩阵L的Moore-Penrose逆矩阵;
(3.4)计算节点之间的有效电阻:
(3.5)根据节点之间的有效电阻计算节点的局部连通性矩阵。
本发明步骤(3.1)中,邻接矩阵A中第i行、j列元素(A)ij表示面向主题的社交网络G中的节点i和节点j之间是否存在连边直接相连,若节点i和节点j之间存在直接相连的连边,则(A)ij=1,否则(A)ij=0;
本发明步骤(3.2)中,对角阵D中第i行、i列元素(D)ii等于与节点i直接相连的所有节点j个数之和,即
本发明步骤(3.3)中:计算面向主题的社交网络G的拉普拉斯矩阵L=D-A;计算拉普拉斯矩阵L的Moore-Penrose逆矩阵为L+;
本发明步骤(3.4)中,计算节点i与节点j之间的有效电阻:
rij=(L+)ii+(L+)jj-2(L+)ij
其中,(L+)ij对应矩阵L+的第i行、j列元素,(L+)ii和(L+)jj分别对应矩阵L+的对角线上的元素i和j。
步骤(3.5)中,计算节点i与节点j之间的局部连通性矩阵LC,其中元素(LC)ij表示节点i与节点j之间的局部连通性,定义如下:
本发明步骤4中,对于面向主题的社交网络中的节点,根据节点与网络中的其它节点之间的局部连通性,计算网络中节点的全局连通性矩阵GC,其中元素(GC)i表示节点i与网络中所有节点的全局连通性:
本发明步骤5中,对于面向主题的社交网络中的节点i,融合节点i的局部连通性和全局连通性,计算节点重要度为:
一种面向主题的社交网络节点重要度评估系统,包括:
面向主题的社交网络构建模块,对给定的社交网络中各节点按主题进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络;
电阻网络构建模块,用于构建面向主题的社交网络所对应的电阻网络;
局部连通性矩阵构建模块,通过计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,局部连通性矩阵其元素表示节点之间的局部连通性;
全局连通性构建模块,根据节点局部连通性矩阵构建节点的全局连通性矩阵,全局连通性矩阵其元素表示节点与网络中所有节点之间的全局连通性;
节点重要度确定模块,根据节点的局部连通性和全局连通性,确定面向主题的社交网络节点重要度。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述面向主题的社交网络节点重要度评估方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述的面向主题的社交网络节点重要度评估方法的步骤。
本发明的有益技术效果:
本发明对社交网络中的节点根据其属性进行主题分类,同一主题下的所有节点组成一个面向主题的社交网络。这样将社交网络细分为多个面向主题的社交网络。针对面向主题的社交网络,提出面向主题的社交网络节点重要度评估方法,其更重要度评估更为精准可靠。
同时,针对传统节点中心性度量无法直接对网络连通性进行建模,难以有效融合网络局部结构和全局结构的问题,本发明提出融合节点局部连通性和全局连通性的节点重要度评估指标。本发明所提出的节点重要度评估指标较经典中心性度量指标具有较好的性能,且能够反映网络结构较本质的特征,特别是发现高影响力节点。
附图说明
图1是本发明的流程图;
图2是实施例2中采用学者引用数(citation)评价指标,针对数据库系统、机器学习、Web挖掘、贝叶斯网络等领域学术合作网络中学者影响力进行评估,得到的各领域影响力最大的单个节点对应的引用数排序图。
图3是实施例2中采用学者引用数(citation)评价指标,针对机器学习领域学术合作网络中学者影响力进行评估,得到的一组重要节点累积引用数排序图和引用数分布图(见图3中内嵌子图)。
图4是实施例2中采用学者H-index评价指标,针对数据库系统、机器学习、Web挖掘、贝叶斯网络等领域学术合作网络中学者影响力进行评估,得到的各领域影响力最大的单个节点对应的引用数排序图。
图5是实施例2中采用学者H-index评价指标,针对机器学习领域学术合作网络中学者影响力进行评估,得到的一组重要节点累积H-index排序图和H-index分布图(见图5中内嵌子图)。
具体实施方式
为了便于本发明的实施,下面结合具体实例作进一步的说明。
实施例1:
本发明提供一种面向主题的社交网络节点重要度评估方法,包括:
给定社交网络,对社交网络中各节点按主题(领域)进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络。采用电阻网络对面向主题的社交网络进行建模表示,将面向主题的社交网络的每条边转换为一个与边权重大小对应的电阻,得到与面向主题的社交网络对应的电阻网络。
进而采用节点之间的有效电阻对节点之间的局部连通性进行建模。根据节点之间的局部连接结构,计算局部连通性矩阵LC,其元素(LC)ij反映节点i和节点j之间连通路径的距离及连通路径的规模,节点之间的连通路径越多、距离越短则局部连通性越强,可根据网络拉普拉斯矩阵的Moore-Penrose逆求解。根据节点与网络中其他节点之间的连接结构,基于节点之间的局部连通性,计算节点的全局连通性矩阵GC,其元素(GC)i为节点i与网络中所有节点局部连通性之和。
在此基础上,融合节点局部连通性和全局连通性,提出面向主题的社交网络节点重要度评估指标CLG:
实施例2:本实施例中的社交网络为学术合作网络。
学术合作是科学研究中最普遍的活动之一。通常具有重要地位的科学家其研究成果被广泛引用,往往与较多的科学家建立联系,其影响力辐射到广泛的范围内。
将科学家在一篇文章上共同署名看作一次学术合作关系,学术合作网络是以参与合作的科学家作为节点、科学家之间的合作关系作为连边组成的无向网络。本实施例中,学术合作网络的点集包含640,134个节点,代表640,134位科学家作者。学术合作网络的边集包含1,554,643条连边,代表科学家作者之间的1,554,643种合作关系。并根据科学家作者之间合作的次数构建边集对应的权重矩阵W。
一位科学家的研究成果可能涉及多个领域,在一个领域具有重要地位的科学家在其他领域可能并不具有同样的重要地位。为了更准确地评估科学家的影响力,采用本申请提供的面向主题的社交网络节点重要度评估方法实现节点重要度评估,流程如图1所示。
步骤1,首先采集节点及其属性信息。本实施例中,收集学术合作网络中各科学家以及各科学家作者所提交的论文信息。然后,根据各科学家作者提交的论文,基于主题模型对论文涉及的主题进行建模,通过训练得到论文涉及的主题,根据论文主题确定各论文对应的科学家作者所对应的主题。同一主题下所有科学家作者作为一个面向主题的社交网络。即对科学家作者所提交的论文所属技术领域进行划分,比如分为数据挖掘、数据库系统、信息检索、web服务、贝叶斯网络、语义网等主题(领域)。基于领域的划分反映了现实世界中科学家在不同领域的贡献及影响力的差异性。同一个领域下的各科学家作者构成一个面向主题的社交网络。
步骤2,建立面向主题的社交网络对应的电阻网络。
(2.1)对于由同一个技术领域下的各科学家作者构成的面向主题的社交网络G,G={V,E,W},其中V表示面向主题的社交网络G中所有节点组成的集合,即点集,其中点集V由对应相同主题的节点组成,点集V中节点的个数记作n;E表示网络G中所有连边的集合,即边集,若网络G中的节点i和节点j之间存在连边,则记作(i,j)∈E;W表示边集对应的权重矩阵,边集中的连边(i,j)对应权重矩阵中的一个权重wij。一般根据节点之间联系的强弱构建边集对应的权重矩阵W,权重的大小对应连边所反映的节点间联系的密切程度,如联系越密切,连边的权重越大,反之,则权重越小。
(2.2)根据面向主题的社交网络G,构建相应的电阻网络N(G),面向主题的社交网络G中的每条连边(i,j)对应一个电阻,每条连边对应的电阻的大小基于连边的权重大小wij计算。步骤3,计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,其元素表示节点之间的局部连通性。
步骤3,计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,其元素表示节点之间的局部连通性;
(3.1)确定面向主题的社交网络的邻接矩阵A;
邻接矩阵A中第i行、j列元素(A)ij表示面向主题的社交网络G中的节点i和节点j之间是否存在连边直接相连,若节点i和节点j之间存在直接相连的连边,则(A)ij=1,否则(A)ij=0。
(3.2)确定节点度对应的对角阵;
对角阵D中第i行、i列元素(D)ii等于与节点i直接相连的所有节点j个数之和,即
(3.3)计算面向主题的社交网络G的拉普拉斯矩阵L=D-A;计算拉普拉斯矩阵L的Moore-Penrose逆矩阵为L+;
(3.4)计算节点i与节点j之间的有效电阻:
rij=(L+)ii+(L+)jj-2(L+)ij
其中,(L+)ij对应矩阵L+的第i行、j列元素,(L+)ii和(L+)jj分别对应矩阵L+的对角线上的元素i和j。
(3.5)计算节点i与节点j之间的局部连通性矩阵LC,其中元素(LC)ij表示节点i与节点j之间的局部连通性:
步骤4,对于面向主题的社交网络中的节点,根据节点与网络中的其它节点之间的局部连通性,计算网络中节点的全局连通性矩阵GC,其中元素(GC)i表示节点i与网络中所有节点的全局连通性:
(GC)i=1/∑i<jrij
步骤5,对于面向主题的社交网络中的节点i,融合节点i的局部连通性和全局连通性,计算节点重要度为:
图2是实施例2中针对数据库系统、机器学习、Web挖掘、贝叶斯网络等领域学术合作网络,采用本发明方法所提节点重要度方法与现有节点中心性指标进行比较,得到的各领域影响力最大的单个节点对应的引用数排序图,各领域从左至右对应的柱状图分别对应度中心性、接近中心性、介数中心性、接近中心性、核心中心性、信息中心性和本发明方法所提中心性指标,可以发现本发明方法识别的学者具有更高的引用数,对应的学者具有更高的影响力。
图3是实施例2中针对机器学习领域学术合作网络,采用本发明方法所提节点重要度方法与现有节点中心性指标进行比较,根据每种方法排序得到影响力最大的top-k个重要节点,对应的累积引用数排序图和引用数分布图(见图3中内嵌的箱线图),为显示方便各方法采用缩写,度中心性(简写为CD)、接近中心性(简写为CC)、介数中心性(简写为CB)、核心中心性(简写为CCore)、信息中心性(简写为CI)、本发明方法(简写为CLG),可以发现本发明方法CLG识别的一组重要学者累积引用数排序最高;图3中内嵌的引用数分布图中,本发明方法CLG识别的一组重要学者引用数最大值、最小值和中位数均优于现有方法,对应的学者具有更高的影响力。
图4是实施例2中针对数据库系统、机器学习、Web挖掘、贝叶斯网络等领域学术合作网络,采用本发明方法所提节点重要度方法与现有节点中心性指标进行比较,得到的各领域影响力最大的单个节点对应的H-index排序图。各领域从左至右对应的柱状图分别对应度中心性、接近中心性、介数中心性、接近中心性、核心中心性、信息中心性和本发明方法所提中心性指标,可以发现本发明方法识别的学者具有更高的H-index,对应的学者具有更高的影响力。
图5是实施例2中针对机器学习领域学术合作网络,采用本发明方法所提节点重要度方法与现有节点中心性指标进行比较,根据每种方法排序方法得到影响力最大的top-k个重要节点,对应的累积H-index排序图和H-index分布图(见图5中内嵌的箱线图),为显示方便各方法采用缩写,度中心性(简写为CD)、接近中心性(简写为CC)、介数中心性(简写为CB)、核心中心性(简写为CCore)、信息中心性(简写为CI)、本发明方法(简写为CLG),可以发现本发明方法CLG识别的一组重要学者累积H-index排序最高;图5中内嵌的H-index分布图中,本发明方法CLG识别的一组重要学者H-index最大值、最小值和中位数均优于现有方法,对应的学者具有更高的影响力。
实施例3:
一种面向主题的社交网络节点重要度评估系统,包括:
面向主题的社交网络构建模块,对给定的社交网络中各节点按主题进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络;
电阻网络构建模块,用于构建面向主题的社交网络所对应的电阻网络;
局部连通性矩阵构建模块,通过计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,局部连通性矩阵其元素表示节点之间的局部连通性;
全局连通性构建模块,根据节点局部连通性矩阵构建节点的全局连通性矩阵,全局连通性矩阵其元素表示节点与网络中所有节点之间的全局连通性;
节点重要度确定模块,根据节点的局部连通性和全局连通性,确定面向主题的社交网络节点重要度。
实施例4:
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,:所述处理器执行所述计算机程序时实现所述面向主题的社交网络节点重要度评估方法的步骤。
实施例5:
一种计算机可读存储介质,其上存储有计算机程序,:所述计算机程序被处理器执行时实现所述的面向主题的社交网络节点重要度评估方法的步骤。
本发明所提供的方法能够广泛应用于各种类型的社交网络中,具有普遍适应性。如交友社交网络,提取网络中各节点的性别、年龄、地址、爱好等属性信息,对网络中的各节点进行分类划分,同一分类下所有节点作为一个面向主题的社交网络,即可采用本发明提供的面向主题的社交网络节点重要度评估方法实现节点重要度评估。本发明方法同样适应其他不同类型的社交网络。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (5)
1.一种面向主题的社交网络节点重要度评估方法,其特征在于,包括:
步骤1,给定社交网络,对社交网络中各节点及其属性信息按主题进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络;其中,所述社交网络为复杂网络,所述社交网络中的节点为人际社交关系中的个体,所述社交网络中节点之间的连边表示人际社交关系中的个体之间的连通关系,以及根据所述连通关系的强弱程度构建权重矩阵;所述社交网络为学术合作网络,所述学术合作网络是根据科学家以及科学家提交的论文信息进行基于主题模型对论文涉及的主题进行建模,得到论文涉及的主题,根据论文主题确定各论文对科学家对应的主题,同一主题下所有科学家构成了面向主题的社交网络,所述主题表示对科学家提交的论文所属的技术领域进行划分;所述技术领域包括:数据挖掘、数据库系统、信息检索、web服务、贝叶斯网络以及语义网;基于领域的划分反映了现实世界中科学家在不同领域贡献及影响力的差异;
步骤2,建立面向主题的社交网络对应的电阻网络;
对于由同一个技术领域下的各科学家作者构成的面向主题的社交网络G,G={V,E,W},其中V表示面向主题的社交网络G中所有节点组成的集合,即点集,其中点集V由对应相同主题的节点组成,点集V中节点的个数记作n;E表示网络G中所有连边的集合,即边集,若网络G中的节点i和节点j之间存在连边,则记作(i,j)∈E;W表示边集对应的权重矩阵,边集中的连边(i,j)对应权重矩阵中的一个权重wij;
根据面向主题的社交网络G,构建相应的电阻网络N(G),面向主题的社交网络G中的每条连边(i,j)对应一个电阻,每条连边对应的电阻的大小基于连边的权重大小wij计算;
步骤3,计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,其元素表示节点之间的局部连通性;
步骤4,根据节点局部连通性矩阵,构建节点的全局连通性矩阵,其元素表示节点与网络中所有节点之间的全局连通性;
步骤5,根据节点的局部连通性和全局连通性,计算面向主题的社交网络节点重要度;
所述计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,步骤包括:
确定面向主题的社交网络的邻接矩阵A;
其中,邻接矩阵A中第i行、j列元素(A)ij表示面向主题的社交网络G中的节点i和节点j之间是否存在连边直接相连,若节点i和节点j之间存在直接相连的连边,则(A)ij=1,否则(A)ij=0;
确定节点度对应的对角阵;
其中,对角阵D中第i行、i列元素(D)ii等于与节点i直接相连的所有节点j个数之和,即
计算面向主题的社交网络的拉普拉斯矩阵L=D-A;计算拉普拉斯矩阵L的Moore-Penrose逆矩阵为L+;
计算节点之间的有效电阻:
rij=(L+)ii+(L+)jj-2(L+)ij
其中,(L+)ij对应矩阵L+的第i行、j列元素,(L+)ii和(L+)jj分别对应矩阵L+的对角线上的元素i和j;
根据节点之间的有效电阻计算节点的局部连通性矩阵,定义式如下:
其中,元素(LC)ij表示节点i与节点j之间的局部连通性;
所述根据节点局部连通性矩阵,构建节点的全局连通性矩阵,公式表示
为:(GC)i=1/∑i<jrij
其中,元素(GC)i表示节点i与网络中所有节点的全局连通性;
所述根据节点的局部连通性和全局连通性,计算面向主题的社交网络节点重要度,公式表示为:
2.根据权利要求1所述的面向主题的社交网络节点重要度评估方法,其特征在于,步骤1中,根据社交网络中的各节点及其属性信息,对节点对应的主题进行划分。
3.一种面向主题的社交网络节点重要度评估系统,其特征在于,包括:
面向主题的社交网络构建模块,对给定的社交网络中各节点按主题进行分类划分,同一主题下的所有节点组成一个面向主题的社交网络;其中,所述社交网络为复杂网络,所述社交网络中的节点为人际社交关系中的个体,所述社交网络中节点之间的连边表示人际社交关系中的个体之间的连通关系,以及根据所述连通关系的强弱程度构建权重矩阵;所述社交网络为学术合作网络,所述学术合作网络是根据科学家以及科学家提交的论文信息进行基于主题模型对论文涉及的主题进行建模,得到论文涉及的主题,根据论文主题确定各论文对科学家对应的主题,同一主题下所有科学家构成了面向主题的社交网络,所述主题表示对科学家提交的论文所属的技术领域进行划分;所述技术领域包括:数据挖掘、数据库系统、信息检索、web服务、贝叶斯网络以及语义网;基于领域的划分反映了现实世界中科学家在不同领域贡献及影响力的差异;
电阻网络构建模块,用于构建面向主题的社交网络所对应的电阻网络;
对于由同一个技术领域下的各科学家作者构成的面向主题的社交网络G,G={V,E,W},其中V表示面向主题的社交网络G中所有节点组成的集合,即点集,其中点集V由对应相同主题的节点组成,点集V中节点的个数记作n;E表示网络G中所有连边的集合,即边集,若网络G中的节点i和节点j之间存在连边,则记作(i,j)∈E;W表示边集对应的权重矩阵,边集中的连边(i,j)对应权重矩阵中的一个权重wij;
根据面向主题的社交网络G,构建相应的电阻网络N(G),面向主题的社交网络G中的每条连边(i,j)对应一个电阻,每条连边对应的电阻的大小基于连边的权重大小wij计算;
局部连通性矩阵构建模块,通过计算电阻网络节点之间的有效电阻,构建节点局部连通性矩阵,局部连通性矩阵其元素表示节点之间的局部连通性;
确定面向主题的社交网络的邻接矩阵A;
其中,邻接矩阵A中第i行、j列元素(A)ij表示面向主题的社交网络G中的节点i和节点j之间是否存在连边直接相连,若节点i和节点j之间存在直接相连的连边,则(A)ij=1,否则(A)ij=0;
确定节点度对应的对角阵;
其中,对角阵D中第i行、i列元素(D)ii等于与节点i直接相连的所有节点j个数之和,即
计算面向主题的社交网络的拉普拉斯矩阵L=D-A;计算拉普拉斯矩阵L的Moore-Penrose逆矩阵为L+;
计算节点之间的有效电阻:
rij=(L+)ii+(L+)jj-2(L+)ij
其中,(L+)ij对应矩阵L+的第i行、j列元素,(L+)ii和(L+)jj分别对应矩阵L+的对角线上的元素i和j;
根据节点之间的有效电阻计算节点的局部连通性矩阵,定义式如下:
其中,元素(LC)ij表示节点i与节点j之间的局部连通性;
所述根据节点局部连通性矩阵,构建节点的全局连通性矩阵,公式表示为:(GC)i=1/∑i<jrij
其中,元素(GC)i表示节点i与网络中所有节点的全局连通性;
所述根据节点的局部连通性和全局连通性,计算面向主题的社交网络节点重要度,公式表示为:
全局连通性构建模块,根据节点局部连通性矩阵构建节点的全局连通性矩阵,全局连通性矩阵其元素表示节点与网络中所有节点之间的全局连通性;
节点重要度确定模块,根据节点的局部连通性和全局连通性,计算面向主题的社交网络节点重要度。
4.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至2中任一权利要求所述面向主题的社交网络节点重要度评估方法的步骤。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至2中任一权利要求所述的面向主题的社交网络节点重要度评估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911074441.5A CN110851664B (zh) | 2019-11-06 | 2019-11-06 | 一种面向主题的社交网络节点重要度评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911074441.5A CN110851664B (zh) | 2019-11-06 | 2019-11-06 | 一种面向主题的社交网络节点重要度评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110851664A CN110851664A (zh) | 2020-02-28 |
CN110851664B true CN110851664B (zh) | 2023-08-15 |
Family
ID=69598609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911074441.5A Active CN110851664B (zh) | 2019-11-06 | 2019-11-06 | 一种面向主题的社交网络节点重要度评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851664B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111667373B (zh) * | 2020-06-08 | 2023-08-11 | 上海大学 | 基于邻居子图社交网络动态增量的演化社区发现方法 |
CN111934937B (zh) * | 2020-09-14 | 2020-12-22 | 中国人民解放军国防科技大学 | 基于重要性迭代的相依网络节点重要度评估方法和装置 |
CN114758498B (zh) * | 2022-04-01 | 2023-06-20 | 中南大学 | 基于多向最优扩展的城市有向交通廊道识别方法 |
CN115205061B (zh) * | 2022-07-22 | 2023-05-05 | 福建师范大学 | 基于网络模体的社会网络重要用户识别方法 |
CN115221366B (zh) * | 2022-09-16 | 2023-01-20 | 通号城市轨道交通技术有限公司 | 城市轨道交通网络中关键节点的识别方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105117422A (zh) * | 2015-07-30 | 2015-12-02 | 中国传媒大学 | 智能社交网络推荐系统 |
-
2019
- 2019-11-06 CN CN201911074441.5A patent/CN110851664B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105117422A (zh) * | 2015-07-30 | 2015-12-02 | 中国传媒大学 | 智能社交网络推荐系统 |
Non-Patent Citations (1)
Title |
---|
若干网络的电阻距离研究;褚正清等;《河北北方学院学报(自然科学版)》;20180731;第34卷(第7期);第50-54页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110851664A (zh) | 2020-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110851664B (zh) | 一种面向主题的社交网络节点重要度评估方法 | |
CN110826164B (zh) | 一种基于局部和全局连通性的复杂网络节点重要度评估方法 | |
Liu et al. | Joint representation learning for multi-modal transportation recommendation | |
De Meo et al. | Recommendation of similar users, resources and social networks in a social internetworking scenario | |
Zhou et al. | Userrec: A user recommendation framework in social tagging systems | |
Zhou et al. | Preference-based mining of top-K influential nodes in social networks | |
Sun et al. | Mining heterogeneous information networks: principles and methodologies | |
Chen et al. | General functional matrix factorization using gradient boosting | |
Ying et al. | A temporal-aware POI recommendation system using context-aware tensor decomposition and weighted HITS | |
Omidvar et al. | Context based user ranking in forums for expert finding using WordNet dictionary and social network analysis | |
BRPI0708330A2 (pt) | treinamento de uma função de classificação usando releváncia propagada de documentos | |
CN108304380A (zh) | 一种融合学术影响力的学者人名消除歧义的方法 | |
CN103399932B (zh) | 一种基于语义社会网络本体分析技术的情境识别方法 | |
Deng et al. | Enhanced models for expertise retrieval using community-aware strategies | |
Chen et al. | Home location profiling for users in social media | |
CN107742169A (zh) | 一种基于复杂网络的城市公交网络系统构建方法及性能评估方法 | |
Xia et al. | Effectively identifying the influential spreaders in large-scale social networks | |
CN110070410A (zh) | 一种基于大数据的人口社交分析方法及系统 | |
Majid et al. | GoThere: travel suggestions using geotagged photos | |
Zhu et al. | Probabilistic routing using multimodal data | |
CN112131261A (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
Roozbahani et al. | A systematic survey on multi-relational community detection | |
Partyka et al. | Enhanced geographically typed semantic schema matching | |
Li et al. | An efficient global optimization method with multi-point infill sampling based on kriging | |
Damaiyanti et al. | A similarity query system for road traffic data based on a NoSQL document store |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |