CN115563181A - 一种基于多类节点特征的挖掘网络关键节点的方法及装置 - Google Patents
一种基于多类节点特征的挖掘网络关键节点的方法及装置 Download PDFInfo
- Publication number
- CN115563181A CN115563181A CN202211158364.3A CN202211158364A CN115563181A CN 115563181 A CN115563181 A CN 115563181A CN 202211158364 A CN202211158364 A CN 202211158364A CN 115563181 A CN115563181 A CN 115563181A
- Authority
- CN
- China
- Prior art keywords
- node
- network
- nodes
- index
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000005065 mining Methods 0.000 title claims abstract description 32
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 36
- 239000011159 matrix material Substances 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 208000035473 Communicable disease Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于多类节点特征的挖掘网络关键节点的方法及装置,该方法包括:根据网络中各个节点的连接情况计算各个节点的度;根据各个节点的度进一步计算各个节点的H指数;根据K壳分解方法计算各个节点的K壳索引;根据广度优先搜索方法计算各个节点的R阶邻域;根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值。本发明有效地考虑了多类节点特征,因此可以更为全面地反映网络中节点的重要程度,更为准确地挖掘网络中的关键节点,降低错判率;并且本发明仅考虑网络中各个节点的R阶邻域,一方面可以降低时间复杂度,另一方面还可以根据实际情况去调整R的大小,使所述方法更为灵活,适应性更好。
Description
技术领域
本发明涉及网络信息挖掘领域,具体涉及一种基于多类节点特征的挖掘网络关键节点的方法及装置。
背景技术
由于复杂网络的异质性,不同的节点在网络结构与功能中的作用可能存在着很大程度的不同。关键节点就是那些能够在更大程度上影响网络的结构与功能的一些特殊节点。关键节点一般数量非常少,但其影响力却非常巨大,可以快速地波及到网络中的大部分节点。如Twitter上的超级明星可能会显著地加速信息的传播,传染病的超级传播者可能会在很大程度上扩大疾病的规模,几个重要的服务器被蓄意攻击可能会导致整个网络的崩溃,少量关键的发电站发生故障可能会导致灾难性的断电。因此挖掘网络中的关键节点意义重大,而解决上述问题的关键在于设计出有效的关键节点挖掘方法。
目前,大部分关键节点挖掘方法仅使用网络的结构化信息,且主要分为基于邻居的中心性和基于路径的中心性:基于邻居中心性的主要包括度中心性、H指数以及K壳分解方法;基于路径中心性的主要包括介数中心性和接近中心性。但上述经典的关键节点挖掘方法均无法全面、准确地评价节点在网络中的重要性。
发明内容
本发明提供一种基于多类节点特征的挖掘网络关键节点的方法及装置,其目的在于通过有效结合多类节点特征可以解决经典方法对于关键节点评价不全面以及准确率低的问题。
技术方案:
一种基于多类节点特征的挖掘网络关键节点的方法,其特征在于,该方法包括:
采集网络数据,将网络中的实体抽象为节点,对节点进行编号,得到节点集合V={V1,V2,…,VN},其中,N为节点的总数,记录各个节点与其他节点的连接情况;
根据各个节点的连接情况得到所述网络的邻接矩阵;
根据所述网络中各个节点的连接情况计算各个节点的度,所述节点的度用来刻画节点的邻居个数这一特征;
根据所述节点的度计算各个节点的H指数,所述节点的H指数用来刻画节点的邻居质量这一特征;
根据K壳分解方法计算各个节点的K壳索引,所述节点的K壳索引用来刻画节点是否位于网络的核心位置这一特征;
根据广度优先搜索方法计算各个节点的R阶邻域,所述节点的R阶邻域包含了与该节点距离不大于R的全部节点,用来刻画节点之间的距离这一特征;
根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值,进而得到网络中的关键节点。
进一步的,所述网络的邻接矩阵为:若节点i与节点j之间存在连边,则邻接矩阵的第i行第j列所对应的元素为1,否则为0。
进一步的,所述网络中节点的度等于节点的直接连边数量。
进一步的,所述节点的H指数的计算,具体包括:
输入:所述网络节点集合V中各个节点的度;
步骤:统计所述节点对应的邻居节点的度,所述节点的H指数初始值设置为h=1,重复下述过程:
1)判断所述节点是否存在h+1个邻居节点的度不小于h+1;
2)若存在,则h=h+1;
3)若不存在,则H指数为h;
输出:所述网络节点集合V中各节点的H指数。
进一步的,所述K壳索引的计算,具体包括:
输入:所述网络的邻接矩阵;
步骤:首先将网络中度为1的节点剥去,此时剩余网络中可能会出现新的度为1的节点,再将它们剥去,直至剩余网络中再无度为1的节点为止,在此过程中被剥去的所有节点的K壳索引均为1;再以同样的方式剥去剩余网络中度为2的节点,在此过程中被剥去的所有节点的K壳索引均为2;重复此过程,直至网络中再无节点为止;
输出:所述网络节点集合V中各节点的K壳索引。
进一步的,所述R阶邻域的计算,具体包括:
输入:所述网络的邻接矩阵,邻域大小R;
步骤:首先搜索与节点距离为1的所有节点,再搜索与所述节点距离为2的所有节点,直至搜索完与所述节点距离为R的所有节点后结束;
输出:所述网络节点集合V中各节点的R阶邻域。
进一步的,所述各个节点的重要性分值公式为:
其中,k(i)为节点i的度,h(i)为节点i的H指数,ks(i)为节点i的K壳索引,d(i,j)为节点i和节点j之间的距离。
一种基于多类节点特征的挖掘网络关键节点的方法的装置,包括依次连接的采集模块、邻接矩阵生成模块、节点度计算模块、节点H指数计算模块、节点K壳索引计算模块、节点R阶邻域计算模块和节点重要性分值计算模块,采集模块,采集网络数据,将网络中的实体抽象为节点,对节点进行编号,得到节点集合V={V1,V2,…,VN},其中,N为节点的总数,记录各个节点与其他节点的连接情况;邻接矩阵生成模块,根据各个节点的连接情况得到所述网络的邻接矩阵;节点度计算模块,根据所述网络中各个节点的连接情况计算各个节点的度,所述节点的度用来刻画节点的邻居个数这一特征;节点H指数计算模块,根据所述节点的度计算各个节点的H指数,所述节点的H指数用来刻画节点的邻居质量这一特征;节点K壳索引计算模块,根据K壳分解方法计算各个节点的K壳索引,所述节点的K壳索引用来刻画节点是否位于网络的核心位置这一特征;节点R阶邻域计算模块,根据广度优先搜索方法计算各个节点的R阶邻域,所述节点的R阶邻域包含了与该节点距离不大于R的全部节点,用来刻画节点之间的距离这一特征;节点重要性分值计算模块,根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值,进而得到网络中的关键节点。
一种电子设备,包括通过总线连接的处理器、存储器、输入设备和输出设备,处理器用于执行计算机程序;存储器用于存储计算机程序;其中,所述计算机程序,用于由所述存储器存储,并由所述处理器加载并执行如权利要求1-7任意一项所述的基于多类节点特征的挖掘网络关键节点的方法。
一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任意一项所述的基于多类节点特征的挖掘网络关键节点的方法。
有益效果:本发明有效地考虑了多类节点特征,因此可以更为全面地反映网络中节点的重要程度,更为准确地挖掘网络中的关键节点,降低错判率;并且本发明仅考虑网络中各个节点的R阶邻域,一方面可以降低时间复杂度,另一方面还可以根据实际情况去调整R的大小,使所述方法更为灵活,适应性更好。
附图说明
图1为本发明实施例中识别方法流程图;
图2为本发明实施例中网络节点连接图;
图3为本发明实施例中是识别装置结构图;
图4为本发明实施例中电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
识别网络中的关键节点,除了需要考虑能够被直接影响的邻居节点数量(通过节点的度描述)外,其邻居节点的质量(通过节点的H指数描述)及该节点所处的网络位置(通过节点的K壳索引描述)是否接近网络核心也应纳入考虑范畴,除此,也应考虑到一个客观事实,即节点之间的相互影响会随着节点间的距离增大而逐渐减弱(通过节点的R阶邻域描述),因此关键节点挖掘方法有必要同时考虑上述各个因素的作用。而大部分经典方法仅考虑了单一因素,因此应用现有方法无法全面、准确地评价节点在网络中的重要性。
本发明提出了一种基于多类节点特征的挖掘网络关键节点的方法,采用度来刻画节点的邻居节点数量,采用H指数来刻画节点的邻居节点质量,采用K壳索引来刻画节点所处的网络位置,采用R阶邻域来刻画节点之间距离的影响,在此基础上,将四者有效结合进而达到全面评价节点重要性的目的。
本发明不对涉及到的网络类型进行限制,参阅图1所示,为本发明实施例中基于多类节点特征的挖掘网络关键节点的方法,包括:
S100采集网络数据,将网络中的实体抽象为节点,对节点进行编号,得到节点集合V={V1,V2,…,VN},其中,N为节点的总数,记录各个节点与其他节点的连接情况。
具体的,若采集到的两个实体之间有直接关联,则对应的两个节点之间存在一条直接连边,若两个实体之间无直接关联,则对应的两个节点之间不存在直接连边。
S110根据各个节点的连接情况得到所述网络的邻接矩阵。
具体的,若节点i与节点j之间存在连边,则邻接矩阵的第i行第j列所对应的元素为1,否则为0。
S120根据所述网络中各个节点的连接情况计算各个节点的度,所述节点的度用来刻画节点的邻居个数这一特征。
具体的,网络中节点的度等于节点的直接连边数量。
S130根据所述节点的度计算各个节点的H指数,所述节点的H指数用来刻画节点的邻居质量这一特征。
所述根据节点的度计算各个节点的H指数,具体包括:
输入:所述网络节点集合V中各个节点的度;
步骤:统计所述节点对应的邻居节点的度,所述节点的H指数初始值设置为h=1,重复下述过程:
1)判断所述节点是否存在h+1个邻居节点的度不小于h+1;
2)若存在,则h=h+1;
3)若不存在,则H指数为h;
输出:所述网络节点集合V中各节点的H指数。
S140根据K壳分解方法计算各个节点的K壳索引,所述节点的K壳索引用来刻画节点是否位于网络的核心位置这一特征。
所述根据K壳分解方法计算各个节点的K壳索引,具体包括:
输入:所述网络的邻接矩阵;
步骤:首先将网络中度为1的节点剥去,此时剩余网络中可能会出现新的度为1的节点,再将它们剥去,直至剩余网络中再无度为1的节点为止,在此过程中被剥去的所有节点的K壳索引均为1;再以同样的方式剥去剩余网络中度为2的节点,在此过程中被剥去的所有节点的K壳索引均为2;重复此过程,直至网络中再无节点为止;
输出:所述网络节点集合V中各节点的K壳索引。
S150根据广度优先搜索方法计算各个节点的R阶邻域,所述节点的R阶邻域包含了与该节点距离不大于R的全部节点,用来刻画节点之间的距离这一特征。
所述根据广度优先搜索方法计算各个节点的R阶邻域,具体包括:
输入:所述网络的邻接矩阵,所述邻域大小R;
步骤:首先搜索与所述节点距离为1的所有节点,再搜索与所述节点距离为2的所有节点,直至搜索完与所述节点距离为R的所有节点后结束;
输出:所述网络节点集合V中各节点的R阶邻域。
S160根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值,进而得到网络中的关键节点。
具体的,所述各个节点的重要性分值公式为:
其中,k(i)为节点i的度,h(i)为节点i的H指数,ks(i)为节点i的K壳索引,d(i,j)为节点i和节点j之间的距离。根据该公式,节点的重要性分值越高说明该节点越重要。
值得说明的是,本发明实施例中的方法流程图是为了更加清楚地说明本发明实施例中的技术方案,并不构成对本发明实施例提供的技术方案的限制,并且,本发明实施例中也不仅限于网络的应用,对于其它的系统结构和业务应用,本发明实施例提供的技术方案对于类似的问题,同样适用。
下面将结合图2中的算例网络对本发明的具体实施进行详细说明。
步骤1:由于算例网络已给出,因此省略数据采集、节点编号以及记录各个节点连接情况等工作。
步骤2:根据网络中各节点的连接情况得到网络的邻接矩阵。本算例网络对应的邻接矩阵可以表示为:
步骤3:计算各节点的度。以节点2为例,节点2有5条连边,因此k(2)=5。所有节点的度见表1:
表1各节点的度
步骤4:计算各节点的H指数。以节点2为例,节点2的邻居节点分别为1、3、4、5和6,对应的度分别为2、4、3、4和1,因为节点2至多有3个邻居节点的度不小于3,并且不存在4个邻居节点的度不小于4,因此h(2)=3。所有节点的H指数见表2:
表2各节点的H指数
步骤5:计算各节点的K壳索引。去除网络中度为1的节点(6、8、10)及其连边,网络中仍有度为1的节点9,去除节点9及其连边,网络中仍有度为1的节点7,去除节点7及其连边,此时网络中再无度为1的节点,因此节点6、7、8、9、10的K壳索引为1;网络现包含五个节点(1、2、3、4、5),去除度为2的节点1及其连边,此时网络中再无度为2的节点,因此节点1的K壳索引为2;网络现仅剩下四个节点(2、3、4、5),去除度为3的节点(2、3、4、5)及其连边,此时网络中已再无节点,因此节点2、3、4、5的K壳索引为3。所有节点的K壳索引见表3:
表3各节点的K壳索引
步骤6:计算各节点的R阶邻域。以2阶邻域为例(即R=2),节点的2阶邻域包含与该节点距离为1的节点(即1阶邻居)以及与该节点距离为2的节点(即2阶邻居)。所有节点的R阶邻域见表4:
表4各节点的R阶邻域
步骤7:计算各节点的重要性分值,分值越高节点越重要。以节点2为例,其1阶邻居包括节点1、3、4、5、6,其2阶邻居包括节点7,将上述节点的度、H指数和K壳索引代入节点重要性分值公式即可计算出S(2)=451。所有节点的重要性分值见表5:
表5各节点的重要性分值
根据表5的重要性分值,可以得到最终的节点重要性排名,见表6:
表6各节点的重要性排名
结合表1、2、3、5可以看出,不同于节点的度、H指数、K壳索引存在大量节点具有相同指标值的现象,本发明所提出的方法可以更深层次地区分各个节点的不同,以节点6、8、10为例,虽然三者都是叶子节点,但是其所处的网络位置的不同的,显然节点6要更接近于网络的核心,而节点10则处于网络的边缘,因此节点6要比节点10更重要一些。本发明所提出的方法由于有效地考虑了多类节点特征,因此可以更为全面地反映网络中节点的重要程度,更为准确地挖掘网络中的关键节点,降低错判率;并且本发明仅考虑网络中各个节点的R阶邻域,一方面可以降低时间复杂度,另一方面还可以根据实际情况去调整R的大小,使所述方法更为灵活,适应性更好。
基于上述实施例,参阅图3所示,本发明实施例中,基于多类节点特征的挖掘网络关键节点的装置,具体包括:依次连接的采集模块20、邻接矩阵生成模块21、节点度计算模块22、节点H指数计算模块23、节点K壳索引计算模块24、节点R阶邻域计算模块25和节点重要性分值计算模块26,
采集模块20,采集网络数据,将网络中的实体抽象为节点,对节点进行编号,得到节点集合V={V1,V2,…,VN},其中,N为节点的总数,记录各个节点与其他节点的连接情况;
邻接矩阵生成模块21,根据各个节点的连接情况得到所述网络的邻接矩阵;
节点度计算模块22,根据所述网络中各个节点的连接情况计算各个节点的度,所述节点的度用来刻画节点的邻居个数这一特征;
节点H指数计算模块23,根据所述节点的度计算各个节点的H指数,所述节点的H指数用来刻画节点的邻居质量这一特征;
节点K壳索引计算模块24,根据K壳分解方法计算各个节点的K壳索引,所述节点的K壳索引用来刻画节点是否位于网络的核心位置这一特征;
节点R阶邻域计算模块25,根据广度优先搜索方法计算各个节点的R阶邻域,所述节点的R阶邻域包含了与该节点距离不大于R的全部节点,用来刻画节点之间的距离这一特征;
节点重要性分值计算模块26,根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值,进而得到网络中的关键节点。
进一步地,包括:
所述邻接矩阵生成模块21中,所述根据各个节点的连接情况得到所述网络的邻接矩阵,具体为:若节点i与节点j之间存在连边,则邻接矩阵的第i行第j列所对应的元素为1,否则为0。
进一步地,包括:
所述节点度计算模块22中,所述根据网络中各个节点的连接情况计算各个节点的度,具体为:所述网络中节点的度等于节点的直接连边数量。
进一步地,包括:
所述节点H指数计算模块23中,所述根据节点的度计算各个节点的H指数,具体包括:
输入:所述网络节点集合V中各个节点的度;
步骤:统计所述节点对应的邻居节点的度,所述节点的H指数初始值设置为h=1,重复下述过程:
1)判断所述节点是否存在h+1个邻居节点的度不小于h+1;
2)若存在,则h=h+1;
3)若不存在,则H指数为h;
输出:所述网络节点集合V中各节点的H指数。
进一步地,包括:
所述节点K壳索引计算模块24中,所述根据K壳分解方法计算各个节点的K壳索引,具体包括:
输入:所述网络的邻接矩阵;
步骤:首先将网络中度为1的节点剥去,此时剩余网络中可能会出现新的度为1的节点,再将它们剥去,直至剩余网络中再无度为1的节点为止,在此过程中被剥去的所有节点的K壳索引均为1;再以同样的方式剥去剩余网络中度为2的节点,在此过程中被剥去的所有节点的K壳索引均为2;重复此过程,直至网络中再无节点为止;
输出:所述网络节点集合V中各节点的K壳索引。
进一步地,包括:
所述节点R阶邻域计算模块25中,所述根据广度优先搜索方法计算各个节点的R阶邻域,具体包括:
输入:所述网络的邻接矩阵,所述邻域大小R;
步骤:首先搜索与所述节点距离为1的所有节点,再搜索与所述节点距离为2的所有节点,直至搜索完与所述节点距离为R的所有节点后结束;
输出:所述网络节点集合V中各节点的R阶邻域。
进一步地,包括:
所述节点重要性分值计算模块26中,所述各个节点的重要性分值公式为:
其中,k(i)为节点i的度,h(i)为节点i的H指数,ks(i)为节点i的K壳索引,d(i,j)为节点i和节点j之间的距离。
参阅图4所示,本发明实施例中,一种电子设备结构示意图。
本发明实施例提供了一种电子设备,该电子设备可以包括处理器310(CenterProcessing Unit,CPU)、存储器320、输入设备330和输出设备340等。四者通过总线连接,由输入设备330负责读取数据,再将数据通过总线交由处理器310和存储器320进行处理,最后通过总线将处理结果返回到输出设备340。输入设备330可以包括键盘、鼠标、触摸屏等,输出设备340可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器320可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器310提供存储器320中存储的程序指令和数据。在本发明实施例中,存储器320可以用于存储上述地理信息查询方法的程序。
处理器310通过调用存储器320存储的程序指令,处理器310用于按照获得的程序指令执行上述任一种基于多类节点特征的挖掘网络关键节点的方法的步骤。
基于上述实施例,本发明实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施例中的基于多类节点特征的挖掘网络关键节点的方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于多类节点特征的挖掘网络关键节点的方法,其特征在于,该方法包括:
采集网络数据,将网络中的实体抽象为节点,对节点进行编号,得到节点集合V={V1,V2,…,VN},其中,N为节点的总数,记录各个节点与其他节点的连接情况;
根据各个节点的连接情况得到所述网络的邻接矩阵;
根据所述网络中各个节点的连接情况计算各个节点的度,所述节点的度用来刻画节点的邻居个数这一特征;
根据所述节点的度计算各个节点的H指数,所述节点的H指数用来刻画节点的邻居质量这一特征;
根据K壳分解方法计算各个节点的K壳索引,所述节点的K壳索引用来刻画节点是否位于网络的核心位置这一特征;
根据广度优先搜索方法计算各个节点的R阶邻域,所述节点的R阶邻域包含了与该节点距离不大于R的全部节点,用来刻画节点之间的距离这一特征;
根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值,进而得到网络中的关键节点。
2.根据权利要求1所述的基于多类节点特征的挖掘网络关键节点的方法,其特征在于,所述网络的邻接矩阵为:若节点i与节点j之间存在连边,则邻接矩阵的第i行第j列所对应的元素为1,否则为0。
3.根据权利要求1所述的基于多类节点特征的挖掘网络关键节点的方法,其特征在于,所述网络中节点的度等于节点的直接连边数量。
4.根据权利要求1所述的基于多类节点特征的挖掘网络关键节点的方法,其特征在于,所述节点的H指数的计算,具体包括:
输入:所述网络节点集合V中各个节点的度;
步骤:统计所述节点对应的邻居节点的度,所述节点的H指数初始值设置为h=1,重复下述过程:
1)判断所述节点是否存在h+1个邻居节点的度不小于h+1;
2)若存在,则h=h+1;
3)若不存在,则H指数为h;
输出:所述网络节点集合V中各节点的H指数。
5.根据权利要求1所述的基于多类节点特征的挖掘网络关键节点的方法,其特征在于,所述K壳索引的计算,具体包括:
输入:所述网络的邻接矩阵;
步骤:首先将网络中度为1的节点剥去,此时剩余网络中可能会出现新的度为1的节点,再将它们剥去,直至剩余网络中再无度为1的节点为止,在此过程中被剥去的所有节点的K壳索引均为1;再以同样的方式剥去剩余网络中度为2的节点,在此过程中被剥去的所有节点的K壳索引均为2;重复此过程,直至网络中再无节点为止;
输出:所述网络节点集合V中各节点的K壳索引。
6.根据权利要求1所述的基于多类节点特征的挖掘网络关键节点的方法,其特征在于,所述R阶邻域的计算,具体包括:
输入:所述网络的邻接矩阵,邻域大小R;
步骤:首先搜索与节点距离为1的所有节点,再搜索与所述节点距离为2的所有节点,直至搜索完与所述节点距离为R的所有节点后结束;
输出:所述网络节点集合V中各节点的R阶邻域。
8.一种如权利要求1所述的基于多类节点特征的挖掘网络关键节点的方法的装置,其特征在于,包括依次连接的采集模块(20)、邻接矩阵生成模块(21)、节点度计算模块(22)、节点H指数计算模块(23)、节点K壳索引计算模块(24)、节点R阶邻域计算模块(25)和节点重要性分值计算模块(26),
采集模块(20),采集网络数据,将网络中的实体抽象为节点,对节点进行编号,得到节点集合V={V1,V2,…,VN},其中,N为节点的总数,记录各个节点与其他节点的连接情况;
邻接矩阵生成模块(21),根据各个节点的连接情况得到所述网络的邻接矩阵;
节点度计算模块(22),根据所述网络中各个节点的连接情况计算各个节点的度,所述节点的度用来刻画节点的邻居个数这一特征;
节点H指数计算模块(23),根据所述节点的度计算各个节点的H指数,所述节点的H指数用来刻画节点的邻居质量这一特征;
节点K壳索引计算模块(24),根据K壳分解方法计算各个节点的K壳索引,所述节点的K壳索引用来刻画节点是否位于网络的核心位置这一特征;
节点R阶邻域计算模块(25),根据广度优先搜索方法计算各个节点的R阶邻域,所述节点的R阶邻域包含了与该节点距离不大于R的全部节点,用来刻画节点之间的距离这一特征;
节点重要性分值计算模块(26),根据所述网络中各个节点的度、H指数、K壳索引以及R阶邻域计算各个节点的重要性分值,进而得到网络中的关键节点。
9.一种电子设备,其特征在于,包括通过总线连接的处理器(310)、存储器(320)、输入设备(330)和输出设备(340),处理器(310)用于执行计算机程序;存储器(320)用于存储计算机程序;其中,所述计算机程序,用于由所述存储器(320)存储,并由所述处理器(310)加载并执行如权利要求1-7任意一项所述的基于多类节点特征的挖掘网络关键节点的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序被处理器(310)执行时实现如权利要求1-7任意一项所述的基于多类节点特征的挖掘网络关键节点的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211158364.3A CN115563181A (zh) | 2022-09-22 | 2022-09-22 | 一种基于多类节点特征的挖掘网络关键节点的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211158364.3A CN115563181A (zh) | 2022-09-22 | 2022-09-22 | 一种基于多类节点特征的挖掘网络关键节点的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115563181A true CN115563181A (zh) | 2023-01-03 |
Family
ID=84740825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211158364.3A Pending CN115563181A (zh) | 2022-09-22 | 2022-09-22 | 一种基于多类节点特征的挖掘网络关键节点的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115563181A (zh) |
-
2022
- 2022-09-22 CN CN202211158364.3A patent/CN115563181A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190362267A1 (en) | Method of and system for generating a prediction model and determining an accuracy of a prediction model | |
US8112421B2 (en) | Query selection for effectively learning ranking functions | |
WO2021072850A1 (zh) | 特征词提取方法、文本相似度计算方法、装置和设备 | |
CN106844341B (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
CN110213164B (zh) | 一种基于拓扑信息融合的识别网络关键传播者的方法及装置 | |
CN111797214A (zh) | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 | |
CN110083475B (zh) | 一种异常数据的检测方法及装置 | |
CN109145080B (zh) | 一种文本指纹获得方法及装置 | |
CN113326420B (zh) | 问题检索方法、装置、电子设备和介质 | |
CN109062936B (zh) | 一种数据查询方法、计算机可读存储介质及终端设备 | |
CN103714086A (zh) | 用于生成非关系数据库的模式的方法和设备 | |
CN110888981B (zh) | 基于标题的文档聚类方法、装置、终端设备及介质 | |
CN111708942B (zh) | 多媒体资源推送方法、装置、服务器及存储介质 | |
CN110222074A (zh) | 索引查找方法、查找装置、电子设备及存储介质 | |
CN111666468A (zh) | 一种基于团簇属性在社交网络中搜索个性化影响力社区的方法 | |
EP4109293A1 (en) | Data query method and apparatus, electronic device, storage medium, and program product | |
CN114297665A (zh) | 基于深度学习的智能合约漏洞检测方法和装置 | |
JP5939587B2 (ja) | アノテーションの相関を計算する装置及び方法 | |
CN117093556A (zh) | 日志分类方法、装置、计算机设备及计算机可读存储介质 | |
CN115563181A (zh) | 一种基于多类节点特征的挖掘网络关键节点的方法及装置 | |
CN115080552A (zh) | 数据质量评价方法、装置、设备和计算机可读存储介质 | |
CN115794473A (zh) | 一种根因告警的定位方法、装置、设备及介质 | |
CN109324963A (zh) | 自动测试收益结果的方法及终端设备 | |
JP5180894B2 (ja) | 属性表現獲得方法及び装置及びプログラム | |
CN115640376A (zh) | 文本标注方法、装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |