CN103853835A - 基于gpu加速的网络社区检测方法 - Google Patents
基于gpu加速的网络社区检测方法 Download PDFInfo
- Publication number
- CN103853835A CN103853835A CN201410093389.9A CN201410093389A CN103853835A CN 103853835 A CN103853835 A CN 103853835A CN 201410093389 A CN201410093389 A CN 201410093389A CN 103853835 A CN103853835 A CN 103853835A
- Authority
- CN
- China
- Prior art keywords
- row
- network
- matrix
- temporary variable
- gpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 title claims abstract description 13
- 230000001133 acceleration Effects 0.000 title abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 49
- 239000011159 matrix material Substances 0.000 claims description 83
- 230000006870 function Effects 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 208000034189 Sclerosis Diseases 0.000 claims description 3
- 238000004321 preservation Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 abstract 3
- 238000010606 normalization Methods 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于GPU加速的网络社区检测方法,主要解决传统NMF网络社区检测方法的运行时间过长,占用空间过多的问题。其实现过程为:(1)构造网络的邻接矩阵;(2)检查网络类型是否满足要求并对邻接矩阵进行预处理;(3)对预处理之后的邻接矩阵进行稀疏表示;(4)对GPU设备进行初始化;(5)将稀疏表示的邻接矩阵传入到GPU设备中;(6)在GPU中进行网络社区检测;(7)将得到的检测结果从GPU设备传到内存中进行归一化处理,得到网络的重叠划分;(8)由重叠划分得到网络的硬化分。本发明利用GPU对NMF社区检测方法进行并行加速,大幅降低了社区检测的运行时间及存储空间,并可处理更大规模的网络数据。
Description
技术领域
本发明属于网络技术领域,特别涉及一种网络社区的检测方法,用于复杂网络数据的结构分析。
背景技术
当今社会中,人们的生活总是被各种各样的网络所包围,如社交网、生物网、Web网络等。复杂网络可以用图的形式表示,其中图中的节点表示网络中的数据对象,而图中的边则表示网络对象间的连接情况。一个网络可以用G=(V,E,A)来表示,其中V是一个包含着n个节点的集合,E是一个包含m条边的集合,A是一个n×n维的邻接矩阵,Aij代表节点i和节点j之间的边的权重。网络社区检测就是将节点集合V划分到不同的社区中,以得到网络的划分C=(c1,c2,....ck),其中k为社区的个数。在重叠网络社区检测中,一个节点可以属于不同的社区,由规模为n×k的隶属度矩阵M来保存其划分的结果,其中mij代表了第i个节点属于第j个社区的概率。
网络社区检测对分析网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律和预测复杂网络行为有着重要的理论意义和广泛的应用前景。在社交网站中,可以通过对网络中的用户好友信息对用户进行聚类,可以向用户推荐好友;在电子商务领域,将消费者看作节点,在购买过相同产品的消费者之间建立连边,这样处于同一个社区的消费者可能就具有相同的购物兴趣,进而可以有针对性的向其推荐商品。
非负矩阵分解NMF算法是解决网络社区检测问题的一个经典方法。该算法的思想是把网络社区检测的问题看作一个维数约减的问题。对网络的邻接矩阵A进行分解,分解得到两个矩阵W和H相乘,得到的分解之后的矩阵W即为节点属于不同社区的隶属度矩阵。NMF不仅能够得到网络中比较好的划分结果,同时可以得到每个节点属于每个社区的概率,从而可以同时得到网络的重叠以及硬划分结果。因此NMF算法成为了解决网络社区检测问题的一个经典算法并被广泛使用。
NMF算法存在一个严重的缺点即时间复杂度比较高。经过分析发现其时间复杂度为O(n2×k),空间复杂度为O(n2),其中n代表网络中的节点个数,k代表网络的社区数目。当网络规模扩大时,算法运行时间将非常长。因此非常有必要设计并行NMF算法来缩短算法的运行时间。
图形处理器GPU原本是处理计算机图形的专用设备。近十年来,由于高清晰度复杂图形实时处理的要求,GPU发展成为高并行性、多线程、多核的处理器。相比于CPU计算,GPU在进行计算密集型和高度并行性的计算任务上显示了强大的优势。目前,提高CPU性能的主要手段是集成更大的缓存和在同一芯片上集成更多的核,而GPU却可以有效利用晶体管资源,目前主流GPU的运算能力已超过主流通用CPU。传统的基于GPU通用计算的开发方式是将数据打包成纹理,将并行计算任务映射成图形学中的图像着色,使用图形学API进行开发,并利用GPU中的可编程顶点着色单元和像素着色单元作为处理器完成通用计算任务,这个处理过程与图形硬件紧密相关,程序实现非常艰涩并需要大量的底层硬件知识。近年来,利用GPU进行通用计算越来越易于实现,一些标准被相继提出来。
目前的并行程序设计有3种主流框架,分别是CUDA、OpenCL和Direct Compute。本发明采用的是在AMD显卡下的OpenCL平台。OpenCL是由Apple公司提出,并交由Khronos组织进行标准化的开放GPU计算标准语言。OpenCL不仅仅是一种编程语言,更是一个完整的并行编程框架,包括编程语言,API,函数库以及运行时系统来支持软件在整个平台上的开发。在OpenCL编程中,通过核函数来对GPU设备进行编程。核函数运行在GPU上,并完成一个相对独立的功能。由CPU通过运行时函数来调用GPU端的核函数来完成计算。
有学者提出利用GPU设备来对NMF算法进行加速。但是所提出的算法只是对经典NMF模型进行并行。由于网络社区检测问题具有其特殊性:网络邻接矩阵普遍规模比较大而且均为稀疏矩阵而且需要自适应找出划分数目k,套用经典NMF算法往往导致划分结果不佳,加速效果有限,并且不能用于对网络社区的检测。
发明内容
本发明的目的在于针对上述现有方法的不足,提出一种基于GPU加速的网络社区检测方法,以节省计算所需的存储空间,提高社区检测速度。
为实现上述目的,本发明的技术方案包括如下步骤:
(1)构造大小为n×n的网络邻接矩阵A,n为网络中节点的数目;
(2)检查网络是否满足无方向无权重的条件特征,若满足该条件,则去除网络中的孤立节点,即网络中与其他任何节点都没有联系的节点,否则该网络无法处理,退出程序;
(3)对邻接矩阵A采用行格式存储法CSR进行稀疏表示,得到列坐标向量Aj和行首位置向量Ap,同时采用列格式存储法CSC进行稀疏表示,得到行坐标向量Bj和列首位置向量Bp;
(4)利用OpenCL编程框架对GPU设备进行初始化:
选择OpenCL平台,得到OpenCL设备,创建命令队列,创建内存对象,创建OpenCL程序对象,创建核函数对象;
(5)利用0-1之间的随机数分别构造大小为n×k的左分解矩阵W、大小为k×n的右分解矩阵H、大小为1×k的中间向量β,其中k为预设的社区数目,将所述W、H、β、Ap、Aj、Bp和Bj传输到GPU全局内存中,其中,k为初始的网络社区数目;
(6)在GPU中进行网络社区结构检测:
6a)根据上面得到的W、H矩阵以及β向量,计算第一临时变量:T1=W/(1n×nHT+Wdiag(β)),其中1n×n代表大小为n×n的单位矩阵,HT代表H矩阵的转置,diag(β)代表β向量的对角矩阵,/代表矩阵间的点除操作;
6b)根据步骤(2)得到的Ap和Aj,计算第二临时变量:T2=A/(WH),其中A为网络的邻接矩阵;
6c)根据第二临时变量T2,计算第三临时变量:T3=T2*HT;
6d)根据第一临时变量T1和第三临时变量T3对左分解矩阵W进行更新,即
其中·代表两个矩阵的点乘操作,←表示用计算结果替换掉原W矩阵;
6e)计算第四临时变量:T4=(H·H)1n×1,其中1n×1代表大小为n×1的单位向量;
6f)根据步骤6d)得到的左邻接矩阵W,计算第五临时变量:T5=11×n(W·W),其中11×n代表大小为1×n的单位向量;
6g)根据第四临时变量T4及第五临时变量T5对中间向量β中的元素进行更新:β=(2n+a)/(T4+T5+b)其中,分子参数a固定为8,分母参数b固定为2;
6h)根据左分解矩阵W、右分解矩阵H、中间向量β,计算第六临时变量:T6=H/(WT1n×n+diag(β)H),WT代表W矩阵的转置;
6i)根据步骤(2)得到的Bp、Bj,计算第七临时变量:T7=A/(WH);
6j)根据第七临时变量T7计算第八临时变量:T8=WT*T7;
6k)根据第六临时变量T6和第八临时变量T8,对右分解矩阵H进行更新,即:
6l)重复执行步骤6a)到6k)共100次,得到最终的左分解矩阵W';
(7)将最终的左分解矩阵W’通过GPU传到计算机内存中;
(8)在计算机内存中对所述左矩阵W'中的元素按行进行归一化,得到网络的重叠划分矩阵M:
其中,w'ij表示最终的左分解矩阵W'第i行第j列的元素,mij代表重叠划分矩阵M的第i行第j列的元素;
(9)根据重叠划分矩阵M得到网络的重叠划分:对于网络中的第i个节点,若M中第i行的任一元素mij不等于0,则将该节点划分到第j个社区中且隶属概率为mij,否则,该节点不属于第j个社区;
(10)根据网络的重叠划分,将节点划分到隶属概率最大的社区,得到网络的硬化分结果。
本发明具有以下优点:
1,本发明使用非负矩阵分解方法NMF对网络结构进行检测,与现有的网络社区检测技术相比可以同时得到网络的硬划分及重叠划分结果,并可以自适应找到网络的社区数目。
2,本发明采用基于GPU对原非负矩阵分解社区检测方法进行加速,大幅度提升了社区的检测速度。
3,本发明采用行格式存储法CSR与列格式存储法CSC对网络的邻接矩阵进行稀疏表示,节省了处理过程所需的存储空间,使得本发明可处理更大规模的网络数据。
附图说明
图1是本发明的流程图;
图2是用本发明处理两个真实网络的结果图;
图3是用本发明处理科学家协作网络的加速效果示意图。
具体实施方式
下面结合附图,对本发明做进一步的描述。
参照图1,本发明具体实施步骤如下:
步骤1:构造网络邻接矩阵A。
邻接矩阵A的大小为n×n的,n为网络中节点的数目;
若网络中的节点i与节点j有连接时,邻接矩阵A中的第i行第j列的元素aij=1;
若节点i与节点j无连接,则aij=0。
步骤2:检查网络是否满足无方向无权重的条件特征。
若网络同时满足无方向无权重条件,则去除网络中的孤立节点,否则该网络无法处理,退出程序。
网络中的孤立节点是指与其他任何节点都没有联系的节点,若第i个节点是孤立节点,去除该孤立节点是指删除邻接矩阵A中的第i行和第i列的所有元素。
步骤3:对邻接矩阵A采用行格式存储法CSR进行稀疏表示,得到列坐标向量Aj和行首位置向量Ap,同时采用列格式存储法CSC进行稀疏表示,得到行坐标向量Bj和列首位置向量Bp。
3a)将邻接矩阵A的所有非零元素所在的列坐标,按照行优先的顺序保存为列坐标向量Aj;
3b)将邻接矩阵A每行第一个非零元素在Aj中的位置保存到行首位置向量Ap中,并将加入到网络的节点数目作为行首位置向量Ap的最后一个元素;
3c)将邻接矩阵A的所有非零元素所在的行坐标按照列优先的顺序保存为Bj;
3d)将邻接矩阵A每列第一个非零元素在Bj中的位置保存到列首位置向量Bp,并将加入到网络的节点数目作为列首位置向量Bp的最后一个元素。
步骤4:利用OpenCL编程框架对GPU设备进行初始化。
选择OpenCL平台,得到OpenCL设备,创建命令队列,创建内存对象,创建OpenCL程序对象,创建核函数对象。
这一系列操作为OpenCL标准所要求,依次调用OpenCL提供的底层运行时函数来完成。
步骤5:数据初始化。
利用0-1之间的随机数分别构造左分解矩阵W、右分解矩阵H和中间向量β,其中左分解矩阵W的大小为n×k,右分解矩阵H的大小为k×n,中间向量β的大小为1×k,k为预设的社区数目;
将所述左分解矩阵W、右分解矩阵H、中间向量β、列坐标向量Aj、行首位置向量Ap、列首位置向量Bj和列首位置向量Bp传输到GPU的全局内存中。
步骤6:在GPU中进行网络社区检测。
网络社区检测的过程即为对左分解矩阵W、右分解矩阵H、中间向量β多次更新迭代更新的过程,一次迭代需要执行的计算为:
其中,1n×n代表大小为n×n的单位矩阵,HT代表分解右矩阵H的转置,diag(β)代表中间向量β的对角矩阵,·代表两个矩阵的点乘操作,←表示用计算结果对左边变量进行更新,WT代表分解右矩阵W的转置,11×n代表大小为1×n的单位向量,1n×1代表大小为n×1的单位向量,分子参数a固定为8,分母参数b固定为2。
对上述三个公式进行拆解,在GPU中完成各拆解之后的运算,其执行步骤如下:
6a)计算第一临时变量:T1=W/(1n×nHT+Wdiag(β)),本步骤在GPU中的实现方式如下:
6a1)在GPU中开辟n×k个线程,其中n为网络节点的数目,k为初始的社区数目,每个线程负责计算第一临时变量T1中的一个元素;
6a2)在上面开辟的线程中,对于位置为第x行第y列的线程,计算第一临时变量T1中第x行第y列的元素:并将计算结果T1xy写到第一临时变量T1的第x行第y列的位置上,其中hyi代表右分解矩阵H矩阵第y行第i列的元素,βx代表中间向量β的第x个元素,wxy代表左分解矩阵W的第x行第y列的元素;
6b)计算第二临时变量:T2=A/(WH),本步骤在GPU中的实现方式如下:
6b1)在GPU中开辟n×n个线程;
6b2)在步骤6b1)开辟的线程中,对于位置为第x行第y列的线程,计算其负责处理的元素在列坐标向量Aj中的位置:index=Apx+y,及该元素在第二临时变量T2中的行坐标row=x、列坐标col=Ajindex,其中Apx代表行首位置向量Ap的第x个元素,Ajindex代表列坐标向量Aj的第index个元素;
6b3)读取左分解矩阵W第row行的元素,并放到局部内存As中;读取右分解矩阵H中第col列的元素,并放到局部内存Bs中;对这两个内存As与Bs中保存的向量求内积,并对所求内积结果取倒数,将取倒数后的最终结果写到第二临时变量T2的第index个位置上;
6c)计算第三临时变量:T3=T2*HT,本步骤在GPU中的实现方式如下:
6c1)在GPU中开辟n×k个线程;
6c2)在步骤6c1)开辟的线程中,对于位于第x行第y列的线程,计算邻接矩阵A的第x行中非零元素的个数zn=Apx+1-Apx,读取第二临时变量T2中相应的元素并放入局部内存As中,即i=1,2,...,zn,其中As[i]表示局部内存As第i个位置保存的元素值,表示第二临时变量T2中第i+Apx个元素;将分解右矩阵H的第y行元素放入局部内存Bs中,计算第三临时变量T3第x行第y列的元素:
其中,Bs[Ajx]代表局部内存Bs第Ajx个位置保存的元素值,Ajx表示列坐标向量Aj的第x个元素值;
6d)用第一临时变量T1和第三临时变量T3更新左分解矩阵W:
本步骤在GPU中的实现如下:
6d1)在GPU中开辟n×k个线程;
6d2)在步骤6d1)开辟的线程中,对于位置为第x行第y列的线程,计算左分解矩阵W中第x行第y列元素的更新值:其中T1xy代表第一临时变量T1的第x行第y列的元素,T3xy代表第三临时变量T3的第x行第y列的元素,将计算结果写到左分解矩阵W第x行第y列的位置上;
6e)计算第四临时变量:T4=(H·H)1n×1,本步骤在GPU中的实现如下:
6e1)在GPU中开辟k×1个线程;
6f)计算第五临时变量:T5=11×n(W·W),本步骤在GPU中的实现如下:
6f1)在GPU中开辟1×k个线程;
6g)根据第四临时变量T4及第五临时变量T5对中间向量β进行更新,本步骤在GPU中的实现如下:
6g1)在GPU中开辟k×1个线程;
6g2)在步骤6g1)开辟的线程中,对于第x列的线程,计算中间向量β的第x个元素的更新值:其中T4x代表第四临时变量T4的第x个元素,T5x代表第五临时变量T5的第x个元素,将结果写到中间变量β的第x个位置上;
6h)计算第六临时变量:T6=H/(WT1n×n+diag(β)H),本步骤在GPU中的实现如下:
6h1)在GPU中开辟k×n个线程;
6h2)在6h1)中开辟的线程中,对于位置为第x行第y列的线程,计算第六临时变量T6中第x行第y列的元素:并将计算结果T6xy写到第六临时变量T6的第x行第y列的位置上,其中βy代表中间变量β的第y个元素;
6i)计算第七临时变量:T7=A/(WH),本步骤在GPU中的实现如下:
6i1)在GPU中开辟n×n个线程;
6i2)在步骤6i1)开辟的线程中,对于位置为第x行第y列的线程,计算其负责处理的元素在行坐标向量Bj中的位置:Index=Bpy+x,及该元素在第七临时变量T7中的行坐标Row=BjIndex、列坐标Col=y,其中Bpy代表列首位置向量Bp的第y个元素,BjIndex代表行坐标向量Bj的第Index个元素;
6i3)读取左分解矩阵W第Row行的元素,并放到局部内存As中;读取右分解矩阵H中第Col列的元素,并放到局部内存Bs中;对这两个内存As与Bs中保存的向量求内积,并对所求内积结果取倒数,将取倒数后的最终结果写到第七临时变量T7的第Index个位置上;
6j)计算第八临时变量:T8=WT*T7,本步骤在GPU中的实现如下:
6j1)在GPU中开辟k×n个线程;
6j2)在步骤6j1)开辟的线程中,对于位于第x行第y列的线程,计算邻接矩阵A的第y列中非零元素的个数Zn=Bpy+1-Bpy,读取左分解矩阵W第x列的元素放入局部内存As中,读取第七临时变量T7中的相应元素并放入局部内存Bs中,即i=1,2,...,Zn,其中Bs[i]表示局部内存Bs第i个位置保存的元素值,表示第七临时变量T7中的第i+Bpy个元素;计算第八临时变量T8第x行第y列的元素:
其中As[Bjy]代表局部内存As中第Bjy个位置保存的元素值,Bjy表示行坐标向量Bj的第y个元素;
6k)用第六临时变量T6和第八临时变量T8更新右分解矩阵H:
本步骤在GPU中的实现如下:
6k1)在GPU中开辟n×k个线程;
6k2)在步骤6k1)开辟的线程中,对于位置为第x行第y列的线程,计算左分解矩阵H中第x行第y列元素的更新值:其中T6xy代表第六临时变量T6的第x行第y列的元素,T8xy代表第三临时变量T8的第x行第y列的元素,将计算结果写到左分解矩阵H第x行第y列的位置上;
6l)重复执行步骤6a)到6k)共100次,得到最终的左分解矩阵W';
步骤7:将最终的左分解矩阵W’通过GPU传到计算机内存中,在计算机内存中对该最终的左分解矩阵W'中的元素按行进行归一化,得到网络的重叠划分矩阵M:
其中,w'ij表示最终的左分解矩阵W'第i行第j列的元素,mij代表重叠划分矩阵M的第i行第j列的元素。
步骤8:根据重叠划分矩阵M得到网络的重叠划分。
对于网络中的第i个节点,若M中第i行的任一元素mij不等于0,则将该节点划分到第j个社区中且隶属概率为mij,否则,该节点不属于第j个社区。
步骤9:根据网络的重叠划分,将节点划分到隶属概率最大的社区,得到网络的硬化分结果。
本发明的效果可通过以下仿真进一步说明:
1仿真内容:应用本发明方法对12种不同的网络进行处理,并使用原始NMF算法进行对比。测试本发明方法得到的网络社区结构的有效性,以及其相对于原始NMF算法的加速效果。
2.仿真条件:
本发明的仿真硬件环境:CPU为AMD4Dual Core2.8GHz,内存为32GB DDR2,GPU为AMD Radeon HD77701GHz显存为1GB DDR5;
本发明的仿真软件环境:编译环境为Microsoft Visual Studio2010,GPU端代码标准为OpenCL1.2版本,操作系统为Windows764位系统。
3仿真实验结果
仿真1.本发明方法进行网络社区检测,测试其有效性。
将本发明方法应用于12种不同规模的网络中,用评价指标NMI和模块度Q来测试所得结果的准确性。结果在表1中给出,左边三列中是人工的网络数据的结果,右列两列为真实网络数据的结果。从表中的结果可以看出算法对于人工网络和真实网络均可以得到比较好的结果。图2给出其中两个网络的具体划分结果,其中图2(a)是Netscience网络的一部分划分结果,图2(b)是LFR500网络的社区结构,在图2中用虚线椭圆框来标记划分结果,两个节点在不同框内代表它们被划分到不同的社区。从该图可以看出,本发明方法可以得到比较合理的网络社区划分。
表1.采用发明方法对处理12种网络的结果
人工网络 | Q | NMI | 真实网络 | Q |
Benchmark | 0.4501 | 1 | 0.62 | |
LFR(500) | 0.8131 | 1 | 0.5312 | |
LFR(1000) | 0.9039 | 0.9714 | NetScience | 0.905 |
LFR(5000) | 0.9075 | 0.9435 | Power | 0.599 |
LFR(10000) | 0.8599 | 0.9329 | Scientists | 0.647 |
LFR(50000) | 0.8999 | 0.9191 | Hep | 0.7716 |
仿真2.测试本发明方法相比于原始NMF方法的加速效果
在表2中统计了原始NMF算法和本发明方法在处理上述12种数据花费的时间,其中n代表网络的节点数目,k代表初始的社区数目,TNMF代表原NMF方法处理该网络需要的时间,TSNMF代表本发明方法处理该网络需要的时间,时间单位均为秒,加速比speedup ratio等于TNMF/TSNMF表示本发明方法相对于原NMF方法的加速性能。表2中的*号表示由于运行时间以及存储空间的限制,该算法对该网络无法处理,也无法计算加速比。
表2.采用发明方法对处理8种网络的加速效果
由表2可知,本发明方法取得了较高的加速比,如对于节点数目为5000的LFR网络,原始NMF方法的运行时间超过8个小时,本发明方法运行时间仅为71秒。原始NMF方法对节点数5000以上的网络便很难进行处理,而本发明可以处理超过50000万个节点的网络。另外,从表格的最后一列可以看出本发明方法的加速比会随着网络规模的增大而提高。
仿真3.测试初始社区数目k对本发明方法加速性能的影响
本仿真选择Netscience网络为例进行测试,图3给出了本发明方法在不同的k值下所达到的加速比。从该图看出本发明方法的加速比随着k值的增大而增大。k取256时,加速比已经达到了381,远大于k取64时的201。因此,利用本发明方法可以有效缓解k值增大对算法运行时间的影响。在实际网络划分中,社区数目普遍比较高,这一效果会更加明显。
Claims (4)
1.一种基于GPU加速的网络社区检测方法,包括如下步骤:
(1)构造大小为n×n的网络邻接矩阵A,n为网络中节点的数目;
(2)检查网络是否满足无方向无权重的条件特征,若满足该条件,则去除网络中的孤立节点,即网络中与其他任何节点都没有联系的节点,否则该网络无法处理,退出程序;
(3)对邻接矩阵A采用行格式存储法CSR进行稀疏表示,得到列坐标向量Aj和行首位置向量Ap,同时采用列格式存储法CSC进行稀疏表示,得到行坐标向量Bj和列首位置向量Bp;
(4)利用OpenCL编程框架对GPU设备进行初始化:
选择OpenCL平台,得到OpenCL设备,创建命令队列,创建内存对象,创建OpenCL程序对象,创建核函数对象;
(5)利用0-1之间的随机数分别构造大小为n×k的左分解矩阵W、大小为k×n的右分解矩阵H、大小为1×k的中间向量β,其中k为预设的社区数目,将所述W、H、β、Ap、Aj、Bp和Bj传输到GPU全局内存中;
(6)在GPU中进行网络社区结构检测:
6a)根据上面得到的W、H矩阵以及β向量,计算第一临时变量:T1=W/(1n×nHT+Wdiag(β)),其中1n×n代表大小为n×n的单位矩阵,HT代表H矩阵的转置,diag(β)代表β向量的对角矩阵,/代表矩阵间的点除操作;
6b)根据步骤(2)得到的Ap和Aj,计算第二临时变量:T2=A/(WH),其中A为网络的邻接矩阵;
6c)根据第二临时变量T2,计算第三临时变量:T3=T2*HT;
6d)根据第一临时变量T1和第三临时变量T3对左分解矩阵W进行更新,
即
其中·代表两个矩阵的点乘操作,←表示用计算结果替换掉原W矩阵;
6e)计算第四临时变量:T4=(H·H)1n×1,其中1n×1代表大小为n×1的单位向量;
6f)根据步骤6d)得到的左邻接矩阵W,计算第五临时变量:T5=11×n(W·W),其中11×n代表大小为1×n的单位向量;
6g)根据第四临时变量T4及第五临时变量T5对中间向量β进行更新:β=(2n+a)/(T4+T5+b)
其中,分子参数a固定为8,分母参数b固定为2;
6h)根据左分解矩阵W、右分解矩阵H、中间向量β,计算第六临时变量:T6=H/(WT1n×n+diag(β)H),WT代表W矩阵的转置;
6i)根据步骤(2)得到的Bp、Bj,计算第七临时变量:T7=A/(WH);
6j)根据第七临时变量T7计算第八临时变量:T8=WT*T7;
6k)根据第六临时变量T6和第八临时变量T8,对右分解矩阵H进行更新,即:
6l)重复执行步骤6a)到6k)共100次,得到最终的左分解矩阵W';
(7)将最终的左分解矩阵W’通过GPU传到计算机内存中,对该最终的左分解矩阵W'中元素按行进行归一化,得到网络的重叠划分矩阵M:
其中,w'ij表示最终的左分解矩阵W'第i行第j列的元素,mij代表重叠划分矩阵M的第i行第j列的元素;
(8)根据重叠划分矩阵M得到网络的重叠划分:对于网络中的第i个节点,若M中第i行的任一元素mij不等于0,则将该节点划分到第j个社区中且隶属概率为mij,否则,该节点不属于第j个社区;
(9)根据网络的重叠划分,将节点划分到隶属概率最大的社区,得到网络的硬化分结果。
3.根据权利要求书1所述的基于GPU加速的网络社区检测方法,其特征在于,步骤6b)所述的计算T2操作,按如下步骤进行:
6b1)在GPU中开辟n×n个线程;
6b2)在上面开辟的线程中,对于位置为第x行第y列的线程,计算其负责处理的元素在列坐标向量Aj中的位置:index=Apx+y,及该元素在结果矩阵中的行坐标row=x、列坐标col=Ajindex,其中Apx代表行首位置向量Ap的第x个元素,Ajindex代表列坐标向量Aj的第index个元素;
6b3)读取左分解矩阵W第row行的元素,并放到局部内存As中,读取右分解矩阵H中第col列的元素,并放到局部内存Bs中,对As与Bs中保存的向量求内积,对所求内积结果取倒数,将最终结果写到第二临时变量T2的第index个位置上。
4.根据权利要求书1所述的基于GPU加速的网络社区检测方法,其特征在于,步骤6c)所述的计算第三临时变量T3,按如下步骤进行:
6c1)在GPU中开辟n×k个线程;
6c2)在上面开辟的线程中,对于位于第x行第y列的线程,计算邻接矩阵A的第x行中非零元素的个数zn=Apx+1-Apx,读取第二临时变量T2中相应的元素并放入局部内存As中,即i=1,2,...,zn,其中As[i]表示局部内存As第i个位置保存的元素值,表示第二临时变量T2中第i+Apx个元素,将H矩阵的第y行元素放入局部内存Bs中,计算第三临时变量T3第x行第y列的元素:
其中,Bs[Ajx]代表Bs第Ajx个位置保存的元素值,Ajx表示列坐标向量Aj的第x个元素值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410093389.9A CN103853835B (zh) | 2014-03-14 | 2014-03-14 | 基于gpu加速的网络社区检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410093389.9A CN103853835B (zh) | 2014-03-14 | 2014-03-14 | 基于gpu加速的网络社区检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103853835A true CN103853835A (zh) | 2014-06-11 |
CN103853835B CN103853835B (zh) | 2017-03-29 |
Family
ID=50861490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410093389.9A Expired - Fee Related CN103853835B (zh) | 2014-03-14 | 2014-03-14 | 基于gpu加速的网络社区检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103853835B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318522A (zh) * | 2014-10-08 | 2015-01-28 | 苏州新视线文化科技发展有限公司 | 一种基于图形处理单元的稀疏表示快速计算方法 |
CN105068971A (zh) * | 2015-07-27 | 2015-11-18 | 东南大学 | 一种向量点积的OpenCL自动化实现方法 |
CN108140061A (zh) * | 2015-06-05 | 2018-06-08 | 凯撒斯劳滕工业大学 | 网络模体的自动确定 |
CN109558888A (zh) * | 2017-09-27 | 2019-04-02 | 武汉嫦娥信息科技有限公司 | 一种高光谱遥感图像分类的并行化加速算法 |
CN110191001A (zh) * | 2019-06-10 | 2019-08-30 | 南京大学 | 在具有可选毫米波链路的数据中心网络中的拓扑推测方法 |
CN110535681A (zh) * | 2019-07-18 | 2019-12-03 | 西安电子科技大学 | 基于开放运算语言OpenCL并行的重叠社区检测方法 |
US10572501B2 (en) | 2015-12-28 | 2020-02-25 | International Business Machines Corporation | Steering graph mining algorithms applied to complex networks |
CN112236760A (zh) * | 2018-07-27 | 2021-01-15 | 浙江天猫技术有限公司 | 一种图数据的更新方法、系统、计算机可读存储介质及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102456062A (zh) * | 2010-11-04 | 2012-05-16 | 中国人民解放军国防科学技术大学 | 社区相似度计算方法与社会网络合作模式发现方法 |
CN102722639A (zh) * | 2012-05-21 | 2012-10-10 | 西安电子科技大学 | 基于进化计算对社会系统进行社区检测的方法 |
CN102722750A (zh) * | 2012-06-06 | 2012-10-10 | 清华大学 | 动态网络社区结构的更新方法及装置 |
-
2014
- 2014-03-14 CN CN201410093389.9A patent/CN103853835B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102456062A (zh) * | 2010-11-04 | 2012-05-16 | 中国人民解放军国防科学技术大学 | 社区相似度计算方法与社会网络合作模式发现方法 |
CN102722639A (zh) * | 2012-05-21 | 2012-10-10 | 西安电子科技大学 | 基于进化计算对社会系统进行社区检测的方法 |
CN102722750A (zh) * | 2012-06-06 | 2012-10-10 | 清华大学 | 动态网络社区结构的更新方法及装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104318522A (zh) * | 2014-10-08 | 2015-01-28 | 苏州新视线文化科技发展有限公司 | 一种基于图形处理单元的稀疏表示快速计算方法 |
CN108140061A (zh) * | 2015-06-05 | 2018-06-08 | 凯撒斯劳滕工业大学 | 网络模体的自动确定 |
CN108140061B (zh) * | 2015-06-05 | 2021-07-20 | 凯撒斯劳滕工业大学 | 确定图中的同现率的方法、存储介质和系统 |
CN105068971A (zh) * | 2015-07-27 | 2015-11-18 | 东南大学 | 一种向量点积的OpenCL自动化实现方法 |
US10572501B2 (en) | 2015-12-28 | 2020-02-25 | International Business Machines Corporation | Steering graph mining algorithms applied to complex networks |
CN109558888A (zh) * | 2017-09-27 | 2019-04-02 | 武汉嫦娥信息科技有限公司 | 一种高光谱遥感图像分类的并行化加速算法 |
CN112236760A (zh) * | 2018-07-27 | 2021-01-15 | 浙江天猫技术有限公司 | 一种图数据的更新方法、系统、计算机可读存储介质及设备 |
CN112236760B (zh) * | 2018-07-27 | 2024-06-07 | 浙江天猫技术有限公司 | 一种图数据的更新方法、系统、计算机可读存储介质及设备 |
CN110191001A (zh) * | 2019-06-10 | 2019-08-30 | 南京大学 | 在具有可选毫米波链路的数据中心网络中的拓扑推测方法 |
CN110191001B (zh) * | 2019-06-10 | 2020-06-30 | 南京大学 | 在具有可选毫米波链路的数据中心网络中的拓扑推测方法 |
CN110535681A (zh) * | 2019-07-18 | 2019-12-03 | 西安电子科技大学 | 基于开放运算语言OpenCL并行的重叠社区检测方法 |
CN110535681B (zh) * | 2019-07-18 | 2021-04-27 | 西安电子科技大学 | 基于开放运算语言OpenCL并行的重叠社区检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103853835B (zh) | 2017-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103853835B (zh) | 基于gpu加速的网络社区检测方法 | |
Van Niekerk et al. | New frontiers in Bayesian modeling using the INLA package in R | |
Ajdari et al. | An adaptive exploration-exploitation algorithm for constructing metamodels in random simulation using a novel sequential experimental design | |
CN106651016B (zh) | 一种热点话题下动态预测用户行为的系统及方法 | |
Ribeiro et al. | Parallel discovery of network motifs | |
Bauer et al. | Fast event-based epidemiological simulations on national scales | |
Matilainen et al. | Employing a Monte Carlo algorithm in Newton-type methods for restricted maximum likelihood estimation of genetic parameters | |
Grurl et al. | Arrays vs. decision diagrams: A case study on quantum circuit simulators | |
Torkamani et al. | Bayesian compressive sensing using wavelet based Markov random fields | |
Mitra | On the capabilities of cellular automata-based MapReduce model in industry 4.0 | |
CN110378543A (zh) | 离职风险预测方法、装置、计算机设备和存储介质 | |
Aletti et al. | Opinion dynamics on graphon: The piecewise constant case | |
Sommer et al. | Reduce–factor–solve for fast Thevenin impedance computation and network reduction | |
Cossell et al. | Concurrent dynamic programming for grid-based problems and its application for real-time path planning | |
Waites | Pyvacy: Towards practical differential privacy for deep learning | |
Hassani et al. | Analysis of sparse matrix-vector multiplication using iterative method in CUDA | |
Marques et al. | Distributed learning of CNNs on heterogeneous CPU/GPU architectures | |
Fratarcangeli et al. | A gpu-based implementation of position based dynamics for interactive deformable bodies | |
CN115544307A (zh) | 基于关联矩阵的有向图数据特征提取与表达方法和系统 | |
Sane et al. | Investigating in situ reduction via lagrangian representations for cosmology and seismology applications | |
Sanfui et al. | Symbolic and numeric kernel division for graphics processing unit-based finite element analysis assembly of regular meshes with modified sparse storage formats | |
Shirke et al. | Two-sample nonparametric test for testing equality of locations based on data depth | |
CN111310266B (zh) | 建筑信息模型产品的几何数据分割方法 | |
Vlassopoulos et al. | An FPGA design for the stochastic Greenberg-Hastings cellular automata | |
Chang et al. | A hybrid data-driven-physics-constrained Gaussian process regression framework with deep kernel for uncertainty quantification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170329 |