CN104484825A - 社交网络社区影响力评估算法 - Google Patents

社交网络社区影响力评估算法 Download PDF

Info

Publication number
CN104484825A
CN104484825A CN201410740284.8A CN201410740284A CN104484825A CN 104484825 A CN104484825 A CN 104484825A CN 201410740284 A CN201410740284 A CN 201410740284A CN 104484825 A CN104484825 A CN 104484825A
Authority
CN
China
Prior art keywords
community
user
subject information
influence
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410740284.8A
Other languages
English (en)
Inventor
张波
杨涛
宋倩倩
宋锋
胡斯卉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Normal University
Third Research Institute of the Ministry of Public Security
University of Shanghai for Science and Technology
Original Assignee
Shanghai Normal University
Third Research Institute of the Ministry of Public Security
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Normal University, Third Research Institute of the Ministry of Public Security filed Critical Shanghai Normal University
Priority to CN201410740284.8A priority Critical patent/CN104484825A/zh
Publication of CN104484825A publication Critical patent/CN104484825A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明社交网络社区影响力评估算法,是基于图论方法基础上的发展与应用,涉及社交网络技术领域。本发明第一、定义社交网络与社区影响力相关的概念及建模;第二、计算出用户传播主题信息的意愿、社区用户综合影响、社区用户数量、社区用户规模,再综合计算出社区影响力;第三、计算出社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力;第四、将计算出的社区影响力、社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,用于评估各社区间的影响力、节点对社区的重要性以及社区对节点作用。基于此,本发明对人人网,微博等社交网络影响进行评估,为更好传播信息以及网络安全等具有实际应用的前景。

Description

社交网络社区影响力评估算法
技术领域
本发明涉及社交网络技术领域,更具体的说是社交网络社区影响力评估算法。
背景技术
近年来,随着人们对获取信息和传递信息的需求越来越大,而社交网络又是满足人们这些需求的良好媒介,从而使得社交网络得到了迅速的发展,社交网络是由每个相对独立的用户组成的一个复杂的虚拟社会,它是当前互联网最热门的网络应用,深刻的改变了互联网信息传播的规则和方式,目前具有代表性的社交网络有:人人网,开心网,Facebook,Twitter等。
与真实的社会网络相同,社区是方便用户交流的重要元素,例如兴趣分享、主题讨论等。因此,社区将会对用户的观点、感受、决定产生影响,并且影响力越大的社区对社交网络的影响越大。因此,社区影响力的评估是对社交网络研究的关键挑战。社区影响力的研究有利于更好地管控网络带来的负面因素以及更好地利用网络带来的正面效应。如网络舆情监控中如何有效地防止各种有害信息在网络中迅速传播;商业领域的“口碑效应”和“病毒式营销”引出的影响力最大化问题等。
目前,国内外许多学者都对社交网络的社区挖掘及用户影响力进行了研究,但很少对社区的影响力进行探讨。社区影响力是对社区内的用户以及用户之间的交互形成的相互影响的一种综合,也是对社区的质量等进行评估的一种方法。社区是社交网络中的一个重要的组成元素,它的作用是可以找到更多兴趣相同的朋友,而对社区的影响力进行评估,对稳定和发展社区有着至关重要的作用。近年来,对社区的研究已经开展了很多,潘磊等人基于边社区的思想,考虑每条边在网络中所归属的局部边社区,提出了基于局部信息的边社区挖掘算法;黄发良等人在给出的社交网络及社区挖掘的形成定义的基础上,提出了一个基于启发式策略的在线社交网络社区挖掘框架;杨长春等人研究微博社区中博主的交互行为,构建微博社区网络,建立评价指标,评价微博博主在网络中的影响力;肖宇等人研究特定区域的人群在社交网络中的信息传播行为,对用户的影响力进行评估,提出了社交网络中用户区域影响力评估算法;张波等人提出了基于信任的社会网络最大化影响节点的计算方法,该方法引入信任这一元素,考虑信任对节点的重要影响,将节点之间的信任度和影响值结合,得出综合影响值,再根据综合影响值得出社会网络影响最大化节点,对节点影响的计算是由节点的出度和节点间边的权重组成的。上述研究都没有对社区影响力进行评估,但是为社交网络中社区影响力的评估提供了一定的基础。
发明内容
本发明的目的针对现有技术中存在的缺失和不足,提出社交网络社区影响力评估算法。
本发明在现有的社区以及对区域内的用户影响力的评估的基础上,提出了一种社区影响力评估算法。计算出社区影响力后还作了相关方面的延伸,由三个因素组成:社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力。本发明,提出一种社区影响力评估算法,其基本流程(如图1所示):
首先,通过分析用户以往的接收和传播主题信息的情况,得出平均用户传播主题信息的意愿,对用户传播主题信息及发布信息等的情况计算出用户影响力,根据社区内所有用户的综合影响、社区用户数量、社区用户规模计算出社区影响力。
其次,根据计算出的社区内用户的平均用户传播主题信息的意愿及社区内节点受其他用户发布主题信息的影响情况计算出社区对社区内节点的影响力;根据计算出的社区内用户的平均用户传播主题信息的意愿及社区外节点受社区内用户发布主题信息的影响情况计算出社区对社区外节点的影响力;根据计算出的社区内的用户的平均用户传播主题信息的意愿及社区的重叠与否,分别计算出非重叠社区的社区对社区的影响力和重叠社区的社区对社区的影响力。
最后,将计算出的社区影响力、社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,用于评估各社区间的影响力、节点对社区的重要性以及社区对节点作用。
本发明社交网络社区影响力评估算法,具体步骤为:
A.定义社交网络与社区影响力相关的概念及建模。
B.基础阶段:(1)分别统计用户接收和传播主题信息的次数,计算出平均用户传播主题信息的意愿(2)根据社区内平均用户传播主题信息的意愿及用户影响力,计算出社区内所有用户的综合影响;统计社区内的用户数量,得出社区用户数量;根据用户间的关系,计算出社区的用户规模(3)结合上述计算出的社区内所有用户的综合影响、社区的用户数量,以及统计出的社区的用户规模,计算出社区影响力。
C.延伸阶段:(1)社区内节点受其他用户发布主题信息的影响情况计算出社区对社区内节点的影响力(2)根据计算出的社区内用户的平均用户传播主题信息的意愿及社区外节点受社区内用户发布主题信息的影响情况计算出社区对社区外节点的影响力(3)根据计算出的社区内的用户的平均用户传播主题信息的意愿及社区的重叠与否,分别计算出非重叠社区的社区对社区的影响力和重叠社区的社区对社区的影响力。
D.将计算出的社区影响力、社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,用于评估各社区间的影响力、节点对社区的重要性以及社区对节点作用。
其中,所述步骤A的具体过程为:
社交网络模型:社交网络形式化为一个二分图,G=(V,E),V代表社交网络中的用户集合,E用来描述用户间的关系的集合。
社区模型:社区是由拥有相同兴趣爱好的用户组成,并且是社交网络的一个子图,C=<CV,CE>,当用户属于社区可以表示为:社区用户间的关系可以表示为:
根据社区间是否拥有共同用户,将社区分为非重叠社区和重叠社区
(1)非重叠社区:如果社区中的所有用户均不属于另一社区,则该社区与另一社区为非重叠社区,非重叠社区表示为:NC=<SV,CE>, SV ⊆ V , CE ⊆ E .
(2)重叠社区:如果一个社区中的至少有一个用户同时也属于另一社区,则两个社区为重叠社区,重叠社区表示为:OC=<MCV,SCV,CE>, MVC ⊆ V , SCV ⊆ V , CE ⊆ E .
根据上述的非重叠社区和重叠社区,得出下列属性:
∀ v i , v j ∈ C . CV ^ ∃ e ( v i , v j ) → ∀ e ( v i , v j ) ∈ C . CE ;
∀ e ( v i , v j ) ∈ C . CE ^ → ∀ v i , v j ∈ C . CV ;
社区影响力评估算法:根据给出的社区模型以及与它相关的社交网络的信息来评估社区的影响力,社区影响力评估算法表示为:CI(Ci)=f(G,Ci),CI(Ci)表示社区Ci的影响力,f(G,Ci)表示该模型是基于G和Ci
用户影响力:每个用户在其所在的社区内存在一定的影响力,而用户的影响力是通过用户发布的信息影响的人数来衡量的,用户发布的信息影响的人数即转发或分享该信息的总人数,用户发布的信息,不仅会影响到社区内的用户,还会影响社区外的用户,UI的取值在0到1之间,UI的值越大,表示用户的影响力越大。
社区影响力:当兴趣爱好相同的人聚集形成社区时,社区就会形成一定的影响力,社区影响力是对社区内用户影响力的综合;
如述,社交网络是由多个重叠或非重叠社区组成,社区是由用户组成,每个用户是一个用户节点,每个用户节点可能属于一个或多个社区,为了便于分析,作出如下定义:
每一条主题信息j在社交网络中传播,都会形成一个图gj,社交网络中,有n个主题,且主题的数量随着时间的推移,在不断的增加,所以需要不停地对信息进行更新,主题S的集合表示为:S={s1,s2,s3......sn},主题S传播过程中形成的图的集合表示为:g={g1,g2,g3......gn}。
平均用户传播主题信息的意愿:每条主题信息由发布者开始传播,用户在面对该主题信息时,决定是否愿意传播下去,如果用户转发或分享,则说明用户愿意对该主题信息进行传播;反之,则不愿意,将用户对多条主题信息的反应综合,形成平均用户传播信息的意愿。
社区对社区内节点的影响:社区对社区内节点的影响是社区内的用户受到社区内其他用户的影响。
社区对社区外节点的影响力:社区内的用户发布的信息,在影响社区内的用户的同时,也可能对社区外的节点产生影响,将社区看作一个整体,社区对社区外节点的影响力即看作是节点对节点的影响力;
社区对社区的影响力:社交网络中的社区与社区之间由于用户之间的交互,使得社区与社区之间存在影响力。
其中,所述步骤B的具体过程为:
用户在接收到主题信息时,可能传播下去,也可能不传播下去。同时,用户接收到该主题信息的途径可能有多个,可能从一个或多个用户那接收到该信息,用户u对主题信息j的标记为:
用户u接收主题信息的次数,初始值为0,若此时用户u对主题信息j的标记为1,则用户u接收主题信息的次数加1。虽然用户u可能从多个用户那接收到主题信息j,但是,用户u对主题信息j的累加只进行一次,用户u对主题信息j的传播,是通过观察图gj
pro us j = 0 , if out deg ree ( u ) = 0 1 , if out deg ree ( u ) > 0 - - - ( 2 )
其中,为0时,表明用户未对该主题信息进行传播;为1时,表明用户对该主题信息进行传播。当用户u的出度大于0时,说明用户u对主题信息j进行传播。平均用户传播主题信息的意愿,作出了如下定义:
AP ( u ) = θ × Pro u Ac S u + ( 1 - θ ) × Σ s ∈ S ( u ) , g ∈ g ( u ) ( Σ v ∈ A ( u ) AP ( v ) × w ( v ) + Σ b ∈ B ( u ) AP ( b ) × w ( b ) ) num S - - - ( 3 )
AcS u = Σ s ∈ S M us j , Pro u = Σ s ∈ S pro us j , w ( v ) = 1 outdegree ( v ) , w ( b ) = a × 1 outdegree ( b )
α = t out → in t ac × num C i
AP(u)为用户u平均传播主题信息的意愿;θ为综合因子,且θ∈[0,1];Prou为用户传播主题信息的总次数;AcSu为用户接收主题信息的总次数;集合A(u)为社区内指向用户u的节点,v∈A(u)为节点v指向u被存放于集合A(u);集合B(u)为社区外指向用户u的节点,b∈B(u)为社区外节点b指向u被存放于集合;每条主题信息的传播,都会形成一个新的图,S(u),g(u)分别为为节点u发布的主题信息的集合,发布主题信息后形成的主题信息传播图的集合,对每个新图的指向u的节点和社区外节点对节点u产生的影响进行计算综合;w(v),w(b)分别为节点v和节点b的权重,而w(v)和w(b)是通过节点的出度来衡量的;α为社区外节点对社区内节点的影响系数。tout→in表示社区外节点指向社区内节点的次数,tac表示社区内节点指向社区外节点的次数,表示社区内用户的数量。这里,假设AP(u)的初值为1。
以上对平均用户传播主题信息的意愿的计算是通过将用户自身传播信息的意愿和社区内以及社区外节点对用户的影响进行综合,得出客观的平均用户传播信息的意愿。
(1)用户影响力的计算
用户发布的主题信息,将会对社区内和社区外的用户产生影响,对用户影响力,作出了如下定义:
UI ( u ) = ξ Σ r ∈ S ( u ) ( sum in . r + β × sum out . r ) - - - ( 4 )
β = t ac - c t ac × num out , ξ = 1 num C i num S ( u )
其中,UI(u)为用户u的影响力;S(u)为用户u发布的主题信息的集合;sumin.r为r条主题信息影响的社区内人数;sumout.r为r条主题信息影响的社区外人数;β为社区内节点对社区外节点的影响系数;tac-c表示社区内用户指向社区外用户的次数,tac表示社区外用户接收社区内主题信息的次数,numout表示社区外用户的数量,ξ为用户影响力的影响因子,表示社区内用户的数量,numS(u)表示用户u发布的主题信息的次数。如果用户从未发布过信息,假设用户的影响力为0.01。
根据用户发布的所有主题信息,对社区内和社区外产生影响的总人数的综合得出用户影响力。
(2)社区影响力计算
相对于社区外的用户而言,社区又被看作一个整体,则整体就有其特有的影响力,包括如下因素:
①社区内用户的综合影响
社区内用户的综合影响,定义为如下:
UII ( C i ) = ∫ 0 t ( Σ u ∈ I ( u ) AP ( u ) × UI ( u ) ) dt - - - ( 5 )
UII(Ci)是社区Ci的用户综合影响;I(u)是社区内用户的集合;AP(u)是用户u的平均传播主题信息的意愿;UI(u)是用户u的用户影响力。
②社区用户的数量
社区用户的数量是社区内存在的用户的数量,在计算社区影响力时起着至关重要的作用,如果不考虑该因素,则不同的社区可能有相同的社区影响力,这是不合理的。
③社区用户规模
社区用户规模是用户间的关系,通过用户的出度来确定,社区用户规模,定义为如下:
US ( C i ) = Σ u ∈ I ( u ) outdegree ( u ) - - - ( 6 )
US(Ci)是社区Ci的用户规模。outdegree(u)是用户u的出度。
综合上述三个因素,得出社区影响力,社区影响力定义如下:
CI(Ci)=M×UII(Ci)+N×NU+(1-M-N)×US(Ci)   (7)
其中,M和N是影响因素,因为在不同的社区影响力评估算法中各个影响因素的重要性不同,M和N可根据实际情况进行取值。
其中,所述步骤C的具体过程为:
(1)社区对社区内的用户的影响力计算
社区对社区内的用户的影响力定义如下:
ICNI ( h ) = Σ u ∈ ( I ( u ) - { h } ) , AP ( u ) × ( Σ s ∈ S ( u ) , g ∈ g ( u ) influ ) - - - ( 8 )
假设节点h在社区内。I(u)是社区内节点的集合,I(u)-{h}表示节点h不在集合内;influ用来标记节点h是否被用户u发布的影响影响,如果节点h被主题信息s影响,influ则是1,否则influ是0。
社区对社区内节点的影响力的计算是将社区外节点受到社区内节点发布信息的影响和社区内用户影响力综合。
(2)社区对社区外用户的影响力的计算
由于社区是由许多用户组成的群体,这个群体势必会对社区外的节点产生影响力,社区对社区外节点的影响力,作出了如下定义:
假设节点q为社区外节点。
ICTN ( q ) = β × Σ u ∈ I ( u ) AP ( u ) × ( Σ s ∈ S ( u ) , g ∈ g ( u ) inf s ) - - - ( 9 )
其中,ICTN(q)为社区对社区外节点q的影响力;β为社区内节点对社区外节点的影响系数;C(u)为社区内用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(u),g(u)分别为为节点u发布的主题信息的集合,发布主题信息后形成的主题信息传播图的集合;infs为用户u发布的主题信息对节点q的影响,若主题信息s对用户产生影响,则infs为1,反之,则infs为0。
上述社区对社区外节点的影响力,根据社区内所有节点发布的主题信息,对社区外节点产生影响和社区内节点的平均传播主题信息的意愿综合得出。
(3)社区对社区影响力的计算
a.非重叠社区
社区GA和社区GB是重叠社区,对GA对社区GB的影响力,作出了如下定义:
ICTC ( C A → C B ) = β × Σ u ∈ D ( C A ) , v ∈ H ( C B ) s ∈ S ( C A ) , g ∈ g ( C A ) AP ( u ) × sum u → v - - - ( 10 )
其中,ICTC(GA→GB)为社区GA对社区GB的影响力;β为社区内节点对社区外节点的影响系数;D(GA)和H(GB)分别为社区GA和社区GB中用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(GA)和g(GA)分别为社区GA中所有用户发布的主题信息的集合和所有用户发布的主题信息形成的主题信息传播图的集合;sumu→v为社区GA中用户u发布的所有主题信息影响的社区GB的人数。
上述社区对社区的影响力的计算是通过统计社区GA发布的所有主题信息对社区GB产生影响的人数,综合得出了社区间的影响力。
b.重叠社区
ICTC ( C A → C B ) = β × Σ u ∈ ( C A - C A ∩ C B ) , v ∈ ( C B - C A ∩ C B ) s ∈ S ( C A - C A ∩ C B ) , g ∈ g ( C A - C A ∩ C B ) AP ( u ) × sum u → v + Σ u ∈ ( C A ∩ C B ) , v ∈ C B s ∈ S ( C A ∩ C B ) , g ∈ g ( C A ∩ C B ) , AP ( u ) × sum in . u - - - ( 11 )
其中,ICTC(GA→GB)为社区GA对社区GB的影响力;GA-GA∩GB为社区GA中减去与社区GB重叠的用户所剩余的用户的集合;GB-GA∩GB为社区GB中去掉与社区GA重叠的用户所剩余的用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(G(A)-G(A)∩G(B))和g(G(A)-G(A)∩G(B))分别为社区GA中去掉与社区GB重合的用户,所剩下的用户发布的主题信息的集合和剩下的用户发布的主题信息形成的主题信息传播图的集合;sumu→v为社区GA中去掉与社区GB重合的用户,所剩下的用户u发布的所有主题信息影响的社区GB中去掉与社区GA重合的用户的总人数;G(A)∩G(B)为社区GA与社区GB重叠的用户的集合;S(G(A)∩G(B))和g(G(A)∩G(B))分别为社区GA与社区GB重合的用户,重合的用户发布的主题信息的集合和重合的用户发布的主题信息形成的主题信息传播图的集合;sumin.u为节点u发布的主题信息影响的社区GB内人数。
上述对重叠社区对社区的影响力的计算是通过将社区GA中去掉与社区GB重叠的用户,剩下的用户对社区GB中去掉与社区GA重叠的用户产生的影响以及社区GA和社区GB重叠的用户,对社区GB产生的影响的综合,得出社区对社区的影响力。
其中,所述步骤D的具体过程为:
将计算出的社区影响力、社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,用于评估各社区间的影响力、节点对社区的重要性以及社区对节点作用。
本发明的主要贡献有:(1)与社区影响力相关的概念定义;(2)社区影响力的计算方法包括:用户影响力计算和社区影响力计算。(3)社区影响力的相关方面的延伸。
附图说明
图1为本发明社交网络社区影响力评估算法流程框图;
图2为本发明一个实例的网络节点图。
其中:a用户关系图,b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图。
具体实施方式
下面结合附图和实施例对本发明进一步描述
本发明首先对社交网络进行定义:
定义1社交网络:社交网络形式化为一个二分图,G=(V,E),V代表社交网络中的用户集合,E用来描述用户间的关系的集合。
定义2社区:社区是由拥有相同兴趣爱好的用户组成,为社交网络的一个子图,C=<CV,CE>,当用户属于社区表示为:社区用户间的关系表示为:
定义3根据社区间是否拥有共同用户,将社区分为非重叠社区和重叠社区。
(1)非重叠社区:如果社区中的所有用户均不属于另一社区,则该社区与另一社区为非重叠社区,非重叠社区表示为:NC=<SV,CE>, SV ⊆ V , CE ⊆ E .
(2)重叠社区:如果一个社区中的至少有一个用户同时也属于另一社区,则两个社区为重叠社区,重叠社区表示为:OC=<MCV,SCV,CE>, MVC ⊆ V , SCV ⊆ V , CE ⊆ E .
定义4社区影响力评估算法:根据给出的社区模型以及与它相关的社交网络的信息来评估社区的影响力,社区影响力评估算法表示为:CI(Ci)=f(G,Ci),CI(Ci)表示社区Ci的影响力,f(G,Ci)表示该模型是基于G和Ci
定义5用户影响力:每个用户在其所在的社区内存在一定的影响力,而用户的影响力是通过用户发布的信息影响的人数来衡量的,用户发布的信息影响的人数即转发或分享该信息的总人数,用户发布的信息,不仅会影响到社区内的用户,还会影响社区外的用户,UI的取值在0到1之间,UI的值越大,表示用户的影响力越大。
定义6社区影响力:当兴趣爱好相同的人聚集形成社区时,社区就会形成一定的影响力,社区影响力是对社区内用户影响力的综合。
定义7平均用户传播主题信息的意愿:每条主题信息由发布者开始传播,用户在面对该主题信息时,决定是否愿意传播下去,如果用户转发或分享,则说明用户愿意对该主题信息进行传播;反之,则不愿意,将用户对多条主题信息的反应综合,形成平均用户传播信息的意愿。
定义8社区对社区内节点的影响:社区对社区内节点的影响是社区内的用户受到社区内其他用户的影响。
定义9社区对社区外节点的影响力:社区内的用户发布的信息,在影响社区内的用户的同时,也可能对社区外的节点产生影响,将社区看作一个整体,社区对社区外节点的影响力即看作是节点对节点的影响力。
定义10社区对社区的影响力:社交网络中的社区与社区之间由于用户之间的交互,使得社区与社区之间存在影响力。
下面,给出本发明社交网络社区影响力评估算法
社交网络社区影响力评估算法,具体步骤为:
A.定义社交网络与社区影响力相关的概念及建模。
B.基础阶段:(1)分别统计用户接收和传播主题信息的次数,计算出平均用户传播主题信息的意愿(2)根据社区内平均用户传播主题信息的意愿及用户影响力,计算出社区内所有用户的综合影响;统计社区内的用户数量,得出社区用户数量;根据用户间的关系,计算出社区的用户规模(3)结合上述计算出的社区内所有用户的综合影响及社区的用户数量及社区的用户规模,计算出社区影响力。
C.延伸阶段:(1)社区内节点受其他用户发布主题信息的影响情况计算出社区对社区内节点的影响力(2)根据计算出的社区内用户的平均用户传播主题信息的意愿及社区外节点受社区内用户发布主题信息的影响情况计算出社区对社区外节点的影响力(3)根据计算出的社区内的用户的平均用户传播主题信息的意愿及社区的重叠与否,分别计算出非重叠社区的社区对社区的影响力及重叠社区的社区对社区的影响力。
D.将计算出的社区影响力、社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,用于评估各社区间的影响力、节点对社区的重要性以及社区对节点作用。
(1)平均用户传播主题信息的意愿的计算
AP ( u ) = θ × Pro u Ac S u + ( 1 - θ ) × Σ s ∈ S ( u ) , g ∈ g ( u ) ( Σ v ∈ A ( u ) AP ( v ) × w ( v ) + Σ b ∈ B ( u ) AP ( b ) × w ( b ) ) num S - - - ( 3 )
AcS u = Σ s ∈ S M us j , Pro u = Σ s ∈ S pro us j , w ( v ) = 1 outdegree ( v ) , w ( b ) = a × 1 outdegree ( b )
α = t out → in t ac × num C i
AP(u)为用户u平均传播主题信息的意愿;θ为综合因子,且θ∈[0,1];Prou为用户传播主题信息的总次数;AcSu为用户接收主题信息的总次数;集合A(u)为社区内指向用户u的节点,v∈A(u)为节点v指向u被存放于集合A(u);集合B(u)为社区外指向用户u的节点,b∈B(u)为社区外节点b指向u被存放于集合;每条主题信息的传播,都会形成一个新的图,S(u),g(u)分别为为节点u发布的主题信息的集合,发布主题信息后形成的主题信息传播图的集合,对每个新图的指向u的节点和社区外节点对节点u产生的影响进行计算综合;w(v),w(b)分别为节点v和节点b的权重,而w(v)和w(b)是通过节点的出度来衡量的;α为社区外节点对社区内节点的影响系数。tout→in表示社区外节点指向社区内节点的次数,tac表示社区内节点指向社区外节点的次数,表示社区内用户的数量。假设AP(u)的初值为1。
以上对平均用户传播主题信息的意愿的计算是通过将用户自身传播信息的意愿和社区内以及社区外节点对用户的影响进行综合,得出客观的平均用户传播信息的意愿。
(2)用户影响力的计算
用户发布的主题信息,将会对社区内和社区外的用户产生影响,对用户影响力,作出了如下定义:
UI ( u ) = ξ Σ r ∈ S ( u ) ( sum in . r + β × sum out . r ) - - - ( 4 )
β = t ac - c t ac × num out , ξ = 1 num C i num S ( u )
其中,UI(u)为用户u的影响力;S(u)为用户u发布的主题信息的集合;sumin.r为r条主题信息影响的社区内人数;sumout.r为r条主题信息影响的社区外人数;β为社区内节点对社区外节点的影响系数;tac-c表示社区内用户指向社区外用户的次数,tac表示社区外用户接收社区内主题信息的次数,numout表示社区外用户的数量,ξ为用户影响力的影响因子,表示社区内用户的数量,numS(u)表示用户u发布的主题信息的次数。如果用户从未发布过信息,假设用户的影响力为0.01。
根据用户发布的所有主题信息,对社区内和社区外产生影响的总人数的综合得出用户影响力。
(3)社区影响力计算
相对于社区外的用户而言,社区又被看作一个整体,则整体就有其特有的影响力,包括如下因素:
①社区内用户的综合影响
社区内用户的综合影响,定义为如下:
UII ( C i ) = ∫ 0 t ( Σ u ∈ I ( u ) AP ( u ) × UI ( u ) ) dt - - - ( 5 )
UII(Ci)是社区Ci的用户综合影响;I(u)是社区内用户的集合;AP(u)是用户u的平均传播主题信息的意愿;UI(u)是用户u的用户影响力。
②社区用户的数量
社区用户的数量是社区内存在的用户的数量,在计算社区影响力时起着至关重要的作用,如果不考虑该因素,则不同的社区可能有相同的社区影响力,这是不合理的。
③社区用户规模
社区用户规模是用户间的关系,通过用户的出度来确定,社区用户规模,定义为如下:
US ( C i ) = Σ u ∈ I ( u ) outdegree ( u ) - - - ( 6 )
US(Ci)是社区Ci的用户规模。outdegree(u)是用户u的出度。
综合上述三个因素,得出社区影响力,社区影响力定义如下:
CI(Ci)=M×UII(Ci)+N×NU+(1-M-N)×US(Ci)   (7)
其中,M和N是影响因素,因为在不同的社区影响力评估算法中各个影响因素的重要性不同,M和N可根据实际情况进行取值。
(4)社区对社区内的用户的影响力计算
社区对社区内的用户的影响力定义如下:
ICNI ( h ) = Σ u ∈ ( I ( u ) - { h } ) , AP ( u ) × ( Σ s ∈ S ( u ) , g ∈ g ( u ) influ ) - - - ( 8 )
假设节点h在社区内。I(u)是社区内节点的集合,I(u)-{h}表示节点h不在集合内;influ用来标记节点h是否被用户u发布的影响影响,如果节点h被主题信息s影响,influ则是1,否则influ是0。
社区对社区内节点的影响力的计算是将社区外节点受到社区内节点发布信息的影响和社区内用户影响力综合。
(5)社区对社区外用户的影响力的计算
由于社区是由许多用户组成的群体,这个群体势必会对社区外的节点产生影响力,社区对社区外节点的影响力,作出了如下定义:
假设节点q为社区外节点。
ICTN ( q ) = β × Σ u ∈ I ( u ) AP ( u ) × ( Σ s ∈ S ( u ) , g ∈ g ( u ) inf s ) - - - ( 9 )
其中,ICTN(q)为社区对社区外节点q的影响力;β为社区内节点对社区外节点的影响系数;C(u)为社区内用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(u),g(u)分别为为节点u发布的主题信息的集合,发布主题信息后形成的主题信息传播图的集合;infs为用户u发布的主题信息对节点q的影响,若主题信息s对用户产生影响,则infs为1,反之,则infs为0。
上述社区对社区外节点的影响力,根据社区内所有节点发布的主题信息,对社区外节点产生影响和社区内节点的平均传播主题信息的意愿综合得出。
(6)社区对社区影响力的计算
a.非重叠社区
社区GA和社区GB是重叠社区,对GA对社区GB的影响力,作出了如下定义:
ICTC ( C A → C B ) = β × Σ u ∈ D ( C A ) , v ∈ H ( C B ) s ∈ S ( C A ) , g ∈ g ( C A ) AP ( u ) × sum u → v - - - ( 10 )
其中,ICTC(GA→GB)为社区GA对社区GB的影响力;β为社区内节点对社区外节点的影响系数;D(GA)和H(GB)分别为社区GA和社区GB中用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(GA)和g(GA)分别为社区GA中所有用户发布的主题信息的集合和所有用户发布的主题信息形成的主题信息传播图的集合;sumu→v为社区GA中用户u发布的所有主题信息影响的社区GB的人数。
上述社区对社区的影响力的计算是通过统计社区GA发布的所有主题信息对社区GB产生影响的人数,综合得出了社区间的影响力。
b.重叠社区
ICTC ( C A → C B ) = β × Σ u ∈ ( C A - C A ∩ C B ) , v ∈ ( C B - C A ∩ C B ) s ∈ S ( C A - C A ∩ C B ) , g ∈ g ( C A - C A ∩ C B ) AP ( u ) × sum u → v + Σ u ∈ ( C A ∩ C B ) , v ∈ C B s ∈ S ( C A ∩ C B ) , g ∈ g ( C A ∩ C B ) , AP ( u ) × sum in . u - - - ( 11 )
其中,ICTC(GA→GB)为社区GA对社区GB的影响力;GA-GA∩GB为社区GA中减去与社区GB重叠的用户所剩余的用户的集合;GB-GA∩GB为社区GB中去掉与社区GA重叠的用户所剩余的用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(G(A)-G(A)∩G(B))和g(G(A)-G(A)∩G(B))分别为社区GA中去掉与社区GB重合的用户,所剩下的用户发布的主题信息的集合和剩下的用户发布的主题信息形成的主题信息传播图的集合;sumu→v为社区GA中去掉与社区GB重合的用户,所剩下的用户u发布的所有主题信息影响的社区GB中去掉与社区GA重合的用户的总人数;G(A)∩G(B)为社区GA与社区GB重叠的用户的集合;S(G(A)∩G(B))和g(G(A)∩G(B))分别为社区GA与社区GB重合的用户,重合的用户发布的主题信息的集合和重合的用户发布的主题信息形成的主题信息传播图的集合;sumin.u为节点u发布的主题信息影响的社区GB内人数。
上述对重叠社区对社区的影响力的计算是通过将社区GA中去掉与社区GB重叠的用户,剩下的用户对社区GB中去掉与社区GA重叠的用户产生的影响以及社区GA和社区GB重叠的用户,对社区GB产生的影响的综合,得出社区对社区的影响力。
实施例:
给出如下实施例说明节点的社会网络影响计算(如附图2所示)其中,a用户关系图,b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图。
1.平均用户传播主题信息的意愿的计算
在附图2之a用户关系图中假设每个用户的初始AP值为1,即AP(u1)=AP(u2).....=AP(v3)=1.从b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图得出
(1)计算用户u1的AP:从b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图numS=3,因为b用户u1的主题信息传播图和c用户u1的主题信息传播图是由于用户u1形成的,所以b用户u1的主题信息传播图和c用户u1的主题信息传播图在集合S(u1)中。从b用户u1的主题信息传播图得出A(u1)={u4},B(u1)={v1};从c用户u1的主题信息传播图得出:A(u1)={u2,u5},B(u1)=φ;w(u5)=1
AP ( u 1 ) = 0.6 × 2 3 + 0.4 × ( ( 1 × 1 3 + 1 × 1 7 ) + ( 1 × 1 2 + 1 × 1 ) ) 3 = 25 63
(2)计算用户u2的AP:从b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,numS=3,因为d用户u2的主题信息传播图是由于用户u2形成的,所以d用户u2的主题信息传播图在集合S(u2)中。从d用户u2的主题信息传播图得出:A(u2)={u5},B(u1)=φ;
AP ( u 2 ) = 0.6 × 2 3 + 0.4 × ( 1 × 1 4 ) 3 = 1 6
(3)计算用户u3的AP:从b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,numS=3, Pro u 3 = 0 + 0 + 0 = 0 , AcS u 3 = 0 + 0 + 1 = 1 , 用户u3从未传播过主题信息。
AP ( u 3 ) = 0.6 × 0 + 0.4 × 0 3 = 0
(4)计算用户u4的AP:从b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,numS=3, Pro u 4 = 1 + 1 + 1 = 3 , AcS u 4 = 1 + 1 + 1 = 3 , 用户u4从未传播过主题信息。
AP ( u 4 ) = ( 0.6 × 3 3 + 0.4 × 0 ) 3 = 1 5
(5)计算用户u5的AP:从b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,numS=3, Pro u 5 = 0 + 1 + 1 = 2 , AcS u 5 = 1 + 1 + 1 = 3 , 用户u5从未传播过主题信息。
AP ( u 5 ) = ( 0.6 × 2 3 + 0.4 × 0 ) 3 = 2 15 .
2.用户影响力的计算
从附图2之b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,得出
(1)计算用户u1的UI:从b用户u1的主题信息传播图,得出sumin.r=4,sumout.r=2,从c用户u1的主题信息传播图,得出sumin.r=4,sumout.r=2
UI ( u 1 ) = 1 8 2 × ( ( 4 + 1 3 × 2 ) + ( 4 + 1 3 × 2 ) ) = 7 48
(2)计算用户u2的UI:从c用户u1的主题信息传播图,得出sumin.r=4,sumout.r=2
UI ( u 2 ) = 1 6 2 ( 4 + 1 3 × 2 ) = 7 54
(3)由于用户u3,u4,u5have从未传播过主题信息,所以他们的值为0.01.即UI(u3)=UI(u4)=UI(u5)=0.01
3.社区内用户综合影响的计算
从附图2之b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,t=1
UII ( C i ) = ∫ 0 1 ( 25 63 × 7 48 + 1 6 × 7 54 + 0 × 0.01 + 1 5 × 0.01 + 1 15 × 0.01 ) dt = 0.083
4.社区内用户数量的计算
NU=8
5.社区内用户规模的计算
从附图2之a用户关系图,US(Ci)=5+2+0+4+3=14
6.社区对社区内节点的影响力的计算
从附图2之b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,得出:
ICNI(u1)=AP(u2)×∑influ=AP(u2)×1
ICNI(u2)=AP(u1)×∑influ=AP(u1)×(1+1)
ICNI(u3)=AP(u1)×∑influ+AP(u2)×∑influ=AP(u1)×(0+0)+AP(u2)×1
ICNI(u4)=AP(u1)×∑influ+AP(u2)×∑influ=AP(u1)×(1+1)+AP(u2)×1
ICNI(u5)=AP(u1)×∑influ+AP(u2)×∑influ=AP(u1)×(1+1)+AP(u2)×1
7.社区对社区外节点的影响力的计算
从附图2之b用户u1的主题信息传播图,c用户u1的主题信息传播图,d用户u2的主题信息传播图,得出:
ICTN(v1)=β×(AP(u1)×∑inf+AP(u2)×∑inf)=β×(AP(u1)×(1+1)+AP(u2)×1)
ICTN(v2)=β×(AP(u1)×∑inf+AP(u2)×∑inf)=β×(AP(u1)×(1+1)+AP(u2)×1)
ICTN(v3)=β×(AP(u1)×∑inf+AP(u2)×∑inf)=β×(AP(u1)×(0+0)+AP(u2)×0)
综上所述,本发明所有的研究都是基于社区是已经挖掘到的社区,充分利用了以往对用户影响力等方面的研究,提出了社交网络社区影响力的评估算法。由于以往的对社区的研究,很少对社区的影响力进行考虑,针对以往的缺陷,本发明对社区影响力、社区对社区内节点的影响力、社区对社区的影响力、社区对社区的影响力等问题进行了考虑。因此,可以对人人网,微博等社交网络进行影响评估,对于更好的传播信息以及网络安全等具有实际应用的前景。

Claims (10)

1.一种社交网络社区影响力评估算法,其特征在于,基于图论方法,其基本步骤为:
第一步,定义社交网络与社区影响力相关的概念及建模;
第二步,基础阶段,计算出用户传播主题信息的意愿、社区用户综合影响、社区用户数量、社区用户规模,再综合计算出社区影响力;
第三步,延伸阶段,以基础阶段为基础,计算出社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力;
第四步,将计算出的社区影响力、社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,用于评估各社区间的影响力、节点对社区的重要性以及社区对节点作用。
2.根据权利要求1所述的社交网络社区影响力评估算法,其特征在于,所述第一步定义,包括步骤:
社交网络模型:社交网络可以形式化为一个二分图,G=(V,E),V代表社交网络中的用户集合,E用来描述用户间的关系的集合;
社区模型:社区是由拥有相同兴趣爱好的用户组成,为社交网络的一个子图,C=<CV,CE>,当用户属于社区表示为:社区用户间的关系表示为:
根据社区间是否拥有共同用户,将社区分为非重叠社区和重叠社区;
(1)非重叠社区:如果社区中的所有用户均不属于另一社区,则该社区与另一社区为非重叠社区,非重叠社区表示为: SV ⊆ V , CE ⊆ E ;
(2)重叠社区:如果一个社区中的至少有一个用户同时也属于另一社区,则两个社区为重叠社区,重叠社区表示为: OC = < MCV , SCV , CE > , MCV &SubsetEqual; V , SCV &SubsetEqual; V , CE &SubsetEqual; E ;
根据上述的非重叠社区和重叠社区,得出下列属性:
&ForAll; v i , v j &Element; C . CV ^ &Exists; e ( v i , v j ) &RightArrow; &ForAll; e ( v i , v j ) &Element; C . CE ;
&ForAll; e ( v i , v j ) &Element; C . CE ^ &RightArrow; &ForAll; v i , v j &Element; C . CV ;
社区影响力评估算法:根据给出的社区模型以及与它相关的社交网络的信息来评估社区的影响力,社区影响力评估算法表示为:CI(Ci)=f(G,Ci),CI(Ci)表示社区Ci的影响力,f(G,Ci)表示该模型是基于G和Ci
用户影响力:每个用户在其所在的社区内存在一定的影响力,而用户的影响力是通过用户发布的信息影响的人数来衡量的,用户发布的信息影响的人数即转发或分享该信息的总人数,用户发布的信息,不仅会影响到社区内的用户,还会影响社区外的用户,UI的取值在0到1之间,UI的值越大,表示用户的影响力越大;
社区影响力:当兴趣爱好相同的人聚集形成社区时,社区就会形成一定的影响力,社区影响力是对社区内用户影响力的综合;
如述,社交网络是由多个重叠或非重叠社区组成,社区是由用户组成,每个用户是一个用户节点,每个用户节点可能属于一个或多个社区,为了便于分析,作出如下定义:
每一条主题信息j在社交网络中传播,都会形成一个图gj,社交网络中,有n个主题,且主题的数量随着时间的推移,在不断的增加,所以需要不停地对信息进行更新,主题S的集合表示为:S={s1,s2,s3......sn},主题S传播过程中形成的图的集合表示为:g={g1,g2,g3......gn};
平均用户传播主题信息的意愿:每条主题信息由发布者开始传播,用户在面对该主题信息时,决定是否愿意传播下去,如果用户转发或分享,则说明用户愿意对该主题信息进行传播;反之,则不愿意,将用户对多条主题信息的反应综合,形成平均用户传播信息的意愿;
社区对社区内节点的影响:社区对社区内节点的影响是社区内的用户受到社区内其他用户的影响;
社区对社区外节点的影响力:社区内的用户发布的信息,在影响社区内的用户的同时,也可能对社区外的节点产生影响,将社区看作一个整体,社区对社区外节点的影响力即看作是节点对节点的影响力;
社区对社区的影响力:社交网络中的社区与社区之间由于用户之间的交互,使得社区与社区之间存在影响力。
3.根据权利要求1所述的社交网络社区影响力评估算法,其特征在于,所述第二步基础阶段,计算出用户传播主题信息的意愿、社区用户综合影响、社区用户规模,统计出社区用户数量,再综合计算出社区影响力,包括步骤:
(1)分别统计用户接收和传播主题信息的次数,计算出平均用户传播主题信息的意愿;
(2)根据社区内平均用户传播主题信息的意愿及用户影响力,计算出社区内所有用户的综合影响;统计社区内的用户数量,得出社区用户数量;根据用户间的关系,计算出社区的用户规模;
(3)结合上述计算出的社区内所有用户的综合影响、社区的用户规模,以及统计出的社区的用户数量,计算出社区影响力。
4.根据权利要求1所述的社交网络社区影响力评估算法,其特征在于,所述第三步延伸阶段,计算出社区对社区内节点的影响力、社区对社区外节点的影响力、社区对社区的影响力,包括步骤:
(1)社区内节点受其他用户发布主题信息的影响情况计算出社区对社区内节点的影响力;
(2)根据计算出的社区内用户的平均用户传播主题信息的意愿及社区外节点受社区内用户发布主题信息的影响情况计算出社区对社区外节点的影响力;
(3)根据计算出的社区内的用户的平均用户传播主题信息的意愿及社区的重叠与否,分别计算出非重叠社区的社区对社区的影响力及重叠社区的社区对社区的影响力。
5.根据权利要求3所述的社交网络社区影响力评估算法,其特征在于,所述(1)分别统计用户接收和传播主题信息的次数,计算出平均用户传播主题信息的意愿,还包括步骤:
用户在接收到主题信息时,可能传播下去,也可能不传播下去,同时,用户接收到该主题信息的途径可能有多个,可能从一个或多个用户那接收到该信息,用户u对主题信息j的标记为:
用户u接收主题信息的次数,初始值为0,若此时用户u对主题信息j的标记为1,则用户u接收主题信息的次数加1,虽然用户u可能从多个用户那接收到主题信息j,但是,用户u对主题信息j的累加只进行一次,用户u对主题信息j的传播,是通过观察图gj
pro us j = 0 , if outdegree ( u ) = 0 1 , if outdegree ( u ) > 0 - - - ( 2 )
其中,为0时,表明用户未对该主题信息进行传播,为1时,表明用户对该主题信息进行了传播;当用户u的出度大于0时,说明用户u对主题信息j进行了传播,平均用户传播主题信息的意愿,其计算方法为:
AP ( u ) = &theta; &times; Pro u AcS u + ( 1 - &theta; ) &times; &Sigma; s &Element; S ( u ) , g &Element; g ( u ) ( &Sigma; v &Element; A ( u ) AP ( v ) &times; w ( v ) + &Sigma; b &Element; B ( u ) AP ( b ) &times; w ( b ) ) num s - - - ( 3 )
AcS u = &Sigma; s &Element; S M us j , Pro u = &Sigma; s &Element; S pro us j , w ( v ) = 1 outdegree ( v ) , w ( b ) = a &times; 1 outdegree ( b )
&alpha; = t out &RightArrow; in t ac &times; num C i
AP(u)为用户u平均传播主题信息的意愿;θ为综合因子,且θ∈[0,1];Prou为用户传播主题信息的总次数;AcSu为用户接收主题信息的总次数;集合A(u)为社区内指向用户u的节点,v∈A(u)为节点v指向u被存放于集合A(u);集合B(u)为社区外指向用户u的节点,b∈B(u)为社区外节点b指向u被存放于集合;每条主题信息的传播,都会形成一个新的图,S(u),g(u)分别为节点u发布的主题信息的集合,发布主题信息后形成的主题信息传播图的集合,对每个新图的指向u的节点和社区外节点对节点u产生的影响进行计算综合;w(v),w(b)分别为节点v和节点b的权重,而w(v)和w(b)是通过节点的出度来衡量的;α为社区外节点对社区内节点的影响系数;tout→in表示社区外节点指向社区内节点的次数,tac表示社区内节点指向社区外节点的次数,表示社区内用户的数量;假设AP(u)的初值为1;
以上对平均用户传播主题信息的意愿的计算是通过将用户自身传播信息的意愿和社区内以及社区外节点对用户的影响进行综合,得出客观的平均用户传播信息的意愿。
6.根据权利要求3所述的社交网络社区影响力评估,其特征在于,所述(2)根据社区内平均用户传播主题信息的意愿及用户影响力,计算出社区内所有用户的综合影响,统计社区内的用户数量,得出社区用户数量,根据用户间的关系,计算出社区的用户规模,还包括步骤:
用户发布的主题信息,将会对社区内和社区外的用户产生影响,对用户影响力,其计算方法为:
UI ( u ) = &xi; &Sigma; r &Element; S ( u ) ( sum in . r + &beta; &times; sum out . r ) - - - ( 4 )
&beta; = t ac - c t ac &times; num out , &xi; = 1 num C i num S ( u )
其中,UI(u)为用户u的影响力;S(u)为用户u发布的主题信息的集合;sumin.r为r条主题信息影响的社区内人数;sumout.r为r条主题信息影响的社区外人数;β为社区内节点对社区外节点的影响系数;tac-c表示社区内用户指向社区外用户的次数,tac表示社区外用户接收社区内主题信息的次数,numout表示社区外用户的数量,ξ为用户影响力的影响因子,表示社区内用户的数量,numS(u)表示用户u发布的主题信息的次数;如果用户从未发布过信息,就设用户的影响力为0.01;
根据用户发布的所有主题信息,对社区内和社区外产生影响的总人数的综合得出用户影响力;
相对于社区外的用户而言,社区又被看作一个整体,则整体就有其特有的影响力,包括如下因素:
a.社区内用户的综合影响,其计算方法为:
UII ( C i ) = &Integral; 0 t ( &Sigma; u &Element; I ( u ) AP ( u ) &times; UI ( u ) ) dt - - - ( 5 )
UII(Ci)是社区Ci的用户综合影响;I(u)是社区内用户的集合;AP(u)是用户u的平均传播主题信息的意愿;UI(u)是用户u的用户影响力;
b.社区用户的数量是社区内存在的用户的数量,在计算社区影响力时起着至关重要的作用,如果不考虑该因素,则不同的社区可能有相同的社区影响力,这是不合理的;
c.社区用户规模是用户间的关系,通过用户的出度来确定,社区用户规模,其计算方法为:
US ( C i ) = &Sigma; u &Element; I ( u ) outdegree ( u ) - - - ( 6 )
US(Ci)是社区Ci的用户规模,outdegree(u)是用户u的出度。
7.根据权利要求3所述的社交网络社区影响力评估算法,其特征在于,所述(3)结合上述计算出的社区内所有用户的综合影响、社区的用户规模,以及统计出的社区的用户数量,计算出社区影响力,还包括步骤:
综合上述三个因素,得出社区影响力,社区影响力,其计算方法为:
CI(Ci)=M×UII(Ci)+N×NU+(1-M-N)×US(Ci)   (7)
其中,M和N是影响因素,因为在不同的社区影响力评估算法中各个影响因素的重要性不同,M和N可根据实际情况进行取值。
8.根据权利要求4所述的社交网络社区影响力评估算法,其特征在于,所述(1)社区内节点受其他用户发布主题信息的影响情况计算出社区对社区内节点的影响力,还包括步骤:
社区对社区内的用户的影响力,其计算方法为:
ICNI ( h ) = &Sigma; u &Element; ( I ( u ) - { h } ) , AP ( u ) &times; ( &Sigma; s &Element; S ( u ) , g &Element; g ( u ) influ ) - - - ( 8 )
假设节点h在社区内,I(u)是社区内节点的集合,I(u)-{h}表示节点h不在集合内;influ用来标记节点h是否被用户u发布的影响影响,如果节点h被主题信息s影响,influ则是1,否则influ是0;
社区对社区内节点的影响力的计算是将社区外节点受到社区内节点发布信息的影响和社区内用户影响力综合。
9.根据权利要求4所述的社交网络社区影响力评估算法,其特征在于,所述(2)根据计算出的社区内用户的平均用户传播主题信息的意愿及社区外节点受社区内用户发布主题信息的影响情况计算出社区对社区外节点的影响力,还包括步骤:
由于社区是由许多用户组成的群体,这个群体势必会对社区外的节点产生影响力,社区对社区外节点的影响力,其计算方法如下:
假设节点q为社区外节点,
ICTN ( q ) = &beta; &times; &Sigma; u &Element; I ( u ) AP ( u ) &times; ( &Sigma; s &Element; S ( u ) , g &Element; g ( u ) inf s ) - - - ( 9 )
其中,ICTN(q)为社区对社区外节点q的影响力;β为社区内节点对社区外节点的影响系数;C(u)为社区内用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(u),g(u)分别为节点u发布的主题信息的集合,发布主题信息后形成的主题信息传播图的集合;infs为用户u发布的主题信息对节点q的影响,若主题信息s对用户产生影响,则infs为1,反之,则infs为0;
上述社区对社区外节点的影响力,根据社区内所有节点发布的主题信息,对社区外节点产生影响和社区内节点的平均传播主题信息的意愿综合得出。
10.根据权利要求4所述的社交网络社区影响力评估算法,其特征在于,所述(3)根据计算出的社区内的用户的平均用户传播主题信息的意愿及社区的重叠与否,分别计算出非重叠社区的社区对社区的影响力和重叠社区的社区对社区的影响力,还包括步骤:
a.非重叠社区
社区GA和社区GB是重叠社区,对GA对社区GB的影响力,其计算方法为:
ICTC ( C A &RightArrow; C B ) = &beta; &times; &Sigma; u &Element; D ( C A ) , v &Element; H ( C B ) s &Element; S ( C A ) , g &Element; g ( C A ) AP ( u ) &times; sum u &RightArrow; v - - - ( 10 )
其中,ICTC(GA→GB)为社区GA对社区GB的影响力;β为社区内节点对社区外节点的影响系数;D(GA)和H(GB)分别为社区GA和社区GB中用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(GA)和g(GA)分别为社区GA中所有用户发布的主题信息的集合和所有用户发布的主题信息形成的主题信息传播图的集合;sumu→v为社区GA中用户u发布的所有主题信息影响的社区GB的人数;
上述社区对社区的影响力的计算是通过统计社区GA发布的所有主题信息对社区GB产生影响的人数,综合得出了社区间的影响力;
b.重叠社区,其计算方法为:
ICTC ( C A &RightArrow; C B ) = &beta; &times; &Sigma; u &Element; ( C A - C A &cap; C B ) , v &Element; ( C B - C A &cap; C B ) s &Element; S ( C A - C A &cap; C B ) , g &Element; g ( C A - C A &cap; C B ) AP ( u ) &times; sum u &RightArrow; v &Sigma; u &Element; ( C A &cap; C B ) , v &Element; C B s &Element; S ( C A &cap; C B ) , g &Element; g ( C A &cap; C B ) , AP ( u ) &times; sum in . u - - - ( 11 )
其中,ICTC(GA→GB)为社区GA对社区GB的影响力;GA-GA∩GB为社区GA中减去与社区GB重叠的用户所剩余的用户的集合;GB-GA∩GB为社区GB中去掉与社区GA重叠的用户所剩余的用户的集合;AP(u)为用户u的平均用户传播主题信息的意愿;S(G(A)-G(A)∩G(B))和g(G(A)-G(A)∩G(B))分别为社区GA中去掉与社区GB重合的用户,所剩下的用户发布的主题信息的集合和剩下的用户发布的主题信息形成的主题信息传播图的集合;sumu→v为社区GA中去掉与社区GB重合的用户,所剩下的用户u发布的所有主题信息影响的社区GB中去掉与社区GA重合的用户的总人数;G(A)∩G(B)为社区GA与社区GB重叠的用户的集合;S(G(A)∩G(B))和g(G(A)∩G(B))分别为社区GA与社区GB重合的用户,重合的用户发布的主题信息的集合和重合的用户发布的主题信息形成的主题信息传播图的集合;sumin.u为节点u发布的主题信息影响的社区GB内人数;
上述对重叠社区对社区的影响力的计算是通过将社区GA中去掉与社区GB重叠的用户,剩下的用户对社区GB中去掉与社区GA重叠的用户产生的影响以及社区GA和社区GB重叠的用户,对社区GB产生的影响的综合,得出社区对社区的影响力。
CN201410740284.8A 2014-12-05 2014-12-05 社交网络社区影响力评估算法 Pending CN104484825A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410740284.8A CN104484825A (zh) 2014-12-05 2014-12-05 社交网络社区影响力评估算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410740284.8A CN104484825A (zh) 2014-12-05 2014-12-05 社交网络社区影响力评估算法

Publications (1)

Publication Number Publication Date
CN104484825A true CN104484825A (zh) 2015-04-01

Family

ID=52759365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410740284.8A Pending CN104484825A (zh) 2014-12-05 2014-12-05 社交网络社区影响力评估算法

Country Status (1)

Country Link
CN (1) CN104484825A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956925A (zh) * 2016-04-23 2016-09-21 时趣互动(北京)科技有限公司 一种基于传播网络的重要用户发现方法及装置
CN106251230A (zh) * 2016-07-22 2016-12-21 福建师范大学 一种基于选举标签传播的社区发现方法
CN107124355A (zh) * 2017-06-24 2017-09-01 梧州市兴能农业科技有限公司 一种一体化社区服务系统
CN108376371A (zh) * 2018-02-02 2018-08-07 众安信息技术服务有限公司 一种基于社交网络的互联网保险营销方法和系统
CN108876648A (zh) * 2018-06-29 2018-11-23 中国矿业大学 基于节点覆盖范围的社交网络影响力最大化方法及系统
CN108960562A (zh) * 2018-05-18 2018-12-07 深圳市和讯华谷信息技术有限公司 一种区域影响力评估方法及装置
CN110738421A (zh) * 2019-10-17 2020-01-31 西南大学 一种基于传播最短路径的多层网络用户影响力度量方法
CN111047453A (zh) * 2019-12-04 2020-04-21 兰州交通大学 基于高阶张量分解大规模社交网络社区的检测方法及装置
CN117573990A (zh) * 2023-11-22 2024-02-20 深圳福恋智能信息科技有限公司 虚拟社交网络用户影响力评估方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100161662A1 (en) * 2008-12-18 2010-06-24 Jonas Jeffrey J Using spheres-of-influence to characterize network relationships
CN103117891A (zh) * 2013-01-18 2013-05-22 武汉大学 微博平台上的僵尸用户探测方法
CN103678669A (zh) * 2013-12-25 2014-03-26 福州大学 一种社交网络中的社区影响力评估系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100161662A1 (en) * 2008-12-18 2010-06-24 Jonas Jeffrey J Using spheres-of-influence to characterize network relationships
CN103117891A (zh) * 2013-01-18 2013-05-22 武汉大学 微博平台上的僵尸用户探测方法
CN103678669A (zh) * 2013-12-25 2014-03-26 福州大学 一种社交网络中的社区影响力评估系统及方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956925A (zh) * 2016-04-23 2016-09-21 时趣互动(北京)科技有限公司 一种基于传播网络的重要用户发现方法及装置
CN105956925B (zh) * 2016-04-23 2021-07-02 时趣互动(北京)科技有限公司 一种基于传播网络的重要用户发现方法及装置
CN106251230A (zh) * 2016-07-22 2016-12-21 福建师范大学 一种基于选举标签传播的社区发现方法
CN107124355A (zh) * 2017-06-24 2017-09-01 梧州市兴能农业科技有限公司 一种一体化社区服务系统
CN108376371A (zh) * 2018-02-02 2018-08-07 众安信息技术服务有限公司 一种基于社交网络的互联网保险营销方法和系统
CN108960562A (zh) * 2018-05-18 2018-12-07 深圳市和讯华谷信息技术有限公司 一种区域影响力评估方法及装置
CN108876648A (zh) * 2018-06-29 2018-11-23 中国矿业大学 基于节点覆盖范围的社交网络影响力最大化方法及系统
CN108876648B (zh) * 2018-06-29 2021-02-02 中国矿业大学 基于节点覆盖范围的社交网络影响力最大化方法及系统
CN110738421A (zh) * 2019-10-17 2020-01-31 西南大学 一种基于传播最短路径的多层网络用户影响力度量方法
CN110738421B (zh) * 2019-10-17 2023-08-22 西南大学 一种基于传播最短路径的多层网络用户影响力度量方法
CN111047453A (zh) * 2019-12-04 2020-04-21 兰州交通大学 基于高阶张量分解大规模社交网络社区的检测方法及装置
CN117573990A (zh) * 2023-11-22 2024-02-20 深圳福恋智能信息科技有限公司 虚拟社交网络用户影响力评估方法及系统

Similar Documents

Publication Publication Date Title
CN104484825A (zh) 社交网络社区影响力评估算法
Adali et al. Measuring behavioral trust in social networks
Chatterjee et al. Dynamic optimal pricing for heterogeneous service-oriented architecture of sensor-cloud infrastructure
Wang et al. Maximizing positive influence spread in online social networks via fluid dynamics
Wang et al. Distributed consensus in noncooperative congestion games: An application to road pricing
CN103678669A (zh) 一种社交网络中的社区影响力评估系统及方法
CN102262681A (zh) 一种博客信息传播中识别关键博客集的方法
CN103116611A (zh) 社交网络意见领袖识别方法
Jiang et al. Identifying important nodes for temporal networks based on the ASAM model
CN104009993A (zh) 一种基于模糊过滤的信任评估方法
Chen et al. Evolutionary game analysis of tripartite cooperation strategy under mixed development environment of cascade hydropower stations
Choobineh et al. Game-theoretic peer-to-peer solar energy trading on blockchain-based transaction infrastructure
Hao et al. Modeling and assessing the robustness of the lithium global trade system against cascading failures
Bimpikis et al. Competing over networks
Wang et al. Maximizing influence in social networks by distinguishing the roles of seeds
Wang et al. Security analysis of Filecoin's expected consensus in the Byzantine vs honest model
Zhan et al. Trust maximization in social networks
Su et al. A jury-based trust management mechanism in distributed cognitive radio networks
Fujita et al. Mining pool selection problem in the presence of block withholding attack
Meng et al. The symmetric Banzhaf value for fuzzy games with a coalition structure
Wang et al. An uncertainty-and collusion-proof voting consensus mechanism in blockchain
Fele et al. Scenario-based robust scheduling for electric vehicle charging games
CN103942278A (zh) 通过分析用户主动交友意愿进行朋友推荐的方法
Li et al. A tree-network model for mining short message services seed users and its empirical analysis
Bello et al. Revealing the role of topological transitivity in efficient trust and reputation system in smart metering network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150401

RJ01 Rejection of invention patent application after publication