CN105630800A - 一种节点重要性排序的方法和系统 - Google Patents

一种节点重要性排序的方法和系统 Download PDF

Info

Publication number
CN105630800A
CN105630800A CN201410597128.0A CN201410597128A CN105630800A CN 105630800 A CN105630800 A CN 105630800A CN 201410597128 A CN201410597128 A CN 201410597128A CN 105630800 A CN105630800 A CN 105630800A
Authority
CN
China
Prior art keywords
node
oriented weighted
weighted networks
networks
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410597128.0A
Other languages
English (en)
Other versions
CN105630800B (zh
Inventor
吕琳媛
陈川
易玲玲
岳亚丁
贺鹏
王巨宏
管刚
任晓龙
佘莉
王澎
张婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Hangzhou Normal University
Original Assignee
Tencent Technology Shenzhen Co Ltd
Hangzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Hangzhou Normal University filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410597128.0A priority Critical patent/CN105630800B/zh
Publication of CN105630800A publication Critical patent/CN105630800A/zh
Application granted granted Critical
Publication of CN105630800B publication Critical patent/CN105630800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种节点重要性排序的方法和系统。本发明实施例方法包括:从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息;根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网络;在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得到所述各个节点的重要性排名。

Description

一种节点重要性排序的方法和系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种节点重要性排序的方法和系统。
背景技术
社交网络中重要用户挖掘是通过在网络中对节点的重要性进行排序来实现的,不同的社交网站会依据不同的应用场景对重要性进行定义和计算。网络中节点重要性的排序是一个非常重要的问题,例如对网页的排序是搜索算法的核心。
现有技术中存在一种链接数据库中节点排序方法,可用于对节点的重要性排序,该方法是LawrencePage发明的美国US6285999B1号专利,即“链接数据库中节点排序方法”(英文全称为METHODFORNODERANKINGINALINKEDDATABASE),简称PageRank算法,该算法用来标识网页的等级/重要性,使那些更具“等级/重要性”的网页在搜索结果中网站排名获得提升,从而提高搜索结果的相关性和质量。
PageRank算法存在的缺陷是无法处理悬摆链,也就是对于出度为零的网页(没有链出边的网页)无法处理,为了解决悬摆链的问题,目前采用的方法是引入一个随机跳转概率,即走到悬摆链的时候会以一定概率随机选择网页链入,这样会使得网页排序结果严重依赖随机跳转概率参数的选择,也就是说不同的随机跳转概率参数会得到不同的排序结果,这会极大影响排序结果的准确性。
现有技术中还存在一种节点重要性排序方法是HITS(英文全称:Hyperlink–InducedTopicSearch)算法,HITS算法同时考虑了节点权威性(英文名称为authority)和中枢性(英文名称为hub)。一个节点的权威值等于链入它的节点的hub值的和,一个节点的hub值等于它指向的节点的权威值之和。由此可见HITS算法中权威值和中枢值的计算都是依赖于节点之间的相互链接关系,所以HITS算法存在的问题是无法适用于包含多个集团的网络中节点重要性的排序,因为各个集团之间没有链接,很难说明一个集团比另外一个集团更重要,因此也就不能确定跨集团的多节点中哪个节点更加权威或者中枢性更强。
综上,现有技术中存在的节点重要性排序方法都无法完全适用于社交网络中重要用户挖掘,目前业界仍急需研究出能够完全适用于社交网络中重要用户挖掘的节点重要性排序方法。
发明内容
本发明实施例提供了一种节点重要性排序的方法和系统,用于实现社交网络中重要用户挖掘。
为解决上述技术问题,本发明实施例提供以下技术方案:
第一方面,本发明实施例提供一种节点重要性排序的方法,包括:
从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息;
根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网络;
在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;
根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得到所述各个节点的重要性排名。
第二方面,本发明实施例还提供一种节点重要性排序的系统,包括:
信息获取模块,用于从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息;
网络转化模块,用于根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网络;
节点添加模块,用于在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;
重要性排序模块,用于根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得到所述各个节点的重要性排名。
从以上技术方案可以看出,本发明实施例具有以下优点:
在本发明实施例中,首先从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息,然后根据获取到的节点日志信息在拓扑网络中加入含权性和有向性,得到有向含权网络,接下来在有向含权网络中加入背景节点,得到加入有背景节点的有向含权网络,其中,背景节点与有向含权网络中原有的所有节点建立有双向链接关系,最后根据加入有背景节点的有向含权网络对各个节点的重要性进行排序,从而可以得到各个节点的重要性排名。本发明实施例中各个节点可以对应于社交网络中的各个用户,通过对节点重要性的排序可以从社交网络中挖掘出重要用户,故可以实现社交网络中重要用户挖掘,本发明实施例中对节点重要性的排序是通过各个节点之间的交互行为进行挖掘以及有向含权网络来实现的,重要性排序的结果精度高,由于有向含权网络中已经添加了与原有的所有节点都建立有双向链接关系的背景节点,使得出度为零的节点也可以实现跳转,故不需要引入随机跳转概率,所以不受随机跳转概率参数的影响,并且对于节点之间没有相互链接的跨集团的拓扑网路也同样适用。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种节点重要性排序的方法的流程方框示意图;
图2-a为本发明实施例提供的一种节点重要性排序的系统的组成结构示意图;
图2-b为本发明实施例提供的另一种节点重要性排序的系统的组成结构示意图;
图2-c为本发明实施例提供的一种重要性排序模块的组成结构示意图;
图2-d为本发明实施例提供的一种计算子模块的组成结构示意图;
图2-e为本发明实施例提供的一种排序子模块的组成结构示意图;
图3为本发明实施例提供的节点重要性排序的方法应用于服务器的组成结构示意图;
图4为本发明实施例提供的节点重要性排序的系统的实现架构示意图;
图5为计算子模块执行的方法流程示意图。
具体实施方式
本发明实施例提供了一种节点重要性排序的方法和系统,用于实现社交网络中重要用户挖掘。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
以下分别进行详细说明。本发明节点重要性排序的一个实施例,具体可以应用于社交网络中重要用户挖掘的场景中,请参阅图1所示,本发明一个实施例提供的节点重要性排序的方法,可以包括如下步骤:
101、获取拓扑网络中各个节点之间交互的节点日志信息。
在本发明实施例中,节点对应于社交网络中的各个用户,每个用户对应于拓扑网络中的一个节点,通过对节点重要性的排序,可以实现对社交网络中重要用户的挖掘,在社交网络中,用户有着自己单独的行为,用户与用户之间也可能存在交互行为,这些都会影响一个用户在社交网络中的活跃程度和影响力,用户之间的交互行为通过用户日志可以由社交网络应用服务器来保存,将社交网络中的用户表示为拓扑网络中的节点,则对于节点而言,在拓扑网络的节点之间也可能存在交互行为,对节点之间交互行为的记录可以通过节点应用服务器来保存,当需要对拓扑网络中各个节点进行重要性排名时,首先提取各个节点之间交互的节点日志信息,例如可以从节点应用服务器来提取上述节点日志信息。其中,节点日志信息用于记录交互双方的节点名称、交互行为以及交互发生的时间等交互行为的记录,提取各个节点的节点日志信息可以发现各个节点在拓扑网络中的活跃程度以及节点对其它节点的影响力,这些都会影响拓扑网络中节点的排序结果。
在本发明的一些实施例中,拓扑网络中各个节点之间交互的节点日志信息,具体可以包括如下内容:交互的两个节点中交互发起方的标识号(ID,Identity)和交互接收方的ID,交互行为类型,交互发起方的属性、交互时间。举例说明,在拓扑网络中,若节点A和节点B之间产生过交互行为,例如,在社交软件微信中,节点A对应于微信中注册的用户A,节点B对应于微信中注册的用户B,用户A对用户B在微信中发布的照片点过赞,则可以认为节点A和节点B之间产生过交互行为,那么在节点A和节点B的节点日志信息中都会记录下交互发起方(即节点A)的ID号、交互接收方(即节点B)的ID号、交互行为类型为“点赞”、交互发起方的属性(例如节点A在社交网络中公开的用户标签等属性信息)以及交互行为产生的时间点。可以理解的是,节点日志信息除了记录下如上举例的内容之外,还可以根据设计网络应用的具体平台、用户之间交互的具体方式以及对其它用户产生的影响等来设计节点日志信息的具体内容,此处不做限定。
在如上的实现场景中,若通过步骤101从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息包括了交互发起方的ID和交互接收方的ID、交互行为类型和交互发起方的属性等涉及到用户的身份以及敏感数据时,为了保证用户的隐私不被泄露,本发明实施例还可以执行如下步骤:
A1、对交互发起方的ID和交互接收方的ID进行匿名化处理;
A2、对交互行为类型和交互发起方的属性进行泛化处理。
其中,步骤A1和步骤A2之间没有时序先后顺序之分,可以先执行其中任意一个,还可以同时执行两个步骤,即通过匿名化处理和泛化处理,可以对涉及到用户的身份以及敏感数据等方面进行隐私保护,其中,泛化处理可以使得当一个变量(如参数或过程变量)被声明承载某个给定类的值时,可使用类(或其他元素)的实例作为值,例如对交互行为类型和交互发起方的属性的泛化处理,使得交互行为类型和交互发起方的属性被使用的其它元素值或者实例作为其值,而真正的交互行为类型和交互发起方的属性不会被直接泄露。
102、根据节点日志信息在拓扑网络中加入含权性和有向性,得到有向含权网络。
在本发明实施例中,从节点应用服务器获取到拓扑网络中各个节点之间交互的节点日志信息之后,根据节点日志信息中记录的各个节点之间的交互行在拓扑网络中加入含权性和有向性,即对拓扑网络中各个节点增加权重的描述以及各个节点与其它节点具有交互关系时增加有向性,使得各个节点之间具有不同的权值,从而可以得到有向含权网络,这更符合拓扑网络的复杂特性。可以理解的是,有向含权网络是相对于无向无权网络而言的,拓扑网络根据获取到的节点日志信息可以生成各个节点之间构成的连接中具有不同权值的含权网络或者各个连接具有方向的网络,统称之为有向含权网络,在拓扑网络中引入含权性和有向性,更符合拓扑网络的实际情况。例如,社交网络为微博,在微博上有关注关系,如果用户V1关注了用户V2,可以建立一条有向边从V1指向V2,那么可以通过从节点日志信息中记录的这种交互关系,在节点V1(对应于用户V1)和节点V2(对应于用户V2)之间增加有向性,对拓扑网络中的所有节点都按照节点日志信息添加权值和方向,就可以得到有向含权网络。对于有向含权网络,若对节点日志信息进行图转化,就可以得到网络图文件,在实际应用中可以通过网络图文件的方式来描述有向含权网络。
在本发明一些实施例中,对于有向含权网络,可以通过如下公式来表示有向含权网络中的节点之间交互:
G=(V,E,L,Lv,Le);
其中,G为有向含权网络,V是节点的集合,V={V1,V2,……,VN},N为有向含权网络中所有节点的个数,E是边的集合,E={(Vi,Vj,t)},i=1,2,……,N,j=1,2,……,N,t为Vi和Vj之间存在关系的时刻,Vi和Vj为V中存在关系的两个节点,L为标签集,Lv为节点标签函数,Le为边标签函数。
需要说明的是,Vi和Vj为V中存在关系的两个节点,则在Vi和Vj之间就存在连接的边,用E来表示边的集合。另外,L为标签集,指节点和边的属性的集合,Lv为节点标签函数,指节点到其标签的映射,Le为边标签函数,指边到其标签的映射。
103、在有向含权网络中加入背景节点,得到加入有背景节点的有向含权网络。
其中,背景节点与有向含权网络中原有的所有节点建立有双向链接关系。
在本发明实施例中,得有向含权网络之后,通过在有向含权网络中添加背景节点,使得有向含权网络中的各个节点实现连通,因为背景节点与有向含权网络中原有的所有节点建立有双向链接关系,可以将悬摆链都化解为有出度的节点,所以添加背景节点后的有向含权网络中就不存在出度为零的节点,原来出度为零的节点由于和背景节点之间都建立有链接关系,所以原来出度为零的节点可以通过与之链接的背景节点实现跳转,从而解决了悬摆链的问题,所以不需要引入随机跳转概率,也就不会受到随机跳转概率的影响。
若步骤102中得到的有向含权网络用G来表示,假设有向含权网络G中所有节点的个数为N,在有向含权网络G中再加入一个新的节点,定义为背景节点,将加入有背景节点的有向含权网络用G′来表示,那么在有向含权网络G′中节点的个数为(N+1),对于新加入的背景节点,还需要建立该背景节点与有向含权网络G′中原有的N个节点之间的双向链接关系,也就是说背景节点与原有的每个节点之间都建立有边。具体的,双向链接关系的权值默认为1,在必要时可以调整以优化背景节点的作用。
需要说明的是,在本发明实施例中,步骤102中根据节点日志信息建立有向含权网络之后,有向含权网络中的有向性指的是在有向含权网络中表示两个节点之间相互关系的链接是有方向的,比如节点A关注了节点B,那么这种关注关系就可以用一条有向边表示,即有一条边从A指向B。有向含权网络中的含权性指的是在有向含权网络中表示两个节点之间的链接的权重,其中,对拓扑网络加权的方式很多,比如按照两个用户之间交互关系的次数或者频率都可以作为有向含权网络中两个节点之间有向边的权重。具体的,每个边的权重可以结合具体的应用场景来设定,不限定的是,本发明实施例中有向含权网络的所有边的权重都可以为1,在这种情况下,有向含权网络同样可以等同于无权网络,另外,也可以根据用于描述两个用户之间交互关系的次数多少或者频繁程度来为每个边设置具体的权重取值。
104、根据加入有背景节点的有向含权网络对各个节点的重要性进行排序,得到各个节点的重要性排名。
在本发明实施例中,得到加入有背景节点的有向含权网路之后,从有向含权网路中对各个节点增加的权重和有向性可以分析各个节点的重要性,其中,对于拓扑网络中各个节点可以依据不同的应用场景对重要性进行定义和计算,总结出拓扑网络中各个节点的重要性之后,对所有节点的重要性进行排序,从而得到拓扑网络中各个节点的重要性排名,通过节点和社交网络中用户的对应关系,可以根据节点的重要性从社交网络中挖掘出重要用户。
在本发明的一些实施例中,步骤103根据有向含权网络对各个节点的重要性进行排序,具体可以包括如下步骤:
1031、根据加入有背景节点的有向含权网络,对各个节点的重要性进行迭代计算,直至有向含权网络达到稳态;
1032、根据稳态时的有向含权网络,计算各个节点的重要性分数,并根据各个节点的重要性分数对各个节点的重要性进行排序。
其中,根据加入有背景节点的有向含权网络,迭代计算各个节点的重要性,每进行一次迭代,判断一下有向含权网路是否达到稳态,若没有达到稳态继续对节点的重要性进行迭代,直至有向含权网络达到稳态为止,其中,有向含权网络的稳态指的是在对节点的重要性进行迭代时有向含权网络达到一定状态不再改变,例如有向含权网络中节点的资源分布值不在改变,可以理解的是若只在很小的误差范围内改变也可以认为是资源分布值不再改变。确定有向含权网络的稳态之后,计算在稳态时有向含权网络中每个节点的重要性分数,以重要性分数的高低来表示各个节点的重要性,从而依据每个节点的重要性分数从高到低,依次可以排序出的各个节点的排名先后。
进一步的,在本发明的一些实施例中,步骤1031根据有向含权网络,对各个节点的重要性进行迭代计算,直至有向含权网络达到稳态,具体可以包括如下步骤:
B1、在加入有背景节点的有向含权网络G′中原有的所有节点上各分配一单位的资源,则分配资源的时刻为在加入有背景节点的有向含权网络G′上资源开始扩散的初始时刻;
B2、计算加入有背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P;
B3、从初始时刻开始,相隔预置的时间步,将有向含权网络中的每个节点上分配的资源按照转移概率矩阵向其指向的其它节点进行转移,并计算资源转移后的每个节点上的资源分布值;
B4、随着时间的增加,根据所述转移概率矩阵对每个节点上的资源分布值进行迭代,直至相邻时间步中有向含权网络中每个节点的资源数保持不变。
对于步骤B1,在有向含权网络中添加过背景节点之后,只在有向含权网络中原有的所有节点上各分配一单位的资源,含有背景节点的有向含权网络就可以随机游走,进行资源分配,那么在分配资源的时刻就是在有向含权网络上资源开始扩散的初始时刻。
对于步骤B2,计算出加入有背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P,也就是说,只有建立有交互关系的两个节点之间才有边,计算出每个节点在指向建立有交互关系的节点时产生的转移概率矩阵,用P来表示转移概率矩阵,例如有向含权网络G′中的节点x,当该节点x指向节点y时,资源从节点x转移到节点y的概率为P(x,y),并且P(x,y)是P中对应于第x行第y列的元素,当有向含权网络G′中还有别的节点时,P中还可包括对应于别的节点的转移概率矩阵。
进一步的,对于步骤B2计算加入有背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P,具体包括如下步骤:
通过如下方式计算节点x指向节点y之间的边时产生的转移概率值P(x,y):
P ( x , y ) = w a ( x , y ) / Σ y = 1 N + 1 w a ( x , y ) ;
其中,wa(x,y)为节点x与节点y之间的边的权重w(x,y)的a次方,a为可调节参数,a的取值为0至1之间的数值,N为有向含权网络中原有的所有节点的个数,节点x和节点y为加入有背景节点的有向含权网络G′中建立有边的两个节点。
对于步骤B3,在含有背景节点的有向含权网络上用随机游走进行资源分配,定义每次游走都是相隔一个预置的时间步,则从初始时刻到第一个时间步之后,将有向含权网络中的每个节点上分配的资源按照转移概率矩阵向其指向的其它节点进行转移,则有向含权网络中的所有节点都会向其指向的其它节点进行一次资源转移,然后计算资源转移后的每个节点上的资源分布值,其中,每个节点上的资源分布值可以表示有向含权网络中在进行过一次资源转移后该节点上的资源变动情况,例如,节点A上的资源分布值可以表示在有向含权网络中在完成一次资源转移后的节点A上的资源变化,资源变化具体可以指节点A上的资源数增加了、或者减少、或者保持不变。
对于步骤B4,完成从初始时刻到第一个时间步之后进行资源转移,当完成资源转移并计算清楚每个节点的资源分布值之后,进入下一时间步开始新一轮迭代,即从第一个时间步到第二个时间步之后,重新计算每个节点的资源分布值,则通过两次资源转移,从两次分别计算出的资源分布向量上就可以确定,在经过一个时间步之后各个节点上的资源变化情况。依据步骤B5中描述的迭代方式进行多次迭代计算,直到有向含权网络中各节点的资源数保持稳定时,可以停止迭代计算。本发明实施例中使用迭代法进行资源向量的计算,通过逐次逼近,先取一个粗糙的近似值,然后用同一个递推公式,反复校正此初值,直至达到有向含权网络的稳定这个精度要求时停止迭代计算。
进一步的,步骤B4随着时间的增加,根据转移概率矩阵对每个节点上的资源分布值进行迭代,具体可以包括:
通过如下方式计算在时间步为t时所有节点上的资源分布向量
s → ( t ) = P T × s → ( t - 1 ) ;
其中,为在时间步为(t-1)时有向含权网络中所有节点上的资源分布向量,PT为对方阵P的转置,方阵P为有向含权网络中所有节点之间资源的转移概率矩阵。
也就是说,以节点x作为有向含权网络中的任意一个节点,对节点x上的资源分布值进行迭代给出计算公式,那么有向含权网络中除节点x以外的其它节点在进行迭代时也可以使用类似的实现方式,其中,以时间步从(t-1)到t作为改变的相隔时间步的长度,那么对于上述公式中,(t-1)和t可以继续进行迭代,例如可以将t换做(t+1),将(t-1)换做t,则可以计算出从t到(t+1)的时间步的长度内节点x的资源分布值。
在步骤1031具体为步骤B1至步骤B4的实现场景下,步骤1032根据稳态时的有向含权网络,计算各个节点的重要性分数,具体可以包括如下步骤:
C1、获取稳态时的有向含权网络中原有的所有节点的资源分布向量其元素为si(∞),中的元素si(∞)表示第i个节点的资源分布值,其中,i为有向含权网络中任意一个节点,i满足如下条件:1≤i≤N+1,N为有向含权网络中原有的所有节点的个数,∞表示达到稳态时的时间步的长度;
C2、获取稳态时的有向含权网络中背景节点的资源分布值sN+1(∞);
C3、通过如下方式计算节点i的重要性分数Ri
Ri=si(∞)+sN+1(∞)/N。
其中,步骤C1和步骤C2之间没有时序先后顺序之分,可以先执行其中任意一个,还可以同时执行两个步骤,从而获取到在稳态时的有向含权网络中原有的N个节点的资源费分布函数和背景节点的资源分布值,在步骤C3中,对于有向含权网络中的原有的N个节点,每个节点的重要性分数都包括两个部分:一个是自身节点的资源数,另一个是从背景节点获得资源数,这两者相加就得到了一个节点的重要性分数。
通过以上实施例对本发明实施例的描述可知,首先从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息,然后根据获取到的节点日志信息在拓扑网络中加入含权性和有向性,得到有向含权网络,最后根据有向含权网络对各个节点的重要性进行排序,从而可以得到各个节点的重要性排名。本发明实施例中各个节点可以对应于社交网络中的各个用户,通过对节点重要性的排序可以从社交网络中挖掘出重要用户,故可以实现社交网络中重要用户挖掘,本发明实施例中对节点重要性的排序是通过各个节点之间的交互行为进行挖掘以及有向含权网络来实现的,重要性排序的结果精度高,由于有向含权网络中已经添加了与原有的所有节点都建立有双向链接关系的背景节点,使得出度为零的节点也可以实现跳转,故不需要引入随机跳转概率,所以不受随机跳转概率参数的影响,并且对于节点之间没有相互链接的跨集团的拓扑网路也同样适用。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
请参阅图2-a所示,本发明实施例提供的一种节点重要性排序的系统200,可以包括:信息获取模块201、网络转化模块202、节点添加模块203、重要性排序模块204,其中,
信息获取模块201,用于获取拓扑网络中各个节点之间交互的节点日志信息;
网络转化模块202,用于根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网络;
节点添加模块203,用于在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;
重要性排序模块204,用于根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得到所述各个节点的重要性排名。
在本发明的一些实施例中,所述节点日志信息,包括:交互的两个节点中交互发起方的标识号ID和交互接收方的ID,交互行为类型,所述交互发起方的属性、交互时间。
在本发明的一些实施例中,请参阅如图2-b所示,节点重要性排序的系统200相比较于如图2-a所述的系统,节点重要性排序的系统200还包括:信息处理模块205,其中,
所述信息处理模块205,用于所述信息获取模块201从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息之后,对所述交互发起方的ID和所述交互接收方的ID进行匿名化处理;对所述交互行为类型和所述交互发起方的属性进行泛化处理。
在本发明的一些实施例中,所述网络转化模块202,具体用于通过如下公式来表示所述有向含权网络中的节点之间交互:
G=(V,E,L,Lv,Le);
其中,所述G为所述有向含权网络,所述V是节点的集合,所述V={V1,V2,……,VN},所述N为所述有向含权网络中所有节点的个数,所述E是边的集合,所述E={(Vi,Vj,t)},所述i=1,2,……,N,所述j=1,2,……,N,所述t为所述Vi和所述Vj之间存在关系的时刻,所述Vi和所述Vj为所述V中存在关系的两个节点,所述L为标签集,所述Lv为节点标签函数,所述Le为边标签函数。
在本发明的一些实施例中,请参阅如图2-c所示,所述重要性排序模块204,包括:
计算子模块2041,用于根据加入有所述背景节点的有向含权网络,对所述各个节点的重要性进行迭代计算,直至所述有向含权网络达到稳态;
排序子模块2042,用于根据稳态时的有向含权网络,计算所述各个节点的重要性分数,并根据所述各个节点的重要性分数对所述各个节点的重要性进行排序。
在本发明的一些实施例中,请参阅如图2-d所示,所述计算子模块2041,包括:
初始资源分配单元20411,用于在加入有背景节点的有向含权网络G′中原有的所有节点上各分配一单位的资源,则分配所述资源的时刻为在加入有背景节点的有向含权网络G′上所述资源开始扩散的初始时刻;
转移概率计算单元20412,用于计算所述加入有所述背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P;
资源分布计算单元20413,用于从所述初始时刻开始,相隔预置的时间步,将所述有向含权网络中的每个节点上分配的资源按照所述转移概率矩阵向其指向的其它节点进行转移,并计算资源转移后的每个节点上的资源分布值;
迭代单元20414,用于随着时间的增加,根据所述转移概率矩阵对每个节点上的资源分布值进行迭代,直至相邻时间步中所述有向含权网络中每个节点的资源数保持不变。
进一步的,所述转移概率计算单元20412,具体用于通过如下方式计算节点x指向节点y之间的边时产生的转移概率矩阵P(x,y):
P ( x , y ) = w a ( x , y ) / Σ y = 1 N + 1 w a ( x , y ) ;
其中,所述wa(x,y)为所述节点x与节点y之间的边的权重w(x,y)的a次方,所述a为可调节参数,a的取值为0至1之间的数值,所述N为所述有向含权网络中原有的所有节点的个数,所述节点x和所述节点y为所述G′中建立有边的两个节点。
具体的,所述迭代单元20414,具体用于通过如下方式计算在所述时间步为t时所有节点的资源分布向量
s → ( t ) = P T × s → ( t - 1 ) ;
其中,所述为在所述时间步为(t-1)时所有N+1个节点上的资源分布向量,所述PT为对方阵P的转置,所述P为节点之间的转移概率矩阵,其元素P(x,y)为资源从所述节点x向节点y转移的概率。
在本发明的一些实施例中,请参阅如图2-e所示,所述排序子模块2042,包括:
资源分布获取单元20421,用于获取稳态时的有向含权网络中所有节点的资源分布向量 中的元素si(∞)表示第i个节点的资源分布值,其中,所述i为所述有向含权网络中原有的任意一个节点,所述i满足如下条件:1≤i≤N+1,所述N为所述有向含权网络中原有的所有节点的个数,所述∞表示达到稳态时的时间步的长度;获取稳态时的有向含权网络中所述背景节点的资源分布值为sN+1(∞);
重要性分数计算单元20422,用于通过如下方式计算节点i的重要性分数Ri:Ri=si(∞)+sN+1(∞)/N。
通过以上对本发明实施例的描述可知,首先从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息,然后根据获取到的节点日志信息在拓扑网络中加入含权性和有向性,得到有向含权网络,最后根据有向含权网络对各个节点的重要性进行排序,从而可以得到各个节点的重要性排名。本发明实施例中各个节点可以对应于社交网络中的各个用户,通过对节点重要性的排序可以从社交网络中挖掘出重要用户,故可以实现社交网络中重要用户挖掘,本发明实施例中对节点重要性的排序是通过各个节点之间的交互行为进行挖掘以及有向含权网络来实现的,重要性排序的结果精度高,由于有向含权网络中已经添加了与原有的所有节点都建立有双向链接关系的背景节点,使得出度为零的节点也可以实现跳转,故不需要引入随机跳转概率,所以不受随机跳转概率参数的影响,并且对于节点之间没有相互链接的跨集团的拓扑网路也同样适用。
图3是本发明实施例提供的节点重要性排序的方法应用于一种服务器的结构示意图,该服务器300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在服务器300上执行存储介质330中的一系列指令操作。
服务器300还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图2-a、图2-b、图2-c、图2-d、图2-e所示的节点重要性排序的系统所执行的方法。
为便于更好的理解和实施本发明实施例的上述方案,下面举例相应的应用场景来进行具体说明通过社交网络上用户之间的交互行为挖掘重要用户的方法,通过迭代分析资源在网络上的转移过程直至网络达到稳态来获得每个节点重要性的排名,从而挖掘重要社交网络用户,本发明实施例中节点重要性排序的方法可以提高挖掘精度,减少挖掘时间,具体的,本发明实施例中所述的社交网络应用包括但不限于微博、facebook、腾讯qq、微信等社交软件或平台。
首先举例说明本发明实施例提供的节点重要性排序的系统的实现架构,请参阅如图4所示,为本发明实施例提供的节点重要性排序的系统的实现架构示意图,其中,节点重要性排序的系统包括:信息获取模块、网络转化模块、节点添加模块、重要性排序模块,接下来对各个模块的实现方式分别进行说明。
信息获取模块:
该模块从社交网络应用服务器获得社交网络用户日志信息,在获取的过程中,例如,用户通过移动终端01、笔记本02、台式计算机03与社交网络中的其它用户产生交互行为,社交网络应用服务器04收集社交网络中各个用户之间的交互行为数据,并向信息获取模块上报。另外,信息获取模块还需要对社交网络用户的身份信息和敏感信息进行隐私保护处理。
例如,不同的社交网络,用户以及用户间的交互数据有着不同的表现,用户还有用户属性或者用户标签来表示其在社交网络中的活跃度、影响力等。信息获取模块获取到的日志信息具体可简化为表1所示:
表1简化的社交网络数据
时间 交互发起方ID 交互接收方ID 交互行为 交互发起方属性
2013/11/23/09/20/33 Dakj93 Ljk23 2 3720392
其中,在日志信息中记录了社交网络数据,可包括交互时间、交互发起方ID、交互接收方ID、交互行为的类型、交互行为发起方属性。
进一步的,在获取到日志信息之后,为了保护社交网络的用户隐私,需要对其敏感字段,如姓名、电话等进行匿名化或者泛化处理。其步骤如下的步骤1)至步骤6):
输入:初始表T
输出:泛化表T’
1、T’为对T进行身份属性重新编码的结果表;
2、检查T’,将满足身份保持的匿名要求的元组添加分组标号;
3、当满足条件:T’中没有分组标号的元组数>0和标识属性组没有泛化到最高层次时,执行如下步骤:
a)选择一个标识属性;
b)对剩余元组的选定属性进行泛化;
c)对满足匿名要求的元组添加分组标号;
4、当满足条件:T’中没有分组标号的元组数>0时,执行如下步骤:
d)从可以移除元组的分组中移除元组,加入剩余元组中;
e)对满足匿名要求的元组添加分组标号;
5、如果满足如下条件:T’中没有分组标号的元组数>0,执行合并剩余元组到临近分组中;
6、返回T’,重新执行上述步骤。
网络转化模块:
社交网络上的用户交互行为可以抽象成为交互网络,从而得到有向含权网络:G=(V,E,L,Lv,Le),其中:
V是节点的集合,V={V1,V2,……,VN};
E是边的集合,E={(Vi,Vj,t)},其中i=1,2,……,N,j=1,2,……,N;
L为标签集,指节点和边的属性的集合;
Lv为节点标签函数,指节点到其标签的映射;
Le为边标签函数,指边到其标签的映射。
在交互网络中,节点Vi表示个体,边(Vi,Vj,t)表示Vi和Vj之间于时刻t存在关系。
随着各种数据存储和采集技术的发展,可以从社交网络用户交互行为数据中抽取到主要的社交团体网络结构,而这些网络拓扑结构对于研究社交团体结构、功能和社交演化有着重要的指导意义,因而完全子网是网络拓扑中最重要的结构之一。网络转化模块根据社交网络的无尺度特点,利用动态规划算法的思想,采用完全子图搜索算法,从而可以快速的抽取出社交网络中的全部完全子网,从而通过完全子网获取到社交网络中各个用户之间产生交互关系的边。
具体的,完全子网搜索算法的步骤如下:
I.按节点顺序(把社交网络数据中的N个节点分别记为1,2,…,i,…,N)搜索每个节点所在的完全子图,例如执行如下步骤:
(1)搜索节点i的邻居节点并计算节点i的度数;
(2)如果节点i的度数为0,则节点i自成一个完全子图,若否,则节点i与其任意邻居可以构成一个仅含两个节点的完全子图,依次判断其余邻居节点是否与包含节点i的完全子图构成一个新的更大的完全子图,若是则加入该邻居节点;
(3)对i增加1,若i<=N,则重复(1)和(2),若否向下继续。
II.对这N个节点所在的完全子图进行筛选,选出不重复的完全子图;
III.若社交网络数据中所有完全子图均已找出,则结束搜索。
节点添加模块
在有向含权网络中加入一个新的节点,定义为背景节点,得到加入有背景节点的有向含权网络,背景节点与有向含权网络中原有的所有节点建立有双向链接关系。
举例而言,根据微博上的朋友关注关系建立有向的社交网络,并有向的社交网络中节点之间的边赋予权重值,比如所有边都赋值为1,或者按照两个节点之间交互关系的次数或者频率对边进行赋值,然后添加背景节点以及背景节点和网络中所有节点之间的双向链接,然后赋予每个原网络中的边权重为1,背景节点指向原网络节点i的边权重为节点i入度的m次方,m是可调参数,节点i指向背景节点的边的权重为1,当i的取值表示原网络中的每个节点时,则每个节点指向背景节点的边的权重都是1。这样就可以建立完成含有背景节点的有向含权网络,基于这个含有背景节点的有向含权网络的随机游走过程就可以完成节点排序了。本发明实施例这种添加背景节点的方式相比于现有的PageRank算法,其优势在于,不需要人为定义随机跳转概率,可以处理原网络有不连通的情况,并且收敛速度快。
重要性排序模块:
该模块包括:计算子模块和排序子模块,其中,请参阅如图5所示,为计算子模块执行的方法流程示意图,其中,可以包括步骤:
S01、在网络原有的N个节点上各放置一单位的资源,该状态为资源在社交网络上扩散的初始时刻;
S02、计算添加背景节点后的有向网络G′的概率转移矩阵为P,其中的元素P(x,y)定义有以下两种表达式:
a1、对于有向网络G’是无权形式,或者有向含权网络的边权重都为1的时候,当存在由节点x指向节点y的边的时候,元素P(x,y)=1/k(x),其中k(x)为添加背景节点后的有向网络G′中节点x的出度。对于有向网络G’是含权网络,那么其中w(x,y)为有向边(x,y)的权重。更普遍的,可以引入一个参数a用于调节权重的作用,此时转移概率矩阵的元素定义为显然,当a=0,回到无权形式,当a=1回到含权形式,所以可以通过调整参数a得到最好的结果。
a2、当不存在节点x指向节点y之间的边的时候,w(x,y)=0,P(x,y)=0。
S03、从初始时刻开始,每隔一定的时间步,社交网络上各个节点上的分配资源按照转移概率矩阵P向该节点指向的节点转移,于是在时间步t时刻,节点上的资源分布值可由下式表示:
s → ( t ) = P T × s → ( t - 1 ) ,
其中,T表示矩阵的转置,根据进行迭代,如果没有达到稳态,则继续进行迭代。
S04、判断有向含权网络是否达到稳态,若经过一定时间步数后有向含权网络达到稳态,则结束整个迭代过程,若没有达到稳态,触发步骤S03继续执行。
需要说明的是,本发明实施例在添加背景节点的有向含权网络上进行随机游走的过程只有在有向含权网络上所有节点的资源达到稳态时才停止迭代,这种方式相比于现有的PageRank算法,其优势在于,在含有背景节点的有向含权网络上的随机游走过程有稳态解并收敛于唯一稳态解,另外本发明实施例中转移概率矩阵本身是稀疏的,可适用于处理超大规模网络。
另外,对于排序子模块,在稳态时候的资源分布向量为整个有向网络的总资源数守恒,就等于N,定义背景节点在稳态时的资源分布值为sN+1(∞),而其他节点在稳态时的资源数为si(∞),其中1≤i≤N+1,于是节点i最终的重要性分数为Ri=si(∞)+sN+1(∞)/N,按照重要性分数Ri从大到小排列即可得到最终的节点排名。
通过以上对本发明实施例的举例说明可知,将社交网络中获取到的用户日志信息进行隐私保护和图转化处理后,得到一个有向含权网络。在该网络中,加入一个背景节点,并且背景节点与有向含权网络中的每个节点都建立双向的链接;初始时刻给每个节点一单位的资源,然后在这个含有背景节点的有向含权网络中随机游走,进行资源分配,直到达到稳态;稳态时将背景节点的资源分配到其他节点中;稳态时,每个节点上的资源数加上从背景节点获得的资源数之和为该节点重要性的分数;按照重要性分数从高到低的顺序将节点排序,排在最前面的表示该节点越重要,或者说他的影响力越大。由于有向含权网络中已经添加了与原有的所有节点都建立有双向链接关系的背景节点,使得出度为零的节点也可以实现跳转,故不需要引入随机跳转概率,所以该方法解决了节点排序中悬摆链问题的同时,还解决了含有多个独立集团的网络排序问题,并且可以处理大规模数据。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (18)

1.一种节点重要性排序的方法,其特征在于,包括:
获取拓扑网络中各个节点之间交互的节点日志信息;
根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网络;
在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;
根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得到所述各个节点的重要性排名。
2.根据权利要求1所述的方法,其特征在于,所述节点日志信息,包括:交互的两个节点中交互发起方的标识号ID和交互接收方的ID,交互行为类型,所述交互发起方的属性、交互时间。
3.根据权利要求2所述的方法,其特征在于,所述从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息之后,所述方法还包括:
对所述交互发起方的ID和所述交互接收方的ID进行匿名化处理;
对所述交互行为类型和所述交互发起方的属性进行泛化处理。
4.根据权利要求1所述的方法,其特征在于,通过如下公式来表示所述有向含权网络中的节点之间交互:
G=(V,E,L,Lv,Le);
其中,所述G为所述有向含权网络,所述V是节点的集合,所述V={V1,V2,……,VN},所述N为所述有向含权网络中所有节点的个数,所述E是边的集合,所述E={(Vi,Vj,t)},所述i=1,2,……,N,所述j=1,2,……,N,所述t为所述Vi和所述Vj之间存在关系的时刻,所述Vi和所述Vj为所述V中存在关系的两个节点,所述L为标签集,所述Lv为节点标签函数,所述Le为边标签函数。
5.根据权利要求1所述的方法,其特征在于,所述根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,包括:
根据加入有所述背景节点的有向含权网络,对所述各个节点的重要性进行迭代计算,直至所述有向含权网络达到稳态;
根据稳态时的有向含权网络,计算所述各个节点的重要性分数,并根据所述各个节点的重要性分数对所述各个节点的重要性进行排序。
6.根据权利要求5所述的方法,其特征在于,所述根据加入有所述背景节点的有向含权网络,对所述各个节点的重要性进行迭代计算,直至所述有向含权网络达到稳态,包括:
在加入有所述背景节点的有向含权网络G′中原有的所有节点上各分配一单位的资源,则分配所述资源的时刻为在加入有所述背景节点的有向含权网络G′上所述资源开始扩散的初始时刻;
计算所述加入有所述背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P;
从所述初始时刻开始,相隔预置的时间步,将所述有向含权网络中的每个节点上分配的资源按照所述转移概率矩阵向其指向的其它节点进行转移,并计算资源转移后的每个节点上的资源分布值;
随着时间的增加,根据所述转移概率矩阵对每个节点上的资源分布值进行迭代,直至相邻时间步中所述有向含权网络中每个节点的资源数保持不变。
7.根据权利要求6所述的方法,其特征在于,所述计算所述加入有所述背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P,包括:
通过如下方式计算节点x指向节点y之间的边时产生的转移概率矩阵P(x,y):
P ( x , y ) = w a ( x , y ) / Σ y = 1 N + 1 w a ( x , y ) ;
其中,所述wa(x,y)为所述节点x与所述节点y之间的边的权重w(x,y)的a次方,所述a为可调节参数,其取值为0至1之间的数值,所述N为所述有向含权网络中原有的所有节点的个数,所述节点x和所述节点y为所述G′中建立有边的两个节点。
8.根据权利要求6所述的方法,其特征在于,所述随着时间步的增加,根据所述转移概率矩阵对每个节点上的资源分布值进行迭代,包括:
通过如下方式计算在所述时间步为t时所有节点上的资源分布向量s
s → ( t ) = P T × s → ( t - 1 ) ;
其中,所述为在所述时间步为(t-1)时有向含权网络中所有节点上的资源分布向量,所述PT为对方阵P的转置,所述方阵P为所述有向含权网络中所有节点之间资源的转移概率矩阵。
9.根据权利要求6所述的方法,其特征在于,所述根据稳态时的有向含权网络,计算所述各个节点的重要性分数,包括:
获取稳态时的有向含权网络中所有节点的资源分布向量所述中的元素si(∞)表示第i个节点的资源分布值,其中,所述i为所述有向含权网络中任意一个节点,所述i满足如下条件:1≤i≤N+1,所述N为所述有向含权网络中原有的所有节点的个数,所述∞表示达到稳态时的时间步的长度;
获取稳态时的有向含权网络中所述背景节点的资源分布值sN+1(∞);
通过如下方式计算节点i的重要性分数Ri
Ri=si(∞)+sN+1(∞)/N。
10.一种节点重要性排序的系统,其特征在于,所述系统包括:
信息获取模块,用于获取拓扑网络中各个节点之间交互的节点日志信息;
网络转化模块,用于根据所述节点日志信息在所述拓扑网络中加入含权性和有向性,得到有向含权网络;
节点添加模块,用于在所述有向含权网络中加入背景节点,得到加入有所述背景节点的有向含权网络,所述背景节点与所述有向含权网络中原有的所有节点建立有双向链接关系;
重要性排序模块,用于根据加入有所述背景节点的有向含权网络对所述各个节点的重要性进行排序,得到所述各个节点的重要性排名。
11.根据权利要求10所述的系统,其特征在于,所述节点日志信息,包括:交互的两个节点中交互发起方的标识号ID和交互接收方的ID,交互行为类型,所述交互发起方的属性、交互时间。
12.根据权利要求11所述的系统,其特征在于,所述系统还包括:信息处理模块,其中,
所述信息处理模块,用于所述信息获取模块从节点应用服务器获取拓扑网络中各个节点之间交互的节点日志信息之后,对所述交互发起方的ID和所述交互接收方的ID进行匿名化处理;对所述交互行为类型和所述交互发起方的属性进行泛化处理。
13.根据权利要求10所述的系统,其特征在于,所述网络转化模块,具体用于通过如下公式来表示所述有向含权网络中的节点之间交互:
G=(V,E,L,Lv,Le);
其中,所述G为所述有向含权网络,所述V是节点的集合,所述V={V1,V2,……,VN},所述N为所述有向含权网络中所有节点的个数,所述E是边的集合,所述E={(Vi,Vj,t)},所述i=1,2,……,N,所述j=1,2,……,N,所述t为所述Vi和所述Vj之间存在关系的时刻,所述Vi和所述Vj为所述V中存在关系的两个节点,所述L为标签集,所述Lv为节点标签函数,所述Le为边标签函数。
14.根据权利要求10所述的系统,其特征在于,所述重要性排序模块,包括:
计算子模块,用于根据加入有所述背景节点的有向含权网络,对所述各个节点的重要性进行迭代计算,直至所述有向含权网络达到稳态;
排序子模块,用于根据稳态时的有向含权网络,计算所述各个节点的重要性分数,并根据所述各个节点的重要性分数对所述各个节点的重要性进行排序。
15.根据权利要求14所述的系统,其特征在于,所述计算子模块,包括:
初始资源分配单元,用于在加入有所述背景节点的有向含权网络G′中原有的所有节点上各分配一单位的资源,则分配所述资源的时刻为在加入有所述背景节点的有向含权网络G′上所述资源开始扩散的初始时刻;
转移概率计算单元,用于计算所述加入有所述背景节点的有向含权网络G′的每个节点指向其它节点之间的边时产生的转移概率矩阵P;
资源分布计算单元,用于从所述初始时刻开始,相隔预置的时间步,将所述有向含权网络中的每个节点上分配的资源按照所述转移概率矩阵向其指向的其它节点进行转移,并计算资源转移后的每个节点上的资源分布值;
迭代单元,用于随着时间的增加,根据所述转移概率矩阵对每个节点上的资源分布值进行迭代,直至相邻时间步中所述有向含权网络中每个节点的资源数保持不变。
16.根据权利要求15所述的系统,其特征在于,所述转移概率计算单元,具体用于通过如下方式计算节点x指向节点y之间的边时产生的转移概率矩阵P(x,y):
P ( x , y ) = w a ( x , y ) / Σ y = 1 N + 1 w a ( x , y ) ;
其中,所述wa(x,y)为所述节点x与所述节点y之间的边的权重w(x,y)的a次方,所述a为可调节参数,其取值为0至1之间的数值,所述N为所述有向含权网络中原有的所有节点的个数,所述节点x和所述节点y为所述G′中建立有边的两个节点。
17.根据权利要求15所述的系统,其特征在于,所述迭代单元,具体用于通过如下方式计算在所述时间步为t时所有节点的资源分布向量
s → ( t ) = P T × s → ( t - 1 ) ;
其中,所述为在所述时间步为(t-1)时所述有向含权网络中所有节点上的资源分布向量,所述PT为对方阵P的转置,所述方阵P为所述有向含权网络中所有节点之间资源的转移概率矩阵。
18.根据权利要求15所述的系统,其特征在于,所述排序子模块,包括:
资源分布获取单元,用于获取稳态时的有向含权网络中原有的所有节点的资源分布向量所述中的元素si(∞)表示第i个节点的资源分布值,其中,所述i为所述有向含权网络中原有的任意一个节点,所述i满足如下条件:1≤i≤N+1,所述N为所述有向含权网络中原有的所有节点的个数,所述∞表示达到稳态时的时间步的长度;获取稳态时的有向含权网络中所述背景节点的资源分布值为sN+1(∞);
重要性分数计算单元,用于通过如下方式计算节点i的重要性分数Ri:Ri=si(∞)+sN+1(∞)/N。
CN201410597128.0A 2014-10-29 2014-10-29 一种节点重要性排序的方法和系统 Active CN105630800B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410597128.0A CN105630800B (zh) 2014-10-29 2014-10-29 一种节点重要性排序的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410597128.0A CN105630800B (zh) 2014-10-29 2014-10-29 一种节点重要性排序的方法和系统

Publications (2)

Publication Number Publication Date
CN105630800A true CN105630800A (zh) 2016-06-01
CN105630800B CN105630800B (zh) 2021-01-15

Family

ID=56045753

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410597128.0A Active CN105630800B (zh) 2014-10-29 2014-10-29 一种节点重要性排序的方法和系统

Country Status (1)

Country Link
CN (1) CN105630800B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106209446A (zh) * 2016-07-06 2016-12-07 北京交通大学 数据中心服务器的业务应用逻辑网络的构建方法
CN107767278A (zh) * 2016-08-15 2018-03-06 腾讯科技(深圳)有限公司 社群层次结构构建方法和装置
CN107977386A (zh) * 2016-10-25 2018-05-01 航天信息股份有限公司 一种识别审计事件中的敏感用户的方法及装置
CN108345999A (zh) * 2018-02-09 2018-07-31 重庆科技学院 一种基于动态规划的制造系统生产过程信息约简方法
CN109272225A (zh) * 2018-09-07 2019-01-25 大连海事大学 一种Bug追踪系统测试人员重要性排序方法
CN110347973A (zh) * 2019-07-15 2019-10-18 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110366205A (zh) * 2019-08-05 2019-10-22 北京邮电大学 移动机会网络流量卸载中初始源节点的选择方法和装置
CN111355616A (zh) * 2020-03-17 2020-06-30 电子科技大学 一种基于物理层数据的战术通信网关键节点识别方法
CN111708845A (zh) * 2020-05-07 2020-09-25 北京明略软件系统有限公司 一种身份匹配方法和装置
CN112073126A (zh) * 2020-08-14 2020-12-11 合肥本源量子计算科技有限责任公司 一种网络节点重要性的排序方法及装置
CN112600830A (zh) * 2020-12-07 2021-04-02 腾讯科技(深圳)有限公司 业务数据处理方法、装置、电子设备及存储介质
WO2021109874A1 (zh) * 2019-12-03 2021-06-10 中兴通讯股份有限公司 拓扑图生成方法、异常检测方法、装置、设备及存储介质
CN115001982A (zh) * 2022-06-19 2022-09-02 复旦大学 基于节点重要性估计的在线社交网络拓扑推断算法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321190A (zh) * 2008-07-04 2008-12-10 清华大学 一种异构网络中的推荐方法及推荐系统
CN101770487A (zh) * 2008-12-26 2010-07-07 聚友空间网络技术有限公司 社交网络中用户影响力的计算方法和系统
CN101976245A (zh) * 2010-10-09 2011-02-16 吕琳媛 网络中节点重要性的排序方法
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
US20140155043A1 (en) * 2011-12-22 2014-06-05 Cygnus Broadband, Inc. Application quality management in a communication system
CN104035978A (zh) * 2014-05-26 2014-09-10 南京泰锐斯通信科技有限公司 社团发现方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321190A (zh) * 2008-07-04 2008-12-10 清华大学 一种异构网络中的推荐方法及推荐系统
CN101770487A (zh) * 2008-12-26 2010-07-07 聚友空间网络技术有限公司 社交网络中用户影响力的计算方法和系统
CN101976245A (zh) * 2010-10-09 2011-02-16 吕琳媛 网络中节点重要性的排序方法
US20140155043A1 (en) * 2011-12-22 2014-06-05 Cygnus Broadband, Inc. Application quality management in a communication system
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
CN104035978A (zh) * 2014-05-26 2014-09-10 南京泰锐斯通信科技有限公司 社团发现方法及系统

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106209446A (zh) * 2016-07-06 2016-12-07 北京交通大学 数据中心服务器的业务应用逻辑网络的构建方法
CN106209446B (zh) * 2016-07-06 2019-07-09 北京交通大学 数据中心服务器的业务应用逻辑网络的构建方法
CN107767278A (zh) * 2016-08-15 2018-03-06 腾讯科技(深圳)有限公司 社群层次结构构建方法和装置
CN107767278B (zh) * 2016-08-15 2021-08-24 腾讯科技(深圳)有限公司 社群层次结构构建方法和装置
CN107977386A (zh) * 2016-10-25 2018-05-01 航天信息股份有限公司 一种识别审计事件中的敏感用户的方法及装置
CN108345999A (zh) * 2018-02-09 2018-07-31 重庆科技学院 一种基于动态规划的制造系统生产过程信息约简方法
CN108345999B (zh) * 2018-02-09 2021-09-28 重庆科技学院 一种基于动态规划的制造系统生产过程信息约简方法
CN109272225A (zh) * 2018-09-07 2019-01-25 大连海事大学 一种Bug追踪系统测试人员重要性排序方法
CN110347973A (zh) * 2019-07-15 2019-10-18 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN110366205A (zh) * 2019-08-05 2019-10-22 北京邮电大学 移动机会网络流量卸载中初始源节点的选择方法和装置
WO2021109874A1 (zh) * 2019-12-03 2021-06-10 中兴通讯股份有限公司 拓扑图生成方法、异常检测方法、装置、设备及存储介质
US11797360B2 (en) 2019-12-03 2023-10-24 Zte Corporation Method for generating topology diagram, anomaly detection method, device, apparatus, and storage medium
CN111355616B (zh) * 2020-03-17 2022-10-14 电子科技大学 一种基于物理层数据的战术通信网关键节点识别方法
CN111355616A (zh) * 2020-03-17 2020-06-30 电子科技大学 一种基于物理层数据的战术通信网关键节点识别方法
CN111708845A (zh) * 2020-05-07 2020-09-25 北京明略软件系统有限公司 一种身份匹配方法和装置
CN111708845B (zh) * 2020-05-07 2023-05-19 北京明略软件系统有限公司 一种身份匹配方法和装置
CN112073126A (zh) * 2020-08-14 2020-12-11 合肥本源量子计算科技有限责任公司 一种网络节点重要性的排序方法及装置
CN112600830A (zh) * 2020-12-07 2021-04-02 腾讯科技(深圳)有限公司 业务数据处理方法、装置、电子设备及存储介质
CN112600830B (zh) * 2020-12-07 2024-03-26 腾讯科技(深圳)有限公司 业务数据处理方法、装置、电子设备及存储介质
CN115001982A (zh) * 2022-06-19 2022-09-02 复旦大学 基于节点重要性估计的在线社交网络拓扑推断算法
CN115001982B (zh) * 2022-06-19 2024-02-02 复旦大学 基于节点重要性估计的在线社交网络拓扑推断方法

Also Published As

Publication number Publication date
CN105630800B (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN105630800A (zh) 一种节点重要性排序的方法和系统
CN108885713B (zh) 图像分类神经网络
CN104995870A (zh) 多目标服务器布局确定
CN106469413B (zh) 一种虚拟资源的数据处理方法及装置
Xuan et al. Voronoi-based multi-level range search in mobile navigation
CN104980462B (zh) 分布式计算方法、装置和系统
CN110298687B (zh) 一种区域吸引力评估方法及设备
CN105528407A (zh) 一种获取l个具有最佳传播影响力用户的方法和装置
CN104820945A (zh) 基于社团结构挖掘算法的在线社会网络信息传播最大化方法
CN109951377A (zh) 一种好友分组方法、装置、计算机设备和存储介质
CN107453928A (zh) 一种电力通信网节点重要度评价方法及装置
CN112052404A (zh) 多源异构关系网络的群体发现方法、系统、设备及介质
CN109446385A (zh) 一种建立网络资源的设备图谱的方法以及所述设备图谱的使用方法
Pagani et al. Power grid network evolutions for local energy trading
CN112100450A (zh) 一种图计算数据分割方法、终端设备及存储介质
CN107222410B (zh) 链接预测的方法、装置、终端及计算机可读存储介质
Yuan et al. Clifford algebra method for network expression, computation, and algorithm construction
CN103744933A (zh) 一种基于并行化模块度优化的社区发现方法
CN106815274A (zh) 基于Hadoop的日志数据挖掘方法及系统
CN107358308A (zh) 实现社会网络影响力最大化的方法和装置
Srinivasan et al. A novel multicriteria optimization technique for VLSI floorplanning based on hybridized firefly and ant colony systems
Shang Mean commute time for random walks on hierarchical scale-free networks
Yin et al. Shortest paths based web service selection in internet of things
CN114629767A (zh) 电力调度网络仿真方法、装置、计算机设备和存储介质
Lu Fast methods for designing circulant network topology with high connectivity and survivability

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant