CN111079058B - 一种基于节点重要性的网络节点表示方法及装置 - Google Patents

一种基于节点重要性的网络节点表示方法及装置 Download PDF

Info

Publication number
CN111079058B
CN111079058B CN201911293994.XA CN201911293994A CN111079058B CN 111079058 B CN111079058 B CN 111079058B CN 201911293994 A CN201911293994 A CN 201911293994A CN 111079058 B CN111079058 B CN 111079058B
Authority
CN
China
Prior art keywords
node
network
nodes
importance
random walk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911293994.XA
Other languages
English (en)
Other versions
CN111079058A (zh
Inventor
何政
朱玟谦
叶刚
傅佑铭
王中元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201911293994.XA priority Critical patent/CN111079058B/zh
Publication of CN111079058A publication Critical patent/CN111079058A/zh
Application granted granted Critical
Publication of CN111079058B publication Critical patent/CN111079058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了‑一种基于节点重要性的网络节点表示方法及装置,其中的方法包括:确定网络中各个节点的重要性;根据节点的重要性计算出游走至每个节点的概率;基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;采用预设神经网络模型对构建的随机游走节点序列进行向量化表示。本发明可以实现置信度更高,鲁棒性更强的网络节点表示,为节点的精准分类、社团准确划分提供重要的工作基础。

Description

一种基于节点重要性的网络节点表示方法及装置
技术领域
本发明涉及向量表示技术领域,具体涉及一种基于节点重要性的网络节点表示方法及装置。
背景技术
随着数据科学的迅速发展与大数据的广泛普及,具有网络结构的数据,如在线社交用户关系网络,论文-作者关系网络等,作为非结构化数据的典型代表,已经成为人们工作生活和科研领域中最为重要的数据类型之一。网络节点表示学习作为网络数据分析中重要的研究内容与重要地位,被广泛应用于节点关系挖掘,网络社团划分等重要方面。网络节点表示学习立足于网络拓扑结构特征,根据节点所在局部/全局的拓扑位置,实现节点的向量化表达,从而实现节点分类,社团划分等网络结构数据挖掘任务。
现有技术中,网络结构节点特征学习方法大多通过随机游走的方式,获取节点局部位置结构信息(以节点序列的形式),再根据获节点序列,构建节点共现概率分布特征,通过类word2vec的算法架构,对节点进行向量化表达。常用的经典算法如DeepWalk,Node2Vec等算法都具有类似架构。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
1、与词向量不同,节点序列的生成依赖于随机游走策略的选择,因此随机游走参数的细微不同都可能影响最后的节点向量表达结果。
2、一般的随机游走策略只考虑深度优先和宽度优先,忽略了节点的重要性在随机游走与节点序列构建中发挥的作用;
3、常用的随机游走策略可能会出现回溯现象,即A→B→A。
由此可知,现有技术中的方法存在鲁棒性和置信度不高的技术问题。
发明内容
有鉴于此,本发明提供了一种基于节点重要性的网络节点表示方法及装置,用以解决或者至少部分解决现有技术中的方法存在的鲁棒性和置信度不高的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种基于节点重要性的网络节点表示方法,包括:
步骤S1:确定网络中各个节点的重要性;
步骤S2:根据节点的重要性计算出游走至每个节点的概率;
步骤S3:基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;
步骤S4:采用预设神经网络模型对构建的随机游走节点序列进行向量化表示。
在一种实施方式中,步骤S1具体包括:
采用计算节点的PageRank值的方法确定网络中各个节点的重要性。
在一种实施方式中,采用计算节点的PageRank值的方法确定网络中各个节点的重要性,包括:
步骤S1.1:将网络中所有节点的PageRank值初始化为1/N,其中,N表示网络节点的总个数;
步骤S1.2:给定一个比例因子s∈(0,1),将每个节点在第k-1步时的PageRank值平分给它指向的邻居节点,获得节点其所指向的节点的PR值:其中,邻域节点表示在有向网络中与当前节点存在连边的节点,PRi(k-1)表示节点i在第k-1时PageRank值,/>表示节点i的出度;
步骤S1.3:将得到的每个节点的当前PageRank值通过比例因子s进行缩减;
步骤S1.4:重复执行步骤S1.1~步骤S1.3直到网络中每个节点的PR值收敛到固定值,得到网络中任一节点i的PageRank值,计算公式为:
其中,N是网络节点的总数,aji是连边指示函数:节点j与节点i存在指向i的连边时,aji=1,否则aji=0。
在一种实施方式中,步骤S2中游走概率的计算方式为:
其中,β表示节点回游容忍度的参数,nodek表示第k步到达的节点,N(nodek)表示节点nodek的邻居节点集合,PR(j)表示节点j的PageRank值,上述公式表示在第k步后,游走至节点j的概率计算公式。
在一种实施方式中,步骤S3具体包括:
步骤S3.1:确定随机游走的参数:每个节点随机游走的次数为α,单次游走最大步长为t;
步骤S3.2:对网络中的每个节点进行随机游走,以任意一个节点vi为起始点,进行α次随机游走,当游走步长等于t时,结束单次游走,生成的节点序列为其中,/>(l)表示节点vi在第l次游走后产生的节点序列。
在一种实施方式中,步骤S4包括:将节点作为单词,每次得到的随机游走节点序列作为是文本中的句子,利用SkipGram模型对节点进行向量化表达,其中,SkipGram在节点嵌入中的优化函数表示为:
其中,w表示滑动窗口的大小,Φ(vi)表示节点vi的向量化表达Pr({vi-w,…,vi+w}\vi|Φ(vi))表示节点vi在全局中与各窗口内单词的共现概率分布,Pr(vj|Φ(vi))表示单个窗口内节点vi与对应窗口内单词共现的概率。
基于同样的发明构思,本发明第二方面提供了一种基于节点重要性的网络节点表示装置,包括:
节点重要性确定模块,用于确定网络中各个节点的重要性;
游走概率计算模块,根据节点的重要性计算出游走至每个节点的概率;
随机游走节点序列构建模块,用于基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;
向量化表示模块,用于采用预设神经网络模型对构建的随机游走节点序列进行向量化表示。
在一种实施方式中,节点重要性确定模块具体用于:
采用计算节点的PageRank值的方法确定网络中各个节点的重要性。
基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。
基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现第一方面所述的方法。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明提供的一种基于节点重要性的网络节点表示方法,首先确定网络中各个节点的重要性;然后根据节点的重要性计算出游走至每个节点的概率;接着基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;最后采用预设神经网络模型对构建的随机游走节点序列进行向量化表示。
由于本发明的方法,充分考虑了网络中节点重要性对节点表达存在的间接性影响,利用重要节点具有更稳定的拓扑性质,更丰富的潜在关系表达,设计出基于节点重要性的随机游走策略,将节点共现关系分布与网络节点重要性分布相结合,从而实现置信度更高,鲁棒性更强的网络节点表示,为节点的精准分类、社团准确划分提供重要的工作基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于节点重要性的网络节点表示方法的流程图;
图2为本发明实施例中进行节点向量化表达所采用的神经网络结构的示意图;
图3为本发明提供的网络节点表示方法的整体实现流程图;
图4为本发明实施例中基于节点重要性的网络节点表示装置的结构框图;
图5为本发明实施例中一种计算机可读存储介质的结构框图;
图6为本发明实施例中计算机设备的结构图。
具体实施方式
本申请发明人通过大量的研究与实践发现,现有技术中的节点序列的生成依赖于随机游走策略的选择,随机游走参数存在细微的变化都可能影响到最后的节点向量表达结果,因此导致表示的向量鲁棒性不高,并且,一般的随机游走策略只考虑深度优先和宽度优先,忽略了节点的重要性在随机游走与节点序列构建中发挥的作用,而重要性较高的节点比一般节点具有更稳定的局部拓扑结构和更深层的语义信息,因而,现有的方法由于信息得到的向量表示无法充分表达网络拓扑中的潜在关系,因此置信度不高,,常用的随机游走策略可能会出现回溯现象。
针对上述问题,本发明提供了一种基于节点重要性的网络节点表示方法,从而达到提高向量表示的鲁棒性和置信度的目的。
为了达到上述目的,本发明的主要构思如下:
充分考虑到网络中节点重要性对节点表达存在的间接性影响,利用重要节点具有更稳定的拓扑性质,更丰富的潜在关系表达,设计出基于节点重要性的随机游走策略,将节点共现关系分布与网络节点重要性分布相结合,从而实现置信度更高,鲁棒性更强的网络节点表示,为节点的精准分类、社团准确划分提供重要的工作基础。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本实施例提供了一种基于节点重要性的网络节点表示方法,请参见图1,该方法包括:
步骤S1:确定网络中各个节点的重要性。
其中,节点的重要性可以根据节点与其他节点的关系、节点在整个网络中的作用等确定。
在一种实施方式中,步骤S1具体包括:
采用计算节点的PageRank值的方法确定网络中各个节点的重要性。
具体来说,PageRank算法组开始用于网页排名,用PR值表示每个网页被PageRank算法附加的权值,本发明采用PageRank值来表示节点的重要性。
在一种实施方式中,采用计算节点的PageRank值的方法确定网络中各个节点的重要性,包括:
步骤S1.1:将网络中所有节点的PageRank值初始化为1/N,其中,N表示网络节点的总个数;
步骤S1.2:给定一个比例因子s∈(0,1),将每个节点在第k-1步时的PageRank值平分给它指向的邻居节点,获得节点其所指向的节点的PR值:PRi(k-1)/,其中,邻域节点表示在有向网络中与当前节点存在连边的节点,PRi(k-1)表示节点i在第k-1时PageRank值,/>表示节点i的出度;
步骤S1.3:将得到的每个节点的当前PageRank值通过比例因子s进行缩减;
步骤S1.4:重复执行步骤S1.1~步骤S1.3直到网络中每个节点的PR值收敛到固定值,得到网络中任一节点i的PageRank值,计算公式为:
其中,N是网络节点的总数,aji是连边指示函数:节点j与节点i存在指向i的连边时,aji=1,否则aji=0。
具体来说,在j=0时,网络中每个节点的PageRank值等值初始化为1/N,连边包括有向边和无向边,例如E-mail通信网络中用户A向用户B发送邮件,则该网络中存在一条由A指向B的有向连边,在无向网络中上述邻居节点是指与当前节点存在连边的节点(如线上社交网络中用户A和用户B存在好友关系,则该网络中存在一条连接A,B的无向连边)。如果节点i的出度为(在无向网络中用节点i的度ki代替出度/>),则计算出该节点所指向的每个节点分得的PR值。
s的默认值为0.85,当k足够大时,网络节点的PR值即会收敛至稳定状态,此时各节点的PR值即为节点的PageRank值。
步骤S2:根据节点的重要性计算出游走至每个节点的概率。
具体地,步骤S2中游走概率的计算方式为:
其中,β表示节点回游容忍度的参数,nodek表示第k步到达的节点,N(nodek)表示节点nodek的邻居节点集合,PR(j)表示节点j的PageRank值,上述公式表示在第k步后,游走至节点j的概率计算公式。
具体来说,公式(1)体现出PRandomWalk游走概率很大程度上由节点的PageRank值决定,而PageRank值则直接反映出节点的重要程度,因而PRandomWalk策略本质上是让稳定性更高,决策权重更大的节点参与到节点序列的表达中,从而实现网络节点的更稳定更可信的向量表达。
步骤S3:基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列。
其中,步骤S3具体包括:
步骤S3.1:确定随机游走的参数:每个节点随机游走的次数为α,单次游走最大步长为t;
步骤S3.2:对网络中的每个节点进行随机游走,以任意一个节点vi为起始点,进行α次随机游走,当游走步长等于t时,结束单次游走,生成的节点序列为其中,/>表示节点vi在第l次游走后产生的节点序列。
步骤S4:采用预设神经网络模型对构建的随机游走节点序列进行向量化表示。
在一种实施方式中,步骤S4包括:将节点作为单词,每次得到的随机游走节点序列作为是文本中的句子,利用SkipGram模型对节点进行向量化表达,其中,SkipGram在节点嵌入中的优化函数表示为:
其中,w表示滑动窗口的大小,Φ(vi)表示节点vi的向量化表达Pr({vi-w,…,vi+w}\vi|Φ(vi))表示节点vi在全局中与各窗口内单词的共现概率分布,Pr(vj|Φ(vi))表示单个窗口内节点vi与对应窗口内单词共现的概率。
具体来说,节点向量表示即通过SkipGram进行节点嵌入,SkipGram是一种经典的词向量化模型,其原理是利用神经网络架构式编码器对文本中的单词进行向量化编码,其优化目标/方向是最大化编码后的单词在给定大小窗口下的共现概率。本发明将节点当作单词,每次得到的随机游走序列作为文本中的句子,利用SkipGram模型实现节点的向量化表达。其中,SkipGram架构如附图2所示,并通过优化等式(2)来实现节点的向量化表达。整体实现流程如图3所示:
首先计算节点PageRank值,然后进行游走概率分布的计算,接着进行随机游走构建游走节点序列,再进行节点的向量化表达,具体包括创建滑动窗口、节点共现概率分布计算、神经网络(SkipGram模型的构建,也可以预先构建好),节点特征向量化表达,最后进行网络向量嵌入。
目前常用的网络节点表示方法对游走策略存在较高的依赖性,而绝大多数游走策略都是在搜索深度与广度限定范围下,根据场景需求,人工设定而成,难以精确挖掘源数据空间与表达向量空间的映射关系。本发明充分考虑到网络中节点重要性对节点表达存在的间接性影响,利用重要节点具有更稳定的拓扑性质,更丰富的潜在关系表达,设计出基于节点重要性的随机游走策略,将节点共现关系分布与网络节点重要性分布相结合,从而实现置信度更高,鲁棒性更强的网络节点表示,为节点的精准分类、社团准确划分提供重要的工作基础。
基于同一发明构思,本申请还提供了与实施例一中基于节点重要性的网络节点表示方法对应的装置,详见实施例二。
实施例二
本实施例提供了一种基于节点重要性的网络节点表示装置,请参见图4,该装置包括:
节点重要性确定模块201,用于确定网络中各个节点的重要性;
游走概率计算模块202,根据节点的重要性计算出游走至每个节点的概率;
随机游走节点序列构建模块203,用于基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;
向量化表示模块204,用于采用预设神经网络模型对构建的随机游走节点序列进行向量化表示。
在一种实施方式中,节点重要性确定模块具体用于:
采用计算节点的PageRank值的方法确定网络中各个节点的重要性。
实施例三
请参见图5,基于同一发明构思,本申请还提供了一种计算机可读存储介质300,其上存储有计算机程序311,该程序被执行时实现如实施例一中所述的方法。
由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中基于节点重要性的网络节点表示方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。
实施例四
基于同一发明构思,本申请还提供了一种计算机设备,请参见图6,包括存储401、处理器402及存储在存储器上并可在处理器上运行的计算机程序403,处理器402执行上述程序时实现实施例一中的方法。
由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中基于节点重要性的网络节点表示方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种基于节点重要性的网络节点表示方法,其特征在于,包括:
步骤S1:确定网络中各个节点的重要性;
步骤S2:根据节点的重要性计算出游走至每个节点的概率;
步骤S3:基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;
步骤S4:采用预设神经网络模型对构建的随机游走节点序列进行向量化表示;
其中,步骤S1为:采用计算节点的PageRank值的方法确定网络中各个节点的重要性,具体包括如下步骤:
步骤S1.1:将网络中所有节点的PageRank值初始化为1/N,其中,N表示网络节点的总个数;
步骤S1.2:给定一个比例因子s∈(0,1),将每个节点在第k-1步时的PageRank值平分给它指向的邻居节点,获得节点其所指向的节点的PR值:其中,邻域节点表示在有向网络中与当前节点存在连边的节点,PRi(k-1)表示节点i在第k-1时PageRank值,/>表示节点i的出度;
步骤S1.3:将得到的每个节点的当前PageRank值通过比例因子s进行缩减;
步骤S1.4:重复执行步骤S1.1~步骤S1.3直到网络中每个节点的PR值收敛到固定值,得到网络中任一节点i的PageRank值,计算公式为:
其中,N是网络节点的总数,aji是连边指示函数:节点j与节点i存在指向i的连边时,aji=1,否则aji=0;
步骤S2中游走概率的计算方式为:
其中,β表示节点回游容忍度的参数,nodek表示第k步到达的节点,N(nodek)表示节点nodek的邻居节点集合,PR(j)表示节点j的PageRank值,上述公式表示在第k步后,游走至节点j的概率计算公式。
2.如权利要求1所述的方法,其特征在于,步骤S3具体包括:
步骤S3.1:确定随机游走的参数:每个节点随机游走的次数为α,单次游走最大步长为t;
步骤S3.2:对网络中的每个节点进行随机游走,以任意一个节点vi为起始点,进行α次随机游走,当游走步长等于t时,结束单次游走,生成的节点序列为其中,/>表示节点vi在第l次游走后产生的节点序列。
3.如权利要求1所述的方法,其特征在于,步骤S4包括:将节点作为单词,每次得到的随机游走节点序列作为是文本中的句子,利用SkipGram模型对节点进行向量化表达,其中,SkipGram在节点嵌入中的优化函数表示为:
其中,w表示滑动窗口的大小,Φ(vi)表示节点vi的向量化表达Pr({vi-w,…,vi+w}\vi|Φ(vi))表示节点vi在全局中与各窗口内单词的共现概率分布,Pr(vj|Φ(vi))表示单个窗口内节点vi与对应窗口内单词共现的概率。
4.一种基于节点重要性的网络节点表示装置,其特征在于,包括:
节点重要性确定模块,用于确定网络中各个节点的重要性;
游走概率计算模块,根据节点的重要性计算出游走至每个节点的概率;
随机游走节点序列构建模块,用于基于计算出的概率对网络中的节点进行随机游走,构建随机游走节点序列;
向量化表示模块,用于采用预设神经网络模型对构建的随机游走节点序列进行向量化表示;
其中,节点重要性确定模块具体采用计算节点的PageRank值的方法确定网络中各个节点的重要性,包括如下步骤:
步骤S1.1:将网络中所有节点的PageRank值初始化为1/N,其中,N表示网络节点的总个数;
步骤S1.2:给定一个比例因子s∈(0,1),将每个节点在第k-1步时的PageRank值平分给它指向的邻居节点,获得节点其所指向的节点的PR值:其中,邻域节点表示在有向网络中与当前节点存在连边的节点,PRi(k-1)表示节点i在第k-1时PageRank值,/>表示节点i的出度;
步骤S1.3:将得到的每个节点的当前PageRank值通过比例因子s进行缩减;
步骤S1.4:重复执行步骤S1.1~步骤S1.3直到网络中每个节点的PR值收敛到固定值,得到网络中任一节点i的PageRank值,计算公式为:
其中,N是网络节点的总数,aji是连边指示函数:节点j与节点i存在指向i的连边时,aji=1,否则aji=0;
游走概率计算模块中游走概率的计算方式为:
其中,β表示节点回游容忍度的参数,nodek表示第k步到达的节点,N(nodek)表示节点nodek的邻居节点集合,PR(j)表示节点j的PageRank值,上述公式表示在第k步后,游走至节点j的概率计算公式。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至3中任一项权利要求所述的方法。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3中任一项权利要求所述的方法。
CN201911293994.XA 2019-12-16 2019-12-16 一种基于节点重要性的网络节点表示方法及装置 Active CN111079058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911293994.XA CN111079058B (zh) 2019-12-16 2019-12-16 一种基于节点重要性的网络节点表示方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911293994.XA CN111079058B (zh) 2019-12-16 2019-12-16 一种基于节点重要性的网络节点表示方法及装置

Publications (2)

Publication Number Publication Date
CN111079058A CN111079058A (zh) 2020-04-28
CN111079058B true CN111079058B (zh) 2023-07-28

Family

ID=70315160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911293994.XA Active CN111079058B (zh) 2019-12-16 2019-12-16 一种基于节点重要性的网络节点表示方法及装置

Country Status (1)

Country Link
CN (1) CN111079058B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112073220B (zh) * 2020-08-14 2022-08-16 合肥本源量子计算科技有限责任公司 一种网络评价模型的构建方法及装置
CN112700124B (zh) * 2020-12-29 2023-10-24 长安大学 多层交通网络mrwc节点重要性排序方法、系统、电子设备及计算机可读存储介质
CN115174450B (zh) * 2022-07-05 2023-10-03 中孚信息股份有限公司 一种基于网络节点表征的未知设备识别方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699617A (zh) * 2013-12-16 2014-04-02 西安交通大学 一种基于随机游走的社区发现方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
JP2014228975A (ja) * 2013-05-20 2014-12-08 日本電信電話株式会社 検索装置、検索方法および検索プログラム
CN106127595A (zh) * 2016-07-18 2016-11-16 安徽大学 一种基于正负边信息的社团结构检测方法
CN110011838A (zh) * 2019-03-25 2019-07-12 武汉大学 一种动态网络PageRank值的实时跟踪方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6005583B2 (ja) * 2013-05-23 2016-10-12 日本電信電話株式会社 検索装置、検索方法および検索プログラム
CN108009933B (zh) * 2016-10-27 2021-06-11 中国科学技术大学先进技术研究院 图中心性计算方法及装置
CN107276793B (zh) * 2017-05-31 2020-04-03 西北工业大学 基于概率跳转随机游走的节点重要性度量方法
US20190012386A1 (en) * 2017-07-05 2019-01-10 Technische Universitaet Darmstadt Method and device for flexible ranking system for information in a multi-linked network
CN107705212B (zh) * 2017-07-07 2021-06-15 江苏开放大学 一种基于粒子群随机游走的角色识别方法
CN107623594A (zh) * 2017-09-01 2018-01-23 电子科技大学 一种地理位置信息约束的三维层级网络拓扑可视化方法
CN110348469A (zh) * 2019-05-21 2019-10-18 广东工业大学 一种基于DeepWalk网络嵌入模型的用户相似度度量方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228975A (ja) * 2013-05-20 2014-12-08 日本電信電話株式会社 検索装置、検索方法および検索プログラム
CN103699617A (zh) * 2013-12-16 2014-04-02 西安交通大学 一种基于随机游走的社区发现方法
CN104008165A (zh) * 2014-05-29 2014-08-27 华东师范大学 一种基于网络拓扑结构和节点属性的社团检测方法
CN106127595A (zh) * 2016-07-18 2016-11-16 安徽大学 一种基于正负边信息的社团结构检测方法
CN110011838A (zh) * 2019-03-25 2019-07-12 武汉大学 一种动态网络PageRank值的实时跟踪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Social Network Discovery Based on Sensitivity Analysis;Tarik Crnovrsanin;IEEE;全文 *
基于节点向量表达的复杂网络社团划分算法;韩忠明;刘雯;李梦琪;郑晨烨;谭旭升;段大高;;软件学报(第04期) *

Also Published As

Publication number Publication date
CN111079058A (zh) 2020-04-28

Similar Documents

Publication Publication Date Title
CN111079058B (zh) 一种基于节点重要性的网络节点表示方法及装置
Myers An O (ND) difference algorithm and its variations
CN109902203B (zh) 基于边的随机游走的网络表示学习方法和装置
CN108681557B (zh) 基于自扩充表示和相似双向约束的短文本主题发现方法及系统
US20140108305A1 (en) Ranking for inductive synthesis of string transformations
CN108647350A (zh) 一种基于双通道网络的图文关联检索方法
CN109543176B (zh) 一种基于图向量表征的丰富短文本语义方法及装置
US20180276535A1 (en) Input-output example encoding
CN107967258B (zh) 文本信息的情感分析方法和系统
CN111930894B (zh) 长文本匹配方法及装置、存储介质、电子设备
JP7417679B2 (ja) 情報抽出方法、装置、電子機器及び記憶媒体
US9892532B2 (en) Apparatus and method for generating a shortest-path tree in a graph
CN110555305A (zh) 基于深度学习的恶意应用溯源方法及相关装置
Garrison et al. Sequence variation aware genome references and read mapping with the variation graph toolkit
CN112084781B (zh) 一种标准术语确定方法、装置及存储介质
CN111563161B (zh) 一种语句识别方法、语句识别装置及智能设备
CN112948608A (zh) 图片查找方法、装置、电子设备及计算机可读存储介质
CN116091152A (zh) 基于多层次对比学习与多模态知识图谱的推荐方法及系统
CN105893601B (zh) 一种数据对比方法
KR101866866B1 (ko) 부호화된 네트워크에서의 개인화된 랭킹 방법, 이를 수행하기 위한 기록 매체 및 장치
CN113032582A (zh) 一种基于知识图谱建立实体统一模型及实体统一方法
CN116595125A (zh) 一种基于知识图检索的开放域问答方法
CN116340507A (zh) 一种基于混合权重和双通道图卷积的方面级情感分析方法
CN115599392A (zh) 一种代码处理的方法、装置、介质及电子设备
CN104850646A (zh) 一种针对单个不确定图的频繁子图挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant