CN115314398A - 一种评估异质信息网络关键节点的方法 - Google Patents

一种评估异质信息网络关键节点的方法 Download PDF

Info

Publication number
CN115314398A
CN115314398A CN202211195029.0A CN202211195029A CN115314398A CN 115314398 A CN115314398 A CN 115314398A CN 202211195029 A CN202211195029 A CN 202211195029A CN 115314398 A CN115314398 A CN 115314398A
Authority
CN
China
Prior art keywords
node
network
nodes
type
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211195029.0A
Other languages
English (en)
Other versions
CN115314398B (zh
Inventor
占晓勇
舒坚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Hangkong University
Original Assignee
Nanchang Hangkong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Hangkong University filed Critical Nanchang Hangkong University
Priority to CN202211195029.0A priority Critical patent/CN115314398B/zh
Publication of CN115314398A publication Critical patent/CN115314398A/zh
Application granted granted Critical
Publication of CN115314398B publication Critical patent/CN115314398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种评估异质信息网络关键节点的方法,针对异质信息网络多类型节点与连边、网络结构复杂等特点,该方法通过约简网络中的节点以及连边,得到节点嵌入向量与边嵌入向量,进而构建图神经网络,得到关键节点评估模型。本发明在通过约简网络简化建模过程的同时,能够尽可能保留丰富的语义信息,通过对节点与连边进行表征学习,采用图神经网络建立评估模型,能够提高异质信息网络关键节点评估的准确性。

Description

一种评估异质信息网络关键节点的方法
技术领域
本发明涉及网络关键节点分析技术领域,特别是涉及一种评估异质信息网络关键节点的方法。
背景技术
现实生活中形形色色的系统,通常由大量类型各异、彼此交互的组件构成,例如社交、生物和计算机系统等。研究人员可以将系统中互相作用的组成抽象为信息网络。目前大部分网络中仅包含相同类型的对象与连接关系,这样往往只抽取了实际交互系统的部分信息或者没有区分对象及其之间关系的异质性,从而造成不可逆的信息损失。为了实现对现实世界更完整自然地抽象,更多研究者开始将系统网络数据建模为异质信息网络(HIN,Heterogeneous Information Network),例如引文网络、电影网络等。
在异质信息网络中,某些节点是整个网络的核心,具有重要的研究价值。网络中每一个节点的重要程度,决定了其在网络中的地位与作用,同时关乎整个网络的健壮性与安全性。比如在设计电力系统时,可以运用关键节点识别技术,对处于关键位置的设备进行保护,避免因某个节点的故障引发重大停电或其他事故。
现有的一些方法,例如基于网络局部性、基于机器学习的关键节点评估方法,在评价异质信息网络节点重要度时考虑因素较为单一,影响异质信息网络关键节点评估的准确性。
发明内容
针对上述问题,本发明的目的在于提出一种评估异质信息网络关键节点的方法,以解决现有技术考虑因素较为单一,异质信息网络关键节点评估的准确性的问题。
本发明采用的技术方案如下:
一种评估异质信息网络关键节点的方法,包括如下步骤:
步骤一,对异质信息网络进行节点类型约简操作,将异质信息网络约简为单节点类型多关系网络(MHIN, Multiplex Heterogeneous Information Network),选定源节点类型、设计对称元路径规则,将选定类型节点之间的对称元路径抽象为新的连边关系,同时根据不同连边关系,划分为不同关系子图,使用基于结构识别的网络表征方法(struc2vec)获得不同子图下的节点嵌入向量,最后将不同子图下的节点嵌入向量进行拼接,获得节点嵌入向量,并构建节点特征矩阵;
步骤二,对单节点类型多关系网络进行连边类型约简操作,将单节点类型多关系网络约简为语义化同质网络,根据所述对称元路径规则,通过数据集自带的文本信息,构建语料库,将节点间的语料信息,通过语言预训练模型(BERT, Bidirectional EncoderRepresentation from Transformers)进行连边关系聚合,获得连边嵌入向量;
步骤三,通过节点嵌入向量与连边嵌入向量得到邻居节点对中心节点的权重影响,构建权重矩阵,使用图卷积网络(GCN, Graph Convolutional Network)构建关键节点评估模型,将权重矩阵与节点特征矩阵作为模型输入,使用多层感知机(MLP, MultilayerPerceptron)输出重要度得分,得到关键节点排序结果。
上述评估异质信息网络关键节点的方法,其中,步骤一中,对异质信息网络进行节点类型约简操作具体包括:
设GHIN=(V, E, A, P)为异质信息网络,其中V表示节点集合,E表示关系集合,A表示节点类型集合,P表示关系类型集合,分析节点与连边的类型,统计节点间的连接情况,设计源节点类型与对称元路径类型,设计的对称元路径类型需要尽可能包含丰富的语义信息以及网络结构信息。根据对称元路径规则约简网络,得到单节点类型多关系网络GMHIN=(V,E, P)。
上述评估异质信息网络关键节点的方法,其中,步骤一中,获得节点嵌入向量,并构建节点特征矩阵具体包括:
根据关系集合中不同关系,将GMHIN划分为不同子图,得到子图集合Gp={Gp1,Gp2,…,Gpn},其中n为关系类型数量,Gp1、Gp2、Gpn分别表示第1种关系类型的子图、第2种关系类型的子图、第n种关系类型的子图;
对每个子图使用基于结构识别的网络表征方法学习节点表示,得到不同子图下节 点嵌入向量
Figure 710889DEST_PATH_IMAGE001
,其中i表示第i个节点,pn表示关系类型,最后根据下式进行不同子图下节 点嵌入向量的向量拼接,得到节点vi的嵌入向量Xi
Figure 883244DEST_PATH_IMAGE002
其中
Figure 100599DEST_PATH_IMAGE003
Figure 104327DEST_PATH_IMAGE004
Figure 686618DEST_PATH_IMAGE005
分别表示第1种关系类型的子图下的节点vi的嵌入向量、第2种 关系类型的子图下的节点vi的嵌入向量、第n种关系类型的子图下的节点vi的嵌入向量,
Figure 408587DEST_PATH_IMAGE006
表示向量拼接操作,进而得到节点特征矩阵H。
上述评估异质信息网络关键节点的方法,其中,步骤二具体包括:
根据得到的单节点类型多关系网络GMHIN=(V, E, P),可以确保节点之间至少会有一种关系连边进行连接,为了得到语义化同质网络Gg=(V, E),需要对节点间不同连边关系进行关系聚合;
根据所述对称元路径规则,构建节点vi与vj在对称元路径f1连接下的语料库
Figure 367315DEST_PATH_IMAGE007
,如下式所示:
Figure 992594DEST_PATH_IMAGE008
其中,
Figure 11366DEST_PATH_IMAGE009
表示对称元路径中首节点的文本信息,
Figure 220630DEST_PATH_IMAGE010
分别表示对称 元路径中尾节点的文本信息,
Figure 717470DEST_PATH_IMAGE011
表示源节点
Figure 695791DEST_PATH_IMAGE012
与目标节点
Figure 682201DEST_PATH_IMAGE013
之间连边关系文 本信息,
Figure 316445DEST_PATH_IMAGE014
表示对称元路径中
Figure 679293DEST_PATH_IMAGE015
Figure 449803DEST_PATH_IMAGE016
Figure 872694DEST_PATH_IMAGE017
以外的文本信息;
最后将节点vi与vj之间不同对称元路径连接下的语料库汇总,得到汇总语料库
Figure 790972DEST_PATH_IMAGE018
,如下式所示:
Figure 629615DEST_PATH_IMAGE019
其中,fi表示第i种类型的对称元路径;
将节点vi与vj之间构建出来的语料库,输入到语言预训练模型中,进行关系聚合,得到连边嵌入向量Ei,j,如下式所示:
Figure 582527DEST_PATH_IMAGE020
其中,BERT表示语言预训练模型。
上述评估异质信息网络关键节点的方法,其中,步骤三中,通过节点嵌入向量与连边嵌入向量得到邻居节点对中心节点的权重影响,构建权重矩阵具体包括:
根据得到的每个节点嵌入向量,结合连边嵌入向量,获得节点间影响权重,进而构建权重矩阵,权重计算如下式所示:
Figure 114003DEST_PATH_IMAGE021
其中,aj,i表示邻居节点vj对中心节点vi的影响权重,aj,i∈(0,1),σ为非线性激活 函数Sigmoid,Wwgt为全连接层权重,
Figure 752532DEST_PATH_IMAGE022
为拼接函数,Xj表示节点vj的嵌入向量,
Figure 722762DEST_PATH_IMAGE023
表示向量减 操作,得到节点间相互影响权重后,将权重值替换邻接矩阵中的(0,1)值,得到权重矩阵Wg
上述评估异质信息网络关键节点的方法,其中,步骤三中,使用图卷积网络构建关键节点评估模型,将权重矩阵与节点特征矩阵作为模型输入,使用多层感知机输出重要度得分,得到关键节点排序结果具体包括:
获取节点特征矩阵H,与权重矩阵Wg
使用图卷积网络与多层感知机构建关键节点评估模型,使用节点特征矩阵H与权重矩阵Wg作为模型输入,图卷积层聚合特征信息,多层感知机作为模型的输出层,得到节点重要度分数组成的重要度序列,通过排序后得到最终的关键节点;
节点特征聚合的表达式Hgcn为:
Figure 467864DEST_PATH_IMAGE024
其中,
Figure 232558DEST_PATH_IMAGE025
表示在第l层卷积层的节点特征矩阵,D为度矩阵,
Figure 63111DEST_PATH_IMAGE026
Figure 305873DEST_PATH_IMAGE027
,I为单位矩阵;
多层感知机输出重要度分数如下式所示:
Figure 171061DEST_PATH_IMAGE028
其中,Wm与bm表示多层感知机的权重与偏置,
Figure 106656DEST_PATH_IMAGE029
为重要度分数,MLP表示使用 多层感知机作为输出层,ReLU为激活函数;
将节点按照重要度分数排列,得到关键节点排序结果,分数大的节点即为关键节点。
根据本发明提供的评估异质信息网络关键节点的方法,针对异质信息网络多类型节点与连边、网络结构复杂等特点,通过约简网络中的节点以及连边,得到节点嵌入向量与边嵌入向量,进而构建图神经网络,得到关键节点评估模型,本发明在通过约简网络简化建模过程的同时,能够尽可能保留丰富的语义信息,通过对节点与连边进行表征学习,采用图神经网络建立评估模型,能够提高异质信息网络关键节点评估的准确性。
附图说明
图1是为本发明实施例的评估异质信息网络关键节点的方法的逻辑示意图;
图2是网络约简流程示意图;
图3是节点嵌入示意图;
图4是连边嵌入示意图;
图5是关键节点评估示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请结合图1,本实施例提供一种评估异质信息网络关键节点的方法,首先对异质信息网络进行节点类型约简,将不同的元路径类型抽象为新的连边关系,根据不同连边关系划分为不同的子图,在子图上对节点进行表征;其次对连边类型进行约简,聚合连边信息,得到连边嵌入向量;使用图神经网络构建关键节点评估模型,得出关键节点序列。该方法具体包括步骤S1~S3。
S1 ,对异质信息网络进行节点类型约简操作,将异质信息网络约简为单节点类型多关系网络(MHIN, Multiplex Heterogeneous Information Network),选定源节点类型、设计对称元路径规则,将选定类型节点之间的对称元路径抽象为新的连边关系,进而达到节点约简的效果,同时根据不同连边关系,划分为不同的子图,使用基于结构识别的网络表征方法(struc2vec)获得不同子图下的节点嵌入向量,最后将不同子图下的节点嵌入向量进行拼接,获得每个节点的嵌入向量,构建节点特征矩阵。
S2,对单节点类型多关系网络进行连边类型约简操作,将单节点类型多关系网络约简为语义化同质网络。根据先前所设计好的对称元路径规则,通过数据集自带的文本信息,构建语料库。将节点间的语料信息,通过语言预训练模型(BERT, BidirectionalEncoder Representation from Transformers)进行连边关系聚合,获得连边嵌入向量。
S3,通过节点嵌入向量与连边嵌入向量得到邻居节点对中心节点的权重影响,构建权重矩阵。使用图卷积网络(GCN, Graph Convolutional Network)构建关键节点评估模型,将权重矩阵与节点特征矩阵作为模型输入,使用多层感知机(MLP, MultilayerPerceptron)输出重要度得分,得到关键节点排序结果。
其中,步骤S1具体包括步骤S11~S12:
S11,如图2中的(a)所示,设GHIN=(V, E, A, P)为异质信息网络,其中V表示节点集 合,E表示关系集合,A表示节点类型集合,P表示关系类型集合。分析节点与连边的类型,统 计节点间的连接情况,根据先验知识确定源节点类型与对称元路径类型,一般选择节点数 量较多的节点类型当成为源节点类型。设计的对称元路径类型需要尽可能包含丰富的语义 信息以及网络结构信息。确定的源节点类型表示为ASource。给定异质信息网络对称元路径
Figure 424505DEST_PATH_IMAGE030
Figure 470958DEST_PATH_IMAGE031
。其中
Figure 190653DEST_PATH_IMAGE032
表示源节点类型节点vi、vj
Figure 297149DEST_PATH_IMAGE033
表示其他节点类型节点vi,p1、pn表示不同的连边关系。给定对称元路径类型集合
Figure 899031DEST_PATH_IMAGE034
,其中,f1表示第1种类型的对称元路径,f2表示第2种类型的对称元路径, f3表示第n种类型的对称元路径。根据对称元路径规则约简网络,得到单节点类型多关系网 络GMHIN=(V, E, P),如图2中的(b)所示,其中V表示节点集合,E表示关系集合,P表示关系类 型集合。
S12,根据关系集合中不同关系,将GMHIN划分为不同子图,得到子图集合Gp={Gp1, Gp2,…,Gpn},其中n为关系类型数量,Gp1、Gp2、Gpn分别表示第1种关系类型的子图、第2种关系 类型的子图、第n种关系类型的子图。如图3所示,对每个子图使用struc2vec学习节点表示, 得到不同子图下节点嵌入向量
Figure 686859DEST_PATH_IMAGE035
,其中i表示第i个节点,pn表示关系类型。最后根据公式 (1)进行不同子图下节点嵌入向量的向量拼接,得到节点vi的嵌入向量Xi
Figure 824841DEST_PATH_IMAGE036
(1)
其中
Figure 39922DEST_PATH_IMAGE003
Figure 129101DEST_PATH_IMAGE004
Figure 720619DEST_PATH_IMAGE005
分别表示第1种关系类型的子图下的节点vi的嵌入向量、第2种 关系类型的子图下的节点vi的嵌入向量、第n种关系类型的子图下的节点vi的嵌入向量,
Figure 211643DEST_PATH_IMAGE037
表示向量拼接操作,进而得到节点特征矩阵H。
步骤S2具体包括步骤S21~S22:
S21,根据得到的单节点类型多关系网络GMHIN,可以确保节点之间至少会有一种关系连边进行连接。为了得到语义化同质网络Gg=(V, E),如图2中的(c)所示,需要对节点间不同连边关系进行关系聚合。由于新的连边关系是由不同的对称元路径抽象得到的,本质还是对称元路径。而数据集自带对应的文本特征信息,可以构建节点间语料库,使用语言预训练模型得到节点间连边嵌入向量,达到连边关系聚合效果。
S22,根据设计好的对称元路径类型,构建节点vi与vj在对称元路径f1连接下的语 料库
Figure 597625DEST_PATH_IMAGE038
,如公式(2)所示。
Figure 439679DEST_PATH_IMAGE039
(2)
其中,
Figure 569309DEST_PATH_IMAGE009
表示对称元路径中首节点的文本信息,
Figure 914840DEST_PATH_IMAGE010
分别表示对称 元路径中尾节点的文本信息,
Figure 737303DEST_PATH_IMAGE011
表示源节点
Figure 801074DEST_PATH_IMAGE040
与目标节点
Figure 468815DEST_PATH_IMAGE013
之间连边关系文 本信息,
Figure 934432DEST_PATH_IMAGE014
表示对称元路径中
Figure 927796DEST_PATH_IMAGE015
Figure 213283DEST_PATH_IMAGE016
Figure 950295DEST_PATH_IMAGE017
以外的文本信息。
最后将节点vi与vj之间不同对称元路径连接下的语料库汇总,得到汇总语料库
Figure 763094DEST_PATH_IMAGE041
,如下式所示。
Figure 661780DEST_PATH_IMAGE042
(3)
其中,fi表示第i种类型的对称元路径;
如图4所示,将节点vi与vj之间构建出来的语料库,输入到语言预训练模型BERT中,进行关系聚合,得到连边嵌入向量Ei,j,如公式(4)所示。
Figure 700143DEST_PATH_IMAGE020
(4)
其中,BERT表示语言预训练模型。
具体实施时,以DBLP引文网络为例,定义了对称元路径规则APA,APCPA。则具体可以生成以下两条语句:“APA,作者A与作者B合著了文章P”、“APCPA,作者A写的文章P1与作者B写的文章P2都投稿了会议C”。此时APA、APCPA代表两种连边关系,为了连边约简,则将生成的语料放入语言预训练模型中进行文本特征提取与聚合,完成连边聚合操作。
步骤S3具体包括步骤S31~S32:
S31,根据得到的每个节点嵌入向量,结合连边嵌入向量,获得节点间影响权重,进而构建权重矩阵。通过借鉴注意力机制,设计出一种权值计算方法,以防止相邻节点间的噪声,以区别相邻节点对中心节点的不同重要性。如公式(5)所示。
Figure 975266DEST_PATH_IMAGE043
(5)
其中,aj,i表示邻居节点vj对中心节点vi的影响权重,aj,i∈(0,1),σ为非线性激活 函数Sigmoid,Wwgt为全连接层权重,
Figure 884317DEST_PATH_IMAGE022
为拼接函数,Xj表示节点vj的嵌入向量,
Figure 485062DEST_PATH_IMAGE023
表示向量减 操作,得到节点间相互影响权重后,将权重值替换邻接矩阵中的(0,1)值,得到权重矩阵Wg
S32,获取节点特征矩阵H,与权重矩阵Wg。其中权重矩阵Wg不仅能够反映邻居节点对中心节点的权重影响,还能反映整个网络的拓扑结构。
使用图卷积网络与多层感知机构建关键节点评估模型。如图5所示,使用节点特征矩阵H与权重矩阵Wg作为模型输入,图卷积层聚合特征信息,多层感知机作为模型的输出层,得到节点重要度分数组成的重要度序列,通过排序后得到最终的关键节点。
节点特征聚合表达式Hgcn如公式(6)所示:
Figure 745142DEST_PATH_IMAGE044
(6)
其中,
Figure 823957DEST_PATH_IMAGE045
表示在第l层卷积层的节点特征矩阵,D为度矩阵,
Figure 118672DEST_PATH_IMAGE046
Figure 359160DEST_PATH_IMAGE047
,I为单位矩阵。
多层感知机输出重要度分数如公式(7)所示:
Figure 106536DEST_PATH_IMAGE048
(7)
其中,Wm与bm表示多层感知机的权重与偏置,
Figure 785779DEST_PATH_IMAGE029
为重要度分数,MLP表示使用多 层感知机作为输出层,ReLU为激活函数。将节点按照重要度分数排列,分数大的节点即为关 键节点。
根据上述的评估异质信息网络关键节点的方法,针对异质信息网络多类型节点与连边、网络结构复杂等特点,通过约简网络中的节点以及连边,得到节点嵌入向量与边嵌入向量,进而构建图神经网络,得到关键节点评估模型,本发明在通过约简网络简化建模过程的同时,能够尽可能保留丰富的语义信息,通过对节点与连边进行表征学习,采用图神经网络建立评估模型,能够提高异质信息网络关键节点评估的准确性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (6)

1.一种评估异质信息网络关键节点的方法,其特征在于,包括如下步骤:
步骤一,对异质信息网络进行节点类型约简操作,将异质信息网络约简为单节点类型多关系网络,选定源节点类型、设计对称元路径规则,将选定类型节点之间的对称元路径抽象为新的连边关系,同时根据不同连边关系,划分为不同关系子图,使用基于结构识别的网络表征方法获得不同子图下的节点嵌入向量,最后将不同子图下的节点嵌入向量进行拼接,获得节点嵌入向量,并构建节点特征矩阵;
步骤二,对单节点类型多关系网络进行连边类型约简操作,将单节点类型多关系网络约简为语义化同质网络,根据所述对称元路径规则,通过数据集自带的文本信息,构建语料库,将节点间的语料信息,通过语言预训练模型进行连边关系聚合,获得连边嵌入向量;
步骤三,通过节点嵌入向量与连边嵌入向量得到邻居节点对中心节点的权重影响,构建权重矩阵,使用图卷积网络构建关键节点评估模型,将权重矩阵与节点特征矩阵作为模型输入,使用多层感知机输出重要度得分,得到关键节点排序结果。
2.根据权利要求1所述的评估异质信息网络关键节点的方法,其特征在于,步骤一中,对异质信息网络进行节点类型约简操作具体包括:
设GHIN=(V, E, A, P)为异质信息网络,其中V表示节点集合,E表示关系集合,A表示节点类型集合,P表示关系类型集合,分析节点与连边的类型,统计节点间的连接情况,设计源节点类型与对称元路径类型,根据对称元路径规则约简网络,得到单节点类型多关系网络GMHIN=(V, E, P)。
3.根据权利要求2所述的评估异质信息网络关键节点的方法,其特征在于,步骤一中,获得节点嵌入向量,并构建节点特征矩阵具体包括:
根据关系集合中不同关系,将GMHIN划分为不同子图,得到子图集合Gp={Gp1, Gp2,…,Gpn},其中n为关系类型数量,Gp1、Gp2、Gpn分别表示第1种关系类型的子图、第2种关系类型的子图、第n种关系类型的子图;
对每个子图使用基于结构识别的网络表征方法学习节点表示,得到不同子图下节点嵌 入向量
Figure 452813DEST_PATH_IMAGE001
,其中i表示第i个节点,pn表示关系类型,最后根据下式进行不同子图下节点嵌 入向量的向量拼接,得到节点vi的嵌入向量Xi
Figure 464631DEST_PATH_IMAGE002
其中
Figure 491493DEST_PATH_IMAGE003
Figure 145329DEST_PATH_IMAGE004
Figure 574036DEST_PATH_IMAGE005
分别表示第1种关系类型的子图下的节点vi的嵌入向量、第2种关系 类型的子图下的节点vi的嵌入向量、第n种关系类型的子图下的节点vi的嵌入向量,
Figure 520870DEST_PATH_IMAGE006
表示 向量拼接操作,进而得到节点特征矩阵H。
4.根据权利要求3所述的评估异质信息网络关键节点的方法,其特征在于,步骤二具体包括:
根据得到的单节点类型多关系网络GMHIN=(V, E, P),对节点间不同连边关系进行关系聚合,得到语义化同质网络Gg=(V, E);
根据所述对称元路径规则,构建节点vi与vj在对称元路径f1连接下的语料库
Figure 300607DEST_PATH_IMAGE007
,如 下式所示:
Figure 492554DEST_PATH_IMAGE008
其中,
Figure 775768DEST_PATH_IMAGE009
表示对称元路径中首节点的文本信息,
Figure 394968DEST_PATH_IMAGE010
分别表示对称元路 径中尾节点的文本信息,
Figure 458739DEST_PATH_IMAGE011
表示源节点
Figure 392060DEST_PATH_IMAGE012
与目标节点
Figure 592097DEST_PATH_IMAGE013
之间连边关系文本信 息,
Figure 585461DEST_PATH_IMAGE014
表示对称元路径中
Figure 136528DEST_PATH_IMAGE015
Figure 607960DEST_PATH_IMAGE016
Figure 928083DEST_PATH_IMAGE017
以外的文本信息;
最后将节点vi与vj之间不同对称元路径连接下的语料库汇总,得到汇总语料库
Figure 92348DEST_PATH_IMAGE018
, 如下式所示:
Figure 599553DEST_PATH_IMAGE019
其中,fi表示第i种类型的对称元路径;
将节点vi与vj之间构建出来的语料库,输入到语言预训练模型中,进行关系聚合,得到连边嵌入向量Ei,j,如下式所示:
Figure 438458DEST_PATH_IMAGE020
其中,BERT表示语言预训练模型。
5.根据权利要求4所述的评估异质信息网络关键节点的方法,其特征在于,步骤三中,通过节点嵌入向量与连边嵌入向量得到邻居节点对中心节点的权重影响,构建权重矩阵具体包括:
根据得到的每个节点嵌入向量,结合连边嵌入向量,获得节点间影响权重,进而构建权重矩阵,权重计算如下式所示:
Figure 816350DEST_PATH_IMAGE021
其中,aj,i表示邻居节点vj对中心节点vi的影响权重,aj,i∈(0,1),σ为非线性激活函数 Sigmoid,Wwgt为全连接层权重,
Figure 948254DEST_PATH_IMAGE022
为拼接函数,Xj表示节点vj的嵌入向量,
Figure 411597DEST_PATH_IMAGE023
表示向量减操 作,得到节点间相互影响权重后,将权重值替换邻接矩阵中的(0,1)值,得到权重矩阵Wg
6.根据权利要求5所述的评估异质信息网络关键节点的方法,其特征在于,步骤三中,使用图卷积网络构建关键节点评估模型,将权重矩阵与节点特征矩阵作为模型输入,使用多层感知机输出重要度得分,得到关键节点排序结果具体包括:
获取节点特征矩阵H,与权重矩阵Wg
使用图卷积网络与多层感知机构建关键节点评估模型,使用节点特征矩阵H与权重矩阵Wg作为模型输入,图卷积层聚合特征信息,多层感知机作为模型的输出层,得到节点重要度分数组成的重要度序列,通过排序后得到最终的关键节点;
节点特征聚合的表达式Hgcn为:
Figure 287149DEST_PATH_IMAGE024
其中,
Figure 519547DEST_PATH_IMAGE025
表示在第l层卷积层的节点特征矩阵,D为度矩阵,
Figure 822352DEST_PATH_IMAGE026
Figure 772991DEST_PATH_IMAGE027
, I为单位矩阵;
多层感知机输出重要度分数如下式所示:
Figure 452234DEST_PATH_IMAGE028
其中,Wm与bm表示多层感知机的权重与偏置,
Figure 539138DEST_PATH_IMAGE029
为重要度分数,MLP表示使用多层感 知机作为输出层,ReLU为激活函数;
将节点按照重要度分数排列,得到关键节点排序结果。
CN202211195029.0A 2022-09-29 2022-09-29 一种评估异质信息网络关键节点的方法 Active CN115314398B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211195029.0A CN115314398B (zh) 2022-09-29 2022-09-29 一种评估异质信息网络关键节点的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211195029.0A CN115314398B (zh) 2022-09-29 2022-09-29 一种评估异质信息网络关键节点的方法

Publications (2)

Publication Number Publication Date
CN115314398A true CN115314398A (zh) 2022-11-08
CN115314398B CN115314398B (zh) 2022-12-23

Family

ID=83866159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211195029.0A Active CN115314398B (zh) 2022-09-29 2022-09-29 一种评估异质信息网络关键节点的方法

Country Status (1)

Country Link
CN (1) CN115314398B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117788122A (zh) * 2024-02-23 2024-03-29 山东科技大学 一种基于异质图神经网络商品推荐方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555050A (zh) * 2018-03-30 2019-12-10 华东师范大学 一种基于元路径的异构网络节点表示学习方法
CN110796269A (zh) * 2019-09-30 2020-02-14 北京明略软件系统有限公司 一种生成模型的方法、装置、信息处理的方法及装置
CN110830291A (zh) * 2019-10-30 2020-02-21 辽宁工程技术大学 一种基于元路径的异质信息网络的节点分类方法
CN110852437A (zh) * 2019-10-29 2020-02-28 天津大学 一种针对异质信息网络的表示学习方法
CN111913702A (zh) * 2020-08-11 2020-11-10 湖北大学 一种基于图神经网络的软件系统中关键类的识别方法
WO2021179834A1 (zh) * 2020-03-10 2021-09-16 支付宝(杭州)信息技术有限公司 基于异构图进行业务处理的方法及装置
CN113762334A (zh) * 2021-07-26 2021-12-07 南昌航空大学 一种采用深度强化学习评估异质社交网络关键节点的方法
US11216620B1 (en) * 2020-07-17 2022-01-04 Alipay (Hangzhou) Information Technology Co., Ltd. Methods and apparatuses for training service model and determining text classification category

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555050A (zh) * 2018-03-30 2019-12-10 华东师范大学 一种基于元路径的异构网络节点表示学习方法
CN110796269A (zh) * 2019-09-30 2020-02-14 北京明略软件系统有限公司 一种生成模型的方法、装置、信息处理的方法及装置
CN110852437A (zh) * 2019-10-29 2020-02-28 天津大学 一种针对异质信息网络的表示学习方法
CN110830291A (zh) * 2019-10-30 2020-02-21 辽宁工程技术大学 一种基于元路径的异质信息网络的节点分类方法
WO2021179834A1 (zh) * 2020-03-10 2021-09-16 支付宝(杭州)信息技术有限公司 基于异构图进行业务处理的方法及装置
US11216620B1 (en) * 2020-07-17 2022-01-04 Alipay (Hangzhou) Information Technology Co., Ltd. Methods and apparatuses for training service model and determining text classification category
CN111913702A (zh) * 2020-08-11 2020-11-10 湖北大学 一种基于图神经网络的软件系统中关键类的识别方法
CN113762334A (zh) * 2021-07-26 2021-12-07 南昌航空大学 一种采用深度强化学习评估异质社交网络关键节点的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LIYAN ZHANG等: "Hotel Review classificationg based on the text pretraing heterogeneous graph neural network model", 《COMPUTATIONAL INTELLIGENCE AND NEUROSCIENCE 》 *
NUTTAPONG CHAIRATANAKUL等: "PGRA: Projected graph relation-feature attention network for heterogeneous information network embedding", 《INFORMATON SCIENCE》 *
刘政君等: "异质网络组合元路径节点重要性分析方法", 《小型微型计算机系统》 *
舒坚、等: "基于图嵌入的多重异质网络节点重要度评估", 《北京邮电大学学报》 *
舒坚、等: "基于拓扑凝聚图的机会网络关键节点评估", 《北京邮电大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117788122A (zh) * 2024-02-23 2024-03-29 山东科技大学 一种基于异质图神经网络商品推荐方法
CN117788122B (zh) * 2024-02-23 2024-05-10 山东科技大学 一种基于异质图神经网络商品推荐方法

Also Published As

Publication number Publication date
CN115314398B (zh) 2022-12-23

Similar Documents

Publication Publication Date Title
CN111597314B (zh) 推理问答方法、装置以及设备
Snyder et al. Interactive learning for identifying relevant tweets to support real-time situational awareness
CN111444709A (zh) 文本分类方法、装置、存储介质及设备
CN108038205B (zh) 针对中文微博的观点分析原型系统
CN111143576A (zh) 一种面向事件的动态知识图谱构建方法和装置
CN109710769A (zh) 一种基于胶囊网络的水军评论检测系统及方法
CN113392651A (zh) 训练词权重模型及提取核心词的方法、装置、设备和介质
Gu et al. Filtering before iteratively referring for knowledge-grounded response selection in retrieval-based chatbots
CN113239143B (zh) 融合电网故障案例库的输变电设备故障处理方法及系统
CN115314398B (zh) 一种评估异质信息网络关键节点的方法
Magalhães et al. Creating deep neural networks for text classification tasks using grammar genetic programming
Zhang et al. TS-GCN: Aspect-level sentiment classification model for consumer reviews
Zhang et al. Contrastive hierarchical discourse graph for scientific document summarization
Chen et al. Learning a general clause-to-clause relationships for enhancing emotion-cause pair extraction
Xu et al. A novel entity joint annotation relation extraction model
CN113392220B (zh) 一种知识图谱生成方法、装置、计算机设备及存储介质
Kuila et al. A Neural Network based Event Extraction System for Indian Languages.
Bhattacharjee Capsule network on social media text: An application to automatic detection of clickbaits
Huspi et al. Sentiment Analysis on Roman Urdu Students’ Feedback Using Enhanced Word Embedding Technique
Gao et al. Chinese short text classification method based on word embedding and Long Short-Term Memory Neural Network
CN110543567A (zh) 一种基于a-gcnn网络和acelm算法的中文文本情感分类方法
CN114282542A (zh) 网络舆情监控方法及设备
Barros et al. A deep learning approach for aspect sentiment triplet extraction in portuguese
Song et al. Rumor detection on social media with out-in-degree graph convolutional networks
Zhai et al. Text Classification Based on Graph Convolution Neural Network and Attention Mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant