CN111064604A - 一种基于多视角motif融合的网络表示系统及方法 - Google Patents

一种基于多视角motif融合的网络表示系统及方法 Download PDF

Info

Publication number
CN111064604A
CN111064604A CN201911247335.2A CN201911247335A CN111064604A CN 111064604 A CN111064604 A CN 111064604A CN 201911247335 A CN201911247335 A CN 201911247335A CN 111064604 A CN111064604 A CN 111064604A
Authority
CN
China
Prior art keywords
network
motif
node
frequency
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911247335.2A
Other languages
English (en)
Other versions
CN111064604B (zh
Inventor
于爱民
许静静
蔡利君
马建刚
孟丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Information Engineering of CAS
Original Assignee
Institute of Information Engineering of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Information Engineering of CAS filed Critical Institute of Information Engineering of CAS
Priority to CN201911247335.2A priority Critical patent/CN111064604B/zh
Publication of CN111064604A publication Critical patent/CN111064604A/zh
Application granted granted Critical
Publication of CN111064604B publication Critical patent/CN111064604B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于多视角motif融合的网络表示系统及方法,包括:生成网络模块、motif的挖掘和选择模块、图级嵌入模块和节点级嵌入模块;本发明实现更加准确的图级嵌入和节点级嵌入,最终通过更好的网络表示高质量的完成网络分析任务。

Description

一种基于多视角motif融合的网络表示系统及方法
技术领域
本发明涉及一种基于多视角motif(图案)融合的网络表示系统及方法,属于图挖掘和网络表示学习技术领域。
背景技术
网络在生活中无处不在,是当今数据的基本形式之一。通过网络表示学习,可以直接在低维空间处理网络分析任务。motif作为网络的基石,近年来吸引了相关研究者的关注。motif是代表特定模式的子图,这些子图是通过总结网络中的模式是否比随机网络更频繁地出现而得到的。它们已被证明对揭示网络的高阶连接模式至关重要。
将motif这一新颖的思想引入到网络表达中,可以更好地克服现有嵌入方法的一些局限性。(1)从网络结构中提取手工特征的方法,如入度、出度、中介性,可能会遗漏网络中的关键信息。如图1所示,对于具有相同的节点度分布但是连接关系不同的两个图G1和G2,使用手工特征的嵌入结果是相同的,用
Figure BDA0002308059480000011
表示。然而,考虑到motif,由于在两个网络之间的motif模式有明显区别,在嵌入空间
Figure BDA0002308059480000012
Figure BDA0002308059480000013
是不同的。(2)基于随机游走的方法不能将信息传播到非连通部分,比如Node2vec方法,从而得到嵌入结果
Figure BDA0002308059480000014
不能捕捉到G1中两个连通分量中节点的相似性。从motif角度来看,A和B多次出现在m1的方块标识的位置,虽然它们之间没有连通路径,但嵌入结果在
Figure BDA0002308059480000015
中也比较接近。(3)深层网络结构过于复杂,例如GNN和GCN,难以解释,而基于motif的方法可以真实地表示相关的图结构信息,具有更清晰的解释性。因此,在网络嵌入中捕获高阶motif结构是一个重要的方向。
现有的基于motif的网络表示方法,如RUM,大多只提取无向motif结构。此外,gl2vec考虑了方向,进一步增加了时间序列。然而,在许多实际网络中,节点和边缘通常与丰富的属性信息相关联。例如,在社交网络中,边缘频率和节点重要性提供了更丰富的外部信息。频率反映了节点之间的紧密通信程度,而重要性则反映一个节点在网络中发挥作用的程度。因此,有必要通过高阶motif来携带外部属性,以获得更精确的网络表示。
针对现有基于motif的嵌入方法不能完全融合外部属性的问题,本发明提出了一种基于多视图motif融合的网络表示系统。系统中融合了静态motif、时间motif、边缘标记motif和节点标记motif,不仅具有静态和时间属性,还考虑了频率和重要性属性。具体来说,本发明利用四种motif的3阶和4阶结构来嵌入网络的静态属性、时间属性、频率属性和重要性属性,进而实现图级嵌入和节点级嵌入。
发明内容
本发明技术解决问题:克服现有网络表示技术的不足,提供一种融合多视角motif的网络表示系统及方法,实现更加准确的图级嵌入和节点级嵌入,最终通过更好的网络表示高质量的完成网络分析任务。
本发明技术解决方案:一种基于多视角motif融合的网络表示系统,包括:生成网络模块、motif的挖掘和选择模块、图级嵌入模块和节点级嵌入模块;
生成网络模块,为每个原始网络生成四种网络,分别是静态网络、时间网络、频率网络和重要性网络;所述静态网络通过在原始网络数据中删除源节点和目的节点相同的重复边缘实现;所述时间网络是将原始网络中的边缘按照时间进行排序获得的有序网络结构;所述频率网络是在原始网络中将所有边缘上通信的频次拟合高斯分布,最终将边缘通信频次划分为频率等级,同时每个边缘均有一个边缘标记;所述重要性网络是将原始网络中节点按照基于motif的PageRank计算方法获得每个节点的重要性分数,然后将重要性分数拟合高斯分布,最终为每个节点划分重要性等级;
motif的挖掘和选择模块,对生成网络模块得到的四种类型的网络分别挖掘3阶和4阶的静态motif、时间motif、边缘标记motif和节点标记motif,并根据motif的重要性和真实网络中motif的数量这两个指标进行motif的选择,最终保存所选出的编号标识motif的Id和motif结构;对四种motif的挖掘分别采用加速网络motif检测Acc_motif、时间网络中的motif挖掘Temporal_motif、快速的网络motif检测工具Fanmod、发现重要标记motif的快速分析方法Flashmotif方法和四种相应的随机网络生成策略,得到网络中所有的motif,以及motif的四个指标:真实网络中motif的数量Freq(real)、随机网络中motif的数量Freq(random)、motif的重要性检验P_value以及子图比率值SRP,然后根据motif的重要性检验P_value和真实网络中motif的数量Freq(real)进行motif的选择;对于静态motif、边缘标记motif、节点标记motif选择满足重要性检验P_value<λ的motif的Id,λ是阈值,并分别保存在三个Id集合:静态motif的Id集合M_id_static、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node中;对于时间motif,保留所有节点数目为2或3,总边数为3的时间motif,共计36个,放入时间motif的Id集合M_id_temporal中,同时一个静态motif或时间motif的Id对应一种motif的结构,将motif结构分别放入静态motif的结构集合M_stru_static和时间motif的结构集合M_stru_temporal中,在频率网络或重要性网络中,一个边缘标记或节点标记motif的Id对应多种边缘或节点结构,因此选择在每个网络中边缘标记或节点标记motif的Id对应的Freq(real)最高的结构,构成边缘标记motif的结构集合M_stru_edge和节点标记motif的结构集合M_stru_node,通过motif的挖掘和选择模块的处理,获得四种motif的Id集合:静态motif的Id集合M_id_static、时间motif的Id集合M_id_temporal、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node,四个结构集合:静态motif的结构集合M_stru_static、时间motif的结构集合M_stru_temporal、边缘标记motif的结构集合M_stru_edge、节点标记motif的结构集合M_stru_node;
图级嵌入模块,基于挖掘和选择模块得出的motif的子图比率值SRP值以及motif的边缘或节点结构作为特征,将网络根据四种motif的分布表示成固定长度的向量;该模块包括四个部分:分别是获取静态网络、时间网络、频率网络、重要性网络中相应的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量;对于静态网络,将静态motif的Id集合M_id_static中的每个Id对应的motif的SRP值作为网络静态特征向量的一个维度;对于时间网络,将时间motif的Id集合M_id_temporal中的每个Id对应的motif的SRP值作为网络时间特征向量的一个维度;在频率网络中,将边缘标记motif的Id集合M_id_edge中的每个Id对应出现最频繁的motif的SRP值以及边缘结构作为网络频率特征向量的组成部分;在重要性网络中,将节点标记motif的Id集合M_id_node中的每个Id对应出现最频繁的motif的SRP值以及节点结构作为网络重要性特征向量的组成部分;最终将在静态网络、时间网络、频率网络、重要性网络中提取的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的图级嵌入;
节点级嵌入模块,通过获得节点在四种类型的motif中的位置信息,将节点表示成固定长度的向量;通过将原始网络生成的四种网络分别与对应的motif类型的结构集合进行子图同构匹配,节点出现在motif中每个位置的次数作为节点向量表示的特征;将静态网络与静态motif结构集合M_stru_static中每个motif进行静态结构的子图同构匹配,使用复杂网络软件工具包NetworkX实现,得到节点在每个motif中的每个位置出现的次数作为节点静态特征向量的一个维度;将时间网络与时间motif结构集合M_stru_temporal中每个motif进行有时序的子图同构匹配,使用时间边驱动的时间子图同构方法CED方法实现,得到时间网络中节点在每个motif中的每个位置出现的频次作为节点时间特征向量的一个维度;将频率网络与边缘标记motif结构集合M_stru_edge中的每个motif进行边缘标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的次数作为节点频率特征向量的一个维度;将重要性网络与节点标记motif结构集合M_stru_node中每个motif进行节点标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的频次作为节点重要性特征向量的一个维度,最终将在静态网络、时间网络、频率网络、重要性网络中提取的节点静态特征向量、节点时间特征向量、节点频率特征向量、节点重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的节点级嵌入。
所述生成网络模块中,边缘频率等级分为低频{L},中频{M},高频{H},频率等级的划分首先是将所有边缘的通信频次拟合高斯分布:
Figure BDA0002308059480000041
其中,x表示边缘通信频次,μ代表边缘通信频次的均值,δ代表边缘通信频次的方差,而f(x)表示边缘通信频次的概率分布;
然后将频率x划分为低频{L}、中频{M}、高频{H}三个等级:
Figure BDA0002308059480000042
其中,f_level表示边缘频率等级,如果边缘通信的频次x的值大于等于边缘通信频次均值μ与边缘通信频次的方差δ的和,则这条边缘的通信频次属于高频,f_level记为{H};如果边缘通信的频次x的值大于均值μ与方差δ的差并且小于均值μ与方差δ的和,那么这条边缘的通信频次属于中频,f_level记为{M};如果边缘通信的频次x的值小于等于均值μ与方差δ的差,则这条边缘的通信频次属于低频,f_level记为{L},通过上述频率等级的划分,每个边缘的频次都对应一个等级,构成频率网络。
所述生成网络模块中,重要性网络是节点标记的网络,其中节点的标记是节点的重要性等级,重要性等级分为一般重要{O},重要{I},极其重要{E},首先是通过基于motif的PageRank计算方法MPR获得网络中节点的重要性分数,之后将每个节点的重要性拟合公式(8)中的高斯分布,其中x表示节点的重要性分数,μ代表节点重要性分数的均值,δ代表节点重要性分数的方差,而f(x)表示节点重要性分数的概率分布,然后将节点重要性分数按照公式(10)划分等级:
Figure BDA0002308059480000051
其中,i_level表示节点重要性等级,μ表示节点重要性分数的均值,δ表示节点重要性分数的方差。如果节点重要性分数x的值大于等于均值μ与方差δ的和,那么这个节点的重要性属于极其重要,i_level记为{E};如果节点重要性分数x的值大于均值μ与方差δ的差并且小于均值μ与方差δ的和,那么这个节点的重要性属于重要,i_level记为{I};如果节点重要性分数x的值小于等于均值μ与方差δ的差,则这个节点的重要性等级属于一般重要,i_level记为{O},通过重要性等级的划分,每个节点的重要性都对应一个等级,构成重要性网络。
所述motif的挖掘和选择模块中,四种相应的随机网络生成策略分别为:生成静态随机网络时保持与真实网络相同的节点数、边缘数目、每个节点的出度和入度;生成时间随机网络时考虑将真实网络的边缘时间戳打乱作为随机网络;频率随机网络的生成规则是除了保持基本的节点数目、边缘数目、节点的入度和出度之外,还保持了双向边的数目和相邻边的标记不变;重要性网络随机网络的生成规则是保持节点数目、边缘数目、节点的入度和出度、以及节点的标记不变。
所述motif的挖掘和选择模块中,重要性检验P_value和子图比率值SRP分别定义为如下:
Figure BDA0002308059480000052
Figure BDA0002308059480000053
其中,n表示生成随机网络的个数,Freq(randomi)表示motif在第i个随机网络中出现的次数,Freq(real)代表motif在真实网络中出现次数。
SRP:子图比率值是一个标准化的值,motif m的SRP值定义为:
Figure BDA0002308059480000061
Figure BDA0002308059480000062
其中,Freq(realm)是motif m在真实网络中的出现次数,<Freq(randomm)>是motif m在随机网络中的平均出现次数,其中ε是误差项(本发明设置为4),以确保当motif很少同时出现在原始图和随机网络中时Δm不会太大。
所述图级嵌入模块中,在频率网络中提取了每个边缘标记motif的Id对应的出现最频繁的motif边缘结构,边缘结构由{H}、{M}、{L}字符串组成,在重要性网络中提取了每个节点标记motif的Id对应出现最频繁的motif节点结构作为特征,其中节点结构由{E}、{I}、{O}字符串组成。
本发明一种基于多视角motif融合的网络表示方法,步骤如下:
步骤(1)基于原始网络数据,生成静态网络、时间网络、频率网络、重要性网络;静态网络是通过在原始网络数据中删除重复边实现的;时间网络是将原始网络中的边缘按照时间进行排序获得的有序网络结构;频率网络是在原始网络中将所有边缘上通信的频次拟合高斯分布,最终将边缘通信频次划分为频率等级,同时每个边缘均有一个边缘标记;最后,生成重要性网络的过程类似于频率网络,将原始网络中节点按照基于motif的PageRank方法MRP获得每个节点的重要性分数,然后将重要性分数拟合高斯分布,最终为网络中每个节点划分重要性等级;
步骤(2),基于步骤(1)得到的四种网络分别进行3阶和4阶的静态motif、时间motif、边缘标记motif、节点标记motif的挖掘和选择,其中motif的挖掘部分分别在静态网络中使用加速网络motif检测Acc_motif方法挖掘静态motif、在时间网络中使用时间网络中的motif挖掘Temporal_motif方法挖掘36个时间motif、在频率网络中使用快速的网络motif检测工具Fanmod方法挖掘边缘标记motif、在重要性网络中使用发现重要标记motif的快速分析方法Flashmotif方法挖掘节点标记motif,在挖掘完motif之后,汇总计算motif的四个指标:真实网络中motif的数量Freq(real)、随机网络中motif的数量Freq(random)、motif的重要性检验P_value以及子图比率值SRP,然后根据motif的重要性检验P_value和真实网络中motif的数量Freq(real)进行motif的选择,对于静态motif、边缘标记motif、节点标记motif选择满足P_value<λ的motif的Id,λ是阈值,并分别保存在三个Id集合:静态motif的Id集合M_id_static、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node中,对于时间motif,保留所有节点数目为2或3,总边数为3的时间motif,共计36个,放入时间motif的Id集合M_id_temporal,同时一个静态motif或时间motif的Id对应一种motif的结构,将motif结构分别放入静态motif的结构集合M_stru_static和时间motif的结构集合M_stru_temporal中,由于在频率网络或重要性网络中,一个边缘标记或节点标记motif的Id对应了多种边缘或节点结构,所以选择在每个网络中该motif的Id对应的Freq(real)最高的结构,构成边缘标记motif的结构集合M_stru_edge和节点标记motif的结构集合M_stru_node;最终得到选择后的四种motif的Id集合:静态motif的Id集合M_id_static、时间motif的Id集合M_id_temporal、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node和四个结构集合:静态motif的结构集合M_stru_static、时间motif的结构集合M_stru_temporal、边缘标记motif的结构集合M_stru_edge、节点标记motif的结构集合M_stru_node。四个Id集合供图级嵌入模块调用,四个结构集合供节点级嵌入模块使用;
步骤(3)基于挖掘和选择出的motif的子图比率值SRP值以及motif的边缘或节点结构作为特征,将网络根据四种motif的分布表示成固定长度的向量,利用步骤(1)中生成的四种网络以及步骤(2)中对应保存的四个motif的Id集合,分别获取静态网络、时间网络、频率网络、重要性网络中相应的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量;对于静态网络,将静态motif的Id集合M_id_static中的每个Id对应的motif的SRP值作为网络静态特征向量的一个维度;对于时间网络,将时间motif的Id集合M_id_temporal中的每个Id对应的motif的SRP值作为网络时间特征向量的一个维度;在频率网络中,将边缘标记motif的Id集合M_id_edge中的每个Id对应出现最频繁的motif的SRP值以及边缘结构作为网络频率特征向量的组成部分;在重要性网络中,将节点标记motif的Id集合M_id_node中的每个Id对应出现最频繁的motif的SRP值以及节点结构作为网络重要性特征向量的组成部分;最终将在静态网络、时间网络、频率网络、重要性网络中提取的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的图级嵌入;
步骤(4)通过获得节点在四种类型的motif中的位置信息,将节点表示成固定长度的向量;基于步骤(1)中生成的四种网络以及步骤(2)中对应的四个motif的结构集合,分别对四种网络和motif结构进行子图同构匹配,获取节点在四种motif中每个位置的出现次数,作为节点向量表示的特征;将静态网络与静态motif结构集合M_stru_static中每个motif进行静态结构的子图同构匹配,使用复杂网络软件工具包NetworkX实现,得到节点在每个motif中的每个位置出现的次数作为节点静态特征向量的一个维度;将时间网络与时间motif结构集合M_stru_temporal中每个motif进行有时序的子图同构匹配,使用时间边驱动的时间子图同构方法CED方法实现,得到网络中节点在每个motif中的每个位置出现的频次作为节点时间特征向量的一个维度;将频率网络与边缘标记motif结构集合M_stru_edge中的每个motif进行边缘标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的次数作为节点频率特征向量的一个维度;将重要性网络与节点标记motif结构集合M_stru_node中每个motif进行节点标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的频次作为节点重要性特征向量的一个维度,最终将在静态网络、时间网络、频率网络、重要性网络中提取的节点静态特征向量、节点时间特征向量、节点频率特征向量、节点重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的节点级嵌入。
本发明与现有技术相比的优点在于:
(1)本发明创新的引入高阶motif结构解决网络表示的问题,有效的克服了手工提取特征缺乏关键信息和基于随机游走的方法对于非连通图的嵌入不准确问题,并且嵌入结果具有很好的可解释性。
(2)本发明利用3阶和4阶的静态motif、时间motif、边缘标记motif、节点标记motif充分考虑了网络中的静态、时间、频率、重要性属性,捕获更丰富的网络特性,进而实现高质量的网络嵌入。本发明是第一个提出结合使用多角度motif充分结合外部属性,同时实现图级嵌入和节点级嵌入的方法。
(3)本发明同时实现了无监督的图级嵌入和节点级嵌入。本发明假设具有相似的motif模式分布的网络,其图级嵌入向量也很相近;对于节点级嵌入,如果节点经常出现在相同的motif的位置,则节点嵌入向量很相近。嵌入过程是完全不依赖标签的无监督过程。
附图说明
图1为基于motif的嵌入方法克服了两个主要缺陷:基于手工特征的方法缺乏关键信息和基于随机游走的方法在非连通图中的局限性;
图2为本发明的系统框图;
图3为本发明中的4种网络示例,从左到右分别是静态网络、时间网络、频率网络、重要性网络,其中不同的线条代表不同的边缘标记,不同的图形代表不同的节点标记;
图4为本发明中的4种motif示例,从左到右分别是静态motif、时间motif、边缘标记motif、节点标记motif,其中不同的线条代表不同的边缘标记,不同的图形代表不同的节点标记;
图5为本发明中的两个拓扑相同但是边缘标记不同的边缘标记motif。
具体实施方式
下面结合附图对本发明进行详细说明。
1.相关术语解释
Figure BDA0002308059480000091
是原始网络集合,Vi是网络中的一系列节点,Ei是网络中的边,Ti是边缘时间戳的集合,N代表原始网络集合中网络G的数量。本发明提出的图级嵌入和节点级嵌入是在原始网络对应的静态网络、时间网络、频率网络、重要性网络中完成的。
f:{Gi}→Rm是图级嵌入函数,使用静态motif、时间motif、边缘标记motif、节点标记motif的子图比率值SRP等信息将图Gi映射到1×m维特征向量Rm
f′:{Vi}→Kl是节点级嵌入函数,使用该节点在静态motif、时间motif、边缘标记motif、节点标记motif的位置信息将图Gi中节点Vi映射到1×l维特征向量Kl
2.本发明的整体流程
如图2所示,本发明主要由四部分组成。首先,为每个原始网络生成四种类型的网络;其次,为四种类型的网络分别进行motif的挖掘和选择;然后,执行图级嵌入的过程;最后,完成节点级嵌入。
下面详细介绍生成网络、motif的挖掘和选择、图级嵌入和节点级嵌入的实施步骤。
(1)生成网络
A相关概念
对于原始网络分别构造静态网络、时间网络、频率网络、重要性网络,定义如下:
定义1:静态网络
静态网络SG(V,E)定义为一系列节点集合V和节点构成的有向边集合E,其中
Figure BDA0002308059480000092
定义2:时间网络
时间网络TG(V,E,T)是一组节点集合V和一组时间边缘的集合E,每个边缘上都有一个时间戳,E是时间戳的集合。
定义3:频率网络
频率网络FG(V,E,F)是一组节点集合V和一组有向频率等级边缘的集合E,每个边缘都有一个频率等级标记。F是边缘频率等级标记集合,F={L,M,H},其中L表示低频、M表示中频、H表示高频。
定义4:重要性网络
重要性网络IG(V,E,I)是一组有标签的节点集合V和有向边缘的集合E。I是节点重要性等级标记集合,I={O,I,E},其中O表示一般重要、I表示重要、E表示极其重要。
如图3所示,4种网络示例,从左到右分别是静态网络、时间网络、频率网络、重要性网络。
B生成四种网络
给定一个原始网络,生成静态网络、时间网络、频率网络、重要性网络。
1)静态网络SG如定义1中所描述,是从原始网络中删除重复边缘获得的静态结构。
2)时间网络TG是定义2中描述的带时间戳的有序边缘,是通过将原始网络中的边缘信息按照时间戳排序获得的。
3)频率网络将一段时间内边缘发生的频率转换成频次等级:低频{L},中频{M},高频{H}。通将所有边缘的通信频次拟合公式(8)中的高斯分布,其中x表示边缘通信频次,μ代表边缘通信频次的均值,δ代表边缘通信频次的方差,而f(x)表示边缘通信频次的概率分布。然后将边缘通信频次x通过公式(9)划分为低频{L}、中频{M}、高频{H}三个等级,公式(9)中f_level表示边缘频率等级。如果边缘通信的频次x的值大于等于边缘通信频次均值μ与边缘通信频次的方差δ的和,那么这条边缘的通信频次属于高频,f_level记为{H};如果边缘通信的频次x的值大于均值μ与方差δ的差并且小于均值μ与方差δ的和,那么这条边缘的通信频次属于中频,f_level记为{M};如果边缘通信的频次x的值小于等于均值μ与方差δ的差,那么这条边缘的通信频次属于低频,f_level记为{L}。通过上述频率等级的划分,每个边缘的频次都对应一个等级作为边缘的标记,构成了频率网络,如定义3中所述。
4)重要性网络,指节点带有重要性等级标记的有向图。其中节点的标记通过使用MRP算法,一种基于motif的PageRank计算方法,清楚刻画节点在网络中的重要程度,获得网络中节点的重要性分数。之后将每个节点的重要性拟合公式(8)中的高斯分布f(x)。其中x表示节点的重要性分数,μ代表节点重要性分数的均值,δ代表节点重要性分数的方差。然后将节点重要性分数按照公式(10)划分等级,公式(10)中i_level表示节点重要性等级,μ表示节点重要性分数的均值,δ表示节点重要性分数的方差。如果节点重要性分数x的值大于等于均值μ与方差δ的和,那么这个节点的重要性属于极其重要,i_level记为{E};如果节点重要性分数x的值大于均值μ与方差δ的差并且小于均值μ与方差δ的和,那么这个节点的重要性属于重要,i_level记为{I};如果节点重要性分数x的值小于等于均值μ与方差δ的差,那么这个节点的重要性等级属于一般重要,i_level记为{O}。通过上述重要性等级的划分,每个节点的重要性都对应一个等级,得到定义4中的重要性网络。所生成的四种网络形态如图3所示。
(2)motif的挖掘和选择
A motif的挖掘
本发明分别在静态网络、时间网络、频率网络、重要性网络中挖掘3阶和4阶的静态motif、时间motif、边缘标记motif、节点标记motif。如图4所示,表示四种类型的motif,同时四种motif和四种网络的对应关系如表1所示。对于待挖掘的网络P,如果motif m与网络P中的边缘和节点满足匹配条件,则在网络P中包含该motif。
表1 四种motif和四种网络的对应关系
Figure BDA0002308059480000111
备注:*表示时间motif、边缘标记motif、节点标记motif在匹配条件中都需要先满足标识的条件。
1)对于静态网络,采用Acc_motif方法实现静态网络中3阶和4阶motif的挖掘。随机网络的生成规则是保持与真实网络相同的节点数、边数、每个节点的出度和入度。
2)对于时间网络使用Temporal_motif实现所有的节点数目为2或3,总边数为3的时间motif的挖掘。时间随机网络的构成规则是在保持节点对固定的同时随机排列边缘上的时间戳。
3)在频率网络中使用Fanmod来挖掘边缘标记motif,频率随机网络的生成规则是除了保持基本的节点数目、边缘数目、节点的入度和出度之外,还保持了双向边的数目和相邻边的标记不变。
4)在重要性网络中,使用Flashmotif挖掘节点标记motif,此时重要性网络随机网络的生成规则是保持节点数目、边缘数目、节点的入度和节点的出度、以及节点的标记不变。
5)在四种类型的motif挖掘完成后,可以计算motif对应的指标,本发明主要采用motif在真实网络中出现的次数Freq(real)、motif在随机网络中出现的次数Freq(random)、motif的重要性检验P_value、motif的子图比率值SRP。重要性检验P_value和子图比率值SRP分别在公式(11)和公式(13)中定义。
B motif的选择
根据motif的重要性检验P_value和真实网络中motif的数量Freq(real)进行motif的选择。
(1)静态motif选择:选择P_value<λ对应的静态motif,所选择的motif的Id组成集合M_id_static,选择的motif的静态结构构成结构集合M_stru_static;
(2)时间motif选择:所有节点数为2或3,总边数为3的时间motif,共计36个,所选择的motif的Id组成集合M_id_temporal,选择的motif的时间结构构成结构集合M_stru_temporal;
(3)边缘标记motif选择:保留P_value<λ对应的motif,边缘标记motif的Id组成的集合为M_id_edge,在每个网络中选择motif的Id对应的出现频次最多的motif边缘结构组成motif结构集合M_stru_edge;
(4)节点标记motif选择:保留P_value<λ对应的motif,节点标记motif的Id组成的集合为M_id_node,在每个网络中选择motif的Id对应的出现频次最多的motif节点结构组成motif结构集合M_stru_node。
最终,在本步骤将得到选择后的四种motif的Id集合和结构集合。Id集合分别是静态motif的Id集合M_id_static、时间motif的Id集合M_id_temporal、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node,结构集合分别是静态motif的结构集合M_stru_static、时间motif的结构集合M_stru_temporal、边缘标记motif的结构集合M_stru_edge、节点标记motif的结构集合M_stru_node。为进一步加深理解,表2中给出了motif选择的条件以及四个Id集合和四个结构集合的对应关系。四个Id集合供给图级嵌入模块调用,四个结构集合供节点级嵌入使用。
表2 四种motif的Id选择和结构集合的选择
Figure BDA0002308059480000131
(3)图级嵌入
图级嵌入模块,基于挖掘和选择出的motif的SRP值以及motif的边缘或节点结构作为特征,将网络根据四种motif的分布表示成固定长度的向量。该模块包括四个主要部分,分别是获取静态网络、时间网络、频率网络、重要性网络中相应的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量。
1)对于静态网络,计算在静态motif的Id集合M_id_static中每个motif的SRP值作为网络静态特征向量的一个维度。
2)对于时间网络,计算在时间motif的Id集合M_id_temporal中每个motif的SRP值作为网络时间特征向量的一个维度。
3)对于频率网络,提取边缘标记motif的Id集合M_id_edge中每个motif的Id对应的出现最频繁的motif的SRP值以及边缘结构作为网络频率特征向量的组成部分,边缘结构由{H}、{M}、{L}组成。比如稀疏的虚线表示高频{H},稠密的虚线表示中频{M},实线表示低频{L},则图5中左子图的边缘结构为{0MML0L000},右子图的边缘结构为{0HML0L000},两个子图对应同一个边缘标记motif的Id,它们具有相同的静态拓扑,但是不同的边缘标记。本发明选择该motif的Id对应的出现最频繁的motif边缘结构。
4)对于重要性网络,提取节点标记motif的Id集合M_id_node中每个motif的Id对应的出现最频繁的motif的SRP值以及节点结构作为网络重要性特征向量的组成部分,节点结构由{O}、{I}、{E}组成,类似于{IOOI}。
最终将在静态网络、时间网络、频率网络、重要性网络中提取的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的图级嵌入。
(4)节点级嵌入
节点级嵌入模块,基于挖掘和选择出的四种类型的motif的结构,通过子图同构匹配获取节点在motif结构中的位置信息,将节点表示成固定长度的向量。该模块包括四个主要部分,分别是获取节点在四种网络所对应的静态motif、时间motif、边缘标记motif、节点标记motif中的位置信息。
1)静态网络与静态motif结构集合M_stru_static中每个motif进行静态结构的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的次数作为节点静态特征向量的一个维度。
2)时间网络与时间motif结构集合M_stru_temporal中每个motif进行有时序的子图同构匹配,使用CED方法实现,得到网络中节点在每个motif中的每个位置出现的频次作为节点时间特征向量的一个维度。
3)频率网络与边缘标记motif结构集合M_stru_edge中的每个motif进行边缘标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的次数作为节点频率特征向量的一个维度。
4)重要性网络与节点标记motif结构集合M_stru_node中每个motif进行节点标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的频次作为节点重要性特征向量的一个维度。
最终将在静态网络、时间网络、频率网络、重要性网络中提取的节点静态特征向量、节点时间特征向量、节点频率特征向量、节点重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的节点级嵌入。
以上虽然描述了本发明的具体实施方法,但是本领域的技术人员应当理解,这些仅是举例说明,在不背离本发明原理和实现的前提下,可以对这些实施方案做出多种变更或修改,因此,本发明的保护范围由所附权利要求书限定。

Claims (7)

1.一种基于多视角motif融合的网络表示系统,其特征在于,包括:生成网络模块、motif的挖掘和选择模块、图级嵌入模块和节点级嵌入模块;
生成网络模块,为每个原始网络生成四种网络,分别是静态网络、时间网络、频率网络和重要性网络;所述静态网络通过在原始网络数据中删除源节点和目的节点相同的重复边缘实现;所述时间网络是将原始网络中的边缘按照时间进行排序获得的有序网络结构;所述频率网络是在原始网络中将所有边缘上通信的频次拟合高斯分布,最终将边缘通信频次划分为频率等级,同时每个边缘均有一个边缘标记;所述重要性网络是将原始网络中节点按照基于motif的PageRank计算方法获得每个节点的重要性分数,然后将重要性分数拟合高斯分布,最终为每个节点划分重要性等级;
motif的挖掘和选择模块,对生成网络模块得到的四种类型的网络分别挖掘3阶和4阶的静态motif、时间motif、边缘标记motif和节点标记motif,并根据motif的重要性和真实网络中motif的数量这两个指标进行motif的选择,最终保存所选出的motif的编号标识Id和motif结构;对四种motif的挖掘分别采用加速网络motif检测Acc_motif、时间网络中的motif挖掘Temporal_motif、快速的网络motif检测工具Fanmod、发现重要标记motif的快速分析方法Flashmotif方法和四种相应的随机网络生成策略,得到网络中所有的motif,以及motif的四个指标:真实网络中motif的数量Freq(real)、随机网络中motif的数量Freq(random)、motif的重要性检验P_value以及子图比率值SRP,然后根据motif的重要性检验P_value和真实网络中motif的数量Freq(real)进行motif的选择;对于静态motif、边缘标记motif、节点标记motif选择满足重要性检验P_value<λ的motif的Id,λ是阈值,并分别保存在三个Id集合:静态motif的Id集合M_id_static、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node中;对于时间motif,保留所有节点数目为2或3,总边数为3的时间motif,共计36个,放入时间motif的Id集合M_id_temporal中,同时一个静态motif或时间motif的Id对应一种motif的结构,将motif结构分别放入静态motif的结构集合M_stru_static和时间motif的结构集合M_stru_temporal中,在频率网络或重要性网络中,一个边缘标记或节点标记motif的Id对应多种边缘或节点结构,因此选择在每个网络中边缘标记或节点标记motif的Id对应的Freq(real)最高的结构,构成边缘标记motif的结构集合M_stru_edge和节点标记motif的结构集合M_stru_node,通过motif的挖掘和选择模块的处理,获得四种motif的Id集合:静态motif的Id集合M_id_static、时间motif的Id集合M_id_temporal、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node,四个结构集合:静态motif的结构集合M_stru_static、时间motif的结构集合M_stru_temporal、边缘标记motif的结构集合M_stru_edge、节点标记motif的结构集合M_stru_node;
图级嵌入模块,基于挖掘和选择模块得出的motif的子图比率值SRP值以及motif的边缘或节点结构作为特征,将网络根据四种motif的分布表示成固定长度的向量;该模块包括四个部分:分别是获取静态网络、时间网络、频率网络、重要性网络中相应的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量;对于静态网络,将静态motif的Id集合M_id_static中的每个Id对应的motif的SRP值作为网络静态特征向量的一个维度;对于时间网络,将时间motif的Id集合M_id_temporal中的每个Id对应的motif的SRP值作为网络时间特征向量的一个维度;在频率网络中,将边缘标记motif的Id集合M_id_edge中的每个Id对应出现最频繁的motif的SRP值以及边缘结构作为网络频率特征向量的组成部分;在重要性网络中,将节点标记motif的Id集合M_id_node中的每个Id对应出现最频繁的motif的SRP值以及节点结构作为网络重要性特征向量的组成部分;最终将在静态网络、时间网络、频率网络、重要性网络中提取的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的图级嵌入;
节点级嵌入模块,通过获得节点在四种类型的motif中的位置信息,将节点表示成固定长度的向量;通过将原始网络生成的四种网络分别与对应的motif类型的结构集合进行子图同构匹配,节点出现在motif中每个位置的次数作为节点向量表示的特征;将静态网络与静态motif结构集合M_stru_static中每个motif进行静态结构的子图同构匹配,使用复杂网络软件工具包NetworkX实现,得到节点在每个motif中的每个位置出现的次数作为节点静态特征向量的一个维度;将时间网络与时间motif结构集合M_stru_temporal中每个motif进行有时序的子图同构匹配,使用时间边驱动的时间子图同构方法CED方法实现,得到时间网络中节点在每个motif中的每个位置出现的频次作为节点时间特征向量的一个维度;将频率网络与边缘标记motif结构集合M_stru_edge中的每个motif进行边缘标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的次数作为节点频率特征向量的一个维度;将重要性网络与节点标记motif结构集合M_stru_node中每个motif进行节点标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的频次作为节点重要性特征向量的一个维度,最终将在静态网络、时间网络、频率网络、重要性网络中提取的节点静态特征向量、节点时间特征向量、节点频率特征向量、节点重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的节点级嵌入。
2.根据权利要求1所述的基于多视角motif融合的网络表示系统,其特征在于:所述生成网络模块中,边缘频率等级分为低频{L},中频{M},高频{H},频率等级的划分首先是将所有边缘的通信频次拟合高斯分布:
Figure FDA0002308059470000031
其中,x表示边缘通信频次,μ代表边缘通信频次的均值,δ代表边缘通信频次的方差,而f(x)表示边缘通信频次的概率分布;
然后将频率x划分为低频{L}、中频{M}、高频{H}三个等级:
Figure FDA0002308059470000032
其中,f_level表示边缘频率等级,如果边缘通信的频次x的值大于等于边缘通信频次均值μ与边缘通信频次的方差δ的和,则这条边缘的通信频次属于高频,f_level记为{H};如果边缘通信的频次x的值大于均值μ与方差δ的差并且小于均值μ与方差δ的和,那么这条边缘的通信频次属于中频,f_level记为{M};如果边缘通信的频次x的值小于等于均值μ与方差δ的差,则这条边缘的通信频次属于低频,f_level记为{L},通过上述频率等级的划分,每个边缘的频次都对应一个等级,构成频率网络。
3.根据权利要求1所述的基于多视角motif融合的网络表示系统,其特征在于:所述生成网络模块中,重要性网络是节点标记的网络,其中节点的标记是节点的重要性等级,重要性等级分为一般重要{O},重要{I},极其重要{E},首先是通过基于motif的PageRank计算方法MPR获得网络中节点的重要性分数,之后将每个节点的重要性拟合公式(1)中的高斯分布,其中x表示节点的重要性分数,μ代表节点重要性分数的均值,δ代表节点重要性分数的方差,而f(x)表示节点重要性分数的概率分布,然后将节点重要性分数按照公式(3)划分等级:
Figure FDA0002308059470000041
其中,i_level表示节点重要性等级,μ表示节点重要性分数的均值,δ表示节点重要性分数的方差。如果节点重要性分数x的值大于等于均值μ与方差δ的和,那么这个节点的重要性属于极其重要,i_level记为{E};如果节点重要性分数x的值大于均值μ与方差δ的差并且小于均值μ与方差δ的和,那么这个节点的重要性属于重要,i_level记为{I};如果节点重要性分数x的值小于等于均值μ与方差δ的差,则这个节点的重要性等级属于一般重要,i_level记为{O},通过重要性等级的划分,每个节点的重要性都对应一个等级,构成重要性网络。
4.根据权利要求1所述的基于多视角motif融合的网络表示系统,其特征在于:所述motif的挖掘和选择模块中,四种相应的随机网络生成策略分别为:生成静态随机网络时保持与真实网络相同的节点数、边缘数目、每个节点的出度和入度;生成时间随机网络时考虑将真实网络的边缘时间戳打乱作为随机网络;频率随机网络的生成规则是除了保持基本的节点数目、边缘数目、节点的入度和出度之外,还保持了双向边的数目和相邻边的标记不变;重要性网络随机网络的生成规则是保持节点数目、边缘数目、节点的入度和出度、以及节点的标记不变。
5.根据权利要求1所述的基于多视角motif融合的网络表示系统,其特征在于:所述motif的挖掘和选择模块中,重要性检验P_value和子图比率值SRP分别定义为如下:
Figure FDA0002308059470000042
Figure FDA0002308059470000043
其中,n表示生成随机网络的个数,Freq(randomi)表示motif在第i个随机网络中出现的次数,Freq(real)代表motif在真实网络中出现次数;
SRP:子图比率值是一个标准化的值,motif m的SRP值定义为:
Figure FDA0002308059470000044
Figure FDA0002308059470000045
其中,Freq(realm)是motif m在真实网络中的出现次数,<Freq(randomm)>是motifm在随机网络中的平均出现次数,其中ε是误差项(本发明设置为4)。
6.根据权利要求1所述的基于多视角motif融合的网络表示系统,其特征在于:所述图级嵌入模块中,在频率网络中提取了每个边缘标记motif的Id对应的出现最频繁的motif边缘结构,边缘结构由{H}、{M}、{L}字符串组成;在重要性网络中提取了每个节点标记motif的Id对应出现最频繁的motif节点结构作为特征,其中节点结构由{E}、{I}、{O}字符串组成。
7.一种基于多视角motif融合的网络表示方法,其特征在于,步骤如下:
步骤(1)基于原始网络数据,生成静态网络、时间网络、频率网络、重要性网络;静态网络是通过在原始网络数据中删除重复边实现的;时间网络是将原始网络中的边缘按照时间进行排序获得的有序网络结构;频率网络是在原始网络中将所有边缘上通信的频次拟合高斯分布,最终将边缘通信频次划分为频率等级,同时每个边缘均有一个边缘标记;最后,生成重要性网络的过程类似于频率网络,将原始网络中节点按照基于motif的PageRank方法MRP获得每个节点的重要性分数,然后将重要性分数拟合高斯分布,最终为网络中每个节点划分重要性等级;
步骤(2),基于步骤(1)得到的四种网络分别进行3阶和4阶的静态motif、时间motif、边缘标记motif、节点标记motif的挖掘和选择,其中motif的挖掘部分分别在静态网络中使用加速网络motif检测Acc_motif方法挖掘静态motif、在时间网络中使用时间网络中的motif挖掘Temporal_motif方法挖掘36个时间motif、在频率网络中使用快速的网络motif检测工具Fanmod方法挖掘边缘标记motif、在重要性网络中使用发现重要标记motif的快速分析方法Flashmotif方法挖掘节点标记motif,在挖掘完motif之后,汇总计算motif的四个指标:真实网络中motif的数量Freq(real)、随机网络中motif的数量Freq(random)、motif的重要性检验P_value以及子图比率值SRP,然后根据motif的重要性检验P_value和真实网络中motif的数量Freq(real)进行motif的选择,对于静态motif、边缘标记motif、节点标记motif选择满足P_value<λ的motif的Id,λ是阈值,并分别保存在三个Id集合:静态motif的Id集合M_id_static、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node中,对于时间motif,保留所有节点数目为2或3,总边数为3的时间motif,共计36个,放入时间motif的Id集合M_id_temporal,同时一个静态motif或时间motif的Id对应一种motif的结构,将motif结构分别放入静态motif的结构集合M_stru_static和时间motif的结构集合M_stru_temporal中,由于在频率网络或重要性网络中,一个边缘标记或节点标记motif的Id对应了多种边缘或节点结构,所以选择在每个网络中该motif的Id对应的Freq(real)最高的结构,构成边缘标记motif的结构集合M_stru_edge和节点标记motif的结构集合M_stru_node;最终得到选择后的四种motif的Id集合:静态motif的Id集合M_id_static、时间motif的Id集合M_id_temporal、边缘标记motif的Id集合M_id_edge、节点标记motif的Id集合M_id_node和四个结构集合:静态motif的结构集合M_stru_static、时间motif的结构集合M_stru_temporal、边缘标记motif的结构集合M_stru_edge、节点标记motif的结构集合M_stru_node;四个Id集合供图级嵌入模块调用,四个结构集合供节点级嵌入模块使用;
步骤(3)基于挖掘和选择出的motif的子图比率值SRP值以及motif的边缘或节点结构作为特征,将网络根据四种motif的分布表示成固定长度的向量,利用步骤(1)中生成的四种网络以及步骤(2)中对应保存的四个motif的Id集合,分别获取静态网络、时间网络、频率网络、重要性网络中相应的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量;对于静态网络,将静态motif的Id集合M_id_static中的每个Id对应的motif的SRP值作为网络静态特征向量的一个维度;对于时间网络,将时间motif的Id集合M_id_temporal中的每个Id对应的motif的SRP值作为网络时间特征向量的一个维度;在频率网络中,将边缘标记motif的Id集合M_id_edge中的每个Id对应出现最频繁的motif的SRP值以及边缘结构作为网络频率特征向量的组成部分;在重要性网络中,将节点标记motif的Id集合M_id_node中的每个Id对应出现最频繁的motif的SRP值以及节点结构作为网络重要性特征向量的组成部分;最终将在静态网络、时间网络、频率网络、重要性网络中提取的网络静态特征向量、网络时间特征向量、网络频率特征向量、网络重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的图级嵌入;
步骤(4)通过获得节点在四种类型的motif中的位置信息,将节点表示成固定长度的向量;基于步骤(1)中生成的四种网络以及步骤(2)中对应的四个motif的结构集合,分别对四种网络和motif结构进行子图同构匹配,获取节点在四种motif中每个位置的出现次数,作为节点向量表示的特征;将静态网络与静态motif结构集合M_stru_static中每个motif进行静态结构的子图同构匹配,使用复杂网络软件工具包NetworkX实现,得到节点在每个motif中的每个位置出现的次数作为节点静态特征向量的一个维度;将时间网络与时间motif结构集合M_stru_temporal中每个motif进行有时序的子图同构匹配,使用时间边驱动的时间子图同构方法CED方法实现,得到网络中节点在每个motif中的每个位置出现的频次作为节点时间特征向量的一个维度;将频率网络与边缘标记motif结构集合M_stru_edge中的每个motif进行边缘标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的次数作为节点频率特征向量的一个维度;将重要性网络与节点标记motif结构集合M_stru_node中每个motif进行节点标记的子图同构匹配,使用NetworkX工具实现,得到节点在每个motif中的每个位置出现的频次作为节点重要性特征向量的一个维度,最终将在静态网络、时间网络、频率网络、重要性网络中提取的节点静态特征向量、节点时间特征向量、节点频率特征向量、节点重要性特征向量依次通过首尾相接的方式进行拼接,实现完整的节点级嵌入。
CN201911247335.2A 2019-12-09 2019-12-09 一种基于多视角motif融合的网络表示系统及方法 Active CN111064604B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911247335.2A CN111064604B (zh) 2019-12-09 2019-12-09 一种基于多视角motif融合的网络表示系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911247335.2A CN111064604B (zh) 2019-12-09 2019-12-09 一种基于多视角motif融合的网络表示系统及方法

Publications (2)

Publication Number Publication Date
CN111064604A true CN111064604A (zh) 2020-04-24
CN111064604B CN111064604B (zh) 2021-05-25

Family

ID=70300004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911247335.2A Active CN111064604B (zh) 2019-12-09 2019-12-09 一种基于多视角motif融合的网络表示系统及方法

Country Status (1)

Country Link
CN (1) CN111064604B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581445A (zh) * 2020-05-08 2020-08-25 杨洋 基于图基元的图嵌入学习方法
CN117349358A (zh) * 2023-12-04 2024-01-05 中国电子投资控股有限公司 基于分布式图处理框架的数据匹配与合并的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492133A (zh) * 2018-11-16 2019-03-19 大连理工大学 一种基于motif和网络嵌入的链路预测方法
CN109902203A (zh) * 2019-01-25 2019-06-18 北京邮电大学 基于边的随机游走的网络表示学习方法和装置
US20190354832A1 (en) * 2018-05-17 2019-11-21 Università della Svizzera italiana Method and system for learning on geometric domains using local operators

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190354832A1 (en) * 2018-05-17 2019-11-21 Università della Svizzera italiana Method and system for learning on geometric domains using local operators
CN109492133A (zh) * 2018-11-16 2019-03-19 大连理工大学 一种基于motif和网络嵌入的链路预测方法
CN109902203A (zh) * 2019-01-25 2019-06-18 北京邮电大学 基于边的随机游走的网络表示学习方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JINGJING XU 等: ""MMNR: A Network Representation Framework Based on Multi-view Motif Fusion"", 《IEEE》 *
许磊 等: ""保持Motif结构的网络表示学习"", 《计算机科学与探索》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581445A (zh) * 2020-05-08 2020-08-25 杨洋 基于图基元的图嵌入学习方法
CN111581445B (zh) * 2020-05-08 2023-10-13 杨洋 基于图基元的图嵌入学习方法
CN117349358A (zh) * 2023-12-04 2024-01-05 中国电子投资控股有限公司 基于分布式图处理框架的数据匹配与合并的方法和系统
CN117349358B (zh) * 2023-12-04 2024-02-20 中国电子投资控股有限公司 基于分布式图处理框架的数据匹配与合并的方法和系统

Also Published As

Publication number Publication date
CN111064604B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN109190653B (zh) 基于半监督密度聚类的恶意代码家族同源性分析方法
CN111064604B (zh) 一种基于多视角motif融合的网络表示系统及方法
CN109871954B (zh) 训练样本生成方法、异常检测方法及装置
CN105138601B (zh) 一种支持模糊约束关系的图模式匹配方法
CN106789912B (zh) 基于分类回归决策树的路由器数据平面异常行为检测方法
US20110004631A1 (en) Frequent changing pattern extraction device
JP5685324B2 (ja) 映像を比較する方法および装置
CN111814148A (zh) 一种基于方法调用图的安卓恶意软件家族聚类方法
CN107682344A (zh) 一种基于dpi数据互联网身份识别的id图谱建立方法
US8108387B2 (en) Method of detecting character string pattern at high speed using layered shift tables
CN110309337A (zh) 一种针对多种目标识别算法的特征值集中存储方法及装置
CN104700311B (zh) 一种社会网络中的邻域跟随社区发现方法
CN115546116A (zh) 全覆盖式岩体不连续面提取与间距计算方法及系统
CN109190656A (zh) 一种低采样定位环境下的室内语义轨迹标注和补全方法
CN108182382A (zh) 基于图相似的行为识别方法及系统
CN111008196A (zh) 基于深度优先搜索的频繁模式挖掘方法
CN114036318A (zh) 面向泛感知数据的基于时序图的公共安全知识图谱生成方法
CN107754312B (zh) 连通性检测方法和装置、存储介质、终端
CN105843809A (zh) 数据处理方法和装置
CN112801113A (zh) 基于多尺度可靠聚类的数据去噪方法
CN110046265B (zh) 一种基于双层索引的子图查询方法
CN110807061A (zh) 一种基于分层搜索不确定图的频繁子图的方法
Tushev et al. Parallel algorithms for effective correspondence problem solution in computer vision
CN109753579A (zh) 一种基于频繁项目集的图片标注推荐方法
CN113868475A (zh) 基于多渠道消费者数据整合方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant