CN112073217B - 一种多网络结构差异向量化方法及装置 - Google Patents

一种多网络结构差异向量化方法及装置 Download PDF

Info

Publication number
CN112073217B
CN112073217B CN202010789176.5A CN202010789176A CN112073217B CN 112073217 B CN112073217 B CN 112073217B CN 202010789176 A CN202010789176 A CN 202010789176A CN 112073217 B CN112073217 B CN 112073217B
Authority
CN
China
Prior art keywords
network
missing
structures
networks
redundant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010789176.5A
Other languages
English (en)
Other versions
CN112073217A (zh
Inventor
陈为
韩东明
潘嘉铖
赵晓冬
傅四维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202010789176.5A priority Critical patent/CN112073217B/zh
Publication of CN112073217A publication Critical patent/CN112073217A/zh
Application granted granted Critical
Publication of CN112073217B publication Critical patent/CN112073217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Technology Law (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种多网络结构差异向量化方法及装置,包括:获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;抽取所有网络对中被对比网络和对比网络的结构序列;对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。

Description

一种多网络结构差异向量化方法及装置
技术领域
本发明涉及网络差异分析技术领域,特别涉及一种多网络结构差异向量化方法及装置。
背景技术
网络数据包括节点和边,节点代表实体,边用于描述实体之间的关系,被广泛用于各个领域中,例如金融机构间的交易关系分析,社交关系网络中人物关系的分析,学者合作网络中合作模式的分析,而量化计算多个网络结构之间的差异,可以有助于深入理解网络中不同模式间的基本关系和多个网络之间的演化模式。例如,比较大脑部分切除前后的大脑连接网络,有助于科学家揭示大脑功能。比较不同时间戳中的通信网络可以揭示公司组织的架构变化。现有的基于统计学的方法,例如比较多个网络之间的平均度数差异,有效偏心率(effective eccentricity)等指标,无法捕捉结构上的差异和上下文的解释信息。而直接通过观察的方式来对比,在大规模的数据下难以适用。现有的技术缺少可以量化和计算多个网络之间结构差异的方法,例如,对不同时刻的金融交易网络之间的结构差异进行量化,可以分析交易网络的变化模式,寻找不同时刻中相似的变化模式,有助于分析师发现交易异常。对多个社交软件中人物的关系网络之间的结构差异进行量化,可以比较出不同软件之间人物关系的差异,有助于设计师制定不同软件的好友推荐策略。对不同期刊会议中的学者合作网络之间的结构差异进行向量化,可以比较不同会议间学者合作模式的差异,有助于研究者分析不同的合作模式。
发明内容
本发明实施例的目的是提供一种多网络结构差异向量化方法及装置,以解决现有存在的不能对多网络的结构差异进行量化的问题。
为了达到上述目的,本发明实施例所采用的技术方案如下:
第一方面,本发明实施例提供一种多网络结构差异向量化方法,包括:
获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
抽取所有网络对中被对比网络和对比网络的结构序列;
对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
进一步地,所述网络采用金融交易网络、社交关系网络或学者合作网络。
进一步地,抽取所有网络对中被对比网络和对比网络的结构序列,包括:
采用Random walk、Gaphlet count或Weisfeiler-Lehman对所有网络对中被对比网络和对比网络进行结构序列的抽取。
进一步地,对所有的多余结构和缺失结构分别进行向量化,得到每个网络的多余结构和缺失结构的向量,包括:
采用Doc2vec方法分别对所有的多余结构和所有的缺失结构进行向量化计算,得到每一个网络对的多余结构和缺失结构的向量,其中向量化计算过程中,应设置同样的Doc2vec方法维度参数,保证每个多余结构和缺失结构的向量维度一致。
进一步地,对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量,包括:
将多余结构和缺失结构的向量进行向量拼接,得到的向量即为网络对结构差异的向量,向量中包含了多余结构和缺失结构的信息。
第二方面,本发明实施例还提供一种多网络结构差异向量化装置,包括:
获取模块,用于获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
划分模块,用于将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
抽取模块,用于抽取所有网络对中被对比网络和对比网络的结构序列;
结构差异计算模块,用于对所有的结构序列进行结构差异计算,得到每个网络对的多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
向量化模块,用于对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
拼接模块,用于对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
第三方面,本发明实施例还提供一种多网络结构差异向量化方法,包括:
获取多个时刻的金融交易网络,其中包含为节点和边,节点代表为一个交易账户,边代表账户之间的交易关系;
将多个金融交易网络划分成多个要进行结构差异向量化的交易网络对,每个交易网络对包括被对比交易网络和对比交易网络;
抽取所有交易网络对中被对比交易网络和对比交易网络的交易结构序列;
对所有的交易结构序列进行结构差异计算,得到每个交易网络对多余交易结构和缺失交易结构,其中所述多余交易结构为第一个交易网络比第二个交易网络多的结构,所述缺失交易结构为第一个交易网络比第二个交易网络少的结构;
对所述多余交易结构和缺失交易结构分别进行向量化,得到多余交易结构和缺失交易结构的向量;
对每个金融交易网络对的多余交易结构和缺失交易结构的向量进行拼接,得到这个网络对结构差异的向量。
采用以上技术方案,具有如下技术效果:本发明通过对网络对进行结构序列抽取,计算两个网络的结构序列的差异,其中包括多余结构与缺失结构,通过分别对多余结构与缺失结构进行向量化。拼接多余结构与缺失结构的向量得到此网络对的结构差异向量。此时多个网络对之间的结构差异可以通过得到的向量进行比较和计算。可以判别哪些网络之间的结构差异是相似的,相似度有多少。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的一种多网络结构差异向量化方法的流程图;
图2为本发明实施例1提供的一种多个金融交易网络结构差异向量化方法的流程图;
图3为本发明实施例2提供的一种多个社交关系网络结构差异向量化方法的流程图;
图4为本发明实施例3提供的一种多个学者合作网络结构差异向量化方法的流程图;
图5为本发明实施例4提供的一种多网络结构差异向量化装置的框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例1:
图1为本发明实施例提供的一种多网络结构差异向量化方法的流程图;本实施例以网络结构形式为多个时刻的金融交易网络作为例子来说明,多个时刻的金融交易网络中,每个实体即为节点,为一个交易账户,实体间的关系即为边,表示账户之间的交易关系。每一个交易网络,代表某一时刻交易账户之间的交易关系。用户选择多对交易网络,来对每对交易网络间的结构差异进行向量化,来寻找具有相似结构差异的交易网络对。本实施例提供的一种多网络结构差异向量化方法,包括以下步骤:
步骤S101,获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
具体地,如图2(步骤1)所示,用户获取多个时刻的金融交易网络G,其中包含为节点和边,节点代表为一个交易账户;边代表账户之间的交易关系。
步骤S102,将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
具体地,如图2(步骤2)所示,用户定义每一个要进行结构差异比较的交易网络对P={Gi,Gj},每一个交易网络对包括被对比交易网络Gi和对比交易网络Gj
步骤S103,抽取所有网络对中被对比网络和对比网络的结构序列;
具体地,如图2(步骤3)所示,抽取所有交易网络对中的每一个交易网络的结构序列。采用Weisfeiler-Lehman算法得到被对比交易网络的结构序列Si={s1,s2,...},交易网络的结构序列Sj={s1,s2,...}。每一个结构s代表了这个交易网络中蕴含了这个交易模式。优选的,这里采用Weisfeiler-Lehman算法,其可以抽取交易网络G中所有的结构s,同时也是通过抽取结构来判断两个网络是否同构的高效算法之一。Random walk方法随机性强,效果差。Graphlet count方法需要预先定义需要抽取的结构s,并且需要耗费大量的时间进行抽取。
步骤S104,对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
具体地,如图2(步骤4)所示,计算交易网络对包括被对比交易网络Gi和对比交易网络Gj的结构序列Si,Sj的差异结构,得到多余交易结构序列
Figure BDA0002623140810000041
缺失交易结构序列/>
Figure BDA0002623140810000051
其中所述多余交易结构为第一个交易网络比第二个交易网络多的结构,所述缺失交易结构为第一个交易网络比第二个交易网络少的结构;
步骤S105,对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
具体地,如图2(步骤5)所示,对得到的所有的多余交易结构
Figure BDA0002623140810000052
和缺失的交易结构序列结构/>
Figure BDA0002623140810000053
分别用Doc2vec方法进行向量化,得到每一个交易网络对多余交易结构/>
Figure BDA0002623140810000054
的向量/>
Figure BDA0002623140810000055
缺失的交易结构序列/>
Figure BDA0002623140810000056
的向量/>
Figure BDA0002623140810000057
其中向量化计算过程中,应设置同样的Doc2vec方法维度参数,保证每个多余结构和缺失结构的向量维度一致。
步骤S106,对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
具体地,如图2(步骤6)所示,对于交易网络对P={Gi,Gj}中的多余的交易结构序列向量
Figure BDA0002623140810000058
的向量/>
Figure BDA0002623140810000059
和缺失的交易结构序列/>
Figure BDA00026231408100000510
的向量/>
Figure BDA00026231408100000511
进行拼接,得到交易网络对间的结构差异向量/>
Figure BDA00026231408100000512
向量中包含了多余交易结构和缺失交易结构的信息。
实施例2:
本实施例以网络结构形式为多个软件的社交关系网络作为例子来说明,多个软件的社交关系网络中,每个实体即为节点,为一个用户,实体间的关系即为边,表示用户之间的社交关系。每一个社交关系网络,代表某一个社交软件上用户的社交关系。用户选择多对社交关系网络,来对每对社交关系网络间的结构差异进行向量化,来寻找具有相似结构差异社交关系网络对。本实施例提供的一种多网络结构差异向量化方法,包括以下步骤:
步骤S101,获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
具体地,如图3(步骤1)所示,用户获取多个软件的社交关系网络F,其中包含为节点和边,节点代表为一个用户;边代表用户之间的社交关系。
步骤S102,将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
具体地,如图3(步骤2)所示,用户定义每一个要进行结构差异比较的关系网络对P={Gi,Gj},每一个关系网络对包括被对比关系网络Gi和对比关系网络Gj
步骤S103,抽取所有网络对中被对比网络和对比网络的结构序列;
具体地,如图3(步骤3)所示,抽取所有关系网络对中的每一个关系网络的结构序列。采用Weisfeiler-Lehman算法得到被对比关系网络的结构序列Si={s1,s2,...},关系网络的结构序列Sj={s1,s2,...}。每一个结构s代表了这个关系网络中蕴含了这个关系模式。优选的,这里采用Weisfeiler-Lehman算法,其可以抽取关系网络G中所有的结构s,同时也是通过抽取结构来判断两个网络是否同构的高效算法之一。Random walk方法随机性强,效果差。Graphlet count方法需要预先定义需要抽取的结构s,并且需要耗费大量的时间进行抽取。
步骤S104,对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
具体地,如图3(步骤4)所示,计算关系网络对包括被对比关系网络Gi和对比关系网络Gj的结构序列Si,Sj的差异结构,得到多余的关系结构(模式)序列
Figure BDA0002623140810000061
缺失的关系结构(模式)序列/>
Figure BDA0002623140810000062
步骤S105,对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
具体地,如图3(步骤5)所示,对得到的所有的多余关系结构
Figure BDA0002623140810000063
和缺失的关系结构序列结构/>
Figure BDA0002623140810000064
分别用Doc2vec方法进行向量化,得到每一个关系网络对的多余关系结构/>
Figure BDA0002623140810000065
的向量/>
Figure BDA0002623140810000066
缺失的关系结构序列/>
Figure BDA0002623140810000067
的向量/>
Figure BDA0002623140810000068
其中向量化计算过程中,应设置同样的Doc2vec方法维度参数,保证每个多余结构和缺失结构的向量维度一致。
步骤S106,对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
具体地,如图3(步骤6)所示,对于关系网络对P={Gi,Gj}中的多余的关系结构序列向量
Figure BDA0002623140810000069
的向量/>
Figure BDA00026231408100000610
和缺失的关系结构序列/>
Figure BDA00026231408100000611
的向量/>
Figure BDA00026231408100000612
进行拼接,得到关系网络对间的结构差异向量/>
Figure BDA00026231408100000613
向量中包含了多余关系结构和缺失关系结构的信息。
实施例3:
本实施例以网络结构形式为多个期刊的学者合作网络作为例子来说明,多个期刊的学者合作网络中,每个实体即为节点,为一个学者,实体间的关系即为边,表示学者之间的合作关系。每一个学者合作网络,代表某一个期刊中学者网络的合作关系。用户选择多对学者合作网络,来对每对学者合作网络间的结构差异进行向量化,来寻找具有相似结构差异学者合作网络对。本实施例提供的一种多网络结构差异向量化方法,包括以下步骤:
步骤S101,获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
具体地,如图4(步骤1)所示,用户获取多个期刊的学者合作网络G,其中包含为节点和边,节点代表为一个学者;边代表学者之间的合作关系。
步骤S102,将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
具体地,如图4(步骤2)所示,用户定义每一个要进行结构差异比较的合作网络对P={Gi,Gj},每一个合作网络对包括被对比合作网络Gi和对比合作网络Gj
步骤S103,抽取所有网络对中被对比网络和对比网络的结构序列;
具体地,如图4(步骤3)所示,抽取所有合作网络对中的每一个合作网络的结构序列。采用Weisfeiler-Lehman算法得到被对比合作网络的结构序列Si={s1,s2,...},合作网络的结构序列Sj={s1,s2,...}。每一个结构s代表了这个合作网络中蕴含了这个合作模式。优选的,这里采用Weisfeiler-Lehman算法,其可以抽取合作网络G中所有的结构s,同时也是通过抽取结构来判断两个网络是否同构的高效算法之一。Random walk方法随机性强,效果差。Graphlet count方法需要预先定义需要抽取的结构s,并且需要耗费大量的时间进行抽取。
步骤S104,对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
具体地,如图4(步骤4)所示,计算合作网络对包括被对比合作网络Gi和对比合作网络Gj的结构序列Si,Sj的差异结构,得到多余的合作结构(模式)序列
Figure BDA0002623140810000071
缺失的合作结构(模式)序列/>
Figure BDA0002623140810000072
步骤S105,对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
具体地,如图4(步骤5)所示,对得到的所有的多余合作结构
Figure BDA0002623140810000073
和缺失的合作结构序列结构/>
Figure BDA0002623140810000074
分别用Doc2vec方法进行向量化,得到每一个合作网络对多余合作结构/>
Figure BDA0002623140810000075
的向量/>
Figure BDA0002623140810000076
缺失的合作结构序列/>
Figure BDA0002623140810000077
的向量/>
Figure BDA0002623140810000078
其中向量化计算过程中,应设置同样的Doc2vec方法维度参数,保证每个多余结构和缺失结构的向量维度一致。
步骤S106,对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
具体地,如图4(步骤6)所示,对于合作网络对P={Gi,Gj}中的多余的合作结构序列向量
Figure BDA0002623140810000081
的向量/>
Figure BDA0002623140810000082
和缺失的合作结构序列/>
Figure BDA0002623140810000083
的向量/>
Figure BDA0002623140810000084
进行拼接,得到合作网络对间的结构差异向量/>
Figure BDA0002623140810000085
向量中包含了多余合作结构和缺失合作结构的信息。
实施例4:
图5为本发明实施例提供的一种多网络结构差异向量化装置的框图,该装置可以执行任意本发明任意实施例所提供的一种多网络结构差异向量化方法,具备执行该方法相应的功能模块和有益效果。如图5所示,该装置包括:
获取模块901,用于获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
划分模块902,用于将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
抽取模块903,用于抽取所有网络对中被对比网络和对比网络的结构序列;
结构差异计算模块904,用于对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
向量化模块905,用于对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
拼接模块906,用于对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的设备实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种多网络结构差异向量化方法,其特征在于,包括:
获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
抽取所有网络对中被对比网络和对比网络的结构序列;
对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量;
对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
2.根据权利要求1所述的一种多网络结构差异向量化方法,其特征在于,所述网络采用金融交易网络、社交关系网络或学者合作网络。
3.根据权利要求1所述的一种多网络结构差异向量化方法,其特征在于,抽取所有网络对中被对比网络和对比网络的结构序列,包括:
采用Random walk、Gaphlet count或Weisfeiler-Lehman对所有网络对中被对比网络和对比网络进行结构序列的抽取。
4.根据权利要求1所述的一种多网络结构差异向量化方法,其特征在于,对所有的多余结构和缺失结构分别进行向量化,得到每个网络对的多余结构和缺失结构的向量,包括:
采用Doc2vec方法分别对所有的多余结构和所有的缺失结构进行向量化计算,得到每一个多余结构和缺失结构的向量,其中向量化计算过程中,应设置同样的Doc2vec方法维度参数,保证每个多余结构和缺失结构的向量维度一致。
5.根据权利要求1所述的一种多网络结构差异向量化方法,其特征在于,对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量,包括:
将多余结构和缺失结构的向量进行向量拼接,得到的向量即为网络对结构差异的向量,向量中包含了多余结构和缺失结构的信息。
6.一种多网络结构差异向量化装置,其特征在于,包括:
获取模块,用于获取多个网络,其中每个网络中包括节点和边,节点表示任一实体,边表示实体之间的关系;
划分模块,用于将多个网络划分成多个要进行结构差异向量化的网络对,每个网络对包括被对比网络和对比网络;
抽取模块,用于抽取所有网络对中被对比网络和对比网络的结构序列;
结构差异计算模块,用于对所述结构序列进行结构差异计算,得到多余结构和缺失结构,其中所述多余结构为第一个网络比第二个网络多的结构,所述缺失结构为第一个网络比第二个网络少的结构;
向量化模块,用于对所有的多余结构和缺失结构分别进行向量化,得到每个网络对多余结构和缺失结构的向量;
拼接模块,用于对每个网络对的多余结构和缺失结构的向量进行拼接,得到这个网络对结构差异的向量。
7.根据权利要求6所述的一种多网络结构差异向量化装置,其特征在于,所述网络采用金融交易网络、社交关系网络或学者合作网络。
CN202010789176.5A 2020-08-07 2020-08-07 一种多网络结构差异向量化方法及装置 Active CN112073217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010789176.5A CN112073217B (zh) 2020-08-07 2020-08-07 一种多网络结构差异向量化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010789176.5A CN112073217B (zh) 2020-08-07 2020-08-07 一种多网络结构差异向量化方法及装置

Publications (2)

Publication Number Publication Date
CN112073217A CN112073217A (zh) 2020-12-11
CN112073217B true CN112073217B (zh) 2023-03-24

Family

ID=73662573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010789176.5A Active CN112073217B (zh) 2020-08-07 2020-08-07 一种多网络结构差异向量化方法及装置

Country Status (1)

Country Link
CN (1) CN112073217B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136779A (zh) * 2019-05-30 2019-08-16 上海大学 一种生物网络关键差异节点的样本特征提取及预测方法
CN111260462A (zh) * 2020-01-16 2020-06-09 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN112567387A (zh) * 2018-06-11 2021-03-26 英艾特股份公司 将循环人工神经网络中的活动特征化以及编码和解码信息

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109936525B (zh) * 2017-12-15 2020-07-31 阿里巴巴集团控股有限公司 一种基于图结构模型的异常账号防控方法、装置以及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112567387A (zh) * 2018-06-11 2021-03-26 英艾特股份公司 将循环人工神经网络中的活动特征化以及编码和解码信息
CN110136779A (zh) * 2019-05-30 2019-08-16 上海大学 一种生物网络关键差异节点的样本特征提取及预测方法
CN111260462A (zh) * 2020-01-16 2020-06-09 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RCAnalyzer: visual analytics of rare categories;潘嘉铖等;《Frontiers of Information Technology & Electronic Engineering》;20200403;全文 *

Also Published As

Publication number Publication date
CN112073217A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
Cai et al. PiiGAN: generative adversarial networks for pluralistic image inpainting
De Santo et al. A large database of graphs and its use for benchmarking graph isomorphism algorithms
US10552471B1 (en) Determining identities of multiple people in a digital image
CN111461164B (zh) 样本数据集的扩容方法及模型的训练方法
Li et al. Refining graph structure for incomplete multi-view clustering
CN105913235A (zh) 一种客户转账关系分析方法及系统
Yuan et al. A continuum limit for the PageRank algorithm
Collier et al. Curve registration by nonparametric goodness-of-fit testing
Hewapathirana et al. Change detection in noisy dynamic networks: a spectral embedding approach
CN111062808B (zh) 信用卡额度评估方法、装置、计算机设备及存储介质
Rossi et al. Unfolding kernel embeddings of graphs: Enhancing class separation through manifold learning
Xueshuo et al. AWAP: Adaptive weighted attribute propagation enhanced community detection model for bitcoin de-anonymization
Ibrahim et al. Confidence-based weighted loss for multi-label classification with missing labels
Chen et al. Community detection in complex network based on APT method
Zhang et al. Tensorized topological graph learning for generalized incomplete multi-view clustering
CN112073217B (zh) 一种多网络结构差异向量化方法及装置
Zhang et al. Center consistency guided multi-view embedding anchor learning for large-scale graph clustering
Qin et al. Robust low-rank tensor reconstruction using high-order t-SVD
CN111368552A (zh) 一种面向特定领域的网络用户群组划分方法及装置
CN113807370B (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
CN113705247B (zh) 主题模型效果评估方法、装置、设备、存储介质和产品
CN115393241A (zh) 医学图像增强方法、装置、电子设备及可读存储介质
CN111401347B (zh) 基于图片的信息定位方法以及装置
CN110599358B (zh) 一种基于概率因子图模型的跨社交网络用户身份关联方法
CN114332472A (zh) 一种基于图神经网络的数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant