CN113158391B - 多维网络节点分类的可视化方法、系统、设备和存储介质 - Google Patents
多维网络节点分类的可视化方法、系统、设备和存储介质 Download PDFInfo
- Publication number
- CN113158391B CN113158391B CN202110482521.5A CN202110482521A CN113158391B CN 113158391 B CN113158391 B CN 113158391B CN 202110482521 A CN202110482521 A CN 202110482521A CN 113158391 B CN113158391 B CN 113158391B
- Authority
- CN
- China
- Prior art keywords
- dimensional
- node
- graph
- network
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/10—Geometric CAD
- G06F30/18—Network design, e.g. design based on topological or interconnect aspects of utility systems, piping, heating ventilation air conditioning [HVAC] or cabling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/04—Constraint-based CAD
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请涉及本发明实施例公开了一种多维网络节点分类的可视化方法、系统、设备和存储介质,该方法是基于机器学习的网络嵌入技术,并结合正则化机制、注意力机制融合得到多维图网络中每一个节点的低维稠密向量,构成一个低维嵌入矩阵。并基于非线性降维算法,对所述低维嵌入矩阵进行投影,得到多维图数据中每个节点在二维空间中的坐标值,以节点的标签信息为颜色映射采用可视化技术呈现分类的结果。本发明实施例得到的低维嵌入同时融合了节点近距离、节点远距离和节点的属性信息。而且基于非线性降维算法将得到的低维嵌入矩阵投影到二维布局空间中,采用可视化技术从视觉的角度直观的展示出原始多维图网络中的各种特征信息对节点分类的影响。
Description
技术领域
本申请涉及网络数据处理领域,特别是涉及一种多维网络节点分类的可视化方法、系统、设备和存储介质。
背景技术
随着过去几十年科技的迅猛发展,特别是以互联网和大数据为代表的新兴技术,已经渗透到生活中的方方面面,人类已经处于一个信息化时代。其中,以因特网为代表的信息技术的发展,使得现实世界中系统与系统之间以不同的交互方式相互影响,其联系也越来越紧密。对于一个给定的系统,其内部的连接模式可以用网络来描述:系统中的各个部件被抽象为顶点(或节点)、部件之间的联系抽象成边;如经济网络、社交网络、生物网络、交通网络、电商信息网络等,这些网络的演化与变迁同时也是人类真实世界的映射。
当今大数据时代海量、易得且具有相关性的数据能够很好的表征出节点之间关系的多样性,可以从各个维度来观测节点之间的关系。不同类型相互作用的同时存在是观察节点之间集体现象的根源,这在单层网络中通常是不可能的,其中单层同质网络(同质网络表示只包含一种节点类型和一种连边类型的网络)只能表示节点之间的一种关系类型。如以一个在线社交网络为例,同一组用户在新浪微博、微信、QQ三种社交账号中同时存在交互关系,若将该具有多种交互关系的网络表示为多关系融合网络,则无法清晰的表达出同一维度图网络各自的结构特征以及不同维度之间的耦合信息和交互关联信息。
现有技术存在以下技术问题:1)经典的基于随机游走的网络嵌入技术能够捕获目标节点远距离的节点邻居信息(即全局的结构特征),但是该方法只能捕获图网络的结构特征,无法捕获节点的属性特征;2)图卷积网络技术能够天然的融合节点的属性特征,但是不能捕获目标节点远距离的邻居信息;3)基于随机游走的网络嵌入技术和图卷积网络技术针对于单层的同质图网络而设计,不能直接用于多维图网络;4)经典的基于非线性降维的图可视化技术只描述由节点结构表现出的相似性特征,而没有考虑图网络中的其它特征对节点相似性的影响。
发明内容
基于此,有必要针对上述技术问题,提供一种多维网络节点分类的可视化方法、系统、设备和存储介质。
第一方面,本发明实施例提供了一种多维网络节点分类的可视化方法,包括以下步骤:
基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
进一步的,所述基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入,包括:
将维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集所述节点vi的上下文信息,获得一个游走序列;
通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;
将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点vi的低维嵌入。
进一步的,所述采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵,包括:
对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;
利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;
基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值。
进一步的,所述加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示,包括:
将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;
基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
另一方面,本发明实施例还提供了一种多维网络节点分类的可视化系统,包括:
全局结构特征模块,用于基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
特定维度图网络模块,用于将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
图卷积网络模块,用于基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
相关性约束模块,用于采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
分类展示模块,用于加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
进一步的,所述全局结构特征模块包括随机游走网络嵌入单元,所述随机游走网络嵌入单元用于:
将维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集所述节点vi的上下文信息,获得一个游走序列;
通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;
将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点vi的低维嵌入。
进一步的,所述相关性约束模块包括约束训练单元,所述约束训练单元用于:
对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;
利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;
基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值。
进一步的,所述分类展示模块包括投影映射单元,所述投影映射单元用于:
将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;
基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
本申请的有益效果是:本发明实施例公开了一种多维网络节点分类的可视化方法、系统、设备和存储介质,该方法是基于机器学习的网络嵌入技术,即随机游走的网络嵌入和图卷积网络的网络嵌入技术,并结合正则化机制、注意力机制融合得到多维图网络中每一个节点的低维稠密向量,构成一个低维嵌入矩阵。该低维嵌入矩阵包含了多维图网络的节点属性、局部和全局的结构、不同维度之间的相关性和重要性差异等各种信息。此外基于非线性降维算法,对所述低维嵌入矩阵进行投影,得到多维图数据中每个节点在二维空间中的坐标值,以节点的标签信息为颜色映射采用可视化技术呈现分类的结果。本发明实施例将随机游走的网络嵌入技术和图卷积网络技术相结合,得到的低维嵌入不仅包含了节点远距离的节点邻居信息(全局结构),同时融合了节点近距离(局部结构)和节点的属性信息。而且,本发明实施例基于非线性降维算法将得到的低维嵌入矩阵投影到二维布局空间中,根据得到的二维坐标值,采用可视化技术从视觉的角度直观的展示出原始多维图网络中的各种特征信息对节点分类的影响。
附图说明
图1为一个实施例中公开的一种多维网络节点分类的可视化方法的流程示意图;
图2为一个实施例中公开的随机游走网络嵌入多维图网络节点的流程示意图;
图3为一个实施例中公开的获取不同维度图网络的相关性和重要性的流程示意图;
图4为一个实施例中公开的对多维网络节点进行分类并可视化的流程示意图;
图5为一个实施例中多维网络节点分类的可视化系统的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
可视化技术通过视觉图像,能够加快信息的处理速度,为发现和理解科学规律提供了有力支撑。其中,图可视化已成为一种重要的网络数据分析方法。图可视化主要分为:基于力引导的方法和基于数据降维的方法。其中基于力引导的图可视化技术通过将图建模为物理系统,计算每个节点引力和斥力综合的合力,由此合力来移动节点的位置,直到整个系统达到稳定状态。而基于数据降维的图可视化是通过设计一个优化目标函数,力求保持图空间和二维布局空间中节点分布之间的相似性,即二维布局空间中节点的分布和原始图空间中节点分布的差异尽可能的小,使得二维布局空间中的节点分布能够反映出原始图空间中的节点信息。基于数据降维的图可视化分为基于线性降维技术和非线性降维技术。而基于线性降维的可视化技术只能反映出具有线性关系的结构数据,因此基于非线性降维的可视化技术应用更加广泛。
在一个实施例中,如图1所示,提供了一种多维网络节点分类的可视化方法,包括以下步骤:
步骤101,基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
步骤102,将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
步骤103,基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
步骤104,采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
步骤105,加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
具体地,本实施例基于机器学习的网络嵌入技术,即随机游走的网络嵌入和图卷积网络的网络嵌入技术,并结合正则化机制、注意力机制融合得到多维图网络中每一个节点的低维稠密向量,构成一个低维嵌入矩阵。该低维嵌入矩阵包含了多维图网络的节点属性、局部和全局的结构、不同维度之间的相关性和重要性差异等各种信息。此外基于非线性降维算法,对所述低维嵌入矩阵进行投影,得到多维图数据中每个节点在二维空间中的坐标值,以节点的标签信息为颜色映射采用可视化技术呈现分类的结果。本发明实施例将随机游走的网络嵌入技术和图卷积网络技术相结合,得到的低维嵌入不仅包含了节点远距离的节点邻居信息(全局结构),同时融合了节点近距离(局部结构)和节点的属性信息。而且,本发明实施例基于非线性降维算法将得到的低维嵌入矩阵投影到二维布局空间中,根据得到的二维坐标值,采用可视化技术从视觉的角度直观的展示出原始多维图网络中的各种特征信息对节点分类的影响。
在一个实施例中,如图2所示,随机游走网络嵌入多维图网络节点的流程包括:
步骤201,将维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集所述节点vi的上下文信息,获得一个游走序列;
步骤202,通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;
步骤203,将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点vi的低维嵌入。
具体地,对于维度为r的图网络Gr中的n个节点,本发明将基于随机游走的网络嵌入模型获得n个节点的低维向量矩阵。
对于维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集节点vi的上下文信息(即邻居节点),获得一个游走序列;通过窗口划分该游走序列,获得关于该节点信息的训练样本序列;将训练样本输入到Skip-Gram模型中,并通过随机梯度下降方法优化目标函数Lloss,得到节点vi的低维稠密向量。
在一个实施例中,如图3所示,获取不同维度图网络的相关性和重要性包括以下步骤:
步骤301,对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;
步骤302,利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;
步骤303,基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值。
具体地,多维图网络中不同维度之间通常具有一定的相关性,具体表现在不同维的图网络之间通常具有一定的相似性或共性特征,上文所述的基于M个图卷积网络模型得到的M个低维嵌入矩阵,无法捕获不同维的图网络之间的相关性信息。
本发明采用正则化的一致性约束和正则化的M个图神经网络的权重参数来捕获其相关性,具体体现在在其下游的优化目标函数中,添加两个正则化约束项:
(1)M个低维嵌入矩阵的一致性正则化约束项LCC,LCC度量两个不同嵌入矩阵之间的相似性程度,其反映出原始多维图网络中相应维度图网络之间的相似性。
(2)M个图卷积网络的权重参数约束。
在一个实施例中,如图4所示,对多维网络节点进行分类并可视化包括以下步骤:
步骤401,将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;
步骤402,基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
具体地,基于非线性降维算法,将低维嵌入矩阵投影到二维布局空间中包括以下步骤:基于低维嵌入矩阵,计算节点之间的相似性,即计算P分布。在二维布局空间中,计算节点之间布局接近性,即计算Q分布。计算P分布和Q分布之间的KL散度,不断迭代优化目标函数,减小P分布和Q分布之间的差异,得到n个节点在二维布局空间中的二维坐标值。根据二维坐标值和节点的标签进行图可视化映射。
其中,根据得到的低维嵌入矩阵,计算描述节点之间相似性的P分布。
其中,对于节点vi和节点vj而言,条件概率pji表示节点vi选择vj作为其临近点的概率,如果节点vi和vj具有很高的相似性,则pji值会很大。dij表示节点vi和vj之间的距离,原始非线性降维方法中采用图论中的最短路径来表示该距离,其缺点在于只能描述节点之间的结构相似性。本发明基于节点vi和vj的低维嵌入计算该距离值,因低维嵌入已经捕获了多维图网络中节点的局部结构特征、属性特征、远距离节点信息(全局结构特征)以及不同维度图网络之间的相关性和重要性差异,因此基于节点vi和vj的低维嵌入来计算dij,得到节点之间相似性的分布会更加准确和全面的描述多维图网络中的特征。δi表示节点vi为中心点的高斯分布的方差。
基于Student-t分布度量二维布局空间中节点vi和vj之间的接近性,即得到Q分布:
其中,||yi-yj||表示节点vi和vj在二维布局空间中的距离(yi和yj分别表示节点vi和vj在二维布局空间中的坐标值)。与P分布类似,Q分布表示二维布局空间中相似的节点距离更加接近,不相似的节点距离相对较远。
P分布和Q分布之间的KL散度为:
在模型优化过程中,不断减少CKL,使得qij尽可能的反映出pij,即二维布局空间中的节点坐标位置尽可能的反映出原始图网络中的特征信息。
当模型停止迭代优化时,此时的y1,y2,L,yn即为n个节点的二维坐标值。为了能够清楚的表明节点的分类结果,本发明将具有相同标签的节点采用相同的颜色进行绘制,不同标签的节点采用不同的颜色,可视化的结果即为多维图网络节点分类后的视觉效果。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种多维网络节点分类的可视化系统,包括:
全局结构特征模块501,用于基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
特定维度图网络模块502,用于将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
图卷积网络模块503,用于基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
相关性约束模块504,用于采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
分类展示模块505,用于加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
在一个实施例中,所述全局结构特征模块501包括随机游走网络嵌入单元,所述随机游走网络嵌入单元用于:
将维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集所述节点vi的上下文信息,获得一个游走序列;
通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;
将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点vi的低维嵌入。
在一个实施例中,所述相关性约束模块504包括约束训练单元,所述约束训练单元用于:
对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;
利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;
基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值。
在一个实施例中,所述分类展示模块505包括投影映射单元,所述投影映射单元用于:
将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;
基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
关于多维网络节点分类的可视化系统的具体限定可以参见上文中对于多维网络节点分类的可视化方法的限定,在此不再赘述。上述多维网络节点分类的可视化系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图6示出了一个实施例中计算机设备的内部结构图。如图6所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现权限异常检测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行权限异常检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集所述节点vi的上下文信息,获得一个游走序列;
通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;
将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点vi的低维嵌入。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;
利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;
基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;
基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;
将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;
加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,将所述综合低维向量在二维空间投影,对节点的分类结果进行展示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将维度为r的图网络中任意一个给定节点vi,通过随机游走的采样策略采集所述节点vi的上下文信息,获得一个游走序列;
通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;
将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点vi的低维嵌入。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;
利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;
基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;
基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (4)
1.一种多维网络节点分类的可视化方法,其特征在于,所述多维网络为多维社交网络,所述多维网络节点为所述多维社交网络中的用户;所述多维网络节点分类的可视化方法包括以下步骤:
基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入,包括:将维度为r的图网络中任意一个给定节点,通过随机游走的采样策略采集所述节点的上下文信息,获得一个游走序列;通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;将所述训练样本序列输入到Ski p-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点的低维嵌入;
将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵,包括:对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值;
加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量;所述综合低维向量包含多维图网络的节点属性特征、局部结构特征、全局结构特征、不同维度图网络之间的相关性和重要性差异五种信息;
将所述综合低维向量在二维空间投影,对节点的分类结果进行展示,包括:将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
2.一种多维网络节点分类的可视化系统,其特征在于,所述多维网络为多维社交网络,所述多维网络节点为所述多维社交网络中的用户;所述多维网络节点分类的可视化系统包括:
全局结构特征模块,用于基于随机游走的网络嵌入技术将多维图网络节点中的所有维度图节点转换为稠密的低维嵌入;所述全局结构特征模块包括:随机游走网络嵌入单元,用于将维度为r的图网络中任意一个给定节点,通过随机游走的采样策略采集所述节点的上下文信息,获得一个游走序列;通过可视窗口划分所述游走序列,获得关于该节点信息的训练样本序列;将所述训练样本序列输入到Skip-Gram模型中,通过随机梯度下降方法进行目标优化,得到所述节点的低维嵌入;
特定维度图网络模块,用于将所述低维嵌入进行加权平均,并与所述多维图的节点原始属性特征进行拼接,得到第二属性特征;
图卷积网络模块,用于基于图卷积网络捕获每一维度图网络的结构和属性信息,将包含所述第二属性特征的每一个节点嵌入到低维空间中,得到低维嵌入矩阵;
相关性约束模块,用于采用正则化约束来捕获不同维度图网络之间的相关性,并利用注意力机制获取不同维度图网络的重要性权值,得到注意力矩阵;所述相关性约束模块包括约束训练单元,用于对所述低维嵌入矩阵采用正则化的一致性约束,度量所述低维嵌入矩阵之间的相似性程度,得到原始多维图网络中相应维度图网络之间的相似性;利用正则化的M个图神经网络的权重参数来捕获不同维度图网络的相关性;基于注意力机制在训练过程中,以下游的节点分类任务为导向,自适应计算出不同维度的重要性权值;
分类展示模块,用于加权融合所述低维嵌入矩阵和所述注意力矩阵,获得n个节点综合低维向量,所述综合低维向量包含多维图网络的节点属性特征、局部结构特征、全局结构特征、不同维度图网络之间的相关性和重要性差异五种信息;还用于将所述综合低维向量在二维空间投影,对节点的分类结果进行展示;所述分类展示模块包括投影映射单元,用于将所述综合低维向量采用非线性降维技术投影到二维布局空间中,得到节点在二维空间中的坐标值;基于所述坐标值,采用可视化技术以节点的标签信息进行颜色映射,将节点的分类结果以视觉的形式进行展示。
3.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1所述方法的步骤。
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482521.5A CN113158391B (zh) | 2021-04-30 | 2021-04-30 | 多维网络节点分类的可视化方法、系统、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482521.5A CN113158391B (zh) | 2021-04-30 | 2021-04-30 | 多维网络节点分类的可视化方法、系统、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113158391A CN113158391A (zh) | 2021-07-23 |
CN113158391B true CN113158391B (zh) | 2023-05-30 |
Family
ID=76873218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110482521.5A Active CN113158391B (zh) | 2021-04-30 | 2021-04-30 | 多维网络节点分类的可视化方法、系统、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113158391B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705642B (zh) * | 2021-08-16 | 2023-10-24 | 中山大学 | 一种基于属性的文物层次分类方法、系统及装置 |
CN114090838B (zh) * | 2022-01-18 | 2022-06-14 | 杭州悦数科技有限公司 | 大数据可视化展示的方法、系统、电子装置和存储介质 |
CN116186547B (zh) * | 2023-04-27 | 2023-07-07 | 深圳市广汇源环境水务有限公司 | 一种环境水务监测采样异常数据快速识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109753589A (zh) * | 2018-11-28 | 2019-05-14 | 中国科学院信息工程研究所 | 一种基于图卷积网络的图可视化方法 |
CN112231482A (zh) * | 2020-11-06 | 2021-01-15 | 中国人民解放军国防科技大学 | 基于可伸缩表示学习的长短文本分类方法 |
CN112417633A (zh) * | 2020-12-01 | 2021-02-26 | 中国人民解放军国防科技大学 | 面向大规模网络的图布局方法以及装置 |
-
2021
- 2021-04-30 CN CN202110482521.5A patent/CN113158391B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109753589A (zh) * | 2018-11-28 | 2019-05-14 | 中国科学院信息工程研究所 | 一种基于图卷积网络的图可视化方法 |
CN112231482A (zh) * | 2020-11-06 | 2021-01-15 | 中国人民解放军国防科技大学 | 基于可伸缩表示学习的长短文本分类方法 |
CN112417633A (zh) * | 2020-12-01 | 2021-02-26 | 中国人民解放军国防科技大学 | 面向大规模网络的图布局方法以及装置 |
Non-Patent Citations (2)
Title |
---|
局部二进制模式方法综述;刘丽 等;《中国图象图形学报》;第第19卷卷(第第12期期);第1696-1720页 * |
融合节点结构和内容的网络表示学习方法;张虎 等;《计算机科学》;第第47卷卷(第第12期期);第119-124页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113158391A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Symbiotic graph neural networks for 3d skeleton-based human action recognition and motion prediction | |
CN113158391B (zh) | 多维网络节点分类的可视化方法、系统、设备和存储介质 | |
Xie et al. | Unseen object instance segmentation for robotic environments | |
Martinez et al. | A scientometric analysis and critical review of computer vision applications for construction | |
JP7286013B2 (ja) | ビデオコンテンツ認識方法、装置、プログラム及びコンピュータデバイス | |
Da Silva et al. | Active learning paradigms for CBIR systems based on optimum-path forest classification | |
Peralta et al. | Next-best view policy for 3d reconstruction | |
US11748937B2 (en) | Sub-pixel data simulation system | |
Wang et al. | 3d-physnet: Learning the intuitive physics of non-rigid object deformations | |
Adate et al. | A survey on deep learning methodologies of recent applications | |
CN111881804B (zh) | 基于联合训练的姿态估计模型训练方法、系统、介质及终端 | |
Gomes et al. | Spatio-temporal graph-RNN for point cloud prediction | |
Zhou et al. | Indexed-points parallel coordinates visualization of multivariate correlations | |
Jha et al. | The neural process family: Survey, applications and perspectives | |
Lu et al. | Rapid mechanical property prediction and de novo design of three-dimensional spider webs through graph and GraphPerceiver neural networks | |
Yang et al. | Xception-based general forensic method on small-size images | |
Riedel et al. | Hand gesture recognition of methods-time measurement-1 motions in manual assembly tasks using graph convolutional networks | |
Bozkir et al. | FUAT–A fuzzy clustering analysis tool | |
Drumond et al. | Few-shot human motion prediction for heterogeneous sensors | |
Tagore et al. | T-MAN: a neural ensemble approach for person re-identification using spatio-temporal information | |
Łępicka et al. | Utilization of colour in ICP-based point cloud registration | |
Khoyani et al. | A survey on visual slam algorithms compatible for 3d space reconstruction and navigation | |
Pegia et al. | Multimodal 3D Object Retrieval | |
Jaunet et al. | Sim2realviz: Visualizing the sim2real gap in robot ego-pose estimation | |
Ward et al. | Improving image-based localization with deep learning: The impact of the loss function |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |