CN104063511A - 基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法 - Google Patents

基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法 Download PDF

Info

Publication number
CN104063511A
CN104063511A CN201410325766.7A CN201410325766A CN104063511A CN 104063511 A CN104063511 A CN 104063511A CN 201410325766 A CN201410325766 A CN 201410325766A CN 104063511 A CN104063511 A CN 104063511A
Authority
CN
China
Prior art keywords
msub
data
complex system
mrow
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410325766.7A
Other languages
English (en)
Inventor
李君宝
刘大同
印姗
梁军
彭宇
彭喜元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201410325766.7A priority Critical patent/CN104063511A/zh
Publication of CN104063511A publication Critical patent/CN104063511A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法,涉及复杂系统监督图嵌入结构化数据监测方法。它是为了解决现有对复杂系统监督图嵌入结构化数据难以实现可视化监测的问题。本发明对复杂系统高维数据进行维数约减,并保存数据点之间的空间结构关系。将高维数据降到人眼可见的二维或三维,在可见空间中观察数据点之间的结构关系,实现高维数据可视化呈现。本发明适用于复杂系统监督图嵌入结构化数据可视化监测场合。

Description

基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法
技术领域
本发明涉及复杂系统监督图嵌入结构化数据监测方法。
背景技术
目前,利用图嵌入数据分析方法对数据进行可视化分析的应用少见,对复杂系统运行监测数据或试验测试数据进行可视化分析未见报道。
现有的图嵌入数据分析方法主要有局部线性嵌入(Locality Linear Embedding,LLE)、拉普拉斯特征映射(Laplacian Eigenmaps,LE)以及局部保持映射(LocalityPreserving Projection,LPP)算法。LLE存在邻近点参数选择的困难;LE算法是一种非线性算法,对数据点之间结构保持不利;LPP算法是一种无监督方法,构建邻近图时,存在参数选择困难等问题。
发明内容
本发明是为了解决现有对复杂系统监督图嵌入结构化数据难以实现可视化监测的问题,从而提供一种基于相关性度量的监督图嵌入结构化数据可视化监测方法(Supervised Graph Embedding based on Correlation,SGEC)。
基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法,它由以下步骤实现:
步骤一、采集复杂系统数据X,所述复杂系统数据X为m类n维数据矩阵,即:n×m矩阵:{x1,x2,…,xm},xi,xj∈Rn,i,j=1,2,…m,xi,xj为n维列向量,Rn为n维实数集;
步骤二、根据步骤一中复杂系统数据X的标签信息以及相关性进行构图,获得步骤一中复杂系统数据X的映射图;
步骤三、根据步骤二获得的复杂系统数据X的映射图,通过公式:
W ij = Cov ( x i , x j ) / σ i σ j , x i , x j ∈ Class ( x i , x j ) 0 , x i , x j ∉ Class ( x i , x j )
获得该映射图的权值矩阵Wij
其中:为xi与xj的协方差,而σi、σj分别为xi、xj的标准差;
步骤四、根据公式:
D ii = Σ j W ji
获得对角矩阵D;
步骤五、根据公式:L=D-W获得拉普拉斯矩阵L;
步骤六、根据公式:
XLXTa=λXDXTa
获得映射矩阵A的列向量a和特征值λ;a=a0,…al-1
列向量a0,…al-1根据特征值从小到大的顺序:λ0<…<λl-1进行排序,
并根据公式:
xi→yi=ATxi,A=(a0,a1,…,al-1)
获得映射矩阵A;
步骤七、根据映射矩阵A将复杂系统数据X从m维空间降为l维空间,降维后的数据为Y{y1,y2,…ym},yi∈Rl,i=1,2,…m(l<<n),其中,yi=ATxi,yi代表xi在低维空间的映射yi=ATxi
降维后的数据Y对复杂系统数据的可视化监测结果。
步骤二中所述的根据步骤一中复杂系统数据X的标签信息以及相关性进行构图的方法为:
根据各数据的标签信息,当节点xi与节点xj满足条件:xi,xj∈Class(xi,xj)时则节点xi与节点xj被连接;
其中:xi,xj∈Class(xi,xj)表示xi与xj属于同一类,是否为同一类依照数据的标签信息确定。
本发明通过对高维数据进行维数约减,并保存数据点之间的空间结构关系。将高维数据降到人眼可见的二维或三维,在可见空间中观察数据点之间的结构关系,实现高维数据可视化呈现。实现未知模式的挖掘与探索,挖掘数据中隐含的有用知识和信息。
附图说明
图1是本发明的SGEC应用于复杂系统监测数据可视化的流程示意图;
图2是四类监测数据24个小时数据结构可视化结果仿真示意图;其中*为A类;+为B类;○为C类;△为D类;
图3是四类监测数据12个小时数据结构可视化结果仿真示意图;其中*为A类;+为B类;○为C类;△为D类;
图4是四类监测数据6个小时数据结构可视化结果仿真示意图;其中*为A类;+为B类;○为C类;△为D类;
图5是四类监测数据1个小时数据结构可视化结果仿真示意图;其中*为A类;+为B类;○为C类;△为D类;
图6是A类数据的功率谱分析结果仿真示意图;
图7是B类数据的功率谱分析结果仿真示意图;
图8是C类数据的功率谱分析结果仿真示意图;
图9是D类数据的功率谱分析结果仿真示意图;
具体实施方式
具体实施方式一、结合图1说明本具体实施方式,基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法,采集复杂系统数据X,所述复杂系统数据X为m类n维数据{x1,x2,…,xm},xi∈Rn,i=1,2,…m,求解线性映射矩阵A,A=(a0,a1,…,al-1),将此n维数据映射到l维空间{y1,y2,…ym},yi∈Rl,i=1,2,…m(l<<n),其中,yi=ATxi,yi代表xi在低维空间的映射。
利用数据的标签信息以及相关性进行构图。同类数据可以被连接,连接数据节点的边通过度量数据之间的相关性获得。保证在原始空间为同一类的点在低维映射空间中依然为同一类。
基于相关性度量的监督图嵌入结构化算法(Supervised Graph Embedding based onCorrelation,SGEC)通过嵌入图形构造,获得图的权值矩阵W,求解矩阵W的变换矩阵的特征向量,从而求解映射矩阵A。
SGEC算法流程以及实现步骤如图1所示。
第一步:构造映射图:
充分考虑数据的标签信息,如果节点xi与节点xj满足条件:xi,xj∈Class(xi,xj)时可以被连接。
xi,xj∈Class(xi,xj)表示xi与xj属于同一类,是否为同一类依照数据的标签信息确定。如图1所示,颜色相同的点标签信息显示为同一类,其间可以建立连接关系。
第二步:计算权重:
权重矩阵Wij的获得通过度量数据的相关性获得,可以有两种方式:
方式一,计算数据点的夹角余弦值:
W ij = x i T x j | | x i | | | | x j | | , x i , x j &Element; Class ( x i , x j ) 0 , x i , x j &NotElement; Class ( x i , x j ) - - - ( 1 )
方法二,计算数据点的线性相关性:
W ij = Cov ( x i , x j ) / &sigma; i &sigma; j , x i , x j &Element; Class ( x i , x j ) 0 , x i , x j &NotElement; Class ( x i , x j ) - - - ( 2 )
其中,为xi与xj的协方差,而σi、σj分别为xi、xj的标准差。
本发明利用同类数据的相关性,避免了权重计算参数选择的难题。
第三步:特征映射:
计算下列广义特征向量问题的特征向量和特征值:
XLXTa=λXDXTa (3)
D为对角矩阵,L=D-W是拉普拉斯矩阵。
列向量a0,…al-1是等式(3)的解,排序依照其特征值:λ0<…<λl-1
通过求解a0,…al-1,可以求得映射矩阵A:xi→yi=ATxi,A=(a0,a1,…,al-1)。
发明效果:利用本发明提出的方法挖掘含有标签信息的数据未知模式以及判定专家所给出的标签信息的合理性。
监测获得的复杂系统运行数据含有一定的类别标签,而这些已经被标记的数据中还含有一定的规律及隐藏的信息。而复杂系统数据维数高,直接对数据进行分析比较困难,这就需要借助本发明提出的方法SGEC对复杂系统数据降维处理,保存数据结构特征,在低维空间中对数据本质特征分析,能够更加直观容易地分析中有标签的复杂系统数据中的信息。
以下以具体实施例验证上述效果:
实验目标:挖掘有标签复杂系统数据专家知识;
实验数据:选取某航天器系统A、B、C、D四类温度数据作为实验对象;
实验设计:截取A、B、C、D四类数据24小时、12小时、6小时以及1小时数据,使用本发明提出的SGEC方法分别对各段数据降到二维,一维作横坐标,一维作纵坐标,在二维空间中可视化呈现各类数据点结构。使用功率谱分析算法APES(Amplitudeand Phase Estimation)对数据周期进行提取。综合数据结构可视化呈现结果以及数据功率谱结果对复杂系统大型监测数据特征进行总结。
四类监测数据各个时间段内数据结构可视化结果如图2至5所示,四类数据的功率谱分析结果如图6至9所示。
表1 四类数据周期
由上述实验结果可知,C、D两类数据空间结构邻近,即这两类监测温度幅值相近,且周期相似;C、D与A类数据周期相近,而数据空间结构远离,即所监测的温度幅值不同;而C、D与B类数据则在监测幅度以及周期都相差较多。从以上结果可知,利用SGEC算法对数据进行维数约减,从而可视化直观呈现其本质结构关系,同时,综合使用功率谱等其他数据分析方法可以对已经被专家知识标签的数据进一步分析和挖掘,探究专家分类的合理性,探究不同类别数据之间的关系等。

Claims (2)

1.基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法,其特征是:它由以下步骤实现:
步骤一、采集复杂系统数据X,所述复杂系统数据X为m类n维数据矩阵,即:n×m矩阵:{x1,x2,…,xm},xi,xj∈Rn,i,j=1,2,…m,xi,xj为n维列向量,Rn为n维实数集;
步骤二、根据步骤一中复杂系统数据X的标签信息以及相关性进行构图,获得步骤一中复杂系统数据X的映射图;
步骤三、根据步骤二获得的复杂系统数据X的映射图,通过公式:
W ij = Cov ( x i , x j ) / &sigma; i &sigma; j , x i , x j &Element; Class ( x i , x j ) 0 , x i , x j &NotElement; Class ( x i , x j )
获得该映射图的权值矩阵Wij
其中:为xi与xj的协方差,而σi、σj分别为xi、xj的标准差;
步骤四、根据公式:
D ii = &Sigma; j W ji
获得对角矩阵D;
步骤五、根据公式:L=D-W获得拉普拉斯矩阵L;
步骤六、根据公式:
XLXTa=λXDXTa
获得映射矩阵A的列向量a和特征值λ;a=a0,…al-1
列向量a0,…al-1根据特征值从小到大的顺序:λ0<…<λl-1进行排序,
并根据公式:
xi→yi=ATxi,A=(a0,a1,…,al-1)
获得映射矩阵A;
步骤七、根据映射矩阵A将复杂系统数据X从m维空间降为l维空间,降维后的数据为Y{y1,y2,…ym},yi∈Rl,i=1,2,…m(l<<n),其中,yi=ATxi,yi代表xi在低维空间的映射yi=ATxi
降维后的数据Y对复杂系统数据的可视化监测结果。
2.根据权利要求1所述的基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法,其特征在于步骤二中所述的根据步骤一中复杂系统数据X的标签信息以及相关性进行构图的方法为:
根据各数据的标签信息,当节点xi与节点xj满足条件:xi,xj∈Class(xi,xj)时则节点xi与节点xj被连接;
其中:xi,xj∈Class(xi,xj)表示xi与xj属于同一类,是否为同一类依照数据的标签信息确定。
CN201410325766.7A 2014-07-09 2014-07-09 基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法 Pending CN104063511A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410325766.7A CN104063511A (zh) 2014-07-09 2014-07-09 基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410325766.7A CN104063511A (zh) 2014-07-09 2014-07-09 基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法

Publications (1)

Publication Number Publication Date
CN104063511A true CN104063511A (zh) 2014-09-24

Family

ID=51551225

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410325766.7A Pending CN104063511A (zh) 2014-07-09 2014-07-09 基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法

Country Status (1)

Country Link
CN (1) CN104063511A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339354A (zh) * 2016-08-17 2017-01-18 盐城师范学院 基于改进pca的云计算网络中高维数据可视化方法
CN106446778A (zh) * 2016-08-27 2017-02-22 天津大学 基于加速度传感器的人体运动识别方法
CN108036941A (zh) * 2017-12-26 2018-05-15 浙江大学 一种基于相关性可视分析的汽轮机轴承振动异常分析方法
CN109194707A (zh) * 2018-07-24 2019-01-11 阿里巴巴集团控股有限公司 分布式图嵌入的方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515328A (zh) * 2008-12-18 2009-08-26 东华大学 一种面向鉴别的具有统计不相关性的局部保持投影方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101515328A (zh) * 2008-12-18 2009-08-26 东华大学 一种面向鉴别的具有统计不相关性的局部保持投影方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SHUICHENG YAN 等: ""Graph embedding: a general framework for dimensionality reduction"", 《 COMPUTER VISION AND PATTERN RECOGNITION, 2005. CVPR 2005. IEEE COMPUTER SOCIETY CONFERENCE ON》 *
XIAOFEI HE 等: ""Locality preserving projections"", 《PROCEEDINGS OF THE NIPS》 *
骆仁波 等: ""超光谱遥感图像有监督LPP特征提取研究"", 《遥感技术与应用》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339354A (zh) * 2016-08-17 2017-01-18 盐城师范学院 基于改进pca的云计算网络中高维数据可视化方法
CN106339354B (zh) * 2016-08-17 2018-11-20 盐城师范学院 基于改进pca的云计算网络中高维数据可视化方法
CN106446778A (zh) * 2016-08-27 2017-02-22 天津大学 基于加速度传感器的人体运动识别方法
CN108036941A (zh) * 2017-12-26 2018-05-15 浙江大学 一种基于相关性可视分析的汽轮机轴承振动异常分析方法
CN108036941B (zh) * 2017-12-26 2019-10-22 浙江大学 一种基于相关性可视分析的汽轮机轴承振动异常分析方法
CN109194707A (zh) * 2018-07-24 2019-01-11 阿里巴巴集团控股有限公司 分布式图嵌入的方法及装置
CN109194707B (zh) * 2018-07-24 2020-11-20 创新先进技术有限公司 分布式图嵌入的方法及装置

Similar Documents

Publication Publication Date Title
Biwer et al. PyCBC Inference: A Python-based parameter estimation toolkit for compact binary coalescence signals
Heyl Dynamical quantum phase transitions: A brief survey
Gao et al. Complex network analysis of time series
Chasapis et al. Energy conversion and collisionless plasma dissipation channels in the turbulent magnetosheath observed by the magnetospheric multiscale mission
Fortin et al. Applications of extreme value statistics in physics
Verdini et al. Anisotropy of third-order structure functions in MHD turbulence
Scarsoglio et al. Complex networks unveiling spatial patterns in turbulence
Zhao et al. A novel performance trend prediction approach using ENBLS with GWO
Zhdankin et al. Energy dissipation in magnetohydrodynamic turbulence: Coherent structures or “nanoflares”?
Constable et al. Stochastic dynamics on slow manifolds
CN104063511A (zh) 基于相关性度量的复杂系统监督图嵌入结构化数据可视化监测方法
Sukharev et al. Correlation study of time-varying multivariate climate data sets
Angelou et al. On the Statistical Properties of the Lower Main Sequence
Scodeller et al. Introducing Mexican needlets for CMB analysis: Issues for practical applications and comparison with standard needlets
Bruno et al. Radial evolution of the intermittency of density fluctuations in the fast solar wind
Murari et al. Symbolic regression via genetic programming for data driven derivation of confinement scaling laws without any assumption on their mathematical form
Boyden et al. An exploration of the statistical signatures of stellar feedback
Granero-Belinchon et al. Scaling of information in turbulence
Ma et al. An interactive framework for visualization of weather forecast ensembles
Sangole et al. Visualization of randomly ordered numeric data sets using spherical self-organizing feature maps
Verardi et al. The S-estimator of multivariate location and scatter in Stata
Calvão et al. The double pendulum: a numerical study
Iqbal et al. Detrended cross correlation analysis (DCCA) of radon, thoron, temperature and pressure time series data
Kang et al. Efficient generation of time series with diverse and controllable characteristics
Lawlor et al. Mapping the similarities of spectra: Global and locally-biased approaches to SDSS galaxies

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140924

WD01 Invention patent application deemed withdrawn after publication