CN108629371B - 一种对二维时频数据的数据降维方法 - Google Patents
一种对二维时频数据的数据降维方法 Download PDFInfo
- Publication number
- CN108629371B CN108629371B CN201810408401.9A CN201810408401A CN108629371B CN 108629371 B CN108629371 B CN 108629371B CN 201810408401 A CN201810408401 A CN 201810408401A CN 108629371 B CN108629371 B CN 108629371B
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- dimensional
- dimension reduction
- dimensional space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 64
- 238000013507 mapping Methods 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims abstract description 15
- 230000002146 bilateral effect Effects 0.000 claims abstract description 12
- 238000013144 data compression Methods 0.000 claims abstract description 3
- 239000013598 vector Substances 0.000 claims description 17
- 150000001875 compounds Chemical class 0.000 claims description 2
- 238000000513 principal component analysis Methods 0.000 abstract description 19
- 238000007906 compression Methods 0.000 abstract description 2
- 230000006835 compression Effects 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种对二维时频数据的数据降维方法,应用于二维数据的降维和压缩。该方法主要流程:首先,对样本数据中心化;然后将中心化的数据映射到高维空间,并在高维空间使用核函数构建映射数据的协方差;最后利用双边二维主成分分析算法对协方差进行降维,得到特征投影变换矩阵。该算法不仅充分利用了原始数据中的非线性特征,而且所得特征投影矩阵系数量较少,这样既提高了识别率、数据压缩率,又减少了计算量。
Description
技术领域
本发明涉及到二维数据的非线性特征的线性化,并提取线性化特征的主元,通过主元实现数据的降维与重构。主要应用于基于雷达时频分布、人脸特征等二维图像特征的目标识别与分类。
背景技术
主成分分析(Principal Component Analysis,PCA)把含有冗余信息的高维数据转化为少数低维数据即主成分,其中每个主成分包含原始数据几乎全部有效信息。这样将错综复杂的数据分析问题转化为只需研究少数主成分的问题,不仅能够更深入地分析问题,而且分析过程也变得很容易。其基本思想是在最小均方误差约束下寻找一个最能够代表原始数据主要特征的投影变换矩阵,在新的投影空间中不仅能降低原始数据的维数的而且还能保持其绝大部分信息。整个变换过程坚持两个原则:(1)最近重构性:使用降维后的数据,重新构建原始数据时误差之和最小;(2)最大可分性:数据在低维投影空间中尽量分开。事实上,可以证明这两原则是等价的。
PCA在处理二维时频数据时,需要将其转换为列向量,这样不仅破坏了时频数据的完整性,而且也会面临所求解高维列向量协方差矩阵不稳定、特征向量不精确等弊端。而二维主成分分析(Two-dimensional Principal Component Analysis,2DPCA)直接对二维数据进行降维识别,这样虽然很好地避免了将二维时频数据转换为一维向量所带来的诸多缺点。但是2DPCA对数据进行的是单边投影,仅考虑了右乘投影变换矩阵的情况,这样实际上仅仅利用了二维时频数据的行向量信息,而丢失了列向量信息。这样得到的投影变换矩阵维度(或系数量)比PCA的得到投影变换矩阵维度(或系数量)大很多。在基于该变换投影矩阵进行特征提取和分类时,计算量将会很大,耗时很长。双边二维主成分分析(BilateralTwo-dimensional Principal Component Analysis,B2DPCA)是H.Kong等人在2005年针对2DPCA在识别中存在的诸多缺点而提出的。该算法中的一些概念仍与PCA和2DPCA中的概念相同,而且变换过程中仍坚持最近重构性和最大可分性这两个原则。最大不同之处主要是构造了左投影矩阵和右投影矩阵,充分利用二维数据样本的行和列信息,并把样本投影到两个不同的空间,可以有效地消除数据行与列的冗余信息,降低了投影变换矩阵维度(或系数量),更重要的是该方法充分地考虑了数据的行与列相关信息,也使得分类变得简单易行。但是,该方法还存在不能利用数据中蕴含的非线性特征,因此利用该方法获得的主元进行目标识别分类时,并未充分利用原始数据中含有的特征,若将数据中非线性特征线性化可以进一步提高识别率。而核主成分分析(Kernel Principal Component Analysis,KPCA)通过非线性函数将数据非线性映射到高维空间,使得低维非线性特征线性化,对高维空间线性化特征进行降维时充分利用了原始空间中的非线性特征。但是KPCA处理二维数据时,仍会遇到PCA处理二维数据时存在的问题。在对二维数据降维时,为了即保证不破坏二维数据的完整性,又充分利用到原始数据中蕴含的利于分类的非线性特征,本发明提出了核双边二维主成分分析(Kernel Two-dimensional Principal Component Analysis,KB2DPCA)算法,该算法即实现了对数据进行双边降维,降低投影矩阵系数量,又通过核函数将数据中非线性特征线性化,充分利用线性化后的特征进行分类,进一步提高了识别率。
发明内容
本发明针对双边二维主成分分析算法对二维数据降维时,不能利用数据中蕴含的非线性特征,识别率不能达到理想的情况。而核主成分分析对二维数据进行降维时虽然利用了原始数据中蕴含的非线性特征,但是要求将二维数据转化为列向量,会产生破坏数据完整性、高维向量协方差不精确等新问题。
本发明技术方案为:一种对二维时频数据的数据降维方法,该方法包括以下步骤:
步骤1:中心化二维时频数据观测样本矩阵Ai∈Rm×Rn,其中i=1,2,…,M,M是二维时频样本矩阵的个数:
步骤4:通过核函数κ,计算步骤2中观测样本列向量在高维空间映射的内积:
式中,由核函数构建的矩阵称之为核矩阵Ki:
步骤6:对步骤5中的核矩阵Ki进行双边降维,得到其变换投影矩阵Bi;
首先,根据最小重构误差求出最优左投影矩阵Uopt∈Rm×l及最优右投影矩阵Vopt∈Rn×r:
然后,再由最优投影矩阵求出Ki的变换投影矩阵Bi
得到Ai∈Rm×Rn降维结果Bi∈Rl×r,实现了数据的压缩。
步骤4中通过核函数κ,计算出步骤2中观测样本列向量在高维空间映射的内积;这样不仅避开了确定映射函数φ具体形式的难题,而且避免了在高维空间直接求映射函数内积的难题;
步骤6中根据双边二维主成分分析算法,对步骤5中的核矩阵Ki进行双边降维,得到其变换投影矩阵Bi。Bi不仅包含了Ki的几乎全部有效信息,而且维数明显小于后者,因此使用本方法获得的变换投影矩阵Bi,比KPCA、B2DPCA获得的投影变换矩阵作为分类特征,不仅包含了更利于识别分类的信息,而且计算量更小,极大地降低了分类时长。
附图说明
图1本发明实施步骤流程图。
具体实施方式
以下使用本发明算法对雷达高分辨距离像的小波变换二维时频表示数据进行降维,获得其投影变换矩阵。以该实施例来详细说明本发明的实施方式,以便对如何应用本发明技术手段来解决技术问题有更加深刻的理解,以期达到良好地解决实际问题目的,并据以实施。本发明核双边二维主成分分析算法,本发明实施步骤流程如图1所示,各步骤具体按照以下方式实施:
步骤1:中心化每一幅距离像时频表示样本Ai∈Rm×Rn(i=1,2,…,M,M是时频样本矩阵的个数):
本发明用到的高分辨距离像(HRRP)数据是由国内某研究所使用高分辨宽带雷达外场实测数据,包括“雅克-42”中型喷气飞机、“奖状”小型喷气机、“安-26”小型螺旋桨飞机等共三种目标的HRRP数据。每个目标的HRRP数据是一个780行256列的矩阵。其中,行数780代表有780幅距离像,列数256代表每幅距离像有256个距离单元。每一幅距离像的小波变换时频表示数据结构为Ai∈R256×R256。
步骤6:根据双边二维主成分分析算法,对步骤5中的核矩阵Ki进行双边降维,得到其变换投影矩阵Bi。先由式(0-7)求得最优投影矩阵,根据实测实验结果,本数据对应的左右投影矩阵所取主元数分别为5和8,即Uopt∈R2565×,Vopt∈R256×8。得到的变换投影矩阵Bi∈R5×8。Bi不仅含有Ki中包含的几乎全部有效信息,而且与由单边二维主成分分析获得的变换投影矩阵R256×8相比系数量由2048降为40,降低了大约50倍。与双边二维主成分分析算法相比,虽然系数量相同,但是本发明提出的算法从分利用了原始数据蕴含的非线性特征,因此识别率会更好。
由于直接将时频表示数据Ai∈R256×R256转化为列向量则所得列向量的维数高达65536维,这样该列向量的协方差及特征向量的精度很难得到保障,为了避开该问题,根据图像处理有关知识,在保证转化后的结果尽可能多地保持原始数据包含的有效识别特征时,使用均值为零的正态随机分布矩阵,将时频分析数据转换为504维列向量,再根据实验对比结果可知投影矩阵的主元取20时识别率较高,这样KPCA算得到的变换投影矩阵Bi∈R1 ×20。虽然该矩阵系数量比本发明提出的算法所得的特征投影矩阵系数量少20,但是前者得到的特征矩阵所含有效信息少于后者所得特征矩阵包含的有效信息。
由训练时频表示样本求得的左右最优投影矩阵,计算出测试样本的投影变换矩阵Bi′,再通过对比测试样本与观测样本的欧氏距离,使用最近邻分类器对测试样本分类。表1给出了基于KPCA、2DPCA、B2DPCA、KB2DPCA的识别率。数据为高分辨距离像的小波变换时频表示。表的第一行训测比是指观测样本数目与测试样本数目的比例。由表1可知本发明提出的KB2DPCA算法取得了最高的识别率。
表1
Claims (1)
1.一种对雷达高分辨距离像的小波变换二维时频数据的数据降维方法,该方法包括以下步骤:
步骤1:中心化二维时频数据观测样本矩阵Ai∈Rm×Rn,其中i=1,2,…,M,M是二维时频样本矩阵的个数:
步骤4:通过核函数κ,计算步骤2中观测样本列向量在高维空间映射的内积:
式中,由核函数构建的矩阵称之为核矩阵Ki:
步骤6:对步骤5中的核矩阵Ki进行双边降维,得到其变换投影矩阵Bi;
首先,根据最小重构误差求出最优左投影矩阵Uopt∈Rm×l及最优右投影矩阵Vopt∈Rn×r:
然后,再由最优投影矩阵求出Ki的变换投影矩阵Bi
至此,也就得到了Ai∈Rm×Rn降维结果Bi∈Rl×r,实现了数据的压缩。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810408401.9A CN108629371B (zh) | 2018-05-02 | 2018-05-02 | 一种对二维时频数据的数据降维方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810408401.9A CN108629371B (zh) | 2018-05-02 | 2018-05-02 | 一种对二维时频数据的数据降维方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108629371A CN108629371A (zh) | 2018-10-09 |
CN108629371B true CN108629371B (zh) | 2020-06-16 |
Family
ID=63695179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810408401.9A Expired - Fee Related CN108629371B (zh) | 2018-05-02 | 2018-05-02 | 一种对二维时频数据的数据降维方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108629371B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241587B (zh) * | 2020-01-21 | 2023-09-29 | 恒瑞通(福建)信息技术有限公司 | 一种数据脱敏的方法及装置 |
CN113255775B (zh) * | 2021-05-28 | 2021-09-24 | 神威超算(北京)科技有限公司 | 一种电力系统异常数据的识别方法、装置和智能芯片 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009134466A (ja) * | 2007-11-29 | 2009-06-18 | Ntt Data Corp | 認識処理装置、方法及びコンピュータプログラム |
CN103020640A (zh) * | 2012-11-28 | 2013-04-03 | 金陵科技学院 | 基于二维主成分分析法的人脸图像降维分类方法 |
CN103617618A (zh) * | 2013-12-03 | 2014-03-05 | 西安电子科技大学 | 基于特征提取与聚类集成的sar图像分割方法 |
CN104077610A (zh) * | 2014-07-10 | 2014-10-01 | 电子科技大学 | 二维非线性投影特征的sar图像目标识别的方法 |
CN105930846A (zh) * | 2016-04-05 | 2016-09-07 | 西安电子科技大学 | 基于邻域信息和svgdl的极化sar图像分类方法 |
-
2018
- 2018-05-02 CN CN201810408401.9A patent/CN108629371B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009134466A (ja) * | 2007-11-29 | 2009-06-18 | Ntt Data Corp | 認識処理装置、方法及びコンピュータプログラム |
CN103020640A (zh) * | 2012-11-28 | 2013-04-03 | 金陵科技学院 | 基于二维主成分分析法的人脸图像降维分类方法 |
CN103617618A (zh) * | 2013-12-03 | 2014-03-05 | 西安电子科技大学 | 基于特征提取与聚类集成的sar图像分割方法 |
CN104077610A (zh) * | 2014-07-10 | 2014-10-01 | 电子科技大学 | 二维非线性投影特征的sar图像目标识别的方法 |
CN105930846A (zh) * | 2016-04-05 | 2016-09-07 | 西安电子科技大学 | 基于邻域信息和svgdl的极化sar图像分类方法 |
Non-Patent Citations (2)
Title |
---|
Radar Target Recognition Using Kernel Uncorrelated Discriminant Local Tangent Space Alignment;Yu, XL等;《2017 IEEE RADAR CONFERENCE (RADARCONF)》;20170518;全文 * |
基于高分辨距离像的雷达目标识别算法研究;曲学超 等;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180915;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108629371A (zh) | 2018-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104008538B (zh) | 基于单张图像超分辨率方法 | |
CN107238822B (zh) | 真假目标一维距离像正交非线性子空间特征提取方法 | |
US20150074130A1 (en) | Method and system for reducing data dimensionality | |
Qi et al. | Using the kernel trick in compressive sensing: Accurate signal recovery from fewer measurements | |
CN108629371B (zh) | 一种对二维时频数据的数据降维方法 | |
CN110598636B (zh) | 一种基于特征迁移的舰船目标识别方法 | |
CN110990775B (zh) | 基于多流形对偶图正则化非负矩阵分解的多视图聚类方法 | |
CN109190511B (zh) | 基于局部与结构约束低秩表示的高光谱分类方法 | |
CN112798654B (zh) | 用于电阻抗层析成像的快速梯度法和自适应雅可比矩阵重构方法 | |
CN110807828A (zh) | 一种倾斜摄影三维重建匹配方法 | |
US10007856B2 (en) | Processing hyperspectral or multispectral image data | |
CN108564607A (zh) | 三维脑图谱数据集空间校准方法及系统 | |
CN110687514B (zh) | 一种非线性判别学习真假目标一维距离像特征提取方法 | |
CN107273919B (zh) | 一种基于置信度构造类属字典的高光谱无监督分类方法 | |
CN110826554B (zh) | 一种红外目标检测方法 | |
CN114254703A (zh) | 一种鲁棒的局部与全局正则化的非负矩阵分解聚类方法 | |
CN112784747B (zh) | 高光谱遥感图像多尺度本征分解方法 | |
CN107609565B (zh) | 一种基于图像全局特征主成分线性回归的室内视觉定位方法 | |
CN110111374B (zh) | 基于分组阶梯式阈值判断的激光点云匹配方法 | |
CN110717485B (zh) | 一种基于局部保留投影的高光谱图像稀疏表示分类方法 | |
CN110766708B (zh) | 基于轮廓相似度的图像比较方法 | |
CN109214269B (zh) | 一种基于流形对齐和多图嵌入的人脸姿态对齐方法 | |
CN111062888A (zh) | 一种基于多目标低秩稀疏及空谱全变分的高光谱影像去噪方法 | |
CN111242082B (zh) | 基于分数阶正交偏最小二乘的人脸超分辨率重建识别方法 | |
Theiler et al. | Design issues for hardware implementation of an algorithm for segmenting hyperspectral imagery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200616 |