CN106022391A - 一种高光谱图像特征的并行提取与分类方法 - Google Patents
一种高光谱图像特征的并行提取与分类方法 Download PDFInfo
- Publication number
- CN106022391A CN106022391A CN201610380345.3A CN201610380345A CN106022391A CN 106022391 A CN106022391 A CN 106022391A CN 201610380345 A CN201610380345 A CN 201610380345A CN 106022391 A CN106022391 A CN 106022391A
- Authority
- CN
- China
- Prior art keywords
- dimensional
- gabor
- frequency
- lambda
- wave band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000000605 extraction Methods 0.000 title claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 24
- 230000008859 change Effects 0.000 claims description 17
- 238000000354 decomposition reaction Methods 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000013461 design Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000011160 research Methods 0.000 description 20
- 230000003595 spectral effect Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 10
- 238000000701 chemical imaging Methods 0.000 description 7
- 239000013256 coordination polymer Substances 0.000 description 5
- 238000007500 overflow downdraw method Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- XUMBMVFBXHLACL-UHFFFAOYSA-N Melanin Chemical compound O=C1C(=O)C(C2=CNC3=C(C(C(=O)C4=C32)=O)C)=C2C4=CNC2=C1C XUMBMVFBXHLACL-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012880 independent component analysis Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 150000001746 carotenes Chemical class 0.000 description 1
- 235000005473 carotenes Nutrition 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/58—Extraction of image or video features relating to hyperspectral data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种高光谱图像特征的并行提取与分类方法,通过三维空间域以及频域联合分析,对三维和高光谱图像进行并行特征提取,然后对这些特征进行增强和融合,可以充分利用高维数据的丰富信息以及这些特征之间的结构关系,大大减少噪声对准确率的影响。本发明对各种相位、方向、频域以及三维空间编码方法进行深入研究,然后从提取各Gabor特征在方向与频率空间结构关系出发,在联合提取空间‑光谱域和频域的信号变化特征同时,开拓性地将智能算法引入波段选择,从而可以在保证识别准确率的前提下减少冗余信息,提高识别效率,具有较广泛的应用和推广前景。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种高光谱图像特征的并行提取与分类方法。
背景技术
高光谱成像技术是近二十年来发展起来的基于非常多窄波段的影像数据技术,其最突出的应用是遥感探测领域,并在越来越多的民用领域有着广泛的应用前景。高光谱成像主要通过不同波长的光源对物体进行拍照,获取物体在不同波段下的照片,从而提取更丰富的有用信息。彩色成像通过红、蓝、绿三个通道获得多光谱图像,而高光谱技术通常将可见光、近红外分割成上百个波段活动高达数百张的高光谱图像。高光谱遥感的光谱分辨率一般达到纳米级,光谱波段数为几十到数百,提供了窄波段连续光谱信息,对物体的测谱能力非常强。
随着高光谱技术在遥感领域的成功应用,现在该技术也开始在食品安全,医学诊断、人脸、掌纹识别以及材料探测等领域广泛运用。食品安全和材料检测主要通过高光谱图像分析食品、物体的光谱,来判断是否有异常物质的加入,从而确定食品是否安全以及材料的种类。医学诊断可以通过高光谱图像获得人体组织的光谱,从而判断该组织是否存在病变。鉴于不同人的皮肤所含的胡萝卜素、黑色素和血色素各不相同,在不同光谱下会呈现出不同的反射特性,研究人员也已经开始通过高光谱图像提取特征对人脸和掌纹进行识别。
目前高光谱图像识别分类的研究还处于起步阶段,研究工作主要集中为遥感图像的地物分类领域。如何从这些海量遥感数据中抽取代表性特征,从而实现准确的地物分类,是目前高光谱遥感影像研究的热点。但在高光谱人脸、掌纹等其他领域,相关研究工作还比较少。目前开展高光谱图像识别分类的研究,可以大大促进该技术在诸如高光谱人脸、高光谱掌纹以及医学诊断领域的推广,从而提升基于高光谱信息的物体识别分类技术进步。
在高光谱遥感影像中,像元的光谱是最简单、可用于表征地物类别的特征。但是由于光谱数据中噪声比较多,基于光谱数据的分类效果往往比较差。为抑制光谱数据中的噪声,主成分分析(Principal Component Analysis,PCA),线性判别分析(Linear Discriminant Analysis,LDA)以及独立成分分析(Independent Component Analysis,ICA)等子空间方法都被用来对数据进行分类前的预处理。除了光谱,研究者们也开始提取诸如纹理、形状之类的空间域特征,从而提高不同地物之间的可区分性。实验表明,纹理和形状等空间域特征可有效地和光谱形成互补,从而大大增加地物分类准确率。鉴于Gabor小波在二维图像特征提取领域的成功,不少学者在二维切片/帧上提取二维Gabor特征,用于三维图像的分析与识别。由于只是提取了二维空间域信息,该方法显然没有充分利用三维数据所包含的所有信息。除了在空间域和光谱域分别提取特征,一种更直接有效的方法是提取空间-光谱域三维空间的联合变化特征。非专利文献1(S.Jia,L.Shen,and Q.Li,"Gabor feature-based collaborative representation for hyperspectral imageryclassification,"IEEE Transactions on Geoscience and Remote Sensing,vol.53,pp.1118-1129,2015)通过三维Gabor小波直接在三维空间提取信号变化信息,率先将三维Gabor特征应用于高光谱遥感图像分类。该方法将三维数据和三维Gabor小波卷积后的幅值结果向量化,然后拼接成为一个长特征向量。实验表明,直接从三维数据提取的三维Gabor特征可以包含更丰富信息,从而获得比二维Gabor特征高得多的准确率。Jia和Shen等人将向量连接形式构造的三维Gabor特征分别和基于L1以及L2优化准则的稀释表示框架进行了结合,用于高光谱遥感图像分类。实验结果表明,和采用光谱特征时不同,在采用区分度高的三维Gabor特征时,依据L2优化准则的协同表示方法能够在大大提高分类效率的同时,取得和采用L1稀疏表示方法相似的准确率。从上述文献可以看出,目前以三维Gabor小波为代表的空间-光谱域联合变化特征提取方法已经在高光谱遥感图像分类中开始广泛应用,各种实验对比表明,该特征可以取得比光谱和二维纹理好得多的准确性能。
相对于可见光人脸识别,高光谱人脸识别研究的起步较晚、研究成果也较少。美国Rochester技术学院的Munsell色彩科学实验室在1999年率先对高光谱人脸数据库的采集进行了尝试。随后,卡内基梅隆大学在2002年采集了18人的数据库用于人脸非对称性的研究。加州大学埃尔文分校计算机视觉实验室2003年在700到1000纳米的近红外波段采集了200个人的高光谱人脸数据,通过前额、左右脸颊和嘴唇等采样区域的平均光谱特性进行识别,实验结果表明高光谱成像在姿态和表情变化下仍能取得令人满意的识别效果。该实验室的研究团队2007年进一步对室外光照情况进行了研究,在原型集(Gallery)和测试集(Probe)的光照存在巨大变化的情况下,高光谱方法同样取得了较高的准确率。该方法只采用了人脸在谱域的信号变化特性,没有充分利用空域信息。
基于高光谱图像的掌纹识别也开始起步。Guo等人在非专利文献2(Z.Guo,D.Zhang,L.Zhang,and w.Liu,"Feature band selection for onlinemultispectral palmprint recognition,"IEEE Transactions on InformationForensics and Security,vol.7,pp.1094-1099,2012.)中率先开展相关数据库的采集和研究。该方法主要通过提取选择波段上的二维特征来进行识别。调研表明,相对于数目众多的可见光人脸、掌纹识别研究团队和成果,目前高光谱人脸/掌纹识别方面的研究还处于起步阶段,需要大量理论和应用上的尝试。通过三维Gabor小波提取空间-光谱域联合变化特征,是未来的一个发展方向。
从高光谱图像中提取的三维空间-光谱域Gabor特征维度巨大。例如,对于大小为100×100×100的三维数据,52个小波抽取的特征维度可高达52,000,000。如此高维特征会给后续分类带来巨大的计算量。例如在稀疏表示框架下,原始三维Gabor特征由于维度太大而无法让现有的求解算法获得稀疏解,必须要通过主成分分析来降维。相对二维Gabor特征,采用向量化拼接方式获得的三维Gabor特征在维度上增加了数百倍。目前对这些特征向量进行选择是主要的有效手段,还未能见到有更有效的相关融合方法研究。一个可行的研究方向是将每个三维Gabor小波提取的特征分别进行处理,从而大大降低每个任务所要处理的特征维度和计算复杂度,后续可以通过多任务联合稀疏表示框架或者多视角张量结构把每个任务的结果/特征融合起来。
相对二维可见光图像的广泛应用,高光谱图像无论在基础理论、还是应用领域的研究都还处于起步阶段。目前高光谱图像的特征提取正在从光谱、二维纹理特征的融合向空间-光谱域联合变化特征的直接提取过度。在这个过程中,采用三维Gabor小波提取的三维Gabor特征在高光谱遥感图像分类、高光谱人脸/掌纹识别应用中表现出了优异的准确性能,正在日益受到相关学者的关注。虽然目前的三维Gabor特征性能好,但是也存在着特征维度大、冗余性强等缺点。不同Gabor特征的融合目前主要采取向量化和向量拼接方式,急需对能够保持方向域、频域以及三维空间结构关系的融合方法进行研究。该发明对高维Gabor特征选择、不同小波提取的Gabor特征融合方法进行深入研究,不仅可以大大丰富和完善空间-光谱域联合变化特征提取理论,还可以有力推动该工具和日臻完善的高光谱成像技术的结合,从而促进基于高光谱数据的生物特征识别、医学诊断和遥感监测领域的技术进步。
发明内容
为解决现有技术中存在的问题,本发明提出了一种高光谱图像特征的并行提取与分类方法,大大减少噪声对准确率的影响,在保证识别准确率的前提下减少冗余信息,提高识别效率,具有较广泛的应用和推广前景。
本发明具体通过如下技术方案实现:
一种高光谱图像特征的并行提取与分类方法,包括以下步骤:
A.获取高光图图像;
B.对所述高光图图像进行基于三维Gabor小波的空间-光谱域联合变化的并行特征提取;具体为:
给定三维高光谱数据V(x,y,λ),三维小波分析通过三维Gabor小波函数Ψf,θ,φ(x,y,λ)和V(x,y,λ)的内积来同时获得信号的空域和频域信息,其中,参数f为小波的中心频率,φ为该频率在三维频域与w轴的夹角,θ为该频率在三维频域的u-v平面内投影与u轴的夹角;在采用Gabor小波抽取特征时,需要预先设计多个不同中心频率fi以及方向的小波然后将其和V(x,y,λ)进行卷积操作,卷积结果代表了在三维空间(x,y,λ)、频率为fi、方向为的信号变化信息;给定N个三维Gabor小波Ψn(n=1,2,…N),通过卷积获得N个同样大小的三维数据从三维空间、频域以及方向域三个角度对所述N个三维Gabor特征进行空间编码以及频率、方向编码后,V(x,y,λ)获得K个编码后的特征图像g1(x,y,λ),…gk(x,y,λ)…gK(x,y,λ)
C.结合波段选择对所述步骤B提取的三维Gabor特征进行筛选,通过所述波段选择去除高光谱数据中冗余信息;
D.构造并学习基于多视角的高阶Gabor张量,实现三维Gabor特征融合;
E.构造核函数实现基于支持向量机的图像分类。
进一步地,所述空间编码的主要思想是将中心像素的响应与相邻像素的响应进行差异性比较,然后对大小关系进行0/1编码,最后再转换成整数,通过区域直方图统计对Gabor特征进行增强。
进一步地,所述频率、方向编码的核心思想是将中心像素的Gabor响应和相邻频率、方向的响应进行差异性比较,然后对大小关系进行0/1编码,最后再转换成整数,通过区域直方图统计对Gabor特征进行增强。
进一步地,所述步骤C具体包括:
Step1:设计L个不同中心频率和方向的三维Gabor小波{Ψl,l=1,..,L},将其和B个波段的多光谱数据V(x,y,λ)卷积,获得B×L个卷积图像:{M1(x,y,λ1),…ML(x,y,λ1)…M1(x,y,λb)…ML(x,y,λb)…M1(x,y,λB)…ML(x,y,λB)};
Step2:依次提取每个波段λb的L个卷积图像{M1(x,y,λb)…ML(x,y,λb)},提取维度较低的特征,设计评价函数进行排序,找出最优波段;将该最优波段从候选集合移出,加入到已选集合;
Step3:从候选集合选取一个波段加入到已选集合,使得已选集合的评价函数值得到最大的增加;
Step4:重复上述过程Step1-3,直到增加量小于设定阈值或者迭代次数达到预先设定值。
进一步地,所述步骤D具体为:波段选择后提取的三维Gabor特征图像表示为K个三阶张量X={χ1,χ2…χK},其中利用稀疏非负多视角张量分解算法,同时学习K个三阶张量的共同因子和各个视角上的潜在因子:一个三阶张量χk的CP分解优化模型写为
为简便起见,用U(1)U(2)U(3)表示其中为U(i)的第j个列向量,U(i)通常称为第i模态的因子矩阵,拟优化的目标函数如下:
其中,为第i个视角下第j个模态上的因子矩阵,表示第一模态上的因子矩阵,U*为共同因子矩阵(这里也可以根据实际情况考虑其他模态);|| ||2,1为范数,用于特征的稀疏化学习;所述目标函数首先根据范数的分析方法,将其转换为矩阵迹的表达形式,进而利用交替最小二乘和半二次法结合进行优化求解得到因子矩阵U*和即为多视角张量分解提取的潜在因子矩阵。
附图说明
图1是三维频域的示意图;
图2是Gabor小波频域示意图;
图3是尺度、方向编码示意图;
图4是多视角张量分解示意图。
具体实施方式
下面结合附图说明及具体实施方式对本发明进一步说明。
本发明主要研究如何从高光谱影像中提取空间-光谱域联合变化特征,并通过智能优化算法对这些特征进行筛选与融合,去除冗余特征,最终实现准确和高效的识别分类效果。本发明重点关注基于三维Gabor小波的空间-光谱域联合变化特征提取,具体如下:
(1)基于三维Gabor小波的空间-光谱域联合变化的并行特征提取
本发明在深入研究三维空间域和频域同时提取信号变化特性机理的同时,对这些编码方法进行优化,重点关注能够提取Gabor小波在方向、频率以及三维空间结构关系的编码方法。
目前三维Gabor特征主要以提取高光谱数据和Gabor小波的卷积响应幅值为主,将三维空间各个点的小波响应直接连接成一个向量,用于后续的分类识别。直接向量化和简单连接将各个特征独立对待,往往丢失了各个特征在方向、频率以及三维空间的结构关系,从而降低特征的识别精度。为此,一个更好的办法是对各个Gabor特征在方向、频率以及三维空间的结构关系进行编码,从而获得更具分辨能力的编码特征。
三维空间编码的主要思想是将中心像素的响应与诸如3×3×3邻域内的相邻像素的响应进行差异性比较,然后对大小关系进行0/1编码,频率、方向编码的核心思想是将中心像素的Gabor响应和相邻频率(尺度)、方向的响应进行差异性比较,然后对大小关系进行0/1编码。本发明将对不同空间领域,以及频率、方向的空间排列关系进行探索,最后找到最佳编码增强方式。
(2)结合波段选择的三维Gabor特征筛选
在总结高光谱人脸数据的特点的基础上,深入研究在空域和谱域同时提取信号变化特性的方法,从理论上分析比较这些方法的优缺点并对其进行优化,重点关注三维Gabor小波在该问题上的应用。
探索通过波段选择去除高光谱数据中冗余信息的方法,量化比较各种选择方案的优劣,尝试引入生物启发算法对选择方案进行优化,减少其对特征提取的负面影响;比较空域、谱域联合分析和波段选择的不同结合方案,使得在重要波段上提取的特征能够获得最佳的识别性能。
(3)基于多视角张量的三维Gabor特征融合
在获得各个小波的增强编码特征之后,需要对这些特征的融合方法进行深入研究。现有的融合方法是将各个Gabor编码特征转换成为一维向量,然后连接成为一个长特征向量。对于大小为100×100×100的三维数据,52个小波抽取的特征维度可高达52,000,000。如此高维特征会给后续分类带来巨大的计算量。除了采用特征选择方法减少特征维度,通过张量表示可以在融合这些特征的同时,保持不同Gabor特征结构关系。
本发明将首先研究目前最新的张量理论与方法,比较包括CP分解在内的不同张量分解方法,重点关注多视角张量数据构造以及基于张量CP分解和因子分解的张量模型,结合Gabor特征特性设计Gabor张量表示,发掘这些多视角张量之间的结构关系,构造基于核函数的相似性度量以及相应支持向量机分类算法。
探索基于张量的三维Gabor特征表示方法,将多个Gabor响应或编码结果表示成三阶张量,根据Gabor张量的多视角特性设计相应张量分解算法,同时学习这些三阶张量的共同因子和各个视角上的潜在因子,获得各Gabor特征之间的结构关系,最后为每一个Gabor视角上提取的因子矩阵设计相应的结构保距核函数,通过支持张量机实现分类。
本发明需要解决的关键问题及方案
(1)基于方向、频率和三维空间的Gabor特征编码问题
在将三维数据和不同的三维Gabor小波卷积获得不同响应之后,如何在方向、频率和三维空间内对这些响应进行编码,提取这些响应之间的联系,从而增强三维Gabor特征对噪声的鲁棒性,是本发明所要解决的第一个关键问题。
给定高光谱数据V(x,y,λ),三维小波分析通过小波函数和V(x,y,λ)的内积来同时获得信号的空域和频域信息。
假定中心为(xc,yc,λc)的对称小波函数在三维空间和频域的覆盖范围分别为xc±Δx、yc±Δy、λc±Δλ以及fc±Δf,三维小波分析则可以提取信号在[xc-Δx,xc+Δx]×[yc-Δy,yc+Δy]×[λc-Δλ,λc+Δλ]×[fc-Δf,fc+Δf]范围内的变化信息。在众多小波函数中,三维Gabor小波可以使Δx、Δy、Δλ以及Δf的乘积达到最小,即达到分析信号的最佳分辨率。三维Gabor函数主要由三维高斯函数和实虚部分别为正余弦的复函数乘积组成,具体定义如下:
公式中S为归一化常量;(xc,yc,λc)为Gabor小波的中心位置,类似于神经元感受野中心;σx、σy以及σλ决定小波在x、y和λ方向的高斯包络大小;参数f为小波的中心频率,φ为该频率在三维频域与w轴的夹角,θ为该频率在三维频域的u-v平面内投影与u轴的夹角(参见附图1);R为将高斯包络主轴和中心频率振荡方向调整为一致的旋转矩阵。
在采用Gabor小波抽取特征时,需要预先设计多个不同中心频率fi以及方向的小波然后将其和三维图像数据V(x,y,λ)进行卷积操作。卷积结果代表了在三维空间(x,y,λ)、频率为fi、方向为的信号变化信息。附图2显示了多个三维Gabor小波在频域的示意图,这些小波覆盖了频域中多个不同频率和方向。
给定N个三维Gabor小波Ψn(n=1,2,…N),可以通过卷积获得N个同样大小的三维数据本发明从三维空间、频域以及方向域三个角度对这N个三维Gabor特征进行编码,以获得更具辨识力和抗干扰性能的特征。空间编码的主要思想是将中心像素的响应与相邻像素的响应进行差异性比较,然后对大小关系进行0/1编码,最后再转换成整数,通过区域直方图统计对Gabor特征进行增强。在三维空间,中心像素的3×3×3邻域中有6邻域,18邻域和26邻域三种。本发明将为这三种邻域关系分别设计相应的0/1编码方式,并测试用不同方法增强后Gabor特征的鲁棒性,从而确定最佳邻域和编码方式。
频率、方向编码的核心思想是将中心像素的Gabor响应和相邻频率(尺度)、方向的响应进行差异性比较,然后对大小关系进行0/1编码,最后再转换成整数,通过区域直方图统计对Gabor特征进行增强。本发明将相邻尺度、方向的Gabor响应排列成如附图3所示的虚拟空间位置,然后通过该空间的邻域编码来实现特征增强。
在对每个三维Gabor特征进行空间编码以及多个Gabor特征进行频率、方向编码后,一幅三维图像V(x,y,λ)可以获得K个编码后的特征图像g1(x,y,λ),…gk(x,y,λ)…gK(x,y,λ)。
(2)特征提取和波段选择的结合问题
如何在不影响特征提取效果的前提下,去除冗余信息,从而减少后续处理的数据量;如何使选择的波段更有利于特征提取,从而获得最佳识别性能。
对于图像大小为64×64、波段数为30的多光谱图像,52个小波卷积后的数据量高达64×64×30×52=6,389,760。对这些数据进行分类处理需要大量的计算时间,因此很有必要去除那些信噪比低、鉴别性差的波段数据,从而减少冗余信息以及后续处理复杂度。本发明通过波段和特征选择相接合的方法进行,主要步骤如下:
Step1:设计L个不同中心频率和方向的三维Gabor小波{Ψl,l=1,..,L},将其和B个波段的多光谱数据V(x,y,λ)卷积,获得B×L个卷积图像:{M1(x,y,λ1),…ML(x,y,λ1)…M1(x,y,λb)…ML(x,y,λb)…M1(x,y,λB)…ML(x,y,λB)};
Step2:依次提取每个波段λb的L个卷积图像{M1(x,y,λb)…ML(x,y,λb)},通过下采样等手段提取维度较低的特征,设计评价函数进行排序,找出最优波段。将该波段从候选集合移出,加入到已选集合;
Step3:从候选集合选取一个波段加入到已选集合,使得已选集合的评价函数值得到最大的增加;
Step4:重复上述过程Step1-3,直到增加量小于设定阈值或者迭代次数达到预先设定值。
对波段评价函数的直接选择是识别准确率,但是每次迭代对每个个体进行准确率测试会耗费大量计算时间,比较折中的选择是采用诸如Fisher准则之类的可分性指标。类间距和类内距的比值越大,特征越好。本发明将对各种评价函数进行测试,最终找到合理的方案,考虑计算复杂度,实现高效、准确的多光谱目标识别方法。
(3)多视角Gabor张量的构造与学习问题
在获取经过选择的三维Gabor特征之后,这些特征包含了高光谱图像不同方向、频率的信号变化信息,如何将这些多视角特征通过张量表示,在后续张量分解以及分类过程中提取这些Gabor特征在方向、频率和三维空间内的结构关系,以及如何构造核函数实现基于支持向量机的分类,是另一个关键问题。
波段选择后提取的三维Gabor特征图像可表示为K个三阶张量X={χ1,χ2…χK},其中传统的张量学习方法往往将其整合为一个更大的四阶张量进行张量分解学习共同的潜在因子,或者针对多个三阶张量进行独立的张量分解学习各个视角上的潜在因子,然后进行后续的识别过程。本发明针对该Gabor张量的多视角特性以及编码数据本身的非负性和冗余性,设计稀疏非负多视角张量分解算法,同时学习K个三阶张量的共同因子和各个视角上的潜在因子(如附图4所示)。
一般地,一个三阶张量χk的CP分解优化模型可以写为:
为简便起见,用U(1)U(2)U(3)表示其中为U(i)的第j个列向量,U(i)通常称为第i模态的因子矩阵。基于此,本发明拟优化的目标函数如下:
其中,为第i个视角下第j个模态上的因子矩阵,表示第一模态上的因子矩阵,U*为共同因子矩阵(这里也可以根据实际情况考虑其他模态);|| ||2,1为范数,用于特征的稀疏化学习。目标函数(3)可首先根据范数的分析方法,将其转换为矩阵迹的表达形式,进而利用交替最小二乘(alternating least squares)和半二次法(half-quadratic way)结合进行优化求解。即可迭代优化如下目标函数
其中Q*和分别为与U*和相关的辅助变量。
通过求解上述公式可得到因子矩阵U*和即为多视角张量分解提取的潜在因子矩阵。需要说明的是,每一个视角上提取的因子矩阵仍然是CP分解形式,可有效地近似表示原始视角张量。在此基础上,可以根据基于CP分解构造的张量结构保距核函数以及多核学习理论,构造多视角张量核函数,进而结合第二类张量机进行分类学习。
相对可见光二维图像的广泛应用,高光谱图像识别分类无论在基础理论、还是应用领域的研究都还处于起步阶段。针对基于三维Gabor小波的空间-光谱域联合变化特征提取以及相关的三个关键问题,本发明的特色与创新之处在于:
(1)高光谱图像识别本身是模式识别领域一个很新的方向,通过三维空间域以及频域联合分析,对三维和高光谱图像进行并行特征提取,然后对这些特征进行增强和融合,可以充分利用高维数据的丰富信息以及这些特征之间的结构关系,大大减少噪声对准确率的影响,本发明技术内容是该领域理论和应用上的全新尝试;
(2)目前三维Gabor特征主要基于幅值响应以及区域统计为主,业界并没有对各种相位、方向、频域以及三维空间编码方法进行深入研究。本发明从提取各Gabor特征在方向与频率空间结构关系出发,对不同编码方法进行研究,可大大加强高维Gabor特征的区分能力;
(3)在联合提取空间-光谱域和频域的信号变化特征同时,本发明开拓性地将智能算法引入波段选择,从而可以在保证识别准确率的前提下减少冗余信息,提高识别效率,具有较广泛的应用和推广前景;
(4)传统的向量化和简单拼接方式极其容易造成三维Gabor特征的维数灾难问题,从而给后续分类带来非常大的计算复杂度。本发明从张量角度出发,国内外首次提出基于多视角的高阶Gabor张量构造、学习以及分类方法,可以在提取不同Gabor特征结构关系的同时,对这些特征进行选择和融合,从而进一步提高高维图像识别系统的准确性和鲁棒性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (5)
1.一种高光谱图像特征的并行提取与分类方法,其特征在于,所述方法包括以下步骤:
A.获取高光图图像;
B.对所述高光图图像进行基于三维Gabor小波的空间-光谱域联合变化的并行特征提取;具体为:
给定三维高光谱数据V(x,y,λ),三维小波分析通过三维Gabor小波函数Ψf,θ,φ(x,y,λ)和V(x,y,λ)的内积来同时获得信号的空域和频域信息,其中,参数f为小波的中心频率,φ为该频率在三维频域与w轴的夹角,θ为该频率在三维频域的u-v平面内投影与u轴的夹角;在采用Gabor小波抽取特征时,需要预先设计多个不同中心频率fi以及方向的小波然后将其和V(x,y,λ)进行卷积操作,卷积结果代表了在三维空间(x,y,λ)、频率为fi、方向为的信号变化信息;给定N个三维Gabor小波Ψn(n=1,2,…N),通过卷积获得N个同样大小的三维数据从三维空间、频域以及方向域三个角度对所述N个三维Gabor特征进行空间编码以及频率、方向编码后,V(x,y,λ)获得K个编码后的特征图像
g1(x,y,λ),…gk(x,y,λ)…gK(x,y,λ);
C.结合波段选择对所述步骤B提取的三维Gabor特征进行筛选,通过所述波段选择去除高光谱数据中冗余信息;
D.构造并学习基于多视角的高阶Gabor张量,实现三维Gabor特征融合;
E.构造核函数实现基于支持向量机的图像分类。
2.根据权利要求1所述的方法,其特征在于:所述空间编码的主要思想是将中心像素的响应与相邻像素的响应进行差异性比较,然后对大小关系进行0/1编码,最后再转换成整数,通过区域直方图统计对Gabor特征进行增强。
3.根据权利要求1所述的方法,其特征在于:所述频率、方向编码的核心思想是将中心像素的Gabor响应和相邻频率、方向的响应进行差异性比较,然后对大小关系进行0/1编码,最后再转换成整数,通过区域直方图统计对Gabor特征进行增强。
4.根据权利要求1所述的方法,其特征在于:所述步骤C具体包括:
Step1:设计L个不同中心频率和方向的三维Gabor小波{Ψl,l=1,..,L},将其和B个波段的多光谱数据V(x,y,λ)卷积,获得B×L个卷积图像:{M1(x,y,λ1),…ML(x,y,λ1)…M1(x,y,λb)…ML(x,y,λb)…M1(x,y,λB)…ML(x,y,λB)};
Step2:依次提取每个波段λb的L个卷积图像{M1(x,y,λb)…ML(x,y,λb)},提取维度较低的特征,设计评价函数进行排序,找出最优波段;将该最优波段从候选集合移出,加入到已选集合;
Step3:从候选集合选取一个波段加入到已选集合,使得已选集合的评价函数值得到最大的增加;
Step4:重复上述过程Step1-3,直到增加量小于设定阈值或者迭代次数达到预先设定值。
5.根据权利要求1所述的方法,其特征在于:所述步骤D具体为:波段选择后提取的三维Gabor特征图像表示为K个三阶张量X={χ1,χ2…χK},其中利用稀疏非负多视角张量分解算法,同时学习K个三阶张量的共同因子和各个视角上的潜在因子:一个三阶张量χk的CP分解优化模型写为
为简便起见,用U(1)U(2)U(3)表示其中为U(i)的第j个列向量,U(i)通常称为第i模态的因子矩阵,拟优化的目标函数如下:
其中,为第i个视角下第j个模态上的因子矩阵,表示第一模态上的因子矩阵,U*为共同因子矩阵(这里也可以根据实际情况考虑其他模态);|| ||2,1为范数,用于特征的稀疏化学习;所述目标函数首先根据范数的分析方法,将其转换为矩阵迹的表达形式,进而利用交替最小二乘和半二次法结合进行优化求解得到因子矩阵U*和即为多视角张量分解提取的潜在因子矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610380345.3A CN106022391A (zh) | 2016-05-31 | 2016-05-31 | 一种高光谱图像特征的并行提取与分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610380345.3A CN106022391A (zh) | 2016-05-31 | 2016-05-31 | 一种高光谱图像特征的并行提取与分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106022391A true CN106022391A (zh) | 2016-10-12 |
Family
ID=57092893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610380345.3A Withdrawn CN106022391A (zh) | 2016-05-31 | 2016-05-31 | 一种高光谱图像特征的并行提取与分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106022391A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960221A (zh) * | 2017-03-14 | 2017-07-18 | 哈尔滨工业大学深圳研究生院 | 一种基于光谱特征和空间特征融合的高光谱图像分类方法及系统 |
CN107609507A (zh) * | 2017-09-08 | 2018-01-19 | 哈尔滨工业大学 | 基于特征张量和支持张量机的遥感图像目标识别方法 |
CN107679114A (zh) * | 2017-09-15 | 2018-02-09 | 四川智库慧通电力科技有限公司 | 一种基于使用情况的电力系统绝缘工具智能推荐方法 |
CN108182399A (zh) * | 2017-12-27 | 2018-06-19 | 北京智慧眼科技股份有限公司 | 指静脉特征比对方法、装置、存储介质和处理器 |
CN108268838A (zh) * | 2018-01-02 | 2018-07-10 | 中国科学院福建物质结构研究所 | 人脸表情识别方法及人脸表情识别系统 |
WO2018192023A1 (zh) * | 2017-04-21 | 2018-10-25 | 深圳大学 | 一种高光谱遥感图像分类方法及装置 |
CN108875649A (zh) * | 2018-06-22 | 2018-11-23 | 北京佳格天地科技有限公司 | 一种地物分类方法、系统、设备和存储介质 |
CN109034274A (zh) * | 2018-08-30 | 2018-12-18 | 深圳大学 | 提升高光谱图像分类精度的方法、装置、设备及存储介质 |
CN109101977A (zh) * | 2018-06-27 | 2018-12-28 | 深圳大学 | 一种基于无人机的数据处理的方法及装置 |
CN109658380A (zh) * | 2018-11-09 | 2019-04-19 | 广西壮族自治区遥感信息测绘院 | 基于前期林地矢量数据的林地变化检测方法 |
CN109993224A (zh) * | 2019-03-27 | 2019-07-09 | 中国人民解放军战略支援部队航天工程大学 | 基于深度学习与多核学习的geo卫星形状与姿态识别方法 |
CN110520768A (zh) * | 2017-06-05 | 2019-11-29 | 上海科技大学 | 高光谱光场成像方法和系统 |
WO2020000271A1 (zh) * | 2018-06-27 | 2020-01-02 | 深圳大学 | 一种基于无人机的数据处理的方法及装置 |
CN111160310A (zh) * | 2020-01-02 | 2020-05-15 | 西北工业大学 | 基于自权重协同表示的高光谱异常目标检测方法 |
CN111680549A (zh) * | 2020-04-28 | 2020-09-18 | 肯维捷斯(武汉)科技有限公司 | 一种纸纹识别方法 |
CN113011438A (zh) * | 2021-03-16 | 2021-06-22 | 东北大学 | 基于节点分类和稀疏图学习的双模态图像显著性检测方法 |
CN114332621A (zh) * | 2021-12-30 | 2022-04-12 | 华智生物技术有限公司 | 一种基于多模型特征融合的病虫害识别方法及系统 |
CN114998708A (zh) * | 2022-06-10 | 2022-09-02 | 安徽农业大学 | 一种基于图谱信号的茶叶种类识别方法和装置 |
CN116563571A (zh) * | 2023-05-16 | 2023-08-08 | 北京师范大学 | 基于玻尔兹曼熵相似性的高光谱图像波段选择方法及系统 |
-
2016
- 2016-05-31 CN CN201610380345.3A patent/CN106022391A/zh not_active Withdrawn
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960221A (zh) * | 2017-03-14 | 2017-07-18 | 哈尔滨工业大学深圳研究生院 | 一种基于光谱特征和空间特征融合的高光谱图像分类方法及系统 |
WO2018192023A1 (zh) * | 2017-04-21 | 2018-10-25 | 深圳大学 | 一种高光谱遥感图像分类方法及装置 |
CN110520768B (zh) * | 2017-06-05 | 2021-10-22 | 上海科技大学 | 高光谱光场成像方法和系统 |
CN110520768A (zh) * | 2017-06-05 | 2019-11-29 | 上海科技大学 | 高光谱光场成像方法和系统 |
CN107609507A (zh) * | 2017-09-08 | 2018-01-19 | 哈尔滨工业大学 | 基于特征张量和支持张量机的遥感图像目标识别方法 |
CN107609507B (zh) * | 2017-09-08 | 2020-11-13 | 哈尔滨工业大学 | 基于特征张量和支持张量机的遥感图像目标识别方法 |
CN107679114A (zh) * | 2017-09-15 | 2018-02-09 | 四川智库慧通电力科技有限公司 | 一种基于使用情况的电力系统绝缘工具智能推荐方法 |
CN107679114B (zh) * | 2017-09-15 | 2021-03-16 | 四川智库慧通电力科技有限公司 | 一种基于使用情况的电力系统绝缘工具智能推荐方法 |
CN108182399B (zh) * | 2017-12-27 | 2020-04-21 | 智慧眼科技股份有限公司 | 指静脉特征比对方法、装置、存储介质和处理器 |
CN108182399A (zh) * | 2017-12-27 | 2018-06-19 | 北京智慧眼科技股份有限公司 | 指静脉特征比对方法、装置、存储介质和处理器 |
CN108268838A (zh) * | 2018-01-02 | 2018-07-10 | 中国科学院福建物质结构研究所 | 人脸表情识别方法及人脸表情识别系统 |
CN108875649A (zh) * | 2018-06-22 | 2018-11-23 | 北京佳格天地科技有限公司 | 一种地物分类方法、系统、设备和存储介质 |
CN109101977A (zh) * | 2018-06-27 | 2018-12-28 | 深圳大学 | 一种基于无人机的数据处理的方法及装置 |
WO2020000271A1 (zh) * | 2018-06-27 | 2020-01-02 | 深圳大学 | 一种基于无人机的数据处理的方法及装置 |
CN109034274A (zh) * | 2018-08-30 | 2018-12-18 | 深圳大学 | 提升高光谱图像分类精度的方法、装置、设备及存储介质 |
CN109034274B (zh) * | 2018-08-30 | 2021-01-22 | 深圳大学 | 提升高光谱图像分类精度的方法、装置、设备及存储介质 |
CN109658380A (zh) * | 2018-11-09 | 2019-04-19 | 广西壮族自治区遥感信息测绘院 | 基于前期林地矢量数据的林地变化检测方法 |
CN109993224A (zh) * | 2019-03-27 | 2019-07-09 | 中国人民解放军战略支援部队航天工程大学 | 基于深度学习与多核学习的geo卫星形状与姿态识别方法 |
CN111160310A (zh) * | 2020-01-02 | 2020-05-15 | 西北工业大学 | 基于自权重协同表示的高光谱异常目标检测方法 |
CN111160310B (zh) * | 2020-01-02 | 2022-04-08 | 西北工业大学 | 基于自权重协同表示的高光谱异常目标检测方法 |
CN111680549A (zh) * | 2020-04-28 | 2020-09-18 | 肯维捷斯(武汉)科技有限公司 | 一种纸纹识别方法 |
CN111680549B (zh) * | 2020-04-28 | 2023-12-05 | 肯维捷斯(武汉)科技有限公司 | 一种纸纹识别方法 |
CN113011438A (zh) * | 2021-03-16 | 2021-06-22 | 东北大学 | 基于节点分类和稀疏图学习的双模态图像显著性检测方法 |
CN113011438B (zh) * | 2021-03-16 | 2023-09-05 | 东北大学 | 基于节点分类和稀疏图学习的双模态图像显著性检测方法 |
CN114332621A (zh) * | 2021-12-30 | 2022-04-12 | 华智生物技术有限公司 | 一种基于多模型特征融合的病虫害识别方法及系统 |
CN114998708A (zh) * | 2022-06-10 | 2022-09-02 | 安徽农业大学 | 一种基于图谱信号的茶叶种类识别方法和装置 |
CN114998708B (zh) * | 2022-06-10 | 2023-09-26 | 安徽农业大学 | 一种基于图谱信号的茶叶种类识别方法和装置 |
CN116563571A (zh) * | 2023-05-16 | 2023-08-08 | 北京师范大学 | 基于玻尔兹曼熵相似性的高光谱图像波段选择方法及系统 |
CN116563571B (zh) * | 2023-05-16 | 2023-11-21 | 北京师范大学 | 基于玻尔兹曼熵相似性的高光谱图像波段选择方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106022391A (zh) | 一种高光谱图像特征的并行提取与分类方法 | |
Jiang et al. | SuperPCA: A superpixelwise PCA approach for unsupervised feature extraction of hyperspectral imagery | |
Jia et al. | Gabor feature-based collaborative representation for hyperspectral imagery classification | |
Rida et al. | Palmprint recognition with an efficient data driven ensemble classifier | |
WO2018045626A1 (zh) | 基于超像素级信息融合的高光谱图像的分类方法及系统 | |
Renard et al. | Denoising and dimensionality reduction using multilinear tools for hyperspectral images | |
Plaza et al. | Spatial/spectral endmember extraction by multidimensional morphological operations | |
Foytik et al. | A two-layer framework for piecewise linear manifold-based head pose estimation | |
Jia et al. | 3-D Gaussian–Gabor feature extraction and selection for hyperspectral imagery classification | |
Chen et al. | Hierarchical clustering based band selection algorithm for hyperspectral face recognition | |
Liu et al. | Feature extraction for hyperspectral remote sensing image using weighted PCA-ICA | |
Xu et al. | Subpixel component analysis for hyperspectral image classification | |
Tu et al. | Feature extraction using multidimensional spectral regression whitening for hyperspectral image classification | |
Rojas et al. | Comparison of support vector machine-based processing chains for hyperspectral image classification | |
Li et al. | Texture analysis of remote sensing imagery with clustering and Bayesian inference | |
Rigamonti et al. | On the relevance of sparsity for image classification | |
Nechikkat et al. | Variational mode feature-based hyperspectral image classification | |
Kak et al. | Discrete wavelet transform with eigenface to enhance face recognition rate | |
Chen et al. | Hyperspectral face recognition with minimum noise fraction, histogram of oriented gradient features and collaborative representation-based classifier | |
Masood et al. | Spatial analysis for colon biopsy classification from hyperspectral imagery | |
Depeursinge et al. | Rotation-covariant visual concept detection using steerable Riesz wavelets and bags of visual words | |
Krishnan et al. | Web-based remote sensing image retrieval using multiscale and multidirectional analysis based on Contourlet and Haralick texture features | |
Masood | Hyperspectral imaging with wavelet transform for classification of colon tissue biopsy samples | |
Shariatmadar et al. | Sal-HMAX: An Enhanced HMAX Model in Conjunction With a Visual Attention Mechanism to Improve Object Recognition Task | |
Liang | Spectral-spatial Feature Extraction for Hyperspectral Image Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20161012 |