CN101847210A

CN101847210A - 基于二维经验模态分解和小波降噪的多分组图像分类方法

Info

Publication number: CN101847210A
Application number: CN 201010209877
Authority: CN
Inventors: 沈毅; 贺智; 张淼
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Zhengyuan Technology Information Technology Co. Ltd.
Priority date: 2010-06-25
Filing date: 2010-06-25
Publication date: 2010-09-29
Anticipated expiration: 2030-06-25
Also published as: CN101847210B

Abstract

基于二维经验模态分解和小波降噪的多分组图像分类方法，属于图像处理领域，本发明为解决传统分类方法对图像本质特征利用不充分，分类精度低的问题，本发明包括如下步骤：一：对多分组图像中各波段分别进行二维经验模态分解，得到前K个二维分量IMF和1个残差；二：对前K个二维分量IMF求和作为特征值，小波降噪后获取降噪后特征值；三：多个多分组图像的降噪后特征值按比例任意选取作为支持向量机的训练样本和测试样本，对训练样本进行支持向量机参数训练，再进行归属判定，形成多个支持向量机子分类器；四：利用多个支持向量机子分类器构建基于一对一策略的多分类器，并依据决策函数对测试样本的归属类别做出决策，完成多分组图像的分类。

Description

基于二维经验模态分解和小波降噪的多分组图像分类方法

技术领域

本发明涉及基于二维经验模态分解和小波降噪的多分组图像分类方法，属于图像处理领域。

背景技术

多分组图像是一组具有较高相关性的多波段图像，在地球观测、医学诊断、雷达探测等领域都存在大量的物理原型，例如高光谱图像、医学超声图像、海平面波动图像等。它们一般是针对同一区域的连续观测或多光谱分光观测，往往包含成百上千个波段的图像，各波段图像之间普遍具有较高的相关性，因此多分组图像既包含观察区域的多分辨信息，又存在大量的冗余信息。

对多分组图像分类能获取图像更多的内在规律，便于图像的后续处理，因而多分组图像分类处理技术成为当前一个热点问题。传统分类方法一般都是直接对原始图像进行处理，对图像本质特征利用不充分，分类精度低，不利于对分类后的图像进一步研究。但在多分组图像进行分类之前，若能对其进行预处理，提取出反映图像本质信息的特征分量，将期望提高分类精度。

发明内容

本发明目的是为了解决传统分类方法对图像本质特征利用不充分，分类精度低的问题，提供了基于二维经验模态分解和小波降噪的多分组图像分类方法。

本发明包括如下步骤：

步骤一：对多分组图像中各波段分别进行二维经验模态分解，得到前K个频率由高到低依次递减的二维本征模态函数分量IMF和1个残差；

步骤二：对所述前K个频率由高到低依次递减的二维本征模态函数分量IMF求和作为该多分组图像的特征值，并对所述特征值选取小波函数降噪，获取降噪后特征值；

步骤三：多个多分组图像的降噪后特征值按比例任意选取作为支持向量机的训练样本和测试样本，

对训练样本进行支持向量机参数训练，再利用参数已训练完毕的支持向量机对测试样本所对应像素的类别进行归属判定，形成多个支持向量机子分类器；

步骤四：利用多个支持向量机子分类器构建基于一对一策略的多分类器，并依据决策函数对测试样本的归属类别做出决策，完成多分组图像的分类。

本发明的优点：

1)本发明把BEMD这种适合处理非平稳信号的新方法应用到多分组图像，得到反应图像不同尺度特征的二维IMF，并依据越靠前的二维IMF反应图像本质特性越多的原理，求取前

个二维IMF的和，它们能更有效的反应图像本质特性。

2)本发明考虑了任何多分组图像都不可避免地被噪声所污染的事实，引入了小波降噪处理环节，将结果作为对输入空间高维数不敏感的支持向量机的训练样本和测试样本，以此来训练基于一对一策略的多分类器。与仅输入原始图像的多分类方法相比，可去除噪声干扰，有效提升分类精度。

3)本发明所提出的分类方法无需增加训练样本的数量，只是将原训练样本与测试样本相应地替换为步骤二得到的训练样本和测试样本，更充分地利用了多波段图像信息，因此该分类方法与传统多分类方法在结构上保持了较好的一致性，无需改变训练向量的采集方法，有利于算法的推广应用。

附图说明

图1为本发明方法原理图；图2为BEMD分解原理图；图3为对第200个波段的原始多分组图像，图4至图7是对第200个波段的原始多分组图像进行二维经验模态分解后得到的前4个二维IMF，图8是对第200个波段的原始多分组图像进行二维经验模态分解后得到的残差；图9为原始多分组图像与降噪后的前4个二维IMF的和各波段均值对比图；图10为原始多分组图像与降噪后的前4个二维IMF的和各波段标准差对比图；图11为对第200个波段的前4个二维IMF之和小波降噪后三维图；图12为对第200个波段的前4个二维IMF之和所去除的噪声三维图；图13基于原始支持向量机方法的分类结果散点图；图14采用本发明方法对降噪后的前4个二维IMF的和选取训练样本和测试样本，进行支持向量机分类结果散点图。

具体实施方式

具体实施方式一：下面结合图1和图2说明本实施方式，

1998年美国国家航空航天管理局(NationalAeronauticsandSpaceAdministration，NASA)的黄锷博士等人根据近代数学家希尔伯特的数学理论设计，提出了希尔伯特-黄变换(Hilbert-HuangTransform，HHT)。HHT作为一种分析非线性非平稳信号的强有力工具，处理过程分为两个步骤。首先用经验模态分解(EmpiricalModeDecomposition，EMD)获得有限数目的本征模态函数(IntrinsicModeFunction，IMF)，然后利用希尔伯特变换(HilbertTransform，HT)和瞬时频率法获得IMF的瞬时频率和振幅，最终得到信号的时-频谱。

HHT的核心是EMD。EMD完全由数据驱动，其本质是根据信号的特征时间尺度对信号进行筛分，此过程表现为尺度带通滤波器对信号进行过滤，因此在一定尺度范围的信号被分离出来，组成具有有限带宽频谱成分的IMF。IMF必须满足下列两个条件：

1)在整个函数中，极值点的数目与穿越零点的数目相等或者相差1；

2)在任何时刻，由极值所定义的包络线均值为零。

EMD能分解一维非线性非平稳信号的特性也能拓展到二维信号，这就是二维经验模态分解(BidimensionalEmpiricalModeDecomposition，BEMD)，它是对EMD的进一步发展。最近几年来，BEMD在图像处理领域发挥了其优良特性，广泛应用于图像压缩、纹理分析、图像降噪等，但鲜有发明将BEMD应用于多分组图像分类。

考虑到HHT从瞬时频率的物理意义出发，定义了BEMD方法和二维IMF的概念，通过BEMD方法可以将任意图像分解为频率从高到低的二维IMF及1个残差图像的叠加，对二维IMF进行支持向量机分类，这就为提高多分组图像分类精度提供了新思路。

本实施方式方法通过以下技术方案实现本发明目的的：通过BEMD提取频率从高到低依次递减的前

个二维IMF，对前

个二维IMF的和进行小波降噪处理，然后对去除噪声后的结果用支持向量机分类，具体方法包括以下步骤：

步骤一获得前K个频率由高到低依次递减的二维本征模态函数分量IMF和1个残差的过程为：

设定多分组图像输入信号为

，其中，m，n为多分组图像的像素横坐标和纵坐标，i=1,2,…,K，j为估计的次数，初始化i=1，j=1，

步骤1、采用区域极值法确定多分组图像输入信号

所有的极大值和极小值；

步骤2、利用步骤1获取的所有的极大值构造一个极大值Denaulay三角形网格，由双三次样条插值求取所述极大值Denaulay三角形网格的上包络面

，

利用步骤1获取的所有的极小值构造一个极小值Denaulay三角形网格，由双三次样条插值求取所述极小值Denaulay三角形网格的下包络面

；

步骤3、按如下公式计算上、下包络面的均值

：

，

步骤4、，获取多分组图像第个IMF分量的第

次估计

：

；

步骤5、判断下式是否成立：

，其中，且充分接近0，

判断结果为是，执行步骤6，

判断结果为否，令

，，并返回执行步骤1，

步骤6、获取第i个二维本征模态函数分量IMF

，获取第i个残差

；

步骤7、判断第i个残差是否为单调函数，

判断结果为否，令i=i+1，j=1，并返回执行步骤1，

判断结果为是，完成获取前K个频率由高到低依次递减的二维本征模态函数分量IMF：

，和1个残差：

。

多分组图像输入信号

被分解成下式：

，

步骤二中，将前K个频率由高到低依次递减的二维本征模态函数分量IMF求和

，并作为该多分组图像的特征值。二维IMF的极值点数与过零点数至多相差1，且彼此近似正交，它们代表了图像信号的各个频率成分，对应原始图像信号时间尺度从细到粗的特征信号，残差则反映了原始图像信号的变化趋势。按比例任意选取前个二维IMF的和作为新的训练样本和测试样本，与传统方法仅用原始图像信号作为输入样本相比，剔除了大量冗余信息，提高了分类精度。

通过BEMD得到的二维IMF，它们彼此近似正交，其频率依次递减，反应了不同尺度的多分组图像特征。越靠前的二维IMF，表征的图像特征信息越丰富。残差代表了多分组图像的变化趋势。

多分组图像中不可避免地带有噪声信息，因而对求取的前

个二维IMF的和寻找合适的降噪方法，将有利于提高分类精度。考虑到：1)前个二维IMF的和是近似平稳信号；2)小波分析对处理平稳信号比Fourier分析等其他方法更有效；3)具有物理意义的二维IMF的频率是由高频到低频依次递减的，而噪声一般为高频信号。综合以上三个方面，本发明采用小波分析对前

个二维IMF的和进行降噪处理，再对降噪后的前个二维IMF的和进行分类。

小波分析是20世纪80年代后期发展起来的新兴应用数学分支，在J.Morlet、S.Mallat和I.Daubechies等人的努力下，小波分析理论及其在工程中的应用得到迅猛发展，打破了积分变换领域由傅氏变换长期一统天下的格局，被认为是信号分析工具及方法上的重大突破。由于小波分析可看成是傅氏变换的发展，所以与傅氏变换一样具有极广的应用面。目前，在通信、图像、语言、地震、雷达、声纳、特征提取、故障诊断、信号滤波、数据压缩、振动分析等诸多方面得到了广泛应用。对于图像降噪这一信号处理中的经典问题，传统的降噪方法多采用平均或线性方法进行，常用的是维纳滤波，但是降噪的效果不好。随着小波分析理论的日益完善，它以自身良好的时频特性在图像降噪领域受到越来越多的关注，开辟了非线性方法降噪的先河。由于它对非平稳信号的处理能力很有限，如果能通过预处理得到平稳图像，降噪效果会更好。鉴于此，本发明采用小波分析对由BEMD得到的二维IMF进行降噪处理。

本实施方式中将前个二维IMF的和表示为

，其中

，

代表图像属于多分组图像的第个分组。要求选取的二维小波函数

满足如下容许性条件

对

进行二维连续小波变换

选取软阈值函数滤除的噪声，得到

，最后由如下反演公式对

进行重构

其中，

是与

无关的常量，

是

个二维IMF的和

降噪后得到的图像，即降噪后特征值。

本发明方法选取Daubeachies、Symlets、Biorthogonal、Coiflets、DiscreteMeyer或ReverseBiorthogonal这6类常用的小波函数进行降噪。

步骤三中获取多个支持向量机子分类器的过程为：

支持向量机分类器的基本核函数选取具有对称内积的径向基函数

：

，

其中

为径向基函数的参数，

由

所构成的多个支持向量机子分类器

为：

，

其中，

为拉格朗日乘子，为分类目标，

为

维多分组图像向量(代表某一像素点的各波段数据)，

是样本的数目，

是

维多分组图像输入向量，

是阈值。

步骤四所述决策函数采用胜者通吃的投票原则，并按下式求出测试样本所对应像素的最终归属类别

：

，

其中，评分函数

可表示为：

，

为扩维特征测试向量区分类别总数量。

支持向量机是V.N.Vapnik提出的一种新型机器学习方法，它本质上是一种非线性数据分类工具，其原理基于结构风险最小化原则，即由有限的训练样本取得的决策对独立的测试集仍能取得小误差的一种方法。此外，由于支持向量机算法是一个凸优化问题，其局部最优就是全局最优解，这是其他学习算法(如人工神经网络等)所不具备的。近年来支持向量机受到国际学术界的广泛重视，在模式识别、函数逼近、回归估计、数据挖掘、三维物体识别、遥感图像分析和非线性系统控制等领域都有应用。本发明采用支持向量机来完成最终的分类任务。由于支持向量机本质上是两分类器，因此需要利用一系列该两分类器并辅以一定策略构造出多分类器。一对一策略是目前广泛应用的策略之一，它对任意两类都构造分类器，并将这些分类器并行运算，测试数据的最终类别由投票选举来确定。该策略使得各支持向量机判别容易，在训练时间上有着非常好的表现。

在决策之前，需要计算每一类别k的评分函数，该函数统计了各子分类器的正负得分。一对一策略的最终决策采取“胜者通吃”的投票原则。

具体实施方式二：下面结合图3至图14说明本实施方式，给出一个具体实施例，选用92AV3C高光谱图像的多分组图像。

高光谱图像是典型的多分组图像。选取的92AV3C高光谱图像来自于AVIRIS(AirborneVisible/InfraredImagingSpectrometer)传感器所采集的美国印地安那州西北部某农业地区的遥感观测。该图像集合包含224个连续波，从0.40μm到2.45μm大约每隔10nm一个波段。去掉4个0值波段以及20个受水汽吸收影响的波段，实际实验可用的波段为200个。选取7类像素数目最多的地物(即corn-notill，corn-mintill，grass/trees，soybeans-notill，soybean-mintill，soybean-cleantill和woods)作为实验样本，这7类地物的像素总数占了所有16类地物像素总数的80.64%。

执行步骤一：对原始92AV3C高光谱图像中各波段分别进行BEMD，提取出反应图像本质特征的频率依次递减的前4个二维IMF。

以第200个AVIRIS波段为例，其对应的原始图像(包含145x145个像素点)如图3所示，进行BEMD后得到的4个二维IMF和1个残差图像分别如图4至图8所示(它们都包含145x145个像素点)。前4个二维IMF的频率由高到低依次递减，残差图像代表原高光谱图像的趋势。图9和图10分别对比了原高光谱图像与第一个二维DIMF的均值和标准差。

执行步骤二：依次求取前4个二维IMF的和，对求取的结果选取Sym4小波函数降噪，相应得到去除了噪声的和图像。

本步骤求取前4个二维IMF的和，对于求取的结果用Sym4小波降噪。

考虑到Symlets是Daubechies提出的近似对称小波，是对db函数的一种改进。它有N阶消失矩，具有正交性和近似对称性，计算复杂度较小，在时域和频域都是有限紧支等特点。Symlets小波系通常表示为

。

本实施例选取最具代表性的Sym4小波，进行二层分解。图11用三维图显示了前4个二维IMF的和的第200个波段的降噪结果。图12显示了对降噪过程中的第200个波段消除的噪声，它等于降噪前的前4个二维IMF的和减去降噪后的前4个二维IMF的和。

执行步骤三：任意选取步骤二得到的结果的20%作为训练样本，剩下的80%作为测试样本。先用训练样本及它们所对应的归属类别对支持向量机进行训练，最后用参数已训练完毕的支持向量机对已选定的测试样本进行归属判定。

本实施例选取如下具有对称内积的径向基核函数(RadialBasisFunction，RBF)

：

，

其中

为径向基函数的参数，

由所构成的多个支持向量机子分类器

为：

，

其中，

为拉格朗日乘子，

为分类目标，

为维多分组图像向量(代表某一像素点的各波段数据)，

是样本的数目，

是

维多分组图像输入向量，

是阈值。

执行步骤四：利用多个支持向量机子分类器构建基于一对一策略的多分类器，并依据决策函数对各波段的归属类别做出决策。

本实施例采用一对一策略构建7类地物的多分类器，共需要

个支持向量机子分类器分别处理其中两两类别之间的鉴别任务，因此本步骤需要执行21次。

最终决策前，首先统计各子分类器的结果中关于7种类别的正、负得分情况，评分函数的计算公式如下

一对一策略最终决策采取“胜者通吃”的投票原则，并根据下式求出最终类别

由于实验所用92AV3C高光谱图像包含了归属类别参考图，也就知道了各个测试样本所在的真实类别，于是可以方便地计算出本发明的实际分类精度。另外，选取20%原始高光谱图像作为一对一策略支持向量机的训练样本，80%原始高光谱图像为测试样本，得到传统方法的分类精度，表1对比了传统方法与本发明的分类精度。两种方法的分类散点图见图12和图13。其中白色散点表示测试集合中被错误分类的波段，黑色区域为实验所涉及的7类地物，灰色区域为实验未涉及的图像区域。

从表1中的分类精度对比可知：对原始图像进行BEMD之后，利用步骤四选取的训练样本和测试样本代替原始图像时，平均分类精度和整体分类精度均得到提高，其中平均精度定义为7类地物分类精度的均值，总体精度则定义为所有正确分类样本占总样本数的百分比。比如，本实施例用降噪后的前4个二维IMF的和代替原始图像时，平均分类精度提高了7.08%，整体精度提高了7.78%。此外，从两种方法的分类结果散点图来看，图14的错误分类波段(白色散点区域)明显少于图13，这说明本发明方法能够有效提高分类精度。

类别	一对一策略支持向量机的平均分类精度 [%]	一对一策略支持向量机的整体分类精度 [%]
			传统SVM方法	88.73	88.41
本发明方法	95.81	96.19

本发明方法的测试样本和训练样本的比例按实际需求而定，可以是如前所述的五五对折；可以是选取20%原始图像作为一对一策略支持向量机的训练样本，80%原始图像为测试样本；可以是选取10%原始图像作为一对一策略支持向量机的训练样本，90%原始图像为测试样本；还可以是选取30%原始图像作为一对一策略支持向量机的训练样本，70%原始图像为测试样本，等等。