CN109558873A

CN109558873A - 一种基于变样本栈式自编码网络的模式识别方法

Info

Publication number: CN109558873A
Application number: CN201811467778.8A
Authority: CN
Inventors: 林琳; 王芳; 郭丰; 钟诗胜
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2018-12-03
Filing date: 2018-12-03
Publication date: 2019-04-02
Anticipated expiration: 2038-12-03
Also published as: CN109558873B

Abstract

一种基于变样本栈式自编码网络的模式识别方法，属于大数据模式识别领域。现有的模式识别方法在数据维度逐渐增高时，会出现模式识别精度和效率下降问题的问题。一种基于变样本栈式自编码网络的模式识别方法，一、通过变样本栈式自编码网络滤除高维空间样本中噪声，映射成低维空间去噪样本集合；二、利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练，得到低维空间去噪样本集合中的典型样本集合；三、基于步骤二获得的典型样本集合，采用逆映射到高维空间获得高维空间典型样本集合，并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别，完成待测试样本的类别判定。本发明与其它算法进行对比，提高了分类准确率。

Description

一种基于变样本栈式自编码网络的模式识别方法

技术领域

本发明涉及一种模式识别方法，特别涉及一种采用变样栈式自编码网络的大规模高维度模式识别方法。

背景技术

目前，各领域数据都表现出大规模、非线性、高维度的特性。例如，民航发动机的巡航信息包括排气温度偏差值、核心机转速偏差值、燃油流量偏差值等至少27个维度的数据，人脸识别中的一张图片可以看作几百维、甚至上千维的数据向量，医学上用于心脏诊断的数据包括主动脉瓣峰值压差、二尖瓣A峰流速、肺动脉瓣峰值流速等十几个维度的数据。这些高维数据在时间维度上的动态信息，就形成了大规模数据记录，例如民航发动机一个小时内的巡航记录通常以每秒钟以37.5kHz的频率采集，长时间连续记录的动态心电图更是数量庞大的数据记录。高维度、大数据量样本的噪声、非线性、高通量问题使得利用这些数据进行模式识别、故障诊断、状态预测时有较大的精度和效率问题。

发明内容

本发明的目的是为了解决现有的模式识别方法在数据维度逐渐增高时，会出现模式识别精度和效率下降问题的问题，而提出一种基于变样本栈式自编码网络的模式识别方法。

一种基于变样本栈式自编码网络的模式识别方法，所述的方法通过以下步骤实现：

步骤一、通过变样本栈式自编码网络滤除高维空间样本中噪声，映射成低维空间去噪样本集合；

步骤二、利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练，得到低维空间去噪样本集合中的典型样本集合；

步骤三、基于步骤二获得的典型样本集合，采用逆映射到高维空间获得高维空间典型样本集合，并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别，完成类别判定。

本发明的有益效果为：

工程领域数据都表现出大规模、非线性、高维度的特性，使得使用现有机器学习方法会产生较大的识别精度误差和识别效率问题。而且在样本空间不完备的情况下，是无法基于现有样本获得最优样本。为了提高栈式自编码网络的特征学习能力，本发明提出了基于变样本栈式自编码网络和遗传算法相结合的模式识别方法。利用自编码网络具有非线性自相关学习、随机噪声在层间学习后会离群的特点，引入基于无迹变换的层间自筛选路径，保留典型样本作为下一层自编码网络的输入，建立变样本栈式自编码网络。采用遗传算法对映射后的低维样本进行进化学习，获得进化后的低维空间样本，以此缩短了识别所需时间。基于低维空间样本及其逆映射还原到高维空间的样本，获得了最优样本。本方法对比多种模式识别方案，利用MNIST手写数字数据库和航空发动机性能参数数据，对方法进行实验验证，并与其它算法进行对比，证明本发明的识别结果获得的分类准确率高于其他识别方法的2倍。

附图说明

图1为本发明涉及的变样本栈式自编码网络示意图；

图2为本发明涉及的获得低维典型样本的单次迭代过程图；

图3为本发明涉及的非线性可分低维样本映射到线性可分高维样本；

图4为本发明涉及的线性可分低维样本映射到线性可分高维样本；

图5为本发明涉及的低维向量到高维向量的还原过程；

图6为本发明涉及的低维空间统计模式识别方案示意图；

图7为本发明涉及的高维空间SVM模式识别方案；

图8为本发明涉及的部分MNIST数据；

图9为本发明涉及的MDL示意图；

图10为本发明涉及的典型样本的可视化表达示例；

图11为本发明涉及的样本构造过程；

图12为本发明的流程图。

具体实施方式

具体实施方式一：

本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述方法包括以下步骤：

步骤二、利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练，通过进化学习过程得到低维空间去噪样本集合中的典型样本集合；

步骤三、基于步骤二获得的典型样本集合，采用逆映射到高维空间获得高维空间典型样本集合，并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别，完成待测试样本的类别判定。

具体实施方式二：

与具体实施方式一不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的步骤一中，通过变样本栈式自编码网络滤除高维空间样本中噪声，映射成低维空间去噪样本集合的过程，具体为：

首先，建立栈式自编码网络，通过栈式自编码网络在聚类方法下逐层筛掉高维空间样本边缘的样本，在栈式底部获得高聚合度的低维空间样本集合，提高低维样本的典型性。

具体实施方式三：

与具体实施方式二不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的建立栈式自编码网络，之后通过栈式自编码网络在聚类方法下逐层筛掉高维空间样本边缘的样本，在栈式底部获得高聚合度的低维空间样本集合的过程，变样本栈式自编码网络的低维空间映射。高维空间通过栈式自编码网络映射到低维空间，如图3所示。由于高维空间样本中随机噪声的独立不相关性在映射过程中会产生离群样本，为提高样本集合的代表性，采用基于无迹变换的无监督聚类在层间筛掉离群样本。因此在自编码网络学习过程中，层间样本集合是变化的，在栈式底部获得高聚合度的低维空间样本集合。

栈式自编码网络具有高效特征学习能力，基于深度学习获得高维样本的非线性低维映射，如图4所示。由于样本中存在噪声，传统自编码网络学习过程将噪声也同时映射到了低维空间。在降维映射过程中，含噪声样本点离群，其离群特点使含噪声样本与无噪声样本具有区分度，支持去噪过程。为提高低维样本的典型性，去掉样本中噪声，在栈式自编码网络训练过程中，采用聚类技术逐层筛掉空间边缘的样本。具体为：

步骤一一、建立栈式自编码网络：

(1)、建立n层栈式自编码网络模型：M＝[H₁,H₂,…,H_n]，，构造出n-1层自编码网络；

其中，

所述的n层栈式自编码网络模型中，输入层H₁对应高维训练样本，输出层H_n对应低维去噪样本集合；H₂至H_n-1为栈式自编码网络模型M的中间层，表示输入样本H₁的抽象映射空间；

所述的n-1层自编码网络的第i层自编码网络为其模型参数矩阵为W_i、B_i、如图1所示，H_i表示自编码网络的输入向量；表示重构的自编码网络的输出向量；H_i+1表示自编码网络的隐含层向量；

(2)、训练自编码网络，使由自编码网络的输出向量与自编码网络的输入向量H_i之间的误差所成的重构误差达到最小，如式1所示：

其中，表示激活函数；s.t.表示使得

满足min

步骤一二、层间无监督聚类分离离群样本：

首先，对于步骤一一建立的n层栈式自编码网络模型M，将第i层自编码网络的输入样本H_i设置为I_i，数量是N_i；

在自编码逐层训练过程中，特征空间类间距增大、类内距减小。类内距减小时，大部分特征样本趋于平均值，含噪声样本边缘化。为了获得高聚类度或高辨识度样本，减少由于层间非线性映射造成含噪声样本中的噪声叠加与干扰，层间增加聚类去除噪声样本。之后，设定聚类阈值α，获得聚类度或分类辨识度大于α的样本作为第i+1层自编码网络的输入，即：

I_i+1＝{H_i+1|F(H_i+1)≥α} (2)

其中，H_i+1是第i+1层自编码网络的隐含层向量，I_i+1是第i+1层自编码网络的输入向量，F(·)是聚类函数或分类器；

之后，设计基于无迹变换的聚类器F(·)，进行第i层自编码器AE_i与第i+1层自编码器AE_i+1的层间去噪；根据设置的聚类阈值α，以F(·)<α为条件选择敏感特征进入网络下一层自编码器AE_i+1。

具体实施方式四：

与具体实施方式三不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的步骤一二中，设计基于无迹变换的聚类器F(·)，进行第i层自编码器AE_i与第i+1层自编码器AE_i+1的层间去噪，根据设置的聚类阈值α，以F(·)<α为条件选择敏感特征进入网络下一层自编码器AE_i+1，具体为：

(1)、通过式(3)计算自编码器AE_i输入样本的均值，通过式(4)计算自编码器AE_i输入样本的方差：

(2)、工程领域中的高维数据通常呈现高斯分布特点。采用式(5)生成能捕获高斯随机变量均值和协方差的2n+1个sigma采样点：

其中，κ是一个比例参数，是矩阵(n+κ)P第j行的平方根，ω_j是权重，且

(3)、计算sigma点非线性变换后隐含层样本：

其中，M(·)为栈式自编码网络模型(非线性变换)；

计算均值估计E_UT和方差估计S_UT：

(4)、以E_UT为聚类中心，计算变换样本点到聚类中心E_UT的广义距离D_i，定义聚类器F(·)：

根据设置的聚类阈值α，以F(·)<α为条件选择敏感特征进入网络下一层自编码器AE_i+1；但是，变换后样本的方差影响聚类阈值α值的选取，因为当变换样本方差大，说明样本点分散，选择较大的α值才能保留一定比例的特征样本；当变换样本方差小时，说明特征样本较集中，此时含噪声样本边缘化，选择较小的α值就能保留去噪特征样本进入下一层自编码器。其中，设计聚类阈值α为：

α＝k·V (10)

其中，V为无迹变换样本方差，k为比例系数。

具体实施方式五：

与具体实施方式四不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的步骤二中，利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练，通过进化学习过程得到低维空间去噪样本集合中的典型样本集合的过程，具体为：

经过深度学习迭代映射，低维空间去噪样本H_n各维度变得无明显物理意义，且各维度的数量级相当，可采用遗传算法对低维空间中的样本进行进化学习。

步骤二一、设置低维典型样本集合为遗传初始群体H_n，群体规模为N_n-1，采用浮点数编码经过g次迭代进化后，获得低维空间中典型特征集合如图2所示。

步骤二二、在进化学习中最重要的是建立合适的适应度指标，由于本发明主要是为了抽取典型样本集合支持样本分类，样本的区分度是最为关注的，因此采用分类器作为适应度函数。但是如果采用计算代价较高的高精度的分类器，对于样本量较大的问题，其工程适应性太差。

已证明如下定理：对任意给定规模有限样本集，必存在一个函数，将样本集映射为高维空间中线性可分的子集。如图3所示，基于非线性变换φ(x)将非线性可分低维样本映射为线性可分高维样本。

鉴于此理论，对线性可分低维样本集，必存在一个函数将其映射到高维空间中的样本集，在高维空间中也线性可分。例如，二维线性可分样本集(x,y)的分界线是y＝ax+b，则三维映射(X＝x,Y＝y,Z＝0)一定使三维样本是线性可分的，其分界面是Y＝aX+b，即二维分界线y＝ax+b沿Z轴拉伸形成二维平面Y＝aX+b,如图4所示。

因此，设计低维空间中的线性分类器S(x)，基于进化中的遗传初始群体和已知类别j构造分类器输入样本将输出遗传初始群体属于类别j的概率作为遗传算法的适应度值，即适应度函数f为：

其中，P表示概率；

步骤二三、如图5所示，利用步骤一获得的低维空间去噪样本集合H_n训练样本训练分类器S(x)；在进化过程中，计算进化个体在每次迭代中的分类正确概率并作为适应度值，即计算复杂度为C·g·m·O(S(x))，利用低维样本集合H_n训练线性分类器S(x)，选择线性分类器S(x)：

其中，C为所有样本的分类数，g为迭代次数，m为遗传规模，O(S(x))为分类器S(x)的复杂度；w_i表示分类器S(x)的权重；w₀表示分类器S(x)的偏置；x_i表示第i个低维空间去噪样本。

具体实施方式六：

与具体实施方式五不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的步骤三中，基于步骤二获得的典型样本集合，采用逆映射到高维空间获得高维空间典型样本集合，并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别，完成待测试样本的类别判定的过程，具体为：

为了获得具有物理意义的典型高维样本支持模式识别，增强特征向量的可解释性，设计高维度空间相似度模式识别方案，简称为HDSI：

分别从低维空间中典型特征集合选出C类样本集合，从每类样本中选择适应度最大的样本作为支持模式分类的典型样本，并通过栈式编码器逆映射到高维空间，得到C个类别的典型样本

之后，计算与测试样本T的相似度S_j，相似度最高的所属类别j即为对测试样本的判定类别。

具体实施方式七：

与具体实施方式六不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的分别从低维空间中典型特征集合选出C类样本集合，从每类样本中选择适应度最大的样本作为支持模式分类的典型样本，并通过栈式编码器逆映射到高维空间，得到C个类别的典型样本之后，计算与测试样本T的相似度S_j，相似度最高的所属类别j即为对测试样本的判定类别的过程具体为：

(1)、通过自编码网络译码过程进行典型样本从低维空间逆向映射到高维空间的过程：

按照倒序逐层译码，将栈式自编码M_j的第n层向量的典型样本还原到高维向量，如式(13)所示：

即将还原到维度的过程为：①计算②将①的结果赋值给③计算如图5所示。

(2)、相似度S_j的设置采用欧氏距离、余弦夹角、曼哈顿距离或切比雪夫距离方法中的一种。

具体实施方式八：

与具体实施方式七不同的是，本实施方式的一种基于变样本栈式自编码网络的模式识别方法，所述的相似度S_j的设置采用余弦夹角表示C个类别的典型样本与测试样本T的相似度S_j，如式14所示：

对于步骤三的基于步骤二获得的典型样本集合，采用逆映射到高维空间获得高维空间典型样本集合，并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别，完成待测试样本的类别判定的过程，其他模式识别方案对照说明：

(1)低维空间相似度模式识别方案(LDSI)

由于高维空间是样本的原始表达空间，其在HDSI中存在计算复杂度大的问题。为了比较同一样本在不同空间中的分类效果和效率，设计基于低维空间典型样本进行模式识别的方案。将测试样本T分别输入栈式自编码网络M_j(j∈[1,C])得到C个测试特征计算测试特征向量与对应类别典型特征的相似度S_j，最大S_j所属类别j即为识别结果。

(2)低维空间统计模式识别方案(LDST)

在LDSI中，虽然基于低维典型特征相似度的识别方法能够减小计算复杂度，但是直接选择与测试样本最相似的典型特征所属类别作为分类结果的方法使模式识别结果理论上具有偶然性，分类精度具有分散性。所以基于统计方法选择典型特征所属分类频数最多的类别作为分类结果，根据该方法设计对比方案如下：

将测试样本T分别输入栈式自编码网络M_j(j∈[1,C])得到C类测试特征，计算第j类测试特征与典型特征集合中元素的相似度S_j，构成相似度集合{S_j}(j∈[1,C])，统计{S_j}中相似度最小的u个分类，最多类别即为识别结果，如图6所示。

(3)高维空间SVM模式识别方案(HDSVM)

通过栈式自编码网络M将低维空间典型样本集合逆向映射到高维空间，利用典型样本集合训练支持向量机，对测试样本分类。此时变样本栈式自编码器和低维空间样本的学习过程起到样本去噪和样本优化的作用。如图7所示。

三个模式识别方案与的复杂度分析如表1所示。

表1模式识别方案复杂度分析

其中，O(sta)是栈式自编码网络初始化复杂度，O(GA)是遗传算法复杂度，O(res)是还原过程复杂度，O(sim)是测试特征与典型特征集合的匹配过程复杂度，O(com)是特征提取过程的复杂度，O(SVM)是SVM复杂度。

如表1所示，HDSI和LDSI的复杂度相同，因为栈式自编码网络特征提取过程与还原过程互逆，O(res)＝O(com)；LDST比HDSI、LDSI复杂度高，因为增加了相似度匹配和统计过程；HDSVM比HDSI、LDSI复杂度高，虽然只训练一个栈式自编码，但由于所有类训练样本共同训练模型，效率低且特征典型性差。LDSI需要将测试样本压缩成C类测试特征，再进行模式匹配。通过对比所有方案，HDSI较其他方案具有更大实用性，其计算复杂度低，直接利用测试样本匹配典型样本，获得识别结果。

为了验证上述方案的有效性，分别用MNIST手写数字数据库和民航发动机在线性能参数进行实验验证。

1.MNIST手写数字数据库实验

MNIST是一个手写数字数据库，它有60000个训练样本和10000个测试样本，在图片识别领域是应用广泛的公共数据，共有0到9十个类别，如图8所示。为了提高实验效率，本方法截取训练样本集的前10000个数据作为训练样本，截取测试样本集的前500个作为测试样本。每张图片大小是28×28像素，看作28×28＝784维向量，共得到10000×784的训练样本，500×784的测试样本。

设置实验参数如下：变样本栈式自编码网络设计三层网络[500，300，100](即n₁＝500，n₂＝300，n₃＝100),筛选阈值α＝0.9；交叉、变异概率P＝[0.8，0.2]。

为了验证HDSI的优越性，在对比LDSI、LDST、HDSVM的基础上，再设置如下对比实验：

(1)成熟深度学习模式识别(MDL)

利用训练样本X^j,j＝1,...,C训练一个栈式自编码网络M，获得网络权重和偏置矩阵W，基于W初始化同结构的神经网络分类器N，并训练该分类器，计算测试样本分类误差确定识别结果，如图9所示。

(2)支持向量机(SVM)

利用训练样本X^j,j＝1,...,C训练支持向量机G，计算测试样本分类误差确定识别结果。将所有实验重复做20次，所有实验结果如表2所示。

表2基于MNIST数据集各方案模式识别正确率(％)

HDSI对部分MNIST手写数字数据库的模式分类效果要远远好于其他方法，从以下几个方面分析：

(1)低维和高维空间中的模式分类对比分析

通过对比HDSI、LDSI、LDST，发现基于低维空间中的典型样本的分类准确率要低于基于高维典型样本的分类准确率(HDSI分类准确率均值(下同)：40.17％；LDSI：11.8％；LDST：12.02％)，结果显示HDSL的分类正确率比其他方案分类正确率均值高出2倍多。HDSI分类正确率高可能是由于低维空间典型样本集合逆映射到高维空间获得的典型样本很好的支持了模式分类。

(2)采用分类后样本和未分类样本模式分类对比分析

在HDSI中每类样本分别训练一个栈式自编码网络，但在HDSVM中，所有类别样本一起训练一个栈式自编码网络。通过对比发现采用分类后样本训练栈式自编码网络的分类正确率要高于采用未分类样本的识别结果(HDSI：40.17％；HDSVM：11.4％)，这与理论分析一致，因为所有类别样本集合包含较多噪声。

(3)变样本栈式自编码网络与传统方法的对比分析

通过对比HDSI、MDL、SVM，发现HDSI的分类效果好于基于传统栈式自编码网络的模式识别方法(MDL)和传统支持向量机分类器(SVM)(HDSI：40.17％；MDL：14.83％；SVM：11.4％)。该结果验证了基于变样本栈式自编码网络获得的低维去噪样本、遗传算法进化低维去噪样本获得的低维典型样本及其逆映射到高维空间获得的高维典型样本支持模式识别的有效性。

(4)分散性对比分析

对于方法的分散性，HDSVM、SVM的分类正确率最集中，其方差都为0，HDSI、LDSI、LDST、MDL的分类正确率较分散，其方差分别为68.71、9.79、7.30、55.10。分类结果的分散性是由自编码网络训练时的随机初始化、遗传算法的随机搜索等因素造成的。由于HDSI是将低维典型样本还原回高维典型样本支持分类，在还原的过程中也会存在误差的随机性，所以分类结果的分散性较大。

为了更加直观地查看分类结果，将高维典型样本可视化，如下图10所示。

如图10所示，可以直观辨认出图中数字，说明基于变样本栈式自编码网络模型能够有效挖掘出该类样本数据的特征。

在实验中各方案的分类正确率都较低(<50％)，这是由于本方法选用了部分MNIST手写数字数据库作为训练样本，样本数量占总数据库数据数量的1/6。即便是成熟的深度学习模式识别方法和支持向量机利用该实验数据得到的分类正确率也很低(<15％)，说明基于栈式自编码网络的模式识别方法在信息量较少的训练样本中也能获得较完备的典型样本支持模式识别，获得较好的分类准确率。

2.工程数据实验

航空发动机采用模块化设计，典型双转子涡扇航空发动机主要由6个气路单元体组成，沿发动机进口到出口方向依次为：风扇(Fan)、低压压气机(low pressurecompressor，LPC)、高压压气机(high pressure compressor，HPC)、燃烧室(combustor)、高压涡轮(high pressure turbine，HPT)、以及低压涡轮(low pressure turbine，LPT)。它的监控数据包括多个传感器测量值，如排气温度(exhaust gas temperature，EGT)、燃油流量(Fuel flow，FF)、低压转子转速N1、高压转子转速N2等性能参数测量值。这些参数由机载设备采集后，在起飞阶段与巡航阶段，以ACARS(Aircraft CommunicationAddressing andReporting System)报文的形式发送到地面系统。航空发动机运行过程中，会出现不同工况(飞行高度、马赫数)。发动机的性能参数测量值同时受到发动机性能衰退与发动机工况的影响，而性能衰退的影响往往会被工况的影响掩盖。为消除工况影响，发动机制造商基于发动机的物理模型，得出可表征发动机性能衰退状态的参数，主要包括气路参数偏差值，如排气温度偏差值DEGT、核心机转速偏差值(GPCN)、燃油流量偏差值(GWFM)等。这些参数随时间的变化趋势可表征并预测发动机的健康状态。

本实验采用民航发动机巡航阶段排气温度偏差值(DEGT)、核心机转速偏差值(GPCN)、燃油流量偏差值(GWFM)和飞行高度(ZALT)四个在线性能参数进行实验验证。分类类别为2类：正常、故障。综合这四个参数构造一个样本，由于航空发动机的状态趋势是判断其是否故障的重要因素，所以将连续50个时间点的参数串接起来构造出200维度的训练样本。样本构造方式如图11所示。共60个训练样本和16个测试样本，部分样本数据如表3所示。

表3部分样本数据表

实验参数的设置：变样本栈式自编码网络为为3层，每层网络的神经元数是[200，150,50],筛选阈值α＝1；交叉、变异概率P＝[0.8，0.2]。

基于上述数据将所有实验重复做20次，实验结果如表4所示。

表4基于航空发动机数据集各方案模式识别正确率(％)

HDSI对民航发动机性能参数的模式分类效果要远远好于其他方法，与MNIST数据实验结果表现出较大相似性，从以下几个方面分析：

(1)低维和高维空间中的模式分类对比分析

通过对比HDSI、LDSI、LDST，发现基于低维空间中的典型样本的分类准确率要低于基于高维典型样本的分类准确率(HDSI：53.43％；LDSI：50.93％；LDST：49.37％)，结果显示HDSL的分类正确率比其他方案分类正确率高。HDSI分类正确率高可能是由于低维空间典型样本集合逆映射到高维空间获得的典型样本很好的支持了模式分类。

(2)采用分类后样本和未分类样本模式分类对比分析

在HDSI中每类样本分别训练一个栈式自编码网络，但在HDSVM中，所有类别样本一起训练一个栈式自编码网络。通过对比发现采用分类后样本训练栈式自编码网络的分类正确率要高于采用未分类样本的识别结果(HDSI：53.43％；HDSVM：50％)，这与理论分析一致，因为所有类别样本集合包含较多噪声。

(3)变样本栈式自编码网络与传统方法的对比分析

通过对比HDSI、MDL、SVM，发现HDSI的分类效果好于基于传统栈式自编码网络的模式识别方法(MDL)和传统支持向量机分类器(SVM)(HDSI：53.43％；MDL：50％；SVM：43.75％)。该结果验证了基于变样本栈式自编码网络获得的低维去噪样本、遗传算法进化低维去噪样本获得的低维典型样本及其逆映射到高维空间获得的高维典型样本支持模式识别的有效性。

实验中训练样本数量为60个，维度为200维，样本数目少于样本维度的30％，说明训练模型不充分。即使在这种小样本的条件下，HDSI分类效果依旧表现出一定优越性

本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，本领域技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述方法包括以下步骤：

2.根据权利要求1所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述的步骤一中，通过变样本栈式自编码网络滤除高维空间样本中噪声，映射成低维空间去噪样本集合的过程，具体为：

首先，建立栈式自编码网络，通过栈式自编码网络在聚类方法下逐层筛掉高维空间样本边缘的样本，在栈式底部获得低维空间样本集合。

3.根据权利要求1或2所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述的建立栈式自编码网络，之后通过栈式自编码网络在聚类方法下逐层筛掉高维空间样本边缘的样本，在栈式底部获得低维空间样本集合的过程，具体为：

步骤一一、建立栈式自编码网络：

(1)、建立n层栈式自编码网络模型：M＝[H₁,H₂,…,H_n]，构造出n-1层自编码网络；

其中，

所述的n-1层自编码网络的第i层自编码网络为其模型参数为W_i、B_i、H_i表示自编码网络的输入向量；表示重构的自编码网络的输出向量；H_i+1表示自编码网络的隐含层向量；

其中，表示激活函数；

步骤一二、层间无监督聚类分离离群样本：

(1)、对于步骤一一建立的n层栈式自编码网络模型M，将第i层自编码网络的输入样本H_i设置为I_i，数量是N_i；

(2)、设定聚类阈值α，获得聚类度或分类辨识度大于α的样本作为第i+1层自编码网络的输入，即：

I_i+1＝{H_i+1|F(H_i+1)≥α} (2)

(3)、设计基于无迹变换的聚类器F(·)，进行第i层自编码器AE_i与第i+1层自编码器AE_i+1的层间去噪；根据设置的聚类阈值α，以F(·)<α为条件选择敏感特征进入网络下一层自编码器AE_i+1。

4.根据权利要求3所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述的步骤一二中，设计基于无迹变换的聚类器F(·)，进行第i层自编码器AE_i与第i+1层自编码器AE_i+1的层间去噪，根据设置的聚类阈值α，以F(·)<α为条件选择敏感特征进入网络下一层自编码器AE_i+1，具体为：

(2)、采用式(5)生成能捕获高斯随机变量均值和协方差的2n+1个sigma采样点：

其中，κ是比例参数，是矩阵(n+κ)P第j行的平方根，ω_j是权重，且

(3)、计算sigma点非线性变换后隐含层样本：

其中，M(·)为栈式自编码网络模型；

计算均值估计E_UT和方差估计S_UT：

根据设置的聚类阈值α，以F(·)<α为条件选择敏感特征进入网络下一层自编码器AE_i+1；其中，设计聚类阈值α为：

α＝k·V (10)

其中，V为无迹变换样本方差，k为比例系数。

5.根据权利要求4所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：

所述的步骤二利用步骤一获得的低维空间去噪样本集合对样本训练分类器进行训练，得到低维空间去噪样本集合中的典型样本集合的过程，具体为：

步骤二一、设置低维典型样本集合为遗传初始群体H_n，群体规模为N_n-1，采用浮点数编码经过g次迭代进化后，获得低维空间中典型特征集合

步骤二二、设计低维空间中的线性分类器S(x)，基于进化中的遗传初始群体和已知类别j构造分类器输入样本将输出遗传初始群体属于类别j的概率作为遗传算法的适应度值，即适应度函数f为：

其中，P表示概率；

步骤二三、利用步骤一获得的低维空间去噪样本集合H_n训练样本训练分类器S(x)：

在进化过程中，计算进化个体在每次迭代中的分类正确概率并作为适应度值，即计算复杂度为C·g·m·O(S(x))，利用低维样本集合H_n训练线性分类器S(x)，所述的择线性分类器S(x)：

6.根据权利要求5所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述的步骤三中，基于步骤二获得的典型样本集合，采用逆映射到高维空间获得高维空间典型样本集合，并利用待测试样本与高维空间典型样本集合的相似度识别方法进行模式识别，完成待测试样本的类别判定的过程，具体为：

7.根据权利要求6所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述的分别从低维空间中典型特征集合选出C类样本集合，从每类样本中选择适应度最大的样本作为支持模式分类的典型样本，并通过栈式编码器逆映射到高维空间，得到C个类别的典型样本之后，计算与测试样本T的相似度S_j，相似度最高的所属类别j即为对测试样本的判定类别的过程具体为：

即将还原到维度的过程为：①计算②将①的结果赋值给③计算

8.根据权利要求7所述的一种基于变样本栈式自编码网络的模式识别方法，其特征在于：所述的相似度S_j的设置采用余弦夹角表示C个类别的典型样本与测试样本T的相似度S_j，如式14所示：