CN109507655A

CN109507655A - 基于导向重构与范数约束dbn的sar目标识别算法

Info

Publication number: CN109507655A
Application number: CN201811512718.3A
Authority: CN
Inventors: 王健; 秦春霞; 杨珂; 任萍
Original assignee: Northwestern Polytechnical University; Xian Aisheng Technology Group Co Ltd
Current assignee: Northwestern Polytechnical University; Xian Aisheng Technology Group Co Ltd
Priority date: 2018-12-11
Filing date: 2018-12-11
Publication date: 2019-03-22
Anticipated expiration: 2038-12-11
Also published as: CN109507655B

Abstract

本发明提出一种基于导向重构与范数约束DBN的SAR目标识别算法，针对传统基于DBN的SAR目标识别算法网络结构复杂度高、训练次数较多且识别率低等问题，提出利用导向重构算法对训练样本和测试样本做重构预处理，然后裁剪后扩展成一维图像矢量，用加权范数约束的深度置信网络提取低维特征，用Softmax对目标进行分类。实验结果表明，本发明方法可降低图像特征的维度和网络训练的次数，网络的识别性能进一步提高。

Description

基于导向重构与范数约束DBN的SAR目标识别算法

技术领域

本发明涉及一种基于导向重构与范数约束深度置信网络(Deep BeliefNetworks，DBN)的目标识别算法，可以应用于各种军用或民用的图像处理系统。

背景技术

现代高科技战争中，战场信息及时准确获取以及战场态势的高效评估，对争夺战场的军事主导权具有十分重要的作用。合成孔径雷达图像(Synthetic Aperture Radar，SAR)作为一种重要的微波成像传感器，在环境监测、资源勘察和国防军事等领域有着非常广泛的应用。

近年来，基于深度神经网络的目标识别技术在各个领域都取得很好的效果，促进其在SAR图像目标识别方面的研究。文献“SAR Automatic Target Recognition Based onEuclidean Distance Restricted Autoencoder，IEEE J.Sel.Topics Appl.EarthObserv.Remote Sens.，pp.1-11，Jul.2017.”将欧氏距离限制与自编码器相结合，使得在增加样本类间距的同时减小类内样本间距，用dropout操作解决有限训练样本产生的过拟合现象。文献“Synthetic Aperture Radar Target Recognition with Feature FusionBased on a Stacked Autoencoder，Sensors，2017，17，192，1-16”提取23个冗余性较低的图像全局和局部互补性TPLBP特征，并将基线和TPLBP特征作为SAE的输入，利用无监督学习算法和Softmax对目标进行分类。文献“相似性约束的深度置信网络在SAR图像目标识别的应用.电子与信息学报，2016，38(1)：97-103.”提出相似性约束的受限玻尔兹曼机模型并引入监督信息，可将多个相似性约束的受限玻尔兹曼机堆叠成深度模型。文献“基于稀疏理论的SAR图像目标识别研究[D].西安：西安电子科技大学，2015.”将L_0.5范数约束引入，约束受限玻尔兹曼机，得到更为稀疏的特征表示并通过范数约束的深度置信网络，对三类目标与十类目标进行分类。文献“Song，S.；Xu，B.；Yang，J.SAR Target Recognition viaSupervised Discriminative Dictionary Learning and Sparse Representation ofthe SAR-HOG Feature.Remote Sens.2016，8，683.”Shengli Song提出基于监督判别字典学习和SAR-HOG特征(a histogram of oriented gradients-like feature for SAR ATR)的稀疏表示的SAR图像目标识别，实验结果表明SAR-HOG特征可以可靠地捕获SAR图像中目标结构，监督判别字典(Supervised Discriminative dictionary Learning，SDDL)可以进一步捕捉不同类别间的细微差异。以上研究成果表明将约束引入DBN模型可以提高SAR目标识别的性能。但是，在引入相似性约束和范数约束在提高DBN在SAR目标识别时，带来模型网络结构复杂度较高、训练次数较多和网络过拟合等问题。为此，本发明提出一种基于导向重构与加权范数约束深度置信网络的快速SAR目标识别算法。

发明内容

要解决的技术问题

针对传统基于DBN的SAR目标识别算法网络结构复杂度高、训练次数较多且识别率低等问题，本发明提出了基于导向重构与加权范数约束深度置信网络的快速SAR目标识别算法。

技术方案

一种基于导向重构与范数约束DBN的SAR目标识别算法，其特征在于步骤如下：

步骤1：基于导向滤波器的两尺度图像重构

对原图像I_n做拉普拉斯滤波得到高频图像H_n：

H_n＝I_n*L (1)

式中，I_n是第n个源图像，L是一个3×3拉普拉斯滤波器，H_n取绝对值并作局部平均用来重建特征映射图S_n：

S_n＝|H_n|*g_r,σ (2)

式中，g是一个(2r+1)×(2r+1)高斯低通滤波器，σ是高斯低通滤波器的标准差，r和σ均为5；特征映射图对图像高频细节分量的显著性水平提供良好的表征，特征映射图的权重图如下：

将加权导向滤波器应用于每个视觉特征加权映射图P_n中，其相对应的源图像I_n作为引导图像并通过导向滤波器生成的加权图如下：

r₁,ε₁,r₂和ε₂是加权导向滤波器的参数，和是低频近似分量和高频细节分量的加权图并对其进行归一化处理；其中r₁＝45；ε₁＝0.3；r₂＝7；ε₂＝10^-6；

总之，利用平滑滤波器对源图像进行两尺度分解得到低频近似分量，高频细节分量则通过源图像减去低频近似分量获得，如下式：

式中：是源图像的低频分量，是源图像的高频分量；G是(2r+1)×(2r+1)窗口的平滑滤波器，其中r＝15；

最后将源图像的低频近似分量和高频细节分量分别通过加权平均进行重构得到各自的重构低频分量和高频分量随后利用分量进行重构后得到重构图像，如下式：

将得到的重构后的低频近似分量和高频细节分量进行重构得到重构后的图像，则

步骤2：基于加权范数约束深度置信网络的低维特征提取

设X＝{x₁,x₂,…,x_N}代表训练样本数据，x_n(n＝1,2,…,N)是其中第n个训练样本数据，其是由原图像I_n作两尺度分解和重构后的图像做裁剪并扩展成一维矢量形成的，是一个列向量，N表示训练样本的总数；受限玻尔兹曼机RBM将输入图像X由可视层V映射到隐层H；

在RBM中，任意两个相连的神经元之间的权值W^vh表示其连接强度，v表示可视层的随机变量，h表示隐含层的随机变量，每个神经元自身有一个可视层神经元的偏置系数b和隐含层神经元的偏置系数c来表示其自身权重；RBM的能量函数表示为：

表示该网络的模型系数，表示第i个可视层神经元与第j个隐含层神经元之间的连接权值，h_j表示第j个隐含层的神经元，v_i表示第i个可视层的神经元，d_x表示可视层神经元的数目，d_h表示隐含层神经元的数目；可视层与隐含层的联合概率分布得到可视层v的独立分布为：

式中d_v和d_h表示可视层与隐含层神经元的数量；第j个隐含层神经元h_j被激活的概率和第i个可视层神经元v_i被激活概率分别为：

式中，σ设定为Sigmoid函数，根据概率密度独立性，可得到下式：

RBM根据计算每个隐含层神经元的开启概率P(h_j|x),j＝1,2,…,d_h，取一个0-1的随机数μ作为阈值，隐含层每个神经元激活状态如下(可视层同理)：

RBM共有五个参数：v是输入向量，h是输出向量，W^vh和b、c，也就是相应的权重和偏置值，是通过学习得到的；对于一个样本数据x，采用对比散度算法CD对其进行训练：

(1)将x赋给可视层v₁，利用计算出隐含层中每个神经元被激活的概率P(h₁|v₁)；

(2)从计算的概率分布中采取Gibbs抽样抽取一个样本h₁～P(h₁|v₁)；

(3)用h₁重构可视层，即通过隐含层反推可视层，利用式计算可视层中每个神经元被激活的概率P(v₂|h₁)；

(4)同样地，由得到的概率分布中采取Gibbs抽样抽取一个样本v₂～P(v₂|h₁)；

(5)通过v₂再次计算隐含层中每个神经元被激活的概率，得到概率分布P(h₂|v₂)；

(6)更新权重：W^vh←W^vh+λ(P(h₁|v₁)v₁-P(h₂|v₂)v₂)、b←b+λ(v₁-v₂)和c←c+λ(h₁-h₂)。

在这个训练阶段，在可视层会产生一个向量v，通过它将值传递到隐含层；反过来，可视层的输入会被随机的选择，以尝试去重构原始的输入信号；最后，这些新的可视的神经元激活单元将前向传递重构隐含层激活单元，获得h；这些后退和前进的步骤就是Gibbs采样，而隐含层激活单元和可视层输入之间的相关性差别就作为权值更新的主要依据；

给定一组N个训练数据{x₁,x₂,…,x_N}，则范数约束玻尔兹曼机的广义最优化问题可以描述为：

其中表示第n个样本x_n在可视层和隐含层的联合概率分布，p[h_nj|x_n]表示当输入层为第n个样本x_n时，隐含层第j个神经元被激活的概率：

其中f(p[h_nj|x_n])是关于p[h_nj|x_n]的函数，并且p[h_nj|x_n]是表征样本x_n对应的所有隐含层概率密度组成的向量，p[h_nj|x_n]＝{p(h_n1|x_l),p(h_n2|x_n),…,p(h_nF|x_n)}；其中的右边一项用范数的形式表现为：

则三种范数正则项表示的梯度可以直接求导得出：

事实上，范数约束玻尔兹曼机的广义最优化问题右边的正则项，可以表示为n个不同范数的线性叠加：

λ_i表示不同范数的权重系数，表示不同的p范数，为了便于算法性能验证，这里p取0.5，1，2；

通过多轮训练可以得到最佳网络模型及其系数θ＝{W,b,c}还有每个训练样本对应的低维特征矢量h_n{n＝1,2,…,N}；

步骤3：基于softmax分类器的目标分类输出

对于训练集{(y₁,L₁),…,(y_N,L_N)}，y_n(i＝1,2,…,N)是训练样本数据x_n(n＝1,2,…,N)经过多层RBM训练提取的输出特征矢量h_n{n＝1,2,…,N}，数据的标签值是L_n∈{1,2,…,k}；其中k是样本的种类，取值3，10；假设输出函数h_W(y)形式如下：

其中，W₁,W₂,…,W_k是模型参数，是归一化因子，使得输出向量的所有元素之和即总概率为1。定义示性函数1{·}，若函数的输入表达式为真，则函数输出值为1，否则为0；即

引入示性函数得到Softmax的代价函数为

上述对数似然函数的第一项是不能用梯度下降法来更新参数的，通过添加一个权重衰减项来使代价函数满足凸函数的性质，得到最优化的解，这里λ＝10^-4；Softmax回归中将y分类为类别j的概率为：

用梯度下降法对损失函数进行求导进行优化，得到最优的目标输出函数h_W(y)；

。

有益效果

附图说明

图1深度置信网络的两层RBM结构；

图2基于导向重构与范数约束DBN的SAR目标识别算法流程；

图3实验源图像数据MSTAR集的三类目标图：(a)BMP-2的SAR图像；(b)BTR-70的SAR图像；(c)T-72的SAR图像；(d)BMP-2的光学图像；(e)BTR-70的光学图像；(f)T-72的光学图像。

具体实施方式

现结合实施例、附图对本发明作进一步描述：

步骤一：基于导向滤波器的两尺度图像重构

对目标识别来说，对原图像进行两尺度重构就是采用特征映射图的导向滤波器处理，以便突出不同类目标图像之间的细节差异性。其具体步骤如下：

对原图像I_n做拉普拉斯滤波得到高频图像H_n：

H_n＝I_n*L (1)

S_n＝|H_n|*g_r,σ (2)

式中，g是一个(2r+1)×(2r+1)高斯低通滤波器，σ是高斯低通滤波器的标准差，r和σ均为5。特征映射图对图像高频细节分量的显著性水平提供良好的表征。特征映射图的权重图如下：

N是输入图像的像素数，是第n幅输入图像像素数为k时的特征映射值。

加权图并对其进行归一化处理，其中r₁＝45；ε₁＝0.3；r₂＝7；ε₂＝10-⁶。

式中：是源图像的低频分量，是源图像的高频分量。G是(2r+1)×(2r+1)窗口的平滑滤波器，其中r＝15。

步骤二：基于加权范数约束深度置信网络的低维特征提取

DBN由若干层神经元构成，组成元素是受限玻尔兹曼机(Restricted BoltzmannMachines，RBM)。一个典型的网络结构如图1所示。

设X＝{x₁,x₂,…,x_N}代表训练样本数据，x_n(n＝1,2,…,N)是其中第n个训练样本数据，其是由原图像I_n作两尺度分解和重构后的图像做裁剪并扩展成一维矢量形成的，是一个列向量，N表示训练样本的总数。RBM将输入图像X由可视层V映射到隐层H。

在RBM中，任意两个相连的神经元之间的权值W^vh表示其连接强度，v表示可视层的随机变量，h表示隐含层的随机变量，每个神经元自身有一个可视层神经元的偏置系数b和隐含层神经元的偏置系数c来表示其自身权重。RBM的能量函数表示为：

θ＝{W^vh,b,c}表示该网络的模型系数，表示第i个可视层神经元与第j个隐含层神经元之间的连接权值，h_j表示第j个隐含层的神经元，v_i表示第i个可视层的神经元，d_x表示可视层神经元的数目，d_h表示隐含层神经元的数目。可视层与隐含层的联合概率分布得到可视层v的独立分布为：

式中d_v和d_h表示可视层与隐含层神经元的数量。第j个隐含层神经元h_j被激活的概率和第i个可视层神经元v_i被激活概率分别为：

RBM共有五个参数：v是输入向量，h是输出向量，W^vh和b、c，也就是相应的权重和偏置值，是通过学习得到的。对于一个样本数据x，采用对比散度算法(ContrastiveDivergence，CD)对其进行训练：

(7)将x赋给可视层v₁，利用计算出隐含层中每个神经元被激活的概率P(h₁|v₁)；

(8)从计算的概率分布中采取Gibbs抽样抽取一个样本h₁～P(h₁|v₁)；

(9)用h₁重构可视层，即通过隐含层反推可视层，利用式计算可视层中每个神经元被激活的概率P(v₂|h₁)；

(10)同样地，由得到的概率分布中采取Gibbs抽样抽取一个样本v₂～P(v₂|h₁)；

(11)通过v₂再次计算隐含层中每个神经元被激活的概率，得到概率分布P(h₂|v₂)；

(12)更新权重：W^vh←W^vh+λ(P(h₁|v₁)v₁-P(h₂|v₂)v₂)、b←b+λ(v₁-v₂)和c←c+λ(h₁-h₂)。

在这个训练阶段，在可视层会产生一个向量v，通过它将值传递到隐含层。反过来，可视层的输入会被随机的选择，以尝试去重构原始的输入信号。最后，这些新的可视的神经元激活单元将前向传递重构隐含层激活单元，获得h。这些后退和前进的步骤就是Gibbs采样，而隐含层激活单元和可视层输入之间的相关性差别就作为权值更新的主要依据。

其中f(p[h_nj|x_n])是关于p[h_nj|x_n]的函数，并且p[h_nj|x_n]是表征样本x_n对应的所有隐含层概率密度组成的向量，p[h_nj|x_n]＝{p(h_n1|x_l),p(h_n2|x_n),…,p(h_nF|x_n)}。其中的右边一项用范数的形式表现为：

则三种范数正则项表示的梯度可以直接求导得出：

λ_i表示不同范数的权重系数，||x||_pi表示不同的p范数，为了便于算法性能验证，这里p取0.5，1，2。

通过多轮训练可以得到最佳网络模型及其系数θ＝{W,b,c}还有每个训练样本对应的低维特征矢量h_n{n＝1,2,…,N}。

步骤三：基于softmax分类器的目标分类输出

对于训练集{(y₁,L₁),…,(y_N,L_N)}，y_n(i＝1,2,…,N)是训练样本数据x_n(n＝1,2,…,N)经过多层RBM训练提取的输出特征矢量h_n{n＝1,2,…,N}，数据的标签值是L_n∈{1,2,…,k}。其中k是样本的种类，取值3，10。假设输出函数h_W(y)形式如下：

引入示性函数得到Softmax的代价函数为

上述对数似然函数的第一项是不能用梯度下降法来更新参数的，通过添加一个权重衰减项来使代价函数满足凸函数的性质，得到最优化的解，这里λ＝10^-4。Softmax回归中将y分类为类别j的概率为：

用梯度下降法对损失函数进行求导进行优化，得到最优的目标输出函数h_W(y)。

1.实验条件

实验环境为Intel(R)Core(TM)i5-3230M CPU@2.6GHz，内存为4GB，采用MATLABR2016a编程。实验数据采用美国国防高等研究计划署(DARPA)支持的MSTAR计划所公布的实测SAR地面静止目标数据。采集数据集的传感器为高分辨聚束式合成孔径雷达，分辨率为0.3×0.3。工作在X波段，所用的极化方式为HH极化方式。对采集到的数据进行处理，从中提取出128×128包含各类目标的数据集图像。实验在标准操作条件(Standard OperatingConditions，SOC)和扩展操作条件(Extended Operating Conditions，EOC)下进行测试。在SOC环境中，测试条件接近标准环境，在EOC环境中，测试条件接近实战环境。SOC环境下，仿真测试包含三类目标七个型号：BMP2步兵战车包括SN-9563、SN-9566和SN-C21，T72坦克包括SN-132、SN-812和SN-S7，BTR70装甲运输车包括SN-C71。同类不同型号配备上有差异，但总体散射特性相差不大。在EOC环境下，MSTAR混合目标数据中还包含其他的一组雷达工作在不同俯仰角的成像图片，分别为2S1(自行榴弹炮)、BRDM2(装甲侦察车)、BTR60(装甲运输车)、D7(推土机)、T62(坦克)、ZIL131(货运卡车)、ZSU234(自行高炮)、T72，用于算法鲁棒性和抗噪声性能的检测。

2.实验内容

本发明首先利用导向重构算法对训练样本集进行预处理，然后基于加权范数约束深度置信网络对SAR目标进行深层稀疏特征提取，最后连接一个Softmax分类器进行分类输出。基于导向重构与加权范数约束的SAR目标识别算法原理如图2所示。对于三类目标(BMP-2、T-72、BTR-70)及其不同型号数据训练和测试样本的类型和数量如表1。表2列出了15度，45度俯仰下不同配置的样本集，用于验证本算法的鲁棒性。导向滤波器重构的输入图像尺寸为128×128，重构预处理完成后，从128×128的训练集图像中心裁剪32×32或者64×64的图像块，将图像块向量化为1×1024或者1×4096的图像矢量，表三中五种网络结构的输入，随着自动降噪参数的变化，不同网络结构的识别性能如表3所示。

3.分类评价指标

聚类正确率(Accuracy，AC)和归一化互信息(Normalized Mutual Information，NMI)作为聚类结果的评价指标。给定一个样本数据x_i，r_i表示获得的聚类标签，s_i表示样本提供的标签，正确率定义如下：

其中n是样本的总数，map(r_i)是一个将每个聚类标签映射到等价标签的置换映射函数，最佳映射可以用Kuhn-Munkres算法。

归一化互信息是度量两张图片相似度的一种表达方式，值越大代表两张图片的相似性越高。通常用来作为图像配准中的评判准则或是目标函数。在两幅图像的灰度级数相似的情况下有良好的配准精度，较高的可靠性：

n_i是第i个聚类的尺寸，是第j个聚类的尺寸，n_ij表示聚类之间交叉的数量，k表示聚类的个数。

在SAR识别算法中，由于训练样本与测试样本的同一类目标有部分差异，归一化互信息高时只能说明训练结果与训练样本高度相似，会导致测试样本的识别精度有不同程度的下降，而且过拟合曲线同样说明归一化互信息无法作为评价识别结果的指标，因此采用AC作为评价SAR目标识别结果的指标。

4.仿真测试

导向滤波器重构的输入图像尺寸为128×128，重构预处理完成后，从128×128的训练集图像中心裁剪32×32或者64×64的图像块，将图像块向量化为处理为1×1024或者1×4096的图像矢量，作为表3中五种结构的输入。表3中五种结构分别为：

结构一：1024×98×3的三层前向神经网络，将dropout设置为0，权值动量因子为0.69。每一层(包含输出层)的输出激活函数均选用sigmoid函数，模型训练10次。

结构二：由两个1024×100和100×100的受限玻尔兹曼机组成。以均值为0，方差为0.05的高斯分布随机生成初始权值，0初始化所有的偏置，RBM和DBN的学习率设定为0.0045。dropout设置为0.5，权值动量因子为0.65。每一层(包含输出层)的输出激活函数均选用sigmoid函数模型训练25次。

结构三：由一个1024×98的受限玻尔兹曼机组成，以均值为0，方差为0.05的高斯分布随机生成初始权值，0初始化所有的偏置，RBM和DBN的学习率设定为0.0045，且范数约束系数取值为λ₁＝0,λ₂＝0,λ₃＝0.0045。dropout设置为0.5，权值动量因子为0.65。每一层(包含输出层)的输出激活函数均选用sigmoid函数，模型训练25次。

结构四：由一个1024×100的受限玻尔兹曼机组成，以均值为0，方差为0.01的高斯分布随机生成初始权值，0初始化所有的偏置，RBM和DBN的学习率设定为0.0045，且范数约束系数取值为λ₁＝0,λ₂＝0,λ₃＝0.0045。dropout设置为0.5，权值动量因子设置为0.65。每一层的激活函数均选用sigmoid函数，输出采用softmax分类器，模型训练25次。

结构五与结构四除了输入神经元网络结构不相同外，其他一样。

由表3可以得出，相同的网络结构下，相对于前项神经网络，深度置信网络的识别性能更好，提高了1.363％。采用堆叠玻尔兹曼机形成的深度置信网络，随着玻尔兹曼机层数及神经元的增加，数据样本少的情况下，过拟合的风险将大大增加，网络的泛化能力变差。设置合理的结构，导向重构算法对训练样本进行预处理，加权范数约束深度置信网络提取深层稀疏特征，Softmax分类器作为识别网络的输出层，可以提高网络的识别性能。

表4中，相似性约束DBN算法中对应的隐单元数目分别为1000，500和200；而每一层所使用的u向量的维度为500，500和200，最大迭代次数都设置为300次。初始网络的权值是由随机采样生成的均值为0，方差为0.01的高斯分布，而初始化所有可视层和隐含层偏置为0，学习率设定为0.002。DBN中的权衡参数设置为0.5。总体时间复杂度为O(698×1000+1000×500+500×200)，简化的复杂度为O(1000×500+500×200)。L_0.5范数约束DBN中层级识别系统的深度结构构建为两层，两个隐含层的节点数限定为300。DBN由RBM或稀疏受限玻尔兹曼机(Sparse Restricted Boltzmann Machine，SRBM)堆叠而成。对于RBM，其学习率取值为0.0045，对于DBN中的反向传播神经网络BPNN，其学习率设定为1。总体时间复杂度为O(4096×300+300×300)。本发明算法以均值为0，方差为0.01的高斯分布随机生成网络的初始连接权值，用0初始化所有的偏置，RBM和DBN的学习率设定为0.0045，且范数约束系数取值为λ₁＝0,λ₂＝0,λ₃＝0.0045，模型训练25次即可得到相对较好的输出结果。综合来看，本发明算法的识别性能更优。

表5中，SAR-HOG算子与本发明算法在测试样本为30度时比多流型低秩近似提取的特征用于识别算法时效果更好，Softmax作为分类器输出时比SVM、KNN、SRC、LCK-SVD算法分类性能更优，比SDDLSR对俯仰角发生变化时的鲁棒性更差，但是训练速度更快，识别效率更高。随着测试样本俯仰角从30度增加至45度，本发明算法的识别率降低了16.602％，比其他四种算法降低了18.71％，20.17％，20.03％，19.06％更好，比MLA+LSR的13.51％、HOG+SDDLSR的15.15％差一点。从运行时间来看，HOG+SDDLSR耗时最长，本发明算法耗时相对较短。

表1三类目标的训练数据和测试数据

表2扩展目标下三类目标的训练数据和测试数据

表3本发明中几种不同网络结构识别性能对比

表4不同文献识别算法的识别性能比较

表5俯仰角和配置发生变换时不同参考文献的识别性能

Claims

1.一种基于导向重构与范数约束DBN的SAR目标识别算法，其特征在于步骤如下：

步骤1：基于导向滤波器的两尺度图像重构

对原图像I_n做拉普拉斯滤波得到高频图像H_n：

H_n＝I_n*L (1)

S_n＝|H_n|*g_r,σ (2)

步骤2：基于加权范数约束深度置信网络的低维特征提取

θ＝{W^vh,b,c}表示该网络的模型系数，表示第i个可视层神经元与第j个隐含层神经元之间的连接权值，h_j表示第j个隐含层的神经元，v_i表示第i个可视层的神经元，d_x表示可视层神经元的数目，d_h表示隐含层神经元的数目；可视层与隐含层的联合概率分布得到可视层v的独立分布为：

则三种范数正则项表示的梯度可以直接求导得出：

步骤3：基于softmax分类器的目标分类输出

引入示性函数得到Softmax的代价函数为