CN112926361B

CN112926361B - 一种流形上的智能目标识别方法

Info

Publication number: CN112926361B
Application number: CN201911239107.0A
Authority: CN
Inventors: 史泽林; 向伟; 刘云鹏; 刘天赐; 邬抒航; 蓝德岩
Original assignee: Shenyang Institute of Automation of CAS
Current assignee: Shenyang Institute of Automation of CAS
Priority date: 2019-12-06
Filing date: 2019-12-06
Publication date: 2024-01-12
Anticipated expiration: 2039-12-06
Also published as: CN112926361A

Abstract

本发明公开了一种流形上的智能目标识别方法，方法流程包括：原始图像输入、流形特征建模、智能网络学习、网络更新优化、识别结果输出等五个部分。本发明首先利用协方差特征矩阵对原始图像进行流形特征建模，从而将提取的流形特征作为智能学习网络的输入；之后，基于黎曼流形理论与矩阵微分原理，对流形上的深度学习网络进行梯度模型推导，同时在模型训练过程中，使用基于矩阵链式法则的反向传播算法来更新模型，并将权值的优化过程转换为Grassmann流形上的优化问题，利用黎曼优化方法获得最优的参数值，最终学习到流形上的智能目标识别网络。本发明有效利用数据的几何结构，降低了计算复杂度，可以精确地、快速地识别目标，具有较高的识别准确率和学习效率。

Description

一种流形上的智能目标识别方法

技术领域

本发明涉及目标识别技术领域，特别提供了一种流形上的智能目标识别方法。

背景技术

成像目标识别是无人飞行器实现精确制导的关键核心技术。在目标识别过程中，不仅有光照条件、物体姿态、复杂背景等外部因素影响，还有目标本身成像中的几何变换和类内差异较小等内部因素影响。如何在复杂的环境因素下进行高效的识别一直是自动目标识别领域的一个重大难题。近年来，深度学习以其强大的学习能力在目标识别领域取得了优异表现，而针对目标识别领域中具有良好特性的流形结构数据，深度学习方法的优势则受到限制。现有的多数深度学习方法都是针对向量数据而设计，若直接将流形数据作为其输入，将无法同时发挥流形数据与深度学习方法的各自优势。

发明内容

鉴于此，本发明的目的在于提供一种流形上的智能目标识别方法，以解决无人飞行器在复杂环境下的目标识别问题。

本发明提供的技术方案是：一种流形上的智能目标识别方法，包括以下步骤：

1)对输入图像进行预处理，预处理后的多个图像构成图像集，建立图像集的协方差特征矩阵；

2)将协方差特征矩阵输入至智能学习网络进行训练，得到目标识别的分类；

3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数；

4)在反向传播阶段，使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数；

5)将待测图像输入更新参数后的智能学习网络，得到目标识别的分类。

所述建立图像集的协方差特征模型，包括以下步骤：

对于每个包含n张图片的图像集M_set＝{I₁,I₂,…,I_n}，提取图像集中每幅图像I_i对应的特征，构成特征向量i＝1,2,…,n，s_i代表第i幅图像的d维特征向量；/>表示图像集中所图像特征向量的均值，即/>那么每个图像集表示为d×d的协方差特征矩阵X：/>

所述将协方差特征矩阵输入至智能学习网络进行训练，得到目标识别的分类，包括以下步骤：

协方差特征矩阵X作为输入，即X为输入的高维流形，Y为学习到的新流形作为输出，则对于流形学习层，有：Y＝f(X)＝W^TXW，其中待学习的W为学习变换矩阵；

将流形学习层的输出Y作为流形转换层的输入，经过流形转换层输出为Q，即有f_QR(Y)＝YR^-1＝Q，其中f_QR(X)为Y的QR正交分解函数，输出Q为Y分解后得到的正交矩阵；

Q输入至欧氏映射层得到G，则有G＝f_pro(Q)＝QQ^T，其中f_pro(Q)为映射函数；将

G作为全连接层的输入，再经过softmax层进行分类。

所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数，包括以下步骤：

W^t+1＝Γ(W^t-λgrad_RL(W))

其中，W^t+1表示下一次更新的权值参数，W^t为当前第t次迭代的权值参数，Γ(·)表示拉回映射算子，λ表示学习速率，grad_RL(W)表示黎曼梯度，是流形学习层的代价函数L(W)关于W的欧氏梯度/>的正则成分；

根据矩阵链式法则求得相应的欧氏梯度的表达式为：

其中L(Y)表示流形转换层的代价函数；

将W^t+1带入步骤2)中的学习变换矩阵W，实现学习变换矩阵的更新。

所述在反向传播阶段，使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数，包括以下步骤：

对于流形学习层，参数更新的公式为：

上式中X为流形学习层的输入，Y为流形学习层的输出；L(W)表示流形学习层的代价函数，L(Y)表示流形转换层的代价函数；

将与步骤2)中的学习变换矩阵W叠加后作为新的W，用于替换上次迭代的W，实现学习变换矩阵的更新；

对于流形转换层，参数更新的公式为：

上式中A_btril＝A_tril-(A)^T _tril，A_tril表示将矩阵A的所有上三角阵元素设为0；L_pro为流形映射层的代价函数；E为单位矩阵；

将与步骤2)中的流形学习层的输出Y叠加后作为新的Y，用于替换上次迭代的Y，实现流形学习层的输出更新。

本发明提供的一种流形上的智能目标识别方法，有益效果如下：基于数据的流形几何结构来设计深度学习网络，将微分几何理论与深度学习理论相结合，提出一种基于流形的深度图像集识别网络。同时在模型训练过程中，使用基于矩阵链式法则的反向传播算法来更新模型，并将权值的优化过程转换为Grassmann流形上的优化问题，此发明有效利用数据的几何结构，降低了计算复杂度，不仅在识别准确率上有所提高，同时在训练和测试速度上也有大幅度提升。

附图说明

下面结合附图及实施方式对本发明作进一步详细的说明：

图1为本发明提供的一种流形上的智能目标识别方法流程示意图；

图2为本发明提供的一种流形上的智能目标识别方法中图像集识别结果示意图。

具体实施方式

下面将结合具体的实施方案对本发明进行进一步的解释，但并不局限本发明。

一种流形上的智能目标识别方法，包括：

步骤一：输入原始图像。

步骤二，对输入的原始图像进行特征提取，并构建协方差特征矩阵，实现流形特征建模。

步骤三，基于数据的流形几何结构来设计深度学习网络。

步骤四，推导流形上的深度学习网络的梯度模型。

步骤五，使用基于矩阵链式法则的反向传播算法更新网络参数。

步骤六，输出识别结果。

所述步骤二对输入的原始图像进行特征提取，并构建协方差特征矩阵，实现流形特征建模中包括如下步骤：

步骤2-1，提取每幅图像对应的特征，构成特征向量s_i代表第i幅图像样本的d维特征向量。

步骤2-2，构建每个图像集中所有图像的特征向量矩阵，并计算图像集中所有矩阵特征向量的平均值。

步骤2-3，构建每个图像集的协方差特征矩阵。

所述步骤三中包括基于数据的流形几何结构来设计深度学习网络。针对图像的流形结构，设计智能学习网络的各种操作层来实现流形学习、欧氏映射、智能分类等功能。

所述步骤四包括推导流形上的深度学习网络的梯度模型。在流形学习层中，为了学习到几何结构更好的流形数据，需要在优化的过程中保持数据的流形结构，因此需要在流形空间中进行参数优化过程。在参数优化时，使用黎曼优化方法在流形空间进行求解，首先推导黎曼流形上的梯度下降模型，然后使用黎曼梯度下降方法在参数空间中搜索待求参数的最优解。

所述步骤五包括使用基于矩阵链式法则的反向传播算法更新网络参数。由于向量的反向传播算法不再使用于流形结构数据，首先在智能学习网络的前向传播阶段，计算模型的参数传播公式；在网络的反向传播阶段，利用矩阵链式法则，使用矩阵的反向传播算法来更新网络参数。

如图1所示，本发明提供了一种流形上的智能目标识别方法，包括如下步骤：

步骤一：输入图像，并对输入图像进行预处理。实际中，为了降低图像中的光照影响，通常对图像进行归一化操作。

步骤二，建立图像集的协方差特征模型。对于每个包含n张图片的图像集M_set＝{I₁,I₂,…,I_n}，提取图像集中每幅图像I_i(其中i＝1,2,…,n)对应的特征，构成特征向量s_i代表第i幅图像样本的d维特征向量。若/>表示图像集中所所有图像特征向量的均值，即/>那么每个图像集可以表示为d×d的协方差特征矩阵X：

步骤三，基于数据的流形几何结构，设计流形上的智能学习网络。首先提出流形学习层，该层以步骤二中计算得到的协方差特征矩阵X作为输入，即X为输入的高维流形，Y为学习到的新流形作为输出，则对于流形学习层，有：Y＝f(X)＝W^TXW，其中待学习的W为学习变换矩阵。之后，提出流形转换层，流形转换层紧接在流形学习层后面。对于流形转换层而言，在经过数次的流形学习层后，将上层的输出Y作为本层的输入经过流形转换层，此时本层的输出为Q，即有f_QR(Y)＝YR^-1＝Q，其中f_QR(X)为Y的QR正交分解函数，输出Q为Y分解后得到的正交矩阵。接下来提出欧氏映射层，欧氏映射层紧接在流形转换层后面。对于欧氏映射层而言，此时的输入为Q，输出为G，则有G＝f_pro(Q)＝QQ^T，其中f_pro(Q)为此层的映射函数。最后将G作为全连接层的输入，再经过softmax层进行分类。

步骤四，基于黎曼优化方法推导流形上的深度学习网络的梯度模型。针对输入数据为协方差特征矩阵，采用黎曼梯度下降方法，对参数赋予正交几何结构，将求解的参数空间优化为Grassmann流形空间。我们将使用Grassmann流形上的随机梯度下降法来更新转换层中的权值参数。具体地，对于流形学习层的代价函数L(W)，其黎曼梯度grad_RL(W)的计算，我们可以由以下公式得到：

其中是L(W)是关于W的欧氏梯度，L(W)是由softmax层的代价函数复合至流形学习层的代价函数，E为单位矩阵。

此时，L(W)具体的表达式为

其中，L为softmax层的代价函数，f表示f(X)。

该层在黎曼流形上的权值更新公式为：

W^t+1＝Γ(W^t-λgrad_RL(W))

其中W^t的当前的权值参数，Γ(·)表示拉回映射算子，λ表示学习速率，是目标函数的欧氏梯度/>的正则成分。

根据矩阵链式法则可以求得，相应的欧氏梯度的表达式为：

其中，L(Y)为流形转换层的代价函数，其具体的表达式为：

步骤五，在反向传播阶段，使用基于矩阵链式法则的反向传播算法更新网络参数。

对于流形学习层，参数更新的公式为：

上式中X为流形学习层的输入，Y为流形学习层的输出。

对于流形转换层，参数更新的公式为：

上式中A_btril＝A_tril-(A)^T _tril，A_tril表示将矩阵A的所有上三角阵元素设为0。其中，L_pro表示流形映射层的代价函数，其具体的表达式为：

本发明提出的流形上的智能目标识别方法所使用的样本库示意图如图2所示,整体识别准确率为92.5％。

其中识别准确率定义：上面结合附图对本发明的实施方式做了详细说明，但是本发明并不限于上述实施方式，在本领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种流形上的智能目标识别方法，其特征在于包括以下步骤：

5)将待测图像输入更新参数后的智能学习网络，得到目标识别的分类；

所述建立图像集的协方差特征模型，包括以下步骤：

对于每个包含n张图片的图像集M_set＝{I₁,I₂,…,I_n}，提取图像集中每幅图像I_i对应的特征，构成特征向量s_i代表第i幅图像的d维特征向量；/>表示图像集中所图像特征向量的均值，即/>那么每个图像集表示为d×d的协方差特征矩阵X：

Q输入至欧氏映射层得到G，则有G＝f_pro(Q)＝QQ^T，其中f_pro(Q)为映射函数；

将G作为全连接层的输入，再经过softmax层进行分类；

grad_RL(W)＝▽_WL(W)-▽_WL(W)WW^T

W^t+1＝Γ(W^t-λgrad_RL(W))

其中，W^t+1表示下一次更新的权值参数，W^t为当前第t次迭代的权值参数，Γ(·)表示拉回映射算子，λ表示学习速率，grad_RL(W)表示黎曼梯度，▽_WL(W)WW^T是流形学习层的代价函数L(W)关于W的欧氏梯度▽_WL(W)的正则成分；

根据矩阵链式法则求得相应的欧氏梯度▽_WL(W)的表达式为：

其中L(Y)表示流形转换层的代价函数；

2.根据权利要求1所述的一种流形上的智能目标识别方法，其特征在于，所述在反向传播阶段，使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数，包括以下步骤：

对于流形学习层，参数更新的公式为：

对于流形转换层，参数更新的公式为：