CN112926361B - 一种流形上的智能目标识别方法 - Google Patents

一种流形上的智能目标识别方法 Download PDF

Info

Publication number
CN112926361B
CN112926361B CN201911239107.0A CN201911239107A CN112926361B CN 112926361 B CN112926361 B CN 112926361B CN 201911239107 A CN201911239107 A CN 201911239107A CN 112926361 B CN112926361 B CN 112926361B
Authority
CN
China
Prior art keywords
manifold
learning
matrix
layer
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911239107.0A
Other languages
English (en)
Other versions
CN112926361A (zh
Inventor
史泽林
向伟
刘云鹏
刘天赐
邬抒航
蓝德岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Institute of Automation of CAS
Original Assignee
Shenyang Institute of Automation of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Institute of Automation of CAS filed Critical Shenyang Institute of Automation of CAS
Priority to CN201911239107.0A priority Critical patent/CN112926361B/zh
Publication of CN112926361A publication Critical patent/CN112926361A/zh
Application granted granted Critical
Publication of CN112926361B publication Critical patent/CN112926361B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种流形上的智能目标识别方法,方法流程包括:原始图像输入、流形特征建模、智能网络学习、网络更新优化、识别结果输出等五个部分。本发明首先利用协方差特征矩阵对原始图像进行流形特征建模,从而将提取的流形特征作为智能学习网络的输入;之后,基于黎曼流形理论与矩阵微分原理,对流形上的深度学习网络进行梯度模型推导,同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,利用黎曼优化方法获得最优的参数值,最终学习到流形上的智能目标识别网络。本发明有效利用数据的几何结构,降低了计算复杂度,可以精确地、快速地识别目标,具有较高的识别准确率和学习效率。

Description

一种流形上的智能目标识别方法
技术领域
本发明涉及目标识别技术领域,特别提供了一种流形上的智能目标识别方法。
背景技术
成像目标识别是无人飞行器实现精确制导的关键核心技术。在目标识别过程中,不仅有光照条件、物体姿态、复杂背景等外部因素影响,还有目标本身成像中的几何变换和类内差异较小等内部因素影响。如何在复杂的环境因素下进行高效的识别一直是自动目标识别领域的一个重大难题。近年来,深度学习以其强大的学习能力在目标识别领域取得了优异表现,而针对目标识别领域中具有良好特性的流形结构数据,深度学习方法的优势则受到限制。现有的多数深度学习方法都是针对向量数据而设计,若直接将流形数据作为其输入,将无法同时发挥流形数据与深度学习方法的各自优势。
发明内容
鉴于此,本发明的目的在于提供一种流形上的智能目标识别方法,以解决无人飞行器在复杂环境下的目标识别问题。
本发明提供的技术方案是:一种流形上的智能目标识别方法,包括以下步骤:
1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;
2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;
3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;
5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类。
所述建立图像集的协方差特征模型,包括以下步骤:
对于每个包含n张图片的图像集Mset={I1,I2,…,In},提取图像集中每幅图像Ii对应的特征,构成特征向量i=1,2,…,n,si代表第i幅图像的d维特征向量;/>表示图像集中所图像特征向量的均值,即/>那么每个图像集表示为d×d的协方差特征矩阵X:/>
所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:
协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=WTXW,其中待学习的W为学习变换矩阵;
将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;
Q输入至欧氏映射层得到G,则有G=fpro(Q)=QQT,其中fpro(Q)为映射函数;将
G作为全连接层的输入,再经过softmax层进行分类。
所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数,包括以下步骤:
Wt+1=Γ(Wt-λgradRL(W))
其中,Wt+1表示下一次更新的权值参数,Wt为当前第t次迭代的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,gradRL(W)表示黎曼梯度,是流形学习层的代价函数L(W)关于W的欧氏梯度/>的正则成分;
根据矩阵链式法则求得相应的欧氏梯度的表达式为:
其中L(Y)表示流形转换层的代价函数;
将Wt+1带入步骤2)中的学习变换矩阵W,实现学习变换矩阵的更新。
所述在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数,包括以下步骤:
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出;L(W)表示流形学习层的代价函数,L(Y)表示流形转换层的代价函数;
与步骤2)中的学习变换矩阵W叠加后作为新的W,用于替换上次迭代的W,实现学习变换矩阵的更新;
对于流形转换层,参数更新的公式为:
上式中Abtril=Atril-(A)T tril,Atril表示将矩阵A的所有上三角阵元素设为0;Lpro为流形映射层的代价函数;E为单位矩阵;
与步骤2)中的流形学习层的输出Y叠加后作为新的Y,用于替换上次迭代的Y,实现流形学习层的输出更新。
本发明提供的一种流形上的智能目标识别方法,有益效果如下:基于数据的流形几何结构来设计深度学习网络,将微分几何理论与深度学习理论相结合,提出一种基于流形的深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,此发明有效利用数据的几何结构,降低了计算复杂度,不仅在识别准确率上有所提高,同时在训练和测试速度上也有大幅度提升。
附图说明
下面结合附图及实施方式对本发明作进一步详细的说明:
图1为本发明提供的一种流形上的智能目标识别方法流程示意图;
图2为本发明提供的一种流形上的智能目标识别方法中图像集识别结果示意图。
具体实施方式
下面将结合具体的实施方案对本发明进行进一步的解释,但并不局限本发明。
一种流形上的智能目标识别方法,包括:
步骤一:输入原始图像。
步骤二,对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模。
步骤三,基于数据的流形几何结构来设计深度学习网络。
步骤四,推导流形上的深度学习网络的梯度模型。
步骤五,使用基于矩阵链式法则的反向传播算法更新网络参数。
步骤六,输出识别结果。
所述步骤二对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模中包括如下步骤:
步骤2-1,提取每幅图像对应的特征,构成特征向量si代表第i幅图像样本的d维特征向量。
步骤2-2,构建每个图像集中所有图像的特征向量矩阵,并计算图像集中所有矩阵特征向量的平均值。
步骤2-3,构建每个图像集的协方差特征矩阵。
所述步骤三中包括基于数据的流形几何结构来设计深度学习网络。针对图像的流形结构,设计智能学习网络的各种操作层来实现流形学习、欧氏映射、智能分类等功能。
所述步骤四包括推导流形上的深度学习网络的梯度模型。在流形学习层中,为了学习到几何结构更好的流形数据,需要在优化的过程中保持数据的流形结构,因此需要在流形空间中进行参数优化过程。在参数优化时,使用黎曼优化方法在流形空间进行求解,首先推导黎曼流形上的梯度下降模型,然后使用黎曼梯度下降方法在参数空间中搜索待求参数的最优解。
所述步骤五包括使用基于矩阵链式法则的反向传播算法更新网络参数。由于向量的反向传播算法不再使用于流形结构数据,首先在智能学习网络的前向传播阶段,计算模型的参数传播公式;在网络的反向传播阶段,利用矩阵链式法则,使用矩阵的反向传播算法来更新网络参数。
如图1所示,本发明提供了一种流形上的智能目标识别方法,包括如下步骤:
步骤一:输入图像,并对输入图像进行预处理。实际中,为了降低图像中的光照影响,通常对图像进行归一化操作。
步骤二,建立图像集的协方差特征模型。对于每个包含n张图片的图像集Mset={I1,I2,…,In},提取图像集中每幅图像Ii(其中i=1,2,…,n)对应的特征,构成特征向量si代表第i幅图像样本的d维特征向量。若/>表示图像集中所所有图像特征向量的均值,即/>那么每个图像集可以表示为d×d的协方差特征矩阵X:
步骤三,基于数据的流形几何结构,设计流形上的智能学习网络。首先提出流形学习层,该层以步骤二中计算得到的协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=WTXW,其中待学习的W为学习变换矩阵。之后,提出流形转换层,流形转换层紧接在流形学习层后面。对于流形转换层而言,在经过数次的流形学习层后,将上层的输出Y作为本层的输入经过流形转换层,此时本层的输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵。接下来提出欧氏映射层,欧氏映射层紧接在流形转换层后面。对于欧氏映射层而言,此时的输入为Q,输出为G,则有G=fpro(Q)=QQT,其中fpro(Q)为此层的映射函数。最后将G作为全连接层的输入,再经过softmax层进行分类。
步骤四,基于黎曼优化方法推导流形上的深度学习网络的梯度模型。针对输入数据为协方差特征矩阵,采用黎曼梯度下降方法,对参数赋予正交几何结构,将求解的参数空间优化为Grassmann流形空间。我们将使用Grassmann流形上的随机梯度下降法来更新转换层中的权值参数。具体地,对于流形学习层的代价函数L(W),其黎曼梯度gradRL(W)的计算,我们可以由以下公式得到:
其中是L(W)是关于W的欧氏梯度,L(W)是由softmax层的代价函数复合至流形学习层的代价函数,E为单位矩阵。
此时,L(W)具体的表达式为
其中,L为softmax层的代价函数,f表示f(X)。
该层在黎曼流形上的权值更新公式为:
Wt+1=Γ(Wt-λgradRL(W))
其中Wt的当前的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,是目标函数的欧氏梯度/>的正则成分。
根据矩阵链式法则可以求得,相应的欧氏梯度的表达式为:
其中,L(Y)为流形转换层的代价函数,其具体的表达式为:
步骤五,在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新网络参数。
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出。
对于流形转换层,参数更新的公式为:
上式中Abtril=Atril-(A)T tril,Atril表示将矩阵A的所有上三角阵元素设为0。其中,Lpro表示流形映射层的代价函数,其具体的表达式为:
本发明提出的流形上的智能目标识别方法所使用的样本库示意图如图2所示,整体识别准确率为92.5%。
其中识别准确率定义:上面结合附图对本发明的实施方式做了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (2)

1.一种流形上的智能目标识别方法,其特征在于包括以下步骤:
1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;
2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;
3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;
5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类;
所述建立图像集的协方差特征模型,包括以下步骤:
对于每个包含n张图片的图像集Mset={I1,I2,…,In},提取图像集中每幅图像Ii对应的特征,构成特征向量si代表第i幅图像的d维特征向量;/>表示图像集中所图像特征向量的均值,即/>那么每个图像集表示为d×d的协方差特征矩阵X:
所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:
协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=WTXW,其中待学习的W为学习变换矩阵;
将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;
Q输入至欧氏映射层得到G,则有G=fpro(Q)=QQT,其中fpro(Q)为映射函数;
将G作为全连接层的输入,再经过softmax层进行分类;
所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数,包括以下步骤:
gradRL(W)=▽WL(W)-▽WL(W)WWT
Wt+1=Γ(Wt-λgradRL(W))
其中,Wt+1表示下一次更新的权值参数,Wt为当前第t次迭代的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,gradRL(W)表示黎曼梯度,▽WL(W)WWT是流形学习层的代价函数L(W)关于W的欧氏梯度▽WL(W)的正则成分;
根据矩阵链式法则求得相应的欧氏梯度▽WL(W)的表达式为:
其中L(Y)表示流形转换层的代价函数;
将Wt+1带入步骤2)中的学习变换矩阵W,实现学习变换矩阵的更新。
2.根据权利要求1所述的一种流形上的智能目标识别方法,其特征在于,所述在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数,包括以下步骤:
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出;L(W)表示流形学习层的代价函数,L(Y)表示流形转换层的代价函数;
与步骤2)中的学习变换矩阵W叠加后作为新的W,用于替换上次迭代的W,实现学习变换矩阵的更新;
对于流形转换层,参数更新的公式为:
上式中Abtril=Atril-(A)T tril,Atril表示将矩阵A的所有上三角阵元素设为0;Lpro为流形映射层的代价函数;E为单位矩阵;
与步骤2)中的流形学习层的输出Y叠加后作为新的Y,用于替换上次迭代的Y,实现流形学习层的输出更新。
CN201911239107.0A 2019-12-06 2019-12-06 一种流形上的智能目标识别方法 Active CN112926361B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911239107.0A CN112926361B (zh) 2019-12-06 2019-12-06 一种流形上的智能目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911239107.0A CN112926361B (zh) 2019-12-06 2019-12-06 一种流形上的智能目标识别方法

Publications (2)

Publication Number Publication Date
CN112926361A CN112926361A (zh) 2021-06-08
CN112926361B true CN112926361B (zh) 2024-01-12

Family

ID=76162299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911239107.0A Active CN112926361B (zh) 2019-12-06 2019-12-06 一种流形上的智能目标识别方法

Country Status (1)

Country Link
CN (1) CN112926361B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334849A (zh) * 2018-01-31 2018-07-27 中山大学 一种基于黎曼流形的行人重识别方法
CN109615005A (zh) * 2018-12-10 2019-04-12 广东技术师范学院 基于流形深度学习和极限学习机的图像集分类系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108334849A (zh) * 2018-01-31 2018-07-27 中山大学 一种基于黎曼流形的行人重识别方法
CN109615005A (zh) * 2018-12-10 2019-04-12 广东技术师范学院 基于流形深度学习和极限学习机的图像集分类系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于Grassmann 流形几何深度网络的图像集识别方法;刘天赐;《红外与激光工程》;第47卷(第7期);第1-6页 *
流形学习及其在图像集分类中的应用研究;王锐;《中国优秀硕士学位论文全文数据库-信息科技辑》;第10-48页 *

Also Published As

Publication number Publication date
CN112926361A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
CN111489358B (zh) 一种基于深度学习的三维点云语义分割方法
CN108038445B (zh) 一种基于多视角深度学习框架的sar自动目标识别方法
CN108830296B (zh) 一种改进的基于深度学习的高分遥感影像分类方法
CN109934282B (zh) 一种基于sagan样本扩充和辅助信息的sar目标分类方法
WO2019100723A1 (zh) 训练多标签分类模型的方法和装置
CN110110599B (zh) 一种基于多尺度特征融合的遥感图像目标检测方法
CN113033520B (zh) 一种基于深度学习的树木线虫病害木识别方法及系统
CN110728192A (zh) 一种基于新型特征金字塔深度网络的高分遥感图像分类方法
CN109063649B (zh) 基于孪生行人对齐残差网络的行人重识别方法
US20230260255A1 (en) Three-dimensional object detection framework based on multi-source data knowledge transfer
US11941865B2 (en) Hyperspectral image classification method based on context-rich networks
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN107423747A (zh) 一种基于深度卷积网络的显著性目标检测方法
CN110705591A (zh) 一种基于最优子空间学习的异构迁移学习方法
CN102867192B (zh) 一种基于监督测地线传播的场景语义迁移方法
CN111881716A (zh) 一种基于多视角生成对抗网络的行人重识别方法
CN111400572A (zh) 一种基于卷积神经网络实现图像特征识别的内容安全监测系统及其方法
CN114241226A (zh) 一种基于混合模型多邻域特征的三维点云语义分割方法
CN113313176A (zh) 一种基于动态图卷积神经网络的点云分析方法
CN110334584A (zh) 一种基于区域全卷积网络的手势识别方法
CN117252928B (zh) 用于电子产品模块化智能组装的视觉图像定位系统
CN112926361B (zh) 一种流形上的智能目标识别方法
CN114898464B (zh) 一种基于机器视觉的轻量化精准手指语智能算法识别方法
CN111241326A (zh) 基于注意力金字塔图网络的图像视觉关系指代定位方法
CN111274893B (zh) 基于部件分割与特征融合的飞行器图像细粒度识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant