CN112926361B - 一种流形上的智能目标识别方法 - Google Patents
一种流形上的智能目标识别方法 Download PDFInfo
- Publication number
- CN112926361B CN112926361B CN201911239107.0A CN201911239107A CN112926361B CN 112926361 B CN112926361 B CN 112926361B CN 201911239107 A CN201911239107 A CN 201911239107A CN 112926361 B CN112926361 B CN 112926361B
- Authority
- CN
- China
- Prior art keywords
- manifold
- learning
- matrix
- layer
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000011159 matrix material Substances 0.000 claims abstract description 55
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 12
- 101150046432 Tril gene Proteins 0.000 claims description 9
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 244000208734 Pisonia aculeata Species 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 12
- 238000005457 optimization Methods 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 2
- 238000009795 derivation Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Astronomy & Astrophysics (AREA)
- Multimedia (AREA)
- Remote Sensing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种流形上的智能目标识别方法,方法流程包括:原始图像输入、流形特征建模、智能网络学习、网络更新优化、识别结果输出等五个部分。本发明首先利用协方差特征矩阵对原始图像进行流形特征建模,从而将提取的流形特征作为智能学习网络的输入;之后,基于黎曼流形理论与矩阵微分原理,对流形上的深度学习网络进行梯度模型推导,同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,利用黎曼优化方法获得最优的参数值,最终学习到流形上的智能目标识别网络。本发明有效利用数据的几何结构,降低了计算复杂度,可以精确地、快速地识别目标,具有较高的识别准确率和学习效率。
Description
技术领域
本发明涉及目标识别技术领域,特别提供了一种流形上的智能目标识别方法。
背景技术
成像目标识别是无人飞行器实现精确制导的关键核心技术。在目标识别过程中,不仅有光照条件、物体姿态、复杂背景等外部因素影响,还有目标本身成像中的几何变换和类内差异较小等内部因素影响。如何在复杂的环境因素下进行高效的识别一直是自动目标识别领域的一个重大难题。近年来,深度学习以其强大的学习能力在目标识别领域取得了优异表现,而针对目标识别领域中具有良好特性的流形结构数据,深度学习方法的优势则受到限制。现有的多数深度学习方法都是针对向量数据而设计,若直接将流形数据作为其输入,将无法同时发挥流形数据与深度学习方法的各自优势。
发明内容
鉴于此,本发明的目的在于提供一种流形上的智能目标识别方法,以解决无人飞行器在复杂环境下的目标识别问题。
本发明提供的技术方案是:一种流形上的智能目标识别方法,包括以下步骤:
1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;
2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;
3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;
5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类。
所述建立图像集的协方差特征模型,包括以下步骤:
对于每个包含n张图片的图像集Mset={I1,I2,…,In},提取图像集中每幅图像Ii对应的特征,构成特征向量i=1,2,…,n,si代表第i幅图像的d维特征向量;/>表示图像集中所图像特征向量的均值,即/>那么每个图像集表示为d×d的协方差特征矩阵X:/>
所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:
协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=WTXW,其中待学习的W为学习变换矩阵;
将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;
Q输入至欧氏映射层得到G,则有G=fpro(Q)=QQT,其中fpro(Q)为映射函数;将
G作为全连接层的输入,再经过softmax层进行分类。
所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数,包括以下步骤:
Wt+1=Γ(Wt-λgradRL(W))
其中,Wt+1表示下一次更新的权值参数,Wt为当前第t次迭代的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,gradRL(W)表示黎曼梯度,是流形学习层的代价函数L(W)关于W的欧氏梯度/>的正则成分;
根据矩阵链式法则求得相应的欧氏梯度的表达式为:
其中L(Y)表示流形转换层的代价函数;
将Wt+1带入步骤2)中的学习变换矩阵W,实现学习变换矩阵的更新。
所述在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数,包括以下步骤:
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出;L(W)表示流形学习层的代价函数,L(Y)表示流形转换层的代价函数;
将与步骤2)中的学习变换矩阵W叠加后作为新的W,用于替换上次迭代的W,实现学习变换矩阵的更新;
对于流形转换层,参数更新的公式为:
上式中Abtril=Atril-(A)T tril,Atril表示将矩阵A的所有上三角阵元素设为0;Lpro为流形映射层的代价函数;E为单位矩阵;
将与步骤2)中的流形学习层的输出Y叠加后作为新的Y,用于替换上次迭代的Y,实现流形学习层的输出更新。
本发明提供的一种流形上的智能目标识别方法,有益效果如下:基于数据的流形几何结构来设计深度学习网络,将微分几何理论与深度学习理论相结合,提出一种基于流形的深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,此发明有效利用数据的几何结构,降低了计算复杂度,不仅在识别准确率上有所提高,同时在训练和测试速度上也有大幅度提升。
附图说明
下面结合附图及实施方式对本发明作进一步详细的说明:
图1为本发明提供的一种流形上的智能目标识别方法流程示意图;
图2为本发明提供的一种流形上的智能目标识别方法中图像集识别结果示意图。
具体实施方式
下面将结合具体的实施方案对本发明进行进一步的解释,但并不局限本发明。
一种流形上的智能目标识别方法,包括:
步骤一:输入原始图像。
步骤二,对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模。
步骤三,基于数据的流形几何结构来设计深度学习网络。
步骤四,推导流形上的深度学习网络的梯度模型。
步骤五,使用基于矩阵链式法则的反向传播算法更新网络参数。
步骤六,输出识别结果。
所述步骤二对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模中包括如下步骤:
步骤2-1,提取每幅图像对应的特征,构成特征向量si代表第i幅图像样本的d维特征向量。
步骤2-2,构建每个图像集中所有图像的特征向量矩阵,并计算图像集中所有矩阵特征向量的平均值。
步骤2-3,构建每个图像集的协方差特征矩阵。
所述步骤三中包括基于数据的流形几何结构来设计深度学习网络。针对图像的流形结构,设计智能学习网络的各种操作层来实现流形学习、欧氏映射、智能分类等功能。
所述步骤四包括推导流形上的深度学习网络的梯度模型。在流形学习层中,为了学习到几何结构更好的流形数据,需要在优化的过程中保持数据的流形结构,因此需要在流形空间中进行参数优化过程。在参数优化时,使用黎曼优化方法在流形空间进行求解,首先推导黎曼流形上的梯度下降模型,然后使用黎曼梯度下降方法在参数空间中搜索待求参数的最优解。
所述步骤五包括使用基于矩阵链式法则的反向传播算法更新网络参数。由于向量的反向传播算法不再使用于流形结构数据,首先在智能学习网络的前向传播阶段,计算模型的参数传播公式;在网络的反向传播阶段,利用矩阵链式法则,使用矩阵的反向传播算法来更新网络参数。
如图1所示,本发明提供了一种流形上的智能目标识别方法,包括如下步骤:
步骤一:输入图像,并对输入图像进行预处理。实际中,为了降低图像中的光照影响,通常对图像进行归一化操作。
步骤二,建立图像集的协方差特征模型。对于每个包含n张图片的图像集Mset={I1,I2,…,In},提取图像集中每幅图像Ii(其中i=1,2,…,n)对应的特征,构成特征向量si代表第i幅图像样本的d维特征向量。若/>表示图像集中所所有图像特征向量的均值,即/>那么每个图像集可以表示为d×d的协方差特征矩阵X:
步骤三,基于数据的流形几何结构,设计流形上的智能学习网络。首先提出流形学习层,该层以步骤二中计算得到的协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=WTXW,其中待学习的W为学习变换矩阵。之后,提出流形转换层,流形转换层紧接在流形学习层后面。对于流形转换层而言,在经过数次的流形学习层后,将上层的输出Y作为本层的输入经过流形转换层,此时本层的输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵。接下来提出欧氏映射层,欧氏映射层紧接在流形转换层后面。对于欧氏映射层而言,此时的输入为Q,输出为G,则有G=fpro(Q)=QQT,其中fpro(Q)为此层的映射函数。最后将G作为全连接层的输入,再经过softmax层进行分类。
步骤四,基于黎曼优化方法推导流形上的深度学习网络的梯度模型。针对输入数据为协方差特征矩阵,采用黎曼梯度下降方法,对参数赋予正交几何结构,将求解的参数空间优化为Grassmann流形空间。我们将使用Grassmann流形上的随机梯度下降法来更新转换层中的权值参数。具体地,对于流形学习层的代价函数L(W),其黎曼梯度gradRL(W)的计算,我们可以由以下公式得到:
其中是L(W)是关于W的欧氏梯度,L(W)是由softmax层的代价函数复合至流形学习层的代价函数,E为单位矩阵。
此时,L(W)具体的表达式为
其中,L为softmax层的代价函数,f表示f(X)。
该层在黎曼流形上的权值更新公式为:
Wt+1=Γ(Wt-λgradRL(W))
其中Wt的当前的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,是目标函数的欧氏梯度/>的正则成分。
根据矩阵链式法则可以求得,相应的欧氏梯度的表达式为:
其中,L(Y)为流形转换层的代价函数,其具体的表达式为:
步骤五,在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新网络参数。
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出。
对于流形转换层,参数更新的公式为:
上式中Abtril=Atril-(A)T tril,Atril表示将矩阵A的所有上三角阵元素设为0。其中,Lpro表示流形映射层的代价函数,其具体的表达式为:
本发明提出的流形上的智能目标识别方法所使用的样本库示意图如图2所示,整体识别准确率为92.5%。
其中识别准确率定义:上面结合附图对本发明的实施方式做了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
Claims (2)
1.一种流形上的智能目标识别方法,其特征在于包括以下步骤:
1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;
2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;
3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;
5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类;
所述建立图像集的协方差特征模型,包括以下步骤:
对于每个包含n张图片的图像集Mset={I1,I2,…,In},提取图像集中每幅图像Ii对应的特征,构成特征向量si代表第i幅图像的d维特征向量;/>表示图像集中所图像特征向量的均值,即/>那么每个图像集表示为d×d的协方差特征矩阵X:
所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:
协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=WTXW,其中待学习的W为学习变换矩阵;
将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有fQR(Y)=YR-1=Q,其中fQR(X)为Y的QR正交分解函数,输出Q为Y分解后得到的正交矩阵;
Q输入至欧氏映射层得到G,则有G=fpro(Q)=QQT,其中fpro(Q)为映射函数;
将G作为全连接层的输入,再经过softmax层进行分类;
所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数,包括以下步骤:
gradRL(W)=▽WL(W)-▽WL(W)WWT
Wt+1=Γ(Wt-λgradRL(W))
其中,Wt+1表示下一次更新的权值参数,Wt为当前第t次迭代的权值参数,Γ(·)表示拉回映射算子,λ表示学习速率,gradRL(W)表示黎曼梯度,▽WL(W)WWT是流形学习层的代价函数L(W)关于W的欧氏梯度▽WL(W)的正则成分;
根据矩阵链式法则求得相应的欧氏梯度▽WL(W)的表达式为:
其中L(Y)表示流形转换层的代价函数;
将Wt+1带入步骤2)中的学习变换矩阵W,实现学习变换矩阵的更新。
2.根据权利要求1所述的一种流形上的智能目标识别方法,其特征在于,所述在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数,包括以下步骤:
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出;L(W)表示流形学习层的代价函数,L(Y)表示流形转换层的代价函数;
将与步骤2)中的学习变换矩阵W叠加后作为新的W,用于替换上次迭代的W,实现学习变换矩阵的更新;
对于流形转换层,参数更新的公式为:
上式中Abtril=Atril-(A)T tril,Atril表示将矩阵A的所有上三角阵元素设为0;Lpro为流形映射层的代价函数;E为单位矩阵;
将与步骤2)中的流形学习层的输出Y叠加后作为新的Y,用于替换上次迭代的Y,实现流形学习层的输出更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911239107.0A CN112926361B (zh) | 2019-12-06 | 2019-12-06 | 一种流形上的智能目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911239107.0A CN112926361B (zh) | 2019-12-06 | 2019-12-06 | 一种流形上的智能目标识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112926361A CN112926361A (zh) | 2021-06-08 |
CN112926361B true CN112926361B (zh) | 2024-01-12 |
Family
ID=76162299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911239107.0A Active CN112926361B (zh) | 2019-12-06 | 2019-12-06 | 一种流形上的智能目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926361B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334849A (zh) * | 2018-01-31 | 2018-07-27 | 中山大学 | 一种基于黎曼流形的行人重识别方法 |
CN109615005A (zh) * | 2018-12-10 | 2019-04-12 | 广东技术师范学院 | 基于流形深度学习和极限学习机的图像集分类系统及方法 |
-
2019
- 2019-12-06 CN CN201911239107.0A patent/CN112926361B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108334849A (zh) * | 2018-01-31 | 2018-07-27 | 中山大学 | 一种基于黎曼流形的行人重识别方法 |
CN109615005A (zh) * | 2018-12-10 | 2019-04-12 | 广东技术师范学院 | 基于流形深度学习和极限学习机的图像集分类系统及方法 |
Non-Patent Citations (2)
Title |
---|
基于Grassmann 流形几何深度网络的图像集识别方法;刘天赐;《红外与激光工程》;第47卷(第7期);第1-6页 * |
流形学习及其在图像集分类中的应用研究;王锐;《中国优秀硕士学位论文全文数据库-信息科技辑》;第10-48页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112926361A (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111489358B (zh) | 一种基于深度学习的三维点云语义分割方法 | |
CN108038445B (zh) | 一种基于多视角深度学习框架的sar自动目标识别方法 | |
CN108830296B (zh) | 一种改进的基于深度学习的高分遥感影像分类方法 | |
CN108564029B (zh) | 基于级联多任务学习深度神经网络的人脸属性识别方法 | |
CN109934282B (zh) | 一种基于sagan样本扩充和辅助信息的sar目标分类方法 | |
CN110110599B (zh) | 一种基于多尺度特征融合的遥感图像目标检测方法 | |
CN113033520B (zh) | 一种基于深度学习的树木线虫病害木识别方法及系统 | |
CN110532920A (zh) | 基于FaceNet方法的小数量数据集人脸识别方法 | |
US11941865B2 (en) | Hyperspectral image classification method based on context-rich networks | |
CN108090472A (zh) | 基于多通道一致性特征的行人重识别方法及其系统 | |
CN112036260B (zh) | 一种自然环境下多尺度子块聚合的表情识别方法及系统 | |
CN111311702B (zh) | 一种基于BlockGAN的图像生成和识别模块及方法 | |
CN110705591A (zh) | 一种基于最优子空间学习的异构迁移学习方法 | |
CN110334584A (zh) | 一种基于区域全卷积网络的手势识别方法 | |
CN114170410A (zh) | 基于PointNet的图卷积与KNN搜索的点云零件级分割方法 | |
CN111881716A (zh) | 一种基于多视角生成对抗网络的行人重识别方法 | |
CN114241226A (zh) | 一种基于混合模型多邻域特征的三维点云语义分割方法 | |
CN111400572A (zh) | 一种基于卷积神经网络实现图像特征识别的内容安全监测系统及其方法 | |
CN111368637A (zh) | 一种基于多掩模卷积神经网络的搬运机器人识别目标方法 | |
CN113313176A (zh) | 一种基于动态图卷积神经网络的点云分析方法 | |
CN114187506B (zh) | 视点意识的动态路由胶囊网络的遥感图像场景分类方法 | |
CN117252928B (zh) | 用于电子产品模块化智能组装的视觉图像定位系统 | |
CN117671666A (zh) | 一种基于自适应图卷积神经网络的目标识别方法 | |
CN117853596A (zh) | 无人机遥感测绘方法及系统 | |
CN112926361B (zh) | 一种流形上的智能目标识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |