CN113435288A - 一种基于mff-ma模块的sar图像舰船目标识别方法 - Google Patents
一种基于mff-ma模块的sar图像舰船目标识别方法 Download PDFInfo
- Publication number
- CN113435288A CN113435288A CN202110684654.0A CN202110684654A CN113435288A CN 113435288 A CN113435288 A CN 113435288A CN 202110684654 A CN202110684654 A CN 202110684654A CN 113435288 A CN113435288 A CN 113435288A
- Authority
- CN
- China
- Prior art keywords
- module
- feature
- sar image
- mff
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 238000010586 diagram Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 4
- 230000005284 excitation Effects 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000001125 extrusion Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于MFF‑MA模块的SAR图像舰船目标识别方法,首先将扩充、整理好后的SAR图像送入改进的VGG模型;通过改进VGG网络的前4个卷积单元充分提取SAR图像特征,通过多层次特征融合模块得到输出特征图U;其次,将特征图U∈RC×H×W送入多尺度注意力模块进一步提高重要特征的权重;最后,将MA模块中两个并行的注意力子模块得到的输出特征图进行逐元素相加的特征融合,再由一个全连接层生成最终分类结果。本发明缓解了数据不平衡问题,通过MFF模块充分挖掘丰富的深层次信息,通过MA模块来降低舰船目标的“类间相似性过高”的负面影响,分别对空间维度和通道维度上的语义依赖关系进行建模,提高了特征的辨别能力。
Description
技术领域
本发明属于合成孔径雷达图像处理与目标识别技术领域,具体涉及一种基于MFF-MA模块的SAR图像舰船目标识别方法。
背景技术
合成孔径雷达(Synthetic Aperture Radar,SAR)成像不受天气、光照等诸多条件的影响,能够宏观、长期、连续、动态、实时地对海洋进行观测,被广泛应用于军事和民用领域。近年来,利用SAR图像进行舰船目标检测和识别的研究得到了高度重视,已成为海洋应用领域的一个重要研究方向和信息技术的一个热点话题。然而SAR图像特征随着不同的姿态,俯仰角,成像参数等具有较大变化,其存在的相干斑噪声更是严重降低了图像的可解译程度,也给后续的目标检测及分类带去极大挑战。对于舰船这种复杂的目标,仅仅是手动提取的特征常常没办法深刻细致、全面精确地对舰船的特点进行描述。
近年来神经网络和深度学习的快速发展给SAR-ATR领域带来了新的启示。以卷积神经网络(CNN)为代表的深度学习方法在图像检测、识别领域取得了巨大进展。相比传统的人工设计寻找特征,利用特征进行分类的方法,国内外较多专业研究人员尝试直接利用CNN以及搭建不同的卷积神经网络架构进行SAR图像的特征提取及分类,但这类方法的有效性严重依赖于训练数据的质量和数量,而中等分辨率SAR图像存在类间距小,类内距大的问题。如何进一步挖掘中等分辨率SAR图像中的深层次特征来提高识别率的问题亟待解决。
发明内容
发明目的:为了解决上述现有技术中存在的不足,本发明基于特征融合和注意力机制,提出了一种基于MFF-MA模块的SAR图像舰船目标识别方法,解决了不平衡中等分辨率SAR图像应用深度学习方法的特征提取及特征解译问题,并研究了此估计方法的性能。
技术方案:本发明提出一种基于MFF-MA模块的SAR图像舰船目标识别方法,具体包括以下步骤:
(1)将扩充、整理好后的SAR图像送入改进的VGG16模型;所述改进的VGG16模型为嵌入多层次特征融合模块的VGG16作为骨干网络;
(2)将特征图U∈RC×H×W送入挤压-激励模块,通过损失函数来学习特征权重,得到加权后的特征图A;
(3)将经过(2)获得的特征图A∈RC×H×W送入两个并行的注意力子模块;即通过位置注意力模块增强特征的表示能力,同时通过通道注意力模块增强特征图的判别能力;
(4)将步骤(3)中两个注意力子模块得到的输出特征图经过一个卷积层后进行逐元素相加的特征融合,再由一个全连接层生成最终分类结果。
进一步地,步骤(1)所述改进的VGG16模型为将原始VGG16网络中的输入层由3通道改为单通道;在模型中将最后一个卷积单元去除,并将原有的三个全连接层替换为一个全连接层;通过MFF模块得到输出特征图U,即将第四个卷积块的最后一层卷积层进行反卷积,再与第三个卷积块的最后一层卷积层得到的特征图进行融合。
进一步地,所述步骤(2)实现过程如下:
在挤压部分,进行全局平均池化操作得到特征图的全局信息:
进入激励部分,通过两个全连接层和非线性层来学习C个特征图的权重P,即:
p=Fex(z,W)=σ(g(z,W))=σ(W2δ(W1z))
对特征图和对应的权重进行“逐通道乘法”操作,得到最终的输出:
ac=Fscale(uc,pc)=pcuc
其中,A=[a1,a2,...,ac]为加权后得到的特征图。
进一步地,步骤(3)所述的通过位置注意力模块增强特征的表示能力实现过程如下:
通过卷积层得到三个新的特征图B、C和D,将特征图reshape至RC×N,其中N=H×W是像素数;在B和C的转置上应用一次矩阵乘法获得位置注意力图S∈RN×N:
其中,sji表示第i个位置对第j个位置的影响,两个位置的特征越相似对这个值的影响越大;对D和S的转置应用一次矩阵乘法,reshape至RC×H×W,乘上一个权重系数α,与原始特征A进行一个逐元素的相加操作得到最终输出E∈RC×H×W,即:
进一步地,步骤(3)所述的通过通道注意力模块增强特征图的判别能力实现过程如下:
对特征图A进行reshape操作至RC×N,在A与A的转置上应用一次矩阵乘法获得通道注意力图X∈RN×N:
其中,xji表示第i个通道对第j个通道的影响;对X的转置和A进行一次矩阵乘法,reshape至RC×H×W;乘上权重系数β,与原始特征A进行一个逐元素的相加操作得到最终输出F∈RC×H×W:
有益效果:与现有技术相比,本发明的有益效果:在不平衡中等分辨率SAR图像目标识别过程中,首先利用数据扩充手段一定程度上缓解了数据不平衡问题,然后通过MFF模块充分挖掘SAR图像的深层次特征,再通过MA模块来降低舰船目标的“类间相似性过高”的负面影响,利用双重注意力机制分别对空间维度和通道维度上的语义依赖关系进行建模,进一步提高特征的辨别能力。
附图说明
图1为本发明的流程示意图;
图2为改进的骨干网络的结构和MFF模块结构示意图;
图3为输入原始SAR图像的实例图;
图4为MA模块中SE子模块的结构示意图;
图5为MA模块中PAM子模块的结构示意图;
图6为MA模块中CAM子模块的结构示意图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1所示,本发明提供一种基于MFF-MA模块的SAR图像舰船目标识别方法,具体包括以下步骤:
步骤1、将扩充后处理好的SAR图像送入改进的VGG模型,改进的VGG16模型为嵌入多层次特征融合(Multi-level feature fusion,MFF)模块的VGG16作为骨干网络。
为了适用于单通道的SAR图像,将原始VGG16网络中的输入层由3通道改为单通道;为了防止网络过拟合,在模型中将最后一个卷积单元去除,并将原有的三个全连接层替换为一个全连接层,通过VGG网络的前4个卷积块充分提取SAR图像特征。设计MFF模块,即:将第四个卷积块的最后一层卷积层进行反卷积(deconv),再与第三个卷积块的最后一层卷积层得到的特征图进行融合,得到输出特征图U,参见图2。图3为输入原始SAR图像的实例,第一行为散货船,第二行为集装箱船,第三行为油轮。
步骤2、通过MFF模块,得到输出特征图U∈RC×H×W,将U送入多尺度注意力(Multi-scale attention,MA)模块。
首先送入挤压-激励模块(Squeeze-and-Excitation block,SE block),通过损失函数来学习特征权重,得到加权后的特征图A,如图4所示,通过损失函数来学习特征权重。在Squeeze部分,进行全局平均池化得到特征图的全局信息:
然后就进入Excitation部分,通过两个全连接层和非线性层来学习张量U中C个特征图的权重P,即:
p=Fex(z,W)=σ(g(z,W))=σ(W2δ(W1z))
最后再对特征图和对应的权重进行“逐通道乘法”操作,得到最终的输出:
ac=Fscale(uc,pc)=pcuc
其中,A=[a1,a2,...,ac]为加权后得到的特征图。
将特征图A∈RC×H×W送入两个并行的注意力模块;通过位置注意力模块(positionattention module,PAM)增强特征的表示能力,同时通过通道注意力模块(channelattention module,CAM)增强特征图的判别能力。
在位置注意力模块PAM中,如图5所示,首先通过卷积层得到三个新的特征图B、C和D,将他们reshape至RC×N,其中N=H×W是像素数。接着在B和C的转置上应用一次矩阵乘法获得位置注意力图S∈RN×N:
其中,sji表示第i个位置对第j个位置的影响,两个位置的特征越相似对这个值的影响越大。然后对D和S的转置应用一次矩阵乘法,reshape至RC×H×W,然后乘上一个权重系数α(初始化为0),与原始特征A进行一个逐元素的相加操作得到最终输出E∈RC×H×W,即:
最终的特征E的每一个位置是所有位置的特征和原始特征的带权重相加得到,因此能够聚合全局语义信息,建立丰富的上下文关系,进而增强特征的表示能力。
在通道注意力模块CAM中,如图6所示,首先对特征图A进行reshape操作至RC×N,然后在A与A的转置上应用一次矩阵乘法获得通道注意力图X∈RN×N:
其中,xji表示第i个通道对第j个通道的影响。之后对X的转置和A进行一次矩阵乘法,reshape至RC×H×W,然后乘上一个权重系数β(初始化为0),与原始特征A进行一个逐元素的相加操作得到最终输出F∈RC×H×W,即:
最终输出的每个通道的特征都是所有通道的特征和原始特征图的带权重相加得到,从而增强了通道特征图之间的全局语义依赖,最终增强了特征图的判别能力。
步骤3:将步骤2得到的输出特征图经过一个卷积层后进行逐元素相加的特征融合,再由一个全连接层生成最终分类结果。
本发明采用tensorflow1.10.0-GPU及NVIDIA GeForce GTX 1080Ti实验平台仿真基于多尺度注意力机制的SAR图像舰船目标识别方法的性能,仿真结果如表1、表2所示,验证了本发明的正确性、可行性和有效性,识别率优于目前同类方法,在SAR图像智能解译领域中有很好的理论指导意义。
表1为本发明的方法与基线方法的实验结果对比表
表1为本发明的方法与基线方法的实验结果对比表,实验数据集为公开中等分辨率舰船SAR图像数据集OpenSARShip,识别率为10次实验的平均结果,每次实验的训练集和测试集为随机划分得到。由表1可知,本发明提出的方法识别率高于原始VGG网络以及单独嵌入SE模块、PAM-CAM模块和MA模块的网络,从而证明了所提方法的有效性。
表2为本发明的方法与近年来使用相同数据库的文献的实验结果对比表
表2为本发明的方法与近年来使用相同数据库的文献的实验结果对比表。这些文献的实验数据集同样为OpenSARShip。由表2可知,本发明提出的方法同样优于目前已有方法,证明了所提方法的优越性。
Claims (5)
1.一种基于MFF-MA模块的SAR图像舰船目标识别方法,其特征在于,包括以下步骤:
(1)将扩充、整理好后的SAR图像送入改进的VGG16模型;所述改进的VGG16模型为嵌入多层次特征融合模块的VGG16作为骨干网络;
(2)将特征图U∈RC×H×W送入挤压-激励模块,通过损失函数来学习特征权重,得到加权后的特征图A;
(3)将经过(2)获得的特征图A∈RC×H×W送入两个并行的注意力子模块;即通过位置注意力模块增强特征的表示能力,同时通过通道注意力模块增强特征图的判别能力;
(4)将步骤(3)中两个注意力子模块得到的输出特征图经过一个卷积层后进行逐元素相加的特征融合,再由一个全连接层生成最终分类结果。
2.根据权利要求1所述的基于MFF-MA模块的SAR图像舰船目标识别方法,其特征在于,步骤(1)所述改进的VGG16模型为将原始VGG16网络中的输入层由3通道改为单通道;在模型中将最后一个卷积单元去除,并将原有的三个全连接层替换为一个全连接层;通过MFF模块得到输出特征图U,即将第四个卷积块的最后一层卷积层进行反卷积,再与第三个卷积块的最后一层卷积层得到的特征图进行融合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110684654.0A CN113435288A (zh) | 2021-06-21 | 2021-06-21 | 一种基于mff-ma模块的sar图像舰船目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110684654.0A CN113435288A (zh) | 2021-06-21 | 2021-06-21 | 一种基于mff-ma模块的sar图像舰船目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113435288A true CN113435288A (zh) | 2021-09-24 |
Family
ID=77756727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110684654.0A Pending CN113435288A (zh) | 2021-06-21 | 2021-06-21 | 一种基于mff-ma模块的sar图像舰船目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435288A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115272685A (zh) * | 2022-06-21 | 2022-11-01 | 北京科技大学 | 一种小样本sar舰船目标识别方法及装置 |
CN117173562A (zh) * | 2023-08-23 | 2023-12-05 | 哈尔滨工程大学 | 一种基于潜层扩散模型技术的sar图像舰艇识别方法 |
CN117173562B (zh) * | 2023-08-23 | 2024-06-04 | 哈尔滨工程大学 | 一种基于潜层扩散模型技术的sar图像舰艇识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368671A (zh) * | 2020-02-26 | 2020-07-03 | 电子科技大学 | 基于深度学习的sar图像舰船目标检测识别一体化方法 |
CN112215199A (zh) * | 2020-10-28 | 2021-01-12 | 中国人民解放军战略支援部队航天工程大学 | 基于多感受野与密集特征聚合网络的sar图像舰船检测方法 |
CN112418176A (zh) * | 2020-12-09 | 2021-02-26 | 江西师范大学 | 一种基于金字塔池化多级特征融合网络的遥感图像语义分割方法 |
-
2021
- 2021-06-21 CN CN202110684654.0A patent/CN113435288A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368671A (zh) * | 2020-02-26 | 2020-07-03 | 电子科技大学 | 基于深度学习的sar图像舰船目标检测识别一体化方法 |
CN112215199A (zh) * | 2020-10-28 | 2021-01-12 | 中国人民解放军战略支援部队航天工程大学 | 基于多感受野与密集特征聚合网络的sar图像舰船检测方法 |
CN112418176A (zh) * | 2020-12-09 | 2021-02-26 | 江西师范大学 | 一种基于金字塔池化多级特征融合网络的遥感图像语义分割方法 |
Non-Patent Citations (1)
Title |
---|
陈婧: "《基于多尺度反卷积特征融合网络的光学遥感影像目标检测》", 《中国优秀硕士学位论文全文数据库》, no. 02, 15 February 2020 (2020-02-15), pages 17 - 21 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115272685A (zh) * | 2022-06-21 | 2022-11-01 | 北京科技大学 | 一种小样本sar舰船目标识别方法及装置 |
CN117173562A (zh) * | 2023-08-23 | 2023-12-05 | 哈尔滨工程大学 | 一种基于潜层扩散模型技术的sar图像舰艇识别方法 |
CN117173562B (zh) * | 2023-08-23 | 2024-06-04 | 哈尔滨工程大学 | 一种基于潜层扩散模型技术的sar图像舰艇识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | ShipDeNet-20: An only 20 convolution layers and< 1-MB lightweight SAR ship detector | |
CN109035149B (zh) | 一种基于深度学习的车牌图像去运动模糊方法 | |
CN110569738B (zh) | 基于密集连接网络的自然场景文本检测方法、设备和介质 | |
CN107122375B (zh) | 基于图像特征的图像主体的识别方法 | |
CN109815956B (zh) | 一种基于自适应位置分割的车牌字符识别方法 | |
CN112633382B (zh) | 一种基于互近邻的少样本图像分类方法及系统 | |
CN110633708A (zh) | 一种基于全局模型和局部优化的深度网络显著性检测方法 | |
CN111369522B (zh) | 基于生成对抗卷积神经网络的光场显著性目标检测方法 | |
CN108154133B (zh) | 基于非对称联合学习的人脸画像-照片识别方法 | |
CN112800980B (zh) | 一种基于多层次特征的sar目标识别方法 | |
CN112418351B (zh) | 基于全局与局部上下文感知的零样本学习图像分类方法 | |
CN109948722B (zh) | 一种识别空间目标的方法 | |
CN112633088B (zh) | 一种基于航拍图像中光伏组件识别的电站容量估测方法 | |
CN112149526B (zh) | 一种基于长距离信息融合的车道线检测方法及系统 | |
CN111008650B (zh) | 一种基于深度卷积对抗神经网络的金相组织自动评级方法 | |
CN114283325A (zh) | 一种基于知识蒸馏的水下目标识别方法 | |
CN114998688A (zh) | 一种基于YOLOv4改进算法的大视场目标检测方法 | |
CN113435288A (zh) | 一种基于mff-ma模块的sar图像舰船目标识别方法 | |
Prasetiyo et al. | Differential augmentation data for vehicle classification using convolutional neural network | |
CN114299305A (zh) | 聚合密集和注意力多尺度特征的显著性目标检测算法 | |
CN112766381A (zh) | 有限样本下属性引导的sar图像生成方法 | |
Chang et al. | Mlsdnet: Multi-class lightweight sar detection network based on adaptive scale distribution attention | |
CN116343016A (zh) | 一种基于轻量型卷积网络的多角度声呐图像目标分类方法 | |
CN115205602A (zh) | 基于最优传输距离函数的零样本sar目标识别方法 | |
CN113192076B (zh) | 联合分类预测和多尺度特征提取的mri脑肿瘤图像分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |