CN114332070A - 一种基于智能学习网络模型压缩的陨坑检测方法 - Google Patents
一种基于智能学习网络模型压缩的陨坑检测方法 Download PDFInfo
- Publication number
- CN114332070A CN114332070A CN202210005347.XA CN202210005347A CN114332070A CN 114332070 A CN114332070 A CN 114332070A CN 202210005347 A CN202210005347 A CN 202210005347A CN 114332070 A CN114332070 A CN 114332070A
- Authority
- CN
- China
- Prior art keywords
- convolution
- meteor
- detection
- meteor crater
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 193
- 230000006835 compression Effects 0.000 title claims abstract description 32
- 238000007906 compression Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 71
- 238000013138 pruning Methods 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims abstract description 26
- 230000006870 function Effects 0.000 claims abstract description 23
- 238000003062 neural network model Methods 0.000 claims abstract description 19
- 238000010586 diagram Methods 0.000 claims description 28
- 238000000605 extraction Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 8
- 230000008034 disappearance Effects 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 238000005286 illumination Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 5
- 238000003384 imaging method Methods 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000003709 image segmentation Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000017105 transposition Effects 0.000 claims description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 5
- 238000010200 validation analysis Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开的基于智能学习网络模型压缩的陨坑检测方法,属于深空探测技术领域。本发明实现方法:通过数据增强方法扩充先前探测任务获取的陨坑图像来构建陨坑数据集,为陨坑检测模型训练提供基础。通过设计出陨坑检测卷积神经网络模型和定义合适的损失函数,使陨坑检测卷积神经网络实现陨坑检测的功能。采用通道剪枝方法显著减少陨坑检测卷积神经网络中冗余卷积核的数量,成倍减少陨坑检测神经网络模型的参数量;采用深度可分离卷积替换普通卷积,将陨坑检测卷积神经网络中的标准卷积过程分解为逐通道卷积和逐点卷积,实现卷积过程在空间结构与通道方面的解耦。本发明能够降低陨坑检测神经网络模型的参数量和检测时间,提升陨坑图像检测效率。
Description
技术领域
本发明涉及一种基于智能学习网络模型压缩的陨坑检测方法,属于深空探测技术领域。
背景技术
着陆探测是开展地外天体表面原位探测与科学研究的必要前提,并且着陆探测任务需要兼顾工程安全性与科学价值,其中,陨坑检测是提高着陆安全性和评估着陆区科学价值的关键技术。一方面,陨石坑会对着陆探测器的安全性带来威胁,基于陨坑检测的障碍规避是保障着陆探测器着陆安全的关键途径。另一方面,陨石坑还蕴含着科学研究价值信息,陨坑检测对于探测器着陆区的选取具有重要参考意义。除此之外,陨石坑在地外天体表面分布范围广,特征明显,是重要的导航信标。基于陨坑检测和匹配的地形相对导航是提高导航精度的重要途径,能够提高未来地外天体着陆探测器的定点着陆能力。因此,实现陨石坑的快速准确检测对于提高探测器着陆精度和安全性以及评估着陆区科学研究价值具有重要意义。
目前,陨坑检测算法主要可以分为两类,基于传统图像处理的方法和基于深度学习的方法。传统图像处理方法通常根据边缘、阴影等陨坑特征完成检测,计算量较小。但是,会受到亮度变化、图像噪声等干扰因素的影响,在复杂环境条件下的检测查全率偏低。随着深度学习算法的发展,基于卷积神经网络的智能学习方法被应用于陨坑检测,这类算法能够实现特征自动提取,避免了复杂的人工特征设计流程。与传统陨坑检测方法相比,基于智能学习的陨坑检测方法在准确性和鲁棒性方面有了明显的提升,但陨坑检测速度却因为神经网络结构的复杂性受到限制,难以应用于工程实践。
发明内容
为了解决当前基于智能学习网络模型的陨坑检测方法算法复杂度高、检测时间长的问题,本发明的主要目的是提供一种基于智能学习网络模型压缩的陨坑检测方法,通过数据增强方法扩展陨坑图像数据集,以弥补高质量陨坑图像数量不足的问题;通过模型剪枝和卷积替换的方式对复杂神经网络结构模型进行轻量化模型压缩,在保证网络模型陨坑检测准确性的前提下,提升陨坑检测效率。利用基于智能学习网络模型压缩的陨坑检测方法能够大幅度降低智能学习网络结构的复杂度,减少陨坑检测时间,满足着陆探测任务中的高实时性要求。
本发明的目的是通过下述技术方案实现的。
本发明公开的基于智能学习网络模型压缩的陨坑检测方法,通过数据增强方法扩充先前探测任务获取的陨坑图像来构建陨坑数据集,为陨坑检测模型训练提供基础。通过设计出陨坑检测卷积神经网络模型和定义合适的损失函数,使陨坑检测卷积神经网络实现陨坑检测的功能。采用通道剪枝方法显著减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少陨坑检测神经网络模型的参数量;采用深度可分离卷积替换普通卷积,将陨坑检测卷积神经网络中的标准卷积过程分解为逐通道卷积和逐点卷积,实现卷积过程在空间结构与通道方面的解耦。该方法能够大幅降低陨坑检测神经网络模型的参数量和检测时间,显著提升陨坑图像检测的效率。
本发明公开的一种基于智能学习网络模型压缩的陨坑检测方法,包括如下步骤:
步骤一、通过数据增强方法扩充先前探测任务获取的陨坑图像来构建陨坑图像数据集,以弥补高质量陨坑图像数量不足的问题,随机将扩充后的陨坑图像数据集按预定比例划分为训练集和验证集。
基于地外天体探测任务过程中获取的陨坑图像,随机选取目标着陆场区的陨石坑灰度图像,采用数据增强方法来扩充陨坑图像样本数据集。考虑到探测器在着陆阶段陨坑图像检测场景的多样性,通过对陨坑图像进行垂直翻转、水平翻转、转置、旋转处理,模拟着陆时不同的光照角度和拍摄角度;将增加和减少陨坑图像的亮度,模拟着陆时不同的光照强度;在陨坑图像中加入高斯噪声,模拟光学相机由于温度过高或者着陆环境亮度偏低产生的成像噪声。随机的将陨坑图像按预定比例划分为训练集和验证集。
调整图像亮度的原理可以表示如下,其中(a)式表示增加陨坑图像的亮度,(b)式表示减少陨坑图像的亮度。
式中,I(x,y)表示图像中位置坐标(x,y)处的像素值,n表示陨坑图像亮度增加或减少的幅度,255表示灰度图像的最大像素值。
在陨坑图像中加入高斯噪声如下式
I(x,y)=max(min(I(x,y)+z,255),0),z~N(μ,σ2)
式中,I(x,y)表示图像中位置坐标(x,y)处的像素值,z表示均值为μ,标准差为σ的正态分布噪声,255表示灰度图像的最大像素值。
步骤二、通过设计出陨坑检测卷积神经网络模型,在编码网络中使用卷积和池化操作提取陨坑图像的浅层特征,得到陨坑图像的不同特征图,使用卷积进行特征提取时,随着卷积训练推进卷积核的感受野不断扩大,使陨坑检测卷积神经网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑和背景之间关系的特征;在解码网络中采用多次卷积和最近邻插值进行特征提取和上采样,缓解神经网络训练过程中的梯度消失问题;通过定义损失函数,计算陨坑检测网络的预测结果和标注结果之间的误差,并根据误差使用反向传播算法调整陨坑检测网络中的参数,从而使陨坑检测卷积神经网络实现陨坑检测的功能。
网络结构由编码网络和解码网络两个部分组成。
在编码网络中,输入陨坑灰度图像,使用多次卷积和池化操作进行输入图像和特征图的特征提取和下采样,可以得到一系列不同尺寸和通道数的特征图。编码网络在训练过程中调整卷积核的参数,自动提取出图像中陨坑的浅层特征,包括陨坑边缘、轮廓、纹理等信息。随着下采样的进行,使用卷积进行特征提取时,卷积核的感受野不断扩大,网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑在整个图像中的陨坑和背景之间关系的特征。
在解码网络中,输入为编码网络中尺寸最小、通道数最多的特征图,经过多次卷积和最近邻插值进行特征提取和上采样,得到尺寸和通道数与编码网络特征一致的特征图。编码网络中的特征图在每次进行最近邻插值操作后,都会与编码网络中尺寸和通道数均相同的特征图在通道维度上进行拼接,再使用卷积操作进行特征提取。在解码网络上采样的过程中,由于使用了编码网络中的浅层特征,有效缓解神经网络训练过程中的梯度消失问题。同时,编码网络中的浅层特征能够提供较为准确的陨坑位置和边缘等信息,进一步提升对陨坑图像分割的精度。解码网络的特征图随着上采样的进行,特征图的尺寸将逐渐恢复至输入陨坑图像的尺寸。
网络最后的输出层是一个卷积层,通过对解码网络输出的特征图进行降维,得到尺寸与输入图像一致的特征图。对输出特征图进行降维后,使用sigmoid激活函数将网络的输出进行转换,表征陨坑灰度图像中各像素点属于陨坑的预测概率。
卷积过程如下式所示:
式中,C(ω,h)表示二维卷积结果,ω和h分别表示图像上的宽度轴和高度轴,K表示核函数矩阵,s和t分别表示卷积核在图像宽度和高度轴上的坐标,I表示图像矩阵,k表示卷积核矩阵的尺寸。
池化的机理可以描述为
M=maxp×p{Fh×h}
式中,M表示通过最大池化层后得到的特征图像矩阵,F表示输入的特征图像矩阵,h表示该特征图像矩阵的尺寸,p表示池化区域的视野尺寸。
通过定义合适的损失函数,计算陨坑检测网络的预测结果和标注结果之间的误差。根据误差使用反向传播算法调整陨坑检测网络中的参数,从而使网络实现陨坑检测的功能。
步骤三、采用通道剪枝和深度可分离卷积替换的方法对步骤二设计出的陨坑检测卷积神经网络模型进行轻量化处理,即对陨坑检测卷积神经网络模型轻量化压缩,降低陨坑检测卷积神经网络模型结构的参数量和复杂度,提升陨坑检测卷积神经网络模型检测陨坑图像的效率。使用通道剪枝方法,显著减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少陨坑检测神经网络模型的参数量;采用深度可分离卷积替换普通卷积,将陨坑检测卷积神经网络中的标准卷积过程分解为逐通道卷积和逐点卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量,进而在保证陨坑检测精度的前提下进一步提高检测效率。
步骤3.1:采用通道剪枝方法,减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少陨坑检测神经网络模型的参数量。
网络模型中的多个卷积核会提取相同的特征,卷积层的输出中存在大量相似的特征图,说明陨坑检测网络中存在功能冗余的卷积核。
定义剪枝参数n,直接将陨坑检测网络中除输出层外所有卷积层的卷积核数量减少为原来的1/n。然后,将剪枝得到的网络进行随机初始化,在训练数据上重新训练。最后,根据剪枝模型在测试集上的检测效果确定最佳的剪枝参数nopt。
步骤3.2:采用深度可分离卷积替换普通卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量。
深度可分离卷积将标准卷积在空间结构与通道方面进行解耦,分解为逐通道卷积和逐点卷积。
逐通道卷积使用N个DK×DK×1的卷积核在输入图像或特征图的N个通道上进行卷积,得到DF×DF×N的特征图。逐点卷积是在逐通道卷积的基础上,使用M个1×1×N的卷积核在DF×DF×N的特征图上进行卷积,最终得到DF×DF×M的输出特征图。逐通道卷积和逐点卷积的参数量分别为DK×DK×1×N和1×1×N×M。深度可分离卷积和标准卷积参数量的比值为:
式中,DF表示输入输出图像或特征图的宽高,DK表示卷积核的宽高,N表示输入图像或特征图的通道数,M表示输出特征图的通道数。
由上式可知,经过深度可分离卷积处理后,陨坑检测卷积神经网络模型的参数量进一步降低,进而能够大幅降低网络模型的参数量和检测时间,显著提升陨坑图像智检测的效率,并且不影响网络模型检测陨坑图像的准确性和鲁棒性。
有益效果:
1.本发明公开的一种基于智能学习网络模型压缩的陨坑检测方法,采用通道剪枝和深度可分离卷积替换的方法对设计出陨坑检测卷积神经网络模型进行轻量化处理,即对陨坑检测卷积神经网络模型轻量化压缩,降低陨坑检测卷积神经网络模型结构的参数量和复杂度,提升陨坑检测卷积神经网络模型检测陨坑图像的检测效率。使用通道剪枝方法,显著减少陨坑检测卷积神经网络中冗余卷积核的数量,成倍减少陨坑检测神经网络模型的参数量;采用深度可分离卷积替换普通卷积,将陨坑检测卷积神经网络中的标准卷积过程分解为逐通道卷积和逐点卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量,进而在保证陨坑检测精度的前提下进一步提高检测效率,满足着陆探测任务中的高实时性要求。
2.本发明公开的一种基于智能学习网络模型压缩的陨坑检测方法,通过数据增强方法扩充先前探测任务获取的陨坑图像来构建陨坑图像数据集,以弥补高质量陨坑图像数量不足的问题。
3.本发明公开的一种基于智能学习网络模型压缩的陨坑检测方法,设计出一种由编码网络和解码网络两个部分组成的网络结构,以实现陨坑图像的高精度和高鲁棒性检测。在编码网络中使用卷积和池化操作提取陨坑图像的浅层特征,得到陨坑图像的不同特征图,使用卷积进行特征提取时,随着卷积训练推进卷积核的感受野不断扩大,使陨坑检测卷积神经网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑和背景之间关系的特征;在解码网络中采用多次卷积和最近邻插值进行特征提取和上采样,缓解神经网络训练过程中的梯度消失问题;网络结构最后的输出层是一个卷积层,通过对解码网络输出的特征图进行降维,得到与输入陨坑图像尺寸一致且陨坑标注清楚的分割图。
4.本发明公开的一种基于智能学习网络模型压缩的陨坑检测方法,能够大幅降低网络模型的参数量和检测时间,显著提升陨坑图像智检测的效率,并且不影响网络模型检测陨坑图像的准确性和鲁棒性。
附图说明
图1为本发明公开的一种基于智能学习网络模型压缩的陨坑检测方法流程图;
图2为部分陨坑图像及其标注结果,其中图2(a)为部分陨坑图像,图2(b)为部分陨坑图像的标注结果;
图3为Unet陨坑检测卷积神经网络结构示意图;
图4为Unet结构中的卷积示意图;
图5为剪枝流程示意图;
图6为深度可分离卷积示意图,其中图6(a)为逐通道卷积示意图,图6(b)为逐点卷积示意图;
图7为模型压缩得到的网络结构DS_P8_Unet示意图;
图8为P1_Unet和DS_P4_Unet的图像预测结果图;
图9为P1_Unet和DS_P4_Unet在不同图像噪声作用下的图像预测结果图。
具体实施方式
为了更好的说明本发明的目的和优点,下面结合实例对发明内容做进一步说明。
本实例针对月球表面陨石坑的图像样本进行陨坑检测,基于月球侦察轨道器获取的月球全球成像图构建陨坑图像数据集,设计Unet陨坑检测卷积神经网络模型,再采用通道剪枝和深度可分离卷积替换进行模型压缩处理,最后对陨坑检测智能学习网络进行训练。为了证明本发明公开的基于智能学习网络模型压缩的陨坑检测方法的有效性,通过实验对陨坑检测结果进行评估,并对比模型压缩前后陨坑检测网络结构的预测性能。
如图1所示,本实施例公开的基于智能学习网络模型压缩的陨坑检测方法,具体实施方法如下:
步骤一、通过数据增强方法扩充先前探测任务获取的陨坑图像来构建陨坑图像数据集,以弥补高质量陨坑图像数量不足的问题,随机将扩充后的陨坑图像数据集按预定比例划分为训练集和验证集。
本实施例使用的陨坑数据来源于月球侦察轨道器相机(Lunar ReconnaissanceOrbiter Camera,LROC),该相机包含一个广角相机和窄角相机,提供了分辨率为100米/像素的月球全球成像图。为了减少扭曲变形,随机裁剪了靠近赤道的100幅灰度图像,并使用labelme工具对每幅图像中的陨坑进行手动标记,得到陨坑图像逐像素的标注结果,作为陨坑图像样本。随机选取其中80幅图像作为训练集,20幅作为验证集。
然后采用数据增强方法来扩充陨坑图像样本数据集,最终得到800幅陨坑图像。同时,考虑到本算法的使用场景,通过对陨坑图像进行了垂直翻转、水平翻转、转置、旋转处理,模拟着陆时不同的光照角度和拍摄角度;将陨坑图像的亮度增加和减少30%,模拟着陆时不同的光照强度;在陨坑图像中加入均值为10、方差为15的高斯噪声,模拟光学相机由于温度过高或者着陆环境亮度偏低产生的成像噪声。随机的将陨坑图像按照8:2的比例划分为训练集和验证集。部分陨坑图像及其标注结果如图2所示,其中图2(a)为部分陨坑图像,图2(b)为部分陨坑图像的标注结果。
将陨坑图像的亮度增加和减少30%,其中(a)式表示增加30%陨坑图像的亮度,(b)式表示减少30%陨坑图像的亮度。
式中,I(x,y)表示图像中位置坐标(x,y)处的像素值。
在陨坑图像中加入均值为10、方差为15的高斯噪声
I(x,y)=max(min(I(x,y)+z,255),0),z~N(10,152)
式中,I(x,y)表示图像中位置坐标(x,y)处的像素值。
步骤二、通过设计出陨坑检测卷积神经网络模型,在编码网络中使用卷积和池化操作提取陨坑图像的浅层特征,得到陨坑图像的不同特征图,使用卷积进行特征提取时,随着卷积训练推进卷积核的感受野不断扩大,使陨坑检测卷积神经网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑和背景之间关系的特征;在解码网络中采用多次卷积和最近邻插值进行特征提取和上采样,缓解神经网络训练过程中的梯度消失问题;通过定义损失函数,计算陨坑检测网络的预测结果和标注结果之间的误差,并根据误差使用反向传播算法调整陨坑检测网络中的参数,从而使陨坑检测卷积神经网络实现陨坑检测的功能。
本实施例利用Unet设计陨坑检测卷积神经网络结构,网络结构由编码网络和解码网络两个部分组成,整体结构呈对称的“U”型,网络结构如图3所示。
在编码网络中,输入尺寸为416×416的陨坑灰度图像,使用多次卷积和池化操作进行输入图像和特征图的特征提取和下采样,可以得到一系列不同尺寸和通道数的特征图。编码网络在训练过程中调整卷积核的参数,自动提取出图像中陨坑的浅层特征,包括陨坑边缘、轮廓、纹理等信息。随着下采样的进行,使用卷积进行特征提取时,卷积核的感受野不断扩大,网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑在整个图像中的上下文信息,即陨坑和背景之间关系的特征。
在解码网络中,输入为编码网络中尺寸最小、通道数最多的特征图,经过多次卷积和最近邻插值进行特征提取和上采样,可以得到一系列尺寸和通道数与编码网络特征一致的特征图。编码网络中的特征图在每次进行最近邻插值操作后,都会与编码网络中尺寸和通道数均相同的特征图在通道维度上进行拼接,再使用卷积操作进行特征提取。在解码网络上采样的过程中,由于使用了编码网络中的浅层特征,有效缓解了神经网络训练过程中的梯度消失问题。同时,编码网络中的浅层特征能够提供较为准确的陨坑位置和边缘等信息,进一步提升了对陨坑图像分割的精度。解码网络的特征图随着上采样的进行,特征图的尺寸将逐渐恢复至输入陨坑图像的尺寸。
网络最后的输出层是一个卷积核尺寸为1×1的卷积层,通过对解码网络输出的特征图进行降维,可以得到尺寸与输入图像一致、通道数为1的特征图。对输出特征图进行降维后,使用sigmoid激活函数将网络的输出转换为取值在0和1之间的概率值,表征陨坑灰度图像中各像素点属于陨坑的预测概率。
卷积过程如下式所示:
式中,C(ω,h)表示二维卷积结果,ω和h分别表示图像上的宽度轴和高度轴,K表示核函数矩阵,s和t分别表示卷积核在图像宽度和高度轴上的坐标,I表示图像矩阵,k表示卷积核矩阵的尺寸。
池化的机理可以描述为
M=maxp×p{Fh×h}
式中,M表示通过最大池化层后得到的特征图像矩阵,F表示输入的特征图像矩阵,h表示该特征图像矩阵的尺寸,p表示池化区域的视野尺寸。
Unet是一个全卷积神经网络,卷积的参数占了整个网络参数的绝大部分。Unet结构中的卷积操作如图4所示,其中输入图像或特征图的形状为DF×DF×N,使用M个形状为DK×DK×N的卷积核进行卷积后,输出形状为DF×DF×M的特征图。DF、DK、N、M分别是输入输出图像或特征图的宽高、卷积核的宽高、输入图像或特征图的通道数、输出特征图的通道数。
通过定义合适的损失函数,可以计算陨坑检测网络的预测结果和标注结果之间的误差。根据误差使用反向传播算法调整陨坑检测网络中的参数,从而使网络实现陨坑检测的功能。本实施例使用的损失函数融合了交叉熵损失和dice损失,其表达式为:
步骤三、采用通道剪枝和深度可分离卷积替换的方法步骤二设计出陨坑检测卷积神经网络模型进行轻量化处理,即对陨坑检测卷积神经网络模型轻量化压缩,降低陨坑检测卷积神经网络模型结构的参数量和复杂度,提升陨坑检测卷积神经网络模型检测陨坑图像的检测效率。使用通道剪枝方法,显著减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少陨坑检测神经网络模型的参数量;采用深度可分离卷积替换普通卷积,将陨坑检测卷积神经网络中的标准卷积过程分解为逐通道卷积和逐点卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量,进而在保证陨坑检测精度的前提下进一步提高检测效率。
(1)采用通道剪枝方法,减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少网络参数量,剪枝示意图如图5所示。
网络模型中的多个卷积核会提取相同的特征,卷积层的输出中存在大量相似的特征图,说明陨坑检测网络中存在功能冗余的卷积核。
定义一个剪枝参数n,直接将陨坑检测网络中除输出层外所有卷积层的卷积核数量减少为原来的1/n。然后,将剪枝得到的网络进行随机初始化,在训练数据上重新训练。最后,根据剪枝模型在测试集上的检测效果确定最佳的剪枝参数nopt。
表2不同剪枝参数陨坑检测模型性能
设置不同的的剪枝参数进行试验,不同剪枝参数陨坑检测模型性能如表2所示。表中Pn_Unet指剪枝参数为n时对应的剪枝模型。通过对比表2中剪枝网络和原始网络的精度可以看出,对复杂的网络进行适当的剪枝,可以在确保网络性能的前提下,提升陨坑检测的效率。当剪枝参数n不大于4时,剪枝精度与原始网络精度相差不多,剪枝对网络的性能影响基本可以忽略,验证了原始模型中卷积核的冗余性。当剪枝参数过大时,网络精度会出现较大的下降。根据对比结果权衡模型的精度和复杂度,可以确定最佳的剪枝参数nopt为4。将剪枝参数设置为4后,得到P4_Unet模型。
(2)采用深度可分离卷积替换普通卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量。深度可分离卷积示意图如图6所示,其中图6(a)为逐通道卷积示意图,图6(b)为逐点卷积示意图。
深度可分离卷积将标准卷积在空间结构与通道方面进行解耦,分解为逐通道卷积和逐点卷积。
逐通道卷积使用N个DK×DK×1的卷积核在输入图像或特征图的N个通道上进行卷积,得到DF×DF×N的特征图。逐点卷积是在逐通道卷积的基础上,使用M个1×1×N的卷积核在DF×DF×N的特征图上进行卷积,最终得到DF×DF×M的输出特征图。逐通道卷积和逐点卷积的参数量分别为DK×DK×1×N和1×1×N×M。深度可分离卷积和标准卷积参数量的比值为:
式中,DF表示输入输出图像或特征图的宽高,DK表示卷积核的宽高,N表示输入图像或特征图的通道数,M表示输出特征图的通道数。
在本实施例使用的陨坑检测网络结构中,卷积核的尺寸均为3×3,每个卷积层输出的特征图通道数通常较大,因此1/M可以忽略。深度可分离卷积的参数量约为标准卷积的1/9。最终,经过通道剪枝和深度可分离卷积替换进行模型压缩得到的网络结构DS_P4_Unet如图7所示。
基于步骤一中构建的陨坑数据集,对模型压缩后的陨坑检测智能学习网络进行训练,并对陨坑检测结果进行评估。
模型训练的超参数如表3所示。表中batch size为网络更新一次权值所使用的图像数量。max epoch是指网络在整个训练集上迭代的最大次数。学习率采用动态更新的方式,当网络在训练集上迭代20次而在验证集上的准确率没有提升时,则将学习率乘以0.1。训练完成后,将在验证集上准确率最高的模型作为最佳模型并保存。
表3模型训练的超参数
采用语义分割中常用的评价指标准确率(Accuracy)、查准率(Precision)、查全率(Recall)和F1-score对陨坑检测网络的分割结果进行评估。
其中,TP、FP、TN、FN代表网络的各类预测结果。
采用剪枝参数为4的通道剪枝处理进行模型压缩,剪枝前后网络模型的数据测试结果如表4所示。
表4剪枝前后网络模型的数据测试结果表4
采用剪枝参数为4的通道剪枝处理进行模型压缩,得到的陨坑检测模型的分割精度与模型压缩前基本持平,但是参数量减少了93.7%。
将P4_Unet中除输入层和输出层外的标准卷积替换为深度可分离卷积后,在训练集上对网络进行重新训练。训练完成后在验证集上完成评估。卷积替换的实验结果如表5所示,表中DS_P4_Unet代表模型P4_Unet进行卷积替换得到的网络模型。
表5卷积替换的实验结果
将标准卷积替换为深度可分离卷积后,陨坑检测模型的分割精度有了略微的下降,但是参数量减少了87.7%,单张图像的测试时间减少了43%。
表6 P1_Unet和DS_P4_Unet性能对比结果
P1_Unet(原始Unet)和DS_P4_Unet之间性能的对比结果如表6所示。两个模型在验证集图像上的预测结果如图8所示。在引入各种图像噪声作用的情况下,P1_Unet和DS_P4_Unet的预测结果如图9所示。
根据表6的结果,DS_P4_Unet与P1_Unet相比,准确率略微下降了0.5%,查准率、查全率和F1-score下降约3%。但是参数量减少了99.2%,单张图像的测试时间较少了94.0%,陨坑检测模型的效率得到显著提升。根据图8、9可以看出DS_P4_Unet和P1_Unet的检测性能相差不多,对于部分形态较复杂的超大陨坑,DS_P4_Unet的边缘检测存在少量错误,对中、小型陨坑,两者的检测能力基本相当。此外,DS_P4_Unet也能适应亮度、噪声和拍摄角度等扰动的影响,具有良好的鲁棒性。通过上述结果可以看出,本发明公开的基于智能学习网络模型压缩的陨坑检测方法大幅降低了网络模型的参数量和推理时间,提升了陨坑图像智检测的效率,并且不影响网络模型检测陨坑图像的准确性和鲁棒性。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于智能学习网络模型压缩的陨坑检测方法,其特征在于:包括如下步骤,
步骤一、通过数据增强方法扩充先前探测任务获取的陨坑图像来构建陨坑图像数据集,以弥补高质量陨坑图像数量不足的问题,随机将扩充后的陨坑图像数据集按预定比例划分为训练集和验证集;
步骤二、通过设计出陨坑检测卷积神经网络模型,在编码网络中使用卷积和池化操作提取陨坑图像的浅层特征,得到陨坑图像的不同特征图,使用卷积进行特征提取时,随着卷积训练推进卷积核的感受野不断扩大,使陨坑检测卷积神经网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑和背景之间关系的特征;在解码网络中采用多次卷积和最近邻插值进行特征提取和上采样,缓解神经网络训练过程中的梯度消失问题;通过定义损失函数,计算陨坑检测网络的预测结果和标注结果之间的误差,并根据误差使用反向传播算法调整陨坑检测网络中的参数,从而使陨坑检测卷积神经网络实现陨坑检测的功能;
步骤三、采用通道剪枝和深度可分离卷积替换的方法对步骤二设计出的陨坑检测卷积神经网络模型进行轻量化处理,即对陨坑检测卷积神经网络模型轻量化压缩,降低陨坑检测卷积神经网络模型结构的参数量和复杂度,提升陨坑检测卷积神经网络模型检测陨坑图像的效率;使用通道剪枝方法,显著减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少陨坑检测神经网络模型的参数量;采用深度可分离卷积替换普通卷积,将陨坑检测卷积神经网络中的标准卷积过程分解为逐通道卷积和逐点卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量,进而在保证陨坑检测精度的前提下进一步提高检测效率。
2.如权利要求1所述的一种基于智能学习网络模型压缩的陨坑检测方法,其特征在于:步骤一实现方法为,
基于地外天体探测任务过程中获取的陨坑图像,随机选取目标着陆场区的陨石坑灰度图像,采用数据增强方法来扩充陨坑图像样本数据集;考虑到探测器在着陆阶段陨坑图像检测场景的多样性,通过对陨坑图像进行垂直翻转、水平翻转、转置、旋转处理,模拟着陆时不同的光照角度和拍摄角度;将增加和减少陨坑图像的亮度,模拟着陆时不同的光照强度;在陨坑图像中加入高斯噪声,模拟光学相机由于温度过高或者着陆环境亮度偏低产生的成像噪声;随机的将陨坑图像按预定比例划分为训练集和验证集;
调整图像亮度的原理可以表示如下,其中(a)式表示增加陨坑图像的亮度,(b)式表示减少陨坑图像的亮度;
式中,I(x,y)表示图像中位置坐标(x,y)处的像素值,n表示陨坑图像亮度增加或减少的幅度,255表示灰度图像的最大像素值;
在陨坑图像中加入高斯噪声如下式
I(x,y)=max(min(I(x,y)+z,255),0),z~N(μ,σ2)
式中,I(x,y)表示图像中位置坐标(x,y)处的像素值,z表示均值为μ,标准差为σ的正态分布噪声,255表示灰度图像的最大像素值。
3.如权利要求2所述的一种基于智能学习网络模型压缩的陨坑检测方法,其特征在于:步骤二实现方法为,
网络结构由编码网络和解码网络两个部分组成;
在编码网络中,输入陨坑灰度图像,使用多次卷积和池化操作进行输入图像和特征图的特征提取和下采样,可以得到一系列不同尺寸和通道数的特征图;编码网络在训练过程中调整卷积核的参数,自动提取出图像中陨坑的浅层特征,包括陨坑边缘、轮廓、纹理等信息;随着下采样的进行,使用卷积进行特征提取时,卷积核的感受野不断扩大,网络不仅能够检测出图像中面积较大的陨坑,还能获取陨坑在整个图像中的陨坑和背景之间关系的特征;
在解码网络中,输入为编码网络中尺寸最小、通道数最多的特征图,经过多次卷积和最近邻插值进行特征提取和上采样,得到尺寸和通道数与编码网络特征一致的特征图;编码网络中的特征图在每次进行最近邻插值操作后,都会与编码网络中尺寸和通道数均相同的特征图在通道维度上进行拼接,再使用卷积操作进行特征提取;在解码网络上采样的过程中,由于使用了编码网络中的浅层特征,有效缓解神经网络训练过程中的梯度消失问题;同时,编码网络中的浅层特征能够提供较为准确的陨坑位置和边缘等信息,进一步提升对陨坑图像分割的精度;解码网络的特征图随着上采样的进行,特征图的尺寸将逐渐恢复至输入陨坑图像的尺寸;
网络最后的输出层是一个卷积层,通过对解码网络输出的特征图进行降维,得到尺寸与输入图像一致的特征图;对输出特征图进行降维后,使用sigmoid激活函数将网络的输出进行转换,表征陨坑灰度图像中各像素点属于陨坑的预测概率;
卷积过程如下式所示:
式中,C(ω,h)表示二维卷积结果,ω和h分别表示图像上的宽度轴和高度轴,K表示核函数矩阵,s和t分别表示卷积核在图像宽度和高度轴上的坐标,I表示图像矩阵,k表示卷积核矩阵的尺寸;
池化的机理描述为
M=maxp×p{Fh×h}
式中,M表示通过最大池化层后得到的特征图像矩阵,F表示输入的特征图像矩阵,h表示该特征图像矩阵的尺寸,p表示池化区域的视野尺寸;
通过定义合适的损失函数,计算陨坑检测网络的预测结果和标注结果之间的误差;根据误差使用反向传播算法调整陨坑检测网络中的参数,从而使网络实现陨坑检测的功能。
4.如权利要求3所述的一种基于智能学习网络模型压缩的陨坑检测方法,其特征在于:步骤三实现方法为,
步骤3.1:采用通道剪枝方法,减少陨坑检测卷积神经网络中冗余卷积核的数量,进而成倍减少陨坑检测神经网络模型的参数量;
网络模型中的多个卷积核会提取相同的特征,卷积层的输出中存在大量相似的特征图,说明陨坑检测网络中存在功能冗余的卷积核;
定义剪枝参数n,直接将陨坑检测网络中除输出层外所有卷积层的卷积核数量减少为原来的1/n;然后,将剪枝得到的网络进行随机初始化,在训练数据上重新训练;最后,根据剪枝模型在测试集上的检测效果确定最佳的剪枝参数nopt;
步骤3.2:采用深度可分离卷积替换普通卷积,实现卷积过程在空间结构与通道方面的解耦,进一步降低陨坑检测卷积神经网络模型参数量;
深度可分离卷积将标准卷积在空间结构与通道方面进行解耦,分解为逐通道卷积和逐点卷积;
逐通道卷积使用N个DK×DK×1的卷积核在输入图像或特征图的N个通道上进行卷积,得到DF×DF×N的特征图;逐点卷积是在逐通道卷积的基础上,使用M个1×1×N的卷积核在DF×DF×N的特征图上进行卷积,最终得到DF×DF×M的输出特征图;逐通道卷积和逐点卷积的参数量分别为DK×DK×1×N和1×1×N×M;深度可分离卷积和标准卷积参数量的比值为:
式中,DF表示输入输出图像或特征图的宽高,DK表示卷积核的宽高,N表示输入图像或特征图的通道数,M表示输出特征图的通道数;
由上式知,经过深度可分离卷积处理后,陨坑检测卷积神经网络模型的参数量进一步降低,进而能够大幅降低网络模型的参数量和检测时间,显著提升陨坑图像智检测的效率,并且不影响网络模型检测陨坑图像的准确性和鲁棒性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210005347.XA CN114332070B (zh) | 2022-01-05 | 2022-01-05 | 一种基于智能学习网络模型压缩的陨坑检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210005347.XA CN114332070B (zh) | 2022-01-05 | 2022-01-05 | 一种基于智能学习网络模型压缩的陨坑检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114332070A true CN114332070A (zh) | 2022-04-12 |
CN114332070B CN114332070B (zh) | 2024-05-28 |
Family
ID=81024503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210005347.XA Active CN114332070B (zh) | 2022-01-05 | 2022-01-05 | 一种基于智能学习网络模型压缩的陨坑检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114332070B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925115A (zh) * | 2022-05-27 | 2022-08-19 | 天津大学 | 基于深度可分离卷积的轻量化广义负荷分解方法 |
CN115393730A (zh) * | 2022-07-15 | 2022-11-25 | 南京林业大学 | 一种火星陨石坑精确识别方法、电子设备及存储介质 |
CN115730654A (zh) * | 2022-11-23 | 2023-03-03 | 湖南大学 | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915619A (zh) * | 2020-06-05 | 2020-11-10 | 华南理工大学 | 一种双特征提取与融合的全卷积网络语义分割方法 |
CN112163628A (zh) * | 2020-10-10 | 2021-01-01 | 北京航空航天大学 | 一种适用于嵌入式设备的改进目标实时识别网络结构的方法 |
CN112837294A (zh) * | 2021-02-07 | 2021-05-25 | 浙江工业大学 | 基于卷积自编码器图像扩增的热成像缺陷检测方法 |
CN113139592A (zh) * | 2021-04-14 | 2021-07-20 | 中国地质大学(武汉) | 基于深度残差U-Net的月球陨石坑识别方法、设备及存储介质 |
WO2021151275A1 (zh) * | 2020-05-20 | 2021-08-05 | 平安科技(深圳)有限公司 | 图像分割方法、装置、设备及存储介质 |
CN113808146A (zh) * | 2021-10-18 | 2021-12-17 | 山东大学 | 一种医学图像多器官分割方法及系统 |
-
2022
- 2022-01-05 CN CN202210005347.XA patent/CN114332070B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021151275A1 (zh) * | 2020-05-20 | 2021-08-05 | 平安科技(深圳)有限公司 | 图像分割方法、装置、设备及存储介质 |
CN111915619A (zh) * | 2020-06-05 | 2020-11-10 | 华南理工大学 | 一种双特征提取与融合的全卷积网络语义分割方法 |
CN112163628A (zh) * | 2020-10-10 | 2021-01-01 | 北京航空航天大学 | 一种适用于嵌入式设备的改进目标实时识别网络结构的方法 |
CN112837294A (zh) * | 2021-02-07 | 2021-05-25 | 浙江工业大学 | 基于卷积自编码器图像扩增的热成像缺陷检测方法 |
CN113139592A (zh) * | 2021-04-14 | 2021-07-20 | 中国地质大学(武汉) | 基于深度残差U-Net的月球陨石坑识别方法、设备及存储介质 |
CN113808146A (zh) * | 2021-10-18 | 2021-12-17 | 山东大学 | 一种医学图像多器官分割方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925115A (zh) * | 2022-05-27 | 2022-08-19 | 天津大学 | 基于深度可分离卷积的轻量化广义负荷分解方法 |
CN115393730A (zh) * | 2022-07-15 | 2022-11-25 | 南京林业大学 | 一种火星陨石坑精确识别方法、电子设备及存储介质 |
CN115730654A (zh) * | 2022-11-23 | 2023-03-03 | 湖南大学 | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 |
CN115730654B (zh) * | 2022-11-23 | 2024-05-14 | 湖南大学 | 层剪枝方法、厨余垃圾检测方法及遥感图像车辆检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114332070B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110335290B (zh) | 基于注意力机制的孪生候选区域生成网络目标跟踪方法 | |
CN108596248B (zh) | 一种基于改进深度卷积神经网络的遥感影像分类方法 | |
CN111126359B (zh) | 基于自编码器与yolo算法的高清图像小目标检测方法 | |
CN114332070B (zh) | 一种基于智能学习网络模型压缩的陨坑检测方法 | |
CN111523553B (zh) | 一种基于相似度矩阵的中心点网络多目标检测方法 | |
CN111160085A (zh) | 一种人体图像关键点姿态估计方法 | |
CN114596500B (zh) | 一种基于通道-空间注意力和DeeplabV3plus的遥感影像语义分割方法 | |
CN111985376A (zh) | 一种基于深度学习的遥感影像舰船轮廓提取方法 | |
CN110334645B (zh) | 一种基于深度学习的月球撞击坑识别方法 | |
CN111127472B (zh) | 一种基于权重学习的多尺度图像分割方法 | |
CN112686097A (zh) | 一种人体图像关键点姿态估计方法 | |
CN113450396B (zh) | 基于骨骼特征的三维/二维图像配准方法及装置 | |
CN106971189B (zh) | 一种低分辨率含噪星图识别方法 | |
CN111553869A (zh) | 一种空基视角下的生成对抗网络图像补全方法 | |
CN113436237B (zh) | 一种基于高斯过程迁移学习的复杂曲面高效测量系统 | |
CN118229889B (zh) | 影视现场预演辅助方法及装置 | |
CN116071664A (zh) | 基于改进CenterNet网络的SAR图像舰船检测方法 | |
CN113989612A (zh) | 基于注意力及生成对抗网络的遥感影像目标检测方法 | |
CN114648724A (zh) | 一种基于生成对抗网络的轻量化高效目标分割与计数方法 | |
CN117315169A (zh) | 基于深度学习多视密集匹配的实景三维模型重建方法和系统 | |
CN117252892B (zh) | 基于轻量化视觉自注意力网络的双分支人像自动抠图装置 | |
CN117237623B (zh) | 一种无人机遥感图像语义分割方法及系统 | |
CN117830701A (zh) | 基于注意力机制的多尺度特征融合星图识别方法和装置 | |
CN117058059A (zh) | 光学遥感图像与sar图像融合的渐进式修复框架去云方法 | |
CN116524352A (zh) | 一种遥感图像水体提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |