CN116403113A - 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 - Google Patents
进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN116403113A CN116403113A CN202310398483.4A CN202310398483A CN116403113A CN 116403113 A CN116403113 A CN 116403113A CN 202310398483 A CN202310398483 A CN 202310398483A CN 116403113 A CN116403113 A CN 116403113A
- Authority
- CN
- China
- Prior art keywords
- landslide
- convolutional neural
- neural network
- data
- evolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 54
- 238000013138 pruning Methods 0.000 title claims abstract description 30
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 24
- 230000035772 mutation Effects 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 18
- 238000010606 normalization Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 11
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 230000001174 ascending effect Effects 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 239000000654 additive Substances 0.000 claims description 2
- 230000000996 additive effect Effects 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Abstract
进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质,其方法为:将滑坡数据集中的样本进行预处理后构建基于卷积神经网络的滑坡识别模型;使用交叉熵损失函数构建本方法的损失函数;用预处理后的数据集进行训练,得到训练好的模型;在训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;读取得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练得到最终分类结果;其系统、设备及介质用于根据进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别,具有更好的性能,对硬件设备计算量的需求低,易于部署,实时性好。
Description
技术领域
本发明属于滑坡识别技术领域,尤其涉及一种进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质。
背景技术
滑坡作为一种常见的地质灾害,给世界各地的自然环境、财产和人身安全造成了严重的破坏,由于滑坡经常对人类住区、道路和农业用地造成严重破坏,对滑坡区域进行实时识别,来维护公共财产安全以及确保市民的安全变的越来越重要。
现有技术方案包括传统实地勘测,以及基于传统机器学习的滑坡识别方法和基于深度学习的滑坡识别方法。
传统实地勘测对于滑坡探测是有效和准确的,但是很多地方难以进行实地调查,需要大量的人力、物力和财力资源并且具有一定的危险性;基于传统机器学习的滑坡识别方法和基于深度学习的滑坡识别方法,则需要专家根据光学图像数据和其它地质信息判断是否发生了滑坡,这种方法需要耗费大量时间,实时性差,对滑坡灾害发生的区域难以及时救助,并且其解释精度可能较差。随着遥感技术的快速发展,从卫星图像自动检测滑坡已得到广泛应用,从光学图像中检测滑坡也越来越受到关注,数字高程模型(Digital TerrainModel)数据提供了地形信息,在滑坡预测和识别中发挥着重要作用,起初将滑坡识别视为图像处理问题,统计方法和机器学习方法得到了广泛应用。例如,模糊逻辑模型、逻辑回归模型已被开发用于区分滑坡区域。还开发了机器学习方法,支持向量机、随机森林等方法。随着深度学习的快速发展,目前,深度学习方法,特别是卷积神经网络(ConvolutionalNeural Networks,CNN)在计算机视觉的各项任务上超过了以往的机器学习方法。目前卷积神经网络广泛应用在滑坡识别问题上,使用卷积神经网络提取滑坡图像的特征,识别是否发生滑坡。目前用来滑坡识别的卷积神经网络都是非常基本的网络架构,即一系列卷积层和池化层,随后是全连接层,被用来检测滑坡,这些算法只追求检测的精度,忽略了网络模型的计算复杂度,使得现有的网络模型训练和推理难度大,并且对硬件有很高的要求,实时性差,难以在实际中应用。
目前最常用于滑坡识别的技术是通过深度学习中的卷积神经网络对滑坡区域进行识别,《Landslide detection from an open satellite imagery and digitalelevation model dataset using attention boosted convolutional neuralnetworks》使用注意力卷积神经网络来进行滑坡识别,该方法提出的注意力机制有效的提高了卷积神经网络的特征信息提取能力,可以较好的识别出滑坡区域,但是该方法忽略了滑坡识别需要实时性,在实际部署的过程中,计算资源往往受限,目前这些技术对硬件设备有较高的要求,因此难以实际中应用。
发明内容
为了克服上述现有技术的不足,本发明的目的在于提出一种进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质,在滑坡识别网络加入大核卷积与3×3卷积相结合,可以将局部信息和长距离信息相结合;选择搜索掩码以及分层初始化,在搜索过程中种群更具有多样性;进一步提出了连续化掩码搜索策略,在搜索过程中根据网络通道权重的变化情况来决定通道的保留和舍弃,并根据该连续化掩码搜索策略,在种群交叉和变异过程中,提出了通道权重取均值和取反的策略,相比传统的进化算法剪枝策略,该方法有更好的性能。
为实现上述目的,本发明采用的技术方案如下:
一种进化剪枝轻量化卷积神经网络的滑坡识别方法,具体如下:
S1、将滑坡数据集中的样本划分为训练集和测试集;
S2、对训练集和测试集图像大小进行调整:对步骤S1划分的训练集进行数据增强,并对训练集和测试集进行归一化和标准化操作;
S3、构建基于卷积神经网络的滑坡识别模型;
S4、基于步骤S3构建的模型,使用交叉熵损失函数构建损失函数;
S5、用基于步骤S2预处理后的数据集对步骤S4处理后的模型进行训练,得到训练好的模型;
S6、在步骤S5训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;
S7、在读取步骤S6得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练,得到最终分类结果。
所述步骤S2具体方法为:
S201、对步骤S1划分的数据集进行预处理,通过双线性插值的方法将训练集和测试集图像大小统一;
S202、自定义概率对训练集进行翻转、旋转,实现数据增强;
S203、对训练集和测试集进行归一化和标准化处理:将输入图像数据的像素点值归一化处理,即将数据归一化到[0,1]之间,并进行标准化,标准化公式如下:
其中,x为归一化处理后的图像,mean(x),std(x)分别表示取均值和取标准差操作。
所述步骤S3具体步骤是:
S301、构建包含一个卷积层的特征降维模块;
S302、构建包含3个卷积层、3个批归一化层和2个ReLU非线性激活层的特征提取模块,特征提取模块的3个卷积层分别为1×1卷积,3×3卷积,1×1卷积,其中3×3卷积为深度可分离卷积,特征提取模块首先通过一个1×1卷积对通道数进行升维,让3×3的深度可分离卷积提取更多的图像特征信息,再通过1个1×1卷积降维,将维度还原;
S303、构建由2个1×1卷积层,1个13×13卷积层,1个3×3卷积层,4个批归一化层和4个ReLU非线性激活层组成的LK-Conv模块,其中2个1×1卷积层对特征图进行线性映射,13×13卷积层负责提取特征图的长距离信息,3×3卷积层负责提取特征图的局部信息,再将提取到的长距离信息和局部信息通过相加的方式进行融合,作为最终提取到的特征信息;
S304、构建包含1个LK-Conv、1个批归一化层和1个多层感知机(MultilayerPerceptron,MLP)层的Large-Kernel Residual Block模块;
S305、构建包含1个卷积层、1个全局平均池化层和1个线性层的分类模块;
S306、基于步骤S301构建的特征降维模块、步骤S302构建的特征提取模块、步骤S304构建的Large-Kernel Residual Block模块、步骤S305构建的分类模块,构建轻量化卷积神经网络MobileL-K,该轻量化卷积神经网络MobileL-K网络首先对输入的数据通过特征降维模块进行降维,接下来依次通过特征提取模块和Large-Kernel Residual Block模块进行特征提取,最后通过分类模块进行分类。
所述步骤S4的具体方法为:
对步骤S306分类模块进行分类的训练分类器过程中,损失函数使用交叉熵损失函数Llog(y,p),定义为:
Llog(y,p)=-(ylog(p)+(1-y)log(1-p))
其中,y为标签,p为分类器网络的预测概率;
训练分类器过程中,采用随机梯度下降法进行优化,首先用损失函数J(θ)对(θ)求偏导,参数θ按负梯度方向更新,/>θ′为更新后的网络参数,θj为更新前的网络参数,σ为学习率,/>为输入网络的训练数据,hθ(xi)为训练集的权重,yi为训练集对应的标签,m为每次训练输入的样本数量,从训练集中随机抽出一组样本,每次训练后按梯度下降法则更新。
所述步骤S6的具体方法为:
S601、设置超参数:
种群大小:N;最大进化代数:Gmax;
复杂度上限:Hmax;
输出:种群中适应度函数值最高的个体Pbest;
S602、初始化种群;
S603、进行Gmax代进化,如果g<Gmax,重复S603,否则进入S604;
步骤S602所述初始化种群的方法为:
1)随机产生初始化种群
大小为N×M,种群中每个个体的元素表示中需要剪枝的每层卷积网络所对应的每个通道,因此M=L1+…+Lc+…+LC,Lc表示第c层卷积剪枝前的通道数,每个元素的值,即掩码(mask)值/>随机初始化为1或-1,1表示该通道保留,-1表示该通道舍弃;
2)对每个初始个体计算复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N个个体的复杂度都小于Hmax;
3)设置当前进化代数g=0。
步骤S603进行Gmax代进化,如果g<Gmax,重复S603;具体方法为:
1)将上一代进化后的种群和当前代进化前的种群合并,[Pg-1,Pg],P-1=[];
2)对合并后的种群[Pg-1,Pg]在训练集上进行微调后在测试集上进行推理,计算种群中所有个体的适应度值,并保留适应度值最大的前N个个体组成临时种群Φ,Φ中每个个体的适应度值为F=[f1,f2,...,fN];
3)Mask连续化:根据步骤S601得到的Flscore提出mask连续化策略、公式(3),更新Φ={xij}中每个个体的掩码值:
F1越高的个体,掩码值的绝对值越大;
将所有个体的每个掩码值重新归一化到[-1,1]之间,防止累积后掩码值过大,并且将1或-1的离散掩码值连续化为[-1,1]之间的任意小数;
更新Φ={xij},i=1...N,j=1...M;
4)交叉操作:从Φ中随机选择两个个体P1和P2作为交叉操作的父代,提出的均值交叉算子即公式(4),循环产生N/2个交叉新个体[α1 α2 …αN/2]T;对每个新产生的交叉个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax;
5)变异操作:从Φ中随机选择一个个体
φi=[xi1 xi2 … xiM],作为变异操作的父代,根据提出的取反变异算子(公式5),循环产生N/2个变异新个体[β1 β2 … βN/2]T,对每个新产生的变异个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax
其中,r是[0,1]的随机数,变异率ρ=1-|xij|,可以随着掩码值自适应调整,当掩码值的绝对值较大时,变异率越小,反之变异率越大;
6)将交叉和变异产生的新个体合并,组成进化后的新种群Pg+1,
Pg+1=[α1,α2,...,αN/2,β1,β2,...,βN/2]T;
7)更新进化代数g=g+1。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别系统,其特征在于可以对数据进行预处理并对模型进行训练和测试,所述系统包括:
数据预处理模块,用于对输入的数据进行预处理,包括将数据的大小统一,并进行数据增强。
模型训练模块,用于把训练数据输入到模型当中对模型进行训练。
模型存储模块,用于保存训练好的模型。
预测模块,用于把需要测试的数据输入到训练好的模型当中并输出预测的结果。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别设备,其特征在于负责支持进化剪枝轻量化卷积神经网络的滑坡识别系统的运行,所述设备包括:
存储器,用于存储计算机程序,数据和模型;
处理器,用于执行所述计算机程序时实现步骤1至7任一项所述基于进化剪枝轻量化卷积神经网络的滑坡识别方法的运行。
一种计算机可读存储介质,其特征在于负责对程序和数据进行读取和存储,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够基于步骤1至7所述的进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别。
本发明与现有技术相比,具有如下优点:
1)首先本发明采取大核卷积,可以获取更大的感受野的内容,相比于现有的卷积神经网络,降低了模型复杂度的同时提升了检测性能;相比于其他剪枝算法在滑坡识别中的效果更好。
2)本发明提出的连续化进化剪枝策略,通过分析搜索过程中搜索通道数和掩码,以及分层初始化和全局初始化的区别,选择了搜索掩码以及分层初始化,该方法相比其他方法在搜索过程中种群更具有多样性,有效的降低了模型的复杂度,并且较好的保持了模型在滑坡识别方面的性能,相比与于其他剪枝算法,具有更好的效果。
3)本发明在使用进化算法对网络模型进行剪枝的时候,提出了连续化掩码搜索策略,在搜索过程中根据网络通道权重的变化情况来决定通道的保留和舍弃,并根据该连续化掩码搜索策略,在种群交叉和变异过程中,提出了通道权重取均值和取反的策略,具有更好的性能,对硬件设备计算量的需求低,易于部署,实时性好,在滑坡发生时及时救助,做出应对措施,有助于减少公共财产安全损失,保护人民生命安全。
4)本发明的进化算法剪枝策略可以推广到现有的卷积神经网络中,特征提取模块选取了MobileViT作为基础网络,当有性能更好、效率更高的网络被提出时,可以通过使用更优的基础网络实现技术的更新;随着新兴技术的发展以及更优网络的提出,本发明依旧能够对网络进行剪枝,让更优的网络变得轻量化。
附图说明
图1为本发明的流程图。
图2为本发明提出的MobileL-K的总体结构。
图3为本发明LK-Conv模块。
图4为本发明Large-Kernel Residual Block模块。
具体实施方式
以下结合附图和具体实施例,对本发明作进一步详细的描述。
一种进化剪枝轻量化卷积神经网络的滑坡识别方法,具体步骤如下:
S1、将公开的毕节市滑坡数据集中的样本按照7∶3的比例划分为训练集和测试集;
S2、对训练集和测试集图像大小进行调整:对步骤S1划分的训练集进行数据增强,并对训练集和测试集进行归一化和标准化操作;
S201、对步骤S1划分的数据集进行预处理,首先通过双线性插值的方法将训练集和测试集图像大小统一为256×256;
S202、以50%概率对训练集进行水平翻转、垂直翻转、一90度和90度之间的旋转,实现数据增强;
S203、对训练集和测试集进行归一化和标准化处理,首先将输入图像数据的像素点值归一化处理,即将数据归一化到[0,1]之间,并进行标准化,标准化公式如下:
其中,x为归一化处理后的图像,mean(x),std(x)分别表示取均值和取标准差操作;
S3、构建基于卷积神经网络的滑坡识别模型,请参阅图2;
S301、构建包含一个卷积层的特征降维模块;
S302、构建包含3个卷积层、3个批归一化层和2个ReLU非线性激活层的特征提取模块,特征提取模块的3个卷积层分别为1×1卷积,3×3卷积,1×1卷积,其中3×3卷积为深度可分离卷积,特征提取模块首先通过一个1×1卷积对通道数进行升维,这样可以让3×3的深度可分离卷积提取更多的图像特征信息,接下来再通过1个1×1卷积降维,将维度还原;
S303、构建由2个1×1卷积层,1个13×13卷积层,1个3×3卷积层,4个批归一化层和4个ReLU非线性激活层组成的LK-Conv模块,请参阅图3;其中2个1×1卷积层对特征图进行线性映射,13×13卷积层负责提取特征图的长距离信息,3×3卷积层负责提取特征图的局部信息,再将提取到的长距离信息和局部信息通过相加的方式进行融合,作为最终提取到的特征信息;
S304、构建包含1个LK-Conv、1个批归一化层和1个多层感知机(MultilayerPerceptron,MLP)层的Large-Kernel Residual Block模块;请参阅图4;
S305、构建包含1个卷积层、1个全局平均池化层和1个线性层的分类模块;
S306、基于步骤S301构建的特征降维模块,步骤S302构建的特征提取模块,步骤S304构建的Large-Kernel Residual Block模块,步骤S305构建的分类模块构建轻量化卷积神经网络MobileL-K,该轻量化卷积神经网络MobileL-K网络首先对输入的数据通过特征降维模块进行降维,接下来依次通过特征提取模块和Large-Kernel Residual Block模块进行特征提取,最后通过分类模块进行分类;
S4、基于步骤S3构建的模型,使用交叉熵损失函数构建本方法的损失函数;
在步骤S306通过分类模块进行分类的训练分类器过程中,损失函数使用交叉熵损失函数Llog(y,p),定义为:
Llog(y,p)=-(ylog(p)+(1-y)log(1-p))
其中,y为标签,p为分类器网络的预测概率;
训练过程中,采用随机梯度下降法进行优化,首先用损失函数J(θ)对(θ)求偏导,参数θ按负梯度方向更新,/>θ′为更新后的网络参数,θj为更新前的网络参数,σ为学习率,/>为输入网络的训练数据,hθ(xi)为训练集的权重,yi为训练集对应的标签,m为每次训练输入的样本数量,从训练集中随机抽出一组样本,每次训练后按梯度下降法则更新;
S5、用基于步骤S2预处理后的数据集对步骤S4处理后的模型进行训练,得到训练好的模型;
S6、在步骤S5训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;
S601、设置超参数:
种群大小:N;最大进化代数:Gmax;
复杂度上限:Hmax;
输出:种群中适应度函数值最高的个体Pbest;
S602、初始化种群:
1)随机产生初始化种群
大小为N×M,种群中每个个体的元素表示中需要剪枝的每层卷积网络所对应的每个通道,因此M=L1+…+Lc+…+LC,Lc表示第c层卷积剪枝前的通道数,每个元素的值,即掩码(mask)值/>随机初始化为1或-1,1表示该通道保留,-1表示该通道舍弃;
2)对每个初始个体计算复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N个个体的复杂度都小于Hmax;
3)设置当前进化代数g=0;
S603、进行Gmax代进化,如果g<Gmax,重复S603,否则跳转到S604;
1)将上一代进化后的种群和当前代进化前的种群合并,[Pg-1,Pg],P-1=[];
2)对合并后的种群[Pg-1,Pg]在训练集上进行微调后在测试集上进行推理,计算种群中所有个体的适应度值,并保留适应度值最大的前N个个体组成临时种群Φ,Φ中每个个体的适应度值为F=[f1,f2,...,fN];
3)Mask连续化:根据步骤S601得到的F1score提出mask连续化策略,公式(3),更新Φ={xij}中每个个体的掩码值:
F1越高的个体,掩码值的绝对值越大;
将所有个体的每个掩码值重新归一化到[-1,1]之间,防止累积后掩码值过大,并且将1或-1的离散掩码值连续化为[-1,1]之间的任意小数;
更新Φ={xij},i=1...N,j=1…M
4)交叉操作:从Φ中随机选择两个个体P1和P2作为交叉操作的父代,根据提出的均值交叉算子即公式(4),循环产生N/2个交叉新个体[α1 α2 … αN/2]T;对每个新产生的交叉个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax;
5)变异操作:从Φ中随机选择一个个体
φi=[xi1 xi2 … xiM],作为变异操作的父代,根据提出的取反变异算子(公式5),循环产生N/2个变异新个体[β1 β2 … βN/2]T,对每个新产生的变异个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax
其中,f是[0,1]的随机数,变异率ρ=1-|xij|,可以随着掩码值自适应调整,当掩码值的绝对值较大时,变异率越小,反之变异率越大;
6)将交叉和变异产生的新个体合并,组成进化后的新种群Pg+1,
Pg+1=[α1,α2,...,αN/2,β1,β2,...,βN/2]T;
7)更新进化代数g=g+1;
S7、读取S6得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练得到最终分类结果。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别系统,可以对滑坡数据进行预处理并对模型进行训练和测试,所述系统包括:
数据预处理模块,用于对输入的滑坡数据进行预处理,包括将数据的大小统一,并进行数据增强。
模型训练模块,用于把训练数据输入到模型当中对模型进行训练。
模型存储模块,用于保存训练好的模型。
预测模块,用于把需要测试的滑坡数据输入到训练好的模型当中并输出预测的结果。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别设备,其特征在于负责支持进化剪枝轻量化卷积神经网络的滑坡识别系统的运行,所述设备包括:
存储器,用于存储计算机程序,数据和模型;
处理器,用于执行所述计算机程序时实现步骤1至7任一项所述基于进化剪枝轻量化卷积神经网络的滑坡识别方法的运行。
一种计算机可读存储介质,其特征在于负责对程序和数据进行读取和存储,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够基于步骤1至7所述的进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别。
以下是对本发明建立的滑坡识别模型(MobileL-K)与现有模型对比实验数据,见表1
表1对比实验表
通过对比发现,本发明MobileL-K在预测的准确率上和F1分数上均比其他方法要高,并且本发明相比其他方法对硬件需求低,推理速度比其他方法更快。
Claims (10)
1.一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,具体步骤如下:
S1、将滑坡数据集中的样本划分为训练集和测试集;
S2、对训练集和测试集图像大小进行调整:对步骤S1划分的训练集进行数据增强,并对训练集和测试集进行归一化和标准化操作;
S3、构建基于卷积神经网络的滑坡识别模型;
S4、基于步骤S3构建的模型,使用交叉熵损失函数构建损失函数;
S5、用基于步骤S2预处理后的数据集对步骤S4处理后的模型进行训练,得到训练好的模型;
S6、在步骤S5训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;
S7、在读取步骤S6得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练,得到最终分类结果。
3.根据权利要求1所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,所述步骤S3具体步骤是:
S301、构建包含一个卷积层的特征降维模块;
S302、构建包含3个卷积层、3个批归一化层和2个ReLU非线性激活层的特征提取模块,特征提取模块的3个卷积层分别为1×1卷积,3×3卷积,1×1卷积,其中3×3卷积为深度可分离卷积,特征提取模块首先通过一个1×1卷积对通道数进行升维,让3×3的深度可分离卷积提取更多的图像特征信息,再通过1个1×1卷积降维,将维度还原;
S303、构建由2个1×1卷积层,1个13×13卷积层,1个3×3卷积层,4个批归一化层和4个ReLU非线性激活层组成的LK-Conv模块,其中2个1×1卷积层对特征图进行线性映射,13×13卷积层负责提取特征图的长距离信息,3×3卷积层负责提取特征图的局部信息,再将提取到的长距离信息和局部信息通过相加的方式进行融合,作为最终提取到的特征信息;
S304、构建包含1个LK-Conv、1个批归一化层和1个多层感知机(MultilayerPerceptron,MLP)层的Large-Kernel Residual Block模块;
S305、构建包含1个卷积层、1个全局平均池化层和1个线性层的分类模块;
S306、基于步骤S301构建的特征降维模块、步骤S302构建的特征提取模块、步骤S304构建的Large-Kernel Residual Block模块、步骤S305构建的分类模块,构建轻量化卷积神经网络MobileL-K,该轻量化卷积神经网络MobileL-K网络首先对输入的数据通过特征降维模块进行降维,接下来依次通过特征提取模块和Large-Kernel Residual Block模块进行特征提取,最后通过分类模块进行分类。
4.根据权利要求1所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,所述步骤S4的具体方法为:
对步骤S306分类模块进行分类的训练分类器过程中,损失函数使用交叉熵损失函数Llog(y,p),定义为:
Llog(y,p)=-(ylog(p)+(1-y)log(1-p))
其中,y为标签,p为分类器网络的预测概率;
7.根据权利要求5所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,步骤S603进行Gmax代进化,如果g<Gmax,重复S603;具体方法为:
1)将上一代进化后的种群和当前代进化前的种群合并,[Pg-1,Pg],P-1=[];
2)对合并后的种群[Pg-1,Pg]在训练集上进行微调后在测试集上进行推理,计算种群中所有个体的适应度值,并保留适应度值最大的前N个个体组成临时种群Φ,Φ中每个个体的适应度值为F=[f1,f2,...,fN];
3)Mask连续化:根据步骤S601得到的F1score提出mask连续化策略,公式(3),更新Φ={xij}中每个个体的掩码值:
F1越高的个体,掩码值的绝对值越大;
将所有个体的每个掩码值重新归一化到[-1,1]之间,防止累积后掩码值过大,并且将1或-1的离散掩码值连续化为[-1,1]之间的任意小数;
更新Φ={xij},i=1...N,j=1...M;
4)交叉操作:从Φ中随机选择两个个体P1和P2作为交叉操作的父代,提出的均值交叉算子即公式(4),循环产生N/2个交叉新个体[α1 α2…αN/2]T;对每个新产生的交叉个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax;
5)变异操作:从Φ中随机选择一个个体
φi=[xi1 xi2…xiM],作为变异操作的父代,根据提出的取反变异算子(公式5),循环产生N/2个变异新个体[β1 β2…βN/2]T,对每个新产生的变异个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax
其中,r是[0,1]的随机数,变异率ρ=1-|xij|,可以随着掩码值自适应调整,当掩码值的绝对值较大时,变异率越小,反之变异率越大;
6)将交叉和变异产生的新个体合并,组成进化后的新种群Pg+1,
Pg+1=[α1,α2,...,αN/2,β1,β2,...,βN/2]T;
7)更新进化代数g=g+1。
8.一种基于权利要求1至7任一项所述方法的进化剪枝轻量化卷积神经网络的滑坡识别系统,其特征在于,可以对滑坡数据进行预处理并对模型进行训练和测试,所述系统包括:
数据预处理模块,用于对输入的滑坡数据进行预处理,包括将数据的大小统一,并进行数据增强。
模型训练模块,用于把训练数据输入到模型当中对模型进行训练。
模型存储模块,用于保存训练好的模型。
预测模块,用于把需要测试的滑坡数据输入到训练好的模型当中并输出预测的结果。
9.一种基于权利要求1至7任一项所述方法的进化剪枝轻量化卷积神经网络的滑坡识别设备,其特征在于,负责支持进化剪枝轻量化卷积神经网络的滑坡识别系统的运行,所述设备包括:
存储器,用于存储计算机程序,数据和模型;
处理器,用于执行所述计算机程序时实现步骤1至7任一项所述基于进化剪枝轻量化卷积神经网络的滑坡识别方法的运行。
10.一种计算机可读存储介质,其特征在于,负责对程序和数据进行读取和存储,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够基于步骤1至7所述的进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310398483.4A CN116403113A (zh) | 2023-04-14 | 2023-04-14 | 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310398483.4A CN116403113A (zh) | 2023-04-14 | 2023-04-14 | 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116403113A true CN116403113A (zh) | 2023-07-07 |
Family
ID=87017727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310398483.4A Pending CN116403113A (zh) | 2023-04-14 | 2023-04-14 | 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116403113A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116625317A (zh) * | 2023-07-26 | 2023-08-22 | 天津达一众诚科技有限公司 | 一种基于图像处理的陡坡表面坡度检测方法及设备 |
CN117497194B (zh) * | 2023-12-28 | 2024-03-01 | 苏州元脑智能科技有限公司 | 一种生物信息处理方法、装置、电子设备和存储介质 |
-
2023
- 2023-04-14 CN CN202310398483.4A patent/CN116403113A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116625317A (zh) * | 2023-07-26 | 2023-08-22 | 天津达一众诚科技有限公司 | 一种基于图像处理的陡坡表面坡度检测方法及设备 |
CN116625317B (zh) * | 2023-07-26 | 2023-10-03 | 天津达一众诚科技有限公司 | 一种基于图像处理的陡坡表面坡度检测方法及设备 |
CN117497194B (zh) * | 2023-12-28 | 2024-03-01 | 苏州元脑智能科技有限公司 | 一种生物信息处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110443143B (zh) | 多分支卷积神经网络融合的遥感图像场景分类方法 | |
CN111563557B (zh) | 一种电力电缆隧道内目标检测的方法 | |
CN108108751B (zh) | 一种基于卷积多特征和深度随机森林的场景识别方法 | |
CN116403113A (zh) | 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 | |
CN110689086A (zh) | 基于生成式对抗网络的半监督高分遥感图像场景分类方法 | |
CN111914907A (zh) | 一种基于深度学习空谱联合网络的高光谱图像分类方法 | |
CN112036447B (zh) | 零样本目标检测系统及可学习语义和固定语义融合方法 | |
CN112464911A (zh) | 基于改进YOLOv3-tiny的交通标志检测与识别方法 | |
CN111738054B (zh) | 一种基于时空自编码器网络和时空cnn的行为异常检测方法 | |
CN114998220B (zh) | 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法 | |
CN112163520B (zh) | 一种基于改进损失函数的mdssd人脸检测方法 | |
CN110599502B (zh) | 一种基于深度学习的皮肤病变分割方法 | |
Feng et al. | Bag of visual words model with deep spatial features for geographical scene classification | |
CN111507227B (zh) | 基于深度学习的多学生个体分割及状态自主识别方法 | |
CN112950780B (zh) | 一种基于遥感影像的网络地图智能生成方法及系统 | |
CN112307982A (zh) | 基于交错增强注意力网络的人体行为识别方法 | |
CN112070040A (zh) | 一种用于视频字幕的文本行检测方法 | |
CN113205103A (zh) | 一种轻量级的文身检测方法 | |
CN115393690A (zh) | 一种轻量化神经网络的空对地观测多目标识别方法 | |
CN115830449A (zh) | 显式轮廓引导和空间变化上下文增强的遥感目标检测方法 | |
CN111310820A (zh) | 基于交叉验证深度cnn特征集成的地基气象云图分类方法 | |
CN115240259A (zh) | 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统 | |
CN111507416A (zh) | 一种基于深度学习的吸烟行为实时检测方法 | |
CN115019132A (zh) | 一种用于复杂背景船舶的多目标识别方法 | |
CN114187506A (zh) | 视点意识的动态路由胶囊网络的遥感图像场景分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |