CN116403113A - 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 - Google Patents

进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 Download PDF

Info

Publication number
CN116403113A
CN116403113A CN202310398483.4A CN202310398483A CN116403113A CN 116403113 A CN116403113 A CN 116403113A CN 202310398483 A CN202310398483 A CN 202310398483A CN 116403113 A CN116403113 A CN 116403113A
Authority
CN
China
Prior art keywords
landslide
convolutional neural
neural network
data
evolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310398483.4A
Other languages
English (en)
Inventor
王蓉芳
王笑凯
李卫斌
焦昶哲
牛毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202310398483.4A priority Critical patent/CN116403113A/zh
Publication of CN116403113A publication Critical patent/CN116403113A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质,其方法为:将滑坡数据集中的样本进行预处理后构建基于卷积神经网络的滑坡识别模型;使用交叉熵损失函数构建本方法的损失函数;用预处理后的数据集进行训练,得到训练好的模型;在训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;读取得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练得到最终分类结果;其系统、设备及介质用于根据进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别,具有更好的性能,对硬件设备计算量的需求低,易于部署,实时性好。

Description

进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及 介质
技术领域
本发明属于滑坡识别技术领域,尤其涉及一种进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质。
背景技术
滑坡作为一种常见的地质灾害,给世界各地的自然环境、财产和人身安全造成了严重的破坏,由于滑坡经常对人类住区、道路和农业用地造成严重破坏,对滑坡区域进行实时识别,来维护公共财产安全以及确保市民的安全变的越来越重要。
现有技术方案包括传统实地勘测,以及基于传统机器学习的滑坡识别方法和基于深度学习的滑坡识别方法。
传统实地勘测对于滑坡探测是有效和准确的,但是很多地方难以进行实地调查,需要大量的人力、物力和财力资源并且具有一定的危险性;基于传统机器学习的滑坡识别方法和基于深度学习的滑坡识别方法,则需要专家根据光学图像数据和其它地质信息判断是否发生了滑坡,这种方法需要耗费大量时间,实时性差,对滑坡灾害发生的区域难以及时救助,并且其解释精度可能较差。随着遥感技术的快速发展,从卫星图像自动检测滑坡已得到广泛应用,从光学图像中检测滑坡也越来越受到关注,数字高程模型(Digital TerrainModel)数据提供了地形信息,在滑坡预测和识别中发挥着重要作用,起初将滑坡识别视为图像处理问题,统计方法和机器学习方法得到了广泛应用。例如,模糊逻辑模型、逻辑回归模型已被开发用于区分滑坡区域。还开发了机器学习方法,支持向量机、随机森林等方法。随着深度学习的快速发展,目前,深度学习方法,特别是卷积神经网络(ConvolutionalNeural Networks,CNN)在计算机视觉的各项任务上超过了以往的机器学习方法。目前卷积神经网络广泛应用在滑坡识别问题上,使用卷积神经网络提取滑坡图像的特征,识别是否发生滑坡。目前用来滑坡识别的卷积神经网络都是非常基本的网络架构,即一系列卷积层和池化层,随后是全连接层,被用来检测滑坡,这些算法只追求检测的精度,忽略了网络模型的计算复杂度,使得现有的网络模型训练和推理难度大,并且对硬件有很高的要求,实时性差,难以在实际中应用。
目前最常用于滑坡识别的技术是通过深度学习中的卷积神经网络对滑坡区域进行识别,《Landslide detection from an open satellite imagery and digitalelevation model dataset using attention boosted convolutional neuralnetworks》使用注意力卷积神经网络来进行滑坡识别,该方法提出的注意力机制有效的提高了卷积神经网络的特征信息提取能力,可以较好的识别出滑坡区域,但是该方法忽略了滑坡识别需要实时性,在实际部署的过程中,计算资源往往受限,目前这些技术对硬件设备有较高的要求,因此难以实际中应用。
发明内容
为了克服上述现有技术的不足,本发明的目的在于提出一种进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质,在滑坡识别网络加入大核卷积与3×3卷积相结合,可以将局部信息和长距离信息相结合;选择搜索掩码以及分层初始化,在搜索过程中种群更具有多样性;进一步提出了连续化掩码搜索策略,在搜索过程中根据网络通道权重的变化情况来决定通道的保留和舍弃,并根据该连续化掩码搜索策略,在种群交叉和变异过程中,提出了通道权重取均值和取反的策略,相比传统的进化算法剪枝策略,该方法有更好的性能。
为实现上述目的,本发明采用的技术方案如下:
一种进化剪枝轻量化卷积神经网络的滑坡识别方法,具体如下:
S1、将滑坡数据集中的样本划分为训练集和测试集;
S2、对训练集和测试集图像大小进行调整:对步骤S1划分的训练集进行数据增强,并对训练集和测试集进行归一化和标准化操作;
S3、构建基于卷积神经网络的滑坡识别模型;
S4、基于步骤S3构建的模型,使用交叉熵损失函数构建损失函数;
S5、用基于步骤S2预处理后的数据集对步骤S4处理后的模型进行训练,得到训练好的模型;
S6、在步骤S5训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;
S7、在读取步骤S6得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练,得到最终分类结果。
所述步骤S2具体方法为:
S201、对步骤S1划分的数据集进行预处理,通过双线性插值的方法将训练集和测试集图像大小统一;
S202、自定义概率对训练集进行翻转、旋转,实现数据增强;
S203、对训练集和测试集进行归一化和标准化处理:将输入图像数据的像素点值归一化处理,即将数据归一化到[0,1]之间,并进行标准化,标准化公式如下:
Figure BDA0004178472860000041
其中,x为归一化处理后的图像,mean(x),std(x)分别表示取均值和取标准差操作。
所述步骤S3具体步骤是:
S301、构建包含一个卷积层的特征降维模块;
S302、构建包含3个卷积层、3个批归一化层和2个ReLU非线性激活层的特征提取模块,特征提取模块的3个卷积层分别为1×1卷积,3×3卷积,1×1卷积,其中3×3卷积为深度可分离卷积,特征提取模块首先通过一个1×1卷积对通道数进行升维,让3×3的深度可分离卷积提取更多的图像特征信息,再通过1个1×1卷积降维,将维度还原;
S303、构建由2个1×1卷积层,1个13×13卷积层,1个3×3卷积层,4个批归一化层和4个ReLU非线性激活层组成的LK-Conv模块,其中2个1×1卷积层对特征图进行线性映射,13×13卷积层负责提取特征图的长距离信息,3×3卷积层负责提取特征图的局部信息,再将提取到的长距离信息和局部信息通过相加的方式进行融合,作为最终提取到的特征信息;
S304、构建包含1个LK-Conv、1个批归一化层和1个多层感知机(MultilayerPerceptron,MLP)层的Large-Kernel Residual Block模块;
S305、构建包含1个卷积层、1个全局平均池化层和1个线性层的分类模块;
S306、基于步骤S301构建的特征降维模块、步骤S302构建的特征提取模块、步骤S304构建的Large-Kernel Residual Block模块、步骤S305构建的分类模块,构建轻量化卷积神经网络MobileL-K,该轻量化卷积神经网络MobileL-K网络首先对输入的数据通过特征降维模块进行降维,接下来依次通过特征提取模块和Large-Kernel Residual Block模块进行特征提取,最后通过分类模块进行分类。
所述步骤S4的具体方法为:
对步骤S306分类模块进行分类的训练分类器过程中,损失函数使用交叉熵损失函数Llog(y,p),定义为:
Llog(y,p)=-(ylog(p)+(1-y)log(1-p))
其中,y为标签,p为分类器网络的预测概率;
训练分类器过程中,采用随机梯度下降法进行优化,首先用损失函数J(θ)对(θ)求偏导,
Figure BDA0004178472860000051
参数θ按负梯度方向更新,/>
Figure BDA0004178472860000052
θ′为更新后的网络参数,θj为更新前的网络参数,σ为学习率,/>
Figure BDA0004178472860000053
为输入网络的训练数据,hθ(xi)为训练集的权重,yi为训练集对应的标签,m为每次训练输入的样本数量,从训练集中随机抽出一组样本,每次训练后按梯度下降法则更新。
所述步骤S6的具体方法为:
S601、设置超参数:
种群大小:N;最大进化代数:Gmax;
适应度函数:
Figure BDA0004178472860000061
复杂度函数:
Figure BDA0004178472860000062
输入:一个训练好的CNN网络
Figure BDA0004178472860000063
复杂度上限:Hmax;
输出:种群中适应度函数值最高的个体Pbest;
S602、初始化种群;
S603、进行Gmax代进化,如果g<Gmax,重复S603,否则进入S604;
S604、对最终的种群
Figure BDA0004178472860000064
中的所有个体计算适应度值,从中选择适应度值最高,即F1 score最大的个体Pbest,输出其网络结构和权值。
步骤S602所述初始化种群的方法为:
1)随机产生初始化种群
Figure BDA0004178472860000065
大小为N×M,种群中每个个体的元素表示
Figure BDA0004178472860000066
中需要剪枝的每层卷积网络所对应的每个通道,因此M=L1+…+Lc+…+LC,Lc表示第c层卷积剪枝前的通道数,每个元素的值,即掩码(mask)值/>
Figure BDA0004178472860000071
随机初始化为1或-1,1表示该通道保留,-1表示该通道舍弃;
2)对每个初始个体计算复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N个个体的复杂度都小于Hmax;
3)设置当前进化代数g=0。
步骤S603进行Gmax代进化,如果g<Gmax,重复S603;具体方法为:
1)将上一代进化后的种群和当前代进化前的种群合并,[Pg-1,Pg],P-1=[];
2)对合并后的种群[Pg-1,Pg]在训练集上进行微调后在测试集上进行推理,计算种群中所有个体的适应度值,并保留适应度值最大的前N个个体组成临时种群Φ,Φ中每个个体的适应度值为F=[f1,f2,...,fN];
3)Mask连续化:根据步骤S601得到的Flscore提出mask连续化策略、公式(3),更新Φ={xij}中每个个体的掩码值:
Figure BDA0004178472860000072
F1越高的个体,掩码值的绝对值越大;
Figure BDA0004178472860000073
Figure BDA0004178472860000074
将所有个体的每个掩码值重新归一化到[-1,1]之间,防止累积后掩码值过大,并且将1或-1的离散掩码值连续化为[-1,1]之间的任意小数;
更新Φ={xij},i=1...N,j=1...M;
4)交叉操作:从Φ中随机选择两个个体P1和P2作为交叉操作的父代,提出的均值交叉算子即公式(4),循环产生N/2个交叉新个体[α1 α2 …αN/2]T;对每个新产生的交叉个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax;
Figure BDA0004178472860000081
5)变异操作:从Φ中随机选择一个个体
φi=[xi1 xi2 … xiM],作为变异操作的父代,根据提出的取反变异算子(公式5),循环产生N/2个变异新个体[β1 β2 … βN/2]T,对每个新产生的变异个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax
Figure BDA0004178472860000082
其中,r是[0,1]的随机数,变异率ρ=1-|xij|,可以随着掩码值自适应调整,当掩码值的绝对值较大时,变异率越小,反之变异率越大;
6)将交叉和变异产生的新个体合并,组成进化后的新种群Pg+1
Pg+1=[α1,α2,...,αN/2,β1,β2,...,βN/2]T
7)更新进化代数g=g+1。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别系统,其特征在于可以对数据进行预处理并对模型进行训练和测试,所述系统包括:
数据预处理模块,用于对输入的数据进行预处理,包括将数据的大小统一,并进行数据增强。
模型训练模块,用于把训练数据输入到模型当中对模型进行训练。
模型存储模块,用于保存训练好的模型。
预测模块,用于把需要测试的数据输入到训练好的模型当中并输出预测的结果。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别设备,其特征在于负责支持进化剪枝轻量化卷积神经网络的滑坡识别系统的运行,所述设备包括:
存储器,用于存储计算机程序,数据和模型;
处理器,用于执行所述计算机程序时实现步骤1至7任一项所述基于进化剪枝轻量化卷积神经网络的滑坡识别方法的运行。
一种计算机可读存储介质,其特征在于负责对程序和数据进行读取和存储,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够基于步骤1至7所述的进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别。
本发明与现有技术相比,具有如下优点:
1)首先本发明采取大核卷积,可以获取更大的感受野的内容,相比于现有的卷积神经网络,降低了模型复杂度的同时提升了检测性能;相比于其他剪枝算法在滑坡识别中的效果更好。
2)本发明提出的连续化进化剪枝策略,通过分析搜索过程中搜索通道数和掩码,以及分层初始化和全局初始化的区别,选择了搜索掩码以及分层初始化,该方法相比其他方法在搜索过程中种群更具有多样性,有效的降低了模型的复杂度,并且较好的保持了模型在滑坡识别方面的性能,相比与于其他剪枝算法,具有更好的效果。
3)本发明在使用进化算法对网络模型进行剪枝的时候,提出了连续化掩码搜索策略,在搜索过程中根据网络通道权重的变化情况来决定通道的保留和舍弃,并根据该连续化掩码搜索策略,在种群交叉和变异过程中,提出了通道权重取均值和取反的策略,具有更好的性能,对硬件设备计算量的需求低,易于部署,实时性好,在滑坡发生时及时救助,做出应对措施,有助于减少公共财产安全损失,保护人民生命安全。
4)本发明的进化算法剪枝策略可以推广到现有的卷积神经网络中,特征提取模块选取了MobileViT作为基础网络,当有性能更好、效率更高的网络被提出时,可以通过使用更优的基础网络实现技术的更新;随着新兴技术的发展以及更优网络的提出,本发明依旧能够对网络进行剪枝,让更优的网络变得轻量化。
附图说明
图1为本发明的流程图。
图2为本发明提出的MobileL-K的总体结构。
图3为本发明LK-Conv模块。
图4为本发明Large-Kernel Residual Block模块。
具体实施方式
以下结合附图和具体实施例,对本发明作进一步详细的描述。
一种进化剪枝轻量化卷积神经网络的滑坡识别方法,具体步骤如下:
S1、将公开的毕节市滑坡数据集中的样本按照7∶3的比例划分为训练集和测试集;
S2、对训练集和测试集图像大小进行调整:对步骤S1划分的训练集进行数据增强,并对训练集和测试集进行归一化和标准化操作;
S201、对步骤S1划分的数据集进行预处理,首先通过双线性插值的方法将训练集和测试集图像大小统一为256×256;
S202、以50%概率对训练集进行水平翻转、垂直翻转、一90度和90度之间的旋转,实现数据增强;
S203、对训练集和测试集进行归一化和标准化处理,首先将输入图像数据的像素点值归一化处理,即将数据归一化到[0,1]之间,并进行标准化,标准化公式如下:
Figure BDA0004178472860000111
其中,x为归一化处理后的图像,mean(x),std(x)分别表示取均值和取标准差操作;
S3、构建基于卷积神经网络的滑坡识别模型,请参阅图2;
S301、构建包含一个卷积层的特征降维模块;
S302、构建包含3个卷积层、3个批归一化层和2个ReLU非线性激活层的特征提取模块,特征提取模块的3个卷积层分别为1×1卷积,3×3卷积,1×1卷积,其中3×3卷积为深度可分离卷积,特征提取模块首先通过一个1×1卷积对通道数进行升维,这样可以让3×3的深度可分离卷积提取更多的图像特征信息,接下来再通过1个1×1卷积降维,将维度还原;
S303、构建由2个1×1卷积层,1个13×13卷积层,1个3×3卷积层,4个批归一化层和4个ReLU非线性激活层组成的LK-Conv模块,请参阅图3;其中2个1×1卷积层对特征图进行线性映射,13×13卷积层负责提取特征图的长距离信息,3×3卷积层负责提取特征图的局部信息,再将提取到的长距离信息和局部信息通过相加的方式进行融合,作为最终提取到的特征信息;
S304、构建包含1个LK-Conv、1个批归一化层和1个多层感知机(MultilayerPerceptron,MLP)层的Large-Kernel Residual Block模块;请参阅图4;
S305、构建包含1个卷积层、1个全局平均池化层和1个线性层的分类模块;
S306、基于步骤S301构建的特征降维模块,步骤S302构建的特征提取模块,步骤S304构建的Large-Kernel Residual Block模块,步骤S305构建的分类模块构建轻量化卷积神经网络MobileL-K,该轻量化卷积神经网络MobileL-K网络首先对输入的数据通过特征降维模块进行降维,接下来依次通过特征提取模块和Large-Kernel Residual Block模块进行特征提取,最后通过分类模块进行分类;
S4、基于步骤S3构建的模型,使用交叉熵损失函数构建本方法的损失函数;
在步骤S306通过分类模块进行分类的训练分类器过程中,损失函数使用交叉熵损失函数Llog(y,p),定义为:
Llog(y,p)=-(ylog(p)+(1-y)log(1-p))
其中,y为标签,p为分类器网络的预测概率;
训练过程中,采用随机梯度下降法进行优化,首先用损失函数J(θ)对(θ)求偏导,
Figure BDA0004178472860000131
参数θ按负梯度方向更新,/>
Figure BDA0004178472860000132
θ′为更新后的网络参数,θj为更新前的网络参数,σ为学习率,/>
Figure BDA0004178472860000133
为输入网络的训练数据,hθ(xi)为训练集的权重,yi为训练集对应的标签,m为每次训练输入的样本数量,从训练集中随机抽出一组样本,每次训练后按梯度下降法则更新;
S5、用基于步骤S2预处理后的数据集对步骤S4处理后的模型进行训练,得到训练好的模型;
S6、在步骤S5训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;
S601、设置超参数:
种群大小:N;最大进化代数:Gmax;
适应度函数:
Figure BDA0004178472860000134
复杂度函数:
Figure BDA0004178472860000135
输入:一个训练好的CNN网络
Figure BDA0004178472860000141
复杂度上限:Hmax;
输出:种群中适应度函数值最高的个体Pbest;
S602、初始化种群:
1)随机产生初始化种群
Figure BDA0004178472860000142
大小为N×M,种群中每个个体的元素表示
Figure BDA0004178472860000143
中需要剪枝的每层卷积网络所对应的每个通道,因此M=L1+…+Lc+…+LC,Lc表示第c层卷积剪枝前的通道数,每个元素的值,即掩码(mask)值/>
Figure BDA0004178472860000144
随机初始化为1或-1,1表示该通道保留,-1表示该通道舍弃;
2)对每个初始个体计算复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N个个体的复杂度都小于Hmax;
3)设置当前进化代数g=0;
S603、进行Gmax代进化,如果g<Gmax,重复S603,否则跳转到S604;
1)将上一代进化后的种群和当前代进化前的种群合并,[Pg-1,Pg],P-1=[];
2)对合并后的种群[Pg-1,Pg]在训练集上进行微调后在测试集上进行推理,计算种群中所有个体的适应度值,并保留适应度值最大的前N个个体组成临时种群Φ,Φ中每个个体的适应度值为F=[f1,f2,...,fN];
3)Mask连续化:根据步骤S601得到的F1score提出mask连续化策略,公式(3),更新Φ={xij}中每个个体的掩码值:
Figure BDA0004178472860000151
F1越高的个体,掩码值的绝对值越大;
Figure BDA0004178472860000152
Figure BDA0004178472860000153
将所有个体的每个掩码值重新归一化到[-1,1]之间,防止累积后掩码值过大,并且将1或-1的离散掩码值连续化为[-1,1]之间的任意小数;
更新Φ={xij},i=1...N,j=1…M
4)交叉操作:从Φ中随机选择两个个体P1和P2作为交叉操作的父代,根据提出的均值交叉算子即公式(4),循环产生N/2个交叉新个体[α1 α2 … αN/2]T;对每个新产生的交叉个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax;
Figure BDA0004178472860000154
5)变异操作:从Φ中随机选择一个个体
φi=[xi1 xi2 … xiM],作为变异操作的父代,根据提出的取反变异算子(公式5),循环产生N/2个变异新个体[β1 β2 … βN/2]T,对每个新产生的变异个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax
Figure BDA0004178472860000161
其中,f是[0,1]的随机数,变异率ρ=1-|xij|,可以随着掩码值自适应调整,当掩码值的绝对值较大时,变异率越小,反之变异率越大;
6)将交叉和变异产生的新个体合并,组成进化后的新种群Pg+1
Pg+1=[α1,α2,...,αN/2,β1,β2,...,βN/2]T
7)更新进化代数g=g+1;
S604、对最终的种群
Figure BDA0004178472860000162
中的所有个体计算适应度值,从中选择适应度值最高,即F1 score最大的个体Pbest,输出其网络结构和权值。
S7、读取S6得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练得到最终分类结果。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别系统,可以对滑坡数据进行预处理并对模型进行训练和测试,所述系统包括:
数据预处理模块,用于对输入的滑坡数据进行预处理,包括将数据的大小统一,并进行数据增强。
模型训练模块,用于把训练数据输入到模型当中对模型进行训练。
模型存储模块,用于保存训练好的模型。
预测模块,用于把需要测试的滑坡数据输入到训练好的模型当中并输出预测的结果。
一种基于步骤1至7所述方法的进化剪枝轻量化卷积神经网络的滑坡识别设备,其特征在于负责支持进化剪枝轻量化卷积神经网络的滑坡识别系统的运行,所述设备包括:
存储器,用于存储计算机程序,数据和模型;
处理器,用于执行所述计算机程序时实现步骤1至7任一项所述基于进化剪枝轻量化卷积神经网络的滑坡识别方法的运行。
一种计算机可读存储介质,其特征在于负责对程序和数据进行读取和存储,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够基于步骤1至7所述的进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别。
以下是对本发明建立的滑坡识别模型(MobileL-K)与现有模型对比实验数据,见表1
表1对比实验表
Figure BDA0004178472860000171
通过对比发现,本发明MobileL-K在预测的准确率上和F1分数上均比其他方法要高,并且本发明相比其他方法对硬件需求低,推理速度比其他方法更快。

Claims (10)

1.一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,具体步骤如下:
S1、将滑坡数据集中的样本划分为训练集和测试集;
S2、对训练集和测试集图像大小进行调整:对步骤S1划分的训练集进行数据增强,并对训练集和测试集进行归一化和标准化操作;
S3、构建基于卷积神经网络的滑坡识别模型;
S4、基于步骤S3构建的模型,使用交叉熵损失函数构建损失函数;
S5、用基于步骤S2预处理后的数据集对步骤S4处理后的模型进行训练,得到训练好的模型;
S6、在步骤S5训练好的模型的基础上使用进化算法进行剪枝,搜索得到最优子网络;
S7、在读取步骤S6得到的最优子网络结构及加载最优子网络的权重基础上进行重新训练,得到最终分类结果。
2.根据权利要求1所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,所述步骤S2具体方法为:
S201、对步骤S1划分的数据集进行预处理,通过双线性插值的方法将训练集和测试集图像大小统一;
S202、自定义概率对训练集进行翻转、旋转,实现数据增强;
S203、对训练集和测试集进行归一化和标准化处理:将输入图像数据的像素点值归一化处理,即将数据归一化到[0,1]之间,并进行标准化,标准化公式如下:
Figure FDA0004178472850000021
其中,x为归一化处理后的图像,mean(x),std(x)分别表示取均值和取标准差操作。
3.根据权利要求1所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,所述步骤S3具体步骤是:
S301、构建包含一个卷积层的特征降维模块;
S302、构建包含3个卷积层、3个批归一化层和2个ReLU非线性激活层的特征提取模块,特征提取模块的3个卷积层分别为1×1卷积,3×3卷积,1×1卷积,其中3×3卷积为深度可分离卷积,特征提取模块首先通过一个1×1卷积对通道数进行升维,让3×3的深度可分离卷积提取更多的图像特征信息,再通过1个1×1卷积降维,将维度还原;
S303、构建由2个1×1卷积层,1个13×13卷积层,1个3×3卷积层,4个批归一化层和4个ReLU非线性激活层组成的LK-Conv模块,其中2个1×1卷积层对特征图进行线性映射,13×13卷积层负责提取特征图的长距离信息,3×3卷积层负责提取特征图的局部信息,再将提取到的长距离信息和局部信息通过相加的方式进行融合,作为最终提取到的特征信息;
S304、构建包含1个LK-Conv、1个批归一化层和1个多层感知机(MultilayerPerceptron,MLP)层的Large-Kernel Residual Block模块;
S305、构建包含1个卷积层、1个全局平均池化层和1个线性层的分类模块;
S306、基于步骤S301构建的特征降维模块、步骤S302构建的特征提取模块、步骤S304构建的Large-Kernel Residual Block模块、步骤S305构建的分类模块,构建轻量化卷积神经网络MobileL-K,该轻量化卷积神经网络MobileL-K网络首先对输入的数据通过特征降维模块进行降维,接下来依次通过特征提取模块和Large-Kernel Residual Block模块进行特征提取,最后通过分类模块进行分类。
4.根据权利要求1所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,所述步骤S4的具体方法为:
对步骤S306分类模块进行分类的训练分类器过程中,损失函数使用交叉熵损失函数Llog(y,p),定义为:
Llog(y,p)=-(ylog(p)+(1-y)log(1-p))
其中,y为标签,p为分类器网络的预测概率;
训练分类器过程中,采用随机梯度下降法进行优化,首先用损失函数J(θ)对(θ)求偏导,
Figure FDA0004178472850000031
参数θ按负梯度方向更新,/>
Figure FDA0004178472850000032
θ′为更新后的网络参数,θj为更新前的网络参数,σ为学习率,/>
Figure FDA0004178472850000033
为输入网络的训练数据,hθ(xi)为训练集的权重,yi为训练集对应的标签,m为每次训练输入的样本数量,从训练集中随机抽出一组样本,每次训练后按梯度下降法则更新。
5.根据权利要求1所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,所述步骤S6的具体方法为:
S601、设置超参数:
种群大小:N;最大进化代数:Gmax;
适应度函数:
Figure FDA0004178472850000041
复杂度函数:
Figure FDA0004178472850000042
输入:一个训练好的CNN网络
Figure FDA0004178472850000043
复杂度上限:Hmax;
输出:种群中适应度函数值最高的个体Pbest;
S602、初始化种群;
S603、进行Gmax代进化,如果g<Gmax,重复S603,否则进入S604;
S604、对最终的种群
Figure FDA0004178472850000044
中的所有个体计算适应度值,从中选择适应度值最高,即F1score最大的个体Pbest,输出其网络结构和权值。
6.根据权利要求5所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,步骤S602所述初始化种群的方法为:
1)随机产生初始化种群
Figure FDA0004178472850000045
大小为N×M,种群中每个个体的元素表示
Figure FDA0004178472850000046
中需要剪枝的每层卷积网络所对应的每个通道,因此M=L1+…+Lc+…+LC,Lc表示第c层卷积剪枝前的通道数,每个元素的值,即掩码(mask)值/>
Figure FDA0004178472850000047
随机初始化为1或-1,1表示该通道保留,-1表示该通道舍弃;
2)对每个初始个体计算复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N个个体的复杂度都小于Hmax;
3)设置当前进化代数g=0。
7.根据权利要求5所述的一种进化剪枝轻量化卷积神经网络的滑坡识别方法,其特征在于,步骤S603进行Gmax代进化,如果g<Gmax,重复S603;具体方法为:
1)将上一代进化后的种群和当前代进化前的种群合并,[Pg-1,Pg],P-1=[];
2)对合并后的种群[Pg-1,Pg]在训练集上进行微调后在测试集上进行推理,计算种群中所有个体的适应度值,并保留适应度值最大的前N个个体组成临时种群Φ,Φ中每个个体的适应度值为F=[f1,f2,...,fN];
3)Mask连续化:根据步骤S601得到的F1score提出mask连续化策略,公式(3),更新Φ={xij}中每个个体的掩码值:
Figure FDA0004178472850000051
F1越高的个体,掩码值的绝对值越大;
Figure FDA0004178472850000052
Figure FDA0004178472850000053
将所有个体的每个掩码值重新归一化到[-1,1]之间,防止累积后掩码值过大,并且将1或-1的离散掩码值连续化为[-1,1]之间的任意小数;
更新Φ={xij},i=1...N,j=1...M;
4)交叉操作:从Φ中随机选择两个个体P1和P2作为交叉操作的父代,提出的均值交叉算子即公式(4),循环产生N/2个交叉新个体[α1 α2…αN/2]T;对每个新产生的交叉个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax;
Figure FDA0004178472850000061
5)变异操作:从Φ中随机选择一个个体
φi=[xi1 xi2…xiM],作为变异操作的父代,根据提出的取反变异算子(公式5),循环产生N/2个变异新个体[β1 β2…βN/2]T,对每个新产生的变异个体计算其复杂度hi,如果hi>Hmax,舍弃该个体,重新随机生成,直到N/2个个体的复杂度都小于Hmax
Figure FDA0004178472850000062
其中,r是[0,1]的随机数,变异率ρ=1-|xij|,可以随着掩码值自适应调整,当掩码值的绝对值较大时,变异率越小,反之变异率越大;
6)将交叉和变异产生的新个体合并,组成进化后的新种群Pg+1
Pg+1=[α1,α2,...,αN/2,β1,β2,...,βN/2]T
7)更新进化代数g=g+1。
8.一种基于权利要求1至7任一项所述方法的进化剪枝轻量化卷积神经网络的滑坡识别系统,其特征在于,可以对滑坡数据进行预处理并对模型进行训练和测试,所述系统包括:
数据预处理模块,用于对输入的滑坡数据进行预处理,包括将数据的大小统一,并进行数据增强。
模型训练模块,用于把训练数据输入到模型当中对模型进行训练。
模型存储模块,用于保存训练好的模型。
预测模块,用于把需要测试的滑坡数据输入到训练好的模型当中并输出预测的结果。
9.一种基于权利要求1至7任一项所述方法的进化剪枝轻量化卷积神经网络的滑坡识别设备,其特征在于,负责支持进化剪枝轻量化卷积神经网络的滑坡识别系统的运行,所述设备包括:
存储器,用于存储计算机程序,数据和模型;
处理器,用于执行所述计算机程序时实现步骤1至7任一项所述基于进化剪枝轻量化卷积神经网络的滑坡识别方法的运行。
10.一种计算机可读存储介质,其特征在于,负责对程序和数据进行读取和存储,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时能够基于步骤1至7所述的进化剪枝轻量化卷积神经网络的滑坡识别方法,对滑坡进行识别。
CN202310398483.4A 2023-04-14 2023-04-14 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质 Pending CN116403113A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310398483.4A CN116403113A (zh) 2023-04-14 2023-04-14 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310398483.4A CN116403113A (zh) 2023-04-14 2023-04-14 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN116403113A true CN116403113A (zh) 2023-07-07

Family

ID=87017727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310398483.4A Pending CN116403113A (zh) 2023-04-14 2023-04-14 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN116403113A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116625317A (zh) * 2023-07-26 2023-08-22 天津达一众诚科技有限公司 一种基于图像处理的陡坡表面坡度检测方法及设备
CN117497194B (zh) * 2023-12-28 2024-03-01 苏州元脑智能科技有限公司 一种生物信息处理方法、装置、电子设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116625317A (zh) * 2023-07-26 2023-08-22 天津达一众诚科技有限公司 一种基于图像处理的陡坡表面坡度检测方法及设备
CN116625317B (zh) * 2023-07-26 2023-10-03 天津达一众诚科技有限公司 一种基于图像处理的陡坡表面坡度检测方法及设备
CN117497194B (zh) * 2023-12-28 2024-03-01 苏州元脑智能科技有限公司 一种生物信息处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN111563557B (zh) 一种电力电缆隧道内目标检测的方法
CN108108751B (zh) 一种基于卷积多特征和深度随机森林的场景识别方法
CN116403113A (zh) 进化剪枝轻量化卷积神经网络的滑坡识别方法、系统、设备及介质
CN110689086A (zh) 基于生成式对抗网络的半监督高分遥感图像场景分类方法
CN111914907A (zh) 一种基于深度学习空谱联合网络的高光谱图像分类方法
CN112036447B (zh) 零样本目标检测系统及可学习语义和固定语义融合方法
CN112464911A (zh) 基于改进YOLOv3-tiny的交通标志检测与识别方法
CN111738054B (zh) 一种基于时空自编码器网络和时空cnn的行为异常检测方法
CN114998220B (zh) 一种基于改进的Tiny-YOLO v4自然环境下舌像检测定位方法
CN112163520B (zh) 一种基于改进损失函数的mdssd人脸检测方法
CN110599502B (zh) 一种基于深度学习的皮肤病变分割方法
Feng et al. Bag of visual words model with deep spatial features for geographical scene classification
CN111507227B (zh) 基于深度学习的多学生个体分割及状态自主识别方法
CN112950780B (zh) 一种基于遥感影像的网络地图智能生成方法及系统
CN112307982A (zh) 基于交错增强注意力网络的人体行为识别方法
CN112070040A (zh) 一种用于视频字幕的文本行检测方法
CN113205103A (zh) 一种轻量级的文身检测方法
CN115393690A (zh) 一种轻量化神经网络的空对地观测多目标识别方法
CN115830449A (zh) 显式轮廓引导和空间变化上下文增强的遥感目标检测方法
CN111310820A (zh) 基于交叉验证深度cnn特征集成的地基气象云图分类方法
CN115240259A (zh) 一种基于yolo深度网络的课堂环境下人脸检测方法及其检测系统
CN111507416A (zh) 一种基于深度学习的吸烟行为实时检测方法
CN115019132A (zh) 一种用于复杂背景船舶的多目标识别方法
CN114187506A (zh) 视点意识的动态路由胶囊网络的遥感图像场景分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination