CN116151356A - 一种优化卷积神经网络的方法、系统、设备及介质 - Google Patents

一种优化卷积神经网络的方法、系统、设备及介质 Download PDF

Info

Publication number
CN116151356A
CN116151356A CN202310438701.2A CN202310438701A CN116151356A CN 116151356 A CN116151356 A CN 116151356A CN 202310438701 A CN202310438701 A CN 202310438701A CN 116151356 A CN116151356 A CN 116151356A
Authority
CN
China
Prior art keywords
convolutional neural
neural network
value
algorithm
optimizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310438701.2A
Other languages
English (en)
Inventor
李强
向哲宏
赵峰
张捷
宋卫平
李欢欢
徐小云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Zhongdian Aostar Information Technologies Co ltd
State Grid Information and Telecommunication Co Ltd
Original Assignee
Sichuan Zhongdian Aostar Information Technologies Co ltd
State Grid Information and Telecommunication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Zhongdian Aostar Information Technologies Co ltd, State Grid Information and Telecommunication Co Ltd filed Critical Sichuan Zhongdian Aostar Information Technologies Co ltd
Priority to CN202310438701.2A priority Critical patent/CN116151356A/zh
Publication of CN116151356A publication Critical patent/CN116151356A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉技术领域,具体地说,涉及一种优化卷积神经网络的方法、系统、设备及介质;该方法将正态分布算法作为模拟退火算法的邻域生成函数,并在迭代寻优过程中加入领导者机制,调整生成新解的邻域函数范围从而控制算法搜索方向,通过改变搜索方向及时的跳出某一范围进行全局搜索,从而平衡算法勘探和开发能力,大大提升算法的寻优能力;根据改进的模拟退火算法将卷积神经网络的输出层的权值和偏置进行迭代寻优,优化整个网络的结构,提升了目标检测的准确度,降低了目标定位错误率,增加了卷积神经网络模型的鲁棒性。

Description

一种优化卷积神经网络的方法、系统、设备及介质
技术领域
本发明涉及计算机视觉技术领域,具体地说,涉及一种优化卷积神经网络的方法、系统、设备及介质。
背景技术
智能巡检应用主要的技术栈支撑为深度学习框架下目标检测算法模型,在智能巡检过程中产生海量数据集,通过对海量数据集预处理后输入卷积神经网络模型中进行训练,得到的模型需达到精准识别输电陷入金具类别以及可能存在的金具缺陷。因此,对于深度学习中模型的选择和优化尤为关键,模型的优劣直接决定了最终在智能巡检过程中相关金具的检测识别和定位。
目标检测是对图像分类任务的进一步加深,他不仅要识别出图片中各种类别的目标,还要把他们的位置找出来用矩形框框住。目标检测是深度学习在计算机视觉领域一个非常重要的应用,CNN则是以Faster R-CNN为代表的Two-Stage算法的基础单元,AlexNet、VGG这些模型都是基于CNN单元构建起来的,用来训练图像分类任务,再到目标检测问题时,RCNN系列、YOLO等都是利用了训练好的图像分类模型,利用它们提取的特征,再做下一步的工作,具体步骤为:首先,我们把图片用作输入,之后,我们将图片分成多个区域,将每个区域看作单独的图片,把这些区域照片传递给CNN,将它们分到不同类别中,当我们把每个区域都分到对应的类别后,再把它们结合在一起,完成对原始图像的目标检测。
目前CNN卷积神经网络在目标检测识别方向主要存在的问题如下:
1、当存在海量数据集时,一旦存在某一金具出现的频率次数或者某金具缺陷类型出现频率过高时,容易导致算法的过拟合;
2、由于CNN卷积神经网络使用的是梯度下降法进行算法收敛,在目标检测时容易导致只检测到图片的某一个区域后就检测下一张图片,使得整个算法模型漏检率较高,并且不能完整地标出检测到的目标物体;
3、梯度弥散,使用反向传播算法传播梯度的时候,随着传播深度的增加,梯度的幅度会急剧减小,会导致浅层神经元的权重更新非常缓慢,不能有效学习。这样一来,深层模型也就变成了前几层相对固定,只能改变最后几层的浅层模型;
综上,CNN卷积神经网络本身网络结构和参数存在检测准确度不够,检测的漏检率较高,以及不能完整标记检测目录的问题。
而对CNN卷积神经网络进行优化时选用正确的优化算法也直接决定了卷积神经网络模型的优劣,目前,基本的模拟退火算法虽然参数简单,容易实现,适用于并行处理,但却存在以下几点问题:
1、收敛速度慢,执行时间长;
2、Metropolis准则随机性太强,导致算法不稳定;
3、算法性能与初始值有关参数敏感。
因此需要对基本模拟退火算法提出优化,使其具有渐进收敛、并行、不易陷入局部最优等特点,再使用优化后的算法对CNN网络模型进行参数结构优化,使得其在目标检测和识别领域具有更好的效果。
发明内容
本发明针对现有的模拟退火算法对CNN网络模型进行优化时存在收敛速度慢、不稳定且与初始值有关参数敏感,容易陷入局部最优的问题,提出一种优化卷积神经网络的方法、系统、设备及介质,该方法将正态分布算法作为模拟退火算法的邻域生成函数,并在迭代寻优过程中加入领导者机制,调整生成新解的邻域函数范围从而控制算法搜索方向,通过改变搜索方向及时地跳出某一范围进行全局搜索,从而平衡算法勘探和开发能力,大大提升算法的寻优能力;根据改进的模拟退火算法将卷积神经网络的输出层的权值和偏置进行迭代寻优,优化整个网络的结构,提升了目标检测的准确度,降低了目标定位错误率,增加了卷积神经网络模型的鲁棒性。
本发明具体实现内容如下:
一种优化卷积神经网络的方法,包括以下步骤:
步骤1:构建卷积神经网络,初始化所述卷积神经网络的网络参数值,并将初始化的所述网络参数值定义为网络权值向量;
步骤2:将训练样本图片输入至所述卷积神经网络中,训练得到输出层的权值和偏置;
步骤3:将正态分布算法作为模拟退火算法的邻域生成函数,并在所述模拟退火算法的迭代寻优过程中加入领导者机制,得到改进后的模拟退火算法;
步骤4:将所述权值和所述偏置作为解向量,根据所述网络权值向量和所述卷积神经网络的损失函数,构建适应度函数;
步骤5:根据改进后的模拟退火算法将所述适应度函数进行迭代寻优,得到适应度函数值;
步骤6:将所述适应度函数的最小值作为卷积神经网络的输出层的初始化权值和偏置参数,构建新的卷积神经网络;
步骤7:将所述训练样本图片输入至新的卷积神经网络中,训练得到新的适应度函数值,判断新的适应度函数值是否在设定阈值范围内,若是则结束,否则返回步骤5重新进行迭代。
为了更好地实现本发明,进一步地,所述步骤5具体包括以下步骤:
步骤51:初始化所述模拟退火算法中的初始温度参数,随机初始化解n计算适应度函数值F(n),并将所述适应度函数值F(n)作为所述模拟退火算法的领导者机制的领导者的值F(b);
步骤52:生成新的解n+1,计算新的解n+1的适应度函数值F(n+1),并根据所述领导者的值,确定所述正态分布函数的方差;
步骤53:比较适应度函数值F(n+1)与领导者的值F(b)的大小,若适应度函数值F(n+1)小于领导者的值F(b),则将适应度函数值F(n+1)作为领导者的值,减小所述方差的值,并开始局部搜索;若适应度函数值F(n+1)大于领导者的值F(b),则根据Metropolis准则判断是否接受恶劣解,若不接受,则改变搜索方向,增大所述方差的值,并开始全局搜索,若接受,则将适应度函数值F(n+1)作为领导者的值F(b);
步骤54:判断当前温度参数是否达到设定的最低温度,若否,则返回步骤52重新进行迭代;若是,则判断是否满足结束条件,若满足,则将领导者的值F(b)作为输出的适应度函数值;若不满足,则进行降温冷却,将迭代次数加1,返回步骤52重新进行迭代。
为了更好地实现本发明,进一步地,步骤52中所述确定所述正态分布函数的方差的过程为:
Figure SMS_1
其中,ub表示整个搜索空间中函数定义域的上界,lb表示整个搜索空间中函数定义域的下界,r1是介于[0,0.5]之间的随机数。
为了更好地实现本发明,进一步地,所述步骤4中所述卷积神经网络的损失函数为:
Figure SMS_2
其中,y代表卷积神经网络期望的输出值;O代表卷积神经网络训练完成一次之后实际的输出值,N代表一次训练的样本数量,n代表当前的迭代次数;
在所述损失函数中构建的适应度函数为:
Figure SMS_3
其中,Q’为构建的适应度函数,w表示输出层的权重系数向量,b表示为输出层偏置项向量,I是一个元素全为1的单位矩阵,u表示上层的特征输入向量,sigm(·)表示输出层的激活函数。
为了更好地实现本发明,进一步地,步骤1中所述卷积神经网络的输入层为交替连接的下采样层和卷积层,输出层为全连接层;所述下采样层和所述卷积层之间通过全连接的方式连接。
为了更好地实现本发明,进一步地,步骤1中所述网络参数值包括卷积神经网络的层数、卷积核参数值、采样核参数值、网络迭代次数、学习率参数值。
为了更好地实现本发明,进一步地,步骤1中所述网络权值向量包括全连接层权值、全连接层偏置参数。
基于上述提出的优化卷积神经网络的方法,为了更好地实现本发明,进一步地,提出一种优化卷积神经网络的系统,包括初始化单元、构建单元、迭代单元、优化单元;
所述初始化单元,用于构建卷积神经网络,初始化所述卷积神经网络的网络参数值,并将初始化的所述网络参数值定义为网络权值向量,并将训练样本图片输入至所述卷积神经网络中,训练得到输出层的权值和偏置;
所述构建单元,用于将正态分布算法作为模拟退火算法的邻域生成函数,并在所述模拟退火算法的迭代寻优过程中加入领导者机制,得到改进后的模拟退火算法;并将所述权值和所述偏置作为解向量,根据所述网络权值向量和所述卷积神经网络的损失函数,构建适应度函数;
所述迭代单元,用于根据改进后的模拟退火算法将所述适应度函数进行迭代寻优,得到适应度函数值;
所述优化单元,用于将所述适应度函数的最小值作为卷积神经网络的输出层的初始化权值和偏置参数,构建新的卷积神经网络;并将所述训练样本图片输入至新的卷积神经网络中,训练得到新的适应度函数值,判断新的适应度函数值是否在设定阈值范围内,若是则结束,否则重新进行迭代。
基于上述提出的优化卷积神经网络的方法,为了更好地实现本发明,进一步地,提出一种电子设备,包括存储器、处理器;所述存储器,用于存储有计算机程序;当所述处理器在所述计算机程序上运行时,实现上述的优化卷积神经网络的方法。
基于上述提出的优化卷积神经网络的方法,为了更好地实现本发明,进一步地,提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令;
当所述计算机指令在上述的电子设备上执行时,实现上述的优化卷积神经网络的方法。
本发明具有以下有益效果:
(1)本发明通过在模拟退火算法中加入领导者机制,使得算法在整个寻优搜索过程中有一个引导方向,通过当前解的优劣判断目前寻优方向的好坏,并且领导者在搜索迭代过程中遵循优胜劣汰的准则,保证领导者在整个搜索寻优的过程中都保持最优解,领导者机制的加入使得算法既能在局部搜索中去探测精度更高的解,也能在算法陷入局部最优时,通过改变搜索方向及时地跳出某一范围进行全局搜索,从而平衡算法勘探和开发能力,大大提升算法的寻优能力。
(2)本发明通过采用正态分布函数生成新解,改变了除初始解之外所有解的生成方式,使用标准正态分布之后的模拟退火算法在解的分布上更加均匀,也使得算法的覆盖更加合理,不论是在局部搜索还是全局搜索中都较之前有更好的寻优能力。
(3)本发明通过进行算法优化后,使用算法寻优,根据卷积神经网络损失函数判断当前参数的优劣,改变了卷积神经网络的参数调整了网络模型的权值和偏置参数值之后,提高了卷积神经网络的识别性能,保证每一次输入样本数据集后进行训练的网络都是经过算法优化结构的,因此训练后的结果也证明优化后的网络模型在目标检测识别的准确度上有极大的提高,并且对于目标物体的定位错误率更低,定位位置更加准确,模型整体鲁棒性增加。
附图说明
图1为本发明实施例提供的改进后的模拟退火算法流程图。
图2为本发明实施例提供的优化卷积神经网络的方法整体流程图。
具体实施方式
为了更清楚地说明本发明实施例的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,应当理解,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,因此不应被看作是对保护范围的限定。基于本发明中的实施例,本邻域普通技术工作人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“设置”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;也可以是直接相连,也可以是通过中间媒介间接相连,可以是两个元件内部的连通。对于本邻域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
术语解释:
模拟退火算法:模拟退火算法来源于固体退火原理,是一种基于概率的算法,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。而传统的模拟退火算法优于贪心算法的原因是Metropolis准则:以一定的概率接受恶化解,使其能够使得算法跳离局部最优解,即便是当前解的适应度函数值差于上一代的解,仍然以一定的概率接受。
CNN网络模型:CNN是卷积神经网络,核心作用在于通过卷积核提取特征,其常规主要构成为卷积层,池化层,全连接层。卷积神经网络与普通神经网络的区别在于,卷积神经网络包含了一个由卷积层和子采样层即池化层构成的特征抽取器。在卷积神经网络的卷积层中,一个神经元只与部分邻层神经元连接。在CNN的一个卷积层中,通常包含若干个特征图(featureMap),每个特征图由一些矩形排列的神经元组成,同一特征图的神经元共享权值,这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。共享权值即卷积核带来的直接好处是减少网络各层之间的连接,同时又降低了过拟合的风险。子采样也叫做池化(pooling),通常有均值子采样(mean pooling)和最大值子采样(max pooling)两种形式。子采样可以看作一种特殊的卷积过程。
人工智能背景下的智能巡检可显著提高电力维护和检修的速度和效率,还大大降低了检修工作人员劳动强度,可减少环境因素带来的影响,可降低劳动强度,可提高电力巡线作业人员的安全性,并且降低成本缩短了巡视周期,飞行速度快、应急迅速调整的优势,能够在巡检时及时发现缺陷,及时提供信息,可有效避免线路发生事故来不及发现导致停电,避免高额的停电费用损失。全国能源供给面临严峻考验,重视能源保供、明确提出电力多发满发的要求。在此背景下,国家电网高度重视全国用电的可靠性,大力保障用电稳定性,积极发挥大电网平台优势,着力支撑各类电源增发稳供,通过对各个市县区乡镇的输电线路进行大规模巡检以保障电网安全运行。
智能巡检应用主要的技术栈支撑为深度学习框架下目标检测算法模型,在智能巡检过程中产生海量数据集,通过对海量数据集预处理后输入卷积神经网络模型中进行训练,得到的模型需达到精准识别输电陷入金具类别以及可能存在的金具缺陷。因此,对于深度学习中模型的选择和优化尤为关键,模型的优劣直接决定了最终在智能巡检过程中相关金具的检测识别和定位,目前CNN卷积神经网络主要存在的问题如下:
1、当网络层次太深时,采用BP传播修改参数会使靠近输入层的参数改动较慢,导致在无人机巡检得到海量图片的同时,算法模型不能够及时的训练更新,模型核心代码不能根据业务场景及时更改;
2、采用梯度下降算法很容易使训练结果收敛于局部最小值而非全局最小值,在数据集很大时,整个算法模型容易陷入过拟合,导致整个模型只针对某几类金具检测准确度高,其余金具错误率偏高;
3、池化层会丢失大量有价值信息,忽略局部与整体之间关联性,导致整个模型在图片检测时不能全面的检测到完整的图片而漏检某类金具;
4、由于特征提取的封装,为网络性能的改进罩了一层黑盒,在特征选择方面增加了前期模型数据集预处理的难度;
基于此问题,迫切需要有一个在目标检测方面较好契合无人机巡检过程中产生大量图片以及拍摄角度不定,拍摄远近景方式随机等特点的检测算法模型,因此通过其他寻优算法的加入,去优化整个网络的结构和参数,从而实现提高无人机巡检检测识别的准确率,降低漏检,误检概率,并增加整个模型能够识别的金具种类。
标准的模拟退火算法中,新解的产生使用随机数生成函数,需确定新的解的范围,具体生成的函数如下:
Figure SMS_4
其中newX表示的是新生成的解,X表示上一代生成的解,rand(·)是一个随机数生成的函数,生成一个在0~1之间的随机数,ub表示生成的随机数的上界,下界为0,T代表跳跃幅度,以便算法寻优过程更加全面,覆盖面更广。
实施例1:
本实施例提出一种优化卷积神经网络的方法,具体包括以下步骤。
步骤1:构建卷积神经网络,初始化所述卷积神经网络的网络参数值,并将初始化的所述网络参数值定义为网络权值向量。
其中,所述卷积神经网络的输入层为交替连接的下采样层和卷积层,输出层为全连接层;所述下采样层和所述卷积层之间通过全连接的方式连接。
其中,所述网络参数值包括卷积神经网络的层数、卷积核参数值、采样核参数值、网络迭代次数、学习率参数值。
其中,所述网络权值向量包括全连接层权值、全连接层偏置参数。
步骤2:将训练样本图片输入至所述卷积神经网络中,训练得到输出层的权值和偏置。
步骤3:将正态分布算法作为模拟退火算法的邻域生成函数,并在所述模拟退火算法的迭代寻优过程中加入领导者机制,得到改进后的模拟退火算法。
步骤4:将所述权值和所述偏置作为解向量,根据所述网络权值向量和所述卷积神经网络的损失函数,构建适应度函数。
进一步地,所述步骤4中所述卷积神经网络的损失函数为:
Figure SMS_5
其中,y代表卷积神经网络期望的输出值;O代表卷积神经网络训练完成一次之后实际的输出值,N代表一次训练的样本数量,n代表当前的迭代次数;
在所述损失函数中构建的适应度函数为:
Figure SMS_6
其中,Q’为构建的适应度函数,w表示输出层的权重系数向量,b表示为输出层偏置项向量,I是一个元素全为1的单位矩阵,u表示上层的特征输入向量,sigm(·)表示输出层的激活函数。
步骤5:根据改进后的模拟退火算法将所述适应度函数进行迭代寻优,得到适应度函数值。
进一步地,所述步骤5具体包括以下步骤:
步骤51:初始化所述模拟退火算法中的初始温度参数,随机初始化解n计算适应度函数值F(n),并将所述适应度函数值F(n)作为所述模拟退火算法的领导者机制的领导者的值F(b);
步骤52:生成新的解n+1,计算新的解n+1的适应度函数值F(n+1),并根据所述领导者的值,确定所述正态分布函数的方差;
步骤53:比较适应度函数值F(n+1)与领导者的值F(b)的大小,若适应度函数值F(n+1)小于领导者的值F(b),则将适应度函数值F(n+1)作为领导者的值,减小所述方差的值,并开始局部搜索;若适应度函数值F(n+1)大于领导者的值F(b),则根据Metropolis准则判断是否接受恶劣解,若不接受,则改变搜索方向,增大所述方差的值,并开始全局搜索,若接受,则将适应度函数值F(n+1)作为领导者的值F(b);
步骤54:判断当前温度参数是否达到设定的最低温度,若否,则返回步骤52重新进行迭代;若是,则判断是否满足结束条件,若满足,则将领导者的值F(b)作为输出的适应度函数值;若不满足,则进行降温冷却,将迭代次数加1,返回步骤52重新进行迭代。
进一步地,步骤52中所述确定所述正态分布函数的方差的过程为:
Figure SMS_7
其中,ub表示整个搜索空间中函数定义域的上界,lb表示整个搜索空间中函数定义域的下界,r1是介于[0,0.5]之间的随机数。
步骤6:将所述适应度函数的最小值作为卷积神经网络的输出层的初始化权值和偏置参数,构建新的卷积神经网络;
步骤7:将所述训练样本图片输入至新的卷积神经网络中,训练得到新的适应度函数值,判断新的适应度函数值是否在设定阈值范围内,若是则结束,否则返回步骤5重新进行迭代。
工作原理:本实施例首先对模拟退火算法进行改进,因为传统的模拟退火算法虽然因为加入了Metropolis准则后,寻优效果大大增强,但经过多次实验发现,该算法仍然存在寻优过程不稳定性较大,Metropolis准则接受而裂解的概率无法确定等问题,因此对其算法本身进行优化改进,以获得更优解,改进为以下两个方面:
1、选择正态分布作为算法产生新解的邻域生成函数,新生成的解满足正态分布概率。正态分布(normal distribution)又名高斯分布(Gaussian distribution),其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。如果一个变量服从正态分布,那就可以判定影响这一变量的过程是相对稳定的,同时,如果变量服从正态分布,也可以对最终结果有更准确的预测。因此将新产生的解按标准正态分布概率实现,既能够保证整个算法寻优过程更加稳定,也能够较准确地估计任意取值范围内频数比例,更快确定变量的参考范围,大大减少算法因随机数的产生而导致的不稳定性以及解的不确定性。
2、在算法迭代过程中加入领导者策略,即在算法整个寻优过程中,一直保持有一个解作为领导者带领整个算法的寻优方向,该解为迭代过程中当前的最优解,并且领导者机制中,是存在竞争性的,每固定的迭代次数后,将当前解的适应度函数值和领导者进行对比,如果更优于领导者的值,则领导者解进行更换,以此保持领导者在绝大多数时间内能够一直维持为最优解,领导整个算法的寻优方向能够朝向目标值方向进行。
然后优化CNN网络结构和参数,首先初始化CNN的网络结构,定义目标函数,适应度函数值根据训练CNN得到的实际输出值和期望值组成,根据此目标函数来确定当前CNN模型的优劣,训练CNN可得到卷积核和全连接层的权值和偏置,而最后一层得到的权值和偏置经过激活后再用于计算损失函数,将最后一层的权值和偏置看作解向量,再使用改进后的模拟退火算法对当前CNN模型最后一层的权值和偏置进行优化,当目标函数满足预测的精度要求或者改进后的模拟退火算法的温度值下降到设定的阈值,优化CNN算法将停止迭代,最优的权值和偏置信息将会被用来构建网络结构。
本实施例通过加入寻优算法去优化整个网络的结构和参数,从而实现提高无人机巡检检测识别的准确率,降低漏检,误检概率,并增加整个卷积神经网络模型能够识别的金具种类。本实施例将正态分布算法作为模拟退火算法的邻域生成函数,并在迭代寻优过程中加入领导者机制,调整生成新解的邻域函数范围从而控制算法搜索方向,通过改变搜索方向及时的跳出某一范围进行全局搜索,从而平衡算法勘探和开发能力,大大提升算法的寻优能力;根据改进的模拟退火算法将卷积神经网络的输出层的权值和偏置进行迭代寻优,优化整个网络的结构,提升了目标检测的准确度,降低了目标定位错误率,增加了卷积神经网络模型的鲁棒性。
实施例2:
本实施例在上述实施例1的基础上,如图1、图2所示,以一个具体的实施例对改进后的模拟退火算法进行优化的流程进行详细说明。
如图1所示为改进后的模拟退火算法的流程图,其中F(b)为整个算法过程中的全局最优解,保持着在搜索过程中找到的之前所有迭代次数的最优解的值,以F(b)作为算法的领导者,来引领整个算法的寻优探索方向,平衡算法的开发能力和探索能力。
改进后的模拟退火算法带领导者机制,引领整个算法的搜索方向,并且领导者是在每一次迭代搜索中不断竞争淘汰的,通过优胜劣汰的方法使得领导者一直保持拥有全局最优解,通过每次迭代后新解的适应度函数值判断当前领导者的方向是否正确,如果新解的适应度函数值优于当前最优解,则表示当前领导者带领的搜索方向正确,正在朝着更优的方向进行,领导者不进行更改。反之,表示当前领导者的搜索方向朝着更差的方向,则需要根据Metropolis准则进行随时判断是否进行领导者的更改,重新寻找寻优的搜索方向。
模拟退火算法的另一方面的改进是选择合适的邻域函数,重新定义新解的生成,在本方法中选择正态分布作为邻域函数,而正态分布方差的选取和函数定义域的定义对解的分布影像很大,方差较大,解的分布范围较大,解的波动较大,方差较小时,又容易陷入局部最优解,因此方差需要根据领导者的寻优方向进行调整从而确定整个算法进行局部还是全局搜索。
利用正态分布函数生成新的解时,数学期望μ设置为10,方差σ设置为2,并且根据F(b)确定搜索方向,σ的值进行动态的变化,其更新公式如下:
Figure SMS_8
其中,ub表示整个搜索空间中函数定义域的上界,lb表示整个搜索空间中函数定义域的下界,r1是介于[0,0.5]之间的随机数。
将改进后的模拟退火算法用于训练CNN网络模型,得到满足条件的最优解,训练完成后,卷积神经网络的损失函数表达式如下:
Figure SMS_9
其中,y代表模型期望的输出值;O代表模型训练完成一次之后实际的输出值;N代表一次训练的样本数量,n代表当前的迭代次数;
卷积神经网络全连接层表达式如下:
Figure SMS_10
其中,sigm(·)表示全连接层的激活函数,
Figure SMS_11
是全连接层l的权重系数,u表示上层的特征输入向量,/>
Figure SMS_12
是全连接层l的偏置项,i,j表示参数在二维坐标系的索引;对所述全连接层表达式变形得:
Figure SMS_13
其中,x=(w b),
Figure SMS_14
,w表示所述全连接层的权重系数向量,b表示所述全连接层的偏置项向量,I是一个元素全部为1的单位矩阵,/>
Figure SMS_15
表示矩阵的转置,将所述全连接层的变形后的表达式代入所述损失函数中以构建所述目标函数:
Figure SMS_16
Q定义为改进后的模拟退火算法的适应度函数,根据Q值的大小作为判断当前算法对CNN网络模型优化的标准,通过改进模拟退火算法优化结构和参数的CNN算法模型的基本流程如图2所示。
1、在下采样层S2层和卷积层C3层间采用全连接的方式情况下,构建卷积神经网络,设定卷积神经网络的前边部分为卷积层和下采样层的交替连接,最后通过一层全连接层后输出,并对相关网络参数值进行初始化。具体设定网络的层数、卷积核、采样核、网络迭代次数以及学习率的参数值;
2、将初始化的卷积神经网络相关参数定义为网络权值向量,此向量由卷积核,连接层权值以及偏置等参数组成,把位置转换成网络参数形式;
3、利用当前网络模型对输入的图片进行训练,训练完成后记录当前网络模型的适应度函数值,卷积,下采样得到样本中心特征;
4、基本模拟退火算法优化,初始化算法中初始温度等参数,并随机初始化一组解,得到的目标函数值作为当前最优解作为“领导者”,每固定的迭代次数后,将当前解的适应度函数值和领导者进行对比,如果更优于领导者的值,则领导者解进行更换,以此保持领导者在绝大多数时间内能够一直维持为最优解,领导整个算法的寻优方向能够朝向目标值方向进行。另外选择正态分布作为邻域函数生成新的解,正态分布中方差的选取和函数定义域的定义对解的分布影像很大,方差较大,解的分布范围较大,解的波动较大,方差较小时,又容易陷入局部最优解,因此方差需要根据领导者的寻优方向进行调整从而确定整个算法进行局部还是全局搜索。初始化正态分布数学期望μ设置为10,方差σ设置为2,并且用边界来定义方差不超过边界,σ的值进行动态的变化,其更新公式如下:
Figure SMS_17
方差的更新规则是根据矢量三角形定理,r1为0-0.5之间的随机数,ub和lb看成向量后构成一个矢量三角形定理保证方差在一定范围内不会过大,随机数r1保证方差不会过小而导致算法陷入局部最优;
5、将初始化的网络权值向量作为输入,利用改进后的模拟退火算法对所述目标函数进行寻优处理,得到最优解。具体操作如下:
将卷积神经网络全连接层的权值和偏置看作解向量,将初始化卷积神经网络信息代入损失函数,构建目标函数,将随机初始化的权值和偏置作为一组解代入目标函数,利用步骤四中优化后的模拟退火算法对所述目标函数进行寻优处理;
6、开始每个温度下的内循环,按照优化后的模拟退火算法流程使用正态分布生成新解后,进行适应度函数值的大小比较,保存目标函数适应度函数值更小的函数参数,满足寻优结束条件后,将所保存的函数参数值构建新的卷积神经网络结构;
7、使用优化后的模拟退火算法进行迭代寻优,通过领导者机制,Metropolis准则等控制算法寻优方式,满足结束条件后保存所获得的最优解;
8、将所述最优解导入所述卷积神经网络的全连接层作为初始化权值和偏置等参数值,并存储所述初始化权值对应的所述卷积神经网络;
9、输入图片,再次对修改后的CNN进行训练,重新计算适应度函数值;
10、判断是否满足网络模型的精度要求,未达到期望条件则需再次对网络模型的参数寻优改进;
本实施例采用了改进后的模拟退火算法更好地对全连接层初始化权值进行寻优操作,利用改进后的模拟退火算法不容易陷入局部最优,搜索范围更广更加稳定的特点寻得最优解作为全连接层初始化权值进而加快权值的更新以及卷积神经网络的收敛,由于全连接层的权重和偏置稳定且高效,得到的卷积神经网络对于图像识别,目标检测方面的性能更加优越。
本实施例对模拟退火算法进行两方面改进:更改了算法的邻域函数,不再使用随机函数生成的函数,采用正态分布函数生成新解,改变了除初始解之外所有解的生成方式,使用标准正态分布之后的模拟退火算法在解的分布上更加均匀,也使得算法的覆盖更加合理,不论是在局部搜索还是全局搜索中都较之前有更好的寻优能力;另外,加入领导者机制使得算法在整个寻优搜索过程中有一个引导方向,领导者机制的重点在于通过当前解的优劣判断目前寻优方向的好坏,及时调整生成新解的邻域函数范围从而控制算法进行局部还是全局寻优,保证算法解的精度同时满足算法具有鲁棒性,并且领导者在搜索迭代过程中遵循优胜劣汰的准则,保证领导者在整个搜索寻优的过程中都保持最优解,也就保证算法在大部分寻优过程中搜索方向正确,大大减少了算法陷入局部最优的概率。
本实施例使用变形的交叉熵损失函数作为卷积神经网络的损失函数,通过下采样以及将全连接层的变形后的表达式代入所述损失函数中构造所述目标函数的方法定义判断卷积神经网络优劣的适应度函数,通过寻优算法对卷积神经网络中的权值和偏置进行迭代寻优,以此更改整个网络模型的结构,再使用优化更改后的卷积神经网络模型对样本数据集进行训练测试。
本实施例增强了模拟退火算法寻优能力,模拟退火算法是基于贪心算法,其中Metropolis准则是根据随机概率选择是否接受恶劣解,存在大量的不确定性和不稳定性,因此通过标准正态分布函数生成新的解,符合标准正态分布的新解保证解分布均匀并且范围可控,使得算法在整个寻优过程更加稳定,搜索领域更加明确,并且符合正态分布函数的解相较于随机生成的解在适应度函数值上更加优秀。加入领导者机制使得算法在整个寻优搜索过程中有一个引导方向,通过当前解的优劣判断目前寻优方向的好坏,并且领导者在搜索迭代过程中遵循优胜劣汰的准则,保证领导者在整个搜索寻优的过程中都保持最优解,领导者机制的加入使得算法既能在局部搜索中去探测精度更高的解,也能在算法陷入局部最优时,通过改变搜索方向及时地跳出某一范围进行全局搜索,从而平衡算法勘探和开发能力,大大提升算法的寻优能力。
本实施例提升了卷积神经网络目标检测性能,进行算法优化后,使用算法寻优,根据卷积神经网络损失函数判断当前参数的优劣,改变了卷积神经网络的参数调整了网络模型的权值和偏置参数值之后,提高了卷积神经网络的识别性能,保证每一次输入样本数据集后进行训练的网络都是经过算法优化结构的,因此训练后的结果也证明优化后的网络模型在目标检测识别的准确度上有极大的提高,并且对于目标物体的定位错误率更低,定位位置更加准确,模型整体鲁棒性增加。
本实施例的其他部分与上述实施例1相同,故不再赘述。
实施例3:
本实施例在上述实施例1-实施例2任一项的基础上,提出一种优化卷积神经网络的系统,包括初始化单元、构建单元、迭代单元、优化单元。
所述初始化单元,用于构建卷积神经网络,初始化所述卷积神经网络的网络参数值,并将初始化的所述网络参数值定义为网络权值向量,并将训练样本图片输入至所述卷积神经网络中,训练得到输出层的权值和偏置。
所述构建单元,用于将正态分布算法作为模拟退火算法的邻域生成函数,并在所述模拟退火算法的迭代寻优过程中加入领导者机制,得到改进后的模拟退火算法;并将所述权值和所述偏置作为解向量,根据所述网络权值向量和所述卷积神经网络的损失函数,构建适应度函数。
所述迭代单元,用于根据改进后的模拟退火算法将所述适应度函数进行迭代寻优,得到适应度函数值。
所述优化单元,用于将所述适应度函数的最小值作为卷积神经网络的输出层的初始化权值和偏置参数,构建新的卷积神经网络;并将所述训练样本图片输入至新的卷积神经网络中,训练得到新的适应度函数值,判断新的适应度函数值是否在设定阈值范围内,若是则结束,否则重新进行迭代。
本实施例还提出一种电子设备,包括存储器、处理器;所述存储器,用于存储有计算机程序;当所述处理器在所述计算机程序上运行时,实现上述的优化卷积神经网络的方法。
本实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令;
当所述计算机指令在上述的电子设备上执行时,实现上述的优化卷积神经网络的方法。
本实施例的其他部分与上述实施例1-实施例2任一项相同,故不再赘述。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。

Claims (10)

1.一种优化卷积神经网络的方法,其特征在于,包括以下步骤:
步骤1:构建卷积神经网络,初始化所述卷积神经网络的网络参数值,并将初始化的所述网络参数值定义为网络权值向量;
步骤2:将训练样本图片输入至所述卷积神经网络中,训练得到输出层的权值和偏置;
步骤3:将正态分布算法作为模拟退火算法的邻域生成函数,并在所述模拟退火算法的迭代寻优过程中加入领导者机制,得到改进后的模拟退火算法;
步骤4:将所述权值和所述偏置作为解向量,根据所述网络权值向量和所述卷积神经网络的损失函数,构建适应度函数;
步骤5:根据改进后的模拟退火算法将所述适应度函数进行迭代寻优,得到适应度函数值;
步骤6:将所述适应度函数的最小值作为卷积神经网络的输出层的初始化权值和偏置参数,构建新的卷积神经网络;
步骤7:将所述训练样本图片输入至新的卷积神经网络中,训练得到新的适应度函数值,判断新的适应度函数值是否在设定阈值范围内,若是则结束,否则返回步骤5重新进行迭代。
2.根据权利要求1所述的一种优化卷积神经网络的方法,其特征在于,所述步骤5具体包括以下步骤:
步骤51:初始化所述模拟退火算法中的初始温度参数,随机初始化解n计算适应度函数值F(n),并将所述适应度函数值F(n)作为所述模拟退火算法的领导者机制的领导者的值F(b);
步骤52:生成新的解n+1,计算新的解n+1的适应度函数值F(n+1),并根据所述领导者的值,确定所述正态分布函数的方差;
步骤53:比较适应度函数值F(n+1)与领导者的值F(b)的大小,若适应度函数值F(n+1)小于领导者的值F(b),则将适应度函数值F(n+1)作为领导者的值,减小所述方差的值,并开始局部搜索;若适应度函数值F(n+1)大于领导者的值F(b),则根据Metropolis准则判断是否接受恶劣解,若不接受,则改变搜索方向,增大所述方差的值,并开始全局搜索,若接受,则将适应度函数值F(n+1)作为领导者的值F(b);
步骤54:判断当前温度参数是否达到设定的最低温度,若否,则返回步骤52重新进行迭代;若是,则判断是否满足结束条件,若满足,则将领导者的值F(b)作为输出的适应度函数值;若不满足,则进行降温冷却,将迭代次数加1,返回步骤52重新进行迭代。
3.根据权利要求2所述的一种优化卷积神经网络的方法,其特征在于,步骤52中所述确定所述正态分布函数的方差的过程为:
Figure QLYQS_1
其中,ub表示整个搜索空间中函数定义域的上界,lb表示整个搜索空间中函数定义域的下界,r1是介于[0,0.5]之间的随机数。
4.根据权利要求1所述的一种优化卷积神经网络的方法,其特征在于,所述步骤4中所述卷积神经网络的损失函数为:
Figure QLYQS_2
其中,y代表卷积神经网络期望的输出值;O代表卷积神经网络训练完成一次之后实际的输出值,N代表一次训练的样本数量,n代表当前的迭代次数;
在所述损失函数中构建的适应度函数为:
Figure QLYQS_3
其中,Q’为构建的适应度函数,w表示输出层的权重系数向量,b表示为输出层偏置项向量,I是一个元素全为1的单位矩阵,u表示上层的特征输入向量,sigm(·)表示输出层的激活函数。
5.根据权利要求1所述的一种优化卷积神经网络的方法,其特征在于,所述步骤1中所述卷积神经网络的输入层为交替连接的下采样层和卷积层,输出层为全连接层;所述下采样层和所述卷积层之间通过全连接的方式连接。
6.根据权利要求1所述的一种优化卷积神经网络的方法,其特征在于,所述步骤1中所述网络参数值包括卷积神经网络的层数、卷积核参数值、采样核参数值、网络迭代次数、学习率参数值。
7.根据权利要求1所述的一种优化卷积神经网络的方法,其特征在于,所述步骤1中所述网络权值向量包括全连接层权值、全连接层偏置参数。
8.一种优化卷积神经网络的系统,其特征在于,包括初始化单元、构建单元、迭代单元、优化单元;
所述初始化单元,用于构建卷积神经网络,初始化所述卷积神经网络的网络参数值,并将初始化的所述网络参数值定义为网络权值向量,并将训练样本图片输入至所述卷积神经网络中,训练得到输出层的权值和偏置;
所述构建单元,用于将正态分布算法作为模拟退火算法的邻域生成函数,并在所述模拟退火算法的迭代寻优过程中加入领导者机制,得到改进后的模拟退火算法;并将所述权值和所述偏置作为解向量,根据所述网络权值向量和所述卷积神经网络的损失函数,构建适应度函数;
所述迭代单元,用于根据改进后的模拟退火算法将所述适应度函数进行迭代寻优,得到适应度函数值;
所述优化单元,用于将所述适应度函数的最小值作为卷积神经网络的输出层的初始化权值和偏置参数,构建新的卷积神经网络;并将所述训练样本图片输入至新的卷积神经网络中,训练得到新的适应度函数值,判断新的适应度函数值是否在设定阈值范围内,若是则结束,否则重新进行迭代。
9.一种电子设备,其特征在于,包括存储器、处理器;所述存储器,用于存储有计算机程序;当所述处理器在所述计算机程序上运行时,实现如权利要求1-7任一项所述的优化卷积神经网络的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令;
当所述计算机指令在如权利要求9所述的电子设备上执行时,实现如权利要求1-7任一项所述的优化卷积神经网络的方法。
CN202310438701.2A 2023-04-23 2023-04-23 一种优化卷积神经网络的方法、系统、设备及介质 Pending CN116151356A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310438701.2A CN116151356A (zh) 2023-04-23 2023-04-23 一种优化卷积神经网络的方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310438701.2A CN116151356A (zh) 2023-04-23 2023-04-23 一种优化卷积神经网络的方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN116151356A true CN116151356A (zh) 2023-05-23

Family

ID=86354776

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310438701.2A Pending CN116151356A (zh) 2023-04-23 2023-04-23 一种优化卷积神经网络的方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN116151356A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556967A (zh) * 2024-01-11 2024-02-13 宁波安得智联科技有限公司 调度方法、装置、设备及存储介质
CN118314569A (zh) * 2024-06-07 2024-07-09 浙江天演维真网络科技股份有限公司 农产品成熟度识别方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556967A (zh) * 2024-01-11 2024-02-13 宁波安得智联科技有限公司 调度方法、装置、设备及存储介质
CN117556967B (zh) * 2024-01-11 2024-05-03 宁波安得智联科技有限公司 调度方法、装置、设备及存储介质
CN118314569A (zh) * 2024-06-07 2024-07-09 浙江天演维真网络科技股份有限公司 农产品成熟度识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN113449680B (zh) 一种基于知识蒸馏的多模小目标检测方法
CN116151356A (zh) 一种优化卷积神经网络的方法、系统、设备及介质
CN105488528B (zh) 基于改进自适应遗传算法的神经网络图像分类方法
CN108764281A (zh) 一种基于半监督自步学习跨任务深度网络的图像分类方法
NL2025689B1 (en) Crop pest detection method based on f-ssd-iv3
CN114841257B (zh) 一种基于自监督对比约束下的小样本目标检测方法
CN111626200A (zh) 一种基于Libra R-CNN的多尺度目标检测网络和交通标识检测方法
CN112446888A (zh) 图像分割模型的处理方法和处理装置
CN114511735A (zh) 级联空谱特征融合与核极限学习机的高光谱图像分类方法及系统
CN105512675B (zh) 一种基于记忆性多点交叉引力搜索的特征选择方法
CN115358305A (zh) 一种基于边界样本迭代生成的增量学习鲁棒性提升方法
Chu et al. Learning semantics-guided visual attention for few-shot image classification
Shi et al. A new multiface target detection algorithm for students in class based on bayesian optimized YOLOv3 model
CN111192240B (zh) 一种基于随机接入记忆的遥感图像目标检测方法
CN117081063A (zh) 一种基于GCN-Crossformer模型的分布式充电负荷预测方法及系统
CN115907122A (zh) 区域电动汽车充电负荷预测方法
CN115393631A (zh) 基于贝叶斯层图卷积神经网络的高光谱图像分类方法
CN115912502A (zh) 一种智能电网运营优化方法及装置
CN115169517A (zh) 一种改进的灰狼优化算法的方法
CN115063664A (zh) 用于工业视觉检测的模型学习方法、训练方法及系统
Yu et al. Remote sensing image classification based on RBF neural network based on fuzzy C-means clustering algorithm
Chen et al. Deep metric learning with graph consistency
Liu et al. Real-time object detection in UAV vision based on neural processing units
CN116029440A (zh) 光伏电站超短期功率预测方法和装置
CN115995020A (zh) 基于全卷积的小目标检测算法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230523

RJ01 Rejection of invention patent application after publication