CN113743605A - 基于进化方法搜索烟、火检测网络架构的方法 - Google Patents

基于进化方法搜索烟、火检测网络架构的方法 Download PDF

Info

Publication number
CN113743605A
CN113743605A CN202111016458.2A CN202111016458A CN113743605A CN 113743605 A CN113743605 A CN 113743605A CN 202111016458 A CN202111016458 A CN 202111016458A CN 113743605 A CN113743605 A CN 113743605A
Authority
CN
China
Prior art keywords
network
layers
smoke
expressed
options
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111016458.2A
Other languages
English (en)
Inventor
杜佳宁
余奇凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Publication of CN113743605A publication Critical patent/CN113743605A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/086Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Physiology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于进化方法搜索烟、火检测网络架构的方法,包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率。首先用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。然后将颜色、纹理和轮廓子网络做为初始种群,开始按选择、繁殖、变异、更新、优化步骤迭代进化。使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。这个方法探索烟、火检测的网络结构,同时采用进化算法限制探索空间,提高优化效率。

Description

基于进化方法搜索烟、火检测网络架构的方法
技术领域
本发明涉及烟雾识别技术领域,具体涉及一种搜索火灾烟雾检测深度网络架构的方法。
背景技术
火灾预警一直是消防安全领域的重要课题。火灾发生前期通常会产生大量烟雾。如果能够及时地检测到烟雾,就可以提供更早的火灾预警,减少人员伤亡和财产损失。传统的烟雾检测方法通常基于颜色、纹理、形状、运动等特征,取得了一定的成果,但在实际应用中仍然存在问题,往往在某些场合有效,而换了应用场景效果欠佳。这主要在于烟雾的静态特征如颜色、纹理等受天气、光照、时间等影响变化范围太大,而动态特征如背景建模或者帧间差分通常基于阈值,阈值对检测结果影响较大。
近些年来,深度神经网络在人脸识别、图像分类等方面取得了突破性进展。深度神经网络以原始图像作为输入,通过组合浅层特征形成更加抽象的高层特征,可以发现数据深层次的分布式特征,避免人工提取特征工作的繁复冗杂。但是网络架构设计中,需要消耗大量的人力和时间,而且由于人在探索时缺乏明确的理论指导,以及人的健忘、易疲倦和情绪化等因素,因此尝试将网络架构搜索的任务转移给机器来自动完成。
发明内容
为解决上述问题,本发明提供了针对烟、火检测的卷积网络,采用强化学习探索优化结构,同时采用进化算法限制探索空间,提高优化效率。
本发明通过以下技术方案予以实现:
建立一个智能代理,可以往初始架构中添加层、连接和修改参数,生成新的网络架构状态,并评价网络架构。这其实是个强化学习过程,包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率,如下式
πθ(s,a)=P(a|s,θ)≈π(a|s) (1)
式中π是策略,s是网络状态,θ是策略网络的参数。critic是以损失函数为基础的评估网络,包括状态s价值和动作a价值,如下式
Figure BDA0003240346260000021
其中w为目标网络的参数。
首先actor根据策略选择动作ai与环境进行交互,当前状态st执行动作ai后反馈一个奖励值rt并移动到下个状态st+1。actor将环境的状态转换存储到经验回放池,然后小批量采样。critic会根据动作值函数进行评估,将评估结果反馈给当前评价网络,并计算评价网络梯度更新。另一方面,critic将评估结果传到actor中用于更新策略网络参数。最后更新actor和critic生成的目标网络。
目标网络的进化步骤主要包括网络编码、搜索策略和性能评估。搜索策略由actor网络负责,性能评估由critic网络负责。
(1)网络编码
采用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。暂定网络最多35层;每层可能是卷积、批正则化、激活、池化、dropout、连接等操作中的一种;由于每层的类型不同,其操作、选项和连接不同。因此把每层表达为3个属性,连接和操作,因此105位的编码可以表示网络。操作用6个选项的编码表示,操作选项用9个选项的编码表示,连接用34个选项的编码表示。
(2)搜索策略
将颜色、纹理和轮廓子网络做为初始种群,开始按以下步骤迭代进化。
选择:从种群中随机选择k个个体,然后按性能对k个个体进行排序,并以概率p选择最佳个体,而次优个体的概率为p×(1-p)。
繁殖:每两个个体繁殖出一个新的后代。父母网络可以通过一个点或多点交叉进行组合。
变异:预定义一组突变运算符,包括更改操作、选项和连接。突变可能探索更多新颖的结构并确保种群的多样性。
更新:在种群中随机选择两个个体,将较差的个体从种群中剔除。
优化:建立目标函数的概率模型,然后使用该模型选择最优的超参数,最后对真实的目标函数评估所选的超参数。
(3)性能评估
使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。也正是有个这个利器,使得它里边提出方法即使用看起来并不复杂的启发式搜索,也能达到很好的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的处理流程示意图;
图2网络进化流程。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
建立一个智能代理,可以往初始架构中添加层、连接和修改参数,生成新的网络架构状态,并评价网络架构。这包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率,如下式
πθ(s,a)=P(a|s,θ)≈π(a|s) (1)
式中π是策略,s是网络状态,θ是策略网络的参数。critic是以损失函数为基础的评估网络,包括状态s价值和动作a价值,如下式
Figure BDA0003240346260000041
其中w为目标网络的参数。
搜索策略如图1所示。首先actor根据策略选择动作ai与环境进行交互,当前状态st执行动作ai后反馈一个奖励值rt并移动到下个状态st+1。actor将环境的状态转换存储到经验回放池,然后小批量采样。critic会根据动作值函数进行评估,将评估结果反馈给当前评价网络,并计算评价网络梯度更新。另一方面,critic将评估结果传到actor中用于更新策略网络参数。最后更新actor和critic生成的目标网络。
目标网络的进化步骤如图2所示,主要包括网络编码、搜索策略和性能评估。搜索策略由actor网络负责,性能评估由critic网络负责。
(1)网络编码
采用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。暂定网络最多35层;每层可能是卷积、批正则化、激活、池化、dropout、连接等操作中的一种;由于每层的类型不同,其操作、选项和连接不同。因此把每层表达为3个属性,连接和操作,因此105位的编码可以表示网络。操作用6个选项的编码表示,操作选项用9个选项的编码表示,连接用34个选项的编码表示。
(2)搜索策略
将颜色、纹理和轮廓子网络做为初始种群,开始按以下步骤迭代进化。
选择:从种群中随机选择k个个体,然后按性能对k个个体进行排序,并以概率p选择最佳个体,而次优个体的概率为p×(1-p)。
繁殖:每两个个体繁殖出一个新的后代。父母网络可以通过一个点或多点交叉进行组合。
变异:预定义一组突变运算符,包括更改操作、选项和连接。突变可能探索更多新颖的结构并确保种群的多样性。
更新:在种群中随机选择两个个体,将较差的个体从种群中剔除。
优化:建立目标函数的概率模型,然后使用该模型选择最优的超参数,最后对真实的目标函数评估所选的超参数。
(3)性能评估
使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。也正是有个这个利器,使得它里边提出方法即使用看起来并不复杂的启发式搜索,也能达到很好的效果。

Claims (4)

1.一种基于进化方法搜索烟、火检测网络架构的方法,包括actor和critic两部分。actor根据奖惩信息调节不同状态下采取各种动作的概率。首先用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示。然后将颜色、纹理和轮廓子网络做为初始种群,开始按选择、繁殖、变异、更新、优化步骤迭代进化。使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。这个方法探索烟、火检测的网络结构,同时采用进化算法限制探索空间,提高优化效率。
2.根据权利要求1,其所提到的采用计算图表达网络结构,并进一步将层、层的连接及层内的操作用编码表示;每层可能是卷积、批正则化、激活、池化、dropout、连接等操作中的一种;由于每层的类型不同,其操作、选项和连接不同,因此把每层表达为3个属性,连接和操作,因此105位的编码可以表示网络;操作用6个选项的编码表示,操作选项用9个选项的编码表示,连接用34个选项的编码表示。
3.根据权利要求1,将颜色、纹理和轮廓子网络做为初始种群,开始按以下步骤迭代进化。
选择:从种群中随机选择k个个体,然后按性能对k个个体进行排序,并以概率p选择最佳个体,而次优个体的概率为p×(1-p)。
繁殖:每两个个体繁殖出一个新的后代。父母网络可以通过一个点或多点交叉进行组合。
变异:预定义一组突变运算符,包括更改操作、选项和连接。突变可能探索更多新颖的结构并确保种群的多样性。
更新:在种群中随机选择两个个体,将较差的个体从种群中剔除。
优化:建立目标函数的概率模型,然后使用该模型选择最优的超参数,最后对真实的目标函数评估所选的超参数。
4.根据权利要求1,使用critic评估网络来做准确率预测器,输入为网络结构的变长字符串描述,输出预测的验证精度。也正是有个这个利器,使得它里边提出方法即使用看起来并不复杂的启发式搜索,也能达到很好的效果。
CN202111016458.2A 2021-06-16 2021-08-31 基于进化方法搜索烟、火检测网络架构的方法 Pending CN113743605A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110665260 2021-06-16
CN2021106652600 2021-06-16

Publications (1)

Publication Number Publication Date
CN113743605A true CN113743605A (zh) 2021-12-03

Family

ID=78734461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111016458.2A Pending CN113743605A (zh) 2021-06-16 2021-08-31 基于进化方法搜索烟、火检测网络架构的方法

Country Status (1)

Country Link
CN (1) CN113743605A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115471993A (zh) * 2022-07-06 2022-12-13 江苏科技大学 基于imode分层进化算法的火警管理水平评估方法及系统

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020174079A1 (en) * 1999-09-01 2002-11-21 Keith E. Mathias Method for improving neural network architectures using evolutionary algorithms
CN107749067A (zh) * 2017-09-13 2018-03-02 华侨大学 基于运动特性和卷积神经网络的火灾烟雾检测方法
US20180114116A1 (en) * 2016-10-26 2018-04-26 Sentient Technologies (Barbados) Limited Cooperative evolution of deep neural network structures
CN108334949A (zh) * 2018-02-11 2018-07-27 浙江工业大学 一种优化深度卷积神经网络结构的快速进化方法
CN109068391A (zh) * 2018-09-27 2018-12-21 青岛智能产业技术研究院 基于边缘计算和Actor-Critic算法的车联网通信优化算法
US20190080240A1 (en) * 2017-09-08 2019-03-14 SparkCognition, Inc. Execution of a genetic algorithm with variable evolutionary weights of topological parameters for neural network generation and training
CN110516573A (zh) * 2019-08-19 2019-11-29 温州大学 结合颜色、纹理特征的两阶段烟雾识别卷积神经网络
CN110659721A (zh) * 2019-08-02 2020-01-07 浙江省北大信息技术高等研究院 一种目标检测网络的构建方法和系统
CN112116671A (zh) * 2020-09-05 2020-12-22 温州大学 注意力机制降低烟、火监测计算量的方法及电子设备
CN112148008A (zh) * 2020-09-18 2020-12-29 中国航空无线电电子研究所 一种基于深度强化学习的实时无人机路径预测方法
CN112465120A (zh) * 2020-12-08 2021-03-09 上海悠络客电子科技股份有限公司 一种基于进化方法的快速注意力神经网络架构搜索方法
US20210110276A1 (en) * 2019-10-15 2021-04-15 Beijing Xiaomi Intelligent Technology Co., Ltd. Search method, device and storage medium for neural network model structure
CN112749644A (zh) * 2020-12-30 2021-05-04 大连海事大学 一种基于改进可变形卷积的Faster RCNN火灾烟雾检测方法
CN112766179A (zh) * 2021-01-22 2021-05-07 郑州轻工业大学 一种基于运动特征混合深度网络的火灾烟雾检测方法
CN115879315A (zh) * 2022-12-29 2023-03-31 东南大学 基于对抗强化学习的人群紧急疏散机器人模型

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020174079A1 (en) * 1999-09-01 2002-11-21 Keith E. Mathias Method for improving neural network architectures using evolutionary algorithms
US20180114116A1 (en) * 2016-10-26 2018-04-26 Sentient Technologies (Barbados) Limited Cooperative evolution of deep neural network structures
US20190080240A1 (en) * 2017-09-08 2019-03-14 SparkCognition, Inc. Execution of a genetic algorithm with variable evolutionary weights of topological parameters for neural network generation and training
CN107749067A (zh) * 2017-09-13 2018-03-02 华侨大学 基于运动特性和卷积神经网络的火灾烟雾检测方法
CN108334949A (zh) * 2018-02-11 2018-07-27 浙江工业大学 一种优化深度卷积神经网络结构的快速进化方法
CN109068391A (zh) * 2018-09-27 2018-12-21 青岛智能产业技术研究院 基于边缘计算和Actor-Critic算法的车联网通信优化算法
CN110659721A (zh) * 2019-08-02 2020-01-07 浙江省北大信息技术高等研究院 一种目标检测网络的构建方法和系统
CN110516573A (zh) * 2019-08-19 2019-11-29 温州大学 结合颜色、纹理特征的两阶段烟雾识别卷积神经网络
US20210110276A1 (en) * 2019-10-15 2021-04-15 Beijing Xiaomi Intelligent Technology Co., Ltd. Search method, device and storage medium for neural network model structure
CN112116671A (zh) * 2020-09-05 2020-12-22 温州大学 注意力机制降低烟、火监测计算量的方法及电子设备
CN112148008A (zh) * 2020-09-18 2020-12-29 中国航空无线电电子研究所 一种基于深度强化学习的实时无人机路径预测方法
CN112465120A (zh) * 2020-12-08 2021-03-09 上海悠络客电子科技股份有限公司 一种基于进化方法的快速注意力神经网络架构搜索方法
CN112749644A (zh) * 2020-12-30 2021-05-04 大连海事大学 一种基于改进可变形卷积的Faster RCNN火灾烟雾检测方法
CN112766179A (zh) * 2021-01-22 2021-05-07 郑州轻工业大学 一种基于运动特征混合深度网络的火灾烟雾检测方法
CN115879315A (zh) * 2022-12-29 2023-03-31 东南大学 基于对抗强化学习的人群紧急疏散机器人模型

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
章鹏;刘全;钟珊;翟建伟;钱炜晟;: "增量式双自然策略梯度的行动者评论家算法", 通信学报, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115471993A (zh) * 2022-07-06 2022-12-13 江苏科技大学 基于imode分层进化算法的火警管理水平评估方法及系统
CN115471993B (zh) * 2022-07-06 2023-09-26 江苏科技大学 基于imode分层进化算法的火警管理水平评估方法及系统

Similar Documents

Publication Publication Date Title
CN111079561B (zh) 一种基于虚拟训练的机器人智能抓取方法
CN110598598A (zh) 基于有限样本集的双流卷积神经网络人体行为识别方法
CN110782015A (zh) 神经网络的网络结构优化器的训练方法、装置及存储介质
CN108334949A (zh) 一种优化深度卷积神经网络结构的快速进化方法
Bhanu et al. Adaptive image segmentation using genetic and hybrid search methods
CN111652357B (zh) 一种利用基于图的特定目标网络解决视频问答问题的方法及其系统
CN111429415B (zh) 基于网络协同剪枝的产品表面缺陷高效检测模型构建方法
CN106503654A (zh) 一种基于深度稀疏自编码网络的人脸情感识别方法
CN107862275A (zh) 人体行为识别模型及其构建方法和人体行为识别方法
CN110322445B (zh) 基于最大化预测和标签间相关性损失函数的语义分割方法
CN114373101A (zh) 基于进化策略的神经网络架构搜索的图像分类方法
CN108573246A (zh) 一种基于深度学习的时序动作识别方法
CN115064020B (zh) 基于数字孪生技术的智慧教学方法、系统及存储介质
CN111753207A (zh) 一种基于评论的神经图协同过滤模型
CN112634019A (zh) 基于细菌觅食算法优化灰色神经网络的违约概率预测方法
CN116015967B (zh) 基于改进鲸鱼算法优化delm的工业互联网入侵检测方法
CN110889560A (zh) 一种具有深度可解释性的快递序列预测的方法
CN113888638A (zh) 一种基于注意力机制的图神经网络行人轨迹预测方法
CN113743605A (zh) 基于进化方法搜索烟、火检测网络架构的方法
CN115203550A (zh) 一种增强邻居关系的社交推荐方法及系统
CN117743719B (zh) 一种页面元素的识别方法
CN111160327B (zh) 一种基于轻量化卷积神经网络的表情识别方法
CN112215346A (zh) 一种类人通用人工智能的实现方法
CN116311454A (zh) 一种多线索关联学习的面部表情识别方法及系统
CN115170888A (zh) 基于视觉信息和语义属性的电子元器件零样本识别模型及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination