CN117010447B - 基于端到端的可微架构搜索方法 - Google Patents

基于端到端的可微架构搜索方法 Download PDF

Info

Publication number
CN117010447B
CN117010447B CN202311284266.9A CN202311284266A CN117010447B CN 117010447 B CN117010447 B CN 117010447B CN 202311284266 A CN202311284266 A CN 202311284266A CN 117010447 B CN117010447 B CN 117010447B
Authority
CN
China
Prior art keywords
network
search
output
group
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311284266.9A
Other languages
English (en)
Other versions
CN117010447A (zh
Inventor
程先琼
严张豹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Univeristy of Technology
Original Assignee
Chengdu Univeristy of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Univeristy of Technology filed Critical Chengdu Univeristy of Technology
Priority to CN202311284266.9A priority Critical patent/CN117010447B/zh
Publication of CN117010447A publication Critical patent/CN117010447A/zh
Application granted granted Critical
Publication of CN117010447B publication Critical patent/CN117010447B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于端到端的可微架构搜索方法,包括搭建端到端的可微架构搜索网络,该网络包括由线性网络子结构构成的主干网络、颈部网络、检测头,三者搜索空间分别为A1、A2、A3;对搜索空间松弛化处理;选取目标检测任务的数据集训练网络并采用梯度下降搜索策略更新网络得到最佳结构参数,将用最佳结构参数搭建的网络作为目标检测网络,用数据集再次训练至收敛,得到最终目标检测网络。本发明能根据目标检测任务自动搜索设计出符合需求的网络架构,且搜索结果更偏向于轻量化神经网络,满足边缘设备对轻量化模型的需求。本发明学习效率高、计算消耗少,主干网络、颈部网络、检测头的搜索空间进行搜索,从而真正实现端到端的搜索。

Description

基于端到端的可微架构搜索方法
技术领域
本发明涉及一种深度学习中神经网络架构搜索领域,尤其涉及一种基于端到端的可微架构搜索方法。
背景技术
一般而言,目标检测网络被人为划为成三部分:主干网络 Backbone,脖颈 Neck,检测头Head。Backbone代表检测网络初始部分,这部分主要负责进行特征提取,常用的Backbone有ResNet,VGG等。Head位于网络的末尾,主要用于利用之前提取处理好的特征进行分类预测以及坐标回归。Neck 则是位于Backbone和Head之间的网络,通常而言是为了进一步更好的提取信息特征,如多尺度特征融合。
近年来,NAS 在图像目标检测领域取得的成果逐年增加,但是大多数都是针对目标检测骨干网络或者特征融合层 (Feature Pyramid Networks,FPN)等单个目标检测网络组件进行搜索。
Chen等人受one-shot NAS方法的启发,提出的DetNAS就是针对单一的backbone进行搜索。DetNAS的框架包括三个步骤:
(1)在ImageNet上预训练one-shot supernet;
(2)在测试数据集上微调one-shot supernet;
(3)使用进化算法EA在经过训练的supernet上进行体系架构搜索
Wang等人提出NAS-FCOS则是针对neck部分和head部分进行同时搜索,所采用的搜索策略为强化学习。
但现有的技术所存在的问题主要有两点:
(1)只针对单一的目标检测网络组件进行搜索。目标检测网络有3部分,但是DetNAS和NAS-FCOS都只搜索了其中1个或2个组件,而最近的研究:Mnasfpn: Learninglatency-aware pyramid architecture for object detection on mobile devices表明,直接针对整个检测网络进行端到端的搜索会具有更好的效果。
(2)搜索策略太耗时。DetNAS和NAS-FCOS都采用的计算量巨大的遗传算法或强化学习策略进行搜索,这类策略需要极大的计算量,带来了极大的时间成本和人力成本。
发明内容
本发明的目的就在于提供一种解决上述问题,克服只能针对单一的目标检测网络组件进行搜索,且搜索策略太耗时的缺陷的,基于端到端的可微架构搜索方法。
为了实现上述目的,本发明采用的技术方案是这样的:一种基于端到端的可微架构搜索方法,包括以下步骤;
(1)搭建一用于执行目标检测任务的端到端的可微架构搜索网络,包括主干网络、颈部网络、检测头,所述检测头输出端分为两路,分别连接坐标回归网络和分类网络;
(2)构建主干网络、颈部网络、检测头的搜索空间A1、A2、A3;
(21)构建线性网络子结构T-cell;
所述T-cell包括依次设置的输入节点、第一节点、第二节点、输出节点;
输入节点、第一节点间设有数个特征提取操作,第一节点、第二节点设有数个逐点卷积操作,第二节点、输出节点设有数个激活操作;
(22)用T-cell搭建主干网络、颈部网络、检测头;
所述主干网络由3个T-cell串联而成,依次为T-cell1、T-cell2、T-cel3;
所述颈部网络包括9个T-cell,其中每3个串联构成一组,分别第一组、第二组和第三组,T-cell1、T-cell2、T-cel3的输出分别接第一组、第二组和第三组的输入;
所述检测头包括2个串联的T-cell;
(23)根据主干网络、颈部网络、检测头的结构,得到对应的搜索空间A1、A2、A3;
(3)对搜索空间松弛化处理;
(4)选取目标检测任务的数据集,包括训练集、测试集和验证集;
(5)用数据集训练端到端的可微架构搜索网络,根据下式得到A1、A2、A3的最佳结构参数α * β * γ *
式中,αβγ为A1、A2、A3的结构参数,α∈A1、β∈A2、γ∈A3;
ω为以αβγ搭建的端到端的可微架构搜索网络的网络权值,ω * (α,β,γ)为该网络训练至收敛后的网络权值;
、/>分别为目标检测任务在验证集和训练集上的损失;
(6)将以α * β * γ * 搭建的端到端的可微架构搜索网络作为目标检测网络Net 1,用数据集再次训练至Net 1收敛,得到最终目标检测网络Net best
作为优选:步骤(3)对搜索空间松弛化处理,具体为,
对每个T-cell,将相邻节点间的每项操作分别作为一条边,用混合操作计算得到一混合输出,再送入下一节点;
混合操作时,将相邻两节点按信号流向分别标记为N1和N2,输入特征从N1输入,经混合操作后从N2输出,混合操作采用下式计算;
式中,x为输入特征,O为N1和N2间所有操作的集合,o∈O,是O中一项操作,o(x)表示N1和N2间对x用o操作,α o 为o(x)的权重,out(x)为混合操作后的输出,m为归一化常数,且/>
作为优选:步骤(5)具体为;
(a1)输入n个训练集中的训练数据x 1x 2,…,x n
(a2)对每个训练数据,经主干网络的t-cell1、T-cell2、T-cell3分别得到第一主干网络输出、第二主干网络输出/>、第三主干网络输出/>
(a3)将、/>、/>分别送入颈部网络的第一组、第二组和第三组中,得到第一组到第三组的输出/>
(a4)调整尺寸至相同,再进行特征融合得到颈部网络输出特征F 4
(a5)将F 4送入检测头,经检测头的2个T-cell得到检测头输出
(a6)将送入坐标回归网络和分类网络,计算回归损失l position 和分类损失l class
(a7)通过l position l class 进行反向传播,采用梯度下降更新网络权值ω;
(a8)固定网络权值ω;
(a9)输入n个测试集中的测试数据t 1t 2,…,t n ,对每个测试数据,按步骤(a1)-(a6)处理得到l position l class
(a10)通过(a9)得到的l position l class 进行反向传播,采用梯度下降更新结构参数αβγ
(a11)重复步骤(a1)-(a10)直至收敛,将此时的αβγ,作为A1、A2、A3的最佳结构参数α * β * γ *
作为优选:对一个T-cell,其输入F in 和输出F out 通过下式得到;
F out =TCELLF in )式中,TCELL()示该T-cell内依次进行的三次混合操作。
作为优选:步骤(a4)中,调整尺寸至相同,具体为,通过上采样和下采样的方式,对的尺寸进行调整;所述特征融合为,通过特征相加的方式。
作为优选:步骤(a6)中,回归损失l position 和分类损失l class 通过下式计算;
式中,Conv box ()为坐标回归网络的卷积运算,Conv class ()为分类网络的卷积运算;
所述坐标回归网络由3层网络结构构成,第一层为3x3的卷积层,第二层为3x3的深度可分离卷积层,第三层为1x1的深度可分离卷积层;
所述分类网络也由3层网络结构构成,第一层为3x3的卷积层,第二层为3x3的深度可分离卷积层,第三层为全连接层。
与现有技术相比,本发明的优点在于:
本发明提出了一种基于端到端的可微架构搜索方法,首先构建一种端到端的可微架构搜索网络,该网络用到了线性网络子结构T-cell。本发明的T-cell引入了多种轻量化操作,从而使得搜索结果更偏向于轻量化神经网络,进而满足边缘设备对轻量化模型的需求。
本发明松驰化了搜索空间,将离散的空间变得可微,从而采用梯度下降策略进行搜索,所述梯度下降策略搜索比基于遗传算法和强化学习的策略更快,计算消耗更小,从而使本发明具有学习效率高、计算消耗少的优点。
综上,基于本发明架构和方法,不仅能根据目标检测任务自动搜索设计出符合需求的网络架构,且设计过程中同时对主干网络、颈部网络、检测头的搜索空间进行搜索,不仅效率高、计算消耗少、且能真正实现端到端的搜索。
附图说明
图1为端到端的可微架构搜索网络整体架构图;
图2为线性网络子结构T-cell的结构图。
具体实施方式
下面将结合附图对本发明作进一步说明。
实施例1:参见图1到图2,一种基于端到端的可微架构搜索方法,包括以下步骤;
(1)搭建一用于执行目标检测任务的端到端的可微架构搜索网络,包括主干网络、颈部网络、检测头,所述检测头输出端分为两路,分别连接坐标回归网络和分类网络;
(2)构建主干网络、颈部网络、检测头的搜索空间A1、A2、A3;
(21)构建线性网络子结构T-cell;
所述T-cell包括依次设置的输入节点、第一节点、第二节点、输出节点;
输入节点、第一节点间设有数个特征提取操作,第一节点、第二节点设有数个逐点卷积操作,第二节点、输出节点设有数个激活操作;
(22)用T-cell搭建主干网络、颈部网络、检测头;
所述主干网络由3个T-cell串联而成,依次为T-cell1、T-cell2、T-cel3;
所述颈部网络包括9个T-cell,其中每3个串联构成一组,分别第一组、第二组和第三组,T-cell1、T-cell2、T-cel3的输出分别接第一组、第二组和第三组的输入;
所述检测头包括2个串联的T-cell;
(23)根据主干网络、颈部网络、检测头的结构,得到对应的搜索空间A1、A2、A3;
(3)对搜索空间松弛化处理;
(4)选取目标检测任务的数据集,包括训练集、测试集和验证集;
(5)用数据集训练端到端的可微架构搜索网络,根据下式得到A1、A2、A3的最佳结构参数α * β * γ *
式中,αβγ为A1、A2、A3的结构参数,α∈A1、β∈A2、γ∈A3;
ω为以αβγ搭建的端到端的可微架构搜索网络的网络权值,ω * (α,β,γ)为该网络训练至收敛后的网络权值;
、/>分别为目标检测任务在验证集和训练集上的损失;
(6)将以α * β * γ * 搭建的端到端的可微架构搜索网络作为目标检测网络Net 1,用数据集再次训练至Net 1收敛,得到最终目标检测网络Net best
本发明中,步骤(3)对搜索空间松弛化处理,具体为,
对每个T-cell,将相邻节点间的每项操作分别作为一条边,用混合操作计算得到一混合输出,再送入下一节点;
混合操作时,将相邻两节点按信号流向分别标记为N1和N2,输入特征从N1输入,经混合操作后从N2输出,混合操作采用下式计算;
式中,x为输入特征,O为N1和N2间所有操作的集合,o∈O,是O中一项操作,o(x)表示N1和N2间对x用o操作,α o 为o(x)的权重,out(x)为混合操作后的输出,m为归一化常数,且/>
实施例2:参见图1到图2,为了更好的说明本发明的实施方式,在在实施例1的基础上,我们给出实施例1中,步骤(5)的具体训练方式如下。
(5)用数据集训练端到端的可微架构搜索网络,根据下式得到A1、A2、A3的最佳结构参数α * β * γ * ,包括步骤(a1)-(a11);
(a1)输入n个训练集中的训练数据x 1x 2,…,x n
(a2)对每个训练数据,经主干网络的t-cell1、T-cell2、T-cell3分别得到第一主干网络输出、第二主干网络输出/>、第三主干网络输出/>
(a3)将、/>、/>分别送入颈部网络的第一组、第二组和第三组中,得到第一组到第三组的输出/>
(a4)调整尺寸至相同,再进行特征融合得到颈部网络输出特征F 4
(a5)将F 4送入检测头,经检测头的2个T-cell得到检测头输出
(a6)将送入坐标回归网络和分类网络,计算回归损失l position 和分类损失l class
(a7)通过l position l class 进行反向传播,采用梯度下降更新网络权值ω;
(a8)固定网络权值ω;
(a9)输入n个测试集中的测试数据t 1t 2,…,t n ,对每个测试数据,按步骤(a1)-(a6)处理得到l position l class
(a10)通过(a9)得到的l position l class 进行反向传播,采用梯度下降更新结构参数αβγ
(a11)重复步骤(a1)-(a10)直至收敛,将此时的αβγ,作为A1、A2、A3的最佳结构参数α * β * γ *
本实施例中,对一个T-cell,其输入F in 和输出F out 通过下式得到;
F out =TCELLF in )式中,TCELL()示该T-cell内依次进行的三次混合操作。
步骤(a4)中,调整尺寸至相同,具体为,通过上采样和下采样的方式,对/>的尺寸进行调整;所述特征融合为,通过特征相加的方式。
步骤(a6)中,回归损失l position 和分类损失l class 通过下式计算;
式中,Conv box ()为坐标回归网络的卷积运算,Conv class ()为分类网络的卷积运算;
所述坐标回归网络由3层网络结构构成,第一层为3x3的卷积层,第二层为3x3的深度可分离卷积层,第三层为1x1的深度可分离卷积层;
所述分类网络也由3层网络结构构成,第一层为3x3的卷积层,第二层为3x3的深度可分离卷积层,第三层为全连接层。
在本实施的步骤(a3)中:
对于,送入第一组,分别经三个T-cell处理得到对应输出/>
对于,送入第二组,分别经三个T-cell处理得到对应输出/>
对于,送入第三组,分别经三个T-cell处理得到对应输出/>
对于步骤(a5),将F 4送入检测头,经检测头的2个T-cell得到2个对应输出,分别是、/>;后续步骤我们仅使用/>
实施例3:参见图1到图2,我们给出一种具体的T-cell设计方法。其中,输入节点和第一节点间设有8个特征提取操作,分别标记为op1到op8,每个符号的对应操作、该操作的含义,见表1。同理,第一节点、第二节点设有5个逐点卷积操作W-op1到W-op5,第二节点、输出节点设有5个激活操作,A-op1到A-op5。符号的对应操作、操作的含义见表1。
表1.T-cell中各操作所对应的符号映射关系表
在对搜索空间松弛化处理的时候,我们以一个T-cell为例,op1到op8看成8条边,分别对应一权重;W-op1到W-op5看成5条边,也分别对应一权重;A-op1到A-op5也是5条分配了权重的边。
将一个数据送入T-cell,会先后在四个节点间out(x)公式进行三次混合操作。这三次操作,我们用TCELL()来表示,对每个T-cell,输入节点输入F in 、经三次混合操作后,在输出节点得到输出F out F out =TCELLF in )。
实施例4:本发明方法在目标检测领域具有通用性,可应用于各类需要神经网络模型的人工智能相关的场景,以下列举2个场景。
场景1:无人机火灾预警和人员搜救。无人机火灾预警和人员搜救往往涉及目标检测和目标识别两类任务,这两类任务需要神经网络的支持。通过该发明,输入无人机拍摄下的各类人员图像和火灾图像数据,然后经过搜索训练,最终可以搜索得到一个高效的神经网络模型,满足两类任务的应用需求。
场景2:机器人寻物。机器人寻物其中重要的一个环节是检测到物体所在,即目标检测任务,而作为一种边缘设备,复杂的网络模型难以部署,故而需要较为轻量的目标检测神经网络模型。通过输入寻找物体的图像信息,该发明经过搜索会得到一个高精度的目标检测模型,且由于其搜索空间多为轻量化操作,故而搜索出的最终网络模型更偏向于轻量化模型,进而满足边缘设备的部署要求。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于端到端的可微架构搜索方法,其特征在于:包括以下步骤;
(1)搭建一用于执行图像目标检测任务的端到端的可微架构搜索网络,包括主干网络、颈部网络、检测头,所述检测头输出端分为两路,分别连接坐标回归网络和分类网络;
(2)构建主干网络、颈部网络、检测头的搜索空间A1、A2、A3;
(21)构建线性网络子结构T-cell;
所述T-cell包括依次设置的输入节点、第一节点、第二节点、输出节点;
输入节点、第一节点间设有数个特征提取操作,第一节点、第二节点设有数个逐点卷积操作,第二节点、输出节点设有数个不同的激活操作;
(22)用T-cell搭建主干网络、颈部网络、检测头;
所述主干网络由3个T-cell串联而成,依次为T-cell1、T-cell2、T-cel3;
所述颈部网络包括9个T-cell,其中每3个串联构成一组,分别第一组、第二组和第三组,T-cell1、T-cell2、T-cel3的输出分别接第一组、第二组和第三组的输入;
所述检测头包括2个串联的T-cell;
(23)根据主干网络、颈部网络、检测头的结构,得到对应的搜索空间A1、A2、A3;
(3)对搜索空间松弛化处理;
(4)选取图像目标检测任务的数据集,包括训练集、测试集和验证集;
(5)用数据集训练端到端的可微架构搜索网络,根据下式得到A1、A2、A3的最佳结构参数α * β * γ *
式中,αβγ为A1、A2、A3的结构参数,α∈A1、β∈A2、γ∈A3;
ω为以αβγ搭建的端到端的可微架构搜索网络的网络权值,ω * (α,β,γ)为该网络训练至收敛后的网络权值;
、/>分别为图像目标检测任务在验证集和训练集上的损失;
(6)将以α * β * γ * 搭建的端到端的可微架构搜索网络作为图像目标检测网络Net 1,用数据集再次训练至Net 1收敛,得到最终图像目标检测网络Net best
步骤(5)具体为;
(a1)输入n个训练集中的训练数据x 1x 2,…,x n
(a2)对每个训练数据,经主干网络的t-cell1、T-cell2、T-cell3分别得到第一主干网络输出、第二主干网络输出/>、第三主干网络输出/>
(a3)将、/>、/>分别送入颈部网络的第一组、第二组和第三组中,得到第一组到第三组的输出/>
(a4)调整尺寸至相同,再进行特征融合得到颈部网络输出特征F 4
(a5)将F 4送入检测头,经检测头的2个T-cell得到检测头输出
(a6)将送入坐标回归网络和分类网络,计算回归损失l position 和分类损失l class
(a7)通过l position l class 进行反向传播,采用梯度下降更新网络权值ω;
(a8)固定网络权值ω;
(a9)输入n个测试集中的测试数据t 1t 2,…,t n ,对每个测试数据,按步骤(a1)-(a6)处理得到l position l class
(a10)通过(a9)得到的l position l class 进行反向传播,采用梯度下降更新结构参数αβγ
(a11)重复步骤(a1)-(a10)直至收敛,将此时的αβγ,作为A1、A2、A3的最佳结构参数α * β * γ *
2.根据权利要求1所述的基于端到端的可微架构搜索方法,其特征在于:步骤(3)对搜索空间松弛化处理,具体为,
对每个T-cell,将相邻节点间的每项操作分别作为一条边,用混合操作计算得到一混合输出,再送入下一节点;
混合操作时,将相邻两节点按信号流向分别标记为N1和N2,输入特征从N1输入,经混合操作后从N2输出,混合操作采用下式计算;
式中,x为输入特征,O为N1和N2间所有操作的集合,o∈O,是O中一项操作,o(x)表示N1和N2间对x用o操作,α o 为o(x)的权重,out(x)为混合操作后的输出,m为归一化常数,且/>
3.根据权利要求1所述的基于端到端的可微架构搜索方法,其特征在于:对一个T-cell,其输入F in 和输出F out 通过下式得到;
F out = TCELLF in )式中,TCELL()示该T-cell内依次进行的三次混合操作。
4.根据权利要求1所述的基于端到端的可微架构搜索方法,其特征在于:步骤(a4)中,调整尺寸至相同,具体为,通过上采样和下采样的方式,对/>的尺寸进行调整;所述特征融合为,通过特征相加的方式。
5.根据权利要求1所述的基于端到端的可微架构搜索方法,其特征在于:步骤(a6)中,回归损失l position 和分类损失l class 通过下式计算;
式中,Conv box ()为坐标回归网络的卷积运算,Conv class ()为分类网络的卷积运算;
所述坐标回归网络由3层网络结构构成,第一层为3x3的卷积层,第二层为3x3的深度可分离卷积层,第三层为1x1的深度可分离卷积层;
所述分类网络也由3层网络结构构成,第一层为3x3的卷积层,第二层为3x3的深度可分离卷积层,第三层为全连接层。
CN202311284266.9A 2023-10-07 2023-10-07 基于端到端的可微架构搜索方法 Active CN117010447B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311284266.9A CN117010447B (zh) 2023-10-07 2023-10-07 基于端到端的可微架构搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311284266.9A CN117010447B (zh) 2023-10-07 2023-10-07 基于端到端的可微架构搜索方法

Publications (2)

Publication Number Publication Date
CN117010447A CN117010447A (zh) 2023-11-07
CN117010447B true CN117010447B (zh) 2024-01-23

Family

ID=88573051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311284266.9A Active CN117010447B (zh) 2023-10-07 2023-10-07 基于端到端的可微架构搜索方法

Country Status (1)

Country Link
CN (1) CN117010447B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203811A (zh) * 2017-05-22 2017-09-26 成都理工大学 一种基于改进qpso算法的rbf神经网络优化方法
CN111353644A (zh) * 2020-02-27 2020-06-30 成都美云智享智能科技有限公司 基于强化学习的智能网联云平台的预测模型生成方法
CN112784954A (zh) * 2019-11-08 2021-05-11 华为技术有限公司 确定神经网络的方法和装置
CN112784140A (zh) * 2021-02-03 2021-05-11 浙江工业大学 一种高能效神经网络架构的搜索方法
CN114299000A (zh) * 2021-12-24 2022-04-08 哈尔滨工业大学(深圳) 一种基于可微分神经网络架构搜索的缺陷检测方法及系统
CN114419389A (zh) * 2021-12-14 2022-04-29 上海悠络客电子科技股份有限公司 一种基于神经网络架构搜索的目标检测模型构建方法
WO2022127299A1 (zh) * 2020-12-17 2022-06-23 苏州浪潮智能科技有限公司 构建神经网络架构搜索框架的方法、系统、设备及介质
CN115688908A (zh) * 2022-09-28 2023-02-03 东南大学 一种基于剪枝技术的高效神经网络搜索与训练方法
CN116416468A (zh) * 2023-04-11 2023-07-11 安徽中科星联信息技术有限公司 一种基于神经架构搜索的sar目标检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111797983A (zh) * 2020-05-25 2020-10-20 华为技术有限公司 一种神经网络构建方法以及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203811A (zh) * 2017-05-22 2017-09-26 成都理工大学 一种基于改进qpso算法的rbf神经网络优化方法
CN112784954A (zh) * 2019-11-08 2021-05-11 华为技术有限公司 确定神经网络的方法和装置
CN111353644A (zh) * 2020-02-27 2020-06-30 成都美云智享智能科技有限公司 基于强化学习的智能网联云平台的预测模型生成方法
WO2022127299A1 (zh) * 2020-12-17 2022-06-23 苏州浪潮智能科技有限公司 构建神经网络架构搜索框架的方法、系统、设备及介质
CN112784140A (zh) * 2021-02-03 2021-05-11 浙江工业大学 一种高能效神经网络架构的搜索方法
CN114419389A (zh) * 2021-12-14 2022-04-29 上海悠络客电子科技股份有限公司 一种基于神经网络架构搜索的目标检测模型构建方法
CN114299000A (zh) * 2021-12-24 2022-04-08 哈尔滨工业大学(深圳) 一种基于可微分神经网络架构搜索的缺陷检测方法及系统
CN115688908A (zh) * 2022-09-28 2023-02-03 东南大学 一种基于剪枝技术的高效神经网络搜索与训练方法
CN116416468A (zh) * 2023-04-11 2023-07-11 安徽中科星联信息技术有限公司 一种基于神经架构搜索的sar目标检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection;Jianyuan Guo等;《arXiv》;第1-4节 *
NAS-FCOS: Efficient Search for Object Detection Architectures;Ning Wang等;International Journal of Computer Vision;第129卷;第3299-3312页 *
基于神经网络架构搜索的铭牌目标检测方法;邓渭铭等;图学学报;第44卷(第4期);第718-727页 *

Also Published As

Publication number Publication date
CN117010447A (zh) 2023-11-07

Similar Documents

Publication Publication Date Title
Galvez et al. Object detection using convolutional neural networks
CN108304795B (zh) 基于深度强化学习的人体骨架行为识别方法及装置
CN109583322B (zh) 一种人脸识别深度网络训练方法和系统
US20200279156A1 (en) Feature fusion for multi-modal machine learning analysis
JP7048225B2 (ja) 建物領域抽出用の学習済みモデル
CN113222011B (zh) 一种基于原型校正的小样本遥感图像分类方法
CN106991440B (zh) 一种基于空间金字塔的卷积神经网络的图像分类方法
CN105989368A (zh) 一种目标检测方法及装置以及移动终端
CN111461063B (zh) 一种基于图卷积和胶囊神经网络的行为识别方法
CN104570736B (zh) 一种星‑臂耦合系统的动力学参数在轨辨识方法和装置
CN108961220A (zh) 一种基于多层卷积特征融合的图像协同显著性检测方法
US20190390396A1 (en) Robot and clothes folding apparatus including the same
CN112200266A (zh) 基于图结构数据的网络训练方法、装置以及节点分类方法
CN115146761A (zh) 一种缺陷检测模型的训练方法和相关装置
CN112464743A (zh) 一种基于多尺度特征加权的小样本目标检测方法
CN111488979A (zh) 设备上持续学习用于分析输入数据的神经网络的方法及装置
CN113033547A (zh) 一种基于MobileNetV2的焊接状态分类方法
CN117010447B (zh) 基于端到端的可微架构搜索方法
CN104680167A (zh) 基于深度学习的极光卵位置确定方法
Attamimi et al. Inclined image recognition for aerial mapping using deep learning and tree based models
Antioquia et al. ZipNet: ZFNet-level accuracy with 48× fewer parameters
CN113139432B (zh) 基于人体骨架和局部图像的工业包装行为识别方法
CN107330456A (zh) 一种基于改进AdaBoost算法的集成深度信念网络图像识别方法
JP2020123337A (ja) スマートフォン、ドローン、船舶または軍事的目的のための、トレーニングイメージの最適化サンプリングにより入力データを分析するニューラルネットワークのオンデバイス連続学習方法及び装置、そして、これを利用したテスト方法及び装置
CN111222529A (zh) 一种基于GoogLeNet-SVM的污水曝气池泡沫识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant