CN115240006B - 目标检测的卷积神经网络优化方法、装置及网络结构 - Google Patents

目标检测的卷积神经网络优化方法、装置及网络结构 Download PDF

Info

Publication number
CN115240006B
CN115240006B CN202210908602.1A CN202210908602A CN115240006B CN 115240006 B CN115240006 B CN 115240006B CN 202210908602 A CN202210908602 A CN 202210908602A CN 115240006 B CN115240006 B CN 115240006B
Authority
CN
China
Prior art keywords
convolutional neural
neural network
decision
route
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210908602.1A
Other languages
English (en)
Other versions
CN115240006A (zh
Inventor
汪俊
花诗燕
单忠德
李大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN202210908602.1A priority Critical patent/CN115240006B/zh
Publication of CN115240006A publication Critical patent/CN115240006A/zh
Application granted granted Critical
Publication of CN115240006B publication Critical patent/CN115240006B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉二维图像目标检测技术领域,解决了使用卷积神经网络进行目标检测时网络拓扑结构复杂、决策能力低下的技术问题,尤其涉及一种目标检测的卷积神经网络优化方法,包括以下步骤:S1、使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积;S2、在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由;S3、将二叉决策树和随机决策路由加入卷积神经网络的检测头中。本发明能够简化复杂的网络拓扑结构并提升网络决策能力,最终提高了目标检测的精度、速度和智能化程度,从而使优化后的卷积神经网络能够快速、高效地完成二维图像中的目标检测。

Description

目标检测的卷积神经网络优化方法、装置及网络结构
技术领域
本发明涉及计算机视觉二维图像目标检测技术领域,尤其涉及一种目标检测的卷积神经网络优化方法、装置及网络结构。
背景技术
目前计算机视觉的三大任务包括目标检测、目标分类和实例分割,使用深度学习的方法完成上述任务具有速度快、精度高、实用性强等优点。随着深度学习领域的飞速发展,卷积神经网络的深度和宽度进一步提升,造成现有网络拓扑结构复杂,训练时计算资源消耗大,训练和推理速度慢等问题,严重影响了深度卷积神经网络的发展。
当前为目标检测构建的卷积神经网络主要包含两大组件,一个是主干网络用于特征提取,主干网络包含大量复杂的拓扑结构,为提高特征提取的有效性,可以用大规模数据集进行预训练,这都加重了模型的负担,成为影响模型大小和性能的重要因素。
另一个是检测头,它产生计算损失或推断检测框的位置,而现有的卷积神经网络中检测头多由多个卷积层或全连接层依次简单连接构造而成。对于单级探测器,检测头通常是由多个卷积层叠加而成,对于两级探测器,候选框提取阶段的区域决策通常由两个全连接层实现,这些检测头的设计过于简单,无法全面激发检测头的决策性能。
发明内容
针对现有技术的不足,本发明提供了一种目标检测的卷积神经网络优化方法、装置及网络结构,解决了使用卷积神经网络进行目标检测时网络拓扑结构复杂、决策能力低下的技术问题,本发明能够简化复杂的网络拓扑结构并提升网络决策能力,最终提高了目标检测的精度、速度和智能化程度,从而使优化后的卷积神经网络能够快速、高效地完成二维图像中的目标检测。
为解决上述技术问题,本发明提供了如下技术方案:一种目标检测的卷积神经网络优化方法,包括以下步骤:
S1、使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积,用于简化网络拓扑结构;
S2、在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由;
S3、将二叉决策树和随机决策路由加入卷积神经网络的检测头中。
将步骤S1引入到卷积神经的主干网络中,使得卷积神经在保持高效率的同时,显著降低了训练时的资源消耗。
将步骤S2用于卷积神经的检测头中,使用具有节点选择损失和关联损失的随机决策路由算法,提高了特征图的表征能力和卷积神经网络的决策能力。
进一步地,在步骤S1中,深度学习模块由多层模块和多分支模块的子拓扑组成,多层模块为顺序结构,多分支模块为并行结构,深度学习模块中还包括多个卷积层,至少一个池化层、上采样层和归一化层以及多个线性缩放层。
进一步地,在步骤S1中,使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积包括以下步骤:
S11、将深度学习模块并行结构中的归一化层替换为线性缩放层;
S12、在深度学习模块的多分支特征图融合之后设置一个归一化层;
采用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积分为两个阶段,步骤S11和步骤S12为第一阶段的模块线性化阶段,用于去除原深度学习模块中的所有非线性成分,即将并行结构中的归一化层替换为线性缩放层,而为稳定训练过程,在多分支特征图融合之后再添加一个归一化层,至此,在通过在线卷积重新参数化方法重新参数化的深度学习模块中只存在线性层,模块线性化阶段完成;
S13、将若干个多层模块和多分支模块同步压缩为单个卷积;
步骤S13为第二阶段的模块压缩阶段,用于将若干个多层模块和多分支模块同步压缩为单个卷积,使其合并到一个单一的卷积层中。
进一步地,在步骤S2中,在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由包括以下步骤:
S21、对从主干网络中获得的特征图的区域特征通过平均池化进行平均,获得单个上下文类向量,单个上下文类向量经过带有Sigmoid激活函数的全连接层后为不同的节点产生路由掩码;
S22、在决策前的最后一个分类特征向量或回归特征向量上乘以路由掩码分别得出相应的决策值cl,cr和bl,br,进一步多样化不同决策节点的输入,决策节点的依赖性大幅降低,因此决策值cl,cr和bl,br具备了路由掩码特性;决策值cl,cr分别为左子树分类和右子树分类,决策值bl,br分别为右子树回归和右子树回归。
S23、在分类特征向量和回归特征向量产生的并行情况下,添加一个具有一至两个全连接层的窄分支,用于产生分类路由和回归路由,得到分类路由概率pl,pr和回归路由概率ql,qr
S24、根据步骤S21-S23找出随机决策路由。
进一步地,在步骤S24中,根据步骤S21-S23找出随机决策路由包括以下步骤:
S241、计算分类和边界框回归的选择损失;
S242、确定分类和边界框回归的关联损失;
S243、根据选择损失和关联损失整合为完整的损失函数;
S244、根据最小的损失函数找出最优的随机决策路由。
本发明还提供了一种用于实现上述卷积神经网络优化方法的装置,包括:
单个卷积压缩模块,所述单个卷积压缩模块用于使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积;
随机决策路由提出模块,所述随机决策路由提出模块用于在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由;
卷积神经网络集成模块,所述卷积神经网络集成模块用于将二叉决策树和随机决策路由加入卷积神经网络的检测头中。
本发明还提供了一种二维图像目标检测的卷积神经网络优化的网络结构,包括:
用于降低特征提取网络拓扑结构的复杂度的卷积神经主干网络,以及用于提升网络的决策能力和检测精度的卷积神经检测头。
进一步地,卷积神经主干网络包括一个输入层、多组卷积层和归一化层的组合、一个上采样层和两组池化层和归一化层的组合。
进一步地,卷积神经检测头包括一个与卷积神经主干网络接入的全连接层,还包括用于从主干网络中获得的特征图的区域特征进行平均的平均池化,平均池化接入一个带有Sigmoid激活函数的全连接层。
进一步地,卷积神经检测头还包括由全连接层在决策前的最后一个分类特征向量或回归特征向量,以及用于产生分类路由和回归路由。
借由上述技术方案,本发明提供了一种目标检测的卷积神经网络优化方法、装置及网络结构,至少具备以下有益效果:
1、本发明通过在线卷积重新参数化方法简化了网络拓扑结构,有助于减少中间计算层造成的计算和存储开销,显著降低了训练成本,但对模型性能的影响较小,网络拓扑结构简化后,便于网络朝着更强大、更复杂的方向发展。
2、本发明通过一种决策树和卷积神经网络结合的端到端学习方式进行目标检测,在检测头插入决策树来分离决策选择和预测值,使用具有节点选择损失和关联损失的随机决策路由,同时提升了特征代表性和网络决策能力。
3、本发明将在线卷积重新参数化方法引入到卷积神经的主干网络中,能够降低特征提取网络拓扑结构的复杂度,具有很强的实用性和移植性;将二叉决策树和随机决策路由用于卷积神经的检测头中,启发式地将目标检测的分类和定位任务解耦,能够提升网络的决策能力和检测精度,因此本发明对于简化深度网络拓扑结构和将检测头的分类和定位任务解耦具有很好的启发性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明卷积神经网络优化方法的流程图;
图2为本发明现有技术中的卷积神经网络结构图;
图3为本发明在线卷积重新参数化后的卷积神经网络结构图;
图4为本发明现有技术中的检测头结构图;
图5为本发明基于二叉决策树算法的检测头结构图;
图6为本发明卷积神经网络优化装置的结构框图;
图7为本发明卷积神经网络结构的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。借此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
请参照图1-图7,示出了本实施例的一种实施方式,本实施例通过在线卷积重新参数化方法简化了网络拓扑结构,有助于减少中间计算层造成的计算和存储开销,显著降低了训练成本,但对模型性能的影响较小。网络拓扑结构简化后,便于网络朝着更强大、更复杂的方向发展。
通过一种决策树和卷积神经网络结合的端到端学习方式进行目标检测,在检测头插入决策树来分离决策选择和预测值,使用具有节点选择损失和关联损失的随机决策路由,同时提升了特征代表性和网络决策能力。
请参照图1,一种目标检测的卷积神经网络优化方法,包括以下步骤:
S1、使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积,用于简化网络拓扑结构。
归一化层(BN)是卷积神经网络中多层多分支结构的关键组成部分,直接去除归一化层会导致网络检测性能急剧下降,同时过多归一化层的使用会额外带来很高的训练预算,因此引入通道级线性缩放层(scaling)作为归一化层的线性替代,用于在通道维度上缩放特征图,线性缩放层与归一化层具有相似作用,它们都鼓励网络中多个分支朝不同方向优化,同时避免网络梯度剧烈变化,线性缩放层在训练过程中可以合并,使在线卷积重新参数化成为可能。
深度学习模块由多层模块和多分支模块的子拓扑组成,多层模块为顺序结构,多分支模块为并行结构,深度学习模块中还包括多个卷积层,至少一个池化层、上采样层和归一化层以及多个线性缩放层。
在步骤S1中,使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积包括以下步骤:
S11、将深度学习模块并行结构中的归一化层替换为线性缩放层。
将并行结构中的归一化层替换为线性缩放层后,为稳定训练过程,在多分支特征图融合之后再添加一个归一化层,至此,经过重新参数化后的深度学习模块中只存在线性层,线性化阶段完成。
S12、在深度学习模块的多分支特征图融合之后设置一个归一化层。
采用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积分为两个阶段,步骤S11和步骤S12为第一阶段的模块线性化阶段,用于去除原深度学习模块中的所有非线性成分,即将并行结构中的归一化层替换为线性缩放层,而为稳定训练过程,在多分支特征图融合之后再添加一个归一化层,至此,在通过在线卷积重新参数化方法重新参数化的深度学习模块中只存在线性层,模块线性化阶段完成。
S13、将若干个多层模块和多分支模块同步压缩为单个卷积。
步骤S13为第二阶段的模块压缩阶段,用于将若干个多层模块和多分支模块同步压缩为单个卷积,使其合并到一个单一的卷积层中。
压缩为单个卷积要涉及多层模块(顺序结构)和多分支模块(并行结构)的压缩过程,卷积过程表示为:
Y=W×X
其中X、Y分别表示输入张量和输出张量,W是训练过程中产生的权重矩阵,多层模块(顺序结构)的卷积层被定义为:
Y=WN(WN-1×…(W2×(W1×X)))
假设卷积的输入通道数和输出通道数一致,根据结合律,上述公式可以转化为:
Y=(WN(WN-1×…(W2×W1)))×X=We×X
其中Wj(j=1,...,N)是第j层的权重矩阵,We表示端到端的映射矩阵,根据卷积的线性,可以将并行结构的多个分支合并为一个分支,并行结构的卷积层被定义为:
其中Wi为第i个分支的权重矩阵,为统一权重,在合并具有不同大小卷积核的卷积层时,需要对齐卷积核的空间中心。
在线卷积重新参数化过程如图3所示,无论深度卷积网络模块多么复杂,它必然由多层(顺序结构)和多分支(并行结构)的子拓扑组成。根据在线卷积重新参数化方法,可以将其压缩为单个卷积操作,得到统一的端到端映射权重矩阵,对顺序结构和并行结构的简化、压缩过程,类似于将中间特征图上的运算转化为卷积核上的运算。假设(H,W),(KH,KW)分别表示特征图和卷积核的大小,通过在线卷积重新参数化方法,可以将网络的训练成本从Ο(H×W)降低到Ο(KH×KW)。
S2、在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由。
常见的目标检测器头部为单预测型,如图4所示,全连接层后出现两个分支,分别用于目标分类和回归,引进二叉决策树前,对特征添加路由掩码,以增加多节点决策的发散性,如图5所示,对从主干网络中获得的特征图的区域特征进行平均,获得单个上下文类向量,该向量经过带有Sigmoid激活函数的全连接层后,将为不同的节点产生路由掩码。
在步骤S2中,在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由包括以下步骤:
S21、对从主干网络中获得的特征图的区域特征通过平均池化进行平均,获得单个上下文类向量,单个上下文类向量经过带有Sigmoid激活函数的全连接层后为不同的节点产生路由掩码。
S22、在决策前的最后一个分类特征向量或回归特征向量上乘以路由掩码分别得出相应的决策值cl,cr和bl,br,进一步多样化不同决策节点的输入,决策节点的依赖性大幅降低,因此决策值cl,cr和bl,br具备了路由掩码特性;决策值cl,cr分别为左子树分类和右子树分类,决策值bl,br分别为右子树回归和右子树回归。
在决策前的最后一个分类或回归特征向量上乘以路由掩码,进一步多样化不同决策节点的输入,决策节点的依赖性大幅降低,因此决策值cl,cr和bl,br具备了路由掩码特性。
S23、在分类特征向量和回归特征向量产生的并行情况下,添加一个具有一至两个全连接层的窄分支,用于产生分类路由和回归路由,得到分类路由概率pl,pr和回归路由概率ql,qr
在分类特征向量和回归特征向量产生的并行情况下,添加一个具有一至两个全连接层的窄分支,用于产生分类路由和回归路由,得到分类路由概率pl,pr和回归路由概率ql,qr
S24、根据步骤S21-S23的已知条件找出随机决策路由。
首先,为了获得高性能的树状结构检测头,需要规避不同节点的多个预测结果之间的高相关性;其次,还需要保证整个树的决策性能。因此,随机决策路由通过选择损失来监督各个节点的学习,关联损失来指导整个二叉决策树的优化,最后将选择损失和关联损失整合到一个损失函数中。
在步骤S24中,根据步骤S21-S23找出随机决策路由包括以下步骤:
S241、计算分类和边界框回归的选择损失。
为了实现低相关度的节点决策,优先选择优先级较高的节点,以更高的路由概率附加所选节点,剩余节点所附加的路由概率逐渐降低。不同的路由概率导致各节点的学习率不同,为产生多样化的节点决策,需要为各个节点设置不同的随机权重来构造选择损失。分类和边界框回归的选择损失函数表示为:
其中分别代表分类和回归的选择损失,Lcls,Lbbox指代未添加随机路由机制的普通分类和回归损失函数,C是分类的基础真值,B是边界框回归的基础真值。/>分别表示分类树选择决策路由概率的权重,/>为表示框回归树选择决策路由概率的权重。
利用随机权重来区分节点学习速度,对于分类,采用较大的随机权重来设置损失值较低的节点。对于边界框回归,我们根据ql,qr的相对大小设定权重如果ql<qr,则限制/>反之亦然。
S242、确定分类和边界框回归的关联损失。
除了选择节点区分决策外,算法还需保证整个决策树的性能,为实现这一目标,我们基于融合预测的分类值c和回归值b制定了关联损失,分类和边界框回归的关联损失公式为:
其中分别代表分类和回归的关联性损失,cl是决策树左子树分类预测值,cr是决策树右子树分类预测值,bl是决策树左子树回归预测值,br是决策树右子树回归预测值,路由概率和预测值在关联损失计算的同时进行优化。特别地,表示决策选择的路由概率只受关联损失的影响,从而在推理中产生最佳路由。
S243、根据选择损失和关联损失整合为完整的损失函数。
根据选择损失和关联损失整合的完整损失函数L公式为:
其中λ∈[0,1],是平衡选择损失和关联损失的系数。
在目标检测器检测头部分,利用决策树根据不同的视觉线索生成多个决策,发散地学习增强特征的表示,抑制过度优化,进一步促进目标检测过程。
S244、根据最小的损失函数找出最优的随机决策路由。
受决策树的启发,在目标检测器中引入树状结构检测头,将决策选择和预测值分离开来,通过多节点预测,帮助检测器探索更多不同的输出结果,我们用概率来表示节点中不同路线的决策选择,整体决策是不同节点预测值的加权和,随机决策路由从不同的节点学习不同的决策,在低相关度节点决策路由选择的情况下输出高性能的决策结果。
本实施例通过一种决策树和卷积神经网络结合的端到端学习方式进行目标检测,在检测头插入决策树来分离决策选择和预测值,使用具有节点选择损失和关联损失的随机决策路由,同时提升了特征代表性和网络决策能力。
S3、将二叉决策树和随机决策路由加入卷积神经网络的检测头中。
将步骤S1中所描述的方法引入到卷积神经的主干网络中,使得卷积神经在保持高效率的同时,显著降低了训练时的资源消耗,在线卷积重新参数化方法分两阶段完成,第一阶段为模块线性化阶段,去除原型模块中的所有非线性成分,第二阶段为模块挤压阶段,将所有线性块合并到一个单一的卷积层,通过这些步骤,使得卷积神经在保持高效率的同时,显著降低了训练时的资源消耗。
将步骤S2中所描述的方法用于卷积神经的检测头中,使用具有节点选择损失和关联损失的随机决策路由算法,提高了特征图的表征能力和卷积神经网络的决策能力。
本实施例通过在线卷积重新参数化方法简化了网络拓扑结构,有助于减少中间计算层造成的计算和存储开销,显著降低了训练成本,但对模型性能的影响较小,网络拓扑结构简化后,便于网络朝着更强大、更复杂的方向发展。
卷积神经网络中包含大量的卷积层,归一化层等,过多的模块操作严重影响了网络的学习速率和轻量性,对网络的扩展十分不利。为解决上述问题,在卷积神经网络的主干网络使用在线卷积重新参数化方法,减少了中间计算层造成的计算和存储开销,显著降低了训练成本,而对模型性能的影响较小。网络拓扑结构简化后,便于网络朝着更强大、更复杂的方向发展。为解决现有目标检测器检测头结构简单、功能单一的问题,卷积神经网络在检测头部分引入二叉决策树方法,使用包含选择性损失和关联损失的随机决策路由进行检测结果输出,提升了决策的多样性和准确性。
请参照图6,本实施例还提供了一种用于实现上述卷积神经网络优化方法的装置,包括:
单个卷积压缩模块,所述单个卷积压缩模块用于使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积;
随机决策路由提出模块,所述随机决策路由提出模块用于在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由;
卷积神经网络集成模块,所述卷积神经网络集成模块用于将二叉决策树和随机决策路由加入卷积神经网络的检测头中。
请参照图7,本实施例还提供了一种二维图像目标检测的卷积神经网络优化的网络结构,包括:
用于降低特征提取网络拓扑结构的复杂度的卷积神经主干网络,以及用于提升网络的决策能力和检测精度的卷积神经检测头,卷积神经主干网络包括一个输入层、多组卷积层和归一化层的组合、一个上采样层和两组池化层和归一化层的组合。
卷积神经检测头包括一个与卷积神经主干网络接入的全连接层,还包括用于从主干网络中获得的特征图的区域特征进行平均的平均池化,平均池化接入一个带有Sigmoid激活函数的全连接层,卷积神经检测头还包括由全连接层在决策前的最后一个分类特征向量或回归特征向量,以及用于产生分类路由和回归路由。
本实施例将在线卷积重新参数化方法引入到卷积神经的主干网络中,能够降低特征提取网络拓扑结构的复杂度,具有很强的实用性和移植性;将二叉决策树和随机决策路由用于卷积神经的检测头中,启发式地将目标检测的分类和定位任务解耦,能够提升网络的决策能力和检测精度,因此本实施例对于简化深度网络拓扑结构和将检测头的分类和定位任务解耦具有很好的启发性。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同或相似的部分互相参见即可。对于以上各实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上实施方式对本发明进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (3)

1.一种二维图像目标检测的卷积神经网络优化方法,其特征在于,包括以下步骤:
S1、使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积,包括:
S11、将深度学习模块并行结构中的归一化层替换为线性缩放层;
S12、在深度学习模块的多分支特征图融合之后设置一个归一化层;
S13、将若干个多层模块和多分支模块同步压缩为单个卷积;
S2、在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由,包括:
S21、对从主干网络中获得的特征图的区域特征通过平均池化进行平均,获得单个上下文类向量,单个上下文类向量经过带有Sigmoid激活函数的全连接层后为不同的节点产生路由掩码;
S22、在决策前的最后一个分类特征向量或回归特征向量上乘以路由掩码分别得出相应的决策值;
S23、在分类特征向量和回归特征向量产生的并行情况下,添加一个具有一至两个全连接层的窄分支,用于产生分类路由和回归路由,得到分类路由概率和回归路由概率;
S24、根据步骤S21-S23找出随机决策路由,找出随机决策路由包括以下步骤:
S241、计算分类和边界框回归的选择损失;
S242、确定分类和边界框回归的关联损失;
S243、根据选择损失和关联损失整合为完整的损失函数;
S244、根据最小的损失函数找出最优的随机决策路由;
S3、将二叉决策树和随机决策路由加入卷积神经网络的检测头中。
2.根据权利要求1所述的卷积神经网络优化方法,其特征在于:在步骤S1中,深度学习模块由多层模块和多分支模块的子拓扑组成,多层模块为顺序结构,多分支模块为并行结构,深度学习模块中还包括多个卷积层,至少一个池化层、上采样层和归一化层以及多个线性缩放层。
3.一种用于实现上述权利要求1-2任一项所述卷积神经网络优化方法的装置,其特征在于,包括:
单个卷积压缩模块,所述单个卷积压缩模块用于使用在线卷积重新参数化方法将卷积神经网络中多个深度学习模块压缩为单个卷积;
随机决策路由提出模块,所述随机决策路由提出模块用于在卷积神经网络中引入二叉决策树分离决策选择和预测值生成过程,提出具有节点选择损失和关联损失的随机决策路由;
卷积神经网络集成模块,所述卷积神经网络集成模块用于将二叉决策树和随机决策路由加入卷积神经网络的检测头中。
CN202210908602.1A 2022-07-29 2022-07-29 目标检测的卷积神经网络优化方法、装置及网络结构 Active CN115240006B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210908602.1A CN115240006B (zh) 2022-07-29 2022-07-29 目标检测的卷积神经网络优化方法、装置及网络结构

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210908602.1A CN115240006B (zh) 2022-07-29 2022-07-29 目标检测的卷积神经网络优化方法、装置及网络结构

Publications (2)

Publication Number Publication Date
CN115240006A CN115240006A (zh) 2022-10-25
CN115240006B true CN115240006B (zh) 2023-09-19

Family

ID=83676709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210908602.1A Active CN115240006B (zh) 2022-07-29 2022-07-29 目标检测的卷积神经网络优化方法、装置及网络结构

Country Status (1)

Country Link
CN (1) CN115240006B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794515A (zh) * 2010-03-29 2010-08-04 河海大学 基于协方差和二叉树支持向量机的目标检测系统及方法
CN110766063A (zh) * 2019-10-17 2020-02-07 南京信息工程大学 基于压缩激励和紧密连接卷积神经网络的图像分类方法
CN111178507A (zh) * 2019-12-26 2020-05-19 集奥聚合(北京)人工智能科技有限公司 图谱卷积神经网络数据处理方法及装置
CN111612143A (zh) * 2020-05-22 2020-09-01 中国科学院自动化研究所 深度卷积神经网络的压缩方法及系统
CN112437930A (zh) * 2018-07-12 2021-03-02 华为技术有限公司 以熟练的推理速度和功耗,生成神经网络的压缩表示
CN112580639A (zh) * 2021-03-01 2021-03-30 四川大学 一种基于进化神经网络模型压缩的早期胃癌图像识别方法
CN112836817A (zh) * 2019-11-22 2021-05-25 中国科学技术大学 一种卷积神经网络模型的压缩方法
CN114037871A (zh) * 2021-11-09 2022-02-11 浙江大学 一种基于神经支持决策树的图像分类可解释方法
CN114120019A (zh) * 2021-11-08 2022-03-01 贵州大学 一种轻量化的目标检测方法
CN114332040A (zh) * 2021-12-30 2022-04-12 华中科技大学协和深圳医院 一种基于多模态的甲状腺肿瘤图像分类方法及终端设备
CN114611673A (zh) * 2022-03-17 2022-06-10 中山大学 神经网络压缩方法、装置、设备及可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11265540B2 (en) * 2018-02-23 2022-03-01 Sk Telecom Co., Ltd. Apparatus and method for applying artificial neural network to image encoding or decoding
US11676371B2 (en) * 2018-08-17 2023-06-13 Fotonation Limited Apparatus for processing a neural network
FR3087033B1 (fr) * 2018-10-03 2021-07-23 Idemia Identity & Security France Procedes d'apprentissage de parametres d'un reseau de neurones a convolution et de detection d'elements d'interet visibles dans une image
CN117456297A (zh) * 2019-03-31 2024-01-26 华为技术有限公司 图像生成方法、神经网络的压缩方法及相关装置、设备
US11676278B2 (en) * 2019-09-26 2023-06-13 Intel Corporation Deep learning for dense semantic segmentation in video with automated interactivity and improved temporal coherence
US11586844B2 (en) * 2020-03-30 2023-02-21 Wipro Limited Method and system for detecting and tracking objects in a rotational environment

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794515A (zh) * 2010-03-29 2010-08-04 河海大学 基于协方差和二叉树支持向量机的目标检测系统及方法
CN112437930A (zh) * 2018-07-12 2021-03-02 华为技术有限公司 以熟练的推理速度和功耗,生成神经网络的压缩表示
CN110766063A (zh) * 2019-10-17 2020-02-07 南京信息工程大学 基于压缩激励和紧密连接卷积神经网络的图像分类方法
CN112836817A (zh) * 2019-11-22 2021-05-25 中国科学技术大学 一种卷积神经网络模型的压缩方法
CN111178507A (zh) * 2019-12-26 2020-05-19 集奥聚合(北京)人工智能科技有限公司 图谱卷积神经网络数据处理方法及装置
CN111612143A (zh) * 2020-05-22 2020-09-01 中国科学院自动化研究所 深度卷积神经网络的压缩方法及系统
CN112580639A (zh) * 2021-03-01 2021-03-30 四川大学 一种基于进化神经网络模型压缩的早期胃癌图像识别方法
CN114120019A (zh) * 2021-11-08 2022-03-01 贵州大学 一种轻量化的目标检测方法
CN114037871A (zh) * 2021-11-09 2022-02-11 浙江大学 一种基于神经支持决策树的图像分类可解释方法
CN114332040A (zh) * 2021-12-30 2022-04-12 华中科技大学协和深圳医院 一种基于多模态的甲状腺肿瘤图像分类方法及终端设备
CN114611673A (zh) * 2022-03-17 2022-06-10 中山大学 神经网络压缩方法、装置、设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Yu Miao.Corpus English word detection and image recognition algorithm based on improved convolutional neural network.《Microprocessors and Microsystems》.2021,第82卷第1-6页. *
保持特征的三角网格曲面去噪技术综述与展望;李智琦 等;《计算机辅助设计与图形学学报 》;第32卷(第1期);第1-15页 *

Also Published As

Publication number Publication date
CN115240006A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN110245655B (zh) 一种基于轻量级图像金字塔网络的单阶段物体检测方法
Ding et al. Where to prune: Using LSTM to guide data-dependent soft pruning
CN111275172B (zh) 一种基于搜索空间优化的前馈神经网络结构搜索方法
CN112036447B (zh) 零样本目标检测系统及可学习语义和固定语义融合方法
CN111862140A (zh) 一种基于协同模块级搜索的全景分割网络及方法
CN109951392B (zh) 一种基于深度学习的中大型网络智能路由选择方法
CN115051925A (zh) 一种基于迁移学习的时空序列预测方法
CN111723203A (zh) 一种基于终生学习的文本分类方法
CN115240006B (zh) 目标检测的卷积神经网络优化方法、装置及网络结构
CN108470251B (zh) 基于平均互信息的社区划分质量评价方法及系统
CN113221988A (zh) 一种基于注意力机制的轻量级网络的构建方法
CN113609904A (zh) 一种基于动态全局信息建模和孪生网络的单目标跟踪算法
Wang et al. Balanced one-stage object detection by enhancing the effect of positive samples
CN117173449A (zh) 基于多尺度detr的航空发动机叶片缺陷检测方法
CN113688946B (zh) 基于空间关联的多标签图像识别方法
CN115861664A (zh) 基于局部特征融合与自注意力机制的特征匹配方法及系统
Xiang et al. Optical flow estimation using spatial-channel combinational attention-based pyramid networks
CN115424012A (zh) 一种基于上下文信息的轻量图像语义分割方法
Liu et al. MTNAS: search multi-task networks for autonomous driving
Zhang et al. Vision transformer with convolutions architecture search
Kshirsagar et al. Rethinking Traffic Management with Congestion Pricing and Vehicular Routing for Sustainable and Clean Transport.
CN111709275B (zh) 一种用于Affordance推理的深度网络构建方法
ZiWen et al. Multi-objective Neural Architecture Search for Efficient and Fast Semantic Segmentation on Edge
CN113379035A (zh) 图神经网络结构优化搜索方法、系统及存储介质
CN112364720A (zh) 一种车辆类别快速识别与统计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant