CN112364720A - 一种车辆类别快速识别与统计方法 - Google Patents

一种车辆类别快速识别与统计方法 Download PDF

Info

Publication number
CN112364720A
CN112364720A CN202011147578.1A CN202011147578A CN112364720A CN 112364720 A CN112364720 A CN 112364720A CN 202011147578 A CN202011147578 A CN 202011147578A CN 112364720 A CN112364720 A CN 112364720A
Authority
CN
China
Prior art keywords
network
dense
yolo
module
yolov3
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011147578.1A
Other languages
English (en)
Inventor
赵巧芝
岳庆冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Cresun Innovation Technology Co Ltd
Original Assignee
Xian Cresun Innovation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Cresun Innovation Technology Co Ltd filed Critical Xian Cresun Innovation Technology Co Ltd
Priority to CN202011147578.1A priority Critical patent/CN112364720A/zh
Publication of CN112364720A publication Critical patent/CN112364720A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/08Detecting or categorising vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种车辆类别快速识别与统计方法,包括:依据预定时间间隔获取目标车辆图像;将目标车辆图像输入预先训练得到的改进型YOLOv3网络中,获得目标车辆图像的属性信息;属性信息至少包括类别;基于预定时间段内获得的多个类别,得到预定时间段内各类别车辆的数量;其中,改进型YOLOv3网络是基于YOLOv3网络的主干网络中,残差模块更换为密集连接模块后,并经过层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成的。本发明的方案在特征提取时,能够直接将早期的特征图作为后面每一层的输入,获得的特征图的信息量更多,在进行车辆属性信息的检测时能提高检测精度,同时对网络简化处理,能够快速准确实现车辆类别统计。

Description

一种车辆类别快速识别与统计方法
技术领域
本发明属于图像处理领域,具体涉及一种车辆类别快速识别与统计方法。
背景技术
目前,随着车辆多样化、行驶密集化,在一些场景下,针对路面行驶的车辆类别进行有效统计是非常必要的,比如,针对高速卡口等位置,往往需要统计单位时间段内各种类别车辆的出入状况。
近年来,随着神经网络的广泛运用,针对各种目标的图像检测算法得到了较为快速的发展,目标检测算法主要是通过对图像进行处理,检测出图像中目标的位置和类别。其中,YOLO(You Only Look Once)系列网络以其明显的速度优势,受到众多使用者的青睐。
那么,如何基于YOLO网络实现车辆图像的高精度快速识别,从而实现车辆类别统计,是一个具有实际意义的研究方向。
发明内容
为了基于YOLO网络实现车辆图像的高精度快速识别,从而实现车辆类别统计,本发明实施例提供了一种车辆类别快速识别与统计方法。
具体技术方案如下:
本发明实施例提供了一种车辆类别统计方法,包括:
依据预定时间间隔获取目标车辆图像;
将所述目标车辆图像输入预先训练得到的改进型YOLOv3网络中,获得所述目标车辆图像的属性信息;所述属性信息至少包括类别;
基于预定时间段内获得的多个类别,得到所述预定时间段内各类别车辆的数量;
其中,所述改进型YOLOv3网络是基于YOLOv3网络的主干网络中,残差模块更换为密集连接模块得到后,并经过层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成的;所述改进型YOLOv3网络是根据样本车辆图像,以及所述样本车辆图像对应的属性信息训练得到的。
可选的,所述改进型YOLOv3网络是基于YOLOv3网络的主干网络中,残差模块更换为密集连接模块后,并经过层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成的,包括:
将YOLOv3网络的主干网络中参差模块替换为密集连接模块,并增加过渡模块,得到Dense-YOLO-1网络;
将所述Dense-YOLO-1网络中的密集连接模块进行层剪枝,得到Dense-YOLO-11网络;
将所述Dense-YOLO-11网络进行稀疏化训练,得到了BN层缩放系数稀疏分布的Dense-YOLO-12网络;
将所述Dense-YOLO-12网络进行通道剪枝,删除不重要的通道,得到Dense-YOLO-13网络;
将所述Dense-YOLO-13网络进行知识蒸馏,得到所述改进型YOLOv3网络。
可选的,所述Dense-YOLO-1网络的主干网络包括多个间隔串接的密集连接模块和过渡模块;所述密集连接模块的数量至少为三个;所述密集连接模块包括串行连接的卷积网络模块和密集连接单元组;所述卷积网络模块包括串行连接的卷积层、BN层、Leaky relu层;所述密集连接单元组包括m个密集连接单元;每个密集连接单元包括多个采用密集连接形式连接的所述卷积网络模块,并采用级联方式融合多个卷积网络模块输出的特征图;其中,m为大于等于4的自然数。
可选的,所述过渡模块为所述卷积网络模块。
可选的,所述过渡模块包括所述卷积网络模块和最大池化层;所述卷积网络模块的输入和所述最大池化层的输入共用,所述卷积网络模块输出的特征图和所述最大池化层输出的特征图采用级联方式融合。
可选的,所述过渡模块包括的所述卷积网络模块的数量为两个或三个,且各个卷积网络模块之间采用串接方式。
可选的,所述将所述Dense-YOLO-1网络中的密集连接模块进行层剪枝,得到Dense-YOLO-11网络;包括:
将所述Dense-YOLO-1网络中的密集连接模块的密集连接单元的数量由m个剪枝为n个,得到所述Dense-YOLO-11网络;其中,m、n均为自然数,且n<m。
可选的,所述将所述Dense-YOLO-11网络进行稀疏化训练,得到了BN层缩放系数稀疏分布的Dense-YOLO-12网络;包括:
将所述Dense-YOLO-11网络进行稀疏化训练,训练过程中,为缩放因子γ添加稀疏正则化,稀疏训练的损失函数为:
Figure BDA0002740196860000031
其中,
Figure BDA0002740196860000032
表示网络原始的损失函数,(x,y)表示训练过程的输入数据和目标数据,W表示可训练的权重,
Figure BDA0002740196860000033
为比例系数添加的正则项,g(γ)是对比例系数进行稀疏训练的惩罚函数,λ为权重。
可选的,所述将所述Dense-YOLO-12网络进行通道剪枝,删除不重要的通道,得到Dense-YOLO-13网络,包括:
在所有层的所有通道中设定一个通道剪枝比例,然后将所述YOLOv3-2Dense-YOLO-12网络中所有的BN层缩放系数按照升序排列,按所述通道剪枝比例剪掉排在前面的BN层缩放系数对应的通道。
可选的,所述将所述Dense-YOLO-13网络进行知识蒸馏,得到所述改进型YOLOv3网络,包括:
对所述Dense-YOLO-13网络引入知识蒸馏,将所述Dense-YOLO-1网络作为老师网络,所述Dense-YOLO-13网络作为学生网络,由老师网络引导学生网络进行精度恢复和调整,得到所述改进型YOLOv3网络。
本发明实施例所提供的方案中,将YOLOv3网络的主干网络中的残差模块更换为密集连接模块后的网络,在进行特征提取时,利用密集连接模块,将特征融合方式从并行改为了串行,能够直接将早期的特征图作为后面每一层的输入,获得的特征图的信息量更多,强化了特征的传递,因此在进行车辆属性信息的检测时,能够提高检测精度。并且,通过复用浅层网络的特征图参数能够减少参数的数量以及运算量。因此,在此基础上,通过获取预定时间段内多张目标车辆图像对应的车辆类别,可以快速、简便、准确地实现车辆类别统计。此外,通过对将YOLOv3网络的主干网络中的残差模块更换为密集连接模块后的网络进行剪枝处理,再结合知识蒸馏引导网络恢复,网络体积大幅缩小,摒除了大部分的冗余计算,基于该网络的目标检测速度得到大幅度的提升,而且能够维持检测的精度。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种车辆类别统计方法的流程示意图;
图2为现有技术中的YOLOv3网络的结构示意图;
图3为本发明实施例所提供的改进型YOLOv3网络的结构示意图;
图4为本发明实施例所提供的过渡模块的结构示意图;
图5为本发明实施例所提供的改进型YOLOv3网络稀疏化训练参数组合的权重分布情况图;
图6为本发明实施例所提供的改变FPN特征融合方式后的改进型YOLOv3网络的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
为了基于YOLO网络实现车辆图像的高精度检测,从而实现车辆类别快速识别与统计,本发明实施例提供了一种车辆类别快速识别与统计方法。
需要说明的是,本发明实施例所提供的一种车辆类别统计方法的执行主体可以为一种车辆类别统计装置,该车辆类别统计装置可以运行于电子设备中。其中,该电子设备可以为一图像采集工具或图像处理工具中的插件,或者独立于一图像采集工具或图像处理工具之外的程序,当然并不局限于此。
如图1所示,本发明实施例所提供的一种车辆类别快速识别与统计方法,可以包括如下步骤:
S1,依据预定时间间隔获取目标车辆图像;
所述预定时间间隔可以根据需要设定,比如1分钟、30秒等。具体的,可以根据车辆行驶速度和密集程度进行适应性地调整。
所述目标车辆图像为图像采集设备拍摄的含有目标车辆的图像;所述图像采集设备可以包括照相机、摄像机、手机等等;所述目标车辆图像中至少含有一个目标车辆;所述图像采集设备可以部署在道路卡口、路灯杆等道路设施上。
示例性的,该步骤可以由道路卡口处的监控设备拍摄经过的车辆的图像,并由所述监控设备实施后续方案;也可以由所述监控设备将拍摄到的图像传输给另一图像处理设备,由所述图像处理设备实施后续方案,这都是合理的。
本发明实施例中,要求目标车辆图像的尺寸为416×416×3。
因此,在该步骤,一种实施方式中,可以直接获得416×416×3尺寸的目标车辆图像;另一种实施方式中,可以获得任意尺寸的图像,将获得的图像经过一定的尺寸缩放处理,得到416×416×3尺寸的目标车辆图像。
并且,在上述两种实施方式中,还可以对获取到的图像可以进行裁剪、拼接、平滑、滤波、边缘填充等图像增强操作,以增强图像中感兴趣的特征,扩展数据集的泛化能力。
S2,将所述目标车辆图像输入预先训练得到的改进型YOLOv3网络中,获得所述目标车辆图像的属性信息;所述属性信息至少包括类别;
所述属性信息除了类别外还可以包括目标车辆在所述目标车辆图像中的位置。具体的,所述属性信息的形式为一向量,包含预测框的位置、预测框内车辆的置信度、预测框内车辆的类别。预测框的位置用来表征目标车辆在所述目标车辆图像中的位置;具体的,每个预测框的位置用bx,by,bw,bh四个值表示,bx,by用于表示预测框的中心点位置,bw,bh为用于表示预测框的宽和高。
所述类别包括小汽车、单层公交车、双层公交车、大卡车、面包车、自行车和摩托车等。
其中,所述改进型YOLOv3网络是基于YOLOv3网络的主干网络中,残差模块更换为密集连接模块得到后,并经过层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成的;所述改进型YOLOv3网络是根据样本车辆图像,以及所述样本车辆图像对应的属性信息训练得到的。具体训练过程在后文中予以介绍。
为了便于理解本发明实施例所提出的改进型YOLOv3网络的网络结构,首先,对现有技术中的YOLOv3网络的网络结构进行介绍,请参见图2,图2为现有技术中的YOLOv3网络的结构示意图。在图2中,虚线框内的部分为YOLOv3网络。其中点划线框内的部分为YOLOv3网络的主干(backbone)网络,即darknet-53网络;其余部分为FPN(FeaturePyramidNetworks,特征金字塔网络)网络,FPN网络又分为三个预测支路Y1~Y3,预测支路Y1~Y3的尺度分别与沿输入逆向的3个残差模块res4、res8、res8分别输出对应的特征图的尺度一一对应。各预测支路的预测结果分别以Y1、Y 2、Y3表示,Y1、Y 2、Y3的尺度依次增大。
YOLOv3网络的主干网络由CBL模块和多个resn模块串接构成。CBL模块为卷积网络模块,包括串行连接的conv层(Convolutional layer,卷积层,简称conv层)、BN(BatchNormalization,批量归一化)层和激活函数Leaky relu对应的Leaky relu层,CBL即表示conv+BN+Leaky relu。resn模块为残差模块,n代表自然数,有res1、res2,…,res8等等,resn模块包括串行连接的zero padding(零填充)层、CBL模块和残差单元组,残差单元组用Res unit*n表示,含义是包括n个残差单元Res unit,每个残差单元包括采用残差网络(Residual Network,简称为ResNets)连接形式连接的多个CBL模块,特征融合方式采用并行方式,即add方式。
FPN网络的各个预测支路中均包括卷积网络模块组,具体包括5个卷积网络模块,即图2中的CBL*5。另外,US(up sampling,上采样)模块为上采样模块;concat表示特征融合采用级联方式,concat为concatenate的简称。
YOLOv3网络中各个主要模块的具体构成请参见图2中虚线框下的示意图。
本发明实施例所提供的改进型YOLOv3网络相比于YOLOv3网络的主要改进思想在于两方面:
一是借鉴密集卷积网络DenseNet的连接方式,提出一种具体的密集连接模块,用来替换YOLOv3网络的主干网络中的残差模块(resn模块),称之为密集连接的YOLOv3网络(Dense-YOLO-1)。已知的是,ResNets在将特征传递到图层之前通过求和来组合特征,即采用并行方式进行特征融合。而密集连接方式为了确保信息以最大程度在网络中各层之间流动,将所有层(具有匹配的特征图大小)彼此直接连接。具体的,针对每个层,它之前层的所有特征图被用作它的输入,它本身的特征图被用作它所有后续层的输入,也就是特征融合采用级联方式(也称为串联方式)。因此,相比于YOLOv3网络使用残差模块,所述密集连接的YOLOv3网络通过改用密集连接模块,获得的特征图的信息量更多,在进行车辆检测时,能够增强特征传播,提高检测精度。同时,因为它不需要重新学习冗余的特征图,可以大大减小参数数量,减少计算量,还可以减轻梯度消失问题。
二是在密集连接的YOLOv3网络的基础上,为了提高检测的速度,对网络进行瘦身处理。由于密集连接的YOLOv3网络相对于原始网络体积有所增大,通过对密集连接的YOLOv3网络进行层剪枝和通道剪枝处理,可以使网络体积大大缩小,极大提高检测的速度;同时结合知识蒸馏处理,仍能够保持较高的检测精度。
S3,基于预定时间段内获得的多个类别,得到所述预定时间段内各类别车辆的数量。
本发明实施例中,可以利用计数方式,比如预先设置各个车辆类别对应的计数器,将各计数器的初始值设为0。当每识别出一种车辆的类别,将对应计数器的数值加1;那么,通过查看预定时间段内各个计数器的累计值则可以得到所述预定时间段内各类别车辆的数量。
当然,对预定时间段内获得的多个类别进行统计的方式不限于上述方式。
可选的,如果所述属性信息包括车辆的位置,可以利用车辆的位置辅助确定车辆的类别,比如利用预测框大小与不同车辆类别的车身大小的预定关系,对车辆的类别进行辅助判断,有助于提高车辆类别统计的准确性。
本发明实施例所提供的方案中,将YOLOv3网络的主干网络中的残差模块更换为密集连接模块,使得所述改进型YOLOv3网络的主干网络在进行特征提取时,利用密集连接模块,将特征融合方式从并行改为了串行,能够直接将早期的特征图作为后面每一层的输入,获得的特征图的信息量更多,强化了特征的传递,因此在进行车辆属性信息检测时,能够提高检测精度。并且,通过复用浅层网络的特征图参数能够减少参数的数量以及运算量。因此,在此基础上,通过获取预定时间段内多张目标车辆图像对应的车辆类别,可以快速、简便、准确地实现车辆类别统计。
可选的,所述密集连接的YOLOv3网络的结构请参见图3,图3为本发明实施例所提供的密集连接的YOLOv3网络的结构示意图;如图3所示,虚线框内的部分为密集连接的YOLOv3网络。其中点划线框内的部分为密集连接的YOLOv3网络的主干网络。
所述密集连接的YOLOv3网络的主干网络包括多个间隔串接的密集连接模块和过渡模块;密集连接模块表示为denm。
因为至少存在三条预测支路,因此,所述密集连接模块的数量至少为三个,以便将自身输出的特征图对应融合进各个预测支路。在图3中,作为示例,所述密集连接模块的数量为5个,相比于3个密集连接模块,5个密集连接模块所构成的改进型YOLOv3网络的精度更高。
所述密集连接模块包括串行连接的卷积网络模块(如前所述,表示为CBL模块)和密集连接单元组;其中,密集连接单元组表示为den unit*m,其含义是,所述密集连接单元组包括m个密集连接单元,m为大于等于4的自然数;
每个密集连接单元表示为den unit;其包括多个采用密集连接形式连接的所述卷积网络模块,并采用级联方式融合多个卷积网络模块输出的特征图;级联方式即concat,含义为张量拼接,该操作和残差模块中的add的操作是不一样的,concat会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。因此,上述改进型YOLOv3网络的主干网络在进行特征提取时,利用密集连接模块,将特征融合方式从并行改为了串行,能够直接将早期的特征图作为后面每一层的输入,强化特征的传递,并通过复用浅层网络的特征图参数来减少参数的数量以及运算量。
对于一般的密集卷积网络DenseNet结构,会包含密集连接之间的过渡层,用来对密集连接的特征图进行调整。因此,在本发明实施例中,对于加入的密集连接模块之间也可以设置过渡模块。
可选的第一种实施方式中,所述过渡模块为所述卷积网络模块。也就是使用CBL模块作为过渡模块。那么,在搭建改进型YOLOv3网络的主干网络时,仅需要将残差模块更换为密集连接模块,再将密集连接模块和原有的CBL模块进行串联即可得到。这样,网络搭建过程会较为快速,所得到的网络结构较为简单。但这样的过渡模块仅使用卷积层进行过渡,即直接通过增加步长来对特征图进行降维,这样做只能照顾到局部区域特征,而不能结合整张图的信息,因此会使得特征图中的信息丢失较多。
可选的第二种实施方式中,所述过渡模块包括所述卷积网络模块和最大池化层;所述卷积网络模块的输入和所述最大池化层的输入共用,所述卷积网络模块输出的特征图和所述最大池化层输出的特征图采用级联方式融合。该种实施方式中过渡模块的结构请参见图4,图4为本发明实施例所提供的过渡模块的结构示意图。该种实施方式中,用tran模块表示该种过渡模块,MP层为最大池化层(Maxpool,缩写MP,含义为最大池化)。进一步的,MP层的步长可以选择为2。在该种实施方式中,引入的MP层可以以较大的感受野对特征图进行降维;使用的参数比较少,因此不会过多地增加计算量,可以减弱过拟合的可能,提高网络模型的泛化能力;并且结合原有的CBL模块,可以看做从不同的感受野对特征图进行降维,因此可以保留更多信息。
针对上述第二种实施方式,可选的,所述过渡模块包括的所述卷积网络模块的数量为两个或三个,且各个卷积网络模块之间采用串接方式。相比于使用一个卷积网络模块,采用串接的两个或三个卷积网络模块,能够增加模型的复杂度,充分提取特征。
原有的YOLOv3网络中含有较多的卷积层,原因在于其针对的目标的类别较多,有80种。而在本发明实施例中,车辆的类别数较少,那么,大量的卷积层是没有必要的,这样会浪费网络资源,降低处理速度。
因此,可选的,所述密集连接的YOLOv3网络中针对密集连接模块的m取值可以为4,这样,相比原有YOLOv3网络中主干网络的多个残差模块含有的卷积层数量,所述改进型YOLOv3网络中,通过将密集连接模块中含有的密集连接单元数量设置为4,可以在不影响网络精度的情况下,针对本发明实施例的车辆图像,减少主干网络中卷积层的数量。
可选的,所述密集连接的YOLOv3网络还可以针对FPN网络中每个预测支路的卷积网络模块组中的k的数值进行调整,将k从原有YOLOv3网络中的5减少为4或3,也就是将原有的CBL*5改为CBL*4或者CBL*3;这样也可以减少FPN网络中卷积层的数量,在不影响网络精度的情况下,针对本发明实施例的车辆图像,整体实现网络层数精简,提升网络处理速度。
当然,优选的一种实施方式是上述两种减少卷积层数量的方案同时使用。
在上述密集连接的YOLOv3网络的基础上,在对网络进行层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成,包括:
S21、将YOLOv3网络的主干网络中参差模块替换为密集连接模块,并增加过渡模块,得到Dense-YOLO-1网络。
将YOLOv3网络的主干网络中参差模块替换为密集连接模块,并增加过渡模块的具体方法在前面密集连接的YOLOv3网络中已详细描述,在此不再赘述。
S22、将所述Dense-YOLO-1网络中的密集连接模块进行层剪枝,得到Dense-YOLO-11网络。
示例性的,将所述Dense-YOLO-1网络中的密集连接模块的密集连接单元的数量由m个剪枝为n个,得到所述Dense-YOLO-11网络;其中,m、n均为自然数,且n<m。
作为优选的方案,Dense-YOLO-1网络中的密集连接模块的密集连接单元层剪枝数量n=1/2m;比如,Dense-YOLO-1网络中密集连接单元有限为4个一组,经层剪枝为2个一组;可以简化网络结构,同时能够将网络的参数量和运算量减小接近一半。
需要说明的是,最初的实验设计,并不包含对网络层的剪枝过程,原计划直接进行通道剪枝。但是,根据通道剪枝的结果分析,发现有超过半数的密集连接层的权重都很接近于0,因此按照通道剪枝的规则,整层的通道都将被剪去。这就表明,在前面设计的4个密集连接单元一组的密集连接模块中,存在有冗余的单元,因此在通道剪枝前,可以进行层剪枝来大幅降低冗余,而后再做相对更细粒度的通道剪枝。这也说明,对密集连接的YOLOv3网络在通道剪枝前进行层剪枝是非常有必要的。
S23、将所述Dense-YOLO-11网络进行稀疏化训练,得到了BN层缩放系数稀疏分布的Dense-YOLO-12网络。
示例性的,将Dense-YOLO-11网络进行稀疏化训练,为密集连接的YOLOv3-1网络的每个通道引入一个比例系数γ,使得每一个通道的输出大小可以由这个比例系数控制。为了让大部分比例系数γ都接近于0,需要在训练过程中,为γ添加稀疏正则化。稀疏训练的损失函数为:
Figure BDA0002740196860000141
其中,
Figure BDA0002740196860000142
表示网络原始的损失函数,(x,y)表示训练过程的输入数据和目标数据,W表示可训练的权重,
Figure BDA0002740196860000143
为比例系数添加的正则项,g(γ)是对比例系数进行稀疏训练的惩罚函数,λ为权重。由于要使得比例系数γ具有稀疏性,惩罚函数选择L1范数。同时,由于不知道后一项所占比重,引入λ参数进行调整。
由于λ的取值与稀疏训练的收敛速度相关,本发明实施例的应用场景车辆类别识别,待识别的类别相对来说并不复杂,所以λ的取值可以选取较大的λ值,稀疏训练的收敛速度也不会很慢,同时也可以通过提高模型学习率的方法来进一步加快收敛;但是考虑到参数选取过大又会对网络模型的精度造成一定的损失,最后确定将学习率为0.25×,λ为1×的组合作为稀疏化训练的优选参数组合。
请参加图5,图5是本发明实施例提供的改进型YOLOv3网络的稀疏化训练参数组合的权重分布情况图,其中图5(a)是权重偏移图,图5(b)是权重交叠图。如图5所示,本发明实施例优选的较小的学习率与较大的权重的组合对于系数训练过后的权重的分布更有利,且网络模型的精度也较高。
S24、将所述Dense-YOLO-12网络进行通道剪枝,删除不重要的通道,得到Dense-YOLO-13网络。
在稀疏化训练之后,得到了一个BN层缩放系数稀疏分布的网络模型,这就便于确定哪些通道的重要性更小。由此,可以剪去这些不太重要的通道,剪枝的方法是删除传入和传出连接以及相应的权重。
对网络进行通道剪枝操作,修剪一个通道基本上对应于删除该通道的所有传入和传出连接,可以直接获得一个轻量化的网络,而不需要使用任何特殊的稀疏计算包。通道剪枝过程中,缩放因子充当频道选择的代理;由于它们与网络权重共同优化,因此网络可以自动识别无关紧要的通道,这些通道可以安全地移除而不会极大地影响泛化性能。
具体的,针对Dense-YOLO-12网络,在所有层的所有通道中设定一个通道剪枝比例,然后将密集连接的YOLOv3-2网络中所有的BN层缩放系数按照升序排列,按通道剪枝比例剪掉排在前面的BN层缩放系数对应的通道。通过通道剪枝,可以删去冗余的通道,减少计算量,加快目标检测的速度。
但是在通道剪枝后,可能会由于参数减少而带来一些精度的下降,从不同的剪枝比例对网络精度的影响进行分析,如果网络剪枝比例过大,网络体积压缩更多,但也会造成网络精度的剧烈下降,由此需要进行一个网络压缩比例与压缩后网络精度的权衡。
作为一种优选方式,对Dense-YOLO-12网络的通道剪枝比例为55%。通道剪枝之所以选择55%是因为:
对不同通道剪枝比例压缩后的模型的及精度进行仿真,得到AP和mAP图像。由于待检测图像中数量较少的种类在网络压缩过程中受到影响比较大,这就会直接影响mAP,因此,要从数据集和网络压缩比例方面来考虑。对数据集的处理,本发明的实施例选择合并数量较少的种类来使得不同种类的数量达到均衡,或者是直接采用种类分布更加均衡的数据集。另外就是控制压缩比例,保证数量较少的种类的预测精度不会下降太多。根据mAP仿真结果来看,50%-60%的压缩比例是精度变化的转折点,因此可以初步选择55%的压缩比例。
除了从精度来分析压缩的影响外,还要考虑目标检测时间和模型压缩比例的关系,通过对不同剪枝比例处理的网络模型不同平台上(在Tesla V100服务器和Jetson TX2边缘设备)的运行时间进行仿真,根据仿真结果可以发现,不同网络压缩比例对于网络推测的时间影响很微弱,而对于NMS(非极大值抑制)所需时间影响较大,在压缩比例达到55%之前,检测速度随着网络压缩而加快,但是压缩比例超过55%后,检测速度反而出现了减慢。由此,最终选定通道剪枝比例为55%。
S25、将所述Dense-YOLO-13网络进行知识蒸馏,得到所述改进型YOLOv3网络。
经过剪枝,获得了一个更为紧凑的Dense-YOLO-13网络,然后需要进行微调使得精度恢复。这里引入了知识蒸馏的策略。
具体的,对密集连接的YOLOv3-3网络引入知识蒸馏,将所述Dense-YOLO-1网络作为老师网络,所述Dense-YOLO-13网络作为学生网络,由老师网络引导学生网络进行精度恢复和调整,得到所述改进型YOLOv3网络。
作为一种优选的实施方式,将改进型YOLOv3网络经过FPN特征融合之后的输出结果除以温度系数,来使得教师网络最终输出的预测值软化,而后学生网络利用软化后的预测值作为标签来辅助训练Dense-YOLO-13网络,最终实现密Dense-YOLO-13网络的精度与和Dense-YOLO-1网络相当;其中,温度系数是预先设定的值,不随网络训练发生变化。
引入温度参数T的原因是,一个完成训练、精度很高的网络对于输入数据的分类结果,和真实的标签是基本一致的。以三分类为例,真实已知的训练类别标签是[1,0,0],预测结果可能会是[0.95,0.02,0.03],和真实的标签值是非常逼近的。因此,对于学生网络来讲,使用教师网络的分类结果辅助训练和直接利用数据进行训练,差别不大。温度参数T可以用来控制预测标签的软化程度,即可以增加教师网络分类结果的偏差。
将添加了知识蒸馏策略的微调过程和一般的微调过程进行对比,经过知识蒸馏调整恢复的网络精度比Dense-YOLO-1网络更高。
需要说明的是,改进型YOLOv3网络与图3所示的密集连接的YOLOv3网络相比,从结构图上来看,区别仅在于主干网络的组成密集连接模块的密集连接单元经过层剪枝处理后,其数量少于图3中所示的den unit*m的数量,因此,对改进型YOLOv3网络的结构说明,以及结合改进型YOLOv3网络的车辆识别与分类统计方法的说明均以图3所示的密集连接的YOLOv3网络为示例,不再另作图说明。
在本发明实施例中,所述改进型YOLOv3网络在主干网络之后还包括:依次串接的FPN网络、分类网络和非极大值抑制模块。
可选的,所述分类网络包括SoftMax分类器,目的是实现多个车辆类别互斥的分类。当然也可以沿用YOLOv3网络的logistic回归进行分类,以实现多个独立的二分类。
非极大值抑制模块用于进行NMS(non_max_suppression,非极大值抑制)处理。用于在重复框选同一目标的多个预测框中,排除置信度相对较小的预测框。
关于分类网络和非极大值抑制模块的内容,可以参见现有技术相关说明,在此不再赘述。
可选的,所述FPN网络对主干网络输出的多个尺度的特征图采用自顶向下、密集连接的方式进行融合。
一种可选的实施方式为,对加入密集连接模块之后的网络采用上述FPN特征融合方式。所得到的具体网络结构请参见图6,图6为本发明实施例所提供的改变FPN特征融合方式后的另一种改进型YOLOv3网络的结构示意图。
在该种实施方式中,首先对原有的FPN网络进行了改进,改变其网络连接形式以改变特征融合方式得到改进型FPN网络,主旨是特征融合结合横向方式与自顶向下密集连接方式,在这种方式中,自顶向下的方式变成了尺度较小的预测支路的特征图直接向每一个尺度较大的预测支路传递自身的特征。
可以理解的是,图6的主干网络中,沿输入逆向的3个密集连接模块各自输出一个特征图,这3个特征图的尺度依次增大,且分别和预测支路Y1~Y3对应。
在该种实施方式中,采用自顶向下、密集连接的方式将主干网络输出的3个不同尺度的特征图进行特征融合,具体的:
针对预测支路Yi,从所述3个特征图中,获取对应尺度的特征图并进行卷积处理,将卷积处理后的特征图,与预测支路Yi-1~Y1分别经上采样处理后的特征图进行级联融合;其中,预测支路Yi-j的上采样倍数为2j;i=2、3;j为小于i的自然数。
以i=3也就是预测支路Y3为例说明,其进行级联融合处理的特征图来源于三方面:第一方面,是从3个特征图中,获取对应尺度的特征图并进行卷积处理,也就是沿输入逆向的第三个密集连接模块输出的特征图经CBL模块后的特征图,该特征图也可以理解为经过1倍上采样,尺寸是52×52×255;第二方面来源于预测支路Y2(即Yi-1=Y2),即沿输入逆向的第二个密集连接模块输出的特征图(尺寸是26×26×255)经过预测支路Y2的CBL模块再经21=2倍上采样处理后的特征图(尺寸是52×52×255);第三方面来源于预测支路Y1(即Yi-2=Y1),即沿输入逆向的第一个密集连接模块输出的特征图(尺寸是13×13×255)经预测支路Y1的CBL模块后再经22=4倍上采样处理后的特征图(尺寸是52×52×255);那么,本领域技术人员可以理解的是,上述过程将主干网络输出的3个不同尺度的特征图经过不同倍数的上采样处理后,可以使得待级联融合的3个特征图的尺寸一致,均为52×52×255。这样,预测支路Y3可以在级联融合之后,继续进行卷积等处理,得到预测结果Y3,Y3尺寸为52×52×255。
关于预测支路Y2的特征融合过程,请参见预测支路Y3,在此不再赘述。而针对预测支路Y1,其获取沿输入逆向的第一个密集连接模块输出的特征图后自行进行后续的预测过程,并不接受其余预测支路的特征图与之融合。
原先的YOLOv3网路的特征融合方式中,使用的是先将深层和较浅层网络特征相加,再一起进行上采样的方法,这种方法在将特征相加后,要通过卷积层提取特征图,这样的操作会破坏一些原始的特征信息。而在本实施方式中,将特征融合方式变为了密集的融合方法,即深层特征直接进行不同倍数的上采样,以此来使得传递的所有特征图具有相同的尺寸。将这些特征图和浅层的特征图通过串联的方式融合起来,对融合的结果再次提取特征来消除里面的噪声,保留主要信息,然后进行预测,这样可以利用到更多的原始信息,在浅层网络中也有高维语义信息的参与。因此,这样可以发挥密集连接网络保留更多特征图原始语义特征的优势,只不过对于自顶向下的方法来讲,保留的原始语义是更加高维的语义信息,这样可以对于物体的分类有帮助。通过直接接收更浅层网络的特征,可以得到更加具体的特征,这样将有效地减少特征的损失,并且可以减少需要运算的参数量,加速预测过程。
以上,主要针对特征融合方式进行介绍,各预测支路在特征融合之后主要是利用一些卷积操作进行预测,关于如何获取各自的预测结果请参见相关的现有技术,在此不进行说明。
另一种可选的实施方式为,对加入密集连接模块,并改进过渡模块之后的网络采用上述FPN特征融合方式。具体网络结构请参见图6的网络结构和图4的过渡模块结构,在此不再赘述。
以下,对所述改进型YOLOv3网络的训练过程予以简单介绍。本领域技术人员可以理解的是,在进行网络训练之前,需要搭建如图3所示的网络结构,或者搭建图3基础上改进过渡模块后的网络结构,搭建后的网络结构再进行层剪枝、稀疏化训练、通道剪枝和知识蒸馏处理,得到所述改进型YOLOv3网络。改进型YOLOv3网络的网络训练过程可以分为以下步骤:
步骤1,获得若干样本车辆图像,以及所述样本车辆图像对应的属性信息;
在该过程中,各样本车辆图像的属性信息是已知的,确定各样本车辆图像的属性信息的方式可以是:通过人工识别,或者通过其他图像识别工具识别等等。之后,需要对样本车辆图像进行标记,可以采用人工标记方式,当然也可以利用其余人工智能方法进行非人工标记。
并且由于网络训练需要使用VOC格式或者COCO格式的数据,并将标记数据存储在文本文档当中。所以需要用Python脚本进行数据集标注格式的转换。
步骤2,利用各样本车辆图像,以及各样本车辆图像对应的属性信息,训练搭建好的网络,得到训练完成的改进型YOLOv3网络。具体的:
1)将每一样本车辆图像对应的属性信息作为该样本车辆图像对应的真值,将各样本车辆图像和对应的真值,通过搭建好的网络进行训练,获得各样本车辆图像的训练结果。
2)将每一样本车辆图像的训练结果与该样本车辆图像对应的真值进行比较,得到该样本车辆图像对应的输出结果。
3)根据各个样本车辆图像对应的输出结果,计算网络的损失值。
4)根据所述损失值,调整网络的参数,并重新进行1)-3)步骤,直至网络的损失值达到了一定的收敛条件,也就是所述损失值达到最小,这时,意味着每一样本车辆图像的训练结果与该样本车辆图像对应的真值一致,从而完成网络的训练,获得训练完成的改进型YOLOv3网络。
以下以具体的实验说明本发明实施例所提供的改进型YOLOv3网络针对车辆检测方面的效果。
原始的YOLOv3网络结构是针对MSCOCO数据集当中的80种物体进行检测和定位的。在本发明实施例中,由于车辆类别的数量远远小于YOLOv3网络的类别数,因此,完全可以降低网络的复杂度和体积同时保持原有的精度。
具体的,搭建如图3所示的网络结构,采用图4所示的tran模块作为过渡模块,同时对得到的网络结构进行层剪枝、稀疏化训练、通道剪枝和知识蒸馏处理,得到的网络命名为改进型YOLOv3-1网络。改进型YOLOv3-1网络使用密集连接模块替换原有的残差模块,同时减少了卷积层的数量,也改进了过渡模块的结构,此外还进行了网络结构简化处理。
获取已标记的若干样本车辆图像完成对改进型YOLOv3-1网络的训练,在训练完成后,对改进型YOLOv3-1网络进行精度、速度、体积等参数的测试,根据性能,分析网络改进的效果。
为了更直观地观察网络精度,选择模型的MAP(Mean Average Precision,平均精度均值)作为评估对象。MAP的值位于0和1之间,MAP值越大,说明模型精度越好。当然,同时也需要参考模型的损失loss曲线,观察模型的收敛情况。其中损失函数的构造仍然按照YOLOv3网络的损失函数。网络的体积和检测的速度也是需要考虑的,所以要记录不同网络的模型文件大小,以及不同模型分别在服务器Tesla V100和边缘设备Jetson TX2平台上运行的时间。
之后,利用训练好的Dense-YOLO-1网络对目标车辆图像进行检测,针对每个目标车辆图像,得到该目标车辆图像的属性信息,比如输出格式为一向量(bx,by,bw,bh,score,one-hot向量),包含预测框的位置bx,by,bw,bh、预测框内物体的置信度score、预测框内物体的类别one-hot向量。其中,假设针对前述所列的类别包括小汽车、单层公交车、双层公交车、大卡车、面包车、自行车和摩托车7个类别,那么,one-hot向量即含有7个数值,若为第一类小汽车,则该one-hot向量为(1,0,0,0,0,0,0)。
对基于改进型YOLOv3-1网络与基于原始YOLOv3网络、Dense-YOLO-1网络的车辆类别识别过程的检测性能进行对比,结果如表1所示。
表1基于Dense-YOLO-1、改进型YOLOv3-1与原YOLOv3的检测性能对比
Figure BDA0002740196860000231
从表1可以看出,在原始YOLOv3网络基础上,将YOLOv3网络的主干网络中的残差模块更换为密集连接模块得到的Dense-YOLO-1网络的体积减小为原来的44%,在边缘设备上的检测速度提高了3%,检测精度提高12%;再对Dense-YOLO-1网络进一步进行结构简化后得到的改进型YOLOv3-1网络相对于原始YOLOv3网络体积减小为原来的78%,在边缘设备上的检测速度提高了14%,检测精度提高6%。
本发明实施例所提供的方案中,将YOLOv3网络的主干网络中的残差模块更换为密集连接模块,使得所述改进型YOLOv3网络的主干网络在进行特征提取时,利用密集连接模块,将特征融合方式从并行改为了串行,能够直接将早期的特征图作为后面每一层的输入,获得的特征图的信息量更多,强化了特征的传递,实现了特征图的端到端传递,减小了传递过程中的信息损失。因此在进行车辆检测时,能够提高检测精度。并且,通过复用浅层网络的特征图参数能够减少参数的数量以及运算量。同时改变过渡模块的结构,能够更好保留主要特征,同时使用的参数比较少,不会过多地增加计算量,同时能够防止过拟合,提高网络模型的泛化能力。
经过实验证实改进型YOLOv3-1网络相对于原始YOLOv3网络,MAP值有明显的提升,且loss值有所下降,且模型大小和运行时间具有下降。因此,针对于本发明实施例的车辆类别较少的检测场景,本发明实施例所提出的改进型YOLOv3-1网络具有良好的性能和广泛的应用前景,可以部署在资源受限的边缘平台。
当然,在本发明实施例中,进一步的,在Dense-YOLO-1网络的基础上,还可以如前文所述,改变FPN网络的特征融合方式,将得到的网络结构命名为Dense-YOLO-2,之后再对Dense-YOLO-2进行如前文所述的剪枝处理等网络结构简化过程,将最后的网络结构命名为改进型YOLOv3-2网络。具体网络结构可以结合图6和图4进行理解。
Dense-YOLO-2改变了融合方式,添加了自顶向下的密集连接特征融合方法的多尺度特征融合网络当中,多尺度的优势体现的更为明显,这可能是因为由于密集连接的特征融合方法当中,保留了比横向连接更多的高维度抽象语义信息,让模型对于物体的判别更加清晰。融合方式的改进对于网络精度的提升十分明显。
对基于改进型YOLOv3-2网络的检测性能与其它网络进行对比,结果如表2所示。
表2基于改进型YOLOv3-2网络与其它网络的检测性能对比
Figure BDA0002740196860000241
从表2可以看出,在Dense-YOLO-1网络基础上,将FPN的特征融合方式又横向连接改进为密集连接后得到的Dense-YOLO-2网络,与原始YOLOv3网络相比,其检测精度提高16%,但体积增加较多,同时检测速度也有所下降,所以再对Dense-YOLO-2网络进行结构简化处理,最后得到的改进型YOLOv3-2网络与原始YOLOv3网络相比,体积减小75%,在边缘设备上的检测速度提高了9%,检测精度提高9%。也可以说明,改进型YOLOv3-2网络与改进型改进型YOLOv3-1网络相比,在改变特征融合方式之后,精度有所提高。
本发明实施例的方案,利用改进的网络对车辆识别与统计,由于检测精度和检测速度都有明显提高,因此识别与统计的效率和准确率也会随之提高。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种车辆类别快速识别与统计方法,其特征在于,包括:
依据预定时间间隔获取目标车辆图像;
将所述目标车辆图像输入预先训练得到的改进型YOLOv3网络中,获得所述目标车辆图像的属性信息;所述属性信息至少包括类别;
基于预定时间段内获得的多个类别,得到所述预定时间段内各类别车辆的数量;
其中,所述改进型YOLOv3网络是基于YOLOv3网络的主干网络中,残差模块更换为密集连接模块后,并经过层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成的;所述改进型YOLOv3网络是根据样本车辆图像,以及所述样本车辆图像对应的属性信息训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述改进型YOLOv3网络是基于YOLOv3网络的主干网络中,残差模块更换为密集连接模块后,并经过层级和通道级剪枝,再结合知识蒸馏引导网络恢复后形成的,包括:
将YOLOv3网络的主干网络中参差模块替换为密集连接模块,并增加过渡模块,得到Dense-YOLO-1网络;
将所述Dense-YOLO-1网络中的密集连接模块进行层剪枝,得到Dense-YOLO-11网络;
将所述Dense-YOLO-11网络进行稀疏化训练,得到了BN层缩放系数稀疏分布的Dense-YOLO-12网络;
将所述Dense-YOLO-12网络进行通道剪枝,删除不重要的通道,得到Dense-YOLO-13网络;
将所述Dense-YOLO-13网络进行知识蒸馏,得到所述改进型YOLOv3网络。
3.根据权利要求2所述的方法,其特征在于,所述Dense-YOLO-1网络的主干网络包括多个间隔串接的密集连接模块和过渡模块;所述密集连接模块的数量至少为三个;所述密集连接模块包括串行连接的卷积网络模块和密集连接单元组;所述卷积网络模块包括串行连接的卷积层、BN层、Leaky relu层;所述密集连接单元组包括m个密集连接单元;每个密集连接单元包括多个采用密集连接形式连接的所述卷积网络模块,并采用级联方式融合多个卷积网络模块输出的特征图;其中,m为大于等于4的自然数。
4.根据权利要求3所述的方法,其特征在于,所述过渡模块为所述卷积网络模块。
5.根据权利要求3所述的方法,其特征在于,所述过渡模块包括所述卷积网络模块和最大池化层;所述卷积网络模块的输入和所述最大池化层的输入共用,所述卷积网络模块输出的特征图和所述最大池化层输出的特征图采用级联方式融合。
6.根据权利要求5所述的方法,其特征在于,所述过渡模块包括的所述卷积网络模块的数量为两个或三个,且各个卷积网络模块之间采用串接方式。
7.根据权利要求3所述的方法,其特征在于,所述将所述Dense-YOLO-1网络中的密集连接模块进行层剪枝,得到Dense-YOLO-11网络;包括:
将所述Dense-YOLO-1网络中的密集连接模块的密集连接单元的数量由m个剪枝为n个,得到所述Dense-YOLO-11网络;其中,m、n均为自然数,且n<m。
8.根据权利要求3所述的方法,其特征在于,所述将所述Dense-YOLO-11网络进行稀疏化训练,得到了BN层缩放系数稀疏分布的Dense-YOLO-12网络;包括:
将所述Dense-YOLO-11网络进行稀疏化训练,训练过程中,为缩放因子γ添加稀疏正则化,稀疏训练的损失函数为:
Figure FDA0002740196850000031
其中,
Figure FDA0002740196850000032
表示网络原始的损失函数,(x,y)表示训练过程的输入数据和目标数据,W表示可训练的权重,
Figure FDA0002740196850000033
为比例系数添加的正则项,g(γ)是对比例系数进行稀疏训练的惩罚函数,λ为权重。
9.根据权利要求3所述的方法,其特征在于,所述将所述Dense-YOLO-12网络进行通道剪枝,删除不重要的通道,得到Dense-YOLO-13网络,包括:
在所有层的所有通道中设定一个通道剪枝比例,然后将所述YOLOv3-2Dense-YOLO-12网络中所有的BN层缩放系数按照升序排列,按所述通道剪枝比例剪掉排在前面的BN层缩放系数对应的通道。
10.根据权利要求3所述的方法,其特征在于,所述将所述Dense-YOLO-13网络进行知识蒸馏,得到所述改进型YOLOv3网络,包括:
对所述Dense-YOLO-13网络引入知识蒸馏,将所述Dense-YOLO-1网络作为老师网络,所述Dense-YOLO-13网络作为学生网络,由老师网络引导学生网络进行精度恢复和调整,得到所述改进型YOLOv3网络。
CN202011147578.1A 2020-10-23 2020-10-23 一种车辆类别快速识别与统计方法 Withdrawn CN112364720A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011147578.1A CN112364720A (zh) 2020-10-23 2020-10-23 一种车辆类别快速识别与统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011147578.1A CN112364720A (zh) 2020-10-23 2020-10-23 一种车辆类别快速识别与统计方法

Publications (1)

Publication Number Publication Date
CN112364720A true CN112364720A (zh) 2021-02-12

Family

ID=74511936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011147578.1A Withdrawn CN112364720A (zh) 2020-10-23 2020-10-23 一种车辆类别快速识别与统计方法

Country Status (1)

Country Link
CN (1) CN112364720A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115115974A (zh) * 2022-06-08 2022-09-27 中国船舶集团有限公司系统工程研究院 基于神经网络的智能航行态势感知系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115115974A (zh) * 2022-06-08 2022-09-27 中国船舶集团有限公司系统工程研究院 基于神经网络的智能航行态势感知系统

Similar Documents

Publication Publication Date Title
WO2022083784A1 (zh) 一种基于车联网的道路检测方法
CN109543502A (zh) 一种基于深度多尺度神经网络的语义分割方法
CN112381763A (zh) 一种表面缺陷检测方法
CN112364719A (zh) 一种遥感图像目标快速检测方法
CN112381764A (zh) 一种农作物病虫害检测方法
CN112288700A (zh) 一种铁轨缺陷检测方法
CN112417973A (zh) 一种基于车联网的无人驾驶系统
CN111797814A (zh) 基于通道融合和分类器对抗的无监督跨域动作识别方法
CN113159067A (zh) 一种基于多粒度局部特征软关联聚合的细粒度图像辨识方法及装置
CN112183240A (zh) 一种基于3d时间流和并行空间流的双流卷积行为识别方法
CN111626357B (zh) 一种基于神经网络模型的图像识别方法
CN116704431A (zh) 水污染的在线监测系统及其方法
CN107967441B (zh) 一种基于双通道3d-2d rbm模型的视频行为识别方法
CN112380918A (zh) 一种道路车辆状态识别方法、装置、电子设备及存储介质
CN112084897A (zh) 一种gs-ssd的交通大场景车辆目标快速检测方法
CN112380919A (zh) 一种车辆类别统计方法
CN112364720A (zh) 一种车辆类别快速识别与统计方法
CN112364864A (zh) 一种车牌识别方法、装置、电子设备及存储介质
CN112308066A (zh) 一种车牌识别系统
CN114022727A (zh) 一种基于图像知识回顾的深度卷积神经网络自蒸馏方法
CN117710841A (zh) 一种无人机航拍图像的小目标检测方法、装置
CN112395952A (zh) 一种用于铁轨缺陷检测的无人机
CN112541469B (zh) 基于自适应分类的人群计数方法及系统
CN115761667A (zh) 一种基于改进fcos算法的无人车辆搭载摄像头目标检测方法
CN112529098B (zh) 密集多尺度目标检测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210212

WW01 Invention patent application withdrawn after publication