CN113971731A - 一种目标检测方法、装置及电子设备 - Google Patents
一种目标检测方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113971731A CN113971731A CN202111266083.5A CN202111266083A CN113971731A CN 113971731 A CN113971731 A CN 113971731A CN 202111266083 A CN202111266083 A CN 202111266083A CN 113971731 A CN113971731 A CN 113971731A
- Authority
- CN
- China
- Prior art keywords
- image data
- different scales
- network
- feature extraction
- outputting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000000605 extraction Methods 0.000 claims description 57
- 230000006870 function Effects 0.000 claims description 42
- 238000010586 diagram Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 20
- 238000012360 testing method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008447 perception Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000002146 bilateral effect Effects 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 3
- 239000000523 sample Substances 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000006855 networking Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种目标检测方法、装置及电子设备,该方法包括:获取目标的图像数据;将图像数据输入预建深度轻量网络,输出不同尺度的预测头;对预测头进行解码,得到目标的类别、定位框及类别置信度。该方案可以大幅度提高目标检测的精度和推理速度。
Description
技术领域
本发明属于计算机视觉和智能交通技术领域,特别涉及一种目标检测方法、装置及电子设备。
背景技术
当前,新一代信息通信及人工智能技术高速发展,汽车作为这些新技术应用的重要载体,正在加速向智能化和网联化转型,而智能网联汽车将成为新一轮产业转型升级的重要标志和依托。汽车不仅是一个传统的机械运载工具,实际上,它也是现代科学技术的载体。今天人们所说的智能网联汽车、移动机器人、移动信息化平台,包括电子线控制装置以及车联网,都是现代科技与汽车相结合的产物。在智能交通的发展过程中,环境感知作为获取实时道路交通信息的关键技术,关系到智能交通系统能否针对当前交通信息做出准确决策,对缓解交通拥堵、提高道路安全具有极大促进作用。
视觉传感器因其结构简单、易安装、成本低的优点被广泛用于智能交通领域中,国内外针对基于视觉的目标检测与跟踪技术已有许多研究,近几年由于人工智能技术的快速发展,基于深度学习的目标检测与跟踪技术已成为研究热点和主流方向,主要可以分为基于CNN和基于Transformer两条技术路线。基于Transformer的目标检测器精度高,但其结构复杂度大,计算成本高,硬件需求高,在算法应用落地过程中存在居多挑战,现阶段难以大规模用于工程应用中;基于CNN的目标检测器模型结构简单、移植性好,但其精度和推理速度仍然难以满足技术落地要求,目标检测器有待优化。
基于CNN的目标检测器可分为one-stage和two-stage两类,YOLO系列等算法作为表现出色的one-stage目标检测器之一被广泛用于自动驾驶、智慧农业、智慧安防等领域中,并取得良好的效果。但就算法大规模应用而言,现有目标检测算法的性能仍然难以满足实时性与精度要求,算法综合性能有待提高。
发明内容
本说明书实施例的目的是提供一种目标检测方法、装置及电子设备。
为解决上述技术问题,本申请实施例通过以下方式实现的:
第一方面,本申请提供一种目标检测方法,该方法包括:
获取目标的图像数据;
将图像数据输入预建深度轻量网络,输出不同尺度的预测头;
对预测头进行解码,得到目标的类别、定位框及类别置信度。
在其中一个实施例中,预建深度轻量网络包括主干特征提取网络和增强特征提取网络;
将图像数据输入预建深度轻量网络,输出不同尺度的预测头,包括:
基于主干特征提取网络对图像数据提取特征,得到不同尺度的特征图;
从不同尺度的特征图中提取预设数量的不同尺度的特征图;
将预设数量的不同尺度的特征图输入增强特征提取网络,输出不同尺度的预测头。
在其中一个实施例中,主干特征提取网络包括普通卷积层和轻量线性残差特征提取模块;
基于主干特征提取网络对图像数据提取特征,得到不同尺度的特征图,包括:
普通卷积层对图像数据进行处理,得到第一特征图;
轻量线性残差特征提取模块对第一特征图进行特征提取,得到不同尺度的特征图;轻量线性残差特征提取模块包括不同滑动步长的提取模块。
在其中一个实施例中,增强特征提取网络包括自顶向下和自底向上的注意力金字塔网络;
将预设数量的不同尺度的特征图输入增强特征提取网络,输出不同尺度的预测头,包括:
将预设数量的不同尺度的特征图依次输入至注意力金字塔网络,输出不同尺度的预测头。
在其中一个实施例中,预建深度轻量网络训练阶段利用交并比感知损失函数监督训练,其中,交并比感知损失函数包括类别损失函数、目标损失函数、回归损失函数。
在其中一个实施例中,类别损失函数Lcls通过下式计算:
Lcls(p,c)=-(t-pc)Vlog(pc)·μ
其中,α、γ为调节系数,μ为交并比感知系数,CIoU为考虑中心点欧氏距离和长宽比的交并比损失函数,p为属于某一类别的概率,c为属于的某一类别。
在其中一个实施例中,将图像数据输入预建深度轻量网络,输出不同尺度的预测头,包括:
预处理图像数据,得到预处理后图像数据;
将预处理后图像数据输入预建深度轻量网络,输出不同尺度的预测头。
在其中一个实施例中,预处理图像数据,,得到预处理后图像数据包括:
调整图像数据的分辨率,得到调整后图像数据;
对调整后图像数据进行双边滤波去噪处理,得到预处理后图像数据。
第二方面,本申请提供一种目标检测装置,该装置包括:
获取模块,用于获取目标的图像数据;
处理模块,用于将图像数据输入预建深度轻量网络,输出不同尺度的预测头;
解码模块,用于对预测头进行解码,得到目标的类别、定位框及类别置信度。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面的目标检测方法。
由以上本说明书实施例提供的技术方案可见,该方案:通过预建深度轻量网络提取特征图,根据特征图,得到目标的类别、定位框及类别置信度,可以大幅度提高目标检测的精度和推理速度。可以为目标检测算法部署到移动端及大规模工程应用提供新的解决思路。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的目标检测方法的流程示意图;
图2为本申请目标检测方法在公开数据集上的验证结果图;
图3为YOLOv4算法在公开数据集上的验证结果图;
图4为YOLOv4-Mobilenet V3模型算法在公开数据集上的验证结果图;
图5为本申请提供的目标检测装置的结构示意图;
图6为本申请提供的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
在不背离本申请的范围或精神的情况下,可对本申请说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本申请的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。
关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。
本申请中的“份”如无特别说明,均按质量份计。
下面结合附图和实施例对本发明进一步详细说明。
参照图1,其示出了适用于本申请实施例提供的目标检测方法的流程示意图。可以理解的,目标检测方法可以用于车辆的检测,应用于智能交通、车联网技术等;还可以用于其他检测,下述实施例中目标以车辆为例示出。还可以理解的,该目标检测方法可以通过电子设备执行,示例性的,电子设备可以为手机、计算机、可穿戴设备等,下述实施例中采用计算机设备执行为例,该计算机设备可以有高性能显卡和处理器及软件系统组成,其中硬件计算能力需满足计算处理要求。
如图1所示,目标检测方法,可以包括:
S110、获取目标的图像数据。
具体的,车辆的图像数据可以是实时获取行驶中的车辆的图像数据,也可以是获取存储的视频中行驶中的车辆的图像数据,还可以是获取的存储的车辆的图像数据,这里不做限制。本申请实施例中以实时获取行驶中的车辆的图像数据为例示出。
行驶中的车辆的图像数据可以通过视觉传感器(例如工业级视觉传感器)采集,然后将采集的车辆数据发送至计算机设备。其中,视觉传感器可以布置在视野最佳区域,在视觉传感器性能范围尽可能覆盖整个待识别车道,布置角度应能使得视觉传感器不易受到光照、天气等其他条件的影响。
在一个实施例中,将图像数据输入预建深度轻量网络,输出不同尺度的预测头,包括:
预处理图像数据,得到预处理后图像数据;
将预处理后图像数据输入预建深度轻量网络,输出不同尺度的预测头。
预处理图像数据,,得到预处理后图像数据包括:
调整图像数据的分辨率,得到调整后图像数据;
对调整后图像数据进行双边滤波去噪处理,得到预处理后图像数据。
具体的,为了获得计算效率与图像质量的平衡,将实时采集的图像数据的图像分辨率调整为640×640,得到调整后图像数据。
对调整后图像数据进行双边滤波去噪预处理,滤波公式如下:
滤波后像素值g(k,l)为:
其中,w(i,j,k,l)为空间域核模板权值,wd(i,j,k,l)为值域核模板权值,wr(i,j,k,l)为双边滤波模板权值;(i,j)为目标像素周边的相关像素的位置,f(i,j)为像素值;(k,l)为目标像素的位置,f(k,l)为目标像素的像素值,g(k,l)为滤波后的像素值;σd为高斯函数的距离标准差,σr为高斯函数的灰度标准差。
本实施例中,对图像数据进行预处理,可以得到更高质量的图像数据。
S120、将图像数据输入预建深度轻量网络,输出不同尺度的预测头。
在一个实施例中,预建深度轻量网络包括主干特征提取网络和增强特征提取网络;
将图像数据输入预建深度轻量网络,输出不同尺度的预测头,包括:
基于主干特征提取网络对图像数据提取特征,得到不同尺度的特征图;
从不同尺度的特征图中提取预设数量的不同尺度的特征图;
将预设数量的不同尺度的特征图输入增强特征提取网络,输出不同尺度的预测头。
可选的,主干特征提取网络包括普通卷积层和轻量线性残差特征提取模块;
基于主干特征提取网络对图像数据提取特征,得到不同尺度的特征图,包括:
普通卷积层对图像数据进行处理,得到第一特征图;
轻量线性残差特征提取模块对第一特征图进行特征提取,得到不同尺度的特征图;轻量线性残差特征提取模块包括不同滑动步长的提取模块。
具体的,第一层为普通卷积层;第一层输入的特征图大小为3×640×640,用16个3×3普通卷积核对输入特征图进行处理,滑动步长为2,得到16×320×320的特征图;
从第二层开始为轻量线性残差特征提取模块,该轻量线性残差特征提取模块中提取模块按照滑动步长可分为两种,一种滑动步长s为1,另一种滑动步长s为2。滑动步长s为1的提取模块不改变特征图尺度大小,滑动步长s为2的提取模块利用深度可分离卷积可扩张特征图通道、缩小特征图大小;
第二层输入特征图大小为16×320×320,输入到步长s为1的提取模块里,不改变原特征图大小,得到16×320×320的特征图。
第三层输入特征图大小为16×320×320,用滑动步长s为2的提取模块对输入特征图进行处理,特征通道得到扩张,大小得到缩减,得到24×160×160的特征图。
第四层、第五层、第六层、第七层与上述操作类似,分别为滑动步长s为1、2、1、2的提取模块,分别输出24×160×160、40×80×80、40×80×80、80×40×40的特征图。
第八层到第十层均为滑动步长s为1的提取模块,目的是为获得更高质量的同级特征图,输出特征图大小均为80×40×40。
第十一层为升维层,特征图尺度不变,通道增加至120,最终输出特征图为120×40×40。
第十二层利用滑动步长s为2的提取模块对输入特征图进行处理,通道增加至160,得到160×20×20的特征图。
第十三、十四、十五层均为滑动步长s为1的提取模块,输出特征图大小均为160×20×20。
第十六层为滑动步长s为2的提取模块,经过处理后输出大小为180×10×10的特征图。
为了获得包含准确语义级信息和物理级信息的特征图,可以将经过主干特征提取网络处理后的特征图输入到增强特征提取网络中作进一步提取。可以从主干特征提取网络输出的若干不同尺度的特征图中提取预设数量(例如四种)的不同尺度的特征图。例如取180×10×10、160×20×20、120×40×40、40×80×80四种不同尺度大小的特征图。
可选的,增强特征提取网络包括自顶向下和自底向上的注意力金字塔网络;
将预设数量的不同尺度的特征图输入增强特征提取网络,输出不同尺度的预测头,包括:
将预设数量的不同尺度的特征图依次输入至注意力金字塔网络,输出不同尺度的预测头。
将上述提取的180×10×10、160×20×20、120×40×40、40×80×80四种不同尺度大小的特征图,依次输入至注意力金字塔网络中。可以通过双线性插值上采样技术、张量拼接技术完成对特征的增强提取,获取了更加精准的特征层。
双线性插值原理为通过寻找距离目标坐标最近的四个像素点,通过在x、y方向进行插值来推算该点的值。
双线性插值计算公式为:
其中,Q11、Q21、Q12、Q22为目标坐标最近邻的四个像素点,
注意力金字塔网络由添加网络权重分配模块的金字塔结构组成。
网络权重分配模块由全局平均池化层、全连接层、卷积层等部分构成,经过网络权重分配处理前后的特征图大小不发生改变,具体步骤为:
①对得到的特征图进行全局平均池化,使每个通道上的二维特征变成一个数;
②通过全连接层建模通道之间的相关性,得到每个特征通道的权重值;
③将所得权重值加权到每个通道的特征上,最终输出加权后的特征图。
完成增强提取后输出四种尺度的预测头(预测头为最终输出加权后的特征图,是多维向量),大小分别为C×10×10、C×20×20、C×40×40、C×80×80;其中,C表示最终特征图的通道数,由预测类别及定位框决定。
可以理解的,上述实施例中如果对图像数据进行了预处理,则预建深度轻量网络的输入即为预处理后图像数据,否则,预建深度轻量网络的输入即为图像数据。
在一个实施例中,上述预建深度轻量网络训练阶段利用交并比感知损失函数监督训练,其中,交并比感知损失函数Loss包括类别损失函数Lcls、目标损失函数Lobj、回归损失函数Lreg:
Loss=Lcls+Lobj+Lreg
其中,类别损失函数Lcls采用加入交并比感知系数μ的交叉熵损失函数:
Lcls(p,c)=-(1-pc)Vlog(pc)·μ
交并比感知系数μ的计算公式如下:
其中,α、γ为调节系数,μ为交并比感知系数,CIoU为考虑中心点欧氏距离和长宽比的交并比损失函数,p为属于某一类别的概率,c为属于的某一类别。
目标损失函数Lobj采用二分类交叉熵损失函数:
回归损失函数Lreg采用CIoU损失函数:
其中,ρ为真实框与预测框中心点欧式距离,A、B分别表示真实框与预测框,c表示可以包围真实框与预测框最小矩形框的对角线距离。
α为权重函数,v用来度量宽高比的一致性,表达式分别为:
其中,IoU表示真实框与预测框的交集面积与并集面积之比,w1、w2表示真实框与预测框的宽度,h1、h2表示真实框与预测框的高度。
整合代入计算后CIoU的最终表达式为:
对三部分损失函数分别赋予权重,最终,交并比感知损失函数的表达式为:
其中,θ1、θ2、θ3为权重系数,并满足θ1+θ2+θ3=1。
S130、对预测头进行解码,得到目标的类别、定位框及类别置信度。
具体的,可以利用网络解码器对预测头进行解码,获得目标的类别、定位框及类别置信度。
将提出的目标检测方法在公开数据集上进行验证,验证结果如图2所示,验证结果表明车辆检测平均精确率>90%,符合国家工信部发布的《自动驾驶数据安全白皮书》(2020)的分类精度要求。
如图3、4分别为采用YOLOv4、YOLOv4-Mobilenet V3模型进行的车辆检测,平均精确率分别为39.04%和88.22%,明显低于本申请实施例提出的目标检测方法的检测精确率。
本申请实施例提出的目标检测方法,通过预建深度轻量网络提取特征图,根据特征图,得到目标的类别、定位框及类别置信度,可以大幅度提高目标检测的精度和推理速度。可以为目标检测算法部署到移动端及大规模工程应用提供新的解决思路。
参照图5,其示出了根据本申请一个实施例描述的目标检测装置的结构示意图。
如图5所示,目标检测装置,可以包括:
获取模块510,用于获取目标的图像数据;
处理模块520,用于将图像数据输入预建深度轻量网络,输出不同尺度的预测头;
解码模块530,用于对预测头进行解码,得到目标的类别、定位框及类别置信度。
可选的,处理模块520还用于:
基于主干特征提取网络对图像数据提取特征,得到不同尺度的特征图;
从不同尺度的特征图中提取预设数量的不同尺度的特征图;
将预设数量的不同尺度的特征图输入增强特征提取网络,输出不同尺度的预测头。
可选的,处理模块520还用于:
普通卷积层对图像数据进行处理,得到第一特征图;
轻量线性残差特征提取模块对第一特征图进行特征提取,得到不同尺度的特征图;轻量线性残差特征提取模块包括不同滑动步长的提取模块。
可选的,处理模块520还用于:
将预设数量的不同尺度的特征图依次输入至注意力金字塔网络,输出不同尺度的预测头。
可选的,预建深度轻量网络训练阶段利用交并比感知损失函数监督训练,其中,交并比感知损失函数包括类别损失函数、目标损失函数、回归损失函数。
可选的,类别损失函数Lcls通过下式计算:
Lcls(p,c)=-(1-pc)Vlog(pc)·μ
其中,α、γ为调节系数,μ为交并比感知系数,CIoU为考虑中心点欧氏距离和长宽比的交并比损失函数,p为属于某一类别的概率,c为属于的某一类别。
可选的,处理模块520还用于:
预处理图像数据,得到预处理后图像数据;
将预处理后图像数据输入预建深度轻量网络,输出不同尺度的预测头。
可选的,处理模块520还用于:
调整图像数据的分辨率,得到调整后图像数据;
对调整后图像数据进行双边滤波去噪处理,得到预处理后图像数据。
本实施例提供的一种目标检测装置,可以执行上述方法的实施例,其实现原理和技术效果类似,在此不再赘述。
图6为本发明实施例提供的一种电子设备的结构示意图。如图6所示,示出了适于用来实现本申请实施例的电子设备300的结构示意图。
如图6所示,电子设备300包括中央处理单元(CPU)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储部分308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有设备300操作所需的各种程序和数据。CPU 301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
以下部件连接至I/O接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至I/O接口306。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行上述目标检测方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、笔记本电脑、行动电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
作为另一方面,本申请还提供了一种存储介质,该存储介质可以是上述实施例中前述装置中所包含的存储介质;也可以是单独存在,未装配入设备中的存储介质。存储介质存储有一个或者一个以上程序,前述程序被一个或者一个以上的处理器用来执行描述于本申请的目标检测方法。
存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (10)
1.一种目标检测方法,其特征在于,所述方法包括:
获取所述目标的图像数据;
将所述图像数据输入预建深度轻量网络,输出不同尺度的预测头;
对所述预测头进行解码,得到所述目标的类别、定位框及类别置信度。
2.根据权利要求1所述的方法,其特征在于,所述预建深度轻量网络包括主干特征提取网络和增强特征提取网络;
所述将所述图像数据输入预建深度轻量网络,输出不同尺度的预测头,包括:
基于所述主干特征提取网络对所述图像数据提取特征,得到不同尺度的特征图;
从所述不同尺度的特征图中提取预设数量的不同尺度的特征图;
将所述预设数量的不同尺度的特征图输入所述增强特征提取网络,输出不同尺度的所述预测头。
3.根据权利要求2所述的方法,其特征在于,所述主干特征提取网络包括普通卷积层和轻量线性残差特征提取模块;
所述基于所述主干特征提取网络对所述图像数据提取特征,得到不同尺度的特征图,包括:
所述普通卷积层对所述图像数据进行处理,得到第一特征图;
所述轻量线性残差特征提取模块对所述第一特征图进行特征提取,得到所述不同尺度的特征图;所述轻量线性残差特征提取模块包括不同滑动步长的提取模块。
4.根据权利要求2所述的方法,其特征在于,所述增强特征提取网络包括自顶向下和自底向上的注意力金字塔网络;
所述将所述预设数量的不同尺度的特征图输入所述增强特征提取网络,输出不同尺度的所述预测头,包括:
将所述预设数量的不同尺度的特征图依次输入至所述注意力金字塔网络,输出不同尺度的所述预测头。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述预建深度轻量网络训练阶段利用交并比感知损失函数监督训练,其中,所述交并比感知损失函数包括类别损失函数、目标损失函数、回归损失函数。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述将所述图像数据输入预建深度轻量网络,输出不同尺度的预测头,包括:
预处理所述图像数据,得到预处理后图像数据;
将所述预处理后图像数据输入所述预建深度轻量网络,输出所述不同尺度的预测头。
8.根据权利要求7所述的方法,其特征在于,所述预处理所述图像数据,,得到预处理后图像数据包括:
调整所述图像数据的分辨率,得到调整后图像数据;
对所述调整后图像数据进行双边滤波去噪处理,得到所述预处理后图像数据。
9.一种目标检测装置,其特征在于,所述装置包括:
获取模块,用于获取所述目标的图像数据;
处理模块,用于将所述图像数据输入预建深度轻量网络,输出不同尺度的预测头;
解码模块,用于对所述预测头进行解码,得到所述目标的类别、定位框及类别置信度。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111266083.5A CN113971731A (zh) | 2021-10-28 | 2021-10-28 | 一种目标检测方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111266083.5A CN113971731A (zh) | 2021-10-28 | 2021-10-28 | 一种目标检测方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113971731A true CN113971731A (zh) | 2022-01-25 |
Family
ID=79588867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111266083.5A Pending CN113971731A (zh) | 2021-10-28 | 2021-10-28 | 一种目标检测方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113971731A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110287849A (zh) * | 2019-06-20 | 2019-09-27 | 北京工业大学 | 一种适用于树莓派的轻量化深度网络图像目标检测方法 |
CN112232411A (zh) * | 2020-10-15 | 2021-01-15 | 浙江凌图科技有限公司 | HarDNet-Lite在嵌入式平台的优化方法 |
CN112288700A (zh) * | 2020-10-23 | 2021-01-29 | 西安科锐盛创新科技有限公司 | 一种铁轨缺陷检测方法 |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
CN112396002A (zh) * | 2020-11-20 | 2021-02-23 | 重庆邮电大学 | 一种基于SE-YOLOv3的轻量级遥感目标检测方法 |
US20210056351A1 (en) * | 2018-06-04 | 2021-02-25 | Jiangnan University | Multi-scale aware pedestrian detection method based on improved full convolutional network |
CN112446388A (zh) * | 2020-12-05 | 2021-03-05 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种基于轻量化二阶段检测模型的多类别蔬菜幼苗识别方法及系统 |
-
2021
- 2021-10-28 CN CN202111266083.5A patent/CN113971731A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210056351A1 (en) * | 2018-06-04 | 2021-02-25 | Jiangnan University | Multi-scale aware pedestrian detection method based on improved full convolutional network |
CN110287849A (zh) * | 2019-06-20 | 2019-09-27 | 北京工业大学 | 一种适用于树莓派的轻量化深度网络图像目标检测方法 |
CN112232411A (zh) * | 2020-10-15 | 2021-01-15 | 浙江凌图科技有限公司 | HarDNet-Lite在嵌入式平台的优化方法 |
CN112288700A (zh) * | 2020-10-23 | 2021-01-29 | 西安科锐盛创新科技有限公司 | 一种铁轨缺陷检测方法 |
CN112396002A (zh) * | 2020-11-20 | 2021-02-23 | 重庆邮电大学 | 一种基于SE-YOLOv3的轻量级遥感目标检测方法 |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
CN112446388A (zh) * | 2020-12-05 | 2021-03-05 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种基于轻量化二阶段检测模型的多类别蔬菜幼苗识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
许志鹏 等: "基于轻量级YOLOv3 的拉链缺陷检测系统设计与实现", 《图形图像》, 31 December 2020 (2020-12-31), pages 1 - 7 * |
郑冬: "基于轻量化SSD的车辆及行人检测网络", 《南京师范大学报(自然科学版)》, vol. 42, no. 1, 31 March 2019 (2019-03-31), pages 1 - 9 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647585B (zh) | 一种基于多尺度循环注意力网络的交通标识符检测方法 | |
CN113780296B (zh) | 基于多尺度信息融合的遥感图像语义分割方法及系统 | |
CN112418236B (zh) | 一种基于多任务神经网络的汽车可行驶区域规划方法 | |
CN108304835A (zh) | 文字检测方法和装置 | |
CN111079739B (zh) | 一种多尺度注意力特征检测方法 | |
CN111753677B (zh) | 基于特征金字塔结构的多角度遥感船舶图像目标检测方法 | |
CN113313706B (zh) | 基于检测参考点偏移分析的电力设备缺陷图像检测方法 | |
CN103136757A (zh) | 基于流形距离的两阶段聚类算法的sar图像分割方法 | |
CN112016569A (zh) | 基于注意力机制的目标检测方法、网络、设备和存储介质 | |
WO2023116632A1 (zh) | 基于时空记忆信息的视频实例分割方法和分割装置 | |
CN113239753A (zh) | 基于YOLOv4改进的交通标志检测与识别方法 | |
CN116935332A (zh) | 一种基于动态视频的渔船目标检测与跟踪方法 | |
CN115115601A (zh) | 一种基于形变注意金字塔的遥感舰船目标检测方法 | |
CN114332473A (zh) | 目标检测方法、装置、计算机设备、存储介质及程序产品 | |
CN109284752A (zh) | 一种车辆的快速检测方法 | |
CN113255555A (zh) | 中国交通标志牌识别方法、系统、处理设备及存储介质 | |
CN113269717A (zh) | 基于遥感图像的建筑物检测方法及装置 | |
Zha et al. | SAR ship detection based on salience region extraction and multi-branch attention | |
CN113971731A (zh) | 一种目标检测方法、装置及电子设备 | |
CN115205518A (zh) | 一种基于YOLO v5s网络结构的目标检测方法及其系统 | |
CN115345932A (zh) | 一种基于语义信息的激光slam回环检测方法 | |
CN110929726B (zh) | 一种铁路接触网支柱号牌识别方法及系统 | |
CN114155524A (zh) | 单阶段3d点云目标检测方法及装置、计算机设备、介质 | |
CN111856618A (zh) | 气象要素的预测方法及设备 | |
CN116630957B (zh) | 基于伪标签大小的无监督领域自适应目标检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |