CN110443279A - 一种基于轻量级神经网络的无人机图像车辆检测方法 - Google Patents

一种基于轻量级神经网络的无人机图像车辆检测方法 Download PDF

Info

Publication number
CN110443279A
CN110443279A CN201910601359.7A CN201910601359A CN110443279A CN 110443279 A CN110443279 A CN 110443279A CN 201910601359 A CN201910601359 A CN 201910601359A CN 110443279 A CN110443279 A CN 110443279A
Authority
CN
China
Prior art keywords
prediction block
unmanned plane
neural network
lightweight neural
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910601359.7A
Other languages
English (en)
Other versions
CN110443279B (zh
Inventor
王志恒
熊健
倪轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201910601359.7A priority Critical patent/CN110443279B/zh
Publication of CN110443279A publication Critical patent/CN110443279A/zh
Application granted granted Critical
Publication of CN110443279B publication Critical patent/CN110443279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于轻量级神经网络的无人机图像车辆检测方法,包括以下步骤:S01,计算损失公式,使度量匹配度的平方误差期望值最小,确定自适应大小的锚框尺寸;S02,使用轻量级神经网络提取图像特征,得到图像的特征图;S03,根据图像的特征图生成预测框并进行目标分类与定位;S04,过滤掉属于背景的预测框以及去除掉冗余的预测框,输出剩余的预测框。本发明提供的一种基于轻量级神经网络的无人机图像车辆检测方法及其工作方法,采用了自适应大小的锚框以及轻量级神经网络ShuffleNet V2的网络结构,使得使用无人机进行车辆目标检测拥有更高的识别精度及速度,满足了该场景下无人机内的低功耗处理器对检测任务的准确性与实时性的要求。

Description

一种基于轻量级神经网络的无人机图像车辆检测方法
技术领域
本发明涉及一种基于轻量级神经网络的无人机图像车辆检测方法,属于深度学习与目标检测领域。
背景技术
由于其移动性和快速性的特点,无人机在很多领域得到了广泛应用。目前无人机在许多特定场景下已经展现出了优势,帮助人们记录高空视角下的海量图像与视频数据。目标检测技术需要定位出物体的位置并识别出物体的类别。目前目标检测领域的深度学习方法主要分为两类:两阶段(Two-Stages)的目标检测算法和单阶段(Single-Stage)的目标检测算法。两阶段:首先在图像上提取候选框,然后进行分类与回归,常见的算法有R-CNN、Fast R-CNN、Faster R-CNN等。单阶段:不需要提取候选框,直接将目标框定位的问题转化为回归(regression)问题处理,常见的算法有YOLO、SSD等。
目前目标检测算法在无人机图像中已被广泛应用,但主流的目标检测方法在无人机目标检测的应用中,尤其是在目标较小且尺寸较为固定的情况下,普遍存在以下问题:(1)锚框尺寸的经验设置不能很好地匹配目标的尺寸;(2)网络模型复杂,使得检测过程计算量大,耗费时间。以上两个问题使得目前基于深度学习的使用无人机进行目标检测的方法,尤其是在目标较小且尺寸较为固定的情况下,不能很好地得到检测结果,且很难在一些计算能力差、功率较小的处理器上快速运行。
传统的目标检测方法在常规场景下,选择经验设置下的锚框尺寸并通过复杂的神经网络模型能够有效地对场景中的目标进行分类与定位,得到目标检测结果。但在使用无人机对车辆目标进行实时检测的场景下,经验设置下的锚框尺寸无法很好地与大小较小且尺寸较为固定的目标进行匹配,同时复杂的网络模型使得检测过程的计算量大,无法满足检测的实时性。
发明内容
本发明要解决的技术问题是,克服现有技术的缺陷,提供一种能够提高无人机进行车辆目标检测拥有更高的识别精度及速度,满足该场景下无人机内的低功耗处理器对检测任务的准确性与实时性的要求的基于轻量级神经网络的无人机图像车辆检测方法。
为解决上述技术问题,本发明采用的技术方案为:
一种基于轻量级神经网络的无人机图像车辆检测方法,包括以下步骤:
S01,计算损失公式,使度量匹配度的平方误差期望值最小,确定自适应大小的锚框尺寸;
S02,使用轻量级神经网络提取图像特征,得到图像的特征图;
S03,根据图像的特征图生成预测框并进行目标分类与定位;
S04,过滤掉属于背景的预测框以及去除掉冗余的预测框,输出剩余的预测框。
S01具体步骤为:
假设总数为K的锚框为A={A1,...,Ak,...,AK},Ak则表示第k个锚框,Sk表示与Ak相匹配的人工标注框,则:
其中,Lmat表示损失值,E表示求期望值,B表示边界框的随机变量,表示在给定Sk的情况下与Ak最佳匹配的人工标注框;
P(B∈Sk)表示B属于Sk的概率,Var(B|B∈Sk)是随机变量B在B∈Sk条件下的方差,P(B∈Sk)和Var(B|B∈Sk)可以分别表示为:
其中nk为属于Sk的边界框总数,n为边界框B的总数,b表示属于Sk的边界框,则公式(1)中的Lmat可表示为:
可计算出无人机图像中车辆目标的最优化锚框尺寸:
S02中,轻量级神经网络为ShuffleNet V21×,通过删去末尾的全连接层得到网络结构。
S03具体步骤为:
用一个1×1的卷积层来卷积该特征图,卷积过程中,在滑动窗口的每个像素点对应的原图像上设置S01中得到的k个最优尺寸的锚框,生成所有的预测框;
下面将卷积的结果和得到的预测框输入到两个并行的卷积层中进行卷积:
其中一个卷积层,大小为1×1,其输出是用于分类的置信度,表示每个预测框分别属于目标或背景这两种类别的概率;
另一个卷积层,大小为3×3,其输出则是用于对预测框进行修正,使其更接近人工标注框的定位输出,表示的是每个预测框回归后的坐标值(x,y,w,h),其中x、y分别是预测框的横坐标值和纵坐标值,w、h分别是预测框的宽和高。
S04中,属于背景的预测框通过设置置信度阈值的方法过滤掉。
S04中,冗余的预测框使用非极大值抑制算法(NMS)去除掉。
本发明的有益效果:本发明提供一种基于轻量级神经网络的无人机图像车辆检测方法,主要创新点在于设计了自适应大小的锚框,并采用了轻量级神经网络ShuffleNet V2的网络结构提取图像特征,能够有效地使用可搭载在无人机上的计算能力相对较差的低功耗处理器,对无人机采集的图像中的车辆目标进行精确且快速的实时检测与定位。
附图说明
图1为本发明中一种基于轻量级神经网络的无人机图像车辆检测方法的流程示意图。
具体实施方式
如图1所示,本发明提供一种基于轻量级神经网络的无人机图像车辆检测方法,包括以下步骤:
步骤一,确定自适应大小的锚框尺寸使锚框尺寸与无人机图像中的车辆目标的人工标注框更加匹配。无人机图像是从高空视角下采集的,使得图像中的车辆目标大小较小且尺寸较为固定,因而锚框的尺寸应尽可能地与无人机图像中车辆目标的人工标注框匹配。我们首先设计了损失公式,目的是使度量匹配度的平方误差期望值最小。假设总数为K的锚框为A={A1,...,Ak,...,AK},Ak则表示第k个锚框。Sk表示与Ak相匹配的人工标注框,则:
其中,Lmat表示损失值,E表示求期望值,B表示边界框(bounding box)的随机变量,表示在给定Sk的情况下与Ak最佳匹配的人工标注框,P(B∈Sk)表示B属于Sk的概率,Var(B|B∈Sk)是随机变量B在B∈Sk条件下的方差。
P(B∈Sk)和Var(B|B∈Sk)可以表示为:
其中nk为属于Sk的边界框总数,n为边界框B的总数,b表示属于Sk的边界框,则公式(1)中的Lmat可表示为:
可计算出无人机图像中车辆目标的最优化锚框尺寸:
步骤二,使用轻量级神经网络提取图像特征。确定了与无人机图像中车辆目标的人工标注框更加匹配的锚框尺寸之后,下面是通过一个经过预训练的基础网络(basenetwork)来提取待检测图像的特征。
在使用无人机进行车辆目标检测的场景下,除了精确度以外,低延迟的需求也非常重要。由于无人机的负重对自身飞行的影响较大,再加上对处理器在小体积和低功耗方面的要求,使得可搭载在无人机中的处理器的性能及计算能力远不及高性能的GPU等处理器。而ShuffleNet V2作为一个轻量级的神经网络,不仅考虑了网络设计上精确与速度,也考虑了硬件上实现的效率。它在速度上和准确度之间做到了很好的平衡,且在同等准确度下,比以往的轻量级神经网络更加快速,满足了无人机内的低功耗处理器对准确和快速的需求。
因此我们选择了ShuffleNet V21×,通过删去其中末尾的全连接层(FC层)来得到我们所需的ShuffleNet V2的网络结构,并以此网络结构作为我们的基础网络来提取图像的特征并生成图像的特征图。
步骤三,生成预测框并进行目标分类与定位。由步骤二中的基础网络得到图像的特征图后,首先用一个1×1的卷积层来卷积该特征图。卷积过程中,在滑动窗口的每个像素点对应的原图像上设置步骤一中得到的k个最优尺寸的锚框,生成所有的预测框。下面将卷积的结果和得到的预测框输入到两个并行的卷积层中进行卷积。
其中一个卷积层(大小为1×1)的输出是用于分类的置信度(confidence),表示每个预测框分别属于目标或背景这两种类别的概率。
另一个卷积层(大小为3×3)的输出则是用于对预测框进行修正,使其更接近人工标注框的定位输出(localization),表示的是每个预测框回归后的坐标值(x,y,w,h),其中x、y分别是预测框的横坐标值和纵坐标值,w、h分别是预测框的宽和高。
步骤四,输出目标的检测结果。得到了所有的预测框以及每个预测框的置信度与定位后,对于每一个预测框,首先根据其置信度值,通过设置置信度阈值的方法过滤掉属于背景的预测框。最后使用非极大值抑制算法(NMS)去除掉冗余的预测框,输出剩余的预测框即无人机图像中车辆目标的检测结果。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种基于轻量级神经网络的无人机图像车辆检测方法,其特征在于:包括以下步骤:
S01,计算损失公式,使度量匹配度的平方误差期望值最小,确定自适应大小的锚框尺寸;
S02,使用轻量级神经网络提取图像特征,得到图像的特征图;
S03,根据图像的特征图生成预测框并进行目标分类与定位;
S04,过滤掉属于背景的预测框以及去除掉冗余的预测框,输出剩余的预测框。
2.根据权利要求1所述一种基于轻量级神经网络的无人机图像车辆检测方法,其特征在于:S01具体步骤为:
假设总数为K的锚框为A={A1,...,Ak,...,AK},Ak则表示第k个锚框,Sk表示与Ak相匹配的人工标注框,则:
其中,Lmat表示损失值,E表示求期望值,B表示边界框的随机变量,表示在给定Sk的情况下与Ak最佳匹配的人工标注框;
P(B∈Sk)表示B属于Sk的概率,Var(B|B∈Sk)是随机变量B在B∈Sk条件下的方差,P(B∈Sk)和Var(B|B∈Sk)可以分别表示为:
其中nk为属于Sk的边界框总数,n为边界框B的总数,b表示属于Sk的边界框,则公式(1)中的Lmat可表示为:
可计算出无人机图像中车辆目标的最优化锚框尺寸:
3.根据权利要求1所述一种基于轻量级神经网络的无人机图像车辆检测方法,其特征在于:S02中,轻量级神经网络为ShuffieNet V21×,通过删去末尾的全连接层得到网络结构。
4.根据权利要求1所述一种基于轻量级神经网络的无人机图像车辆检测方法,其特征在于:S03具体步骤为:
用一个1×1的卷积层来卷积该特征图,卷积过程中,在滑动窗口的每个像素点对应的原图像上设置S01中得到的k个最优尺寸的锚框,生成所有的预测框;
下面将卷积的结果和得到的预测框输入到两个并行的卷积层中进行卷积:
其中一个卷积层,大小为1×1,其输出是用于分类的置信度,表示每个预测框分别属于目标或背景这两种类别的概率;
另一个卷积层,大小为3×3,其输出则是用于对预测框进行修正,使其更接近人工标注框的定位输出,表示的是每个预测框回归后的坐标值(x,y,w,h),其中x、y分别是预测框的横坐标值和纵坐标值,w、h分别是预测框的宽和高。
5.根据权利要求1所述一种基于轻量级神经网络的无人机图像车辆检测方法,其特征在于:S04中,属于背景的预测框通过设置置信度阈值的方法过滤掉。
6.根据权利要求1所述一种基于轻量级神经网络的无人机图像车辆检测方法,其特征在于:S04中,冗余的预测框使用非极大值抑制算法去除掉。
CN201910601359.7A 2019-07-04 2019-07-04 一种基于轻量级神经网络的无人机图像车辆检测方法 Active CN110443279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910601359.7A CN110443279B (zh) 2019-07-04 2019-07-04 一种基于轻量级神经网络的无人机图像车辆检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910601359.7A CN110443279B (zh) 2019-07-04 2019-07-04 一种基于轻量级神经网络的无人机图像车辆检测方法

Publications (2)

Publication Number Publication Date
CN110443279A true CN110443279A (zh) 2019-11-12
CN110443279B CN110443279B (zh) 2022-08-12

Family

ID=68429504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910601359.7A Active CN110443279B (zh) 2019-07-04 2019-07-04 一种基于轻量级神经网络的无人机图像车辆检测方法

Country Status (1)

Country Link
CN (1) CN110443279B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860260A (zh) * 2020-07-10 2020-10-30 逢亿科技(上海)有限公司 基于fpga的高精度低算量目标检测网络系统
CN111860175A (zh) * 2020-06-22 2020-10-30 中国科学院空天信息创新研究院 一种基于轻量化网络的无人机影像车辆检测方法及装置
CN112580665A (zh) * 2020-12-18 2021-03-30 深圳赛安特技术服务有限公司 车款识别方法、装置、电子设备及存储介质
CN112906732A (zh) * 2020-12-31 2021-06-04 杭州旷云金智科技有限公司 目标检测方法、装置、电子设备及存储介质
CN117649779A (zh) * 2023-10-29 2024-03-05 柳州市广恒科技有限公司 一种基于ar技术的停车管理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009526A (zh) * 2017-12-25 2018-05-08 西北工业大学 一种基于卷积神经网络的车辆识别与检测方法
CN108710913A (zh) * 2018-05-21 2018-10-26 国网上海市电力公司 一种基于深度学习的开关柜图像开关状态自动识别方法
CN109903331A (zh) * 2019-01-08 2019-06-18 杭州电子科技大学 一种基于rgb-d相机的卷积神经网络目标检测方法
CN109919013A (zh) * 2019-01-28 2019-06-21 浙江英索人工智能科技有限公司 视频图像中基于深度学习的人脸检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009526A (zh) * 2017-12-25 2018-05-08 西北工业大学 一种基于卷积神经网络的车辆识别与检测方法
CN108710913A (zh) * 2018-05-21 2018-10-26 国网上海市电力公司 一种基于深度学习的开关柜图像开关状态自动识别方法
CN109903331A (zh) * 2019-01-08 2019-06-18 杭州电子科技大学 一种基于rgb-d相机的卷积神经网络目标检测方法
CN109919013A (zh) * 2019-01-28 2019-06-21 浙江英索人工智能科技有限公司 视频图像中基于深度学习的人脸检测方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860175A (zh) * 2020-06-22 2020-10-30 中国科学院空天信息创新研究院 一种基于轻量化网络的无人机影像车辆检测方法及装置
CN111860175B (zh) * 2020-06-22 2021-10-29 中国科学院空天信息创新研究院 一种基于轻量化网络的无人机影像车辆检测方法及装置
CN111860260A (zh) * 2020-07-10 2020-10-30 逢亿科技(上海)有限公司 基于fpga的高精度低算量目标检测网络系统
CN111860260B (zh) * 2020-07-10 2024-01-26 逢亿科技(上海)有限公司 基于fpga的高精度低算量目标检测网络系统
CN112580665A (zh) * 2020-12-18 2021-03-30 深圳赛安特技术服务有限公司 车款识别方法、装置、电子设备及存储介质
CN112580665B (zh) * 2020-12-18 2024-04-19 深圳赛安特技术服务有限公司 车款识别方法、装置、电子设备及存储介质
CN112906732A (zh) * 2020-12-31 2021-06-04 杭州旷云金智科技有限公司 目标检测方法、装置、电子设备及存储介质
CN112906732B (zh) * 2020-12-31 2023-12-15 杭州旷云金智科技有限公司 目标检测方法、装置、电子设备及存储介质
CN117649779A (zh) * 2023-10-29 2024-03-05 柳州市广恒科技有限公司 一种基于ar技术的停车管理方法及系统

Also Published As

Publication number Publication date
CN110443279B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN110443279A (zh) 一种基于轻量级神经网络的无人机图像车辆检测方法
CN110084165A (zh) 基于边缘计算的电力领域开放场景下异常事件的智能识别与预警方法
CN110222769A (zh) 一种基于YOLOV3-tiny的改进目标检测方法
CN104376334B (zh) 一种多尺度特征融合的行人比对方法
CN106127145A (zh) 瞳孔定位及跟踪方法
CN109636758A (zh) 一种基于时空动态算子的水面漂浮物检测方法
CN111126116A (zh) 无人船河道垃圾识别方法及系统
CN112489089B (zh) 一种微型固定翼无人机机载地面运动目标识别与跟踪方法
CN109448307A (zh) 一种火源目标的识别方法和装置
Zhang et al. An automatic recognition method for PCB visual defects
CN107798691A (zh) 一种基于视觉的无人机自主着陆地标实时检测跟踪方法
Yu et al. Improvement of face recognition algorithm based on neural network
CN114972423A (zh) 一种航拍视频运动目标检测方法及系统
CN102799861B (zh) 一种利用颜色快速识别仪表读数的方法
Zhou et al. PSFNet: Efficient Detection of SAR Image Based on Petty-Specialized Feature Aggregation
Wang et al. Research on vehicle detection based on faster R-CNN for UAV images
Chen et al. Port ship detection in complex environments
CN117689995A (zh) 一种基于单目图像的未知航天器层级检测方法
Song et al. Fast detection of multi-direction remote sensing ship object based on scale space pyramid
Wen et al. A Lightweight ST-YOLO Based Model for Detection of Tea Bud in Unstructured Natural Environments.
Mo et al. Automatic power transmission towers detection based on the deep learning algorithm
CN105205826B (zh) 一种基于方向直线筛选的sar图像目标方位角估计方法
Heng et al. Anti-vibration hammer detection in UAV image
Tsai et al. Deep Learning Based AOI System with Equivalent Convolutional Layers Transformed from Fully Connected Layers
Li et al. An improved adaptive threshold BRISK feature matching algorithm based on SURF

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant