CN110490905A - 一种基于YOLOv3和DSST算法的目标跟踪方法 - Google Patents
一种基于YOLOv3和DSST算法的目标跟踪方法 Download PDFInfo
- Publication number
- CN110490905A CN110490905A CN201910754317.7A CN201910754317A CN110490905A CN 110490905 A CN110490905 A CN 110490905A CN 201910754317 A CN201910754317 A CN 201910754317A CN 110490905 A CN110490905 A CN 110490905A
- Authority
- CN
- China
- Prior art keywords
- target
- model
- scale
- algorithm
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/251—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本发明公开了一种基于YOLOv3和DSST算法的目标跟踪方法,步骤如下:训练目标检测模型:图像输入:位置评估:目标检测:在下一帧图像来时,以位置模型和尺度模型,以及目标位置和目标尺度作为步骤3)的输入,重复步骤3)~步骤4)完成视频目标跟踪功能。本发明有利于在实施过程的两个阶段中充分验证和客观评价方法整体效果的构成因素影响,同时也便于明确目标跟踪方法的改进与强化目标;有效减少了检测算法运算量从而提高了运算速度并降低了硬件需求;可提高跟踪算法的抗干扰性,进一步提高跟踪算法成功率和实时性。
Description
技术领域
本发明涉及视频目标跟踪领域,尤其涉及一种深度学习YOLOv3算法(深度学习回归检测算法)结合DSST算法(区分尺度空间跟踪算法)的目标跟踪方法。
背景技术
视频中运动目标的跟踪一直是计算机视觉领域中最重要的研究方向之一,它被广泛运用于安防、交通、军事等研究领域。现有的视频目标跟踪方法大体分生成模型和判别模型两大类:生成模型方法主要通过学习后的目标模型去搜索图像区域和最小化重构误差,典型代表有Mean-Shift、卡尔曼滤波和粒子滤波等;判别模型方法的主要思想是将跟踪问题看成一个二分类问题,通过判定目标和背景的差别来区分分类,典型方法包括DNet、CT、FCT,Staple和DSST等。
近年来,随着深度学习在计算机视觉方面的研究持续走热,基于深度学习与传统跟踪算法结合的目标跟踪算法研究也越来越受到重视。
中国专利公开了“一种车辆检测与跟踪方法”(公开号:109886079),其采用SSD算法和MobileNets组建的检测模块与粒子滤波和CamShift算法组建的跟踪模块,进行车辆检测跟踪。该方法降低了算法硬件性能需求,具有一定的应用价值。
中国专利公开了“一种深度学习SSD算法结合KCF算法的多目标跟踪系统”(公开号:109993769),其由SSD检测确定目标跟踪的物体和位置,KCF算法进行跟踪,并记录目标移动轨迹,跟踪过程中,SSD算法同时进行优化校正,防止跟踪偏移和失败。该发明需要使用GPU进行加速目标识别,对硬件性能需求比较高,不利于商业化应用。
研究表明,基于YOLOv3的目标检测算法在标准数据集上的检测精度和速度上都优于SSD算法,能够快速准确地识别出图片中包含的各个物体类别,并用矩形框定位物体的坐标,可显著提高基于深度学习的目标跟踪算法性能,具有较高实用价值。
发明内容
针对现有技术中存在的缺陷,本发明提供一种基于YOLOv3和DSST算法的目标跟踪方法,充分利用深度学习YOLOv3算法和DSST算法优良性能,提高了跟踪算法成功率和实时性,在很多场景下表现出较强的鲁棒性。
本发明采用以下技术方案实现上述目的。一种基于YOLOv3和DSST算法的目标跟踪方法,其步骤如下:
1)训练目标检测模型:在线下收集图片并进行人工标注,使用YOLOv3 model深度学习模型和改进的Darknet网络结构,对标注的图片进行训练和预测,获取目标检测模型;
2)图像输入:通过摄像头进行视频采集,记录当前帧图像;手动选取需要跟踪目标的位置和区域,分别记录为目标位置和目标尺度;
3)位置评估:输入下一帧图像,输入位置模型和尺度模型,结合目标位置、目标尺度和图像使用DSST跟踪算法进行位置预测和尺度预测,经过信息融合后输出当前帧的目标位置和目标尺度;更新位置模型和尺度模型;
4)目标检测:在完成位置预测后,以当前帧目标位置为中心,目标尺度放大两倍得到样本区域;在当前帧中提取样本区域的图像,将该区域图像作为YOLOv3检测算法图像输入,使用步骤1)训练的目标检测模型,经过图像预处理、特征提取和拼接进行目标定位,得出精确的目标位置和目标尺度;
5)在下一帧图像来时,以位置模型和尺度模型,以及目标位置和目标尺度作为步骤3)的输入,重复步骤3)~步骤4)完成视频目标跟踪功能。
本发明将传统跟踪算法输出的目标位置和尺度,与深度学习检测确认相结合,这种技术优势在于:
(1)提出了一种两段式设计的跟踪算法实施方案,有利于在实施过程的两个阶段中充分验证和客观评价方法整体效果的构成因素影响,同时也便于明确目标跟踪方法的改进与强化目标;
(2)与已知常见的同类跟踪方法(比如基于SDD算法)相比,本方案充分利用了检测精度和运算速度均优于SDD的YOLOv3检测算法,在此基础上,通过减少YOLOv3算法中一个尺度的输出张量,有效的减少了检测算法运算量从而提高了运算速度并降低了硬件需求;
(3)将DSST跟踪算法预测的目标区域放大2倍后作为YOLOv3检测算法输入,检测结果用于更新DSST跟踪目标框,从而提高跟踪算法的抗干扰性,进一步提高跟踪算法成功率和实时性。
附图说明
图1是本发明的整体流程图;
图2是本发明中改进的Darknet网络结构图;
图3是本发明中的DSST算法原理图;
图4是本发明中的YOLOv3目标检测框架图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示的本发明的一种基于YOLOv3和DSST算法的目标跟踪方法的整体流程图,包括步骤如下:
S1、可以利用监控视频帧进行标注,也可以从VOC2007/VOC2012/COCO数据集中提取图片并转换标注,制作数据训练集;使用改进的Darknet网络结构中的YOLOv3算法对数据集进行训练和预测,获得目标检测模型;
改进的Darknet网络结构如图2所示,为了提高YOLOv3检测算法运行速度降低硬件需求,本发明提出了一种改进Darknet网络结构,采用端到端的检测方法,在检测网络的基础上减少1个多尺度预测,采用和两种尺度分别负责预测不同大小的物体,有效的减少了运算量且提高了运算速度、降低了硬件需求;
S2、图像输入:通过摄像头进行视频采集,记录当前帧图像。手动选取需要跟踪目标的位置和区域,分别记录为目标位置和目标尺度;
S3、位置评估:输入下一帧图像,输入位置模型和,尺度模型和,结合目标位置、目标尺度和图像使用DSST跟踪算法进行位置预测和尺度预测,经过信息融合后输出当前帧的目标位置和尺度。更新位置模型和,尺度模型和;
图3是DSST目标跟踪算法的核心思想,DSST算法在样本提取的时候选择多维特征,输入样本的多维特征由样本的灰度和样本的HOG特征共同组成,相对于MOSSE,增加得HOG特征使得该算法能够更好的适应纹理特征的场景,那么最小均方差和如式(1)所示:
(1)
其中,和分别表示特征的某一维度和正则系数,表示正则系数作用是消除频谱中的零频分量的影响,避免式(1)解的分子为零,如下:
(2)
为了降低图像求解维的线性方程的计算复杂度,通过对式(2)中的分子和分母分别进行更新公式得到一个近似解,如下所示:
(3)
其中,表示学习率。新一帧图像中目标位置由式(4)获得(即相关滤波器最大的响应值):
(4)
S4、目标检测:在完成位置预测后,为避免由目标旋转、姿态变化以及相似背景干扰因素导致的跟踪失败的情况发生,以当前帧目标位置为中心,目标尺度放大两倍得到样本区域;在当前帧中提取样本区域的图像,将该区域图像作为YOLOv3检测算法输入,使用步骤1)训练的目标检测模型,通过图像预处理、特征提取和拼接几个步骤进行目标定位,得出精确的目标位置和目标尺度;
如图4所示,一种基于YOLOv3目标检测框架。具体步骤为:将目标检测模型输入检测网络,提取边界框并判断物体类别;对边界框采用非极大抑制(Non-Maximum Suppression,NMS)进行过滤,得到最终的物体边界框。
S5:在下一帧图像来时,以位置模型和,尺度模型、,目标位置和目标尺度作为步骤3)的输入,重复步骤3)~步骤4)完成视频目标跟踪功能。
Claims (1)
1.一种基于YOLOv3和DSST算法的目标跟踪方法,其特征在于,其步骤如下:
1)训练目标检测模型:在线下收集图片并进行人工标注,使用YOLOv3 model深度学习模型和改进的Darknet网络,对标注的图片进行训练和预测,获取目标检测模型;
2)图像输入:通过摄像头进行视频采集,记录当前帧图像;手动选取需要跟踪目标的位置和区域,分别记录为目标位置和目标尺度;
3)位置评估:输入下一帧图像,输入位置模型和尺度模型,结合目标位置、目标尺度和图像使用DSST跟踪算法进行位置预测和尺度预测,经过信息融合后输出当前帧的目标位置和目标尺度;更新位置模型和尺度模型;
4)目标检测:在完成位置预测后,以当前帧目标位置为中心,目标尺度放大两倍得到样本区域;在当前帧中提取样本区域的图像,将该区域图像作为YOLOv3检测算法图像输入,使用步骤1)训练的目标检测模型,经过图像预处理、特征提取和拼接进行目标定位,得出精确的目标位置和目标尺度;
5)在下一帧图像来时,以位置模型和尺度模型,以及目标位置和目标尺度作为步骤3)的输入,重复步骤3)~步骤4)完成视频目标跟踪功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910754317.7A CN110490905A (zh) | 2019-08-15 | 2019-08-15 | 一种基于YOLOv3和DSST算法的目标跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910754317.7A CN110490905A (zh) | 2019-08-15 | 2019-08-15 | 一种基于YOLOv3和DSST算法的目标跟踪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110490905A true CN110490905A (zh) | 2019-11-22 |
Family
ID=68551261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910754317.7A Withdrawn CN110490905A (zh) | 2019-08-15 | 2019-08-15 | 一种基于YOLOv3和DSST算法的目标跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110490905A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008305A (zh) * | 2019-11-29 | 2020-04-14 | 百度在线网络技术(北京)有限公司 | 一种视觉搜索方法、装置以及电子设备 |
CN111160440A (zh) * | 2019-12-24 | 2020-05-15 | 广东省智能制造研究所 | 一种基于深度学习的安全帽佩戴检测方法及装置 |
CN111667505A (zh) * | 2020-04-30 | 2020-09-15 | 北京捷通华声科技股份有限公司 | 一种定置物品跟踪的方法和装置 |
CN112184770A (zh) * | 2020-09-28 | 2021-01-05 | 中国电子科技集团公司第五十四研究所 | 一种基于YOLOv3和改进KCF的目标跟踪方法 |
CN112183252A (zh) * | 2020-09-15 | 2021-01-05 | 珠海格力电器股份有限公司 | 视频的动作识别方法、装置、计算机设备和存储介质 |
CN112257587A (zh) * | 2020-10-22 | 2021-01-22 | 江苏禹空间科技有限公司 | 目标对象的检测效果评估方法、装置、存储介质及设备 |
CN112395967A (zh) * | 2020-11-11 | 2021-02-23 | 华中科技大学 | 一种口罩佩戴监测方法、电子设备和可读存储介质 |
CN113744313A (zh) * | 2021-09-06 | 2021-12-03 | 山东工商学院 | 基于目标移动轨迹预测的深度学习集成的跟踪算法 |
CN114862916A (zh) * | 2022-07-05 | 2022-08-05 | 华砺智行(武汉)科技有限公司 | 基于ConvNeXt网络和DSST算法的交通车辆跟踪方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932509A (zh) * | 2018-08-16 | 2018-12-04 | 新智数字科技有限公司 | 一种基于视频跟踪的跨场景目标检索方法及装置 |
-
2019
- 2019-08-15 CN CN201910754317.7A patent/CN110490905A/zh not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932509A (zh) * | 2018-08-16 | 2018-12-04 | 新智数字科技有限公司 | 一种基于视频跟踪的跨场景目标检索方法及装置 |
Non-Patent Citations (2)
Title |
---|
闵召阳;赵文杰;: "基于深度学习的目标抗干扰跟踪算法" * |
马旗;朱斌;张宏伟;张杨;姜雨辰: "基于优化YOLOv3的低空无人机检测识别方法" * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008305A (zh) * | 2019-11-29 | 2020-04-14 | 百度在线网络技术(北京)有限公司 | 一种视觉搜索方法、装置以及电子设备 |
US11704813B2 (en) | 2019-11-29 | 2023-07-18 | Baidu Online Network Technology (Beijing) Co., Ltd. | Visual search method, visual search device and electrical device |
CN111160440A (zh) * | 2019-12-24 | 2020-05-15 | 广东省智能制造研究所 | 一种基于深度学习的安全帽佩戴检测方法及装置 |
CN111160440B (zh) * | 2019-12-24 | 2023-11-21 | 广东省智能制造研究所 | 一种基于深度学习的安全帽佩戴检测方法及装置 |
CN111667505B (zh) * | 2020-04-30 | 2023-04-07 | 北京捷通华声科技股份有限公司 | 一种定置物品跟踪的方法和装置 |
CN111667505A (zh) * | 2020-04-30 | 2020-09-15 | 北京捷通华声科技股份有限公司 | 一种定置物品跟踪的方法和装置 |
CN112183252A (zh) * | 2020-09-15 | 2021-01-05 | 珠海格力电器股份有限公司 | 视频的动作识别方法、装置、计算机设备和存储介质 |
CN112184770A (zh) * | 2020-09-28 | 2021-01-05 | 中国电子科技集团公司第五十四研究所 | 一种基于YOLOv3和改进KCF的目标跟踪方法 |
CN112257587A (zh) * | 2020-10-22 | 2021-01-22 | 江苏禹空间科技有限公司 | 目标对象的检测效果评估方法、装置、存储介质及设备 |
CN112257587B (zh) * | 2020-10-22 | 2023-12-22 | 无锡禹空间智能科技有限公司 | 目标对象的检测效果评估方法、装置、存储介质及设备 |
CN112395967A (zh) * | 2020-11-11 | 2021-02-23 | 华中科技大学 | 一种口罩佩戴监测方法、电子设备和可读存储介质 |
CN113744313A (zh) * | 2021-09-06 | 2021-12-03 | 山东工商学院 | 基于目标移动轨迹预测的深度学习集成的跟踪算法 |
CN113744313B (zh) * | 2021-09-06 | 2024-02-02 | 山东工商学院 | 基于目标移动轨迹预测的深度学习集成的跟踪算法 |
CN114862916A (zh) * | 2022-07-05 | 2022-08-05 | 华砺智行(武汉)科技有限公司 | 基于ConvNeXt网络和DSST算法的交通车辆跟踪方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490905A (zh) | 一种基于YOLOv3和DSST算法的目标跟踪方法 | |
CN111325089B (zh) | 跟踪对象的方法和设备 | |
CN103942811B (zh) | 分布式并行确定特征目标运动轨迹的方法与系统 | |
CN103455797B (zh) | 航拍视频中运动小目标的检测与跟踪方法 | |
CN108549846B (zh) | 一种结合运动特征和头肩结构的行人检测与统计方法 | |
CN110378931A (zh) | 一种基于多摄像头的行人目标移动轨迹获取方法及系统 | |
CN105160310A (zh) | 基于3d卷积神经网络的人体行为识别方法 | |
CN102609720B (zh) | 一种基于位置校正模型的行人检测方法 | |
CN106446922B (zh) | 一种人群异常行为分析方法 | |
CN111027481B (zh) | 基于人体关键点检测的行为分析方法及装置 | |
CN106295532B (zh) | 一种视频图像中的人体动作识别方法 | |
CN110991397B (zh) | 一种行进方向确定方法及相关设备 | |
CN101179713A (zh) | 复杂背景下单个运动目标的检测方法 | |
CN105893946A (zh) | 一种正面人脸图像的检测方法 | |
CN106355604A (zh) | 图像目标跟踪方法与系统 | |
CN107452015A (zh) | 一种具有重检测机制的目标跟踪系统 | |
CN110119726A (zh) | 一种基于YOLOv3模型的车辆品牌多角度识别方法 | |
CN109145708A (zh) | 一种基于rgb和d信息融合的人流量统计方法 | |
CN106446002A (zh) | 一种基于运动目标在地图中轨迹的视频检索方法 | |
CN103699874A (zh) | 基于surf流和lle稀疏表示的人群异常行为识别方法 | |
CN110298248A (zh) | 一种基于语义分割的多目标跟踪方法及系统 | |
CN106529441B (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
CN104200218B (zh) | 一种基于时序信息的跨视角动作识别方法及系统 | |
CN104123569B (zh) | 一种基于有监督学习的视频人数信息统计方法 | |
CN102148919B (zh) | 一种球类检测的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20191122 |