CN114022812A - 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 - Google Patents
一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 Download PDFInfo
- Publication number
- CN114022812A CN114022812A CN202111282062.2A CN202111282062A CN114022812A CN 114022812 A CN114022812 A CN 114022812A CN 202111282062 A CN202111282062 A CN 202111282062A CN 114022812 A CN114022812 A CN 114022812A
- Authority
- CN
- China
- Prior art keywords
- frame
- water surface
- tracking
- target
- target detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000001514 detection method Methods 0.000 claims abstract description 143
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 208000034699 Vitreous floaters Diseases 0.000 claims description 64
- 238000007667 floating Methods 0.000 claims description 16
- 238000013139 quantization Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 7
- 230000001629 suppression Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 230000017105 transposition Effects 0.000 claims description 3
- 238000005286 illumination Methods 0.000 abstract description 4
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000013527 convolutional neural network Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011480 coordinate descent method Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/277—Analysis of motion involving stochastic approaches, e.g. using Kalman filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/292—Multi-camera tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法,属于机器学习、目标跟踪领域。首先,获得若干水面漂浮物的连续视频帧。其次,输入水面漂浮物视频数据,通过轻量化的SSD检测算法获取当前帧的水面漂浮物目标检测框,基于视频当前帧的目标检测框进行状态预测,获得当前视频帧下的水面漂浮物目标跟踪框。再次,计算所有水面漂浮物目标检测框和跟踪框之间的运动匹配度和表观匹配度,将运动匹配度和表观匹配度进行综合匹配得到关联代价。最后,通过匈牙利算法将水面漂浮物的关联代价矩阵Ci,j进行关联匹配,确定跟踪结果。本发明能够实现水面漂浮物多目标跟踪,降低反向传播的参数数量和内存成本,提高数据关联的准确性,改善光照和遮挡物的影响。
Description
技术领域
本发明属于机器学习、目标跟踪领域,涉及一种基于轻量化SSD算法的DeepSort水面漂 浮物多目标跟踪方法。
背景技术
水环境综合治理是水利工程运营与管理的重要组成部分,是落实绿色发展理念、推进生 态文明建设的内在要求,是解决我国复杂水问题、维护河湖健康生命的有效举措。漂浮物对 水质、水面景观、供水、水产和航运等造成不利影响,同时减小水电枢纽的发电效益、对枢 纽运行安全构成威胁,加强河道漂浮物检测与打捞对水利工程具有重要意义。如何快速有效 检测跟踪水面漂浮物的运行轨迹,为水面安全规避、污染物清洁、水面交通安全等领域提供 早期预警及实时监控等信息,成为了智能识别以及水利信息化的重要课题之一。
目标检测与跟踪是计算机视觉领域中核心的研究问题,也是目前工业领域最为热门的技 术。其中目标检测的任务是从场景中将目标物体与其他目标进行有效区分,定位目标物体的 位置,识别出目标大小等信息。目标跟踪是在检测的基础上,进一步对目标物体下一时刻的 位置和大小等信息进行科学预测,明确目标物体的运动轨迹。伴随着深度学习技术的不断发 展,卷积神经网络为目标检测跟踪提供了巨大的技术支撑,并在目标检测与跟踪领域取得了 巨大的成功。
目前,基于深度学习的水面漂浮物检测算法沿着两条主线发展:第一,以FasterRCNN、 CA-Faster R-CNN为代表的基于候选框方式的检测主线,能够有效确保漂浮物检测精度,但 检测速度无法满足实时检测需求;第二,以YOLO、SSD和Retain-Net为代表的一体化检测 算法,检测速度要明显快于前者,但漂浮物检测精度略有下降,其中SSD检测算法的准确率 和检测速度相对较优,成为当前应用于水面漂浮物目标检测的主流方法。传统的SSD检测算 法是以VGG-16为基础网络,包含了13个卷机层,模型的网络参数、浮点数计算量以及内存 需求等依赖于高性能的硬件设备,导致传统SSD检测算法难以在实际中进行大规模推广和应 用。
同时,当前水面漂浮物跟踪技术也面临着较大的挑战,首先,水面漂浮物目标跟踪需要 解决单目标跟踪中存在的诸如漂浮物目标形变、场景环境变化等挑战之外,还面临着由于漂 浮物目标数量不确定所带来的实时目标数量更新及维持目标各自身份(Identity,ID)的任务, 因此视觉多目标跟踪还需要处理更为复杂关键的问题,诸如:漂浮物目标数量不确定、频繁 目标遮挡、同类目标的相似度区分等。近几年随着基于深度学习检测算法的精度较传统算法 性能大幅度提高,视觉多目标跟踪随之取得了较大的突破。目前多目标跟踪技术应用较为广 泛的是SORT和DeepSort算法,其中SORT算法主要是利用卡尔曼滤波对目标物体进行预测 和更新,并使用匈牙利算法对目标物体的预测框和检测框进行匹配,在存在遮挡的情况下跟 踪效果较差。DeepSort算法是基于SORT算法上引入级联匹配思想,通过匈牙利算法将目标 物体轨迹的预测框和检测框进行数据关联匹配,降低了目标物体的误检率和漏检率,改善了 光照和遮挡物的影响。
基于实际水面漂浮物检测跟踪的需求,目前国内外相关研究成果存在算法结构复杂以及 受到复杂水面环境的影响,无法满足实时水面漂浮物检测跟踪的需求。本发明在深度学习技 术不断拓展的基础上,提出基于轻量化SSD(Single Shot MultiBox Detector,单发多目标检测 器)算法的DeepSort水面漂浮物多目标跟踪方法,实现对水面漂浮物的精准跟踪。
发明内容
本发明的目的在于提供一种基于轻量化SSD的DeepSort目标检测跟踪方法,旨在解决现 有目标跟踪算法受到运行设备内存容量限制的问题,同时降低外部光照和遮挡物对目标跟踪 的影响。
为了实现上述目的,本发明采用的技术方案为:
一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法,包括以下主要步骤:
S1:借助多台摄像机获得若干水面漂浮物的连续视频帧;
S2:输入水面漂浮物视频数据,通过轻量化的SSD检测算法获取当前帧的水面漂浮物目 标检测框;具体为:
所述轻量化SSD目标检测算法由骨干网络和辅助网络构成。第一,骨干网络主要参考轻 量化MobileNetV2的网络结构,将MobileNetV2网络替换传统SSD检测算法中的VGG-16网 络,将MobileNetV2网络卷积中的多尺度结构通过跨层连接构建特征金字塔网络(FeaturePyramidNetwork,FPN),在MobileNetV2网络预测层中将深度可分离卷积代替传统标 准卷积以降低参数和模型运算量。第二,辅助网络采用模型量化方法Quantized-CNN对深度 可分离卷积的参数进行量化,量化过程主要通过改变深度可分离卷积中字空间数量和每个字 空间中的字码数数量两个参数来完成。轻量化SSD检测算法获取视频目标检测框主要包括以 下步骤:
(1)采用轻量化SSD目标检测算法中的特征金字塔网络获得当前帧中水面漂浮物不同尺 度的特征响应图。
(2)将步骤(1)中得到的特征响应图通过轻量化SSD目标检测算法的特征提取网络MobileNetV2提取当前帧中的所有目标检测框。
(3)在步骤(2)中得到的所有目标检测框中,删除置信度低于0.7的检测框,并采用非 最大值抑制方法删除冗余和重复的检测框,通过两次筛选得到当前帧中的最终目标检测框。
S3:基于视频当前帧的目标检测框采用卡尔曼滤波算法进行状态预测,获得当前视频帧 下的水面漂浮物目标跟踪框;具体为:
(1)在步骤S2中通过轻量化SSD目标检测算法获得视频中第1帧中A个水面漂浮物目 标检测框,将置信度作为目标检测框准确度的重要指标,代表目标检测框与目标实际框的重 合率,置信度阈值设定为0.7,将A个水面漂浮物目标检测框中置信度低于0.7的目标检测框 删除;非最大值抑制(NMS)是为了消除多余交叉重复的检测框,识别出最佳的漂浮物目标 检测的位置,解决一个漂浮物目标被多次检测的问题。在第一次将置信度低于0.7的检测框 进行删除的基础上,采用非最大值抑制将高冗余和重复检测的检测框进行第二次删除,最终 得到B个目标检测框。
(2)为第1帧中的B个目标检测框中的每一个检测框分配一个卡尔曼滤波器。
(3)根据第1帧中的B个目标检测框,通过卡尔曼滤波器对第2帧中的水面漂浮物目标 进行预测,获得第2帧下水面漂浮物的跟踪框。
(4)根据视频总帧数N,重复上述(1)-(3),直到获得第N帧下的水面漂浮物目标跟踪框。
S4:计算所有水面漂浮物目标检测框和跟踪框之间的运动匹配度和表观匹配度,将运动 匹配度和表观匹配度进行综合匹配得到关联代价,并构建关联代价矩阵;具体为:
采用马氏距离衡量物体检测框dj和物体跟踪框yi之间的距离d(1)(i,j),进而衡量运动匹 配度:
其中,dj代表第j个检测框,yi代表第i个跟踪框,代表卡尔曼滤波器预测得到的跟踪框 与目标检测算法得到的检测框之间的协方差,T代表转置操作,t(1)代表马氏距离特定阈值,代表跟踪框和预测框两者的运动匹配度;当马氏距离d(1)(i,j)≤特定阈值t(1)时,代表跟 踪框和预测框两者关联,运动匹配度为1,匹配成功。
采用余弦距离d(2)(i,j)进行衡量表观匹配度,公式如下:
其中,代表余弦相似度,代表第k个跟踪框,余弦距离d(2)(i,j)=1-余弦相似度,Ri代 表在跟踪器i中所有的跟踪框;t(2)代表余弦距离特定阈值;代表跟踪框和预测框两者的 表观匹配度;当最小余弦距离d(2)(i,j)≤特定阈值t(2)时,代表跟踪框和预测框两者的表观匹 配成功。
基于S4中的运动匹配度和表观匹配度计算结果,进一步加权计算得到关联代价矩阵Ci,j:
Ci,j=λd(1)(i,j)+(1+λ)d(2)(i,j) (5)
其中,λ代表运动匹配度的权重,1+λ代表表观匹配度的权重,bi,j代表第j个检测框和第i 个跟踪框的匹配性,当bi,j=1时,代表第j个检测框和第i个跟踪框初步匹配。
S5:通过匈牙利算法将水面漂浮物的关联代价矩阵Ci,j进行关联匹配,进一步确定跟踪结 果,实现水面漂浮物多目标跟踪。具体为:
(1)设定马氏距离特定阈值t(1)和余弦距离特定阈值t(2),将t(1)与d(1)(i,j)进行比较,将 t(2)与d(2)(i,j)进行比较。
(2)将大于t(1)的d(1)(i,j)和大于t(2)的d(2)(i,j)来计算关联代价矩阵Ci,j,将所对应的目 标检测框和目标跟踪框中的水面漂浮物作为一组跟踪结果。
与现有技术相比,本发明的有益效果如下:
(1)参考MobileNetV2的网络结构,将基于反向残差网络的轻量级MobileNetV2网络替 代传统SSD检测网络中的VGG16基础网络,同时将特征金字塔网络结构引入到特征提取网 络中以确保用于预测的特征图具有不同的尺度;应用模型量化Quantized-CNN方法对深度可 分离卷积的参数进行量化,降低反向传播的参数数量和内存成本。
(2)采用基于轻量化SSD目标检测的DeepSort水面漂浮物多目标跟踪,利用匈牙利算 法来解决预测框和跟踪框之间的数据关联问题,将运动匹配度和表观匹配度来进行关联度量, 提高了数据关联的准确性。
(3)本发明基于轻量化SSD的DeepSort水面漂浮物多目标跟踪,降低了算法结构复杂 度以及复杂水面环境对跟踪效果的影响,并通过匈牙利算法将目标物体轨迹的预测框和检测 框进行数据关联匹配,降低了目标物体的误检率和漏检率,改善了光照和遮挡物的影响。
附图说明
图1是本发明的一种基于轻量化SSD算法的DeepSort水面漂浮物多目标跟踪方法流程图。
图2是卡尔曼滤波与匈牙利匹配作用示意图。
图3是本发明中提供的轻量化SSD检测网络结构示意图。
具体实施方式
为了能够为本技术领域内的人员更加清晰地理解本发明,将对本发明的具体实施内容和 方式进行详细描述。但是需要明确的是,本发明不限于具体实施方式的内容,只要部分技术 变化在权力要求之内,一切利于本发明构思的创造在合法保护范围之内。
如图1所示,一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法,具体实施流 程如下:
S1:通过5个摄像头录制水面漂浮物30天时间内完整的视频帧;
S2:通过本发明中轻量化的SSD目标检测算法对水面漂浮物视频帧进行目标检测,获得 视频中第i帧(i=1,2,3……N)水面漂浮物目标的检测框;
S3:基于当前第i帧(i=1,2,3……N)的检测框采用卡尔曼滤波算法进行状态预测,获得 对应的水面漂浮物目标跟踪框;
S4:计算所有水面漂浮物目标检测框和跟踪框之间的运动匹配度和表观匹配度,将运动 匹配度和表观匹配度进行综合匹配得到关联代价,并构建关联代价矩阵;
S5:通过匈牙利算法将水面漂浮物的关联代价矩阵进行关联匹配,进一步确定跟踪结果, 实现水面漂浮物多目标跟踪。
具体实施例如下:
本发明中的轻量化SSD目标检测算法作为水面漂浮物目标检测工具,旨在识别出漂浮物 的种类、数量以及规模等信息。轻量化的SSD目标检测算法主体结构见图3所示,由骨干网 络(2a)和辅助网络(2b)组成网络模块,其中MobileNetV2的核心(2c)是由1个标准卷 积层和17个反向残差模块组成。参考ResNet的残差模块,本发明采用1*1→3*3→1*1的模式, 首先采用逐点卷积(Poinwise,PW)增加特征通道数,将膨胀系数设置为6,使用DW过滤 大量通道的空间信息并提取特征,引入宽度乘数β∈[0,1]和分辨率乘数ρ,优化并减少模型冗 余参数;其次使用PW卷积以减少通道数,通过线性转换形成低维线性瓶颈,将ReLU6代替 传统的非线性激活函数ReLU,将最大输出值限制为6。调整后的反向残差模块(2d)是由1 个1*1的卷积层、1个3*3的DW卷积、批量标准化(Batch normalize,Bn)和Relu6激励函数组成。骨干网络中的特征金字塔FPN融合MobileNetV2网络的输出特征图,在不增加过多参数的情况下,能够有效提高水面漂浮物检测精度。本发明首先将特征图自上而下进行2次上采样(up-sampling),将上采样结果与自下而上采样产生的特征图进行横向连接并融合,其 次采用3*3卷积层对融合特征图进行卷积操作,动态调整每个不同比例的特征地图的大小, 通过融合MobileNetV2网络获取的多尺度特征图(2e)来提高水面漂浮物检测精度。
改进后的骨干网络MobileNetV2-FPN网络参数见表1,每一行描述了一个重复n次并由 一个或多个相同模块层组成的序列。其中t代表残差块中扩展的维度,c代表特征图输出的维 数,s代表卷积操作的步长,n代表当前行卷积操作被重复应用次数。本发明在序列1中以标 准卷积层conv2d进行操作,将卷积核设置为24,以确保完整地提取输入图像的特征信息, 在序列2-8中采用瓶颈倒置残差(bottleneck)进行卷机操作,在序列9-12中采用标准卷积 conv2d进行自上而下和自下而上的特征金字塔特征提取,构建多个具有不同分辨率和强语义 信息的低成本预测特征图。在序列13中采用深度可分离卷积(DW)代替传统标准卷积conv2d 进行特征预测。
表1 MobileNetV2-FPN网络参数
序列 | Input(输入) | Operator(卷积类型) | t | c | n | s |
1 | 256*256*3 | conv2d | - | 24 | 1 | 2 |
2 | 128*128*24 | bottleneck | 1 | 16 | 1 | 1 |
3 | 128*128*16 | bottleneck | 6 | 24 | 1 | 2 |
4 | 64*64*24 | bottleneck | 6 | 24 | 2 | 2 |
5 | 32*32*24 | bottleneck | 6 | 48 | 3 | 2 |
6 | 16*16*48 | bottleneck | 6 | 72 | 4 | 1 |
7 | 16*16*72 | bottleneck | 6 | 120 | 3 | 2 |
8 | 8*8*120 | bottleneck | 6 | 120 | 3 | 1 |
9 | 8*8*120 | conv2d | - | 192 | 1 | 1 |
10 | 8*8*192 | Top-down | - | 96 | 1 | 1 |
11 | 8*8*96 | conv2d | - | 96 | 1 | 1 |
12 | 4*4*96 | conv2d | - | 96 | 1 | 1 |
13 | 2*2*96 | DW | - | - | - | - |
辅助网络(2b)的构建是为了量化深度可分离卷积(DW)和传统标准卷积conv2d的参 数,以降低算法的计算复杂度和内存成本。本发明采用模型量化方法Quantized-CNN对卷积 层进行误差量化,将每一层特征图输出的误差进行最小化,并融合前一层量化过程中的误差, 将误差量化的最优目标设置为G:
式中Sn代表图像输入,Tn代表图像输出,F代表Frobenius中参数量化的近似响应,误差量 化最优目标通过块坐标下降法(Block Coordinate Descent)进行优化,同时优化过程中子空间 残差优化通过动态调整子码本和子码字分配来实现。因此,本研究将图像数据输入均匀划分 为V个子向量S(v),将权重矩阵W分解为V个子空间矩阵,并生成子码本(Codebook)D(v), 计算S(v)和D(v)中子码字(Codeword),算法的计算复杂度是子码本和子码字的内积,算法的 内存成本是由子码本和子码字进行动态分配,K和V越小,网络计算效率越高。
上述S2中通过轻量化的SSD检测算法获取当前帧的水面漂浮物目标检测框,具体见图2 中的(a),漂浮物目标检测框的检测方法如下:(1)采用轻量化SSD目标检测算法中的特征 金字塔网络获得当前帧中水面漂浮物不同尺度的特征响应图;(2)将(1)中得到的特征响应 图通过轻量化SSD目标检测算法的特征提取网络MobileNetV2提取当前帧中的所有目标检测 框;(3)在(2)中得到的所有目标检测框中,删除置信度低于0.7的检测框,并采用非最大 值抑制方法删除冗余和重复的检测框,通过两次筛选得到当前帧中的最终目标检测框。。
本发明是基于轻量化SSD检测算法的检测结果,利用DeepSort多目标跟踪算法,即DeepSort算法在本发明中负责Track阶段,经轻量化SSD检测出目标检测框后,DeepSort负责对视频中每一帧图像中的目标检测框进行匹配跟踪。上述S3中基于视频当前帧的目标检测 框采用卡尔曼滤波算法进行状态预测,获得对应的水面漂浮物目标跟踪框,具体见图2中的 (b),卡尔曼滤波是通过轻量化SSD目标检测得到当前时刻的“测量值”和上一时刻的“预测 量”和“误差”,计算当前的最优量,再预测下一时刻的量,用于对水面漂浮物目标运动轨迹的 预测,并使用置信度较高的跟踪结果对预测结果进行修正。漂浮物目标跟踪框的获取方法如 下:第一,在S2中通过轻量化SSD目标检测算法获得视频中第1帧中A个水面漂浮物目标 检测框,并通过置信度阈值0.7和非最大值抑制方法两种方式筛选出B个目标检测框;第二, 为第1帧中的B个目标检测框中的每一个检测框分配一个卡尔曼滤波器;第三,根据第1帧 中的B个目标检测框,通过卡尔曼滤波器对第2帧中的水面漂浮物目标进行预测,获得第2 帧下水面漂浮物的跟踪框;第四,根据视频总帧数N,重复上述(1)-(3),直到获得第N 帧下的水面漂浮物目标跟踪框。
上述S4中本发明通过计算水面漂浮物目标检测框和跟踪框之间的运动匹配度和表观匹配 度,将运动匹配度和表观匹配度进行综合匹配得到关联代价,并构建关联代价矩阵,具体实 施过程如下:
采用马氏距离衡量物体检测框dj和物体跟踪框yi之间的距离d(1)(i,j),进而衡量运动匹 配度:
其中,dj代表第j个检测框,yi代表第i个跟踪框,代表卡尔曼滤波器预测得到的跟踪框 与目标检测算法得到的检测框之间的协方差,T代表转置操作,t(1)代表马氏距离特定阈值, 代表跟踪框和预测框两者的运动匹配度;当马氏距离d(1)(i,j)≤特定阈值t(1)时,代表跟 踪框和预测框两者关联,运动匹配度为1,匹配成功。针对四维测量空间下设置t(1)=9.4877。
采用余弦距离d(2)(i,j)进行衡量表观匹配度,公式如下:
其中,代表余弦相似度,代表第k个跟踪框,余弦距离d(2)(i,j)=1-余弦相似度,Ri代 表在跟踪器i中所有的跟踪框;t(2)代表余弦距离特定阈值;代表跟踪框和预测框两者的 表观匹配度;当最小余弦距离d(2)(i,j)≤特定阈值t(2)时,代表跟踪框和预测框两者的表观匹 配成功。t(2)从单独的训练集中获得。
基于S4中的运动匹配度和表观匹配度计算结果,进一步加权计算得到关联代价矩阵Ci,j:
Ci,j=λd(1)(i,j)+(1+λ)d(2)(i,j) (5)
其中,λ代表运动匹配度的权重,1+λ代表表观匹配度的权重,bi,j代表第j个检测框和第i 个跟踪框的匹配性,当bi,j=1时,代表第j个检测框和第i个跟踪框初步匹配。
上述S5中通过匈牙利算法将水面漂浮物的关联代价矩阵进行关联匹配,进一步确定跟踪 结果,匈牙利匹配是将视频前一帧中的跟踪框与当前帧中的检测框进行关联,通过马氏距离 (Mahalanobis distance)和外观信息(Appearance information),或者IOU来计算代价矩阵, 可寻找视频前后2帧的若干目标匹配的最优解,具体见图3。具体操作如下:第一,设定马 氏距离特定阈值t(1)和余弦距离特定阈值t(2),将t(1)与d(1)(i,j)进行比较,将t(2)与d(2)(i,j)进 行比较;第二,将大于t(1)和t(2)的d(1)(i,j)和d(2)(i,j)计算关联代价矩阵Ci,j,将所对应的目标 检测框和目标跟踪框中的水面漂浮物作为一组跟踪结果。
需要明确的是,本发明所实施的水面漂浮物多目标跟踪过程具有系统性,在跟踪每一帧 水面漂浮物目标时,会重新计算卡尔曼滤波器增益,实时更新水面漂浮物目标物体的状态信 息和协方差矩阵。
Claims (1)
1.一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法,其特征在于,包括以下步骤:
S1:借助多台摄像机获得若干水面漂浮物的连续视频帧;
S2:输入水面漂浮物视频数据,通过轻量化的SSD检测算法获取当前帧的水面漂浮物目标检测框;具体为:
所述轻量化SSD目标检测算法由骨干网络和辅助网络构成;第一,骨干网络主要参考轻量化MobileNetV2的网络结构,将MobileNetV2网络替换传统SSD检测算法中的VGG-16网络,将MobileNetV2网络卷积中的多尺度结构通过跨层连接构建特征金字塔网络,在MobileNetV2网络预测层中将深度可分离卷积代替传统标准卷积以降低参数和模型运算量;第二,辅助网络采用模型量化方法Quantized-CNN对深度可分离卷积的参数进行量化,量化过程主要通过改变深度可分离卷积中字空间数量和每个字空间中的字码数数量两个参数来完成;轻量化SSD检测算法获取视频目标检测框主要包括以下步骤:
(1)采用轻量化SSD目标检测算法中的特征金字塔网络获得当前帧中水面漂浮物不同尺度的特征响应图;
(2)将步骤(1)中得到的特征响应图通过轻量化SSD目标检测算法的特征提取网络MobileNetV2提取当前帧中的所有目标检测框;
(3)在步骤(2)中得到的所有目标检测框中,删除置信度低于0.7的检测框,并采用非最大值抑制方法删除冗余和重复的检测框,通过两次筛选得到当前帧中的最终目标检测框;
S3:基于视频当前帧的目标检测框采用卡尔曼滤波算法进行状态预测,获得当前视频帧下的水面漂浮物目标跟踪框;具体为:
(1)在步骤S2中通过轻量化SSD目标检测算法获得视频中第1帧中A个水面漂浮物目标检测框,并通过置信度阈值0.7和非最大值抑制方法两种方式筛选出B个目标检测框;
(2)为第1帧中的B个目标检测框中的每一个检测框分配一个卡尔曼滤波器;
(3)根据第1帧中的B个目标检测框,通过卡尔曼滤波器对第2帧中的水面漂浮物目标进行预测,获得第2帧下水面漂浮物的跟踪框;
(4)根据视频总帧数N,重复上述步骤(1)-(3),直到获得第N帧下的水面漂浮物目标跟踪框;
S4:计算所有水面漂浮物目标检测框和跟踪框之间的运动匹配度和表观匹配度,将运动匹配度和表观匹配度进行综合匹配得到关联代价,并构建关联代价矩阵;具体为:
采用马氏距离衡量物体检测框dj和物体跟踪框yi之间的距离d(1)(i,j),衡量运动匹配度:
其中,dj代表第j个检测框,yi代表第i个跟踪框,代表卡尔曼滤波器预测得到的跟踪框与目标检测算法得到的检测框之间的协方差,T代表转置操作,t(1)代表马氏距离特定阈值,代表跟踪框和预测框两者的运动匹配度;当马氏距离d(1)(i,j)≤特定阈值t(1)时,代表跟踪框和预测框两者关联,运动匹配度为1,匹配成功;
采用余弦距离d(2)(i,j)进行衡量表观匹配度,公式如下:
其中,代表余弦相似度,代表第k个跟踪框,余弦距离d(2)(i,j)=1-余弦相似度,Ri代表在跟踪器i中所有的跟踪框;t(2)代表余弦距离特定阈值;代表跟踪框和预测框两者的表观匹配度;当最小余弦距离d(2)(i,j)≤特定阈值t(2)时,代表跟踪框和预测框两者的表观匹配成功;
基于S4中的运动匹配度和表观匹配度计算结果,加权计算得到关联代价矩阵Ci,j:
Ci,j=λd(1)(i,j)+(1+λ)d(2)(i,j) (5)
其中,λ代表运动匹配度的权重,1+λ代表表观匹配度的权重,bi,j代表第j个检测框和第i个跟踪框的匹配性,当bi,j=1时,代表第j个检测框和第i个跟踪框初步匹配;
S5:通过匈牙利算法将水面漂浮物的关联代价矩阵Ci,j进行关联匹配,确定跟踪结果,实现水面漂浮物多目标跟踪;具体为:
(1)设定马氏距离特定阈值t(1)和余弦距离特定阈值t(2),将t(1)与d(1)(i,j)进行比较,将t(2)与d(2)(i,j)进行比较;
(2)将大于t(1)的d(1)(i,j)和大于t(2)的d(2)(i,j)来计算关联代价矩阵Ci,j,将所对应的目标检测框和目标跟踪框中的水面漂浮物作为一组跟踪结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111282062.2A CN114022812B (zh) | 2021-11-01 | 2021-11-01 | 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111282062.2A CN114022812B (zh) | 2021-11-01 | 2021-11-01 | 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114022812A true CN114022812A (zh) | 2022-02-08 |
CN114022812B CN114022812B (zh) | 2024-05-10 |
Family
ID=80059206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111282062.2A Active CN114022812B (zh) | 2021-11-01 | 2021-11-01 | 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022812B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI790957B (zh) * | 2022-04-06 | 2023-01-21 | 淡江大學學校財團法人淡江大學 | 一種多目標追蹤的高速數據關聯方法 |
CN116563347A (zh) * | 2023-07-04 | 2023-08-08 | 广东海洋大学 | 一种基于组合模型的蜂王轨迹追踪方法、系统及装置 |
CN117152689A (zh) * | 2023-10-31 | 2023-12-01 | 易启科技(吉林省)有限公司 | 一种基于视觉的河道目标检测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190147318A1 (en) * | 2017-11-14 | 2019-05-16 | Google Llc | Highly Efficient Convolutional Neural Networks |
WO2021017291A1 (zh) * | 2019-07-31 | 2021-02-04 | 平安科技(深圳)有限公司 | 基于Darkflow-DeepSort的多目标追踪检测方法、装置及存储介质 |
CN113034548A (zh) * | 2021-04-25 | 2021-06-25 | 安徽科大擎天科技有限公司 | 一种适用于嵌入式终端的多目标跟踪方法及其系统 |
CN113470076A (zh) * | 2021-07-13 | 2021-10-01 | 南京农业大学 | 一种平养鸡舍黄羽鸡多目标跟踪方法 |
-
2021
- 2021-11-01 CN CN202111282062.2A patent/CN114022812B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190147318A1 (en) * | 2017-11-14 | 2019-05-16 | Google Llc | Highly Efficient Convolutional Neural Networks |
WO2021017291A1 (zh) * | 2019-07-31 | 2021-02-04 | 平安科技(深圳)有限公司 | 基于Darkflow-DeepSort的多目标追踪检测方法、装置及存储介质 |
CN113034548A (zh) * | 2021-04-25 | 2021-06-25 | 安徽科大擎天科技有限公司 | 一种适用于嵌入式终端的多目标跟踪方法及其系统 |
CN113470076A (zh) * | 2021-07-13 | 2021-10-01 | 南京农业大学 | 一种平养鸡舍黄羽鸡多目标跟踪方法 |
Non-Patent Citations (4)
Title |
---|
任珈民;宫宁生;韩镇阳;: "基于YOLOv3与卡尔曼滤波的多目标跟踪算法", 计算机应用与软件, no. 05, 12 May 2020 (2020-05-12) * |
叶碎高;彭勇;周惠成;: "基于PSO参数辨识SVM的中长期径流预测研究", 大连理工大学学报, no. 01, 15 January 2011 (2011-01-15) * |
易诗;沈练;周思尧;朱竞铭;袁学松;: "基于增强型Tiny-YOLOV3模型的野鸡识别方法", 农业工程学报, no. 13, 8 July 2020 (2020-07-08) * |
许志鹏;桑庆兵;: "基于轻量级YOLOv3的拉链缺陷检测系统设计与实现", 现代计算机, no. 26, 15 September 2020 (2020-09-15) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI790957B (zh) * | 2022-04-06 | 2023-01-21 | 淡江大學學校財團法人淡江大學 | 一種多目標追蹤的高速數據關聯方法 |
CN116563347A (zh) * | 2023-07-04 | 2023-08-08 | 广东海洋大学 | 一种基于组合模型的蜂王轨迹追踪方法、系统及装置 |
CN117152689A (zh) * | 2023-10-31 | 2023-12-01 | 易启科技(吉林省)有限公司 | 一种基于视觉的河道目标检测方法及系统 |
CN117152689B (zh) * | 2023-10-31 | 2024-01-19 | 易启科技(吉林省)有限公司 | 一种基于视觉的河道目标检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114022812B (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114022812B (zh) | 一种基于轻量化SSD的DeepSort水面漂浮物多目标跟踪方法 | |
CN108765506B (zh) | 基于逐层网络二值化的压缩方法 | |
CN109559297B (zh) | 一种基于三维区域生成网络的肺结节检测的方法 | |
CN114254561A (zh) | 一种内涝预测方法、系统及存储介质 | |
US20240012965A1 (en) | Steady flow prediction method in plane cascade based on generative adversarial network | |
CN109871749B (zh) | 一种基于深度哈希的行人重识别方法和装置、计算机系统 | |
CN111178206A (zh) | 一种基于改进yolo的建筑预埋件检测方法及系统 | |
CN112541532B (zh) | 基于密集连接结构的目标检测方法 | |
CN114170512A (zh) | 基于网络剪枝和参数量化结合的遥感sar目标检测方法 | |
CN117117859B (zh) | 基于神经网络的光伏发电功率预测方法及系统 | |
CN115131760B (zh) | 一种基于改进特征匹配策略的轻量级车辆追踪方法 | |
CN109902697A (zh) | 多目标检测方法、装置及移动终端 | |
CN113257357B (zh) | 蛋白质残基接触图预测方法 | |
CN116612378B (zh) | 一种基于ssd改进的不平衡数据及复杂背景下水下小目标检测方法 | |
CN112149612A (zh) | 一种基于深度神经网络的海洋生物识别系统及识别方法 | |
CN111858565B (zh) | 一种基于线段聚类的多维度高精度航迹智能预测方法 | |
CN118675031A (zh) | 一种隧道围岩风化程度的智能评估方法 | |
Liu et al. | A multi-scale feature pyramid SAR ship detection network with robust background interference | |
Wu et al. | Unmanned Ship Identification Based on Improved YOLOv8s Algorithm | |
CN116205918A (zh) | 基于图卷积的多模态融合半导体检测方法、装置及介质 | |
CN117877587A (zh) | 一种全基因组预测模型的深度学习算法 | |
CN114283323A (zh) | 一种基于图像深度学习的海上目标识别系统 | |
CN116758363A (zh) | 一种权重自适应与任务解耦的旋转目标检测器 | |
CN113128362A (zh) | 一种基于yolov3的无人机视角下小目标快速检测方法 | |
Cao et al. | Improved YOLOv3 model based on ResNeXt for target detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |