CN115797794A - 基于知识蒸馏的卫星视频多目标跟踪方法 - Google Patents

基于知识蒸馏的卫星视频多目标跟踪方法 Download PDF

Info

Publication number
CN115797794A
CN115797794A CN202310057656.6A CN202310057656A CN115797794A CN 115797794 A CN115797794 A CN 115797794A CN 202310057656 A CN202310057656 A CN 202310057656A CN 115797794 A CN115797794 A CN 115797794A
Authority
CN
China
Prior art keywords
layer
student
teacher
network
knowledge distillation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310057656.6A
Other languages
English (en)
Inventor
张文华
邓文静
崔振
刘嘉
许春燕
张桐
李勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202310057656.6A priority Critical patent/CN115797794A/zh
Publication of CN115797794A publication Critical patent/CN115797794A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于知识蒸馏的卫星视频多目标跟踪方法,包括以下步骤:构造专门用于目标检测的教师网络;构造用于多目标跟踪的学生网络;结合教师网络和学生网络构建知识蒸馏模块;根据知识蒸馏损失和已有损失优化学生网络模型;结合目标检测结果,输出多目标跟踪结果。本发明的优点在于将知识蒸馏技术应用于卫星视频的多目标跟踪,利用专门用于目标检测的教师网络指导学生网络学习,提升了学生网络检测的泛化能力,可适用于卫星视频中的多目标跟踪问题。

Description

基于知识蒸馏的卫星视频多目标跟踪方法
技术领域
本发明属于多目标跟踪领域,具体涉及一种基于知识蒸馏的卫星视频多目标跟踪方法。
背景技术
多目标跟踪中既要面对在单目标跟踪中存在的遮挡、变形、运动模糊、拥挤场景、快速运动、光照变化、尺度变化等挑战,还要面对如轨迹的初始化与终止、相似目标间的相互干扰等复杂问题。因此,多目标跟踪是图像处理中的一个极具挑战性的方向。遥感视频中的多目标跟踪相较于通常的多目标跟踪存在以下特点:(1)成像幅宽不同,不同于监控视频对日常场景的成像,遥感视频卫星可以对较大范围实现持续成像。以“吉林一号”为例,成像幅宽达到4.6km*3.4km,巨大的成像幅宽使得运动目标更为多样,环境更加复杂;(2)目标尺度不同,遥感视频影像中的典型动目标主要以飞机、舰船为主。在巨大的成像幅宽下,此类典型动目标的像素值只占到总像素数的5%甚至更小的比例,只依靠卷积神经网络无法实现对目标的检测跟踪。
通常的MOT范式分为Detection Based Tracking(DBT)和Joint Detection andTracking(JDT)。如SORT、DeepSORT属于DBT范式的典型代表,SORT算法将当前帧目标的位置作为输入,利用卡尔曼滤波器粗略预测目标在下一帧的位置,再使用匈牙利算法来将预测结果与检测框进行匹配。DeepSORT在此基础上引入了外观模型,通过目标重识别网络来提取目标的外观特征,并于目标的运动特征相结合,共同用于数据关联,一定程度上减少了ID切换次数,提高跟踪精度。IOU-Tracker同样使用交并比(Intersection-over-Union,IOU)作为关联时的度量指标,后续的VIOU-Tracktor在其基础上增加了一个视觉单目标跟踪器(Single Object Tracking,SOT),以解决目标运动过快而导致的跟踪失效的问题。对于未被匹配的轨迹,利用SOT进行跟踪,并于后续检测结果进行匹配,若在一段时间内匹配成功,则恢复跟踪轨迹,否则停止跟踪。对于新初始化的跟踪,利用SOT进行反向跟踪,若与某条轨迹重合,则合并。目前多数研究者尝试从使用图范式建模多目标跟踪问题,将不同时间帧的检测作为节点,节点之间的连接作为预测得到的轨迹。如Learning a neural solver formultiple object tracking假设各个节点之间均相连,预测每条边的值(0或1),将节点的多分类问题转化为边的二分类问题。
JDT将检测和跟踪框架合并为一个统一的框架,故跟踪预测框架和检测框架可以同步进行参数更新,获得更好的效果。例如,Wang等人提出的JDE将检测和外观特征提取模块合并,不再使用单独的重识别模型获取目标表征信息,且提取的外观特征可以用于后续的关联匹配。Bergmann等人提出的Tracktor网络直接利用了Faster R-CNN中的边界框回归模块来预测跟踪结果,从而去掉了专门的跟踪预测模块。Peng等人提出的CTracker网络设计了一种端到端的在线多目标跟踪模型,它将跟踪预测中的数据关联问题转变成成对目标检测问题。Han等人提出的MAT利用多种运动学模型的信息来进行轨迹预测。CenterTrack使用CenterNet作为检测器,输入前一帧的热图,预测后一帧目标的位置、大小和相对偏移量,从而实现轨迹。FairMOT同样使用CenterNet作为检测网络,并在其基础上添加了Reid分支,认为无锚框的检测器有利于提取更有区分度的行人特征,可以在一定程度上解决重叠行人的识别问题。
发明内容
本发明的目的在于提供一种基于知识蒸馏的卫星视频多目标跟踪方法,利用教师网络提取的特征对学生网络提取的特征进行知识蒸馏,从而提高学生网络对特征的提取能力。
实现本发明目的的技术解决方案为:第一方面,本发明提供一种基于知识蒸馏的卫星视频多目标跟踪方法,包括以下步骤:
第一步,构建用于目标检测的教师网络,在训练集上充分训练优化模型参数后输入卫星视频图像,经过若干卷积层得到教师层特征图;
第二步,构建用于多目标跟踪的学生网络,网络的输入为与教师网络同样的数据图像,经过若干卷积层得到学生层特征图;
第三步,构建知识蒸馏模块,分别输入教师层和学生层的特征图,输出学生网络的知识蒸馏损失;
第四步,优化学生网络的目标检测网络参数,将知识蒸馏损失添加到整体损失当中,利用随机梯度下降方法优化网络参数;
第五步,从优化后的学生网络中得到目标检测输出,输出多目标跟踪结果。
第二方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法的步骤。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法的步骤。
本发明与现有技术相比,其显著特点在于:(1)选用专门用于目标检测的网络作为教师模型,多目标跟踪网络作为学生模型;(2)分别提取教师网络和学生网络的特征层,对教师层特征和学生层特征进行知识蒸馏;(3)定义知识蒸馏损失函数计算教师层特征和学生层特征之间的特征差异,优化学生网络的特征提取网络参数,输出更好的目标检测输出,进而提升多目标跟踪性能。
下面结合附图对本发明作进一步详细描述。
附图说明
图1是本发明的流程图。
图2是本发明提出的知识蒸馏网络结构。
图3(a)~图3(e)是本发明实施例中的多目标跟踪结果可视化示意图。
具体实施方式
本发明提出一种基于知识蒸馏的卫星视频多目标跟踪方法,具体是通过选择强大的教师网络对学生网络的目标检测结果进行特征蒸馏,计算特征蒸馏损失与已有损失共同训练网络参数,最终得到泛化能力更强的目标检测结果进而提升多目标跟踪效果,该技术适用于卫星视频的多目标跟踪任务。结合图1、图2,该方法包括如下步骤:
第一步,构建专门用于目标检测的教师网络,在训练集上充分训练优化模型参数后输入卫星视频图像,经过若干卷积层得到教师层特征图;
第二步,构建用于多目标跟踪的学生网络,网络的输入为与教师网络同样的数据图像,经过若干卷积层得到学生层特征图;
第三步,根据教师层和学生层的特征图构建知识蒸馏模块,分别输入教师层和学生层的特征图,输出用于指导学生网络的知识蒸馏损失,提升学生网络的检测性能;具体过程如下:
(1)分别将每一个学生层特征投影至不同教师层所在特征空间,将学生层特征
Figure SMS_1
投影至教师层特征
Figure SMS_2
同空间得到新的学生层特征
Figure SMS_3
Figure SMS_4
其中
Figure SMS_5
表示学生层的输出特征,b表示实例数,
Figure SMS_6
分别表示学生层的通道数以及高和宽,
Figure SMS_7
Figure SMS_8
分别表示学生层和教师层输出的L个特征层,
Figure SMS_9
表示投影函数,依次由一个1x1,3x3和1x1的卷积实现;
(2)利用自注意力机制分别计算各个教师层特征、学生层特征和自身的成对相似矩阵作为语义相似度度量:
Figure SMS_10
其中
Figure SMS_11
表示教师层特征
Figure SMS_12
的语义相似度,
Figure SMS_13
表示学生层特征
Figure SMS_14
的语义相似度,
Figure SMS_15
表示reshape操作,将特征层转换为特征向量;通过计算各个特征层的语义相似度可构造成对相似度矩阵;
(3)为了减少噪声和稀疏的影响,利用MLP将教师层和学生层特征投影至子空间,得到query和key向量,对特征层中的第i个实例,输入教师层特征和学生层特征的语义相似度
Figure SMS_16
Figure SMS_17
得到:
Figure SMS_18
Figure SMS_19
其中
Figure SMS_20
Figure SMS_21
分别表示用于生成query和key向量的MLP,
Figure SMS_22
Figure SMS_23
分别表示对第i个实例生成的query和key向量,且由各个实例共享;
(4)利用注意力分配机制计算各个教师层与学生层之间的特征相似度作为各个教师层特征对学生层特征之间的权重系数,即归一化处理学生层
Figure SMS_24
对每一个教师层
Figure SMS_25
的注意力权重;教师层
Figure SMS_26
对学生层特征
Figure SMS_27
的权重系数
Figure SMS_28
计算如下:
Figure SMS_29
其中i表示特征层中的第i个实例,总数为b;
(5)根据教师层和学生层之间特征的平均误差加权求和计算知识蒸馏损失:
Figure SMS_30
Figure SMS_31
其中使用Mean Squared Error(简称MSE)方法作为计算教师层特征
Figure SMS_32
和学生层特征
Figure SMS_33
之间的距离Dist的算法,并使用之前计算的权重系数
Figure SMS_34
对两者特征之间的MSE距离计算加权平均。
通过最小化
Figure SMS_35
可以最小化学生网络和教师网络输出特征之间的误差,指导学生网络向更加强大的教师网络学习对目标特征的提取能力,使其同时收到教师网络提取特征和真实标签框特征的约束,从而提升学生网络的检测能力。
第四步,优化学生网络的目标检测网络参数,将知识蒸馏损失添加到学生网络的整体损失函数当中优化网络参数,对于输入的单个图像
Figure SMS_36
,W表示图像的宽度,H表示图像的高度,3表示图像的RGB三个颜色通道,整体损失函数如下:
Figure SMS_37
Figure SMS_38
Figure SMS_39
Figure SMS_40
其中,
Figure SMS_43
表示focal损失,
Figure SMS_46
是与标注物体对应的真实热图,C表示目标总类别数,R为一个下采样因子,值为4,
Figure SMS_49
则表示在第c个类别的(x,y)位置的热图,N表示物体总数,α和β为该损失的超参数;
Figure SMS_42
使用回归方法表示预测框的尺寸损失,对于位于
Figure SMS_44
的第i个物体,
Figure SMS_47
Figure SMS_50
分别表示目标框和预测框尺寸;
Figure SMS_41
使用L1损失进一步回归到细化的中心局部位置的位置损失,
Figure SMS_45
Figure SMS_48
分别表示预测框和真实框的中心点位置。
第五步,从优化后的学生网络中得到目标检测输出,在此基础上进一步输出多目标跟踪结果。
本发明以知识蒸馏技术对教师网络和学生网络的输出层特征进行知识蒸馏。该方法可有效提升学生网络目标检测部分的泛化性能,得到更准确的目标检测输出,进而提升多目标跟踪的性能。
本发明的效果可通过以下仿真实验进一步说明:
(1)仿真条件
仿真实验采用3个卫星视频数据集:SkySat,AIR飞机类和船类,其中AIR飞机类和船类分别是提取AIR原始数据集中包含有飞机或船目标的数据集,称为AIR-aircraft和AIR-ship,AIR-aircraft数据集的背景大多为不同飞机场和极少数海面背景,AIR-ship数据集的背景包括港口、海面等。SkySat数据集只有单一car类别,主要任务是街道场景的车辆识别,环境背景相对单一且数据量较少。将上述三个数据集按照近似1:1概率分为训练集和测试集,实验时默认设置输入图像大小为640x640。由于卫星视频中的目标尺度小,成像幅度大导致环境背景复杂,导致多目标跟踪算法的检测难题。我们将添加知识蒸馏技术与原方法进行了比较,仿真实验均在Linux操作系统下使用机器为amd64和GeForceRTX2080TiGPU,配置环境为CUDA10.2下使用Pytorch1.11和python3.8,程序使用python与VisualStudioCode进行编写。学生和教师网络各自的参数遵循默认参数设置,知识蒸馏损失使用系数0.1添加到学生网络的整体损失当中。
本发明采用的评价指标是多目标跟踪准确度(MOTA,Multiple Object TrackingAccuracy),多目标跟踪精度(MOTP,Multiple Object Tracking Precision),正确身份标签被赋予的检测框与平均ground truth和计算的检测数量的比值(IDF1,ID F1 Score),目标ID切换的次数(IDs,ID Switch),大多数目标被跟踪的轨迹数量(MT,Mostly Tracked),大多数目标被跟丢的轨迹数量(ML,Mostly Lost),误检数量(FP,False Positive),漏检数量(FN,False Negative)。
(2)仿真内容
本发明采用三种卫星视频数据集检验算法的性能。为测试本发明算法的性能,将提出的基于知识蒸馏的卫星视频多目标跟踪方法与原多目标跟踪方法(baseline)对比。
(3)仿真实验结果分析
表1为三种数据集下在不同算法下的不同评价指标的对比结果,由表1可以看出,在卫星视频数据集中,本发明所提出的基于知识蒸馏的多目标跟踪方法,凭借教师网络对特征提取的鲁棒性,可以很好地指导学生网络的特征提取,提升检测和跟踪的准确度,与baseline相比对于SkySat和AIR-ship等环境背景较为复杂的数据集中,我们提出的方法在不同的评价指标中的精度都有所提升,对于AIR-aircraft数据集的IDs指标也有显著提升。以上实验结果表明了本发明方法的有效性。
表1 卫星视频数据集的不同算法定量评价
Figure SMS_51
此外图3(a)~图3(e)分别展示了我们的两种多目标跟踪方法的可视化结果(左侧为baseline,右侧为我们提出的方法),图3(a)展示了我们提出的方法可以有效减少目标的ID切换次数,图3(b)和图3(c)显示我们提出的方法检测出的目标数要多于baseline,由图3(d)可以看出我们提出的方法在一定程度上可以减少模型误检的个数,图3(e)左右两幅图差别不大,与表1相一致。综上可知,利用教师网络提取的特征对学生网络提取的特征进行知识蒸馏可以有效指导学生网络获得精确度更高的检测结果,一定程度上减弱了原网络的漏检和误检问题,进一步体现在多目标跟踪任务上,有效且准确的目标框可以减少ID切换的次数,提升多目标跟踪性能。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (5)

1.一种基于知识蒸馏的卫星视频多目标跟踪方法,其特征在于,包括以下步骤:
第一步,构建用于目标检测的教师网络,在训练集上充分训练优化模型参数后输入卫星视频图像,经过若干卷积层得到教师层特征图;
第二步,构建用于多目标跟踪的学生网络,网络的输入为与教师网络同样的数据图像,经过若干卷积层得到学生层特征图;
第三步,构建知识蒸馏模块,分别输入教师层和学生层的特征图,输出学生网络的知识蒸馏损失;
第四步,优化学生网络的目标检测网络参数,将知识蒸馏损失添加到整体损失当中,利用随机梯度下降方法优化网络参数;
第五步,从优化后的学生网络中得到目标检测输出,输出多目标跟踪结果。
2.根据权利要求1所述的基于知识蒸馏的卫星视频多目标跟踪方法,其特征在于,第三步根据教师层和学生层的特征图构建知识蒸馏模块,具体过程如下:
(1)分别将每一个学生层特征投影至不同教师层所在特征空间,将学生层特征
Figure QLYQS_1
投影至教师层特征
Figure QLYQS_2
同空间得到新的学生层特征
Figure QLYQS_3
Figure QLYQS_4
其中
Figure QLYQS_5
表示学生层的输出特征,b表示实例数,
Figure QLYQS_6
分别表示学生层的通道数以及高和宽,
Figure QLYQS_7
Figure QLYQS_8
分别表示学生层和教师层输出的L个特征层,
Figure QLYQS_9
表示投影函数,依次由一个1x1,3x3和1x1的卷积实现;
(2)利用自注意力机制分别计算各个教师层特征、学生层特征和自身的成对相似矩阵作为语义相似度度量:
Figure QLYQS_10
其中
Figure QLYQS_11
表示教师层特征
Figure QLYQS_12
的语义相似度,
Figure QLYQS_13
表示学生层特征
Figure QLYQS_14
的语义相似度,
Figure QLYQS_15
表示reshape操作,将特征层转换为特征向量;通过计算各个特征层的语义相似度可构造成对相似度矩阵;
(3)利用MLP将教师层和学生层特征投影至子空间,得到query和key向量,对特征层中的第i个实例,输入教师层特征和学生层特征的语义相似度
Figure QLYQS_16
Figure QLYQS_17
得到:
Figure QLYQS_18
Figure QLYQS_19
其中
Figure QLYQS_20
Figure QLYQS_21
分别表示用于生成query和key向量的MLP,
Figure QLYQS_22
Figure QLYQS_23
分别表示对第i个实例生成的query和key向量,且由各个实例共享;
(4)利用注意力分配机制计算各个教师层与学生层之间的特征相似度作为各个教师层特征对学生层特征之间的权重系数,即归一化处理学生层
Figure QLYQS_24
对每一个教师层
Figure QLYQS_25
的注意力权重;教师层
Figure QLYQS_26
对学生层特征
Figure QLYQS_27
的权重系数
Figure QLYQS_28
计算如下:
Figure QLYQS_29
其中i表示特征层中的第i个实例,总数为b;
(5)根据教师层和学生层之间特征的平均误差加权求和计算知识蒸馏损失:
Figure QLYQS_30
Figure QLYQS_31
其中使用MSE方法作为计算教师层特征
Figure QLYQS_32
和学生层特征
Figure QLYQS_33
之间的距离Dist的算法,并使用之前计算的权重系数
Figure QLYQS_34
对两者特征之间的MSE距离计算加权平均。
3.根据权利要求2所述的基于知识蒸馏的卫星视频多目标跟踪方法,其特征在于,第四步,将知识蒸馏损失添加到学生网络的整体损失函数当中优化网络参数,对于输入的单个图像
Figure QLYQS_35
,W表示图像的宽度,H表示图像的高度,3表示图像的RGB三个颜色通道,整体损失函数如下:
Figure QLYQS_36
Figure QLYQS_37
Figure QLYQS_38
Figure QLYQS_39
其中,
Figure QLYQS_42
表示focal损失,
Figure QLYQS_44
是与标注物体对应的真实热图,C表示目标总类别数,R为一个下采样因子,
Figure QLYQS_47
则表示在第c个类别的(x,y)位置的热图,N表示物体总数,α和β为该损失的超参数;
Figure QLYQS_41
使用回归方法表示预测框的尺寸损失,对于位于
Figure QLYQS_45
的第i个物体,
Figure QLYQS_48
Figure QLYQS_49
分别表示目标框和预测框尺寸;
Figure QLYQS_40
使用L1损失进一步回归到细化的中心局部位置的位置损失,
Figure QLYQS_43
Figure QLYQS_46
分别表示预测框和真实框的中心点位置。
4.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-3中任一所述的基于知识蒸馏的卫星视频多目标跟踪方法的步骤。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一所述的基于知识蒸馏的卫星视频多目标跟踪方法的步骤。
CN202310057656.6A 2023-01-17 2023-01-17 基于知识蒸馏的卫星视频多目标跟踪方法 Pending CN115797794A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310057656.6A CN115797794A (zh) 2023-01-17 2023-01-17 基于知识蒸馏的卫星视频多目标跟踪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310057656.6A CN115797794A (zh) 2023-01-17 2023-01-17 基于知识蒸馏的卫星视频多目标跟踪方法

Publications (1)

Publication Number Publication Date
CN115797794A true CN115797794A (zh) 2023-03-14

Family

ID=85429688

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310057656.6A Pending CN115797794A (zh) 2023-01-17 2023-01-17 基于知识蒸馏的卫星视频多目标跟踪方法

Country Status (1)

Country Link
CN (1) CN115797794A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200302295A1 (en) * 2019-03-22 2020-09-24 Royal Bank Of Canada System and method for knowledge distillation between neural networks
CN112884742A (zh) * 2021-02-22 2021-06-01 山西讯龙科技有限公司 一种基于多算法融合的多目标实时检测、识别及跟踪方法
CN113469118A (zh) * 2021-07-20 2021-10-01 京东科技控股股份有限公司 多目标行人跟踪方法及装置、电子设备、存储介质
CN113610126A (zh) * 2021-07-23 2021-11-05 武汉工程大学 基于多目标检测模型无标签的知识蒸馏方法及存储介质
CN115100238A (zh) * 2022-05-24 2022-09-23 北京理工大学 基于知识蒸馏的轻量化单目标跟踪器训练方法
CN115271063A (zh) * 2022-07-07 2022-11-01 清华大学深圳国际研究生院 基于特征原型投影的类间相似性知识蒸馏方法与模型
CN115424177A (zh) * 2022-09-02 2022-12-02 哈尔滨工程大学 一种基于增量学习的孪生网络目标跟踪的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200302295A1 (en) * 2019-03-22 2020-09-24 Royal Bank Of Canada System and method for knowledge distillation between neural networks
CN112884742A (zh) * 2021-02-22 2021-06-01 山西讯龙科技有限公司 一种基于多算法融合的多目标实时检测、识别及跟踪方法
CN113469118A (zh) * 2021-07-20 2021-10-01 京东科技控股股份有限公司 多目标行人跟踪方法及装置、电子设备、存储介质
CN113610126A (zh) * 2021-07-23 2021-11-05 武汉工程大学 基于多目标检测模型无标签的知识蒸馏方法及存储介质
CN115100238A (zh) * 2022-05-24 2022-09-23 北京理工大学 基于知识蒸馏的轻量化单目标跟踪器训练方法
CN115271063A (zh) * 2022-07-07 2022-11-01 清华大学深圳国际研究生院 基于特征原型投影的类间相似性知识蒸馏方法与模型
CN115424177A (zh) * 2022-09-02 2022-12-02 哈尔滨工程大学 一种基于增量学习的孪生网络目标跟踪的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DEFANG CHEN 等: "Cross-Layer Distillation with Semantic Calibration" *
XINGYI ZHOU 等: "Objects as Points" *
李玺 等: "深度学习的目标跟踪算法综述" *
陈诗琪 等: "特征图知识蒸馏引导的轻量化任意方向SAR舰船目标检测器" *

Similar Documents

Publication Publication Date Title
Mane et al. Moving object detection and tracking using convolutional neural networks
Zhang et al. Multiscale semantic fusion-guided fractal convolutional object detection network for optical remote sensing imagery
Wang et al. Gaussian focal loss: Learning distribution polarized angle prediction for rotated object detection in aerial images
Hu et al. Face Detection based on SSD and CamShift
Boumediene et al. Multi-ROI association and tracking with belief functions: application to traffic sign recognition
Gao et al. Tracking video objects with feature points based particle filtering
CN113129336A (zh) 一种端到端多车辆跟踪方法、系统及计算机可读介质
CN114627339B (zh) 茂密丛林区域对越境人员的智能识别跟踪方法及存储介质
Yang et al. Online multi-object tracking using KCF-based single-object tracker with occlusion analysis
Zhang et al. Spatiotemporal adaptive attention 3D multiobject tracking for autonomous driving
CN117630860A (zh) 一种毫米波雷达的手势识别方法
Moridvaisi et al. An extended KCF tracking algorithm based on TLD structure in low frame rate videos
Lu et al. Hybrid deep learning based moving object detection via motion prediction
Lokkondra et al. DEFUSE: deep fused end-to-end video text detection and recognition
Wang et al. Vehicle key information detection algorithm based on improved SSD
Badal et al. Online multi-object tracking: multiple instance based target appearance model
CN116245913A (zh) 基于层次化上下文引导的多目标跟踪方法
CN115797794A (zh) 基于知识蒸馏的卫星视频多目标跟踪方法
CN115100565A (zh) 一种基于空间相关性与光流配准的多目标跟踪方法
Liao et al. Multi-scale ship tracking based on maritime monitoring platform
Zhao et al. Forward vehicle detection based on deep convolution neural network
Cui et al. SDA-Net: a detector for small, densely distributed, and arbitrary-directional ships in remote sensing images
Maharani et al. Deep features fusion for KCF-based moving object tracking
Zhang et al. A deep learning filter for visual drone single object tracking
Zhu et al. Automatic refinement strategies for manual initialization of object trackers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230314

RJ01 Rejection of invention patent application after publication