WO2021036373A1

WO2021036373A1 - 目标跟踪方法、装置和计算机可读存储介质

Info

Publication number: WO2021036373A1
Application number: PCT/CN2020/092556
Authority: WO
Inventors: 朱兆琪; 董玉新; 陈宇
Original assignee: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2019-08-27
Filing date: 2020-05-27
Publication date: 2021-03-04
Also published as: CN111798487A

Abstract

本公开涉及一种目标跟踪方法、装置和计算机可读存储介质，涉及计算机技术领域。本公开的方法包括：获取视频的当前帧中目标的位置信息；根据当前帧中目标的位置信息确定视频的下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分；在下一帧的目标对应的检测区域中检测目标；将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

Description

目标跟踪方法、装置和计算机可读存储介质

相关申请的交叉引用

本申请是以CN申请号为201910794278.3，申请日为2019年8月27日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及计算机技术领域，特别涉及一种目标跟踪方法、装置和计算机可读存储介质。

背景技术

目标跟踪技术是目前计算机视觉领域的一个重要研究方向。目标跟踪技术可以应用于视频监控、人机交互、无人驾驶等各个领域。

目标跟踪是在连续的视频帧中，确定所要跟踪的目标以及各个帧中目标的位置，从而得到目标的运动轨迹。

发明内容

发明人发现：目前一些目标跟踪算法中，对于每一帧图像都是在该帧的全局图像中检测目标，导致检测和目标跟踪效率较低，时间较长。

本公开所要解决的一个技术问题是：如何提高目标跟踪过程中对目标进行检测和跟踪的效率。

根据本公开的一些实施例，提供的一种目标跟踪方法，包括：获取视频的当前帧中目标的位置信息；根据当前帧中目标的位置信息确定视频的下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分；在下一帧的目标对应的检测区域中检测目标；将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

在一些实施例中，目标的位置信息包括目标的边界框的坐标信息，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域包括：根据当前帧中目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定当前帧中目标的边界框扩展后的坐标信息；根据当前帧中目标的边界框扩展后的坐标信息，在下一帧中将相同坐标信息所表示的区域作为目标对应的检测区域。

在一些实施例中，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域包括：确定当前帧的前一帧中目标的位置信息和当前帧中目标的位置信息的差距；在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域。

在一些实施例中，目标的位置信息包括：目标的边界框的中心点坐标信息；前一帧中目标的位置信息和当前帧中目标的位置信息的差距为前一帧中目标的边界框的中心点和当前帧中目标的边界框的中心点的距离。

在一些实施例中，在下一帧的目标对应的检测区域中检测目标包括：将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息；在一个或多个边界框为一个的情况下，将边界框中的图像确定为目标；在一个或多个边界框为多个的情况下，针对每个边界框，将边界框的位置信息和当前帧中目标的位置信息进行比对，在该边界框的位置信息和当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。

根据本公开的另一些实施例，提供的一种目标跟踪方法，包括：获取视频的当前帧中目标的位置信息；确定当前帧的前一帧中目标的位置信息和当前帧中目标的位置信息的差距；在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分，在下一帧的目标对应的检测区域中检测目标；在前一帧中目标的位置信息和当前帧中目标的位置信息的差距大于第一预设差距的情况下，在下一帧的全局图像中检测目标；将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

根据本公开的又一些实施例，提供的一种目标跟踪装置，包括：信息获取模块，用于获取视频的当前帧中目标的位置信息；检测区域确定模块，用于根据当前帧中目标的位置信息确定视频的下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分；目标检测模块，用于在下一帧的目标对应的检测区域中检测目标；信息关联模块，用于将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

在一些实施例中，目标的位置信息包括目标的边界框的坐标信息；检测区域确定模块用于根据当前帧中目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定当前帧中目标的边界框扩展后的坐标信息，根据当前帧中目标的边界框扩展后的坐标信息，在下一帧中将相同坐标信息所表示的区域作为目标对应的检测区域。

在一些实施例中，检测区域确定模块用于确定当前帧的前一帧中目标的位置信息和当前帧中目标的位置信息的差距，在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域。

在一些实施例中，目标检测模块用于将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息；在一个或多个边界框为一个的情况下，将边界框中的图像确定为目标；在一个或多个边界框为多个的情况下，针对每个边界框，将边界框的位置信息和当前帧中目标的位置信息进行比对，在该边界框的位置信息和当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。

根据本公开的再一些实施例，提供的一种目标跟踪装置，包括：获取模块，用于获取视频的当前帧中目标的位置信息；差距确定模块，用于确定当前帧的前一帧中目标的位置信息和当前帧中目标的位置信息的差距；第一检测模块，用于在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分，在下一帧的目标对应的检测区域中检测目标；第二检测模块，用于在前一帧中目标的位置信息和当前帧中目标的位置信息的差距大于第一预设差距的情况下，在下一帧的全局图像中检测目标；关联模块，用于将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

在一些实施例中，第一检测模块用于根据当前帧中目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定当前帧中目标的边界框扩展后的坐标信息；根据当前帧中目标的边界框扩展后的坐标信息，在下一帧中将相同坐标信息所表示的区域作为目标对应的检测区域。

在一些实施例中，第一检测模块用于将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息；在一个或多个边界框为一个的情况下，将边界框中的图像确定为目标；在一个或多个边界框为多个的情况下，针对每个边界框，将边界框的位置信息和当前帧中目标的位置信息进行比对，在该边界框的位置信息和当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。

根据本公开的又一些实施例，提供的一种目标跟踪装置，包括：存储器；以及耦接至存储器的处理器，处理器被配置为基于存储在存储器中的指令，执行如前述任意实施例的目标跟踪方法。

根据本公开的再一些实施例，提供的一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现前述任意实施例的目标跟踪方法。

本公开中基于视频的当前帧中目标的位置信息，从下一帧的全局图像中确定一部分为目标对应的检测区域，在目标对应的检测区域中对目标进行检测，实现对目标的跟踪。由于检测时只针对全局图像的一部分对目标进行检测，计算机处理的数据量减少了，因此提高了目标跟踪过程中对目标进行检测和跟踪的效率。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明被配置为解释本公开，并不构成对本公开的不当限定。在附图中：

图1示出本公开的一些实施例的目标跟踪方法的流程示意图。

图2示出本公开的一些实施例的确定目标检测区域的示意图。

图3示出本公开的另一些实施例的目标跟踪方法的流程示意图。

图4示出本公开的一些实施例的目标跟踪装置的结构示意图。

图5示出本公开的另一些实施例的目标跟踪装置的结构示意图。

图6示出本公开的又一些实施例的目标跟踪装置的结构示意图。

图7示出本公开的再一些实施例的目标跟踪装置的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

针对目前一些目标跟踪算法中，对于每一帧图像，都是在该帧的全局图像中检测目标，导致检测和目标跟踪效率较低，时间较长的问题，提出本方案。下面结合图1描述本公开的目标跟踪方法的一些实施例。

图1为本公开目标跟踪方法一些实施例的流程图。如图1所示，该实施例的方法包括：步骤S102～S108。

在步骤S102中，获取视频的当前帧中目标的位置信息。

摄像头在进行数据采集时是不断的采集图像帧，进而构成了视频流。例如，通过Opencv对摄像头的视频流进行解析，获取视频的各帧的信息，将各帧的图像进行目标检测及相关逻辑计算，从而实现对一个或多个目标(例如，人脸)的跟踪。在目标为多个的情况下，针对每个目标都可以执行本实施例中的方法。

目标的位置信息例如为目标的边界框(Bounding Box)的坐标信息。当前帧中目标的边界框可以是将当前帧的图像(可以是当前帧的全局图像，或者基于前一帧确定的当前帧的目标对应的检测区域的图像)输入预先训练的目标检测模型后，目标检测模型输出的结果。目标检测模型可以采用现有的模型，例如，目标为人脸的情况下，目标检测模型为cascade CNN(级联卷积神经网络)模型。目标检测模型也可以是其他模型，只要是在各帧的全局图像中进行目标检测的模型都可以应用本公开的方案进行优化，不限于所举示例。

在步骤S104中，根据当前帧中目标的位置信息确定视频的下一帧中目标对应的检测区域。

目标对应的检测区域可以属于下一帧的全局图像的一部分。在一些实施例中，根据当前帧中目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定当前帧中目标的边界框扩展后的坐标信息；根据当前帧中目标的边界框扩展后的坐标信息，在下一帧中将相同坐标信息所表示的区域作为目标对应的检测区域。

如图2所示，确定了当前帧100中目标102的边界框104后，将当前帧100中的目标102的边界框104按照预设扩展长度和预设扩展宽度进行扩展，得到扩展后的边界框106，根据扩展后的边界框106坐标信息将下一帧200中相同位置的图像作为目标102对应的检测区域108。预设扩展长度和预设扩展宽度可以是根据目标的移动速度，当前帧和下一帧的时间间隔确定的。例如，可以统计不同类别的目标对应的最大移动速度，确定当前帧中目标的最大移动速度与当前帧和下一帧的时间间隔的乘积。将当前帧中目标的边界框沿着长度的两个方向分别扩展与该乘积值相等的长度，将当前帧中目标的边界框沿着宽度的两个方向分别扩展与该乘积值相等的宽度。不同类别的目标可以对应不同的预设扩展长度和预设扩展宽度。

由于不同帧之间的间隔时间很短，目标的移动距离也会较短，因此，按照上述方式确定下一帧中目标检测区域较为准确。

在步骤S106中，在下一帧的目标对应的检测区域中检测目标。

可以从下一帧的全局图像中进行抠图，将目标对应的检测区域的图像提取出来。在一些实施例中，将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息。在一个或多个边界框为一个的情况下，将边界框中的图像确定为目标。

如果仅对一个目标进行跟踪，且目标检测模型输出的边界框仅有一个，可以直接将边界框中的图像确定为该目标。也可以进一步将边界框中图像的特征与当前帧中目标的特征进行比对，确定边界框中的图像是否为该目标。

在一些实施例中，将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息；在一个或多个边界框为多个的情况下，针对每个边界框，将边界框的位置信息和当前帧中目标的位置信息进行比对，在该边界框的位置信息和当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。

基于相邻帧之间目标的位置移动不会太大的原理，将下一帧中每个边界框的位置信息和当前帧中每个目标的位置信息进行比对，从而确定各个边界框分别为哪一个目标，可以提高目标确定的效率。针对每个边界框和当前帧中每个目标，可以计算边界框中心的坐标与当前帧中目标的边界框中心的坐标的距离，作为该边界框位置信息和当前帧中该目标的位置信息的差距。第二预设差距例如根据目标的移动速度，当前帧和下一帧的时间间隔确定。

也可以将每个边界框中图像的特征和当前帧中每个目标的特征进行比对，确定各个边界框对应的目标。图像的特征和目标的特征可以由目标检测模型提取。可以根据每个边界框中图像的特征向量和当前帧中每个目标的特征向量的距离，确定各个边界框对应的目标。

在目标对应的检测区域中检测目标的位置信息后，可以将检测区域中目标的位置信转换为下一帧全局图像目标的位置信息。即将目标的边界框的坐标信息由检测区域进行坐标转换，转换为下一帧的全局图像中目标的边界框的坐标信息，以便确定各帧中目标的位置信息，实现对目标的跟踪。

在步骤S108中，将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

目标的信息例如为目标的标识(ID、名称等)，还可以包括目标的描述信息。例如，对人脸进行跟踪的情况下，可以把当前帧的人脸框属性(例如，人脸的性别、年龄、id号等)在下一帧中继承下来。

上述实施例的方法中基于视频的当前帧中目标的位置信息，从下一帧的全局图像中确定一部分为目标对应的检测区域，在目标对应的检测区域中对目标进行检测，实现对目标的跟踪。由于检测时只针对全局图像的一部分对目标进行检测，计算机处理的数据量减少了，因此提高了目标跟踪过程中对目标进行检测和跟踪的效率。

下面结合图3描述本公开目标跟踪算法的另一些实施例，相对于前述实施例可以进一步提高目标检测的准确度。

图3为本公开目标跟踪方法另一些实施例的流程图。如图3所示，该实施例的方法包括：针对一个或多个目标中的每一个，执行步骤S302～S314。

在步骤S302中，获取视频的当前帧中目标的位置信息和前一帧中目标的位置信息。

在步骤S304中，确定视频的前一帧中目标的位置信息和当前帧中目标的位置信息的差距。

在一些实施例中，目标位置信息包括：目标的边界框的中心点坐标信息。前一帧中目标的位置信息和当前帧中目标的位置信息的差距为前一帧中目标的边界框的中心点和当前帧中目标的边界框的中心点的距离。

例如，目标检测模型输出目标的边界框的坐标信息表示为(x,y,w,h)，(x,y)代表边界框框左上角点的位置坐标，w和h分别表示边界框的宽度和高度。当前帧假设为第k帧，k为正整数，当前帧中目标的边界框的坐标信息可以表示为(x ^k,y ^k,w ^k,h ^k)。则当前帧边界框的中心点坐标为

前一帧中边界框的坐标信息可以表示为(x ^k-1,y ^k-1,w ^k-1,h ^k-1)，前一帧中边界框的中心点坐标为

前一帧中边界框的中心点与当前帧中边界框的中心点的距离可以采用以下公式表示。

在步骤S306中，在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域。

即前一帧和当前帧中目标的位置如果变化不大，则在下一帧中确定目标对应检测区域。确定目标检测区域的方法可以参考前述实施例。

在步骤S308中，在下一帧的目标对应的检测区域中检测目标。

在步骤S310中，在前一帧中目标的位置信息和当前帧中目标的位置信息的差距大于第一预设差距的情况下，在下一帧的全局图像中检测目标

如果前一帧和当前帧中目标的位置变化较大，则在下一帧的全局图像中进行目标检测。这样可以避免目标位置变化大导致在目标检测区域中无法准确检测到该目标，进一步提高检测的准确性。

在步骤S312中，将下一帧中检测到的目标与当前帧中的目标的信息进行关联，以便对目标进行跟踪。

在步骤S314中，将下一帧更新为当前帧，返回步骤S302重新开始执行。

发明人经过实验得出本公开的目标跟踪算法，相对于现有的在全局图像中进行目标检测的跟踪算法，计算速度可以提高3-4倍。

上述实施例的方案，通过相邻帧之间目标的位置变化，确定在下一帧中在目标对应的检测区域或者在全局图像中对目标进行检测。上述实施例的方案能够在提高检测和跟踪效率的同时，保证检测的准确性。

本公开还提供一种目标跟踪装置，下面结合图4进行描述。

图4为本公开目标跟踪装置的一些实施例的结构图。如图4所示，该实施例的装置40包括：信息获取模块410，检测区域确定模块420，目标检测模块430，信息关联模块440。

信息获取模块410，用于获取视频的当前帧中目标的位置信息。

检测区域确定模块420，用于根据当前帧中目标的位置信息确定视频的下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分。

在一些实施例中，目标的位置信息包括：目标的边界框的坐标信息。检测区域确定模块420用于根据当前帧中目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定当前帧中目标的边界框扩展后的坐标信息，根据当前帧中目标的边界框扩展后的坐标信息，在下一帧中将相同坐标信息所表示的区域作为目标对应的检测区域。

在一些实施例中，检测区域确定模块420用于确定当前帧的前一帧中目标的位置信息和当前帧中目标的位置信息的差距，在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区。

在一些实施例中，目标的位置信息包括：目标的边界框的中心点坐标信息。前一帧中目标的位置信息和当前帧中目标的位置信息的差距为前一帧中目标的边界框的中心点和当前帧中目标的边界框的中心点的距离。

目标检测模块430，用于在下一帧的目标对应的检测区域中检测目标。

在一些实施例中，目标检测模块430用于将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息；在一个或多个边界框为一个的情况下，将边界框中的图像确定为目标；在一个或多个边界框为多个的情况下，针对每个边界框，将边界框的位置信息和当前帧中目标的位置信息进行比对，在该边界框的位置信息和当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。

信息关联模块440，用于将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

本公开还提供一种目标跟踪装置，下面结合图5进行描述。

图5为本公开目标跟踪装置的一些实施例的结构图。如图5所示，该实施例的装置50包括：获取模块510，差距确定模块520，第一检测模块530，第二检测模块540，关联模块550。

获取模块510，用于获取视频的当前帧中目标的位置信息；

差距确定模块520，用于确定当前帧的前一帧中目标的位置信息和当前帧中目标的位置信息的差距。

前一帧中目标的位置信息和当前帧中目标的位置信息的差距的计算方法可以参考前述实施例。在一些实施例中，目标的位置信息包括：目标的边界框的中心点坐标信息；前一帧中目标的位置信息和当前帧中目标的位置信息的差距为前一帧中目标的边界框的中心点和当前帧中目标的边界框的中心点的距离。

第一检测模块530，用于在前一帧中目标的位置信息和当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据当前帧中目标的位置信息确定下一帧中目标对应的检测区域，目标对应的检测区域属于下一帧的全局图像的一部分，在下一帧的目标对应的检测区域中检测目标。

目标对应的检测区域的确定方法可以参考前述实施例。在一些实施例中，第一检测模块530用于根据当前帧中目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定当前帧中目标的边界框扩展后的坐标信息；根据当前帧中目标的边界框扩展后的坐标信息，在下一帧中将相同坐标信息所表示的区域作为目标对应的检测区域。

在一些实施例中，第一检测模块530用于将下一帧的目标对应的检测区域的图像输入目标检测模型，得到目标检测模型输出的一个或多个边界框的位置信息；在一个或多个边界框为一个的情况下，将边界框中的图像确定为目标；在一个或多个边界框为多个的情况下，针对每个边界框，将边界框的位置信息和当前帧中目标的位置信息进行比对，在该边界框的位置信息和当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。

第二检测模块540，用于在前一帧中目标的位置信息和当前帧中目标的位置信息的差距大于第一预设差距的情况下，在下一帧的全局图像中检测目标。

关联模块550，用于将下一帧中检测到的目标与当前帧中目标的信息进行关联，以便对目标进行跟踪。

本公开的实施例中的目标跟踪装置可各由各种计算设备或计算机系统来实现，下面结合图6以及图7进行描述。

图6为本公开目标跟踪装置的一些实施例的结构图。如图6所示，该实施例的装置60包括：存储器610以及耦接至该存储器610的处理器620，处理器620被配置为基于存储在存储器610中的指令，执行本公开中任意一些实施例中的目标跟踪方法。

其中，存储器610例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。

图7为本公开目标跟踪装置的另一些实施例的结构图。如图7所示，该实施例的装置70包括：存储器710以及处理器720，分别与存储器610以及处理器620类似。还可以包括输入输出接口730、网络接口740、存储接口750等。这些接口730，740，750以及存储器710和处理器720之间例如可以通过总线760连接。其中，输入输出接口730为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口740为各种联网设备提供连接接口，例如可以连接到数据库服务器或者云端存储服务器等。存储接口750为SD卡、U盘等外置存储设备提供连接接口。

本领域内的技术人员应当明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生被配置为实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供被配置为实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本公开的较佳实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

一种目标跟踪方法，包括：

获取视频的当前帧中目标的位置信息；

根据所述当前帧中所述目标的位置信息确定所述视频的下一帧中所述目标对应的检测区域，所述目标对应的检测区域属于所述下一帧的全局图像的一部分；

在所述下一帧的所述目标对应的检测区域中检测所述目标；

将所述下一帧中检测到的所述目标与所述当前帧中所述目标的信息进行关联，以便对所述目标进行跟踪。
根据权利要求1所述的目标跟踪方法，其中，所述目标的位置信息包括所述目标的边界框的坐标信息，所述根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域包括：

根据所述当前帧中所述目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定所述当前帧中所述目标的边界框扩展后的坐标信息；

根据所述当前帧中所述目标的边界框扩展后的坐标信息，在所述下一帧中将相同坐标信息所表示的区域作为所述目标对应的检测区域。
根据权利要求1所述的目标跟踪方法，其中，所述根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域包括：

确定所述当前帧的前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距；

在所述前一帧中所述目标的位置信息和所述当前帧中目标的位置信息的差距小于或等于第一预设差距的情况下，根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域。
根据权利要求3所述的目标跟踪方法，其中，所述目标的位置信息包括：所述目标的边界框的中心点坐标信息；

所述前一帧中所述目标的位置信息和所述当前帧中目标的位置信息的差距为所述前一帧中所述目标的边界框的中心点和所述当前帧中目标的边界框的中心点的距离。
根据权利要求1所述的目标跟踪方法，其中，在所述下一帧的所述目标对应的检测区域中检测所述目标包括：

将所述下一帧的所述目标对应的检测区域的图像输入目标检测模型，得到所述目标检测模型输出的一个或多个边界框的位置信息；

在所述一个或多个边界框为一个的情况下，将所述边界框中的图像确定为所述目标；

在所述一个或多个边界框为多个的情况下，针对每个边界框，将所述边界框的位置信息和所述当前帧中所述目标的位置信息进行比对，在该边界框的位置信息和所述当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。
一种目标跟踪方法，包括：

获取视频的当前帧中目标的位置信息；

确定所述当前帧的前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距；

在所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距小于或等于第一预设差距的情况下，根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域，所述目标对应的检测区域属于所述下一帧的全局图像的一部分，在所述下一帧的所述目标对应的检测区域中检测所述目标；

在所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距大于第一预设差距的情况下，在所述下一帧的全局图像中检测所述目标；

将所述下一帧中检测到的所述目标与所述当前帧中所述目标的信息进行关联，以便对所述目标进行跟踪。
根据权利要求6所述的目标跟踪方法，其中，所述目标的位置信息包括所述目标的边界框的坐标信息，所述根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域包括：

根据所述当前帧中所述目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定所述当前帧中所述目标的边界框扩展后的坐标信息；

根据所述当前帧中所述目标的边界框扩展后的坐标信息，在所述下一帧中将相同坐标信息所表示的区域作为所述目标对应的检测区域。
根据权利要求6所述的目标跟踪方法，其中，所述目标的位置信息包括：所述目标的边界框的中心点坐标信息；

所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距为所述前一帧中所述目标的边界框的中心点和所述当前帧中所述目标的边界框的中心点的距离。
根据权利要求6所述的目标跟踪方法，其中，在所述下一帧的所述目标对应的检测区域中检测所述目标包括：

将所述下一帧的所述目标对应的检测区域的图像输入目标检测模型，得到所述目标检测模型输出的一个或多个边界框的位置信息；

在所述一个或多个边界框为一个的情况下，将所述边界框中的图像确定为所述目标；

在所述一个或多个边界框为多个的情况下，针对每个边界框，将所述边界框的位置信息和所述当前帧中所述目标的位置信息进行比对，在该边界框的位置信息和所述当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。
一种目标跟踪装置，包括：

信息获取模块，用于获取视频的当前帧中目标的位置信息；

检测区域确定模块，用于根据所述当前帧中所述目标的位置信息确定所述视频的下一帧中所述目标对应的检测区域，所述目标对应的检测区域属于所述下一帧的全局图像的一部分；

目标检测模块，用于在所述下一帧的所述目标对应的检测区域中检测所述目标；

信息关联模块，用于将所述下一帧中检测到的所述目标与所述当前帧中所述目标的信息进行关联，以便对所述目标进行跟踪。
根据权利要求10所述的目标跟踪装置，其中，所述目标的位置信息包括所述目标的边界框的坐标信息；

所述检测区域确定模块用于根据所述当前帧中所述目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定所述当前帧中所述目标的边界框扩展后的坐标信息，根据所述当前帧中所述目标的边界框扩展后的坐标信息，在所述下一帧中将相同坐标信息所表示的区域作为所述目标对应的检测区域。
根据权利要求10所述的目标跟踪装置，其中，

所述检测区域确定模块用于确定所述当前帧的前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距，在所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距小于或等于第一预设差距的情况下，根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域。
根据权利要求12所述的目标跟踪装置，其中，所述目标的位置信息包括：所述目标的边界框的中心点坐标信息；

所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距为所述前一帧中所述目标的边界框的中心点和所述当前帧中所述目标的边界框的中心点的距离。
根据权利要求10所述的目标跟踪装置，其中，

所述目标检测模块用于将所述下一帧的所述目标对应的检测区域的图像输入目标检测模型，得到所述目标检测模型输出的一个或多个边界框的位置信息；在所述一个或多个边界框为一个的情况下，将所述边界框中的图像确定为所述目标；在所述一个或多个边界框为多个的情况下，针对每个边界框，将所述边界框的位置信息和所述当前帧中所述目标的位置信息进行比对，在该边界框的位置信息和所述当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。
一种目标跟踪装置，包括：

获取模块，用于获取视频的当前帧中目标的位置信息；

差距确定模块，用于确定所述当前帧的前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距；

第一检测模块，用于在所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距小于或等于第一预设差距的情况下，根据所述当前帧中所述目标的位置信息确定下一帧中所述目标对应的检测区域，所述目标对应的检测区域属于所述下一帧的全局图像的一部分，在所述下一帧的所述目标对应的检测区域中检测所述目标；

第二检测模块，用于在所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距大于第一预设差距的情况下，在所述下一帧的全局图像中检测所述目标；

关联模块，用于将所述下一帧中检测到的所述目标与所述当前帧中所述目标的信息进行关联，以便对所述目标进行跟踪。
根据权利要求15所述的目标跟踪装置，其中，

所述第一检测模块用于根据所述当前帧中所述目标的边界框的坐标信息，预设扩展长度和预设扩展宽度，确定所述当前帧中所述目标的边界框扩展后的坐标信息；根据所述当前帧中所述目标的边界框扩展后的坐标信息，在所述下一帧中将相同坐标信息所表示的区域作为所述目标对应的检测区域。
根据权利要求15所述的目标跟踪装置，其中，所述目标的边界框的中心点坐标信息；

所述前一帧中所述目标的位置信息和所述当前帧中所述目标的位置信息的差距为所述前一帧中所述目标的边界框的中心点和所述当前帧中所述目标的边界框的中心点的距离。
根据权利要求15所述的目标跟踪装置，其中，

所述第一检测模块用于将所述下一帧的所述目标对应的检测区域的图像输入目标检测模型，得到所述目标检测模型输出的一个或多个边界框的位置信息；在所述一个或多个边界框为一个的情况下，将所述边界框中的图像确定为所述目标；在所述一个或多个边界框为多个的情况下，针对每个边界框，将所述边界框的位置信息和所述当前帧中所述目标的位置信息进行比对，在该边界框的位置信息和所述当前帧中该目标的位置信息的差距小于第二预设差距的情况下，将该边界框中的图像确定为该目标。
一种目标跟踪装置，包括：

存储器；以及

耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如权利要求1-9任一项所述的目标跟踪方法。
一种计算机可读存储介质，其上存储有计算机程序，其中，该程序被处理器执行时实现权利要求1-9任一项所述方法的步骤。