WO2021159554A1

WO2021159554A1 - 基于视觉的目标跟踪方法、系统、设备及存储介质

Info

Publication number: WO2021159554A1
Application number: PCT/CN2020/076360
Authority: WO
Inventors: 张明; 董健; 李帅
Original assignee: 睿魔智能科技（深圳）有限公司
Priority date: 2020-02-14
Filing date: 2020-02-24
Publication date: 2021-08-19
Also published as: US20220383518A1; CN111339855A; CN111339855B

Abstract

一种基于视觉的目标跟踪方法、系统、设备及存储介质，该方法包括：读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置（S110）；获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置（S120）；判断在在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，若不存在，执行步骤S140（S130）；根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序目标是否处于交叉状态，若是，执行步骤S150（S140）；判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若不存在，则将时序跟踪目标的当前位置作为目标当前位置，执行步骤S160（S150）；保持跟踪（S160）；将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像（S170），返回执行上述步骤。该方法能降低目标跟踪错误的可能性，确保跟踪的稳定性。

Description

基于视觉的目标跟踪方法、系统、设备及存储介质

本申请是以申请号为202010095228.9、申请日为2020年2月14日的中国专利申请为基础，并主张其优先权，该申请的全部内容在此作为整体引入本申请中。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种基于视觉的目标跟踪方法、系统、设备及存储介质。

背景技术

现有的基于视觉的目标跟踪算法通常采用相关滤波算法，即根据当前图像获取需要跟踪目标的图像模板，然后采用相关滤波计算得到下一帧图像中和目标模板匹配度最高的位置，将该位置作为目标所在的位置。

相关滤波跟踪算法通常采用实时模板进行目标匹配，虽然可采用历史模板进行优化得到更具有鲁棒性的模板，但是该算法在目标突变、快速移动的情况下效果不好，则使得当人体出现无规律的走动再加上姿态的剧烈变化的情况下，跟踪效果变差。

申请内容

本申请实施例提供了一种基于视觉的目标跟踪方法、系统、设备及存储介质，旨在降低目标跟踪错误的可能性，提高跟踪效果，确保跟踪的稳定性。

第一方面，本申请实施例提供了一种基于视觉的目标跟踪方法，其包括：步骤A、读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；步骤B、获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；步骤C、判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，若不存在，执行步骤D；步骤D、根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若是，执行步骤E；步骤E、判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若不存在，将时序跟踪目标的当前位置作为目标当前位置，执行步骤F；步骤F、保持跟踪，执行步骤G；步骤G、将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像，返回执行步骤A。

第二方面，本申请实施例提供了一种基于视觉的目标跟踪系统，其包括人脸人体检测模块、时序跟踪模块、人脸匹配模块、人体交叉判断模块、人体匹配模块及更新模块，所述人脸人体检测模块用于读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；所述时序跟踪模块用于获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；所述人脸匹配模块用于判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，并根据判断结果确定目标当前位置；所述人体交叉判断模块用于根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态；所述人体匹配模块用于判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，并根据判断结果确定目标当前位置；所述更新模块用于将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像。

第三方面，本申请实施例提供了一种计算机设备，其包括存储器和处理器，所述存储器上存储有可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现上述的基于视觉的目标跟踪方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被执行时实现上述的基于视觉的目标跟踪方法。

本申请提供的一种基于视觉的目标跟踪方法将时序跟踪算法、人脸识别及人体识别结合在一起进行目标跟踪，结合时序跟踪算法获得更可靠的目标位置，降低目标人物发生剧烈姿态变化的可能性，将人脸识别作为目标切换的第一优先级，并通过利用人体识别以有效避免交叉阶段跟踪到错误的人物，降低当目标人物与其他人物无规律交叉时的跟踪错误，提高目标跟踪的准确性，且鲁棒性高。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。

图1为本申请第一实施例提供的基于视觉的目标跟踪方法的流程示意图；

图2为本申请第一实施例提供的基于视觉的目标跟踪方法的子流程示意图；

图3为本申请第二实施例提供的基于视觉的目标跟踪方法的流程示意图；

图4为本申请第三实施例提供的基于视觉的目标跟踪方法的流程示意图；

图5为本申请第三实施例提供的基于视觉的目标跟踪方法的具体流程示意图；

图6为本申请实施例提供的基于视觉的目标跟踪系统的示意性框图；

图7为本申请另一实施例提供的基于视觉的目标跟踪系统的示意性框图；

图8为本申请实施例提供的计算机设备的结构框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。在此本申请说明书中使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其他情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。在本申请说明书和所附权利要求书中使用的属于“和/或”是指相关联列出的项中的一个或多个的任何组合及所有可能组合，并且包括这些组合。

请参阅图1，图1是本申请第一实施例提供的一种基于视觉的目标跟踪方法的流程示意图。如图所示，该方法包括以下步骤：

步骤S110、读取当前帧图像，获取并保存当前帧图像的所有人物的人脸位置及人体位置。其中，位置代表对应区域于图像中的各端点坐标，对应区域呈矩形，通过各端点坐标组合可获得对应的区域，则可通过位置获取于图像中的对应区域。具体地，以人脸于当前帧图像中的对应区域的左上角的端点坐标及右下角的端点坐标表示人脸位置，以人体于当前帧图像中的对应区域的左上角的端点坐标及右下角的端点坐标表示人体位置。

步骤S120、获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置。其中，待跟踪目标是指需要跟踪的人物，时序跟踪目标是指基于时序跟踪算法获得的跟踪目标，时序跟踪目标的当前位置是指基于时序跟踪算法获得的跟踪目标的人体位置。利用时序跟踪算法以跟踪所述待跟踪目标的时序信息可预测获取更可靠的位置信息。其中，所述时序跟踪算法可采用现有的时序滤波的目标跟踪方法，例如中国专利CN110111358A一种基于多层时序滤波的目标跟踪方法，此不赘述。

具体地，在一些实施例中，如图2所示，所述步骤S120前还具体包括：

步骤S1101、判断是否已确定待跟踪目标，若是，执行步骤S120，否则，执行步骤S1102。

步骤S1102、根据跟踪需求，在所有人物中确定待跟踪目标，提取并保存待跟踪目标的人脸模板及人体模板。

优选地，所述步骤S1102具体为：根据跟踪需求，在所有人物中确定待跟踪目标，获取待跟踪目标的人脸图像和人体图像，利用基于深度神经网络的人脸识别模型结合获得的人脸图像提取待跟踪目标的人脸模板，利用基于深度神经网络的人体识别模型结合获得的人体图像提取待跟踪目标的人体模板。

步骤S1103、将待跟踪目标的人体位置作为目标当前位置，执行步骤S170。

本实施例中，若已确定待跟踪目标，则执行步骤S120以获取时序跟踪目标的当前位置；若未确定待跟踪目标，则根据跟踪需求获取待跟踪目标，将待跟踪目标的人体位置作为目标当前位置，然后执行步骤S170，以对待跟踪目标进行跟踪。

步骤S130、判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，若不存在，执行步骤S140。通过判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物以判断是否跟踪错误，从而对时序跟踪获得的位置信息进行检验，确保跟踪的准确性，同时，利用人脸识别作为目标切换的第一优先级，其中，与待跟踪目标的人脸匹配是指与待跟踪目标的人脸模板匹配，所述人脸模板表示人脸特征模板，由待跟踪目标的人脸图像利用基于深度神经网络的人脸识别模型提取获得。

步骤S140、根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若是，执行步骤S150。其中，交叉状态是指人物的人体位置对应的区域之间发生重叠的状态。

若在时序跟踪目标的当前位置对应的区域外不存在与待跟踪目标的人脸匹配的人物，则待跟踪目标不在时序跟踪目标的当前位置外的区域，则进一步地根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，以确定待跟踪目标是否处于时序跟踪目标的当前位置，这样通过时序跟踪目标的当前位置对应的区域外的人物的人脸匹配及时序跟踪目标的当前位置内的时序跟踪目标的交叉状态来判断时序跟踪目标的准确性，起到双重保障的作用。其他人物是指当前帧图像中所有的非时序跟踪目标的人体位置对应的区域与所述时序跟踪目标的当前位置对应的区域的交并比大于预设的交并比阈值的人体位置对应区域所对应的人物，交并比代表交集与并集之间的比值。

步骤S150、判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若不存在，将时序跟踪目标的当前位置作为目标当前位置，执行步骤S160。

其中，所述目标当前位置代表待跟踪目标的准确的人体位置，与待跟踪目标的人体匹配是指与待跟踪目标的人体模板匹配，所述人体模板表示人体特征模板，由待跟踪目标的人体图像利用基于深度神经网络的人体识别模型提取获得。通过判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，以判断其他人物是否为待跟踪目标，提高跟踪目标的准确性。当与时序跟踪目标发生交叉的其他人物中不存在与待跟踪目标的人体匹配的人物，则与时序跟踪目标发生交叉的其他人物并非需要跟踪的人物，时序跟踪目标即为需要跟踪的人物，则跟踪无误，此时，时序跟踪目标的当前位置即为目标当前位置，提高跟踪的可靠性。

步骤S160、保持跟踪，执行步骤S170。在已知时序跟踪无误后，根据获得的目标当前位置以对待跟踪目标进行跟踪记录。

步骤S170、将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像，返回执行步骤S110。

本申请实施例的基于视觉的目标跟踪方法通过将时序跟踪算法、人脸识别及人体识别多种目标跟踪方式结合在一起进行目标跟踪，结合时序跟踪算法以利用待跟踪目标的时序信息获得更可靠的目标位置，降低目标人物发生剧烈姿态变化的可能性，可在待跟踪目标不处于交叉状态时获取可靠的目标位置；将人脸识别作为目标切换的第一优先级，以对时序跟踪目标进行修正，并通过利用人体识别以有效避免交叉阶段跟踪到错误的人物，降低当目标人物与其他人物无规律交叉时的跟踪错误，提高目标跟踪的准确性，且鲁棒性高。

图3是本申请第二实施例提供的基于视觉的目标跟踪方法的流程示意图。如图3所示，本实施例的基于视觉的目标跟踪方法包括步骤S210-S270。其中，步骤S210与上述实施例中的步骤S110类似，步骤S2101-S2103与上述实施例中的步骤S1101-S1103类似，步骤S220与上述实施例中的步骤S120类似，步骤S260-S270与上述实施例中的步骤S160-S170类似，在此不再赘述。下面详细说明本实施例中不同的步骤S230-S250。

在本实施例中，所述步骤S230具体为：步骤S231、判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物。若不存在，执行步骤S240。

具体地，所述步骤S230还包括：步骤S2311、若在时序跟踪目标的当前位置对应的区域外存在与待跟踪目标的人脸匹配的人物，将该人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，执行步骤S270。

其中，时序跟踪目标是指基于时序跟踪算法获得的跟踪目标，时序跟踪目标的当前位置是指基于时序跟踪算法获得的跟踪目标的人体位置，所述时序跟踪算法可采用现有的时序滤波的目标跟踪方法，例如中国专利CN110111358A一种基于多层时序滤波的目标跟踪方法，此不赘述。目标当前位置代表待跟踪目标的准确的人体位置，与待跟踪目标的人脸匹配是指与待跟踪目标的人脸模板匹配，人脸模板表示人脸特征模板，由待跟踪目标的人脸图像利用基于深度神经网络的人脸识别模型提取获得。当在时序跟踪目标的当前位置对应的区域外存在与待跟踪目标的人脸匹配的人物，则时序跟踪目标并非需要跟踪的人物，需将与待跟踪目标的人脸模板匹配的人物作为待跟踪目标，获取该人物的人体位置作为目标当前位置，以更正跟踪。

在本实施例中，步骤S240具体为：步骤S241、根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若时序跟踪目标处于交叉状态，执行步骤S250。其中，交叉状态是指人物的人体位置对应的区域之间发生重叠的状态。

具体地，所述步骤S240还包括：步骤S2411、若时序跟踪目标不处于交叉状态，则将时序跟踪目标的当前位置作为目标当前位置，执行步骤S270。

若在时序跟踪目标的当前位置对应的区域外不存在与待跟踪目标的人脸匹配的人物，即待跟踪目标不在时序跟踪目标的当前位置外的区域，则进一步地根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，以确定待跟踪目标是否处于时序跟踪目标的当前位置，这样通过时序跟踪目标的当前位置对应的区域外的人物的人脸匹配及时序跟踪目标的当前位置内的时序跟踪目标的交叉状态来判断时序跟踪目标的准确性，起到双重保障的作用。若在时序跟踪目标的当前位置对应的区域外不存在与待跟踪目标的人脸匹配的人物，且时序跟踪目标又不处于交叉状态，则时序跟踪目标为正确的需要跟踪的人物，跟踪无误，此时，时序跟踪目标的当前位置即为目标当前位置。其他人物是指当前帧图像中所有的非时序跟踪目标的人体位置对应的区域与所述时序跟踪目标的当前位置对应的区域的交并比大于预设的交并比阈值的人体位置对应区域所对应的人物，交并比代表交集与并集之间的比值。

在本实施例中，步骤S250具体包括：

步骤S251、判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物。

步骤S252、若与时序跟踪目标发生交叉的其他人物中不存在与待跟踪目标的人体匹配的人物，则将时序跟踪目标的当前位置作为目标当前位置，执行步骤S260。

具体地，所述步骤S250还包括：步骤S2511、若与时序跟踪目标发生交叉的其他人物中存在与待跟踪目标的人体匹配的人物，将该人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，执行步骤S270。

其中，目标当前位置代表待跟踪目标的准确的人体位置，与待跟踪目标的人体匹配是指与待跟踪目标的人体模板匹配，人体模板表示人体特征模板，由待跟踪目标的人体图像利用基于深度神经网络的人体识别模型提取获得。通过判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，提高跟踪目标的准确性。当与时序跟踪目标发生交叉的其他人物中不存在与待跟踪目标的人体匹配的人物，则时序跟踪目标即为需要跟踪的人物，则跟踪无误，此时，时序跟踪目标的当前位置即为目标当前位置，提高跟踪的可靠性。当与时序跟踪目标发生交叉的其他人物中存在与待跟踪目标的人体匹配的人物，则时序跟踪目标并非需要跟踪的人物，需将其他人物中与待跟踪目标的人体匹配人物作为待跟踪目标，该人物对应的人体位置作为目标当前位置。

图4是本申请第三实施例提供的基于视觉的目标跟踪方法的流程示意图。如图4所示，本实施例的基于视觉的目标跟踪方法包括步骤S310-S370。其中，步骤S310与第二实施例中的步骤S210类似，步骤S3101-S3103与第二实施例中的步骤S2101-S2103类似，步骤S320与第二实施例中的步骤S220类似，步骤S340与第二实施例中的步骤S240类似，步骤S360-S370与第二实施例中的步骤S260-S270类似，在此不再赘述。下面详细说明本实施例中不同的步骤步骤S330及步骤S350。

在本实施例中，所述步骤S330具体包括：

步骤S331、获取所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征，计算所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度。其中，时序跟踪目标是指基于时序跟踪算法获得的跟踪目标，时序跟踪目标的当前位置是指基于时序跟踪算法获得的跟踪目标的人体位置，人脸模板表示人脸特征模板，由待跟踪目标的人脸图像利用基于深度神经网络的人脸识别模型提取获得。获取时序跟踪目标的当前位置外的区域的人物可以更为快速和方便地判断出待跟踪目标是否不在所述时序跟踪目标的当前位置对应区域，从而对时序跟踪获得的位置信息进行检验，确保跟踪的准确性。

步骤S332、判断所述人脸相似度是否小于等于预设的人脸相似阈值，若所述人脸相似度小于等于预设的人脸相似阈值，执行步骤S340。

通过获取不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征，并判断其与待跟踪目标的人脸模板之间的人脸相似度是否小于等于预设的人脸相似阈值，可快速判断待跟踪目标是否不在所述时序跟踪目标的当前位置对应的区域内，从而判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配人物。若所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度均小于等于预设的人脸相似阈值，则在时序跟踪目标的当前位置对应的区域外不存在与待跟踪目标的人脸匹配的人物，则待跟踪目标在所述时序跟踪目标的当前位置对应的区域内，确定跟踪区域的准确。

在一些实施例，如图4和图5所示，所述步骤S330还包括：步骤S3321，若所述人脸相似度大于预设的人脸相似阈值，获取人脸相似度最大的人脸特征对应的人脸，并将该人脸对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，执行步骤S370。目标当前位置代表待跟踪目标的准确的人体位置。当不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度大于预设的人脸相似阈值，则在时序跟踪目标的当前位置对应的区域外存在与待跟踪目标的人脸匹配的人物，即代表所述时序跟踪目标的当前位置对应的人物并非需要跟踪的人物，需从人脸相似度大于人脸相似阈值的对应的人脸中获取人脸相似度最大的人脸特征对应的人脸所对应的人物作为待跟踪目标，以更新为正确的待跟踪目标，且其对应的人体位置为目标当前位置。

具体地，在一些实施例中，如图5所示，所述步骤S340包括步骤S3401、步骤S341及步骤S3411，所述步骤S341与第二实施例中的步骤S241类似，步骤S3411与第二实施例中的步骤S2411类似，此不赘述，所述步骤S3401于步骤S341前执行，其具体为：

步骤S3401、获取其他人物的人体位置。

在一些实施例中，所述步骤S3401具体为：获取当前帧图像中所有的非时序跟踪目标的人体位置对应的区域，计算其与所述时序跟踪目标的当前位置对应的区域的交并比，获取所述交并比大于预设的交并比阈值的人体位置对应区域所对应的人物的人体位置，并将其作为其他人物的人体位置。

交并比代表交集与并集之间的比值，非时序跟踪目标是指所有人物中除时序跟踪目标外的人物，计算非时序跟踪目标的人物的人体位置对应的区域与时序跟踪目标的当前位置对应区域的交并比可初步排除与时序跟踪目标的当前位置对应的区域不交叉的人物的人体位置对应的区域，便于交叉状态的判断，交并比越大，交叉面积越大。其他人物是指当前帧图像中所有的非时序跟踪目标的人体位置对应的区域与所述时序跟踪目标的当前位置对应的区域的交并比大于预设的交并比阈值的人体位置对应区域所对应的人物。

在本实施例中，所述步骤S350具体包括：

步骤S351、提取与时序跟踪目标发生交叉的其他人物的人体特征，计算所述其他人物的人体特征与待跟踪目标的人体模板之间的人体相似度。

步骤S352、判断所述人体相似度是否小于等于预设的人体相似阈值。

步骤S353、若所述人体相似度小于等于预设的人体相似阈值，将时序跟踪目标的人体位置作为目标当前位置，执行步骤S360。其中，所述人体模板表示人体特征模板，由待跟踪目标的人体图像利用基于深度神经网络的人体识别模型提取获得。所述目标当前位置代表待跟踪目标准确的人体位置。通过判断所述其他人物的人体特征与待跟踪目标的人体模板之间的人体相似度以判断其他人物是否为待跟踪目标，提高跟踪目标的准确性。当人体相似度小于等于预设的人体相似阈值，则与时序跟踪目标发生交叉的其他人物并非需要跟踪的人物，时序跟踪目标即为需要跟踪的人物，则跟踪无误，此时，时序跟踪目标的当前位置即为目标当前位置，提高跟踪的可靠性。

在一些实施例中，如图4和图5所示，所述步骤S352后还包括：若所述人体相似度大于预设的人体相似阈值，执行步骤S3521。

步骤S3521、若所述人体相似度大于预设的人体相似阈值，获取人体相似度最大的人体特征对应的人体，并将该人体对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，执行步骤S370。

当与时序跟踪目标发生交叉的其他人物的人体相似度大于预设的人体相似阈值，则代表所述时序跟踪目标的当前位置对应的人物并非需要跟踪的人物，需从其他人物的人体位置中获取人体相似度最大的人体特征对应的人体所对应的人物作为待跟踪目标，且其对应的人体位置为目标当前位置。

本申请实施例提供的基于视觉的目标跟踪方法结合时序跟踪算法以利用待跟踪目标的时序信息获得更可靠的目标位置，降低目标人物发生剧烈姿态变化的可能性，可在待跟踪目标不处于交叉状态时获取可靠的目标位置；并通过利用人体识别以有效避免交叉阶段跟踪到错误的人物，降低当目标人物于其他人物无规律交叉时的跟踪错误，提高目标跟踪的准确性，且鲁棒性高。

图6为本申请实施例提供的一种基于视觉的目标跟踪系统的示意性框图。如图6所示，对应于以上基于视觉的目标跟踪方法，本申请提供一种基于视觉的目标跟踪系统10，所述目标跟踪系统10包括人脸人体检测模块110、时序跟踪模块120、人脸匹配模块130、人体交叉判断模块140、人体匹配模块150及更新模块160。所述人脸人体检测模块110用于读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置。其中，位置代表对应区域于图像中的各端点坐标，对应区域呈矩形，通过各端点坐标组合可获得对应的区域，则可通过位置获取于图像中的对应区域。具体地，以人脸于当前帧图像中的对应区域的左上角的端点坐标及右下角的端点坐标表示人脸位置，以人体于当前帧图像中的对应区域的左上角的端点坐标及右下角的端点坐标表示人体位置。

所述时序跟踪模块120用于获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置。其中，待跟踪目标是指需要跟踪的人物，时序跟踪目标是指基于时序跟踪算法获得的跟踪目标，时序跟踪目标的当前位置是指基于时序跟踪算法获得的跟踪目标的人体位置。利用时序跟踪算法以跟踪所述待跟踪目标的时序信息可预测获取更可靠的位置信息。其中，所述时序跟踪算法可采用现有的时序滤波的目标跟踪方法，例如中国专利CN110111358A一种基于多层时序滤波的目标跟踪方法，此不赘述。

所述人脸匹配模块130用于判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，并根据判断结果确定目标当前位置。具体地，所述判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物是通过计算所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度，结合预设的人脸相似阈值进行判断。根据判断结果可确定目标当前位置。所述人脸匹配模块130获取所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征，计算所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度，判断所述人脸相似度是否小于等于预设的人脸相似阈值。其中，若所述人脸相似度大于预设的人脸相似阈值，则时序跟踪目标非正确的待跟踪目标，需获取人脸相似度最大的人脸特征对应的人脸，并将该人脸对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置。所述人脸模板表示人脸特征模板，由待跟踪目标的人脸图像利用基于深度神经网络的人脸识别模型提取获得。若所述人脸相似度小于等于预设的人脸相似阈值，所述人体交叉判断模块140工作。

其中，利用人脸匹配模块130获取时序跟踪目标的当前位置外的区域的人物可以更为快速和方便地判断出待跟踪目标是否已不在所述时序跟踪目标的当前位置对应区域，以对时序跟踪获得的位置信息进行检验，确保跟踪的准确性。

所述人体交叉判断模块140用于根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态。其中，交叉状态是指人物的人体位置对应的区域之间发生重叠的状态。具体地，所述人体交叉判断模块140获取当前帧图像中所有的非时序跟踪目标的人体位置对应的区域，计算其与所述时序跟踪目标的当前位置对应的区域的交并比，获取所述交并比大于预设的交并比阈值的人体位置对应区域所对应的人体位置，并将其作为其他人物的人体位置；根据所述时序跟踪目标的当前位置及所述其他人物的人体位置判断时序跟踪目标是否处于交叉状态。其中，交并比代表交集与并集之间的比值，非时序跟踪目标是指所有人物中除时序跟踪目标外的人物，计算非时序跟踪目标的人物的人体位置对应区域与时序跟踪目标的当前位置对应区域的交并比可初步排除与时序跟踪目标的当前位置不交叉的人物的人体位置，便于交叉状态的判断，交并比越大，交叉面积越大。其他人物是指当前帧图像中所有的非时序跟踪目标的人体位置对应区域与所述时序跟踪目标的当前位置对应区域的交并比大于预设的交并比阈值的人体位置对应区域所对应的人物。若时序跟踪目标不处于交叉状态，则时序跟踪目标的当前位置作为目标当前位置。

在确定待跟踪目标处于所述时序跟踪目标的当前位置对应的区域时，利用人体交叉模块140判断时序跟踪目标的当前位置内的时序跟踪目标的交叉状态，可起到双重保障，以提高跟踪目标的准确性。

所述人体匹配模块150用于判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，并根据判断结果确定目标当前位置。具体地，所述判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物是通过提取与时序跟踪目标发生交叉的其他人物的人体特征，计算所述其他人物的人体特征与待跟踪目标的人体模板之间的人体相似度，结合预设的人体相似阈值进行判断。根据判断结果可确定目标当前位置。其中，若所述人体相似度小于等于预设的人体相似阈值，则时序跟踪目标即为需要跟踪的人物，将时序跟踪目标的当前位置作为目标当前位置。所述人体模板表示人体特征模板，由待跟踪目标的人体图像利用基于深度神经网络的人体识别模型提取获得。若所述人体相似度大于预设的人体相似阈值，获取人体相似度最大的人体特征对应的人体，并将该人体对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置。当与时序跟踪目标发生交叉的其他人物的人体相似度大于预设的人体相似阈值，则代表所述时序跟踪目标的当前位置对应的人物并非需要跟踪的人物，需从其他人物的人体位置中获取人体相似度最大的人体特征对应的人体所对应的人物作为待跟踪目标，且其对应的人体位置为目标当前位置。利用人体匹配模块150可更好地对发生交叉状态的时序跟踪目标进行跟踪，提高跟踪的准确性。

所述更新模块160用于将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像。

基于上述设计，工作时，人脸人体检测模块110读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；时序跟踪模块120获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；人脸匹配模块130获取所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征，计算所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度。判断所述人脸相似度是否小于等于预设的人脸相似阈值，以判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物。其中，若所述人脸相似度大于预设的人脸相似阈值，则在时序跟踪目标的当前位置对应的区域外存在与待跟踪目标的人脸匹配的人物，时序跟踪目标非正确的待跟踪目标，获取人脸相似度最大的人脸特征对应的人脸，并将该人脸对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，更新模块160工作，更新模块160将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像；且人脸人体检测模块110、时序跟踪模块120及人脸匹配模块130依序工作；若所述人脸相似度小于等于预设的人脸相似阈值，则在时序跟踪目标的当前位置对应的区域外不存在与待跟踪目标的人脸匹配的人物，人体交叉判断模块140工作；所述人体交叉判断模块140根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若时序跟踪目标不处于交叉状态，则时序跟踪目标的当前位置作为目标当前位置，更新模块160工作，且人脸人体检测模块110、时序跟踪模块120、人脸匹配模块130及人体交叉判断模块140依序工作；若时序跟踪目标处于交叉状态，人体匹配模块150工作；人体匹配模块150提取与时序跟踪目标发生交叉的其他人物的人体特征，计算所述其他人物的人体特征与待跟踪目标的人体模板之间的人体相似度，并根据所述人体相似度确定目标当前位置，以判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若所述人体相似度大于预设的人体相似阈值，则与时序跟踪目标发生交叉的其他人物中存在与待跟踪目标的人体匹配的人物，时序跟踪目标非正确的待跟踪目标，获取人体相似度最大的人体特征对应的人体，并将该人体对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，更新模块160工作，且人脸人体检测模块110、时序跟踪模块120、人脸匹配模块130、人体交叉判断模块140及人体匹配模块150依序工作；若所述人体相似度小于等于预设的人体相似阈值，则将时序跟踪目标的当前位置作为目标当前位置，更新模块160工作，且人脸人体检测模块110、时序跟踪模块120、人脸匹配模块130、人体交叉判断模块140及人体匹配模块150依序工作。

本申请实施例的基于视觉的目标跟踪系统将时序跟踪算法、人脸识别及人体识别结合在一起进行目标跟踪，结合时序跟踪算法获得更可靠的目标位置，降低目标人物发生剧烈姿态变化的可能性，将人脸识别作为目标切换的第一优先级，并通过利用人体识别以避免交叉阶段跟踪到错误的人物，降低当目标人物与其他人物无规律交叉时的跟踪错误，提高目标跟踪的准确性，且鲁棒性高。

图7是本申请另一实施例提供的基于视觉的目标跟踪系统的示意性框图。如图7所示，所述目标跟踪系统20是上述实施例的基础上增加了初始化模块270，所述初始化模块270用于根据跟踪需求，在所有人物中确定待跟踪目标，提取并保存待跟踪目标的人脸模板和人体模板，将待跟踪目标的人体位置作为目标当前位置。所述初始化模块270根据跟踪需求，在所有人物中确定待跟踪目标，获取待跟踪目标的人脸图像和人体图像，利用基于深度神经网络的人脸识别模型结合获得的人脸图像提取待跟踪目标的人脸模板，利用基于深度神经网络的人体识别模型结合获得的人体图像提取待跟踪目标的人体模板，将待跟踪目标的人体位置作为目标当前位置。

基于上述设计，工作时，人脸人体检测模块210读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；初始化模块270根据需求在所有人物中确定待跟踪目标，获取待跟踪目标的人脸图像和人体图像，利用基于深度神经网络的人脸识别模型结合获得的人脸图像提取待跟踪目标的人脸模板，利用基于深度神经网络的人体识别模型结合获得的人体图像提取待跟踪目标的人体模板，将待跟踪目标的人体位置作为目标当前位置；更新模块260将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像；人脸人体检测模块再次读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；时序跟踪模块220获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；人脸匹配模块250获取所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征，计算所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征与待跟踪目标的人脸模板之间的人脸相似度。判断所述人脸相似度是否小于等于预设的人脸相似阈值，以判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物。其中，若所述人脸相似度大于预设的人脸相似阈值，则在时序跟踪目标的当前位置对应的区域外存在与待跟踪目标的人脸匹配的人物，时序跟踪目标并非需要跟踪的人物，获取人脸相似度最大的人脸特征对应的人脸，并将该人脸对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，更新模块260工作，且人脸人体检测模块210、时序跟踪模块220及人脸匹配模块250依序工作；若所述人脸相似度小于等于预设的人脸相似阈值，人体交叉判断模块240工作；所述人体交叉判断模块240根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若时序跟踪目标不处于交叉状态，则时序跟踪目标的当前位置作为目标当前位置，更新模块260工作，且人脸人体检测模块210、时序跟踪模块220、人脸匹配模块250及人体交叉判断模块240依序工作；若时序跟踪目标处于交叉状态，人体匹配模块250工作；人体匹配模块250提取与时序跟踪目标发生交叉的其他人物的人体特征，计算所述其他人物的人体特征与待跟踪目标的人体模板之间的人体相似度，并根据所述人体相似度确定目标当前位置，以判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物。若所述人体相似度大于预设的人体相似阈值，则与时序跟踪目标发生交叉的其他人物中存在与待跟踪目标的人体匹配的人物，时序跟踪目标并非需要跟踪的人物，获取人体相似度最大的人体特征对应的人体，并将该人体对应的人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，更新模块260工作，且人脸人体检测模块210、时序跟踪模块220、人脸匹配模块230、人体交叉判断模块240及人体匹配模块250依序工作；若所述人体相似度小于等于预设的人体相似阈值，则将时序跟踪目标的当前位置作为目标当前位置，更新模块260工作，且人脸人体检测模块210、时序跟踪模块220、人脸匹配模块230、人体交叉判断模块240及人体匹配模块250依序工作。

本申请实施例通过设置时序跟踪模块、人脸匹配模块、人体交叉判断模块及人体匹配模块以将时序跟踪算法、人脸识别及人体识别多种目标跟踪方式结合在一起进行目标跟踪，结合时序跟踪算法以利用待跟踪目标的时序信息获得更可靠的目标位置，降低目标人物发生剧烈姿态变化的可能性，可在待跟踪目标不处于交叉状态时获取可靠的目标位置；将人脸识别作为目标切换的第一优先级，以对时序跟踪目标进行修正，并通过利用人体识别以有效避免交叉阶段跟踪到错误的人物，降低当目标人物与其他人物无规律交叉时的跟踪错误，提高目标跟踪的准确性，且鲁棒性高。

上述基于视觉的目标跟踪系统可以实现为一种计算机程序的形式，该计算机程序可以在如图8所示的计算机设备上运行。

请参阅图8，图8是本申请实施例的一种计算机设备的示意性框图。该计算机设备30可以是终端。也可以是服务器，其中，终端可以是平板电脑、笔记本电脑和台式电脑等具有通信功能的电子设备。服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图8，该计算机设备30包括通过系统总线301连接的处理器302、存储器和网络接口305，其中，存储器可以包括非易失性存储介质303和内存储器304。该非易失性存储介质303可存储操作系统3031和计算机程序3032。该计算机程序3032包括程序指令，该程序指令被执行时，可使得处理器302执行一种基于视觉的目标跟踪方法。该处理器302用于提供计算和控制能力，以支撑整个计算机设备30的运行。该内存储器304为非易失性存储介质303中的计算机程序3032的运行提供环境，该计算机程序3032被处理器302执行时，可使得处理器302执行一种基于视觉的目标跟踪方法。该网络接口305用于与其它设备进行网络通信。本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备30的限定，具体的计算机设备30可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器302用于运行存储在存储器中的计算机程序3032，以实现一种基于视觉的目标跟踪方法，该目标跟踪方法包括：步骤A、读取当前帧图像，获取并保存当前帧图像的所有人物的人脸位置及人体位置；步骤B、获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；步骤C、判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，若不存在，执行步骤D；步骤D、根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若是，执行步骤E；步骤E、判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若不存在，则将时序跟踪目标的当前位置作为目标当前位置，执行步骤F；步骤F、保持跟踪，执行步骤G；步骤G、将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像，返回执行步骤A。

本申请实施例所提供的一种计算机设备，其内存储的计算机程序不限于如上的方法操作，还可以执行本申请任意实施例所提供的基于视觉的目标跟踪方法中的相关操作。

应当理解，在本申请实施例中，处理器302可以是中央处理单元(Central Processing Unit，CPU)，该处理器302还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序，其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器实现一种基于视觉的目标跟踪方法，该目标跟踪方法包括：步骤A、读取当前帧图像，获取并保存当前帧图像的所有人物的人脸位置及人体位置；步骤B、获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；步骤C、判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，若不存在，执行步骤D；步骤D、根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若是，执行步骤E；步骤E、判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若不存在，则将时序跟踪目标的当前位置作为目标当前位置，执行步骤F；步骤F、保持跟踪，执行步骤G；步骤G、将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像，返回执行步骤A。

本申请实施例所提供的一种存储介质，其内存储的计算机程序包括的程序指令不限于如上的方法操作，还可以执行本申请任意实施例所提供的基于视觉的目标跟踪方法中的相关操作。

所述存储介质可以是移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。技术人员可对每个特定的应用使用不同方法来实现所描述的功能，但这种实现不应认为超出本申请的范围。在本申请所提供的几个实施例中，应该理解到，所揭露的系统和方法，可通过其它的方式实现。本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例系统中的单元可以根据实际需要进行合并、划分和删减。另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

发明概述

技术问题

问题的解决方案

发明的有益效果

Claims

一种基于视觉的目标跟踪方法，其特征在于，包括：

步骤A、读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；

步骤B、获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；

步骤C、判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，若不存在，执行步骤D；

步骤D、根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态，若是，执行步骤E；

步骤E、判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，若不存在，将时序跟踪目标的当前位置作为目标当前位置，执行步骤F；

步骤F、保持跟踪，执行步骤G；

步骤G、将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像，返回执行步骤A。
如权利要求1所述的基于视觉的目标跟踪方法，其特征在于，所述步骤C具体包括：

步骤C1、获取所有不在所述时序跟踪目标的当前位置对应的区域内的人物对应的人脸特征，计算其与待跟踪目标的人脸模板之间的人脸相似度；

步骤C2、判断所述人脸相似度是否小于等于预设的人脸相似阈值，若是，执行步骤D。
如权利要求1所述的基于视觉的目标跟踪方法，其特征在于，所述步骤C还包括：

步骤c、若在时序跟踪目标的当前位置对应的区域外存在与待跟踪目标的人脸匹配的人物，将该人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，执行步骤G。
如权利要求1所述的基于视觉的目标跟踪方法，其特征在于，所述步骤D还包括：

步骤d、若时序跟踪目标不处于交叉状态，则将时序跟踪目标的当前位置作为目标当前位置，执行步骤G。
如权利要求1所述的基于视觉的目标跟踪方法，其特征在于，所述步骤E包括：

步骤E1、提取与时序跟踪目标发生交叉的其他人物的人体特征，计算所述其他人物的人体特征与待跟踪目标的人体模板之间的人体相似度；

步骤E2、判断所述人体相似度是否小于等于预设的人体相似阈值；

步骤E3、若是，将时序跟踪目标的当前位置作为目标当前位置，执行步骤F。
如权利要求1所述的基于视觉的目标跟踪方法，其特征在于，所述步骤E还包括：

步骤e、若与时序跟踪目标发生交叉的其他人物中存在与待跟踪目标的人体匹配的人物，将该人物切换为待跟踪目标，获取该人物的人体位置作为目标当前位置，执行步骤G。
如权利要求1所述的基于视觉的目标跟踪方法，其特征在于，所述步骤B前还具体包括：

步骤a1、判断是否已确定待跟踪目标，若是，执行步骤B，否则，执行步骤a2；

步骤a2、根据跟踪需求，在所有人物中确定待跟踪目标，提取并保存待跟踪目标的人脸模板和人体模板；

步骤a3、将待跟踪目标的人体位置作为目标当前位置，执行步骤G。
一种基于视觉的目标跟踪系统，其特征在于，包括：

人脸人体检测模块，用于读取当前帧图像，获取并保存当前帧图像中的所有人物的人脸位置及人体位置；

时序跟踪模块，用于获取前一帧图像及待跟踪目标的前一帧位置，根据所述当前帧图像、前一帧图像及待跟踪目标的前一帧位置，采用时序跟踪算法获取时序跟踪目标的当前位置；

人脸匹配模块，用于判断在时序跟踪目标的当前位置对应的区域外是否存在与待跟踪目标的人脸匹配的人物，并根据判断结果确定目标当前位置；

人体交叉判断模块，用于根据所述时序跟踪目标的当前位置与其他人物的人体位置判断时序跟踪目标是否处于交叉状态；

人体匹配模块，用于判断与时序跟踪目标发生交叉的其他人物中是否存在与待跟踪目标的人体匹配的人物，并根据判断结果确定目标当前位置；

更新模块，用于将目标当前位置作为待跟踪目标的前一帧位置，将当前帧图像作为前一帧图像。
一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器上存储有可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的基于视觉的目标跟踪方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被执行时实现如权利要求1-7任意一项所述的基于视觉的目标跟踪方法。