CN114677625B

CN114677625B - 目标检测方法、装置、设备、存储介质和程序产品

Info

Publication number: CN114677625B
Application number: CN202210271372.2A
Authority: CN
Inventors: 徐志良; 刘家铭; 洪智滨
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-03-18
Filing date: 2022-03-18
Publication date: 2023-09-08
Anticipated expiration: 2042-03-18
Also published as: CN114677625A

Abstract

本公开提供了一种目标检测方法、装置、设备、存储介质和程序产品，涉及深度学习、计算机视觉等人工智能技术领域。具体实现方案为：根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置；根据第二视频帧顺序对所述多帧进行关键点检测，获取所述多帧中每一帧的第二关键点位置，所述第一视频帧顺序和所述第二视频帧顺序相反；针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置。本公开可以提高目标检测的准确性。

Description

目标检测方法、装置、设备、存储介质和程序产品

技术领域

本公开涉及深度学习、计算机视觉等人工智能技术领域，具体涉及一种目标检测方法、装置、设备、存储介质和程序产品。

背景技术

在一些视频应用中往往对视频进行目标检测，目前目标检测主要是基于单帧的目标对齐方案，该方案中对于任一帧都是基于该帧的信息进行一次检测。

发明内容

本公开提供了一种目标检测方法、装置、设备、存储介质和程序产品。

根据本公开的一方面，提供了一种目标检测方法，包括：

根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置；

根据第二视频帧顺序对所述多帧进行关键点检测，获取所述多帧中每一帧的第二关键点位置，所述第一视频帧顺序和所述第二视频帧顺序相反；

针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置。

根据本公开的另一方面，提供了一种目标检测装置，包括：

第一检测模块，用于根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置；

第二检测模块，用于根据第二视频帧顺序对所述多帧进行关键点检测，获取所述多帧中每一帧的第二关键点位置，所述第一视频帧顺序和所述第二视频帧顺序相反；

确定模块，用于针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开提供的目标检测方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行本公开提供的目标检测方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开提供的目标检测方法。

本公开中，由于针对所述多帧中每一帧，根据第一视频帧顺序检测的第一关键点位置和根据第二视频帧顺序检测的第二关键点位置确定目标位置，从而可以提高目标检测的准确性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开提供一种目标检测方法的流程图；

图2是本公开提供的一种目标检测的示意图；

图3是本公开提供的一种目标检测装置的示意图；

图4是用来实现本公开实施例的目标检测方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

请参见图1，图1是本公开提供的一种目标检测方法的流程图，如图1所示，包括以下步骤：

步骤S101、根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置。

上述第一视频帧顺序可以是视频帧播放时间从先到后的顺序，也可以称作视频帧的正向顺序。

上述多帧为上述视频中的全部或者部分视频帧，且上述多帧可以为连续的多帧，具体可以根据实际的应用场景或者需求设定。

上述根据第一视频帧顺序对视频中多帧进行关键点检测可以是，基于视频帧的前一帧或者多帧的关键点检测位置对该视频帧进行关键点检测。例如：上述多帧中的第i帧，基于上述多帧中第i-1、第1-2等中至少一项的关键点检测位置对第i帧进行关键点检测，i为2至n中的任一整数，n为上述多帧的帧数。

本公开中，在一些应用场景中，上述关键点位置可以是人脸关键点位置，在另一些应用场景中，上述关键点位置可以是除人脸之外的其他目标对象关键点位置，例如：车辆、动物等目标，具体可以根据实际场景或者需求设定。

步骤S102、根据第二视频帧顺序对所述多帧进行关键点检测，获取所述多帧中每一帧的第二关键点位置，所述第一视频帧顺序和所述第二视频帧顺序相反。

上述第二视频帧顺序可以是视频帧播放时间从后到先的顺序，也可以称作视频帧的反向顺序。

上述根据第二视频帧顺序对所述多帧进行关键点检测可以是，基于视频帧的后一帧或者多帧的关键点检测位置对该视频帧进行关键点检测。例如：上述多帧中的第i帧，基于上述多帧中第i+1、第1+2等中至少一项的关键点检测位置对第i帧进行关键点检测。

需要说明的是，步骤S101和S102可以同时执行，也可以先后执行，如先执行步骤S101再执行步骤S102，或者，先执行步骤S102再执行步骤S101。

步骤S103、针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置。

上述针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置可以是，在第一关键点位置和第二关键点位置选择其中一个置信度最高的关键点位置作为目标位置；或者，上述针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置可以是，以所述第一关键点位置和第二关键点位置作为检测依据确定目标位置，例如：将第一关键点位置和第二关键点位置的重叠位置作为目标位置。

上述目标位置可以理解为，关键点检测的最终位置。

本公开中，通过上述步骤可以实现针对所述多帧中每一帧，根据第一视频帧顺序检测的第一关键点位置和根据第二视频帧顺序检测的第二关键点位置确定目标位置，从而可以提高目标检测的准确性。

以人脸检测为例，在实际中发现，未检测出关键点的帧往往更容易出现在某个场景的前几帧，例如：由于在遮挡和大侧脸等情况往往难以检测出人脸。这样，在本公开中，按照两种相反的视频帧顺序分别进行检测，除了按照正向视频帧顺序检测之外，还按照反向视频帧顺序检测，即通过将视频进行倒叙，从后往前重新检测一次，得到反向视频的人脸关键点位置，这样通过正向和反向追踪的策略能够极大地减少视频中不同场景的首帧出现丢帧的问题。

本公开中，上述目标检测方法由电子设备执行，即该方法中所有步骤由该电子设备执行，该电子设备包括但不限于：计算机、服务器、平板电脑、手机等电子设备。

作为一种可选的实施方式，第一帧的第一关键点位置是基于所述第一帧在所述第一视频帧顺序中的上一帧的第一关键点位置确定，所述第一帧为所述多帧中除所述第一视频帧顺序的首帧之外的任一帧；

第二帧的第二关键点位置是基于所述第二帧在所述第二视频帧顺序中的上一帧的第二关键点位置确定，所述第二帧为所述多帧中除所述第二视频帧顺序的首帧之外的任一帧。

上述第一帧的第一关键点位置基于所述第一帧在所述第一视频帧顺序中的上一帧的第一关键点位置确定可以是，基于第一帧的上一帧的第一关键点位置确定第一帧的目标区域，以实现目标追踪，再对该目标区域进行关键点检测，得到第一帧的第一关键点位置。也就是说，将上一帧的第一关键点位置作为第一帧的参考检测位置，基于该参考检测位置进行关键点检测，得到第一帧的第一关键点位置。例如：对于人脸检测，可以通过上一帧的人脸关键点检测结果来裁剪人脸区域，再对该人脸区域进行关键点检测，得到第一帧的人脸关键点位置。

上述第一帧为所述多帧中除所述第一视频帧顺序的首帧之外的任一帧可以理解为，在上述多帧中，除了第一视频帧顺序的首帧之外，其余帧的第一关键点位置都是基于上一帧的第一关键点位置检测得到。

上述第二帧的检测同理，此处不作赘述。需要说明的是，第二帧的上一帧与第一帧的上一帧不同，例如：上述多帧包括n帧，按照上述第一视频帧顺序依次为：帧1,帧2,帧3,…,帧n-2,帧n-1,帧n，帧2的上一帧为帧1，帧3的上一帧为帧2；按照上述第二视频帧顺序依次为：帧n,帧n-1,帧n-2,…,帧4,帧3,帧2,帧1，帧2的上一帧为帧3，帧3的上一帧为帧4。

该实施方式中，由于在第一视频帧顺序和第二视频帧顺序中，除了首帧之外，其余帧的第一关键点位置都是基于上一帧的第一关键点位置检测得到，这样可以提高检测的准确性，因为，在视频中目标的位置往往是连续的。

该实施方式中，对于首帧可以通过预先获取的目标检测算法先检测出目标框，以得到目标的大致位置，再使用关键点检测器得到关键点位置。之后，利用上一帧的关键点位置作为目标框的位置，以实现目标追踪。

需要说明的是，本公开中并不限定基于上一帧的第一关键点位置检测，例如：在一些实施方式或者场景中，也可以基于当前帧的前面多帧的第一目标点位置进行检测。

作为一种可选的实施方式，图1所示的实施例中的步骤S103，包括：

从所述第一关键点位置和第二关键点位置中选择第一置信度对应的第三关键点位置，所述第一置信度为所述第一关键点位置和所述第二关键点位置对应的置信度中最高的置信度；

针对所述多帧中每一帧，将第三关键点位置确定为所述目标位置。

在该实施方式中，图1所示的实施例中的步骤S101，可以包括：

根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置，以及所述第一关键点位置的置信度；

在该实施方式中，图1所示的实施例中的步骤S102，可以包括：

根据第二视频帧顺序对所述多帧进行关键点检测，得到所述多帧中每一帧的第二关键点位置，以及所述第二关键点位置的置信度。

上述第一关键点位置，以及第一关键点位置的置信度可以是，通过预先设置的目标检测模型检测的第一关键点位置，以及第一关键点位置的置信度；或者，上述第一关键点位置，以及第一关键点位置的置信度可以是，通过预先设置的关键点检测算法检测的第一关键点位置，以及第一关键点位置的置信度。

上述第二关键点位置，以及第二关键点位置的置信度的检测同理，此处不作赘述。

上述将第三关键点位置确定为所述目标位置可以是，针对每一帧都选择该帧中置信度最高的关键点位置作为目标位置。

该实施方式中，由于将所述第一关键点位置和第二关键点位置中置信度高的第三关键点位置确定为目标位置，从而可以提高关键点的准确性。

例如：以人脸检测为例，上述多帧包括n帧，如图2所示，按照上述第一视频帧顺序依次为：帧1,帧2,帧3,…,帧n；按照上述第二视频帧顺序依次为：帧n,帧n-1,帧n-2,…帧1。在步骤S101中根据第一视频帧顺序进行人脸检测，得到基于追踪的人脸对齐的检测结果，在步骤S102中根据第二视频帧顺序进行人脸检测，得到基于追踪的人脸对齐的检测结果，对于任一帧选择置信度最高的最终检测结果。

作为一种可选的实施方式，图1所示的实施例中的步骤S101包括：

基于第三帧的第一关键点位置对第四帧进行关键点检测，获取所述第四帧的候选关键点位置，所述第三帧为所述多帧中的任一帧，所述第四帧为所述第三帧的下一帧；

响应于确定所述候选关键点位置的置信度低于预设第一阈值，确定所述关键点的候选位置；

基于所述候选位置检测所述第四帧的第一关键点位置。

上述第四帧的候选关键点位置的置信度低于预设第一阈值可以表示，上述第四帧的候选关键点位置的检测是错误的。

上述估计所述第四帧的关键点的估计位置可以是，基于预先获取的目标检测算法或者目标检测器检测第四帧的目标大致位置；上述基于所述估计位置检测所述第四帧的第一关键点位置可以是，在该估计位置的基础上往复检测，得到第四帧的第一关键点位置，以及第一关键点位置的置信度，例如：基于预先获取的关键点检测算法或者模型，在该估计位置的基础上检测第一关键点位置，以及第一关键点位置的置信度。

该实施方式中，可以实现对于候选关键点位置的置信度低于预设第一阈值的视频帧，基于估计位置检测第一关键点位置，这样可以提高检测的准确性。

需要说明的是，在该实施方式中，对于候选关键点位置的置信度高于或者等于预设第一阈值的视频帧，候选关键点位置为该帧的第一关键点位置。

另外，对于第二视频帧顺序的检测同理，此处不作赘述。

基于第五帧的第一关键点位置对第六帧进行关键点检测，得到所述第六帧的候选关键点位置，所述第五帧为所述多帧中的任一帧，所述第六帧为所述第五帧的下一帧；

响应于确定所述候选关键点位置与所述第五帧的第一关键点位置的距离大于预设第二阈值，基于所述候选关键点位置检测所述第六帧的第一关键点位置。

上述第六帧的候选关键点位置与所述第五帧的第一关键点位置的距离大于预设第二阈值可以理解为，第六帧和第五帧的关键点位置相差一定距离，例如：由于第五帧的关键点位置检测不准确导致的第六帧和第五帧的关键点位置相差一定距离。

上述基于所述第六帧的候选关键点位置对所述第六帧进行关键点检测，得到所述第六帧的第一关键点位置可以是，基于第六帧的候选关键点位置，重新确定第六帧的目标区域，再对该目标区域进行关键点检测，得到第六帧的第一关键点位置。

该实施方式中，由于候选关键点位置对与上一帧的第一关键点位置的距离大于预设第二阈值的视频帧，基于候选关键点位置再次进行检测，以实现通过两次的迭代检测得到第一关键点位置，从而使得检测的关键点位置更加准确。

例如：对于人脸检测，如果当前帧预测的人脸关键点位置和上一帧预测的人脸关键点位置差值超过某个阈值，则使用当前帧的人脸关键点位置重新裁剪出人脸区域进行检测，这样通过两次的迭代检测能得到更准确的人脸关键点。

需要说明的是，在该实施方式中，对于候选关键点位置对与上一帧的第一关键点位置的距离小于或者等于预设第二阈值，候选关键点位置为该帧的第一关键点位置。

另外，对于第二视频帧顺序的检测同理，此处不作赘述。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

请参见图3，图3是本公开提供的一种目标检测装置的结构图，如图3所示，目标检测装置300包括：

第一检测模块301，用于根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置；

第二检测模块302，用于根据第二视频帧顺序对所述多帧进行关键点检测，获取所述多帧中每一帧的第二关键点位置，所述第一视频帧顺序和所述第二视频帧顺序相反；

确定模块303，用于针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置。

可选的，第一帧的第一关键点位置是基于所述第一帧在所述第一视频帧顺序中的上一帧的第一关键点位置确定，所述第一帧为所述多帧中除所述第一视频帧顺序的首帧之外的任一帧；

可选的，所述确定模块303用于针对所述多帧中每一帧，将第三关键点位置确定为所述目标位置；

其中，所述第三关键点位置为所述第一关键点位置和第二关键点位置中第一置信度对应的关键点位置，所述第一置信度为所述第一关键点位置和所述第二关键点位置对应的置信度中最高的置信度。

可选的，所述第一检测模块301用于：

基于所述候选位置检测所述第四帧的第一关键点位置。

可选的，所述第一检测模块301用于：

本公开提供的目标检测装置能够实现图1所示的方法实施例实现的各个过程，并达到相同的技术效果，为避免重复，这里不再赘述。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图4示出了可以用来实施本公开的实施例的示例电子设备400的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图4所示，设备400包括计算单元401，其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元408加载到随机访问存储器(RAM)403中的计算机程序，来执行各种适当的动作和处理。在RAM 403中，还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

设备400中的多个部件连接至I/O接口405，包括：输入单元406，例如键盘、鼠标等；输出单元407，例如各种类型的显示器、扬声器等；存储单元408，例如磁盘、光盘等；以及通信单元409，例如网卡、调制解调器、无线通信收发机等。通信单元409允许设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理，例如目标检测方法。例如，在一些实施例中，目标检测方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元408。在一些实施例中，计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到设备400上。当计算机程序加载到RAM 403并由计算单元401执行时，可以执行上文描述的目标检测方法的一个或多个步骤。备选地，在其他实施例中，计算单元401可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行目标检测方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种目标检测方法，包括：

针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置；

其中，所述根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置，包括：

响应于确定所述候选关键点位置与所述第五帧的第一关键点位置的距离大于预设第二阈值，基于所述第六帧的候选关键点位置，重新确定所述第六帧的目标区域，再对所述目标区域进行关键点检测，得到所述第六帧的第一关键点位置。

2.根据权利要求1所述的方法，其中，第一帧的第一关键点位置是基于所述第一帧在所述第一视频帧顺序中的上一帧的第一关键点位置确定，所述第一帧为所述多帧中除所述第一视频帧顺序的首帧之外的任一帧；

3.根据权利要求1所述的方法，其中，所述针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置，包括：

针对所述多帧中每一帧，将第三关键点位置确定为所述目标位置；

4.根据权利要求1至3中任一项所述的方法，其中，所述根据第一视频帧顺序对视频中多帧进行关键点检测，获取所述多帧中每一帧的第一关键点位置，包括：

基于所述候选位置检测所述第四帧的第一关键点位置。

5.一种目标检测装置，包括：

确定模块，用于针对所述多帧中每一帧，根据所述第一关键点位置和第二关键点位置确定目标位置；

其中，所述第一检测模块用于：

6.根据权利要求5所述的装置，其中，第一帧的第一关键点位置是基于所述第一帧在所述第一视频帧顺序中的上一帧的第一关键点位置确定，所述第一帧为所述多帧中除所述第一视频帧顺序的首帧之外的任一帧；

7.根据权利要求6所述的装置，其中，所述确定模块用于针对所述多帧中每一帧，将第三关键点位置确定为所述目标位置；

8.根据权利要求5至7中任一项所述的装置，其中，所述第一检测模块用于：

基于所述候选位置检测所述第四帧的第一关键点位置。

9.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一项所述的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-4中任一项所述的方法。

11.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-4中任一项所述的方法。