WO2022021028A1

WO2022021028A1 - 目标检测方法、装置、无人机及计算机可读存储介质

Info

Publication number: WO2022021028A1
Application number: PCT/CN2020/104972
Authority: WO
Inventors: 丁旭; 郭亚娜; 张李亮
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2020-07-27
Filing date: 2020-07-27
Publication date: 2022-02-03
Also published as: CN113168532A

Abstract

一种目标检测方法、装置（400）、无人机（200）及计算机可读存储介质，其中方法包括：获取拍摄装置（201）拍摄待跟踪目标得到的当前拍摄图像（S101）；将当前拍摄图像输入预设的3D目标检测模型进行处理，得到待跟踪目标的3D目标检测信息（S102），能够准确且全面地对目标进行检测。

Description

目标检测方法、装置、无人机及计算机可读存储介质

技术领域

本申请涉及目标检测技术领域，尤其涉及一种目标检测方法、装置、无人机及计算机可读存储介质。

背景技术

目前，无人机可以实现对目标进行跟踪拍摄，在对目标进行跟踪拍摄时需要对目标进行检测。目前，无人机主要采用2D目标检测算法对目标进行检测，但2D目标检测算法仅能提供目标在二维图片中的位置和对应类别的置信度，在一些情况下，由于遮挡和交错等情况的出现，仅通过目标在二维图片中的位置和对应类别的置信度是无人机无法准确的跟踪目标的，对此需要通过图像识别目标的更多信息，例如，目标的大小、目标相对于无人机的角度等。因此，如何准确且全面地对目标进行检测是目前亟待解决的问题。

发明内容

基于此，本申请实施例提供了一种目标检测方法、装置、无人机及计算机可读存储介质，旨在准确且全面地对目标进行检测。

第一方面，本申请实施例提供了一种目标检测方法，应用于无人机，所述无人机包括拍摄装置，所述方法包括：

获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息；

其中，所述3D目标检测模型是预先训练好的神经网络模型，所述3D目标检测信息包括所述待跟踪目标在世界坐标系下的第一尺寸信息和所述待跟踪目标相对于所述无人机的角度信息。

第二方面，本申请实施例还提供了一种目标检测装置应用无人机，所述无人机包括拍摄装置，所述目标检测装置包括存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现如上所述的目标检测方法的步骤。

第三方面，本申请实施例还提供了一种无人机，所述无人机包括拍摄装置、存储器和处理器；

所述存储器，用于存储计算机程序；

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如上所述的目标检测方法的步骤。

本申请实施例提供了一种目标检测方法、装置、无人机及计算机可读存储介质，通过获取拍摄装置拍摄待跟踪目标得到的当前拍摄图像，并将当前拍摄图像输入预设的3D目标检测模型进行处理，得到包括待跟踪目标在世界坐标系下的第一尺寸信息和待跟踪目标相对于无人机的角度信息的3D目标检测信息，通过3D目标检测模型能够准确且全面地对目标进行检测，得到3D目标检测信息，便于无人机基于3D目标检测信息对待跟踪目标进行跟踪，极大地提高了用户体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是实施本申请实施例提供的目标检测方法的一场景示意图；

图2是本申请实施例提供的一种目标检测方法的步骤示意流程图；

图3是本申请实施例提供的另一种目标检测方法的步骤示意流程图；

图4是本申请的实施例提供的目标跟踪的场景示意图；

图5是本申请的实施例提供的拍摄图像中包括多个目标对象的场景示意图；

图6是图3中的目标检测方法的子步骤示意流程图；

图7是本申请实施例提供的又一种目标检测方法的步骤示意流程图；

图8是本申请实施例提供的一种目标检测装置的结构示意性框图；

图9是本申请实施例提供的一种无人机的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

附图中所示的流程图仅是示例说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解、组合或部分合并，因此实际执行的顺序有可能根据实际情况改变。

下面结合附图，对本申请的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

基于上述问题，本申请实施例提供一种目标检测方法、装置、无人机及计算机可读存储介质，该目标检测方法可以应用于目标检测装置，也可以应用于无人机。请参阅图1，图1是实施本申请实施例提供的目标检测方法的一场景示意图。如图1所示，该场景包括控制终端100和无人机200，控制终端100与无人机200通信连接，用于控制无人机200的飞行，无人机200用于对待跟踪目标进行目标检测，得到待跟踪目标的3D目标检测信息，以便无人机200后续基于待跟踪目标的3D目标检测信息对待跟踪目标进行跟踪拍摄，并将跟踪拍摄的图像，利用无线图传技术发送至控制终端100进行显示。

具体地，控制终端100包括显示装置101，显示装置101用于显示无人机拍摄的图像。需要说明的是，显示装置101包括设置在控制终端100上的显示屏或者独立于控制终端100的显示器，独立于控制终端100的显示器可以包括手机、平板电脑或者个人电脑等，或者也可以是带有显示屏的其他电子设备。其中，该显示屏包括LED显示屏、OLED显示屏、LCD显示屏等等。

无人机200包括拍摄装置201，拍摄装置201用于对待跟踪目标进行拍摄，得到当前拍摄图像，并将当前拍摄图像发给无人机，由无人机根据当前拍摄图像对待跟踪目标进行检测。拍摄装置201具体可以包括一个摄像头，即单目拍摄方案；也可以包括两个摄像头，即双目拍摄方案。

无人机200可以是旋翼飞机。在某些情形下，无人机200可以是可包括多个旋翼的多旋翼飞行器。多个旋翼可旋转而为无人机200产生提升力。旋翼可以是推进单元，可使得无人机200在空中自由移动。旋翼可按相同速率旋转和/或可产生相同量的提升力或推力。旋翼可按不同的速率随意地旋转，产生不同量的提升力或推力和/或允许无人机200旋转。在某些情形下，在无人机200上可提供一个、两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个旋翼。这些旋翼可布置成其旋转轴彼此平行。在某些情形下，旋翼的旋转轴可相对于彼此呈任意角度，从而可影响无人机200的运动。

无人机200可包括多个旋翼。旋翼可连接至无人机200的本体，无人机200的本体可包含控制单元、惯性测量单元(inertial measuring unit，IMU)、处理器、电池、电源和/或其他传感器。旋翼可通过从本体中心部分分支出来的一个或多个臂或延伸而连接至本体。例如，一个或多个臂可从无人机200的中心本体放射状延伸出来，而且在臂末端或靠近末端处可具有旋翼。示例性的，无人机200可例如为四旋翼无人机、六旋翼无人机、八旋翼无人机。当然，也可以是固定翼无人机，还可以是旋翼型与固定翼无人机的组合，在此不作限定。

以下，将结合图1中的场景对本申请的实施例提供的目标检测方法进行详细介绍。需知，图1中的场景仅用于解释本申请实施例提供的目标检测方法，但并不构成对本申请实施例提供的目标检测方法应用场景的限定。

请参阅图2，图2是本申请实施例提供的一种目标检测方法的步骤示意流程图。该目标检测方法应用于无人机，用于准确且全面地对目标进行检测。

如图2所示，该目标检测方法包括步骤S101至步骤S102。

S101、获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像。

S102、将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息。

在对待跟踪目标进行目标检测时，需要获取包含待跟踪目标的当前拍摄图像，具体可以通过拍摄装置拍摄待跟踪目标所在空间区域的图像，得到包含待跟踪目标得到的当前拍摄图像，并将当前拍摄图像输入预设的3D目标检测模型进行处理，得到待跟踪目标的3D目标检测信息。其中，预设的3D目标检测模型是预先训练好的神经网络模型，3D目标检测信息包括待跟踪目标在世界坐标系下的第一尺寸信息和待跟踪目标相对于无人机的角度信息。

在一实施例中，3D目标检测信息还包括待跟踪目标在相机坐标系下的位置信息和待跟踪目标在当前拍摄图像内的第二尺寸信息和待跟踪目标在相机坐标系下的位置信息，待跟踪目标相对于无人机的角度信息包括待跟踪目标相对于无人机的yaw角、pitch角和roll角，第一尺寸信息包括待跟踪目标在世界坐标系下的长度信息、宽度信息和/或高度信息，第二尺寸信息包括待跟踪目标在当前拍摄图像内的长度信息、宽度信息和/或高度信息。

在一实施例中，对神经网络模型进行训练得到3D目标检测模型的方式可以为：获取训练样本数据，其中，训练样本数据包括多个样本图像以及每个样本图像中的待跟踪目标的3D目标检测信息；根据训练样本数据对神经网络模型进行迭代训练，直到迭代训练后的神经网络模型收敛，得到3D目标检测模型。其中，神经网络模型包括但不限于卷积神经网络模型CNN、RCNN、Fast RCNN和Faster RCNN。通过包括待跟踪目标相对于无人机的yaw角、pitch角和roll角、待跟踪目标在相机坐标系下的位置信息和待跟踪目标在世界坐标系下的第一尺寸信息等的3D目标检测信息和对应的图像对神经网络模型进行训练，能够解决现有的3D目标检测算法无法在无人机上复用的问题，使得无人机能够基于3D目标检测模型对待跟踪目标进行目标检测，便于后续无人机对待跟踪目标进行跟踪拍摄，极大地提高了用户体验。

上述实施例提供的目标检测方法，通过获取拍摄装置拍摄待跟踪目标得到的当前拍摄图像，并将当前拍摄图像输入预设的3D目标检测模型进行处理，得到包括待跟踪目标在世界坐标系下的第一尺寸信息和待跟踪目标相对于无人机的角度信息的3D目标检测信息，通过3D目标检测模型能够准确且全面地对目标进行检测，得到3D目标检测信息，便于无人机基于3D目标检测信息对待跟踪目标进行跟踪，极大地提高了用户体验。

请参阅图3，图3是本申请实施例提供的另一种目标检测方法的步骤示意流程图。

具体地，如图3所示，该目标检测方法包括步骤S201至S203。

S201、获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

S202、将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息；

S203、根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄。

一般情况下，在获取包含待跟踪目标的当前拍摄图像之后，即可以基于目标跟踪算法，根据当前拍摄图像中的待跟踪目标的图像特征对待跟踪目标进行跟踪拍摄。然而由于在实际跟踪过程中，常常会出现与该跟踪目标类似的目标对象的影响，并且还可能会有遮挡和交错等情况的出现，因此会导致待跟踪目标的跟踪丢失。其中，目标跟踪算法包括均值漂移算法、Kalman滤波算法、粒子滤波算法、对运动目标建模算法中任意一种。在其他一些实施例中，还可以使用其他目标跟踪算法，在此不做限定。

示例性的，如图4所示，无人机200通过拍摄装置201对待跟踪目标(车辆A)进行拍摄，得到包括该车辆A的当前拍摄图像。无人机200获取该包含该车辆A的当前拍摄图像，并根据当前拍摄图像对车辆A进行跟踪拍摄，并将跟踪拍摄的当前拍摄图像发送给控制终端100进行显示，以及在定位的待跟踪目标上显示跟踪标识，如图4中控制终端100的显示装置101显示的车辆的定位框。

示例性的，如图5所示，如果在对车辆A进行跟踪的过程中，若当前拍摄图像中出现多个车辆，比如为车辆1、车辆2、车辆3和车辆4，其中，车辆3和车辆4又是相同类型的车辆。假设车辆3和车辆4中有一辆车是待跟踪目标(车辆A)，由于车辆A所在的当前拍摄图像中出现多辆车辆，还包括与车辆A完全相同的车辆，由此若此时出现遮挡或交错等原因，可能会导致待跟踪目标跟踪丢失的情况出现。其中，待跟踪目标跟踪丢失的情况包括：无法区别哪一个车辆为待跟踪目标或者跟踪到错误的目标对象。

为此，在对待跟踪目标进行跟踪时，获取拍摄装置拍摄待跟踪目标得到的当前拍摄图像；将当前拍摄图像输入预设的3D目标检测模型进行处理，得到待跟踪目标的3D目标检测信息；根据待跟踪目标的3D目标检测信息对待跟踪目标进行跟踪拍摄。由于3D目标检测信息包括待跟踪目标相对于无人机的角度信息，也即不同的目标对象相对于无人机的角度信息大概率存在不同，因此在跟踪待跟踪目标的过程中，当出现多个目标对象时，使用3D目标检测信息中的目标对象相对于无人机的角度信息可以确定待跟踪目标，能够克服仅根据图像信息进行跟踪导致的错跟和跟丢的问题，极大地提高目标跟踪的准确率。

在一实施例中，如图6所示，步骤S203具体包括：子步骤S2031至S2032。

S2031、根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标。

在一实施例中，根据3D目标检测信息和预设目标跟踪算法，能够预测得到待跟踪目标在世界坐标系下的下一时刻的目标位置坐标。其中，预设目标跟踪算法包括均值漂移算法、Kalman滤波算法、粒子滤波算法、对运动目标建模算法中任意一种。在其他一些实施例中，还可以使用其他目标跟踪算法，在此不做限定。

在一实施例中，根据3D目标检测信息和预设目标跟踪算法，预测待跟踪目标在世界坐标系下的目标位置坐标的方式可以为：根据3D目标检测信息中的第一目标检测信息和预设目标跟踪算法，预测待跟踪目标在世界坐标系下的第一候选位置坐标；根据3D目标检测信息中的第二目标检测信息和预设目标跟踪算法，预测待跟踪目标在世界坐标系下的第二候选位置坐标；根据第一候选位置坐标和第二候选位置坐标，确定待跟踪目标在世界坐标系下的目标位置坐标。其中，第一目标检测信息包括待跟踪目标在世界坐标系下的第一尺寸信息和待跟踪目标相对于无人机的角度信息，第二目标检测信息包括待跟踪目标在当前拍摄图像内的位置信息和第二尺寸信息。通过融合待跟踪目标在世界坐标系下的信息和待跟踪目标当前拍摄图像内的信息，能够准确地预测待跟踪目标在世界坐标系下的目标位置坐标，便于对待跟踪目标进行跟踪，能够克服仅根据图像信息进行跟踪导致的错跟和跟丢的问题。

在一实施例中，根据第一候选位置坐标和第二候选位置坐标，确定待跟踪目标在世界坐标系下的目标位置坐标的方式可以为：获取第一预设系数和第二预设系数；计算第一预设系数与第一候选位置坐标的乘积，得到第一权重位置坐标，并计算第二预设系数与第二候选位置坐标的乘积，得到第二权重位置坐标；将第一权重位置坐标与第二权重位置坐标相加，得到待跟踪目标在世界坐标系下的目标位置坐标。其中，第一预设系数与第二预设系数之和为1，第一预设系数和第二预设系数可基于实际情况进行设置，本申请实施例对此不做具体限定，例如，第一预设系数为0.65，第二预设系数为0.35。

S2032、根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄。

在预测到待跟踪目标在世界坐标系下的目标位置坐标后，基于该目标位置坐标控制无人机对待跟踪目标进行跟踪拍摄，使得待跟踪目标始终位于拍摄装置的拍摄画面的中央位置、无人机相对待跟踪目标静止和/或无人机与待跟踪目标之间的距离始终为固定距离。

在一实施例中，待跟踪目标的3D目标检测信息包括待跟踪目标在相机坐标系下的位置信息，根据目标位置坐标控制无人机对待跟踪目标进行跟踪拍摄的方式可以为：将待跟踪目标在相机坐标系下的位置信息转换为待跟踪目标在世界坐标系下的第一位置信息；获取无人机的第二位置信息，并根据第一位置信息和第二位置信息，确定待跟踪目标与无人机之间的目标距离；根据目标位置坐标和目标距离，控制无人机对待跟踪目标进行跟踪拍摄，使得无人机与待跟踪目标之间的距离始终为目标距离。其中，无人机的第二位置信息可以根据无人机的定位装置在当前时刻采集到的位置信息，定位装置包括全球定位系统(Global Positioning System，GPS)定位装置和实时动态(Real-time kinematic，RTK)定位装置中的任一项。通过目标位置坐标和目标距离，控制无人机对待跟踪目标进行跟踪拍摄能够保证无人机与待跟踪目标之间的距离始终为目标距离，提高用户体验。

在一实施例中，根据目标位置坐标和目标距离，控制无人机对待跟踪目标进行跟踪拍摄的方式可以为：根据待跟踪目标在世界坐标系下的目标位置坐标和无人机的第二位置信息，确定待跟踪目标的位置处于目标位置坐标对应的位置时无人机与待跟踪目标之间的距离预测值；确定该目标距离与该距离预测值的差值，并基于目标距离与该距离预测值的差值和无人机的第二位置信息，确定无人机的目标位置；控制无人机由当前位置飞行至目标位置，并在该目标位置对待跟踪目标进行跟踪拍摄，使得无人机达到目标位置时无人机与待跟踪目标之间的距离为该目标距离。

在一实施例中，根据目标位置坐标和目标距离，控制无人机对待跟踪目标进行跟踪拍摄的方式可以为：根据待跟踪目标的3D目标检测信息，确定待跟踪目标的运动速度；根据待跟踪目标的运动速度，控制无人机对待跟踪目标进行跟踪拍摄，使得无人机相对待跟踪目标静止，即控制无人机按照与该运动速度相同的飞行速度飞行，使得无人机相对待跟踪目标静止。通过在无人机跟踪拍摄待跟踪目标的过程中，保证无人机相对待跟踪目标静止，便于无人机通过拍摄装置拍摄待跟踪目标，提高用户体验。

在一实施例中，根据目标位置坐标和目标距离，控制无人机对待跟踪目标进行跟踪拍摄的方式可以为：根据待跟踪目标的3D目标检测信息，确定待跟踪目标的运动速度；根据待跟踪目标的目标位置坐标、运动速度和目标距离，控制无人机对待跟踪目标进行跟踪拍摄，使得无人机相对待跟踪目标静止，且无人机与待跟踪目标之间的距离始终为目标距离。通过在无人机跟踪拍摄待跟踪目标的过程中，保证无人机相对待跟踪目标静止，且无人机与待跟踪目标之间的距离始终为目标距离，便于无人机通过拍摄装置拍摄待跟踪目标，提高用户体验。

在一实施例中，根据待跟踪目标的3D目标检测信息，确定待跟踪目标的运动速度的方式可以为：获取待跟踪目标的3D目标检测信息中的待跟踪目标在相机坐标系下的位置坐标，并将待跟踪目标在相机坐标系下的位置坐标转换为待跟踪目标在世界坐标系下的当前位置坐标；获取待跟踪目标在世界坐标系下的历史位置坐标，并基于待跟踪目标在世界坐标系下的当前位置坐标和历史位置坐标，确定待跟踪目标的运动距离；根据待跟踪目标在世界坐标系下的当前位置坐标的第一采集时刻和历史位置坐标的第二采集时刻，确定待跟踪目标的运动时长；根据待跟踪目标的运动距离和运动时长，确定待跟踪目标的运动速度。其中，待跟踪目标在世界坐标系下的历史位置坐标为在上一个时刻确定的待跟踪目标在世界坐标系下的位置坐标。

在一实施例中，根据目标位置坐标控制无人机对待跟踪目标进行跟踪拍摄的方式可以为：根据该目标位置坐标，确定无人机上的拍摄装置的目标姿态；根据目标姿态控制无人机对待跟踪目标进行跟踪拍摄，使得待跟踪目标始终位于拍摄装置的拍摄画面的中央位置。通过在无人机跟踪拍摄待跟踪目标的过程中，保证待跟踪目标始终位于拍摄装置的拍摄画面的中央位置，便于用户观看和控制无人机的拍摄装置对待跟踪目标进行拍摄，极大地提高了用户体验。

在一实施例中，根据该目标位置坐标，确定无人机上的拍摄装置的目标姿态的方式可以为：将该目标位置坐标转换为图像坐标系下的第一像素坐标，并获取拍摄画面的中央位置的第二像素坐标；根据第一像素坐标和第二像素坐标，确定待跟踪目标相对于拍摄画面的中央位置的方位信息，并根据待跟踪目标相对于拍摄画面的中央位置的方位信息，确定无人机上的拍摄装置的目标姿态，使得当无人机的拍摄装置的姿态为该目标姿态时待跟踪目标位于拍摄画面的中央位置。

在一实施例中，根据目标姿态控制无人机对待跟踪目标进行跟踪拍摄的方式可以为：将无人机上的拍摄装置的姿态调整为该目标姿态，使得待跟踪目标始终位于拍摄装置的拍摄画面的中央位置。其中，可以通过调整搭载拍摄装置的云台来改变拍摄装置的姿态，也可以通过调整无人机的飞行姿态来改变拍摄装置的姿态，还可以通过同时调整搭载拍摄装置的云台和无人机的飞行姿态来改变拍摄装置的姿态。

上述实施例提供的目标检测方法，通过在对待跟踪目标进行跟踪时，获取拍摄装置拍摄待跟踪目标得到的当前拍摄图像；将当前拍摄图像输入预设的3D目标检测模型进行处理，得到待跟踪目标的3D目标检测信息；根据待跟踪目标的3D目标检测信息对待跟踪目标进行跟踪拍摄，能够克服仅根据图像信息进行跟踪导致的错跟和跟丢的问题，可以提高目标跟踪的准确率。

请参阅图7，图7是本申请实施例提供的又一种目标检测方法的步骤示意流程图。

如图7所示，该目标检测方法包括步骤S301至步骤S304。

S301、获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

S302、将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息；

S303、当确定所述当前拍摄图像包括多个目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标；

S304、根据所述待跟踪目标的3D目标检测信息对所述待跟踪目标进行跟踪拍摄。

由于不同的目标对象有可能类型比较类似或者完全相同，比如差不多身高和胖瘦的行人，或者类似车型的车辆，或者完全相同的车辆，导致这些目标对象的图像特征比较相近，因此根据图像特征对待跟踪目标进行跟踪的话，可能无法区分。但是不同的目标对象对应的3D目标检测信息大概率存在不同，因此在对待跟踪目标进行跟踪的过程中，获取拍摄装置拍摄待跟踪目标得到的当前拍摄图像，并将当前拍摄图像输入预设的3D目标检测模型进行处理，得到待跟踪目标的3D目标检测信息，然后当确定当前拍摄图像包括多个目标对象时，根据多个目标对象的3D目标检测信息从多个目标对象中确定待跟踪目标，最后根据待跟踪目标的3D目标检测信息对待跟踪目标进行跟踪拍摄。能够克服仅根据图像信息进行跟踪导致的错跟和跟丢的问题，极大地提高目标跟踪的准确率。

在一实施例中，根据多个目标对象的3D目标检测信息从多个目标对象中确定待跟踪目标的方式可以为：根据多个目标对象的3D目标检测信息，确定多个目标对象的运动信息；根据待跟踪目标的3D目标检测信息确定待跟踪目标的运动信息；根据待跟踪目标的运动信息和多个目标对象的运动信息，计算待跟踪目标与多个目标对象的相似度；根据待跟踪目标与多个目标对象的相似度从多个目标对象中确定待跟踪目标。其中，该运动信息包括速度信息和/或位置信息，该速度信息为目标对象或待跟踪目标的速度大小和/或方向，该位置信息为待跟踪目标或待跟踪目标的坐标，具体可以为在世界坐标系下的坐标。通过待跟踪目标与多个目标对象的相似度可以准确地从多个目标对象中确定待跟踪目标，便于后续对待跟踪目标进行跟踪，克服仅根据图像信息进行跟踪导致的错跟和跟丢的问题，极大地提高目标跟踪的准确率。

在一实施例中，由于运动信息包括位置信息和/或速度信息。相应地，待跟踪目标与目标对象的相似度包括位置相似度和/或速度相似度。由此，根据待跟踪目标与多个目标对象的相似度从多个目标对象中确定待跟踪目标的方式可以为：根据待跟踪目标与多个目标对象的位置相似度，从多个目标对象中确定待跟踪目标；或者，根据待跟踪目标与多个目标对象的速度相似度，从多个目标对象中确定待跟踪目标；再或者，根据待跟踪目标与多个目标对象的位置相似度和速度相似度，从多个目标对象中确定待跟踪目标。需要说明的是，根据位置相似度和速度相似度，从多个目标对象中确定待跟踪目标，可以根据位置相似度和速度相似度之和，确定最大的和值对应的目标对象为待跟踪目标。

在一实施例中，为了提高待跟踪目标确定的准确率。根据待跟踪目标与多个目标对象的相似度从多个目标对象中确定待跟踪目标的方式可以为：获取位置相似度对应的第一预设权重，以及速度相似度对应的第二预设权重；根据位置相似度、速度相似度、第一预设权重和第二预设权重，从多个目标对象中确定所述待跟踪目标。其中，第一预设权重和第二预设权重可基于实际情况进行设置，本申请实施例对此不做具体限定。

在一实施例中，根据位置相似度、速度相似度、第一预设权重和第二预设权重，从多个目标对象中确定所述待跟踪目标的方式可以为：计算位置相似度与第一预设权重的乘积，以及计算速度相似度与第二预设权重的乘积；再计算两个乘积之和，将两个乘积之和作为待跟踪目标与目标对象的最终相似度，将最大的最终相似度对应的目标对象确定为待跟踪目标。利用预设权重可以调整位置信息和速度信息之间的影响大小，因此能够更为准确地确定待跟踪目标，进而提高目标跟踪的准确率。

在一实施例中，位置相似度对应的第一预设权重小于速度相似度对应的第二预设权重。由于位置信息在前后帧拍摄图像中有较小的变化，而速度信息在前后帧拍摄图像中则基本不变，因此通过设置不同权重比例，提高速度相似度的占比，可以提高跟踪目标确定的准确率，进而提高目标跟踪的准确率。

在一实施例中，根据当前拍摄图像确定待跟踪目标的图像特征；根据待跟踪目标与多个目标对象的相似度和待跟踪目标的图像特征，从多个目标对象中确定待跟踪目标，即从多个目标对象中，找出与该待跟踪目标相似度最高以及图像特征最近的目标对象作为待跟踪目标。通过结合待跟踪目标的图像特征和待跟踪目标与多个目标对象的相似度，能够进一步地准确地确定待跟踪目标，进而提高目标跟踪的准确率。

在一实施例中，根据待跟踪目标的图像特征从多个目标对象中，确定与待跟踪目标相似的目标对象；根据待跟踪目标与多个目标对象的相似度从与待跟踪目标相似的目标对象中，确定待跟踪目标。先通过待跟踪目标的图像特征从多个目标对象中，确定与待跟踪目标相似的目标对象，再根据待跟踪目标与多个目标对象的相似度从与待跟踪目标相似的目标对象中，确定待跟踪目标，能够了快速以及准确地确定待跟踪目标。其中，该图像特征包括目标在拍摄图像中对应的颜色特征、分布位置特征、纹理特征、轮廓特征中一种或多种。

在一实施例中，根据待跟踪目标与多个目标对象的相似度从多个目标对象中确定所述待跟踪目标的方式可以为：根据待跟踪目标与多个目标对象的相似度和待跟踪目标的Reid特征，从多个目标对象中确定待跟踪目标；其中，该Reid特征为采用行人重识别技术从当前拍摄图像识别出的待跟踪目标的特征。通过待跟踪目标与多个目标对象的相似度和待跟踪目标的Reid特征，从多个目标对象中确定待跟踪目标，可以弥补无人机的拍摄装置的视觉局限，以及提高待跟踪目标确定的准确率，进而提高目标跟踪的准确率。

在一实施例中，在根据多个目标对象的3D目标检测信息从多个目标对象中确定待跟踪目标之前，当确定当前拍摄图像包括多个目标对象时，根据当前拍摄图像，获取待跟踪目标的图像特征和多个目标对象的图像特征；根据待跟踪目标的图像特征和多个目标对象的图像特征，确定多个目标对象中是否存在与待跟踪目标相似的目标对象；当确定多个目标对象中存在至少两个与待跟踪目标相似的目标对象时，根据多个目标对象的3D目标检测信息从多个目标对象中确定待跟踪目标。若多个目标对象中只存在一个与待跟踪目标相似的目标对象，即使出现目标跟踪丢失的情况，也可以从图像特征识别的角度重新对该待跟踪目标进行跟踪。若多个目标对象中存在至少两个与待跟踪目标相似的目标对象，才有可能因为遮挡或交叉等原因造成目标跟踪丢失，因此需要使用3D目标检测信息进行进一步地确定，由此可以提高待跟踪目标的跟踪的准确率。

上述实施例提供的目标检测方法，通过在对待跟踪目标进行跟踪的过程中，获取拍摄装置拍摄待跟踪目标得到的当前拍摄图像，并将当前拍摄图像输入预设的3D目标检测模型进行处理，得到待跟踪目标的3D目标检测信息，然后当确定当前拍摄图像包括多个目标对象时，根据多个目标对象的3D目标检测信息从多个目标对象中确定待跟踪目标，最后根据待跟踪目标的3D目标检测信息对待跟踪目标进行跟踪拍摄。能够克服仅根据图像信息进行跟踪导致的错跟和跟丢的问题，极大地提高目标跟踪的准确率。

请参阅图8，图8是本申请实施例提供的一种目标检测装置的结构示意性框图。

该目标检测装置应用无人机，该无人机包括拍摄装置，如图8所示，目标检测装置400包括包括处理器401和存储器402，处理器401和存储器402通过总线403连接，该总线403比如为I2C(Inter-integrated Circuit)总线。

具体地，处理器401可以是微控制单元(Micro-controller Unit，MCU)、中央处理单元(Central Processing Unit，CPU)或数字信号处理器(Digital Signal Processor，DSP)等。

具体地，存储器402可以是Flash芯片、只读存储器(ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

其中，所述处理器401用于运行存储在存储器402中的计算机程序，并在执行所述计算机程序时实现如下步骤：

获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

在一实施例中，所述待跟踪目标相对于所述无人机的角度信息包括所述待跟踪目标相对于所述无人机的yaw角、pitch角和roll角。

在一实施例中，所述3D目标检测信息还包括所述待跟踪目标在相机坐标系下的位置信息和所述待跟踪目标在所述当前拍摄图像内的第二尺寸信息。

在一实施例中，所述第一尺寸信息包括所述待跟踪目标在世界坐标系下的长度信息、宽度信息和/或高度信息。

在一实施例中，所述第二尺寸信息包括所述待跟踪目标在所述当前拍摄图像内的长度信息、宽度信息和/或高度信息。

在一实施例中，所述处理器还用于实现以下步骤：

获取训练样本数据，其中，所述训练样本数据包括多个样本图像以及每个所述样本图像中的待跟踪目标的3D目标检测信息；

根据所述训练样本数据对神经网络模型进行迭代训练，直到迭代训练后的神经网络模型收敛，得到所述3D目标检测模型。

在一实施例中，所述神经网络模型包括卷积神经网络模型CNN、RCNN、Fast RCNN和Faster RCNN。

在一实施例中，所述处理器还用于实现以下步骤：

根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄。

在一实施例中，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标；

根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄。

在一实施例中，所述根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标，包括：

根据所述3D目标检测信息和预设目标跟踪算法，预测所述待跟踪目标在世界坐标系下的目标位置坐标。

在一实施例中，所述3D目标检测信息包括所述待跟踪目标在相机坐标系下的位置信息，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

将所述待跟踪目标在相机坐标系下的位置信息转换为所述待跟踪目标在世界坐标系下的第一位置信息；

获取所述无人机的第二位置信息，并根据所述第一位置信息和第二位置信息，确定所述待跟踪目标与所述无人机之间的目标距离；

根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机与待跟踪目标之间的距离始终为所述目标距离。

在一实施例中，所述根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，确定所述待跟踪目标的运动速度；

根据所述待跟踪目标的目标位置坐标、运动速度和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机相对所述待跟踪目标静止，且所述无人机与待跟踪目标之间的距离始终为所述目标距离。

在一实施例中，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述目标位置坐标，确定所述无人机上的拍摄装置的目标姿态；

根据所述目标姿态控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述待跟踪目标始终位于所述拍摄装置的拍摄画面的中央位置。

当确定所述当前拍摄图像包括多个目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标；

根据所述待跟踪目标的3D目标检测信息对所述待跟踪目标进行跟踪拍摄。

在一实施例中，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标，包括：

根据多个所述目标对象的3D目标检测信息，确定多个所述目标对象的运动信息；

根据所述待跟踪目标的3D目标检测信息确定所述待跟踪目标的运动信息；

根据所述待跟踪目标的运动信息和多个所述目标对象的运动信息，计算所述待跟踪目标与多个所述目标对象的相似度；

根据所述相似度从多个所述目标对象中确定所述待跟踪目标。

在一实施例中，所述运动信息包括位置信息和/或速度信息；所述相似度包括位置相似度和/或速度相似度。

在一实施例中，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述位置相似度和/或速度相似度，从多个所述目标对象中确定所述待跟踪目标。

获取所述位置相似度对应的第一预设权重，以及所述速度相似度对应的第二预设权重；

根据所述位置相似度、速度相似度、第一预设权重和第二预设权重，从多个所述目标对象中确定所述待跟踪目标。

根据所述当前拍摄图像确定所述待跟踪目标的图像特征；

根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标。

在一实施例中，所述根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述待跟踪目标的图像特征从多个所述目标对象中，确定与所述待跟踪目标相似的目标对象；

根据所述相似度从与所述待跟踪目标相似的目标对象中，确定所述待跟踪目标。

根据所述相似度和所述待跟踪目标的Reid特征，从多个所述目标对象中确定所述待跟踪目标；

其中，所述Reid特征为采用行人重识别技术从所述当前拍摄图像识别出的所述待跟踪目标的特征。

在一实施例中，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标之前，还包括：

当确定所述当前拍摄图像包括多个目标对象时，根据所述当前拍摄图像，获取所述待跟踪目标的图像特征和多个所述目标对象的图像特征；

根据所述待跟踪目标的图像特征和多个所述目标对象的图像特征，确定多个所述目标对象中是否存在与所述待跟踪目标相似的目标对象；

当确定多个所述目标对象中存在至少两个与所述待跟踪目标相似的目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的目标检测装置的具体工作过程，可以参考前述目标检测方法实施例中的对应过程，在此不再赘述。

请参阅图9，图9是本申请实施例提供的一种无人机的结构示意性框图。

如图9所示，该无人机500包括处理器501、存储器502和拍摄装置503，处理器501、存储器502和拍摄装置503通过总线504连接，该总线504比如为I2C(Inter-integrated Circuit)总线。其中，无人机可以为旋翼型无人机，例如四旋翼无人机、六旋翼无人机、八旋翼无人机，也可以是固定翼无人机，还可以是旋翼型与固定翼无人机的组合，在此不作限定。

具体地，处理器501可以是微控制单元(Micro-controller Unit，MCU)、中央处理单元(Central Processing Unit，CPU)或数字信号处理器(Digital Signal Processor，DSP)等。

具体地，存储器502可以是Flash芯片、只读存储器(ROM，Read-Only Memory)磁盘、光盘、U盘或移动硬盘等。

其中，所述处理器501用于运行存储在存储器502中的计算机程序，并在执行所述计算机程序时实现如下步骤：

获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

在一实施例中，所述处理器还用于实现以下步骤：

根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄。

根据所述当前拍摄图像确定所述待跟踪目标的图像特征；

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的无人机的具体工作过程，可以参考前述目标检测方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序中包括程序指令，所述处理器执行所述程序指令，实现上述实施例提供的目标检测方法的步骤。

其中，所述计算机可读存储介质可以是前述任一实施例所述的无人机的内部存储单元，例如所述无人机的硬盘或内存。所述计算机可读存储介质也可以是所述无人机的外部存储设备，例如所述无人机上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种目标检测方法，其特征在于，应用于无人机，所述无人机包括拍摄装置，所述方法包括：

获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息；

其中，所述3D目标检测模型是预先训练好的神经网络模型，所述3D目标检测信息包括所述待跟踪目标在世界坐标系下的第一尺寸信息和所述待跟踪目标相对于所述无人机的角度信息。
根据权利要求1所述的目标检测方法，其特征在于，所述待跟踪目标相对于所述无人机的角度信息包括所述待跟踪目标相对于所述无人机的yaw角、pitch角和roll角。
根据权利要求1所述的目标检测方法，其特征在于，所述3D目标检测信息还包括所述待跟踪目标在相机坐标系下的位置信息和所述待跟踪目标在所述当前拍摄图像内的第二尺寸信息。
根据权利要求1所述的目标检测方法，其特征在于，所述第一尺寸信息包括所述待跟踪目标在世界坐标系下的长度信息、宽度信息和/或高度信息。
根据权利要求3所述的目标检测方法，其特征在于，所述第二尺寸信息包括所述待跟踪目标在所述当前拍摄图像内的长度信息、宽度信息和/或高度信息。
根据权利要求1所述的目标检测方法，其特征在于，所述方法还包括：

获取训练样本数据，其中，所述训练样本数据包括多个样本图像以及每个所述样本图像中的待跟踪目标的3D目标检测信息；

根据所述训练样本数据对神经网络模型进行迭代训练，直到迭代训练后的神经网络模型收敛，得到所述3D目标检测模型。
根据权利要求1所述的目标检测方法，其特征在于，所述神经网络模型包括卷积神经网络模型CNN、RCNN、Fast RCNN和Faster RCNN。
根据权利要求1至7中任一项所述的目标检测方法，其特征在于，所述方法还包括：

根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄。
根据权利要求8所述的目标检测方法，其特征在于，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标；

根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄。
根据权利要求9所述的目标检测方法，其特征在于，所述根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标，包括：

根据所述3D目标检测信息和预设目标跟踪算法，预测所述待跟踪目标在世界坐标系下的目标位置坐标。
根据权利要求9所述的目标检测方法，其特征在于，所述3D目标检测信息包括所述待跟踪目标在相机坐标系下的位置信息，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

将所述待跟踪目标在相机坐标系下的位置信息转换为所述待跟踪目标在世界坐标系下的第一位置信息；

获取所述无人机的第二位置信息，并根据所述第一位置信息和第二位置信息，确定所述待跟踪目标与所述无人机之间的目标距离；

根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机与待跟踪目标之间的距离始终为所述目标距离。
根据权利要求11所述的目标检测方法，其特征在于，所述根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，确定所述待跟踪目标的运动速度；

根据所述待跟踪目标的目标位置坐标、运动速度和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机相对所述待跟踪目标静止，且所述无人机与待跟踪目标之间的距离始终为所述目标距离。
根据权利要求9所述的目标检测方法，其特征在于，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述目标位置坐标，确定所述无人机上的拍摄装置的目标姿态；

根据所述目标姿态控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述待跟踪目标始终位于所述拍摄装置的拍摄画面的中央位置。
根据权利要求8所述的目标检测方法，其特征在于，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

当确定所述当前拍摄图像包括多个目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标；

根据所述待跟踪目标的3D目标检测信息对所述待跟踪目标进行跟踪拍摄。
根据权利要求14所述的目标检测方法，其特征在于，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标，包括：

根据多个所述目标对象的3D目标检测信息，确定多个所述目标对象的运动信息；

根据所述待跟踪目标的3D目标检测信息确定所述待跟踪目标的运动信息；

根据所述待跟踪目标的运动信息和多个所述目标对象的运动信息，计算所述待跟踪目标与多个所述目标对象的相似度；

根据所述相似度从多个所述目标对象中确定所述待跟踪目标。
根据权利要求15所述的目标检测方法，其特征在于，所述运动信息包括位置信息和/或速度信息；所述相似度包括位置相似度和/或速度相似度。
根据权利要求16所述的目标检测方法，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述位置相似度和/或速度相似度，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求16所述的目标检测方法，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

获取所述位置相似度对应的第一预设权重，以及所述速度相似度对应的第二预设权重；

根据所述位置相似度、速度相似度、第一预设权重和第二预设权重，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求15所述的目标检测方法，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述当前拍摄图像确定所述待跟踪目标的图像特征；

根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求19所述的目标检测方法，其特征在于，所述根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述待跟踪目标的图像特征从多个所述目标对象中，确定与所述待跟踪目标相似的目标对象；

根据所述相似度从与所述待跟踪目标相似的目标对象中，确定所述待跟踪目标。
根据权利要求15所述的目标检测方法，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述相似度和所述待跟踪目标的Reid特征，从多个所述目标对象中确定所述待跟踪目标；

其中，所述Reid特征为采用行人重识别技术从所述当前拍摄图像识别出的所述待跟踪目标的特征。
根据权利要求14所述的目标检测方法，其特征在于，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标之前，还包括：

当确定所述当前拍摄图像包括多个目标对象时，根据所述当前拍摄图像，获取所述待跟踪目标的图像特征和多个所述目标对象的图像特征；

根据所述待跟踪目标的图像特征和多个所述目标对象的图像特征，确定多个所述目标对象中是否存在与所述待跟踪目标相似的目标对象；

当确定多个所述目标对象中存在至少两个与所述待跟踪目标相似的目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标。
一种目标检测装置，其特征在于，应用无人机，所述无人机包括拍摄装置，所述目标检测装置包括存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现如下步骤：

获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息；

其中，所述3D目标检测模型是预先训练好的神经网络模型，所述3D目标检测信息包括所述待跟踪目标在世界坐标系下的第一尺寸信息和所述待跟踪目标相对于所述无人机的角度信息。
根据权利要求23所述的目标检测装置，其特征在于，所述待跟踪目标相对于所述无人机的角度信息包括所述待跟踪目标相对于所述无人机的yaw角、pitch角和roll角。
根据权利要求23所述的目标检测装置，其特征在于，所述3D目标检测信息还包括所述待跟踪目标在相机坐标系下的位置信息和所述待跟踪目标在所述当前拍摄图像内的第二尺寸信息。
根据权利要求23所述的目标检测装置，其特征在于，所述第一尺寸信息包括所述待跟踪目标在世界坐标系下的长度信息、宽度信息和/或高度信息。
根据权利要求25所述的目标检测装置，其特征在于，所述第二尺寸信息包括所述待跟踪目标在所述当前拍摄图像内的长度信息、宽度信息和/或高度信息。
根据权利要求23所述的目标检测装置，其特征在于，所述处理器还用于实现以下步骤：

获取训练样本数据，其中，所述训练样本数据包括多个样本图像以及每个所述样本图像中的待跟踪目标的3D目标检测信息；

根据所述训练样本数据对神经网络模型进行迭代训练，直到迭代训练后的神经网络模型收敛，得到所述3D目标检测模型。
根据权利要求23所述的目标检测装置，其特征在于，所述神经网络模型包括卷积神经网络模型CNN、RCNN、Fast RCNN和Faster RCNN。
根据权利要求23至29中任一项所述的目标检测装置，其特征在于，所述处理器还用于实现以下步骤：

根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄。
根据权利要求30所述的目标检测装置，其特征在于，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标；

根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄。
根据权利要求31所述的目标检测装置，其特征在于，所述根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标，包括：

根据所述3D目标检测信息和预设目标跟踪算法，预测所述待跟踪目标在世界坐标系下的目标位置坐标。
根据权利要求31所述的目标检测装置，其特征在于，所述3D目标检测信息包括所述待跟踪目标在相机坐标系下的位置信息，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

将所述待跟踪目标在相机坐标系下的位置信息转换为所述待跟踪目标在世界坐标系下的第一位置信息；

获取所述无人机的第二位置信息，并根据所述第一位置信息和第二位置信息，确定所述待跟踪目标与所述无人机之间的目标距离；

根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机与待跟踪目标之间的距离始终为所述目标距离。
根据权利要求33所述的目标检测装置，其特征在于，所述根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，确定所述待跟踪目标的运动速度；

根据所述待跟踪目标的目标位置坐标、运动速度和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机相对所述待跟踪目标静止，且所述无人机与待跟踪目标之间的距离始终为所述目标距离。
根据权利要求31所述的目标检测装置，其特征在于，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述目标位置坐标，确定所述无人机上的拍摄装置的目标姿态；

根据所述目标姿态控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述待跟踪目标始终位于所述拍摄装置的拍摄画面的中央位置。
根据权利要求30所述的目标检测装置，其特征在于，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

当确定所述当前拍摄图像包括多个目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标；

根据所述待跟踪目标的3D目标检测信息对所述待跟踪目标进行跟踪拍摄。
根据权利要求36所述的目标检测装置，其特征在于，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标，包括：

根据多个所述目标对象的3D目标检测信息，确定多个所述目标对象的运动信息；

根据所述待跟踪目标的3D目标检测信息确定所述待跟踪目标的运动信息；

根据所述待跟踪目标的运动信息和多个所述目标对象的运动信息，计算所述待跟踪目标与多个所述目标对象的相似度；

根据所述相似度从多个所述目标对象中确定所述待跟踪目标。
根据权利要求37所述的目标检测装置，其特征在于，所述运动信息包括位置信息和/或速度信息；所述相似度包括位置相似度和/或速度相似度。
根据权利要求38所述的目标检测装置，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述位置相似度和/或速度相似度，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求38所述的目标检测装置，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

获取所述位置相似度对应的第一预设权重，以及所述速度相似度对应的第二预设权重；

根据所述位置相似度、速度相似度、第一预设权重和第二预设权重，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求37所述的目标检测装置，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述当前拍摄图像确定所述待跟踪目标的图像特征；

根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求41所述的目标检测装置，其特征在于，所述根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述待跟踪目标的图像特征从多个所述目标对象中，确定与所述待跟踪目标相似的目标对象；

根据所述相似度从与所述待跟踪目标相似的目标对象中，确定所述待跟踪目标。
根据权利要求37所述的目标检测装置，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述相似度和所述待跟踪目标的Reid特征，从多个所述目标对象中确定所述待跟踪目标；

其中，所述Reid特征为采用行人重识别技术从所述当前拍摄图像识别出的所述待跟踪目标的特征。
根据权利要求36所述的目标检测装置，其特征在于，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标之前，还包括：

当确定所述当前拍摄图像包括多个目标对象时，根据所述当前拍摄图像，获取所述待跟踪目标的图像特征和多个所述目标对象的图像特征；

根据所述待跟踪目标的图像特征和多个所述目标对象的图像特征，确定多个所述目标对象中是否存在与所述待跟踪目标相似的目标对象；

当确定多个所述目标对象中存在至少两个与所述待跟踪目标相似的目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标。
一种无人机，其特征在于，所述无人机包括拍摄装置、存储器和处理器；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述计算机程序并在执行所述计算机程序时，实现如下步骤：

获取所述拍摄装置拍摄待跟踪目标得到的当前拍摄图像；

将所述当前拍摄图像输入预设的3D目标检测模型进行处理，得到所述待跟踪目标的3D目标检测信息；

其中，所述3D目标检测模型是预先训练好的神经网络模型，所述3D目标检测信息包括所述待跟踪目标在世界坐标系下的第一尺寸信息和所述待跟踪目标相对于所述无人机的角度信息。
根据权利要求45所述的无人机，其特征在于，所述待跟踪目标相对于所述无人机的角度信息包括所述待跟踪目标相对于所述无人机的yaw角、pitch角和roll角。
根据权利要求45所述的无人机，其特征在于，所述3D目标检测信息还包括所述待跟踪目标在相机坐标系下的位置信息和所述待跟踪目标在所述当前拍摄图像内的第二尺寸信息。
根据权利要求45所述的无人机，其特征在于，所述第一尺寸信息包括所述待跟踪目标在世界坐标系下的长度信息、宽度信息和/或高度信息。
根据权利要求47所述的无人机，其特征在于，所述第二尺寸信息包括所述待跟踪目标在所述当前拍摄图像内的长度信息、宽度信息和/或高度信息。
根据权利要求45所述的无人机，其特征在于，所述处理器还用于实现以下步骤：

获取训练样本数据，其中，所述训练样本数据包括多个样本图像以及每个所述样本图像中的待跟踪目标的3D目标检测信息；

根据所述训练样本数据对神经网络模型进行迭代训练，直到迭代训练后的神经网络模型收敛，得到所述3D目标检测模型。
根据权利要求45所述的无人机，其特征在于，所述神经网络模型包括卷积神经网络模型CNN、RCNN、Fast RCNN和Faster RCNN。
根据权利要求45至51中任一项所述的无人机，其特征在于，所述处理器还用于实现以下步骤：

根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄。
根据权利要求52所述的无人机，其特征在于，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标；

根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄。
根据权利要求53所述的无人机，其特征在于，所述根据所述3D目标检测信息，预测所述待跟踪目标在世界坐标系下的目标位置坐标，包括：

根据所述3D目标检测信息和预设目标跟踪算法，预测所述待跟踪目标在世界坐标系下的目标位置坐标。
根据权利要求53所述的无人机，其特征在于，所述3D目标检测信息包括所述待跟踪目标在相机坐标系下的位置信息，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

将所述待跟踪目标在相机坐标系下的位置信息转换为所述待跟踪目标在世界坐标系下的第一位置信息；

获取所述无人机的第二位置信息，并根据所述第一位置信息和第二位置信息，确定所述待跟踪目标与所述无人机之间的目标距离；

根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机与待跟踪目标之间的距离始终为所述目标距离。
根据权利要求55所述的无人机，其特征在于，所述根据所述目标位置坐标和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述3D目标检测信息，确定所述待跟踪目标的运动速度；

根据所述待跟踪目标的目标位置坐标、运动速度和目标距离，控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述无人机相对所述待跟踪目标静止，且所述无人机与待跟踪目标之间的距离始终为所述目标距离。
根据权利要求53所述的无人机，其特征在于，所述根据所述目标位置坐标控制所述无人机对所述待跟踪目标进行跟踪拍摄，包括：

根据所述目标位置坐标，确定所述无人机上的拍摄装置的目标姿态；

根据所述目标姿态控制所述无人机对所述待跟踪目标进行跟踪拍摄，使得所述待跟踪目标始终位于所述拍摄装置的拍摄画面的中央位置。
根据权利要求52所述的无人机，其特征在于，所述根据所述3D目标检测信息对所述待跟踪目标进行跟踪拍摄，包括：

当确定所述当前拍摄图像包括多个目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标；

根据所述待跟踪目标的3D目标检测信息对所述待跟踪目标进行跟踪拍摄。
根据权利要求58所述的无人机，其特征在于，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标，包括：

根据多个所述目标对象的3D目标检测信息，确定多个所述目标对象的运动信息；

根据所述待跟踪目标的3D目标检测信息确定所述待跟踪目标的运动信息；

根据所述待跟踪目标的运动信息和多个所述目标对象的运动信息，计算所述待跟踪目标与多个所述目标对象的相似度；

根据所述相似度从多个所述目标对象中确定所述待跟踪目标。
根据权利要求59所述的无人机，其特征在于，所述运动信息包括位置信息和/或速度信息；所述相似度包括位置相似度和/或速度相似度。
根据权利要求60所述的无人机，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述位置相似度和/或速度相似度，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求60所述的无人机，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

获取所述位置相似度对应的第一预设权重，以及所述速度相似度对应的第二预设权重；

根据所述位置相似度、速度相似度、第一预设权重和第二预设权重，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求59所述的无人机，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述当前拍摄图像确定所述待跟踪目标的图像特征；

根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标。
根据权利要求63所述的无人机，其特征在于，所述根据所述相似度和所述待跟踪目标的图像特征，从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述待跟踪目标的图像特征从多个所述目标对象中，确定与所述待跟踪目标相似的目标对象；

根据所述相似度从与所述待跟踪目标相似的目标对象中，确定所述待跟踪目标。
根据权利要求59所述的无人机，其特征在于，所述根据所述相似度从多个所述目标对象中确定所述待跟踪目标，包括：

根据所述相似度和所述待跟踪目标的Reid特征，从多个所述目标对象中确定所述待跟踪目标；

其中，所述Reid特征为采用行人重识别技术从所述当前拍摄图像识别出的所述待跟踪目标的特征。
根据权利要求58所述的无人机，其特征在于，所述根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标之前，还包括：

当确定所述当前拍摄图像包括多个目标对象时，根据所述当前拍摄图像，获取所述待跟踪目标的图像特征和多个所述目标对象的图像特征；

根据所述待跟踪目标的图像特征和多个所述目标对象的图像特征，确定多个所述目标对象中是否存在与所述待跟踪目标相似的目标对象；

当确定多个所述目标对象中存在至少两个与所述待跟踪目标相似的目标对象时，根据多个所述目标对象的3D目标检测信息从多个所述目标对象中确定所述待跟踪目标。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1-22中任一项所述的目标检测方法的步骤。