WO2020164092A1

WO2020164092A1 - 图像处理方法、设备、可移动平台、无人机及存储介质

Info

Publication number: WO2020164092A1
Application number: PCT/CN2019/075171
Authority: WO
Inventors: 任创杰; 李鑫超; 李思晋
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2019-02-15
Filing date: 2019-02-15
Publication date: 2020-08-20
Also published as: CN111213155A; EP3920095A4; EP3920095A1; US20210390329A1; JP2022520019A

Abstract

本发明实施例提供了一种图像处理方法、设备、可移动平台、无人机及存储介质，其中，方法包括：获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据；对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。通过这种方式，可自动生成置信度特征图，实现了快速、高效地识别目标图像数据中的目标区域。

Description

图像处理方法、设备、可移动平台、无人机及存储介质

技术领域

本发明涉及控制技术领域，尤其涉及一种图像处理方法、设备、可移动平台、无人机及存储介质。

背景技术

目前可移动平台(如无人机、无人车、无人船)的发展越来越重要，发展速度越来越快。可移动平台的应用非常多，其中，以挂载有拍摄装置的无人机为例，无人机在航拍技术上的应用尤为广泛。然而，传统的无人机的航拍技术在拍摄过程中无法自动识别所拍摄图像中某图像区域中目标对象的数量，需依靠人工来判断拍摄图像中该图像区域中目标对象的数量，这种方法操作繁琐，效率较低。因此如何更高效、快速地识别目标对象成为研究的重点。

发明内容

本发明实施例提供了一种图像处理方法、设备、可移动平台、无人机及存储介质，可高效、快速地自动识别出目标图像数据中的目标区域。

第一方面，本发明实施例提供了一种图像处理方法，包括：

获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据；

对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；

根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。

第二方面，本发明实施例提供了另一种图像处理方法，包括：

对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；

根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。

第三方面，本发明实施例提供了一种图像处理设备，包括存储器和处理器；

所述存储器，用于存储程序指令；

所述处理器，执行所述存储器存储的程序指令，当程序指令被执行时，所述处理器用于执行如下步骤：

第四方面，本发明实施例提供了另一种图像处理设备，包括存储器和处理器；

所述存储器，用于存储程序指令；

根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的点数据的数量。

第五方面，本发明实施例提供了一种可移动平台，包括：存储器和处理器；

所述存储器，用于存储程序指令；

第六方面，本发明实施例提供了另一种可移动平台，包括：存储器和处理器；

所述存储器，用于存储程序指令；

第七方面，本发明实施例提供了一种无人机，所述无人机包括：机身；设置于所述机身上的动力系统，用于提供飞行动力；如上述第三方面或第四方面所述的图像处理设备。

第八方面，本发明实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现如上述第一方面或第二方面所述的图像处理方法。

本发明实施例中，图像处理设备可以获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据，并对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，以及根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。通过这种实施方式，实现了快速、高效地识别目标图像数据中的目标区域，从而提高图像处理效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种图像处理系统的结构示意图；

图2是本发明实施例提供的一种图像处理方法的流程示意图；

图3a是本发明实施例提供的一种置信度特征图的示意图；

图3b是本发明实施例提供的一种目标图像数据的界面示意图；

图4是本发明实施例提供的一种标记目标对象的示意图；

图5是本发明实施例提供的另一种图像处理方法的流程示意图；

图6是本发明实施例提供的目标场景三维重建方法一实施例中参考帧选取的示意图；

图7是本发明实施例提供的一种图像处理设备的结构示意图；

图8是本发明实施例提供的另一种图像处理设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图，对本发明的一些实施方式作详细说明。在不冲突的情况下，下述的实施例及实施例中的特征可以相互组合。

在本发明实施例提供的图像处理方法可以由一种图像处理系统执行，所述图像处理系统包括图像处理设备和可移动平台。在某些实施例中，所述图像处理设备可以设置在配置有负载(如拍摄装置、红外探测装置、测绘仪等)的可移动平台(如无人机)上。在其他实施例中，所述图像处理设备还可以设置在其他可移动设备上，如能够自主移动的机器人、无人车、无人船等可移动设备。在某些实施例中，所述图像处理设备可以是可移动平台的部件，即所述可移动平台包括所述图像处理设备；在其他实施例中，所述图像处理设备还可以在空间上独立于可移动平台。下面结合附图对本发明实施例中的图像处理系统进行举例说明。

具体请参见图1，图1是本发明实施例提供的一种图像处理系统的结构示意图，如图1所示的图像处理系统包括：图像处理设备11和可移动平台12，所述图像处理设备11可以为可移动平台12的控制终端，具体地可以为遥控器、智能手机、平板电脑、膝上型电脑、地面站、穿戴式设备(手表、手环)中的任意一种或多种。所述可移动平台12可以包括能够自主移动的机器人、无人车、无人船等可移动设备。可移动平台12包括动力系统121，动力系统用于为可移动平台12提供移动的动力，可移动平台12还可以包括摄像装置122，摄像装置122通过设置于可移动平台12的主体上。摄像装置122用于在可移动平台32的移动过程中进行图像或视频拍摄，包括但不限于多光谱成像仪、高光谱成像仪、可见光相机及红外相机等。

本发明实施例中，所述图像处理系统中图像处理设备11可以通过挂载在所述可移动平台12上的摄像装置122获取目标图像数据，并对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，从而根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。在某些实施例中，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据。

下面结合附图对应用于可移动平台的图像处理方法的进行示意性说明。

请参见图2，图2是本发明实施例提供的一种图像处理方法的流程示意图，所述方法可以由图像处理设备执行，其中，所述图像处理设备的具体解释如前所述。具体地，本发明实施例的所述方法包括如下步骤。

S201：获取目标图像数据。

本发明实施例中，图像处理设备可以获取目标图像数据，在某些实施例中，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据。在某些实施例中，所述目标图像数据可以通过挂载在可移动平台上的摄像装置拍摄得到的目标图像和景深数据得到，在某些实施例中，所述目标图像包括但不限于俯视图视角下的图像。

在某些实施例中，所述目标图像数据包括彩色图像；或者，所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，所述目标图像数据包括正射影像；或者，所述目标图像数据包括正射影像和所述正射影像对应的景深数据。

S202：对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图。

本发明实施例中，图像处理设备可以对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图。

在一个实施例中，图像处理设备在对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图时，可以基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，并根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据，从而根据所述包含语义类别和语义的置信度的点云数据，生成如图3a所示的置信度特征图，图3a是本发明实施例提供的一种置信度特征图的示意图，如图3a所示，所述置信度特征图包括包含语义类别和语义的置信度的点云数据。

具体可以图3b为例进行说明，图3b是本发明实施例提供的一种目标图像数据的界面示意图，所述图像处理设备可以根据如图3b所示的目标图像数据31的位置数据、高度数据、每个像素点的语义类别和语义置信度，生成如图3a所示包含语义类别和语义的置信度的点云数据。例如，假设所述目标图像数据31的位置数据为m、高度数据为h、所述目标图像数据31中n个像素点对应的语义类别和语义置信度分别为K1,K2,…,Kn，则图像处理设备可以根据所述位置数据为m、高度数据为h、所述目标图像数据31中n个像素点对应的语义类别和语义置信度分别为K1,K2,…,Kn，生成如图3a所示包含语义类别和语义的置信度的点云数据。

在某些实施例中，所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别，所述点云数据包含的每个点数据与所述目标图像数据中的每个像素点对应。在某些实施例中，所述置信度特征图中的点云数据是由高斯分布生成的多个圆形组成，通过高斯分布生成的置信度特征图，提高了置信度特征图的稳定性。当然，本实施例不对点云数据与目标图像数据中像素点的对应关系进行限定，点云数据可以与图像数据中的像素点呈一一对应关系；每个点云数据也可以对应多个像素点，其语义由多个像素点的聚类结果决定。

在某些实施例中，所述语义识别模型可以为卷积神经网络(Convolutional Neural Network，CNN)模型，所述CNN模型的架构主要包括输入层、卷积层、激励层、池化层。在神经网络模型中，可以包括多个子网，所述子网被布置在从最低到最高的序列中，并且，通过所述序列中的子网中的每一个来处理输入的图像数据。序列中的子网包括多个模块子网以及可选地包括一个或多个其它子网，所述其它子网均由一个或者多个常规神经网络层组成，例如最大池化层、卷积层、全连接层、正则化层等。每个子网接收由序列中的前子网生成的在前输出表示；通过直通卷积来处理所述在前输出表示，以生成直通输出；通过神经网络层的一个或者多个群组来处理在前输出表示，以生成一个或者多个群组，连接所述直通输出和所述群组输出，以生成所述模块子网的输出表示。

在某些实施例中，所述输入层用于输入图像数据，所述卷积层用于对所述图像数据进行运算，所述激励层用于对卷积层输出的结果做非线性映射，所述池化层用于压缩数据和参数的量，减少过拟合，提高性能。本方案采用进行语义标注后的样本图像数据作为输入数据，输入CNN模型的输入层，经过卷积层计算之后，通过多个通道输出不同语义的置信度，例如，农田通道(置信度)、果树通道(置信度)、河流通道(置信度)等。作为CNN的输出结果，可以表示为一个张量数值，例如，对于某一个像素点{经纬度，高度，K1,K2,…,Kn}，该张量数值表示了像素点的三维点云信息和n个通道的语义信息，其中，K1,K2,…,Kn表示置信度，张量数据中置信度最大的语义通道被作为该像素点的语义类别。例如，第i个语义通道的置信度Ki＝0.8，是最高的置信度，则该第i个通道对应的语义类别被作为该像素点的语义类别。在某些实施例中，景深数据的加入，为可移动平台获得的RGB像素信息增加了一个维度的信息，利用RGB数据集合景深数据，能够优化训练的过程，并且大大提高训练模型对地面物体识别的准确度。景深数据是通过双目相机拍摄获得的数据，可以是通过单目相机在飞机飞行过程中对一系列连续图像帧处理获得的数据计算得到。

在某些实施例中，所述不同置信度的多个语义类别是通过语义识别模型识别之后从多个通道输出得到的；在某些实施例中，与一般神经网络输出的结果不同的是，在神经网络的输出通道后增加分段输出函数，若通道置信度结果为负值，则将通道置信度结果置为零，保证神经网络输出的置信度为正浮点数据。使用正浮点数据作为语义通道的置信度，可以直接通过两个像素点数据的减法运算获得较大的置信度，由于张量的减法运算只需要对数组对应的数值内容进行减法操作，其运算量非常小，在同等算力的情况下，可以大大提高运算速度。尤其适合高精度地图绘制过程中，由于高精度地图需要大量运算，而造成的算力紧张问题。

在某些实施例中，所述目标图像数据对应的位置数据包括所述目标图像的经度和纬度，所述目标图像数据对应的高度数据为所述目标图像的高度。在某些实施例中，所述目标图像数据的位置数据和高度数据可以根据全球定位系统(Global Positioning System，GPS)信息得到，或者，所述目标图像数据的位置数据和高度数据可以根据载波相位差分技术(Real-time kinematic，RTK)计算得到。在某些实施例中，所述目标图像数据对应的地物数据可以根据所述目标图像数据的位置数据和高度数据计算得到。通过这种实施方式可以生成目标图像数据的语义的置信度特征图，以便可移动平台在拍摄应用中可以根据置信度特征图上的语义类别，确定地物类别。

在一个实施例中，所述图像处理设备对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，可以根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理，并根据后处理的结果更新所述置信度特征图。

在一个实施例中，所述图像处理设备根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，可以检测所述置信度特征图中每个点数据的语义的置信度，并对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理，以使所述图像处理设备在根据后处理的结果更新所述置信度特征图时，可以基于所述删除处理后的点云数据，更新所述置信度特征图。

例如，假设预设置信度阈值为0.6，所述图像处理设备根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，可以检测所述置信度特征图中每个点数据的语义的置信度，并对所述置信度特征图中语义的置信度小于或等于预设置信度阈值0.6的点数据进行删除处理，以使所述图像处理设备在根据后处理的结果更新所述置信度特征图时，可以基于所述删除处理后的点云数据，更新所述置信度特征图。

在某些实施例中，所述置信度特征图中的点云数据可以用不同形状的点数据来标记不同的语义类别，如用圆形的点数据来标记树、用方形的点数据来标记人、用三角形的点数据来标记水稻等，以便于对不同语义类别的目标对象进行区分。在某些实施例中，所述置信度特征图中的点云数据还可以用不同颜色的点数据来标记不同的语义类别，如用绿色圆形的点数据来标记树、用黄色圆形的点数据来标记人、用红色圆形的点数据来标记水稻等。当然，所述置信度特征图中的点云数据还可以用其他的标记方式来实现，本发明实施例不做具体限定。

在一个实施例中，所述图像处理设备在基于语义识别模型处理所述目标图像数据之前，可以获取样本数据库，所述样本数据库包括样本图像数据，并根据预设的语义识别算法生成初始语义识别模型，从而基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型。在某些实施例中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。

在某些实施例中，所述样本图像数据包括样本图像和样本图像中各像素点对应的景深数据，所述样本图像可以是RGB图像，所述景深数据可以通过深度图像获取。所述图像处理设备可以根据预设的语义识别算法生成初始语义识别模型，并将所述包括语义标注信息的样本图像数据作为输入数据，输入该初始语义识别模型中进行训练，得到训练结果，其中，所述训练结果包括所述样本图像中每个像素点的语义以及各语义的置信度。在得到训练结果之后，所述图像处理设备可以将所述训练结果中样本图像中每个像素点的语义与所述样本图像的语义标注信息进行对比，如果不匹配，则调整所述初始语义识别模型中的参数，直至训练结果样本图像中每个像素点的语义与所述语义标注信息相匹配时，生成所述语义识别模型。

在一些实施例中，所述样本图像可以包括彩色图像或正射影像；在某些实施例中，所述正射影像是一种经过几何纠正(比如使之拥有统一的比例尺)的俯视图像，与没有纠正过的俯视图像不同的是，正射影像量可用于测实际距离，因为它是通过几何纠正后得到的地球表面的真实描述，所述正射影像具有信息量丰富、直观、可量测的特性。在某些实施例中，所述彩色图像可以是根据RGB值确定的RGB图像。在某些实施例中，所述景深数据反映所述摄像装置到被拍摄物的距离。

在一个实施例中，所述图像处理设备在基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型时，可以调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果，若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则可以对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。

S203：根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。

本发明实施例中，图像处理设备可以根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。

在一个实施例中，所述图像处理设备在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置时，可以获取所述置信度特征图中每个点数据的位置数据和语义类别，并根据所述置信度特征图中每个点数据的位置数据和语义类别，确定所述置信度特征图中具有相同语义类别的图像区域，从而根据所述置信度特征图中具有相同语义类别的图像区域，确定所述目标图像数据中地面上的目标区域的位置数据。

例如，根据图3a所示的置信度特征图可以确定出如图4所示的目标图像数据中地面上的目标对象，并确定出所述地面上目标对象对应的目标区域的位置数据，图4是本发明实施例提供的一种标记目标对象的示意图，如图4所示标记的目标对象的语义类别为树。当然在其他实施例中，所述目标对象的语义类别还可以包括人、电线杆、农作物等，本发明实施例不做具体限定。

在一个实施例中，所述图像处理设备在根据所述置信度特征图中每个点数据的位置数据和语义类别，确定所述置信度特征图中具有相同语义类别的图像区域时，可以根据所述置信度特征图上的语义类别，确定所述置信度特征图上具有连续相同语义类别的图像区域，并对所述具有连续相同语义类别的各图像区域进行边沿处理操作，以得到所述点云地图上不同语义类别的各图像区域。

在一个实施例中，所述图像处理设备在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置之后，可以根据所述目标图像数据中目标区域的位置和语义类别，规划航线，并控制可移动平台按照所述航线移动。通过这种实施方式，可以控制可移动平台按照所述航线移动，并执行与所述目标区域的语义类别对应的任务。

在一些实施例中，所述图像处理设备在根据所述目标图像数据中目标区域的位置和语义类别，规划航线时，可以根据所述置信度特征图上具有不同语义类别的图像区域，对不同语义类别的图像区域进行分类，并根据不同类别的图像区域，规划各类别的图像区域对应的航线。

在一些实施例中，所述图像处理设备在控制所述可移动平台按照所述航线移动的过程中，可以判断所述可移动平台的当前位置在所述置信度特征图中所对应的语义类别是否与目标任务的语义类别相匹配。如果判断结果为是，则控制所述可移动平台执行所述目标任务，如果判断结果为否，则控制所述可移动平台停止执行所述目标任务。在某些实施例中，所述可移动平台包括但不限于无人机或者按照航线自动行驶的无人车。

在一些实施例中，在控制所述可移动平台按照所述航线移动的过程中，控制所述可移动平台在所述航线中的标记点停留，以执行与目标任务对应的预定操作。在某些实施例中，所述预定操作包括农药喷洒操作，所述农药喷洒操作包括围绕指定点进行环形喷洒的操作。

例如，假设所述可移动平台为无人机，所述目标区域的语义类别为树，则所述图像处理设备可以根据所述目标图像数据中目标区域的位置和语义类别，规划出树所在区域的航线。当所述无人机需要执行喷洒农药的任务时，所述图像处理设备可以控制无人机按照所述航线移动，以及控制无人机在按照所述航线移动的过程中执行喷洒农药的任务。

本发明实施例中，图像处理设备可以获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据，并对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，以及根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。通过这种实施方式，实现了快速、高效地识别目标图像数据中的目标区域的位置，从而提高了对图像区域的定位效率。

请参见图5，图5是本发明实施例提供的另一种图像处理方法的流程示意图，所述方法可以由图像处理设备执行，其中，图像处理设备的具体解释如前所述。本发明实施例与上述图2所述实施例的区别在于，本发明实施例主要是对目标图像数据中具有相同语义类别的目标对象的计数进行详细的说明。目标对象可以是果树、建筑、人、车辆等等在目标图像中可以被识别和计数的物体。

S501：获取目标图像数据。

本发明实施例中，图像处理设备可以获取目标图像数据，在某些实施例中，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据。

在某些实施例中，所述目标图像数据包括彩色图像；或者，所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，所述目标图像数据包括正射影像；或者，所述目标图像数据包括正射影像和所述正射影像对应的景深数据。具体实施例如前所述，此处不再赘述。

S502：对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图。

本发明实施例中，图像处理设备可以对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图。

在一个实施例中，所述图像处理设备可以基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，并根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据，从而根据所述包含语义类别和语义的置信度的点云数据，生成所述置信度特征图。具体实施例如前所述，此处不再赘述。

在某些实施例中，所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别；所述点云数据包含的每个点数据与所述目标图像数据中的每个像素点对应。

在一个实施例中，所述图像处理设备对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，可以根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理，并根据后处理的结果更新所述置信度特征图。具体实施例如前所述，此处不再赘述。

在一个实施例中，所述图像处理设备在根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，可以检测所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理，并基于所述删除处理后的点云数据，更新所述置信度特征图。具体实施例如前所述，此处不再赘述。

在一个实施例中，所述图像处理设备在基于语义识别模型处理所述目标图像数据之前，可以获取样本数据库，所述样本数据库包括样本图像数据；并根据预设的语义识别算法生成初始语义识别模型，以及基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型。其中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。具体实施例如前所述，此处不再赘述。

在一个实施例中，所述图像处理设备可以调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果，若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则可以对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。具体实施例如前所述，此处不再赘述。

S503：根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。

本发明实施例中，图像处理设备可以根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。

在一个实施例中，图像处理设备在根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量时，可以根据所述置信度特征图上各点数据的语义类别，对所述置信度特征图上不同语义类别的点数据进行分类，并计算所述置信度特征图上不同类别的点数据的数量，从而确定所述置信度特征图上不同类别的点数据的数量为所述目标图像数据上具有相同语义的目标对象的数量。

具体可以图3a为例进行说明，假设所述图像处理设备根据如图3a所示的置信度特征图上各点数据的语义类别，确定出所述置信度特征图上的语义类别为均为树，如果所述图像处理设备计算所述置信度特征图上语义类别为树的点数据的数量为300，从而可以确定所述目标图像数据上树的数量为300。

在一个实施例中，所述置信度特征图中的点数据可以用不同的形状进行标记，图像处理设备在根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量时，可以根据所述置信度特征图上各点数据的形状确定不同的语义类别。假设所述置信度特征图中包括圆形点数据的图像区域和方形点数据的图像区域，且圆形代表树，方形代表人，则所述图像处理设备可以通过计算所述置信度特征图上圆形点数据的数量来确定树的数量，并通过计算所述置信度特征图上方形点数据的数量来确定人的数量。

在一个实施例中，所述置信度特征图中的点数据可以用不同的颜色进行标记，图像处理设备在根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量时，可以根据所述置信度特征图上各点数据的颜色确定不同的语义类别。假设所述置信度特征图中包括红色圆形点数据的图像区域和黄色圆形点数据的图像区域，且红色圆形代表树，黄色圆形代表人，则所述图像处理设备可以通过计算所述置信度特征图上红色圆形点数据的数量来确定树的数量，并通过计算所述置信度特征图上黄色圆形点数据的数量来确定人的数量。

在一些实施例中，图像处理设备可以根据目标图像数据对目标图像数据中的特征点进行跟踪，在某些实施例中，所述图像处理设备可以根据所述特征点确定点云数据。其中，以无人机为例的一种实现方式可以是：

获取第一图像帧在世界坐标系中的第一位姿信息，所述第一位姿信息包括：第一实时动态RTK信息和第一云台角信息；

根据所述第一位姿信息，估计第二图像帧在世界坐标系中的第二位姿信息，所述第二位姿信息包括：第二RTK信息和第二云台角信息；

根据所述第一位姿信息和所述第二位姿信息对所述第一图像帧的特征信息和所述第二图像帧的特征信息进行特征匹配；

根据特征匹配结果，进行特征点的跟踪；

其中，所述第一图像帧和所述第二图像帧为所述图像序列中相邻的两帧。

现有基于视觉的方案中通常采用匀速运动模型对相机下一帧的位姿进行估计，由于无人机机动灵敏，其运行通常不符合匀速运动模型，因此基于匀速运动模型估计的位姿将极不准确，进而导致特征点的跟踪数量和精度降低。

为了获得准确的位姿估计，本实施例中根据传感器提供的第一图像帧的RTK信息和云台角信息，对第二图像帧的位姿进行估计。由于采用了传感器提供的准确的RTK信息和云台角信息，因此估计出的第二图像帧的位姿信息的准确度将大幅提升，准确的位姿信息提高了特征匹配的准确度和速度。

本实施例中根据第一位姿信息和第二位姿信息对第一图像帧的特征信息和第二图像帧的特征信息进行特征匹配，具体可以包括：获取第一图像帧和第二图像帧的特征，针对第一图像帧的特征，根据第一位姿信息和第二位姿信息，在第二图像帧中确定相应的搜索范围，进行特征匹配。由于获取了准确的位姿信息，不仅可以确定准确的搜索范围，而且可以大大缩小搜索范围，因此不仅提高了特征匹配的准确率而且提高了特征匹配的速度。

由于无人机飞行速度较快，因此相邻两帧图像之间的重叠率较低，导致特征点跟踪效果差。本实施例中在特征跟踪时，加入对上一帧是否为关键帧的判断，若为关键帧，则用关键帧的特征信息替换上一帧原始的特征信息。由于关键帧有额外的三维点云生成操作，可以在限定的时间内最大限度的利用重叠区域图像生成的可用三维点云，使得跟踪的有效特征点数量得到提升。

本实施例中在完成特征跟踪之后，需要利用所有的特征点匹配对进行位姿解算。本实施例在位姿解算中加入传感器提供的RTK信息和云台角信息，使得位姿解算精度更高且不易受到误匹配的干扰。解决了现有技术中，基于视觉的方案中，当存在误匹配时，导致位姿解算精度降低甚至出现错误的问题。

在上述实施例的基础上，为了进一步提高目标场景三维重建的准确性，本实施例提供的目标场景三维重建方法，在融合关键帧的三维点云之前，还可以包括：根据所述关键帧对应的RTK信息和云台角信息，采用非线性优化的方式对所述关键帧的位姿信息及三维点云的位置进行优化。

本实施例对于非线性优化所采用的具体算法不做限制，例如可以采用高斯牛顿法、裂纹伯格-马夸尔特方法等。

本实施例中在根据关键帧及其三维点云构建全局一致性的地图之前，根据RTK信息和云台角信息进行优化处理。具体可以包括：

首先维护一个局部地图，该局部地图可以由当前帧、当前帧的共视关键帧及它们所能观测到的点云组成。本实施例在利用非线性优化调整局部地图时，加入每一个参与优化的关键帧对应的RTK信息与云台角信息，使得关键帧的位姿解算及三维点云的位置更加精确。

本实施例通过在非线性优化过程中，引入更将精确的传感器信息，即RTK信息与云台角信息，优化后的代价函数不仅考虑了重投影误差，而且考虑了当前估计的位姿与传感器提供的位姿之间的差距，采用优化后的代价函数可以得到最优的位姿估计。解决了现有技术中仅考虑视觉重投影误差，所带了的稳定性差的问题。

可选的，在实时测量结束后，本实施例还会对所有保留下的关键帧和三维点云进行全局的优化。可以理解的是，在该全局优化中加入RTK信息与云台角信息，使得最终输出的结果更加精确。

在上一实施例的基础上，为了获得更加精准的关键帧的三维点云关键帧，以提高目标场景三维重建的准确度，本实施例提供的目标场景三维重建方法中，可以在所述图像序列中为所述关键帧选取参考帧，然后根据所选取的参考帧，确定所述关键帧的深度图，根据关键帧的深度图获取关键帧的三维点云。参考帧至少可以包括第一图像帧和第二图像帧。其中，第一图像帧在时序上位于所述关键帧之前，第二图像帧在时序上位于所述关键帧之后。

无人机航拍时，可以沿着规划的航线飞行。当无人机沿着一条航线飞行时，当前图像帧中存在相当大的一部分区域不存在于之前拍摄的图像帧中。也就是说，若参考帧中仅包括当前图像帧之前拍摄的图像帧，根据参考帧确定当前图像帧的深度图时，会存在相当大的一部分区域的视差无解，深度图中必然会存在大片的无效区域。

因此，为了避免关键帧中的区域在参考帧中无相应的匹配区域，而导致该区域对应的深度图无效，本实施例中的参考帧既包括在时序上位于参考帧之前的第一图像帧，也包括在时序上位于参考帧之后的第二图像帧，提高了关键帧与参考帧之间的重叠率，减小了视差无解的区域，进而提高了基于参考帧获得的关键帧的深度图的准确性。

可选的，若关键帧为第N帧，则第一图像帧为第N-1帧，第二图像帧为第N+1帧，即参考帧包括与关键帧相邻的前后两帧。举例来说，若无人机在航拍时，相邻两帧之间的重叠率为70％，若参考帧仅包括关键帧之前的图像帧，则关键帧中至少有30％区域的视差无解。而本实施例提供的参考帧的选取策略，使得关键帧中的全部区域均可以在参考帧中找到与之相匹配的区域，避免了视差无解现象的产生，提高了关键帧的深度图的准确性。

可选的，若关键帧为第N帧，则第一图像帧可以包括第N帧之前预设数量的图像帧，第二图像帧可以包括第N帧之后预设数量的图像帧。

可选的，若关键帧为第N帧，则第一图像帧可以为第N帧之前预设数量的图像帧中的一帧，第二图像帧可以为第N帧之后预设数量的图像帧中的一帧。

在上述任一实施例的基础上，为了提高关键帧的深度图的可靠性，以提高目标场景三维重建的可靠性，本实施例提供的目标场景三维重建方法中，参考帧至少可以包括第三图像帧。其中，第三图像帧与关键帧的极线方向不平行。

本实施例中的极线为对极几何中的极线，即极平面与图像之间的交线。第三图像帧与关键帧的极线方向不平行，也就是说，极平面与第三图像帧的第一交线，与该极平面与关键帧的第二交线，不平行。

当关键帧中存在重复纹理时，若关键帧与参考帧的极线方向平行，则会出现沿着平行极线分布的重复纹理，将会降低该区域对应的深度图的可靠性。因此，本实施例通过选取与关键帧的极线方向不平行的第三图像帧作为参考帧，避免了出现重复纹理沿着平行极线分布的现象，提高了深度图的可靠性。

可选的，第三图像帧可以包括关键帧相邻航带中与关键帧存在重叠像素的图像帧。

可选的，第三图像帧可以为关键帧相邻航带中与关键帧的重叠率最高的图像帧。

下面通过一个具体的示例来说明本发明实施例提供的参考帧的选取方法。图6是本发明实施例提供的目标场景三维重建方法一实施例中参考帧选取的示意图。如图6所示，其中的实线用于表示无人机的飞行航线，航线覆盖了目标场景，箭头表示无人机的飞行方向，飞行航线上的黑色圆圈和黑色正方形表示无人机的拍摄装置在该位置进行拍摄，即黑色圆圈和黑色正方形对应目标场景的一个图像帧。当无人机沿着飞行航线飞行时，通过无人机上搭载的拍摄装置，如单目相机，便可以获取到目标场景的图像序列，包含了在时序上连续的多个图像帧。图6中的M-1、M、M+1、N-1、N、N+1表示图像帧的帧号，N和M为自然数，本实施例对N和M的具体取值不做限制。

若黑色正方形表示的第N帧为关键帧，在一种可能的实现方式中，参考帧可以包括图中所示的第N-1帧和第N+1帧。

若黑色正方形表示的第N帧为关键帧，在又一种可能的实现方式中，参考帧可以包括图中所示的第M帧。

若黑色正方形表示的第N帧为关键帧，在另一种可能的实现方式中，参考帧可以包括图中所示的第M帧、第N-1帧和第N+1帧，即图3中虚线圆圈中包括的图像帧。

可以理解的是，参考帧还可以包括更多的图像帧，例如还可以包括第M-1帧、第M+1帧、第N-2帧等。在具体实现时，可以综合考虑关键帧与参考帧的重叠率以及计算速度，进行选取。

在一些实施例中，基于参考帧获得关键帧的深度图的一种实现方式可以是：根据所述关键帧和所述参考帧之间的像差，获得所述关键帧的深度图。

本实施例中可以根据同一对象在关键帧和参考帧中的像差，获得关键帧的深度图。

在一些实施例中，基于所述图像序列获得所述关键帧的三维点云的一种实现方式可以是：根据所述图像序列，获得所述关键帧的深度图；根据所述关键帧的深度图，获得所述关键帧的三维点云。

在一些实施例中，根据所述图像序列，获得所述关键帧的深度图的一种实现方式可以是：根据所述图像序列，确定所述关键帧对应的匹配代价；根据所述关键帧对应的匹配代价，确定所述关键帧的深度图。

本实施例中可以通过对图像序列与关键帧中的像素点进行匹配，以确定关键帧对应的匹配代价。在确定了关键帧对应的匹配代价之后，可以进行匹配代价聚合，然后确定视差，根据视差与深度之间的对应关系，确定关键帧的深度图。可选的，在确定视差之后，还可以进行视差优化，视差加强。根据优化以及加强之后的视差，确定关键帧的深度图。

无人机的飞行高度通常在100米左右，且无人机通常都是垂直朝下进行拍摄的，由于地面高低起伏，对阳光的反射具有差异性，无人机拍摄的图像具有不可忽视的光照变化，光照变化将降低目标场景三维重建的准确性。

在上述任一实施例的基础上，为了提高目标场景三维重建对于光照的鲁棒性，本实施例提供的目标场景三维重建方法中，根据图像序列，确定关键帧对应的匹配代价，可以包括：根据图像序列，确定关键帧对应的第一类型匹配代价和第二类型匹配代价；确定关键帧对应的匹配代价等于第一类型匹配代价和第二类型匹配代价的加权和。

本实施例中在计算匹配代价时，通过将第一类型匹配代价与第二类型匹配代价进行融合，相较于仅采用单一类型匹配代价，提高了匹配代价对于光照的鲁棒性，进而减少了光照变化对于三维重建的影响，提高了三维重建的准确性。本实施例中第一类型匹配代价和第二类型匹配代价的加权系数可以根据具体需要进行设置，本实施例对此不做限制。

可选的，第一类型匹配代价可以基于零均值归一化互相关(Zero-based Normalized Cross Correlation，ZNCC)确定。基于ZNCC可以精确的度量关键帧与参考帧之间的相似性。

可选的，第二类型匹配代价可以基于光照不变特征确定。本实施例中，可以提取无人机所采集的图像帧中的光照不变特征，例如局部二值模式(Local Binary Patterns，LBP)，census序列等，然后可以基于光照不变特征确定第二类型匹配代价。

本实施例中的census序列可以通过如下方式确定：在图像帧中选取任一点，以该点为中心划出一个例如3×3的矩形，矩形中除中心点之外的每一点都与中心点进行比较，灰度值小于中心点即记为1，灰度值大于中心点的则记为0，以所得长度为8的只有0和1的序列作为该中心点的census序列，即中心像素的灰度值被census序列替换。

经过census变换后，可以采用汉明距离确定关键帧的第二类型匹配代价。

例如，关键帧对应的匹配代价可以等于ZNCC和census两种匹配代价的加权和。

在一些实施例中，根据关键帧对应的匹配代价，确定关键帧的深度图的一种实现方式可以是：将关键帧划分成多个图像块；根据图像序列，确定每一个图像块对应的匹配代价；根据每一个所述图像块对应的匹配代价，确定关键帧对应的匹配代价。

本实施例中可以采用如下方式中的一种或者多种将关键帧划分为多个图像块：

(1)采用聚类的方式，将关键帧划分成多个图像块。本实施例中例如可以根据关键帧的色彩信息和/或纹理信息，采用聚类的方式，将关键帧划分成多个图像块。

(2)将关键帧均匀划分成多个图像块。本实施例中例如可以预先设置图像块的数量，然后根据预先设置的图像块的数量，对关键帧进行划分。

(3)将关键帧划分成预设大小的多个图像块。例如可以预先设置图像块的大小，然后根据预先设置的图像块的大小，对关键帧进行划分。

可选的，在将关键帧划分成多个图像块之后，可以根据图像序列，并行确定每一个图像块对应的匹配代价。本实施例中例如可以采用软件和/或硬件的方式并行确定每一个图像块对应的匹配代价。具体的，例如可以采用多线程并行确定每一个图像块对应的匹配代价，和/或，可以采用图形处理器(Graphics Processing Unit，GPU)并行确定每一个图像块对应的匹配代价。

本实施例提供的目标场景三维重建方法，在上述实施例的基础上，通过将关键帧划分成多个图像块，根据图像序列，并行确定每一个图像块对应的匹配代价，然后根据每一个图像块对应的匹配代价，确定关键帧对应的匹配代价，提高了匹配代价的计算速度，进而提高了目标场景三维重建的实时性。

深度采样次数可以根据深度范围和精度确定，深度采样次数与深度范围正相关，与精度负相关。举例来说，若深度范围为50米，精度要求为0.1米，则深度采样次数可以为500。

在确定关键帧的匹配代价时，可以采用预设深度采样次数，也可以采用即时定位与地图构建(Simultaneous Localization and Mapping，SLAM)恢复出关键帧中一些稀疏的三维点，然后根据这些稀疏的三维点确定整个关键帧的深度范围，然后根据整个关键帧的深度范围以及精度要求，确定深度采样次数。若深度采样次数为N，则需要针对关键帧中每一个像素点计算N次匹配代价。对于640*480像素大小的关键帧，需要计算640*480*N次匹配代价。

在上述任一实施例的基础上，为了进一步提高处理速度，提高目标场景三维重建的实时性，本实施例提供的目标场景三维重建方法中，根据图像序列，确定每一个图像块对应的匹配代价，可以包括：根据每一个图像块中的稀疏点确定该图像块的深度采样次数；根据图像序列以及每一个图像块的深度采样次数，确定每一个图像块对应的匹配代价。

需要说明的是，当无人机垂直朝下进行拍摄时，关键帧中可以包含多种拍摄对象，例如行人、汽车、树木、高楼等，因此整个关键帧的深度范围比较大，在预设精度要求下，深度采样次数较大。然而关键帧中各个图像块对应的深度范围是比较小的，比如当一个图像块中仅包括行人时，该图像块对应的深度范围将远远小于整个关键帧的深度范围，在相同精度要求下，可以大幅减小深度采样次数。也就是说，在相同精度要求下，关键帧中图像块的深度采样次数必定小于等于关键帧整体的深度采样次数。

本发明实施例中，图像处理设备可以获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据，并对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，从而根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。通过这种实施方式，实现了基于置信度特征图，自动对目标图像数据上具有相同语义的目标对象进行计数，提高了计数效率。

请参见图7，图7是本发明实施例提供的一种图像处理设备的结构示意图。具体的，所述图像处理设备包括：存储器701、处理器702以及数据接口703。

所述存储器701可以包括易失性存储器(volatile memory)；存储器701也可以包括非易失性存储器(non-volatile memory)；存储器701还可以包括上述种类的存储器的组合。所述处理器702可以是中央处理器(central processing unit，CPU)。所述处理器702还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。具体例如可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)或其任意组合。

进一步地，所述存储器701用于存储程序指令，当程序指令被执行时所述处理器702可以调用存储器701中存储的程序指令，用于执行如下步骤：

进一步地，所述处理器702对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图时，具体用于：

基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度；

根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据；

根据所述包含语义类别和语义的置信度的点云数据，生成所述置信度特征图。

进一步地，所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别。

进一步地，所述处理器702对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还用于：

根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理；

根据后处理的结果更新所述置信度特征图。

进一步地，所述处理器702在根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，具体用于：

检测所述置信度特征图中每个点数据的语义的置信度；

对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。

进一步地，所述处理器702在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置时，具体用于：

获取所述置信度特征图中每个点数据的位置数据和语义类别；

根据所述置信度特征图中每个点数据的位置数据和语义类别，确定所述置信度特征图中具有相同语义类别的图像区域；

根据所述置信度特征图中具有相同语义类别的图像区域，确定所述目标图像数据中目标区域的位置数据。

进一步地，所述处理器702在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置之后，还用于：

根据所述目标图像数据中目标区域的位置和语义类别，规划航线；

控制可移动平台按照所述航线移动。

进一步地，所述处理器702在根据所述目标图像数据中目标区域的位置和语义类别，规划航线时，具体用于：

根据所述置信度特征图上具有不同语义类别的图像区域，对不同语义类别的图像区域进行分类；

根据不同类别的图像区域，规划各类别的图像区域对应的航线。

进一步地，所述处理器702控制可移动平台按照所述航线移动时，具体用于：

在控制所述可移动平台按照所述航线移动的过程中，判断所述可移动平台的当前位置在所述置信度特征图中所对应的语义类别是否与目标任务的语义类别相匹配；

如果判断结果为是，则控制所述可移动平台执行所述目标任务。

进一步地，所述可移动平台包括无人机或者按照航线自动行驶的无人车。

进一步地，所述处理器还用于：

在控制所述可移动平台按照所述航线移动的过程中，控制所述可移动平台在所述航线中的标记点停留，以执行与目标任务对应的预定操作。

进一步地，所述预定操作包括农药喷洒操作。

进一步地，所述农药喷洒操作包括围绕指定点进行环形喷洒的操作。

进一步地，所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，

所述目标图像数据包括正射影像；或者，

所述目标图像数据包括正射影像和所述正射影像对应的景深数据。

进一步地，所述处理器702基于语义识别模型处理所述目标图像数据之前，还用于：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型；

其中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。

进一步地，所述处理器702基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型时，具体用于：

调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果；

若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。

请参见图8，图8是本发明实施例提供的另一种图像处理设备的结构示意图。具体的，所述图像处理设备包括：存储器801、处理器802以及数据接口803。

所述存储器801可以包括易失性存储器(volatile memory)；存储器801也可以包括非易失性存储器(non-volatile memory)；存储器801还可以包括上述种类的存储器的组合。所述处理器802可以是中央处理器(central processing unit，CPU)。所述处理器802还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。具体例如可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)或其任意组合。

进一步地，所述存储器801用于存储程序指令，当程序指令被执行时所述处理器802可以调用存储器801中存储的程序指令，用于执行如下步骤：

进一步地，所述处理器802根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量时，具体用于：

根据所述置信度特征图上各点数据的语义类别，对所述置信度特征图上不同语义类别的点数据进行分类；

计算所述置信度特征图上不同类别的点数据的数量；

确定所述置信度特征图上不同类别的点数据的数量为所述目标图像数据上具有相同语义的目标对象的数量。

进一步地，所述处理器802对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图时，具体用于：

进一步地，所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别；所述点云数据包含的每个点数据与所述目标图像数据中的每个像素点对应。

进一步地，所述处理器802对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还用于：

根据后处理的结果更新所述置信度特征图。

进一步地，所述处理器802根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，具体用于：

检测所述置信度特征图中每个点数据的语义的置信度；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。

进一步地，所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括正射影像；或者，

进一步地，所述处理器802基于语义识别模型处理所述目标图像数据之前，还用于：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

进一步地，所述处理器802基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型，具体用于：

本发明实施例还提供了一种可移动平台，具体的，所述可移动平台包括：动力系统，用于为可移动平台提供移动的动力；存储器和处理器；处理器，用于执行如下步骤：

进一步地，所述处理器对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图时，具体用于：

进一步地，所述处理器对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还用于：

根据后处理的结果更新所述置信度特征图。

进一步地，所述处理器在根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，具体用于：

检测所述置信度特征图中每个点数据的语义的置信度；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。

进一步地，所述处理器在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置时，具体用于：

进一步地，所述处理器在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置之后，还用于：

控制可移动平台按照所述航线移动。

进一步地，所述处理器在根据所述目标图像数据中目标区域的位置和语义类别，规划航线时，具体用于：

进一步地，所述处理器控制可移动平台按照所述航线移动时，具体用于：

进一步地，所述处理器还用于：

进一步地，所述预定操作包括农药喷洒操作。

进一步地，所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括正射影像；或者，

进一步地，所述处理器基于语义识别模型处理所述目标图像数据之前，还用于：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

进一步地，所述处理器基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型时，具体用于：

本发明实施例中，可移动平台可以获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据，并对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，以及根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。通过这种实施方式，实现了快速、高效地识别目标图像数据中的目标区域的位置，从而提高了对图像区域的定位效率。

本发明实施例还提供了另一种可移动平台，具体的，所述可移动平台包括：动力系统，用于为可移动平台提供移动的动力；存储器和处理器；处理器，用于执行如下步骤：

进一步地，所述处理器根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量时，具体用于：

计算所述置信度特征图上不同类别的点数据的数量；

根据后处理的结果更新所述置信度特征图。

进一步地，所述处理器根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，具体用于：

检测所述置信度特征图中每个点数据的语义的置信度；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。

进一步地，所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括正射影像；或者，

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

进一步地，所述处理器基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型，具体用于：

本发明实施例中，可移动平台可以获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据，并对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，从而根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。通过这种实施方式，实现了基于置信度特征图，自动对目标图像数据上具有相同语义的目标对象进行计数，提高了计数效率。

本发明实施例还提供了一种无人机，包括：机身；设置于所述机身上的动力系统，用于提供飞行动力；摄像装置，用于拍摄目标图像数据；所述动力系统包括：桨叶、电机，用于驱动桨叶转动；如图7或图8所述的图像处理设备。

在本发明的实施例中还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现本发明图图2或图5所对应实施例中描述的图像处理方法方式，也可实现图7或图8所述本发明所对应实施例的图像处理设备，在此不再赘述。

所述计算机可读存储介质可以是前述任一项实施例所述的设备的内部存储单元，例如设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备，例如所述设备上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述设备所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所揭露的仅为本发明部分实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

一种图像处理方法，其特征在于，包括：

获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据；

对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；

根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。
根据权利要求1所述的方法，其特征在于，对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，包括：

基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度；

根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据；

根据所述包含语义类别和语义的置信度的点云数据，生成所述置信度特征图。
根据权利要求2所述的方法，其特征在于，

所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别。
根据权利要求3所述的方法，其特征在于，所述对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还包括：

根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理；

根据后处理的结果更新所述置信度特征图。
根据权利要求4所述的方法，其特征在于，所述根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理，包括：

检测所述置信度特征图中每个点数据的语义的置信度；

对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。
根据权利要求5所述的方法，其特征在于，所述根据所述置信度特征图，确定所述目标图像数据中目标区域的位置，包括：

获取所述置信度特征图中每个点数据的位置数据和语义类别；

根据所述置信度特征图中每个点数据的位置数据和语义类别，确定所述置信度特征图中具有相同语义类别的图像区域；

根据所述置信度特征图中具有相同语义类别的图像区域，确定所述目标图像数据中目标区域的位置数据。
根据权利要求6所述的方法，其特征在于，所述根据所述置信度特征图，确定所述目标图像数据中目标区域的位置之后，还包括：

根据所述目标图像数据中目标区域的位置和语义类别，规划航线；

控制可移动平台按照所述航线移动。
根据权利要求6所述的方法，其特征在于，所述根据所述目标图像数据中目标区域的位置和语义类别，规划航线，包括：

根据所述置信度特征图上具有不同语义类别的图像区域，对不同语义类别的图像区域进行分类；

根据不同类别的图像区域，规划各类别的图像区域对应的航线。
根据权利要求7所述的方法，其特征在于，所述控制可移动平台按照所述航线移动，包括：

在控制所述可移动平台按照所述航线移动的过程中，判断所述可移动平台的当前位置在所述置信度特征图中所对应的语义类别是否与目标任务的语义类别相匹配；

如果判断结果为是，则控制所述可移动平台执行所述目标任务。
根据权利要求7-9任一项所述的方法，其特征在于，

所述可移动平台包括无人机或者按照航线自动行驶的无人车。
根据权利要求9所述的方法，其特征在于，还包括：

在控制所述可移动平台按照所述航线移动的过程中，控制所述可移动平台在所述航线中的标记点停留，以执行与目标任务对应的预定操作。
根据权利要求11所述的方法，其特征在于，所述预定操作包括农药喷洒操作。
根据权利要求12所述的方法，其特征在于，所述农药喷洒操作包括围绕指定点进行环形喷洒的操作。
根据权利要求1所述的方法，其特征在于，

所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，

所述目标图像数据包括正射影像；或者，

所述目标图像数据包括正射影像和所述正射影像对应的景深数据。
根据权利要求2所述的方法，其特征在于，所述基于语义识别模型处理所述目标图像数据之前，还包括：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型；

其中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。
根据权利要求15所述的方法，其特征在于，所述基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型，包括：

调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果；

若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。
一种图像处理方法，其特征在于，包括：

获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据；

对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；

根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。
根据权利要求17所述的方法，其特征在于，所述根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量，包括：

根据所述置信度特征图上各点数据的语义类别，对所述置信度特征图上不同语义类别的点数据进行分类；

计算所述置信度特征图上不同类别的点数据的数量；

确定所述置信度特征图上不同类别的点数据的数量为所述目标图像数据上具有相同语义的目标对象的数量。
根据权利要求17所述的方法，其特征在于，所述对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图，包括：

基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度；

根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据；

根据所述包含语义类别和语义的置信度的点云数据，生成所述置信度特征图。
根据权利要求19所述的方法，其特征在于，

所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别；

所述点云数据包含的每个点数据与所述目标图像数据中的每个像素点对应。
根据权利要求20所述的方法，其特征在于，所述对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还包括：

根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理；

根据后处理的结果更新所述置信度特征图。
根据权利要求21所述的方法，其特征在于，所述根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理，包括：

检测所述置信度特征图中每个点数据的语义的置信度；

对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。
根据权利要求17所述的方法，其特征在于，

所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，

所述目标图像数据包括正射影像；或者，

所述目标图像数据包括正射影像和所述正射影像对应的景深数据。
根据权利要求19所述的方法，其特征在于，所述基于语义识别模型处理所述目标图像数据之前，还包括：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型；

其中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。
根据权利要求24所述的方法，其特征在于，所述基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型，包括：

调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果；

若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。
一种图像处理设备，其特征在于，所述设备包括：存储器和处理器；

所述存储器，用于存储程序指令；

所述处理器，调用存储器中存储的程序指令，用于执行如下步骤：

获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据；

对目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；

根据所述置信度特征图，确定所述目标图像数据中目标区域的位置。
根据权利要求26所述的设备，其特征在于，所述处理器对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图时，具体用于：

基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度；

根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据；

根据所述包含语义类别和语义的置信度的点云数据，生成所述置信度特征图。
根据权利要求27所述的设备，其特征在于，

所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别。
根据权利要求28所述的设备，其特征在于，所述处理器在对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还用于：

根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理；

根据后处理的结果更新所述置信度特征图。
根据权利要求29所述的设备，其特征在于，所述处理器根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，具体用于：

检测所述置信度特征图中每个点数据的语义的置信度；

对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。
根据权利要求30所述的设备，其特征在于，所述处理器在根据所述置信度特征图，确定所述目标图像数据中目标区域的位置时，具体用于：

获取所述置信度特征图中每个点数据的位置数据和语义类别；

根据所述置信度特征图中每个点数据的位置数据和语义类别，确定所述置信度特征图中具有相同语义类别的图像区域；

根据所述置信度特征图中具有相同语义类别的图像区域，确定所述目标图像数据中目标区域的位置数据。
根据权利要求31所述的设备，其特征在于，所述处理器根据所述置信度特征图，确定所述目标图像数据中目标区域的位置之后，还用于：

根据所述目标图像数据中目标区域的位置和语义类别，规划航线；

控制可移动平台按照所述航线移动。
根据权利要求31所述的设备，其特征在于，所述处理器根据所述目标图像数据中目标区域的位置和语义类别，规划航线时，具体用于：

根据所述置信度特征图上具有不同语义类别的图像区域，对不同语义类别的图像区域进行分类；

根据不同类别的图像区域，规划各类别的图像区域对应的航线。
根据权利要求32所述的设备，其特征在于，所述处理器控制可移动平台按照所述航线移动时，具体用于：

在控制所述可移动平台按照所述航线移动的过程中，判断所述可移动平台的当前位置在所述置信度特征图中所对应的语义类别是否与目标任务的语义类别相匹配；

如果判断结果为是，则控制所述可移动平台执行所述目标任务。
根据权利要求32-34任一项所述的设备，其特征在于，

所述可移动平台包括无人机或者按照航线自动行驶的无人车。
根据权利要求34所述的设备，其特征在于，所述处理器还用于：

在控制所述可移动平台按照所述航线移动的过程中，控制所述可移动平台在所述航线中的标记点停留，以执行与目标任务对应的预定操作。
根据权利要求36所述的设备，其特征在于，所述预定操作包括农药喷洒操作。
根据权利要求37所述的设备，其特征在于，所述农药喷洒操作包括围绕指定点进行环形喷洒的操作。
根据权利要求26所述的设备，其特征在于，

所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，

所述目标图像数据包括正射影像；或者，

所述目标图像数据包括正射影像和所述正射影像对应的景深数据。
根据权利要求27所述的设备，其特征在于，所述处理器基于语义识别模型处理所述目标图像数据之前，还用于：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型；

其中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。
根据权利要求40所述的设备，其特征在于，所述处理器基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型时，具体用于：

调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果；

若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。
一种图像处理设备，其特征在于，所述设备包括：存储器和处理器；

所述存储器，用于存储程序指令；

所述处理器，调用存储器中存储的程序指令，用于执行如下步骤：

获取目标图像数据，所述目标图像数据包括目标图像以及所述目标图像中各像素点对应的景深数据；

对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图；

根据所述置信度特征图，确定所述目标图像数据上具有相同语义类别的目标对象的数量。
根据权利要求42所述的设备，其特征在于，所述处理器根据所述置信度特征图，确定所述目标图像数据上具有相同语义的目标对象的数量时，具体用于：

根据所述置信度特征图上各点数据的语义类别，对所述置信度特征图上不同语义类别的点数据进行分类；

计算所述置信度特征图上不同类别的点数据的数量；

确定所述置信度特征图上不同类别的点数据的数量为所述目标图像数据上具有相同语义的目标对象的数量。
根据权利要求42所述的设备，其特征在于，所述处理器对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图时，具体用于：

基于语义识别模型处理所述目标图像数据，以获得所述目标图像数据中每个像素点所具有的语义类别和语义的置信度；

根据所述目标图像数据对应的位置数据、高度数据以及所述目标图像数据中每个像素点所具有的语义类别和语义的置信度，生成包含语义类别和语义的置信度的点云数据；

根据所述包含语义类别和语义的置信度的点云数据，生成所述置信度特征图。
根据权利要求44所述的设备，其特征在于，

所述点云数据和所述置信度特征图均包含复数个点数据，每个点数据包括位置数据、高度数据和不同置信度的多个语义类别；

所述点云数据包含的每个点数据与所述目标图像数据中的每个像素点对应。
根据权利要求45所述的设备，其特征在于，所述处理器对所述目标图像数据进行处理，得到所述目标图像数据的语义的置信度特征图之后，还用于：

根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理；

根据后处理的结果更新所述置信度特征图。
根据权利要求46所述的设备，其特征在于，所述处理器根据所述置信度特征图中每个点数据的语义的置信度，对所述置信度特征图进行后处理时，具体用于：

检测所述置信度特征图中每个点数据的语义的置信度；

对所述置信度特征图中语义的置信度小于或等于预设置信度阈值的点数据进行删除处理；

所述根据后处理的结果更新所述置信度特征图，包括：

基于所述删除处理后的点云数据，更新所述置信度特征图。
根据权利要求42所述的设备，其特征在于，

所述目标图像数据包括彩色图像；或者，

所述目标图像数据包括彩色图像和所述彩色图像对应的景深数据；或者，

所述目标图像数据包括正射影像；或者，

所述目标图像数据包括正射影像和所述正射影像对应的景深数据。
根据权利要求44所述的设备，其特征在于，所述处理器基于语义识别模型处理所述目标图像数据之前，还用于：

获取样本数据库，所述样本数据库包括样本图像数据；

根据预设的语义识别算法生成初始语义识别模型；

基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型；

其中，所述样本图像数据包括样本图像和语义标注信息；或者，所述样本图像数据包括样本图像、所述样本图像中各个像素点对应的景深数据和语义标注信息。
根据权利要求49所述的设备，其特征在于，所述处理器基于所述样本数据库中的各个样本图像数据对所述初始语义识别模型进行训练优化，得到所述语义识别模型时。具体用于：

调用所述初始语义识别模型对所述样本图像数据包括的所述样本图像以及所述样本图像中各个像素点对应的景深数据进行识别，得到识别结果；

若所述识别结果与所述样本图像数据包括的语义标注信息相匹配，则对所述初始语义识别模型的模型参数进行优化，以得到所述语义识别模型。
一种可移动平台，其特征在于，包括：

动力系统，用于为所述可移动平台提供移动的动力；

如权利要求26-41中任一项所述的图像处理设备。
一种可移动平台，其特征在于，包括：

动力系统，用于为所述可移动平台提供移动的动力；

如权利要求42-50中任一项所述的图像处理设备。
一种无人机，其特征在于，包括：

机身；

设置于所述机身上的动力系统，用于提供飞行动力；

如权利要求26-50中任一项所述的图像处理设备。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至25任一项所述方法。