WO2023178510A1

WO2023178510A1 - 图像处理方法、装置和系统、可移动平台

Info

Publication number: WO2023178510A1
Application number: PCT/CN2022/082257
Authority: WO
Inventors: 魏笑
Original assignee: 深圳市大疆创新科技有限公司
Priority date: 2022-03-22
Filing date: 2022-03-22
Publication date: 2023-09-28
Also published as: CN117882117A

Abstract

本公开实施例提供一种图像处理方法、装置和系统、可移动平台，所述方法包括：获取N张样本图像，所述样本图像为车辆在行驶过程中对周围环境采集的图像；在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数，所述M张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。

Description

图像处理方法、装置和系统、可移动平台

技术领域

本公开涉及人工智能技术领域，具体而言，涉及图像处理方法、装置和系统、可移动平台。

背景技术

为了提高机器学习模型的性能，需要进行数据挖掘，即从数据池中提取出导致机器学习模型失效的、表现不好的、甚至是没见过的边角案例(corner case)数据来调整机器学习模型的模型参数。相关技术一般基于待挖掘数据的信息量来进行数据挖掘，然而，这种数据挖掘方式受背景噪声的干扰较大，数据挖掘准确度较低。

发明内容

第一方面，本公开实施例提供一种图像处理方法，所述方法包括：

获取N张样本图像，所述样本图像为车辆在行驶过程中对周围环境采集的图像；

在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；

获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；

根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数，所述M张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。

第二方面，本公开实施例提供一种图像处理装置，所述装置包括处理器，所述处理器用于执行以下步骤：

第三方面，本公开实施例提供一种图像处理系统，所述系统包括：

视觉传感器，部署在车辆上，用于在所述车辆行驶过程中对周围环境进行图像采集，得到N张样本图像；

处理器，用于在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数；

服务器，用于基于所述M张样本图像对所述车辆的机器学习模型的副本进行训练，并将训练后的机器学习模型部署到所述车辆上。

第四方面，本公开实施例提供一种可移动平台，所述可移动平台包括：

视觉传感器，用于在所述可移动平台行驶过程中对周围环境进行图像采集，得到N张样本图像；

电子控制单元，用于基于所述可移动平台上部署的机器学习模型的输出结果，对所述可移动平台进行自动驾驶决策，所述机器学习模型用于基于从所述N张样本图像中确定的M张样本图像训练得到，所述M张样本图像基于本公开任一实施例所述的方法获取。

第五方面，本公开实施例提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现本公开任一实施例所述的方法。

本公开实施例方案从样本图像中确定与所述车辆的自动驾驶决策相关联的交通元素的成像区域，即目标像素区域，在获取信息量时，仅聚焦于目标像素区域的信息量，并基于目标像素区域的信息量进行样本图像的数据挖掘。这样，在获取信息量时减少了与车辆的自动驾驶决策无关的元素的干扰，从而减少了背景噪声对数据挖掘过程的干扰，提高了数据挖掘准确度。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是数据挖掘过程的示意图。

图2A和图2B分别是不同图像中物体的uncertainty的示意图。

图3是本公开实施例的图像处理方法的流程图。

图4A、图4B、图4C和图4D分别是本公开实施例的基于像素区域的特征确定目标像素区域的示意图。

图5A、图5B和图5C分别是本公开实施例的基于物体的特征确定目标像素区域的示意图。

图6A和图6B分别是本公开实施例的基于视觉传感器的视角确定目标像素区域的示意图。

图7是本公开实施例的系统架构的示意图。

图8是本公开实施例的总体流程的示意图。

图9是本公开实施例的应用场景的示意图。

图10是本公开实施例的图像处理装置的结构示意图。

图11是本公开实施例的图像处理系统的示意图。

图12是本公开实施例的可移动平台的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

机器学习模型(简称模型)通常由不同种类、功能的神经元构成，用以执行特定的机器学习任务。所述机器学习任务可以是回归任务、分类任务，或者两者相结合。通常，模型越大越复杂，其性能越好。在采用机器学习模型执行机器学习任务之前，需要采用样本数据对机器学习模型进行训练。然而，实际采集的样本数据对于机器学习模型的训练来说往往是重复、冗余、不平衡的，在很多情况下，一小部分的类别占据了大多数的样本数据，而大部分的类别只有极少数的样本数据，这一问题称为数据的长尾问题。为了提高机器学习模型的性能，需要进行数据挖掘，如图1所示，数据挖掘一般是指通过挖掘算法从数据池中提取出部分数据作为挖掘结果，期望的挖掘结果为导致机器学习模型失效的、表现不好的、甚至是没见过的边角案例(corner case)数据，利用挖掘结果来调整机器学习模型的模型参数，从而获得性能较好的模型。

其中，数据池是指待挖掘的海量数据，通常指某一任务场景中所有采集到的作为模型输入的数据总和，通常不包括或者仅包括有限的标注信息。数据池中数据的类别根据任务场景不同而不同，包括但不限于图像、视频、音频、文字等各种模态的数据，并且在同一个任务场景中可以多种模态的数据共存。数据池可以是云端也可以是本地。可以是单一节点，也可以是分布式存储系统。数据池内的数据组织方式和数据结构不做要求，只要支持单帧图像输出即可。个别注意力机制算法可能要求时间上连续的样本，这种情况下要求数据池保存并可以检索样本的物理时间。

鉴于实际情况中数据池极为庞大和复杂，数据挖掘一般采用纯算法或者半人工的数据挖掘手段实现。挖掘算法包括不确定性采样(uncertainty sampling)、多样性采样(diversity sampling)、异议采样(disagreement based sampling)等算法，这三种方法都是通过某种采样模型计算待挖掘样本的信息量，然后根据信息量大小进行数据挖掘。例如，在不确定性采样算法中，信息量正比于模型预测的uncertainty大小；在多样性采样算法中，信息量正比于数据的diverse程度；在异议采样算法中，信息量正比于采样模型之间异议的程度。

然而，发明人发现，上述数据挖掘方式都是从样本整体维度进行信息量估计，在进行数据挖掘时没有提供足够细的粒度去估计样本的信息量，会引入冗余信息和噪音，导致数据挖掘准确度较低。

举例来说，在L2自动驾驶物体检测任务中，需要挖掘一些容易导致漏检误检骑自行车人的样本，采取不确定性采样算法对样本信息量进行估计，如图2A所示，算法为包括骑自行车的人的区域201给出了很高的uncertainty，为包括机动车的区域202给出了较低的uncertainty。但是，这并不代表该帧图像会被以很高的优先级挖掘出来，因为背景噪声带来的uncertainty noise会导致其他无关样本有更高的uncertainty，从而有更高的优先级被挖掘。

例图2B所示，虚线框203内的是人行道上的一排自行车。虽然这里被给出很高的uncertainty是合理的，因为“自行车物体”和“骑自行车的人”很容易被混淆，但是，在人行道上的自行车哪怕被误检也不影响L2自动驾驶系统的决策。用户只优先关心行车道上的物体，或者说，在数据挖掘的时候，希望以更高的优先级挖掘行车道上相关物体的漏检误检。

由上例可以看出，不同的系统、不同的机器学习任务可能都有自身特定的数据挖掘需求。每张待挖掘的样本，用户会以更高优先级关心某些区域。相关技术中的数据挖掘系统并没有很好地支持这种需求。

基于此，本公开实施例提供一种图像处理方法，该方法基于注意力机制进行数据挖掘，可以在有或者没有专家知识先验的情况下，通过自动算法从每个图像样本中识别、划分出人为定义的目标像素区域，以作为数据挖掘计算信息量的最小单元，从而达到在挖掘过程中通过“注意力聚焦”以排除不重要因素干扰的目的。参见图3，所述方法包括：

步骤301：获取N张样本图像，所述样本图像为车辆在行驶过程中对周围环境采集的图像；

步骤302：在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；

步骤303：获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；

步骤304：根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数，所述M张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。

在步骤301中，所述周围环境可以是车辆行驶或停靠的道路环境，所述道路环境中可以包括一种或多种交通元素，道路环境中的交通元素可能包括与所述车辆的自动驾驶决策相关联的交通元素，也可能包括与所述车辆的自动驾驶决策无关的交通元素。在一些实施例中，所述交通元素可以包括车辆自身要素和外部交通环境要素，外部交通环境要素又包括静态环境要素、动态环境要素、交通参与者要素和/或气象要素等。车辆自身要素包括车辆自身的基础属性(例如，重量、几何信息、性能信息等)、位置信息(例如，坐标信息、所在的车道信息等)、运动状态信息(例如，横向运动状态和纵向运动状态)和/或驾驶任务信息(例如，感知识别、路径规划、人机交互、联网通信等)。静态环境要素是指交通环境中静止状态的物体，包括道路、交通设施、周围景观以及障碍物等。动态环境要素是指交通环境中处于动态变化的要素，包括动态指示设施(例如，交通信号灯、可变交通标志、交警等)和通信环境信息(例如，信号强度信息、电磁干扰信息、信号延迟信息等)。交通参与者要素包括车辆周围的行人、动物和/或其他车辆等对车辆的决策规划造成影响的对象信息。气象要素包括行驶场景中的环境温度、光照条件和/或天气情况等信息。

可以对周围环境进行图像采集，得到N张样本图像。所述N张样本图像既可以包括由车辆上的视觉传感器采集得到的图像，又可以包括由在车辆的行驶环境中设置的监控装置采集得到的图像。其中，所述车辆的数量可以大于或等于1，通过多台车辆上的视觉传感器共同采集样本图像，能够提高样本图像的采集效率。当车辆在行车道上行驶时，所述监控装置可以包括在行车道周围布设的若干监控摄像头。所述N张样本图像既可以包括单张图像，也可以包括视频中的一帧或多帧视频帧。

在步骤302中，可以针对每张样本图像确定目标像素区域。其中，目标像素区域为所述周围环境中与车辆的自动驾驶决策相关联的交通元素的成像区域。所述与车辆的自动驾驶决策相关联的交通元素一般是指会对自动驾驶决策产生影响的交通元素。当车辆在行车道上行驶时，行车道上的其他车辆、在行车道前方的斑马线上经过的行人和动物、行车道周围路口的交通信号灯、行驶时的自然环境等元素都可能会影响自动驾驶决策。例如，当行车道上存在车辆A和车辆B时，车辆A需要基于车辆B的位置和移动速度确定自身的行驶路径和行驶速度，以避免与车辆B相撞。又例如，当行车道周围路口存在交通信号灯时，车辆需要基于交通信号灯的状态确定是否能够通过路口。

一张样本图像中可能包括一个或多个目标像素区域，也可能不包括目标像素区域。如果一张样本图像中不包括目标像素区域，可以直接将该样本图像丢弃。如果一张样本图像中包括一个或多个目标像素区域，可以将该样本图像用于后续步骤的处理。下面对确定目标像素区域的具体方式进行举例说明。

在一些实施例中，可以基于所述样本图像中各像素区域的特征确定目标像素区域，或者基于所述样本图像中包括的物体的特征确定目标像素区域，或者基于所述视觉传感器的视角确定目标像素区域，获取基于所述机器学习模型执行的任务确定目标像素区域。还可以基于上述两种或两种以上方式共同确定目标像素区域。下面对各种确定目标像素区域的方式进行逐一说明。

(1)基于所述样本图像中各像素区域的特征确定目标像素区域

在一些实施例中，像素区域的特征包括但不限于所述像素区域的位置、深度、像素值和/或语义。其中，一个像素区域的位置可以是像素区域在物理空间中的位置，也可以是该像素区域在样本图像中的像素位置，所述位置可以是绝对位置，也可以是相对位置。所述深度可以是所述像素区域中的某个像素点或者某个物体到拍摄所述像素区域所属的样本图像的图像采集装置的深度。所述像素值可以包括所述像素区域中部分或全部像素点的像素值。所述语义可用于表征所述像素区域中的像素点对应的交通元素的类别(例如，车道类别、人行道类别、交通信号灯类别等)。

在所述像素区域的特征包括所述像素区域的位置的情况下，可以将预设位置范围内的像素区域确定为所述目标像素区域。所述预设位置范围可以是连续的位置区间(例如，大于或等于某个位置下限，和/或小于或等于某个位置上限)，也可以是离散的一个或多个位置点。图4A示出了所述位置为像素位置时的示意图，所述预设位置范围为样本图像中居中的一块像素区域，如图中虚线框所示。假设车辆401在道路上行驶，且车辆401在T1时刻与在T2时刻处于道路上不同的位置。在T1时刻，通过车辆401右侧的摄像头(图中未示出)采集到样本图像P1，且样本图像P1中包括狗402，在T2时刻，通过车辆401右侧的摄像头采集到样本图像P2，且样本图像P2中包括行人403。可以看出，无论虚线框中的像素区域在物理空间中处于哪一位置，也无论虚线框中的像素区域中包括何种物体，在采集的样本图像中，均以同一块像素区域(即虚线框内的像素区域)作为目标像素区域。当然，所述预设位置范围除了可以是样本图像中居中的像素区域之外，也可以是本图像中居中的其他像素区域，且预设位置范围的尺寸和数量不限于图中所示。

图4B示出了所述位置为像素区域在物理空间中的位置时的示意图，白色椭圆形区域为摄像头404的视野范围，该视野范围可变，灰色椭圆形区域表示所述预设位置范围。假设在T1时刻，狗402处于摄像头404的视野范围S1内的预设位置范围，且在T2时刻，行人403处于摄像头404的视野范围S2内的预设位置范围，则两个时刻采集的样本图像P3和P4中，目标像素区域如虚线框所示。可以看出，无论摄像头404的视野范围如何变化，在采集的样本图像中，均以同一物理位置在样本图像中对应的像素区域作为目标像素区域。当然，所述预设位置范围除了可以是图中所示的区域之外，也可以是摄像头视野范围内的其他区域，且预设位置范围的尺寸和数量不限于图中所示。

在所述像素区域的特征包括所述像素区域的深度的情况下，可以将预设深度范围内的像素区域确定为所述目标像素区域，所述预设深度范围可以是连续的深度区间(例如，大于或等于某个深度下限，和/或小于或等于某个深度上限)，也可以是离散的一个或多个深度点。如图4C所示，假设在某一时刻，狗402与行人403与车辆401的深度均在预设深度范围内，则采集的样本图像P5中包括狗402的像素区域以及包括行人403的像素区域均为目标像素区域(如图中虚线框所示)。图中示出了同一张样本图像中包括两个处于预设深度范围内的物体的情况，在实际情况下，同一张样本图像中包括的处于预设深度范围内的物体的数量也可以是其他数量，各个物体可以是同一个摄像头采集到的，也可以是不同摄像头采集到的。

在所述像素区域的特征包括所述像素区域的语义的情况下，可以将预设语义类别的像素区域确定为所述目标像素区域。如图4D所示，样本图像中的像素区域的语义类别包括机动车道类别和人行道类别，可以将其中一者或两者确定为目标像素区域。当然，本领域技术人员可以理解，语义类别的划分方式不限于图中所示，例如，可以对语义类别进行更为细致的划分，例如，将机动车道进一步划分为左转车道类别、直行车道类别和右转车道类别等。除了车道类别之外，语义类别还可能包括交通信号灯类别、行人类别、地面指示线类别等。

在所述像素区域的特征包括所述像素区域的像素值的情况下，可以将包括预设像素值的像素点的像素区域确定为所述目标像素区域。例如，可以将包括红色像素点的像素区域确定为目标像素区域。

(2)基于所述样本图像中包括的物体的特征确定目标像素区域。

一个物体的特征包括但不限于所述物体的类别、移动速度、尺寸中的至少一者。其中，所述类别可用于表征物体属于何种交通元素，所述移动速度可以是绝对速度或者相对速度，所述尺寸可以是像素尺寸，也可以是物体在物理空间中的尺寸。

可以从图像中确定具有预设特征的物体，并将样本图像中所述预设特征的物体所在的像素区域确定为目标像素区域。所述具有预设特征可以是属于预设类别、移动速度在预设速度范围内和/或尺寸在预设尺寸范围内。如图5A所示，假设样本图像中包括“行人”类别的对象和“狗”类别的对象，且“行人”类别为预设类别，则可以将“行人”类别的对象所在的像素区域确定为目标像素区域。

在一些实施例中，可以从所述样本图像中识别具有预设特征的目标物体；将所述样本图像中所述目标物体所在的像素区域以及与所述目标物体类别相同的其他物体所在的像素区域确定为目标像素区域。如图5B所示，可以从样本图像中识别移动速度不为0的目标物体，假设目标物体的类别为行人A，则可以从样本图像中识别行人A以外的其他行人，假设识别到行人B和行人C，则可以将行人A所在的像素区域、行人B所在的像素区域以及行人C所在的像素区域均确定为目标像素区域(如图中虚线框所示)。

在一些实施例中，所述样本图像包括视频中的多帧目标视频帧。在这种情况下，可以从所述视频中的一帧参考视频帧中识别具有预设特征的目标物体；对所述目标物体进行跟踪，以确定每帧目标视频帧中包括所述目标物体的像素区域；将每帧目标视频帧中包括所述目标物体的像素区域确定为目标像素区域。如图5C所示，假设F1、F2和F3为视频中的多帧目标视频帧，这些目标视频帧可能是连续的，也可能是不连续的。假设所述预设特征为类别属于“行人”类别，则可以先对视频帧F1进行识别，假设识别到行人A，进而可以对行人A进行跟踪，以在视频帧F2和F3中分别识别行人A。假设行人A在F1、F2和F3中的像素位置分别如图中所示，则可以将F1、F2和F3中包括行人A的像素区域分别确定为目标像素区域，如图中虚线框所示。

在一些实施例中，所述预设特征基于所述物体所在的像素区域的语义类别确定，即，可以分别为不同的像素区域确定不同的预设特征。以所述预设特征是预设类别为例，对于道路所在的像素区域而言，该像素区域内影响车辆的自动驾驶决策的交通元素主要是机动车、非机动车、行人等类别的物体，因此，可以将机动车、非机动车、行人等一个或多个类别确定为道路所在的像素区域对应的预设类别；而其他像素区域(除了道路所在的像素区域以外的区域)内影响车辆的自动驾驶决策的交通元素可能主要包括交通信号灯，因此，可以将交通信号灯类别确定为其他像素区域对应的预设类别。

(3)基于所述视觉传感器的视角确定目标像素区域。例如，可以将视觉传感器在预设视角范围内采集的像素区域确定为目标像素区域。在一些实施例中，所述预设视角范围小于视觉传感器的总的视角范围。如图6A所示，假设视觉传感器的总的视角范围为α ₁，该视角范围能够对浅灰色区域601进行成像，由于图像边缘的畸变程度一般高于图像中心区域的畸变程度，因此，可以确定一个小于α ₁的视角范围α ₂，视角范围α ₂能够对深灰色区域602进行成像。从而深灰色区域602对应的像素区域即为目标像素区域。

在一些实施例中，所述预设视角范围可以是两个或两个以上视角传感器的重叠的视角范围。如图6B所示，以包括重叠的视角范围的两个视觉传感器为例，其中，椭圆形区域603和604分别为两个视觉传感器各自的视角，这两个传感器的视角的重叠范围如图中带斜线的区域所示。可以将该重叠范围对应的像素区域确定为目标像素区域。

(4)所述目标像素区域基于数据挖掘任务确定。一种数据挖掘任务可能对应几种区域，不同的数据挖掘任务可能对应不同的区域。同一组数据上可能被执行多种数据挖掘任务。例如，在数据挖掘任务为“挖掘蓝色轿车”或者“挖掘机动车道上的车辆”时，可以将机动车道对应的像素区域确定为目标像素区域；在数据挖掘任务为“挖掘人行道上的物体”时，可以将人行道对应的像素区域确定为目标像素区域。

在实际确定目标像素区域时，可以基于上述任意一种方式确定目标像素区域，或者，也可以同时基于上述至少两种方式确定目标像素区域，例如，可以将属于预设语义类别，且包括预设特征的物体的像素区域确定为目标像素区域，在预设语义类别为机动车道类别，预设特征为自行车类别时，可以将机动车道上包括自行车的像素区域确定为目标像素区域。还可以结合上述至少任一方式与其他方式共同确定目标像素区域，此处不再一一列举。可以在不同的场景下采用不同的方式确定目标像素区域，从而提高方案的灵活性和可扩展性。当边角案例的定义发生变化，亦即挖掘标准变化时，挖掘算法能够以很低的成本进行适配。

在步骤303中，可以采用各种确定信息量的方式来确定目标像素区域的信息量，所述确定信息量的方式包括但不限于前述不确定性采样、多样性采样或者异议采样。由于在获取信息量时，仅聚焦于目标像素区域的信息量，并基于目标像素区域的信息量进行样本图像的数据挖掘。这样，在获取信息量时减少了与车辆的自动驾驶决策无关的元素的干扰，从而减少了背景噪声对数据挖掘过程的干扰，提高了数据挖掘准确度。

在步骤304中，可以根据所述样本图像中所述目标像素区域的信息量，对所述样本图像进行评分，得到所述样本图像的评分值；根据所述N张样本图像的评分值，在所述N张样本图像中选择M张样本图像。其中，一张样本图像的评分值与该样本图像被选择的概率可以正相关，也可以反相关。以正相关的情况为例，则可以对各样本图像的评分值按照从大到小的顺序进行排序，并从中选择排序靠前的M张样本图像。当然，还可以采用其他方式来选择M张样本图像，此处不再赘述。

本公开实施例的方案可采用图7所示的架构实现。其中，数据池(database)701用于存储待挖掘的样本图像，样本图像可以经由注意力节点(attention node)702进行处理，以确定目标像素区域。其中，确定目标像素区域的方式可采用前述任意一种方式，具体的算法可采用跟踪(tracking)算法、分割(segmentation)算法等。在跟踪算法中，用户只关心图像中某个动态物体的特征，例如一辆车。则在时序数据的第一帧画框框出目标车辆，然后采用tracking算法在之后每帧图像中自动跟踪该框，并基于跟踪结果确定目标像素区域。在分割算法中，用户只关心画面中某些区域的特征，例如只关心机动车道区域。则通过一个语义分割(semantic segmentation)网络对图像进行分割，只保留“机动车道”类别的像素点对应的区域作为目标像素区域。

在确定目标像素区域之后，可以将目标像素区域发送至挖掘节点(mining node)703，挖掘节点703可以采用不确定性采样、多样性采样等方式确定目标像素区域的信息量，并基于信息量挖掘出M张样本图像。挖掘出的M张样本图像可以存入数据池701进行存储，也可以输出给其他处理单元。确定目标像素区域的方式、注意力节点702采用的算法以及挖掘节点703采用的算法均可以通过图形用户界面(Graphical User Interface，GUI)704输入。在GUI上还可以对筛选出的M张样本图像进行二次筛查，或者通过在GUI上输入相应指令以将筛选出的样本图像直接存入数据池。

在一些实施例中，可以对所述M张样本图像进行人工筛选，得到K张样本图像。自动挖掘方式可能存在一定的误差，因此，本公开实施例进一步对挖掘出的M张样本图像进行人工筛选，得到K张样本图像，并将这K张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型，以提高训练效果。其中K可以小于或等于M。本公开实施例对数据池中的大量样本图像进行自动化数据挖掘，并将人工筛选作为辅助，同时保证了挖掘效率与挖掘结果的准确度。

如图8所示，筛选出的样本图像可以用于训练与车辆的自动驾驶决策相关的机器学习模型。其中，车辆的自动驾驶决策依据感知信息来替代人类驾驶员对车辆的行驶状态进行决策和控制，从而实现车道保持、车道偏离预警、车距保持、障碍物警告等功能。自动驾驶决策可以基于部署在车辆上的机器学习模型实现，所述机器学习模型可以包括但不限于各种检测模型、识别模型、分类模型等。例如，可以通过识别模型对道路上的交通元素进行识别，以确定其中的交通信号灯，从而依据交通信号灯的信息确定是否能够通过当前路口。又例如，可以通过检测模型检测前车与本车的车距，从而确定是否需要减速。由于自动驾驶决策可能涉及多种机器学习任务，因此，部署在车辆上的机器学习模型可能包括执行不同机器学习任务的多个机器学习模型。

部署在车辆上的机器学习模型可以基于挖掘出的样本图像以及样本图像中交通元素对应的描述真值训练得到，执行不同机器学习任务的机器学习模型训练时采用的描述真值可能不同。例如，执行分类任务的机器学习模型所采用的描述真值为样本图像中各像素点的类别，执行检测任务的机器学习模型所采用的描述真值为样本图像中检测到的车辆到本车的距离。

在一些实施例中，可以将所述M张样本图像输入真值标定系统801，以获取所述M张样本图像中所述交通元素对应的描述真值；基于所述M张样本图像以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。其中，真值标定系统801可以通过自动标定、半自动标定或者人工标定方式来获取样本图像中所述交通元素对应的描述真值。不同的真值标定系统的标定准确性和标定效率不同，例如，人工标定方式效率较低但准确性较高，而自动标定或半自动标定的方式效率较高但准确性较低。因此，需要对真值标定系统的标定效率和准确性进行权衡。

在一些自动标定系统中，可以预先在云端训练一个性能较优的机器学习模型，该机器学习模型执行的任务与部署在车辆上的机器学习模型相同，且该机器学习模型的标定结果的准确度高于预设的准确度阈值，从而可以直接将该机器学习模型的输出结果作为所述描述真值。例如，可以通过部署在云端的识别模型从样本图像中识别交通信号灯，并输出交通信号灯的颜色(红灯、黄灯、绿灯)的描述真值。然后，将该样本图像及其中的交通信号灯的颜色的描述真值用于训练部署在车辆上的机器学习模型，以便使部署在车辆上的机器学习模型能够准确地针对交通信号灯的颜色确定是否能够通过路口。

在一些半自动标定系统中，可以先获取部署在车辆上的机器学习模型针对样本图像的输出结果，如果车辆的决策系统针对该样本图像输出的自动驾驶决策结果正常，则将部署在车辆上的机器学习模型的输出结果作为所述描述真值，否则通过人工标定的方式确定该样本图像中所述交通元素对应的描述真值。例如，可以通过部署在车辆上的检测模型检测前车与本车的距离。如果在某一时刻，车辆的决策系统针对一张样本图像输出的自动驾驶决策结果指示车辆以当前速度向前行驶，但出现车辆与前车相撞的情况，则表示该自动驾驶决策结果异常，从而可以确定部署在车辆上的机器学习模型输出的车距不准确，因此，可以通过人工标定的方式确定该样本图像中前车与本车的距离，将人工标定的距离作为对应的描述真值。

在一些实施例中，在进行人工标定时，可以将所述M张样本图像中每一样本图像在标定界面进行展示，并标识所述样本图像中的所述目标像素区域；检测用户针对所述交通元素的标定操作，基于所述标定操作获取真值标定结果；将所述真值标定结果作为所述描述真值。所述标定操作可以包括删除、修改原标定结果以及添加标定结果。可以在所述标定界面展示关联交通元素的预标定真值；若检测到用户对所述预标定真值的确认操作，将所述预标定真值确定为所述真值标定结果。反之，若检测到用户对所述预标定真值的调整操作，获取调整后的标定结果，可以将调整后的标定结果确定为所述真值标定结果。

例如，针对识别交通信号灯的任务，可以在显示界面显示预标定真值，所述预标定真值可以是图像中交通信号灯的包围框。如果检测到用户针对该包围框的确认操作，将该包围框确定为所述真值标定结果。反之，若检测到用户对所述包围框的调整操作，例如，调整其大小和/或位置，则将调整后的包围框确定为所述真值标定结果。

除了上述列举的方式之外，还可以基于其他方式获取真值描述，此处不再一一列举。

在获取样本图像的描述真值之后，可以从所述M张样本图像中每一所述样本图像中截取所述目标像素区域；基于所述M张样本图像对应的目标像素区域以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。或者，可以直接基于所述M张样本图像以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。训练好的机器学习模型可以部署到车辆上。

在一些实施例中，除了基于目标像素区域的信息量筛选出用于训练机器学习模型的样本图像之外，还可以基于其他信息筛选样本图像。例如，可以对所述车辆的行驶状态进行检测；获取检测到所述行驶状态异常的时刻之前和/或之后采集到的P张样本图像，P为正整数，所述M张样本图像和所述P张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。所述P张样本图像可以部分或全部包括在所述M张样本图像中，也可以是所述M张样本图像以外的其他图像，即，所述P张样本图像与所述M张样本图像可以部分或全部相同。所述行驶状态可以包括行驶速度、行驶方向等，在行驶状态包括行驶速度时，如果行驶速度的变化率超过一定阈值(例如，车辆急刹车)，可以认为行驶状态异常。在行驶状态包括行驶方向时，如果行驶方向的变化率超过一定阈值(例如，急转弯)，或者转向后撞上障碍物，可以认为行驶状态异常。此外，行驶状态还可以包括其他状态，各种行驶状态下的行驶异常情况可以基于实际场景确定，此处不再一一列举。

又例如，可以获取所述车辆的决策系统输出的决策结果，所述决策结果用于对所述车辆的行驶状态进行决策规划；将输出错误的决策结果的时刻之前和/或之后采集到的Q张样本图像，Q为正整数，所述M张样本图像和所述Q张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。所述Q张样本图像可以部分或全部包括在所述M张样本图像中，也可以是所述M张样本图像以外的其他图像，即，所述Q张样本图像与所述M张样本图像可以部分或全部相同。例如，车辆的决策结果指示按照当前速度行驶后撞上障碍物，或者决策结果指示在直行车道上转向，则确定为错误的决策结果。此外，决策结果错误的情况还可以包括其他情况，此处不再一一列举。

在一些实施例中，可以同时采用所述M张样本图像、所述P张样本图像以及所述Q张样本图像共同训练车辆的机器学习模型。由于行驶状态异常以及决策结果错误时针对的样本图像可能是使机器学习模型表现不好的样本图像，因此，将这些样本图像挖掘出来，有助于提高机器学习模型的性能。

在一些实施例中，所述车辆设置有第一自动驾驶权限；在对所述机器学习模型进行训练之后，将所述车辆的自动驾驶权限设置为第二自动驾驶权限，所述第二自动驾驶权限高于所述第一自动驾驶权限。例如，所述第一自动驾驶权限可以是L2自动驾驶权限，所述第二自动驾驶权限可以是L3自动驾驶权限。可以在训练好机器学习模型之后，采用测试图像对训练好的机器学习模型进行测试，以确定机器学习模型的性能，并根据机器学习模型的性能确定所述第二自动驾驶权限。通过采用本实施例，能够为车辆自动设置其能力范围内的自动驾驶权限，提高了自动驾驶的安全性。

如图9所示，是本公开一实施例的应用场景的示意图。在初始状态下，车辆901设置有第一自动驾驶权限，在该自动驾驶权限下，车辆901不具备自动路径规划权限。可通过车辆901上的视觉传感器采集样本图像，并将样本图像发送至云端进行筛选，或者通过车辆901自身进行筛选，筛选后的样本数据可用于在云端训练机器学习模型。训练好之后，云端可以将机器学习模型下发至车辆901。由于此时车辆901已经对周围环境具备一定的检测、识别能力，因此，可以为车辆901设置第二自动驾驶权限。在该自动驾驶权限下，车辆901具备自动路径规划权限。车辆901可以基于机器学习模型的输出结果规划出路径R，并基于路径R进行自动驾驶。

本公开实施例为解决机器学习模型部署中模型迭代的长尾问题，同时支持用户在数据挖掘中聚焦部分区域的需求，从而提出一种基于注意力机制的数据挖掘框架，并定义其在生产实践中的软件形态。本公开实施例的软件系统可以提供整套数据挖掘功能。本公开具有以下优势：

(1)在估计样本信息量时，能够聚焦在每个图像样本中用户所感兴趣的区域(即目标像素区域)，而排除其他背景、噪声等不关心内容的干扰，提高数据挖掘的质量。

(2)适用领域广，兼容回归、分类、二者结合的机器学习模型和任务。

(3)支持半自动和自动化的数据挖掘过程，能够尽可能减少人为参与。

(4)挖掘标准可扩展，当边角案例的定义发生变化，亦即挖掘标准变化时，挖掘算法可以很低的成本进行适配。

本公开还提供一种图像处理装置，所述装置包括处理器，所述处理器用于执行以下步骤：

在一些实施例中，所述处理器具体用于：基于所述样本图像中各像素区域的特征确定目标像素区域。

在一些实施例中，所述处理器具体用于：所述像素区域的特征包括所述像素区域的位置，所述目标像素区域为预设位置范围内的像素区域；所述像素区域的特征包括所述像素区域的深度，所述目标像素区域为预设深度范围内的像素区域；所述像素区域的特征包括所述像素区域的像素值，所述目标像素区域为包括预设像素值的像素点的像素区域；所述像素区域的特征包括所述像素区域的语义，所述目标像素区域为预设语义类别的像素区域。

在一些实施例中，所述处理器具体用于：基于所述样本图像中包括的物体的特征确定目标像素区域。

在一些实施例中，一个物体的特征包括所述物体的类别、移动速度、尺寸中的至少一者。

在一些实施例中，所述样本图像包括视频中的多帧目标视频帧；所述处理器具体用于：从所述视频中的一帧参考视频帧中识别具有预设特征的目标物体；对所述目标物体进行跟踪，以确定每帧目标视频帧中包括所述目标物体的像素区域；将每帧目标视频帧中包括所述目标物体的像素区域确定为目标像素区域。

在一些实施例中，所述处理器具体用于：从所述样本图像中识别具有预设特征的目标物体；将所述样本图像中所述目标物体所在的像素区域以及与所述目标物体类别相同的其他物体所在的像素区域确定为目标像素区域。

在一些实施例中，所述预设特征基于所述物体所在的像素区域的语义类别确定。

在一些实施例中，所述样本图像由所述车辆上的视觉传感器采集得到；所述处理器具体用于：基于所述视觉传感器的视角确定目标像素区域。

在一些实施例中，所述目标像素区域为所述视觉传感器在预设视角范围内采集的图像。

在一些实施例中，所述目标像素区域基于数据挖掘任务确定。

在一些实施例中，所述处理器还用于：对所述车辆的行驶状态进行检测；获取检测到所述行驶状态异常的时刻之前和/或之后采集到的P张样本图像，P为正整数，所述M张样本图像和所述P张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。

在一些实施例中，所述处理器还用于：获取所述车辆的决策系统输出的决策结果，所述决策结果用于对所述车辆的行驶状态进行决策规划；将输出错误的决策结果的时刻之前和/或之后采集到的Q张样本图像，Q为正整数，所述M张样本图像和所述Q张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。

在一些实施例中，所述处理器具体用于：根据所述样本图像中所述目标像素区域的信息量，对所述样本图像进行评分，得到所述样本图像的评分值；根据所述N张样本图像的评分值，在所述N张样本图像中选择M张样本图像。

在一些实施例中，所述处理器还用于：对所述M张样本图像进行人工筛选，得到K张样本图像，K为正整数，K小于或等于M，所述K张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。

在一些实施例中，所述处理器还用于：将所述M张样本图像输入真值标定系统，以获取所述M张样本图像中所述交通元素对应的描述真值；基于所述M张样本图像以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。

在一些实施例中，所述处理器具体用于：从所述M张样本图像中每一所述样本图像中截取所述目标像素区域；基于所述M张样本图像对应的目标像素区域以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。

在一些实施例中，所述车辆设置有第一自动驾驶权限；所述处理器还用于：在对所述机器学习模型进行训练之后，将所述车辆的自动驾驶权限设置为第二自动驾驶权限，所述第二自动驾驶权限高于所述第一自动驾驶权限。

在一些实施例中，所述处理器具体用于：将所述M张样本图像中每一样本图像在标定界面进行展示，并标识所述样本图像中的所述目标像素区域；检测用户针对所述交通元素的标定操作，基于所述标定操作获取真值标定结果；将所述真值标定结果作为所述描述真值。

在一些实施例中，所述处理器具体用于：在所述标定界面展示关联交通元素的预标定真值；若检测到用户对所述预标定真值的确认操作，将所述预标定真值确定为所述真值标定结果；和/或；在所述标定界面展示关联交通元素的预标定真值；若检测到用户对所述预标定真值的调整操作，获取调整后的标定结果；将调整后的标定结果确定为所述真值标定结果。

上述装置实施例中处理器实现的功能详见前述方法实施例，此处不再赘述。

图10示出了一种图像处理装置的硬件结构示意图，该装置可以包括：处理器1001、存储器1002、输入/输出接口1003、通信接口1004和总线1005。其中处理器1001、存储器1002、输入/输出接口1003和通信接口1004通过总线1005实现彼此之间在设备内部的通信连接。

处理器1001可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。处理器1001还可以包括显卡，所述显卡可以是Nvidia titan X显卡或者1080Ti显卡等。

存储器1002可以采用ROM(Read Only Memory，只读存储器)、RAM(Random Access Memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1002可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1002中，并由处理器1001来调用执行。

输入/输出接口1003用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口1004用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1005包括一通路，在设备的各个组件(例如处理器1001、存储器1002、输入/输出接口1003和通信接口1004)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器1001、存储器1002、输入/输出接口1003、通信接口1004以及总线1005，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。

如图11所示，本公开还提供一种图像处理系统，所述系统包括：

视觉传感器1101，部署在车辆上，用于在所述车辆行驶过程中对周围环境进行图像采集，得到N张样本图像；

处理器1102，用于在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数；

服务器1103，用于基于所述M张样本图像对所述车辆的机器学习模型的副本进行训练，并将训练后的机器学习模型部署到所述车辆上。

所述视觉传感器1101可以是单目视觉传感器、双目视觉传感器或者其他类型的视觉传感器。为了提高车辆的安全性，可以在车辆上部署多个视觉传感器1101，不同的视觉传感器1101位于车辆的不同方位。例如，可以在车辆的左、右后视镜上各部署一个视觉传感器1101，还可以在车辆的后侧部署一个或多个视觉传感器1101。所述处理器1102可以部署在车辆上，也可以部署在云端。处理器1102执行的功能详见前述方法实施例，此处不再赘述。所述服务器1103可以部署在云端，可以通过采用筛选出的M张样本图像以及样本图像对应的描述真值来训练车辆的机器学习模型的副本，并将训练后的机器学习模型部署到所述车辆上。

如图12所示，本公开还提供一种可移动平台，其特征在于，所述可移动平台包括：

视觉传感器1201，用于在所述可移动平台行驶过程中对周围环境进行图像采集，得到N张样本图像；

电子控制单元1202，用于基于所述可移动平台上部署的机器学习模型的输出结果，对所述可移动平台进行自动驾驶决策，所述机器学习模型用于基于从所述N张样本图像中确定的M张样本图像训练得到，所述M张样本图像基于本公开任一实施例所述的方法获取。

其中，所述可移动平台可以包括但不限于车辆、飞机、船只、可移动机器人等各种设备，在一些应用场景下，可移动平台为自动驾驶车辆、无人机、无人船等设备，可移动平台可以通过对周围环境进行感知和决策规划以实现自主移动，也可以在用户的操纵下移动。

所述视觉传感器1201可以是单目视觉传感器、双目视觉传感器或者其他类型的视觉传感器。可以在可移动平台上部署多个视觉传感器1101，不同的视觉传感器1101位于可移动平台的不同方位。电子控制单元1202可以部署在可移动平台上，用于对可移动平台的行驶进行决策规划，例如，对可移动平台进行路径规划、速度控制等。用于训练可移动平台的M张图像可以采用前述任一实施例中的方法获取，具体细节可参见前述方法实施例，此处不再赘述。

本说明书实施例还提供一种计算机可读存储介质，所述可读存储介质上存储有若干计算机指令，所述计算机指令被执行时实任一实施例所述方法的步骤。

以上实施例中的各种技术特征可以任意进行组合，只要特征之间的组合不存在冲突或矛盾，但是限于篇幅，未进行一一描述，因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。

本说明书实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体，可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于：相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

本领域技术人员在考虑说明书及实践这里公开的说明书后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

以上所述仅为本公开的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

Claims

一种图像处理方法，其特征在于，所述方法包括：

获取N张样本图像，所述样本图像为车辆在行驶过程中对周围环境采集的图像；

在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；

获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；

根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数，所述M张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求1所述的方法，其特征在于，所述在每一所述样本图像中确定目标像素区域，包括：

基于所述样本图像中各像素区域的特征确定目标像素区域。
根据权利要求2所述的方法，其特征在于，所述基于所述样本图像中各像素区域的特征确定目标像素区域，包括：

所述像素区域的特征包括所述像素区域的位置，所述目标像素区域为预设位置范围内的像素区域；

所述像素区域的特征包括所述像素区域的深度，所述目标像素区域为预设深度范围内的像素区域；

所述像素区域的特征包括所述像素区域的像素值，所述目标像素区域为包括预设像素值的像素点的像素区域；

所述像素区域的特征包括所述像素区域的语义，所述目标像素区域为预设语义类别的像素区域。
根据权利要求1所述的方法，其特征在于，所述在每一所述样本图像中确定目标像素区域，包括：

基于所述样本图像中包括的物体的特征确定目标像素区域。
根据权利要求4所述的方法，其特征在于，一个物体的特征包括所述物体的类别、移动速度、尺寸中的至少一者。
根据权利要求4所述的方法，其特征在于，所述样本图像包括视频中的多帧目标视频帧；所述基于所述样本图像中包括的物体的特征确定目标像素区域，包括：

从所述视频中的一帧参考视频帧中识别具有预设特征的目标物体；

对所述目标物体进行跟踪，以确定每帧目标视频帧中包括所述目标物体的像素区域；

将每帧目标视频帧中包括所述目标物体的像素区域确定为目标像素区域。
根据权利要求4所述的方法，其特征在于，所述基于所述样本图像中包括的物体的特征确定目标像素区域，包括：

从所述样本图像中识别具有预设特征的目标物体；

将所述样本图像中所述目标物体所在的像素区域以及与所述目标物体类别相同的其他物体所在的像素区域确定为目标像素区域。
根据权利要求6或7所述的方法，其特征在于，所述预设特征基于所述物体所在的像素区域的语义类别确定。
根据权利要求1所述的方法，其特征在于，所述样本图像由所述车辆上的视觉传感器采集得到；所述在每一所述样本图像中确定目标像素区域，包括：

基于所述视觉传感器的视角确定目标像素区域。
根据权利要求9所述的方法，其特征在于，所述目标像素区域为所述视觉传感器在预设视角范围内采集的图像。
根据权利要求1所述的方法，其特征在于，所述目标像素区域基于数据挖掘任务确定。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

对所述车辆的行驶状态进行检测；

获取检测到所述行驶状态异常的时刻之前和/或之后采集到的P张样本图像，P为正整数，所述M张样本图像和所述P张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取所述车辆的决策系统输出的决策结果，所述决策结果用于对所述车辆的行驶状态进行决策规划；

将输出错误的决策结果的时刻之前和/或之后采集到的Q张样本图像，Q为正整数，所述M张样本图像和所述Q张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求1所述的方法，其特征在于，所述根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，包括：

根据所述样本图像中所述目标像素区域的信息量，对所述样本图像进行评分，得到所述样本图像的评分值；

根据所述N张样本图像的评分值，在所述N张样本图像中选择M张样本图像。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

对所述M张样本图像进行人工筛选，得到K张样本图像，K为正整数，K小于或等于M，所述K张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

将所述M张样本图像输入真值标定系统，以获取所述M张样本图像中所述交通元素对应的描述真值；

基于所述M张样本图像以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。
根据权利要求16所述的方法，其特征在于，所述基于所述M张样本图像以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练，包括：

从所述M张样本图像中每一所述样本图像中截取所述目标像素区域；

基于所述M张样本图像对应的目标像素区域以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。
根据权利要求16所述的方法，其特征在于，所述车辆设置有第一自动驾驶权限；所述方法还包括：

在对所述机器学习模型进行训练之后，将所述车辆的自动驾驶权限设置为第二自动驾驶权限，所述第二自动驾驶权限高于所述第一自动驾驶权限。
根据权利要求16所述的方法，其特征在于，所述获取所述M张样本图像中所述交通元素对应的描述真值，包括：

将所述M张样本图像中每一样本图像在标定界面进行展示，并标识所述样本图像中的所述目标像素区域；

检测用户针对所述交通元素的标定操作，基于所述标定操作获取真值标定结果；

将所述真值标定结果作为所述描述真值。
根据权利要求19所述的方法，其特征在于，所述基于所述标定操作获取真值标定结果，包括：

在所述标定界面展示关联交通元素的预标定真值；

若检测到用户对所述预标定真值的确认操作，将所述预标定真值确定为所述真值标定结果；

和/或；

在所述标定界面展示关联交通元素的预标定真值；

若检测到用户对所述预标定真值的调整操作，获取调整后的标定结果；

将调整后的标定结果确定为所述真值标定结果。
一种图像处理装置，其特征在于，所述装置包括处理器，所述处理器用于执行以下步骤：

获取N张样本图像，所述样本图像为车辆在行驶过程中对周围环境采集的图像；

在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；

获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；

根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数，所述M张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求21所述的装置，其特征在于，所述处理器具体用于：

基于所述样本图像中各像素区域的特征确定目标像素区域。
根据权利要求22所述的装置，其特征在于，所述处理器具体用于：

所述像素区域的特征包括所述像素区域的位置，所述目标像素区域为预设位置范围内的像素区域；

所述像素区域的特征包括所述像素区域的深度，所述目标像素区域为预设深度范围内的像素区域；

所述像素区域的特征包括所述像素区域的像素值，所述目标像素区域为包括预设像素值的像素点的像素区域；

所述像素区域的特征包括所述像素区域的语义，所述目标像素区域为预设语义类别的像素区域。
根据权利要求21所述的装置，其特征在于，所述处理器具体用于：

基于所述样本图像中包括的物体的特征确定目标像素区域。
根据权利要求24所述的装置，其特征在于，一个物体的特征包括所述物体的类别、移动速度、尺寸中的至少一者。
根据权利要求24所述的装置，其特征在于，所述样本图像包括视频中的多帧目标视频帧；所述处理器具体用于：

从所述视频中的一帧参考视频帧中识别具有预设特征的目标物体；

对所述目标物体进行跟踪，以确定每帧目标视频帧中包括所述目标物体的像素区域；

将每帧目标视频帧中包括所述目标物体的像素区域确定为目标像素区域。
根据权利要求24所述的装置，其特征在于，所述处理器具体用于：

从所述样本图像中识别具有预设特征的目标物体；

将所述样本图像中所述目标物体所在的像素区域以及与所述目标物体类别相同的其他物体所在的像素区域确定为目标像素区域。
根据权利要求26或27所述的装置，其特征在于，所述预设特征基于所述物体所在的像素区域的语义类别确定。
根据权利要求21所述的装置，其特征在于，所述样本图像由所述车辆上的视觉传感器采集得到；所述处理器具体用于：

基于所述视觉传感器的视角确定目标像素区域。
根据权利要求29所述的装置，其特征在于，所述目标像素区域为所述视觉传感器在预设视角范围内采集的图像。
根据权利要求21所述的装置，其特征在于，所述目标像素区域基于数据挖掘任务确定。
根据权利要求21所述的装置，其特征在于，所述处理器还用于：

对所述车辆的行驶状态进行检测；

获取检测到所述行驶状态异常的时刻之前和/或之后采集到的P张样本图像，P为正整数，所述M张样本图像和所述P张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求21所述的装置，其特征在于，所述处理器还用于：

获取所述车辆的决策系统输出的决策结果，所述决策结果用于对所述车辆的行驶状态进行决策规划；

将输出错误的决策结果的时刻之前和/或之后采集到的Q张样本图像，Q为正整数，所述M张样本图像和所述Q张样本图像共同用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求21所述的装置，其特征在于，所述处理器具体用于：

根据所述样本图像中所述目标像素区域的信息量，对所述样本图像进行评分，得到所述样本图像的评分值；

根据所述N张样本图像的评分值，在所述N张样本图像中选择M张样本图像。
根据权利要求21所述的装置，其特征在于，所述处理器还用于：

对所述M张样本图像进行人工筛选，得到K张样本图像，K为正整数，K小于或等于M，所述K张样本图像用于训练与车辆的自动驾驶决策相关的机器学习模型。
根据权利要求21所述的装置，其特征在于，所述处理器还用于：

将所述M张样本图像输入真值标定系统，以获取所述M张样本图像中所述交通元素对应的描述真值；

基于所述M张样本图像以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。
根据权利要求36所述的装置，其特征在于，所述处理器具体用于：

从所述M张样本图像中每一所述样本图像中截取所述目标像素区域；

基于所述M张样本图像对应的目标像素区域以及所述M张样本图像中所述交通元素对应的描述真值，对所述机器学习模型进行训练。
根据权利要求36所述的装置，其特征在于，所述车辆设置有第一自动驾驶权限；所述处理器还用于：

在对所述机器学习模型进行训练之后，将所述车辆的自动驾驶权限设置为第二自动驾驶权限，所述第二自动驾驶权限高于所述第一自动驾驶权限。
根据权利要求36所述的装置，其特征在于，所述处理器具体用于：

将所述M张样本图像中每一样本图像在标定界面进行展示，并标识所述样本图像中的所述目标像素区域；

检测用户针对所述交通元素的标定操作，基于所述标定操作获取真值标定结果；

将所述真值标定结果作为所述描述真值。
根据权利要求39所述的装置，其特征在于，所述处理器具体用于：

在所述标定界面展示关联交通元素的预标定真值；

若检测到用户对所述预标定真值的确认操作，将所述预标定真值确定为所述真值标定结果；

和/或；

在所述标定界面展示关联交通元素的预标定真值；

若检测到用户对所述预标定真值的调整操作，获取调整后的标定结果；

将调整后的标定结果确定为所述真值标定结果。
一种图像处理系统，其特征在于，所述系统包括：

视觉传感器，部署在车辆上，用于在所述车辆行驶过程中对周围环境进行图像采集，得到N张样本图像；

处理器，用于在每一所述样本图像中确定目标像素区域，所述目标像素区域为所述周围环境中与所述车辆的自动驾驶决策相关联的交通元素的成像区域；获取所述N张样本图像中每一所述样本图像对应的所述目标像素区域的信息量；根据所述目标像素区域的信息量，在所述N张样本图像中选择M张样本图像，其中，M小于N，M和N均为正整数；

服务器，用于基于所述M张样本图像对所述车辆的机器学习模型的副本进行训练，并将训练后的机器学习模型部署到所述车辆上。
一种可移动平台，其特征在于，所述可移动平台包括：

视觉传感器，用于在所述可移动平台行驶过程中对周围环境进行图像采集，得到N张样本图像；

电子控制单元，用于基于所述可移动平台上部署的机器学习模型的输出结果，对所述可移动平台进行自动驾驶决策，所述机器学习模型用于基于从所述N张样本图像中确定的M张样本图像训练得到，所述M张样本图像基于权利要求1至20任意一项所述的方法获取。
一种计算机可读存储介质，其特征在于，其上存储有计算机指令，该指令被处理器执行时实现权利要求1至20任意一项所述的方法。