CN112598007A

CN112598007A - 图片训练集的筛选方法、装置、设备和可读存储介质

Info

Publication number: CN112598007A
Application number: CN202110239769.9A
Authority: CN
Inventors: 徐显杰; 李涛; 亚瑟·菲利波维奇
Original assignee: Zhejiang Suoto Ruian Technology Group Co Ltd
Current assignee: Zhejiang Suoto Ruian Technology Group Co Ltd
Priority date: 2021-03-04
Filing date: 2021-03-04
Publication date: 2021-04-02
Anticipated expiration: 2041-03-04
Also published as: CN112598007B

Abstract

本发明实施例公开了一种图片训练集的筛选方法、装置、设备和可读存储介质，涉及神经网络训练技术，方法包括：采用训练集训练目标检测网络和语义分割网络，所述训练集包括多张已标注图片；采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果，并确定每张未标注图片中各目标的位置分布、预测精度、面积分布和尺寸特征中的至少一项；从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，并将所述目标图片进行标注后添加到所述训练集。本实施例从未标注的多张图片中自动筛选出满足网络训练任务要求的训练集，无需人工筛选，且灵活性高。

Description

图片训练集的筛选方法、装置、设备和可读存储介质

技术领域

本发明实施例涉及神经网络训练技术，尤其涉及一种图片训练集的筛选方法、装置、设备和可读存储介质。

背景技术

训练集是用于拟合网络的数据样本。在通过神经网络预测图片中的人、车、物的属性信息时，需要大量不同环境、不同场景的图片构成训练集，才能保证神经网络的精度。

目前，在训练目标检测网络和语义分割网络时，需要人工浏览并筛选不同的图片，这存在很多明显的缺点：1）人工成本高、筛选效率低；2）需要浏览所有的图片进行筛选，导致筛选时间成本高；3）人工筛选的主观性强，难以形成统一的标准，导致训练集的可靠性差；4）如果筛选标准发生变化，已经筛选的训练集需要重新一一调整，灵活性差。

发明内容

本发明实施例提供一种图片训练集的筛选方法、装置、设备和可读存储介质，以从未标注的多张图片中自动筛选出满足网络训练任务要求的训练集，无需人工筛选，且灵活性高。

第一方面，本发明实施例提供了一种图片训练集的筛选方法，包括：

采用训练集训练目标检测网络和语义分割网络，所述训练集包括多张已标注图片；

采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果；

根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息；所述属性信息包括位置分布、预测精度、面积分布和尺寸特征中的至少一项；

从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，并将所述目标图片进行标注后添加到所述训练集。

第二方面，本发明实施例还提供了一种图片训练集的筛选装置，包括：

训练模块，用于采用训练集训练目标检测网络和语义分割网络，所述训练集包括多张已标注图片；

预测模块，用于采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果；

确定模块，用于根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息；所述属性信息包括位置分布、预测精度、面积分布和尺寸特征中的至少一项；

筛选模块，用于从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，并将所述目标图片进行标注后添加到所述训练集。

第三方面，本发明实施例还提供了一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现任一实施例所述的图片训练集的筛选方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现任一实施例所述的图片训练集的筛选方法。

本发明实施例中，通过采用训练集训练目标检测网络和语义分割网络，得到具有一定精度的目标检测网络和语义分割网络；通过采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，并根据得到的目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息，从而通过网络预测的方式得到各目标的属性信息，进而从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，从而自动筛选出满足网络训练所需要的训练集，无需人工筛选；而且，本实施例中的属性信息包括位置分布、预测精度、面积分布和尺寸特征中的至少一项，通过调整这些属性就可以筛选出不同特点的图片，提高图片筛选的灵活性。

附图说明

图1是本发明实施例提供的一种图片训练集的筛选方法的流程图；

图2是本发明实施例提供的另一种图片训练集的筛选方法的流程图；

图3是本发明实施例提供的一种图片训练集的筛选装置的结构示意图；

图4为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

图1是本发明实施例提供的一种图片训练集的筛选方法的流程图，本实施例适用于扩充图片训练集的情况。该方法可以由图片训练集的筛选装置来执行，该装置可以由软件和/或硬件构成，并一般集成在电子设备中。

如图1所示，图片训练集的筛选方法包括：

S110、采用训练集训练目标检测网络和语义分割网络，所述训练集包括多张已标注图片。

在初始时，目标检测网络和语义分割网络中的参数均为初始值。可以人工筛选出多张图片并标注其中各目标的检测框的位置信息、尺寸信息、各检测框的类别以及各像素的类别。其中，目标检测网络和语义分割网络基于卷积神经网络框架。

采用多张已标注图片训练目标检测网络，得到训练后的目标检测网络。采用多张已标注图片训练语义分割网络，得到训练后的语义分割网络。

在一些情况下，由于训练集中图片数量有限，损失函数无法收敛，无法得到精度较高的目标检测网络和语义分割网络，导致目标检测结果和语义分割结果精度不高。基于此，可以训练得到多个目标检测网络和多个语义分割网络，并从中选出精度较高的网络。具体的，采用训练集，基于不同迭代次数和/或训练参数分别训练目标检测网络和语义分割网络，得到多个目标检测网络和多个语义分割网络。

示例性的，采用不同的学习率、权值等训练参数，对目标检测网络循环迭代28000次、35000次和43000次，得到3个训练后的标检测网络及对应的权重参数；采用不同的学习率、权值等训练参数，对语义分割网络循环迭代28000次、35000次和43000次，得到3个训练后的语义分割网络及对应的权重参数。

需要说明的是，损失函数是为网络训练而构建的，以最小化损失函数为目标，不断迭代网络中的参数，得到训练后的网络。损失函数的表达式可参见现有技术，此处不再赘述。

S120、采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果。

本实施例不限定多张未标注图片的获取来源。在驾驶应用场景中，从车载摄像头获取拍摄的多张道路环境图片。

将多张未标注图片输入至训练后的目标检测网络得到目标检测结果，将多张未标注图片输入至训练后的语义分割网络得到语义分割结果。

具体的，目标检测结果包括但不限于各目标的检测框的位置信息（左上角坐标）、尺寸信息（长和宽）、宽高比、各检测框的类别和置信度。语义分割结果包括但不限于各像素的类别和置信度。示例性的，在驾驶应用场景中，目标可以是行人、车辆、树木和建筑物等。

接着上述情况，当存在多个训练后的目标检测网络和多个训练后的语义分割网络时，每个训练后的网络均要对多张未标注的图片进行预测，得到对应每个网络的结果。

S130、根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息；所述属性信息包括位置分布、预测精度、面积分布和尺寸特征中的至少一项。

当存在多个训练后的目标检测网络和多个训练后的语义分割网络时，会对应存在多个目标检测结果和多个语义分割结果，可从中选择精度较高的一组目标检测结果和语义分割结果。具体的，从所述多个目标检测网络中筛选各目标的平均置信度最高的目标检测网络；从所述多个语义分割网络中筛选各目标的平均置信度最高的语义分割网络；根据筛选出的目标检测网络输出的目标检测结果，以及筛选出的语义分割网络输出的语义分割结果，确定每张未标注图片中各目标的属性信息。

各目标的位置分布指的是各目标在图片上的分布情况，预测精度指的是同一目标的位置预测精度，面积分布指的是各目标在图片上所占面积的分布情况，尺寸特征指的是各目标的检测框的尺寸特征，例如宽高比、宽度范围和高度范围。

本实施例根据目标检测结果和语义分割结果综合得到各目标的属性信息，充分利用目标检测网络和语义分割网络的预测结果，能够限制提高属性信息的准确度。

S140、从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，并将所述目标图片进行标注后添加到所述训练集。

本实施例中，相关人员可以根据网络训练任务需要确定属性信息所要满足的要求，本实施例不对具体要求做限定。示例性的，目标检测网络和语义分割网络的网络训练任务为训练“显示车辆的图片”，从中检测车辆的属性信息。考虑到车辆具有一定的宽高比，可以筛选各目标的宽高比在设定范围内的目标图片，从而筛选出显示车辆的图片。

为了方便描述和区分，将筛选出的图片称为目标图片，并将目标图片进行标注后添加到S110处的训练集。示例性的，S110处的训练集包括1000张已标注的图片，筛选出300张目标图片，则将300张目标图片进行标注后添加到训练集中，得到1300张图片。

可选的，由于训练后的目标检测网络和语义分割网络精度有限，输出的目标检测结果和语义分割结果准确性不高。基于此，通过人工在目标检测结果和语义分割结果的基础上，对检测框的位置、尺寸、类别、各像素的类别进行修正，将这些已标注的图片添加到训练集中。

在上述实施例和下述实施例中，在所述将所述目标图片进行标注后添加到所述训练集之后，还包括：返回执行所述目标检测网络和语义分割网络的训练操作，直到目标检测网络和语义分割网络的预测精度达到设定精度阈值。

可选的，在所述采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果之前，还包括：对所述多张未标注图片进行去重处理。也就是说，在相似的图片中保留一张图片即可，减少通过网络进行预测的图片数量，提高筛选效率；同时提高训练集的质量。

图2是本发明实施例提供的另一种图片训练集的筛选方法的流程图，结合上述各实施例，如图2所示，本实施例提供的方法包括：

S210、开始。

S220、判断目标检测网络和语义分割网络的预测精度是否达到设定精度阈值，如果达到，跳转到S230；如果未达到，跳转到S240。

两个网络的预测精度可以采用两个网络最后一次得到的每张未标注图片中各目标的平均预测精度来表示。示例性的，设定精度阈值为90%，当每张未标注图片中各目标的平均预测精度达到90%时，说明当前训练集能够训练得到精度较高的目标检测网络和语义分割网络。此时得到的训练集达到了网络训练要求。

S230、输出当前的训练集。结束本次操作。

S240、采用训练集训练目标检测网络和语义分割网络，所述训练集包括多张已标注图片。

在初次训练时，目标检测网络和语义分割网络中的参数均为初始值。在再次训练时，目标检测网络和语义分割网络中的参数为前一次训练结束后的参数。

在训练集扩充后，采用扩充后的训练集训练当前的目标检测网络和语义分割网络，使网络精度进一步提高。

S250、对多张未标注图片进行去重处理。

可选的，多张未标注的图片为车辆上的摄像头实时拍摄的图片。

具体的，对每张图片使用感知哈希算法计算获取图片特征值，根据图片的特征值进行相似度比较，去除相似的图片。当剩余图片大于等于设定数量（如5000）后，停止去重处理。在去重处理之后，才会将剩余的图片输入至训练后的目标检测网络和语义分割网络。

S260、采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果。

S270、根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息；所述属性信息包括位置分布、预测精度、面积分布和尺寸特征中的至少一项。

S280、从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，并将所述目标图片进行标注后添加到所述训练集。返回执行S220。

当有未标注的图片生成时，可以输入至当前训练好的目标检测网络和语义分割网络，得到目标检测结果和语义分割结果，进而从中筛选出目标图片，继续扩充训练集。如此循环，直到网络最后一次得到的每张未标注图片中各目标的平均预测精度达到设定精度阈值。本实施例通过循环方案，使得训练集不断扩充，快速得到符合网络训练要求的训练集。

在上述实施例和下述实施例中，目标检测结果包括各目标的位置信息和尺寸信息，所述语义分割结果包括各目标覆盖的像素数量。根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息，包括以下至少一种操作：

1）根据每张未标注图片中各目标的位置信息，计算各目标的位置分布。其中，各目标的位置信息为各目标所在检测框的左上角坐标。可选的，将每张未标注图片中划分出一块区域，将各目标是否在这块区域内作为各目标的位置分布。

2）根据每张未标注图片中各目标的尺寸信息和各目标覆盖的像素数量，计算各目标的预测精度。其中，各目标的尺寸信息包括各目标所在检测框的宽度和高度。可选的，根据各目标所在检测框的宽度和高度计算各目标所在检测框的面积。将各目标覆盖的像素数量乘以像素面积，得到各目标覆盖的面积。计算各目标所在检测框的面积和覆盖面积的交并比（又称交叠率），作为预测精度。显然交并比越高，说明目标检测网络和语义分割网络的预测的目标位置越一致，预测精度就越高。

3）根据每张未标注图片中各目标的尺寸信息和各目标覆盖的像素数量计算各目标的面积，并根据各目标的面积计算各目标的面积分布。具体的，首先根据各目标的宽度和高度计算目标的第一面积，同时将各目标覆盖的像素数量乘以像素面积，得到对应目标的第二面积，将同一目标的第一面积和第二面积平均得到该目标最终的面积。确定各目标的面积是否符合均匀分布。

4）根据每张未标注图片中各目标的尺寸信息，计算各目标的尺寸特征。其中，尺寸特征为能够体现本类目标不同于其他类别目标的特征，例如，尺寸特征为宽高比，车辆的宽高比与行人的宽高比显然是不同的，可以根据尺寸特征区分不同类别的目标。可选的，各目标所在检测框的宽度除以高度得到宽高比，作为各目标的尺寸特征；如果目标检测结果中包括宽高比，可以直接使用。

本实施例提供了位置分布、预测精度、面积分布和尺寸特征的具体确定方法，充分利用目标检测结果和语义分割结果，保证一定的准确性。

在上述实施例和下述实施例中，从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，包括以下15种操作中的任一种操作：

1）如果未标注图片中各目标的位置分布集中在设定图片区域，将所述未标注图片筛选为目标图片。

其中，所述设定图片区域为车辆盲区映射在未标注图片上的区域。车辆盲区为驾驶员视角下，通过玻璃或后视镜不能看到的区域。在驾驶应用场景中，摄像头设置在车身后右侧，朝向车前，从而拍摄得到车身右侧的行驶环境图片，则设定图片区域为车身右侧盲区映射在未标注图片上的区域。

可选的，各目标的位置分布包括各目标是否在设定图片区域内。目标是否在设定图片区域内可以根据目标所处的检测框是否位于图片区域内而确定。如果检测框仅有部分位于设定图片区域内，也可以认为其内目标位于设定图片区域内。如果大部分或全部目标在设定图片区域内，可认为各目标的位置分布集中在设定图片区域。

本实施例可以筛选出集中分布在设定图片区域的目标图片，从而使得训练集更加关注在设定图片区域内的目标。通过将设定图片区域限定为盲区，可以重点关注车辆盲区内的目标，提高盲区内目标的检测精度和语义分割精度，有利于提高驾驶安全性。

2）如果未标注图片中各目标的平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片。

可选的，如果各目标的检测精度为各目标所在检测框的面积和覆盖面积的交并比，设定精度阈值例如为85%，如果各目标的交并比的平均值未达到设定精度阈值，说明网络对该图片的检测/分割能力有待提高，则将该未标注图片筛选为目标图片，有利于提高网络的预测精度，从而得到能够训练出高精度网络的训练集。

3）如果未标注图片中各目标的面积分布满足均匀要求，将所述未标注图片筛选为目标图片。

如果各目标的面积符合均匀分布，则面积分布满足均匀要求，说明图片中存在大小不一的多个目标。例如不同身高的人、不同尺寸的车辆均会呈现大小不一的样子。通过将此类目标图片进行标注后添加到训练集，使得训练集更加关注大小不一的目标。

4）如果未标注图片中全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

如果两个目标所在检测框的宽度、高度或宽高比在设定范围内，说明这两个目标的类型相同。例如，不同品牌的轿车的宽高比在设定范围内，而卡车确不在此范围内。利用这个特点，如果一未标注图片中全部或大部分目标的尺寸特征在设定范围内，说明全部或大部分目标的类型相同，进而将此图片筛选为目标图片，使得训练集更加关注相同类型的目标。

需要说明的是，虽然目标检测网络和语义分割网络也会输出检测框和各像素的类别，但此类别一般为大类，如车辆，难易细分为车辆中的卡车和轿车；而且类别的置信度普遍不高，本实施例通过尺寸特征成功将某一细分类型的目标识别出来。

5）如果未标注图片中各目标的位置分布集中在设定图片区域，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对设定图片区域内的目标的检测/分割精度较高。

6）如果未标注图片中各目标的面积分布满足均匀要求，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对大小不一的目标的检测/分割精度较高。

7）如果未标注图片中全部目标或大部分目标的尺寸特征在设定范围内，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对某一类型的目标的检测/分割精度较高。

8）如果未标注图片中各目标的位置分布集中在设定图片区域，且面积分布满足均匀要求，将所述未标注图片筛选为目标图片。

本实施例中的训练集更加关注在设定图片区域内且大小不一的目标，例如在车辆盲区内出现的车辆和行人。

9）如果未标注图片中各目标的位置分布集中在设定图片区域，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

本实施例中的训练集更加关注在设定图片区域内且同类型的目标，例如在车辆盲区内出现的多个行人。

10）如果未标注图片中各目标的面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

本实施例中的训练集更加关注同类型且大小不一的目标，例如成年人、老人和小孩；又例如大型客车和小型客车。

11）如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对在设定图片区域内且同类型的目标的检测/分割精度较高。

12）如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，且面积分布满足均匀要求，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对在设定图片区域内且大小不一的目标的检测/分割精度较高。

13）如果未标注图片中各目标的位置分布集中在设定图片区域，面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

本实施例中的训练集更加关注在设定图片区域内、同类型且大小不一的目标，例如车辆盲区内出现的成年人、老人和小孩。

14）如果未标注图片中各目标的平均预测精度未达到设定精度阈值，面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对同类型且大小不一的目标的检测/分割精度较高。

15）如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，面积分布满足均匀要求且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片。

本实施例中的训练集能够训练出高精度的目标检测网络和语义分割网络，尤其是对在设定图片区域内、同类型且大小不一的目标的检测/分割精度较高。

在上述实施例和下述实施例中，从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，包括：

第一步：根据每张未标注图片中各目标与设定图片区域的远近程度，确定各目标的位置分布特征值。

具体的，计算目标所处检测框位置与设定图片区域中心的距离，距离越大，位置分布特征值越小。示例性的，盲区为距离车身0-0.8米的范围，则如果目标距离车身0-0.8米，位置分布特征值为1；如果目标距离车身0.8-1.5米，位置分布特征值为0.8；如果目标距离车身1.5-4米，位置分布特征值为0.5；如果目标距离车身大于4米，位置分布特征值为0。

第二步：根据每张未标注图片中各目标的预测精度的高低，确定各目标的预测精度特征值。

可选的，各目标的预测精度越高，相应的预测精度特征值越低。

示例性的，如果一目标的交并比在0.8-1区间，则预测精度特征值为0.4；交并比在0.5-0.8区间，预测精度特征值为0.7；交并比在0.3-0.5区间，预测精度特征值为1；交并比在其它区间，预测精度特征值为0。

第三步：根据每张未标注图片中各目标的面积分布的均匀程度，确定各目标的面积分布特征值。

可选的，各目标的面积分布越均匀，相应的面积分布特征值越高。示例性的，计算各目标的面积的均匀度，均匀度越大，则全部目标的面积分布特征值越大。

第四步：根据每张未标注图片中各目标的尺寸特征是否在设定范围内，确定各目标的尺寸特征值。

可选的，尺寸特征（如宽高比）在设定范围内的目标的尺寸特征值，大于尺寸特征在设定范围外的目标。示例性的，如果一目标的尺寸特征在设定范围内，确定该目标的尺寸特征值为1；如果一目标的尺寸特征不在设定范围内，确定该目标的尺寸特征值为0。

第五步：对所述每张未标注图片中各目标的位置分布特征值、预测精度特征值、面积分布特征值和尺寸特征值进行融合，得到每张未标注图片中各目标的得分。

可选的，融合方式包括但不限于相加、相乘和加权和。为了提高图片筛选的灵活性，满足多样性的网络训练任务要求，可以为位置分布特征值、预测精度特征值、面积分布特征值和尺寸特征值分配不同的权重，例如依次为0.3、0.4、0.1、0.2，从而筛选出侧重不同关注点的图片。对于每张未标注图片中的每个目标，计算位置分布特征值、预测精度特征值、面积分布特征值和尺寸特征值的加权和，作为对应目标的得分。

第六步：统计每张未标注图片中所有目标的得分，并将得分满足要求的图片筛选为目标图片。

对于一张未标注图片来说，计算所有目标的得分之和，将得到之和归一化到[0,1]，得到最终的得分。如果该得分超过分数阈值，如0.6，将该图片筛选为目标图片。

值得说明的是，第一步至第四步的执行顺序不限，可以先后执行也可以并行执行。

本实施例提供了具体的筛选方法，即通过计算多个特征值，并进行融合和评分，得到可以量化的结果，便于实际筛选操作，为筛选结果提供了足够的数据支撑。

图3是本发明实施例提供的一种图片训练集的筛选装置的结构示意图，适用于扩充图片训练集的情况，该装置具体包括：训练模块310、预测模块320、确定模块330和筛选模块340。

训练模块310，用于采用训练集训练目标检测网络和语义分割网络，所述训练集包括多张已标注图片；

预测模块320，用于采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果；

确定模块330，用于根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息；所述属性信息包括位置分布、预测精度、面积分布和尺寸特征中的至少一项；

筛选模块340，用于从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，并将所述目标图片进行标注后添加到所述训练集。

可选的，该装置还包括返回模块，用于在所述将所述目标图片进行标注后添加到所述训练集之后，返回执行所述目标检测网络和语义分割网络的训练操作，直到目标检测网络和语义分割网络的预测精度达到设定精度阈值。

可选的，目标检测结果包括各目标的位置信息和尺寸信息，所述语义分割结果包括各目标覆盖的像素数量；相应的，确定模块330具体用于执行以下至少一种操作：根据每张未标注图片中各目标的位置信息，计算各目标的位置分布；根据每张未标注图片中各目标的尺寸信息和各目标覆盖的像素数量，计算各目标的预测精度；根据每张未标注图片中各目标的尺寸信息和各目标覆盖的像素数量计算各目标的面积，并根据各目标的面积计算各目标的面积分布；根据每张未标注图片中各目标的尺寸信息，计算各目标的尺寸特征。

可选的，筛选模块340在从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片时，具体用于执行以下任一种操作：如果未标注图片中各目标的位置分布集中在设定图片区域，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的面积分布满足均匀要求，将所述未标注图片筛选为目标图片；如果未标注图片中全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的面积分布满足均匀要求，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；如果未标注图片中全部目标或大部分目标的尺寸特征在设定范围内，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，且面积分布满足均匀要求，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，且面积分布满足均匀要求，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的平均预测精度未达到设定精度阈值，面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，面积分布满足均匀要求且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；其中，所述设定图片区域为车辆盲区映射在未标注图片上的区域。

可选的，筛选模块340在从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片时，具体用于：根据每张未标注图片中各目标与设定图片区域的远近程度，确定各目标的位置分布特征值；根据每张未标注图片中各目标的预测精度的高低，确定各目标的预测精度特征值；根据每张未标注图片中各目标的面积分布的均匀程度，确定各目标的面积分布特征值；根据每张未标注图片中全部目标或大部分目标的尺寸特征是否在设定范围内，确定各目标的尺寸特征值；对所述每张未标注图片中各目标的位置分布特征值、预测精度特征值、面积分布特征值和尺寸特征值进行融合，得到每张未标注图片中各目标的得分；统计每张未标注图片中所有目标的得分，并将得分满足要求的图片筛选为目标图片。

可选的，该装置还包括去重模块用于在所述采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果之前，对所述多张未标注图片进行去重处理。

可选的，训练模块310具体用于采用训练集，基于不同迭代次数和/或训练参数，分别训练目标检测网络和语义分割网络，得到多个目标检测网络和多个语义分割网络；相应的，确定模块330具体用于从所述多个目标检测网络中筛选各目标的平均置信度最高的目标检测网络；从所述多个语义分割网络中筛选各目标的平均置信度最高的语义分割网络；根据筛选出的目标检测网络输出的目标检测结果，以及筛选出的语义分割网络输出的语义分割结果，确定每张未标注图片中各目标的属性信息。

本申请实施例所提供的图片训练集的筛选装置可执行本申请任意实施例所提供的图片训练集的筛选方法，具备执行方法相应的功能模块和有益效果。

图4为本发明实施例提供的一种电子设备的结构示意图，如图4所示，该电子设备包括处理器40、存储器41、输入装置42和输出装置43；电子设备中处理器40的数量可以是一个或多个，图4中以一个处理器40为例；电子设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接，图4中以通过总线连接为例。

存储器41作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的图片训练集的筛选方法对应的程序指令/模块（例如，图片训练集的筛选装置中的训练模块310、预测模块320、确定模块330和筛选模块340）。处理器40通过运行存储在存储器41中的软件程序、指令以及模块，从而执行电子设备的各种功能应用以及数据处理，即实现上述的图片训练集的筛选方法。

存储器41可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储器41可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器41可进一步包括相对于处理器40远程设置的存储器，这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置42可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示电子设备。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现任一实施例的图片训练集的筛选方法。

本申请实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器（RAM）、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或电子设备上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算机，或者，可以连接到外部计算机（例如利用因特网服务提供商来通过因特网连接）。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

1.一种图片训练集的筛选方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述将所述目标图片进行标注后添加到所述训练集之后，还包括：

返回执行所述目标检测网络和语义分割网络的训练操作，直到目标检测网络和语义分割网络的预测精度达到设定精度阈值。

3.根据权利要求1所述的方法，其特征在于，所述目标检测结果包括各目标的位置信息和尺寸信息，所述语义分割结果包括各目标覆盖的像素数量；

所述根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息，包括以下至少一种操作：

根据每张未标注图片中各目标的位置信息，计算各目标的位置分布；

根据每张未标注图片中各目标的尺寸信息和各目标覆盖的像素数量，计算各目标的预测精度；

根据每张未标注图片中各目标的尺寸信息和各目标覆盖的像素数量计算各目标的面积，并根据各目标的面积计算各目标的面积分布；

根据每张未标注图片中各目标的尺寸信息，计算各目标的尺寸特征。

4.根据权利要求1所述的方法，其特征在于，所述从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，包括以下任一种操作：

如果未标注图片中各目标的位置分布集中在设定图片区域，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的面积分布满足均匀要求，将所述未标注图片筛选为目标图片；

如果未标注图片中全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的面积分布满足均匀要求，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；

如果未标注图片中全部目标或大部分目标的尺寸特征在设定范围内，且平均预测精度未达到设定精度阈值，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，且面积分布满足均匀要求，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，且面积分布满足均匀要求，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的平均预测精度未达到设定精度阈值，面积分布满足均匀要求，且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

如果未标注图片中各目标的位置分布集中在设定图片区域，平均预测精度未达到设定精度阈值，面积分布满足均匀要求且全部目标或大部分目标的尺寸特征在设定范围内，将所述未标注图片筛选为目标图片；

其中，所述设定图片区域为车辆盲区映射在未标注图片上的区域。

5.根据权利要求1所述的方法，其特征在于，所述从所述多张未标注图片中筛选所述各目标的属性信息满足网络训练任务要求的目标图片，包括：

根据每张未标注图片中各目标与设定图片区域的远近程度，确定各目标的位置分布特征值；

根据每张未标注图片中各目标的预测精度的高低，确定各目标的预测精度特征值；

根据每张未标注图片中各目标的面积分布的均匀程度，确定各目标的面积分布特征值；

根据每张未标注图片中全部目标或大部分目标的尺寸特征是否在设定范围内，确定各目标的尺寸特征值；

对所述每张未标注图片中各目标的位置分布特征值、预测精度特征值、面积分布特征值和尺寸特征值进行融合，得到每张未标注图片中各目标的得分；

统计每张未标注图片中所有目标的得分，并将得分满足要求的图片筛选为目标图片。

6.根据权利要求1-5任一项所述的方法，其特征在于，在所述采用训练后的目标检测网络和语义分割网络对多张未标注图片进行预测，得到目标检测结果和语义分割结果之前，还包括：

对所述多张未标注图片进行去重处理。

7.根据权利要求1-5任一项所述的方法，其特征在于，所述采用训练集训练目标检测网络和语义分割网络，包括：

采用训练集，基于不同迭代次数和/或训练参数，分别训练目标检测网络和语义分割网络，得到多个目标检测网络和多个语义分割网络；

所述根据目标检测结果和语义分割结果，确定每张未标注图片中各目标的属性信息，包括：

从所述多个目标检测网络中筛选各目标的平均置信度最高的目标检测网络；

从所述多个语义分割网络中筛选各目标的平均置信度最高的语义分割网络；

根据筛选出的目标检测网络输出的目标检测结果，以及筛选出的语义分割网络输出的语义分割结果，确定每张未标注图片中各目标的属性信息。

8.一种图片训练集的筛选装置，其特征在于，包括：

9.一种电子设备，其特征在于，

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的图片训练集的筛选方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的图片训练集的筛选方法。