CN118279688A

CN118279688A - 数据集构建方法、模型、服务器以及计算机可读存储介质

Info

Publication number: CN118279688A
Application number: CN202211730875.8A
Authority: CN
Inventors: 李敬阳; 戴雪瑞; 李智; 周浩
Original assignee: Beijing Wanji Technology Co Ltd
Current assignee: Beijing Wanji Technology Co Ltd
Priority date: 2022-12-30
Filing date: 2022-12-30
Publication date: 2024-07-02

Abstract

本申请适用于计算机视觉技术领域，提供了数据集构建方法、模型、服务器以及计算机可读存储介质，包括获取初始数据集，其中初始数据集包含多个样本，样本被标注目标信息；对初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息；远端数据为对大于预设距离的区域进行检测得到的数据，远端目标为检测区域中大于预设距离的区域中的目标，基于补充标注的信息生成数据集。本申请提供的数据集构建方法，通过补充远端车辆的标注信息，解决了训练检测模型的数据集中缺少距离远车辆信息的问题。

Description

数据集构建方法、模型、服务器以及计算机可读存储介质

技术领域

本申请属于视觉计算机技术领域，尤其涉及数据集构建方法、模型、服务器以及计算机可读存储介质。

背景技术

在智慧道路交通领域，基于激光雷达点云的3D目标检测模型可以精准地定位车辆位置和检测车辆尺寸。

目前，3D车辆检测模型是利用车辆点云数据集对检测模型进行训练获得的。车辆点云数据集中包含了激光雷达探测的不同距离车辆的点云数据，还包含了车辆的标注数据。然而，在激光雷达采集车辆点云数据集的过程中，当车辆与激光雷达之间的距离较远时，受信号干扰以及信号被遮挡等原因，激光雷达的接收器采集的点云数据较少，导致车辆点云数据集中缺少距离较远车辆的点云数据。

发明内容

本申请实施例提供了数据集构建方法、模型、服务器以及计算机可读存储介质，解决了训练检测模型的数据集中缺少距离远车辆信息的问题。

第一方面，本申请实施例提供了一种数据集构建方法，所述方法包括：

获取初始数据集；所述初始数据集包含多个样本，所述样本被标注目标信息；

对所述初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息；所述远端数据为对大于预设距离的区域进行检测得到的数据，所述远端目标为检测区域中大于预设距离的区域中的目标；

基于补充标注的信息生成数据集。

在第一方面的一种可能的实现方式中，所述目标为车辆，所述远端数据为大于预设距离的区域进行检测得到的数据；所述远端目标为检测区域中大于所述预设距离的区域中的目标。

在第一方面的一种可能的实现方式中，所述对所述初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息，包括：

将所述初始数据集中位于预设区域的目标作为远端目标，所述预设区域为大于或者等于预设距离的区域；

分别根据每个所述远端目标的车型信息以及所述位置信息，对所述远端目标进行标注；

根据所述初始数据集获得每个所述远端目标的点云；

根据每个所述远端目标的点云数量设置所述远端目标的标注信息标志位；

将所述点云数量小于第一数量的远端目标的标注信息标志位设置为1。

在第一方面的一种可能的实现方式中，所述基于补充标注的信息生成数据集，包括：

将所述补充标注的信息以及所述初始数据集进行拼接，获得第一数据集；

对所述第一数据集进行数据清洗，获得数据集。

在第一方面的一种可能的实现方式中，所述对所述第一数据集进行数据清洗，获得数据集，包括：

将所述第一数据集对应的第一点云文件中包含的异常帧进行过滤，获得第二点云文件；

根据所述第二点云文件生成二维俯视图；

根据所述补充标注的信息中包含所有远端目标的点云生成至少一个三视图；

根据所述二维俯视图以及所述至少一个三视图确定异常远端目标，并将所述第一数据集中删除所述异常远端目标对应的信息，获得数据集。

获取所述初始数据集中每个所述目标对应的点云，获得第一点云集；

获取所述补充标注的信息中每个所述远端目标对应的点云；

针对每个所述远端目标对应的点云，将所述远端目标对应的点云加入所述第一点云集中，获得第二点云集；

若所述第二点云集中的每个点云对应的区域均不重合，则根据所述第二点云集包含的所有目标的标注信息生成数据集；

若所述远端目标对应的点云与所述第一点云集中包含的目标的点云存在重合区域，则对所述远端目标的位置进行偏移，若偏移后的所述远端目标对应的点云与所述第一点云集中包含所有目标的点云均不存在重合区域，则根据偏移后的所述远端目标的标注信息以及所述第一点云集包含的所有目标的标注信息生成数据集。

第二方面，本申请实施例提供了一种目标检测方法，所述方法包括：

获取预设范围的检测数据，所述检测数据的范围大于预设距离；

将所述检测数据输入目标检测模型，得到目标检测结果，所述目标检测模型基于如第一方面的任意一项所述的数据集进行训练得到的。

第三方面，本申请实施例提供了一种目标检测模型，所述模型包括：

获取初始模型，所述初始模型基于目标检测任务构建；

利用第一方面的任一项所述的数据集训练所述初始模型，获得目标检测模型。

第四方面，本申请实施例提供了一种服务器，包含存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面的任一项所述的数据集构建方法。

第五方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时实现如第一方面的任一项所述的数据集构建方法。

可以理解的是，上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

本申请实施例与现有技术相比存在的有益效果是：通过对初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息，获得包含远端车辆的数据集。本申请提供的数据集构建方法，通过补充远端车辆的标注信息，解决了训练检测模型的数据集中缺少距离远车辆信息的问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的数据集构建方法的流程示意图一；

图2是本申请实施例提供的数据集构建方法的流程示意图二；

图3是本申请实施例提供的数据集构建方法的流程示意图三；

图4是本申请实施例提供的目标检测方法的流程示意图；

图5是本申请实施例提供的数据集构建装置的结构框图；

图6是本申请实施例提供的服务器的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。

图1是本申请实施例提供的数据集构建方法的流程示意图一。作为示例而非限定，本申请实施例提供的执行主体为对目标检测模型训练的服务器，本申请实施例提供此处不做特别限制。

S101：获取初始数据集；初始数据集包含多个样本，样本被标注目标信息。

在本申请实施例中，在获得激光雷达探测的车辆点云之后，将探测的点云数据作为训练车辆检测模型的初始数据集。进一步的，将初始数据集中与激光雷达之间的距离小于预设距离的车辆作为目标，对目标进行标注，获得近距离车辆的目标信息。具体的，对近距离车辆的车型信息以及车辆定位信息进行标注。

需要说明的是，初始数据集中已标注的样本与激光雷达之间的距离较近，即初始数据集中不包含与激光雷达距离较远车辆的标注信息。

S102：对初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息；远端数据为对大于预设距离的区域进行检测得到的数据，远端目标为检测区域中大于预设距离的区域中的目标。

示例性的，在利用激光雷达进行车辆检测场景中，设定待探测的目标为车辆。应理解，为了补充初始数据集中缺少的远端目标的标注信息，对初始数据集中的样本进行远端数据的补充标注，实现了补充初始数据集中缺少的远端车辆的标注信息的目的。其中，远端数据为大于预设距离的区域进行检测得到的数据；远端目标为检测区域中大于预设距离的区域中的目标。

需要说明的是，在车辆检测场景中，远端数据为对大于预设距离的区域进行探测采集的点云，远端目标即为检测区域中大于预设距离的区域中的车辆。

示例性的，对初始数据集中的样本进行远端数据的补充标注的过程为：将从初始数据集包含的点云数据中，选取大于预设距离的区域的点云对应的车辆作为远端目标，分别确定每个远端目标的车型信息以及位置信息，对远端目标进行标注，并根据初始数据集获得每个远端目标的点云。其中，预设区域为大于或者等于预设距离的区域。具体的，在车辆检测场景中，预设距离为70米。应理解，将初始数据集中与激光雷达之间的距离大于70米的车辆作为待补充标注的远端车辆，在通过对远端车辆进行标注即补充车辆的车型信息以及定位信息之后，完成了远端数据的补充标注过程。

示例性的，根据初始数据集获得每个远端目标的点云；根据每个远端目标的点云数量设置远端目标的标注信息标志位；将点云数量小于第一数量的远端目标的标注信息标志位设置为1。具体的，在对远端数据的补充标注完成之后，从初始数据集中选出远端车辆的点云数据，通过根据每个远端车辆的点云数据的数量设置远端车辆的标注信息标志位，并将点云数量小于第一数量的远端目标的标注信息标志位设置为1。在通过远端目标的标注信息标志位对补充标注的远端数据进行筛选，滤除点云数量过少的远端目标，以提高数据集的处理效率。

S103：基于补充标注的信息生成数据集。

在本申请实施例中，在完成了对远端数据的补充标注之后，根据补充的远端车辆的标注信息以及原有的初始数据集的标注数据获得新的数据集。具体的，在初始数据集中添加补充标注的信息中包含的远端车辆的类型和位置信息。

本申请实施例提供提供的数据集构建方法，通过测量的点云中距离较远的目标车辆进行标注，补充了初始数据集中缺少的大于预设距离区域内车辆的标注信息，解决了激光雷达采集的数据集中缺少距离远车辆信息的问题。

图2是本申请实施例提供的数据集构建方法的流程示意图二。在图1实施例提供的数据集构建方法的基础上，如图2所示，在S103中生成数据集的另一种过程具体如下：

S201：将补充标注的信息以及初始数据集进行拼接，获得第一数据集。

在本申请实施例中，在完成了补充了远端车辆的标注信息之后，将补充的远端车辆的标注信息以及初始数据集中已有的车辆的标注信息进行合并，获得第一数据集。具体的，在初始数据集中添加补充标注的信息中包含的远端车辆的类型和位置信息，使得初始数据集中添加的远端目标的类型和位置信息与初始数据集中远端目标的点云数据相对应。

S202：对第一数据集进行数据清洗，获得数据集。

在本申请实施例中，为了提高标注数据的准确性，在获得了第一数据集之后，对第一数据集进行数据清洗，避免进行补充的远端车辆的标注信息存在较大的误差。

示例性的，将第一数据集对应的第一点云文件中包含的异常帧进行过滤，获得第二点云文件。具体的，在本申请实施例中，点云文件为利用激光雷达在对车辆进行探测的过程中生成的点云数据pcd文件，通过对pcd文件中包含的点云进行筛选，删除文件中数据异常的点云数据帧。具体的，数据异常包含点云数据的数量异常或者点云数据的位置异常。在保证滤除后获得的第二点云文件中点云数据对应的目标与第一数据集中已标注的目标一一对应的前提下，将点云数据中明显不属于车辆点云的异常点云进行滤除。

在本申请实施例中，在获得了第二点云文件之后，根据第二点云文件生成二维俯视图，根据第一数据集中包含所有目标的点云生成至少一个三视图。具体的，根据第二点云文件生成点云数据对应的二维俯视图，同时根据第一数据集中包含的所有目标的点云生成包含每个目标车辆的三视图。示例性的，根据二维俯视图以及至少一个目标的三视图，筛选出异常远端目标，从第一数据集中删除异常远端目标的标注信息。具体的，根据现有激光雷达探测的车辆点云的三维图像对至少一个目标的三视图进行识别，并结合远端目标在二维俯视图的位置选出不符合车辆三维形状的异常点云，将该远端目标作为异常远端目标。通过从第一数据集中删除异常远端目标的标注信息，获得处理后的数据集，提高了数据集中补充的远端车辆标注信息的准确性。

本申请实施例提供提供的数据集构建方法，通过对包含补充标注的信息的数据集进行清洗，筛选出异常帧以及不属于车辆外形的远端目标对应的点云数据，使得补充标注的远端目标的点云更接近实际的车辆探测点云，提高了补充的标注数据的准确性。

图3是本申请实施例提供的数据集构建方法的流程示意图三。在图1实施例提供的数据集构建方法的基础上，如图3所示，在S103中基于补充标注的信息生成数据集的另一种实现过程为：

S301：获取初始数据集。

S302：对初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息。

在本申请实施例中，S301至S302实现的步骤以及效果与图1实施例中S101至S102实现的步骤以及效果一致，在此不再赘述。

S303：获取初始数据集中每个目标对应的点云，获得第一点云集。

S304：获取补充标注的信息中每个远端目标对应的点云。

在本申请实施例中，一方面，从初始数据集中获得已标注车辆的点云数据，

作为第一点云集；另一方面，在补充了远端车辆的标注信息之后，从初始数据5集的样本中获得每个远端车辆的点云数据。

需要说明的是，原有的初始数据集中是包含了每个远端目标对应的点云的，但是初始数据集中的远端车辆没有被标注，在对初始数据集中的样本进行远端数据的补充标注之后，进一步的，从初始数据集中获得远端目标的点云数据，即从原来的初始数据集对应的点云数据中获得远端目标的点云数据。

0S305：针对每个远端目标对应的点云，将远端目标对应的点云加入第一点

云集中，获得第二点云集。

在本申请实施例中，将每个远端目标的点云加入第一点云集中，获得包含了远端车辆点云数据的第二点云集，即第二点云集中包含了初始数据集中每个标注车辆的点云数据。

5S306：若第二点云集中的每个点云对应的区域均不重合，则根据第二点云集包含的所有目标的标注信息生成数据集。

在本申请实施例中，在获得了包含初始数据集中每个标注车辆的点云数据的第二点云集之后，根据第二点云集中每个标注车辆的点云数据，确定每个标

注车辆的点云空间。示例性的，根据标注车辆的点云数据确定每个标注车辆的0空间位置信息，即每个标注车辆的点云空间的空间位置信息。具体的，每个标

注车辆的点云空间的空间位置信息包含空间的长度、宽度、高度以及空间中心点的三维坐标信息。若根据每个标注车辆的空间位置信息，判定第二点云集中的每个标注车辆的点云空间之间均不存在重合的空间，则可以确定补充了远端

车辆的标注信息之后，每个远端车辆对应的点云空间与第一点云集中每个已标5注车辆对应的点云空间均不存在位置冲突的情况。

S307：若远端目标对应的点云与第一点云集中包含的目标的点云存在重合区域，则对远端目标的位置进行偏移，若偏移后的远端目标对应的点云与第一点云集中包含所有目标的点云均不存在重合区域，则根据偏移后的远端目标的标注信息以及第一点云集包含的所有目标的标注信息生成数据集。

在本申请实施例中，在确定了每个远端车辆对应的点云空间的空间位置信息之后，若判定存在一个远端车辆的点云空间与初始数据集中已标注车辆的点云空间存在空间重合时，需要调整该远端车辆的标注信息中的车辆定位信息。

具体的，在获得了每个远端车辆对应的点云空间的空间位置信息之后，针对每个远端车辆，确定该远端车辆的点云空间与第一点云集中每个已标注车辆对应的点云空间的空间并交比。需要说明是，两个点云空间的空间并交比，为两个点云空间的重合空间与两个点云空间的合并空间之间的比值。需要说明是，在已知两个点云空间的空间位置信息之后，计算两个点云空间的空间并交比为现有技术，在此不再赘述。

应理解，当根据远端车辆的点云空间与已标注车辆对应的点云空间的空间并交比不为零时，则可确定远端车辆的点云空间与已标注车辆对应的点云空间存在重合空间，需要对远端车辆的点云空间的位置进行偏移。

需要说明的是，当两个远端车辆的点云空间之间存在空间重合时，需要对其中任一一个远端车辆的点云位置进行偏移，直至补充标注的所有远端车辆之间均不存在位置重合的情况。

具体的，在对远端车辆的点云空间的位置进行偏移之后，重新计算远端车辆的点云空间与原来重合的已标注车辆对应的点云空间之间的空间并交比，并根据重新计算的空间并交比调整偏移的策略，使得两个点云空间不存在重合部分，即两个点云空间的空间并交比为零。具体的，根据重新计算的空间并交比调整偏移的策略的过程为：若重新计算的空间并交比小于原来的空间并交比，则按照本次偏移方向进行偏移，相反的，若重新计算的空间并交比大于原来的空间并交比，则按照本次偏移方向的反方向进行偏移，直至两个点云空间的空间并交比为零。

在本申请实施例中，在对存在重合情况的远端车辆的点云空间的位置进行偏移之后，当调整后的远端车辆的点云空间与原来重合的已标注车辆对应的点云空间之间的空间并交比为零，即在确定了每个远端车辆的点云空间与原来重合的已标注车辆对应的点云空间不存在重合部分时，可根据偏移后的远端车辆的标注信息以及第一点云集包含的所有车辆的标注信息生成新的数据集。其中，当远端车辆的点云空间的位置进行偏移之后，根据该点云空间的位置偏移信息对远端车辆的标注信息中车辆定位信息进行调整。

本申请实施例提供提供的数据集构建方法，通过补充标注的远端车辆的点云位置进行调整，使得补充标注的远端车辆与标注的其他车辆之间不存在位置冲突的情况，提高了补充标注远端车辆的点云位置的准确性。

图4是本申请实施例提供的目标检测方法的流程示意图。在图1实施例提供的数据集构建方法的基础上，如图4所示，在S103基于补充标注的信息生成数据集之后进行目标检测的过程如下：

S401：获取预设范围的检测数据，检测数据的范围大于预设距离。

在本申请实施例中，在采用3D车辆检测模型对采集的点云数据进行检测获得车辆的位置信息的过程中，需要利用激光雷达采集待检测的点云数据。具体的，利用激光雷达对预设范围内的车辆进行探测，获得车辆的检测数据。获取检测数据的预设范围大于现有技术中获得检测数据的探测采集范围，需要说明的是，本申请实施例中的预设距离为图1实施例中的预设距离。

应理解，在本申请实施例中，通过采用上述实施例中提供的数据构建方法，使得训练目标检测模型的数据集中包含了测量范围大于预设距离的车辆的标注数据，使得训练后的目标检测模型能够对大于预设距离范围内的检测数据进行识别。

S402：将检测数据输入目标检测模型，得到目标检测结果，其中，目标检测模型基于数据集进行训练得到的。

在本申请实施例中，通过采用图1至图3实施例中获得的包含远端车辆标注数据的数据集对目标检测模型进行训练，使得训练后的检测模型能够对超出预设距离的车辆的点云进行检测，已实现检测车辆位置信息的目的。

具体的，在获得数据集之前，获取初始模型，初始模型基于目标检测任务构建。在获得初始模型之后，根据图1至图3实施例中获得的数据集训练初始模型，获得目标检测模型。

本申请实施例提供提供的数据集构建方法，通过补充了远端车辆标注数据的数据集对目标检测模型进行训练，由于数据集中包含了测量范围大于预设距离的车辆的标注数据，使得训练后的目标检测模型能够对大于预设距离范围内的车辆的点云数据进行检测，以识别车辆的位置，提高了目标检测模型的检测范围。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例所述的数据集构建方法，图5是本申请实施例提供的数据集构建装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参照图5，该数据集构建装置包括：获取模块501、补充模块502以及生成模块503。

所述获取模块501，用于获取初始数据集；所述初始数据集包含多个样本，所述样本被标注目标信息；

所述补充模块502，用于对所述初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息；所述远端数据为对大于预设距离的区域进行检测得到的数据，所述远端目标为检测区域中大于预设距离的区域中的目标；

所述生成模块503，用于基于补充标注的信息生成数据集。

需要说明的是，上述模块/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

另外，图5所示的数据集构建装置可以是内置于现有的终端设备内的软件单元、硬件单元、或软硬结合的单元，也可以作为独立的挂件集成到所述终端设备中，还可以作为独立的终端设备存在。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图6是本申请实施例提供的服务器的结构示意图，本申请实施例提供的服务器60包括：至少一个处理器61(图6中仅示出一个)、存储器62以及存储在所述存储器62中并可在所述至少一个处理器61上运行的计算机程序63，所述处理器61执行所述计算机程序63时实现上述任意各个数据集构建方法实施例中的服务器执行的步骤。

所称处理器61可以是中央处理单元(Central Processing Unit，CPU)，该处理器61还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器62在一些实施例中可以是所述服务器60的内部存储单元，例如服务器60的硬盘或内存。所述存储器62在另一些实施例中也可以是所述服务器60的外部存储设备，例如所述服务器60上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述服务器60还可以既包括所述服务器60的内部存储单元也包括外部存储设备。所述存储器62用于存储操作系统、应用程序、引导装载程序(Boot Loader)、数据以及其他程序等，例如所述计算机程序的程序代码等。所述存储器62还可以用于暂时地存储已经输出或者将要输出的数据。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时可实现上述任意各个数据集构建方法实施例中的服务器执行的步骤。

本申请实施例提供了一种计算机程序产品，当计算机程序产品在终端设备上运行时，使得终端设备执行时实现上述任意各个数据集构建方法实施例中服务器执行的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本申请实施例提供方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种数据集构建方法，其特征在于，所述方法包括：

基于补充标注的信息生成数据集。

2.根据权利要求1所述的方法，其特征在于，所述目标为车辆，所述远端数据为大于预设距离的区域进行检测得到的数据；所述远端目标为检测区域中大于所述预设距离的区域中的目标。

3.根据权利要求1所述的方法，其特征在于，所述对所述初始数据集中的样本进行远端数据的补充标注，以补充标注远端目标的类型和位置信息，包括：

根据所述初始数据集获得每个所述远端目标的点云；

4.根据权利要求1所述的方法，其特征在于，所述基于补充标注的信息生成数据集，包括：

对所述第一数据集进行数据清洗，获得数据集。

5.根据权利要求4所述的方法，其特征在于，所述对所述第一数据集进行数据清洗，获得数据集，包括：

根据所述第二点云文件生成二维俯视图；

根据所述第一数据集中包含所有目标的点云生成至少一个三视图；

6.根据权利要求1所述的方法，其特征在于，所述基于补充标注的信息生成数据集，包括：

获取所述补充标注的信息中每个所述远端目标对应的点云；

7.一种目标检测方法，其特征在于，所述方法包括：

将所述检测数据输入目标检测模型，得到目标检测结果，所述目标检测模型基于如权利要求1至6任意一项所述的数据集进行训练得到的。

8.一种目标检测模型，其特征在于，所述模型包括：

获取初始模型，所述初始模型基于目标检测任务构建；

利用如权利要求1至6任一项所述的数据集训练所述初始模型，获得目标检测模型。

9.一种服务器，其特征在于，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的数据集构建方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，执行如权利要求1至6任一项所述的数据集构建方法。