CN117789211A - 基于仿真平台的仿真数据标注方法、装置、设备及介质 - Google Patents
基于仿真平台的仿真数据标注方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117789211A CN117789211A CN202311830259.4A CN202311830259A CN117789211A CN 117789211 A CN117789211 A CN 117789211A CN 202311830259 A CN202311830259 A CN 202311830259A CN 117789211 A CN117789211 A CN 117789211A
- Authority
- CN
- China
- Prior art keywords
- target object
- boundary coordinates
- image
- target
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004088 simulation Methods 0.000 title claims abstract description 104
- 238000002372 labelling Methods 0.000 title claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims abstract description 26
- 238000013135 deep learning Methods 0.000 claims abstract description 17
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 6
- 238000009877 rendering Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 abstract description 16
- 238000012549 training Methods 0.000 abstract description 10
- 238000010586 diagram Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请涉及一种基于仿真平台的仿真数据标注方法、装置、设备及介质,其中方法包括:配置目标对象的配置信息;通过预设仿真平台基于配置信息生成随机场景,并对随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;提取分割图像中各目标对象的边界坐标和最小外接矩形;基于边界坐标和最小外接矩形确定当前对象的类别,得到目标对象类别;通过预设的深度学习算法基于目标对象类别、边界坐标和最小外接矩形构建标注文件。本申请通过仿真平台上的仿真数据代替真实数据,增加了训练数据的多样性,降低了数据集采集难度,并且能够实现数据自动标注,有利于提高数据标注的效率和精度。
Description
技术领域
本申请涉及数据标注技术领域,尤其涉及一种基于仿真平台的仿真数据标注方法、装置、设备及介质。
背景技术
数据标注是指给原始数据添加标签的过程,带有标签的数据被称为训练数据,这些标签形成了数据属于哪一类对象的表示并提供了对象的边界信息和最小外接矩形等信息,帮助机器学习模型在未来遇到从未见过的数据时,能够准确地识别数据中的内容。在计算机视觉领域,数据标注一般指对目标图像进行类别、定位和分割的标注。
现有图像数据的标注主要以人工标注为主,其中,人工标注指工作人员使用Labelme、Labellmg、VGG、Labelbox和CVAT等软件对图像添加类别、定位及分割等标签的过程。然而人工标注的精度受人为影响较大,实践过程中通常需要大量带标签的数据进行模型训练,这要求负责标注的工作人员保持长时间的专注工作。此外,人工标注数据需要在项目初期花费大量的时间,影响项目进度。故现亟需一种提高数据标注精度和效率的数据标注方法。
发明内容
本申请实施例的目的在于提出一种基于仿真平台的仿真数据标注方法、装置、设备及介质,以提高数据标注精度和效率。
为了解决上述技术问题,本申请实施例提供一种基于仿真平台的仿真数据标注方法,包括:
配置目标对象的配置信息;
通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;
提取所述分割图像中各目标对象的边界坐标和最小外接矩形;
基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;
通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。
进一步地,所述配置信息包括数据集数量、目标对象信息以及环境信息,所述目标对象信息包括图像分辨率、图像水平旋转范围、图像垂直旋转范围、目标对象在图像中的区域、目标对象类别数量、目标对象数量和目标对象自身旋转量,所述环境信息包括背景纹理图和场景灯光。
进一步地,所述通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息,包括:
通过所述预设仿真平台基于所述配置信息生成所述随机场景;
对所述随机场景进行渲染,生成所述纹理图像;
通过对所述随机场景中的不同模型进行射线碰撞处理,获取每一模型的模型信息;
根据所述模型信息生成所述分割图像。
进一步地,所述通过对所述随机场景中的不同模型进行射线碰撞处理,获取每一模型的模型信息,包括:
通过所述预设仿真平台发出射线,当射线碰撞到每一所述模型时,获取每一所述模型的模型信息,其中,所述模型信息包括模型在所述分割图像或所述纹理图像中的位置、模型的名称或类别。
进一步地,所述提取所述分割图像中各目标对象的边界坐标和最小外接矩形包括:
提取所述分割图像中各目标对象的边界坐标;
从所述边界坐标中筛选出目标边界坐标,并基于所述目标边界坐标构建边框,且根据所述边框构建所述最小外接矩形。
进一步地,所述从所述边界坐标中筛选出目标边界坐标,并基于所述目标边界坐标构建边框,且根据所述边框构建所述最小外接矩形,包括:
从所述边界坐标中筛选出最边缘的边界坐标,得到目标边界坐标,其中,所述目标边界坐标包括最上边坐标、最下边坐标、最左边坐标和最右边坐标;
将每一所述目标边界坐标构建对应边框;
将所述边框的首尾相连生成所述最小外接矩形。
进一步地,所述基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别,包括:
基于所述边界坐标和所述最小外接矩形确定所述当前对象的位置信息,得到目标位置信息;
将所述目标位置信息与所述模型信息中的位置信息进行对比,以识别出所述当前对象对应的目标对象,使得从所述模型信息中确认所述目标对象类别。
为了解决上述技术问题,本申请实施例提供一种基于仿真平台的仿真数据标注装置,包括:
配置信息生成单元,用于配置目标对象的配置信息;
分割图像生成单元,用于通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;
边界坐标提取单元,用于提取所述分割图像中各目标对象的边界坐标和最小外接矩形;
对象类别生成单元,用于基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;
标注文件构建单元,用于通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种计算机设备,包括,一个或多个处理器;存储器,用于存储一个或多个程序,使得一个或多个处理器实现上述任意一项所述的基于仿真平台的仿真数据标注方法。
为解决上述技术问题,本发明采用的一个技术方案是:一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于仿真平台的仿真数据标注方法。
本发明实施例提供了一种基于仿真平台的仿真数据标注方法、装置、设备及介质。其中,方法包括:配置目标对象的配置信息;通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;提取所述分割图像中各目标对象的边界坐标和最小外接矩形;基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。本发明实施例通过仿真平台上的仿真数据代替真实数据,增加了训练数据的多样性,降低了数据集采集难度,并且能够实现数据自动标注,有利于提高数据标注的效率和精度。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的基于仿真平台的仿真数据标注方法流程的一实现流程图;
图2是本申请实施例提供的基于仿真平台的仿真数据标注方法中的子流程实现流程图;
图3是本申请实施例提供的基于仿真平台的仿真数据标注方法中的子流程实现流程图;
图4是本申请实施例提供的基于仿真平台的仿真数据标注方法中的子流程实现流程图;
图5是本申请实施例提供的基于仿真平台的仿真数据标注方法中的子流程实现流程图;
图6是本申请实施例提供的基于仿真平台的仿真数据标注装置示意图;
图7是本申请实施例提供的计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
下面结合附图和实施方式对本发明进行详细说明。
需要说明的是,本申请实施例所提供的基于仿真平台的仿真数据标注方法一般由计算机执行,相应地,基于仿真平台的仿真数据标注装置一般配置计算机中。
请参阅图1,图1示出了基于仿真平台的仿真数据标注方法的一种具体实施方式。
需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限,该方法包括如下步骤:
S1:配置目标对象的配置信息。
具体地,为了保证生成丰富多样的仿真数据,需要对不同的属性进行配置,以生成配置信息。其中,所述配置信息包括数据集数量、目标对象信息以及环境信息,所述目标对象信息包括图像分辨率、图像水平旋转范围、图像垂直旋转范围、目标对象在图像中的区域、目标对象类别数量、目标对象数量和目标对象自身旋转量,所述环境信息包括背景纹理图和场景灯光。
进一步地,配置信息可以通过人工配置,也可以由程序自动随机配置。
S2:通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息。
具体地,预设仿真平台包括Unity3d、Nvidia Omniverse和Blender中的任一种。在本申请实施例中,优先选择Unity3d作为仿真平台。在仿真平台Unity3d中基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息。
其中,在有监督深度学习任务中,纹理图像作为深度学习算法的输入数据,分割图像或者由分割图像生成的标签数据作为groundtrut。
请参阅图2,图2示出了步骤S2的一种具体实施方式,详叙如下:
S21:通过所述预设仿真平台基于所述配置信息生成所述随机场景。
S22:对所述随机场景进行渲染,生成所述纹理图像。
具体地,根据配置信息中的数据集数量、目标对象类别数量和目标对象数量确定不同类别的目标对象数量,然后根据配置信息的目标对象在图像中的区域确定目标对象摆放位置区域,再根据图像分辨率、图像水平旋转范围、图像垂直旋转范围和目标对象自身旋转量确定目标对象的摆放姿态和图像分辨率,最后根据背景纹理图和场景灯光生成随机场景的背景和灯光,从而生成最终的随机场景。在本申请实施例中,随机场景是仿真平台的scene视图的场景。而game视图是对随机场景渲染后的图像,也即渲染后的纹理图像,该纹理图像可以保存于本地数据库中。
在一具体实施例中,以配置信息中的数据集数量举例,假设数据集数量为10,那么程序从配置属性中获取该数字10,然后“指导”unity3d在场景中规则或随机摆放10个目标模型(模型可以是圆柱体、立方体、刹车盘、汽车、人、鸟等等由设计人员提前制作好的美术模型,根据项目需要使用不同的模型。以公路上车辆检测为例,通过随机在unity程序里面放入地面模型、建筑物模型、天空模型等生成随机场景。)当目标模型(我们在实践中需要检测的对象)、场景模型等出现在unity场景中,unity会渲染该场景从而生成纹理图像。
S23:通过对所述随机场景中的不同模型进行射线碰撞处理,获取每一模型的模型信息。
进一步地,提供步骤S23的一种具体实施方式:通过所述预设仿真平台发出射线,当射线碰撞到每一所述模型时,获取每一所述模型的模型信息,其中,所述模型信息包括模型在所述分割图像或所述纹理图像中的位置、模型的名称或类别。由于每个模型在场景种都有唯一的名称,该名称可以作为模型的类别,而模型命名是根据实际需要的类别进行命名。例如:car_0,表示该模型的类别为car,并表示在所有car中其标号为0。
S24:根据所述模型信息生成所述分割图像。
具体地,射线碰撞是unity3d自带的功能,指的是利用场景中的摄像机向场景中发出射线,当射线碰撞到模型时,程序会获知被碰撞的模型信息(包括模型名称、模型类别以及模型位置信息),获知模型信息就可以生成分割图像。
以分割图像为例,背景一般用纯黑色,代表黄色圆柱体的分割对象其像素值为255(也可以是其他像素值),代表黑色球体的分割对象其像素值为254。注意,scene视图中有摄像机,game视图就是场景中摄像机“看到”的图像。
S3:提取所述分割图像中各目标对象的边界坐标和最小外接矩形。
具体地,在本申请实施例通过对分割图像进行数字图像处理,以提取分割图像中各目标对象的边界坐标和最小外接矩形。其中,数字图像处理(Digital ImageProcessing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。
需要说明的是,虽然模型信息中已经获取到了模型的位置和类别,但是unity从场景中获取模型信息时会无差别获取所有被射线碰撞到的模型,这是因为要实现模型的真实场景,所以仿真场景中必然会存在模型互相堆叠的情况,这使得在实践中被遮挡(可以设置被遮挡的比例,例如被遮挡超过20%的车子就不再参与深度学习的训练)的模型是不能作为训练数据的。也就是说整个场景中并不是所有模型信息都会被利用上,所以需要从分割图像中获取那些“面积”较大的目标对象(对于同一种模型,面积大表示没遮挡或被遮挡较少)。从分割图像中针对“面积”较大的目标对象进行数字图像处理,从而获取边界、最小外接矩形信息,然后通过位置信息比对场景中所有模型的模型信息,最终确定当前分割图像中的目标对象属于哪种类别。
请参阅图3,图3示出了步骤S3的一种具体实施方式,详叙如下:
S31:提取所述分割图像中各目标对象的边界坐标。
在一具体的实施例中,模型信息中包括模型位置信息,所以在快速定位到分割模型中的目标对象位置,由于在分割模型中目标对象和背景呈现不同的图像分辨率,所以可以根据图像分辨率的差别可以提取到目标对象的不同像素点坐标;由于本申请实施例只需要目标对象的边界坐标,所以只要提取目标对象与边界相接触的像素点集合的坐标,即可提取到该目标对象的边界坐标。
S32:从所述边界坐标中筛选出目标边界坐标,并基于所述目标边界坐标构建边框,且根据所述边框构建所述最小外接矩形。
请参阅图4,图4示出了步骤S32的一种具体实施方式,详叙如下:
S321:从所述边界坐标中筛选出最边缘的边界坐标,得到目标边界坐标,其中,所述目标边界坐标包括最上边坐标、最下边坐标、最左边坐标和最右边坐标。
S322:将每一所述目标边界坐标构建对应边框。
S323:将所述边框的首尾相连生成所述最小外接矩形。
具体地,本申请实施例需要构造出目标对象的最小外接矩形,所以需要从边界坐标中筛选出最边缘的边界坐标,得到目标边界坐标,其中,所述目标边界坐标包括最上边坐标、最下边坐标、最左边坐标和最右边坐标;最上边坐标可以沿该坐标中的纵坐标生成平行与横标轴平行的边框;最下边坐标可以沿该坐标中的纵坐标生成平行与横标轴平行的边框;最左边坐标可以沿该坐标中的横坐标生成平行与纵标轴的边框;最右边坐标可以沿该坐标中的横坐标生成平行与纵标轴的边框;当四条边框相交时,也即不同边框的首尾相连,生成最小外接矩形。
S4:基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别。
请参阅图5,图5示出了步骤S4的一种具体实施方式,详叙如下:
S41:基于所述边界坐标和所述最小外接矩形确定所述当前对象的位置信息,得到目标位置信息。
S42:将所述目标位置信息与所述模型信息中的位置信息进行对比,以识别出所述当前对象对应的目标对象,使得从所述模型信息中确认所述目标对象类别。
具体地,上述步骤已经获知了分割图像中的边界坐标和最小外接矩形,所以在本申请实施例中,通过边界坐标和最小外接矩形确认不同模型的位置信息,然后根据这些位置信息与模型信息中的位置进行对比,从而识别出当前对象在相同位置上的目标对象,由于模型信息中已经获知了所有目标对象的类别,所以可以生成目标对象类别。
从而最终确定当前分割图像中的目标对象属于哪种类别。
在一具体实施例中,在实例分割中需要知道目标对象的外接矩形、物体轮廓、物体类别甚至同一类物体对象还要区分个体。例如在车辆实例分割时,不仅要获知车辆的外接矩形、车辆自身的真实轮廓,还要知道车辆是小吃还是大巴,即使都是大巴,还要区分“这辆大巴”和“那辆大巴”。本申请实施例中从分割图像提取更详细的目标对象信息就是为了能适应更高级别的计算机视觉任务。此外,在目前主流的目标检测或实例分割算法中,训练数据集中的标签数据实际不是图像,而是纹理图像中每个目标对象的位置、类别等信息。初级的计算机视觉任务,如早期的图像分割可以直接使用分割图像,而不需要进一步提取位置、类型等信息。
S5:通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。
具体地,本申请实施例中将分割图像中每一目标对象的目标对象类别、边界坐标和最小外接矩形进行组合,生成标注文件,从而构成深度学习的训练数据集。
进一步地,目标检测任务只需要外接矩形、类型和自身类别,实例分割任务需要外接矩形、目标对象的真实轮廓、类型和自身类别。不同深度学习算法需要的标签数据会存在不一样的情况,但只要从分割图像中提取到边界信息、最小外接矩形和类别信息就能适应各种深度学习算法。预设的深度学习算法主要是yolo系列和maskrcnn中的任一种。
本申请实施例中,配置目标对象的配置信息;通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;提取所述分割图像中各目标对象的边界坐标和最小外接矩形;基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。本发明实施例通过仿真平台上的仿真数据代替真实数据,增加了训练数据的多样性,降低了数据集采集难度,并且能够实现数据自动标注,有利于提高数据标注的效率和精度。
请参考图6,作为对上述图1所示方法的实现,本申请提供了一种基于仿真平台的仿真数据标注装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的基于仿真平台的仿真数据标注装置包括:配置信息生成单元61、分割图像生成单元62、边界坐标提取单元63、对象类别生成单元64及标注文件构建单元65,其中:
配置信息生成单元61,用于配置目标对象的配置信息;
分割图像生成单元62,用于通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;
边界坐标提取单元63,用于提取所述分割图像中各目标对象的边界坐标和最小外接矩形;
对象类别生成单元64,用于基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;
标注文件构建单元65,用于通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。
进一步地,所述配置信息包括数据集数量、目标对象信息以及环境信息,所述目标对象信息包括图像分辨率、图像水平旋转范围、图像垂直旋转范围、目标对象在图像中的区域、目标对象类别数量、目标对象数量和目标对象自身旋转量,所述环境信息包括背景纹理图和场景灯光。
进一步地,分割图像生成单元62包括:
随机场景生成单元,用于通过所述预设仿真平台基于所述配置信息生成所述随机场景;
场景渲染单元,用于对所述随机场景进行渲染,生成所述纹理图像;
模型信息生成单元,用于通过对所述随机场景中的不同模型进行射线碰撞处理,获取每一模型的模型信息;
图像生成单元,用于根据所述模型信息生成所述分割图像。
进一步地,模型信息生成单元包括:
模型信息获取单元,用于通过所述预设仿真平台发出射线,当射线碰撞到每一所述模型时,获取每一所述模型的模型信息,其中,所述模型信息包括模型在所述分割图像或所述纹理图像中的位置、模型的名称或类别。
进一步地,边界坐标提取单元63包括:
坐标提取单元,用于提取所述分割图像中各目标对象的边界坐标;
矩形构建单元,用于从所述边界坐标中筛选出目标边界坐标,并基于所述目标边界坐标构建边框,且根据所述边框构建所述最小外接矩形。
进一步地,矩形构建单元包括:
坐标筛选单元,用于从所述边界坐标中筛选出最边缘的边界坐标,得到目标边界坐标,其中,所述目标边界坐标包括最上边坐标、最下边坐标、最左边坐标和最右边坐标;
边框构建单元,用于将每一所述目标边界坐标构建对应边框;
矩形生成单元,用于将所述边框的首尾相连生成所述最小外接矩形。
进一步地,对象类别生成单元64包括:
目标位置信息生成单元,用于基于所述边界坐标和所述最小外接矩形确定所述当前对象的位置信息,得到目标位置信息;
对象类别确认单元,用于将所述目标位置信息与所述模型信息中的位置信息进行对比,以识别出所述当前对象对应的目标对象,使得从所述模型信息中确认所述目标对象类别。
本申请实施例中,配置目标对象的配置信息;通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;提取所述分割图像中各目标对象的边界坐标和最小外接矩形;基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。本发明实施例通过仿真平台上的仿真数据代替真实数据,增加了训练数据的多样性,降低了数据集采集难度,并且能够实现数据自动标注,有利于提高数据标注的效率和精度。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
计算机设备7包括通过系统总线相互通信连接存储器71、处理器72、网络接口73。需要指出的是,图中仅示出了具有三种组件存储器71、处理器72、网络接口73的计算机设备7,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field -Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
存储器71至少包括一种类型的可读存储介质,可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器71可以是计算机设备7的内部存储单元,例如该计算机设备7的硬盘或内存。在另一些实施例中,存储器71也可以是计算机设备7的外部存储设备,例如该计算机设备7上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器71还可以既包括计算机设备7的内部存储单元也包括其外部存储设备。本实施例中,存储器71通常用于存储安装于计算机设备7的操作系统和各类应用软件,例如基于仿真平台的仿真数据标注方法的程序代码等。此外,存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器72在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制计算机设备7的总体操作。本实施例中,处理器72用于运行存储器71中存储的程序代码或者处理数据,例如运行上述基于仿真平台的仿真数据标注方法的程序代码,以实现基于仿真平台的仿真数据标注方法的各种实施例。
网络接口73可包括无线网络接口或有线网络接口,该网络接口73通常用于在计算机设备7与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序可被至少一个处理器执行,以使至少一个处理器执行如上述的一种基于仿真平台的仿真数据标注方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种基于仿真平台的仿真数据标注方法,其特征在于,包括:
配置目标对象的配置信息;
通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;
提取所述分割图像中各目标对象的边界坐标和最小外接矩形;
基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;
通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。
2.根据权利要求1所述的基于仿真平台的仿真数据标注方法,其特征在于,所述配置信息包括数据集数量、目标对象信息以及环境信息,所述目标对象信息包括图像分辨率、图像水平旋转范围、图像垂直旋转范围、目标对象在图像中的区域、目标对象类别数量、目标对象数量和目标对象自身旋转量,所述环境信息包括背景纹理图和场景灯光。
3.根据权利要求1所述的基于仿真平台的仿真数据标注方法,其特征在于,所述通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息,包括:
通过所述预设仿真平台基于所述配置信息生成所述随机场景;
对所述随机场景进行渲染,生成所述纹理图像;
通过对所述随机场景中的不同模型进行射线碰撞处理,获取每一模型的模型信息;
根据所述模型信息生成所述分割图像。
4.根据权利要求3所述的基于仿真平台的仿真数据标注方法,其特征在于,所述通过对所述随机场景中的不同模型进行射线碰撞处理,获取每一模型的模型信息,包括:
通过所述预设仿真平台发出射线,当射线碰撞到每一所述模型时,获取每一所述模型的模型信息,其中,所述模型信息包括模型在所述分割图像或所述纹理图像中的位置、模型的名称或类别。
5.根据权利要求1所述的基于仿真平台的仿真数据标注方法,其特征在于,所述提取所述分割图像中各目标对象的边界坐标和最小外接矩形包括:
提取所述分割图像中各目标对象的边界坐标;
从所述边界坐标中筛选出目标边界坐标,并基于所述目标边界坐标构建边框,且根据所述边框构建所述最小外接矩形。
6.根据权利要求5所述的基于仿真平台的仿真数据标注方法,其特征在于,所述从所述边界坐标中筛选出目标边界坐标,并基于所述目标边界坐标构建边框,且根据所述边框构建所述最小外接矩形,包括:
从所述边界坐标中筛选出最边缘的边界坐标,得到目标边界坐标,其中,所述目标边界坐标包括最上边坐标、最下边坐标、最左边坐标和最右边坐标;
将每一所述目标边界坐标构建对应边框;
将所述边框的首尾相连生成所述最小外接矩形。
7.根据权利要求1至6任一项所述的基于仿真平台的仿真数据标注方法,其特征在于,所述基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别,包括:
基于所述边界坐标和所述最小外接矩形确定所述当前对象的位置信息,得到目标位置信息;
将所述目标位置信息与所述模型信息中的位置信息进行对比,以识别出所述当前对象对应的目标对象,使得从所述模型信息中确认所述目标对象类别。
8.一种基于仿真平台的仿真数据标注装置,其特征在于,包括:
配置信息生成单元,用于配置目标对象的配置信息;
分割图像生成单元,用于通过预设仿真平台基于所述配置信息生成随机场景,并对所述随机场景中的不同模型进行射线碰撞处理,生成分割图像、纹理图像和模型信息;
边界坐标提取单元,用于提取所述分割图像中各目标对象的边界坐标和最小外接矩形;
对象类别生成单元,用于基于所述边界坐标和所述最小外接矩形确定当前对象的类别,得到目标对象类别;
标注文件构建单元,用于通过预设的深度学习算法基于所述目标对象类别、所述边界坐标和所述最小外接矩形构建标注文件。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于仿真平台的仿真数据标注方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于仿真平台的仿真数据标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311830259.4A CN117789211A (zh) | 2023-12-28 | 2023-12-28 | 基于仿真平台的仿真数据标注方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311830259.4A CN117789211A (zh) | 2023-12-28 | 2023-12-28 | 基于仿真平台的仿真数据标注方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117789211A true CN117789211A (zh) | 2024-03-29 |
Family
ID=90401510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311830259.4A Pending CN117789211A (zh) | 2023-12-28 | 2023-12-28 | 基于仿真平台的仿真数据标注方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117789211A (zh) |
-
2023
- 2023-12-28 CN CN202311830259.4A patent/CN117789211A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699775B (zh) | 基于深度学习的证件识别方法、装置、设备及存储介质 | |
CN110751682B (zh) | 一种提取和标识图像的方法、装置、终端设备及存储介质 | |
CN109285181B (zh) | 用于识别图像的方法和装置 | |
CN112052850A (zh) | 车牌识别方法、装置、电子设备及存储介质 | |
CN111639704A (zh) | 目标识别方法、装置及计算机可读存储介质 | |
CN112132216B (zh) | 车型识别方法、装置、电子设备及存储介质 | |
CN113705462A (zh) | 人脸识别方法、装置、电子设备及计算机可读存储介质 | |
CN113361643A (zh) | 基于深度学习的通用标志识别方法、系统、设备及存储介质 | |
CN116385859A (zh) | 图元识别方法、装置、计算机设备及其介质 | |
CN114332894A (zh) | 图像的文本检测方法及装置 | |
CN117934771A (zh) | 数字沙盘的展示方法、装置、计算机设备及存储介质 | |
CN109190467B (zh) | 一种基于关键点回归的多物体检测方法、系统、终端和存储介质 | |
CN117789211A (zh) | 基于仿真平台的仿真数据标注方法、装置、设备及介质 | |
CN113850836B (zh) | 基于行为轨迹的员工行为识别方法、装置、设备及介质 | |
CN116343251A (zh) | 一种基于ai建筑识图的建筑图纸识别方法及系统 | |
CN114783042A (zh) | 基于多移动目标的人脸识别方法、装置、设备及存储介质 | |
CN112464753B (zh) | 图像中关键点的检测方法、检测装置及终端设备 | |
CN112529116B (zh) | 场景元素融合处理方法、装置和设备及计算机存储介质 | |
CN115049836A (zh) | 图像分割方法、装置、设备及存储介质 | |
CN113792671A (zh) | 人脸合成图像的检测方法、装置、电子设备及介质 | |
CN116681792A (zh) | 矢量图纸的子图生成方法、装置、设备及可读存储介质 | |
CN112084364A (zh) | 对象分析方法、局部图像搜索方法、设备及存储介质 | |
CN114266777A (zh) | 分割模型的训练方法、分割方法、装置、电子设备及介质 | |
CN112633134A (zh) | 基于图像识别的车内人脸识别方法、装置及介质 | |
CN111652226A (zh) | 基于图片的目标识别方法、装置及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |