CN108563742A

CN108563742A - 自动创建人工智能图像识别训练素材与标注文件的方法

Info

Publication number: CN108563742A
Application number: CN201810325982.XA
Authority: CN
Inventors: 王海军; 王海涛; 吕博钰; 吕钢
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-04-12
Filing date: 2018-04-12
Publication date: 2018-09-21
Anticipated expiration: 2038-04-12
Also published as: CN108563742B

Abstract

本发明公开自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于，该方法包括以下步骤：步骤S1:3D模型与场景设计，利用CAD类软件数字进行三维建模；步骤S2:合成训练图片，工具软件读取步骤S1中的3D模型、材质及背景信息，并对3D模型、材质及背景进行模拟相机拍摄，得到不同的距离、角度、时段、场景下的拍摄照片；最后通过对所模拟得到的照片和物体材质进行不同组合，合成训练图片并输出，在输出时记录当前状态下各关注对象的模型空间位置；步骤S3:创建物体标注文件，根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件；步骤S4:保存标注文件，本发明能快速、高质量生成训练素材及标注文件。

Description

自动创建人工智能图像识别训练素材与标注文件的方法

技术领域

本发明涉及自动创建人工智能图像识别训练素材与标注文件的方法，属于人工智能技术领域。

背景技术

人工智能平台软件已经较为成熟，可以通过对大量训练素材（经过预先标注的图片）进行自动学习，形成特定的图片识别模型。然后应用此模型，即可识别新的图片中是否有关注的对象，并描述出该对象在图片中的准确位置。但目前训练素材的获取存在如下困难：

拍摄困难。现有的训练照片数据通常是通过人工拍摄或航拍方式采集获取。受到安全、距离、角度、拍摄器材、时间、气候等方面的各种制约，因而形成训练图片数量较少，难以形成人工智能需要的足够信息量训练照片。平均下来，每获得100张符合要求的拍摄照片，从启动计划到最终提交，至少需要48小时以上。

标注困难。获取到拍摄阶段提供的训练照片后，还必须要人工利用特定工具软件进行标注处理，准确说明每个关注对象在图片中的具体位置，并确定形成对应的标注文件。这样，人工智能才能进行学习训练，知道应该关注的有哪些对象，这些对象在图片的什么区域。这一工作主要由人工完成，费时费力，效率低，速度慢，容易出现遗漏和偏差，且难以检查。例如，假定一张1024*768分辨率图片，图片中有5个关注对象。从打开1张图片，到手工画框标注特定的5个对象，并完成标注检查，熟练工人完成这一过程，平均需要约45秒。

总体质量低。在拍摄阶段，很难准确拍摄出符合预期的海量照片，因此总体图片数量偏少，时间长。标注阶段主要依赖人工，而受生理因素限制，人工连续标注多张图片后，其标注速度、准确度将迅速下降，从而影响训练最终产生的训练图片数据集的总体质量也随之下降。

即：现需要一种自动创建人工智能图像识别训练素材与标注文件的方法能解决上述问题。

发明内容

本发明要解决的技术问题是提供自动创建人工智能图像识别训练素材与标注文件的方法，可以克服现有技术的不足。

本发明的技术方案是：自动创建人工智能图像识别训练素材与标注文件的方法，该方法包括以下步骤：

步骤S1: 3D模型与场景设计，利用CAD类软件数字进行三维建模，再采用3D MAX类软件进行材质制作与背景渲染，并将模型、材质及背景信息独立存放，以便组合使用；

步骤S2: 合成训练图片，工具软件读取步骤S1中的3D模型、材质及背景信息，并对3D模型、材质及背景进行模拟相机拍摄，得到不同的距离、角度、时段、场景下的拍摄照片；最后通过对所模拟得到的照片和物体材质进行不同组合，合成训练图片并输出，在输出时记录当前状态下各关注对象的模型空间位置；

步骤S3: 创建物体标注文件，根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件，所述的标注文件包含的信息包括图片所属、位置信息、每个对象及其二维平面坐标值；

步骤S4:保存标注文件。

上述步骤1中包含三维建模模块和材质制作模块及渲染模块。

上述步骤S1中，在建模时，首先对重要的零部件单独建模，最后将各零部件统一装配成整体。

上述步骤S1中，在建模时，为物体不同的零部件准备多套材质方案，每套方案对应不同的材质纹理照片，最后经过PHOTOSHOP软件处理后独立存放备用。

上述步骤S2中工具软件包括信息读取模块，读取3D模型、材质及背景信息；模拟拍摄模块，模拟不同的距离、角度、时段及场景，预览并进行拍摄；组合生成模块，对照片和物体材质进行不同组合；记录空间位置模块，记录并关注对象的模型空间位置。

上述步骤S2中，通过工具软件参数设置界面设置合成图片的距离、高度及角度，并进行观察预览、调整各项参数及范围，从而实现可以一次性生成大量不同的合成训练图片，最终创建的合成训练图片样。

步骤S3包括图片标注模块，读取并标注当前图片中各关注对象的二维平面坐标值。

上述步骤S3中，所述标注文件为XML格式。

现有技术比较，本发明自动创建人工智能图像识别训练素材与标注文件的方法，该方法通过3D模型与场景设计、模拟相机拍摄、照片和物体材质进行不同组合，解决了现有人工拍摄或航拍方式受安全、距离、角度、拍摄器材、时间、气候等方面的各种制约的问题，合成的训练图片的整体质量亦比较高，有利于人工智能的精准学习；同时，通过记录当前状态下各关注对象的模型空间位置进行标注，能节约标注时间，经过多次实验，这样的方法生成速度快，平均1秒可产生1张512*512分辨率的图片并创建对象标注文件，能满足人工智能训练所需照片的需求。

附图说明

图1是本发明的步骤示意图。

具体实施方式

实施例1. 如图1所示，自动创建人工智能图像识别训练素材与标注文件的方法，该方法包括以下步骤：

步骤S1: 3D模型与场景设计，利用CAD类软件数字进行三维建模，再采用3D MAX类软件进行材质制作与渲染，模拟各种场景、各个时段下的光影效果，并将模型、材质及背景信息独立存放，以便组合使用；所述步骤1中包含三维建模模块和材质制作模块及渲染模块。所述步骤S1中，在建模时，首先对重要的零部件单独建模，最后将各零部件统一装配成整体。以避雷器为例，至少要对均压环、绝缘瓷柱、法兰、螺栓、设备支柱、水泥基础、接地带等零部件分别建模，最终进行装配；

所述步骤S1中，在建模时，同时，为物体不同的零部件准备多套材质方案，每套方案对应不同的材质纹理照片，最后经过PHOTOSHOP软件处理后独立存放备用。因为建模环节形成的零部件只是准确表现物体的形态，没有设置材质纹理与光照参数，真实感不强。外观设计阶段可以根据实际情况，为不同的零部件准备多套材质方案备用，如：螺栓的外观可分为正常与锈蚀两大类，而正常又可分为全新、班新、陈旧等；锈蚀也可分为微锈、生锈、严重腐蚀等等。

步骤S2: 合成训练图片，工具软件读取步骤S1中的3D模型、材质及背景信息，并对3D模型、材质及背景进行模拟相机拍摄，得到不同的距离、角度、时段、场景下的拍摄照片；最后通过对所模拟得到的照片和物体材质进行不同组合，合成训练图片并输出，在输出时记录当前状态下各关注对象的模型空间位置；所述步骤S2中工具软件包括信息读取模块，读取3D模型、材质及背景信息；模拟拍摄模块，模拟不同的距离、角度、时段及场景，预览并进行拍摄；组合生成模块，对照片和物体材质进行不同组合；记录空间位置模块，记录并关注对象的模型空间位置；步骤S2中，通过工具软件参数设置界面设置合成图片的距离、高度及角度，并进行观察预览、调整各项参数及范围，从而实现可以一次性生成大量不同的合成训练图片，最终创建的合成训练图片样，在合成图片输出过程中，综合利用DirectX和OpenGL等相关技术。

步骤S3: 创建物体标注文件，根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件，所述的标注文件包含的信息包括图片所属、位置信息、每个对象及其二维平面坐标值，通过物体的多个二维平面坐标值，即可框定特定的学习区域；步骤S3包括图片标注模块，读取并标注当前图片中各关注对象的二维平面坐标值，标注文件为XML格式。

步骤S4:保存标注文件。

经过多次试验，平均1秒可产生1张512*512分辨率的图片并创建对象标注文件。支持并行计算与任务切片，可以让多台PC同时并发创建一个AI训练图片集,提高制作速度。

Claims

1.自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于，该方法包括以下步骤：

步骤S1: 3D模型与场景设计，利用CAD类软件数字进行三维建模，再采用3D MAX类软件进行材质制作与背景渲染，并将三维模型、材质及背景信息独立存放，以便组合使用；

步骤S4:保存标注文件。

2.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：所述步骤1中包含三维建模模块和材质制作模块及渲染模块。

3.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：所述步骤S1中，在建模时，首先对重要的零部件单独建模，最后将各零部件统一装配成整体。

4.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：所述步骤S1中，在建模时，为物体不同的零部件准备多套材质方案，每套方案对应不同的材质纹理照片，最后经过PHOTOSHOP软件处理后独立存放备用。

5.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：所述步骤S2中工具软件包括信息读取模块，读取3D模型、材质及背景信息；模拟拍摄模块，模拟不同的距离、角度、时段及场景，预览并进行拍摄；组合生成模块，对照片和物体材质进行不同组合；记录空间位置模块，记录并关注对象的模型空间位置。

6.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：在步骤S2中，通过工具软件参数设置界面设置合成图片的距离、高度及角度，并进行观察预览、调整各项参数及范围，从而实现可以一次性生成大量不同的合成训练图片，最终创建的合成训练图片样。

7.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：步骤S3包括图片标注模块，读取并标注当前图片中各关注对象的二维平面坐标值。

8.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法，其特征在于：步骤S3中，所述标注文件为XML格式。