CN108563742A - 自动创建人工智能图像识别训练素材与标注文件的方法 - Google Patents
自动创建人工智能图像识别训练素材与标注文件的方法 Download PDFInfo
- Publication number
- CN108563742A CN108563742A CN201810325982.XA CN201810325982A CN108563742A CN 108563742 A CN108563742 A CN 108563742A CN 201810325982 A CN201810325982 A CN 201810325982A CN 108563742 A CN108563742 A CN 108563742A
- Authority
- CN
- China
- Prior art keywords
- file
- artificial intelligence
- image recognition
- automatically creating
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本发明公开自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于,该方法包括以下步骤:步骤S1:3D模型与场景设计,利用CAD类软件数字进行三维建模;步骤S2:合成训练图片,工具软件读取步骤S1中的3D模型、材质及背景信息,并对3D模型、材质及背景进行模拟相机拍摄,得到不同的距离、角度、时段、场景下的拍摄照片;最后通过对所模拟得到的照片和物体材质进行不同组合,合成训练图片并输出,在输出时记录当前状态下各关注对象的模型空间位置;步骤S3:创建物体标注文件,根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件;步骤S4:保存标注文件,本发明能快速、高质量生成训练素材及标注文件。
Description
技术领域
本发明涉及自动创建人工智能图像识别训练素材与标注文件的方法,属于人工智能技术领域。
背景技术
人工智能平台软件已经较为成熟,可以通过对大量训练素材(经过预先标注的图片)进行自动学习,形成特定的图片识别模型。然后应用此模型,即可识别新的图片中是否有关注的对象,并描述出该对象在图片中的准确位置。但目前训练素材的获取存在如下困难:
拍摄困难。现有的训练照片数据通常是通过人工拍摄或航拍方式采集获取。受到安全、距离、角度、拍摄器材、时间、气候等方面的各种制约,因而形成训练图片数量较少,难以形成人工智能需要的足够信息量训练照片。平均下来,每获得100张符合要求的拍摄照片,从启动计划到最终提交,至少需要48小时以上。
标注困难。获取到拍摄阶段提供的训练照片后,还必须要人工利用特定工具软件进行标注处理,准确说明每个关注对象在图片中的具体位置,并确定形成对应的标注文件。这样,人工智能才能进行学习训练,知道应该关注的有哪些对象,这些对象在图片的什么区域。这一工作主要由人工完成,费时费力,效率低,速度慢,容易出现遗漏和偏差,且难以检查。例如,假定一张1024*768分辨率图片,图片中有5个关注对象。从打开1张图片,到手工画框标注特定的5个对象,并完成标注检查,熟练工人完成这一过程,平均需要约45秒。
总体质量低。在拍摄阶段,很难准确拍摄出符合预期的海量照片,因此总体图片数量偏少,时间长。标注阶段主要依赖人工,而受生理因素限制,人工连续标注多张图片后,其标注速度、准确度将迅速下降,从而影响训练最终产生的训练图片数据集的总体质量也随之下降。
即:现需要一种自动创建人工智能图像识别训练素材与标注文件的方法能解决上述问题。
发明内容
本发明要解决的技术问题是提供自动创建人工智能图像识别训练素材与标注文件的方法,可以克服现有技术的不足。
本发明的技术方案是:自动创建人工智能图像识别训练素材与标注文件的方法,该方法包括以下步骤:
步骤S1: 3D模型与场景设计,利用CAD类软件数字进行三维建模,再采用3D MAX类软件进行材质制作与背景渲染,并将模型、材质及背景信息独立存放,以便组合使用;
步骤S2: 合成训练图片,工具软件读取步骤S1中的3D模型、材质及背景信息,并对3D模型、材质及背景进行模拟相机拍摄,得到不同的距离、角度、时段、场景下的拍摄照片;最后通过对所模拟得到的照片和物体材质进行不同组合,合成训练图片并输出,在输出时记录当前状态下各关注对象的模型空间位置;
步骤S3: 创建物体标注文件,根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件,所述的标注文件包含的信息包括图片所属、位置信息、每个对象及其二维平面坐标值;
步骤S4:保存标注文件。
上述步骤1中包含三维建模模块和材质制作模块及渲染模块。
上述步骤S1中,在建模时,首先对重要的零部件单独建模,最后将各零部件统一装配成整体。
上述步骤S1中,在建模时,为物体不同的零部件准备多套材质方案,每套方案对应不同的材质纹理照片,最后经过PHOTOSHOP软件处理后独立存放备用。
上述步骤S2中工具软件包括信息读取模块,读取3D模型、材质及背景信息;模拟拍摄模块,模拟不同的距离、角度、时段及场景,预览并进行拍摄;组合生成模块,对照片和物体材质进行不同组合;记录空间位置模块,记录并关注对象的模型空间位置。
上述步骤S2中,通过工具软件参数设置界面设置合成图片的距离、高度及角度,并进行观察预览、调整各项参数及范围,从而实现可以一次性生成大量不同的合成训练图片,最终创建的合成训练图片样。
步骤S3包括图片标注模块,读取并标注当前图片中各关注对象的二维平面坐标值。
上述步骤S3中,所述标注文件为XML格式。
现有技术比较,本发明自动创建人工智能图像识别训练素材与标注文件的方法,该方法通过3D模型与场景设计、模拟相机拍摄、照片和物体材质进行不同组合,解决了现有人工拍摄或航拍方式受安全、距离、角度、拍摄器材、时间、气候等方面的各种制约的问题,合成的训练图片的整体质量亦比较高,有利于人工智能的精准学习;同时,通过记录当前状态下各关注对象的模型空间位置进行标注,能节约标注时间,经过多次实验,这样的方法生成速度快,平均1秒可产生1张512*512分辨率的图片并创建对象标注文件,能满足人工智能训练所需照片的需求。
附图说明
图1是本发明的步骤示意图。
具体实施方式
实施例1. 如图1所示,自动创建人工智能图像识别训练素材与标注文件的方法,该方法包括以下步骤:
步骤S1: 3D模型与场景设计,利用CAD类软件数字进行三维建模,再采用3D MAX类软件进行材质制作与渲染,模拟各种场景、各个时段下的光影效果,并将模型、材质及背景信息独立存放,以便组合使用;所述步骤1中包含三维建模模块和材质制作模块及渲染模块。所述步骤S1中,在建模时,首先对重要的零部件单独建模,最后将各零部件统一装配成整体。以避雷器为例,至少要对均压环、绝缘瓷柱、法兰、螺栓、设备支柱、水泥基础、接地带等零部件分别建模,最终进行装配;
所述步骤S1中,在建模时,同时,为物体不同的零部件准备多套材质方案,每套方案对应不同的材质纹理照片,最后经过PHOTOSHOP软件处理后独立存放备用。因为建模环节形成的零部件只是准确表现物体的形态,没有设置材质纹理与光照参数,真实感不强。外观设计阶段可以根据实际情况,为不同的零部件准备多套材质方案备用,如:螺栓的外观可分为正常与锈蚀两大类,而正常又可分为全新、班新、陈旧等;锈蚀也可分为微锈、生锈、严重腐蚀等等。
步骤S2: 合成训练图片,工具软件读取步骤S1中的3D模型、材质及背景信息,并对3D模型、材质及背景进行模拟相机拍摄,得到不同的距离、角度、时段、场景下的拍摄照片;最后通过对所模拟得到的照片和物体材质进行不同组合,合成训练图片并输出,在输出时记录当前状态下各关注对象的模型空间位置;所述步骤S2中工具软件包括信息读取模块,读取3D模型、材质及背景信息;模拟拍摄模块,模拟不同的距离、角度、时段及场景,预览并进行拍摄;组合生成模块,对照片和物体材质进行不同组合;记录空间位置模块,记录并关注对象的模型空间位置;步骤S2中,通过工具软件参数设置界面设置合成图片的距离、高度及角度,并进行观察预览、调整各项参数及范围,从而实现可以一次性生成大量不同的合成训练图片,最终创建的合成训练图片样,在合成图片输出过程中,综合利用DirectX和OpenGL等相关技术。
步骤S3: 创建物体标注文件,根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件,所述的标注文件包含的信息包括图片所属、位置信息、每个对象及其二维平面坐标值,通过物体的多个二维平面坐标值,即可框定特定的学习区域;步骤S3包括图片标注模块,读取并标注当前图片中各关注对象的二维平面坐标值,标注文件为XML格式。
步骤S4:保存标注文件。
经过多次试验,平均1秒可产生1张512*512分辨率的图片并创建对象标注文件。支持并行计算与任务切片,可以让多台PC同时并发创建一个AI训练图片集,提高制作速度。
Claims (8)
1.自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于,该方法包括以下步骤:
步骤S1: 3D模型与场景设计,利用CAD类软件数字进行三维建模,再采用3D MAX类软件进行材质制作与背景渲染,并将三维模型、材质及背景信息独立存放,以便组合使用;
步骤S2: 合成训练图片,工具软件读取步骤S1中的3D模型、材质及背景信息,并对3D模型、材质及背景进行模拟相机拍摄,得到不同的距离、角度、时段、场景下的拍摄照片;最后通过对所模拟得到的照片和物体材质进行不同组合,合成训练图片并输出,在输出时记录当前状态下各关注对象的模型空间位置;
步骤S3: 创建物体标注文件,根据步骤S3记录的各关注对象的模型空间位置信息进行标注生成标注文件,所述的标注文件包含的信息包括图片所属、位置信息、每个对象及其二维平面坐标值;
步骤S4:保存标注文件。
2.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:所述步骤1中包含三维建模模块和材质制作模块及渲染模块。
3.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:所述步骤S1中,在建模时,首先对重要的零部件单独建模,最后将各零部件统一装配成整体。
4.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:所述步骤S1中,在建模时,为物体不同的零部件准备多套材质方案,每套方案对应不同的材质纹理照片,最后经过PHOTOSHOP软件处理后独立存放备用。
5.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:所述步骤S2中工具软件包括信息读取模块,读取3D模型、材质及背景信息;模拟拍摄模块,模拟不同的距离、角度、时段及场景,预览并进行拍摄;组合生成模块,对照片和物体材质进行不同组合;记录空间位置模块,记录并关注对象的模型空间位置。
6.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:在步骤S2中,通过工具软件参数设置界面设置合成图片的距离、高度及角度,并进行观察预览、调整各项参数及范围,从而实现可以一次性生成大量不同的合成训练图片,最终创建的合成训练图片样。
7.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:步骤S3包括图片标注模块,读取并标注当前图片中各关注对象的二维平面坐标值。
8.根据权利要求1所述的自动创建人工智能图像识别训练素材与标注文件的方法,其特征在于:步骤S3中,所述标注文件为XML格式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810325982.XA CN108563742B (zh) | 2018-04-12 | 2018-04-12 | 自动创建人工智能图像识别训练素材与标注文件的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810325982.XA CN108563742B (zh) | 2018-04-12 | 2018-04-12 | 自动创建人工智能图像识别训练素材与标注文件的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108563742A true CN108563742A (zh) | 2018-09-21 |
CN108563742B CN108563742B (zh) | 2022-02-01 |
Family
ID=63534793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810325982.XA Active CN108563742B (zh) | 2018-04-12 | 2018-04-12 | 自动创建人工智能图像识别训练素材与标注文件的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108563742B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109598772A (zh) * | 2018-11-23 | 2019-04-09 | 华南理工大学 | 基于架空输电线路单一缺陷自动标注图片数据源扩充方法 |
CN109635853A (zh) * | 2018-11-26 | 2019-04-16 | 深圳市玛尔仕文化科技有限公司 | 基于计算机图形技术自动生成人工智能训练样本的方法 |
CN109634610A (zh) * | 2018-12-29 | 2019-04-16 | 浙江口碑网络技术有限公司 | 一种界面标注数据的生成方法及装置 |
CN109871859A (zh) * | 2018-09-28 | 2019-06-11 | 北京矩视智能科技有限公司 | 一种自动生成图像训练集系统 |
CN110248093A (zh) * | 2019-06-20 | 2019-09-17 | 清华大学深圳研究生院 | 一种数据采集方法、系统和终端设备 |
CN111310859A (zh) * | 2020-03-26 | 2020-06-19 | 上海景和国际展览有限公司 | 一种用于多媒体展示中的快速人工智能数据训练系统 |
CN112712098A (zh) * | 2019-10-25 | 2021-04-27 | 北京四维图新科技股份有限公司 | 图像数据处理方法及装置 |
CN113119626A (zh) * | 2021-05-24 | 2021-07-16 | 福建天晴在线互动科技有限公司 | 一种3d立体书制作的方法及其系统 |
CN113362353A (zh) * | 2020-03-04 | 2021-09-07 | 上海分众软件技术有限公司 | 一种利用合成训练图片识别广告机边框的方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102254195A (zh) * | 2011-07-25 | 2011-11-23 | 广州市道真生物科技有限公司 | 一种训练集合生成方法 |
US20140032616A1 (en) * | 2008-08-29 | 2014-01-30 | John Nack | Creation and sharing of user annotations |
CN103678569A (zh) * | 2013-12-09 | 2014-03-26 | 北京航空航天大学 | 一种面向虚拟场景生成的视频图像素材库的构造方法 |
CN104182765A (zh) * | 2014-08-21 | 2014-12-03 | 南京大学 | 一种互联网图像驱动的三维模型最优视图自动选择方法 |
CN106169082A (zh) * | 2015-05-21 | 2016-11-30 | 三菱电机株式会社 | 训练分类器以检测目标环境图像中的对象的方法和系统 |
CN106503653A (zh) * | 2016-10-21 | 2017-03-15 | 深圳地平线机器人科技有限公司 | 区域标注方法、装置和电子设备 |
CN106846813A (zh) * | 2017-03-17 | 2017-06-13 | 西安电子科技大学 | 构建城市道路车辆图像数据库的方法 |
CN107689073A (zh) * | 2016-08-05 | 2018-02-13 | 阿里巴巴集团控股有限公司 | 图像集的生成方法、装置及图像识别模型训练方法、系统 |
CN107690672A (zh) * | 2017-07-25 | 2018-02-13 | 深圳前海达闼云端智能科技有限公司 | 训练数据生成方法、生成装置及其图像语义分割方法 |
-
2018
- 2018-04-12 CN CN201810325982.XA patent/CN108563742B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140032616A1 (en) * | 2008-08-29 | 2014-01-30 | John Nack | Creation and sharing of user annotations |
CN102254195A (zh) * | 2011-07-25 | 2011-11-23 | 广州市道真生物科技有限公司 | 一种训练集合生成方法 |
CN103678569A (zh) * | 2013-12-09 | 2014-03-26 | 北京航空航天大学 | 一种面向虚拟场景生成的视频图像素材库的构造方法 |
CN104182765A (zh) * | 2014-08-21 | 2014-12-03 | 南京大学 | 一种互联网图像驱动的三维模型最优视图自动选择方法 |
CN106169082A (zh) * | 2015-05-21 | 2016-11-30 | 三菱电机株式会社 | 训练分类器以检测目标环境图像中的对象的方法和系统 |
CN107689073A (zh) * | 2016-08-05 | 2018-02-13 | 阿里巴巴集团控股有限公司 | 图像集的生成方法、装置及图像识别模型训练方法、系统 |
CN106503653A (zh) * | 2016-10-21 | 2017-03-15 | 深圳地平线机器人科技有限公司 | 区域标注方法、装置和电子设备 |
CN106846813A (zh) * | 2017-03-17 | 2017-06-13 | 西安电子科技大学 | 构建城市道路车辆图像数据库的方法 |
CN107690672A (zh) * | 2017-07-25 | 2018-02-13 | 深圳前海达闼云端智能科技有限公司 | 训练数据生成方法、生成装置及其图像语义分割方法 |
Non-Patent Citations (2)
Title |
---|
JAKE SNELL: "Learning to generate images with perceptual similarity metrics", 《IEEE》 * |
虢齐: "基于深度学习的图像生成技术研究与应用", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871859A (zh) * | 2018-09-28 | 2019-06-11 | 北京矩视智能科技有限公司 | 一种自动生成图像训练集系统 |
CN109598772A (zh) * | 2018-11-23 | 2019-04-09 | 华南理工大学 | 基于架空输电线路单一缺陷自动标注图片数据源扩充方法 |
CN109598772B (zh) * | 2018-11-23 | 2023-01-06 | 华南理工大学 | 基于架空输电线路单一缺陷自动标注图片数据源扩充方法 |
CN109635853A (zh) * | 2018-11-26 | 2019-04-16 | 深圳市玛尔仕文化科技有限公司 | 基于计算机图形技术自动生成人工智能训练样本的方法 |
CN109634610A (zh) * | 2018-12-29 | 2019-04-16 | 浙江口碑网络技术有限公司 | 一种界面标注数据的生成方法及装置 |
CN109634610B (zh) * | 2018-12-29 | 2022-01-28 | 浙江口碑网络技术有限公司 | 一种界面标注数据的生成方法及装置 |
CN110248093B (zh) * | 2019-06-20 | 2020-09-01 | 清华大学深圳研究生院 | 一种数据采集方法、系统和终端设备 |
CN110248093A (zh) * | 2019-06-20 | 2019-09-17 | 清华大学深圳研究生院 | 一种数据采集方法、系统和终端设备 |
CN112712098A (zh) * | 2019-10-25 | 2021-04-27 | 北京四维图新科技股份有限公司 | 图像数据处理方法及装置 |
CN113362353A (zh) * | 2020-03-04 | 2021-09-07 | 上海分众软件技术有限公司 | 一种利用合成训练图片识别广告机边框的方法 |
CN111310859A (zh) * | 2020-03-26 | 2020-06-19 | 上海景和国际展览有限公司 | 一种用于多媒体展示中的快速人工智能数据训练系统 |
CN113119626A (zh) * | 2021-05-24 | 2021-07-16 | 福建天晴在线互动科技有限公司 | 一种3d立体书制作的方法及其系统 |
CN113119626B (zh) * | 2021-05-24 | 2022-04-08 | 福建天晴在线互动科技有限公司 | 一种3d立体书制作的方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108563742B (zh) | 2022-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108563742A (zh) | 自动创建人工智能图像识别训练素材与标注文件的方法 | |
Shlyakhter et al. | Reconstructing 3D tree models from instrumented photographs | |
CN109887020A (zh) | 一种植株器官分离方法及系统 | |
CN109887084A (zh) | 一种利用浸入式虚拟现实技术用于城市规划的方法 | |
CN106873550A (zh) | 模拟装置以及模拟方法 | |
CN109086798A (zh) | 一种数据标注方法和标注装置 | |
CN110850818A (zh) | 一种实现断路器自动化装配车间的数字孪生建模的方法 | |
CN113297701B (zh) | 多种类工业零件堆叠场景的仿真数据集生成方法及装置 | |
CN103745497A (zh) | 植物生长建模方法和系统 | |
CN106097433A (zh) | 物体工业与影像模型的叠加方法及系统 | |
CN112017227A (zh) | 点云融合生成的地形模型与潮汐数据混合可视化的方法 | |
KR20180082042A (ko) | 3d 게임엔진기반 머시니마 제작방법 | |
CN109671161A (zh) | 沉浸式兵马俑烧造过程虚拟体验系统 | |
CN110163936A (zh) | 应用于工程项目中的三维动画与实拍视频合成技术 | |
CN114170377A (zh) | 一种基于bim的历史建筑特色构件族库构建方法及系统 | |
JP2016003427A (ja) | かつらベースの制作方法およびシステム | |
CN105279320B (zh) | 一种生成fdtd网格的方法 | |
CN117610253A (zh) | 基于风景园林信息模型的植物虚拟仿真模拟方法 | |
CN118365807B (zh) | 一种合成数据生成方法、装置、介质及设备 | |
Goh et al. | Synthetic Data Generation for Fresh Fruit Bunch Ripeness Classification | |
Domiter et al. | Surface reconstruction algorithms in cultural heritage digital representation | |
Jiang et al. | A Mars Multi-terrain Simulator Using a Modular Terrain Construction Framework | |
Zhao et al. | Research on automatic 3D modeling of street lamps based on 3DMax | |
CN117058279A (zh) | 一种应用大数据分析技术的动画建模管理系统及方法 | |
Song et al. | Research on 3D Image Simulation of Landscape Design Rationality Based on Virtual Reality |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |