CN114359658A - 训练数据的生成方法、装置、终端设备及存储介质 - Google Patents
训练数据的生成方法、装置、终端设备及存储介质 Download PDFInfo
- Publication number
- CN114359658A CN114359658A CN202111535100.0A CN202111535100A CN114359658A CN 114359658 A CN114359658 A CN 114359658A CN 202111535100 A CN202111535100 A CN 202111535100A CN 114359658 A CN114359658 A CN 114359658A
- Authority
- CN
- China
- Prior art keywords
- virtual
- training data
- target
- image
- virtual image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例适用于人工智能技术领域,提供了一种训练数据的生成方法、装置、终端设备及存储介质,该方法包括:在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;虚拟目标由虚拟环境对配置文件进行配置处理生成;根据配置文件的配置信息,获取虚拟图像的标注类别;基于虚拟图像和标注类别,生成虚拟目标的训练数据。采用上述方法可以在采集用于对真实目标进行训练的训练数据时,降低时间成本和人力成本。
Description
技术领域
本申请属于人工智能技术领域,尤其涉及一种训练数据的生成方法、装置、终端设备及存储介质。
背景技术
目前,在进行人工智能模型识别的训练过程中,需要从真实环境中采集包含真实目标的图像,形成训练样本集进行模型训练。通常,该训练样本集需要包括真实目标在真实环境中的多种角度、形状或标签的图像。
目前,采用上述方式需要从真实环境中采集大量的图像,并通过人工对采集的图像进行标注,以得到训练数据。然而,在真实环境中,采集多种角度或形状下的真实目标的图像,通常需要实地考察,需要大量的时间成本和人力成本完成。
发明内容
本申请实施例提供了一种训练数据的生成方法、装置、终端设备及存储介质,可以解决在采集对真实目标进行训练的训练数据时,时间成本和人力成本均非常高的问题。
第一方面,本申请实施例提供了一种训练数据的生成方法,该方法包括:
在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;虚拟目标由虚拟环境对配置文件进行配置处理生成;
根据配置文件的配置信息,获取虚拟图像的标注类别;
基于虚拟图像和标注类别,生成虚拟目标的训练数据。
第二方面,本申请实施例提供了一种训练数据的生成装置,该装置包括:
虚拟目标生成模块,用于在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;虚拟目标由虚拟环境对配置文件进行配置处理生成;
获取模块,用于根据配置文件的配置信息,获取虚拟图像的标注类别;
训练数据生成模块,用于基于虚拟图像和标注类别,生成虚拟目标的训练数据。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述第一方面的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上述第一方面的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面的方法。
本申请实施例与现有技术相比存在的有益效果是:通过在虚拟环境中构建虚拟目标,以模拟真实目标在真实环境下的形状、大小、颜色等信息,并识别出该虚拟目标在不同视角下的虚拟图像,以代替真实目标在真实环境下被拍摄的图像进行处理。以此,终端设备可以降低工作人员去真实环境下采集该真实目标的图像所需花费的时间成本和人力成本。并且,根据配置信息中的标注类别,在虚拟图像具有多个时,终端设备自动化的为每个虚拟图像均进行标注,提升虚拟图像被标注的效率,以及训练数据的生成效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种训练数据的生成方法的实现流程图;
图2是本申请另一实施例提供的一种训练数据的生成方法的实现流程图;
图3是本申请一实施例提供的一种训练数据的生成方法中虚拟环境的应用场景示意图;
图4是本申请一实施例提供的一种训练数据的生成方法的S101的一种实现方式示意图;
图5是本申请一实施例提供的一种训练数据的生成方法中虚拟相机在虚拟环境中的应用场景示意图;
图6是本申请一实施例提供的一种训练数据的生成方法中虚拟相机的拍摄参数的应用场景示意图;
图7是本申请一实施例提供的一种训练数据的生成方法的S103的一种实现方式示意图;
图8是本申请又一实施例提供的一种训练数据的生成方法的实现流程图;
图9是本申请一实施例提供的一种训练数据的生成装置的结构示意图;
图10是本申请一实施例提供的一种终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集的存在或添加。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
本申请实施例提供的训练数据的生成方法可以应用于平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)等终端设备上,本申请实施例对终端设备的具体类型不作任何限制。
其中,需要说明的是,上述终端设备中需预先安装有和/或可以控制用于生成虚拟环境的第三方引擎。其中,第三方引擎包括但不限于虚幻引擎(Unreal Engine)引擎,三维创作引擎(Unity3D),或者其他自研引擎,对此不作限定。
示例性的,该第三方引擎可以为游戏引擎,其为已编写好的可编辑电脑游戏系统,或者一些交互式实时图像应用程序的核心组件。这些系统或核心组件为游戏设计者提供各种编写游戏所需的各种工具,其目的在于让游戏设计者能容易且快速地做出游戏程序,而不用由零开始。其中,游戏引擎大部分都支持多种操作系统平台,如Linux、Windows等操作系统平台。
通常的,大多数游戏引擎通常包含以下部分:渲染引擎(即“渲染器”,含二维图像引擎和三维图像引擎)、物理引擎、碰撞检测系统、音效、脚本引擎、电脑动画、人工智能、网络引擎以及场景管理等,对此不作限定。
请参阅图1,图1示出了本申请实施例提供的一种训练数据的生成方法的实现流程图,该方法包括如下步骤:
S101、终端设备在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;虚拟目标由虚拟环境对配置文件进行配置处理生成。
在一实施例中,上述虚拟环境为终端设备利用第三方引擎生成的虚拟场景。其中,虚拟环境包括但不限于虚拟城市、虚拟天空等环境。需要说明的是,上述虚拟环境可以由工作人员根据真实环境的颜色、形状进行构建,也可以由工作人员将其构建为符合预设布局的环境,对此不作限定。
在一实施例中,上述虚拟目标为处于虚拟场景内的物体,其可以为人物、动物、植物或其他机器人等具有形态的物体或者设备。其中,上述虚拟目标为虚拟环境对配置文件进行加载并处理后生成。
在一实施例中,终端设备对虚拟目标进行识别生成虚拟图像时,虚拟图像可以为显示有虚拟目标的图像;或者,可以为同时显示部分或整体的虚拟场景的虚拟图像。即此时该虚拟图像中包含有虚拟目标以及虚拟场景。
需要说明的是,在构建虚拟目标时,虚拟目标通常以三维的形式存在于虚拟环境中,而生成的虚拟图像通常为二维图像。其中,将三维图像渲染成二维图像的技术为已有的成熟技术,对此不作说明。
需要补充的是,对于一个虚拟目标,终端设备可以识别多个视角下的虚拟目标,以生成多个虚拟图像。可以理解的是,用于训练模型的训练数据通常需要大量包含虚拟目标的虚拟图像,一张虚拟图像并不足以训练模型。若使用少量的虚拟图像训练模型,得到的模型将产生欠拟合的效果,模型识别的准确率较低。因此,终端设备可以识别多个视角下的虚拟目标,生成虚拟图像。
在一具体实施例中,参照图2,终端设备可以通过如下步骤S11-S12生成虚拟目标,具体的:
S11、终端设备获取包含用于训练虚拟目标的配置文件。
S12、终端设备使用第三方引擎对配置文件进行处理,生成虚拟目标。
在一实施例中,上述配置文件可以由工作人员预先根据需要被训练的真实目标的信息进行配置,以使生成的虚拟目标与真实目标的颜色、形状相同或相似。或者,可以为工作人员直接利用虚拟环境中的渲染引擎生成虚拟目标,对此不作限定。
另外,需要补充的是,对于通过上述方式生成的虚拟目标,还可以由工作人员借用虚拟环境再次对其进行更改,以使更改后的虚拟目标也接近于真实目标,或符合工作人员要求的虚拟目标。
在一实施例中,在加载配置文件时,可以由虚拟环境通过调用预设的应用程序接口(Application Programming Interface,API)进行加载,或者由虚拟环境接收工作人员拖拽的配置文件进行加载。其中,利用虚拟环境对配置文件进行处理,以生成虚拟图像的过程为已有的成熟技术,对此不作说明。
在一实施例中,上述第三方引擎具体已在上述内容进行解释,对此不再进行说明。
示例性的,参照图3,图3为虚拟环境的应用场景示意图。其中,图3中显示的虚拟目标为飞行的鸟类动物,而除鸟类的其他区域均可认为是虚拟环境。
在一具体实施例中,虚拟环境中通常包括用于对虚拟目标进行拍摄的虚拟相机;参照图4,终端设备可以通过如下子步骤S1011-S1012对虚拟目标进行识别以生成虚拟目标,具体的:
S1011、终端设备每隔预设时长,根据预先在虚拟相机中设定的多种拍摄参数,依次变换虚拟相机拍摄虚拟目标时的视角,生成虚拟图像。或者,
S1012、终端设备每隔预设时长,随机变换虚拟相机拍摄虚拟目标时的视角,生成虚拟图像。
在一实施例中,上述虚拟相机(Virtual Camer)为第三方引擎中的核心组件,其具有对虚拟目标进行拍摄的功能,且该功能与传统意义上的物理相机对真实目标进行拍摄的功能相同或相似。即虚拟相机可以将当前视角下所拍摄到的虚拟目标输出成一张二维的虚拟图像。
可以理解的是,虚拟相机与物理相机的拍摄对象不同。具体的,物理相机机拍摄的是为实景人物或实真实场景,虚拟相机拍摄的是建立在虚拟环境下的虚拟目标。通常,虚拟相机在虚拟环境中以图标的形式进行显示,但是工作人员可以设置该虚拟相机的拍摄参数,以得到在虚拟环境中具有不同视角或拍摄焦距的虚拟相机。其中,上述拍摄参数可以包括:Pitch(虚拟相机相对于虚拟目标的俯仰角)、Position(虚拟相机在虚拟环境中的位置)。例如,如图5以及图6所示,其中,图5为虚拟相机在虚拟环境中的应用场景,图6为虚拟相机的拍摄参数的一种示例。其中,图5中的长方体可以认为是虚拟相机在虚拟环境中的位置。图6中每行的X、Y、Z分别对应的数值为虚拟相机在虚拟环境中的位置参数。
在一实施例中,上述每隔预设时长可以由工作人员根据实际情况进行设置,对此不作限定。需要说明的是,终端设备可以通过事件的方式变换虚拟相机拍摄虚拟目标时的视角。其中,事件的方式通常为通过某种动作(单击、双击、设置时间等)触发后,对所需执行的事情进行处理的方式。示例性的,终端设备可以对虚拟相机进行如下设置,以增加变换拍摄虚拟目标的视角的事件:
object.addEventListener(event,function,useCapture);
其中,event表示变换拍摄虚拟目标的视角的事件,function表示设置时间到达时要执行的功能函数,useCapture表示事件捕获。
在一实施例中,图5中的长方体可以认为是虚拟相机在虚拟环境中的位置,而图5中的多个长方体可以认为是虚拟相机在每次变换后在虚拟环境中的位置,以及拍摄虚拟目标时的视角。
在一实施例中,上述拍摄参数还包括虚拟相机的rotation(旋转)和scale(比例)等参数,用于对虚拟相机的拍摄方向以及拍摄范围进行变换。可以理解的是,根据拍摄方向以及虚拟相机相对于虚拟目标的俯仰角,可以确定虚拟相机拍摄虚拟目标时的视角。
在一实施例中,上述随机变换虚拟相机拍摄虚拟目标的视角可以通过:伪随机算法,或可预测生成式分布算法进行变换,对此不作限定。其中,伪随机算法,以及可预测生成式分布算法均可以根据当前时刻下虚拟相机的拍摄参数进行处理,以预测虚拟相机在下一时刻下的拍摄参数。
在本实施例中,采用每隔预设时长变换虚拟相机拍摄虚拟目标时的视角,可以使终端设备获取该虚拟目标的多种不同视角下的虚拟图像,以便在利用虚拟图像进行模型训练时,可以使模型提取出该虚拟目标的多种特征进行训练,提高训练后的模型对虚拟目标进行识别的准确率。
在另一实施例中,终端设备还可以将事件方式以及随机方式进行结合,以获取多个视角下的虚拟图像。可以理解的是,因事件的方式由工作人员进行设定,因此采用事件的方式可以使虚拟相机拍摄到特定视角下的虚拟图像。然而,单独使用特定视角下的虚拟图像可能会使训练后的模型产生欠拟合的效果。基于此,在事件方式的基础上,终端设备还可以结合随机方式获取不同视角下的虚拟图像,以使模型可以提取出虚拟目标的多种特征进行训练处理,提高训练后的模型对虚拟目标进行识别的准确率。可以理解的是,若只单独采用随机方式获取虚拟图像,则获取到的虚拟图像可能不包含最能体现出虚拟目标的特征信息的图像。
需要说明的是,因虚拟相机可以将当前视角下所拍摄到的虚拟目标输出成一张二维的虚拟图像。因此,该虚拟图像中可能包含有部分虚拟环境。即将虚拟环境作为背景拍摄至虚拟图像中。然而,训练数据仅为针对虚拟目标进行识别的数据,基于此,在拍摄虚拟图像时,终端设备还可以通过虚拟相机提取以虚拟目标的边缘为界限生成的虚拟图像。以此,可以避免模型在对虚拟图像进行特征处理的过程中,还需对虚拟图像中的其他背景进行处理。进而,减少模型对虚拟图像的处理时间,以及避免对虚拟图像进行特征处理后得到的特征信息掺杂了其他背景的特征信息,以对模型的训练过程产生干扰。
另外,可以理解的是,因训练识别模型通常需要真实目标在不同的真实环境下(雨、雪、风、霜、昼夜变化、光影变换等)的图像,因此,对于真实环境下的真实目标,若人工去进行图像采集,则需要花费大量的时间成本和人力成本。而在本实施例中,只需根据上述真实环境的环境因素设定出虚拟环境,而后在该虚拟环境中构建出虚拟目标,以获取虚拟图像即可。
需要补充的是,因虚拟目标在虚拟环境中存在时,也会受到虚拟环境中的环境因素对其造成的影响。例如,光照或背光等影响。因此,对于受到该影响后的虚拟目标,虽然虚拟相机仅提取以虚拟目标的边缘为界限生成的虚拟图像,但是该方式生成的虚拟图像却更接近于在真实环境下的真实目标。
S102、终端设备根据配置文件的配置信息,获取虚拟图像的标注类别。
在一实施例中,上述配置信息为对配置文件的描述信息,其包括但不限于配置文件的名称、标注类别等信息。示例性的,以配置信息为CSV文件格式存储在终端设备为例。
Id,assetPath,label1,label2,...,
bird_01,/Content/Organism/bird_01.fbx,Bird,Organism,...,
其中,Id为配置文件的名称,具体为bird_01,可以用于从多个配置信息中确定当前配置文件的配置信息;assetPath为对应的配置文件在终端设备中的存储路径;label1表示为该配置文件的第一种标注类别,Bird为具体的第一种标注类别;label2表示为该配置文件的第二种标注类别,Organism为具体的第二种标注类别。
基于此,在获取到配置文件的配置信息后,终端设备可以直接从配置信息中确定该虚拟图像的标注类别。可以理解的是,在配置信息中记载的标注类别具有多种时,可以认为该虚拟图像能够分别用于对多种标注类别的识别模型进行训练。
S103、终端设备基于虚拟图像和标注类别,生成虚拟目标的训练数据。
在一实施例中,生成虚拟目标的训练数据时,可以将该标注类别作为该虚拟图像的真实标注类别参与模型训练。需要补充的是,基于上述S102中的解释可知,因配置信息具有多种标注类别,因此,生成的虚拟目标的训练数据也可以作为多种训练数据,且每种训练数据能够分别用于训练一种识别模型。
具体的,生成的训练数据可以分别为虚拟图像+label1,虚拟图像+label2,....,等多种,对此不作限定。
可以理解的是,在虚拟图像的数量具有多个时,终端设备也只需根据配置信息中的标注类别,自动化的为每个虚拟图像进行标注,提升虚拟图像被标注的效率,以及训练数据的生成效率。
在本实施例中,通过在虚拟环境中构建虚拟目标,以模拟真实目标在真实环境下的形状、大小、颜色等信息,并识别出该虚拟目标在不同视角下的虚拟图像,以代替真实目标在真实环境下被拍摄的图像进行处理。以此,终端设备可以降低工作人员去真实环境下采集该真实目标的图像所需花费的时间成本和人力成本。并且,根据配置信息中的标注类别,在虚拟图像具有多个时,终端设备自动化的为每个虚拟图像均进行标注,提升虚拟图像被标注的效率,以及训练数据的生成效率。
在一具体实施例中,在一个虚拟目标生成多个虚拟图像时,参照图7,终端设备可以根据如下子步骤S1031-S1032对每个虚拟图像进行标注,以生成虚拟目标的训练数据:
S1031、终端设备将由同一个虚拟目标对应的多个虚拟图像组成虚拟图像集。
S1032、若配置信息中包含多个标注类别,则对终端设备虚拟图像集进行标注,生成多种训练数据;其中,每种训练数据分别用于训练一种标注类别对应的识别模型。
在一实施例中,基于上述S101中的解释可知,虚拟相机可以拍摄多个视角下的虚拟图像,因此,对于一个虚拟目标,其可以同时生成多个虚拟图像。基于此,终端设备可以将该多个虚拟图像组成一个虚拟图像集。之后,对于配置信息中的每个标注类别,均可以分别对虚拟图像集进行标注,以此生成多种训练数据。进而,通过对一种虚拟目标进行上述方式处理,终端设备可以同时得到用于训练多种识别模型分别对应的训练数据,提高对虚拟目标的利用率,以及训练数据的生成效率。
可以理解的是,每种训练数据可以用于训练一种标注类别对应的识别模型,因此,对于生成的多种训练数据,终端设备可以同时训练多种类型的识别模型。并且,若训练后的任一识别模型不合格,则可以对影响虚拟目标的影响因素进行更改,重新生成虚拟图像集,以得到训练数据。
此时,需要说明的是,重新生成的虚拟图像也可以再次采用多种标注类别分别进行标注,再次得到多种训练数据。因此,在同时具有多种识别模型训练不合格时,也只需重新生成一次虚拟图像集即可。
在另一实施例中,训练数据可以分为训练集和测试集,在得到训练数据之后,参照图8,终端设备可以对训练数据进行如下步骤S131-S135处理,详述如下:
S131、终端设备根据训练集对预训练模型进行模型训练,得到初始模型。
在一实施例中,上述训练数据可以随机分为训练集和测试集,其中,训练集用于对预训练模型进行训练,得到训练后的初始模型。而后,采用测试集对初始模型进行评估,以确定初始模型对图像识别的准确率。通常,若准确率大于预设值时,即可认为该初始模型为最终的目标模型。
需要补充的是,因目标模型在训练过程中需要使用大量的数据,因此,分配的训练集所占训练数据的比例通常大于测试集的比例。
S132、终端设备采用初始模型对测试集中的每个虚拟图像进行识别,得到对测试集进行识别的第一准确率。
S133、若第一准确率大于第一预设值,则终端设备根据训练数据的标注类别,采用与标注类别一致的真实图像集对初始模型进行验证。
S134、若对真实图像集进行识别的第二准确率大于第二预设值,则终端设备将初始模型确定为目标模型。
在一实施例中,上述第一预设值以及第二预设值可以由工作人员根据实际情况进行设置,对此不作限定。
在本实施例中,需要说明的是,在第一准确率大于第一预设值时,终端设备还需额外采用验证集以对初始模型进行进一步的评估。
具体的,验证集为在真实环境下对真实目标进行图像采集后得到的图像集合,其为本实施例中的真实图像集。需要说明的是,在真实环境下采集真实目标的真实图像通常难度较大,并且最终训练的目标模型所应用的实际场景也为对真实环境下的真实目标进行识别。因此,该真实图像的数量虽然通常较少,但其更适用于对初始模型进行二次验证。
S135、若第一准确率小于或等于第一预设值,或第二准确率小于或等于第二预设值,则终端设备在虚拟环境中调整虚拟目标的影响因素,生成新的虚拟图像。
在一实施例中,在第一准确率小于或等于第一预设值,或第二准确率小于或等于第二预设值时,可以认为此时的初始模型未符合要求。即应用于实际场景时,对真实目标进行识别的准确率较低。因此,终端设备还需在虚拟环境中调整虚拟目标的影响因素,以重新对虚拟目标进行拍摄,生成新的虚拟图像。
在一实施例中,上述影响因素包括但不限于:阳光、背光、雨、雪、风、霜、昼夜变化、光影变换等因素。在虚拟环境中对该影响因素进行调整可以为通过虚拟环境中设置参数进行实现。示例性的,与时间相关的影响因素,其设置参数通常为time,与天气类型相关设置参数其通常为:rain、snow、wind等参数,对此不作限定。
在另一具体实施例中,若第一准确率小于或等于第一预设值,或第二准确率小于或等于第二预设值,则终端设备需要重新生成新的虚拟图像以再次得到新的训练数据。此时,终端设备可以将该新的训练数据与上一次的训练数据进行合并,得到合并后的训练数据。之后,对合并后的训练数据再次进行上述S131-S135步骤处理,直至得到目标模型。
需要补充的是,在将合并后的训练数据重新分为训练集以及测试集后,可以将真实图像集中的部分真实图像合并至训练集中,以此在基于训练集对预训练模型进行训练时,可以使真实目标的信息带入至初始模型中,使得训练后的初始模型可以提高对测试集的虚拟图像,以及真实图像集的真实图像的识别准确率。此时,对于真实图像集中剩余的真实图像,可以用于对新的初始模型进行验证,以确定该新的初始模型是否为目标模型。
请参阅图9,图9是本申请实施例提供的一种训练数据的生成装置的结构框图。本实施例中训练数据的生成装置包括的各模块用于执行图1、图2、图4、图7以及图8对应的实施例中的各步骤。具体请参阅图1、图2、图4、图7以及图8以及图1、图2、图4、图7以及图8所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图9,训练数据的生成装置900可以包括:虚拟目标生成模块910、获取模块920以及训练数据生成模块930,其中:
虚拟目标生成模块910,用于在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;虚拟目标由虚拟环境对配置文件进行配置处理生成;
获取模块920,用于根据配置文件的配置信息,获取虚拟图像的标注类别;
训练数据生成模块930,用于基于虚拟图像和标注类别,生成虚拟目标的训练数据。
在一实施例中,训练数据的生成装置900还包括:
配置文件获取模块,用于获取包含用于训练虚拟目标的配置文件。
处理模块,用于使用第三方引擎对配置文件进行处理,生成虚拟目标。
在一实施例中,虚拟环境包括用于对虚拟目标进行拍摄的虚拟相机;虚拟目标生成模块910还用于:
每隔预设时长,根据预先在虚拟相机中设定的多种拍摄参数,依次变换虚拟相机拍摄虚拟目标时的视角,生成虚拟图像;或者,每隔预设时长,随机变换虚拟相机拍摄虚拟目标时的视角,生成虚拟图像。
在一实施例中,虚拟目标生成模块910还用于:
通过虚拟相机提取以虚拟目标的边缘为界限生成的虚拟图像。
在一实施例中,训练数据生成模块930还用于:
将由同一个虚拟目标对应的多个虚拟图像组成虚拟图像集;若配置信息中包含多个标注类别,则对虚拟图像集进行标注,生成多种训练数据;其中,每种训练数据分别用于训练一种标注类别对应的识别模型。
在一实施例中,训练数据包括训练集和测试集;训练数据的生成装置900还包括:
初始模块训练模块,用于根据训练集对预训练模型进行模型训练,得到初始模型。
虚拟图像识别模块,用于采用初始模型对测试集中的每个虚拟图像进行识别,得到对测试集进行识别的第一准确率;
验证模块,用于若第一准确率大于第一预设值,则根据训练数据的标注类别,采用与标注类别一致的真实图像集对初始模型进行验证;
确定模块,用于若对真实图像集进行识别的第二准确率大于第二预设值,则将初始模型确定为目标模型。
在一实施例中,训练数据的生成装置900还包括:
影响因素调整模块,用于若第一准确率小于或等于第一预设值,或第二准确率小于或等于第二预设值,则在虚拟环境中调整虚拟目标的影响因素,生成新的虚拟图像。
当理解的是,图9示出的训练数据的生成装置的结构框图中,各模块用于执行图1、图2、图4、图7以及图8对应的实施例中的各步骤,而对于图1、图2、图4、图7以及图8对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1、图2、图4、图7以及图8以及图1、图2、图4、图7以及图8所对应的实施例中的相关描述,此处不再赘述。
图10是本申请一实施例提供的一种终端设备的结构框图。如图10所示,该实施例的终端设备1000包括:处理器1010、存储器1020以及存储在存储器1020中并可在处理器1010运行的计算机程序1030,例如训练数据的生成方法的程序。处理器1010执行计算机程序1030时实现上述各个训练数据的生成方法各实施例中的步骤,例如图1所示的S101至S104。或者,处理器1010执行计算机程序1030时实现上述图9对应的实施例中各模块的功能,例如,图9所示的模块910至930的功能,具体请参阅图9对应的实施例中的相关描述。
示例性的,计算机程序1030可以被分割成一个或多个模块,一个或者多个模块被存储在存储器1020中,并由处理器1010执行,以实现本申请实施例提供的训练数据的生成方法。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序1030在终端设备1000中的执行过程。例如,计算机程序1030可以实现本申请实施例提供的训练数据的生成方法。
终端设备1000可包括,但不仅限于,处理器1010、存储器1020。本领域技术人员可以理解,图10仅仅是终端设备1000的示例,并不构成对终端设备1000的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器1010可以是中央处理单元,还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器1020可以是终端设备1000的内部存储单元,例如终端设备1000的硬盘或内存。存储器1020也可以是终端设备1000的外部存储设备,例如终端设备1000上配备的插接式硬盘,智能存储卡,闪存卡等。进一步地,存储器1020还可以既包括终端设备1000的内部存储单元也包括外部存储设备。
本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述各个实施例中的训练数据的生成方法。
本申请实施例提供了一种计算机可读存储介质,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述各个实施例中的训练数据的生成方法。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述各个实施例中的训练数据的生成方法。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种训练数据的生成方法,其特征在于,包括:
在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;所述虚拟目标由所述虚拟环境对配置文件进行配置处理生成;
根据所述配置文件的配置信息,获取所述虚拟图像的标注类别;
基于所述虚拟图像和所述标注类别,生成所述虚拟目标的训练数据。
2.根据权利要求1所述的训练数据的生成方法,其特征在于,在所述在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像之前,还包括:
获取包含用于训练所述虚拟目标的配置文件;
使用第三方引擎对所述配置文件进行处理,生成所述虚拟目标。
3.根据权利要求1或2所述的训练数据的生成方法,其特征在于,所述虚拟环境包括用于对所述虚拟目标进行拍摄的虚拟相机;
所述在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像,包括:
每隔预设时长,根据预先在所述虚拟相机中设定的多种拍摄参数,依次变换所述虚拟相机拍摄所述虚拟目标时的视角,生成所述虚拟图像;或者,
每隔预设时长,随机变换所述虚拟相机拍摄所述虚拟目标时的视角,生成所述虚拟图像。
4.根据权利要求3所述的训练数据的生成方法,其特征在于,所述变换所述虚拟相机拍摄所述虚拟目标时的视角,生成所述虚拟图像,包括:
通过所述虚拟相机提取以所述虚拟目标的边缘为界限生成的虚拟图像。
5.根据权利要求2所述的训练数据的生成方法,其特征在于,所述基于所述虚拟图像和所述标注类别,生成所述虚拟目标的训练数据,包括:
将由同一个所述虚拟目标对应的多个所述虚拟图像组成虚拟图像集;
若所述配置信息中包含多个标注类别,则对所述虚拟图像集进行标注,生成多种所述训练数据;其中,每种所述训练数据分别用于训练一种标注类别对应的识别模型。
6.根据权利要求1或2或4或5所述的训练数据的生成方法,其特征在于,所述训练数据包括训练集和测试集;
在所述基于所述虚拟图像和所述标注类别,生成所述虚拟目标的训练数据之后,还包括:
根据所述训练集对预训练模型进行模型训练,得到初始模型;
采用所述初始模型对所述测试集中的每个所述虚拟图像进行识别,得到对所述测试集进行识别的第一准确率;
若所述第一准确率大于第一预设值,则根据所述训练数据的标注类别,采用与所述标注类别一致的真实图像集对所述初始模型进行验证;
若对所述真实图像集进行识别的第二准确率大于第二预设值,则将所述初始模型确定为目标模型。
7.根据权利要求6所述的训练数据的生成方法,其特征在于,在所述根据所述训练集对模型进行训练,得到初始模型之后,还包括:
若所述第一准确率小于或等于第一预设值,或所述第二准确率小于或等于第二预设值,则在所述虚拟环境中调整所述虚拟目标的影响因素,生成新的虚拟图像。
8.一种训练数据的生成装置,其特征在于,包括:
虚拟目标生成模块,用于在虚拟环境中识别至少一个视角下的虚拟目标,生成虚拟图像;所述虚拟目标由所述虚拟环境对配置文件进行配置处理生成;
获取模块,用于根据所述配置文件的配置信息,获取所述虚拟图像的标注类别;
训练数据生成模块,用于基于所述虚拟图像和所述标注类别,生成所述虚拟目标的训练数据。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111535100.0A CN114359658A (zh) | 2021-12-15 | 2021-12-15 | 训练数据的生成方法、装置、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111535100.0A CN114359658A (zh) | 2021-12-15 | 2021-12-15 | 训练数据的生成方法、装置、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114359658A true CN114359658A (zh) | 2022-04-15 |
Family
ID=81099319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111535100.0A Pending CN114359658A (zh) | 2021-12-15 | 2021-12-15 | 训练数据的生成方法、装置、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114359658A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782417A (zh) * | 2022-06-16 | 2022-07-22 | 浙江大学 | 基于边缘强化图像分割的风机数字孪生特征实时检测方法 |
CN115456162A (zh) * | 2022-08-12 | 2022-12-09 | 星络家居云物联科技有限公司 | 基于虚拟交互的用户行为习惯学习模型的训练方法及装置 |
CN116071621A (zh) * | 2023-03-15 | 2023-05-05 | 中汽智联技术有限公司 | 针对感知算法的训练样本生成和验证方法、设备和介质 |
CN116596923A (zh) * | 2023-07-17 | 2023-08-15 | 天津市蓟州区民力新能源科技有限公司 | 基于边缘检测的园林植物识别方法及系统 |
-
2021
- 2021-12-15 CN CN202111535100.0A patent/CN114359658A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782417A (zh) * | 2022-06-16 | 2022-07-22 | 浙江大学 | 基于边缘强化图像分割的风机数字孪生特征实时检测方法 |
CN115456162A (zh) * | 2022-08-12 | 2022-12-09 | 星络家居云物联科技有限公司 | 基于虚拟交互的用户行为习惯学习模型的训练方法及装置 |
CN116071621A (zh) * | 2023-03-15 | 2023-05-05 | 中汽智联技术有限公司 | 针对感知算法的训练样本生成和验证方法、设备和介质 |
CN116596923A (zh) * | 2023-07-17 | 2023-08-15 | 天津市蓟州区民力新能源科技有限公司 | 基于边缘检测的园林植物识别方法及系统 |
CN116596923B (zh) * | 2023-07-17 | 2023-09-12 | 天津市蓟州区民力新能源科技有限公司 | 基于边缘检测的园林植物识别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114359658A (zh) | 训练数据的生成方法、装置、终端设备及存储介质 | |
JP6926335B2 (ja) | 深層学習における回転可変物体検出 | |
US20220383649A1 (en) | System and method for facilitating graphic-recognition training of a recognition model | |
CN109726678B (zh) | 一种车牌识别的方法及相关装置 | |
CN112348885A (zh) | 视觉特征库的构建方法、视觉定位方法、装置和存储介质 | |
CN110740545B (zh) | 一种现场光斑排列方法及系统、存储介质及灯具控制设备 | |
CN115082966B (zh) | 行人重识别模型训练方法、行人重识别方法、装置和设备 | |
CN113393487A (zh) | 运动目标检测方法、装置、电子设备及介质 | |
CN114429208A (zh) | 基于残差结构剪枝的模型压缩方法、装置、设备及介质 | |
CN111062350A (zh) | 基于人工智能烟火识别算法 | |
CN112686314B (zh) | 基于远距离拍摄场景的目标检测方法、装置及存储介质 | |
CN114092670A (zh) | 一种虚拟现实显示方法、设备以及存储介质 | |
CN113065533A (zh) | 一种特征提取模型生成方法、装置、电子设备和存储介质 | |
CN111598005A (zh) | 动捕数据处理方法、装置、电子设备及计算机存储介质 | |
CN116664694A (zh) | 图像亮度获取模型的训练方法、图像获取方法及移动终端 | |
CN110569707A (zh) | 一种身份识别方法和电子设备 | |
CN115641512A (zh) | 一种卫星遥感影像道路识别方法、装置、设备及介质 | |
CN115965934A (zh) | 一种停车位检测方法及装置 | |
CN114898447A (zh) | 一种基于自注意力机制的个性化注视点检测方法及装置 | |
CN116546304A (zh) | 一种参数配置方法、装置、设备、存储介质及产品 | |
CN111062479B (zh) | 基于神经网络的模型快速升级方法及装置 | |
Cohen et al. | Machine vision algorithms for robust animal species identification | |
CN110490950B (zh) | 图像样本生成方法、装置、计算机设备和存储介质 | |
CN112395208A (zh) | Ai识别装置的自动测试方法、装置、设备及存储介质 | |
WO2020192262A1 (zh) | 一种实物图像生成方法及装置、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |