CN112396569B - 一种对图像进行数据增强的方法 - Google Patents
一种对图像进行数据增强的方法 Download PDFInfo
- Publication number
- CN112396569B CN112396569B CN202011404137.5A CN202011404137A CN112396569B CN 112396569 B CN112396569 B CN 112396569B CN 202011404137 A CN202011404137 A CN 202011404137A CN 112396569 B CN112396569 B CN 112396569B
- Authority
- CN
- China
- Prior art keywords
- transformation
- point set
- image
- perspective transformation
- target image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000002708 enhancing effect Effects 0.000 title abstract description 8
- 230000009466 transformation Effects 0.000 claims abstract description 293
- 239000011159 matrix material Substances 0.000 claims abstract description 71
- 238000012549 training Methods 0.000 claims description 42
- 238000004891 communication Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000002093 peripheral effect Effects 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000008859 change Effects 0.000 abstract description 11
- 238000002372 labelling Methods 0.000 description 15
- 238000010801 machine learning Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000011426 transformation method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Abstract
本发明公开了一种对图像进行数据增强的方法,适于在计算设备中执行,方法包括:在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点;在目标图像中确定透视变换矩阵;根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集。本发明还一并公开了一种对图像进行数据增强的装置,计算设备和计算机可读存储介质。
Description
技术领域
本发明涉及图像的机器学习领域,特别涉及一种对图像进行数据增强的方法。
背景技术
随着涉及图像的机器学习领域的发展,我们对神经网络进行训练时,往往遇到数据不足的情况。此时,就需要对图像进行数据增强,进一步的利用增强的图像数据对神经网络进行训练,以提高神经网络的训练效果,得到健壮的机器学习算法。同时,一些优秀的适于对图像中进行目标检测与识别的算法,如Mask rcnn,高精度高准确度完成较为复杂的图像识别时,在训练阶段就需要进行对图片的数据增强,提供各式各样的图片以供学习。
因此在图片进行数据增强时,需要进行多种变换形式的数据增强。现有技术中,Keras.processing库中的ImageDataGenerator可对未标注数据进行增强,该增强函数中,包含平移以及旋转、放缩、错切等线性变换以及白化、锐化等与坐标无关的操作,但该函数中并没有包含一般的透视变换。在实际情况中,一幅画、一张证件拍摄的样片不会有完美正直的角度,它一般有着一定的倾斜度,原本的矩形可被拍摄成一个不规则的四边形,因此在丰富数据时对数据进行透视增强是十分必要的。
与此同时,该函数每次进行变换的随机参数并没有返回,这使得无法对已标注图片的标注轮廓点集施加同样的变换,从而对已标注数据进行增强时无法使用,这样就不得不进行大量的人工标注,较为耗费人力和时间。
为此,需要一种新的对图像进行数据增强的方法。
发明内容
为此,本发明提供一种对图像进行数据增强的方法,以力图解决或者至少缓解上面存在的问题。
根据本发明的一个方面,提供一种对图像进行数据增强的方法,适于在计算设备中执行,方法包括:在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点;在目标图像中确定透视变换矩阵;根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集。
可选地,在根据本发明的方法中,在目标图像中确定透视变换矩阵包括步骤:在目标图像中确定变换点集;根据变换点集生成增强变换点集;根据变换点集和透视变换点集,确定由变换点集变换到增强变换点集的透视变换矩阵。
可选地,在根据本发明的方法中,变换点集包括目标图像中预设的矩形的顶点。
可选地,在根据本发明的方法中,根据变换点集生成增强变换点集包括步骤:以变换点集的每个变换点为圆心,在预定半径内随机生成增强变换点,作为增强变换点集。
可选地,在根据本发明的方法中,在预定半径内随机生成增强变换点时,在预定半径内以正态分布作为随机方式生成增强变换点。
可选地,在根据本发明的方法中,根据透视变化矩阵对目标图像和标注点集进行透视变换包括步骤:根据透视变换矩阵,将目标图像中的每个点的坐标与透视变换矩阵进行计算,得到在数据增强图像中所对应的点的坐标;计算得到目标图像中所有点在数据增强图像中的对应的坐标,确定变换后的数据增强图像。
可选地,在根据本发明的方法中,还包括:根据透视变换矩阵,将标注点集中的每个标注点的坐标与透视变换矩阵进行计算,得到在数据增强图像中所对应的透视变换标注点的坐标;计算得到标注点集中所有标注点在数据增强图像中所对应的透视变换标注点集的坐标,确定透视变换标注点集。
可选地,在根据本发明的方法中,在目标图像中确定透视变换矩阵包括步骤:在目标图像中确定多个透视变换矩阵。
可选地,在根据本发明的方法中,根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集包括步骤:根据多个透视变化矩阵中的每个透视变换矩阵,对目标图像中和标注点集进行透视变换,生成数据增强图像和透视变换标注点集,并进一步计算得到多张数据增强图像和多个透视变换标注点集。
根据本发明的又一方面,提供了一种对图像进行数据增强的装置,包括:标注模块,适于在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点;计算模块,与标注模块通信连接,适于在目标图像中确定透视变换矩阵;变换模块,与计算模块通信连接,适于根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集。
根据本发明的又一方面,提供了一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行根据本发明的一种对图像进行数据增强的方法的任一方法的指令。
根据本发明的还有一个方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,该指令当由计算设备执行时,使得计算设备执行根据本发明的一种对图像进行数据增强的方法中的任一方法。
本发明中,通过在目标图像中确定标注点集和透视变换矩阵,根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集,以便根据增强图像和透视变换标注点集进行图像数据扩充。从而能够提供对图像的透视变换的数据增强方法,并将应用于对图像的透视变换的透视变换矩阵,同样应用于对目标图像中标注点集的透视变换,从而得到透视变换后的透视变换标注点集,无须人工重新对透视变换后的增强图像中标注点重新进行标注,节约了人力和时间,提高了图像领域的机器学习神经网络的训练速度。
进一步的,在从目标图像中确定透视变换矩阵时,在目标图像中确定变换点集,根据变换点集生成增强变换点集,根据变换点集和透视变换点集,确定由变换点集变换到增强变换点集的透视变换矩阵。根据变换点集和透视变换点集时,以变换点集的每个变换点为圆心,在预定半径内随机生成增强变换点,作为增强变换点集。本发明在生成增强变换点集时,以微小的随机透视变换的方法对图片进行增强,一方面随机透视变换能够将四边形随机的变换为另一个四边形,并且本身便包含平移和线性变换,能够增强透视变换的多样性,提高数据增强的图像的丰富度,训练出更加健壮的机器学习算法。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个示范性实施例的计算设备100的结构框图;
图2示出了根据本发明一个实施例的一种对图像进行数据增强的方法200的流程图;
图3示出了根据本发明一个实施例的目标图像的示意图;
图4示出了根据本发明一个实施例的增强图像的示意图;以及
图5示出了根据本发明一个实施例的一种对图像进行数据增强的装置500的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。相同的附图标记通常指代相同的部件或元素。
图1是根据本发明一个示范性实施例的计算设备100的结构框图。根据本发明的一种代码变更分析方法200可以在计算设备100中执行。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个程序122以及程序数据124。在一些实施方式中,程序122可以布置为在操作系统上由一个或者多个处理器104利用程序数据124执行指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
在根据本发明的计算设备100中,应用122包括执行一种对图像进行数据增强的方法200的多条程序指令,这些程序指令可以指示处理器104执行本发明的一种页面跳转方法200中的部分步骤,以便计算设备100中的各部分通过执行本发明的一种对图像进行数据增强的方法200来实现提供对图像进行数据增强。
计算设备100可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器等,这些电子设备可以是诸如个人数字助理(PDA)、无线网络浏览设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行一种对图像进行数据增强的方法200。
图2示出了根据本发明的一个实施例的一种对图像进行数据增强的方法200的流程示意图。方法200在计算设备中执行,如在计算设备100中执行。如图2所示,一种对图像进行数据增强的方法200始于步骤S210,在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点。由于在涉及图像的机器学习领域,在训练神经网络时,仅由目标图像构成用作训练的图像数据集时,训练数据集较少,样式也较为单一,因此需要对目标图像进行数据增强。在进行数据增强前,先行对目标图像进行标注,确定目标图像的标注点集。本发明对标注点集中包括的标注点个数和标注点集的确定方式不做限制,在具体实施情况中,可依据根据目标图像的训练需求进行确定。根据本发明的一个实施例,在目标图像中确定标注点集,标注点集外围连线围成的区域即为机器学习所训练的神经网络需要识别的图像区域。
根据本发明一个实施例,图3示出了根据本发明一个实施例的目标图像的示意图,目标图像宽1200,高800,以示意图的下底边为x轴,向右为正方向,左边界为y轴,向上为正方向,建立直角坐标系。图3中,确定了标注点集X,标注点集包括按顺时针,以六边形排列的标注点A,坐标(595,162);点B,坐标(594,235);点C,坐标(656,272);点D(720,236);点E,坐标(720,162)和点F,坐标(657,126)。目标图像中被标注点集X所确定的区域中包括一个轮廓线清晰的“月亮”。
随后,执行步骤S210,在目标图像中确定透视变换矩阵,所确定的透视变换矩阵即为目标图像和标注点集施加透视变换的矩阵。确定透视变换矩阵的步骤包括:步骤1,在目标图像中确定变换点集。在目标图像中确定的变换点集包括目标图像中预设的矩形的顶点。由于任意三个点都不共线的4个点,和变换后任意三个点都不共线的4个点可以唯一确定一个透视变换即一个透视变换矩阵,因此变换点集中最少有任意三个点都不共线的4个点。本发明对变换点集中的点的数量及布局方式不作限制。根据本发明的一个实施例,将预设矩形的顶点作为在目标图像中确定的变换点集。并进一步的,预设矩形的大小接近目标图像的大小,预设矩形的顶点接近目标图像的顶点,以便在对预设矩形施加的微小随机变换较小时,尽可能的增强目标图像的变换效果,避免因预设矩形的太小导致目标图像的透视变换效果不够明显。
根据本发明的一个实施例,在图3所示的目标图像中确定了变换点集I,变换点集I围成的形状为矩形,大小接近目标图像的大小,变换点集I的各点接近目标图像的顶点。变换点集包括按逆时针,以矩形排列的变换点M,坐标(10,10);点N(790,10);点O,坐标(790,1190)和点P,坐标(10,1190)。
步骤2,根据变换点集生成增强变换点集。根据变换点集生成增强变换点集时,以变换点集的每个变换点为圆心,在预定半径内随机生成增强变换点,作为增强变换点集。在生成增强变换点集时,以微小的随机透视变换的方法对图片进行增强,一方面随机透视变换能够将四边形随机的变换为另一个四边形,并且本身便包含平移和线性变换,能够增强透视变换的多样性。本发明对生成增强变换点集的方式不作限制,在具体实践过程中,可以根据图像数据增强的需要灵活选择生成的方式。根据本发明的一个实施例,在预定半径内随机生成增强变换点时,在预定半径内以正态分布作为随机方式生成增强变换点。本实施例中,将作为变换点集的预设矩形的顶点生成的增强变换点集中,每个点为预设矩形顶点在预定半径内以正态分布作为随机方式生成增强变换点。
根据本发明的一个实施例,在图3所示的目标图像中确定了变换点集I的增强变换点集I'。将变换点集I中的每个变换点,点M,点N,点O和点P,在预定半径为100内以正态分布作为随机方式生成增强变换点:点M',坐标(10,10);点N',坐标(790,100);点O',坐标(790,1190)和点P',坐标(10,1190)并作为增强变换点集I'。
步骤3,根据变换点集和透视变换点集,确定由变换点集变换到增强变换点集的透视变换矩阵。
为说明生成透视变换矩阵的方法,将透视变换矩阵的求解过程进行简要说明:
在三维空间的任意透视变换可以表示为:
再令
其中,x和y为目标图像中的点在进行透视变换前,在目标图像中的坐标,为透视变换矩阵,x′和y′为目标图像中的点在透视变换后,在增强图像中的位置坐标,x″,y″,z″为计算透视变换矩阵的中间量。
由于x″,y″,z″同时放大相同的倍数对最终结果并不产生影响,因此直接令a33=1以消除自由度。则对于变换前的四点(x1,y1),(x2,y2),(x3,y3),(x4,y4)及变换后对应的四点(x′1,y′1),(x′2,y′2),(x′3,y′3),(x′4,y′4),得到方程组:
在变换前的任意三点不共线的四点,和变换后的任意三点不共线的四点满足上述方程组时,该方程租有唯一解,因此可以唯一确定一个透视变换。
按照上述方程,将变换点集和增强变换点集的坐标输入,即可获得增强变换点集。
根据本发明的一个实施例,将变换点集I中点M,点N,点O和点P的坐标作为透视变换前的点的坐标,和增强变换点集I′中点M′,点N′,点O′,和点P′的坐标作为透视变换后的点的坐标输入方程,可解得一确定的透视变换矩阵Z,矩阵Z如下:
随后,执行步骤S230,根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集,以便根据增强图像和透视变换标注点集进行图像数据扩充。在将目标图像根据透视变换矩阵生成增强图像时,能够提供对图像的透视变换的数据增强方法。同时根据透视变换矩阵生成透视变换标注点集,从而得到透视变换后的透视变换标注点集,无须人工对透视变换后的增强图像中标注点重新进行标记。
根据透视变化矩阵对目标图像和标注点集进行透视变换包括步骤:根据透视变换矩阵,将目标图像中的每个点的坐标与透视变换矩阵进行计算,得到在数据增强图像中所对应的点的坐标;计算得到目标图像中所有点在数据增强图像中的对应的坐标,确定变换后的数据增强图像。
在对目标图像进行透视变换时,将目标图像中的每一个点通过透视变换矩阵,计算得到透视变换空间中的每一个点的坐标,此时,透视变换空间中的点比目标图像中的点的坐标多一个维度的坐标。再将透视变换空间中的点的坐标计算得到数据增强图像中的点的坐标,此时,数据增强图像中的点的坐标又与目标图像中点的坐标维度相同,但不同的是,坐标数值经过了在透视变换空间的透视变换计算。
根据本发明的一个实施例,图4示出的了根据本发明一个实施例的增强图像的示意图。图4为作为目标图像的图3根据透视变换矩阵M生成的增强图像。图4中,由标注点集X,根据透视变换矩阵变换得到的透视变换标注点集X',透视变换标注点集X'包括透视变换标注点A',坐标(672.03614902,192.81445961);点B',坐标(671.05076741,256.33116883);点C',坐标(731.33061581,290.05677682);点D'(791.86647523,261.07681263);点E',坐标(791.86647523,198.3919598)和点F',坐标(732.28949858,164.70417)。
根据本发明的一个实施例,在实施本发明方法200时,在目标图像中确定透视变换矩阵包括步骤:在目标图像中确定多个透视变换矩阵。根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集包括步骤:根据多个透视变化矩阵中的每个透视变换矩阵,对目标图像中和标注点集进行透视变换,生成数据增强图像和透视变换标注点集,并进一步计算得到多张数据增强图像和多个透视变换标注点集。
重复执行步骤S220和步骤S230,即可获得多个透视变换矩阵M1,M2,······,MN,根据多个透视变换矩阵M1~MN,可生成多张数据增强图像和多个透视变换标注点集X'1~X'N,实现大量扩充训练图像数据,能够增强透视变换的多样性,提高数据增强的图像的丰富度。
图5示出了一种对图像进行数据增强的装置,适于执行本发明的一种对图像进行数据增强的方法。装置包括标注模块510,计算模块520和变换模块530,其中,计算模块520与标注模块510和变换模块530通信连接。标注模块510适于在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点。计算模块520适于在目标图像中确定透视变换矩阵,变换模块530适于根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集。
根据本发明的一个实施例,还包括一种对训练数据集的处理方法。训练数据集是指应用于对机器学习中应用于图像领域的模型进行训练的数据集。本发明对应用于图像领域的模型的类型不作限制,根据具体用途需要,可以为Faster rcnn、Yolov3或Mask rcnn等。训练数据集中包括多张目标图像,方法包括:对训练数据集中的每一张目标图像,在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点;在目标图像中确定透视变换矩阵;根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集。并进一步的生成训练集数据中的所有目标图像的数据增强图像,作为数据增强图像集,以及生成所有目标图像对应的所有透视变换标注点集,将生成的数据增强图像集,所有目标图像生成对应的所有透视变换标注点集和,与所有目标图像和所有目标图像的标注点集一起作为扩充后的训练数据集。扩充后的训练数据集与原训练数据集相比,极大的扩充了训练数据集中的训练数据,能够支持训练准确度更高,更为健壮的应用于图像领域的模型。
根据本发明的一个实施例,还包括一种对目标识别模型的训练方法。由于对目标识别模型进行训练时,为了达到更好的训练效果,使目标识别模型的识别结果更准确,能够适应各种复杂的识别场景,需要对训练目标识别模型的训练数据集进行扩充。本发明中,对目标识别模型的模型具体类别不做限制,在具体事件情况中,可以根据用途需要,选择相应的目标识别模型进行训练,相应的,目标识别模型可以具体为Faster rcnn、Yolov3或Maskrcnn等中的一种。方法包括:对训练目标识别模型的训练数据集进行数据增强,对训练数据集中的每一张目标图像,在目标图像中确定标注点集,标注点集包括目标图像中的一个或多个标注点;在目标图像中确定透视变换矩阵;根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集。并进一步的生成训练集数据中的所有目标图像的数据增强图像,作为数据增强图像集,以及生成所有目标图像对应的所有透视变换标注点集,将生成的数据增强图像集,所有目标图像生成对应的所有透视变换标注点集和,与所有目标图像和所有目标图像的标注点集一起作为扩充后的训练数据集。扩充后的训练数据集与原训练数据集相比,极大的扩充了训练数据集中的训练数据,能够支持训练准确度更高,更为健壮的应用于图像领域的模型。方法还包括将扩充后的训练数据集输入到目标识别模型中进行目标识别模型的训练。根据扩充后的训练数据集进行训练的目标识别模型,能够更准确更迅速的,在各种复杂的目标识别场景中进行目标识别。
本发明中,通过在目标图像中确定标注点集和透视变换矩阵,根据透视变化矩阵对目标图像和标注点集进行透视变换,生成数据增强图像和透视变换标注点集,以便根据增强图像和透视变换标注点集进行图像数据扩充。从而能够提供对图像的透视变换的数据增强方法,并将应用于对图像的透视变换的透视变换矩阵,同样应用于对目标图像中标注点集的透视变换,从而得到透视变换后的透视变换标注点集,无须人工重新对透视变换后的增强图像中标注点重新进行标记,节约了人力和时间,提高了图像领域的机器学习神经网络的训练速度。
进一步的,在从目标图像中确定透视变换矩阵时,在目标图像中确定变换点集,根据变换点集生成增强变换点集,根据变换点集和透视变换点集,确定由变换点集变换到增强变换点集的透视变换矩阵。根据变换点集和透视变换点集时,以变换点集的每个变换点为圆心,在预定半径内随机生成增强变换点,作为增强变换点集。本发明在生成增强变换点集时,以微小的随机透视变换的方法对图片进行增强,一方面随机透视变换能够将四边形随机的变换为另一个四边形,并且本身便包含平移和线性变换,能够增强透视变换的多样性,提高数据增强的图像的丰富度,训练出更加健壮的机器学习算法。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
A8、如A1-A7中任一项所述的方法,其中,所述在所述目标图像中确定透视变换矩阵包括步骤:
在所述目标图像中确定多个透视变换矩阵。
A9、如A8所述的方法,其中,所述根据所述透视变化矩阵对所述目标图像和所述标注点集进行透视变换,生成数据增强图像和透视变换标注点集包括步骤:
根据所述多个透视变化矩阵中的每个透视变换矩阵,对所述目标图像中和所述标注点集进行透视变换,生成数据增强图像和透视变换标注点集,并进一步计算得到多张数据增强图像和多个透视变换标注点集。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组间可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组间组合成一个模块或单元或组间,以及此外可以把它们分成多个子模块或子单元或子组间。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的设备停机状态的判断方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (9)
1.一种对图像进行数据增强的方法,适于在计算设备中执行,所述方法包括:
对目标识别模型的训练数据集中的每一张目标图像,在该目标图像中确定标注点集,所述标注点集包括目标图像中的一个或多个标注点,所述标注点集外围连线围成的区域为待训练的目标识别模型需要识别的图像区域;
在所述目标图像中确定变换点集,所述变换点集包括所述目标图像中预设的矩形的顶点;
以所述变换点集的每个变换点为圆心,在预定半径内随机生成增强变换点,作为增强变换点集;
根据所述变换点集和透视变换点集,确定由变换点集变换到所述增强变换点集的透视变换矩阵;
根据所述透视变换矩阵对所述目标图像和所述标注点集进行透视变换,生成数据增强图像和透视变换标注点集,以扩充训练数据集。
2.如权利要求1所述的方法,其中,所述在预定半径内随机生成增强变换点时,在预定半径内以正态分布作为随机方式生成增强变换点。
3.如权利要求1或2所述的方法,其中,所述根据所述透视变换矩阵对所述目标图像和所述标注点集进行透视变换包括步骤:
根据所述透视变换矩阵,将所述目标图像中的每个点的坐标与所述透视变换矩阵进行计算,得到在所述数据增强图像中所对应的点的坐标;
计算得到目标图像中所有点在数据增强图像中的对应的坐标,确定变换后的数据增强图像。
4.如权利要求3所述的方法,还包括:
根据所述透视变换矩阵,将所述标注点集中的每个标注点的坐标与所述透视变换矩阵进行计算,得到在所述数据增强图像中所对应的透视变换标注点的坐标;
计算得到所述标注点集中所有标注点在所述数据增强图像中所对应的透视变换标注点集的坐标,确定透视变换标注点集。
5.如权利要求1或2所述的方法,其中,所述在所述目标图像中确定透视变换矩阵包括步骤:
在所述目标图像中确定多个透视变换矩阵。
6.如权利要求5所述的方法,其中,所述根据所述透视变换矩阵对所述目标图像和所述标注点集进行透视变换,生成数据增强图像和透视变换标注点集包括步骤:
根据所述多个透视变换矩阵中的每个透视变换矩阵,对所述目标图像中和所述标注点集进行透视变换,生成数据增强图像和透视变换标注点集,并进一步计算得到多张数据增强图像和多个透视变换标注点集。
7.一种对图像进行数据增强的装置,包括:
标注模块,适于对目标识别模型的训练数据集中的每一张目标图像,在该目标图像中确定标注点集,所述标注点集包括目标图像中的一个或多个标注点,所述标注点集外围连线围成的区域为待训练的目标识别模型需要识别的图像区域;
计算模块,与所述标注模块通信连接,适于在所述目标图像中确定变换点集,所述变换点集包括所述目标图像中预设的矩形的顶点,以所述变换点集的每个变换点为圆心,在预定半径内随机生成增强变换点,作为增强变换点集,根据所述变换点集和透视变换点集,确定由变换点集变换到所述增强变换点集的透视变换矩阵;
变换模块,与所述计算模块通信连接,适于根据所述透视变换矩阵对所述目标图像和所述标注点集进行透视变换,生成数据增强图像和透视变换标注点集,以扩充训练数据集。
8.一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1至6所述的方法中的任一方法的指令。
9.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行根据权利要求1至6所述的方法中的任一方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011404137.5A CN112396569B (zh) | 2020-12-02 | 一种对图像进行数据增强的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011404137.5A CN112396569B (zh) | 2020-12-02 | 一种对图像进行数据增强的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112396569A CN112396569A (zh) | 2021-02-23 |
CN112396569B true CN112396569B (zh) | 2024-05-31 |
Family
ID=
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104517111A (zh) * | 2013-09-27 | 2015-04-15 | 比亚迪股份有限公司 | 车道线检测方法、系统、车道偏离预警方法及系统 |
CN107845107A (zh) * | 2017-11-22 | 2018-03-27 | 殷周平 | 一种图像透视变换的优化方法 |
CN108492335A (zh) * | 2018-03-27 | 2018-09-04 | 长春理工大学 | 一种双相机透视畸变校正方法及系统 |
CN109063748A (zh) * | 2018-07-16 | 2018-12-21 | 重庆大学 | 基于数据增强的目标检测方法 |
CN110503146A (zh) * | 2019-08-21 | 2019-11-26 | 杭州比智科技有限公司 | 数据增强方法、装置、计算设备及计算机存储介质 |
CN111784588A (zh) * | 2019-04-04 | 2020-10-16 | 长沙智能驾驶研究院有限公司 | 图像数据增强方法、装置、计算机设备和存储介质 |
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104517111A (zh) * | 2013-09-27 | 2015-04-15 | 比亚迪股份有限公司 | 车道线检测方法、系统、车道偏离预警方法及系统 |
CN107845107A (zh) * | 2017-11-22 | 2018-03-27 | 殷周平 | 一种图像透视变换的优化方法 |
CN108492335A (zh) * | 2018-03-27 | 2018-09-04 | 长春理工大学 | 一种双相机透视畸变校正方法及系统 |
CN109063748A (zh) * | 2018-07-16 | 2018-12-21 | 重庆大学 | 基于数据增强的目标检测方法 |
CN111784588A (zh) * | 2019-04-04 | 2020-10-16 | 长沙智能驾驶研究院有限公司 | 图像数据增强方法、装置、计算机设备和存储介质 |
CN110503146A (zh) * | 2019-08-21 | 2019-11-26 | 杭州比智科技有限公司 | 数据增强方法、装置、计算设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4614389B2 (ja) | 画像形成装置、印刷装置、表示装置、描画処理方法、及びプログラム | |
JPH01196675A (ja) | パターンデータ生成方式 | |
US20070011648A1 (en) | Fast systems and methods for calculating electromagnetic fields near photomasks | |
CN111582267B (zh) | 一种文本检测方法、计算设备及可读存储介质 | |
US11017147B2 (en) | Edge-based camera for characterizing semiconductor layout designs | |
WO2024027039A1 (zh) | 数据处理方法、装置、设备和可读存储介质 | |
US20220245510A1 (en) | Multi-dimensional model shape transfer | |
CN111737809B (zh) | 一种建筑模型生成方法、系统、设备及介质 | |
CN112396569B (zh) | 一种对图像进行数据增强的方法 | |
JP3037854B2 (ja) | 文字生成方法及びその装置 | |
US20240013033A1 (en) | Large scale mask optimization with convolutional fourier neural operator and litho-guided self learning | |
WO2021025906A1 (en) | Topology optimization with local overhang constraints for 3d printing | |
CN111753830A (zh) | 一种作业图像校正方法和计算设备 | |
CN112396569A (zh) | 一种对图像进行数据增强的方法 | |
JP7219011B2 (ja) | 表に関するタイプセットネススコア | |
CN113724127B (zh) | 一种图像矩阵卷积的实现方法、计算设备及储存介质 | |
CN115630599A (zh) | 用于版图处理的方法、设备和介质 | |
CN114445595A (zh) | 孔洞三角形网格生成方法、装置、设备及存储介质 | |
JP2018088098A (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN110853144A (zh) | 一种数据展示方法 | |
JP5949002B2 (ja) | 画像マッチング方法、およびこの方法を用いた画像マッチング装置およびプログラム | |
CN113391799A (zh) | 界面代码生成方法、图层处理方法、装置及计算设备 | |
JP2000251095A (ja) | ポリゴンメッシュの領域分割方法及びその装置並びに情報記録媒体 | |
JP2020064438A (ja) | 学習データ生成装置および学習データ生成方法 | |
CN113033085B (zh) | 基于粒子群优化与贝塞尔曲线的颗粒形状模拟方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |