CN111784588A - 图像数据增强方法、装置、计算机设备和存储介质 - Google Patents
图像数据增强方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111784588A CN111784588A CN201910269046.6A CN201910269046A CN111784588A CN 111784588 A CN111784588 A CN 111784588A CN 201910269046 A CN201910269046 A CN 201910269046A CN 111784588 A CN111784588 A CN 111784588A
- Authority
- CN
- China
- Prior art keywords
- image
- detection target
- perspective
- perspective transformation
- transformation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000009466 transformation Effects 0.000 claims abstract description 201
- 238000001514 detection method Methods 0.000 claims abstract description 158
- 238000007499 fusion processing Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims description 85
- 230000000877 morphologic effect Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 28
- 230000004927 fusion Effects 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000003708 edge detection Methods 0.000 claims description 16
- 230000000007 visual effect Effects 0.000 claims description 13
- 230000001131 transforming effect Effects 0.000 claims description 11
- 230000001965 increasing effect Effects 0.000 abstract description 6
- 230000000875 corresponding effect Effects 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 230000002708 enhancing effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000007797 corrosion Effects 0.000 description 3
- 238000005260 corrosion Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
Abstract
本申请涉及一种图像数据增强方法、装置、计算机设备和存储介质。所述方法包括:获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;确定检测目标图像的透视变换基点;根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。采用本方法能够对图像数据进行扩充,增加图像数据量。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种图像数据增强方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,基于人工神经网络的人工智能经过不断深入的研究,已经取得了很大的进展,在模式识别、智能机器人、自动控制、预测估计等领域得到了广泛的应用。一般而言,人工神经网络与训练数据量呈正相关,例如,在训练数据量足够多的情况下,深度学习的卷积神经网络(Convolutional neural networks,CNN)能够被训练得足够鲁棒去识别出特定的图像。
然而,目前数据总量严重不足,且各样本数不均衡,影响了网络的训练学习,降低了网络的工作性能,如模式识别网络的识别精度。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对图像数据进行扩充,增加图像数据量的图像数据增强方法、装置、计算机设备和存储介质。
一种图像数据增强方法,所述方法包括:
获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
确定检测目标图像的透视变换基点;
根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
在其中一个实施例中,透视变换条件包括视角方向和变换角度;根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像包括:
根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵;
按照透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
在其中一个实施例中,在将透视视角图像与预设的背景图像进行融合,得到增强图像之后,还包括:
确定遮挡框中心和遮挡框参数;
根据遮挡框中心和遮挡框参数,生成图像遮挡框;
将图像遮挡框与增强图像进行融合,得到遮挡图像,图像增强数据包括遮挡图像。
在其中一个实施例中,对原始图像进行掩码融合处理,得到检测目标图像包括:
对原始图像进行边缘检测,确定原始图像中的检测目标区域;
获取与检测目标区域对应的掩码;
将掩码与检测目标区域融合,得到检测目标图像。
在其中一个实施例中,将透视视角图像与预设的背景图像进行融合,得到增强图像包括:
获取预设的背景图像;
将掩码、背景图像和透视视角图像进行融合,得到背景融合图像;
按照预设的融合调整条件,对背景融合图像进行调整,得到增强图像。
在其中一个实施例中,在得到检测目标图像之后,还包括:
对检测目标图像进行形态学处理,得到形态处理图像,图像增强数据包括形态处理图像;
将形态处理图像替换检测目标图像。
在其中一个实施例中,在得到遮挡图像之后,还包括:
对遮挡图像进行颜色抖动处理,得到颜色抖动图像,图像增强数据包括颜色抖动图像;
对颜色抖动图像进行高斯模糊处理,得到模糊处理图像,图像增强数据包括模糊处理图像。
一种图像数据增强装置,所述装置包括:
掩码融合处理模块,用于获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
变换基点确定模块,用于确定检测目标图像的透视变换基点;
透视变换处理模块,用于根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
背景融合处理模块,用于将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
确定检测目标图像的透视变换基点;
根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
确定检测目标图像的透视变换基点;
根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
上述图像数据增强方法、装置、计算机设备和存储介质,对原始图像进行掩码融合处理得到检测目标图像,再根据确定的透视变换基点和预设的透视变换条件对检测目标图像进行透视变换得到透视视角图像,并融合预设的背景图像得到增强图像,将得到的增强图像作为图像增强数据,从而实现了对图像数据的扩充,增加了图像数据量。
附图说明
图1为一个实施例中图像数据增强方法的应用环境图;
图2为一个实施例中图像数据增强方法的流程示意图;
图3为一个实施例中透视视角变换的示意图;
图4为图3所示实施例中透视视角变换的三个维度变化示意图;
图5为一个实施例中图像遮挡处理的流程示意图;
图6为另一个实施例中图像数据增强方法的流程示意图;
图7为一个实施例中图像数据增强方法的流程示意图;
图8为一个实施例中图像数据增强装置的结构框图;
图9为一个实施例中计算机设备的内部结构图;
图10为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的图像数据增强方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102将需要进行增强处理的原始图像发送至服务器104,服务器104对接收到的原始图像进行掩码融合处理得到检测目标图像,再根据确定的透视变换基点和预设的透视变换条件对检测目标图像进行透视变换得到透视视角图像,并融合预设的背景图像得到增强图像,得到的增强图像可以作为图像增强数据,图像增强数据可以作为人工神经网络的训练数据。
在其他应用场景中,也可以由终端102或服务器104单独实现上述图像数据增强方法,即可以由终端102或服务器104从本地获取需要进行增强处理的原始图像,对获得的原始图像进行掩码融合处理得到检测目标图像,再根据确定的透视变换基点和预设的透视变换条件对检测目标图像进行透视变换得到透视视角图像,并融合预设的背景图像得到增强图像,得到的增强图像可以作为图像增强数据,图像增强数据可以作为人工神经网络的训练数据。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种图像数据增强方法,以该方法应用于图1中的终端或服务器为例进行说明,包括以下步骤:
步骤S201:获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像。
其中,原始图像为需要进行数据增强处理的图像数据,例如可以为包含交通标志Logo的图像,如包括转向Logo的图片;也可以为其它具有标准形状或颜色用作标识的图像,如包括易碎、轻拿轻放标识的图像;还可以为包括模式识别对象的图像,如包括猫、狗或人的图像。原始图像可以根据待训练网络的工作任务确定,如根据模式识别的对象确定。
掩码是8位的单通道图像,掩码中某个像素点的像素值为0,则在该像素点的操作不起作用;若不为0,则可以对其进行操作。利用掩码可以从图像中提取感兴趣区域,以确定分析重点,在减少处理时间的同时提高处理精度。掩码融合处理即为将掩码与原始图像进行融合,利用掩码将原始图像中非感兴趣区域覆盖,从而实现从原始图像中提取感兴趣区域,得到检测目标图像。例如,对于包含交通标志Logo的原始图像,可以通过掩码融合处理,从原始图像中提取交通标志Logo区域的图像,以针对性进行数据增强处理。
本实施例中,原始图像可以由终端向服务器发送,也可以由服务器从图像数据库中提取,对原始图像进行掩码融合处理后,得到掩码覆盖原始图像后的检测目标图像,检测目标图像为4通道图像,包括R通道、G通道、B通道和掩码的alpha通道。
步骤S203:确定检测目标图像的透视变换基点。
透视变换基点为进行透视变换处理时的参考点,透视变换基点可以根据实际需求进行设定,如可以根据检测目标图像的范围大小确定透视变换基点,具体可以为检测目标图像的4个角点,包括LU(0,0)、LD(0,h)、RU(w,0)和RD(w,h),其中,LU表示Left Up,即左上角点;LD为Left Down,即左下角点;RU为Right Up,即右上角点;RD代表Right Down,即右下角点。
步骤S205:根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像。
透视变换条件为对检测目标图像进行透视变换时的变换条件,可以根据实际需求预先设定,具体可以包括视角方向和变换角度,如视角方向可以为左侧视角,变换角度可以为13度。根据透视变换基点和透视变换条件,对检测目标图像进行变换,可以将检测目标图像映射到所设定的新视平面,得到新视平面下的透视视角图像,从而有效模拟人在三维空间中观察目标时各个视角的变换,得到不同视平面下的图像,实现了对原视平面下原始图像的图像数据扩充。
步骤S207:将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
背景图像用于模拟人工神经网络的检测目标处于真实场景的情景,以扩充检测目标所处场景的图像数据。背景图像可以根据检测目标实际可能出现的场景进行预先选取,如对于检测目标为交通标志Logo的人工神经网络,背景图像可以为在实际交通场景中,交通标志Logo所处的场景背景图像,如高楼背景,道路背景等。本实施例中,将经过透视变换得到的透视视角图像与背景图像融合,得到增强图像,可以对检测目标所处的背景进行扩充,从而实现对背景下原始图像的图像数据扩充。
本实施例中,图像增强数据可以仅包括背景融合后的增强图像,此外,对原始图像进行变换和/或融合处理后得到的图像也均可以作为对原始图像进行扩充得到的图像增强数据,如检测目标图像、透视视角图像和增强图像,从而增加了图像数据总量。在具体应用中,可以从检测目标图像、透视视角图像和增强图像中选取满足对应需求的图像数据作为图像增强数据,以进行网络模型训练。
上述图像数据增强方法中,对原始图像进行掩码融合处理得到检测目标图像,再根据确定的透视变换基点和预设的透视变换条件对检测目标图像进行透视变换得到透视视角图像,并融合预设的背景图像得到增强图像,将得到的增强图像作为图像增强数据,从而实现了对图像数据的扩充,增加了图像数据量。
在其中一个实施例中,透视变换条件包括视角方向和变换角度;根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像包括:根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵;按照透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
本实施例中,透视变换条件包括视角方向和变换角度。其中,视角方向为透视变换时的视角变换方向,如可以包括左侧视角、右侧视角、俯视视角、仰视视角和平面视角等;变换角度则为按照视角方向对图像进行映射的角度。透视变换条件中的视角方向和变换角度可以根据需求进行设定,如可以设置多个不同视角方向,每个视角方向设置多个不同的变换角度,以对检测目标图像进行充分扩充。
具体地,在对检测目标图像进行透视变换时,根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵,透视变换矩阵反映了透视变换前后像素点的坐标映射关系,用于对检测目标图像中各像素点的坐标进行变换。具体实现时,可以根据视角方向和变换角度计算透视变换基点经过透视变换后对应基点的坐标,再根据对应基点的坐标和透视变换基点的坐标,计算得到该视角方向和变换角度下的透视变换矩阵。得到透视变换矩阵后,按照该透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
在一个实施例中,透视变换基点为检测目标图像的4个角点,包括LU(0,0)、LD(0,h)、RU(w,0)和RD(w,h)。其中,w为检测目标图像的宽度,h为检测目标图像的高度。则对于视角方向为左侧视角,变换角度为β时,基点LU和基点LD的纵坐标改变,具体如公式(1)示,
y'LU=yLU-w*arctanβ
y'LD=yLD+w*arctanβ (1)
其中,yLU和y'LU分别为基点LU变换前后的纵坐标,yLD和y'LD分别为基点LD变换前后的纵坐标。则4个透视变换基点的坐标变换如公式(2)示,
(0,0)→(0,0-w*arctanβ)
(0,h)→(0,h+w*arctanβ)
(w,0)→(w,0)
(w,h)→(w,h) (2)
同理,视角方向为右侧视角,变换角度为β时,基点RU和基点RD的纵坐标改变,具体如公式(3)示,
y'RU=yRU+w*arctanβ
y'RD=yRD-w*arctanβ (3)
其中,yRU和y'RU分别为基点RU变换前后的纵坐标,yRD和y'RD分别为基点RD变换前后的纵坐标。则4个透视变换基点的坐标变换如公式(4)示,
(0,0)→(0,0)
(0,h)→(0,h)
(w,0)→(w,w*arctanβ)
(w,h)→(w,h-w*arctanβ) (4)
视角方向为俯视视角,变换角度为α时,基点LU和基点RU的横坐标改变,具体如公式(5)示,
x'LU=xLU-h*arctanα
x'RU=xRU+h*arctanα (5)
其中,xLU和x'LU分别为基点LU变换前后的纵坐标,xRU和x'RU分别为基点RU变换前后的横坐标。则4个透视变换基点的坐标变换如公式(6)示,
(0,0)→(-h*arctanα,0)
(0,h)→(0,h)
(w,0)→(w+h*arctanα,0)
(w,h)→(w,h) (6)
视角方向为仰视视角,变换角度为α时,基点LD和基点RD的纵坐标改变,具体如公式(7)示,
x'LD=xLD+h*arctanα
x'RD=xRD-h*arctanα (7)
其中,xLD和x'LD分别为基点LD变换前后的纵坐标,xRD和x'RD分别为基点RD变换前后的横坐标。则4个透视变换基点的坐标变换如公式(8)示,
(0,0)→(0,0)
(0,h)→(h*arctanα,h)
(w,0)→(w,0)
(w,h)→(w-h*arctanα,h) (8)
视角方向为平面视角,变换角度为γ时,透视变换基点的坐标变换如公式(9)示,
其中,x'和y'分别为透视变换基点透视变换后的横纵坐标,x和y分别为透视变换基点透视变换前的横纵坐标。
如图3所示,为一个实施例中,为针对包括禁止马车的交通标志Logo的检测目标图像进行透视视角变换的示意图。不同的视角方向和变换角度下,禁止马车Logo产生不同的形变,从而模拟了人在三维空间中观察禁止马车Logo时各个视角的变换,实现了图像数据增强。图4为图3中禁止马车Logo在进行透视视角变换时,对应在三维空间三个维度变化示意图。其中,平面视角为按照β旋转图像,左/右侧视角为按照γ旋转图像,俯/仰视角为按照α旋转图像。
在其中一个实施例中,如图5所示,在将透视视角图像与预设的背景图像进行融合,得到增强图像之后,还包括图像遮挡处理的步骤,具体包括:
步骤S501:确定遮挡框中心和遮挡框参数。
本实施例中,在将透视视角图像与背景图像融合后,进一步模拟真实场景中检测目标受遮挡的情况,如通过生成遮挡框对检测目标进行随机遮挡,以扩充该情景下图像数据,从而可以提高模型的泛化能力,防止网络的过拟合。其中,可以直接在增强图像上进行遮挡,也可以在网络特征图进行遮挡,还可以利用生成对抗网络(Generative AdversarialNetwork,GAN)对检测目标进行遮挡。
本实施例通过图像遮挡框对增强图像进行随机遮挡。具体地,确定图像遮挡框中心和遮挡框参数,其中,遮挡框中心可以通过随机采样确定,遮挡框参数也可以随机生成,具体可以包括图像遮挡框的宽度和高度,根据遮挡框中心和遮挡框参数,可以生成图像遮挡框,对增强图像中的检测目标进行遮挡。
步骤S503:根据遮挡框中心和遮挡框参数,生成图像遮挡框。
得到遮挡框中心和遮挡框参数,生成图像遮挡框。具体地,遮挡框参数包括图像遮挡框的宽度和高度,根据该图像遮挡框的宽度、高度以及遮挡框中心,生成对应的图像遮挡框。对于遮挡框中心(x,y),可以按照公式(10)确定图像遮挡框。
其中,cuth为图像遮挡框的高度,cutw为图像遮挡框的宽度。图像遮挡框范围内各像素点的像素值可以固定成[0-255]之间的任意一个数值,在将图像遮挡框与增强图像进行融合后,实现对增强图像的遮挡。
步骤S505:将图像遮挡框与增强图像进行融合,得到遮挡图像,图像增强数据包括遮挡图像。
得到图像遮挡框后,将图像遮挡框与增强图像进行融合,得到遮挡图像。具体地,可以将图像遮挡框直接覆盖于增强图像,从而对增强图像进行随机遮挡。得到遮挡图像后,可以将遮挡图像作为扩充后的图像增强数据,用于网络模型的训练。
在其中一个实施例中,对原始图像进行掩码融合处理,得到检测目标图像包括:对原始图像进行边缘检测,确定原始图像中的检测目标区域;获取与检测目标区域对应的掩码;将掩码与检测目标区域融合,得到检测目标图像。
利用掩码可以从图像中提取感兴趣区域,以确定分析重点,在减少处理时间的同时提高处理精度。本实施例中,在对原始图像进行掩码融合处理时,先对原始图像进行边缘检测,具体可以采用边缘检测算法,Soble边缘检测算法对原始图像进行边缘检测,以确定原始图像中的检测目标区域。检测目标区域即为包括检测目标的区域,如对于包含交通标志Logo的原始图像,检测目标区域即为交通标志Logo的范围,而原始图像中其他背景内容则为非感兴趣区域。确定原始图像中的检测目标区域后,获取与该检测目标区域对应的掩码,具体可以采用泛洪填充算法计算得到检测目标区域对应的掩码。再将掩码与检测目标区域融合,使掩码对原始图像中的非感兴趣区域进行覆盖,得到检测目标图像。
在其中一个实施例中,将透视视角图像与预设的背景图像进行融合,得到增强图像包括:获取预设的背景图像;将掩码、背景图像和透视视角图像进行融合,得到背景融合图像;按照预设的融合调整条件,对背景融合图像进行调整,得到增强图像。
本实施例中,通过掩码将背景图像和透视视角图像进行融合,并按照预设的融合调整条件进行调整,得到融合背景后的增强图像。具体地,在将透视视角图像与预设的背景图像进行融合时,获取预设的背景图像,背景图像用于模拟人工神经网络的检测目标处于场景的情景。将掩码、背景图像和透视视角图像进行融合,再对融合得到的背景融合图像进行调整,具体按照预设的融合调整条件进行调整,得到增强图像。其中,融合调整条件可以包括亮度调整条件和对比度调整条件,通过亮度和对比度调整,可以使背景图像与透视视角图像融合得更加自然,图片风格具有一致性。
在一个实施例中,交通标志Logo的图像数据增强处理中,背景图像融合的处理如按照公式(11)示,
其中,dst为融合后的增强图像,mask代表图像掩码,logo代表透视视角图像,background代表背景图像,Adj为亮度和对比度调整函数,img为输入图像,f(x)为截断函数。
在其中一个实施例中,在得到检测目标图像之后,还包括:对检测目标图像进行形态学处理,得到形态处理图像,图像增强数据包括形态处理图像;将形态处理图像替换检测目标图像。
本实施例中,在对检测目标图像进行透视变换之前,还可以对得到的检测目标检测图像进行形态学处理,形态学处理用于从图像中提取对表达和描绘区域形状有意义的图像分量,使后续的识别工作能够抓住目标对象最为本质的形状特征,如边界和连通区域等。
具体地,在得到检测目标图像之后,对检测目标图像进行形态学处理,如利用腐蚀算法或膨胀算法对检测目标图像进行形态学处理,以使检测目标图像中线条粗细发生变化,能模拟真实场景中由于强光、污损等影响时图像内容部分缺失的情况,对于标准标志类的检测目标,还可以模拟由于制作工艺影响导致标识制作不规范的情况。对检测目标图像进行形态学处理后,得到形态处理图像,并将形态处理图像替换检测目标图像进行后续的透视变换处理。此外,得到的形态处理图像也可以作为扩充得到的图像增强数据。
在其中一个实施例中,在得到遮挡图像之后,还包括:对遮挡图像进行颜色抖动处理,得到颜色抖动图像,图像增强数据包括颜色抖动图像;对颜色抖动图像进行高斯模糊处理,得到模糊处理图像,图像增强数据包括模糊处理图像。
本实施例中,在得到遮挡图像之后,依次对遮挡图像进行颜色抖动处理和高斯模糊处理,进一步扩充图像数据。具体地,对遮挡图像进行颜色抖动处理,得到颜色抖动图像。颜色抖动处理时,可以先将RGB空间的遮挡图像转换至HSV空间,再分别选择曝光度、饱和度和色调的随机调整范围。其中,曝光度exposure、饱和度saturation调整范围为[0.667,1.5],色调hue调整范围为[-0.1,0.1]。调整方法如公式(12)示,
其中,img代表输入图像,即遮挡图像,img[c]代表图像的第c个通道。当通道c为0时,代表调整色调,为防止数值出界,定义色调的截断函数为f1(x);当通道c为1,2时,分别代表调整曝光度和饱和度,其截断函数为f2(x)。颜色抖动处理后,将图像由HSV空间变为RGB空间,得到颜色抖动图像。
得到颜色抖动图像后,对其进行高斯模糊处理,得到模糊处理图像。其中,高斯模糊处理将颜色抖动图像中的每个像素点,与周围(高斯半径为3或者5)像素点的像素值进行加权平均后取代原值,通过高斯模糊处理可以进一步增强样本的多样性。
对于得到的颜色抖动图像和模糊处理图像,均可以作为对原始图像进行扩充得到的图像增强数据。
在其中一个实施例中,如图6所示,提供了一种图像数据增强方法,包括:
步骤S601:获取原始图像,并对原始图像进行边缘检测,确定原始图像中的检测目标区域;
步骤S602:获取与检测目标区域对应的掩码;
步骤S603:将掩码与检测目标区域融合,得到检测目标图像。
本实施例中,利用掩码从图像中提取感兴趣区域,以确定分析重点,在减少处理时间的同时提高处理精度。具体采用边缘检测算法对原始图像进行边缘检测,采用泛洪填充算法计算得到检测目标区域对应的掩码,再将掩码与检测目标区域融合,使掩码对原始图像中的非感兴趣区域进行覆盖,得到检测目标图像。
步骤S604:对检测目标图像进行形态学处理,得到形态处理图像,并将形态处理图像替换检测目标图像。
本实施例中,在得到检测目标图像之后,对检测目标图像进行形态学处理,如利用腐蚀算法或膨胀算法对检测目标图像进行形态学处理,以使检测目标图像中线条粗细发生变化。
步骤S605:确定检测目标图像的透视变换基点;
步骤S606:透视变换条件包括视角方向和变换角度;根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵;
步骤S607:按照透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
视角方向为透视变换时的视角变换方向;变换角度则为按照视角方向对图像进行映射的角度。本实施例中,根据视角方向和变换角度计算透视变换基点经过透视变换后对应基点的坐标,再根据对应基点的坐标和透视变换基点的坐标,计算得到该视角方向和变换角度下的透视变换矩阵。得到透视变换矩阵后,按照该透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
步骤S608:将透视视角图像与预设的背景图像进行融合,得到增强图像。
本实施例中,通过掩码将背景图像和透视视角图像进行融合,并按照预设的融合调整条件进行调整,得到融合背景后的增强图像。具体包括:获取预设的背景图像;将掩码、背景图像和透视视角图像进行融合,得到背景融合图像;按照预设的融合调整条件,对背景融合图像进行调整,得到增强图像。
步骤S609:通过预设的图像遮挡框与增强图像进行融合,得到遮挡图像。
本实施例中,在将透视视角图像与背景图像融合后,进一步模拟真实场景中检测目标受遮挡的情况。具体包括:确定遮挡框中心和遮挡框参数;根据遮挡框中心和遮挡框参数,生成图像遮挡框;将图像遮挡框与增强图像进行融合,得到遮挡图像。
步骤S610:对遮挡图像进行颜色抖动处理,得到颜色抖动图像;
步骤S611:对颜色抖动图像进行高斯模糊处理,得到模糊处理图像。
本实施例中,在得到遮挡图像之后,依次对遮挡图像进行颜色抖动处理和高斯模糊处理,进一步扩充图像数据。
如图7所示,为一个实施例中,针对禁止马车的交通标志Logo图像数据增强处理的流程图。其中,禁止马车Logo经过边缘检测算法检测边缘,并与生成的掩码mask融合,得到检测目标图像。检测目标图像通过膨胀算法或腐蚀算法进行形态学处理,得到形态处理图像。形态处理图像与预设的背景图像进行融合,得到增强图像。增强图像再与预设的图像遮挡框进行融合,得到遮挡图像。此外,遮挡图像还依次通过颜色抖动处理和高斯模糊处理,分别得到颜色抖动图像和模糊处理图像。其中,各处理阶段生成的图像数据,均可以作为对原始图像进行扩充得到的图像增强数据,具体可以包括检测目标图像、形态处理图像、增强图像、遮挡图像、颜色抖动图像和模糊处理图像中的至少一种,从而实现了对图像数据的扩充,增加了图像数据量。
应该理解的是,虽然图2、5-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、5-7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种图像数据增强装置,包括:掩码融合处理模块801、变换基点确定模块803、透视变换处理模块805和背景融合处理模块807,其中:
掩码融合处理模块801,用于获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
变换基点确定模块803,用于确定检测目标图像的透视变换基点;
透视变换处理模块805,用于根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
背景融合处理模块807,用于将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
在其中一个实施例中,透视变换条件包括视角方向和变换角度;透视变换处理模块805包括变换矩阵确定单元和透视变换处理单元,其中:变换矩阵确定单元,用于根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵;透视变换处理单元,用于按照透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
在其中一个实施例中,还包括遮挡参数模块、遮挡框生成模块和遮挡模块,其中:遮挡参数模块,用于确定遮挡框中心和遮挡框参数;遮挡框生成模块,用于根据遮挡框中心和遮挡框参数,生成图像遮挡框;遮挡模块,用于将图像遮挡框与增强图像进行融合,得到遮挡图像,图像增强数据包括遮挡图像。
在其中一个实施例中,掩码融合处理模块801包括边缘检测单元、掩码获取单元和掩码融合单元,其中:边缘检测单元,用于对原始图像进行边缘检测,确定原始图像中的检测目标区域;掩码获取单元,用于获取与检测目标区域对应的掩码;掩码融合单元,用于将掩码与检测目标区域融合,得到检测目标图像。
在其中一个实施例中,背景融合处理模块807包括背景图像获取单元、背景融合单元和调整单元,其中:背景图像获取单元,用于获取预设的背景图像;背景融合单元,用于将掩码、背景图像和透视视角图像进行融合,得到背景融合图像;调整单元,用于按照预设的融合调整条件,对背景融合图像进行调整,得到增强图像。
在其中一个实施例中,还包括形态处理模块和图像替换模块,其中:形态处理模块,用于对检测目标图像进行形态学处理,得到形态处理图像,图像增强数据包括形态处理图像;图像替换模块,用于将形态处理图像替换检测目标图像。
在其中一个实施例中,还包括颜色抖动模块和高斯模糊模块,其中:颜色抖动模块,用于对遮挡图像进行颜色抖动处理,得到颜色抖动图像,图像增强数据包括颜色抖动图像;高斯模糊模块,用于对颜色抖动图像进行高斯模糊处理,得到模糊处理图像,图像增强数据包括模糊处理图像。
关于图像数据增强装置的具体限定可以参见上文中对于图像数据增强方法的限定,在此不再赘述。上述图像数据增强装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像数据增强方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像数据增强方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9-10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
确定检测目标图像的透视变换基点;
根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
在一个实施例中,透视变换条件包括视角方向和变换角度;处理器执行计算机程序时还实现以下步骤:根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵;按照透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定遮挡框中心和遮挡框参数;根据遮挡框中心和遮挡框参数,生成图像遮挡框;将图像遮挡框与增强图像进行融合,得到遮挡图像,图像增强数据包括遮挡图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对原始图像进行边缘检测,确定原始图像中的检测目标区域;获取与检测目标区域对应的掩码;将掩码与检测目标区域融合,得到检测目标图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设的背景图像;将掩码、背景图像和透视视角图像进行融合,得到背景融合图像;按照预设的融合调整条件,对背景融合图像进行调整,得到增强图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对检测目标图像进行形态学处理,得到形态处理图像,图像增强数据包括形态处理图像;将形态处理图像替换检测目标图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对遮挡图像进行颜色抖动处理,得到颜色抖动图像,图像增强数据包括颜色抖动图像;对颜色抖动图像进行高斯模糊处理,得到模糊处理图像,图像增强数据包括模糊处理图像。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取原始图像,并对原始图像进行掩码融合处理,得到检测目标图像;
确定检测目标图像的透视变换基点;
根据透视变换基点和预设的透视变换条件,对检测目标图像进行透视变换,得到透视视角图像;
将透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括增强图像。
在一个实施例中,透视变换条件包括视角方向和变换角度;计算机程序被处理器执行时还实现以下步骤:根据视角方向、变换角度和透视变换基点的坐标确定透视变换矩阵;按照透视变换矩阵对检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:确定遮挡框中心和遮挡框参数;根据遮挡框中心和遮挡框参数,生成图像遮挡框;将图像遮挡框与增强图像进行融合,得到遮挡图像,图像增强数据包括遮挡图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对原始图像进行边缘检测,确定原始图像中的检测目标区域;获取与检测目标区域对应的掩码;将掩码与检测目标区域融合,得到检测目标图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设的背景图像;将掩码、背景图像和透视视角图像进行融合,得到背景融合图像;按照预设的融合调整条件,对背景融合图像进行调整,得到增强图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对检测目标图像进行形态学处理,得到形态处理图像,图像增强数据包括形态处理图像;将形态处理图像替换检测目标图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对遮挡图像进行颜色抖动处理,得到颜色抖动图像,图像增强数据包括颜色抖动图像;对颜色抖动图像进行高斯模糊处理,得到模糊处理图像,图像增强数据包括模糊处理图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像数据增强方法,所述方法包括:
获取原始图像,并对所述原始图像进行掩码融合处理,得到检测目标图像;
确定所述检测目标图像的透视变换基点;
根据所述透视变换基点和预设的透视变换条件,对所述检测目标图像进行透视变换,得到透视视角图像;
将所述透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括所述增强图像。
2.根据权利要求1所述的方法,其特征在于,所述透视变换条件包括视角方向和变换角度;所述根据所述透视变换基点和预设的透视变换条件,对所述检测目标图像进行透视变换,得到透视视角图像包括:
根据所述视角方向、所述变换角度和所述透视变换基点的坐标确定透视变换矩阵;
按照所述透视变换矩阵对所述检测目标图像中各像素点的坐标进行变换,得到透视视角图像。
3.根据权利要求1所述的方法,其特征在于,在所述将所述透视视角图像与预设的背景图像进行融合,得到增强图像之后,还包括:
确定遮挡框中心和遮挡框参数;
根据所述遮挡框中心和所述遮挡框参数,生成图像遮挡框;
将所述图像遮挡框与所述增强图像进行融合,得到遮挡图像,所述图像增强数据包括所述遮挡图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述原始图像进行掩码融合处理,得到检测目标图像包括:
对所述原始图像进行边缘检测,确定所述原始图像中的检测目标区域;
获取与所述检测目标区域对应的掩码;
将所述掩码与所述检测目标区域融合,得到检测目标图像。
5.根据权利要求2所述的方法,其特征在于,所述将所述透视视角图像与预设的背景图像进行融合,得到增强图像包括:
获取预设的背景图像;
将所述掩码、所述背景图像和所述透视视角图像进行融合,得到背景融合图像;
按照预设的融合调整条件,对所述背景融合图像进行调整,得到增强图像。
6.根据权利要求1至5任意一项所述的方法,其特征在于,在所述得到检测目标图像之后,还包括:
对所述检测目标图像进行形态学处理,得到形态处理图像,所述图像增强数据包括所述形态处理图像;
将所述形态处理图像替换所述检测目标图像。
7.根据权利要求3所述的方法,其特征在于,在所述得到遮挡图像之后,还包括:
对所述遮挡图像进行颜色抖动处理,得到颜色抖动图像,所述图像增强数据包括所述颜色抖动图像;
对所述颜色抖动图像进行高斯模糊处理,得到模糊处理图像,所述图像增强数据包括所述模糊处理图像。
8.一种图像数据增强装置,其特征在于,所述装置包括:
掩码融合处理模块,用于获取原始图像,并对所述原始图像进行掩码融合处理,得到检测目标图像;
变换基点确定模块,用于确定所述检测目标图像的透视变换基点;
透视变换处理模块,用于根据所述透视变换基点和预设的透视变换条件,对所述检测目标图像进行透视变换,得到透视视角图像;
背景融合处理模块,用于将所述透视视角图像与预设的背景图像进行融合,得到增强图像,图像增强数据包括所述增强图像。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910269046.6A CN111784588A (zh) | 2019-04-04 | 2019-04-04 | 图像数据增强方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910269046.6A CN111784588A (zh) | 2019-04-04 | 2019-04-04 | 图像数据增强方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111784588A true CN111784588A (zh) | 2020-10-16 |
Family
ID=72755700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910269046.6A Pending CN111784588A (zh) | 2019-04-04 | 2019-04-04 | 图像数据增强方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111784588A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396569A (zh) * | 2020-12-02 | 2021-02-23 | 北京皮尔布莱尼软件有限公司 | 一种对图像进行数据增强的方法 |
CN112767239A (zh) * | 2021-01-12 | 2021-05-07 | 云南电网有限责任公司电力科学研究院 | 一种样本自动生成方法、系统、设备和存储介质 |
CN112766348A (zh) * | 2021-01-12 | 2021-05-07 | 云南电网有限责任公司电力科学研究院 | 一种基于对抗神经网络生成样本数据的方法以及装置 |
CN112801862A (zh) * | 2021-02-01 | 2021-05-14 | 中科云谷科技有限公司 | 基于图像变换的数据处理方法、数据处理装置及存储介质 |
CN113012176A (zh) * | 2021-03-17 | 2021-06-22 | 北京百度网讯科技有限公司 | 样本图像的处理方法、装置、电子设备及存储介质 |
CN113486941A (zh) * | 2021-06-30 | 2021-10-08 | 广州方硅信息技术有限公司 | 直播图像的训练样本生成方法、模型训练方法及电子设备 |
CN113658280A (zh) * | 2021-08-20 | 2021-11-16 | 平安科技(深圳)有限公司 | 基于人工智能的数据增广方法、装置、设备和存储介质 |
CN113657518A (zh) * | 2021-08-20 | 2021-11-16 | 北京百度网讯科技有限公司 | 训练方法、目标图像检测方法、装置、电子设备以及介质 |
CN114037637A (zh) * | 2022-01-10 | 2022-02-11 | 苏州浪潮智能科技有限公司 | 一种图像数据增强方法、装置、计算机设备和存储介质 |
CN114972093A (zh) * | 2022-05-26 | 2022-08-30 | 平安科技(深圳)有限公司 | 图像增强方法、装置、设备及存储介质 |
CN115497153A (zh) * | 2022-11-16 | 2022-12-20 | 吉林大学 | 一种基于兴奋分析的车辆驾驶参数控制方法及系统 |
CN112396569B (zh) * | 2020-12-02 | 2024-05-31 | 北京皮尔布莱尼软件有限公司 | 一种对图像进行数据增强的方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006204330A (ja) * | 2005-01-25 | 2006-08-10 | Hitachi Medical Corp | 画像表示装置 |
CN101405763A (zh) * | 2006-03-01 | 2009-04-08 | 新加坡科技研究局 | 用于获取实时视频输出的对象的多个视图的方法和系统 |
US20100194872A1 (en) * | 2009-01-30 | 2010-08-05 | Microsoft Corporation | Body scan |
US20150002419A1 (en) * | 2013-06-26 | 2015-01-01 | Microsoft Corporation | Recognizing interactions with hot zones |
WO2016000331A1 (zh) * | 2014-06-30 | 2016-01-07 | 京东方科技集团股份有限公司 | 一种图像增强方法、图像增强装置及显示装置 |
CN106169076A (zh) * | 2016-07-22 | 2016-11-30 | 中山大学 | 一种基于透视变换的角度车牌图像库搭建方法 |
CN107153816A (zh) * | 2017-04-16 | 2017-09-12 | 五邑大学 | 一种用于鲁棒人脸识别的数据增强方法 |
CN108596905A (zh) * | 2018-05-10 | 2018-09-28 | 广东拓斯达科技股份有限公司 | 物体检测方法、系统、计算机设备和存储介质 |
CN108881846A (zh) * | 2018-07-10 | 2018-11-23 | 深圳市易成自动驾驶技术有限公司 | 信息融合方法、装置及计算机可读存储介质 |
CN109063748A (zh) * | 2018-07-16 | 2018-12-21 | 重庆大学 | 基于数据增强的目标检测方法 |
US20190034736A1 (en) * | 2017-07-14 | 2019-01-31 | Illumitex, Inc. | System and Method for Identifying a Number of Insects in a Horticultural Area |
-
2019
- 2019-04-04 CN CN201910269046.6A patent/CN111784588A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006204330A (ja) * | 2005-01-25 | 2006-08-10 | Hitachi Medical Corp | 画像表示装置 |
CN101405763A (zh) * | 2006-03-01 | 2009-04-08 | 新加坡科技研究局 | 用于获取实时视频输出的对象的多个视图的方法和系统 |
US20100194872A1 (en) * | 2009-01-30 | 2010-08-05 | Microsoft Corporation | Body scan |
US20150002419A1 (en) * | 2013-06-26 | 2015-01-01 | Microsoft Corporation | Recognizing interactions with hot zones |
WO2016000331A1 (zh) * | 2014-06-30 | 2016-01-07 | 京东方科技集团股份有限公司 | 一种图像增强方法、图像增强装置及显示装置 |
CN106169076A (zh) * | 2016-07-22 | 2016-11-30 | 中山大学 | 一种基于透视变换的角度车牌图像库搭建方法 |
CN107153816A (zh) * | 2017-04-16 | 2017-09-12 | 五邑大学 | 一种用于鲁棒人脸识别的数据增强方法 |
US20190034736A1 (en) * | 2017-07-14 | 2019-01-31 | Illumitex, Inc. | System and Method for Identifying a Number of Insects in a Horticultural Area |
CN108596905A (zh) * | 2018-05-10 | 2018-09-28 | 广东拓斯达科技股份有限公司 | 物体检测方法、系统、计算机设备和存储介质 |
CN108881846A (zh) * | 2018-07-10 | 2018-11-23 | 深圳市易成自动驾驶技术有限公司 | 信息融合方法、装置及计算机可读存储介质 |
CN109063748A (zh) * | 2018-07-16 | 2018-12-21 | 重庆大学 | 基于数据增强的目标检测方法 |
Non-Patent Citations (8)
Title |
---|
JIANG-JING LV等: "Data augmentation for face recognition", 《ELSEVIER》 * |
JIANG-JING LV等: "Data augmentation for face recognition", 《ELSEVIER》, 31 March 2017 (2017-03-31), pages 184 - 196 * |
LIGANG ZHANG等: "Random Gabor based templates for facial expression recognition in images with facial occlusion", 《ELSEVIER》 * |
LIGANG ZHANG等: "Random Gabor based templates for facial expression recognition in images with facial occlusion", 《ELSEVIER》, 31 December 2014 (2014-12-31), pages 451 - 464 * |
欧啸天 胡伟: "自然场景中Logo标识检测训练数据生成方法研究", 《电子设计工程》, vol. 26, no. 7 * |
欧啸天: "自然场景中的物体检测相关技术研究", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》, vol. 2019, no. 01, pages 16 - 24 * |
王兴宝 等: "红外成像制导中前视图的仿真技术研究", 《红外与激光工程》, vol. 35, pages 68 - 72 * |
黄倩倩: "基于深度学习的交通标志识别技术研究", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》, vol. 2019, no. 01 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112396569A (zh) * | 2020-12-02 | 2021-02-23 | 北京皮尔布莱尼软件有限公司 | 一种对图像进行数据增强的方法 |
CN112396569B (zh) * | 2020-12-02 | 2024-05-31 | 北京皮尔布莱尼软件有限公司 | 一种对图像进行数据增强的方法 |
CN112767239A (zh) * | 2021-01-12 | 2021-05-07 | 云南电网有限责任公司电力科学研究院 | 一种样本自动生成方法、系统、设备和存储介质 |
CN112766348A (zh) * | 2021-01-12 | 2021-05-07 | 云南电网有限责任公司电力科学研究院 | 一种基于对抗神经网络生成样本数据的方法以及装置 |
CN112801862A (zh) * | 2021-02-01 | 2021-05-14 | 中科云谷科技有限公司 | 基于图像变换的数据处理方法、数据处理装置及存储介质 |
CN112801862B (zh) * | 2021-02-01 | 2024-01-19 | 中科云谷科技有限公司 | 基于图像变换的数据处理方法、数据处理装置及存储介质 |
CN113012176A (zh) * | 2021-03-17 | 2021-06-22 | 北京百度网讯科技有限公司 | 样本图像的处理方法、装置、电子设备及存储介质 |
CN113012176B (zh) * | 2021-03-17 | 2023-12-15 | 阿波罗智联(北京)科技有限公司 | 样本图像的处理方法、装置、电子设备及存储介质 |
CN113486941A (zh) * | 2021-06-30 | 2021-10-08 | 广州方硅信息技术有限公司 | 直播图像的训练样本生成方法、模型训练方法及电子设备 |
CN113658280A (zh) * | 2021-08-20 | 2021-11-16 | 平安科技(深圳)有限公司 | 基于人工智能的数据增广方法、装置、设备和存储介质 |
CN113657518A (zh) * | 2021-08-20 | 2021-11-16 | 北京百度网讯科技有限公司 | 训练方法、目标图像检测方法、装置、电子设备以及介质 |
CN113658280B (zh) * | 2021-08-20 | 2023-07-04 | 平安科技(深圳)有限公司 | 基于人工智能的数据增广方法、装置、设备和存储介质 |
CN113657518B (zh) * | 2021-08-20 | 2022-11-25 | 北京百度网讯科技有限公司 | 训练方法、目标图像检测方法、装置、电子设备以及介质 |
CN114037637A (zh) * | 2022-01-10 | 2022-02-11 | 苏州浪潮智能科技有限公司 | 一种图像数据增强方法、装置、计算机设备和存储介质 |
CN114037637B (zh) * | 2022-01-10 | 2022-04-19 | 苏州浪潮智能科技有限公司 | 一种图像数据增强方法、装置、计算机设备和存储介质 |
CN114972093A (zh) * | 2022-05-26 | 2022-08-30 | 平安科技(深圳)有限公司 | 图像增强方法、装置、设备及存储介质 |
CN115497153A (zh) * | 2022-11-16 | 2022-12-20 | 吉林大学 | 一种基于兴奋分析的车辆驾驶参数控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111784588A (zh) | 图像数据增强方法、装置、计算机设备和存储介质 | |
CN112348815B (zh) | 图像处理方法、图像处理装置以及非瞬时性存储介质 | |
CN109255772B (zh) | 基于风格迁移的车牌图像生成方法、装置、设备及介质 | |
CN112633144A (zh) | 人脸遮挡检测方法、系统、设备及存储介质 | |
CN110717878B (zh) | 图像融合方法、装置、计算机设备和存储介质 | |
JP2019504386A (ja) | 顔画像処理方法および装置、ならびに記憶媒体 | |
CN111192356A (zh) | 感兴趣区域的显示方法、装置、设备和存储介质 | |
CN112949507A (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN106683100A (zh) | 一种图像分割去雾方法及终端 | |
CN110443252A (zh) | 一种文字检测方法、装置及设备 | |
CN113822817A (zh) | 文档图像增强方法、装置及电子设备 | |
CN114764775A (zh) | 红外图像质量评价方法、设备以及存储介质 | |
JP4639754B2 (ja) | 画像処理装置 | |
CN110163864A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN111209908B (zh) | 更新标注框的方法、装置、存储介质和计算机设备 | |
CN110263754B (zh) | 屏下指纹去底纹方法、装置、计算机设备和存储介质 | |
CN112906611B (zh) | 一种井盖检测方法、装置、电子设备及存储介质 | |
CN114332895A (zh) | 文本图像合成方法、装置、设备、存储介质和程序产品 | |
JP7151742B2 (ja) | 画像変換装置、画像変換方法及び画像変換用コンピュータプログラム | |
CN110570521B (zh) | 一种城市地面粗糙度计算方法 | |
CN108876713B (zh) | 二维模板图像的映射方法、装置、终端设备和存储介质 | |
CN110824451A (zh) | 雷达回波图的处理方法、装置、计算机设备及存储介质 | |
CN114332297A (zh) | 图像的绘制方法、装置、计算机设备和存储介质 | |
CN114494052A (zh) | 书本计数方法、装置、计算机设备和存储介质 | |
CN116645299B (zh) | 一种深度伪造视频数据增强方法、装置及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |