CN113962360B - 一种基于gan网络的样本数据增强方法及系统 - Google Patents
一种基于gan网络的样本数据增强方法及系统 Download PDFInfo
- Publication number
- CN113962360B CN113962360B CN202111178317.0A CN202111178317A CN113962360B CN 113962360 B CN113962360 B CN 113962360B CN 202111178317 A CN202111178317 A CN 202111178317A CN 113962360 B CN113962360 B CN 113962360B
- Authority
- CN
- China
- Prior art keywords
- image
- sample
- sample data
- scale
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 230000032683 aging Effects 0.000 claims abstract description 12
- 238000005070 sampling Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 claims description 2
- 229910052760 oxygen Inorganic materials 0.000 claims description 2
- 239000001301 oxygen Substances 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 abstract 1
- 239000010410 layer Substances 0.000 description 17
- 239000002861 polymer material Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 235000008708 Morus alba Nutrition 0.000 description 1
- 240000000249 Morus alba Species 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002431 foraging effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于GAN网络的样本数据增强方法及系统,方法具体为:构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;基于Coarse‑to‑Fine思想的对GAN网络学习模型进行训练和测试,对输入图像从粗略的分辨率开始进行多次迭代;迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,直到图像的分辨率达到设定的输出分辨率;基于满足输出分辨率的图像生成虚拟样本,将所述虚拟样本与小样本数据集混合,得到增强后的完成样本数据;解决了工业过程中老化样本数据十分稀缺的问题,相对传统的数据增强方法而言效率更高,降低了数据成本;生成的图像在符合原始分布的基础上更加多样。
Description
技术领域
本发明属于GAN网络模型技术领域,具体说是一种基于GAN网络的样本数据增强方法及系统。
背景技术
高分子材料的老化已成为一个非常重要的问题,实际造成的危害要比人们想象的严重得多,尤其是在苛刻环境条件下,常导致设备过早失效、材料大量流失,不但在经济上受到很大损失,导致资源的浪费,甚至因材料的失效分解造成对环境的污染。然而,高分子材料在加工、贮存和使用过程中,在光、热、水、化学与生物侵蚀等内外因素的综合作用下,产生降解,表现为性能逐渐下降,从而部分丧失或丧失其使用价值。
对老化样本进行研究,就需要大量的老化样本数据,然而老化样本数据少,难收集,这时候往往需要对老化样本进行数据增强。常用的数据增强方法有:翻转,旋转,裁剪,缩放,平移,抖动等等,但是这些数据增强方法仅仅能对单张图像进行小规模数据增强,且改变了他们的位置特征,但是我们对于某一时刻的老化样本往往需要大规模的样本数据,这要求我们能够对样本进行大规模的数据增强,且不改变它的总体特征分布。
发明内容
为了对老化样本进行大规模数据增强,本发明的目的在于提供一种基于GAN网络的样本数据增强方法,本发明使用多个GAN结构分别学习了不同尺度下分辨率的图像块的分布,并从粗糙到细致、从低分辨率到高分辨率逐步生成真实图像,进而实现对单张图像进行大规模数据增强。
本发明采用如下技术方案:一种基于GAN网络的样本数据增强方法,包含如下步骤:
采集初始样本数据集,初始样本数据集包括多张输入图像;
构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试,对输入图像从粗略的分辨率开始进行多次迭代,迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率,生成输出分辨率的图像;
基于满足输出分辨率的图像生成虚拟样本,将所述虚拟样本与小样本数据集混合,得到增强后的完成样本数据。
GAN网络学习模型包括金字塔结构的生成器{G0,...,GN},训练图像金字塔x:{x0,...,xN},其中xn是图像x的下采样版本,采样因子为rn,r>1,每个生成器GN负责生成对应xn的图像样本。
基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试时,图像样本的生成从最粗尺度开始,然后顺序地通过所有的生成器逐渐生成最好尺度图像,每个尺度都输入噪声图像,所有的生成器和判别器具有相同的感受野,随着生成过程的进行,捕捉更细尺寸的结构。
最粗尺度下,是纯生成过程,即GN将空间高斯白噪声zN映射为一个图像样本更细尺度的每个生成器GN(n<N)为GAN网络模型加入之前尺度下没有生成的细节特征,除了空间噪声之外,每个生成器G还接收较粗尺度生成图像的上采样样本作为输入。
S4中:
从最粗到最细顺序地训练多尺度结构,当每个GAN训练好,就固定,第n个GAN的训练损失包括对抗损失Ladv和重建损失Lrec,如下:
α为超参数,对于对抗损失,每个生成器Gn都设有一个对应的马尔可夫判别器Dn来判别真假,使用WGAN-GP损失,以增加训练稳定性,如下:
λ为超参数,最终判别分数是patch D判别图谱上的平均值,Dn的结构与ψn网络相同,其中,为生成器生成的图像特征;
重建损失为其中zφ是固定的噪声图谱,用/>表示用所述噪声图谱生成第n尺度的生成图像,
对于n<N,用公式
对于n=N,Lrec=||GN(zφ)-xN||2。
采集小样本数据集时,对于老化样品,将样品进行预设温度范围内纯氧老化和热氧老化,间隔时间取出若干片样品并采集其特征图像作为小样本数据集。
迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率时,分辨率在阶段变化的学习尺寸通过下式得到:
xn=xN×r((N-1)/log(N))*log(N-n)+1
n=0,...,N-1。
一种样本数据增强系统,包括初始样本采集模块、模型构建模块、训练测试模块以及生成样本模块;
其中,初始样本采集模块,采集初始样本数据集,初始样本数据集包括多张输入图像;
模型构建模块,构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
训练测试模块,基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试,对输入图像从粗略的分辨率开始进行多次迭代,迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率,生成输出分辨率的图像;
生成样本模块,基于满足输出分辨率的图像生成虚拟样本,将所述虚拟样本与小样本数据集混合,得到增强后的完成样本数据。
一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算可执行程序时能实现本发明所述基于GAN网络的样本数据增强方法。
一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的基于GAN网络的样本数据增强方法。
与现有技术相比,本发明具有如下有益效果:
本发明使用多个GAN结构分别学习了样本图像不同尺度下分辨率的图像块的分布,并从粗糙到细致、从低分辨率到高分辨率逐步生成真实图像,生成的图像符合原始图像的分布,不改变它的纹理结构特征;传统的数据增强方法增强生成的数量有限,本发明能够在生成图像符合原始分布的基础上尽可能的生成多样化的图像,同时也能够对单张图像使用GAN网络进行数据增强,而且产生的虚拟样本数量更多。综上所述,本发明能够对单张图像进行大规模的数据增强,而且生成的图像在符合原始分布的基础上更加多样。,
附图说明
图1为本发明基于GAN网络对老化样本进行数据增强网络结构图。
图2为本发明单尺度生成过程示例图。
图3为本发明实施例中多阶段不同分辨率生成示例。
图4为本发明实施例中老化样本数据增强样例。
具体实施方式
以下结合附图和具体实方法对本发明作进一步的详细说明。
如图1所示,本发明基于GAN网络对老化样本进行数据增强,包含如下步骤:
S1,进行小样本老化样本采集:
将绝缘样品从定子线棒上进行剥离,获取单层或多层堆叠的绝缘片材,将绝缘片材放在玻璃皿中进行热氧老化,每隔一段时间取出若干老化样品,采集老化样本的图像;
S2,构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
模型结构包含金字塔结构的生成器{G0,...,GN},训练图像金字塔x:{x0,...,xN},其中xn是图像x的下采样版本,采样因子为rn,r>1,每个生成器GN负责生成对应xn的真实图像样本,在第n个尺度上,Gn网络的输入是:第n+1个Gn+1网络的生成图像经过上采样后与对应随机噪声相加的结果,Gn网络学习生成图像样本,而D网络判断生成图像样本的真假。
S3,GAN网络学习模型训练时对输入图像从粗略的分辨率开始进行多次迭代,
从训练到测试,基于Coarse-to-Fine思想,由下到上,尺度逐渐由粗糙到精细,图像样本的生成从最粗尺度开始,然后顺序地通过所有的生成器逐渐生成最好尺度图像,每一级尺度都输入噪声图像;所有的生成器和判别器具有相同的感受野,随着生成过程的进行,可以捕捉更细尺寸的结构。在最粗尺度下,是纯生成过程,即GN,将空间高斯白噪声zN映射为一个图像样本而不需要真实图像,如以下公式:
这一尺度的有效感受野通常是图像高度的1/2,GN可以生成图像的整体布局和目标的全局结构。更细尺度的每个生成器GN(n<N)为模型添加上一级尺度下没有生成的细节特征,除了空间高斯白噪声之外,每个生成器G还接收较粗尺度生成图像的上采样样本作为输入,如以下公式
所有生成器G具有相似的结构,具体而言,噪声zn与图像作为输入给一系列卷积层,生成/>中缺少的细节特征,GN的操作如下式:
其中ψn是一个由3×3卷积BN-LeakyReLU组成的5层全卷积网络,在最粗尺度使用32个卷积核(即卷积操作的输出通道数是32),然后每四个尺度增加两倍,生成器是全卷积的,所以在测试时可以通过改变噪声图像的维度以任意尺寸和纵横比生成图像。
如图2所示,在第n个阶段的尺度下,来自第n+1个阶段尺度的生成图像上采样后加到输入噪声图像zn,然后送给5个卷积层,输出一个残差图像,再加上/> 即为GN的输出。
S4,一旦第n个阶段的训练收敛,通过添加三个附加的卷积层来增加生成器的大小,从原始的上采样特征,到新添加卷积层的输出间添加残差连接,重复此过程N次,直到达到所需的输出分辨率;
从最粗到最细顺序地训练多尺度结构,当每个GAN网络学习模型训练好,就会被固定。第n个GAN网络学习模型的训练损失包括对抗损失Ladv和重建损失Lrec,如以下公式
对于对抗损失,每个生成器Gn都有一个对应的马尔可夫判别器Dn来判别图像样本的真假。本发明使用WGAN-GP损失,α为超参数,如以下公式
以增加训练稳定性,最终判别分数是patch D判别图谱上的平均值。Dn的结构与ψn网络相同,λ为超参数。
对于重建损失,为了确保使模型存在可以生成原始图像x的特定噪声图谱集合,选择其中zφ是一些固定的噪声图谱,用/>表示用这些噪声图谱生成第n尺度的生成图像:
对于n<N用公式
对于n=N,使用Lrec=||GN(zφ)-xN||2。
作为上述技术方案的补充,S4中:以缩放因子η对学习率δ(0.1)进行缩放,例如,对于在n阶段的生成器Gn,使用的学习率是δ0 η,对于在n-1阶段的生成器Gn-1,使用的学习率是δ1 η。同时在低分辨率(小于60pix)下往往得不到足够的阶段数去训练。在高分辨率图像上进行训练时,全局布局已经“确定”,此时仅纹理信息比较重要,因为判别器的感受野始终为初始的感受野;因此,要实现全局图像布局,需要一定数量的阶段(通常至少三个)以较低的分辨率去学习,而无需要太多的高分辨率学习,故提出分辨率在阶段变化的学习尺寸为如下公式:
xn=xN×r((N-1)/log(N))*log(N-n)+1
n=0,...,N-1
实施例
本实施例基于GAN网络的样本数据增强方法,包括如下步骤:
步骤一,采集老化样本小样本数据集
将绝缘样品从定子线棒上进行剥离,获取单层或多层堆叠的绝缘片材。将绝缘片材裁剪为1cm×1cm的样品。将样品进行老化,得到117张老化样本数据集作为输入图像。
步骤二,构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
模型包括金字塔结构的GAN,训练和推论都是由粗到细进行的。在每个尺度上,Gn学习生成图像样本,而判别器Dn无法区分所有重桑的图像块和下采样的训练图像块xn;随着金字塔的上升,有效图像块尺寸减小(原图中的黄色区域)。Gn的输入是随机噪声图像zn,来自上一尺度的生成图像是上采样到当前分辨率(除了最低尺度)。在尺度n的生成过程包含所有生成器{G0,...,GN}和所有噪声图像{z0,...,zN}。
步骤三,训练时对输入图像从粗略的分辨率开始进行多次迭代,实际示例如图3;
步骤四,一旦阶段n的训练收敛,通过添加三个附加的卷积层来增加生成器的大小,从原始的上采样特征,到新添加卷积层的输出间添加残差连接,重复此过程N次,直到达到所需的输出分辨率;
低分辨率(小于60pix)下往往得不到足够的阶段数去训练。在高分辨率图像上进行训练时,全局布局已经“确定”,此时仅纹理信息比较重要,因为判别器的感受野始终为11×11。因本发明采取五个阶段以较低的分辨率去学习,而无需要太多的高分辨率学习,这样一来,在缩放r=0.55的情况下,分辨率变化变成了25×34,32×42,42×56,63×84,126×167,188×250。
步骤五,达到训练要求后,利用生成器生成虚拟样本,选取与实际相符的样本与初始小样本数据混合,完成数据增强。
对117张照片分别单独进行训练,得到了117个模型,每个模型对应一张照片进行数据增强,每个模型生成100张照片,筛选出符合实际的样本,加上初始照片,一共得到了8917张图像。增强图像示例如图4所示。
本发明提供一种样本数据增强系统,包括初始样本采集模块、模型构建模块、训练测试模块以及生成样本模块;
其中,初始样本采集模块,采集初始样本数据集,初始样本数据集包括多张输入图像;
模型构建模块,构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
训练测试模块,基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试,对输入图像从粗略的分辨率开始进行多次迭代;迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率,生成输出分辨率的图像;
生成样本模块,基于满足输出分辨率的图像生成虚拟样本,将所述虚拟样本与小样本数据集混合,得到增强后的完成样本数据。
本发明还可以提供一种计算机设备,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取部分或全部所述计算机可执行程序并执行,处理器执行部分或全部计算可执行程序时能实现本发明所述基于GAN网络的样本数据增强方法。
另一方面,本发明提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现本发明所述的基于GAN网络的样本数据增强方法。
所述计算机设备可以采用笔记本电脑、桌面型计算机或工作站。
处理器可以是中央处理器(CPU)、数字信号处理器(DSP)、专用集成电路(ASIC)或现成可编程门阵列(FPGA)。
对于本发明所述存储器,可以是笔记本电脑、桌面型计算机或工作站的内部存储单元,如内存、硬盘;也可以采用外部存储单元,如移动硬盘、闪存卡。
计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、固态硬盘(SSD,Solid State Drives)或光盘等。其中,随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,Resistance Random Access Memory)和动态随机存取存储器(DRAM,Dynamic Random Access Memory)。
Claims (6)
1.一种基于GAN网络的样本数据增强方法,其特征在于,包含如下步骤:
采集初始样本数据集,初始样本数据集包括多张输入图像;
构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试,对输入图像从粗略的分辨率开始进行多次迭代,迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率,生成输出分辨率的图像;基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试时,图像样本的生成从最粗尺度开始,然后顺序地通过所有的生成器逐渐生成最好尺度图像,每个尺度都输入噪声图像,所有的生成器和判别器具有相同的感受野,随着生成过程的进行,捕捉更细尺寸的结构;
最粗尺度下,是纯生成过程,即GN将空间高斯白噪声zN映射为一个图像样本更细尺度的每个生成器GN(n<N)为GAN网络模型加入之前尺度下没有生成的细节特征,除了空间噪声之外,每个生成器G还接收较粗尺度生成图像的上采样样本作为输入;
从最粗到最细顺序地训练多尺度结构,当每个GAN训练好,就固定,第n个GAN的训练损失包括对抗损失Ladv和重建损失Lrec,如下:
α为超参数,对于对抗损失,每个生成器Gn都设有一个对应的马尔可夫判别器Dn来判别真假,使用WGAN-GP损失,以增加训练稳定性,如下:
λ为超参数,最终判别分数是patch D判别图谱上的平均值,Dn的结构与ψn网络相同,其中,为生成器生成的图像特征;
重建损失为其中zφ是固定的噪声图谱,用/>表示用所述噪声图谱生成第n尺度的生成图像,
对于n<N,用公式
对于n=N,
迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率时,分辨率在阶段变化的学习尺寸通过下式得到:
xn=xN×r((N-1)/log(N))*log(N-n)+1
n=0,…,N-1;
基于满足输出分辨率的图像生成虚拟样本,将所述虚拟样本与小样本数据集混合,得到增强后的完成样本数据。
2.根据权利要求1所述的基于GAN网络的样本数据增强方法,其特征在于,GAN网络学习模型包括金字塔结构的生成器{G0,…,GN},训练图像金字塔x:{x0,…,xN},其中xn是图像x的下采样版本,采样因子为rn,r>1,每个生成器GN负责生成对应xn的图像样本。
3.根据权利要求1所述的基于GAN网络的样本数据增强方法,其特征在于,采集小样本数据集时,对于老化样品,将样品进行预设温度范围内纯氧老化和热氧老化,间隔时间取出若干片样品并采集其特征图像作为小样本数据集。
4.一种样本数据增强系统,其特征在于,包括初始样本采集模块、模型构建模块、训练测试模块以及生成样本模块;
其中,初始样本采集模块,采集初始样本数据集,初始样本数据集包括多张输入图像;
模型构建模块,构建利用N个GAN网络结构组成的金字塔形状的GAN网络学习模型;
训练测试模块,基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试,对输入图像从粗略的分辨率开始进行多次迭代;迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率,生成输出分辨率的图像;基于Coarse-to-Fine思想的对GAN网络学习模型进行训练和测试时,图像样本的生成从最粗尺度开始,然后顺序地通过所有的生成器逐渐生成最好尺度图像,每个尺度都输入噪声图像,所有的生成器和判别器具有相同的感受野,随着生成过程的进行,捕捉更细尺寸的结构;
最粗尺度下,是纯生成过程,即GN将空间高斯白噪声zN映射为一个图像样本更细尺度的每个生成器GN(n<N)为GAN网络模型加入之前尺度下没有生成的细节特征,除了空间噪声之外,每个生成器G还接收较粗尺度生成图像的上采样样本作为输入;
从最粗到最细顺序地训练多尺度结构,当每个GAN训练好,就固定,第n个GAN的训练损失包括对抗损失Ladv和重建损失Lrec,如下:
α为超参数,对于对抗损失,每个生成器Gn都设有一个对应的马尔可夫判别器Dn来判别真假,使用WGAN-GP损失,以增加训练稳定性,如下:
λ为超参数,最终判别分数是patch D判别图谱上的平均值,Dn的结构与ψn网络相同,其中,为生成器生成的图像特征;
重建损失为其中zφ是固定的噪声图谱,用/>表示用所述噪声图谱生成第n尺度的生成图像,
对于n<N,用公式
对于n=N,
迭代结果收敛时,添加附加的卷积层来增加生成器的大小,从原始的上采样特征到新添加卷积层的输出间添加残差连接,重复此过程,直到图像的分辨率达到设定的输出分辨率时,分辨率在阶段变化的学习尺寸通过下式得到:
xn=xN×r((N-1)/log(N))*log(N-n)+1
n=0,…,N-1;
生成样本模块,基于满足输出分辨率的图像生成虚拟样本,将所述虚拟样本与小样本数据集混合,得到增强后的完成样本数据。
5.一种计算机设备,其特征在于,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取所述计算机可执行程序并执行,处理器执行计算可执行程序时能实现权利要求1~3中任一项所述基于GAN网络的样本数据增强方法。
6.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现如权利要求1~3中任一项所述的基于GAN网络的样本数据增强方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111178317.0A CN113962360B (zh) | 2021-10-09 | 2021-10-09 | 一种基于gan网络的样本数据增强方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111178317.0A CN113962360B (zh) | 2021-10-09 | 2021-10-09 | 一种基于gan网络的样本数据增强方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113962360A CN113962360A (zh) | 2022-01-21 |
CN113962360B true CN113962360B (zh) | 2024-04-05 |
Family
ID=79463406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111178317.0A Active CN113962360B (zh) | 2021-10-09 | 2021-10-09 | 一种基于gan网络的样本数据增强方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113962360B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114519679B (zh) * | 2022-02-21 | 2022-10-21 | 安徽大学 | 一种sar目标图像数据智能增强方法 |
CN114609493B (zh) * | 2022-05-09 | 2022-08-12 | 杭州兆华电子股份有限公司 | 一种信号数据增强的局部放电信号识别方法 |
CN116663619B (zh) * | 2023-07-31 | 2023-10-13 | 山东科技大学 | 基于gan网络的数据增强方法、设备以及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020062846A1 (en) * | 2018-09-30 | 2020-04-02 | Boe Technology Group Co., Ltd. | Apparatus and method for image processing, and system for training neural network |
CN111666994A (zh) * | 2020-05-28 | 2020-09-15 | 平安科技(深圳)有限公司 | 样本图像数据增强方法、装置、电子设备及存储介质 |
CN112052899A (zh) * | 2020-09-03 | 2020-12-08 | 上海无线电设备研究所 | 一种基于生成对抗网络的单幅舰船目标sar图像生成方法 |
-
2021
- 2021-10-09 CN CN202111178317.0A patent/CN113962360B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020062846A1 (en) * | 2018-09-30 | 2020-04-02 | Boe Technology Group Co., Ltd. | Apparatus and method for image processing, and system for training neural network |
CN111666994A (zh) * | 2020-05-28 | 2020-09-15 | 平安科技(深圳)有限公司 | 样本图像数据增强方法、装置、电子设备及存储介质 |
CN112052899A (zh) * | 2020-09-03 | 2020-12-08 | 上海无线电设备研究所 | 一种基于生成对抗网络的单幅舰船目标sar图像生成方法 |
Non-Patent Citations (1)
Title |
---|
多尺度生成对抗网络的图像超分辨率算法;刘遵雄;蒋中慧;任行乐;;科学技术与工程(第13期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113962360A (zh) | 2022-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962360B (zh) | 一种基于gan网络的样本数据增强方法及系统 | |
CN108510504B (zh) | 图像分割方法和装置 | |
CN112016507A (zh) | 基于超分辨率的车辆检测方法、装置、设备及存储介质 | |
CN111160217B (zh) | 一种行人重识别系统对抗样本生成方法及系统 | |
CN110111276B (zh) | 基于空-谱信息深度利用的高光谱遥感影像超分辨率方法 | |
CN110288524B (zh) | 基于增强型上采样和辨别融合机制的深度学习超分辨率方法 | |
CN110245711A (zh) | 基于角度旋转生成网络的sar目标识别方法 | |
CN110245683B (zh) | 一种少样本目标识别的残差关系网络构建方法及应用 | |
CN111667445A (zh) | 一种基于Attention多特征融合的图像压缩感知重建方法 | |
CN116071309B (zh) | 元器件的声扫缺陷检测方法、装置、设备和存储介质 | |
CN116310425B (zh) | 一种细粒度图像检索方法、系统、设备及存储介质 | |
CN113538246A (zh) | 基于无监督多阶段融合网络的遥感图像超分辨率重建方法 | |
CN112184606A (zh) | 一种基于拉普拉斯金字塔的可见光图像与红外图像融合方法 | |
CN111340189B (zh) | 一种空间金字塔图卷积网络实现方法 | |
CN112257727A (zh) | 一种基于深度学习自适应可变形卷积的特征图像提取方法 | |
CN115936992A (zh) | 一种轻量级Transformer的垃圾图像超分辨方法及系统 | |
CN115588024A (zh) | 一种基于人工智能的复杂工业影像边缘提取方法及装置 | |
CN112508106B (zh) | 一种基于卷积神经网络的水下图像分类方法 | |
CN110503157B (zh) | 基于细粒度图像的多任务卷积神经网络的图像隐写分析方法 | |
EP3937120B1 (en) | Computer-implemented method, computer program product and system for processing images | |
CN116188272B (zh) | 适用于多模糊核的两阶段深度网络图像超分辨率重建方法 | |
CN108960285B (zh) | 一种分类模型生成方法、舌体图像分类方法及装置 | |
CN115205527A (zh) | 一种基于域适应和超分辨率的遥感图像双向语义分割方法 | |
CN115689880A (zh) | 一种基于fsrcnn的荧光显微图像超分辨方法 | |
Lu et al. | Flower classification based on single petal image and machine learning methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |