CN107392255B - 少数类图片样本的生成方法、装置、计算设备及存储介质 - Google Patents
少数类图片样本的生成方法、装置、计算设备及存储介质 Download PDFInfo
- Publication number
- CN107392255B CN107392255B CN201710637315.0A CN201710637315A CN107392255B CN 107392255 B CN107392255 B CN 107392255B CN 201710637315 A CN201710637315 A CN 201710637315A CN 107392255 B CN107392255 B CN 107392255B
- Authority
- CN
- China
- Prior art keywords
- countermeasure network
- training
- random noise
- preset
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明适用计算机技术领域,提供了一种少数类图片样本的生成方法、装置、计算设备及存储介质,该方法包括:当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种少数类图片样本的生成方法、装置、计算设备及存储介质。
背景技术
随着人工智能技术的日趋完善,机器学习越来越多的被运用在人们的日常生活中,其中监督式机器学习又因其高准确度而成为机器学习中的主流算法之一。监督学习需要有标签的数据作为训练的指导依据,训练集的质量直接影响模型效果。然而,在现实生活中,很多可以取得的训练集会存在标签不平衡(label imbalance/class imbalance)的问题。比如利用机器学习判定一组肺部的影像是否有肺病,需要的训练集为已经人为判定过的有肺病的肺部影像和没有肺病的肺部影像。一般情况下,没有肺病的肺部影像远多于有肺病的肺部影像,因此产生标签不平衡问题。
标签不平衡问题的解决方法可以分为三类。第一类是通过改变图片样本数量来达到标签平衡,这其中又包含两种方法,一种是欠采样(under-sampling),即通过删去一部分将多数类图片样本或者增加一些少数类图片样本来达到标签平衡;另一种是过采样(over-sampling),即通过增加一些少数类图片样本来达到标签平衡。第二类解决标签不平衡的方法为通过算法的改进增加算法对标签不平衡的适应性,比如对分错少数类和分错多数类的损失设置不同的权重。第三类方法为通过特征选择来解决标签不平衡问题。
现有的增加少数类图片样本的方法大多通过模拟特定少数类图片样本来增加少数图片样本的数量,这种方法泛化效果不好,抗噪性差。换而言之,现有的方法生成的少数类图片样本与特定的已有的少数类图片样本高度相似,缺乏普遍性。
发明内容
本发明的目的在于提供一种少数类图片样本的生成方法、装置、计算设备及存储介质,旨在解决由于现有技术抗噪性和泛化效果不佳,导致生成的少数类图片样本缺乏普遍性且生成效率不高、用户体验不佳的问题。
一方面,本发明提供了一种少数类图片样本的生成方法,所述方法包括下述步骤:
当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
根据所述训练后的生成对抗网络,构造条件生成对抗网络;
通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;
根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本。
另一方面,本发明提供了一种少数类图片样本的生成装置,所述装置包括:
第一模型训练单元,用于当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
模型构造单元,用于根据所述训练后的生成对抗网络,构造条件生成对抗网络;
第二模型训练单元,用于通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;以及
样本生成单元,用于根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本。
另一方面,本发明还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述少数类图片样本的生成方法的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述少数类图片样本的生成方法的步骤。
本发明当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
附图说明
图1是本发明实施例一提供的少数类图片样本的生成方法的实现流程图;
图2是本发明实施例二提供的少数类图片样本的生成装置的结构示意图;
图3是本发明实施例三提供的少数类图片样本的生成装置的结构示意图;以及
图4是本发明实施例四提供的计算设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的少数类图片样本的生成方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,训练样本集由标签不平衡图片样本组成。
本发明实施例适用于机器学习,尤其适用于监督式机器学习,以方便根据标签不平衡图片样本生成少数类图片样本,从而得到标签平衡的训练集,提高机器学习效果。在本发明实施例中,如果用户获取的用于机器学习的图片样本标签不平衡,则需要在使用这些图片样本进行机器学习之前,首先根据这些标签不平衡的图片样本生成少数类图片样本,以解决标签不平衡问题。为了解决上述问题,预先构造了由神经网络(例如,多层感知机、卷积神经网络)组成的生成对抗网络,当接收到生成少数类图片样本的用户请求时,首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络,然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练,即学习从随机噪音向量到图片样本的映射关系,根据训练过程中学习到的映射关系,得到训练后的生成对抗网络。其中,训练样本集由标签不平衡图片样本组成,随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布,也可以为泊松分布、二项分布等离散型分布。
优选地,在通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练时,可以首先将随机噪音向量输入生成对抗网络G(z),根据预设的训练样本集对对抗网络G(z)进行训练,得到第一生成样本,接着将第一生成样本输入预先构造的第一判别模型D(x),以判定第一生成样本是否为真实样本,得到第一判别结果D(G(z)),若该第一判别结果正确,则G(z)的损失增加,若该第一判别结果不正确,则D(x)损失增加,然后根据公式和分别对D(x)和G(z)进行训练,即G(z)尽可能让自己的输出像真实样本,而D(x)则尽可能将不是真实样本的情况分辨出来,当满足预设的第一训练结束条件时,结束训练,得到训练后的生成对抗网络,从而提高了模型训练效率。其中,第一判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,V(G,D)为价值方程,pdata(x)为真实样本的分布,pz(z)为自定义的先验分布,E表示期望,D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别,0≤D(x)的判别值≤1,第一训练结束条件可以为pz(z)=pdata(x),即
具体地,在根据 和分别对D(x)和G(z)进1行训练时,首先构造损失函数然后使用m个真实样本{x(1),x(2),...,x(m)}和m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度上升法更新D(x)的权重分布,接着使用m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度下降法更新G(z)的权重分布,当时,结束训练。其中,m为真实样本数据集中的样本数量,x(i)为第i个真实样本,z(i)为第i个随机噪音向量。
进一步优选地,也可以直接将真实样本输入该第一判别模型D(x),以判定是否为真实样本,得到判别结果,从而进一步优化对第一判别模型D(x)的训练。
在步骤S102中,根据训练后的生成对抗网络,构造条件生成对抗网络。
在本发明实施例中,首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层,从而降低了训练样本数量,同时提高了生成对抗网络的训练速率。具体地,该条件生成对抗网络可由神经网络(例如,多层感知机、卷积神经网络)组成。
在步骤S103中,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。
在本发明实施例中,得到条件生成对抗网络之后,首先将随机噪音向量和预设标签输入条件生成对抗网络,然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,即学习从随机噪音向量到少数类图片样本的映射关系,根据训练过程中学习到的映射关系,最后得到训练后的条件生成对抗网络。优选地,将随机噪音向量和预设标签串联输入条件生成对抗网络,从而提高输入速率,进而提高条件生成对抗网络的训练效率。
优选地,在通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练时,可以首先将随机噪音向量和预设标签输入条件生成对抗网络G(z|y),通过训练样本集对条件生成对抗网络G(z|y)进行训练,得到第二生成样本,接着将第二生成样本输入预先构造的第二判别模型D(x|y),以判定第二生成样本是否为真实样本,得到第二判别结果D(G(z|y)),若该第二判别结果正确,则G(z|y)的损失增加,若该第二判别结果不正确,则D(x|y)损失增加,然后根据公式和 分别对G(z|y)和D(x|y)进行训练,即G(z|y)尽量去欺骗D(x|y),而D(x|y)尽量去辨别输入样本是否标签为y的真实样本,两者博弈最后达到预设平衡(例如,纳什均衡)来得到最优的G(z|y),最后当满足预设的第二训练结束条件时,结束训练,得到训练后的条件生成对抗网络,从而提高了模型训练效率。其中,第二判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,0≤D(x|y)的判别值≤1,第二训练结束条件可以为pz(z)=pdata(x),即
在步骤S104中,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本。
在本发明实施例中,得到训练后的条件生成对抗网络之后,首先将随机噪音向量和用户请求中包括的少数类标签输入到训练后的条件生成对抗网络,然后通过训练样本集,使用训练后的条件生成对抗网络生成图片样本并输出,最后将输出的图片样本设置为少数类图片样本,从而实现了少数类图片样本的生成,提高了生成少数类图片样本的质量。
在本发明实施例中,首先通过预先构造的生成对抗网络与所有图片样本(训练样本集中所有的非少数类图片样本和少数类图片样本)训练出一个可以生成图片样本的训练后的生成对抗网络,然后以这个训练后的生成对抗网络为基础构造出条件生成对抗网络,并通过少数类图片样本数据及非少数类图片样本对这个条件生成对抗网络进行训练,以对这个条件生成对抗网络进行优化,得到训练后的条件生成对抗网络,最后通过训练后的条件生成对抗网络得到与训练样本集中少数类图片样本类似的少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
实施例二:
图2示出了本发明实施例二提供的少数类图片样本的生成装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
第一模型训练单元21,用于当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,训练样本集由标签不平衡图片样本组成。
在本发明实施例中,如果用户获取的用于机器学习的图片样本标签不平衡,则需要在使用这些图片样本进行机器学习之前,首先根据这些标签不平衡的图片样本生成少数类图片样本,以解决标签不平衡问题。为了解决上述问题,预先构造了由神经网络(例如,多层感知机、卷积神经网络)组成的生成对抗网络,当接收到生成少数类图片样本的用户请求时,第一模型训练单元21首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络,然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练,即学习从随机噪音向量到图片样本的映射关系,根据训练过程中学习到的映射关系,得到训练后的生成对抗网络。其中,训练样本集由标签不平衡图片样本组成,随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布,也可以为泊松分布、二项分布等离散型分布。
模型构造单元22,用于根据训练后的生成对抗网络,构造条件生成对抗网络。
在本发明实施例中,模型构造单元22首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层,从而降低了训练样本数量,同时提高了生成对抗网络的训练速率。具体地,该条件生成对抗网络可由神经网络(例如,多层感知机、卷积神经网络)组成。
第二模型训练单元23,用于通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。
在本发明实施例中,得到条件生成对抗网络之后,第二模型训练单元23首先将随机噪音向量和预设标签输入条件生成对抗网络,然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,即学习从随机噪音向量到少数类图片样本的映射关系,根据训练过程中学习到的映射关系,最后得到训练后的条件生成对抗网络。优选地,将随机噪音向量和预设标签串联输入条件生成对抗网络,从而提高输入速率,进而提高条件生成对抗网络的训练效率。
样本生成单元24,用于根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本。
在本发明实施例中,得到训练后的条件生成对抗网络之后,样本生成单元24首先将随机噪音向量和用户请求中包括的少数类标签输入训练后的条件生成对抗网络,然后通过训练样本集,使用训练后的条件生成对抗网络生成图片样本并输出,最后将输出的图片样本设置为少数类图片样本,从而实现了少数类图片样本的生成,提高了生成少数类图片样本的质量。
在本发明实施例中,当接收到生成少数类图片样本的用户请求时,第一模型训练单元21通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,模型构造单元22根据训练后的生成对抗网络,构造条件生成对抗网络,第二模型训练单元23通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,样本生成单元24根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
在本发明实施例中,少数类图片样本的生成装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例三:
图3示出了本发明实施例三提供的少数类图片样本的生成装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
第一模型训练单元31,用于通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,训练样本集由标签不平衡图片样本组成。
在本发明实施例中,如果用户获取的用于机器学习的图片样本标签不平衡,则需要在使用这些图片样本进行机器学习之前,首先根据这些标签不平衡的图片样本生成少数类图片样本,以解决标签不平衡问题。为了解决上述问题,预先构造了由神经网络(例如,多层感知机、卷积神经网络)组成的生成对抗网络,当接收到生成少数类图片样本的用户请求时,第一模型训练单元31首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络,然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练,即学习从随机噪音向量到图片样本的映射关系,根据训练过程中学习到的映射关系,得到训练后的生成对抗网络。其中,训练样本集由标签不平衡图片样本组成,随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布,也可以为泊松分布、二项分布等离散型分布。
优选地,在通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练时,可以首先将随机噪音向量输入生成对抗网络G(z),根据预设的训练样本集对对抗网络G(z)进行训练,得到第一生成样本,接着将第一生成样本输入预先构造的第一判别模型D(x),以判定第一生成样本是否为真实样本,得到第一判别结果D(G(z)),若该第一判别结果正确,则G(z)的损失增加,若该第一判别结果不正确,则D(x)损失增加,然后根据公式和分别对D(x)和G(z)进行训练,即G(z)尽可能让自己的输出像真实样本,而D(x)则尽可能将不是真实样本的情况分辨出来,当满足预设的第一训练结束条件时,结束训练,得到训练后的生成对抗网络,从而提高了模型训练效率。其中,第一判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,V(G,D)为价值方程,pdata(x)为真实样本的分布,pz(z)为自定义的先验分布,E表示期望,D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别,0≤D(x)≤1,第一训练结束条件可以为pz(z)=pdata(x),即
具体地,在根据 和分别对D(x)和G(z)进行训练时,首先构造损失函数然后使用m个真实样本{x(1),x(2),...,x(m)}和m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度上升法更新D(x)的权重分布,接着使用m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度下降法更新G(z)的权重分布,当时,结束训练。其中,m为真实样本数据集中的样本数量,x(i)为第i个真实样本,z(i)为第i个随机噪音向量。
进一步优选地,也可以直接将真实样本输入该第一判别模型D(x),以判定是否为真实样本,得到判别结果,从而进一步优化对第一判别模型D(x)的训练。
模型构造单元32,用于根据训练后的生成对抗网络,构造条件生成对抗网络。
在本发明实施例中,模型构造单元32首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层,从而降低了训练样本数量,同时提高了生成对抗网络的训练速率。具体地,该条件生成对抗网络可由神经网络(例如,多层感知机、卷积神经网络)组成。
第二模型训练单元33,用于通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。
在本发明实施例中,得到条件生成对抗网络之后,第二模型训练单元33首先将随机噪音向量和预设标签输入条件生成对抗网络,然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,即学习从随机噪音向量到少数类图片样本的映射关系,根据训练过程中学习到的映射关系,最后得到训练后的条件生成对抗网络。优选地,将随机噪音向量和预设标签串联输入条件生成对抗网络,从而提高输入速率,进而提高条件生成对抗网络的训练效率。
优选地,在通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练时,可以首先将随机噪音向量和预设标签输入条件生成对抗网络G(z|y),通过训练样本集对条件生成对抗网络G(z|y)进行训练,得到第二生成样本,接着将第二生成样本输入预先构造的第二判别模型D(x|y),以判定第二生成样本是否为真实样本,得到第二判别结果D(G(z|y)),若该第二判别结果正确,则G(z|y)的损失增加,若该第二判别结果不正确,则D(x|y)损失增加,然后根据公式和 分别对G(z|y)和D(x|y)进行训练,即G(z|y)尽量去欺骗D(x|y),而D(x|y)尽量去辨别输入样本是否标签为y的真实样本,两者博弈最后达到预设平衡(例如,纳什均衡)来得到最优的G(z|y),最后当满足预设的第二训练结束条件时,结束训练,得到训练后的条件生成对抗网络,从而提高了模型训练效率。其中,第二判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,第二训练结束条件可以为pz(z)=pdata(x),即
样本生成单元34,用于根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本。
在本发明实施例中,得到训练后的条件生成对抗网络之后,样本生成单元34首先将随机噪音向量和用户请求中包括的少数类标签输入到训练后的条件生成对抗网络,然后通过训练样本集,使用训练后的条件生成对抗网络生成图片样本并输出,最后将输出的图片样本设置为少数类图片样本,从而实现了少数类图片样本的生成,提高了生成少数类图片样本的质量。
因此,优选地,该第一模型训练单元31包括:
第一样本生成单元311,用于根据随机噪音向量和训练样本集,通过生成对抗网络生成第一生成样本;
第一判别单元312,用于根据第一生成样本,通过预先构造的第一判别模型获取第一判别结果;
第一训练单元313,用于根据预设的第一价值方程分别对生成对抗网络和第一判别模型进行训练;
优选地,该第二模型训练单元33包括:
第二样本生成单元331,用于根据随机噪音向量、预设标签以及训练样本集,通过条件生成对抗网络生成第二生成样本;
第二判别单元332,用于根据第二生成样本,通过预先构造的第二判别模型获取第二判别结果;
第二训练单元333,用于根据预设的第二价值方程分别对条件生成对抗网络和第二判别模型进行训练。
在本发明实施例中,少数类图片样本的生成装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例四:
图4示出了本发明实施例四提供的计算设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的计算设备4包括处理器40、存储器41以及存储在存储器41中并可在处理器40上运行的计算机程序42。该处理器40执行计算机程序42时实现上述少数类图片样本的生成方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,处理器40执行计算机程序42时实现上述各装置实施例中各单元的功能,例如图2所示单元21至24、图3所示单元31至34的功能。
在本发明实施例中,该处理器40执行计算机程序42时实现上述各个屏幕唤醒的控制方法实施例中的步骤时,当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
该计算设备4中处理器40在执行计算机程序42时实现的步骤具体可参考实施例一中方法的描述,在此不再赘述。
实施例五:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述少数类图片样本的生成方法实施例中的步骤,例如,图1所示的步骤S101至S104。或者,该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能,例如图2所示单元21至24、图3所示单元31至34的功能。
在本发明实施例中,当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。该计算机程序被处理器执行时实现的少数类图片样本的生成方法进一步可参考前述方法实施例中步骤的描述,在此不再赘述。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种少数类图片样本的生成方法,其特征在于,所述方法包括下述步骤:
当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
根据所述训练后的生成对抗网络,构造条件生成对抗网络;首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层;
通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;
根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本;
所述通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练的步骤,包括:
根据所述随机噪音向量和训练样本集,通过所述生成对抗网络G(z)生成第一生成样本;
根据所述第一生成样本,通过预先构造的第一判别模型D(x)获取第一判别结果;
根据预设的第一价值方程:
分别对所述生成对抗网络和第一判别模型进行训练,其中,V(G,D)为价值方程,pdata(x)为真实样本的分布,pz(z)为自定义的先验分布,E表示期望,D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别,0≤D(x)的判别值≤1,训练结束条件为
对所述生成对抗网络和第一判别模型进行训练中,构造损失函数
然后使用m个真实样本{x(1),x(2),...,x(n)}和m个随机噪音向量{z(1),z(2),...,z(m)}计算
并使用梯度上升法更新D(x)的权重分布,接着使用m个随机噪音向量{Z(1),z(2),...,z(m)}计算
并使用梯度下降法更新G(z)的权重分布;
所述通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练的步骤,包括:
根据所述随机噪音向量、预设标签以及训练样本集,通过所述条件生成对抗网络G(z|y)生成第二生成样本;
根据所述第二生成样本,通过预先构造的第二判别模型D(x|y)获取第二判别结果;
根据预设的第二价值方程
2.如权利要求1所述的方法,其特征在于,所述条件生成对抗网络的非输入层与所述训练后的生成对抗网络对应的非输入层具有相同的结构和权重分布。
3.一种少数类图片样本的生成装置,其特征在于,所述装置包括:
第一模型训练单元,用于当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
模型构造单元,用于根据所述训练后的生成对抗网络,构造条件生成对抗网络;首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层;
第二模型训练单元,用于通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;以及
样本生成单元,用于根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本;
所述第一模型训练单元包括:
第一样本生成单元,用于根据所述随机噪音向量和训练样本集,通过所述生成对抗网络G(z)生成第一生成样本;
第一判别单元,用于根据所述第一生成样本,通过预先构造的第一判别模型D(x)获取第一判别结果;
第一训练单元,用于根据预设的第一价值方程
分别对所述生成对抗网络和第一判别模型进行训练,其中,V(G,D)为价值方程,pdata(x)为真实样本的分布,pz(z)为自定义的先验分布,E表示期望,D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别,0≤D(x)的判别值≤1,训练结束条件为
对所述生成对抗网络和第一判别模型进行训练中,构造损失函数
然后使用m个真实样本{x(1),x(2),...,x(n)}和m个随机噪音向量{z(1),z(2),...,z(m)}计算
并使用梯度上升法更新D(x)的权重分布,接着使用m个随机噪音向量(Z(1),z(2),...,z(m)}计算
并使用梯度下降法更新G(z)的权重分布;
所述第二模型训练单元包括:
第二样本生成单元,用于根据所述随机噪音向量、预设标签以及训练样本集,通过所述条件生成对抗网络生成第二生成样本;
第二判别单元,用于根据所述第二生成样本,通过预先构造的第二判别模型获取第二判别结果;
第二训练单元,用于根据预设的第二价值方程
4.如权利要求3所述的装置,其特征在于,所述条件生成对抗网络的非输入层与所述训练后的生成对抗网络对应的非输入层具有相同的结构和权重分布。
5.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至2任一项所述方法的步骤。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至2任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710637315.0A CN107392255B (zh) | 2017-07-31 | 2017-07-31 | 少数类图片样本的生成方法、装置、计算设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710637315.0A CN107392255B (zh) | 2017-07-31 | 2017-07-31 | 少数类图片样本的生成方法、装置、计算设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107392255A CN107392255A (zh) | 2017-11-24 |
CN107392255B true CN107392255B (zh) | 2020-06-12 |
Family
ID=60342295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710637315.0A Active CN107392255B (zh) | 2017-07-31 | 2017-07-31 | 少数类图片样本的生成方法、装置、计算设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107392255B (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108876847B (zh) * | 2017-11-30 | 2021-04-27 | 北京旷视科技有限公司 | 图像定位方法、装置、系统和存储介质 |
CN108090902B (zh) * | 2017-12-30 | 2021-12-31 | 中国传媒大学 | 一种基于多尺度生成对抗网络的无参考图像质量客观评价方法 |
CN108121975B (zh) * | 2018-01-04 | 2022-04-19 | 中科汇通投资控股有限公司 | 一种联合原始数据和生成数据的人脸识别方法 |
CN108333183B (zh) * | 2018-01-31 | 2021-03-16 | 西安工程大学 | 一种基于dcgan和dcnn的色织衬衫裁片缺陷检测方法 |
CN110210505B (zh) * | 2018-02-28 | 2020-12-01 | 北京三快在线科技有限公司 | 样本数据的生成方法、装置及电子设备 |
CN108460761A (zh) * | 2018-03-12 | 2018-08-28 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
CN108629680A (zh) * | 2018-04-03 | 2018-10-09 | 中国农业银行股份有限公司 | 一种风险识别方法及系统 |
CN108846405A (zh) * | 2018-04-11 | 2018-11-20 | 东莞迪赛软件技术有限公司 | 基于ssgan的不平衡医保数据分类方法 |
CN108648188B (zh) * | 2018-05-15 | 2022-02-11 | 南京邮电大学 | 一种基于生成对抗网络的无参考图像质量评价方法 |
CN108763857A (zh) * | 2018-05-29 | 2018-11-06 | 浙江工业大学 | 一种基于相似度生成对抗网络的过程软测量建模方法 |
CN109190648B (zh) * | 2018-06-26 | 2020-12-29 | Oppo(重庆)智能科技有限公司 | 模拟环境生成方法、装置、移动终端及计算机可读取存储介质 |
CN109460708A (zh) * | 2018-10-09 | 2019-03-12 | 东南大学 | 一种基于生成对抗网络的林火图像样本生成方法 |
CN109508647A (zh) * | 2018-10-22 | 2019-03-22 | 北京理工大学 | 一种基于生成对抗网络的光谱数据库扩展方法 |
CN109543720B (zh) * | 2018-10-30 | 2023-10-27 | 东华大学 | 一种基于对抗生成网络的晶圆图缺陷模式识别方法 |
CN109658369A (zh) * | 2018-11-22 | 2019-04-19 | 中国科学院计算技术研究所 | 视频智能生成方法及装置 |
CN109634961B (zh) * | 2018-12-05 | 2021-06-04 | 杭州大拿科技股份有限公司 | 一种试卷样本生成方法、装置、电子设备和存储介质 |
US10949706B2 (en) | 2019-01-16 | 2021-03-16 | Microsoft Technology Licensing, Llc | Finding complementary digital images using a conditional generative adversarial network |
CN109815920A (zh) * | 2019-01-29 | 2019-05-28 | 南京信息工程大学 | 基于卷积神经网络和对抗卷积神经网络的手势识别方法 |
CN110188824B (zh) * | 2019-05-31 | 2021-05-14 | 重庆大学 | 一种小样本植物病害识别方法及系统 |
CN110276802B (zh) * | 2019-06-26 | 2021-08-17 | 湖南大学 | 医学图像中病症组织定位方法、装置与设备 |
CN110245459B (zh) * | 2019-06-28 | 2021-06-01 | 北京师范大学 | 激光清洗效果预览方法及装置 |
CN110334657B (zh) * | 2019-07-08 | 2020-08-25 | 创新奇智(北京)科技有限公司 | 一种鱼眼畸变图像的训练样本生成方法、系统及电子设备 |
CN110427994A (zh) * | 2019-07-24 | 2019-11-08 | 腾讯医疗健康(深圳)有限公司 | 消化道内镜图像处理方法、装置、存储介质、设备及系统 |
CN110647986A (zh) * | 2019-08-13 | 2020-01-03 | 杭州电子科技大学 | 一种基于对抗式生成网络的道路破损图像生成方法 |
CN111784592A (zh) * | 2020-05-19 | 2020-10-16 | 知昇(上海)人工智能科技有限公司 | 一种基于gan的自动化设计图像生成方法 |
CN112215268A (zh) * | 2020-09-27 | 2021-01-12 | 浙江工业大学 | 一种灾害天气卫星云图分类方法和装置 |
CN112116025A (zh) * | 2020-09-28 | 2020-12-22 | 北京嘀嘀无限科技发展有限公司 | 用户分类模型的训练方法、装置、电子设备及存储介质 |
CN112613599A (zh) * | 2020-12-15 | 2021-04-06 | 江西师范大学 | 一种基于生成对抗网络过采样的网络入侵检测方法 |
TWI845797B (zh) | 2020-12-17 | 2024-06-21 | 緯創資通股份有限公司 | 物件辨識裝置及物件辨識方法 |
CN112712002B (zh) * | 2020-12-24 | 2024-05-14 | 深圳力维智联技术有限公司 | 基于cgan的环境监控方法、装置、系统及存储介质 |
-
2017
- 2017-07-31 CN CN201710637315.0A patent/CN107392255B/zh active Active
Non-Patent Citations (4)
Title |
---|
Conditional Generative Adversarial Nets;Mehdi Mirza等;《arXiv》;20141106;1-7 * |
GAN:生成式对抗网络介绍和其优缺点以及研究现状;qq_34420188;《CSDN》;20170629;1-8 * |
Generative Adversarial Nets;Ian J. Goodfellow等;《arXiv》;20140610;1-9 * |
生成式对抗网络GAN的研究进展与展望;王坤峰 等;《自动化学报》;20170331;第43卷(第3期);322-331 * |
Also Published As
Publication number | Publication date |
---|---|
CN107392255A (zh) | 2017-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107392255B (zh) | 少数类图片样本的生成方法、装置、计算设备及存储介质 | |
CN111639710B (zh) | 图像识别模型训练方法、装置、设备以及存储介质 | |
US20210256403A1 (en) | Recommendation method and apparatus | |
JP2018063504A (ja) | 生成モデル学習方法、装置及びプログラム | |
CN112052948B (zh) | 一种网络模型压缩方法、装置、存储介质和电子设备 | |
CN110245550B (zh) | 一种基于总体余弦分布的人脸噪音数据集cnn训练方法 | |
CN107911491A (zh) | 信息推荐方法、装置及存储介质、服务器和移动终端 | |
WO2015103964A1 (en) | Method, apparatus, and device for determining target user | |
CN107947951A (zh) | 用户群组推荐方法、装置及存储介质和服务器 | |
CN108229268A (zh) | 表情识别及卷积神经网络模型训练方法、装置和电子设备 | |
WO2019202073A1 (en) | Neural networks for scalable continual learning in domains with sequentially learned tasks | |
CN112241715A (zh) | 模型训练方法、表情识别方法、装置、设备及存储介质 | |
CN111401219B (zh) | 一种手掌关键点检测方法和装置 | |
CN111553428A (zh) | 用于训练判别模型的方法、装置、设备及可读存储介质 | |
CN116542321B (zh) | 基于扩散模型的图像生成模型压缩和加速方法及系统 | |
WO2023206771A1 (zh) | 基于决策流图的环境建模方法、装置和电子设备 | |
CN113726545B (zh) | 基于知识增强生成对抗网络的网络流量生成方法及装置 | |
CN112149634A (zh) | 图像生成器的训练方法、装置、设备以及存储介质 | |
CN113633983A (zh) | 虚拟角色表情控制的方法、装置、电子设备及介质 | |
CN111523467A (zh) | 人脸跟踪方法和装置 | |
CN114528490A (zh) | 一种基于用户长短期兴趣的自监督序列推荐方法 | |
CN113156473B (zh) | 信息融合定位系统卫星信号环境的自适应判别方法 | |
CN117437467A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN117216223A (zh) | 对话文本的生成方法和装置、存储介质及电子设备 | |
CN114373034B (zh) | 图像处理方法、装置、设备、存储介质及计算机程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |