CN107392255B

CN107392255B - 少数类图片样本的生成方法、装置、计算设备及存储介质

Info

Publication number: CN107392255B
Application number: CN201710637315.0A
Authority: CN
Inventors: 梁予之; 杨敏; 曲强
Original assignee: Shenzhen Institute of Advanced Technology of CAS
Current assignee: Shenzhen Institute of Advanced Technology of CAS
Priority date: 2017-07-31
Filing date: 2017-07-31
Publication date: 2020-06-12
Anticipated expiration: 2037-07-31
Also published as: CN107392255A

Abstract

本发明适用计算机技术领域，提供了一种少数类图片样本的生成方法、装置、计算设备及存储介质，该方法包括：当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，根据训练后的生成对抗网络，构造条件生成对抗网络，通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本，从而提高了生成的少数类图片样本的泛化效果和质量，进而提高了少数类图片样本的生成效率。

Description

少数类图片样本的生成方法、装置、计算设备及存储介质

技术领域

本发明属于计算机技术领域，尤其涉及一种少数类图片样本的生成方法、装置、计算设备及存储介质。

背景技术

随着人工智能技术的日趋完善，机器学习越来越多的被运用在人们的日常生活中，其中监督式机器学习又因其高准确度而成为机器学习中的主流算法之一。监督学习需要有标签的数据作为训练的指导依据，训练集的质量直接影响模型效果。然而，在现实生活中，很多可以取得的训练集会存在标签不平衡(label imbalance/class imbalance)的问题。比如利用机器学习判定一组肺部的影像是否有肺病，需要的训练集为已经人为判定过的有肺病的肺部影像和没有肺病的肺部影像。一般情况下，没有肺病的肺部影像远多于有肺病的肺部影像，因此产生标签不平衡问题。

标签不平衡问题的解决方法可以分为三类。第一类是通过改变图片样本数量来达到标签平衡，这其中又包含两种方法，一种是欠采样(under-sampling)，即通过删去一部分将多数类图片样本或者增加一些少数类图片样本来达到标签平衡；另一种是过采样(over-sampling)，即通过增加一些少数类图片样本来达到标签平衡。第二类解决标签不平衡的方法为通过算法的改进增加算法对标签不平衡的适应性，比如对分错少数类和分错多数类的损失设置不同的权重。第三类方法为通过特征选择来解决标签不平衡问题。

现有的增加少数类图片样本的方法大多通过模拟特定少数类图片样本来增加少数图片样本的数量，这种方法泛化效果不好，抗噪性差。换而言之，现有的方法生成的少数类图片样本与特定的已有的少数类图片样本高度相似，缺乏普遍性。

发明内容

本发明的目的在于提供一种少数类图片样本的生成方法、装置、计算设备及存储介质，旨在解决由于现有技术抗噪性和泛化效果不佳，导致生成的少数类图片样本缺乏普遍性且生成效率不高、用户体验不佳的问题。

一方面，本发明提供了一种少数类图片样本的生成方法，所述方法包括下述步骤：

当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，所述训练样本集由标签不平衡图片样本组成；

根据所述训练后的生成对抗网络，构造条件生成对抗网络；

通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练；

根据所述随机噪音向量和所述用户请求中包括的少数类标签，通过所述训练后的条件生成对抗网络生成少数类图片样本。

另一方面，本发明提供了一种少数类图片样本的生成装置，所述装置包括：

第一模型训练单元，用于当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，所述训练样本集由标签不平衡图片样本组成；

模型构造单元，用于根据所述训练后的生成对抗网络，构造条件生成对抗网络；

第二模型训练单元，用于通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练；以及

样本生成单元，用于根据所述随机噪音向量和所述用户请求中包括的少数类标签，通过所述训练后的条件生成对抗网络生成少数类图片样本。

另一方面，本发明还提供了一种计算设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如所述少数类图片样本的生成方法的步骤。

另一方面，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如所述少数类图片样本的生成方法的步骤。

本发明当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，根据训练后的生成对抗网络，构造条件生成对抗网络，通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本，从而提高了生成的少数类图片样本的泛化效果和质量，进而提高了少数类图片样本的生成效率。

附图说明

图1是本发明实施例一提供的少数类图片样本的生成方法的实现流程图；

图2是本发明实施例二提供的少数类图片样本的生成装置的结构示意图；

图3是本发明实施例三提供的少数类图片样本的生成装置的结构示意图；以及

图4是本发明实施例四提供的计算设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述：

实施例一：

图1示出了本发明实施例一提供的少数类图片样本的生成方法的实现流程，为了便于说明，仅示出了与本发明实施例相关的部分，详述如下：

在步骤S101中，当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，训练样本集由标签不平衡图片样本组成。

本发明实施例适用于机器学习，尤其适用于监督式机器学习，以方便根据标签不平衡图片样本生成少数类图片样本，从而得到标签平衡的训练集，提高机器学习效果。在本发明实施例中，如果用户获取的用于机器学习的图片样本标签不平衡，则需要在使用这些图片样本进行机器学习之前，首先根据这些标签不平衡的图片样本生成少数类图片样本，以解决标签不平衡问题。为了解决上述问题，预先构造了由神经网络(例如，多层感知机、卷积神经网络)组成的生成对抗网络，当接收到生成少数类图片样本的用户请求时，首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络，然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练，即学习从随机噪音向量到图片样本的映射关系，根据训练过程中学习到的映射关系，得到训练后的生成对抗网络。其中，训练样本集由标签不平衡图片样本组成，随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布，也可以为泊松分布、二项分布等离散型分布。

优选地，在通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练时，可以首先将随机噪音向量输入生成对抗网络G(z)，根据预设的训练样本集对对抗网络G(z)进行训练，得到第一生成样本，接着将第一生成样本输入预先构造的第一判别模型D(x)，以判定第一生成样本是否为真实样本，得到第一判别结果D(G(z))，若该第一判别结果正确，则G(z)的损失增加，若该第一判别结果不正确，则D(x)损失增加，然后根据公式

和

分别对D(x)和G(z)进行训练，即G(z)尽可能让自己的输出像真实样本，而D(x)则尽可能将不是真实样本的情况分辨出来，当满足预设的第一训练结束条件时，结束训练，得到训练后的生成对抗网络，从而提高了模型训练效率。其中，第一判别模型可由神经网络(例如，多层感知机、卷积神经网络)组成，V(G，D)为价值方程，p_data(x)为真实样本的分布，p_z(z)为自定义的先验分布，E表示期望，D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别，0≤D(x)的判别值≤1，第一训练结束条件可以为p_z(z)＝p_data(x)，即

具体地，在根据

和

分别对D(x)和G(z)进1行训练时，首先构造损失函数

然后使用m个真实样本{x⁽¹⁾，x⁽²⁾，...，x^(m)}和m个随机噪音向量{z⁽¹⁾，z⁽²⁾，...，z^(m)}计算

并使用梯度上升法更新D(x)的权重分布，接着使用m个随机噪音向量{z⁽¹⁾，z⁽²⁾，...，z^(m)}计算

并使用梯度下降法更新G(z)的权重分布，当

时，结束训练。其中，m为真实样本数据集中的样本数量，x⁽ⁱ⁾为第i个真实样本，z⁽ⁱ⁾为第i个随机噪音向量。

进一步优选地，也可以直接将真实样本输入该第一判别模型D(x)，以判定是否为真实样本，得到判别结果，从而进一步优化对第一判别模型D(x)的训练。

在步骤S102中，根据训练后的生成对抗网络，构造条件生成对抗网络。

在本发明实施例中，首先根据训练后的生成对抗网络的各非输入层的结构和权重分布，构造条件生成对抗网络的各非输入层的结构和权重分布，然后根据条件生成对抗网络的输入要求和作用，构造可同时输入随机噪音向量和预设标签的输入层，从而降低了训练样本数量，同时提高了生成对抗网络的训练速率。具体地，该条件生成对抗网络可由神经网络(例如，多层感知机、卷积神经网络)组成。

在步骤S103中，通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。

在本发明实施例中，得到条件生成对抗网络之后，首先将随机噪音向量和预设标签输入条件生成对抗网络，然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，即学习从随机噪音向量到少数类图片样本的映射关系，根据训练过程中学习到的映射关系，最后得到训练后的条件生成对抗网络。优选地，将随机噪音向量和预设标签串联输入条件生成对抗网络，从而提高输入速率，进而提高条件生成对抗网络的训练效率。

和

在步骤S104中，根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本。

在本发明实施例中，得到训练后的条件生成对抗网络之后，首先将随机噪音向量和用户请求中包括的少数类标签输入到训练后的条件生成对抗网络，然后通过训练样本集，使用训练后的条件生成对抗网络生成图片样本并输出，最后将输出的图片样本设置为少数类图片样本，从而实现了少数类图片样本的生成，提高了生成少数类图片样本的质量。

在本发明实施例中，首先通过预先构造的生成对抗网络与所有图片样本(训练样本集中所有的非少数类图片样本和少数类图片样本)训练出一个可以生成图片样本的训练后的生成对抗网络，然后以这个训练后的生成对抗网络为基础构造出条件生成对抗网络，并通过少数类图片样本数据及非少数类图片样本对这个条件生成对抗网络进行训练，以对这个条件生成对抗网络进行优化，得到训练后的条件生成对抗网络，最后通过训练后的条件生成对抗网络得到与训练样本集中少数类图片样本类似的少数类图片样本，从而提高了生成的少数类图片样本的泛化效果和质量，进而提高了少数类图片样本的生成效率。

实施例二：

图2示出了本发明实施例二提供的少数类图片样本的生成装置的结构，为了便于说明，仅示出了与本发明实施例相关的部分，其中包括：

第一模型训练单元21，用于当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，训练样本集由标签不平衡图片样本组成。

在本发明实施例中，如果用户获取的用于机器学习的图片样本标签不平衡，则需要在使用这些图片样本进行机器学习之前，首先根据这些标签不平衡的图片样本生成少数类图片样本，以解决标签不平衡问题。为了解决上述问题，预先构造了由神经网络(例如，多层感知机、卷积神经网络)组成的生成对抗网络，当接收到生成少数类图片样本的用户请求时，第一模型训练单元21首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络，然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练，即学习从随机噪音向量到图片样本的映射关系，根据训练过程中学习到的映射关系，得到训练后的生成对抗网络。其中，训练样本集由标签不平衡图片样本组成，随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布，也可以为泊松分布、二项分布等离散型分布。

模型构造单元22，用于根据训练后的生成对抗网络，构造条件生成对抗网络。

在本发明实施例中，模型构造单元22首先根据训练后的生成对抗网络的各非输入层的结构和权重分布，构造条件生成对抗网络的各非输入层的结构和权重分布，然后根据条件生成对抗网络的输入要求和作用，构造可同时输入随机噪音向量和预设标签的输入层，从而降低了训练样本数量，同时提高了生成对抗网络的训练速率。具体地，该条件生成对抗网络可由神经网络(例如，多层感知机、卷积神经网络)组成。

第二模型训练单元23，用于通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。

在本发明实施例中，得到条件生成对抗网络之后，第二模型训练单元23首先将随机噪音向量和预设标签输入条件生成对抗网络，然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，即学习从随机噪音向量到少数类图片样本的映射关系，根据训练过程中学习到的映射关系，最后得到训练后的条件生成对抗网络。优选地，将随机噪音向量和预设标签串联输入条件生成对抗网络，从而提高输入速率，进而提高条件生成对抗网络的训练效率。

样本生成单元24，用于根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本。

在本发明实施例中，得到训练后的条件生成对抗网络之后，样本生成单元24首先将随机噪音向量和用户请求中包括的少数类标签输入训练后的条件生成对抗网络，然后通过训练样本集，使用训练后的条件生成对抗网络生成图片样本并输出，最后将输出的图片样本设置为少数类图片样本，从而实现了少数类图片样本的生成，提高了生成少数类图片样本的质量。

在本发明实施例中，当接收到生成少数类图片样本的用户请求时，第一模型训练单元21通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，模型构造单元22根据训练后的生成对抗网络，构造条件生成对抗网络，第二模型训练单元23通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，样本生成单元24根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本，从而提高了生成的少数类图片样本的泛化效果和质量，进而提高了少数类图片样本的生成效率。

在本发明实施例中，少数类图片样本的生成装置的各单元可由相应的硬件或软件单元实现，各单元可以为独立的软、硬件单元，也可以集成为一个软、硬件单元，在此不用以限制本发明。

实施例三：

图3示出了本发明实施例三提供的少数类图片样本的生成装置的结构，为了便于说明，仅示出了与本发明实施例相关的部分，其中包括：

第一模型训练单元31，用于通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，训练样本集由标签不平衡图片样本组成。

在本发明实施例中，如果用户获取的用于机器学习的图片样本标签不平衡，则需要在使用这些图片样本进行机器学习之前，首先根据这些标签不平衡的图片样本生成少数类图片样本，以解决标签不平衡问题。为了解决上述问题，预先构造了由神经网络(例如，多层感知机、卷积神经网络)组成的生成对抗网络，当接收到生成少数类图片样本的用户请求时，第一模型训练单元31首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络，然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练，即学习从随机噪音向量到图片样本的映射关系，根据训练过程中学习到的映射关系，得到训练后的生成对抗网络。其中，训练样本集由标签不平衡图片样本组成，随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布，也可以为泊松分布、二项分布等离散型分布。

和

分别对D(x)和G(z)进行训练，即G(z)尽可能让自己的输出像真实样本，而D(x)则尽可能将不是真实样本的情况分辨出来，当满足预设的第一训练结束条件时，结束训练，得到训练后的生成对抗网络，从而提高了模型训练效率。其中，第一判别模型可由神经网络(例如，多层感知机、卷积神经网络)组成，V(G，D)为价值方程，pdata(x)为真实样本的分布，p_z(z)为自定义的先验分布，E表示期望，D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别，0≤D(x)≤1，第一训练结束条件可以为p_z(z)＝p_data(x)，即

具体地，在根据

和

分别对D(x)和G(z)进行训练时，首先构造损失函数

并使用梯度下降法更新G(z)的权重分布，当

模型构造单元32，用于根据训练后的生成对抗网络，构造条件生成对抗网络。

在本发明实施例中，模型构造单元32首先根据训练后的生成对抗网络的各非输入层的结构和权重分布，构造条件生成对抗网络的各非输入层的结构和权重分布，然后根据条件生成对抗网络的输入要求和作用，构造可同时输入随机噪音向量和预设标签的输入层，从而降低了训练样本数量，同时提高了生成对抗网络的训练速率。具体地，该条件生成对抗网络可由神经网络(例如，多层感知机、卷积神经网络)组成。

第二模型训练单元33，用于通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。

在本发明实施例中，得到条件生成对抗网络之后，第二模型训练单元33首先将随机噪音向量和预设标签输入条件生成对抗网络，然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，即学习从随机噪音向量到少数类图片样本的映射关系，根据训练过程中学习到的映射关系，最后得到训练后的条件生成对抗网络。优选地，将随机噪音向量和预设标签串联输入条件生成对抗网络，从而提高输入速率，进而提高条件生成对抗网络的训练效率。

和

样本生成单元34，用于根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本。

在本发明实施例中，得到训练后的条件生成对抗网络之后，样本生成单元34首先将随机噪音向量和用户请求中包括的少数类标签输入到训练后的条件生成对抗网络，然后通过训练样本集，使用训练后的条件生成对抗网络生成图片样本并输出，最后将输出的图片样本设置为少数类图片样本，从而实现了少数类图片样本的生成，提高了生成少数类图片样本的质量。

因此，优选地，该第一模型训练单元31包括：

第一样本生成单元311，用于根据随机噪音向量和训练样本集，通过生成对抗网络生成第一生成样本；

第一判别单元312，用于根据第一生成样本，通过预先构造的第一判别模型获取第一判别结果；

第一训练单元313，用于根据预设的第一价值方程分别对生成对抗网络和第一判别模型进行训练；

优选地，该第二模型训练单元33包括：

第二样本生成单元331，用于根据随机噪音向量、预设标签以及训练样本集，通过条件生成对抗网络生成第二生成样本；

第二判别单元332，用于根据第二生成样本，通过预先构造的第二判别模型获取第二判别结果；

第二训练单元333，用于根据预设的第二价值方程分别对条件生成对抗网络和第二判别模型进行训练。

实施例四：

图4示出了本发明实施例四提供的计算设备的结构，为了便于说明，仅示出了与本发明实施例相关的部分。

本发明实施例的计算设备4包括处理器40、存储器41以及存储在存储器41中并可在处理器40上运行的计算机程序42。该处理器40执行计算机程序42时实现上述少数类图片样本的生成方法实施例中的步骤，例如图1所示的步骤S101至S104。或者，处理器40执行计算机程序42时实现上述各装置实施例中各单元的功能，例如图2所示单元21至24、图3所示单元31至34的功能。

在本发明实施例中，该处理器40执行计算机程序42时实现上述各个屏幕唤醒的控制方法实施例中的步骤时，当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，根据训练后的生成对抗网络，构造条件生成对抗网络，通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本，从而提高了生成的少数类图片样本的泛化效果和质量，进而提高了少数类图片样本的生成效率。

该计算设备4中处理器40在执行计算机程序42时实现的步骤具体可参考实施例一中方法的描述，在此不再赘述。

实施例五：

在本发明实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述少数类图片样本的生成方法实施例中的步骤，例如，图1所示的步骤S101至S104。或者，该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能，例如图2所示单元21至24、图3所示单元31至34的功能。

在本发明实施例中，当接收到生成少数类图片样本的用户请求时，通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练，根据训练后的生成对抗网络，构造条件生成对抗网络，通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练，根据随机噪音向量和用户请求中包括的少数类标签，通过训练后的条件生成对抗网络生成少数类图片样本，从而提高了生成的少数类图片样本的泛化效果和质量，进而提高了少数类图片样本的生成效率。该计算机程序被处理器执行时实现的少数类图片样本的生成方法进一步可参考前述方法实施例中步骤的描述，在此不再赘述。

本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质，例如，ROM/RAM、磁盘、光盘、闪存等存储器。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。