WO2019237240A1

WO2019237240A1 - 一种增强型生成式对抗网络以及目标样本识别方法

Info

Publication number: WO2019237240A1
Application number: PCT/CN2018/090761
Authority: WO
Inventors: 王书强; 申妍燕; 张文勇
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2018-06-12
Filing date: 2018-06-12
Publication date: 2019-12-19
Also published as: US12154036B2; US20200380366A1

Abstract

本发明涉及计算机应用技术领域，特别涉及一种增强型生成式对抗网络以及目标样本识别方法。本发明增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器，所述增强型生成器将获得的初始数据进行处理得到生成数据，并提供生成数据给增强型判别器，所述增强型判别器对生成数据进行处理，并反馈分类结果给增强型生成器，所述增强型判别器包括卷基层、基础胶囊层、卷积胶囊层和分类胶囊层，所述卷基层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连。

Description

一种增强型生成式对抗网络以及目标样本识别方法

技术领域

本发明涉及计算机应用技术领域，特别涉及一种增强型生成式对抗网络以及目标样本识别方法。

背景技术

生成式对抗网络(GAN，Generative Adversarial Networks)近年来在复杂分布的无监督学习问题上得到广泛关注和应用。生成式对抗网络(GAN)是一种深度学习模型。模型包括两个模块：生成器模型(G)和判别器模型(D)，GAN通过生成器和判别器的互相博弈学习产生相当好的输出。生成器和判别器通常由包含卷积和(或)全连接层的多层网络构成。生成器和判别器必须是可微的，但并不必要是直接可逆的。GAN的训练目标是获得令判别器分类准确率最大化的参数，以及获得最大化欺骗判别器的生成器参数。在训练的过程中固定一方，更新另一方的网络权重，交替进行，分别迭代优化自己的网络，从而形成竞争对抗，直到双方达到一个动态的平衡(纳什均衡)，此时生成模型G恢复了训练数据的分布，即生成的数据分布与真实数据高度相似，判别模型D难以识别。

深度卷积神经网络(DCGAN)对传统的GAN主要有如下改进：(1)在卷积GAN拓扑结构的基础上增加约束条件；(2)将训练后的判别网络应用于图像分类任务；(3)对卷积核进行了可视化；(4)充分利用了生成模型的向量运算属性，容易控制生成样本的多语义特性。

现有技术主要有如下缺点：①深度学习模型，尤其是应用广泛的深度卷积神经网络模型，需要依靠大量的训练样本，才能显示出优势。但是，在一些领域中，高质量的标注样本较少，譬如，在医学影像领域，大量高质量标注样本对任何一种疾病都是稀缺的。现有的深度卷积神经网络模型在缺少足够训练样本的条件下，无法获得充分训练，这极大地限制了其在医学影像领域的应用。②半监督学习模型是解决以上问题的一种可行方案，尤其是基于生成式对抗网络(GAN)的半监督学习模型，它可以利用有限的标注样本学习数据的整体分布。但是现有生成式对抗网络(GAN)模型通常存在如下问题：(a)GAN难训练，尤其是分布复杂的多类别数据条件下；(b)GAN易引起模型崩溃，从而导致生模型失效。

发明内容

本发明提供了一种增强型生成式对抗网络以及目标样本识别方法，旨在至少在一定程度上解决现有技术中的上述技术问题之一。

为了解决上述问题，本发明提供了如下技术方案：

一种增强型生成式对抗网络，包括至少一个增强型生成器和至少一个增强型判别器，所述增强型生成器将获得的初始数据进行处理得到生成数据，并提供生成数据给增强型判别器，所述增强型判别器对生成数据进行处理，并反馈分类结果给增强型生成器，所述增强型判别器包括卷基层、基础胶囊层、卷积胶囊层和分类胶囊层，所述卷基层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连。

本发明实施例采取的技术方案还包括：所述增强型生成器将获得的初始数据通过反池化层、线性修正、过滤层得到生成数据。

本发明实施例采取的技术方案还包括：所述卷基层、基础胶囊层，卷积胶囊层和分类胶囊层的层数和结构参数根据目标样本的特征进行设定。

本发明实施例采取的技术方案还包括：所述增强型生成器的数量大于1个，所述增强型判别器阵列数量大于1个，所述多个增强型生成器按类别生成新的样本数据，所述多个增强型判别器组成增强型判别器阵列，对未标注样本进行类别预测。

本发明实施例采取的另一技术方案为：一种目标样本识别方法，其特征在于，包括：

步骤a：构建增强型生成式对抗网络，其中，构建的增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器

步骤b：根据构建的增强型生成式对抗网络和目标样本的类别特点构建多通道生成式对抗网络，利用训练过的多通道生成式对抗网络对无标注数据进行标签预测，根据增强型生成器生成相应类别的样本，利用增强型判别器对目标样本进行精准识别。

本发明实施例采取的技术方案还包括：在所述步骤a中，所述增强型生成器将获得的初始数据进行处理得到生成数据，并提供生成数据给增强型判别器，所述增强型判别器对生成数据进行处理，并反馈分类结果给增强型生成器。

本发明实施例采取的技术方案还包括：在所述步骤a中，所述增强型判别器包括：卷基层、基础胶囊层，卷积胶囊层和分类胶囊层，所述卷基层、基础胶囊层，卷积胶囊层和分类胶囊层依次相连。

本发明实施例采取的技术方案还包括：所述步骤a包括：利用胶囊特征向量化表达的模式，设计基于胶囊机制的增强型判别器；根据增强型生成对抗模型的纳什平衡能力，设计“生成-判别”交替优化方案；利用有标注样本和无标注样本，设计模型的目标函数。

本发明实施例采取的技术方案还包括：所述步骤b包括：对于原始带标注的数据先进行按类别分类，分别对每一类的数据进行数据增强操作；对增强型判别器网络进行训练；对增强型生成器进行网络训练；输入噪声数据，通过增强型生成器生成新的标注数据；通过增强型判别器对无标注数据进行类别预测；基于多通道生成式对抗网络中的判别器对目标样本进行分类。

本发明实施例采取的技术方案还包括：所述通过增强型判别器对无标注数据进行类别预测包括：从原始未标注疾病数据集中任意取出一份数据分别输入到每一类的判别器当中，每一个判别器都会对此数据类别进行判断输出一个0到1之间的数字，数字越接近1意味着被判定为该类的置信度越高；如果存在多个接近1的输出值，说明生成器的训练并没有达到最优化的状态，需要继续返回训练。

本发明实施例采取的技术方案还包括：所述三维线框重建模块重建三维线框具体包括：将不同图像上提取的二维线段根据极线几何约束进行初始匹配，使用三维点云对匹配进行验证，根据相机位置和旋转量将每一对匹配好的二维线段重建出一条三维线段，对所有重建出的三维线段进行聚类合并得到最终的三维线框；所述三维模型构建模块构建三维模型包括：对三维线框中的线段使用RANSAC方法产生大量候选平面，结合点云进行优化选择得到封闭的三维模型。

相对于现有技术，本发明实施例产生的有益效果在于：本发明实施例的增强型生成式对抗网络以及目标样本识别方法可以有效解决少量标注样本条件下的模式识别问题，实现目标样本的精准识别；本发明实施例的增强型生成式对抗网络以及目标样本识别方法使用多通道生成式对抗网络中的多个增强型生成器进行按类别地生成新的样本数据；同时，也可以使用多通道生成式对抗网络中的多个增强型判别器组成一个增强型判别器阵列，并对未标注样本进行类别预测。从而增加了标注数据的数量，使得训练复杂的深度卷积神经网络分类器更加容易；本发明实施例的增强型生成式对抗网络以及目标样本识别方法与现有技术相比，具有以下显著特点和积极效果：通过训练多通道生成式对抗网络使得多个增强型生成器分别学习到原始数据库中不同类别数据各自的子分布，这使得网络训练更容易达到纳什平衡，使得生成式对抗网络更容易训练。通过多通道生成式对抗网络中的多个增强型生成器和相应的增强型判别器阵列，可以大量地增加标注数据量，从而解决了在一些领域，譬如医学影像领域，大量高质量标注数据获取困难的问题，可以更加方便训练基于深度卷积神经网络的分类模型。

附图说明

图1是本发明第一实施例的增强型生成式对抗网络的结构示意图；

图2是本发明第二实施例的增强型生成式对抗网络的结构示意图；

图3是本发明实施例的目标样本识别方法的流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

请参阅图1，图1是本发明第一实施例的增强型生成式对抗网络的结构示意图。本发明实施例的增强型生成式对抗网络包括增强型生成器和增强型判别器，增强型生成器将获得初始数据通过反池化层、线性修正、过滤(Filtering)层得到生成数据，并提供生成数据给增强型判别器，增强型判别器对数据进行处理后反馈分类结果给增强型生成器，其中，生成数据可以是生成图片或者其他类型的数据。增强型判别器包括：卷基层、基础胶囊层，卷积胶囊层和分类胶囊层，卷基层、基础胶囊层，卷积胶囊层和分类胶囊层依次相连。卷基层、基础胶囊层，卷积胶囊层和分类胶囊层的层数的多少和结构参数根据目标样本的特征而定。

本发明实施例的增强型生成式对抗网络在现有深度卷积生成式对抗网络的基础上，提出基于胶囊机制的增强型判别器，通过向量化表达样本的方向信息特征、层次信息特征，提升判别器的样本特征表达和特征识别能力，从而增强生成器学习真实数据整体分布的能力。

请参阅图2，图2是本发明第二实施例的增强型生成式对抗网络的结构示意图。本发明实施例的增强型生成式对抗网络通过构建N个增强型生成式对抗网络组成多通道生成式对抗网络，使得每一个增强型生成器(G _i，i＝1…N)只需要学习对应类别的真实样本分布

相比于普通的生成器需要学习所有样本的整体分布(φ)而言，本发明实施例的增强型生成式对抗网络使得N个增强型生成器更容易达到纳什平衡状态，从而降低了生成式对抗网络难训练的问题，提升了生成式对抗网络的普适性。经过多次迭代训练，可以得到最优的判别器

和生成器

利用多通道最优化生成器可以按类别生成带标注高质量数据：

其中，

代表新生成第i类数据，Z _i代表第i类初始化噪声。同时利用多通道最优化判别器可以对任意未标注数据

进行标签预测：

本发明实施例的增强型生成式对抗网络使用多通道生成式对抗网络中的多个增强型生成器进行按类别地生成新的样本数据；同时，也可以使用多通道生成式对抗网络中的多个增强型判别器组成一个增强型判别器阵列，并对未标注样本进行类别预测。从而增加了标注数据的数量，使得训练复杂的深度卷积神经网络分类器更加容易。

请参阅图3，图3是本发明实施例的目标样本识别方法的流程图。本发明实施例的目标样本识别方法包括：

步骤100：构建基于胶囊机制的增强型生成式对抗网络；

其中，步骤100具体包括：首先，设计基于胶囊机制的增强型判别器，利用胶囊特征向量化表达的模式，提升判别器特征提取和特征识别的能力，并进一步通过梯度信息传播，提升生成器学习样本整体分布的能力，从而增强整个生成对抗模型的判别能力和生成能力；其次，设计合适的“生成-判别”交替优化方案，提高增强型生成对抗模型达到纳什平衡的能力，提高模型的鲁棒性；最后，设计模型的目标函数，使模型能够充分利用有标注样本和无标注样本，提升模型在有限的标注样本条件下快速学习数据整体分布的能力，实现样本的精准识别。

本方案在现有深度卷积生成式对抗网络的基础上，提出基于胶囊机制的增强型判别器，通过向量化表达样本的方向信息特征、层次信息特征，提升判别器的样本特征表达和特征识别能力，从而增强生成器学习真实数据整体分布的能力。请一并参阅图1，图1是增强型生成式对抗网络结构示意图。增强型生成式对抗网络包括增强型生成器和增强型判别器，增强型生成器将获得初始数据通过反池化层、线性修正、过滤(Filtering)层得到生成图片，并提供生成图片给增强型判别器，增强型判别器对图片进行处理后反馈分类结果给增强型生成器。增强型判别器包括：卷基层、基础胶囊层，卷积胶囊层和分类胶囊层，卷基层、基础胶囊层，卷积胶囊层和分类胶囊层依次相连。各层的层数的多少和结构参数根据目标样本的特征而定。

步骤200：构建多通道生成式对抗网络，利用训练过的多通道生成式对抗网络对无标注数据进行标签预测，根据优化后的生成器生成相应类别的样本，利用优化后的判别器对目标样本进行精准识别。

在步骤200中，首先，在增强型生成式对抗网络的基础上，针对目标样本的类别特点，设计多通道增强型生成式对抗网络，利用不同类别的样本分别训练各个通道的生成式对抗网络；其次，利用训练过的多通道生成式对抗网络对无标注数据进行标签预测，并利用优化后的生成器生成相应类别的样本，从而获得更充分的标注样本；最后，利用优化后的判别器，实现目标样本的精准识别。

请一并参阅图3，为了方便方案描述，本方案假设样本类别数目为N，针对N类数据集x＝{X ₁，X ₂，…X _N}，数据集x整体分布服从分布x～φ；其中每一类数据子集可表示为

并服从分布

通过构建N个增强型生成式对抗网络组成多通道生成式对抗网络，使得每一个增强型生成器(G _i，i＝1…N)只需要学习对应类别的真实样本分布

步骤200具体包括：

步骤210：对标注样本进行数据增强；

在步骤220中，对于原始带标注的数据先进行按类别分类，分别对每一类的数据进行常见的数据增强操作，数据增强操作包括旋转、翻转、缩放等等，扩充后的数据集足够训练对应的多通道对抗生成网络。

步骤220：对增强型判别器网络进行训练；

在步骤220中，对于包含N类的样本，在模型训练过程中会逐一训练包含N个对抗生成网络。对于第i通道对抗生成网络只输入对应的i类的数据。针对第i通道对抗生成网络，对应的最优化的判别器训练目标函数为：

其中，Loss(G)代表着生成器G的损失函数(Loss Function)。它要测量的是真实数据(P _data(x))与生成数据(P _G(x))之间的差异。初始化判别器网络D的参数θ _D和设定判别器训练迭代次数n _D。训练判别器D时，在每一次的迭代中，从真实数据中采样出若干数据{x ¹，x ²，x ³，…x ^m}。从噪声数据中采样出若干数据{z ¹，z ²，z ³，…z ^m}(正态分布或者均匀分布)。然后通过生成器获得生成若干生成数据

计算出若干惩罚项数据

∈是一个0～1之间的随机数；然后可以进行参数更新：

经过以上n _D次迭代训练就可以使得增强型判别器得到更好的性能。按照同样的方法，对剩下的N-1个增强型判别器进行训练，从而形成一组N个增强型判别器组。

步骤230：对增强型生成器进行网络训练；

在步骤230中，对于一组多通道对抗生成网络，也包含了N个增强型生成器。把训练数据按类别分成N类，并使用每一类的数据对相应的增强型生成器进行训练。最优化的生成器训练目标函数为：

其中V(G，D)的定义与步骤二相同。对于寻找最优化生成器的过程，需要先初始化生成器网络G的参数θ _G和设定生成器训练迭代次数n _G。再从噪声数据中采样出若干数据{z ¹，z ²，z ³，…z ^m}(正态分布或者均匀分布)；然后可以进行参数更新：

然后再返回第一步进行新一轮的迭代，一共进行n _G次的迭代更新，就可以使增强型型生成器达到最优的性能。按照同样的方法，对CSM其他类别的生成器进行训练，从而可以得到一组增强型生成器。

步骤240：输入噪声数据，通过增强型生成器生成新的标注数据；

在步骤240中，在得到一组训练好的多通道生成式对抗网络之后，取出所有的增强型生成器

对于每一个增强型网络，分别输入一组噪声数据(高斯分布、均匀分布等)将会生成一组新的带标注数据，它的标注类别为该生成器所对应的类别：

其中，

代表新生成第i类数据，Z _i代表第i类初始化噪声。以此类推，对一个生成器进行相同的操作，都可以生成新的标注数据。这样便可以增加每类数据的数量，也扩充了数据集的大小。

步骤250：通过增强型判别器对无标注数据进行类别预测；

在步骤250中，在得到一组训练好的多通道生成式对抗网络之后，取出所有的生成器

从原始未标注疾病数据集中任意取出一份数据

分别输入到每一类的判别器当中。每一个判别器都会对此数据类别进行判断(y ₁，y ₂，…y _N)，输出一个0-1之间的数字，数字越接近1意味着被判定为该类的置信度越高。理想状态下，所有的判别器中只会有一个输出值接近于1，其他的输出值都接近于0。这样就可以判定该输入数据的类别为输出值最大的那一类。如果存在多个接近1的输出值，说明生成器的训练并没有达到最优化的状态，需要继续返回训练。

以此类推，对原始数据集中的每一份未标注数据进行上述操作，会使未标注数据变成标注数据。从而增加了数据集中带标注的数据量，也扩充了数据集的大小。

步骤260：基于多通道生成式对抗网络中的判别器对目标样本进行分类。

在步骤260中，训练好的多通道生成式对抗网络中包含了N个增强型生成式对抗网络。把其中所有的增强型判别器取出来可以形成一组增强型判别器阵列(D ^s，s＝1…N)。这N个增强型判别器分别对应着疾病数据的N个类别。这些增强型判别器可以直接对测试样本进行分类预测。在测试阶段中，取任意测试样本(d _k)分别输入到每一个增强型判别器()当中。每一个增强型判别器(D ^s)对于输入样本(d _k)会对硬输出一个0～1之间的数字。该数字越大代表该判别器判定测试样本为所对应类别的置信度越高。正常情况下，一组N个增强型判别器对于一个测试样本得输出值中只有一个会接近1(例如D ^j)，其余的输出值都会接近0。根据以上分析可知，对于该测试样本(d _k)的类别会被预测为某疾病的第j类样本。按照以上方法，对于测试集中的每一个测试样本可以重复以上的操作即可对每个样本进行分类。

针对有限的标注样本，本发明实施例的增强型生成式对抗网络以及目标样本识别方法提出了融合胶囊机制的增强型生成式对抗网络，该网络利用向量化模式表达图像特征，显著增强了判别器对真实样本和生成样本的识别能力，进而提高了生成器学习真实数据整体分布的能力，使得生成对抗模型更容易达到纳什平衡。

在增强型生成式对抗网络的基础上，本发明实施例的增强型生成式对抗网络以及目标样本识别方法进一步提出了多通道生成对抗模型。针对N类数据集x＝{X ₁，X ₂，…X _N}，数据集x整体分布服从分布x～φ；其中每一类数据子集可表示为

并服从分布

相比于普通的生成器需要学习所有样本的整体分布(φ)而言，本项目的方法使得N个增强型生成器更容易达到纳什平衡状态，从而降低了生成式对抗网络难训练的问题，提升了生成式对抗网络的普适性。经过多次迭代训练，可以得到最优的判别器

和生成器

其中，

进行标签预测：

本发明实施例的增强型生成式对抗网络以及目标样本识别方法可以有效解决少量标注样本条件下的模式识别问题，实现目标样本的精准识别。

本发明实施例的增强型生成式对抗网络以及目标样本识别方法使用多通道生成式对抗网络中的多个增强型生成器进行按类别地生成新的样本数据；同时，也可以使用多通道生成式对抗网络中的多个增强型判别器组成一个增强型判别器阵列，并对未标注样本进行类别预测。从而增加了标注数据的数量，使得训练复杂的深度卷积神经网络分类器更加容易。

本发明实施例的增强型生成式对抗网络以及目标样本识别方法与现有技术相比，具有以下显著特点和积极效果：通过训练多通道生成式对抗网络使得多个增强型生成器分别学习到原始数据库中不同类别数据各自的子分布，这使得网络训练更容易达到纳什平衡，使得生成式对抗网络更容易训练。通过多通道生成式对抗网络中的多个增强型生成器和相应的增强型判别器阵列，可以大量地增加标注数据量，从而解决了在一些领域，譬如医学影像领域，大量高质量标注数据获取困难的问题，可以更加方便训练基于深度卷积神经网络的分类模型。

虽然本发明参照当前的较佳实施方式进行了描述，但本领域的技术人员应能理解，上述较佳实施方式仅用来说明本发明，并非用来限定本发明的保护范围，任何在本发明的精神和原则范围之内，所做的任何修饰、等效替换、改进等，均应包含在本发明的权利保护范围之内。

Claims

一种增强型生成式对抗网络，其特征在于，包括至少一个增强型生成器和至少一个增强型判别器，所述增强型生成器将获得的初始数据进行处理得到生成数据，并提供生成数据给增强型判别器，所述增强型判别器对生成数据进行处理，并反馈分类结果给增强型生成器，所述增强型判别器包括卷基层、基础胶囊层、卷积胶囊层和分类胶囊层，所述卷基层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连。
根据权利要求1所述的增强型生成式对抗网络，其特征在于，所述增强型生成器将获得的初始数据通过反池化层、线性修正、过滤层得到生成数据。
根据权利要求1或2所述的增强型生成式对抗网络，其特征在于，所述卷基层、基础胶囊层、卷积胶囊层和分类胶囊层的层数和结构参数根据目标样本的特征进行设定。
根据权利要求1所述的增强型生成式对抗网络，其特征在于，所述增强型生成器的数量大于1个，所述增强型判别器阵列数量大于1个，所述多个增强型生成器按类别生成新的样本数据，所述多个增强型判别器组成增强型判别器阵列，对未标注样本进行类别预测。
一种利用权利要求1至4任一项所述的增强型生成式对抗网络的目标样本识别方法，其特征在于，包括：

步骤a：构建增强型生成式对抗网络，其中，构建的增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器；

步骤b：根据构建的增强型生成式对抗网络和目标样本的类别特点构建多通道生成式对抗网络，利用训练过的多通道生成式对抗网络对无标注数据进行标签预测，根据增强型生成器生成相应类别的样本，利用增强型判别器对目标样本进行精准识别。
根据权利要求5所述的目标样本识别方法，其特征在于，在所述步骤a中，所述增强型生成器将获得的初始数据进行处理得到生成数据，并提供生成数据给增强型判别器，所述增强型判别器对生成数据进行处理，并反馈分类结果给增强型生成器。
根据权利要求5或6所述的目标样本识别方法，其特征在于，在所述步骤a中，所述增强型判别器包括：卷基层、基础胶囊层，卷积胶囊层和分类胶囊层，所述卷基层、基础胶囊层，卷积胶囊层和分类胶囊层依次相连。
根据权利要求5所述的目标样本识别方法，其特征在于，所述步骤a包括：利用胶囊特征向量化表达的模式，设计基于胶囊机制的增强型判别器；根据增强型生成对抗模型的纳什平衡能力，设计“生成-判别”交替优化方案；利用有标注样本和无标注样本，设计模型的目标函数。
根据权利要求5所述的目标样本识别方法，其特征在于，所述步骤b包括：对于原始带标注的数据先进行按类别分类，分别对每一类的数据进行数据增强操作；对增强型判别器网络进行训练；对增强型生成器进行网络训练；输入噪声数据，通过增强型生成器生成新的标注数据；通过增强型判别器对无标注数据进行类别预测；基于多通道生成式对抗网络中的判别器对目标样本进行分类。
根据权利要求9所述的目标样本识别方法，其特征在于，所述通过增强型判别器对无标注数据进行类别预测包括：从原始未标注疾病数据集中任意取出一份数据分别输入到每一类的判别器当中，每一个判别器都会对此数据类别进行判断输出一个0到1之间的数字，数字越接近1意味着被判定为该类的置信度越高；如果存在多个接近1的输出值，说明生成器的训练并没有达到最优化的状态，需要继续返回训练。