CN109063724B - 一种增强型生成式对抗网络以及目标样本识别方法 - Google Patents

一种增强型生成式对抗网络以及目标样本识别方法 Download PDF

Info

Publication number
CN109063724B
CN109063724B CN201810604607.9A CN201810604607A CN109063724B CN 109063724 B CN109063724 B CN 109063724B CN 201810604607 A CN201810604607 A CN 201810604607A CN 109063724 B CN109063724 B CN 109063724B
Authority
CN
China
Prior art keywords
data
enhanced
discriminator
generator
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810604607.9A
Other languages
English (en)
Other versions
CN109063724A (zh
Inventor
王书强
申妍燕
张文勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201810604607.9A priority Critical patent/CN109063724B/zh
Publication of CN109063724A publication Critical patent/CN109063724A/zh
Application granted granted Critical
Publication of CN109063724B publication Critical patent/CN109063724B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明涉及计算机应用技术领域,特别涉及一种增强型生成式对抗网络以及目标样本识别方法。本发明增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器,所述增强型生成器将获得的初始数据进行处理得到生成数据,并提供生成数据给增强型判别器,所述增强型判别器对生成数据进行处理,并反馈分类结果给增强型生成器,所述增强型判别器包括卷基层、基础胶囊层、卷积胶囊层和分类胶囊层,所述卷基层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连。

Description

一种增强型生成式对抗网络以及目标样本识别方法
技术领域
本发明涉及计算机应用技术领域,特别涉及一种增强型生成式对抗网络以及目标样本识别方法。
背景技术
生成式对抗网络(GAN,Generative Adversarial Networks)近年来在复杂分布的无监督学习问题上得到广泛关注和应用。生成式对抗网络(GAN)是一种深度学习模型。模型包括两个模块:生成器模型(G)和判别器模型(D),GAN通过生成器和判别器的互相博弈学习产生相当好的输出。生成器和判别器通常由包含卷积和(或)全连接层的多层网络构成。生成器和判别器必须是可微的,但并不必要是直接可逆的。GAN的训练目标是获得令判别器分类准确率最大化的参数,以及获得最大化欺骗判别器的生成器参数。在训练的过程中固定一方,更新另一方的网络权重,交替进行,分别迭代优化自己的网络,从而形成竞争对抗,直到双方达到一个动态的平衡(纳什均衡),此时生成模型G恢复了训练数据的分布,即生成的数据分布与真实数据高度相似,判别模型D难以识别。
深度卷积神经网络(DCGAN)对传统的GAN主要有如下改进:(1)在卷积GAN拓扑结构的基础上增加约束条件;(2)将训练后的判别网络应用于图像分类任务;(3)对卷积核进行了可视化;(4)充分利用了生成模型的向量运算属性,容易控制生成样本的多语义特性。
现有技术主要有如下缺点:①深度学习模型,尤其是应用广泛的深度卷积神经网络模型,需要依靠大量的训练样本,才能显示出优势。但是,在一些领域中,高质量的标注样本较少,譬如,在医学影像领域,大量高质量标注样本对任何一种疾病都是稀缺的。现有的深度卷积神经网络模型在缺少足够训练样本的条件下,无法获得充分训练,这极大地限制了其在医学影像领域的应用。②半监督学习模型是解决以上问题的一种可行方案,尤其是基于生成式对抗网络(GAN)的半监督学习模型,它可以利用有限的标注样本学习数据的整体分布。但是现有生成式对抗网络(GAN)模型通常存在如下问题:(a)GAN难训练,尤其是分布复杂的多类别数据条件下;(b)GAN易引起模型崩溃,从而导致生模型失效。
发明内容
本发明提供了一种增强型生成式对抗网络以及目标样本识别方法,旨在至少在一定程度上解决现有技术中的上述技术问题之一。
为了解决上述问题,本发明提供了如下技术方案:
一种增强型生成式对抗网络,包括至少一个增强型生成器和至少一个增强型判别器,所述增强型生成器将获得的初始数据进行处理得到生成数据,并提供生成数据给增强型判别器,所述增强型判别器对生成数据进行处理,并反馈分类结果给增强型生成器,所述增强型判别器包括卷基层、基础胶囊层、卷积胶囊层和分类胶囊层,所述卷基层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连。
本发明实施例采取的技术方案还包括:所述增强型生成器将获得的初始数据通过反池化层、线性修正、过滤层得到生成数据。
本发明实施例采取的技术方案还包括:所述卷基层、基础胶囊层,卷积胶囊层和分类胶囊层的层数和结构参数根据目标样本的特征进行设定。
本发明实施例采取的技术方案还包括:所述增强型生成器的数量大于1个,所述增强型判别器阵列数量大于1个,所述多个增强型生成器按类别生成新的样本数据,所述多个增强型判别器组成增强型判别器阵列,对未标注样本进行类别预测。
本发明实施例采取的另一技术方案为:一种目标样本识别方法,其特征在于,包括:
步骤a:构建增强型生成式对抗网络,其中,构建的增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器
步骤b:根据构建的增强型生成式对抗网络和目标样本的类别特点构建多通道生成式对抗网络,利用训练过的多通道生成式对抗网络对无标注数据进行标签预测,根据增强型生成器生成相应类别的样本,利用增强型判别器对目标样本进行精准识别。
本发明实施例采取的技术方案还包括:在所述步骤a中,所述增强型生成器将获得的初始数据进行处理得到生成数据,并提供生成数据给增强型判别器,所述增强型判别器对生成数据进行处理,并反馈分类结果给增强型生成器。
本发明实施例采取的技术方案还包括:在所述步骤a中,所述增强型判别器包括:卷基层、基础胶囊层,卷积胶囊层和分类胶囊层,所述卷基层、基础胶囊层,卷积胶囊层和分类胶囊层依次相连。
本发明实施例采取的技术方案还包括:所述步骤a包括:利用胶囊特征向量化表达的模式,设计基于胶囊机制的增强型判别器;根据增强型生成对抗模型的纳什平衡能力,设计“生成-判别”交替优化方案;利用有标注样本和无标注样本,设计模型的目标函数。
本发明实施例采取的技术方案还包括:所述步骤b包括:对于原始带标注的数据先进行按类别分类,分别对每一类的数据进行数据增强操作;对增强型判别器网络进行训练;对增强型生成器进行网络训练;输入噪声数据,通过增强型生成器生成新的标注数据;通过增强型判别器对无标注数据进行类别预测;基于多通道生成式对抗网络中的判别器对目标样本进行分类。
本发明实施例采取的技术方案还包括:所述通过增强型判别器对无标注数据进行类别预测包括:从原始未标注疾病数据集中任意取出一份数据分别输入到每一类的判别器当中,每一个判别器都会对此数据类别进行判断输出一个0到1之间的数字,数字越接近1意味着被判定为该类的置信度越高;如果存在多个接近1的输出值,说明生成器的训练并没有达到最优化的状态,需要继续返回训练。
本发明实施例采取的技术方案还包括:所述三维线框重建模块重建三维线框具体包括:将不同图像上提取的二维线段根据极线几何约束进行初始匹配,使用三维点云对匹配进行验证,根据相机位置和旋转量将每一对匹配好的二维线段重建出一条三维线段,对所有重建出的三维线段进行聚类合并得到最终的三维线框;所述三维模型构建模块构建三维模型包括:对三维线框中的线段使用RANSAC方法产生大量候选平面,结合点云进行优化选择得到封闭的三维模型。
相对于现有技术,本发明实施例产生的有益效果在于:本发明实施例的增强型生成式对抗网络以及目标样本识别方法可以有效解决少量标注样本条件下的模式识别问题,实现目标样本的精准识别;本发明实施例的增强型生成式对抗网络以及目标样本识别方法使用多通道生成式对抗网络中的多个增强型生成器进行按类别地生成新的样本数据;同时,也可以使用多通道生成式对抗网络中的多个增强型判别器组成一个增强型判别器阵列,并对未标注样本进行类别预测。从而增加了标注数据的数量,使得训练复杂的深度卷积神经网络分类器更加容易;本发明实施例的增强型生成式对抗网络以及目标样本识别方法与现有技术相比,具有以下显著特点和积极效果:通过训练多通道生成式对抗网络使得多个增强型生成器分别学习到原始数据库中不同类别数据各自的子分布,这使得网络训练更容易达到纳什平衡,使得生成式对抗网络更容易训练。通过多通道生成式对抗网络中的多个增强型生成器和相应的增强型判别器阵列,可以大量地增加标注数据量,从而解决了在一些领域,譬如医学影像领域,大量高质量标注数据获取困难的问题,可以更加方便训练基于深度卷积神经网络的分类模型。
附图说明
图1是本发明第一实施例的增强型生成式对抗网络的结构示意图;
图2是本发明第二实施例的增强型生成式对抗网络的结构示意图;
图3是本发明实施例的目标样本识别方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
请参阅图1,图1是本发明第一实施例的增强型生成式对抗网络的结构示意图。本发明实施例的增强型生成式对抗网络包括增强型生成器和增强型判别器,增强型生成器将获得初始数据通过反池化层、线性修正、过滤(Filtering)层得到生成数据,并提供生成数据给增强型判别器,增强型判别器对数据进行处理后反馈分类结果给增强型生成器,其中,生成数据可以是生成图片或者其他类型的数据。增强型判别器包括:卷基层、基础胶囊层,卷积胶囊层和分类胶囊层,卷基层、基础胶囊层,卷积胶囊层和分类胶囊层依次相连。卷基层、基础胶囊层,卷积胶囊层和分类胶囊层的层数的多少和结构参数根据目标样本的特征而定。
本发明实施例的增强型生成式对抗网络在现有深度卷积生成式对抗网络的基础上,提出基于胶囊机制的增强型判别器,通过向量化表达样本的方向信息特征、层次信息特征,提升判别器的样本特征表达和特征识别能力,从而增强生成器学习真实数据整体分布的能力。
请参阅图2,图2是本发明第二实施例的增强型生成式对抗网络的结构示意图。本发明实施例的增强型生成式对抗网络通过构建N个增强型生成式对抗网络组成多通道生成式对抗网络,使得每一个增强型生成器(Gi,i=1…N)只需要学习对应类别的真实样本分布
Figure BDA0001692994190000078
相比于普通的生成器需要学习所有样本的整体分布(φ)而言,本发明实施例的增强型生成式对抗网络使得N个增强型生成器更容易达到纳什平衡状态,从而降低了生成式对抗网络难训练的问题,提升了生成式对抗网络的普适性。经过多次迭代训练,可以得到最优的判别器
Figure BDA0001692994190000071
和生成器
Figure BDA0001692994190000072
利用多通道最优化生成器可以按类别生成带标注高质量数据:
Figure BDA0001692994190000073
其中,
Figure BDA0001692994190000074
代表新生成第i类数据,Zi代表第i类初始化噪声。同时利用多通道最优化判别器可以对任意未标注数据
Figure BDA0001692994190000075
进行标签预测:
Figure BDA0001692994190000076
Figure BDA0001692994190000077
本发明实施例的增强型生成式对抗网络使用多通道生成式对抗网络中的多个增强型生成器进行按类别地生成新的样本数据;同时,也可以使用多通道生成式对抗网络中的多个增强型判别器组成一个增强型判别器阵列,并对未标注样本进行类别预测。从而增加了标注数据的数量,使得训练复杂的深度卷积神经网络分类器更加容易。
请参阅图3,图3是本发明实施例的目标样本识别方法的流程图。本发明实施例的目标样本识别方法包括:
步骤100:构建基于胶囊机制的增强型生成式对抗网络;
其中,步骤100具体包括:首先,设计基于胶囊机制的增强型判别器,利用胶囊特征向量化表达的模式,提升判别器特征提取和特征识别的能力,并进一步通过梯度信息传播,提升生成器学习样本整体分布的能力,从而增强整个生成对抗模型的判别能力和生成能力;其次,设计合适的“生成-判别”交替优化方案,提高增强型生成对抗模型达到纳什平衡的能力,提高模型的鲁棒性;最后,设计模型的目标函数,使模型能够充分利用有标注样本和无标注样本,提升模型在有限的标注样本条件下快速学习数据整体分布的能力,实现样本的精准识别。
本方案在现有深度卷积生成式对抗网络的基础上,提出基于胶囊机制的增强型判别器,通过向量化表达样本的方向信息特征、层次信息特征,提升判别器的样本特征表达和特征识别能力,从而增强生成器学习真实数据整体分布的能力。请一并参阅图1,图1是增强型生成式对抗网络结构示意图。增强型生成式对抗网络包括增强型生成器和增强型判别器,增强型生成器将获得初始数据通过反池化层、线性修正、过滤(Filtering)层得到生成图片,并提供生成图片给增强型判别器,增强型判别器对图片进行处理后反馈分类结果给增强型生成器。增强型判别器包括:卷基层、基础胶囊层,卷积胶囊层和分类胶囊层,卷基层、基础胶囊层,卷积胶囊层和分类胶囊层依次相连。各层的层数的多少和结构参数根据目标样本的特征而定。
步骤200:构建多通道生成式对抗网络,利用训练过的多通道生成式对抗网络对无标注数据进行标签预测,根据优化后的生成器生成相应类别的样本,利用优化后的判别器对目标样本进行精准识别。
在步骤200中,首先,在增强型生成式对抗网络的基础上,针对目标样本的类别特点,设计多通道增强型生成式对抗网络,利用不同类别的样本分别训练各个通道的生成式对抗网络;其次,利用训练过的多通道生成式对抗网络对无标注数据进行标签预测,并利用优化后的生成器生成相应类别的样本,从而获得更充分的标注样本;最后,利用优化后的判别器,实现目标样本的精准识别。
请一并参阅图3,为了方便方案描述,本方案假设样本类别数目为N,针对N类数据集
Figure BDA0001692994190000094
数据集
Figure BDA0001692994190000095
整体分布服从分布
Figure BDA0001692994190000096
其中每一类数据子集可表示为
Figure BDA0001692994190000091
并服从分布
Figure BDA0001692994190000092
通过构建N个增强型生成式对抗网络组成多通道生成式对抗网络,使得每一个增强型生成器(Gi,i=1…N)只需要学习对应类别的真实样本分布
Figure BDA0001692994190000093
步骤200具体包括:
步骤210:对标注样本进行数据增强;
在步骤220中,对于原始带标注的数据先进行按类别分类,分别对每一类的数据进行常见的数据增强操作,数据增强操作包括旋转、翻转、缩放等等,扩充后的数据集足够训练对应的多通道对抗生成网络。
步骤220:对增强型判别器网络进行训练;
在步骤220中,对于包含N类的样本,在模型训练过程中会逐一训练包含N个对抗生成网络。对于第i通道对抗生成网络只输入对应的i类的数据。针对第i通道对抗生成网络,对应的最优化的判别器训练目标函数为:
Figure BDA0001692994190000101
Figure BDA0001692994190000102
其中,Loss(G)代表着生成器G的损失函数(Loss Function)。它要测量的是真实数据(Pdata(x))与生成数据(PG(x))之间的差异。初始化判别器网络D的参数θD和设定判别器训练迭代次数nD。训练判别器D时,在每一次的迭代中,从真实数据中采样出若干数据{x1,x2,x3,…xm}。从噪声数据中采样出若干数据{z1,z2,z3,…zm}(正态分布或者均匀分布)。然后通过生成器获得生成若干生成数据
Figure BDA0001692994190000103
计算出若干惩罚项数据
Figure BDA0001692994190000104
∈是一个0~1之间的随机数;然后可以进行参数更新:
Figure BDA0001692994190000105
经过以上nD次迭代训练就可以使得增强型判别器得到更好的性能。按照同样的方法,对剩下的N-1个增强型判别器进行训练,从而形成一组N个增强型判别器组。
步骤230:对增强型生成器进行网络训练;
在步骤230中,对于一组多通道对抗生成网络,也包含了N个增强型生成器。把训练数据按类别分成N类,并使用每一类的数据对相应的增强型生成器进行训练。最优化的生成器训练目标函数为:
Figure BDA0001692994190000111
其中V(G,D)的定义与步骤二相同。对于寻找最优化生成器的过程,需要先初始化生成器网络G的参数θG和设定生成器训练迭代次数nG。再从噪声数据中采样出若干数据{z1,z2,z3,…zm}(正态分布或者均匀分布);然后可以进行参数更新:
Figure BDA0001692994190000112
然后再返回第一步进行新一轮的迭代,一共进行nG次的迭代更新,就可以使增强型型生成器达到最优的性能。按照同样的方法,对CSM其他类别的生成器进行训练,从而可以得到一组增强型生成器。
步骤240:输入噪声数据,通过增强型生成器生成新的标注数据;
在步骤240中,在得到一组训练好的多通道生成式对抗网络之后,取出所有的增强型生成器
Figure BDA0001692994190000113
对于每一个增强型网络,分别输入一组噪声数据(高斯分布、均匀分布等)将会生成一组新的带标注数据,它的标注类别为该生成器所对应的类别:
Figure BDA0001692994190000114
其中,
Figure BDA0001692994190000115
代表新生成第i类数据,Zi代表第i类初始化噪声。以此类推,对一个生成器进行相同的操作,都可以生成新的标注数据。这样便可以增加每类数据的数量,也扩充了数据集的大小。
步骤250:通过增强型判别器对无标注数据进行类别预测;
在步骤250中,在得到一组训练好的多通道生成式对抗网络之后,取出所有的生成器
Figure BDA0001692994190000121
从原始未标注疾病数据集中任意取出一份数据
Figure BDA0001692994190000122
分别输入到每一类的判别器当中。每一个判别器都会对此数据类别进行判断(y1,y2,…yN),输出一个0-1之间的数字,数字越接近1意味着被判定为该类的置信度越高。理想状态下,所有的判别器中只会有一个输出值接近于1,其他的输出值都接近于0。这样就可以判定该输入数据的类别为输出值最大的那一类。如果存在多个接近1的输出值,说明生成器的训练并没有达到最优化的状态,需要继续返回训练。
Figure BDA0001692994190000123
Figure BDA0001692994190000124
以此类推,对原始数据集中的每一份未标注数据进行上述操作,会使未标注数据变成标注数据。从而增加了数据集中带标注的数据量,也扩充了数据集的大小。
步骤260:基于多通道生成式对抗网络中的判别器对目标样本进行分类。
在步骤260中,训练好的多通道生成式对抗网络中包含了N个增强型生成式对抗网络。把其中所有的增强型判别器取出来可以形成一组增强型判别器阵列(Ds,s=1…N)。这N个增强型判别器分别对应着疾病数据的N个类别。这些增强型判别器可以直接对测试样本进行分类预测。在测试阶段中,取任意测试样本(dk)分别输入到每一个增强型判别器()当中。每一个增强型判别器(Ds)对于输入样本(dk)会对硬输出一个0~1之间的数字。该数字越大代表该判别器判定测试样本为所对应类别的置信度越高。正常情况下,一组N个增强型判别器对于一个测试样本得输出值中只有一个会接近1(例如Dj),其余的输出值都会接近0。根据以上分析可知,对于该测试样本(dk)的类别会被预测为某疾病的第j类样本。按照以上方法,对于测试集中的每一个测试样本可以重复以上的操作即可对每个样本进行分类。
针对有限的标注样本,本发明实施例的增强型生成式对抗网络以及目标样本识别方法提出了融合胶囊机制的增强型生成式对抗网络,该网络利用向量化模式表达图像特征,显著增强了判别器对真实样本和生成样本的识别能力,进而提高了生成器学习真实数据整体分布的能力,使得生成对抗模型更容易达到纳什平衡。
在增强型生成式对抗网络的基础上,本发明实施例的增强型生成式对抗网络以及目标样本识别方法进一步提出了多通道生成对抗模型。针对N类数据集
Figure BDA00016929941900001311
数据集
Figure BDA00016929941900001312
整体分布服从分布
Figure BDA00016929941900001313
其中每一类数据子集可表示为
Figure BDA0001692994190000131
并服从分布
Figure BDA0001692994190000132
通过构建N个增强型生成式对抗网络组成多通道生成式对抗网络,使得每一个增强型生成器(Gi,i=1…N)只需要学习对应类别的真实样本分布
Figure BDA0001692994190000133
相比于普通的生成器需要学习所有样本的整体分布(φ)而言,本项目的方法使得N个增强型生成器更容易达到纳什平衡状态,从而降低了生成式对抗网络难训练的问题,提升了生成式对抗网络的普适性。经过多次迭代训练,可以得到最优的判别器
Figure BDA0001692994190000134
和生成器
Figure BDA0001692994190000135
利用多通道最优化生成器可以按类别生成带标注高质量数据:
Figure BDA0001692994190000136
其中,
Figure BDA0001692994190000137
代表新生成第i类数据,Zi代表第i类初始化噪声。同时利用多通道最优化判别器可以对任意未标注数据
Figure BDA0001692994190000138
进行标签预测:
Figure BDA0001692994190000139
Figure BDA00016929941900001310
本发明实施例的增强型生成式对抗网络以及目标样本识别方法可以有效解决少量标注样本条件下的模式识别问题,实现目标样本的精准识别。
本发明实施例的增强型生成式对抗网络以及目标样本识别方法使用多通道生成式对抗网络中的多个增强型生成器进行按类别地生成新的样本数据;同时,也可以使用多通道生成式对抗网络中的多个增强型判别器组成一个增强型判别器阵列,并对未标注样本进行类别预测。从而增加了标注数据的数量,使得训练复杂的深度卷积神经网络分类器更加容易。
本发明实施例的增强型生成式对抗网络以及目标样本识别方法与现有技术相比,具有以下显著特点和积极效果:通过训练多通道生成式对抗网络使得多个增强型生成器分别学习到原始数据库中不同类别数据各自的子分布,这使得网络训练更容易达到纳什平衡,使得生成式对抗网络更容易训练。通过多通道生成式对抗网络中的多个增强型生成器和相应的增强型判别器阵列,可以大量地增加标注数据量,从而解决了在一些领域,譬如医学影像领域,大量高质量标注数据获取困难的问题,可以更加方便训练基于深度卷积神经网络的分类模型。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种增强型生成式对抗网络的构建方法,应用于医学影像领域,其特征在于,所述增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器,所述增强型生成器将获得的初始数据进行处理得到生成数据,并提供生成数据给增强型判别器,所述增强型判别器对生成数据进行处理,并反馈分类结果给增强型生成器,所述增强型判别器包括卷积层、基础胶囊层、卷积胶囊层和分类胶囊层,所述卷积层、基础胶囊层、卷积胶囊层和分类胶囊层依次相连;通过向量化表达样本的方向信息特征、层次信息特征,提升所述增强型判别器的样本特征表达和特征识别能力,增强生成器学习真实数据整体分布的能力,所述数据为图片;
多个所述增强型生成器按类别生成新的样本数据,多个所述增强型判别器组成增强型判别器阵列,对未标注样本进行类别预测;
在增强型生成式对抗网络的基础上,根据目标样本的类别特点,设计多通道增强型生成式对抗网络;通过不同类别的样本分别训练各个通道的生成式对抗网络;所述目标样本的样本类别数目为N,针对N类数据集
Figure FDA0003423064100000013
数据集
Figure FDA0003423064100000014
整体分布服从分布
Figure FDA0003423064100000015
其中每一类数据子集可表示为
Figure FDA0003423064100000011
并服从分布
Figure FDA0003423064100000012
具体包括:
对于原始带标注的数据先进行按类别分类,分别对每一类的数据进行常见的数据增强操作;对增强型判别器网络进行训练:
对于包含N类的样本,在模型训练过程中会逐一训练包含N个对抗生成网络;对于第i通道对抗生成网络只输入对应的i类的数据;针对第i通道对抗生成网络,对应的最优化的判别器训练目标函数为:
Figure FDA0003423064100000021
Figure FDA0003423064100000022
其中,Loss(G)代表着生成器G的损失函数,它要测量的是真实数据Pdata(x)与生成数据PG(x)之间的差异,初始化判别器网络D的参数θD和设定判别器训练迭代次数nD;训练判别器D时,在每一次的迭代中,从真实数据中采样出若干数据{x1,x2,x3,…xm};从噪声数据中采样出若干数据{z1,z2,z3,…zm},数据为正态分布或者均匀分布;然后通过生成器获得生成若干生成数据
Figure FDA0003423064100000023
计算出若干惩罚项数据
Figure FDA0003423064100000024
∈是一个0~1之间的随机数;然后进行参数更新:
Figure FDA0003423064100000025
经过以上nD次迭代训练就可以使得增强型判别器得到更好的性能;按照同样的方法,对剩下的N-1个增强型判别器进行训练,从而形成一组N个增强型判别器组;
对增强型生成器进行网络训练:对于一组多通道对抗生成网络,也包含了N个增强型生成器;把训练数据按类别分成N类,并使用每一类的数据对相应的增强型生成器进行训练;
最优化的生成器训练目标函数为:
Figure FDA0003423064100000026
其中,对于寻找最优化生成器的过程,需要先初始化生成器网络G的参数θG和设定生成器训练迭代次数nG;再从噪声数据中采样出若干数据{z1,z2,z3,…zm},以正态分布或者均匀分布;然后进行参数更新:
Figure FDA0003423064100000027
然后再返回第一步进行新一轮的迭代,一共进行nG次的迭代更新,就可以使增强型型生成器达到最优的性能;
按照同样的方法,对CSM其他类别的生成器进行训练,从而可以得到一组增强型生成器;
输入噪声数据,通过增强型生成器生成新的标注数据:在得到一组训练好的多通道生成式对抗网络之后,取出所有的增强型生成器
Figure FDA0003423064100000031
Figure FDA0003423064100000032
对于每一个增强型网络,分别输入一组包括高斯分布和均匀分布的噪声数据,将会生成一组新的带标注数据,它的标注类别为该生成器所对应的类别:
Figure FDA0003423064100000033
其中,
Figure FDA0003423064100000034
代表新生成第i类数据,Zi代表第i类初始化噪声;以此类推,对一个生成器进行相同的操作,都可以生成新的标注数据;这样便可以增加每类数据的数量,也扩充了数据集的大小;
通过增强型判别器对无标注数据进行类别预测:在得到一组训练好的多通道生成式对抗网络之后,取出所有的生成器
Figure FDA0003423064100000035
从原始未标注疾病数据集中任意取出一份数据
Figure FDA0003423064100000036
分别输入到每一类的判别器当中;每一个判别器都会对此数据类别进行判断(y1,y2,…yN),输出一个0-1之间的数字,数字越接近1意味着被判定为该类的置信度越高;
理想状态下,所有的判别器中只会有一个输出值接近于1,其他的输出值都接近于0;这样就可以判定该输入数据的类别为输出值最大的那一类;如果存在多个接近1的输出值,说明生成器的训练并没有达到最优化的状态,需要继续返回训练;
Figure FDA0003423064100000037
Figure FDA0003423064100000041
以此类推,对原始数据集中的每一份未标注数据进行上述操作,会使未标注数据变成标注数据;
基于多通道生成式对抗网络中的判别器对目标样本进行分类:训练好的多通道生成式对抗网络中包含了N个增强型生成式对抗网络;把其中所有的增强型判别器取出来可以形成一组增强型判别器阵列Ds,s=1…N;
N个增强型判别器分别对应着疾病数据的N个类别;
在测试阶段中,取任意测试样本dk分别输入到每一个增强型判别器中,每一个增强型判别器Ds对于输入样本dk会对硬输出一个0~1之间的数字;该数字越大代表该判别器判定测试样本为所对应类别的置信度越高;正常情况下,一组N个增强型判别器对于一个测试样本得输出值中只有一个会接近1,其余的输出值都会接近0;根据以上分析,对于该测试样本dk的类别会被预测为某疾病的第j类样本,按照以上方法,对于测试集中的每一个测试样本重复以上的操作即可对每个样本进行分类。
2.根据权利要求1所述的增强型生成式对抗网络的构建方法,其特征在于,所述增强型生成器将获得的初始数据通过反池化层、线性修正、过滤层得到生成数据。
3.根据权利要求1或2所述的增强型生成式对抗网络的构建方法,其特征在于,所述卷积层、基础胶囊层、卷积胶囊层和分类胶囊层的层数和结构参数根据目标样本的特征进行设定。
4.一种利用权利要求1至3任一项所述的增强型生成式对抗网络的构建方法的目标样本识别方法,应用于医学影像领域,其特征在于,包括:
步骤a:构建增强型生成式对抗网络,其中,构建的增强型生成式对抗网络包括至少一个增强型生成器和至少一个增强型判别器;
步骤b:根据构建的增强型生成式对抗网络和目标样本的类别特点构建多通道生成式对抗网络,利用训练过的多通道生成式对抗网络对无标注数据进行标签预测,根据增强型生成器生成相应类别的样本,利用增强型判别器对目标样本进行精准识别;
所述步骤a基于胶囊机制构建增强型生成式对抗网络;
所述步骤b具体为:
在增强型生成式对抗网络的基础上,根据目标样本的类别特点,设计多通道增强型生成式对抗网络;通过不同类别的样本分别训练各个通道的生成式对抗网络;所述目标样本的样本类别数目为N,针对N类数据集
Figure FDA0003423064100000057
Figure FDA0003423064100000058
数据集
Figure FDA0003423064100000055
整体分布服从分布
Figure FDA0003423064100000056
其中每一类数据子集可表示为
Figure FDA0003423064100000051
并服从分布
Figure FDA0003423064100000052
具体包括:
对标注样本进行数据增强:对于原始带标注的数据先进行按类别分类,分别对每一类的数据进行常见的数据增强操作;
对增强型判别器网络进行训练:对于包含N类的样本,在模型训练过程中会逐一训练包含N个对抗生成网络;对于第i通道对抗生成网络只输入对应的i类的数据;针对第i通道对抗生成网络,对应的最优化的判别器训练目标函数为:
Figure FDA0003423064100000053
Figure FDA0003423064100000054
其中,Loss(G)代表着生成器G的损失函数,它要测量的是真实数据Pdata(x)与生成数据PG(x)之间的差异,初始化判别器网络D的参数θD和设定判别器训练迭代次数nD;训练判别器D时,在每一次的迭代中,从真实数据中采样出若干数据{x1,x2,x3,…xm};从噪声数据中采样出若干数据{z1,z2,z3,…zm},数据为正态分布或者均匀分布;然后通过生成器获得生成若干生成数据
Figure FDA0003423064100000061
Figure FDA0003423064100000062
计算出若干惩罚项数据
Figure FDA0003423064100000063
∈是一个0~1之间的随机数;然后进行参数更新:
Figure FDA0003423064100000064
经过以上nD次迭代训练就可以使得增强型判别器得到更好的性能;按照同样的方法,对剩下的N-1个增强型判别器进行训练,从而形成一组N个增强型判别器组;
对增强型生成器进行网络训练:对于一组多通道对抗生成网络,也包含了N个增强型生成器;把训练数据按类别分成N类,并使用每一类的数据对相应的增强型生成器进行训练;
最优化的生成器训练目标函数为:
Figure FDA0003423064100000065
其中,对于寻找最优化生成器的过程,需要先初始化生成器网络G的参数θG和设定生成器训练迭代次数nG;再从噪声数据中采样出若干数据{z1,z2,z3,…zm},以正态分布或者均匀分布;然后进行参数更新:
Figure FDA0003423064100000066
然后再返回第一步进行新一轮的迭代,一共进行nG次的迭代更新,就可以使增强型型生成器达到最优的性能;
按照同样的方法,对CSM其他类别的生成器进行训练,从而可以得到一组增强型生成器;
输入噪声数据,通过增强型生成器生成新的标注数据:在得到一组训练好的多通道生成式对抗网络之后,取出所有的增强型生成器
Figure FDA0003423064100000071
1…N,对于每一个增强型网络,分别输入一组包括高斯分布和均匀分布的噪声数据,将会生成一组新的带标注数据,它的标注类别为该生成器所对应的类别:
Figure FDA0003423064100000072
其中,
Figure FDA0003423064100000077
代表新生成第i类数据,Zi代表第i类初始化噪声;以此类推,对一个生成器进行相同的操作,都可以生成新的标注数据;这样便可以增加每类数据的数量,也扩充了数据集的大小;
通过增强型判别器对无标注数据进行类别预测:在得到一组训练好的多通道生成式对抗网络之后,取出所有的生成器
Figure FDA0003423064100000073
从原始未标注疾病数据集中任意取出一份数据
Figure FDA0003423064100000074
分别输入到每一类的判别器当中;每一个判别器都会对此数据类别进行判断(y1,y2,…yN),输出一个0-1之间的数字,数字越接近1意味着被判定为该类的置信度越高;
理想状态下,所有的判别器中只会有一个输出值接近于1,其他的输出值都接近于0;这样就可以判定该输入数据的类别为输出值最大的那一类;如果存在多个接近1的输出值,说明生成器的训练并没有达到最优化的状态,需要继续返回训练;
Figure FDA0003423064100000075
Figure FDA0003423064100000076
以此类推,对原始数据集中的每一份未标注数据进行上述操作,会使未标注数据变成标注数据;
基于多通道生成式对抗网络中的判别器对目标样本进行分类:训练好的多通道生成式对抗网络中包含了N个增强型生成式对抗网络;把其中所有的增强型判别器取出来可以形成一组增强型判别器阵列Ds,s=1…N;
N个增强型判别器分别对应着疾病数据的N个类别;
在测试阶段中,取任意测试样本dk分别输入到每一个增强型判别器中,每一个增强型判别器Ds对于输入样本dk会对硬输出一个0~1之间的数字;该数字越大代表该判别器判定测试样本为所对应类别的置信度越高;正常情况下,一组N个增强型判别器对于一个测试样本得输出值中只有一个会接近1,其余的输出值都会接近0;根据以上分析,对于该测试样本dk的类别会被预测为某疾病的第j类样本,按照以上方法,对于测试集中的每一个测试样本重复以上的操作即可对每个样本进行分类。
5.根据权利要求4所述的目标样本识别方法,其特征在于,在所述步骤a中,所述增强型生成器将获得的初始数据进行处理得到生成数据,并提供生成数据给增强型判别器,所述增强型判别器对生成数据进行处理,并反馈分类结果给增强型生成器。
6.根据权利要求4或5所述的目标样本识别方法,其特征在于,在所述步骤a中,所述增强型判别器包括:卷积层、基础胶囊层,卷积胶囊层和分类胶囊层,所述卷积层、基础胶囊层,卷积胶囊层和分类胶囊层依次相连。
7.根据权利要求4所述的目标样本识别方法,其特征在于,所述步骤a包括:利用胶囊特征向量化表达的模式,设计基于胶囊机制的增强型判别器;根据增强型生成对抗模型的纳什平衡能力,设计“生成-判别”交替优化方案;利用有标注样本和无标注样本,设计模型的目标函数。
CN201810604607.9A 2018-06-12 2018-06-12 一种增强型生成式对抗网络以及目标样本识别方法 Active CN109063724B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810604607.9A CN109063724B (zh) 2018-06-12 2018-06-12 一种增强型生成式对抗网络以及目标样本识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810604607.9A CN109063724B (zh) 2018-06-12 2018-06-12 一种增强型生成式对抗网络以及目标样本识别方法

Publications (2)

Publication Number Publication Date
CN109063724A CN109063724A (zh) 2018-12-21
CN109063724B true CN109063724B (zh) 2022-02-22

Family

ID=64820679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810604607.9A Active CN109063724B (zh) 2018-06-12 2018-06-12 一种增强型生成式对抗网络以及目标样本识别方法

Country Status (1)

Country Link
CN (1) CN109063724B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726669B (zh) * 2018-12-26 2020-11-17 浙江捷尚视觉科技股份有限公司 基于对抗网络的不同光照条件下行人再识别数据生成方法
CN111376910B (zh) * 2018-12-29 2022-04-15 北京嘀嘀无限科技发展有限公司 用户行为的识别方法、识别系统及计算机设备
CN111797863A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 模型训练方法、数据处理方法、装置、存储介质及设备
CN110197226B (zh) * 2019-05-30 2021-02-09 厦门大学 一种无监督图像翻译方法及系统
CN110503654B (zh) * 2019-08-01 2022-04-26 中国科学院深圳先进技术研究院 一种基于生成对抗网络的医学图像分割方法、系统及电子设备
CN111126503B (zh) * 2019-12-27 2023-09-26 北京同邦卓益科技有限公司 一种训练样本的生成方法和装置
CN111507410B (zh) * 2020-04-17 2021-02-12 中国科学院半导体研究所 卷积胶囊层的构建方法和多视角图像的分类方法及装置
CN112036281B (zh) * 2020-07-29 2023-06-09 重庆工商大学 基于改进胶囊网络的人脸表情识别方法
CN112115267B (zh) * 2020-09-28 2023-07-07 平安科技(深圳)有限公司 文本分类模型的训练方法、装置、设备及存储介质
CN112465037B (zh) * 2020-11-30 2023-12-19 深圳供电局有限公司 目标检测方法、装置、计算机设备及存储介质
CN112508175A (zh) * 2020-12-10 2021-03-16 深圳先进技术研究院 用于低剂量pet重建的多任务学习型生成式对抗网络生成方法及系统
CN113947706B (zh) * 2021-12-20 2022-06-28 四川师范大学 一种基于生成对抗网络的图像多样性增强方法与系统
CN114545255B (zh) * 2022-01-18 2022-08-26 广东工业大学 基于竞争型生成式对抗神经网络的锂电池soc估计方法
CN115019510B (zh) * 2022-06-29 2024-01-30 华南理工大学 一种基于动态自适应生成对抗网络的交通数据修复方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273936A (zh) * 2017-07-07 2017-10-20 广东工业大学 一种gan图像处理方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460386B2 (en) * 2015-02-05 2016-10-04 International Business Machines Corporation Passage justification scoring for question answering
CN107392118B (zh) * 2017-07-04 2020-04-03 竹间智能科技(上海)有限公司 基于多任务对抗生成网络的强化人脸属性识别方法及系统
CN107392147A (zh) * 2017-07-20 2017-11-24 北京工商大学 一种基于改进的生成式对抗网络的图像语句转换方法
CN108090521B (zh) * 2018-01-12 2022-04-08 广州视声智能科技股份有限公司 一种生成式对抗网络模型的图像融合方法和判别器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273936A (zh) * 2017-07-07 2017-10-20 广东工业大学 一种gan图像处理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
人工智能研究的新前线:生成式对抗网络;林懿伦 等;《自动化学报》;20180531;第44卷(第05期);第775-791页 *

Also Published As

Publication number Publication date
CN109063724A (zh) 2018-12-21

Similar Documents

Publication Publication Date Title
CN109063724B (zh) 一种增强型生成式对抗网络以及目标样本识别方法
WO2019237240A1 (zh) 一种增强型生成式对抗网络以及目标样本识别方法
US11645835B2 (en) Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications
Fang et al. A Method for Improving CNN-Based Image Recognition Using DCGAN.
Liu et al. Rankiqa: Learning from rankings for no-reference image quality assessment
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN109584337B (zh) 一种基于条件胶囊生成对抗网络的图像生成方法
CN111583263B (zh) 一种基于联合动态图卷积的点云分割方法
CN109711426B (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
CN110232341B (zh) 基于卷积-堆叠降噪编码网络的半监督学习图像识别方法
CN110348399B (zh) 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN109063649B (zh) 基于孪生行人对齐残差网络的行人重识别方法
CN104866810A (zh) 一种深度卷积神经网络的人脸识别方法
CN111027576B (zh) 基于协同显著性生成式对抗网络的协同显著性检测方法
CN107169117B (zh) 一种基于自动编码器和dtw的手绘图人体运动检索方法
CN111625667A (zh) 一种基于复杂背景图像的三维模型跨域检索方法及系统
CN102385592B (zh) 图像概念的检测方法和装置
CN113688894B (zh) 一种融合多粒度特征的细粒度图像分类方法
CN110110845B (zh) 一种基于并行多级宽度神经网络的学习方法
Ejbali et al. A dyadic multi-resolution deep convolutional neural wavelet network for image classification
CN110543916A (zh) 一种缺失多视图数据的分类方法及系统
CN114926693A (zh) 基于加权距离的sar图像小样本识别方法及装置
CN111639697B (zh) 基于非重复采样与原型网络的高光谱图像分类方法
CN110111365B (zh) 基于深度学习的训练方法和装置以及目标跟踪方法和装置
CN114913379A (zh) 基于多任务动态对比学习的遥感图像小样本场景分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant