CN113435488B - 一种图像采样概率提升方法及其应用 - Google Patents
一种图像采样概率提升方法及其应用 Download PDFInfo
- Publication number
- CN113435488B CN113435488B CN202110674593.XA CN202110674593A CN113435488B CN 113435488 B CN113435488 B CN 113435488B CN 202110674593 A CN202110674593 A CN 202110674593A CN 113435488 B CN113435488 B CN 113435488B
- Authority
- CN
- China
- Prior art keywords
- image
- hidden
- convolution
- network
- deconvolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000005070 sampling Methods 0.000 title claims abstract description 50
- 238000012952 Resampling Methods 0.000 claims abstract description 5
- 238000009826 distribution Methods 0.000 claims description 62
- 238000012549 training Methods 0.000 claims description 31
- 238000010606 normalization Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 5
- 206010028980 Neoplasm Diseases 0.000 claims description 4
- 201000011510 cancer Diseases 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 4
- 238000005192 partition Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 30
- 230000004913 activation Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 230000009021 linear effect Effects 0.000 description 9
- 239000013598 vector Substances 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 3
- 238000013145 classification model Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 201000005202 lung cancer Diseases 0.000 description 3
- 208000020816 lung neoplasm Diseases 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
本申请属于图像识别技术领域,特别是涉及一种图像采样概率提升方法及其应用。现有技术导致模型的正确识别概率降低,模型泛化误差过大。本申请提供了一种图像采样概率提升方法,所述方法包括获取图像数据,提取所述图像隐藏特征,对所述隐藏特征参数进行重采样,对样本特征进行识别调整样本被采样权重。提高识别结果的准确性。
Description
技术领域
本申请属于图像识别技术领域,特别是涉及一种图像采样概率提升方法及其应用。
背景技术
图像识别是将图像文件转化成若干个通道的二维矩阵作为卷积网络的输入,将分类结果向量作为输出的过程。整个过程通常包括图像信息的处理、图像特征卷积提取和分类模型的建立三个阶段。传统的图像分类问题的解决方法主要是将图片作为输入到卷积网络中进行特征提取,最终得到一个分类结果的向量。
人脸图像经过卷积之后所得到潜在空间中的特征是只有计算机能够识别的特征,这些特征通常是计算机通过对图像计算得到的潜在分布的结果。若是光光通过提升训练集中样本的少数人种图像的数量,这些处在潜在分布中所占特征基数比偏少的图像仍然得不到充分地训练。导致模型对少数派样本图像得不到充分的学习,最终得到模型泛化误差偏大的结果。
发明内容
1.要解决的技术问题
基于图像数据集中人的特征分布总是呈现高斯分布的形式,处于高斯分布两端的少数派样本拥有较小的基数,所以造成少数派样本特征被采样次数过少。最终这样的现象导致模型的正确识别概率降低,模型泛化误差过大的问题,本申请提供了一种图像采样概率提升方法及其应用。
2.技术方案
为了达到上述的目的,本申请提供了一种图像采样概率提升方法,所述方法包括获取图像数据,提取所述图像隐藏特征,对所述隐藏特征参数进行重采样,对样本特征进行识别调整样本被采样权重。
本申请提供的另一种实施方式为:所述对样本特征进行识别调整样本被采样权重包括提取所述隐藏特征分布,将所述隐藏特征分布分区间转化为概率,再把概率转化为倒数,进行采样概率加权。
本申请还提供一种基于变分自编码器的建模方法,采用所述图像采样概率提升方法进行建模。
本申请提供的另一种实施方式为:所述方法包括获取图像库的多批次采样图像数据;对所述图像数据进行卷积特征提取,得到图像特征数据;对所述图像数据采用构建的卷积网络进行训练获得图像识别模型,所述图像特征数据包括隐藏特征,根据一部分所述隐藏特征采用所述模型对图像数据进行识别分类;将另一部分所述隐藏特征作为高斯分布参数进行重参数化后将结果作为输入重复以上步骤得到第二结果;将所述第二结果输入反卷积网络中,重构原图像;所述重构原图像与原图像进行对比构成所述图像识别模型的损失函数,根据所述损失对所述图像识别模型进行优化。
本申请提供的另一种实施方式为:所述图像识别模型包括编码器卷积网络和解码器反卷积网络;所述编码器卷积网络包括卷积层和归一化层,所述卷积层包括第一卷积模块、第二卷积模块、第三卷积模块和第一全连接模块;所述解码器反卷积网络包括反卷积层,所述反卷积层包括第二全连接模块、第一反卷积模块、第二反卷积模块、第三反卷积模块,所述第二圈连接模块与所述第一全连接模块完全相反。
本申请提供的另一种实施方式为:所述损失函数以潜在变量与单位高斯分布匹配程度的相对熵和重构原图像与原图像差值相结合的自定义。
本申请提供的另一种实施方式为:所述编码器卷积网络为能够输出表示图像特征隐藏层的卷积网络。
本申请提供的另一种实施方式为:所述一部分所述隐藏特征参数为隐藏单元所构成潜在空间分布的期望,所述另一部分所述隐藏特征为隐藏单元所构成潜在空间分布的方差;将所述一部分所述隐藏特征和所述另一部分所述隐藏特征的正态分布参数进行正态分布组合之后作为对图像特征描述的输出结果。
本申请提供的另一种实施方式为:所述识别分类结果中,若图像为非需要图像,则不对所述非需要图像隐藏层参数进行处理,若图像为需要图像,将卷积网络输出结果作为反卷积网络的输入进行图像的重构。
本申请还提供一种图像采样概率提升方法的应用,将所述的基于变分自编码器的建模方法应用于人脸识别、癌症病例切片图像或者芯片进行电路检查。
3.有益效果
与现有技术相比,本申请提供的一种图像采样概率提升方法及其应用及应用的有益效果在于:
本申请提供的图像采样概率提升方法,解决传统识别模型存在的对特征不明显的小样本识别误差过大的问题。
本申请提供的图像采样概率提升方法,通过半监督学习的方法对图像库中提取的图像数据进行训练得到识别模型,以及在采用识别模型对待不同的图像进行识别时候,在每一个训练批次开始前更新对稀有特征图像样本采样的概率进行调整,从而有效地弱化模型对多数派样本特征识别的偏置性,提高识别结果的准确性。
本申请提供的图像采样概率提升方法,为一种基于变分自编码器的对少数派样本图像采样概率提升方法。
本申请提供的图像采样概率提升方法,采用构建的卷积网络对图像库中提取的图像数据进行训练得到识别模型,以及在采用识别模型对待不同的图像进行识别时候,在每一个训练批次开始前更新对稀有特征图像样本采样的概率进行调整,从而有效地弱化模型对多数派样本特征识别的偏置性,提高识别结果的准确性。
本申请提供的图像采样概率提升方法的应用,通过基于变分自编码器的对少数派样本图像采样概率提升方法,在训练开始时利用上一个轮次中已训练好的编码器将数据集样本被采样权重进行更新,再对训练集样本中的图像数据进行采样。经过学习之后,根据编码器的卷积网络学习到的人脸特征分布,将训练集中稀有的少数派样本被采样概率提升,从而达到对少数派个体的稀有特征也能得到充分学习的目的。这样的提高稀有样本被采样概率的方法可以使得卷积网络的分类准确性大大增加。
本申请提供的基于变分自编码器的建模方法,具体涉及一种通过卷积生成网络将一个大型数据集中一些小部分样本特征不明显的数据被采样概率提升的技术。
本申请提供的基于变分自编码器的建模方法,通过对图像数据集中图像的潜在特征空间的特征提取,并通过将提取的特征参数进行重采样后,对样本特征进行识别调整样本的被采样权重。然后将数据通过反卷积网络重新生成的技术。这种采样模型可以有效地让应用于图像识别的卷积网络能学习到少数派样本的特征,提高图像识别网络的泛化能力。
附图说明
图1是本申请的基于变分自编码器的建模方法流程示意图;
图2是本申请的图像采样概率提升方法流程示意图。
具体实施方式
在下文中,将参考附图对本申请的具体实施例进行详细地描述,依照这些详细的描述,所属领域技术人员能够清楚地理解本申请,并能够实施本申请。在不违背本申请原理的情况下,各个不同的实施例中的特征可以进行组合以获得新的实施方式,或者替代某些实施例中的某些特征,获得其它优选的实施方式。
目前行业内都在针对人脸识别优化做着各种努力。而就Face++来讲,未来研究会从几个角度去改善目前的状况,如增加训练数据,针对不同人种进行专门训练,另外是从算法层面优化现在的流程,提升对不同人种的识别性能。
参见图1~2,本申请提供一种图像采样概率提升方法,所述方法包括获取图像数据,提取所述图像隐藏特征,对所述隐藏特征参数进行重采样,对样本特征进行识别调整样本被采样权重。
进一步地,所述对样本特征进行识别调整样本被采样权重包括提取所述隐藏特征分布,将所述隐藏特征分布分区间转化为概率,再把概率转化为倒数,进行采样概率加权,使得少数派样本权值提高。原理是把特征概率分布化为n个区间(n为超参数由作者指定),则概率分布可以转化为一个直方图,某区间直方图的面积表示该特征取在这个区间样本的概率。所以将这个概率取倒数可以将不易被采样的样本被采样概率提升。
本申请还提供一种基于变分自编码器的建模方法,采用所述图像采样概率提升方法进行建模。
进一步地,所述方法包括获取图像库的多批次采样图像数据;对所述图像数据进行卷积特征提取,得到图像特征数据;对所述图像数据采用构建的卷积网络进行训练获得图像识别模型,所述图像特征数据包括隐藏特征,根据一部分所述隐藏特征采用所述模型对图像数据进行识别分类;将另一部分所述隐藏特征作为高斯分布参数进行重参数化后将结果作为输入重复以上步骤得到第二结果;将所述第二结果输入反卷积网络中,重构原图像;所述重构原图像与原图像进行对比构成所述图像识别模型的损失函数,根据所述损失对所述图像识别模型进行优化。
将所述图像数据中的数据划分为训练数据集和验证数据集,对每一个输入的图像数据都对应两个特征,用来表示是否为带有人脸的图像;一般判定图像是否为存在人脸图像只有两个答案:是人脸图像,非人脸图像。但是在卷积网络里判定此图像是否为图像则要通过卷积结果判定。所以需要设定两个特征,第一个特征数表示此图片为人脸图像,第二个特征数表示非人脸图像。对图片进行卷积计算之后,可以通过比较卷积结果两个特征值的大小判定该图像是否为人脸图像。
将被划分为训练数据集的图像数据输入至权利要求1中所述的卷积网络中进行训练,根据标签进行优化得到特征提取模型。
再将上述经过卷积网络的输出结果特征经过重参数化之后,将其输入到解码器的反卷积网络中,构成重构图像。根据原图像和生成图像的损失进行优化,获得优化后解码器的生成模型。
进一步地,所述图像识别模型包括编码器卷积网络和解码器反卷积网络;所述编码器卷积网络包括卷积层和归一化层,所述卷积层包括第一卷积模块、第二卷积模块、第三卷积模块和第一全连接模块;所述解码器反卷积网络包括反卷积层,所述反卷积层包括第二全连接模块、第一反卷积模块、第二反卷积模块、第三反卷积模块,所述第二圈连接模块与所述第一全连接模块完全相反。并且将所述编码器的卷积结果作为隐藏特征的分布更新进行对数据集采样概率权重的更新。
根据获得的参数设置该编码器卷积网络各种卷积层中模型参数其中包括:输入图像的大小、生成图像的大小、隐藏层单元数目、分类数目、训练模型每次训练的样本数量、模型优化器的学习率、损失函数的选择以及数据集被轮询的次数。
在上述基于编码器卷积网络的建模方法中,所述编码器卷积网络中包括卷积层、激活层、归一化层、全连接层,所述解码器的反卷积网络中包含卷积层、激活层和全连接层。本申请在编码器卷积网络与解码器反卷积网络之间将隐藏层数据进行了处理,使得一部分隐藏层数据作为分类结果,另外一部分隐藏层的结果作为隐藏特征的概率分布进行相互组合并重参数化,将重参数化的数据作为反卷积网络的输入得到重新生成图像的结果。所述构建编码器网络与解码器网络的步骤包括:
所述编码器网络包含三个卷积模块与一个全连接模块。在第一卷积模块对图像特征数据进行卷积,对卷积后的图像特征数据进行激活函数引入非线性的元素,得到结果之后将其作归一化处理保证数据在同一分布下,输出第一特征图。
第二个卷积模块对第一卷积模块输出的第一特征图进行卷积,将卷积结果输入到激活函数中再作归一化处理,得到第二特征图。
所述第三卷积模块对第二卷积模块输出的第二特征图进行卷积,并将卷积后的输出结果输入到激活函数后再作归一化处理,得到第三特征图。
所述第三特征图中的数据将作为输入,被输入到全连接层中。在全连接层中,第三特征图中的数据将被变形为向量,再对其作线性运算,最终得到网络所期望的隐藏层结果。
所述隐藏层的结果可以被划分为三部分,第一部分是对输入图像数据的分类结果,第二部分是图像数据隐藏层所代表特征分布的期望,第三部分是图像数据所代表特征分布的方差。
将上述隐藏层的结果中第二部分和第三部分根据高斯分布公式(因为一般对人群中的特征如:身高、体重等都服从高斯分布,所以这里也默认特征服从高斯分布)重参数化输入到反卷积网络中。在解码器的反卷积网络中,网络将这部分特征还原为图像。
所述特征单元将被放入全连接层模块,对特征单元进行线性层计算,再使得特征单元变形还原成可以作为反卷积层输入的形状。
所述变形过后的特征单元数据将被作为输入,被放入第一反卷积层中,经过反卷积计算过后,将运算结果输入到激活函数中得到第一反卷积特征图。
所述第二反卷积模块将第一反卷卷积特征图输入到第二反卷积网络中,得到结果之后输入到激活函数中得到第二反卷积特征图。
所述第三反卷积模块将把第二反卷积特征图作为输入,在第三反卷积网络以及激活函数的作用下得到还原之后的图像。
所述还原后图像将被与原图像作比对,将两图像的差值与隐藏单元相互组合后的分布与单位高斯分布之间的KL散度值线性结合,并将两个值加权之后线性相加作为损失函数。以上述损失函数作为依据,通过优化器调节参数,使得模型不断优化,得到初始模型。
进一步地,所述损失函数以潜在变量与单位高斯分布匹配程度的相对熵和重构原图像与原图像差值相结合的自定义。
进一步地,所述编码器卷积网络为能够输出表示图像特征隐藏层的卷积网络。
进一步地,所述一部分所述隐藏特征参数为隐藏单元所构成潜在空间分布的期望,所述另一部分所述隐藏特征为隐藏单元所构成潜在空间分布的方差;将所述一部分所述隐藏特征和所述另一部分所述隐藏特征的正态分布参数进行正态分布组合之后作为对图像特征描述的输出结果。
进一步地,所述识别分类结果中,若图像为非需要图像,则不对所述非需要图像隐藏层参数进行处理,若图像为需要图像,将卷积网络输出结果作为反卷积网络的输入进行图像的重构。
获取图像数据集中的图像数据时可以基于已训练完成的编码器来对整个图像数据集的采样概率进行更新。这使得每一次训练时,训练器可以有选择地对少数派样本被采样概率增大。调整概率的步骤包括:
根据上一次经过卷积网络的结果(隐藏层中代表方差的隐藏单元),对数据进行采样概率的重新调整。就是将具有稀有特征且基数较小的图像特征被采样的概率提高,以便将有稀有特征训练集能够得到均等的机会被学习。
本申请还提供一种图像采样概率提升方法的应用,将所述的图像采样概率提升方法应用于人脸识别、癌症病例切片图像或者芯片进行电路检查。
本申请可以广泛应用于需要深度学习卷积识别网络的领域,例如:在以用医疗领域中癌症病例的切片图像中通常会应用深度学习的图像识别技术。一般早期肺癌的肺部照影中肺癌细胞通常都比较微小,如果能够通过本申请的方法,对早期肺癌的肺部造影图像进行充分学习,那么能使得深度学习在医疗诊断方面大大提升应用效果。在工业生产方面对芯片进行电路检查,通常在工业生产车间中,电路板被制作失败的电路板图像很容易被识别出来。但几个地方由于各种原因制作不完美,导致芯片寿命下降的例子,如果能够图像识别模型能充分学习,那么可以大幅提升芯片产品质量和生产车间出片率。
实施例
请参阅图1,本申请实例提供了一种可应用于人脸识别的基于变分自编码器的对少数派样本图像采样概率提升方法,该应用场景不受限制。该发明主要应用于需要对图像判定是否存在人脸特征,换而言之,于图像中是否存在人脸。
首先本申请采用的数据集是来自于人脸数据集CelebA Dataset和Image Net图像数据集两个数据集分别提供人脸识别的正例与反例。对于一个批次的数据,训练器将从正例和反例数据集中各取一半批次的数据以及其标签,并且对取出数据进行测试集的划分,将一小部分作为测试集用例来测试。其中CelebA Dataset属性数据集是一个大规模的面部属性数据集,其中包含有两百万位名人图像,每个图像有40个属性注释。而Image Net图像数据是一些自然图像,其中不包含任何与人脸有关的图像数据,可以作为反例用来训练网络。
步骤一:对所述的图像数据进行数据采集,通过Python库函数随机从CelebA与Image Net 中按权重随机抽取一个批次的图像数据,将三通道图像转化为3*64*64的张量数据。上述权重是卷积网络经过训练之后根据图像的潜在空间特征进行概率的调整,具体在后续的步骤中会详尽说明。
步骤二:构建编码器的卷积网络。
需要说明的是,卷积网络通常包括卷积模块(包括卷积层、激活层、归一化层)、全连接层。卷积层是通过卷积核参与卷积计算的操作。全连接层是将卷积层中得到的结果压平,对输入的特征图进行降维提纯,再经过线性层的计算后得到网络起始设定的隐藏单元特征。
所述卷积模块由三层卷积构成,每一层卷积层中由三部分构成。其中第一部分为卷积层,其目的是计算图像每块卷积核对应感受野的特征值。经过卷积层的计算之后得到特征图。在得到特征图之后,需要将特征图输入到激活函数中,使得数据具有非线性的特性。最后将结果输入到归一化层中,这一步操作的目的是为了使得数据在同一个数量级的分布中比较。
所述全连接层是将经过卷积模块计算过后的结果经过变形将每个图像所对应的特征图变为一个可以作为线性层输入的一个向量,再输入到线性层中。在经过线性层的计算之后,网络得到起始设定个数的隐藏单元。构建上述卷积层以及全连接层的模型参数信息中需要确定:卷积层中卷积层输入通道数、输出通道数、卷积核大小、卷积步长,归一化层中输入特征数量,全连接层中输出隐藏层单元个数。在本实例中用户还需要输入训练网络的参数:损失函数指定、学习率的大小、一个训练数据批次的大小、整个训练的轮询次数、训练所用的优化器类别。
上述步骤二的具体是:构建能够输出能够表示图像特征隐藏层的卷积网络,首先构建卷积层,其中第一层卷积层对输入的3*64*64的数据进行卷积操作,使用卷积层参数输入通道为 3输出通道为24使用6*6大小的卷积核,卷积步长为2。从卷积层中得到的结果被输入到激活函数中,再经过批量归一化层的计算得到第一卷积模块的输出结果。第二层卷积层对上一层结果进行卷积操作,使用卷积层参数输入通道为24输出通道为48使用8*8大小的卷积核,卷积步长为2。将卷积层中得到的结果被输入到激活函数中,再经过批量归一化层后得到第二卷积模块的输出结果。第三层卷积层进行卷积操作,使用卷积层参数输入通道为48输出通道为72使用3*3大小的卷积核,卷积步长为3。从卷积层中得到的结果被输入到激活函数中,再经过批量归一化层后得到第三卷积模块的输出结果。得到卷积模块的输出结果后,将输出结果变形为648维的向量,再将被变形得到的向量输入到线性层中得到202个隐藏单元。其中前2个单元作为图像分类的结果,后200个隐藏单元作为100个特征的分布参数分为两个部分。假定隐藏单元组成100个正态分布,认定隐藏单元中前一个部分参数作为隐藏单元所构成潜在空间分布的期望,后一个部分作为隐藏单元所构成潜在空间分布的方差。本申请将隐藏单元的第一部分和第二部分的正态分布参数进行正态分布组合之后作为对图像特征描述的输出结果。
根据上述隐藏单元中的前2个单元的图像分类结果,若图像分类为非人脸图像,则不对该图像的隐藏层参数作任何处理。若图像分类为人脸图像,将卷积网络输出结果作为反卷积网络的输入进行图像的重构。
上述卷积网络输出结果其作用除了对生成图像进行重构,还有根据卷积网络输出结果对图像的隐藏空间数据进行分析,使得在采集图像样本时去对图像特征的除偏置性。具体操作是:特征概率分布化为100个区间,则概率分布可以转化为一个直方图,某区间直方图的面积表示该特征取在这个区间样本的概率。所以将这个概率取倒数之后,作为步骤一对样本数据集采样的权值进行权重更新,这样可以使得样本特征不明显的样本被采样概率提升,从而使得图像的稀有特征也可以被模型学习到。
步骤三:构建解码器的反卷积网络用以生成图像
上述编码器的卷积网络得出的隐藏层分布参数将被作为解码器反卷积网络的输入,根据特征还原图像。反卷积网络中第一部分是和卷积网络完全相反的全连接层,其中输入为100 个隐藏层单元,输出为72*3*3带有图像特征的张量。上述隐藏层单元输入时是作为特征向量输入,输出时应当变形为可以被反卷积层所接收的形状。
反卷积层中第一层反卷积层对输入的72*3*3的数据进行反卷积操作,使用反卷积层的参数输入通道为72输出通道为48,卷积核大小为3*3,卷积步长为3。经过反卷积操作之后的结果需要输入到激活函数ReLU中,引入非线性性质。第二层反卷积层中使用反卷积层的参数输入通道为48输出通道为24,卷积核大小为8*8,卷积步长为2。经过第二步的反卷积操作之后的结果,同样需要输入到激活函数ReLU中。第三层反卷积层中使用反卷积层的参数输入通道为24输出通道为3,卷积核大小为6*6,卷积步长为2。经过反卷积层的计算后,经过非线性函数,得到输出结果为重新生成的图像。
步骤四:此操作可以提升数据集中小基数样本的被采样概率,从而使得模型可以提升识别准确性。
请参阅图2,本申请将数据集中所有的人脸图像输入到当前已经训练过的解码器中。从输出结果提取隐藏特征分布的期望,将每个样本对应的每个维度的期望统计起来。再分别提取每个隐藏层的维度,并统计整个人脸数据集在这个维度上的分布,根据这个隐藏层的分布给每一个样本赋予一个处于该分布概率的倒数。也就是说,在这个分布上越稀有则被采样的概率越大。随后将对100个隐藏特征每个特征进行计算一次,依据最大的概率值对每个人脸图像的被采样概率更新。最终每一张人脸图像的被采样概率将被更新为所处最稀有分布的概率的倒数。
对定义完网络结构后对上述网络进行训练,在训练过程中需要定义损失函数。本实例所采用的损失函数是以潜在变量与单位高斯分布匹配程度的KL散度(相对熵)和生成图像与原图像差值相结合的自定义损失函数。因为隐藏层单元表示的是人群中某个特征分布,所以默认一般这种自然分布都遵从单位高斯分布。训练优化器定义Adam优化器对网络参数调节,学习率的大小被设置为1e-4。
其中训练完成之后对网络的泛化性进行测试处理是,首先专门打包一个测试集图像其中有训练集中不经常出现的肤色较黑的男性、肤色较黑的女性,还有训练集中经常出现的肤色较白的男性、肤色较白的女性。根据常规分类模型的卷积分类模型对图像进行识别是否有人脸图像数据,准确性只能达到80%左右,然而一般的模型对肤色较黑的男性与肤色较黑的女性的识别准确度只能达到50%左右。而上述提到的对小样本采样概率进行调整的模型可以将人脸识别的准确率提升至80%。可见该可调节采样概率的模型为图像识别准确率的提升奠定了基础。
本申请同上述具体实施方案中详细描述,进行过具体实验。其中实验过程包括获取公开图像数据集,根据已得到的数据集编写采样函数,采样函数需要根据训练网络的不同阶段进行不同程度的采样。以及为了证明该卷积网络图像识别的去偏置性,本申请需要专门特殊的少数派样本数据用来测试该模型对泛化能力提升的可行性。
实验过程中还包括网络的搭建,其中卷积网络以及反卷积网络中参数需要特殊设定。卷积网络与反卷积网络之间的衔接中,需要将前几个特征作为图像特征的识别。而且剩余的特征数值需要重参数化,为了将图像特征转变为可以被输入到反卷积网络中的数据形状。以及每一轮次在上个轮次的卷积网络被训练完成之后,利用该卷积网络将样本数据集中图像的被采样几率重新调整。之后经过图像特征被反卷积计算之后,需要将重构之后的图像与原图像作损失函数计算,根据损失函数的梯度方向进行调参。
利用上述测试用的少数派样本数据,将数据输入经过完全训练完成之后的卷积识别模型中,对比普通不经过少数派样本概率采样调整,本申请的优势显而易见。
在实验数据中卷积识别网络对肤色较白的男性与肤色较白的女性的识别概率,两种模型识别准确度基本上达到了80%以上,而且经过少数派样本概率采样调整的模型相对较高2.1%。然而对肤色较黑的男性与肤色较黑的女性的识别概率,未经过少数派样本概率采样调整的模型识别准确度要降低到50%左右(由于数据集中肤色较黑的人样本数量较少)。而经过少数派样本概率采样调整的识别模型在识别准确度上能达到80%的概率。上述结果足以证明,本申请对少数派样本概率采样调整对模型泛化能力提升的可行性。
尽管在上文中参考特定的实施例对本申请进行了描述,但是所属领域技术人员应当理解,在本申请公开的原理和范围内,可以针对本申请公开的配置和细节做出许多修改。本申请的保护范围由所附的权利要求来确定,并且权利要求意在涵盖权利要求中技术特征的等同物文字意义或范围所包含的全部修改。
Claims (5)
1.一种基于变分自编码器的建模方法,其特征在于:采用图像采样概率提升方法进行建模;所述图像采样概率提升方法包括获取图像数据,提取所述图像隐藏特征,对所述隐藏特征参数进行重采样,对样本特征进行识别调整样本被采样权重;所述对样本特征进行识别调整样本被采样权重包括提取所述隐藏特征分布,将所述隐藏特征分布分区间转化为概率,再把概率转化为倒数,进行采样概率加权;所述方法包括获取图像库的多批次采样图像数据;
对所述图像数据进行卷积特征提取,得到图像特征数据;
对所述图像数据采用构建的卷积网络进行训练获得图像识别模型,所述图像特征数据包括隐藏特征,根据一部分所述隐藏特征采用所述模型对图像数据进行识别分类;
将另一部分所述隐藏特征作为高斯分布参数进行重参数化后将结果作为输入重复以上步骤得到第二结果;
将所述第二结果输入反卷积网络中,重构原图像;所述重构原图像与原图像进行对比构成所述图像识别模型的损失函数,根据所述损失对所述图像识别模型进行优化;所述图像识别模型包括编码器卷积网络和解码器反卷积网络;所述编码器卷积网络包括卷积层和归一化层,所述卷积层包括第一卷积模块、第二卷积模块、第三卷积模块和第一全连接模块;所述解码器反卷积网络包括反卷积层,所述反卷积层包括第二全连接模块、第一反卷积模块、第二反卷积模块、第三反卷积模块,所述第二全连接模块与所述第一全连接模块完全相反;所述一部分所述隐藏特征参数为隐藏单元所构成潜在空间分布的期望,所述另一部分所述隐藏特征为隐藏单元所构成潜在空间分布的方差;将所述一部分所述隐藏特征和所述另一部分所述隐藏特征的正态分布参数进行正态分布组合之后作为对图像特征描述的输出结果。
2.如权利要求1所述的基于变分自编码器的建模方法,其特征在于:所述损失函数以潜在变量与单位高斯分布匹配程度的相对熵和重构原图像与原图像差值相结合的形式定义。
3.如权利要求1所述的基于变分自编码器的建模方法,其特征在于:所述编码器卷积网络为能够输出表示图像特征隐藏层的卷积网络。
4.如权利要求1所述的基于变分自编码器的建模方法,其特征在于:识别分类结果中,若图像为非需要图像,则不对所述非需要图像隐藏层参数进行处理,若图像为需要图像,将卷积网络输出结果作为反卷积网络的输入进行图像的重构。
5.一种基于变分自编码器的建模方法的应用,其特征在于:将所述权利要求1~4中任一项所述的基于变分自编码器的建模方法应用于人脸识别、癌症病例切片图像识别或者芯片电路检查。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110674593.XA CN113435488B (zh) | 2021-06-17 | 2021-06-17 | 一种图像采样概率提升方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110674593.XA CN113435488B (zh) | 2021-06-17 | 2021-06-17 | 一种图像采样概率提升方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435488A CN113435488A (zh) | 2021-09-24 |
CN113435488B true CN113435488B (zh) | 2023-11-07 |
Family
ID=77756316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110674593.XA Active CN113435488B (zh) | 2021-06-17 | 2021-06-17 | 一种图像采样概率提升方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435488B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117173543B (zh) * | 2023-11-02 | 2024-02-02 | 天津大学 | 一种肺腺癌和肺结核的混合图像重构方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224948A (zh) * | 2015-09-22 | 2016-01-06 | 清华大学 | 一种基于图像处理的最大间隔深度生成模型的生成方法 |
CN108416370A (zh) * | 2018-02-07 | 2018-08-17 | 深圳大学 | 基于半监督深度学习的图像分类方法、装置和存储介质 |
CN110197205A (zh) * | 2019-05-09 | 2019-09-03 | 三峡大学 | 一种多特征来源残差网络的图像识别方法 |
CN111310852A (zh) * | 2020-03-08 | 2020-06-19 | 桂林电子科技大学 | 一种图像分类方法及系统 |
CN111711821A (zh) * | 2020-06-15 | 2020-09-25 | 南京工程学院 | 基于深度学习的信息隐藏方法 |
CN112541944A (zh) * | 2020-12-10 | 2021-03-23 | 山东师范大学 | 基于条件变分编码器的概率孪生目标跟踪方法及系统 |
WO2021083241A1 (zh) * | 2019-10-31 | 2021-05-06 | Oppo广东移动通信有限公司 | 人脸图像质量评价方法、特征提取模型训练方法、图像处理系统、计算机可读介质和无线通信终端 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389128B (zh) * | 2018-08-24 | 2021-08-27 | 中国石油天然气股份有限公司 | 电成像测井图像特征自动提取方法及装置 |
CN109993825B (zh) * | 2019-03-11 | 2023-06-20 | 北京工业大学 | 一种基于深度学习的三维重建方法 |
-
2021
- 2021-06-17 CN CN202110674593.XA patent/CN113435488B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224948A (zh) * | 2015-09-22 | 2016-01-06 | 清华大学 | 一种基于图像处理的最大间隔深度生成模型的生成方法 |
CN108416370A (zh) * | 2018-02-07 | 2018-08-17 | 深圳大学 | 基于半监督深度学习的图像分类方法、装置和存储介质 |
CN110197205A (zh) * | 2019-05-09 | 2019-09-03 | 三峡大学 | 一种多特征来源残差网络的图像识别方法 |
WO2021083241A1 (zh) * | 2019-10-31 | 2021-05-06 | Oppo广东移动通信有限公司 | 人脸图像质量评价方法、特征提取模型训练方法、图像处理系统、计算机可读介质和无线通信终端 |
CN111310852A (zh) * | 2020-03-08 | 2020-06-19 | 桂林电子科技大学 | 一种图像分类方法及系统 |
CN111711821A (zh) * | 2020-06-15 | 2020-09-25 | 南京工程学院 | 基于深度学习的信息隐藏方法 |
CN112541944A (zh) * | 2020-12-10 | 2021-03-23 | 山东师范大学 | 基于条件变分编码器的概率孪生目标跟踪方法及系统 |
Non-Patent Citations (1)
Title |
---|
基于假设检验的隐写分析;王仰国 等;电脑知识与技术;第6卷(第2期);第299-301页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113435488A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110599409B (zh) | 基于多尺度卷积组与并行的卷积神经网络图像去噪方法 | |
CN110889853B (zh) | 基于残差-注意力深度神经网络的肿瘤分割方法 | |
CN109726751B (zh) | 基于深度卷积神经网络识别脑电成像图的方法 | |
CN110889852B (zh) | 基于残差-注意力深度神经网络的肝脏分割方法 | |
CN110309853B (zh) | 基于变分自编码器的医学图像聚类方法 | |
CN106408550A (zh) | 一种改进的自适应多字典学习的图像超分辨率重建方法 | |
CN112991493B (zh) | 基于vae-gan和混合密度网络的灰度图像着色方法 | |
CN112232438B (zh) | 面向高维图像表示多核子空间学习框架 | |
CN112818764A (zh) | 一种基于特征重建模型的低分辨率图像人脸表情识别方法 | |
CN111738363A (zh) | 基于改进的3d cnn网络的阿尔茨海默病分类方法 | |
CN111371611B (zh) | 一种基于深度学习的加权网络社区发现方法及装置 | |
CN112085745A (zh) | 基于均衡采样拼接的多通道u型全卷积神经网络的视网膜血管图像分割方法 | |
CN113435488B (zh) | 一种图像采样概率提升方法及其应用 | |
CN111598830A (zh) | 一种基于无监督学习的皮肤癌疾病检测方法 | |
CN111652238A (zh) | 一种多模型集成方法及系统 | |
CN113762117B (zh) | 一种图像处理模型的训练方法、图像处理模型及计算机设备 | |
CN112259228B (zh) | 一种动态注意力网络非负矩阵分解的抑郁症筛选方法 | |
CN110427892B (zh) | 基于深浅层自相关融合的cnn人脸表情特征点定位方法 | |
CN111767842B (zh) | 基于迁移学习和自编码器数据增强的微表情种类判别方法 | |
CN112766143B (zh) | 一种基于多情绪的人脸老化处理方法和系统 | |
CN114004295A (zh) | 一种基于对抗增强的小样本图像数据拓展方法 | |
CN116508076A (zh) | 利用自动编码器的人物特性归一化 | |
CN112488936B (zh) | 一种基于生成对抗网络的手指静脉模糊图像去模糊的方法 | |
CN117671395B (zh) | 一种癌细胞种类识别装置 | |
CN116306673B (zh) | 一种文本特征提取方法与系统、电子设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |