CN111476269B - 均衡样本集构建、翻拍图像识别方法、装置、设备及介质 - Google Patents
均衡样本集构建、翻拍图像识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111476269B CN111476269B CN202010143207.XA CN202010143207A CN111476269B CN 111476269 B CN111476269 B CN 111476269B CN 202010143207 A CN202010143207 A CN 202010143207A CN 111476269 B CN111476269 B CN 111476269B
- Authority
- CN
- China
- Prior art keywords
- samples
- negative
- positive
- flip
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 110
- 238000004088 simulation Methods 0.000 claims abstract description 59
- 238000005070 sampling Methods 0.000 claims description 144
- 238000000605 extraction Methods 0.000 claims description 54
- 238000010586 diagram Methods 0.000 claims description 37
- 238000009826 distribution Methods 0.000 claims description 33
- 239000011159 matrix material Substances 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 6
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000246358 Thymus Species 0.000 description 1
- 235000007303 Thymus vulgaris Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000001585 thymus vulgaris Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种均衡样本集构建、翻拍图像识别方法、装置、设备及介质,所述方法包括:获取不均衡翻拍样本集和预设的目标均衡样本数;将不均衡翻拍样本集输入均衡样本集构建模型中的DVAE‑GAN网络模型进行训练,直到DVAE‑GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的DVAE‑GAN网络模型记录为训练完成的DVAE‑GAN网络模型;若目标均衡样本数同时大于正样本数以及负样本数,训练完成的DVAE‑GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;获取均衡翻拍样本集,以供训练翻拍识别模型。本发明实现了通过均衡样本集构建模型生成足够数量且均衡的翻拍样本以供翻拍识别模型训练,能够减少收集翻拍样本的时间,并提高翻拍识别模型的识别准确率和命中率。
Description
技术领域
本发明涉及图像分类领域,尤其涉及一种均衡样本集构建、翻拍图像识别方法、装置、计算机设备及存储介质。
背景技术
随着信用社会的发展,越来越多的应用场景(比如:涉及金融、保险、安防的应用场景)需要通过证件识别、人脸识别对用户身份进行验证。随着数据拍照技术的提升,不法分子通过翻拍图像来验证用户身份的手段层出不穷,验证过程变得越来越难于核查,在现有技术中,主要通过自动识别翻拍图像进行验证,就需要大量的翻拍图像和正常图像对翻拍识别模型进行训练,从而提高翻拍识别模型对翻拍图像识别的准确率和命中率,但是在训练翻拍识别模型时所需的图像数量是非常庞大的,通常很难获取到如此庞大的训练图像,而且实际应用场景下获取的翻拍图像与正常图像的比例十分不均衡,如百里挑一,因此,训练后的翻拍识别模型的准确率和命中率不高,导致身份验证过程中没有识别出翻拍图像,将会对用户信息出现安全性问题。
发明内容
本发明提供一种均衡样本集构建、翻拍图像识别方法、装置、计算机设备及存储介质,实现了在少量不均衡的翻拍样本情况下,通过均衡样本集构建模型生成足够数量且均衡的翻拍样本,提供给翻拍识别模型训练,能够减少收集翻拍样本的时间,并且能够提高翻拍识别模型的识别准确率和命中率。
一种均衡样本集构建方法,包括:
获取不均衡翻拍样本集和预设的目标均衡样本数;其中,所述不均衡翻拍样本集包含若干个翻拍样本,所述翻拍样本包括正翻拍样本和负翻拍样本;所述正翻拍样本的正样本数与所述负翻拍样本的负样本数不均衡;
将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型;
若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
获取所述均衡样本集构建模型输出均衡翻拍样本集,确定均衡样本集构建完成,所述均衡翻拍样本集用于训练翻拍识别模型;其中,所述均衡翻拍样本集包括与所述目标均衡样本数相等的正均衡样本以及与所述目标均衡样本数相等的负均衡样本,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
一种翻拍图像识别方法,包括:
接收验证指令,获取待识别图像;
将所述待识别图像输入训练完成的翻拍识别模型,其中,所述翻拍识别模型为通过使用上述均衡样本集构建模型输出的均衡翻拍样本集进行训练获得;
所述翻拍识别模型通过对所述待识别图像进行纹理特征的提取,并获取所述翻拍识别模型根据所述纹理特征输出的识别结果,所述识别结果表征了所述待识别图像是否为翻拍。
一种均衡样本集构建装置,包括:
获取模块,用于获取不均衡翻拍样本集和预设的目标均衡样本数;其中,所述不均衡翻拍样本集包含若干个翻拍样本,所述翻拍样本包括正翻拍样本和负翻拍样本;所述正翻拍样本的正样本数与所述负翻拍样本的负样本数不均衡;
训练模块,用于将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型;
生成模块,用于若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
输出模块,用于获取所述均衡样本集构建模型输出均衡翻拍样本集,确定均衡样本集构建完成,所述均衡翻拍样本集用于训练翻拍识别模型;其中,所述均衡翻拍样本集包括与所述目标均衡样本数相等的正均衡样本以及与所述目标均衡样本数相等的负均衡样本,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
一种翻拍图像识别装置,包括:
接收模块,用于接收验证指令,获取待识别图像;
输入模块,用于将所述待识别图像输入训练完成的翻拍识别模型,其中,所述翻拍识别模型为通过使用上述均衡样本集构建模型输出的均衡翻拍样本集进行训练获得;
识别模块,用于所述翻拍识别模型通过对所述待识别图像进行纹理特征的提取,并获取所述翻拍识别模型根据所述纹理特征输出的识别结果,所述识别结果表征了所述待识别图像是否为翻拍。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述均衡样本集构建方法的步骤,或者所述处理器执行所述计算机程序时实现上述翻拍图像识别方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述均衡样本集构建方法的步骤,或者所述计算机程序被处理器执行时实现上述翻拍图像识别方法的步骤。
本发明提供的均衡样本集构建方法、装置、计算机设备及存储介质,通过所述不均衡翻拍样本集输入至所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练直至训练完成,在所述不均衡翻拍样本集的基础上,所述训练完成的所述DVAE-GAN网络模型随机生成等于所述目标均衡样本数与所述负样本数之间差值的所述正翻拍模拟样本和等于所述目标均衡样本数与所述负样本数之间差值的所述负翻拍模拟样本,在所述不均衡翻拍样本集的基础上,获取所述均衡样本集构建模型输出的用于训练翻拍识别模型的均衡翻拍样本集,确定均衡样本集构建完成。因此,在少量不均衡的翻拍样本情况下,通过均衡样本集构建模型生成足够数量且均衡的翻拍样本,提供给翻拍识别模型训练,能够减少收集翻拍样本的时间,减少了成本,缩短了训练周期,并且能够提高翻拍识别模型的识别准确率和命中率。
本发明提供的翻拍图像识别方法、装置、计算机设备及存储介质,通过使用上述所述均衡样本集构建模型输出的均衡且足够数量的翻拍样本集进行训练所述翻拍识别模型,能够提高所述翻拍识别模型的准确率和命中率,如此,本发明实现了快速地、准确地识别出翻拍图像,提高了识别的准确率和命中率,提升了识别效率和可靠性,节省了成本。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中均衡样本集构建方法或翻拍图像识别方法的应用环境示意图;
图2是本发明一实施例中均衡样本集构建方法的流程图;
图3是本发明一实施例中均衡样本集构建方法的步骤S20的流程图;
图4是本发明一实施例中均衡样本集构建方法的步骤S206的流程图;
图5是本发明一实施例中均衡样本集构建方法的步骤S30的流程图;
图6是本发明一实施例中翻拍图像识别方法的流程图;
图7是本发明一实施例中均衡样本集构建装置的原理框图;
图8是本发明一实施例中翻拍图像识别装置的原理框图;
图9是本发明一实施例中计算机设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供的均衡样本集构建方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种识别模型训练方法,其技术方案主要包括以下步骤S10-S40:
S10,获取不均衡翻拍样本集和预设的目标均衡样本数;其中,所述不均衡翻拍样本集包含若干个翻拍样本,所述翻拍样本包括正翻拍样本和负翻拍样本;所述正翻拍样本的正样本数与所述负翻拍样本的负样本数不均衡。
可理解地,所述不均衡翻拍样本集包含至少一个与正标签值关联的所述正翻拍样本和至少一个与负标签值关联的所述负翻拍样本,所述正翻拍样本可以为正常图像经过处理后的(80,80)特征矩阵(该矩阵包含6400个特征值)的样本,所述负翻拍图像样本可以为翻拍图像经过处理后的(80,80)特征矩阵(该矩阵包含6400个特征值)的样本,其中,所述正样本数和所述负样本数之间存在不均衡的情况,将所述正样本数占所述不均衡翻拍样本集的样本总数的占比标记为正样本占比,将所述负样本数占所述不均衡翻拍样本集的样本总数的占比标记为负样本占比,所述不均衡为所述负样本占比和所述正样本占比之间相差悬殊,比如不均衡翻拍样本集有1000个,其中5个为负翻拍样本,995个为正翻拍样本,负样本占比为0.5%,正样本占比为99.5%,正样本占比和负样本占比之间相差悬殊。
在一实施例中,所述步骤S10,即所述获取不均衡翻拍样本集和预设的目标均衡样本数之前,包括:
S101,对所述不均衡翻拍图像集中的所述翻拍样本对应的翻拍图像进行灰度处理,得到所述翻拍图像的灰度图像,根据六角锥体颜色模型将所述翻拍图像转换得到含有多个通道的色调饱和度图像,并根据颜色空间模型将所述翻拍图像转换得到含有多个通道的色彩视频图像;
可理解地,将所述翻拍图像中的每个像素点进行灰度处理,通过加权平均法公式得出每个像素点的灰度值,从而生成所述翻拍图像的灰度图像,将所述翻拍图像中的每个像素点对应的红色(R)分量值、绿色(G)分量值和蓝色(B)分量值通过加权平均法公式计算得出每个像素点的灰度分量值,所述加权平均法公式为:Y=0.299R+0.587G+0.114B,其中,Y为每个像素点的灰度分量值;R为每个像素点中的红色分量值;G为每个像素点中的绿色分量值;B为每个像素点中的蓝色分量值;从而得到所述翻拍图像的灰度图像;将所述翻拍图像输入所述六角锥体颜色模型,所述六角锥体颜色模型将所述翻拍图像转换输出含有三个通道(色调通道、饱和度通道和明度通道)的所述色调饱和度图像,将所述翻拍图像中的每个像素点对应的红色分量值、绿色分量值和蓝色分量值输入所述六角锥体颜色模型(HSV模型),转换得到每个像素点的色调(H)分量值、饱和度(S)分量值和明度(V)分量值,将所有像素点的色调分量值进行汇总得到色调通道图像,将所有像素点的饱和度分量值进行汇总得到饱和度通道图像,将所有像素点的明度分量值进行汇总得到明度通道图像,由色调通道图像、饱和度通道图像和明度通道图像组成所述翻拍图像的色调饱和度图像(HSV图像);将所述翻拍图像输入所述颜色空间模型,所述颜色空间模型将所述翻拍图像转换输出含有三个通道(灰度通道、色度红通道和色度蓝通道)的所述色调饱和度图像,将所述翻拍图像中的每个像素点对应的红色分量值、绿色分量值和蓝色分量值输入所述色彩视频模型(YCrCb模型),转换得到每个像素点的灰度(Y)分量值、色度红(Cr)分量值和色度蓝(Cb)分量值,将所有像素点的灰度分量值进行汇总得到灰度通道图像,将所有像素点的色度红分量值进行汇总得到色度红通道图像,将所有像素点的色度蓝分量值进行汇总得到色度蓝通道图像,由灰度通道图像、色度红通道图像和色度蓝通道图像组成所述翻拍图像的色彩视频图像(YCrCb图像)。
S102,通过局部相位量化法对所述灰度图像进行变换,获得所述灰度图像的局部相位量化特征直方图的所有归一化值;通过相邻局部二值模式法对所述色调饱和图像的每个通道图像进行变换,获得与所述色调饱和度图像的多个通道图像对应的第一相邻局部二值模式特征直方图的所有标准值;同时通过相邻局部二值模式法对所述色彩视频图像的每个通道图像进行变换,获得与所述色彩视频图像的每个通道图像对应的第二相邻局部二值模式特征直方图的所有标准值;
可理解地,通过所述局部相位量化法提取出与所述灰度图像的每个像素点对应的局部相位量化特征值,将所有所述局部相位量化特征值进行统计分析,得到所述灰度图像的局部相位量化特征直方图;所述第一像素点为所述色调通道图像的一个像素点,所述色调通道图像的每个第一像素点包括所述色调通道图像中每个像素点的色调分量值,所述第二像素点为所述饱和度通道图像的一个像素点,所述饱和度通道图像的每个第二像素点包括所述饱和度通道图像中每个像素点的饱和度分量值,所述第三像素点为所述明度通道图像的一个像素点,所述明度通道图像的每个第三像素点包括所述明度通道图像中每个像素点的明度分量值;通过所述相邻局部二值模式法计算出所述色调饱和度图像中的色调通道图像的所有第一像素点的第一相邻局部二值模式特征值,通过所述相邻局部二值模式法计算出所述色调饱和度图像中的饱和度通道图像的所有第二像素点的第一相邻局部二值模式特征值,通过所述相邻局部二值模式法计算出所述色调饱和度图像中的明度通道图像的所有第三像素点的第一相邻局部二值模式特征值,将所述色调饱和度图像的所有通道的第一相邻局部二值模式特征值进行分离及拼接后得到所述色调饱和度图像的第一相邻局部二值模式特征直方图;所述第四像素点为所述灰度通道图像的一个像素点,所述灰度通道图像的每个第四像素点包括所述灰度通道图像中每个像素点的灰度分量值,所述第五像素点为所述色度红通道图像的一个像素点,所述色度红通道图像的每个第五像素点包括所述色度红通道图像中每个像素点的色度红分量值,所述第六像素点为所述色度蓝通道图像的一个像素点,所述色度蓝通道图像的每个第六像素点包括所述色度蓝通道图像中每个像素点的色度蓝分量值;通过所述相邻局部二值模式法计算出所述色彩视频图像中的灰度通道图像的所有第四像素点的第二相邻局部二值模式特征值,通过所述相邻局部二值模式法计算出所述色彩视频图像中的色度红通道图像的所有第五像素点的第二相邻局部二值模式特征值,通过所述相邻局部二值模式法计算出所述色彩视频图像中的色度蓝通道图像的所有第六像素点的第二相邻局部二值模式特征值,将所述色彩视频图像的所有通道的第二相邻局部二值模式特征值进行分离及拼接后得到所述色彩视频图像的第二相邻局部二值模式特征直方图。因此,所述局部相位量化特征直方图的横坐标有与所述局部相位量化特征值对应的256个维度值,纵坐标为与所述横坐标的维度值对应的所述局部相位量化特征值相等的频次值;所述第一相邻局部二值模式特征直方图的横坐标有3072(256×4×3)个维度值,即所述第一相邻局部二值模式特征直方图包括所述色调饱和度图像中的色调通道图像的第一相邻局部二值模式特征直方图(由预设四个方向对应的特征直方图拼接组成,每个特征直方图有256个维度)、所述色调饱和度图像中的饱和度通道图像的第一相邻局部二值模式特征直方图(由预设四个方向对应的特征直方图拼接组成,每个特征直方图有256个维度)、所述色调饱和度图像中的明度通道图像的第一相邻局部二值模式特征直方图(由预设四个方向对应的特征直方图拼接组成,每个特征直方图有256个维度),纵坐标为与所述横坐标的维度值对应的频次值,即所述3072个维度值对应有3072个频次值;同理,所述第二相邻局部二值模式特征直方图的横坐标有3072(256×4×3)个维度值,即所述第二相邻局部二值模式特征直方图包括所述彩色视频图像中的灰度通道图像的第二相邻局部二值模式特征直方图(由预设四个方向对应的特征直方图拼接组成,每个特征直方图有256个维度)、所述彩色视频图像中的色度红通道图像的第二相邻局部二值模式特征直方图(由预设四个方向对应的特征直方图拼接组成,每个特征直方图有256个维度)、所述彩色视频图像图像中的色度蓝通道图像的第二相邻局部二值模式特征直方图(由预设四个方向对应的特征直方图拼接组成,每个特征直方图有256个维度),纵坐标为与所述横坐标的维度值对应的频次值,即所述3072个维度值对应有3072个频次值。
其中,通过将所述灰度图像的局部相位量化特征直方图的所有频次值进行归一化处理,获得所述灰度图像的局部相位量化特征直方图的所有归一化值,即获得256个所述局部相位量化特征直方图的归一化值;通过将所述色调饱和度图像的每个通道图像对应的第一相邻局部二值模式特征直方图的所有频次值进行标准化处理,获得所述色调饱和度图像的每个通道图像对应的第一相邻局部二值模式特征直方图的所有标准值,即获得3072个所述第一相邻局部二值模式特征直方图的标准值;通过将所述色彩视频图像的每个通道图像对应的第一相邻局部二值模式特征直方图的所有频次值进行标准化处理,获得所述色彩视频图像的每个通道图像对应的第一相邻局部二值模式特征直方图的所有标准值,即获得3072个所述第二相邻局部二值模式特征直方图的标准值。
S103,将所述局部相位量化特征直方图的所有归一化值、所有所述第一相邻局部二值模式特征直方图的所有标准值和所有所述第二相邻局部二值模式特征直方图的所有标准值根据预设的排列规则进行排列,生成所述翻拍图像的矩阵图;
可理解地,将所述局部相位量化特征直方图对应的256个归一化值、所述第一相邻局部二值模式特征直方图对应的3072个标准值和所述第二相邻局部二值模式特征直方图对应的3072个标准值根据预设的排列规则进行排列。优选地,所述排列规则为将所有所述归一化值和所有所述标准值进行拼接后按照80×80的矩阵进行排列,进而生成所述裁切图像的矩阵图,即80×80的矩阵合成的图。
S104,将所述翻拍图像的矩阵图确定为所述不均衡翻拍样本集。
如此,通过对翻拍图像进行转换得到灰度图像、色调饱和度图像(HSV图像)和色彩视频图像(YCrCb图像),通过局部相位量化(LPQ)法获得灰度图像的局部相位量化特征直方图(LPQ特征直方图),通过相邻局部二值模式(CoaLBP)法获得色调饱和度图像的第一相邻局部二值模式特征直方图(CoaLBP特征直方图),同时通过相邻局部二值模式法获得色彩视频图像的第二相邻局部二值模式特征直方图,将局部相位量化特征直方图的所有归一化值、第一相邻局部二值模式特征直方图的所有标准值和第二相邻局部二值模式特征直方图的所有标准值按照尾数补零法并根据预设的排序规则进行排序得到矩阵图,由于所述翻拍图像的矩阵图是让所述翻拍图像的翻拍特征更加凸显,且减少干扰因素,所以所述均衡样本集构建模型无需在对翻拍图像进行预处理,从而能够减少所述均衡样本集构建模型的执行时间。
S20,将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。
可理解地,所述DVAE-GAN网络模型为输入所述不均衡翻拍样本集中的所述翻拍样本进行训练的深度神经网络模型,所述DVAE-GAN网络模型为通过DVAE模型算法和GAN模型算法进行融合的神经网络模型,即所述DVAE-GAN网络模型采用了在VAE(VariationalAuto-Encoder,变分自编码器)模型算法的基础上,采用了两个正态分布与GAN(GenerativeAdversarial Networks,生成式对抗网络)模型算法进行边界决策来区分样本的神经网络模型,所述决策边界就是能够把样本正确分类的一条边界,主要有线性决策边界(lineardecision boundaries)和非线性决策边界(non-linear decisionboundaries)。所述训练方法可以为仅使用不均衡翻拍样本集进行迭代训练的输入,也可以为使用不均衡翻拍样本集和所述不均衡翻拍样本集经过所述DVAE-GAN网络模型的迭代更新所述DVAE-GAN网络模型(即每次训练)后生成获得的增强翻拍样本集同时作为迭代训练的输入,所述DVAE-GAN网络模型的总损失值为通过所述DVAE-GAN网络模型的编码损失值、解码损失值、对抗值和重构值确定的损失值,其中,所述编码损失值为通过所述DVAE-GAN网络模型中的编码器进行计算获得,所述解码损失值为通过所述DVAE-GAN网络模型中的解码器进行计算获得,所述对抗值为通过所述DVAE-GAN网络模型中的判别器中的对抗函数进行计算获得,所述重构值为通过所述DVAE-GAN网络模型中的判别器中的重构函数进行计算获得,所述收敛条件可以为所述总损失值经过了10000次计算后值为很小且不会再下降的条件,即在所述损失值经过10000次计算后值为很小且不会再下降时,停止训练,并将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型;所述收敛条件也可以为所述损失值小于设定阈值的条件,即在所述损失值小于设定阈值时,停止训练,并将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型,所述总损失值未达到所述收敛条件时,迭代更新所述DVAE-GAN网络模型,不断更新所述总损失值向损失值变小的方向靠拢。
在一实施例中,如图3所示,所述正翻拍样本与正标签值关联;所述负翻拍样本与负标签值关联;所述步骤S20之前,即所述将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型之前,包括:
S201,获取不均衡翻拍样本集和增强翻拍样本集;将所述不均衡翻拍样本集和所述增强翻拍样本集记录为训练样本集,对所述训练样本集进行随机获取与预设的抽取数相等的翻拍特征随机样本;其中,所述增强翻拍样本集包括正增强样本和负增强样本;将所述翻拍特征随机样本中的所述正翻拍样本和所述正增强样本记录为正抽取样本,将所述翻拍特征随机样本中的所述负翻拍样本和所述负增强样本记录为负抽取样本。
可理解地,所述增强翻拍样本集为所述不均衡翻拍样本集经过所述DVAE-GAN网络模型每次训练后生成出(即确认出)的样本集合,所述增强翻拍样本集包含正增强样本和负增强样本,将所述不均衡翻拍样本集和所述增强翻拍样本集记录为所述训练样本集,所述训练样本集为输入所述DVAE-GAN网络模型进行训练的样本集合,从所述训练样本集中进行随机获取与预设的抽取数相等的翻拍特征随机样本,所述抽取数可以根据需求进行设定,所述翻拍特征随机样本为输入所述DVAE-GAN网络模型进行训练的样本,将所述翻拍特征随机样本中的所述正翻拍样本和所述正增强样本记录为正抽取样本,将所述翻拍特征随机样本中的所述负翻拍样本和所述负增强样本记录为负抽取样本。
S202,将所有所述翻拍特征随机样本输入所述DVAE-GAN网络模型中的编码器;通过所述编码器对所有所述正抽取样本提取非翻拍特征,生成与所述正抽取样本一一对应的正隐变量;通过所述编码器对所有所述负抽取样本提取翻拍特征,生成与所述负抽取样本一一对应的负隐变量;并通过所述编码器计算出编码损失值。
可理解地,所述编码器为对所述矩阵图进行特征提取输出对应隐变量的卷积神经网络模型,所述编码器根据所述正抽取样本关联的所述正标签值匹配对应的提取特征方式(即非翻拍特征),对所有所述正抽取样本进行非翻拍特征的提取,所述非翻拍特征为不存在纹理、不存在异常斑纹的特征生成对应的所述正隐变量,所述编码器根据所述负抽取样本关联的所述负标签值匹配对应的提取特征方式(即翻拍特征),对所有所述负抽取样本进行翻拍特征的提取,所述翻拍特征为纹理、异常斑纹特征,生成对应的所述负隐变量。
在一实施例中,所述步骤S202中,即所述通过所述编码器计算出编码损失值,包括:
S2021,将所有所述正抽取样本、所有所述负抽取样本、所有所述正抽取样本对应的所述正标签值、所有所述负抽取样本对应的所述负标签值、所有所述正隐变量、所有所述负隐变量输入所述编码器的编码损失函数,通过所述编码损失函数计算得出所述编码损失值。
S203,通过所述DVAE-GAN网络模型中的解码器对所有所述正隐变量进行解码,生成与所述正隐变量一一对应的正解码样本;通过所述解码器对所有所述负隐变量进行解码,生成与所述负隐变量一一对应的负解码样本;并通过所述解码器计算出解码损失值。
可理解地,所述解码器对所述编码器输出的隐变量进行构造矩阵图的卷积神经网络模型,所述解码器根据所述正隐变量重新构造出新的矩阵图,即为所述正解码样本,所述解码器根据所述负隐变量重新构造出新的矩阵图,即为所述负解码样本,所述正解码样本与所述正翻拍样本都为相同规格的矩阵图,所述负解码样本与所述负翻拍样本也都为相同规格的矩阵图。
在一实施例中,所述步骤S203中,即所述通过所述解码器计算出解码损失值,包括:
S2031,将所有所述正抽取样本、所有所述负抽取样本、所有所述正抽取样本对应的所述正标签值、所有所述负抽取样本对应的所述负标签值、所有所述正隐变量、所有所述负隐变量、所有所述正解码样本、所有所述负解码样本输入所述解码器的解码损失函数,通过所述解码损失函数计算得出所述解码损失值。
S204,在所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正隐变量等量的正采样隐变量,并与所述正标签值关联;在所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负隐变量等量的负采样隐变量,并与所述负标签值关联;通过所述解码器对所有所述正采样隐变量进行解码,生成与所述正采样隐变量一一对应的正采样解码样本;通过所述解码器对所有所述负采样隐变量进行解码,生成与所述负采样隐变量一一对应的负采样解码样本;其中,所述第一正态分布图含有正隐平均变量,所述第一正态分布图含有负隐平均变量。
可理解地,所述第一正态分布图为(μ,I)的正态分布图,其中,μ为所述正隐平均变量,I为单位矩阵;所述第二正态分布图为(-μ,I)的正态分布图,其中,-μ为所述负隐平均变量,I为单位矩阵;所述正隐平均变量和所述负隐平均变量为相反数。在所述第一正态分布图中随机采样与所述正隐变量相同数量的所述正采样隐变量,在所述第二正态分布图中随机采样与所述负隐变量相同数量的所述负采样隐变量,并通过所述解码器对所有所述正采样隐变量进行解码生成对应的所述正采样解码样本,以及通过所述解码器对所有所述负采样隐变量进行解码生成对应的所述负采样解码样本,其中,所述正采样解码样本与所述正解码样本都为相同规格的矩阵图,所述负采样解码样本与所述负解码样本都为相同规格的矩阵图。
S205,通过所述DVAE-GAN网络模型中的判别器对所有所述正解码样本进行判别,得出与所述正解码样本一一对应的第一判别结果和第一判别标签值;通过所述判别器对所有所述负解码样本进行判别,得出与所述负解码样本一一对应的第二判别结果和第二判别标签值;通过所述判别器对所有所述正采样解码样本进行判别,得出与所述正采样解码样本一一对应的第三判别结果和第三判别标签值;通过所述判别器对所有所述负采样解码样本进行判别,得出与所述负采样解码样本一一对应的第四判别结果和第四判别标签值;并通过判别器计算出对抗值和重构值。
可理解地,所述判别器为对矩阵图进行识别的卷积神经网络模型,即为CNN模型,所述判别器通过对所述矩阵图进行识别,输出所述矩阵图对应的判别结果和对应的判别标签值,所述判别器的神经网络结构可以根据需求进行设定,比如所述判别器的神经网络结构可以设为VGGNet网络结构模型,所述第一判别结果为所述正解码样本经过所述判别器进行判别后获得的矩阵图,所述第一判别标签值为所述正解码样本经过所述判别器进行判别后获得的正标签值或负标签值,所述第二判别结果为所述负解码样本经过所述判别器进行判别后获得的矩阵图,所述第二判别标签值为所述负解码样本经过所述判别器进行判别后获得的正标签值或负标签值,所述第三判别结果为所述正采样解码样本经过所述判别器进行判别后获得的矩阵图,所述第三判别标签值为所述正采样解码样本经过所述判别器进行判别后获得的正标签值或负标签值,所述第四判别结果为所述负采样解码样本经过所述判别器进行判别后获得的矩阵图,所述第四判别标签值为所述负采样解码样本经过所述判别器进行判别后获得的正标签值或负标签值,通过所述判别器的对抗函数,计算出所述对抗值,所述对抗函数为迫使所述判别器去标签出输入样本为正标签值或负标签值的对抗损失设定的函数,通过所述判别器的重构函数计算出所述重构值,所述重构函数为评估原样本与生成样本在所述判别器隐含层空间的差异去减少特征层面的重构造损失的函数。
在一实施例中,所述步骤S205中,即所述通过判别器计算出对抗值和重构值,包括:
S2051,将所有所述正解码样本、所有所述正解码样本对应的所述正标签值、所有所述第一判别结果及所述第一判别标签值、所有所述负解码样本、所有所述负解码样本对应的所述负标签值、所有所述第二判别结果及所述第二判别标签值、所有所述正采样解码样本、所有所述正采样解码样本对应的所述正标签值、所有所述第三判别结果及第三判别标签值、所有所述负采样解码样本、所有所述负采样解码样本对应的所述负标签值、所有所述第四判别结果及第四判别标签值输入所述判别器的对抗函数,通过所述对抗函数计算得出所述对抗值;
S2052,将所有所述正抽取样本、所有所述负抽取样本、所有所述正抽取样本对应的所述正标签值、所有所述第一判别结果及所述第一判别标签值、所有所述第二判别结果及所述第二判别标签值输入所述辨别器的重构函数,通过所述重构函数计算得出所述重构值。
S206,根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的所述总损失值。
可理解地,根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,所述正隐平均变量会根据所述对抗值和所述重构值的不断更新而进行不断更新,所述负隐平均变量与所述正隐平均变量为相反数,因此,所述负隐平均变量也在不断更新,在不断让所述正隐平均变量变小的同时,所述第一正态分布图和所述第二正态分布图会不断靠近,直到所述损失值达到收敛条件时,所述第一正态分布图和所述第二正态分布图达到最佳的交集,可以保证高质量的构造生成能力。
在一实施例中,如图4所示,所述步骤S206中,即所述根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的总损失值,包括:
S2061,将所述对抗值和所述重构值输入双曲正切函数,得出更新差值。
可理解地,所述双曲正切函数为:
其中,
为所述更新差值;
为所述重构值;
为所述对抗值;
为可调参数,所述可调参数可以根据需要进行调整。
S2062,将所述正隐平均变量减去所述更新差值,得到下一个正隐平均变量;将所述负隐平均变量与所述更新差值相加,得到下一个负隐平均变量。
可理解地,所述正隐平均变量会不断向值小的方向靠拢,而所述负隐平均变量会不断向值大的方向靠拢。
S2063,将所述编码损失值、所述解码损失值、所述对抗值和所述重构值求和,得到所述总损失值。
可理解地,将所述编码损失值、所述解码损失值、所述对抗值和所述重构值进行相加得出所述总损失值。
S207,在所述正采样隐变量对应的所述第三判别标签值与该正采样隐变量关联的正标签值一致时,将该正采样隐变量记录为正增强样本;在所述负采样隐变量对应的所述第四判别标签值与该负采样隐变量关联的负标签值一致时,将该负采样隐变量记录为负增强样本;将所有所述正增强样本和所述负增强样本插入所述增强翻拍样本集。
可理解地,在所述正采样隐变量对应的所述第三判别标签值与该正采样隐变量关联的正标签值一致时,说明所述正采样隐变量符合所述正增强样本的要求,在所述负采样隐变量对应的所述第四判别标签值与该负采样隐变量关联的正标签值一致时,说明所述负采样隐变量符合所述负增强样本的要求,能够为训练所述DVAE-GAN网络模型提供样本,让所述DVAE-GAN网络模型的生成能力更佳。
S208,在所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。
可理解地,在所述总损失值未达到预设的收敛条件时,迭代更新所述DVAE-GAN网络模型,即重复所述步骤S201至所述步骤S208,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型,其中,所述不均衡翻拍样本集不会变化,只需要获取一次即可。
本发明通过获取不均衡翻拍样本集和训练所述DVAE-GAN网络模型过程中生成的增强翻拍样本集,再通过随机抽取出翻拍特征随机样本;然后将所有所述翻拍特征随机样本输入所述DVAE-GAN网络模型中的编码器,通过所述编码器生成正隐变量和负隐变量,并计算出编码损失值;通过所述DVAE-GAN网络模型中的解码器对所有所述正隐变量进行解码,生成正解码样本,通过所述解码器对所有所述负隐变量进行解码,生成负解码样本,并计算出解码损失值;在所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正隐变量等量的正采样隐变量;在所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负隐变量等量的负采样隐变量;通过所述解码器对所有所述正采样隐变量进行解码,生成正采样解码样本;通过所述解码器对所有所述负采样隐变量进行解码,生成负采样解码样本;其中,所述第一正态分布图含有正隐平均变量(μ),所述第一正态分布图含有负隐平均变量(-μ);通过所述DVAE-GAN网络模型中的判别器对所有所述正解码样本进行判别,得出第一判别结果和第一判别标签值;通过所述判别器对所有所述负解码样本进行判别,得出第二判别结果和第二判别标签值;通过所述判别器对所有所述正采样解码样本进行判别,得出第三判别结果和第三判别标签值;通过所述判别器对所有所述负采样解码样本进行判别,得出第四判别结果和第四判别标签值;并计算出对抗值和重构值;根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的所述总损失值;在所述正采样隐变量对应的所述第三判别标签值与该正采样隐变量关联的正标签值一致时,将该正采样隐变量记录为正增强样本;在所述负采样隐变量对应的所述第四判别标签值与该负采样隐变量关联的负标签值一致时,将该负采样隐变量记录为负增强样本;将所有所述正增强样本和所述负增强样本插入所述增强翻拍样本集(即为训练所述DVAE-GAN网络模型过程中生成的增强翻拍样本集);在所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。
如此,实现了正抽取样本与负抽取样本的分类处理,并最后进行对齐收敛处理,以及引入训练过程中生成的增强样本集,能够缩减训练时间和提高了DVAE-GAN网络模型的高质量生成能力。
在一实施例中,所述正翻拍样本与正标签值关联;所述负翻拍样本与负标签值关联;所述步骤S20之前,还包括:
S209,获取不均衡翻拍样本集;对所述不均衡翻拍样本集进行随机获取与预设的抽取数相等的翻拍特征随机样本;其中,将所述翻拍特征随机样本中的所述正翻拍样本记录为正抽取样本,将所述翻拍特征随机样本中的所述负翻拍样本记录为负抽取样本;
S210, 将所有所述翻拍特征随机样本输入所述DVAE-GAN网络模型中的编码器;通过所述编码器对所有所述正抽取样本提取翻拍特征,生成与所述正抽取样本一一对应的正隐变量;通过所述编码器对所有所述负抽取样本提取非翻拍特征,生成与所述负抽取样本一一对应的负隐变量;并通过所述编码器计算出编码损失值;
S211,通过所述DVAE-GAN网络模型中的解码器对所有所述正隐变量进行解码,生成与所述正隐变量一一对应的正解码样本;通过所述解码器对所有所述负隐变量进行解码,生成与所述负隐变量一一对应的负解码样本;并通过所述解码器计算出解码损失值;
S212,在所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正隐变量等量的正采样隐变量,并与所述正标签值关联;在所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负隐变量等量的负采样隐变量,并与所述负标签值关联;通过所述解码器对所有所述正采样隐变量进行解码,生成与所述正采样隐变量一一对应的正采样解码样本;通过所述解码器对所有所述负采样隐变量进行解码,生成与所述负采样隐变量一一对应的负采样解码样本;其中,所述第一正态分布图含有正隐平均变量,所述第一正态分布图含有负隐平均变量;
S213,通过所述DVAE-GAN网络模型中的判别器对所有所述正解码样本进行判别,得出与所述正解码样本一一对应的第一判别结果和第一判别标签值;通过所述判别器对所有所述负解码样本进行判别,得出与所述负解码样本一一对应的第二判别结果和第二判别标签值;通过所述判别器对所有所述正采样解码样本进行判别,得出与所述正采样解码样本一一对应的第三判别结果和第三判别标签值;通过所述判别器对所有所述负采样解码样本进行判别,得出与所述负采样解码样本一一对应的第四判别结果和第四判别标签值;并通过判别器计算出对抗值和重构值;
S214,根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的所述总损失值;
S215,在所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。
可理解地,在所述总损失值未达到预设的收敛条件时,迭代更新所述DVAE-GAN网络模型,即重复所述步骤S209至所述步骤S214,直至所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型,其中,所述不均衡翻拍样本集不会变化,只需要获取一次即可。
如此,提供了一种通过获取不均衡翻拍样本集,再通过随机模型抽取翻拍特征随机样本;然后将所有所述翻拍特征随机样本输入所述DVAE-GAN网络模型中的编码器,通过所述编码器生成正隐变量和负隐变量,并计算出编码损失值;通过所述DVAE-GAN网络模型中的解码器对所有所述正隐变量进行解码,生成正解码样本,通过所述解码器对所有所述负隐变量进行解码,生成负解码样本,并计算出解码损失值;在所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正隐变量等量的正采样隐变量;在所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负隐变量等量的负采样隐变量;通过所述解码器对所有所述正采样隐变量进行解码,生成正采样解码样本;通过所述解码器对所有所述负采样隐变量进行解码,生成负采样解码样本;其中,所述第一正态分布图含有正隐平均变量(μ),所述第一正态分布图含有负隐平均变量(-μ);通过所述DVAE-GAN网络模型中的判别器对所有所述正解码样本进行判别,得出第一判别结果和第一判别标签值;通过所述判别器对所有所述负解码样本进行判别,得出第二判别结果和第二判别标签值;通过所述判别器对所有所述正采样解码样本进行判别,得出第三判别结果和第三判别标签值;通过所述判别器对所有所述负采样解码样本进行判别,得出第四判别结果和第四判别标签值;并计算出对抗值和重构值;根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的所述总损失值;在所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。实现了正抽取样本与负抽取样本的分类处理,并最后进行对齐收敛处理,能够缩减训练时间和提高了DVAE-GAN网络模型的高质量生成能力。
S30,若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值。
可理解地,所述目标均衡样本数可以根据需求进行设置,在所述目标均衡样本数大于所述正样本数且所述目标均衡样本数大于所述负样本数时,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本,即所述训练完成的所述DVAE-GAN网络模型生成所述目标均衡样本数与所述正样本数之间的差值数量的所述正翻拍模拟样本,所述训练完成的所述DVAE-GAN网络模型生成所述目标均衡样本数与所述负样本数之间的差值数量的所述负翻拍模拟样本。
在一实施例中,如图5所示,所述步骤S30中,即所述若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本,包括:
S301,获取所述正翻拍模拟样本的数量和所述负翻拍模拟样本的数量。
可理解地,所述正翻拍模拟样本的数量为统计所述正翻拍模拟样本的个数获得,所述负翻拍模拟样本的数量为统计所述负翻拍模拟样本的个数获得。
S302,在所述训练完成的所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正翻拍模拟样本的数量相等的正模拟隐变量;在所述训练完成的所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负翻拍模拟样本的数量相等的负模拟隐变量。
可理解地,所述随机采样为随机性的从所述第一正态分布图或者所述第二正态分布图中抽取出的值,在所述第一正态分布图中随机采样出与所述正翻拍模拟样本的数量相等的所述正模拟隐变量,在所述第二正态分布图中随机采样出与所述负翻拍模拟样本的数量相等的所述负模拟隐变量。
S303,通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述正模拟隐变量进行解码,生成与所述正模拟隐变量一一对应的正翻拍模拟样本,并与所述正标签值关联;通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述负模拟隐变量进行解码,生成与所述负模拟隐变量一一对应的负翻拍模拟样本,并与所述负标签值关联。
可理解地,通过所述解码器对所有所述正模拟隐变量进行解码,生成对应的正翻拍模拟样本,并与所述正标签值关联;通过所述解码器对所有所述负模拟隐变量进行解码,生成对应的负翻拍模拟样本,并与所述负标签值关联。
如此,通过在所述训练完成的所述DVAE-GAN网络模型中的第一正态分布图中随机采样正模拟隐变量;在所述训练完成的所述DVAE-GAN网络模型中的第二正态分布图中随机采样负模拟隐变量;再通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述正模拟隐变量进行解码,生成正翻拍模拟样本;通过所述解码器对所有所述负模拟隐变量进行解码,生成负翻拍模拟样本。实现了随机正翻拍模拟样本和负翻拍模拟样本,提供了高质量的样本给翻拍识别模型进行训练,提升了翻拍识别模型的准确率和命中率。
S40,获取所述均衡样本集构建模型输出均衡翻拍样本集,确定均衡样本集构建完成,所述均衡翻拍样本集用于训练翻拍识别模型;其中,所述均衡翻拍样本集包括与所述目标均衡样本数相等的正均衡样本以及与所述目标均衡样本数相等的负均衡样本,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
可理解地,所述均衡翻拍样本集中的所述正均衡样本的数量和所述均衡翻拍样本集中的所述负均衡样本的数量相等,所述均衡翻拍样本集用于训练翻拍识别模型,能够提高翻拍识别模型的准确率和命中率,其中,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
如此,本发明实现了通过所述不均衡翻拍样本集输入至所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练直至训练完成,在所述不均衡翻拍样本集的基础上,所述训练完成的所述DVAE-GAN网络模型随机生成等于所述目标均衡样本数与所述负样本数之间差值的所述正翻拍模拟样本和等于所述目标均衡样本数与所述负样本数之间差值的所述负翻拍模拟样本,在所述不均衡翻拍样本集的基础上,所述均衡样本集构建模型输出用于训练翻拍识别模型的均衡翻拍样本集。因此,在少量不均衡的翻拍样本情况下,通过均衡样本集构建模型生成足够数量且均衡的翻拍样本,提供给翻拍识别模型训练,能够减少收集翻拍样本的时间,减少了成本,缩短了训练周期,并且能够提高翻拍识别模型的识别准确率和命中率。
在一实施例中,所述步骤S20之后,即所述将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型之后,还包括:
S50,若所述目标均衡样本数小于或等于所述正样本数,判断所述目标均衡样本数是否小于所述负样本数。
S60,在所述目标均衡样本数小于或者等于所述负样本数时,所述均衡样本集构建模型在所有所述正翻拍样本中随机抽取与所述目标均衡样本数一致的所述正翻拍样本,并将抽取与所述目标均衡样本数一致的所述正翻拍样本记录为正样本,同时在所有所述负翻拍样本中随机抽取与所述目标均衡样本数一致的所述负翻拍样本,并将抽取与所述目标均衡样本数一致的所述负翻拍样本记录为负样本;将所有所述正样本和所有所述负样本记录为所述均衡翻拍样本集。
可理解地,在所述目标均衡样本数小于或等于所述正样本数,且所述目标均衡样本数小于或者等于所述负样本数时,从所有所述正翻拍样本中随机抽取等于所述目标均衡样本数的所述正翻拍样本,以及从所述有所述负翻拍样本中随机抽取等于所述目标均衡样本数的所述负翻拍样本。
S70,在所述目标均衡样本数大于所述负样本数时,所述均衡样本集构建模型在所有所述正翻拍样本中随机抽取与所述目标均衡样本数一致的所述正翻拍样本,并将抽取与所述目标均衡样本数一致的所述正翻拍样本记录为正样本,同时所述训练完成的所述DVAE-GAN网络模型随机生成负翻拍模拟样本,将所有所述正样本、所有所述负翻拍模拟样本和所有所述负翻拍样本记录为所述均衡翻拍样本集;其中,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值。
可理解地,所述随机抽取为随机性的从所有正翻拍样本或负翻拍样本中抽取。
S80,若所述目标均衡样本数大于所述正样本数,且所述目标均衡样本数小于或等于所述负样本数,所述均衡样本集构建模型在所有所述负翻拍样本中随机抽取与所述目标均衡样本数一致的所述负翻拍样本,并将抽取与所述目标均衡样本数一致的所述负翻拍样本记录为负样本,同时所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本,将所有所述负样本、所有所述正翻拍模拟样本和所有所述正翻拍样本记录为所述均衡翻拍样本集;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值。
如此,本发明根据所述目标均衡样本数与所述正样本数大小以及所述目标均衡样本数与所述负样本数的大小,确定所述均衡样本集构建模型输出均衡翻拍样本集的处理方式,能够做到一对一的输出处理,减少了执行时间。
本发明提供的图像识别方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务器进行通信。其中,客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图6示,提供一种翻拍图像识别方法,其技术方案主要包括以下步骤S100-S300:
S100,接收验证指令,获取待识别图像。
可理解地,所述待识别图像为需要进行翻拍识别的图像。
可理解地,接收所述验证指令,获取所述待识别图像,所述所述验证指令为在选择完所述待识别图像之后触发的指令,接收到所述验证指令之后,获取所述待识别图像,所述待识别图像为需要进行翻拍识别的图像,其获取方式可以根据需要进行设定,比如获取方式可以为通过所述验证指令中包含的所述待识别图像进行获取、根据所述验证指令中包含的所述待识别图像的存储路径获取所述待识别图像等等。
S200,将所述待识别图像输入训练完成的翻拍识别模型,其中,所述翻拍识别模型为通过上述均衡样本集构建模型输出的均衡翻拍样本集进行训练获得。
可理解地,所述翻拍识别模型通过使用上述均衡样本集构建模型输出的均衡翻拍样本集进行训练完成的神经网络模型,所述翻拍识别模型的网络结构可以根据需求进行设定,比如所述翻拍识别模型的网络结构可以设定为Inception系列模型的网络结构,将所述待识别图像输入训练完成的翻拍识别模型。
S300,所述翻拍识别模型通过对所述待识别图像进行纹理特征的提取,并获取所述翻拍识别模型根据所述纹理特征输出的识别结果,所述识别结果表征了所述待识别图像是否为翻拍。
可理解地,所述纹理特征为反映图像中同质现象的视觉特征,所述翻拍识别模型根据所述纹理特征输出所述识别结果,通过所述识别结果确定所述待识别图像是否为翻拍,所述识别结果可以根据需求进行设定,比如,所述识别结果可以设定为翻拍和非翻拍两种结果,如此,通过使用上述所述均衡样本集构建模型输出均衡且足够数量的翻拍样本集进行训练所述翻拍识别模型,能够提高所述翻拍识别模型的准确率和命中率,通过实验可以将所述翻拍识别模型的准确率达到99%和命中率达到99.5%,达到高质量输出。
本发明通过将所述待检测图像输入至已训练完成的所述翻拍识别模型,输出所述待检测图像的识别结果,如此,本发明实现了快速地、准确地识别出翻拍图像,提高了识别的准确率和命中率,提升了识别效率和可靠性,节省了成本。
在一实施例中,提供一种均衡样本集构建装置,该均衡样本集构建装置与上述实施例中均衡样本集构建方法一一对应。如图7所示,该均衡样本集构建装置包括获取模块11、训练模块12、生成模块13和输出模块14。各功能模块详细说明如下:
获取模块11,用于获取不均衡翻拍样本集和预设的目标均衡样本数;其中,所述不均衡翻拍样本集包含若干个翻拍样本,所述翻拍样本包括正翻拍样本和负翻拍样本;所述正翻拍样本的正样本数与所述负翻拍样本的负样本数不均衡;
训练模块12,用于将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型;
生成模块13,用于若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
输出模块14,用于获取所述均衡样本集构建模型输出均衡翻拍样本集,确定均衡样本集构建完成,所述均衡翻拍样本集用于训练翻拍识别模型;其中,所述均衡翻拍样本集包括与所述目标均衡样本数相等的正均衡样本以及与所述目标均衡样本数相等的负均衡样本,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
在一实施例中,所述均衡样本集构建装置还包括:
第一判断模块,用于若所述目标均衡样本数小于或等于所述正样本数,判断所述目标均衡样本数是否小于所述负样本数;
第一抽取模块,用于在所述目标均衡样本数小于或者等于所述负样本数时,所述均衡样本集构建模型在所有所述正翻拍样本中随机抽取与所述目标均衡样本数一致的所述正翻拍样本,并将抽取与所述目标均衡样本数一致的所述正翻拍样本记录为正样本,同时在所有所述负翻拍样本中随机抽取与所述目标均衡样本数一致的所述负翻拍样本,并将抽取与所述目标均衡样本数一致的所述负翻拍样本记录为负样本;将所有所述正样本和所有所述负样本记录为所述均衡翻拍样本集;
第二抽取模块,用于在所述目标均衡样本数大于所述负样本数时,所述均衡样本集构建模型在所有所述正翻拍样本中随机抽取与所述目标均衡样本数一致的所述正翻拍样本,并将抽取与所述目标均衡样本数一致的所述正翻拍样本记录为正样本,同时所述训练完成的所述DVAE-GAN网络模型随机生成负翻拍模拟样本,将所有所述正样本、所有所述负翻拍模拟样本和所有所述负翻拍样本记录为所述均衡翻拍样本集;其中,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
第二判断模块,用于若所述目标均衡样本数大于所述正样本数,且所述目标均衡样本数小于或等于所述负样本数,所述均衡样本集构建模型在所有所述负翻拍样本中随机抽取与所述目标均衡样本数一致的所述负翻拍样本,并将抽取与所述目标均衡样本数一致的所述负翻拍样本记录为负样本,同时所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本,将所有所述负样本、所有所述正翻拍模拟样本和所有所述正翻拍样本记录为所述均衡翻拍样本集;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值。
在一实施例中,所述训练模块12,包括:
第一获取单元,用于获取不均衡翻拍样本集和增强翻拍样本集;将所述不均衡翻拍样本集和所述增强翻拍样本集记录为训练样本集,对所述训练样本集进行随机获取与预设的抽取数相等的翻拍特征随机样本;其中,所述增强翻拍样本集包括正增强样本和负增强样本;将所述翻拍特征随机样本中的所述正翻拍样本和所述正增强样本记录为正抽取样本,将所述翻拍特征随机样本中的所述负翻拍样本和所述负增强样本记录为负抽取样本;
第一计算单元,用于将所有所述翻拍特征随机样本输入所述DVAE-GAN网络模型中的编码器;通过所述编码器对所有所述正抽取样本提取非翻拍特征,生成与所述正抽取样本一一对应的正隐变量;通过所述编码器对所有所述负抽取样本提取翻拍特征,生成与所述负抽取样本一一对应的负隐变量;并通过所述编码器计算出编码损失值;
第二计算单元,用于通过所述DVAE-GAN网络模型中的解码器对所有所述正隐变量进行解码,生成与所述正隐变量一一对应的正解码样本;通过所述解码器对所有所述负隐变量进行解码,生成与所述负隐变量一一对应的负解码样本;并通过所述解码器计算出解码损失值;
生成单元,用于在所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正隐变量等量的正采样隐变量,并与所述正标签值关联;在所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负隐变量等量的负采样隐变量,并与所述负标签值关联;通过所述解码器对所有所述正采样隐变量进行解码,生成与所述正采样隐变量一一对应的正采样解码样本;通过所述解码器对所有所述负采样隐变量进行解码,生成与所述负采样隐变量一一对应的负采样解码样本;其中,所述第一正态分布图含有正隐平均变量,所述第一正态分布图含有负隐平均变量;
第三计算单元,用于通过所述DVAE-GAN网络模型中的判别器对所有所述正解码样本进行判别,得出与所述正解码样本一一对应的第一判别结果和第一判别标签值;通过所述判别器对所有所述负解码样本进行判别,得出与所述负解码样本一一对应的第二判别结果和第二判别标签值;通过所述判别器对所有所述正采样解码样本进行判别,得出与所述正采样解码样本一一对应的第三判别结果和第三判别标签值;通过所述判别器对所有所述负采样解码样本进行判别,得出与所述负采样解码样本一一对应的第四判别结果和第四判别标签值;并通过判别器计算出对抗值和重构值;
确定单元,用于根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的所述总损失值;
插入单元,用于在所述正采样隐变量对应的所述第三判别标签值与该正采样隐变量关联的正标签值一致时,将该正采样隐变量记录为正增强样本;在所述负采样隐变量对应的所述第四判别标签值与该负采样隐变量关联的负标签值一致时,将该负采样隐变量记录为负增强样本;将所有所述正增强样本和所述负增强样本插入所述增强翻拍样本集;
收敛单元,用于在所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。
在一实施例中,所述确定单元,包括:
更新子单元,用于将所述对抗值和所述重构值输入双曲正切函数,得出更新差值;
计算子单元,用于将所述正隐平均变量减去所述更新差值,得到下一个正隐平均变量;将所述负隐平均变量与所述更新差值相加,得到下一个负隐平均变量;
输出子单元,用于将所述编码损失值、所述解码损失值、所述对抗值和所述重构值求和,得到所述总损失值。
在一实施例中,所述生成模块13,包括:
第二获取单元,用于获取所述正翻拍模拟样本的数量和所述负翻拍模拟样本的数量;
采样单元,用于在所述训练完成的所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正翻拍模拟样本的数量相等的正模拟隐变量;在所述训练完成的所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负翻拍模拟样本的数量相等的负模拟隐变量;
解码单元,用于通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述正模拟隐变量进行解码,生成与所述正模拟隐变量一一对应的正翻拍模拟样本,并与所述正标签值关联;通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述负模拟隐变量进行解码,生成与所述负模拟隐变量一一对应的负翻拍模拟样本,并与所述负标签值关联。
关于均衡样本集构建装置的具体限定可以参见上文中对于均衡样本集构建方法的限定,在此不再赘述。上述均衡样本集构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供一种翻拍图像识别装置,该翻拍图像识别装置与上述实施例中翻拍图像识别方法一一对应。如图8所示,该翻拍图像识别装置包括接收模块101、输入模块102和识别模块103。各功能模块详细说明如下:
接收模块101,用于接收验证指令,获取待识别图像;
输入模块102,用于将所述待识别图像输入训练完成的翻拍识别模型,其中,所述翻拍识别模型为通过使用如权利要求1至5任一项所述均衡样本集构建模型输出的均衡翻拍样本集进行训练获得;
识别模块103,用于所述翻拍识别模型通过对所述待识别图像进行纹理特征的提取,并获取所述翻拍识别模型根据所述纹理特征输出的识别结果,所述识别结果表征了所述待识别图像是否为翻拍。
关于翻拍图像识别装置的具体限定可以参见上文中对于翻拍图像识别方法的限定,在此不再赘述。上述翻拍图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种均衡样本集构建方法,或者翻拍图像识别方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中均衡样本集构建方法,或者处理器执行计算机程序时实现上述实施例中翻拍图像识别方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中均衡样本集构建方法,或者计算机程序被处理器执行时实现上述实施例中翻拍图像识别方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种均衡样本集构建方法,其特征在于,包括:
获取不均衡翻拍样本集和预设的目标均衡样本数;其中,所述不均衡翻拍样本集包含若干个翻拍样本,所述翻拍样本包括正翻拍样本和负翻拍样本;所述正翻拍样本的正样本数与所述负翻拍样本的负样本数不均衡;所述正翻拍样本为正常图像经过处理后的特征矩阵的样本,所述负翻拍样本为翻拍图像经过处理后的特征矩阵的样本;
将所述不均衡翻拍样本集输入均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型;所述DVAE-GAN网络模型采用了在VAE模型算法的基础上,采用了两个正态分布与GAN模型算法进行决策边界来区分样本的神经网络模型,所述决策边界就是把样本正确分类的一条边界,包括线性决策边界和非线性决策边界;其中,训练方法为使用不均衡翻拍样本集进行迭代训练的输入,或者使用不均衡翻拍样本集和所述不均衡翻拍样本集经过所述DVAE-GAN网络模型的迭代更新所述DVAE-GAN网络模型后生成获得的增强翻拍样本集同时作为迭代训练的输入;所述DVAE-GAN网络模型的总损失值为通过所述DVAE-GAN网络模型的编码损失值、解码损失值、对抗值和重构值确定的损失值,其中,所述编码损失值为通过所述DVAE-GAN网络模型中的编码器进行计算获得,所述解码损失值为通过所述DVAE-GAN网络模型中的解码器进行计算获得,所述对抗值为通过所述DVAE-GAN网络模型中的判别器中的对抗函数进行计算获得,所述重构值为通过所述DVAE-GAN网络模型中的判别器中的重构函数进行计算获得,所述收敛条件也可以为所述损失值小于设定阈值的条件,停止训练,并将收敛之后的DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型,所述总损失值未达到所述收敛条件时,迭代更新DVAE-GAN网络模型,不断更新所述总损失值向损失值变小的方向靠拢;
若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
获取所述均衡样本集构建模型输出均衡翻拍样本集,确定均衡样本集构建完成,所述均衡翻拍样本集用于训练翻拍识别模型;其中,所述均衡翻拍样本集包括与所述目标均衡样本数相等的正均衡样本以及与所述目标均衡样本数相等的负均衡样本,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
2.如权利要求1所述的均衡样本集构建方法,其特征在于,所述将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型之后,还包括:
若所述目标均衡样本数小于或等于所述正样本数,判断所述目标均衡样本数是否小于所述负样本数;
在所述目标均衡样本数小于或者等于所述负样本数时,所述均衡样本集构建模型在所有所述正翻拍样本中随机抽取与所述目标均衡样本数一致的所述正翻拍样本,并将抽取与所述目标均衡样本数一致的所述正翻拍样本记录为正样本,同时在所有所述负翻拍样本中随机抽取与所述目标均衡样本数一致的所述负翻拍样本,并将抽取与所述目标均衡样本数一致的所述负翻拍样本记录为负样本;将所有所述正样本和所有所述负样本记录为所述均衡翻拍样本集;
在所述目标均衡样本数大于所述负样本数时,所述均衡样本集构建模型在所有所述正翻拍样本中随机抽取与所述目标均衡样本数一致的所述正翻拍样本,并将抽取与所述目标均衡样本数一致的所述正翻拍样本记录为正样本,同时所述训练完成的所述DVAE-GAN网络模型随机生成负翻拍模拟样本,将所有所述正样本、所有所述负翻拍模拟样本和所有所述负翻拍样本记录为所述均衡翻拍样本集;其中,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
若所述目标均衡样本数大于所述正样本数,且所述目标均衡样本数小于或等于所述负样本数,所述均衡样本集构建模型在所有所述负翻拍样本中随机抽取与所述目标均衡样本数一致的所述负翻拍样本,并将抽取与所述目标均衡样本数一致的所述负翻拍样本记录为负样本,同时所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本,将所有所述负样本、所有所述正翻拍模拟样本和所有所述正翻拍样本记录为所述均衡翻拍样本集;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值。
3.如权利要求1所述的均衡样本集构建方法,其特征在于,所述正翻拍样本与正标签值关联;所述负翻拍样本与负标签值关联;
所述将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型之前,包括:
获取不均衡翻拍样本集和增强翻拍样本集;将所述不均衡翻拍样本集和所述增强翻拍样本集记录为训练样本集,对所述训练样本集进行随机获取与预设的抽取数相等的翻拍特征随机样本;其中,所述增强翻拍样本集包括正增强样本和负增强样本;将所述翻拍特征随机样本中的所述正翻拍样本和所述正增强样本记录为正抽取样本,将所述翻拍特征随机样本中的所述负翻拍样本和所述负增强样本记录为负抽取样本;
将所有所述翻拍特征随机样本输入所述DVAE-GAN网络模型中的编码器;通过所述编码器对所有所述正抽取样本提取非翻拍特征,生成与所述正抽取样本一一对应的正隐变量;通过所述编码器对所有所述负抽取样本提取翻拍特征,生成与所述负抽取样本一一对应的负隐变量;并通过所述编码器计算出编码损失值;
通过所述DVAE-GAN网络模型中的解码器对所有所述正隐变量进行解码,生成与所述正隐变量一一对应的正解码样本;通过所述解码器对所有所述负隐变量进行解码,生成与所述负隐变量一一对应的负解码样本;并通过所述解码器计算出解码损失值;
在所述DVAE-GAN网络模型中的第一正态分布图中随机采样与正隐变量等量的正采样隐变量,并与所述正标签值关联;在所述DVAE-GAN网络模型中的第二正态分布图中随机采样与负隐变量等量的负采样隐变量,并与所述负标签值关联;通过所述解码器对所有所述正采样隐变量进行解码,生成与所述正采样隐变量一一对应的正采样解码样本;通过所述解码器对所有所述负采样隐变量进行解码,生成与所述负采样隐变量一一对应的负采样解码样本;其中,所述第一正态分布图含有正隐平均变量,所述第一正态分布图含有负隐平均变量;
通过所述DVAE-GAN网络模型中的判别器对所有所述正解码样本进行判别,得出与所述正解码样本一一对应的第一判别结果和第一判别标签值;通过所述判别器对所有所述负解码样本进行判别,得出与所述负解码样本一一对应的第二判别结果和第二判别标签值;通过所述判别器对所有所述正采样解码样本进行判别,得出与所述正采样解码样本一一对应的第三判别结果和第三判别标签值;通过所述判别器对所有所述负采样解码样本进行判别,得出与所述负采样解码样本一一对应的第四判别结果和第四判别标签值;并通过判别器计算出对抗值和重构值;
根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的所述总损失值;
在所述正采样隐变量对应的所述第三判别标签值与该正采样隐变量关联的正标签值一致时,将该正采样隐变量记录为正增强样本;在所述负采样隐变量对应的所述第四判别标签值与该负采样隐变量关联的负标签值一致时,将该负采样隐变量记录为负增强样本;将所有所述正增强样本和所述负增强样本插入所述增强翻拍样本集;
在所述总损失值达到所述预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型。
4.如权利要求3所述的均衡样本集构建方法,其特征在于,所述根据所述对抗值、所述重构值和所述正隐平均变量确定下一个正隐平均变量,以及根据所述对抗值、所述重构值和所述负隐平均变量确定下一个负隐平均变量,同时,根据所述编码损失值、所述解码损失值、所述对抗值和所述重构值确定所述DVAE-GAN网络模型的总损失值,包括:
将所述对抗值和所述重构值输入双曲正切函数,得出更新差值;
将所述正隐平均变量减去所述更新差值,得到下一个正隐平均变量;将所述负隐平均变量与所述更新差值相加,得到下一个负隐平均变量;
将所述编码损失值、所述解码损失值、所述对抗值和所述重构值求和,得到所述总损失值。
5.如权利要求3所述的均衡样本集构建方法,其特征在于,所述若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本,包括:
获取所述正翻拍模拟样本的数量和所述负翻拍模拟样本的数量;
在所述训练完成的所述DVAE-GAN网络模型中的第一正态分布图中随机采样与所述正翻拍模拟样本的数量相等的正模拟隐变量;在所述训练完成的所述DVAE-GAN网络模型中的第二正态分布图中随机采样与所述负翻拍模拟样本的数量相等的负模拟隐变量;
通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述正模拟隐变量进行解码,生成与所述正模拟隐变量一一对应的正翻拍模拟样本,并与所述正标签值关联;通过所述训练完成的所述DVAE-GAN网络模型中的解码器对所有所述负模拟隐变量进行解码,生成与所述负模拟隐变量一一对应的负翻拍模拟样本,并与所述负标签值关联。
6.一种翻拍图像识别方法,其特征在于,包括:
接收验证指令,获取待识别图像;
将所述待识别图像输入训练完成的翻拍识别模型,其中,所述翻拍识别模型为通过使用如权利要求1至5任一项所述均衡样本集构建模型输出的均衡翻拍样本集进行训练获得;
所述翻拍识别模型通过对所述待识别图像进行纹理特征的提取,并获取所述翻拍识别模型根据所述纹理特征输出的识别结果,所述识别结果表征了所述待识别图像是否为翻拍。
7.一种均衡样本集构建装置,其特征在于,包括:
获取模块,用于获取不均衡翻拍样本集和预设的目标均衡样本数;其中,所述不均衡翻拍样本集包含若干个翻拍样本,所述翻拍样本包括正翻拍样本和负翻拍样本;所述正翻拍样本的正样本数与所述负翻拍样本的负样本数不均衡;所述正翻拍样本为正常图像经过处理后的特征矩阵的样本,所述负翻拍样本为翻拍图像经过处理后的特征矩阵的样本;
训练模块,用于将所述不均衡翻拍样本集输入所述均衡样本集构建模型中的DVAE-GAN网络模型进行训练,直到所述DVAE-GAN网络模型的总损失值达到预设的收敛条件时,将收敛之后的所述DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型;所述DVAE-GAN网络模型采用了在VAE模型算法的基础上,采用了两个正态分布与GAN模型算法进行决策边界来区分样本的神经网络模型,所述决策边界就是把样本正确分类的一条边界,包括线性决策边界和非线性决策边界;其中,训练方法为使用不均衡翻拍样本集进行迭代训练的输入,或者使用不均衡翻拍样本集和所述不均衡翻拍样本集经过所述DVAE-GAN网络模型的迭代更新所述DVAE-GAN网络模型后生成获得的增强翻拍样本集同时作为迭代训练的输入;所述DVAE-GAN网络模型的总损失值为通过所述DVAE-GAN网络模型的编码损失值、解码损失值、对抗值和重构值确定的损失值,其中,所述编码损失值为通过所述DVAE-GAN网络模型中的编码器进行计算获得,所述解码损失值为通过所述DVAE-GAN网络模型中的解码器进行计算获得,所述对抗值为通过所述DVAE-GAN网络模型中的判别器中的对抗函数进行计算获得,所述重构值为通过所述DVAE-GAN网络模型中的判别器中的重构函数进行计算获得,所述收敛条件也可以为所述损失值小于设定阈值的条件,停止训练,并将收敛之后的DVAE-GAN网络模型记录为训练完成的所述DVAE-GAN网络模型,所述总损失值未达到所述收敛条件时,迭代更新DVAE-GAN网络模型,不断更新所述总损失值向损失值变小的方向靠拢;
生成模块,用于若所述目标均衡样本数同时大于所述正样本数以及所述负样本数,所述训练完成的所述DVAE-GAN网络模型随机生成正翻拍模拟样本和负翻拍模拟样本;其中,所述正翻拍模拟样本的数量等于所述目标均衡样本数与所述正样本数之间的差值,所述负翻拍模拟样本的数量等于所述目标均衡样本数与所述负样本数之间的差值;
输出模块,用于获取所述均衡样本集构建模型输出均衡翻拍样本集,确定均衡样本集构建完成,所述均衡翻拍样本集用于训练翻拍识别模型;其中,所述均衡翻拍样本集包括与所述目标均衡样本数相等的正均衡样本以及与所述目标均衡样本数相等的负均衡样本,所述正均衡样本包含所有所述正翻拍模拟样本和所有所述正翻拍样本,所述负均衡样本包含所有所述负翻拍模拟样本和所有所述负翻拍样本。
8.一种翻拍图像识别装置,其特征在于,包括:
接收模块,用于接收验证指令,获取待识别图像;
输入模块,用于将所述待识别图像输入训练完成的翻拍识别模型,其中,所述翻拍识别模型为通过使用如权利要求1至5任一项所述均衡样本集构建模型输出的均衡翻拍样本集进行训练获得;
识别模块,用于所述翻拍识别模型通过对所述待识别图像进行纹理特征的提取,并获取所述翻拍识别模型根据所述纹理特征输出的识别结果,所述识别结果表征了所述待识别图像是否为翻拍。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述均衡样本集构建方法,或者所述处理器执行所述计算机程序时实现如权利要求6所述翻拍图像识别方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述均衡样本集构建方法,或者所述处理器执行所述计算机程序时实现如权利要求6所述翻拍图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143207.XA CN111476269B (zh) | 2020-03-04 | 2020-03-04 | 均衡样本集构建、翻拍图像识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010143207.XA CN111476269B (zh) | 2020-03-04 | 2020-03-04 | 均衡样本集构建、翻拍图像识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111476269A CN111476269A (zh) | 2020-07-31 |
CN111476269B true CN111476269B (zh) | 2024-04-16 |
Family
ID=71747984
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010143207.XA Active CN111476269B (zh) | 2020-03-04 | 2020-03-04 | 均衡样本集构建、翻拍图像识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111476269B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985504B (zh) * | 2020-08-17 | 2021-05-11 | 中国平安人寿保险股份有限公司 | 基于人工智能的翻拍检测方法、装置、设备及介质 |
CN113239469B (zh) * | 2021-06-15 | 2023-04-07 | 南方科技大学 | 一种车体零部件的结构优化方法、装置、设备及存储介质 |
CN114005019B (zh) * | 2021-10-29 | 2023-09-22 | 北京有竹居网络技术有限公司 | 一种翻拍图像识别方法及其相关设备 |
CN117711374B (zh) * | 2024-02-01 | 2024-05-10 | 广东省连听科技有限公司 | 一种视听一致个性化语音合成系统、合成方法及训练方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537742A (zh) * | 2018-03-09 | 2018-09-14 | 天津大学 | 一种基于生成对抗网络的遥感图像全色锐化方法 |
WO2020037960A1 (zh) * | 2018-08-21 | 2020-02-27 | 深圳大学 | 一种sar目标识别方法、装置、计算机设备及存储介质 |
-
2020
- 2020-03-04 CN CN202010143207.XA patent/CN111476269B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537742A (zh) * | 2018-03-09 | 2018-09-14 | 天津大学 | 一种基于生成对抗网络的遥感图像全色锐化方法 |
WO2020037960A1 (zh) * | 2018-08-21 | 2020-02-27 | 深圳大学 | 一种sar目标识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111476269A (zh) | 2020-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476269B (zh) | 均衡样本集构建、翻拍图像识别方法、装置、设备及介质 | |
CN110929622B (zh) | 视频分类方法、模型训练方法、装置、设备及存储介质 | |
CN111476268A (zh) | 翻拍识别模型训练、图像识别方法、装置、设备及介质 | |
CN109886275A (zh) | 翻拍图像识别方法、装置、计算机设备和存储介质 | |
CN107679466B (zh) | 信息输出方法和装置 | |
US11790499B2 (en) | Certificate image extraction method and terminal device | |
CN111709408A (zh) | 图像真伪检测方法和装置 | |
CN111160313B (zh) | 一种基于lbp-vae异常检测模型的人脸表示攻击检测方法 | |
CN111191568A (zh) | 翻拍图像识别方法、装置、设备及介质 | |
CN113344826B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111339897B (zh) | 活体识别方法、装置、计算机设备和存储介质 | |
CN111428557A (zh) | 基于神经网络模型的手写签名的自动校验的方法和装置 | |
CN111259915A (zh) | 翻拍图像识别的方法、装置、设备及介质 | |
US20230076017A1 (en) | Method for training neural network by using de-identified image and server providing same | |
CN111476216A (zh) | 人脸识别方法、装置、计算机设备和可读存储介质 | |
CN109754059A (zh) | 翻拍图像识别方法、装置、计算机设备和存储介质 | |
CN116453232A (zh) | 人脸活体检测方法、人脸活体检测模型的训练方法和装置 | |
CN111428740A (zh) | 网络翻拍照片的检测方法、装置、计算机设备及存储介质 | |
CN113283388B (zh) | 活体人脸检测模型的训练方法、装置、设备及存储介质 | |
CN113609900B (zh) | 局部生成人脸定位方法、装置、计算机设备和存储介质 | |
CN106530198A (zh) | 基于参数拟合安全容量的自适应批量隐写方法 | |
CN112633200A (zh) | 基于人工智能的人脸图像比对方法、装置、设备及介质 | |
CN108460811B (zh) | 面部图像处理方法、装置及计算机设备 | |
CN115761837A (zh) | 人脸识别质量检测方法、系统及设备和介质 | |
CN115083006A (zh) | 虹膜识别模型训练方法、虹膜识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |