CN114863536B - 一种基于复合特征空间的生成人脸检测方法 - Google Patents
一种基于复合特征空间的生成人脸检测方法 Download PDFInfo
- Publication number
- CN114863536B CN114863536B CN202210573401.0A CN202210573401A CN114863536B CN 114863536 B CN114863536 B CN 114863536B CN 202210573401 A CN202210573401 A CN 202210573401A CN 114863536 B CN114863536 B CN 114863536B
- Authority
- CN
- China
- Prior art keywords
- gan
- layer
- dct
- face
- dft
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 95
- 239000002131 composite material Substances 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000006243 chemical reaction Methods 0.000 claims abstract description 4
- 238000011176 pooling Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 16
- 239000011159 matrix material Substances 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 10
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 101100239890 Candida albicans (strain SC5314 / ATCC MYA-2876) NAG4 gene Proteins 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 3
- 230000009466 transformation Effects 0.000 abstract description 2
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 34
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 34
- 238000005457 optimization Methods 0.000 description 9
- 238000012795 verification Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000004298 light response Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于复合特征空间的生成人脸检测方法,主要步骤如下:对输入图像进行检测,裁剪出以人脸区域中心点为中心的待检测图像;将待检测图像从RGB转为HSL;计算亮度分量和饱和度分量的各4个32级归一化灰度共生矩阵,堆叠为空域特征图;对亮度分量进行DCT变换,得到DCT域特征图;对亮度分量进行DFT变换,得到DFT域特征图;构造空域、DCT域和DFT域的检测网络模型;对空域、DCT域和DFT域检测网络模型进行训练;利用训练好的空域、DCT域和DFT域检测网络模型对待测样本进行检测,综合得到最终检测结果;本发明通过复合利用图像空域、DCT域和DFT域的特征,更有效地检测出GAN网络在生成人脸过程中留下的痕迹,有效提升了对生成人脸的检测性能。
Description
技术领域
本发明涉及计算机视觉和人工智能技术领域,具体涉及一种基于复合特征空间的生成人脸检测方法。
背景技术
近年随着深度学习技术的发展,通过强大且易于使用的深度学习工具,如自动编码器或生成对抗网络,可以生成能够以假乱真的人脸图像,难以将它们与真实的人脸图片区分开来。这类技术可能被用于恶意目的,如制造虚假色情视频,炮制虚假新闻,伪造图像证据等,对社会秩序造成严重影响。因此,增强对生成人脸图像的检测能力,具有重要的研究意义与迫切的实际需求。
现有对于生成人脸的检测方法主要包括两类,其一是利用生成人脸与真实人脸具有不同的物理性质,通过检测图像中的阴影、照明、透视、透镜畸变、CFA伪影、模式噪声、光响应非均匀性噪声等特征,区分真实人脸图像及生成人脸图像;其二是利用生成人脸图像所使用的生成对抗网络GAN自身特性,检测图像中使用GAN后留下的痕迹,以识别不同GAN生成的人脸图像,在判断人脸图像的真假以外,还能实现对生成人脸图像方法的溯源。
然而,现有的生成人脸检测方法往往只利用单一特征进行检测,检测准确率仍不够高,对生成人脸图像的方法溯源能力仍有不足,距离实际应用仍具有一定差距。
发明内容
为了解决现有技术中对生成人脸图像检测和溯源能力不足的缺陷,本发明提供了一种基于复合特征空间的生成人脸检测方法。该方法通过综合利用人脸图像空域、DCT域及DFT域特征,获得了较强的检测性能和溯源能力。
本发明的目的可以通过采取如下技术方案达到:
一种基于复合特征空间的生成人脸检测方法,包括以下步骤:
S1、对输入图像进行人脸检测,得到人脸区域左上角坐标(x0,y0)以及右下角坐标(x1,y1),计算人脸区域中心点坐标(xm,ym),具体为:
其中表示向下取整,以(xm,ym)为中心,裁剪出256×256尺寸的图像块,图像块左上角坐标为(xm-127,ym-127),右下角坐标为(xm+128,ym+128),将裁剪得到的待检测图像记为I;
S2、将I从RGB颜色空间转换至HSL颜色空间,记其中亮度分量为IL,饱和度分量为IS;
S3、计算IL的灰度共生矩阵,如下式所示:
其中i、j为亮度分量的等级,取值为0至31的整数,即亮度分量共分为32级,||||表示集合内的元素总数,(Δx,Δy)的取值有(1,0)、(1,1)、(0,1)和(-1,1)共4种情况,计算得到1种情况的灰度共生矩阵后将其归一化有:
其中sum()表示矩阵内所有元素之和,得到IL对应的4个归一化灰度共生矩阵,用同样的方法得到IS对应的4个归一化灰度共生矩阵,将8个灰度共生矩阵堆叠,得到尺寸为8×32×32的空域特征图FGLCM;
S4、对S2步骤中的IL进行DCT变换,得到尺寸为1×256×256的DCT域特征图FDCT;
S5、对S2步骤中的IL进行DFT变换,并将变换后的频域图分为4个不重叠的尺寸为128×128的子图,再将子图堆叠,得到尺寸为4×128×128的DFT域特征图FDFT;
S6、分别构造空域的检测网络模型NGLCM、DCT域的检测网络模型NDCT和DFT域的检测网络模型NDFT;
S7、利用4种GAN网络生成人脸样本,分别为GAN1、GAN2、GAN3和GAN4;
S8、利用S7步骤中的GAN1、GAN2、GAN3和GAN4与真实人脸样本,使用多元交叉熵损失函数,对空域检测网络模型NGLCM进行训练,该模型输出结果为:DGLCM∈{Real,GAN1,GAN2,GAN3,GAN4};
S9、利用S7步骤中的GAN1、GAN2、GAN3和GAN4与真实人脸样本,使用多元交叉熵损失函数,对DCT域检测网络模型NDCT进行训练,该模型输出结果为DDCT∈{Real,GAN1,GAN2,GAN3,GAN4};
S10、利用S7步骤中的GAN1、GAN2、GAN3和GAN4与真实人脸样本组合,使用二元交叉熵损失函数,分别训练4个DFT域检测网络模型NDFT,记为N1 DFT、N2 DFT、N3 DFT和N4 DFT,模型输出结果分别为和/>其中PReal、PGAN1、PGAN2、PGAN3和PGAN4分别表示样本为真实人脸、GAN1生成人脸、GAN2生成人脸、GAN3生成人脸和GAN4生成人脸的概率;
S11、在测试阶段,利用NGLCM和NDCT对待测样本进行检测,得到DGLCM和DDCT,若DGLCM=DDCT,则最终检测结果D=DGLCM;若DGLCM≠DDCT且其中包含真实人脸结果,则利用非真实人脸结果所对应的GAN网络生成样本训练得到的NDFT进行检测,若检测为真实人脸的概率PReal大于等于检测为对应GAN生成人脸的概率PGAN,则最终检测结果为真实人脸,否则为对应GAN生成人脸;若DGLCM≠DDCT且其中不包含真实人脸结果,则分别利用对应两种GAN网络生成样本训练得到的两个NDFT进行检测,分别得到两种GAN生成人脸的概率PGAN,GLCM和PGAN,DCT,若PGAN,GLCM≥PGAN,DCT,则最终检测结果D=DGLCM,否则D=DDCT。
本技术方案通过复合利用图像空域、DCT域和DFT域的特征,更有效地检测出GAN网络在生成人脸过程中留下的痕迹,从而可以获得较强的检测性能和溯源能力。
作为优选的技术方案,所述S1步骤中,使用RetinaFace人脸检测网络对输入图像进行人脸检测,并获得人脸区域坐标。
作为优选的技术方案,所述S6步骤中构造空域检测网络模型NGLCM:输入为8×32×32尺寸的空域特征图FGLCM,接着依次为步幅stride为1的64通道输出3×3卷积层,BN层,步幅stride为1的128通道输出3×3卷积层,2×2的最大池化层,BN层,步幅stride为1的128通道输出3×3卷积层,BN层,步幅stride为1的256通道输出3×3卷积层,BN层,步幅stride为1的256通道输出3×3卷积层,2×2的最大池化层,BN层,步幅stride为1的128通道输出3×3卷积层,BN层,128单元的全连接层,32单元的全连接层,5单元的全连接层,以及Softmax激活函数,最终输出5分类结果。
作为优选的技术方案,所述S6步骤中构造DCT域检测网络模型NDCT:输入为1×256×256尺寸的DCT域特征图FDCT,接着依次为步幅stride为1的16通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的32通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,256单元的全连接层,64单元的全连接层,5单元的全连接层,以及Softmax激活函数,最终输出5分类结果。
作为优选的技术方案,所述S6步骤中构造DFT域的检测网络模型NDFT:输入为4×128×128尺寸的DFT域特征图FDFT,接着依次为步幅stride为1的16通道输出5×5卷积层,BN层,步幅stride为1的32通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,256单元的全连接层,64单元的全连接层,2单元的全连接层,以及Softmax激活函数,最终输出2分类结果。
作为优选的技术方案,所述S3步骤中,空域检测网络模型NGLCM、DCT域检测网络模型NDCT和DFT域检测网络模型NDFT均使用Adam方法进行优化,设置学习率为0.0005,一阶平滑参数β1=0.9,二阶平滑参数β2=0.999,避免除以0的微小常数ε=10-8,使用Adam方法进行优化可以提升网络的性能,使得网络结构不但简单,而且集成容易。
本发明相对于现有技术具有如下的优点及效果:
1、本发明提供了一种基于复合特征空间的生成人脸检测方法,通过获取人脸图像空域、DCT域及DFT域输入特征,构造针对特定特征的检测网络,并综合利用各特征检测网络的输出,获得高准确率的最终检测结果,并可以对生成人脸图像的方法进行溯源,有效提升了该方法对于生成人脸图像的检测性能。
2、本发明可根据实际应用需要,通过利用不同的训练样本,从而增加、减少或变更所需检测的生成人脸方法,具有很强的灵活性。
3、本发明根据生成人脸检测主要应用网络浅层特征的理论基础,所构造针对不同特征的检测网络均为轻量化网络,从而有效提高了该方法的应用效率。
附图说明
图1是本发明公开的基于复合特征空间的生成人脸检测方法的整体流程框图;
图2是本发明实施例中空域检测网络模型结构图;
图3是本发明实施例中DCT域检测网络模型结构图;
图4是本发明实施例中DFT域检测网络模型结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例公开了一种基于复合特征空间的生成人脸检测方法,下面以对PGGAN、StarGAN、StyleGAN和CycleGAN四种GAN网络生成样本的检测为例详细介绍本发明的实施过程。使用16000张来自CelebA-HQ数据库的真实人脸图像,并使用PGGAN、StarGAN、StyleGAN和CycleGAN四种GAN网络各生成16000张人脸图像,对各种人脸图像按照5:2:1的比例划分为训练集、验证集和测试集。实施例在Linux系统上进行,主要基于深度学习框架Pytorch1.6.1来实现,所用显卡为英伟达GTX1080Ti,CUDA版本为10.1.105,cudnn版本7.6.4。
整体的实施流程如图1所示,具体的实施步骤如下:
首先利用RetinaFace人脸检测网络,对输入图像进行人脸检测,得到人脸区域左上角坐标(x0,y0)以及右下角坐标(x1,y1),计算人脸区域中心点坐标(xm,ym),其中,计算人脸区域中心点坐标(xm,ym)使用的公式为:
其中表示向下取整。以(xm,ym)为中心,裁剪出256×256尺寸的图像块,此时得到的图像块的左上角坐标为(xm-127,ym-127),图像块的右下角坐标为(xm+128,ym+128),并将裁剪得到的待检测图像块记为I。
将I从RGB颜色空间转换至HSL颜色空间,得到一张新的图像,记该图像其中亮度分量为IL,饱和度分量为IS。
计算IL的灰度共生矩阵,如下式所示:
其中i、j为亮度分量的等级,取值为0至31的整数,即亮度分量共分为32级,||||表示集合内的元素总数,(Δx,Δy)的取值有(1,0)、(1,1)、(0,1)和(-1,1)共4种情况,计算得到1种情况的灰度共生矩阵后将其归一化有:
其中sum()表示矩阵内所有元素之和。得到IL对应的4个归一化灰度共生矩阵,用同样的方法得到IS对应的4个归一化灰度共生矩阵,然后将8个灰度共生矩阵堆叠,得到尺寸为8×32×32的空域特征图FGLCM。
对IL进行DCT变换,得到尺寸为1×256×256的DCT域特征图FDCT。
对IL进行DFT变换,并将变换后的频域图分为4个不重叠的尺寸为128×128的子图,再将子图堆叠,得到尺寸为4×128×128的DFT域特征图FDFT。
如图2所示,使用算法构造空域检测网络模型NGLCM,然后在空域检测网络模型NGLCM中输入为8×32×32尺寸的空域特征图FGLCM,接着依次为步幅stride为1的64通道输出3×3卷积层,BN层,步幅stride为1的128通道输出3×3卷积层,2×2的最大池化层,BN层,步幅stride为1的128通道输出3×3卷积层,BN层,步幅stride为1的256通道输出3×3卷积层,BN层,步幅stride为1的256通道输出3×3卷积层,2×2的最大池化层,BN层,步幅stride为1的128通道输出3×3卷积层,BN层,128单元的全连接层,32单元的全连接层,5单元的全连接层,以及Softmax激活函数,最终输出5分类结果。
如图3所示,使用算法构造DCT域检测网络模型NDCT,然后在DCT域检测网络模型NDCT中输入为1×256×256尺寸的DCT域特征图FDCT,接着依次为步幅stride为1的16通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的32通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,256单元的全连接层,64单元的全连接层,5单元的全连接层,以及Softmax激活函数,最终输出5分类结果。
如图4所示,使用算法构造DFT域的检测网络模型NDFT,然后在DFT域的检测网络模型NDFT中输入为4×128×128尺寸的DFT域特征图FDFT,接着依次为步幅stride为1的16通道输出5×5卷积层,BN层,步幅stride为1的32通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,256单元的全连接层,64单元的全连接层,2单元的全连接层,以及Softmax激活函数,最终输出2分类结果。
利用真实人脸和4种GAN生成人脸图像中的训练集,使用多元交叉熵损失函数,对NGLCM进行训练。使用Adam方法进行优化,设置学习率为0.0005,一阶平滑参数β1=0.9,二阶平滑参数β2=0.999,避免除以0的微小常数ε=10-8。使用Adam方法进行优化后,可以提升网络的性能,使得网络结构不但简单,而且集成容易。当然于其他实施例中还可以使用SGD进行优化,故不以此为限。本实施例利用验证集监测训练效果,选择对验证集具有最佳稳定性能的模型作为最终训练结果。
利用真实人脸和4种GAN生成人脸图像中的训练集,使用多元交叉熵损失函数,对NDCT进行训练。使用Adam方法进行优化,设置学习率为0.0005,一阶平滑参数β1=0.9,二阶平滑参数β2=0.999,避免除以0的微小常数ε=10-8。使用Adam方法进行优化后,可以提升网络的性能,使得网络结构不但简单,而且集成容易。当然于其他实施例中还可以使用SGD进行优化,故不以此为限。本实施例利用验证集监测训练效果,选择对验证集具有最佳稳定性能的模型作为最终训练结果。
分别利用前述4种GAN网络生成人脸图像中的训练集和真实人脸图像中的训练集组合,使用二元交叉熵损失函数,分别训练4个DFT域检测网络模型,记为NDFT,PGGAN、NDFT,StarGAN、NDFT,StyleGAN和NDFT,CycleGAN。使用Adam方法进行优化,设置学习率为0.0005,一阶平滑参数β1=0.9,二阶平滑参数β2=0.999,避免除以0的微小常数ε=10-8。使用Adam方法进行优化后,可以提升网络的性能,使得网络结构不但简单,而且集成容易。当然于其他实施例中还可以使用SGD进行优化,故不以此为限。本实施例利用验证集监测训练效果,选择对验证集具有最佳稳定性能的模型作为最终训练结果。
在测试阶段,利用NGLCM和NDCT对待测样本进行检测,得到其检测结果DGLCM和DDCT。若DGLCM=DDCT,则最终检测结果D=DGLCM。
若DGLCM≠DDCT且其中包含真实人脸结果,则利用非真实人脸结果所对应的GAN网络生成样本训练得到的NDFT进行检测。假设待测样本被NGLCM检测为真实人脸,被NDCT检测为PGGAN生成人脸,则进一步使用NDFT,PGGAN对待测样本进行检测。若NDFT,PGGAN检测结果为真实人脸,则待测样本最终检测结果为真实人脸;若NDFT,PGGAN检测结果为生成人脸,则待测样本最终检测结果为PGGAN生成人脸。
若DGLCM≠DDCT且其中不包含真实人脸结果,则分别利用对应两种GAN网络生成样本训练得到的两个NDFT进行检测,比较相应的概率,以概率较大者为检测结果。假设待测样本被NGLCM检测为PGGAN生成人脸,被NDCT检测为StarGAN生成人脸,则进一步使用NDFT,PGGAN和NDFT,StarGAN对待测样本进行检测,得到样本为PGGAN生成人脸的概率PPGGAN和为StarGAN生成人脸的概率PStarGAN。若PPGGAN≥PStarGAN,则待测样本最终检测结果为PGGAN生成人脸,否则为StarGAN生成人脸。
本实施例对前述测试集进行检测,检测结果如下表所示:
表1.本实施例方法检测准确率(%)
从上述实验结果可见,本发明方法对于真实人脸图像和多种GAN生成人脸图像均具有较高的检测准确率,证明了本发明方法的有效性。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (6)
1.一种基于复合特征空间的生成人脸检测方法,其特征在于,包括以下步骤:
S1、对输入图像进行人脸检测,得到人脸区域左上角坐标(x0,y0)以及右下角坐标(x1,y1),计算人脸区域中心点坐标(xm,ym),具体为:
其中表示向下取整,以(xm,ym)为中心,裁剪出256×256尺寸的图像块,图像块左上角坐标为(xm-127,ym-127),右下角坐标为(xm+128,ym+128),将裁剪得到的待检测图像记为I;
S2、将I从RGB颜色空间转换至HSL颜色空间,记其中亮度分量为IL,饱和度分量为IS;
S3、计算IL的灰度共生矩阵,如下式所示:
其中i、j为亮度分量的等级,取值为0至31的整数,即亮度分量共分为32级,|| ||表示集合内的元素总数,(Δx,Δy)的取值有(1,0)、(1,1)、(0,1)和(-1,1)共4种情况,计算得到1种情况的灰度共生矩阵后将其归一化有:
其中sum()表示矩阵内所有元素之和,得到IL对应的4个归一化灰度共生矩阵,用同样的方法得到IS对应的4个归一化灰度共生矩阵,将8个灰度共生矩阵堆叠,得到尺寸为8×32×32的空域特征图FGLCM;
S4、对S2步骤中的IL进行DCT变换,得到尺寸为1×256×256的DCT域特征图FDCT;
S5、对S2步骤中的IL进行DFT变换,并将变换后的频域图分为4个不重叠的尺寸为128×128的子图,再将子图堆叠,得到尺寸为4×128×128的DFT域特征图FDFT;
S6、分别构造空域的检测网络模型NGLCM、DCT域的检测网络模型NDCT和DFT域的检测网络模型NDFT;
S7、利用4种GAN网络生成人脸样本,分别为GAN1、GAN2、GAN3和GAN4;
S8、利用S7步骤中的GAN1、GAN2、GAN3和GAN4与真实人脸样本,使用多元交叉熵损失函数,对空域检测网络模型NGLCM进行训练,该模型输出结果为:DGLCM∈{Real,GAN1,GAN2,GAN3,GAN4};
S9、利用S7步骤中的GAN1、GAN2、GAN3和GAN4与真实人脸样本,使用多元交叉熵损失函数,对DCT域检测网络模型NDCT进行训练,该模型输出结果为DDCT∈{Real,GAN1,GAN2,GAN3,GAN4};
S10、利用S7步骤中的GAN1、GAN2、GAN3和GAN4与真实人脸样本组合,使用二元交叉熵损失函数,分别训练4个DFT域检测网络模型NDFT,记为N1 DFT、N2 DFT、N3 DFT和N4 DFT,模型输出结果分别为和其中PReal、PGAN1、PGAN2、PGAN3和PGAN4分别表示样本为真实人脸、GAN1生成人脸、GAN2生成人脸、GAN3生成人脸和GAN4生成人脸的概率;
S11、在测试阶段,利用NGLCM和NDCT对待测样本进行检测,得到DGLCM和DDCT,若DGLCM=DDCT,则最终检测结果D=DGLCM;若DGLCM≠DDCT且其中包含真实人脸结果,则利用非真实人脸结果所对应的GAN网络生成样本训练得到的NDFT进行检测,若检测为真实人脸的概率PReal大于等于检测为对应GAN生成人脸的概率PGAN,则最终检测结果为真实人脸,否则为对应GAN生成人脸;若DGLCM≠DDCT且其中不包含真实人脸结果,则分别利用对应两种GAN网络生成样本训练得到的两个NDFT进行检测,分别得到两种GAN生成人脸的概率PGAN,GLCM和PGAN,DCT,若PGAN,GLCM≥PGAN,DCT,则最终检测结果D=DGLCM,否则D=DDCT。
2.根据权利要求1所述的一种基于复合特征空间的生成人脸检测方法,其特征在于,所述S1步骤中,使用RetinaFace人脸检测网络对输入图像进行人脸检测,并获得人脸区域坐标。
3.根据权利要求1所述的一种基于复合特征空间的生成人脸检测方法,其特征在于,所述S6步骤中构造空域检测网络模型NGLCM:输入为8×32×32尺寸的空域特征图FGLCM,接着依次为步幅stride为1的64通道输出3×3卷积层,BN层,步幅stride为1的128通道输出3×3卷积层,2×2的最大池化层,BN层,步幅stride为1的128通道输出3×3卷积层,BN层,步幅stride为1的256通道输出3×3卷积层,BN层,步幅stride为1的256通道输出3×3卷积层,2×2的最大池化层,BN层,步幅stride为1的128通道输出3×3卷积层,BN层,128单元的全连接层,32单元的全连接层,5单元的全连接层,以及Softmax激活函数,最终输出5分类结果。
4.根据权利要求1所述的一种基于复合特征空间的生成人脸检测方法,其特征在于,所述S6步骤中构造DCT域检测网络模型NDCT:输入为1×256×256尺寸的DCT域特征图FDCT,接着依次为步幅stride为1的16通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的32通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,256单元的全连接层,64单元的全连接层,5单元的全连接层,以及Softmax激活函数,最终输出5分类结果。
5.根据权利要求1所述的一种基于复合特征空间的生成人脸检测方法,其特征在于,所述S6步骤中构造DFT域的检测网络模型NDFT:输入为4×128×128尺寸的DFT域特征图FDFT,接着依次为步幅stride为1的16通道输出5×5卷积层,BN层,步幅stride为1的32通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,步幅stride为1的64通道输出5×5卷积层,2×2的最大池化层,BN层,256单元的全连接层,64单元的全连接层,2单元的全连接层,以及Softmax激活函数,最终输出2分类结果。
6.根据权利要求1所述的一种基于复合特征空间的生成人脸检测方法,其特征在于,所述S3步骤中,空域检测网络模型NGLCM、DCT域检测网络模型NDCT和DFT域检测网络模型NDFT均使用Adam方法进行优化,设置学习率为0.0005,一阶平滑参数β1=0.9,二阶平滑参数β2=0.999,避免除以0的微小常数ε=10-8。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210573401.0A CN114863536B (zh) | 2022-05-25 | 2022-05-25 | 一种基于复合特征空间的生成人脸检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210573401.0A CN114863536B (zh) | 2022-05-25 | 2022-05-25 | 一种基于复合特征空间的生成人脸检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114863536A CN114863536A (zh) | 2022-08-05 |
CN114863536B true CN114863536B (zh) | 2024-05-24 |
Family
ID=82639533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210573401.0A Active CN114863536B (zh) | 2022-05-25 | 2022-05-25 | 一种基于复合特征空间的生成人脸检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863536B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977830A (zh) * | 2019-03-16 | 2019-07-05 | 四川大学 | 基于颜色纹理双通道卷积神经网络及循环神经网络的人脸融合检测方法 |
CN110309798A (zh) * | 2019-07-05 | 2019-10-08 | 中新国际联合研究院 | 一种基于域自适应学习和域泛化的人脸欺骗检测方法 |
WO2021134871A1 (zh) * | 2019-12-30 | 2021-07-08 | 深圳市爱协生科技有限公司 | 基于局部二值模式和深度学习的合成人脸图像取证方法 |
-
2022
- 2022-05-25 CN CN202210573401.0A patent/CN114863536B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977830A (zh) * | 2019-03-16 | 2019-07-05 | 四川大学 | 基于颜色纹理双通道卷积神经网络及循环神经网络的人脸融合检测方法 |
CN110309798A (zh) * | 2019-07-05 | 2019-10-08 | 中新国际联合研究院 | 一种基于域自适应学习和域泛化的人脸欺骗检测方法 |
WO2021134871A1 (zh) * | 2019-12-30 | 2021-07-08 | 深圳市爱协生科技有限公司 | 基于局部二值模式和深度学习的合成人脸图像取证方法 |
Non-Patent Citations (1)
Title |
---|
基于卷积神经网络的视频监控人脸识别方法;晏鹏程;张一鸣;童光红;黄锋;欧先锋;;成都工业学院学报;20200315(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114863536A (zh) | 2022-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108961235B (zh) | 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法 | |
CN111340784B (zh) | 一种基于Mask R-CNN图像篡改检测方法 | |
CN110929635B (zh) | 基于信任机制下面部交并比的假脸视频检测方法及系统 | |
CN113379833B (zh) | 一种基于神经网络的图像可见水印的定位和分割方法 | |
CN112819748B (zh) | 一种带钢表面缺陷识别模型的训练方法及装置 | |
CN113963041A (zh) | 一种图像纹理识别方法及系统 | |
CN111899270A (zh) | 卡片边框检测方法、装置、设备及可读存储介质 | |
CN112347910A (zh) | 一种基于多模态深度学习的信号指纹识别方法 | |
CN115661777A (zh) | 一种联合语义的雾天道路目标检测算法 | |
CN115471463A (zh) | 一种基于对抗式生成网络的太阳能电池缺陷检测方法 | |
CN117237683B (zh) | 基于改进神经网络的芯片缺陷智慧检测系统 | |
CN114863536B (zh) | 一种基于复合特征空间的生成人脸检测方法 | |
CN110349119B (zh) | 基于边缘检测神经网络的路面病害检测方法和装置 | |
CN112509026A (zh) | 一种绝缘子裂缝长度识别方法 | |
CN110223273B (zh) | 一种结合离散余弦变换与神经网络的图像修复取证方法 | |
CN114970694B (zh) | 一种网络安全态势评估方法及其模型训练方法 | |
CN116051539A (zh) | 一种变电设备发热故障的诊断方法 | |
CN112396638A (zh) | 一种图像处理方法、终端和计算机可读存储介质 | |
CN116152571A (zh) | 基于深度学习的厨余垃圾识别分类方法 | |
CN115205230A (zh) | 一种基于新型注意力机制的混凝土桥梁表观裂缝识别方法 | |
CN116309270A (zh) | 一种基于双目图像的输电线路典型缺陷识别方法 | |
CN115147405A (zh) | 一种快速新能源电池无损检测方法 | |
CN111461259B (zh) | 基于红黑形态小波池化网络的图像分类方法及系统 | |
Gunawan et al. | Classification of Japanese fagaceae wood based on microscopic image analysis | |
CN116071625B (zh) | 深度学习模型的训练方法、目标检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |