CN112183501B - 深度伪造图像检测方法及装置 - Google Patents

深度伪造图像检测方法及装置 Download PDF

Info

Publication number
CN112183501B
CN112183501B CN202011352811.XA CN202011352811A CN112183501B CN 112183501 B CN112183501 B CN 112183501B CN 202011352811 A CN202011352811 A CN 202011352811A CN 112183501 B CN112183501 B CN 112183501B
Authority
CN
China
Prior art keywords
features
image
face image
feature
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011352811.XA
Other languages
English (en)
Other versions
CN112183501A (zh
Inventor
陈建益
田天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Real AI Technology Co Ltd
Original Assignee
北京智源人工智能研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 北京智源人工智能研究院 filed Critical 北京智源人工智能研究院
Priority to CN202011352811.XA priority Critical patent/CN112183501B/zh
Publication of CN112183501A publication Critical patent/CN112183501A/zh
Application granted granted Critical
Publication of CN112183501B publication Critical patent/CN112183501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种深度伪造图像检测方法及装置,该方法包括:执行人脸图像输入,输入的人脸图像包括真实人脸图像和伪造人脸图像;采用第一卷积神经网络对人脸图像进行初步人脸特征提取;对人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对传统图像特征进行动态调整加工;将初步人脸特征和传统图像特征在通道维度叠加,获得人脸图像的融合特征;对融合特征采用第三卷积神经网络进行特征再提取,特征再提取使初步人脸特征和加工后的传统图像特征进行特征交互;根据再提取特征输出人脸图像真假分类的概率置信度。本发明融合传统图像特征和深度学习,能显著提升深度伪造图像检测模型的准确率和泛化性能。

Description

深度伪造图像检测方法及装置
技术领域
本发明涉及图像处理技术领域,具体涉及一种深度伪造图像检测方法及装置。
背景技术
DeepFake是由“deep machine learning”(深度机器学习)和“fake photo”(假照片)组合而成,本质是一种深度学习模型在图像合成、替换领域的技术框架。随着DeepFake技术的兴起,互联网上出现越来越多的虚假换脸视频,随之而来的是一些负面影响,比如侵犯隐私、换脸视频的恶意应用等等。因此,DeepFake(即深度伪造图像)的检测技术日益显得尤为重要。
当前市面上常见的DeepFake检测方法都是基于深度学习的方式,收集大量的真实和DeepFake数据,并打上标签,然后用深度神经网络端到端的进行训练,提取真实视频和DeepFake视频的高层特征,这些特征通常不具有可解释性。
根据标注数据的丰富程度的不同,常见的训练方式有三种:第一类是标注数据不完整,即部分数据有真假标签,部分数据没有标签,是一个半监督学习问题,可以采用自学习(self-training)的方式逐步给没有标签的数据自动生成标签,这类方法在实际的互联网应用场景通常效果不太理想;第二类是当成二分类问题,这类方式依赖的标注数据只有真和假的标签;第三类是标注数据不仅有真假标签,对于DeepFake视频还标注有造假区域的标签,可以采用分类和分割相结合的方式加强网络的学习。
现有技术中,都是基于深度神经网络自动地学习有区分性的特征,一个最主要的缺点没有人为的引入特定领域的知识和特征,而神经网络也未必可以学习到这些特征,降低了模型的泛化到新型造假视频、图像上的识别准确率。鉴于现有检测技术的不足,亟需一种能够增强DeepFake的检测识别准确率的新Deepfake检测技术方案。
发明内容
为此,本发明提供一种深度伪造图像检测方法及装置,在深度学习的基础上进行传统图像特征融合,并将其应用在DeepFake检测上,能显著提升DeepFake检测模型的准确率和泛化性能。
为了实现上述目的,本发明提供如下技术方案:第一方面,提供一种深度伪造图像检测方法,包括以下步骤:
步骤一、执行人脸图像输入,输入的所述人脸图像包括真实人脸图像和伪造人脸图像;
步骤二、采用第一卷积神经网络对所述人脸图像进行初步人脸特征提取;
步骤三、对所述人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对所述传统图像特征进行动态调整加工;
步骤四、将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的所述传统图像特征在通道维度叠加,获得所述人脸图像的融合特征;
步骤五、对所述融合特征采用第三卷积神经网络进行特征再提取,所述特征再提取使所述初步人脸特征和加工后的传统图像特征进行特征交互;
步骤六、根据步骤五中对融合特征的再提取特征,通过线性分类器及归一化处理输出所述人脸图像真假分类的概率置信度。
作为深度伪造图像检测方法的优选方案,还包括以下步骤:
步骤七、根据输入的所述人脸图像的标签和步骤六输出的概率置信度计算损失交叉熵函数;
步骤八、梯度回传,采用优化算法对所述第一卷积神经网络、第二卷积神经网络和第三卷积神经网络进行参数优化;
步骤九、迭代步骤一至步骤八,直到收敛到一个预估计参数或者迭代到固定迭代次数为止。
作为深度伪造图像检测方法的优选方案,所述步骤一中,当所述人脸图像的来源为视频时,对所述视频进行抽帧、人脸检测和剪裁以得到人脸图像。
作为深度伪造图像检测方法的优选方案,所述步骤二中第一卷积神经网络处理的方式为:feature1=f1(x),式中,feature1为人脸图像的初步人脸特征,f1为卷积神经网络,x是人脸图像;f1包括若干个卷积操作、池化操作、激活函数和归一化操作。
作为深度伪造图像检测方法的优选方案,所述步骤三中,所述人脸图像的纹理特征提取过程中,将所人脸图像上的每个像素点由该像素点与局部邻域内的像素值做比较后重新确定像素值。
作为深度伪造图像检测方法的优选方案,所述步骤三中,第二卷积神经网络处理的方式为:feature2=f2(L(x)),式中,L为LBP算子,feature2为动态调整加工后的传统图像特征,f2为第二卷积神经网络,x是人脸图像。
作为深度伪造图像检测方法的优选方案,所述步骤四中,第三卷积神经网络处理的方式为:feature3=concat(feature1,feature2),通过concat函数将人脸图像的初步人脸特征feature1和动态调整加工后的传统图像特征feature2在通道维度叠加,得到融合特征feature3。
作为深度伪造图像检测方法的优选方案,所述步骤五中初步人脸特征和加工后的传统图像特征进行特征交互的方式为:feature=CNN(feature3),CNN为卷积神经网络,CNN的网络结构包括Resnet、xception或efficientnet。
作为深度伪造图像检测方法的优选方案,所述步骤六中,所述人脸图像真假分类的概率置信度输出方式为:p=softmax(classfier(feature)),式中,classifier为线性分类器,输出维度为2,分别表示真和假的程度;softmax的作用是将classifier输出的真假分类值归一化到0-1范围内,并且使真假分类值的和为1, feature为表示特征的变量。
第二方面,本发明还提供一种深度伪造图像检测装置,采用第一方面或其任意可能实现方式的深度伪造图像检测方法,包括:
图像输入模块,用于执行人脸图像输入,输入的所述人脸图像包括真实人脸图像和伪造人脸图像;
人脸特征初步提取模块,用于采用第一卷积神经网络对所述人脸图像进行初步人脸特征提取;
传统图像特征提取模块,用于对所述人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对所述传统图像特征进行动态调整加工;
特征融合模块,用于将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的所述传统图像特征在通道维度叠加,获得所述人脸图像的融合特征;
特征交互模块,用于对所述融合特征采用第三卷积神经网络进行特征再提取,所述特征再提取使所述初步人脸特征和加工后的传统图像特征进行特征交互;
概率输出模块,用于根据特征交互模块对融合特征的再提取特征,通过线性分类器及归一化处理输出所述人脸图像真假分类的概率置信度。
第三方面,提供一种计算机可读存储介质,所述计算机可读存储介质中存储用于深度伪造图像检测的程序代码,所述程序代码包括用于执行第一方面或其任意可能的实现方式中的深度伪造图像检测方法的指令。
第四方面,提供一种电子设备,所述电子设备包括处理器,所述处理器与存储介质耦合,当所述处理器执行存储介质中的指令时,使得所述电子设备执行第一方面或其任意可能的实现方式中的深度伪造图像检测方法。
本发明技术方案首先执行人脸图像输入,输入的人脸图像包括真实人脸图像和伪造人脸图像;采用第一卷积神经网络对人脸图像进行初步人脸特征提取;对人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对传统图像特征进行动态调整加工;将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的传统图像特征在通道维度叠加,获得人脸图像的融合特征;对融合特征采用第三卷积神经网络进行特征再提取,特征再提取使初步人脸特征和加工后的传统图像特征进行特征交互;输出人脸图像真假分类的概率置信度。本发明创造性地在DeepFake检测领域融合传统图像特征和深度学习,能显著提升DeepFake检测模型的准确率和泛化性能,并且可以非常方便地与当前市面上其他的DeepFake检测方法结合,给传统图像特征一定的可学习空间,传统特征如LBP特征的应用,也给DeepFake检测问题提供新的思考角度。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例中提供的深度伪造图像检测方法流程示意图;
图2为本发明实施例中提供的深度伪造图像检测中LBP计算示意图,其中,Thresholding表示做比较,Binary表示二进制;
图3为本发明实施例中提供的采用插值的方式确定像素值的示意图;
图4为本发明实施例中提供的深度伪造图像检测装置示意图;
图5为本发明实施例提供的深度伪造图像检测中LBP特征应用效果图;
图6为本发明实施例中提供实现深度伪造图像检测的电子设备框架图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参见图1,提供一种深度伪造图像检测方法,包括以下步骤:
S1、执行人脸图像输入,输入的所述人脸图像包括真实人脸图像和伪造人脸图像;
S2、采用第一卷积神经网络对所述人脸图像进行初步人脸特征提取;
S3、对所述人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对所述传统图像特征进行动态调整加工;
S4、将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的所述传统图像特征在通道维度叠加,获得所述人脸图像的融合特征;
S5、对所述融合特征采用第三卷积神经网络进行特征再提取,所述特征再提取使所述初步人脸特征和加工后的传统图像特征进行特征交互;
S6、根据S5中对融合特征的再提取特征,通过线性分类器及归一化处理输出所述人脸图像真假分类的概率置信度。
具体的,为了实现深度伪造图像检测的训练和推理,还包括以下步骤:
S7、根据输入的所述人脸图像的标签和S6输出的概率置信度计算损失交叉熵函数;
S8、梯度回传,采用优化算法对所述第一卷积神经网络、第二卷积神经网络和第三卷积神经网络进行参数优化;
S9、迭代S1至S8,直到收敛到一个预估计参数或者迭代到固定迭代次数为止。
具体的,步骤S1中,当所述人脸图像的来源为视频时,对所述视频进行抽帧、人脸检测和剪裁以得到人脸图像。由于在进行图像Deepfake检测时,并非所有的人脸图像都是现成的。当数据来源如果是视频时,会经历抽帧、人脸检测和剪裁的步骤得到人脸图像。
人脸图像的深度特征提取采用在计算机视觉领域广泛使用的卷积神经网络,具体选择何种网络结构一般会依赖于实验。为了强化网络的训练,这些神经网络都会采用预训练好的参数权重作为初始权重。步骤S2中,第一卷积神经网络处理的方式为:feature1=f1(x),式中,feature1为人脸图像的初步人脸特征,f1为卷积神经网络,x是人脸图像;f1包括若干个卷积操作、池化操作、激活函数和归一化操作。为了不使整个系统过于复杂,此处的f1一般选择轻量级的,网络不会太深,比如,f1可以是resnet中介绍的resBlock。
具体的,步骤S3中,所述人脸图像的纹理特征提取过程中,将所人脸图像上的每个像素点由该像素点与局部邻域内的像素值做比较后重新确定像素值。
本技术方案创造性的将LBP特征引入到DeepFake检测领域,并证明了其有效性。
LBP特征的本质是图像上的每个像素点由其与局部邻域内的像素值做比较后重新计算出来的,如图2中的(a)所示,对于中心像素点“4”,考虑它的8邻域像素点,做比较后可以得到二进制数值“11010011”,转换为十进制数即为LBP图中该像素点的像素值。LBP计算方式中的邻域选取不仅可以选择8邻域,也可以选择4邻域和16邻域等等,邻域形状不仅可以是矩阵也可以是圆形。一般来说,邻域半径越小,纹理越精细,具体邻域半径的选择依赖于待识别的DeepFake图像的质量,一般通过实验来进行选取,当然也可以多种邻域半径同时使用。对于邻域形状,一般选取圆形邻域较多,有些圆形邻域点并不会落到整数像素坐标上,采用插值的方式确定其像素值。
如图3所示,(i0,j0)、(i1,j1)、(i0,j1)、(i1,j0)是整数像素点坐标,(x,y)是非整数坐标,则双线性差值系数:s0=i1-x,s1=x-i0,t0=y1-y,t1-y-y0,则插值后的像素值为:d(x, y)=s0*[t0*d(i0, j0),t1*d(i0, j1)],s1*[t0*d(i1, j0),t1*d(i1, j1)] ,d(,)表示像素值。
除了上述的以像素点为单位计算LBP的方式外,也可以用块为单位进行计算,如图2中的(b)所示,原始的LBP用的是单个像素值进行比较计算,灵敏度很高,易受到噪声的影响,但是块的方式,会用局部块的一个均值代替单个像素值,相对灵敏度低,对噪声的鲁棒性强。
步骤S3中,第二卷积神经网络处理的方式为:feature2=f2(L(x)),式中,L为LBP算子,feature2为动态调整加工后的传统图像特征,f2为卷积神经网络,x是人脸图像。
具体来讲,L为LBP算子,一旦选定LBP的规格参数,L是确定的,f2是卷积神经网络,是可学习的,用来对传统特征动态调整,feature2是动态调整加工后的传统图像特征。为了不使系统过于复杂,此处的f2也选择轻量型的结构,网络不会太深,f2也可以是resnet中介绍的resBlock。
步骤S4中,第三卷积神经网络处理的方式为:feature3=concat(feature1,feature2),通过concat函数将人脸图像的初步人脸特征feature1和动态调整加工后的传统图像特征feature2在通道维度叠加,得到融合特征feature3。
具体的,RGB图像和传统图像特征图分别经过卷积神经网络得到各自的中间层特征,然后在中间层特征层面进行通道维度的叠加,feature3=concat(feature1,feature2),concat函数将深度学习特征feature1和动态调整加工后的传统图像特征feature2在通道维度叠加,得到融合后的特征feature3。
步骤S5中,初步人脸特征和加工后的传统图像特征进行特征交互的方式为:feature=CNN(feature3),CNN为卷积神经网络,CNN的网络结构包括Resnet、xception或efficientnet。
具体的,深度学习特征feature1和动态调整加工后的传统图像特征feature2在通道维度叠加后,由于它们提取的方式方法是独立的,没有任何交互,深度学习特征feature1和动态调整加工后的传统图像特征feature2依然是相互独立的,故融合后采用卷积神经网络使它们可以充分的交互,即feature=CNN(feature3),也就是在通道维度叠加后,通过卷积神经网络的卷积操作算子,会对叠加后的特征进行联合运算,即是融合或者交互过程。为了提取有区分性的特征,通过实验选择有效的网络结构,一般可选的网络结构包括Resnet、xception、efficientnet等。本发明实施例中使用的feature的维度为4096维。
步骤S6中,所述人脸图像真假分类的概率置信度输出方式为:p=softmax(classfier(feature)),式中,classifier为线性分类器,输出维度为2,分别表示真和假的程度;softmax的作用是将classifier输出的真假分类值归一化到0-1范围内,并且使真假分类值的和为1。
具体的,classifier为线性分类器,是一种全连接神经网络,输出维度为2,分别表示真和假的程度。但是classifier输出的2个值并不一定是0-1范围内,并且它们的和也不一定为1,不符合概率的要求,softmax的作用是将其归一化到0-1范围内并且使其和为1。
实施例2
参见图4,本发明还提供一种深度伪造图像检测装置,采用实施例1或其任意可能实现方式的深度伪造图像检测方法,包括:
图像输入模块1,用于执行人脸图像输入,输入的所述人脸图像包括真实人脸图像和伪造人脸图像;
人脸特征初步提取模块2,用于采用第一卷积神经网络对所述人脸图像进行初步人脸特征提取;
传统图像特征提取模块3,用于对所述人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对所述传统图像特征进行动态调整加工;
特征融合模块4,用于将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的所述传统图像特征在通道维度叠加,获得所述人脸图像的融合特征;
特征交互模块5,用于对所述融合特征采用第三卷积神经网络进行特征再提取,所述特征再提取使所述初步人脸特征和加工后的传统图像特征进行特征交互;
概率输出模块6,用于根据特征交互模块对融合特征的再提取特征,通过线性分类器及归一化处理输出所述人脸图像真假分类的概率置信度。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请实施例1中的方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述。
本发明技术方案对LBP特征的应用,也给DeepFake检测问题提供新的思考角度,如图5所示,a,b是假图像(即换脸图像)的LBP图,c,d是真图像的LBP图,可以看出比较明显的差异性,假图像的人脸面部有很多的块状的结构,而真图像的人脸区域相对自然。
参见表1,给出了在特定数据上的测试结果,具体测试实施方案为:
1)准备数据集,数据集的来源包括两种不同源的数据集,记为数据集1和数据集2;
2)数据集划分,划分数据集1为训练集和测试集,记为train1和test1,划分数据集2为训练集和测试集,记为train2和test2;
3)实验设计,对照模型包含加传统特征和不加传统特征(不加传统特征加上述的传统特征特征置为全零),分别设计两组实验,两个对照模型在train1上训练在test1和test2上测试,两个对照模型在train2上训练在test1和test2上测试。
表1 深度伪造图像检测实验结果
Figure 326046DEST_PATH_IMAGE001
实验结果如表1所示。训练集train1和测试集test1同源,训练集train2和测试集test2也同源,它们的结果可以看出加了传统特征可以提升DeepFake检测模型准确率。训练集train1和测试集test2不同源,训练集train2和测试集test1也不同源,对应的实验结果可以看出融合了传统特征提升了模型泛化性能。
本发明技术方案首先执行人脸图像输入,人脸图像的输入对象包含真的人脸和假的人脸;采用第一卷积神经网络对人脸图像进行初步人脸特征提取;对人脸图像进行包含纹理特征的传统图像特征提取,采用第二卷积神经网络对传统图像特征进行动态调整加工;将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的传统图像特征在通道维度叠加,获得人脸图像的融合特征;对融合特征采用第三卷积神经网络进行特征再提取,特征再提取使初步人脸特征和加工后的传统图像特征进行特征交互;输出人脸图像真假分类的概率置信度。本发明创造性地在DeepFake检测领域融合传统图像特征和深度学习,能显著提升DeepFake检测模型的准确率和泛化性能,并且可以非常方便地与当前市面上其他的DeepFake检测方法结合,给传统图像特征一定的可学习空间,传统特征如LBP特征的应用,也给DeepFake检测问题提供新的思考角度。
实施例3
提供一种计算机可读存储介质,所述计算机可读存储介质中存储用于深度伪造图像检测的程序代码,所述程序代码包括用于执行实施例1或其任意可能的实现方式中的深度伪造图像检测方法的指令。
计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(SolidStateDisk、SSD))等。
实施例4
参见图6,提供一种电子设备,所述电子设备包括处理器,所述处理器与存储介质耦合,当所述处理器执行存储介质中的指令时,使得所述电子设备执行实施例1或其任意可能的实现方式中的深度伪造图像检测方法。
具体的,处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于所述处理器之外,独立存在。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机700程序产品的形式实现。所述计算机700程序产品包括一个或多个计算机700指令。在计算机700上加载和执行所述计算机700程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机700可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机700指令可以存储在计算机700可读存储介质中,或者从一个计算机700可读存储介质向另一个计算机700可读存储介质传输,例如,所述计算机700指令可以从一个网站站点、计算机700、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机700、服务器或数据中心进行传输。
具体的,参见图6,示出了可用于实施根据本发明实施方式的方法和系统的计算机的示意性框图,在图6中,中央处理单元(CPU)701根据只读存储器(ROM)702中存储的程序或从存储部分708加载到随机存取存储器(RAM)703的程序执行各种处理。在RAM 703中,还根据需要存储当CPU 701执行各种处理等等时所需的数据。CPU 701、ROM 702和RAM 703经由总线704彼此连接。输入/输出接口705也连接到总线704。
下述部件连接到输入/输出接口705:输入部分706(包括键盘、鼠标等等)、输出部分707(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分708(包括硬盘等)、通信部分709(包括网络接口卡比如LAN卡、调制解调器等)。通信部分709经由网络比如因特网执行通信处理。根据需要,驱动器710也可连接到输入/输出接口705。可拆卸介质711比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器710上,使得从中读出的计算机程序根据需要被安装到存储部分708中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质711安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图6所示的其中存储有程序的、与设备相分离地分发以向用户提供程序的可拆卸介质711。可拆卸介质711的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 702、存储部分708中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

Claims (9)

1.深度伪造图像检测方法,其特征在于,包括以下步骤:
步骤一、执行人脸图像输入,输入的所述人脸图像包括真实人脸图像和伪造人脸图像;
步骤二、采用第一卷积神经网络对所述人脸图像进行初步人脸特征提取;
步骤三、对所述人脸图像进行纹理特征提取,采用第二卷积神经网络对所述纹理特征进行动态调整加工,所述第二卷积神经网络处理的方式为:feature2=f2(L(x)),式中,L为LBP算子,feature2为动态调整加工后的所述纹理特征,f2为所述第二卷积神经网络,x是所述人脸图像;
步骤四、将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的所述纹理特征在通道维度叠加,获得所述人脸图像的融合特征;
步骤五、对所述融合特征采用第三卷积神经网络进行特征再提取,所述特征再提取使所述初步人脸特征和加工后的纹理特征进行特征交互;
步骤六、根据步骤五中对融合特征的再提取特征,通过线性分类器及归一化处理输出所述人脸图像真假分类的概率置信度。
2.根据权利要求1所述的深度伪造图像检测方法,其特征在于,还包括以下步骤:
步骤七、根据输入的所述人脸图像的标签和步骤六输出的概率置信度计算损失交叉熵函数;
步骤八、梯度回传,采用优化算法对所述第一卷积神经网络、第二卷积神经网络和第三卷积神经网络进行参数优化;
步骤九、迭代步骤一至步骤八,直到收敛到一个预估计参数或者迭代到固定迭代次数为止。
3.根据权利要求1所述的深度伪造图像检测方法,其特征在于,所述步骤一中,当所述人脸图像的来源为视频时,对所述视频进行抽帧、人脸检测和剪裁以得到人脸图像。
4.根据权利要求1所述的深度伪造图像检测方法,其特征在于,所述步骤二中第一卷积神经网络处理的方式为:feature1=f1(x),式中,feature1为人脸图像的初步人脸特征,f1为卷积神经网络,x是人脸图像;f1包括若干个卷积操作、池化操作、激活函数和归一化操作。
5.根据权利要求4所述的深度伪造图像检测方法,其特征在于,所述步骤三中,所述人脸图像的纹理特征提取过程中,将所人脸图像上的每个像素点由该像素点与局部邻域内的像素值做比较后重新确定像素值。
6.根据权利要求4所述的深度伪造图像检测方法,其特征在于,所述步骤四中,第三卷积神经网络处理的方式为:feature3=concat(feature1, feature2),通过concat函数将人脸图像的初步人脸特征feature1和动态调整加工后的纹理特征feature2在通道维度叠加,得到融合特征feature3。
7.根据权利要求6所述的深度伪造图像检测方法,其特征在于,所述步骤五中初步人脸特征和加工后的纹理特征进行特征交互的方式为:feature=CNN(feature3),CNN为卷积神经网络,CNN的网络结构包括Resnet、xception或efficientnet。
8.根据权利要求7所述的深度伪造图像检测方法,其特征在于,所述步骤六中,所述人脸图像真假分类的概率置信度输出方式为:p=soft(classifier(feature))式中,classifier为线性分类器,输出维度为2,分别表示真和假的程度;softmax的作用是将classifier输出的真假分类值归一化到0-1范围内,并且使真假分类值的和为1, feature为融合特征的再提取特征。
9.深度伪造图像检测装置,采用如权利要求1至8任一项所述的深度伪造图像检测方法,其特征在于,包括:
图像输入模块,用于执行人脸图像输入,输入的所述人脸图像包括真实人脸图像和伪造人脸图像;
人脸特征初步提取模块,用于采用第一卷积神经网络对所述人脸图像进行初步人脸特征提取;
纹理特征提取模块,用于对所述人脸图像进行纹理特征提取,采用第二卷积神经网络对所述纹理特征进行动态调整加工;
特征融合模块,用于将通过第一卷积神经网络得到的初步人脸特征和通过第二卷积神经网络加工后的所述纹理特征在通道维度叠加,获得所述人脸图像的融合特征;
特征交互模块,用于对所述融合特征采用第三卷积神经网络进行特征再提取,所述特征再提取使所述初步人脸特征和加工后的所述纹理特征进行特征交互;
概率输出模块,用于根据特征交互模块对融合特征的再提取特征,通过线性分类器及归一化处理输出所述人脸图像真假分类的概率置信度。
CN202011352811.XA 2020-11-27 2020-11-27 深度伪造图像检测方法及装置 Active CN112183501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011352811.XA CN112183501B (zh) 2020-11-27 2020-11-27 深度伪造图像检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011352811.XA CN112183501B (zh) 2020-11-27 2020-11-27 深度伪造图像检测方法及装置

Publications (2)

Publication Number Publication Date
CN112183501A CN112183501A (zh) 2021-01-05
CN112183501B true CN112183501B (zh) 2021-02-19

Family

ID=73918698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011352811.XA Active CN112183501B (zh) 2020-11-27 2020-11-27 深度伪造图像检测方法及装置

Country Status (1)

Country Link
CN (1) CN112183501B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818767B (zh) * 2021-01-18 2023-07-25 深圳市商汤科技有限公司 数据集生成、伪造检测方法、装置、电子设备及存储介质
CN112749686B (zh) * 2021-01-29 2021-10-29 腾讯科技(深圳)有限公司 图像检测方法、装置、计算机设备及存储介质
CN112991278B (zh) * 2021-03-01 2023-01-31 华南理工大学 RGB空域特征与LoG时域特征结合的Deepfake视频检测方法及系统
CN113052096B (zh) * 2021-03-31 2024-01-05 上海商汤智能科技有限公司 一种视频检测方法、装置、设备及存储介质
CN113570564B (zh) * 2021-07-21 2024-02-27 同济大学 一种基于多路卷积网络的多清晰度伪造人脸视频的检测方法
CN113723220B (zh) * 2021-08-11 2023-08-25 电子科技大学 基于大数据联邦学习架构下的深度伪造溯源系统
CN113989713B (zh) * 2021-10-28 2023-05-12 杭州中科睿鉴科技有限公司 基于视频帧序预测的深度伪造检测方法
CN115457374B (zh) * 2022-11-09 2023-02-03 之江实验室 基于推理模式评估深伪图像检测模型泛化性方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241989A (zh) * 2020-01-08 2020-06-05 腾讯科技(深圳)有限公司 图像识别方法及装置、电子设备
CN111339832A (zh) * 2020-02-03 2020-06-26 中国人民解放军国防科技大学 人脸合成图像的检测方法及装置
CN111444881A (zh) * 2020-04-13 2020-07-24 中国人民解放军国防科技大学 伪造人脸视频检测方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170091550A1 (en) * 2014-07-15 2017-03-30 Qualcomm Incorporated Multispectral eye analysis for identity authentication

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111241989A (zh) * 2020-01-08 2020-06-05 腾讯科技(深圳)有限公司 图像识别方法及装置、电子设备
CN111339832A (zh) * 2020-02-03 2020-06-26 中国人民解放军国防科技大学 人脸合成图像的检测方法及装置
CN111444881A (zh) * 2020-04-13 2020-07-24 中国人民解放军国防科技大学 伪造人脸视频检测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《DeepFakes and Beyond: A Survey of DeepFakes and Beyond: A Survey of Face Manipulation and Fake Detection》;Ruben Tolosana 等;《CORNEL UNIVERSITY:COMPUTER SCIENCE:COMPUTER VISION AND PATTERN RECOGNITION》;20200618;第1-23页 *

Also Published As

Publication number Publication date
CN112183501A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
CN112183501B (zh) 深度伪造图像检测方法及装置
CN111754596B (zh) 编辑模型生成、人脸图像编辑方法、装置、设备及介质
CN112818862A (zh) 基于多源线索与混合注意力的人脸篡改检测方法与系统
CN114677565B (zh) 特征提取网络的训练方法和图像处理方法、装置
Pistilli et al. Learning robust graph-convolutional representations for point cloud denoising
CN112288011A (zh) 一种基于自注意力深度神经网络的图像匹配方法
CN111986125A (zh) 一种用于多目标任务实例分割的方法
CN111784699B (zh) 一种对三维点云数据进行目标分割方法、装置及终端设备
CN112884758B (zh) 一种基于风格迁移方法的缺陷绝缘子样本生成方法及系统
CN112836625A (zh) 人脸活体检测方法、装置、电子设备
CN112561926A (zh) 三维图像分割方法、系统、存储介质及电子设备
CN111104941B (zh) 图像方向纠正方法、装置及电子设备
TWI803243B (zh) 圖像擴增方法、電腦設備及儲存介質
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
Kumar et al. Automatic image segmentation using wavelets
CN113139544A (zh) 一种基于多尺度特征动态融合的显著性目标检测方法
CN117058554A (zh) 电力设备目标检测方法、模型训练方法和装置
CN116778164A (zh) 一种基于多尺度结构改进DeeplabV3+网络的语义分割方法
CN112906829B (zh) 一种基于Mnist数据集的数字识别模型构建方法及装置
CN115439669A (zh) 基于深度学习的特征点检测网络及跨分辨率图像匹配方法
Habiba et al. hlgp: A modified local gradient pattern for image classification
CN109871835B (zh) 一种基于互斥正则化技术的人脸识别方法
CN115147434A (zh) 图像处理方法、装置、终端设备及计算机可读存储介质
CN114821216A (zh) 图片去网纹神经网络模型建模、使用方法及相关设备
CN116071625B (zh) 深度学习模型的训练方法、目标检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210429

Address after: 100084 b201c-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing

Patentee after: Beijing innovation Zhiyuan Technology Co.,Ltd.

Address before: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100084

Patentee before: Beijing Zhiyuan Artificial Intelligence Research Institute

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211014

Address after: 100084 a1901, 19th floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing

Patentee after: Beijing Ruili Wisdom Technology Co.,Ltd.

Address before: 100084 b201c-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing

Patentee before: Beijing innovation Zhiyuan Technology Co.,Ltd.

TR01 Transfer of patent right
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20210105

Assignee: Beijing Intellectual Property Management Co.,Ltd.

Assignor: Beijing Ruili Wisdom Technology Co.,Ltd.

Contract record no.: X2023110000073

Denomination of invention: Method and device for detecting deep forged images

Granted publication date: 20210219

License type: Common License

Record date: 20230531

EE01 Entry into force of recordation of patent licensing contract