CN113673465A

CN113673465A - 图像检测方法、装置、设备及可读存储介质

Info

Publication number: CN113673465A
Application number: CN202110995202.4A
Authority: CN
Inventors: 周欣; 王娜; 李连磊; 白云波; 程岩; 王立松
Original assignee: China Information Technology Security Evaluation Center
Current assignee: China Information Technology Security Evaluation Center
Priority date: 2021-08-27
Filing date: 2021-08-27
Publication date: 2021-11-19
Anticipated expiration: 2041-08-27
Also published as: CN113673465B

Abstract

本申请实施例提供了一种图像检测方法、装置、设备及可读存储介质，获取人脸图像序列，人脸图像序列包括至少一张按照时序排列的人脸图像，获取每一人脸图像的一维频域特征向量，依据时序，将各个人脸图像的一维频域特征向量拼接得到频域特征矩阵，依据频域特征矩阵，获取人脸图像序列的图像检测结果，图像检测结果指示人脸图像序列是否经过篡改。由于，目标人脸图像即任意一个人脸图像的一维频域特征向量表征该目标人脸图像的频域特征，所以，通过将多个连续的人脸图像一维频域特征向量拼接后的频域特征矩阵，集合了人脸图像序列的频域特征以及时域特征，所以以频域特征矩阵为图像检测依据，能够提高检测结果的准确性。

Description

图像检测方法、装置、设备及可读存储介质

技术领域

本申请涉及图像识别技术领域，尤其涉及一种图像检测方法、装置、设备及可读存储介质。

背景技术

人脸伪造指的是通过替换视频或图像中人脸生物特征，并保留原有的动作或表情的一种图像操纵方法。人脸特征作为重要的生物识别特征，在传统的社会交往中有着重要意义，并且，人脸特征已经成为了人们使用虚拟资产的身份识别特征。因此，伪造后的图像或视频将严重威胁公众信息安全，干扰社会稳定。

现有的图像检测方法从空域以及时域空间特征出发，以图像为单位对视频或图像进行检测，以此判断人脸的真伪，但是现有的图像检测方法检测准确性低，检测效果亟待提高。

发明内容

本申请提供了一种图像检测方法、装置、设备及可读存储介质，目的在于提高图像检测准确性，如下：

一种图像检测方法，包括：

获取人脸图像序列，所述人脸图像序列包括至少一张按照时序排列的人脸图像；

获取每一所述人脸图像的一维频域特征向量，其中，目标人脸图像的一维频域特征向量表征所述目标人脸图像的频域特征，所述目标人脸图像为任意一个所述人脸图像；

依据所述时序，将各个所述人脸图像的一维频域特征向量拼接得到频域特征矩阵；

依据所述频域特征矩阵，获取所述人脸图像序列的图像检测结果，所述图像检测结果指示所述人脸图像序列是否经过篡改。

可选地，获取所述目标人脸图像的一维频域特征向量，包括：

获取所述目标人脸图像的每一频域信号的频域参数，所述频域参数包括频率和幅值；

获取多个频域信号集合，每一频域信号集合包括多个同频信号，其中，多个所述同频信号的频率相同；

将每一所述频域信号集合中的所述多个同频信号的幅值进行预设数值处理，得到每一所述频域信号集合的幅值参数，所述预设数值处理包括求平均值和归一化；

将各个所述频域信号集合的幅值参数按照频域序位排列，得到所述目标人脸图像的一维频域特征向量；所述频域序位通过对各个所述频域信号集合的频率从大到小排序得到。

可选地，获取所述目标人脸图像的每一所述频域信号的频域参数，包括：

将所述目标人脸图像进行预设空频变换，得到所述目标人脸图像的频谱图像以及空域对应关系，所述空域对应关系包括各个第一像素点和各个所述频域信号的对应关系，所述第一像素点为所述频谱图像中的像素点，所述预设空频变换包括傅里叶变换；

依据所述频谱图像中各个所述第一像素点的空域参数以及所述空域对应关系，获取每一所述频域信号的频域参数，所述空域参数包括坐标值以及灰度值。

可选地，预设空频变换还包括频率中心化和/或高通滤波。

可选地，依据所述频域特征矩阵，获取所述人脸图像序列的图像检测结果，包括：

将所述频域特征矩阵输入至预设的预测模型，得到所述预测模型的预测结果，作为图像检测结果；

其中，所述预测模型由神经网络模型，以预设样本图像序列的频域特征矩阵作为输入数据，以所述预设样本图像序列的标签作为目标输出训练得到，所述标签指示所述预设样本图像序列是否经过篡改。

可选地，神经网络模型包括依次首尾相连的多个循环网络模块，每一所述循环网络模块包括循环网络层和第一加法器，所述循环网络层用于输出所述循环网络层的输入数据的序列化特征，所述第一加法器用于对所述循环网络层的输入数据和输出数据进行加法运算，并将加法运算结果作为所述循环网络模块的输出数据输出。

可选地，循环网络层包括依次首尾相连的多个记忆单元，每一所述记忆单元包括长短期记忆网络、ReLU层和第二加法器，所述ReLU层用于对所述长短期记忆网络的输出数据进行Relu函数运算，所述第二加法器用于对所述长短期记忆网络的输入数据和所述ReLU的输出数据进行加法运算，并将加法运算结果作为所述记忆单元的输出数据输出。

一种图像检测装置，包括：

图像获取单元，用于获取人脸图像序列，所述人脸图像序列包括至少一张按照时序排列的人脸图像；

向量获取单元，用于获取每一所述人脸图像的一维频域特征向量，其中，目标人脸图像的一维频域特征向量表征所述目标人脸图像的频域特征，所述目标人脸图像为任意一个所述人脸图像；

特征矩阵获取单元，用于依据所述时序，将各个所述人脸图像的一维频域特征向量拼接得到频域特征矩阵；

检测结果获取单元，用于依据所述频域特征矩阵，获取所述人脸图像序列的图像检测结果，所述图像检测结果指示所述人脸图像序列是否经过篡改。

一种图像检测设备，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现图像检测方法的各个步骤。

一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现图像检测方法的各个步骤。

由上述技术方案可以看出，本申请实施例提供的图像检测方法、装置、设备及可读存储介质，获取人脸图像序列，人脸图像序列包括至少一张按照时序排列的人脸图像，获取每一人脸图像的一维频域特征向量，依据时序，将各个人脸图像的一维频域特征向量拼接得到频域特征矩阵，依据频域特征矩阵，获取人脸图像序列的图像检测结果，图像检测结果指示人脸图像序列是否经过篡改。由于，目标人脸图像即任意一个人脸图像的一维频域特征向量表征该目标人脸图像的频域特征，所以，通过将多个连续的人脸图像一维频域特征向量拼接后的频域特征矩阵，集合了人脸图像序列的频域特征以及时域特征，所以以频域特征矩阵为图像检测依据，能够提高检测结果的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种图像检测方法的具体实施方式的流程示意图；

图2a示例了一种中心化频谱图像的获取方法的可视化流程；

图2b为本申请实施例提供的像素集合的示意图；

图3为本申请实施例提供的一种预测模型的具体结构示意图；

图4为本申请实施例提供的一种图像检测方法的流程示意图；

图5为本申请实施例提供的一种一维频域特征向量的获取方法的流程示意图；

图6为本申请实施例提供的一种图像检测装置的结构示意图；

图7为本申请实施例提供的一种图像检测设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

随着深度学习的发展和应用，人脸伪造技术在性能和效果方面具有显著提升，尤其是基于人工智能的人体图像合成技术(统称为DeepFake技术)的应用和发展给社会带来巨大的信息安全隐患。现有的图像检测方法从传统图像处理和深度学习模型两个角度提出多种方法，但是效果较差，因此本申请实施例提供了一种基于频域空间特征的图像检测方法，用于检测图像或视频中的图像序列(具体为人脸图像序列)是否经过篡改，以确定图像中的人脸是否经过伪造，以提高图像检测的准确性，降低图像检测算法对运算资源的要求。

图1为本申请实施例提供的一种图像检测方法的具体实现方法流程图，如图1所示，本方法包括：

S101、从待检测视频中，提取人脸图像序列。

本实施例中，人脸图像序列包括至少一张按照时序排序的人脸图像，时序为人脸图像在待检测视频中的时序。

需要说明的是，人脸图像的数量可以根据视频属性(清晰度、尺寸等)或者实际应用场景预设，数量适当的人脸图像一方面提高检测精度，另一方面能够节省计算资源，优选地，人脸图像序列包括50张按照时序排序的人脸图像。从待检测视频中，提取人脸图像序列的具体方法包括多种，其中一种可选的方法包括A1～A3。

A1、将待检测视频划分为多个连续的视频帧。

A2、使用MTCNN(Multi-taskconvolutionalneuralnetwork，多任务卷积神经网络)从每一视频帧中提取满足预设要求的人脸图像。其中预设要求包括：图像形状为预设形状、和/或人脸区域位于人脸图像的预设区域，例如，各人脸图像为预设尺寸的正方形图像，且人脸区域位于人脸图像的中间区域。

A3、按照人脸图像的时序生成人脸图像序列。

S102、获取每一人脸图像的灰度图像，得到灰度图像序列。

S103、对每一灰度图像进行傅里叶变换，得到每一灰度图像的第一频谱图像。

本实施例中，利用傅里叶变换公式获取目标频域信号和目标像素点的对应关系，记为第一空频对应关系，进一步，利用第一空频对应关系生成第一频谱图像。其中，目标频域信号为从灰度图像提取的频域信号，目标像素点为频谱图像中的像素点。

本实施例中，第一空频对应关系具体包括：目标频域信号的频域参数和目标像素点的空域参数之间的对应关系。其中，频域信号的频域参数包括频率和幅值，空域参数包括位置(具体为坐标值)和灰度值。具体地，第一目标像素点(任意一个像素点)的灰度值等于第一目标频域信号(与第一目标像素点对应的频域信号)的幅值，第一目标频域信号的频率等于第一目标像素点的边缘距离，第一目标像素点的边缘距离依据第一目标像素点的坐标值获取，本实施例中，任意像素点的边缘距离为像素点距离目标点的距离，目标点为频谱图像中距离像素点最近的顶点。

以灰度图像序列中的灰度图像T_i(i∈[1,N]，N为灰度图像的数量)为例，T_i的尺寸为X×Y(以像素为度量单位)，利用傅里叶变换公式(参见公式1)，获取目标频域信号s(u,v)的频域参数和与其对应的目标像素点d(u,v)的空域参数间的对应关系，生成频谱图像P_i，如下：

公式(1)中，F(u,v)的数值为目标频域信号s(u,v)的幅值，也即目标像素点d(u,v)的灰度值，其中，d(u,v)的坐标值为(u,v)，s(u,v)的频率等于d(u,v)的边缘距离。f(x,y)为灰度图像中坐标值为(x,y)的像素点的灰度值。

S104、将每一频谱图像进行频率中心化，得到每一灰度图像的中心化频谱图像。

具体地，频率中心化的具体过程可以参见现有技术。

进一步需要说明的是，图2a示例了一种中心化频谱图像的获取方法的可视化流程，其中，201为灰度图像T_i，202为T_i的频谱图像P_i，203为T_i的中心化频谱图像CP_i。

S105、依据中心化频谱图像，获取M个像素集合。

本实施例中，每一像素集合包括中心距离相同的多个像素点，中心距离指的是中心化频谱图像中的像素点与中心点的距离。

例如，中心化频谱图像CP_i的任意一个像素集合为D_j＝{d₁、d₂、....、d_K}(j∈[1,M]，K为D_j中像素点的数量)，其中，d_k(k∈[1,K])为中心化频谱图像中的中心距离为r(预设半径值)的像素点，如图2b所示，d_k包括中心化频谱图像中以中心点为圆心，以r为半径的圆Or上的所有像素点。

S106、获取像素集合的灰度平均值，并将灰度平均值归一化至预设数值区间，得到像素集合的一维频域特征参数。

本实施例中，像素集合的灰度平均值为像素集合中所有像素点的灰度值的平均值，预设数值区间为[0,1]，以任意一个像素集合为D_j＝{d₁、d₂、....、d_K}为例，可选的一种获取一维频域特征参数的方法参见下述公式2：

公式2中，α_j表示D_j的一维频域特征参数，h(d_k)表示像素点d_k的灰度值，h_max表示D_j中像素点的最大灰度值。

S107、将各个一维频域特征参数按照频域序位排列，得到一维频域特征向量。

本实施例中，将所有像素集合的中心距离从大到小排序得到的序位，并将每一像素集合的序位作为像素集合的一维频域特征参数的频域序位。像素集合的中心距离即为像素集合中任一像素点的中心距离。接上例，灰度图像T_i的一维频域特征向量为A_i＝[α₁、α₂、...、α_j、...、α_M]。

需要说明的是，中心化频谱图像中每一像素点的中心距离等于该像素点对应的频谱信号的频率，灰度值等于该像素点对应的频谱信号的幅值，所以，灰度图像的一维特征向量中，每一个一维频域特征参数为频率相同的频谱信号的幅值的平均值的归一化结果。可见，一维频域特征向量为灰度图像的二维频域特征的降维结果。

显然，人脸图像的一维频域特征向量相对于传统的人脸图像的二维频域特征，在保留频域特征的同时，压缩了数据量，减少运算开销，降低对运算资源的要求。进一步，本方法通过灰度变换、傅里叶变换以及频率中心化得到每一人脸图像的中心化频谱图像，依据频域特征和空域特征的对应关系，依据中心化频谱图像中各个像素点的空域参数，获取能够表征人脸图像的一维频域特征向量，显然，空域空间的运算相对频域空间的运算，对运算资源的要求低。

S108、将各个灰度图像的一维频域特征向量按照灰度图像的时序拼接，得到频域特征矩阵。

可以理解的是，频域特征矩阵中的一维频域特征向量表征一个灰度图像的频域特征，且，各个一维频域特征向量的排序指示灰度图像的时序，因此，频域特征矩阵既表征待检测视频的频域特征又表征待检测视频的时域特征。

接上例，将X₁～X_N拼接得到频域特征矩阵Q，Q的尺寸为N×M。需要说明的是，具体的拼接方法参见现有技术。

S109、将频域特征矩阵输入至预设的预测模型，得到预测模型的预测结果，作为图像检测结果。

本实施例中，预测结果指示人脸图像序列经过篡改。预测模型由神经网络模型，以预设样本图像序列的频域特征矩阵作为输入数据，以预设样本图像序列的标签作为目标输出训练得到，标签指示预设样本图像序列中的人脸是否属于伪造人脸，也即预设样本图像序列是否经过篡改。

需要说明的是，预测模型的具体训练方法和具体结构参加下述实施例。

由上述技术方案可以看出，本申请实施例提供的图像检测方法，获取人脸图像序列，人脸图像序列包括至少一张按照时序排列的人脸图像，获取每一人脸图像的一维频域特征向量，依据时序，将各个人脸图像的一维频域特征向量拼接得到频域特征矩阵，将频域特征矩阵输入至预设的预测模型，得到预测模型的预测结果，作为图像检测结果，由于，目标人脸图像即任意一个人脸图像的一维频域特征向量表征该目标人脸图像的频域特征，所以，通过将多个连续的人脸图像一维频域特征向量拼接后的频域特征矩阵，集合了人脸图像序列的频域特征以及时域特征，所以以频域特征矩阵为图像检测依据，能够提高检测结果的准确性。

进一步，本方法借助神经网络模型强大的数据处理能力和寻优能力，提高图像检测的效率和准确率。

图3示例了本申请实施例提供的一种预测模型的具体结构。

如图3所示，预测模型包括依次首尾相连的多个循环网络模块和两个全连接层，如图3所示，第一循环网络模块E1的输入数据为预测模型的输入数据Q，其它循环网络模块(除了第一循环网络模块之外的任意循环网络模块)的输入数据为上一循环网络模块的输出数据，例如，循环网络模块E2的输入数据为E1的输出数据q1。第一全连接层的输入数据为第二循环网络模块(最后一个循环网络模块ER)的输出数据，第二全连接层的输入数据为第一全连接层的输出数据，第二全连接层的输出数据为预测模型的输出数据，也即预测结果P。需要说明的是，P包括0或1，其中，P＝0指示待检测视频中的人脸经过伪造得到，P＝1指示待检测视频中的人脸未经伪造。

本实施例中，任意一个循环网络模块包括循环网络层和加法器，循环网络层的输入数据为循环网络模块的输入数据，循环网络层用于对输入数据进行多次预设矩阵运算，输出输入数据的序列化特征，加法器用于对循环网络层的输入数据和输出数据进行加法运算，得到加法运算结果并作为循环网络模块的输出数据输出。如图3所示，E1包括循环网络层L1和加法器J1，L1的输入数据为E1的输入数据Q，加法器J1用于对Q和L1的输出数据进行加法运算得到加法运算结果q1并输出。

其中，每一循环网络层包括依次首尾相连的多个记忆单元，如图3所示第1+5a(a＝0、1、2、3、和4)个循环网络层包括3个记忆单元，其他循环网络层包括5个记忆单元，例如，E1包括3个记忆单元，E2～E4包括5个记忆单元。

每一循环网络层中的第一记忆单元的输入数据为循环网络层的输入数据，其他记忆单元(除了第一记忆单元之外的任意记忆单元)的输入数据为上一个记忆单元的输出数据。如图3所示的记忆单元M2的输入数据为记忆单元M1的输出数据。具体地，每一记忆单元包括LSTM(长短期记忆，Long short-termmemory)网络、ReLU层和加法器，LSTM的输入数据为记忆单元的输入数据，ReLU层用于对LSTM的输出数据进行Relu函数运算，加法器用于对ReLU层的输出数据和LSTM的输入数据进行加法运算，将加法运算结果作为记忆单元的输出数据输出。如图3所示，M1包括LSTMW1、ReLU层R1和加法器(图3中未示出)，R1用于对M1的输出数据进行ReLU函数运算，加法器用于对W1的输入数据和R1的输出数据进行加法运算，得到M1的输出数据m1，输入至M2。

Relu函数参见下述公式3：

F(L(q))＝max(0,L(q)) (3)

公式3中，F(L(q))为ReLU层的输出数据，L(q)为LSTM的输出数据，q为LSTM的输入数据，也即记忆单元的输入数据。

需要说明的是，每一LSTM、ReLU层、加法器的具体结构和功能可以参见现有技术。

进一步需要说明的是，模型训练过程中使用梯度下降进行参数优化，梯度下降的参数设置包括：学习率＝0.00005、动量＝0.5、且初始准确率阈值设置为0.5。

训练结束条件包括：预测模型的准确率高于预设准确率阈值、和/或，迭代次数达到预设次数阈值。

本实施例中，从多次训练得到的预测模型中，选择准确率最高的预测模型作为最终的预测模型。

由上述技术方案可以看出，本申请实施例提供的一种神经网络包括依次首尾相连的多个循环网络模块，每一循环网络模块包括循环网络层和第一加法器，循环网络层包括依次首尾相连的多个记忆单元，每一记忆单元包括长短期记忆网络、ReLU层和第二加法器。

其中，循环网络层用于对输入数据进行多次预设矩阵运算，输出该输入数据的序列化特征，第一加法器用于对循环网络层的输入数据和输出数据进行加法运算，并将加法运算结果作为循环网络模块的输出数据输出。ReLU层用于对长短期记忆网络的输出数据进行Relu函数运算，第二加法器用于对长短期记忆网络的输入数据和ReLU的输出数据进行加法运算，并将加法运算结果作为记忆单元的输出数据输出。可见，预测模型结合LSTM在处理序列数据时的网络特征以及线性残差结构的网络特性，能够提高神经网络模型的检测性能，从而提高预测模型输出预测结果的准确性。

需要说明的是，图3仅为本申请实施例提供的一种可选的预测模型具体结构以及训练方法，预测模型的还包括其他可选的具体结构以及训练方法，本实施例对此不做赘述。

需要说明的是，图1所示的流程仅示例了本申请实施例提供的图像检测方法的一种可选的具体实施方式，本申请还可以以其他可选的具体实施方式实现。

例如，在S104之后还包括，将中心化频谱图像进行滤波操作，具体地，过滤中心化频谱图像中预设区域的频率信号，得到滤波频谱图，并将中心化频谱图像替换为滤波频谱图执行S105～S109。具体的一种滤波方法为将中心化频谱图像的频域特征矩阵与预设掩膜的频域特征矩阵进行点乘，其中，预设掩膜的频域特征矩阵中预设区域的数值为0，实现预设区域频率信号的过滤，可见，利用高通滤波可以将频域空间中的非重点区域过滤，由此提高检测准确率。

例如，S103～S106仅为一种可选的获取一维频域特征参数的方法，本申请还包括其他的获取一维频域特征参数的方法。再例如，S109仅为可选的一种依据频域特征矩阵获取图像检测结果的具体实现方法，本申请还包括其他具体实现方法，并且，图3仅为一种可选的预测模型的具体结构，本申请提供的预测模型还可以包括其他的具体结构。

综上，将本申请实施例提供的一种图像检测方法总结概括为图4所示的流程，如图4所示，本方法包括：

S401、获取人脸图像序列。

本实施例中，人脸图像序列包括至少一张按照时序排列的人脸图像，其中，人脸图像从待检测视频的图像帧中提取，人脸图像的时序依据图像帧在在待检测视频中的时间顺序确定。

需要说明的是，可选的一种获取人脸图像序列的方法参见S101，本实施例不做赘述。

S402、获取每一人脸图像的一维频域特征向量。

本实施例中，目标人脸图像的一维频域特征向量表征目标人脸图像的频域特征，目标人脸图像为任意一个人脸图像，需要说明的是，一维频域特征向量由人脸图像的二维频域特征降维得到，二维频域特征表征人脸图像的频域信号的频率分布和幅值分布。

本实施例中，获取每一人脸图像的一维频域特征向量包括多种，可选的一种方法参见上述实施例，图5示例了另一种可选的获取一维频域特征向量的方法，包括：

S501、获取目标人脸图像的每一频域信号的频域参数，频域参数包括频率和幅值。

具体地，依据将目标人脸图像进行预设空频变换，得到目标人脸图像的频谱图像以及空域对应关系，依据频谱图像中各个第一像素点的空域参数以及空域对应关系，获取每一频域信号的频域参数。

其中，空域对应关系包括各个第一像素点和各个频域信号的对应关系，第一像素点为频谱图像中的像素点，空域参数包括坐标值以及灰度值。需要说明的是，预设空频变换至少包括傅里叶变换，还可以包括频率中心化和/或高通滤波操作。可选的一种获取目标人脸图像的每一频域信号的频域参数方法可以参见上述实施例。

S502、获取多个频域信号集合，每一频域信号集合包括多个同频信号。

其中，多个同频信号的频率相同，需要说明的是，通过空域对应关系，频域信号集合对应于一个像素集合，像素集合中包括频域信号集合中各个频域信号对应的第一像素点，也即上述实施例中的中心化频谱图像的像素集合。

S503、将每一频域信号集合中的多个同频信号的幅值进行预设数值处理，得到每一频域信号集合的幅值参数。

其中，预设数值处理包括求平均值和归一化，需要说明的是，求平均值包括算数平均值获取或者中位值获取。

S504、将各个频域信号集合的幅值参数按照频域序位排列，得到目标人脸图像的一维频域特征向量。

其中，频域序位通过对各个频域信号集合的频率从大到小排序得到。

可见，人脸图像的一维频域特征向量相对于传统的人脸图像的二维频域特征，在保留频域特征的同时，压缩了数据量，减少运算开销，降低对运算资源的要求。

S403、依据时序，将各个人脸图像的一维频域特征向量拼接得到频域特征矩阵。

S404、依据频域特征矩阵，获取人脸图像序列的图像检测结果。

本实施例中，图像检测结果指示人脸图像序列是否经过篡改。

可选的一种依据频域特征矩阵，获取人脸图像序列的图像检测结果的方法包括：将频域特征矩阵输入至预设的预测模型，得到预设预测模型的预测结果，作为图像检测结果，预测结果指示人脸图像序列经过篡改，其中，预测模型由神经网络模型，以预设样本图像序列的频域特征矩阵作为输入数据，以预设样本图像序列的标签作为目标输出训练得到，标签指示预设样本图像序列是否经过篡改。

需要说明的是，具体方法可以参见上述实施例。

由上述技术方案可以看出，本申请实施例提供的图像检测方法，获取人脸图像序列，人脸图像序列包括至少一张按照时序排列的人脸图像，获取每一人脸图像的一维频域特征向量，依据时序，将各个人脸图像的一维频域特征向量拼接得到频域特征矩阵，依据频域特征矩阵，获取人脸图像序列的图像检测结果，图像检测结果指示人脸图像序列是否经过篡改。由于，目标人脸图像即任意一个人脸图像的一维频域特征向量表征该目标人脸图像的频域特征，所以，通过将多个连续的人脸图像一维频域特征向量拼接后的频域特征矩阵，集合了人脸图像序列的频域特征以及时域特征，所以以频域特征矩阵为图像检测依据，能够提高检测结果的准确性。

图5示出了本申请实施例提供的一种图像检测装置的结构示意图，如图5所示，该装置可以包括：

一种图像检测装置，其特征在于，包括：

图像获取单元501，用于获取人脸图像序列，所述人脸图像序列包括至少一张按照时序排列的人脸图像；

向量获取单元502，用于获取每一所述人脸图像的一维频域特征向量，其中，目标人脸图像的一维频域特征向量表征所述目标人脸图像的频域特征，所述目标人脸图像为任意一个所述人脸图像；

特征矩阵获取单元503，用于依据所述时序，将各个所述人脸图像的一维频域特征向量拼接得到频域特征矩阵；

检测结果获取单元504，用于依据所述频域特征矩阵，获取所述人脸图像序列的图像检测结果，所述图像检测结果指示所述人脸图像序列是否经过篡改。

可选地，向量获取单元用于获取所述目标人脸图像的一维频域特征向量，包括：向量获取单元具体用于：

可选地，向量获取单元获取所述目标人脸图像的每一所述频域信号的频域参数，包括：向量获取单元具体用于：

依据所述频谱图像中各个所述第一像素点的空域参数以及所述空域对应关系，获取每一所述频域信号的频域参数，所述空域参数包括坐标值以及灰度值；

可选地，预设空频变换还包括频率中心化和/或高通滤波。

可选地，检测结果获取单元用于依据所述频域特征矩阵，获取所述人脸图像序列的图像检测结果，包括：检测结果获取单元具体用于：

图6示出了该图像检测设备的结构示意图，该设备可以包括：至少一个处理器601，至少一个通信接口602，至少一个存储器603和至少一个通信总线604；

在本申请实施例中，处理器601、通信接口602、存储器603、通信总线604的数量为至少一个，且处理器601、通信接口602、存储器603通过通信总线604完成相互间的通信；

处理器601可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路等；

存储器603可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)等，例如至少一个磁盘存储器；

其中，存储器存储有程序，处理器可执行存储器存储的程序，实现本申请实施例提供的一种图像检测方法的各个步骤，如下：

一种图像检测方法，包括：

可选地，预设空频变换还包括频率中心化和/或高通滤波。

本申请实施例还提供一种可读存储介质，该可读存储介质可存储有适于处理器执行的计算机程序，计算机程序被处理器执行时，实现本申请实施例提供的一种图像检测方法的各个步骤，如下：

一种图像检测方法，包括：

可选地，预设空频变换还包括频率中心化和/或高通滤波。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种图像检测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，获取所述目标人脸图像的一维频域特征向量，包括：

3.根据权利要求2所述的方法，其特征在于，所述获取所述目标人脸图像的每一所述频域信号的频域参数，包括：

4.根据权利要求3所述的方法，其特征在于，所述预设空频变换还包括频率中心化和/或高通滤波。

5.根据权利要求1所述的方法，其特征在于，所述依据所述频域特征矩阵，获取所述人脸图像序列的图像检测结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述神经网络模型包括依次首尾相连的多个循环网络模块，每一所述循环网络模块包括循环网络层和第一加法器，所述循环网络层用于输出所述循环网络层的输入数据的序列化特征，所述第一加法器用于对所述循环网络层的输入数据和输出数据进行加法运算，并将加法运算结果作为所述循环网络模块的输出数据输出。

7.根据权利要求6所述的方法，其特征在于，所述循环网络层包括依次首尾相连的多个记忆单元；

每一所述记忆单元包括长短期记忆网络、ReLU层和第二加法器，所述ReLU层用于对所述长短期记忆网络的输出数据进行Relu函数运算，所述第二加法器用于对所述长短期记忆网络的输入数据和所述ReLU的输出数据进行加法运算，并将加法运算结果作为所述记忆单元的输出数据输出。

8.一种图像检测装置，其特征在于，包括：

9.一种图像检测设备，其特征在于，包括：存储器和处理器；

所述存储器，用于存储程序；

所述处理器，用于执行所述程序，实现如权利要求1～7中任一项所述的图像检测方法的各个步骤。

10.一种可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1～7中任一项所述的图像检测方法的各个步骤。