CN113763405A

CN113763405A - 一种图像检测方法和装置

Info

Publication number: CN113763405A
Application number: CN202110142944.2A
Authority: CN
Inventors: 周安涛; 赵鑫; 李源
Original assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Jingdong Century Trading Co Ltd; Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2021-02-02
Filing date: 2021-02-02
Publication date: 2021-12-07

Abstract

本发明公开了一种图像检测方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：获取训练样本；其中，所述训练样本，包括：训练图像、区域标签和边界标签；将所述训练图像输入检测模型，得到区域检测结果和边界检测结果；根据所述区域标签、所述边界标签、所述区域检测结果和所述边界检测结果，训练所述检测模型；基于训练好的所述检测模型，确定检测图像是否被篡改。该实施方式能够提高检测准确度。

Description

一种图像检测方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种图像检测方法和装置。

背景技术

在实际应用场景中，不法分子将多张图像的内容合成到一张图像中，改变了图像的原始含义，对用户造成误导。例如，在电商平台中，商家篡改原始图像以吸引消费者。因此，如何检测图像是否被篡改，成为亟待解决的问题。

现有技术通过边缘检测，识别图像是否被篡改。

但是，该方法仅关注图像的局部特征，其检测准确度较低。

发明内容

有鉴于此，本发明实施例提供一种图像检测方法和装置，能够提高检测准确度。

第一方面，本发明实施例提供了一种图像检测方法，包括：

获取训练样本；其中，所述训练样本，包括：训练图像、区域标签和边界标签；

将所述训练图像输入检测模型，得到区域检测结果和边界检测结果；

根据所述区域标签、所述边界标签、所述区域检测结果和所述边界检测结果，训练所述检测模型；

基于训练好的所述检测模型，确定检测图像是否被篡改。

可选地，

所述检测模型，包括：特征提取层、区域检测层和边界检测层；

所述将训练图像输入检测模型，得到区域检测结果和边界检测结果，包括：

将所述训练图像输入所述特征提取层，以从所述训练图像中提取出高阶特征图和低阶特征图；

将所述高阶特征图和所述低阶特征图输入所述区域检测层，得到所述区域检测结果；

将所述高阶特征图和所述低阶特征图输入所述边界检测层，得到所述边界检测结果。

可选地，

所述将所述训练图像输入所述特征提取层，以从所述训练图像中提取出高阶特征图和低阶特征图，包括：

将所述训练图像输入主干网络，得到所述低阶特征图和第一特征图；

基于多尺度网络从所述第一特征图中提取多尺度特征，得到多个第二特征图；

将所述多个第二特征图拼接后输入第一卷积层，得到所述高阶特征图；

其中，所述主干网络包括：第一多通道卷积层和深度可分离卷积层；所述第一卷积层为1×1卷积层。

可选地，

所述多尺度网络包括：空洞卷积层、第二卷积层和池化层；

其中，所述第二卷积层为1×1卷积层。

可选地，

所述区域检测层，包括：第一特征融合层、区域异常分析层和第一结果输出层；

所述将所述高阶特征图和所述低阶特征图输入所述区域检测层，得到所述区域检测结果，包括：

将所述高阶特征图和所述低阶特征图输入所述第一特征融合层，得到第三特征图；

根据所述第三特征图和所述区域异常分析层，确定第四特征图；其中，所述第四特征图用于表征所述第三特征图中篡改区域与背景区域的像素值差异；

将所述第四特征图输入所述第一结果输出层，得到所述区域检测结果。

可选地，

所述将所述高阶特征图和所述低阶特征图输入所述第一特征融合层，得到第三特征图，包括：

将所述低阶特征图输入第三卷积层，得到第五特征图；

对所述高阶特征图进行上采样，得到第六特征图；

将所述第五特征图和所述第六特征图拼接后输入第二多通道卷积层，得到所述第三特征图；

其中，所述第三卷积层为1×1卷积层。

可选地，

所述根据所述第三特征图和所述区域异常分析层，确定第四特征图，包括：

根据所述第三特征图中各个像素坐标的像素值，计算所述第三特征图的平均像素值；

确定各个所述像素坐标的像素值与所述平均像素值的差；

根据各个所述像素坐标的像素值与所述平均像素值的差，计算所述第三特征图的像素值标准差；

根据所述像素值标准差、各个所述像素坐标的像素值与所述平均像素值的差，计算各个所述像素坐标的标准化像素值；

根据各个所述像素坐标的标准化像素值，确定所述第四特征图。

可选地，

所述将所述第四特征图输入所述第一结果输出层，得到所述区域检测结果，包括：

将所述第四特征图输入第四卷积层，得到第七特征图；

对所述第七特征图进行上采样，得到第八特征图；

将所述第八特征图输入激活函数，得到所述区域检测结果；

其中，所述第四卷积层为1×1卷积层。

可选地，

所述边界检测层，包括：第二特征融合层、边界异常分析层和第二结果输出层；

所述将所述高阶特征图和所述低阶特征图输入所述边界检测层，得到所述边界检测结果，包括：

将所述高阶特征图和所述低阶特征图输入所述第二特征融合层，得到第九特征图；

根据所述第九特征图和所述边界异常分析层，确定第十特征图；其中，所述第十特征图用于表征检测窗口内篡改区域与背景区域的像素值差异；

将所述第十特征图输入所述第二结果输出层，得到所述边界检测结果。

可选地，

所述将所述高阶特征图和所述低阶特征图输入所述第二特征融合层，得到第九特征图，包括：

将所述低阶特征图输入第五卷积层，得到第十一特征图；

对所述高阶特征图进行上采样，得到第十二特征图；

将所述第十一特征图和所述第十二特征图拼接后输入第三多通道卷积层，得到所述第九特征图；

其中，所述第五卷积层为1×1卷积层。

可选地，

所述根据所述第九特征图和所述边界异常分析层，确定第十特征图，包括：

根据所述检测窗口内第九特征图中各个像素坐标的像素值，计算所述检测窗口的平均像素值；

确定各个所述像素坐标的像素值与所述像素坐标所处检测窗口的平均像素值的差；

计算所述第九特征图的像素值标准差；

根据所述像素值标准差、各个所述像素坐标的像素值与所述像素坐标所处检测窗口的平均像素值的差，计算所述检测窗口内像素坐标的标准化像素值；

根据所述检测窗口内像素坐标的标准化像素值，确定所述第十特征图。

可选地，

所述将所述第十特征图输入所述第二结果输出层，得到所述边界检测结果，包括：

将所述第十特征图输入第六卷积层，得到第十三特征图；

对所述第十三特征图进行上采样，得到第十四特征图；

将所述第十四特征图输入激活函数，得到所述区域检测结果；

其中，所述第六卷积层为1×1卷积层。

可选地，

所述获取训练样本，包括：

获取所述训练图像和所述区域标签；

对所述区域标签执行膨胀操作，得到膨胀图像；

对所述区域标签执行腐蚀操作，得到腐蚀图像；

根据所述膨胀图像和所述腐蚀图像，确定所述边界标签。

可选地，

进一步包括：

获取预训练样本；

基于所述预训练样本对所述检测模型进行预训练；

所述将所述训练图像输入检测模型，得到区域检测结果和边界检测结果，包括：

将所述训练图像输入经过预训练的所述检测模型，得到所述区域检测结果和所述边界检测结果。

第二方面，本发明实施例提供了一种图像检测装置，包括：

获取模块，配置为获取训练样本；其中，所述训练样本，包括：训练图像、区域标签和边界标签；

训练模块，配置为将所述训练图像输入检测模型，得到区域检测结果和边界检测结果；根据所述区域标签、所述边界标签、所述区域检测结果和所述边界检测结果，训练所述检测模型；

检测模块，配置为基于训练好的所述检测模型，确定检测图像是否被篡改。

第三方面，本发明实施例提供了一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上述任一实施例所述的方法。

第四方面，本发明实施例提供了一种计算机可读介质，其上存储有计算机程序，所述程序被处理器执行时实现如上述任一实施例所述的方法。

上述发明中的一个实施例具有如下优点或有益效果：基于检测模型对图像进行边界检测和区域检测，区域检测基于整个图像的篡改区域与背景区域的特征差异，识别篡改区域，其关注的是图像整体特征；边界检测基于篡改边界两侧的特征差异，识别篡改边界，其关注的是局部特征。边界检测能够辅助区域检测，更加精确地确定篡改区域，提高图像检测的准确度。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是本发明的一个实施例提供的一种图像检测方法的流程图；

图2是本发明的一个实施例提供的一种图像检测方法的流程图；

图3是本发明的一个实施例提供的一种检测模型的架构图；

图4(a)是本发明的一个实施例提供的一种区域标签的示意图；

图4(b)是本发明的一个实施例提供的一种膨胀图像的示意图；

图4(c)是本发明的一个实施例提供的一种腐蚀图像的示意图；

图4(d)是本发明的一个实施例提供的一种边界标签的示意图；

图5是本发明的一个实施例提供的一种主干网络的结构示意图；

图6是本发明的一个实施例提供的一种多尺度网络的结构示意图；

图7是本发明的一个实施例提供的一种图像检测装置的结构示意图；

图8是本发明实施例可以应用于其中的示例性系统架构图；

图9是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

边缘检测关注的是检测框内图像的局部特征，并没有考虑整个图像的篡改区域与背景区域的特征差异。因此，其检测结果的准确度还需进一步提升。

鉴于此，如图1所示，本发明实施例提供了一种图像检测方法，包括：

步骤101：获取训练样本；其中，训练样本，包括：训练图像、区域标签和边界标签。

为了提高训练效果，本发明实施例的训练样本来自于篡改图像数据集CASIA 2.0，CASIA 2.0能够提供超过五千张篡改图像，并涉及多种篡改方式和图像格式，能够满足本发明实施例的训练需求。在实际应用场景中，还可以根据实际情况选择样本数量相对较少的CASIA 1.0数据集等。

数据集中包括训练图像和区域标签，边界标签根据区域标签确定。

步骤102：将训练图像输入检测模型，得到区域检测结果和边界检测结果。

区域检测结果为预测得到的篡改区域，边界检测结果为预测得到的篡改边界。

步骤103：根据区域标签、边界标签、区域检测结果和边界检测结果，训练检测模型。

根据区域标签、边界标签、区域检测结果、边界检测结果和预设的损失函数，确定损失值；根据损失值，调整检测模型的参数。

在实际应用场景中，为了保证检测模型的预测质量，在训练的过程中，使用测试样本对检测模型进行测试，以确定检测模型的预测效果。具体地，训练样本和预测样本的数量比可以为9:1。测试样本可以来源于CASIA 1.0和Columbia数据集。

步骤104：基于训练好的检测模型，确定检测图像是否被篡改。

本发明实施例基于检测模型对图像进行边界检测和区域检测，区域检测基于整个图像的篡改区域与背景区域的特征差异，识别篡改区域，其关注的是图像整体特征；边界检测基于篡改边界两侧的特征差异，识别篡改边界，其关注的是局部特征。边界检测能够辅助区域检测，更加精确地确定篡改区域，提高图像检测的准确度。

在本发明的一个实施例中，检测模型，包括：特征提取层、区域检测层和边界检测层；

将训练图像输入检测模型，得到区域检测结果和边界检测结果，包括：

将训练图像输入特征提取层，以从训练图像中提取出高阶特征图和低阶特征图；

将高阶特征图和低阶特征图输入区域检测层，得到区域检测结果；

将高阶特征图和低阶特征图输入边界检测层，得到边界检测结果。

本发明实施例基于检测模型确定区域检测结果和边界检测结果。基于功能的不同，检测模型可以被划分成特征提取层、区域检测层和边界检测层。其中，特征提取层用于从训练图像中提取高阶特征和低阶特征，提取的高阶特征构成高阶特征图，提取的低阶特征构成低阶特征图。低阶特征的分辨率更高，包含位置信息、细节信息等；高阶特征具有更多的语义信息，但是分辨率较低。区域检测层用于检测篡改区域，边界检测层用于检测篡改边界。

本发明实施例利用高阶特征和低阶特征进行边界检测和区域检测，考虑了训练图像中的多维特征，提高区域检测和边界检测的精确度，进而篡改识别结果的准确度。

在本发明的一个实施例中，将训练图像输入特征提取层，以从训练图像中提取出高阶特征图和低阶特征图，包括：

将训练图像输入主干网络，得到低阶特征图和第一特征图；

基于多尺度网络从第一特征图中提取多尺度特征，得到多个第二特征图；

将多个第二特征图拼接后输入第一卷积层，得到高阶特征图；

其中，主干网络包括：第一多通道卷积层和深度可分离卷积层；第一卷积层为1×1卷积层。

在本发明实施例中，特征提取层中包括主干网络、多尺度网络和第一卷积层。主干网络用于从训练图像中提取特征，其可以通过多通道卷积层和深度可分离卷积实现。第一多通道卷积层和深度可分离卷积层相结合，能够提高特征提取效率和质量。在本发明实施例中，主干网络中可以包括多个第一多通道卷积层和多个深度可分离卷积层，还可以将深度可分离卷积层替换成第一多通道卷积层或者其他类型的卷积层。

本发明实施例通过提取多尺度特征提高区域检测的精确度，进而提高图像检测结果的准确度和可靠性。

第一卷积层用于将第二特征图进行融合，得到高阶特征图。

在本发明的一个实施例中，多尺度网络包括：空洞卷积层、第二卷积层和池化层；

其中，第二卷积层为1×1卷积层。

本发明实施例通过空洞卷积层加大了感受野，使得多尺度网络能够输出更加丰富的信息，进而提高模型训练效果。本发明实施例可以多个空洞卷积层，如三个或四个等。

在本发明的一个实施例中，区域检测层，包括：第一特征融合层、区域异常分析层和第一结果输出层；

将高阶特征图和低阶特征图输入区域检测层，得到区域检测结果，包括：

将高阶特征图和低阶特征图输入第一特征融合层，得到第三特征图；

根据第三特征图和区域异常分析层，确定第四特征图；其中，第四特征图用于表征第三特征图中篡改区域与背景区域的像素值差异；

将第四特征图输入第一结果输出层，得到区域检测结果。

本发明实施例基于篡改区域与背景区域的像素值差异，确定篡改区域的范围。在计算像素值差异的过程中，考虑的是第三特征图中各个像素坐标的像素值，能够从全局角度识别篡改区域。

在本发明的一个实施例中，将高阶特征图和低阶特征图输入第一特征融合层，得到第三特征图，包括：

将低阶特征图输入第三卷积层，得到第五特征图；

对高阶特征图进行上采样，得到第六特征图；

将第五特征图和第六特征图拼接后输入第二多通道卷积层，得到第三特征图；

其中，第三卷积层为1×1卷积层。

本发明实施例通过1×1卷积层对低阶特征图进行特征融合、压缩，以便于去除冗余特征，提高模型训练效果。另外，可以通过双线性插值或转置卷积对高阶特征图进行上采样，以放大高阶特征图的尺寸。第五特征图与第六特征图可以按照Z轴拼接，然后通过1×1卷积层进行特征融合。

在本发明的一个实施例中，根据第三特征图和区域异常分析层，确定第四特征图，包括：

根据第三特征图中各个像素坐标的像素值，计算第三特征图的平均像素值；

确定各个像素坐标的像素值与平均像素值的差；

根据各个像素坐标的像素值与平均像素值的差，计算第三特征图的像素值标准差；

根据像素值标准差、各个像素坐标的像素值与平均像素值的差，计算各个像素坐标的标准化像素值；

根据各个像素坐标的标准化像素值，确定第四特征图。

本发明实施例通过标准化像素值表征像素坐标的像素值与第三特征图平均像素值的差异程度，差异程度越大，说明像素坐标位于篡改区域中的可能性越大。本发明实施例通过像素值的差异，识别像素坐标是否处于篡改区域，能够提高区域识别的精确度。

在本发明的一个实施例中，将第四特征图输入第一结果输出层，得到区域检测结果，包括：

将第四特征图输入第四卷积层，得到第七特征图；

对第七特征图进行上采样，得到第八特征图；

将第八特征图输入激活函数，得到区域检测结果；

其中，第四卷积层为1×1卷积层。

本发明实施例通过上采样放大图像，并通过激活函数将像素值映射到0～1之间，第八特征图各个像素坐标的映射结果构成区域检测结果。本发明实施例在计算标准化像素值之后再进行降维和放大，能够保证计算过程所采用像素值的准确性，提高区域检测结果的准确性和可靠性。采用的激活函数可以为sigmoid函数、softmax函数等。

在本发明的一个实施例中，边界检测层，包括：第二特征融合层、边界异常分析层和第二结果输出层；

将高阶特征图和低阶特征图输入边界检测层，得到边界检测结果，包括：

将高阶特征图和低阶特征图输入第二特征融合层，得到第九特征图；

根据第九特征图和边界异常分析层，确定第十特征图；其中，第十特征图用于表征检测窗口内篡改区域与背景区域的像素值差异；

将第十特征图输入第二结果输出层，得到边界检测结果。

本发明实施例基于检测窗口内篡改区域与背景区域的像素值差异，确定篡改区域的范围。与区域检测相区别，本发明实施例考虑的是检测窗口中各个像素坐标的像素值，能够从局部角度辅助区域检测过程确定篡改区域。

在本发明的一个实施例中，将高阶特征图和低阶特征图输入第二特征融合层，得到第九特征图，包括：

将低阶特征图输入第五卷积层，得到第十一特征图；

对高阶特征图进行上采样，得到第十二特征图；

将第十一特征图和第十二特征图拼接后输入第三多通道卷积层，得到第九特征图；

其中，第五卷积层为1×1卷积层。

与区域检测部分类似，本发明实施例通过1×1卷积层对低阶特征图进行特征融合、压缩，以便于去除冗余特征，提高模型训练效果。另外，可以通过双线性插值或转置卷积对高阶特征图进行上采样，以放大高阶特征图的尺寸。第十一特征图与第十二特征图可以按照Z轴拼接，然后通过1×1卷积层进行特征融合。

在本发明的一个实施例中，根据第九特征图和边界异常分析层，确定第十特征图，包括：

根据检测窗口内第九特征图中各个像素坐标的像素值，计算检测窗口的平均像素值；

确定各个像素坐标的像素值与像素坐标所处检测窗口的平均像素值的差；

计算第九特征图的像素值标准差；

根据像素值标准差、各个像素坐标的像素值与像素坐标所处检测窗口的平均像素值的差，计算检测窗口内像素坐标的标准化像素值；

根据检测窗口内像素坐标的标准化像素值，确定第十特征图。

本发明实施例关注的是检测窗口这一局部区域内的像素值差异。在篡改边界两侧，像素值存在差异，这种差异可以通过计算检测窗口内像素坐标的标准化像素值来确定。在实际应用场景中，检测窗口的尺寸可以根据需要进行调整。

在本发明的一个实施例中，将第十特征图输入第二结果输出层，得到边界检测结果，包括：

将第十特征图输入第六卷积层，得到第十三特征图；

对第十三特征图进行上采样，得到第十四特征图；

将第十四特征图输入激活函数，得到区域检测结果；

其中，第六卷积层为1×1卷积层。

第二结果输出层与第一结果输出层类似，本发明实施例通过上采样放大图像，并通过激活函数将像素值映射到0～1之间，第十四特征图各个像素坐标的映射结果构成区域检测结果。采用的激活函数可以为sigmoid函数、softmax函数等。

在本发明的一个实施例中，获取训练样本，包括：

获取训练图像和区域标签；

对区域标签执行膨胀操作，得到膨胀图像；

对区域标签执行腐蚀操作，得到腐蚀图像；

根据膨胀图像和腐蚀图像，确定边界标签。

在本发明实施例中，鉴于CASIA 2.0中不存在边界标签，因此，本发明实施例基于区域标签生成边界标签。膨胀图像与腐蚀图像的差值为边界标签。膨胀操作和腐蚀操作可以采用7x7的窗口实现。通过本发明实施例能够更加便捷的获取边界标签，提高模型训练效率。

在本发明的一个实施例中，该方法还包括：获取预训练样本；基于预训练样本对检测模型进行预训练；

将训练图像输入经过预训练的检测模型，得到区域检测结果和边界检测结果。

在本发明实施例中，预训练样本可以通过COCO数据集中的原始图像构建。例如，在COCO数据集中选择一张图像作为原始图像，然后从另一张图像中裁剪出一个物体，经过旋转、放大等操作粘贴到原始图像中。本发明实施例在通过预训练提高检测模型的训练效果，进而提高篡改图像检测的准确度。

如图2所示，本发明实施例提供了一种图像检测方法，包括：

步骤201：获取预训练样本。

从COCO数据集中选择原始图像，从另一张图像中裁剪出物体图像，将该物体图像经过旋转、方法后黏贴到原始图像中，得到预训练样本。

步骤202：基于预训练样本对检测模型进行预训练。

检测模型的架构如图3所示，下述实施例将对其架构进行详细说明。

步骤203：获取训练图像和区域标签。

从CASIA 2.0中获取训练图像和区域标签。

步骤204：对区域标签执行膨胀操作，得到膨胀图像。

步骤205：对区域标签执行腐蚀操作，得到腐蚀图像。

膨胀操作和腐蚀操作采用的窗口尺寸为7×7。

如图4所示，从左到右依次是区域标签，膨胀图像、腐蚀图像，边界标签。

步骤206：根据膨胀图像和腐蚀图像，确定边界标签。

训练图像、区域标签和边界标签构成训练样本。

步骤207：将训练图像输入特征提取层，以从训练图像中提取出高阶特征图和低阶特征图。

具体地，将训练图像输入主干网络，主干网络的结构如图5所示，从图中可以看出，主干网络包括入口层、中间层和出口层。入口层包括五个多通道卷积层和九个深度可分离卷积层。以“Conv 32，3x3，stride2”为例，Conv 32表示多通道卷积层的输出通道为32，卷积核为3x3，步幅为2。中间层包括16个相同的深度可分离卷积层。出口层包括一个多通道卷积层和六个深度可分离卷积层。低价特征图由中间层的第三个深度可分离卷积层输出，第一特征图由出口层输出。

参考图3，将第一特征图依次输入卷积核为3x3，膨胀率为6、12、18的三个空洞卷积层，一个1x1卷积层和一个池化层，得到多个第二特征图。将第二特征图按Z轴拼接，并输入1x1卷积层，得到融合不同尺度特征的高阶特征图。在本发明实施例中，低阶特征图的大小为训练图像的1/4，高阶特征图大小为训练图像的1/16。多尺度网络还可以为图6所示结构，其中包括1x1卷积层，膨胀率为1、2、5的膨胀卷积。在图6中，每一个横排的卷积层共享卷积核参数，以便于同一个目标在不同尺度下有相同的特征表达能力。

步骤208：将高阶特征图和低阶特征图输入区域检测层，得到区域检测结果。

具体地，将低阶特征图输入1x1卷积层，得到第五特征图。对高阶特征图进行双线性插值，使其放大四倍，得到第六特征图。将第五特征图与第六特征图按照Z轴拼接，然后输入3x3卷积层将特征融合，得到第三特征图。

根据第三特征图中各个像素坐标的像素值，计算第三特征图的平均像素值，如式(1)所示。

其中，F[i,j]用于表征第三特征图中像素坐标(i，j)的像素值，H用于表征第三特征图的高度，W用于表征第三特征图的宽度，μ_f用于表征第三特征图的平均像素值。

确定各个像素坐标的像素值与平均像素值的差，如式(2)所示。

D_f[i,j]＝F[i,j]-μ_f (2)

其中，D_f[i,j]用于表征像素坐标(i，j)的像素值与平均像素值的差。

根据各个像素坐标的像素值与平均像素值的差，计算第三特征图的像素值标准差。

根据像素值标准差、各个像素坐标的像素值与平均像素值的差，计算各个像素坐标的标准化像素值，如式(3)所示。

Z_f[i,j]＝D_f[i,j]/max(σ_f,ε+ω_σ1) (3)

其中，σ_f用于表征第三特征图的像素值标准差，ε为10^-5，ω_σ1为可以通过训练过程不断调整的第一向量。

根据各个像素坐标的标准化像素值，确定第四特征图。

将第四特征图输入1×1卷积层，得到第七特征图。通过双线性插值将第七特征图放大四倍，得到第八特征图。将第八特征图输入sigmoid函数，得到区域检测结果。

步骤209：将高阶特征图和低阶特征图输入边界检测层，得到边界检测结果。

具体地，将低阶特征图输入1x1卷积层，得到第十一特征图。对高阶特征图进行双线性插值，使其放大四倍，得到第十二特征图。将第十一特征图与第十二特征图按照Z轴拼接，然后输入3x3卷积层将特征融合，得到第九特征图。

根据检测窗口内第九特征图中各个像素坐标的像素值，计算检测窗口的平均像素值，如式(4)所示。

其中，

用于表征高为7、宽为7的检测窗口的平均像素值。

确定各个像素坐标的像素值与像素坐标所处检测窗口的平均像素值的差，如式(5)所示。

其中，

用于表征像素坐标(i，j)的像素值与像素坐标所处检测窗口的平均像素值的差。

计算第九特征图的像素值标准差。

根据像素值标准差、各个像素坐标的像素值与像素坐标所处检测窗口的平均像素值的差，计算检测窗口内像素坐标的标准化像素值，如式(6)所示。

在本发明实施例中，第九特征图为第三特征图相同，两者的像素值标准差相同。ω_σ2为可以通过训练过程不断调整的第二向量。

将第十特征图输入1×1卷积层，得到第十三特征图。通过双线性插值将第十三特征图放大四倍，得到第十四特征图。将第十四特征图输入sigmoid函数，得到边界检测结果。

步骤210：根据区域标签、边界标签、区域检测结果和边界检测结果，训练检测模型。

根据区域标签和区域检测结果的差异，可以确定预测篡改区域与实际篡改区域的差异；根据边界标签和边界检测结果的差异，可以确定预测篡改边界与实际篡改边界的差异。本发明实施例采用交叉熵损失函数，包括区域检测和边界检测两部分，如式(7)-(9)所示。

其中，m用于表征训练样本数量，

用于表征训练样本k的区域检测结果，

用于表征训练样本k的边界检测结果，

用于表征训练样本k中像素坐标(i，j)对应的区域标签的值，

用于表征训练样本k中像素坐标(i，j)的区域检测结果，

用于表征训练样本k中像素坐标(i，j)对应的边界标签的值，

用于表征训练样本k中像素坐标(i，j)的边界检测结果。

通过式(7)-(9)可以计算损失值，根据损失值调整检测模型的参数。

步骤211：基于训练好的检测模型，确定检测图像是否被篡改。

检测模型可以将输入的像素值映射到0和1之间，如果Sigmoid函数输出的值大于设定值(本发明实施例为0.5)，则确定像素坐标位于篡改区域中，否则，位于背景区域中。

本发明实施例以Columbia和CASIA 1.0为测试样本集，通过F1分数评估训练得到的检测模型的性能，测试结果如表1所示。由表1可知，与其他模型相比，本发明实施例训练得到的检测模型具有最高的F1分数，说明其性能优于其他模型。其中，RGB-N是一种基于双流Faster R-CNN的篡改图像检测方法，NOI1是一种基于噪声不一致来检测篡改图像的方法，其使用高通小波系数来模拟局部噪声，CFA是一种CFA模式估计方法，它使用附近的像素来近似相机滤波器阵列模式，然后产生每个像素的篡改概率。DCT是一种基于DCT系数直方图差异的JPEG图像篡改检测方法。

表1不同模型的F1分数

	Columbia	CASIA 1.0
			检测模型	0.747	0.435
RGB-N	0.697	0.408
			NOI1	0.574	0.263
DCT	0.520	0.301
			CFA	0.503	0.212

如图7所示，本发明实施例提供了一种图像检测装置，包括：

获取模块701，配置为获取训练样本；其中，训练样本，包括：训练图像、区域标签和边界标签；

训练模块702，配置为将训练图像输入检测模型，得到区域检测结果和边界检测结果；根据区域标签、边界标签、区域检测结果和边界检测结果，训练检测模型；

检测模块703，配置为基于训练好的检测模型，确定检测图像是否被篡改。

训练模块702，配置为将训练图像输入特征提取层，以从训练图像中提取出高阶特征图和低阶特征图；将高阶特征图和低阶特征图输入区域检测层，得到区域检测结果；将高阶特征图和低阶特征图输入边界检测层，得到边界检测结果。

在本发明的一个实施例中，训练模块702，配置为将训练图像输入主干网络，得到低阶特征图和第一特征图；基于多尺度网络从第一特征图中提取多尺度特征，得到多个第二特征图；将多个第二特征图拼接后输入第一卷积层，得到高阶特征图；其中，主干网络包括：第一多通道卷积层和深度可分离卷积层；第一卷积层为1×1卷积层。

在本发明的一个实施例中，多尺度网络包括：空洞卷积层、第二卷积层和池化层；其中，第二卷积层为1×1卷积层。

在本发明的一个实施例中，区域检测层，包括：第一特征融合层、区域异常分析层和第一结果输出层；训练模块702，配置为将高阶特征图和低阶特征图输入第一特征融合层，得到第三特征图；根据第三特征图和区域异常分析层，确定第四特征图；其中，第四特征图用于表征第三特征图中篡改区域与背景区域的像素值差异；将第四特征图输入第一结果输出层，得到区域检测结果。

在本发明的一个实施例中，训练模块702，配置为将低阶特征图输入第三卷积层，得到第五特征图；对高阶特征图进行上采样，得到第六特征图；将第五特征图和第六特征图拼接后输入第二多通道卷积层，得到第三特征图；其中，第三卷积层为1×1卷积层。

在本发明的一个实施例中，训练模块702，配置为根据第三特征图中各个像素坐标的像素值，计算第三特征图的平均像素值；确定各个像素坐标的像素值与平均像素值的差；根据各个像素坐标的像素值与平均像素值的差，计算第三特征图的像素值标准差；根据像素值标准差、各个像素坐标的像素值与平均像素值的差，计算各个像素坐标的标准化像素值；根据各个像素坐标的标准化像素值，确定第四特征图。

在本发明的一个实施例中，训练模块702，配置为将第四特征图输入第四卷积层，得到第七特征图；对第七特征图进行上采样，得到第八特征图；将第八特征图输入激活函数，得到区域检测结果；其中，第四卷积层为1×1卷积层。

在本发明的一个实施例中，边界检测层，包括：第二特征融合层、边界异常分析层和第二结果输出层；训练模块702，配置为将高阶特征图和低阶特征图输入第二特征融合层，得到第九特征图；根据第九特征图和边界异常分析层，确定第十特征图；其中，第十特征图用于表征检测窗口内篡改区域与背景区域的像素值差异；将第十特征图输入第二结果输出层，得到边界检测结果。

在本发明的一个实施例中，训练模块702，配置为将低阶特征图输入第五卷积层，得到第十一特征图；对高阶特征图进行上采样，得到第十二特征图；将第十一特征图和第十二特征图拼接后输入第三多通道卷积层，得到第九特征图；其中，第五卷积层为1×1卷积层。

在本发明的一个实施例中，训练模块702，配置为根据检测窗口内第九特征图中各个像素坐标的像素值，计算检测窗口的平均像素值；确定各个像素坐标的像素值与像素坐标所处检测窗口的平均像素值的差；计算第九特征图的像素值标准差；根据像素值标准差、各个像素坐标的像素值与像素坐标所处检测窗口的平均像素值的差，计算检测窗口内像素坐标的标准化像素值；根据检测窗口内像素坐标的标准化像素值，确定第十特征图。

在本发明的一个实施例中，训练模块702，配置为将第十特征图输入第六卷积层，得到第十三特征图；对第十三特征图进行上采样，得到第十四特征图；将第十四特征图输入激活函数，得到区域检测结果；其中，第六卷积层为1×1卷积层。

在本发明的一个实施例中，获取模块701，配置为获取训练图像和区域标签；对区域标签执行膨胀操作，得到膨胀图像；对区域标签执行腐蚀操作，得到腐蚀图像；根据膨胀图像和腐蚀图像，确定边界标签。

在本发明的一个实施例中，获取模块701，配置为获取预训练样本；基于预训练样本对检测模型进行预训练；将训练图像输入经过预训练的检测模型，得到区域检测结果和边界检测结果。

本发明实施例提供了一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如上述任一实施例所述的方法。

本发明实施例提供了一种计算机可读介质，其上存储有计算机程序，程序被处理器执行时实现如上述任一实施例所述的方法。

图8示出了可以应用本发明实施例的图像检测方法或图像检测装置的示例性系统架构800。

如图8所示，系统架构800可以包括终端设备801、802、803，网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备801、802、803通过网络804与服务器805交互，以接收或发送消息等。终端设备801、802、803上可以安装有各种通讯客户端应用，例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备801、802、803可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器805可以是提供各种服务的服务器，例如对用户利用终端设备801、802、803所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理，并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是，本发明实施例所提供的图像检测方法一般由服务器805执行，相应地，图像检测装置一般设置于服务器805中。

应该理解，图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

下面参考图9，其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示，计算机系统900包括中央处理单元(CPU)901，其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中，还存储有系统900操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

以下部件连接至I/O接口905：包括键盘、鼠标等的输入部分906；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907；包括硬盘等的存储部分908；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器910上，以便于从其上读出的计算机程序根据需要被安装入存储部分908。

特别地，根据本发明公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分909从网络上被下载和安装，和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时，执行本发明的系统中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中，例如，可以描述为：一种处理器包括发送模块、获取模块、确定模块和第一处理模块。其中，这些模块的名称在某种情况下并不构成对该模块本身的限定，例如，发送模块还可以被描述为“向所连接的服务端发送图片获取请求的模块”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该设备执行时，使得该设备包括：

基于训练好的所述检测模型，确定检测图像是否被篡改。

根据本发明实施例的技术方案，基于检测模型对图像进行边界检测和区域检测，区域检测基于整个图像的篡改区域与背景区域的特征差异，识别篡改区域，其关注的是图像整体特征；边界检测基于篡改边界两侧的特征差异，识别篡改边界。边界检测能够辅助区域检测，更加精确地确定篡改区域，提高图像检测的准确度。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种图像检测方法，其特征在于，包括：

基于训练好的所述检测模型，确定检测图像是否被篡改。

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求2所述的方法，其特征在于，

4.根据权利要求3所述的方法，其特征在于，

所述多尺度网络包括：空洞卷积层、第二卷积层和池化层；

其中，所述第二卷积层为1×1卷积层。

5.根据权利要求2所述的方法，其特征在于，

6.根据权利要求5所述的方法，其特征在于，

将所述低阶特征图输入第三卷积层，得到第五特征图；

对所述高阶特征图进行上采样，得到第六特征图；

其中，所述第三卷积层为1×1卷积层。

7.根据权利要求5所述的方法，其特征在于，

确定各个所述像素坐标的像素值与所述平均像素值的差；

8.根据权利要求5-7任一所述的方法，其特征在于，

将所述第四特征图输入第四卷积层，得到第七特征图；

对所述第七特征图进行上采样，得到第八特征图；

将所述第八特征图输入激活函数，得到所述区域检测结果；

其中，所述第四卷积层为1×1卷积层。

9.根据权利要求2所述的方法，其特征在于，

10.根据权利要求9所述的方法，其特征在于，

将所述低阶特征图输入第五卷积层，得到第十一特征图；

对所述高阶特征图进行上采样，得到第十二特征图；

其中，所述第五卷积层为1×1卷积层。

11.根据权利要求9所述的方法，其特征在于，

计算所述第九特征图的像素值标准差；

12.根据权利要求9-11任一所述的方法，其特征在于，

将所述第十特征图输入第六卷积层，得到第十三特征图；

对所述第十三特征图进行上采样，得到第十四特征图；

其中，所述第六卷积层为1×1卷积层。

13.根据权利要求1所述的方法，其特征在于，

所述获取训练样本，包括：

获取所述训练图像和所述区域标签；

对所述区域标签执行膨胀操作，得到膨胀图像；

对所述区域标签执行腐蚀操作，得到腐蚀图像；

根据所述膨胀图像和所述腐蚀图像，确定所述边界标签。

14.根据权利要求1所述的方法，其特征在于，进一步包括：

获取预训练样本；

基于所述预训练样本对所述检测模型进行预训练；

15.一种图像检测装置，其特征在于，包括：

16.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-14中任一所述的方法。

17.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-14中任一所述的方法。