CN114972886A

CN114972886A - 一种图像隐写分析方法

Info

Publication number: CN114972886A
Application number: CN202210692375.3A
Authority: CN
Inventors: 钮可; 石林; 潘晓中; 林洋平; 张硕
Original assignee: Engineering University of Chinese Peoples Armed Police Force
Current assignee: Engineering University of Chinese Peoples Armed Police Force
Priority date: 2022-06-17
Filing date: 2022-06-17
Publication date: 2022-08-30

Abstract

本发明公开了一种图像隐写分析方法，包括：采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本；将新图像样本加入所述灰度图像样本中，构成待检测图像样本；将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析，以判定待检测图像是否是隐写图像。与现有技术相比，本发明利用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本，并加入原灰度图像样本中，以使得灰度图像样本中的多数类样本和少数类样本平衡，可有效避免由于样本的不平衡性对图像隐写分析模型性能的影响，提高了模型检测的识别率和准确率。

Description

一种图像隐写分析方法

技术领域

本发明涉及计算机技术领域，更具体地涉及一种图像隐写分析方法。

背景技术

近年来，隐藏信息传输行为的数字隐写受到人们越来越多的关注，其通过隐藏信息传输行为的存在，实现信息的安全，已经被广泛应用于数字多媒体安全防护和保密通信领域。然而随着隐写技术的不断发展和推广，其在为人们的通信安全提供保障的同时，也容易被不法分子利用以获取个人利益或甚至应用于袭击活动，正因为如此，隐写分析作为一项针对隐写算法的对抗技术，逐渐受到政府和科研机构的重视。

隐写分析可以通过提取分析载体的某些特征，以确定载体中是否存在隐藏的附加信息，然后对可疑目标进行拦截。随着隐写技术的不断发展，隐写分析技术实现了从利用经验设计特征进行分析阶段逐步转化为利用深度学习方法进行分类，然而在利用深度学习设计的图像隐写分析模型中，存在样本不平衡的问题，现有技术中，一般通过神经网络提取一些特定的统计特征区分隐写图像和正常图像，虽然这些算法能够准确的分类隐写图像，但是大多数的算法都是假设训练数据集能够服从理想样本分布，即样本中的隐写图像和正常图像的比例没有比较显著的差异。然而，在现实样本中，正常图像远远多于隐写图像，当已有的这些隐写分析模型使用不平衡的样本进行训练时，模型便容易被多数类的样本所控制，从而较大的降低模型性能，容易将隐写图像误分类为一个正常图像，这将会导致秘密信息相互传递，从而造成较大损失。

发明内容

本发明所要解决的技术问题是提供一种可提高隐写图像识别率和准确率的图像隐写分析方法。

为解决上述技术问题，本发明提供一种图像隐写分析方法，包括：

采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本；

将新图像样本加入所述灰度图像样本中，构成待检测图像样本；

将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析，以判定待检测图像是否是隐写图像。

其进一步技术方案为：所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本，具体包括：

计算少数类样本中每一样本到该少数类样本中其他样本的欧式距离，以获得每一样本的k近邻样本；

根据公式

对从每一样本的k近邻样本中选择的n个近邻样本进行线性插值，以形成新图像样本；其中，x_new为新图像样本，x为少数类样本，ω_B和ω_A分别为非轮廓区域权值和轮廓区域权值，且ω_B＝2ω_A，x_n为选择的第n个近邻样本，a为少数类样本中图像的像素的灰度值，bi为a在图像中的相邻像素的灰度值。

其进一步技术方案为：在所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本之前，还包括：

采用Focal Loss损失函数预先对图像隐写分析模型进行训练，以获得预先训练好的图像隐写分析模型。基于该设计，采用Focal Loss算法加大了识别不平衡样本中对少数类样本和困难样本的关注，优化了用于隐写分析的卷积神经网络的训练过程。

其进一步技术方案为：所述Focal Loss损失函数FL(p_t)＝-α_t(1- p_t)^γlog(p_t)；其中，γ为调制系数，α_t为平衡因子，

其中y为样本的标签，p为模型预测样本为正类的概率。

其进一步技术方案为：所述将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析，具体包括：

采用高通滤波器对待检测图像样本中的待检测图像进行残差处理；

将进行残差处理后的待检测图像进行卷积处理；

对卷积处理后的待检测图像进行特征提取，以获得特征图像；

特征图像经空间金字塔池化层处理以输出图像隐写分析特征，通过全连接层和Softmax层将图像隐写分析特征映射成分类概率，判断Softmax层的损失函数是否收敛，以判定待检测图像是否是隐写图像。

其进一步技术方案为：所述将进行残差处理后的待检测图像进行卷积处理，具体包括：将进行残差处理后的待检测图像经两种不同的深度可分离卷积模块进行卷积处理，其中，所述两种深度可分离卷积模块分别为1×1点向卷积和3 ×3深度卷积，组数均为30。

其进一步技术方案为：所述对卷积处理后的待检测图像进行特征提取，以获得特征图像，具体包括：将卷积处理后的待检测图像重复依次经卷积、批量标准化，ReLU函数非线性激活和平均池化处理，以进行特征提取，获得特征图像。

其进一步技术方案为：所述损失函数为Focal Loss损失函数。

本发明的有益技术效果在于：与现有技术相比，本发明利用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本，并加入原灰度图像样本中，以使得灰度图像样本中的多数类样本和少数类样本平衡，可有效避免由于样本的不平衡性对图像隐写分析模型性能的影响，提高了模型检测的识别率和准确率。

附图说明

图1是本发明图像隐写分析方法一具体实施例的流程示意图。

具体实施方式

为使本领域的普通技术人员更加清楚地理解本发明的目的、技术方案和优点，以下结合附图和实施例对本发明做进一步的阐述。

参照图1，图1为本发明图像隐写分析方法一具体实施例的流程示意图。在附图所示的实施例中，所述图像隐写分析方法包括：

S101、采用Focal Loss损失函数预先对图像隐写分析模型进行训练，以获得预先训练好的图像隐写分析模型。

该步骤中，所述Focal Loss损失函数FL(p_t)＝-α_t(1-p_t)^γlog(p_t)；其中，γ为调制系数，α_t为平衡因子，

其中y代表样本的标签，有+1和-1两种取值，分别代正、负样本；p的取值范围为0到1，代表模型预测样本为正类的概率。

相对传统交叉熵，Focal Loss算法加大了识别不平衡样本中对少数类样本和困难样本的关注，优化了用于隐写分析的卷积神经网络的训练过程。由上式可知，如果模型对该样本预测的越准，那么模型预测的概率和实际概率的差值就越靠近0，这个样本的loss的缩小程度就越大，例如当γ＝2时，如果预测概率p_t为0.9，较之前的loss就要缩小100倍，若预测概率p_t为0.97就会1000倍，从而减小简单样本的loss对总loss的影响，优化了用于隐写分析的卷积神经网络的训练过程，确保了识别不平衡样本中对少数类样本和困难样本的关注度。

S102、采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本。

本发明中，灰度图像样本中包括正常图像和隐写图像(载密图像)，通常，正常图像远远多于隐写图像，则该步骤中，利用SMOTE算法对灰度图像样本中的隐写图像进行过采样。

具体地，该步骤包括：计算少数类样本中每一样本到该少数类样本中其他样本的欧式距离，以获得每一样本的k近邻样本；根据公式

由上可知，本实施例中，SMOTE算法为针对隐写图像改进的SMOTE采样算法。可理解地，实际过采样过程中，可首先将灰度图像变换为数组数据，再通过对数组数据过采样以获得新数据样本，再对新数据样本进行恢复，获得新图像样本。下面举例对步骤S101进行详细描述，例如，当输入的图像为M×N 的灰度图像，将图像的灰度值展开成一维数组，该数组的长度为(M×N)；对少数类样本即隐写图像中的每一个数组x，计算欧氏距离以求出数组x的k近邻，假设第n个近邻为x_n；数组中的每个像素a在原图中的每个相邻像素bi，当存在 bi－a≥40时，设置轮廓区域权值ω_A＝rand(0,1)，其他情况则设置非轮廓区域权值ω_B＝2×ω_A，通过上述公式获取新数组，并将获取得到的新数组按照灰度值展开，再还原成图像，以形成新图像样本。

S103、将新图像样本加入所述灰度图像样本中，构成待检测图像样本。

该步骤中，将过采样获得的新图像样本加入至原灰度图像样本中，可使得灰度图像样本中的多数类样本和少数类样本平衡，以有效避免由于样本的不平衡性对图像隐写分析模型性能的影响。

S104、将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析，以判定待检测图像是否是隐写图像。

该步骤中，采用训练好的图像隐写分析模型对所述待检测图像进行隐写分析，根据所述图像隐写分析模型的输出判定所述待检测图像是否为隐写图像。

具体地，该步骤包括：采用高通滤波器对待检测图像样本中的待检测图像进行残差处理；将进行残差处理后的待检测图像进行卷积处理；对卷积处理后的待检测图像进行特征提取，以获得特征图像；特征图像经空间金字塔池化层处理以输出图像隐写分析特征，通过全连接层和Softmax层将图像隐写分析特征映射成分类概率，判断Softmax层的FocalLoss损失函数是否收敛，以判定待检测图像是否是隐写图像。

本实施例中，所述将进行残差处理后的待检测图像进行卷积处理，具体包括：将进行残差处理后的待检测图像经两种不同的深度可分离卷积模块进行卷积处理，其中，所述两种深度可分离卷积模块分别为1×1点向卷积和3×3深度卷积，组数均为30；即进行残差处理后的待检测图像分别经30组1×1点向卷积和30组3×3深度卷积；而所述对卷积处理后的待检测图像进行特征提取，以获得特征图像，具体包括：将卷积处理后的待检测图像重复依次经卷积、批量标准化(BN)，ReLU函数非线性激活和平均池化处理，以进行特征提取，获得特征图像，该步骤中，依次重复四次卷积批量标准化(BN)，ReLU函数非线性激活和平均池化处理。

可理解地，本发明中步骤S104的具体处理分析流程与Zhu-Net分析模型中的隐写分析流程类似，本发明中用的Focal Loss损失函数代替Zhu-Net分析模型中的交叉熵函数，增加了对于不同样本赋予不同的权重，使得神经网络提高对少数类样本和难分样本的关注度。

综上所述，本发明提供的图像隐写分析方法，通过改进的SMOTE采样算法和FocalLoss损失函数可以分别在数据层面上对不平衡的少数数据进行线性插值的生成，完成过采样，进而解决数据的不平衡分布，同时，通过对调制系数和平衡因子的设置，可以在算法层面上进一步对不平衡数据在模型的影响进行改善，既能够有效避免由于样本的不平衡性对图像隐写分析模型性能的影响，同时通过加大对难分样本的关注度提高了模型检测的准确率，可理解地，在不平衡样本隐写分析的精度普遍优于Zhu-Net分析模型，且通过在BOSSbase1.01 数据集上的仿真测试，结果表明在该不平衡样本集训练下，检出率显著高于同类的Zhu-Net分析模型，平均检出率提高0.9％-1.9％。

以上所述仅为本发明的优选实施例，而非对本发明做任何形式上的限制。本领域的技术人员可在上述实施例的基础上施以各种等同的更改和改进，凡在权利要求范围内所做的等同变化或修饰，均应落入本发明的保护范围之内。

Claims

1.一种图像隐写分析方法，其特征在于，所述图像隐写分析方法包括：

2.如权利要求1所述的图像隐写分析方法，其特征在于，所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本，具体包括：

根据公式

3.如权利要求1所述的图像隐写分析方法，其特征在于，在所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样，以获得新图像样本之前，还包括：

采用FocalLoss损失函数预先对图像隐写分析模型进行训练，以获得预先训练好的图像隐写分析模型。

4.如权利要求3所述的图像隐写分析方法，其特征在于，所述FocalLoss损失函数FL(p_t)＝-α_t(1-p_t)^γlog(p_t)；其中，γ为调制系数，α_t为平衡因子，

其中y为样本的标签，p为模型预测样本为正类的概率。

5.如权利要求1所述的图像隐写分析方法，其特征在于，所述将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析，具体包括：

将进行残差处理后的待检测图像进行卷积处理；

6.如权利要求5所述的图像隐写分析方法，其特征在于，所述将进行残差处理后的待检测图像进行卷积处理，具体包括：将进行残差处理后的待检测图像经两种不同的深度可分离卷积模块进行卷积处理，其中，所述两种深度可分离卷积模块分别为1×1点向卷积和3×3深度卷积，组数均为30。

7.如权利要求5所述的图像隐写分析方法，其特征在于，所述对卷积处理后的待检测图像进行特征提取，以获得特征图像，具体包括：将卷积处理后的待检测图像重复依次经卷积、批量标准化，ReLU函数非线性激活和平均池化处理，以进行特征提取，获得特征图像。

8.如权利要求5所述的图像隐写分析方法，其特征在于，所述损失函数为Focal Loss损失函数。