CN114972886A - 一种图像隐写分析方法 - Google Patents
一种图像隐写分析方法 Download PDFInfo
- Publication number
- CN114972886A CN114972886A CN202210692375.3A CN202210692375A CN114972886A CN 114972886 A CN114972886 A CN 114972886A CN 202210692375 A CN202210692375 A CN 202210692375A CN 114972886 A CN114972886 A CN 114972886A
- Authority
- CN
- China
- Prior art keywords
- image
- samples
- detected
- sample
- steganalysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像隐写分析方法,包括:采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本;将新图像样本加入所述灰度图像样本中,构成待检测图像样本;将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析,以判定待检测图像是否是隐写图像。与现有技术相比,本发明利用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本,并加入原灰度图像样本中,以使得灰度图像样本中的多数类样本和少数类样本平衡,可有效避免由于样本的不平衡性对图像隐写分析模型性能的影响,提高了模型检测的识别率和准确率。
Description
技术领域
本发明涉及计算机技术领域,更具体地涉及一种图像隐写分析方法。
背景技术
近年来,隐藏信息传输行为的数字隐写受到人们越来越多的关注,其通过隐藏信息传输行为的存在,实现信息的安全,已经被广泛应用于数字多媒体安全防护和保密通信领域。然而随着隐写技术的不断发展和推广,其在为人们的通信安全提供保障的同时,也容易被不法分子利用以获取个人利益或甚至应用于袭击活动,正因为如此,隐写分析作为一项针对隐写算法的对抗技术,逐渐受到政府和科研机构的重视。
隐写分析可以通过提取分析载体的某些特征,以确定载体中是否存在隐藏的附加信息,然后对可疑目标进行拦截。随着隐写技术的不断发展,隐写分析技术实现了从利用经验设计特征进行分析阶段逐步转化为利用深度学习方法进行分类,然而在利用深度学习设计的图像隐写分析模型中,存在样本不平衡的问题,现有技术中,一般通过神经网络提取一些特定的统计特征区分隐写图像和正常图像,虽然这些算法能够准确的分类隐写图像,但是大多数的算法都是假设训练数据集能够服从理想样本分布,即样本中的隐写图像和正常图像的比例没有比较显著的差异。然而,在现实样本中,正常图像远远多于隐写图像,当已有的这些隐写分析模型使用不平衡的样本进行训练时,模型便容易被多数类的样本所控制,从而较大的降低模型性能,容易将隐写图像误分类为一个正常图像,这将会导致秘密信息相互传递,从而造成较大损失。
发明内容
本发明所要解决的技术问题是提供一种可提高隐写图像识别率和准确率的图像隐写分析方法。
为解决上述技术问题,本发明提供一种图像隐写分析方法,包括:
采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本;
将新图像样本加入所述灰度图像样本中,构成待检测图像样本;
将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析,以判定待检测图像是否是隐写图像。
其进一步技术方案为:所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本,具体包括:
计算少数类样本中每一样本到该少数类样本中其他样本的欧式距离,以获得每一样本的k近邻样本;
根据公式对从每一样本的k近邻样本中选择的n个近邻样本进行线性插值,以形成新图像样本;其中,xnew为新图像样本,x为少数类样本,ωB和ωA分别为非轮廓区域权值和轮廓区域权值,且ωB=2ωA,xn为选择的第n个近邻样本,a为少数类样本中图像的像素的灰度值,bi为a在图像中的相邻像素的灰度值。
其进一步技术方案为:在所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本之前,还包括:
采用Focal Loss损失函数预先对图像隐写分析模型进行训练,以获得预先训练好的图像隐写分析模型。基于该设计,采用Focal Loss算法加大了识别不平衡样本中对少数类样本和困难样本的关注,优化了用于隐写分析的卷积神经网络的训练过程。
其进一步技术方案为:所述将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析,具体包括:
采用高通滤波器对待检测图像样本中的待检测图像进行残差处理;
将进行残差处理后的待检测图像进行卷积处理;
对卷积处理后的待检测图像进行特征提取,以获得特征图像;
特征图像经空间金字塔池化层处理以输出图像隐写分析特征,通过全连接层和Softmax层将图像隐写分析特征映射成分类概率,判断Softmax层的损失函数是否收敛,以判定待检测图像是否是隐写图像。
其进一步技术方案为:所述将进行残差处理后的待检测图像进行卷积处理,具体包括:将进行残差处理后的待检测图像经两种不同的深度可分离卷积模块进行卷积处理,其中,所述两种深度可分离卷积模块分别为1×1点向卷积和3 ×3深度卷积,组数均为30。
其进一步技术方案为:所述对卷积处理后的待检测图像进行特征提取,以获得特征图像,具体包括:将卷积处理后的待检测图像重复依次经卷积、批量标准化,ReLU函数非线性激活和平均池化处理,以进行特征提取,获得特征图像。
其进一步技术方案为:所述损失函数为Focal Loss损失函数。
本发明的有益技术效果在于:与现有技术相比,本发明利用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本,并加入原灰度图像样本中,以使得灰度图像样本中的多数类样本和少数类样本平衡,可有效避免由于样本的不平衡性对图像隐写分析模型性能的影响,提高了模型检测的识别率和准确率。
附图说明
图1是本发明图像隐写分析方法一具体实施例的流程示意图。
具体实施方式
为使本领域的普通技术人员更加清楚地理解本发明的目的、技术方案和优点,以下结合附图和实施例对本发明做进一步的阐述。
参照图1,图1为本发明图像隐写分析方法一具体实施例的流程示意图。在附图所示的实施例中,所述图像隐写分析方法包括:
S101、采用Focal Loss损失函数预先对图像隐写分析模型进行训练,以获得预先训练好的图像隐写分析模型。
该步骤中,所述Focal Loss损失函数FL(pt)=-αt(1-pt)γlog(pt);其中,γ为调制系数,αt为平衡因子,其中y代表样本的标签,有+1和-1两种取值,分别代正、负样本;p的取值范围为0到1,代表模型预测样本为正类的概率。
相对传统交叉熵,Focal Loss算法加大了识别不平衡样本中对少数类样本和困难样本的关注,优化了用于隐写分析的卷积神经网络的训练过程。由上式可知,如果模型对该样本预测的越准,那么模型预测的概率和实际概率的差值就越靠近0,这个样本的loss的缩小程度就越大,例如当γ=2时,如果预测概率pt为0.9,较之前的loss就要缩小100倍,若预测概率pt为0.97就会1000倍,从而减小简单样本的loss对总loss的影响,优化了用于隐写分析的卷积神经网络的训练过程,确保了识别不平衡样本中对少数类样本和困难样本的关注度。
S102、采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本。
本发明中,灰度图像样本中包括正常图像和隐写图像(载密图像),通常,正常图像远远多于隐写图像,则该步骤中,利用SMOTE算法对灰度图像样本中的隐写图像进行过采样。
具体地,该步骤包括:计算少数类样本中每一样本到该少数类样本中其他样本的欧式距离,以获得每一样本的k近邻样本;根据公式 对从每一样本的k近邻样本中选择的n个近邻样本进行线性插值,以形成新图像样本;其中,xnew为新图像样本,x为少数类样本,ωB和ωA分别为非轮廓区域权值和轮廓区域权值,且ωB=2ωA,xn为选择的第n个近邻样本,a为少数类样本中图像的像素的灰度值,bi为a在图像中的相邻像素的灰度值。
由上可知,本实施例中,SMOTE算法为针对隐写图像改进的SMOTE采样算法。可理解地,实际过采样过程中,可首先将灰度图像变换为数组数据,再通过对数组数据过采样以获得新数据样本,再对新数据样本进行恢复,获得新图像样本。下面举例对步骤S101进行详细描述,例如,当输入的图像为M×N 的灰度图像,将图像的灰度值展开成一维数组,该数组的长度为(M×N);对少数类样本即隐写图像中的每一个数组x,计算欧氏距离以求出数组x的k近邻,假设第n个近邻为xn;数组中的每个像素a在原图中的每个相邻像素bi,当存在 bi-a≥40时,设置轮廓区域权值ωA=rand(0,1),其他情况则设置非轮廓区域权值ωB=2×ωA,通过上述公式获取新数组,并将获取得到的新数组按照灰度值展开,再还原成图像,以形成新图像样本。
S103、将新图像样本加入所述灰度图像样本中,构成待检测图像样本。
该步骤中,将过采样获得的新图像样本加入至原灰度图像样本中,可使得灰度图像样本中的多数类样本和少数类样本平衡,以有效避免由于样本的不平衡性对图像隐写分析模型性能的影响。
S104、将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析,以判定待检测图像是否是隐写图像。
该步骤中,采用训练好的图像隐写分析模型对所述待检测图像进行隐写分析,根据所述图像隐写分析模型的输出判定所述待检测图像是否为隐写图像。
具体地,该步骤包括:采用高通滤波器对待检测图像样本中的待检测图像进行残差处理;将进行残差处理后的待检测图像进行卷积处理;对卷积处理后的待检测图像进行特征提取,以获得特征图像;特征图像经空间金字塔池化层处理以输出图像隐写分析特征,通过全连接层和Softmax层将图像隐写分析特征映射成分类概率,判断Softmax层的FocalLoss损失函数是否收敛,以判定待检测图像是否是隐写图像。
本实施例中,所述将进行残差处理后的待检测图像进行卷积处理,具体包括:将进行残差处理后的待检测图像经两种不同的深度可分离卷积模块进行卷积处理,其中,所述两种深度可分离卷积模块分别为1×1点向卷积和3×3深度卷积,组数均为30;即进行残差处理后的待检测图像分别经30组1×1点向卷积和30组3×3深度卷积;而所述对卷积处理后的待检测图像进行特征提取,以获得特征图像,具体包括:将卷积处理后的待检测图像重复依次经卷积、批量标准化(BN),ReLU函数非线性激活和平均池化处理,以进行特征提取,获得特征图像,该步骤中,依次重复四次卷积批量标准化(BN),ReLU函数非线性激活和平均池化处理。
可理解地,本发明中步骤S104的具体处理分析流程与Zhu-Net分析模型中的隐写分析流程类似,本发明中用的Focal Loss损失函数代替Zhu-Net分析模型中的交叉熵函数,增加了对于不同样本赋予不同的权重,使得神经网络提高对少数类样本和难分样本的关注度。
综上所述,本发明提供的图像隐写分析方法,通过改进的SMOTE采样算法和FocalLoss损失函数可以分别在数据层面上对不平衡的少数数据进行线性插值的生成,完成过采样,进而解决数据的不平衡分布,同时,通过对调制系数和平衡因子的设置,可以在算法层面上进一步对不平衡数据在模型的影响进行改善,既能够有效避免由于样本的不平衡性对图像隐写分析模型性能的影响,同时通过加大对难分样本的关注度提高了模型检测的准确率,可理解地,在不平衡样本隐写分析的精度普遍优于Zhu-Net分析模型,且通过在BOSSbase1.01 数据集上的仿真测试,结果表明在该不平衡样本集训练下,检出率显著高于同类的Zhu-Net分析模型,平均检出率提高0.9%-1.9%。
以上所述仅为本发明的优选实施例,而非对本发明做任何形式上的限制。本领域的技术人员可在上述实施例的基础上施以各种等同的更改和改进,凡在权利要求范围内所做的等同变化或修饰,均应落入本发明的保护范围之内。
Claims (8)
1.一种图像隐写分析方法,其特征在于,所述图像隐写分析方法包括:
采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本;
将新图像样本加入所述灰度图像样本中,构成待检测图像样本;
将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析,以判定待检测图像是否是隐写图像。
3.如权利要求1所述的图像隐写分析方法,其特征在于,在所述采用SMOTE算法对灰度图像样本中的少数类样本进行过采样,以获得新图像样本之前,还包括:
采用FocalLoss损失函数预先对图像隐写分析模型进行训练,以获得预先训练好的图像隐写分析模型。
5.如权利要求1所述的图像隐写分析方法,其特征在于,所述将待检测图像样本中的待检测图像输入预先训练好的图像隐写分析模型中进行处理分析,具体包括:
采用高通滤波器对待检测图像样本中的待检测图像进行残差处理;
将进行残差处理后的待检测图像进行卷积处理;
对卷积处理后的待检测图像进行特征提取,以获得特征图像;
特征图像经空间金字塔池化层处理以输出图像隐写分析特征,通过全连接层和Softmax层将图像隐写分析特征映射成分类概率,判断Softmax层的损失函数是否收敛,以判定待检测图像是否是隐写图像。
6.如权利要求5所述的图像隐写分析方法,其特征在于,所述将进行残差处理后的待检测图像进行卷积处理,具体包括:将进行残差处理后的待检测图像经两种不同的深度可分离卷积模块进行卷积处理,其中,所述两种深度可分离卷积模块分别为1×1点向卷积和3×3深度卷积,组数均为30。
7.如权利要求5所述的图像隐写分析方法,其特征在于,所述对卷积处理后的待检测图像进行特征提取,以获得特征图像,具体包括:将卷积处理后的待检测图像重复依次经卷积、批量标准化,ReLU函数非线性激活和平均池化处理,以进行特征提取,获得特征图像。
8.如权利要求5所述的图像隐写分析方法,其特征在于,所述损失函数为Focal Loss损失函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210692375.3A CN114972886A (zh) | 2022-06-17 | 2022-06-17 | 一种图像隐写分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210692375.3A CN114972886A (zh) | 2022-06-17 | 2022-06-17 | 一种图像隐写分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114972886A true CN114972886A (zh) | 2022-08-30 |
Family
ID=82963482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210692375.3A Pending CN114972886A (zh) | 2022-06-17 | 2022-06-17 | 一种图像隐写分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114972886A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117332082A (zh) * | 2023-09-19 | 2024-01-02 | 北京邮电大学 | 基于聚类和集成学习的不平衡语言隐写分析方法及装置 |
-
2022
- 2022-06-17 CN CN202210692375.3A patent/CN114972886A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117332082A (zh) * | 2023-09-19 | 2024-01-02 | 北京邮电大学 | 基于聚类和集成学习的不平衡语言隐写分析方法及装置 |
CN117332082B (zh) * | 2023-09-19 | 2024-06-11 | 北京邮电大学 | 基于聚类和集成学习的不平衡语言隐写分析方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109035149B (zh) | 一种基于深度学习的车牌图像去运动模糊方法 | |
CN110048827B (zh) | 一种基于深度学习卷积神经网络的类模板攻击方法 | |
CN109492026B (zh) | 一种基于改进的主动学习技术的电信欺诈分类检测方法 | |
CN108847223B (zh) | 一种基于深度残差神经网络的语音识别方法 | |
JP4697670B2 (ja) | 識別用データ学習システム、学習装置、識別装置及び学習方法 | |
CN111507884A (zh) | 一种基于深层卷积神经网络的自适应图像隐写分析方法及系统 | |
CN113806746B (zh) | 基于改进cnn网络的恶意代码检测方法 | |
CN108596818B (zh) | 一种基于多任务学习卷积神经网络的图像隐写分析方法 | |
CN110968845B (zh) | 基于卷积神经网络生成的针对lsb隐写的检测方法 | |
CN110826060A (zh) | 物联网恶意软件的可视化分类方法、装置与电子设备 | |
CN110570433A (zh) | 基于生成对抗网络的图像语义分割模型构建方法和装置 | |
CN112115967B (zh) | 一种基于数据保护的图像增量学习方法 | |
CN113779581B (zh) | 一种轻量化高精度恶意软件识别模型的鲁棒检测方法及系统 | |
CN112884061A (zh) | 一种基于参数优化元学习的恶意软件家族分类方法 | |
CN111222583B (zh) | 一种基于对抗训练与关键路径提取的图像隐写分析方法 | |
CN116910752A (zh) | 一种基于大数据的恶意代码检测方法 | |
CN114972886A (zh) | 一种图像隐写分析方法 | |
CN115393698A (zh) | 一种基于改进dpn网络的数字图像篡改检测方法 | |
CN111815526A (zh) | 基于图像滤波和cnn的有雨图像雨条纹去除方法及系统 | |
Yu et al. | A multi-task learning CNN for image steganalysis | |
CN114299305A (zh) | 聚合密集和注意力多尺度特征的显著性目标检测算法 | |
CN113919401A (zh) | 基于星座图特征的调制类型识别方法、装置、计算机设备 | |
CN114022914A (zh) | 基于融合深度网络的掌纹识别方法 | |
CN111291712B (zh) | 基于插值的cn和胶囊网络的森林火灾识别方法及装置 | |
CN112560034A (zh) | 基于反馈式深度对抗网络的恶意代码样本合成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |