CN112950445A - 图像隐写分析中基于补偿的检测特征选择方法 - Google Patents

图像隐写分析中基于补偿的检测特征选择方法 Download PDF

Info

Publication number
CN112950445A
CN112950445A CN202110265150.5A CN202110265150A CN112950445A CN 112950445 A CN112950445 A CN 112950445A CN 202110265150 A CN202110265150 A CN 202110265150A CN 112950445 A CN112950445 A CN 112950445A
Authority
CN
China
Prior art keywords
feature
characteristic
separability
image
secret
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110265150.5A
Other languages
English (en)
Other versions
CN112950445B (zh
Inventor
马媛媛
于鑫泉
徐久成
刘栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Normal University
Original Assignee
Henan Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Normal University filed Critical Henan Normal University
Priority to CN202110265150.5A priority Critical patent/CN112950445B/zh
Publication of CN112950445A publication Critical patent/CN112950445A/zh
Application granted granted Critical
Publication of CN112950445B publication Critical patent/CN112950445B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/0021Image watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明属于图像隐写检测技术领域,特别涉及一种图像隐写分析中基于补偿的特征选择方法,针对收集到的载体图像,利用隐写算法生成不同嵌入率的载密图像,并提取载密图像一维步态隐写检测特征;度量每个隐写检测特征分量的可分性,根据隐写检测特征分量可分性值对所有隐写检测特征分量进行降序排序;根据可分性排序结果构建候选特征向量,并度量每个候选特征向量可分性;选取可分性值最大的候选特征向量作为局部最优特征向量,利用补选策略向局部最优特征向量中添加特征分量来获取最终选取的特征。本发明提高检测效率,不需要依赖分类器的结果选取特征,同时检测正确率相对较高,适用于图像隐写检测特征选取。

Description

图像隐写分析中基于补偿的检测特征选择方法
技术领域
本发明属于图像隐写检测技术领域,特别涉及一种图像隐写分析中基于补偿的特征选择方法。
背景技术
随着多媒体技术的飞速发展,数字图像已经成为隐蔽通信的重要载体。隐写者们利用图像隐写技术将秘密信息嵌入图像中,通过公共渠道传递隐写图像,实现了秘密通信。隐写检测是为了检测图像中是否藏有秘密信息,并揭示相应隐写方法的缺点,从而维护网络信息安全和社会稳定。随着图像自适应隐写技术的高速发展,传统的隐写检测方法已经无法应对图像自适应隐写方法的挑战,于是,近年来涌现出大量新的图像隐写检测方法。这些图像高维隐写检测方法为了更加有效地捕获嵌入变化,尽可能多地从不同尺度和方向提取特征子集,造成了隐写检测特征的维数不断升高,最终导致特征提取时间、分类检测计算量和特征存储空间的不断增加。于是,研究者们提出了特征选取方法,以达到降低图像高维隐写检测特征维数,进而减轻分类器的压力,缩短提取特征和分类训练时间的目的。而现有的图像高维隐写检测特征选取方法都需要对高维隐写检测特征进行反复选取,然后训练分类器对载密图像进行检测,最终根据检测结果衡量选取特征的优劣。这种对高维隐写检测特征的反复选取和分类器的反复训练造成了较大的计算和时间开销,难以在实际中推广和应用。
发明内容
为此,本发明提供一种图像隐写分析中基于补偿的特征选择方法,解决在保持图像隐写检测特征检测正确率条件下对其进行大幅度降维,提升隐写检测技术的实际推广应用。
按照本发明所提供的设计方案,一种图像隐写分析中基于补偿的特征选择方法,包含如下内容:
针对收集到的载体图像,利用隐写算法生成不同嵌入率的载密图像,并提取载密图像一维步态隐写检测特征;
度量每个检测特征分量的可分性,并根据每个检测特征分量可分性值对所有检测特征分量进行降序排序;
构建候选特征向量,根据可分性排序结果选取排名第一的特征分量作为初始候选特征向量,并在排序结果中删除此特征,依次将排序结果中的第一个特征分量添加至前一个候选特征向量以形成新的候选特征向量;
度量每个候选特征向量的可分性,选取可分性值最大的候选特征向量作为局部最优特征向量。利用轮特征补偿策略向局部最优特征向量中添加特征分量来获取最终选取的特征向量。
作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,利用基于失真函数的图像隐写算法分别生成不同嵌入率的载密图像。
作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,对不同嵌入率下载密图像的检测特征进行统计分析,基于类间间距、类内间距和类内距离差异的特征分量可分性准则来度量每个检测特征分量的可分性。
作为本发明图像隐写分析中基于补偿的检测特征选择方法,进一步地,假设s+(fi)和s-(fi)分别表示特征分量fi在载体图像和载密图像的方差,使用
Figure BDA0002972157960000021
Figure BDA0002972157960000022
来表示特征分量在载体特征与载密特征的类内距离差异。
作为本发明图像隐写分析中基于补偿的检测特征选择方法,进一步地,选取
Figure BDA0002972157960000023
Figure BDA0002972157960000024
两者中的最大值来表示特征分量在载体特征与载密特征的类内距离差异。
作为本发明图像隐写分析中基于补偿的检测特征选择方法,进一步地,利用自然对数函数均衡
Figure BDA0002972157960000025
Figure BDA0002972157960000026
依据均衡后的数据来表示特征分量在载体特征与载密特征的类内距离差异。
作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,每个检测特征分量可分性的度量公式表示为:
Figure BDA0002972157960000027
其中,m+(fi)和m-(fi)分别表示第i个特征分量fi在载体图像类与载密图像类的均值,(m+(fi)-m-(fi))2表示第i个特征分量fi在载体图像类与载密图像类的类间距离,s+ 2(fi)+s- 2(fi)表示特征分量第i个特征分量fi在载体图像类与载密图像类的类内距离。
作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,基于类间距离、类内距离和整体类内差异的特征向量可分性准则从候选特征向量中选出局部最优特征向量。
作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,特征向量可分性度量包含如下内容:首先选取可分性值最大的特征分量作为初始候选特征向量,迭代计算当前轮次内相应特征分量的载体特征及载密特征两者的方差和均值;在迭代中内嵌循环计算特征分量的载体特征及载密特征两者的方差和均值;通过特征分量整体类内距离差异度量候选特征向量的可分性值;兵选取可分性值最大的候选特征向量作为局部最优特征向量。
作为本发明图像隐写分析中基于补偿的特征选择方法,进一步地,利用特征补偿策略获取最终选取的特征向量,包含如下内容:依据每个特征分量被选中概率及其累计概率,并累计概率与产生的随机数进行比较来旋固特征分量;重复执行直至达到最大执行次数,将选取的特征分量加入局部最优特征向量中形成最终选择的特征。
本发明的有益效果:
本发明通过对隐写检测特征进行选取,使特征子集的势(集合元素的个数)显著低于原始特征的维数,从而减少提取特征所需的时间,而且低维数的特征相比高维特征能明显减轻分类器的压力,缩短分类器处理的时间,故基于约简的特征进行隐写检测能够显著提高检测效率;且,不需要依赖具体的提取算法,实现简单和时间复杂度低,可适用于图像隐写检测特征的选取,具有较好的应用前景。
附图说明:
图1为实施例中图像隐写分析中基于补偿的隐写检测特征选择流程示意;
图2为实施例中新特征向量可分性的度量流程示意;
图3为实施例中基于补偿的隐写检测特征选择整体流程示意;
图4为实施例中选取前后GFR特征的检测正确率对比实验结果示意;
图5为实施例中与Fisher-based算法的对比实验结果示意;
图6为实施例中对不同嵌入率下其它隐写检测特征的对比实验结果示意。
具体实施方式:
为使本发明的目的、技术方案和优点更加清楚、明白,下面结合附图和技术方案对本发明作进一步详细的说明。
现有的图像高维隐写检测特征选取方法中,无论是基于通用评价准则还是基于特定评价准则,都需要对高维隐写检测特征进行反复选取,然后训练分类器对载密图像进行检测,最终根据检测结果衡量选取特征的优劣。这种对高维隐写检测特征的反复选取和分类器的反复训练造成了较大的计算和时间开销,难以在实际中推广和应用。另外,即使针对隐写检测特征的专门评价准则也不能保证评价结果的绝对准确,即不能够绝对准确地反映相应特征分量对检测载密图像的贡献。这将导致部分有用的特征分量因度量值较小而没能被选取出来,使得选取后的特征向量无法包含对检测载密图像有用的所有信息,导致其对载密图像的检测正确率下降或者无法达到最佳。为了能够进一步降低隐写检测特征的维数,提高其对载密图像的检测正确率,同时提高特征选取的速度,本发明实施例,提供一种图像隐写分析中基于补偿的检测特征选择方法,参见图1所示,包含如下内容:
S101、针对收集到的载体图像,利用隐写算法生成不同嵌入率的载密图像,并提取载密图像一维步态隐写检测特征;
S102、度量每个特征分量的可分性,并根据每个特征分量可分性值对所有特征分量进行降序排列;
S103、构建候选特征向量,根据可分性排序结果选取排名第一的特征分量作为初始候选特征向量,并在排序结果中删除此特征,依次将排序结果中的第一个特征分量添加至前一个候选特征向量以形成新的候选特征向量,并度量每个候选特征向量可分性;
S104、选取可分性值最大的候选特征向量作为局部最优候选特征向量,利用特征补偿策略向局部最优特征向量中添加特征分量以获取最终选取的特征向量。
鉴于特征中存在大量类间距离较小但类内距离较大的特征分量,而这部分特征分量又经常被误判为无用特征,导致最终选取的特征对载密图像的检测正确率不高;本案实施例中,通过度量每个检测特征分量的可分性和候选特征向量可分性来获取局部最优特征向量,降低隐写检测特征的维数、减少运算时间以及提高对载密图像的检测正确率。
作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,利用基于失真函数的图像隐写算法分别生成不同嵌入率的载密图像。例如,对Bossbase-1.01数据库中10000幅512×512的灰度图像,先将其转换成质量因子为95的JPEG载体图像,再利用SI-UNIWARD隐写算法分别生成嵌入率为0.1,0.25,0.5,0.8,1.0的载密图像,对载体和载密图像分别提取GFR隐写检测特征。
作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,对不同嵌入率下载密图像特征进行统计分析,发现当|m+(fi)-m-(fi)|<5×10-4时,存在大量特征分量满足
Figure BDA0002972157960000041
Figure BDA0002972157960000042
具体个数如表1所示:
表1GFR特征中满足条件的特征分量统计表
Figure BDA0002972157960000043
(注,Δm代表|m+(fi)-m-(fi)|<5×10-4,σ1代表
Figure BDA0002972157960000044
σ2代表
Figure BDA0002972157960000045
.)
在表1中,m+(fi)和m-(fi)分别表示第i个特征分量fi在载体图像类和载密图像类的均值,s+(fi)和s-(fi)分别表示第i个特征分量fi在载体图像类和载密图像类的方差。当Δm时,传统的准则并没有对此类数据作特殊处理,即没有考虑此类特征分量的载体特征方差与载密特征方差差异较大时对特征分量可分性的影响,使得大量的特征分量可分性为零,成为“无用特征分量”。然而,这部分特征分量在GFR中占相当大的比重,无法忽视其对检测载密图像的作用。而这部分“无用特征分量”被删除,可能导致载密图像的检测正确率下降。可见,仅当类间距离为零的“无用特征分量”并不一定对检测载密图像无用。由于模式识别中将“类内距离差异”也作为衡量特征分量可分性原则之一,因此,可令s+(fi)和s-(fi)分别表示fi在载体图像和载密图像的方差,二者都能够表示特征分量在载体图像和载密图像中的类内距离,但为避免误删有用的特征分量,单独考虑了特征分量的类内距离差异,即
Figure BDA0002972157960000046
Figure BDA0002972157960000047
虽然
Figure BDA0002972157960000048
Figure BDA0002972157960000049
均能表示特征分量在载体特征与载密特征的类内差异,但若同时选取
Figure BDA00029721579600000410
Figure BDA00029721579600000411
作为衡量标准,可能反而会缩小类内差异值,使特征分量可分性值不准确。可通过例1进行详细说明。
例1:假设存在两个特征分量fi和fk,其中,fi的载体特征方差s+(fi)=1,载密特征方差s-(fi)=4,fk的载体特征方差s+(fi)=1,载密特征方差s-(fi)=3。
若同时选取
Figure BDA00029721579600000412
Figure BDA00029721579600000413
作为衡量标准,则fi的类内距离差异为
Figure BDA00029721579600000414
而fk的类内距离差异为
Figure BDA00029721579600000415
此时fi和fk的差异为
Figure BDA00029721579600000416
若选择二者中的最大值作为衡量标准,则fi类内距离差异为4,而fk的类内距离差异为3,此时fi和fk的差异为1。
由例1可知,只需选取二者中的最大值即可表示类内距离的差异,于是将
Figure BDA0002972157960000051
作为可分性准则的一部分。另外,当Δm时,由于隐写检测特征分量的均值较小,
Figure BDA0002972157960000052
Figure BDA0002972157960000053
的值可能会过大,导致载体特征与载密特征的均值差异被湮没,从而无法凸显类间距离的主导作用,影响对载密图像的检测结果。故在这里可利用自然对数函数均衡
Figure BDA0002972157960000054
Figure BDA0002972157960000055
的值,使其不至于过大,却还能体现出特征分量在载体图像类与载密图像类的类内距离差异。综上,基于类间距离、类内距离和类内距离差异的特征分量可分性准则为(Cscore):
Figure BDA0002972157960000056
其中1≤i≤N,m+(fi)和m-(fi)分别表示第i个特征分量fi在载体图像类与载密图像类的均值,s+(fi)和s-(fi)分别表示第i个特征分量fi在载体图像类与载密图像类的方差。(m+(fi)-m-(fi))2表示第i个特征分量fi在载体图像类与载密图像类的类间距离,s+ 2(fi)+s- 2(fi)表示特征分量第i个特征分量fi在载体图像类与载密图像类的类内距离。
Figure BDA0002972157960000057
能够度量Δm的情况下特征分量的可分性。这里,Cscore(fi)的值越大,说明该特征分量的可分性越好,对检测载密图像越有用。
作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,基于类间距离、类内距离和最大类内差异的特征向量可分性准则从候选特征向量中选出局部最优特征向量。进一步地,特征向量可分性度量包含如下内容:首先选取可分性值最大的特征分量作为初始候选特征向量,迭代计算当前轮次内相应特征分量的载体特征及载密特征两者的方差和均值;在迭代中内嵌循环计算特征分量的载体特征及载密特征两者的方差和均值;并结合特征分量的最大类内差异获取候选特征向量的可分性值;选取可分性值最大的候选特征向量作为局部最优特征向量。
Cscore(fi)的值能够衡量隐写检测特征分量的可分性,却无法度量特征向量的可分性,即无法为特征选取提供直接的选取依据。为考虑新加入的特征分量与当前候选特征向量中每个特征分量的关系。假设第i个特征分量fi是刚加进来的,要衡量当前特征向量的可分性,最重要的就是衡量新加进来的特征分量与当前候选特征向量中每个特征分量的差异,可利用
Figure BDA0002972157960000058
衡量第j个特征分量fj与第i个特征分量fi的类内距离差异,于是有
Figure BDA0002972157960000059
用于衡量新加进来的第i个特征分量与第i个候选特征向量中所有特征分量的差异,具体过程如图2所示。为了从候选特征向量中选出局部最优特征向量,本案中基于类间距离、类内距离和最大类内差异的特征向量可分性准则(Vscore):
Figure BDA0002972157960000061
其中1≤i≤N,1≤j≤i,m+(fj)和m-(fj)分别表示第j个特征分量fj在载体图像类与载密图像类的均值,s+(fj)和s-(fj)分别表示第j个特征分量fj在载体图像类和载密图像类的方差,(m+(fj)-m-(fj))2表示第j个特征分量fj在载体特征与载密特征的类间距离,(s+(fj))2+(s-(fj))2表示特征分量第j个特征分量fj在载体特征与载密特征的类内距离;s+(fi)和s-(fi)分别表示第i个特征分量fi在载体图像类和载密图像类的方差,
Figure BDA0002972157960000062
用于衡量新加进来的第i个特征分量与第i个候选特征向量中所有特征分量的差异。这里,Vscore(fi)的值越大,则说明该特征向量的可分性越好,即此特征向量的对载密图像的检测正确率相对较高。
特征向量可分性度量算法过程可设计为如算法1所示:
Figure BDA0002972157960000063
根据算法1,可以构建出N个候选特征向量,并度量出每个特征向量的可分性,为选取局部最优特征向量提供直接依据。
作为本发明实施例中图像隐写分析中基于补偿的特征选择方法,进一步地,利用特征补偿策略获取最终选取的特征,包含如下内容:依据每个特征分量被选中概率及其累计概率,并累计概率与产生的随机数进行比较来旋固特征分量;重复执行直至达到最大执行次数,将选取的特征分量加入局部最优特征向量中以形成最终选取的特征。
虽然特征分量可分性准则尽可能准确地度量特征分量的可分性,但都无法完全度量准确,导致可能存在特征分量可分性值较小,但却对提高载密图像检测正确率“有用”的并未被选取的特征分量。因此,本案实施例中在获得局部最优特征向量后,考虑利用特征补偿策略补选一部分可分值小但可能有用的特征分量,与局部最优特征向量共同形成最终选取的特征。特征补偿策略基本思想是:每个个体被选中的概率与其适应度函数值成正比。假设群体大小为N,个体i的适应度函数值为Ci,综上,第i个特征分量被选中的概率Pi为:
Figure BDA0002972157960000071
利用特征补偿策略补选一部分有用却未被选择的特征分量,将这部分特征分量与局部最优特征向量结合,形成最终选取的特征。具体过程如下:
(1)利用公式(3)计算每个特征分量被选中的概率,在公式中,N代表剩余特征分量的数量,Ci等于剩余特征分量中fi的可分性值,即Cscore(fi)。
(2)利用公式
Figure BDA0002972157960000072
计算每个特征分量的累计概率。
(3)产生一个[0,10000]区间内的随机数r。
(4)若r≤Q1,则说明选中的是第一个特征分量;若r≤Qj,则说明选中的是第j个特征分量;若Qj<r<Qj+1则选中的是第j+1个特征分量。(这里需要标记选择过的特征分量,使得不会重复加入同一特征分量)
重复执行(3)、(4)K次,将选取的特征分量加入局部最优特征向量中。这里的K表示特征补偿次数。
本案实施例中,首先,利用特征分量可分性准则度量每个特征分量的可分性;再根据每个特征分量的可分性值对所有特征分量进行降序排列;其次,根据特征分量的排序结果,每次向候选特征向量中添加一维特征分量,形成一个新的候选特征向量;接着,利用特征向量可分性准则度量每个候选特征向量的可分性;然后,选取可分性值最大的候选特征向量作为局部最优特征向量;最后,利用特征补偿策略向局部最优特征向量中添加一部分特征分量,形成最终选取的特征。参见图3所示算法的主要步骤如下:
(1)归一化特征值。利用
Figure BDA0002972157960000073
对Rich Model隐写检测特征进行归一化处理。
(2)度量特征分量可分性。根据步骤(1)中归一化后每个特征分量的载体特征和载密特征,利用特征分量可分性准则度量每个特征分量的可分性。
(3)处理异常数据。对特征分量可分性值为NAN的数据进行处理,使其可分性值为0。
(4)降序排列特征分量。根据步骤(2)中的特征分量可分性值对所有特征分量进行降序排序得ST=[f1',f2',…,fi',…,fN]。
(5)构建候选特征向量。初始化,选取可分性值最大的特征分量作为第一个候选特征向量即V1=f1',令第一个候选特征向量的可分性值Vscore(V1)=0,接着,每次选择步骤(3)中的第一个特征分量,将其加到前一个候选特征向量中,形成新的当前候选特征向量,并在排序的结果中删除该特征分量,重复N-1次,最终得到N个候选特征向量。
(6)度量特征向量可分性。利用公式(2)计算步骤(5)中每个候选特征向量的可分性值。
(7)选取局部最优特征向量。选取步骤(6)中特征向量可分性值最大的候选特征向量,将其作为局部最优特征向量。
(8)计算剩余特征分量被选中概率。将特征分量可分性值作为轮盘赌算法的适应度函数的结果,根据公式(3)计算每个特征分量被选中的概率。
(9)计算累加概率。根据步骤(8)中剩余的每个特征分量被选中的概率,计算剩余特征分量中前i个特征分量被选中的累加概率Qi
(10)补选特征分量。随机生成一个随机数r,通过比较随机数r与累计概率Qi的大小,确定选中的特征分量,将其添加到局部最优特征向量中,形成新的局部最优特征向量,并标记该特征分量已被选取过,使其不会因为再次被选到而重复加入局部最优特征向量中,造成冗余。
(11)选取最优特征向量。选取步骤(10)中最后一个局部最优特征向量作为最终选择的特征。
Fc=[f1 c,f2 c,…,fN c]和Fs=[f1 s,f2 s…,fN s]分别表示载体特征和载密特征;[f1 c,f2 c,…,fi c,…,fN-1 c,fN c]和[f1 s,f2 s,…,fi s,…,fN-1 s,fN s]分别表示归一化后的载体特征和载密特征;m+(fi c)和m-(fi s)分别表示特征分量fi在载体图像类和载密图像类的均值;(m+(fi)-m-(fi))2表示特征分量fi的类间距离;s+(fi c)和s-(fi s)分别表示特征分量fi在载体图像类和载密图像类的方差;s+ 2(fi)+s- 2(fi)表示特征分量fi的类内距离;Cscore(fi)表示第i个特征分量的可分性值,可利用公式(1)计算;[f1',f2',…,fi',…,fN-1',fN']表示特征分量排序后的结果;Vi表示第i个候选特征向量;Vscore(fi)表示第i个候选特征向量的可分性值,可用公式(2)计算;Vscore(Vn)表示局部最优特征向量,其中Vn=[f1',f2',…,fn-1',fn'];[fn+1',fn+2',…,fN-1',fN']表示未被选取的特征分量;[P1,P2,…PN-n-1,PN-n]表示[fn+1',fn+2',…,fN-1',fN']中对应特征分量被选择的概率,可用公式(3)计算;K表示特征补偿次数;[fj1',fj2',…,fjk']表示利用特征补偿策略补选的特征分量;[f1',f2',…,fn-1',fn',fj1',fj2',…,fjk']表示最终选取的特征。特征分量可分性准则和特征向量可分性准则明显降低了图像隐写检测特征的维数;特征补偿策略通过补选一部分特征分量,提高了对载密图像的检测正确率。其中,基于补偿的隐写检测特征选方法可设计为如算法2所示的内容:
Figure BDA0002972157960000081
Figure BDA0002972157960000091
根据算法2,可将其分解为归一化处理、度量分量可分性并处理异常数据、降序排列特征分量、构建候选特征向量并度量其可分性、选取局部最优特征向量、计算剩余特征分量被选中的概率、计算累加概率、补选特征分量以及确定被选取的特征这九个部分。对九个部分进行分析,得到每个部分的时间复杂度、作用和包含的步骤具体如表2所示:
表2时间复杂度分析表
Figure BDA0002972157960000092
在表2中,由于每个部分间都是线性独立的,不存在嵌套关系,故算法2的时间复杂度与时间复杂度最大的那部分相等,即O((N-1)(N+2)/2);而现有的依赖集成分类器结果的选取方法,其时间复杂度取决于集成分类器的时间复杂度,即
Figure BDA0002972157960000101
其中,L为集成分类器中分类器个数,Ntrn为训练集中图像样本的个数,dsub为被测试特征集合中特征的维数,如Steganalysis-α方法利用FLD集成分类器,其时间复杂度为
Figure BDA0002972157960000102
其中m为循环次数。综上可以看出,本案方法的时间复杂度O((N-1)(N+2)/2),明显低于依赖集成分类器方法的时间复杂度。
为进一步验证本案方案有效性,下面结合试验数据做进一步解释说明:
由于篇幅限制,我们以GFR特征为例在Matlab R2016b中进行了特征选取实验,采用的图像来自BOSSbase-1.01图像库,其中包含10000幅512×512的灰度图像。首先,采用SI-UNIWARD隐写算法进行隐写,构建嵌入率分别为0.1,0.25,0.5,0.8,1.0的、质量因子为95的JPEG载密图像库,共得到一组载体图像和五组载密图像。然后,使用GFR特征选取算法(17000-D)对其提取特征。最终,得到包括10000×6=60000幅图像的GFR隐写检测特征库。在训练和分类过程中,继续沿用FLD集成分类器对样本数据进行训练和测试,该集成分类器中的错误率由虚警率和误报率组成。
Figure BDA0002972157960000103
这里PFA表示虚警率,PMD表示误报率,
Figure BDA0002972157960000104
其中
Figure BDA0002972157960000105
表示平均检测错误率,
Figure BDA0002972157960000106
表示平均检测正确率。在进行检测效果的分析比较时,从每组图像样本中随机选取5000幅相对应的载体和载密图像进行训练,剩余5000幅用于测试,重复试验10次,计算10次结果的平均值作为最终结果。实验主要包括三个方面:(1)与原始特征的对比实验;(2)与Fisher-based方法的对比实验;(3)与Steganalysis-α方法的对比实验。
一、与原始特征的对比实验
对提取的17000维GFR隐写检测特征进行实验,首先,归一化处理数据;其次,根据Cscore准则度量每个特征分量的可分性;接着,根据Cscore(fi)的值进行降序排列,得到ST=[f1',f2',…,fi',…,fN];然后,选取可分值最大的特征分量作为初始候选特征向量即V1=f1',同时令第一个候选特征向量的可分性值Vscore(V1)=0;之后,每次将排序结果中的第一个特征分量删除,并添加到前一个候选特征向量中,形成新的候选特征向量,并计算新候选特征向量的可分性;最终将得到N个候选特征向量的可分性值,从中选择可分性值最大的候选特征向量作为局部最优特征向量;最后,利用特征补偿策略,补选K个特征分量并与局部最优特征向量相结合形成最终选择的特征。对于K值的确定,通过尝试多次试验,对比选取后的特征维数和检测正确率,确定K=850。
为直观了解SRFS方法对GFR特征的选取效果,将SRFS方法选取后的特征与GFR原始特征进行对比实验,检测其对载密图像的检测正确率,实验结果如图4所示,可知,SRFS方法明显提高了GFR特征的检测正确率,特别是当嵌入率低时,结果越明显。如当嵌入率=0.1时,SRFS选取后的特征的检测正确率为0.5240,GFR原始特征的检测正确率为0.5168,SRFS的检测正确率比原始特征检测正确率提高了0.72%;当嵌入率为0.25时,SRFS选取后的特征的检测正确率为0.5237,GFR原始特征的检测正确率为0.5205,SRFS选取后的特征对载密图像的检测正确率比原始特征检测正确率提高了0.32%。
选取后,随着特征维数的大幅度下降,选取后特征占用的存储空间也随之明显下降。随后,10000幅GFR隐写检测特征选取前后的存储空间进行了对比实验,具体结果表3所示,表3是SRFS方法与原始特征的存储空间对比,从表中可以看到,SRFS方法明显减少了存储空间,如当嵌入率为0.1时,节省了0.6833GB,节省比例为59.59%;当嵌入率为1.0时,节省了0.7521GB,节省比例为65.54%。
表3 SRFS方法与原始特征的存储空间对比表(17000-D)
Figure BDA0002972157960000111
二、与Fisher-based方法的对比实验
Fisher-based是一种简单有效的特征选取方法,具有判别方法简单、对总体的分布没有特定要求、应用广泛等优点。其过程如下:首先利用均值和标准差度量每个特征分量的可分性值。其次,按照特征分量可分性值对特征分量进行降序排序。接着,度量特征向量的可分性。最后,选取可分性值最大的候选特征向量作为最终选取的特征向量。SRFS方法与Fisher-based方法在不同嵌入率下的检测效果如图5所示,在不同嵌入率下,SRFS方法与Fisher-based方法对GFR隐写检测特征的对比实验图。图中,横轴代表特征维数,纵轴代表检测正确率,每一条线代表一个嵌入率,自上而下,嵌入率分别为1.0,0.8,0.5,0.25,0.1,图中红点代表SRFS方法的结果,蓝点代表Fisher-based方法的结果,绿点代表GFR原始特征的结果。由图5可知,SRFS方法在显著降低特征维数的同时,还进一步提高了检测正确率,实验效果普遍优于Fisher-based方法。
三、与Steganalysis-α方法的对比实验
Steganalysis-α方法的过程如下:首先,对数据进行归一化处理,构建决策表;其次,计算每个特征分量的均值和标准差,进而计算每个特征分量的属性可分性值;然后,设置属性可分性值阈值,删除可分性值低的特征分量;最后划分步长,构建若干候选特征向量,约简特征,选取分类效果好并且位数较低的候选特征向量作为最终选取的特征向量。SRFS方法与Steganalysis-α的对比实验结果如表4所示,可知,在不同的嵌入率下,利用SRFS方法选取后的特征维数都比利用Steganalysis-α方法选取的特征维数低得多,并且SRFS方法的检测正确率优于或基本等于Steganalysis-α方法选取后特征对载密图像的检测正确率。如当嵌入率=0.1时,Steganalysis-α方法得到的特征维数是15493,检测正确率是0.5168,而SRFS方法得到的特征维数是8565,检测正确率是0.5240,不仅进一步降低了6928维,检测正确率还进一步提高了0.71%;同时,在不同的嵌入率下,SRFS方法特征选取的时间均远远低于Steganalysis-α特征选取的时间。如当嵌入率=0.1时,SRFS方法选取特征花费的时间为0.0342小时,而Steganalysis-α选取特征的时间为43.12小时,Steganalysis-α方法的时间是SRFS方法时间的1261倍。由此可知,SRFS方法极大地提升了隐写检测特征选取的速度。
表4 SRFS方法与Steganalysis-α方法的对比实验结果
Figure BDA0002972157960000112
Figure BDA0002972157960000121
通过上述内容可说明本案方案SRFS方法的有效性和快速性,基于以上实验数据可进一步验证本案对降低GFR隐写检测特征的维数、减少运算时间以及提高对载密图像的检测正确率是非常有效的。本案方案同样对其他隐写特征也有很好的检测效果。参见图6所示,(a)-(f)分别表示GFR特征(SI-UNIWARD隐写)、DCTR特征(SI-UNIWARD隐写)、DCTR特征(nsF5隐写)、SRM特征(S-UNIWARD隐写)、CC-JRM特征(J-UNIWARD隐写)、CC-PEV特征(SI-UNIWARD隐写)。例如CCPEV特征(SI-UNIWARD),如图6中(f)所示,当Payload=0.2时,本案SRFS选择特征的检测正确率为0.5235,未使用特征补偿策略OSC选择特征的检测正确率为0.5228,原始特征的检测正确率为0.5181。结果表明,本案方案SRFS方法的检测正确率比原始特征检测正确率提高了0.54%,维数降低了42.70%,比OSC方法进一步提高了0.07%。对于DCTR特征(SI-UNIWARD),如图6中(b)所示,当Payload=0.1时,SRFS选择特征的检测正确率为0.5276,OSC选择特征的检测正确率为0.5268,原始特征的检测正确率为0.5239。SRFS方法的检测正确率比原始特征提高了0.37%,维数降低了50.55%,比OSC方法进一步提高了0.08%。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
在这里示出和描述的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制,因此,示例性实施例的其他示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种图像隐写分析中基于补偿的特征选择方法,用于检测载密图像,其特征在于,包含如下内容:
针对收集到的载体图像,利用隐写算法生成不同嵌入率的载密图像,并提取载密图像一维步态隐写检测特征;
度量每个隐写检测特征分量的可分性,并根据隐写检测特征分量可分性值对所有隐写检测特征分量进行降序排列;
构建候选特征向量,构建候选特征向量,根据可分性排序结果选取排名第一的特征分量作为初始候选特征向量,并在排序结果中删除此特征,依次将排序结果中的第一个特征分量添加至前一个候选特征向量以形成新的候选特征向量,并度量每个候选特征向量可分性;
选取可分性值最大的候选特征向量作为局部最优特征向量,利用特征补偿策略向局部最优特征向量中添加特征分量来获取最终选取的特征。
2.根据权利要求1所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,利用基于失真函数的图像隐写算法分别生成不同嵌入率的载密图像。
3.根据权利要求1或2所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,对不同嵌入率下图像隐写检测特征进行统计分析,基于类间间距、类内间距和类内距离差异的特征分量可分性准则来度量每个隐写检测特征分量的可分性。
4.根据权利要求1所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,假设s+(fi)和s-(fi)分别表示特征分量fi在载体图像和载密图像的方差,则使用
Figure FDA0002972157950000011
Figure FDA0002972157950000012
均能来表示特征分量在载体特征与载密特征的类内距离差异。
5.根据权利要求4所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,选取
Figure FDA0002972157950000013
Figure FDA0002972157950000014
两者中的最大值来表示特征分量在载体特征与载密特征的类内距离差异。
6.根据权利要求4或5所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,利用自然对数函数均衡
Figure FDA0002972157950000015
和/或
Figure FDA0002972157950000016
依据均衡后的数据来表示特征分量在载体特征与载密特征的类内距离差异。
7.根据权利要求4所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,每个检测特征分量可分性的度量公式表示为:
Figure FDA0002972157950000017
其中,m+(fi)和m-(fi)分别表示第i个特征分量fi在载体图像类与载密图像类的均值,(m+(fi)-m-(fi))2表示第i个特征分量fi在载体图像类与载密图像类的类间距离,s+ 2(fi)+s- 2(fi)表示特征分量第i个特征分量fi在载体图像类与载密图像类的类内距离。
8.根据权利要求1所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,基于类间距离、类内距离和整体类内距离差异的特征向量可分性准则度量候选特征向量的可分性,并从候选特征向量中选出局部最优特征向量。
9.根据权利要求1或8所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,特征向量可分性度量包含如下内容:首先选取可分性值最大的特征分量作为初始候选特征向量,迭代计算当前轮次内相应特征分量的载体特征及载密特征两者的方差和均值;在迭代中内嵌循环计算特征分量的载体特征及载密特征两者的方差和均值;通过特征分量整体类内差异获取候选特征向量的可分性值;通过设置最大迭代次数生成若干个候选特征向量及其对应的可分性值,最终选取可分性值最大的候选特征向量为局部最优特征向量。
10.根据权利要求1所述的图像隐写分析中基于补偿的特征选择方法,其特征在于,利用特征补选策略获取最终选取的特征向量,包含如下内容:依据每个特征分量被选中概率及其累计概率,并通过累计概率与产生的随机数进行比较来选定特征分量;重复执行直至达到最大执行次数,将选取的特征分量加入局部最优特征向量中形成最终选取的特征。
CN202110265150.5A 2021-03-11 2021-03-11 图像隐写分析中基于补偿的检测特征选择方法 Active CN112950445B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110265150.5A CN112950445B (zh) 2021-03-11 2021-03-11 图像隐写分析中基于补偿的检测特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110265150.5A CN112950445B (zh) 2021-03-11 2021-03-11 图像隐写分析中基于补偿的检测特征选择方法

Publications (2)

Publication Number Publication Date
CN112950445A true CN112950445A (zh) 2021-06-11
CN112950445B CN112950445B (zh) 2023-11-17

Family

ID=76229002

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110265150.5A Active CN112950445B (zh) 2021-03-11 2021-03-11 图像隐写分析中基于补偿的检测特征选择方法

Country Status (1)

Country Link
CN (1) CN112950445B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298689A (zh) * 2021-06-22 2021-08-24 河南师范大学 一种大容量图像隐写方法
CN113542525A (zh) * 2021-06-30 2021-10-22 中国人民解放军战略支援部队信息工程大学 基于mmd残差的隐写检测特征选取方法
CN114051082A (zh) * 2021-10-19 2022-02-15 河南师范大学 基于失真度和信息增益比的隐写检测特征选取方法及装置
CN114627340A (zh) * 2022-03-19 2022-06-14 河南师范大学 基于三重度量的图像隐写检测特征自适应选取方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016201648A1 (zh) * 2015-06-17 2016-12-22 中国科学院自动化研究所 一种基于局部学习的信息隐藏检测方法
CN108009434A (zh) * 2017-12-13 2018-05-08 中国人民解放军战略支援部队信息工程大学 基于粗糙集α-正域约简的富模型隐写检测特征选取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016201648A1 (zh) * 2015-06-17 2016-12-22 中国科学院自动化研究所 一种基于局部学习的信息隐藏检测方法
CN108009434A (zh) * 2017-12-13 2018-05-08 中国人民解放军战略支援部队信息工程大学 基于粗糙集α-正域约简的富模型隐写检测特征选取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨雪;杨榆;雷敏;: "基于SPAM和特征优化的通用隐写分析算法改进", 成都信息工程大学学报, no. 01 *
汪然;薛小燕;平西建;牛少彰;张涛;: "分类与分割相结合的JPEG图像隐写分析", 中国图象图形学报, no. 10 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113298689A (zh) * 2021-06-22 2021-08-24 河南师范大学 一种大容量图像隐写方法
CN113542525A (zh) * 2021-06-30 2021-10-22 中国人民解放军战略支援部队信息工程大学 基于mmd残差的隐写检测特征选取方法
CN114051082A (zh) * 2021-10-19 2022-02-15 河南师范大学 基于失真度和信息增益比的隐写检测特征选取方法及装置
CN114051082B (zh) * 2021-10-19 2023-10-27 河南师范大学 基于失真度和信息增益比的隐写检测特征选取方法及装置
CN114627340A (zh) * 2022-03-19 2022-06-14 河南师范大学 基于三重度量的图像隐写检测特征自适应选取方法
CN114627340B (zh) * 2022-03-19 2024-04-30 河南师范大学 基于三重度量的图像隐写检测特征自适应选取方法

Also Published As

Publication number Publication date
CN112950445B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN112950445B (zh) 图像隐写分析中基于补偿的检测特征选择方法
CN111027069B (zh) 恶意软件家族检测方法、存储介质和计算设备
US7783581B2 (en) Data learning system for identifying, learning apparatus, identifying apparatus and learning method
CN109729091A (zh) 一种基于多特征融合和CNN算法的LDoS攻击检测方法
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN114492768B (zh) 一种基于小样本学习的孪生胶囊网络入侵检测方法
CN110674865B (zh) 面向软件缺陷类分布不平衡的规则学习分类器集成方法
CN114844840B (zh) 一种基于计算似然比的分布外网络流量数据检测方法
CN115577357A (zh) 一种基于堆叠集成技术的Android恶意软件检测方法
CN112199670A (zh) 一种基于深度学习改进iforest对行为异常检测的日志监控方法
Wu et al. Genetic algorithm with multiple fitness functions for generating adversarial examples
CN111753299A (zh) 一种基于分组集成的不平衡恶意软件检测方法
CN114897124A (zh) 基于改进灰狼优化算法的入侵检测特征选择方法
CN112836731A (zh) 基于决策树准确率和相关性度量的信号随机森林分类方法、系统及装置
CN111708865B (zh) 一种基于改进XGBoost算法的技术预见及专利预警分析方法
CN112906672A (zh) 钢轨缺陷识别方法及系统
CN116318877A (zh) 利用多种特征流形向量的入侵检测系统对抗样本防御方法
CN103761433A (zh) 一种网络服务资源分类方法
CN113010673A (zh) 一种基于熵优化支持向量机的漏洞自动分类方法
CN112257688A (zh) 一种基于gwo-oselm的非接触式手掌活体检测方法及装置
CN111581640A (zh) 一种恶意软件检测方法、装置及设备、存储介质
CN114627340B (zh) 基于三重度量的图像隐写检测特征自适应选取方法
CN112183576B (zh) 一种基于不均衡数据集的Time-LSTM分类方法
CN112131388B (zh) 一种包含文本型数据类型的异常数据检测方法
CN112749524B (zh) 一种基于残差编码器神经网络的硬件木马电路检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant