CN115760535A - 基于局部均值分解的自适应音频盲水印嵌入与提取方法 - Google Patents

基于局部均值分解的自适应音频盲水印嵌入与提取方法 Download PDF

Info

Publication number
CN115760535A
CN115760535A CN202211367574.3A CN202211367574A CN115760535A CN 115760535 A CN115760535 A CN 115760535A CN 202211367574 A CN202211367574 A CN 202211367574A CN 115760535 A CN115760535 A CN 115760535A
Authority
CN
China
Prior art keywords
watermark
signal
local
audio
local mean
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211367574.3A
Other languages
English (en)
Inventor
陈文佳
唐文娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202211367574.3A priority Critical patent/CN115760535A/zh
Publication of CN115760535A publication Critical patent/CN115760535A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)

Abstract

本发明公开了基于局部均值分解的自适应音频盲水印嵌入与提取方法,包括:S1:对水印进行预处理;S2:将原始信号分为互不重叠的长度均为L的n个音频帧,对每个水印待嵌入帧进行局部均值分解,得到若干个PF分量和一个残余分量;S3:对原始音频信号进行水印嵌入和提取。本发明根据音频信号的特点和人耳听觉特性,用局部均值分解自适应地处理信号后,选择合适的嵌入算法和嵌入位置,在音频信号本身振幅小的地方进行极小的改动,避免引入可感知的失真,保留信号完整性。

Description

基于局部均值分解的自适应音频盲水印嵌入与提取方法
技术领域
本发明属于信息安全和音频处理技术领域,特别涉及基于局部均值分解的自适应音频盲水印嵌入与提取方法。
背景技术
随着数字处理技术越来越大众化,别有用心的人可能会利用相关技术对音频进行复制、篡改、伪造等以达到其非法目的,研究者们利用水印来保护版权所有者的合法权益。音频盲水印技术需要保证鲁棒性和不可感知性,即音频信号遭受常见攻击时提取出的水印和嵌入的水印差别是可接受的并且嵌入水印后的音频听起来与原始音频差别不大。该算法是“盲”的,即水印提取端不需要原始音频数据,只需要嵌入水印的音频和密钥就可以提取出水印。
最早的算法是基于时域的,如现在还被经常提及的最低有效位算法(LSB)。但由于人的听觉对音频信号的加性噪声十分敏感,简单地在时域添加水印会导致水印的不可感知性及鲁棒性不佳。近年来,变换域的音频水印算法发展迅速,目前大多音频盲水印算法都是基于离散余弦变换(DCT)、离散小波变换(DWT)、平稳小波变换(SWT)、奇异值分解(SVD)等。研究者们往往基于以上一种或多种变换方式来对音频信号处理后添加盲水印,并与一些其它领域技术结合提高算法的鲁棒性,不可感知性。
DCT、DWT、SWT对时频面是一种机械型处理,不具备自适应性。WVD是信号时间自相关函数的傅里叶变换,是信号的二次时频,对于多分量信号必然存在交叉干扰项。SVD在不同数据中奇异值向量可能是相同的,导致可能在未嵌入水印的音频中提取出水印信息,造成水印提取的虚警问题,并且由于SVD自身特性,在提取水印时会出现较严重的对角线失真问题。为了能够自适应地处理信号,许多研究者使用经验模式分解(EMD)完成水印嵌入,EMD虽能够自适应地处理信号,但存在迭代次数较多,端点效应导致信号失真,信号完整性保留不足的问题。
发明内容
为解决以上技术问题,本发明公开基于局部均值分解的自适应音频盲水印嵌入与提取方法,根据音频信号的特点和人耳听觉特性,用局部均值分解自适应地处理信号后,选择合适的嵌入算法和嵌入位置,在音频信号本身振幅小的地方进行极小的改动,避免引入可感知的失真,保留信号完整性。
基于局部均值分解的自适应音频盲水印嵌入与提取方法,包括以下步骤:
S1:对水印进行预处理,得到一维水印数组;
S2:将原始音频信号分为互不重叠的长度均为L的n个音频帧作为水印待嵌入帧,对每个水印待嵌入帧进行局部均值分解,得到若干个PF分量PFj(t)和一个残余分量ui(t);
S3:对原始音频信号进行一维水印数组嵌入。
进一步地,所述S1步骤中所述的预处理具体步骤为:用户选择需要的正方形图片作为水印,将选中的正方形图片转化为二值图像后,再利用Arnold置乱算法进行变换,Arnold变换使用到的参数相当于密钥,由合法使用者保管;Arnold变换后的图像进行降维处理,得到一维水印数组。
进一步地,所述S2步骤中所述的局部均值分解步骤如下:
S2-1:用镜像扩展算法对原始音频信号进行处理,得到处理后的信号x(t);
S2-2:找到信号x(t)中所有局部极小值点和局部极大值点,极值点表示为ed,其值为x(ed),其中d=1,2,3...。通过求相邻的局部极值点之间的平均值,得到局部均值函数m0l
Figure BDA0003923808800000021
S2-3:计算局部包络函数a0l
Figure BDA0003923808800000022
S2-4:对上述的(10)式和(11)式进行滑动平均算法处理,生成平滑后的局部均值函数ml(t)和平滑后的局部包络函数al(t);选定步长,从原始信号x(t)中剔除当前局部均值函数ml(t),得到零均值函数hl(t);
S2-5:al(t)除hl(t)得到解调信号sl(t);
S2-6:拟定目标函数f=RMS((z(t))+kurtosis((z(t)),其中,zP(t)=aP(t)-1;
重复以上步骤P次,直到fP>fP-1,fP-1>fP-2,认为内循环迭代结束;
S2-7,把内循环迭代产生的所有局部包络函数累乘,得到包络信号a(t);将包络信号a(t)与纯调频信号sP(t)相乘,得到PF分量PFj(t),PF分量PFj(t)为本次分解的第j个PF分量;
S2-8,从信号中提取所有的PF分量,从原始信号x(t)中减去当前的PF分量PFj(t),得到本次分解的残余分量uj(t),用残余分量uj(t)在步骤S2-1至S2-5重复,直到残余分量uj(t)为常数或单调,此时将残余分量uj(t)记为u(t);重构信号x(t):
Figure BDA0003923808800000023
其中,Q为分解出的PF分量个数。
进一步地,所述S2-4中的步长为利用包络估计和“3σ”原则选定的滑动步长λ,滑动步长λ的选取如式(9)所示:
λ=odd(μp+3*σp) (9)
其中,odd()表示输出大于等于输入的最接近奇数,μp表示阶跃长度的平均值,σp表示阶跃长度的方差。
进一步地,所述S3中所述对原始音频信号进行水印嵌入的具体步骤为:
S3-1:先分别取残余分量的局部极大值点和局部极小值点的平均值作为最大值点和最小值点:
Figure BDA0003923808800000031
Figure BDA0003923808800000032
其中,ui(t)为第i帧的原始信号,l1为局部极大值点的数量,l2为局部极小值点的数量,maxk(u(t))代表第k个局部极大值点,mink(u(t))代表第k个局部极小值点,Max(ui(t))代表本设计认为的最大值点,Min(ui(t))代表本发明认为的最小值点;
S3-2:对分解出的残余分量ui(t)进行平移得到ui_new(t),把ui_new(t)与PF分量相加得到嵌入水印的音频信号xi_w(t):
Figure BDA0003923808800000033
进一步地,针对非语音信号的音频,所述嵌入水印的音频信号的表达式如下:
Figure BDA0003923808800000034
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值。
进一步地,针对语音信号的音频,所述嵌入水印的音频信号的表达式如下:
Figure BDA0003923808800000035
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值。
进一步地,所述嵌入强度Si的表达式如下:
Figure BDA0003923808800000041
其中,α为嵌入强度Si的调节参数,α范围为25≤α≤40。
进一步地,本法明还提供一种基于局部均值分解的自适应音频盲水印提取方法,进行盲水印提取的具体步骤为:接收端收到嵌入水印的音频信号xi_w(t)后进行局部均值分解,提取水印的表达式如下:
Figure BDA0003923808800000042
其中,W'(i)为嵌入的第i个水印比特的值;
将W’(i)转成二维并进行逆Arnold置乱,完成水印的提取。
本发明有益效果为:
1、利用局部均值分解(LMD)处理实际信号,收敛速度快,运行速度快;并且由于LMD分解得到的残余分量的幅值相对于整个信号来看非常小并且频率很低,所以对残余分量改动来嵌入水印引入的可察觉性很小
2、考虑振幅和嵌入强度的关系,在音频信号本身振幅小的地方进行极小的改动,避免引入可感知的失真;在添加噪声、重采样、低通滤波、压缩等常见攻击下,提取出的水印图片与原始图片的误差较小
3、能够利用提取出的水印图片检测和定位恶意篡改攻击。如图12所示,提取出的水印与原始水印进行比较,在一维水印数组下,若找到连续出错的水印范围为[a1,b1],则音频对应被篡改的范围是[a1×L,b1×L]。
附图说明
附图1为改进后的局部均值分解方法的框图。
附图2为基于局部均值分解的自适应音频盲水印嵌入方法。
附图3为基于局部均值分解的自适应音频盲水印提取方法
附图4为理论上的局部均值分解方法的框图。
附图5为原始信号局部均值分解的结果与嵌入水印后的信号局部均值分解后的结果。
附图6为嵌入水印前后信号的波形以及嵌入水印前后的修改量。
附图7为无攻击的情况下提取出的水印图像。
附图8为在嵌入水印后的信号中添加100dB的高斯白噪声的情况下提取出的水印图片。
附图9为在嵌入水印后的信号进行重采样的情况下提取出的水印图片。
附图10为在嵌入水印后的信号进行低通滤波的情况下提取出的水印图片。
附图11为在嵌入水印后的信号进行MP3压缩的情况下提取出的水印图片。
附图12为通过提取出的检测并定位恶意篡改的示意图。
具体实施方式
下面结合附图和实施例对本发明的实施方式作进一步描述。需要说明的是,实施例并不对本发明要求保护的范围构成限制。
实施例1
如附图1至附图12所示,基于局部均值分解的自适应音频盲水印嵌入与提取方法,包括以下步骤:
S1:对水印进行预处理;
用户选择需要的正方形图片作为水印,将该图像也即选中的正方形图片转化为二值图像后,再利用Arnold置乱算法进行变换,Arnold变换使用到的参数相当于密钥,由合法使用者保管;Arnold变换后的图像进行降维处理,得到一维水印数组。
Arnold置乱算法的具体步骤为:将原图像的位置点(u,v)通过置乱运算变换到新位置点(u',v'),破坏像素之间的相关性。置乱运算用到的参数有g、h、N、r。其中,g和h构成置乱矩阵
Figure BDA0003923808800000051
N为置乱次数,r为水印图片的阶数。g、h、N、r作为密钥,只有可提取水印的合法使用者知道,置乱和逆置乱的表达式:
Figure BDA0003923808800000052
Figure BDA0003923808800000053
其中,mod表示取余运算。
S2:将原始信号分为互不重叠的长度均为L的n个音频帧,对每个水印待嵌入帧进行局部均值分解,得到若干个PF分量和一个残余分量。
局部均值分解的理论步骤由内外循环构成,理论上的LMD如图4所示,x(t)被分解为Q个PF分量和一个残余分量u(t):
Figure BDA0003923808800000054
其中,t表示第t个抽样点。
而实际中,由于理论算法停止迭代的条件过于严格,往往会使算法不收敛,本发明使用的改进的局部均值分解包括以下3个方面:
S2-1:内循环迭代停止判据
引入均方根(RMS)和峰度值(kurtosis)构成目标函数f:
f=RMS((z(t))+kurtosis((z(t)) (4)
Figure BDA0003923808800000061
Figure BDA0003923808800000062
其中,t表示第t个抽样点;a(t)表示表示平滑后的包络函数,令z(t)=a(t)-1;
Figure BDA0003923808800000063
表示z(t)的平均值,Ns表示a(t)中的抽样点总数。
按照理论算法,当a(t)无限接近于1时,目标函数f无限接近于0。使用两个指标来描述原理,提高了算法的可用性。
本发明使用的迭代停止判据目标是找到连续几次迭代过程中目标函数的较小值,对于第(j-2)次、(j-1)次、j次迭代得到的目标函数fj-2、fj-1、fj,如果fj-1>fj-2,fj>fj-1,则可以停止迭代,返回第j次的结果。为了保证算法收敛,需要预定义一个最大迭代次数,本发明将最大迭代次数定为10。因此,本发明提供的局部均值分解算法内循环迭代次数为2-10次。
S2-2:采用镜像扩展算法,用扩展比控制总长度,将扩展信号切回与原始信号相同的长度;
LMD的第一步是找到所有的局部极值点,如果端点不是真正的极值点,会导致包络估计发散,影响到后续提取信号分量。为了解决这个问题,本发明采用镜像扩展算法,用扩展比控制总长度,将扩展信号切回与原始信号相同的长度,解决端点效应。
经过MATLAB仿真实验,扩展比设定在[0.1,0.5]比较合适,扩展越多会使处理速度稍慢,但扩展长度越长分解效果越好,本发明采用扩展比0.4,即扩展的长度为原长度的0.4。
3)利用包络估计和“3σ”原则选定步长;
如图4所示,m0l为未平滑的局部均值函数,a0l为未平滑的局部包络函数;ml(t)为平滑后的局部均值函数,al(t)为平滑后的的局部包络函数;t表示第t个抽样点。
m0l和a0l通过滑动平均法后得到ml(t)和al(t),滑动步长的选择如下:
首先计算m0l和a0l的阶跃长度,即(ed+1-ed+1)(如图4所示,ed表示第d个局部极值点,ed+1表示第d+1个局部极值点),绘制阶跃长度集的直方图。
Figure BDA0003923808800000071
Figure BDA0003923808800000072
其中,Nb为直方图的总条数,p(k)为每个直方的中间值,P(k)为概率,μp表示阶跃长度的平均值,σp表示阶跃长度的方差。
最后,选定的步长λ用下式表示:
λ=odd(μp+3*σp) (9)
其中,odd()表示输出大于等于输入的最接近奇数。
由于“3σ”原则,平滑步长λ大于绝大多数阶跃长度(ed+1-ed+1)。
综上,本发明使用的局部均值分解步骤如下,框图如图1所示:
第1步:用镜像扩展算法对原信号进行处理,处理后的信号用于以下步骤。
第2步:一个点的左右两个相邻点都比它小,称为局部极小值点,两个相邻点都比它大,称为局部极大值点。找到信号x(t)中所有局部极小值点和局部极大值点。极值点表示为ed其值为x(ed),其中d=1,2,3...。通过求相邻的局部极值点之间的平均值,得到局部均值函数m0l
Figure BDA0003923808800000073
第3步:计算局部包括函数a0l
Figure BDA0003923808800000074
第4步:对(10),(11)式进行滑动平均算法处理,生成平滑后的局部均值函数ml(t)和局部包络函数al(t)。
利用包络估计和“3σ”原则选定步长,滑动步长λ的选取如式(9)所示。
第四步,从原始信号x(t)中剔除当前局部均值函数ml(t)
hl(t)=x(t)-ml(t) (12)
第5步:对hl(t)进行解调得到sl(t)
Figure BDA0003923808800000081
重复以上步骤P次,直到式(4)中的目标函数fP>fP-1,fP-1>fP-2
其中,fP=RMS((zP(t))+kurtosis((zP(t)),zP(t)=aP(t)-1。
第6步,把内循环迭代产生的所有局部包络函数累乘,得到包络信号a(t)。将a(t)与纯调频信号sP(t)相乘,得到PF分量:
Figure BDA0003923808800000082
PFj(t)=a(t)sP(t) (15)
第7步,从信号中提取所有的PF分量,这就是算法的外循环:从原始信号x(t)中减去当前PFj(t),得到残余分量uj(t),用uj(t)在步骤1-5重复,直到uj(t)为常数或单调,此时将uj(t)记为u(t)。重构信号x(t):
Figure BDA0003923808800000083
其中,Q为分解出的PF分量个数。
S3:对原始音频信号进行水印嵌入和提取;
原始音频信号为X(t),t是采样点,将X(t)分为互不重合且长度均为L的n个音频帧:x1(t),x2(t),...xn(t)。水印图片的阶数为r,即大小为r2,其中,n>r2。将水印嵌入
Figure BDA0003923808800000084
次,选择前
Figure BDA0003923808800000085
作为水印嵌入帧。对每一个水印嵌入帧都进行LMD分解:
Figure BDA0003923808800000086
其中,xi(t)为第i个音频帧,Q为分解出的PF分量个数,PFj(t)为本次分解的第j个PF分量,ui(t)为本次分解的残余分量。
嵌入水印是对分解出的残余分量ui(t)进行平移来完成的,将ui(t)平移后得到ui_new(t),把ui_new(t)与PF分量相加得到嵌入水印的音频信号xi_w(t)。由于残余分量平移后不能再进行分解,即依然是残余分量,如图5所示。所以接收端将xi_w(t)进行局部均值分解,得到的残余分量中包含着水印信息。
两种方案的水印嵌入设计框图如图2所示,水印提取设计框图如图3所示。
本发明认为,使用者可以从鲁棒性和不可感知性的需求选择以下两种方案。若使用者没有进行选择,那么若该音频为非语音信号(如音乐等)则使用第一种方案,若该音频为语音信号则使用第二种方案。原因是在语音信号的频率范围比音乐信号的小,这两种信号在都使用第一种方案且不可感知性相当的的情况下,语音信号的鲁棒性强于音乐信号,所以可以牺牲一些鲁棒性换取更好的不可感知性。
1)第一种水印的嵌入及提取方案
由于改进后的局部均值分解算法实质上来说是放宽了内外循环的迭代终止条件,所以残余分量不严格是一条单调的曲线,可能存在极少的局部极值点,所以设计嵌入和提取的表达式如下:
先分别取残余分量的局部极大值点和局部极小值点的平均值作为最大值点和最小值点:
Figure BDA0003923808800000091
Figure BDA0003923808800000092
其中,ui(t)为第i帧的原始信号,l1为局部极大值点的数量,l2为局部极小值点的数量,maxk(u(t))代表第k个局部极大值点,mink(u(t))代表第k个局部极小值点,Max(ui(t))代表本设计认为的最大值点,Min(ui(t))代表本发明认为的最小值点。
第一种方案的嵌入水印的表达式如下:
Figure BDA0003923808800000093
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值。
嵌入强度Si的表达式如下:
Figure BDA0003923808800000094
其中,α可调,α越大嵌入强度S越小,则有更强的鲁棒性但不可感知性稍弱,α越小嵌入强度S越大,则有好的不可感知性但鲁棒性稍弱。通过实验,合适的α范围为[25,40]。
嵌入水印后的信号xi_w(t):
Figure BDA0003923808800000101
接收端收到xi_w(t)后进行LMD分解:
Figure BDA0003923808800000102
提取水印的表达式如下:
Figure BDA0003923808800000103
其中,W'(i)为嵌入的第i个水印比特的值。
第一种方案采用残余分量曲线整体平移的方案,对每一个采样点都进行了操作,保证了较高的鲁棒性。适用于对音质要求不是很高,但需要健壮的水印场合。
2)第二种水印的嵌入及提取方案
从第一种水印嵌入方案来看,只要能够保证已嵌入水印的信号通过LMD分解后得到的残余分量每个采样点的和在嵌入水印为1时大于0,嵌入水印为0时小于0即可。所以考虑每个采样点平移的量可以减小,只要保证和符合要求即可。将残余分量的每个采样点的和平均加到或减到每个采样点上,并引入一个嵌入强度提高可靠性,就能够保证残余分量的和大于或小于0。
第二种方案与第一种方案不同之处为嵌入水印的表达式,其余方法一致。
第二种方案的嵌入水印的表达式如下:
Figure BDA0003923808800000104
对比方案一,平移的量较小,不可察觉性提高。但是,如果在恶意攻击或信道条件一般、多媒体设备的电子元件的噪声较大的情况下,轻微的扰动可能会使得信号整体偏移,导致残余分量偏移,造成错误的水印判断,鲁棒性比第一种方案稍差。
本发明还提供一种基于局部均值分解的自适应音频盲水印嵌入与提取系统,其包括能够实现上述步骤的功能步骤模块。
对原始音频信号进行水印嵌入,包括:
用户选择需要的边长为r的正方形图片作为水印,将该图像转化为二值图像后进行Arnold变换,Arnold变换使用到的参数相当于密钥,由合法使用者保管。处理后的图像进行降维处理。
将原始信号分为互不重叠的长度均为L的n个音频帧。其中分帧长度L为密钥,只有合法使用者知晓。
综上,该系统的密钥由分帧长度L,以及Arnold变换参数g、h、N、r组成。
对水印待嵌入帧进行局部均值分解:
Figure BDA0003923808800000111
其中,xi(t)为第i个音频帧,Q为分解出的PF分量个数,PFj(t)为本次分解的第j个PF分量,ui(t)为本次分解的残余分量。
两种水印的嵌入方案:
1)第一种
先分别取局部极大值点和局部极小值点的平均值作为最大值点和最小值点:
Figure BDA0003923808800000112
Figure BDA0003923808800000113
其中,ui(t)为第i帧的原始信号,l1为局部极大值点的数量,l2为局部极小值点的数量,maxk(u(t))代表第k个局部极大值点,mink(u(t))代表第k个局部极小值点,Max(ui(t))代表本设计认为的最大值点,Min(ui(t))代表本设计认为的最小值点。
嵌入水印的表达式如下:
Figure BDA0003923808800000114
其中,ui_new(t)为改变后的残余分量,S为嵌入强度,W(i)为嵌入的第i个水印比特的值
2)第二种
嵌入水印的表达式如下:
Figure BDA0003923808800000115
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值
两种方案中嵌入强度Si
Figure BDA0003923808800000121
其中,α可调,通过实验,合适的α范围为[25,40]。
将修改后的残余分量与若干个PF分量相加,得到嵌入水印的信号,第i帧嵌入水印后的信号xi_w(t):
Figure BDA0003923808800000122
把分帧复原后得到嵌入水印后的信号:
Figure BDA0003923808800000123
提取水印:
接收端将收到的已嵌入水印的音频信号分成长度均为L且互不重叠的音频帧,每帧进行LMD分解,得到残余分量ui_w(t),按以下公式得到一维水印信息W’(i)。
两种方案提取水印的方法相同:
Figure BDA0003923808800000124
其中,W’(i)为嵌入的第i个水印比特的值。ui_w(t)表示第i帧的残余分量。
将W’(i)转成二维并进行逆Arnold置乱,完成水印的提取。
为了进一步验证本发明技术方案的技术效果,对本发明音频盲水印的嵌入及提取的处理方法实验例进行仿真测试,详见下文描述:
(1)不可感知性分析验证
采用信噪比(SNR)来验证本发明的不可感知性,具体公式如下:
Figure BDA0003923808800000125
其中,音频数据有n×L个样本点,x(t)表示原始音频,xw(t)表示嵌入水印后的音频数据。SNR值越大,说明技术方案的不可感知性越好。
将图5所示,原始音频信号经过本发明音频水印嵌入的处理方法处理后,生成含水印音频信号。SNR可达30dB,说明本技术方案有良好的不可感知性。
由于人类听觉的特殊性,不能简单地用信噪比来衡量不可感知性。直观地,在振幅大的地方进行较大的修改,在振幅小的地方基本不进行修改,能避免引入可感知的失真,如图6所示。
(2)鲁棒性分析验证
鲁棒性用来衡量音频水印算法的抗攻击能力,本发明通过计算原始水印和提取水印之间的误码率(BER)和相关程度来测度算法的鲁棒性,选择BER和归一化系数(NC)作为鲁棒性的评价指标:
Figure BDA0003923808800000131
Figure BDA0003923808800000132
其中,r2是水印图片的比特数,W(i)表示嵌入的水印和W’(i)表示提取出的水印,
Figure BDA0003923808800000133
表示异或运算。
本发明无攻击的情况下提取的水印图像如图7所示。
为了验证算法的鲁棒性,对嵌入水印的音频信号采取以下攻击:
1)添加噪声:添加100dB的高斯白噪声后,从音频中提取出来的水印图像。图8为添加噪声后的从音频中提取出的水印图像。对100个不同类型的音频文件加噪后,方案一下嵌入与提取的水印的平均NC值为0.9919,方案二下嵌入与提取的水印的平均NC值为0.9909,基本不受噪声影响。
2)重采样:将音频原fs的采样频率降到0.5fs,再恢复成fs。图9为重采样后的从音频中提取出的水印图像。对100个不同类型的音频文件进行上述处理后,方案一下嵌入与提取的水印的平均NC值为0.9887,方案二下嵌入与提取的水印的平均NC值为0.9826,基本不受重采样影响。
3)低通滤波:用切比雪夫低通滤波器对信号进行滤波。图10为低通滤波后的从音频中提取出的水印图像。对100个不同类型的音频文件进行低通滤波后,方案一下嵌入与提取的水印的平均NC值为0.9887,方案二下嵌入与提取的水印的平均NC值为0.9766,基本不受低通滤波影响。
4)压缩:对信号进行MP3压缩。图11为压缩后的从音频中提取出的水印图像。方案一下嵌入与提取的水印的平均NC值为0.9910,方案二下嵌入与提取的水印的平均NC值为0.9763,基本不受压缩的影响。
5)恶意篡改:对信号其中一段进行置换。从图12可以看出,通过提取出的水印能够准确定位被篡改的位置。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,包括以下步骤:
S1:对水印进行预处理,得到一维水印数组;
S2:将原始音频信号分为互不重叠的长度均为L的n个音频帧作为水印待嵌入帧,对每个水印待嵌入帧进行局部均值分解,得到若干个PF分量PFj(t)和一个残余分量ui(t);
S3:对原始音频信号进行一维水印数组嵌入。
2.如权利要求1所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,所述S1步骤中所述的预处理具体步骤为:用户选择需要的正方形图片作为水印,将选中的正方形图片转化为二值图像后,再利用Arnold置乱算法进行变换,Arnold变换使用到的参数相当于密钥,由合法使用者保管;Arnold变换后的图像进行降维处理,得到一维水印数组。
3.如权利要求1所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,所述S2步骤中所述的局部均值分解步骤如下:
S2-1:用镜像扩展算法对原始音频信号进行处理,得到处理后的信号x(t);
S2-2:找到信号x(t)中所有局部极小值点和局部极大值点,极值点表示为ed,其值为x(ed),其中d=1,2,3...;通过求相邻的局部极值点之间的平均值,得到局部均值函数m0l
Figure RE-FDA0004034805920000011
S2-3:计算局部包络函数a0l
Figure RE-FDA0004034805920000012
S2-4:对上述的(10)式和(11)式进行滑动平均算法处理,生成平滑后的局部均值函数ml(t)和平滑后的局部包络函数al(t);选定步长,从原始信号x(t)中剔除当前局部均值函数ml(t),得到零均值函数hl(t);S2-5:al(t)除hl(t)得到解调信号sl(t);
S2-6:拟定目标函数f=RMS((z(t))+kurtosis((z(t)),其中,zP(t)=aP(t)-1;
重复以上步骤P次,直到fP>fP-1,fP-1>fP-2,认为内循环迭代结束;
S2-7:把内循环迭代产生的所有局部包络函数累乘,得到包络信号a(t);将包络信号a(t)与纯调频信号sP(t)相乘,得到PF分量PFj(t),PF分量PFj(t)为本次分解的第j个PF分量;
S2-8:提取所有的PF分量,从原始的信号x(t)中减去当前的PF分量PFj(t),得到本次分解的残余分量uj(t),用残余分量uj(t)在步骤S2-1至S2-5重复,直到残余分量uj(t)为常数或单调,此时将残余分量uj(t)记为u(t);重构信号x(t):
Figure RE-FDA0004034805920000021
其中,Q为分解出的PF分量个数。
4.如权利要求3所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,所述S2-4中的步长为利用包络估计和“3σ”原则选定的滑动步长λ,滑动步长λ的选取如式(9)所示:
λ=odd(μp+3*σp) (9)
其中,odd()表示输出大于等于输入的最接近奇数,μp表示阶跃长度的平均值,σp表示阶跃长度的方差。
5.如权利要求1所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,所述S3中所述对原始音频信号进行一位水印数组嵌入的具体步骤为:
S3-1:先分别取残余分量的局部极大值点和局部极小值点的平均值作为最大值点和最小值点:
Figure RE-FDA0004034805920000022
Figure RE-FDA0004034805920000023
其中,ui(t)为第i帧的原始信号,l1为局部极大值点的数量,l2为局部极小值点的数量,maxk(u(t))代表第k个局部极大值点,mink(u(t))代表第k个局部极小值点,Max(ui(t))代表本设计认为的最大值点,Min(ui(t))代表本发明认为的最小值点;
S3-2:对分解出的残余分量ui(t)进行平移得到ui_new(t),把ui_new(t)与PF分量相加得到嵌入水印的音频信号xi_w(t):
Figure RE-FDA0004034805920000024
6.如权利要求5所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,针对非语音信号的音频,所述嵌入水印的音频信号的表达式如下:
Figure RE-FDA0004034805920000031
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值。
7.如权利要求5所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,针对语音信号的音频,所述嵌入水印的音频信号的表达式如下:
Figure RE-FDA0004034805920000032
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值。
8.如权利要求6或7所述的基于局部均值分解的自适应音频盲水印嵌入方法,其特征在于,所述嵌入强度Si的表达式如下:
Figure RE-FDA0004034805920000033
其中,α为嵌入强度Si的调节参数,α范围为25≤α≤40。
9.一种基于局部均值分解的自适应音频盲水印提取方法,其特征在于,所述盲水印为权利要求1中所述的在原始音频信号中嵌入的一维水印数组,所述盲水印提取的具体步骤为:接收端收到嵌入水印的音频信号xi_w(t)后进行局部均值分解,提取水印的表达式如下:
Figure RE-FDA0004034805920000034
其中,ui_new(t)为改变后的残余分量,Si为嵌入强度,W(i)为嵌入的第i个水印比特的值;
将W’(i)转成二维并进行逆Arnold置乱,完成水印的提取。
CN202211367574.3A 2022-11-03 2022-11-03 基于局部均值分解的自适应音频盲水印嵌入与提取方法 Pending CN115760535A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211367574.3A CN115760535A (zh) 2022-11-03 2022-11-03 基于局部均值分解的自适应音频盲水印嵌入与提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211367574.3A CN115760535A (zh) 2022-11-03 2022-11-03 基于局部均值分解的自适应音频盲水印嵌入与提取方法

Publications (1)

Publication Number Publication Date
CN115760535A true CN115760535A (zh) 2023-03-07

Family

ID=85356955

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211367574.3A Pending CN115760535A (zh) 2022-11-03 2022-11-03 基于局部均值分解的自适应音频盲水印嵌入与提取方法

Country Status (1)

Country Link
CN (1) CN115760535A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116312577A (zh) * 2023-05-22 2023-06-23 海底鹰深海科技股份有限公司 语音处理装置、语音加密方法和语音解密方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116312577A (zh) * 2023-05-22 2023-06-23 海底鹰深海科技股份有限公司 语音处理装置、语音加密方法和语音解密方法

Similar Documents

Publication Publication Date Title
Liu et al. Patchwork-based audio watermarking robust against de-synchronization and recapturing attacks
Lei et al. Robust SVD-based audio watermarking scheme with differential evolution optimization
Fan et al. Chaos-based discrete fractional Sine transform domain audio watermarking scheme
Dhar et al. A new audio watermarking system using discrete fourier transform for copyright protection
Dhar et al. A new DCT-based watermarking method for copyright protection of digital audio
Dhar et al. Digital watermarking scheme based on fast Fourier transformation for audio copyright protection
CN115760535A (zh) 基于局部均值分解的自适应音频盲水印嵌入与提取方法
Zeng et al. A novel steganalysis algorithm of phase coding in audio signal
JP4771635B2 (ja) 一次元の情報信号へのウォーターマークの埋め込み及び検出
Giannoula et al. Watermark detection for noisy interpolated images
Beauget et al. Informed detection of audio watermark for resolving playback speed modifications
Wu et al. Analysis-by-synthesis echo hiding scheme using mirrored kernels
Wang et al. Robust audio watermarking based on MDCT coefficients
Bai et al. A blind audio watermarking algorithm based on FFT coefficients quantization
JP2004525429A (ja) 電子透かしの埋め込み
Subhashini et al. Robust audio watermarking for monitoring and information embedding
Roy et al. An efficient and blind audio watermarking technique in DCT domain
Dutta et al. An adaptive robust watermarking algorithm for audio signals using SVD
CN108877819B (zh) 一种基于系数自相关度的语音内容取证方法
CN107910010B (zh) 基于多参数Weibull统计建模的数字水印检测方法
Wu et al. Comparison of two speech content authentication approaches
Gupta et al. Perceptually transparent & robust audio watermarking algorithm using multi resolution decomposition & Cordic QR decomposition
Zezula et al. Audio signal watermarking in mclt domain with the aid of 2d pattern
Khademi et al. Audio steganography by using of linear predictive coding analysis in the safe places of discrete wavelet transform domain
Patil et al. Audio watermarking: A way to copyright protection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination