发明内容
本发明提出一种基于压缩感知和信息隐藏的语音保密通信系统设计方法,采用压缩感知技术对秘密语音进行编解码,技术方案如下:
一种基于压缩感知和信息隐藏的语音保密通信系统设计方法,其体特征在于,包括嵌入系统及提取系统的设计,嵌入系统将秘密语音嵌入载体语音得到混合语音,提取系统从混合语音中提取秘密语音,其中:
嵌入系统将秘密语音嵌入载体语音得到混合语音的方法是:采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典,并将秘密语音用基于能量分布非均匀特性的压缩感知自适应观测矩阵采样,得到降低维数的观测矢量,对观测矢量用LBG矢量量化,作为秘密信息嵌入载体语音,嵌入方法采用标量Costa算法,嵌入域选择载体语音的离散余弦变换系数的提升小波变换系数,将嵌入秘密信息的载体语音的离散余弦变换系数的提升小波变换系数用提升小波反变换及离散余弦反变换两级变换得到混合语音;
提取系统从混合语音中提取秘密语音的方法是:将混合语音进行离散余弦变换和提升小波变换两级变换得到小波变换系数,通过标量Costa解码算法得到秘密比特流,利用LBG矢量量化解码器得到重构的观测矢量,利用压缩感知正交匹配追踪算法重构秘密语音,利用小波去噪方法改善重构秘密语音的音质。
嵌入系统中,
1)采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典的具体方法为:通过级联一个两倍冗余的离散余弦变换矩阵和一个两倍冗余的离散小波变换矩阵初始化字典,大小为N×4N,即4倍冗余,其中N为语音信号的帧长,使用大量长度为N的语音数据去训练字典,首先在现有字典上对训练数据做稀疏编码,然后更新字典,使字典中的原子更加匹配训练数据,具体说来,Y为训练数据,D为过完备字典,即稀疏基矩阵,X为系数向量,通过求解下式寻找能够表示数据样本
的最佳字典:
用l2范数归一化的列元素初始化矩阵D(0)∈RN×C,然后重复以下步骤直到收敛;
稀疏编码方法:使用正交匹配追踪算法,对每一个样本y,通过近似下式的解来计算系数向量xi
subject to ‖xi‖0≤T0
码本更新:对D(J-1)中的每一个列元素k=1,2,....K,做如下更新:
计算总的表示误差矩阵Ek;
做奇异值分解
选择更新过的字典列元素
作为U的第一列,更新系数向量
使其作为V乘Δ(1,1)的第一列;
置J=J+1,寻找能够表示数据样本的最佳字典;
2)将秘密语音用基于能量分布非均匀特性的压缩感知自适应观测矩阵采样,得到降低维数的观测矢量的具体方法为:首先产生一个满秩的随机矩阵
由这个矩阵对语音信号采样,产生与原始信号等长的随机观测向量
遍历
的所有维数为M的子集,找出其中的最大能量子集:
根据
构造子矩阵
并以
作为自适应观测矩阵,对语音信号投影采样,得到能够反映原始语音能量分布的观测向量;
提取系统中,压缩感知正交匹配追踪算法重构构秘密语音的具体方法是:
压缩感知编码器端将k-稀疏信号x0投影到观测矩阵Φ∈RM×N(M<N)上,产生长度为M的观测序列y=(y1,y2…yM)T:
y=Φx0=ΦΨθ=Ξθ
其中观测投影矩阵Φ与基矩阵Ψ应当是互不相关的。上式显示,投影序列y与原始序列x0的求解是一个线性代数问题,当M<N时,有无穷多个解为欠定方程,所以,由上式无法求得确切的重构信号,本发明采用正交匹配追踪算法重构信号,迭代过程如下:
初始r0=y;
迭代λt=arg max|<rt-1,ej>|,(Ξ=(e1…em));
θt=arg min‖Ξtθ-y‖2;
at=Ξtθt;
rt=y-at(t=1,2,…)。
由最优解θ*计算原始信号x0的重构信号x*=Ψθ*。
本发明的优点及其显著效果:
(1)设计的语音保密通信系统采用压缩感知技术,由于采用K奇异值分解方法设计针对语音信号的过完备字典,较之传统的正交基更为灵活,能够实现更高的稀疏性。采用基于语音能量分布非均匀特性的压缩感知自适应观测矩阵,改进了重构语音的质量;
(2)本发明嵌入域选择在载体语音离散余弦变换系数的提升小波变换系数中,结合了两种变换各自的优势,混合语音的透明性优于单域隐藏方案,且易于实现。采用标量Costa嵌入算法,接收端对秘密语音进行盲提取,能有效抵抗加性噪声、低通滤波等各种常见信号攻击,具有非常高的鲁棒性。
具体实施方式
基于压缩感知和信息隐藏的语音保密通信系统设计包括嵌入系统设计及提取系统设计两部分,下面给出这两部分的主要实施方案。
A、嵌入系统设计(参看图1)
1、采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典的设计
(1)通过级联一个两倍冗余的DCT矩阵和一个两倍冗余的DWT矩阵初始化字典,大小为N×4N(4倍冗余),其中N为语音信号的帧长。本设计中秘密语音和载体语音均为8KHz采样,帧长N为128。
(2)字典训练
使用大量长度为N的语音数据去训练字典。K-SVD是一个K-均值聚类的过程,包括以下两部分:1)在现有字典上对训练数据做稀疏编码。本设计使用OMP算法计算稀疏系数。2)更新字典,使字典中的原子更加匹配训练数据。字典原子的更新与信号稀疏表示的更新是同步进行的,因此加速了收敛。整个字典训练过程如下。其中Y为训练数据,D为过完备字典(即稀疏基矩阵),X为系数向量。
目标任务:通过求解公式(1)寻找能够表示数据样本
的最佳字典。
初始化:用l2范数归一化的列元素初始化矩阵D(0)∈RN×C,令J=1。
重复以下步骤直到收敛:
稀疏编码:使用OMP算法,对每一个样本y,通过近似下式的解来计算系数向量xi:
码本更新:对D(J-1)中的每一个列元素k=1,2,....K,做如下更新:
—计算总的表示误差矩阵Ek
—做奇异值分解
选择更新过的字典列元素
作为U的第一列。更新系数向量
使其作为V乘Δ(1,1)的第一列。
置J=J+1。
2、基于能量分布非均匀特性的压缩感知自适应观测矩阵的设计
根据RIP(Restricted Isometry Property)准则,
对
有如下关系:
即:
由公式(5)可知,观测值y的能量分布反映了稀疏系数θ的能量分布。另一方面,语音信号的绝大部分能量集中在k个非零系数上。因此,通过对观测值进行分析,可以得到原始信号的能量分布。通过随机矩阵采样得到的观测序列不能反映原始语音信号的能量分布,于是,我们根据观测值的能量分布自适应的构造观测矩阵。
首先产生一个满秩的随机矩阵
由这个矩阵对语音信号采样,产生与原始信号等长的随机观测向量
遍历
的所有维数为M的子集,找出其中的最大能量子集:
根据
构造子矩阵
并以
作为自适应观测矩阵,对语音信号投影采样,得到能够反映原始语音能量分布的观测向量。
3、对观测矢量用LBG矢量量化,作为秘密信息嵌入载体语音,嵌入方法为标量Costa算法,嵌入域选择载体语音的离散余弦变换系数的提升小波变换系数,将嵌入秘密信息的载体语音的离散余弦变换系数的提升小波变换系数用提升小波反变换及离散余弦反变换两级变换得到混合语音。
B、提取系统设计(参看图2)
从混合语音中提取秘密语音,即将混合语音进行离散余弦变换和提升小波变换两级变换得到小波变换系数,再通过标量Costa解码算法得到秘密比特流,利用LBG矢量量化解码器得到重构的观测矢量,利用压缩感知正交匹配追踪算法重构秘密语音,再利用小波去噪方法改善重构秘密语音的音质。压缩感知正交匹配追踪重构算法具体如下:
压缩感知编码器端将k-稀疏信号x0投影到观测矩阵Φ∈RM×N(M<N)上,产生长度为M的观测序列y=(y1,y2…yM)T:
y=Φx0=ΦΨθ=Ξθ (6)
其中观测投影矩阵Φ与基矩阵Ψ应当是互不相关的。公式(6)显示,投影序列y与原始序列x0的求解是一个线性代数问题,当M<N时,有无穷多个解为欠定方程,所以,由公式(6)无法求得确切的重构信号,本发明采用正交匹配追踪算法重构信号,迭代过程如下:
初始r0=y;
迭代λt=arg max|<rt-1,ej>|,(Ξ=(e1…em));
θt=arg min‖Ξtθ-y‖2;
at=Ξtθt;
rt=y-at(t=1,2,…)。
由最优解θ*计算原始信号x0的重构信号x*=Ψθ*。
图3左、右两图分别表示嵌入比特为0及1时的SCS核心量化策略。dn表示嵌入的观测值量化比特。xn和sn分别表示原始音频载体和嵌入秘密语音后的密写信号。从中我们可以看出,当嵌入比特为0时,密写信号的值将集中在量化步长的整数倍附近,即密写信号的量化误差也接近于0。而当嵌入的秘密数据为1时,密写信号的值将集中在二分之一量化步长的奇数倍附近,即密写信号的量化误差接近于二分之一的量化步长。这也是该算法实现盲提取的前提。
下面通过四张表格的数据进一步验证本发明方法的效果。
秘密语音的CS压缩由于采用K奇异值分解方法训练的过完备字典及基于信号能量的自适应观测矩阵,重构效果优于单一的过完备余弦基和过完备小波基(Symmlet小波)及随机观测矩阵下的重构语音。表1显示了观测值未量化条件下,基于不同的稀疏基及观测矩阵所重构的秘密语音的平均分段信噪比。实验中的测试语音(包括秘密语音和载体语音)为8KHz采样,帧长N为128个样点,观测样值数取40,三种稀疏基的尺寸均为N×4N(四倍冗余)。
表1 基于不同稀疏基及观测矩阵的压缩感知重构语音平均分段信噪比
嵌入系统中,嵌入域选择在载体语音中低频DCT系数的LWT系数中,结合了DCT与LWT各自的优势,使得混合语音的透明性较之单域隐藏有一定程度的提升。表2给出本设计采用的嵌入域与普通单域隐藏效果的对比。
表2 混合语音客观质量评价
加性高斯白噪声(Additive White Gaussion Noise:AWGN)是分组交换数据网(PacketSwitched Data Network:PSTN)信道常见的干扰。表3为AWGN攻击下秘密语音的恢复情况。即使当信道中存在可察觉的噪声(信噪比下降到20dB)时,重构语音的误码率仍可控制在9%以下,归一化相关系数保持在91%以上。本设计方案具有良好的抵抗噪声能力。
表3 加性高斯白噪声攻击下秘密信息的恢复情况
表4为系统在低通滤波攻击下的表现。当截止频率fc下降到2500Hz时,误码率仍可控制在2.5%以下,归一化相关系数保持在97%以上。两级变换比小波域单域隐藏的抗低通滤波能力有明显提升。比单独的DCT域隐藏也有一定的改善。本设计方案能有效抵抗低通滤波攻击。
表4 低通滤波攻击下秘密信息的恢复情况