CN102034478B

CN102034478B - 基于压缩感知和信息隐藏的语音保密通信系统设计方法

Info

Publication number: CN102034478B
Application number: CN2010105479531A
Authority: CN
Inventors: 杨震; 叶蕾; 徐挺挺
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University; Nanjing University of Posts and Telecommunications
Priority date: 2010-11-17
Filing date: 2010-11-17
Publication date: 2013-10-30
Anticipated expiration: 2030-11-17
Also published as: CN102034478A

Abstract

本发明公开了一种基于压缩感知和信息隐藏的语音保密通信系统设计方法，嵌入系统将秘密语音嵌入载体语音得到混合语音，设计针对语音信号的压缩感知过完备字典，并将秘密语音用压缩感知自适应观测矩阵采样，得到降低维数的观测矢量，对观测矢量用LBG矢量量化，作为秘密信息嵌入载体语音，将载体语音经过两级变换得到混合语音；提取系统从混合语音中提取秘密语音，将混合语音进行离散余弦变换和提升小波变换两级变换得到小波变换系数，通过标量Costa解码算法得到秘密比特流，利用LBG矢量量化解码器得到重构的观测矢量，利用压缩感知正交匹配追踪算法重构秘密语音，再利用小波去噪方法改善重构秘密语音的音质。

Description

基于压缩感知和信息隐藏的语音保密通信系统设计方法

技术领域

本发明涉及信号采样技术、信息隐藏技术及语音信号处理技术领域，尤其涉及一种基于压缩感知和信息隐藏的语音保密通信系统设计方法。

背景技术

语音是人类交流信息的重要手段。随着社会文明的发展，语音通信的安全与隐私问题受到越来越多的关注。传统的语音保密通信机制通过加密保护通信用户的个人隐私及通话内容不被非法窃听者获取。然而，随着计算机技术的飞速发展，越来越多的密码算法可以在有限时间内被破解。更为糟糕的是，加密所产生的杂乱无章的码流显而易见的表明秘密信息的存在性。即使无法在短时间内破解，攻击者也会选择对其进行修改甚至破坏，迫使合法用户也无法得到该信息。

信息隐藏技术的出现为语音保密通信系统设计提供了一条全新的思路。秘密话音经过处理后隐藏在公开语音中传输。窃听者在进行窃听时听到的语音(密写信号)与公开话音(载体信号)基本无异。这样不但保护了秘密信息的内容，也保护了秘密信息的存在性。由于隐蔽通信对隐藏容量的特殊要求，信息嵌入前必须对秘密语音压缩以降低其码率，同时也在一定程度上增强了信息的安全性(窃听者不知道解码方法是无法窃密的)。

现有的秘密语音压缩编码方法中最主流的方法是通过各种语音声码器对秘密语音进行编解码，如2.4Kbps混合激励线性预测声码器以及8Kbps G.729对结构代数码激励线性预测声码器等。此类方法可以实现较高的压缩率，但计算复杂度较高，时延较大。压缩感知(Compressive Sensing：CS)技术是近几年出现的一种新兴的采样技术，该理论下所获得的采样率不仅大大低于传统的奈奎斯特采样率，而且其还具有对未知信号“边感知边压缩”的特性。

发明内容

本发明提出一种基于压缩感知和信息隐藏的语音保密通信系统设计方法，采用压缩感知技术对秘密语音进行编解码，技术方案如下：

一种基于压缩感知和信息隐藏的语音保密通信系统设计方法，其体特征在于，包括嵌入系统及提取系统的设计，嵌入系统将秘密语音嵌入载体语音得到混合语音，提取系统从混合语音中提取秘密语音，其中：

嵌入系统将秘密语音嵌入载体语音得到混合语音的方法是：采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典，并将秘密语音用基于能量分布非均匀特性的压缩感知自适应观测矩阵采样，得到降低维数的观测矢量，对观测矢量用LBG矢量量化，作为秘密信息嵌入载体语音，嵌入方法采用标量Costa算法，嵌入域选择载体语音的离散余弦变换系数的提升小波变换系数，将嵌入秘密信息的载体语音的离散余弦变换系数的提升小波变换系数用提升小波反变换及离散余弦反变换两级变换得到混合语音；

提取系统从混合语音中提取秘密语音的方法是：将混合语音进行离散余弦变换和提升小波变换两级变换得到小波变换系数，通过标量Costa解码算法得到秘密比特流，利用LBG矢量量化解码器得到重构的观测矢量，利用压缩感知正交匹配追踪算法重构秘密语音，利用小波去噪方法改善重构秘密语音的音质。

嵌入系统中，

1)采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典的具体方法为：通过级联一个两倍冗余的离散余弦变换矩阵和一个两倍冗余的离散小波变换矩阵初始化字典，大小为N×4N，即4倍冗余，其中N为语音信号的帧长，使用大量长度为N的语音数据去训练字典，首先在现有字典上对训练数据做稀疏编码，然后更新字典，使字典中的原子更加匹配训练数据，具体说来，Y为训练数据，D为过完备字典，即稀疏基矩阵，X为系数向量，通过求解下式寻找能够表示数据样本

的最佳字典：

subject to

用l²范数归一化的列元素初始化矩阵D⁽⁰⁾∈R^N×C，然后重复以下步骤直到收敛；

稀疏编码方法：使用正交匹配追踪算法，对每一个样本y，通过近似下式的解来计算系数向量x_i

subject to ‖x_i‖₀≤T₀

码本更新：对D^(J-1)中的每一个列元素k＝1，2，....K，做如下更新：

定义使用原子

的一组样值；

计算总的表示误差矩阵E_k；

E_{k} = Y - \underset{j &NotEqual; k}{Σ} d_{j} x_{T}^{j}

选择与w_k相关的列元素，得到

做奇异值分解

选择更新过的字典列元素作为U的第一列，更新系数向量使其作为V乘Δ(1，1)的第一列；

置J＝J+1，寻找能够表示数据样本的最佳字典；

2)将秘密语音用基于能量分布非均匀特性的压缩感知自适应观测矩阵采样，得到降低维数的观测矢量的具体方法为：首先产生一个满秩的随机矩阵

由这个矩阵对语音信号采样，产生与原始信号等长的随机观测向量

\hat{y} = \hat{Φ} x_{0} = \hat{Φ} Ψθ &Element; R^{N}

遍历

的所有维数为M的子集，找出其中的最大能量子集：

E_{\max}^{M} = \max_{E &Subset; {1,2 . . . C_{N}^{M}}} {| | {\hat{y}}_{U} | |}_{2}^{2} = \max_{E &Subset; {1,2 . . . C_{N}^{M}}} {| | {\hat{Φ}}_{E} x_{0} | |}_{2}^{2}

根据

构造子矩阵

并以

作为自适应观测矩阵，对语音信号投影采样，得到能够反映原始语音能量分布的观测向量；

提取系统中，压缩感知正交匹配追踪算法重构构秘密语音的具体方法是：

压缩感知编码器端将k-稀疏信号x₀投影到观测矩阵Φ∈R^M×N(M＜N)上，产生长度为M的观测序列y＝(y₁，y₂…y_M)^T：

y＝Φx₀＝ΦΨθ＝Ξθ

其中观测投影矩阵Φ与基矩阵Ψ应当是互不相关的。上式显示，投影序列y与原始序列x₀的求解是一个线性代数问题，当M＜N时，有无穷多个解为欠定方程，所以，由上式无法求得确切的重构信号，本发明采用正交匹配追踪算法重构信号，迭代过程如下：

初始r₀＝y；

迭代λ_t＝arg max|<r_t-1，e_j>|，(Ξ＝(e₁…e_m))；

Ξ_{t} = [Ξ_{t - 1}, e_{λ_{t}}];

θ_t＝arg min‖Ξ_tθ-y‖₂；

a_t＝Ξ_tθ_t；

r_t＝y-a_t(t＝1，2，…)。

由最优解θ^*计算原始信号x₀的重构信号x^*＝Ψθ^*。

本发明的优点及其显著效果：

(1)设计的语音保密通信系统采用压缩感知技术，由于采用K奇异值分解方法设计针对语音信号的过完备字典，较之传统的正交基更为灵活，能够实现更高的稀疏性。采用基于语音能量分布非均匀特性的压缩感知自适应观测矩阵，改进了重构语音的质量；

(2)本发明嵌入域选择在载体语音离散余弦变换系数的提升小波变换系数中，结合了两种变换各自的优势，混合语音的透明性优于单域隐藏方案，且易于实现。采用标量Costa嵌入算法，接收端对秘密语音进行盲提取，能有效抵抗加性噪声、低通滤波等各种常见信号攻击，具有非常高的鲁棒性。

附图说明：

图1是本发明嵌入系统框图；

图2是本发明提取系统框图；

图3是本发明标量Costa量化策略。

具体实施方式

基于压缩感知和信息隐藏的语音保密通信系统设计包括嵌入系统设计及提取系统设计两部分，下面给出这两部分的主要实施方案。

A、嵌入系统设计(参看图1)

1、采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典的设计

(1)通过级联一个两倍冗余的DCT矩阵和一个两倍冗余的DWT矩阵初始化字典，大小为N×4N(4倍冗余)，其中N为语音信号的帧长。本设计中秘密语音和载体语音均为8KHz采样，帧长N为128。

(2)字典训练

使用大量长度为N的语音数据去训练字典。K-SVD是一个K-均值聚类的过程，包括以下两部分：1)在现有字典上对训练数据做稀疏编码。本设计使用OMP算法计算稀疏系数。2)更新字典，使字典中的原子更加匹配训练数据。字典原子的更新与信号稀疏表示的更新是同步进行的，因此加速了收敛。整个字典训练过程如下。其中Y为训练数据，D为过完备字典(即稀疏基矩阵)，X为系数向量。

目标任务：通过求解公式(1)寻找能够表示数据样本

的最佳字典。

subject to

初始化：用l²范数归一化的列元素初始化矩阵D⁽⁰⁾∈R^N×C，令J＝1。

重复以下步骤直到收敛：

稀疏编码：使用OMP算法，对每一个样本y，通过近似下式的解来计算系数向量x_i：

subject to ‖x_i‖₀≤T₀ (2)

—定义使用原子

的一组样值。

—计算总的表示误差矩阵E_k

E_{k} = Y - \underset{j &NotEqual; k}{Σ} d_{j} x_{T}^{j} - - - (3)

—选择与w_k相关的列元素，得到

—做奇异值分解

选择更新过的字典列元素

作为U的第一列。更新系数向量

使其作为V乘Δ(1，1)的第一列。

置J＝J+1。

2、基于能量分布非均匀特性的压缩感知自适应观测矩阵的设计

根据RIP(Restricted Isometry Property)准则，

对

有如下关系：

(1 - δ_{k}) {| | θ | |}_{2}^{2} \leq {| | ΦΨθ | |}_{2}^{2} \leq (1 + δ_{k}) {| | θ | |}_{2}^{2} - - - (4)

即：

(1 - δ_{k}) {| | θ | |}_{2}^{2} \leq {| | y | |}_{2}^{2} \leq (1 + δ_{k}) {| | θ | |}_{2}^{2} - - - (5)

由公式(5)可知，观测值y的能量分布反映了稀疏系数θ的能量分布。另一方面，语音信号的绝大部分能量集中在k个非零系数上。因此，通过对观测值进行分析，可以得到原始信号的能量分布。通过随机矩阵采样得到的观测序列不能反映原始语音信号的能量分布，于是，我们根据观测值的能量分布自适应的构造观测矩阵。

首先产生一个满秩的随机矩阵

\hat{y} = \hat{Φ} x_{0} = \hat{Φ} Ψθ &Element; R^{N} - - - (6)

遍历

的所有维数为M的子集，找出其中的最大能量子集：

E_{\max}^{M} = \max_{E &Subset; {1,2 . . . C_{N}^{M}}} {| | {\hat{y}}_{U} | |}_{2}^{2} = \max_{E &Subset; {1,2 . . . C_{N}^{M}}} {| | {\hat{Φ}}_{E} x_{0} | |}_{2}^{2} - - - (7)

根据

构造子矩阵

并以

作为自适应观测矩阵，对语音信号投影采样，得到能够反映原始语音能量分布的观测向量。

3、对观测矢量用LBG矢量量化，作为秘密信息嵌入载体语音，嵌入方法为标量Costa算法，嵌入域选择载体语音的离散余弦变换系数的提升小波变换系数，将嵌入秘密信息的载体语音的离散余弦变换系数的提升小波变换系数用提升小波反变换及离散余弦反变换两级变换得到混合语音。

B、提取系统设计(参看图2)

从混合语音中提取秘密语音，即将混合语音进行离散余弦变换和提升小波变换两级变换得到小波变换系数，再通过标量Costa解码算法得到秘密比特流，利用LBG矢量量化解码器得到重构的观测矢量，利用压缩感知正交匹配追踪算法重构秘密语音，再利用小波去噪方法改善重构秘密语音的音质。压缩感知正交匹配追踪重构算法具体如下：

y＝Φx₀＝ΦΨθ＝Ξθ (6)

其中观测投影矩阵Φ与基矩阵Ψ应当是互不相关的。公式(6)显示，投影序列y与原始序列x₀的求解是一个线性代数问题，当M＜N时，有无穷多个解为欠定方程，所以，由公式(6)无法求得确切的重构信号，本发明采用正交匹配追踪算法重构信号，迭代过程如下：

初始r₀＝y；

迭代λ_t＝arg max|<r_t-1，e_j>|，(Ξ＝(e₁…e_m))；

Ξ_{t} = [Ξ_{t - 1}, e_{λ_{t}}];

θ_t＝arg min‖Ξ_tθ-y‖₂；

a_t＝Ξ_tθ_t；

r_t＝y-a_t(t＝1，2，…)。

由最优解θ^*计算原始信号x₀的重构信号x^*＝Ψθ^*。

图3左、右两图分别表示嵌入比特为0及1时的SCS核心量化策略。d_n表示嵌入的观测值量化比特。x_n和s_n分别表示原始音频载体和嵌入秘密语音后的密写信号。从中我们可以看出，当嵌入比特为0时，密写信号的值将集中在量化步长的整数倍附近，即密写信号的量化误差也接近于0。而当嵌入的秘密数据为1时，密写信号的值将集中在二分之一量化步长的奇数倍附近，即密写信号的量化误差接近于二分之一的量化步长。这也是该算法实现盲提取的前提。

下面通过四张表格的数据进一步验证本发明方法的效果。

秘密语音的CS压缩由于采用K奇异值分解方法训练的过完备字典及基于信号能量的自适应观测矩阵，重构效果优于单一的过完备余弦基和过完备小波基(Symmlet小波)及随机观测矩阵下的重构语音。表1显示了观测值未量化条件下，基于不同的稀疏基及观测矩阵所重构的秘密语音的平均分段信噪比。实验中的测试语音(包括秘密语音和载体语音)为8KHz采样，帧长N为128个样点，观测样值数取40，三种稀疏基的尺寸均为N×4N(四倍冗余)。

表1 基于不同稀疏基及观测矩阵的压缩感知重构语音平均分段信噪比

嵌入系统中，嵌入域选择在载体语音中低频DCT系数的LWT系数中，结合了DCT与LWT各自的优势，使得混合语音的透明性较之单域隐藏有一定程度的提升。表2给出本设计采用的嵌入域与普通单域隐藏效果的对比。

表2 混合语音客观质量评价

加性高斯白噪声(Additive White Gaussion Noise：AWGN)是分组交换数据网(PacketSwitched Data Network：PSTN)信道常见的干扰。表3为AWGN攻击下秘密语音的恢复情况。即使当信道中存在可察觉的噪声(信噪比下降到20dB)时，重构语音的误码率仍可控制在9％以下，归一化相关系数保持在91％以上。本设计方案具有良好的抵抗噪声能力。

表3 加性高斯白噪声攻击下秘密信息的恢复情况

表4为系统在低通滤波攻击下的表现。当截止频率f_c下降到2500Hz时，误码率仍可控制在2.5％以下，归一化相关系数保持在97％以上。两级变换比小波域单域隐藏的抗低通滤波能力有明显提升。比单独的DCT域隐藏也有一定的改善。本设计方案能有效抵抗低通滤波攻击。

表4 低通滤波攻击下秘密信息的恢复情况

Claims

1.一种基于压缩感知和信息隐藏的语音保密通信系统设计方法，其特征在于，包括嵌入系统及提取系统的设计，嵌入系统将秘密语音嵌入载体语音得到混合语音，提取系统从混合语音中提取秘密语音，其中：

2.根据权利要求1所述的基于压缩感知和信息隐藏的语音保密通信系统设计方法，其特征在于，

嵌入系统中

1)采用K奇异值分解方法设计针对语音信号的压缩感知过完备字典的具体方法是：通过级联一个两倍冗余的离散余弦变换矩阵和一个两倍冗余的离散小波变换矩阵初始化字典，大小为N×4N，即4倍冗余，其中N为语音信号的帧长，使用大量长度为N的语音数据去训练字典，首先在现有字典上对训练数据做稀疏编码，然后更新字典，使字典中的原子更加匹配训练数据，具体说来，Y为训练数据，D为过完备字典，即稀疏基矩阵，X为系数向量，通过求解下式寻找能够表示数据样本