CN109256141B

CN109256141B - 利用语音信道进行数据传输的方法

Info

Publication number: CN109256141B
Application number: CN201811068965.9A
Authority: CN
Inventors: 陈冰雪; 叶达; 侯方勇; 庞潼川; 杨成功
Original assignee: Beijing Core Shield Group Co ltd
Current assignee: Beijing Core Shield Group Co ltd
Priority date: 2018-09-13
Filing date: 2018-09-13
Publication date: 2023-03-28
Anticipated expiration: 2038-09-13
Also published as: CN109256141A

Abstract

本发明提供了一种利用语音信道进行数据传输的方法，包括以下步骤：发送端将需要传输的比特数据进行类语音调制，转换成类语音信号，并将类语音信号在语音信道上进行传输，接收端将接收到的类语音信号解调为比特数据；其中，类语音调制的方法为：将比特数据流分成B比特一组，将B比特数据构建十进制索引i，则有N_sym＝2^B个索引值，构建码本S＝{s_i,i＝1,2,3,……N_sym}，其中s_i为由L个样点构成的符号波形，将一个十进制的标量i编码成一个矢量符号s_i的映射：I→S，其中，I＝{1,2,3,……N_sym}，S＝{s₁,s₂,……s_Nsym}，映射完成后，将这些符号波形首尾相连即转换成类语音信号。本发明的语音信道进行数据传输的方法，使用反向离散余弦变换IDCT使得频谱能量较集中，便于声码器传输。

Description

利用语音信道进行数据传输的方法

技术领域

本发明属于语音消息领域，具体涉及一种利用语音信道进行数据传输的方法。

背景技术

在一些情况下，数据信道上的传输不可能或者不方便实现，由于语音信道的覆盖和使用比数据信道更加广泛，并且以类语音的形式传送数据，能够在相同的通信环境中从正常语音切换到加密语音，在安全性上更有保障，因此在语音信道上传输数据成为了很好的选择。然而，现有的传输方法频谱利用率低而且误码率高。

发明内容

本发明的一个目的是解决上述问题，并提供至少后面将说明的优点。

本发明还有一个目的是提供一种利用语音信道进行数据传输的方法，使用反向离散余弦变换IDCT使得频谱能量较集中，便于声码器传输。

为了实现根据本发明的这些目的和其它优点，提供了一种利用语音信道进行数据传输的方法，包括以下步骤：

发送端将需要传输的比特数据进行类语音调制，转换成类语音信号，并将类语音信号在语音信道上进行传输，接收端将接收到的类语音信号解调为比特数据；

其中，类语音调制的方法为：

将比特数据流分成B比特一组，将B比特数据构建十进制索引i，则有N_sym＝2^B个索引值，构建码本S＝{s_i,i＝1,2,3,......N_sym}，其中s_i为由L个样点构成的符号波形，将一个十进制的标量i编码成一个矢量符号s_i的映射：I→S，其中，I＝{1,2,3,......N_sym}，S＝{s₁,s₂,......s_Nsym}，映射完成后，将这些符号波形首尾相连即转换成类语音信号，其中符号波形的生成步骤为：

A1、在

中选择N_f个实数G_i，用于产生符号频谱φ，且频谱φ的频率在300～3400Hz之间，其中，

A2、使用实数G_i构造N_f个频谱分量：

A3、利用反向离散余弦变换IDCT将φ_i由频域转到时域：s_i＝IDCT(φ_i)，s_i为实数符号波形；

A4、对实数符号波形的功率进行归一化处理，即得符号波形，重复上述步骤，直至产生N_sym个符号波形作为码本。

优选的是，所述的利用语音信道进行数据传输的方法，接收端将接收到的类语音信号解调之前还包括：

S1、构建与多组与B比特对应的比特数据流，并将多组比特数据流随机排列，生成训练样本库；对接收到的十进制索引i对应的符号波形分别进行GMM模型训练，得到十进制索引i对应的符号波形的GMM模型中参数λ^opt＝{ω_m,μ_m,Σ_m}的最优值，ω_m,μ_m,Σ_m分别为混合分量的权值，均值矢量，协方差矩阵；

S2、通过最优值λ^opt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i，然后依据该十进制索引确定对应的比特数据流，将比特数据流首尾相连即完成解调。

优选的是，所述的利用语音信道进行数据传输的方法，最优值λ^opt通过以下方法得到：利用K-means算法计算初始参数λ，然后通过EM算法，利用初始参数λ计算得到新的参数λ'，循环迭代，直至新的参数达到收敛界限，从而得到最优参数λ^opt。

本发明至少包括以下效果：

1、本发明的利用语音信道进行数据传输的方法，使用反向离散余弦变换IDCT使得频谱能量较集中，便于声码器传输。

2、本发明的利用语音信道进行数据传输的方法，通过对码本中的符号波形进行GMM模型训练，提高匹配的准确性，从而降低误码率。

本发明的其它优点、目标和特征将部分通过下面的说明体现，部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。

附图说明

图1为本发明的符号波形示意图；

图2为本发明的不经过GMM模型训练得到的误码率；

图3为本发明的经过GMM模型训练得到的误码率。

具体实施方式

下面结合附图对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

一种利用语音信道进行数据传输的方法，包括以下步骤：

其中，类语音调制的方法为：

A1、在

A2、使用实数G_i构造N_f个频谱分量：

其中，

f_s为采样频率；

所述的利用语音信道进行数据传输的方法，接收端将接收到的类语音信号解调之前还包括：

所述的利用语音信道进行数据传输的方法，最优值λ^opt通过以下方法得到：利用K-means算法计算初始参数λ，然后通过EM算法，利用初始参数λ计算得到新的参数λ'，循环迭代，直至新的参数达到收敛界限，从而得到最优参数λ^opt。

以下以具体实施例进行说明，将比特数据流分成3比特为一组，将3比特数据构建十进制索引i，则有N_sym＝2³＝8个索引值，构建码本S＝{s_i,i＝1,2,3,......8}，将一个十进制的标量i编码成一个矢量符号s_i的映射：I→S，其中，I＝{1,2,3,......8}，S＝{s₁,s₂,......s₈}，映射完成后，将这些符号波形首尾相连即转换成类语音信号，假如比特数据流的采样频率为f_s＝8KHz，码率为1.3Kbps，也就是平均一个比特用6个样本点来表示，即s_i为由L＝3*6＝18个样点构成的符号波形，也就是找18个点来代替三个比特，有8种可能性，比如(000，001，010，011，100，101，110，111)，那么就需要八个不同的十八个点组成的符号波形作为码本，其中符号波形的生成步骤为：

在

中选择8个实数G_k，用于产生符号频谱，使用实数构造8个频谱分量：

然后利用离散余弦逆变换IDCT将φ_i由频域转到时域：

为18点的实数符号波形，对符号波形的功率进行归一化处理，产生最终的时域符号波形

按照这个步骤产生8个符号波形作为码本，利用MATLAB软件编写程序产生初始码本，生成8个符号波形如图1所示。

构建多组与3比特对应的比特数据流，比如构建N组与3比特对应的比特数据流，这里取N＝2000，实际中N还可以取其他值具体可以根据符号波形进行确定，这里构建2000组与3比特对应的比特数据流，即该组比特数据流包括2000个000，2000个001，2000个010，2000个011，2000个100，2000个101，2000个110，2000个111，则总共有16000组比特数据流，将16000组比特数据流随机排列并组成训练样本库，则接收端接收到的符号波形在16000组比特数据流中存在一一对应，比如，码本内第一个符号波形对应16000组比特数据流中的比特数据位置为index₁，同理第二个符号波形对应的位置为index₂，...，第N_sym个波形所在位置的索引为

在接收端，

为接收端接收到的第一个符号波形的接收数据，

为接收端接收到的第二个符号波形的接收数据，...，

为第N_sym个波形的接收数据。

接收端对接收到的符号波形进行GMM模型训练，GMM模型的混合数为M(这边取M＝12)，即用M个高斯分布的加权和来表示：

其中，y为L维观测矢量，ω_m(m＝1,2,…,M)为混合权值，且满足

p_m(y|μ_m,Σ_m)为高斯函数，是GMM的第m个高斯分量，μ_m为均值矢量，Σ_m为协方差矩阵，有：

通常用均值矢量、协方差矩阵、混合分量的权值来表示GMM，所以会得到一个GMM参数有：λ＝{ω_m,μ_m,Σ_m}(m＝1,2,…,M)，进行GMM训练时，我们希望能找到最能代表码本接收波形的最优参数λ^opt，比如，

为码本中第一个符号波形经过声码器，无线信道等的接收波形，GMM模型的概率为：

上式称为似然函数，其中

为

的第n行，由于单个点的概率比较小，它们的乘积可能会造成浮点数溢出，所以通过取其对数形式转化成相加的形式，得到log似然函数：

我们可利用期望值最大化EM算法反复地估算最大可能性的高斯混合模型参数，直到收敛为止。

使用EM算法之前首先利用K-means算法计算得到初始参数λ，通过最小化各个点到中心点的距离的平方和来完成，具体初始化步骤为：

(1)初始聚类中心有M个矢量组成，这些矢量可以随意选取，为了简单我们选取

的前M行作为初始矢量(z₁(1),z₂(1),…,z_M(1))；

(2)数据共有M个聚类，

作为一个样本，由最小距离的准则，计算出距离最小的那个聚类，计算公式如下：

并且a,b＝1,2,…,M

从而将

归于第a类S_a；

(3)更新聚类中心，其中N_m为聚类S_m中的样本数目：

(3)若|z_m(i+1)-z_m(i)|≥δ则转到(2)继续；

(4)初始化GMM模型的各个参数：

为协方差矩阵Σ_m对角线的值。

得到初始化参数λ之后，采用EM算法来估计模型参数，EM算法的主要目的就是找到一个λ使得

最大，具体作法是根据初始参数λ来估算新的模型参数λ'，使得

然后新的模型参数λ'变成新的初始参数，反复的重复此步骤，直到

收敛为止。具体步骤为：

(1)E-step:估计每个单一高斯概率密度函数生成的概率，对于数据

来说由第m个单一高斯概率密度函数生成的概率即ω_m的后验概率为：

(2)M-step:估计每个单一高斯概率分布的参数。

更新权值：

更新均值：

更新协方差矩阵：

反复进行迭代，重复上面的步骤，直到|λ-λ'|≤ε，其中ε为很小的参数，比如为0.0000000001，就这样得到了码本中第一个符号波形的最优参数值

ω为1×M的权值矩阵，μ为L×M的均值矩阵，Σ为L×L×M的协方差矩阵。同样的，可以求出码本中第一个波形的最优参数值

...，码本中波形N_sym的最优参数

即码本中N_sym个不同符号波形有N_sym个GMM模型参数

一个1×L的接收样本x，通过GMM模型找到一个最大后验概率值的模型：

即通过最优值λ^opt在接收到的符号波形中根据GMM模型计算概率即得到对应波形的十进制索引i，然后依据该十进制索引i确定对应的比特数据流。比如求得i＝1，其对应的比特数据流为000，求得i＝8，其对应的比特数据流为111，然后将对应的比特数据流按顺序排列，解调完成。

图2为以联通苹果-联通华为例，总共传输200帧信号，每帧3000个比特，码率为1.33kbps，每个比特采样6个点，不经过GMM模型训练得到的误码率。平均误码率为千分之三点五，其中误码率小于千分之五的帧占百分之七十五以上。

图3为经过GMM模型训练得到的误码率，平均误码率为万分之一，其中误码率小于千分之五的帧占百分之九十九以上。

应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图例。

Claims

1.一种利用语音信道进行数据传输的方法，其特征在于，包括以下步骤：

其中，类语音调制的方法为：

A1、在

A2、使用实数G_i构造N_f个频谱分量：

A4、对实数符号波形的功率进行归一化处理，即得符号波形，重复上述步骤，直至产生N_sym个符号波形作为码本；

接收端将接收到的类语音信号解调之前还包括：

S1、构建多组与B比特对应的比特数据流，并将多组比特数据流随机排列，生成训练样本库；对接收到的十进制索引i对应的符号波形分别进行GMM模型训练，得到十进制索引i对应的符号波形的GMM模型中参数λ^opt＝{ω_m,μ_m,Σ_m}的最优值，ω_m,μ_m,Σ_m分别为混合分量的权值，均值矢量，协方差矩阵；

S2、通过最优值λ^opt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i，然后依据该十进制索引i确定对应的比特数据流，将比特数据流首尾相连即完成解调。

2.如权利要求1所述的利用语音信道进行数据传输的方法，其特征在于，最优值λ^opt通过以下方法得到：利用K-means算法计算初始参数λ，然后通过EM算法，利用初始参数λ计算得到新的参数λ'，循环迭代，直至新的参数达到收敛界限，从而得到最优参数λ^opt。