CN109256141B - 利用语音信道进行数据传输的方法 - Google Patents

利用语音信道进行数据传输的方法 Download PDF

Info

Publication number
CN109256141B
CN109256141B CN201811068965.9A CN201811068965A CN109256141B CN 109256141 B CN109256141 B CN 109256141B CN 201811068965 A CN201811068965 A CN 201811068965A CN 109256141 B CN109256141 B CN 109256141B
Authority
CN
China
Prior art keywords
voice
bit data
symbol
sym
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811068965.9A
Other languages
English (en)
Other versions
CN109256141A (zh
Inventor
陈冰雪
叶达
侯方勇
庞潼川
杨成功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Core Shield Group Co ltd
Original Assignee
Beijing Core Shield Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Core Shield Group Co ltd filed Critical Beijing Core Shield Group Co ltd
Priority to CN201811068965.9A priority Critical patent/CN109256141B/zh
Publication of CN109256141A publication Critical patent/CN109256141A/zh
Application granted granted Critical
Publication of CN109256141B publication Critical patent/CN109256141B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明提供了一种利用语音信道进行数据传输的方法,包括以下步骤:发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;其中,类语音调制的方法为:将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,……Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,……Nsym},S={s1,s2,……sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号。本发明的语音信道进行数据传输的方法,使用反向离散余弦变换IDCT使得频谱能量较集中,便于声码器传输。

Description

利用语音信道进行数据传输的方法
技术领域
本发明属于语音消息领域,具体涉及一种利用语音信道进行数据传输的方法。
背景技术
在一些情况下,数据信道上的传输不可能或者不方便实现,由于语音信道的覆盖和使用比数据信道更加广泛,并且以类语音的形式传送数据,能够在相同的通信环境中从正常语音切换到加密语音,在安全性上更有保障,因此在语音信道上传输数据成为了很好的选择。然而,现有的传输方法频谱利用率低而且误码率高。
发明内容
本发明的一个目的是解决上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种利用语音信道进行数据传输的方法,使用反向离散余弦变换IDCT使得频谱能量较集中,便于声码器传输。
为了实现根据本发明的这些目的和其它优点,提供了一种利用语音信道进行数据传输的方法,包括以下步骤:
发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;
其中,类语音调制的方法为:
将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,......Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......Nsym},S={s1,s2,......sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号,其中符号波形的生成步骤为:
A1、在
Figure BDA0001799032000000011
中选择Nf个实数Gi,用于产生符号频谱φ,且频谱φ的频率在300~3400Hz之间,其中,
Figure BDA0001799032000000012
A2、使用实数Gi构造Nf个频谱分量:
Figure BDA0001799032000000021
A3、利用反向离散余弦变换IDCT将φi由频域转到时域:si=IDCT(φi),si为实数符号波形;
A4、对实数符号波形的功率进行归一化处理,即得符号波形,重复上述步骤,直至产生Nsym个符号波形作为码本。
优选的是,所述的利用语音信道进行数据传输的方法,接收端将接收到的类语音信号解调之前还包括:
S1、构建与多组与B比特对应的比特数据流,并将多组比特数据流随机排列,生成训练样本库;对接收到的十进制索引i对应的符号波形分别进行GMM模型训练,得到十进制索引i对应的符号波形的GMM模型中参数λopt={ωmmm}的最优值,ωmmm分别为混合分量的权值,均值矢量,协方差矩阵;
S2、通过最优值λopt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i,然后依据该十进制索引确定对应的比特数据流,将比特数据流首尾相连即完成解调。
优选的是,所述的利用语音信道进行数据传输的方法,最优值λopt通过以下方法得到:利用K-means算法计算初始参数λ,然后通过EM算法,利用初始参数λ计算得到新的参数λ',循环迭代,直至新的参数达到收敛界限,从而得到最优参数λopt
本发明至少包括以下效果:
1、本发明的利用语音信道进行数据传输的方法,使用反向离散余弦变换IDCT使得频谱能量较集中,便于声码器传输。
2、本发明的利用语音信道进行数据传输的方法,通过对码本中的符号波形进行GMM模型训练,提高匹配的准确性,从而降低误码率。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的符号波形示意图;
图2为本发明的不经过GMM模型训练得到的误码率;
图3为本发明的经过GMM模型训练得到的误码率。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
一种利用语音信道进行数据传输的方法,包括以下步骤:
发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;
其中,类语音调制的方法为:
将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,......Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......Nsym},S={s1,s2,......sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号,其中符号波形的生成步骤为:
A1、在
Figure BDA0001799032000000031
中选择Nf个实数Gi,用于产生符号频谱φ,且频谱φ的频率在300~3400Hz之间,其中,
Figure BDA0001799032000000032
A2、使用实数Gi构造Nf个频谱分量:
Figure BDA0001799032000000033
其中,
Figure BDA0001799032000000034
fs为采样频率;
A3、利用反向离散余弦变换IDCT将φi由频域转到时域:si=IDCT(φi),si为实数符号波形;
A4、对实数符号波形的功率进行归一化处理,即得符号波形,重复上述步骤,直至产生Nsym个符号波形作为码本。
所述的利用语音信道进行数据传输的方法,接收端将接收到的类语音信号解调之前还包括:
S1、构建与多组与B比特对应的比特数据流,并将多组比特数据流随机排列,生成训练样本库;对接收到的十进制索引i对应的符号波形分别进行GMM模型训练,得到十进制索引i对应的符号波形的GMM模型中参数λopt={ωmmm}的最优值,ωmmm分别为混合分量的权值,均值矢量,协方差矩阵;
S2、通过最优值λopt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i,然后依据该十进制索引确定对应的比特数据流,将比特数据流首尾相连即完成解调。
所述的利用语音信道进行数据传输的方法,最优值λopt通过以下方法得到:利用K-means算法计算初始参数λ,然后通过EM算法,利用初始参数λ计算得到新的参数λ',循环迭代,直至新的参数达到收敛界限,从而得到最优参数λopt
以下以具体实施例进行说明,将比特数据流分成3比特为一组,将3比特数据构建十进制索引i,则有Nsym=23=8个索引值,构建码本S={si,i=1,2,3,......8},将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......8},S={s1,s2,......s8},映射完成后,将这些符号波形首尾相连即转换成类语音信号,假如比特数据流的采样频率为fs=8KHz,码率为1.3Kbps,也就是平均一个比特用6个样本点来表示,即si为由L=3*6=18个样点构成的符号波形,也就是找18个点来代替三个比特,有8种可能性,比如(000,001,010,011,100,101,110,111),那么就需要八个不同的十八个点组成的符号波形作为码本,其中符号波形的生成步骤为:
Figure BDA0001799032000000041
中选择8个实数Gk,用于产生符号频谱,使用实数构造8个频谱分量:
Figure BDA0001799032000000042
然后利用离散余弦逆变换IDCT将φi由频域转到时域:
Figure BDA0001799032000000043
Figure BDA0001799032000000044
为18点的实数符号波形,对符号波形的功率进行归一化处理,产生最终的时域符号波形
Figure BDA0001799032000000045
按照这个步骤产生8个符号波形作为码本,利用MATLAB软件编写程序产生初始码本,生成8个符号波形如图1所示。
构建多组与3比特对应的比特数据流,比如构建N组与3比特对应的比特数据流,这里取N=2000,实际中N还可以取其他值具体可以根据符号波形进行确定,这里构建2000组与3比特对应的比特数据流,即该组比特数据流包括2000个000,2000个001,2000个010,2000个011,2000个100,2000个101,2000个110,2000个111,则总共有16000组比特数据流,将16000组比特数据流随机排列并组成训练样本库,则接收端接收到的符号波形在16000组比特数据流中存在一一对应,比如,码本内第一个符号波形对应16000组比特数据流中的比特数据位置为index1,同理第二个符号波形对应的位置为index2,...,第Nsym个波形所在位置的索引为
Figure BDA0001799032000000051
在接收端,
Figure BDA0001799032000000052
为接收端接收到的第一个符号波形的接收数据,
Figure BDA0001799032000000053
为接收端接收到的第二个符号波形的接收数据,...,
Figure BDA0001799032000000054
为第Nsym个波形的接收数据。
接收端对接收到的符号波形进行GMM模型训练,GMM模型的混合数为M(这边取M=12),即用M个高斯分布的加权和来表示:
Figure BDA0001799032000000055
其中,y为L维观测矢量,ωm(m=1,2,…,M)为混合权值,且满足
Figure BDA0001799032000000056
pm(y|μmm)为高斯函数,是GMM的第m个高斯分量,μm为均值矢量,Σm为协方差矩阵,有:
Figure BDA0001799032000000057
通常用均值矢量、协方差矩阵、混合分量的权值来表示GMM,所以会得到一个GMM参数有:λ={ωmmm}(m=1,2,…,M),进行GMM训练时,我们希望能找到最能代表码本接收波形的最优参数λopt,比如,
Figure BDA0001799032000000058
为码本中第一个符号波形经过声码器,无线信道等的接收波形,GMM模型的概率为:
Figure BDA0001799032000000059
上式称为似然函数,其中
Figure BDA00017990320000000510
Figure BDA00017990320000000511
的第n行,由于单个点的概率比较小,它们的乘积可能会造成浮点数溢出,所以通过取其对数形式转化成相加的形式,得到log似然函数:
Figure BDA0001799032000000061
我们可利用期望值最大化EM算法反复地估算最大可能性的高斯混合模型参数,直到收敛为止。
使用EM算法之前首先利用K-means算法计算得到初始参数λ,通过最小化各个点到中心点的距离的平方和来完成,具体初始化步骤为:
(1)初始聚类中心有M个矢量组成,这些矢量可以随意选取,为了简单我们选取
Figure BDA0001799032000000062
的前M行作为初始矢量(z1(1),z2(1),…,zM(1));
(2)数据共有M个聚类,
Figure BDA0001799032000000063
作为一个样本,由最小距离的准则,计算出距离最小的那个聚类,计算公式如下:
Figure BDA0001799032000000064
并且a,b=1,2,…,M
从而将
Figure BDA0001799032000000065
归于第a类Sa
(3)更新聚类中心,其中Nm为聚类Sm中的样本数目:
Figure BDA0001799032000000066
(3)若|zm(i+1)-zm(i)|≥δ则转到(2)继续;
(4)初始化GMM模型的各个参数:
Figure BDA0001799032000000067
Figure BDA0001799032000000068
Figure BDA0001799032000000069
为协方差矩阵Σm对角线的值。
得到初始化参数λ之后,采用EM算法来估计模型参数,EM算法的主要目的就是找到一个λ使得
Figure BDA00017990320000000610
最大,具体作法是根据初始参数λ来估算新的模型参数λ',使得
Figure BDA0001799032000000071
然后新的模型参数λ'变成新的初始参数,反复的重复此步骤,直到
Figure BDA0001799032000000072
收敛为止。具体步骤为:
(1)E-step:估计每个单一高斯概率密度函数生成的概率,对于数据
Figure BDA0001799032000000073
来说由第m个单一高斯概率密度函数生成的概率即ωm的后验概率为:
Figure BDA0001799032000000074
(2)M-step:估计每个单一高斯概率分布的参数。
更新权值:
Figure BDA0001799032000000075
更新均值:
Figure BDA0001799032000000076
更新协方差矩阵:
Figure BDA0001799032000000077
反复进行迭代,重复上面的步骤,直到|λ-λ'|≤ε,其中ε为很小的参数,比如为0.0000000001,就这样得到了码本中第一个符号波形的最优参数值
Figure BDA0001799032000000078
ω为1×M的权值矩阵,μ为L×M的均值矩阵,Σ为L×L×M的协方差矩阵。同样的,可以求出码本中第一个波形的最优参数值
Figure BDA0001799032000000079
...,码本中波形Nsym的最优参数
Figure BDA00017990320000000710
即码本中Nsym个不同符号波形有Nsym个GMM模型参数
Figure BDA00017990320000000711
一个1×L的接收样本x,通过GMM模型找到一个最大后验概率值的模型:
Figure BDA0001799032000000081
即通过最优值λopt在接收到的符号波形中根据GMM模型计算概率即得到对应波形的十进制索引i,然后依据该十进制索引i确定对应的比特数据流。比如求得i=1,其对应的比特数据流为000,求得i=8,其对应的比特数据流为111,然后将对应的比特数据流按顺序排列,解调完成。
图2为以联通苹果-联通华为例,总共传输200帧信号,每帧3000个比特,码率为1.33kbps,每个比特采样6个点,不经过GMM模型训练得到的误码率。平均误码率为千分之三点五,其中误码率小于千分之五的帧占百分之七十五以上。
图3为经过GMM模型训练得到的误码率,平均误码率为万分之一,其中误码率小于千分之五的帧占百分之九十九以上。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (2)

1.一种利用语音信道进行数据传输的方法,其特征在于,包括以下步骤:
发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;
其中,类语音调制的方法为:
将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,......Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......Nsym},S={s1,s2,......sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号,其中符号波形的生成步骤为:
A1、在
Figure FDA0004045785730000011
中选择Nf个实数Gi,用于产生符号频谱φ,且频谱φ的频率在300~3400Hz之间,其中,
Figure FDA0004045785730000012
A2、使用实数Gi构造Nf个频谱分量:
Figure FDA0004045785730000013
A3、利用反向离散余弦变换IDCT将φi由频域转到时域:si=IDCT(φi),si为实数符号波形;
A4、对实数符号波形的功率进行归一化处理,即得符号波形,重复上述步骤,直至产生Nsym个符号波形作为码本;
接收端将接收到的类语音信号解调之前还包括:
S1、构建多组与B比特对应的比特数据流,并将多组比特数据流随机排列,生成训练样本库;对接收到的十进制索引i对应的符号波形分别进行GMM模型训练,得到十进制索引i对应的符号波形的GMM模型中参数λopt={ωmmm}的最优值,ωmmm分别为混合分量的权值,均值矢量,协方差矩阵;
S2、通过最优值λopt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i,然后依据该十进制索引i确定对应的比特数据流,将比特数据流首尾相连即完成解调。
2.如权利要求1所述的利用语音信道进行数据传输的方法,其特征在于,最优值λopt通过以下方法得到:利用K-means算法计算初始参数λ,然后通过EM算法,利用初始参数λ计算得到新的参数λ',循环迭代,直至新的参数达到收敛界限,从而得到最优参数λopt
CN201811068965.9A 2018-09-13 2018-09-13 利用语音信道进行数据传输的方法 Active CN109256141B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811068965.9A CN109256141B (zh) 2018-09-13 2018-09-13 利用语音信道进行数据传输的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811068965.9A CN109256141B (zh) 2018-09-13 2018-09-13 利用语音信道进行数据传输的方法

Publications (2)

Publication Number Publication Date
CN109256141A CN109256141A (zh) 2019-01-22
CN109256141B true CN109256141B (zh) 2023-03-28

Family

ID=65047556

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811068965.9A Active CN109256141B (zh) 2018-09-13 2018-09-13 利用语音信道进行数据传输的方法

Country Status (1)

Country Link
CN (1) CN109256141B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109887519B (zh) * 2019-03-14 2021-05-11 北京芯盾集团有限公司 提高语音信道数据传输准确性的方法
CN111818519B (zh) * 2020-07-16 2022-02-11 郑州信大捷安信息技术股份有限公司 一种端到端语音加密、解密方法及系统
CN113037781A (zh) * 2021-04-29 2021-06-25 广东工业大学 基于rnn的语音信息加密方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110214A (zh) * 2007-08-10 2008-01-23 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0203834D0 (en) * 2002-02-19 2002-04-03 Univ Surrey Data transmission
CN101496097A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于在与语音信号相关联的包中包含识别符的系统及方法
CN101290774B (zh) * 2007-01-31 2011-09-07 广州广晟数码技术有限公司 音频编码和解码系统
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8249865B2 (en) * 2009-11-23 2012-08-21 Airbiquity Inc. Adaptive data transmission for a digital in-band modem operating over a voice channel
CN102737637B (zh) * 2011-12-31 2013-11-27 清华大学 一种利用类语音调制解调进行数据传输的方法
CN103399191B (zh) * 2013-07-25 2016-06-22 哈尔滨理工大学 基于边带解调的fbg-gmm电流传感方法
US9774354B2 (en) * 2014-07-10 2017-09-26 King Abdullah University Of Science And Technology Generation of correlated finite alphabet waveforms using Gaussian random variables
CN104882144B (zh) * 2015-05-06 2018-10-30 福州大学 基于声谱图双特征的动物声音识别方法
US10158394B2 (en) * 2015-05-11 2018-12-18 Cohere Technologies, Inc. Systems and methods for symplectic orthogonal time frequency shifting modulation and transmission of data
CN105846946B (zh) * 2016-03-22 2018-09-25 中国人民解放军国防科学技术大学 基于子载波索引调制的物理层安全传输方法
CN107786574A (zh) * 2017-11-10 2018-03-09 芯盾(北京)信息技术有限公司 移动终端的语音通信信源加密系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101110214A (zh) * 2007-08-10 2008-01-23 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法

Also Published As

Publication number Publication date
CN109256141A (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
Weng et al. Semantic communication systems for speech transmission
Weng et al. Deep learning enabled semantic communications with speech recognition and synthesis
CN109326283B (zh) 非平行文本条件下基于文本编码器的多对多语音转换方法
CN109256141B (zh) 利用语音信道进行数据传输的方法
CN110275939B (zh) 对话生成模型的确定方法及装置、存储介质、电子设备
CN110060701B (zh) 基于vawgan-ac的多对多语音转换方法
CN110211575A (zh) 用于数据增强的语音加噪方法及系统
CN113381828B (zh) 基于条件生成对抗网络的稀疏码多址接入随机信道建模方法
CN102238190A (zh) 身份认证方法及系统
CN110473557B (zh) 一种基于深度自编码器的语音信号编解码方法
CN110060657B (zh) 基于sn的多对多说话人转换方法
CN110491400B (zh) 一种基于深度自编码器的语音信号重建方法
Bridle et al. Recnorm: Simultaneous normalisation and classification applied to speech recognition
CN110060691B (zh) 基于i向量和VARSGAN的多对多语音转换方法
US8271278B2 (en) Quantizing feature vectors in decision-making applications
CN110459232A (zh) 一种基于循环生成对抗网络的语音转换方法
CN111010356A (zh) 一种基于支持向量机的水声通信信号调制方式识别方法
CN112786003A (zh) 语音合成模型训练方法、装置、终端设备及存储介质
CN109308316B (zh) 一种基于主题聚类的自适应对话生成系统
US20240112037A1 (en) Automatic modulation classification method based on deep learning network fusion
Hammami et al. Tree distribution classifier for automatic spoken arabic digit recognition
CN114360500B (zh) 语音识别方法和装置、电子设备及存储介质
Zhong et al. Multimodal deep learning model for specific emitter identification
Gutkin et al. Quantized HMMs for low footprint text-to-speech synthesis.
CN112821971A (zh) 一种基于对抗式学习的时变信道信号检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100085 Beijing Haidian District, Northeast Wangxi Road, No. 8 Courtyard, 2nd Floor 217

Applicant after: BEIJING CORE SHIELD GROUP Co.,Ltd.

Address before: 102402 room 4, 4 floor, 2 building, 85 Hong Yuan Road, Fangshan District, Beijing.

Applicant before: CORE SHIELD (BEIJING) INFORMATION TECHNOLOGY Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant