CN109256141B - 利用语音信道进行数据传输的方法 - Google Patents
利用语音信道进行数据传输的方法 Download PDFInfo
- Publication number
- CN109256141B CN109256141B CN201811068965.9A CN201811068965A CN109256141B CN 109256141 B CN109256141 B CN 109256141B CN 201811068965 A CN201811068965 A CN 201811068965A CN 109256141 B CN109256141 B CN 109256141B
- Authority
- CN
- China
- Prior art keywords
- voice
- bit data
- symbol
- sym
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000005540 biological transmission Effects 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 238000001228 spectrum Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
本发明提供了一种利用语音信道进行数据传输的方法,包括以下步骤:发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;其中,类语音调制的方法为:将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,……Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,……Nsym},S={s1,s2,……sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号。本发明的语音信道进行数据传输的方法,使用反向离散余弦变换IDCT使得频谱能量较集中,便于声码器传输。
Description
技术领域
本发明属于语音消息领域,具体涉及一种利用语音信道进行数据传输的方法。
背景技术
在一些情况下,数据信道上的传输不可能或者不方便实现,由于语音信道的覆盖和使用比数据信道更加广泛,并且以类语音的形式传送数据,能够在相同的通信环境中从正常语音切换到加密语音,在安全性上更有保障,因此在语音信道上传输数据成为了很好的选择。然而,现有的传输方法频谱利用率低而且误码率高。
发明内容
本发明的一个目的是解决上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种利用语音信道进行数据传输的方法,使用反向离散余弦变换IDCT使得频谱能量较集中,便于声码器传输。
为了实现根据本发明的这些目的和其它优点,提供了一种利用语音信道进行数据传输的方法,包括以下步骤:
发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;
其中,类语音调制的方法为:
将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,......Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......Nsym},S={s1,s2,......sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号,其中符号波形的生成步骤为:
A2、使用实数Gi构造Nf个频谱分量:
A3、利用反向离散余弦变换IDCT将φi由频域转到时域:si=IDCT(φi),si为实数符号波形;
A4、对实数符号波形的功率进行归一化处理,即得符号波形,重复上述步骤,直至产生Nsym个符号波形作为码本。
优选的是,所述的利用语音信道进行数据传输的方法,接收端将接收到的类语音信号解调之前还包括:
S1、构建与多组与B比特对应的比特数据流,并将多组比特数据流随机排列,生成训练样本库;对接收到的十进制索引i对应的符号波形分别进行GMM模型训练,得到十进制索引i对应的符号波形的GMM模型中参数λopt={ωm,μm,Σm}的最优值,ωm,μm,Σm分别为混合分量的权值,均值矢量,协方差矩阵;
S2、通过最优值λopt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i,然后依据该十进制索引确定对应的比特数据流,将比特数据流首尾相连即完成解调。
优选的是,所述的利用语音信道进行数据传输的方法,最优值λopt通过以下方法得到:利用K-means算法计算初始参数λ,然后通过EM算法,利用初始参数λ计算得到新的参数λ',循环迭代,直至新的参数达到收敛界限,从而得到最优参数λopt。
本发明至少包括以下效果:
1、本发明的利用语音信道进行数据传输的方法,使用反向离散余弦变换IDCT使得频谱能量较集中,便于声码器传输。
2、本发明的利用语音信道进行数据传输的方法,通过对码本中的符号波形进行GMM模型训练,提高匹配的准确性,从而降低误码率。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的符号波形示意图;
图2为本发明的不经过GMM模型训练得到的误码率;
图3为本发明的经过GMM模型训练得到的误码率。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
一种利用语音信道进行数据传输的方法,包括以下步骤:
发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;
其中,类语音调制的方法为:
将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,......Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......Nsym},S={s1,s2,......sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号,其中符号波形的生成步骤为:
A2、使用实数Gi构造Nf个频谱分量:
A3、利用反向离散余弦变换IDCT将φi由频域转到时域:si=IDCT(φi),si为实数符号波形;
A4、对实数符号波形的功率进行归一化处理,即得符号波形,重复上述步骤,直至产生Nsym个符号波形作为码本。
所述的利用语音信道进行数据传输的方法,接收端将接收到的类语音信号解调之前还包括:
S1、构建与多组与B比特对应的比特数据流,并将多组比特数据流随机排列,生成训练样本库;对接收到的十进制索引i对应的符号波形分别进行GMM模型训练,得到十进制索引i对应的符号波形的GMM模型中参数λopt={ωm,μm,Σm}的最优值,ωm,μm,Σm分别为混合分量的权值,均值矢量,协方差矩阵;
S2、通过最优值λopt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i,然后依据该十进制索引确定对应的比特数据流,将比特数据流首尾相连即完成解调。
所述的利用语音信道进行数据传输的方法,最优值λopt通过以下方法得到:利用K-means算法计算初始参数λ,然后通过EM算法,利用初始参数λ计算得到新的参数λ',循环迭代,直至新的参数达到收敛界限,从而得到最优参数λopt。
以下以具体实施例进行说明,将比特数据流分成3比特为一组,将3比特数据构建十进制索引i,则有Nsym=23=8个索引值,构建码本S={si,i=1,2,3,......8},将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......8},S={s1,s2,......s8},映射完成后,将这些符号波形首尾相连即转换成类语音信号,假如比特数据流的采样频率为fs=8KHz,码率为1.3Kbps,也就是平均一个比特用6个样本点来表示,即si为由L=3*6=18个样点构成的符号波形,也就是找18个点来代替三个比特,有8种可能性,比如(000,001,010,011,100,101,110,111),那么就需要八个不同的十八个点组成的符号波形作为码本,其中符号波形的生成步骤为:
构建多组与3比特对应的比特数据流,比如构建N组与3比特对应的比特数据流,这里取N=2000,实际中N还可以取其他值具体可以根据符号波形进行确定,这里构建2000组与3比特对应的比特数据流,即该组比特数据流包括2000个000,2000个001,2000个010,2000个011,2000个100,2000个101,2000个110,2000个111,则总共有16000组比特数据流,将16000组比特数据流随机排列并组成训练样本库,则接收端接收到的符号波形在16000组比特数据流中存在一一对应,比如,码本内第一个符号波形对应16000组比特数据流中的比特数据位置为index1,同理第二个符号波形对应的位置为index2,...,第Nsym个波形所在位置的索引为在接收端,为接收端接收到的第一个符号波形的接收数据,
接收端对接收到的符号波形进行GMM模型训练,GMM模型的混合数为M(这边取M=12),即用M个高斯分布的加权和来表示:
通常用均值矢量、协方差矩阵、混合分量的权值来表示GMM,所以会得到一个GMM参数有:λ={ωm,μm,Σm}(m=1,2,…,M),进行GMM训练时,我们希望能找到最能代表码本接收波形的最优参数λopt,比如,为码本中第一个符号波形经过声码器,无线信道等的接收波形,GMM模型的概率为:
我们可利用期望值最大化EM算法反复地估算最大可能性的高斯混合模型参数,直到收敛为止。
使用EM算法之前首先利用K-means算法计算得到初始参数λ,通过最小化各个点到中心点的距离的平方和来完成,具体初始化步骤为:
(3)更新聚类中心,其中Nm为聚类Sm中的样本数目:
(3)若|zm(i+1)-zm(i)|≥δ则转到(2)继续;
(4)初始化GMM模型的各个参数:
得到初始化参数λ之后,采用EM算法来估计模型参数,EM算法的主要目的就是找到一个λ使得最大,具体作法是根据初始参数λ来估算新的模型参数λ',使得然后新的模型参数λ'变成新的初始参数,反复的重复此步骤,直到收敛为止。具体步骤为:
(2)M-step:估计每个单一高斯概率分布的参数。
更新权值:
更新均值:
更新协方差矩阵:
反复进行迭代,重复上面的步骤,直到|λ-λ'|≤ε,其中ε为很小的参数,比如为0.0000000001,就这样得到了码本中第一个符号波形的最优参数值ω为1×M的权值矩阵,μ为L×M的均值矩阵,Σ为L×L×M的协方差矩阵。同样的,可以求出码本中第一个波形的最优参数值...,码本中波形Nsym的最优参数即码本中Nsym个不同符号波形有Nsym个GMM模型参数一个1×L的接收样本x,通过GMM模型找到一个最大后验概率值的模型:
即通过最优值λopt在接收到的符号波形中根据GMM模型计算概率即得到对应波形的十进制索引i,然后依据该十进制索引i确定对应的比特数据流。比如求得i=1,其对应的比特数据流为000,求得i=8,其对应的比特数据流为111,然后将对应的比特数据流按顺序排列,解调完成。
图2为以联通苹果-联通华为例,总共传输200帧信号,每帧3000个比特,码率为1.33kbps,每个比特采样6个点,不经过GMM模型训练得到的误码率。平均误码率为千分之三点五,其中误码率小于千分之五的帧占百分之七十五以上。
图3为经过GMM模型训练得到的误码率,平均误码率为万分之一,其中误码率小于千分之五的帧占百分之九十九以上。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (2)
1.一种利用语音信道进行数据传输的方法,其特征在于,包括以下步骤:
发送端将需要传输的比特数据进行类语音调制,转换成类语音信号,并将类语音信号在语音信道上进行传输,接收端将接收到的类语音信号解调为比特数据;
其中,类语音调制的方法为:
将比特数据流分成B比特一组,将B比特数据构建十进制索引i,则有Nsym=2B个索引值,构建码本S={si,i=1,2,3,......Nsym},其中si为由L个样点构成的符号波形,将一个十进制的标量i编码成一个矢量符号si的映射:I→S,其中,I={1,2,3,......Nsym},S={s1,s2,......sNsym},映射完成后,将这些符号波形首尾相连即转换成类语音信号,其中符号波形的生成步骤为:
A2、使用实数Gi构造Nf个频谱分量:
A3、利用反向离散余弦变换IDCT将φi由频域转到时域:si=IDCT(φi),si为实数符号波形;
A4、对实数符号波形的功率进行归一化处理,即得符号波形,重复上述步骤,直至产生Nsym个符号波形作为码本;
接收端将接收到的类语音信号解调之前还包括:
S1、构建多组与B比特对应的比特数据流,并将多组比特数据流随机排列,生成训练样本库;对接收到的十进制索引i对应的符号波形分别进行GMM模型训练,得到十进制索引i对应的符号波形的GMM模型中参数λopt={ωm,μm,Σm}的最优值,ωm,μm,Σm分别为混合分量的权值,均值矢量,协方差矩阵;
S2、通过最优值λopt在接收到的符号波形中依据GMM模型计算得到对应的十进制索引i,然后依据该十进制索引i确定对应的比特数据流,将比特数据流首尾相连即完成解调。
2.如权利要求1所述的利用语音信道进行数据传输的方法,其特征在于,最优值λopt通过以下方法得到:利用K-means算法计算初始参数λ,然后通过EM算法,利用初始参数λ计算得到新的参数λ',循环迭代,直至新的参数达到收敛界限,从而得到最优参数λopt。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811068965.9A CN109256141B (zh) | 2018-09-13 | 2018-09-13 | 利用语音信道进行数据传输的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811068965.9A CN109256141B (zh) | 2018-09-13 | 2018-09-13 | 利用语音信道进行数据传输的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109256141A CN109256141A (zh) | 2019-01-22 |
CN109256141B true CN109256141B (zh) | 2023-03-28 |
Family
ID=65047556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811068965.9A Active CN109256141B (zh) | 2018-09-13 | 2018-09-13 | 利用语音信道进行数据传输的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109256141B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109887519B (zh) * | 2019-03-14 | 2021-05-11 | 北京芯盾集团有限公司 | 提高语音信道数据传输准确性的方法 |
CN111818519B (zh) * | 2020-07-16 | 2022-02-11 | 郑州信大捷安信息技术股份有限公司 | 一种端到端语音加密、解密方法及系统 |
CN113037781A (zh) * | 2021-04-29 | 2021-06-25 | 广东工业大学 | 基于rnn的语音信息加密方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110214A (zh) * | 2007-08-10 | 2008-01-23 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB0203834D0 (en) * | 2002-02-19 | 2002-04-03 | Univ Surrey | Data transmission |
CN101496097A (zh) * | 2006-07-31 | 2009-07-29 | 高通股份有限公司 | 用于在与语音信号相关联的包中包含识别符的系统及方法 |
CN101290774B (zh) * | 2007-01-31 | 2011-09-07 | 广州广晟数码技术有限公司 | 音频编码和解码系统 |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8249865B2 (en) * | 2009-11-23 | 2012-08-21 | Airbiquity Inc. | Adaptive data transmission for a digital in-band modem operating over a voice channel |
CN102737637B (zh) * | 2011-12-31 | 2013-11-27 | 清华大学 | 一种利用类语音调制解调进行数据传输的方法 |
CN103399191B (zh) * | 2013-07-25 | 2016-06-22 | 哈尔滨理工大学 | 基于边带解调的fbg-gmm电流传感方法 |
US9774354B2 (en) * | 2014-07-10 | 2017-09-26 | King Abdullah University Of Science And Technology | Generation of correlated finite alphabet waveforms using Gaussian random variables |
CN104882144B (zh) * | 2015-05-06 | 2018-10-30 | 福州大学 | 基于声谱图双特征的动物声音识别方法 |
US10158394B2 (en) * | 2015-05-11 | 2018-12-18 | Cohere Technologies, Inc. | Systems and methods for symplectic orthogonal time frequency shifting modulation and transmission of data |
CN105846946B (zh) * | 2016-03-22 | 2018-09-25 | 中国人民解放军国防科学技术大学 | 基于子载波索引调制的物理层安全传输方法 |
CN107786574A (zh) * | 2017-11-10 | 2018-03-09 | 芯盾(北京)信息技术有限公司 | 移动终端的语音通信信源加密系统 |
-
2018
- 2018-09-13 CN CN201811068965.9A patent/CN109256141B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101110214A (zh) * | 2007-08-10 | 2008-01-23 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109256141A (zh) | 2019-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Weng et al. | Semantic communication systems for speech transmission | |
Weng et al. | Deep learning enabled semantic communications with speech recognition and synthesis | |
CN109326283B (zh) | 非平行文本条件下基于文本编码器的多对多语音转换方法 | |
CN109256141B (zh) | 利用语音信道进行数据传输的方法 | |
CN110275939B (zh) | 对话生成模型的确定方法及装置、存储介质、电子设备 | |
CN110060701B (zh) | 基于vawgan-ac的多对多语音转换方法 | |
CN110211575A (zh) | 用于数据增强的语音加噪方法及系统 | |
CN113381828B (zh) | 基于条件生成对抗网络的稀疏码多址接入随机信道建模方法 | |
CN102238190A (zh) | 身份认证方法及系统 | |
CN110473557B (zh) | 一种基于深度自编码器的语音信号编解码方法 | |
CN110060657B (zh) | 基于sn的多对多说话人转换方法 | |
CN110491400B (zh) | 一种基于深度自编码器的语音信号重建方法 | |
Bridle et al. | Recnorm: Simultaneous normalisation and classification applied to speech recognition | |
CN110060691B (zh) | 基于i向量和VARSGAN的多对多语音转换方法 | |
US8271278B2 (en) | Quantizing feature vectors in decision-making applications | |
CN110459232A (zh) | 一种基于循环生成对抗网络的语音转换方法 | |
CN111010356A (zh) | 一种基于支持向量机的水声通信信号调制方式识别方法 | |
CN112786003A (zh) | 语音合成模型训练方法、装置、终端设备及存储介质 | |
CN109308316B (zh) | 一种基于主题聚类的自适应对话生成系统 | |
US20240112037A1 (en) | Automatic modulation classification method based on deep learning network fusion | |
Hammami et al. | Tree distribution classifier for automatic spoken arabic digit recognition | |
CN114360500B (zh) | 语音识别方法和装置、电子设备及存储介质 | |
Zhong et al. | Multimodal deep learning model for specific emitter identification | |
Gutkin et al. | Quantized HMMs for low footprint text-to-speech synthesis. | |
CN112821971A (zh) | 一种基于对抗式学习的时变信道信号检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100085 Beijing Haidian District, Northeast Wangxi Road, No. 8 Courtyard, 2nd Floor 217 Applicant after: BEIJING CORE SHIELD GROUP Co.,Ltd. Address before: 102402 room 4, 4 floor, 2 building, 85 Hong Yuan Road, Fangshan District, Beijing. Applicant before: CORE SHIELD (BEIJING) INFORMATION TECHNOLOGY Co.,Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |