CN102855878B - 一种窄带语音子带清浊音度参数的量化方法 - Google Patents
一种窄带语音子带清浊音度参数的量化方法 Download PDFInfo
- Publication number
- CN102855878B CN102855878B CN201210352305.XA CN201210352305A CN102855878B CN 102855878 B CN102855878 B CN 102855878B CN 201210352305 A CN201210352305 A CN 201210352305A CN 102855878 B CN102855878 B CN 102855878B
- Authority
- CN
- China
- Prior art keywords
- sub
- sonant
- degree parameter
- band
- band surd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000011002 quantification Methods 0.000 title abstract description 12
- 238000013139 quantization Methods 0.000 claims description 26
- 238000005086 pumping Methods 0.000 claims description 13
- 239000000203 mixture Substances 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 239000012141 concentrate Substances 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims description 2
- 238000010168 coupling process Methods 0.000 claims description 2
- 238000005859 coupling reaction Methods 0.000 claims description 2
- 230000005764 inhibitory process Effects 0.000 abstract description 2
- 239000011295 pitch Substances 0.000 abstract 5
- 238000009792 diffusion process Methods 0.000 description 7
- 230000005284 excitation Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种窄带语音子带清浊音度参数的量化方法,考虑到了连续超帧子带清浊音度参数的相关性,采用状态转移机的原理,对当前超帧子带清浊音度量化时,考虑到了上一超帧的子带清浊音度参数,因此提高了子带清浊音度参数的量化效率。在提高效率的同时,通过误码扩散抑制,也就是通过定时退出机制,防止误码扩散,降低因采用参数相关性而导致的误码扩散范围。
Description
技术领域
本发明属于语音编码技术领域,特别是涉及低速率及超低速率参数语音编码方法。
背景技术
语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。近些年来国际电信联盟(ITU)、一些区域组织和一些国家相继制定了一系列语音压缩编码标准,并在编码速率为2.4kb/s到16kb/s上得到了令人满意的语音质量。
目前国内外的研究主要集中在2.4kb/s以下速率高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放等。低速率语音编码中激励信号的合成非常重要,而多带激励信号合成是目前激励信号合成的重要手段,混合激励线性预测编码算法等均采用了多带激励模型。多带激励信号合成主要依靠于子带清浊音度参数,因此子带清浊音度参数的高效量化传输对合成语音质量具有重要意义。目前子带清浊音度参数的量化方法如下:
(1)对输入语音信号采样点按时间顺序分帧;
(2)按帧提取子带清浊音度参数;
(3)联合多个语音帧组成超帧,多个语音帧的子带清浊音度参数组成超帧子带清浊音度参数;
(4)对超帧子带清浊音度参数进行矢量量化,将其量化索引值进行编码传输,量化码本的训练方法可参照杨行峻等人著《语音信号数字处理》矢量量化一章中所采用的LBG算法;
(5)解码端根据索引值搜索码本得到超帧子带清浊音度参数;
(6)根据超帧子带清浊音度参数,得到每个语音帧的子带清浊音度参数,送入激励信号合成端生成激励信号。
上述已有技术对子带清浊音度参数进行矢量量化,在编码速率进一步降低时,用于子带清浊音度参数量化的比特数减少,从而无法高效量化子带清浊音度参数,进一步使合成语音质量受到较大影响。实际上,连续语音帧的子带清浊音度参数具有较强的相关性,因而连续超帧的子带清浊音度参数间也具有较强的相关性,现有技术并未考虑或利用到这种相关性,从而无法进一步提高子带清浊音度参数的量化效率。
发明内容
本发明利用连续语音帧或超帧间子带清浊音度参数的相关性,提供一种窄带语音子带清浊音度参数的量化方法,以提高量化效率,进一步改善合成语音质量。
本发明采用以下技术方案:
编码端:1)编码端对输入的语音信号样点按时间顺序分帧,按帧提取子带清浊音度参数;
2)联合多个语音帧组成超帧,对应的多个语音帧的子带清浊音度参数组成超帧子带清浊音度参数;
3)对当前超帧判断是否为L的整数倍,若是,则采用初始码本对所述超帧子带清浊音度参数进行矢量量化;若不是,则将上一超帧量化后的子带清浊音度参数采用初始码本进行量化,并以量化值为索引从条件码本中选取该索引所对应的码本,利用该码本对当前超帧子带清浊音度参数进行量化并得到索引值index;
解码端:5)解码端判断是否为L的整数倍,若是,则根据所述索引值index搜索初始码本得到超帧子带清浊音度参数;若不是,利用初始码本对上一超帧量化后的子带清浊音度参数进行量化,得到索引值,并依据该索引值从条件码本集中选取匹配的码本,根据索引值index搜索码本得到超帧子带清浊音度参数;
依据本发明的上述窄带语音子带清浊音度参数的量化方法,考虑到了连续超帧子带清浊音度参数的相关性,采用状态转移机的原理,对当前超帧子带清浊音度量化时,考虑到了上一超帧的子带清浊音度参数,因此提高了子带清浊音度参数的量化效率。在提高效率的同时,通过误码扩散抑制,也就是通过定时退出机制,防止误码扩散,降低因采用参数相关性而导致的误码扩散范围。
上述窄带语音子带清浊音度参数的量化方法,所述初始码本和所述条件码本均为离线训练得到。
附图说明
图1为已知的一种子带清浊音度参数量化流程框图。
图2为依据本发明的一种子带清浊音度参数量化流程框图。
具体实施方式
下面结合说明书附图以具体实施例的方式详述本发明的技术方案。
依据本发明的实施例,基于子带清浊音度参数的帧间相关性,对当前超帧子带清浊音度参数进行量化时,考虑其前一超帧的子带清浊音度参数,选择不同的码本,对其进行更加精细的量化,提高其量化效率。
若信道有误码存在,当某一超帧的子带清浊音度参数传输出错时,其后续所有超帧子带清浊音度参数的码本信息将发生错误,导致误码扩散,为了防止误码扩散,采用了定时退出机制。即设定退出间隔L,每当L的整数倍个超帧编码结束后,则重新采用初始码本对超帧子带清浊音度参数进行矢量量化。采用定时退出的方案,即使某一超帧的子带清浊音度参数传输出错,只会对不超过L个语音帧产生影响。
从而,采用合适的量化方案,充分利用连续语音帧或超帧间子带清浊音度参数的相关性,提高其量化效率,从而进一步改善合成语音质量,解决低速率、超低速率语音编码中子带清浊音度参数量化效率低下的问题。
参照说明书附图2所示子带清浊音度参数量化流程,其包括以下步骤:
2)在编码端,对输入语音信号样点按时间顺序分帧;(此处的分帧不是超帧!)
3)按帧提取子带清浊音度参数;应知步骤2)和步骤3)在顺序上没有逻辑上的关联性;
5)判断是否为L的整数倍,若是,采用初始码本对超帧子带清浊音度参数进行矢量量化;若不是,将上一超帧量化后的子带清浊音度参数采用初始码本进行量化,假设量化得到的索引值为,根据量化索引值从条件码本集合中选取该索引对应的码本,利用码本对当前超帧子带清浊音度参数进行量化并得到索引值index;
7)解码端判断是否为L的整数倍。若是,根据索引值index搜索初始码本得到超帧子带清浊音度参数;若不是,利用初始码本对上一超帧量化后的子带清浊音度参数进行量化,得到索引值,根据索引值,从条件码本集中选取码本,根据解码端收到的索引值index搜索码本得到超帧子带清浊音度参数;
8)根据步骤7)得到的超帧子带清浊音度参数,得到每个语音帧的子带清浊音度参数,送入激励信号合成端生成激励信号,,转至步骤7)。
一个更具体实施例详细说明如下:
对输入语音信号样点按时间顺序分帧的实施例是按8kHz频率采样、已经过高通滤波去除工频干扰的语音样点。每25ms,也就是200个语音样点构成一帧。
根据语音编码算法中的超帧长度(参数量化前,由编码算法确定。一般情况下,编码速率2400bps为1帧,1200bps为2-3帧,600bps为3-6帧,300bps为6-8帧,具体由编码算法设计者根据实际应用而确定),若编码算法中连续4个语音帧组成一个超帧,则超帧的子带清浊音度参数,记为。
设超帧子带清浊音度参数的量化比特数为4,则量化码本尺寸为16,满足较高的精细度。首先根据所有训练矢量集得到初始码本,之后根据当前超帧的前一超帧量化索引结果,将训练矢量集分成16类,分别训练得到16个条件码本,,尺寸也为16。根据训练矢量集得到码本的方法可以参考杨行峻等人著《语音信号数字处理》pp92-95中所述LBG方法;
最终,按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法,利用子带清浊音度参数,结合基音周期参数、余量谱幅度参数进行激励信号合成。
依据上述窄带语音子带清浊音度参数量化的方法,对当前超帧子带清浊音度参数进行量化时,充分考虑其前一超帧子带清浊音度参数的量化结果,采用分类码本对当前超帧的子带清浊音度参数进行量化。同时,为了防止由于信道误码的存在而使误码扩散,该发明中采用了定时退出机制,使信道误码的影响局限在退出间隔之内,有效防止了误码的快速扩散。
Claims (3)
编码端:1)编码端对输入的语音信号样点按时间顺序分帧,按帧提取子带清浊音度参数;
2)联合多个语音帧组成超帧,对应的多个语音帧的子带清浊音度参数组成超帧子带清浊音度参数;
3)对当前超帧判断是否为L的整数倍,若是,则采用初始码本对所述超帧子带清浊音度参数进行矢量量化;若不是,则将上一超帧量化后的子带清浊音度参数采用初始码本进行量化,假设量化值为,根据量化索引值从条件码本中选取所对应的码本,利用码本对当前超帧子带清浊音度参数进行量化并得到索引值index;
解码端:5)解码端判断是否为L的整数倍,若是,则根据索引值index搜索初始码本得到超帧子带清浊音度参数;若不是,利用初始码本对上一超帧量化后的子带清浊音度参数进行量化,得到索引值,并依据该索引值从条件码本集中选取匹配的码本,根据索引值index搜索码本得到超帧子带清浊音度参数;
2.根据权利要求1所述的窄带语音子带清浊音度参数的量化方法,其特征在于,所述初始码本和所述条件码本均为离线训练得到。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210352305.XA CN102855878B (zh) | 2012-09-21 | 2012-09-21 | 一种窄带语音子带清浊音度参数的量化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210352305.XA CN102855878B (zh) | 2012-09-21 | 2012-09-21 | 一种窄带语音子带清浊音度参数的量化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102855878A CN102855878A (zh) | 2013-01-02 |
CN102855878B true CN102855878B (zh) | 2014-05-14 |
Family
ID=47402407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210352305.XA Expired - Fee Related CN102855878B (zh) | 2012-09-21 | 2012-09-21 | 一种窄带语音子带清浊音度参数的量化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102855878B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107017007A (zh) * | 2017-05-12 | 2017-08-04 | 国网山东省电力公司经济技术研究院 | 一种基于语音传输的变电站现场作业远程指挥方法 |
CN107256711A (zh) * | 2017-05-12 | 2017-10-17 | 国网山东省电力公司经济技术研究院 | 一种配电网应急维修远程指挥系统 |
CN108461088B (zh) * | 2018-03-21 | 2019-11-19 | 山东省计算中心(国家超级计算济南中心) | 基于支持向量机在语音解码端重构子带清浊音度参数的方法 |
CN109256143A (zh) * | 2018-09-21 | 2019-01-22 | 西安蜂语信息科技有限公司 | 语音参数量化方法、装置、计算机设备和存储介质 |
CN109448739B (zh) * | 2018-12-13 | 2019-08-23 | 山东省计算中心(国家超级计算济南中心) | 基于分层聚类的声码器线谱频率参数量化方法 |
CN109346093B (zh) * | 2018-12-17 | 2019-09-03 | 山东省计算中心(国家超级计算济南中心) | 一种低速率声码器子带清浊音参数提取与量化的融合方法 |
CN117577121B (zh) * | 2024-01-17 | 2024-04-05 | 清华大学 | 基于扩散模型的音频编解码方法及装置、存储介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774839A (en) * | 1995-09-29 | 1998-06-30 | Rockwell International Corporation | Delayed decision switched prediction multi-stage LSF vector quantization |
US5974378A (en) * | 1997-01-06 | 1999-10-26 | Texas Instruments Incorporated | Multi-stage vector quantization with efficient codebook search |
CN101261835A (zh) * | 2008-04-25 | 2008-09-10 | 清华大学 | 基于超帧模式的多矢量多码本尺寸联合优化方法 |
CN101295507A (zh) * | 2008-04-25 | 2008-10-29 | 清华大学 | 带级间预测的超帧声道参数多级矢量量化方法 |
-
2012
- 2012-09-21 CN CN201210352305.XA patent/CN102855878B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774839A (en) * | 1995-09-29 | 1998-06-30 | Rockwell International Corporation | Delayed decision switched prediction multi-stage LSF vector quantization |
US5974378A (en) * | 1997-01-06 | 1999-10-26 | Texas Instruments Incorporated | Multi-stage vector quantization with efficient codebook search |
CN101261835A (zh) * | 2008-04-25 | 2008-09-10 | 清华大学 | 基于超帧模式的多矢量多码本尺寸联合优化方法 |
CN101295507A (zh) * | 2008-04-25 | 2008-10-29 | 清华大学 | 带级间预测的超帧声道参数多级矢量量化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102855878A (zh) | 2013-01-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102855878B (zh) | 一种窄带语音子带清浊音度参数的量化方法 | |
US7613606B2 (en) | Speech codecs | |
CN102119414B (zh) | 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法 | |
TW519616B (en) | Method and apparatus for predictively quantizing voiced speech | |
CN103325375B (zh) | 一种极低码率语音编解码设备及编解码方法 | |
CN101030377B (zh) | 提高声码器基音周期参数量化精度的方法 | |
CN105976830A (zh) | 音频信号编码和解码方法、音频信号编码和解码装置 | |
US11430456B2 (en) | Encoding method, decoding method, encoding apparatus, and decoding apparatus | |
CN103050122B (zh) | 一种基于melp的多帧联合量化低速率语音编解码方法 | |
CN101261836B (zh) | 基于过渡帧判决及处理的激励信号自然度提高方法 | |
CN101261835B (zh) | 基于超帧模式的多矢量多码本尺寸联合优化方法 | |
CN110634495B (zh) | 信号编码方法和装置以及信号解码方法和装置 | |
CN102903365B (zh) | 一种在解码端细化窄带声码器参数的方法 | |
CN104637487B (zh) | 确定音调循环能量及按比例缩放激励信号 | |
CN109448739B (zh) | 基于分层聚类的声码器线谱频率参数量化方法 | |
CN101009096B (zh) | 子带清浊音模糊判决的方法 | |
CN106098072A (zh) | 一种基于混合激励线性预测的600bps甚低速率语音编解码方法 | |
CN105336338B (zh) | 音频编码方法和装置 | |
CN101295507A (zh) | 带级间预测的超帧声道参数多级矢量量化方法 | |
CN109346093B (zh) | 一种低速率声码器子带清浊音参数提取与量化的融合方法 | |
CN101685637B (zh) | 音频编码方法及装置和音频解码方法及装置 | |
CN114974203B (zh) | 基于声道信息聚类的基音周期矢量多模式量化方法及系统 | |
De-liang et al. | Audio data compression based on AVS-P10 | |
Du et al. | Vector quantization of speech parameters in the time-frequency domain | |
Raina et al. | Wireless speech coding: A systematic review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140514 |
|
CF01 | Termination of patent right due to non-payment of annual fee |