CN102855878B - 一种窄带语音子带清浊音度参数的量化方法 - Google Patents

一种窄带语音子带清浊音度参数的量化方法 Download PDF

Info

Publication number
CN102855878B
CN102855878B CN201210352305.XA CN201210352305A CN102855878B CN 102855878 B CN102855878 B CN 102855878B CN 201210352305 A CN201210352305 A CN 201210352305A CN 102855878 B CN102855878 B CN 102855878B
Authority
CN
China
Prior art keywords
sub
sonant
degree parameter
band
band surd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210352305.XA
Other languages
English (en)
Other versions
CN102855878A (zh
Inventor
李晔
马晓凤
樊燕红
姜竞赛
郝秋赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Computer Science Center
Original Assignee
Shandong Computer Science Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Computer Science Center filed Critical Shandong Computer Science Center
Priority to CN201210352305.XA priority Critical patent/CN102855878B/zh
Publication of CN102855878A publication Critical patent/CN102855878A/zh
Application granted granted Critical
Publication of CN102855878B publication Critical patent/CN102855878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种窄带语音子带清浊音度参数的量化方法,考虑到了连续超帧子带清浊音度参数的相关性,采用状态转移机的原理,对当前超帧子带清浊音度量化时,考虑到了上一超帧的子带清浊音度参数,因此提高了子带清浊音度参数的量化效率。在提高效率的同时,通过误码扩散抑制,也就是通过定时退出机制,防止误码扩散,降低因采用参数相关性而导致的误码扩散范围。

Description

一种窄带语音子带清浊音度参数的量化方法
技术领域
本发明属于语音编码技术领域,特别是涉及低速率及超低速率参数语音编码方法。
背景技术
语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。近些年来国际电信联盟(ITU)、一些区域组织和一些国家相继制定了一系列语音压缩编码标准,并在编码速率为2.4kb/s到16kb/s上得到了令人满意的语音质量。
目前国内外的研究主要集中在2.4kb/s以下速率高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放等。低速率语音编码中激励信号的合成非常重要,而多带激励信号合成是目前激励信号合成的重要手段,混合激励线性预测编码算法等均采用了多带激励模型。多带激励信号合成主要依靠于子带清浊音度参数,因此子带清浊音度参数的高效量化传输对合成语音质量具有重要意义。目前子带清浊音度参数的量化方法如下:
(1)对输入语音信号采样点按时间顺序分帧;
(2)按帧提取子带清浊音度参数;
(3)联合多个语音帧组成超帧,多个语音帧的子带清浊音度参数组成超帧子带清浊音度参数;
(4)对超帧子带清浊音度参数进行矢量量化,将其量化索引值进行编码传输,量化码本的训练方法可参照杨行峻等人著《语音信号数字处理》矢量量化一章中所采用的LBG算法;
(5)解码端根据索引值搜索码本得到超帧子带清浊音度参数;
(6)根据超帧子带清浊音度参数,得到每个语音帧的子带清浊音度参数,送入激励信号合成端生成激励信号。
上述已有技术对子带清浊音度参数进行矢量量化,在编码速率进一步降低时,用于子带清浊音度参数量化的比特数减少,从而无法高效量化子带清浊音度参数,进一步使合成语音质量受到较大影响。实际上,连续语音帧的子带清浊音度参数具有较强的相关性,因而连续超帧的子带清浊音度参数间也具有较强的相关性,现有技术并未考虑或利用到这种相关性,从而无法进一步提高子带清浊音度参数的量化效率。
发明内容
本发明利用连续语音帧或超帧间子带清浊音度参数的相关性,提供一种窄带语音子带清浊音度参数的量化方法,以提高量化效率,进一步改善合成语音质量。
本发明采用以下技术方案:
一种窄带语音子带清浊音度参数的量化方法,编解码端分别设定退出计数器                                                
Figure 201210352305X100002DEST_PATH_IMAGE001
Figure 852978DEST_PATH_IMAGE002
,设定退出间隔为L,然后通过以下步骤进行量化;
编码端:1)编码端对输入的语音信号样点按时间顺序分帧,按帧提取子带清浊音度参数;
2)联合多个语音帧组成超帧,对应的多个语音帧的子带清浊音度参数组成超帧子带清浊音度参数;
3)对当前超帧判断
Figure 201210352305X100002DEST_PATH_IMAGE003
是否为L的整数倍,若是,则采用初始码本对所述超帧子带清浊音度参数进行矢量量化;若不是,则将上一超帧量化后的子带清浊音度参数采用初始码本进行量化,并以量化值
Figure 707801DEST_PATH_IMAGE004
为索引从条件码本中选取该索引所对应的码本
Figure 201210352305X100002DEST_PATH_IMAGE005
,利用该码本
Figure 612172DEST_PATH_IMAGE005
对当前超帧子带清浊音度参数进行量化并得到索引值index;
4)将索引值进行编码传输,
Figure 695797DEST_PATH_IMAGE006
,转至步骤3);
解码端:5)解码端判断
Figure 201210352305X100002DEST_PATH_IMAGE007
是否为L的整数倍,若是,则根据所述索引值index搜索初始码本得到超帧子带清浊音度参数;若不是,利用初始码本对上一超帧量化后的子带清浊音度参数进行量化,得到索引值
Figure 447853DEST_PATH_IMAGE004
,并依据该索引值从条件码本集中选取匹配的码本
Figure 270315DEST_PATH_IMAGE005
,根据索引值index搜索码本
Figure 724299DEST_PATH_IMAGE005
得到超帧子带清浊音度参数;
6)根据步骤5)得到的超帧子带清浊音度参数,得到每个语音帧的子带清浊音度参数,送入激励信号合成端生成激励信号,
Figure 860882DEST_PATH_IMAGE008
,转至步骤5)。
依据本发明的上述窄带语音子带清浊音度参数的量化方法,考虑到了连续超帧子带清浊音度参数的相关性,采用状态转移机的原理,对当前超帧子带清浊音度量化时,考虑到了上一超帧的子带清浊音度参数,因此提高了子带清浊音度参数的量化效率。在提高效率的同时,通过误码扩散抑制,也就是通过定时退出机制,防止误码扩散,降低因采用参数相关性而导致的误码扩散范围。
上述窄带语音子带清浊音度参数的量化方法,所述初始码本和所述条件码本均为离线训练得到。
上述窄带语音子带清浊音度参数的量化方法,所述条件码本的个数
Figure 201210352305X100002DEST_PATH_IMAGE009
依赖于子带清浊音度参数的量化比特数,即
Figure 201210352305X100002DEST_PATH_IMAGE011
附图说明
图1为已知的一种子带清浊音度参数量化流程框图。
图2为依据本发明的一种子带清浊音度参数量化流程框图。
具体实施方式
下面结合说明书附图以具体实施例的方式详述本发明的技术方案。
依据本发明的实施例,基于子带清浊音度参数的帧间相关性,对当前超帧子带清浊音度参数进行量化时,考虑其前一超帧的子带清浊音度参数,选择不同的码本,对其进行更加精细的量化,提高其量化效率。
若信道有误码存在,当某一超帧的子带清浊音度参数传输出错时,其后续所有超帧子带清浊音度参数的码本信息将发生错误,导致误码扩散,为了防止误码扩散,采用了定时退出机制。即设定退出间隔L,每当L的整数倍个超帧编码结束后,则重新采用初始码本对超帧子带清浊音度参数进行矢量量化。采用定时退出的方案,即使某一超帧的子带清浊音度参数传输出错,只会对不超过L个语音帧产生影响。
从而,采用合适的量化方案,充分利用连续语音帧或超帧间子带清浊音度参数的相关性,提高其量化效率,从而进一步改善合成语音质量,解决低速率、超低速率语音编码中子带清浊音度参数量化效率低下的问题。
参照说明书附图2所示子带清浊音度参数量化流程,其包括以下步骤:
1)编解码端分别设定退出计数器
Figure 146294DEST_PATH_IMAGE001
Figure 900623DEST_PATH_IMAGE002
,设定退出间隔为L,从而,每当L的整数倍个超帧编码结束后,则重新采用初始码本对超帧子带清浊音度参数进行矢量量化;
2)在编码端,对输入语音信号样点按时间顺序分帧;(此处的分帧不是超帧!)
3)按帧提取子带清浊音度参数;应知步骤2)和步骤3)在顺序上没有逻辑上的关联性; 
4)联合
Figure 824586DEST_PATH_IMAGE012
个语音帧组成超帧,
Figure 285654DEST_PATH_IMAGE012
个语音帧的子带清浊音度参数组成超帧子带清浊音度参数,如果每个语音帧提取个子带清浊音度参数,则每超帧共有
Figure 403914DEST_PATH_IMAGE014
个子带清浊音度参数;
5)判断是否为L的整数倍,若是,采用初始码本对超帧子带清浊音度参数进行矢量量化;若不是,将上一超帧量化后的子带清浊音度参数采用初始码本进行量化,假设量化得到的索引值为
Figure 858346DEST_PATH_IMAGE004
,根据量化索引值从条件码本集合中选取该索引对应的码本,利用码本
Figure 690539DEST_PATH_IMAGE005
对当前超帧子带清浊音度参数进行量化并得到索引值index;
6)将索引值进行编码传输,
Figure 769353DEST_PATH_IMAGE006
,转至步骤5);应知,这里的逻辑式
Figure 952816DEST_PATH_IMAGE006
是计算机学中的赋值,而非数学表达式。本步骤中的初始码本和条件码本集均为离线训练得到,降低所获得码本所受到外界干扰因素;
7)解码端判断
Figure 662146DEST_PATH_IMAGE007
是否为L的整数倍。若是,根据索引值index搜索初始码本得到超帧子带清浊音度参数;若不是,利用初始码本对上一超帧量化后的子带清浊音度参数进行量化,得到索引值
Figure 612785DEST_PATH_IMAGE004
,根据索引值
Figure 682241DEST_PATH_IMAGE004
,从条件码本集中选取码本
Figure 972408DEST_PATH_IMAGE005
,根据解码端收到的索引值index搜索码本
Figure 603372DEST_PATH_IMAGE005
得到超帧子带清浊音度参数;
8)根据步骤7)得到的超帧子带清浊音度参数,得到每个语音帧的子带清浊音度参数,送入激励信号合成端生成激励信号,,转至步骤7)。
一个更具体实施例详细说明如下:
上述方法步骤1)中退出间隔L根据超帧大小决定,一般时长为1s左右,比如语音分析帧为25ms,若连续4个语音帧组成一个超帧,则可以取值
Figure 201210352305X100002DEST_PATH_IMAGE015
个超帧;
对输入语音信号样点按时间顺序分帧的实施例是按8kHz频率采样、已经过高通滤波去除工频干扰的语音样点。每25ms,也就是200个语音样点构成一帧。
按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法提取子带清浊音度参数,记为
Figure 399606DEST_PATH_IMAGE016
根据语音编码算法中的超帧长度
Figure 996810DEST_PATH_IMAGE012
(参数量化前,由编码算法确定。一般情况下,编码速率2400bps为1帧,1200bps为2-3帧,600bps为3-6帧,300bps为6-8帧,具体由编码算法设计者根据实际应用而确定),若编码算法中连续4个语音帧组成一个超帧,则超帧的子带清浊音度参数,记为
Figure 110259DEST_PATH_IMAGE018
设超帧子带清浊音度参数的量化比特数为4,则量化码本尺寸为16,满足较高的精细度。首先根据所有训练矢量集得到初始码本
Figure 720976DEST_PATH_IMAGE020
,之后根据当前超帧的前一超帧量化索引结果,将训练矢量集分成16类,分别训练得到16个条件码本,,尺寸也为16。根据训练矢量集得到码本的方法可以参考杨行峻等人著《语音信号数字处理》pp92-95中所述LBG方法;
根据索引值index,直接从所对应的码本中搜索得到其对应的超帧子带清浊音度参数矢量
Figure 69918DEST_PATH_IMAGE022
根据得到的超帧子带清浊音度参数
Figure 131415DEST_PATH_IMAGE022
Figure 201210352305X100002DEST_PATH_IMAGE023
按下式得到超帧中第
Figure 201210352305X100002DEST_PATH_IMAGE025
个语音帧的子带清浊音度参数:
Figure 41864DEST_PATH_IMAGE026
最终,按美国政府2400b/s混合激励的线性预测(MELP)语音编码算法标准所描述的方法,利用子带清浊音度参数,结合基音周期参数、余量谱幅度参数进行激励信号合成。
依据上述窄带语音子带清浊音度参数量化的方法,对当前超帧子带清浊音度参数进行量化时,充分考虑其前一超帧子带清浊音度参数的量化结果,采用分类码本对当前超帧的子带清浊音度参数进行量化。同时,为了防止由于信道误码的存在而使误码扩散,该发明中采用了定时退出机制,使信道误码的影响局限在退出间隔
Figure 201210352305X100002DEST_PATH_IMAGE027
之内,有效防止了误码的快速扩散。
从而,上述窄带语音子带清浊音度参数的高效量化方法,本方法充分考虑了连续帧(超帧)间子带清浊音度参数的相关性,借助状态转移机利用该相关性,根据前一超帧子带清浊音度参数的量化结果,自适应选择当前超帧子带清浊音度参数的量化码本,提高了子带清浊音参数的量化效率。同时,该发明提出了定时退出机制,每过间隔
Figure 392074DEST_PATH_IMAGE027
,量化码本重新启动原始码本,从而能够有效防止信道误码的扩散,使误码扩散的影响局限在间隔
Figure 607023DEST_PATH_IMAGE027
之内。该方法可以有效用于2400bps以下的低速率、超低速率语音编码算法中,从而提高其合成语音质量。

Claims (3)

1.一种窄带语音子带清浊音度参数的量化方法,其特征在于,编解码端分别设定退出计数器                                               
Figure 201210352305X100001DEST_PATH_IMAGE002
Figure 201210352305X100001DEST_PATH_IMAGE004
,设定退出间隔为L,然后通过以下步骤进行量化;
编码端:1)编码端对输入的语音信号样点按时间顺序分帧,按帧提取子带清浊音度参数;
2)联合多个语音帧组成超帧,对应的多个语音帧的子带清浊音度参数组成超帧子带清浊音度参数;
3)对当前超帧判断
Figure 201210352305X100001DEST_PATH_IMAGE006
是否为L的整数倍,若是,则采用初始码本对所述超帧子带清浊音度参数进行矢量量化;若不是,则将上一超帧量化后的子带清浊音度参数采用初始码本进行量化,假设量化值为,根据量化索引值从条件码本中选取所对应的码本
Figure 201210352305X100001DEST_PATH_IMAGE010
,利用码本
Figure 420437DEST_PATH_IMAGE010
对当前超帧子带清浊音度参数进行量化并得到索引值index;
4)将索引值进行编码传输,
Figure 201210352305X100001DEST_PATH_IMAGE012
,转至步骤3);
解码端:5)解码端判断
Figure 201210352305X100001DEST_PATH_IMAGE014
是否为L的整数倍,若是,则根据索引值index搜索初始码本得到超帧子带清浊音度参数;若不是,利用初始码本对上一超帧量化后的子带清浊音度参数进行量化,得到索引值
Figure 212944DEST_PATH_IMAGE008
,并依据该索引值从条件码本集中选取匹配的码本,根据索引值index搜索码本
Figure 325573DEST_PATH_IMAGE010
得到超帧子带清浊音度参数;
6)根据步骤5)得到的超帧子带清浊音度参数,得到每个语音帧的子带清浊音度参数,送入激励信号合成端生成激励信号,
Figure 201210352305X100001DEST_PATH_IMAGE016
,转至步骤5)。
2.根据权利要求1所述的窄带语音子带清浊音度参数的量化方法,其特征在于,所述初始码本和所述条件码本均为离线训练得到。
3.根据权利要求2所述的窄带语音子带清浊音度参数的量化方法,其特征在于,所述条件码本的个数
Figure 201210352305X100001DEST_PATH_IMAGE018
依赖于子带清浊音度参数的量化比特数
Figure 201210352305X100001DEST_PATH_IMAGE020
,即
Figure 201210352305X100001DEST_PATH_IMAGE022
CN201210352305.XA 2012-09-21 2012-09-21 一种窄带语音子带清浊音度参数的量化方法 Active CN102855878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210352305.XA CN102855878B (zh) 2012-09-21 2012-09-21 一种窄带语音子带清浊音度参数的量化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210352305.XA CN102855878B (zh) 2012-09-21 2012-09-21 一种窄带语音子带清浊音度参数的量化方法

Publications (2)

Publication Number Publication Date
CN102855878A CN102855878A (zh) 2013-01-02
CN102855878B true CN102855878B (zh) 2014-05-14

Family

ID=47402407

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210352305.XA Active CN102855878B (zh) 2012-09-21 2012-09-21 一种窄带语音子带清浊音度参数的量化方法

Country Status (1)

Country Link
CN (1) CN102855878B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107017007A (zh) * 2017-05-12 2017-08-04 国网山东省电力公司经济技术研究院 一种基于语音传输的变电站现场作业远程指挥方法
CN107256711A (zh) * 2017-05-12 2017-10-17 国网山东省电力公司经济技术研究院 一种配电网应急维修远程指挥系统
CN108461088B (zh) * 2018-03-21 2019-11-19 山东省计算中心(国家超级计算济南中心) 基于支持向量机在语音解码端重构子带清浊音度参数的方法
CN109256143A (zh) * 2018-09-21 2019-01-22 西安蜂语信息科技有限公司 语音参数量化方法、装置、计算机设备和存储介质
CN109448739B (zh) * 2018-12-13 2019-08-23 山东省计算中心(国家超级计算济南中心) 基于分层聚类的声码器线谱频率参数量化方法
CN109346093B (zh) * 2018-12-17 2019-09-03 山东省计算中心(国家超级计算济南中心) 一种低速率声码器子带清浊音参数提取与量化的融合方法
CN117577121B (zh) * 2024-01-17 2024-04-05 清华大学 基于扩散模型的音频编解码方法及装置、存储介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
US5974378A (en) * 1997-01-06 1999-10-26 Texas Instruments Incorporated Multi-stage vector quantization with efficient codebook search
CN101261835A (zh) * 2008-04-25 2008-09-10 清华大学 基于超帧模式的多矢量多码本尺寸联合优化方法
CN101295507A (zh) * 2008-04-25 2008-10-29 清华大学 带级间预测的超帧声道参数多级矢量量化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
US5974378A (en) * 1997-01-06 1999-10-26 Texas Instruments Incorporated Multi-stage vector quantization with efficient codebook search
CN101261835A (zh) * 2008-04-25 2008-09-10 清华大学 基于超帧模式的多矢量多码本尺寸联合优化方法
CN101295507A (zh) * 2008-04-25 2008-10-29 清华大学 带级间预测的超帧声道参数多级矢量量化方法

Also Published As

Publication number Publication date
CN102855878A (zh) 2013-01-02

Similar Documents

Publication Publication Date Title
CN102855878B (zh) 一种窄带语音子带清浊音度参数的量化方法
US8019599B2 (en) Speech codecs
FI119533B (fi) Audiosignaalien koodaus
CN102119414B (zh) 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法
TW519616B (en) Method and apparatus for predictively quantizing voiced speech
CN101030377B (zh) 提高声码器基音周期参数量化精度的方法
CN103325375B (zh) 一种极低码率语音编解码设备及编解码方法
CN105976830A (zh) 音频信号编码和解码方法、音频信号编码和解码装置
CN101114450B (zh) 一种语音编码选择性加密方法
US11430456B2 (en) Encoding method, decoding method, encoding apparatus, and decoding apparatus
CN103050122B (zh) 一种基于melp的多帧联合量化低速率语音编解码方法
CN101320563A (zh) 一种背景噪声编码/解码装置、方法和通信设备
CN110867190B (zh) 信号编码方法和装置以及信号解码方法和装置
CN101261835B (zh) 基于超帧模式的多矢量多码本尺寸联合优化方法
CN101261836B (zh) 基于过渡帧判决及处理的激励信号自然度提高方法
CN106169297A (zh) 信号编码方法及设备
CN102903365B (zh) 一种在解码端细化窄带声码器参数的方法
CN109448739B (zh) 基于分层聚类的声码器线谱频率参数量化方法
CN101295507B (zh) 带级间预测的超帧声道参数多级矢量量化方法
CN101009096B (zh) 子带清浊音模糊判决的方法
CN106098072A (zh) 一种基于混合激励线性预测的600bps甚低速率语音编解码方法
CN105336338B (zh) 音频编码方法和装置
CN109346093B (zh) 一种低速率声码器子带清浊音参数提取与量化的融合方法
CN101685637B (zh) 音频编码方法及装置和音频解码方法及装置
Raina et al. Wireless speech coding: A systematic review

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant