CN101004915A - 2.4kb/s SELP 低速率声码器抗信道误码保护方法 - Google Patents
2.4kb/s SELP 低速率声码器抗信道误码保护方法 Download PDFInfo
- Publication number
- CN101004915A CN101004915A CNA2007100628646A CN200710062864A CN101004915A CN 101004915 A CN101004915 A CN 101004915A CN A2007100628646 A CNA2007100628646 A CN A2007100628646A CN 200710062864 A CN200710062864 A CN 200710062864A CN 101004915 A CN101004915 A CN 101004915A
- Authority
- CN
- China
- Prior art keywords
- parameter
- pure
- frame
- unvoiced
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 101000622137 Homo sapiens P-selectin Proteins 0.000 title claims description 22
- 102100023472 P-selectin Human genes 0.000 title claims description 22
- 101000873420 Simian virus 40 SV40 early leader protein Proteins 0.000 title claims description 22
- 238000001228 spectrum Methods 0.000 claims abstract description 73
- 239000013598 vector Substances 0.000 claims description 31
- 230000003595 spectral effect Effects 0.000 claims description 17
- 238000011084 recovery Methods 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 230000003716 rejuvenation Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims 1
- 238000012795 verification Methods 0.000 abstract description 2
- 238000013139 quantization Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明属于低速率语音抗差错编码技术领域。该方法在编码端改变2.4kb/s SELP编码后清音帧清浊音参数的发送模式;采用BCH码和改进的(7,4)汉明码分别保护清音和浊音帧中的语音参数;在解码端,根据信源信道的联合特性采用分支判决确定清浊音;对于清音帧采用相应BCH码恢复出对应参数,对于浊音帧采用基于长时统计特性的最大后验概率准则恢复清浊音参数,并解码出线谱对参数第一级并对残留误码的线谱对参数采用线谱对参数抗误码算法恢复。该方法在不消耗任何额外带宽且无延时的要求下可以显著提高2.4kb/s SELP声码器抗信道误码能力和合成语音质量。
Description
技术领域
本发明属于语音编码技术领域,特别涉及语音编码抗信道误码技术
背景技术
速率为2.4kb/s的低速率语音编码在无线通信、保密通信、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。由于低速率语音编码使每个语音参数所承载的信息量加大,在条件较为苛刻或者恶劣的高误码率窄带无线信道环境下,例如:野外无线信道、短波超短波通信、保密通信等,信道误码对重建语音质量影响很大。受高误码率影响的低速率声码器重建语音可懂度、自然度和舒适度都会有较大的下降。而低速率语音传输的特殊性要求不允许有额外的带宽消耗和较大的编解码时延,这与传统信道编码需要额外带宽来保护数据且有编解码延时相矛盾,因此需要在编码器内部基于信源信道联合编码的思想进行语音参数保护。SELP低速率声码器将语音分为清音帧和浊音帧,并由清浊音参数(BPVC)来表示清浊音状态。其中浊音帧某些参数对合成语音质量影响不大,而清音帧中的某些参数不必传输,因而利用声码器本身的冗余度进行前向纠错保护。美国政府标准2.4 kb/s MELPe算法中,利用清音帧不传送的Fourier magnitudes,bandpass voicing和jitter bits参数的冗余采用3组(7,4)汉明码和一组(8,4)汉明码来保护LSF 7比特参数和增益8比特参数,浊音帧中清浊音信息与基音周期联合量化。由于采用汉明码仅能纠正一位比特错误,在高误码率的情况下,剩余误码率会显著增加。而且当发生错误的时候也只采用前帧参数直接替代本帧参数的方式,影响了有信道误码时的合成语音质量。因此需要采用更好的整体清浊音抗信道误码保护算法。
发明内容
本发明的目的是为了在保证无信道误码情况下合成语音质量基本不变的前提下,同时大幅度提高低速率声码器在高误码率窄带无线信道下的合成语音质量,提出一种基于2.4kb/sSELP低速率声码器的清音帧保护方法,能够在不增加额外带宽和无算法延时的情况下,显著提高噪声环境下的语音合成质量。
本发明提出的基于2.4kb/s SELP低速率声码器的清音帧保护方法,在数字集成电路芯片中依次按以下步骤实现的,在编码器端:
(1)2.4kb/s SELP声码器输出的清浊音参数(BPVC)最低位判断是否清浊音,将清音帧的清浊音参数由00000模式改为00101模式发送;
(2)采用BCH(15,7)码组保护第一级线谱对参数,共7比特,将校验位写到余量谱幅度参数的高8比特;采用BCH(31,16)码组保护第二、第三级线谱对参数和增益参数低4位,共16比特,将校验位写到余量谱幅度参数和基音周期共15比特;
(3)浊音帧采用改进的(7,4)汉明码保护线谱对参数矢量量化后的第一级,在信息位的最后一位填充零,校验位写到余量谱幅度参数的高6位,最后与被保护后的清音帧合路输出。
在语音解码端:
(1)接收到的语音参数序列提取出清浊音参数,并对清浊音参数逐比特位做权重加和;
(2)对于权重为偶数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,判断清浊音参数是否全为零;对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,继续判别是否增益参数小于107并且受保护参数是否在BCH码的译码范围之内;对于在译码能力之内的帧判为清音帧,否则判为浊音帧;
(3)对于权重为奇数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,对于翻转后的清浊音参数进行多数位判决;
(4)对于多数判决小于2的帧,继续判断受保护参数是否在BCH码译码范围之内;对于在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于多数位判决大于或者等于2的帧,直接判为浊音帧;至此,清浊音判决结束;
(5)对于所有判为浊音帧的清浊音参数翻转清浊音参数比特顺序中最低位和第三低位,并选取在前面5帧清浊音参数信息的长时统计条件下后验概率最大的清浊音参数作为其恢复值;对于所有判为清音帧的清浊音参数置为全零模式;
(6)清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特;采用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代;
(7)浊音帧采用与编码端相对应的汉明码纠错;若检测到恢复得到的第四位信息位为1,则说明线谱对参数出错,采用基于信源信道联合特性的线谱对参数抗误码算法恢复,即在基于语音模式信息和长时特性的条件下选择均方误差意义下误差最小的参数作为其恢复值
;首先翻转第4,5,6比特位加上接收到得线谱对参数共4个候选线谱对参数
,然后设前两帧、前一帧和当前帧解码后线谱对参数分别为
,N为参数的矢量维数,计算连续稳定浊音帧之间的矢量差值: ,当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1;当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于0.1,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程,否则置为1;最后得到线谱对参数的恢复值
其中
,P(s)为前向统计概率由大规模标准语音库离线统计得到,Wn,k通过上述判决得到;
(8)清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比;若检测到信道有误码,则打开影响原始声码器合成语音质量的基音周期后处理和增益后处理选项;
(9)合路送2.4 kb/s SELP解码器合成语音。
本发明的特点是对编码端对清音帧采用了清浊音参数和其他重要性参数不同的前向纠错保护方案,在解码端采用了基于信源信道特性的清浊音分支判决和对其他重要性参数相应的解码和恢复算法,方案中引入了信源信道联合编码的思想。传统SELP低速率语音编码算法对于清音帧是不保护的,由于低速率语音编码算法使每个参数比特承载的信息量加大,在高误码率信道下由于参数发生错误会导致合成语音质量的大幅下降。本发明通过利用清音帧的残留冗余度,在编解码器内部进行前向纠错,用于保护本帧清音帧。本发明对清浊音参数采用基于信源信道特性的清浊音分支判决方法,综合利用了(1)语音信号清音帧BPVC参数跳转统计概率(2)奇偶校验是否成功;(3)清音帧的增益参数应小于107;(4)BCH码是否在译码范围之内等信源和信道的特性综合判决接收到的当前帧的清浊音情况,降低清浊音参数这个重要性很高的参数在较高误码率下的误判率。本发明通过大规模语音客观MOS测试确定语音参数对合成语音质量的重要性程度,并利用BCH系统码对高重要性的参数进行保护。提高了语音重要性参数在高误码率下的正确性。同时引入了清浊音参数长时MAP准则恢复结合基于信源信道联合特性的线谱对参数抗误码恢复算法,信道编码保护和信道误码检测器,进一步提高了声码器在无误码和高误码率下的合成语音质量。
本发明在不消耗任何额外带宽且无算法延时的要求下可以显著提高2.4 kb/s SELP声码器抗信道误码能力和合成语音质量,使合成语音具有更高的可懂性和舒适度。经典型语句测试,本发明与未采用保护方案的SELP声码器比较能在不同信道误码的情况下将合成语音MOS分平均提高20%。在无误码和有误码的情况下合成语音质量均高于美国政府标准MELPe 2.4 kb/s声码器方案。平均MOS分无误码时比MELPe算法高0.35,1%信道误码时比MELPe算法高0.45,3%信道误码时比MELPe算法高0.32,5%信道误码时比MELPe算法高0.27。该方法最适合2.4 kb/s SELP低速率参数语音编码。
附图说明
图1编码端抗信道误码保护方案框图。
图2解码端抗信道误码保护方案框图。
图3发明算法方案整体框图。
具体实施方式
本发明提出的2.4 kb/s SELP低速率声码器的清音帧保护方法结合附图及实施例进一步说明如下:
本发明的方法在数字集成电路芯片中依次按以下步骤实现的,如图1所示,在编码器端::(1) 2.4kb/s SELP声码器输出的清浊音参数(BPVC)最低位判断是否清浊音,将清音帧的清浊音参数由00000模式改为00101模式发送;
(2)采用BCH(15,7)码组保护第一级线谱对参数,共7比特,将校验位写到余量谱幅度参数的高8比特;采用BCH(31,16)码组保护第二、第三级线谱对参数和增益参数低4位,共16比特,将校验位写到余量谱幅度参数和基音周期共15比特;
(3)浊音帧采用改进的(7,4)汉明码保护线谱对参数矢量量化后的第一级,在信息位的最后一位填充零,校验位写到余量谱幅度参数的高6位,最后与被保护后的清音帧合路输出。
本发明上述方法各步骤的具体实施例分别详细说明如下:
上述方法步骤(1)的实施例为:语音分为清音帧和浊音帧,2.4 kb/s SELP低速率语音声码器编码用5比特清浊音参数(BPVC)来代表当前编码帧的清浊音状态。编码器对每一帧语音划分为5个子带,并对每个子带提取清浊音参数,若子带为清音,用“0”表示,子带为浊音则用“1”表示,记为B,B=b1,b2,b3,b4,b5,再对该子带清浊音参数B用5比特标量量化,5个比特依次对应着5个子带的清浊音模式,即若第k个子带为浊音,则bk=1,否则bk=0,该量化值编码后经信道传输到解码端将清浊音参数对应为二进制数,则清音帧清浊音参数模式为0,浊音帧模式为16~31,清浊音一共17种不同的模式(模式为5比特清浊音参数按照二进制权重的表示方法,最低位权重最高,权重依次为16∶8∶4∶2∶1)。对于清音帧的BPVC进行偶校验,将校验位写入最低位,结果仍不改变原清浊音的模式。清浊音参数的判决准确性对于整个算法方案起决定性作用。在解码端经过信道误码干扰后的BPVC一旦判决错误,直接影响该帧是否进行后续解码过程,是否会对正确接收的浊音帧进行错误解码。SELP编码中采用预测和插值技术,一旦判决错误也会带来影响后续多帧类似“误码扩散”的恶劣效果。因此对于BPVC的保护是本方案中特别需要注意的问题。采用超过107M字节的标准测试语音库进行测试,总帧数273841帧。在信道随机误码率1%~5%的条件下,浊音帧清浊音参数模式因受信道误码影响而跳转到其他模式的次数统计结果如下:
表1.信道误码率为1%时各模式的分布次数
BPVC模式 | 跳转到该模式下的次数 | BPVC模式 | 跳转到该模式下的次数 |
00000 | 213 | 10000 | 21035 |
00001 | 11 | 10001 | 1119 |
00010 | 14 | 10010 | 1150 |
00011 | 6 | 10011 | 922 |
00100 | 28 | 10100 | 2225 |
00101 | 4 | 10101 | 543 |
00110 | 13 | 10110 | 1220 |
00111 | 56 | 10111 | 4162 |
01000 | 190 | 11000 | 19315 |
01001 | 24 | 11001 | 2457 |
01010 | 21 | 11010 | 2605 |
01011 | 60 | 11011 | 4689 |
01100 | 174 | 11100 | 17184 |
01101 | 83 | 11101 | 7184 |
01110 | 165 | 11110 | 17880 |
01111 | 922 | 11111 | 92546 |
表2.信道误码率为2%时各模式的分布次数
BPVC模式 | 跳转到该模式下的次数 | BPVC模式 | 跳转到该模式下的次数 |
00000 | 407 | 10000 | 20224 |
00001 | 21 | 10001 | 1282 |
00010 | 35 | 10010 | 1333 |
00011 | 19 | 10011 | 992 |
00100 | 60 | 10100 | 2527 |
00101 | 15 | 10101 | 666 |
00110 | 24 | 10110 | 1437 |
00111 | 113 | 10111 | 4925 |
01000 | 386 | 11000 | 18830 |
01001 | 54 | 11001 | 2693 |
01010 | 53 | 11010 | 2871 |
01011 | 119 | 11011 | 5397 |
01100 | 337 | 11100 | 16780 |
01101 | 178 | 11101 | 7939 |
01110 | 362 | 11110 | 18125 |
01111 | 1787 | 11111 | 88229 |
表3.信道误码率为3%时各模式的分布次数
BPVC模式 | 跳转到该模式下的次数 | BPVC模式 | 跳转到该模式下的次数 |
00000 | 550 | 10000 | 19502 |
00001 | 41 | 10001 | 1456 |
00010 | 49 | 10010 | 1554 |
00011 | 33 | 10011 | 1078 |
00100 | 92 | 10100 | 2807 |
00101 | 25 | 10101 | 809 |
00110 | 45 | 10110 | 1658 |
00111 | 179 | 10111 | 5519 |
01000 | 570 | 11000 | 18237 |
01001 | 85 | 11001 | 2913 |
01010 | 99 | 11010 | 3167 |
01011 | 191 | 11011 | 6097 |
01100 | 483 | 11100 | 16434 |
01101 | 282 | 11101 | 8664 |
01110 | 543 | 11110 | 18348 |
01111 | 2628 | 11111 | 84082 |
表4.信道误码率为4%时各模式的分布次数
BPVC模式 | 跳转到该模式下的次数 | BPVC模式 | 跳转到该模式下的次数 |
00000 | 741 | 10000 | 18782 |
00001 | 63 | 10001 | 1599 |
00010 | 77 | 10010 | 1713 |
00011 | 55 | 10011 | 1192 |
00100 | 130 | 10100 | 3081 |
00101 | 35 | 10101 | 978 |
00110 | 83 | 10110 | 1881 |
00111 | 262 | 10111 | 6126 |
01000 | 713 | 11000 | 17770 |
01001 | 116 | 11001 | 3091 |
01010 | 152 | 11010 | 3460 |
01011 | 296 | 11011 | 6713 |
01100 | 633 | 11100 | 16077 |
01101 | 411 | 11101 | 9293 |
01110 | 735 | 11110 | 18526 |
01111 | 3419 | 11111 | 80017 |
表5.信道误码率为5%时各模式的分布次数
BPVC模式 | 跳转到该模式下的次数 | BPVC模式 | 跳转到该模式下的次数 |
00000 | 931 | 10000 | 18110 |
00001 | 90 | 10001 | 1764 |
00010 | 100 | 10010 | 1866 |
00011 | 76 | 10011 | 1328 |
00100 | 155 | 10100 | 3296 |
00101 | 54 | 10101 | 1145 |
00110 | 120 | 10110 | 2107 |
00111 | 355 | 10111 | 6659 |
01000 | 857 | 11000 | 17293 |
01001 | 161 | 11001 | 3286 |
01010 | 203 | 11010 | 3761 |
01011 | 414 | 11011 | 7266 |
01100 | 823 | 11100 | 15727 |
01101 | 546 | 11101 | 9801 |
01110 | 940 | 11110 | 18633 |
01111 | 4065 | 11111 | 76288 |
由表1~表5可见,在各种信道误码率条件下,浊音帧错误跳转到模式00101的概率都是最小的。因此,将原来清音帧模式00000改为发送模式00101,从而可以降低由于信道误码而带来的清浊音判决失误。
上述方法步骤(2)的实施例为:2.4 kb/s SELP低速率语音编码器编码后的比特分配如下表所示:
表6.2.4 kb/s SELP声码器参数分配表
参数(parameters) | 分配比特数(bits) |
SYN(同步位) | 1 |
线谱对参数(共4级) | 7,6,6,5 |
余量谱幅度参数 | 10+6(空余) |
增益参数 | 7 |
BPVC(清浊音)参数 | 5 |
基音周期参数 | 7 |
清音帧在解码端对于基因周期直接置为50,对于余量谱幅度参数也不必传输。因此一共有16+7=23比特可用于保护当前清音帧。经过大规模语音客观MOS分测试,参数影响合成语音质量的重要性如下:线谱对参数矢量量化第一级>线谱对参数矢量量化第二级>线谱对参数矢量量化第三级>增益参数(前4比特)>线谱对参数矢量量化第四级。因此选择编码保护线谱对矢量量化后的1-3级和增益参数。
信道编码需要在声码器内部进行,且编码长度有限,为每帧23比特,且不能引入过大的编解码延时。对比BCH,RS,RCPC码组,从纠错性能的角度选择了BCH码组。其纠错性能在2.4 kb/s声码器中比其他两种都优秀。当信道错误在BCH译码范围以外时,译码算法能给出指示,提供给清浊音参数判决。
经过参数比特组合,采用BCH(31,16)系统码保护第二、第三级线谱对参数和增益参数的低四位,共16比特。将校验位写到余量谱幅度参数和基音周期的15比特中。采用BCH(15,7)码组保护第一级线谱对参数共7比特。将校验位写到余量谱幅度参数的高8比特
MELPe中采用7-4和8-4汉明码,而本方案采用BCH(31,16),其剩余误码率情况如下:
表7.两种算法剩余误码率
误码率 | 0.005 | 0.007 | 0.01 | 0.015 | 0.02 | 0.03 |
MELPe | 0.00051 | 0.00100 | 0.00203 | 0.00449 | 0.00785 | 0.0170 |
本算法 | 0 | 0 | 0.00027 | 0.00112 | 0.00299 | 0.0167 |
上述方法步骤(3)的实施例为:浊音帧采用两组(7,4)汉明码保护线谱对参数矢量量化的第一级,在信息位的最后一位填充零。校验位写到余量谱幅度参数的高6位比特。
本发明在解码器端,如图2所示,包括以下步骤:
(1)接收到的语音参数序列提取出清浊音参数,并对清浊音参数逐比特位做权重加和;
(2)对于权重为偶数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,判断清浊音参数是否全为零;对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,继续判别是否增益参数小于107并且受保护参数是否在BCH码的译码范围之内;对于在译码能力之内的帧判为清音帧,否则判为浊音帧;
(3)对于权重为奇数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,对于翻转后的清浊音参数进行多数位判决;
(4)对于多数判决小于2的帧,继续判断受保护参数是否在BCH码译码范围之内;对于在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于多数位判决大于或者等于2的帧,直接判为浊音帧;至此,清浊音判决结束;
(5)对于所有判为浊音帧的清浊音参数翻转清浊音参数比特顺序中最低位和第三低位,并选取在前面5帧清浊音参数信息的长时统计条件下后验概率最大的清浊音参数作为其恢复值;对于所有判为清音帧的清浊音参数置为全零模式;
(6)清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特;采用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代;
(7)浊音帧采用与编码端相对应的汉明码纠错;若检测到恢复得到的第四位信息位为1,则说明线谱对参数出错,采用基于信源信道联合特性的线谱对参数抗误码算法恢复,即在基于语音模式信息和长时特性的条件下选择均方误差意义下误差最小的参数作为其恢复值
;首先翻转第4,5,6比特位加上接收到得线谱对参数共4个候选线谱对参数
,然后设前两帧、前一帧和当前帧解码后线谱对参数分别为
,N为参数的矢量维数,计算连续稳定浊音帧之间的矢量差值: ,当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1;当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于0.1,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程,否则置为1;最后得到线谱对参数的恢复值
(8)清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比;若检测到信道有误码,则打开影响原始声码器合成语音质量的基音周期后处理和增益后处理选项;
(9)合路送2.4 kb/s SELP解码器合成语音。
本发明上述方法各步骤的具体实施例分别详细说明如下:
上述方法步骤(1)的实施例为:在解码端对于接收到的语音参数序列提取出5比特清浊音参数信息。对于清浊音参数统计其汉明权重值。
上述方法步骤(2)的实施例为:清浊音参数汉明权重为偶数的帧,有两个可能:1)是清音帧,且BPVC参数满足权重要求;2)是浊音帧,但因为受到信道误码的影响而使比特位发生翻转,从而通过了权重判决。因此,需要继续判决。对于汉明权重为偶数的清浊音参数,翻转最高位和第三高位,以保证与编码端将清音帧清浊音模式从00000改为00101对应,然后判断清浊音参数是否全为零。对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,通过大规模标准语音统计,该判决支路的清音帧接收到的增益参数的值均小于107(7比特增益参数,按照2进制权值计算大小)。并且清音帧的受保护参数应当在BCH码的译码能力范围之内。因此设计继续判别其增益参数是否小于107并且受保护参数是否在BCH码的译码能力之内,对于满足条件的帧判为清音帧,否则判为浊音帧。
上述方法步骤(3)的实施例为:对于汉明权重为奇数的清浊音参数,翻转最高位和第三高位,同样对应于编码端将清音帧清浊音模式从00000改为00101。对于翻转后的清浊音参数进行多数位判决。考虑到信道的对称性,每一比特位的权重是一样的,因此将5比特清浊音参数按比特位加和,得到多数判决的结果。
上述方法步骤(4)的实施例为:清音帧发送模式为00000,与任何位重量大于等于2的模式的汉明距离均大于或者等于2。清音帧BPVC参数5比特同时发生2比特翻转的概率是很小的,因此将多数判决门限设为2。对于多数判决结果小于2且受保护参数在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于多数位判决大于或者等于2的帧,直接判为浊音帧;
上述方法步骤(5)的实施例为:在编码端将清音帧的清浊音参数发送模式从00000改为00101,因此将判决为清音帧的清浊音参数重新置为00000;在基于分支判决的过程中,将浊音帧的清浊音参数也进行过翻转,因此也需要将判决为浊音帧的清浊音参数的最高位和第三高位翻转。语音中清浊音参数与前面已收到的清浊音参数之间存在着一定的相关性。语音帧的清浊音参数记为Bi,0≤i≤n,其中n为帧序号。前面连续多帧的清浊音参数记为Bi j,0≤i≤j≤n,则当前帧的清浊音参数记为Bn,设前面帧为清音时Bi=0,浊音时Bi=1。则根据语音清浊音参数的稳定性有:
即前面连续帧是浊音帧时,当前帧是浊音帧的概率大于当前帧是清音帧得概率,同样当前面连续帧是清音帧时,当前帧是清音帧的概率大于当前帧是浊音帧得概率。设接收端接收到的比特序列为r,当发现本帧清浊音参数Bn受信道误码影响出现错误后,按比特位翻转形成编码端候选清浊音参数Bn,j,1≤j≤N。计算结合长时统计特性的后验概率为
其中p(r,Bi j)是接收端的出现概率,p(Bn,j,r,Bi j)可以通过大规模统计信源特性得到。因此选择使该后验概率取值最大的Bn,j为解码端恢复得到的清浊音参数。该参数在结合长时统计特性的改进MAP的准则下是最优的,由此得到了清浊音参数的恢复值。对于基于模式信息的线谱对参数差错恢复的准确有有进一步的帮助。特别注意,该判决的清浊音参数并不回写,仅提供给线谱对参数差错恢复以提高准确性。
上述方法步骤(6)的实施例为:对于清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特。用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;并指示是否在译码范围之外,译码器采用Berlekamp迭代译码。对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代。具体的说,用一位标志位记录前帧对应参数是否正确。若前一帧为清音帧,则当前帧对应参数在译码范围之内时记为正确,否则记为不正确。若前一帧为浊音帧,则对应参数未经过修改时记为正确,否则记为不正确。选用正确的对应参数进行替代,能有效抑制在高误码率下由于采用前帧替代而产生的“误码扩散”的恶劣效果。
上述方法步骤(7)的实施例为:若汉明码解码时所插入的“0”位变为1,则说明已经超出汉明码纠错的能力范围,基于信源信道联合特性的线谱对参数抗误码算法恢复。否则不处理。
声码器中对合成语音质量影响最大的参数为线谱对参数第一级矢量,将汉明码校验后的校验位写到最不重要的余量谱幅度参数中。由于余量谱幅度参数仅提高语音的细节特性,因此对合成语音的质量影响很小。线谱对参数矢量在稳定的浊音帧时变化较为平缓,而且清浊音参数作为状态信息在前面已经经过抗误码恢复得到了较准确的估计值,因此稳定浊音帧时变化较大的线谱对矢量则是受到信道误码后发生错误的。这个信源特性可以结合信道特性更好地恢复线谱对参数。
特别的,由于在2.4 kb/s SELP保护方案中汉明码仅能发现线谱对参数矢量量化后第一级的第4、5、6比特位或校验位出错时的情况,因此上述差错后处理过程中仅针对线谱对参数矢量量化后第一级的第4、5、6比特位或校验位出错而进行处理,相应的参数集的范围限定为线谱对参数矢量量化后第一级的第4、5、6比特位和原始接收到的线谱对参数第一级。设接收端接收到的线谱对参数为
,是一个矢量,k为帧序号。基于前向统计概率和分模式加权的最小均方误差准则下的线谱对参数差错后处理具体方法如下:
1)若校验失败有两种可能:1、线谱对参数第一级发生了奇数个错误;2、校验位本身受信道误码影响出错。在5×10-2左右的信道误码率下,线谱对参数比特序列发生3比特错误的概率是发生1比特错误的概率的400倍以上,因此对于大规模语音来说,只考虑残留1比特出错的情况。翻转线谱对参数比特序列的各个比特位形成线谱对的候选参数集合
,其中t为对应的翻转比特位,t=4,5,6。对于校验位出错的情况,接收到的线谱对参数
也是候选参数之一,因此共有4个候选线谱对参数
2)对4个候选参数给于不同的权重,权重的分配由参数的前向出现概率决定。由于声码器中稳定的浊音帧中线谱对参数矢量的变化范围一般不大。前两子帧、前一子帧和当前子帧解码后线谱对参数分别为
,N为参数的矢量维数。线谱对参数各维矢量严格按大小顺序排列。连续稳定浊音帧之间的矢量差值为:
通过超过104M的标准语音库统计,在2.4 kb/s声码器中选取差值的阈值为0.1。当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1。当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于给定阈值,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程。否则置为1。连续的浊音帧在声码器中占60%左右的比例,加入权重判决后能进一步提高线谱对参数的恢复质量,进而提高声码器的抗误码性能。受到信道随机误码影响时各个候选参数的出现概率是一样的,因此前向转移概率Pk(r|s)归一化为1,其中s为编码端发送的参数比特序列。设为收到当前参数序列的情况下各个候选参数出现的后验概率。当前声码器频率参数估计的误差期望为:
上述方法步骤(8)的实施例为:清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比。若对应序列比特不相同,则认为检测到信道有误码,则将控制位比特置为“1”,打开会影响原始声码器合成语音质量的基音周期后处理和增益后处理选项。否则控制位比特置为“0”关闭该选项。
Claims (4)
1、2.4kb/s SELP低速率声码器抗信道误码保护方法,所述方法是在数字集成电路芯片中依次按以下步骤实现的,在编码器端:
(1)2.4kb/s SELP声码器输出的清浊音参数(BPVC)最低位判断是否清浊音,将清音帧的清浊音参数由00000模式改为00101模式发送;
(2)采用BCH(15,7)码组保护第一级线谱对参数,共7比特,将校验位写到余量谱幅度参数的高8比特;采用BCH(31,16)码组保护第二、第三级线谱对参数和增益参数低4位,共16比特,将校验位写到余量谱幅度参数和基音周期共15比特;
(3)浊音帧采用改进的(7,4)汉明码保护线谱对参数矢量量化后的第一级,在信息位的最后一位填充零,校验位写到余量谱幅度参数的高6位,最后与被保护后的清音帧合路输出。
2、2.4kb/s SELP低速率声码器抗信道误码保护方法,所述方法是在数字集成电路芯片中依次按以下步骤实现的,在解码器端:
(1)接收到的语音参数序列提取出清浊音参数,并对清浊音参数逐比特位做权重加和;
(2)对于权重为偶数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,判断清浊音参数是否全为零;对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,继续判别是否增益参数小于107并且受保护参数是否在BCH码的译码范围之内;对于在译码能力之内的帧判为清音帧,否则判为浊音帧;
(3)对于权重为奇数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,对于翻转后的清浊音参数进行逐比特位做权重加和;
(4)对于权重小于2的帧,继续判断受保护参数是否在BCH码译码范围之内;对于在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于权重大于或者等于2的帧,直接判为浊音帧;至此,清浊音判决结束;
(5)对于所有判为浊音帧的清浊音参数翻转清浊音参数比特顺序中最低位和第三低位,并选取在前面5帧清浊音参数信息的长时统计条件下后验概率最大的清浊音参数作为其恢复值;对于所有判为清音帧的清浊音参数置为全零模式;
(6)清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特;采用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代;
(7)浊音帧采用与编码端相对应的汉明码纠错;若检测到恢复得到的第四位信息位为1,则说明线谱对参数出错,采用基于信源信道联合特性的线谱对参数抗误码算法恢复,即在基于语音模式信息和长时特性的条件下选择均方误差意义下误差最小的参数作为其恢复值
首先翻转第4,5,6比特位加上接收到得线谱对参数共4个候选线谱对参数
然后设前两帧、前一帧和当前帧解码后线谱对参数分别为
N为参数的矢量维数,计算连续稳定浊音帧之间的矢量差值: 当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1;当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于0.1,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程,否则置为1;最后得到线谱对参数的恢复值
其中
P(s)为前向统计概率由大规模标准语音库离线统计得到,Wn,k通过上述判决得到;
(8)清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比;若检测到信道有误码,则打开影响原始声码器合成语音质量的基音周期后处理和增益后处理选项;
(9)合路送2.4kb/s SELP解码器合成语音。
3、按权利要求1所述的方法,其特征在于,所述编码端步骤(2)中依次将BCH码组校验位写到余量谱幅度和基音周期中,顺序不限于此,可以互换;在解码端从对应位置提取校验位。
4、按权利要求2所述的方法,其特征在于,所述解码端步骤(8)中采用信道误码检测器判决当前信道误码水平;当检测没有信道误码发生时,关闭基音周期后处理和增益后处理选项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100628646A CN101004915B (zh) | 2007-01-19 | 2007-01-19 | 2.4kb/s SELP 低速率声码器抗信道误码保护方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100628646A CN101004915B (zh) | 2007-01-19 | 2007-01-19 | 2.4kb/s SELP 低速率声码器抗信道误码保护方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101004915A true CN101004915A (zh) | 2007-07-25 |
CN101004915B CN101004915B (zh) | 2011-04-06 |
Family
ID=38704006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007100628646A Expired - Fee Related CN101004915B (zh) | 2007-01-19 | 2007-01-19 | 2.4kb/s SELP 低速率声码器抗信道误码保护方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101004915B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908888B (zh) * | 2009-06-03 | 2013-07-03 | 晨星软件研发(深圳)有限公司 | 反量化处理方法与装置 |
WO2015161493A1 (en) * | 2014-04-24 | 2015-10-29 | Motorola Solutions, Inc. | Method and apparatus for enhancing alveolar trill |
CN109448739A (zh) * | 2018-12-13 | 2019-03-08 | 山东省计算中心(国家超级计算济南中心) | 基于分层聚类的声码器线谱频率参数量化方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3343965B2 (ja) * | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
US5636231A (en) * | 1995-09-05 | 1997-06-03 | Motorola, Inc. | Method and apparatus for minimal redundancy error detection and correction of voice spectrum parameters |
US6587826B1 (en) * | 1999-12-15 | 2003-07-01 | Agere Systems Inc. | Channel code configurations for digital audio broadcasting systems and other types of communication systems |
CN1248512C (zh) * | 2004-09-26 | 2006-03-29 | 陈贺新 | 嵌入式音视频混合信号同步编码技术 |
-
2007
- 2007-01-19 CN CN2007100628646A patent/CN101004915B/zh not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101908888B (zh) * | 2009-06-03 | 2013-07-03 | 晨星软件研发(深圳)有限公司 | 反量化处理方法与装置 |
WO2015161493A1 (en) * | 2014-04-24 | 2015-10-29 | Motorola Solutions, Inc. | Method and apparatus for enhancing alveolar trill |
US10127916B2 (en) | 2014-04-24 | 2018-11-13 | Motorola Solutions, Inc. | Method and apparatus for enhancing alveolar trill |
CN109448739A (zh) * | 2018-12-13 | 2019-03-08 | 山东省计算中心(国家超级计算济南中心) | 基于分层聚类的声码器线谱频率参数量化方法 |
CN109448739B (zh) * | 2018-12-13 | 2019-08-23 | 山东省计算中心(国家超级计算济南中心) | 基于分层聚类的声码器线谱频率参数量化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101004915B (zh) | 2011-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2026330B1 (en) | Device and method for lost frame concealment | |
CN101578508B (zh) | 用于对语音信号中的过渡帧进行编码的方法和设备 | |
CN101494055B (zh) | 用于码分多址无线系统的方法和装置 | |
CN110473557B (zh) | 一种基于深度自编码器的语音信号编解码方法 | |
US6408267B1 (en) | Method for decoding an audio signal with correction of transmission errors | |
CN102034476B (zh) | 语音帧错误检测的方法及装置 | |
CN101004916B (zh) | 声码器线谱对参数抗信道误码方法 | |
CA2154253A1 (en) | Soft error correction in a tdma radio system | |
JP2000357999A (ja) | 復号装置及び方法、並びにプログラム提供媒体 | |
CN110491400B (zh) | 一种基于深度自编码器的语音信号重建方法 | |
CN1143470C (zh) | 掩蔽故障的方法和装置 | |
CN101166071A (zh) | 差错帧隐藏装置与方法 | |
CN101004915B (zh) | 2.4kb/s SELP 低速率声码器抗信道误码保护方法 | |
CN101009098B (zh) | 声码器增益参数分模式抗信道误码方法 | |
EP0747884A2 (en) | Codebook gain attenuation during frame erasures | |
CN101009097B (zh) | 1.2kb/s SELP低速率声码器抗信道误码保护方法 | |
CN101086844A (zh) | 抗信道恶劣丢包伴随误码的语音编码传输方法 | |
CN101895373B (zh) | 信道译码方法、系统及装置 | |
McLarnon | A method for reducing the transmission rate of a channel vocoder by using frame interpolation | |
Salami et al. | Performance of error protected binary pulse excitation coders at 11.4 kb/s over mobile radio channels | |
Cheng et al. | Improvement of Packet Loss Concealment for EVS Codec Based on Deep Learning | |
Su et al. | Improving the speech quality of cellular mobile systems under heavy fading | |
Gao et al. | A speech coding error control transmission scheme based on UEP for bandwidth-limited channels | |
Mohammadi | Spectral coding of speech based on generalized sorted codebook vector quantization | |
Görtz | On the combination of redundant and zero-redundant channel error detection in CELP speech-coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110406 Termination date: 20150119 |
|
EXPY | Termination of patent right or utility model |