CN101004915A - 2.4kb/s SELP 低速率声码器抗信道误码保护方法 - Google Patents

2.4kb/s SELP 低速率声码器抗信道误码保护方法 Download PDF

Info

Publication number
CN101004915A
CN101004915A CNA2007100628646A CN200710062864A CN101004915A CN 101004915 A CN101004915 A CN 101004915A CN A2007100628646 A CNA2007100628646 A CN A2007100628646A CN 200710062864 A CN200710062864 A CN 200710062864A CN 101004915 A CN101004915 A CN 101004915A
Authority
CN
China
Prior art keywords
parameter
pure
frame
unvoiced
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100628646A
Other languages
English (en)
Other versions
CN101004915B (zh
Inventor
唐昆
崔慧娟
彭坦
龚晨
李晔
洪侃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN2007100628646A priority Critical patent/CN101004915B/zh
Publication of CN101004915A publication Critical patent/CN101004915A/zh
Application granted granted Critical
Publication of CN101004915B publication Critical patent/CN101004915B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明属于低速率语音抗差错编码技术领域。该方法在编码端改变2.4kb/s SELP编码后清音帧清浊音参数的发送模式;采用BCH码和改进的(7,4)汉明码分别保护清音和浊音帧中的语音参数;在解码端,根据信源信道的联合特性采用分支判决确定清浊音;对于清音帧采用相应BCH码恢复出对应参数,对于浊音帧采用基于长时统计特性的最大后验概率准则恢复清浊音参数,并解码出线谱对参数第一级并对残留误码的线谱对参数采用线谱对参数抗误码算法恢复。该方法在不消耗任何额外带宽且无延时的要求下可以显著提高2.4kb/s SELP声码器抗信道误码能力和合成语音质量。

Description

2.4kb/s SELP 低速率声码器抗信道误码保护方法
技术领域
本发明属于语音编码技术领域,特别涉及语音编码抗信道误码技术
背景技术
速率为2.4kb/s的低速率语音编码在无线通信、保密通信、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。由于低速率语音编码使每个语音参数所承载的信息量加大,在条件较为苛刻或者恶劣的高误码率窄带无线信道环境下,例如:野外无线信道、短波超短波通信、保密通信等,信道误码对重建语音质量影响很大。受高误码率影响的低速率声码器重建语音可懂度、自然度和舒适度都会有较大的下降。而低速率语音传输的特殊性要求不允许有额外的带宽消耗和较大的编解码时延,这与传统信道编码需要额外带宽来保护数据且有编解码延时相矛盾,因此需要在编码器内部基于信源信道联合编码的思想进行语音参数保护。SELP低速率声码器将语音分为清音帧和浊音帧,并由清浊音参数(BPVC)来表示清浊音状态。其中浊音帧某些参数对合成语音质量影响不大,而清音帧中的某些参数不必传输,因而利用声码器本身的冗余度进行前向纠错保护。美国政府标准2.4 kb/s MELPe算法中,利用清音帧不传送的Fourier magnitudes,bandpass voicing和jitter bits参数的冗余采用3组(7,4)汉明码和一组(8,4)汉明码来保护LSF 7比特参数和增益8比特参数,浊音帧中清浊音信息与基音周期联合量化。由于采用汉明码仅能纠正一位比特错误,在高误码率的情况下,剩余误码率会显著增加。而且当发生错误的时候也只采用前帧参数直接替代本帧参数的方式,影响了有信道误码时的合成语音质量。因此需要采用更好的整体清浊音抗信道误码保护算法。
发明内容
本发明的目的是为了在保证无信道误码情况下合成语音质量基本不变的前提下,同时大幅度提高低速率声码器在高误码率窄带无线信道下的合成语音质量,提出一种基于2.4kb/sSELP低速率声码器的清音帧保护方法,能够在不增加额外带宽和无算法延时的情况下,显著提高噪声环境下的语音合成质量。
本发明提出的基于2.4kb/s SELP低速率声码器的清音帧保护方法,在数字集成电路芯片中依次按以下步骤实现的,在编码器端:
(1)2.4kb/s SELP声码器输出的清浊音参数(BPVC)最低位判断是否清浊音,将清音帧的清浊音参数由00000模式改为00101模式发送;
(2)采用BCH(15,7)码组保护第一级线谱对参数,共7比特,将校验位写到余量谱幅度参数的高8比特;采用BCH(31,16)码组保护第二、第三级线谱对参数和增益参数低4位,共16比特,将校验位写到余量谱幅度参数和基音周期共15比特;
(3)浊音帧采用改进的(7,4)汉明码保护线谱对参数矢量量化后的第一级,在信息位的最后一位填充零,校验位写到余量谱幅度参数的高6位,最后与被保护后的清音帧合路输出。
在语音解码端:
(1)接收到的语音参数序列提取出清浊音参数,并对清浊音参数逐比特位做权重加和;
(2)对于权重为偶数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,判断清浊音参数是否全为零;对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,继续判别是否增益参数小于107并且受保护参数是否在BCH码的译码范围之内;对于在译码能力之内的帧判为清音帧,否则判为浊音帧;
(3)对于权重为奇数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,对于翻转后的清浊音参数进行多数位判决;
(4)对于多数判决小于2的帧,继续判断受保护参数是否在BCH码译码范围之内;对于在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于多数位判决大于或者等于2的帧,直接判为浊音帧;至此,清浊音判决结束;
(5)对于所有判为浊音帧的清浊音参数翻转清浊音参数比特顺序中最低位和第三低位,并选取在前面5帧清浊音参数信息的长时统计条件下后验概率最大的清浊音参数作为其恢复值;对于所有判为清音帧的清浊音参数置为全零模式;
(6)清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特;采用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代;
(7)浊音帧采用与编码端相对应的汉明码纠错;若检测到恢复得到的第四位信息位为1,则说明线谱对参数出错,采用基于信源信道联合特性的线谱对参数抗误码算法恢复,即在基于语音模式信息和长时特性的条件下选择均方误差意义下误差最小的参数作为其恢复值
Figure A20071006286400051
;首先翻转第4,5,6比特位加上接收到得线谱对参数共4个候选线谱对参数 ,然后设前两帧、前一帧和当前帧解码后线谱对参数分别为
Figure A20071006286400062
Figure A20071006286400063
,N为参数的矢量维数,计算连续稳定浊音帧之间的矢量差值: diff = Σ N ( L k , N ^ - L k - 1 , N ^ ) 2 - Σ N ( L k - 1 , N ^ - L k - 2 , N ^ ) 2 ,当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1;当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于0.1,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程,否则置为1;最后得到线谱对参数的恢复值 LS P ^ t , k , n = Σ n Σ t Σ k L t , k , n ^ × P t , k ( L t , k , N ^ , s ) P ( s ) × W n , k , t = 0,4,5,6 , 其中 ,P(s)为前向统计概率由大规模标准语音库离线统计得到,Wn,k通过上述判决得到;
(8)清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比;若检测到信道有误码,则打开影响原始声码器合成语音质量的基音周期后处理和增益后处理选项;
(9)合路送2.4 kb/s SELP解码器合成语音。
本发明的特点是对编码端对清音帧采用了清浊音参数和其他重要性参数不同的前向纠错保护方案,在解码端采用了基于信源信道特性的清浊音分支判决和对其他重要性参数相应的解码和恢复算法,方案中引入了信源信道联合编码的思想。传统SELP低速率语音编码算法对于清音帧是不保护的,由于低速率语音编码算法使每个参数比特承载的信息量加大,在高误码率信道下由于参数发生错误会导致合成语音质量的大幅下降。本发明通过利用清音帧的残留冗余度,在编解码器内部进行前向纠错,用于保护本帧清音帧。本发明对清浊音参数采用基于信源信道特性的清浊音分支判决方法,综合利用了(1)语音信号清音帧BPVC参数跳转统计概率(2)奇偶校验是否成功;(3)清音帧的增益参数应小于107;(4)BCH码是否在译码范围之内等信源和信道的特性综合判决接收到的当前帧的清浊音情况,降低清浊音参数这个重要性很高的参数在较高误码率下的误判率。本发明通过大规模语音客观MOS测试确定语音参数对合成语音质量的重要性程度,并利用BCH系统码对高重要性的参数进行保护。提高了语音重要性参数在高误码率下的正确性。同时引入了清浊音参数长时MAP准则恢复结合基于信源信道联合特性的线谱对参数抗误码恢复算法,信道编码保护和信道误码检测器,进一步提高了声码器在无误码和高误码率下的合成语音质量。
本发明在不消耗任何额外带宽且无算法延时的要求下可以显著提高2.4 kb/s SELP声码器抗信道误码能力和合成语音质量,使合成语音具有更高的可懂性和舒适度。经典型语句测试,本发明与未采用保护方案的SELP声码器比较能在不同信道误码的情况下将合成语音MOS分平均提高20%。在无误码和有误码的情况下合成语音质量均高于美国政府标准MELPe 2.4 kb/s声码器方案。平均MOS分无误码时比MELPe算法高0.35,1%信道误码时比MELPe算法高0.45,3%信道误码时比MELPe算法高0.32,5%信道误码时比MELPe算法高0.27。该方法最适合2.4 kb/s SELP低速率参数语音编码。
附图说明
图1编码端抗信道误码保护方案框图。
图2解码端抗信道误码保护方案框图。
图3发明算法方案整体框图。
具体实施方式
本发明提出的2.4 kb/s SELP低速率声码器的清音帧保护方法结合附图及实施例进一步说明如下:
本发明的方法在数字集成电路芯片中依次按以下步骤实现的,如图1所示,在编码器端::(1)  2.4kb/s SELP声码器输出的清浊音参数(BPVC)最低位判断是否清浊音,将清音帧的清浊音参数由00000模式改为00101模式发送;
(2)采用BCH(15,7)码组保护第一级线谱对参数,共7比特,将校验位写到余量谱幅度参数的高8比特;采用BCH(31,16)码组保护第二、第三级线谱对参数和增益参数低4位,共16比特,将校验位写到余量谱幅度参数和基音周期共15比特;
(3)浊音帧采用改进的(7,4)汉明码保护线谱对参数矢量量化后的第一级,在信息位的最后一位填充零,校验位写到余量谱幅度参数的高6位,最后与被保护后的清音帧合路输出。
本发明上述方法各步骤的具体实施例分别详细说明如下:
上述方法步骤(1)的实施例为:语音分为清音帧和浊音帧,2.4 kb/s SELP低速率语音声码器编码用5比特清浊音参数(BPVC)来代表当前编码帧的清浊音状态。编码器对每一帧语音划分为5个子带,并对每个子带提取清浊音参数,若子带为清音,用“0”表示,子带为浊音则用“1”表示,记为B,B=b1,b2,b3,b4,b5,再对该子带清浊音参数B用5比特标量量化,5个比特依次对应着5个子带的清浊音模式,即若第k个子带为浊音,则bk=1,否则bk=0,该量化值编码后经信道传输到解码端将清浊音参数对应为二进制数,则清音帧清浊音参数模式为0,浊音帧模式为16~31,清浊音一共17种不同的模式(模式为5比特清浊音参数按照二进制权重的表示方法,最低位权重最高,权重依次为16∶8∶4∶2∶1)。对于清音帧的BPVC进行偶校验,将校验位写入最低位,结果仍不改变原清浊音的模式。清浊音参数的判决准确性对于整个算法方案起决定性作用。在解码端经过信道误码干扰后的BPVC一旦判决错误,直接影响该帧是否进行后续解码过程,是否会对正确接收的浊音帧进行错误解码。SELP编码中采用预测和插值技术,一旦判决错误也会带来影响后续多帧类似“误码扩散”的恶劣效果。因此对于BPVC的保护是本方案中特别需要注意的问题。采用超过107M字节的标准测试语音库进行测试,总帧数273841帧。在信道随机误码率1%~5%的条件下,浊音帧清浊音参数模式因受信道误码影响而跳转到其他模式的次数统计结果如下:
表1.信道误码率为1%时各模式的分布次数
    BPVC模式   跳转到该模式下的次数     BPVC模式   跳转到该模式下的次数
    00000     213     10000     21035
    00001     11     10001     1119
    00010     14     10010     1150
    00011     6     10011     922
    00100     28     10100     2225
    00101     4     10101     543
    00110     13     10110     1220
    00111     56     10111     4162
    01000     190     11000     19315
    01001     24     11001     2457
    01010     21     11010     2605
    01011     60     11011     4689
    01100     174     11100     17184
    01101     83     11101     7184
    01110     165     11110     17880
    01111     922     11111     92546
表2.信道误码率为2%时各模式的分布次数
  BPVC模式   跳转到该模式下的次数    BPVC模式   跳转到该模式下的次数
    00000     407     10000     20224
    00001     21     10001     1282
    00010     35     10010     1333
    00011     19     10011     992
    00100     60     10100     2527
    00101     15     10101     666
    00110     24     10110     1437
    00111     113     10111     4925
    01000     386     11000     18830
    01001     54     11001     2693
    01010     53     11010     2871
    01011     119     11011     5397
    01100     337     11100     16780
    01101     178     11101     7939
    01110     362     11110     18125
    01111     1787     11111     88229
表3.信道误码率为3%时各模式的分布次数
  BPVC模式   跳转到该模式下的次数   BPVC模式   跳转到该模式下的次数
    00000     550     10000     19502
    00001     41     10001     1456
    00010     49     10010     1554
    00011     33     10011     1078
    00100     92     10100     2807
    00101     25     10101     809
    00110     45     10110     1658
    00111     179     10111     5519
    01000     570     11000     18237
    01001     85     11001     2913
    01010     99     11010     3167
    01011     191     11011     6097
    01100     483     11100     16434
    01101     282     11101     8664
    01110     543     11110     18348
    01111     2628     11111     84082
表4.信道误码率为4%时各模式的分布次数
  BPVC模式   跳转到该模式下的次数     BPVC模式   跳转到该模式下的次数
    00000     741     10000     18782
    00001     63     10001     1599
    00010     77     10010     1713
    00011     55     10011     1192
    00100     130     10100     3081
    00101     35     10101     978
    00110     83     10110     1881
    00111     262     10111     6126
    01000     713     11000     17770
    01001     116     11001     3091
    01010     152     11010     3460
    01011     296     11011     6713
    01100     633     11100     16077
    01101     411     11101     9293
    01110     735     11110     18526
    01111     3419     11111     80017
表5.信道误码率为5%时各模式的分布次数
  BPVC模式   跳转到该模式下的次数    BPVC模式   跳转到该模式下的次数
    00000     931     10000     18110
    00001     90     10001     1764
    00010     100     10010     1866
    00011     76     10011     1328
    00100     155     10100     3296
    00101     54     10101     1145
    00110     120     10110     2107
    00111     355     10111     6659
    01000     857     11000     17293
    01001     161     11001     3286
    01010     203     11010     3761
    01011     414     11011     7266
    01100     823     11100     15727
    01101     546     11101     9801
    01110     940     11110     18633
    01111     4065     11111     76288
由表1~表5可见,在各种信道误码率条件下,浊音帧错误跳转到模式00101的概率都是最小的。因此,将原来清音帧模式00000改为发送模式00101,从而可以降低由于信道误码而带来的清浊音判决失误。
上述方法步骤(2)的实施例为:2.4 kb/s SELP低速率语音编码器编码后的比特分配如下表所示:
表6.2.4 kb/s SELP声码器参数分配表
参数(parameters) 分配比特数(bits)
    SYN(同步位)     1
线谱对参数(共4级)     7,6,6,5
余量谱幅度参数     10+6(空余)
增益参数     7
BPVC(清浊音)参数     5
基音周期参数     7
清音帧在解码端对于基因周期直接置为50,对于余量谱幅度参数也不必传输。因此一共有16+7=23比特可用于保护当前清音帧。经过大规模语音客观MOS分测试,参数影响合成语音质量的重要性如下:线谱对参数矢量量化第一级>线谱对参数矢量量化第二级>线谱对参数矢量量化第三级>增益参数(前4比特)>线谱对参数矢量量化第四级。因此选择编码保护线谱对矢量量化后的1-3级和增益参数。
信道编码需要在声码器内部进行,且编码长度有限,为每帧23比特,且不能引入过大的编解码延时。对比BCH,RS,RCPC码组,从纠错性能的角度选择了BCH码组。其纠错性能在2.4 kb/s声码器中比其他两种都优秀。当信道错误在BCH译码范围以外时,译码算法能给出指示,提供给清浊音参数判决。
经过参数比特组合,采用BCH(31,16)系统码保护第二、第三级线谱对参数和增益参数的低四位,共16比特。将校验位写到余量谱幅度参数和基音周期的15比特中。采用BCH(15,7)码组保护第一级线谱对参数共7比特。将校验位写到余量谱幅度参数的高8比特
MELPe中采用7-4和8-4汉明码,而本方案采用BCH(31,16),其剩余误码率情况如下:
表7.两种算法剩余误码率
误码率 0.005  0.007  0.01  0.015  0.02  0.03
MELPe 0.00051  0.00100  0.00203  0.00449  0.00785  0.0170
本算法 0  0  0.00027  0.00112  0.00299  0.0167
上述方法步骤(3)的实施例为:浊音帧采用两组(7,4)汉明码保护线谱对参数矢量量化的第一级,在信息位的最后一位填充零。校验位写到余量谱幅度参数的高6位比特。
本发明在解码器端,如图2所示,包括以下步骤:
(1)接收到的语音参数序列提取出清浊音参数,并对清浊音参数逐比特位做权重加和;
(2)对于权重为偶数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,判断清浊音参数是否全为零;对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,继续判别是否增益参数小于107并且受保护参数是否在BCH码的译码范围之内;对于在译码能力之内的帧判为清音帧,否则判为浊音帧;
(3)对于权重为奇数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,对于翻转后的清浊音参数进行多数位判决;
(4)对于多数判决小于2的帧,继续判断受保护参数是否在BCH码译码范围之内;对于在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于多数位判决大于或者等于2的帧,直接判为浊音帧;至此,清浊音判决结束;
(5)对于所有判为浊音帧的清浊音参数翻转清浊音参数比特顺序中最低位和第三低位,并选取在前面5帧清浊音参数信息的长时统计条件下后验概率最大的清浊音参数作为其恢复值;对于所有判为清音帧的清浊音参数置为全零模式;
(6)清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特;采用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代;
(7)浊音帧采用与编码端相对应的汉明码纠错;若检测到恢复得到的第四位信息位为1,则说明线谱对参数出错,采用基于信源信道联合特性的线谱对参数抗误码算法恢复,即在基于语音模式信息和长时特性的条件下选择均方误差意义下误差最小的参数作为其恢复值
Figure A20071006286400131
;首先翻转第4,5,6比特位加上接收到得线谱对参数共4个候选线谱对参数
Figure A20071006286400132
,然后设前两帧、前一帧和当前帧解码后线谱对参数分别为
Figure A20071006286400133
,N为参数的矢量维数,计算连续稳定浊音帧之间的矢量差值: diff = Σ N ( L k , N ^ - L k - 1 , N ^ ) 2 - Σ N ( L k - 1 , N ^ - L k - 2 , N ^ ) 2 ,当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1;当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于0.1,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程,否则置为1;最后得到线谱对参数的恢复值 LS P ^ t , k , n = Σ n Σ t Σ k L t , k , n ^ × P t , k ( L t , k , N ^ , s ) P ( s ) × W n , k , t = 0,4,5,6 ,
其中
Figure A20071006286400137
,P(s)为前向统计概率由大规模标准语音库离线统计得到,Wn,k通过上述判决得到;
(8)清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比;若检测到信道有误码,则打开影响原始声码器合成语音质量的基音周期后处理和增益后处理选项;
(9)合路送2.4 kb/s SELP解码器合成语音。
本发明上述方法各步骤的具体实施例分别详细说明如下:
上述方法步骤(1)的实施例为:在解码端对于接收到的语音参数序列提取出5比特清浊音参数信息。对于清浊音参数统计其汉明权重值。
上述方法步骤(2)的实施例为:清浊音参数汉明权重为偶数的帧,有两个可能:1)是清音帧,且BPVC参数满足权重要求;2)是浊音帧,但因为受到信道误码的影响而使比特位发生翻转,从而通过了权重判决。因此,需要继续判决。对于汉明权重为偶数的清浊音参数,翻转最高位和第三高位,以保证与编码端将清音帧清浊音模式从00000改为00101对应,然后判断清浊音参数是否全为零。对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,通过大规模标准语音统计,该判决支路的清音帧接收到的增益参数的值均小于107(7比特增益参数,按照2进制权值计算大小)。并且清音帧的受保护参数应当在BCH码的译码能力范围之内。因此设计继续判别其增益参数是否小于107并且受保护参数是否在BCH码的译码能力之内,对于满足条件的帧判为清音帧,否则判为浊音帧。
上述方法步骤(3)的实施例为:对于汉明权重为奇数的清浊音参数,翻转最高位和第三高位,同样对应于编码端将清音帧清浊音模式从00000改为00101。对于翻转后的清浊音参数进行多数位判决。考虑到信道的对称性,每一比特位的权重是一样的,因此将5比特清浊音参数按比特位加和,得到多数判决的结果。
上述方法步骤(4)的实施例为:清音帧发送模式为00000,与任何位重量大于等于2的模式的汉明距离均大于或者等于2。清音帧BPVC参数5比特同时发生2比特翻转的概率是很小的,因此将多数判决门限设为2。对于多数判决结果小于2且受保护参数在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于多数位判决大于或者等于2的帧,直接判为浊音帧;
上述方法步骤(5)的实施例为:在编码端将清音帧的清浊音参数发送模式从00000改为00101,因此将判决为清音帧的清浊音参数重新置为00000;在基于分支判决的过程中,将浊音帧的清浊音参数也进行过翻转,因此也需要将判决为浊音帧的清浊音参数的最高位和第三高位翻转。语音中清浊音参数与前面已收到的清浊音参数之间存在着一定的相关性。语音帧的清浊音参数记为Bi,0≤i≤n,其中n为帧序号。前面连续多帧的清浊音参数记为Bi j,0≤i≤j≤n,则当前帧的清浊音参数记为Bn,设前面帧为清音时Bi=0,浊音时Bi=1。则根据语音清浊音参数的稳定性有:
p ( B n = 1 B i j = 1 ) > p ( B n = 1 B i j = 0 ) - - - ( 1 )
p ( B n = 0 B i j = 0 ) > p ( B n = 1 B i j = 0 ) - - - ( 2 )
即前面连续帧是浊音帧时,当前帧是浊音帧的概率大于当前帧是清音帧得概率,同样当前面连续帧是清音帧时,当前帧是清音帧的概率大于当前帧是浊音帧得概率。设接收端接收到的比特序列为r,当发现本帧清浊音参数Bn受信道误码影响出现错误后,按比特位翻转形成编码端候选清浊音参数Bn,j,1≤j≤N。计算结合长时统计特性的后验概率为
p ( B n , j r , B i j ) = p ( B n , j , r , B i j ) p ( r , B i j ) , 1 ≤ j ≤ N - - - ( 3 )
其中p(r,Bi j)是接收端的出现概率,p(Bn,j,r,Bi j)可以通过大规模统计信源特性得到。因此选择使该后验概率取值最大的Bn,j为解码端恢复得到的清浊音参数。该参数在结合长时统计特性的改进MAP的准则下是最优的,由此得到了清浊音参数的恢复值。对于基于模式信息的线谱对参数差错恢复的准确有有进一步的帮助。特别注意,该判决的清浊音参数并不回写,仅提供给线谱对参数差错恢复以提高准确性。
上述方法步骤(6)的实施例为:对于清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特。用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;并指示是否在译码范围之外,译码器采用Berlekamp迭代译码。对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代。具体的说,用一位标志位记录前帧对应参数是否正确。若前一帧为清音帧,则当前帧对应参数在译码范围之内时记为正确,否则记为不正确。若前一帧为浊音帧,则对应参数未经过修改时记为正确,否则记为不正确。选用正确的对应参数进行替代,能有效抑制在高误码率下由于采用前帧替代而产生的“误码扩散”的恶劣效果。
上述方法步骤(7)的实施例为:若汉明码解码时所插入的“0”位变为1,则说明已经超出汉明码纠错的能力范围,基于信源信道联合特性的线谱对参数抗误码算法恢复。否则不处理。
声码器中对合成语音质量影响最大的参数为线谱对参数第一级矢量,将汉明码校验后的校验位写到最不重要的余量谱幅度参数中。由于余量谱幅度参数仅提高语音的细节特性,因此对合成语音的质量影响很小。线谱对参数矢量在稳定的浊音帧时变化较为平缓,而且清浊音参数作为状态信息在前面已经经过抗误码恢复得到了较准确的估计值,因此稳定浊音帧时变化较大的线谱对矢量则是受到信道误码后发生错误的。这个信源特性可以结合信道特性更好地恢复线谱对参数。
特别的,由于在2.4 kb/s SELP保护方案中汉明码仅能发现线谱对参数矢量量化后第一级的第4、5、6比特位或校验位出错时的情况,因此上述差错后处理过程中仅针对线谱对参数矢量量化后第一级的第4、5、6比特位或校验位出错而进行处理,相应的参数集的范围限定为线谱对参数矢量量化后第一级的第4、5、6比特位和原始接收到的线谱对参数第一级。设接收端接收到的线谱对参数为
Figure A20071006286400161
,是一个矢量,k为帧序号。基于前向统计概率和分模式加权的最小均方误差准则下的线谱对参数差错后处理具体方法如下:
1)若校验失败有两种可能:1、线谱对参数第一级发生了奇数个错误;2、校验位本身受信道误码影响出错。在5×10-2左右的信道误码率下,线谱对参数比特序列发生3比特错误的概率是发生1比特错误的概率的400倍以上,因此对于大规模语音来说,只考虑残留1比特出错的情况。翻转线谱对参数比特序列的各个比特位形成线谱对的候选参数集合
Figure A20071006286400162
,其中t为对应的翻转比特位,t=4,5,6。对于校验位出错的情况,接收到的线谱对参数
Figure A20071006286400163
也是候选参数之一,因此共有4个候选线谱对参数
Figure A20071006286400164
2)对4个候选参数给于不同的权重,权重的分配由参数的前向出现概率决定。由于声码器中稳定的浊音帧中线谱对参数矢量的变化范围一般不大。前两子帧、前一子帧和当前子帧解码后线谱对参数分别为
Figure A20071006286400165
,N为参数的矢量维数。线谱对参数各维矢量严格按大小顺序排列。连续稳定浊音帧之间的矢量差值为:
diff = Σ N ( L k , N ^ - L k - 1 , N ^ ) 2 - Σ N ( L k - 1 , N ^ - L k - 2 , N ^ ) 2 - - - ( 4 )
通过超过104M的标准语音库统计,在2.4 kb/s声码器中选取差值的阈值为0.1。当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1。当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于给定阈值,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程。否则置为1。连续的浊音帧在声码器中占60%左右的比例,加入权重判决后能进一步提高线谱对参数的恢复质量,进而提高声码器的抗误码性能。受到信道随机误码影响时各个候选参数的出现概率是一样的,因此前向转移概率Pk(r|s)归一化为1,其中s为编码端发送的参数比特序列。设为收到当前参数序列的情况下各个候选参数出现的后验概率。当前声码器频率参数估计的误差期望为:
D LSF = Σ n Σ t Σ k ( L t , k , n ^ - SL SP ^ t , k , n ) 2 × W n , k × P t , k ( L t , k , N ^ | r , s ) , t = 0,4,5,6 - - - ( 5 )
Figure A20071006286400173
为发送端发送的线谱对参数矢量第一级。则基于前向统计概率和  最小均方误差准则的加权线谱对参数最佳恢复值
Figure A20071006286400174
的计算公式为:
LS P ^ t , k , n = Σ n Σ t Σ k L t , k , n ^ × P t , k ( L t , k , N , s ^ ) P ( s ) × W n , k , t = 0,4,5,6 - - - ( 6 )
其中
Figure A20071006286400176
,P(s)为前向统计概率由标准语音库离线统计得到。Wn,k通过判决阈值得到。由此得到了受信道误码影响后基于前向统计概率和分模式加权的最小均方误差准则下的线谱对参数恢复值。
上述方法步骤(8)的实施例为:清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比。若对应序列比特不相同,则认为检测到信道有误码,则将控制位比特置为“1”,打开会影响原始声码器合成语音质量的基音周期后处理和增益后处理选项。否则控制位比特置为“0”关闭该选项。

Claims (4)

1、2.4kb/s SELP低速率声码器抗信道误码保护方法,所述方法是在数字集成电路芯片中依次按以下步骤实现的,在编码器端:
(1)2.4kb/s SELP声码器输出的清浊音参数(BPVC)最低位判断是否清浊音,将清音帧的清浊音参数由00000模式改为00101模式发送;
(2)采用BCH(15,7)码组保护第一级线谱对参数,共7比特,将校验位写到余量谱幅度参数的高8比特;采用BCH(31,16)码组保护第二、第三级线谱对参数和增益参数低4位,共16比特,将校验位写到余量谱幅度参数和基音周期共15比特;
(3)浊音帧采用改进的(7,4)汉明码保护线谱对参数矢量量化后的第一级,在信息位的最后一位填充零,校验位写到余量谱幅度参数的高6位,最后与被保护后的清音帧合路输出。
2、2.4kb/s SELP低速率声码器抗信道误码保护方法,所述方法是在数字集成电路芯片中依次按以下步骤实现的,在解码器端:
(1)接收到的语音参数序列提取出清浊音参数,并对清浊音参数逐比特位做权重加和;
(2)对于权重为偶数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,判断清浊音参数是否全为零;对清浊音参数全为零的帧直接判为清音帧;对于清浊音参数不全为零的帧,继续判别是否增益参数小于107并且受保护参数是否在BCH码的译码范围之内;对于在译码能力之内的帧判为清音帧,否则判为浊音帧;
(3)对于权重为奇数的清浊音参数,翻转清浊音参数比特顺序中最低位和第三低位,对于翻转后的清浊音参数进行逐比特位做权重加和;
(4)对于权重小于2的帧,继续判断受保护参数是否在BCH码译码范围之内;对于在译码能力范围之内的帧判为清音帧,否则判为浊音帧;对于权重大于或者等于2的帧,直接判为浊音帧;至此,清浊音判决结束;
(5)对于所有判为浊音帧的清浊音参数翻转清浊音参数比特顺序中最低位和第三低位,并选取在前面5帧清浊音参数信息的长时统计条件下后验概率最大的清浊音参数作为其恢复值;对于所有判为清音帧的清浊音参数置为全零模式;
(6)清音帧采用BCH(15,7)码组解码,恢复线谱对第一级参数7比特;采用BCH(31,16)码组解码,恢复第二、第三级线谱对参数和增益参数的低4位,共16比特;对不在BCH译码范围之内的参数用前帧对应的正确参数予以替代;
(7)浊音帧采用与编码端相对应的汉明码纠错;若检测到恢复得到的第四位信息位为1,则说明线谱对参数出错,采用基于信源信道联合特性的线谱对参数抗误码算法恢复,即在基于语音模式信息和长时特性的条件下选择均方误差意义下误差最小的参数作为其恢复值
Figure A2007100628640003C1
首先翻转第4,5,6比特位加上接收到得线谱对参数共4个候选线谱对参数 然后设前两帧、前一帧和当前帧解码后线谱对参数分别为
Figure A2007100628640003C3
Figure A2007100628640003C4
N为参数的矢量维数,计算连续稳定浊音帧之间的矢量差值: diff = Σ n ( L k , N ^ - L k - 1 , N ^ ) 2 - Σ n ( L k - 1 , N ^ - L k - 2 , N ^ ) 2 , 当前一子帧和当前子帧均非为浊音帧时将候选参数的权重Wn,k置为1;当前一子帧和当前子帧均为浊音帧时,计算当前矢量差值,若大于0.1,则将当前子帧的权重Wn,k置为0,即不参与最后的合成恢复过程,否则置为1;最后得到线谱对参数的恢复值 P ^ t , k , n = Σ n Σ t Σ k L t , k , n ^ × P t , k ( L t , k , N ^ , S ) P ( s ) × W n , k , t = 0,4,5,6 , 其中
Figure A2007100628640003C7
P(s)为前向统计概率由大规模标准语音库离线统计得到,Wn,k通过上述判决得到;
(8)清音帧和浊音帧合路后送信道误码检测器,与接收到的码字做对比;若检测到信道有误码,则打开影响原始声码器合成语音质量的基音周期后处理和增益后处理选项;
(9)合路送2.4kb/s SELP解码器合成语音。
3、按权利要求1所述的方法,其特征在于,所述编码端步骤(2)中依次将BCH码组校验位写到余量谱幅度和基音周期中,顺序不限于此,可以互换;在解码端从对应位置提取校验位。
4、按权利要求2所述的方法,其特征在于,所述解码端步骤(8)中采用信道误码检测器判决当前信道误码水平;当检测没有信道误码发生时,关闭基音周期后处理和增益后处理选项。
CN2007100628646A 2007-01-19 2007-01-19 2.4kb/s SELP 低速率声码器抗信道误码保护方法 Expired - Fee Related CN101004915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100628646A CN101004915B (zh) 2007-01-19 2007-01-19 2.4kb/s SELP 低速率声码器抗信道误码保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100628646A CN101004915B (zh) 2007-01-19 2007-01-19 2.4kb/s SELP 低速率声码器抗信道误码保护方法

Publications (2)

Publication Number Publication Date
CN101004915A true CN101004915A (zh) 2007-07-25
CN101004915B CN101004915B (zh) 2011-04-06

Family

ID=38704006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100628646A Expired - Fee Related CN101004915B (zh) 2007-01-19 2007-01-19 2.4kb/s SELP 低速率声码器抗信道误码保护方法

Country Status (1)

Country Link
CN (1) CN101004915B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908888B (zh) * 2009-06-03 2013-07-03 晨星软件研发(深圳)有限公司 反量化处理方法与装置
WO2015161493A1 (en) * 2014-04-24 2015-10-29 Motorola Solutions, Inc. Method and apparatus for enhancing alveolar trill
CN109448739A (zh) * 2018-12-13 2019-03-08 山东省计算中心(国家超级计算济南中心) 基于分层聚类的声码器线谱频率参数量化方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
US5636231A (en) * 1995-09-05 1997-06-03 Motorola, Inc. Method and apparatus for minimal redundancy error detection and correction of voice spectrum parameters
US6587826B1 (en) * 1999-12-15 2003-07-01 Agere Systems Inc. Channel code configurations for digital audio broadcasting systems and other types of communication systems
CN1248512C (zh) * 2004-09-26 2006-03-29 陈贺新 嵌入式音视频混合信号同步编码技术

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101908888B (zh) * 2009-06-03 2013-07-03 晨星软件研发(深圳)有限公司 反量化处理方法与装置
WO2015161493A1 (en) * 2014-04-24 2015-10-29 Motorola Solutions, Inc. Method and apparatus for enhancing alveolar trill
US10127916B2 (en) 2014-04-24 2018-11-13 Motorola Solutions, Inc. Method and apparatus for enhancing alveolar trill
CN109448739A (zh) * 2018-12-13 2019-03-08 山东省计算中心(国家超级计算济南中心) 基于分层聚类的声码器线谱频率参数量化方法
CN109448739B (zh) * 2018-12-13 2019-08-23 山东省计算中心(国家超级计算济南中心) 基于分层聚类的声码器线谱频率参数量化方法

Also Published As

Publication number Publication date
CN101004915B (zh) 2011-04-06

Similar Documents

Publication Publication Date Title
EP2026330B1 (en) Device and method for lost frame concealment
CN101578508B (zh) 用于对语音信号中的过渡帧进行编码的方法和设备
CN101494055B (zh) 用于码分多址无线系统的方法和装置
CN110473557B (zh) 一种基于深度自编码器的语音信号编解码方法
US6408267B1 (en) Method for decoding an audio signal with correction of transmission errors
CN102034476B (zh) 语音帧错误检测的方法及装置
CN101004916B (zh) 声码器线谱对参数抗信道误码方法
CA2154253A1 (en) Soft error correction in a tdma radio system
JP2000357999A (ja) 復号装置及び方法、並びにプログラム提供媒体
CN110491400B (zh) 一种基于深度自编码器的语音信号重建方法
CN1143470C (zh) 掩蔽故障的方法和装置
CN101166071A (zh) 差错帧隐藏装置与方法
CN101004915B (zh) 2.4kb/s SELP 低速率声码器抗信道误码保护方法
CN101009098B (zh) 声码器增益参数分模式抗信道误码方法
EP0747884A2 (en) Codebook gain attenuation during frame erasures
CN101009097B (zh) 1.2kb/s SELP低速率声码器抗信道误码保护方法
CN101086844A (zh) 抗信道恶劣丢包伴随误码的语音编码传输方法
CN101895373B (zh) 信道译码方法、系统及装置
McLarnon A method for reducing the transmission rate of a channel vocoder by using frame interpolation
Salami et al. Performance of error protected binary pulse excitation coders at 11.4 kb/s over mobile radio channels
Cheng et al. Improvement of Packet Loss Concealment for EVS Codec Based on Deep Learning
Su et al. Improving the speech quality of cellular mobile systems under heavy fading
Gao et al. A speech coding error control transmission scheme based on UEP for bandwidth-limited channels
Mohammadi Spectral coding of speech based on generalized sorted codebook vector quantization
Görtz On the combination of redundant and zero-redundant channel error detection in CELP speech-coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110406

Termination date: 20150119

EXPY Termination of patent right or utility model