CN103117062B - 语音解码器中帧差错隐藏的谱参数代替方法及系统 - Google Patents

语音解码器中帧差错隐藏的谱参数代替方法及系统 Download PDF

Info

Publication number
CN103117062B
CN103117062B CN201310024222.2A CN201310024222A CN103117062B CN 103117062 B CN103117062 B CN 103117062B CN 201310024222 A CN201310024222 A CN 201310024222A CN 103117062 B CN103117062 B CN 103117062B
Authority
CN
China
Prior art keywords
frame
neighbour
isf
spectrum parameter
good
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310024222.2A
Other languages
English (en)
Other versions
CN103117062A (zh
Inventor
胡瑞敏
杨玉红
董少龙
谢松波
余洪江
成鸿飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201310024222.2A priority Critical patent/CN103117062B/zh
Publication of CN103117062A publication Critical patent/CN103117062A/zh
Application granted granted Critical
Publication of CN103117062B publication Critical patent/CN103117062B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种语音解码器中帧差错隐藏的谱参数替代方法及系统,本发明方法包括步骤:判断接收的语音帧是否为坏帧;统计连续坏帧数量;根据当前坏帧的近邻好帧的基音周期变化趋势对当前坏帧的谱参数进行恢复。本发明根据当前坏帧的近邻好帧的基音周期变化趋势,采用持续平稳的近邻好帧的自适应平均值来代替坏帧的谱参数,从而隐藏由语音解码器经通信信道接收的坏帧的影响。本发明能够为坏帧寻找最适合的替代谱参数,可提高合成语音的主观质量。

Description

语音解码器中帧差错隐藏的谱参数代替方法及系统
技术领域
本发明涉及语音解码器,更具体的说,涉及用于处理语音解码器接收的坏帧的方法。
背景技术
在数字蜂窝系统中,比特流被说成要通过将移动台连接至基站的通信信道经空中接口发送。比特流被组织成帧,包括语音帧。传输期间是否出现错误取决于主要的信道条件。检测到包含错误的语音帧称为坏帧,损坏或丢失的帧即为坏帧。根据现有技术,在出现坏帧时,从以前的正确参数(无错误语音帧)导出的语音参数可代替坏帧的语音参数。通过进行此类代替来处理坏帧的目的是隐藏错误语音帧的损坏的语音参数,而不引起语音质量的明显下降。
对于每一帧,编码器确定输入信号的参数表示。参数被量化,然后通过通信信道以数字形式发送。解码器根据收到的参数产生合成语音信号。
一般提取的编码参数组包括用于短期预测的谱参数(即,线性预测编码参数)、用于信号长期预测的参数(即,长期预测参数)、各种增益参数以及最后的激励参数。
所谓的线性预测编码(LPC)是一种用于将语音编码以便经通信信道传输的广泛使用的有效方法;它表示声道的频率整形属性。LPC参数化表征短段语音的谱形状。LPC参数可表示为线谱频率(LSF)或者等价的导抗谱对(ISP)。ISP是通过将反滤波器传递函数A(z)分解为一组的一个偶对称而另一个奇对称的两个传递函数而获得的。ISP也称为导抗谱频率(ISF),是z-单位圆上的这些多项式根。线谱对(也称为线谱频率)可用与导抗谱对相同的方法来定义;这些表示之间的差异在于变换算法,它将线性预测LP滤波器系数转换为另一种LPC参数表示(等价线谱对LSP或ISP)。
在根据先有技术的一些方法中,用缓冲器存储了最近无差错接收的语音参数,当无差错地接收到帧时,缓冲器中的值会被更新。当检测到坏帧时,坏帧指示符(BFI)被设为真,随后会开始差错隐藏,将上一好帧的谱参数向谱参数的自适应平均值偏移,得到的值作为差错帧的谱参数;或者将上一好帧的谱参数向谱参数的常数平均值进行自适应偏移,得到的值作为差错帧的谱参数。
发明内容
本发明的目的是提供一种能得到更好的解码语音质量的语音解码器中帧差错隐藏的谱参数替代方法及系统,从而可避免解码语音质量的明显下降。
为了达到上述目的,本发明提供了一种语音解码器解中帧差错隐藏的谱参数替代方法,语音解码器接收语音帧,语音帧提供语音解码器在合成语音中所需使用的谱参数,本发明方法基于语音帧的谱参数进行,包括步骤:语音解码器根据语音帧的谱参数判断接收的语音帧是否为坏帧;若为坏帧,统计连续坏帧数量,并根据当前坏帧的近邻好帧的基音周期变化趋势对当前坏帧的谱参数进行恢复。
上述对当前坏帧的谱参数进行恢复主要基于当前坏帧的持续平稳的近邻好帧的谱参数,可表示为:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b(1)
其中,
ISFq(i)是当前坏帧的ISF向量的第i分量;
past_ISFq(i)是当前坏帧的近邻第一好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的持续平稳的近邻好帧ISF向量的第i分量的算术平均值;
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,为经验常数;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b为待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值。
当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化剧烈,或当前坏帧的近邻好帧数量仅为1时,使用当前坏帧的近邻第一个好帧的谱参数来恢复当前坏帧的谱参数,即,公式(1)中的ISFadaptive_mean(i)为当前坏帧的近邻第一个好帧的ISF向量的第i分量,ISFadaptive_mean(i)=past_ISFq(i)。
当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,而近邻第二个好帧相对于近邻第三个好帧变化剧烈,使用当前坏帧的近邻第一和第二个好帧的谱参数来恢复当前坏帧的谱参数,即,公式(1)中的ISFadaptive_mean(i)为当前坏帧的近邻第一和第二个好帧ISF向量的第i分量的算术平均值。
当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,近邻第二个好帧相对于近邻第三个好帧变化也缓慢时,使用当前坏帧的近邻第一、第二和第三个好帧的谱参数来恢复当前坏帧的谱参数,即,公式(1)中的ISFadaptive_mean(i)为当前坏帧的近邻第一、第二和第三个好帧ISF向量的第i分量的算术平均值。
本发明还提供了一种语音解码器解中帧差错隐藏的谱参数替代系统,包括:
语音解码器,用来接收语音帧:
坏帧判断模块,用来判断接收的语音帧是否为坏帧;
坏帧统计模块,用来统计连续坏帧数量;
坏帧谱参数恢复模块,用来根据当前坏帧的近邻好帧的基音周期变化趋势对当前坏帧的谱参数进行恢复。
上述坏帧谱参数恢复模块使用持续平稳的近邻好帧的谱参数恢复当前坏帧的谱参数,具体为:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b
其中,
ISFq(i)是当前坏帧的ISF向量的第i分量;
past_ISFq(i)是当前坏帧的近邻第一好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的持续平稳的近邻好帧ISF向量的第i分量的算术平均值;
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,为经验常数;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b为待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值。
上述坏帧谱参数恢复模块进一步包括第一坏帧谱参数恢复模块、第二坏帧谱参数恢复模块和第三坏帧谱参数恢复模块。
所述的第一坏帧谱参数恢复模块用来使用当前坏帧的近邻第一个好帧的谱参数来恢复当前坏帧的谱参数,即,公式(1)中的ISFadative_mean(i)为当前坏帧的近邻第一个好帧的ISF向量的第i分量。当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化剧烈,或当前坏帧的近邻好帧数量仅为1时,使用第一坏帧谱参数恢复模块进行坏帧谱参数恢复。
所述的第二坏帧谱参数恢复模块用来使用当前坏帧的近邻第一和第二个好帧的谱参数来恢复当前坏帧的谱参数,即,公式(1)中的ISFadaptive_mean(i)为当前坏帧的近邻第一和第二个好帧ISF向量的第i分量的算术平均值。当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,而近邻第二个好帧相对于近邻第三个好帧变化剧烈,使用第二坏帧谱参数恢复模块进行坏帧谱参数恢复。
所述的第三坏帧谱参数恢复模块用来使用当前坏帧的近邻第一、第二和第三个好帧的谱参数来恢复当前坏帧的谱参数,即,公式(1)中的ISFadaptive_mean(i)为当前坏帧的近邻第一、第二和第三个好帧ISF向量的第i分量的算术平均值。当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,近邻第二个好帧相对于近邻第三个好帧变化也缓慢时,使用第三坏帧谱参数恢复模块。
本发明根据当前坏帧的近邻好帧的基音周期变化趋势,采用持续平稳的近邻好帧的自适应平均值来代替坏帧的谱参数,从而隐藏由语音解码器经通信信道接收的坏帧的影响,避免语音质量的明显下降。本发明可用于隐藏错误帧的语音参数,能够为坏帧寻找最适合的替代谱参数,与现有的帧差错隐藏方法相比,本发明可提高合成语音的主观质量。
附图说明
图1为发射或存储语音和音频信号的系统框图;
图2是本发明方法流程图。
具体实施方式
根据本发明,在语音信号通过通信信道(图1)传输后,语音解码器检测到坏帧时,根据对最近通过通信信道传递的好帧的谱参数的分析,隐藏该语音信号的损坏谱参数,即由其它谱参数来代替该语音信号的已损坏的谱参数。在语音解码过程中,语音信号中损坏的谱参数可引起非自然信号(非自然信号指明显不是语音的可听见声音),而且还会降低随后的无差错语音帧的主观质量,因此,有效隐藏坏帧的损坏谱参数非常重要。
参见图2,将各语音帧提供给语音解码器,各帧提供解码器在合成语音中使用的谱参数,语音解码器根据语音帧提供的谱参数判断接收到的语音帧为好帧还是坏帧,当接收到好帧时,语音解码器使用正常解码方式进行解码;当接收到坏帧时,则分析坏帧近邻好帧的谱参数,并根据分析结果对坏帧的谱参数执行代替。
当语音解码器接收到坏帧时,本发明采用如下的方法对坏帧进行谱参数代替。
首先,统计连续坏帧数。
然后,根据基音周期变化趋势判断坏帧之前持续平稳的近邻好帧的帧数,并根据判断结果将之前近邻好帧的平稳性分为如下三种情况:
(1)当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化剧烈时,即当前坏帧之前连续平稳的近邻好帧的帧数为1,使用近邻第一个好帧的谱参数来恢复当前坏帧的谱参数:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b   (1)
其中:
ISFq(i)是当前坏帧的ISF向量的第i分量,即本发明中的谱参数;
past_ISFq(i)是当前坏帧的近邻第一个好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的近邻第一个好帧的自适应平均值向量的第i分量,即,ISFadaptive_mean(i)=past_ISFq(i);
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,根据经验得到;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b是待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值,具体见表1所示。
当坏帧之前的近邻好帧数量仅为1时,则根据公式(1)采用该近邻好帧的谱参数来恢复当前坏帧的谱参数。
(2)当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,而近邻第二个好帧相对于近邻第三个好帧变化剧烈,即当前坏帧之前连续平稳的近邻好帧的帧数为2,使用近邻第一和第二个好帧的谱参数来恢复当前坏帧的谱参数:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b   (2)
其中
ISFq(i)是当前坏帧的ISF向量的第i分量,即本发明中的谱参数;
past_ISFq(i)是当前坏帧的近邻第一个好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的近邻第一和第二个好帧的自适应平均值向量的第i分量,即当前坏帧的近邻第一和第二个好帧的ISF向量的第i分量的算术平均值,可表示为: ISF adaptive _ mean ( i ) = 1 2 ( past _ ISF q ( i ) + past _ ISF q . 1 ( i ) ) , past _ ISF q . 1 ( i ) 为当前坏帧的近邻第二个好帧的ISF向量的第i分量;
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,根据经验得到;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b是待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值,具体取值见表2。
当坏帧之前的近邻好帧数量仅为2,且当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,则根据公式(2)采用变化缓慢的近邻第一和第二个好帧谱参数来恢复当前坏帧的谱参数。
(3)当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,而近邻第二个好帧相对于近邻第三个好帧变化也缓慢时,即当前坏帧之前连续平稳的近邻好帧的帧数为3,使用近邻第一、二、三个好帧的谱参数来恢复当前差错帧的谱参数:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b   (3)
其中
ISFq(i)是当前坏帧的ISF向量的第i分量,即本发明中的谱参数;
past_ISFq(i)是当前坏帧的近邻第一个好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的近邻第一、第二和第三个好帧的自适应平均值向量的第i分量,即当前坏帧的近邻第一、第二和第三个好帧的ISF向量的第i分量的算术平均值,可表示为: ISF adaptive _ mean ( i ) = 1 2 ( past _ ISF q ( i ) + past _ ISF q . 1 ( i ) + past _ ISF q . 2 ( i ) ) , past_ISFq.1(i)为当前坏帧的近邻第二个好帧的ISF向量的第i分量,past_ISFq.2(i)为当前坏帧的近邻第三个好帧的ISF向量的第i分量;
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,根据经验得到;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b是待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值,具体取值见表3。
上述近邻第一、二、三个好帧分别为语音解码器在当前坏帧之前接收到的距离该坏帧最近的第一、二、三个好帧,且第一、二、三个好帧距离坏帧的距离依次从近到远。
本发明基于好帧的基音周期来判断相邻好帧之间变化趋势,具体如下:
近邻好帧为超帧,各超帧内包括4个相邻帧,计算超帧内4个帧的基音周期最大值和最小值之差,若差大于设定阈值,认为超帧内部的帧变化剧烈,则该超帧与相邻超帧之间也变化剧烈;若超帧内4个帧的基音周期最大值和最小值之差不大于阈值,再判断该超帧与相邻超帧之间的变化趋势,即将相邻两个超帧内4个帧的基音周期最大和最小值均提取出来,将相邻两超帧分别标记为超帧A和超帧B,计算超帧A的基音周期最大值和超帧B的基音周期最小值之差,再计算超帧B的基音周期最大值和超帧A的基音周期最小值之差,如果所得差均不大于阈值,则认为超帧A和超帧B之间变化缓慢;否则,超帧A和超帧B之间变化剧烈。本具体实施中设定阈值取为20。
例如,当前坏帧之前的三个近邻好帧,第一个好帧内各帧的基音周期分别为84、91、182、177,第二个好帧内各帧的基音周期分别为193、191、66、65,第三个好帧内各帧的基音周期分别为79、84、43、43,第一个好帧内基音周期最大值和最小值之差为182-84>20,第一个好帧内各帧变化激烈,则第一个好帧和第二个好帧之间也变化剧烈,此时近邻好帧的平稳性属于上述第(1)种情况。
当前坏帧之前的三个近邻好帧,第一个好帧内各帧的基音周期分别为56、61、37、34,第二个好帧内各帧的基音周期分别为64、59、62、70,第三个好帧内各帧的基音周期分别为62、64、62、71,第一个好帧和第二个好帧之间变化剧烈,第二和第三个好帧之间变化缓慢,则三个近邻好帧的平稳性属于上述第(2)种情况。
当前坏帧之前的三个近邻好帧,第一个好帧内各帧的基音周期分别为34、48、42、36,第二个好帧内各帧的基音周期分别为35、50、43、39,第三个好帧内各帧的基音周期分别为40、37、37、37,该三个近邻好帧持续平稳,属于上第(3)种情况。
表1~3中的系数是通过样本训练得到,具体为:
将69个测试序列拼接成一个长序列,并提取长序列的基音周期和ISF系数值,所述的ISF系数即为α、β、γ和b;再根据上述三种情况,将ISF系数值对应分成三类,对每类ISF系数值进行线性回归分析,从而得到上述三种情况对应的ISF系数值,具体ISF系数值见表1~3。
表1ISF系数值
连续坏帧数 1 2 3 4 5 6 >7
b 6.086613 10.80186 14.60187 17.97733 20.64642 22.22191 23.05819
α 0.859902 0.749726 0.67088 0.613561 0.573734 0.546557 0.525555
β 0 0 0 00 0 0 0
γ 0.139369 0.249024 0.327407 0.384377 0.42401 0.451168 0.47225
表2ISF系数值
连续坏帧数 1 2 3 4 5 6 >7
b 7.534166 15.88286 21.97638 24.69059 24.06755 25.19468 27.27548
α 0.825844 0.587618 0.440273 0.301631 0.195837 0.140824 0.114227
β 0.041113 0.173841 0.243466 0.323725 0.401924 0.430064 0.437015
γ 0.13225 0.236332 0.313419 0.37153 0.399511 0.426345 0.445612
表3ISF系数值
连续坏帧数 1 2 3 4 5 6 >7
b 10.82875 19.28352 24.98307 28.85123 31.73919 33.67593 35.06034
α 0.840303 0.623973 0.456788 0.307862 0.196889 0.129593 0.095395
β 0.019395 0.121461 0.205022 0.294959 0.362123 0.40289 0.41845
γ 0.138608 0.251654 0.334387 0.392703 0.435841 0.461828 0.480069
下面将提供本发明的一种具体实施方式。
采用AVS-P10编解码器坏境,编码端全部采用acelp(代数码本激励线性预测编码)模式,参见图2。具体实施过程为:对输入的语音序列,解码器接收每帧的数据,当BFI没有置位(即BFI=0)时,说明所接收的该帧无错误,即为好帧,解码器执行正确的解码方式;当BFI置位(即BFI=1)时,说明该帧出现错误,即为坏帧,先统计连续坏帧数,再根据基音周期变化趋势判断坏帧之前持续平稳的近邻好帧帧数N。
例如,当前坏帧的近邻三个好帧,第一个好帧的基音周期为34、48、42、36,第二个好帧的基音周期为35、36、36、34,第三个好帧的基音周期为34、34、36、43,设定阈值为20,第一个好帧和第二个好帧之间变化缓慢,第二个好帧和第三个好帧之间也变化缓慢,则第一、二、三个好帧为持续平稳的三个好帧,即N=3,则属于上述第(3)种情况,再依据连续坏帧数从表3中取对应的系数值,再使用公式(3)对该坏帧的谱参数进行代替,然后进行照常解码。
下面将同时对本发明方法和AVS-P10算法进行客观评测,以说明本发明的优点。
采用测评软件ITU-T的P.862客观评测标准WB-PESQ评价AVS-P10算法和本发明方法的语音解码质量。待测试序列为AVS提供的12个测试序列:es01,es02,es03,sc01,sc02,sc03,sm01,sm02,sm03,si01,si02,si03。测试序列均为单声道wav波形文件,采样率为16kHz,编码速率为12kbit/s。帧错误序列通过matlab代码生成,测试中模拟的帧错误率有1%、3%、5%和10%,所得PESQ分数见表4。
表4AVS-P10算法和本发明方法的PESQ分数
误码率(%) AVS-P10算法 本发明
1 2.864 2.875
3 2.864 2.866
5 2.759 2.766
10 2.690 2.710

Claims (8)

1.语音解码器中帧差错隐藏的谱参数替代方法,语音解码器接收语音帧,语音帧提供语音解码器在合成语音中所需使用的谱参数,其特征在于,包括步骤:
a)判断接收的语音帧是否为坏帧;
b)统计连续坏帧数量;
c)根据当前坏帧的近邻好帧的基音周期变化趋势对当前坏帧的谱参数进行恢复;;
步骤c)具体为:
根据当前坏帧的近邻好帧的基音周期变化趋势,使用持续平稳的近邻好帧的谱参数恢复当前坏帧的谱参数:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b
其中,
ISFq(i)是当前坏帧的ISF向量的第i分量;
past_ISFq(i)是当前坏帧的近邻第一好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的持续平稳的近邻好帧ISF向量的第i分量的算术平均值;
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,为经验常数;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b为待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值。
2.如权利要求1所述的语音解码器中帧差错隐藏的谱参数替代方法,其特征在于:
当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化剧烈,或当前坏帧的近邻好帧数量仅为1时,使用当前坏帧的近邻第一个好帧的谱参数来恢复当前坏帧的谱参数,所述的ISFadaptive_mean(i)为当前坏帧的近邻第一个好帧的ISF向量的第i分量。
3.如权利要求1所述的语音解码器中帧差错隐藏的谱参数替代方法,其特征在于:
当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,而近邻第二个好帧相对于近邻第三个好帧变化剧烈,使用当前坏帧的近邻第一和第二个好帧的谱参数来恢复当前坏帧的谱参数,所述的ISFadaptive_mean(i)为当前坏帧的近邻第一和第二个好帧ISF向量的第i分量的算术平均值。
4.如权利要求1所述的语音解码器中帧差错隐藏的谱参数替代方法,其特征在于:
当前坏帧的近邻第一个好帧相对于近邻第二个好帧变化缓慢,近邻第二个好帧相对于近邻第三个好帧变化也缓慢时,使用当前坏帧的近邻第一、第二和第三个好帧的谱参数来恢复当前坏帧的谱参数,所述的ISFadaptive_mean(i)为当前坏帧的近邻第一、第二和第三个好帧ISF向量的第i分量的算术平均值。
5.语音解码器中帧差错隐藏的谱参数替代系统,包括接收语音帧的语音解码器,其特征在于,还包括:
a)坏帧判断模块,用来判断接收的语音帧是否为坏帧;
b)坏帧统计模块,用来统计连续坏帧数量;
c)坏帧谱参数恢复模块,用来根据当前坏帧的近邻好帧的基音周期变化趋势对当前坏帧的谱参数进行恢复;
所述的坏帧谱参数恢复模块使用持续平稳的近邻好帧的谱参数恢复当前坏帧的谱参数:
ISFq(i)=α*past_ISFq(i)+β*ISFadaptive_mean(i)+γ*ISFconst_mean(i)+b
其中,
ISFq(i)是当前坏帧的ISF向量的第i分量;
past_ISFq(i)是当前坏帧的近邻第一好帧的ISF向量的第i分量;
ISFadaptive_mean(i)是当前坏帧的持续平稳的近邻好帧ISF向量的第i分量的算术平均值;
ISFconst_mean(i)是ISF向量的长期平均值常数向量的第i分量,为经验常数;
i为帧中变量编号,i=1,2,...,16;
α、β、γ和b为待定系数,根据当前坏帧的近邻好帧的基音周期变化趋势和连续坏帧数量进行取值。
6.如权利要求5所述的语音解码器中帧差错隐藏的谱参数替代系统,其特征在于:
所述的坏帧谱参数恢复模块包括第一坏帧谱参数恢复模块,所述的第一坏帧谱参数恢复模块用来使用当前坏帧的近邻第一个好帧的谱参数来恢复当前坏帧的谱参数,即,所述的ISFadaptive_mean(i)为当前坏帧的近邻第一个好帧的ISF向量的第i分量。
7.如权利要求5所述的语音解码器中帧差错隐藏的谱参数替代系统,其特征在于:
所述的坏帧谱参数恢复模块包括第二坏帧谱参数恢复模块,所述的第二坏帧谱参数恢复模块用来使用当前坏帧的近邻第一和第二个好帧的谱参数来恢复当前坏帧的谱参数,即,所述的ISFadaptive_mean(i)为当前坏帧的近邻第一和第二个好帧ISF向量的第i分量的算术平均值。
8.如权利要求5所述的语音解码器中帧差错隐藏的谱参数替代系统,其特征在于:
所述的坏帧谱参数恢复模块包括第三坏帧谱参数恢复模块,所述的第三坏帧谱参数恢复模块用来使用当前坏帧的近邻第一、第二和第三个好帧的谱参数来恢复当前坏帧的谱参数,即,所述的ISFadaptive_mean(i)为当前坏帧的近邻第一、第二和第三个好帧ISF向量的第i分量的算术平均值。
CN201310024222.2A 2013-01-22 2013-01-22 语音解码器中帧差错隐藏的谱参数代替方法及系统 Expired - Fee Related CN103117062B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310024222.2A CN103117062B (zh) 2013-01-22 2013-01-22 语音解码器中帧差错隐藏的谱参数代替方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310024222.2A CN103117062B (zh) 2013-01-22 2013-01-22 语音解码器中帧差错隐藏的谱参数代替方法及系统

Publications (2)

Publication Number Publication Date
CN103117062A CN103117062A (zh) 2013-05-22
CN103117062B true CN103117062B (zh) 2014-09-17

Family

ID=48415420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310024222.2A Expired - Fee Related CN103117062B (zh) 2013-01-22 2013-01-22 语音解码器中帧差错隐藏的谱参数代替方法及系统

Country Status (1)

Country Link
CN (1) CN103117062B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456307B (zh) * 2013-09-18 2015-10-21 武汉大学 音频解码器中帧差错隐藏的谱代替方法及系统
CN104269176B (zh) * 2014-09-30 2017-11-24 武汉大学深圳研究院 一种isf系数矢量量化的方法与装置
CN105654957B (zh) * 2015-12-24 2019-05-24 武汉大学 联合声道间和声道内预测的立体声误码隐藏方法及系统
CN115101088A (zh) * 2022-06-08 2022-09-23 维沃移动通信有限公司 音频信号恢复方法、装置、电子设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1535461A (zh) * 2000-10-23 2004-10-06 ��˹��ŵ�� 用于语音解码器中帧差错隐藏的改善的谱参数代替
WO2006028009A1 (ja) * 2004-09-06 2006-03-16 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置および信号消失補償方法
CN101197133A (zh) * 2006-12-04 2008-06-11 华为技术有限公司 一种解码方法及装置
CN101894547A (zh) * 2010-06-30 2010-11-24 北京捷通华声语音技术有限公司 一种语音合成方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1535461A (zh) * 2000-10-23 2004-10-06 ��˹��ŵ�� 用于语音解码器中帧差错隐藏的改善的谱参数代替
WO2006028009A1 (ja) * 2004-09-06 2006-03-16 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置および信号消失補償方法
CN101197133A (zh) * 2006-12-04 2008-06-11 华为技术有限公司 一种解码方法及装置
CN101894547A (zh) * 2010-06-30 2010-11-24 北京捷通华声语音技术有限公司 一种语音合成方法和系统

Also Published As

Publication number Publication date
CN103117062A (zh) 2013-05-22

Similar Documents

Publication Publication Date Title
EP2026330B1 (en) Device and method for lost frame concealment
CN104021796B (zh) 语音增强处理方法和装置
US8386246B2 (en) Low-complexity frame erasure concealment
US5774836A (en) System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator
CN101542589A (zh) 基音滞后估计
CN103117062B (zh) 语音解码器中帧差错隐藏的谱参数代替方法及系统
KR102012325B1 (ko) 오디오 신호의 배경 잡음 추정
TWI648730B (zh) 決定編碼模式的裝置以及音訊編碼裝置
CN103548081A (zh) 噪声稳健语音译码模式分类
CN103794222A (zh) 语音基音频率检测方法和装置
CN103456307B (zh) 音频解码器中帧差错隐藏的谱代替方法及系统
CN101572093A (zh) 一种转码方法和装置
CN101895373B (zh) 信道译码方法、系统及装置
Gueham et al. An enhanced insertion packet loss concealment method for voice over IP network services
EP1442455B1 (en) Enhancement of a coded speech signal
Lee et al. A packet loss concealment algorithm based on time-scale modification for CELP-type speech coders
CN110085242B (zh) 一种基于最小失真代价的silk基音域自适应隐写方法
Wu et al. An improved MELP speech coder
Li et al. An 800 bps vocoder based on Mixed Excitation Linear Prediction
Zhao et al. Research on the low rate representations for speech signals
KR100934528B1 (ko) 프레임 손실 은닉 방법 및 장치
Cheng et al. Improvement of Packet Loss Concealment for EVS Codec Based on Deep Learning
Merazka Packet loss concealment using time scale modification for CELP based coders in packet network
Li et al. A Channel Coding Scheme for 2400 bps Speech Coding Algorithm
CN102968997A (zh) 用于宽带语音解码中噪声增强后处理的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140917

Termination date: 20160122

EXPY Termination of patent right or utility model