CN103065636A

CN103065636A - 语音频信号的丢帧补偿方法和装置

Info

Publication number: CN103065636A
Application number: CN201110325869XA
Authority: CN
Inventors: 关旭; 袁浩; 彭科; 黎家力
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2011-10-24
Filing date: 2011-10-24
Publication date: 2013-04-24
Anticipated expiration: 2031-10-24
Also published as: EP3537436B1; EP2772910A4; WO2013060223A1; EP3537436A1; US20140337039A1; EP2772910A1; EP2772910B1; US9330672B2

Abstract

本发明公开了一种语音频信号的丢帧补偿方法和装置，以获得更好的补偿效果，同时保证无延时和低复杂度。所述方法包括：当正确接收帧后紧随的第一帧丢失时，判断该第一丢失帧的帧类型，当第一丢失帧为非多谐波帧时，使用第一丢失帧的前一个或若干个帧的MDCT系数计算得到该第一丢失帧的MDCT系数；根据第一丢失帧的MDCT系数得到第一丢失帧的初始补偿信号；对第一丢失帧的初始补偿信号进行第一类波形调整，将调整后得到的时域信号作为该第一丢失帧的时域信号。所述装置包括帧类型判断模块、MDCT系数获取模块、初始补偿信号获取模块和调整模块。相对于现有技术，本发明具有无延迟、计算量存储量小、易于实现，补偿效果好等优点。

Description

语音频信号的丢帧补偿方法和装置

技术领域

本发明涉及语音频编解码领域，具体涉及一种MDCT(Modified DiscreteCosine Transform，改进的离散余弦变换)域语音频信号的丢帧补偿方法和装置。

背景技术

在网络通信中，分组技术应用十分广泛，各种形式的信息如语音或者音频等数据通过编码后采用分组技术在网络上传输，如VoIP(网络电话)等。由于信息发送端发送容量的限制，或在指定延迟时间内分组信息帧没有到达接收端缓冲区，或是网络拥挤堵塞等造成帧信息的丢失，引起解码端合成音质的急剧下降，因此需要采用补偿技术对丢失帧的数据进行补偿。丢帧补偿技术就是一种减轻这种由于丢帧导致的音质下降的技术。

现有的变换域语音频丢帧补偿方法最为简单的是采用重复前一帧的变换域信号或者使用静音替代的方法。该方法虽然实现简单且没有延迟，但是补偿效果一般；其他的补偿方式如GAPES(缺口数据幅值相位估计技术)需要先将MDCT系数转化成DSTFT(离散短时傅里叶变换)系数再进行补偿，该方法运算复杂度高，消耗内存多；另一种方法采用整形噪声插入技术进行语音频丢帧补偿，该方法对类噪声信号的补偿效果较好，对多谐波音频信号的补偿效果甚差。

综上所述，已公开的变换域丢帧补偿技术多数效果不明显，运算复杂度高和延迟时间过长，或是对某些信号补偿效果较差。

发明内容

本发明要解决的技术问题是提供一种语音频信号的丢帧补偿方法和装置，以获得更好的补偿效果，同时保证无延时和低复杂度。

为了解决上述问题，本发明提供了一种语音频信号的丢帧补偿方法，包括：

当正确接收帧后紧随的第一帧丢失时，判断该第一丢失帧的帧类型，当第一丢失帧为非多谐波帧时，使用第一丢失帧的前一个或若干个帧的MDCT系数计算得到该第一丢失帧的MDCT系数；

根据第一丢失帧的MDCT系数得到第一丢失帧的初始补偿信号；

对第一丢失帧的初始补偿信号进行第一类波形调整，将调整后得到的时域信号作为该第一丢失帧的时域信号。

优选地，所述判断第一丢失帧的帧类型，包括：根据码流中由编码端设置的帧类型标识位判断该第一丢失帧的帧类型。

优选地，所述编码端采用以下方式设置帧类型标识位，包括：对编码后有剩余比特的帧，计算该帧的谱平坦度，判断谱平坦度的值是否小于第一阈值K，如果小于K则认为该帧为多谐波信号帧，设置帧类型标识位为多谐波类型，如果不小于K则认为该帧为非多谐波信号帧，设置帧类型标识位为非多谐波类型，将该帧类型标识位放入码流发送到解码端；对编码后无剩余比特的帧，不设置帧类型标识位。

优选地，所述根据码流中由编码端设置的帧类型标识位判断该第一丢失帧的帧类型，包括：获取该第一丢失帧的前n帧中每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀，0≤n₀≤n，n≥1，则认为该第一丢失帧为多谐波帧，设置帧类型标识为多谐波类型；如果不大于第二阈值，则认为该第一丢失帧为非多谐波帧，设置帧类型标识为非多谐波类型。

优选地，所述第一丢失帧的前n帧中每一帧的帧类型标识采用以下方式设置：

对于未丢失帧，判断解码后码流中是否有剩余比特，如果有剩余比特，则从码流中读取帧类型标识位中的帧类型标识作为该帧的帧类型标识，如果没有剩余比特，则复制前一帧的帧类型标识位中的帧类型标识作为该帧的帧类型标识；

对于丢失帧，获取当前丢失帧的前n帧中每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀，0≤n₀≤n，n≥1，则认为当前丢失帧为多谐波帧，设置帧类型标识为多谐波类型；如果不大于第二阈值，则认为当前丢失帧为非多谐波帧，设置帧类型标识为非多谐波类型。

优选地，所述对第一丢失帧的初始补偿信号进行第一类波形调整，包括：对第一丢失帧进行基音周期估计，以及短基音检测，对有可用基音周期且不存在短基音周期的第一丢失帧的初始补偿信号进行波形调整：以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形对第一丢失帧前一帧时域信号进行有交叠的周期性延拓，得到大于一帧长度的时域信号，延拓时从前一帧时域信号的最后一个基音周期的波形逐渐向第一丢失帧初始补偿信号的第一个基音周期的波形收敛，将延拓得到的大于一帧长度的时域信号中前一帧长度的时域信号作为补偿得到的第一丢失帧的时域信号，超出一帧长度的部分用于与下一帧时域信号的平滑。

优选地，所述对第一丢失帧进行基音周期估计，包括：使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，得到前一帧时域信号的基音周期和最大归一化自相关系数，将得到的基音周期作为该第一丢失帧的基音周期估计值；采用以下条件判断该第一丢失帧的基音周期估计值是否可用：满足以下条件中任意一个则认为该第一丢失帧的基音周期估计值不可用：

第一丢失帧的初始补偿信号的过零率大于第三阈值Z₁，其中Z₁＞0；

第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第四阈值R₁或者第一丢失帧的前一帧时域信号第一个基音周期内的最大幅值大于最后一个基音周期内的最大幅值的λ倍，其中0＜R₁＜1，λ≥1

第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第五阈值R₂并且第一丢失帧的前一帧时域信号的过零率大于第六阈值Z₂，其中0＜R₂＜1，Z₂＞0。

优选地，所述对第一丢失帧进行短基音检测，包括：检测第一丢失帧的前一帧是否存在短基音周期，如果存在，则认为该第一丢失帧也存在短基音周期，如果存在，则认为该第一丢失帧也不存在短基音周期；其中，所述检测第一丢失帧的前一帧是否存在短基音周期，包括：检测第一丢失帧前一帧是否存在T′_min到T′_max之间的基音周期，所述T′_min和T′_max满足条件：T′_min＜T′_max≤基音搜索时的基音周期下限T_min，检测时使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，当最大归一化自相关系数超过第七阈值R₃时则认为存在短基音周期，其中0＜R₃＜1。

优选地，在对有可用基音周期且不存在短基音周期的第一丢失帧的初始补偿信号进行波形调整之前，所述方法还包括：如果第一丢失帧的前一帧时域信号不为正确解码得到的时域信号，则对基音周期估计得到的基音周期估计值进行调整。

优选地，所述对基音周期估计值进行调整，包括：分别搜索得到第一丢失帧的初始补偿信号在时间区间[0，T-1]和[T，2T-1]内的最大幅值位置i₁和i₂，其中T为估计得到的基音周期估计值，如果满足以下条件：q₁T＜i₂-i₁＜q₂T并且i₂-i₁小于帧长的一半，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₂-i₁，如果不满足上述条件，则不对基音周期估计值作修改。

优选地，所述以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形进行有交叠的周期性延拓，包括：对第一丢失帧前一帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的后方做周期性的复制，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生交叠区，对交叠区中的信号进行加窗相加处理。

优选地，在对第一丢失帧进行基音周期估计的过程中，在使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索之前，所述方法还包括：先对第一丢失帧的初始补偿信号和第一丢失帧的前一帧时域信号做低通滤波或降采样处理，使用低通滤波或降采样后的初始补偿信号和第一丢失帧的前一帧时域信号代替原有的初始补偿信号和第一丢失帧的前一帧时域信号进行所述基音周期估计。

优选地，所述方法还包括：对于第一丢失帧之后紧随的第二个丢失帧，判断该第二丢失帧的帧类型，当第二丢失帧为非多谐波帧时，使用第二丢失帧的前一个或若干个帧的MDCT系数计算得到该第二丢失帧的MDCT系数；根据第二丢失帧的MDCT系数得到第二丢失帧的初始补偿信号；对该第二丢失帧的初始补偿信号进行第二类波形调整，将调整后的时域信号作为所述第二丢失帧的时域信号。

优选地，所述对第二丢失帧的初始补偿信号进行第二类波形调整，包括：将补偿第一丢失帧时得到的时域信号超出一帧长度的部分M₁与第二丢失帧的初始补偿信号交叠相加得到第二丢失帧的时域信号，其中交叠区长度为M₁，在交叠区内，补偿第一丢失帧时得到的时域信号超出一帧长度的部分采用下降窗，第二丢失帧的初始补偿信号的前M₁点的数据采用与下降窗等长的上升窗，将加窗后相加得到的数据作为第二丢失帧时域信号的前M₁个样点的数据，其余各样点数据使用交叠区以外的第二丢失帧初始补偿信号的样点数据补充。

优选地，所述方法还包括：对于第二丢失帧之后紧随的第三个丢失帧及第三个丢失帧以后的丢失帧，判断该丢失帧的帧类型，当该丢失帧为非多谐波帧时，使用该丢失帧的前一个或若干个帧的MDCT系数计算得到该丢失帧的MDCT系数；根据该丢失帧的MDCT系数得到该丢失帧的初始补偿信号；将该丢失帧的初始补偿信号作为该丢失帧的时域信号。

优选地，所述方法包括：当正确接收帧后紧随的第一帧丢失，且该第一丢失帧为非多谐波帧，对第一丢失帧之后紧随的正确接收帧进行以下的处理：

解码得到该正确接收帧的时域信号；对补偿第一丢失帧时使用的基音周期估计值做调整；以及，以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号；对补偿第一丢失帧时得到的时域信号超出一帧长度的部分与延拓得到的时域信号交叠相加，将得到的信号作为该正确接收帧的时域信号。

优选地，所述对补偿第一丢失帧时使用的基音周期估计值做调整，包括：分别搜索得到该正确接收帧时域信号在时间区间[L-2T-1，L-T-1]和[L-T，L-1]内的最大幅值位置i₃和i₄，其中T为补偿第一丢失帧时使用的基音周期估计值，L为帧长，如果满足以下条件：q₁T＜i₄-i₃＜q₂T并且i₄-i₃小于L/2，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₄-i₃，如果不满足上述条件，则不对基音周期估计值作修改。

优选地，所述以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号，包括：对该正确接收帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的前方做周期性的复制，直至得到一帧长的时域信号，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生信号交叠区，在交叠区中的信号进行加窗相加处理。

为了解决上述问题，本发明还提供了一种语音频信号的丢帧补偿方法，包括：

当正确接收帧后紧随的第一帧丢失，且该第一丢失帧为非多谐波帧，对第一丢失帧之后紧随的正确接收帧进行以下的处理：

解码得到该正确接收帧的时域信号；对补偿第一丢失帧时使用的基音周期估计值做调整；以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号；对补偿第一丢失帧时得到的时域信号超出一帧长度的部分与延拓得到的时域信号交叠相加，将得到的信号作为该正确接收帧的时域信号。

为了解决上述问题，本发明还提供了一种语音频信号的丢帧补偿装置，所述装置包括帧类型判断模块、MDCT系数获取模块、初始补偿信号获取模块和调整模块，其中：

所述帧类型判断模块，用于在正确接收帧后紧随的第一帧丢失时，判断该第一丢失帧的帧类型；

所述MDCT系数获取模块，用于在所述判断模块判断第一丢失帧为非多谐波帧时，使用第一丢失帧的前一个或若干个帧的MDCT系数计算得到该第一丢失帧的MDCT系数；

所述初始补偿信号获取模块，用于根据第一丢失帧的MDCT系数得到第一丢失帧的初始补偿信号；

所述调整模块，用于对第一丢失帧的初始补偿信号进行第一类波形调整，将调整后得到的时域信号作为该第一丢失帧的时域信号。

优选地，所述帧类型判断模块是用于采用以下方式判断第一丢失帧的帧类型：根据码流中由编码装置设置的帧类型标识位判断该第一丢失帧的帧类型。

优选地，所述帧类型判断模块是用于采用以下方式根据码流中由编码端设置的帧类型标识位判断该第一丢失帧的帧类型：所述帧类型判断模块获取该第一丢失帧的前n帧中每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀，0≤n₀≤n，n≥1，则认为该第一丢失帧为多谐波帧，设置帧类型标识为多谐波类型；如果不大于第二阈值，则认为该第一丢失帧为非多谐波帧，设置帧类型标识为非多谐波类型。

优选地，所述调整模块包括第一类波形调整单元，其中包括基音周期估计单元、短基音检测单元、波形延拓单元，其中：

所述基音周期估计单元，用于对第一丢失帧进行基音周期估计；

所述短基音检测单元，用于对第一丢失帧进行短基音检测；

所述波形延拓单元，用于对有可用基音周期且不存在短基音周期的第一丢失帧的初始补偿信号进行波形调整：以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形对第一丢失帧前一帧时域信号进行有交叠的周期性延拓，得到大于一帧长度的时域信号，延拓时，从前一帧时域信号的最后一个基音周期的波形逐渐向第一丢失帧初始补偿信号的第一个基音周期的波形收敛，将延拓得到的大于一帧长度的时域信号中前一帧长度的时域信号作为补偿得到的第一丢失帧的时域信号，超出一帧长度的部分用于与下一帧时域信号的平滑。

优选地，所述基音周期估计单元是用于采用以下方式对第一丢失帧进行基音周期估计：所述基音周期估计单元使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，得到前一帧时域信号的基音周期和最大归一化自相关系数，将得到的基音周期作为该第一丢失帧的基音周期估计值；所述基音周期估计单元采用以下条件判断该第一丢失帧的基音周期估计值是否可用：满足以下条件中任意一个则认为该第一丢失帧的基音周期估计值不可用：

第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第四阈值R₁或者第一丢失帧的前一帧时域信号第一个基音周期内的最大幅值大于最后一个基音周期内的最大幅值的λ倍，其中0＜R₁＜1，λ≥1；

优选地，所述短基音检测单元是用于采用以下方式对第一丢失帧进行短基音检测：所述短基音检测单元检测第一丢失帧的前一帧是否存在短基音周期，如果存在，则认为该第一丢失帧也存在短基音周期，如果不存在，则认为该第一丢失帧也不存在短基音周期；其中，所述短基音检测单元采用以下方式检测第一丢失帧的前一帧是否存在短基音周期：检测第一丢失帧前一帧是否存在T′_min到T′_max之间的基音周期，所述T′_min和T′_max满足条件：T′_min＜T′_max≤基音搜索时的基音周期下限T_min，检测时使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，当最大归一化自相关系数超过第七阈值R₃时则认为存在短基音周期，其中0＜R₃＜1。

优选地，所述第一类波形调整单元还包括基音周期调整单元，其用于判断第一丢失帧的前一帧时域信号不为正确解码得到的时域信号时，对所述基音周期估计单元估计得到的基音周期估计值进行调整，将调整后的基音周期估计值送至所述波形延拓单元。

优选地，所述基音周期调整单元是用于采用以下方式对基音周期估计值进行调整：所述基音周期调整单元分别搜索得到第一丢失帧的初始补偿信号在时间区间[0，T-1]和[T，2T-1]内的最大幅值位置i₁和i₂，其中T为估计得到的基音周期估计值，如果满足以下条件：q₁T＜i₂-i₁＜q₂T并且i₂-i₁小于帧长的一半，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₂-i₁，如果不满足上述条件，则不对基音周期估计值作修改。

优选地，所述波形延拓单元是用于采用以下方式以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形进行有交叠的周期性延拓：对第一丢失帧前一帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的后方做周期性的复制，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生交叠区，对交叠区中的信号进行加窗相加处理。

优选地，所述基音周期估计单元还用于在使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索之前，先对第一丢失帧的初始补偿信号和第一丢失帧的前一帧时域信号做低通滤波或降采样处理，使用低通滤波或降采样后的初始补偿信号和第一丢失帧的前一帧时域信号代替原有的初始补偿信号和第一丢失帧的前一帧时域信号进行所述基音周期估计。

优选地，所述帧类型判断模块，还用于在第一丢失帧之后紧随的第二个丢失帧丢失时，判断该第二丢失帧的帧类型；

所述MDCT系数获取模块，还用于在所述帧类型判断模块判断该第二丢失帧为非多谐波帧时，使用第二丢失帧的前一个或若干个帧的MDCT系数计算得到该第二丢失帧的MDCT系数；

所述初始补偿信号获取模块，还用于根据第二丢失帧的MDCT系数得到第二丢失帧的初始补偿信号；

所述调整模块，还用于对该第二丢失帧的初始补偿信号进行第二类波形调整，将调整后的时域信号作为所述第二丢失帧的时域信号。

优选地，所述调整模块还包括第二类波形调整单元，其用于采用以下方式对第二丢失帧的初始补偿信号进行第二类波形调整：将补偿第一丢失帧时得到的时域信号超出一帧长度的部分M₁与第二丢失帧的初始补偿信号交叠相加得到第二丢失帧的时域信号，其中交叠区长度为M₁，在交叠区内，补偿第一丢失帧时得到的时域信号超出一帧长度的部分采用下降窗，第二丢失帧的初始补偿信号的前M₁点的数据采用与下降窗等长的上升窗，将加窗后相加得到的数据作为第二丢失帧时域信号的前M₁个样点的数据，其余各样点数据使用交叠区以外的第二丢失帧初始补偿信号的样点数据补充。

优选地，所述帧类型判断模块，还用于在第二丢失帧之后紧随的第三个丢失帧及第三个丢失帧以后的帧丢失时，判断该丢失帧的帧类型；

所述MDCT系数获取模块，还用于在所述帧类型判断模块判断当前丢失帧为非多谐波帧时，使用该当前丢失帧的前一个或若干个帧的MDCT系数计算得到该当前丢失帧的MDCT系数；

所述初始补偿信号获取模块，还用于根据该当前丢失帧的MDCT系数得到该当前丢失帧的初始补偿信号；

所述调整模块，还用于将该当前丢失帧的初始补偿信号作为该丢失帧的时域信号。

优选地，所述装置还包括正常帧补偿模块，其用于在正确接收帧后紧随的第一帧丢失，且该第一丢失帧为非多谐波帧，对第一丢失帧之后紧随的正确接收帧进行处理，包括解码单元、时域信号调整单元，其中：

所述解码单元，用于解码得到该正确接收帧的时域信号；

所述时域信号调整单元，用于对补偿第一丢失帧时使用的基音周期估计值做调整；以及，以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号；以及，对补偿第一丢失帧时得到的时域信号超出一帧长度的部分与延拓得到的时域信号交叠相加，将得到的信号作为该正确接收帧的时域信号。

优选地，所述时域信号调整单元是用于采用以下方式对补偿第一丢失帧时使用的基音周期估计值做调整：分别搜索得到该正确接收帧时域信号在时间区间[L-2T-1，L-T-1]和[L-T，L-1]内的最大幅值位置i₃和i₄，其中T为补偿第一丢失帧时使用的基音周期估计值，L为帧长，如果满足以下条件：q₁T＜i₄-i₃＜q₂T并且i₄-i₃小于L/2，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₄-i₃，如果不满足上述条件，则不对基音周期估计值作修改。

优选地，所述时域信号调整单元是用于采用以下方式以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号：以该正确接收帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的前方做周期性的复制，直至得到一帧长的时域信号，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生信号交叠区，在交叠区中的信号进行加窗相加处理。

本发明提出的语音频信号的丢帧补偿方法和装置，首先判断丢失帧类型，然后对于多谐波信号丢失帧，将MDCT域信号转换成MDCT-MDST域信号后采用相位外推，幅值复制的技术进行补偿；对于非多谐波信号丢失帧，首先进行初始补偿得到初始补偿信号，再对初始补偿信号进行波形调整得到当前丢失帧的时域信号。该补偿方法不仅保证了音乐等多谐波信号的补偿质量，还大大提高了语音等非多谐波信号的补偿质量。相对于现有技术，本发明具有无延迟、计算量存储量小、易于实现，补偿效果好等优点。

附图说明

图1是本发明实施例1的流程图；

图2是本发明实施例1帧类型判断流程图；

图3是本发明实施例1第一类波形调整的方法流程图；

图4a-d是本发明实施例1交叠的周期性延拓的示意图；

图5是本发明实施例1多谐波丢帧补偿方法流程图；

图6是本发明实施例2流程图；

图7是本发明实施例3流程图；

图8是本发明实施例4丢帧补偿装置的结构示意图；

图9是本发明实施例4丢帧补偿装置中第一类调整单元的结构示意图；

图10是本发明实施例4丢帧补偿装置中正常帧补偿模块结构示意图。

具体实施方式

首先，由编码端对原始信号帧做类型判断，将判断结果传输给解码端时不额外占用编码比特(即使用编码后的剩余比特传输判断结果，无剩余比特时不传输判断结果)，在解码端获取当前丢失帧的前n帧的类型判断结果后推断当前丢失帧的类型，根据丢失帧为多谐波信号帧或非多谐波信号帧，分别采用多谐波丢帧补偿方法或非多谐波丢帧补偿方法对其进行补偿。对于多谐波丢失帧，将MDCT域信号转换成MDCT-MDST(改进的离散余弦变换-改进的离散正弦变换)域信号后采用相位外推，幅值复制的技术进行补偿；对非多谐波丢失帧进行补偿时首先使用当前丢失帧的前若干帧的MDCT系数计算得到当前丢失帧的MDCT系数值(比如，采用衰减后的前一帧的MDCT系数值作为当前丢失帧的MDCT系数值)，然后根据当前丢失帧的MDCT系数得到当前丢失帧的初始补偿信号，再对初始补偿信号进行波形调整得到当前丢失帧的时域信号。采用该非多谐波补偿方法，提高了对语音帧等非多谐波帧的补偿质量。

为使本发明的目的、技术方案和优点更加清楚明白，下文中将结合附图对本发明的实施例进行详细说明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。

实施例1

本实施例描述紧随正确接收帧的第一帧丢失时的补偿方法，如图1所示，包括以下步骤：

步骤101：判断第一丢失帧类型，当第一丢失帧为非多谐波帧时执行步骤102，否则执行步骤104；

步骤102：当第一丢失帧为非多谐波帧时，使用第一丢失帧的前一个或若干个帧的MDCT系数计算得到该第一丢失帧的MDCT系数，根据第一丢失帧的MDCT系数得到第一丢失帧的时域信号，将该时域信号作为第一丢失帧的初始补偿信号；

计算第一丢失帧的MDCT系数值可以采用以下方法：比如，可以使用前若干帧MDCT系数的加权平均并做适当衰减后的值作为该第一丢失帧的MDCT系数；或者，也可以复制上一帧的MDCT系数并做适当衰减后的值作为第一丢失帧的MDCT系数。

根据MDCT系数得到时域信号的方法可采用现有技术实现，本文不再赘述。

具体MDCT系数的衰减方式为：

当前丢失帧为第p帧时，

c^p(m)＝α*c^p-1(m)，m＝0，...，M-1；

其中c^p(m)表示第p帧在频点m处的MDCT系数，α为衰减系数，0≤α≤1。

步骤103：对第一丢失帧的初始补偿信号进行第一类波形调整，将调整后的时域信号作为第一丢失帧的时域信号，结束；

步骤104：当第一丢失帧为多谐波帧时使用多谐波帧丢帧补偿方法补偿该帧，结束。

下面结合图2，图3，图4和图5分别对步骤101，步骤103和步骤104进行具体说明。

如图2所示，步骤101a-101c由编码端设备完成，步骤101d由解码端设备完成。判断丢失帧类型的具体方法包括：

101a：在编码端，对每一帧正常编码后判断该帧有无剩余比特，即判断该帧编码后是否使用完一帧的所有可用比特，如果有剩余比特则执行步骤101b；否则执行步骤101c1；

101b：计算该帧的谱平坦度，判断谱平坦度的值是否小于第一阈值K，如果小于K则认为该帧为多谐波信号帧，设置帧类型标识位为多谐波类型(例如为1)；如果不小于K，则认为该帧为非多谐波信号帧，设置帧类型标识位为非多谐波类型(例如为0)，其中0≤K≤1，执行步骤101c2；

具体谱平坦度的计算方法如下：

任意第i帧的谱平坦度SFM_i定义为第i帧信号的变换域下信号幅值的几何平均值与算术平均值之比：

{SFM}_{i} = \frac{G_{i}}{A_{i}}

其中

为第i帧信号幅值的几何平均，

为第i帧信号幅值的算术平均，cⁱ(m)为第i帧在频率点m的MDCT系数，M为MDCT域信号频点个数。

优选地，可以使用MDCT域全部频点中的一部分计算谱平坦度。

101c1：将编码码流发送至解码端；

101c2：如果该帧编码后有剩余比特，将101b中设置的标识位连同编码码流一起发送到解码端；

101d：在解码端，对于每个未丢失帧，判断解码后码流中是否有剩余比特，如果有剩余比特，从码流中读取该帧类型标识位中的帧类型标识作为该帧的帧类型标识并放入缓存中，否则复制前一帧的帧类型标识位中的帧类型标识作为该帧的帧类型标识并放入缓存中；对于每个丢失帧，获取缓存中当前丢失帧的前n帧中的每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀(0≤n₀≤n)，则认为当前丢失帧为多谐波帧，设置帧类型标识位为多谐波类型(例如为1)并将其放入缓存；否则认为当前丢失帧为非多谐波帧，设置帧类型标识位为非多谐波类型(例如为0)并将其放入缓存，其中n≥1。

本发明不限于使用谱平坦度这个特征量来判断帧类型，也可以使用其他特征量进行判断，比如使用过零率或几种特征量相结合的方式进行判断，本发明对此不作限定。

图3针对步骤103具体描述对第一丢失帧的初始补偿信号进行第一类波形调整的方法，该方法包括：

103a：对第一丢失帧进行基音周期估计，具体基音周期估计的方法如下：

首先，使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，得到前一帧时域信号的基音周期和最大归一化自相关系数，将得到的基音周期作为该第一丢失帧的基音周期估计值；

即寻找t∈[T_min，T_max]，0＜T_min＜T_max＜M使得

达到最大值，该最大值即为最大归一化自相关系数，此时的t即为基音周期，其中T_min，T_max分别为基音搜索的下限和上限，M为帧长，s(i)，i＝1，...，M为待基音搜索的时域信号；

虽然估计出该第一丢失帧的基音周期估计值，但该估计值未必可用，采用以下条件判断该第一丢失帧的基音周期估计值是否可用：

满足下面三个条件中的任意一个则认为该第一丢失帧的基音周期估计值不可用：

●第一丢失帧的初始补偿信号的过零率大于第三阈值Z₁，其中Z₁＞0；

●第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第四阈值R₁或者第一丢失帧的前一帧时域信号第一个基音周期内的最大幅值大于最后一个基音周期内的最大幅值的λ倍，其中0＜R₁＜1，λ≥1；

●第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第五阈值R₂并且第一丢失帧的前一帧时域信号的过零率大于第六阈值Z₂，其中0＜R₂＜1，Z₂＞0；

特别地，在进行基音周期估计的过程中，在对第一丢失帧的前一帧时域信号进行基音搜索之前，还可以先进行以下处理：先对第一丢失帧的前一帧时域信号和第一丢失帧的初始补偿信号做低通滤波或降采样处理，然后使用低通滤波或降采样后的第一丢失帧的前一帧时域信号和第一丢失帧的初始补偿信号代替原有的第一丢失帧的前一帧时域信号和初始补偿信号进行所述基音周期估计。低通滤波或降采样处理可以减小信号高频分量对基音搜索的影响或降低基音搜索的复杂度。

103b：如果第一丢失帧的基音周期不可用则不对该帧的初始补偿信号进行波形调整，结束；否则执行103c；

103c：对第一丢失帧进行短基音检测，若存在短基音周期则不对该丢失帧初始补偿信号进行波形调整，结束；否则执行103d；

对第一丢失帧进行短基音检测，包括：检测第一丢失帧的前一帧是否存在短基音周期，如果存在，则认为该第一丢失帧也存在短基音周期，如果不存在，则认为该第一丢失帧也不存在短基音周期，即将该第一丢失帧前一帧的短基音周期检测结果作为该第一丢失帧的短基音周期检测结果。

采用以下方法检测第一丢失帧的前一帧是否存在短基音周期：

检测第一丢失帧的前一帧是否存在T′_min到T′_max之间的短小的基音周期，这里T′_min和T′_max满足条件：T′_min＜T′_max≤基音搜索时的基音周期下限T_min，检测时使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，当最大归一化自相关系数超过第七阈值R₃时则认为存在短基音周期，其中0＜R₃＜1。

103d：如果第一丢失帧的前一帧时域信号不为解码端正确解码得到的时域信号，则先对估计得到的基音周期估计值进行调整，然后执行103e，否则直接执行103e；

这里第一丢失帧的前一帧时域信号不为解码端正确解码得到的时域信号是指：设第一丢失帧为第p帧，即使解码端能够正确接收到第p-1帧的数据包但由于第p-2帧丢失或其他原因，造成不能正确解码得到第p-1帧的时域信号。

具体对基音周期的调整方法包括：记估计得到的基音周期为T，分别搜索得到第一丢失帧初始补偿信号在时间区间[0，T-1]和[T，2T-1]内的最大幅值位置i₁和i₂，如果q₁T＜i₂-i₁＜q₂T并且i₂-i₁小于帧长的一半，则修改基音周期估计值为i₂-i₁，否则不对基音周期估计值作修改，其中0≤q₁≤1≤q₂。

103e：使用第一丢失帧的前一帧时域信号的最后一个基音周期的波形和第一丢失帧初始补偿信号的第一个基音周期的波形对初始补偿信号进行第一类波形调整，调整的方法包括：以前一帧时域信号的最后一个基音周期为基准波形，对第一丢失帧前一帧时域信号进行有交叠的周期性延拓，得到大于一帧长度的时域信号，比如得到长度为M+M₁点的时域信号。延拓时从前一帧时域信号的最后一个基音周期的波形逐渐向第一丢失帧初始补偿信号的第一个基音周期的波形收敛。延拓得到的M+M₁点的时域信号中的前M长作为补偿得到的第一丢失帧的时域信号，超出一帧长度的部分用于与下一帧时域信号的平滑，其中M为帧长，M₁为超出帧长的点数，1≤M₁≤M；

其中，有交叠的周期性延拓是指以基音周期为长度向时间上的后方做周期性的复制，复制时，为保证信号平滑需要复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生交叠区，在交叠区中的信号需要进行加窗相加处理。具体使用有交叠的周期性延拓方式得到大于一帧长度的时域语音信号的方法包括：

103ea：在长度为M+M₁的缓存区a的前l个单元中放入初始补偿信号的前l个点的数据，并设置缓存区a的有效数据长度n₁＝0，其中l＞0，为交叠区长度；如图4a所示；

103eb：将当前丢失帧的前一帧时域信号的最后一个基音周期的数据连同当前帧的初始补偿信号的前l个点的数据放入缓存区b中，缓存区b的长度n₂＝基音周期+l；如图4b所示；

103ec：将缓存区b中的数据复制到缓存区a的指定区域，并将缓存区a的有效数据长度增加一个基音周期的长度。所述指定区域指缓存区a中从第n₁+1个单元起依次向后的区域，区域的长度等于缓存b中数据的长度n₂。在复制时会与缓存区a中第n₁+1个单元到第n₁+l个单元中的原有的数据形成一个长度为l的交叠区，交叠区中的数据需要做如下特别处理：

将交叠区中原有的l个点的数据乘以一个长度为l的下降窗，将从缓存区b中复制到交叠区中的数据乘以一个长度为l的上升窗，然后将两部分数据相加形成该交叠区中的数据；

其中，长度为l的下降窗和上升窗可以选取为下降的线性窗和上升的线性窗，即1-i/l和i/l，i＝0，1，...，l-1，也可以选用下降和上升的正弦窗或者余弦窗等。

特别地，在将缓存区b中的数据复制到缓存区a的指定区域时，如果缓存区a中的剩余空间(M+M₁-n₁)小于缓存区b中的数据长度n₂，则实际复制到缓存区a中的数据仅为缓存区b中的前M+M₁-n₁个点的数据。

图4c所示为第一次复制时的情形，图中以l小于基音周期长度为例，其他实施例中l可以等于基音周期长度，也可以大于基音周期长度。图4d所示为第二次复制时的情形。

103ed：更新缓存区b，更新方式为将缓存区b中的原有数据与初始补偿信号的前n₂个点的数据逐点加权平均；

103ee：重复103ec到103ed直到缓存区a的有效数据长度大于等于M+M₁，缓存区a中的数据即为大于一帧长度的时域信号。

图5针对步骤104具体描述多谐波帧丢帧补偿方法，该方法包括：

当第p帧丢失时，

104a：根据当前丢失帧之前若干帧解码得到的MDCT系数，采用FMDST(快速的改进的离散正弦变换)算法得到第p-2帧和第p-3帧的MDST系数S^p-2(m)和S^p-3(m)，把得到的第p-2帧和第p-3帧的MDST系数和第p-2帧和第p-3帧的MDCT系数c^p-2(m)和c^p-3(m)组成MDCT-MDST域的复数信号：

v^p-2(m)＝c^p-2(m)+js^p-2(m)(1)

v^p-3(m)＝c^p-3(m)+js^p-3(m)(2)

其中j为虚数符号。

计算第p-2帧和第p-3帧中各频率点的功率|v^p-2(m)|²，|v^p-3(m)|²，分别取第p-2帧和第p-3帧中功率最大的前r个峰值频率点(如果任何一帧中的峰值频率点少于r个，则取该帧中的所有峰值频率点)组成频率点集合m^p-2，m^p-3，其中，峰值频点是指频点功率大于相邻频点的频点，1＜r＜M。

根据第p-1帧的MDCT系数估计第p-1帧中各频率点的功率：

{| {\hat{v}}^{p - 1} (m) |}^{2} = {[c^{p - 1} (m)]}^{2} + {[c^{p - 1} (m + 1) - c^{p - 1} (m - 1)]}^{2} - - - (3)

其中，

是第p-1帧在频率点m的功率，c^p-1(m)是第p-1帧在频率点m处的MDCT系数，其余类似。

求得第p-1帧中功率最大的前r个峰值频率点

如果该帧中的峰值频率点数/N^p-1小于r，则取该帧中的所有峰值频率点

对每个

判断

(峰值频率点附近的频率点其功率也可能比较大，因此将其加入第p-1帧的峰值频率点的集合中)中是否存在同时属于集合m^p-2，m^p-3的频率点。如果同时属于集合m^p-2，m^p-3，根据下面式(4)-(9)求得第p帧在频率点

(

中只要有一个点同时属于m^p-2和m^p-3，对

这三个频率点都作下述计算)的MDCT-MDST域复数信号的相位和幅值：

A^p-2(m)＝|v^p-2(m)|(6)

A^p-3(m)＝|v^p-3(m)|(7)

其中

A分别表示相位和幅值。例如，

为第p帧在频率点m的相位的估计值，

为第p-2帧在频率点m的相位，为第p-3帧在频率点m的相位，

是第p帧在频率点m的幅值的估计值，A^p-2(m)为第p-2帧在频率点m的幅值，其余类似。

因此补偿得到的第p帧在频率点m的MDCT系数为：

如果在所有

中没有同时属于集合m^p-2，m^p-3的频率点，就对当前丢失帧内所有频率点根据式(4)-(10)估计MDCT系数。

也可不求需要做预测的频率点，直接对当前丢失帧内所有频率点根据式(4)-(10)估计MDCT系数。

用S_C表示上述所有根据式(4)-(10)进行补偿的频率点组成的集合。

104b：对一帧内S_C之外的频率点，采用第p-1帧在该频率点的MDCT系数值作为第p帧在该频率点的MDCT系数值；

104c：对当前丢失帧在所有频率点的MDCT系数进行IMDCT变换，得到当前丢失帧的时域信号。

实施例2

本实施例描述紧随正确接收帧的连续2个以上的帧丢失时的补偿方法，与如图6所示，包括以下步骤：

步骤201：判断丢失帧类型，当丢失帧为非多谐波帧时执行步骤202，否则执行步骤204；

步骤202：当丢失帧为非多谐波帧时，使用当前丢失帧的前一个或若干帧的MDCT系数计算得到当前丢失帧的MDCT系数值，然后根据当前丢失帧的MDCT系数得到当前丢失帧的时域信号，将该时域信号作为初始补偿信号；

优选地，可以使用前若干帧MDCT系数的加权平均并做适当衰减后的值作为当前丢失帧的MDCT系数，或者，可以复制上一帧的MDCT系数并做适当衰减后的值作为当前丢失帧的MDCT系数；

步骤203：若当前丢失帧为正确接收帧后的第一个丢失帧时，使用步骤103中的方法补偿得到第一个丢失帧的时域信号；若当前丢失帧为正确接收帧后的第二个丢失帧时，对当前丢失帧的初始补偿信号进行第二类波形调整，将调整后的时域信号作为当前帧的时域信号；若当前丢失帧为正确接收帧后的第三个或以后的丢失帧时，直接将该当前丢失帧的初始补偿信号作为当前帧的时域信号，结束；

具体第二类波形调整的方法包括：

将补偿第一个丢失帧时得到的时域信号超出一帧长度的部分(长度记M₁)与当前丢失帧(即第二丢失帧)的初始补偿信号交叠相加得到第二丢失帧的时域信号。其中交叠区长度为M₁，在交叠区内，补偿第一丢失帧时得到的时域信号超出一帧长度的部分采用下降窗，第二丢失帧的初始补偿信号的前M₁点的数据采用与下降窗等长的上升窗，将加窗后相加得到的数据作为第二丢失帧时域信号的前M₁个样点的数据，其余各样点数据使用第二丢失帧初始补偿信号在交叠区以外的样点数据补充。

其中，下降窗和上升窗可以选取为下降的线性窗和上升的线性窗，也可以选用下降和上升的正弦窗或者余弦窗等。

步骤204：当丢失帧为多谐波帧时使用多谐波帧丢帧补偿方法补偿该帧，结束。

实施例3

本实施例描述丢帧过程中只丢一帧非多谐波帧情况下的丢帧后的恢复处理流程，丢多帧情况下或丢帧类型为多谐波帧时不需要进行本流程操作，如图7所示，在本实施例中第一丢失帧即正确接收帧后紧随的第一个丢失帧，且该第一丢失帧为非多谐波帧，正确接收帧为第一丢失帧后紧随的一个正确接收的帧，包括以下步骤：

步骤301：解码得到该正确接收帧的时域信号；

步骤302：对补偿第一丢失帧时使用的基音周期估计值做调整，具体的调整方法包括：

记补偿第一丢失帧时使用的基音周期估计值为T，分别搜索得到该正确接收帧时域信号在时间区间[L-2T-1，L-T-1]和[L-T，L-1]内的最大幅值位置i₃和i₄，如果q₁T＜i₄-i₃＜q₂T并且i₄-i₃小于L/2，则修改基音周期估计值为i₄-i₃，否则不对基音周期估计值作修改，其中L为帧长，0≤q₁≤1≤q₂。

步骤303：以该正确接收帧的时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号；

具体使用有交叠的周期性延拓方式得到一帧长的时域信号的方法如103e中的方法，不同之处在于延拓方向相反，并且无波形逐渐收敛的过程。即对该正确接收帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的前方做周期性的复制，直至得到一帧长的时域信号。复制时，为保证信号平滑需要复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生信号交叠区，在交叠区中的信号需要进行加窗相加处理。

步骤304：对补偿第一丢失帧时得到的时域信号超出一帧长度的部分(长度记M₁)与延拓得到的时域信号交叠相加，将得到的信号作为该正确接收帧的时域信号。

其中交叠区长度为M₁，在交叠区内，补偿第一丢失帧时得到的时域信号超出一帧长度的部分采用下降窗，延拓得到的该正确接收帧时域信号的前M₁点的数据采用与下降窗等长的上升窗，将加窗后相加得到的数据作为该正确接收帧时域信号的前M₁个样点的数据，其余各样点数据采用延拓得到的该正确接收帧时域信号在交叠区以外的样点数据补充。

实施例4

本实施例为实现上述实施例方法的装置，如图8所示，包括帧类型判断模块、MDCT系数获取模块、初始补偿信号获取模块和调整模块，其中：

优选地，该帧类型判断模块是用于采用以下方式判断第一丢失帧的帧类型：根据码流中由编码装置设置的帧类型标识位判断该第一丢失帧的帧类型。具体地：该帧类型判断模块获取该第一丢失帧的前n帧中每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀，0≤n₀≤n，n≥1，则认为该第一丢失帧为多谐波帧，设置帧类型标识为多谐波类型；如果不大于第二阈值，则认为该第一丢失帧为非多谐波帧，设置帧类型标识为非多谐波类型。

优选地，该调整模块包括第一类波形调整单元，如图9所示，其中包括基音周期估计单元、短基音检测单元、波形延拓单元，其中：

所述短基音检测单元，用于对第一丢失帧进行短基音检测；

优选地，该基音周期估计单元是用于采用以下方式对第一丢失帧进行基音周期估计：使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，得到前一帧时域信号的基音周期和最大归一化自相关系数，将得到的基音周期作为该第一丢失帧的基音周期估计值；并且，该基音周期估计单元采用以下条件判断该第一丢失帧的基音周期估计值是否可用：满足以下条件中任意一个则认为该第一丢失帧的基音周期估计值不可用：

●第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第五阈值R₂并且第一丢失帧的前一帧时域信号的过零率大于第六阈值Z₂，其中0＜R₂＜1，Z₂＞0。

优选地，所述短基音检测单元是用于采用以下方式对第一丢失帧进行短基音检测：检测第一丢失帧的前一帧是否存在短基音周期，如果存在，则认为该第一丢失帧也存在短基音周期，如果不存在，则认为该第一丢失帧也不存在短基音周期；其中，该短基音检测单元采用以下方式检测第一丢失帧的前一帧是否存在短基音周期：检测第一丢失帧前一帧是否存在T′_min到T′_max之间的基音周期，所述T′_min和T′_max满足条件：T′_min＜T′_max≤基音搜索时的基音周期下限T_min，检测时使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，当最大归一化自相关系数超过第七阈值R₃时则认为存在短基音周期，其中0＜R₃＜1。

优选地，所述第一类波形调整单元还包括基音周期调整单元，其用于判断第一丢失帧的前一帧时域信号不为正确解码得到的时域信号时，对所述基音周期估计单元估计得到的基音周期估计值进行调整，将调整后的基音周期估计值送至该波形延拓单元。

优选地，所述基音周期调整单元是用于采用以下方式对基音周期估计值进行调整：分别搜索得到第一丢失帧的初始补偿信号在时间区间[0，T-1]和[T，2T-1]内的最大幅值位置i₁和i₂，其中T为估计得到的基音周期估计值，如果满足以下条件：q₁T＜i₂-i₁＜q₂T并且i₂-i₁小于帧长的一半，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₂-i₁，如果不满足上述条件，则不对基音周期估计值作修改。

优选地，该波形延拓单元是用于采用以下方式以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形进行有交叠的周期性延拓：对第一丢失帧前一帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的后方做周期性的复制，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生交叠区，对交叠区中的信号进行加窗相加处理。

优选地，上述帧类型判断模块、MDCT系数获取模块、初始补偿信号获取模块和调整模块还可具有以下功能：

该帧类型判断模块，还用于在第一丢失帧之后紧随的第二个丢失帧丢失时，判断该第二丢失帧的帧类型；

该MDCT系数获取模块，还用于在所述帧类型判断模块判断该第二丢失帧为非多谐波帧时，使用第二丢失帧的前一个或若干个帧的MDCT系数计算得到该第二丢失帧的MDCT系数；

该初始补偿信号获取模块，还用于根据第二丢失帧的MDCT系数得到第二丢失帧的初始补偿信号；

该调整模块，还用于对该第二丢失帧的初始补偿信号进行第二类波形调整，将调整后的时域信号作为所述第二丢失帧的时域信号。

优选地，所述调整模块还包括第二类波形调整单元，其用于采用以下方式对第二丢失帧的初始补偿信号进行第二类波形调整：

将补偿第一丢失帧时得到的时域信号超出一帧长度的部分M₁与第二丢失帧的初始补偿信号交叠相加得到第二丢失帧的时域信号，其中交叠区长度为M₁，在交叠区内，补偿第一丢失帧时得到的时域信号超出一帧长度的部分采用下降窗，第二丢失帧的初始补偿信号的前M₁点的数据采用与下降窗等长的上升窗，将加窗后相加得到的数据作为第二丢失帧时域信号的前M₁个样点的数据，其余各样点数据使用交叠区以外的第二丢失帧初始补偿信号的样点数据补充。

该帧类型判断模块，还用于在第二丢失帧之后紧随的第三个丢失帧及第三个丢失帧以后的帧丢失时，判断该丢失帧的帧类型；

该MDCT系数获取模块，还用于在所述帧类型判断模块判断当前丢失帧为非多谐波帧时，使用该当前丢失帧的前一个或若干个帧的MDCT系数计算得到该当前丢失帧的MDCT系数；

该初始补偿信号获取模块，还用于根据该当前丢失帧的MDCT系数得到该当前丢失帧的初始补偿信号；

该调整模块，还用于将该当前丢失帧的初始补偿信号作为该丢失帧的时域信号。

优选地，该装置还包括正常帧补偿模块，其用于在正确接收帧后紧随的第一帧丢失，且该第一丢失帧为非多谐波帧，对第一丢失帧之后紧随的正确接收帧进行处理，如图10所示，包括解码单元、时域信号调整单元，其中：

所述解码单元，用于解码得到该正确接收帧的时域信号；

优选地，所述时域信号调整单元是用于采用以下方式对补偿第一丢失帧时使用的基音周期估计值做调整：

分别搜索得到该正确接收帧时域信号在时间区间[L-2T-1，L-T-1]和[L-T，L-1]内的最大幅值位置i₃和i₄，其中T为补偿第一丢失帧时使用的基音周期估计值，L为帧长，如果满足以下条件：q₁T＜i₄-i₃＜q₂T并且i₄-i₃小于L/2，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₄-i₃，如果不满足上述条件，则不对基音周期估计值作修改。

优选地，所述时域信号调整单元是用于采用以下方式以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号：

对该正确接收帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的前方做周期性的复制，直至得到一帧长的时域信号，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生信号交叠区，在交叠区中的信号进行加窗相加处理。

本文实施例中所使用阈值为经验值，可通过仿真得到。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

当然，本发明还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims

1.一种语音频信号的丢帧补偿方法，其特征在于，所述方法包括：

根据第一丢失帧的MDCT系数得到第一丢失帧的初始补偿信号；

2.如权利要求1所述的方法，其特征在于，

所述判断第一丢失帧的帧类型，包括：

根据码流中由编码端设置的帧类型标识位判断该第一丢失帧的帧类型。

3.如权利要求2所述的方法，其特征在于，

所述编码端采用以下方式设置帧类型标识位，包括：

对编码后有剩余比特的帧，计算该帧的谱平坦度，判断谱平坦度的值是否小于第一阈值K，如果小于K则认为该帧为多谐波信号帧，设置帧类型标识位为多谐波类型，如果不小于K则认为该帧为非多谐波信号帧，设置帧类型标识位为非多谐波类型，将该帧类型标识位放入码流发送到解码端；

对编码后无剩余比特的帧，不设置帧类型标识位。

4.如权利要求2所述的方法，其特征在于，

所述根据码流中由编码端设置的帧类型标识位判断该第一丢失帧的帧类型，包括：

获取该第一丢失帧的前n帧中每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀，0≤n₀≤n，n≥1，则认为该第一丢失帧为多谐波帧，设置帧类型标识为多谐波类型；如果不大于第二阈值，则认为该第一丢失帧为非多谐波帧，设置帧类型标识为非多谐波类型。

5.如权利要求4所述的方法，其特征在于，

所述第一丢失帧的前n帧中每一帧的帧类型标识采用以下方式设置：

6.如权利要求1所述的方法，其特征在于，

所述对第一丢失帧的初始补偿信号进行第一类波形调整，包括：

对第一丢失帧进行基音周期估计，以及短基音检测，对有可用基音周期且不存在短基音周期的第一丢失帧的初始补偿信号进行波形调整：以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形对第一丢失帧前一帧时域信号进行有交叠的周期性延拓，得到大于一帧长度的时域信号，延拓时从前一帧时域信号的最后一个基音周期的波形逐渐向第一丢失帧初始补偿信号的第一个基音周期的波形收敛，将延拓得到的大于一帧长度的时域信号中前一帧长度的时域信号作为补偿得到的第一丢失帧的时域信号，超出一帧长度的部分用于与下一帧时域信号的平滑。

7.如权利要求6所述的方法，其特征在于，

所述对第一丢失帧进行基音周期估计，包括：

使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，得到前一帧时域信号的基音周期和最大归一化自相关系数，将得到的基音周期作为该第一丢失帧的基音周期估计值；

采用以下条件判断该第一丢失帧的基音周期估计值是否可用：满足以下条件中任意一个则认为该第一丢失帧的基音周期估计值不可用：

●第一丢失帧的前一帧时域信号的最大归一化自相关系数小于第四阈值R₁或者第一丢失帧的前一帧时域信号第一个基音周期内的最大幅值大于最后一个基音周期内的最大幅值的λ倍，其中0＜R₁＜1，λ≥1

8.如权利要求6所述的方法，其特征在于，

所述对第一丢失帧进行短基音检测，包括：检测第一丢失帧的前一帧是否存在短基音周期，如果存在，则认为该第一丢失帧也存在短基音周期，如果存在，则认为该第一丢失帧也不存在短基音周期；

其中，所述检测第一丢失帧的前一帧是否存在短基音周期，包括：

检测第一丢失帧前一帧是否存在T′_min到T′_max之间的基音周期，所述T′_min和T′_max满足条件：T′_min＜T′_max≤基音搜索时的基音周期下限T_min，检测时使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，当最大归一化自相关系数超过第七阈值R₃时则认为存在短基音周期，其中0＜R₃＜1。

9.如权利要求6所述的方法，其特征在于，

在对有可用基音周期且不存在短基音周期的第一丢失帧的初始补偿信号进行波形调整之前，所述方法还包括：

如果第一丢失帧的前一帧时域信号不为正确解码得到的时域信号，则对基音周期估计得到的基音周期估计值进行调整。

10.如权利要求9所述的方法，其特征在于，

所述对基音周期估计值进行调整，包括：

分别搜索得到第一丢失帧的初始补偿信号在时间区间[0，T-1]和[T，2T-1]内的最大幅值位置i₁和i₂，其中T为估计得到的基音周期估计值，如果满足以下条件：q₁T＜i₂-i₁＜q₂T并且i₂-i₁小于帧长的一半，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₂-i₁，如果不满足上述条件，则不对基音周期估计值作修改。

11.如权利要求6所述的方法，其特征在于，

所述以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形进行有交叠的周期性延拓，包括：

对第一丢失帧前一帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的后方做周期性的复制，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生交叠区，对交叠区中的信号进行加窗相加处理。

12.如权利要求7所述的方法，其特征在于，

在对第一丢失帧进行基音周期估计的过程中，在使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索之前，所述方法还包括：

先对第一丢失帧的初始补偿信号和第一丢失帧的前一帧时域信号做低通滤波或降采样处理，使用低通滤波或降采样后的初始补偿信号和第一丢失帧的前一帧时域信号代替原有的初始补偿信号和第一丢失帧的前一帧时域信号进行所述基音周期估计。

13.如权利要求1-12中任一权利要求所述的方法，其特征在于，所述方法还包括：

对于第一丢失帧之后紧随的第二个丢失帧，判断该第二丢失帧的帧类型，当第二丢失帧为非多谐波帧时，使用第二丢失帧的前一个或若干个帧的MDCT系数计算得到该第二丢失帧的MDCT系数；

根据第二丢失帧的MDCT系数得到第二丢失帧的初始补偿信号；

对该第二丢失帧的初始补偿信号进行第二类波形调整，将调整后的时域信号作为所述第二丢失帧的时域信号。

14.如权利要求13所述的方法，其特征在于，

所述对第二丢失帧的初始补偿信号进行第二类波形调整，包括：

15.如权利要求13所述的方法，其特征在于，所述方法还包括：

对于第二丢失帧之后紧随的第三个丢失帧及第三个丢失帧以后的丢失帧，判断该丢失帧的帧类型，当该丢失帧为非多谐波帧时，使用该丢失帧的前一个或若干个帧的MDCT系数计算得到该丢失帧的MDCT系数；

根据该丢失帧的MDCT系数得到该丢失帧的初始补偿信号；

将该丢失帧的初始补偿信号作为该丢失帧的时域信号。

16.如权利要求1-12中任一权利要求所述的方法，其特征在于，所述方法包括：

17.如权利要求16所述的方法，其特征在于，所述对补偿第一丢失帧时使用的基音周期估计值做调整，包括：

分别搜索得到该正确接收帧时域信号在时间区间[L-2T-1，L-T-1]和[L-T，-L-1]内的最大幅值位置i₃和i₄，其中T为补偿第一丢失帧时使用的基音周期估计值，L为帧长，如果满足以下条件：q₁T＜i₄-i₃＜q₂T并且i₄-i₃小于L/2，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₄-i₃，如果不满足上述条件，则不对基音周期估计值作修改。

18.如权利要求16所述的方法，其特征在于，

所述以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号，包括：

19.一种语音频信号的丢帧补偿方法，其特征在于，所述方法包括：

20.如权利要求19所述的方法，其特征在于，所述对补偿第一丢失帧时使用的基音周期估计值做调整，包括：

21.如权利要求19所述的方法，其特征在于，

22.一种语音频信号的丢帧补偿装置，其特征在于，所述装置包括帧类型判断模块、MDCT系数获取模块、初始补偿信号获取模块和调整模块，其中：

23.如权利要求22所述的装置，其特征在于，

所述帧类型判断模块是用于采用以下方式判断第一丢失帧的帧类型：根据码流中由编码装置设置的帧类型标识位判断该第一丢失帧的帧类型。

24.如权利要求23所述的装置，其特征在于，

所述帧类型判断模块是用于采用以下方式根据码流中由编码端设置的帧类型标识位判断该第一丢失帧的帧类型：

所述帧类型判断模块获取该第一丢失帧的前n帧中每一帧的帧类型标识，如果前n帧中多谐波信号帧的数目大于第二阈值n₀，0≤n₀≤n，n≥1，则认为该第一丢失帧为多谐波帧，设置帧类型标识为多谐波类型；如果不大于第二阈值，则认为该第一丢失帧为非多谐波帧，设置帧类型标识为非多谐波类型。

25.如权利要求22所述的装置，其特征在于，

所述调整模块包括第一类波形调整单元，其中包括基音周期估计单元、短基音检测单元、波形延拓单元，其中：

所述短基音检测单元，用于对第一丢失帧进行短基音检测；

26.如权利要求25所述的装置，其特征在于，

所述基音周期估计单元是用于采用以下方式对第一丢失帧进行基音周期估计：

所述基音周期估计单元使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索，得到前一帧时域信号的基音周期和最大归一化自相关系数，将得到的基音周期作为该第一丢失帧的基音周期估计值；

所述基音周期估计单元采用以下条件判断该第一丢失帧的基音周期估计值是否可用：满足以下条件中任意一个则认为该第一丢失帧的基音周期估计值不可用：

27.如权利要求25所述的装置，其特征在于，

所述短基音检测单元是用于采用以下方式对第一丢失帧进行短基音检测：

所述短基音检测单元检测第一丢失帧的前一帧是否存在短基音周期，如果存在，则认为该第一丢失帧也存在短基音周期，如果不存在，则认为该第一丢失帧也不存在短基音周期；

其中，所述短基音检测单元采用以下方式检测第一丢失帧的前一帧是否存在短基音周期：

28.如权利要求25所述的装置，其特征在于，

所述第一类波形调整单元还包括基音周期调整单元，其用于判断第一丢失帧的前一帧时域信号不为正确解码得到的时域信号时，对所述基音周期估计单元估计得到的基音周期估计值进行调整，将调整后的基音周期估计值送至所述波形延拓单元。

29.如权利要求28所述的装置，其特征在于，

所述基音周期调整单元是用于采用以下方式对基音周期估计值进行调整：

所述基音周期调整单元分别搜索得到第一丢失帧的初始补偿信号在时间区间[0，T-1]和[T，2T-1]内的最大幅值位置i₁和i₂，其中T为估计得到的基音周期估计值，如果满足以下条件：q₁T＜i₂-i₁＜q₂T并且i₂-i₁小于帧长的一半，其中0≤q₁≤1≤q₂，则修改基音周期估计值为i₂-i₁，如果不满足上述条件，则不对基音周期估计值作修改。

30.如权利要求25所述的装置，其特征在于，

所述波形延拓单元是用于采用以下方式以第一丢失帧前一帧时域信号的最后一个基音周期为基准波形进行有交叠的周期性延拓：

31.如权利要求26所述的装置，其特征在于，

所述基音周期估计单元还用于在使用自相关方法对第一丢失帧的前一帧时域信号进行基音搜索之前，先对第一丢失帧的初始补偿信号和第一丢失帧的前一帧时域信号做低通滤波或降采样处理，使用低通滤波或降采样后的初始补偿信号和第一丢失帧的前一帧时域信号代替原有的初始补偿信号和第一丢失帧的前一帧时域信号进行所述基音周期估计。

32.如权利要求22-31中任一权利要求所述的装置，其特征在于，

所述帧类型判断模块，还用于在第一丢失帧之后紧随的第二个丢失帧丢失时，判断该第二丢失帧的帧类型；

33.如权利要求32所述的装置，其特征在于，

所述调整模块还包括第二类波形调整单元，其用于采用以下方式对第二丢失帧的初始补偿信号进行第二类波形调整：

34.如权利要求32所述的装置，其特征在于，

所述帧类型判断模块，还用于在第二丢失帧之后紧随的第三个丢失帧及第三个丢失帧以后的帧丢失时，判断该丢失帧的帧类型；

35.如权利要求22-31中任一权利要求所述的装置，其特征在于，

所述装置还包括正常帧补偿模块，其用于在正确接收帧后紧随的第一帧丢失，且该第一丢失帧为非多谐波帧，对第一丢失帧之后紧随的正确接收帧进行处理，包括解码单元、时域信号调整单元，其中：

所述解码单元，用于解码得到该正确接收帧的时域信号；

36.如权利要求35所述的装置，其特征在于，

所述时域信号调整单元是用于采用以下方式对补偿第一丢失帧时使用的基音周期估计值做调整：

37.如权利要求35所述的装置，其特征在于，

所述时域信号调整单元是用于采用以下方式以该正确接收帧时域信号的最后一个基音周期为基准波形进行向前的有交叠的周期性延拓得到一帧长的时域信号：

以该正确接收帧时域信号的最后一个基音周期的波形以基音周期为长度向时间上的前方做周期性的复制，直至得到一帧长的时域信号，复制时，每次复制超过一个基音周期长度的信号，每次复制的信号与前一次复制的信号产生信号交叠区，在交叠区中的信号进行加窗相加处理。