CN101399040A - 一种帧错误隐藏的谱参数替换方法 - Google Patents
一种帧错误隐藏的谱参数替换方法 Download PDFInfo
- Publication number
- CN101399040A CN101399040A CNA2007101525365A CN200710152536A CN101399040A CN 101399040 A CN101399040 A CN 101399040A CN A2007101525365 A CNA2007101525365 A CN A2007101525365A CN 200710152536 A CN200710152536 A CN 200710152536A CN 101399040 A CN101399040 A CN 101399040A
- Authority
- CN
- China
- Prior art keywords
- frame
- isf
- spectral frequency
- demoder
- amr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了一种帧错误隐藏的谱参数替换方法,所述方法包括:(1)解码器统计最近连续坏帧数量;(2)在当前帧发生帧错误时,根据所述最近连续坏帧数量,将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,得到的值作为当前帧的导谱频率。本发明与现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换方案相比,能保持解码器解码质量并略有提高,同时节约解码器的内存并减小解码计算复杂度。
Description
技术领域
本发明涉及语音解码器的坏帧处理方法,具体的说,涉及一种帧错误隐藏的谱参数替换方法。
背景技术
在通信系统中,语音编码器常用的编码原理是代数码本激励线性预测(ACELP,Algebraic Code Excited Linear Prediction),这类编码器包括G.729、EVRC、AMR、AMR-WB、AMR-WB+等。其中AMR、AMR-WB、AMR-WB+是第三代移动通信合作伙伴计划(3GPP,3rd Generation Partnership Project)的语音编码标准。
基于ACELP的语音编码器生成的码流都是以语音帧为单位的,有的还把帧分为若干子帧,如AMR。对于每一帧的输入数据,通常为几十毫秒PCM(Pulse Code Modulation,脉冲编码调制)格式数据,发送端的语音编码器要将其编码为一组参数。这些参数一般要经过量化并且传输。接收端的解码器则要将这些参数重新合成为语音信号(常见为PCM格式数据)。
参照图1所示,为基于ACELP的语音编码器语音信号传输示意图。输入语音信号经编码器进行编码后由通信信道传输至解码器,由解码器重新合成语音信号。
线性预测系数(LPC,Linear Predictive Coefficience)表示短时语音的谱形状。语音编码器一般都会将LPC参数进行量化后再传输。为了减少量化误差,一些语音编码器会将LPC转换成线谱频率(LSF,Linear SpectralFrequency)或导谱频率(ISF,Immittance Spectral Frequency)等其他谱参数,再进行量化。使用ISF作为谱参数的语音编码器有AMR-WB、AMR-WB+等。
基于ACELP的语音编码器生成的语音帧的参数一般包括谱参数、自适应码本参数、代数码本参数、自适应码本增益和代数码本增益等。
如果一个语音帧的数据从发送端传输到接收端后,发生错误或者丢失,则称为坏帧。当出现坏帧时,接收端的解码器一般需要对坏帧中的错误参数进行替换,以减少解码后语音质量的下降。
最早的基于ACELP的语音解码器在发生帧错误时,都是简单的重复上一帧的谱参数,如G.729和EVRC(分别参见ITU-T G.729和3GPP23GPP2C.S0014-0)。之后的一些标准,为了进一步提高语音质量,开始利用其他的信息(如最近好帧的自适应平均值、常数平均值等)来替换当前坏帧的谱参数,如AMR-WB和AMR-WB+(参见AMR-WB的帧错误隐藏标准3GPP TS26.191)。
AMR-WB和AMR-WB+使用的谱参数是16阶的导谱频率ISF。在发生帧错误时,AMR-WB和AMR-WB+语音解码器将上一帧的ISF向ISF的部分自适应平均值偏移,得到的值作为错误帧的ISF(参考AMR帧错误隐藏标准3GPPTS 26.191和国际专利WO 02/35520):
ISFq(i)=α*past_ISFq(i)+(1-α)*ISFmean(i)i=0..15
其中
α=0.9,
ISFq(i)是当前帧的ISF向量,
past_ISFq(i)是上一帧的ISF向量,
ISFmean(i)是ISF的部分自适应平均值,由ISF的自适应平均值和ISF的常数平均值组成:
ISFmean(i)=β*ISFconst_mean(i)+(1-β)*ISFadaptive_mean(i),i=0..15
其中
β=0.25,
ISFconst_mean(i)ISF向量的长期平均值常数向量。
在上述的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在下列缺陷:
a)没有考虑最近坏帧的严重程度。当连续坏帧时,最近好帧的ISF和当前坏帧的相关性应当减弱。
b)使用最近三个好帧的ISF平均值。实际上最近一个好帧的ISF和当前坏帧的ISF的相关度应大于其他好帧,可以忽略其他好帧。
c)基于(b),如果上一帧是坏帧,那么上一帧的ISF也要通过上一好帧的ISF推断出来。因此在替换当前帧的ISF时,没有必要将上一好帧的ISF和上一帧的ISF分开计算,仅用上一好帧的ISF进行计算即可。
可见,现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在计算冗余的问题。
发明内容
本发明所要解决的技术问题是提供一种帧错误隐藏的谱参数替换方法,在保证解码质量有所提高的情况下,为了解决AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换中存在的计算冗余的问题,提出一个高效的谱参数替换方法。
为了解决上述技术问题,本发明提供了一种帧错误隐藏的谱参数替换方法,所述方法包括以下步骤:
(1)解码器统计最近连续坏帧数量;
(2)在当前帧发生帧错误时,根据所述最近连续坏帧数量,将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,得到的值作为当前帧的导谱频率。
进一步的,步骤(1)中所述统计最近连续坏帧数量,包括:设置坏帧计数器,当解码器接收到好帧时,将所述坏帧计数器置零;当解码器接收到坏帧时,将所述坏帧计数器加1。
进一步的,步骤(2)中所述将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,包括:
令
i=0..15
其中
ISFq(i)是当前帧导谱频率的向量,
past_ISFq(i)是上一好帧的导谱频率向量,
ISFconst_mean(i)是导谱频率向量的长期平均值常数向量,
bfi_count是最近连续坏帧的数量。
进一步的,所述方法还包括以下步骤:
(3)解码器按照所述当前帧的导谱频率对所述当前帧进行解码。
在技术上,采用本发明的优势有:
a)当发生连续坏帧时,逐渐减小最近好帧ISF与当前坏帧ISF的相关度,在相同码率和帧错误率情况下获得比AMR-WB和AMR-WB+原帧错误隐藏算法更好的音质。
b)当发生帧错误,需要替换ISF参数时,只使用最近一个好帧的ISF,不使用更早的好帧的ISF。和AMR-WB和AMR-WB+原帧错误隐藏算法相比,节约了解码器的内存和减小了计算复杂度。
c)当发生帧错误,需要替换ISF参数时,只使用最近一个好帧的ISF,不使用上一帧的ISF。和AMR-WB和AMR-WB+原帧错误隐藏算法相比,减小了计算复杂度。
附图说明
图1为基于ACELP的语音编码器语音信号传输示意图。
图2为本发明实施例帧错误隐藏的谱参数替换方法流程图。
具体实施方式
本发明通过统计最近连续坏帧个数,当发生连续坏帧时,逐渐减小最近好帧与当前坏帧的相关度,当发生帧错误时,将上一好帧的ISF向ISF的常数平均值进行自适应偏移,得到的值作为错误帧的ISF。从而本发明只使用最近一个好帧的ISF,不使用更早的好帧的ISF,节约解码器的内存和减小计算复杂度。并且当发生帧错误,需要替换ISF参数时,只使用最近一个好帧的ISF,不使用上一帧的ISF,从而减小了计算复杂度。
下面结合附图对本发明的优选实施例进行详细说明。
参照图2所示,为本发明实施例帧错误隐藏的谱参数替换方法流程图。所述方法包括以下步骤:
步骤201:设置坏帧计数器,解码器判断当前帧是否是坏帧,如果是坏帧,则执行步骤204;如果是好帧,则执行步骤202;
步骤202:将坏帧计数器置零;
步骤203:直接用接收到的好帧的ISF参数更新解码器的ISF输入缓冲区,作为解码器的输入参数,执行步骤206;
步骤204:将坏帧计数器加1,从而统计最近连续坏帧数量;
步骤205:按照统计出的所述最近连续坏帧数量,根据上一好帧的ISF,计算当前的坏帧的ISF,作为解码器输入参数,执行步骤206;
步骤206:解码器按照得到的当前帧的ISF对语音数据进行解码,结束。
总而言之,解码器需要统计最近连续坏帧数量。当接收到好帧时,则将统计数置0。在发生帧错误时,根据最近连续坏帧数量,将上一好帧的ISF向ISF的常数平均值进行自适应偏移,得到的值作为错误帧的ISF:
其中
ISFq(i)是当前帧的ISF向量,
past_ISFq(i)是上一好帧的ISF向量,
ISFconst_mean(i)是ISF向量的长期平均值常数向量
bi_count是最近连续坏帧的数量。
本发明提供的改进的帧错误隐藏的ISF谱参数替换方法,与现有的AMR-WB和AMR-WB+语音编解码器的帧错误隐藏的谱参数替换方案相比,能保持解码器解码质量并略有提高,同时节约解码器的内存并减小解码计算复杂度。
当然,上述具体实施方式不是对本发明技术方案的进一步限定,任何熟悉本领域的技术人员对本发明技术特征所作的等同替换或者相应改进,仍在本发明的保护范围之内。
Claims (4)
1、一种帧错误隐藏的谱参数替换方法,其特征在于,所述方法包括以下步骤:
(1)解码器统计最近连续坏帧数量;
(2)在当前帧发生帧错误时,根据所述最近连续坏帧数量,将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,得到的值作为当前帧的导谱频率。
2、如权利要求1所述的方法,其特征在于,步骤(1)中所述统计最近连续坏帧数量,包括:设置坏帧计数器,当解码器接收到好帧时,将所述坏帧计数器置零;当解码器接收到坏帧时,将所述坏帧计数器加1。
3、如权利要求1所述的方法,其特征在于,步骤(2)中所述将上一好帧的导谱频率向导谱频率的常数平均值进行自适应偏移,包括:
令
i=0..15
其中:
ISFq(i)是当前帧导谱频率的向量,
past_ISFq(i)是上一好帧的导谱频率向量,
ISFconst_mean(i)是导谱频率向量的长期平均值常数向量,
bfi_count是最近连续坏帧的数量。
4、如权利要求1所述的方法,其特征在于,所述方法还包括以下步骤:
(3)解码器按照所述当前帧的导谱频率对所述当前帧进行解码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101525365A CN101399040B (zh) | 2007-09-27 | 2007-09-27 | 一种帧错误隐藏的谱参数替换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007101525365A CN101399040B (zh) | 2007-09-27 | 2007-09-27 | 一种帧错误隐藏的谱参数替换方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101399040A true CN101399040A (zh) | 2009-04-01 |
CN101399040B CN101399040B (zh) | 2011-08-10 |
Family
ID=40517545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007101525365A Expired - Fee Related CN101399040B (zh) | 2007-09-27 | 2007-09-27 | 一种帧错误隐藏的谱参数替换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101399040B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102479513A (zh) * | 2010-11-29 | 2012-05-30 | Nxp股份有限公司 | 子带已编码音频信号的错误隐藏 |
CN102088613B (zh) * | 2009-12-02 | 2013-03-20 | 宏碁股份有限公司 | 图像修复方法 |
CN104396146A (zh) * | 2012-07-02 | 2015-03-04 | 索尼公司 | 对于高效率视频编码器(hevc)的采样自适应偏移(sao)的解耦增强 |
CN105765651A (zh) * | 2013-10-31 | 2016-07-13 | 弗朗霍夫应用科学研究促进协会 | 用于使用基于时域激励信号的错误隐藏提供经解码的音频信息的音频解码器及方法 |
CN107103910A (zh) * | 2011-10-21 | 2017-08-29 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
US10249309B2 (en) | 2013-10-31 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970011728B1 (ko) * | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
US6327689B1 (en) * | 1999-04-23 | 2001-12-04 | Cirrus Logic, Inc. | ECC scheme for wireless digital audio signal transmission |
-
2007
- 2007-09-27 CN CN2007101525365A patent/CN101399040B/zh not_active Expired - Fee Related
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088613B (zh) * | 2009-12-02 | 2013-03-20 | 宏碁股份有限公司 | 图像修复方法 |
CN102479513A (zh) * | 2010-11-29 | 2012-05-30 | Nxp股份有限公司 | 子带已编码音频信号的错误隐藏 |
CN102479513B (zh) * | 2010-11-29 | 2014-07-16 | Nxp股份有限公司 | 解码器及对比特错误加以隐藏的方法 |
US8812923B2 (en) | 2010-11-29 | 2014-08-19 | Nxp, B.V. | Error concealment for sub-band coded audio signals |
US11657825B2 (en) | 2011-10-21 | 2023-05-23 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
CN107103910A (zh) * | 2011-10-21 | 2017-08-29 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
US10984803B2 (en) | 2011-10-21 | 2021-04-20 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
CN107103910B (zh) * | 2011-10-21 | 2020-09-18 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
CN104396146A (zh) * | 2012-07-02 | 2015-03-04 | 索尼公司 | 对于高效率视频编码器(hevc)的采样自适应偏移(sao)的解耦增强 |
CN104396146B (zh) * | 2012-07-02 | 2017-07-07 | 索尼公司 | 对于高效率视频编码器(hevc)的采样自适应偏移(sao)的解耦增强 |
CN107172440A (zh) * | 2012-07-02 | 2017-09-15 | 索尼公司 | 对于高效率视频编码器的采样自适应偏移的解耦增强 |
CN107172440B (zh) * | 2012-07-02 | 2020-06-16 | 索尼公司 | 一种图像处理装置及方法 |
US10262662B2 (en) | 2013-10-31 | 2019-04-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
US10373621B2 (en) | 2013-10-31 | 2019-08-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
US10269358B2 (en) | 2013-10-31 | 2019-04-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
US10276176B2 (en) | 2013-10-31 | 2019-04-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US10283124B2 (en) | 2013-10-31 | 2019-05-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
US10290308B2 (en) | 2013-10-31 | 2019-05-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US10339946B2 (en) | 2013-10-31 | 2019-07-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US10269359B2 (en) | 2013-10-31 | 2019-04-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
US10381012B2 (en) | 2013-10-31 | 2019-08-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
CN105765651B (zh) * | 2013-10-31 | 2019-12-10 | 弗朗霍夫应用科学研究促进协会 | 使用错误隐藏提供经解码的音频信息的音频解码器及方法 |
US10262667B2 (en) | 2013-10-31 | 2019-04-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US10249310B2 (en) | 2013-10-31 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US10964334B2 (en) | 2013-10-31 | 2021-03-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US10249309B2 (en) | 2013-10-31 | 2019-04-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
CN105765651A (zh) * | 2013-10-31 | 2016-07-13 | 弗朗霍夫应用科学研究促进协会 | 用于使用基于时域激励信号的错误隐藏提供经解码的音频信息的音频解码器及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101399040B (zh) | 2011-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
US7203638B2 (en) | Method for interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs | |
RU2418324C2 (ru) | Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием | |
US7657427B2 (en) | Methods and devices for source controlled variable bit-rate wideband speech coding | |
US9053702B2 (en) | Systems, methods, apparatus, and computer-readable media for bit allocation for redundant transmission | |
EP1330818B1 (en) | Method and system for speech frame error concealment in speech decoding | |
CN101494055B (zh) | 用于码分多址无线系统的方法和装置 | |
US6721712B1 (en) | Conversion scheme for use between DTX and non-DTX speech coding systems | |
CN101399040B (zh) | 一种帧错误隐藏的谱参数替换方法 | |
EP2091040B1 (en) | Decoding method and device | |
US10607624B2 (en) | Signal codec device and method in communication system | |
CN101322181A (zh) | 有效的语音流转换 | |
US8055499B2 (en) | Transmitter and receiver for speech coding and decoding by using additional bit allocation method | |
KR20010006091A (ko) | 전송에러보정을 갖는 오디오신호 디코딩방법 | |
EP1224663A1 (en) | A predictive speech coder using coding scheme selection patterns to reduce sensitivity to frame errors | |
US8380495B2 (en) | Transcoding method, transcoding device and communication apparatus used between discontinuous transmission | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
Wang et al. | Parameter interpolation to enhance the frame erasure robustness of CELP coders in packet networks | |
US7584096B2 (en) | Method and apparatus for encoding speech | |
KR20010087393A (ko) | 폐루프 가변-레이트 다중모드 예측 음성 코더 | |
Ahmadi et al. | On the architecture, operation, and applications of VMR-WB: The new cdma2000 wideband speech coding standard | |
Gibson | Speech coding for wireless communications | |
Bernard | Source-channel coding of speech | |
Foodeei et al. | A low bit rate codec for AMR standard | |
Hayashi et al. | 8 kbit/s short and medium delay speech codecs based on CELP coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110810 Termination date: 20190927 |
|
CF01 | Termination of patent right due to non-payment of annual fee |