CN108364657B - 处理丢失帧的方法和解码器 - Google Patents
处理丢失帧的方法和解码器 Download PDFInfo
- Publication number
- CN108364657B CN108364657B CN201810203241.4A CN201810203241A CN108364657B CN 108364657 B CN108364657 B CN 108364657B CN 201810203241 A CN201810203241 A CN 201810203241A CN 108364657 B CN108364657 B CN 108364657B
- Authority
- CN
- China
- Prior art keywords
- frame
- current lost
- loss
- received before
- gain gradient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012545 processing Methods 0.000 title claims abstract description 18
- 238000011084 recovery Methods 0.000 claims abstract description 92
- 230000007704 transition Effects 0.000 abstract description 14
- 230000005284 excitation Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 239000012792 core layer Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
- G10L2025/937—Signal energy in various frequency bands
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
本发明实施例提供处理丢失帧的方法和解码器。该方法包括:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数;根据恢复信息,确定当前丢失帧的全局增益梯度;根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益;根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。本发明实施例使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
Description
技术领域
本发明涉及通信领域,并且具体地,涉及处理丢失帧的方法和解码器。
背景技术
随着技术的不断进步,用户对话音质量的需求越来越高,其中提高话音的带宽是提高话音质量提高的主要方法。如果采用传统的编码方式来编码增加的带宽部分的信息则会大大提高码率,这种情况下,由于当前网络带宽的限制,将无法达到传送的目的。因此通常采用频带扩展技术来提升带宽。
编码端利用频带扩展技术对高频带信号编码后,将编码后的信号传输到解码端。解码端也利用频带扩展技术恢复高频带信号。在传输信号的过程中,由于网络拥塞或故障等原因,可能会导致丢帧。由于丢包率是一个影响信号质量的关键因素,因此为了在丢帧的情况下尽可能正确地恢复出丢失帧,提出了丢帧处理技术。在该技术中,解码端可以将根据前一帧的合成高频带信号作为丢失帧的合成高频带信号,然后利用当前丢失帧的子帧增益和全局增益对合成高频带信号进行调整,从而得到最终的高频带信号。然而,由于在该技术中当前丢失帧的子帧增益为固定值,当前丢失帧的全局增益是利用前一帧的全局增益乘以固定的梯度得到的,因此会导致重建的高频带信号在丢帧前后过渡不连续,重建的高频带信号出现严重的杂音。
发明内容
本发明实施例提供处理丢失帧的方法和解码器,能够提升高频带信号的质量。
第一方面,提供了一种处理丢失帧的方法,包括:确定当前丢失帧的合成高频带信号;确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;根据所述全局增益梯度和所述当前丢失帧的前M帧中每一帧的全局增益确定所述当前丢失帧的全局增益,其中M为正整数;根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第一方面,在第一种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
结合第一方面,在第二种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第一方面,在第三种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定所述丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度大于预设的第一阈值。
结合第一方面,在第四种可能的实现方式中,所述根据恢复信息,确定当前丢失帧的全局增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第一方面或第一方面的第一种可能的实现方式至第四种可能的实现方式中任一实现方式,在第五种可能的实现方式中,所述确定所述当前丢失帧的子帧增益,包括:根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第一方面的第五种可能的实现方式,在第七种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
第二方面,提供了一种处理丢失帧的方法,包括:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第二方面,在第一种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第二方面,在第二种可能的实现方式中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
第三方面,提供了一种解码器,包括:第一确定单元,用于确定当前丢失帧的合成高频带信号;第二确定单元,用于确定当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;第四确定单元,用于根据所述全局增益梯度和所述当前丢失帧的前M帧中每一帧的全局增益确定所述当前丢失帧的全局增益,其中M为正整数;调整单元,用于根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第三方面,在第一种可能的实现方式中,所述第二确定单元,具体用于在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
结合第三方面,在第二种可能的实现方式中,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第三方面,在第三种可能的实现方式中,所述第二确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定所述丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度大于预设的第一阈值。
结合第三方面,在第四种可能的实现方式中,所述第二确定单元,具体用于在确定所述丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
结合第三方面或第三方面的第一种可能的实现方式至第四种可能的实现方式中任一实现方式,在第五种可能的实现方式中,还包括:第五确定单元,用于:根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
结合第三方面的第五种可能的实现方式,在第六种可能的实现方式中,所述第五确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第三方面的第五种可能的实现方式,在第七种可能的实现方式中,所述第五确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
第四方面,提供了一种解码器,包括:第一确定单元,用于确定当前丢失帧的合成高频带信号;第二确定单元,用于确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;第四确定单元,用于根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;调整单元,用于根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
结合第四方面,在第一种可能的实现方式中,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
结合第四方面,在第二种可能的实现方式中,所述第二确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一个实施例的处理丢失帧的方法的示意性流程图。
图2是根据本发明另一实施例的处理丢失帧的方法的示意性流程图。
图3是根据本发明一个实施例的处理丢失帧的方法的过程的示意性流程图。
图4是根据本发明一个实施例的解码器的示意框图。
图5是根据本发明另一实施例的解码器的示意框图。
图6是根据本发明一个实施例的解码器的示意框图。
图7是根据本发明另一实施例的解码器的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
编码技术和解码技术,广泛应用于各种电子设备中,例如:移动电话,无线装置,个人数据助理(Personal Data Assistant,PDA),手持式或便携式计算机,全球定位系统(Global Positioning System,GPS)接收机/导航器,照相机,音频/视频播放器,摄像机,录像机,监控设备等。
为了提升话音的带宽,常采用频带扩展技术。具体地,编码端可以通过核心层编码器编码低频带信息,对高频带信号进行线性预测编码(Linear Predictive Coding,LPC)分析来得到高频带LPC系数。然后根据由核心层编码器得到的基因周期、代数码书和各自增益等参数,得到高频带激励信号。将高频带激励信号经过由LPC参数得到的LPC合成滤波器处理后,得到合成高频带信号。通过比较原始高频带信号与合成高频带信号,得到子帧增益和全局增益。将上述LPC系数转化为LSF参数,并将LSF参数、子帧增益和全局增益进行量化并编码。最后将编码得到的码流发送给解码端。
解码端接收到编码的码流后,首先可以解析码流信息确定是否有帧丢失。如果没有发生丢帧情况,则可以正常解码。如果发生丢帧情况,解码端可以对丢失帧进行处理。下面将结合本发明实施例详细描述解码端处理丢失帧的方法。
图1是根据本发明一个实施例的处理丢失帧的方法的示意性流程图。图1的方法由解码端执行。
110,确定当前丢失帧的合成高频带信号。
例如,解码端可以根据当前丢失帧的前一帧的参数,确定当前丢失帧的合成高频带激励信号。具体地,解码端可以将当前丢失帧的前一帧的LPC参数作为当前帧的LPC参数,并可以利用前一帧的核心层解码器得到的基音周期、代数码书和各自增益等参数得到高频带激励信号。解码端可以将该高频带激励信号作为当前丢失帧的高频带激励信号,然后将高频带激励信号经过由LPC参数生成的LPC合成滤波器处理后,得到当前丢失帧的合成高频带信号。
120,确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到所述当前丢失帧为止连续丢失的帧数。
当前丢失帧可以是指解码端当前需要处理的丢失帧。
丢帧前编码模式可以是指本次丢帧事件发生前的编码模式。通常,为了达到更好的编码性能,编码端在对信号编码前可以对信号分类,从而选择合适的编码模式。目前,编码模式可以包括:静音帧编码模式(INACTIVE mode),清音帧编码模式(UNVOICED mode),浊音帧编码模式(VOICED mode),普通帧编码模式(GENERIC mode),瞬态帧编码模式(TRANSITION mode),音频帧编码模式(AUDIO mode)。
丢帧前所接收到的最后一个帧的类型可以是指本次丢帧事件发生前解码端接收到的最近的一个帧的类型。例如,假设编码端向解码端发送了4帧,其中解码端正确地接收了第1帧和第2帧,而第3帧和第4帧丢失,那么丢帧前所接收到的最后一个帧可以指第2帧。通常,帧的类型可以包括:(1)清音、静音、噪声或浊音结尾等几种特性之一的帧(UNVOICED_CLAS frame);(2)清音到浊音过渡,浊音开始但还比较微弱的帧(UNVOICED_TRANSITIONframe);(3)浊音之后的过渡,浊音特性已经很弱的帧(VOICED_TRANSITION frame);(4)浊音特性的帧,其之前的帧为浊音或者浊音开始帧(VOICED_CLAS frame);(5)明显浊音的开始帧(ONSET frame);(6)谐波和噪声混合的开始帧(SIN_ONSET frame);(7)非活动特性帧(INACTIVE_CLAS frame)。
连续丢帧数可以是指本次丢帧事件中到当前丢失帧为止连续丢失的帧数。实质上,连续丢帧数可以指示当前丢失帧是连续丢失的帧中的第几帧。例如,编码端向解码端发送了5帧,解码端正确接收了第1帧和第2帧,第3帧至第5帧均丢失。如果当前丢失帧为第4帧,那么连续丢帧数就是2;如果当前丢失帧为第5帧,那么连续丢帧数为3。
130,根据恢复信息,确定当前丢失帧的全局增益梯度。
140,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,其中M为正整数。
例如,解码端可以对前M帧的全局增益进行加权,然后根据加权后的全局增益和全局增益梯度确定当前丢失帧的全局增益。
具体地,当前丢失帧的全局增益FramGain可以用等式(1)表示:
FramGain=f(α,FramGain(-m)) (1)
其中,FramGain(-m)可以表示前M帧中第m帧的全局增益,α可以表示当前丢失帧的全局增益梯度。
例如,解码端可以按照下述等式(2)确定当前丢失帧的全局增益FramGain:
应理解,上述等式(2)的举例仅是为了帮助本领域技术人员更好地理解本发明实施例,而非要限制本发明实施例的范围。本领域技术人员可以基于等式(1)进行各种等价的修改或变化,从而可以确定等式(1)的多种具体表现形式,这些修改或变化也落入本发明实施例的范围内。
通常,为了简化步骤130的过程,解码端可以根据当前丢失帧的前一帧的全局增益和全局增益梯度,确定当前丢失帧的全局增益。
150,根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
例如,解码端可以将当前丢失帧的子帧增益设置为固定值。或者,解码端也可以根据下面将要描述的方式确定当前丢失帧的子帧增益。然后解码端可以使用当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,从而得到最终的高频带信号。
现有技术中,当前丢失帧的全局增益梯度为固定值,解码端根据前一帧的全局增益和固定的全局增益梯度得到当前丢失帧的全局增益。根据这种方法得到的当前丢失帧的全局增益对合成高频带信号进行调整,会导致在丢帧情况下最终的高频带信号前后过渡不连续,产生严重的杂音。而本发明实施例中,解码端可以根据恢复信息确定全局增益梯度,而非简单地设置为固定值,由于恢复信息描述了丢帧事件的相关特性,因此根据恢复信息确定的全局增益梯度更为精确,使得当前丢失帧的全局增益也更为精确。因此解码端根据该全局增益对合成高频信号进行调整,使得重建的高频带信号过渡自然平稳,能够削弱重建的高频带信号中的杂音,提升重建的高频带信号的质量。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,在步骤120中,上述全局增益梯度α可以用等式(3)表示:
α=1.0-delta*scale (3)
其中,delta可以代表α的调整梯度,其取值范围可以在0.5到1之间。
scale可以代表α微调的幅度,其决定了当前条件下当前丢失帧跟随之前帧的能力的程度。其取值范围可以在0到1之间,其取值越小可以表示当前丢失帧跟随之前帧的能量越接近,反之可以表示当前丢失帧相比之前帧的能量有较大的削弱。
可选地,作为一个实施例,在步骤120中,解码端可以在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,确定全局增益梯度为1。
具体地,解码端在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,当前丢失帧的全局增益可以跟随之前的帧的全局增益,因此可以确定α为1。例如,对于等式(3),delta可以取值为0.6,scale可以取值为0。
可选地,作为另一实施例,在步骤120中,解码端可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,则确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
具体地,在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果可以确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,解码端可以确定α为较小的值,即α可以小于预设的第一阈值。例如,第一阈值可以为0.5。例如,对于等式(3),delta可以取值为0.65,scale可以取值为0.8。
在上述实施例中,解码端可以根据丢帧前所接收到的最后一个帧的类型和/或连续丢帧数,确定丢帧前所接收到的最后一个帧的编码模式是否与当前丢失帧的编码模式相同,或者确定所接收到的最后一个帧的类型是否与当前丢失帧的类型相同。比如,如果连续丢帧数小于或等于3的话,解码端可以确定所接收到的最后一帧的编码模式与当前丢失帧的编码模式相同。如果连续丢帧数大于3,那么解码端不能够确定所接收到的最后一帧的编码模式与当前丢失帧的编码模式相同。再比如,如果所接收到的最后一个帧为浊音帧的开始帧或清音帧的开始帧,并且连续丢帧数小于或等于3,那么解码端可以确定当前丢失帧的类型与所接收到的最后一个帧的类型相同。如果连续丢帧数大于3,那么解码端就不能确定丢帧前所接收到的最后一个帧的编码模式是否与当前丢失帧的编码模式相同,或者所接收到的最后一个帧的类型是否与当前丢失帧的类型相同。
可选地,作为另一实施例,解码端可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定全局增益梯度,使得全局增益梯度大于预设的第一阈值。
具体地,如果解码端确定丢帧前所接收到的最后一个帧为浊音帧的开始帧,则可以确定当前丢失帧很可能为浊音帧,那么可以确定α为较大的值,即α可以大于预设的第一阈值。例如,对于等式(3),delta可以取值为0.5,scale可以取值为0.4。
如果解码端确定丢帧前所接收到的最后一个帧为音频帧或静音帧,则也可以确定α为较大的值,即α可以大于预设的第一阈值。例如,对于等式(3),delta可以取值为0.5,scale可以取值为0.4。
可选地,作为另一实施例,解码端可以在确定丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
如果丢帧前所接收到的最后一个帧为清音帧的开始帧,那么当前丢失帧很可能为清音帧,那么解码端可以确定α为较小的值,即α可以小于预设的第一阈值。例如,对于等式(3),delta可以取值为0.8,scale可以取值为0.65。
此外,对于除了上述恢复信息所指示的情况外,在其它情况下,解码端可以确定α为较小的值,即α可以小于预设的第一阈值。例如,对于等式(3),delta可以取值为0.8,scale可以取值为0.75。
可选地,作为另一实施例,上述第一阈值的取值范围可以如下:0<第一阈值<1。
可选地,作为另一实施例,解码端可以根据恢复信息,确定当前丢失帧的子帧增益梯度,并可以根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
解码端可以根据上述恢复信息确定当前丢失帧的全局增益梯度外,解码端也可以根据上述恢复信息,确定当前丢失帧的子帧增益梯度。例如,解码端可以对前N帧的子帧增益进行加权,然后根据加权后的子帧增益和子帧增益梯度确定当前丢失帧的子帧增益。
具体地,当前丢失帧的子帧增益SubGain可以用等式(4)表示:
SubGain=f(β,SubGain(-n)) (4)
其中,SubGain(-n)可以表示前N帧中第n帧的子帧增益,β可以表示当前丢失帧的子帧增益梯度。
例如,解码端可以按照等式(5)确定当前丢失帧的子帧增益SubGain:
应理解,上述等式(5)的举例仅是为了帮助本领域技术人员更好地理解本发明实施例,而非要限制本发明实施例的范围。本领域技术人员可以基于等式(4)进行各种等价的修改或变化,从而可以确定等式(4)的多种具体表现形式,这些修改或变化也落入本发明实施例的范围内。
为了简化过程,解码端也可以根据当前丢失帧的前一帧的子帧增益和子帧增益梯度,确定当前丢失帧的子帧增益。
可见,本实施例中,并非简单地设置当前丢失帧的子帧增益为固定值,而是根据恢复信息确定子帧增益梯度后再确定当前丢失帧的子帧增益,因此,根据当前丢失帧的子帧增益以及上述当前丢失帧的全局增益对合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为另一实施例,解码端可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
例如,第二阈值可以是1.5。β可以为1.25。
可选地,作为另一实施例,解码端可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
如果丢帧前所接收到的最后一个帧为浊音帧的开始帧,则当前丢失帧很可能为浊音帧,那么解码端可以确定β为较大的值,例如,β可以为2.0。
此外,对于β而言,除了上述恢复信息所指示的两种情况外,在其它情况下,β可以为1。
可选地,作为另一实施例,上述第二阈值的取值范围如下:1<第二阈值<2。
图2是根据本发明另一实施例的处理丢失帧的方法的示意性流程图。图2的方法由解码端执行。
210,确定当前丢失帧的合成高频带信号。
解码端可以按照现有技术,确定当前丢失帧的合成高频带信号。例如,解码端可以根据当前丢失帧的前一帧的参数,确定当前丢失帧的合成高频带激励信号。具体地,解码端可以将当前丢失帧的前一帧的LPC参数作为当前帧的LPC参数,并可以利用前一帧的核心层解码器得到的基音周期、代数码书和各自增益等参数得到高频带激励信号。解码端可以将该高频带激励信号作为当前丢失帧的高频带激励信号,然后将高频带激励信号经过由LPC参数生成的LPC合成滤波器处理后,得到当前丢失帧的合成高频带信号。
220,确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数。
恢复信息的详细描述可以参照图1的实施例中的描述,此处不再赘述。
230,根据恢复信息,确定当前丢失帧的子帧增益梯度。
240,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
例如,解码端可以对前N帧的子帧增益进行加权,然后根据加权后的子帧增益和子帧增益梯度确定当前丢失帧的子帧增益。
具体地,当前丢失帧的子帧增益SubGain可以用等式(4)表示。
例如,解码端可以按照等式(5)确定当前丢失帧的子帧增益SubGain。
应理解,上述等式(5)的举例仅是为了帮助本领域技术人员更好地理解本发明实施例,而非要限制本发明实施例的范围。本领域技术人员可以基于等式(4)进行各种等价的修改或变化,从而可以确定多种等式(4)的具体表现形式,这些修改或变化也落入本发明实施例的范围内。
为了简化过程,解码端也可以根据当前丢失帧的前一帧的子帧增益和子帧增益梯度,确定当前丢失帧的子帧增益。
250,根据当前丢失帧的子帧增益和当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
例如,解码端可以按照现有技术,设置固定的全局增益梯度,然后根据该固定的全局增益梯度和前一帧的全局增益,确定当前丢失帧的全局增益。
在现有技术中,解码端将当前丢失帧的子帧增益设置为固定值,根据固定值以及当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,导致最终的高频带信号在丢帧情况下前后过渡不连续,产生严重的杂音。而本发明实施例中,解码端可以根据恢复信息确定子帧增益梯度,然后根据子帧增益梯度确定当前丢失帧的子帧增益,而非简单地将当前丢失帧的子帧增益设置为固定值,由于恢复信息描述了丢帧事件的相关特性,因此使得当前丢失帧的子帧增益更为精确。因此解码端根据该子帧增益对合成高频信号进行调整,使得重建的高频带信号过渡自然平稳,能够削弱重建的高频带信号中的杂音,提升重建的高频带信号的质量。
本实施例中,通过根据恢复信息确定当前丢失帧的子帧增益梯度,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益确定当前丢失帧的子帧增益,根据当前丢失帧的子帧增益和当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为另一实施例,解码端可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
例如,第二阈值可以是1.5。β可以为1.25。
可选地,作为一个实施例,解码端可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
如果丢帧前所接收到的最后一个帧为浊音帧的开始帧,则当前丢失帧很可能为浊音帧,那么解码端可以确定β为较大的值,例如,β可以为2.0。
此外,对于β而言,除了上述恢复信息所指示的两种情况外,在其它情况下,β可以为1。
可选地,作为另一实施例,上述第二阈值的取值范围可以如下:1<第二阈值<2。
从上述可以看出,解码端可以按照本发明实施例确定当前丢失帧的全局增益,按照现有技术按照当前丢帧帧的子帧增益,或者,解码端可以按照本发明实施例确定当前丢失帧的子帧增益,按照现有技术按照当前丢帧帧的全局增益,或者,解码端可以按照本发明实施例确定当前丢失帧的子帧增益和当前丢帧帧的全局增益,上述方法均使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
图3是根据本发明一个实施例的处理丢失帧的方法的过程的示意性流程图。
301,解析所接收的码流中的丢帧标志。
该过程可以按照现有技术执行。
302,根据丢帧标志,确定当前帧是否丢失。
如果丢帧标志指示当前帧没有丢失,转到步骤303。
在丢帧标志指示当前帧丢失,则转到步骤304至306。
303,如果丢帧标志指示当前帧没有丢失,则对码流进行解码处理,恢复当前帧。
如果丢帧标志指示当前帧丢失,则可以同时执行步骤304至306。或者,按一定顺序执行步骤304至306。本发明实施例对此不做限定。
304,确定当前丢失帧的合成高频带信号。
例如,解码端可以根据当前丢失帧的前一帧的参数,确定当前丢失帧的合成高频带激励信号。具体地,解码端可以将当前丢失帧的前一帧的LPC参数作为当前帧的LPC参数,并可以利用前一帧的核心层解码器得到的基音周期、代数码书和各自增益等参数得到高频带激励信号。解码端可以将该高频带激励信号作为当前丢失帧的高频带激励信号,然后将高频带激励信号经过由LPC参数生成的LPC合成滤波器处理后,得到当前丢失帧的合成高频带信号。
305,确定当前丢失帧的全局增益。
可选地,解码端可以根据当前丢失帧的恢复信息,确定当前丢失帧的全局增益梯度。其中,恢复信息可以包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数。然后根据当前丢失帧的全局增益梯度和前M帧的每一帧的全局增益,确定当前丢失帧的全局增益。
例如,在
可选地,解码端还可以根据现有技术确定当前丢失帧的全局增益。例如,可以将前一帧的全局增益乘以固定的全局增益梯度,得到当前丢失帧的全局增益。
306,确定当前丢失帧的子帧增益。
可选地,解码端可以也根据当前丢失帧的恢复信息,确定当前丢失帧的子帧增益梯度。然后根据当前丢失帧的全局增益梯度和前N帧的每一帧的子帧增益,确定当前丢失帧的子帧增益。
可选地,解码端可以按照现有技术确定当前丢失帧的子帧增益,例如将当前丢失帧的子帧增益设为固定值。
应理解,为了提升当前丢失帧对应的重建高频带信号的质量,如果步骤305中采用现有技术确定当前丢失帧的全局增益,那么步骤306中,就需要按照图2的实施例的方法确定当前丢帧的子帧增益。如果步骤305中采用本图1的实施例的方法确定当前丢失帧的全局增益,那么步骤306中,可以采用图2的实施例的方法确定当前丢失帧的子帧增益,也可以采用现有技术确定当前丢失帧的子帧增益。
307,根据步骤305确定的当前丢失帧的全局增益和步骤306确定的当前丢失帧的子帧增益,对步骤304得到的合成高频带信号进行调整,得到当前丢失帧的高频带信号。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,或者根据恢复信息确定当前丢失帧的子帧增益梯度,从而得到当前丢失帧的全局增益和当前丢失帧的子帧增益,并根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
图4是根据本发明一个实施例的解码器的示意框图。图4的设备400的一个例子是解码器。设备400包括第一确定单元410、第二确定单元420、第三确定单元430、第四确定单元440和调整单元450。
第一确定单元410确定当前丢失帧的合成高频带信号。第二确定单元420确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数。第三确定单元430根据恢复信息,确定当前丢失帧的全局增益梯度。第四确定单元440根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,其中M为正整数。确定当前丢失帧的子帧增益。调整单元450根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,第三确定单元430可以在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,确定全局增益梯度为1。
可选地,作为另一实施例,第三确定单元430可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,则确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,第三确定单元430可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定全局增益梯度,使得全局增益梯度大于预设的第一阈值。
可选地,作为另一实施例,第三确定单元430可以在确定丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,还包括第五确定单元450。第五确定单元450可以根据恢复信息,确定当前丢失帧的子帧增益梯度。第五确定单元450可以根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
可选地,作为另一实施例,第五确定单元450可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值。
可选地,作为另一实施例,第五确定单元450可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备400的其它功能和操作可以参照上面图1和图3的方法实施例的过程,为了避免重复,此处不再赘述。
图5是根据本发明另一实施例的解码器的示意框图。图5的设备500的一个例子是解码器。图5的设备500包括第一确定单元510、第二确定单元520、第三确定单元530、第四确定单元540和调整单元550。
第一确定单元510确定当前丢失帧的合成高频带信号。第二确定单元520确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数。第三确定单元530根据恢复信息,确定当前丢失帧的子帧增益梯度。第四确定单元540根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。调整单元550根据当前丢失帧的子帧增益和当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本实施例中,通过根据恢复信息确定当前丢失帧的子帧增益梯度,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益确定当前丢失帧的子帧增益,根据当前丢失帧的子帧增益和当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,第三确定单元530可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值。
可选地,作为另一实施例,第三确定单元530可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备500的其它功能和操作可以参照上面图2和图3的方法实施例的过程,为了避免重复,此处不再赘述。
图6是根据本发明一个实施例的解码器的示意框图。图6的设备600的一个例子是解码器。设备600包括存储器610和处理器620。
存储器610可以包括随机存储器、闪存、只读存储器、可编程只读存储器、非易失性存储器或寄存器等。处理器620可以是中央处理器(Central Processing Unit,CPU)。
存储器610用于存储可执行指令。处理器620可以执行存储器610中存储的可执行指令,用于:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数;根据恢复信息,确定当前丢失帧的全局增益梯度;根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,其中M为正整数;根据当前丢失帧的全局增益和当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本发明实施例中,通过根据恢复信息确定当前丢失帧的全局增益梯度,根据全局增益梯度和当前丢失帧的前M帧中每一帧的全局增益确定当前丢失帧的全局增益,根据当前丢失帧的全局增益和当前丢失帧的子帧增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,处理器620可以在确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式相同且连续丢帧数小于或等于3的情况下,或者,在确定当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型相同且连续丢帧数小于或等于3的情况下,确定全局增益梯度为1。
可选地,作为另一实施例,处理器620可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧或浊音帧,且连续丢帧数小于或等于3,则确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,处理器620可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定全局增益梯度,使得全局增益梯度大于预设的第一阈值。
可选地,作为另一实施例,处理器620可以在确定丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定全局增益梯度,使得全局增益梯度小于或等于预设的第一阈值且大于0。
可选地,作为另一实施例,处理器620可以根据恢复信息,确定当前丢失帧的子帧增益梯度,并可以根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数。
可选地,作为另一实施例,处理器620可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
可选地,作为另一实施例,处理器620可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备600的其它功能和操作可以参照上面图1和图3的方法实施例的过程,为了避免重复,此处不再赘述。
图7是根据本发明另一实施例的解码器的示意框图。图7的设备700的一个例子是解码器。图7的设备700包括存储器710和处理器720。
存储器710可以包括随机存储器、闪存、只读存储器、可编程只读存储器、非易失性存储器或寄存器等。处理器720可以是中央处理器(Central Processing Unit,CPU)。
存储器710用于存储可执行指令。处理器720可以执行存储器710中存储的可执行指令,用于:确定当前丢失帧的合成高频带信号;确定当前丢失帧对应的恢复信息,其中恢复信息包括以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,连续丢帧数,其中连续丢帧数为到当前丢失帧为止连续丢失的帧数;根据恢复信息,确定当前丢失帧的子帧增益梯度;根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益,确定当前丢失帧的子帧增益,其中N为正整数;根据当前丢失帧的子帧增益和当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到当前丢失帧的高频带信号。
本实施例中,通过根据恢复信息确定当前丢失帧的子帧增益梯度,根据子帧增益梯度和当前丢失帧的前N帧中每一帧的子帧增益确定当前丢失帧的子帧增益,根据当前丢失帧的子帧增益和当前丢失帧的全局增益对当前丢失帧的合成高频带信号进行调整,使得当前丢失帧的高频带信号过渡自然平稳,能够削弱高频带信号中的杂音,提升高频带信号的质量。
可选地,作为一个实施例,处理器720可以在不能够确定当前丢失帧的编码模式与丢帧前所接收到的最后一个帧的编码模式是否相同或者当前丢失帧的类型与丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定丢帧前所接收到的最后一个帧为清音帧,且连续丢帧数小于或等于3,则确定子帧增益梯度,使得子帧增益梯度小于或等于预设的第二阈值且大于0。
可选地,作为另一实施例,处理器720可以在确定丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定子帧增益梯度,使得子帧增益梯度大于预设的第二阈值。
设备700的其它功能和操作可以参照上面图2和图3的方法实施例的过程,为了避免重复,此处不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (20)
1.一种处理丢失帧的方法,其特征在于,包括:
确定当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;
根据所述全局增益梯度和所述当前丢失帧的前一帧的全局增益确定所述当前丢失帧的全局增益;
根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对所述当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述恢复信息,确定当前丢失帧的全局增益梯度,包括:
在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
3.根据权利要求1所述的方法,其特征在于,所述根据所述恢复信息,确定当前丢失帧的全局增益梯度,包括:
在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
4.根据权利要求1所述的方法,其特征在于,所述根据所述恢复信息,确定当前丢失帧的全局增益梯度,包括:
在所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定所述丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度大于预设的第一阈值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述恢复信息,确定当前丢失帧的全局增益梯度,包括:
在所述丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:
在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
8.根据权利要求6所述的方法,其特征在于,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:
在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
9.一种处理丢失帧的方法,其特征在于,包括:
确定当前丢失帧的合成高频带信号;
确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;
根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;
确定所述当前丢失帧的全局增益;
根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号;
其中,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:
在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
10.根据权利要求9所述的方法,其特征在于,所述根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度,包括:
在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
11.一种解码器,其特征在于,包括:
第一确定单元,用于确定当前丢失帧的合成高频带信号;
第二确定单元,用于确定当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的全局增益梯度;
第四确定单元,用于根据所述全局增益梯度和所述当前丢失帧的前一帧的全局增益确定所述当前丢失帧的全局增益;
调整单元,用于根据所述当前丢失帧的全局增益和所述当前丢失帧的子帧增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号。
12.根据权利要求11所述的解码器,其特征在于,所述第二确定单元,具体用于在确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式相同且所述连续丢帧数小于或等于3的情况下,或者,在确定所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型相同且所述连续丢帧数小于或等于3的情况下,确定所述全局增益梯度为1。
13.根据权利要求11所述的解码器,其特征在于,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧或浊音帧,且所述连续丢帧数小于或等于3,则确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
14.根据权利要求11所述的解码器,其特征在于,所述第二确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,或者,在确定所述丢帧前所接收到的最后一个帧为音频帧或静音帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度大于预设的第一阈值。
15.根据权利要求11所述的解码器,其特征在于,所述第二确定单元,具体用于在确定所述丢帧前所接收到的最后一个帧为清音帧的开始帧的情况下,确定所述全局增益梯度,使得所述全局增益梯度小于或等于预设的第一阈值且大于0。
16.根据权利要求11至15中任一项所述的解码器,其特征在于,还包括:第五确定单元,用于:根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数。
17.根据权利要求16所述的解码器,其特征在于,所述第五确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
18.根据权利要求16所述的解码器,其特征在于,所述第五确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
19.一种解码器,其特征在于,包括:
第一确定单元,用于确定当前丢失帧的合成高频带信号;
第二确定单元,用于确定所述当前丢失帧对应的恢复信息,其中所述恢复信息包括连续丢帧数和以下至少一种:丢帧前编码模式,丢帧前所接收到的最后一个帧的类型,其中所述连续丢帧数为到所述当前丢失帧为止连续丢失的帧数;
第三确定单元,用于根据所述恢复信息,确定所述当前丢失帧的子帧增益梯度;
第四确定单元,用于根据所述子帧增益梯度和所述当前丢失帧的前N帧中每一帧的子帧增益,确定所述当前丢失帧的子帧增益,其中N为正整数;
调整单元,用于根据所述当前丢失帧的子帧增益和所述当前丢失帧的全局增益,对当前丢失帧的合成高频带信号进行调整,以得到所述当前丢失帧的高频带信号;
其中,所述第二确定单元具体用于在确定所述丢帧前所接收到的最后一个帧为浊音帧的开始帧的情况下,确定所述子帧增益梯度,使得所述子帧增益梯度大于预设的第二阈值。
20.根据权利要求19所述的解码器,其特征在于,所述第二确定单元具体用于在不能够确定所述当前丢失帧的编码模式与所述丢帧前所接收到的最后一个帧的编码模式是否相同或者所述当前丢失帧的类型与所述丢帧前所接收到的最后一个帧的类型是否相同的情况下,如果确定所述丢帧前所接收到的最后一个帧为清音帧,且所述连续丢帧数小于或等于3,则确定所述子帧增益梯度,使得所述子帧增益梯度小于或等于预设的第二阈值且大于0。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810203241.4A CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810203241.4A CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
CN201310297740.1A CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310297740.1A Division CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108364657A CN108364657A (zh) | 2018-08-03 |
CN108364657B true CN108364657B (zh) | 2020-10-30 |
Family
ID=52320649
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810203241.4A Active CN108364657B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
CN201310297740.1A Active CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310297740.1A Active CN104301064B (zh) | 2013-07-16 | 2013-07-16 | 处理丢失帧的方法和解码器 |
Country Status (8)
Country | Link |
---|---|
US (2) | US10068578B2 (zh) |
EP (3) | EP2988445B1 (zh) |
JP (1) | JP6264673B2 (zh) |
KR (1) | KR101807683B1 (zh) |
CN (2) | CN108364657B (zh) |
DE (1) | DE202014011512U1 (zh) |
ES (1) | ES2738885T3 (zh) |
WO (1) | WO2015007076A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364657B (zh) * | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
US10998922B2 (en) * | 2017-07-28 | 2021-05-04 | Mitsubishi Electric Research Laboratories, Inc. | Turbo product polar coding with hard decision cleaning |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1516113A (zh) * | 2000-07-14 | 2004-07-28 | ���ο�ɭ��ϵͳ��˾ | 处理丢失帧的语音通信系统及方法 |
CN101361112A (zh) * | 2006-08-15 | 2009-02-04 | 美国博通公司 | 隐藏丢包后解码器状态的更新 |
CN102014286A (zh) * | 2010-12-21 | 2011-04-13 | 广东威创视讯科技股份有限公司 | 一种视频编解码方法及装置 |
CN102308333A (zh) * | 2009-02-04 | 2012-01-04 | 摩托罗拉移动公司 | 修改的离散余弦变换音频编码器的带宽扩展方法和装置 |
CN103098127A (zh) * | 2010-09-13 | 2013-05-08 | 高通股份有限公司 | 译码及解码瞬时帧 |
CN104301064A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
Family Cites Families (91)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5450449A (en) | 1994-03-14 | 1995-09-12 | At&T Ipm Corp. | Linear prediction coefficient generation during frame erasure or packet loss |
US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JP3616432B2 (ja) | 1995-07-27 | 2005-02-02 | 日本電気株式会社 | 音声符号化装置 |
JP3308783B2 (ja) * | 1995-11-10 | 2002-07-29 | 日本電気株式会社 | 音声復号化装置 |
US5819217A (en) | 1995-12-21 | 1998-10-06 | Nynex Science & Technology, Inc. | Method and system for differentiating between speech and noise |
FR2765715B1 (fr) | 1997-07-04 | 1999-09-17 | Sextant Avionique | Procede de recherche d'un modele de bruit dans des signaux sonores bruites |
FR2774827B1 (fr) | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
US6260010B1 (en) | 1998-08-24 | 2001-07-10 | Conexant Systems, Inc. | Speech encoder using gain normalization that combines open and closed loop gains |
AU4201100A (en) | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system |
JP2000305599A (ja) | 1999-04-22 | 2000-11-02 | Sony Corp | 音声合成装置及び方法、電話装置並びにプログラム提供媒体 |
US6604070B1 (en) | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6574593B1 (en) | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
ATE319162T1 (de) | 2001-01-19 | 2006-03-15 | Koninkl Philips Electronics Nv | Breitband-signalübertragungssystem |
SE521693C3 (sv) | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
CN1235192C (zh) | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US7457757B1 (en) | 2002-05-30 | 2008-11-25 | Plantronics, Inc. | Intelligibility control for speech communications systems |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
AU2002309146A1 (en) | 2002-06-14 | 2003-12-31 | Nokia Corporation | Enhanced error concealment for spatial audio |
EP1543307B1 (en) | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
US20040064308A1 (en) | 2002-09-30 | 2004-04-01 | Intel Corporation | Method and apparatus for speech packet loss recovery |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
KR100501930B1 (ko) | 2002-11-29 | 2005-07-18 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
EP1775717B1 (en) * | 2004-07-20 | 2013-09-11 | Panasonic Corporation | Speech decoding apparatus and compensation frame generation method |
KR20070084002A (ko) | 2004-11-05 | 2007-08-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 복호화 장치 및 스케일러블 부호화 장치 |
WO2006098274A1 (ja) | 2005-03-14 | 2006-09-21 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル復号化方法 |
TWI317933B (en) | 2005-04-22 | 2009-12-01 | Qualcomm Inc | Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same |
US20060262851A1 (en) | 2005-05-19 | 2006-11-23 | Celtro Ltd. | Method and system for efficient transmission of communication traffic |
EP1727131A2 (en) | 2005-05-26 | 2006-11-29 | Yamaha Hatsudoki Kabushiki Kaisha | Noise cancellation helmet, motor vehicle system including the noise cancellation helmet and method of canceling noise in helmet |
US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
EP1898397B1 (en) | 2005-06-29 | 2009-10-21 | Panasonic Corporation | Scalable decoder and disappeared data interpolating method |
US7734462B2 (en) | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN100571314C (zh) | 2006-04-18 | 2009-12-16 | 华为技术有限公司 | 对丢失的语音业务数据帧进行补偿的方法 |
CN1983909B (zh) * | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
TWI343560B (en) | 2006-07-31 | 2011-06-11 | Qualcomm Inc | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US8374857B2 (en) * | 2006-08-08 | 2013-02-12 | Stmicroelectronics Asia Pacific Pte, Ltd. | Estimating rate controlling parameters in perceptual audio encoders |
KR101008508B1 (ko) * | 2006-08-15 | 2011-01-17 | 브로드콤 코포레이션 | 패킷 손실 후의 디코더 상태의 리페이징 |
JP5224666B2 (ja) | 2006-09-08 | 2013-07-03 | 株式会社東芝 | オーディオ符号化装置 |
JP4827675B2 (ja) | 2006-09-25 | 2011-11-30 | 三洋電機株式会社 | 低周波帯域音声復元装置、音声信号処理装置および録音機器 |
CN101155140A (zh) | 2006-10-01 | 2008-04-02 | 华为技术有限公司 | 音频流错误隐藏的方法、装置和系统 |
DK2102619T3 (en) | 2006-10-24 | 2017-05-15 | Voiceage Corp | METHOD AND DEVICE FOR CODING TRANSITION FRAMEWORK IN SPEECH SIGNALS |
CN103383846B (zh) * | 2006-12-26 | 2016-08-10 | 华为技术有限公司 | 改进语音丢包修补质量的语音编码方法 |
US8010351B2 (en) | 2006-12-26 | 2011-08-30 | Yang Gao | Speech coding system to improve packet loss concealment |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
CN101321033B (zh) | 2007-06-10 | 2011-08-10 | 华为技术有限公司 | 帧补偿方法及系统 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
CN101325537B (zh) | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
US8990073B2 (en) | 2007-06-22 | 2015-03-24 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8185388B2 (en) | 2007-07-30 | 2012-05-22 | Huawei Technologies Co., Ltd. | Apparatus for improving packet loss, frame erasure, or jitter concealment |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN101335003B (zh) | 2007-09-28 | 2010-07-07 | 华为技术有限公司 | 噪声生成装置、及方法 |
CN101207665B (zh) | 2007-11-05 | 2010-12-08 | 华为技术有限公司 | 一种衰减因子的获取方法 |
KR101235830B1 (ko) | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
US8180064B1 (en) | 2007-12-21 | 2012-05-15 | Audience, Inc. | System and method for providing voice equalization |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
CN101588341B (zh) * | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
EP2410522B1 (en) | 2008-07-11 | 2017-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, method for encoding an audio signal and computer program |
US8718804B2 (en) | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
JP5764488B2 (ja) | 2009-05-26 | 2015-08-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 復号装置及び復号方法 |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
GB0919673D0 (en) | 2009-11-10 | 2009-12-23 | Skype Ltd | Gain control for an audio signal |
WO2011141772A1 (en) | 2010-05-12 | 2011-11-17 | Nokia Corporation | Method and apparatus for processing an audio signal based on an estimated loudness |
US8744091B2 (en) | 2010-11-12 | 2014-06-03 | Apple Inc. | Intelligibility control using ambient noise detection |
WO2012070370A1 (ja) | 2010-11-22 | 2012-05-31 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置、方法およびプログラム、並びに、音声復号装置、方法およびプログラム |
TWI484479B (zh) | 2011-02-14 | 2015-05-11 | Fraunhofer Ges Forschung | 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法 |
CA2821577C (en) | 2011-02-15 | 2020-03-24 | Voiceage Corporation | Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec |
CN103443856B (zh) | 2011-03-04 | 2015-09-09 | 瑞典爱立信有限公司 | 音频编码中的后量化增益校正 |
CN102915737B (zh) * | 2011-07-31 | 2018-01-19 | 中兴通讯股份有限公司 | 一种浊音起始帧后丢帧的补偿方法和装置 |
EP2772910B1 (en) | 2011-10-24 | 2019-06-19 | ZTE Corporation | Frame loss compensation method and apparatus for voice frame signal |
EP2798631B1 (en) | 2011-12-21 | 2016-03-23 | Huawei Technologies Co., Ltd. | Adaptively encoding pitch lag for voiced speech |
CN105469805B (zh) | 2012-03-01 | 2018-01-12 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
CN102833037B (zh) | 2012-07-18 | 2015-04-29 | 华为技术有限公司 | 一种语音数据丢包的补偿方法及装置 |
US9633662B2 (en) | 2012-09-13 | 2017-04-25 | Lg Electronics Inc. | Frame loss recovering method, and audio decoding method and device using same |
CN104885149B (zh) | 2012-09-24 | 2017-11-17 | 三星电子株式会社 | 用于隐藏帧错误的方法和设备以及用于对音频进行解码的方法和设备 |
US9123328B2 (en) | 2012-09-26 | 2015-09-01 | Google Technology Holdings LLC | Apparatus and method for audio frame loss recovery |
CN103854649B (zh) | 2012-11-29 | 2018-08-28 | 中兴通讯股份有限公司 | 一种变换域的丢帧补偿方法及装置 |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
US9711156B2 (en) | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
US9208775B2 (en) | 2013-02-21 | 2015-12-08 | Qualcomm Incorporated | Systems and methods for determining pitch pulse period signal boundaries |
US20150170655A1 (en) | 2013-12-15 | 2015-06-18 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
JP6318621B2 (ja) | 2014-01-06 | 2018-05-09 | 株式会社デンソー | 音声処理装置、音声処理システム、音声処理方法、音声処理プログラム |
US9697843B2 (en) | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2013
- 2013-07-16 CN CN201810203241.4A patent/CN108364657B/zh active Active
- 2013-07-16 CN CN201310297740.1A patent/CN104301064B/zh active Active
-
2014
- 2014-01-07 EP EP14825749.6A patent/EP2988445B1/en active Active
- 2014-01-07 JP JP2016526411A patent/JP6264673B2/ja active Active
- 2014-01-07 EP EP19163032.6A patent/EP3595211B1/en active Active
- 2014-01-07 DE DE202014011512.5U patent/DE202014011512U1/de not_active Expired - Lifetime
- 2014-01-07 WO PCT/CN2014/070199 patent/WO2015007076A1/zh active Application Filing
- 2014-01-07 KR KR1020157033976A patent/KR101807683B1/ko active IP Right Grant
- 2014-01-07 EP EP24158654.4A patent/EP4350694A2/en active Pending
- 2014-01-07 ES ES14825749T patent/ES2738885T3/es active Active
-
2015
- 2015-12-29 US US14/981,956 patent/US10068578B2/en active Active
-
2018
- 2018-07-24 US US16/043,880 patent/US10614817B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1516113A (zh) * | 2000-07-14 | 2004-07-28 | ���ο�ɭ��ϵͳ��˾ | 处理丢失帧的语音通信系统及方法 |
CN101361112A (zh) * | 2006-08-15 | 2009-02-04 | 美国博通公司 | 隐藏丢包后解码器状态的更新 |
CN102308333A (zh) * | 2009-02-04 | 2012-01-04 | 摩托罗拉移动公司 | 修改的离散余弦变换音频编码器的带宽扩展方法和装置 |
CN103098127A (zh) * | 2010-09-13 | 2013-05-08 | 高通股份有限公司 | 译码及解码瞬时帧 |
CN102014286A (zh) * | 2010-12-21 | 2011-04-13 | 广东威创视讯科技股份有限公司 | 一种视频编解码方法及装置 |
CN104301064A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
Non-Patent Citations (3)
Title |
---|
Enhanced Variable Rate Codec, Speech Service Options 3,68,70,73 and 77 for Wideband Spread Spectrum Digital Systems;3GPP2 STANDARD;《3RD GENERATION PARTNERSHIP PROJECT 2》;20120103;第1-358页 * |
France Telecom G729EV Candidate:High level description and complexity evaluation;INTERNATIONAL TELECOMMUNICATION UNION;《ITU-T DRAFT》;20060503;第1-12页 * |
基于ACELP和TCX的嵌入式宽带语音编码器;贾懋珅 等;《清华大学学报(自然科学版)》;20080415;第48卷(第S1期);第741-747页 * |
Also Published As
Publication number | Publication date |
---|---|
EP2988445A4 (en) | 2016-05-11 |
CN108364657A (zh) | 2018-08-03 |
EP3595211A1 (en) | 2020-01-15 |
JP6264673B2 (ja) | 2018-01-24 |
US10614817B2 (en) | 2020-04-07 |
DE202014011512U1 (de) | 2021-09-06 |
JP2016529542A (ja) | 2016-09-23 |
CN104301064A (zh) | 2015-01-21 |
CN104301064B (zh) | 2018-05-04 |
US20160118054A1 (en) | 2016-04-28 |
ES2738885T3 (es) | 2020-01-27 |
EP2988445B1 (en) | 2019-06-05 |
KR101807683B1 (ko) | 2017-12-11 |
KR20160005069A (ko) | 2016-01-13 |
EP2988445A1 (en) | 2016-02-24 |
US10068578B2 (en) | 2018-09-04 |
EP3595211B1 (en) | 2024-02-21 |
EP4350694A2 (en) | 2024-04-10 |
US20180330738A1 (en) | 2018-11-15 |
WO2015007076A1 (zh) | 2015-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6558745B2 (ja) | 符号化/復号化方法および符号化/復号化デバイス | |
JP6364518B2 (ja) | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 | |
JP6616470B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
US20140214413A1 (en) | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding | |
CN107818789B (zh) | 解码方法和解码装置 | |
JP7144499B2 (ja) | 信号処理方法及び装置 | |
CN106683681B (zh) | 处理丢失帧的方法和装置 | |
CN108364657B (zh) | 处理丢失帧的方法和解码器 | |
EP3109861B1 (en) | Signal classifying method and device, and audio encoding method and device using same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200721 Address after: Houston, USA Applicant after: Chaoqing codec Co., Ltd Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Applicant before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |