CN104025191A - 用于自适应多速率编解码器的改进方法和设备 - Google Patents

用于自适应多速率编解码器的改进方法和设备 Download PDF

Info

Publication number
CN104025191A
CN104025191A CN201180074240.0A CN201180074240A CN104025191A CN 104025191 A CN104025191 A CN 104025191A CN 201180074240 A CN201180074240 A CN 201180074240A CN 104025191 A CN104025191 A CN 104025191A
Authority
CN
China
Prior art keywords
sample
prediction
equipment
current sample
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201180074240.0A
Other languages
English (en)
Inventor
S.布鲁恩
J.邝
J.王
C.张
S.赵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ericsson China Communications Co Ltd
Original Assignee
Ericsson China Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson China Communications Co Ltd filed Critical Ericsson China Communications Co Ltd
Publication of CN104025191A publication Critical patent/CN104025191A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供用于对语音信号进行编码的设备和方法。编码包括:接收语音信号的多个当前样本;从当前样本外推多个前瞻样本;以及使用当前样本和外推的前瞻样本来执行线性预测分析。

Description

用于自适应多速率编解码器的改进方法和设备
 
技术领域
本申请涉及对语音信号进行编码的方法、用于对语音信号进行编码的设备以及计算机可读介质。
背景技术
许多语音编解码器采用代码激励线性预测(CELP)的框架。CELP要求使用线性预测(LP)分析。在一些语音编解码器中,在当前帧的LP分析期间利用下一帧中的语音样本。来自下一帧的所涉及样本称作前瞻样本。因为编码器必须等待前瞻样本被创建并且到达处理器,所以在当前样本的编码之前,前瞻过程固有地创建至少与前瞻样本跨越的时间期(其称作前瞻期)同样长的延迟。 
例如,自适应多速率(AMR)编码模式的编码方案是代数代码激励线性预测(ACELP)。  
AMR窄带(AMR-NB)的取样率为每秒8000个样本。编码比特率取决于模式。当前使用的编码模式为:4.75、5.15、5.90、6.70、7.40、7.95、10.2和12.2千比特/秒。在AMR-NB中,短期过滤系数使用每帧的分析窗口内的高通过滤语音样本计算。分析窗口的长度为240个样本。 
在12.2千比特/秒模式中,两个不对称窗口用来生成每帧的两组LP系数。没有使用下一帧的样本(不存在前瞻)。在其它模式中,只有单个不对称窗口用来生成单组LP系数,并且这个窗口具有40样本前瞻,其意味着5 ms前瞻期。
在AMR宽带(AMR-WB)中,取样率为每秒16000个样本,但是处理速率降低到每秒12800个样本。编码比特率取决于模式。当前使用的编码模式为6.60、8.85、12.65、14.25、15.85、18.25、19.85、23.05和23.85千比特/秒。在AMR-WB中,分析窗口的长度为384个样本。对于所有模式,单个不对称窗口用来生成单组LP系数。这个窗口具有64样本前瞻,其要求在每秒12800个样本的处理速率下的5 ms前瞻期。
在上述示例中使用包括一些前瞻样本的窗口,因为与没有前瞻的窗口相比,所产生的编码语音的质量得到显著改进。 
在AMR-NB的LP模型中,在对帧(当前帧)进行编码时,必须分析随后的帧的前40个样本。类似地,在AMR-WB的LP模型中,在对当前帧进行编码时,必须检查下一帧的前64个样本。在两种情况下,前瞻期均为5 ms。这个前瞻期引起延迟,其增加总传送延迟。这类延迟使语音通信的服务质量降级,并且可降低系统容量。
因此,5 ms的前瞻期是编码语音质量与传送延迟之间的折衷。需要用于AMR编解码器以及用于一般使用前瞻样本的编解码器的改进方法和设备。
在3GPP技术规范26.090 v10.0.0中描述了AMR语音编解码器和转码功能,其通过引用结合到本文中。在3GPP TS 26.190 v 10.0.0中描述了自适应多速率宽带(AMR-WB)语音编解码器和相应转码功能,其通过引用结合到本文中。AMR的进一步描述能够见于Information Technology:Coding and Computing (ITCC),2004中发表的J.Makinen和J.Vainio的“Source signal based rate adaptation for GSM AMR speech codec”,其通过引用结合到本文中。关于线性预测的更多信息能够见于在IEEE ICASSP,Hong Kong,2003年4月中发表的W.C.Chu的“Gradient-Descent Based Window Optimization for Linear Prediction Analysis”,其通过引用结合到本文中。关于用于取样的窗口的更多信息能够见于在IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING,VOL. 11,NO. 6,2003年11月中发表的Wai C. Chu的“Window Optimization in Linear Prediction Analysis”。
发明内容
本文所述的方法和设备提供一种跳过前瞻期从而改进传送系统上的服务质量,而没有显著影响编码语音的质量的方式。这通过使用仍然要求前瞻样本的线性预测的取样窗口进行,而不是等待前瞻样本被创建并且到达处理器,前瞻样本从当前可用样本外推。外推样本替代线性预测分析中的前瞻样本。
已经发现本文所提供的方法和设备提供在使用不具有前瞻的取样窗口的系统上的显著改进的编码语音质量。
##权利要求## 采用斜体文本。
附图说明
现在将仅通过示例的方式参考附图来描述用于AMR编解码器以及一般使用前瞻样本的编解码器的改进方法和设备,其中:
图1是典型AMR编码器中使用的原始线性预测(LP)分析模型的流程图;
图2是示出可在线性预测分析的加窗和自相关过程中使用的窗口的图;
图3是本文提出的线性预测(LP)分析方法的流程图;
图4是本文所公开的方法的流程图,其中自相关用来从所接收的样本外推前瞻样本;
图5是本文所公开的方法的流程图,其中协方差用来从所接收的样本外推前瞻样本;
图6示出用于实现本文所述方法的设备;以及
图7示出在图6的设备中实现的方法。
具体实施方式
图1是典型AMR编码器中使用的原始线性预测(LP)分析模型的流程图。在110,接收输入语音信号,其经过预处理和取样。在预处理之后,在140,语音样本被加窗以计算自相关系数R[ ]。然后,在150,通过应用Levinson-Durbin算法并且使用自相关系数R[ ]来计算LP系数α_tmp。然后,在160,将LP系数α_tmp转换成线谱对(LSP)域用于量化和内插。
随后并且图1中未示出,内插量化的和未量化的过滤系数被转换回LP过滤系数(以便在每个子帧构造合成和加权过滤器)。在AMR-NB中,一个帧由160个样本组成并且因此具有20 ms的持续时间。每个帧由40个样本和持续时间5 ms的4个子帧组成。
图2示出图201,图201示出在线性预测分析的加窗和自相关过程中可使用的窗口的样本数量202与窗口权重203之间的关系。所示窗口是在较低比特率模式(除了12.2千比特/秒之外的所有模式)的AMR-NB中使用的窗口,并且在3GPP TS 26.090 v 10.0.0的第5.2.1节中描述。窗口跨越在编号为n-1(210)、n(220)、n+1(230)的3个帧上编号为0至239的240个样本。帧n 220是当前帧。每个帧由160个样本组成并且具有持续时间20 ms。每个帧由各具有40个样本和持续时间5 ms的4个子帧222组成。窗口使用来自当前帧220的样本、来自在前帧210的最后一个子帧的样本以及来自随后的帧230的第一子帧的样本。
图3是本文提出的线性预测(LP)分析方法的流程图。在310,接收输入语音信号,其经过预处理和取样。在预处理之后,在320,外推用来从所接收的样本得出前瞻样本。在332,尚未到达的原始前瞻样本由在320所产生的外推的前瞻样本替代。然后,LP分析可使用外推的前瞻样本继续进行,开始于340,其中适当的接收的和外推的语音样本被加窗以计算自相关系数R[ ]。然后,在350,通过应用Levinson-Durbin算法并且使用自相关系数R[ ]来计算LP系数α_tmp。然后,在360,将LP系数α_tmp转换成线谱对(LSP)域用于量化和内插。
按照AMR-NB算法,各子帧由40个样本组成,并且除了12.2千比特/秒模式之外的所有模式的前瞻为40个样本。因此,当本文所公开的方法应用于使用AMR-NB的系统时,40个前瞻样本从所接收的样本外推供线性预测分析中使用。这些外推的样本替代来自原始方法中使用的下一帧的样本,并且因此消除由等待这些所引起的5 ms延迟。
类似地,按照AMR-WB算法,各子帧为64个样本,并且线性预测分析的前瞻包括样本的一个子帧。因此,当本文所公开的方法应用于使用AMR-WB的系统时,64个前瞻样本从所接收的样本外推以供线性预测分析中使用。这些外推的样本替代来自原始方法中使用的下一帧的样本,并且因此消除由等待这些所引起的5 ms延迟。
图4是本文所公开方法的流程图,其中自相关用来从所接收的样本外推前瞻样本。在410,接收输入语音信号,其经过预处理和取样。在预处理之后,前瞻样本的外推在421以自相关和加窗开始。在421,自相关使用没有前瞻的窗口;该窗口仅包含当前帧的样本以及先前帧的最后两个子帧的样本。在421,对于由窗口所识别的样本计算自相关系数R[ ]。然后,在427,通过应用Levinson-Durbin算法并且使用自相关系数R[ ]来计算LP系数α_tmp。然后,LP系数α_tmp用来在428使用图4的框428中所示的公式来计算外推的前瞻样本s[n]。  
在432,尚未接收的原始(或者“现实世界”)前瞻样本由在428所计算的外推的前瞻样本替代。然后,语音编码的LP分析可使用所接收的样本以及外推的前瞻样本(代替原始前瞻样本)继续进行。语音编码的LP分析开始于440,其中适当的当前样本和外推样本被加窗,并且计算所选择的样本的自相关系数R[ ]。然后,在450,通过应用Levinson-Durbin算法并且使用自相关系数R[]来计算这些样本的LP系数α_tmp。然后,在460,将LP系数α_tmp转换成线谱对(LSP)域用于量化和内插。然后,编码过程如上面描述的继续进行。
图5是本文所公开方法的流程图,其中协方差用来从所接收的样本外推前瞻样本。在510,接收输入语音信号,其经过预处理和取样。在预处理之后,前瞻样本的外推在522以协方差方法开始。在522,协方差使用无前瞻的窗口;该窗口仅包含当前帧的样本。在522,LU分解用来计算LP系数α_tmp。然后,LP系数α_tmp用来在528使用图5的框528中所示的公式来计算外推的前瞻样本s[n]。外推的前瞻样本的数量取决于LP分析的窗口。线性预测分析所需的样本的至少一些从所接收的样本外推。
在532,尚未接收的原始(或者“现实世界”)前瞻样本由在528所计算的外推的前瞻样本替代。然后,语音编码的LP分析可使用所接收的样本以及外推的前瞻样本(代替原始前瞻样本)继续进行。语音编码的LP分析开始于540,其中适当的当前样本和外推的样本被加窗,并且计算所选择的样本的自相关系数R[ ]。然后,在550,通过应用Levinson-Durbin算法并且使用自相关系数R[]来计算这些样本的LP系数α_tmp。然后,在560,将LP系数α_tmp转换成线谱对(LSP)域用于量化和内插。然后,编码过程如上面描述的继续进行。
图6示出用于实现本文所述方法的设备。该设备包括接收器610以及外推器620和编码器630。接收器610接收语音信号。接收器610执行预处理以创建多个样本。外推器620接收样本并且将外推方法应用于所接收的样本以创建外推的前瞻样本。然后编码器630逐帧对语音样本进行编码。作为编码过程的一部分,处理器620使用线性预测分析,具有关联的样本的至少一个窗口。在窗口包括前瞻样本的情况下,按常规来自随后的帧,外推的前瞻样本用来替代它们。
图6的设备中实现的通用方法在图7中示出。在710,接收语音样本。语音样本产生于输入语音信号的预处理。在720,前瞻样本从所接收的样本外推。外推可包括应用自相关方法、协方差方法或另一种外推方法。在730,对当前语音样本进行编码。编码使用所接收的语音样本以及外推的语音样本以执行关于语音样本的当前帧的线性预测分析。  
线性预测分析给出LP系数,其转换成线谱对(LSP)域用于量化和内插。随后,内插的量化和未量化的过滤系数转换回LP过滤系数(以便在各子帧构造合成和加权过滤器)。 
按照一些实施例,所有前瞻样本由从所接收的样本外推的外推样本替代。上述方法可同样适用于前瞻样本的一部分。例如,编码器可等待接收来自输入语音信号的前瞻样本的前一半,以及外推样本以替代后一半。在这个示例中,前瞻延迟减少一半。更一般地,前瞻延迟减少从所接收的样本外推的样本的部分。外推用来计算所需的前瞻样本的后面的部分。即,当已经接收到第一部分时还未接收到的那些。
已经发现,使用外推来跳过某个前瞻的上述方法对于AMR语音编解码器能够减少5 ms前瞻延迟,并且获得的语音质量接近于常规方法的语音质量。
对本领域技术人员将显而易见的是,在本文所述方法中实施的动作的确切顺序和内容可按照执行参数的特定集合的要求来改变。因此,描述和/或要求保护的动作所按照的顺序不是要被理解为对执行动作所按照的顺序的严格限制。
此外,虽然在特定通信标准的上下文中给出了示例,但是这些示例不是意在作为对所公开的方法和设备可适用的通信标准的限制。例如,虽然在AMR语音编码的上下文中给出了具体示例,但是本文所公开的原理也能够适用于使用前瞻样本作为编码过程的一部分的任何语音编码系统。

Claims (22)

  1. 斜体文本仅用于发明内容部分
    1.一种对语音信号进行编码的方法,所述方法包括:
    接收所述语音信号的多个当前样本;
    从所述当前样本外推多个前瞻样本;以及
    使用所述当前样本和外推的前瞻样本来执行线性预测分析。
  2. 2.如权利要求1所述的方法,还包括:
    接收语音信号;以及
    预处理所述语音信号以创建当前样本。
  3. 3.如权利要求1或2所述的方法,其中所述线性预测分析用来为多个子帧中的每个构造线性预测过滤器。
  4. 4.如权利要求1、2或3所述的方法,其中使用自相关方法来执行所述线性预测分析。
    这个部分指图5的上半部,其中使用自相关来计算所述前瞻样本。
  5. 5.如权利要求1至4中的任一项所述的方法,其中前瞻样本的所述外推使用自相关方法。
  6. 6.如权利要求5所述的方法,其中使用自相关方法的前瞻样本的所述外推包括从多个当前样本计算自相关。
  7. 7.如权利要求5或6所述的方法,其中窗口用来确定用于执行所述自相关的所述当前样本。
    这个部分指图6的上半部,其中使用协方差来计算所述前瞻样本。
  8. 8.如权利要求1至4中的任一项所述的方法,其中,前瞻样本的所述外推使用协方差方法。
  9. 9.如权利要求8所述的方法,其中使用协方差方法的前瞻样本的所述外推包括从多个当前样本计算协方差。
  10. 10.如权利要求8或9所述的方法,其中预定的样本长度用来确定对其应用所述协方差方法的所述当前样本。
  11. 11.一种对语音信号进行编码的方法,所述方法包括使用前瞻值用于线性预测分析,所述方法特征在于所述前瞻样本从当前样本外推。
  12. 12.一种用于对语音信号进行编码的设备,所述设备包括:
    接收器,布置成接收所述语音信号的多个当前样本;
    外推器,布置成从所述当前样本外推多个前瞻样本;以及
    编码器,布置成使用所述当前样本和外推的前瞻样本来执行线性预测分析。
  13. 13.如权利要求12所述的设备,其中所述处理器还布置成使用所述线性预测分析来为多个子帧中的每个构造线性预测过滤器。
  14. 14.如权利要求12或13所述的设备,其中所述处理器布置成使用自相关方法来执行所述线性预测分析。
  15. 15.如权利要求12至14中的任一项所述的设备,其中所述处理器还布置成使用自相关方法来生成用来外推所述多个前瞻样本的过滤器。
  16. 16.如权利要求15所述的设备,其中处理器还布置成从多个当前样本计算自相关。
  17. 17.如权利要求15或16所述的设备,其中所述处理器布置成使用窗口来确定对其应用所述自相关方法的所述当前样本。
  18. 18.如权利要求12至14中的任一项所述的设备,其中所述处理器还布置成使用协方差方法来外推所述多个前瞻样本。
  19. 19.如权利要求18所述的设备,其中所述处理器还布置成从多个当前样本计算协方差。
  20. 20.如权利要求18或19所述的设备,其中所述处理器布置成将预定数量的当前样本用于所述协方差方法。
  21. 21.一种用于对语音信号进行编码的设备,所述设备包括布置成将前瞻值用于线性预测分析的处理器,所述设备特征在于所述处理器还布置成从多个当前样本外推所述前瞻样本。
  22. 22.一种携带指令的计算机可读介质,所述指令在由计算机逻辑执行时促使所述计算机逻辑执行由权利要求1至11限定的方法中的任一方法。
CN201180074240.0A 2011-10-18 2011-10-18 用于自适应多速率编解码器的改进方法和设备 Pending CN104025191A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/001730 WO2013056388A1 (en) 2011-10-18 2011-10-18 An improved method and apparatus for adaptive multi rate codec

Publications (1)

Publication Number Publication Date
CN104025191A true CN104025191A (zh) 2014-09-03

Family

ID=48086574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180074240.0A Pending CN104025191A (zh) 2011-10-18 2011-10-18 用于自适应多速率编解码器的改进方法和设备

Country Status (4)

Country Link
US (1) US20130096913A1 (zh)
EP (1) EP2761616A4 (zh)
CN (1) CN104025191A (zh)
WO (1) WO2013056388A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106031038A (zh) * 2013-12-20 2016-10-12 奥兰治 根据帧对由可变采样频率中断的音频信号进行重采样

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1050633A (zh) * 1989-09-01 1991-04-10 莫托罗拉公司 具有改进的子样求解长期预测器的数字化语言编码器
CN101089951A (zh) * 2006-06-16 2007-12-19 徐光锁 频带扩展编码方法及装置和解码方法及装置
CN101395661A (zh) * 2006-03-07 2009-03-25 艾利森电话股份有限公司 音频编码和解码的方法和设备
CN101523486A (zh) * 2006-10-10 2009-09-02 高通股份有限公司 用于编码和解码音频信号的方法和设备
CN101609678A (zh) * 2008-12-30 2009-12-23 华为技术有限公司 信号压缩方法及其压缩装置
US20100174547A1 (en) * 2009-01-06 2010-07-08 Skype Limited Speech coding

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6125348A (en) * 1998-03-12 2000-09-26 Liquid Audio Inc. Lossless data compression with low complexity
SE519563C2 (sv) * 1998-09-16 2003-03-11 Ericsson Telefon Ab L M Förfarande och kodare för linjär prediktiv analys-genom- synteskodning
US6564182B1 (en) * 2000-05-12 2003-05-13 Conexant Systems, Inc. Look-ahead pitch determination
EP1199711A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
US7930181B1 (en) * 2002-09-18 2011-04-19 At&T Intellectual Property Ii, L.P. Low latency real-time speech transcription
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7630892B2 (en) * 2004-09-10 2009-12-08 Microsoft Corporation Method and apparatus for transducer-based text normalization and inverse text normalization
CN101366082B (zh) * 2006-02-06 2012-10-03 艾利森电话股份有限公司 可变帧偏移编解码方法、编解码器及无线电通信设备
US20080103765A1 (en) * 2006-11-01 2008-05-01 Nokia Corporation Encoder Delay Adjustment
JP5097219B2 (ja) * 2007-03-02 2012-12-12 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 非因果性ポストフィルタ
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
US20090319263A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US20090319261A1 (en) * 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
US8332213B2 (en) * 2008-07-10 2012-12-11 Voiceage Corporation Multi-reference LPC filter quantization and inverse quantization device and method

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1050633A (zh) * 1989-09-01 1991-04-10 莫托罗拉公司 具有改进的子样求解长期预测器的数字化语言编码器
CN101395661A (zh) * 2006-03-07 2009-03-25 艾利森电话股份有限公司 音频编码和解码的方法和设备
CN101089951A (zh) * 2006-06-16 2007-12-19 徐光锁 频带扩展编码方法及装置和解码方法及装置
CN101523486A (zh) * 2006-10-10 2009-09-02 高通股份有限公司 用于编码和解码音频信号的方法和设备
CN101609678A (zh) * 2008-12-30 2009-12-23 华为技术有限公司 信号压缩方法及其压缩装置
US20100174547A1 (en) * 2009-01-06 2010-07-08 Skype Limited Speech coding

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106031038A (zh) * 2013-12-20 2016-10-12 奥兰治 根据帧对由可变采样频率中断的音频信号进行重采样
CN106031038B (zh) * 2013-12-20 2018-09-28 奥兰治 根据帧对由可变采样频率中断的音频信号进行重采样

Also Published As

Publication number Publication date
EP2761616A1 (en) 2014-08-06
EP2761616A4 (en) 2015-06-24
US20130096913A1 (en) 2013-04-18
WO2013056388A1 (en) 2013-04-25

Similar Documents

Publication Publication Date Title
CN101996636B (zh) 带多级码本和冗余编码的子带话音编解码器
CN1820306B (zh) 可变比特率宽带语音编码中增益量化的方法和装置
RU2680352C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов
US11521631B2 (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm
CN103493129B (zh) 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
US20110119054A1 (en) Apparatus for encoding and decoding of integrated speech and audio
CN1655236A (zh) 用于预测量化有声语音的方法和设备
CN104025189A (zh) 编码语音信号的方法、解码语音信号的方法,及使用其的装置
CN103069483B (zh) 编码装置以及编码方法
JP2016504637A5 (zh)
CN103915097B (zh) 一种语音信号处理方法、装置和系统
JP2019135551A (ja) オーディオ信号の時間包絡線を処理するための方法および装置、ならびにエンコーダ
CN104025191A (zh) 用于自适应多速率编解码器的改进方法和设备
CN101572093B (zh) 一种转码方法和装置
CN106463140B (zh) 具有语音信息的改进型帧丢失矫正
CN109427338B (zh) 立体声信号的编码方法和编码装置
EP3252758B1 (en) Encoding apparatus, decoding apparatus, and methods, programs and recording media for encoding apparatus and decoding apparatus
CN101582263B (zh) 语音解码中噪音增强后处理的方法和装置
CN101197134A (zh) 消除编码模式切换影响的方法和装置以及解码方法和装置
US20100179807A1 (en) Audio encoding device and audio encoding method
KR101807683B1 (ko) 손실 프레임을 처리하는 방법, 및 디코더
CN101609682B (zh) 自适应多速率宽带不连续发送的一种编码器和方法
CN101266798A (zh) 一种在语音解码器中进行增益平滑的方法及装置
FR2869151B1 (fr) Procede de quantification d'un codeur de parole a tres bas debit
JPH09120300A (ja) ベクトル量子化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140903

WD01 Invention patent application deemed withdrawn after publication