CN1989548A - 语音解码装置及补偿帧生成方法 - Google Patents

语音解码装置及补偿帧生成方法 Download PDF

Info

Publication number
CN1989548A
CN1989548A CNA2005800244876A CN200580024487A CN1989548A CN 1989548 A CN1989548 A CN 1989548A CN A2005800244876 A CNA2005800244876 A CN A2005800244876A CN 200580024487 A CN200580024487 A CN 200580024487A CN 1989548 A CN1989548 A CN 1989548A
Authority
CN
China
Prior art keywords
gain
acb
vector
signal
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800244876A
Other languages
English (en)
Other versions
CN1989548B (zh
Inventor
江原宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1989548A publication Critical patent/CN1989548A/zh
Application granted granted Critical
Publication of CN1989548B publication Critical patent/CN1989548B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供一种语音解码装置,在丢失补偿处理中考虑过去信号的能量变化,从而能够提高解码信号的音质。在该装置中,能量变化计算单元(143),计算由自适应码本(106)输出的ACB矢量的最后一个音调周期长度的音源信号的平均能量。此外,能量变化计算单元(143)计算当前子帧与前一子帧的平均能量之比,并输出给ACB增益生成单元(135)。ACB增益生成单元(135)由过去解码出的ACB增益或由能量变化计算单元(143)输出的能量变化率信息中的任一个所定义的用于屏蔽处理的ACB增益输出给乘法器(132)。

Description

语音解码装置及补偿帧生成方法
技术领域
本发明涉及语音解码装置及补偿帧(repaired frame)生成方法。
背景技术
在互联网等中进行的分组通信中,由于在传输路径中丢失分组等原因而没能在解码装置接收到编码信息时,一般进行该分组的丢失补偿(屏蔽)处理。
例如在语音编码领域,在ITU-T建议G.729中规定了如下帧丢失屏蔽处理(frame erasure concealment processing):(1)重复使用合成滤波器系数;(2)使音调增益和固定码本增益(FCB增益)渐渐衰减;(3)使FCB增益预测器的内部状态渐渐衰减;(4)基于前一正常帧中的有声模式/无声模式的判定结果,使用在自适应码本或固定码本中的任一个生成音源信号(例如,参见专利文献1)。
上述方式中,使用由后置滤波器进行的音调分析结果,根据音调预测增益的大小判定有声模式/无声模式,并且,例如,在前一正常帧为有声模式时,使用自适应码本生成合成滤波器的音源矢量。基于为了帧丢失补偿处理而生成的音调滞后,利用自适应码本生成ACB(自适应码本)矢量,并将其乘以为了帧丢失补偿处理而生成的音调增益,由此得到音源矢量。将在刚刚使用过的解码音调滞后进行增量后,用作为帧丢失补偿处理的音调滞后。将刚刚使用过的解码音调增益衰减一定倍数以后,用作为帧丢失补偿处理的音调增益。
专利文献1:日本专利特开平9-120298号公报
发明内容
发明要解决的问题
然而,以往的语音解码装置基于过去的音调增益决定用于帧丢失补偿处理的音调增益。但是,音调增益并不一定是反映了信号的能量变化的参数。于是,所生成的用于帧丢失补偿处理的音调增益并没有考虑到过去信号的能量变化的音调增益。而且,由于以一定比率使音调增益衰减,所以用于帧丢失补偿处理的音调增益会与过去的信号的能量变化无关地衰减。也就是说,由于没有考虑到过去信号的能量变化,而且以一定比率使音调增益衰减,所以经补偿的帧与过去的信号之间难以保持能量的连续性,从而容易产生断音感。由此,解码信号的音质恶化。
因此,本发明旨在提供一种语音解码装置及补偿帧生成方法,在丢失补偿处理中考虑过去信号的能量变化,从而能够提高解码信号的音质。
解决问题的方案
本发明的语音解码装置的结构包括:自适应码本,生成音源信号;计算单元,计算所述音源信号的子帧之间的能量变化;决定单元,基于所述能量变化决定所述自适应码本的增益;以及生成单元,使用所述自适应码本的增益生成对于丢失帧的补偿帧。
发明效果
根据本发明,在丢失补偿处理中能够考虑过去信号的能量变化,从而能够提高解码信号的音质。
附图说明
图1是表示实施方式1所涉及的补偿帧生成单元的主要结构的方框图;
图2是表示实施方式1所涉及的噪声性附加单元内部的主要结构的方框图;
图3是表示实施方式2所涉及的语音解码装置的主要结构的方框图;
图4表示使用自适应码本和固定码本两者而生成补偿帧的例子;
图5表示以由固定码本生成的噪声性信号置换由自适应码本生成的音源中的一部分频带的例子;
图6是表示实施方式3所涉及的补偿帧生成单元的主要结构的方框图;
图7是表示实施方式3所涉及的噪声性附加单元内部的主要结构的方框图;
图8是表示实施方式3所涉及的ACB分量生成单元内部的主要结构的方框图;
图9是表示实施方式3所涉及的FCB分量生成单元内部的主要结构的方框图;
图10是表示实施方式3所涉及的丢失帧屏蔽处理单元的主要结构的方框图;
图11是表示实施方式3所涉及的模式判定单元内部的主要结构的方框图;以及
图12是表示实施方式4所涉及的无线发送装置和无线接收装置的主要结构的方框图。
具体实施方式
以下,参照附图详细说明本发明的实施方式。
(实施方式1)
本发明的实施方式1所涉及的语音解码装置对缓冲在自适应码本中的、过去生成的音源信号的能量变化进行分析,并生成自适应码本的音调增益(即自适应码本增益(ACB增益)),以便保持能量的连续性。由此,能够改善作为丢失帧的补偿帧而生成的音源矢量与过去信号之间的能量连续性,并能够保持存储在自适应码本中的信号的能量连续性。
图1是表示本发明的实施方式1所涉及的语音解码装置内部的补偿帧生成单元100的主要结构的方框图。
该补偿帧生成单元100包括:自适应码本106;矢量生成单元115;噪声性附加单元116;乘法器132;ACB增益生成单元135;以及能量变化计算单元143。
能量变化计算单元143计算由自适应码本106输出的ACB(自适应码本)矢量的最后一个音调周期长度的音源信号的平均能量。另一方面,在能量变化计算单元143的内部存储器中,存储着在前一子帧中同样地计算出的1个音调周期长度的音源信号的平均能量。于是,能量变化计算单元143计算当前子帧与前一子帧的一个周期长度的音源信号的平均能量之比。此外,该平均能量也可以是音源信号的能量的平方根或对数。能量变化计算单元143还对计算出的比值在子帧之间进行平滑处理,并将经平滑处理的比值输出给ACB增益生成单元135。
能量变化计算单元143使用在当前子帧计算出的一个音调周期长度的音源信号的能量,更新在前一子帧计算出的一个音调周期长度的音源信号的能量。例如,根据以下(式1)计算Ec。
Ec=√((∑(ACB[Lacb-i])2)/P c)             ...(式1)
(在此,ACB[0:Lacb-1]:自适应码本缓冲、
Lacb:自适应码本缓冲长度、
Pc:在当前子帧的音调周期、
Ec:在当前子帧的过去一个音调周期的音源信号的平均振幅(能量的平方根)、
i=1,2,...,Pc)
然后,能量变化计算单元143将在前一子帧计算出的Ec作为Ep存储起来,以Re=Ec/Ep计算能量变化率Re。接着,能量变化计算单元143以0.98对Re进行削波,使用譬如Sre=0.7×Sre+0.3×Re这样的算式进行平滑处理,并将平滑能量变化率Sre输出给ACB增益生成单元135。能量变化计算单元143最后使Ep=Ec,由此更新Ep。
通过如上计算能量变化而决定ACB增益,由此能够保持能量连续性。然后,使用所决定的ACB增益仅根据自适应码本生成音源,就能够生成保持了能量连续性的音源矢量。
ACB增益生成单元135在使用过去解码出的ACB增益而定义的用于屏蔽处理的ACB增益、和由能量变化计算单元143输出的能量变化率信息所定义的用于屏蔽处理的ACB增益中任意选择一个,并将最终的用于屏蔽处理的ACB增益输出给乘法器132。
在此,能量变化率信息为对由前一子帧的最后一个音调周期得到的平均振幅A(-1)和由向前两个子帧的最后1个音调周期得到的平均振幅A(-2)之比(即A(-1)/A(-2))、在子帧间进行平滑处理而得到的信息,其表示过去的解码信号的功率变化,基本上将其作为ACB增益。只是,在使用过去解码出的ACB增益所定义的用于屏蔽处理的ACB增益大于上述能量变化率信息的情况下,也可以选择使用过去解码出的ACB增益所定义的用于屏蔽处理的ACB增益作为最终的用于屏蔽处理的ACB增益。此外,在上述A(-1)/A(-2)的比值超过上限值时,以上限值进行削波。作为上限值,例如使用0.98。
矢量生成单元115根据自适应码本106生成相应的ACB矢量。
可是,上述补偿帧生成单元100不管有声性的强弱,仅根据过去的信号的能量变化来决定ACB增益。于是,虽然能够消除断音感,但有时有声性虽弱但ACB增益反而增高,此时会产生较强的蜂鸣声。
因此,本实施方式中为了得到自然的音质,具有与返回自适应码本106的反馈环路为不同系统的噪声性附加单元116,用于对由自适应码本106生成的矢量附加噪声性。
通过对由自适应码本106生成的音源矢量的特定频带分量进行噪声化处理,来进行噪声性附加单元116处的音源矢量的噪声化处理。更具体来讲,对由自适应码本106生成的音源矢量使用低通滤波器而去除高频分量,并加上具有与所去除的高频分量相同的信号能量的噪声信号。对由固定码本生成的音源矢量使用高通滤波器去除低频分量,而生成该噪声信号。低通滤波器和高通滤波器使用其阻带和通带彼此相反的完全重构滤波器组(perfectreconfiguration filter bank)或与其相应的滤波器。
根据上述结构,在将最后正常接收到的音源波形的特征存储在自适应码本106中的同时能够任意附加噪声性,从而任意加工所生成的音源矢量的特征。此外,即使对音源矢量附加噪声性,由于对附加噪声性之前的音源矢量的能量进行存储,所以不会影响到能量的连续性。
图2是表示噪声性附加单元116内部的主要结构的方框图。
该噪声性附加单元116包括:乘法器110、111;ACB分量生成单元134;FCB增益生成单元139;FCB分量生成单元141;固定码本145;矢量生成单元146以及加法器147。
ACB分量生成单元134使由矢量生成单元115输出的ACB矢量通过低通滤波器,由此生成在由矢量生成单元115输出的ACB矢量中不附加噪声的频带分量,并将该分量作为ACB分量输出。通过低通滤波器之后的ACB矢量A输出到乘法器110和FCB增益生成单元139。
FCB分量生成单元141使由矢量生成单元146输出的FCB(固定码本)矢量通过高通滤波器,由此生成在由矢量生成单元146输出的FCB矢量中要附加噪声的频带分量,并将该分量作为FCB分量输出。通过高通滤波器之后的FCB矢量F输出到乘法器111和FCB增益生成单元139。
另外,上述低通滤波器和高通滤波器为线性相位FIR滤波器。
FCB增益生成单元139根据由ACB增益生成单元135输出的用于屏蔽处理的ACB增益、由ACB分量生成单元134输出的用于屏蔽处理的ACB矢量A、输入到ACB分量生成单元134的、经ACB分量生成单元134处理前的ACB矢量、以及由FCB分量生成单元141输出的FCB矢量F,如下计算用于屏蔽处理的FCB增益。
FCB增益生成单元139对经ACB分量生成单元134进行处理前和处理后的ACB矢量的差矢量D,计算能量Ed(矢量D的各个要素的平方和)。然后,FCB增益生成单元139计算FCB矢量F的能量Ef(矢量F的各个要素的平方和)。其次,FCB增益生成单元139对由ACB分量生成单元134输入的ACB矢量A和由FCB分量生成单元141输入的FCB矢量F,计算互相关Raf(矢量A和矢量F的内积)。接着,FCB增益生成单元139对由ACB分量生成单元134输入的ACB矢量A和上述差矢量D,计算互相关Rad(矢量A和D的内积)。然后,FCB增益生成单元139根据以下(式2)计算增益。(-Raf+√(Raf×Raf+Ef×Ed+2×Ef×Rad))/Ef
                                       ...(式2)
在此,所得的解为虚数或负数时,将√(Ed/Ef)作为增益。最后,FCB增益生成单元139将由上述(式2)得到的增益乘以由ACB增益生成单元135生成的用于屏蔽处理的ACB增益,由此得到用于屏蔽处理的FCB增益。
以上的记载为计算用于屏蔽处理的FCB增益以便使以下两个矢量的能量相等的一个例子。在此所谓的两个矢量,其中一个为将输入到ACB分量生成单元134的原来的ACB矢量乘以用于屏蔽处理的ACB增益而得到的矢量,而另一个为将ACB矢量A乘以用于屏蔽处理的ACB增益而得到的矢量,和将FCB矢量F乘以用于屏蔽处理的FCB增益(此为未知的、在此要计算的对象)而得到的矢量的和矢量。
加法器147,将由ACB增益生成单元135决定的ACB增益乘以由ACB分量生成单元134生成的ACB矢量A(音源矢量的ACB分量)而得到的矢量、和将由FCB增益生成单元139决定的FCB增益乘以由FCB分量生成单元141生成的FCB矢量F(音源矢量的FCB分量)而得到的矢量的和矢量,作为最终的音源矢量输出给合成滤波器。此外,将输入到ACB分量生成单元134的(经低通滤波器处理前的)ACB矢量乘以用于屏蔽处理的ACB增益的矢量反馈给自适应码本106,由此仅使用ACB矢量更新自适应码本106,并将由加法器147得到的矢量作为合成滤波器的激励音源。
另外,对于合成滤波器的驱动音源,也可以施加相位扩散处理(phasedispersion processing)或实现音调周期性增强的处理。
如上所述,根据本实施方式,由于根据过去的解码语音信号的能量变化率决定ACB增益,并生成与由使用该增益生成的ACB矢量的能量相等的音源矢量,所以解码语音的能量变化在丢失帧的前后变得平滑,因此难以发生断音感。
另外,由于在上述结构中仅使用自适应码矢量进行自适应码本106的更新,所以能够抑制例如使用经随机噪声化的音源矢量更新自适应码本106时发生的后续帧的噪声感。
另外,在上述结构中,由于在语音信号的有声恒定单元中的屏蔽处理主要仅对高频(例如,3kHz以上)附加噪声,所以与以往的对所有频域附加噪声的方式相比,不容易发生噪声感。
(实施方式2)
在实施方式1中,作为本发明所涉及的补偿帧生成单元的结构的一例,将补偿帧生成单元单独提出来进行了说明。在本发明的实施方式2中,示出了将本发明所涉及的补偿帧生成单元安装在语音解码装置时的语音解码装置的结构的一例。此外,对于与实施方式1相同的结构单元附上相同的标记,并省略其说明。
图3是表示本发明的实施方式2所涉及的语音解码装置的主要结构的方框图。
本实施方式所涉及的语音解码装置在输入帧是正常帧时进行通常的解码处理,而在输入帧不是正常帧(丢失了帧)时,进行对该丢失帧的屏蔽处理。切换开关121至127根据表示输入帧是否为正常帧的坏帧指示(BFI)进行切换,由此实现上述两种处理。
首先对本实施方式所涉及的语音解码装置在通常的解码处理中的动作进行说明。图3所示的开关的状态表示在通常的解码处理中的开关的位置。
复用分离单元101将编码比特流分离为各个参数(LPC代码、音调代码、音调增益代码、FCB代码以及FCB增益代码),并分别供给给相应的解码单元。LPC解码单元102基于由复用分离单元101供给的LPC代码解码出LPC参数。音调周期解码单元103基于由复用分离单元101供给的音调代码解码出音调周期。ACB增益解码单元104基于由复用分离单元101供给的ACB代码解码出ACB增益。FCB增益解码单元105基于由复用分离单元101供给的FCB增益代码解码出FCB增益。
自适应码本106使用由音调周期解码单元103输出的音调周期生成ACB矢量,并输出给乘法器110。乘法器110将由ACB增益解码单元104输出的ACB增益乘以由自适应码本106输出的ACB矢量,并将增益调整后的ACB矢量供给给音源生成单元108。另一方面,固定码本107基于由复用分离单元101输出的固定码本代码生成FCB矢量,并输出给乘法器111。乘法器111将由FCB增益解码单元105输出的FCB增益乘以由固定码本107输出的FCB矢量,并将增益调整后的FCB矢量供给给音源生成单元108。音源生成单元108将由乘法器110、111输出的两个矢量相加而生成音源矢量,将其反馈给自适应码本106,并输出给合成滤波器109。
音源生成单元108从乘法器110得到已乘上了用于屏蔽处理的ACB增益后的ACB矢量,而从乘法器111得到已乘上了用于屏蔽处理的FCB增益后的FCB矢量,并将两者相加而得到音源矢量。没有差错时,音源生成单元108将该所相加的矢量作为音源信号反馈给自适应码本106,并输出给合成滤波器109。
合成滤波器109为基于经由开关124输入的线性预测系数(LPC)构成的线性预测滤波器,通过输入由音源生成单元108输出的激励音源矢量而进行滤波处理,由此输出解码语音信号。
所输出的解码语音信号在经过后置滤波器等的后处理之后,成为语音解码装置的最终输出。此外,该信号也输出到丢失帧屏蔽处理单元112内部的零交叉率计算单元(未图示)。
下面,对本实施方式所涉及的语音解码装置在屏蔽处理中的动作进行说明。该处理主要由丢失帧屏蔽处理单元112执行。
在通常的解码处理中,也将由LPC解码单元102、音调周期解码单元103、ACB增益解码单元104以及FCB增益解码单元105得到的各个解码参数(LPC参数、音调周期、ACB增益以及FCB增益)供给给丢失帧屏蔽处理单元112。这四种解码参数、前帧的解码语音(合成滤波器109的输出)、存储于自适应码本106中的过去生成的音源信号、为用于当前帧(丢失帧)而生成的ACB矢量以及为用于当前帧(丢失帧)而生成的FCB矢量输入到丢失帧屏蔽处理单元112。丢失帧屏蔽处理单元112使用这些参数进行后述的丢失帧的屏蔽处理,并输出所得到的LPC参数、音调周期、ACB增益、固定码本代码、FCB增益、ACB矢量以及FCB矢量。
在所生成的用于屏蔽处理的ACB矢量、用于屏蔽处理的ACB增益、用于屏蔽处理的FCB矢量以及用于屏蔽处理的FCB增益中,用于屏蔽处理的ACB矢量输出到乘法器110,用于屏蔽处理的ACB增益输出到乘法器110,用于屏蔽处理的FCB矢量经由切换开关125输出到乘法器111,而用于屏蔽处理的FCB增益经由切换开关126输出到乘法器111。
音源生成单元108在屏蔽处理中,将输入给ACB分量生成单元134的(经LPF处理前的)ACB矢量乘以用于屏蔽处理的ACB增益,并将所得到的矢量反馈给自适应码本106(自适应码本106仅使用ACB矢量进行更新),将由上述加法处理得到的矢量作为合成滤波器的激励音源。此外,也可以像没有差错时那样对合成滤波器的激励音源施加相位扩散处理和实现音调周期增强的处理等。
另外,在上述说明中,丢失帧屏蔽处理单元112和音源生成单元108相当于实施方式1中的补偿帧生成单元。此外,用语音解码装置的固定码本107来代替用于噪声性附加处理中的固定码本(实施方式1中的固定码本145)。
如上所述,根据本实施方式,能够将本发明所涉及的补偿帧生成单元安装在语音解码装置中。
另外,在AMR方式中,通过在开始一个帧的解码处理之前随机生成一个帧长度的比特流来进行相当于后述的FCB代码生成单元140的处理,所以并不一定需要配置专门生成FCB代码的单元。
另外,输出给合成滤波器109的音源信号和反馈给自适应码本106的音源信号并非必需为相同信号。例如,在生成输出给合成滤波器109的音源信号时,也可以如AMR方式那样对FCB矢量适用相位扩散处理,或施加增强音调周期的处理。此时,使输出给自适应码本106的信号的生成方法与编码端的结构一致。由此,有时能进一步改善主观质量。
另外,虽然在本实施方式中由FCB增益解码单元105将FCB增益输入给丢失帧屏蔽处理单元112,但这并不一定是必需的。在上述方法中在计算用于屏蔽处理的FCB增益之前需要求出临时的用于屏蔽处理的FCB增益时,需要FCB增益。或者,在有限字长的固定小数点计算中,为了通过使动态范围变窄而防止运算精确度的恶化,将上述FCB矢量F预先乘以该临时的用于屏蔽处理的FCB增益时,也需要FCB增益。
(实施方式3)
对于具有有声和无声的中间性质的丢失帧,优选方式为如图4所示使用自适应码本和固定码本两者,通过混合由这些码本生成的音源矢量而生成补偿帧。然而,这种中间性质的信号存在各种情形,例如,由于具有噪声性而使其有声性降低,或由于功率变化而使其有声性降低,或由于是过渡部分、上升部分、字尾部分的附近而使其有声性降低等,所以,如果采用以固定方式使用随机生成的固定码本生成音源信号的结构的话,则解码语音中会发生噪声感,导致主观质量的恶化。
另一方面,CELP方式的语音解码将过去生成的音源信号存储在自适应码本中,并基于使用该音源信号表示对于当前输入信号的音源信号的模型。也就是说,递归使用存储在自适应码本中的音源信号。于是,一旦音源信号成为噪声性信号,由于其影响的传播,在后续的帧中也成为噪声性的信号,这成为一个问题。
因此,在本实施方式中,如图5所示仅将由自适应码本生成的音源中的一部分频带置换为由固定码本生成的噪声性信号,由此尽可能地减少噪声对主观质量的影响。更具体来讲,仅将由自适应码本生成的音源的高频带置换为由固定码本生成的噪声性信号。其原因在于,高频分量具有噪声性是在实际的语音信号中能观察到的现象,所以,与将全部频带均一地噪声化处理相比,更容易得到自然的主观质量。
另外,本实施方式中,为附加噪声性还配置了模式判定单元,以根据所判定的语音模式在噪声性附加单元中切换要附加噪声的信号频带,来控制所附加的噪声性的强弱。
另外,使用经频带限制的自适应码本和经频带限制的固定码本生成的音源矢量合成音源信号,意味着无法原封不动地使用针对作为正常帧的前帧得到的ACB增益和FCB增益。因为基于未经频带限制的自适应码本和未经频带限制的固定码本生成的音源矢量的合成矢量的增益,与基于经频带限制的自适应码本和经频带限制的固定码本生成的音源矢量的增益不同。于是,为了防止发生帧间的能量的不连续,就需要实施方式1中所示的补偿帧生成单元。
另外,在将由固定码本生成的音源矢量混合时,可以挪用实施方式1中所示的噪声性附加单元。
由此,能够根据语音信号的特征(语音模式)切换解码音源信号的要进行噪声化处理的信号频带。例如,在周期性较低而噪声性较高的模式中,将附加噪声的信号频带加宽,而在周期性较强而有声性较高的模式中,将附加噪声的信号频带缩小,由此能够使解码合成语音信号的主观质量更为自然。
图6是表示本发明实施方式3所涉及的补偿帧生成单元100a的主要结构的方框图。此外,该补偿帧生成单元100a具有与实施方式1所示的补偿帧生成单元100同样的基本结构,对相同的结构单元附上相同的标记,并省略其说明。
模式判定单元138使用过去的解码音调周期的历史记录、过去的解码合成语音信号的零交叉率、过去的平滑ACB增益、过去的解码音源信号的能量变化率以及连续丢失帧数量,进行解码语音信号的模式判定。噪声性附加单元116a基于由模式判定单元138判定的模式,切换附加噪声的信号频带。
图7是表示噪声性附加单元116a内部的主要结构的方框图。此外,该噪声性附加单元116a具有与实施方式1所示的噪声性附加单元116同样的基本结构,对相同的结构单元附上相同的标记,并省略其说明。
滤波器截止频率切换单元137根据由模式判定单元138输出的模式判定结果决定滤波器截止频率,并输出对应于ACB分量生成单元134和FCB分量生成单元141的滤波器系数。
图8是表示上述ACB分量生成单元134内部的主要结构的方框图。
ACB分量生成单元134在BFI指示丢失帧时,使由矢量生成单元115输出的ACB矢量通过LPF(低通滤波器)161,由此作为ACB分量生成不附加噪声的频带分量。该LPF 161为基于从滤波器截止频率切换单元137输出的滤波器系数构成的线性相位FIR滤波器。滤波器截止频率切换单元137存储有与多种截止频率相对应的滤波器系数组合,选择与由模式判定单元138输出的模式判定结果相对应的滤波器系数并输出给LPF 161。
滤波器的截止频率与语音模式之间的对应关系例如为如下。在此表示电话频带语音中语音模式为三种模式结构的例子。
有声模式:截止频率=3kHz
噪声模式:截止频率=0Hz(全频带截止=ACB矢量为零矢量)
其它模式:截止频率=1kHz
图9是表示上述FCB分量生成单元141内部的主要结构的方框图。
由矢量生成单元146输出的FCB矢量在BFI指示丢失帧时输入到高通滤波器(HPF)171。HPF 171为基于从滤波器截止频率切换单元137输出的滤波器系数构成的线性相位FIR滤波器。滤波器截止频率切换单元137存储着与多种截止频率相对应的滤波器系数组合,选择与由模式判定单元138输出的模式判定结果相对应的滤波器系数组合并输出给HPF 171。
滤波器的截止频率与语音模式之间的关系例如为如下。在此也表示电话频带语音中语音模式为三种模式结构的例子。
有声模式:截止频率=3kHz
噪声模式:截止频率=0Hz(全频带带通=将输入的FCB矢量原封不动地输出)
其它模式:截止频率=1kHz
此时,如果通过如下(式3)所示的音调周期化处理将最终的FCB矢量的周期性增强的话,则该FCB矢量对于生成具有周期性的信号的情况有效。
c(n)=c(n)+βc(n-T)[n=T,T+1,...,L-1]...(式3)
(其中,c(n)为FCB矢量,β为音调周期化增益系数,T为音调周期,L为子帧长度)
将本实施方式所涉及的补偿帧生成单元安装在实施方式2所示的语音编码装置中,则如下。图10是表示本实施方式所涉及的语音解码装置内部的丢失帧屏蔽处理单元112的主要结构的方框图。此外,对于已经说明的方框附上相同的标记,并基本上省略其说明。
LPC生成单元136基于过去输入的解码LPC信息生成用于屏蔽处理的LPC参数、并将其经由切换开关124输出给合成滤波器109。作为用于屏蔽处理的LPC参数的生成方法,例如在AMR方式中使刚刚之前的LSP参数近似于平均的LSP参数后将其作为用于屏蔽处理的LSP参数,并将其变换为LPC参数作为用于屏蔽处理的LPC参数。此外,在帧的丢失持续较长时间(例如,3个或3个以上20ms的帧)时,也可以对LPC参数进行加权处理,由此扩展合成滤波器的带宽而进行白色化处理。假设LPC合成滤波器的传递系数为1/A(z)时,该加权表现为1/A(z/y),其中y的取值约为0.99至0.97,或者将该值作为初始值渐渐降低。此外,1/A(z)基于以下(式4)。
1/A(z)=1/(1+∑a(i)z-i)                 ...(式4)
(其中,i=1,...,p(p为LPC分析阶数))
音调周期生成单元131在由模式判定单元138的模式判定之后,生成音调周期。具体来讲,在AMR方式的12.2kbps模式时,将前一的正常子帧的解码音调周期(整数精确度)输出,作为丢失帧中的音调周期。也就是说,音调周期生成单元131具有存储解码音调的存储器,对每个子帧更新其值,在有差错时将该存储的值输出,作为屏蔽处理时的音调周期。此外,自适应码本106根据由音调周期生成单元131输出的该音调周期,生成相对应的ACB矢量。
FCB代码生成单元140将所生成的FCB代码经由切换开关127输出给固定码本107。
固定码本107将与FCB代码相对应的FCB矢量输出给FCB分量生成单元141。
零交叉率计算单元142得到由合成滤波器输出的合成信号,计算零交叉率并输出给模式判定单元138。在此,为了提取前一个音调周期的信号的特征(为了反映在时间上最接近的部分的特征),优选使用前一个音调周期计算零交叉率。
如上生成的各个参数分别被输出,具体来讲,用于屏蔽处理的ACB矢量经由切换开关123输出给乘法器110,用于屏蔽处理的ACB增益经由切换开关122输出给乘法器110,用于屏蔽处理的FCB矢量经由切换开关125输出给乘法器111,用于屏蔽处理的FCB增益经由切换开关126输出给乘法器111。
图11是表示模式判定单元138内部的主要结构的方框图。
模式判定单元138使用音调历史记录的分析结果、平滑音调增益、能量变化信息、零交叉率信息以及丢失帧的连续数目,进行模式判定。由于本发明的模式判定为用于屏蔽处理的判定,所以,在帧中进行一次(在从结束正常帧的解码处理之后到第一次进行使用模式信息的屏蔽处理为止的时间)即可,在本实施方式中为在第一子帧的音源解码处理的开头部分进行。
音调历史记录分析单元182在缓冲器中存储着有关过去的多个子帧的解码音调周期信息,根据过去的音调周期的变动的大小判定有声恒定性(voicedstationarity)。更具体来讲,在存储在缓冲器内的最大音调周期与最小音调周期之间的差在规定阈值(例如,最大音调周期的15%或10个采样(8kHz采样处理时))以内时,判定为有声恒定性较高。作为音调周期的缓冲器更新,如果存储着1个帧份的音调周期信息的话,则在一帧中进行一次(通常在帧处理的最后)即可,否则在每个子帧中进行一次(通常在子帧处理的最后)即可。所存储的音调周期的数目为之前4个子帧(20ms)左右。由于仅根据音调变化的大小进行判定,在倍音调错误(将音调误认为二分之一)或半音调错误(将音调误认为两倍)时不会判定为有声恒定,所以,不会出现因使用倍音调或半音调的信息进行屏蔽处理而发生的“语音变为假声”的现象。
平滑ACB增益计算单元183进行子帧间平滑处理,以便将解码ACB增益在子帧间的变动抑制到一定程度。例如,进行由下式所示的程度的平滑处理。
(平滑ACB增益)=0.7×(平滑ACB增益)+0.3×(解码ACB增益)
在计算出的平滑ACB增益超过阈值(例如为0.7)时判定为有声性较高。
判定单元184除了上述参数之外,还使用能量变化信息和零交叉率信息进行模式判定。具体来讲,在音调历史记录分析结果表示有声恒定性较高、且平滑ACB增益的阈值处理的结果表示有声性较高、且能量变化为阈值以下(例如,小于2)、且零交叉率为阈值以下(例如,小于0.7)的情况下,判定为有声(有声恒定)模式,在零交叉率为阈值以上(例如,0.7或0.7以上)的情况下,判定为噪声(噪声性信号)模式,而在其它情况下判定为其它(上升、过渡)模式。
模式判定单元138在进行模式判定之后,根据当前帧为连续第几个丢失帧决定最终模式判定结果。具体来讲,到连续第二帧为止将上述模式判定结果作为最终模式判定结果,在为连续第三帧时,如果上述模式判定结果为有声模式的话,则改变为其它模式并且作为最终模式判定结果,而在连续第四帧以后则作为噪声模式。通过如上的最终模式判定结果,能够防止在突发帧丢失时(帧丢失连续了3帧或3帧以上时)发生蜂鸣声,并使解码信号随着时间得到自然的噪声化,由此能够缓和主观上的不适感。如果配置连续丢失帧数目计数器,以便在当前帧为正常帧时将计数值复位为0,否则每次将计数值加1的话,通过参照该计数器的值就能够判断为连续第几个丢失帧。此外,在AMR方式中具有状态机,所以参照状态机的状态即可。
如上所述,根据本实施方式,在有声部分的屏蔽处理时能够防止噪声感的发生,即使在刚刚之前的子帧的增益偶然成为较小值的情况下,也能够防止在屏蔽处理时发生断音。
另外,在上述结构中,由于模式判定单元138在解码端无需进行音调分析即可进行模式判定,所以在适用于不进行解码端的音调分析的编码解码器时,能够压缩运算量。
另外,在上述结构中,由于根据丢失帧的连续数目改变所附加的噪声的频带,所以能够抑制因屏蔽处理而发生的蜂鸣声。
(实施方式4)
图12是表示将本发明所涉及的语音解码装置适用于无线通信系统时的无线发送装置300和与其相对应的无线接收装置310的主要结构的方框图。
无线发送装置300包括:输入装置301、A/D变换装置302、语音编码装置303、信号处理装置304、RF调制装置305、发送装置306以及天线307。
A/D变换装置302的输入端子连接到输入装置301的输出端子。语音编码装置303的输入端子连接到A/D变换装置302的输出端子。信号处理装置304的输入端子连接到语音编码装置303的输出端子。RF调制装置305的输入端子连接到信号处理装置304的输出端子。发送装置306的输入端子连接到RF调制装置305的输出端子。天线307连接到发送装置306的输出端子。
输入装置301接收语音信号,将其变换成作为电信号的模拟语音信号,并将其提供给A/D变换装置302。A/D变换装置302将来自输入装置301的模拟语音信号变换成数字语音信号,并将其提供给语音编码装置303。语音编码装置303对来自A/D变换装置302的数字语音信号进行编码而生成语音编码比特流,并将其提供给信号处理装置304。信号处理装置304对来自语音编码装置303的语音编码比特流进行信道编码处理、分组化处理和发送缓冲处理等之后,将该语音编码比特流提供给RF调制装置305。RF调制装置305对来自信号处理装置304的经信道编码处理等的语音编码比特串的信号进行调制,并将其提供给发送装置306。发送装置306经由天线307,将来自RF调制装置305的经调制的语音编码信号作为电波(RF信号)发送出去。
在无线发送装置300中,对经由A/D变换装置302得到的数字语音信号,以几十ms的帧为单位进行处理。在构成系统的网络为分组网的情况下,将1个帧或几个帧的编码数据包装在1个分组中并将该分组发送给分组网。此外,上述网络为线路交换网的情况下,不需进行分组化处理和发送缓冲处理等。
无线接收装置310包括:天线311、接收装置312、RF解调装置313、信号处理装置314、语音解码装置315、D/A变换装置316以及输出装置317。此外,作为语音解码装置315使用本实施方式所涉及的语音解码装置。
接收装置312的输入端子连接到天线311。RF解调装置313的输入端子连接到接收装置312的输出端子。信号处理装置314的输入端子连接到RF解调装置313的输出端子。语音解码装置315的输入端子连接到信号处理装置314的输出端子。D/A变换装置316的输入端子连接到语音解码装置315的输出端子。输出装置317的输入端子连接到D/A变换装置316的输出端子。
接收装置312经由天线311,接收包含语音编码信息的电波(RF信号)而生成作为模拟的电信号的接收语音编码信号,并将其提供给RF解调装置313。如果经由天线311接收到的电波(RF信号)在传播路径没有发生信号的衰减或噪声的重叠的话,则将为与从无线发送装置300发送的电波(RF信号)完全相同的信号。RF解调装置313对来自接收装置312的接收语音编码信号进行解调,并将其提供给信号处理装置314。信号处理装置314对来自RF解调装置313的接收语音编码信号进行抖动吸收缓冲处理、分组组合处理以及信道解码处理等,并将接收语音编码比特流提供给语音解码装置315。语音解码装置315对来自信号处理装置314的接收语音编码比特流进行解码处理而生成解码语音信号,并将其提供给D/A变换装置316。D/A变换装置316将来自语音解码装置315的数字解码语音信号变换成模拟解码语音信号,并将其提供给输出装置317。输出装置317将来自D/A变换装置316的模拟解码语音信号变换成空气的振动,并作为音波输出以便让人听到。
如上所述,根据本实施方式的语音解码装置可适用于无线通信系统中。此外,根据本实施方式的语音解码装置并不限用于无线通信系统中,例如,不言而喻也可以适用于有线通信系统中。
以上对本发明的各个实施方式进行了说明。
本发明所涉及的语音解码装置及补偿帧生成方法并不限于上述实施方式1至4,也可以进行各种各样的变形后实施之。
另外,本发明所涉及的语音解码装置、无线发送装置、无线接收装置以及补偿帧生成方法可以安装在移动通信系统中的通信终端装置以及基站装置,由此能够提供具有与以上说明同样的作用效果的通信终端装置、基站装置以及移动通信系统。
另外,本发明所涉及的语音解码装置也可以适用于有线通信系统中,由此能够提供具有与以上的说明同样的作用效果的有线通信系统。
另外,虽然在此以由硬件构成本发明的情况为例进行了说明,但本发明也可以由软件实现。例如,将本发明所涉及的补偿帧生成方法的算法使用编程语言记述,将该程序存储于存储器并让信息处理单元实行,由此能够实现与本发明所涉及的语音解码装置同样的功能。
另外,用于上述各实施方式的说明中的各功能模块,典型地由集成电路LSI来实现。这些即可以分别作成一个芯片,也可以包括其中一部分或者是全部而作成一个芯片。
另外,虽然在此称作LSI,但根据集成度的不同也可以称为IC、系统LSI、超LSI以及极大LSI等。
另外,集成电路化的技术并不限于LSI,也可以使用专用电路或通用处理器来实现。也可以利用制造LSI后可编程的现场可编程门阵列(FPGA),也可以利用可将LSI内部的电路块连接或设定重新配置的可重配置处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了替换LSI的集成电路技术,当然,也可以利用该技术来实现功能模块的集成化。也有应用生物工程学技术等的可能性。
本说明书基于2004年7月20日申请的日本专利申请特愿2004-212180号。其内容全部包括在此作为参考。
工业实用性
本发明所涉及的语音解码装置及补偿帧生成方法,可以适用于移动通信系统等用途。

Claims (8)

1、一种语音解码装置,包括:
自适应码本,生成音源信号;
计算单元,计算所述音源信号的子帧间的能量变化;
决定单元,基于所述能量变化决定所述自适应码本的增益;以及
生成单元,使用所述自适应码本的增益生成对于丢失帧的补偿帧。
2、如权利要求1所述的语音解码装置,还包括:
噪声化单元,对所述补偿帧的一部分频带进行噪声化处理。
3、如权利要求2所述的语音解码装置,其中,
所述噪声化单元对所述补偿帧的高频带进行噪声化处理。
4、如权利要求2所述的语音解码装置,其中,
所述噪声化单元根据所述丢失帧以前的帧的语音模式,决定进行噪声化处理的所述一部分频带。
5、如权利要求2所述的语音解码装置,其中,
所述噪声化单元根据丢失帧的连续数目,将进行噪声化处理的所述一部分频带加宽。
6、一种通信终端装置,包括权利要求1所述的语音解码装置。
7、一种基站装置,包括权利要求1所述的语音解码装置。
8、一种补偿帧生成方法,包括:
计算步骤,计算由自适应码本生成的音源信号的子帧间的能量变化;
决定步骤,根据所述能量变化决定所述自适应码本的增益;以及
生成步骤,使用所述自适应码本的增益生成对于丢失帧的补偿帧。
CN2005800244876A 2004-07-20 2005-07-14 语音解码装置及补偿帧生成方法 Expired - Fee Related CN1989548B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004212180 2004-07-20
JP212180/2004 2004-07-20
PCT/JP2005/013051 WO2006009074A1 (ja) 2004-07-20 2005-07-14 音声復号化装置および補償フレーム生成方法

Publications (2)

Publication Number Publication Date
CN1989548A true CN1989548A (zh) 2007-06-27
CN1989548B CN1989548B (zh) 2010-12-08

Family

ID=35785187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800244876A Expired - Fee Related CN1989548B (zh) 2004-07-20 2005-07-14 语音解码装置及补偿帧生成方法

Country Status (5)

Country Link
US (1) US8725501B2 (zh)
EP (1) EP1775717B1 (zh)
JP (1) JP4698593B2 (zh)
CN (1) CN1989548B (zh)
WO (1) WO2006009074A1 (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009059498A1 (fr) * 2007-11-05 2009-05-14 Huawei Technologies Co., Ltd. Procédé de traitement de signal, dispositif de traitement et décodeur audio
WO2010127617A1 (en) * 2009-05-05 2010-11-11 Huawei Technologies Co., Ltd. Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal
US7957961B2 (en) 2007-11-05 2011-06-07 Huawei Technologies Co., Ltd. Method and apparatus for obtaining an attenuation factor
CN102480760A (zh) * 2010-11-23 2012-05-30 中兴通讯股份有限公司 系统间链路协议帧丢帧处理、补偿帧判别方法及装置
CN102623013A (zh) * 2011-02-01 2012-08-01 冲电气工业株式会社 语音品质观测装置及方法
WO2013016986A1 (zh) * 2011-07-31 2013-02-07 中兴通讯股份有限公司 一种浊音起始帧后丢帧的补偿方法和装置
CN103250206A (zh) * 2010-10-07 2013-08-14 弗朗霍夫应用科学研究促进协会 用于比特流域中的编码音频帧的强度估计的装置及方法
CN101741402B (zh) * 2009-12-24 2014-10-22 北京韦加航通科技有限责任公司 一种无线通信系统下适用于超大动态范围的无线接收机
CN104126201A (zh) * 2013-02-15 2014-10-29 华为技术有限公司 用于语音编码的混合码本激励的系统和方法
WO2015007114A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 解码方法和解码装置
WO2015007076A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 处理丢失帧的方法和解码器
CN105340007A (zh) * 2013-06-21 2016-02-17 弗朗霍夫应用科学研究促进协会 用于产生舒缓噪声的自适应频谱形状的装置及方法
CN105408954A (zh) * 2013-06-21 2016-03-16 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
CN106170830A (zh) * 2014-03-19 2016-11-30 弗朗霍夫应用科学研究促进协会 使用功率补偿产生错误隐藏信号的装置、方法和对应的计算机程序
CN106575509A (zh) * 2014-07-28 2017-04-19 弗劳恩霍夫应用研究促进协会 谐波滤波器工具的谐度依赖控制
US9852738B2 (en) 2014-06-25 2017-12-26 Huawei Technologies Co.,Ltd. Method and apparatus for processing lost frame
CN107846691A (zh) * 2016-09-18 2018-03-27 中兴通讯股份有限公司 一种mos测量方法、装置及分析仪
CN108922551A (zh) * 2017-05-16 2018-11-30 博通集成电路(上海)股份有限公司 用于补偿丢失帧的电路及方法
US10643624B2 (en) 2013-06-21 2020-05-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
CN111370006A (zh) * 2014-03-19 2020-07-03 弗朗霍夫应用科学研究促进协会 产生错误隐藏信号的装置、方法和计算机可读介质
CN111627451A (zh) * 2013-06-21 2020-09-04 弗朗霍夫应用科学研究促进协会 用于获取音频信号的替换帧的频谱系数的方法及相关产品

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
JP4846712B2 (ja) * 2005-03-14 2011-12-28 パナソニック株式会社 スケーラブル復号化装置およびスケーラブル復号化方法
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
FR2907586A1 (fr) * 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
PT2102619T (pt) * 2006-10-24 2017-05-25 Voiceage Corp Método e dispositivo para codificação de tramas de transição em sinais de voz
JP4504389B2 (ja) 2007-02-22 2010-07-14 富士通株式会社 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8508357B2 (en) * 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
EP2425563A1 (en) 2009-05-01 2012-03-07 The Nielsen Company (US), LLC Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
KR101381272B1 (ko) 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8868432B2 (en) * 2010-10-15 2014-10-21 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5694745B2 (ja) * 2010-11-26 2015-04-01 株式会社Nttドコモ 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
JP5752324B2 (ja) * 2011-07-07 2015-07-22 ニュアンス コミュニケーションズ, インコーポレイテッド 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
CN107068156B (zh) * 2011-10-21 2021-03-30 三星电子株式会社 帧错误隐藏方法和设备以及音频解码方法和设备
KR102138320B1 (ko) 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
ES2881510T3 (es) * 2013-02-05 2021-11-29 Ericsson Telefon Ab L M Método y aparato para controlar la ocultación de pérdida de trama de audio
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
BR122022008597B1 (pt) 2013-10-31 2023-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador áudio e método para fornecer uma informação de áudio decodificada utilizando uma dissimulação de erro que modifica um sinal de excitação de domínio de tempo
PT3285254T (pt) * 2013-10-31 2019-07-09 Fraunhofer Ges Forschung Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro com base num sinal de excitação no domínio de tempo
EP2922055A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
CN107369453B (zh) 2014-03-21 2021-04-20 华为技术有限公司 语音频码流的解码方法及装置
JP6516099B2 (ja) * 2015-08-05 2019-05-22 パナソニックIpマネジメント株式会社 音声信号復号装置および音声信号復号方法
US11030524B2 (en) * 2017-04-28 2021-06-08 Sony Corporation Information processing device and information processing method
BR112021008089A2 (pt) 2018-11-02 2021-08-03 Dolby International Ab codificador de áudio e decodificador de áudio
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0243562B1 (en) * 1986-04-30 1992-01-29 International Business Machines Corporation Improved voice coding process and device for implementing said process
CA2005115C (en) 1989-01-17 1997-04-22 Juin-Hwey Chen Low-delay code-excited linear predictive coder for speech or audio
US5235669A (en) * 1990-06-29 1993-08-10 At&T Laboratories Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec
JPH06130999A (ja) * 1992-10-22 1994-05-13 Oki Electric Ind Co Ltd コード励振線形予測復号化装置
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3557662B2 (ja) * 1994-08-30 2004-08-25 ソニー株式会社 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
US5732389A (en) 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JP3653826B2 (ja) * 1995-10-26 2005-06-02 ソニー株式会社 音声復号化方法及び装置
JP3157116B2 (ja) * 1996-03-29 2001-04-16 三菱電機株式会社 音声符号化伝送システム
JPH1091194A (ja) * 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10232699A (ja) * 1997-02-21 1998-09-02 Japan Radio Co Ltd Lpcボコーダ
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
JP2000267700A (ja) 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP3292711B2 (ja) * 1999-08-06 2002-06-17 株式会社ワイ・アール・ピー高機能移動体通信研究所 音声符号化復号方法および装置
JP4464488B2 (ja) 1999-06-30 2010-05-19 パナソニック株式会社 音声復号化装置及び符号誤り補償方法、音声復号化方法
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
JP3510168B2 (ja) * 1999-12-09 2004-03-22 日本電信電話株式会社 音声符号化方法及び音声復号化方法
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
EP1339041B1 (en) * 2000-11-30 2009-07-01 Panasonic Corporation Audio decoder and audio decoding method
EP1235203B1 (en) * 2001-02-27 2009-08-12 Texas Instruments Incorporated Method for concealing erased speech frames and decoder therefor
US6871176B2 (en) * 2001-07-26 2005-03-22 Freescale Semiconductor, Inc. Phase excited linear prediction encoder
US6732389B2 (en) * 2002-05-28 2004-05-11 Edwin Drexler Bed sheet with traction areas
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
WO2003107591A1 (en) * 2002-06-14 2003-12-24 Nokia Corporation Enhanced error concealment for spatial audio
JP4331928B2 (ja) 2002-09-11 2009-09-16 パナソニック株式会社 音声符号化装置、音声復号化装置、及びそれらの方法
CN1989548B (zh) * 2004-07-20 2010-12-08 松下电器产业株式会社 语音解码装置及补偿帧生成方法
US20080243496A1 (en) * 2005-01-21 2008-10-02 Matsushita Electric Industrial Co., Ltd. Band Division Noise Suppressor and Band Division Noise Suppressing Method
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
ES2347473T3 (es) * 2005-12-05 2010-10-29 Qualcomm Incorporated Procedimiento y aparato de deteccion de componentes tonales de señales de audio.
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP5596341B2 (ja) * 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法

Cited By (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009059498A1 (fr) * 2007-11-05 2009-05-14 Huawei Technologies Co., Ltd. Procédé de traitement de signal, dispositif de traitement et décodeur audio
US7957961B2 (en) 2007-11-05 2011-06-07 Huawei Technologies Co., Ltd. Method and apparatus for obtaining an attenuation factor
CN102122511B (zh) * 2007-11-05 2013-12-04 华为技术有限公司 一种信号处理方法、处理装置以及语音解码器
US8320265B2 (en) 2007-11-05 2012-11-27 Huawei Technologies Co., Ltd. Method and apparatus for obtaining an attenuation factor
CN101601217B (zh) * 2007-11-05 2013-01-09 华为技术有限公司 一种信号处理方法、处理装置以及语音解码器
WO2010127617A1 (en) * 2009-05-05 2010-11-11 Huawei Technologies Co., Ltd. Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal
US8718804B2 (en) 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
CN101741402B (zh) * 2009-12-24 2014-10-22 北京韦加航通科技有限责任公司 一种无线通信系统下适用于超大动态范围的无线接收机
CN103250206B (zh) * 2010-10-07 2015-07-15 弗朗霍夫应用科学研究促进协会 用于比特流域中的编码音频帧的强度估计的装置及方法
US11238873B2 (en) 2010-10-07 2022-02-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for codebook level estimation of coded audio frames in a bit stream domain to determine a codebook from a plurality of codebooks
CN103250206A (zh) * 2010-10-07 2013-08-14 弗朗霍夫应用科学研究促进协会 用于比特流域中的编码音频帧的强度估计的装置及方法
CN102480760B (zh) * 2010-11-23 2014-09-10 中兴通讯股份有限公司 系统间链路协议帧丢帧处理、补偿帧判别方法及装置
CN102480760A (zh) * 2010-11-23 2012-05-30 中兴通讯股份有限公司 系统间链路协议帧丢帧处理、补偿帧判别方法及装置
CN102623013A (zh) * 2011-02-01 2012-08-01 冲电气工业株式会社 语音品质观测装置及方法
US9026433B2 (en) 2011-02-01 2015-05-05 Oki Electric Industry Co., Ltd. Voice quality measurement device, method and computer readable medium
CN102623013B (zh) * 2011-02-01 2015-08-19 冲电气工业株式会社 语音品质观测装置及方法
WO2013016986A1 (zh) * 2011-07-31 2013-02-07 中兴通讯股份有限公司 一种浊音起始帧后丢帧的补偿方法和装置
CN102915737B (zh) * 2011-07-31 2018-01-19 中兴通讯股份有限公司 一种浊音起始帧后丢帧的补偿方法和装置
US9972325B2 (en) 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
CN104126201A (zh) * 2013-02-15 2014-10-29 华为技术有限公司 用于语音编码的混合码本激励的系统和方法
US10679632B2 (en) 2013-06-21 2020-06-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
US10867613B2 (en) 2013-06-21 2020-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out in different domains during error concealment
US11869514B2 (en) 2013-06-21 2024-01-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved signal fade out for switched audio coding systems during error concealment
CN111627451B (zh) * 2013-06-21 2023-11-03 弗朗霍夫应用科学研究促进协会 用于获取音频信号的替换帧的频谱系数的方法及相关产品
US11501783B2 (en) 2013-06-21 2022-11-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application
CN105408954A (zh) * 2013-06-21 2016-03-16 弗朗霍夫应用科学研究促进协会 利用改进的音调滞后估计的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
US11462221B2 (en) 2013-06-21 2022-10-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an adaptive spectral shape of comfort noise
US11410663B2 (en) 2013-06-21 2022-08-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation
CN105340007A (zh) * 2013-06-21 2016-02-17 弗朗霍夫应用科学研究促进协会 用于产生舒缓噪声的自适应频谱形状的装置及方法
US10854208B2 (en) 2013-06-21 2020-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing improved concepts for TCX LTP
CN111627451A (zh) * 2013-06-21 2020-09-04 弗朗霍夫应用科学研究促进协会 用于获取音频信号的替换帧的频谱系数的方法及相关产品
US10672404B2 (en) 2013-06-21 2020-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an adaptive spectral shape of comfort noise
CN105340007B (zh) * 2013-06-21 2019-05-31 弗朗霍夫应用科学研究促进协会 用于产生舒缓噪声的自适应频谱形状的装置及方法
US10643624B2 (en) 2013-06-21 2020-05-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization
US10607614B2 (en) 2013-06-21 2020-03-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method realizing a fading of an MDCT spectrum to white noise prior to FDNS application
US10102862B2 (en) 2013-07-16 2018-10-16 Huawei Technologies Co., Ltd. Decoding method and decoder for audio signal according to gain gradient
US10614817B2 (en) 2013-07-16 2020-04-07 Huawei Technologies Co., Ltd. Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient
RU2628159C2 (ru) * 2013-07-16 2017-08-15 Хуавэй Текнолоджиз Ко., Лтд. Способ декодирования и устройство декодирования
CN107818789A (zh) * 2013-07-16 2018-03-20 华为技术有限公司 解码方法和解码装置
WO2015007076A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 处理丢失帧的方法和解码器
WO2015007114A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 解码方法和解码装置
US10068578B2 (en) 2013-07-16 2018-09-04 Huawei Technologies Co., Ltd. Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient
US10741186B2 (en) 2013-07-16 2020-08-11 Huawei Technologies Co., Ltd. Decoding method and decoder for audio signal according to gain gradient
CN106170830A (zh) * 2014-03-19 2016-11-30 弗朗霍夫应用科学研究促进协会 使用功率补偿产生错误隐藏信号的装置、方法和对应的计算机程序
CN111370005A (zh) * 2014-03-19 2020-07-03 弗朗霍夫应用科学研究促进协会 产生错误隐藏信号的装置、方法和计算机可读介质
CN111370006A (zh) * 2014-03-19 2020-07-03 弗朗霍夫应用科学研究促进协会 产生错误隐藏信号的装置、方法和计算机可读介质
US11423913B2 (en) 2014-03-19 2022-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating an error concealment signal using an adaptive noise estimation
CN111370005B (zh) * 2014-03-19 2023-12-15 弗朗霍夫应用科学研究促进协会 产生错误隐藏信号的装置、方法和计算机可读介质
CN111370006B (zh) * 2014-03-19 2024-03-05 弗朗霍夫应用科学研究促进协会 产生错误隐藏信号的装置、方法和计算机可读介质
US10529351B2 (en) 2014-06-25 2020-01-07 Huawei Technologies Co., Ltd. Method and apparatus for recovering lost frames
US9852738B2 (en) 2014-06-25 2017-12-26 Huawei Technologies Co.,Ltd. Method and apparatus for processing lost frame
US10311885B2 (en) 2014-06-25 2019-06-04 Huawei Technologies Co., Ltd. Method and apparatus for recovering lost frames
CN106575509A (zh) * 2014-07-28 2017-04-19 弗劳恩霍夫应用研究促进协会 谐波滤波器工具的谐度依赖控制
CN107846691A (zh) * 2016-09-18 2018-03-27 中兴通讯股份有限公司 一种mos测量方法、装置及分析仪
CN108922551A (zh) * 2017-05-16 2018-11-30 博通集成电路(上海)股份有限公司 用于补偿丢失帧的电路及方法

Also Published As

Publication number Publication date
EP1775717A4 (en) 2009-06-17
JPWO2006009074A1 (ja) 2008-05-01
EP1775717A1 (en) 2007-04-18
US20080071530A1 (en) 2008-03-20
US8725501B2 (en) 2014-05-13
CN1989548B (zh) 2010-12-08
WO2006009074A1 (ja) 2006-01-26
EP1775717B1 (en) 2013-09-11
JP4698593B2 (ja) 2011-06-08

Similar Documents

Publication Publication Date Title
CN1989548B (zh) 语音解码装置及补偿帧生成方法
AU2006252965B2 (en) Sub-band voice CODEC with multi-stage codebooks and redundant coding
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
ES2625895T3 (es) Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal
CN102449690B (zh) 用于重建被擦除语音帧的系统与方法
US8255210B2 (en) Audio/music decoding device and method utilizing a frame erasure concealment utilizing multiple encoded information of frames adjacent to the lost frame
US7840402B2 (en) Audio encoding device, audio decoding device, and method thereof
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
WO2005112005A1 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
KR100526829B1 (ko) 음성부호화방법및장치음성복호화방법및장치
WO2006120931A1 (ja) 符号化装置、復号化装置及びこれらの方法
JP2000516356A (ja) 可変ビットレート音声送信システム
JP4365653B2 (ja) 音声信号送信装置、音声信号伝送システム及び音声信号送信方法
JP4414705B2 (ja) 音源信号符号化装置、及び音源信号符号化方法
JP4299676B2 (ja) 固定音源ベクトルの生成方法及び固定音源符号帳
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
Bouzid et al. Optimized trellis coded vector quantization of LSF parameters, application to the 4.8 kbps FS1016 speech coder
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
RU2248619C2 (ru) Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов
US5797120A (en) System and method for generating re-configurable band limited noise using modulation
JP2001051699A (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3824706B2 (ja) 音声符号化/復号化装置
JP2004302258A (ja) 音声復号化装置および音声復号化方法
JP2000089797A (ja) 音声符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140716

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140716

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20170605

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101208

Termination date: 20180714

CF01 Termination of patent right due to non-payment of annual fee