CN101185125A - 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备 - Google Patents

用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备 Download PDF

Info

Publication number
CN101185125A
CN101185125A CNA2006800183538A CN200680018353A CN101185125A CN 101185125 A CN101185125 A CN 101185125A CN A2006800183538 A CNA2006800183538 A CN A2006800183538A CN 200680018353 A CN200680018353 A CN 200680018353A CN 101185125 A CN101185125 A CN 101185125A
Authority
CN
China
Prior art keywords
signal
frequency spectrum
band
band excitation
narrow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800183538A
Other languages
English (en)
Other versions
CN101185125B (zh
Inventor
科恩·贝尔纳德·福斯
阿南塔帕德马纳卜汉·A·坎达达伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Priority claimed from PCT/US2006/012233 external-priority patent/WO2006107839A2/en
Publication of CN101185125A publication Critical patent/CN101185125A/zh
Application granted granted Critical
Publication of CN101185125B publication Critical patent/CN101185125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Transmitters (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

一种用于产生高频带激励信号(S120)的方法和设备包含:通过延伸基于经编码低频带激励信号(S50)的信号的频谱来产生频谱延伸信号(A400);以及对基于所述经编码低频带激励信号的信号执行抗稀疏滤波(600)。所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于所述抗稀疏滤波的结果。

Description

用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
本申请案主张2005年4月1日申请的题为“CODING THE HIGH-FREQUENCYBAND OF WIDEBAND SPEECH”的第60/667,901号美国临时专利申请案的权益。本申请案还主张2005年4月22日申请的题为“PARAMETER CODING IN A HIGH-BANDSPEECH CODER”的第60/673,965号美国临时专利申请案的权益。
技术领域
本发明涉及信号处理。
背景技术
公共交换电话网络(PSTN)上的语音通信的带宽传统上限于300-3400kHz的频率范围。用于语音通信(例如蜂窝式电话和IP语音(因特网协议,VoIP))的新的网络可能不具有相同的带宽限制,且可能需要在此类网络上发射和接收包含宽频带频率范围的语音通信。举例来说,可能需要支持向下延伸到50Hz和/或一直到7或8kHz的音频频率范围。还可能需要支持可能具有在传统PSTN限制以外的范围内的音频语音内容的其它应用,例如高质量音频或音频/视频会议。
语音编码器所支持的范围向较高频率的延伸可改进清晰度。举例来说,区分例如“s”与“f”的摩擦音的信息主要处于高频率。高频带延伸还可改进语音的其它质量,例如存在率。举例来说,甚至浊元音也可具有远远高于PSTN限制的频谱能量。
宽频带语音编码的一种方法涉及缩放窄频带语音编码技术(例如,经配置以编码0-4kHz的范围的技术)以覆盖宽频带频谱。举例来说,语音信号可以较高速率取样以包含处于高频率的分量,且窄频带编码技术可重新配置以使用更多滤波系数来表示此宽频带信号。然而,例如CELP(密码本激励线性预测)的窄频带编码技术计算量较大,而宽频带CELP编码器可能消耗过多处理循环,以至于对于许多移动和其它嵌入式应用而言不现实。使用这种技术将宽频带信号的整个频谱编码为所需质量还可能导致带宽大大增加而令人无法接受。此外,甚至在此经编码信号的窄频带部分可传输到仅支持窄频带编码的系统中和/或由所述系统解码之前,将需要对所述经编码信号进行代码转换。
宽频带语音编码的另一种方法涉及从经编码窄频带频谱包络外推高频带频谱包络。虽然这种方法可在不增加带宽且不需要代码转换的情况下实施,但通常无法从窄频带部分的频谱包络中精确地预测出语音信号的高频带部分的粗略频谱包络或共振峰结构。
可能需要实施宽频带语音编码,使得至少经编码信号的窄频带部分可通过窄频带信道(例如,PSTN信道)发送,而不进行代码转换或其它显著修改。还可能需要宽频带编码延伸有效率,以便(例如)避免在例如无线蜂窝式电话以及有线和无线信道上的广播的应用中可能接受服务的用户的数目显著减少。
发明内容
在一个实施例中,一种产生高频带激励信号的方法包含:通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号;以及对基于所述经编码低频带激励信号的信号执行抗稀疏滤波。在此方法中,所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于执行抗稀疏滤波的结果。
在另一实施例中,一种设备包含:频谱延伸器,其经配置以通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号;以及抗稀疏滤波器,其经配置以对基于所述经编码低频带激励信号的信号进行滤波。在此设备中,所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于所述抗稀疏滤波器的输出。
在另一实施例中,一种设备包含:用于通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号的装置;以及抗稀疏滤波器,其经配置以对基于所述经编码低频带激励信号的信号进行滤波。在此设备中,所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于所述抗稀疏滤波器的输出。
附图说明
图1a展示根据一实施例的宽频带语音编码器A100的方块图。
图1b展示宽频带语音编码器A100的实施方案A102的方块图。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。
图2b展示宽频带语音编码器B100的实施方案B102的方块图。
图3a展示滤波器组A110的实施方案A112的方块图。
图3b展示滤波器组B120的实施方案B122的方块图。
图4a展示滤波器组A110的一个实例的低和高频带的带宽覆盖。
图4b展示滤波器组A110的另一实例的低和高频带的带宽覆盖。
图4c展示滤波器组A112的实施方案A114的方块图。
图4d展示滤波器组B122的实施方案B124的方块图。
图5a展示语音信号的频率与对数幅值的曲线的实例。
图5b展示基础线性预测编码系统的方块图。
图6展示窄频带编码器A120的实施方案A122的方块图。
图7展示窄频带解码器B110的实施方案B112的方块图。
图8a展示浊语音的残留信号的频率与对数幅值的曲线的实例。
图8b展示浊语音的残留信号的时间与对数幅值的曲线的实例。
图9展示也执行长期预测的基础线性预测编码系统的方块图。
图10展示高频带编码器A200的实施方案A202的方块图。
图11展示高频带激励发生器A300的实施方案A302的方块图。
图12展示频谱延伸器A400的实施方案A402的方块图。
图12a展示频谱延伸操作的一个实例中各点处的信号频谱的曲线。
图12b展示频谱延伸操作的另一实例中各点处的信号频谱的曲线。
图13展示高频带激励发生器A302的实施方案A304的方块图。
图14展示高频带激励发生器A302的实施方案A306的方块图。
图15展示包络计算任务T100的流程图。
图16展示组合器490的实施方案492的方块图。
图17说明计算高频带信号S30的周期性的指标的方法。
图18展示高频带激励发生器A302的实施方案A312的方块图。
图19展示高频带激励发生器A302的实施方案A314的方块图。
图20展示高频带激励发生器A302的实施方案A316的方块图。
图21展示增益计算任务T200的流程图。
图22展示增益计算任务T200的实施方案T210的流程图。
图23a展示窗口函数的图。
图23b展示将如图23a所示的窗口函数应用于语音信号的子帧。
图24展示高频带解码器B200的实施方案B202的方块图。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。
图26a展示延迟线D120的实施方案D122的示意图。
图26b展示延迟线D120的实施方案D124的示意图。
图27展示延迟线D120的实施方案D130的示意图。
图28展示宽频带语音编码器AD10的实施方案AD12的方块图。
图29展示根据一实施例的信号处理方法MD100的流程图。
图30展示根据一实施例的方法M100的流程图。
图31a展示根据一实施例的方法M200的流程图。
图31b展示方法M200的实施方案M210的流程图。
图32展示根据一实施例的方法M300的流程图。
在各图以及随附的描述中,相同参考标号表示相同或类似的元件或信号。
具体实施方式
本文描述的实施例包含可经配置以向窄频带语音编码器提供延伸以支持传输和/或存储宽频带语音信号而带宽仅增加约800到1000bps(位/秒)的系统、方法和设备。此类实施方案的潜在优点包含支持与窄频带系统的兼容性的嵌入式编码、在窄频带与高频带编码信道之间相对容易地分配和再分配位、避免计算量较大的宽频带合成操作,以及维持待通过计算量较大的波形编码例行程序处理的信号的低取样速率。
除非特别受到上下文限制,否则本文使用术语“计算”来表示其普通含义的任一者,例如计算、产生和从值的列表中选择。本描述内容和权利要求书中使用术语“包括”时,不排除其它元件或操作。使用术语“A基于B”来表示其普通含义的任一者,包含以下情况:(i)“A等于B”和(ii)“A至少基于B”。术语“因特网协议”包含如IETF(因特网工程工作小组)RFC(请求注解)791中描述的版本4和随后版本(例如,版本6)。
图1a展示根据一实施例的宽频带语音编码器A100的方块图。滤波器组A110经配置以对宽频带语音信号S10进行滤波以产生窄频带信号S20和高频带信号S30。窄频带编码器A120经配置以编码窄频带信号S20以产生窄频带(NB)滤波器参数S40和窄频带残留信号S50。如本文进一步详细描述,窄频带编码器A120通常经配置以作为密码本索引或采取另一量化形式而产生窄频带滤波器参数S40和经编码窄频带激励信号S50。高频带编码器A200经配置以根据经编码窄频带激励信号S50中的信息编码高频带信号S30以产生高频带编码参数S60。如本文进一步详细描述,高频带编码器A200通常经配置以作为密码本索引或采取另一量化形式而产生高频带编码参数S60。宽频带语音编码器A100的一个特定实例经配置以在约8.55kbps(千位/秒)的速率下编码宽频带语音信号S10,其中约7.55kbps用于窄频带滤波器参数S40和经编码窄频带激励信号S50,且约1kbps用于高频带编码参数S60。
可能需要将经编码窄频带和高频带信号组合为单一位流。举例来说,可能需要将经编码信号多路复用在一起以作为经编码宽频带语音信号用于传输(例如,在有线、光学或无线传输信道上)或用于存储。图1b展示宽频带语音编码器A100的实施方案A102的方块图,宽频带语音编码器A100包含多路复用器A130,其经配置以将窄频带滤波器参数S40、经编码窄频带激励信号S50和高频带滤波器参数S60组合为多路复用信号S70。
一种包含编码器A102的设备还可包含经配置以将多路复用信号S70传输到例如有线、光学或无线信道的传输信道中的电路。此设备还可经配置以对信号执行一个或一个以上信道编码操作,例如误差校正编码(例如,速率兼容卷积编码)和/或误差检测编码(例如,循环冗余编码),和/或一层或一层以上网络协议编码(例如,以太网、TCP/IP、cdma2000)。
可能需要多路复用器A130经配置以嵌入经编码窄频带信号(包含窄频带滤波器参数S40和经编码窄频带激励信号S50)作为可分离的多路复用信号S70支流,使得经编码窄频带信号可独立于多路复用信号S70的另一部分(例如,高频带和/或低频带信号)被恢复并解码。举例来说,多路复用信号S70可经配置使得经编码窄频带信号可通过剥除高频带滤波器参数S60而恢复。这一特征的一个潜在优点是避免在将经编码宽频带信号传递到支持窄频带信号的解码但不支持高频带部分的解码的系统之前需要对所述经编码宽频带信号进行代码转换。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。窄频带解码器B110经配置以解码窄频带滤波器参数S40和经编码窄频带激励信号S50以产生窄频带信号S90。高频带解码器B200经配置以根据基于经编码窄频带激励信号S50的窄频带激励信号S80而解码高频带编码参数S60,以产生高频带信号S100。在此实例中,窄频带解码器B110经配置以将窄频带激励信号S80提供到高频带解码器B200。滤波器组B120经配置以将窄频带信号S90与高频带信号S100组合以产生宽频带语音信号S110。
图2b是宽频带语音解码器B100的实施方案B102的方块图,宽频带语音解码器B100包含多路分解器B130,其经配置以从多路复用信号S70中产生经编码信号S40、S50和S60。一种包含解码器B102的设备可包含经配置以从例如有线、光学或无线信道的传输信道接收多路复用信号S70的电路。此设备还可经配置以对信号执行一个或一个以上信道解码操作,例如误差校正解码(例如,速率兼容卷积解码)和/或误差检测解码(例如,循环冗余解码),和/或一层或一层以上网络协议解码(例如,以太网、TCP/IP、cdma2000)。
滤波器组A110经配置以根据分裂频带方案对输入信号进行滤波以产生低频率子频带和高频率子频带。视特定应用的设计标准而定,输出子频带可具有相等或不等的带宽且可能重叠或不重叠。产生两个以上子频带的滤波器组A110配置也是可能的。举例来说,此滤波器组可经配置以产生一个或一个以上低频带信号,所述低频带信号包含处于窄频带信号S20的频率范围以下的频率范围(例如50-300Hz的范围)内的分量。此滤波器组也可能经配置以产生一个或一个以上额外高频带信号,所述额外高频带信号包含处于高频带信号S30的频率范围以上的频率范围(例如14-20、16-20或16-32kHz的范围)内的分量。在此情况下,可实施宽频带语音编码器A100以单独编码此信号(一个或多个),且多路复用器A130可经配置以将额外经编码信号(一个或多个)包含在多路复用信号S70中(例如,作为可分离部分)。
图3a展示滤波器组A110的实施方案A112的方块图,滤波器组A110经配置以产生具有减小的取样速率的两个子频带信号。滤波器组A110经配置以接收具有高频率(或高频带)部分和低频率(或低频带)部分的宽频带语音信号S10。滤波器组A112包含经配置以接收宽频带语音信号S10并产生窄频带语音信号S20的低频带处理路径,和经配置以接收宽频带语音信号S10并产生高频带语音信号S30的高频带处理路径。低通滤波器110对宽频带语音信号S10进行滤波以通过选定的低频率子频带,且高通滤波器130对宽频带语音信号S10进行滤波以通过选定的高频率子频带。因为两个子频带信号的带宽比宽频带语音信号S10窄,所以其取样速率可在一定程度上减小而无信息损失。向下取样器120根据所需的抽选因数(例如,通过去除信号的样本和/或用平均值代替样本)来减小低通信号的取样速率,且向下取样器140同样地根据另一所需的抽选因数来减小高通信号的取样速率。
图3b展示滤波器组B120的相应实施方案B122的方块图。向上取样器150(例如,通过零塞入和/或通过复制样本)增加窄频带信号S90的取样速率,且低通滤波器160对向上取样信号进行滤波以仅通过低频带部分(例如,以防止混叠)。同样,向上取样器170增加高频带信号S100的取样速率,且高通滤波器180对向上取样信号进行滤波以仅通过高频带部分。接着,将两个通带信号求和以形成宽频带语音信号S110。在解码器B100的一些实施方案中,滤波器组B120经配置以根据由高频带解码器B200接收和/或计算的一个或一个以上权数来产生两个通带信号的加权总和。还预期将两个以上通带信号组合的滤波器组B120配置。
滤波器110、130、160、180的每一者可实施为有限脉冲响应(FIR)滤波器或实施为无限脉冲响应(IIR)滤波器。编码器滤波器110和130的频率响应可具有抑止频带与通带之间的对称或相异形状的转变区。同样,解码器滤波器160和180的频率响应可具有抑止频带与通带之间的对称或相异形状的转变区。可能需要(但不是严格有必要)低通滤波器110与低通滤波器160具有相同响应,且高通滤波器130与高通滤波器180具有相同响应。在一个实例中,两个滤波器对110、130和160、180是正交镜像滤波器(QMF)组,其中滤波器对110、130与滤波器对160、180具有相同系数。
在典型实例中,低通滤波器110具有包含300-3400Hz的有限PSTN范围的通带(例如,0到4kHz的频带)。图4a和4b展示两个不同实施实例中宽频带语音信号S10、窄频带信号S20和高频带信号S30的相对带宽。在这两个特定实例中,宽频带语音信号S10具有16kHz的取样速率(表示0到8kHz范围内的频率分量),且窄频带信号S20具有8kHz的取样速率(表示0到4kHz范围内的频率分量)。
在图4a的实例中,两个子频带之间不存在明显重叠。此实例中所示的高频带信号S30可通过使用具有4-8kHz的通带的高通滤波器130来获得。在此情况下,可能需要通过以2为因数向下取样经滤波信号而将取样速率减小为8kHz。可预期此操作会显著减小对信号的进一步处理操作的计算复杂性,此操作将把通带能量下移到0到4kHz范围内而无信息损失。
在图4b的替代实例中,上部和下部子频带具有明显重叠,使得两个子频带信号均描述3.5到4kHz的区域。此实例中的高频带信号S30可通过使用具有3.5-7kHz的通带的高通滤波器130来获得。在此情况下,可能需要通过以16/7为因数向下取样经滤波信号而将取样速率减小为7kHz。可预期此操作会显著减小对信号的进一步处理操作的计算复杂性,此操作将把通带能量下移到0到3.5kHz范围内而无信息损失。
在典型电话通信手机中,一个或一个以上变换器(即,麦克风和耳机或扬声器)缺乏7-8kHz的频率范围上的明显响应。在图4b的实例中,宽频带语音信号S10的处于7与8kHz之间的部分不包含在经编码信号中。高通滤波器130的其它特定实例具有3.5-7.5kHz和3.5-8kHz的通带。
在一些实施方案中,如在图4b的实例中在子频带之间提供重叠允许使用在重叠区上具有平滑衰减的低通和/或高通滤波器。此类滤波器与具有较急剧或“砖墙式(brick-wall)”响应的滤波器相比,通常较易设计,计算上不太复杂,且/或引起的延迟较少。具有急剧转变区的滤波器往往比具有平滑衰减的类似等级的滤波器具有更高的旁瓣(这可能引起混叠)。具有急剧转变区的滤波器还可能具有长脉冲响应,这可能引起振铃假象。对于具有一个或一个以上IIR滤波器的滤波器组实施方案,允许重叠区上的平滑衰减可使得能够使用极点较远离单位圆的滤波器(一个或多个),这对于确保稳定的定点实施方案可能较重要。
子频带重叠允许低频带与高频带的平滑混合,这可导致较少的可听到的假象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此外,窄频带编码器A120(例如,波形编码器)的编码效率可随着频率不断增加而下降。举例来说,可能在低位速率下,尤其在存在背景噪声的情况下减小窄频带编码器的编码质量。在此类情况下,提供子频带重叠可提高重叠区中复制的频率分量的质量。
此外,子频带重叠允许低频带与高频带的平滑混合,其可能导致较少的可听到的假象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此特征对于窄频带编码器A120和高频带编码器A200根据不同编码方法操作的实施方案可能尤其合乎需要。举例来说,不同编码技术可产生听起来非常不同的信号。以密码本索引形式编码频谱包络的编码器可产生具有与改为编码幅值谱的编码器不同的声音的信号。时域编码器(例如,脉冲-代码调制或PCM编码器)可产生具有与频域编码器不同的声音的信号。以频谱包络和相应残留信号的表示形式编码信号的编码器可产生具有与仅以频谱包络表示形式编码信号的编码器不同的声音的信号。将信号编码为其波形的表示形式的编码器可产生具有与来自正弦编码器的输出不同的声音的输出。在此类情况下,使用具有急剧转变区的滤波器来界定非重叠子频带可能导致合成的宽频带信号中子频带之间的转变较突然且感觉上较明显。
尽管子频带技术中通常使用具有互补重叠频率响应的QMF滤波器组,但此类滤波器不适于本文描述的宽频带编码实施方案中的至少一些实施方案。编码器处的QMF滤波器组经配置以产生较大程度的混叠,所述混叠在解码器处的相应QMF滤波器组中被消去。此配置可能不适于信号招致滤波器组之间的大量失真的应用,因为失真可减小混叠消去性质的效力。举例来说,本文描述的应用包含经配置以在非常低的位速率下操作的编码实施方案。由于位速率非常低,所以经解码信号很可能与原始信号相比呈现为明显失真,使得QMF滤波器组的使用可导致未消去的混叠。使用QMF滤波器组的应用通常具有较高位速率(例如,对于AMR超过12kbps,且对于G.722超过64kbps)。
另外,编码器可经配置以产生感觉上类似于原始信号但实际上显著不同于原始信号的合成信号。举例来说,如本文所描述从窄频带残留中导出高频带激励的编码器可产生此信号,因为经解码信号中可能完全不存在实际高频带残留。在此类应用中使用QMF滤波器组可导致由未消去的混叠引起的较大程度的失真。
如果受影响子频带较窄,那么可减小QMF混叠引起的失真量,因为混叠的影响限于与子频带宽度相等的带宽。然而,对于本文描述的其中每一子频带包含宽频带带宽的约一半的实例,由未消去的混叠引起的失真可能影响信号的大部分。信号的质量也可能受上面发生未消去的混叠的频带的位置影响。举例来说,宽频带语音信号中心附近(例如,3与4kHz之间)产生的失真可能比信号边缘附近(例如,6kHz以上)发生的失真有害得多。
虽然QMF滤波器组的滤波器的响应彼此严格相关,但滤波器组A110和B120的低频带和高频带路径可经配置以具有除两个子频带的重叠外完全不相关的频谱。我们将两个子频带的重叠定义为高频带滤波器的频率响应下降到-20dB的点至低频带滤波器的频率响应下降到-20dB的点的距离。在滤波器组A110和/或B120的各种实例中,此重叠范围为约200Hz到约1kHz。约400到约600Hz的范围可表示编码效率与感知平滑度之间的理想折衷。在上文提及的一个特定实例中,重叠在500Hz附近。
可能需要实施滤波器组A112和/或B122来在若干阶段执行图4a和4b中说明的操作。举例来说,图4c展示滤波器组A112的实施方案A114的方块图,实施方案A114使用一系列内插、再取样、抽选和其它操作来执行功能等效的高通滤波和向下取样操作。此类实施方案可较易设计且/或可允许再使用逻辑和/或代码的功能块。举例来说,可使用相同功能块来执行如图4c所示至14 kHz的抽选以及至7kHz的抽选的操作。可通过将信号与函数ejnπ或序列(-1)n相乘来实施频谱反转操作,所述序列(-1)n的值在+1与-1之间交替。频谱成形操作可实施为经配置以使信号成形从而获得所需的总体滤波器响应的低通滤波器。
注意到,由于频谱反转操作的缘故,高频带信号S30的频谱反转。可相应地配置编码器和相应解码器中的后续操作。举例来说,本文描述的高频带激励发生器A300可经配置以产生同样具有频谱反转形式的高频带激励信号S120。
图4d展示滤波器组B122的实施方案B124的方块图,滤波器组B122使用一系列内插、再取样和其它操作来执行功能等效的向上取样和高通滤波操作。滤波器组B124包含高频带中的频谱反转操作,其使与例如编码器的滤波器组(例如,滤波器组A114)中执行的类似的操作反转。在此特定实例中,滤波器组B124还包含低频带和高频带中的陷波滤波器,其削弱7100 Hz处的信号分量,但此类滤波器是任选的且不需要包含此类滤波器。与此一同申请的代理人案号为050551的专利申请案“SYSTEMS,METHODS,ANDAPPARATUS FOR SPEECH SIGNAL FILTERING”包含关于滤波器组A110和B120的特定实施方案的元件的响应的额外描述和图式,且此材料在此以引用的方式并入。
窄频带编码器A120根据源-滤波器模型而实施,其将输入语音信号编码为(A)一组描述滤波器的参数和(B)驱动所描述的滤波器产生输入语音信号的合成复制物的激励信号。图5a展示语音信号的频谱包络的实例。表现此频谱包络的特征的峰值表示声域的谐振且称为共振峰。大多数语音编码器至少将此粗略谱结构编码为一组参数(例如,滤波器系数)。
图5b展示如应用于窄频带信号S20的频谱包络的编码的基础源-滤波器配置的实例。分析模块计算描述对应于一段时间(通常20毫秒)内的语音声音的滤波器的一组参数。根据那些滤波器参数配置的白化滤波器(也称为分析或预测误差滤波器)去除频谱包络以对信号进行频谱整平。所得的白化信号(也称为残留)与原始语音信号相比,具有较少能量且因此变化较小并且较易于编码。由于对残留信号编码引起的误差还可能较均匀地散布在频谱上。滤波器参数和残留通常经过量化以用于在信道上有效传输。在解码器处,根据滤波器参数配置的合成滤波器由基于残留的信号激励以产生原始语音声音的合成版本。合成滤波器通常经配置以具有转移函数,所述转移函数是白化滤波器的转移函数的反转形式。
图6展示窄频带编码器A120的基础实施方案A122的方块图。在此实例中,线性预测编码(LPC)分析模块210将窄频带信号S20的频谱包络编码为一组线性预测(LP)系数(例如,全极滤波器的系数1/A(z))。分析模块通常将输入信号处理为一系列非重叠帧,其中为每一帧计算一组新的系数。帧周期通常是可预期信号在本地静止的周期;一个常见实例为20毫秒(等效于8kHz的取样速率下160个样本)。在一个实例中,LPC分析模块210经配置以计算一组10个LP滤波器系数以描述每一20毫秒帧的共振峰结构。也可能实施分析模块以将输入信号处理为一系列重叠帧。
分析模块可经配置以直接分析每一帧的样本,或者可首先根据窗口函数(例如,汉明窗口)对样本进行加权。也可在大于帧的窗口(例如,30毫秒窗口)上执行分析。此窗口可对称(例如5-20-5,使得其包含紧接着20毫秒帧之前和之后的5毫秒)或不对称(例如10-20,使得其包含先前帧的最后10毫秒)。LPC分析模块通常经配置以使用Levinson-Durbin递归式或Leroux-Gueguen算法计算LP滤波器系数。在另一实施方案中,分析模块可经配置以计算每一帧的一组倒谱系数而不是一组LP滤波器系数。
编码器A120的输出速率可通过量化滤波器系数而显著减小,且对复制质量的影响相对较小。线性预测滤波器系数难以有效量化,且通常映射为另一表示形式,例如线谱对(LSP)或线谱频率(LSF),以用于量化和/或熵编码。在图6的实例中,LP滤波器系数-LSF变换220将所述组LP滤波器系数变换为一组相应的LSF。LP滤波器系数的其它一对一表示形式包含部分自相关系数、对数面积比值、导抗谱对(ISP)和导抗谱频率(ISF),其用于GSM(全球移动通信系统)AMR-WB(自适应多速宽频带)编译码器中。通常,一组LP滤波器系数与一组相应的LSF之间的变换是可逆的,但实施例还包含变换不可在无误差情况下可逆的编码器A120实施方案。
量化器230经配置以量化所述组窄频带LSF(或其它系数表示形式),且窄频带编码器A122经配置以输出此量化的结果作为窄频带滤波器参数S40。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
如图6所示,窄频带编码器A122还通过使窄频带信号S20通过根据所述组滤波器系数配置的白化滤波器260(也称为分析或预测误差滤波器)来产生残留信号。在此特定实例中,白化滤波器260实施为FIR滤波器,但也可使用IIR实施方案。此残留信号通常将含有窄频带滤波器参数S40中未表示的感觉上较重要的语音帧信息,例如与音调有关的长期结构。量化器270经配置以计算此残留信号的量化表示形式以作为经编码的窄频带激励信号S50输出。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。或者,此量化器可经配置以发送一个或一个以上参数,可在解码器处从所述参数中动态地产生向量,而不是如稀疏密码本方法中一样从存储装置中检索向量。此方法用于例如代数CELP(密码本激励线性预测)的编码方案和例如3GPP2(第三代合作伙伴关系2)EVRC(增强可变速率编译码器)的编译码器中。
需要窄频带编码器A120根据将可用于相应窄频带解码器的相同滤波器参数值来产生经编码窄频带激励信号。以此方式,所得的经编码窄频带激励信号可能已在某种程度上考虑那些参数值的不理想性,例如量化误差。因此,需要使用将在解码器处可用的相同系数值来配置白化滤波器。在如图6所示的编码器A122的基础实例中,反转量化器240对窄频带编码参数S40解量化,LSF-LP滤波器系数变换250将所得值映射回一组相应的LP滤波器系数,且此组系数用于配置白化滤波器260以产生由量化器270量化的残留信号。
窄频带编码器A120的一些实施方案经配置以通过从一组密码本向量中识别出与残留信号最佳匹配的一个向量来计算经编码窄频带激励信号S50。然而,注意到,窄频带编码器A120也可经实施以计算残留信号的量化表示形式而不实际上产生残留信号。举例来说,窄频带编码器A120可经配置以使用许多密码本向量来产生相应的合成信号(例如,根据一组当前滤波器参数),并选择与感知加权域中和原始窄频带信号S20最佳匹配的所产生信号相关联的密码本向量。
图7展示窄频带解码器B110的实施方案B112的方块图。反转量化器310对窄频带滤波器参数S40解量化(在此情况下,解量化为一组LSF),且LSF-LP滤波器系数变换320将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化器240和变换250所描述)。反转量化器340对窄频带残留信号S40解量化以产生窄频带激励信号S80。基于滤波器系数和窄频带激励信号S80,窄频带合成滤波器330合成窄频带信号S90。换句话说,窄频带合成滤波器330经配置以根据解量化滤波器系数对窄频带激励信号S80进行频谱成形,以产生窄频带信号S90。窄频带解码器B112还将窄频带激励信号S80提供到高频带编码器A200,高频带编码器A200使用窄频带激励信号S80来导出高频带激励信号S120,如本文所描述。在下文描述的一些实施方案中,窄频带解码器B110可经配置以将与窄频带信号有关的额外信息(例如,频谱倾斜、音调增益和滞后,以及语音模式)提供到高频带解码器B200。
窄频带编码器A122和窄频带解码器B112的系统是合成分析语音编译码器的基础实例。密码本激励线性预测(CELP)编码是合成分析编码的一个普遍系列,且此类编码器的实施方案可执行残留的波形编码,其中包含例如从固定和自适应密码本中选择条目的操作、误差最小化操作和/或感知加权操作。合成分析编码的其它实施方案包含混合激励线性预测(MELP)、代数CELP(ACELP)、松弛CELP(RCELP)、规则脉冲激励(RPE)、多脉冲CELP(MPE)和向量和激励线性预测(VSELP)编码。相关编码方法包含多频带激励(MBE)和原型波形内插(PWI)编码。标准合成分析语音编译码器的实例包含使用残留激励线性预测(RELP)的ETSI(欧洲电信标准协会)GSM全速率编译码器(GSM06.10)、GSM增强全速率编译码器(ETSI-GSM 06.60)、ITU(国际电信联盟)标准11.8kb/s G.729 Annex E编码器、IS-136的IS(临时标准)641编译码器(时分多址方案)、GSM自适应多速率(GSM-AMR)编译码器,和4GVTM(第四代VocoderTM)编译码器(加州圣地亚哥市的高通公司(QUALCOMM Incorporated,San Diego,CA))。窄频带编码器A120和相应的解码器B110可根据这些技术中的任一者或任何其它语音编码技术(已知的或待开发的)实施,所述语音编码技术将语音信号表示为(A)一组描述滤波器的参数和(B)用于驱动所描述的滤波器复制语音信号的激励信号。
即使在白化滤波器已从窄频带信号S20中去除粗略频谱包络之后,也可能保留相当大量的精细谐波结构(尤其对于浊语音来说)。图8a展示浊音信号(例如,元音)的残留信号(如可能由白化滤波器产生)的一个实例的频谱曲线。此实例中可见的周期性结构与音调有关,且同一说话者发出的不同浊音可能具有不同的共振峰结构但具有类似的音调结构。图8b展示此残留信号的实例的时域曲线,其展示音调脉冲的时间序列。
可通过使用一个或一个以上参数值编码音调结构的特性来增加编码效率和/或语音质量。音调结构的一个重要特性是第一谐波的频率(也称为基频),其通常在60到400Hz范围内。此特性通常编码为基频的反转形式,也称为音调滞后(pitch lag)。音调滞后指示一个音调周期中样本的数目,且可编码为一个或一个以上密码本索引。来自男性说话者的语音信号往往比来自女性说话者的语音信号具有更大的音调滞后。
与音调结构有关的另一信号特性是周期性,其指示谐波结构的强度,或换句话说,信号为谐波或非谐波的程度。周期性的两个典型指示符是零交叉和标准化自相关函数(NACF)。周期性也可由音调增益来指示,所述音调增益通常编码为密码本增益(例如,量化自适应密码本增益)。
窄频带编码器A120可包含经配置以编码窄频带信号S20的长期谐波结构的一个或一个以上模块。如图9所示,可使用的一个典型CELP范例包含开放式回路LPC分析模块,其编码短期特性或粗略频谱包络,之后是闭合式回路长期预测分析阶段,所述阶段编码精细音调或谐波结构。短期特性编码为滤波器系数,且长期特性编码为例如音调滞后和音调增益的参数的值。举例来说,窄频带编码器A120可经配置以便以包含一个或一个以上密码本索引(例如,固定密码本索引和自适应密码本索引)和相应增益值的形式输出经编码窄频带激励信号S50。窄频带残留信号的这种量化表示形式的计算(例如,通过量化器270)可包含选择这些索引和计算这些值。音调结构的编码还可包含内插音调原型波形,所述操作可包含计算连续音调脉冲之间的差。可针对对应于清语音(其通常类似于噪声且未系统化)的帧禁用长期结构的建模。
根据图9所示的范例的窄频带解码器B110的实施方案可经配置以在长期结构(音调或谐波结构)已恢复之后将窄频带激励信号S80输出到高频带解码器B200。举例来说,此解码器可经配置以输出窄频带激励信号S80作为经编码窄频带激励信号S50的解量化版本。当然,也可能实施窄频带解码器B110,使得高频带解码器B200执行经编码窄频带激励信号S50的解量化以获得窄频带激励信号S80。
在根据图9所示的范例的宽频带语音编码器A100的实施方案中,高频带编码器A200可经配置以接收由短期分析或白化滤波器产生的窄频带激励信号。换句话说,窄频带编码器A120可经配置以在编码长期结构之前将窄频带激励信号输出到高频带编码器A200。然而,高频带编码器A200需要从窄频带信道接收将由高频带解码器B200接收的相同编码信息,使得高频带编码器A200产生的编码参数可能已在某种程度上考虑所述信息的不理想性。因此,可能优选的是,高频带编码器A200从待由宽频带语音编码器A100输出的相同参数化和/或量化经编码窄频带激励信号S50中重建窄频带激励信号S80。此方法的一个潜在优点是较准确地计算下文描述的高频带增益因数S60b。
除了描述窄频带信号S20的短期和/或长期结构的参数外,窄频带编码器A120还可产生与窄频带信号S20的其它特性有关的参数值。这些值(其可能经适宜量化以由宽频带语音编码器A100输出)可包含在窄频带滤波器参数S40中或单独输出。高频带编码器A200也可经配置以根据这些额外参数中的一者或一者以上(例如,解量化之后)计算高频带编码参数S60。在宽频带语音解码器B100处,高频带解码器B200可经配置以经由窄频带解码器B110(例如,解量化之后)接收参数值。或者,高频带解码器B200可经配置以直接接收(且可能用于解量化)参数值。
在额外窄频带编码参数的一个实例中,窄频带编码器A120产生每一帧的频谱倾斜和语音模式参数的值。频谱倾斜与通带上频谱包络的形状有关,且通常由量化第一反射系数表示。对于大多数浊音,频谱能量随着频率的不断增加而减小,使得第一反射系数为负且可接近-1。大多数清音具有平整的频谱,从而使得第一反射系数接近零,或者在高频率下具有较多能量,从而使得第一反射系数为正且可接近+1。
语音模式(也称为发声模式)指示当前帧表示浊语音还是清语音。此参数可具有二进制值,其基于周期性的一个或一个以上指标(例如,零交叉、NACF、音调增益)和/或帧的声音活动(例如,此指标与阈值之间的关系)。在其它实施方案中,语音模式参数具有一个或一个以上其它状态以指示例如无声或背景噪声或无声与浊语音之间的转变的模式。
高频带编码器A200经配置以根据源-滤波器模型来编码高频带信号S30,其中此滤波器的激励是基于经编码窄频带激励信号。图10展示高频带编码器A200的实施方案A202的方块图,高频带编码器A200经配置以产生包含高频带滤波器参数S60a和高频带增益因数S60b的高频带编码参数S60流。高频带激励发生器A300从经编码窄频带激励信号S50中导出高频带激励信号S120。分析模块A210产生描述高频带信号S30的频谱包络的一组参数值。在此特定实例中,分析模块A210经配置以执行LPC分析以便为高频带信号S30的每一帧产生一组LP滤波器系数。线性预测滤波器系数-LSF变换410将所述组LP滤波器系数变换为一组相应的LSF。如上文参照分析模块210和变换220所述,分析模块A210和/或变换410可经配置以使用其它系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。
量化器420经配置以量化所述组高频带LSF(或其它系数表示形式,例如ISP),且高频带编码器A202经配置以输出此量化的结果作为高频带滤波器参数S60a。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
高频带编码器A202还包含合成滤波器A220,其经配置以根据分析模块A210产生的高频带激励信号S120和经编码频谱包络(例如,所述组LP滤波器系数)来产生合成高频带信号S130。合成滤波器A220通常实施为IIR滤波器,但也可使用FIR实施方案。在特定实例中,合成滤波器A220实施为六次线性自回归滤波器。
高频带增益因数计算器A230计算原始高频带信号S30与合成高频带信号S130的电平之间的一个或一个以上差,以指定帧的增益包络。量化器430可实施为将输入向量编码为对于表或密码本中的相应向量条目的索引的向量量化器,其量化指定增益包络的值(一或多个),且高频带编码器A202经配置以输出此量化的结果作为高频带增益因数S60b。
在如图10所示的实施方案中,合成滤波器A220经配置以从分析模块A210接收滤波器系数。高频带编码器A202的替代实施方案包含反转量化器和反转变换,其经配置以从高频带滤波器参数S60a中解码滤波器系数,且在此情况下合成滤波器A220经配置以改为接收经解码滤波器系数。此替代配置可支持由高频带增益计算器A230较准确地计算增益包络。
在一个特定实例中,分析模块A210和高频带增益计算器A230分别每帧输出一组六个LSF和一组五个增益值,使得可仅用每帧十一个额外值来实现窄频带信号S20的宽频带延伸。耳朵对于高频率下的频率误差往往较不敏感,因而低LPC级的高频带编码可产生具有可与较高LPC级的窄频带编码相比的感知质量的信号。高频带编码器A200的典型实施方案可经配置以每帧输出8到12位用于频谱包络的高质量重建,以及每帧输出另外8到12位用于时间包络的高质量重建。在另一特定实例中,分析模块A210每帧输出一组八个LSF。
高频带编码器A200的一些实施方案经配置以通过以下方式产生高频带激励信号S120:产生具有高频带频率分量的随机噪声信号,并根据窄频带信号S20、窄频带激励信号S80或高频带信号S30的时域包络对噪声信号进行幅值调制。虽然这种基于噪声的方法对于清音可产生适当结果,然而,其对于浊音可能不理想,浊音的残留通常为谐波且因此具有某种周期性结构。
高频带激励发生器A300经配置以通过将窄频带激励信号S80的频谱延伸到高频带频率范围中来产生高频带激励信号S120。图11展示高频带激励发生器A300的实施方案A302的方块图。反转量化器450经配置以解量化经编码窄频带激励信号S50以产生窄频带激励信号S80。频谱延伸器A400经配置以基于窄频带激励信号S80产生谐波延伸信号S160。组合器470经配置以将噪声发生器480产生的随机噪声信号与包络计算器460计算的时域包络组合以产生经调制噪声信号S170。组合器490经配置以将谐波延伸信号S60与经调制噪声信号S170混合以产生高频带激励信号S120。
在一个实例中,频谱延伸器A400经配置以对窄频带激励信号S80执行频谱折叠操作(也称为镜射)以产生谐波延伸信号S160。频谱折叠可由零塞入激励信号S80执行且接着应用高通滤波器来保留伪信号。在另一实例中,频谱延伸器A400经配置以通过将窄频带激励信号S80频谱转译到高频带中(例如,经由向上取样,之后与恒定频率余弦信号相乘)来产生谐波延伸信号S160。
频谱折叠和转译方法可产生谐波结构在相位和/或频率上与窄频带激励信号S80的原始谐波结构不连续的频谱延伸信号。举例来说,此类方法可产生具有通常不位于基频的倍数处的峰值的信号,这可能在重建的语音信号中引起声音微弱的假象。这些方法往往还产生具有不自然较强音调特性的高频率谐波。然而,因为PSTN信号可在8kHz下取样但带宽被限制为不大于3400Hz,所以窄频带激励信号S80的上部频谱可能含有极少或不含有能量,使得根据频谱折叠或频谱转译操作产生的延伸信号可具有3400Hz以上的频谱缺陷。
产生谐波延伸信号S160的其它方法包含识别窄频带激励信号S80的一个或一个以上基频,和根据所述信息产生谐音。举例来说,激励信号的谐波结构可由基频与幅值和相位信息一起描述。高频带激励发生器A300的另一实施方案基于基频和幅值(例如,如由音调滞后和音调增益指示)来产生谐波延伸信号S160。然而,除非谐波延伸信号与窄频带激励信号S80在相位上相干,否则所得的经解码语音的质量可能不可接受。
可使用非线性函数来产生与窄频带激励相位上相干并保持谐波结构而没有相位不连续性的高频带激励信号。非线性函数还可提供高频率谐波之间的增加的噪声电平,其往往比通过例如频谱折叠和频谱转译的方法产生的音调高频率谐波听起来更为自然。可由频谱延伸器A400的各种实施方案应用的典型无记忆非线性函数包含绝对值函数(也称为全波整流)、半波整流、平方、立方和削波。频谱延伸器A400的其它实施方案可经配置以应用具有记忆的非线性函数。
图12是频谱延伸器A400的实施方案A402的方块图,频谱延伸器A400经配置以应用非线性函数来延伸窄频带激励信号S80的频谱。向上取样器510经配置以对窄频带激励信号S80进行向上取样。可能需要对信号进行充分向上取样以使应用非线性函数时的混叠最小化。在一个特定实例中,向上取样器510以8为因数对信号进行向上取样。向上取样器510可经配置以通过对输入信号进行零塞入并对结果进行低通滤波来执行向上取样操作。非线性函数计算器520经配置以将非线性函数应用于向上取样信号。对于频谱延伸而言,绝对值函数相对于其它非线性函数(例如,平方函数)的一个潜在优点是,不需要能量标准化。在一些实施方案中,可通过剥离或清除每一样本的符号位来有效地应用绝对值函数。非线性函数计算器520还可经配置以执行向上取样信号或频谱延伸信号的幅值偏差。
向下取样器530经配置以对应用非线性函数的频谱延伸结果进行向下取样。向下取样器530可能需要执行带通滤波操作以在减小取样速率(例如,以便减小或避免由于不必要图像引起的混叠或讹误)之前选择频谱延伸信号的所需频带。向下取样器530可能还需要在一个以上阶段减小取样速率。
图12a是展示频谱延伸操作的一个实例中各点处的信号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号S80已被以8为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的延伸频谱的实例。曲线(d)展示低通滤波之后的频谱。在此实例中,通带延伸到高频带信号S30的频率上限(例如,7kHz或8kHz)。
曲线(e)展示向下取样的第一阶段之后的频谱,其中使取样速率以4为因数减小以获得宽频带信号。曲线(f)展示进行高通滤波操作以选择延伸信号的高频带部分之后的频谱,且曲线(g)展示向下取样的第二阶段之后的频谱,其中使取样速率以2为因数减小。在一个特定实例中,向下取样器530通过使宽频带信号通过滤波器组A112(或具有相同响应的其它结构或例行程序)的高通滤波器130和向下取样器140来执行高通滤波和向下取样的第二阶段,以产生具有高频带信号S30的频率范围和取样速率的频谱延伸信号。
如曲线(g)中可见,曲线(f)所示的高通信号的向下取样促使其频谱反转。在此实例中,向下取样器530还经配置以对信号执行频谱翻转操作。曲线(h)展示应用频谱翻转操作的结果,所述频谱翻转操作可通过将信号与函数ejnπ或序列(-1)n相乘来执行,所述序列(-1)n的值在+1与-1之间交替。此操作等效于在频域中将信号的数字频谱移位距离π。注意到,还可通过以不同次序应用向下取样和频谱翻转操作来获得相同结果。向上取样和/或向下取样的操作还可经配置以包含再取样来获得具有高频带信号S30的取样速率(例如,7kHz)的频谱延伸信号。
如上文注意到,滤波器组A110和B120可经实施使得窄频带和高频带信号S20、S30中的一者或两者在滤波器组A110的输出处具有频谱反转形式,以频谱反转形式被编码和解码,并在宽频带语音信号S110中输出之前在滤波器组B120处再次频谱反转。当然,在此情况下,将不需要如图12a所示的频谱翻转操作,因为高频带激励信号S120将也需要具有频谱反转形式。
频谱延伸器A402执行的频谱延伸操作的向上取样和向下取样的各个任务可以许多不同方式配置和安排。举例来说,图12b是展示频谱延伸操作的另一实例中各点处的信号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号S80已被以2为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的延伸频谱的实例。在此情况下,接受较高频率中可能发生的混叠。
曲线(d)展示频谱反转操作之后的频谱。曲线(e)展示向下取样的单一阶段之后的频谱,其中使取样速率以2为因数减小以获得所需频谱延伸信号。在此实例中,所述信号采取频谱反转形式,且可用于处理采取此形式的高频带信号S30的高频带编码器A200的实施方案中。
非线性函数计算器520产生的频谱延伸信号很可能随着频率增加而幅值明显降低。频谱延伸器A402包含频谱整平器540,其经配置以对经向下取样信号执行白化操作。频谱整平器540可经配置以执行固定白化操作或执行自适应白化操作。在自适应白化的特定实例中,频谱整平器540包含:LPC分析模块,其经配置以依据经向下取样信号计算一组四个滤波器系数;以及四次分析滤波器,其经配置以根据那些系数对信号进行白化。频谱延伸器A400的其它实施方案包含频谱整平器540在向下取样器530之前对频谱延伸信号操作的配置。
可实施高频带激励发生器A300以输出谐波延伸信号S160作为高频带激励信号S120。然而,在一些情况下,仅使用谐波延伸信号作为高频带激励可能导致可听到的假象。语音的谐波结构在高频带中通常不如低频带中明显,且在高频带激励信号中使用过多谐波结构可能导致嗡嗡声。此假象在来自女性说话者的语音信号中可能尤其明显。
实施例包含经配置以将谐波延伸信号S160与噪声信号混合的高频带激励发生器A300的实施方案。如图11所示,高频带激励发生器A302包含噪声发生器480,其经配置以产生随机噪声信号。在一个实例中,噪声发生器480经配置以产生单位方差白色伪随机噪声信号,但在其它实施方案中,噪声信号不需要为白色的且可具有随着频率变化的功率密度。噪声发生器480可能需要经配置以输出噪声信号作为确定性函数以便可在解码器处复制其状态。举例来说,噪声发生器480可经配置以输出噪声信号作为早先在相同帧内编码的信息(例如,窄频带滤波器参数S40和/或经编码窄频带激励信号S50)的确定性函数。
在与谐波延伸信号S160混合之前,噪声发生器480产生的随机噪声信号可经幅值调制以具有近似窄频带信号S20、高频带信号S30、窄频带激励信号S80或谐波延伸信号S160的随时间能量分布的时域包络。如图11所示,高频带激励发生器A302包含组合器470,其经配置以根据包络计算器460计算的时域包络对噪声发生器480产生的噪声信号进行幅值调制。举例来说,组合器470可实施为乘法器,其经配置以根据包络计算器460计算的时域包络来缩放噪声发生器480的输出以产生经调制噪声信号S170。
如图13的方块图所示,在高频带激励发生器A302的实施方案A304中,包络计算器460经配置以计算谐波延伸信号S160的包络。如图14的方块图所示,在高频带激励发生器A302的实施方案A306中,包络计算器460经配置以计算窄频带激励信号S80的包络。高频带激励发生器A302的另外的实施方案可以其它方式配置以根据窄频带音调脉冲的位置及时向谐波延伸信号S160添加噪声。
包络计算器460可经配置以作为一项包含一系列子任务的任务而执行包络计算。图15展示此任务的实例T100的流程图。子任务T110计算包络待建模的信号(例如,窄频带激励信号S80或谐波延伸信号S160)的帧的每一样本的平方以产生平方值序列。子任务T120对平方值序列执行平滑操作。在一个实例中,子任务T120根据以下表达式向序列应用一次IIR低通滤波器:
y(n)=ax(n)+(1-a)y(n-1),    (1)
其中x是滤波器输入,y是滤波器输出,n是时域索引,且a是具有0.5与1之间的值的平滑系数。平滑系数a的值可为固定的,或者在替代实施方案中,可根据输入信号中噪声的指示而自适应,使得在无噪声的情况下a较接近1,且在存在噪声的情况下较接近0.5。子任务T130将平方根函数应用于经平滑序列的每一样本以产生时域包络。
包络计算器460的此实施方案可经配置以按照串行和/或并行方式执行任务T100的各个子任务。在任务T100的另外的实施方案中,子任务T110之前可以是带通操作,其经配置以选择包络待建模的信号的所需频率部分,例如3-4kHz范围。
组合器490经配置以将谐波延伸信号S160与经调制噪声信号S170混合以产生高频带激励信号S120。组合器490的实施方案可经配置(例如)以将高频带激励信号S120计算为谐波延伸信号S160与经调制噪声信号S170的和。组合器490的此实施方案可经配置以通过在求和之前向谐波延伸信号S160和/或向经调制噪声信号S170应用加权因数,而将高频带激励信号S120计算为加权总和。可根据一个或一个以上标准来计算每一此类加权因数,且所述加权因数可为固定值,或者在逐帧或逐子帧基础上计算出的自适应值。
图16展示组合器490的实施方案492的方块图,所述实施方案492经配置以将高频带激励信号S120计算为谐波延伸信号S160与经调制噪声信号S170的加权总和。组合器492经配置以根据谐波加权因数S180加权谐波延伸信号S160,根据噪声加权因数S190加权经调制噪声信号S170,并输出高频带激励信号S120作为被加权信号的总和。在此实例中,组合器492包含加权因数计算器550,其经配置以计算谐波加权因数S180和噪声加权因数S190。
加权因数计算器550可经配置以根据高频带激励信号S120中谐波含量与噪声含量的所需比率来计算加权因数S180和S190。举例来说,组合器492可能需要产生高频带激励信号S120以具有与高频带信号S30的谐波能量与噪声能量比类似的谐波能量与噪声能量比。在加权因数计算器550的一些实施方案中,根据与窄频带信号S20或窄频带残留信号的周期性有关的一个或一个以上参数(例如,音调增益和/或语音模式)来计算加权因数S180、S190。加权因数计算器550的此实施方案可经配置以向谐波加权因数S180指派(例如)与音调增益成比例的值,且/或对于清语音信号比对于浊语音信号向噪声加权因数S190指派更高的值。
在其它实施方案中,加权因数计算器550经配置以根据高频带信号S30的周期性的指标来计算谐波加权因数S180和/或噪声加权因数S190的值。在一个此类实例中,加权因数计算器550将谐波加权因数S180计算为高频带信号S30的当前帧或子帧的自相关系数的最大值,其中在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围上执行自相关。图17展示以一个音调滞后的延迟为中心并具有不大于一个音调滞后的宽度的长度为n个样本的此搜索范围的实例。
图17还展示加权因数计算器550在若干阶段计算高频带信号S30的周期性的指标的另一方法的实例。在第一阶段,将当前帧划分为许多子帧,且针对每一子帧单独识别自相关系数为最大时的延迟。如上文所提及,在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围上执行自相关。
在第二阶段,通过将相应识别的延迟应用于每一子帧,连接所得的子帧以建立最佳延迟帧,并将谐波加权因数S180计算为原始帧与最佳延迟帧之间的相关系数,来建立延迟帧。在另一替代实施方案中,加权因数计算器550将谐波加权因数S180计算为第一阶段中针对每一子帧获得的最大自相关系数的平均值。加权因数计算器550的实施方案还可经配置以缩放相关系数,和/或将其与另一值组合,以计算谐波加权因数S180的值。
加权因数计算器550可能需要仅在以其它方式指示帧存在周期性的情况下计算高频带信号S30的周期性的指标。举例来说,加权因数计算器550可经配置以根据当前帧的周期性的另一指示符(例如,音调增益)与阈值之间的关系来计算高频带信号S30的周期性的指标。在一个实例中,加权因数计算器550经配置以仅当帧的音调增益(例如,窄频带残留的自适应密码本增益)的值大于0.5(或者,至少0.5)时才对高频带信号S30执行自相关运算。在另一实例中,加权因数计算器550经配置以仅针对具有特定语音模式状态的帧(例如,仅针对浊音信号)对高频带信号S30执行自相关运算。在此类情况下,加权因数计算器550可经配置以针对具有其它语音模式状态和/或较小的音调增益值的帧分派默认加权因数。
实施例包含经配置以根据不同于周期性或除周期性以外的特性来计算加权因数的加权因数计算器550的另外的实施方案。举例来说,此实施方案可经配置以针对具有大音调滞后的语音信号比针对具有小音调滞后的语音信号向噪声增益因数S190分派更大的值。加权因数计算器550的另一此类实施方案经配置以根据处于基频的倍数处的信号能量相对于处于其它频率分量处的信号能量的指标,来确定宽频带语音信号S10或高频带信号S30的谐度的指标。
宽频带语音编码器A100的一些实施方案经配置以基于本文描述的音调增益和/或周期性或谐度的另一指标来输出周期性或谐度的指示(例如,指示帧为谐波还是非谐波的1位旗标)。在一个实例中,相应的宽频带语音解码器B100使用此指示来配置例如加权因数计算的操作。在另一实例中,此指示用于编码器和/或解码器处来计算语音模式参数的值。
可能需要高频带激励发生器A302产生高频带激励信号S120,使得激励信号的能量大致不受加权因数S180和S190的特定值的影响。在此情况下,加权因数计算器550可经配置以计算谐波加权因数S180或噪声加权因数S190的值(或从存储装置或高频带编码器A200的另一元件接收此值),并根据例如以下表达式导出另一加权因数的值:
(W谐波)2+(W噪声)2=1,    (2)
其中W谐波表示谐波加权因数S180,且W噪声表示噪声加权因数S190。或者,加权因数计算器550可经配置以根据当前帧或子帧的周期性指标的值从多对加权因数S180、S190中选出相应一者,其中所述对经预先计算以满足例如表达式(2)的恒定能量比。对于遵循表达式(2)的加权因数计算器550的实施方案,谐波加权因数S180的典型值在约0.7到约1.0范围内,且噪声加权因数S190的典型值在约0.1到约0.7范围内。加权因数计算器550的其它实施方案可经配置以根据一种形式的表达式(2)来操作,所述形式的表达式(2)依据谐波延伸信号S160与经调制噪声信号S170之间的所需基线加权进行修改。
当已使用稀疏密码本(条目大部分为零值的密码本)来计算残留的量化表示形式时,合成语音信号中可能发生假象。尤其当以低位速率编码窄频带信号时,会发生密码本稀疏。密码本稀疏引起的假象通常在时间上是准周期性的,且主要在3kHz以上发生。因为人耳在较高频率下具有较好的时间分辨能力,所以这些假象在高频带中可能较明显。
实施例包含经配置以执行抗稀疏滤波的高频带激励发生器A300的实施方案。图18展示高频带激励发生器A302的实施方案A312的方块图,所述实施方案A312包含抗稀疏滤波器600,其经配置以对反转量化器450产生的经解量化窄频带激励信号进行滤波。图19展示高频带激励发生器A302的实施方案A314的方块图,所述实施方案A314包含抗稀疏滤波器600,其经配置以对频谱延伸器A400产生的频谱延伸信号进行滤波。图20展示高频带激励发生器A302的实施方案A316的方块图,所述实施方案A316包含抗稀疏滤波器600,其经配置以对组合器490的输出进行滤波以产生高频带激励信号S120。当然,预期并在此明确地揭示将实施方案A304和A306的任一者的特征与实施方案A312、A314和A316的任一者的特征组合的高频带激励发生器A300的实施方案。抗稀疏滤波器600也可配置在频谱延伸器A400内:例如在频谱延伸器A402中的元件510、520、530和540的任一者之后。特别注意到,抗稀疏滤波器600也可用于频谱延伸器A400的执行频谱折叠、频谱转译或谐波延伸的实施方案。
抗稀疏滤波器600可经配置以改变其输入信号的相位。举例来说,抗稀疏滤波器600可能需要经配置和安排,使得高频带激励信号S120的相位随着时间随机化或其它方式更为均匀地分布。可能还需要抗稀疏滤波器600的响应为频谱整平的,使得经滤波信号的幅值频谱不会有相当大的改变。在一个实例中,抗稀疏滤波器600根据以下表达式实施为具有转移函数的全通滤波器:
H ( z ) = - 0.7 + z - 4 1 - 0.7 z - 4 · 0.6 + z - 6 1 + 0.6 z - 6 . - - - ( 3 )
此滤波器的一个作用可以是将输入信号的能量散布开使得其不再仅集中于几个样本中。
密码本稀疏引起的假象通常对于其中残留包含较少音调信息的类似噪声的信号较明显,且对于背景噪声中的语音也较明显。稀疏在激励具有长期结构的情况下通常引起较少假象,且事实上相位修改可引起浊音信号中的噪声。因此,可能需要配置抗稀疏滤波器600以对清音信号进行滤波并在不作出改变的情况下使至少一些浊音信号通过。清音信号的特征在于低音调增益(例如,量化窄频带自适应密码本增益)和接近零或为正的频谱倾斜(例如,量化第一反射系数),从而指示整平或随着频率的不断增加而向上倾斜的频谱包络。抗稀疏滤波器600的典型实施方案经配置以对清音(例如,如频谱倾斜的值所指示)进行滤波,当音调增益低于阈值(或者,不大于阈值)时对浊音进行滤波,且否则在不作出改变的情况下使信号通过。
抗稀疏滤波器600的另外的实施方案包含两个或两个以上滤波器,其经配置以具有不同的最大相位修改角(例如,高达180度)。在此情况下,抗稀疏滤波器600可经配置以根据音调增益(例如,量化自适应密码本或LTP增益)的值在这些组成滤波器中进行选择,以便将较大的最大相位修改角用于具有较低音调增益值的帧。抗稀疏滤波器600的实施方案还可包含不同的组成滤波器,其经配置以在频谱的或多或少的部分上修改相位,以便将经配置以在输入信号的较宽频率范围上修改相位的滤波器用于具有较低音调增益值的帧。
为了准确地复制经编码语音信号,可能需要使合成宽频带语音信号S100的高频带与窄频带部分的电平之间的比率类似于原始宽频带语音信号S10中的所述比率。除了高频带编码参数S60a表示的频谱包络外,高频带编码器A200还可经配置以通过指定时间或增益包络来表征高频带信号S30。如图10所示,高频带编码器A202包含高频带增益因数计算器A230,其经配置和安排以根据高频带信号S30与合成高频带信号S130之间的关系(例如,所述两个信号在帧或其某一部分上的能量之间的差或比率)来计算一个或一个以上增益因数。在高频带编码器A202的其它实施方案中,高频带增益计算器A230可同样地配置但改为经安排以根据高频带信号S30与窄频带激励信号S80或高频带激励信号S120之间的这种时间变化关系来计算增益包络。
窄频带激励信号S80和高频带信号S30的时间包络很可能类似。因此,编码基于高频带信号S30与窄频带激励信号S80(或从中导出的信号,例如高频带激励信号S120或合成高频带信号S130)之间的关系的增益包络通常将比编码仅基于高频带信号S30的增益包络有效。在典型实施方案中,高频带编码器A202经配置以输出为每一帧指定5个增益因数的8到12位的量化索引。
高频带增益因数计算器A230可经配置以作为一项包含一个或一个以上系列的子任务的任务而执行增益因数计算。图21展示根据高频带信号S30与合成高频带信号S130的相对能量计算相应子帧的增益值的任务的实例T200的流程图。任务220a和220b计算各个信号的相应子帧的能量。举例来说,任务220a和220b可经配置以将能量计算为各个子帧的样本的平方的和。任务T230将子帧的增益因数计算为那些能量的比率的平方根。在此实例中,任务T230将增益因数计算为子帧上高频带信号S30的能量与合成高频带信号S130的能量的比率的平方根。
高频带增益因数计算器A230可能需要经配置以根据窗口函数来计算子帧能量。图22展示增益因数计算任务T200的此实施方案T210的流程图。任务T215a将窗口函数应用于高频带信号S30,且任务T215b将相同窗口函数应用于合成高频带信号S130。任务220a和220b的实施方案222a和222b计算各自窗口的能量,且任务T230将子帧的增益因数计算为能量的比率的平方根。
可能需要应用与邻近子帧重叠的窗口函数。举例来说,可以重叠-相加方式应用的产生增益因数的窗口函数可帮助减小或避免子帧之间的不连续性。在一个实例中,高频带增益因数计算器A230经配置以应用如图23a所示的梯形窗口函数,其中窗口与两个邻近子帧的每一者重叠一毫秒。图23b展示将此窗口函数应用于20毫秒帧的五个子帧的每一者。高频带增益因数计算器A230的其它实施方案可经配置以应用具有不同重叠周期和/或不同窗口形状(例如,矩形、汉明)(其可对称或不对称)的窗口函数。高频带增益因数计算器A230的实施方案还可能经配置以将不同窗口函数应用于帧内的不同子帧和/或包含具有不同长度的子帧的帧。
提供以下值(没有限制)作为特定实施方案的实例。针对这些情况假定一个20毫秒的帧,但可使用任何其它持续时间。对于以7kHz取样的高频带信号,每一帧具有140个样本。如果将此帧划分为具有相等长度的五个子帧,那么每一子帧将具有28个样本,且如图23a所示的窗口将为42个样本宽。对于以8kHz取样的高频带信号,每一帧具有160个样本。如果此帧划分为具有相等长度的五个子帧,那么每一子帧将具有32个样本,且如图23a所示的窗口将为48个样本宽。在其它实施方案中,可使用具有任何宽度的子帧,且甚至可能使高频带增益计算器A230的实施方案经配置以针对帧的每一样本产生不同的增益因数。
图24展示高频带解码器B200的实施方案B202的方块图。高频带解码器B202包含高频带激励发生器B300,其经配置以基于窄频带激励信号S80产生高频带激励信号S120。视特定系统设计选择而定,可根据本文描述的高频带激励发生器A300的实施方案的任一者来实施高频带激励发生器B300。通常,需要将高频带激励发生器B300实施为具有与特定编码系统的高频带编码器的高频带激励发生器相同的响应。然而,因为窄频带解码器B110通常将执行经编码窄频带激励信号S50的解量化,所以在大多数情况下,高频带激励发生器B300可经实施以从窄频带解码器B110接收窄频带激励信号S80,而不需要包含经配置以对经编码窄频带激励信号S50解量化的反转量化器。窄频带解码器B110也可能经实施以包含抗稀疏滤波器600的实例,其经配置以在将经解量化的窄频带激励信号输入到例如滤波器330的窄频带合成滤波器之前对所述信号进行滤波。
反转量化器560经配置以对高频带滤波器参数S60a(在此实例中为一组LSF)解量化,且LSF-LP滤波器系数变换570经配置以将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化器240和变换250所描述)。在其它实施方案中,如上文所提及,可使用不同系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。高频带合成滤波器B200经配置以根据高频带激励信号S120和所述组滤波器系数产生合成高频带信号。对于其中高频带编码器包含合成滤波器的系统(例如,如上述编码器A202的实例中),可能需要将高频带合成滤波器B200实施为具有与所述合成滤波器相同的响应(例如,相同转移函数)。
高频带解码器B202还包含经配置以对高频带增益因数S60b解量化的反转量化器580,和经配置和安排以将经解量化的增益因数应用于合成高频带信号以产生高频带信号S100的增益控制元件590(例如,乘法器或放大器)。对于其中帧的增益包络由一个以上增益因数指定的情况,增益控制元件590可包含经配置以可能根据窗口函数将增益因数应用于各个子帧的逻辑,所述窗口函数可与由相应高频带编码器的增益计算器(例如,高频带增益计算器A230)应用的窗口函数相同或不同。在高频带解码器B202的其它实施方案中,增益控制元件590经类似地配置但经安排以改为将经解量化的增益因数应用于窄频带激励信号S80或应用于高频带激励信号S120。
如上文所提及,可能需要在高频带编码器与高频带解码器中获得相同状态(例如,通过在编码期间使用经解量化值)。因此,可能需要在根据此实施方案的编码系统中确保高频带激励发生器A300和B300中的相应噪声发生器具有相同状态。举例来说,此实施方案的高频带激励发生器A300和B300可经配置而使得噪声发生器的状态是相同帧内已编码的信息(例如,窄频带滤波器参数S40或其一部分,和/或经编码窄频带激励信号S50或其一部分)的确定性函数。
本文描述的元件的量化器中的一者或一者以上(例如,量化器230、420或430)可经配置以执行分类向量量化。举例来说,此量化器可经配置以基于窄频带信道中和/或高频带信道中的相同帧内已编码的信息从一组密码本中选出一个密码本。此技术通常以存储额外的密码本为代价提供增加的编码效率。
如上文参看例如图8和9所论述,在从窄频带语音信号S20中去除粗略频谱包络之后,相当大量的周期性结构可能保留在残留信号中。举例来说,残留信号可随时间而含有粗略周期性脉冲或尖峰信号序列。此结构(通常与音调有关)尤其有可能发生在浊音语音信号中。窄频带残留信号的量化表示形式的计算可包含根据由(例如)一个或一个以上密码本表示的长期周期性的模型来编码此音调结构。
实际残留信号的音调结构可能不与周期性模型完全匹配。举例来说,残留信号可能包含音调脉冲的位置规则性的较小抖动,使得帧中连续音调脉冲之间的距离不完全相等且所述结构并非相当规则。这些不规则性往往会降低编码效率。
窄频带编码器A120的一些实施方案经配置以通过在量化之前或期间将自适应时间偏差应用于残留,或通过以其它方式在经编码激励信号中包含自适应时间偏差,来执行音调结构的规则化。举例来说,此编码器可经配置以选择或以其它方式计算时间偏差的程度(例如,根据一个或一个以上感知加权和/或误差最小化标准),使得所得的激励信号与长期周期性的模型最佳拟和。音调结构的规则化由称为松弛代码激励线性预测(RCELP)编码器的CELP编码器子组执行。
RCELP编码器通常经配置以执行时间偏差作为自适应时移。此时移可为负几毫秒到正几毫秒范围的延迟,且其通常平滑地变化以避免可听到的不连续性。在一些实施方案中,此编码器经配置以用分段方式应用规则化,其中每一帧或子帧偏差相应的固定时移。在其它实施方案中,编码器经配置以应用规则化作为连续偏差函数,使得帧或子帧根据音调轮廓(也称为音调轨迹)而偏差。在一些情况下(例如,如第2004/0098255号美国专利申请公开案中所描述),编码器经配置以通过将偏移应用于用于计算经编码激励信号的感知加权输入信号而在经编码激励信号中包含时间偏差。
编码器计算规则化和量化的经编码激励信号,且解码器对经编码激励信号解量化以获得用于合成经解码语音信号的激励信号。经解码输出信号因此展现出与通过规则化而包含在经编码激励信号中的延迟相同的变化的延迟。通常,不将任何指定规则化量的信息传输到解码器。
规则化往往使残留信号较易编码,这改进了来自长期预测器的编码增益且因此推进了总体编码效率,而通常不会产生假象。可能需要仅对浊音帧执行规则化。举例来说,窄频带编码器A124可经配置以仅偏移那些具有长期结构(例如,浊音信号)的帧或子帧。甚至可能需要仅对包含音调脉冲能量的子帧执行规则化。第5,704,003号美国专利(Kleijn等人)和第6,879,955号美国专利(Rao)和第2004/0098255号美国专利申请公开案(Kovesi等人)中描述了RCELP编码的各种实施方案。RCELP编码器的现有实施方案包含如电信工业协会(TIA)IS-127中所描述的增强可变速率编译码器(EVRC),和第三代合作伙伴关系计划2(3GPP2)可选模式声码器(SMV)。
不幸的是,规则化对于其中从经编码窄频带激励信号导出高频带激励的宽频带语音编码器(例如,包含宽频带语音编码器A100和宽频带语音解码器B100的系统)可能导致若干问题。由于高频带激励信号相对于时间偏差信号的偏转,所以高频带激励信号通常将具有与原始高频带语音信号的时间表不同的时间表。换句话说,高频带激励信号将不再与原始高频带语音信号同步。
偏差高频带激励信号与原始高频带语音信号之间的时间上的不对准可能引起若干问题。举例来说,偏差高频带激励信号可能不再为根据从原始高频带语音信号中提取的滤波器参数配置的合成滤波器提供适宜的源激励。因此,合成高频带信号可含有减小经解码宽频带语音信号的感知质量的可听到的假象。
时间上的不对准还可能引起增益包络编码的低效率。如上文所提及,窄频带激励信号S80与高频带信号S30的时间包络之间很可能存在相关。通过根据这两个时间包络之间的关系编码高频带信号的增益包络,与直接编码增益包络相比可实现编码效率的提高。然而,当经编码窄频带激励信号规则化时,此相关可能削弱。窄频带激励信号S80与高频带信号S30之间的时间上的不对准可导致高频带增益因数S60b中出现波动,且编码效率可能降低。
实施例包含根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执行时间偏差的宽频带语音编码方法。此类方法的潜在优点包含改进经解码宽频带语音信号的质量和/或改进编码高频带增益包络的效率。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。编码器AD10包含窄频带编码器A120的实施方案A124,所述实施方案A124经配置以在计算经编码窄频带激励信号S50期间执行规则化。举例来说,窄频带编码器A124可根据上文论述的RCELP实施方案中的一者或一者以上配置。
窄频带编码器A124还经配置以输出指定所应用的时间偏差的程度的规则化数据信号SD10。对于窄频带编码器A124经配置以将固定时移应用于每一帧或子帧的各种情况,规则化数据信号SD10可包含一系列值,其以样本、毫秒或某一其它时间增量为单位将每一时移量指示为整数或非整数值。对于窄频带编码器A124经配置以用其它方式修改帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)的情况,规则化信息信号SD10可包含对修改的相应描述,例如一组函数参数。在一个特定实例中,窄频带编码器A124经配置以将帧划分为三个子帧并计算每一子帧的固定时移,使得规则化数据信号SD10指示经编码窄频带信号的每一规则化帧的三个时移量。
宽频带语音编码器AD10包含延迟线D120,其经配置以根据由输入信号指示的延迟量来推进或阻滞高频带语音信号S30的若干部分,从而产生时间偏差高频带语音信号S30a。在图25所示的实例中,延迟线D120经配置以根据由规则化数据信号SD10指示的偏差来对高频带语音信号S30执行时间偏差。以此方式,经编码窄频带激励信号S50中包含的相同时间偏差量也在分析之前应用于高频带语音信号S30的相应部分。尽管此实例将延迟线D120展示为高频带编码器A200的单独元件,但在其它实施方案中,延迟线D120配置为高频带编码器的一部分。
高频带编码器A200的另外的实施方案可经配置以执行未偏差高频带语音信号S30的频谱分析(例如,LPC分析),并在计算高频带增益参数S60b之前执行高频带语音信号S30的时间偏差。此编码器可包含(例如)经配置以执行时间偏差的延迟线D120的实施方案。然而,在此类情况下,基于对未偏差信号S30的分析的高频带滤波器参数S60a可描述与高频带激励信号S120在时间上不对准的频谱包络。
延迟线D120可根据适于将所需时间偏差操作应用于高频带语音信号S30的逻辑元件与存储元件的任何组合来配置。举例来说,延迟线D120可经配置以根据所需的时移从缓冲器中读取高频带语音信号S30。图26a展示延迟线D120的此实施方案D122的示意图,所述延迟线D120包含移位寄存器SR1。移位寄存器SR1是经配置以接收和存储高频带语音信号S30的m个最新近样本的具有大约长度m的缓冲器。值m至少等于将支持的最大正(或“推进”)与负(或“阻滞”)时移的总和。值m等于高频带信号S30的帧或子帧的长度可能会较方便。
延迟线D122经配置以从移位寄存器SR1的偏移位置OL输出时间偏差高频带信号S30a。偏移位置OL的定位根据由例如规则化数据信号SD10指示的当前时移而在参考位置(零时移)附近变化。延迟线D122可经配置以支持相等的推进和阻滞限制,或者一个限制大于另一限制,使得可在一个方向上比在另一方向上执行更大偏移。图26a展示支持的正时移大于负时移的特定实例。延迟线D122可经配置以一次输出一个或一个以上样本(例如视输出总线宽度而定)。
具有大于几毫秒的量值的规则化时移可引起经解码信号中的可听到的假象。通常,由窄频带编码器A124执行的规则化时移的量值将不超过几毫秒,使得由规则化数据信号SD10指示的时移将有限。然而,在此类情况下可能需要延迟线D122经配置以对正和/或负方向上的时移强加最大限制(例如,以遵循比窄频带编码器强加的限制更为严格的限制)。
图26b展示延迟线D122的实施方案D124的示意图,延迟线D122包含移位窗口SW。在此实例中,偏移位置OL的定位受移位窗口SW限制。尽管图26b展示缓冲器长度m大于移位窗口SW的宽度的情况,但延迟线D124也可经实施使得移位窗口SW的宽度等于m。
在其它实施方案中,延迟线D120经配置以根据所需时移将高频带语音信号S30写入到缓冲器。图27展示延迟线D120的实施方案D130的示意图,所述实施方案D130包含经配置以接收和存储高频带语音信号S30的两个移位寄存器SR2和SR3。延迟线D130经配置以根据例如由规则化数据信号SD10指示的时移而将来自移位寄存器SR2的帧或子帧写入到移位寄存器SR3。移位寄存器SR3配置为FIFO缓冲器,其经配置以输出时间偏差高频带信号S30。
在图27所示的特定实例中,移位寄存器SR2包含帧缓冲器部分FB1和延迟缓冲器部分DB,且移位寄存器SR3包含帧缓冲器部分FB2、推进缓冲器部分AB和阻滞缓冲器部分RB。推进缓冲器AB和阻滞缓冲器RB的长度可相等,或者其中一者可大于另一者,使得所支持的一个方向上的偏移大于所支持的另一方向上的偏移。延迟缓冲器DB和阻滞缓冲器部分RB可经配置以具有相同长度。或者,延迟缓冲器DB可比阻滞缓冲器RB短以考虑到将样本从帧缓冲器FB1转移到移位寄存器SR3所需的时间间隔,所述转移可包含例如在存储到移位寄存器SR3之前先使样本偏差的其它处理操作。
在图27的实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个帧的长度相等的长度。在另一实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个子帧的长度相等的长度。在此情况下,延迟线D130可经配置以包含用于将相同(例如,平均)延迟应用于待偏移的帧的所有子帧的逻辑。延迟线D130还可包含用于将来自帧缓冲器FB1的值与阻滞缓冲器RB或推进缓冲器AB中待重写的值进行平均的逻辑。在另一实例中,移位寄存器SR3可经配置以仅经由帧缓冲器FB1接收高频带信号S30的值,且在此情况下,延迟线D130可包含用于在写入到移位寄存器SR3的连续帧或子帧之间的间隙上进行内插的逻辑。在其它实施方案中,延迟线D130可经配置以在将来自帧缓冲器FB1的样本写入到移位寄存器SR3之前对所述样本执行偏差操作(例如,根据由规则化数据信号SD10描述的函数)。
延迟线D120可能需要应用基于但不等同于由规则化数据信号SD10指定的偏差的时间偏差。图28展示宽频带语音编码器AD10的实施方案AD12的方块图,宽频带语音编码器AD10包含延迟值映射器D110。延迟值映射器D110经配置以将由规则化数据信号SD10指示的偏差映射为经映射延迟值SD10a。延迟线D120经配置以根据由经映射延迟值SD10a指示的偏差来产生时间偏差高频带语音信号S30a。
可预期窄频带编码器应用的时移随时间平滑地进展。因此,通常计算语音帧期间应用于子帧的平均窄频带时移并根据此平均值来偏移高频带语音信号S30的相应帧已足够。在一个此类实例中,延迟值映射器D110经配置以计算每一帧的子帧延迟值的平均值,且延迟线D120经配置以将计算出的平均值应用于高频带信号S30的相应帧。在其它实例中,可计算和应用较短周期(例如,两个子帧,或半个帧)或较长周期(例如,两个帧)内的平均值。在平均值是样本的非整数值的情况下,延迟值映射器D110可经配置以在将所述值输出到延迟线D120之前将所述值四舍五入为样本的整数数目。
窄频带编码器A124可经配置以在经编码窄频带激励信号中包含非整数数目的样本的规则化时移。在此情况下,延迟值映射器D110可能需要经配置以将窄频带时移四舍五入为样本的整数数目,且延迟线D120可能需要将经四舍五入的时移应用于高频带语音信号S30。
在宽频带语音编码器AD10的一些实施方案中,窄频带语音信号S20与高频带语音信号S30的取样速率可能不同。在此类情况下,延迟值映射器D110可经配置以调节规则化数据信号SD10中指示的时移量,以考虑窄频带语音信号S20(或窄频带激励信号S80)与高频带语音信号S30的取样速率之间的差异。举例来说,延迟值映射器D110可经配置以根据取样速率的比率缩放时移量。在上文提及的一个特定实例中,以8kHz对窄频带语音信号S20进行取样,且以7 kHz对高频带语音信号S30进行取样。在此情况下,延迟值映射器D110经配置以将每一偏移量乘以7/8。延迟值映射器D110的实施方案还可经配置以执行此缩放运算以及本文描述的整数四舍五入和/或时移平均运算。
在另外的实施方案中,延迟线D120经配置以用其它方式修改帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)。举例来说,窄频带编码器A124可经配置以根据例如音调轮廓或轨迹的函数来执行规则化。在此情况下,规则化数据信号SD10可包含对所述函数的相应描述(例如一组参数),且延迟线D120可包含经配置以根据所述函数对高频带语音信号S30的帧或子帧执行偏差的逻辑。在其它实施方案中,延迟值映射器D110经配置以在将所述函数通过延迟线D120应用于高频带语音信号S30之前对所述函数进行平均、缩放和/或四舍五入。举例来说,延迟值映射器D110可经配置以根据所述函数计算一个或一个以上延迟值,每一延迟值指示样本数目,其接着由延迟线D120应用以对高频带语音信号S30的一个或一个以上相应帧或子帧执行时间偏差。
图29展示根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执行时间偏差的方法MD100的流程图。任务TD100处理宽频带语音信号以获得窄频带语音信号和高频带语音信号。举例来说,任务TD100可经配置以使用具有低通滤波器和高通滤波器的滤波器组(例如滤波器组A110的实施方案)对宽频带语音信号进行滤波。任务TD200将窄频带语音信号至少编码为经编码的窄频带激励信号和多个窄频带滤波器参数。所述经编码的窄频带激励信号和/或滤波器参数可量化,且经编码的窄频带激励信号还可包含例如语音模式参数的其它参数。任务TD200还包含经编码的窄频带激励信号中的时间偏差。
任务TD300基于窄频带激励信号产生高频带激励信号。在此情况下,窄频带激励信号基于经编码的窄频带激励信号。任务TD400根据至少所述高频带激励信号,将高频带语音信号至少编码为多个高频带滤波器参数。举例来说,任务TD400可经配置以将高频带语音信号编码为多个量化LSF。任务TD500将时移应用于高频带语音信号,所述时移基于与经编码窄频带激励信号中包含的时间偏差有关的信息。
任务TD400可经配置以对高频带语音信号执行频谱分析(例如,LPC分析),且/或计算高频带语音信号的增益包络。在此类情况下,任务TD500可经配置以在所述分析和/或增益包络计算之前将时移应用于高频带语音信号。
宽频带语音编码器A100的其它实施方案经配置以将由经编码窄频带激励信号中包含的时间偏差引起的高频带激励信号S120的时间偏差反转。举例来说,高频带激励发生器A300可经实施以包含延迟线D120的实施方案,延迟线D120的所述实施方案经配置以接收规则化数据信号SD10或经映射延迟值SD10a,并将相应的反转时移应用于窄频带激励信号S80,且/或应用于基于所述窄频带激励信号S80的随后信号(例如,谐波延伸信号S160或高频带激励信号S120)。
另外的宽频带语音编码器实施方案可经配置以彼此独立地对窄频带语音信号S20和高频带语音信号S30进行编码,使得高频带语音信号S30被编码为高频带频谱包络和高频带激励信号的表示形式。此实施方案可经配置以根据与经编码窄频带激励信号中包含的时间偏差有关的信息对高频带残留信号执行时间偏差,或用其它方式将时间偏差包含在经编码高频带激励信号中。举例来说,高频带编码器可包含本文描述的经配置以将时间偏差应用于高频带残留信号的延迟线D120和/或延迟值映射器D110的实施方案。此操作的潜在优点包含对高频带残留信号的较有效编码,和合成窄频带与高频带语音信号之间的较好匹配。
如上文所提及,本文描述的实施例包含可用于执行嵌入式编码的实施方案、支持与窄频带系统的兼容性并避免需要代码转换。对高频带编码的支持还可用于按照成本来区分具有带有向后兼容性的宽频带支持的芯片、芯片组、装置和/或网络与仅具有窄频带支持的芯片、芯片组、装置和/或网络。如本文所描述的对高频带编码的支持也可与用于支持低频带编码的技术结合使用,且根据此实施例的系统、方法或设备可支持对例如约50或100Hz一直到约7或8kHz的频率分量的编码。
如上文所提及,向语音编码器添加高频带支持可改进清晰度,尤其是关于摩擦音的区分的清晰度。尽管这种区分通常可能由人类收听者根据特定上下文推导出来,但高频带支持可充当语音识别和其它机器解译应用(例如用于自动化语音菜单导航和/或自动呼叫处理的系统)中的启用特征。
根据一实施例的设备可嵌入到便携式无线通信装置(例如,蜂窝式电话或个人数字助理(PDA))中。或者,此设备可包含在另一通信装置中,例如VoIP手机、经配置以支持VoIP通信的个人计算机或经配置以路由电话或VoIP通信的网络装置。举例来说,根据一实施例的设备可实施在通信装置的芯片或芯片组中。视特定应用而定,此装置还可包含例如以下特征:对语音信号的模拟-数字和/或数字-模拟转换、用于对语音信号执行放大和/或其它信号处理操作的电路,和/或用于发射和/或接收经编码语音信号的射频电路。
明确预期且揭示实施例可包含第60/667,901号和第60/673,965号美国临时专利申请案中揭示的其它特征中的任一者或一者以上且/或与其一起使用,本申请案中主张所述临时专利申请案的权益。此类特征包含去除发生于高频带中且在窄频带中大体上不存在的具有短持续时间的高能量突发。此类特征包含例如高频带LSF的系数表示形式的固定或自适应平滑。此类特征包含与例如LSF的系数表示形式的量化相关联的噪声的固定或自适应成形。此类特征还包含增益包络的固定或自适应平滑,以及增益包络的自适应衰减。
提供对所描述实施例的以上介绍以便使所属领域的技术人员能够制造或使用本发明。可能对这些实施例作出各种修改,且本文提供的一般原理也可应用于其它实施例。举例来说,实施例可部分或整体地实施为硬连线电路,实施为制造到专用集成电路中的电路配置,或者实施为作为机器可读代码加载到非易失性存储装置中的固件程序、或从数据存储媒体加载或加载到数据存储媒体中的软件程序,所述代码为可由例如微处理器或其它数字信号处理单元的逻辑元件阵列执行的指令。数据存储媒体可为存储元件阵列,例如半导体存储器(其可包含(不限于)动态或静态RAM(随机存取存储器)、ROM(只读存储器)和/或快闪RAM),或铁电、磁阻、双向开关半导体、聚合物或相变存储器;或者例如磁盘或光盘的圆盘式媒体。术语“软件”应理解为包含源代码、汇编语言代码、机器代码、二进制代码、固件、宏代码、微码、可由逻辑元件阵列执行的任何一个或一个以上指令组或序列,以及此类实例的任何组合。
高频带激励发生器A300和B300、高频带编码器A100、高频带解码器B200、宽频带语音编码器A100和宽频带语音解码器B100的实施方案的各种元件可实施为(例如)驻存在芯片组中的同一芯片上或两个或两个以上芯片之间的电子和/或光学装置,但也预期存在没有此限制的其它配置。此设备的一个或一个以上元件可整体或部分地实施为一个或一个以上指令组,所述指令组经配置以在一个或一个以上固定或可编程逻辑元件(例如,晶体管、门)阵列上执行,所述元件例如为微处理器、内嵌式处理器、IP核心、数字信号处理器、FPGA(场可编程门阵列)、ASSP(专用标准产品)和ASIC(专用集成电路)。一个或一个以上此类元件也可能具有共同结构(例如,用于在不同时间执行对应于不同元件的代码部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令组,或者在不同时间针对不同元件执行操作的电子和/或光学装置的配置)。此外,一个或一个以上此类元件可能用于执行与设备的操作并不直接相关的任务或其它指令组,例如与内嵌有所述设备的装置或系统的另一操作相关的任务。
图30展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带部分进行编码的方法M100的流程图。任务X100计算表征高频带部分的频谱包络的一组滤波器参数。任务X200通过将非线性函数应用于从窄频带部分导出的信号来计算频谱延伸信号。任务X300根据(A)所述组滤波器参数和(B)基于所述频谱延伸信号的高频带激励信号来产生合成高频带信号。任务X400基于(C)高频带部分的能量与(D)从窄频带部分导出的信号的能量之间的关系来计算增益包络。
图31a展示根据一实施例产生高频带激励信号的方法M200的流程图。任务Y100通过将非线性函数应用于从语音信号的窄频带部分导出的窄频带激励信号来计算经谐波延伸信号。任务Y200将经谐波延伸信号与经调制噪声信号混合以产生高频带激励信号。图31b展示根据包含任务Y300和Y400的另一实施例产生高频带激励信号的方法M210的流程图。任务Y300根据窄频带激励信号和经谐波延伸信号中的一者的随时间的能量来计算时域包络。任务Y400根据时域包络调制噪声信号以产生经调制噪声信号。
图32展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带部分进行解码的方法M300的流程图。任务Z100接收表征所述高频带部分的频谱包络的一组滤波器参数和表征所述高频带部分的时间包络的一组增益因数。任务Z200通过将非线性函数应用于从窄频带部分导出的信号来计算频谱延伸信号。任务Z300根据(A)所述组滤波器参数和(B)基于所述频谱延伸信号的高频带激励信号来产生合成高频带信号。任务Z400基于所述组增益因数来调制所述合成高频带信号的增益包络。举例来说,任务Z400可经配置以通过将所述组增益因数应用于从窄频带部分导出的激励信号、应用于频谱延伸信号、应用于高频带激励信号,或应用于合成高频带信号,来调制所述合成高频带信号的增益包络。
实施例还包含如本文中(例如)通过对经配置以执行额外语音译码、编码和解码方法的结构实施例的描述而明确揭示的所述额外语音译码、编码和解码方法。这些方法的每一者也可确实地实施(例如,在如上文列举的一个或一个以上数据存储媒体中)为可由包含逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)阵列的机器读取和/或执行的一个或一个以上指令组。因此,本发明不希望限于上文展示的实施例,而是应符合与本文中(包含所提交的形成原始揭示案的一部分的所附权利要求书中)以任何方式揭示的原理和新颖特征一致的最广泛范围。

Claims (42)

1.一种产生高频带激励信号的方法,所述方法包括:
通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号;以及对基于所述经编码低频带激励信号的信号执行抗稀疏滤波,其中所述高频带激励信号基于所述频谱延伸信号,且其中所述高频带激励信号基于所述执行抗稀疏滤波的结果。
2.根据权利要求1所述的方法,其中所述执行抗稀疏滤波包含对所述频谱延伸信号执行抗稀疏滤波。
3.根据权利要求1所述的方法,其中所述执行抗稀疏滤波包含对所述高频带激励信号执行抗稀疏滤波。
4.根据权利要求1所述的方法,其中所述对信号执行抗稀疏滤波包含根据全通转移函数对所述信号执行滤波操作。
5.根据权利要求1所述的方法,其中所述对信号执行抗稀疏滤波包含在不显著修改所述信号的量值频谱的情况下改变所述信号的相位频谱。
6.根据权利要求1所述的方法,所述方法包括决定是否对基于所述经编码低频带激励信号的信号执行抗稀疏滤波,
其中所述决定的结果基于频谱倾斜参数、音调增益参数和语音模式参数中至少一者的值。
7.根据权利要求1所述的方法,其中所述产生频谱延伸信号包括谐波延伸基于所述经编码低频带激励信号的信号的频谱以获得所述频谱延伸信号。
8.根据权利要求1所述的方法,其中所述产生频谱延伸信号包括将非线性函数应用于基于所述经编码低频带激励信号的信号以产生所述频谱延伸信号。
9.根据权利要求8所述的方法,其中所述非线性函数包括绝对值函数、平方函数和削波函数中的至少一者。
10.根据权利要求1所述的方法,所述方法包括将基于所述频谱延伸信号的信号与经调制噪声信号混合,其中所述高频带激励信号基于所述混合信号。
11.根据权利要求10所述的方法,其中所述混合包含计算所述经调制噪声信号与基于所述频谱延伸信号的信号的加权总和,其中所述高频带激励信号基于所述加权总和。
12.根据权利要求10所述的方法,其中所述经调制噪声信号基于根据一信号的时域包络来调制噪声信号的结果,所述信号基于所述经编码低频带激励信号和所述频谱延伸信号中的至少一者。
13.根据权利要求12所述的方法,所述方法包括根据经编码语音信号内的信息的确定性函数来产生所述噪声信号。
14.根据权利要求1所述的方法,其中所述产生频谱延伸信号包含谐波延伸基于所述经编码低频带激励信号的向上取样信号的频谱。
15.根据权利要求1所述的方法,所述方法包括以下中的至少一者:(A)对所述频谱延伸信号进行频谱整平,和(B)对所述高频带激励信号进行频谱整平。
16.根据权利要求15所述的方法,其中所述频谱整平包括:
基于待频谱整平的信号计算多个滤波器系数;以及
用根据所述多个滤波器系数配置的白化滤波器对所述待频谱整平的信号进行滤波。
17.根据权利要求16所述的方法,其中所述计算多个滤波器系数包含对所述待频谱整平的信号执行线性预测分析。
18.根据权利要求1所述的方法,所述方法包括以下中的至少一者:(i)根据所述高频带激励信号编码高频带语音信号,和(ii)根据所述高频带激励信号解码高频带语音信号。
19.一种具有机器可执行指令的数据存储媒体,所述机器可执行指令描述根据权利要求1所述的信号处理方法。
20.一种设备,其包括:
频谱延伸器,其经配置以通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号;以及
抗稀疏滤波器,其经配置以对基于所述经编码低频带激励信号的信号进行滤波,其中所述高频带激励信号基于所述频谱延伸信号,且其中所述高频带激励信号基于所述抗稀疏滤波器的输出。
21.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以对所述频谱延伸信号进行滤波。
22.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以对所述高频带激励信号进行滤波。
23.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以根据全通转移函数对所述信号进行滤波。
24.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以在不显著修改所述信号的量值频谱的情况下改变所述信号的相位频谱。
25.根据权利要求20所述的设备,其中所述抗稀疏滤波器包含决策逻辑,所述决策逻辑经配置以决定是否对基于所述经编码低频带激励信号的信号进行滤波,其中所述决策逻辑经配置以基于频谱倾斜参数、音调增益参数和语音模式参数中至少一者的值来作出决定。
26.根据权利要求20所述的设备,其中所述频谱延伸器经配置以谐波延伸基于所述经编码低频带激励信号的信号的频谱以获得所述频谱延伸信号。
27.根据权利要求20所述的设备,其中所述频谱延伸器经配置以将非线性函数应用于基于所述经编码低频带激励信号的信号以产生所述频谱延伸信号。
28.根据权利要求27所述的设备,其中所述非线性函数包括绝对值函数、平方函数和削波函数中的至少一者。
29.根据权利要求20所述的设备,所述设备包括组合器,所述组合器经配置以将基于所述频谱延伸信号的信号与经调制噪声信号混合,其中所述高频带激励信号基于所述组合器的输出。
30.根据权利要求29所述的设备,其中所述混合器经配置以计算所述经调制噪声信号与基于所述频谱延伸信号的信号的加权总和,其中所述高频带激励信号基于所述加权总和。
31.根据权利要求29所述的设备,所述设备包含第二组合器,所述第二组合器经配置以根据一信号的时域包络来调制噪声信号,所述信号基于所述经编码低频带激励信号和所述频谱延伸信号中的至少一者,
其中所述经调制噪声信号基于所述第二组合器的输出。
32.根据权利要求31所述的设备,所述设备包括噪声发生器,所述噪声发生器经配置以根据经编码语音信号内的信息的确定性函数来产生所述噪声信号。
33.根据权利要求20所述的设备,其中所述频谱延伸器经配置以谐波延伸基于所述经编码低频带激励信号的向上取样信号的频谱。
34.根据权利要求20所述的设备,所述设备包括频谱整平器,所述频谱整平器经配置以对所述频谱延伸信号和所述高频带激励信号中的至少一者进行频谱整平。
35.根据权利要求34所述的设备,其中所述频谱整平器经配置以基于待频谱整平的信号计算多个滤波器系数,并用根据所述多个滤波器系数配置的白化滤波器对所述待频谱整平的信号进行滤波。
36.根据权利要求35所述的设备,其中所述频谱整平器经配置以基于对所述待频谱整平的信号的线性预测分析来计算所述多个滤波器系数。
37.根据权利要求20所述的设备,所述设备包括以下中的至少一者:(i)高频带语音编码器,其经配置以根据所述高频带激励信号编码高频带语音信号,和(ii)高频带语音解码器,其经配置以根据所述高频带激励信号解码高频带语音信号。
38.根据权利要求20所述的设备,所述设备包括蜂窝式电话。
39.根据权利要求20所述的设备,所述设备包括经配置以发射与因特网协议的版本一致的多个包的装置,其中所述多个包描述所述窄频带激励信号。
40.根据权利要求20所述的设备,所述设备包括经配置以接收与所述因特网协议的版本一致的多个包的装置,其中所述多个包描述所述窄频带激励信号。
41.一种设备,其包括:
用于通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号的装置;以及
抗稀疏滤波器,其经配置以对基于所述经编码低频带激励信号的信号进行滤波,
其中所述高频带激励信号基于所述频谱延伸信号,且其中所述高频带激励信号基于所述抗稀疏滤波器的输出。
42.根据权利要求41所述的设备,所述设备包括蜂窝式电话。
CN2006800183538A 2005-04-01 2006-04-03 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备 Active CN101185125B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US60/667,901 2005-04-01
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22
PCT/US2006/012233 WO2006107839A2 (en) 2005-04-01 2006-04-03 Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201110326747.2A Division CN102411935B (zh) 2005-04-01 2006-04-03 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备

Publications (2)

Publication Number Publication Date
CN101185125A true CN101185125A (zh) 2008-05-21
CN101185125B CN101185125B (zh) 2012-01-11

Family

ID=39406063

Family Applications (8)

Application Number Title Priority Date Filing Date
CN2006800181405A Active CN101180676B (zh) 2005-04-01 2006-04-03 用于谱包络表示的向量量化的方法和设备
CN2006800183519A Active CN101184979B (zh) 2005-04-01 2006-04-03 用于高频带激励产生的系统、方法和设备
CN200680018213.0A Active CN101185127B (zh) 2005-04-01 2006-04-03 用于编码和解码语音信号的高频带部分的方法和设备
CN2006800182709A Active CN101185124B (zh) 2005-04-01 2006-04-03 用于语音信号的分割频带编码的方法和设备
CN200680018212.6A Active CN101185126B (zh) 2005-04-01 2006-04-03 用于高频带时间偏差的系统、方法和设备
CN2006800182696A Active CN101185120B (zh) 2005-04-01 2006-04-03 用于高频带突发抑制的系统、方法和设备
CN2006800183538A Active CN101185125B (zh) 2005-04-01 2006-04-03 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
CN2006800181496A Active CN101180677B (zh) 2005-04-01 2006-04-03 用于宽频带语音编码的系统、方法和设备

Family Applications Before (6)

Application Number Title Priority Date Filing Date
CN2006800181405A Active CN101180676B (zh) 2005-04-01 2006-04-03 用于谱包络表示的向量量化的方法和设备
CN2006800183519A Active CN101184979B (zh) 2005-04-01 2006-04-03 用于高频带激励产生的系统、方法和设备
CN200680018213.0A Active CN101185127B (zh) 2005-04-01 2006-04-03 用于编码和解码语音信号的高频带部分的方法和设备
CN2006800182709A Active CN101185124B (zh) 2005-04-01 2006-04-03 用于语音信号的分割频带编码的方法和设备
CN200680018212.6A Active CN101185126B (zh) 2005-04-01 2006-04-03 用于高频带时间偏差的系统、方法和设备
CN2006800182696A Active CN101185120B (zh) 2005-04-01 2006-04-03 用于高频带突发抑制的系统、方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2006800181496A Active CN101180677B (zh) 2005-04-01 2006-04-03 用于宽频带语音编码的系统、方法和设备

Country Status (3)

Country Link
CN (8) CN101180676B (zh)
ES (3) ES2351935T3 (zh)
UA (6) UA91853C2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8484036B2 (en) 2005-04-01 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
US8805695B2 (en) 2011-01-24 2014-08-12 Huawei Technologies Co., Ltd. Bandwidth expansion method and apparatus
CN105814631A (zh) * 2013-12-15 2016-07-27 高通股份有限公司 盲带宽扩展系统和方法

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
CN101964690B (zh) * 2009-07-22 2012-07-04 联芯科技有限公司 一种harq合并译码方法、装置及系统
CN102044250B (zh) * 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
KR101804922B1 (ko) * 2010-03-23 2017-12-05 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
AU2012218409B2 (en) * 2011-02-18 2016-09-15 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
CN104040624B (zh) * 2011-11-03 2017-03-01 沃伊斯亚吉公司 改善低速率码激励线性预测解码器的非语音内容
CN102543091B (zh) * 2011-12-29 2014-12-24 深圳万兴信息科技股份有限公司 一种模拟音效的生成系统及方法
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
JP6053196B2 (ja) * 2012-05-23 2016-12-27 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、および記録媒体
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
CN103971693B (zh) * 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US9293143B2 (en) * 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
ES2933287T3 (es) 2016-04-12 2023-02-03 Fraunhofer Ges Forschung Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior
WO2018109143A1 (en) 2016-12-16 2018-06-21 Telefonaktiebolaget Lm Ericsson (Publ) Methods, encoder and decoder for handling envelope representation coefficients
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11956111B2 (en) * 2020-02-14 2024-04-09 Huawei Technologies Co., Ltd. Multi-rate crest factor reduction
CN111402907B (zh) * 2020-03-13 2023-04-18 大连理工大学 一种基于g.722.1的多描述语音编码方法
US11935546B2 (en) * 2021-08-19 2024-03-19 Semiconductor Components Industries, Llc Transmission error robust ADPCM compressor with enhanced response

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US6097824A (en) * 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
FI113571B (fi) * 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3696091B2 (ja) * 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
US6393394B1 (en) * 1999-07-19 2002-05-21 Qualcomm Incorporated Method and apparatus for interleaving line spectral information quantization methods in a speech coder
JP4792613B2 (ja) * 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
DE60019268T2 (de) * 1999-11-16 2006-02-02 Koninklijke Philips Electronics N.V. Breitbandiges audio-übertragungssystem
AU2547201A (en) * 2000-01-11 2001-07-24 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
MXPA03005133A (es) * 2001-11-14 2004-04-02 Matsushita Electric Ind Co Ltd Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos.
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
DE60323331D1 (de) * 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
KR100446242B1 (ko) * 2002-04-30 2004-08-30 엘지전자 주식회사 음성 부호화기에서 하모닉 추정 방법 및 장치
CA2464408C (en) * 2002-08-01 2012-02-21 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing suppression
CN1186765C (zh) * 2002-12-19 2005-01-26 北京工业大学 2.3kb/s谐波激励线性预测语音编码方法
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
CN1598926A (zh) * 2003-09-16 2005-03-23 株式会社东芝 具有噪声抑制的音频编码方法和设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8484036B2 (en) 2005-04-01 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
CN102411935B (zh) * 2005-04-01 2014-05-07 高通股份有限公司 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
US8805695B2 (en) 2011-01-24 2014-08-12 Huawei Technologies Co., Ltd. Bandwidth expansion method and apparatus
CN105814631A (zh) * 2013-12-15 2016-07-27 高通股份有限公司 盲带宽扩展系统和方法

Also Published As

Publication number Publication date
CN101185124B (zh) 2012-01-11
UA92742C2 (ru) 2010-12-10
ES2351935T3 (es) 2011-02-14
CN101185126A (zh) 2008-05-21
ES2350494T3 (es) 2011-01-24
CN101185126B (zh) 2014-08-06
CN101185120A (zh) 2008-05-21
CN101185124A (zh) 2008-05-21
CN101184979A (zh) 2008-05-21
CN101185125B (zh) 2012-01-11
UA91853C2 (ru) 2010-09-10
CN101180676A (zh) 2008-05-14
CN101180677A (zh) 2008-05-14
ES2358125T3 (es) 2011-05-05
CN101180676B (zh) 2011-12-14
CN101185127B (zh) 2014-04-23
CN101185127A (zh) 2008-05-21
UA92341C2 (ru) 2010-10-25
CN101185120B (zh) 2012-05-30
UA93677C2 (ru) 2011-03-10
UA94041C2 (ru) 2011-04-11
CN101180677B (zh) 2011-02-09
UA95776C2 (ru) 2011-09-12
CN101184979B (zh) 2012-04-25

Similar Documents

Publication Publication Date Title
CN101180677B (zh) 用于宽频带语音编码的系统、方法和设备
CN102411935B (zh) 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
CN102110440B (zh) 用于增益因数衰减的系统、方法和设备
CN104123946A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
CN101496097A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1115024

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1115024

Country of ref document: HK