CN102411935A - 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备 - Google Patents

用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备 Download PDF

Info

Publication number
CN102411935A
CN102411935A CN2011103267472A CN201110326747A CN102411935A CN 102411935 A CN102411935 A CN 102411935A CN 2011103267472 A CN2011103267472 A CN 2011103267472A CN 201110326747 A CN201110326747 A CN 201110326747A CN 102411935 A CN102411935 A CN 102411935A
Authority
CN
China
Prior art keywords
signal
band
frequency spectrum
narrow
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103267472A
Other languages
English (en)
Other versions
CN102411935B (zh
Inventor
科恩·贝尔纳德·福斯
阿南塔帕德马纳卜汉·A·坎达达伊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36588741&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN102411935(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN102411935A publication Critical patent/CN102411935A/zh
Application granted granted Critical
Publication of CN102411935B publication Critical patent/CN102411935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

本发明涉及用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备。一种用于产生高频带激励信号(S120)的方法和设备包含:通过延伸基于经编码低频带激励信号(S50)的信号的频谱来产生频谱延伸信号(A400);以及对基于所述经编码低频带激励信号的信号执行抗稀疏滤波(600)。所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于所述抗稀疏滤波的结果。

Description

用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
分案申请的相关信息
本申请为发明名称为“用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备”的原中国发明专利申请的分案申请。原申请的申请号为200680018353.8;原申请的申请日为2007年11月26日;原发明专利申请案的优先权日为2005年4月1日。
本申请案主张2005年4月1日申请的题为“CODING THE HIGH-FREQUENCYBAND OF WIDEBAND SPEECH”的第60/667,901号美国临时专利申请案的权益。本申请案还主张2005年4月22日申请的题为“PARAMETER CODING IN A HIGH-BANDSPEECH CODER”的第60/673,965号美国临时专利申请案的权益。
技术领域
本发明涉及信号处理。
背景技术
公共交换电话网络(PSTN)上的语音通信的带宽传统上限于300-3400kHz的频率范围。用于语音通信(例如蜂窝式电话和IP语音(因特网协议,VoIP))的新的网络可能不具有相同的带宽限制,且可能需要在此类网络上发射和接收包含宽频带频率范围的语音通信。举例来说,可能需要支持向下延伸到50Hz和/或一直到7或8kHz的音频频率范围。还可能需要支持可能具有在传统PSTN限制以外的范围内的音频语音内容的其它应用,例如高质量音频或音频/视频会议。
语音编码器所支持的范围向较高频率的延伸可改进清晰度。举例来说,区分例如“s”与“f”的摩擦音的信息主要处于高频率。高频带延伸还可改进语音的其它质量,例如存在率。举例来说,甚至浊元音也可具有远远高于PSTN限制的频谱能量。
宽频带语音编码的一种方法涉及缩放窄频带语音编码技术(例如,经配置以编码0-4kHz的范围的技术)以覆盖宽频带频谱。举例来说,语音信号可以较高速率取样以包含处于高频率的分量,且窄频带编码技术可重新配置以使用更多滤波系数来表示此宽频带信号。然而,例如CELP(密码本激励线性预测)的窄频带编码技术计算量较大,而宽频带CELP编码器可能消耗过多处理循环,以至于对于许多移动和其它嵌入式应用而言不现实。使用这种技术将宽频带信号的整个频谱编码为所需质量还可能导致带宽大大增加而令人无法接受。此外,甚至在此经编码信号的窄频带部分可传输到仅支持窄频带编码的系统中和/或由所述系统解码之前,将需要对所述经编码信号进行代码转换。
宽频带语音编码的另一种方法涉及从经编码窄频带频谱包络外推高频带频谱包络。虽然这种方法可在不增加带宽且不需要代码转换的情况下实施,但通常无法从窄频带部分的频谱包络中精确地预测出语音信号的高频带部分的粗略频谱包络或共振峰结构。
可能需要实施宽频带语音编码,使得至少经编码信号的窄频带部分可通过窄频带信道(例如,PSTN信道)发送,而不进行代码转换或其它显著修改。还可能需要宽频带编码延伸有效率,以便(例如)避免在例如无线蜂窝式电话以及有线和无线信道上的广播的应用中可能接受服务的用户的数目显著减少。
发明内容
在一个实施例中,一种产生高频带激励信号的方法包含:通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号;以及对基于所述经编码低频带激励信号的信号执行抗稀疏滤波。在此方法中,所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于执行抗稀疏滤波的结果。
在另一实施例中,一种发备包含:频谱延伸器,其经配置以通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号;以及抗稀疏滤波器,其经配置以对基于所述经编码低频带激励信号的信号进行滤波。在此设备中,所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于所述抗稀疏滤波器的输出。
在另一实施例中,一种设备包含:用于通过延伸基于经编码低频带激励信号的信号的频谱来产生频谱延伸信号的装置;以及抗稀疏滤波器,其经配置以对基于所述经编码低频带激励信号的信号进行滤波。在此设备中,所述高频带激励信号基于所述频谱延伸信号,且所述高频带激励信号基于所述抗稀疏滤波器的输出。
附图说明
图1a展示根据一实施例的宽频带语音编码器A100的方块图。
图1b展示宽频带语音编码器A100的实施方案A102的方块图。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。
图2b展示宽频带语音编码器B100的实施方案B102的方块图。
图3a展示滤波器组A110的实施方案A112的方块图。
图3b展示滤波器组B120的实施方案B122的方块图。
图4a展示滤波器组A110的一个实例的低和高频带的带宽覆盖。
图4b展示滤波器组A110的另一实例的低和高频带的带宽覆盖。
图4c展示滤波器组A112的实施方案A114的方块图。
图4d展示滤波器组B122的实施方案B124的方块图。
图5a展示语音信号的频率与对数幅值的曲线的实例。
图5b展示基础线性预测编码系统的方块图。
图6展示窄频带编码器A120的实施方案A122的方块图。
图7展示窄频带解码器B110的实施方案B112的方块图。
图8a展示浊语音的残留信号的频率与对数幅值的曲线的实例。
图8b展示浊语音的残留信号的时间与对数幅值的曲线的实例。
图9展示也执行长期预测的基础线性预测编码系统的方块图。
图10展示高频带编码器A200的实施方案A202的方块图。
图11展示高频带激励发生器A300的实施方案A302的方块图。
图12展示频谱延伸器A400的实施方案A402的方块图。
图12a展示频谱延伸操作的一个实例中各点处的信号频谱的曲线。
图12b展示频谱延伸操作的另一实例中各点处的信号频谱的曲线。
图13展示高频带激励发生器A302的实施方案A304的方块图。
图14展示高频带激励发生器A302的实施方案A306的方块图。
图15展示包络计算任务T100的流程图。
图16展示组合器490的实施方案492的方块图。
图17说明计算高频带信号S30的周期性的指标的方法。
图18展示高频带激励发生器A302的实施方案A312的方块图。
图19展示高频带激励发生器A302的实施方案A314的方块图。
图20展示高频带激励发生器A302的实施方案A316的方块图。
图21展示增益计算任务T200的流程图。
图22展示增益计算任务T200的实施方案T210的流程图。
图23a展示窗口函数的图。
图23b展示将如图23a所示的窗口函数应用于语音信号的子帧。
图24展示高频带解码器B200的实施方案B202的方块图。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。
图26a展示延迟线D120的实施方案D122的示意图。
图26b展示延迟线D120的实施方案D124的示意图。
图27展示延迟线D120的实施方案D130的示意图。
图28展示宽频带语音编码器AD10的实施方案AD12的方块图。
图29展示根据一实施例的信号处理方法MD100的流程图。
图30展示根据一实施例的方法M100的流程图。
图31a展示根据一实施例的方法M200的流程图。
图31b展示方法M200的实施方案M210的流程图。
图32展示根据一实施例的方法M300的流程图。
在各图以及随附的描述中,相同参考标号表示相同或类似的元件或信号。
具体实施方式
本文描述的实施例包含可经配置以向窄频带语音编码器提供延伸以支持传输和/或存储宽频带语音信号而带宽仅增加约800到1000bps(位/秒)的系统、方法和设备。此类实施方案的潜在优点包含支持与窄频带系统的兼容性的嵌入式编码、在窄频带与高频带编码信道之间相对容易地分配和再分配位、避免计算量较大的宽频带合成操作,以及维持待通过计算量较大的波形编码例行程序处理的信号的低取样速率。
除非特别受到上下文限制,否则本文使用术语“计算”来表示其普通含义的任一者,例如计算、产生和从值的列表中选择。本描述内容和权利要求书中使用术语“包括”时,不排除其它元件或操作。使用术语“A基于B”来表示其普通含义的任一者,包含以下情况:(i)“A等于B”和(ii)“A至少基于B”。术语“因特网协议”包含如IETF(因特网工程工作小组)RFC(请求注解)791中描述的版本4和随后版本(例如,版本6)。
图1a展示根据一实施例的宽频带语音编码器A100的方块图。滤波器组A110经配置以对宽频带语音信号S10进行滤波以产生窄频带信号S20和高频带信号S30。窄频带编码器A120经配置以编码窄频带信号S20以产生窄频带(NB)滤波器参数S40和窄频带残留信号S50。如本文进一步详细描述,窄频带编码器A120通常经配置以作为密码本索引或采取另一量化形式而产生窄频带滤波器参数S40和经编码窄频带激励信号S50。高频带编码器A200经配置以根据经编码窄频带激励信号S50中的信息编码高频带信号S30以产生高频带编码参数S60。如本文进一步详细描述,高频带编码器A200通常经配置以作为密码本索引或采取另一量化形式而产生高频带编码参数S60。宽频带语音编码器A100的一个特定实例经配置以在约8.55kbps(千位/秒)的速率下编码宽频带语音信号S10,其中约7.55kbps用于窄频带滤波器参数S40和经编码窄频带激励信号S50,且约1kbps用于高频带编码参数S60。
可能需要将经编码窄频带和高频带信号组合为单一位流。举例来说,可能需要将经编码信号多路复用在一起以作为经编码宽频带语音信号用于传输(例如,在有线、光学或无线传输信道上)或用于存储。图1b展示宽频带语音编码器A100的实施方案A102的方块图,宽频带语音编码器A100包含多路复用器A130,其经配置以将窄频带滤波器参数S40、经编码窄频带激励信号S50和高频带滤波器参数S60组合为多路复用信号S70。
一种包含编码器A102的设备还可包含经配置以将多路复用信号S70传输到例如有线、光学或无线信道的传输信道中的电路。此设备还可经配置以对信号执行一个或一个以上信道编码操作,例如误差校正编码(例如,速率兼容卷积编码)和/或误差检测编码(例如,循环冗余编码),和/或一层或一层以上网络协议编码(例如,以太网、TCP/IP、cdma2000)。
可能需要多路复用器A130经配置以嵌入经编码窄频带信号(包含窄频带滤波器参数S40和经编码窄频带激励信号S50)作为可分离的多路复用信号S70支流,使得经编码窄频带信号可独立于多路复用信号S70的另一部分(例如,高频带和/或低频带信号)被恢复并解码。举例来说,多路复用信号S70可经配置使得经编码窄频带信号可通过剥除高频带滤波器参数S60而恢复。这一特征的一个潜在优点是避免在将经编码宽频带信号传递到支持窄频带信号的解码但不支持高频带部分的解码的系统之前需要对所述经编码宽频带信号进行代码转换。
图2a展示根据一实施例的宽频带语音解码器B100的方块图。窄频带解码器B110经配置以解码窄频带滤波器参数S40和经编码窄频带激励信号S50以产生窄频带信号S90。高频带解码器B200经配置以根据基于经编码窄频带激励信号S50的窄频带激励信号S80而解码高频带编码参数S60,以产生高频带信号S100。在此实例中,窄频带解码器B110经配置以将窄频带激励信号S80提供到高频带解码器B200。滤波器组B120经配置以将窄频带信号S90与高频带信号S100组合以产生宽频带语音信号S110。
图2b是宽频带语音解码器B100的实施方案B102的方块图,宽频带语音解码器B100包含多路分解器B130,其经配置以从多路复用信号S70中产生经编码信号S40、S50和S60。一种包含解码器B102的设备可包含经配置以从例如有线、光学或无线信道的传输信道接收多路复用信号S70的电路。此设备还可经配置以对信号执行一个或一个以上信道解码操作,例如误差校正解码(例如,速率兼容卷积解码)和/或误差检测解码(例如,循环冗余解码),和/或一层或一层以上网络协议解码(例如,以太网、TCP/IP、cdma2000)。
滤波器组A110经配置以根据分裂频带方案对输入信号进行滤波以产生低频率子频带和高频率子频带。视特定应用的设计标准而定,输出子频带可具有相等或不等的带宽且可能重叠或不重叠。产生两个以上子频带的滤波器组A110配置也是可能的。举例来说,此滤波器组可经配置以产生一个或一个以上低频带信号,所述低频带信号包含处于窄频带信号S20的频率范围以下的频率范围(例如50-300Hz的范围)内的分量。此滤波器组也可能经配置以产生一个或一个以上额外高频带信号,所述额外高频带信号包含处于高频带信号S30的频率范围以上的频率范围(例如14-20、16-20或16-32kHz的范围)内的分量。在此情况下,可实施宽频带语音编码器A100以单独编码此信号(一个或多个),且多路复用器A130可经配置以将额外经编码信号(一个或多个)包含在多路复用信号S70中(例如,作为可分离部分)。
图3a展示滤波器组A110的实施方案A112的方块图,滤波器组A110经配置以产生具有减小的取样速率的两个子频带信号。滤波器组A110经配置以接收具有高频率(或高频带)部分和低频率(或低频带)部分的宽频带语音信号S10。滤波器组A112包含经配置以接收宽频带语音信号S10并产生窄频带语音信号S20的低频带处理路径,和经配置以接收宽频带语音信号S10并产生高频带语音信号S30的高频带处理路径。低通滤波器110对宽频带语音信号S10进行滤波以通过选定的低频率子频带,且高通滤波器130对宽频带语音信号S10进行滤波以通过选定的高频率子频带。因为两个子频带信号的带宽比宽频带语音信号S10窄,所以其取样速率可在一定程度上减小而无信息损失。向下取样器120根据所需的抽选因数(例如,通过去除信号的样本和/或用平均值代替样本)来减小低通信号的取样速率,且向下取样器140同样地根据另一所需的抽选因数来减小高通信号的取样速率。
图3b展示滤波器组B120的相应实施方案B122的方块图。向上取样器150(例如,通过零塞入和/或通过复制样本)增加窄频带信号S90的取样速率,且低通滤波器160对向上取样信号进行滤波以仅通过低频带部分(例如,以防止混叠)。同样,向上取样器170增加高频带信号S100的取样速率,且高通滤波器180对向上取样信号进行滤波以仅通过高频带部分。接着,将两个通带信号求和以形成宽频带语音信号S110。在解码器B100的一些实施方案中,滤波器组B120经配置以根据由高频带解码器B200接收和/或计算的一个或一个以上权数来产生两个通带信号的加权总和。还预期将两个以上通带信号组合的滤波器组B120配置。
滤波器110、130、160、180的每一者可实施为有限脉冲响应(FIR)滤波器或实施为无限脉冲响应(IIR)滤波器。编码器滤波器110和130的频率响应可具有抑止频带与通带之间的对称或相异形状的转变区。同样,解码器滤波器160和180的频率响应可具有抑止频带与通带之间的对称或相异形状的转变区。可能需要(但不是严格有必要)低通滤波器110与低通滤波器160具有相同响应,且高通滤波器130与高通滤波器180具有相同响应。在一个实例中,两个滤波器对110、130和160、180是正交镜像滤波器(QMF)组,其中滤波器对110、130与滤波器对160、180具有相同系数。
在典型实例中,低通滤波器110具有包含300-3400Hz的有限PSTN范围的通带(例如,0到4kHz的频带)。图4a和4b展示两个不同实施实例中宽频带语音信号S10、窄频带信号S20和高频带信号S30的相对带宽。在这两个特定实例中,宽频带语音信号S10具有16kHz的取样速率(表示0到8kHz范围内的频率分量),且窄频带信号S20具有8kHz的取样速率(表示0到4kHz范围内的频率分量)。
在图4a的实例中,两个子频带之间不存在明显重叠。此实例中所示的高频带信号S30可通过使用具有4-8kHz的通带的高通滤波器130来获得。在此情况下,可能需要通过以2为因数向下取样经滤波信号而将取样速率减小为8kHz。可预期此操作会显著减小对信号的进一步处理操作的计算复杂性,此操作将把通带能量下移到0到4kHz范围内而无信息损失。
在图4b的替代实例中,上部和下部子频带具有明显重叠,使得两个子频带信号均描述3.5到4kHz的区域。此实例中的高频带信号S30可通过使用具有3.5-7kHz的通带的高通滤波器130来获得。在此情况下,可能需要通过以16/7为因数向下取样经滤波信号而将取样速率减小为7kHz。可预期此操作会显著减小对信号的进一步处理操作的计算复杂性,此操作将把通带能量下移到0到3.5kHz范围内而无信息损失。
在典型电话通信手机中,一个或一个以上变换器(即,麦克风和耳机或扬声器)缺乏7-8kHz的频率范围上的明显响应。在图4b的实例中,宽频带语音信号S10的处于7与8kHz之间的部分不包含在经编码信号中。高通滤波器130的其它特定实例具有3.5-7.5kHz和3.5-8kHz的通带。
在一些实施方案中,如在图4b的实例中在子频带之间提供重叠允许使用在重叠区上具有平滑衰减的低通和/或高通滤波器。此类滤波器与具有较急剧或“砖墙式(brick-wall)”响应的滤波器相比,通常较易设计,计算上不太复杂,且/或引起的延迟较少。具有急剧转变区的滤波器往往比具有平滑衰减的类似等级的滤波器具有更高的旁瓣(这可能引起混叠)。具有急剧转变区的滤波器还可能具有长脉冲响应,这可能引起振铃假象。对于具有一个或一个以上IIR滤波器的滤波器组实施方案,允许重叠区上的平滑衰减可使得能够使用极点较远离单位圆的滤波器(一个或多个),这对于确保稳定的定点实施方案可能较重要。
子频带重叠允许低频带与高频带的平滑混合,这可导致较少的可听到的假象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此外,窄频带编码器A120(例如,波形编码器)的编码效率可随着频率不断增加而下降。举例来说,可能在低位速率下,尤其在存在背景噪声的情况下减小窄频带编码器的编码质量。在此类情况下,提供子频带重叠可提高重叠区中复制的频率分量的质量。
此外,子频带重叠允许低频带与高频带的平滑混合,其可能导致较少的可听到的假象,减少混叠,且/或使一个频带到另一频带的转变不太明显。此特征对于窄频带编码器A120和高频带编码器A200根据不同编码方法操作的实施方案可能尤其合乎需要。举例来说,不同编码技术可产生听起来非常不同的信号。以密码本索引形式编码频谱包络的编码器可产生具有与改为编码幅值谱的编码器不同的声音的信号。时域编码器(例如,脉冲-代码调制或PCM编码器)可产生具有与频域编码器不同的声音的信号。以频谱包络和相应残留信号的表示形式编码信号的编码器可产生具有与仅以频谱包络表示形式编码信号的编码器不同的声音的信号。将信号编码为其波形的表示形式的编码器可产生具有与来自正弦编码器的输出不同的声音的输出。在此类情况下,使用具有急剧转变区的滤波器来界定非重叠子频带可能导致合成的宽频带信号中子频带之间的转变较突然且感觉上较明显。
尽管子频带技术中通常使用具有互补重叠频率响应的QMF滤波器组,但此类滤波器不适于本文描述的宽频带编码实施方案中的至少一些实施方案。编码器处的QMF滤波器组经配置以产生较大程度的混叠,所述混叠在解码器处的相应QMF滤波器组中被消去。此配置可能不适于信号招致滤波器组之间的大量失真的应用,因为失真可减小混叠消去性质的效力。举例来说,本文描述的应用包含经配置以在非常低的位速率下操作的编码实施方案。由于位速率非常低,所以经解码信号很可能与原始信号相比呈现为明显失真,使得QMF滤波器组的使用可导致未消去的混叠。使用QMF滤波器组的应用通常具有较高位速率(例如,对于AMR超过12kbps,且对于G.722超过64kbps)。
另外,编码器可经配置以产生感觉上类似于原始信号但实际上显著不同于原始信号的合成信号。举例来说,如本文所描述从窄频带残留中导出高频带激励的编码器可产生此信号,因为经解码信号中可能完全不存在实际高频带残留。在此类应用中使用QMF滤波器组可导致由未消去的混叠引起的较大程度的失真。
如果受影响子频带较窄,那么可减小QMF混叠引起的失真量,因为混叠的影响限于与子频带宽度相等的带宽。然而,对于本文描述的其中每一子频带包含宽频带带宽的约一半的实例,由未消去的混叠引起的失真可能影响信号的大部分。信号的质量也可能受上面发生未消去的混叠的频带的位置影响。举例来说,宽频带语音信号中心附近(例如,3与4kHz之间)产生的失真可能比信号边缘附近(例如,6kHz以上)发生的失真有害得多。
虽然QMF滤波器组的滤波器的响应彼此严格相关,但滤波器组A110和B120的低频带和高频带路径可经配置以具有除两个子频带的重叠外完全不相关的频谱。我们将两个子频带的重叠定义为高频带滤波器的频率响应下降到-20dB的点至低频带滤波器的频率响应下降到-20dB的点的距离。在滤波器组A110和/或B120的各种实例中,此重叠范围为约200Hz到约1kHz。约400到约600Hz的范围可表示编码效率与感知平滑度之间的理想折衷。在上文提及的一个特定实例中,重叠在500Hz附近。
可能需要实施滤波器组A112和/或B122来在若干阶段执行图4a和4b中说明的操作。举例来说,图4c展示滤波器组A112的实施方案A114的方块图,实施方案A114使用一系列内插、再取样、抽选和其它操作来执行功能等效的高通滤波和向下取样操作。此类实施方案可较易设计且/或可允许再使用逻辑和/或代码的功能块。举例来说,可使用相同功能块来执行如图4c所示至14kHz的抽选以及至7kHz的抽选的操作。可通过将信号与函数ejnπ或序列(-1)n相乘来实施频谱反转操作,所述序列(-1)n的值在+1与-1之间交替。频谱成形操作可实施为经配置以使信号成形从而获得所需的总体滤波器响应的低通滤波器。
注意到,由于频谱反转操作的缘故,高频带信号S30的频谱反转。可相应地配置编码器和相应解码器中的后续操作。举例来说,本文描述的高频带激励发生器A300可经配置以产生同样具有频谱反转形式的高频带激励信号S 120。
图4d展示滤波器组B122的实施方案B124的方块图,滤波器组B122使用一系列内插、再取样和其它操作来执行功能等效的向上取样和高通滤波操作。滤波器组B124包含高频带中的频谱反转操作,其使与例如编码器的滤波器组(例如,滤波器组A114)中执行的类似的操作反转。在此特定实例中,滤波器组B124还包含低频带和高频带中的陷波滤波器,其削弱7100Hz处的信号分量,但此类滤波器是任选的且不需要包含此类滤波器。与此一同申请的代理人案号为050551的专利申请案“SYSTEMS,METHODS,ANDAPPARATUS FOR SPEECH SIGNAL FILTERING”包含关于滤波器组A110和B120的特定实施方案的元件的响应的额外描述和图式,且此材料在此以引用的方式并入。
窄频带编码器A120根据源-滤波器模型而实施,其将输入语音信号编码为(A)一组描述滤波器的参数和(B)驱动所描述的滤波器产生输入语音信号的合成复制物的激励信号。图5a展示语音信号的频谱包络的实例。表现此频谱包络的特征的峰值表示声域的谐振且称为共振峰。大多数语音编码器至少将此粗略谱结构编码为一组参数(例如,滤波器系数)。
图5b展示如应用于窄频带信号S20的频谱包络的编码的基础源-滤波器配置的实例。分析模块计算描述对应于一段时间(通常20毫秒)内的语音声音的滤波器的一组参数。根据那些滤波器参数配置的白化滤波器(也称为分析或预测误差滤波器)去除频谱包络以对信号进行频谱整平。所得的白化信号(也称为残留)与原始语音信号相比,具有较少能量且因此变化较小并且较易于编码。由于对残留信号编码引起的误差还可能较均匀地散布在频谱上。滤波器参数和残留通常经过量化以用于在信道上有效传输。在解码器处,根据滤波器参数配置的合成滤波器由基于残留的信号激励以产生原始语音声音的合成版本。合成滤波器通常经配置以具有转移函数,所述转移函数是白化滤波器的转移函数的反转形式。
图6展示窄频带编码器A120的基础实施方案A122的方块图。在此实例中,线性预测编码(LPC)分析模块210将窄频带信号S20的频谱包络编码为一组线性预测(LP)系数(例如,全极滤波器的系数1/A(z))。分析模块通常将输入信号处理为一系列非重叠帧,其中为每一帧计算一组新的系数。帧周期通常是可预期信号在本地静止的周期;一个常见实例为20毫秒(等效于8kHz的取样速率下160个样本)。在一个实例中,LPC分析模块210经配置以计算一组10个LP滤波器系数以描述每一20毫秒帧的共振峰结构。也可能实施分析模块以将输入信号处理为一系列重叠帧。
分析模块可经配置以直接分析每一帧的样本,或者可首先根据窗口函数(例如,汉明窗口)对样本进行加权。也可在大于帧的窗口(例如,30毫秒窗口)上执行分析。此窗口可对称(例如5-20-5,使得其包含紧接着20毫秒帧之前和之后的5毫秒)或不对称(例如10-20,使得其包含先前帧的最后10毫秒)。LPC分析模块通常经配置以使用Levinson-Durbin递归式或Leroux-Gueguen算法计算LP滤波器系数。在另一实施方案中,分析模块可经配置以计算每一帧的一组倒谱系数而不是一组LP滤波器系数。
编码器A120的输出速率可通过量化滤波器系数而显著减小,且对复制质量的影响相对较小。线性预测滤波器系数难以有效量化,且通常映射为另一表示形式,例如线谱对(LSP)或线谱频率(LSF),以用于量化和/或熵编码。在图6的实例中,LP滤波器系数-LSF变换220将所述组LP滤波器系数变换为一组相应的LSF。LP滤波器系数的其它一对一表示形式包含部分自相关系数、对数面积比值、导抗谱对(ISP)和导抗谱频率(ISF),其用于GSM(全球移动通信系统)AMR-WB(自适应多速宽频带)编译码器中。通常,一组LP滤波器系数与一组相应的LSF之间的变换是可逆的,但实施例还包含变换不可在无误差情况下可逆的编码器A120实施方案。
量化器230经配置以量化所述组窄频带LSF(或其它系数表示形式),且窄频带编码器A122经配置以输出此量化的结果作为窄频带滤波器参数S40。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
如图6所示,窄频带编码器A122还通过使窄频带信号S20通过根据所述组滤波器系数配置的白化滤波器260(也称为分析或预测误差滤波器)来产生残留信号。在此特定实例中,白化滤波器260实施为FIR滤波器,但也可使用IIR实施方案。此残留信号通常将含有窄频带滤波器参数S40中未表示的感觉上较重要的语音帧信息,例如与音调有关的长期结构。量化器270经配置以计算此残留信号的量化表示形式以作为经编码的窄频带激励信号S50输出。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。或者,此量化器可经配置以发送一个或一个以上参数,可在解码器处从所述参数中动态地产生向量,而不是如稀疏密码本方法中一样从存储装置中检索向量。此方法用于例如代数CELP(密码本激励线性预测)的编码方案和例如3GPP2(第三代合作伙伴关系2)EVRC(增强可变速率编译码器)的编译码器中。
需要窄频带编码器A120根据将可用于相应窄频带解码器的相同滤波器参数值来产生经编码窄频带激励信号。以此方式,所得的经编码窄频带激励信号可能已在某种程度上考虑那些参数值的不理想性,例如量化误差。因此,需要使用将在解码器处可用的相同系数值来配置自化滤波器。在如图6所示的编码器A122的基础实例中,反转量化器240对窄频带编码参数S40解量化,LSF-LP滤波器系数变换250将所得值映射回一组相应的LP滤波器系数,且此组系数用于配置白化滤波器260以产生由量化器270量化的残留信号。
窄频带编码器A120的一些实施方案经配置以通过从一组密码本向量中识别出与残留信号最佳匹配的一个向量来计算经编码窄频带激励信号S50。然而,注意到,窄频带编码器A120也可经实施以计算残留信号的量化表示形式而不实际上产生残留信号。举例来说,窄频带编码器A120可经配置以使用许多密码本向量来产生相应的合成信号(例如,根据一组当前滤波器参数),并选择与感知加权域中和原始窄频带信号S20最佳匹配的所产生信号相关联的密码本向量。
图7展示窄频带解码器B110的实施方案B112的方块图。反转量化器310对窄频带滤波器参数S40解量化(在此情况下,解量化为一组LSF),且LSF-LP滤波器系数变换320将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化器240和变换250所描述)。反转量化器340对窄频带残留信号S40解量化以产生窄频带激励信号S80。基于滤波器系数和窄频带激励信号S80,窄频带合成滤波器330合成窄频带信号S90。换句话说,窄频带合成滤波器330经配置以根据解量化滤波器系数对窄频带激励信号S80进行频谱成形,以产生窄频带信号S90。窄频带解码器B112还将窄频带激励信号S80提供到高频带编码器A200,高频带编码器A200使用窄频带激励信号S80来导出高频带激励信号S120,如本文所描述。在下文描述的一些实施方案中,窄频带解码器B110可经配置以将与窄频带信号有关的额外信息(例如,频谱倾斜、音调增益和滞后,以及语音模式)提供到高频带解码器B200。
窄频带编码器A122和窄频带解码器B112的系统是合成分析语音编译码器的基础实例。密码本激励线性预测(CELP)编码是合成分析编码的一个普遍系列,且此类编码器的实施方案可执行残留的波形编码,其中包含例如从固定和自适应密码本中选择条目的操作、误差最小化操作和/或感知加权操作。合成分析编码的其它实施方案包含混合激励线性预测(MELP)、代数CELP(ACELP)、松弛CELP(RCELP)、规则脉冲激励(RPE)、多脉冲CELP(MPE)和向量和激励线性预测(VSELP)编码。相关编码方法包含多频带激励(MBE)和原型波形内插(PWI)编码。标准合成分析语音编译码器的实例包含使用残留激励线性预测(RELP)的ETSI(欧洲电信标准协会)GSM全速率编译码器(GSM06.10)、GSM增强全速率编译码器(ETSI-GSM 06.60)、ITU(国际电信联盟)标准11.8kb/s G.729Annex E编码器、IS-136的IS(临时标准)641编译码器(时分多址方案)、GSM自适应多速率(GSM-AMR)编译码器,和4GVTM(第四代VocoderTM)编译码器(加州圣地亚哥市的高通公司(QUALCOMM Incorporated,San Diego,CA))。窄频带编码器A120和相应的解码器B110可根据这些技术中的任一者或任何其它语音编码技术(已知的或待开发的)实施,所述语音编码技术将语音信号表示为(A)一组描述滤波器的参数和(B)用于驱动所描述的滤波器复制语音信号的激励信号。
即使在自化滤波器已从窄频带信号S20中去除粗略频谱包络之后,也可能保留相当大量的精细谐波结构(尤其对于浊语音来说)。图8a展示浊音信号(例如,元音)的残留信号(如可能由白化滤波器产生)的一个实例的频谱曲线。此实例中可见的周期性结构与音调有关,且同一说话者发出的不同浊音可能具有不同的共振峰结构但具有类似的音调结构。图8b展示此残留信号的实例的时域曲线,其展示音调脉冲的时间序列。
可通过使用一个或一个以上参数值编码音调结构的特性来增加编码效率和/或语音质量。音调结构的一个重要特性是第一谐波的频率(也称为基频),其通常在60到400Hz范围内。此特性通常编码为基频的反转形式,也称为音调滞后(pitch lag)。音调滞后指示一个音调周期中样本的数目,且可编码为一个或一个以上密码本索引。来自男性说话者的语音信号往往比来自女性说话者的语音信号具有更大的音调滞后。
与音调结构有关的另一信号特性是周期性,其指示谐波结构的强度,或换句话说,信号为谐波或非谐波的程度。周期性的两个典型指示符是零交叉和标准化自相关函数(NACF)。周期性也可由音调增益来指示,所述音调增益通常编码为密码本增益(例如,量化自适应密码本增益)。
窄频带编码器A120可包含经配置以编码窄频带信号S20的长期谐波结构的一个或一个以上模块。如图9所示,可使用的一个典型CELP范例包含开放式回路LPC分析模块,其编码短期特性或粗略频谱包络,之后是闭合式回路长期预测分析阶段,所述阶段编码精细音调或谐波结构。短期特性编码为滤波器系数,且长期特性编码为例如音调滞后和音调增益的参数的值。举例来说,窄频带编码器A120可经配置以便以包含一个或一个以上密码本索引(例如,固定密码本索引和自适应密码本索引)和相应增益值的形式输出经编码窄频带激励信号S50。窄频带残留信号的这种量化表示形式的计算(例如,通过量化器270)可包含选择这些索引和计算这些值。音调结构的编码还可包含内插音调原型波形,所述操作可包含计算连续音调脉冲之间的差。可针对对应于清语音(其通常类似于噪声且未系统化)的帧禁用长期结构的建模。
根据图9所示的范例的窄频带解码器B110的实施方案可经配置以在长期结构(音调或谐波结构)已恢复之后将窄频带激励信号S80输出到高频带解码器B200。举例来说,此解码器可经配置以输出窄频带激励信号S80作为经编码窄频带激励信号S50的解量化版本。当然,也可能实施窄频带解码器B110,使得高频带解码器B200执行经编码窄频带激励信号S50的解量化以获得窄频带激励信号S80。
在根据图9所示的范例的宽频带语音编码器A100的实施方案中,高频带编码器A200可经配置以接收由短期分析或白化滤波器产生的窄频带激励信号。换句话说,窄频带编码器A120可经配置以在编码长期结构之前将窄频带激励信号输出到高频带编码器A200。然而,高频带编码器A200需要从窄频带信道接收将由高频带解码器B200接收的相同编码信息,使得高频带编码器A200产生的编码参数可能已在某种程度上考虑所述信息的不理想性。因此,可能优选的是,高频带编码器A200从待由宽频带语音编码器A100输出的相同参数化和/或量化经编码窄频带激励信号S50中重建窄频带激励信号S80。此方法的一个潜在优点是较准确地计算下文描述的高频带增益因数S60b。
除了描述窄频带信号S20的短期和/或长期结构的参数外,窄频带编码器A120还可产生与窄频带信号S20的其它特性有关的参数值。这些值(其可能经适宜量化以由宽频带语音编码器A100输出)可包含在窄频带滤波器参数S40中或单独输出。高频带编码器A200也可经配置以根据这些额外参数中的一者或一者以上(例如,解量化之后)计算高频带编码参数S60。在宽频带语音解码器B100处,高频带解码器B200可经配置以经由窄频带解码器B110(例如,解量化之后)接收参数值。或者,高频带解码器B200可经配置以直接接收(且可能用于解量化)参数值。
在额外窄频带编码参数的一个实例中,窄频带编码器A120产生每一帧的频谱倾斜和语音模式参数的值。频谱倾斜与通带上频谱包络的形状有关,且通常由量化第一反射系数表示。对于大多数浊音,频谱能量随着频率的不断增加而减小,使得第一反射系数为负且可接近-1。大多数清音具有平整的频谱,从而使得第一反射系数接近零,或者在高频率下具有较多能量,从而使得第一反射系数为正且可接近+1。
语音模式(也称为发声模式)指示当前帧表示浊语音还是清语音。此参数可具有二进制值,其基于周期性的一个或一个以上指标(例如,零交叉、NACF、音调增益)和/或帧的声音活动(例如,此指标与阈值之间的关系)。在其它实施方案中,语音模式参数具有一个或一个以上其它状态以指示例如无声或背景噪声或无声与浊语音之间的转变的模式。
高频带编码器A200经配置以根据源-滤波器模型来编码高频带信号S30,其中此滤波器的激励是基于经编码窄频带激励信号。图10展示高频带编码器A200的实施方案A202的方块图,高频带编码器A200经配置以产生包含高频带滤波器参数S60a和高频带增益因数S60b的高频带编码参数S60流。高频带激励发生器A300从经编码窄频带激励信号S50中导出高频带激励信号S120。分析模块A210产生描述高频带信号S30的频谱包络的一组参数值。在此特定实例中,分析模块A210经配置以执行LPC分析以便为高频带信号S30的每一帧产生一组LP滤波器系数。线性预测滤波器系数-LSF变换410将所述组LP滤波器系数变换为一组相应的LSF。如上文参照分析模块210和变换220所述,分析模块A210和/或变换410可经配置以使用其它系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。
量化器420经配置以量化所述组高频带LSF(或其它系数表示形式,例如ISP),且高频带编码器A202经配置以输出此量化的结果作为高频带滤波器参数S60a。此量化器通常包含向量量化器,其将输入向量编码为对于表或密码本中的相应向量条目的索引。
高频带编码器A202还包含合成滤波器A220,其经配置以根据分析模块A210产生的高频带激励信号S120和经编码频谱包络(例如,所述组LP滤波器系数)来产生合成高频带信号S130。合成滤波器A220通常实施为IIR滤波器,但也可使用FIR实施方案。在特定实例中,合成滤波器A220实施为六次线性自回归滤波器。
高频带增益因数计算器A230计算原始高频带信号S30与合成高频带信号S130的电平之间的一个或一个以上差,以指定帧的增益包络。量化器430可实施为将输入向量编码为对于表或密码本中的相应向量条目的索引的向量量化器,其量化指定增益包络的值(一或多个),且高频带编码器A202经配置以输出此量化的结果作为高频带增益因数S60b。
在如图10所示的实施方案中,合成滤波器A220经配置以从分析模块A210接收滤波器系数。高频带编码器A202的替代实施方案包含反转量化器和反转变换,其经配置以从高频带滤波器参数S60a中解码滤波器系数,且在此情况下合成滤波器A220经配置以改为接收经解码滤波器系数。此替代配置可支持由高频带增益计算器A230较准确地计算增益包络。
在一个特定实例中,分析模块A210和高频带增益计算器A230分别每帧输出一组六个LSF和一组五个增益值,使得可仅用每帧十一个额外值来实现窄频带信号S20的宽频带延伸。耳朵对于高频率下的频率误差往往较不敏感,因而低LPC级的高频带编码可产生具有可与较高LPC级的窄频带编码相比的感知质量的信号。高频带编码器A200的典型实施方案可经配置以每帧输出8到12位用于频谱包络的高质量重建,以及每帧输出另外8到12位用于时间包络的高质量重建。在另一特定实例中,分析模块A210每帧输出一组八个LSF。
高频带编码器A200的一些实施方案经配置以通过以下方式产生高频带激励信号S120:产生具有高频带频率分量的随机噪声信号,并根据窄频带信号S20、窄频带激励信号S80或高频带信号S30的时域包络对噪声信号进行幅值调制。虽然这种基于噪声的方法对于清音可产生适当结果,然而,其对于浊音可能不理想,浊音的残留通常为谐波且因此具有某种周期性结构。
高频带激励发生器A300经配置以通过将窄频带激励信号S80的频谱延伸到高频带频率范围中来产生高频带激励信号S120。图11展示高频带激励发生器A300的实施方案A302的方块图。反转量化器450经配置以解量化经编码窄频带激励信号S50以产生窄频带激励信号S80。频谱延伸器A400经配置以基于窄频带激励信号S80产生谐波延伸信号S160。组合器470经配置以将噪声发生器480产生的随机噪声信号与包络计算器460计算的时域包络组合以产生经调制噪声信号S170。组合器490经配置以将谐波延伸信号S60与经调制噪声信号S170混合以产生高频带激励信号S120。
在一个实例中,频谱延伸器A400经配置以对窄频带激励信号S80执行频谱折叠操作(也称为镜射)以产生谐波延伸信号S160。频谱折叠可由零塞入激励信号S80执行且接着应用高通滤波器来保留伪信号。在另一实例中,频谱延伸器A400经配置以通过将窄频带激励信号S80频谱转译到高频带中(例如,经由向上取样,之后与恒定频率余弦信号相乘)来产生谐波延伸信号S160。
频谱折叠和转译方法可产生谐波结构在相位和/或频率上与窄频带激励信号S80的原始谐波结构不连续的频谱延伸信号。举例来说,此类方法可产生具有通常不位于基频的倍数处的峰值的信号,这可能在重建的语音信号中引起声音微弱的假象。这些方法往往还产生具有不自然较强音调特性的高频率谐波。然而,因为PSTN信号可在8kHz下取样但带宽被限制为不大于3400Hz,所以窄频带激励信号S80的上部频谱可能含有极少或不含有能量,使得根据频谱折叠或频谱转译操作产生的延伸信号可具有3400Hz以上的频谱缺陷。
产生谐波延伸信号S160的其它方法包含识别窄频带激励信号S80的一个或一个以上基频,和根据所述信息产生谐音。举例来说,激励信号的谐波结构可由基频与幅值和相位信息一起描述。高频带激励发生器A300的另一实施方案基于基频和幅值(例如,如由音调滞后和音调增益指示)来产生谐波延伸信号S160。然而,除非谐波延伸信号与窄频带激励信号S80在相位上相干,否则所得的经解码语音的质量可能不可接受。
可使用非线性函数来产生与窄频带激励相位上相干并保持谐波结构而没有相位不连续性的高频带激励信号。非线性函数还可提供高频率谐波之间的增加的噪声电平,其往往比通过例如频谱折叠和频谱转译的方法产生的音调高频率谐波听起来更为自然。可由频谱延伸器A400的各种实施方案应用的典型无记忆非线性函数包含绝对值函数(也称为全波整流)、半波整流、平方、立方和削波。频谱延伸器A400的其它实施方案可经配置以应用具有记忆的非线性函数。
图12是频谱延伸器A400的实施方案A402的方块图,频谱延伸器A400经配置以应用非线性函数来延伸窄频带激励信号S80的频谱。向上取样器510经配置以对窄频带激励信号S80进行向上取样。可能需要对信号进行充分向上取样以使应用非线性函数时的混叠最小化。在一个特定实例中,向上取样器510以8为因数对信号进行向上取样。向上取样器510可经配置以通过对输入信号进行零塞入并对结果进行低通滤波来执行向上取样操作。非线性函数计算器520经配置以将非线性函数应用于向上取样信号。对于频谱延伸而言,绝对值函数相对于其它非线性函数(例如,平方函数)的一个潜在优点是,不需要能量标准化。在一些实施方案中,可通过剥离或清除每一样本的符号位来有效地应用绝对值函数。非线性函数计算器520还可经配置以执行向上取样信号或频谱延伸信号的幅值偏差。
向下取样器530经配置以对应用非线性函数的频谱延伸结果进行向下取样。向下取样器530可能需要执行带通滤波操作以在减小取样速率(例如,以便减小或避免由于不必要图像引起的混叠或讹误)之前选择频谱延伸信号的所需频带。向下取样器530可能还需要在一个以上阶段减小取样速率。
图12a是展示频谱延伸操作的一个实例中各点处的信号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号S80已被以8为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的延伸频谱的实例。曲线(d)展示低通滤波之后的频谱。在此实例中,通带延伸到高频带信号S30的频率上限(例如,7kHz或8kHz)。
曲线(e)展示向下取样的第一阶段之后的频谱,其中使取样速率以4为因数减小以获得宽频带信号。曲线(f)展示进行高通滤波操作以选择延伸信号的高频带部分之后的频谱,且曲线(g)展示向下取样的第二阶段之后的频谱,其中使取样速率以2为因数减小。在一个特定实例中,向下取样器530通过使宽频带信号通过滤波器组A112(或具有相同响应的其它结构或例行程序)的高通滤波器130和向下取样器140来执行高通滤波和向下取样的第二阶段,以产生具有高频带信号S30的频率范围和取样速率的频谱延伸信号。
如曲线(g)中可见,曲线(f)所示的高通信号的向下取样促使其频谱反转。在此实例中,向下取样器530还经配置以对信号执行频谱翻转操作。曲线(h)展示应用频谱翻转操作的结果,所述频谱翻转操作可通过将信号与函数ejnπ或序列(-1)n相乘来执行,所述序列(-1)n的值在+1与-1之间交替。此操作等效于在频域中将信号的数字频谱移位距离π。注意到,还可通过以不同次序应用向下取样和频谱翻转操作来获得相同结果。向上取样和/或向下取样的操作还可经配置以包含再取样来获得具有高频带信号S30的取样速率(例如,7kHz)的频谱延伸信号。
如上文注意到,滤波器组A110和B120可经实施使得窄频带和高频带信号S20、S30中的一者或两者在滤波器组A110的输出处具有频谱反转形式,以频谱反转形式被编码和解码,并在宽频带语音信号S110中输出之前在滤波器组B120处再次频谱反转。当然,在此情况下,将不需要如图12a所示的频谱翻转操作,因为高频带激励信号S120将也需要具有频谱反转形式。
频谱延伸器A402执行的频谱延伸操作的向上取样和向下取样的各个任务可以许多不同方式配置和安排。举例来说,图12b是展示频谱延伸操作的另一实例中各点处的信号频谱的图,其中频率标度在各曲线上相同。曲线(a)展示窄频带激励信号S80的一个实例的频谱。曲线(b)展示信号S80已被以2为因数向上取样之后的频谱。曲线(c)展示应用非线性函数之后的延伸频谱的实例。在此情况下,接受较高频率中可能发生的混叠。
曲线(d)展示频谱反转操作之后的频谱。曲线(e)展示向下取样的单一阶段之后的频谱,其中使取样速率以2为因数减小以获得所需频谱延伸信号。在此实例中,所述信号采取频谱反转形式,且可用于处理采取此形式的高频带信号S30的高频带编码器A200的实施方案中。
非线性函数计算器520产生的频谱延伸信号很可能随着频率增加而幅值明显降低。频谱延伸器A402包含频谱整平器540,其经配置以对经向下取样信号执行白化操作。频谱整平器540可经配置以执行固定白化操作或执行自适应白化操作。在自适应白化的特定实例中,频谱整平器540包含:LPC分析模块,其经配置以依据经向下取样信号计算一组四个滤波器系数;以及四次分析滤波器,其经配置以根据那些系数对信号进行白化。频谱延伸器A400的其它实施方案包含频谱整平器540在向下取样器530之前对频谱延伸信号操作的配置。
可实施高频带激励发生器A300以输出谐波延伸信号S160作为高频带激励信号S120。然而,在一些情况下,仅使用谐波延伸信号作为高频带激励可能导致可听到的假象。语音的谐波结构在高频带中通常不如低频带中明显,且在高频带激励信号中使用过多谐波结构可能导致嗡嗡声。此假象在来自女性说话者的语音信号中可能尤其明显。
实施例包含经配置以将谐波延伸信号S160与噪声信号混合的高频带激励发生器A300的实施方案。如图11所示,高频带激励发生器A302包含噪声发生器480,其经配置以产生随机噪声信号。在一个实例中,噪声发生器480经配置以产生单位方差白色伪随机噪声信号,但在其它实施方案中,噪声信号不需要为白色的且可具有随着频率变化的功率密度。噪声发生器480可能需要经配置以输出噪声信号作为确定性函数以便可在解码器处复制其状态。举例来说,噪声发生器480可经配置以输出噪声信号作为早先在相同帧内编码的信息(例如,窄频带滤波器参数S40和/或经编码窄频带激励信号S50)的确定性函数。
在与谐波延伸信号S160混合之前,噪声发生器480产生的随机噪声信号可经幅值调制以具有近似窄频带信号S20、高频带信号S30、窄频带激励信号S80或谐波延伸信号S160的随时间能量分布的时域包络。如图11所示,高频带激励发生器A302包含组合器470,其经配置以根据包络计算器460计算的时域包络对噪声发生器480产生的噪声信号进行幅值调制。举例来说,组合器470可实施为乘法器,其经配置以根据包络计算器460计算的时域包络来缩放噪声发生器480的输出以产生经调制噪声信号S170。
如图13的方块图所示,在高频带激励发生器A302的实施方案A304中,包络计算器460经配置以计算谐波延伸信号S160的包络。如图14的方块图所示,在高频带激励发生器A302的实施方案A306中,包络计算器460经配置以计算窄频带激励信号S80的包络。高频带激励发生器A302的另外的实施方案可以其它方式配置以根据窄频带音调脉冲的位置及时向谐波延伸信号S160添加噪声。
包络计算器460可经配置以作为一项包含一系列子任务的任务而执行包络计算。图15展示此任务的实例T100的流程图。子任务T110计算包络待建模的信号(例如,窄频带激励信号S80或谐波延伸信号S160)的帧的每一样本的平方以产生平方值序列。子任务T120对平方值序列执行平滑操作。在一个实例中,子任务T120根据以下表达式向序列应用一次IIR低通滤波器:
y(n)=ax(n)+(1-a)y(n-1),(1)
其中x是滤波器输入,y是滤波器输出,n是时域索引,且a是具有0.5与1之间的值的平滑系数。平滑系数a的值可为固定的,或者在替代实施方案中,可根据输入信号中噪声的指示而自适应,使得在无噪声的情况下a较接近1,且在存在噪声的情况下较接近0.5。子任务T130将平方根函数应用于经平滑序列的每一样本以产生时域包络。
包络计算器460的此实施方案可经配置以按照串行和/或并行方式执行任务T100的各个子任务。在任务T100的另外的实施方案中,子任务T110之前可以是带通操作,其经配置以选择包络待建模的信号的所需频率部分,例如3-4kHz范围。
组合器490经配置以将谐波延伸信号S160与经调制噪声信号S170混合以产生高频带激励信号S120。组合器490的实施方案可经配置(例如)以将高频带激励信号S120计算为谐波延伸信号S160与经调制噪声信号S170的和。组合器490的此实施方案可经配置以通过在求和之前向谐波延伸信号S160和/或向经调制噪声信号S170应用加权因数,而将高频带激励信号S120计算为加权总和。可根据一个或一个以上标准来计算每一此类加权因数,且所述加权因数可为固定值,或者在逐帧或逐子帧基础上计算出的自适应值。
图16展示组合器490的实施方案492的方块图,所述实施方案492经配置以将高频带激励信号S120计算为谐波延伸信号S160与经调制噪声信号S170的加权总和。组合器492经配置以根据谐波加权因数S180加权谐波延伸信号S160,根据噪声加权因数S190加权经调制噪声信号S170,并输出高频带激励信号S120作为被加权信号的总和。在此实例中,组合器492包含加权因数计算器550,其经配置以计算谐波加权因数S180和噪声加权因数S190。
加权因数计算器550可经配置以根据高频带激励信号S120中谐波含量与噪声含量的所需比率来计算加权因数S180和S190。举例来说,组合器492可能需要产生高频带激励信号S120以具有与高频带信号S30的谐波能量与噪声能量比类似的谐波能量与噪声能量比。在加权因数计算器550的一些实施方案中,根据与窄频带信号S20或窄频带残留信号的周期性有关的一个或一个以上参数(例如,音调增益和/或语音模式)来计算加权因数S180、S190。加权因数计算器550的此实施方案可经配置以向谐波加权因数S180指派(例如)与音调增益成比例的值,且/或对于清语音信号比对于浊语音信号向噪声加权因数S190指派更高的值。
在其它实施方案中,加权因数计算器550经配置以根据高频带信号S30的周期性的指标来计算谐波加权因数S180和/或噪声加权因数S190的值。在一个此类实例中,加权因数计算器550将谐波加权因数S180计算为高频带信号S30的当前帧或子帧的自相关系数的最大值,其中在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围上执行自相关。图17展示以一个音调滞后的延迟为中心并具有不大于一个音调滞后的宽度的长度为n个样本的此搜索范围的实例。
图17还展示加权因数计算器550在若干阶段计算高频带信号S30的周期性的指标的另一方法的实例。在第一阶段,将当前帧划分为许多子帧,且针对每一子帧单独识别自相关系数为最大时的延迟。如上文所提及,在包含一个音调滞后的延迟且不包含零样本的延迟的搜索范围上执行自相关。
在第二阶段,通过将相应识别的延迟应用于每一子帧,连接所得的子帧以建立最佳延迟帧,并将谐波加权因数S180计算为原始帧与最佳延迟帧之间的相关系数,来建立延迟帧。在另一替代实施方案中,加权因数计算器550将谐波加权因数S180计算为第一阶段中针对每一子帧获得的最大自相关系数的平均值。加权因数计算器550的实施方案还可经配置以缩放相关系数,和/或将其与另一值组合,以计算谐波加权因数S180的值。
加权因数计算器550可能需要仅在以其它方式指示帧存在周期性的情况下计算高频带信号S30的周期性的指标。举例来说,加权因数计算器550可经配置以根据当前帧的周期性的另一指示符(例如,音调增益)与阈值之间的关系来计算高频带信号S30的周期性的指标。在一个实例中,加权因数计算器550经配置以仅当帧的音调增益(例如,窄频带残留的自适应密码本增益)的值大于0.5(或者,至少0.5)时才对高频带信号S30执行自相关运算。在另一实例中,加权因数计算器550经配置以仅针对具有特定语音模式状态的帧(例如,仅针对浊音信号)对高频带信号S30执行自相关运算。在此类情况下,加权因数计算器550可经配置以针对具有其它语音模式状态和/或较小的音调增益值的帧分派默认加权因数。
实施例包含经配置以根据不同于周期性或除周期性以外的特性来计算加权因数的加权因数计算器550的另外的实施方案。举例来说,此实施方案可经配置以针对具有大音调滞后的语音信号比针对具有小音调滞后的语音信号向噪声增益因数S190分派更大的值。加权因数计算器550的另一此类实施方案经配置以根据处于基频的倍数处的信号能量相对于处于其它频率分量处的信号能量的指标,来确定宽频带语音信号S10或高频带信号S30的谐度的指标。
宽频带语音编码器A100的一些实施方案经配置以基于本文描述的音调增益和/或周期性或谐度的另一指标来输出周期性或谐度的指示(例如,指示帧为谐波还是非谐波的1位旗标)。在一个实例中,相应的宽频带语音解码器B100使用此指示来配置例如加权因数计算的操作。在另一实例中,此指示用于编码器和/或解码器处来计算语音模式参数的值。
可能需要高频带激励发生器A302产生高频带激励信号S120,使得激励信号的能量大致不受加权因数S180和S190的特定值的影响。在此情况下,加权因数计算器550可经配置以计算谐波加权因数S180或噪声加权因数S190的值(或从存储装置或高频带编码器A200的另一元件接收此值),并根据例如以下表达式导出另一加权因数的值:
(W谐波)2+(W噪声)2=1,(2)
其中W谐波表示谐波加权因数S180,且W噪声表示噪声加权因数S190。或者,加权因数计算器550可经配置以根据当前帧或子帧的周期性指标的值从多对加权因数S180、S190中选出相应一者,其中所述对经预先计算以满足例如表达式(2)的恒定能量比。对于遵循表达式(2)的加权因数计算器550的实施方案,谐波加权因数S180的典型值在约0.7到约1.0范围内,且噪声加权因数S190的典型值在约0.1到约0.7范围内。加权因数计算器550的其它实施方案可经配置以根据一种形式的表达式(2)来操作,所述形式的表达式(2)依据谐波延伸信号S160与经调制噪声信号S170之间的所需基线加权进行修改。
当已使用稀疏密码本(条目大部分为零值的密码本)来计算残留的量化表示形式时,合成语音信号中可能发生假象。尤其当以低位速率编码窄频带信号时,会发生密码本稀疏。密码本稀疏引起的假象通常在时间上是准周期性的,且主要在3kHz以上发生。因为人耳在较高频率下具有较好的时间分辨能力,所以这些假象在高频带中可能较明显。
实施例包含经配置以执行抗稀疏滤波的高频带激励发生器A300的实施方案。图18展示高频带激励发生器A302的实施方案A312的方块图,所述实施方案A312包含抗稀疏滤波器600,其经配置以对反转量化器450产生的经解量化窄频带激励信号进行滤波。图19展示高频带激励发生器A302的实施方案A314的方块图,所述实施方案A314包含抗稀疏滤波器600,其经配置以对频谱延伸器A400产生的频谱延伸信号进行滤波。图20展示高频带激励发生器A302的实施方案A316的方块图,所述实施方案A316包含抗稀疏滤波器600,其经配置以对组合器490的输出进行滤波以产生高频带激励信号S120。当然,预期并在此明确地揭示将实施方案A304和A306的任一者的特征与实施方案A312、A314和A316的任一者的特征组合的高频带激励发生器A300的实施方案。抗稀疏滤波器600也可配置在频谱延伸器A400内:例如在频谱延伸器A402中的元件510、520、530和540的任一者之后。特别注意到,抗稀疏滤波器600也可用于频谱延伸器A400的执行频谱折叠、频谱转译或谐波延伸的实施方案。
抗稀疏滤波器600可经配置以改变其输入信号的相位。举例来说,抗稀疏滤波器600可能需要经配置和安排,使得高频带激励信号S120的相位随着时间随机化或其它方式更为均匀地分布。可能还需要抗稀疏滤波器600的响应为频谱整平的,使得经滤波信号的幅值频谱不会有相当大的改变。在一个实例中,抗稀疏滤波器600根据以下表达式实施为具有转移函数的全通滤波器:
H ( z ) = - 0.7 + z - 4 1 - 0.7 z - 4 · 0.6 + z - 6 1 + 0.6 z - 6 . - - - ( 3 )
此滤波器的一个作用可以是将输入信号的能量散布开使得其不再仅集中于几个样本中。
密码本稀疏引起的假象通常对于其中残留包含较少音调信息的类似噪声的信号较明显,且对于背景噪声中的语音也较明显。稀疏在激励具有长期结构的情况下通常引起较少假象,且事实上相位修改可引起浊音信号中的噪声。因此,可能需要配置抗稀疏滤波器600以对清音信号进行滤波并在不作出改变的情况下使至少一些浊音信号通过。清音信号的特征在于低音调增益(例如,量化窄频带自适应密码本增益)和接近零或为正的频谱倾斜(例如,量化第一反射系数),从而指示整平或随着频率的不断增加而向上倾斜的频谱包络。抗稀疏滤波器600的典型实施方案经配置以对清音(例如,如频谱倾斜的值所指示)进行滤波,当音调增益低于阈值(或者,不大于阈值)时对浊音进行滤波,且否则在不作出改变的情况下使信号通过。
抗稀疏滤波器600的另外的实施方案包含两个或两个以上滤波器,其经配置以具有不同的最大相位修改角(例如,高达180度)。在此情况下,抗稀疏滤波器600可经配置以根据音调增益(例如,量化自适应密码本或LTP增益)的值在这些组成滤波器中进行选择,以便将较大的最大相位修改角用于具有较低音调增益值的帧。抗稀疏滤波器600的实施方案还可包含不同的组成滤波器,其经配置以在频谱的或多或少的部分上修改相位,以便将经配置以在输入信号的较宽频率范围上修改相位的滤波器用于具有较低音调增益值的帧。
为了准确地复制经编码语音信号,可能需要使合成宽频带语音信号S100的高频带与窄频带部分的电平之间的比率类似于原始宽频带语音信号S10中的所述比率。除了高频带编码参数S60a表示的频谱包络外,高频带编码器A200还可经配置以通过指定时间或增益包络来表征高频带信号S30。如图10所示,高频带编码器A202包含高频带增益因数计算器A230,其经配置和安排以根据高频带信号S30与合成高频带信号S130之间的关系(例如,所述两个信号在帧或其某一部分上的能量之间的差或比率)来计算一个或一个以上增益因数。在高频带编码器A202的其它实施方案中,高频带增益计算器A230可同样地配置但改为经安排以根据高频带信号S30与窄频带激励信号S80或高频带激励信号S120之间的这种时间变化关系来计算增益包络。
窄频带激励信号S80和高频带信号S30的时间包络很可能类似。因此,编码基于高频带信号S30与窄频带激励信号S80(或从中导出的信号,例如高频带激励信号S120或合成高频带信号S130)之间的关系的增益包络通常将比编码仅基于高频带信号S30的增益包络有效。在典型实施方案中,高频带编码器A202经配置以输出为每一帧指定5个增益因数的8到12位的量化索引。
高频带增益因数计算器A230可经配置以作为一项包含一个或一个以上系列的子任务的任务而执行增益因数计算。图21展示根据高频带信号S30与合成高频带信号S130的相对能量计算相应子帧的增益值的任务的实例T200的流程图。任务220a和220b计算各个信号的相应子帧的能量。举例来说,任务220a和220b可经配置以将能量计算为各个子帧的样本的平方的和。任务T230将子帧的增益因数计算为那些能量的比率的平方根。在此实例中,任务T230将增益因数计算为子帧上高频带信号S30的能量与合成高频带信号S130的能量的比率的平方根。
高频带增益因数计算器A230可能需要经配置以根据窗口函数来计算子帧能量。图22展示增益因数计算任务T200的此实施方案T210的流程图。任务T215a将窗口函数应用于高频带信号S30,且任务T215b将相同窗口函数应用于合成高频带信号S 130。任务220a和220b的实施方案222a和222b计算各自窗口的能量,且任务T230将子帧的增益因数计算为能量的比率的平方根。
可能需要应用与邻近子帧重叠的窗口函数。举例来说,可以重叠-相加方式应用的产生增益因数的窗口函数可帮助减小或避免子帧之间的不连续性。在一个实例中,高频带增益因数计算器A230经配置以应用如图23a所示的梯形窗口函数,其中窗口与两个邻近子帧的每一者重叠一毫秒。图23b展示将此窗口函数应用于20毫秒帧的五个子帧的每一者。高频带增益因数计算器A230的其它实施方案可经配置以应用具有不同重叠周期和/或不同窗口形状(例如,矩形、汉明)(其可对称或不对称)的窗口函数。高频带增益因数计算器A230的实施方案还可能经配置以将不同窗口函数应用于帧内的不同子帧和/或包含具有不同长度的子帧的帧。
提供以下值(没有限制)作为特定实施方案的实例。针对这些情况假定一个20毫秒的帧,但可使用任何其它持续时间。对于以7kHz取样的高频带信号,每一帧具有140个样本。如果将此帧划分为具有相等长度的五个子帧,那么每一子帧将具有28个样本,且如图23a所示的窗口将为42个样本宽。对于以8kHz取样的高频带信号,每一帧具有160个样本。如果此帧划分为具有相等长度的五个子帧,那么每一子帧将具有32个样本,且如图23a所示的窗口将为48个样本宽。在其它实施方案中,可使用具有任何宽度的子帧,且甚至可能使高频带增益计算器A230的实施方案经配置以针对帧的每一样本产生不同的增益因数。
图24展示高频带解码器B200的实施方案B202的方块图。高频带解码器B202包含高频带激励发生器B300,其经配置以基于窄频带激励信号S80产生高频带激励信号S120。视特定系统设计选择而定,可根据本文描述的高频带激励发生器A300的实施方案的任一者来实施高频带激励发生器B300。通常,需要将高频带激励发生器B300实施为具有与特定编码系统的高频带编码器的高频带激励发生器相同的响应。然而,因为窄频带解码器B110通常将执行经编码窄频带激励信号S50的解量化,所以在大多数情况下,高频带激励发生器B300可经实施以从窄频带解码器B110接收窄频带激励信号S80,而不需要包含经配置以对经编码窄频带激励信号S50解量化的反转量化器。窄频带解码器B110也可能经实施以包含抗稀疏滤波器600的实例,其经配置以在将经解量化的窄频带激励信号输入到例如滤波器330的窄频带合成滤波器之前对所述信号进行滤波。
反转量化器560经配置以对高频带滤波器参数S60a(在此实例中为一组LSF)解量化,且LSF-LP滤波器系数变换570经配置以将LSF变换为一组滤波器系数(例如,如上文参照窄频带编码器A122的反转量化器240和变换250所描述)。在其它实施方案中,如上文所提及,可使用不同系数组(例如,倒谱系数)和/或系数表示形式(例如,ISP)。高频带合成滤波器B200经配置以根据高频带激励信号S120和所述组滤波器系数产生合成高频带信号。对于其中高频带编码器包含合成滤波器的系统(例如,如上述编码器A202的实例中),可能需要将高频带合成滤波器B200实施为具有与所述合成滤波器相同的响应(例如,相同转移函数)。
高频带解码器B202还包含经配置以对高频带增益因数S60b解量化的反转量化器580,和经配置和安排以将经解量化的增益因数应用于合成高频带信号以产生高频带信号S100的增益控制元件590(例如,乘法器或放大器)。对于其中帧的增益包络由一个以上增益因数指定的情况,增益控制元件590可包含经配置以可能根据窗口函数将增益因数应用于各个子帧的逻辑,所述窗口函数可与由相应高频带编码器的增益计算器(例如,高频带增益计算器A230)应用的窗口函数相同或不同。在高频带解码器B202的其它实施方案中,增益控制元件590经类似地配置但经安排以改为将经解量化的增益因数应用于窄频带激励信号S80或应用于高频带激励信号S120。
如上文所提及,可能需要在高频带编码器与高频带解码器中获得相同状态(例如,通过在编码期间使用经解量化值)。因此,可能需要在根据此实施方案的编码系统中确保高频带激励发生器A300和B300中的相应噪声发生器具有相同状态。举例来说,此实施方案的高频带激励发生器A300和B300可经配置而使得噪声发生器的状态是相同帧内已编码的信息(例如,窄频带滤波器参数S40或其一部分,和/或经编码窄频带激励信号S50或其一部分)的确定性函数。
本文描述的元件的量化器中的一者或一者以上(例如,量化器230、420或430)可经配置以执行分类向量量化。举例来说,此量化器可经配置以基于窄频带信道中和/或高频带信道中的相同帧内已编码的信息从一组密码本中选出一个密码本。此技术通常以存储额外的密码本为代价提供增加的编码效率。
如上文参看例如图8和9所论述,在从窄频带语音信号S20中去除粗略频谱包络之后,相当大量的周期性结构可能保留在残留信号中。举例来说,残留信号可随时间而含有粗略周期性脉冲或尖峰信号序列。此结构(通常与音调有关)尤其有可能发生在浊音语音信号中。窄频带残留信号的量化表示形式的计算可包含根据由(例如)一个或一个以上密码本表示的长期周期性的模型来编码此音调结构。
实际残留信号的音调结构可能不与周期性模型完全匹配。举例来说,残留信号可能包含音调脉冲的位置规则性的较小抖动,使得帧中连续音调脉冲之间的距离不完全相等且所述结构并非相当规则。这些不规则性往往会降低编码效率。
窄频带编码器A120的一些实施方案经配置以通过在量化之前或期间将自适应时间偏差应用于残留,或通过以其它方式在经编码激励信号中包含自适应时间偏差,来执行音调结构的规则化。举例来说,此编码器可经配置以选择或以其它方式计算时间偏差的程度(例如,根据一个或一个以上感知加权和/或误差最小化标准),使得所得的激励信号与长期周期性的模型最佳拟和。音调结构的规则化由称为松弛代码激励线性预测(RCELP)编码器的CELP编码器子组执行。
RCELP编码器通常经配置以执行时间偏差作为自适应时移。此时移可为负几毫秒到正几毫秒范围的延迟,且其通常平滑地变化以避免可听到的不连续性。在一些实施方案中,此编码器经配置以用分段方式应用规则化,其中每一帧或子帧偏差相应的固定时移。在其它实施方案中,编码器经配置以应用规则化作为连续偏差函数,使得帧或子帧根据音调轮廓(也称为音调轨迹)而偏差。在一些情况下(例如,如第2004/0098255号美国专利申请公开案中所描述),编码器经配置以通过将偏移应用于用于计算经编码激励信号的感知加权输入信号而在经编码激励信号中包含时间偏差。
编码器计算规则化和量化的经编码激励信号,且解码器对经编码激励信号解量化以获得用于合成经解码语音信号的激励信号。经解码输出信号因此展现出与通过规则化而包含在经编码激励信号中的延迟相同的变化的延迟。通常,不将任何指定规则化量的信息传输到解码器。
规则化往往使残留信号较易编码,这改进了来自长期预测器的编码增益且因此推进了总体编码效率,而通常不会产生假象。可能需要仅对浊音帧执行规则化。举例来说,窄频带编码器A124可经配置以仅偏移那些具有长期结构(例如,浊音信号)的帧或子帧。甚至可能需要仅对包含音调脉冲能量的子帧执行规则化。第5,704,003号美国专利(Kleijn等人)和第6,879,955号美国专利(Rao)和第2004/0098255号美国专利申请公开案(Kovesi等人)中描述了RCELP编码的各种实施方案。RCELP编码器的现有实施方案包含如电信工业协会(TIA)IS-127中所描述的增强可变速率编译码器(EVRC),和第三代合作伙伴关系计划2(3GPP2)可选模式声码器(SMV)。
不幸的是,规则化对于其中从经编码窄频带激励信号导出高频带激励的宽频带语音编码器(例如,包含宽频带语音编码器A100和宽频带语音解码器B100的系统)可能导致若干问题。由于高频带激励信号相对于时间偏差信号的偏转,所以高频带激励信号通常将具有与原始高频带语音信号的时间表不同的时间表。换句话说,高频带激励信号将不再与原始高频带语音信号同步。
偏差高频带激励信号与原始高频带语音信号之间的时间上的不对准可能引起若干问题。举例来说,偏差高频带激励信号可能不再为根据从原始高频带语音信号中提取的滤波器参数配置的合成滤波器提供适宜的源激励。因此,合成高频带信号可含有减小经解码宽频带语音信号的感知质量的可听到的假象。
时间上的不对准还可能引起增益包络编码的低效率。如上文所提及,窄频带激励信号S80与高频带信号S30的时间包络之间很可能存在相关。通过根据这两个时间包络之间的关系编码高频带信号的增益包络,与直接编码增益包络相比可实现编码效率的提高。然而,当经编码窄频带激励信号规则化时,此相关可能削弱。窄频带激励信号S80与高频带信号S30之间的时间上的不对准可导致高频带增益因数S60b中出现波动,且编码效率可能降低。
实施例包含根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执行时间偏差的宽频带语音编码方法。此类方法的潜在优点包含改进经解码宽频带语音信号的质量和/或改进编码高频带增益包络的效率。
图25展示宽频带语音编码器A100的实施方案AD10的方块图。编码器AD10包含窄频带编码器A120的实施方案A124,所述实施方案A124经配置以在计算经编码窄频带激励信号S50期间执行规则化。举例来说,窄频带编码器A124可根据上文论述的RCELP实施方案中的一者或一者以上配置。
窄频带编码器A124还经配置以输出指定所应用的时间偏差的程度的规则化数据信号SD10。对于窄频带编码器A124经配置以将固定时移应用于每一帧或子帧的各种情况,规则化数据信号SD10可包含一系列值,其以样本、毫秒或某一其它时间增量为单位将每一时移量指示为整数或非整数值。对于窄频带编码器A124经配置以用其它方式修改帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)的情况,规则化信息信号SD10可包含对修改的相应描述,例如一组函数参数。在一个特定实例中,窄频带编码器A124经配置以将帧划分为三个子帧并计算每一子帧的固定时移,使得规则化数据信号SD10指示经编码窄频带信号的每一规则化帧的三个时移量。
宽频带语音编码器AD10包含延迟线D120,其经配置以根据由输入信号指示的延迟量来推进或阻滞高频带语音信号S30的若干部分,从而产生时间偏差高频带语音信号S30a。在图25所示的实例中,延迟线D120经配置以根据由规则化数据信号SD10指示的偏差来对高频带语音信号S30执行时间偏差。以此方式,经编码窄频带激励信号S50中包含的相同时间偏差量也在分析之前应用于高频带语音信号S30的相应部分。尽管此实例将延迟线D120展示为高频带编码器A200的单独元件,但在其它实施方案中,延迟线D120配置为高频带编码器的一部分。
高频带编码器A200的另外的实施方案可经配置以执行未偏差高频带语音信号S30的频谱分析(例如,LPC分析),并在计算高频带增益参数S60b之前执行高频带语音信号S30的时间偏差。此编码器可包含(例如)经配置以执行时间偏差的延迟线D120的实施方案。然而,在此类情况下,基于对未偏差信号S30的分析的高频带滤波器参数S60a可描述与高频带激励信号S120在时间上不对准的频谱包络。
延迟线D120可根据适于将所需时间偏差操作应用于高频带语音信号S30的逻辑元件与存储元件的任何组合来配置。举例来说,延迟线D120可经配置以根据所需的时移从缓冲器中读取高频带语音信号S30。图26a展示延迟线D120的此实施方案D122的示意图,所述延迟线D120包含移位寄存器SR1。移位寄存器SR1是经配置以接收和存储高频带语音信号S30的m个最新近样本的具有大约长度m的缓冲器。值m至少等于将支持的最大正(或“推进”)与负(或“阻滞”)时移的总和。值m等于高频带信号S30的帧或子帧的长度可能会较方便。
延迟线D122经配置以从移位寄存器SR1的偏移位置OL输出时间偏差高频带信号S30a。偏移位置OL的定位根据由例如规则化数据信号SD10指示的当前时移而在参考位置(零时移)附近变化。延迟线D122可经配置以支持相等的推进和阻滞限制,或者一个限制大于另一限制,使得可在一个方向上比在另一方向上执行更大偏移。图26a展示支持的正时移大于负时移的特定实例。延迟线D122可经配置以一次输出一个或一个以上样本(例如视输出总线宽度而定)。
具有大于几毫秒的量值的规则化时移可引起经解码信号中的可听到的假象。通常,由窄频带编码器A124执行的规则化时移的量值将不超过几毫秒,使得由规则化数据信号SD10指示的时移将有限。然而,在此类情况下可能需要延迟线D122经配置以对正和/或负方向上的时移强加最大限制(例如,以遵循比窄频带编码器强加的限制更为严格的限制)。
图26b展示延迟线D122的实施方案D124的示意图,延迟线D122包含移位窗口SW。在此实例中,偏移位置OL的定位受移位窗口SW限制。尽管图26b展示缓冲器长度m大于移位窗口SW的宽度的情况,但延迟线D124也可经实施使得移位窗口SW的宽度等于m。
在其它实施方案中,延迟线D120经配置以根据所需时移将高频带语音信号S30写入到缓冲器。图27展示延迟线D120的实施方案D130的示意图,所述实施方案D130包含经配置以接收和存储高频带语音信号S30的两个移位寄存器SR2和SR3。延迟线D130经配置以根据例如由规则化数据信号SD10指示的时移而将来自移位寄存器SR2的帧或子帧写入到移位寄存器SR3。移位寄存器SR3配置为FIFO缓冲器,其经配置以输出时间偏差高频带信号S30。
在图27所示的特定实例中,移位寄存器SR2包含帧缓冲器部分FB1和延迟缓冲器部分DB,且移位寄存器SR3包含帧缓冲器部分FB2、推进缓冲器部分AB和阻滞缓冲器部分RB。推进缓冲器AB和阻滞缓冲器RB的长度可相等,或者其中一者可大于另一者,使得所支持的一个方向上的偏移大于所支持的另一方向上的偏移。延迟缓冲器DB和阻滞缓冲器部分RB可经配置以具有相同长度。或者,延迟缓冲器DB可比阻滞缓冲器RB短以考虑到将样本从帧缓冲器FB1转移到移位寄存器SR3所需的时间间隔,所述转移可包含例如在存储到移位寄存器SR3之前先使样本偏差的其它处理操作。
在图27的实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个帧的长度相等的长度。在另一实例中,帧缓冲器FB1经配置以具有与高频带信号S30的一个子帧的长度相等的长度。在此情况下,延迟线D130可经配置以包含用于将相同(例如,平均)延迟应用于待偏移的帧的所有子帧的逻辑。延迟线D130还可包含用于将来自帧缓冲器FB1的值与阻滞缓冲器RB或推进缓冲器AB中待重写的值进行平均的逻辑。在另一实例中,移位寄存器SR3可经配置以仅经由帧缓冲器FB1接收高频带信号S30的值,且在此情况下,延迟线D130可包含用于在写入到移位寄存器SR3的连续帧或子帧之间的间隙上进行内插的逻辑。在其它实施方案中,延迟线D130可经配置以在将来自帧缓冲器FB1的样本写入到移位寄存器SR3之前对所述样本执行偏差操作(例如,根据由规则化数据信号SD10描述的函数)。
延迟线D120可能需要应用基于但不等同于由规则化数据信号SD10指定的偏差的时间偏差。图28展示宽频带语音编码器AD10的实施方案AD12的方块图,宽频带语音编码器AD10包含延迟值映射器D110。延迟值映射器D110经配置以将由规则化数据信号SD10指示的偏差映射为经映射延迟值SD10a。延迟线D120经配置以根据由经映射延迟值SD10a指示的偏差来产生时间偏差高频带语音信号S30a。
可预期窄频带编码器应用的时移随时间平滑地进展。因此,通常计算语音帧期间应用于子帧的平均窄频带时移并根据此平均值来偏移高频带语音信号S30的相应帧已足够。在一个此类实例中,延迟值映射器D110经配置以计算每一帧的子帧延迟值的平均值,且延迟线D120经配置以将计算出的平均值应用于高频带信号S30的相应帧。在其它实例中,可计算和应用较短周期(例如,两个子帧,或半个帧)或较长周期(例如,两个帧)内的平均值。在平均值是样本的非整数值的情况下,延迟值映射器D110可经配置以在将所述值输出到延迟线D120之前将所述值四舍五入为样本的整数数目。
窄频带编码器A124可经配置以在经编码窄频带激励信号中包含非整数数目的样本的规则化时移。在此情况下,延迟值映射器D110可能需要经配置以将窄频带时移四舍五入为样本的整数数目,且延迟线D120可能需要将经四舍五入的时移应用于高频带语音信号S30。
在宽频带语音编码器AD10的一些实施方案中,窄频带语音信号S20与高频带语音信号S30的取样速率可能不同。在此类情况下,延迟值映射器D110可经配置以调节规则化数据信号SD10中指示的时移量,以考虑窄频带语音信号S20(或窄频带激励信号S80)与高频带语音信号S30的取样速率之间的差异。举例来说,延迟值映射器D110可经配置以根据取样速率的比率缩放时移量。在上文提及的一个特定实例中,以8kHz对窄频带语音信号S20进行取样,且以7kHz对高频带语音信号S30进行取样。在此情况下,延迟值映射器D110经配置以将每一偏移量乘以7/8。延迟值映射器D110的实施方案还可经配置以执行此缩放运算以及本文描述的整数四舍五入和/或时移平均运算。
在另外的实施方案中,延迟线D120经配置以用其它方式修改帧或其它样本序列的时间标度(例如,通过压缩一个部分并扩展另一部分)。举例来说,窄频带编码器A124可经配置以根据例如音调轮廓或轨迹的函数来执行规则化。在此情况下,规则化数据信号SD10可包含对所述函数的相应描述(例如一组参数),且延迟线D120可包含经配置以根据所述函数对高频带语音信号S30的帧或子帧执行偏差的逻辑。在其它实施方案中,延迟值映射器D110经配置以在将所述函数通过延迟线D120应用于高频带语音信号S30之前对所述函数进行平均、缩放和/或四舍五入。举例来说,延迟值映射器D110可经配置以根据所述函数计算一个或一个以上延迟值,每一延迟值指示样本数目,其接着由延迟线D120应用以对高频带语音信号S30的一个或一个以上相应帧或子帧执行时间偏差。
图29展示根据相应经编码窄频带激励信号中包含的时间偏差对高频带语音信号执行时间偏差的方法MD100的流程图。任务TD100处理宽频带语音信号以获得窄频带语音信号和高频带语音信号。举例来说,任务TD100可经配置以使用具有低通滤波器和高通滤波器的滤波器组(例如滤波器组A110的实施方案)对宽频带语音信号进行滤波。任务TD200将窄频带语音信号至少编码为经编码的窄频带激励信号和多个窄频带滤波器参数。所述经编码的窄频带激励信号和/或滤波器参数可量化,且经编码的窄频带激励信号还可包含例如语音模式参数的其它参数。任务TD200还包含经编码的窄频带激励信号中的时间偏差。
任务TD300基于窄频带激励信号产生高频带激励信号。在此情况下,窄频带激励信号基于经编码的窄频带激励信号。任务TD400根据至少所述高频带激励信号,将高频带语音信号至少编码为多个高频带滤波器参数。举例来说,任务TD400可经配置以将高频带语音信号编码为多个量化LSF。任务TD500将时移应用于高频带语音信号,所述时移基于与经编码窄频带激励信号中包含的时间偏差有关的信息。
任务TD400可经配置以对高频带语音信号执行频谱分析(例如,LPC分析),且/或计算高频带语音信号的增益包络。在此类情况下,任务TD500可经配置以在所述分析和/或增益包络计算之前将时移应用于高频带语音信号。
宽频带语音编码器A100的其它实施方案经配置以将由经编码窄频带激励信号中包含的时间偏差引起的高频带激励信号S120的时间偏差反转。举例来说,高频带激励发生器A300可经实施以包含延迟线D120的实施方案,延迟线D120的所述实施方案经配置以接收规则化数据信号SD10或经映射延迟值SD10a,并将相应的反转时移应用于窄频带激励信号S80,且/或应用于基于所述窄频带激励信号S80的随后信号(例如,谐波延伸信号S160或高频带激励信号S120)。
另外的宽频带语音编码器实施方案可经配置以彼此独立地对窄频带语音信号S20和高频带语音信号S30进行编码,使得高频带语音信号S30被编码为高频带频谱包络和高频带激励信号的表示形式。此实施方案可经配置以根据与经编码窄频带激励信号中包含的时间偏差有关的信息对高频带残留信号执行时间偏差,或用其它方式将时间偏差包含在经编码高频带激励信号中。举例来说,高频带编码器可包含本文描述的经配置以将时间偏差应用于高频带残留信号的延迟线D120和/或延迟值映射器D110的实施方案。此操作的潜在优点包含对高频带残留信号的较有效编码,和合成窄频带与高频带语音信号之间的较好匹配。
如上文所提及,本文描述的实施例包含可用于执行嵌入式编码的实施方案、支持与窄频带系统的兼容性并避免需要代码转换。对高频带编码的支持还可用于按照成本来区分具有带有向后兼容性的宽频带支持的芯片、芯片组、装置和/或网络与仅具有窄频带支持的芯片、芯片组、装置和/或网络。如本文所描述的对高频带编码的支持也可与用于支持低频带编码的技术结合使用,且根据此实施例的系统、方法或设备可支持对例如约50或100Hz一直到约7或8kHz的频率分量的编码。
如上文所提及,向语音编码器添加高频带支持可改进清晰度,尤其是关于摩擦音的区分的清晰度。尽管这种区分通常可能由人类收听者根据特定上下文推导出来,但高频带支持可充当语音识别和其它机器解译应用(例如用于自动化语音菜单导航和/或自动呼叫处理的系统)中的启用特征。
根据一实施例的设备可嵌入到便携式无线通信装置(例如,蜂窝式电话或个人数字助理(PDA))中。或者,此设备可包含在另一通信装置中,例如VoIP手机、经配置以支持VoIP通信的个人计算机或经配置以路由电话或VoIP通信的网络装置。举例来说,根据一实施例的设备可实施在通信装置的芯片或芯片组中。视特定应用而定,此装置还可包含例如以下特征:对语音信号的模拟-数字和/或数字-模拟转换、用于对语音信号执行放大和/或其它信号处理操作的电路,和/或用于发射和/或接收经编码语音信号的射频电路。
明确预期且揭示实施例可包含第60/667,901号和第60/673,965号美国临时专利申请案中揭示的其它特征中的任一者或一者以上且/或与其一起使用,本申请案中主张所述临时专利申请案的权益。此类特征包含去除发生于高频带中且在窄频带中大体上不存在的具有短持续时间的高能量突发。此类特征包含例如高频带LSF的系数表示形式的固定或自适应平滑。此类特征包含与例如LSF的系数表示形式的量化相关联的噪声的固定或自适应成形。此类特征还包含增益包络的固定或自适应平滑,以及增益包络的自适应衰减。
提供对所描述实施例的以上介绍以便使所属领域的技术人员能够制造或使用本发明。可能对这些实施例作出各种修改,且本文提供的一般原理也可应用于其它实施例。举例来说,实施例可部分或整体地实施为硬连线电路,实施为制造到专用集成电路中的电路配置,或者实施为作为机器可读代码加载到非易失性存储装置中的固件程序、或从数据存储媒体加载或加载到数据存储媒体中的软件程序,所述代码为可由例如微处理器或其它数字信号处理单元的逻辑元件阵列执行的指令。数据存储媒体可为存储元件阵列,例如半导体存储器(其可包含(不限于)动态或静态RAM(随机存取存储器)、ROM(只读存储器)和/或快闪RAM),或铁电、磁阻、双向开关半导体、聚合物或相变存储器;或者例如磁盘或光盘的圆盘式媒体。术语“软件”应理解为包含源代码、汇编语言代码、机器代码、二进制代码、固件、宏代码、微码、可由逻辑元件阵列执行的任何一个或一个以上指令组或序列,以及此类实例的任何组合。
高频带激励发生器A300和B300、高频带编码器A100、高频带解码器B200、宽频带语音编码器A100和宽频带语音解码器B100的实施方案的各种元件可实施为(例如)驻存在芯片组中的同一芯片上或两个或两个以上芯片之间的电子和/或光学装置,但也预期存在没有此限制的其它配置。此设备的一个或一个以上元件可整体或部分地实施为一个或一个以上指令组,所述指令组经配置以在一个或一个以上固定或可编程逻辑元件(例如,晶体管、门)阵列上执行,所述元件例如为微处理器、内嵌式处理器、IP核心、数字信号处理器、FPGA(场可编程门阵列)、ASSP(专用标准产品)和ASIC(专用集成电路)。一个或一个以上此类元件也可能具有共同结构(例如,用于在不同时间执行对应于不同元件的代码部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令组,或者在不同时间针对不同元件执行操作的电子和/或光学装置的配置)。此外,一个或一个以上此类元件可能用于执行与设备的操作并不直接相关的任务或其它指令组,例如与内嵌有所述设备的装置或系统的另一操作相关的任务。
图30展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带部分进行编码的方法M100的流程图。任务X100计算表征高频带部分的频谱包络的一组滤波器参数。任务X200通过将非线性函数应用于从窄频带部分导出的信号来计算频谱延伸信号。任务X300根据(A)所述组滤波器参数和(B)基于所述频谱延伸信号的高频带激励信号来产生合成高频带信号。任务X400基于(C)高频带部分的能量与(D)从窄频带部分导出的信号的能量之间的关系来计算增益包络。
图31a展示根据一实施例产生高频带激励信号的方法M200的流程图。任务Y100通过将非线性函数应用于从语音信号的窄频带部分导出的窄频带激励信号来计算经谐波延伸信号。任务Y200将经谐波延伸信号与经调制噪声信号混合以产生高频带激励信号。图31b展示根据包含任务Y300和Y400的另一实施例产生高频带激励信号的方法M210的流程图。任务Y300根据窄频带激励信号和经谐波延伸信号中的一者的随时间的能量来计算时域包络。任务Y400根据时域包络调制噪声信号以产生经调制噪声信号。
图32展示根据一实施例对具有窄频带部分和高频带部分的语音信号的所述高频带部分进行解码的方法M300的流程图。任务Z100接收表征所述高频带部分的频谱包络的一组滤波器参数和表征所述高频带部分的时间包络的一组增益因数。任务Z200通过将非线性函数应用于从窄频带部分导出的信号来计算频谱延伸信号。任务Z300根据(A)所述组滤波器参数和(B)基于所述频谱延伸信号的高频带激励信号来产生合成高频带信号。任务Z400基于所述组增益因数来调制所述合成高频带信号的增益包络。举例来说,任务Z400可经配置以通过将所述组增益因数应用于从窄频带部分导出的激励信号、应用于频谱延伸信号、应用于高频带激励信号,或应用于合成高频带信号,来调制所述合成高频带信号的增益包络。
实施例还包含如本文中(例如)通过对经配置以执行额外语音译码、编码和解码方法的结构实施例的描述而明确揭示的所述额外语音译码、编码和解码方法。这些方法的每一者也可确实地实施(例如,在如上文列举的一个或一个以上数据存储媒体中)为可由包含逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)阵列的机器读取和/或执行的一个或一个以上指令组。因此,本发明不希望限于上文展示的实施例,而是应符合与本文中(包含所提交的形成原始揭示案的一部分的所附权利要求书中)以任何方式揭示的原理和新颖特征一致的最广泛范围。

Claims (40)

1.一种产生高频带激励信号的方法,所述方法包括:
通过延伸基于经编码窄频带激励信号的信号的频谱来产生频谱延伸信号;以及
对基于所述经编码窄频带激励信号的信号执行抗稀疏滤波,其中包括基于窄频带语音信号的频谱倾斜参数、音高增益参数和语音模式参数中的至少一个值,决定是否对基于所述经编码窄频带激励信号的信号执行抗稀疏滤波,其中所述经编码窄频带激励信号是由所述窄频带语音信号生成的,
其中所述高频带激励信号基于所述频谱延伸信号,且
其中所述高频带激励信号基于所述执行抗稀疏滤波的结果。
2.根据权利要求1所述的方法,其中所述执行抗稀疏滤波包含对所述频谱延伸信号执行抗稀疏滤波。
3.根据权利要求1所述的方法,其中所述执行抗稀疏滤波包含对所述高频带激励信号执行抗稀疏滤波。
4.根据权利要求1所述的方法,其中所述对信号执行抗稀疏滤波包含根据全通转移函数对所述基于所述经编码窄频带激励信号的信号执行滤波操作。
5.根据权利要求1所述的方法,其中所述对信号执行抗稀疏滤波包含在不显著修改所述基于所述经编码窄频带激励信号的信号的量值频谱的情况下改变所述基于所述经编码窄频带激励信号的信号的相位频谱。
6.根据权利要求1所述的方法,其中所述产生频谱延伸信号包括谐波延伸基于所述经编码窄频带激励信号的信号的频谱以获得所述频谱延伸信号。
7.根据权利要求1所述的方法,其中所述产生频谱延伸信号包括将非线性函数应用于基于所述经编码窄频带激励信号的信号以产生所述频谱延伸信号。
8.根据权利要求7所述的方法,其中所述非线性函数包括绝对值函数、平方函数和削波函数中的至少一者。
9.根据权利要求1所述的方法,所述方法包括将基于所述频谱延伸信号的信号与经调制噪声信号混合,其中所述高频带激励信号基于所述混合信号。
10.根据权利要求9所述的方法,其中所述混合包含计算所述经调制噪声信号与基于所述频谱延伸信号的信号的加权总和,其中所述高频带激励信号基于所述加权总和。
11.根据权利要求9所述的方法,其中所述经调制噪声信号基于根据一信号的时域包络来调制噪声信号的结果,所述用于调制噪声信号的信号基于所述经编码窄频带激励信号和所述频谱延伸信号中的至少一者。
12.根据权利要求11所述的方法,所述方法包括根据经编码语音信号内的信息的确定性函数来产生所述噪声信号。
13.根据权利要求1所述的方法,其中所述决定是否对信号执行抗稀疏滤波还基于音调增益参数。
14.根据权利要求1所述的方法,所述方法包括以下中的至少一者:(A)对所述频谱延伸信号进行频谱整平,和(B)对所述高频带激励信号进行频谱整平。
15.根据权利要求14所述的方法,其中所述频谱整平包括:
基于待频谱整平的信号计算多个滤波器系数;以及
用根据所述多个滤波器系数配置的白化滤波器对所述待频谱整平的信号进行滤波。
16.根据权利要求15所述的方法,其中所述计算多个滤波器系数包含对所述待频谱整平的信号执行线性预测分析。
17.根据权利要求1所述的方法,所述方法包括以下中的至少一者:(i)根据所述高频带激励信号编码高频带语音信号,和(ii)根据所述高频带激励信号解码高频带语音信号。
18.根据权利要求1所述的方法,其中所述方法包括发射与因特网协议的版本一致的多个包,其中所述多个包描述所述经编码窄频带激励信号。
19.根据权利要求1所述的方法,其中所述方法包括接收与因特网协议的版本一致的多个包,其中所述多个包描述所述经编码窄频带激励信号。
20.一种产生高频带激励信号设备,其包括:
经配置以通过延伸基于经编码窄频带激励信号的信号的频谱来产生频谱延伸信号的装置;以及
抗稀疏滤波器,其经配置以对基于所述经编码窄频带激励信号的信号进行滤波,其包含决策逻辑元件阵列,所述决策逻辑元件阵列经配置以基于窄频带语音信号的频谱倾斜参数、音高增益参数和语音模式参数中的至少一个值,决定是否对基于所述经编码窄频带激励信号的信号进行滤波,其中所述经编码窄频带激励信号是由所述窄频带语音信号生成的,
其中所述高频带激励信号基于所述频谱延伸信号,且其中所述高频带激励信号基于所述抗稀疏滤波器的输出。
21.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以对所述频谱延伸信号进行滤波。
22.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以对所述高频带激励信号进行滤波。
23.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以根据全通转移函数对所述基于所述经编码窄频带激励信号的信号进行滤波。
24.根据权利要求20所述的设备,其中所述抗稀疏滤波器经配置以在不显著修改所述基于所述经编码窄频带激励信号的信号的量值频谱的情况下改变所述基于所述经编码窄频带激励信号的信号的相位频谱。
25.根据权利要求20所述的设备,其中所述产生频谱延伸信号的装置经配置以谐波延伸基于所述经编码窄频带激励信号的信号的频谱以获得所述频谱延伸信号。
26.根据权利要求20所述的设备,其中所述产生频谱延伸信号的装置经配置以将非线性函数应用于基于所述经编码窄频带激励信号的信号以产生所述频谱延伸信号。
27.根据权利要求26所述的设备,其中所述非线性函数包括绝对值函数、平方函数和削波函数中的至少一者。
28.根据权利要求20所述的设备,所述设备包括组合器,所述组合器经配置以将基于所述频谱延伸信号的信号与经调制噪声信号混合,其中所述高频带激励信号基于所述组合器的输出。
29.根据权利要求28所述的设备,其中所述组合器经配置以计算所述经调制噪声信号与基于所述频谱延伸信号的信号的加权总和,其中所述高频带激励信号基于所述加权总和。
30.根据权利要求28所述的设备,所述设备包含第二组合器,所述第二组合器经配置根据一信号的时域包络来调制噪声信号,所述用于调制噪声信号的信号基于所述经编码窄频带激励信号和所述频谱延伸信号中的至少一者,
其中所述经调制噪声信号基于所述第二组合器的输出。
31.根据权利要求30所述的设备,所述设备包括噪声发生器,所述噪声发生器经配置以根据经编码语音信号内的信息的确定性函数来产生所述噪声信号。
32.根据权利要求20所述的设备,其中所述决策逻辑元件阵列经配置还基于音调增益参数决定是否对信号进行滤波。
33.根据权利要求20所述的设备,所述设备包括频谱整平器,所述频谱整平器经配置以对所述频谱延伸信号和所述高频带激励信号中的至少一者进行频谱整平。
34.根据权利要求33所述的设备,其中所述频谱整平器经配置以基于待频谱整平的信号计算多个滤波器系数,并用根据所述多个滤波器系数配置的白化滤波器对所述待频谱整平的信号进行滤波。
35.根据权利要求34所述的设备,其中所述频谱整平器经配置以基于对所述待频谱整平的信号的线性预测分析来计算所述多个滤波器系数。
36.根据权利要求20所述的设备,所述设备包括以下中的至少一者:(i)高频带语音编码器,其经配置以根据所述高频带激励信号编码高频带语音信号,和(ii)高频带语音解码器,其经配置以根据所述高频带激励信号解码高频带语音信号。
37.根据权利要求20所述的设备,所述设备包括蜂窝式电话。
38.根据权利要求20所述的设备,所述设备包括经配置以发射与因特网协议的版本一致的多个包的装置,其中所述多个包描述所述经编码窄频带激励信号。
39.根据权利要求20所述的设备,所述设备包括经配置以接收与因特网协议的版本一致的多个包的装置,其中所述多个包描述所述经编码窄频带激励信号。
40.根据权利要求20所述的设备,其中所述产生频谱延伸信号的装置包括频谱延伸器。
CN201110326747.2A 2005-04-01 2006-04-03 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备 Active CN102411935B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US60/667,901 2005-04-01
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN2006800183538A Division CN101185125B (zh) 2005-04-01 2006-04-03 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备

Publications (2)

Publication Number Publication Date
CN102411935A true CN102411935A (zh) 2012-04-11
CN102411935B CN102411935B (zh) 2014-05-07

Family

ID=36588741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110326747.2A Active CN102411935B (zh) 2005-04-01 2006-04-03 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备

Country Status (24)

Country Link
US (8) US8069040B2 (zh)
EP (8) EP1866915B1 (zh)
JP (8) JP5203929B2 (zh)
KR (8) KR100956876B1 (zh)
CN (1) CN102411935B (zh)
AT (4) ATE485582T1 (zh)
AU (8) AU2006232362B2 (zh)
BR (8) BRPI0607690A8 (zh)
CA (8) CA2603219C (zh)
DE (4) DE602006017050D1 (zh)
DK (2) DK1864101T3 (zh)
ES (3) ES2340608T3 (zh)
HK (5) HK1113848A1 (zh)
IL (8) IL186441A0 (zh)
MX (8) MX2007012187A (zh)
NO (7) NO340566B1 (zh)
NZ (6) NZ562186A (zh)
PL (4) PL1864282T3 (zh)
PT (2) PT1864282T (zh)
RU (9) RU2402827C2 (zh)
SG (4) SG161224A1 (zh)
SI (1) SI1864282T1 (zh)
TW (8) TWI321314B (zh)
WO (8) WO2006107836A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217730A (zh) * 2014-08-18 2014-12-17 大连理工大学 一种基于k-svd的人工语音带宽扩展方法及装置
CN110462732A (zh) * 2017-03-20 2019-11-15 高通股份有限公司 目标样本产生
CN113450810A (zh) * 2014-07-28 2021-09-28 弗劳恩霍夫应用研究促进协会 谐波滤波器工具的谐度依赖控制
CN113450810B (zh) * 2014-07-28 2024-04-09 弗劳恩霍夫应用研究促进协会 谐波滤波器工具的谐度依赖控制

Families Citing this family (319)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
KR101213840B1 (ko) * 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
EP1775717B1 (en) * 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
CN101873266B (zh) * 2004-08-30 2015-11-25 高通股份有限公司 用于语音ip传输的自适应去抖动缓冲器
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
EP1872364B1 (en) * 2005-03-30 2010-11-24 Nokia Corporation Source coding and/or decoding
KR100956876B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들
ES2705589T3 (es) * 2005-04-22 2019-03-26 Qualcomm Inc Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia
ATE435481T1 (de) * 2005-04-28 2009-07-15 Siemens Ag Verfahren und vorrichtung zur geräuschunterdrückung
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
WO2007007253A1 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio signal synthesis
US8169890B2 (en) * 2005-07-20 2012-05-01 Qualcomm Incorporated Systems and method for high data rate ultra wideband communication
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US7734462B2 (en) * 2005-09-02 2010-06-08 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
RU2008112137A (ru) * 2005-09-30 2009-11-10 Панасоник Корпорэйшн (Jp) Устройство кодирования речи и способ кодирования речи
BRPI0617447A2 (pt) 2005-10-14 2012-04-17 Matsushita Electric Ind Co Ltd codificador de transformada e método de codificação de transformada
JPWO2007043643A1 (ja) * 2005-10-14 2009-04-16 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8725499B2 (en) 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8000960B2 (en) * 2006-08-15 2011-08-16 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of sub-band audio waveforms
ATE496365T1 (de) 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
AU2007308416B2 (en) * 2006-10-25 2010-07-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
KR101375582B1 (ko) 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
HUE041323T2 (hu) * 2007-08-27 2019-05-28 Ericsson Telefon Ab L M Eljárás és eszköz hangjel észlelési spektrális dekódolására, beleértve a spektrális lyukak kitöltését
FR2920545B1 (fr) * 2007-09-03 2011-06-10 Univ Sud Toulon Var Procede de trajectographie de plusieurs cetaces par acoustique passive
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
KR101238239B1 (ko) * 2007-11-06 2013-03-04 노키아 코포레이션 인코더
CA2704807A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation Audio coding apparatus and method thereof
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
CN101836250B (zh) * 2007-11-21 2012-11-28 Lg电子株式会社 用于处理信号的方法及装置
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
CA2729751C (en) 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
EP2410521B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for generating an audio signal and computer program
BRPI0904958B1 (pt) * 2008-07-11 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
US20100070550A1 (en) * 2008-09-12 2010-03-18 Cardinal Health 209 Inc. Method and apparatus of a sensor amplifier configured for use in medical applications
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
DE102008058496B4 (de) * 2008-11-21 2010-09-09 Siemens Medical Instruments Pte. Ltd. Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
TR201910073T4 (tr) * 2009-01-16 2019-07-22 Dolby Int Ab Vektörel çarpımı geliştirilmiş harmonik aktarım.
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
KR101390433B1 (ko) * 2009-03-31 2014-04-29 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
EP2434485A4 (en) * 2009-05-19 2014-03-05 Korea Electronics Telecomm METHOD AND APPARATUS FOR ENCODING AND DECODING AUDIO SIGNAL USING HIERARCHICAL ENCODING IN SINUSOIDAL PULSES
WO2011047887A1 (en) 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011029484A1 (en) * 2009-09-14 2011-03-17 Nokia Corporation Signal enhancement processing
US9595257B2 (en) * 2009-09-28 2017-03-14 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
KR101419151B1 (ko) 2009-10-20 2014-07-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 영역-의존 산술 코딩 매핑 규칙을 이용하는 오디오 인코더, 오디오 디코더, 오디오 정보를 인코딩하기 위한 방법, 오디오 정보를 디코딩하기 위한 방법 및 컴퓨터 프로그램
JP5422664B2 (ja) 2009-10-21 2014-02-19 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US8929568B2 (en) * 2009-11-19 2015-01-06 Telefonaktiebolaget L M Ericsson (Publ) Bandwidth extension of a low band audio signal
EP2502230B1 (en) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Improved excitation signal bandwidth extension
US8489393B2 (en) * 2009-11-23 2013-07-16 Cambridge Silicon Radio Limited Speech intelligibility
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US8559749B2 (en) * 2010-01-06 2013-10-15 Streaming Appliances, Llc Audiovisual content delivery system
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
PL2524371T3 (pl) 2010-01-12 2017-06-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący tabelę skrótów zarówno opisującą znaczące wartości stanów i granice przedziałów
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
JP5456914B2 (ja) 2010-03-10 2014-04-02 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. サンプリングレート依存型タイムワープコンター符号化を用いた、オーディオ信号復号器、オーディオ信号符号化器、方法、およびコンピュータプログラム
US8700391B1 (en) * 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
PT2559029T (pt) * 2010-04-13 2019-05-23 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Wss E V Método e codificador e descodificador para reprodução sem lacunas de um sinal de áudio
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6073215B2 (ja) * 2010-04-14 2017-02-01 ヴォイスエイジ・コーポレーション Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CA2800613C (en) 2010-04-16 2016-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
ES2372202B2 (es) * 2010-06-29 2012-08-08 Universidad De Málaga Sistema de reconocimiento de sonidos de bajo consumo.
SG10201503004WA (en) 2010-07-02 2015-06-29 Dolby Int Ab Selective bass post filter
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
WO2012008891A1 (en) * 2010-07-16 2012-01-19 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
JP5777041B2 (ja) * 2010-07-23 2015-09-09 沖電気工業株式会社 帯域拡張装置及びプログラム、並びに、音声通信装置
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20130310422A1 (en) 2010-09-01 2013-11-21 The General Hospital Corporation Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine
KR102014696B1 (ko) 2010-09-16 2019-08-27 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9767823B2 (en) * 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
AU2012217184B2 (en) 2011-02-14 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Encoding and decoding of pulse positions of tracks of an audio signal
MY166394A (en) 2011-02-14 2018-06-25 Fraunhofer Ges Forschung Information signal representation using lapped transform
JP5666021B2 (ja) 2011-02-14 2015-02-04 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号後オーディオ信号をスペクトル領域で処理する装置及び方法
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
TWI476760B (zh) 2011-02-14 2015-03-11 Fraunhofer Ges Forschung 用以使用暫態檢測及品質結果將音訊信號的部分編碼之裝置與方法
EP2676262B1 (en) * 2011-02-14 2018-04-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
ES2727131T3 (es) * 2011-02-16 2019-10-14 Dolby Laboratories Licensing Corp Decodificador con filtros configurables
ES2916257T3 (es) * 2011-02-18 2022-06-29 Ntt Docomo Inc Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
US9026450B2 (en) 2011-03-09 2015-05-05 Dts Llc System for dynamically creating and rendering audio objects
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
JP5986565B2 (ja) * 2011-06-09 2016-09-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
JP6001657B2 (ja) * 2011-06-30 2016-10-05 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張信号生成装置及びその方法
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2486636C1 (ru) * 2011-11-14 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486637C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486638C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2496222C2 (ru) * 2011-11-17 2013-10-20 Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496192C2 (ru) * 2011-11-21 2013-10-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486639C1 (ru) * 2011-11-21 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
RU2487443C1 (ru) * 2011-11-29 2013-07-10 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ согласования комплексных сопротивлений и устройство его реализации
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
ES2762325T3 (es) * 2012-03-21 2020-05-22 Samsung Electronics Co Ltd Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
DK2831757T3 (da) * 2012-03-29 2019-08-19 Ericsson Telefon Ab L M Vektorkvantiserer
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
KR101343768B1 (ko) * 2012-04-19 2014-01-16 충북대학교 산학협력단 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법
RU2504894C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
RU2504898C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
DK2891151T3 (en) 2012-08-31 2016-12-12 ERICSSON TELEFON AB L M (publ) Method and device for detection of voice activity
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
KR101413969B1 (ko) 2012-12-20 2014-07-08 삼성전자주식회사 오디오 신호의 복호화 방법 및 장치
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
KR101771828B1 (ko) * 2013-01-29 2017-08-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 인코딩된 오디오 정보를 제공하기 위한 방법, 디코딩된 오디오 정보를 제공하기 위한 방법, 컴퓨터 프로그램 및 신호 적응적 대역폭 확장을 이용한 인코딩된 표현
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN105009210B (zh) * 2013-01-29 2018-04-10 弗劳恩霍夫应用研究促进协会 合成音频信号的装置与方法、解码器、编码器、系统以及计算机程序
US20140213909A1 (en) * 2013-01-31 2014-07-31 Xerox Corporation Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9741350B2 (en) 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
US9715885B2 (en) * 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
RU2665228C1 (ru) * 2013-04-05 2018-08-28 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
BR112015025139B1 (pt) * 2013-04-05 2022-03-15 Dolby International Ab Codificador e decodificador de fala, método para codificar e decodificar um sinal de fala, método para codificar um sinal de áudio, e método para decodificar um fluxo de bits
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
MX371425B (es) * 2013-06-21 2020-01-29 Fraunhofer Ges Forschung Aparato y metodo para la ocultacion mejorada del libro de codigo adaptativo en la ocultacion similar a acelp mediante la utilizacion de una estimacion mejorada del retardo de tono.
CA2915001C (en) 2013-06-21 2019-04-02 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio decoder having a bandwidth extension module with an energy adjusting module
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US10314503B2 (en) 2013-06-27 2019-06-11 The General Hospital Corporation Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data
WO2014210527A1 (en) * 2013-06-28 2014-12-31 The General Hospital Corporation System and method to infer brain state during burst suppression
CN104282308B (zh) * 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
KR101790641B1 (ko) * 2013-08-28 2017-10-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 파형-코딩 및 파라미터-코딩된 스피치 인핸스
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
JP6586093B2 (ja) 2013-09-13 2019-10-02 ザ ジェネラル ホスピタル コーポレイション 全身麻酔および鎮静中の改良された脳監視のためのシステム
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
CN105765655A (zh) 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP6281336B2 (ja) * 2014-03-12 2018-02-21 沖電気工業株式会社 音声復号化装置及びプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
JPWO2015151451A1 (ja) * 2014-03-31 2017-04-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN107424621B (zh) * 2014-06-24 2021-10-26 华为技术有限公司 音频编码方法和装置
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
US10304474B2 (en) * 2014-08-15 2019-05-28 Samsung Electronics Co., Ltd. Sound quality improving method and device, sound decoding method and device, and multimedia device employing same
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
TWI550945B (zh) * 2014-12-22 2016-09-21 國立彰化師範大學 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
CN107210824A (zh) 2015-01-30 2017-09-26 美商楼氏电子有限公司 麦克风的环境切换
CN107517593B (zh) 2015-02-26 2021-03-12 弗劳恩霍夫应用研究促进协会 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
NO339664B1 (en) 2015-10-15 2017-01-23 St Tech As A system for isolating an object
MY191093A (en) * 2016-02-17 2022-05-30 Fraunhofer Ges Forschung Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
FR3049084B1 (fr) * 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code
PL3443557T3 (pl) * 2016-04-12 2020-11-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio do kodowania sygnału audio, sposób kodowania sygnału audio i program komputerowy, z uwzględnieniem wykrytego regionu widmowego pełnego w wyższym pasmie częstotliwości
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
CA3024167A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
US10786168B2 (en) 2016-11-29 2020-09-29 The General Hospital Corporation Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments
HUE056219T2 (hu) 2017-01-06 2022-02-28 Ericsson Telefon Ab L M Eljárás és eszköz jelzésre és referencia jel eltolás meghatározására
KR20180092582A (ko) * 2017-02-10 2018-08-20 삼성전자주식회사 Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
TWI752166B (zh) * 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
WO2019084566A1 (en) * 2017-10-27 2019-05-02 Terawave, Llc HIGH SPECTRUM EFFICIENCY DATA COMMUNICATION SYSTEM USING SUB-PERIODIC MODULATION
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
CN109729553B (zh) * 2017-10-30 2021-12-28 成都鼎桥通信技术有限公司 Lte集群通信系统的语音业务处理方法及设备
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US10460749B1 (en) * 2018-06-28 2019-10-29 Nuvoton Technology Corporation Voice activity detection using vocal tract area information
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
WO2020171034A1 (ja) * 2019-02-20 2020-08-27 ヤマハ株式会社 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
CN110610713B (zh) * 2019-08-28 2021-11-16 南京梧桐微电子科技有限公司 一种声码器余量谱幅度参数重构方法及系统
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
TWI723545B (zh) 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11295751B2 (en) 2019-09-20 2022-04-05 Tencent America LLC Multi-band synchronized neural vocoder
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN114548442B (zh) * 2022-02-25 2022-10-21 万表名匠(广州)科技有限公司 一种基于互联网技术的腕表维修管理系统

Family Cites Families (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US596689A (en) * 1898-01-04 Hose holder or support
US525147A (en) * 1894-08-28 Steam-cooker
US526468A (en) * 1894-09-25 Charles d
US321993A (en) * 1885-07-14 Lantern
US1126620A (en) * 1911-01-30 1915-01-26 Safety Car Heating & Lighting Electric regulation.
US1089258A (en) * 1914-01-13 1914-03-03 James Arnot Paterson Facing or milling machine.
US1300833A (en) * 1918-12-12 1919-04-15 Moline Mill Mfg Company Idler-pulley structure.
US1498873A (en) * 1924-04-19 1924-06-24 Bethlehem Steel Corp Switch stand
US2073913A (en) * 1934-06-26 1937-03-16 Wigan Edmund Ramsay Means for gauging minute displacements
US2086867A (en) * 1936-06-19 1937-07-13 Hall Lab Inc Laundering composition and process
US3044777A (en) * 1959-10-19 1962-07-17 Fibermold Corp Bowling pin
US3158693A (en) 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) * 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) * 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) * 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
NL8503152A (nl) * 1985-11-15 1987-06-01 Optische Ind De Oude Delft Nv Dosismeter voor ioniserende straling.
US4862168A (en) 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
CA1321645C (en) 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
JPH02244100A (ja) 1989-03-16 1990-09-28 Ricoh Co Ltd 駆動音源信号生成装置
ATE162661T1 (de) 1990-09-19 1998-02-15 Koninkl Philips Electronics Nv System mit einem aufzeichnungsträger und einer wiedergabevorrichtung
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) * 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0663739B1 (en) 1993-06-30 2001-08-22 Sony Corporation Digital signal encoding device, its decoding device, and its recording medium
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) * 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) * 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) * 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
US5706395A (en) 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) * 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) * 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
DE69530204T2 (de) * 1995-10-16 2004-03-18 Agfa-Gevaert Neue Klasse von Gelbfarbstoffen für photographische Materialien
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
JP3073919B2 (ja) * 1995-12-30 2000-08-07 松下電器産業株式会社 同期装置
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
DE69730779T2 (de) 1996-06-19 2005-02-10 Texas Instruments Inc., Dallas Verbesserungen bei oder in Bezug auf Sprachkodierung
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
WO1998020483A1 (fr) * 1996-11-07 1998-05-14 Matsushita Electric Industrial Co., Ltd. Generateur de vecteur de source sonore, codeur et decodeur vocal
US6009395A (en) * 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6041297A (en) 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US5890126A (en) 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6029125A (en) 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6231516B1 (en) * 1997-10-14 2001-05-15 Vacusense, Inc. Endoluminal implant with therapeutic and diagnostic capability
JPH11205166A (ja) 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
JP4170458B2 (ja) * 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
US6829360B1 (en) 1999-05-14 2004-12-07 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6556950B1 (en) 1999-09-30 2003-04-29 Rockwell Automation Technologies, Inc. Diagnostic method and apparatus for use with enterprise control
US6715125B1 (en) 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
DE60019268T2 (de) * 1999-11-16 2006-02-02 Koninklijke Philips Electronics N.V. Breitbandiges audio-übertragungssystem
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
WO2001052241A1 (en) 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US7330814B2 (en) 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
DE60102975T2 (de) 2000-05-22 2005-05-12 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
MXPA02003990A (es) * 2000-08-25 2002-10-23 Koninkl Philips Electronics Nv Metodo y apatao para reducir la longitud de palabra de una senal digital de entrada y metodo y aparato para recobrar la senal digital de entrada.
US6515889B1 (en) * 2000-08-31 2003-02-04 Micron Technology, Inc. Junction-isolated depletion mode ferroelectric memory
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) * 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
KR100865860B1 (ko) 2000-11-09 2008-10-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
CA2733453C (en) * 2000-11-30 2014-10-14 Panasonic Corporation Lpc vector quantization apparatus
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) * 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US20040153313A1 (en) * 2001-05-11 2004-08-05 Roland Aubauer Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
JP2004521394A (ja) 2001-06-28 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 広帯域信号伝送システム
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
DE60212696T2 (de) * 2001-11-23 2007-02-22 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
US7069212B2 (en) 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
WO2004097797A1 (en) 2003-05-01 2004-11-11 Nokia Corporation Method and device for gain quantization in variable bit rate wideband speech coding
JP4212591B2 (ja) 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
US7689579B2 (en) * 2003-12-03 2010-03-30 Siemens Aktiengesellschaft Tag modeling within a decision, support, and reporting environment
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
ES2358125T3 (es) * 2005-04-01 2011-05-05 Qualcomm Incorporated Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
KR100956876B1 (ko) 2005-04-01 2010-05-11 콸콤 인코포레이티드 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들
ES2705589T3 (es) 2005-04-22 2019-03-26 Qualcomm Inc Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113450810A (zh) * 2014-07-28 2021-09-28 弗劳恩霍夫应用研究促进协会 谐波滤波器工具的谐度依赖控制
CN113450810B (zh) * 2014-07-28 2024-04-09 弗劳恩霍夫应用研究促进协会 谐波滤波器工具的谐度依赖控制
CN104217730A (zh) * 2014-08-18 2014-12-17 大连理工大学 一种基于k-svd的人工语音带宽扩展方法及装置
CN104217730B (zh) * 2014-08-18 2017-07-21 大连理工大学 一种基于k‑svd的人工语音带宽扩展方法及装置
CN110462732A (zh) * 2017-03-20 2019-11-15 高通股份有限公司 目标样本产生

Also Published As

Publication number Publication date
NZ562188A (en) 2010-05-28
JP5129117B2 (ja) 2013-01-23
NZ562190A (en) 2010-06-25
NZ562182A (en) 2010-03-26
MX2007012191A (es) 2007-12-11
TWI319565B (en) 2010-01-11
RU2413191C2 (ru) 2011-02-27
KR100956525B1 (ko) 2010-05-07
RU2402827C2 (ru) 2010-10-27
WO2006107836A1 (en) 2006-10-12
RU2009131435A (ru) 2011-02-27
AU2006252957A1 (en) 2006-12-07
US8069040B2 (en) 2011-11-29
AU2006232357A1 (en) 2006-10-12
WO2006130221A1 (en) 2006-12-07
BRPI0607646B1 (pt) 2021-05-25
CA2603255A1 (en) 2006-10-12
IL186436A0 (en) 2008-01-20
EP1869673B1 (en) 2010-09-22
DE602006017673D1 (de) 2010-12-02
RU2381572C2 (ru) 2010-02-10
US20060277042A1 (en) 2006-12-07
IL186438A (en) 2011-09-27
DE602006018884D1 (de) 2011-01-27
EP1869670B1 (en) 2010-10-20
IL186443A0 (en) 2008-01-20
NZ562186A (en) 2010-03-26
NZ562183A (en) 2010-09-30
TWI321315B (en) 2010-03-01
DE602006012637D1 (de) 2010-04-15
BRPI0608269B8 (pt) 2019-09-03
IL186442A0 (en) 2008-01-20
DK1864101T3 (da) 2012-10-08
NZ562185A (en) 2010-06-25
BRPI0607691B1 (pt) 2019-08-13
KR100982638B1 (ko) 2010-09-15
TW200705387A (en) 2007-02-01
CA2603255C (en) 2015-06-23
JP4955649B2 (ja) 2012-06-20
BRPI0607690A8 (pt) 2017-07-11
CA2603219C (en) 2011-10-11
US20060271356A1 (en) 2006-11-30
BRPI0608270A2 (pt) 2009-10-06
IL186442A (en) 2012-06-28
MX2007012184A (es) 2007-12-11
US8332228B2 (en) 2012-12-11
MX2007012187A (es) 2007-12-11
CA2603229C (en) 2012-07-31
ES2636443T3 (es) 2017-10-05
RU2007140426A (ru) 2009-05-10
CA2603187A1 (en) 2006-12-07
NO340428B1 (no) 2017-04-18
PL1864282T3 (pl) 2017-10-31
KR20070118168A (ko) 2007-12-13
TW200703240A (en) 2007-01-16
US20070088541A1 (en) 2007-04-19
WO2006107834A1 (en) 2006-10-12
TW200707408A (en) 2007-02-16
CA2603229A1 (en) 2006-10-12
JP5129118B2 (ja) 2013-01-23
PL1869673T3 (pl) 2011-03-31
AU2006232357B2 (en) 2010-07-01
IL186404A (en) 2011-04-28
PL1866915T3 (pl) 2011-05-31
ES2391292T3 (es) 2012-11-23
PL1864101T3 (pl) 2012-11-30
ATE459958T1 (de) 2010-03-15
US20080126086A1 (en) 2008-05-29
RU2007140406A (ru) 2009-05-10
JP2008536169A (ja) 2008-09-04
JP5129116B2 (ja) 2013-01-23
JP5203929B2 (ja) 2013-06-05
KR20070118173A (ko) 2007-12-13
AU2006252957B2 (en) 2011-01-20
IL186404A0 (en) 2008-01-20
NO340434B1 (no) 2017-04-24
CA2602804C (en) 2013-12-24
AU2006232360A1 (en) 2006-10-12
JP2008537165A (ja) 2008-09-11
HK1113848A1 (en) 2008-10-17
PT1864282T (pt) 2017-08-10
RU2007140382A (ru) 2009-05-10
MX2007012189A (es) 2007-12-11
US20070088542A1 (en) 2007-04-19
CA2602806C (en) 2011-05-31
HK1169509A1 (zh) 2013-01-25
RU2007140429A (ru) 2009-05-20
WO2006107839A3 (en) 2007-04-05
KR20070118170A (ko) 2007-12-13
EP1864101B1 (en) 2012-08-08
US8260611B2 (en) 2012-09-04
CN102411935B (zh) 2014-05-07
JP2008535027A (ja) 2008-08-28
HK1115024A1 (en) 2008-11-14
BRPI0608305B1 (pt) 2019-08-06
RU2007140365A (ru) 2009-05-10
BRPI0608269A2 (pt) 2009-12-08
BRPI0607690A2 (pt) 2009-09-22
KR100956876B1 (ko) 2010-05-11
RU2491659C2 (ru) 2013-08-27
ATE485582T1 (de) 2010-11-15
AU2006232357C1 (en) 2010-11-25
AU2006232361A1 (en) 2006-10-12
KR100956523B1 (ko) 2010-05-07
TWI316225B (en) 2009-10-21
AU2006232363B2 (en) 2011-01-27
TWI321777B (en) 2010-03-11
AU2006232358B2 (en) 2010-11-25
TWI330828B (en) 2010-09-21
RU2007140394A (ru) 2009-05-10
BRPI0608306A2 (pt) 2009-12-08
CA2603219A1 (en) 2006-10-12
KR20070119722A (ko) 2007-12-20
MX2007012182A (es) 2007-12-10
JP5129115B2 (ja) 2013-01-23
AU2006232364A1 (en) 2006-10-12
EP1869670A1 (en) 2007-12-26
SG161224A1 (en) 2010-05-27
NO340566B1 (no) 2017-05-15
SI1864282T1 (sl) 2017-09-29
NO20075513L (no) 2007-12-28
US20070088558A1 (en) 2007-04-19
KR20070118167A (ko) 2007-12-13
MX2007012185A (es) 2007-12-11
JP2008535026A (ja) 2008-08-28
TW200703237A (en) 2007-01-16
MX2007012181A (es) 2007-12-11
NO20075503L (no) 2007-12-28
ATE482449T1 (de) 2010-10-15
NO20075511L (no) 2007-12-27
JP2008537606A (ja) 2008-09-18
TW200707405A (en) 2007-02-16
CA2603231A1 (en) 2006-10-12
EP1866915B1 (en) 2010-12-15
TWI321314B (en) 2010-03-01
CA2602804A1 (en) 2006-10-12
SG163556A1 (en) 2010-08-30
BRPI0607691A2 (pt) 2009-09-22
RU2402826C2 (ru) 2010-10-27
EP1864283B1 (en) 2013-02-13
KR100956877B1 (ko) 2010-05-11
NO20075510L (no) 2007-12-28
NO20075512L (no) 2007-12-28
US8484036B2 (en) 2013-07-09
RU2376657C2 (ru) 2009-12-20
IL186405A (en) 2013-07-31
HK1114901A1 (en) 2008-11-14
AU2006232361B2 (en) 2010-12-23
KR20070118174A (ko) 2007-12-13
KR20070118172A (ko) 2007-12-13
KR20070118175A (ko) 2007-12-13
ATE492016T1 (de) 2011-01-15
EP1866914A1 (en) 2007-12-19
AU2006232358A1 (en) 2006-10-12
JP5203930B2 (ja) 2013-06-05
EP1866914B1 (en) 2010-03-03
KR100956624B1 (ko) 2010-05-11
DK1864282T3 (en) 2017-08-21
EP1864101A1 (en) 2007-12-12
IL186439A0 (en) 2008-01-20
ES2340608T3 (es) 2010-06-07
AU2006232362A1 (en) 2006-10-12
BRPI0607646A2 (pt) 2009-09-22
PT1864101E (pt) 2012-10-09
DE602006017050D1 (de) 2010-11-04
TWI320923B (en) 2010-02-21
JP2008535024A (ja) 2008-08-28
US8364494B2 (en) 2013-01-29
IL186438A0 (en) 2008-01-20
TW200705390A (en) 2007-02-01
RU2387025C2 (ru) 2010-04-20
IL186443A (en) 2012-09-24
JP2008536170A (ja) 2008-09-04
HK1115023A1 (zh) 2008-11-14
SG163555A1 (en) 2010-08-30
CA2603246C (en) 2012-07-17
AU2006232362B2 (en) 2009-10-08
EP1864283A1 (en) 2007-12-12
RU2386179C2 (ru) 2010-04-10
US20060282263A1 (en) 2006-12-14
EP1864281A1 (en) 2007-12-12
MX2007012183A (es) 2007-12-11
BRPI0608305A2 (pt) 2009-10-06
RU2007140381A (ru) 2009-05-10
WO2006107840A1 (en) 2006-10-12
BRPI0609530B1 (pt) 2019-10-29
NO20075514L (no) 2007-12-28
EP1869673A1 (en) 2007-12-26
BRPI0609530A2 (pt) 2010-04-13
RU2390856C2 (ru) 2010-05-27
WO2006107837A1 (en) 2006-10-12
WO2006107838A1 (en) 2006-10-12
AU2006232360B2 (en) 2010-04-29
US20060277038A1 (en) 2006-12-07
WO2006107839A2 (en) 2006-10-12
CA2603187C (en) 2012-05-08
US8078474B2 (en) 2011-12-13
AU2006232364B2 (en) 2010-11-25
NO20075515L (no) 2007-12-28
KR100956524B1 (ko) 2010-05-07
TW200705389A (en) 2007-02-01
SG161223A1 (en) 2010-05-27
TW200705388A (en) 2007-02-01
IL186441A0 (en) 2008-01-20
RU2007140383A (ru) 2009-05-10
IL186405A0 (en) 2008-01-20
CA2602806A1 (en) 2006-10-12
EP1864282B1 (en) 2017-05-17
CA2603231C (en) 2012-11-06
AU2006232363A1 (en) 2006-10-12
EP1866915A2 (en) 2007-12-19
US8140324B2 (en) 2012-03-20
US8244526B2 (en) 2012-08-14
KR101019940B1 (ko) 2011-03-09
TWI324335B (en) 2010-05-01
EP1864282A1 (en) 2007-12-12
CA2603246A1 (en) 2006-10-12
JP2008535025A (ja) 2008-08-28
BRPI0608269B1 (pt) 2019-07-30
WO2006107833A1 (en) 2006-10-12
JP5161069B2 (ja) 2013-03-13

Similar Documents

Publication Publication Date Title
CN101185125B (zh) 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
CN102110440B (zh) 用于增益因数衰减的系统、方法和设备
CN102411935B (zh) 用于带宽延伸语音预测激励信号的抗稀疏滤波的方法和设备
CN104123946A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法
CN101496097A (zh) 用于在与语音信号相关联的包中包含识别符的系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1169509

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1169509

Country of ref document: HK