CN106463136B - 基于高频带信号特征的时间增益调整 - Google Patents

基于高频带信号特征的时间增益调整 Download PDF

Info

Publication number
CN106463136B
CN106463136B CN201580032467.7A CN201580032467A CN106463136B CN 106463136 B CN106463136 B CN 106463136B CN 201580032467 A CN201580032467 A CN 201580032467A CN 106463136 B CN106463136 B CN 106463136B
Authority
CN
China
Prior art keywords
value
signal
gains
lpc
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580032467.7A
Other languages
English (en)
Other versions
CN106463136A (zh
Inventor
文卡特拉曼·S·阿提
文卡特什·克里希南
维韦克·拉金德朗
文卡塔·萨伯拉曼亚姆·强卓·赛克哈尔·奇比亚姆
苏巴辛格哈·夏敏达·苏巴辛格哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN106463136A publication Critical patent/CN106463136A/zh
Application granted granted Critical
Publication of CN106463136B publication Critical patent/CN106463136B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Abstract

本发明提供用于调整时间增益参数且用于调整线性预测系数的技术。所述时间增益参数的值可基于音频信号的经合成高频带部分与所述音频信号的高频带部分的比较。如果所述高频带部分的较高频率范围的信号特征满足第一阈值,则可调整所述时间增益参数。线性预测LP增益可基于LP增益操作来确定,所述LP增益操作使用LP阶数的第一值。所述LP增益可与LP合成滤波器的能量等级相关联。如果所述LP增益满足第二阈值,则可减小所述LP阶数。

Description

基于高频带信号特征的时间增益调整
优先权主张
本申请案主张来自标题都为“基于高频带信号特征的时间增益调整(TEMPORALGAIN ADJUSTMENT BASED ON HIGH-BAND SIGNAL CHARACTERISTIC)”的2014年6月26日申请的第62/017,790号美国临时专利申请案及2015年6月4日申请的第14/731,276号美国专利申请案的优先权,所述案的内容以全文引用的方式并入本文中。
技术领域
本发明大体上涉及信号处理。
背景技术
技术的进步已产生体积较小且功能更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线计算装置,例如便携式无线电话、个人数字助理(PDA)及传呼装置等,其体积小、重量轻且易于由用户携带。更具体言之,便携式无线电话(例如蜂窝式电话及因特网协议(IP)电话)可经由无线网络传达语音及数据包。另外,许多所述无线电话包含并入于其中的其它类型的装置。举例来说,无线电话也可包含数字静态相机、数字视频摄像机、数字记录器及音频文件播放器。
由数字技术发射语音为普遍的,尤其在长距离及数字无线电电话应用中。确定可经由信道发送的最少信息量同时维持经重建话音的所感知质量可为关注事项。如果通过采样及数字化来发射话音,则数量级为六十四千位/每秒(kbps)的数据速率可用于达成模拟电话的话音质量。经由在接收器处使用话音分析,继之以译码、发射及重新合成,可达成数据速率的显著减小。
用于压缩话音的装置可用于许多电信领域中。例示性领域为无线通信。无线通信的领域具有许多应用,包含(例如)无线电话、传呼、无线区域环路、例如蜂窝式及个人通信服务(PCS)电话系统的无线电话、移动因特网协议(IP)电话及卫星通信系统。特定应用为用于移动订户的无线电话。
已开发出用于无线通信系统的各种空中接口,包括(例如)频分多址接入(FDMA)、时分多址接入(TDMA)、码分多址接入(CDMA)及时分同步CDMA(TD-SCDMA)。结合所述空中接口,已建立了各种国内及国际标准,包含(例如)高级移动电话服务(AMPS)、全球移动通信系统(GSM)及暂行标准95(IS-95)。例示性无线电话通信系统为码分多址接入(CDMA)系统。IS-95标准及其衍生标准(IS-95A、ANSI J-STD-008及IS-95B)(本文中统称为IS-95)由电信工业协会(TIA)及其它公认标准机构颁布以指定CDMA空中接口针对蜂窝式或PCS电话通信系统的使用。
IS-95标准随后演进成例如cdma2000及WCDMA的“3G”系统,所述“3G”系统提供更大容量及高速度包数据服务。cdma2000的两个变体由TIA发布的文件IS-2000(cdma20001xRTT)及IS-856(cdma2000 1xEV-DO)呈现。cdma2000 1xRTT通信系统给予153kbps的峰值数据速率,而cdma2000 1xEV-DO通信系统定义范围介于38.4kbps到2.4Mbps的数据速率集合。WCDMA标准体现于第三代合作伙伴计划“3GPP”第3G TS 25.211号、第3G TS 25.212号、第3G TS 25.213号及第3G TS 25.214号文档中。高级国际移动电信(高级IMT)规范阐述“4G”标准。对于高移动性通信(例如,来自火车及汽车),高级IMT规范设定100百万位/秒(Mbit/s)的峰值数据速率用于4G服务,且对于低移动性通信(例如,来自行人及固定用户)设定1十亿位/秒(Gbit/s)的峰值数据速率。
使用通过提取关于人类话音产生模型的参数来压缩话音的技术的装置被称为话音译码器。话音译码器可包括编码器及解码器。编码器将传入话音信号划分成时间块或分析帧。可将每一时间分段(或“帧”)的持续时间选择为足够短,以使得可预期信号的频谱包络为保持相对固定。举例来说,一个帧长度为20毫秒,此对应于8千赫(kHz)采样速率下的160个样本,尽管可使用被视为适合于特定应用的任何帧长度或采样速率。
编码器分析传入话音帧以提取某些相关参数,且接着将所述参数量化成二进制表示,即,量化成位集合或二进制数据包。经由通信信道(即,有线及/或无线网络连接)将数据包发射到接收器及解码器。解码器处理数据包、去量化经处理数据包以产生参数并使用经去量化参数重新合成话音帧。
话音译码器的功能为通过移除话音中固有的自然冗余而将经数字化话音信号压缩成低位速率信号。可通过用参数集合表示输入话音帧及使用量化以通过位集合表示参数来达成数字压缩。如果输入话音帧具有位数目Ni,且由话音译码器所产生的数据包具有位数目No,则由话音译码器所达成的压缩因数为Cr=Ni/No。挑战为在达成目标压缩因数时保持经解码话音的高语音质量。话音译码器的性能取决于:(1)话音模型或上文所描述的分析及合成过程的组合执行得有多好;及(2)在每帧No个位的目标位速率下参数量化过程执行得有多好。因此,话音模型的目标为在针对每一帧具有小参数集合的情况下撷取话音信号的本质或目标语音质量。
话音译码器通常利用参数集合(包含向量)来描述话音信号。良好参数集合向感知上准确的话音信号的重建理想地提供低系统带宽。音调、信号功率、频谱包络(或共振峰)、振幅及相谱为话音译码参数的实例。
话音译码器可经实施为时域译码器,其试图通过使用高时间分辨率处理以每次编码小的话音区段(通常为5毫秒(ms)的子帧)来撷取时域话音波形。对于每一子帧,借助于搜索算法发现来自码簿空间的高精确度代表。替代地,话音译码器可经实施为频域译码器,其试图用参数集合(分析)来撷取输入话音帧的短期话音频谱,且使用对应合成过程以从频谱参数来重新产生话音波形。参数量化器通过根据已知量化技术用码向量的所存储表示来表示参数而保留参数。
一个时域话音译码器为码激励线性预测(CELP)译码器。在CELP译码器中,通过找到短期共振峰滤波器的系数的线性预测(LP)分析来移除话音信号中的短期相关或冗余。将短期预测滤波器应用于传入话音帧产生LP残余信号,LP残余信号是用长期预测滤波器参数及后续随机码簿予以进一步建模及量化。因此,CELP译码将编码时域话音波形的任务划分成编码LP短期滤波器系数及编码LP残余的单独任务。可以固定速率(即,针对每一帧使用相同数目(No)个位)或以可变速率(其中针对不同类型的帧内容使用不同位速率)执行时域译码。可变速率译码器试图使用将译码解码器参数编码到充分获得目标质量的等级所需要的位量。
例如CELP译码器的时域译码器通常可依赖于每帧高数目(N0)个位以保留时域话音波形的准确度。倘若每帧的位数目No相对大(例如,8kbps或高于8kbps),则这些译码器可递送极好的语音质量。在低位速率(例如,4kbps及低于4kbps)下,归因于受限数目个可用位,时域译码器可不能保持高质量及稳健性能。在低位速率下,受限码簿空间削减在较高速率商业应用中所部署的时域译码器的波形匹配能力。因此,尽管随时间推移进行改良,但以低位速率操作的许多CELP译码系统仍遭受特征化为噪声的感知明显失真。
低位速率下对CELP译码器的替代例为根据类似于CELP译码器的原理操作的“噪声激励线性预测”(NELP)译码器。NELP译码器使用经滤波伪随机噪声信号来建模话音而非码簿。由于NELP将较简单模型用于经译码话音,因此NELP达成比CELP低的位速率。NELP可用于压缩或表示无声话音或静默。
以大约为2.4kbps的速率操作的译码系统本质上大体上为参数的。即,这些译码系统通过以规则间隔发射描述话音信号的音调周期及频谱包络(或共振峰)的参数进行操作。这些所谓的参数译码器的说明为LP声码器系统。
LP声码器通过每音调周期单个脉冲来建模有声话音信号。可扩增此基本技术以包含关于频谱包络以及其它事项的发射信息。尽管LP声码器提供大体合理的性能,但其可引入特征化为传言的感知显著失真。
近年来,已出现为波形译码器及参数译码器两者的混合的译码器。这些所谓的混合译码器的说明为原型波形内插(PWI)话音译码系统。PWI译码系统也可被称为原型音调周期(PPP)话音译码器。PWI译码系统提供用于译码有声话音的高效方法。PWI的基本概念为以固定间隔提取代表性音调周期(原型波形)、发射其描述及通过在原型波形之间进行内插而重建话音信号。PWI方法可对LP残余信号抑或话音信号进行操作。
可存在对改良话音信号(例如,经译码话音信号、经重建话音信号或二者)的音频质量的研究关注及商业关注。举例来说,通信装置可接收具有低于最佳语音质量的语音质量的话音信号。为了说明,通信装置可在语音呼叫期间从另一通信装置接收话音信号。归因于各种原因(例如,环境噪声(例如,风、街道噪声)、通信装置的接口的限制、由通信装置进行的信号处理、包丢失、带宽限制、位速率限制等),语音呼叫质量可受损。
在传统电话系统(例如,公众交换电话网络(PSTN))中,信号带宽限于300赫兹(Hz)到3.4千赫兹(kHz)的频率范围。在例如蜂窝式电话及因特网语音通讯协议(VoIP)的宽带(WB)应用中,信号带宽可跨越从50Hz到7kHz的频率范围。超宽带(SWB)译码技术支持扩展到16kHz左右的带宽。将信号带宽从3.4kHz的窄频电话扩展到16kHz的SWB电话可改良信号重建的质量、可懂度及自然度。
SWB译码技术通常涉及编码及发射信号的较低频率部分(例如,0Hz到6.4kHz,也称为“低频带”)。举例来说,可使用滤波器参数及/或低频带激励信号表示低频带。然而,为了改良译码效率,信号的较高频率部分(例如,6.4kHz到16kHz,也称为“高频带”)可能未经充分编码并发射。实情为,接收器可利用信号建模以预测高频带。在一些实施中,可将与高频带相关联的数据提供到接收器以辅助预测。此数据可被称为“旁侧信息”,且可包括增益信息、线谱频率(LSF,也被称为线谱对(LSP))等。在使用信号建模编码及解码高频带信号时,非所要的噪声或可听伪讯在某些条件下可被引入到高频带信号中。
发明内容
在特定方面中,一种方法包含在编码器处确定输入音频信号的高频带部分的较高频率范围的信号特征是否满足阈值。所述方法还包含产生对应于所述高频带部分的高频带激励信号;基于所述高频带激励信号产生经合成高频带部分;及基于所述经合成高频带部分与所述高频带部分的比较来确定时间增益参数的值。所述方法进一步包含响应于所述信号特征满足所述阈值,调整所述时间增益参数的所述值。调整所述时间增益参数的所述值控制所述时间增益参数的可变性。
在另一特定方面中,一种设备包含预处理模块,其经配置以对输入音频信号的至少一部分进行滤波以产生多个输出。所述设备还包含第一滤波器,其经配置以确定所述输入音频信号的高频带部分的较高频率范围的信号特征。所述设备进一步包含高频带激励产生器,其经配置以产生对应于所述高频带部分的高频带激励信号;及第二滤波器,其经配置以基于所述高频带激励信号产生经合成高频带部分。所述设备还包含时间包络估计器,其经配置以:基于所述经合成高频带部分与所述高频带部分的比较来确定时间增益参数的值;及响应于所述信号特征满足阈值,调整所述时间增益参数的所述值。调整所述时间增益参数的所述值控制所述时间增益参数的可变性。
在另一特定方面中,一种非暂时性处理器可读媒体包含指令,所述指令在由处理器执行时使得所述处理器执行包含以下操作的操作:确定输入音频信号的高频带部分的较高频率范围的信号特征是否满足阈值。所述操作还包含:产生对应于所述高频带部分的高频带激励信号;基于所述高频带激励信号产生经合成高频带部分;及基于所述经合成高频带部分与所述高频带部分的比较来确定时间增益参数的值。所述操作进一步包含响应于所述信号特征满足所述阈值,调整所述时间增益参数的所述值。调整所述时间增益参数的所述值控制所述时间增益参数的可变性。
在另一特定方面中,一种设备包含用于对输入音频信号的至少一部分进行滤波以产生多个输出的装置。所述设备还包含用于基于所述多个输出确定所述输入音频信号的高频带部分的较高频率范围的信号特征是否满足阈值的装置。所述设备进一步包含用于产生对应于所述高频带部分的高频带激励信号的装置;用于基于所述高频带激励信号产生经合成高频带部分的装置;及用于估计所述高频带部分的时间包络的装置。所述用于估计的装置经配置以:基于所述经合成高频带部分与所述高频带部分的比较来确定时间增益参数的值;及响应于所述信号特征满足所述阈值,调整所述时间增益参数的所述值。调整所述时间增益参数的所述值控制所述时间增益参数的可变性。
在另一特定方面中,一种调整编码器的线性预测系数(LPC)的方法包含在所述编码器处基于使用线性预测(LP)阶数的第一值的LP增益操作来确定LP增益。所述LP增益与LP合成滤波器的能量等级相关联。所述方法还包含比较所述LP增益与阈值,及在所述LP增益满足所述阈值情况下将所述LP阶数从所述第一值减小到第二值。
在另一特定方面中,一种设备包含编码器及存储指令的存储器,所述指令由所述编码器可执行以执行操作。所述操作包含基于使用线性预测(LP)阶数的第一值的LP增益操作来确定LP增益。所述LP增益与LP合成滤波器的能量等级相关联。所述操作还包含比较所述LP增益与阈值,及在所述LP增益满足所述阈值情况下将所述LP阶数从所述第一值减小到第二值。
在另一特定方面中,一种非暂时性计算机可读媒体包含用于调整编码器的线性预测系数(LPC)的指令。所述指令在由所述编码器执行时使得所述编码器执行操作。所述操作包含基于使用线性预测(LP)阶数的第一值的LP增益操作来确定LP增益。所述LP增益与LP合成滤波器的能量等级相关联。所述操作还包含比较所述LP增益与阈值,及在所述LP增益满足所述阈值情况下将所述LP阶数从所述第一值减小到第二值。
在另一特定方面中,一种设备包含用于基于使用线性预测(LP)阶数的第一值的LP增益操作来确定LP增益的装置。所述LP增益与LP合成滤波器的能量等级相关联。所述设备还包含用于比较所述LP增益与阈值的装置,及用于在所述LP增益满足所述阈值情况下将所述LP阶数从所述第一值减小到第二值的装置。
附图说明
图1为说明可操作以基于高频带信号特征调整时间增益参数的系统的特定方面的图;
图2为说明可操作以基于高频带信号特征调整时间增益参数的编码器的组件的特定方面的图;
图3包含说明根据特定方面的信号的频率分量的图;
图4为说明解码器的组件的特定方面的图,所述解码器可操作以使用基于高频带信号特征调整的时间增益参数来合成音频信号的高频带部分;
图5A描绘流程图以说明基于高频带信号特征调整时间增益参数的方法的特定方面;
图5B描绘流程图以说明计算高频带信号特征的方法的特定方面;
图5C描绘流程图以说明调整编码器的调整线性预测系数(LPC)的方法的特定方面;且
图6为可操作以执行根据图1到5B的系统、设备及方法的信号处理操作的无线装置的框图。
具体实施方式
揭示基于高频带信号特征调整时间增益信息的系统及方法。举例来说,时间增益信息可包含增益形状参数,其在按子帧基础上于编码器处产生。在某些情形下,输入到编码器的音频信号在高频带中可具有极少内容或无内容(例如,关于高频带可为“频带受限”的)。举例来说,频带受限信号可于在与SWB模型兼容的电子装置、不能越过整个高频带撷取数据的装置等处的音频撷取期间产生。为了说明,特定无线电话可能不能或可经编程以避免在高于8kHz、高于10kHz等的频率下撷取数据。当编码这些频带受限信号时,信号模型(例如,SWB谐波模型)可归因于时间增益的大的变化引入可听伪讯。
为了减小这些伪讯,编码器(例如,话音编码器或“声码器”)可确定待编码的音频信号的信号特征。在一个实例中,信号特征为音频信号的高频带部分的较高频率区中的能量的总和。作为非限制性实例,信号特征可通过对12kHz到16kHz频率范围内的分析滤波器组输出的能量求和来确定,且可因此对应于高频带“信号底限”。如本文所使用,音频信号的高频带部分的“较高频率区”可对应于低于音频信号的高频带部分的带宽的任何频率范围(在音频信号的高频带部分的较高部分处)。作为非限制性实例,如果音频信号的高频带部分由6.4kHz到14.4kHz频率范围特征化,则音频信号的高频带部分的较高频率区可由10.6kHz到14.4kHz频率范围特征化。作为另一非限制性实例,如果音频信号的高频带部分由8kHz到16kHz频率范围特征化,则音频信号的高频带部分的较高频率区可由13kHz到16kHz频率范围特征化。编码器可处理音频信号的高频带部分以产生高频带激励信号,且可基于高频带激励信号产生高频带部分的经合成版本。基于“原始”高频带部分与经合成高频带部分的比较,编码器可确定增益形状参数的值。如果高频带部分的信号特征满足阈值(例如,信号特征指示音频信号为频带受限的且具有极少高频带内容或无高频带内容),则编码器可调整增益形状参数的值以限制增益形状参数的可变性(例如,受限动态范围)。限制增益形状参数的可变性可减小在频带受限音频信号的编码/解码期间产生的伪讯。
参看图1,可操作以基于高频带信号特征调整时间增益参数的系统的特定方面经展示,并通常指定为100。在特定方面中,系统100可集成到编码系统或设备中(例如,无线电话或译码器/解码器(译码解码器)中)。
应注意,在以下描述中,将由图1的系统100执行的各种功能描述为由某些组件或模块执行。然而,组件及模块的此划分仅是为了说明。在替代方面中,由特定组件或模块所执行的功能可替代地划分于多个组件或模块之间。此外,在替代方面中,图1的两个或多于两个组件或模块可集成到单个组件或模块中。可使用硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合实施图1中所说明的每一组件或模块。
系统100包含经配置以接收音频信号102的预处理模块110。举例来说,音频信号102可由麦克风或其它输入装置提供。在特定方面中,音频信号102可包含话音。音频信号102可为超宽带(SWB)信号,其包含在大约50赫兹(Hz)到大约16千赫兹(kHz)的频率范围内的数据。预处理模块110可基于频率将音频信号102滤波成多个部分。举例来说,预处理模块110可产生低频带信号122及高频带信号124。低频带信号122及高频带信号124可具有相等或不等带宽,且可重叠或不重叠。
在特定方面中,低频带信号122及高频带信号124对应于不重叠频带中的数据。举例来说,低频带信号122及高频带信号124可对应于50Hz到7kHz及7kHz到16kHz的不重叠频带中的数据。在替代方面中,低频带信号122及高频带信号124可对应于50Hz到8kHz且8kHz到16kHz的不重叠频带中的数据。在另一替代方面中,低频带信号122及高频带信号124对应于重叠频带(例如,50Hz到8kHz及7kHz到16kHz),其可使预处理模块110的低通滤波器及高通滤波器能够具有光滑滚落,其可简化设计且减少低通滤波器及高通滤波器的成本。使低频带信号122及高频带信号124重叠也可实现接收器处低频带及高频带信号的光滑掺合,其可引起更少听觉伪讯。
在特定方面中,预处理模块110包含分析滤波器组。举例来说,预处理模块110可包含正交镜像滤波器(QMF)滤波器组,其包含多个QMF。每一QMF可对音频信号102的一部分进行滤波。作为另一实例,预处理模块110可包含复合低延迟滤波器组(CLDFB)。预处理模块110还可包含经配置以翻转音频信号102的频谱的频谱翻转器。因此,在特定方面中,尽管高频带信号124对应于音频信号102的高频带部分,但高频带信号124可作为基带信号进行传达。
在特定SWB方面中,滤波器组包含40个QMF滤波器,其中每一滤波器(例如,说明性QMF滤波器112)对音频信号102的400Hz部分进行操作。每一QMF滤波器112可产生包含实部及虚部的滤波器输出。预处理模块110可对来自对应于音频信号102的高频带部分的较高频率部分的QMF滤波器的滤波器输出求和。举例来说,预处理模块110可对来自对应于12kHz到16kHz频率范围的10个QMF的输出求和,所述QMF使用着色图案展示于图1中。预处理模块110可基于经求和的QMF输出来确定高频带信号特征126。在特定方面中,预处理模块110对QMF输出的总和进行长期求平均运算以确定高频带信号特征126。为了说明,预处理模块110可根据以下伪码进行操作:
尽管以上伪码说明使用分析滤波器组在10个频带(例如,表示12到16kHz数据的10个400Hz频带)上的长期求平均运算,但应了解,预处理模块110可根据基本上类似于针对不同分析滤波器组的伪码、频带的不同数目及/或数据的不同频率范围操作。作为非限制性实例,预处理模块110可将复合低延迟分析滤波器组用于表示13到16kHz数据的20个频带。
在特定方面中,高频带信号特征126在按子帧基础上确定。为了说明,音频信号102可被划分成多个帧,其中每一帧对应于大约20毫秒(ms)的音频。每一帧可包含多个子帧。举例来说,每一20ms帧可包含四个5ms(或大约5ms)子帧。在替代方面中,帧及子帧可对应于不同时间长度,且不同数目个子帧可包含于每一帧中。
应注意,尽管图1的实例说明SWB信号的处理,但此仅为了说明。在替代方面中,音频信号102可为具有大约50Hz到大约8kHz的频率范围的宽带(WB)信号。在此方面中,低频带信号122可对应于大约50Hz到大约6.4kHz的频率范围,且高频带信号124可对应于大约6.4kHz到大约8kHz的频率范围。
系统100可包含经配置以接收低频带信号122的低频带分析模块130。在特定方面中,低频带分析模块130可表示码激励线性预测(CELP)编码器的方面。低频带分析模块130可包含线性预测(LP)分析及译码模块132、线性预测系数(LPC)到线谱对(LSP)变换模块134及量化器136。LSP也可被称作线谱频率(LSF),且所述两个术语在本文中可以互换地使用。LP分析及译码模块132可将低频带信号122的频谱包络编码成LPC的集合。可针对音频的每一帧(例如,对应于16kHz的采样速率下的320个样本的20毫秒的音频)、音频的每一子帧(例如,5ms的音频)或其任何组合产生LPC。可由所执行LP分析的“阶数”确定针对每一帧或子帧所产生的LPC的数目。在特定方面中,LP分析及译码模块132可产生对应于十阶LP分析的十一个LPC的集合。
LPC到LSP变换模块134可将由LP分析及译码模块132所产生的LPC的集合变换成对应LSP集合(例如,使用一对一变换)。替代性地,LPC的集合可经一对一地变换成部分自相关系数、对数面积比率值、导谱对(ISP)或导谱频率(ISF)的对应集合。LPC集合与LSP集合之间的变换可为可逆的而不存在误差。
量化器136可量化由变换模块134产生的LSP的集合。举例来说,量化器136可包含或耦合到包含多个条目(例如,向量)的多个码簿。为量化LSP的集合,量化器136可识别“最接近”(例如,基于例如最小平方或均方误差的失真度量)LSP集合的码簿的条目。量化器136可输出对应于码簿中所识别条目的位置的索引值或一系列索引值。因此,量化器136的输出可表示包含于低频带位流142中的低频带滤波器参数。
低频带分析模块130也可产生低频带激励信号144。举例来说,低频带激励信号144可为通过量化LP残余信号产生的经编码信号,在由低频带分析模块130执行的LP过程期间产生所述LP残余信号。LP残余信号可表示预测误差。
系统100可进一步包含高频带分析模块150,其经配置以从预处理模块110接收高频带信号124及高频带信号特征126并从低频带分析模块130接收低频带激励信号144。高频带分析模块150可产生高频带旁侧信息(例如,参数)172。举例来说,高频带旁侧信息172可包含高频带LSP、增益信息等。
高频带分析模块150可包含高频带激励产生器160。高频带激励产生器160可通过将低频带激励信号144的频谱扩展到高频带频率范围(例如,8kHz到16kHz)中而产生高频带激励信号161。为了说明,高频带激励产生器160可对低频带激励信号应用变换(例如,非线性变换,例如绝对值或平方运算),且可将经变换低频带激励信号与噪声信号(例如,根据对应于低频带激励信号144的包络而调制的白噪声,其模仿低频带信号122的缓慢变化的时间特征)混合来产生高频带激励信号161。
高频带激励信号161可用于确定包含于高频带旁侧信息172中的一或多个高频带增益参数。如所说明,高频带分析模块150也可包含LP分析及译码模块152、LPC到LSP变换模块154及量化器156。LP分析及译码模块152、变换模块154及量化器156中的每一者可如上文参考低频带分析模块130的对应组件所描述但以相对减少的分辨率(例如,对于每一系数、LSP等使用较少位)起作用。LP分析及译码模块152可产生由变换模块154变换到LSP并由量化器156基于码簿163量化的LPC的集合。举例来说,LP分析及译码模块152、变换模块154及量化器156可使用高频带信号124来确定包含于高频带旁侧信息172中的高频带滤波器信息(例如,高频带LSP)。在特定方面中,高频带分析模块150可包含本地解码器,其基于由变换模块154产生的LPC使用滤波器系数,且接收高频带激励信号161作为输入。本地解码器的合成滤波器(例如,合成模块164)的输出,例如高频带信号124的经合成版本,可与高频带信号124进行比较,且增益参数(例如,帧增益及/或时间包络增益塑形值)可经确定、量化并包含于高频带旁侧信息172中。
在特定方面中,高频带旁侧信息172可包含高频带LSP以及高频带增益参数。举例来说,高频带旁侧信息172可包含时间增益参数(例如,增益形状参数),其指示高频带信号124的频谱包络随时间如何演进。举例来说,增益形状参数可基于“原始”高频带部分与经合成高频带部分之间的归一化能量的比率。增益形状参数可在按子帧基础上来经确定并应用。在特定方面中,也可确定并应用第二增益参数。举例来说,“增益帧”参数可跨越整个帧来确定并应用,其中增益帧参数对应于特定帧的高频带与低频带的能量比率。
举例来说,高频带分析模块150可包含合成模块164,其经配置以基于高频带激励信号161产生高频带信号124的经合成版本。高频带分析模块150也可包含增益调整器162,其基于“原始”高频带信号124与由合成模块164产生的高频带信号的经合成版本的比较来确定增益形状参数的值。为了说明,对于包含四个子帧的特定音频帧,高频带信号124对于相应子帧可具有10、20、30、20的值(例如,振幅或能量)。高频带信号的经合成版本可具有值10、10、10、10。增益调整器162可确定相应子帧的增益形状参数的值为1、2、3、2。在解码器处,增益形状参数值可用以使高频带信号的经合成版本塑形以更紧密地反映“原始”高频带信号124。在特定方面中,增益调整器162可使增益形状参数值归一化为0与1之间的值。举例来说,增益形状参数值可经归一化为0.33、0.67、1、0.33。
在特定方面中,增益调整器162可基于高频带信号特征126是否满足阈值165来调整增益形状参数的值。所述阈值165可为固定或可调整的。满足阈值165的高频带信号特征126可指示,音频信号102在高频带部分(例如,8kHz到16kHz)的较高频率区(例如,12kHz到16kHz)中包含小于阈值量的音频内容。因此,与经合成域相对,高频带信号特征可在滤波/分析域(例如,QMF域)中确定。当音频信号102在高频带部分的较高频率区中包含极少内容或不包含内容时,增益的大摆动可由高频带分析模块150编码,从而在信号解码上引起可听伪讯。为了减小这些伪讯,增益调整器162可在高频带信号特征满足阈值165时调整增益形状参数值。调整增益形状参数值可限制增益形状参数的可变性(例如,动态范围)。为了说明,增益调整器可根据以下伪码操作:
在替代方面中,阈值165可存储于预处理模块110处或可用于所述预处理模块,且预处理模块110可确定高频带信号特征126是否满足阈值165。在此方面中,预处理模块110可发送指示符(例如,位)到增益调整器162。指示符在高频带信号特征126满足阈值165时可具有第一值(例如,1),且在高频带信号特征126并不满足阈值165时可具有第二值(例如,0)。增益调整器162可基于指示符具有第一值抑或第二值而调整增益形状参数的值。
低频带位流142及高频带旁侧信息172可由多路复用器(MUX)180进行多路发射以产生输出位流192。输出位流192可表示对应于音频信号102的经编码音频信号。举例来说,输出位流192可经发射(例如,经由有线、无线或光学通道)及/或存储。在接收器处,反向操作可由解多路复用器(DEMUX)、低频带解码器、高频带解码器及滤波器组来执行以产生音频信号(例如,音频信号102的提供到扬声器其它输出装置的经重建版本)。用于表示低频带位流142的位数目可大体上大于用于表示高频带旁侧信息172的位数目。因此,输出位流192中的大部分位可表示低频带数据。高频带旁侧信息172可用于接收器处以根据信号模型从低频带数据重新产生高频带激励信号。举例来说,信号模型可表示低频带数据(例如,低频带信号122)与高频带数据(例如,高频带信号124)之间的关系或相关性的预期集合。因此,不同信号模型可用于不同种类的音频数据(例如,话音、音乐等),且在使用中的特定信号模型在传达经编码音频数据之前可由发射器及接收器协商(或通过业界标准界定)。使用信号模型,发射器处的高频带分析模块150可能能够产生高频带旁侧信息172,使得接收器处的对应高频带分析模块能够使用信号模型从输出位流192重建高频带信号124。
通过在高频带信号特征满足阈值时选择性地调整时间增益信息(例如,增益形状参数),图1的系统100在经编码信号经频带受限(例如,包含很少高频带内容或不包含高频带内容)时可减小可听伪讯。图1的系统100因此在输入信号并不附接到使用中的信号模型时可实现约束时间增益。
参看图2,展示用于编码器200中的组件的特定方面。在说明性方面中,编码器200对应于图1的系统100。
编码器200可接收具有为“F”的带宽的输入信号201(例如,具有从0Hz到F Hz的频率范围的信号,例如当F=16,000=16k时为0Hz到16kHz)。分析滤波器202可输出输入信号201的低频带部分。从分析滤波器202输出的信号203可具有从0Hz到F1Hz(例如,在F1=6.4k时为0Hz到6.4kHz)的频率分量。
例如ACELP编码器(例如,图1的低频带分析模块130中的LP分析及译码模块132)的低频带编码器204可编码信号203。ACELP编码器204可产生例如LPC的译码信息及低频带激励信号205。
来自ACELP编码器的低频带激励信号205(其也可由接收器中的ACELP解码器再现,例如图4中所描述)可在采样器206处经增加采样,使得经增加采样信号207的有效带宽在从0Hz到F Hz的频率范围内。低频带激励信号205可由采样器206接收,此是由于样本集合对应于12.8kHz的采样速率(例如,6.4kHz低频带激励信号205的奈奎斯采样速率)。举例来说,低频带激励信号205可以低频带激励信号205的带宽的速率两倍的速率进行采样。
第一非线性变换产生器208可经配置以基于经增加采样信号207产生说明为非线性激励信号的经带宽扩展信号209。举例来说,非线性变换产生器208可对经增加采样信号207执行非线性变换操作(例如,绝对值运算或平方运算)以产生经带宽扩展信号209。非线性变换操作可将原始信号(从0Hz到F1Hz(例如,0Hz到6.4kHz)的低频带激励信号205)的谐波扩展到较高频带,例如从0Hz扩展到F Hz(例如,从0Hz到16kHz)。
经带宽扩展信号209可经提供到第一频谱翻转模块210。第一频谱翻转模块210可经配置以执行经带宽扩展信号209的频谱镜像操作(例如,“翻转”频谱)以产生“经翻转”信号211。翻转经带宽扩展信号209的频谱可将经带宽扩展信号209的内容改变(例如,“翻转”)到经翻转信号211的范围为0Hz到F Hz(例如,从0Hz到16kHz)的频谱的相对末端。举例来说,经带宽扩展信号209在14.4kHz处的内容可在经翻转信号211的1.6kHz处,经带宽扩展信号209在0Hz处的内容可在经翻转信号211的16kHz处等。
经翻转信号211可提供到切换器212的输入,其以第一操作模式选择性地路由经翻转信号211到包含滤波器214及降混器216的第一路径,或以第二操作模式路由所述经翻转信号到包含滤波器218的第二路径。举例来说,切换器212可包含多路复用器,其对控制输入处指示编码器200的操作模式的信号作出响应。
在第一操作模式中,经翻转信号211在滤波器214处经带通滤波,以产生带通信号215,所述带通信号在从(F-F2)Hz到(F-F1)Hz的频率范围外部具有减少或移除的信号内容,其中F2>F1。举例来说,当F=16k、F1=6.4k且F2=14.4k时,经翻转信号211可经带通滤波到频率范围1.6kHz到9.6kHz。滤波器214可包含极零滤波器,其经配置以作为具有在大约F-F1处(例如,在16kHz-6.4kHz=9.6kHz处)的截止频率的低通滤波器操作。举例来说,极零滤波器可为高阶滤波器,其在截止频率处具有急剧下降,且经配置以滤除经翻转信号211的高频分量(例如,经翻转信号211的在(F-F1)与F之间例如在9.6kHz与16kHz之间的分量)。此外,滤波器214可包含高通滤波器,其经配置以使输出信号中在F-F2以下(例如,在16kHz-14.4kHz=1.6kHz以下)的频率分量衰减。
带通信号215可经提供到降混器216,其可产生具有从0Hz扩展到(F2-F1)Hz例如从0Hz到8kHz的有效信号带宽的信号217。举例来说,降混器216可经配置以将带通信号215从在1.6kHz与9.6kHz之间的频率范围降混到基带(例如,0Hz与8kHz之间的频率范围)以产生信号217。降混器216可使用两阶赫伯特(Hilbert)变换来实施。举例来说,降混器216可使用具有虚数分量及实数分量的两个五阶无限脉冲响应(IIR)滤波器来实施。
在第二操作模式中,切换器212提供经翻转信号211到滤波器218以产生信号219。滤波器218可作为低通滤波器操作以使(F2-F1)Hz以上(例如,8kHz以上)的频率分量衰减。滤波器218处的低通滤波可作为重新采样过程的部分执行,在所述重新采样过程处,采样速率经转换成2*(F2-F1)(例如,成2*(14.4Hz-6.4Hz=16kHz))。
切换器220输出信号217、219中的一者以根据操作模式在适应性白化及按比例调整模块222处处理,且适应性白化及按比例调整模块处的输出经提供到例如加法器的组合器240的第一输入。组合器240的第二输入接收从随机噪声产生器230的输出产生的信号,所述输出已根据噪声包络模块232(例如,调制器)及按比例调整模块234进行了处理。组合器240产生高频带激励信号241,例如图1的高频带激励信号161。
具有在0Hz与F Hz之间的频率范围内的有效带宽的输入信号201也可在基带信号产生路径处处理。举例来说,输入信号201可在频谱翻转模块242处在频谱上翻转以产生经翻转信号243。经翻转信号243可在滤波器244处经带通滤波以产生带通信号245,所述带通信号具有在从(F-F2)Hz到(F-F1)Hz(例如,从1.6kHz到9.6kHz)的频率范围外部的经移除或减小的信号分量。
在特定方面中,滤波器244确定输入信号201的高频带部分的较高频率范围的信号特征。作为说明性非限制性实例,滤波器244可基于对应于12kHz到16kHz频率范围的滤波器输出确定高频带信号底限的长期平均值,如参看图1所描述。图3说明这些频带受限信号(指示为1到7)的实例。这些频带受限信号的线性预测系数(LPC)估计引起在高频带中导致伪讯的量化及稳定性的问题。举例来说,如果经32kHz采样的输入信号经频带受限到10kHz(即,在10kHz以上且直到奈奎斯存在极其有限的能量)且高频带正从8到16kHz或6.4到14.4kHz编码,则来自8到10kHz的频带受限频谱内容可引起高频带LPC估计中的稳定性问题。详言之,LP系数在以所要固定点精度Q格式表示时可归因于精度损失而饱和。在这些情境下,较低预测阶数可用于LP分析(例如,使用LPC阶数=2或4而非10)。用于LP分析的LPC阶数的此减小以限制饱和度及稳定性问题可基于LP合成滤波器的LP增益或能量来执行。如果LP增益高于特定阈值,则LPC阶数可经调整到较低值。LP合成滤波器的能量通过|1/A(z)|^2给出,其中A(z)为LP分析滤波器。对应于48dB的为64的典型LP增益值为良好指示符以检查这些频带受限情境下的高LP增益,且控制预测阶数以避免LPC估计中的饱和度问题。
带通信号245可在降混器246处进行降混以产生高频带“目标”信号247,其具有在从0Hz到(F2-F1)Hz(例如,从0Hz到8kHz)的频率范围内的有效信号带宽。高频带目标信号247为对应于第一频率范围的基带信号。
表示对高频带激励信号241的修改使得其表示高频带目标信号247的参数可经提取并发射到解码器。为了说明,高频带目标信号247可由LP分析模块248处理以产生LPC,所述LPC在LPC到LSP转换器250处经转换成LSP,并在量化模块252处量化。量化模块252可产生待发送到解码器的LSP量化索引,例如在图1的高频带旁侧信息172中。
LPC可用以配置合成滤波器260,其接收高频带激励信号241作为输入并产生经合成高频带信号261作为输出。经合成高频带信号261在时间包络估计模块262处与高频带目标信号247进行比较(例如,信号261及247的能量可在相应信号的每一子帧处进行比较)以产生增益信息263,例如增益形状参数值。增益信息263经提供到量化模块264以产生经量化增益信息索引以发送到解码器,例如在图1的高频带旁侧信息172中。
如上文所描述,如果LP增益高于特定阈值以减小饱和度,则较低预测阶数可用于LP分析(例如,使用LPC阶数=2或4而非10)。为了说明,LP分析模块248可根据以下伪码进行操作:
基于伪码,LP分析模块248可基于使用LP阶数的第一值的LP增益操作来确定LP增益。举例来说,LP分析模块248可使用函数“ener_1_Az”估计LP增益(例如,“enerG”)。函数可使用16阶滤波器(例如,十六阶增益计算)来估计LP增益。LP分析模块248也可比较增益与阈值。根据伪码,阈值具有为64的数值。然而,应理解,伪码中的阈值仅用作非限制性实例,且其它数值可用作阈值。LP分析模块248也可确定能量等级(“enerG”)是否超出限值。举例来说,LP分析模块248可使用函数“is_numeric_float”确定能量等级是否为“无限的”。如果LP分析模块248确定,能量等级(例如,LP增益)满足阈值(例如,大于阈值)或超出限值或两者,则LP分析模块248可将LP阶数从第一值(例如,16)减小到第二值(例如,2或4)以减小LPC饱和度的似然度。
在特定方面中,在由滤波器244确定的信号特征满足阈值时(例如,当信号特征指示输入信号201在高频带部分的较高频率范围中具有极少内容或不具有内容时),时间包络估计模块262可调整增益形状参数的值。当编码这些信号时,增益形状参数的值的广泛摆动在帧间及/或在子帧间发生,从而导致经重建音频信号的可听伪讯。举例来说,如图3中用圆圈表示,高频带伪讯可存在于经重建音频信号中。本发明的技术在输入信号201在高频带部分或至少其较高频率区中具有极少内容或无内容时,可通过选择性地调整增益形状参数值来实现减小或消除这些伪讯的存在。
如关于第一路径所描述,在第一操作模式中,高频带激励信号241产生路径包含降混操作以产生信号217。此降混操作在经由赫伯特变换器实施情况下可为复合的。替代实施可基于正交镜像滤波器(QMF)。在第二操作模式中,降混操作并非包含于高频带激励信号241产生路径中。此导致高频带激励信号241与高频带目标信号247之间的失配。应了解,根据第二模式(例如,使用滤波器218)产生高频带激励信号241可绕过极零滤波器214及降混器216,且减小与极零滤波及降混器相关联的复杂且计算上昂贵的操作。尽管图2描述第一路径(包含滤波器214及降混器216)及第二路径(包含滤波器218)与编码器200的独特操作模式相关联,但在其它方面中,编码器200可经配置而以第二模式操作,而非经配置以又以第一模式操作(例如,编码器200可省略切换器212、滤波器214、降混器216及切换器220,从而使滤波器218的输入经耦合以接收经翻转信号211且使信号219提供到适应性白化及按比例调整模块222)。
图4描绘解码器400的特定方面,所述解码器可用以解码经编码音频信号,例如由图1的系统100或图2的编码器200产生的经编码音频信号。
解码器400包含接收经编码音频信号401的低频带解码器404,例如ACELP核心解码器404。经编码音频信号401为音频信号的经编码版本,例如图2的输入信号201;且包含对应于音频信号的低频带部分的第一数据402(例如,低频带激励信号205及经量化LSP索引)及对应于音频信号的高频带部分的第二数据403(例如,增益包络数据463及经量化LSP索引461)。在特定方面中,增益包络数据463包含增益形状参数值,其在输入信号(例如,输入信号201)在高频带部分(或其较高频率区)中具有极少内容或无内容时经选择性地调整以限制可变性/动态范围。
低频带解码器404产生经合成低频带解码信号471。高频带信号合成包含提供图2的低频带激励信号205(或低频带激励信号205的表示,例如低频带激励信号205的接收自编码器的经量化版本)到图2的增加采样器206。高频带合成包含如由切换器212及220所控制使用增加采样器206、非线性变换模块208、频谱翻转模块210、滤波器214及降混器216(在第一操作模式中)或滤波器218(在第二操作模式)产生高频带激励信号241,且使用适应性白化及按比例调整模块222来提供第一输入到图2的组合器240。到组合器的第二输入由随机噪声产生器230的由噪声包络模块232处理的输出产生,且在图2的按比例调整模块234处进行按比例调整。
图2的合成滤波器260可根据例如由图2的编码器200的量化模块252输出的接收自编码器的LSP量化索引而在解码器400中配置,且处理由组合器240输出的激励信号241以产生经合成信号。经合成信号提供到时间包络应用模块462,其经配置以应用例如增益形状参数值的一或多个增益(例如,根据从图2的编码器200的量化模块264输出的增益包络索引)来产生经调整信号。
高频带合成以混频器464进行的处理继续,所述混频器经配置以将信号从0Hz到(F2-F1)Hz的频率范围升混(upmix)到(F-F2)Hz到(F-F1)Hz(例如,1.6kHz到9.6kHz)的频率范围。由混频器464输出的升混信号在采样器466处经增加采样,且采样器466的经增加采样输出经提供到频谱翻转模块468,所述频谱翻转模块468可如关于频谱翻转模块210所描述而操作,以产生具有从F1Hz扩展到F2Hz的频带的高频带经解码信号469。
由低频带解码器404输出的低频带解码信号471(从0Hz到F1Hz)及从频谱翻转模块468输出的高频带经解码信号469(从F1Hz到F2Hz)经提供到合成滤波器组470。合成滤波器组470基于低频带经解码信号471与高频带经解码信号469的组合产生经合成音频信号473,例如图2的音频信号201的经合成版本,且具有从0Hz到F2Hz的频率范围。
如关于图2所描述,根据第二模式(例如,使用滤波器218)产生高频带激励信号241可绕过极零滤波器214及降混器216,且减小与极零滤波及降混器相关联的复杂且计算上昂贵的操作。尽管图4描述第一路径(包含滤波器214及降混器216)及第二路径(包含滤波器218)为与解码器400的独特操作模式相关联,但在其它方面中,解码器400可经配置而以第二模式操作而无需可配置而以第一模式操作(例如,解码器400可省略切换器212、滤波器214、降混器216及切换器220,使滤波器218的输入耦合以接收经翻转信号211并使信号219提供到适应性白化及按比例调整模块222的输入)。
参看图5A,展示基于高频带信号特征调整时间增益参数的方法500的特定方面。在说明性方面中,可由图1的系统100或图2的编码器200执行方法500。
方法500可包含在502处确定音频信号的高频带部分的较高频率范围的信号特征是否满足阈值。举例来说,在图1中,增益调整器162可确定信号特征126是否满足阈值165。
前进到504,方法500可产生对应于高频带部分的高频带激励信号。方法500可在506处进一步基于高频带激励信号来产生经合成高频带部分。举例来说,在图1中,高频带激励产生器160可产生高频带激励信号161,且合成模块164可基于高频带激励信号161产生经合成高频带部分。
继续到508,方法500可基于经合成高频带部分与高频带部分的比较来确定时间增益参数(例如,增益形状)的值。方法500还可包含在510处确定信号特征是否满足阈值。当信号特征满足阈值时,方法500可包含在512处调整所述时间增益参数的值。调整时间增益参数的值可限制时间增益参数的可变性。举例来说,在图1中,在高频带信号特征126满足阈值165(例如,高频带信号特征126指示音频信号102在高频带部分(或至少其较高频率区)中具有极少内容或无内容)时,增益调整器162可调整增益形状参数的值。在说明性方面中,调整增益形状参数的值包含基于归一化常数(例如,0.315)与增益形状参数的第一值的特定百分数(例如,10%)的总和来计算增益形状参数的第二值,如参看图1描述的伪码中所展示。
当信号特征并不满足阈值时,方法500可包含在514处使用时间增益参数的未调整值。举例来说,在图1中,当音频信号102在高频带部分(或至少其较高频率区)中包含足够内容时,增益调整器162可避免限制增益形状参数值的可变性。
在特定方面中,图5A的方法500可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等的处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等)实施,经由固件装置实施,或其任何组合来实施。作为实例,可由执行指令的处理器(如关于图6所描述)执行图5A的方法500。
参看图5B,展示计算高频带信号特征的方法520的特定方面。在说明性方面中,可由图1的系统100或图2的编码器200执行方法520。
方法520包含在522处经由对音频信号执行频谱翻转操作而产生音频信号的经频谱翻转版本以在基带下处理音频信号的高频带部分。举例来说,参看图2,频谱翻转模块242可通过对输入信号201执行频谱翻转操作而产生经翻转信号243(例如,输入信号201的频谱经翻转版本)。在频谱上翻转输入信号201可实现基带下处理输入信号201的高频带部分的较高频率范围(例如,12到16kHz部分)。
在524处,可基于音频信号的经频谱翻转版本来计算能量值的总和。举例来说,参看图1,预处理模块110可对能量值的总和执行长期求平均运算。能量值可对应于QMF输出,所述QMF输出对应于输入信号201的高频带部分的较高频率范围。能量值的总和可指示高频带信号特征126。
图5B的方法520可减小在频带受限音频信号的编码/解码期间产生的伪讯。举例来说,能量值的总和的长期平均值可指示高频带信号特征126。如果高频带信号特征126满足阈值(例如,信号特征指示音频信号为频带受限的且具有极少高频带内容或无高频带内容),则编码器可调整增益形状参数的值以限制增益形状参数的可变性(例如,受限动态范围)。限制增益形状参数的可变性可减小在频带受限音频信号的编码/解码期间产生的伪讯。
在特定方面中,图5B的方法520可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器的处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等)实施,经由固件装置实施,或其任何组合实施。作为实例,可由执行指令的处理器(如关于图6所描述)执行图5B的方法520。
参看图5C,展示调整编码器的LPC的方法540的特定方面。在说明性方面中,可由图1的系统100或图2的LP分析模块248执行方法540。根据一个实施,LP分析模块248可根据上文所描述以执行方法540的对应伪码而操作。
方法540包含于542处在编码器处基于使用线性预测(LP)阶数的第一值的LP增益操作来确定LP增益。所述LP增益可与LP合成滤波器的能量等级相关联。举例来说,参看图2,LP分析模块248可基于使用LP阶数的第一值的LP增益计算来确定LP增益。根据一个实施,第一值对应于十六阶滤波器。所述LP增益可与LP合成滤波器260的能量等级相关联。举例来说,能量等级可对应于脉冲响应能量等级,其基于音频帧的音频帧大小且基于针对音频帧产生的LPC的数目。合成滤波器260(例如,LP合成滤波器)可对从低频带激励信号的非线性扩展产生(例如,从经带宽扩展信号209产生)的高频带激励信号241作出响应。
在544处,可比较LP增益与阈值。举例来说,参看图2,LP分析模块248可比较LP增益与阈值。在546处,如果LP增益满足阈值,则LP阶数可从第一值减小到第二值。举例来说,参看图2,如果LP增益满足(例如,高于)阈值,则LP分析模块248可将LP阶数从第一值减小到第二值。根据一个实施,第二值对应于二阶滤波器。根据另一实施,第二值对应于四阶滤波器。
方法540还可包含确定能量等级是否超出限值。举例来说,参看图2,LP分析模块248可确定合成滤波器260的能量等级是否超出限值(例如,可使得能量值被解释为具有不正确数值的“无限”限值)。LP阶数响应于合成滤波器260的能量等级超出限值而可从第一值减小到第二值。
在特定方面中,图5C的方法540可经由例如CPU、DSP或控制器的处理单元的硬件(例如,FPGA装置、ASIC等)实施,经由固件装置实施,或其任何组合来实施。作为实例,可由执行指令的处理器(如关于图6所描述)执行图5C的方法540。
参看图6,装置(例如,无线通信装置)的特定说明性方面的框图经描绘并通常指定为600。在各种方面中,装置600可具有比图6中所说明较少或较多的组件。在说明性方面中,装置600可对应于一或多个系统、设备或参看图1、2及4描述的装置的一或多个组件。在说明性方面中,装置600可根据例如图5A的方法500、图5B的方法520及/或图5C的方法540的全部或一部分的本文中所描述的一或多种方法而操作。
在特定方面中,装置600包含处理器606(例如,中央处理单元(CPU))。装置600可包含一或多个额外处理器610(例如,一或多个数字信号处理器(DSP))。处理器610可包含话音及音乐译码器解码器(译码解码器)608及回波消除器612。话音及音乐译码解码器608可包含声码器编码器636、声码器解码器638或所述两者。
在特定方面中,声码器编码器636可包含图1的系统100或图2的编码器200。声码器编码器636可包含增益形状调整器662,其经配置以基于高频带信号特征来选择性地调整时间增益信息(例如,增益形状参数值)(例如,当高频带信号特征指示输入音频信号在高频带部分的较高频率范围内具有极少内容或无内容)。
声码器解码器638可包含图4的解码器400。举例来说,声码器解码器638可经配置以基于经调整的增益形状参数值执行信号重建672。尽管话音及音乐译码解码器608说明为处理器610的组件,但在其它方面中,话音及音乐译码解码器608的一或多个组件可包含于处理器606、译码解码器634、另一处理组件或其组合中。
装置600可包含存储器632及经由收发器650耦合到天线642的无线控制器640。装置600可包含耦合到显示控制器626的显示器628。扬声器648、麦克风646或所述两者可耦合到译码解码器634。译码解码器634可包含数/模转换器(DAC)602及模/数转换器(ADC)604。
在特定方面中,译码解码器634可从麦克风646接收模拟信号、使用模/数转换器604将模拟信号转换成数字信号并将数字信号例如以脉码调制(PCM)格式提供到话音及音乐译码解码器608。话音及音乐译码解码器608可处理数字信号。在特定方面中,话音及音乐译码解码器608可将数字信号提供到译码解码器634。译码解码器634可使用数/模转换器602将数字信号转换成模拟信号且可将模拟信号提供到扬声器648。
存储器632可包含指令656,所述指令可由处理器606、处理器610、译码解码器634、装置600的另一处理单元或其组合执行以执行本文中所揭示的方法及过程(例如,图5A到5B的方法中的一或多者)。图1、2或4的系统的一或多个组件可由执行指令以执行一或多个任务或其组合的处理器经由专用硬件(例如,电路)来实施。作为实例,存储器632或处理器606、处理器610及/或译码解码器634的一或多个组件可为存储器装置,例如随机存取存储器(RAM)、磁阻式随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、闪存存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、装卸式磁盘或光盘只读存储器(CD-ROM)。存储器装置可包含指令(例如,指令656),其在由计算机(例如,译码解码器634中的处理器、处理器606及/或处理器610)执行时可使得计算机执行图5A到5B的方法的至少一部分。作为实例,存储器632或处理器606、处理器610、译码解码器634的一或多个组件可为包含指令(例如,指令656)的非暂时性计算机可读媒体,所述指令在由计算机(例如,译码解码器634中的处理器、处理器606及/或处理器610)执行时使得计算机执行图5A到5B的方法的至少一部分。
在特定方面中,装置600可包含于系统级封装或系统单芯片装置622(例如,移动台数据机(MSM))中。在特定方面中,处理器606、处理器610、显示控制器626、存储器632、译码解码器634、无线控制器640及收发器650包含于系统级封装或系统单芯片装置622中。在特定方面中,例如触控式屏幕及/或小键盘等的输入装置630及电力供应器644耦合到系统单芯片装置622。此外,在特定方面中,如图6中所说明,显示器628、输入装置630、扬声器648、麦克风646、天线642及电力供应器644在系统单芯片装置622外部。然而,显示器628、输入装置630、扬声器648、麦克风646、天线642及电力供应器644中的每一者可耦合到系统单芯片装置622的组件,例如接口或控制器。在说明性方面中,装置600对应于移动通信装置、智能电话、蜂窝式电话、便携式计算机、计算机、平板计算机、个人数字助理、显示装置、电视、游戏控制台、音乐播放器、收音机、数字视频播放器、光盘播放器、调谐器、摄像机、导航装置、解码器系统、编码器系统或其任何组合。
在说明性方面中,处理器610可操作以根据所描述技术执行信号编码及解码操作。举例来说,麦克风646可撷取音频信号。ADC 604可将所撷取音频信号从模拟波形转换成包含数字音频样本的数字波形。处理器610可处理数字音频样本。回波消除器612可减少可已由进入麦克风646的扬声器648的输出所产生的回波。
声码器编码器636可压缩对应于经处理话音信号的数字音频样本且可形成发射包(例如,数字音频样本的经压缩位表示)。举例来说,发射包可对应于图1的位流192的至少一部分。发射包可存储在存储器632中。收发器650可调制某一形式的发射包(例如,可将其它信息随附于所述发射包)且可经由天线642发射经调制数据。
作为另一实例,天线642可接收包含接收包的传入包。可由另一装置经由网络发送接收包。举例来说,接收包可对应于在图4的ACELP核心解码器404处接收到的位流的至少一部分。声码器解码器638可解压缩并解码接收包以产生经重建音频样本(例如,对应于经合成音频信号473)。回波消除器612可移除来自经重建音频样本的回波。DAC602可将声码器解码器638的输出从数字波形转换成模拟波形且可将经转换波形提供到扬声器648以用于输出。
所属领域的一般技术人员将进一步了解,各种说明性逻辑块、配置、模块、电路及结合本文中所揭示的方面描述的算法步骤可实施为电子硬件、由例如硬件处理器的处理装置执行的计算机软件,或两者的组合。上文已大体在功能性方面描述了各种说明性组件、块、配置、模块、电路及步骤。此功能性经实施为硬件或是软件取决于特定应用及强加于整个系统的设计约束。对于每一特定应用来说,所属领域的一般技术人员可以变化的方式实施所描述的功能性,但不应将所述实施决策解释为导致脱离本发明的范围。
结合本文中所揭示的方面所描述的方法或算法的步骤可直接具体化于硬件中、由处理器执行的软件模块中或两者的组合中。软件模块可驻留于存储器装置中,例如随机存取存储器(RAM)、磁阻式随机存取存储器(MRAM)、自旋力矩转移MRAM(STT-MRAM)、闪存存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、装卸式磁盘或光盘只读存储器(CD-ROM)。例示性存储器装置耦合到处理器,使得处理器可从存储器装置读取信息并将信息写入到存储器装置。在替代方案中,存储器装置可与处理器成一体式。处理器及存储媒体可驻留于专用集成电路(ASIC)中。ASIC可驻留于计算装置或用户终端机中。在替代例中,处理器及存储媒体可作为离散组件驻留于计算装置或用户终端机中。
提供所揭示方面的先前描述以使得所属领域的一般技术人员能够制作或使用所揭示方面。对于所属领域的一般技术人员来说,对这些方面的各种修改将易于显而易见,且可在不背离本发明的范围的情况下将本文中所界定的一般原理应用于其它方面。因此,本发明并非意欲限于本文中所展示的实施例,而应符合可能与如以下权利要求书所界定的原理及新颖特征相一致的最广泛范围。

Claims (16)

1.一种通过调整编码器之线性预测系数LPC来进行音频译码的方法,所述方法包括:
在所述编码器处基于使用线性预测LP阶数的第一值的LP增益操作确定LP增益,所述LP增益与LP合成滤波器的能量等级相关联;
比较所述LP增益与阈值;
在所述LP增益大于所述阈值的情况下将所述LP阶数从所述第一值减小到第二值;
将LPC变换成线谱对LSP,所述LPC是基于所述LP阶数的;及
将所述LSP作为位流的一部分从所述编码器发送到接收器。
2.根据权利要求1所述的方法,其中所述LP合成滤波器对从低频带激励信号的谐波扩展产生的高频带激励信号作出响应。
3.根据权利要求1所述的方法,其中所述能量等级对应于脉冲响应能量,且基于音频帧的音频帧大小及针对所述音频帧产生的LPC的数目。
4.根据权利要求1所述的方法,其中所述第一值对应于十阶滤波器,且其中所述第二值对应于二阶滤波器或四阶滤波器。
5.根据权利要求1所述的方法,其中将所述LP阶数从所述第一值减小到所述第二值是在包含移动通信装置的装置中执行的。
6.一种用于执行音频译码操作的设备,其包括:
编码器;及
存储指令的存储器,所述指令在由所述编码器执行时执行包括以下各者的音频译码操作:
基于使用线性预测LP阶数的第一值的LP增益操作确定LP增益,所述LP增益与LP合成滤波器的能量等级相关联;
比较所述LP增益与阈值;
在所述LP增益大于所述阈值的情况下将所述LP阶数从所述第一值减小到第二值;及
将LPC变换成线谱对LSP,所述LPC是基于所述LP阶数的;及
发射器,其经操作以将所述LSP作为位流的一部分发送给接收器。
7.根据权利要求6所述的设备,其中所述能量等级对应于脉冲响应能量,且基于音频帧的音频帧大小及针对所述音频帧产生的LPC的数目。
8.根据权利要求6所述的设备,其中所述第一值对应于十阶滤波器,且其中所述第二值对应于二阶滤波器或四阶滤波器。
9.根据权利要求6所述的设备,其进一步包括:
天线;及
发射器,其耦合到所述天线且经配置以发送经编码音频信号。
10.根据权利要求9所述的设备,其中所述发射器和所述编码器集成到移动通信装置中。
11.一种包括用于调整编码器的线性预测系数LPC的指令的非暂时性计算机可读媒体,
所述指令在由所述编码器执行时使所述编码器执行包括以下各者的音频译码操作:
基于使用线性预测LP阶数的第一值的LP增益操作确定LP增益,所述LP增益与LP合成滤波器的能量等级相关联;
比较所述LP增益与阈值;
在所述LP增益大于所述阈值的情况下将所述LP阶数从所述第一值减小到第二值;
将LPC变换成线谱对LSP,所述LPC是基于所述LP阶数的;及
起始将所述LSP作为位流的一部分从所述编码器到接收器的发射。
12.根据权利要求11所述的非暂时性计算机可读媒体,其中所述能量等级对应于脉冲响应能量,且基于音频帧的音频帧大小及针对所述音频帧产生的LPC的数目。
13.根据权利要求11所述的非暂时性计算机可读媒体,其中所述第一值对应于十阶滤波器,且其中所述第二值对应于二阶滤波器或四阶滤波器。
14.一种用于执行音频译码操作的设备,所述设备包括:
用于基于使用线性预测LP阶数的第一值的LP增益操作确定LP增益的装置,所述LP增益与LP合成滤波器的能量等级相关联;
用于比较所述LP增益与阈值的装置;
用于在所述LP增益大于所述阈值的情况下将所述LP阶数从所述第一值减小到第二值的装置;
用于将LPC变换成线谱对LSP的装置,所述LPC是基于所述LP阶数的;及
用于将所述LSP作为位流的一部分从编码器发送到接收器的装置。
15.根据权利要求14所述的设备,其中所述能量等级对应于脉冲响应能量,且基于音频帧的音频帧大小及针对所述音频帧产生的LPC的数目。
16.根据权利要求14所述的设备,其中用于确定所述LP增益的装置、用于比较所述LP增益与所述阈值的装置以及用于减小所述LP阶数的装置被集成到移动通信装置中。
CN201580032467.7A 2014-06-26 2015-06-05 基于高频带信号特征的时间增益调整 Active CN106463136B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462017790P 2014-06-26 2014-06-26
US62/017,790 2014-06-26
US14/731,276 US9626983B2 (en) 2014-06-26 2015-06-04 Temporal gain adjustment based on high-band signal characteristic
US14/731,276 2015-06-04
PCT/US2015/034540 WO2015199955A1 (en) 2014-06-26 2015-06-05 Temporal gain adjustment based on high-band signal characteristic

Publications (2)

Publication Number Publication Date
CN106463136A CN106463136A (zh) 2017-02-22
CN106463136B true CN106463136B (zh) 2018-05-08

Family

ID=54931208

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580032102.4A Active CN106663440B (zh) 2014-06-26 2015-06-05 基于高频带信号特征的时间增益调整
CN201580032467.7A Active CN106463136B (zh) 2014-06-26 2015-06-05 基于高频带信号特征的时间增益调整

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580032102.4A Active CN106663440B (zh) 2014-06-26 2015-06-05 基于高频带信号特征的时间增益调整

Country Status (12)

Country Link
US (2) US9583115B2 (zh)
EP (2) EP3161823B1 (zh)
JP (2) JP6312868B2 (zh)
KR (2) KR101849871B1 (zh)
CN (2) CN106663440B (zh)
AR (2) AR100848A1 (zh)
BR (1) BR112016030384B1 (zh)
CA (2) CA2952006C (zh)
ES (2) ES2690251T3 (zh)
HU (2) HUE039281T2 (zh)
TW (2) TWI598873B (zh)
WO (2) WO2015199955A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
US11315584B2 (en) * 2017-12-19 2022-04-26 Dolby International Ab Methods and apparatus for unified speech and audio decoding QMF based harmonic transposer improvements
US11425258B2 (en) * 2020-01-06 2022-08-23 Waves Audio Ltd. Audio conferencing in a room
CN113820067B (zh) * 2021-11-22 2022-02-18 北京理工大学 强冲击传感器下阶跃响应动态特性计算方法及发生装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US5142581A (en) * 1988-12-09 1992-08-25 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis circuit
EP0582921A2 (en) * 1992-07-31 1994-02-16 SIP SOCIETA ITALIANA PER l'ESERCIZIO DELLE TELECOMUNICAZIONI P.A. Low-delay audio signal coder, using analysis-by-synthesis techniques
CN1159691A (zh) * 1995-12-15 1997-09-17 法国电信公司 用于声频信号线性预测分析的方法
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7146309B1 (en) * 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
MX2007012187A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
DE602006004959D1 (de) * 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
KR101393298B1 (ko) 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
PT2165328T (pt) 2007-06-11 2018-04-24 Fraunhofer Ges Forschung Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
US9253568B2 (en) * 2008-07-25 2016-02-02 Broadcom Corporation Single-microphone wind noise suppression
JP5441577B2 (ja) * 2009-09-11 2014-03-12 三菱電機株式会社 冷蔵庫
FR2961937A1 (fr) 2010-06-29 2011-12-30 France Telecom Codage/decodage predictif lineaire adaptatif
JP2012144128A (ja) * 2011-01-11 2012-08-02 Toyota Motor Corp 燃料タンクの給油部構造
US8811601B2 (en) * 2011-04-04 2014-08-19 Qualcomm Incorporated Integrated echo cancellation and noise suppression
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4301329A (en) * 1978-01-09 1981-11-17 Nippon Electric Co., Ltd. Speech analysis and synthesis apparatus
US5142581A (en) * 1988-12-09 1992-08-25 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis circuit
EP0582921A2 (en) * 1992-07-31 1994-02-16 SIP SOCIETA ITALIANA PER l'ESERCIZIO DELLE TELECOMUNICAZIONI P.A. Low-delay audio signal coder, using analysis-by-synthesis techniques
CN1159691A (zh) * 1995-12-15 1997-09-17 法国电信公司 用于声频信号线性预测分析的方法
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Joint Optimization of Linear Predictors in Speech Coders;PETER KABAL,et al.;《IEEE TRANSACTIONS ON ACOUSTICS. SPEECH. AND SIGNAL PROCESSING》;19890531;第37卷(第5期);642-650 *
VARIABLE MODEL ORDER LPC QUANTIZATION;Pasi Ojala,et al.;《PROCEEDINGS OF THE 1998 IEEE INTERNATIONAL CONFERENCE OF ACOUSTICS, SPEECH AND SIGNAL PROCESSING, ICASSP’98》;19980515;第1卷;49-52 *

Also Published As

Publication number Publication date
CA2952006C (en) 2019-05-21
CA2952214C (en) 2020-06-16
EP3161823B1 (en) 2018-07-18
KR20170023007A (ko) 2017-03-02
US20150380006A1 (en) 2015-12-31
JP2017523460A (ja) 2017-08-17
JP2017524980A (ja) 2017-08-31
WO2015199954A1 (en) 2015-12-30
CN106463136A (zh) 2017-02-22
EP3161825A1 (en) 2017-05-03
BR112016030384B1 (pt) 2023-04-04
CN106663440B (zh) 2018-05-08
US9626983B2 (en) 2017-04-18
CN106663440A (zh) 2017-05-10
ES2690251T3 (es) 2018-11-20
EP3161825B1 (en) 2018-07-18
HUE039281T2 (hu) 2018-12-28
TW201606758A (zh) 2016-02-16
US20150380007A1 (en) 2015-12-31
KR101849871B1 (ko) 2018-04-17
JP6312868B2 (ja) 2018-04-18
US9583115B2 (en) 2017-02-28
HUE039698T2 (hu) 2019-01-28
TW201604865A (zh) 2016-02-01
AR100848A1 (es) 2016-11-02
EP3161823A1 (en) 2017-05-03
KR101809866B1 (ko) 2017-12-15
JP6196004B2 (ja) 2017-09-13
TWI598873B (zh) 2017-09-11
CA2952214A1 (en) 2015-12-30
WO2015199955A1 (en) 2015-12-30
AR100847A1 (es) 2016-11-02
KR20170023851A (ko) 2017-03-06
ES2690252T3 (es) 2018-11-20
CA2952006A1 (en) 2015-12-30
BR112016030384A2 (zh) 2017-08-22

Similar Documents

Publication Publication Date Title
CN106463136B (zh) 基于高频带信号特征的时间增益调整
CN106463135B (zh) 使用失配频率范围的高频带信号译码
KR102612134B1 (ko) 고대역 타겟 신호 제어
CN106165012B (zh) 使用多个子频带的高频带信号译码
CN107851439A (zh) 在带宽变换周期期间的信号再使用
KR101872138B1 (ko) 디바이스에서 코딩 기술들을 스위칭하는 장치 및 방법들

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant