CN105830153A - 高频带信号建模 - Google Patents
高频带信号建模 Download PDFInfo
- Publication number
- CN105830153A CN105830153A CN201480067799.4A CN201480067799A CN105830153A CN 105830153 A CN105830153 A CN 105830153A CN 201480067799 A CN201480067799 A CN 201480067799A CN 105830153 A CN105830153 A CN 105830153A
- Authority
- CN
- China
- Prior art keywords
- band
- sub
- group
- parameter
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 68
- 230000005236 sound signal Effects 0.000 claims abstract description 64
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 230000005284 excitation Effects 0.000 claims description 123
- 238000002156 mixing Methods 0.000 claims description 37
- 230000009466 transformation Effects 0.000 claims description 23
- 230000001105 regulatory effect Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 description 19
- 238000003786 synthesis reaction Methods 0.000 description 19
- 230000008569 process Effects 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 13
- 238000001228 spectrum Methods 0.000 description 11
- 239000013598 vector Substances 0.000 description 9
- 238000005070 sampling Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000009987 spinning Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Luminescent Compositions (AREA)
- Polyoxymethylene Polymers And Polymers With Carbon-To-Carbon Bonds (AREA)
Abstract
本发明涉及一种方法,其包含在语音编码器处将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带。所述方法还包含基于所述第一组子频带产生经谐波扩展的信号。所述方法进一步包含至少部分地基于所述经谐波扩展的信号产生第三组子频带。所述第三组子频带对应于所述第二组子频带。所述方法还包含确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数。所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
Description
优先权要求
本申请案要求题目均为“高频带信号建模(HIGH-BANDSIGNALMODELING)”的2014年12月12日申请的第14/568,359号美国专利申请案和2013年12月16日申请的第61/916,697号美国临时专利申请案的优先权,所述两案的内容均以引用的方式全文并入。
技术领域
本发明大体上涉及信号处理。
背景技术
技术的进步已经产生了更小且功能更强大的计算装置。举例来说,当前存在各种便携式个人计算装置,包含无线计算装置,例如较小、轻重量且易于由用户携带的便携式无线电话、个人数字助理(PDA)和寻呼装置。更具体来说,例如蜂窝电话和因特网协议(IP)电话等便携式无线电话可经由无线网络传达语音和数据包。另外,许多此类无线电话包含并入其中的其它类型的装置。举例来说,无线电话还可包含数码相机、数码摄像机、数字记录器和音频文件播放器。
在传统电话系统(例如,公共交换电话网络(PSTN))中,信号带宽限于300赫兹(Hz)到3.4千赫兹(kHz)的频率范围。在例如蜂窝电话和基于因特网协议的语音业务(VoIP)等宽带(WB)应用中,信号带宽可横跨50Hz到7kHz的频率范围。超宽带(SWB)译码技术支持扩展到16kHz左右的带宽。将信号带宽从3.4kHz的窄带电话扩展到16kHz的SWB电话可改进信号重建的质量、可懂度及自然度。
SWB译码技术通常涉及编码和发射信号的较低频率部分(例如,50Hz到7kHz,也被称为“低频带”)。举例来说,可使用滤波器参数和/或低频带激励信号表示低频带。然而,为了改进译码效率,可不完全编码和发射信号的较高频率部分(例如,7kHz到16kHz,也被称为“高频带”)。接收器可改为利用信号建模以预测高频带。在一些实施方案中,可将与高频带相关联的数据提供到接收器以辅助预测。此数据可被称为“旁侧信息”,且可包含增益信息、线谱频率(LSF,也被称为线谱对(LSP))等。低频带信号的性质可用于产生旁侧信息,然而,低频带与高频带之间的能量差可产生不准确地表征高频带的旁侧信息。
发明内容
揭示了用于执行高频带信号建模的系统和方法。第一滤波器(例如,正交镜像滤波器(QMF)组或伪QMF组)可将音频信号滤波成对应于音频信号的低频带部分的第一组子频带和对应于所述音频信号的高频带部分的第二组子频带。对应于所述音频信号的低频带部分的子频带组和对应于所述音频信号的高频带部分的子频带组可具有或可不具有共用子频带。合成滤波器组可将第一组子频带进行组合以产生低频带信号(例如,低频带残差信号),且低频带信号可提供到低频带译码器。低频带译码器可使用可产生低频带激励信号的线性预测译码器(LP译码器)来量化低频带信号。非线性变换过程可基于低频带激励信号产生经谐波扩展的信号。非线性激励信号的带宽可大于音频信号的低频带部分且甚至与整个音频信号的带宽一样大。举例来说,非线性变换产生器可升取样低频带激励信号,且可经由非线性函数处理经升取样的信号以产生带宽大于低频带激励信号的带宽的经谐波扩展的信号。
在特定实施例中,第二滤波器可将所述经谐波扩展的信号分离成多个子频带。在此实施例中,经调制噪声可添加到所述经谐波扩展的信号的多个子频带的每一子频带以产生对应于第二组子频带(例如,对应于所述经谐波扩展的信号的高频带的子频带)的第三组子频带。在另一特定实施例中,经调制噪声可与所述经谐波扩展的信号混合以产生提供到第二滤波器的高频带激励信号。在此实施例中,第二滤波器可将高频带激励信号分离成第三组子频带。
第一参数估算器可基于第二组子频带中的对应子频带的度量确定第三组子频带中的第一子频带的第一调节参数。举例来说,第一参数估算器可确定第三组子频带中的第一子频带与音频信号的对应高频带部分之间的频谱关系和/或时间包络关系。以类似方式,第二参数估算器可基于第二组子频带中的对应子频带的度量确定第三组子频带中的第二子频带的第二调节参数。调节参数可经量化且连同其它旁侧信息一起发射到解码器以辅助解码器重建音频信号的高频带部分。
在特定方面中,方法包含在语音编码器处将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带。所述方法还包含基于所述第一组子频带产生经谐波扩展的信号。所述方法进一步包含至少部分地基于所述经谐波扩展的信号产生第三组子频带。所述第三组子频带对应于所述第二组子频带。所述方法还包含确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数。所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
在另一特定的方面中,设备包含第一滤波器,其经配置以将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带。所述设备还包含经配置以基于第一组子频带产生经谐波扩展的信号的非线性变换产生器。所述设备进一步包含经配置以至少部分地基于所述经谐波扩展的信号产生第三组子频带的第二滤波器。所述第三组子频带对应于所述第二组子频带。所述设备还包含参数估算器,其经配置以确定第三组子频带中的第一子频带的第一调节参数或第三组子频带中的第二子频带的第二调节参数。所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
在另一特定的方面中,非暂时性计算机可读媒体包含指令,当在语音编码器处由处理器执行时所述指令致使所述处理器将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带。还可执行所述指令以致使所述处理器基于第一组子频带产生经谐波扩展的信号。所述指令进一步可经执行以致使所述处理器至少部分地基于所述经谐波扩展的信号产生第三组子频带。所述第三组子频带对应于所述第二组子频带。还可执行所述指令以致使所述处理器确定第三组子频带中的第一子频带的第一调节参数或第三组子频带中的第二子频带的第二调节参数。所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
在另一特定的方面中,设备包含用于将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带的装置。所述设备还包含用于基于所述第一组子频带产生经谐波扩展的信号的装置。所述设备进一步包含用于至少部分地基于所述经谐波扩展的信号产生第三组子频带的装置。所述第三组子频带对应于所述第二组子频带。所述设备还包含用于确定第三组子频带中的第一子频带的第一调节参数或第三组子频带中的第二子频带的第二调节参数的装置。所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
在另一特定的方面中,方法包含在语音解码器处基于低频带激励信号产生经谐波扩展的信号,所述低频带激励信号是由基于线性预测的解码器基于从语音编码器接收的参数产生。所述方法进一步包含至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带。所述方法还包含基于从语音编码器接收的调节参数来调节所述高频带激励子频带组。
在另一特定的方面中,设备包含经配置以基于低频带激励信号产生经谐波扩展的信号的非线性变换产生器,所述低频带激励信号是由基于线性预测的解码器基于从语音编码器接收的参数产生。所述设备进一步包含经配置以至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带的第二滤波器。所述设备还包含经配置以基于从语音编码器接收的调节参数调节所述高频带激励子频带组的调节器。
在另一特定的方面中,设备包含用于基于低频带激励信号产生经谐波扩展的信号的装置,所述低频带激励信号是由基于线性预测的解码器基于从语音编码器接收的参数产生。所述设备进一步包含用于至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带的装置。所述设备还包含用于基于从语音编码器接收的调节参数来调节所述高频带激励子频带组的装置。
在另一特定的方面中,非暂时性计算机可读媒体包含指令,当在语音解码器处由处理器执行时所述指令致使所述处理器基于低频带激励信号产生经谐波扩展的信号,所述低频带激励信号是由基于线性预测的解码器基于从语音编码器接收的参数产生。所述指令进一步可经执行以致使所述处理器至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带。还可执行所述指令以致使所述处理器基于从语音编码器接收的调节参数来调节所述高频带激励子频带组。
由所揭示的实施例中的至少一者提供的特定优点包含音频信号的高频带部分的分辨率改进的建模。本发明的其它方面、优点和特征将在审阅全部申请案之后变得显而易见,申请案包含以下部分:附图说明、具体实施方式和权利要求书。
附图说明
图1为用以说明可操作以执行高频带信号建模的系统的特定实施例的图;
图2为可操作以执行高频带信号建模的系统的另一特定实施例的图;
图3为可操作以执行高频带信号建模的系统的另一特定实施例的图;
图4为可操作以使用调节参数重建音频信号的系统的特定实施例的图;
图5为用于执行高频带信号建模的方法的特定实施例的流程图;
图6为用于使用调节参数重建音频信号的方法的特定实施例的流程图;以及
图7为可操作以执行根据图1到6的系统和方法的信号处理操作的无线装置的框图。
具体实施方式
参考图1,可操作以执行高频带信号建模的系统的特定实施例经展示且大体上指定为100。在特定实施例中,系统100可集成到编码系统或设备中(例如,无线电话或译码器/解码器(CODEC)中)。在其它实施例中,系统100可以集成到机顶盒、音乐播放器、视频播放器、娱乐单元、导航装置、通信装置、PDA、固定位置数据单元或计算机中。
应注意,在以下描述中,将由图1的系统100执行的各种功能描述为由某些组件或模块执行。然而,组件和模块的此划分仅为了说明。在替代实施例中,由特定组件或模块执行的功能可改为划分到多个组件或模块中。此外,在替代实施例中,图1的两个或多于两个组件或模块可集成到单个组件或模块中。图1中所说明的每一组件或模块可使用硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合来实施。
系统100包含经配置以接收输入音频信号102的第一分析滤波器组110(例如,QMF组或伪QMF组)。举例来说,输入音频信号102可由麦克风或其它输入装置提供。在特定实施例中,输入音频信号102可包含语音。输入音频信号102可以是包含在从大致50Hz到大致16kHz的频率范围中的数据的SWB信号。第一分析滤波器组110可基于频率将输入音频信号102滤波成多个部分。举例来说,第一分析滤波器组110可产生第一频率范围内的第一组子频带122和第二频率范围内的第二组子频带124。第一组子频带122可包含M个子频带,其中M为大于零的整数。第二组子频带124可包含N个子频带,其中N为大于一的整数。因此,第一组子频带122可包含至少一个子频带,且第二组子频带124包含两个或多于两个子频带。在特定实施例中,M和N可为类似值。在另一特定实施例中,M和N可为不同值。第一组子频带122和第二组子频带124可具有相等或不相等的带宽,且可重叠或不重叠。在替代实施例中,第一分析滤波器组110可产生多于两个子频带组。
第一频率范围可小于第二频率范围。在图1的实例中,第一组子频带122和第二组子频带124占据不重叠的频带。举例来说,第一组子频带122和第二组子频带124可分别占据50Hz到7kHz和7kHz到16kHz的不重叠的频带。在替代实施例中,第一组子频带122和第二组子频带124可分别占据50Hz到8kHz和8kHz到16kHz的不重叠的频带。在另一替代实施例中,第一组子频带122与第二组子频带124重叠(例如,分别为50Hz到8kHz和7kHz到16kHz),其可使第一分析滤波器组110的低通滤波器和高通滤波器具有平滑滚降,此可简化设计且降低低通滤波器和高通滤波器的成本。使第一组子频带122与第二组子频带124重叠还能够实现在接收器处低频带信号和高频带信号的平滑掺和,此可产生较少可听伪声。
应注意,尽管图1的实例说明SWB信号的处理,但此情形仅用于说明。在替代实施例中,输入音频信号102可为具有大致50Hz到大致8kHz的频率范围的WB信号。在此实施例中,第一组子频带122可对应于大致50Hz到大致6.4kHz的频率范围且第二组子频带124可对应于大致6.4kHz到大致8kHz的频率范围。
系统100可包含经配置以接收第一组子频带122的低频带分析模块130。在特定实施例中,低频带分析模块130可表示码激励线性预测(CELP)编码器的实施例。低频带分析模块130可包含线性预测(LP)分析和译码模块132、线性预测系数(LPC)到LSP变换模块134和量化器136。LSP也可被称作LSF,且所述两个术语(LSP和LSF)在本文中可以可互换地使用。LP分析和译码模块132可将第一组子频带122的频谱包络编码成LPC的集合。可针对音频的每一帧(例如,在16kHz的取样速率下对应于320个样本的20毫秒(ms)的音频)、音频的每一子帧(例如,5ms的音频)或其任何组合产生LPC。可由所执行的LP分析的“阶数”确定针对每一帧或子帧所产生的LPC的数目。在特定实施例中,LP分析和译码模块132可产生对应于第十阶LP分析的十一个LPC的集合。
LPC到LSP变换模块134可将由LP分析和译码模块132产生的LPC的集合变换成对应LSP的集合(例如,使用一对一变换)。或者,LPC的集合可经一对一变换成部分自相关系数(parcorcoefficient)、对数面积比率值、导谱对(ISP)或导谱频(ISF)的对应集合。LPC集合与LSP集合之间的变换可为可逆的而不存在误差。
量化器136可量化由LPC到LSP变换模块134所产生的LSP集合。举例来说,量化器136可包含或耦合到包含多个条目(例如,向量)的多个码本。为了量化LSP集合,量化器136可识别“最接近”(例如,基于例如最小平方或均方误差的失真量度)LSP集合的码本的条目。量化器136可输出对应于码本中所识别条目的位置的索引值或一系列索引值。因此,量化器136的输出表示包含于低频带位流142中的低频带滤波器参数。
低频带分析模块130还可产生低频带激励信号144。举例来说,低频带激励信号144可为经编码的信号,其是通过译码在由低频带分析模块130执行的LP过程期间产生的LP残差信号而产生。
系统100可进一步包含高频带分析模块150,其经配置以从第一分析滤波器组110接收第二组子频带124,且从低频带分析模块130接收低频带激励信号144。高频带分析模块150可基于第二组子频带124和低频带激励信号144产生高频带旁侧信息172。举例来说,高频带旁侧信息172可包含高频带LPC和/或增益信息(例如,调节参数)。
高频带分析模块150可包含非线性变换产生器190。非线性变换产生器190可经配置以基于低频带激励信号144产生经谐波扩展的信号。举例来说,非线性变换产生器190可升取样低频带激励信号144,且可经由非线性函数处理经升取样的信号以产生带宽大于低频带激励信号144的带宽的经谐波扩展的信号。
高频带分析模块150还可包含第二分析滤波器组192。在特定实施例中,第二分析滤波器组192可将所述经谐波扩展的信号分离成多个子频带。在此实施例中,经调制噪声可添加到所述多个子频带的每一子频带以产生对应于第二组子频带124的第三组子频带126(例如,高频带激励信号)。作为非限制性实例,第二组子频带124的第一子频带(H1)可具有在7kHz到8kHz范围内的带宽,且第二组子频带124的第二子频带(H2)可具有在8kHz到9kHz范围内的带宽。类似地,第三组子频带126的第一子频带(未展示)(对应于第一子频带(H1))可具有在7kHz到8kHz范围内的带宽,且第三组子频带126的第二子频带(未展示)(对应于第二子频带(H2))可具有在8kHz到9kHz范围内的带宽。在另一特定实施例中,经调制噪声可与所述经谐波扩展的信号混合以产生提供到第二分析滤波器组192的高频带激励信号。在此实施例中,第二分析滤波器组192可将高频带激励信号分离成第三组子频带126。
高频带分析模块150内的参数估算器194可基于第二组子频带124中的对应子频带的度量确定第三组子频带126中的第一子频带的第一调节参数(例如,LPC调节参数和/或增益调节参数)。举例来说,特定参数估算器可确定第三组子频带126中的第一子频带与输入音频信号102的对应高频带部分(例如,第二组子频带124中的对应子频带)之间的频谱关系和/或包络关系。以类似方式,另一参数估算器可基于第二组子频带124中的对应子频带的度量确定第三组子频带126中的第二子频带的第二调节参数。如本文中所使用,子频带的“度量”可对应于表征所述子频带的任何值。作为非限制性实例,子频带的度量可对应于所述子频带的信号能量、所述子频带的残差能量、所述子频带的LP系数等。
在特定实施例中,参数估算器194可根据第二组子频带124的子频带(例如,输入音频信号102的高频带部分的分量)与第三组子频带126的对应子频带(例如,高频带激励信号的分量)之间的关系计算至少两个增益因数(例如,调节参数)。增益因数可对应于在某一帧内或在所述帧的某一部分内的对应子频带的能量之间的差(或比率)。举例来说,参数估算器194可对于每一子频带计算作为每一子帧的样本的平方的总和的能量,且相应子帧的增益因数可为那些能量的比率的平方根。在另一特定实施例中,参数估算器194可根据第二组子频带124中的子频带与第三组子频带126中的对应子频带之间的时变关系计算增益包络。然而,输入音频信号102的高频带部分(例如,高频带信号)的时间包络和高频带激励信号的时间包络有可能为类似的。
在另一特定实施例中,参数估算器194可包含LP分析和译码模块152和LPC到LSP变换模块154。LP分析和译码模块152和LPC到LSP变换模块154中的每一者可如上文参照低频带分析模块130的对应组件所描述地工作,但在相对降低的分辨率下(例如,对于每一系数、LSP等使用较少位)。LP分析和译码模块152可产生由变换模块154变换到LSP并由量化器156基于码本163量化的LPC的集合。举例来说,LP分析和译码模块152、LPC到LSP变换模块154和量化器156可使用第二组子频带124以确定包含于高频带旁侧信息172中的高频带滤波器信息(例如,高频带LSP或调节参数)和/或高频带增益信息。
量化器156可经配置以将来自参数估算器194的调节参数量化为高频带旁侧信息172。量化器还可经配置以量化由变换模块154提供的例如LSP等频谱频率值的集合。在其它实施例中,量化器156可接收并量化除LSF或LSP外或替代LSF或LSP的一或多个其它类型的频谱频率值的集合。举例来说,量化器156可接收和量化由LP分析和译码模块152产生的LPC的集合。其它实例包含可在量化器156处接收并量化的部分自相关系数、对数面积比率值和ISF的集合。量化器156可包含向量量化器,其将输入向量(例如,呈向量格式的频谱频率值的集合)编码为到表或例如码本163等码本中的对应条目的索引。作为另一实例,量化器156可经配置以确定一或多个参数,可在解码器处,例如在稀疏码本实施例中从所述一或多个参数动态地产生输入向量,而非从存储装置检索输入向量。为了说明,稀疏码本实例可应用于例如CELP等译码方案和根据例如3GPP2(第三代合作伙伴2)EVRC(增强型可变速率编解码器)等业界标准的编解码器中。在另一实施例中,高频带分析模块150可包含量化器156,且可经配置以使用多个码本向量产生合成信号(例如,根据滤波器参数的集合),且选择与合成信号相关联的码本向量中的例如在感知加权域中与第二组子频带124最佳匹配的码本向量。
在特定实施例中,高频带旁侧信息172可包含高频带LSP以及高频带增益参数。举例来说,高频带旁侧信息172可包含由参数估算器194产生的调节参数。
低频带位流142和高频带旁侧信息172可由多路复用器(MUX)170进行多路复用以产生输出位流199。输出位流199可表示对应于输入音频信号102的经编码的音频信号。举例来说,多路复用器170可经配置以将包含于高频带旁侧信息172中的调节参数插入到输入音频信号102的经编码版本中以允许在输入音频信号102的再现期间实现增益调节(例如,基于包络的调节)和/或线性调节(例如,基于频谱的调节)。输出位流199可由发射器198发射(例如,经由有线、无线或光学信道)和/或被存储。在接收器处,反向操作可由分用器(DEMUX)、低频带解码器、高频带解码器和滤波器组执行以产生音频信号(例如,经提供到扬声器或其它输出装置的输入音频信号102的经重建版本)。用于表示低频带位流142的位数可显著大于用于表示高频带旁侧信息172的位数。因此,输出位流199中的大部分位可表示低频带数据。可在接收器处将高频带旁侧信息172用以根据信号模型从低频带数据再生高频带激励信号。举例来说,信号模型可表示低频带数据(例如,第一组子频带122)与高频带数据(例如,第二组子频带124)之间的关系或相关性的预期集合。因此,不同信号模型可用于不同种类的音频数据(例如,语音、音乐等),且在传送经编码音频数据之前可由发射器和接收器协商(或由业界标准定义)所使用的特定信号模型。使用信号模型,发射器处的高频带分析模块150可能够产生高频带旁侧信息172,使得接收器处的对应高频带分析模块能够使用信号模型从输出位流199重建第二组子频带124。
图1的系统100可改进合成的高频带信号分量(例如,第三组子频带126)与初始高频带信号分量(例如,第二组子频带124)之间的相关性。举例来说,可通过在逐个子频带的基础上比较第二组子频带124的度量与第三组子频带126的度量来以“更精细”等级执行合成的高频带信号分量与初始高频带信号分量之间的频谱和包络近似。可基于由所述比较产生的调节参数调节第三组子频带126,且调节参数可发射到解码器以在输入音频信号102的高频带重建期间减小可听伪声。
参考图2,展示可操作以执行高频带信号建模的系统200的特定实施例。系统200包含第一分析滤波器组110、合成滤波器组202、低频带译码器204、非线性变换产生器190、噪声组合器206、第二分析滤波器组192和N个参数估算器294a到294c。
第一分析滤波器组110可接收输入音频信号102且可经配置以基于频率将输入音频信号102滤波成多个部分。举例来说,第一分析滤波器组110可产生低频带频率范围内的第一组子频带122和高频带频率范围内的第二组子频带124。作为非限制性实例,低频带频率范围可从大致0kHz到6.4kHz,且高频带频率范围可从大致6.4kHz到12.8kHz。可将第一组子频带124提供到合成滤波器组202。合成滤波器组202可经配置以通过组合第一组子频带122而产生低频带信号212。可将低频带信号212提供到低频带译码器204。
低频带译码器204可对应于图1的低频带分析模块130。举例来说,低频带译码器204可经配置以量化低频带信号212(例如,第一组子频带122)以产生低频带激励信号144。可将低频带激励信号144提供到非线性变换产生器190。
如参照图1所描述,可使用低频带分析模块130由第一组子频带122(例如,输入音频信号102的低频带部分)产生低频带激励信号144。非线性变换产生器190可经配置以基于低频带激励信号144(例如,第一组子频带122)产生经谐波扩展的信号214(例如,非线性激励信号)。非线性变换产生器190可升取样低频带激励信号144,且可使用非线性函数处理经升取样的信号以产生带宽大于低频带激励信号144的带宽的经谐波扩展的信号214。举例来说,在特定实施例中,低频带激励信号144的带宽可为从大致0到6.4kHz,且所述经谐波扩展的信号214的带宽可为从大致6.4kHz到16kHz。在另一特定实施例中,所述经谐波扩展的信号214的带宽可高于具备相等量值的低频带激励信号的带宽。举例来说,低频带激励信号144的带宽可为从大致0到6.4kHz,且所述经谐波扩展的信号214的带宽可为从大致6.4kHz到12.8kHz。在特定实施例中,非线性变换产生器190可对低频带激励信号144的帧(或子帧)执行绝对值操作或平方操作以产生经谐波扩展的信号214。可将所述经谐波扩展的信号214提供到噪声组合器206。
噪声组合器206可经配置以将所述经谐波扩展的信号214与经调制噪声混合以产生高频带激励信号216。经调制噪声可基于低频带信号212的包络和白噪声。与所述经谐波扩展的信号214混合的经调制噪声的量可基于混合因数。低频带译码器204可产生由噪声组合器206用以确定混合因数的信息。所述信息可包含第一组子频带122中的音调滞后、与第一组子频带122相关联的自适应性码本增益、第一组子频带122与第二组子频带124之间的音调相关性、其任何组合等。举例来说,如果低频带信号212的谐波对应于有声信号(例如,具备相对强有声分量和相对弱类噪声分量的信号),那么混合因数的值可增大且较少量的经调制噪声可与所述经谐波扩展的信号214混合。替代性地,如果低频带信号212的谐波对应于类噪声信号(例如,具备相对强类噪声分量和相对弱有声分量的信号),那么混合因数的值可减小且较大量的经调制噪声可与所述经谐波扩展的信号214混合。可将高频带激励信号216提供到第二分析滤波器组192。
第二滤波器分析滤波器组192可经配置以将高频带激励信号216滤波(例如,分离)成对应于第二组子频带124的第三组子频带126(例如,高频带激励信号)。可将第三组子频带126中的每一子频带(HE1到HEN)提供到对应参数估算器294a到294c。另外,可将第二组子频带124中的每一子频带(H1到HN)提供到对应参数估算器294a到294c。
参数估算器294a到294c可对应于图1的参数估算器194且可以基本上类似的方式操作。举例来说,每一参数估算器294a到294c可基于第二组子频带124中的对应子频带的度量确定第三组子频带126中的对应子频带的调节参数。举例来说,第一参数估算器294a可基于第二组子频带124中第一子频带(H1)的度量确定第三组子频带126中第一子频带(HE1)的第一调节参数(例如,LPC调节参数和/或增益调节参数)。举例来说,第一参数估算器294a可确定第三组子频带126中的第一子频带(HE1)与第二组子频带124中的第一子频带(H1)之间的频谱关系和/或包络关系。为了说明,第一参数估算器294可对第二组子频带124中的第一子频带(H1)执行LP分析以产生第一子频带(H1)的LPC和第一子频带(H1)的残差。可将第一子频带(H1)的残差与第三组子频带126中的第一子频带(HE1)相比较,且第一参数估算器294可确定增益参数,从而使第二组子频带124中第一子频带(H1)的残差的能量与第三组子频带126中第一子频带(HE1)的能量基本上相匹配。作为另一实例,第一参数估算器294可使用第三组子频带126中的第一子频带(HE1)执行合成以产生第二组子频带124中的第一子频带(H1)的合成版本。第一参数估算器294可确定增益参数,使得第二组子频带124中第一子频带(H1)的能量近似于第一子频带(H1)的合成版本的能量。以类似方式,第二参数估算器294b可基于第二组子频带124中第二子频带(H2)的度量确定第三组子频带126中第二子频带(HE2)的第二调节参数。
调节参数可由量化器(例如,图1的量化器156)量化且作为高频带旁侧信息发射。第三组子频带126还可基于调节参数受到调节以用于编码器(例如,系统200)的其它组件(未展示)进行的进一步处理(例如,增益形状调节处理、相位调节处理等)。
图2的系统200可改进合成的高频带信号分量(例如,第三组子频带126)与初始高频带信号分量(例如,第二组子频带124)之间的相关性。举例来说,可通过在逐个子频带的基础上比较第二组子频带124的度量与第三组子频带126的度量来以“更精细”等级执行合成的高频带信号分量与初始高频带信号分量之间的频谱和包络近似。可基于由所述比较产生的调节参数调节第三组子频带126,且调节参数可被发射到解码器以在输入音频信号102的高频带重建期间减小可听伪声。
参考图3,展示可操作以执行高频带信号建模的系统300的特定实施例。系统300包含第一分析滤波器组110、合成滤波器组202、低频带译码器204、非线性变换产生器190、第二分析滤波器组192、N个噪声组合器306a到306c和N个参数估算器294a到294c。
在系统300的操作期间,将经谐波扩展的信号214提供到第二分析滤波器组192(而非图2的噪声组合器206)。第二滤波器分析滤波器组192可经配置以将所述经谐波扩展的信号214滤波(例如,分离)成多个子频带322。可将所述多个子频带322中的每一子频带提供到对应噪声组合器306a到306c。举例来说,可将所述多个子频带322中的第一子频带提供到第一噪声组合器306a;可将所述多个子频带322中的第二子频带提供到第二噪声组合器306b;等。
每一噪声组合器306a到306c可经配置以将所述多个子频带322中的所接收到的子频带与经调制噪声混合以产生第三组子频带126(例如,多个高频带激励信号(HE1到HEN))。举例来说,经调制噪声可基于低频带信号212的包络和白噪声。与所述多个子频带322中的每一子频带混合的经调制噪声的量可基于至少一个混合因数。在特定实施例中,可通过基于第一混合因数混合所述多个子频带322中的第一子频带而产生第三组子频带126中的第一子频带(HE1),且可通过基于第二混合因数混合所述多个子频带322中的第二子频带而产生第三组子频带126中的第二子频带(HE2)。因此,多个(例如,不同)混合因数可用于产生第三组子频带126。
低频带译码器204可产生由每一噪声组合器306a到306c用以确定相应混合因数的信息。举例来说,提供到第一噪声组合器306a以用于确定第一混合因数的信息可包含音调滞后、与第一组子频带122中的第一子频带(L1)相关联的自适应性码本增益、第一组子频带122中的第一子频带(L1)与第二组子频带124中的第一子频带(H1)之间的音调相关性或其任何组合。各个子频带的类似参数可用于确定其它噪声组合器306b、306n的混合因数。在另一实施例中,每一噪声组合器306a到306n可基于共用混合因数执行混合操作。
如参照图2所描述,每一参数估算器294a到294c可基于第二组子频带124中的对应子频带的度量确定第三组子频带126中的对应子频带的调节参数。调节参数可由量化器(例如,图1的量化器156)量化且作为高频带旁侧信息发射。第三组子频带126还可基于调节参数受到调节以用于编码器(例如,系统300)的其它组件(未展示)进行的进一步处理(例如,增益形状调节处理、相位调节处理等)。
图3的系统300可改进合成的高频带信号分量(例如,第三组子频带126)与初始高频带信号分量(例如,第二组子频带124)之间的相关性。举例来说,可通过在逐个子频带的基础上比较第二组子频带124的度量与第三组子频带126的度量来以“更精细”等级执行合成的高频带信号分量与初始高频带信号分量之间的频谱和包络近似。另外,可基于第一组子频带122和第二组子频带124内的对应子频带的特性(例如,音调值)产生第三组子频带126中的每一子频带(例如,高频带激励信号)以改进信号估算。可基于由所述比较产生的调节参数调节第三组子频带126,且调节参数可发射到解码器以在输入音频信号102的高频带重建期间减小可听伪声。
参考图4,展示可操作以使用调节参数重建音频信号的系统400的特定实施例。系统400包含非线性变换产生器490、噪声组合器406、分析滤波器组492和N个调节器494a到494c。在特定实施例中,系统400可以集成到解码系统或设备中(例如,在无线电话或CODEC中)。在其它特定实施例中,系统400可以集成到机顶盒、音乐播放器、视频播放器、娱乐单元、导航装置、通信装置、PDA、固定位置数据单元或计算机中。
非线性变换产生器490可经配置以基于作为位流199中的低频带位流142的一部分接收到的低频带激励信号144产生经谐波扩展的信号414(例如,非线性激励信号)。所述经谐波扩展的信号414可对应于图1到3的经谐波扩展的信号214的经重建版本。举例来说,非线性变换产生器490可以与图1到3的非线性变换产生器190基本上类似的方式操作。在说明性实施例中,可将所述经谐波扩展的信号414以如参照图2所描述的类似方式提供到噪声组合器406。在另一特定实施例中,可将所述经谐波扩展的信号414以如参照图3所描述的类似方式提供到分析滤波器组492。
噪声组合器406可接收低频带位流142且产生混合因数,如参照图2的噪声组合器206或图3的噪声组合器306a到306c所描述。替代性地,噪声组合器406可接收包含在编码器(例如,图1到3的系统100到300)处所产生的混合因数的高频带旁侧信息172。在说明性实施例中,噪声组合器406可基于混合因数将变换低频带激励信号414与经调制噪声混合以产生高频带激励信号416(例如,图2的高频带激励信号216的经重建版本)。举例来说,噪声组合器406可以与图2的噪声组合器206基本上类似的方式操作。在说明性实施例中,可将高频带激励信号416提供到分析滤波器组492。
在说明性实施例中,分析滤波器组492可经配置以将高频带激励信号416滤波(例如,分离)成一组高频带激励子频带426(例如,图1到3的第三组子频带126的经重建版本)。举例来说,分析滤波器组492可以与如参照图2所描述的第二分析滤波器组192基本上类似的方式操作。可将所述组高频带激励子频带426提供到对应调节器494a到494c。
在另一实施例中,分析滤波器组492可经配置成以与如参照图3所描述的第二分析滤波器组192类似的方式将经谐波扩展的信号414滤波成多个子频带(未展示)。在此实施例中,多个噪声组合器(未展示)可以与图3的噪声组合器394a到394c类似的方式将多个子频带中的每一子频带与经调制噪声进行组合(基于作为高频带旁侧信息发射的混合因数)以产生高频带激励子频带组426。可将高频带激励子频带组426中的每一子频带提供到对应调节器494a到494c。
每一调节器494a到494c可接收由图1的参数估算器194产生的作为高频带旁侧信息172的对应调节参数。每一调节器494a到494c还可接收高频带激励子频带组426中的对应子频带。调节器494a到494c可经配置以基于调节参数产生经调节的一组高频带激励子频带424。可将经调节的高频带激励子频带组424提供到系统400的其它组件(未展示)以供进一步处理(例如,LP合成、增益形状调节处理、相位调节处理等),从而重建图1到3的第二组子频带124。
图4的系统400可使用图1的低频带位流142和调节参数(例如,图1的高频带旁侧信息172)重建第二组子频带124。通过在逐个子频带的基础上执行对高频带激励信号416的调节,使用调节参数可改进重建的准确度(例如,产生经微调的重建)。
参考图5,展示用于执行高频带信号建模的方法500的特定实施例的流程图。作为说明性实例,方法500可由图1到3的系统100到300中的一或多者执行。
在502处,方法500可包含在语音编码器处将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带。举例来说,参考图1,第一分析滤波器组110可将输入音频信号102滤波成第一频率范围内的第一组子频带122和第二频率范围内的第二组子频带124。第一频率范围可低于第二频率范围。
在504处,可基于第一组子频带产生经谐波扩展的信号。举例来说,参考图2到3,合成滤波器组202可通过组合第一组子频带122产生低频带信号212,且低频带译码器204可对低频带信号212进行编码以产生低频带激励信号144。可将低频带激励信号144提供到非线性变换产生器407。非线性变换产生器190可升取样低频带激励信号144以基于低频带激励信号144(例如,第一组子频带122)产生经谐波扩展的信号214(例如,非线性激励信号)。
在506处,可至少部分地基于所述经谐波扩展的信号产生第三组子频带。举例来说,参考图2,所述经谐波扩展的信号214可与经调制噪声混合以产生高频带激励信号216。第二滤波器分析滤波器组192可将高频带激励信号216滤波(例如,分离)成对应于第二组子频带124的第三组子频带126(例如,高频带激励信号)。替代性地,参考图3,将经谐波扩展的信号214提供到第二分析滤波器组192。第二滤波器分析滤波器组192可将经谐波扩展的信号214滤波(例如,分离)成多个子频带322。可将所述多个子频带322中的每一子频带提供到对应噪声组合器306a到306c。举例来说,可将所述多个子频带322中的第一子频带提供到第一噪声组合器306a;可将所述多个子频带322中的第二子频带提供到第二噪声组合器306b;等。每一噪声组合器306a到306c可将所述多个子频带322中的所接收到的子频带与经调制噪声混合以产生第三组子频带126。
在508处,可确定第三组子频带中第一子频带的第一调节参数,或可确定第三组子频带中第二子频带的第二调节参数。举例来说,参考图2到3,第一参数估算器294a可基于第二组子频带124中对应子频带(H1)的度量(例如,信号能量、残差能量、LP系数等)确定第三组子频带126中第一子频带(HE1)的第一调节参数(例如,LPC调节参数和/或增益调节参数)。第一参数估算器294a可根据第一子频带(HE1)与第一子频带(H1)之间的关系计算第一增益因数(例如,第一调节参数)。增益因数可对应于在某一帧内或在所述帧的某一部分内子频带(H1、HE1)的能量之间的差(或比率)。以类似方式,其它参数估算器294b到294c可基于第二组子频带124中第二子频带(H2)的度量(例如,信号能量、残差能量、LP系数等)确定第三组子频带126中第二子频带(HE2)的第二调节参数。
图5的方法500可改进合成的高频带信号分量(例如,第三组子频带126)与初始高频带信号分量(例如,第二组子频带124)之间的相关性。举例来说,可通过在逐个子频带的基础上比较第二组子频带124的度量与第三组子频带126的度量来以“更精细”等级执行合成的高频带信号分量与初始高频带信号分量之间的频谱和包络近似。可基于由所述比较产生的调节参数调节第三组子频带126,且调节参数可被发射到解码器以在输入音频信号102的高频带重建期间减小可听伪声。
参考图6,展示用于使用调节参数重建音频信号的方法600的特定实施例的流程图。作为说明性实例,方法600可由图4的系统400执行。
在602处,方法600包含基于从语音编码器接收的低频带激励信号产生经谐波扩展的信号。举例来说,参考图4,可将低频带激励信号444提供到非线性变换产生器490以基于低频带激励信号444产生经谐波扩展的信号414(例如,非线性激励信号)。
在606处,可至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带。举例来说,参考图4,噪声组合器406可基于音调滞后、自适应性码本增益和/或频带之间的音调相关性确定混合因数,如参照图4所描述;或可接收包含在编码器(例如,图1到3的系统100到300)处所产生的混合因数的高频带旁侧信息172。噪声组合器406可基于混合因数将变换低频带激励信号414与经调制噪声混合以产生高频带激励信号416(例如,图2的高频带激励信号216的经重建版本)。分析滤波器组492可将高频带激励信号416滤波(例如,分离)成一组高频带激励子频带426(例如,图1到3的第三组子频带126的经重建版本)。
在608处,可基于从语音编码器接收的调节参数调节高频带激励子频带组。举例来说,参考图4,每一调节器494a到494c可接收由图1的参数估算器194产生的作为高频带旁侧信息172的对应调节参数。每一调节器494a到494c还可接收高频带激励子频带组426中的对应子频带。调节器494a到494c可基于调节参数产生经调节的高频带激励子频带组424。可将经调节的高频带激励子频带组424提供到系统400的其它组件(未展示)以供进一步处理(例如,增益形状调节处理、相位调节处理等),从而重建图1到3的第二组子频带124。
图6的方法600可使用图1的低频带位流142和调节参数(例如,图1的高频带旁侧信息172)重建第二组子频带124。通过在逐个子频带的基础上执行对高频带激励信号416的调节,使用调节参数可改进重建的准确度(例如,产生经微调的重建)。
在特定实施例中,图5到6的方法500、600可经由处理单元(例如,中央处理单元(CPU)、DSP或控制器)的硬件(例如,FPGA装置、ASIC等);经由固件装置或其任何组合实施。作为实例,可由执行指令的处理器执行图5到6的方法500、600,如参照图7所描述。
参考图7,描绘无线通信装置的特定说明性实施例的框图,且将其大体上指定为700。装置700包含耦合到存储器732的处理器710(例如,CPU)。存储器732可包含可由处理器710和/或CODEC734执行以执行本文中所揭示的方法和过程(例如,图5到6的方法500、600中的一者或两者)的指令760。
在特定实施例中,CODEC734可包含编码系统782和解码系统784。在特定实施例中,编码系统782包含图1到3的系统100到300的一或多个组件。举例来说,编码系统782可执行与图1到3的系统100到300和图5的方法500相关联的编码操作。在特定实施例中,解码系统784可包含图4的系统400的一或多个组件。举例来说,解码系统784可执行与图4的系统400和图6的方法600相关联的解码操作。
编码系统782和/或解码系统784可经由专用硬件(例如,电路);通过执行指令以执行一或多个任务的处理器;或其组合实施。作为实例,存储器732或CODEC734中的存储器790可为存储器装置,例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋力矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动的磁盘或压缩光盘只读存储器(CD-ROM)。存储器装置可包含指令(例如,指令760或指令785),当由计算机(例如,CODEC734中的处理器和/或处理器710)执行时所述指令可致使计算机执行图5到6的方法500、600中的一个方法的至少一部分。作为实例,存储器732或CODEC734中的存储器790可为非暂时性计算机可读媒体,其包含指令(例如,分别为指令760或指令795),当由计算机(例如,CODEC734中的处理器和/或处理器710)执行时所述指令致使计算机执行图5到6的方法500、600中的一个方法的至少一部分。
装置700还可包含耦合到CODEC734且耦合到处理器710的DSP796。在特定实施例中,DSP796可包含编码系统797和解码系统798。在特定实施例中,编码系统797包含图1到3的系统100到300的一或多个组件。举例来说,编码系统797可执行与图1到3的系统100到300和图5的方法500相关联的编码操作。在特定实施例中,解码系统798可包含图4的系统400的一或多个组件。举例来说,解码系统798可执行与图4的系统400和图6的方法600相关联的解码操作。
图7还展示耦合到处理器710且耦合到显示器728的显示控制器726。CODEC734可耦合到处理器710,如所示。扬声器736和麦克风738可耦合到CODEC734。举例来说,麦克风738可产生图1的输入音频信号102,且CODEC734可基于输入音频信号102产生输出位流199以供发射到接收器。举例来说,输出位流199可经由处理器710、无线控制器740和天线742发射到接收器。作为另一实例,扬声器736可用于输出由CODEC734从图1的输出位流199重建的信号,其中输出位流199是从发射器接收(例如,经由无线控制器740和天线742)。
在特定实施例中,处理器710、显示控制器726、存储器732、CODEC734和无线控制器740包含于系统级封装或系统单芯片装置(例如,移动台调制解调器(MSM))722中。在特定实施例中,输入装置730(例如触摸屏和/或小键盘)和电源744耦合到系统单芯片装置722。此外,在特定实施例中,如图7中所说明,显示器728、输入装置730、扬声器736、麦克风738、天线742和电源744在系统单芯片装置722外部。然而,显示器728、输入装置730、扬声器736、麦克风738、天线742和电源744中的每一者可耦合到系统单芯片装置722的组件,例如接口或控制器。
结合所描述实施例,揭示第一设备,其包含用于将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带的装置。举例来说,用于滤波音频信号的装置可包含图1到3的第一分析滤波器组110、图7的编码系统782、图7的编码系统797、经配置以滤波音频信号的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
第一设备还可包含用于基于第一组子频带产生经谐波扩展的信号的装置。举例来说,用于产生经谐波扩展的信号的装置可包含图1的低频带分析模块130和其组件、图1到3的非线性变换产生器190、图2到3的合成滤波器组202、图2到3的低频带译码器204、图7的编码系统782、图7的编码系统797、经配置以产生经谐波扩展的信号的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
第一设备还可包含用于至少部分地基于经谐波扩展的信号产生第三组子频带的装置。举例来说,用于产生第三组子频带的装置可包含图1的高频带分析模块150和其组件、图1到3的第二分析滤波器组192、图2的噪声组合器206、图3的噪声组合器306a到306c、图7的编码系统782、经配置以产生第三组子频带的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
第一设备还可包含用于确定第三组子频带中第一子频带的第一调节参数或第三组子频带中第二子频带的第二调节参数的装置。举例来说,用于确定第一调节参数和第二调节参数的装置可包含图1的参数估算器194、图2的参数估算器294a到294c、图7的编码系统782、图7的编码系统797、经配置以确定第一调节参数和第二调节参数的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
结合所描述实施例,揭示第二设备,其包含用于基于从语音编码器接收的低频带激励信号产生经谐波扩展的信号的装置。举例来说,用于产生经谐波扩展的信号的装置可包含图4的非线性变换产生器490、图7的解码系统784、图7的解码系统798、经配置以产生经谐波扩展的信号的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
第二设备还可包含用于至少部分地基于经谐波扩展的信号产生一组高频带激励子频带的装置。举例来说,用于产生高频带激励子频带组的装置可包含图4的噪声组合器406、图4的分析滤波器组492、图7的解码系统784、图7的解码系统798、经配置以产生高频带激励信号组的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
第二设备还可包含用于基于从语音编码器接收的调节参数来调节高频带激励子频带组的装置。举例来说,用于调节高频带激励子频带组的装置可包含图4的调节器494a到494c、图7的解码系统784、图7的解码系统798、经配置以调节高频带激励子频带组的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
所属领域的技术人员将进一步了解,结合本文中所揭示的实施例所描述的各种说明性逻辑块、配置、模块、电路和算法步骤可实施为电子硬件、由例如硬件处理器等处理装置执行的计算机软件或两者的组合。上文已大体在其功能性方面描述各种说明性组件、块、配置、模块、电路和步骤。此类功能性是实施为硬件还是可执行软件取决于特定应用和施加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施决策不应被解释为引起偏离本发明的范围。
结合本文中所揭示的实施例而描述的方法或算法的步骤可直接体现于硬件、由处理器执行的软件模块或两者的组合中。软件模块可驻留于存储器装置中,所述存储器装置例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋力矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可移动的磁盘或压缩光盘只读存储器(CD-ROM)。例示性存储器装置耦合到处理器,使得处理器可从存储器装置读取信息并将信息写入到存储器装置。在替代方案中,存储器装置可与处理器集成。处理器和存储媒体可驻留在ASIC中。ASIC可驻留在计算装置或用户终端中。在替代方案中,处理器与存储媒体可作为离散组件驻留在计算装置或用户终端中。
提供对所揭示实施例的先前描述以使所属领域的技术人员能够制作或使用所揭示实施例。对于所属领域的技术人员来说,对这些实施例的各种修改将为易于显而易见的,且可在不偏离本发明的范围的情况下将本文中所定义的原理应用于其它实施例。因此,本发明并不意图限于本文中所展示的实施例,而是将赋予本发明与如由所附权利要求书定义的原理和新颖特征一致的可能的最广范围。
Claims (41)
1.一种方法,其包括:
在语音编码器处将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带;
基于所述第一组子频带和非线性处理函数产生经谐波扩展的信号;
至少部分地基于所述经谐波扩展的信号产生第三组子频带,其中所述第三组子频带对应于所述第二组子频带;以及
确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数,其中所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且其中所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
2.根据权利要求1所述的方法,其中所述第一调节参数和所述第二调节参数对应于增益调节参数。
3.根据权利要求1所述的方法,其中所述第一调节参数和所述第二调节参数对应于线性预测系数调节参数。
4.根据权利要求1所述的方法,其中所述第一调节参数和所述第二调节参数对应于时变包络调节参数。
5.根据权利要求1所述的方法,其进一步包括将所述第一调节参数和所述第二调节参数插入到所述音频信号的经编码版本中以允许在从所述音频信号的所述经编码版本重建所述音频信号期间实现调节。
6.根据权利要求1所述的方法,其进一步包括将所述第一调节参数和所述第二调节参数作为位流的部分发射到语音解码器。
7.根据权利要求1所述的方法,其中所述第一频率范围跨越在数值上低于所述第二频率范围的频率。
8.根据权利要求1所述的方法,其中产生所述第三组子频带包括:
将所述经谐波扩展的信号与经调制噪声混合以产生高频带激励信号,其中所述经调制噪声和所述经谐波扩展的信号基于混合因数混合;以及
将所述高频带激励信号滤波成所述第三组子频带。
9.根据权利要求8所述的方法,其中基于音调滞后、与所述第一组子频带相关联的自适应性码本增益、所述第一组子频带与所述第二组子频带之间的音调相关性当中的至少一个来确定所述混合因数。
10.根据权利要求1所述的方法,其中产生所述第三组子频带包括:
将所述经谐波扩展的信号滤波成多个子频带;以及
将所述多个子频带中的每一子频带与经调制噪声混合以产生多个高频带激励信号,其中所述多个高频带激励信号对应于所述第三组子频带。
11.根据权利要求10所述的方法,其中所述经调制噪声和所述多个子频带中的第一子频带基于第一混合因数混合,且其中所述经调制噪声和所述多个子频带中的第二子频带基于第二混合因数混合。
12.一种设备,其包括:
第一滤波器,其经配置以将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带;
非线性变换产生器,其经配置以基于所述第一组子频带和非线性处理函数产生经谐波扩展的信号;
第二滤波器,其经配置以至少部分地基于所述经谐波扩展的信号产生第三组子频带,其中所述第三组子频带对应于所述第二组子频带;以及
参数估算器,其经配置以确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数,其中所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且其中所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
13.根据权利要求12所述的设备,其中所述第一调节参数和所述第二调节参数对应于增益调节参数。
14.根据权利要求12所述的设备,其中所述第一调节参数和所述第二调节参数对应于线性预测系数调节参数。
15.根据权利要求12所述的设备,其中所述第一调节参数和所述第二调节参数对应于时变包络调节参数。
16.根据权利要求12所述的设备,其进一步包括多路复用器,所述多路复用器经配置以将所述第一调节参数和所述第二调节参数插入到所述音频信号的经编码版本中以允许在从所述音频信号的所述经编码版本重建所述音频信号期间实现调节。
17.根据权利要求12所述的设备,其进一步包括将所述第一调节参数和所述第二调节参数作为位流的部分发射到语音解码器的发射器。
18.根据权利要求12所述的设备,其中所述第一频率范围跨越在数值上低于所述第二频率范围的频率。
19.根据权利要求12所述的设备,其中产生所述第三组子频带包括:
将所述经谐波扩展的信号与经调制噪声混合以产生高频带激励信号,其中所述经调制噪声和所述经谐波扩展的信号基于混合因数混合;以及
将所述高频带激励信号滤波成所述第三组子频带。
20.根据权利要求19所述的设备,其中基于音调滞后、与所述第一组子频带相关联的自适应性码本增益、和所述第一组子频带与所述第二组子频带之间的音调相关性当中的至少一个来确定所述混合因数。
21.根据权利要求12所述的设备,其中产生所述第三组子频带包括:
将所述经谐波扩展的信号滤波成多个子频带;以及
将所述多个子频带中的每一子频带与经调制噪声混合以产生多个高频带激励信号,其中所述多个高频带激励信号对应于所述第三组子频带。
22.根据权利要求21所述的设备,其中所述经调制噪声和所述多个子频带中的第一子频带基于第一混合因数混合,且其中所述经调制噪声和所述多个子频带中的第二子频带基于第二混合因数混合。
23.一种包括指令的非暂时性计算机可读媒体,在语音编码器处在由处理器执行时所述指令使所述处理器:
将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带;
基于所述第一组子频带和非线性处理函数产生经谐波扩展的信号;
至少部分地基于所述经谐波扩展的信号产生第三组子频带,其中所述第三组子频带对应于所述第二组子频带;以及
确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数,其中所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且其中所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
24.根据权利要求23所述的非暂时性计算机可读媒体,其中所述第一调节参数和所述第二调节参数对应于增益调节参数。
25.根据权利要求23所述的非暂时性计算机可读媒体,其中所述第一调节参数和所述第二调节参数对应于线性预测系数调节参数。
26.根据权利要求23所述的非暂时性计算机可读媒体,其中所述第一调节参数和所述第二调节参数对应于时变包络调节参数。
27.根据权利要求23所述的非暂时性计算机可读媒体,其进一步包括指令,在由所述处理器执行时所述指令使所述处理器将所述第一调节参数和所述第二调节参数插入到所述音频信号的经编码版本中以允许在从所述音频信号的所述经编码版本重建所述音频信号期间实现调节。
28.根据权利要求23所述的非暂时性计算机可读媒体,其中将所述第一调节参数和所述第二调节参数作为位流的部分发射到语音解码器。
29.一种设备,其包括:
用于将音频信号滤波成第一频率范围内的第一组子频带和第二频率范围内的第二组子频带的装置;
用于基于所述第一组子频带和非线性处理函数产生经谐波扩展的信号的装置;
用于至少部分地基于所述经谐波扩展的信号产生第三组子频带的装置,其中所述第三组子频带对应于所述第二组子频带;以及
用于确定所述第三组子频带中的第一子频带的第一调节参数或所述第三组子频带中的第二子频带的第二调节参数的装置,其中所述第一调节参数是基于所述第二组子频带中的第一子频带的度量,且其中所述第二调节参数是基于所述第二组子频带中的第二子频带的度量。
30.根据权利要求29所述的设备,其中所述第一调节参数和所述第二调节参数对应于增益调节参数。
31.根据权利要求29所述的设备,其中所述第一调节参数和所述第二调节参数对应于线性预测系数调节参数。
32.根据权利要求29所述的设备,其中所述第一调节参数和所述第二调节参数对应于时变包络调节参数。
33.根据权利要求29所述的设备,其进一步包括用于将所述第一调节参数和所述第二调节参数插入到所述音频信号的经编码版本中以允许在从所述音频信号的所述经编码版本重建所述音频信号期间实现调节的装置。
34.根据权利要求29所述的设备,其进一步包括用于将所述第一调节参数和所述第二调节参数作为位流的部分发射到语音解码器的装置。
35.一种方法,其包括:
在语音解码器处基于低频带激励信号产生经谐波扩展的信号,其中所述低频带激励信号由基于线性预测的解码器基于从语音编码器接收的参数产生;
至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带;以及
基于从所述语音编码器接收的调节参数来调节所述组高频带激励子频带。
36.根据权利要求35所述的方法,其中所述调节参数包含增益调节参数、线性预测系数调节参数、时变包络调节参数或其组合。
37.一种设备,其包括:
非线性变换产生器,其经配置以基于低频带激励信号产生经谐波扩展的信号,其中所述低频带激励信号由基于线性预测的解码器基于从语音编码器接收的参数产生;
第二滤波器,其经配置以至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带;以及
调节器,其经配置以基于从所述语音编码器接收的调节参数来调节所述组高频带激励子频带。
38.根据权利要求37所述的设备,其中所述调节参数包含增益调节参数、线性预测系数调节参数、时变包络调节参数或其组合。
39.一种设备,其包括:
用于基于低频带激励信号产生经谐波扩展的信号的装置,其中所述低频带激励信号由基于线性预测的解码器基于从语音编码器接收的参数产生;
用于至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带的装置;以及
用于基于从所述语音编码器接收的调节参数来调节所述组高频带激励子频带的装置。
40.根据权利要求39所述的设备,其中所述调节参数包含增益调节参数、线性预测系数调节参数、时变包络调节参数或其组合。
41.一种包括指令的非暂时性计算机可读媒体,在语音解码器处在由处理器执行时所述指令使所述处理器:
基于低频带激励信号产生经谐波扩展的信号,其中所述低频带激励信号由基于线性预测的解码器基于从语音编码器接收的参数产生;
至少部分地基于所述经谐波扩展的信号产生一组高频带激励子频带;以及
基于从所述语音编码器接收的调节参数来调节所述组高频带激励子频带。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010353901.4A CN111583955B (zh) | 2013-12-16 | 2014-12-15 | 高频带信号建模 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361916697P | 2013-12-16 | 2013-12-16 | |
US61/916,697 | 2013-12-16 | ||
US14/568,359 US10163447B2 (en) | 2013-12-16 | 2014-12-12 | High-band signal modeling |
US14/568,359 | 2014-12-12 | ||
PCT/US2014/070268 WO2015095008A1 (en) | 2013-12-16 | 2014-12-15 | High-band signal modeling |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010353901.4A Division CN111583955B (zh) | 2013-12-16 | 2014-12-15 | 高频带信号建模 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105830153A true CN105830153A (zh) | 2016-08-03 |
CN105830153B CN105830153B (zh) | 2020-05-22 |
Family
ID=53369248
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480067799.4A Active CN105830153B (zh) | 2013-12-16 | 2014-12-15 | 高频带信号建模 |
CN202010353901.4A Active CN111583955B (zh) | 2013-12-16 | 2014-12-15 | 高频带信号建模 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010353901.4A Active CN111583955B (zh) | 2013-12-16 | 2014-12-15 | 高频带信号建模 |
Country Status (9)
Country | Link |
---|---|
US (1) | US10163447B2 (zh) |
EP (2) | EP3084762A1 (zh) |
JP (1) | JP6526704B2 (zh) |
KR (2) | KR102304152B1 (zh) |
CN (2) | CN105830153B (zh) |
BR (1) | BR112016013771B1 (zh) |
CA (1) | CA2929564C (zh) |
ES (1) | ES2844231T3 (zh) |
WO (1) | WO2015095008A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328153A (zh) * | 2016-08-24 | 2017-01-11 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
CN109804430A (zh) * | 2016-10-13 | 2019-05-24 | 高通股份有限公司 | 参数音频解码 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
US9984699B2 (en) | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
DE102017105043A1 (de) * | 2017-03-09 | 2018-09-13 | Valeo Schalter Und Sensoren Gmbh | Verfahren zum Bestimmen eines Funktionszustands eines Ultraschallsensors mittels einer Übertragungsfunktion des Ultraschallsensors, Ultraschallsensorvorrichtung sowie Kraftfahrzeug |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
EP3576088A1 (en) * | 2018-05-30 | 2019-12-04 | Fraunhofer Gesellschaft zur Förderung der Angewand | Audio similarity evaluator, audio encoder, methods and computer program |
GB2576769A (en) * | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US20060277038A1 (en) * | 2005-04-01 | 2006-12-07 | Qualcomm Incorporated | Systems, methods, and apparatus for highband excitation generation |
US20070282599A1 (en) * | 2006-06-03 | 2007-12-06 | Choo Ki-Hyun | Method and apparatus to encode and/or decode signal using bandwidth extension technology |
CN101184979A (zh) * | 2005-04-01 | 2008-05-21 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
US20080120118A1 (en) * | 2006-11-17 | 2008-05-22 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding high frequency signal |
US20080120117A1 (en) * | 2006-11-17 | 2008-05-22 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
CN101192409A (zh) * | 2006-11-21 | 2008-06-04 | 华为技术有限公司 | 选择自适应码本激励信号的方法和装置 |
CN103155033A (zh) * | 2010-07-19 | 2013-06-12 | 杜比国际公司 | 高频重建期间的音频信号处理 |
CN103262164A (zh) * | 2010-09-16 | 2013-08-21 | 杜比国际公司 | 叉积增强的基于子带块的谐波换位 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62234435A (ja) * | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
US6141638A (en) | 1998-05-28 | 2000-10-31 | Motorola, Inc. | Method and apparatus for coding an information signal |
US7117146B2 (en) | 1998-08-24 | 2006-10-03 | Mindspeed Technologies, Inc. | System for improved use of pitch enhancement with subcodebooks |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
GB2342829B (en) | 1998-10-13 | 2003-03-26 | Nokia Mobile Phones Ltd | Postfilter |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6449313B1 (en) | 1999-04-28 | 2002-09-10 | Lucent Technologies Inc. | Shaped fixed codebook search for celp speech coding |
US6704701B1 (en) | 1999-07-02 | 2004-03-09 | Mindspeed Technologies, Inc. | Bi-directional pitch enhancement in speech coding systems |
WO2001059766A1 (en) | 2000-02-11 | 2001-08-16 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
WO2002023536A2 (en) | 2000-09-15 | 2002-03-21 | Conexant Systems, Inc. | Formant emphasis in celp speech coding |
US6766289B2 (en) | 2001-06-04 | 2004-07-20 | Qualcomm Incorporated | Fast code-vector searching |
JP3457293B2 (ja) | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US6993207B1 (en) | 2001-10-05 | 2006-01-31 | Micron Technology, Inc. | Method and apparatus for electronic image processing |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7047188B2 (en) | 2002-11-08 | 2006-05-16 | Motorola, Inc. | Method and apparatus for improvement coding of the subframe gain in a speech coding system |
US7788091B2 (en) | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
JP2006197391A (ja) | 2005-01-14 | 2006-07-27 | Toshiba Corp | 音声ミクシング処理装置及び音声ミクシング処理方法 |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
EP1979901B1 (de) * | 2006-01-31 | 2015-10-14 | Unify GmbH & Co. KG | Verfahren und anordnungen zur audiosignalkodierung |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US9009032B2 (en) | 2006-11-09 | 2015-04-14 | Broadcom Corporation | Method and system for performing sample rate conversion |
KR101375582B1 (ko) * | 2006-11-17 | 2014-03-20 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
EP2096631A4 (en) | 2006-12-13 | 2012-07-25 | Panasonic Corp | TONE DECODING DEVICE AND POWER ADJUSTMENT METHOD |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8484020B2 (en) | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
EP2502229B1 (en) | 2009-11-19 | 2017-08-09 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
WO2012158157A1 (en) | 2011-05-16 | 2012-11-22 | Google Inc. | Method for super-wideband noise supression |
CN102802112B (zh) | 2011-05-24 | 2014-08-13 | 鸿富锦精密工业(深圳)有限公司 | 具有音频文件格式转换功能的电子装置 |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
-
2014
- 2014-12-12 US US14/568,359 patent/US10163447B2/en active Active
- 2014-12-15 ES ES18206593T patent/ES2844231T3/es active Active
- 2014-12-15 WO PCT/US2014/070268 patent/WO2015095008A1/en active Application Filing
- 2014-12-15 BR BR112016013771-0A patent/BR112016013771B1/pt active IP Right Grant
- 2014-12-15 KR KR1020167016998A patent/KR102304152B1/ko active IP Right Grant
- 2014-12-15 EP EP14824286.0A patent/EP3084762A1/en not_active Withdrawn
- 2014-12-15 JP JP2016558544A patent/JP6526704B2/ja active Active
- 2014-12-15 CN CN201480067799.4A patent/CN105830153B/zh active Active
- 2014-12-15 CA CA2929564A patent/CA2929564C/en active Active
- 2014-12-15 EP EP18206593.8A patent/EP3471098B1/en active Active
- 2014-12-15 CN CN202010353901.4A patent/CN111583955B/zh active Active
- 2014-12-15 KR KR1020217029315A patent/KR102424755B1/ko active IP Right Grant
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US20060277038A1 (en) * | 2005-04-01 | 2006-12-07 | Qualcomm Incorporated | Systems, methods, and apparatus for highband excitation generation |
CN101184979A (zh) * | 2005-04-01 | 2008-05-21 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
US20070282599A1 (en) * | 2006-06-03 | 2007-12-06 | Choo Ki-Hyun | Method and apparatus to encode and/or decode signal using bandwidth extension technology |
US20080120118A1 (en) * | 2006-11-17 | 2008-05-22 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding high frequency signal |
US20080120117A1 (en) * | 2006-11-17 | 2008-05-22 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
CN101192409A (zh) * | 2006-11-21 | 2008-06-04 | 华为技术有限公司 | 选择自适应码本激励信号的方法和装置 |
CN103155033A (zh) * | 2010-07-19 | 2013-06-12 | 杜比国际公司 | 高频重建期间的音频信号处理 |
CN103262164A (zh) * | 2010-09-16 | 2013-08-21 | 杜比国际公司 | 叉积增强的基于子带块的谐波换位 |
Non-Patent Citations (1)
Title |
---|
V. KRISHNAN ET AL.: "EVRC-Wideband: The New 3GPP2 Wideband Vocoder Standard", 《2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING - ICASSP》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106328153A (zh) * | 2016-08-24 | 2017-01-11 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
CN106328153B (zh) * | 2016-08-24 | 2020-05-08 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
CN109804430A (zh) * | 2016-10-13 | 2019-05-24 | 高通股份有限公司 | 参数音频解码 |
CN109804430B (zh) * | 2016-10-13 | 2023-05-12 | 高通股份有限公司 | 参数音频解码 |
Also Published As
Publication number | Publication date |
---|---|
EP3471098A1 (en) | 2019-04-17 |
KR102304152B1 (ko) | 2021-09-17 |
CA2929564C (en) | 2022-10-04 |
CA2929564A1 (en) | 2015-06-25 |
EP3471098B1 (en) | 2020-10-14 |
KR20210116698A (ko) | 2021-09-27 |
BR112016013771B1 (pt) | 2021-12-21 |
JP6526704B2 (ja) | 2019-06-05 |
US20150170662A1 (en) | 2015-06-18 |
CN111583955A (zh) | 2020-08-25 |
WO2015095008A1 (en) | 2015-06-25 |
US10163447B2 (en) | 2018-12-25 |
KR102424755B1 (ko) | 2022-07-22 |
CN105830153B (zh) | 2020-05-22 |
EP3084762A1 (en) | 2016-10-26 |
JP2016541032A (ja) | 2016-12-28 |
ES2844231T3 (es) | 2021-07-21 |
BR112016013771A2 (pt) | 2017-08-08 |
KR20160098285A (ko) | 2016-08-18 |
CN111583955B (zh) | 2023-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105830153A (zh) | 高频带信号建模 | |
CN105637583B (zh) | 自适应带宽扩展方法及其装置 | |
US9899032B2 (en) | Systems and methods of performing gain adjustment | |
CN105765655A (zh) | 高频带译码中的选择性相位补偿 | |
CN105612578B (zh) | 用于信号处理的方法和设备 | |
US9620134B2 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
CN106165012B (zh) | 使用多个子频带的高频带信号译码 | |
JP2016541032A5 (zh) | ||
CN107112027A (zh) | 增益形状电路的按比例缩放 | |
AU2014331903A1 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |