CN104969291A - 执行用于增益确定的滤波的系统及方法 - Google Patents
执行用于增益确定的滤波的系统及方法 Download PDFInfo
- Publication number
- CN104969291A CN104969291A CN201380071701.8A CN201380071701A CN104969291A CN 104969291 A CN104969291 A CN 104969291A CN 201380071701 A CN201380071701 A CN 201380071701A CN 104969291 A CN104969291 A CN 104969291A
- Authority
- CN
- China
- Prior art keywords
- frequency band
- filtering
- sound signal
- high frequency
- lsp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Abstract
一种特定方法包含基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定所述音频信号包含对应于伪声产生条件的分量。所述方法还包含对所述音频信号的所述高频带部分进行滤波及产生经编码信号。产生所述经编码信号包含基于对应于经滤波高频带输出的第一能量与对应于所述低频带部分的第二能量的比率确定增益信息以减小所述伪声产生条件的可听见效果。
Description
相关申请案的交叉参考
本申请案主张来自共同拥有的2013年2月8号申请的第61/762,807号美国临时专利申请案及2013年8月5号申请的第13/959,188号美国非临时专利申请案的优先权,所述申请案的内容全文以引用的方式明确地并入本文中。
技术领域
本发明通常涉及信号处理。
背景技术
技术的进步已经带来更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线计算装置,例如便携式无线电话、个人数字助理(PDA)和寻呼装置,其体积小,重量轻且易于由用户携带。更具体来说,例如蜂窝式电话和因特网协议(IP)电话等便携式无线电话可经由无线网络传送语音和数据包。此外,许多此类无线电话包含并入其中的其它类型的装置。举例来说,无线电话还可包含数字静态相机、数码摄像机、数字记录器,和音频文件播放器。
在传统电话系统(例如,公共交换电话网络(PSTN))中,信号带宽限于300赫兹(Hz)到3.4千赫兹(kHz)的频率范围。在例如蜂窝式电话及因特网语音通信协议(VoIP)等宽带(WB)应用中,信号带宽可横跨50Hz到7kHz的频率范围。超宽带(SWB)译码技术支持延展到16kHz左右的带宽。将信号带宽从3.4kHz的窄带电话延展到16kHz的SWB电话可改进信号重建的质量、可懂度及自然度。
SWB译码技术通常涉及编码及发射信号的较低频率部分(例如,50Hz到7kHz,也被称为“低频带”)。举例来说,可使用滤波器参数及/或低频带激励信号表示低频带。然而,为了改进译码效率,可不完全编码及发射信号的较高频率部分(例如,7kHz到16kHz,也被称为“高频带”)。替代地,接收器可利用信号建模以预测高频带。在一些实施方案中,可将与高频带相关联的数据提供到接收器以辅助预测。此数据可被称为“辅助信息”,且可包含增益信息、线谱频率(LSF,也被称作线谱对(LSP))等。在低频带信号与高频带信号充分相关时,使用信号模型的高频带预测的准确度可被接受。然而,在存在噪声的情况下,低频带与高频带之间的相关可为弱的,且信号模型可不再能够准确地表示高频带。此情形可导致接收器处的伪声(例如,经变形话音)。
发明内容
揭示执行音频译码系统中的用于增益确定的音频信号的条件滤波的系统及方法。所描述的技术包含确定经编码以用于发射的音频信号是否包含可在重建音频信号之后产生可听见伪声的分量(例如,噪声)。举例来说,底层信号模型可将噪声解译为话音数据,所述话音数据可导致音频信号的错误重建。根据所描述的技术,在存在伪声诱发分量的情况下,可对音频信号的高频带部分执行条件滤波,且经滤波高频带输出可用以产生用于高频带部分的增益信息。基于经滤波高频带输出的增益信息可导致在接收器处重建音频信号之后减小的可听见伪声。
在特定实施例中,一种方法包含基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量。所述方法还包含对音频信号的高频带部分进行滤波以产生经滤波高频带输出。所述方法进一步包含产生经编码信号。产生经编码信号包含基于对应于经滤波高频带输出的第一能量与对应于低频带部分的第二能量的比率确定增益信息以减小伪声产生条件的可听见效果。
在特定实施例中,一种方法包含将与音频信号的帧相关联的跨线谱对(LSP)间距与至少一个阈值进行比较。所述方法还包含至少部分基于比较对音频信号的高频带部分进行条件滤波以产生经滤波高频带输出。所述方法包含基于对应于经滤波高频带输出的第一能量与对应于音频信号的低频带部分的第二能量的比率确定增益信息。
在另一特定实施例中,一种设备包含噪声检测电路,其经配置以基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量。所述设备包含滤波电路,所述滤波电路对噪声检测电路作出响应,且经配置以对音频信号的高频带部分进行滤波以产生经滤波高频带输出。所述设备还包含增益确定电路,所述增益确定电路经配置以基于对应于经滤波高频带输出的第一能量与对应于低频带部分的第二能量的比率确定增益信息以减小伪声产生条件的可听见效果。
在另一特定实施例中,一种设备包含用于基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量的装置。所述设备还包含用于对音频信号的高频带部分进行滤波以产生经滤波高频带输出的装置。所述设备包含用于产生经编码信号的装置。用于产生经编码信号的装置包含用于基于对应于经滤波高频带输出的第一能量与对应于低频带部分的第二能量的比率确定增益信息以减小伪声产生条件的可听见效果的装置。
在另一特定实施例中,一种非暂时性计算机可读媒体包含若干指令,所述指令在由计算机执行时致使计算机基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量,以对音频信号的高频带部分进行滤波以产生经滤波高频带输出,且产生经编码信号。产生经编码信号包含基于对应于经滤波高频带输出的第一能量与对应于低频带部分的第二能量的比率确定增益信息以减小伪声产生条件的可听见效果。
由所揭示的实施例中的至少一者提供的特定优势包含检测伪声诱发分量(例如,噪声)且响应于检测到此些伪声诱发分量而选择性地执行滤波以影响增益信息的能力,此举可产生接收器处的更准确信号重建及较少可听见伪声。本发明的其它方面、优点及特征将在审阅全部申请案之后变得显而易见,所述全部申请案包含以下部分:附图说明、具体实施方式及权利要求书。
附图说明
图1为用以说明可操作以执行滤波的系统的特定实施例的图;
图2为用以说明伪声诱发分量、包含伪声的对应经重建信号及不包含伪声的对应经重建信号的实例的图;
图3为用以说明自适应加权因子(γ)与线谱对(LSP)间距之间的映射的特定实施例的曲线图;
图4为用以说明可操作以执行滤波的系统的另一特定实施例的图;
图5为用以说明执行滤波的方法的特定实施例的流程图;
图6为用以说明执行滤波的方法的另一特定实施例的流程图;
图7为用以说明执行滤波的方法的另一特定实施例的流程图;及
图8为根据图1到7的系统及方法的可操作以执行信号处理操作的无线装置的框图。
具体实施方式
参看图1,可操作以执行滤波的系统的特定实施例经展示且通常经指定为100。在特定实施例中,系统100可集成到编码系统或设备中(例如,无线电话或译码器/解码器(CODEC)中)。
应注意,在以下描述中,将由图1的系统100执行的各种功能经描述为由某些组件或模块执行。然而,组件及模块的此划分是仅用于说明。在替代实施例中,由特定组件或模块执行的功能可改为在多个组件或模块之中划分。此外,在替代实施例中,图1的两个或两个以上组件或模块可集成到单个组件或模块中。图1中说明的每一组件或模块可使用硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合来实施。
系统100包含经配置以接收输入音频信号102的分析滤波器组110。举例来说,输入音频信号102可由麦克风或其它输入装置提供。在特定实施例中,输入音频信号102可包含话音。输入音频信号可为超宽带(SWB)信号,所述SWB信号包含在从约50赫兹(Hz)到约16千赫兹(kHz)的频率范围中的数据。分析滤波器组110可基于频率将输入音频信号102滤波成多个部分。举例来说,分析滤波器组110可产生低频带信号122及高频带信号124。低频带信号122及高频带信号124可具有相等或不相等带宽,且可重叠或不重叠。在替代实施例中,分析滤波器组110可产生两个以上输出。
低频带信号122及高频带信号124可占用非重叠频带。举例来说,低频带信号122及高频带信号124可占用50Hz-7kHz及7kHz-16kHz的非重叠频带。在替代实施例中,低频带信号122及高频带信号124可占用50Hz-8kHz及8kHz-16kHz的非重叠频带。在又一替代实施例中,低频带信号122及高频带信号124重叠(例如,50Hz-8kHz及7kHz-16kHz),其可使分析滤波器组110的低通滤波器及高通滤波器具有平滑滚降,其可简化设计且减少低通滤波器及高通滤波器的成本。重叠低频带信号122及高频带信号124还可允许实现接收器处低频带及高频带信号的平滑掺合,此情形可导致更少可听见伪声。
应注意尽管图1的实例说明SWB信号的处理,但此情形仅用于说明。在替代实施例中,输入音频信号102可为具有约50Hz到约8kHz的频率范围的宽带(WB)信号。在此类实施例中,低频带信号122可对应于约50Hz到约6.4kHz的频率范围,且高频带信号124可对应于约6.4kHz到约8kHz的频率范围。还应注意本文中的各种系统及方法经描述为检测高频带噪声及响应于高频带噪声而执行各种操作。然而,此情形仅作为实例。参看图1到7所说明的技术也可在低频带噪声的情况下执行。
系统100可包含经配置以接收低频带信号122的低频带分析模块130。在特定实施例中,低频带分析模块130可表示码激励线性预测(CELP)编码器的实施例。低频带分析模块130可包含线性预测(LP)分析及译码模块132、线性预测系数(LPC)到线谱对(LSP)变换模块134及量化器136。LSP也可被称作线谱频率(LSF),且所述两个术语在本文中可互换地使用。LP分析及译码模块132可将低频带信号122的频谱包络编码为一组LPC。对于音频的每一帧(例如,对应于16kHz的取样速率的320个样本的20毫秒(ms)音频)、音频的每一子帧(例如,5ms音频)或其任何组合可产生LPC。可由所执行的LP分析的“级数”确定每一帧或子帧所产生的LPC的数目。在特定实施例中,LP分析及译码模块132可产生对应于第十级LP分析的十一个LPC的集合。
LPC到LSP变换模块134可将由LP分析及译码模块132所产生的LPC的集合变换成对应LSP集合(例如,使用一对一变换)。或者,LPC的集合可经一对一变换成部分自相关系数、对数面积比率值、导谱对(ISP)或导谱频(ISF)的对应集合。LPC集合与LSP集合之间的变换可为可逆的而不存在误差。
量化器136可量化由变换模块134产生的LSP集合。举例来说,量化器136可包含或耦合到包含多个项(例如,向量)的多个码簿。为量化LSP集合,量化器136可识别“最接近”(例如,基于例如均方误差的最小平方等失真测量)LSP集合的码簿的项。量化器136可输出对应于码簿中所识别项的位置的索引值或一系列索引值。因此,量化器136的输出可表示包含于低频带位流142中的低频带滤波器参数。
低频带分析模块130还可产生低频带激励信号144。举例来说,低频带激励信号144可为通过量化LP残余信号产生的经编码信号,在由低频带分析模块130执行的LP过程期间产生所述LP残余信号。LP残余信号可表示预测误差。
系统100可进一步包含高频带分析模块150,所述高频带分析模块经配置以接收来自分析滤波器组110的高频带信号124及来自低频带分析模块130的低频带激励信号144。高频带分析模块150可基于高频带信号124、低频带激励信号144或高频带经滤波输出168中的一或多者产生高频带辅助信息172,诸如关于图4所更详细描述。举例来说,高频带辅助信息172可包含高频带LSP及/或增益信息(例如,至少基于高频带能量与低频带能量的比率),如本文进一步描述。
高频带分析模块150可包含高频带激励产生器160。高频带激励产生器160可通过将低频带激励信号144的频谱延展到高频带频率范围(例如,7kHz到16kHz)中而产生高频带激励信号。为了进行说明,高频带激励产生器160可将变换应用于低频带激励信号(例如,例如绝对值或平方运算等非线性变换),且可将经变换低频带激励信号与噪声信号(例如,根据对应于低频带激励信号144的包络调制的白噪声)混合以产生高频带激励信号。高频带激励信号可由高频带增益确定模块162使用以确定包含于高频带辅助信息172中的一或多个高频带增益参数。
高频带分析模块150还可包含LP分析及译码模块152、LPC到LSP变换模块154及量化器156。LP分析及译码模块152、变换模块154及量化器156中的每一者可如上文参考低频带分析模块130的对应组件所描述般起作用,但分辨率相对减小(例如,对于每一系数使用较少位、LSP等)。在另一实例实施例中,高频带LSP量化器156可使用标量量化,其中使用预定义位数个别地量化LSP系数的子集。举例来说,LP分析及译码模块152、变换模块154及量化器156可使用高频带信号124来确定包含于高频带辅助信息172中的高频带滤波器信息(例如,高频带LSP)。在特定实施例中,高频带辅助信息172可包含高频带LSP以及高频带增益参数。
低频带位流142及高频带辅助信息172可由多路复用器(MUX)180进行多路复用以产生输出位流192。输出位流192可表示对应于输入音频信号102的经编码音频信号。举例来说,可发射(例如,经由有线、无线或光学通道)及/或存储输出位流192。在接收器处,反向操作可由多路分用器(DEMUX)、低频带解码器、高频带解码器及滤波器组执行以产生音频信号(例如,经提供到扬声器或其它输出装置的输入音频信号102的经重建版本)。用以表示低频带位流142的位数可实质上大于用以表示高频带辅助信息172的位数。因此,输出位流192中的大部分位表示低频带数据。可在接收器处使用高频带辅助信息172以根据信号模型从低频带数据再生高频带激励信号。举例来说,信号模型可表示低频带数据(例如,低频带信号122)与高频带数据(例如,高频带信号124)之间的关系或相关的预期集合。因此,对于不同类别的音频数据(例如,话音、音乐等)可使用不同信号模型,且在使用中的特定信号模型可在传达经编码音频数据之前由发射器及接收器协商(或由工业标准定义)。使用信号模型,在发射器处的高频带分析模块150可能够产生高频带辅助信息172以使得在接收器处的对应高频带分析模块能够使用信号模型从输出位流192重建高频带信号124。
然而,在存在噪声的情况下,在接收器处的高频带合成可导致明显的伪声,因为低频带与高频带之间的不充分相关可致使底层信号模型在可靠信号重建中次最佳地执行。举例来说,信号模型可将高频带中的噪声分量不正确地解译为话音,且可因此致使产生增益参数,所述增益参数试图在接收器处复制噪声,从而导致明显的伪声。此些伪声产生条件的实例包含(但不限于)高频噪声,例如汽车喇叭及刺耳的刹车。为了进行说明,图2中的第一频谱图210说明具有对应于伪声产生条件的分量的音频信号,所述音频信号经说明为具有相对大的信号能量的高频带噪声。第二频谱图220说明归因于增益参数的过高估计的在经重构信号中的所得伪声。
为了减小此些伪声,高频带分析模块150可执行条件高频带滤波。举例来说,高频带分析模块150可包含伪声诱发分量检测模块158,所述伪声诱发分量检测模块经配置以检测可能在再现之后产生可听见伪声的伪声诱发分量,例如,图2的第一频谱图210中所示的伪声诱发分量。在存在此些分量的情况下,滤波模块166可执行高频带信号124的滤波以使伪声产生分量衰减。对高频带信号124进行滤波可根据图2的第三频谱图230产生经重构信号,所述经重构信号不含(或具有程度减小的)图2的第二频谱图220中所示的伪声。
可执行一或多个测试以评估音频信号是否包含伪声产生条件。举例来说,第一测试可包含将在LSP集合(例如,音频信号的特定帧的LSP)中检测的最小跨LSP间距与第一阈值进行比较。LSP之间的小间距对应于相对窄的频率范围处的相对强的信号。在特定实施例中,在确定高频带信号124产生具有小于第一阈值的最小跨LSP间距的帧时,确定伪声产生条件存在于音频信号中,且对于帧来说可启用滤波。
作为另一实例,第二测试可包含将多个连续帧的平均最小跨LSP间距与第二阈值进行比较。举例来说,在音频信号的特定帧具有大于第一阈值但小于第二阈值的最小LSP间距时,如果多个帧的平均最小跨LSP间距(例如,包含特定帧的最近四个帧的最小跨LSP间距的加权平均值)小于第三阈值,那么仍可确定存在伪声产生条件。结果,对于特定帧来说可启用滤波。
作为另一实例,第三测试可包含确定特定帧是否在音频信号的经滤波帧之后。如果特定帧在经滤波帧之后,那么对于特定帧来说可基于小于第二阈值的特定帧的最小跨LSP间距而启用滤波。
出于说明性目的描述三个测试。可响应于满足测试(或测试的组合)中的任何一或多者或响应于满足一或多个其它测试或条件而启用帧的滤波。举例来说,特定实施例可包含确定是否基于例如上文所描述的第一测试等单个测试启用滤波,而不应用第二测试或第三测试中的任一者。替代实施例可包含确定是否基于第二测试启用滤波,而不应用第一测试或第三测试中的任一者,或是否基于第三测试启用滤波,而不应用第一测试或第二测试中的任一者。作为另一实例,特定实施例可包含确定是否基于例如第一测试及第二测试等两个测试启用滤波,而不应用第三测试。替代实施例可包含确定是否基于第一测试及第三测试启用滤波,而不应用第二测试,或是否基于第二测试及第三测试启用滤波而不应用第一测试。
在特定实施例中,伪声诱发分量检测模块158可从音频信号确定参数以确定音频信号是否包含将产生可听见伪声的分量。此些参数的实例包含最小跨LSP间距及平均最小跨LSP间距。举例来说,第十级LP过程可产生经变换成十个LSP的十一个LPC的集合。伪声诱发分量检测模块158可针对音频的特定帧确定十个LSP中的任何两者之间的最小(minimum)(例如,最小(smallest))间距。通常,例如汽车喇叭及刺耳的刹车等急剧及突然噪声产生紧密地间隔开的LSP(例如,第一频谱图210中的“强”13kHz噪声分量可由12.95kHz及13.05kHz处的LSP紧密包围)。伪声诱发分量检测模块158可确定最小跨LSP间距及平均最小跨LSP间距,如下文C++风格的伪码中所示,所述伪码可由伪声诱发分量检测模块158执行或实施。
lsp_spacing=0.5;//默认最小LSP间距
LPC_ORDER=10;//所执行的线性预测性译码的级数
for(i=0;i<LPC_ORDER;i++)
{/*按照下文,估计跨LSP间距,即,第i系数与第(i-1)LSP系数之间的LSP距离
*/
lsp_spacing=min(lsp_spacing,(i==0?lsp_shb[0]:(lsp_shb[i]-lsp_shb[i-1])));
}
伪声诱发分量检测模块158可进一步根据下文伪码确定加权平均最小跨LSP间距。下文伪码还包含响应于模式转变复位跨LSP间距。此些模式转变可出现于支持音乐及/或话音的多个编码模式的装置中。举例来说,装置可使用用于话音的代数CELP(ACELP)模式及音频译码模式,即,用于音乐型信号的通用信号译码(GSC)。或者,在某些低速率情形中,装置可基于特征参数(例如,音值、音调漂移、发声等)确定可使用ACELP/GSC/经修改离散余弦变换(MDCT)模式。
/*在模式转变期间(即,在上一帧的译码模式不同于当前帧的译码模式时)的LSP间距复位*/
THR1=0.008;
if(last_mode!=current_mode&&lsp_spacing<THR1)
{
lsp_shb_spacing[0]=lsp_spacing;
lsp_shb_spacing[1]=lsp_spacing;
lsp_shb_spacing[2]=lsp_spacing;
prevPreFilter=TRUE;
}
/*计算当前帧及三个先前帧内的加权平均值LSP间距*/
WGHT1=0.1;WGHT2=0.2;WGHT3=0.3;WGHT4=0.4;
Average_lsp_shb_spacing=WGHT1*lsp_shb_spacing[0]+
WGHT2*lsp_shb_spacing[1]+
WGHT3*lsp_shb_spacing[2]+
WGHT4*lsp_spacing;
/*更新过去lsp间距缓冲器*/
lsp_shb_spacing[0]=lsp_shb_spacing[1];
lsp_shb_spacing[1]=lsp_shb_spacing[2];
lsp_shb_spacing[2]=lsp_spacing;
在确定最小跨LSP间距及平均最小跨LSP间距之后,伪声诱发分量检测模块158可根据下文伪码将所确定的值与一或多个阈值进行比较,以确定伪声诱发噪声是否存在于音频帧中。在伪声诱发噪声存在时,伪声诱发分量检测模块158可致使滤波模块166执行高频带信号124的滤波。
THR1=0.008;THR2=0.0032,THR3=0.005;
PreFilter=FALSE;
/*检查下文条件且启用滤波参数
如果LSP间距极小,那么存在伪声诱发噪声存在的高可信度。*/
if(lsp_spacing<=THR2||
(lsp_spacing<THR1&&(Average_lsp_shb_spacing<THR3||
prevPreFilter==TRUE)))
{
prevPreFilter=TRUE;
}
/*更新将用于下一帧中的先前帧增益衰减旗标*/
prevPreFilter=PreFilter;
在特定实施例中,条件滤波模块166可在检测伪声诱发噪声时选择性地执行滤波。滤波模块166可在确定高频带辅助信息172的一或多个增益参数之前对高频带信号124进行滤波。举例来说,滤波可包含有限脉冲响应(FIR)滤波。在特定实施例中,可使用来自LP分析及译码模块152的自适应高频带LPC 164执行滤波,且所述滤波可产生-频带经滤波输出168。高频带经滤波输出168可用以产生高频带辅助信息172的至少一部分。
在特定实施例中,可根据滤波等式执行滤波:
其中ai为高频带LPC,L为LPC级数(例如,10),且γ(伽马)为加权参数。在特定实施例中,加权参数γ可具有恒定值。在其它实施例中,加权参数γ可为自适应的,且可基于跨LSP间距来确定。举例来说,可从由图3的曲线图300说明的γ到跨LSP间距的线性映射确定加权参数γ的值。如图3中所展示,在跨LSP间距很窄时,γ可为小的(例如,等于0.0001),从而导致高频带的频谱白化或更强滤波。然而,如果跨LSP为大的,那么γ也可为大的(例如,几乎等于1),从而导致几乎不会滤波。在特定实施例中,图3的映射可基于例如伪声显著的取样率及频率、信噪比(SNR)、LP分析之后的预测增益等一或多个因子自适应。
图1的系统100因此可执行滤波以减小或防止归因于输入信号中的噪声的可听见伪声。图1的系统100因此可在存在伪声产生噪声分量(其并未由话音译码信号模型进行说明)的情况下使得能够更准确地再现音频信号。
图4说明经配置以对高频带信号进行滤波的系统400的实施例。系统400包含图1的LP分析及译码模块152、LPC到LSP变换模块154、量化器156、伪声诱发分量检测模块158及滤波模块166。系统400进一步包含合成滤波器402、帧增益计算器404及时间增益计算器406。在特定实施例中,帧增益计算器404及时间增益计算器406为图1的增益确定模块162的组件。
在LP分析及译码模块152处接收高频带信号124(例如,图1的输入信号102的高频带部分),且LP分析及译码模块152产生高频带LPC 164,如关于图1所描述。在LPC到LSP变换模块154处将高频带LPC 164转换成LSP,且在量化器156处量化LSP以产生高频带滤波器参数450(例如,经量化LSP)。
合成滤波器402用以基于低频带激励信号144及高频带LPC 164模拟高频带信号的解码。举例来说,低频带激励信号144可经变换且在高频带激励产生器160处与经调制噪声信号混合,以产生高频带激励信号440。高频带激励信号440作为输入经提供到合成滤波器402,所述合成滤波器根据高频带LPC 164配置以产生经合成高频带信号442。尽管合成滤波器402经说明为接收高频带LPC 164,但在其它实施例中,由LPC到LSP变换模块154输出的LSP可经变换回到LPC,且经提供到合成滤波器402。或者,量化器156的输出可未经量化,经变换回到LPC,且被提供到合成滤波器402,以更准确地模拟在接收装置处出现的LPC的再现。
虽然传统上可将经合成高频带信号442与高频带信号124相比较以产生用于高频带辅助信息的增益信息,但在高频带信号124包含伪声产生分量时,增益信息可用以借助于使用选择性地经滤波高频带信号446使伪声产生分量衰减。
为了进行说明,滤波模块166可经配置以从伪声诱发分量检测模块158接收控制信号444。举例来说,控制信号444可包含对应于最小检测到的跨LSP间距的值,且滤波模块166可基于最小检测到的跨LSP间距选择性地应用滤波以产生经滤波高频带输出作为选择性地经滤波高频带信号446。作为另一实例,滤波模块166可使用跨LSP间距的值应用滤波以产生经滤波高频带输出作为选择性地经滤波高频带信号446以确定加权因子γ的值(例如根据图3中说明的映射)。结果,在高频带信号124中检测到伪声产生噪声分量时,选择性地及/或自适应地经滤波高频带信号446与高频带信号124相比较可具有减小的信号能量。
选择性地及/或自适应地经滤波高频带信号446可在帧增益计算器404处与经合成高频带信号442相比较及/或与图1的低频带信号122相比较。帧增益计算器404可基于比较产生高频带帧增益信息454(例如,能量值的经编码或经量化比率,例如对应于经滤波高频带输出的第一能量与对应于低频带信号的第二能量的比率)以使得接收器能够调整帧增益以在高频带信号124的重建期间更仔细地再现经滤波高频带信号446。通过在确定高频带帧增益信息之前对高频带信号124进行滤波,可使归因于高频带信号124中的噪声的伪声的可听见效果衰减或将其去除。
也可将经合成高频带信号442提供到时间增益计算器406。时间增益计算器406可确定对应于经合成高频带信号的能量及/或对应于图1的低频带信号122的能量与对应于经滤波高频带信号446的能量的比率。比率可经编码(例如,经量化)及经提供为对应于子帧增益估计的高频带时间增益信息452。高频带时间增益信息可使得接收器能够调整高频带增益以更仔细地再现输入音频信号的高频带到低频带能量比率。
高频带滤波器参数450、高频带时间增益信息452及高频带帧增益信息454可共同对应于图1的高频带辅助信息172。例如高频带帧增益信息454等一些辅助信息可至少部分基于经滤波信号446,且至少部分基于经合成高频带信号442。一些辅助信息可不受滤波的影响。如图4中所说明,滤波器166的经滤波高频带输出可仅用于确定增益信息。为了进行说明,选择性地经滤波高频带信号466仅被提供到高频带增益确定模块162,且不会提供到LP分析及译码模块152以用于编码。结果,LSP(例如,高频带滤波器参数450)至少部分基于高频带信号124而产生,且可不受滤波影响。
参看图5,执行滤波的方法的特定实施例的流程图经展示及通常经指定为500。在说明性实施例中,可在图1的系统100或图4的系统400处执行方法500。
方法500可包含在502处接收待再现的音频信号(例如,话音译码信号模型)。在特定实施例中,音频信号可具有从约50Hz到约16kHz的带宽,且可包含话音。举例来说,在图1中,分析滤波器组110可接收用以在接收器处再现的输入音频信号102。
方法500可包含在504处基于对应于音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量。可响应于跨LSP间距小于第一阈值(例如对应于图1的伪码中的“THR2”)确定音频信号包含对应于伪声产生条件的分量。可基于与帧相关联的跨LSP间距及与音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距确定平均跨LSP间距。可响应于跨LSP间距小于第二阈值及以下各者中的至少一者确定音频信号包含对应于伪声产生条件的分量:平均跨LSP间距小于第三阈值或启用对应于音频信号的另一帧的增益衰减,另一帧在音频信号的帧之前。
方法500包含在506处对音频信号进行滤波。举例来说,音频信号可包含低频带部分及高频带部分,例如图1的低频带信号122及高频带信号124。对音频信号进行滤波可包含对高频带部分进行滤波。可使用与音频信号的高频带部分相关联的自适应线性预测系数(LPC)对音频信号进行滤波以产生高频带经滤波输出。举例来说,LPC可与如关于图1所描述的加权参数γ结合使用。
作为实例,可将与音频信号的帧相关联的跨线谱对(LSP)间距确定为对应于在帧的线性预测性译码(LPC)期间产生的多个LSP的多个跨LSP间距中的最小者。方法500可包含基于跨LSP间距确定自适应加权因子,且使用自适应加权因子执行滤波。举例来说,可将自适应加权因子应用于高频带线性预测系数,例如通过将项(1-γ)i应用于线性预测系数ai,如关于图1所描述的滤波器等式所描述。
可根据将跨LSP间距值与自适应加权因子的值相关联的映射(例如图3中说明)来确定自适应加权因子。映射可为线性映射以使得一系列跨LSP间距值与一系列加权因子值之间存在线性关系。或者,映射可为非线性的。映射可为静态(例如,图3的映射可应用于所有操作条件之下)或可为自适应的(例如,图3的映射可基于操作条件而变化)。举例来说,映射可基于取样率或对应于伪声产生条件的频率中的至少一者自适应。作为另一实例,映射可基于信噪比自适应。作为另一实例,映射可基于线性预测分析之后的预测增益自适应。
方法500可包含在508处基于滤波产生经编码信号,以减小伪声产生条件的可听见效果。方法500在510处结束。
方法500可由图1的系统100或图4的系统400执行。举例来说,可在分析滤波器组110处接收输入音频信号102,且可在分析滤波器组110处产生低频带部分及高频带部分。低频带分析模块130可基于低频带部分产生低频带位流142。高频带分析模块150可基于高频带部分124、与低频带部分相关联的低频带激励信号144或高频带经滤波输出168中的至少一者产生高频带辅助信息172。MUX 180可对低频带位流142及高频带辅助信息172进行多路复用以产生对应于经编码信号的输出位流192。
为了进行说明,图1的高频带辅助信息172可包含至少部分基于高频带经滤波输出168及高频带部分产生的帧增益信息,例如关于图4的高频带帧增益信息454所描述。高频带辅助信息172可进一步包含对应于子帧增益估计的时间增益信息。可至少部分基于高频带部分124及高频带经滤波输出168产生时间增益信息,例如关于图4的高频带时间增益信息452所描述。高频带辅助信息172可包含至少部分基于高频带部分124产生的线谱对(LSP),例如关于图4的高频带滤波器参数450所描述。
在特定实施例中,图5的方法500可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等),经由固件装置或其任何组合来实施。作为实例,图5的方法500可由执行指令的处理器执行,如关于图8所描述。
参考图6,执行滤波的方法的特定实施例的流程图经展示及通常经指定为600。在说明性实施例中,可在图1的系统100或图4的系统400处执行方法600。
在602处将与音频信号的帧相关联的跨线谱对(LSP)间距与至少一个阈值相比较,且在604处可至少部分基于比较的结果对音频信号进行滤波。尽管将跨LSP间距与至少一个阈值进行比较可指示音频信号中的伪声产生分量的存在,但所述比较不一定指示、检测或需要伪声产生分量的实际存在。举例来说,在比较中使用的一或多个阈值可设定为提供在伪声产生分量存在于音频信号中时执行增益控制的增加可能性,同时还提供在伪声产生分量不存在于音频信号中(例如,‘误肯定’)的情况下执行滤波的增加的可能性。因此,方法600可在不确定伪声产生分量是否存在于音频信号中的情况下执行滤波。
可将与音频信号的帧相关联的跨线谱对(LSP)间距确定为对应于在帧的线性预测性译码(LPC)期间产生的多个LSP的多个跨LSP间距中的最小者。可响应于跨LSP间距小于第一阈值对音频信号进行滤波。作为另一实例,可响应于跨LSP间距小于第二阈值及以下各者中的至少一者对音频信号进行滤波:平均跨LSP间距小于第三阈值,平均跨LSP间距基于与帧相关联的跨LSP间距及与音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距,或启用对应于音频信号的另一帧的滤波,另一帧在音频信号的帧之前。
对音频信号进行滤波可包含使用与音频信号的高频带部分相关联的自适应线性预测系数(LPC)对音频信号进行滤波以产生高频带经滤波输出。可使用自适应加权因子执行滤波。举例来说,可基于跨LSP间距(例如关于图3所描述的自适应加权因子γ)确定自适应加权因子。为了进行说明,可根据将跨LSP间距值与自适应加权因子的值相关联的映射确定自适应加权因子。对音频信号进行滤波可包含将自适应加权因子应用于高频带线性预测系数,例如通过将项(1-γ)i应用于线性预测系数ai,如关于图1的滤波器等式所描述。
在特定实施例中,图6的方法600可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等),经由固件装置或其任何组合实施。作为实例,图6的方法600可由执行指令的处理器执行,如关于图8所描述。
参看图7,执行滤波的方法的另一特定实施例的流程图经展示及通常经指定为700。在说明性实施例中,可在图1的系统100或图4的系统400处执行方法700。
方法700可包含在702处确定与音频信号的帧相关联的跨LSP间距。跨LSP间距可为对应于在帧的线性预测性译码期间产生的多个LSP的多个跨LSP间距中的最小者。举例来说,可如所说明参考对应于图1的伪码中的“lsp_spacing”变量来确定跨LSP间距。
方法700还可包含在704处基于与帧相关联的跨LSP间距及与音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距确定平均跨LSP间距。举例来说,可如所说明参考对应于图1的伪码中的“Average_lsp_shb_spacing”变量来确定平均跨LSP间距。
方法700可包含在706处确定跨LSP间距是否小于第一阈值。举例来说,在图1的伪码中,第一阈值可为“THR2”=0.0032。在跨LSP间距小于第一阈值时,方法700可包含在708处启用滤波,且可在714处结束。
在跨LSP间距不低于第一阈值时,方法700可包含在710处确定跨LSP间距是否小于第二阈值。举例来说,在图1的伪码中,第二阈值可为“THR1”=0.008。在跨LSP间距不低于第二阈值时,方法700可在714处结束。在跨LSP间距小于第二阈值时,方法700可包含在712处确定平均跨LSP间距是否小于第三阈值,或帧是否表示模式转变(或以其它方式与其相关联),或是否对先前帧执行滤波。举例来说,在图1的伪码中,第三阈值可为“THR3”=0.005。在平均跨LSP间距小于第三阈值或帧表示模式转变或对先前帧执行滤波时,方法700在708处启用滤波,且接着在714处结束。在平均跨LSP间距不低于第三阈值且帧不表示模式转变且不对先前帧执行滤波时,方法700可在714处结束。
在特定实施例中,图7的方法700可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等),经由固件装置或其任何组合实施。作为实例,图7的方法700可由执行指令的处理器执行,如关于图8所描述。
参看图8,无线通信装置的特定说明性实施例的框图经描绘且通常经指定为800。装置800包含耦合到存储器832的处理器810(例如,中央处理单元(CPU)、数字信号处理器(DSP)等)。存储器832可包含可由处理器810及/或译码器/解码器(CODEC)834执行以执行本文中所揭示的方法及过程(例如图5到7的方法)的指令860。
CODEC 834可包含滤波系统874。在特定实施例中,滤波系统874可包含图1的系统100的一或多个组件。滤波系统874可经由专用硬件(例如,电路),由执行指令以执行一或多个任务的处理器或其组合来实施。作为实例,存储器832或CODEC 834中的存储器可为存储器装置,例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可装卸式磁盘或压缩光盘只读存储器(CD-ROM)。存储器装置可包含若干指令(例如,指令860),所述指令在由计算机(例如,CODEC 834中的处理器及/或处理器810)执行时致使计算机基于对应于音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量,对音频信号进行滤波,且基于滤波产生经编码信号。作为实例,存储器832或CODEC 834中的存储器可为包含指令(例如,指令860)的非暂时性计算机可读媒体,所述指令在由计算机(例如,CODEC 834中的处理器及/或处理器810)执行时致使计算机将与音频信号的帧相关联的跨线谱对(LSP)间距与至少一个阈值进行比较,且至少部分基于比较对音频信号进行滤波。
图8还展示耦合到处理器810及耦合到显示器828的显示器控制器826。CODEC 834可耦合到处理器810,如图所示。扬声器836及麦克风838可耦合到CODEC 834。举例来说,麦克风838可产生图1的输入音频信号102,且CODEC 834可基于输入音频信号102产生用于发射到接收器的输出位流192。作为另一实例,扬声器836可用以输出由CODEC 834从图1的输出位流192重建的信号,其中从发射器接收输出位流192。图8还指示无线控制器840可耦合到处理器810及耦合到无线天线842。
在特定实施例中,处理器810、显示器控制器826、存储器832、CODEC 834及无线控制器840包含于系统级封装或片上系统装置(例如,移动台调制解调器(MSM))822中。在特定实施例中,例如触摸屏及/或小键盘等输入装置830及电力供应器844耦合到片上系统装置822。此外,在特定实施例中,如图8中所说明,显示器828、输入装置830、扬声器836、麦克风838、无线天线842及电力供应器844在片上系统装置822的外部。然而,显示器828、输入装置830、扬声器836、麦克风838、无线天线842及电力供应器844中的每一者可耦合到片上系统装置822的组件,例如接口或控制器。
结合所描述实施例,揭示一种设备,其包含用于基于对应于音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量的装置。举例来说,用于确定的装置可包含图1或图4的伪声诱发分量检测模块158、图8的滤波系统874或其组件、经配置以确定音频信号包含此分量的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
设备还可包含用于响应于用于确定的装置对音频信号进行滤波的装置。举例来说,用于滤波的装置可包含图1或图4的滤波模块168、图8的滤波系统874或其组件、经配置以对信号进行滤波的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
设备还可包含用于基于经滤波音频信号产生经编码信号以减小伪声产生条件的可听见效果的装置。举例来说,用于产生的装置可包含图1的高频带分析模块150、图4的系统400的更多组件、图8的滤波系统874或其组件、经配置以基于经滤波音频信号产生经编码信号的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
所属领域的技术人员将进一步了解,结合本文所揭示的实施例所描述的各种说明性逻辑块、配置、模块、电路及算法步骤可实施为电子硬件、由例如硬件处理器等处理装置执行的计算机软件或两者的组合。上文已大体在其功能性方面描述各种说明性组件、区块、配置、模块、电路和步骤。此功能性是实施为硬件还是可执行软件取决于特定应用及施加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施决策不应被解译为引起对本发明的范围的偏离。
结合本文所揭示的实施例而描述的方法或算法的步骤可直接体现在硬件、由处理器执行的软件模块或所述两者的组合中。软件模块可驻留于存储器装置中,所述存储器装置例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可装卸式磁盘或压缩光盘只读存储器(CD-ROM)。示范性存储器装置耦合到处理器,使得处理器可从存储器装置读取信息并将信息写入到存储器装置。在替代方案中,存储器装置可与处理器集成。处理器及存储媒体可驻留在专用集成电路(ASIC)中。ASIC可以驻留在计算装置或用户终端中。在替代方案中,处理器与存储媒体可作为离散组件驻留在计算装置或用户终端中。
提供对所揭示实施例的先前描述以使得所属领域的技术人员能够制造或使用所揭示的实施例。所属领域的技术人员将容易了解对这些实施例的各种修改,且可在不脱离本发明的范围的情况下将本文定义的原理应用到其它实施例。因此,本发明并不希望限于本文展示的实施例,而应符合与如通过所附权利要求书界定的原理及新颖特征一致的可能的最宽范围。
Claims (40)
1.一种方法,其包括:
基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定所述音频信号包含对应于伪声产生条件的分量;
对所述音频信号的所述高频带部分进行滤波以产生经滤波高频带输出;及
产生经编码信号,其中产生所述经编码信号包含基于对应于所述经滤波高频带输出的第一能量与对应于所述低频带部分的第二能量的比率确定增益信息以减小所述伪声产生条件的可听见效果。
2.根据权利要求1所述的方法,其中所述经滤波高频带输出除了用于确定所述增益信息之外不被使用。
3.根据权利要求1所述的方法,其中对所述音频信号的所述高频带部分进行滤波包括使用与所述音频信号的所述高频带部分相关联的线性预测系数LPC对所述高频带部分进行滤波。
4.根据权利要求1所述的方法,其进一步包括:
接收所述音频信号;
在分析滤波器组处产生所述音频信号的所述低频带部分及所述音频信号的所述高频带部分;
基于所述低频带部分产生低频带位流;
基于所述高频带部分、与所述低频带部分相关联的低频带激励信号或所述经滤波高频带输出中的至少一者产生高频带辅助信息;及
对所述低频带位流及所述高频带辅助信息进行多路复用以产生对应于所述经编码信号的输出位流。
5.根据权利要求4所述的方法,其中所述增益信息包含帧增益信息,且其中所述高频带辅助信息包含所述帧增益信息。
6.根据权利要求5所述的方法,其中所述帧增益信息进一步基于所述高频带部分产生,且其中所述高频带辅助信息进一步包含:
对应于子帧增益估计的时间增益信息,其中至少部分基于所述经滤波高频带输出产生所述时间增益信息;及
至少部分基于所述高频带部分产生的线谱对LSP。
7.根据权利要求1所述的方法,其进一步包括确定与所述音频信号的帧相关联的跨线谱对LSP间距。
8.根据权利要求7所述的方法,其中所述跨LSP间距为对应于在所述帧的线性预测性译码LPC期间产生的多个LSP的多个跨LSP间距中的最小者。
9.根据权利要求7所述的方法,其中使用自适应加权因子执行所述滤波,所述方法进一步包括基于所述跨LSP间距确定所述自适应加权因子。
10.根据权利要求9所述的方法,其中对所述音频信号的所述高频带部分进行滤波包含将所述自适应加权因子应用于高频带线性预测系数。
11.根据权利要求9所述的方法,其中根据将跨LSP间距值与所述自适应加权因子的值相关联的映射确定所述自适应加权因子的值。
12.根据权利要求11所述的方法,其中所述映射为线性映射。
13.根据权利要求11所述的方法,其中所述映射基于取样率或对应于所述伪声产生条件的频率中的至少一者自适应。
14.根据权利要求11所述的方法,其中所述映射基于信噪比自适应。
15.根据权利要求11所述的方法,其中所述映射基于线性预测分析之后的预测增益自适应。
16.根据权利要求7所述的方法,其中响应于所述跨LSP间距小于第一阈值而确定所述音频信号包含所述分量。
17.根据权利要求7所述的方法,其进一步包括基于与所述帧相关联的所述跨LSP间距及与所述音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距确定平均跨LSP间距。
18.根据权利要求17所述的方法,其中响应于所述跨LSP间距小于第二阈值及以下各者中的至少一者确定所述音频信号包含所述分量:
所述平均跨LSP间距小于第三阈值;或
启用对应于所述音频信号的另一帧的滤波,所述另一帧在所述音频信号的所述帧之前。
19.一种方法,其包括:
将与音频信号的帧相关联的跨线谱对LSP间距与至少一个阈值进行比较;及
至少部分基于所述比较对所述音频信号的高频带部分进行滤波以产生经滤波高频带输出;及
基于对应于所述经滤波高频带输出的第一能量与对应于所述音频信号的低频带部分的第二能量的比率确定增益信息。
20.根据权利要求19所述的方法,其进一步包括确定与所述音频信号的帧相关联的跨线谱对LSP间距,其中所述跨LSP间距为对应于在所述帧的线性预测性译码LPC期间产生的多个LSP的多个跨LSP间距中的最小者。
21.根据权利要求20所述的方法,其中响应于所述跨LSP间距小于第一阈值对所述音频信号的所述高频带部分进行滤波。
22.根据权利要求20所述的方法,其中响应于所述跨LSP间距小于第二阈值及以下各者中的至少一者对所述音频信号的所述高频带部分进行滤波:
平均跨LSP间距小于第三阈值,所述平均跨LSP间距基于与所述帧相关联的所述跨LSP间距及与所述音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距;或
启用对应于所述音频信号的另一帧的高频带滤波,所述另一帧在所述音频信号的所述帧之前。
23.根据权利要求19所述的方法,其中对所述高频带部分进行滤波包括使用与所述音频信号的所述高频带部分相关联的线性预测系数LPC对所述高频带部分进行滤波。
24.根据权利要求19所述的方法,其进一步包括基于所述跨LSP间距确定自适应加权因子的值,且其中使用所述自适应加权因子的所述值执行所述滤波。
25.根据权利要求24所述的方法,其中对所述高频带部分进行滤波包含将所述自适应加权因子应用于高频带线性预测系数。
26.根据权利要求24所述的方法,其中根据将跨LSP间距值与所述自适应加权因子的值相关联的映射确定所述自适应加权因子的所述值。
27.一种设备,其包括:
噪声检测电路,其经配置以基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定所述音频信号包含对应于伪声产生条件的分量;
滤波电路,其对所述噪声检测电路作出响应,且经配置以对所述音频信号的所述高频带部分进行滤波以产生经滤波高频带输出;及
增益确定电路,其经配置以基于对应于所述经滤波高频带输出的第一能量与对应于所述低频带部分的第二能量的比率确定增益信息以减小所述伪声产生条件的可听见效果。
28.根据权利要求27所述的设备,其进一步包括:
分析滤波器组,其经配置以产生所述音频信号的所述低频带部分及所述音频信号的所述高频带部分;
低频带分析模块,其经配置以基于所述低频带部分产生低频带位流;
高频带分析模块,其经配置以基于所述高频带部分、与所述低频带部分相关联的低频带激励信号或所述经滤波高频带输出中的至少一者产生高频带辅助信息;及
多路复用器,其经配置以对所述低频带位流及所述高频带辅助信息进行多路复用以产生对应于所述经编码信号的输出位流。
29.根据权利要求28所述的设备,其中所述增益信息包含帧增益信息,且其中所述高频带辅助信息包含所述帧增益信息。
30.根据权利要求29所述的设备,其中所述帧增益信息进一步基于所述高频带部分产生,且其中所述高频带辅助信息进一步包含:
对应于子帧增益估计的时间增益信息,其中至少部分基于所述经滤波高频带输出产生所述时间增益信息;及
至少部分基于所述高频带部分产生的线谱对LSP。
31.根据权利要求27所述的设备,其中所述噪声检测电路经配置以确定与所述音频信号的帧相关联的跨线谱对LSP间距,其中所述跨LSP间距为对应于在所述帧的线性预测性译码LPC期间产生的多个LSP的多个跨LSP间距中的最小者。
32.根据权利要求31所述的设备,其中所述滤波电路经配置以将自适应加权因子应用于高频带线性预测系数,其中基于所述跨LSP间距确定所述高频带自适应加权因子。
33.一种设备,其包括:
用于基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定所述音频信号包含对应于伪声产生条件的分量的装置;
用于对所述音频信号的高频带部分进行滤波以产生经滤波高频带输出的装置;及
用于产生经编码信号的装置,其中用于产生所述经编码信号的所述装置包含用于基于对应于所述经滤波高频带输出的第一能量与对应于所述低频带部分的第二能量的比率确定增益信息以减小所述伪声产生条件的可听见效果的装置。
34.根据权利要求33所述的设备,其进一步包括:
用于产生所述音频信号的所述低频带部分及所述音频信号的所述高频带部分的装置;
用于基于所述低频带部分产生低频带位流的装置;
用于基于所述高频带部分、与所述低频带部分相关联的低频带激励信号或所述经滤波高频带输出中的至少一者产生高频带辅助信息的装置;及
用于对所述低频带位流及所述高频带辅助信息进行多路复用以产生对应于所述经编码信号的输出位流的装置。
35.根据权利要求34所述的设备,其中所述增益信息包含帧增益信息,且其中所述高频带辅助信息包含所述帧增益信息。
36.根据权利要求35所述的设备,其中所述帧增益信息进一步基于所述高频带部分产生,且其中所述高频带辅助信息进一步包含:
对应于子帧增益估计的时间增益信息,其中至少部分基于所述经滤波高频带输出产生所述时间增益信息;及
至少部分基于所述高频带部分产生的线谱对LSP。
37.根据权利要求33所述的设备,其中用于确定的所述装置经配置以确定与所述音频信号的帧相关联的跨线谱对LSP间距,其中所述跨LSP间距为对应于在所述帧的线性预测性译码LPC期间产生的多个LSP的多个跨LSP间距中的最小者。
38.一种非暂时性计算机可读媒体,其包括若干指令,所述指令在由计算机执行时致使所述计算机:
基于对应于包含低频带部分及高频带部分的音频信号的频谱信息确定所述音频信号包含对应于伪声产生条件的分量;
对所述音频信号的所述高频带部分进行滤波以产生经滤波高频带输出;及
产生经编码信号,其中产生所述经编码信号包含基于对应于所述经滤波高频带输出的第一能量与对应于所述低频带部分的第二能量的比率确定增益信息以减小所述伪声产生条件的可听见效果。
39.根据权利要求38所述的计算机可读媒体,其中所述经滤波高频带输出除了用于确定所述增益信息之外不被使用。
40.根据权利要求38所述的计算机可读媒体,其中用以致使所述计算机对所述音频信号的所述高频带部分进行滤波的所述指令包括用以致使所述计算机使用与所述音频信号的所述高频带部分相关联的线性预测系数LPC对所述高频带部分进行滤波的指令。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361762807P | 2013-02-08 | 2013-02-08 | |
US61/762,807 | 2013-02-08 | ||
US13/959,188 US9711156B2 (en) | 2013-02-08 | 2013-08-05 | Systems and methods of performing filtering for gain determination |
US13/959,188 | 2013-08-05 | ||
PCT/US2013/053806 WO2014123579A1 (en) | 2013-02-08 | 2013-08-06 | Systems and methods of performing filtering for gain determination |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104969291A true CN104969291A (zh) | 2015-10-07 |
CN104969291B CN104969291B (zh) | 2018-10-26 |
Family
ID=51298066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380071701.8A Active CN104969291B (zh) | 2013-02-08 | 2013-08-06 | 执行用于增益确定的滤波的系统及方法 |
Country Status (22)
Country | Link |
---|---|
US (1) | US9711156B2 (zh) |
EP (1) | EP2954523B1 (zh) |
JP (1) | JP6456847B2 (zh) |
KR (1) | KR101891872B1 (zh) |
CN (1) | CN104969291B (zh) |
AU (1) | AU2013377885B2 (zh) |
CA (1) | CA2896814C (zh) |
DK (1) | DK2954523T3 (zh) |
ES (1) | ES2715847T3 (zh) |
HK (1) | HK1211377A1 (zh) |
HU (1) | HUE042387T2 (zh) |
IL (1) | IL239719A (zh) |
MY (1) | MY171188A (zh) |
PH (1) | PH12015501516A1 (zh) |
PL (1) | PL2954523T3 (zh) |
PT (1) | PT2954523T (zh) |
RU (1) | RU2643628C2 (zh) |
SG (1) | SG11201505067TA (zh) |
SI (1) | SI2954523T1 (zh) |
UA (1) | UA116371C2 (zh) |
WO (1) | WO2014123579A1 (zh) |
ZA (1) | ZA201506577B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US9697843B2 (en) | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
CN104217726A (zh) * | 2014-09-01 | 2014-12-17 | 东莞中山大学研究院 | 一种无损音频压缩编码方法及其解码方法 |
US10020002B2 (en) | 2015-04-05 | 2018-07-10 | Qualcomm Incorporated | Gain parameter estimation based on energy saturation and signal scaling |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US9380150B1 (en) * | 2015-09-16 | 2016-06-28 | Captioncall, Llc | Methods and devices for automatic volume control of a far-end voice signal provided to a captioning communication service |
AU2017249291B2 (en) * | 2016-04-12 | 2020-02-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
US11321047B2 (en) | 2020-06-11 | 2022-05-03 | Sorenson Ip Holdings, Llc | Volume adjustments |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1484823A (zh) * | 2000-11-30 | 2004-03-24 | 松下电器产业株式会社 | 音频解码器和音频解码方法 |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
US20060287853A1 (en) * | 2001-11-14 | 2006-12-21 | Mineo Tsushima | Encoding device and decoding device |
CN101089951A (zh) * | 2006-06-16 | 2007-12-19 | 徐光锁 | 频带扩展编码方法及装置和解码方法及装置 |
CN101184979A (zh) * | 2005-04-01 | 2008-05-21 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
CN101273404A (zh) * | 2005-09-30 | 2008-09-24 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
CN102652336A (zh) * | 2009-12-28 | 2012-08-29 | 三菱电机株式会社 | 声音信号复原装置以及声音信号复原方法 |
CN102779522A (zh) * | 2009-04-03 | 2012-11-14 | 株式会社Ntt都科摩 | 语音解码装置及语音解码方法 |
WO2012158157A1 (en) * | 2011-05-16 | 2012-11-22 | Google Inc. | Method for super-wideband noise supression |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
KR20000047944A (ko) * | 1998-12-11 | 2000-07-25 | 이데이 노부유끼 | 수신장치 및 방법과 통신장치 및 방법 |
US7110953B1 (en) | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
EP2107557A3 (en) * | 2005-01-14 | 2010-08-25 | Panasonic Corporation | Scalable decoding apparatus and method |
WO2006107837A1 (en) * | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
EP1898397B1 (en) * | 2005-06-29 | 2009-10-21 | Panasonic Corporation | Scalable decoder and disappeared data interpolating method |
DE102006022346B4 (de) | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
US8682652B2 (en) | 2006-06-30 | 2014-03-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
US8725499B2 (en) * | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
BRPI0807276A2 (pt) * | 2007-02-20 | 2014-05-06 | Airbus France | "processo de realização de um revestimento para o tratamento acústico aplicado no nível de uma superfície a tratar de uma aeronave, revestimento para o tratamento acústico, e nacela de aeronave" |
US8600740B2 (en) * | 2008-01-28 | 2013-12-03 | Qualcomm Incorporated | Systems, methods and apparatus for context descriptor transmission |
GB0822537D0 (en) * | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CA2780962C (en) | 2009-11-19 | 2017-09-05 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and arrangements for loudness and sharpness compensation in audio codecs |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
-
2013
- 2013-08-05 US US13/959,188 patent/US9711156B2/en active Active
- 2013-08-06 CN CN201380071701.8A patent/CN104969291B/zh active Active
- 2013-08-06 DK DK13753450.9T patent/DK2954523T3/en active
- 2013-08-06 ES ES13753450T patent/ES2715847T3/es active Active
- 2013-08-06 PT PT13753450T patent/PT2954523T/pt unknown
- 2013-08-06 AU AU2013377885A patent/AU2013377885B2/en active Active
- 2013-08-06 MY MYPI2015702276A patent/MY171188A/en unknown
- 2013-08-06 CA CA2896814A patent/CA2896814C/en active Active
- 2013-08-06 WO PCT/US2013/053806 patent/WO2014123579A1/en active Application Filing
- 2013-08-06 RU RU2015138109A patent/RU2643628C2/ru active
- 2013-08-06 JP JP2015556929A patent/JP6456847B2/ja active Active
- 2013-08-06 SI SI201331369T patent/SI2954523T1/sl unknown
- 2013-08-06 PL PL13753450T patent/PL2954523T3/pl unknown
- 2013-08-06 KR KR1020157023785A patent/KR101891872B1/ko active IP Right Grant
- 2013-08-06 UA UAA201508656A patent/UA116371C2/uk unknown
- 2013-08-06 HU HUE13753450A patent/HUE042387T2/hu unknown
- 2013-08-06 SG SG11201505067TA patent/SG11201505067TA/en unknown
- 2013-08-06 EP EP13753450.9A patent/EP2954523B1/en active Active
-
2015
- 2015-06-30 IL IL239719A patent/IL239719A/en active IP Right Grant
- 2015-07-03 PH PH12015501516A patent/PH12015501516A1/en unknown
- 2015-09-07 ZA ZA2015/06577A patent/ZA201506577B/en unknown
- 2015-12-07 HK HK15112045.3A patent/HK1211377A1/zh unknown
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1484823A (zh) * | 2000-11-30 | 2004-03-24 | 松下电器产业株式会社 | 音频解码器和音频解码方法 |
US20060287853A1 (en) * | 2001-11-14 | 2006-12-21 | Mineo Tsushima | Encoding device and decoding device |
WO2006049205A1 (ja) * | 2004-11-05 | 2006-05-11 | Matsushita Electric Industrial Co., Ltd. | スケーラブル復号化装置およびスケーラブル符号化装置 |
US20080243496A1 (en) * | 2005-01-21 | 2008-10-02 | Matsushita Electric Industrial Co., Ltd. | Band Division Noise Suppressor and Band Division Noise Suppressing Method |
CN101184979A (zh) * | 2005-04-01 | 2008-05-21 | 高通股份有限公司 | 用于高频带激励产生的系统、方法和设备 |
CN101273404A (zh) * | 2005-09-30 | 2008-09-24 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
CN101089951A (zh) * | 2006-06-16 | 2007-12-19 | 徐光锁 | 频带扩展编码方法及装置和解码方法及装置 |
CN102779522A (zh) * | 2009-04-03 | 2012-11-14 | 株式会社Ntt都科摩 | 语音解码装置及语音解码方法 |
CN102652336A (zh) * | 2009-12-28 | 2012-08-29 | 三菱电机株式会社 | 声音信号复原装置以及声音信号复原方法 |
WO2012158157A1 (en) * | 2011-05-16 | 2012-11-22 | Google Inc. | Method for super-wideband noise supression |
Non-Patent Citations (1)
Title |
---|
WEI SHOU HSU: ""Robust Bandwidth Extension of Narrowband Speech"", 《MCGILL UNIVERSITY》 * |
Also Published As
Publication number | Publication date |
---|---|
AU2013377885A1 (en) | 2015-07-23 |
RU2643628C2 (ru) | 2018-02-02 |
CA2896814C (en) | 2018-08-14 |
CA2896814A1 (en) | 2014-08-14 |
PH12015501516B1 (en) | 2015-09-21 |
ES2715847T3 (es) | 2019-06-06 |
DK2954523T3 (en) | 2019-03-25 |
HUE042387T2 (hu) | 2019-06-28 |
BR112015019040A2 (pt) | 2017-07-18 |
WO2014123579A1 (en) | 2014-08-14 |
KR101891872B1 (ko) | 2018-08-24 |
PL2954523T3 (pl) | 2019-05-31 |
RU2015138109A (ru) | 2017-03-16 |
JP2016511436A (ja) | 2016-04-14 |
EP2954523A1 (en) | 2015-12-16 |
ZA201506577B (en) | 2018-08-29 |
US9711156B2 (en) | 2017-07-18 |
PH12015501516A1 (en) | 2015-09-21 |
MY171188A (en) | 2019-09-30 |
UA116371C2 (uk) | 2018-03-12 |
AU2013377885B2 (en) | 2019-07-18 |
JP6456847B2 (ja) | 2019-01-23 |
PT2954523T (pt) | 2019-03-25 |
EP2954523B1 (en) | 2018-12-19 |
CN104969291B (zh) | 2018-10-26 |
IL239719A0 (en) | 2015-08-31 |
HK1211377A1 (zh) | 2016-05-20 |
KR20150116881A (ko) | 2015-10-16 |
SG11201505067TA (en) | 2015-08-28 |
SI2954523T1 (sl) | 2019-04-30 |
IL239719A (en) | 2016-11-30 |
US20140229171A1 (en) | 2014-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104969291A (zh) | 执行用于增益确定的滤波的系统及方法 | |
CA2896811C (en) | Systems and methods of performing gain control | |
CN110634503B (zh) | 用于信号处理的方法和设备 | |
CN105593933B (zh) | 用于信号处理的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1211377 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |