CN104956437A - 执行增益控制的系统及方法 - Google Patents
执行增益控制的系统及方法 Download PDFInfo
- Publication number
- CN104956437A CN104956437A CN201380071693.7A CN201380071693A CN104956437A CN 104956437 A CN104956437 A CN 104956437A CN 201380071693 A CN201380071693 A CN 201380071693A CN 104956437 A CN104956437 A CN 104956437A
- Authority
- CN
- China
- Prior art keywords
- sound signal
- lsp
- gain
- frame
- spacing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000005236 sound signal Effects 0.000 claims abstract description 140
- 230000004044 response Effects 0.000 claims abstract description 45
- 238000009499 grossing Methods 0.000 claims abstract description 31
- 230000009467 reduction Effects 0.000 claims description 54
- 238000004458 analytical method Methods 0.000 claims description 29
- 238000004519 manufacturing process Methods 0.000 claims description 27
- 238000001228 spectrum Methods 0.000 claims description 27
- 230000005284 excitation Effects 0.000 claims description 17
- 230000006978 adaptation Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 28
- 230000006698 induction Effects 0.000 description 17
- 238000001514 detection method Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 101000712600 Homo sapiens Thyroid hormone receptor beta Proteins 0.000 description 2
- 101150049692 THR4 gene Proteins 0.000 description 2
- 102100033451 Thyroid hormone receptor beta Human genes 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 206010038743 Restlessness Diseases 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Control Of Amplification And Gain Control (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Noise Elimination (AREA)
- Stereophonic System (AREA)
- Telephone Function (AREA)
Abstract
一种特定方法包含基于对应于音频信号的跨线谱对LSP间距确定所述音频信号包含对应于伪声产生条件的分量。所述方法还包含响应于确定所述音频信号包含所述分量,调整对应于所述音频信号的增益参数。举例来说,可经由增益衰减及/或增益平滑来调整所述增益参数。
Description
相关申请案的交叉参考
本申请案主张来自共同拥有的2013年2月8号申请的第61/762,803号美国临时专利申请案及2013年8月5号申请的第13/959,090号美国非临时专利申请案的优先权,所述申请案的内容全文以引用的方式明确地并入本文中。
技术领域
本发明通常涉及信号处理。
背景技术
技术的进步已经带来更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线计算装置,例如便携式无线电话、个人数字助理(PDA)和寻呼装置,其体积小,重量轻且易于由用户携带。更具体来说,例如蜂窝式电话和因特网协议(IP)电话等便携式无线电话可经由无线网络传送语音和数据包。此外,许多此类无线电话包含并入其中的其它类型的装置。举例来说,无线电话还可包含数字静态相机、数码摄像机、数字记录器,和音频文件播放器。
在传统电话系统(例如,公共交换电话网络(PSTN))中,信号带宽限于300赫兹(Hz)到3.4千赫兹(kHz)的频率范围。在例如蜂窝式电话及因特网语音通信协议(VoIP)等宽带(WB)应用中,信号带宽可横跨50Hz到7kHz的频率范围。超宽带(SWB)译码技术支持延展到16kHz左右的带宽。将信号带宽从3.4kHz的窄带电话延展到16kHz的SWB电话可改进信号重建的质量、可懂度及自然度。
SWB译码技术通常涉及编码及发射信号的较低频率部分(例如,50Hz到7kHz,也被称为“低频带”)。举例来说,可使用滤波器参数及/或低频带激励信号表示低频带。然而,为了改进译码效率,可不完全编码及发射信号的较高频率部分(例如,7kHz到16kHz,也被称为“高频带”)。替代地,接收器可利用信号建模以预测高频带。在一些实施方案中,可将与高频带相关联的数据提供到接收器以辅助预测。此数据可被称为“辅助信息”,且可包含增益信息、线谱频率(LSF,也被称作线谱对(LSP))等。在低频带信号与高频带信号充分相关时,使用信号模型的高频带预测的准确度可被接受。然而,在存在噪声的情况下,低频带与高频带之间的相关可为弱的,且信号模型可不再能够准确地表示高频带。此情形可导致接收器处的伪声(例如,经变形话音)。
发明内容
揭示执行增益控制的系统及方法。所描述的技术包含确定经编码以用于发射的音频信号是否包含可在音频信号的重建之后产生可听见伪声的分量(例如,噪声)。举例来说,信号模型可将噪声解译为话音数据,所述话音数据可产生用以表示音频信号的错误增益信息。根据所描述的技术,在存在嘈杂条件的情况下,可执行增益衰减及/或增益平滑以调整用以表示待发射的信号的增益参数。此些调整可导致接收器处的信号的更准确重建,从而减小可听见伪声。
在特定实施例中,一种方法包含基于对应于音频信号的跨线谱对(LSP)间距确定音频信号包含对应于伪声产生条件的分量。所述方法还包含响应于确定音频信号包含所述分量,调整对应于音频信号的增益参数。
在另一特定实施例中,所述方法包含将与音频信号的帧相关联的跨线谱对(LSP)间距与至少一个阈值进行比较。所述方法还包含至少部分基于比较的结果调整对应于音频信号的话音译码增益参数(例如,用于话音译码系统中的数字增益的编解码器增益参数)。
在另一特定实施例中,一种设备包含噪声检测电路,所述噪声检测电路经配置以基于对应于音频信号的跨线谱对(LSP)间距确定音频信号包含对应于伪声产生条件的分量。所述设备还包含增益衰减及平滑电路,所述增益衰减及平滑电路对噪声检测电路作出响应,且经配置以响应于确定音频信号包含所述分量,调整对应于音频信号的增益参数。
在另一特定实施例中,一种设备包含用于基于对应于音频信号的跨线谱对(LSP)间距确定音频信号包含对应于伪声产生条件的分量的装置。所述设备还包含用于响应于确定音频信号包含分量而调整对应于音频信号的增益参数的装置。
在另一特定实施例中,一种非暂时性计算机可读媒体包含若干指令,所述指令在由计算机执行时致使计算机基于对应于音频信号的跨线谱对(LSP)间距确定音频信号包含对应于伪声产生条件的分量。所述指令还可执行以致使计算机响应于确定音频信号包含所述分量而调整对应于音频信号的增益参数。
由所揭示的实施例中的至少一者提供的特定优势包含检测伪声诱发分量(例如,噪声)且响应于检测到此些伪声诱发分量而选择性地执行增益控制(例如,增益衰减及/或增益平滑)的能力,此举可产生接收器处的更准确信号重建及较少可听见伪声。本发明的其它方面、优点及特征将在审阅全部申请案之后变得显而易见,所述全部申请案包含以下部分:附图说明、具体实施方式及权利要求书。
附图说明
图1为用以说明可操作以执行增益控制的系统的特定实施例的图;
图2为用以说明伪声诱发分量、包含伪声的对应经重构信号及不包含伪声的对应经重构信号的实例的图;
图3为用以说明执行增益控制的方法的特定实施例的流程图;
图4为用以说明执行增益控制的方法的另一特定实施例的流程图;
图5为用以说明执行增益控制的方法的另一特定实施例的流程图;及
图6为根据图1到5的系统及方法的可操作以执行信号处理操作的无线装置的框图。
具体实施方式
参看图1,可操作以执行增益控制的系统的特定实施例经展示且通常经指定为100。在特定实施例中,系统100可集成到编码系统或设备中(例如,无线电话或译码器/解码器(CODEC)中)。
应注意,在以下描述中,将由图1的系统100执行的各种功能经描述为由某些组件或模块执行。然而,组件及模块的此划分是仅用于说明。在替代实施例中,由特定组件或模块执行的功能可改为在多个组件或模块之中划分。此外,在替代实施例中,图1的两个或两个以上组件或模块可集成到单个组件或模块中。图1中说明的每一组件或模块可使用硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、数字信号处理器(DSP)、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合来实施。
系统100包含经配置以接收输入音频信号102的分析滤波器组110。举例来说,输入音频信号102可由麦克风或其它输入装置提供。在特定实施例中,输入音频信号102可包含话音。输入音频信号可为超宽带(SWB)信号,所述SWB信号包含在从约50赫兹(Hz)到约16千赫兹(kHz)的频率范围中的数据。分析滤波器组110可基于频率将输入音频信号102滤波成多个部分。举例来说,分析滤波器组110可产生低频带信号122及高频带信号124。低频带信号122及高频带信号124可具有相等或不相等带宽,且可重叠或不重叠。在替代实施例中,分析滤波器组110可产生两个以上输出。
在图1的实例中,低频带信号122及高频带信号124占用非重叠频带。举例来说,低频带信号122及高频带信号124可占用50Hz-7kHz及7kHz-16kHz的非重叠频带。在替代实施例中,低频带信号122及高频带信号124可占用50Hz-8kHz及8kHz-16kHz的非重叠频带。在又一替代实施例中,低频带信号122及高频带信号124重叠(例如,50Hz-8kHz及7kHz-16kHz),其可使分析滤波器组110的低通滤波器及高通滤波器具有平滑滚降,其可简化设计且减少低通滤波器及高通滤波器的成本。重叠低频带信号122及高频带信号124还可允许实现接收器处低频带及高频带信号的平滑掺合,此情形可导致更少可听见伪声。
应注意尽管图1的实例说明SWB信号的处理,但此情形仅用于说明。在替代实施例中,输入音频信号102可为具有约50Hz到约8kHz的频率范围的宽带(WB)信号。在此类实施例中,低频带信号122可对应于约50Hz到约6.4kHz的频率范围,且高频带信号124可对应于约6.4kHz到约8kHz的频率范围。还应注意本文中的各种系统及方法经描述为检测高频带噪声及响应于高频带噪声而执行各种操作。然而,此情形仅作为实例。参看图1到6所说明的技术也可在低频带噪声的情况下执行。
系统100可包含经配置以接收低频带信号122的低频带分析模块130。在特定实施例中,低频带分析模块130可表示码激励线性预测(CELP)编码器的实施例。低频带分析模块130可包含线性预测(LP)分析及译码模块132、线性预测系数(LPC)到线谱对(LSP)变换模块134及量化器136。LSP也可被称作线谱频率(LSF),且所述两个术语在本文中可互换地使用。LP分析及译码模块132可将低频带信号122的频谱包络编码为一组LPC。对于音频的每一帧(例如,对应于16kHz的取样速率的320个样本的20毫秒(ms)音频)、音频的每一子帧(例如,5ms音频)或其任何组合可产生LPC。可由所执行的LP分析的“级数”确定每一帧或子帧所产生的LPC的数目。在特定实施例中,LP分析及译码模块132可产生对应于第十级LP分析的十一个LPC的集合。
LPC到LSP变换模块134可将由LP分析及译码模块132所产生的LPC的集合变换成对应LSP集合(例如,使用一对一变换)。或者,LPC的集合可经一对一变换成部分自相关系数、对数面积比率值、导谱对(ISP)或导谱频(ISF)的对应集合。LPC集合与LSP集合之间的变换可为可逆的而不存在误差。
量化器136可量化由变换模块134产生的LSP集合。举例来说,量化器136可包含或耦合到包含多个项(例如,向量)的多个码簿。为量化LSP集合,量化器136可识别“最接近”(例如,基于例如最小平方或均方误差等失真测量)LSP集合的码簿的项。量化器136可输出对应于码簿中所识别项的位置的索引值或一系列索引值。因此,量化器136的输出可表示包含于低频带位流142中的低频带滤波器参数。
低频带分析模块130还可产生低频带激励信号144。举例来说,低频带激励信号144可为通过量化LP残余信号产生的经编码信号,在由低频带分析模块130执行的LP过程期间产生所述LP残余信号。LP残余信号可表示预测误差。
系统100可进一步包含高频带分析模块150,所述高频带分析模块经配置以接收来自分析滤波器组110的高频带信号124及来自低频带分析模块130的低频带激励信号144。高频带分析模块150可基于高频带信号124及低频带激励信号144产生高频带辅助信息172。举例来说,高频带辅助信息172可包含高频带LSP及/或增益信息(例如,至少基于高频带能量与低频带能量的比率),如本文进一步描述。
高频带分析模块150可包含高频带激励产生器160。高频带激励产生器160可通过将低频带激励信号144的频谱延展到高频带频率范围(例如,7kHz到16kHz)中而产生高频带激励信号。为了进行说明,高频带激励产生器160可将变换应用于低频带激励信号(例如,例如绝对值或平方运算等非线性变换),且可将经变换低频带激励信号与噪声信号(例如,根据对应于低频带激励信号144的包络调制的白噪声)混合以产生高频带激励信号。高频带激励信号可用以确定包含于高频带辅助信息172中的一或多个高频带增益参数。
高频带分析模块150还可包含LP分析及译码模块152、LPC到LSP变换模块154及量化器156。LP分析及译码模块152、变换模块154及量化器156中的每一者可如上文参考低频带分析模块130的对应组件所描述般起作用,但分辨率相对减小(例如,对于每一系数使用较少位、LSP等)。在另一实例实施例中,高频带LSP量化器156可使用标量量化,其中使用预定义位数个别地量化LSP系数的子集。举例来说,LP分析及译码模块152、变换模块154及量化器156可使用高频带信号124来确定包含于高频带辅助信息172中的高频带滤波器信息(例如,高频带LSP)。在特定实施例中,高频带辅助信息172可包含高频带LSP以及高频带增益参数。在存在某些类型的噪声的情况下,可因由增益衰减及平滑模块162执行的增益衰减及/或增益平滑而产生高频带增益参数,如本文进一步描述。
低频带位流142及高频带辅助信息172可由多路复用器(MUX)180进行多路复用以产生输出位流192。输出位流192可表示对应于输入音频信号102的经编码音频信号。举例来说,可发射(例如,经由有线、无线或光学通道)及/或存储输出位流192。在接收器处,反向操作可由多路分用器(DEMUX)、低频带解码器、高频带解码器及滤波器组执行以产生音频信号(例如,经提供到扬声器或其它输出装置的输入音频信号102的经重建版本)。用以表示低频带位流142的位数可实质上大于用以表示高频带辅助信息172的位数。因此,输出位流192中的大部分位表示低频带数据。可在接收器处使用高频带辅助信息172以根据信号模型从低频带数据再生高频带信号。举例来说,信号模型可表示低频带数据(例如,低频带信号122)与高频带数据(例如,高频带信号124)之间的关系或相关的预期集合。因此,对于不同类别的音频数据(例如,话音、音乐等)可使用不同信号模型,且在使用中的特定信号模型可在传达经编码音频数据之前由发射器及接收器协商(或由工业标准定义)。使用信号模型,在发射器处的高频带分析模块150可能够产生高频带辅助信息172以使得在接收器处的对应高频带分析模块能够使用信号模型从输出位流192重建高频带信号124。
然而,在存在背景噪声的情况下,在接收器处的高频带合成可导致明显的伪声,因为低频带与高频带之间的不充分相关可致使底层信号模型在可靠信号重建中次最佳地执行。举例来说,信号模型可将高频带中的噪声分量不正确地解译为话音,且可因此致使产生增益参数,所述增益参数试图在接收器处不准确地复制噪声,从而导致明显的伪声。此些伪声产生条件的实例包含(但不限于)高频噪声,例如汽车喇叭及刺耳的刹车。为了进行说明,图2中的第一频谱图210说明具有对应于伪声产生条件的两个分量的音频信号,所述音频信号经说明为具有相对大的信号能量的高频带噪声。第二频谱图220说明归因于高频带增益参数的过高估计的在经重构信号中的所得伪声。
为了减小此些伪声,高频带分析模块150可执行高频带增益控制。举例来说,高频带分析模块150可包含伪声诱发分量检测模块158,所述伪声诱发分量检测模块经配置以检测可能在再现之后产生可听见伪声的信号分量(例如,图2的第一频谱图210中所示的伪声产生条件)。在存在此些分量的情况下,高频带分析模块150可致使产生经编码信号,所述经编码信号至少部分减小此些伪声的可听见效果。举例来说,增益衰减及平滑模块162可执行增益衰减及/或增益平滑以修改包含于高频带辅助信息172中的增益信息或参数。
作为说明性实例,增益衰减可包含经由应用指数或线性运算而减小经建模增益值。增益平滑可包含计算当前帧/子帧及一或多个先前帧/子帧的经建模增益的加权和。经修改增益信息可根据图2的第三频谱图230产生经重构信号,所述经重构信号不含(或具有程度减小的)图2的第二频谱图220中所示的伪声。
可执行一或多个测试以评估音频信号是否包含伪声产生条件。举例来说,第一测试可包含将在LSP集合(例如,音频信号的特定帧的LSP)中检测的最小跨LSP间距与第一阈值进行比较。LSP之间的小间距对应于相对窄的频率范围处的相对强的信号。在特定实施例中,在确定高频带信号124产生具有小于第一阈值的最小跨LSP间距的帧时,确定伪声产生条件存在于音频信号中,且对于帧来说可启用增益衰减。
作为另一实例,第二测试可包含将多个连续帧的平均最小跨LSP间距与第二阈值进行比较。举例来说,在音频信号的特定帧具有大于第一阈值但小于第二阈值的最小LSP间距时,如果多个帧的平均最小跨LSP间距(例如,包含特定帧的最近四个帧的最小跨LSP间距的加权平均值)小于第三阈值,那么仍可确定存在伪声产生条件。结果,对于特定帧来说可启用增益衰减。
作为另一实例,第三测试可包含确定特定帧是否在音频信号的增益衰减帧之后。如果特定帧在增益衰减帧之后,那么对于特定帧来说可基于小于第二阈值的特定帧的最小跨LSP间距而启用增益衰减。
出于说明性目的描述三个测试。可响应于满足测试(或测试的组合)中的任何一或多者或响应于满足一或多个其它测试或条件而启用帧的增益衰减。举例来说,特定实施例可包含确定是否基于例如上文所描述的第一测试等单个测试启用增益衰减,而不应用第二测试或第三测试中的任一者。替代实施例可包含确定是否基于第二测试启用增益衰减,而不应用第一测试或第三测试中的任一者,或是否基于第三测试启用增益衰减,而不应用第一测试或第二测试中的任一者。作为另一实例,特定实施例可包含确定是否基于例如第一测试及第二测试等两个测试启用增益衰减,而不应用第三测试。替代实施例可包含确定是否基于第一测试及第三测试启用增益衰减,而不应用第二测试,或是否基于第二测试及第三测试启用增益衰减而不应用第一测试。
在对于特定帧已启用增益衰减时,对于特定帧也可启用增益平滑。举例来说,可通过确定特定帧的增益值及音频信号的先前帧的增益值的平均值(例如,加权平均值)来执行增益平滑。所确定的平均值可用作特定帧的增益值,从而减小音频信号的顺序帧之间的增益值的改变量。
对于特定帧来说可响应于确定特定帧的LSP值从LSP值的“缓慢”演进估计偏离小于第四阈值及从LSP值的“快速”演进估计偏离小于第五阈值而启用增益平滑。从缓慢演进估计的偏离量可被称为缓慢LSP演进速率。从快速演进估计的偏离量可被称为快速LSP演进速率,且可对应于比缓慢LSP演进速率更快的调适速率。
缓慢LSP演进速率可基于从多个顺序帧的LSP值的加权平均值的偏离,此举使一或多个先前帧的LSP值的权重比当前帧的LSP值更重。具有相对大的值的缓慢LSP演进速率指示LSP值正以不指示伪声产生条件的速率改变。然而,具有相对小的值(例如,小于第四阈值)的缓慢LSP演进速率对应于多个帧内的LSP的缓慢移动,此情形可指示进行中的伪声产生条件。
快速LSP演进速率可基于从多个顺序帧的LSP值的加权平均值的偏离,此举使当前帧的LSP值的权重比缓慢LSP演进速率的加权平均值更重。具有相对大的值的快速LSP演进速率可指示LSP值正以不指示伪声产生条件的速率改变,且具有相对小的值(例如,小于第五阈值)的快速LSP演进速率可对应于多个帧内的LSP的相对小的改变,此情形可指示伪声产生条件。
尽管缓慢LSP演进速率可用以指示多帧伪声产生条件何时开始,但缓慢LSP演进速率可导致在检测多帧伪声产生条件何时结束时的延迟。类似地,尽管快速LSP演进速率检测多帧伪声产生条件何时开始可比缓慢LSP演进速率更不可靠,但快速LSP演进速率可用以更准确地检测多帧伪声产生条件何时结束。可确定多帧伪声产生事件在进行中,同时缓慢LSP演进速率小于第四阈值,且快速LSP演进速率小于第五阈值。结果,可启用增益平滑以在伪声产生事件在进行中时防止帧增益值的突然或伪增加。
在特定实施例中,伪声诱发分量检测模块158可从音频信号确定四个参数以确定音频信号是否包含将产生可听见伪声的分量,即最小跨LSP间距、缓慢LSP演进速率、快速LSP演进速率及平均最小跨LSP间距。举例来说,第十级LP过程可产生经变换成十个LSP的十一个LPC的集合。伪声诱发分量检测模块158可针对音频的特定帧确定十个LSP中的任何两者之间的最小(minimum)(例如,最小(smallest))间距。通常,例如汽车喇叭及刺耳的刹车等急剧及突然噪声产生紧密地间隔开的LSP(例如,第一频谱图210中的“强”13kHz噪声分量可由12.95kHz及13.05kHz处的LSP紧密包围)。伪声诱发分量检测模块158还可确定缓慢LSP演进速率及快速演进速率,如下文C++风格的伪码中所示,所述伪码可由伪声诱发分量检测模块158执行或实施。
伪声诱发分量检测模块158可进一步根据下文伪码确定加权平均最小跨LSP间距。下文伪码还包含响应于模式转变复位跨LSP间距。此些模式转变可出现于支持音乐及/或话音的多个编码模式的装置中。举例来说,装置可使用用于话音的代数CELP(ACELP)模式及音频译码模式,即,用于音乐型信号的通用信号译码(GSC)。或者,在某些低速率情形中,装置可基于特征参数(例如,音值、音调漂移、发声等)确定可使用ACELP/GSC/经修改离散余弦变换(MDCT)模式。
在确定最小跨LSP间距、LSP演进速率及平均最小跨LSP间距之后,伪声诱发分量检测模块158可根据下文伪码将所确定的值与一或多个阈值进行比较,以确定伪声诱发噪声是否存在于音频帧中。在伪声诱发噪声存在时,伪声诱发分量检测模块158可启用增益衰减及平滑模块162以在适当时执行增益衰减及/或增益平滑。
THR1=0.008,
THR2=0.0032,
THR3=0.005,
THR4=0.001,
THR5=0.001,
GainAttenuate=FALSE,
GainSmooth=FALSE
在特定实施例中,增益衰减及平滑模块162可根据下文伪码选择性地执行增益衰减及/或平滑。
图1的系统100因此可执行增益控制(例如,增益衰减及/或增益平滑)以减小或防止归因于输入信号中的噪声的可听见伪声。图1的系统100因此可在存在噪声(其并未由话音译码信号模型进行说明)的情况下使得能够更准确地再现音频信号(例如,话语信号)。
参看图3,执行增益控制的方法的特定实施例的流程图经展示及通常经指定为300。在说明性实施例中,可在图1的系统100处执行方法300。
方法300可包含在302处接收待编码的音频信号(例如,经由话音译码信号模型)。在特定实施例中,音频信号可具有从约50Hz到约16kHz的带宽,且可包含话音。举例来说,在图1中,分析滤波器组110可接收经编码以在接收器处再现的输入音频信号102。
方法300还可包含在304处基于对应于音频信号的频谱信息(例如,跨LSP间距、LSP演进速率)确定音频信号包含对应于伪声产生条件的分量。在特定实施例中,伪声诱发分量可为噪声,例如图2的第一频谱图210中所示的高频噪声。举例来说,在图1中,伪声诱发分量检测模块158可基于频谱信息确定音频信号102的高频带部分包含此噪声。
确定音频信号包含分量可包含确定与音频信号的帧相关联的跨LSP间距。跨LSP间距可为对应于在音频信号的帧的高频带部分的线性预测性译码(LPC)期间产生的多个LSP的多个跨LSP间距中的最小者。举例来说,可响应于跨LSP间距小于第一阈值而确定音频信号包含分量。作为另一实例,可响应于跨LSP间距小于第二阈值及多个帧的平均跨LSP间距小于第三阈值而确定音频信号包含分量。如关于图5进一步详细描述,可响应于(1)跨LSP间距小于第二阈值及(2)以下各者中的至少一者而确定音频信号包含分量:平均跨LSP间距小于第三阈值或启用对应于音频信号的另一帧的增益衰减,所述另一帧在音频信号的帧之前。尽管用于确定音频信号是否包含分量的条件经标记为(1)及(2),但此些标签是仅出于参考目的,且不会强加操作的顺序次序。替代地,条件(1)及(2)可相对于彼此按任何次序或同时(在时间上至少部分重叠)确定。
方法300可进一步包含在306处响应于确定音频信号包含分量,调整对应于音频信号的增益参数。举例来说,在图1中,增益衰减及平滑模块162可修改包含于高频带辅助信息172中的增益信息,此情形导致经编码输出位流192从信号模型偏离。方法300可在308处结束。
调整增益参数可包含启用增益平滑以减小对应于音频信号的帧的增益值。在特定实施例中,增益平滑包含确定包含所述增益值及对应于音频信号的另一帧的另一增益值的增益值的加权平均值。可响应于与帧相关联的第一线谱对(LSP)演进速率小于第四阈值及与帧相关联的第二LSP演进速率小于第五阈值而启用增益平滑。第一LSP演进速率(例如,‘缓慢’LSP演进速率)可对应于比第二LSP演进速率(例如,‘快速’LSP演进速率)更慢的调适速率。
调整增益参数可包含启用增益衰减以减小对应于音频信号的帧的增益值。在特定实施例中,增益衰减包含将指数运算应用于增益值或将线性运算应用于增益值。举例来说,响应于满足第一增益条件(例如,帧包含小于第六阈值的平均跨LSP间距),可将指数运算应用于增益值。响应于满足第二增益条件(例如,启用对应于音频信号的另一帧的增益衰减,所述另一帧在音频信号的帧之前),可将线性运算应用于增益值。在特定实施例中,图3的方法300可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等),经由固件装置或其任何组合来实施。作为实例,图3的方法300可由执行指令的处理器执行,如关于图6所描述。
参考图4,执行增益控制的方法的特定实施例的流程图经展示及通常经指定为400。在说明性实施例中,可在图1的系统100处执行方法400。
在402处将与音频信号的帧相关联的跨线谱对(LSP)间距与至少一个阈值相比较,且在404处至少部分基于比较的结果调整对应于音频信号的增益参数。尽管将跨LSP间距与至少一个阈值进行比较可指示音频信号中的伪声产生分量的存在,但所述比较不一定指示伪声产生分量的实际存在。举例来说,用于比较的一或多个阈值可设定为提供在伪声产生分量存在于音频信号中时执行增益控制的增加可能性,同时还提供在伪声产生分量不存在于音频信号中(例如,‘误报’)的情况下执行增益控制的增加可能性。因此,方法400可在不确定伪声产生分量是否存在于音频信号中的情况下执行增益控制。
在特定实施例中,跨LSP间距为对应于音频信号的帧的高频带部分的多个LSP的多个跨LSP间距中的最小者。调整增益参数可包含响应于跨LSP间距小于第一阈值而启用增益衰减。或者或另外,调整增益参数包含响应于跨LSP间距小于第二阈值及平均跨LSP间距小于第三阈值而启用增益衰减,其中平均跨LSP间距是基于与帧相关联的跨LSP间距及与音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距。
在启用增益衰减时,调整增益参数可包含响应于满足第一增益条件将指数运算应用于增益参数的值,且响应于满足第二增益条件将线性运算应用于增益参数的值。
调整增益参数可包含启用增益平滑以减小对应于音频信号的帧的增益值。增益平滑可包含确定包含与帧相关联的增益值及对应于音频信号的另一帧的另一增益值的增益值的加权平均值。可响应于与帧相关联的第一线谱对(LSP)演进速率小于第四阈值及与帧相关联的第二LSP演进速率小于第五阈值而启用增益平滑。第一LSP演进速率对应于比第二LSP演进速率更慢的调适速率。
在特定实施例中,图4的方法400可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等),经由固件装置或其任何组合来实施。作为实例,图4的方法400可由执行指令的处理器执行,如关于图6所描述。
参看图5,执行增益控制的方法的另一特定实施例的流程图经展示及通常经指定为500。在说明性实施例中,可在图1的系统100处执行方法500。
方法500可包含在502处确定与音频信号的帧相关联的跨LSP间距。跨LSP间距可为对应于在帧的线性预测性译码期间产生的多个LSP的多个跨LSP间距中的最小者。举例来说,可如所说明参考对应于图1的伪码中的“lsp_spacing”变量来确定跨LSP间距。
方法500还可包含在504处确定与帧相关联的第一(例如,缓慢)LSP演进速率,及在506处确定与帧相关联的第二(例如,快速)LSP演进速率。举例来说,可如所说明参考对应于图1的伪码中的“lsp_slow_evol_rate”及“lsp_fast_evol_rate”变量来确定LSP演进速率。
方法500可进一步包含在508处基于与帧相关联的跨LSP间距及与音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距确定平均跨LSP间距。举例来说,可如所说明参考对应于图1的伪码中的“Average_lsp_shb_spacing”变量来确定平均跨LSP间距。
方法500可包含在510处确定跨LSP间距是否小于第一阈值。举例来说,在图1的伪码中,第一阈值可为“THR2”=0.0032。在跨LSP间距小于第一阈值时,方法500可包含在514处启用增益衰减。
在跨LSP间距不低于第一阈值时,方法500可包含在512处确定跨LSP间距是否小于第二阈值。举例来说,在图1的伪码中,第二阈值可为“THR1”=0.008。在跨LSP间距不低于第二阈值时,方法500可在522处结束。在跨LSP间距小于第二阈值时,方法500可包含在516处确定平均跨LSP间距是否小于第三阈值,帧是否表示模式转变(或以其它方式与其相关联),及/或是否在先前帧中启用增益衰减。举例来说,在图1的伪码中,第三阈值可为“THR3”=0.005。在平均跨LSP间距小于第三阈值或帧表示模式转变时或在变量prevGainAttenuate=TRUE的情况下,方法500可包含在514处启用增益衰减。在平均跨LSP间距不低于第三阈值且帧不表示模式转变且变量prevGainAttenuate=FALSE时,方法500可在522处结束。
在514处启用增益衰减时,方法500可前移到518,且在518处确定第一演进速率是否小于第四阈值及第二演进速率是否小于第五阈值。举例来说,在图1的伪码中,第四阈值可为“THR4”=0.001,且第五阈值可为“THR5”=0.001。在第一演进速率小于第四阈值且第二演进速率小于第五阈值时,方法500可包含在520处启用增益平滑,其后方法500可在522处结束。在第一演进速率不低于第四阈值或第二演进速率不低于第五阈值时,方法500可在522处结束。
在特定实施例中,图5的方法500可经由例如中央处理单元(CPU)、数字信号处理器(DSP)或控制器等处理单元的硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)等),经由固件装置或其任何组合来实施。作为实例,图5的方法500可由执行指令的处理器执行,如关于图6所描述。
图1到5因此说明确定是否执行增益控制(例如,在图1的增益衰减及平滑模块162处)以减小归因于噪声的伪声的系统及方法。
参看图6,无线通信装置的特定说明性实施例的框图经描绘且通常经指定为600。装置600包含耦合到存储器632的处理器610(例如,中央处理单元(CPU)、数字信号处理器(DSP)等)。存储器632可包含可由处理器610及/或译码器/解码器(CODEC)634执行以执行本文中所揭示的方法及过程(例如图3到5的方法)的指令660。
CODEC 634可包含增益控制系统672。在特定实施例中,增益控制系统672可包含图1的系统100的一或多个组件。增益控制系统672可经由专用硬件(例如,电路),由执行指令以执行一或多个任务的处理器或其组合来实施。作为实例,存储器632或CODEC 634中的存储器可为存储器装置,例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可装卸式磁盘或压缩光盘只读存储器(CD-ROM)。存储器装置可包含若干指令(例如,指令660),所述指令在由计算机(例如,CODEC 634中的处理器及/或处理器610)执行时可致使计算机基于对应于音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量,且响应于确定音频信号包含所述分量而调整对应于音频信号的增益参数。作为实例,存储器632或CODEC 634中的存储器可为包含指令(例如,指令660)的非暂时性计算机可读媒体,所述指令在由计算机(例如,CODEC634中的处理器及/或处理器610)执行时可致使计算机将与音频信号的帧相关联的跨线谱对(LSP)间距与至少一个阈值进行比较,且至少部分基于比较的结果调整对应于音频信号的音频编码增益参数。
图6还展示耦合到处理器610及耦合到显示器628的显示器控制器626。CODEC 634可耦合到处理器610,如图所示。扬声器636及麦克风638可耦合到CODEC 634。举例来说,麦克风638可产生图1的输入音频信号102,且CODEC 634可基于输入音频信号102产生用于发射到接收器的输出位流192。作为另一实例,扬声器636可用以输出由CODEC 634从图1的输出位流192重建的信号,其中从发射器接收输出位流192。图6还指示无线控制器640可耦合到处理器610及耦合到无线天线642。
在特定实施例中,处理器610、显示器控制器626、存储器632、CODEC 634及无线控制器640包含于系统级封装或片上系统装置(例如,移动台调制解调器(MSM))622中。在特定实施例中,例如触摸屏及/或小键盘等输入装置630及电力供应器644耦合到片上系统装置622。此外,在特定实施例中,如图6中所说明,显示器628、输入装置630、扬声器636、麦克风638、无线天线642及电力供应器644在片上系统装置622的外部。然而,显示器628、输入装置630、扬声器636、麦克风638、无线天线642及电力供应器644中的每一者可耦合到片上系统装置622的组件,例如接口或控制器。
结合所描述实施例,揭示一种设备,其包含用于基于对应于音频信号的频谱信息确定音频信号包含对应于伪声产生条件的分量的装置。举例来说,用于确定的装置可包含图1的伪声诱发分量检测模块158、图6的增益控制系统672或其组件、经配置以确定音频信号包含此分量的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
所述设备还可包含用于响应于确定音频信号包含分量调整对应于音频信号的增益参数的装置。举例来说,用于调整的装置可包含图1的增益衰减及平滑模块162、图6的增益控制系统672或其组件、经配置以产生经编码信号的一或多个装置(例如,执行非暂时性计算机可读存储媒体处的指令的处理器)或其任何组合。
所属领域的技术人员将进一步了解,结合本文所揭示的实施例所描述的各种说明性逻辑块、配置、模块、电路及算法步骤可实施为电子硬件、由例如硬件处理器等处理装置执行的计算机软件或两者的组合。上文已大体在其功能性方面描述各种说明性组件、区块、配置、模块、电路和步骤。此功能性是实施为硬件还是可执行软件取决于特定应用及施加于整个系统的设计约束。熟练的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但此类实施决策不应被解译为引起对本发明的范围的偏离。
结合本文所揭示的实施例而描述的方法或算法的步骤可直接体现在硬件、由处理器执行的软件模块或所述两者的组合中。软件模块可驻留于存储器装置中,所述存储器装置例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可装卸式磁盘或压缩光盘只读存储器(CD-ROM)。示范性存储器装置耦合到处理器,使得处理器可从存储器装置读取信息并将信息写入到存储器装置。在替代方案中,存储器装置可与处理器集成。处理器及存储媒体可驻留在专用集成电路(ASIC)中。ASIC可以驻留在计算装置或用户终端中。在替代方案中,处理器与存储媒体可作为离散组件驻留在计算装置或用户终端中。
提供对所揭示实施例的先前描述以使得所属领域的技术人员能够制造或使用所揭示的实施例。所属领域的技术人员将容易了解对这些实施例的各种修改,且可在不脱离本发明的范围的情况下将本文定义的原理应用到其它实施例。因此,本发明并不希望限于本文展示的实施例,而应符合与如通过所附权利要求书界定的原理及新颖特征一致的可能的最宽范围。
Claims (37)
1.一种方法,其包括:
基于与音频信号的帧相关联的跨线谱对LSP间距确定所述音频信号包含对应于伪声产生条件的分量;及
响应于确定所述音频信号包含所述分量,调整对应于所述音频信号的增益参数。
2.根据权利要求1所述的方法,其中所述跨LSP间距与所述音频信号的帧相关联。
3.根据权利要求2所述的方法,其中所述跨LSP间距为对应于所述音频信号的所述帧的高频带部分的多个LSP的多个跨LSP间距中的最小者。
4.根据权利要求2所述的方法,其中响应于所述跨LSP间距小于第一阈值而确定所述音频信号包含所述分量。
5.根据权利要求2所述的方法,其中响应于所述跨LSP间距小于第二阈值及平均跨LSP间距小于第三阈值而确定所述音频信号包含所述分量,其中所述平均跨LSP间距是基于与所述帧相关联的所述跨LSP间距及与所述音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距。
6.根据权利要求2所述的方法,其中响应于以下各者而确定所述音频信号包含所述分量:
1)所述跨LSP间距小于第二阈值;及
2)以下各者中的至少一者:
平均跨LSP间距小于第三阈值;或
启用对应于所述音频信号的另一帧的增益衰减,所述另一帧在所述音频信号的所述帧之前。
7.根据权利要求1所述的方法,其中调整所述增益参数包含启用增益平滑以减小对应于所述音频信号的帧的增益值的更快变化。
8.根据权利要求7所述的方法,其中所述增益平滑包含确定包含与所述帧相关联的所述增益值及对应于所述音频信号的另一帧的另一增益值的增益值的加权平均值。
9.根据权利要求7所述的方法,其中响应于与所述帧相关联的第一线谱对LSP演进速率小于第四阈值及与所述帧相关联的第二LSP演进速率小于第五阈值而启用所述增益平滑。
10.根据权利要求9所述的方法,其中所述第一LSP演进速率对应于比所述第二LSP演进速率更慢的调适速率。
11.根据权利要求1所述的方法,其中调整所述增益参数包含启用增益衰减以减小对应于所述音频信号的帧的增益值。
12.根据权利要求11所述的方法,其中所述增益衰减包含将指数运算应用于所述增益值。
13.根据权利要求11所述的方法,其中所述增益衰减包含将线性运算应用于所述增益值。
14.根据权利要求11所述的方法,其中所述增益衰减包含:
响应于满足第一增益条件,将指数运算应用于所述增益值;及
响应于满足第二增益条件,将线性运算应用于所述增益值。
15.根据权利要求14所述的方法,其中所述第一增益条件包含平均跨LSP间距小于第六阈值,其中所述平均跨LSP间距是基于与所述帧相关联的所述跨LSP间距及与所述音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距。
16.根据权利要求14所述的方法,其中所述第二增益条件包含启用对应于所述音频信号的另一帧的增益衰减,所述另一帧在所述音频信号的所述帧之前。
17.根据权利要求1所述的方法,其中所述伪声产生条件对应于高频带噪声。
18.一种方法,其包括:
将与音频信号的帧相关联的跨线谱对LSP间距与至少一个阈值进行比较;及
至少部分基于所述比较的结果调整对应于所述音频信号的音频编码增益参数。
19.根据权利要求18所述的方法,其中所述跨LSP间距为对应于所述音频信号的所述帧的高频带部分的多个LSP的多个跨LSP间距中的最小者。
20.根据权利要求18所述的方法,其中调整所述增益参数包含响应于所述跨LSP间距小于第一阈值而启用增益衰减。
21.根据权利要求18所述的方法,其中调整所述增益参数包含响应于所述跨LSP间距小于第二阈值及平均跨LSP间距小于第三阈值而启用增益衰减,其中所述平均跨LSP间距是基于与所述帧相关联的所述跨LSP间距及与所述音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距。
22.根据权利要求18所述的方法,其中调整所述增益参数包含在启用增益衰减时:
响应于满足第一增益条件,将指数运算应用于所述增益参数的值;及
响应于满足第二增益条件,将线性运算应用于所述增益参数的所述值。
23.根据权利要求18所述的方法,其中调整所述增益参数包含启用增益平滑以减小对应于所述音频信号的帧的增益值的更快变化。
24.根据权利要求23所述的方法,其中所述增益平滑包含确定包含与所述帧相关联的所述增益值及对应于所述音频信号的另一帧的另一增益值的增益值的加权平均值。
25.根据权利要求24所述的方法,其中响应于与所述帧相关联的第一线谱对LSP演进速率小于第四阈值及与所述帧相关联的第二LSP演进速率小于第五阈值而启用所述增益平滑,且其中所述第一LSP演进速率对应于比所述第二LSP演进速率更慢的调适速率。
26.一种设备,其包括:
噪声检测电路,其经配置以基于与音频信号的帧相关联的跨线谱对LSP间距确定所述音频信号包含对应于伪声产生条件的分量;及
增益衰减及平滑电路,其对所述噪声检测电路作出响应,且经配置以响应于确定所述音频信号包含所述分量,调整对应于所述音频信号的增益参数。
27.根据权利要求26所述的设备,其进一步包括:
分析滤波器组,其经配置以接收所述音频信号及产生所述音频信号的低频带部分及所述音频信号的高频带部分;
低频带分析电路,其经配置以基于所述低频带部分产生低频带位流;
高频带分析电路,其经配置以基于所述高频带部分及与所述低频带部分相关联的低频带激励产生高频带辅助信息,其中包含所述增益参数的增益信息包含于所述高频带辅助信息中;及
多路复用器,其经配置以对所述低频带位流及所述高频带辅助信息进行多路复用以产生输出位流。
28.一种设备,其包括:
用于基于与音频信号的帧相关联的跨线谱对LSP间距确定所述音频信号包含对应于伪声产生条件的分量的装置;及
用于响应于确定所述音频信号包含所述分量而调整对应于所述音频信号的增益参数的装置。
29.根据权利要求28所述的设备,其进一步包括:
用于产生所述音频信号的低频带部分及所述音频信号的高频带部分的装置;
用于基于所述低频带部分产生低频带位流的装置;
用于基于所述高频带部分及与所述低频带部分相关联的低频带激励产生高频带辅助信息的装置,其中包含所述增益参数的增益信息包含于所述高频带辅助信息中;及
用于对所述低频带位流及所述高频带辅助信息进行多路复用以产生输出位流的装置。
30.一种非暂时性计算机可读媒体,其包括若干指令,所述指令在由计算机执行时致使所述计算机:
基于与对应于音频信号的音频信号的帧相关联的跨线谱对LSP间距确定所述音频信号包含对应于伪声产生条件的分量;及
响应于确定所述音频信号包含所述分量而调整对应于所述音频信号的增益参数。
31.根据权利要求30所述的计算机可读媒体,其中所述跨LSP间距为对应于所述音频信号的所述帧的高频带部分的多个LSP的多个跨LSP间距中的最小者。
32.根据权利要求30所述的计算机可读媒体,其中调整所述增益参数包含响应于所述跨LSP间距小于第一阈值而启用增益衰减。
33.根据权利要求30所述的计算机可读媒体,其中调整所述增益参数包含响应于所述跨LSP间距小于第二阈值及平均跨LSP间距小于第三阈值而启用增益衰减,其中所述平均跨LSP间距是基于与所述帧相关联的所述跨LSP间距及与所述音频信号的至少一个其它帧相关联的至少一个其它跨LSP间距。
34.根据权利要求30所述的计算机可读媒体,其中调整所述增益参数包含在启用增益衰减时:
响应于满足第一增益条件,将指数运算应用于所述增益参数的值;及
响应于满足第二增益条件,将线性运算应用于所述增益参数的所述值。
35.根据权利要求30所述的计算机可读媒体,其中调整所述增益参数包含启用增益平滑以减小对应于所述音频信号的帧的增益值的更快变化。
36.根据权利要求35所述的计算机可读媒体,其中所述增益平滑包含确定包含与所述帧相关联的所述增益值及对应于所述音频信号的另一帧的另一增益值的增益值的加权平均值。
37.根据权利要求36所述的计算机可读媒体,其中响应于与所述帧相关联的第一线谱对LSP演进速率小于第四阈值及与所述帧相关联的第二LSP演进速率小于第五阈值而启用所述增益平滑,且其中所述第一LSP演进速率对应于比所述第二LSP演进速率更慢的调适速率。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361762803P | 2013-02-08 | 2013-02-08 | |
US61/762,803 | 2013-02-08 | ||
US13/959,090 US9741350B2 (en) | 2013-02-08 | 2013-08-05 | Systems and methods of performing gain control |
US13/959,090 | 2013-08-05 | ||
PCT/US2013/053791 WO2014123578A1 (en) | 2013-02-08 | 2013-08-06 | Systems and methods of performing gain control |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104956437A true CN104956437A (zh) | 2015-09-30 |
CN104956437B CN104956437B (zh) | 2018-10-26 |
Family
ID=51298065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380071693.7A Active CN104956437B (zh) | 2013-02-08 | 2013-08-06 | 执行增益控制的系统及方法 |
Country Status (24)
Country | Link |
---|---|
US (1) | US9741350B2 (zh) |
EP (1) | EP2954524B1 (zh) |
JP (1) | JP6185085B2 (zh) |
KR (1) | KR101783114B1 (zh) |
CN (1) | CN104956437B (zh) |
AU (1) | AU2013377884B2 (zh) |
BR (1) | BR112015019056B1 (zh) |
CA (1) | CA2896811C (zh) |
DK (1) | DK2954524T3 (zh) |
ES (1) | ES2618258T3 (zh) |
HK (1) | HK1211376A1 (zh) |
HR (1) | HRP20170232T1 (zh) |
HU (1) | HUE031736T2 (zh) |
IL (1) | IL239718A (zh) |
MY (1) | MY183416A (zh) |
PH (1) | PH12015501694A1 (zh) |
PT (1) | PT2954524T (zh) |
RS (1) | RS55653B1 (zh) |
RU (1) | RU2643454C2 (zh) |
SG (1) | SG11201505066SA (zh) |
SI (1) | SI2954524T1 (zh) |
UA (1) | UA114027C2 (zh) |
WO (1) | WO2014123578A1 (zh) |
ZA (1) | ZA201506578B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106067847A (zh) * | 2016-05-25 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
US10163453B2 (en) * | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
US10346125B2 (en) * | 2015-08-18 | 2019-07-09 | International Business Machines Corporation | Detection of clipping event in audio signals |
AU2017219696B2 (en) | 2016-02-17 | 2018-11-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
SG11201808684TA (en) * | 2016-04-12 | 2018-11-29 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
CN108011686B (zh) * | 2016-10-31 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 信息编码帧丢失恢复方法和装置 |
WO2021260683A1 (en) * | 2020-06-21 | 2021-12-30 | Biosound Ltd. | System, device and method for improving plant growth |
CN113473316B (zh) * | 2021-06-30 | 2023-01-31 | 苏州科达科技股份有限公司 | 音频信号处理方法、装置及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04230800A (ja) * | 1990-05-28 | 1992-08-19 | Matsushita Electric Ind Co Ltd | 音声信号処理装置 |
JP2000221998A (ja) * | 1999-01-28 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 音声符号化方法及び音声符号化装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN101335002A (zh) * | 2007-11-02 | 2008-12-31 | 华为技术有限公司 | 一种音频解码的方法和装置 |
US20090192803A1 (en) * | 2008-01-28 | 2009-07-30 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
US20110099004A1 (en) * | 2009-10-23 | 2011-04-28 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US20110295598A1 (en) * | 2010-06-01 | 2011-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
WO2012110447A1 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6263307B1 (en) | 1995-04-19 | 2001-07-17 | Texas Instruments Incorporated | Adaptive weiner filtering using line spectral frequencies |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
CA2399706C (en) | 2000-02-11 | 2006-01-24 | Comsat Corporation | Background noise reduction in sinusoidal based speech coding systems |
KR100566163B1 (ko) * | 2000-11-30 | 2006-03-29 | 마츠시타 덴끼 산교 가부시키가이샤 | 음성 복호화 장치, 음성 복호화 방법 및 프로그램을기록한 기록 매체 |
EP2107557A3 (en) * | 2005-01-14 | 2010-08-25 | Panasonic Corporation | Scalable decoding apparatus and method |
EP1864281A1 (en) | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
PL1875463T3 (pl) | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
US8725499B2 (en) | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
RU2483363C2 (ru) * | 2006-11-30 | 2013-05-27 | Энтони БОНДЖИОВИ | Устройство и способ для цифровой обработки сигнала |
US20080208575A1 (en) | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
JP5141691B2 (ja) * | 2007-11-26 | 2013-02-13 | 富士通株式会社 | 音処理装置、補正装置、補正方法及びコンピュータプログラム |
EP2211335A1 (en) * | 2009-01-21 | 2010-07-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
US8869271B2 (en) | 2010-02-02 | 2014-10-21 | Mcafee, Inc. | System and method for risk rating and detecting redirection activities |
US8381276B2 (en) | 2010-08-23 | 2013-02-19 | Microsoft Corporation | Safe URL shortening |
EP2710590B1 (en) | 2011-05-16 | 2015-10-07 | Google, Inc. | Super-wideband noise supression |
-
2013
- 2013-08-05 US US13/959,090 patent/US9741350B2/en active Active
- 2013-08-06 SI SI201330520A patent/SI2954524T1/sl unknown
- 2013-08-06 RS RS20170102A patent/RS55653B1/sr unknown
- 2013-08-06 BR BR112015019056-1A patent/BR112015019056B1/pt active IP Right Grant
- 2013-08-06 PT PT137532230T patent/PT2954524T/pt unknown
- 2013-08-06 DK DK13753223.0T patent/DK2954524T3/en active
- 2013-08-06 SG SG11201505066SA patent/SG11201505066SA/en unknown
- 2013-08-06 RU RU2015138122A patent/RU2643454C2/ru active
- 2013-08-06 MY MYPI2015702274A patent/MY183416A/en unknown
- 2013-08-06 AU AU2013377884A patent/AU2013377884B2/en active Active
- 2013-08-06 CA CA2896811A patent/CA2896811C/en active Active
- 2013-08-06 UA UAA201508663A patent/UA114027C2/uk unknown
- 2013-08-06 CN CN201380071693.7A patent/CN104956437B/zh active Active
- 2013-08-06 ES ES13753223.0T patent/ES2618258T3/es active Active
- 2013-08-06 HU HUE13753223A patent/HUE031736T2/en unknown
- 2013-08-06 EP EP13753223.0A patent/EP2954524B1/en active Active
- 2013-08-06 KR KR1020157023782A patent/KR101783114B1/ko active IP Right Grant
- 2013-08-06 JP JP2015556928A patent/JP6185085B2/ja active Active
- 2013-08-06 WO PCT/US2013/053791 patent/WO2014123578A1/en active Application Filing
-
2015
- 2015-06-30 IL IL239718A patent/IL239718A/en active IP Right Grant
- 2015-07-31 PH PH12015501694A patent/PH12015501694A1/en unknown
- 2015-09-07 ZA ZA2015/06578A patent/ZA201506578B/en unknown
- 2015-12-07 HK HK15112044.4A patent/HK1211376A1/zh unknown
-
2017
- 2017-02-13 HR HRP20170232TT patent/HRP20170232T1/hr unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04230800A (ja) * | 1990-05-28 | 1992-08-19 | Matsushita Electric Ind Co Ltd | 音声信号処理装置 |
JP2000221998A (ja) * | 1999-01-28 | 2000-08-11 | Matsushita Electric Ind Co Ltd | 音声符号化方法及び音声符号化装置 |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CN101335002A (zh) * | 2007-11-02 | 2008-12-31 | 华为技术有限公司 | 一种音频解码的方法和装置 |
US20090192803A1 (en) * | 2008-01-28 | 2009-07-30 | Qualcomm Incorporated | Systems, methods, and apparatus for context replacement by audio level |
US20110099004A1 (en) * | 2009-10-23 | 2011-04-28 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
US20110295598A1 (en) * | 2010-06-01 | 2011-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
WO2012110447A1 (en) * | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for error concealment in low-delay unified speech and audio coding (usac) |
Non-Patent Citations (1)
Title |
---|
B.L. PELLOM ET AL.: "An improved (Auto:I, LSP:T) constrained iterative speech enhancement for colored noise environments", 《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106067847A (zh) * | 2016-05-25 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
CN106067847B (zh) * | 2016-05-25 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 一种语音数据传输方法及装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104956437A (zh) | 执行增益控制的系统及方法 | |
DK3138096T3 (en) | Highband excitation signal-GENERATION | |
CN104969291B (zh) | 执行用于增益确定的滤波的系统及方法 | |
US10141001B2 (en) | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding | |
RU2636685C2 (ru) | Решение относительно наличия/отсутствия вокализации для обработки речи | |
US9620134B2 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
CN105612578B (zh) | 用于信号处理的方法和设备 | |
EP3471098A1 (en) | High-band signal modeling | |
US20150162008A1 (en) | Bandwidth extension mode selection | |
AU2014331903A1 (en) | Gain shape estimation for improved tracking of high-band temporal characteristics | |
EP3127112B1 (en) | Apparatus and methods of switching coding technologies at a device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1211376 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |