CN101501759A - 具有动态可变规整特性的音频编码器、音频解码器和音频处理器 - Google Patents
具有动态可变规整特性的音频编码器、音频解码器和音频处理器 Download PDFInfo
- Publication number
- CN101501759A CN101501759A CNA2007800302813A CN200780030281A CN101501759A CN 101501759 A CN101501759 A CN 101501759A CN A2007800302813 A CNA2007800302813 A CN A2007800302813A CN 200780030281 A CN200780030281 A CN 200780030281A CN 101501759 A CN101501759 A CN 101501759A
- Authority
- CN
- China
- Prior art keywords
- encryption algorithm
- signal
- audio
- regular
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 164
- 230000005236 sound signal Effects 0.000 claims abstract description 115
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims description 74
- 238000011045 prefiltration Methods 0.000 claims description 55
- 238000000034 method Methods 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 claims description 30
- 230000000873 masking effect Effects 0.000 claims description 24
- 230000005284 excitation Effects 0.000 claims description 22
- 238000001228 spectrum Methods 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 20
- 230000008859 change Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000013459 approach Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013139 quantization Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 2
- 239000000284 extract Substances 0.000 claims 2
- 238000005303 weighing Methods 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 17
- 230000008447 perception Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000010276 construction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000005086 pumping Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种音频编码器、音频解码器或音频处理器,包括:滤波器(12),用于产生经滤波的音频信号,所述滤波器具有可变规整特性,所述规整特性可响应于时变控制信号(16)得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性。此外,控制器(18)连接用于提供取决于音频信号的时变控制信号。经滤波的音频信号可以被引入具有不同编码算法的编码处理器(22),所述编码算法之一是适于特定信号模式的编码算法。可选地,滤波器是接收经解码的音频信号的后置滤波器。
Description
技术领域
本发明涉及采用规整滤波器的音频处理,具体涉及多用途音频编码。
背景技术
在低比特率音频以及语音编码技术环境下,传统上采用几种不同的编码技术,从而在给定速率下以尽可能好的主观质量对此类信号进行低比特率编码。一般的音乐/声音信号所用的编码器旨在,根据掩蔽阈值曲线对量化误差的谱(时域)形状进行成形,以优化主观质量,所述掩蔽阈值曲线是利用感知模型(“感知音频编码”)根据输入信号来估计得到的。另一方面,当基于人类语音的产生模型进行语音编码时,以极低的比特率进行语音编码是很有效的,所述基于人类语音的产生模型进行语音编码,即:使用线性预测编码(LPC)以对人类声道的谐振效应进行建模,并对残差激励信号进行高效编码。
由于上述两种不同方法的缘故,对于极低数据速率的语音信号,一般的音频编码器(如MPEG-1层3、或MPEG-2/4高级音频编码、AAC)由于没有利用语音源模型,因此其性能通常不如专用的基于LPC的语音编码器好。相反,基于LPC的语音编码器在应用于一般的音乐信号时,由于不能根据掩蔽阈值曲线灵活地将编码失真的谱包络进行成形,因此通常不能取得令人满意的结果。本发明的目的在于,提供一种概念,将基于LPC的编码同感知音频编码的优势合并于单一框架下,从而提出对于一般音频和语音信号均很有效的统一音频编码。
以下部分对一组为高效地对音频以及语音信号进行编码而提出的相关技术进行说明。
感知音频编码(图9)
传统上,感知音频编码器使用基于滤波器组的方法,来高效地对音频信号进行编码,以及根据对掩蔽曲线的估计,将量化失真成形。
图9示出了单声道感知编码系统的基本方框图。分析滤波器组用于将时域采样映射至子采样谱分量。
根据谱分量的数目,系统还被称为子带编码器(子带数目较少,例如,32)或基于滤波器组的编码器(谱线数目很大,例如,512)。感知(“心理声学”)模型用于估计实际的时间相关掩蔽阈值。谱(“子带”或“频域”)分量的量化和编码方式为,将量化噪声隐藏在实际的发送信号下,并且在解码之后无法察觉量化噪声。这是通过在时域和频域上改变谱值的量化粒度来实现的。
最近提出了一种基于前置/后置滤波的编码,作为完全基于滤波器组的感知编码概念的可替换方法,如图10所示。
在[Ed 100]中,提出了一种感知音频编码器,该感知音频编码器通过使用所谓的前置滤波器而不是频域上的谱系数的可变量化,将减小非相关性(即,根据感知准则进行噪声成形)以及减小冗余(即,获得在数学上更加简洁的信息表示)的方面进行分离。在下图中对该原理进行了说明。感知模型对输入信号进行分析,以估算以频率为自变量的掩蔽阈值曲线。将掩蔽阈值转换为一组前置滤波器系数,使前置滤波器频率响应的幅度与掩蔽阈值成反比。前置滤波操作将这组系数作用于输入信号,从而产生输出信号,其中,根据频率分量的感知重要性表现全部频率分量(“感知白化”)。接着,利用任意类型的音频编码器对该信号进行编码,即不采用任何感知噪声成形,从而产生“白”量化失真。因此,音频信号的传输/存储包括编码器的比特流以及前置滤波系数的编码版本。在解码器中,将编码器比特流解码为中间音频信号,接着根据所发送的滤波器系数对中间音频信号进行后置滤波操作。由于后置滤波器执行与前置滤波器相对的逆滤波过程,因此它根据掩蔽曲线对其输入信号应用谱加权。采用这种方法,像预期的那样,谱平坦(“白”)编码噪声看似在解码器输出端得到感知成形。
由于在这样的方案中感知噪声成形是通过前置/后置滤波步骤而不是通过对谱系数进行频率相关量化来实现的,因此可以将此概念推广为包括:除基于滤波器组的音频编码器以外的、用于表示经前置滤波的音频信号的非基于滤波器组的编码机制。在[Sch02]中,针对使用预测和熵编码级的时域编码核示出了这个概念。
[Edl00]B.Edler,G.Schuller:″Audio coding using a psychoacousticpre-and post-filter″,ICASSP 2000,Volume 2,5-9 June 2000 Page(s):II881-II884 vol.2
[Sch02]G.Schuller,B.Yu,D.Huang,and B.Edler,″Perceptual AudioCoding using Adaptive Pre-and post-filters and Lossless Compression″,IEEETransactions on Speech and Audio Processing,September 2002,pp.379-390
为了利用前置/后置滤波技术实现适当的谱噪声成形,使前置/后置滤波器的频率分辨率适应于人类听觉系统的频率分辨率是十分重要的。理想情况下,频率分辨率遵循众所周知的感知频率标度,如BARK或ERB频率标度[Zwi]。为了最小化前置/后置滤波器模型的阶,从而最小化相关计算复杂度和辅助信息传输速率,极其希望满足该条件。
前置/后置滤波器频率分辨率的调整可由众所周知的频率规整概念[KHL97]予以实现。本质上,用导致滤波器频率响应的非均匀变形(“规整”)的(一阶或高阶)全通滤波器代替滤波器结构内的单位延迟。已知即使利用一阶全通滤波器(如),也可以通过适当选择全通系数十分精确地逼近感知频率标度[SA99]。由于一阶全通滤波器完全取决于决定频率标度变形的单个标量参数(以下称为“规整因子”-1<λ<1)。因此,大多数已知系统不利用高阶全通滤波器进行频率规整。举例而言,对于规整因子λ=0,无有效变形,即滤波器以正常频率标度工作。所选的规整因子越高,集中于谱的低频部分的频率分辨率越高(由于必须逼近感知频率标度),所述较高的频率分辨率是从谱的高频部分获得的。图5针对正规整系数和负规整系数示出了上述情况:
利用规整前置/后置滤波器,音频编码器通常以诸如48kHz或44.1kHz的常见采样率使用8至20间的滤波器阶数[WSKH05]。
现已记录了规整滤波的多种其他应用,如房间冲激响应建模[HKS00]、音频信号中噪声分量的参数建模(其等效术语为Laguerre/Kauz滤波)[SOB03]。
[Zwi]Zwicker,E.and H.Fastl,“Psychoacoustics,Facts and Models”,Springer Verlag,Berlin
[KHL97]M.Karjalainen,A.,U.K.Laine,“Realizable warped IIRfilters and their properties”,IEEE ICASSP 1997,pp.2205-2208,vol.3
[SA99] J.O.Smith,J.S.Abel,“BARK and ERB Bilinear Transforms”,IEEE Transactions on Speech and Audio Processing,Volume 7, Issue 6,Nov.1999,pp.697-708
[HKS00]Aki;Karjalainen,Matti;Savioja,Lauri;Vesa;Laine,Unto K.;Huopaniemi,Jyri,“Frequency-Warped Signal Processing forAudio Applications”,Journal of the AES,Volume 48 Number 11 pp.1011-1031;November 2000
[SOB03]E.Schuijers,W.Oomen,B.den Brinker,J.Breebaart,“Advances in Parametric Coding for High-Quality Audio”,114th Convention,Amsterdam,The Netherlands 2003,preprint 5852
[WSKH05]S.Wabnik,G.Schuller,U.,J.Hirschfeld,“Frequency Warping in Low Delay Audio Coding”,IEEE InternationalConference on Acoustics,Speech,and Signal Processing,March 18-23,2005,Philadelphia,PA,USA
基于LPC的语音编码
传统上,高效语音编码基于线性预测编码(LPC),以对人类声道的谐振效应进行建模并对残差激励信号进行高效编码[VM06]。将LPC和激励参数从编码器传送至解码器。以下附图(编码器和解码器)示出了该原理。
随着技术的发展,现已针对残差(激励)信号的高效和感知有效的表示提出了许多方法,如多脉冲激励(MPE)、规则脉冲激励(RPE)和码激励线性预测编码(CELP)。
线性预测编码试图基于对于特定数量的过去值的观察产生过去观察的线性组合,作为对于当前采样值序列的估计。为了减小输入信号中的冗余,编码器LPC滤波器在其谱包络中“白化”输入信号,即,其频率响应是信号谱包络的逆的模型。相反地,解码器LPC滤波器的频率响应是信号谱包络的模型。特别地,已知著名的自动回归(AR)线性预测分析利用全极点近似对信号谱包络进行建模。
典型地,窄带语音编码器(即,具有8kHz采样率的语音编码器)采用阶数在8至12间的LPC滤波器。由于LPC滤波器特性的缘故,均匀频率分辨率在整个频率范围内都是有效的。这与感知频率标度并不对应。
规整LPC编码
值得注意,由规整技术提供的非均匀频率灵敏度也可以为语音编码提供优势,已提出用规整预测分析替代规则LPC分析。特别地,[TML94]提出一种语音编码器,通过根据时变输入信号逐采样更新的倒谱系数c(m)对语音谱包络进行建模。利用一阶全通滤波器而不是通常的单位延迟,调整模型的频率标度,使其近似于感知MEL标度[Zwi]。以8kHz的编码器采样率使用0.31的固定规整系数。在[KTK95]中,该方法还进一步发展为包括用于表示激励信号的CELP编码核,该编码核仍然使用0.31的固定规整系数。
虽然作者宣称所提出的方案具有良好的性能,但现有技术的语音编码并未采用预测编码技术。
已知规整LPC和CELP编码的其他组合,如[HLM99],其中以44.1kHz的采样率使用0.723的规整因子。
[TMK94]K.Tokuda,H.Matsumura,T.Kobayashi and S.Imai,“Speechcoding based on adaptive mel-cepstral analysis,”Proc.IEEE ICASSP’94,pp.197-200,Apr.1994.
[KTK95]K.Koishida,K.Tokuda,T.Kobayashi and S.Imai,“CELPcoding based on mel-cepstral analysis,”Proc.IEEE ICASSP’95,pp.33-36,1995.
[HLM99]Aki Unto K.Laine,Matti Karjalainen,“Warpedlow-delay CELP for wideband audio coding”,17th International AESConference,Florence,Italy,1999
[VM06]Peter Vary, Rainer Martin,“Digital Speech Transmission:Enhancement,Coding and Error Concealment”,published by John Wiley &Sons,LTD,2006,ISBN 0-471-56018-9
推广的规整LPC编码
在随后几年内在规整频率标度上执行语音编码的概念得到了进一步的发展。特别地,注意到根据感知频率标度对谱分析进行完全常规规整可能不适于实现可能的最佳质量。因此,在[KTK96]中提出了Mel推广倒谱分析,允许谱模型特性在前面提出的mel倒谱分析的谱模型特性(具有全规整频率标度和倒谱分析)和传统LPC模型的特性(具有均匀频率标度和信号谱包络的全极点模型)之间渐变。特别地,所提出的一般分析具有两个控制上述特性的参数:
●参数γ,-1≤γ≤0连续在倒谱型和LPC型分析间渐变,其中,γ=0对应于倒谱型分析,γ=-1对应于LPC型分析。
●参数α,|α|<1是规整因子。α=0对应于完全均匀的频率标度(如在标准LPC中那样),α=0.31对应于完全感知频率规整。
在[KHT98]中将相同的概念应用于宽带语音编码(以16kHz采样率进行编码)。应当注意的是,针对这样的推广分析的工作点(γ;α)是先验选定的,并且不随时间变化。
[KTK96]K.Koishida,K.Tokuda,T.Kobayashi and S.Imai,“CELPcoding system based on mel-generalized cepstral analysis,”Proc.ICSLP’96,pp.318-321,1996.
[KHT98]K.Koishida,G.Hirabayashi,K.Tokuda,and T.Kobayashi,“Awideband CELP speech coder at 16 kbit/s based on mel-generalized cepstralanalysis,”Proc.IEEE ICASSP’98,pp.161-164,1998.
包括编码滤波器和两个可选编码核的结构已在文献(“WB-AMR+编码器”[BLS05])中进行了描述。不存在使用规整滤波器的任何概念,甚至使用具有时变规整特性的滤波器的概念。
[BLS05]B.Bessette,R.Lefebvre,R.Salami,“UNIVERSALSPEECH/AUDIO CODING USING HYBRID ACELP/TCX TECHNIQUES,”Proc.IEEE ICASSP 2005,pp.301-304,2005.
所有上述技术的缺陷在于,它们都是专门用于特定的音频编码算法的。采用规整滤波器的任何语音编码器都最佳地适应于语音信号,但是当用于对一般音频信号(如音乐信号)进行编码时语音编码器性能不佳。
另一方面,一般的音频编码器被优化为完美地将量化噪声隐藏于掩蔽阈值以下,即最佳地适应于减小非相关性。因此,它们具有满足人类听觉机制的非均匀频率分辨率的功能。然而,由于它们是一般的音频编码器,因此无法特别地利用有关特定类型信号模式的任何先验知识,而这是获得获知于例如语音编码器的极低比特率的原因。
此外,许多语音编码器是使用固定和可变码本的时域编码器,然而由于作为频率度量的掩蔽阈值的问题,大多数一般音频编码器是基于滤波器组的编码器,因此虽然还存在基于时域的一般的音频编码器,但是以高效的方式将两个编码器引入单个编码/解码框架困难重重。
发明内容
本发明的目的是,提供一种改进的通用编码概念,不仅为特定信号模式甚至为一般音频信号提供较高的质量和较低的比特率。
根据本发明的第一方面,该目的是通过对音频信号进行编码的音频编码器予以实现的,所述音频编码器包括:前置滤波器用于产生经前置滤波的音频信号,所述前置滤波器具有可变规整特性,所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;控制器,用于提供所述时变控制信号,所述时变控制信号取决于所述音频信号;以及可控编码处理器,用于处理经前置滤波的音频信号,以获得经编码的音频信号,其中所述编码处理器适于根据第一编码算法或根据第二编码算法处理经前置滤波的音频信号,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码。
优选地,所述编码处理器适于受控制器控制,从而利用第二编码算法处理利用相对较高的规整特性进行滤波的音频信号部分,以获得经编码的信号,并利用第一编码算法处理利用较小规整特性或未利用规整特性进行滤波的音频信号。
根据本发明的另一方面,该目的是通过对经编码的音频信号进行解码的音频解码器予以实现的,所述经编码的音频信号具有根据第一编码算法进行编码的第一部分,并具有根据第二编码算法进行编码的第二部分,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码,所述音频解码器包括:检测器,用于检测形成第一部分或第二部分的编码算法;解码处理器,用于对所述检测器予以响应,利用所述第一编码算法对第一部分进行解码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以获得第二解码时间部分;以及后置滤波器,具有可控的可变规整特性,所述可变规整特性可以被控制在具有较小规整特性或不具有规整特性的第一状态和具有相对较高的规整特性的第二状态间。
优选地,后置滤波器被控制为:利用小规整特性或不利用规整特性对第一解码时间部分进行滤波,并利用相对较高的规整特性对第二解码时间部分进行滤波。
根据本发明的另一方面,该目的是通过对音频信号进行处理的音频处理器予以实现的,所述音频处理器包括:滤波器,用于产生经滤波的音频信号,所述滤波器具有可变规整特性,所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;以及控制器,用于提供所述时变控制信号,所述时变控制信号取决于所述音频信号。
本发明的其他方面涉及相应的编码、加密和音频处理方法以及相关的计算机程序和经编码的音频信号。
本发明基于以下发现,即位于音频编码器侧的具有可变规整特性的前置滤波器是将不同的编码算法集成于单个编码器框架的关键特征。所述两个不同的编码算法彼此不同。第一编码算法适于特定的信号模式(如语音信号),但任何其他特定的谐波模式、基音模式、或瞬态模式也可以作为一种选项,而第二编码算法适于对一般的音频信号进行编码。编码器侧的前置滤波器或解码器侧的后置滤波器使得可以将信号特定编码模块和一般编码模块集成在单个编码器/解码器框架内。
通常,可以对一般音频编码器模块或信号特定编码器模块的输入进行较高程度、较低程度的规整、或不对其进行规整。这取决于特定信号和编码器模块的实现。因此,可以用信号告知哪个规整滤波特性属于哪个编码模块。在许多情况下,结果可以是较强的规整特性属于一般音频编码器,较小的或零规整特性属于信号特定模块。在某些实施例中,该情况可以是固定设置,或者可以是针对特定信号部分动态地向编码器模块传信的结果。
虽然适于特定信号模式的编码算法通常不十分依赖于采用掩蔽阈值来减小非相关性,但该编码算法不一定需要规整预处理或仅仅“软”规整预处理。这意味着适于特定信号模式的第一编码算法有利地使用有关特定信号模式的先验知识,但不那么依赖掩蔽阈值,因此,不需要接近人类听觉机制的非均匀频率分辨率。人类听觉机制的非均匀频率分辨率是由沿频率标度带宽不同的标度因子带所反映的。该非均匀频率标度也被称为BARK或ERB标度。
只有当编码算法十分依赖于利用掩蔽阈值的概念来减小非相关性,才必须利用非均匀频率分辨率进行处理和噪声成形,但对于适于特定信号模式的特定编码算法,无需利用非均匀频率分辨率进行处理和噪声成形,并且使用先验知识来高效地处理这样的特定信号模式。事实上,由于规整将影响特定信号模式,而由于第一编码算法是针对特定信号模式进行高度优化的,因而规整将使第一编码算法的编码效率大大降低,因此任何非均匀频率规整都将导致这种特定信号模式所适合的编码算法效率下降。
与此相反,只有当采取满足人类听觉机制的非均匀频率分辨率的任何度量,使得可以从掩蔽阈值得到最佳受益时,第二编码算法才可以产生可接受的输出比特率以及可接受的音频质量。
由于音频信号可以包括跟随在一般音频后的特定信号模式,即不含该特定信号模式,或仅仅少量含有该特定信号模式的信号,因此本发明的前置滤波器仅当存在不含有特定信号模式时,才较大程度地进行规整,而对于不含特定信号模式的信号,不应用规整,或仅仅应用较小的规整特性。
特别地,对于第一编码算法是依赖于线性预测编码的情况,以及第二编码算法是基于前置滤波器/后置滤波器架构的一般音频编码器的情况,前置滤波器可以利用相同的滤波器执行不同的任务。当音频信号具有特定信号模式时,前置滤波器充当LPC分析滤波器,因此第一编码算法只与残差信号或LPC激励信号的编码有关。
当存在不含特定信号模式的信号部分时,前置滤波器被控制为具有较强的规整特性,优选地,前置滤波器被控制为基于心理声学掩蔽阈值执行LPC滤波,从而使频率规整滤波器对经前置滤波的输出信号进行滤波,并且使得相对于心理声学不太重要的谱部分而言心理声学较重要的部分得到放大。接着,可以使用直接量化器,或者更一般地说,编码过程中的量化可以无需将编码噪声非均匀地分布在规整滤波器输出中的频率范围上。量化噪声的噪声成形将自动地被通过解码器侧的时变规整滤波器获得的后置滤波操作所取代,相对于规整特性,解码器侧的时变规整滤波器与编码器侧的前置滤波器是相同的,并且,由于该滤波器是解码器侧前置滤波器的逆,因此自动地产生噪声成形,以最大地减小非相关性,同时保持较高的音频质量。
附图说明
下面参考附图对本发明的优选实施例予以说明,附图中:
图1是一优选音频编码器的方框图;
图2是一优选音频解码器的方框图;
图3a是经编码的音频信号的示意表示;
图3b是图3a的第一和/或第二时间部分的辅助信息的示意表示;
图4是适用于本发明的现有技术的FIR前置滤波器或后置滤波器的表示;
图5示出了取决于规整因子的滤波器的规整特性;
图6示出了具有线性滤波器和控制器的本发明的音频处理器,所述线性滤波器具有时变规整特性;
图7示出了本发明的音频编码器的优选实施例;
图8示出了本发明的音频解码器的优选实施例;
图9示出了具有编码器和解码器的现有技术的基于滤波器组的编码算法;
图10示出了具有编码器和解码器的现有技术的基于前/后置滤波器的音频编码算法;以及
图11示出了具有编码器和解码器的现有技术的LPC编码算法。
具体实施方式
本发明的优选实施例提供了一种实现了对一般音频信号和语音信号进行编码的统一方法,具有至少与已知的针对两种类型信号的最佳编码方案的性能相当的编码性能。该方法基于以下考虑:
●对于一般音频信号的编码,必须根据掩蔽阈值曲线(根据“感知音频编码”的思想)对编码噪声谱包络进行成形,因而感知规整频率标度是所期望的。然而,可能存在特定的(如谐波)音频信号,其中由于均匀频率分辨率可以更好地分辨音频信号的独立谱精细结构,因此均匀频率分辨率比感知规整频率分辨率性能更好。
●对于语音信号编码,可以通过规则(非规整)线性有预测实现现有技术的编码性能。可能存在某些语音信号,对于语音信号一定程度的规整可以改进编码性能。
根据本发明的思想,用包括可以使其特性平滑地在完全规整操作和非规整操作间渐变的编码系统解决了这个难题,所述完全规整操作对于音乐信号的编码而言通常是优选的,所述非规整操作对于语音信号的编码而言通常是优选的。特别地,所提出的本发明的方法包括具有时变规整因子的线性滤波器。该滤波器受额外输入的控制,所述额外输入接收期望的规整因子,并相应地改变滤波操作。
这样的滤波器的操作使滤波器既表现为掩蔽曲线的模型(用于音乐编码的后置滤波器,进行规整,λ=λ0)又表现为信号谱包络的模型(用于语音编码的逆LPC滤波器,不进行规整,λ=0),具体取决于控制输入。如果本发明的滤波器被配置为还处理中间规整因子的连续区间,那么还可以得到软中间特性(soft in-between characteristics)。
自然,类似地装配了逆解码器滤波机制,即带有时变规整因子的线性解码器滤波器,并且可以起感知前置滤波器以及LPC滤波器的作用。
为了产生性能良好的经滤波的信号,以进行后继编码,不希望在两个不同的规整因子间瞬间切换,而希望使规整因子随时间平缓过渡。作为示例,在非规整和完全规整操作间的128个采样的过渡可以避免输出信号中非希望的不连续性。
利用这样的带有可变规整的滤波器,可以构建合并语音/音频编码器,按以下方式实现最佳的语音和音频编码质量(参见图7或图8):
●对所要使用的编码模式(“语音模式”或“音乐模式”)的判决是在独立模块中通过执行输入信号分析实现的,并且可以基于现有的用于区分语音信号和音乐的技术。因此,判决模块产生关于编码模式/和相关的滤波器的最佳规整因子的判决结果。此外,根据该判决结果,确定一组适于选定编码模式下的输入信号的适当的滤波器系数,即对于语音编码,执行LPC分析(无规整或采用小规整因子),而对于音乐编码,估计掩蔽曲线,并将掩蔽曲线的逆转换为规整谱系数。
●用具有时变规整特性的滤波器作为一般的编码器/解码器滤波器,并且根据编码模式判决结果/规整因子以及由判决模块产生的一组滤波器系数将其作用于信号。
●根据编码模式,用语音编码核(如CELP编码器)或一般音频编码器核(如滤波器组/子带编码器、或预测音频编码器)或同时使用两者,对音频滤波级的输出信号进行编码。
●所要发送/存储的信息包括:编码模式判决结果(或规整因子指示)、编码形式的滤波器系数、和由语音/激励和一般音频编码器传送的信息。
对应的解码器相应地按以下方式工作:解码器接收所发送的信息,根据编码模式信息对语音和一般音频部分进行解码,将它们合并为(如通过将两者相加)单个中间信号,并利用编码模式/规整因子和滤波器系数对该中间信号进行滤波,以形成最终的输出信号。
接下来,将结合图1讨论本发明的音频编码器。图1的音频编码器有效地对线路10上的音频信号输入进行编码。将音频信号输入前置滤波器12,产生出现在线路14上的经前置滤波的音频信号。前置滤波器具有可变规整特性,所述规整特性可响应于线路16上的时变控制信号得到控制。所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性。因此,时变规整控制信号可以是具有两种不同状态(如表示强规整的“1”或表示无规整的“0”)的信号。应用规整的期望目标是,获得与BARK标度相似的前置滤波器的频率分辨率。然而,也可以使用信号/规整特性设置的不同状态。
此外,本发明的音频编码器包括控制器18,用于提供时变控制信号,其中,如图1中的线路20所示,所述时变控制信号取决于音频信号。此外,本发明的音频编码器包括可控编码处理器22,用于处理经前置滤波的音频信号,以在线路24上获得经编码的音频信号输出。具体而言,编码处理器22适于根据第一编码算法或根据第二编码算法对经前置滤波的音频信号进行处理,所述第一编码算法适于特定信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般音频信号进行编码。具体而言,编码处理器22适于优选地借助线路26上单独的编码器控制信号受控制器18的控制,从而利用第二编码算法处理利用相对较高的规整特性进行滤波的音频信号部分,以获得经编码的信号,并利用第一编码算法处理利用较小规整特性或未利用规整特性进行滤波的音频信号部分。
因此,如控制线路26上信号的控制表28所示,在某些情形下,当处理音频信号时,对于根据第一编码算法进行滤波的信号,滤波器执行小规整或不执行规整,而当前置滤波器采用了较强的并且优选的感知全标度规整时,使用针对一般音频信号的第二编码算法对时间部分进行处理,优选地所述处理基于将量化噪声隐藏在心理声学掩蔽阈值以下。自然,本发明还覆盖以下情况:对于具有信号特定模式的音频信号的另一部分,应用较高的规整特性,而对于不具有该特定信号模式的又一部分,采用较低的或不采用规整特性。举例而言,这可以通过综合编码器判决结果以进行分析或利用任何其他现有技术中的已知算法,来进行判定。然而,编码器模块控制还可以根据所发送的规整因子进行固定设置,或者规整因子可由所发送的编码器模块指示导出。此外,两个信息项(即编码器模块和规整因子)可以作为辅助信息予以发送。
图2示出了用于对在线路30处输入的经编码的音频信号进行解码的本发明的解码器。经编码的音频信号具有根据第一编码算法进行编码的第一部分,并具有根据第二编码算法进行编码的第二部分,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码。具体而言,本发明的解码器包括:检测器32,用于检测形成第一部分或第二部分的编码算法。该检测可以如虚线34所示通过从经编码的音频信号中提取辅助信息的方式来实现,和/或可以如虚线38所示通过检查进入解码处理器36的比特流的方式来实现。解码处理器36用于如控制线路40所示对检测器予以响应,以进行解码,从而为第一和第二部分选择正确的编码算法。
优选地,解码处理器有效地使用第一编码算法对第一时间部分进行解码,并使用第二编码算法对第二时间部分进行解码,以在线路42上输出第一和第二解码时间部分。线路42将输入作用于具有可变规整特性的后置滤波器44。具体而言,可以使用线路46上的时变规整控制信号控制后置滤波器44,使该后置滤波器在第一状态下只具有较小的规整特性或不具有规整特性,并在第二状态下具有较高的规整特性。
优选地,后置滤波器44被控制为,利用小规整特性或不利用规整特性对使用第一编码算法进行解码的第一时间部分进行滤波,并利用相对较高的规整特性对解码音频信号的第二时间部分进行滤波,从而在线路48处获得音频解码器输出信号。
当观察图1和图2时,第一编码算法确定要在编码处理器22中采取的编码器相关步骤,以及要实现于解码处理器36中的相应的解码器相关步骤。此外,第二编码算法确定要在编码处理器中使用的编码器相关的第二编码算法步骤,以及要实现于解码处理器36中的相应的第二编码算法相关的解码步骤。
此外,前置滤波器12和后置滤波器44通常是互逆的。上述滤波器的规整特性被控制为,使后置滤波器具有与前置滤波器相同的规整特性,或具有至少相似程度在10%的容差范围以内的相似的规整特性。
自然, 当由于存在例如具有特定信号模式的信号,而为规整前置滤波器时,那么后置滤波器也不必是规整滤波器。
然而,正如稍后将予以概述的那样,前置滤波器12和后置滤波器44可以实现与第一编码算法或第二编码算法相结合所需的任何其他前置滤波器或后置滤波器操作。
图3a示出了在图1的线路2上获得的以及可以在图2的线路30上出现的经编码的音频信号的示例。具体而言,经编码的音频信号包括:如参考标记50所指示的由第一编码算法产生的编码形式的第一时间部分、以及第一部分的相应的辅助信息52。此外,比特流包括:如54所示的编码形式的第二时间部分、以及第二时间部分的辅助信息56。此处应当注意的是,图3a中各项的顺序可以改变。此外,辅助信息不一定必须被复用在主要信息50和54之间。如外部需要或实现所指示的那样,上述信号甚至可以来自独立的信号源。
图3b示出了本发明的显式传信实施例的辅助信息,用于显式地以信号告知规整因子和编码器模式,可用于图3a的52和56中。以下示出了图3b的辅助信息流。因此,辅助信息可以包括:编码模式指示,显式地以信号告知形成辅助信息所属部分的第一或第二编码算法。
此外,可以信号告知规整因子。当系统只能使用两种不同的规整特性(即作为第一种可能的无规整特性,和作为第二种可能的感知全标度规整特性),以信号告知规整因子并非是必须的。在这种情况下,规整因子可以是固定的,并且不一定必须发送。
然而,在优选实施例中,规整因子可以两个极端值以外的值,因此使用如绝对值或差分编码值,显式地以信号告知规整因子。
此外,优选地,前置滤波器不仅实现规整,还实现由第一编码算法和第二编码算法所要求的、使第一和第二编码算法更加高效工作的任务。
如果第一编码算法是基于LPC的编码算法,那么前置滤波器还实现LPC分析滤波器的功能,并且解码器侧的后置滤波器实现LPC综合滤波器的功能。
如果第二编码算法是不具有特定噪声成形功能的通用音频编码器,前置滤波器优选为LPC滤波器,对音频信号进行前置滤波,使得在前置滤波后,相对于心理声学不太重要的谱部分而言心理声学较重要的部分得到放大。在解码器侧,后置滤波器被实现为,用于再生类似于前置滤波前情形的滤波器,即逆滤波器,所述逆滤波器使心理声学不太重要的谱部分相对于心理声学较重要的部分得到放大,使得经后置滤波的信号(除发生编码错误的情况外)类似于输入编码器的原始音频信号。
优选地,上述前置滤波器的滤波器系数还借助辅助信息从编码器发送至解码器。
典型地,前置滤波器和后置滤波器将被实现为规整FIR滤波器或规整IIR数据滤波器,图4示出了规整FIR滤波器的结构。[KHL 97]中详细描述了图4滤波器。[KHL 97]还公开了规整IIR滤波器的示例。所有上述数字滤波器的共同点在于都具有规整延迟单元60,和由β0、β1、β2、...所指示的加权系数或加权单元。如图4中两侧的滤波器结构所示,当用全通滤波器(如一阶全通滤波器D(z))代替非规整滤波器结构(未示出)中的延迟单元时,滤波器结构转换为规整滤波器。图4右侧示出了左侧结构的高计算效率的实现,其中示出了规整因子λ的显式使用及其实现。
因此,图4右侧的滤波器结构可以容易地实现于前置滤波器和后置滤波器内部,其中,规整因子受参数λ的控制,而滤波器特性,即LPC分析/综合或用于放大/减弱心理声学较重要部分的前置滤波或后置滤波的滤波器系数通过将加权参数β0、β1、β2、...设置为适当数值来进行控制。
图5示出了频率-规整特性对规整因子λ的依赖,λ在-0.8和+0.8之间。当λ被设置为0.0时,无法获得任何规整。将λ设置在0.3和0.4之间,可以获得心理声学全标度规整。一般地,最佳规整因子取决于所选定的采样率,并且对于32和48kHz间的采样率,具有约0.3和0.4间的规整因子值。利用规整滤波器如此获得的非均匀频率分辨率类似于BARK或ERB标度。可以实现明显更强的规整特性,但明显更强的规整特性仅仅在特定情况下才是有用的,当控制器判定较高规整因子有用时,能够出现所述特定情况。
因此,优选地,编码器侧的前置滤波器具有正规整因子λ,用于在低频范围内提高频率分辨率,并在高频范围内降低频率分辨率。因此,解码器侧的后置滤波器也具有正规整因子。这样一来,在图6中的70处将优选的本发明的时变规整滤波器表示为音频处理器的一部分。优选地,本发明的滤波器是线性滤波器,后者是作为前置滤波器或后置滤波器实现的、或者是作为依赖于系统控制信号的LPC分析/综合滤波器实现的,前置滤波器或后置滤波器用于滤波以放大或减弱心理声学上较重要/不太重要的部分。在这点上值得注意的是,规整滤波器是线性滤波器,并且不改变分量(如输入滤波器的正弦波)的频率。然而,如果假设规整前的滤波器是低通滤波器,那么必须按以下阐释的那样理解图5。
如果示例正弦波具有0.6的归一化原始频率,那么滤波器将对等于0.0的规整因子应用由该非规整滤波器的滤波器冲激响应限定的相位和幅度加权。
当为该低通滤波器设置0.8的规整因子时(此时滤波器变为规整滤波器),具有0.6的归一化频率的正弦波将被滤波为,使输出得到非规整滤波器所具有的针对图5中0.97的归一化频率的相位和幅度加权。由于该滤波器是线性滤波器,因此不改变正弦波的频率。
根据情况,当滤波器70仅仅得到规整时,必须应用规整因子或一般的规整控制16或46。滤波器系数βi是从掩蔽阈值导出的。这些滤波器系数可以是前置或后置滤波器系数、或LPC分析/综合滤波器系数、或结合第一或第二编码算法有用的任何其他滤波器系数。
因此,除了具有可变规整特性的滤波器以外,根据本发明的音频处理器还包括:图1的控制器18,或实现为图2的编码算法检测器32的控制器,或在音频输入10/42中查找特定信号模式以便能够设置特定规整特性的一般音频输入信号分析器,所述特定规整特性符合特定信号模式,因此,如果音频输入是经编码或经解码的音频输入,可以获得音频输入的时间自适应可变规整。优选地,前置滤波器系数和后置滤波器系数是相同的。
图6示出的音频处理器包括滤波器70和控制器74,其输出可以被存储用于各种目的,或者可以由编码处理器22进行处理或者在音频处理器位于解码器侧的情况下由音频再现设备进行处理,或者可以用任何其他信号处理算法进行处理。
下面,将讨论图7和8,图7和8示出了本发明的编码器(图7)和本发明的解码器(图8)的优选实施例。上述设备的功能类似于图1和图2的设备。具体而言,图7示出了一实施例,其中,第一编码算法是语音编码器类的编码算法,特定信号模式是音频输入10中的语音模式。第二编码算法22b是通用音频编码器,如结合图9予以说明和讨论的直接基于滤波器组的音频编码器,或如图10所示的前置滤波器/后置滤波器音频编码算法。
第一编码算法与图11的语音编码系统相对应,除了LPC分析/综合滤波器1100和1102,语音编码系统还包括残差/激励编码器1104和相应的激励解码器1106。在该实施例中,图7中的时变规整滤波器12具有与LPC滤波器1100相同的功能,并且实现于图11中的方框1108中的LPC分析是在控制器18中实现的。
残差/激励编码器1104与图7中的残差/激励编码器核22a相对应。类似地,激励解码器1106与图8中的残差/激励解码器36a相对应,并且时变规整滤波器44具有逆LPC滤波器1102的功能,用于处理根据第一编码算法进行编码的第一时间部分。
由LPC分析方框1108产生的LPC滤波器系数与用于第一时间部分的图7中90所示的滤波器系数相对应,输入至图11中方框1102的LPC滤波器系数与图8的线路92上的滤波器系数相对应。此外,图7编码器包括编码器输出接口94,编码器输出接口可以被实现为比特流复用器,但也可以被实现为产生适于传输和/或存储的数据流的任何其他设备。相应地,图8的解码器包括输入接口96,输入接口可以被实现为,用于对结合图3a所讨论的特定的时间部分信息进行解复用并提取图3b所示的所需辅助信息的比特流解复用器。
在图7实施例中,编码核22a、22b具有公共输入96,并且通过线路97a和97b受控制器18的控制。该控制确保在特定时刻,编码器核22a、22b中只有一个向输出接口输出主要和辅助信息。可选地,两编码核可以完全并行地工作,编码器控制器18确保只将由编码模式信息所指示的编码核的输出输入至比特流,而将其他编码器的输出丢弃。
再次,可选地,两个解码器可以并行运行,并且可以将其输出相加。在这种情况下,优选对编码器侧前置滤波器和解码器侧后置滤波器使用中等的规整特性。此外,举例而言,该实施例利用第一编码算法处理信号的语音部分,如特定频率范围或(一般地)特定信号部分,并用第二一般编码算法处理信号的剩余部分。接着,从编码器向解码器侧发送两个编码器的输出。解码器侧合并确保在进行后置滤波前将信号进行结合。
只要能够确保输出的经编码的音频信号24具有如图3所示的第一和第二部分的顺序或如语音部分和一般音频部分等信号部分的合并,可以实现任何类型的特定控制。
在解码器侧,编码模式信息用于使用正确的解码算法对时间部分进行解码,以在解码器核36a和36b的输出端获得第一部分和第二部分的时间交错模式,然后,如利用加法器符号36c示意性示出的那样,将两者复用为单个时域信号。此时,在元件36c的输出端存在时域音频信号,该信号必须经后置滤波,以便获得经解码的音频信号。
如之前在附图说明后的发明内容中所讨论的那样,在图7中的编码器和图8中的解码器可以包括内插器100或102,以借助特定时间部分平滑过渡,所述特定时间部分至少包括两个采样,但优选包括50个以上的采样,甚至100个以上的采样也是可实现的。这样可以确保避免可能由规整因子和滤波器系数的快速改变所引起的编码噪声。然而,由于后置滤波器和前置滤波器完全是在时域中运作的,因此不存在与基于块的特定实现有关的问题。因此,再次考虑图4,可以逐采样地改变β0、β1、β2、...和λ的值,使得可以从例如全规整状态渐变为无规整的另一状态。虽然,可以发送经内插的参数,从而省去解码器侧的内插器,但是,由于后一种选择需要较少的辅助信息比特,因此优选不发送经内插的值,而发送内插前的值。
此外,如上述已经指出的那样,图7所示的通用音频编码器核22b可以同图10中的编码器1000相同。在这种情况下,前置滤波器12还将实现图10中前置滤波器1002的功能。此外,图10中的感知模型1004将被实现于图7的控制器18中。对于采用第二编码算法的时间部分,由感知模型1004所产生的滤波器系数与图7中线路90上的滤波器系数相对应。
类似地,图10中的解码器1006是由图8中的通用音频解码器核36b实现的,后置滤波器1008是由图8中的时变规整滤波器44实现的。在解码器侧在线路92上接收由感知模型产生的优选地经编码的滤波器系数,使进入图10中后置滤波器1008的标有“滤波器系数”的线路与第二编码算法时间部分的图8中的线路92相对应。
然而,同根据图10和11的两个由于音频质量和比特率的缘故并不完美的并行工作的编码器相比,本发明的编码器设备和本发明的解码器设备仅使用单个的但可控的滤波器,并且分辨输入信号,以判断音频信号的时间部分是具有特定的模式,还是仅仅是一般的音频信号。
关于控制器18内的音频分析器,可以用多种不同的实现来判断音频信号的一部分是否是具有特定信号模式的部分,或该部分是否不具有该特定信号模式,并因此必须使用一般的音频编码算法对其进行处理。虽然已讨论了特定信号模式是语音信号的优选实施例,但是还可以确定其他信号特定模式,并且可以用这样的信号特定的第一编码算法(如谐波信号、噪声信号、音调信号、或脉冲序列状信号等的编码算法)对其他信号特定模式进行编码。
标准检测器是综合分析检测器,举例而言,综合分析检测器尝试不同的编码算法以及不同的规整检测器,以寻找最佳规整因子以及最佳滤波器系数和最佳编码算法。在某些情况下,这样的综合分析检测器在计算上开销很大。这在编码器数量较少解码器数量较多的情况下无关紧要,因为在这种情况下解码器可以极其简单。这是由于只有编码器执行该复杂的计算任务,而解码器可以简单地使用所发送的辅助信息。
其他信号检测器基于直接模式分析算法,直接模式分析算法查找音频信号中的特定信号模式,并在匹配程度超过特定门限时以信号告知一肯定结果。[BLS05]中给出了有关这种检测器的更多的信息。
此外,根据本发明方法的特定实现需求,本发明的方法可以用硬件或软件来实现。可以使用数字存储介质(特别是在其上存储着电子可读控制信号的盘片或CD)来完成实现,所述数字存储介质能够同可编程计算机系统协作,以实现本发明的方法。一般地,因此,本发明是将程序代码存储在机器可读载体上的计算机程序产品,所述程序代码被配置为,在计算机程序产品运行于计算机上时,执行本发明的至少一种方法。换言之,因此,本发明的方法是计算机程序,所述计算机程序含有用于在计算机程序运行于计算机上时执行本发明方法的程序代码。
上述实施例仅仅说明了本发明的原理。应当理解的是,对于所属领域技术人员而言,对此处所述的配置和细节的改变和修改是显而易见的。因此,本意上本发明仅受限于以下专利权利要求的范围,而不受通过此处对实施例的说明和描述所展现的特定细节的限制。
Claims (49)
1.一种用于对音频信号进行编码的音频编码器,包括:
前置滤波器,用于产生经前置滤波的音频信号,所述前置滤波器具有可变规整特性,所述规整特性可响应于时变控制信号从而得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;
控制器,用于提供所述时变控制信号,所述时变控制信号取决于所述音频信号;以及
可控编码处理器,用于处理经前置滤波的音频信号,以获得经编码的音频信号,其中,所述编码处理器适于根据第一编码算法或根据第二编码算法处理经前置滤波的音频信号,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码。
2.根据权利要求1所述的音频编码器,其中,所述编码处理器适于使用语音编码算法的至少一部分作为第一编码算法。
3.根据权利要求1所述的音频编码器,其中,所述编码处理器适于使用残差/激励编码算法作为第一编码算法的一部分,所述残差/激励编码算法包括:码激励线性预测(CELP)编码算法、多脉冲激励(MPE)编码算法、或规则脉冲激励(RPE)编码算法。
4.根据权利要求1所述的音频编码器,其中,所述编码处理器适于使用:基于滤波器组的、基于滤波器组的、或基于时域的编码算法作为第二编码算法。
5.根据权利要求1所述的音频编码器,还包括:心理声学模块,用于提供有关掩蔽阈值的信息,并且
其中,所述前置滤波器有效地基于掩蔽阈值执行滤波操作,使得在经前置滤波的音频信号中,相对于心理声学上较不重要的部分,心理声学上较重要的部分得到放大。
6.根据权利要求5所述的音频编码器,其中,所述前置滤波器是具有可控规整因子的线性滤波器,所述可控规整因子是由所述时变控制信号确定的,并且
其中,滤波器系数是基于所述掩蔽阈值通过分析加以确定的。
7.根据权利要求1所述的音频编码器,其中,所述第一编码算法包括残差或激励编码步骤,所述第二编码算法包括一般的音频编码步骤。
8.根据权利要求1所述的音频编码器,其中,所述编码处理器包括:
第一编码核,用于对音频信号应用所述第一编码算法;
第二编码核,用于对音频信号应用所述第二编码算法;
其中,第一和第二编码核具有与所述前置滤波器的输出相连的公共输入,第一和第二编码核具有单独的输出,
其中,所述音频编码器还包括输出级,用于输出经编码的信号,并且
其中,所述控制器有效地仅将所述控制器所指示的应在一时间部分处于活动状态的编码核的输出连接至所述输出级。
9.根据权利要求1所述的音频编码器,其中,所述编码处理器包括:
第一编码核,用于对音频信号应用所述第一编码算法;
第二编码核,用于对音频信号应用所述第二编码算法;
其中,第一和第二编码核具有与所述前置滤波器的输出相连的公共输入,第一和第二编码核具有单独的输出,并且
其中,所述控制器有效地激活由编码模式指示选定的编码核,并禁用未被编码模式指示选定的编码核,或针对音频信号的同一时间部分的不同成份激活第一和第二编码核。
10.根据权利要求1所述的音频编码器,还包括:输出级,用于向经编码的信号输出时变控制信号、或通过量化或编码由时变控制信号导出的信号,作为辅助信息。
11.根据权利要求6所述的音频编码器,还包括:输出级,用于向经编码的音频信号输出有关掩蔽阈值的信息作为辅助信息。
12.根据权利要求6所述的音频编码器,其中,所述编码处理器在应用所述第二编码算法时,有效地利用量化器对经前置滤波的音频信号进行量化,所述量化器具有引入具有平坦谱分布的量化噪声的量化特性。
13.根据权利要求12所述的音频编码器,其中,所述编码处理器在应用所述第二编码算法时,有效地对由经前置滤波的音频信号导出的经前置滤波的时域采样、子带采样、频率系数、或残差采样进行量化。
14.根据权利要求1所述的音频编码器,其中,所述控制器有效地提供所述时变控制信号,使得同前置滤波器的小规整特性相比,对于前置滤波器的相对较高的规整特性,规整操作提高低频范围的频率分辨率并降低高频范围的频率分辨率。
15.根据权利要求1所述的音频编码器,其中,所述控制器包括:音频信号分析器,用于分析音频信号以确定所述时变控制信号。
16.根据权利要求1所述的音频编码器,其中,所述控制器有效地产生时变控制信号,除指示无规整特性或很小的规整特性的第一极端状态以及指示最大规整特性的第二极端状态之外,所述时变控制信号还具有指示两种极端状态之间的规整特性的零个、一个或多个中间状态。
17.根据权利要求1所述的音频编码器,还包括内插器,其中,所述内插器有效地控制所述前置滤波器,使规整特性在具有至少两个时域采样的渐变时段内在两个规整状态间渐变,所述两个规整状态是由所述时变控制信号通知的。
18.根据权利要求17所述的音频编码器,其中,所述渐变时段包括:在不引起规整或引起小规整的滤波特性和引起相对较高的规整的滤波特性间的至少50个时域采样,所述相对较高的规整导致与BARK或ERB标度相似的规整频率分辨率。
19.根据权利要求17所述的音频编码器,其中,所述内插器有效地在所述渐变时段内使用由时变控制信号指示的产生两个规整特性间的规整特性的规整因子。
20.根据权利要求1所述的音频编码器,其中,所述前置滤波器是具有规整FIR或规整IIR结构的数字滤波器,所述结构包括延迟单元,所述延迟单元被形成为,具有一阶或高阶全通滤波特性。
21.根据权利要求20所述的音频编码器,其中,所述全通滤波特性基于以下滤波特性:
(z-1-λ)/(1-λz-1),
其中,z-1表示离散时域内的延迟,λ是规整因子,当所述规整因子大小接近于"1"时指示较强的规整特性,当所述规整因子大小接近于"0"时指示较小的规整特性。
22.根据权利要求20所述的音频编码器,其中,所述FIR或IIR结构还包括加权单元,每个加权单元具有相关加权因子,
其中,所述加权因子是由前置滤波器的滤波器系数确定的,所述滤波器系数包括:LPC分析或综合滤波器系数、或者掩蔽阈值确定的分析或综合滤波器系数。
23.根据权利要求20所述的音频编码器,其中,所述前置滤波器具有6至30间的滤波器阶数。
24.根据权利要求1所述的音频编码器,其中,所述编码处理器适于受所述控制器控制,从而利用所述第二编码算法处理利用相对较高的规整特性进行滤波的音频信号部分,以获得经编码的信号,并利用所述第一编码算法处理利用较小规整特性或未利用规整特性进行滤波的音频信号。
25.一种用于对经编码的音频信号进行解码的音频解码器,所述经编码的音频信号具有根据第一编码算法进行编码的第一部分,并具有根据第二编码算法进行编码的第二部分,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码,所述音频解码器包括:
检测器,用于检测形成第一部分或第二部分的编码算法;
解码处理器,用于对所述检测器予以响应,利用所述第一编码算法对第一部分进行解码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以获得第二解码时间部分;以及
后置滤波器,具有可控的可变规整特性,所述可变规整特性可以被控制在具有较小规整特性或不具有规整特性的第一状态和具有相对较高的规整特性的第二状态间。
26.根据权利要求25所述的音频解码器,其中,所述后置滤波器被设置为,使后置滤波期间的规整特性与前置滤波期间使用的规整特性相似,相似程度在相对于规整强度10%的容差范围以内。
27.根据权利要求25所述的音频解码器,其中,所述经编码的音频信号包括:编码模式指示符或规整因子信息,
其中,所述检测器有效地从经编码的音频信号中提取有关编码模式的信息或规整因子,并且
其中,利用所述所提取的信息,所述解码处理器或后置滤波器有效地得到控制。
28.根据权利要求27所述的音频解码器,其中,由所述所提取的信息导出并用于控制所述后置滤波器的规整因子是正数。
29.根据权利要求25所述的音频解码器,其中,所述经编码的信号还包括:与滤波器系数有关的信息,所述滤波器系数取决于构成所述经编码的信号的原始信号的掩蔽阈值,并且
其中,所述检测器有效地从经编码的音频信号中提取有关滤波器系数的信息,并且
其中,所述后置滤波器适于基于与所述滤波器系数有关的提取信息得到控制,使得同后置滤波前的信号相比,经后置滤波的信号与原始信号更为相似。
30.根据权利要求25所述的音频解码器,其中,所述解码处理器适于使用语音编码算法作为第一编码算法。
31.根据权利要求25所述的音频解码器,其中,所述解码处理器适于使用残差/激励解码算法作为第一编码算法。
32.根据权利要求25所述的音频解码器,其中,所述残差/激励解码算法包括所述残差/激励编码算法,作为第一编码算法的一部分,所述残差/激励编码算法包括:码激励线性预测(CELP)编码算法、多脉冲激励(MPE)编码算法、或规则脉冲激励(RPE)编码算法。
33.根据权利要求25所述的音频解码器,其中,所述解码器处理器适于使用基于滤波器组的或基于变换的或基于时域的解码算法作为第二编码算法。
34.根据权利要求25所述的音频解码器,其中,所述解码器处理器包括:第一编码核,用于对经编码的音频信号应用所述第一编码算法;
第二编码核,用于对经编码的音频信号应用所述第二编码算法;
其中,第一和第二编码核具有输出,每个输出与合并器相连,所述合并器具有与所述后置滤波器的输入相连的输出,其中,所述编码核被控制为:只将由选定的编码算法输出的经解码的时间部分转发至合并器和后置滤波器,或者用不同编码核以及所述合并器对音频信号的同一时间部分的不同成份进行处理,所述合并器有效地合并所述不同成份的解码表示。
35.根据权利要求35所述的音频解码器,其中,所述解码器处理器在应用所述第二编码算法时,有效地对已利用量化器进行过量化的音频信号进行反量化,所述量化器具有引入具有平坦谱分布的量化噪声的量化特性。
36.根据权利要求25所述的音频解码器,其中,所述编码处理器在应用所述第二编码算法时,有效地对经量化的时域采样、经量化的子带采样、经量化的频率系数、或经量化的残差采样进行反量化。
37.根据权利要求25所述的音频解码器,其中,所述检测器有效地提供时变后置滤波器控制信号,使得同具有小规整特性或不具有规整特性的后置滤波器的滤波输出信号相比,对于后置滤波器的相对较高的规整特性,规整滤波输出信号在高频范围内具有降低了的频率分辨率,在低频范围内具有增加了的频率分辨率。
38.根据权利要求25所述的音频解码器,还包括:内插器,用于控制所述后置滤波器,使规整特性在具有至少两个时域采样的渐变时段内在两个规整状态间渐变。
39.根据权利要求25所述的音频解码器,其中,所述后置滤波器是具有规整FIR或规整IIR结构的数字滤波器,所述结构包括延迟单元,所述延迟单元被形成为,具有一阶或高阶全通滤波特性。
40.根据权利要求25所述的音频解码器,其中,所述全通滤波特性基于以下滤波特性:
(z-1-λ)/(1-λz-1),
其中,z-1表示离散时域内的延迟,λ是规整因子,当所述规整因子大小接近于"1"时指示较强的规整特性,当所述规整因子大小接近于"0"时指示较小的规整特性。
41.根据权利要求25所述的音频解码器,其中,所述规整FIR或规整IIR结构还包括加权单元,每个加权单元具有相关加权因子,
其中,所述加权因子是由前置滤波器的滤波器系数确定的,所述滤波器系数包括:LPC分析或综合滤波器系数、或者掩蔽阈值确定的分析或综合滤波器系数。
42.根据权利要求25所述的音频解码器,其中,所述后置滤波器被控制为:利用小规整特性或不利用规整特性对第一解码时间部分进行滤波,并利用相对较高的规整特性对第二解码时间部分进行滤波。
43.一种经编码的音频信号,具有:根据第一编码算法进行编码的第一时间部分、以及根据第二编码算法进行编码的第二时间部分,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码。
44.根据权利要求43所述的经编码的音频信号,还包括:作为辅助信息的编码模式指示符、或规整因子、或滤波器系数信息,所述编码模式指示符指示是第一编码算法形成第一部分还是第二编码算法形成第二部分,所述规整因子指示形成经编码的音频信号的第一或第二部分的规整强度,所述滤波器系数信息表示用于对音频信号进行编码的前置滤波器或在对音频信号进行解码时所使用的后置滤波器。
45.一种对音频信号进行编码的方法,包括:
产生经前置滤波的音频信号,所述前置滤波器具有可变规整特性,所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;
提供所述时变控制信号,所述时变控制信号取决于所述音频信号;以及
根据第一编码算法或根据第二编码算法处理经前置滤波的音频信号,以获得经编码的音频信号,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码。
46.一种于对经编码的音频信号进行解码的方法,所述经编码的音频信号具有根据第一编码算法进行编码的第一部分,并具有根据第二编码算法进行编码的第二部分,所述第一编码算法适于特定的信号模式,所述第二编码算法不同于所述第一编码算法,适于对一般的音频信号进行编码,所述方法包括:
检测形成第一部分或第二部分的编码算法;
对所述检测器予以响应,利用所述第一编码算法对第一部分进行解码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以获得第二解码时间部分;以及
对所述检测步骤予以响应,利用所述第一编码算法对第一部分进行解码,以获得第一解码时间部分,并利用所述第二编码算法对第二部分进行解码,以获得第二解码时间部分;
利用可控的可变规整特性进行后置滤波,所述可变规整特性可以被控制在具有较小规整特性或不具有规整特性的第一状态和具有相对较高的规整特性的第二状态间。
47.一种用于处理音频信号的音频处理器,包括:
滤波器,用于产生经滤波的音频信号,所述滤波器具有可变规整特性,所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;
控制器,用于提供所述时变控制信号,所述时变控制信号取决于所述音频信号。
48.一种处理音频信号的方法,包括:
利用滤波器产生经滤波的音频信号,所述滤波器具有可变规整特性,所述规整特性可响应于时变控制信号得到控制,所述控制信号指示小规整特性、无规整特性、或相对较高的规整特性;以及
提供所述时变控制信号,所述时变控制信号取决于所述音频信号。
49.一种含有程序代码的计算机程序,当在计算机上运行时,所述程序代码执行权利要求45、46或48所述的方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/428,297 | 2006-06-30 | ||
EP06013604.1 | 2006-06-30 | ||
US11/428,297 US7873511B2 (en) | 2006-06-30 | 2006-06-30 | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
EP06013604A EP1873754B1 (en) | 2006-06-30 | 2006-06-30 | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
PCT/EP2007/004401 WO2008000316A1 (en) | 2006-06-30 | 2007-05-16 | Audio encoder, audio decoder and audio processor having a dynamically variable harping characteristic |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101501759A true CN101501759A (zh) | 2009-08-05 |
CN101501759B CN101501759B (zh) | 2012-08-15 |
Family
ID=38877778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800302813A Active CN101501759B (zh) | 2006-06-30 | 2007-05-16 | 具有动态可变规整特性的音频编码器、音频解码器和音频处理器 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7873511B2 (zh) |
CN (1) | CN101501759B (zh) |
ZA (1) | ZA200810597B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102158778A (zh) * | 2011-03-11 | 2011-08-17 | 青岛海信移动通信技术股份有限公司 | 一种降低耳机噪声的方法、设备和系统 |
CN102257564A (zh) * | 2009-10-21 | 2011-11-23 | 松下电器产业株式会社 | 音频编码装置、解码装置、方法、电路及程序 |
CN103098130A (zh) * | 2010-10-06 | 2013-05-08 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法以及解码方法 |
CN103366752A (zh) * | 2012-04-04 | 2013-10-23 | 摩托罗拉移动有限责任公司 | 生成用于编码信息信号的候选码矢的方法和设备 |
CN105261371A (zh) * | 2010-07-02 | 2016-01-20 | 杜比国际公司 | 选择性低音后置滤波器 |
CN106910509A (zh) * | 2011-11-03 | 2017-06-30 | 沃伊斯亚吉公司 | 改善低速率码激励线性预测解码器的非语音内容 |
CN107636756A (zh) * | 2015-04-10 | 2018-01-26 | 汤姆逊许可公司 | 用于编码多个音频信号的方法和设备以及用于利用改进的分离解码多个音频信号的混合的方法和设备 |
CN108630211A (zh) * | 2017-03-20 | 2018-10-09 | 班布科技有限公司 | 使用全通滤波器的动态音频增强 |
CN111587457A (zh) * | 2017-11-10 | 2020-08-25 | 弗劳恩霍夫应用研究促进协会 | 信号滤波 |
CN112105902A (zh) * | 2018-04-11 | 2020-12-18 | 杜比实验室特许公司 | 基于机器学习的用于音频编码和解码的基于感知的损失函数 |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7676362B2 (en) * | 2004-12-31 | 2010-03-09 | Motorola, Inc. | Method and apparatus for enhancing loudness of a speech signal |
US8280730B2 (en) | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
KR20080071804A (ko) * | 2007-01-31 | 2008-08-05 | 삼성전자주식회사 | 오디오 신호 인코딩 장치 및 방법, 그리고 오디오 신호디코딩 장치 및 방법 |
WO2008108701A1 (en) * | 2007-03-02 | 2008-09-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Postfilter for layered codecs |
US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
US8645129B2 (en) | 2008-05-12 | 2014-02-04 | Broadcom Corporation | Integrated speech intelligibility enhancement system and acoustic echo canceller |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2654433T3 (es) | 2008-07-11 | 2018-02-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de señal de audio, método para codificar una señal de audio y programa informático |
MX2011000369A (es) * | 2008-07-11 | 2011-07-29 | Ten Forschung Ev Fraunhofer | Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas. |
GB2466669B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466672B (en) * | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466670B (en) * | 2009-01-06 | 2012-11-14 | Skype | Speech encoding |
GB2466673B (en) * | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466671B (en) * | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
KR20100089772A (ko) * | 2009-02-03 | 2010-08-12 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US9215538B2 (en) * | 2009-08-04 | 2015-12-15 | Nokia Technologies Oy | Method and apparatus for audio signal classification |
KR101569702B1 (ko) * | 2009-08-17 | 2015-11-17 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
US8452606B2 (en) * | 2009-09-29 | 2013-05-28 | Skype | Speech encoding using multiple bit rates |
AU2016204672B2 (en) * | 2010-07-02 | 2016-08-18 | Dolby International Ab | Audio encoder and decoder with multiple coding modes |
US8532985B2 (en) | 2010-12-03 | 2013-09-10 | Microsoft Coporation | Warped spectral and fine estimate audio encoding |
PT3239978T (pt) | 2011-02-14 | 2019-04-02 | Fraunhofer Ges Forschung | Codificação e descodificação de posições de pulso de faixas de um sinal de áudio |
MY160265A (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion |
KR101424372B1 (ko) | 2011-02-14 | 2014-08-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 랩핑 변환을 이용한 정보 신호 표현 |
PL2676268T3 (pl) | 2011-02-14 | 2015-05-29 | Fraunhofer Ges Forschung | Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej |
JP5969513B2 (ja) | 2011-02-14 | 2016-08-17 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
PT2676270T (pt) | 2011-02-14 | 2017-05-02 | Fraunhofer Ges Forschung | Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
BR112013020324B8 (pt) | 2011-02-14 | 2022-02-08 | Fraunhofer Ges Forschung | Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio |
JP2014030074A (ja) * | 2012-07-31 | 2014-02-13 | International Business Maschines Corporation | 白色化フィルタの構成方法、プログラム及びシステム |
WO2014096236A2 (en) * | 2012-12-19 | 2014-06-26 | Dolby International Ab | Signal adaptive fir/iir predictors for minimizing entropy |
CN105229735B (zh) | 2013-01-29 | 2019-11-01 | 弗劳恩霍夫应用研究促进协会 | 用于编码模式切换补偿的技术 |
BR112015018021B1 (pt) | 2013-01-29 | 2022-10-11 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V | Aparelho e método para selecionar um dentre um primeiro algoritmo de codificação e um segundo algoritmo de codificação |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
PT3000110T (pt) | 2014-07-28 | 2017-02-15 | Fraunhofer Ges Forschung | Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos. |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI980132A (fi) * | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
KR20010072035A (ko) * | 1999-05-26 | 2001-07-31 | 요트.게.아. 롤페즈 | 오디오 신호 송신 시스템 |
US6523002B1 (en) * | 1999-09-30 | 2003-02-18 | Conexant Systems, Inc. | Speech coding having continuous long term preprocessing without any delay |
KR100675309B1 (ko) * | 1999-11-16 | 2007-01-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 광대역 오디오 송신 시스템, 송신기, 수신기, 코딩 디바이스, 디코딩 디바이스와, 송신 시스템에서 사용하기 위한 코딩 방법 및 디코딩 방법 |
US6496794B1 (en) * | 1999-11-22 | 2002-12-17 | Motorola, Inc. | Method and apparatus for seamless multi-rate speech coding |
US6487553B1 (en) * | 2000-01-05 | 2002-11-26 | International Business Machines Corporation | Method for reducing search results by manually or automatically excluding previously presented search results |
US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
KR20040060946A (ko) * | 2001-10-26 | 2004-07-06 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코더에서의 사인곡선의 파라미터의 추적 |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
US7587254B2 (en) * | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
US20070147518A1 (en) * | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
-
2006
- 2006-06-30 US US11/428,297 patent/US7873511B2/en active Active
-
2007
- 2007-05-16 CN CN2007800302813A patent/CN101501759B/zh active Active
-
2008
- 2008-12-15 ZA ZA200810597A patent/ZA200810597B/xx unknown
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102257564A (zh) * | 2009-10-21 | 2011-11-23 | 松下电器产业株式会社 | 音频编码装置、解码装置、方法、电路及程序 |
CN105355209A (zh) * | 2010-07-02 | 2016-02-24 | 杜比国际公司 | 音高增强后置滤波器 |
CN105261371A (zh) * | 2010-07-02 | 2016-01-20 | 杜比国际公司 | 选择性低音后置滤波器 |
CN103098130A (zh) * | 2010-10-06 | 2013-05-08 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法以及解码方法 |
CN103098130B (zh) * | 2010-10-06 | 2014-11-26 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法以及解码方法 |
CN102158778A (zh) * | 2011-03-11 | 2011-08-17 | 青岛海信移动通信技术股份有限公司 | 一种降低耳机噪声的方法、设备和系统 |
CN106910509A (zh) * | 2011-11-03 | 2017-06-30 | 沃伊斯亚吉公司 | 改善低速率码激励线性预测解码器的非语音内容 |
CN103366752B (zh) * | 2012-04-04 | 2016-06-01 | 谷歌技术控股有限责任公司 | 生成用于编码信息信号的候选码矢的方法和设备 |
CN103366752A (zh) * | 2012-04-04 | 2013-10-23 | 摩托罗拉移动有限责任公司 | 生成用于编码信息信号的候选码矢的方法和设备 |
CN107636756A (zh) * | 2015-04-10 | 2018-01-26 | 汤姆逊许可公司 | 用于编码多个音频信号的方法和设备以及用于利用改进的分离解码多个音频信号的混合的方法和设备 |
CN108630211A (zh) * | 2017-03-20 | 2018-10-09 | 班布科技有限公司 | 使用全通滤波器的动态音频增强 |
CN111587457A (zh) * | 2017-11-10 | 2020-08-25 | 弗劳恩霍夫应用研究促进协会 | 信号滤波 |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
CN111587457B (zh) * | 2017-11-10 | 2023-05-12 | 弗劳恩霍夫应用研究促进协会 | 信号滤波 |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
CN112105902A (zh) * | 2018-04-11 | 2020-12-18 | 杜比实验室特许公司 | 基于机器学习的用于音频编码和解码的基于感知的损失函数 |
CN112105902B (zh) * | 2018-04-11 | 2022-07-22 | 杜比实验室特许公司 | 基于机器学习的用于音频编码和解码的基于感知的损失函数 |
Also Published As
Publication number | Publication date |
---|---|
ZA200810597B (en) | 2009-11-25 |
CN101501759B (zh) | 2012-08-15 |
US20080004869A1 (en) | 2008-01-03 |
US7873511B2 (en) | 2011-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101501759B (zh) | 具有动态可变规整特性的音频编码器、音频解码器和音频处理器 | |
JP6556815B2 (ja) | オーディオデコーダ及び復号方法 | |
US8682652B2 (en) | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic | |
EP2038879B1 (en) | Audio encoder and audio decoder having a dynamically variable warping characteristic | |
EP2165328B1 (en) | Encoding and decoding of an audio signal having an impulse-like portion and a stationary portion | |
EP2144171B1 (en) | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal | |
KR101346894B1 (ko) | 오디오 인코더/디코더, 인코딩/디코딩 방법 및 기록매체 | |
CN102113051A (zh) | 具有级联开关的低比特率音频编码/解码方案 | |
KR20070061330A (ko) | 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기 | |
EP1873754B1 (en) | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic | |
Vasilache et al. | Flexible spectrum coding in the 3GPP EVS codec | |
Fuchs et al. | Super-wideband spectral envelope modeling for speech coding | |
Czyzewski et al. | Speech codec enhancements utilizing time compression and perceptual coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |