CN111587457A - 信号滤波 - Google Patents
信号滤波 Download PDFInfo
- Publication number
- CN111587457A CN111587457A CN201880086266.9A CN201880086266A CN111587457A CN 111587457 A CN111587457 A CN 111587457A CN 201880086266 A CN201880086266 A CN 201880086266A CN 111587457 A CN111587457 A CN 111587457A
- Authority
- CN
- China
- Prior art keywords
- filtering
- interval
- filter
- update interval
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001914 filtration Methods 0.000 title claims abstract description 370
- 238000000034 method Methods 0.000 claims abstract description 62
- 230000008859 change Effects 0.000 claims description 32
- 230000005236 sound signal Effects 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 20
- 238000012546 transfer Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 7
- 230000007774 longterm Effects 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000000295 complement effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 29
- 230000003044 adaptive effect Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 230000007704 transition Effects 0.000 description 7
- 238000013139 quantization Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 5
- 238000005562 fading Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 3
- 230000001351 cycling effect Effects 0.000 description 3
- 238000011045 prefiltration Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0294—Variable filters; Programmable filters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0012—Smoothing of parameters of the decoder interpolation
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03H—IMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
- H03H17/00—Networks using digital techniques
- H03H17/02—Frequency selective networks
- H03H17/0294—Variable filters; Programmable filters
- H03H2017/0295—Changing between two filter characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Networks Using Active Elements (AREA)
- Image Processing (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
Abstract
讨论了根据随不同更新间隔而变的参数对划分成不同更新间隔的信息输入信号(11,11a,x)进行滤波以获得经滤波输出信号(y,15)的方法和系统。系统(10)可包括:第一滤波单元(12),用于在当前更新间隔(T)中的初始子间隔(Tl)处对第一滤波输入信号(11,x)进行滤波以获得第一滤波输出信号(y’,13),所述第一滤波单元(12)被配置为将沿着至少初始子间隔(Tl)的参数从较高滤波状态改变为较低滤波状态;以及第二滤波单元(14),用于根据与当前更新间隔(T)关联的参数在所述初始间隔(Tl)处对第二滤波输入信号(13)进行滤波以获得第二滤波输出信号(15),所述第二滤波单元(14)被配置为将沿着至少初始子间隔(Tl)的参数从较低滤波状态改变为较高滤波状态。第一滤波输入信号(11)是基于信息输入信号(x),第一滤波输出信号(13)是中间信号(y’),第二滤波输入信号是基于中间信号(y’),以及经滤波输出信号(y)是基于第二滤波输出信号(15)。
Description
技术领域
本发明的示例涉及用于对信号进行滤波的系统和方法(例如:LTP后置滤波和/或前置滤波)。
背景技术
现有技术包括以下公开:
[1]A.T.Hill and A.Ilchmann,"Exponential stability of time-varyinglinear systems(时变线性系统的指数稳定性),"IMA J Numer Anal,pp.865-885,2011。
[2]3GPP TS 26.090,Adaptive Multi-Rate(AMR)speech codec;Transcodingfunctions(自适应多速率(AMR)语音编解码器;转码功能)。
[3]3GPP TS 26.445,Codec for Enhanced Voice Services(EVS);Detailedalgorithmic description(用于增强语音服务(EVS)的编解码器;详细算法说明)。
[4]3GPP TS 26.190,Adaptive Multi-Rate-Wideband(AMR-WB)speech codec;Transcoding functions(自适应多速率宽带(AMR-WB)语音编解码器;转码功能)。
[5]3GPP TS 26.290,Extended Adaptive Multi-Rate-Wideband(AMR-WB+)codec;Transcoding functions(扩展自适应多速率宽带(AMR-WB+)编解码器;转码功能)。
[6]B.Edler,C.Faller and G.Schuller,"Perceptual Audio Coding Using aTime-Varying Linear Pre-and Post-Filter(基于时变线性前置与后置滤波器的感知音频编码),"in AES 109th Convention,Los Angeles,2000。
[7]A.Gray and J.Markel,"Digital lattice and ladder filter synthesis(数字格梯滤波器综合),"IEEE Transactions on Audio and Electroacoustics,vol.vol.21,no.no.6,pp.491-500,1973.
[8]M.P.Lamoureux,S.Ismail and G.F.Margrave,"Stability of time variantfilters(时变滤波器的稳定性),"CREWES Research Report-Volume 19,2007。
[9]P.J.Wilson and H.Chhatwal,"Adaptive Transform Coder Having LongTerm Predictor(具有长期预测器的自适应变换编码器)".US Patent 5,012,517,30Apr1991。
[10]M.Tsushima,Y.Nakatoh and T.Norimatus,"Apparatus for expandingspeech bandwidth(用于扩展语音带宽的装置)".EP Patent 0 732 687B2,18Sep 1996。
[11]A.John Robinson,"Low Bit Rate Audio Coder And Decoder Operatingin A Transform Domain Using Vector Quantization(使用矢量量化在变换域中操作的低位速率音频编码器和解码器)".US Patent 5,999,899,7Dec 1999。
[12]J.Thyssen,C.C Lee and J.-H.Chen,"Method And Apparatus ToEliminate Discontinuities In Adaptively Filtered Signals(消除自适应滤波信号中的不连续性的方法和装置)".US Patent 7,353,168B2,28Jun 2002。
[13]E.Ravelli,M.Jander,G.Pietrzyk,M.Dietz and M.Gayer,"Method andapparatus for processing an audio signal,audio decoder,and audio encoder(用于处理音频信号的方法和装置、音频解码器和音频编码器)".EP Patent 2980796A1,28Jul2014。
[14]E.Ravelli,C.Helmrich,G.Markovic,M.Neusinger,M.Jander,M.Dietz andS.Disch,"Apparatus and method for processing an audio signal using a harmonicpost-filter(使用谐波后置滤波器处理音频信号的装置和方法)".EP Patent 2980799A1,28Jul 2014。
[15]ITU-T Recommendation G.718,Frame error robust narrow-band andwideband embedded variable bit-rate coding of speech and audio from 8-32kbit/s,2008(ITU-T建议G.718,来自8-32kbit/s的语音和音频的帧错误鲁棒窄带和宽带嵌入式可变位速率编码,2008)。
音频和语音大致为时变信号。由于改变相对较慢,因此通常认为其在短时段内呈准静态。用于处理音频/语音信号的适应性滤波器参数(例如:线性预测编码(LPC)或长期后置滤波(LTP))每个帧都更新一次,并且在帧持续时间内保持恒定,帧通常具有2到40毫秒的长度。此类滤波实际上属于时变,因此大致上产生不稳定性和不连续性,即使利用已冻结滤波器参数进行滤波也仍然如此[1]。
已知一种交叉衰减方法。可将所述交叉衰减方法汇总为:
-用一组参数c0对信号的一部分进行滤波,产生第一经滤波部分
-用一组参数c1对所述信号的相同部分进行滤波,产生第二经滤波部分;以及
-进行所述第一经滤波部分和所述第二经滤波部分的交叉衰减。
所述交叉衰减方法尤其已用在[9]、[10]、[11]和[12]中。
-移除不连续性的另一种方法是使用LP滤波器,如[13]中所述。
无限脉冲响应(IIR)滤波器可采用格梯形式呈现[7]。采用格梯形式的稳定IIR滤波器的内插应产生稳定的时变IIR滤波器[8]。因此,大致以IIR滤波器来说明,应有可能从[6]将反射系数的内插一般化。然而,此类方法对于LTP滤波太复杂,因为非零反射系数的数量会等于音调滞后(例如,如果用于平滑[3]中的LTP不连续性,这会导致滤波器阶数大于250)。
复杂度是实时编解码非常重要的方面,而且期望使用一种方法来避免时变滤波中的不连续性,使复杂度最小。
低复杂度技术对于进行滤波操作是优选的。
发明内容
本发明介绍一种用于例如在连续帧中无限脉冲响应(IIR)滤波器参数改变时避免不连续性的低复杂度技术。
根据示例,提供一种系统,用于根据随不同更新间隔而变的参数,对划分成所述不同更新间隔的信息输入信号进行滤波,以获得经滤波输出信号,所述系统包括:
第一滤波单元,用于根据与居前更新间隔关联的参数,至少在当前更新间隔中的初始子间隔处对第一滤波输入信号进行滤波,以获得第一滤波输出信号,所述第一滤波单元被配置为将沿着至少所述初始子间隔的所述参数从较高滤波状态改变为较低滤波状态;以及
第二滤波单元,用于根据与所述当前更新间隔关联的参数,在所述初始间隔处对第二滤波输入信号进行滤波,以获得第二滤波输出信号,所述第二滤波单元被配置为将沿着至少所述初始子间隔的所述参数从较低滤波状态改变为较高滤波状态,
其中所述第一滤波输入信号是基于所述信息输入信号,所述第一滤波输出信号是中间信号,所述第二滤波输入信号是基于所述中间信号,以及所述经滤波输出信号是基于所述第二滤波输出信号。
因此,例如关于交叉衰减技术,不连续性得以减小和/或避免,并且复杂度得以降低。不需要进行两个不同滤波操作,并且随后,对于交叉衰减这两个经滤波信号:单纯地进行两个滤波操作,从而降低进行计算的必要性。
根据示例,提供第三滤波单元,用于根据与所述当前更新间隔关联的参数,在所述当前更新间隔中的位于所述初始子间隔之后的后续子间隔处对所述信息输入信号进行滤波。
因此,除了所述初始子间隔之外,所述当前更新间隔也可使用与其最适合的参数来操作。
根据示例,提供选择器,被配置为检查用于所述当前更新间隔的各参数之间的距离是否为0、或在第一阈值内,以使用所述第三滤波单元,至少在所述初始子间隔中,对所述信息输入信号进行滤波。
根据示例,所述第三滤波单元被配置为沿着后续间隔维持相同滤波状态、和/或使滤波器参数维持恒定。
根据示例,所述第一滤波单元、第二滤波单元和第三滤波单元中的至少一个作为长期(LTP)滤波器操作。
根据示例,所述第一滤波单元、第二滤波单元和第三滤波单元中的至少一个具有包括分子和分母的传递函数,其中所述分子包括由增益信息指示的增益值,并且其中所述分母包括由音调滞后信息指示的音调滞后的整数部分、和取决于所述音调滞后的小数部分的多抽头滤波器。
根据示例,所述第一滤波单元、第二滤波单元和第三滤波单元中的至少一个的所述参数是从谐度信息、增益信息、音调滞后信息、所述信息输入信号的所述音调滞后的所述整数部分、和/或所述信息输入信号的所述音调滞后的所述小数部分获得的。
根据示例,所述第一、第二和/或第三滤波单元中的至少一个的所述参数是在线性预测编码(LPC)滤波器、无限脉冲响应(IIR)滤波器、和/或有限脉冲响应(FIR)滤波器中的至少一个或其组合之中选择的滤波器的参数。
根据示例,所述第一滤波单元被配置为通过沿着至少所述初始子间隔朝向0改变的第一缩放因子,来缩放与所述居前更新间隔关联的参数,和/或所述第二滤波单元被配置为通过沿着至少所述初始子间隔从0朝向不同于0的值改变(或从接近0的值改变为与接近0的所述值相比离0更远的第二值)的第二缩放因子,来缩放与所述当前更新间隔关联的参数。
根据示例,所述第一缩放因子和所述第二缩放因子是相对于大于0的值彼此互补的非负值。
根据示例,所述第一缩放因子是要朝向0,朝向至少所述初始子间隔的最终极端改变,和/或所述第二缩放因子是要从0,从所述当前更新间隔的初始极端朝向非零值改变(或从接近0的值改变为比接近0的所述值相比离0更远的第二值)。
根据示例,提供第四滤波单元,被配置为至少在所述初始子间隔处,使用通过对与所述当前更新间隔关联的所述参数、和与所述先前更新间隔关联的所述参数进行内插而获得的参数,对所述信息输入信号进行滤波。
根据示例,提供选择器,被配置为检查用于所述当前更新间隔的各参数之间的距离是否在第二阈值内,以使用所述第四滤波单元,至少在所述初始子间隔中,对所述信息输入信号进行滤波。
所述系统被进一步配置为基于与所述信号关联的值,主动地设置所述第二阈值。
根据示例,所述系统可被配置为:
将所述第二阈值设置为音调滞后距离阈值,所述音调滞后距离阈值等于所述当前更新间隔处的所述音调滞后的整数部分与所述先前更新间隔处的所述音调滞后的整数部分之间的最小值,
以在所述当前更新间隔处的所述音调滞后的所述整数部分与所述先前更新间隔处的所述音调滞后的所述整数部分之间的距离小于所述音调滞后距离阈值时,使用所述第四滤波单元;和/或
以在所述当前更新间隔处的所述音调滞后的所述整数部分与所述先前更新间隔处的所述音调滞后的所述整数部分之间的距离大于所述音调滞后距离阈值时,使用所述第一滤波单元和第二滤波单元。
根据示例,所述系统可被配置为:
使用与所述当前更新间隔处和所述居前间隔处的所述信号的所述增益关联的条件,
以在所述当前更新间隔处和所述居前间隔处的所述信号的增益都不为零时,使用所述第四滤波单元,和/或
以在所述当前更新间隔处和所述居前间隔处的所述信号的增益中的至少一个为零时,使用所述第一滤波单元和第二滤波单元。
根据示例,所述第一滤波单元用于按照下面的形式提供所述第一滤波输出信号
其中
当n增加时,sk-1[n]朝向接近0的值改变
以及所述第二滤波单元用于按照下面的形式提供所述第二滤波输出信号:
其中
当n增加时,sk[n]从接近0的值朝向非零值改变,
其中T是当前第k更新间隔,Tl是所述初始子间隔,n是瞬时,x[n]是所述信息输入信号(11),bk-1,i和ak-1,j是与先前第(k-1)更新间隔关联的参数,ak,j和bk,i与所述当前第k更新间隔关联的参数,以及P和Q与所述滤波器的类型关联。
根据示例,所述第一滤波单元被配置为按照下面的形式提供所述第一滤波输出信号(13)
以及所述第二滤波单元被配置为按照下面的形式提供所述经滤波输出信号:
其中是所述初始子间隔的长度,是所述信息输入信号(11),是所述中间信号,是所述经滤波输出信号(15),n是瞬时,和分别基于与所述居前更新间隔关联的所述音调滞后的所述整数部分和小数部分,pint和pfr分别基于与所述当前更新间隔关联的所述音调滞后的所述整数部分和小数部分,cnum(k)是基于用于所述当前更新间隔的增益值的系数,cden(k,pfr)是基于用于所确定的更新间隔的增益值且基于所述音调的所述小数部分的系数,是基于用于居前更新间隔的增益值的系数,是基于用于居前更新间隔的增益值且基于所述音调的所述小数部分的系数,Lden和Lnum是固定的和/或基于所述输入信号的采样率。
根据示例,所述初始子间隔的时间长度介于所述当前更新间隔的时间长度的5%与40%之间。
根据示例,所述系统被进一步配置为检查所述当前第k帧的所述增益gk和所述先前第(k-1)帧的所述增益gk-1,以使得:
-如果gk-1=0且gk=0,则没有第一滤波、第二滤波也没有第三滤波;和/或
-如果gk-1=0且gk≠0,则
·禁用所述第一滤波;
·至少在所述初始子间隔(Tl)中有第二滤波;
·在所述后续子间隔(Ts)中有第三滤波;和/或
-如果gk-1≠0且gk=0,则
·至少在所述初始子间隔(Tl)中有第一滤波;
·禁用所述第二滤波;
·禁用所述第三滤波;和/或
-如果gk-1≠0且gk≠0,则检查所述音调滞后的所述整数部分和小数部分的差异,以使得:
·如果所述音调滞后的所述整数部分和小数部分在所述当前第k帧中与在所述先前第(k-1)帧中是相同的,则:
■没有第一滤波也没有第二滤波;
■沿着所述当前更新间隔的100%有第三滤波;
·否则,若所述音调滞后的所述整数部分中或所述小数部分存在差异:
■至少在所述初始子间隔(Tl)中有第一滤波;
■至少在所述初始子间隔(Tl)中有按照52的第二滤波;
■在后续子间隔(Ts)中有按照53的第三滤波。
根据示例,所述系统包括编码器侧和解码器侧,其中所述第一滤波单元、第二滤波单元、第三滤波单元、和/或第四滤波单元中的至少一个位于所述解码器侧。
根据示例,所述系统包括一编码器侧和一解码器侧,其中所述第一滤波单元、第二滤波单元、第三滤波单元、和/或第四滤波单元中的至少一个位于所述编码器侧。
根据示例,所述系统包括转换器,用于将所述信息信号的第一表示转换成所述信息信号的第二表示。
根据示例,所述系统被配置为:
确定所述第一滤波单元和/或第二滤波单元(12,14)是否将作为恒等滤波器操作;以及
在确定的情况下,将所述第一滤波器和/或第二滤波器(12,14)旁路。
根据示例,提供有一种方法,用于根据对应于不同更新间隔的参数对包括所述不同更新间隔的信息输入信号进行滤波以获得经滤波输出信号,所述方法包括:
根据与居前更新间隔关联的参数,至少在当前更新间隔的初始子间隔处,进行第一滤波,其中沿着至少所述初始子间隔的参数从较高滤波状态改变为较低滤波状态;以及
根据与所述当前更新间隔关联的参数,至少在所述初始子间隔处,进行第二滤波,其中沿着所述初始子间隔的参数从较低滤波状态改变为较高滤波状态,
其中所述第一滤波是对所述信息输入信号进行的,并且所述第二滤波是对通过所述第一滤波获得的所述信号进行的。
根据示例,提供有一种存储指令的非暂时性存储单元,所述指令在由处理器执行时,致使所述处理器执行上文或下文的方法之一,和/或实施如上文或下文的系统、和/或这种系统的部件。
举例而言,所述信息输入信号可以是音频信号。
在一些示例中,所述间隔是整个帧。在其他示例中,所述间隔小于所述帧。
因此,仅可针对所确定的帧的初始间隔或最终间隔进行上文的技术:在后续间隔中,可使用用于所述所确定的帧的参数,进一步降低运算复杂度。
因此,后续间隔中没有对输出进行修改。
在示例中,可使用系数的内插来代替上述技术。这可基于选择来控制,以使滤波操作更加适应信号条件。
在示例中,可以将第二阈值设置为介于所确定的帧的音调滞后的整数部分与先前帧(或后续帧)的音调滞后的整数部分之间的最小值,和/或将第二阈值设置为介于所确定的帧的增益与先前帧或后续帧的增益之间的最大值。因此,可以在所确定的帧的增益与先前帧的增益之间的距离小于第二阈值时使用第四滤波单元,和/或在所确定的帧的音调滞后的整数部分与先前帧或后续帧的音调滞后的整数部分之间的距离小于第二阈值时使用第一和第二滤波单元。
在示例中,可以定义与所确定的帧和居前帧或后续帧的信号的增益关联的条件。因此,可以在所确定的帧和居前帧或后续帧的信号的增益中的至少一个为零时使用第四滤波单元。在示例中,可以在所确定的帧和居前帧或后续帧处的信号的增益都不为零时使用第一滤波单元和第二滤波单元。
因此,修改与先前帧或后续帧关联的参数、和与所确定的帧关联的参数(例如,逐样本修改),以进行平稳滤波,其避免和/或减小所述帧之间的不连续性。
因此,可使第一滤波单元和第二滤波单元的输入信号轻易地且同调地消减。
在示例中,所述第一滤波单元被配置为用以按照下面的形式提供所述第一滤波输出信号(13)
其中是所述初始子间隔的长度,是所述信息输入信号(11),是所述中间信号,是所述经滤波输出信号(15),n是瞬时,和分别基于与所述居前帧关联的所述音调滞后的所述整数部分和小数部分,pint和pfr分别基于与所确定的帧关联的所述音调滞后的所述整数部分和小数部分,cnum(k)和cden(k,pfr)是基于用于所确定的帧的增益值的系数,和cden(k,pfr)是基于用于居前帧的增益值的系数,Lden和Lnum是固定的和/或基于所述输入信号的采样率。
在示例中,在较低滤波状态中,修改同一滤波器的参数,以具有比在较高滤波状态中更接近0的值。举例而言,所述参数可通过缩放逐渐变化的因子来缩放。
本发明举例而言,可用于长期后置滤波(LTPF)。LTPF是一种用于基于变换的音频编码的工具,有助于降低谐波间噪声。其依赖变换解码后应用于时域信号的后置滤波器。该后置滤波器实质上是无限脉冲响应(IIR)滤波器,具有由一个参数(音调滞后)或两个参数(音调滞后和增益)控制的梳状频率响应。为了使稳健性更好,当增益为非零时,在编码器侧估计后置滤波器参数(音调滞后和每帧增益),并且将所述参数编码成位流。
附图说明
图1、1a、2、3、4、5a和5b示出根据示例的系统;
图6、7和7a示出根据示例的方法;
图8和9示出根据示例的系统;
图10和11示出根据示例的时间图;
图12a和12b示出根据示例的系统;以及
图13示出根据示例的传递函数。
具体实施方式
在这里介绍的方法中,对于不同更新间隔,滤波参数(亦称为滤波器参数或参数)大致上也有差异。两个连续的更新间隔可具有不同参数。在示例中,更新间隔可具有信号适应性,并且其长度可随时间改变或移位。
在一些示例中,所述信号被划分成各帧。举例而言,帧可与固定数量的样本和/或固定时间长度(例如:20ms)相关联。当传送或存储时,帧可与特定参数相关联,例如:滤波参数。在相同帧内,所述参数可大致上恒定。
在一些示例中,更新间隔可对应于帧。因此,当传送或存储时,信号可例如通过与特定帧相关联进行编码的数据,包括与帧(其也是更新间隔)相关联的参数(例如:滤波参数)。
在一些示例中,更新间隔不对应于预定义帧。当传送或存储时,信号可包括与更新间隔相关联的参数,即使所述参数是与帧相关联地以信号通知的。在一些情形中,新帧(具有新参数)预期新的更新间隔,并且旧的更新间隔仍然与旧参数相关联。当更新间隔具有适应性时(举例而言,其长度是例如基于信号的特性而实时确定的),其一般不与固定长度帧对应。因此,可以使参数与特定更新间隔相关联(其在一些情形中,与帧相关联)。
图1示出系统10,其可以是用于对输入信号11(表示为“x”或“x[n]”,其中“n”意指为特定样本)进行滤波的系统。
信号11可以是信息信号,诸如音频信号。可使用信息信号的数字表示。信号可包括一连串的样本,每个样本是在不同的时间瞬时(例如,离散时间瞬时)获得的。可将所述信号划分成不同的帧和/或更新间隔(例如:一连串的样本)。每个帧和/或更新间隔可由多个样本(例如:1、2、…、n、…)构成,举例而言,每个样本与一离散时间相关联。每个帧和/或更新间隔可细分成初始子间隔和后续子间隔(子间隔可以是适当子间隔,因为其长度可小于更新间隔的长度)。一般而言,初始子间隔的样本居前于相同帧和/或更新间隔的后续子间隔的样本(在所述样本之前)。所确定的(当前,目前)帧居前于后续帧和/或更新间隔,并且被一居前(先前、旧)帧居前。所确定的(当前,目前)更新间隔居前于后续更新间隔,并且被一居前(先前、旧)更新间隔居前。更新间隔的初始子间隔可具有一时间长度,该时间长度介于当前更新间隔的时间长度的1%与99%之间,更特别是介于20%与30%之间(例如:四分之一)。后续子间隔可具有一时间长度,该时间长度介于当前更新间隔的时间长度的1%与99%之间,更特别是介于70%与80%之间(例如:四分之三)。
对于一些示例,其称为更新间隔的“至少一个初始子间隔”,这意味着一些示例中也可覆盖更新间隔的100%。
系统10可根据随更新间隔变化的参数(例如,一般而言,根据参数所关联的特定更新间隔而在时间上变化的参数,例如借助于被编码且与特定帧关联的参数),对信息输入信号11(x)进行滤波。系统10可提供经滤波输出信号15(y或y[n])。系统10可提供后滤波音频信号(例如:后滤波音频信号的时域TD表示)。
系统10可包括用于对信息输入信号11(第一滤波输入信号)进行滤波的第一滤波单元12。第一滤波单元12可利用当前更新间隔(目前更新间隔,诸如当前处理的更新间隔)的至少初始子间隔的样本来操作,以获得第一滤波输出信号,该第一滤波输出信号为中间信号13(y'或y'[n])。(至少初始子间隔可在示例中仅意指为初始子间隔,或者,在示例中意指为大于所述初始子间隔的间隔,诸如更新间隔)。中间信号13可使用与居前更新间隔(例如:居前于当前更新间隔的更新间隔)相关联的参数来获得。第一滤波单元12被配置为(例如逐渐地,例如通过衰减,例如单调地)将沿着至少初始子间隔的参数从较高滤波状态改变为较低滤波状态。举例而言,可对应于初始子间隔中的第一样本而更不减小和/或更不消减(因此暗示较高滤波状态)参数。可对应于至少初始子间隔中的最后样本(其中可将参数处理成更接近0),将参数减小得更多和/或消减得更多(因此,暗示较低滤波状态)。
系统10可包括第二滤波单元14。第二滤波单元14可具有第二滤波输入信号和第二滤波输出信号。第二滤波单元14可对中间信号13(其为第二滤波输入信号)进行滤波。第二滤波单元14可利用当前更新间隔的至少初始子间隔(例如,滤波单元12在其上操作的相同至少初始子间隔)的样本来操作。第二滤波单元14可根据与当前更新间隔相关联的参数来对中间信号进行滤波。第二滤波单元14可被配置为(例如逐渐地,例如通过衰减,例如单调地)将沿着至少初始子间隔的参数从较低滤波状态改变为较高滤波状态。举例而言,对于至少初始子间隔中的前几个样本(其中可将参数处理成0或接近0),参数可被减小得更多和/或消减得更多(因此暗示较低滤波状态)。对于至少初始子间隔中的最后几个样本,参数可被减小得较少和/或消减得较少(因此暗示较高滤波状态)。
较低滤波状态可使得脉冲响应比较高滤波状态中的脉冲响应更接近于恒等滤波器的脉冲响应。在一些示例中,较低滤波状态和较高滤波状态可设为,相对于较高滤波状态的脉冲响应的能量,较低滤波状态暗示脉冲响应的增大能量。在一些示例中,较低滤波状态和较高滤波状态可设为,相对于较高滤波状态的脉冲响应的能量,较低滤波状态暗示脉冲响应的减小能量。当第一滤波单元12在较低滤波状态下操作时,意味着脉冲响应不同于(例如,低于或高于)相同的第一滤波单元12在较高滤波状态下操作时所暗示的能量。这同样适用于第二滤波单元14。在较低滤波状态中,参数可比在较高滤波状态中更接近0。
在示例中,第一滤波单元12可从较高滤波状态朝向较低滤波状态改变,和/或第二滤波单元14可从较低滤波状态改变为较高滤波状态。
一般而言,当从较高滤波状态改变为较低滤波状态时,可修改参数(例如逐渐地和/或单调地和/或通过衰减和/或通过消减来修改)。在较低滤波状态中,可处理成0,或者可处理成比较高滤波状态中的参数更接近0。举例而言,在较高滤波状态中,与在较低滤波状态相比,参数可被较少地减小和/或较少地消减和/或离0更远。
在较低滤波状态中,可使滤波效应减小(例如,可获得与恒等滤波器的效应相同或接近的效应)。在较高滤波状态中,可获得强烈滤波效应。
在较高滤波状态中,对输入信号进行强烈滤波。在较低滤波状态中,对输入信号进行强烈滤波。在示例中,参数消减越多,滤波状态越低。
第一滤波单元12和/或第二滤波单元14可被配置为使参数消减和/或减小,以使得与在较高滤波状态中,减小和/或消减的参数与在较低滤波状态中相比,被较少地消减(例如,离0更远)和/或较少地减小(例如,接近0)。
第一滤波单元12可被配置为使用第一消减因子或缩放因子来缩放(例如,向下缩放)参数,和/或第二滤波单元14可被配置为使用第二消减因子或缩放因子来缩放(例如,向下缩放)参数。相较于在较高滤波状态中,在较低滤波状态中,第一消减因子或缩放因子和/或第二消减因子或缩放因子可更接近0。
第一滤波单元12和/或第二滤波单元14可被配置为消减和/或减小和/或向下缩放参数,以使得所述参数是通过与在所述较高滤波状态中相比在所述较低滤波状态中更接近0的第一消减因子和/或减小缩放因子来消减和/或减小的。
第一滤波单元12可被配置以通过逐渐地消减和/或减小与居前更新间隔相关联的参数,将参数从较高滤波状态改变为较低滤波状态,和/或第二滤波单元14可被配置为通过从接近0的参数逐渐增大和/或放大到与当前更新间隔相关联的参数来改变参数。
第一滤波单元12可被配置为通过使用减小消减因子和/或缩放因子(例如,通过使用例如逐渐朝向0转变的消减因子和/或缩放因子),将参数从较高滤波状态改变为较低滤波状态。第二滤波单元14可被配置为通过放大(例如,逐渐地)消减因子和/或缩放因子(例如,通过使用例如逐渐脱离0的消减因子和/或缩放因子),将参数从较低滤波状态改变(例如,逐渐地)为较高滤波状态。
第一滤波单元12可被配置为通过将减小开窗函数应用于参数(例如,逐渐朝向0转变的开窗函数),将参数从较高滤波状态改变为较低滤波状态,和/或第二滤波单元14可被配置为通过将放大开窗函数应用于参数(例如,逐渐脱离0的开窗函数),将参数从较低滤波状态改变为较高滤波状态。
举例而言,可在输入信号11中提供参数作为控制数据。举例而言,滤波器可以是线性非时变(LTI)无限脉冲响应(IIR)滤波器(例如,用于LTP后置滤波)。所述参数可以是或包括例如增益信息和/或音调信息。
特别地,第一滤波单元12和第二滤波单元14可以是LTP滤波器(或后置滤波器)的部分,例如,位于解码器(例如,音频解码器)处。举例而言,所述参数可从基于谐度的测量获得。举例而言,所述参数可基于音调滞后T、基于音调滞后的一整数部分Tint、基于音调滞后的小数部分Tfr、和/或基于如在例如音频解码器处获得的增益g。举例而言,这些参数可与更新间隔(在一些示例中,其为固定长度的帧、或可具有适应性长度)相关联。
因此,第一滤波单元和第二滤波单元中的每一个均可与特定参数和/或与特定传递函数相关联。特别地,所述传递函数可属于具有分子和分母的类型,其中所述分子包括由增益信息指示的增益值,并且其中所述分母包括由音调滞后信息指示的音调滞后的整数部分、和取决于所述音调滞后的小数部分的多抽头滤波器。举例而言,所述传递函数可以是:
所述传递函数的各参数可根据在编码器侧估计的、和/或从位流解码的参数来确定g可以是已解码增益,Tint和Tfr可以是已解码音调滞后的整数和小数部分,α和β可以是对增益进行加权的两个纯量,以及B(z,Tfr)可以是低通FIR滤波器,其系数取决于已解码音调滞后的小数部分。B(z,Tfr)的阶数和系数也可取决于位速率和输出采样率。可为位速率与输出采样率的每种组合来设计和调谐不同频率响应。图13中提供转移函数130的示例(纵然其他类型的滤波器和/或转移函数也是可行的)。
值得注意的是,可针对每个更新间隔(其可以是可据以将原始信号细分的一个帧)可改变参数和传递函数。因此,第k更新间隔可与Hk(z)传递函数和诸如Tint,k,Tfr,k,gk,等参数相关联,而第(k-1)更新间隔则可与Hk-1(z)传递函数和诸如Tint,k-1,Tfr,k-1,gk-1等参数相关联。因此,在第k帧或更新间隔,第一滤波单元12可使用旧参数Tint,k-1,Tfr,k-1,gk-1来操作,而第二滤波单元14可使用已更新参数Tint,k,Tfr,k,gk来操作。此处理可至少针对第k已更新间隔的初始子间隔(或者,在一些示例中,针对100%)来进行。
更一般而言,部件10和12处的每个滤波器或至少一个滤波器可以是以下列形式表示的LTI IIR滤波器(也可将其表示为H(z)):
或使用线性差分方程式:
系数bi和aj可以是滤波器参数。值得注意的是,系数bi和aj一般可针对不同帧和/或更新间隔而变化。
已注意到,经滤波信号15在居前第(k-1)更新间隔与当前第k更新间隔之间产生平滑转移。不同更新间隔之间的不连续性因此得以避免和/或减小。
此外,进行滤波功能的程序具有特别降低的复杂度。
这种系统举例而言,可用于长期后置滤波器(LTPF)。
第一滤波单元12与第二滤波单元14可视为以串联方式连接(或级联、或“一个接一个”)。
图1a示出系统10的变例10',其中可分别在选择器16和17处将第一滤波单元12和第二滤波单元14旁路。举例而言,选择器16和17可通过参数来控制(图1a中示出外部条件可造成滤波单元的旁路)。
图2示出系统10,其可实施图1的系统(即使为求清楚,图2中未示出图1a在这里的旁路连接,变例10'仍属可能)。与信息输入信号(第一滤波输入信号)11的当前第k更新间隔有关的信息可包括信号表示11a(例如,时域中构成“x”的不同瞬时的样本的实际值)、和控制数据11b(其举例而言,可被编码成位流并且从传送器传送出去、或存储在内存中)。控制数据11b可包括第k帧或更新间隔(例如,已估计音调滞后和/或增益值或类似值或其经处理版本)处与滤波相关联的参数。可将当前第k帧或更新间隔的参数存储在参数存储部件21a(例如:存储单元,诸如缓存器)中。参数存储部件21b可含有居前第(k-1)帧或更新间隔的参数。箭头21'意指为居前第(k-1)帧或更新间隔的参数(先前存储于存储部件21a)变为“居前帧或更新间隔的参数”,并且是在处理新第k帧或更新间隔时存储于存储部件21b。
对于当前第k帧或更新间隔的初始子间隔,可将存储在存储部件21b中的参数(已准备将其用于居前第(k-1)帧)应用于一第一滤波部分22(其可实施第一滤波单元12的功能)。至少对于当前第k帧或更新间隔的初始子间隔,可将存储在存储部件21a中的参数(准备用于当前第k帧)应用于第二滤波部分24(其可实施第二滤波单元14的功能)。
然而,存储在存储部件21b中的参数(最初准备用于居前第(k-1)更新间隔)可例如通过区块23b来改变,以造成第一滤波部分22在当前第k更新间隔的初始子间隔内,从较高滤波状态移动(例如逐渐地、例如单调地)到较低滤波状态。举例而言,所述参数可使用消减因子来缩放(例如,向下缩放、消减),所述消减因子转变为0,例如减小消减因子(例如,通过乘法来消减)。区块23b可应用开窗函数。开窗函数可至少在初始子间隔中朝向0改变和/或减小(例如从第k当前更新间隔的第一样本处的最高正值(例如1)改变为至少初始子间隔的最后样本处的最低值(例如0))。
举例而言,滤波效应的减小(例如,从较高滤波状态减小为较低滤波状态)可通过逐渐减小消减因子(例如,从一最大值(例如1)减小为一最小值或可忽略值(例如0))来获得。当消减因子为可忽略(或0)时,参数是修改为可忽略(或0)值,并且第一滤波部分22的输出13(y')几乎与信息输入信号11(x)类似(或相同)。
存储在存储部件21a中的参数(与当前第k帧或更新间隔相关联)可通过区块23a来改变,以造成第二滤波部分24在当前第k帧或更新间隔的至少初始子间隔内,从较低滤波状态移动(例如逐渐地、例如单调地)到较高滤波状态。举例而言,所述参数可通过增大消减因子(例如,通过乘法)来缩放(例如,向下缩放、消减),其可从0或接近0的值放大到离0更远的值。区块23a可应用开窗函数。所述开窗函数可从初始子间隔的初始瞬时到初始子间隔的最后时间瞬时,增大或按其他方式改变(例如,从较低滤波状态改变为较高滤波状态)(例如,从接近0的值改变为离0更远的值,和/或从初始子间隔的第一样本处的最低值改变为第k当前帧的初始子间隔、或更新间隔的最后样本处、或所述帧或更新间隔的最后样本处的正最高值,例如1)。
举例而言,滤波效应的增加(例如,从较低滤波状态朝向较高滤波状态)可通过从0或接近0的值逐渐放大到离0更远的值来获得,举例而言,通过放大或增加(例如,单调地或严格单调地)消减因子(例如,从接近0的值到离0更远的值,和/或从最小或可忽略值(例如0)到最大值(例如1))来获得。当消减因子为可忽略(或0)时,参数是修改为可忽略(或0)的值,并且第二滤波部分24的输出与其输入(其为中间信号y'或13)几乎类似(或相同)。
在示例中,可在至少初始子间隔的连串样本期间,以彼此互补于一常数值(例如:一正值,诸如1)的因子(例如,区块23a、23b的缩放因子),来修改第一和/或第二滤波单元12、14的参数,以使得其总和为恒定。在示例中,所述因子的变例可呈线性(例如,可用1次方程式来描述)。
在示例中,第一滤波部分22和第二滤波部分24可共享相同硬件/软件结构,其输出仅随着不同输入和/或参数和/或因子的输入而改变。
值得注意的是,所述参数可在存储部件21a和21b中与一特定长度的子间隔、或更新间隔的100%相关联。因此,可知悉要将更新间隔或帧平滑到哪个百分比(或在任何情形中,将哪个部分平滑到哪个百分比)。在一些情形中,使用者选择(例如,配置为会话期间的设置)可界定至少一子间隔的长度。
图3示出系统30,其可包括用于至少初始子间隔的滤波部10(或10',即使图3中未示出旁路连接亦然)、以及用于后续子间隔的滤波部31(其中更新间隔的100%中使用图1和2的双滤波技术,“用于后续子间隔的滤波部”未操作)。用于初始子间隔的滤波部可与系统10相同。用于后续子间隔的滤波部31可配置为用于在由用于至少初始子间隔(其可以是继初始子间隔后的后续间隔)的滤波部10对所述部分的末端进行滤波之后,于当前第k更新间隔中,对信号进行滤波。用于后续间隔的滤波部31可以是缺少消减参数的第三滤波器。因此,第三滤波部31可单纯地应用最初为当前更新间隔准备的参数。
选择器32可监测信息输入信号11,并且在滤波部10用于初始子间隔与滤波部31用于后续间隔之间进行改变。值得注意的是,用于后续间隔的滤波部31(第三滤波器)可由用于第一和/或第二滤波器12和14的结构块和/或功能块所构成。
另外或替代地,选择器32可决定是否要在初始子间隔期间,将滤波部10(具有第一和第二滤波器12、14)用于初始子间隔、或将滤波部31至少用于初始子间隔(除了将滤波部31用于后续子间隔以外,以防万一)。所述决定可基于特定条件,其举例而言,可基于参数(例如,基于参数的与当前更新间隔相关联的值、和参数的与先前更新间隔相关联的值之间的比较)。以下段落中提供此决定的一些示例。
部件22、24和31处的滤波器可以是如上述的LTP后置滤波器,或者更一般而言,可以是LTI IIR滤波器(也可将其表示为H(z)),并且可采用以下形式来呈现:
或使用线性差分方程式:
系数bi和aj可以是滤波器参数。图10示出与滤波器Hk相关联的更新间隔T(例如,当前第k更新间隔处)、和与滤波器Hk-1相关联的居前间隔(例如,先前第(k+)日期间隔处)。值得注意的是,图11示出更新间隔(或帧)T、两个滤波器都有用到的初始子间隔Tl、以及仅将滤波部31用于后续间隔的随后子间隔Ts=T-Tl。(在更新间隔(或帧)T的100%是由部件12和14滤波两次的示例中,可理解t T=Tl,亦即,子间隔与间隔相同,并且后续间隔不存在。)
我们将更新间隔k中的时变滤波器视为等于LTI IIR滤波器Hk(其可以是一LTP后置滤波器):
其中T与更新间隔有关(并且可存在于零散样本中),并且k为其索引,k-1与居前第(k-1)更新间隔产生关联。第三滤波区段31可属于这种类型。P和Q可特定于滤波器(例如,分别为前馈滤波器阶数和反馈滤波器阶数)。举例而言,Q可与Tint的最大可能值有关。
第一滤波部件12和/或22可采用以下形式将一中间信号y'输出:
其中对于kT-Tl≤n<(k+1)T,当n增加时,sk-1[n]朝向0改变
其中Tl与初始子间隔有关。
第二滤波部件14和/或24可采用以下形式输出经滤波输出信号y:
值得注意的是,经滤波输出值y[n]具有基于由第一滤波器提供的中间滤波器输出y′[n]的输入。
图4示出系统40,作为图2的系统的修改。选择器(图未示)可从使用对初始子间隔(Tl)进行滤波(如通过系统10来滤波)的第一模式进行改变、以及从使用对当前更新间隔的后续子间隔进行滤波的第二模式进行改变。如偏差器41a和开关41b所示,在如图2中于初始子间隔处对信息输入信号x完成滤波之后,可通过偏移器41a来旁路第一滤波部分22。因此,第二滤波部分24可用信息输入信号x的表示11a来直接馈送。如偏差器41c所示,存储在存储部件21a中的参数可直接用在第二滤波部分24处而不消减,亦即将区块23a旁路。因此,在图4中,第三滤波单元31的用于对当前间隔的后续间隔进行滤波的作用通过第二滤波部分24来实现。(在更新间隔的100%由部件22和24滤波两次的示例中,偏差器始终处于准许部件22和24两者都进行滤波的相同状态。)
图5a示出系统50。系统50可包括第一滤波单元51(举例而言,其可以是如图1或1a中配置的单元12)、第二滤波单元52(举例而言,其可以是如图1或1a中配置的单元14)、和/或第三滤波单元53、和/或第四滤波单元54(其可以是可选的)。在示例中,这些滤波单元中有些可相同(例如,利用相同硬件获得),并且仅按照输入和/或参数彼此区别。一选择器55可基于信号表示11a和/或控制数据11b的值,将信息输入信号11的信号表示11a引导至滤波单元51至54中任何一个。
在一些示例中,第一、第二和第三滤波单元51、52和53是如图4中那样获得。因此,第二滤波单元52也可进行第三滤波单元53的活动。
第一滤波单元51可实施第一滤波单元12和/或第一滤波部分22,并且用于以从一较高滤波状态移动到一较低滤波状态的参数(最初与居前第(k-1)更新间隔相关联),对当前第k较低间隔的初始子间隔进行滤波。第二滤波单元52可实施第二滤波单元14和/或第二滤波器部分24,并且用于以从较低滤波状态移动到较高滤波状态的参数(实际上与当前第k更新间隔相关联),对当前更新间隔的初始子间隔进行滤波。第三滤波单元53可为当前更新间隔的后续间隔实施第三滤波部分31。
第四滤波单元54可实施用于以通过内插用于居前第(k-1)更新间隔的参数、和用于当前第k更新间隔的参数所获得的参数,对当前第k更新间隔的初始子间隔进行滤波的一滤波器。
选择器55可操作:
-在初始子间隔(Tl)中,通过从以下中选择来操作:
·以第一滤波单元51与第二滤波单元52的组合动作为基础的滤波操作;
·以第三滤波单元53为基础的滤波操作;以及
·以第四滤波单元54为基础的滤波操作;
-在随后间隔中,通过使用第三滤波单元53来操作。
请参照对于初始子间隔的决定,选择器55举例而言,可通过使用一第一和/或一个第二阈值和/或条件(例如,后续更新间隔中信号的增益的条件)来操作。举例而言,选择器55可选择:
·在当前第k更新间隔的参数与居前第(k-1)更新间隔的参数之间的距离为高,例如超过第二阈值时,第一滤波单元51与第二滤波单元52的组合动作;
·在当前第k更新间隔的参数与居前第(k-1)更新间隔的参数之间的距离更小(例如低于第二阈值)时,仅第四滤波单元54的动作;和/或
·在各参数之间的距离小于第一阈值(其可小于第二阈值)、和/或在当前第k更新间隔的参数与居前第(k-1)更新间隔的参数相同时,仅第三滤波单元53的动作,。
举例而言,可将第二阈值主动地设置为所述当前更新间隔处所述音调滞后的整数部分与所述先前更新间隔处所述音调滞后的整数部分之间的最小值。
另外或替代地,也可能基于先前更新间隔处信号的增益来使用条件,以在所确定的(当前)更新间隔处的增益与先前更新间隔处的增益之间的距离小于第一和/或第二阈值时,使用第四滤波单元54。因此,可实时修改第二阈值以及增益条件,举例而言,用以获得更好滤波行为。
图5b示出LTP后置滤波器的实施方式,其中不使用第四滤波器54(举例而言,其可包括如图1或1a中配置的单元12和14)。
图6示出方法60,其中“UI”意指为“更新间隔”,并且”SI”意指为”子间隔”。根据方法60,可(例如从编码器)获得信息输入信号11(x)。特别地,信号11可包括信号表示11a(举例而言,其与要滤波的音频信号相关联)和控制数据11b(举例而言,其可包括与当前更新间隔相关联的滤波器参数)。
在步骤S61,可为(所确定的)当前第k更新间隔获得输入信息信号(例如x,11),连同与当前第k更新间隔相关联的参数。
接着,可通过在初始子间隔的多个样本之中对值(索引)n进行循环,为当前第k更新间隔的初始子间隔,进行第一滤波操作61(例如,通过部件12、22、51中的任何一个来进行)。在S611,可通过将变量n初始化(成为n=0),将初始子间隔的第一样本列入考虑。在S612,使用与居前第(k-1)更新间隔相关联的参数,获得中间值y'[n]。在613(“初始SI的最后样本?”),检查n是否已达到与初始子间隔的最后样本相关联的值(例如,检查n是否为初始子间隔的最后索引)。如果n已达到初始子间隔的最后值(索引),则结束第一滤波操作61并开启第二滤波操作62。否则,在S614(“将沿着当前第k UI的初始S的参数从较高滤波状态改变为较低滤波状态”),改变参数以从较高滤波状态移动到较低滤波状态(例如,在图2的区块23b处通过使因子减小来移动)。在S615,将新样本列入考虑(通过更新索引,例如通过n=n+1),并且对于新索引n重复步骤S612。
可通过在初始子间隔的多个样本之中对值(索引)n进行循环,为当前第k更新间隔的初始子间隔,进行第二滤波操作62(例如,通过部件14、24、52中的任何一个来进行)。在S621,可通过将变量n初始化为0,将初始子间隔的(r n=0的)第一样本列入考虑。在S622,使用与当前第k更新间隔相关联的参数,获得经滤波输出值y[n]。在S623(“初始SI的最后样本?”),检查索引n是否已达到与初始子间隔的最后样本相关联的值(例如,检查n是否为初始子间隔的最后索引)。如果索引n已达到初始子间隔的最后值,则结束第二滤波操作62并开启第三滤波操作63。否则,在S624(“将沿着当前第k UI的初始SI的参数从较低滤波状态改变为较高滤波状态”),改变参数以从较低滤波状态移动到较高滤波状态(例如,将值从0或接近0的值放大到离0更远的值,例如通过在区块23a处使因子的值增大来放大)。在S625,将新样本列入考虑(n=n+1),并且调用步骤S612。
通过在后续子间隔的多个样本之中循环值(索引)n,为当前第k更新间隔的后续(例如最终)子间隔,进行第三滤波操作63(例如,通过部件31、24、53中的任何一个来进行)。在S632,使用与当前第k更新间隔相关联的参数,获得经滤波输出值y[n]。在633,确定索引n是否已达到与当前第k更新间隔的最后样本相关联的值(例如,检查n是否为更新间隔的最后索引)。如果n已达到更新间隔的最后值,则结束第三滤波操作63。否则,在S635,将新样本列入考虑(例如通过n=n+1来更新索引),并且以新索引n重复步骤S632。
在该方法结束时,已获得经滤波输出信号的所有值y[n]。可在S64更新索引k的值。可针对第(k+1)更新间隔再次调用步骤S61。
应注意的是,在步骤S611至S63中任何一个之后,步骤S61并非严格必要。在一些示例中,也可在操作61至63的处理期间已经获得当前第k更新间隔处的信息输入信号。在示例中,可事前已经获得在当前第k更新间隔处的信息输入信号。
在针对更新间隔的100%进行第一和第二滤波操作的示例中,不进行第三滤波操作63。
图7示出方法70(“UI”意指为“更新间隔”,并且“SI”意指为”、子间隔”)。方法70可包括步骤S71(“获得第k UI处的信息输入信号x以及与第k UI相关联的参数”),其中,对于当前第k更新间隔,获得当前第k更新间隔处的信号x以及与信号x相关联的参数。
在步骤S72(“用于第k UI的参数与用于第(k-1)UI的参数是否相同,或者它们的距离是否在第一阈值内?”),执行第一比较:将用于当前第k更新间隔的参数与用于居前第(k-1)更新间隔的参数进行比较(例如,通过选择器55进行比较)。如果所述参数相同、或者第k更新间隔的参数与第(k-1)更新间隔的参数之间的距离处于第一(低)阈值内,则在S73(“进行第三滤波操作63,而不对沿着整个第k UI的系数进行消减”),针对当前第k更新间隔(初始子间隔和后续子间隔两者)使用与当前第k更新间隔相关联的参数(因为对于两个连续的更新间隔,这些参数相同或几乎相同,不需要对它们进行消减或平滑:因此,可以将第三滤波器31或53应用于整个更新间隔,而无需区分初始子间隔与后续子间隔),来进行第三滤波操作63。随后,在S77,更新k的值,并且现在可对新的第(k+1)更新间隔进行滤波。举例而言,该判定可通过例如图4和5中所示的选择器中的任何一个来做出。
如果参数之间的距离超过第一阈值,则可以进行第二检查:举例而言,在S74(“用于第k UI的参数与用于第(k-1)UI的参数之间的距离是否在第二阈值内?是否gk=0或gk-1=0?”),将用于当前第k更新间隔的参数与用于居前第(k-1)更新间隔的参数作比较(例如,在选择器55处作比较)。在S74检查的参数也可与在S72检查的参数不同。如果用于当前第k更新间隔的参数与用于居前第(k-1)更新间隔的参数之间的距离处于第二阈值(其可高于第一阈值)内,则在S75(“进行对参数进行内插的第四滤波操作”),可在当前第k更新间隔的初始子间隔处执行第四滤波操作(例如,通过第四滤波单元54来执行)。在这种情形中,要应用于初始子间隔的参数可通过对用于居前第(k-1)更新间隔的参数与用于当前第k更新间隔的参数进行内插(和/或平均)来获得。之后,对于后续间隔,可在S75'(“对后续SI进行第三滤波”)执行第三滤波63。随后,在S77(“k=k+1”),更新k的值,并且现在可对新的第(k+1)更新间隔进行滤波。
如果在S74,已验证用于当前第k更新间隔的参数与用于居前第(k-1)更新间隔的参数之间的距离超过第二阈值,则在步骤S76(“对第k UI的初始SI进行第一滤波操作61和第二滤波操作62,并且对第k UI的后续SI进行第三滤波操作63”),可执行第一滤波操作61、第二滤波操作62、和第三滤波操作63(例如,通过部件12、14、22、24、31、51、52和/或53来执行):因此,当前更新间隔的第一子间隔可首先通过12、22、51、和/或61中任何一个来进行滤波,然后通过14、24、52和/或62中任何一个来进行滤波,并且后续子间隔是使用31、53、和/或63中任何一个来进行滤波。随后,在S77,更新k,并且可以对新的第(k+1)更新间隔进行滤波。
在示例中,可额外地或替代地设置至少另一条件(在一些情形中,在步骤S74处)。在一些示例中,所提供的是,为了开启步骤S76,必须验证该条件。在示例中,S74处的条件可包括以下中的至少一个:
-如果所确定的(当前)更新间隔的增益为零(gk=0),则使用第一滤波器,不使用第二滤波器,并且不使用第三滤波器(并且,若有提供,不使用第四滤波器)。
-如果先前更新间隔的增益为零(gk-1=0),则不使用第一滤波器,使用第二滤波器,使用第三滤波器(并且,若有提供,不使用第四滤波器)。
-如果先前更新间隔和当前更新间隔的增益都不同于零(gk-1≠0并且gk≠0),则所使用者取决于其他参数(例如,在一些示例中,可考虑音调滞后的整数和/或小数部分的差异)。
在一些示例中,在步骤S72之前可进行步骤S74。
在一些示例中,仅进行一次比较。因此,存在不具有步骤S72和S73的示例,也存在不具有步骤S74和S75的示例。
在一些示例中,仅进行一次比较。因此,存在不具有步骤S72和S73的示例,也存在不具有步骤S74和S75的示例。
在示例中,可例如从参数的值,实时获得用于第一步骤S72和/或第二步骤S74的第一阈值和/或第二阈值(或关于参数(例如关于增益)的其他条件)。
在有关LTP滤波器的一些示例中,第二阈值可以是音调滞后距离阈值,其被定义以在当前第k更新间隔的参数与居前第(k-1)更新间隔的参数之间的距离(例如,模数差异)小于以下最小值时使用第四滤波单元54(和/或内插),所述最小值是与第k更新间隔相关联的音调滞后的整数部分、和与第(k-1)更新间隔相关联的音调滞后的整数部分之间的最小值。因此,步骤S74处的第二比较可以是:
|Tint,k-Tint,k-1|<min(Tint,k,Tint,k-1)
其中Tint,k和Tint,k-1分别是更新间隔k和k-1处的音调滞后的整数部分。因此,在一些示例中,S74处的第二比较可检查以下两个条件是否都适用:
Tint,k<2Tint,k-1
因此,为了利用第四滤波单元54进行滤波,S74处的第二比较设为整数音调必须(从第(k-1)更新间隔至第k更新间隔)不增加超过100%,也必须不减少50%:亦即,先前更新间隔与当前更新间隔之间没有音调加倍或减半。
类似的是,S74处的第二比较设为当已验证下式时,可触发第一滤波和第二滤波(例如,使用部件12、14、51、52等中的任何一个):
|Tint,k-Tint,k-1|≥min(Tint,k,Tint,k-1)
也就是说,验证以下两个条件中的至少一个:
Tint,k≥2Tint,k-1
因此,在当前第k更新间隔处音调滞后的整数部分相对于先前第(k-1)更新间隔处音调滞后的整数部分极端变化时,可启用第一滤波单元和第二滤波单元(例如,通过选择器55来启用)。
可设置另一条件。举例而言,为了进行第一滤波操作61和第二滤波操作62(例如,利用第一滤波单元12和第二滤波单元14来进行),步骤S74可提供:应验证以下条件中的至少一个:
gk=0
gk-1=0
当gk-1=0时,可获得与略过第一滤波器相同的效果。当gk=0时,可获得与略过第二滤波器相同的效应。
条件可以是,如果以下两个条件都得到验证:
gk≠0
gk-1≠0
在该情形中,在S74检查(当前帧和先前帧的)音调滞后的整数部分之间的差异(举例而言,如上文已论述的)。
在此示例中,可看出:
1)如果当前更新间隔与居前间隔之间的参数相同,则对于当前更新间隔,使用与先前更新间隔相同的滤波器(第三滤波单元53);
2)如果当前更新间隔的参数与居前更新间隔的参数极为不同、或增益中的至少一个为零,则优选使用第一滤波器和第二滤波器(12、24、14、24、51、52、61、62);
3)如果当前更新间隔和先前更新间隔的增益都不同于0,则从音调滞后确定应当使用哪个滤波器。
值得注意的是,与(1)和(3)相比,(2)提升了质量。(2)具有比现有技术低的复杂度。
在一些示例中,不使用第四滤波单元54,因此,不进行S74处的第二验证,并且可仅进行与极小阈值的比较(或对确切值进行比较)。
其他示例(例如:非LTP滤波器)可基于其他参数。然而,本方法可针对任何IIR滤波器进行。
一般而言,如果存在参数差异,则使用第一滤波器和第二滤波器。否则,在初始子间隔中使用第三滤波器。
举例而言,当LPC参数在码激励线性预测(CELP)编解码中改变时,可使用本解决方案。这样,可处理CELP中的甚至在基于子帧的线谱频率(LSF)内插之后仍存在的不连续性。可使用此技术的另一示例是对CELP编解码中的共振峰增强进行滤波。
图8和9示出编码/解码系统的部件。
图8示出用于将信息信号从音频信号81编码成数字格式的装置80的示例。
装置80可举例而言,可包括任选前置滤波器81a,其可例如操作为系统10、30、40和50中任何一个,并且其可进行上文和/或下文的任何方法。在其他示例中,可避免装置80。
装置80可包括开窗块82。装置80可包括域转换器83,其可将信息信号的TD(时域)表示转换成信息信号的FD(频域)表示。举例而言,转换器83可以是修改型离散余弦转换(MDCT)区块或修改型离散正弦转换(MDST)区块83(或与另一搭接变换(lappedtransformation)相关联的区块),位在开窗块82下游处,举例而言,用于转换成频域(FD)。装置80可包括用以在变换的窗口内对量化噪声的时间形状进行控制的时域噪声整形(TNS)区块84。装置80可包括频域噪声整形器(FDNS)区块85。装置80可包括用于在开窗块82下游处获得FDNS参数的区块87。装置80可包括量化块86,其也可包括熵编码器。装置80可包括TD/TD(时域瞬时检测器)区块88。
装置80可包括用于获得LTP参数(例如:谐度信息、增益信息、诸如音调滞后的音调信息等)的LTP区块89。由LTP区块89所获得的参数至少有一些可通过设备10、30、40、50和/或通过方法60和/或70用于信号的每一第k更新间隔。举例而言,用于第k更新间隔的参数可以是与第k更新间隔处的信号相关联的音调滞后和增益(在一些情形中为任选,并且可在解码器侧予以估计)。LTP区块89的操作可独立于前置滤波器81a的操作:前置滤波器81a也可不存在,但LTP区块89可通过向解码器侧提供参数来正确地操作。
所述信号可通过位流编写器89'来编码,并且可存储在内存中和/或传送至解码器(例如使用诸如蓝牙的标准协议例如采无线方式传送)。
图9示出装置90,用于编码信号信息,其可获得数字音频信号(例如,使用从编码器(诸如装置80)传送出去或由所述编码器存储的位流读取器91')。装置90可包括部件10、12、14、20、22、24、31、40、50中的至少一个,和/或针对信号的每一第k更新间隔实施方法60和/或70中任何一个,以提供经解码和经滤波的输出信号15。特别地,装置90可包括LTP后置滤波器91,其可实施进行与部件12、14、22、24、31、40、51至54、61至63和70相关联的滤波动作中任何一个。装置90可包括去量化块92,其也可包括熵解码器。装置90可包括FDNS区块93,其可从FDNS参数解码器94接收参数。装置90可包括FDNS区块93下游处的TNS区块95。装置90可包括域转换器96,其可将信息信号的第一域表示(例如:FD域表示)转换成信息信号的第二域表示(例如:TD表示)。转换器96可以是逆MDCT或逆MDST区块(或与另一搭接变换相关联的区块),用于从频域转换成时域。装置90可包括可从TD/TD区块88接收参数的开窗和重叠和相加(OLA)区块97。
举例而言,LTP后置滤波器91可从区块97获得要滤波的信号的数字表示11a(x)。举例而言,LTP后置滤波器91可从位流获得系数11b。
系统80和/或90中的至少一个可进行分析操作(例如,在区块89处进行),用于获得与第k和/或第(k+1)更新间隔相关联的参数。
一数字输入信息信号x[n](11a)可用时变滤波器来滤波,其参数在更新间隔T(例如,当前第k更换间隔)处改变,产生经滤波输出信号y[n]。更新间隔T也可具有信号适应性,因此T可随着时间改变。我们可将滤波器视为可在时间间隔T期间予以表示为线性非时变(LTI)无限脉冲响应(IIR)滤波器。时间间隔T可以是数字信号的帧(例如,上述当前滤波器)或子帧。我们可将帧和/或更新间隔一词用于帧和子帧两者。
LTI IIR滤波器(其也可表示为H(z))可采用以下形式呈现:
或使用线性差分方程式:
系数bi和aj是滤波器参数(例如,要存储在例如内存部件21a和21b中的参数)。LTIIIR滤波器可通过其系数(参数)来独特地定义。图10示出与滤波器Hk相关联的更新间隔T(例如,当前第k更新间隔处)、和与滤波器Hk-1相关联的居前间隔。
我们将更新间隔k中的时变滤波器视为等于LTI IIR滤波器Hk:
并不在更新间隔k-1和k之间的边界处立即改变滤波器参数,而代之以在更新间隔k开始时以一组新的时变滤波器处理一部分:
1.如果(步骤S72)滤波器参数是相同的(其差值极小),则利用滤波器Hk进行滤波(步骤S73);
2.如果(步骤S74)各滤波器参数之间的距离小(例如,在S74进行检查的第二阈值内),则逐样本对这些滤波器参数进行内插(S75),并且使用经内插参数对更新间隔k的开始部分进行滤波;
3.如果(步骤S74)各滤波器参数之间的距离大(例如,大于第二阈值),则(步骤S76)首先利用滤波器H′k-1对长度Tl的开始部分进行滤波(例如,在诸如12、22、51等组件处滤波),随后通过H′k来滤波(例如,在诸如14、24、52等组件处滤波),其由下式定义:
举例而言,y′[n]可以是图1的第一滤波单元12的中间输出。sk-1[n]可以是组件23b(图2)的缩放因子,用于减小参数值ak-1,i和bk-1,i(它们储存在储存组件21b中)。sk[n]可以是储存在组件23a中的缩放因子,用于减小组件23a(图2)的参数值,以减小参数值ak和bk(它们储存在储存组件21b中)。
图11中提供sk[n]和sk-1[n]的示例,其中T意指为当前第k更新间隔。可将第一和第二滤波操作61和62应用于至少初始子间隔Tl,而将第三滤波操作63应用于TS。如可看出的是,在Tl中,Tl减小,而sk[n]则渐进地增大:这是因为应用于输入信号的先前第(k-1)更新间隔的参数渐进地减小,而当前第k更新间隔T的参数则渐进地增大到最大值,其在随后间隔Ts处恒定。因此,有可能获得从第(k-1)更新间隔到第k更新间隔的平滑转移。
在图11中,亦有可能看到可实施第三滤波器62(例如,通过第三单元53来操作)的处。第三滤波可由下式定义:
如[3]中描述的系统可用作基础,包括时域瞬时检测器(TD TD)、开窗、MDCT、TNS、FDNS、OLA、量化、算术编码器以及LTP后置滤波器(请参照上文的区块82至89和92至97)。可在LTP后置滤波器中实现所述修改,并且从而将会描述LTP的细节。
一般而言,LTP可视为用于对信息信号的表示进行滤波的谐波后置滤波器。其可基于包括分子和分母的传递函数,其中所述分子可包括由增益信息指示的增益值,并且所述分母可包括由音调滞后信息指示的音调滞后的整数部分、和取决于所述音调滞后的小数部分的多抽头滤波器。在示例中,后置滤波器的传递函数在分子中包括用于音调滞后的零小数部分的另一多抽头FIR滤波器。在示例中,分母包括多抽头滤波器与增益值之间的乘积。在示例中,分子可进一步包括第一纯量值与第二纯量值的乘积,其中分母包括第二纯量值而不包括第一纯量值,其中第一和第二纯量值是预确定的,并具有大于或等于0且小于或等于1的值,以及其中第二纯量值可低于第一纯量值。
下文提供LTP滤波器的示例(亦请参照图13)。
在编码器侧(例如,装置80),可如[14]中所述使用LTP参数计算:
1.音调估计
估计每个帧的一个音调滞后(整数部分+小数部分)(帧大小例如20ms)。举例而言,一个帧可以是一个更新间隔。这可分两步骤完成以降低复杂度,并且提升估计准确度。
a.音调滞后的整数部分的第一估计
使用产生平滑音调演进轮廓的音调分析程序(例如,开环音调分析,说明请见[15]的6.6小节)。此分析一般是在子帧基础(子帧大小例如10ms)上完成的,并且每个子帧产生一个音调滞后估计。请注意,这些音调滞后估计不具有任何小数部分,并且一般是对降采样信号(采样率例如6400Hz)进行估计。使用的信号可以是任何音频信号,例如输入信号或LPC加权音频信号,说明请见[15]的6.5小节。
b.音调滞后的整数部分的细化
对以核心编码器采样率执行的音频信号x[n]估计音调滞后的最终整数部分,所述核心编码器采样率大致高于a.中使用的降采样信号的采样率(例如:12.8kHz、16kHz、32kHz等等)。信号x[n]可以是任何音频信号,例如LPC加权音频信号。
音调滞后的整数部分是滞后dm,其对自相关函数进行最大化
音调滞后T周围的d是在步骤1.a.中估计的。
T-δ1≤d≤T+δ2
c.音调滞后的小数部分的估计
求出小数部分的方式可为:内插在步骤1.b.中运算的自相关函数C(d)并且选择对经内插自相关函数进行最大化的小数音调滞后。所述内插可使用低通有限脉冲响应FIR滤波器来进行,说明请见例如[15]的6.6.7小节。
2.增益估计和量化
增益可对核心编码器采样率下的输入音频信号进行估计,但其也可以是任何音频信号,如LPC加权音频信号。此信号注记为y[n],并且可与x[n]相同或不同。
首先可通过利用以下滤波器对y[n]进行滤波,求出y[n]的预测yP[n]
Tint为音调滞后的整数部分(在1.b.中估计),并且B(z,Tfr)为低通FIR滤波器,其系数取决于音调滞后Tfr的小数部分(在1.c.中估计)。
音调滞后分解为1/4时B(z)的一个示例:
则增益g计算如下:
并且限制在0与1之间。
最后,使用例如均匀量化,以例如两个位来量化该增益。
可使用出自[14]的LTP后置滤波器(图13中提供传递函数的示例):
其参数是根据在编码器侧估计的参数确定的,并且从位流中解码。g是经解码增益,Tint和Tfr是经解码音调滞后的整数和小数部分,α和β是对增益进行加权的两个纯量,以及B(z,Tfr)是低通FIR滤波器,其系数取决于经解码音调滞后的小数部分。B(z,Tfr)的阶数和系数也可取决于位速率和输出采样率。可为位速率与输出采样率的每一组合设计和调谐一不同的频率响应。
所述LTP后置滤波器与[14]的差异可以是从一个帧到下一个帧的转变。帧k-1的结束部分中使用的LTP后置滤波器为Hk-1:
并且帧k的结束部分为Hk:
bj(Tfr)在下表中定义:
T<sub>fr</sub> | 0/4 | 1/4 | 2/4 | 3/4 |
b<sub>-1</sub>(T<sub>fr</sub>) | 0.0000 | 0.0152 | 0.0609 | 0.1353 |
b<sub>0</sub>(T<sub>fr</sub>) | 0.2325 | 0.3400 | 0.4391 | 0.5094 |
b<sub>1</sub>(T<sub>fr</sub>) | 0.5349 | 0.5094 | 0.4391 | 0.3400 |
b<sub>2</sub>(T<sub>fr</sub>) | 0.2325 | 0.1353 | 0.0609 | 0.0152 |
帧k(当前第k帧或更新间隔)的开始部分中可有三种可能性:
1.(步骤S73):如果各参数相同,亦即:gk=gk-1,Tint,k=Tint,k-1,Tfr,k=Tfr,k-1,则利用Hk对帧k的开始部分进行滤波;
2.(步骤S75):如果各参数之间的差异小,例如|Tint,k-Tint,k-1|<min(Tint,k,Tint,k-1)且|gk-gk-1|<max(gk,gk-1),则使用已内插参数,利用时变滤波器对帧k的长度L的开始部分进行滤波:
Tk-1=Tint,k-1+Tfr,k-1/4
Tk=Tint,k+Tfr,k/4
T′fr,k[n]=T′k[n]-T′int,k[n]
0≤n<L
3.(步骤S76):如果各参数之间的差异大,则首先利用H′k-1对帧k的长度L的开始部分进行滤波:
并且随后通过H′k来滤波:
对于复杂度比质量更重要的情形,每当gk≠gk-1,Tint,k≠Tint,k-1,Tfr,k≠Tfr,k-1中的至少一个得到满足时,可使用3.。根据特定示例,这些条件中的一些条件可比其他一些条件更重要。在一些示例中,对于2.与3.可能性之间的选择,音调的差异是要验证的最重要条件。
下文参考图7a和方法700提供上文针对LTP后置滤波器的方程式的应用的示例。参数可包括增益gk、音调的整数部分Tint,k、以及音调的小数部分Tfr,k。在这些示例的一些中,选择器55可操作以使得:
-如果gk-1(增益)为零且gk也为零(S702),则没有滤波(S704),因为:
其中gk-1=0;以及
其中gk=0;
(请参照图1a,可将第一和第二滤波单元12和14两者都旁路)
-如果gk-1=0且gk≠0(S706),则(S708)
其中g_(k-1)=0;
·后续子间隔Ts(其中Tl≠T)中有第三滤波,形式为
(请参照图1a,仅将第一滤波单元12旁路);
-如果gk-1≠0且gk=0(S710),则(S712)
其中gk=0;
·没有第三滤波,因为
其中gk=0;
(请参照图1a,仅将第二滤波单元14旁路);
-如果gk-1≠0且gk≠0(714),则检查音调滞后的整数和小数部分的差异(S716,“Tint,k=Tint,k-1且Tfr,k-1=Tfr,k?”):
·如果k-1和k中音调滞后的整数和小数部分相同(Tint,k=Tint,k且Tfr,k-1=Tfr,k),则(S718):
■根据由选择器执行的选择,没有第一滤波,也没有第二滤波(例如,在步骤S72);
·否则若所述音调滞后的所述整数部分或小数部分存在差异(S720):
■Tl中有第一滤波,形式为
■Tl中有第二滤波,形式为
(请参照图1a,滤波单元12与14都未被旁路)
值得注意的是,当(例如,通过选择器55)确定将不进行第一和/或第二滤波(或将提供输入的相同值作为输出,基本上作为“恒等滤波器”操作,其一般无用),可以对无用的滤波单元和/或部进行旁路(举例如图1a中所示)。因此,运算数量减少。
这里对用于LTP后置滤波器的滤波器的操作提供论述。MDCT或MDST(或任何其他搭接变换)合成之后的解码信号可使用IIR滤波器在时域中进行后置滤波,所述IIR滤波器的参数取决于LTPF位流数据,举例而言,可以是“pitch_index”和/或“ltpf_active”(后者启用/禁用LTP后置滤波操作)。为了避免当参数从一个帧改变到下一个帧时出现不连续性,可对当前帧的前四分之一应用转变机制。
LTPF IIR后置滤波器可使用下式(亦请参照上文)来实施:
LTPF音调滞后的整数部分pint与小数部分pfr可如下计算。首先,音调滞后(例如,在12.8kHz处)可使用下式来恢复
接着,可使用下式将音调滞后缩放为输出采样率fs,并且转换成整数与小数部分
pfr=pup-4*pint
其中Fs是采样率。
将滤波系数cnum(k)和cden(k,pfr)可如下计算
cnum(k)=0.85*gainltpf*tab_ltpf_num_fs[k]对于k=0..Lnum
cden(k,pfr)=gainltpf*tab_ltpf_den_fs[pfr][k]对于k=0..Lden
其中
Lnum=Lden-2
并且在一些示例中,可根据诸如下面的过程来获得gainltpf和gainind:
表格tab_ltpf_num_fs[k]和tab_ltpf_den_fs[pfr][k]可预先确定。一些示例可以是(而不是“fs”,所使用的实际带宽):
可考虑五种不同情形:
1.第一情形:ltpf_active=0且mem_ltpf_active=0(“mem_ltpf_active”意指为居前帧中的启用/禁用状态):
其中NF意指为一个帧中处理的样本数量,俗称为帧尺寸。
2.第二情形:ltpf_active=1且mem_ltpf_active=0
3.第三情形:ltpf_active=0且mem_ltpf_active=1
这里论述本发明的优点。以上示例比先前使用的实施方式更不复杂。举例而言,在LTP后置滤波器的例示性情形中,胜过[13]中所用LPC方法的复杂度优势清楚可知。与[9]、[10]、[11]和[12]中使用的交叉衰减方法相比较,每个样本少一次操作。为了明白这点,应注意的是,和可通过逐样本从βgk-1中减去常数并将常数加上βgk来实现。连同使用H′k-1和H′k的滤波,在操作数量方面,这等效于以Hk-1和Hk进行滤波,然后如交叉衰减方法中所使用的对经滤波信号进行加权。接着,所述交叉衰减方法接续将加权信号相加,同时所提出的方法已经产生输出。
当确定将不进行第一和/或第二滤波(或将提供输入的相同值作为输出,基本上操作为“恒等滤波器”,其一般无用),可以对无用的滤波单元和/或部进行旁路(举例如图1a中所示)。因此,运算数量减少。
一般而言,当滤波器在帧边界处从Hk-1改变时,得以避免不连续性,:
至Hk:
通过利用时变滤波器H′k-1,利用帧k的长度L对开始部分进行滤波:
然后利用时变滤波器H′k对时变滤波器H′k-1的中间输出y′[n]进行滤波:
H′k-1是从利用Hk-1进行完全滤波改变为不进行滤波的时变滤波器。H′k是从不进行滤波改变为利用Hk进行完全滤波的时变滤波器。
这里以伪码提供第一示例(基于上文图5b的示例):
这里以伪码提供第二示例:
在此2.实施方式中,除了检查音调的整数部分之间的差异以外,我们还可包括音调的小数部分。
图12a示出系统110,其举例而言,可实施编码装置80。系统110可包括处理器111和存储指令的非暂时性存储单元112,所述指令在受处理器111执行时,可致使处理器111执行参数估计113(举例如方块89中所示)、编码信号处理114(例如,用以实施部件82至86)、以及位流形成115(例如,用以实施位流编写器89')。系统110可包括输入单元116,其可获得音频信号(例如:音频信号89)。因此,处理器111可进行处理以获得音频信号的编码表示(例如,以格式11a表示)。可使用输出单元117向外部单元提供此编码表示。输出单元117举例而言,可包括用以向外部设备(例如,使用诸如蓝牙的无线通信)和/或外部存储空间通信的通信单元。处理器111可将音频信号的编码表示存储在本地存储空间118中。
图12b示出系统120,其可实施设备10、30、40、50、90、和/或进行方法60或70。系统120可包括处理器121和存储指令的非暂时性存储单元122,所述指令在受处理器121执行时,可致使处理器121进行位流读取123(例如,用以实施位流读取器91')、第一/第二滤波控制124(例如,部件12、14、22、24、51、52和/或滤波操作61、62中任何一个、和/或方法70的步骤),和/或一第三滤波控制125(例如,用以实施第三滤波器31、53、和/或滤波操作63、和/或方法70的步骤)。系统120可包括输入单元126,其可获得一音频信号的解码表示(例如,以11a的形式)。因此,处理器121可进行用以(例如,使用一LTP滤波器)对信号进行滤波的处理。可使用输出单元127向外部单元提供此经滤波表示。输出单元127举例而言,可包括用以向外部设备(例如,使用诸如蓝牙的无线通信)和/或外部存储空间通信的通信单元。处理器121可将音频信号的经滤波表示存储在本地存储空间128中。
在示例中,系统110和120可以是相同设备。
取决于某些实施方式要求,可将示例实施成硬件。所述实施方式可使用数字存储媒体来进行,例如软式磁盘、数字多样化光盘(DVD)、蓝光光盘、光盘(CD)、只读存储器(ROM)、可规划只读存储器(PROM)、可抹除且可规划只读存储器(EPROM)、电气可抹除可规划只读存储器(EEPROM)或闪存,所述数字存储媒体上存储有电子可读控制信号,所述电子可读控制信号与一可规划计算机系统相配合(或能够相配合)而得以进行各别方法。因此,数字存储媒体可以是计算机可读。
一般而言,示例可实施成具有程序指令的计算机程序产品,当所述计算机程序产品在计算机上执行时,所述程序指令是运作来进行所述方法之一。所述程序指令举例而言,可存储在机器可读媒体上。
其他示例包括用于进行本文中所述方法之一、存储在机器可读载体上的计算机程序。换句话说,方法示例因此是具有程序指令的计算机程序,当所述计算机程序在计算机上执行时,所述程序指令是用于进行本文中所述方法之一。
所述方法的再一示例因此是数据承载媒体(或数字存储媒体、或计算机可读媒体),其包括、上有记录用于进行本文中所述方法之一的计算机程序。数据承载媒体、数字存储媒体或已记录媒体属于有形和/或非暂时性,而不是无形和暂时性的信号。
再一示例包括进行本文中所述方法之一的处理单元(例如:计算机)、或可编程逻辑器件。
再一示例包括计算机,所述计算机上安装有用于进行本文中所述方法之一的计算机程序。
再一示例包括(例如以电子方式或以光学方式)将用于进行本文中所述方法之一的计算机程序转移至接收器的装置或系统。此接收器举例而言,可以是计算机、移动设备、内存设备或类似物。此用具或系统举例而言,可包括用于将此计算机程序传送至此接收器的文件服务器。
在一些示例中,可编程逻辑器件(例如:现场可编程门阵列)可用于进行本文中所述方法的功能的一些或全部。在一些示例中,现场可编程门阵列可与微处理器相配合,以便进行本文中所述方法之一。一般而言,所述方法可通过任何适当的硬件装置来进行。
上述示例对于上述原理而言属于说明性。据了解,本文中所述布置结构与细节的修改和变例将会显而易见。因此,意图是仅受限于待决专利权利要求的范畴,并且不受限于通过本文中示例的说明和解释所介绍的特定细节。
Claims (31)
1.一种系统(10,30,40,50,80),用于根据随不同更新间隔变化的参数,对划分成所述不同更新间隔的信息输入信号(11,11a,x)进行滤波,以获得经滤波输出信号(y,15),所述系统(10)包括:
第一滤波单元(12),用于根据与居前更新间隔关联的参数,至少在当前更新间隔(T)中的初始子间隔(Tl)处,对第一滤波输入信号(11,x)进行滤波,以获得第一滤波输出信号(y’,13),所述第一滤波单元(12)被配置为将沿着至少所述初始子间隔(Tl)的参数从较高滤波状态改变为较低滤波状态;以及
第二滤波单元(14),用于根据与所述当前更新间隔(T)关联的参数,在所述初始间隔(Tl)处,对第二滤波输入信号(13)进行滤波,以获得第二滤波输出信号(15),所述第二滤波单元(14)被配置为将沿着至少所述初始子间隔(Tl)的参数从较低滤波状态改变为较高滤波状态,
其中所述第一滤波输入信号(11)是基于所述信息输入信号(x),所述第一滤波输出信号(13)是中间信号(y’),所述第二滤波输入信号是基于所述中间信号(y’),以及所述经滤波输出信号(y)是基于所述第二滤波输出信号(15)。
2.如权利要求1所述的系统,进一步包括:
第三滤波单元(31,53),用于根据与所述当前更新间隔(T)关联的参数,在所述当前更新间隔(T)中的位于所述初始子间隔(Tl)之后的后续子间隔(Ts)处,对所述信息输入信号(x,11)进行滤波。
3.如权利要求2所述的系统,进一步包括:
选择器(32,55),被配置为检查用于所述当前更新间隔(T)的各参数之间的距离是否为0、或者在第一阈值内,以使用所述第三滤波单元(53),至少在所述初始子间隔(Tl)中,对所述信息输入信号(11,x)进行滤波。
4.如权利要求2或3所述的系统,其中所述第三滤波单元(31,53)被配置为沿着所述后续间隔(Ts)维持相同滤波状态、和/或使所述滤波器参数维持恒定。
5.如前述权利要求中任一项所述的系统,其中所述第一滤波单元、第二滤波单元和第三滤波单元(12,14,22,24,51,52)中的至少一个作为长期LTP滤波器操作。
6.如前述权利要求中任一项所述的系统,其中所述第一滤波单元、第二滤波单元和第三滤波单元(12,14,22,24,51,52)中的至少一个具有包括分子和分母的传递函数(130),其中所述分子包括由增益信息指示的增益值,并且其中所述分母包括由音调滞后信息指示的音调滞后的整数部分、和取决于所述音调滞后的小数部分的多抽头滤波器。
7.如前述权利要求中任一项所述的系统,其中:
所述第一滤波单元、第二滤波单元和第三滤波单元(12,14,22,24,51,52)中的至少一个的参数是从谐度信息、增益信息、音调滞后信息、所述信息输入信号(x,11)的所述音调滞后的所述整数部分、和/或所述信息输入信号(x,11)的所述音调滞后的所述小数部分获得的。
8.如前述权利要求中任一项所述的系统,其中:
所述第一滤波单元和/或第二滤波单元的所述参数是在线性预测编码LPC滤波器、无限脉冲响应IIR滤波器、和/或有限脉冲响应FIR滤波器中的至少一个或其组合之中选择的滤波器的参数。
9.如前述权利要求中任一项所述的系统,其中:
所述第一滤波单元(12,51)被配置为通过沿着至少所述初始子间隔(Tl)朝向0改变的第一缩放因子(sk-1),来缩放与所述居前更新间隔关联的参数(21b),和/或
所述第二滤波单元(14,52)被配置为通过沿着至少所述初始子间隔(Tl)从0、或接近0的值朝向不同于0的值、或者与接近0的所述值相比离0更远的值改变的第二缩放因子(sk),来缩放与所述当前更新间隔(T)关联的参数(21a)。
10.如权利要求9所述的系统,其中:
所述第一缩放因子(sk-1)和所述第二缩放因子(sk)是相对于大于0的值彼此互补的非负值。
11.如权利要求9或10所述的系统,其中:
所述第一缩放因子(sk-1)是要朝向0,朝向至少所述初始子间隔(Tl)的最终极端改变,和/或
所述第二缩放因子(sk)是要从0、或接近0的值,从所述当前更新间隔(T)的初始极端朝向非零值、或者与接近0的所述值相比离0更远的值改变。
12.如前述权利要求中任一项所述的系统,进一步包括:
第四滤波单元(54),被配置为至少在所述初始子间隔(Tl)处,使用通过对与所述当前更新间隔(T)关联的所述参数、和与所述先前更新间隔关联的参数进行内插而获得的参数,对所述信息输入信号(x,11)进行滤波。
13.如权利要求12所述的系统,进一步包括:
选择器(55),被配置为检查(S74)用于所述当前更新间隔(T)的各参数之间的距离是否在第二阈值内,以使用所述第四滤波单元(54),至少在所述初始子间隔(Tl)中,对所述信息输入信号(x,11)进行滤波(S75)。
14.如权利要求13所述的系统,被进一步配置为基于与所述信号关联的值,主动地设置所述第二阈值。
15.如权利要求14所述的系统,被进一步配置为:
将所述第二阈值设置为音调滞后距离阈值,所述音调滞后距离阈值等于所述当前更新间隔(T)处的所述音调滞后的整数部分与所述先前更新间隔处的所述音调滞后的所述整数部分之间的最小值,
以在所述当前更新间隔处的所述音调滞后的所述整数部分与所述先前更新间隔处的所述音调滞后的所述整数部分之间的距离小于所述音调滞后距离阈值时,使用所述第四滤波单元(54);和/或
以在所述当前更新间隔处的所述音调滞后的所述整数部分与所述先前更新间隔处的所述音调滞后的所述整数部分之间的距离大于所述音调滞后距离阈值时,使用所述第一滤波单元和第二滤波单元(12,14,51,52)。
16.如权利要求14或15所述的系统,被进一步配置为:
使用与所述当前更新间隔处和所述居前间隔处的所述信号的增益关联的条件,
以在所述当前更新间隔处和所述居前间隔处的所述信号的增益都不同于零时,使用所述第四滤波单元(54),和/或
以在所述当前更新间隔处和所述居前间隔处的所述信号的增益中的至少一个为零时,使用所述第一滤波单元和第二滤波单元(12,14,51,52)。
17.如前述权利要求中任一项所述的系统,其中所述信息输入信号(x,11)是音频信号。
19.如前述权利要求中任一项所述的系统,其中所述第一滤波单元(12)被配置为按照下面的形式提供所述第一滤波输出信号(13):
20.如前述权利要求中任一项所述的系统,其中所述初始子间隔的时间长度介于所述当前更新间隔的时间长度的5%与40%之间。
21.如权利要求3与前述权利要求中任一项的可能组合所述的系统,被进一步配置为检查所述当前第k帧的所述增益gk和所述先前第(k-1)帧的所述增益gk-1,以使得:
-如果gk-1=0且gk=0,则没有第一滤波、第二滤波也没有第三滤波;和/或
-如果gk-1=0且gk≠0,则
●禁用所述第一滤波;
●至少在所述初始子间隔(Tl)中有第二滤波;
●在所述后续子间隔(Ts)中有第三滤波;和/或
-如果gk-1≠0且gk=0,则
●至少在所述初始子间隔(Tl)中有第一滤波;
●禁用所述第二滤波;
●禁用所述第三滤波;和/或
-如果gk-1≠0且gk≠0,则检查所述音调滞后的所述整数部分和小数部分的差异,以使得:
●如果所述音调滞后的所述整数部分和小数部分在所述当前第k帧中与在所述先前第(k-1)帧中是相同的,则:
■没有第一滤波也没有第二滤波;
■沿着所述当前更新间隔的100%有第三滤波;
●否则,若所述音调滞后的所述整数部分中或所述小数部分存在差异:
■至少在所述初始子间隔(Tl)中有第一滤波;
■至少在所述初始子间隔(Tl)中有按照52的第二滤波;
■在后续子间隔(Ts)中有按照53的第三滤波。
22.如前述权利要求中任一项所述的系统,包括编码器侧(80)和解码器侧(90),其中所述第一滤波单元、第二滤波单元、第三滤波单元、和/或第四滤波单元中的至少一个位于所述解码器侧。
23.如前述权利要求中任一项所述的系统,包括编码器侧(80)和解码器侧(90),其中所述第一滤波单元、第二滤波单元、第三滤波单元、和/或第四滤波单元中的至少一个位于所述编码器侧。
24.如前述权利要求中任一项所述的系统,其中所述编码器侧包括:
参数估计器(89),被配置为估计用于所述第一滤波单元、第二滤波单元、第三滤波单元、和/或第四滤波单元(51-54)中的至少一个的参数。
25.如前述权利要求中任一项所述的系统,进一步包括转换器(96),用于将所述信息信号的第一表示转换成所述信息信号的第二表示。
26.如前述权利要求中任一项所述的系统,其中所述至少子间隔是所述更新间隔。
27.如前述权利要求中任一项所述的系统,被进一步配置为:
确定所述第一滤波单元和/或第二滤波单元(12,14)是否将作为恒等滤波器操作;以及
在确定的情况下,将所述第一滤波器和/或第二滤波器(12,14)旁路。
28.如前述权利要求中任一项所述的系统,其中所述第一滤波单元(12)被配置为逐渐地、和/或通过衰减、和/或单调地或严格单调地将沿着至少所述初始子间隔的所述参数从较高滤波状态改变为较低滤波状态。
29.如前述权利要求中任一项所述的系统,其中所述第二滤波单元(14)被配置为逐渐地、和/或通过衰减、和/或单调地或严格单调地将沿着至少所述初始子间隔的所述参数从较低滤波状态改变为较高滤波状态。
30.一种用于根据对应于不同更新间隔的参数对包括所述不同更新间隔的信息输入信号(x,11,11a)进行滤波以获得经滤波输出信号(y)的方法(60,70),所述方法包括:
根据与居前更新间隔(T)关联的参数,至少在当前更新间隔(T)的初始子间隔(Tl)处,进行第一滤波(61),其中沿着至少所述初始子间隔(Tl)的参数从较高滤波状态改变为较低滤波状态;以及
根据与所述当前更新间隔(T)关联的参数,至少在所述初始子间隔(Tl)处,进行第二滤波(62),其中沿着所述初始子间隔(Tl)的参数从较低滤波状态改变为较高滤波状态,
其中所述第一滤波是对所述信息输入信号(x)进行的,并且所述第二滤波是对通过所述第一滤波获得的信号进行的。
31.一种存储指令的非暂时性存储单元(122),所述指令在由处理器(121)执行时,致使所述处理器(121)执行如权利要求30所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201105.8 | 2017-11-10 | ||
EP17201105.8A EP3483884A1 (en) | 2017-11-10 | 2017-11-10 | Signal filtering |
PCT/EP2018/080837 WO2019092220A1 (en) | 2017-11-10 | 2018-11-09 | Signal filtering |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111587457A true CN111587457A (zh) | 2020-08-25 |
CN111587457B CN111587457B (zh) | 2023-05-12 |
Family
ID=60301912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880086266.9A Active CN111587457B (zh) | 2017-11-10 | 2018-11-09 | 信号滤波 |
Country Status (19)
Country | Link |
---|---|
US (1) | US11545167B2 (zh) |
EP (2) | EP3483884A1 (zh) |
JP (1) | JP7179060B2 (zh) |
KR (1) | KR102492559B1 (zh) |
CN (1) | CN111587457B (zh) |
AR (1) | AR113496A1 (zh) |
AU (1) | AU2018363802B2 (zh) |
BR (1) | BR112020009326A2 (zh) |
CA (1) | CA3082291C (zh) |
ES (1) | ES2939975T3 (zh) |
FI (1) | FI3707715T3 (zh) |
MX (1) | MX2020004773A (zh) |
PL (1) | PL3707715T3 (zh) |
PT (1) | PT3707715T (zh) |
RU (1) | RU2738323C1 (zh) |
SG (1) | SG11202004173PA (zh) |
TW (1) | TWI705434B (zh) |
WO (1) | WO2019092220A1 (zh) |
ZA (1) | ZA202002569B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US11165414B2 (en) | 2019-12-20 | 2021-11-02 | Infineon Technologies Ag | Reconfigurable filter network with shortened settling time |
WO2023113490A1 (ko) * | 2021-12-15 | 2023-06-22 | 한국전자통신연구원 | 복소수 데이터를 이용한 오디오 처리 방법 및 그를 수행하는 장치 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0801790A1 (fr) * | 1995-01-06 | 1997-10-22 | Matra Communication | Procede de codage de parole a analyse par synthese |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
WO2009089700A1 (fr) * | 2008-01-18 | 2009-07-23 | Huawei Technologies Co., Ltd. | Procédé et appareil de mise à jour de l'état d'un filtre de synthèse |
CN101501759A (zh) * | 2006-06-30 | 2009-08-05 | 弗劳恩霍夫应用研究促进协会 | 具有动态可变规整特性的音频编码器、音频解码器和音频处理器 |
US20100010810A1 (en) * | 2006-12-13 | 2010-01-14 | Panasonic Corporation | Post filter and filtering method |
US20140052439A1 (en) * | 2012-08-19 | 2014-02-20 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
US20170103774A1 (en) * | 2015-10-12 | 2017-04-13 | Microsoft Technology Licensing, Llc | Audio Signal Processing |
CN106575509A (zh) * | 2014-07-28 | 2017-04-19 | 弗劳恩霍夫应用研究促进协会 | 谐波滤波器工具的谐度依赖控制 |
Family Cites Families (181)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
JP3426871B2 (ja) * | 1995-09-18 | 2003-07-14 | 株式会社東芝 | 音声信号のスペクトル形状調整方法および装置 |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
WO1999016050A1 (en) | 1997-09-23 | 1999-04-01 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
JP3344962B2 (ja) | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7302396B1 (en) * | 1999-04-27 | 2007-11-27 | Realnetworks, Inc. | System and method for cross-fading between audio streams |
EP1139665A1 (en) | 2000-03-29 | 2001-10-04 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for changing the output delay of audio or video data encoding |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
US20040158462A1 (en) | 2001-06-11 | 2004-08-12 | Rutledge Glen J. | Pitch candidate selection method for multi-channel pitch detectors |
US7512535B2 (en) | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
WO2004072956A1 (en) | 2003-02-11 | 2004-08-26 | Koninklijke Philips Electronics N.V. | Audio coding |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
US20040162866A1 (en) | 2003-02-19 | 2004-08-19 | Malvar Henrique S. | System and method for producing fast modulated complex lapped transforms |
KR101063562B1 (ko) | 2003-06-17 | 2011-09-07 | 파나소닉 주식회사 | 수신 장치, 전송 장치 및 송신 시스템 |
KR101058062B1 (ko) | 2003-06-30 | 2011-08-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 잡음 부가에 의한 디코딩된 오디오의 품질 개선 |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
KR100550003B1 (ko) | 2003-07-11 | 2006-02-08 | 학교법인연세대학교 | 상호부호화기에서 개회로 피치 추정 방법 및 그 장치 |
AU2003302486A1 (en) | 2003-09-15 | 2005-04-06 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
KR20050087956A (ko) | 2004-02-27 | 2005-09-01 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
SG10202004688SA (en) | 2004-03-01 | 2020-06-29 | Dolby Laboratories Licensing Corp | Multichannel Audio Coding |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
CN1930607B (zh) | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | 差错隐藏装置以及差错隐藏方法 |
US7392195B2 (en) | 2004-03-25 | 2008-06-24 | Dts, Inc. | Lossless multi-channel audio codec |
NZ562183A (en) | 2005-04-01 | 2010-09-30 | Qualcomm Inc | Systems, methods, and apparatus for highband excitation generation |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
KR20070037945A (ko) | 2005-10-04 | 2007-04-09 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US20070118361A1 (en) | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
US9123350B2 (en) | 2005-12-14 | 2015-09-01 | Panasonic Intellectual Property Management Co., Ltd. | Method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
US8345890B2 (en) | 2006-01-05 | 2013-01-01 | Audience, Inc. | System and method for utilizing inter-microphone level differences for speech enhancement |
CN101395661B (zh) | 2006-03-07 | 2013-02-06 | 艾利森电话股份有限公司 | 音频编码和解码的方法和设备 |
US8150065B2 (en) * | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
EP2030199B1 (en) | 2006-05-30 | 2009-10-28 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
JP5096468B2 (ja) | 2006-08-15 | 2012-12-12 | ドルビー ラボラトリーズ ライセンシング コーポレイション | サイド情報なしの時間的ノイズエンベロープの自由な整形 |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
US7752038B2 (en) | 2006-10-13 | 2010-07-06 | Nokia Corporation | Pitch lag estimation |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
WO2008151408A1 (en) | 2007-06-14 | 2008-12-18 | Voiceage Corporation | Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US10795949B2 (en) | 2007-07-26 | 2020-10-06 | Hamid Hatami-Hanza | Methods and systems for investigation of compositions of ontological subjects and intelligent systems therefrom |
JP4981174B2 (ja) | 2007-08-24 | 2012-07-18 | フランス・テレコム | 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化 |
EP2186087B1 (en) | 2007-08-27 | 2011-11-30 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved transform coding of speech and audio signals |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
RU2449386C2 (ru) | 2007-11-02 | 2012-04-27 | Хуавэй Текнолоджиз Ко., Лтд. | Способ и устройство для аудиодекодирования |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
CN101933086B (zh) | 2007-12-31 | 2013-06-19 | Lg电子株式会社 | 处理音频信号的方法和设备 |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
CN102057424B (zh) | 2008-06-13 | 2015-06-17 | 诺基亚公司 | 用于经编码的音频数据的错误隐藏的方法和装置 |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
JP5369180B2 (ja) | 2008-07-11 | 2013-12-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
BRPI0914056B1 (pt) * | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
CN102334160B (zh) | 2009-01-28 | 2014-05-07 | 弗劳恩霍夫应用研究促进协会 | 音频编码器,音频解码器,编码和解码音频信号的方法 |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US20100223061A1 (en) | 2009-02-27 | 2010-09-02 | Nokia Corporation | Method and Apparatus for Audio Coding |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
CN102648494B (zh) | 2009-10-08 | 2014-07-02 | 弗兰霍菲尔运输应用研究公司 | 多模式音频信号解码器、多模式音频信号编码器、使用基于线性预测编码的噪声塑形的方法 |
EP3693964B1 (en) | 2009-10-15 | 2021-07-28 | VoiceAge Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
JP5243661B2 (ja) | 2009-10-20 | 2013-07-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム |
EP2491554B1 (en) | 2009-10-20 | 2014-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
CN102648493B (zh) | 2009-11-24 | 2016-01-20 | Lg电子株式会社 | 音频信号处理方法和设备 |
JP5773502B2 (ja) | 2010-01-12 | 2015-09-02 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化するための方法、オーディオ情報を復号するための方法、および上位状態値と間隔境界との両方を示すハッシュテーブルを用いたコンピュータプログラム |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
EP3079153B1 (en) | 2010-07-02 | 2018-08-01 | Dolby International AB | Audio decoding with selective post filtering |
PL2596494T3 (pl) | 2010-07-20 | 2021-01-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio, sposób dekodowania audio i program komputerowy |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
PL2676266T3 (pl) | 2011-02-14 | 2015-08-31 | Fraunhofer Ges Forschung | Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
TWI480860B (zh) | 2011-03-18 | 2015-04-11 | Fraunhofer Ges Forschung | 音訊編碼中之訊框元件長度傳輸技術 |
KR101863687B1 (ko) | 2011-04-21 | 2018-06-01 | 삼성전자주식회사 | 선형예측계수 양자화장치, 사운드 부호화장치, 선형예측계수 역양자화장치, 사운드 복호화장치와 전자기기 |
US8891775B2 (en) | 2011-05-09 | 2014-11-18 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
US9363339B2 (en) | 2011-07-12 | 2016-06-07 | Hughes Network Systems, Llc | Staged data compression, including block level long range compression, for data streams in a communications system |
JP5901790B2 (ja) | 2011-12-12 | 2016-04-13 | ドルビー ラボラトリーズ ライセンシング コーポレイション | メディアデータにおける低計算量反復検出 |
MX350686B (es) | 2012-01-20 | 2017-09-13 | Fraunhofer Ges Forschung | Aparato y método para la codificación y decodificación de audio que emplea sustitución sinusoidal. |
JP5947971B2 (ja) | 2012-04-05 | 2016-07-06 | 華為技術有限公司Huawei Technologies Co.,Ltd. | マルチチャネルオーディオ信号の符号化パラメータを決定する方法及びマルチチャネルオーディオエンコーダ |
US20130282372A1 (en) * | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
WO2013183977A1 (ko) * | 2012-06-08 | 2013-12-12 | 삼성전자 주식회사 | 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치 |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
CN107481725B (zh) * | 2012-09-24 | 2020-11-06 | 三星电子株式会社 | 时域帧错误隐藏设备和时域帧错误隐藏方法 |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9318116B2 (en) | 2012-12-14 | 2016-04-19 | Disney Enterprises, Inc. | Acoustic data transmission based on groups of audio receivers |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
KR20150108937A (ko) | 2013-02-05 | 2015-09-30 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치 |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
WO2014202786A1 (en) * | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an adaptive spectral shape of comfort noise |
EP3011555B1 (en) | 2013-06-21 | 2018-03-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Reconstruction of a speech frame |
EP2830054A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
RU2638734C2 (ru) | 2013-10-18 | 2017-12-15 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Кодирование спектральных коэффициентов спектра аудиосигнала |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
ES2746034T3 (es) | 2013-10-31 | 2020-03-04 | Fraunhofer Ges Forschung | Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de error sobre la base de una señal de excitación de dominio de tiempo |
CA2928974C (en) | 2013-10-31 | 2020-06-02 | Jeremie Lecomte | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
WO2015063227A1 (en) | 2013-10-31 | 2015-05-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
ES2716652T3 (es) | 2013-11-13 | 2019-06-13 | Fraunhofer Ges Forschung | Codificador para la codificación de una señal de audio, sistema de transmisión de audio y procedimiento para la determinación de valores de corrección |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
LT3511935T (lt) | 2014-04-17 | 2021-01-11 | Voiceage Evs Llc | Būdas, įrenginys ir kompiuteriu nuskaitoma neperkeliama atmintis garso signalų tiesinės prognozės kodavimui ir dekodavimui po perėjimo tarp kadrų su skirtingais mėginių ėmimo greičiais |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (zh) | 2014-05-15 | 2018-06-09 | ||
EP2963646A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP3000110B1 (en) | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
US10242679B2 (en) | 2014-07-28 | 2019-03-26 | Samsung Electronics Co., Ltd. | Method and apparatus for packet loss concealment, and decoding method and apparatus employing same |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10296959B1 (en) | 2015-03-30 | 2019-05-21 | Audible, Inc. | Automated recommendations of audio narrations |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) * | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) * | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
WO2017039422A2 (ko) | 2015-09-04 | 2017-03-09 | 삼성전자 주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107945809B (zh) | 2017-05-02 | 2021-11-09 | 大连民族大学 | 一种复调音乐多音高估计方法 |
EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
-
2017
- 2017-11-10 EP EP17201105.8A patent/EP3483884A1/en not_active Withdrawn
-
2018
- 2018-11-09 PT PT187966924T patent/PT3707715T/pt unknown
- 2018-11-09 FI FIEP18796692.4T patent/FI3707715T3/fi active
- 2018-11-09 PL PL18796692.4T patent/PL3707715T3/pl unknown
- 2018-11-09 SG SG11202004173PA patent/SG11202004173PA/en unknown
- 2018-11-09 ES ES18796692T patent/ES2939975T3/es active Active
- 2018-11-09 CA CA3082291A patent/CA3082291C/en active Active
- 2018-11-09 MX MX2020004773A patent/MX2020004773A/es unknown
- 2018-11-09 RU RU2020119053A patent/RU2738323C1/ru active
- 2018-11-09 BR BR112020009326-2A patent/BR112020009326A2/pt unknown
- 2018-11-09 TW TW107139853A patent/TWI705434B/zh active
- 2018-11-09 EP EP18796692.4A patent/EP3707715B1/en active Active
- 2018-11-09 JP JP2020526154A patent/JP7179060B2/ja active Active
- 2018-11-09 KR KR1020207015681A patent/KR102492559B1/ko active IP Right Grant
- 2018-11-09 AU AU2018363802A patent/AU2018363802B2/en active Active
- 2018-11-09 WO PCT/EP2018/080837 patent/WO2019092220A1/en unknown
- 2018-11-09 CN CN201880086266.9A patent/CN111587457B/zh active Active
- 2018-11-12 AR ARP180103300A patent/AR113496A1/es active IP Right Grant
-
2020
- 2020-05-07 US US16/869,143 patent/US11545167B2/en active Active
- 2020-05-08 ZA ZA2020/02569A patent/ZA202002569B/en unknown
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0801790A1 (fr) * | 1995-01-06 | 1997-10-22 | Matra Communication | Procede de codage de parole a analyse par synthese |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
CN101501759A (zh) * | 2006-06-30 | 2009-08-05 | 弗劳恩霍夫应用研究促进协会 | 具有动态可变规整特性的音频编码器、音频解码器和音频处理器 |
US20100010810A1 (en) * | 2006-12-13 | 2010-01-14 | Panasonic Corporation | Post filter and filtering method |
WO2009089700A1 (fr) * | 2008-01-18 | 2009-07-23 | Huawei Technologies Co., Ltd. | Procédé et appareil de mise à jour de l'état d'un filtre de synthèse |
US20140052439A1 (en) * | 2012-08-19 | 2014-02-20 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
CN106575509A (zh) * | 2014-07-28 | 2017-04-19 | 弗劳恩霍夫应用研究促进协会 | 谐波滤波器工具的谐度依赖控制 |
CN106663444A (zh) * | 2014-07-28 | 2017-05-10 | 弗劳恩霍夫应用研究促进协会 | 用于使用谐波后置滤波器来处理音频信号的装置及方法 |
US20170103774A1 (en) * | 2015-10-12 | 2017-04-13 | Microsoft Technology Licensing, Llc | Audio Signal Processing |
Non-Patent Citations (2)
Title |
---|
LEE BARFORD: "Filtering of Randomly Sampled Time-Stamped Measurements", 《2006 IEEE INSTRUMENTATION AND MEASUREMENT TECHNOLOGY CONFERENCE PROCEEDINGS》 * |
王银峰: "基于普通话时频特性的语音活动检测及增强算法研究", 《中国优秀硕士学位论文全文数据库》 * |
Also Published As
Publication number | Publication date |
---|---|
MX2020004773A (es) | 2020-08-13 |
PT3707715T (pt) | 2023-03-06 |
AU2018363802B2 (en) | 2020-12-10 |
US11545167B2 (en) | 2023-01-03 |
TW201923757A (zh) | 2019-06-16 |
EP3483884A1 (en) | 2019-05-15 |
US20200335118A1 (en) | 2020-10-22 |
FI3707715T3 (fi) | 2023-03-23 |
JP7179060B2 (ja) | 2022-11-28 |
BR112020009326A2 (pt) | 2020-10-27 |
ES2939975T3 (es) | 2023-04-28 |
EP3707715B1 (en) | 2023-01-04 |
RU2738323C1 (ru) | 2020-12-11 |
TWI705434B (zh) | 2020-09-21 |
PL3707715T3 (pl) | 2023-05-02 |
AU2018363802A1 (en) | 2020-05-21 |
JP2021502609A (ja) | 2021-01-28 |
KR20200077579A (ko) | 2020-06-30 |
CN111587457B (zh) | 2023-05-12 |
KR102492559B1 (ko) | 2023-01-30 |
AR113496A1 (es) | 2020-05-13 |
CA3082291C (en) | 2022-11-29 |
EP3707715A1 (en) | 2020-09-16 |
ZA202002569B (en) | 2021-08-25 |
WO2019092220A1 (en) | 2019-05-16 |
SG11202004173PA (en) | 2020-06-29 |
CA3082291A1 (en) | 2019-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3175454B1 (en) | Apparatus and method for processing an audio signal using a harmonic post-filter | |
US10083706B2 (en) | Harmonicity-dependent controlling of a harmonic filter tool | |
KR101853352B1 (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
US11545167B2 (en) | Signal filtering | |
JP2016535286A (ja) | ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法 | |
US11380341B2 (en) | Selecting pitch lag | |
WO2004097795A2 (en) | Adaptive voice enhancement for low bit rate audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |