CN103477387A - 使用频谱域噪声整形的基于线性预测的编码方案 - Google Patents
使用频谱域噪声整形的基于线性预测的编码方案 Download PDFInfo
- Publication number
- CN103477387A CN103477387A CN2012800182653A CN201280018265A CN103477387A CN 103477387 A CN103477387 A CN 103477387A CN 2012800182653 A CN2012800182653 A CN 2012800182653A CN 201280018265 A CN201280018265 A CN 201280018265A CN 103477387 A CN103477387 A CN 103477387A
- Authority
- CN
- China
- Prior art keywords
- frequency spectrum
- spectrum
- audio coder
- predictor coefficient
- current frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007493 shaping process Methods 0.000 title claims abstract description 51
- 230000003595 spectral effect Effects 0.000 title claims abstract description 49
- 238000001228 spectrum Methods 0.000 claims abstract description 193
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000001914 filtration Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 26
- 238000011002 quantification Methods 0.000 claims description 7
- 230000001052 transient effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
- 230000005236 sound signal Effects 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 17
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000012074 hearing test Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种基于线性预测并使用频谱域噪声整形的编码概念,通过利用将音频输入信号分解成包括频谱序列的谱图的频谱分解,来用于线性预测系数计算以及基于线性预测系数的频谱域整形两者,得以在例如就比率/失真比而言的相近编码效率下具有较低的复杂性。即使导致混叠并需要时间混叠消除的重叠变换,诸如临界取样的重叠变换(例如MDCT)被用于频谱分解,编码效率也可保持不变。
Description
技术领域
本发明涉及使用诸如从USAC所知的TCX模式这样的频域噪声整形的基于线性预测的音频编译码器。
背景技术
作为相对较新的音频编译码器,USAC最近已经完成。USAC是一种支持在多个编码模式间切换的编译码器,这些编码模式诸如AAC式编码模式、使用线性预测编码的时域编码模式,即ACELP、以及形成中间编码模式的变换编码激励编码,频谱域整形依据该中间编码模式利用经由数据流所发送的线性预测系数被控制。在WO2011147950中,提出通过排除AAC式编码模式的可用性并且将编码模式仅局限于ACELP及TCX而使USAC编码方案更适于低延迟应用。而且,还建议减少帧长度。
然而,最好是能够在减少使用频谱域整形的基于线性预测的编码方案的复杂度的同时,实现近似的编码效率,例如就比率/失真比而言。
发明内容
因此,本发明的目的是提供这样一种使用频谱域整形的基于线性预测的编码方案,允许在类似或甚至增加的编码效率下降低复杂性。
该目的通过审查中的独立权利要求中的主题的来实现。
本发明的基本概念是如果将音频输入信号分解成包括频谱序列的谱图的频谱分解被用于线性预测系数计算以及基于线性预测系数的频谱域整形的输入这两者,则基于线性预测且使用频谱域噪声整形的编码概念在类似编码效率下,例如就比率/失真比而言,得以具有较低的复杂性。
在这一方面,已发现,即使导致混叠并且需要时域混叠消除的、诸如临界取样的重叠(lapped)变换(如MDCT)这样的重叠变换用于频谱分解,编码效率也保持不变。
本发明的方面中有利实现方式是从属权利要求的主题。
附图说明
具体地,本申请的较佳实施方式相关于附图而被描述,其中:
图1示出根据比较例或实施方式的音频编码器的方块图;
图2示出根据本申请的实施方式的音频编码器;
图3示出适合于图2的音频编码器的可实行的音频译码器的方块图;以及
图4示出根据本申请的实施方式的可选音频编码器的方块图。
具体实施方式
为了便于理解在下文中进一步描述的本发明的实施方式的主要方面及优势,首先参照图1,其示出使用频谱域噪声整形的基于线性预测的音频编码器。
具体地,图1的音频编码器包括频谱分解器10,用以将输入音频信号12频谱分解成由频谱序列组成的谱图,如图1中的14所指示。如图1中所示,频谱分解器10可使用MDCT以将输入音频信号10由时域变换到频谱域。具体地,窗口化器16在频谱分解器10的MDCT模块18之前,以窗口化输入音频信号12的互相重叠部分,其窗口化部分在MDCT模块18中单独接受各自的变换以获得谱图14的频谱序列的频谱。然而,频谱分解器10可选地使用任何其他导致混叠的重叠变换,诸如任何其他临界取样的重叠变换。
而且,图1的音频编码器包括线性预测分析器20,用以分析输入音频信号12以由此导出线性预测系数。图1的音频编码器的频谱域整形器22被配置为基于由线性预测分析器20所提供的线性预测系数来对谱图14的频谱序列的当前频谱频谱整形。具体地,频谱域整形器22被配置成通过将来自分析器20的线性预测系数变换成频谱加权值并应用该加权值作为除数以频谱形成或整形该当前频谱,来根据对应于线性预测分析滤波器传送函数的传送函数对进入频谱域整形器22的当前频谱进行频谱整形。整形后的频谱在图1的音频编码器的量化器24中量化。由于频谱域整形器22中的整形,在译码器端对量化频谱进行去整形时所产生的量化噪声被移位而被隐藏,即编码尽可能的是感知透明(perceptually transparent)的。
仅为了完整起见,应指出的是,时间噪声整形模块26可以选择性地使从频谱分解器10转发至频谱域整形器22的频谱接受时间噪声整形,并且低频加重(emphasis)模块28可以在量化24之前适应性地滤波由频谱域整形器22所输出的每个整形后频谱。
量化并频谱整形后的频谱连同关于频谱整形中所使用的线性预测系数的信息被插入到数据流30中,使得在译码端,去整形及去量化可被执行。
除TNS模块26的外,图1中所示的音频编译码器的绝大部分在例如新音频编译码器USAC中、特别是在其TCX模式内被实现及描述。因此,详情请参照示范性的USAC标准,例如[1]。
然而,下文中更着重于描述线性预测分析器20。如图1中所示,线性预测分析器20直接对输入音频信号12进行操作。预加重模块32诸如例如通过FIR滤波而对输入音频信号12预滤波,之后,自相关通过级联(concatenation)窗口化器34、自相关器36及滞后(lag)窗口化器38而被连续导出。窗口化器34从预滤波后的输入音频信号中形成窗口化部分,该窗口化部分可能在时间上互相重叠。自相关器36计算由窗口化器34所输出的每一个窗口化部分的自相关,而滞后窗口化器38被选择性地提供,以对自相关应用滞后窗口函数,以使自相关更加适于下述线性预测参数估计算法。具体地,线性预测参数估计器40接收滞后窗口输出,并对窗口化后的自相关执行例如维纳-列文逊-杜宾或其他适合的算法以导出每个自相关的线性预测系数。在频谱域整形器22内,所产生的线性预测系数通过模块链42、44、46及48传递。模块42负责将关于数据流30内的线性预测系数的信息传送到译码端。如图1中所示,线性预测系数数据流插入器42可被配置为以线谱对或在线谱频域执行线性预测系数的量化,该线性预测系数是由线性预测分析器20所决定的,同时将量化的系数编码到数据流30中且再次将量化的预测值重新变换成LPC系数。可选地,某种内插可被使用,以降低有关线性预测系数的信息在数据流30内输送的更新率。因此,负责使关于进入频谱域整形器22的当前频谱的线性预测系数接受某种加权处理的后续模块44可以访问线性预测系数,因为这些线性预测系数也可在译码端获得,即访问量化的线性预测系数。其后的模块46将加权的线性预测系数变换成频谱权重,该频谱权重接着由频域噪声整形器模块48来应用,以对接收的当前频谱进行频谱整形。
由上述讨论可清楚看出,由分析器20所执行的线性预测分析导致开支(overhead),该开支完全地增加到方块10及22中所执行的频谱分解及频谱域整形上,因此,计算开支是相当大的。
图2示出依据本申请的一个实施方式的音频编码器,该音频编码器提供相当的编码效率,但是编码复杂性降低。
简而言之,在代表本申请的一个实施方式的图2的音频编码器中,图1的线性预测分析器由被串联连接在频谱分解器10与频谱域整形器22之间的级联的自相关计算器50和线性预测系数计算器52所取代。由图1修改成图2的动机及揭示模块50及52的详细功能的数学解释将在下文中提供。然而,显而易见的是,鉴于自相关计算器50涉及的计算与自相关及自相关前的窗口化的一系列计算相比更不复杂,图2的音频编码器的计算开支较图1的音频编码器降低。
在描述图2的实施方式的详细的数学架构之前,图2的音频编码器的结构被简短地描述。具体地,使用参考符号60指示的图2的音频编码器包括用以接收输入音频信号12的输入62及用以输出数据流30的输出64,音频编码器将输入音频信号12编码到数据流30中。频谱分解器10、时间噪声整形器26、频谱域整形器22、低频加重器28及量化器24在输入62与输出64之间以提到的顺序串联连接。时间噪声整形器26及低频加重器28是可选的模块,并且依据可选实施方式可被省略。若存在的话,时间噪声整形器26可被配置成可适应性地启动,即例如,根据输入音频信号的特性,通过时间噪声整形器26所进行的时间噪声整形被启动或停用,决定的结果被经由数据流30被传送至译码端,这将在下文中更加详细地说明。
如图1中所示,图2的频谱域整形器22如同已相关于图1所描述地那样被内部构建。然而,图2的内部结构并不应被理解为关键点且频谱域整形器22的内部结构也可能是与图2中所示的确切结构不同。
图2的线性预测系数计算器52包括串联连接在自相关计算器50与频谱域整形器22之间的滞后窗口化器38及线性预测系数估计器40。应指出的是,滞后窗口化器,举例而言,也是可选的特征。若存在的话,由滞后窗口化器38对由自相关计算器50所提供的个别自相关所应用的窗口可以是高斯或二项分布形状窗口。有关线性预测系数估计器40,应指出的是,其不一定使用维纳-列文逊-杜宾算法。而是可使用不同的算法以计算线性预测系数。
自相关计算器50内部包括一个序列:功率谱计算器54,后接标度扭曲器/频谱加权器56,其后又接反变换器58。模块54至58序列的细节及重要性将在下文中更加详细地加以描述。
为了理解为什么分解器10的频谱分解可共同用于整形器22内的频谱域噪声整形以及线性预测系数计算,应该考虑维纳-辛钦定理,该定理表明自相关可使用DFT来算出:
其中
k=0,...,N-1 m=0,...,N-1
因此,Rm是DFT是Xk时,信号部分xn的自相关的自相关系数。
因此,若频谱分解器10将使用DFT以实施重叠变换并产生输入音频信号12的频谱序列,则自相关计算器50将能够仅通过遵照上文概述的维纳-辛钦定理在其输出执行较快的自相关计算。
若需要自相关的所有滞后m的值,则频谱分解器10的DFT可使用FFT而被执行,且反FFT可在自相关计算器50内使用,以使用刚才提到的公式由此导出自相关。然而,当仅需要M<<N个滞后时,使用FFT来频谱分解将更迅速,并且直接应用反DFT以获得相关的自相关系数。
当上文提到的DFT被ODFT,即奇频DFT所取代时,也是这样,其中,时间序列x的一般化DFT被定义为:
对ODFT(奇频DFT)设定
然而,若MDCT而非DFT或FFT被用在图2的实施方式中,则情况不同。MDCT包括IV型离散余弦变换且仅揭示实值频谱。也就是说,相位信息因此变换而失去。MDCT可被写作:
其中xn,n=0...2N-1,定义由窗口化器16所输出的输入音频信号12的当前窗口化部分,Xk相应地是对于此窗口化部分所产生的频谱的第k个频谱系数。
功率谱计算器54依据下式通过求每个变换系数Xk的平方由MDCT的输出来计算功率谱:
Sk=|Xk|2k=0,...,N-1
由Xk所定义的MDCT频谱与ODFT谱Xk ODFT之间的关系可被写成:
这意味着自相关计算器50使用MDCT而非ODFT作为输入来执行MDCT的自相关程序,等效于使用以下的频谱加权由ODFT所获得的自相关:
然而,所决定的自相关的失真对译码端是透明的,因为整形器22内的频谱域整形在与频谱分解器10中完全相同的频谱域、即MDCT中进行。换而言之,由于通过图2的频域噪声整形器48的频域噪声整形被应用在MDCT域中,这实际上意味着当MDCT被ODFT所取代时,频谱加权fk mdct与MDCT的调变互相抵消且产生如图1中所示的传统LPC的相似结果。
因此,在自相关计算器50中,反变换器58执行反ODFT且对称的实数输入的反ODFT等于DCT II型:
因此,由于由反ODFT在反变换器58的输出所决定的自相关仅需要较少的计算步骤,诸如上文所概述的求平方,及功率谱计算器54与反变换器58中的反ODFT,而得到相对较低的计算成本,这允许图2的自相关计算器50中的基于MDCT的LPC的快速计算。
关于标度扭曲器/频谱加权器56的细节还未被描述。具体地,此模块是可选的且可被省略或被频域抽取滤波器(decimator)所取代。关于由模块56所执行的可能的测量的细节在下文中描述。然而,在此之前,关于图2中所示的某些其他组件的某些细节被概述。关于滞后窗口化器38,例如,应指出的是,同样可执行白噪声补偿以改良由估计器40所执行的线性预测系数估计的调节。模块44中所执行的LPC加权是可选的,但是,若存在的话,其可被执行以实现实际的带宽扩展。也就是说,LPC的极点以根据下式的常数因子移向原点,例如,
因此,所执行的LPC加权接近同步屏蔽。常数γ=0.92或0.85到0.95之间(包括两端值)产生良好结果。
关于模块42,应指出的是,可变比特率编码或某些其他熵编码方案可被使用,以将关于线性预测系数的信息编码到数据流30中。如上文所提到者,量化可在LSP/LSF域中执行,但是ISP/ISF域也是可行的。
关于LPC到MDCT模块46,其将LPC变换成频谱加权值,该频谱加权值在MDCT域情况下,在下文中例如在详细说明此变换提到USAC编译码器时称为MDCT增益。简而言之,LPC系数可接受ODFT,以获得MDCT增益,其倒数则可被使用作权重以通过对各自的频谱带应用所产生的权重对模块48中的频谱整形。例如,16个LPC系数被变换成MDCT增益。当然,在译码器端是用使用非倒数形式的MDCT增益加权,而非使用倒数加权,以获得类似LPC合成滤波器的传送函数,以形成上文所提到的量化噪声。因此,总结起来,在模块46中,FDNS48所使用的增益是使用ODFT由线性预测系数而获得的,且在使用MDCT的情况下称作MDCT增益。
为了完整起见,图3示出可用以由数据流30再次重建音频信号的音频译码器的可能的实现方式。图3的译码器包括可选的低频去加重器80,频谱域去整形器82,同为可选的时间噪声去整形器84,及频谱域到时域变换器86,它们被串联连接在数据流30进入音频译码器的数据流输入88与重建音频信号被输出的音频译码器的输出90之间。低频去加重器从数据流30接收量化且频谱整形后的频谱且对其执行滤波,其是图2的低频加重器的传送函数的反函数。然而,如先前所提到者,去加重器80是可选的。
频谱域去整形器82具有与图2的频谱域整形器22结构非常类似的结构。具体地,内部同样包括级联的LPC提取器(extractor)92、与LPC加权器44等同的LPC加权器94,同样与图2的模块46相同的LPC到MDCT变换器96,及频域噪声整形器98,与图2的FDNS48相反地,频域噪声整形器98通过乘法而非除法对接收(去加重)频谱应用MDCT增益,以获得对应于由LPC提取器92从数据流30所提取的线性预测系数的线性预测合成滤波器的传送函数。LPC提取器92可在对应的量化域诸如LSP/LSF或ISP/ISF中执行上文所提到的再变换,以获得被编码至将被重建的音频信号的连续相互重叠部分的数据流30中的个别频谱的线性预测系数。
时域噪声整形器84反转图2的模块26的滤波,且这些模块的可能实现方式在下文中被更加详细地描述。然而,无论如何,图3的TNS模块84都是可选的,且也可如相关于图2的TNS模块26所提到的被省略。
频谱组合器86内部包括反变换器100,例如对接收的去整形后的频谱个别执行IMDCT,后接混叠消除器,诸如重叠相加相加器102,其被配置成正确地暂时寄存由再变换器100输出的重建窗口版本以在其之间运行时间混叠消除,且在输出90输出重建音频信号。
如上文所提到,由于频谱域整形22依据对应于由在数据流30内传送的LPC系数所定义的LPC分析滤波器的传送函数,例如具有频谱白噪声的量化器24中的量化由频谱域去整形器82在译码端以隐藏于屏蔽阈值下的方式被整形。
在译码器中有实施TNS模块26及其逆转的不同可能性,即模块84。时间噪声整形是用以整形由所提到的频谱域整形器频谱形成个别频谱的时间部分内的时间意义上噪声。在瞬态存在于所指涉当前频谱的各别时间部分内的情况下时间噪声整形是特别有用的。依据特定实施方式,时间噪声整形器26被配置成频谱预测器,其被配置成预测性地滤波由频谱分解器10沿频谱维度所输出的当前频谱或频谱序列。也就是说,频谱预测器26也可决定可插入到数据流30中的预测滤波器系数。这由图2中的虚线示出。结果,时间噪声滤波频谱该频谱维度而被平坦化,且由于频谱域与时域之间的关系,时域噪声去整形器84内的反滤波与数据流30内发送的时域噪声整形预测滤波器一致,去整形导致起音(attack)或瞬态发生时刻的噪声隐藏或压缩。所谓的预回音从而被避免。
换句话说,通过在时域噪声整形器26中预测性地滤波当前频谱,时域噪声整形器26获得频谱提醒项目,即被转发至频谱域整形器22的预测性滤波的频谱,其中对应的预测系数被插入到数据流30中。时域噪声去整形器84转而从频谱域去整形器82接收去整形后的频谱且通过依据从数据流所接收,或从数据流30所提取的预测滤波器来反滤波该频谱而沿频谱域逆转时域滤波。换句话说,时域噪声整形器26使用分析预测滤波器,诸如线性预测滤波器,而时域噪声去整形器84使用基于相同预测系数的对应的合成滤波器。
如先前所提到,音频编码器可被配置成根据滤波器预测增益或音频输入信号12的音调或瞬态特性来决定启动或停用在对应于当前频谱的各自的时间部分的时间噪声整形。同样,关于决定的各别信息被插入到数据流30中。
在下文中,自相关计算器50被配置成如图2中所示,由预测性滤波,即频谱的TNS滤波版本而非未滤波频谱来计算自相关的可能性被讨论。存在两种可能性:TNS被应用、或以一种方式,例如基于待编码的输入音频信号12的特性而被音频编码器选择时,TNS滤波频谱即可被使用。因此,图4的音频编码器与图2的音频编码器不同的处在于自相关计算器50的输入被连接至频谱分解器10的输出以及TNS模块26的输出。
如刚才所述,由频谱分解器10所输出的TNS滤波的MDCT频谱可被用作计算器50内的自相关计算的输入或基础。如刚才所述,当TNS被应用,或音频编码器在使用未滤波频谱或TNS滤波频谱之间可决定TNS应用于频谱时,TNS滤波频谱即可被使用。如上所述,可依音频输入信号的特性做决定。但决筞对于译码器可能是透明的,该译码器仅对频域去整形应用LPC系数信息。另一可能性是音频编码器在TNS所应用的频谱的TNS滤波频谱与非滤波频谱之间切换,即根据频谱分解器10所选择的变换长度在这些频谱的两个选项间做决定。
更准确地说,图4中的分解器10可被配置成在频谱分解音频输入信号时在不同的变换长度之间切换,使得由频谱分解器10所输出的频谱将具有不同的频谱分辨率。也就是说,频谱分解器10例如将使用重叠变换,诸如MDCT,以将不同长度的互相重叠时间部分变换成为变换版本或同样具有不同长度的频谱,其中频谱的变换长度对应于对应的重叠时间部分的长度。在此情况下,若当前频谱的频谱分辨率满足预定条件,则自相关计算器50可被配置成由预测性滤波或TNS滤波的当前频谱来计算自相关,或若当前频谱的频谱分辨率不满足预定条件,则由未预测性滤波,即未滤波的当前频谱来计算自相关。预定条件例如可以是当前频谱的频谱分辨率超过某一阈值。例如,将由TNS模块26所输出的TNS滤波后的频谱使用于自相关计算对于较长帧(时间部分),诸如15ms以上帧是有利的,但是对较短帧(时间部分),例如15ms以下者可能不利,因此,对于较长帧,自相关计算器50的输入可以是TNS滤波的MDCT频谱,而对于较短帧,由分解器10所输出的MDCT频谱可被直接使用。
迄今还未描述哪些感知相关修改可在模块56内的功率谱上执行。现在,各种量测被说明,且其可被个别或组合应用于到目前为止所述的所有实施方式及变形例。具体地,频谱加权可通过模块56应用于由功率谱计算器54所输出的功率谱。频谱加权可以是:
其中Sk是上文所提到的功率谱的系数。
频谱加权可被使用作为用于依据心理声学方面来分配量化噪声的机制。对应于图1的意义的预加重的频谱加权可通过下式来定义:
此外,标度扭曲可在模块56内使用。完整的频谱例如可被分割为对应于样本长度为l1的帧或时间部分的频谱的M个频带,及对应于样本长度为l2的帧的时间部分的频谱的2M个频带,其中l2可以是l1的两倍,其中l1可以是64、128或256。具体地,分割可遵照:
频带分割可包括频率依据下式扭曲成巴克频谱(Bark scale)的近似值:
可选择地,频带可均等分配以形成依据下式的线性标度:
对于长度为例如l1的帧的频谱,频带数目可能在20到40之间,且对于长度为l2的帧的频谱,在48到72的间,其中32个频带对应于长度为l1的帧的频谱,且64个频带对应于长度为l2的帧的频谱是较佳的。
由可选的模块56选择性执行的频谱加权及频率扭曲可被视为位分配(量化噪声整形)手段。对应于预加重的线性标度中的频谱加权可使用常数μ=0.9或位于0.8到0.95之间的常数来执行,使得对应的预加重将接近对应于巴克标度扭曲。
模块56内的功率谱的修改可包括功率谱的扩展、模型化同步屏蔽,因此取代LPC加权模块44及94。
若线性标度被使用,且对应于预加重的频谱加权被应用,则在译码端,即在图3的音频译码器的输出所获得的图4的音频编码器的结果,在感知上非常类似于依据图1的实施方式所获得的传统的重建结果。
某些听力测试结果已使用上文所确认的实施方式而被执行。当:
˙基于MDCT的LPC分析中的频谱加权对应于传统的LPC分析中的预加重,
˙同样的窗口化被使用在频谱分解内,诸如低重叠正弦窗口,及
˙线性标度被用在基于MDCT的LPC分析中时,
由这些测试,结果证明图1中所示的传统的LPC分析及基于线性标度MDCT的LPC分析产生感知相等结果。
传统的LPC分析与基于线性标度MDCT的LPC分析之间的可忽略差异可能源于LPC被用于量化噪声整形,以及在48kbit/s下有足够的比特位来充分精确地编码MDCT系数。
而且,结果证明在模块56内通过应用标度扭曲而使用巴克标度或非线性标度产生编码效率或听力测试的结果,依据该结果,对于测试音频片段Applause、Fatboy、RockYou、Waiting、bohemian、fuguepremikres、kraftwerk、lesvoleurs、teardrop,巴克标度胜过线性标度。
巴克标度对hockey及linchpin非常失败。在巴克标度中有问题的另一项目是bibilolo,但是因其呈现具有特定频谱结构的实验音乐而并不包括在测试内。某些听众也表示对bibilolo项目的强烈反感。
然而,图2及图4的音频编码器可以在不同的标度的间切换。也就是说,模块56可依音频信号的特性,诸如瞬态特性或音调对不同的频谱应用不同的标度,或使用不同的频率标度来产生多个量化信号和决定哪一量化信号是感知最佳者的量度。结果证明,标度切换在有瞬态,诸如RockYou及linchpin中的瞬态存在下产生与非切换版本(巴克及线性标度)相较的下的改良结果。
应提到的是,上文概述的实施方式可被用作多模式音频编译码器,诸如支持ACELP的编译码器中的TCX模式,且上文概述的实施方式为类TCX模式。在成帧时,恒定长度,诸如20ms的帧可被使用。以此方式,一种USAC编译码器的低延迟版本可被获得而非常高效率。在TNS上,来自AAC-ELD的TNS可被使用。为了减少旁侧信息(side information)所使用的位的数目,滤波器的数目可被固定成两个,一个在600Hz到4500Hz的间运作,且第二个在4500Hz到核心编码器频谱的末端间运作。滤波器可独立地切换成打开及关闭。滤波器可使用部分相关系数以格点(lattice)被应用并发送。滤波器的最大阶数可被设定成8且每个滤波器系数可使用四个比特位。霍夫曼编码可用以减少用于滤波器的阶数的比特位及用于其系数的比特位的数目。
尽管有些方面已就装置而被描述,但是应清楚的是,这些方面还代表对应方法的说明,其中方块或装置对应于方法步骤或方法步骤的特征。类似地,就方法步骤而描述的方面也代表对应装置的对应方块或项目或特征的说明。某些或全部方法步骤可由硬件装置来执行(或使用),像例如微处理器、可编程计算机或电子电路。在某些实施方式中,某一个或多个最重要的方法步骤可由这样的一个装置来执行。
视某些实施要求而定,本发明实施方式可以硬件或以软件来实施。该实施可使用数字储存媒体来执行,例如其上储存有电子可读取控制信号的软盘、DVD、蓝光光盘、CD、ROM、PROM、EPROM、EEPROM或FLASH内存,该电子可读取控制信号与可编程计算机系统协作(或能够与之协作),使得各别方法得以执行。因此,数字储存媒体可以是计算机可读的。
依据本发明的某些实施方式包括具有电子可读取控制信号的数据载体,该电子可读取控制信号能够与可编程计算机系统协作,使得本文所述诸方法中之一得以执行。
一般而言,本发明实施方式可被实施为具有程序代码的计算机程序产品,当该计算机程序产品在计算机上运行时,该程序代码可操作以执行该方法中的一个。该程序代码可以例如储存在机器可读取载体上。
其他实施方式包括储存在机器可读取载体上,用以执行本文所述多个方法之一的计算机程序。
因此,换句话说,本发明方法的实施方式是具有程序代码的计算机程序,当该计算机程序在计算机上运行时,该程序代码用以执行本文所述诸方法中的一个。
因此,本发明方法的另一实施方式是包括记录在其上用以执行本文所述多个方法中的一个的计算机程序的数据载体(或数字储存媒体,或计算机可读取介质)。该数据载体、该数字储存介质或记录介质典型地是有实体的及/或非瞬变的。
因此,本发明方法的又一实施方式是代表用以执行本文所述多个方法中的一个的计算机程序的数据流或信号序列。该数据流或信号序列例如可以被配置成经由数据通讯连接(例如经由因特网)来传送。
另一实施方式包括处理装置,例如计算机,或可编程逻辑装置,其被配置成或适应于执行本文所述多个方法中的一个。
另一实施方式包括安装有用以执行本文所述多个方法中的一个的计算机程序的计算机。
依据本发明的又一实施方式包括一种装置或一种系统,其被配置成传送(例如,以电子或光学方式)用以执行本文所述诸方法中的一个的计算机程序至接收器。该接收器可以是,例如计算机、行动装置、内存装置等。该装置或系统例如可包括用以将该计算机程序传送至该接收器的文件服务器。
在某些实施方式中,可编程逻辑装置(例如现场可编程门阵列)可用以执行本文所述方法的某些或全部功能。在某些实施方式中,现场可编程门阵列可与微处理器协作以执行本文所述多个方法中的一个。一般而言,这些方法最好地由任一硬件装置来执行。
上述实施方式仅说明本发明的原理。应理解的是,本文所述配置及细节的修改及变化对本领域技术人员而言将是显而易见的。因此,旨在仅受所附在审专利权利要求的范围的限制而并不受通过说明及解释本文实施方式所提出的特定细节的限制。
文献:
[1]:USAC codec(Unified Speech and Audio Codec),ISO/IEC CD23003-3,2010年9月24日
Claims (13)
1.一种音频编码器,包括:
频谱分解器(10),用于将音频输入信号(12)频谱分解成具有频谱序列的谱图(14);
自相关计算器(50),被配置为由所述频谱序列的当前频谱来计算自相关;
线性预测系数计算器(52),被配置为基于所述自相关来计算线性预测系数;
频谱域整形器(22),被配置为基于所述线性预测系数来频谱整形所述当前频谱;以及
量化级(24),被配置为量化所述经频谱整形的频谱;
其中,所述音频编码器被配置为将关于所述被量化的经频谱整形的频谱的信息及关于所述线性预测系数的信息插入到数据流中。
2.根据权利要求1所述的音频编码器,还包括:
频谱预测器(26),被配置为沿频谱维度预测性滤波所述当前频谱,其中,所述频谱域整形器被配置为频谱整形所述经预测性滤波的当前频谱,并且所述音频编码器被配置为将关于如何逆转该预测性滤波的信息插入到所述数据流中。
3.根据权利要求2所述的音频编码器,其中,所述频谱预测器被配置为沿所述频谱维度对所述当前频谱执行线性预测滤波,其中,所述数据流形成器被配置为使得关于如何逆转该预测性滤波的信息包括关于沿所述频谱维度对所述当前频谱进行的该线性预测滤波中隐含的进一步的线性预测系数的信息。
4.根据权利要求2或3所述的音频编码器,其中,所述音频编码器被配置为根据所述音频输入信号的音调或瞬态特性或滤波器预测增益来决定启动或停用所述频谱预测器,其中,所述音频编码器被配置为插入关于该决定的信息。
5.根据权利要求2至4中的任一项所述的音频编码器,其中,所述自相关计算器被配置为由所述经预测性滤波的当前频谱来计算所述自相关。
6.根据权利要求2至5中的任一项所述的音频编码器,其中,所述频谱分解器(10)被配置为在频谱分解所述音频输入信号(12)时在不同的变换长度的间切换,使得所述频谱具有不同的频谱分辨率,其中,所述自相关计算器(50)被配置为:如果所述当前频谱的频谱分辨率满足预定条件,则根据所述经预测性滤波的当前频谱来计算自相关;或如果所述当前频谱的频谱分辨率不满足该预定条件,则由未预测性滤波的当前频谱来计算自相关。
7.根据权利要求6所述的音频编码器,其中,所述自相关计算器被配置为使得如果所述当前频谱的频谱分辨率高于频谱分辨率阈值,则所述预定条件被满足。
8.根据权利要求1至7中的任一项所述的音频编码器,其中,所述自相关计算器被配置为:在由所述当前频谱来计算所述自相关时,由所述当前频谱来计算所述功率谱,感知加权所述功率谱并且使该经感知加权的功率谱接受反变换。
9.根据权利要求8所述的音频编码器,其中,所述自相关计算器被配置为改变所述当前频谱的频率标度并且以所述改变后的频率标度来执行所述功率谱的感知加权。
10.根据权利要求1至9中的任一项所述的音频编码器,其中,所述音频编码器被配置为将关于所述线性预测系数的信息以量化形式插入到该数据流中,其中,所述频谱域整形器被配置为基于所述经量化的线性预测系数来频谱整形所述当前频谱。
11.根据权利要求10所述的音频编码器,其中,所述音频编码器被配置为将关于所述线性预测系数的信息以在LSF或LSP域中进行所述线性预测系数的量化所依据的形式插入到所述数据流中。
12.一种音频编码方法,包括以下步骤:
将音频输入信号(12)频谱分解成具有频谱序列的谱图(14);
由所述频谱序列的当前频谱来计算自相关;
基于所述音频相关来计算线性预测系数;
基于所述线性预测系数来频谱整形所述当前频谱;
量化所述经频谱整形的频谱;以及
将关于所述被量化的经频谱整形的频谱的信息和关于所述线性预测系数的信息插入到数据流中。
13.一种具有程序代码的计算器程序,所述程序代码当在计算器上被运行时,用以执行根据权利要求12所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052455 WO2012110476A1 (en) | 2011-02-14 | 2012-02-14 | Linear prediction based coding scheme using spectral domain noise shaping |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103477387A true CN103477387A (zh) | 2013-12-25 |
CN103477387B CN103477387B (zh) | 2015-11-25 |
Family
ID=71943596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280018265.3A Active CN103477387B (zh) | 2011-02-14 | 2012-02-14 | 使用频谱域噪声整形的基于线性预测的编码方案 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9595262B2 (zh) |
EP (1) | EP2676266B1 (zh) |
JP (1) | JP5625126B2 (zh) |
KR (1) | KR101617816B1 (zh) |
CN (1) | CN103477387B (zh) |
AR (1) | AR085794A1 (zh) |
AU (1) | AU2012217156B2 (zh) |
BR (2) | BR112013020587B1 (zh) |
CA (1) | CA2827277C (zh) |
ES (1) | ES2534972T3 (zh) |
HK (1) | HK1192050A1 (zh) |
MX (1) | MX2013009346A (zh) |
MY (1) | MY165853A (zh) |
PL (1) | PL2676266T3 (zh) |
RU (1) | RU2575993C2 (zh) |
SG (1) | SG192748A1 (zh) |
TW (1) | TWI488177B (zh) |
WO (1) | WO2012110476A1 (zh) |
ZA (1) | ZA201306840B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106575509A (zh) * | 2014-07-28 | 2017-04-19 | 弗劳恩霍夫应用研究促进协会 | 谐波滤波器工具的谐度依赖控制 |
CN107239434A (zh) * | 2015-11-19 | 2017-10-10 | 英特尔公司 | 用于稀疏矩阵的自动重新排序的技术 |
CN110491401A (zh) * | 2014-05-01 | 2019-11-22 | 日本电信电话株式会社 | 周期性综合包络序列生成装置、方法、程序、记录介质 |
CN110709926A (zh) * | 2017-03-31 | 2020-01-17 | 弗劳恩霍夫应用研究促进协会 | 用于使用基于预测的整形后处理音频信号的装置和方法 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010003663A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
CA2777073C (en) * | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
US8891775B2 (en) * | 2011-05-09 | 2014-11-18 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
CA2899542C (en) * | 2013-01-29 | 2020-08-04 | Guillaume Fuchs | Noise filling without side information for celp-like coders |
BR122020015614B1 (pt) * | 2014-04-17 | 2022-06-07 | Voiceage Evs Llc | Método e dispositivo para interpolar parâmetros de filtro de predição linear em um quadro de processamento de sinal sonoro atual seguindo um quadro de processamento de sinal sonoro anterior |
EP3405950B1 (en) | 2016-01-22 | 2022-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Stereo audio coding with ild-based normalisation prior to mid/side decision |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP4336497A3 (en) | 2018-07-04 | 2024-03-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multisignal encoder, multisignal decoder, and related methods using signal whitening or signal post processing |
DE102020210917B4 (de) | 2019-08-30 | 2023-10-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein | Verbesserter M/S-Stereo-Codierer und -Decodierer |
KR20230066547A (ko) | 2020-07-07 | 2023-05-16 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 양자화기, 오디오 역양자화기 및 관련 방법들 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1195414A (zh) * | 1995-08-01 | 1998-10-07 | 夸尔柯姆股份有限公司 | 生成和编码线状谱平方根的方法和装置 |
JP2000330593A (ja) * | 1999-05-24 | 2000-11-30 | Ricoh Co Ltd | 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP1852851A1 (en) * | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
CN101460998A (zh) * | 2006-05-30 | 2009-06-17 | 皇家飞利浦电子股份有限公司 | 音频信号的线性预测编码 |
Family Cites Families (207)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE294441T1 (de) | 1991-06-11 | 2005-05-15 | Qualcomm Inc | Vocoder mit veränderlicher bitrate |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
US5537510A (en) * | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
CN1145928C (zh) | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ES2269112T3 (es) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
KR100464369B1 (ko) | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
RU2331933C2 (ru) | 2002-10-11 | 2008-08-20 | Нокиа Корпорейшн | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463559B1 (ko) | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
US7876966B2 (en) | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
KR100556831B1 (ko) | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
US7548852B2 (en) | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
CA2475282A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Volume hologram |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
CN1914669A (zh) | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
AU2004317109B2 (en) | 2004-02-12 | 2008-05-22 | Core Wireless Licensing S.A.R.L. | Classified media quality of experience |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
MXPA06012617A (es) | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
JP4168976B2 (ja) | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
RU2405217C2 (ru) | 2005-01-31 | 2010-11-27 | Скайп Лимитед | Способ взвешенного сложения с перекрытием |
CN100593197C (zh) | 2005-02-02 | 2010-03-03 | 富士通株式会社 | 信号处理方法和装置 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
EP1897085B1 (en) | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
EP1984911A4 (en) * | 2006-01-18 | 2012-03-14 | Lg Electronics Inc | DEVICE AND METHOD FOR SIGNAL CODING AND DECODING |
CN101371297A (zh) | 2006-01-18 | 2009-02-18 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7959940B2 (en) | 2006-05-30 | 2011-06-14 | Advanced Cardiovascular Systems, Inc. | Polymer-bioceramic composite implantable medical devices |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
JP5190363B2 (ja) | 2006-07-12 | 2013-04-24 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102096937B (zh) | 2006-07-24 | 2014-07-09 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
EP2054879B1 (en) | 2006-08-15 | 2010-01-20 | Broadcom Corporation | Re-phasing of decoder states after packet loss |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
PT2109098T (pt) | 2006-10-25 | 2020-12-18 | Fraunhofer Ges Forschung | Aparelho e método para gerar amostras de áudio de domínio de tempo |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
KR101016224B1 (ko) | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
EP2128855A1 (en) | 2007-03-02 | 2009-12-02 | Panasonic Corporation | Voice encoding device and voice encoding method |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP5241701B2 (ja) | 2007-03-02 | 2013-07-17 | パナソニック株式会社 | 符号化装置および符号化方法 |
DE102007063635A1 (de) | 2007-03-22 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
DK2827327T3 (da) | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CA2691993C (en) | 2007-06-11 | 2015-01-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
ES2748843T3 (es) | 2007-08-27 | 2020-03-18 | Ericsson Telefon Ab L M | Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
WO2009033288A1 (en) | 2007-09-11 | 2009-03-19 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
JP5302980B2 (ja) | 2008-03-04 | 2013-10-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 複数の入力データストリームのミキシングのための装置 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
ES2379761T3 (es) | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
ES2401487T3 (es) | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
CA2871498C (en) | 2008-07-11 | 2017-10-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
EP2345030A2 (en) | 2008-10-08 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-resolution switched audio encoding/decoding scheme |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
BR122019023704B1 (pt) | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
ES2567129T3 (es) | 2009-01-28 | 2016-04-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de ordenador |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
EP3352168B1 (en) | 2009-06-23 | 2020-09-16 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8635357B2 (en) | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
TWI430263B (zh) | 2009-10-20 | 2014-03-11 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 |
PL2473995T3 (pl) | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
CA2862715C (en) | 2009-10-20 | 2017-10-17 | Ralf Geiger | Multi-mode audio codec and celp coding adapted therefore |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
EP2676268B1 (en) | 2011-02-14 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
AR085895A1 (es) | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
WO2013075753A1 (en) | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
-
2012
- 2012-02-14 MY MYPI2013002982A patent/MY165853A/en unknown
- 2012-02-14 KR KR1020137024237A patent/KR101617816B1/ko active IP Right Grant
- 2012-02-14 AU AU2012217156A patent/AU2012217156B2/en active Active
- 2012-02-14 SG SG2013061387A patent/SG192748A1/en unknown
- 2012-02-14 ES ES12705820.4T patent/ES2534972T3/es active Active
- 2012-02-14 BR BR112013020587-3A patent/BR112013020587B1/pt active IP Right Grant
- 2012-02-14 CN CN201280018265.3A patent/CN103477387B/zh active Active
- 2012-02-14 BR BR112013020592-0A patent/BR112013020592B1/pt active IP Right Grant
- 2012-02-14 AR ARP120100477A patent/AR085794A1/es active IP Right Grant
- 2012-02-14 WO PCT/EP2012/052455 patent/WO2012110476A1/en active Application Filing
- 2012-02-14 TW TW101104673A patent/TWI488177B/zh active
- 2012-02-14 EP EP12705820.4A patent/EP2676266B1/en active Active
- 2012-02-14 MX MX2013009346A patent/MX2013009346A/es active IP Right Grant
- 2012-02-14 CA CA2827277A patent/CA2827277C/en active Active
- 2012-02-14 RU RU2013142133/08A patent/RU2575993C2/ru active
- 2012-02-14 PL PL12705820T patent/PL2676266T3/pl unknown
- 2012-02-14 JP JP2013553901A patent/JP5625126B2/ja active Active
-
2013
- 2013-08-14 US US13/966,601 patent/US9595262B2/en active Active
- 2013-09-11 ZA ZA2013/06840A patent/ZA201306840B/en unknown
-
2014
- 2014-06-09 HK HK14105388.3A patent/HK1192050A1/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1195414A (zh) * | 1995-08-01 | 1998-10-07 | 夸尔柯姆股份有限公司 | 生成和编码线状谱平方根的方法和装置 |
JP2000330593A (ja) * | 1999-05-24 | 2000-11-30 | Ricoh Co Ltd | 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP1852851A1 (en) * | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
CN101460998A (zh) * | 2006-05-30 | 2009-06-17 | 皇家飞利浦电子股份有限公司 | 音频信号的线性预测编码 |
Non-Patent Citations (1)
Title |
---|
PETR MOTLICEK, ET AL.: "Audio Coding Based on Long Temporal Contexts", 《IDIAP RESEARCH REPORT》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110491401A (zh) * | 2014-05-01 | 2019-11-22 | 日本电信电话株式会社 | 周期性综合包络序列生成装置、方法、程序、记录介质 |
CN110491401B (zh) * | 2014-05-01 | 2022-10-21 | 日本电信电话株式会社 | 周期性综合包络序列生成装置、方法、记录介质 |
CN106575509A (zh) * | 2014-07-28 | 2017-04-19 | 弗劳恩霍夫应用研究促进协会 | 谐波滤波器工具的谐度依赖控制 |
CN107239434A (zh) * | 2015-11-19 | 2017-10-10 | 英特尔公司 | 用于稀疏矩阵的自动重新排序的技术 |
CN107239434B (zh) * | 2015-11-19 | 2020-11-10 | 英特尔公司 | 用于稀疏矩阵的自动重新排序的技术 |
CN110709926A (zh) * | 2017-03-31 | 2020-01-17 | 弗劳恩霍夫应用研究促进协会 | 用于使用基于预测的整形后处理音频信号的装置和方法 |
US11562756B2 (en) | 2017-03-31 | 2023-01-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
CN110709926B (zh) * | 2017-03-31 | 2023-08-15 | 弗劳恩霍夫应用研究促进协会 | 用于使用基于预测的整形后处理音频信号的装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
PL2676266T3 (pl) | 2015-08-31 |
AU2012217156A1 (en) | 2013-08-29 |
SG192748A1 (en) | 2013-09-30 |
KR101617816B1 (ko) | 2016-05-03 |
US20130332153A1 (en) | 2013-12-12 |
JP5625126B2 (ja) | 2014-11-12 |
TW201246189A (en) | 2012-11-16 |
BR112013020587B1 (pt) | 2021-03-09 |
WO2012110476A1 (en) | 2012-08-23 |
JP2014510306A (ja) | 2014-04-24 |
BR112013020592B1 (pt) | 2021-06-22 |
MX2013009346A (es) | 2013-10-01 |
AR085794A1 (es) | 2013-10-30 |
ZA201306840B (en) | 2014-05-28 |
AU2012217156B2 (en) | 2015-03-19 |
EP2676266B1 (en) | 2015-03-11 |
ES2534972T3 (es) | 2015-04-30 |
EP2676266A1 (en) | 2013-12-25 |
BR112013020592A2 (pt) | 2016-10-18 |
RU2013142133A (ru) | 2015-03-27 |
CN103477387B (zh) | 2015-11-25 |
RU2575993C2 (ru) | 2016-02-27 |
MY165853A (en) | 2018-05-18 |
KR20130133848A (ko) | 2013-12-09 |
CA2827277A1 (en) | 2012-08-23 |
TWI488177B (zh) | 2015-06-11 |
US9595262B2 (en) | 2017-03-14 |
HK1192050A1 (zh) | 2014-08-08 |
BR112013020587A2 (pt) | 2018-07-10 |
CA2827277C (en) | 2016-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103477387B (zh) | 使用频谱域噪声整形的基于线性预测的编码方案 | |
EP3693964B1 (en) | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms | |
CN103098126B (zh) | 音频编码器、音频解码器及利用复预测处理多信道音频信号的相关方法 | |
US9892735B2 (en) | Coding of spectral coefficients of a spectrum of an audio signal | |
CN103052983B (zh) | 音频或视频编码器、音频或视频解码器及编码和解码方法 | |
CN101086845B (zh) | 声音编码装置及方法以及声音解码装置及方法 | |
CN103366749B (zh) | 一种声音编解码装置及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. |