CN103460284A - 音频信号音轨脉冲位置的编码与译码 - Google Patents
音频信号音轨脉冲位置的编码与译码 Download PDFInfo
- Publication number
- CN103460284A CN103460284A CN2012800164424A CN201280016442A CN103460284A CN 103460284 A CN103460284 A CN 103460284A CN 2012800164424 A CN2012800164424 A CN 2012800164424A CN 201280016442 A CN201280016442 A CN 201280016442A CN 103460284 A CN103460284 A CN 103460284A
- Authority
- CN
- China
- Prior art keywords
- track
- pulse
- state number
- positions
- tracks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 66
- 238000000034 method Methods 0.000 claims description 63
- 238000013316 zoning Methods 0.000 claims description 23
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 description 20
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000013461 design Methods 0.000 description 10
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008707 rearrangement Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提出一种用以译码一编码音频信号的装置,其中,一或多个音轨是与该编码音频信号相关联,这些音轨中的每一者具有多个音轨位置及多个脉冲。该装置包含一脉冲信息译码器(110)及一信号译码器(120)。该脉冲信息译码器(110)是适用以译码多个脉冲位置,其中这些脉冲位置中的每一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置,及其中该脉冲信息译码器是经配置来藉由使用指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、指示这些音轨中的至少一者的脉冲总数的一总脉冲数目、及一个状态数目而译码这些多个脉冲位置。该信号译码器(120)是适用于藉由使用这些多个脉冲位置及与该编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码该编码音频信号。
Description
技术领域
本发明是有关于音频处理及音频编码领域,更明确言之,是有关于音频信号中音轨脉冲位置的编码与译码。
背景技术
音频处理及/或音频编码已经按照许多方式进展。在音频编码中,线性预测编码器扮演重要角色。当编码音频信号(例如包含语音的音频信号)时,线性预测编码器信道通常编码音频信号的频谱包络的表示型态。为了达成该目的,线性预测编码器可决定预测滤波器系数来以编码形式表示该声音的频谱包络。然后,滤波器系数可由线性预测译码器用来通过使用这些线性预测编码器产生合成音频信号而译码该编码音频信号。
线性预测编码器的重要实例为ACELP编码器(ACELP=代数代码激励线性预测编码器)。ACELP编码器广为人使用,例如用于USAC(USAC=统一语音与音频编码)且可具有额外应用领域,例如用于LD-USAC(低延迟统一语音与音频编码)。
ACELP编码器信道是通过决定预测滤波器系数而编码音频信号。为了达成更佳编码,ACELP编码器基于欲编码的音频信号,及基于已经决定的预测滤波器系数而决定残差信号(又称目标信号)。残差信号例如可以是差信号,表示欲编码的音频信号与按照预测滤波器系数及可能地按照音准(pitch)分析所得的适应性滤波器系数编码的该信号部分之间的差值。然后ACELP编码器针对编码该残差信号。为了达成该目的,编码器编码代数码本参数,这些代数码本参数是用来表示该残差信号。
为了编码该残差信号,使用代数码本。通常代数码本包含多个音轨,例如四个音轨各自包含16音轨位置。于此种配置中,藉个别代数码本可表示共计4×16=64样本位置,相对应于欲编码的音频信号的一子帧的样本数目。
码本的这些音轨可以交插,使得码本的音轨0可表示该子帧的样本0、4、8、…、60,使得码本的音轨1可表示该子帧的样本1、5、9、…、61,使得码本的音轨2可表示该子帧的样本2、6、10、…、62,及使得码本的音轨3可表示该子帧的样本3、7、11、…、63。各个音轨可有固定数目的脉冲。或者每个音轨的脉冲数目可改变,例如取决于其它状况而改变。脉冲例如可以是正或负,例如可以+1(正脉冲)或0(负脉冲)表示。
为了编码该残差信号,当编码时,码本配置可经选择使得最佳表示该残差信号的其余信号。为了达成该目的,可用脉冲可位于最佳地反映出欲编码的信号位置的适当音轨位置。此外,可指定相对应脉冲为正或为负。
在译码器侧,ACELP译码器将首先解码代数码本参数。ACELP译码器也可解码适应性码本参数。为了决定代数码本参数,ACELP译码器可针对代数码本的各个音轨决定多个脉冲位置。此外,ACELP译码器也可译码在一音轨位置的脉冲是正或负脉冲。再者,ACELP译码器也可解码适应性码本参数。基于此项信息,ACELP译码器通常产生激励信号。然后,ACELP译码器施加这些预测滤波器系数于该激励信号来产生合成音频信号而获得译码音频信号。
在ACELP中,音轨上的脉冲通常是编码如下。若该音轨具有长度16,及若此一音轨上的脉冲数目为1,则可通过其位置(4位)及符号(1位)共计5位编码脉冲位置。若该音轨具有长度16及脉冲数目为2,则第一脉冲是通过其位置(4位)及符号(1位)编码。至于第二脉冲,则只需编码位置(4位),原因在于若该第二脉冲是在第一脉冲左方则可选择第二脉冲的符号为正,若是在第一脉冲右方则可选择第二脉冲的符号为正,及若是在第一脉冲的相同位置则可选择第二脉冲为与第一脉冲相同符号。因此,总计共需9位来编码两个脉冲。比起分开地各通过5位编码脉冲位置,因而针对每一对脉冲节省1位。
编码比2更大的脉冲数目,可成对地编码脉冲,及若脉冲数为奇数,则分开地编码最末脉冲。如此则例如针对5脉冲的音轨,需要9+9+5=23位。若有4音轨,则要求4×23=92位来编码具有4音轨及每个音轨5脉冲的长度64的子帧。但若位数可以更进一步减少则更有价值。
若能提供具有改良编码或译码构思的编码装置及相应的译码装置将极有价值,该装置具有针对脉冲信息表示型态使用较少位而以改良方式来编码或译码脉冲信息的手段,如此将例如减低传输各自编码地音频信号的传输速率,及再者,如此将例如减少储存各自编码地音频信号需要的储存空间。
发明内容
因此本发明的一目的是提供音频信号的音轨脉冲的编码及译码的改良构思。本发明的目的可通过根据权利要求1的译码装置、根据权利要求9的编码装置、根据权利要求13的解码方法、根据权利要求14的编码方法、及根据权利要求15的计算机程序达成。
依据实施例,假设一个状态数目可供译码装置使用。再者假设指示与该编码音频信号相关联的至少一个音轨的音轨位置总数的音轨位置数目、及指示至少一个音轨的脉冲数目的总脉冲数目可供本发明的译码装置使用。较佳地,该音轨位置数目及该总脉冲数目是可供与该编码音频信号相关联的各个音轨使用。
举例言之,具有4音轨有5脉冲,各自可达成粗略地6.6×10^21状态,依据实施例,可按照73位编码,比较前述现有技术的编码器使用92位编码,更有效约21%。
首先,提供一种构思,如何以有效方式编码一音频信号的一音轨的多个脉冲位置。后文中,该构思扩延成允许不仅编码一音轨的脉冲位置,同时也允许编码该脉冲是正或负。此外,然后该构思扩延成允许以有效方式针对多个音轨编码脉冲信息。此等构思同等适用于译码器侧。
此外,实施例又更基于发现若编码策略使用预定数目的位,使得在各个音轨上有相同脉冲数目的任一种配置皆要求相等数目的位。若可用位数目为固定,则可能直接地选定使用该给定位量可编码多少个脉冲,如此允许以预定质量编码。此外,使用此种办法,无需尝试不等量脉冲直到达成期望的位率,反而可以直接地选择正确脉冲量,因而减低复杂度。
基于前述假设,可编码及/或译码一音频信号帧的一音轨的多个脉冲位置。
虽然可采用本发明来编码或译码任一种音频信号,例如语音信号或音乐信号,本发明特别可用于编码或译码语音信号。
在另一实施例中,脉冲信息译码器又更适用以使用音轨位置数目、总脉冲数目、及状态数目来译码多个脉冲符号,其中这些脉冲符号中的每一个指示多个脉冲中的一者的符号。信号译码器可适用以还使用多个脉冲符号,通过产生合成音频信号而译码该编码音频信号。
依据又一实施例,其中一或多个音轨可包含至少一个最末音轨及一或多个其它音轨,该脉冲信息译码器可适用以从该状态数目产生一第一子状态数目及一第二子状态数目。该脉冲信息译码器可经配置来基于该第一子状态数目而译码这些脉冲位置的一第一群组,及该脉冲信息译码器更可经配置来基于该第二子状态数目而译码这些脉冲位置的一第二群组。这些脉冲位置的该第二群组可只包含指示该最末音轨的音轨位置的脉冲位置。这些脉冲位置的该第一群组可只包含指示一或多个其它音轨的音轨位置的脉冲位置。
依据另一实施例,脉冲信息译码器可经配置来通过将该状态数目除以f(pk,N)而获得一整数部分及一余数作为除法结果来产生该第一子状态数目及该第二子状态数目,其中该整数部分为该第一子状态数目,及其中该余数为该第二子状态数目,其中pk指示针对一或多个音轨中的每一个的脉冲数目,及其中N指示针对一或多个音轨中的各一者的音轨位置数目。此处,f(pk,N)乃返回于长度N具有pk脉冲的音轨中可达成的状态数目的函数。
在另一实施例中,该脉冲信息译码器可适用以进行一测试比较该状态数目或一已更新状态数目与一阈值。
该脉冲信息译码器可适用以通过比较该状态数目或一已更新状态数目是否大于、大于或等于、小于、或小于或等于该阈值而进行该测试,及其中该脉冲信息译码器还适用取决于该测试结果而更新该状态数目或一已更新状态数目。
在一实施例中,该脉冲信息译码器可经配置来针对这些多个音轨中的一者的各个音轨位置,比较该状态数目或该已更新状态数目与该阈值。
依据一实施例,该脉冲信息译码器可经配置来划分这些音轨中的一者成为包含这些多个音轨位置中的至少一个音轨位置的一第一音轨区划,及成为包含这些多个音轨位置中的其他剩余音轨位置的一第二音轨区划。该脉冲信息译码器可经配置来基于该状态数目而产生一第一子状态数目及一第二子状态数目。此外,该脉冲信息译码器可经配置来基于该第一子状态数目,译码与该第一音轨区划相关联的脉冲位置的一第一群组。再者,该脉冲信息译码器可经配置来基于该第二子状态数目,译码与该第二音轨区划相关联的脉冲位置的一第二群组。
依据一实施例,提出一种编码一音频信号的装置。该装置包含适用以决定与该音频信号相关联的多个预测滤波器系数的一信号处理器,用以基于该音频信号及这些多个预测滤波器系数而产生一残差信号。此外,该装置包含一脉冲信息编码器适用以编码与一或多个音轨相关的多个脉冲位置来编码该音频信号,这些一或多个音轨是与该残差信号相关联。这些音轨中的各一者具有多个音轨位置及多个脉冲。这些脉冲位置中的各一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置。该脉冲信息编码器是经配置来通过产生一状态数目而编码这些多个脉冲位置,使得这些脉冲位置仅基于该状态数目、指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、及指示这些音轨中的至少一者的脉冲总数的一总脉冲数目才能被译码。
依据另一实施例,该脉冲信息编码器可适用以编码多个脉冲符号,其中这些脉冲符号中的各一者指示这些多个脉冲中的一者的一符号。该脉冲信息编码器还可经配置来通过产生该状态数目而编码这些多个脉冲符号,使得这些脉冲符号近基于该状态数目、指示这些音轨中的至少一者的音轨位置总数的该音轨位置数目、及该总脉冲数目就可被译码。
在一实施例中,该脉冲信息编码器是经配置来针对这些音轨中的一者的各个音轨位置,将一整数值加至针对于一音轨位置的各个脉冲的一中间数目来获得该状态数目。
依据另一实施例,该脉冲信息编码器可经配置来划分这些音轨中的一者成为包含这些多个音轨位置中的至少一个音轨位置的一第一音轨区划,及成为包含这些多个音轨位置中的其他剩余音轨位置的一第二音轨区划。此外,该脉冲信息编码器可经配置来编码与该第一区划相关联的的一第一子状态数目。再者,该脉冲信息编码器可经配置来编码与该第二区划相关联的的一第二子状态数目。此外,该脉冲信息编码器可经配置来组合该第一子状态数目与该第二子状态数目而获得该状态数目。
附图说明
图1显示依据一实施例用以译码一编码音频信号的装置,
图2显示依据一实施例用以编码一音频信号的装置,
图3显示针对具有两个无符号脉冲及三个音轨位置的一音轨的全部可能配置,
图4显示针对具有一个有符号脉冲及两个音轨位置的一音轨的全部可能配置,
图5显示针对具有两个有符号脉冲及两个音轨位置的一音轨的全部可能配置,
图6为例示说明一实施例的流程图,阐释依据一实施例藉脉冲信息译码器所进行的处理步骤,及
图7为例示说明一实施例的流程图,该流程图阐释依据一实施例藉脉冲信息编码器所进行的处理步骤。
具体实施方式
图1例示说明译码一编码音频信号的装置,其中一或多个音轨是与该编码音频信号相关联,这些音轨中的各一者具有多个音轨位置及多个脉冲。
该装置包含一脉冲信息译码器110及一信号译码器120。该脉冲信息译码器110是适用以译码多个脉冲位置。这些脉冲位置中的各一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置。
该脉冲信息译码器110是经配置来通过由使用指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、指示这些音轨中的至少一者的脉冲总数的一总脉冲数目、及一个状态数目而译码这些多个脉冲位置。
该信号译码器120是适用于通过由使用这些多个脉冲位置及与该编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码该编码音频信号。
状态数目为已经依据后述实施例通过编码器编码的数目。状态数目例如包含在一精简表示型态中有关多个脉冲位置的信息,该表示型态例如为要求少数位的表示型态,及当有关该音轨位置数目及总脉冲数目的信息在该译码器为可利用时可被译码的表示型态。
在一实施例中,该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目在该译码器为可利用,原因在于该音轨位置数目及/或总脉冲数目为不变的静态数值且为接收器所已知。举例,针对各个音轨,该音轨位置数目可以总是为16,及总脉冲数目可以总是为4。
在另一实施例中,该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目例如可通过编码装置而明确地传输至该译码装置。
在又一实施例中,译码器可决定该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目,该决定方式是通过分析并不显式地陈述该音轨位置数目及/或总脉冲数目的其它参数,而从这些其它参数可推导出该音轨位置数目及/或总脉冲数目。
在其它实施例中,译码器可分析可利用来推导出该音频信号的一个音轨或各个音轨的该音轨位置数目及/或总脉冲数目的其它数据。
在又一实施例中,该脉冲信息译码器可适用也解码一脉冲为正脉冲或负脉冲。
在另一实施例中,该脉冲信息译码器又更可适用以译码脉冲信息,包含有关多个音轨的脉冲的信息。脉冲信息例如可以是有关于一音轨中的脉冲位置信息及/或一脉冲为正脉冲或负脉冲的信息。
图2例示说明编码音频信号的装置,包含信号处理器210及脉冲信息编码器220。
信号处理器210是适用以决定与该音频信号相关联的多个预测滤波器系数,用以基于该音频信号及这些多个预测滤波器系数而产生一残差信号。
脉冲信息编码器220是适用以编码与一或多个音轨相关的多个脉冲位置来编码该音频信号。这些一或多个音轨是与由信号处理器210所产生的该残差信号相关联。这些音轨中的各一者具有多个音轨位置及多个脉冲。此外,这些脉冲位置中的各一者指示这些音轨中的一者的这些音轨位置中的一者来指示该音轨的这些脉冲中的一者的位置。
该脉冲信息编码器220是经配置来通过产生一状态数目而编码这些多个脉冲位置,使得这些脉冲位置仅基于该状态数目、指示这些音轨中的至少一者的音轨位置总数的一音轨位置数目、及指示这些音轨中的至少一者的脉冲总数的一总脉冲数目就能被译码。
后文中,呈示有关通过产生一状态数目而编码脉冲位置及可能地编码脉冲符号(正脉冲或负脉冲)的本发明的实施例的基本构思。
本发明的实施例的编码原理是基于下述发现,若考虑在具有n个音轨位置的一音轨中的k个脉冲的全部可能配置的状态列举,则是足以编码一音轨的脉冲的实际状态。通过尽可能少数位编码此种状态,提供期望的精简编码。藉此,呈示状态列举的构思,其中脉冲位置及可能也脉冲符号的各丛表示一个状态,及各个状态是独特地列举。
图3针对简单情况例示说明此点,在该处阐释全部可能的配置,此时考虑具有两个脉冲及三个音轨位置的一音轨。两个脉冲可位在相同音轨位置。在图3的实例中,不考虑脉冲的符号(例如脉冲是正或负),例如于此一实例中,全部脉冲皆可视为正脉冲。
在图3中,例示说明针对位在具有三个音轨位置(图3中:音轨位置1、2及3)的一音轨中两个无方向性脉冲的全部可能配置。只有六个不同的可能状态(图3中标示为0至5),描述脉冲如何分布在该音轨。藉此,使用0至5的范围的状态数目来描述所呈示的实际配置是足够的。举例,若图3实例的状态数目具有数值(4),且若译码器知晓编码方案,则译码器可获得结论状态数目=4,表示该音轨具有一个脉冲在音轨位置0,及另一个脉冲在音轨位置2。于是在图3的实例中,3位即足以编码状态数目来识别图3的实例的六个不同状态中的一者。
图4例示说明针对位在具有两个音轨位置(图4中:音轨位置1及2)的一音轨中一个方向性脉冲的全部可能配置。图4中考虑脉冲的符号(例如脉冲是正或负)。有四个不同的可能状态(图4中标示为0至3),描述脉冲如何分布在该音轨,也描述其符号(正或负)。使用0至3的范围的状态数目来描述所呈示的实际配置是足够的。举例,若图4实例的状态数目具有数值(2),且若译码器知晓编码方案,则译码器可获得结论状态数目=2,表示该音轨具有一个脉冲在音轨位置1,及该脉冲为正脉冲。
图5例示说明又另一情况,在该处阐释当考虑具有两个脉冲及两个音轨位置的一音轨时的全部可能配置。脉冲可位在相同音轨位置。在图5所示实例中,考虑脉冲的符号(例如脉冲是正或负)。假设在同一个音轨位置的脉冲具有相同符号(例如在同一个音轨位置的音轨脉冲是全正或全负)。
图5中例示说明位在具有两个音轨位置(图5中:音轨位置1及2)的一音轨中两个有符号脉冲(例如脉冲是正或负)的全部可能配置。只有八个不同的可能状态(图5中标示为0至7),描述脉冲如何分布在该音轨。藉此,使用0至7的范围的状态数目来描述所呈示的实际配置是足够的。举例,若图5实例的状态数目具有数值(3),且若译码器知晓编码方案,则译码器可获得结论状态数目=3,表示该音轨具有一个脉冲在音轨位置0,及另一个脉冲在音轨位置1而该脉冲为负。于是在图5的实例中,3位即足以编码状态数目来识别图5的实例的八个不同状态中的一者。
在ACELP中,残差信号可通过固定数目的有符号脉冲编码。如前述,脉冲例如可分布在四个交插音轨,使得音轨0含有位置mod(n,4)==0,音轨=1含有位置mod(n,4)==1,等等。各个音轨可有经预先界定的有符号单位脉冲数目,脉冲可重迭,但重迭时脉冲有相同符号。
通过编码脉冲,须达成从脉冲位置及其符号映射至使用最小可能的位数量的表示型态。此外,脉冲编码须具有固定的位耗用量,亦即任何脉冲丛具有相等数目的位。
各音轨首先独立地编码,然后各个音轨的状态被组合成一个数目,表示整个子帧的状态。此方法给予数学上最佳的位耗用,给定全部状态有相等机率,及位耗用量是固定的。
状态列举构思可运用不同状态丛的精简表示型态说明:
设欲编码的残差信号为xn。假设考虑例如代数码本的四个交插音轨,则第一音轨具有样本x0、x4、x8、…xN-4,第二音轨具有样本x1、x5、x9、…xN-3等。假设第一音轨是使用一个有符号单位脉冲量化及T=8,故音轨长度为2(T=欲编码的残差信号长度(样本)。若t=8,及若4音轨是用来编码残差信号,则4音轨中的各一者具有2音轨位置。举例,第一音轨可考虑具有两个音轨位置x0及x4。则第一音轨的脉冲出现在下列中的任一者:
x0 | +1 | -1 | 0 | 0 |
x4 | 0 | 0 | +1 | -1 |
此一配置有四个不同状态。
同理,若第一音轨有两个脉冲,第一音轨具有两个音轨位置x0及x4。则脉冲可分配在下列脉冲丛:
x0 | +2 | -2 | +1 | +1 | -1 | -1 | 0 | 0 |
x4 | 0 | 0 | +1 | -1 | +1 | -1 | +2 | -2 |
因而此一配置有8状态。
若残差信号的长度扩延至T=12,则4音轨各自有3音轨位置。第一音轨获得多一个样本,现在有音轨位置x0、x4及x8,使得具有:
上表表示若x8=0(x8不具脉冲)则针对x0及x4有8不同状态;若x8=1(x8具正脉冲)则针对x0及x4有不同状态;若x8=-1(x8具负脉冲)则针对x0及x4有不同状态;若x8=2(x8具两个正脉冲)则针对x0及x4有一个状态;及若x8=-2(x8具两个负脉冲)则针对x0及x4有一个状态。
此处,从先前二表获得第一列的状态数目。通过将状态数目加至第一列,发现此一配置共有18状态。
在T=12实例中,5位足够编码全部18个不同的可能状态。然后编码器例如从范围[0,…,17]选定状态数目来指定18配置中的一者。若译码器知晓编码方案,例如若译码器知晓哪个状态数目表示哪个配置,则可针对一音轨译码脉冲位置及脉冲符号。
后文中,将提供依据实施例的适当编码方法及相对应译码方法。依据实施例提供编码装置,其是经配置来执行后文呈示的编码方法中的一者。此外,依据额外实施例提供译码装置,其是经配置来执行后文呈示的译码方法中的一者。
在实施例中,为了产生状态数目或译码状态数目,可计算具有p个脉冲的N个音轨位置的可能配置数目。
脉冲可加符号,及可采用递归公式,计算针对具有N个音轨位置及p个有符号脉冲(脉冲可以是正或负,但在相同音轨位置的脉冲具有相同符号)的一音轨的状态数目f(p,N),其中递归公式f(p,N)定义为:
公式1:
初始条件为
因具有一或多个脉冲的单一位置要求一个位(2状态)来用于符号。递归公式是用于全部不同丛的摘要。
亦即,给定p个脉冲,目前位置可具有qN=0至p个脉冲,故其余N-1个位置有p-qN个脉冲。在目前位置及其余N-1位置的状态数目相乘来获得具有这些脉冲组合的状态数目,组合经求和来获得状态总数。
在实施例中,递归函数可通过迭代重复算法计算,其中递归是以迭代重复置换。
因f(p,N)的评估就实时应用而言在数值上相当复杂,依据若干实施例,可采用询查表来计算f(p,N)。依据若干实施例,该表可已经离线计算。
后文中,提出额外构思用于状态数目的编码与译码:
设f(p,N)表示具有p个有符号脉冲的N个音轨位置的可能配置数目。
脉冲信息编码器现在可分析音轨:若在该音轨的第一位置不具有脉冲,则其余N-1个位置具有p个有符号脉冲,为了描述此丛,只需要f(p,N-1)个状态。
否则,若第一位置具有一或多个脉冲,则脉冲信息编码器可定义总状态是大于f(p,N-1)。
然后,在脉冲信息译码器,脉冲信息译码器例如可始于最末位置,及比较该状态与一阈值例如f(p,N-1)。若该状态为较大,则脉冲信息译码器可决定最末位置具有至少一个脉冲。然后脉冲信息译码器可从该状态扣除f(p,N-1)来获得已更新状态数目及将剩余脉冲数目减1来更新状态。
否则,若最末位置没有脉冲,则脉冲信息译码器可将剩余位置数目减1。重复此一程序直到没有脉冲剩下提供无符号的脉冲位置。
为了也将脉冲符号列入考虑,脉冲信息编码器可以最低状态位编码脉冲。在另一实施例中,脉冲信息编码器可以最高剩余状态位编码该符号。但以最低位编码脉冲符号为佳,原因在于就整数计算而言更容易处理。
在脉冲信息译码器中,若找到给定位置的第一脉冲,则脉冲符号是由最末位决定。然后,剩余状态向右移位一步骤来获得已更新状态数目。
在一实施例中,脉冲信息译码器是经配置来应用下列译码算法。在此译码算法中,在逐一步骤方法中,针对各个音轨位置例如前后相续,状态数目或已更新状态数目是与阈值(例如与f(p,k-1))比较。
依据一实施例,提供脉冲信息译码器算法:
依据一实施例,有关脉冲信息,脉冲信息编码器是经配置来施加下列编码算法。脉冲信息编码器进行与脉冲信息译码器的相同步骤但顺序相反。
依据一实施例,提供脉冲信息编码器算法:
通过使用此一算法编码状态数目,针对音轨中的一者的各个音轨位置在一音轨位置的各个脉冲,脉冲信息编码器将一整数值加至中间数目(例如中间状态数目),例如算法完成前的状态数目,来获得状态数目(的数值)。
脉冲信息的编码及译码办法,例如脉冲位置及脉冲符号可称作为“逐一步骤编码”及“逐一步骤译码”,原因在于音轨位置由编码及译码方法被视为前后相续,亦即逐一步骤。
图6为流程图例示说明一实施例,阐释依据一实施例由脉冲信息译码器所进行的处理步骤。
在步骤610,目前音轨位置k是设定为N。此处,N表示一音轨的音轨位置数目,其中音轨位置是编码从1至N。
在步骤620,测试k是否大于或等于1,亦即是否有任何剩余音轨位置尚未考虑。若k不大于或等于1,则全部音轨位置皆已考虑及结束处理。
否则在步骤630,测试状态是否大于或等于f(p,k-1)。若为是,则位置k至少存在有一个脉冲。若为否,则在音轨位置k不存在有(额外)脉冲,及处理继续步骤640,在该处k减1,使得将考虑下个音轨位置。
但若状态是大于或等于f(p,k-1),处理继续步骤642,一脉冲置于音轨位置k,及然后在步骤644,状态是通过将该状态减f(p,k-1)更新。然后在步骤650,测试目前脉冲是否为在音轨位置k第一个发现的脉冲。若为否,则在步骤680,剩余脉冲数目减1,及处理继续步骤630。
但若目前脉冲是在音轨位置k第一个发现的脉冲,处理继续步骤660,在该处测试s的最低位是否经设定。若为是,则在此音轨位置的脉冲符号是设定为负(步骤662),否则在此音轨位置的脉冲符号是设定为正(步骤664)。两种情况下,在步骤670然后状态向右移位一阶(s:=s/2)。然后,剩余脉冲数目也减1(步骤680),及处理继续步骤630。
图7为流程图例示说明一实施例,该流程图阐释依据一实施例由脉冲信息编码器所进行的处理步骤。
在步骤710,所找到的脉冲p的数目是设定为0,状态s是设定为0,及所考虑的音轨位置k是设定为1。
在步骤720,测试k是否小于或等于N,亦即是否仍有音轨位置尚未考虑(此处,N表示:一音轨的音轨位置数目)。若k是不小于或等于N,则全部音轨位置皆已经考虑及结束处理。
否则在步骤730,测试至少一个脉冲是否存在于位置k。若否,处理继续步骤740,在该处k增加1,使得将考虑下个音轨位置。
但若至少一个脉冲是存在于音轨位置k,则在步骤750测试目前考虑的脉冲是否为音轨位置k的最末脉冲。若否,则于步骤770,状态s是藉f(p,k-1)加至状态s更新,所找到的脉冲p数目加1,及处理继续步骤780。
若目前考虑的脉冲是音轨位置k的最末脉冲,则在步骤750的后,处理继续步骤755,及状态向左移位一阶(s:=s*2)。然后在步骤760,测试脉冲符号是否为负。若是,则s的最低位是设定为1(步骤762);否则s的最低位是设定为0(或不变)(步骤764)。然后在两种情况下,进行步骤770,在该处状态s是通过f(p,k-1)加至状态s更新,所找到的脉冲p数目加1,及处理继续步骤780。
在步骤780,测试在位置k是否有另一脉冲。若是,则处理继续步骤750;否则,处理继续步骤740。
后文中,提供编码多个音轨的状态的联合状态数目的构思。
不幸,在多种情况下,单音轨的可能状态范围并非2的倍数,因而各状态的二进制表示型态无效。举例,若可能的状态数目为5,则需3位来以二进制数目表示。但若有4音轨各有5个状态,则整个子帧有5×5×5×5=625状态,可以10位(而非4×3=12位)表示。如此相当于每个音轨2.5位而非3位,如此每音轨节省0.5位,或相当于每个子帧节省2位(占总位耗用量的20%)。因此重要地是组合各音轨状态成为一个联合状态,原因在于藉此可减少二进制表示型态的无效率。注意相同方法可用于传输的任何数目。举例,因各个子帧可有一状态表示脉冲位置,及各帧可有例如4子帧,此等状态可组合成为一个联合状态。
给定子帧例如有4音轨,则通过联合编码各音轨状态,可减少位耗用而改良效率。举例,给定各音轨有pk脉冲,及各音轨具有长度N,例如有N个音轨位置,则各音轨状态是在0至f(pk,N)-1的范围。然后各音轨的状态sk可经组合成为子帧的联合状态s,利用公式(假设每个子帧有4个音轨)
公式2:
s=[[s0f(p0,N)+s1]f(p1,N)+s2]f(p2,N)+s3
然后各音轨的状态可在译码器决定,通过将联合状态除以f(pk,N),藉此余数为最末音轨状态,及整数部分为其余音轨的联合状态。若音轨数目非为4,则方便于上式中适当地加或减项数。
注意,当每个音轨的脉冲数目大时,则可能的状态数目变大。举例,有4个音轨,每个音轨有6个脉冲,及音轨长度N=16,则状态为83-位数目,超过常规中央处理单元(CPU)上的最大二进制数目长度。接着须采取若干额外步骤来使用标准方法以极长整数评估上式。
当状态机率假设为相等时,也观察此一方法等于音轨状态的算术编码。
前文已经呈示逐一步骤办法用以编码及译码一音轨的脉冲信息,例如一音轨的脉冲位置及可能脉冲符号。其它实施例提供另一方法,称作为“分裂与征服”办法。
脉冲信息编码器是经配置来施加分裂与征服办法,将一音轨划分为两个音轨区划x1及x2,可考虑为两个向量,其中x=[x1x2]。基本构想是分开编码二向量x1及x2,及然后以下式组合二者
公式3:
上式中,须注意当脉冲数目为已知时,换言之,当向量分别地具有p1及p2=p-p1脉冲时,s(x1)及s(x2)为向量x1及x2的状态。为了将向量x1中具有0至p1-1脉冲的全部状态列入考虑,须将加总项加至上式。
如上算法/公式可施加来通过施加以下两个前处理步骤来编码交插音轨脉冲。首先,设向量xtrack k包含音轨k上的全部样本,藉定义x=[xtrack1,xtrack 2,xtrack3,xtrack4]而合并此等向量。观察如此只是样本的重新排序,使得来自音轨1的全部样本是置于第一组等等。
其次,注意每个音轨的脉冲数目通常为固定数目。接着若音轨1经常性有p1脉冲,则针对全部值k≠p1,音轨1上的状态数目为f(k,N1)=0。此乃陈述音轨1没有任何状态不具p1脉冲的另一个方式。正式地然后将状态数目公式定义为:
公式4:
针对具有pk脉冲的完整音轨×track k,状态数目为(N=Ntrack k)
否则,针对N>1
以及针对N=1:
通过样本的重新排序及使用如上针对状态数目的定义(公式4),可通过公式3计算全部音轨的联合状态。注意因状态数目大半含有零,当合并音轨状态时,公式3的总和为零。因此合并二音轨是与公式2相同。同理,方便显示采用两个办法,合并全部4音轨(或5)也获得相同结果。
依据一实施例,重新排序可用作为编码器的前处理步骤。在另一实施例中,重新排序可整合入编码器。同理依据一实施例,重新排序可用作为译码器的后处理步骤。在另一实施例中,重新排序可整合入译码器。
若一音轨上的脉冲数目为不固定,则方便适度修改状态数目公式,而仍然使用相同编码算法。
若适当选择合并音轨顺序,则观察于章节“组合音轨数据”呈示的方法及前述方法获得相等结果。同理,逐一步骤办法及分裂与征服方法获得相等结果。因此,依据哪个方法体现上更实用或哪个方法最佳匹配平台的运算限制,独立地选择哪个方法用在译码器及编码器。
依据一实施例,提供脉冲信息编码器算法,可以伪码描述
依据一实施例,采用此种编码算法,脉冲信息编码器是经配置来将音轨中的一者划分成一第一音轨区划及一第二音轨区划。脉冲信息编码器是经配置来编码与第一区划相关联的第一子状态数目。此外,脉冲信息编码器是经配置来编码与第二区划相关联的第二子状态数目。再者,脉冲信息编码器是经配置来组合第一子状态数目及第二子状态数目而获得该状态数目。
同理,依据一实施例,提供脉冲信息译码器算法,可以伪码描述
在实现该分裂与征服方法的一实施例中,脉冲信息译码器是经配置来基于该状态数目而产生第一子状态数目及第二子状态数目。脉冲信息译码器是经配置来基于该第一子状态数目而译码这些音轨中的一者的第一区划的脉冲位置的第一群组。此外,脉冲信息译码器是经配置来基于该第二子状态数目而译码这些音轨中的一者的第二区划的脉冲位置的第二群组。
虽然已经在装置上下文中描述若干方面,但显然这些方面也表示相对应方法的描述,在该处一方块或一装置是相对应于一方法步骤或一方法步骤的特征。同理,以方法步骤的脉络描述的构面也表示相对应装置的相对应方块或项或特征结构的描述。
取决于某些体现要求,本发明的实施例可以硬件或以软件体现。体现可使用数字储存媒介质执行,例如软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存,具有可电子读取控制信号储存于其上,这些信号与(或可与)可编程计算机系统协作,因而执行相应方法。
依据本发明的若干实施例包含具有可电子式读取控制信号的数据载体,这些控制信号可与可编程计算机系统协作,因而执行此处所述方法中的一者。
大致上,本发明的实施例可体现为具有程序代码的计算机程序产品,该程序代码是当计算机程序产品在计算机上运行时可执行这些方法中的一者。该程序代码例如可储存在机器可读取载体上。
其它实施例包含储存在机器可读取载体或非暂存性储存媒体上的用以执行此处所述方法中的一者的计算机程序。
换言之,因此,本发明方法的实施例为一种具有一程序代码的计算机程序,该程序代码是当该计算机程序于一计算机上运行时用以执行此处所述方法中的一者。
因此,本发明方法的又一实施例为数据载体(或数字储存媒体或计算机可读取媒体)包含用以执行此处所述方法中的一者的计算机程序记录于其上。
因此,本发明方法的又一实施例为表示用以执行此处所述方法中的一者的计算机程序的数据串流或信号序列。数据串流或信号序列例如可经配置来通过数据通信连结,例如通过因特网转移。
又一实施例包含处理构件例如计算机或可编程逻辑装置,其是经配置来或适用于执行此处所述方法中的一者。
又一实施例包含一计算机,其上安装有用以执行此处所述方法中的一者的计算机程序。
在若干实施例中,可编程逻辑装置(例如可编程现场门阵列)可用来执行此处描述的方法的部分或全部功能。在若干实施例中,可现场程序规划门阵列可与微处理器协作来执行此处所述方法中的一者。大致上这些方法较佳是通过任何硬件装置执行。
前述实施例是仅供举例说明本发明的原理。须了解此处所述配置及细节的修改及变化将为熟谙技艺人士显然易知。因此,意图仅受审查中的专利申请范围所限而非受藉以描述及解说此处实施例所呈示的特定细节所限。
Claims (15)
1.一种用以译码一编码音频信号的装置,其中一或多个音轨是与所述编码音频信号相关联,音轨中的每一个具有多个音轨位置及多个脉冲,其中,所述装置包括:
一脉冲信息译码器(110),用以译码多个脉冲位置,其中,所述脉冲位置中的每一个脉冲位置指示所述音轨中的一个的音轨位置中的一个来指示所述音轨的脉冲中的一个的位置,及其中,所述脉冲信息译码器(110)被配置为通过使用指示这些音轨中的至少一个的音轨位置总数的一音轨位置数目、指示这些音轨中的至少一个的脉冲总数的一总脉冲数目、及一个状态数目而译码所述多个脉冲位置;及
一信号译码器(120),用于通过使用所述多个脉冲位置及与所述编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码所述编码音频信号。
2.根据权利要求1所述的装置,
其中,所述脉冲信息译码器(110)还适用于使用所述音轨位置数目、所述总脉冲数目及所述状态数目而译码多个脉冲符号,其中,所述脉冲符号中的每一个指示所述多个脉冲中的一个的一符号,及
其中,所述信号译码器(120)适用于通过再使用所述多个脉冲符号而产生一合成音频信号来译码所述编码音频信号。
3.根据权利要求1或2所述的装置,其中,所述一或多个音轨是包含至少一个最末音轨及一或多个其它音轨,及
其中,所述脉冲信息译码器(110)是适用以从所述状态数目产生一第一子状态数目及一第二子状态数目,
其中,所述脉冲信息译码器(110)被配置为基于所述第一子状态数目而译码所述脉冲位置的一第一群组,及
其中,所述脉冲信息译码器(110)被配置为基于所述第二子状态数目而译码所述脉冲位置的一第二群组,
其中,所述脉冲位置的所述第二群组只包含指示所述最末音轨的音轨位置的脉冲位置,及
其中,所述脉冲位置的所述第一群组只包含指示所述一或多个其它音轨的音轨位置的脉冲位置。
4.根据权利要求3所述的装置,其中,所述脉冲信息译码器被配置为通过将所述状态数目除以f(pk,N)而获得一整数部分及一余数作为除法结果来产生所述第一子状态数目及所述第二子状态数目,其中,所述整数部分为所述第一子状态数目,及其中,所述余数为所述第二子状态数目,其中,pk指示针对所述一或多个音轨中的每一个的脉冲数目,及其中,N指示针对所述一或多个音轨中的每一个的音轨位置数目。
5.根据前述权利要求中任一项所述的装置,其中,所述脉冲信息译码器(110)是适用以进行将所述状态数目或一已更新状态数目与一阈值相比较的一测试。
6.根据权利要求5所述的装置,其中,所述脉冲信息译码器(110)是适用以通过比较所述状态数目或一已更新状态数目是否大于、大于等于、小于、或小于等于所述阈值而进行所述测试,及其中,所述脉冲信息译码器(110)是更适用以取决于所述测试结果而更新所述状态数目或一已更新状态数目。
7.根据权利要求6所述的装置,其中,所述脉冲信息译码器(110)被配置为针对所述多个音轨中的一个的各个音轨位置,比较所述状态数目或所述已更新状态数目与所述阈值。
8.根据权利要求1至3中任一项所述的装置,
其中,所述脉冲信息译码器(110)被配置为划分所述音轨中的一个成为包含所述多个音轨位置中的至少两个音轨位置的一第一音轨区划,及成为包含所述多个音轨位置中的至少另两个音轨位置的一第二音轨区划,
其中,所述脉冲信息译码器(110)被配置为基于所述状态数目而产生一第一子状态数目及一第二子状态数目,
其中,所述脉冲信息译码器(110)被配置为基于所述第一子状态数目,译码与所述第一音轨区划相关联的脉冲位置的一第一群组,及
其中,所述脉冲信息译码器(11)被配置为基于所述第二子状态数目,译码与所述第二音轨区划相关联的脉冲位置的一第二群组。
9.一种用以编码一音频信号的装置,所述装置包括:
一信号处理器(210),用以决定与所述音频信号相关联的多个预测滤波器系数,用以基于所述音频信号及所述多个预测滤波器系数而产生一残差信号;及
一脉冲信息编码器(220),用以编码与一或多个音轨相关的多个脉冲位置来编码所述音频信号,所述一或多个音轨是与所述残差信号相关联,所述音轨中的每一个具有多个音轨位置及多个脉冲,其中,所述脉冲位置中的每一个指示所述音轨中的一个的所述音轨位置中的一个来指示所述音轨的所述脉冲中的一个的位置,其中,所述脉冲信息编码器(220)被配置为通过产生一状态数目而编码所述多个脉冲位置,使得所述脉冲位置仅基于所述状态数目、指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、及指示所述音轨中的至少一个的脉冲总数的一总脉冲数目就能被译码。
10.根据权利要求9所述的用以编码的装置,其中,所述脉冲信息编码器(220)是适用以编码多个脉冲符号,其中,所述脉冲符号中的每一个指示所述多个脉冲中的一个的一符号,其中,所述脉冲信息编码器(220)被配置为通过产生所述状态数目而编码所述多个脉冲符号,使得所述脉冲符号仅基于所述状态数目、指示所述音轨中的至少一个的音轨位置总数的所述音轨位置数目、及所述总脉冲数目就能被译码。
11.根据权利要求9或10所述的装置,其中,所述脉冲信息编码器(220)被配置为针对所述音轨中的一个的各个音轨位置,将一整数值加至针对在一音轨位置的各个脉冲的一中间数目来获得所述状态数目。
12.根据权利要求9或10所述的装置,
其中,所述脉冲信息编码器(220)被配置为划分所述音轨中的一个成为包含所述多个音轨位置中的至少两个音轨位置的一第一音轨区划,及成为包含所述多个音轨位置中的至少另两个音轨位置的一第二音轨区划,
其中,所述脉冲信息编码器(220)被配置为编码与所述第一区划相关联的的一第一子状态数目,
其中,所述脉冲信息编码器(220)被配置为编码与所述第二区划相关联的的一第二子状态数目,及
其中,所述脉冲信息编码器(220)被配置为组合所述第一子状态数目与所述第二子状态数目而获得所述状态数目。
13.一种用以译码一编码音频信号的方法,其中,一或多个音轨是与所述编码音频信号相关联,所述音轨中的每一个具有多个音轨位置及多个脉冲,其中,所述方法是包含:
译码多个脉冲位置,其中,所述脉冲位置中的每一个指示所述音轨中的一个的所述音轨位置中的一个来指示所述音轨的所述脉冲中的一个的位置,及其中,所述多个脉冲位置是通过使用指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、指示所述音轨中的至少一个的脉冲总数的一总脉冲数目、及一个状态数目而被译码;及
通过使用所述多个脉冲位置及与所述编码音频信号相关联的多个预测滤波器系数而产生一合成音频信号来译码所述编码音频信号。
14.一种用以编码一音频信号的方法,所述方法是包含:
决定与所述音频信号相关联的多个预测滤波器系数,用以基于所述音频信号及所述多个预测滤波器系数而产生一残差信号;及
编码与一或多个音轨相关的多个脉冲位置来编码所述音频信号,所述一或多个音轨是与所述残差信号相关联,所述音轨中的每一个具有多个音轨位置及多个脉冲,其中,所述脉冲位置中的每一个指示所述音轨中的一个的音轨位置中的一个来指示所述音轨的所述脉冲中的一个的位置,其中,所述多个脉冲位置是通过产生一状态数目而被编码,使得所述脉冲位置仅基于所述状态数目、指示所述音轨中的至少一个的音轨位置总数的一音轨位置数目、及指示所述音轨中的至少一个的脉冲总数的一总脉冲数目就能被译码。
15.一种计算机程序,所述计算机程序当在一计算机或信号处理器上执行时实现根据权利要求13或14所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052294 WO2012110416A1 (en) | 2011-02-14 | 2012-02-10 | Encoding and decoding of pulse positions of tracks of an audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103460284A true CN103460284A (zh) | 2013-12-18 |
CN103460284B CN103460284B (zh) | 2016-05-18 |
Family
ID=71943601
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280016442.4A Active CN103460284B (zh) | 2011-02-14 | 2012-02-10 | 音频信号音轨脉冲位置的编码与译码 |
Country Status (19)
Country | Link |
---|---|
US (1) | US9595263B2 (zh) |
EP (3) | EP3471092B1 (zh) |
JP (1) | JP5800915B2 (zh) |
KR (1) | KR101643450B1 (zh) |
CN (1) | CN103460284B (zh) |
AR (1) | AR085361A1 (zh) |
AU (1) | AU2012217184B2 (zh) |
BR (1) | BR112013020700B1 (zh) |
CA (1) | CA2827156C (zh) |
ES (2) | ES2715191T3 (zh) |
HK (1) | HK1245987B (zh) |
MX (1) | MX2013009345A (zh) |
PL (3) | PL3239978T3 (zh) |
PT (2) | PT3239978T (zh) |
RU (1) | RU2586597C2 (zh) |
SG (1) | SG192747A1 (zh) |
TR (1) | TR201903388T4 (zh) |
WO (1) | WO2012110416A1 (zh) |
ZA (1) | ZA201306841B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
US10553228B2 (en) * | 2015-04-07 | 2020-02-04 | Dolby International Ab | Audio coding with range extension |
JP2022539217A (ja) | 2019-07-02 | 2022-09-07 | ドルビー・インターナショナル・アーベー | 離散指向性情報の表現、符号化、および復号化のための方法、装置、およびシステム |
US11088784B1 (en) | 2020-12-24 | 2021-08-10 | Aira Technologies, Inc. | Systems and methods for utilizing dynamic codes with neural networks |
US11483109B2 (en) | 2020-12-28 | 2022-10-25 | Aira Technologies, Inc. | Systems and methods for multi-device communication |
US11575469B2 (en) | 2020-12-28 | 2023-02-07 | Aira Technologies, Inc. | Multi-bit feedback protocol systems and methods |
US11368250B1 (en) | 2020-12-28 | 2022-06-21 | Aira Technologies, Inc. | Adaptive payload extraction and retransmission in wireless data communications with error aggregations |
US11489624B2 (en) | 2021-03-09 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets using lookup tables |
US11496242B2 (en) | 2021-03-15 | 2022-11-08 | Aira Technologies, Inc. | Fast cyclic redundancy check: utilizing linearity of cyclic redundancy check for accelerating correction of corrupted network packets |
US11489623B2 (en) | 2021-03-15 | 2022-11-01 | Aira Technologies, Inc. | Error correction in network packets |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020111799A1 (en) * | 2000-10-12 | 2002-08-15 | Bernard Alexis P. | Algebraic codebook system and method |
US20030078771A1 (en) * | 2001-10-23 | 2003-04-24 | Lg Electronics Inc. | Method for searching codebook |
CN101388210A (zh) * | 2007-09-15 | 2009-03-18 | 华为技术有限公司 | 编解码方法及编解码器 |
CN101483043A (zh) * | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
Family Cites Families (213)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE294441T1 (de) | 1991-06-11 | 2005-05-15 | Qualcomm Inc | Vocoder mit veränderlicher bitrate |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
CN1145928C (zh) | 1999-06-07 | 2004-04-14 | 艾利森公司 | 用参数噪声模型统计量产生舒适噪声的方法及装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) * | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
ES2269112T3 (es) | 2000-02-29 | 2007-04-01 | Qualcomm Incorporated | Codificador de voz multimodal en bucle cerrado de dominio mixto. |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
KR100464369B1 (ko) * | 2001-05-23 | 2005-01-03 | 삼성전자주식회사 | 음성 부호화 시스템의 여기 코드북 탐색 방법 |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
CA2388358A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
US7302387B2 (en) * | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
RU2331933C2 (ru) | 2002-10-11 | 2008-08-20 | Нокиа Корпорейшн | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) * | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100463559B1 (ko) * | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
KR100465316B1 (ko) * | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
KR20040058855A (ko) * | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
US7876966B2 (en) | 2003-03-11 | 2011-01-25 | Spyder Navigations L.L.C. | Switching between coding schemes |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
KR100556831B1 (ko) * | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
US7548852B2 (en) | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
CA2475282A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Volume hologram |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
CN1914669A (zh) | 2004-01-28 | 2007-02-14 | 皇家飞利浦电子股份有限公司 | 使用复数值数据的音频信号解码 |
AU2004317109B2 (en) | 2004-02-12 | 2008-05-22 | Core Wireless Licensing S.A.R.L. | Classified media quality of experience |
DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
WO2005096274A1 (fr) | 2004-04-01 | 2005-10-13 | Beijing Media Works Co., Ltd | Dispositif et procede de codage/decodage audio ameliores |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
MXPA06012617A (es) | 2004-05-17 | 2006-12-15 | Nokia Corp | Codificacion de audio con diferentes longitudes de cuadro de codificacion. |
JP4168976B2 (ja) | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
KR100656788B1 (ko) * | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
RU2405217C2 (ru) | 2005-01-31 | 2010-11-27 | Скайп Лимитед | Способ взвешенного сложения с перекрытием |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
CN100593197C (zh) | 2005-02-02 | 2010-03-03 | 富士通株式会社 | 信号处理方法和装置 |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
EP1864281A1 (en) | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
EP1905002B1 (en) | 2005-05-26 | 2013-05-22 | LG Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
EP1897085B1 (en) | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
CN101371297A (zh) | 2006-01-18 | 2009-02-18 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
JP5190363B2 (ja) | 2006-07-12 | 2013-04-24 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
CN102096937B (zh) | 2006-07-24 | 2014-07-09 | 索尼株式会社 | 毛发运动合成器系统和用于毛发/皮毛流水线的优化技术 |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
EP2054879B1 (en) | 2006-08-15 | 2010-01-20 | Broadcom Corporation | Re-phasing of decoder states after packet loss |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
PT2109098T (pt) | 2006-10-25 | 2020-12-18 | Fraunhofer Ges Forschung | Aparelho e método para gerar amostras de áudio de domínio de tempo |
DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
KR101016224B1 (ko) | 2006-12-12 | 2011-02-25 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 인코더, 디코더 및 시간 영역 데이터 스트림을 나타내는 데이터 세그먼트를 인코딩하고 디코딩하는 방법 |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
JP5241701B2 (ja) | 2007-03-02 | 2013-07-17 | パナソニック株式会社 | 符号化装置および符号化方法 |
EP2128855A1 (en) | 2007-03-02 | 2009-12-02 | Panasonic Corporation | Voice encoding device and voice encoding method |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
DE102007063635A1 (de) | 2007-03-22 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
DK2827327T3 (da) * | 2007-04-29 | 2020-10-12 | Huawei Tech Co Ltd | Fremgangsmåde til excitationsimpulskodning |
CA2691993C (en) | 2007-06-11 | 2015-01-27 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
ES2748843T3 (es) | 2007-08-27 | 2020-03-18 | Ericsson Telefon Ab L M | Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable |
JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
WO2009033288A1 (en) | 2007-09-11 | 2009-03-19 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
JP5302980B2 (ja) | 2008-03-04 | 2013-10-02 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 複数の入力データストリームのミキシングのための装置 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
ES2401487T3 (es) | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
CA2871498C (en) | 2008-07-11 | 2017-10-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
ES2379761T3 (es) | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
EP2345030A2 (en) | 2008-10-08 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-resolution switched audio encoding/decoding scheme |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
BR122019023704B1 (pt) | 2009-01-16 | 2020-05-05 | Dolby Int Ab | sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta |
ES2567129T3 (es) | 2009-01-28 | 2016-04-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de ordenador |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
CN102396024A (zh) | 2009-02-16 | 2012-03-28 | 韩国电子通信研究院 | 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备 |
EP2234103B1 (en) | 2009-03-26 | 2011-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for manipulating an audio signal |
KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
EP3352168B1 (en) | 2009-06-23 | 2020-09-16 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
US8635357B2 (en) | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
PL2473995T3 (pl) | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
TWI430263B (zh) | 2009-10-20 | 2014-03-11 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法 |
CA2862715C (en) | 2009-10-20 | 2017-10-17 | Ralf Geiger | Multi-mode audio codec and celp coding adapted therefore |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
CN103069484B (zh) | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
TW201214415A (en) | 2010-05-28 | 2012-04-01 | Fraunhofer Ges Forschung | Low-delay unified speech and audio codec |
FR2963254B1 (fr) | 2010-07-27 | 2012-08-24 | Maurice Guerin | Dispositif et procede pour laver des surfaces internes d?une enceinte |
EP2676268B1 (en) | 2011-02-14 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
AR085895A1 (es) | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
WO2013075753A1 (en) | 2011-11-25 | 2013-05-30 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
-
2012
- 2012-02-10 TR TR2019/03388T patent/TR201903388T4/tr unknown
- 2012-02-10 ES ES17171964T patent/ES2715191T3/es active Active
- 2012-02-10 PL PL17171964T patent/PL3239978T3/pl unknown
- 2012-02-10 AR ARP120100443A patent/AR085361A1/es active IP Right Grant
- 2012-02-10 AU AU2012217184A patent/AU2012217184B2/en active Active
- 2012-02-10 SG SG2013061379A patent/SG192747A1/en unknown
- 2012-02-10 ES ES12703123.5T patent/ES2639646T3/es active Active
- 2012-02-10 EP EP18209670.1A patent/EP3471092B1/en active Active
- 2012-02-10 EP EP17171964.4A patent/EP3239978B1/en active Active
- 2012-02-10 EP EP12703123.5A patent/EP2676267B1/en active Active
- 2012-02-10 PL PL12703123T patent/PL2676267T3/pl unknown
- 2012-02-10 CA CA2827156A patent/CA2827156C/en active Active
- 2012-02-10 PT PT17171964T patent/PT3239978T/pt unknown
- 2012-02-10 CN CN201280016442.4A patent/CN103460284B/zh active Active
- 2012-02-10 WO PCT/EP2012/052294 patent/WO2012110416A1/en active Application Filing
- 2012-02-10 BR BR112013020700-0A patent/BR112013020700B1/pt active IP Right Grant
- 2012-02-10 MX MX2013009345A patent/MX2013009345A/es active IP Right Grant
- 2012-02-10 PL PL18209670T patent/PL3471092T3/pl unknown
- 2012-02-10 PT PT127031235T patent/PT2676267T/pt unknown
- 2012-02-10 KR KR1020137024213A patent/KR101643450B1/ko active IP Right Grant
- 2012-02-10 RU RU2013142068/08A patent/RU2586597C2/ru active
- 2012-02-10 JP JP2013553882A patent/JP5800915B2/ja active Active
-
2013
- 2013-08-14 US US13/966,635 patent/US9595263B2/en active Active
- 2013-09-11 ZA ZA2013/06841A patent/ZA201306841B/en unknown
-
2018
- 2018-04-24 HK HK18105291.5A patent/HK1245987B/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020111799A1 (en) * | 2000-10-12 | 2002-08-15 | Bernard Alexis P. | Algebraic codebook system and method |
US20030078771A1 (en) * | 2001-10-23 | 2003-04-24 | Lg Electronics Inc. | Method for searching codebook |
CN101388210A (zh) * | 2007-09-15 | 2009-03-18 | 华为技术有限公司 | 编解码方法及编解码器 |
CN101483043A (zh) * | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103460284A (zh) | 音频信号音轨脉冲位置的编码与译码 | |
CN101815992A (zh) | 编码和/或解码数字内容 | |
EP2867892B1 (en) | Linear prediction based audio coding using improved probability distribution estimation | |
CN105723452A (zh) | 音频信号的频谱的频谱系数的编码 | |
KR20170118236A (ko) | 오디오/비디오 샘플 벡터의 피라미드 벡터 양자화 인덱싱 및 디인덱싱을 위한 방법 및 장치 | |
CN101622663B (zh) | 编码装置以及编码方法 | |
CN100578618C (zh) | 一种解码方法及装置 | |
CN101622665A (zh) | 编码装置以及编码方法 | |
CN106537500B (zh) | 周期性综合包络序列生成装置、周期性综合包络序列生成方法、记录介质 | |
CN101317218A (zh) | 用于频域波形对准的系统、方法和设备 | |
CN1173939A (zh) | 综合分析的语音编码方法 | |
CN101641734B (zh) | 对音频信号编码的方法和设备以及对音频信号解码的方法和设备 | |
CN1303508A (zh) | 语音编码的方法和装置 | |
US8660195B2 (en) | Using quantized prediction memory during fast recovery coding | |
US10199046B2 (en) | Encoder, decoder, coding method, decoding method, coding program, decoding program and recording medium | |
CN102132342A (zh) | 一种通过内插滤波器更新编码器的方法 | |
JP4918074B2 (ja) | 符号化装置、符号化方法、符号化プログラム、及び記録媒体 | |
Kabal | ITU-T G. 723.1 speech coder: A matlab implementation | |
CN105340010A (zh) | 用于通过应用分布量化和编码分裂音频信号包络的音频信号包络编码、处理和解码的装置和方法 | |
CN105431902A (zh) | 用于通过应用分布量化和编码建模累积和表示的音频信号包络编码、处理和解码的装置和方法 | |
CN101223580A (zh) | 用于搜索固定码本的方法和设备 | |
US20120020406A1 (en) | Method and apparatus for lossless encoding and decoding based on context | |
US20200349959A1 (en) | Audio coding method based on spectral recovery scheme | |
CN113904900B (zh) | 一种实时遥测信源分阶相对编码方法 | |
JP2019124951A (ja) | 快適雑音生成モード選択のための装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Munich, Germany Applicant after: Fraunhofer Application and Research Promotion Association Address before: Munich, Germany Applicant before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. |
|
COR | Change of bibliographic data | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |