CN102959620B - 利用重迭变换的信息信号表示 - Google Patents

利用重迭变换的信息信号表示 Download PDF

Info

Publication number
CN102959620B
CN102959620B CN201280001344.3A CN201280001344A CN102959620B CN 102959620 B CN102959620 B CN 102959620B CN 201280001344 A CN201280001344 A CN 201280001344A CN 102959620 B CN102959620 B CN 102959620B
Authority
CN
China
Prior art keywords
information signal
sampling rate
conversion
remap
subsequent sections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280001344.3A
Other languages
English (en)
Other versions
CN102959620A (zh
Inventor
马库斯·施内尔
拉尔夫·盖尔
埃曼努埃尔·拉维利
埃莱尼·福托普洛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN102959620A publication Critical patent/CN102959620A/zh
Application granted granted Critical
Publication of CN102959620B publication Critical patent/CN102959620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

一种被配置为来使用混叠抵消从信息信号的重迭变换表示重建该信息信号的信息信号重建器,对于该信息信号的各个连续的重迭区域包含各个区域的窗口版本的变换,其中,该信息信号重建器被配置为以在信息信号的先前区域84和后续区域86之间的边界82处变化的采样速率来重建该信息信号。该信息信号重建器包括:重新变换器70,被配置为对该先前区域84的窗口版本的变换94施加重新变换,从而获得该先前区域84的重新变换96,以及对该后续区域的窗口版本的变换施加重新变换,从而获得该后续区域86的重新变换100,其中,该先前区域84的重新变换96和该后续区域86的重新变换106在该先前区域与后续区域之间边界82处的混叠抵消部分102处重叠;重新采样器72,被配置为根据在该边界82处的采样速率变化,通过内插在该混叠抵消部分102处对先前区域84的重新变换96和/或后续区域86的重新变换100进行重新采样;以及组合器74,被配置为在作为通过在混叠抵消部分102处重新采样而获得的先前区域84和后续区域86的重新变换96、100之间执行混叠抵消。

Description

利用重迭变换的信息信号表示
技术领域
本申请涉及使用重迭变换的信息信号表示,更具体地涉及使用要求例如用在音频压缩技术中的混叠抵消的信息信号的重迭变换表示的信息信号的表示。
背景技术
大部分的压缩技术被设计为用于信息信号的特定类型以及压缩数据流的特定的传输条件,诸如最大容许延迟及可用的传输位元率。例如,在较高可用位率的情况下及以编码音乐而非编码语音的情况下,在音频压缩中,以变换为基础的编译码器诸如AAC趋于优于以线性预测为基础的时域编译码器诸如ACELP。例如,USAC编译码器寻求通过将不同音频编码原则统一在一个编译码器内而涵盖应用景况的更大的变化。然而,更进一步提高对不同编码状况诸如变动的可用传输位元率的适应性以能够利用该适应性的优点来获得例如更高的编码效率等将更为有利。
发明内容
因此,本发明的目标在于提出这样的构思:通过提供重迭变换信息信号表示方案,该方案使得通过要求混叠抵消的重迭变换表示来表示信息信号,从而使得可以将重迭变换表示调整适于实际需求,从而提供获得更高编码效率的可能性。
该目标通过本发明的一个方面的主题而达到,本发明的一个方面提供了一种被配置为使用混叠抵消从信息信号的重迭变换表示来重建所述信息信号的信息信号重建器,对于所述信息信号的各个连续重迭区域,包含各区域的窗口版本的变换,其中,所述信息信号重建器被配置为以在所述信息信号的先前区域(84)和后续区域(86)之间的边界(82)处变化的采样速率来重建所述信息信号,其中,所述信息信号为音频信号,所述信息信号重建器包括:重新变换器(70),被配置为对所述先前区域(84)的所述窗口版本的变换(94)施加重新变换以从而获得所述先前区域的重新变换(96),并对所述后续区域(86)的所述窗口版本的变换施加重新变换以从而获得所述后续区域(86)的重新变换(100),其中,所述先前区域(84)的所述重新变换(96)和所述后续区域(86)的所述重新变换(106)在所述先前区域和所述后续区域之间的所述边界(82)处的混叠抵消部分(102)处重叠;重新采样器,被配置为根据在所述边界(82)处的采样速率变化,通过内插而对在所述混叠抵消部分(102)处的所述先前区域(84)的所述重新变换(96)和/或所述后续区域(86)的所述重新变换(100)进行重新采样;以及组合器,被配置为在作为通过在所述混叠抵消部分(102)处重新采样而获得的所述先前区域和所述后续区域(84,86)的重新变换(96,100)之间执行混叠抵消。
引领至本发明的主要思考如下。通常使用信息信号的重迭变换表示以就例如速率/失真比而言,形成有效编码所述信息信号的前驱态。这样的编译码器的实例为AAC或TCX等。然而,重迭变换表示也可以被用来通过以不同频谱分辨率而级联变换和重新变换来执行重新采样。一般而言,造成在该信息信号的连续时间区域的窗口版本的变换的各个重新变换在重迭部分混叠的重迭变换表示就欲编码而表示该重迭变换表示的变换系数位的数目较低而言具有优点。在极端形式中,重迭变换为“临界采样”。即,与该信息信号的时间样本的数目相比,不会增加该重迭变换表示中的系数的数目。重迭变换表示的一个实例为MDCT(修正离散余弦变换)或QMF(正交镜像滤波器)滤波器组。因此,将这样的重迭变换表示用作有效率地编码信息信号中的前驱态通常是有利的。然而,能够允许该信息信号使用该重迭变换表示来表示的采样速率即时改变,从而调整为适于例如可用传输位元率或其它环境状况。设想改变的可用传输位元率。每当可用传输位元率降至低于某个预定临界值时,例如降低采样速率是有利的,而当可用传输位元率再次升高时,则能够提高重迭变换表示表示该信息信号的采样速率将是有利的。不幸地,重迭变换表示的重新变换的重迭混频部分似乎形成妨碍这样的采样速率改变的障碍,在采样速率变化的情况下,该障碍似乎只有通过完全地中断重迭变换表示才能克服。然而,本发明的发明人获得了上述问题的解决方案,从而使得能够有效使用涉及所考虑的混叠及采样速率变的重迭变换表示。具体地,通过内插,信息信号的先前区域和/或后续区域根据在两区域之间的边界处的采样速率变化在混叠抵消部分处被重新采样。然后组合器能够在作为通过在混叠抵消部分重新采样而获得的先前区域和后续区域的重新变换之间的边界处执行混叠抵消。通过该措施,采样速率变化被有效地克服,避免采样速率变化/转变处的任何重迭变换表示的不连续。在变换端相似手段也是可行的以从而适当地产生重迭变换。
运用前述概念,可以提供信息信号压缩技术,诸如音频压缩技术,通过将传输采样速率调整适于环境编码状况,其在宽范围的环境编码状况诸如可用传输带宽上具有高的编码效率,而没有采样速率变化实例本身带来的不利结果。
附图说明
本发明的具有优势的方面为审查中的权利要求组的从属权利要求的主题。此外,以下相对于附图描述了本发明的优选实施方式,其中:
图1a示出了可实现本发明的实施例的信息编码器的框图;
图1b示出了可实现本发明的实施例的信息信号译码器的框图;
图2a示出了图1a的核心编码器的可能的内部结构的框图;
图2b示出了图1b的核心译码器的可能的内部结构的框图;
图3a示出了图1a的重新采样器的可能实现的框图;
图3b示出了图1b的重新采样器的可能的内部结构的框图;
图4a示出了可实现本发明的实施例的信息信号编码器的框图;
图4b示出了可实现本发明的实施例的信息信号译码器的框图;
图5示出了根据实施例的信息信号重建器的框图;
图6示出了实施例的信息信号变换器的框图;
图7a示出了根据又一实施例的信息信号编码器的框图,在该实施例中使用根据图5的信息信号重建器;
图7b示出了根据又一实施例的信息信号译码器的框图,在该实施例中使用根据图5的信息信号重建器;
图8示出了根据实施例的出现在图6a和图6b的信息信号编码器和译码器中的采样速率切换情况的示意图。
具体实施方式
为了激励本发明的以下进一步描述的实施例,首先,可在本申请的实施例被使用的范围内讨论实施例,这使得以下进一步描述的本申请的实施方式的意图和优点更加清晰。
图1a和图1b例如示出了一对编码器和译码器,其中,可有利地使用随后说明的实施例。图1a示出了编码器而图1b示出了译码器。图1a的信息信号编码器10包含输入信息信号的输入12、重新采样器14以及核心编码器16,其中,重新采样器l4和核心编码器16串接在编码器10的输入12和输出18之间。在输出18处,编码器10输出表示输入12的信息信号的数据流。同理,图1b中以参考标号20示出的译码器包含核心译码器22,以及以图1b所示的方式串接在译码器20的输入26和输出28之间的重新采样器24。
如果用来将在输出18处的数据流传输至译码器20的输入26的可用传输位元率为高,则就编码效率而言,以高采样速率在数据流内表示信息信号12是有利的,从而覆盖信息信号频谱的宽的频带。即,编码效率测量诸如速率/失真比测量可揭示当与信息信号12的较低采样速率版本的压缩相比时,若核心编码器16以较高采样速率来压缩输入信号12,则编码效率较高。另一方面,在较低的可用传输位元率情况下,当以较低的采样速率对信息信号12进行编码时,可能出现编码效率测量为较高。就这点而言,应该注意的是,可以心理声学激励方式来测量失真,即,比较知觉上较不相关的频率区域,即,人耳例如较不敏感的频率区域,考虑在知觉上较为相关的频率区域失真较为敏感。一般而言,低频区倾向于比高频区更为相关,因此,较低采样速率编码排除位于尼奎斯特(Nyquist)频率之上的输入12处的信号的频率成分被编码,但另一方面,从其中所得位率节省,就速率/失真比而言,结果导致此种较低采样速率编码优于较高采样速率编码。较低与较高频部分之间的就失真意义而言同样的不相一致也存在于其它信息信号,诸如测量信号等中。
因此,重新采样器14用来改变信息信号12的采样速率。通过依据外部传输状况诸如由输出18和输入26之间的可用传输位元率限定等适当地控制采样速率,编码器10能够获得提高的编码效率,尽管外部传输状况随时间而改变。译码器20包括核心译码器22,核心译码器22解压缩数据流,其中,重新采样器24再度要求在输出28处的重建的信息信号输出具有不变的采样速率。
然而,每当重迭变换表示用在图1a和图1b的成对编码器/译码器时就会导致问题。涉及在重新变换的重迭区域处混叠的重迭变换表示形成用于编码的有效工具,但由于必要的时间混叠抵消故,若采样速率改变则出现问题。例如,参考图2a和图2b。图2a和图2b示出了对于核心编码器16和核心译码器22可能的实现,假设二者均为变换编码型。从而,核心编码器16包括变换器30,其后为压缩器32,图2b图中所示核心译码器包括解压缩器34,其后相应的为重新变换器36。图2a和2b不应被解译为并无其它模块存在于核心编码器16和核心译码器22内的程度。例如,滤波器可位于变换器30前方,从而使得变换器30并非直接地变换通过重新采样器14所得的重新采样信息信号,而是以预滤波形式变换。同样地,具有反变换功能的滤波器可位于重新变换器36后方,从而使得重新变换信号能够被顺序地反滤波。
压缩器32可压缩通过变换器30输出的所得重迭变换表示,诸如通过使用无损耗编码,诸如熵编码,包含如霍夫曼(Huffman)编码或算术编码的实例,解压缩器34可进行反处理,即,通过熵译码,诸如霍夫曼译码或算术译码,获得重迭变换表示,其然后馈至重新变换器36。
在2a和图2b中所示的变换编码环境中,每当重新采样器14改变采样速率时则出现问题。在编码端问题不太严重,原因在于存在有信息信号12,因此,变换器30可被提供以使用各个区域的窗口版本的用于各变换的连续采样区域,即便横跨采样速率变化情况。从而,实现变换器30的可能实施例在下文中参照图6作出描述。通常,变换器30可被以当前采样速率提供有信息信号的先前区域的窗口版本,然后变换器30通过重新采样器14提供以该信息信号之下个部分重迭区域,然后通过变换器30产生其窗口版本的变换。不会出现另外的问题,原因在于必要的时间混叠抵消必需在重新变换器36处进行而非在变换器30处进行。然而,在重新变换器36处,采样速率的变化所引起的问题在于,由于前述紧接其后的区域的重新变换涉及不同的采样速率,所以重新变换器36不能执行时间混叠抵消。进一步详述的实施例克服了这些问题。依据这些实施例,重新变换器36可由以下进一步描述的信息信号重建器代替。
然而,在相对于图1a和图1b所描述的环境中,问题不仅出现在核心编码器16和核心译码器22为变换编码型的情况。反而,问题也可能出现在使用以重迭变换为基础的滤波器组分别地用来形成重新采样器14及24的情况。例如参考图3a和图3b。图3a和图3b示出了用来实现重新采样器14和24的一个特定实施例。根据图3a和图3b图的实施例,两个重新采样器分别通过使用后分别跟随滤波器组32和44的分析滤波器组38和40的级联(concatenation)而实现。如图3a和图3b所示,分析和合成滤波器组38至40可实现为QMF滤波器组,即,以MDCT为基础的滤波器组,使用QMF来事先分裂信息信号,及然后再度重新接合信号。QMF可以类似于用在MPEG HE-AAC或AAC-ELD的SBR部分中的QMF来实现,表示具有10区块重叠的多信道调制滤波器组,其中,10仅为一实例。因此,通过分析滤波器组38和40产生重迭变换表示,以及在合成滤波器组42和44之情况下,从该重迭变换表示重建重新采样信号。为了获得采样速率变化,合成滤波器组42及分析滤波器组40可被实现为以变化的变换长度操作,但其中,滤波器组或QMF速率,即,一方面通过分析滤波器组38和40分别产生连续变换的速率,以及另一方面,通过合成滤波器组42和44所作重新变换的速率不变且对于全部组件38至44均为相同。然而,改变变换长度导致采样速率变化。例如,考虑成对的分析滤波器组38和合成滤波器组42。假设分析滤波器组38使用不变的变换长度和不变的滤波器组或变换速率操作。在这种情况下,对于具有不变样本长度的输入信号的连续的重迭区域的每一个,通过分析滤波器组38输出的输入信号的重迭变换表示包括各区域的窗口版本的变换,所述变换同样具有不变的长度。换言之,分析滤波器组38向合成滤波器组42转发不变的时/频分辨率的光谱图。然而,合成滤波器组的变换长度将改变。例如,考虑从在分析滤波器组38的输入处的输入采样速率与合成滤波器组42的输出处的输出信号的采样速率之间的第一下采样速率至第二下采样速率的下采样情况。只要第一下采样速率是有效的,则由分析滤波器组38输出的重迭变换表示或光谱图将仅部分用来馈送合成滤波器组42内部的重新变换。合成滤波器组42的重新变换将仅仅施加至分析滤波器组38的光谱图内的连续变换的低频部分。由于用在合成滤波器组42的重新变换中的较低的变换长度,比较已经以重迭时间部分的簇集而接受滤波器组38中变换的样本数目,合成滤波器组42的重新变换内部的样本数目也将较低,因而比较进入分析滤波器组38的输入的信息信号的原先采样速率,结果导致较低采样速率。只要下采样速率维持相同则没问题,仿佛合成滤波器组42在滤波器组42的输出端的该输出信号的连续重新变换与连续重迭区域之间重迭进行时间混叠抵消那样没问题。
每当下采样速率改变,诸如从第一下采样速率改变为第二较大的下采样速率时出问题。在这种情况下,用在合成滤波器组42的重新变换内部的变换长度将进一步缩短,从而导致在采样速率变化时间点之后,各随后区域的采样速率甚至更低。对于合成滤波器组42,再度出现问题,原因在于,有关紧接在采样速率变化时间点之前的该区域的重新变换与有关紧接在采样速率变化时间点之后的该区域的重新变换之间的时间混叠抵消干扰所关注的重新变换之间的时间混叠抵消。因此,不太有帮助的是,类似问题不会出现在解码端,其中,具有变化的变换长度的分析滤波器组40位于具有不变的变换长度的合成滤波器组44之前。这里,合成滤波器组44施加至不变的QMF/变换率的光谱图,但具有不同频率分辨率,即,连续变换以不变的速率从分析滤波器组40转发至合成滤波器组44,但具有不同的或时变的变换长度,来保留合成滤波器组44的整个变换长度的低频部分,而整个变换长度的高频部分以零填补。由合成滤波器44输出的连续的重新变换之间的时间混叠抵消不成问题,原因在于在合成滤波器组44的输出端处输出的重建信号的采样速率具有不变的采样速率。
因此,尝试实现相对于图1a和图1b描述的采样速率变化/调适有问题,但这些问题可根据用于信息信号重建器的一些随后的示例性实施例,通过实现图3a的反滤波器组或合成滤波器组42来解决。
当考虑编码构思时,上述关于采样速率调适/变化的想法甚至更令人关注,其中,根据所述编码构思,将被编码的信息信号的高频部分被以参数的方式,例如,通过使用谱带复制器(SBR)编码,而其低频部分利用变换编码和/或预测编码等被编码。例如,参考示出了一对信息信号编码器和信息信号译码器的图4a和4b。在编码侧,核心编码器16位于重新采样器之后,如图3a所示的实施例,即,分析滤波器组38与变化的变换长度合成滤波器组42的级联。如上所述,为了获得分析滤波器组38的输入与合成滤波器组42的输出之间的时变下采样速率,合成滤波器组42将其重新变换施加至由分析滤波器组38所输出的不变的范围频谱的一小部分,即,不变长度及不变变换率的变换46,其中,该小部分具有合成滤波器组42的变换长度的时变长度。通过双箭头48示出时变。通过分析滤波器组38和合成滤波器组42的级联而被重新采样的低频部分50通过核心编码器16被编码,其余部分,即,组成频谱46的其余频率部分的高频部分52可以在参数包络编码器54内受到其包络的参数编码。因此,核心数据流56伴有由参数包络编码器54所输出的参数编码数据流58。
在解码侧,译码器同样地包括核心译码器22,所述可信译码器由如图3b中所示实现的重新采样器跟随,即,由分析滤波组40(由合成滤波组44)跟随,分析滤波器组40具有与编码侧的合成滤波器组42的变换长度的时变同步的时变变换长度。当核心译码器22接收核心数据流56以解码时,设置参数包络译码器60以接收参数数据流58,并从中获取与变化的变换长度,即,与由在编码侧的合成滤波器组42所使用的变换长度的时变同步且与由核心译码器22输出的采样速率变化同步的长度,的低频部分50互补的高频部分52’。
在图4a的编码器的情况下,有利的是存在分析滤波器组38从而使得重新采样器的形成只需添加合成滤波器组42。通过切换采样速率,可调整适应频谱46的低频(LF)部分的比率,与仅受到参数包络编码的高频(HF)部分相比,所述LF部分受到更准确的核心编码。具体地,可以以取决于外部状况,诸如用来传输总数据流等的可用传输带宽,的有效方式来控制所述比率。在编码端控制的时变透过个别侧边信息数据(举例)容易信号化至译码瑞
因此,关于图1a至图4b,已经示出,若有一种构思:尽管使用需要时间混叠抵消的重迭变换表示,仍可有效地使得采样速率变化,则为有利的。图5示出了信息信号重建器的实施例,如果将所述重建器用来实现图2b中的合成滤波器组42或重新变换器36,则可克服前述问题并获得利用上述的这样的采样速率变化的优点的优势。
图5中所示的信息信号重建器包含重新变换器70、重新采样器72以及组合器74,它们以上述顺序依次串联在信息信号重建器80的输入76与输出78之间。
图5所示的信息信号重建器用来使用混叠抵消从进入输入76的信息信号重迭变换表示重建所述信息信号。即,信息信号重建器利用如进入输入76的该信息信号的重迭变换表示而以时变采样速率来在输出78输出所述信息信号。对于信息信号的各个连续的重迭时间区域(或时间间隔),该信息信号的重迭变换表示包括各个区域的窗口版本的变换。如下文将详细描述的,信息信号重建器80被配置为以在信息信号90的先前区域84和后续区域86之间的边界82处变化的采样速率来重建该信息信号。
为了说明信息信号重建器80的各个模块70至74的功能,初步假设在输入76进入的信息信号的重迭变换表示具有不变的时/频分辨率,即,时分辨率在时间和频率中时不变的。后来讨论另一种情况。
根据刚提及的假设,重迭变换表示可视为如图5中92所示。如图所示,重迭变换表示包括在时间上以某个变换率Δt连续的变换序列。每个变换94表示所述信息信号各个时间区域i的窗口版本的变换。具体地,对于表示92,由于频率分辨率在时间上是不变的,所以每个变换94包括恒定数目的变换系数,即,Nk。这有效地表示所述表示92为包括Nk个频谱成分或子带的所述信息信号的光谱图,所述频谱成分或子带可严格地沿着频谱轴k排序,如图5所示。在每个频谱成分或子带中,光谱图内的变换系数以变换率Δt出现。
如图3a所示,具有这样的不变的时/频分辨率的重迭变换表示92例如通过QMF分析滤波器组输出。在这种情况下,每个变换系数将为复数值,即,每个变换系数例如具有实部和虚部。然而,重迭变换表示92的变换系数不必是复数值,也可以仅为单个的实数值,诸如在纯粹的MDCT的情况下。此外,应该注意的是,图5的实施例也可转移至引起在时间区域中的重迭变换表示处的混叠的其他重迭变换表示,其变换94连续地排列在重迭变换表示92内。
重新变换器70被配置为对变换94施加重新变换,使得对于每一个变换94,以获得连续的时间区域84和86的由相应的时间包络96示出的重新变换,所述时间包络粗略地对应于施加至前述信息信号的时间部分以获得变换94序列的窗口。考虑先前时间区域84,图5假设重新变换器70已将重新变换施加至重迭变换表示92中与时间区域84相关联的整个变换94,从而使得时间区域84的重新变换96包括例如Nk个样本或两倍Nk个样本-总之,与组成获得各变换94的窗口部一样多的样本-以一个因子对时间区域84的整个时间长度At.A进行采样,所述因子为以产生表示92的变换94为单位确定连续时间区域之间的重叠的因子。应该注意的是,时间区域84内部的时间样本数目与属于该时间区域84的变换94内的变换系数的数目等数(或倍数)仅选择用于示例的目的,根据所使用的具体重迭变换,等数(或倍数)也可由二个数目之间的另一恒定比率代替。
现在假设信息信号重建器寻求改变时间区域84与时间区域86之间的信息信号采样速率。这样做的动机系基于外部信号98。例如,如果信息信号重建器80被用来分别实现图3a和图4a的合成滤波器组42,则每当采样速率变化允许更有效的编码时,诸如数据流的传输状况的改变过程时,可提供信号98。
在该情况下,作为示例性目的,假设信息信号重建器80寻求降低时间区域84与86之间的采样速率。因此,重新变换器70还对后续区域86的窗口版本的变换施加重新变换,以从而获得用于后续区域86的重新变换100,但这次重新变换器70使用较低的变换长度来执行重新变换。为了更精确,重新变换器70对后续区域86的变换的变换系数的最低Nk’<Nk,,即,变换系数1…Nk’执行重新变换,使得所得的重新变换100包较低的采样速率,即,只以Nk’采样而非以Nk(或后者数目的对应分数)采样。
如图5所示,重新变换96与100之间出现的问题如下。先前区域84的重新变换96和后续区域86的重新变换100在先前区域84与后续区域86之间的边界82处的混叠抵消部分102处重叠,混叠抵消部分的时间长度为(a–1)·Δt,但在此混叠抵消部分102内的重新变换96的样本数目与在相同混叠抵消部分102内的重新变换100的样本数目不同(恰在本例中为较高)。因此,通过在时间间隔102内执行重叠相加两个重新变换96和100而执行的时间混叠抵消不是直接的。
因此,重新采样器72被连接在重新变换器70与组合器74之间,后者负责执行时间混叠抵消。具体地,重新采样器72被配置为依据边界82处的采样速率变化通过内插对混叠抵消部分102处的先前区域84的重新变换96和/或后续区域86的重新变换100进行采样。由于重新变换96比重新变换100更早到达重新采样器72的输入端,故重新采样器72优选地对先前区域84的重新变换96执行重新采样。即,通过内插104,包含在混叠抵消部分102内的重新变换96的对应部分将被重新采样,以从而对应于相同混叠抵消部分102内的重新变换100的采样条件或样本位置。然后组合器74仅将来自重新变换96和重新变换100的重新采样版本的共同定位样本相加,从而以新的采样速率获得时间间隔102内的重建信号90。在这种情况下,输出重建信号中的采样速率将从前者切换至在时间部分86的前端(起点)处的新的采样速率。但内插也可不同地用于施加于时间间隔102的前半部分和后半部分,以从而达到重建信号90中的用于采样速率切换的另一个时间点82。因此,时间瞬间82在图5中绘成在部分84与86之间的重叠的中间仅是示例性目的,依据其它实施例,相同时间点可位部分86的起点与部分84的终点(包括两端点)之间的某个位置。
因此,组合器74然后能够执行分别用于先前和后续区域84和86的重新变换96和100之间的混叠抵消,如在混叠抵消部分102处通过重新采样而获得。更确切地,为了抵消混叠抵消部分102内的混叠,组合器74使用通过重新采样器72所获得的重新采样版本而在部分102内的重新变换96和100之间执行重叠相加处理。随着用来产生变换94的开窗,即便信息信号90的采样速率在时间瞬间82处从较高的采样速率变化至较低的采样速率,甚至跨过边界82,重叠相加处理仍在输出78处获得无重叠和恒定放大的信息信号的重建。
因此,从图5的上述描述可知,施加至先前时间区域84的窗口版本的变换94的重新变换的变换长度与先前时间区域84的时间长度的比率与施加至后续时间区域86的窗口版本的变换94的重新变换的变换长度与后续时间区域86的时间长度的比率相差一个因子,所述因子对应于两个时间区域84与86之间的边界82处的采样速率变化。在上述实例中,该比率变化示例性地由外部信号98发起。先前和后续时间区域84和86的时间长度已经被假设为彼此相等,重新变换器70被配置为将对后续区域86的窗口版本的变换94施加的重新变换限制在其低频部分上,例如至多至变换的第Nk’个变换系数。当然,这样的获取还已经相对于先前时间区域84的窗口版本的变换94而进行。此外,与上述相反,边界82处的采样速率变化也可以以另一个方向执行,因此,不用相对于后续区域86执行获取,而仅仅相对于先前时间区域84的窗口版本的变换94进行获取。
更确切地,到目前为止,已经示例性地描述了图5的信息信号重建器的操作模式以用于如下情况,其中,信息信号的区域的窗口版本的变换94的变换长度和信息信号的区域的时间长度是不变的,即,重迭变换表示92为具有不变的时/频分辨率的光谱图。为了定位边界82,示例性地描述信息信号重建器80以响应于控制信号98。
因此,在该配置中,图5的信息信号重建器80可以是图3a的重新采样器14的一部分。换言之,图3a的重新采样器14可以由用来提供信息信号的重迭变换表示的滤波器组38和包含信息信号重建器80的反滤波器组组成,所述信息信号重建器80被配置为使用混叠抵消而从至此所描述的信息信号的重迭变换表示重建该信息信号。图5图的重新变换器70因此可被配置为QMF合成滤波器组,例如可以将滤波器组38系实现为QMF分析滤波器组。
从图1a和4a的描述可以清楚看出,信息信号编码器可包括这样的重新采样器和诸如核心编码器16或聚集核心编码器16以及参数包络编码器540的压缩级。所述压缩级可以被配置为压缩重建的信心信号。如图1a和4a所示,这样的信息信号编码器可进一步包括采样速率控制器,例如,所述采样速率控制器被配置为依据关于可用传输位元率的外部信息来控制控制信号98。
然而,可选地,图5的信息信号重建器可被配置为通过检测重迭变换表示内的信息信号的区域的窗口版本的变换长度的变化来定位边界820。为了使该可能的实现更清晰,参考图5的92’,其中,示出了入站重迭变换表示,据此,表示92’内的连续变换94仍以不变的变换率Δt到达重新变换器70处,但各变换的变换长度改变。在图5中,例如,假设先前时间区域84的窗口版本的变换的变换长度(即,Nk)大于后续时间区域86的窗口版本的变换的变换长度(其被假设仅为Nk’)。重新变换器70能够正确地解析来自输入数据流的关于重迭变换表示92’的信息,并因此重新变换器70可将施加至信息信号的连续区域的窗口版本的变换的重新变换的变换长度调整适于重迭变换表示92的连续变换的变换长度。因此,重新变换器70可使用先前时间区域84的窗口版本的变换94的重新变换的变换长度Nk以及后续时间区域86的窗口版本的变换的重新变换的变换长度Nk’,从而获得以上已经描述的并在图5的中上部分示出的重新变换之间的采样速率差。因此,除了将变换长度的重新变换调整适于重迭变换表示92’内的变换的变换长度的上述差异之外,只要考虑图5的信息信号重建器80的操作模式,该操作模式就符合以上所述。
因此,根据后者的功能,信息信号重建器无需响应于外部控制信号98。而是,入站重迭变换表示92’即足够以通知信息信号重建器采样速率变化的时间点。
可以使用如上所述的信息信号重建器80以形成图2b的重新变换器36。即,信息信号译码器可包括被配置为从数据流重构信息信号的重迭变换表示92的解压缩器34。如上所述,重建可涉及熵解码。变换94的时变变换长度可以适当方式在进入解压缩器34的数据流内被通知。图5中所示的信息信号重建器可用被作为重建器36。同样也可被配置为使用混叠抵消而从如通过解压缩器34所提供的重迭变换表示而重建信息信号。在后者的情况下,例如,重新变换器70可被执行为使用IMDCT以执行重新变换,变换94可由实数值系数而非复数值系数表示。
因此,上述实施例使得能够获得许多优点。对于以在整个元率范围内,例如,从每秒8kb至每秒128kb的操作的音频编译码器而言,最佳采样速率可取决于上述已经相对于图4a和图4b描述的位率。对于较低的位率,例如只有低频可以更准确的编码方法例如ACELP或变换编码而编码,而高频应以参数方式编码。对于高位率,整个频谱例如可以准确方法编码。这例如意味着,这些准确方法应通常以最佳表示编码信号。这些信号的采样速率须经最佳化,允许依据尼奎斯特原理传送最相关的信号频率成分。因此,参看图4a。这里所示的采样速率控制器120可以被配置为取决于可用传输位元率,控制信息信号馈入核心编码器16的样本位率。这对应于只将分析滤波器组频谱的低频子部分馈进核心编码器16。其余高频部分可馈进参数包络编码器54。如上所述,采样速率和传输位元率的时间变化不成问题。
图5的描述关注于可以被使用以处理在采样速率变化时的时间混叠抵消的问题的信息信号重建。如上述已经相对于图1至图4b所提及的,在图l至图4b的情况中连续模块之间的界面必须采取一些措施,其中,变换器产生重迭变换表示,然后输入图5的信息信号重建器。
图6示出了信息信号变换器的这样的实施例。图6的信息信号变换器包括:用来以样本序列的形式接收信息信号的输入105;被配置为获取信息信号的连续的重迭区域的获取器106;被配置为将重新采样至少施加至连续的重叠区域的子集从而使得每一个连续的重叠区域具有不变的采样速率的重新采样器107,然而其中,不变的采样速率在连续的重叠区域中变化;被配置为对连续的重叠区域施加开窗的窗口器108;以及被配置为对窗口部分单独施加变换以获得形成重迭变换表示92’的变换序列94的变换器,其中,所述变换序列然后在图6的信息信号变换器的之输出110处被输出。窗口器108可使用汉明(Hamming)开窗等。
获取器106可被配置为执行获取,从而使得信息信号的连续的重迭区域具有相等的时间长度,诸如各20毫秒。
因此,获取器106将信息信号部分的序列转发给重新采样器107。假设入站信息信号具有以预定时间瞬间从第一采样速率切换至第二采样速率的时变采样速率,例如,则重新采样器107可被配置为通过内插而对时间上涵盖该预定时间瞬间的入站信息信号部分进行重新采样,从而使得连续样本速率从第一采样速率至第二采样速率变化一次,如图6中的111处所示。为了更清晰,图6示意性地示出了样本序列112,其中,采样速率以某个时间瞬间113切换,其中,不变的时间长度区域114a至114d被不变的区域偏移值115Δt获取,所述区域偏移值和不变的区域时间长度一起限定了连续区域114a至114d之间的预定重叠,诸如所述区域的每连续对的50%的重叠,尽管这仅被理解为一个实例。在时间瞬间113之前的第一采样速率已δt1示出,在时间瞬间113之后的采样速率由δt2表示。如在111处所示,重新采样器107例如可被配置为对区域114b进行重新采样,因而有不变的采样速率δt1,然而其中,时间上连续的后续区域114c被重新采样以具有不变的采样速率δt2。原则上,若重新采样器107通过内插对尚未具有目标采样速率而时间上涵盖时间瞬间113的各区域114b和114c的子部分进行重新采样就够了。例如,在区域114b的情况下,若重新采样器107对时间上超过时间瞬间113的其子部分进行重新采样就够了;而在区域114c的情况下,可以只重新采样在时间瞬问113之前的子部分。在这种情况下,由于获取区域114a至114d的不变的时间长度,各个重新采样区域具有相对应于各不变的采样速率δt1,2的时间样本数目N1,2。窗口器108可将其窗口或窗口长度调整适于各入站部分的该样本数目,同等适用于变换器109,其因此可调整其变换的变换长度。即,在图6的111处示出的实例的情况下,在输出110处的重迭变换表示具有变换序列,其变换长度依据连续区域的样本数目,相应地依据各区域已经被重新采样的不变的采样速率而线性地变化,即,增减。
应该注意的是,重新采样器107可被配置为使得连续区域114a至114d之间的采样速率变化亦排齐,从而使得在各区域内部必须重新采样的样本数目为最小。然而,可选地,重新采样器107可以被不同地配置。例如,重新采样器107可以被配置为优先向上采样而非下采样,或反之亦然,即,执行重新采样从而使得与时间瞬间113重迭的全部区域被以第一采样速率δt1或第二采样速率δt2进行重新采样。
例如,可以使用图6的信息信号变换器以实现图2a的变换器30。在这种情况下,例如,变换器109可被配置为执行MDCT。
关于此,应该注意的是,由变换器109施加的变换的变换长度甚至可以大于以多个重新采样的样本测量的区域114c的大小。在这种情况下,延伸超出由窗口器108输出的窗口区域的变换长度的区域在通过变换器109施加变换前可设定为零。
在进一步详细描述用来实现图5的内插104以及图6的重新采样器107内的内插的可能实现之前,参照示出了用于图1a和图1b的编码器和译码器的可能实现的图7a和图7b。具体地,重新采样器14和24被实施为如图3a和3b所示,而核心编码器16及核心译码器22分别被实施为能够在一方面以MDCT为基础的变换编码和另一方面CELP编码诸如ACELP编码之间进行切换的编译码器。以MDCT为基础的编码/译码分支122和124分别地例如可以是TCX编码器和TCX译码器。可选地,可使用AAC编码器/译码器对。对于CELP编码,ACELP编码器126可形成核心编码器16的另一编码分支,而ACELP译码器128可形成核心译码器22的另一解码分支。两个编码分支之间的切换可以逐帧为基础进行,如同USAC[2]或AMR-WB+[1]的情况,有关这些编码模块的进一步细节请参考标准文献。
将图7a和图7b的编码器和译码器作为又一特例,允许输入编码分支122和l26以及通过译码分支124和128重建的内部采样速率的切换方案在以下进行详细的描述。具体地,在输入12处进入的输入信号具有不变的采样速率,诸如32kHz。可以以上述方式使用QMF分析和合成滤波器组对38和42对信号进行重新采样,即,具有有关带数的适当的分析和合成比率,诸如1.25或2.5,结果导致内部时间信号进入具有例如25.6kHz或12.8kHz的专用采样速率的核心编码器16。因此使用编码模式的编码分支中的任一个,诸如在编码分支122的情况下使用MDCT表示和标准变换编码方案,或例如在编码分支126时在时域中使用ACELP来对下采样信号进行编码。由此通过核心编码器16的编码分支l26和122所形成的数据流被输出及传送至解码侧,以接受重建。
为了切换内部采样速率,滤波器组38至44必须根据核心编码器16和核心译码器22操作的内部采样速率以逐帧为基础调整适应。图8示出了一些可能的切换情况,其中,图8仅示出了编码器和译码器的MDCT编码路径。
具体地,图8示出了被假设为32kHz的输入采样速率可被下采样至25.6kHz,12.8kHz或8kHz中的任一个,进一步可能维持输入采样速率。取决于输入采样速率与内部采样速率之间的所选采样速率比率,存在一方面分析滤波器组与另一方面合成滤波器组之间的变换长度比率。所述比率从图8中的灰色阴影框内得到:滤波器组38和44中的40个子带与所选的内部采样速率独立无关,而滤波器组42和40中的40、32、16或10个子带取决于所选的采样速率。用在核心编码器内的MDCT的变换长度被调整适于所得的内部采样速率,从而使得以时间测量得的变换速率或变换间距间隔不变,或与所选的样本采样速率独立无关。例如,取决于所选的内部采样速率,例如其可以是导致640、512、256和160的变换长度的恒定的20ms。
使用前述原理,可以将内部采样速率切换为遵从如下关于滤波器组切换的限制:
切换期间未导致额外的延迟;
切换或采样速率变化可即时发生;
切换假象可被最小化或至少降低;以及
计算复杂性低。
基本上,滤波器组38至44及核心编码器内的MDCT为重迭变换,其中,所述滤波器组与核心编码器和译码器的MDCT相比可使用更高的窗口区域的重叠。例如,对于滤波器组可施加10倍重叠,而对于MDCT122和124可施加2倍重叠。对于重迭变换,状态缓冲器可描述为用于分析滤波器组及MDC7的分析-窗缓冲器,以及用于合成滤波器组及IMDCT的重叠相加缓冲器。在速率切换的情况下,这些状态缓冲器应该以上述相对于图5和图6所描述的方式根据采样速率来调整。在下文中,提供了关于可以在图6所讨论的分析侧处而不是在相对于图5所讨论的合成情况下执行的内插的详细讨论。重迭变换的原型或窗口可被调整适应。为了降低切换假象,状态缓冲器中的信号成分须被保留以维持重迭变换的混叠抵消特性。
在下文中,将提供如何在重新采样器72内执行内插104的更详细的描述。
可区别两种情况:
1)向上切换为据此采样速率从先前时间部分84增加值随后或后续时间部分86的处理。
2)向下切换为据此采样速率从先前时间部分84降低至随后或后续时间部分86的处理。
假设向上切换,即,从12.8kHz(每20毫秒256个样本)切换至32kHz(每20毫秒640样本),由图5中的参考标号130示例性示出的状态缓冲器(诸如重新采样器72的状态缓冲器),或其内容在给定实例中需要以对应于采样速率变化的因子诸如2.5来扩展。扩展而不会引起额外延迟的可能的方案例如为线性内插或样条内插。即,重新采样器72可在行进间将有关先前时间区域84的重新变换96末端例如位于时间间隔102内的样本内插至状态缓冲器130内。如图5所示,状态缓冲器可作为先进先出(FIFO)缓冲器。当然,并非完整的混叠抵消所需的所有频率成分都可通过此程序获得,但至少低频诸如0至6.4kHz可被产生而无任何失真,并且从心理声学观点来看,这些频率是最相关的。
对于向下切换至较低采样速率的情况,也可以使用线性内插或样条内插来因此减少状态缓冲器而不会造成额外的延迟。即,重新采样器72可通过内插而降低采样速率。然而,向下切换至减低因子大的采样速率,诸如从32kHz(每20毫秒640个样本)切换至12.8kHz(每20毫秒256个样本)(减低因子为2.5),若不去除高频成分则可能造成严重的干扰混叠。为了解决这种现象,可进行合成滤波,高频成分可通过“冲洗”滤波器组或重新变换器而去除。这意味着,在切换瞬间滤波器合成较低频成分,因而从重叠相加缓冲器清除高频谱成分。更确切地,设想从先前时间区域84的第一采样速率向下切换至后续时间区域86的较低采样速率。从上述描述可以得出,重新变换器70可以被配置为通过不让先前时间区域84的窗口版本的变换94的所有频率成分参与重新变换。而是,重新变换器70可以通过将变换94的非相关高频成分设定为0,例如,或者诸如通过逐渐衰减这些较高的频率成分而降低它们对重新变换的影响来将所述变换94的高频成分从重新变换中排除。例如,受影响的高频成分可以是高于频率成分Nk’的那些频率成分。因此,在所得信息信号中,时间区域84被有意地重建于频谱带宽,该频谱带宽系低于在输入76处的重迭变换表示输入中的可用的带宽。然而,另一方面,避免了尽管内插104但通过无意将高频部分引入组合器74内的混叠抵消处理中而出现在重叠相加处理处的混叠问题。
可选地,可同时产生另外的低采样速率表示,用在适当状态缓冲器以用来从较高采样速率表示切换。这可以确保降低因子(在需要降低的情况下)一直保持相对地(即,小于2),因而不会出现混叠所造成的干扰假象。如前所述,这将不会保留所有的频率成分,但至少保留有关心理声学上关注的低频成分。
因此,根据具体的实施例,可以下述方式修改USAC编解码器来获得USAC的低延迟版本。首先,只容许TCX和ACELP编码模式。可避免AAC模式。可以选择帧长度以获得20毫秒的成帧。然后,取决于操作模式(超宽带(SWB)、宽带(WB)、窄带(NB)、全带宽(FB))及取决于位率可选择下列系统参数。系统参数的整体情况在下表中给出。
至于考虑窄带模式,可避免采样速率增加,并通过将内部采样速率设定为等于输入采样速率,即,8kHz,因此选择帧长度,即,为160样本长度来替代采样速率增加。同样,16kHz可选用于宽带操作模式,选定用于TCX的MDCT的帧长度为320样本长而不是256。
具体地,经由整个操作点列表可以支持切换操作,即,支持的采样速率、位率及宽带。下表示出了关于USAC编解码器的前文预期的低延迟版本的内部采样速率的各种配置。
示出了低延迟USAC编译码器的内部采样速率模式的矩阵的表
作为侧边信息,应该注意的是,不需要使用根据图2a和图2b的重新采样器。可选地,可提供IIR滤波器组以假设负责从输入采样速率至专用核心采样频率的重新采样功能。这些IIR滤波器的延迟系低于0.5毫秒,但因输入频率与输出频率之间的奇数比率,故复杂性相当高。假设对于所有的IIR滤波器延迟相同,使得能够进行不同采样速率之间的切换。
因此,优选使用图2a和图2b的重新采样器实施例。参数包络模块(即,SBR)的QMF滤波器组可参与共同操作以实现上述重新采样功能。在SWB的情况下,这将合成滤波器组级添加至编码器,而同时因SBR编码器模块已经使用分析级。在译码器侧,QMF已经负责当能够使用SBR时提供向上采样功能。该方案可以被用于全部其它带宽模式。下表提供了需要的QMF配置的总体情况。
在编码器侧处的QMF配置的列表(分析带数/合成带数)。通过将所有的数目除以因子2可得另一可能的配置。
假设不变的输入采样频率,通过切换QMF合成原型使得能够激活内部采样速率之间的切换。在译码器侧,可施加反向操作。应该注意的是,在操作点的整个范围上,一个QMF带的带宽是相同的。
尽管以装置的脉络已经描述了一些方面,但显然,这些方面也表示相对应方法的描述,其中框图或装置对应于方法步骤或方法步骤的特征。类似地,以方法步骤的脉络描述方面也表示对应的装置的相对应框图或项目或特征的描述。部分或全部方法步骤可通过(或使用)硬件设备例如微处理器、可编程计算机或电子电路执行。在一些实施例中,最重要的方法步骤的某一步或多步可通过这样的设备执行。
取决于某些实现要求,本发明的实施例可以硬件或软件实现。所述实现可使用数字存储介质来执行,例如,具有可电可读控制信号存储于其上的软盘、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM或闪存,所述信号与(或可与)可编程计算机系统协作,从而使得执行各种方法。因此,该数字储存媒体可以是计算机可读的。
根据本发明的一些实施例包含具有电可读控制信号的数据载体,所述控制信号可与可编程计算机系统协作,从而使得执行这里所描述的方法之一。
通常,本发明的实施例可以被实现为具有程序代码的计算机程序产品,所述程序代码可操作为当在计算机上运行计算机程序时执行所述方法中的一种。该程序代码例如可储存在机器可读载体上。
其它实施例包含存储在机器可读载体上的用于执行这里所描述的方法中的一种的计算机程序。
换言之,因此,本发明方法的实施例为一种计算机程序,所述计算机程序具有当在计算机上运行用来执行这里所描述的方法中的一种的程序代码。
因此,本发明方法的又一实施例为数据载体(或数字存储介质或计算机可读介质),所述数据载体包括记录在其上的用来执行这里所描述的方法中的一种的计算机程序。数据载体、数字存储介质或记录介质通常有形的和/或非易失的。
因此,本发明方法的又一实施例为表示用来执行这里所描述的方法中的一种的计算机程序的数据流或信号序列。数据流或信号序列例如可以被配置为经由数据通信连接(例如,经由英特网)传输。
又一实施例包含处理装置,例如计算机或可编程逻辑装置,被配置为或适用于执行这里所述描述的方法中的一种。
又一实施例包含具有安装在其上的用来执行这里所描述的方法中的一种的计算机程序的计算机。
根据本发明的又一实施例包含被配置为将用来执行这里所描述的方法中的一种的计算机程序传输(例如,电学地或光学地)至接收器的装置或系统。接收器例如可以是计算机、移动装置、存储装置等。设备或系统例如包含用于将计算机程序传输至接收器的文档服务器。
在一些实施例中,可编程逻辑装置(例如现场可编程门阵列)可用来执行这里所描述的方法的部分或全部功能。在一些实施例中,现场可编程门阵列可与微处理器协作来执行这里所描述的方法中的一种。通常,所述方法优选地通过任何硬件装置执行。
前述实施例仅是示例性的以用于本发明的原理。应该理解的是,对于本领域的其他技术人员来说,这里所描述的配置和细节的修改和变换是显而易见的。因此,其意在仅由所附权利要求的范围来限定而不是由通过这里的实施例的描述和说明的方式表示的具体细节的限定。
文献:
[1]:3GPP,“Audio codec processing functions;Extended AdaptiveMulti-Rate–Wideband(AMR-WB+)codec;Transcoding functions”,2009,3GPP TS26.290.
[2]:USAC codec(Unified Speech and Audio Codec),ISO/IEC CD23003-3dated September24,2010.

Claims (21)

1.一种被配置为使用混叠抵消从信息信号的重迭变换表示来重建所述信息信号的信息信号重建器,对于所述信息信号的各个连续重迭区域,包含各区域的窗口版本的变换,其中,所述信息信号重建器被配置为以在所述信息信号的先前区域(84)和后续区域(86)之间的边界(82)处变化的采样速率来重建所述信息信号,其中,所述信息信号为音频信号,所述信息信号重建器包括:
重新变换器(70),被配置为对所述先前区域(84)的所述窗口版本的变换(94)施加重新变换以从而获得所述先前区域的重新变换(96),并对所述后续区域(86)的所述窗口版本的变换施加重新变换以从而获得所述后续区域(86)的重新变换(100),其中,所述先前区域(84)的所述重新变换(96)和所述后续区域(86)的所述重新变换(106)在所述先前区域和所述后续区域之间的所述边界(82)处的混叠抵消部分(102)处重叠;
重新采样器,被配置为根据在所述边界(82)处的采样速率变化,通过内插而对在所述混叠抵消部分(102)处的所述先前区域(84)的所述重新变换(96)和/或所述后续区域(86)的所述重新变换(100)进行重新采样;以及
组合器,被配置为在作为通过在所述混叠抵消部分(102)处重新采样而获得的所述先前区域和所述后续区域(84,86)的重新变换(96,100)之间执行混叠抵消。
2.根据权利要求1所述的信息信号重建器,其中,所述重新采样器被配置为根据所述边界处的所述采样速率变化来对所述混叠抵消部分处的先前区域的重新变换(96)进行重新采样。
3.根据权利要求1所述的信息信号重建器,其中,施加至所述先前区域(84)的所述窗口版本的所述变换(94)的所述重新变换的变换长度和所述先前区域(84)的时间长度的比率与施加至所述后续区域(86)的所述窗口版本的所述重新变换的变换长度和所述后续区域(86)的时间长度的比率相差对应于所述采样速率变化的因子。
4.根据权利要求3所述的信息信号重建器,其中,所述先前和后续区域(84,86)的所述时间长度彼此相等,并且所述重新变换器(70)被配置为将至所述先前区域(84)的所述窗口版本的所述变换的所述重新变换的施加限于所述先前区域的所述窗口版本的所述变换的低频部分和/或将至所述后续区域的所述窗口版本的所述变换的所述重新变换的施加限于所述后续区域的所述窗口版本的所述变换的低频部分。
5.根据权利要求1所述的信息信号重建器,其中,所述信息信号的所述区域的所述窗口版本的所述变换的变换长度和所述信息信号的所述区域的时间长度为常数,并且所述信息信号重建器被配置为响应于控制信号(98)来定位所述边界(82)。
6.根据权利要求1所述的信息信号重建器,其中,所述信息信号的所述区域的所述窗口版本的所述变换的变换长度各异,而所述信息信号的所述区域的时间长度为常数,其中,所述信息信号重建器被配置为通过测所述信息信号的所述区域的所述窗口版本的所述变换长度中的变化来定位所述边界。
7.根据权利要求6所述的信息信号重建器,其中,所述重新变换器被配置为将施加至所述先前区域和后续区域的所述窗口版本的所述变换的所述重新变换的变换长度调整适于所述先前区域和所述后续区域的所述窗口版本的所述变换的所述变换长度。
8.根据权利要求1所述的信息信号重建器,其中,所述重迭变换被临界采样。
9.根据权利要求1所述的信息信号重建器,其中,所述重迭变换表示为复合值滤波器组。
10.根据权利要求1所述的信息信号重建器,其中,所述重新采样器被配置为使用线性或样条内插用于内插。
11.根据权利要求1所述的信息信号重建器,其中,所述采样速率在所述边界处降低,以及所述重新变换器(7)被配置为在将所述重新变换施加至所述先前区域(84)的所述窗口版本的所述变换(94)时,将所述先前区域的所述窗口版本的所述变换(94)的较高的频率衰减或设定为零。
12.一种由用来提供信息信号的重迭变换表示的滤波器组(38)与反滤波器组(42)级联组成的重新采样器,包括:信息信号重建器,被配置为使用混叠抵消从根据权利要求5所述的信息信号的所述重迭变换表示而重建所述信息信号。
13.一种信息信号编码器,包括根据权利要求12所述的重新采样器和被被配置为压缩所述重建信息信号的压缩级(16),所述信息信号编码器进一步包括采样速率控制器,所述采样速率控制器被配置为依赖于有关可用的传输位元率的外部信息来控制控制信号(98)。
14.一种信息信号重建器,包括解压缩器(34),被配置为从数据流重建信息信号的重迭变换表示;以及根据权利要求7所述的信息信号重建器,被配置为使用混叠抵消从所述重迭变换表示重建所述信息信号。
15.一种被配置为使用引起混叠重迭变换来产生信息信号的重迭变换表示的信息信号变换器,其中,所述信息信号为音频信号,且所述信息信号变换器包括:
输入(105),用来以样本序列的形式来接收所述信息信号;
获取器(106),被配置为获取所述信息信号的连续的重迭区域;
重新采样器(107),被配置为通过内插向所述信息信号的所述连续的重叠区域的至少一个子集施加重新采样,从而使得所述连续的重迭区域的每一个具有各自不变的采样速率,但在所述连续的重迭区域中所述各自不变的采样速率各异;
窗口器(108),被配置为对所述信息信号的所述连续的重迭区域施加开窗;以及
变换器(109),被配置为对所述窗口区域单独地施加变换。
16.根据权利要求15所述的信息信号变换器,其中,所述获取器(106)被配置为执行所述信息信号的所述连续的重叠区域的获取,从而使得所述信息信号的所述连续的重迭区域具有不变的时间长度。
17.根据权利要求15所述的信息信号变换器,其中,所述获取器(106)被配置为执行所述信息信号的所述连续的重叠区域的获取,从而使得所述信息信号的所述连续的重叠区域具有不变的时间偏移。
18.根据权利要求16所述的信息信号变换器,其中,所述样本序列具有以预定时间瞬间(113)从第一采样速率切换至第二采样速率的变化的采样速率,其中,所述重新采样器(107)被配置为与所述预定时间瞬间重迭,将所述重新采样施加至所述连续重迭区域,从而使得其不变的采样速率只有一次从所述第一采样速率切换至所述第二采样速率。
19.根据权利要求18所述的信息信号变换器,其中,所述变换器被配置为将各个窗口区域的所述变换的变换长度调整适于所述各个窗口区域的多个样本。
20.一种使用混叠抵消从信息信号的重迭变换表示重建所述信息信号的方法,对于所述信息信号的各个连续的重迭区域包含所述各个区域的窗口版本的变换,其中,信息信号重建器被配置为以在所述信息信号的先前区域(84)与后续区域(86)之间的边界处变化的采样速率重建所述信息信号,其中,所述信息信号为音频信号,所述方法包括:
对所述先前区域(84)的所述窗口版本的所述变换(94)施加重新变换以从而获得所述先前区域的重新变换(96),以及对所述后续区域(86)的所述窗口版本的所述变换施加重新变换以从而获得所述后续区域的重新变换(100),其中,所述先前区域(84)的所述重新变换(96)以及所述后续区域(86)的所述重新变换(106)在所述先前区域和所述后续区域之间的边界处的混叠抵消部分处重叠;
根据在所述边界(82)处的采样速率变化,通过内插对在所述混叠抵消部分(102)处的所述先前区域(84)的重新变换(96)和/或所述后续区域(86)的所述重新变换(100)进行采样;以及
在作为通过在所述混叠抵消部分(102)处重新采样而获得的所述先前区域和所述后续区域(84,86)的重新变换(96,100)之间执行混叠抵消。
21.一种使用引起混叠重迭变换来产生信息信号的重迭变换表示的方法,其中,所述信息信号为音频信号,且所述方法包括:
以样本序列的形式接收所述信息信号;
获取所述信息信号的连续的重迭区域;
通过内插向所述信息信号的所述连续的重迭区域的至少一个子集施加重新采样,从而使得所述连续的重迭区域的每一个具有各自不变的采样速率,但所述连续的重迭区域中的所述各自不变的采样速率各异;
对所述信息信号的所述连续的重迭区域施加开窗;以及
对所述窗口区域单独地施加变换。
CN201280001344.3A 2011-02-14 2012-02-14 利用重迭变换的信息信号表示 Active CN102959620B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052458 WO2012110478A1 (en) 2011-02-14 2012-02-14 Information signal representation using lapped transform

Publications (2)

Publication Number Publication Date
CN102959620A CN102959620A (zh) 2013-03-06
CN102959620B true CN102959620B (zh) 2015-05-13

Family

ID=71943597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280001344.3A Active CN102959620B (zh) 2011-02-14 2012-02-14 利用重迭变换的信息信号表示

Country Status (18)

Country Link
US (1) US9536530B2 (zh)
EP (1) EP2550653B1 (zh)
JP (2) JP5712288B2 (zh)
KR (1) KR101424372B1 (zh)
CN (1) CN102959620B (zh)
AR (1) AR085222A1 (zh)
AU (1) AU2012217158B2 (zh)
BR (1) BR112012029132B1 (zh)
CA (1) CA2799343C (zh)
ES (1) ES2458436T3 (zh)
HK (1) HK1181541A1 (zh)
MX (1) MX2012013025A (zh)
MY (1) MY166394A (zh)
PL (1) PL2550653T3 (zh)
RU (1) RU2580924C2 (zh)
SG (1) SG185519A1 (zh)
TW (2) TWI483245B (zh)
WO (1) WO2012110478A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2849974C (en) * 2011-09-26 2021-04-13 Sirius Xm Radio Inc. System and method for increasing transmission bandwidth efficiency ("ebt2")
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
CN109509478B (zh) 2013-04-05 2023-09-05 杜比国际公司 音频处理装置
RU2643662C2 (ru) * 2013-08-23 2018-02-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки звукового сигнала с использованием комбинирования в диапазоне перекрытия
RU2632151C2 (ru) 2014-07-28 2017-10-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ выбора одного из первого алгоритма кодирования и второго алгоритма кодирования с использованием уменьшения гармоник
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
KR102632136B1 (ko) * 2017-04-28 2024-01-31 디티에스, 인코포레이티드 오디오 코더 윈도우 사이즈 및 시간-주파수 변환
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101351840A (zh) * 2005-11-03 2009-01-21 科丁技术公司 对音频信号的时间伸缩改进变换编码
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
WO2010003532A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
CN101743587A (zh) * 2007-07-19 2010-06-16 高通股份有限公司 用于执行信号转换的统一滤波器组

Family Cites Families (213)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE477571T1 (de) 1991-06-11 2010-08-15 Qualcomm Inc Vocoder mit veränderlicher bitrate
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
KR100419545B1 (ko) 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
JP3304717B2 (ja) * 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
EP0720316B1 (en) 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ES2247741T3 (es) 1998-01-22 2006-03-01 Deutsche Telekom Ag Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio.
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
CN1145928C (zh) 1999-06-07 2004-04-14 艾利森公司 用参数噪声模型统计量产生舒适噪声的方法及装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ATE341074T1 (de) 2000-02-29 2006-10-15 Qualcomm Inc Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US20050130321A1 (en) 2001-04-23 2005-06-16 Nicholson Jeremy K. Methods for analysis of spectral data and their applications
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
KR100464369B1 (ko) 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP3815323B2 (ja) * 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) * 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) * 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP3646939B1 (ja) 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
WO2004034379A2 (en) 2002-10-11 2004-04-22 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
CN100508030C (zh) 2003-06-30 2009-07-01 皇家飞利浦电子股份有限公司 一种编码/解码音频信号的方法及相应设备
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US7565286B2 (en) 2003-07-17 2009-07-21 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada Method for recovery of lost speech data
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US7418396B2 (en) * 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
CN1875402B (zh) 2003-10-30 2012-03-21 皇家飞利浦电子股份有限公司 音频信号编码或解码
EP1711938A1 (en) * 2004-01-28 2006-10-18 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
WO2005086138A1 (ja) 2004-03-05 2005-09-15 Matsushita Electric Industrial Co., Ltd. エラー隠蔽装置およびエラー隠蔽方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
MXPA06012617A (es) 2004-05-17 2006-12-15 Nokia Corp Codificacion de audio con diferentes longitudes de cuadro de codificacion.
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
US9047860B2 (en) 2005-01-31 2015-06-02 Skype Method for concatenating frames in communication system
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
EP1845520A4 (en) 2005-02-02 2011-08-10 Fujitsu Ltd SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
WO2006107838A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Systems, methods, and apparatus for highband time warping
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
PL1897085T3 (pl) 2005-06-18 2017-10-31 Nokia Technologies Oy System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy
EP1895511B1 (en) * 2005-06-23 2011-09-07 Panasonic Corporation Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US20090281812A1 (en) 2006-01-18 2009-11-12 Lg Electronics Inc. Apparatus and Method for Encoding and Decoding Signal
CN101371297A (zh) 2006-01-18 2009-02-18 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
EP2040251B1 (en) 2006-07-12 2019-10-09 III Holdings 12, LLC Audio decoding device and audio encoding device
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
EP2549440B1 (en) 2006-07-24 2017-01-11 Sony Corporation A hair motion compositor system and optimization techniques for use in a hair/fur graphics pipeline
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
DE602007004502D1 (de) 2006-08-15 2010-03-11 Broadcom Corp Neuphasierung des status eines dekodiergerätes nach einem paketverlust
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8452605B2 (en) * 2006-10-25 2013-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
CN102395033B (zh) * 2006-12-12 2014-08-27 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
SG179433A1 (en) 2007-03-02 2012-04-27 Panasonic Corp Encoding device and encoding method
WO2008108083A1 (ja) 2007-03-02 2008-09-12 Panasonic Corporation 音声符号化装置および音声符号化方法
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
EP2165328B1 (en) * 2007-06-11 2018-01-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of an audio signal having an impulse-like portion and a stationary portion
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
WO2009029032A2 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CN102789782B (zh) * 2008-03-04 2015-10-14 弗劳恩霍夫应用研究促进协会 对输入数据流进行混合以及从中产生输出数据流
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
US8879643B2 (en) 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
JP5551695B2 (ja) 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声符号器、音声復号器、音声符号化方法、音声復号化方法およびコンピュータプログラム
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
ES2654433T3 (es) 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2346030B1 (en) 2008-07-11 2014-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and computer program
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
EP3640941A1 (en) 2008-10-08 2020-04-22 Fraunhofer Gesellschaft zur Förderung der Angewand Multi-resolution switched audio encoding/decoding scheme
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
KR101256808B1 (ko) 2009-01-16 2013-04-22 돌비 인터네셔널 에이비 외적 향상 고조파 전치
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
MX2011007925A (es) 2009-01-28 2011-08-17 Dten Forschung E V Fraunhofer Ges Zur Foeerderung Der Angewan Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de computadora.
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
WO2010093224A2 (ko) 2009-02-16 2010-08-19 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
PL2234103T3 (pl) 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
US8725503B2 (en) * 2009-06-23 2014-05-13 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
MY162251A (en) 2009-10-20 2017-05-31 Fraunhofer Ges Forschung Audio signal encoder,audio signal decoder,method for providing an encoded representation of an audio content,method for providing a decoded representation of an audio content and computer program for use in low delay applications
MY167980A (en) 2009-10-20 2018-10-09 Fraunhofer Ges Forschung Multi- mode audio codec and celp coding adapted therefore
AU2010309838B2 (en) 2009-10-20 2014-05-08 Dolby International Ab Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
WO2011147950A1 (en) 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
RU2560788C2 (ru) 2011-02-14 2015-08-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки декодированного аудиосигнала в спектральной области
MX2013009305A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio.

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101351840A (zh) * 2005-11-03 2009-01-21 科丁技术公司 对音频信号的时间伸缩改进变换编码
CN101743587A (zh) * 2007-07-19 2010-06-16 高通股份有限公司 用于执行信号转换的统一滤波器组
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
WO2010003532A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme

Also Published As

Publication number Publication date
US20130064383A1 (en) 2013-03-14
KR20130007651A (ko) 2013-01-18
JP2014240973A (ja) 2014-12-25
TWI483245B (zh) 2015-05-01
JP6099602B2 (ja) 2017-03-22
TW201506906A (zh) 2015-02-16
TWI564882B (zh) 2017-01-01
PL2550653T3 (pl) 2014-09-30
JP5712288B2 (ja) 2015-05-07
MY166394A (en) 2018-06-25
AU2012217158A1 (en) 2012-12-13
US9536530B2 (en) 2017-01-03
MX2012013025A (es) 2013-01-22
TW201246186A (en) 2012-11-16
JP2013531820A (ja) 2013-08-08
AR085222A1 (es) 2013-09-18
ES2458436T3 (es) 2014-05-05
WO2012110478A1 (en) 2012-08-23
KR101424372B1 (ko) 2014-08-01
EP2550653A1 (en) 2013-01-30
BR112012029132A2 (pt) 2020-11-10
RU2580924C2 (ru) 2016-04-10
CA2799343C (en) 2016-06-21
HK1181541A1 (zh) 2013-11-08
RU2012148250A (ru) 2014-07-27
EP2550653B1 (en) 2014-04-02
BR112012029132B1 (pt) 2021-10-05
AU2012217158B2 (en) 2014-02-27
CN102959620A (zh) 2013-03-06
SG185519A1 (en) 2012-12-28
CA2799343A1 (en) 2012-08-23

Similar Documents

Publication Publication Date Title
CN102959620B (zh) 利用重迭变换的信息信号表示
US11929084B2 (en) Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor
US11915712B2 (en) Audio encoder and decoder using a frequency domain processor, a time domain processor, and a cross processing for continuous initialization
AU2009267518B2 (en) Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
WO2011147950A1 (en) Low-delay unified speech and audio codec
KR101648133B1 (ko) 시간-도메인 및 주파수-도메인 코딩 방식을 지원하는 오디오 코덱

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Munich, Germany

Patentee after: Fraunhofer Application and Research Promotion Association

Address before: Munich, Germany

Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.