KR101424372B1 - 랩핑 변환을 이용한 정보 신호 표현 - Google Patents

랩핑 변환을 이용한 정보 신호 표현 Download PDF

Info

Publication number
KR101424372B1
KR101424372B1 KR1020127029497A KR20127029497A KR101424372B1 KR 101424372 B1 KR101424372 B1 KR 101424372B1 KR 1020127029497 A KR1020127029497 A KR 1020127029497A KR 20127029497 A KR20127029497 A KR 20127029497A KR 101424372 B1 KR101424372 B1 KR 101424372B1
Authority
KR
South Korea
Prior art keywords
information signal
transformation
transform
region
sample rate
Prior art date
Application number
KR1020127029497A
Other languages
English (en)
Other versions
KR20130007651A (ko
Inventor
마르쿠스 슈넬
랄프 가이거
엠마누엘 라벨리
에레니 포토포우로우
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20130007651A publication Critical patent/KR20130007651A/ko
Application granted granted Critical
Publication of KR101424372B1 publication Critical patent/KR101424372B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

정보 신호 재구성기는 앨리어싱 소거를 이용하여, 정보 신호의 연속적인 중복 영역의 각각에 대해, 각각의 영역의 윈도우 버전의 변환을 포함하는 상기 정보 신호의 랩핑 변환 표현으로부터 상기 정보 신호를 재구성하도록 구성되고, 정보 신호 재구성기는 상기 정보 신호의 이전의 영역(84)과 다음의 영역(86) 사이의 경계(82)에서 변화하는 샘플율로 상기 정보 신호를 재구성하도록 구성된다. 정보 신호 재구성기는, 상기 이전의 영역(84)에 대한 재변환(96)을 획득하기 위해 상기 이전의 영역(84)의 상기 윈도우 버전의 변환(94)에 재변환을 적용하고, 상기 다음의 영역(86)에 대한 재변환(100)을 획득하기 위해 상기 다음의 영역(86)의 상기 윈도우 버전의 변환(94)에 재변환을 적용하도록 구성된 재변환기(70)로서, 상기 이전의 영역(84)에 대한 재변환(96) 및 상기 다음의 영역(86)에 대한 재변환(106)은 상기 이전의 영역과 상기 다음의 영역 사이의 경계(82)에서의 앨리어싱 소거 부분(102)에서 중복하는 재변환기(70); 보간에 의해, 상기 경계(82)에서의 샘플율 변화에 따라 상기 앨리어싱 소거 부분(102)에서 상기 이전의 영역(84)에 대한 재변환(96) 및/또는 상기 다음의 영역(86)에 대한 재변환(100)을 리샘플링하도록 구성되는 리샘플러(72); 및 상기 앨리어싱 소거 부분(102)에서 상기 리샘플링에 의해 획득되는 바와 같이 상기 이전의 및 다음의 영역(84, 86)에 대한 재변환(96, 100) 사이에서 앨리어싱 소거를 수행하도록 구성되는 조합기(74)를 포함한다.

Description

랩핑 변환을 이용한 정보 신호 표현{INFORMATION SIGNAL REPRESENTATION USING LAPPED TRANSFORM}
본 출원은 랩핑 변환(lapped transform)을 이용한 정보 신호 표현에 관한 것으로서, 특히, 예를 들어, 오디오 압축 기술에 이용되는 바와 같이 앨리어싱 소거(aliasing cancellation)를 필요로 하는 정보 신호의 랩핑 변환 표현을 이용한 정보 신호의 표현에 관한 것이다.
대부분의 압축 기술은 최대 허용 지연 및 이용 가능한 전송 비트율과 같은 압축된 데이터 스트림의 특정 전송 조건 및 정보 신호의 특정 타입을 위해 설계되었다. 예를 들면, 오디오 압축 시에, 높은 이용 가능한 비트율의 경우와 음성 대신에 음악을 코딩하는 경우에, AAC와 같은 변환 기반 코덱은 ACELP와 같은 선형 예측 기반의 시간 도메인 코덱을 능가하는 경향이 있다. USAC 코덱은, 예를 들어, 하나의 코덱 내에 서로 다른 오디오 코딩 원리를 통합하여 훨씬 다양한 애플리케이션 배경(application sceneries)을 커버하기를 추구한다. 그러나, 이용 가능한 전송 비트율의 변화와 같은 서로 다른 코딩 조건에 대한 적응성(adaptivity)을 더욱 증가시켜, 이를 이용하여, 예를 들어, 높은 코딩 효율 등을 달성하는 것이 유리하다.
따라서, 본 발명의 목적은 랩핑 변환 표현을 실제 필요에 적응시켜, 높은 코딩 효율을 달성할 가능성을 제공할 수 있도록 앨리어싱 소거를 필요로 하는 랩핑 변환 표현에 의해 정보 신호를 나타낼 수 있는 랩핑 변환 정보 신호 표현 방식을 제공하는 이와 같은 개념을 제공하기 위한 것이다.
이러한 목적은 계류 중인 독립항의 구성에 의해 달성된다.
본 발명에 이르게 한 주요 생각은 다음과 같다. 정보 신호의 랩핑 변환 표현은 종종, 예를 들어, 율(rate)/왜곡 비율 의미의 관점에서 정보 신호를 효율적으로 코딩할 시에 예약 상태(prestate)를 형성하기 위해 이용된다. 이와 같은 코덱의 예로는 AAC 또는 TCX 등이 있다. 그러나, 랩핑 변환 표현은 또한 변환 연결하여 리-샘플링(re-sampling)을 수행하고, 서로 다른 스펙트럼 해상도를 재변환하는데 이용될 수 있다. 일반적으로, 정보 신호의 연속 시간 영역의 윈도우 버전의 변환의 개개의 재변환의 중복 부분에서 앨리어싱을 일으키는 랩핑 변환 표현은 보다 낮은 수의 변환 계수 레벨이 랩핑 변환 표현을 나타내기 위해 코딩된다는 관점에서 이점을 갖는다. 극단적인 형식에서, 랩핑 변환은 "임계적으로 샘플링(critically sampled)"된다. 즉, 정보 신호의 시간 샘플의 수에 비해 랩핑 변환 표현의 계수의 수를 증가시키지 않는다. 랩핑 변환 표현의 일례로는 MDCT(Modified Discrete Cosine Transform) 또는 QMF(Quadratur Mirror Filters) 필터뱅크가 있다. 따라서, 종종, 정보 신호를 효율적으로 코딩할 시에 이와 같은 랩핑 변환 표현을 예약 상태로서 이용하는 것이 유리하다. 그러나, 또한, 랩핑 변환 표현을 이용하여 정보 신호를 나타내는 샘플율이, 예를 들어, 이용 가능한 전송 비트율 또는 다른 환경 조건에 적응되도록 하기 위해 시간적으로 변화할 수 있는 것이 유리하다. 변화하는 이용 가능한 전송 비트율을 상상한다. 예를 들면, 이용 가능한 전송 비트율이 어떤 미리 정해진 임계치 아래로 떨어질 때마다, 샘플율을 낮추는 것이 유리할 수 있으며, 이용 가능한 전송율이 다시 오를 때에는 랩핑 변환 표현이 정보 신호를 나타내는 샘플율을 증가시킬 수 있는 것이 유리하다. 불행하게도, 랩핑 변환 표현의 재변환의 중복 앨리어싱 부분은 이와 같은 샘플율 변화에 장애(bar)가 될 것 같으며, 이러한 장애는 샘플율 변화의 경우에 랩핑 변환 표현을 완전히 중단함으로써만 극복될 것 같다. 그러나, 본 발명의 발명자는 상술한 문제에 대한 해결책을 실현하여, 앨리어싱 및 관계한 샘플율 변화를 수반하는 랩핑 변환 표현의 효율적인 이용을 가능하게 한다. 특히, 보간(interpolation)에 의해, 정보 신호의 이전 및/또는 다음 영역은 두 영역의 경계에서 샘플율 변화에 따라 앨리어싱 소거 부분에서 리샘플링된다. 그 후, 조합기는 앨리어싱 소거 부분에서 리샘플링에 의해 획득되는 바와 같이 이전 및 다음 영역에 대한 재변환 사이의 경계에서 앨리어싱 소거를 수행할 수 있다. 이러한 방법에 의해, 샘플율 변화는 샘플율 변화/전환에서 랩핑 변환 표현의 어떤 불연속성을 피해 효율적으로 트래버스(traverse)된다. 유사한 방법은 또한 랩핑 변환을 적절히 생성하기 위해 변환측에서도 실행할 수 있다.
상술한 아이디어를 이용하여, 이용 가능한 전송 대역폭과 같은 광범위한 환경의 코딩 조건을 통해 샘플율 변화의 경우 스스로에 의해 불이익 없이 전달된 샘플율을 이들 조건에 채택하여 높은 코딩 효율을 갖는 오디오 압축 기술과 같은 정보 신호 압축 기술을 제공할 수 있다.
본 발명의 유리한 측면은 계류중인 청구항 세트의 종속항의 구성이다. 더욱이, 본 발명의 바람직한 실시예는 도면에 대해 아래에 설명된다:
도 1a는 본 발명의 실시예가 구현될 수 있는 정보 인코더의 블록도를 도시한다.
도 1b는 본 발명의 실시예가 구현될 수 있는 정보 신호 디코더의 블록도를 도시한다.
도 2a는 도 1a의 코어 인코더의 가능한 내부 구조의 블록도를 도시한다.
도 2b는 도 1b의 코어 디코더의 가능한 내부 구조의 블록도를 도시한다.
도 3a는 도 1a의 리샘플러의 가능한 구현의 블록도를 도시한다.
도 3b는 도 1b의 리샘플러의 가능한 내부 구조의 블록도를 도시한다.
도 4a는 본 발명의 실시예가 구현될 수 있는 정보 신호 인코더의 블록도를 도시한다.
도 4b는 본 발명의 실시예가 구현될 수 있는 정보 신호 디코더의 블록도를 도시한다.
도 5는 실시예에 따른 정보 신호 재구성기의 블록도를 도시한다.
도 6은 실시예에 따른 정보 신호 변환기의 블록도를 도시한다.
도 7a는 도 5에 따른 정보 신호 재구성기가 이용되는 다른 실시예에 따른 정보 신호 인코더의 블록도를 도시한다.
도 7b는 도 5에 따른 정보 신호 재구성기가 이용되는 다른 실시예에 따른 정보 신호 디코더의 블록도를 도시한다.
도 8은 실시예에 따른 도 6a 및 6b의 정보 신호 인코더 및 디코더에서 발생하는 샘플율 전환 시나리오를 보여주는 개략도를 도시한다.
아래에 추가로 설명되는 본 발명의 실시예에 동기를 부여하기 위해, 사전에, 본 출원의 실시예가 이용될 수 있고, 추가로 아래의 명확하게 설명되는 본 출원의 실시예의 이점 및 의도를 표현하는 실시예가 논의된다.
도 1a 및 1b는, 예를 들어, 다음에 설명되는 실시예가 유리하게 이용될 수 있는 한 쌍의 인코더 및 디코더를 도시한다. 도 1a는 인코더를 도시하지만, 도 1b는 디코더를 도시한다. 도 1a의 정보 신호 인코더(10)는 정보 신호가 입력하는 입력(12), 리샘플러(14) 및 코어 인코더(16)를 포함하는데, 리샘플러(14) 및 코어 인코더(16)는 인코더(10)의 입력(12)과 출력(18)의 사이에 직렬로 연결된다. 출력(18)에서, 인코더(10)는 입력(12)의 정보 신호를 나타내는 데이터 스트림을 출력한다. 마찬가지로, 참조 부호 20을 가진 도 1b에 도시된 디코더는 도 1b에 도시된 방식으로 디코더(20)의 입력(26)과 출력(28)의 사이에 직렬로 연결되는 코어 디코더(22) 및 리샘플러(24)를 포함한다.
출력(18)에서 출력된 데이터 스트림을 디코더(20)의 입력(26)으로 전달하기 위한 이용 가능한 전송 비트율이 높으면, 코딩 효율의 관점에서, 높은 샘플율로 데이터 스트림 내에 정보 신호(12)를 나타내어, 정보 신호의 스펙트럼의 넓은 스펙트럼 대역을 커버하는 것이 유리할 수 있다. 즉, 율/왜곡 비율 측정과 같은 코딩 효율성 측정은 코어 인코더(16)가 정보 신호(12)의 낮은 샘플율 버전의 압축에 비해 높은 샘플율로 입력 신호(12)를 압축하는 경우에 코딩 효율성이 더 높은 것으로 나타날 수 있다. 한편, 낮은 이용 가능한 전송 비트율에서는, 코딩 효율성 측정은 낮은 샘플율로 정보 신호(12)를 코딩할 때 더 높은 것으로 발생할 수 있다. 이 점에서, 왜곡은 음향 심리학적으로(psycho-acoustically) 동기 부여된 방식으로, 즉 지각적으로(perceptually) 관련성이 적은 주파수 영역, 즉 인간 귀, 예를 들어, 덜 민감한 주파수 영역 내에서보다 지각적으로 관련성이 많은 주파수 영역 내의 왜곡을 더 강력하게 고려하여 측정될 수 있다는 것이 주목되어야 한다. 일반적으로, 낮은 주파수 영역은 높은 주파수 영역보다 관련성이 더 많은 경향이 있으며, 따라서, 낮은 샘플율 코딩은 나이퀴스트(Nyquist) 주파수 위에 있는 입력(12)에서의 신호의 주파수 구성 요소가 코딩되지 못하게 하지만, 한편, 그로부터 생성하는 비트율 절약은, 율/왜곡 율 관점에서, 높은 샘플율 코딩보다 선호될 이러한 낮은 샘플율 코딩을 생성한다. 낮은 주파수 부분과 높은 주파수 부분 사이의 왜곡의 중요성의 비슷한 차이는 또한 측정 신호 등과 같은 다른 정보 신호에도 존재한다.
따라서, 리샘플러(14)는 정보 신호(12)가 샘플링되는 샘플율을 변화시킨다. 정의된 바와 같이 외부 전송 조건의 의존성에서 샘플율을 적절하게 제어함으로써, 특히, 출력(18)과 입력(26) 사이의 이용 가능한 전송 비트율에 의해, 인코더(10)는 시간이 지남에 따라 변화하는 외부 전송 조건에도 불구하고 증가된 코딩 효율을 달성할 수 있다. 디코더(20)는 차례로 데이터 스트림을 압축 해제하는 코어 디코더(22)를 포함하며, 리샘플러(24)는 출력(28)에서 출력되는 재구성된 정보 신호가 다시 일정한 샘플율을 가짐을 주의한다.
그러나, 문제는 랩핑 변환 표현이 도 1a 및 1b의 인코더/디코더 쌍에 이용될 때마다 발생한다. 재변환의 중복 영역에서 앨리어싱을 수반하는 랩핑 변환 표현은 코딩을 위한 효과적인 도구(tool)를 형성하지만, 필요한 시간 앨리어싱 소거로 인해, 문제는 샘플율이 변화할 경우에 발생한다. 예를 들면, 도 2a 및 2b를 참조한다. 도 2a 및 2b는 양자 모두 변환 코딩 타입임을 가정하는 코어 인코더(16) 및 코어 디코더(22)에 대한 가능한 구현을 도시한다. 따라서, 코어 인코더(16)는 압축기(32)가 뒤따르는 변환기(30)를 포함하며, 도 2b에 도시된 코어 디코더는 재변환기(36)가 차례로 뒤따르는 압축 해제기(34)를 포함한다. 도 2a 및 2b는 다른 모듈이 코어 인코더(16) 및 코어 디코더(22) 내에 존재할 수 없다는 것으로 해석되지 않아야 한다. 예를 들면, 필터는 변환기(30)보다 우선하여, 후자가 리샘플러(14)에 의해 직접적이지 않지만, 사전 필터링된 형식으로 획득되는 리샘플링된 정보 신호를 변환하도록 한다. 마찬가지로, 역 전달 함수를 갖는 필터 뒤에는 재변환기(36)가 따름으로써, 재변환 신호가 나중에 역으로 필터링될 수 있다.
압축기(32)는 허프만(Huffman) 또는 산술 코딩과 같은 예를 포함하는 엔트로피 코딩과 같은 손실없는 코딩을 이용하는 것과 같이 변환기(30)에 의해 출력되는 생성된 랩핑 변환 표현을 압축하며, 압축 해제기(34)는, 예를 들어, 허프만 또는 산술 디코딩과 같은 엔트로피 디코딩에 의해 역 프로세스, 즉 압축 해제를 행하여, 재변환기(36)로 공급되는 랩핑 변환 표현을 획득할 수 있다.
도 2a 및 2b에 도시된 변환 코딩 환경에서, 문제는 리샘플러(14)가 샘플링율을 변화시킬 때마다 발생한다. 이러한 문제는 정보 신호(12)가 어쨌든 제공될 때에 인코딩측에서 덜 심각하며, 따라서, 변환기(30)에는 심지어 샘플링율의 변화의 경우에 각각의 영역의 윈도우 버전을 이용하여 개개의 변환에 대해 지속적으로 샘플링된 영역이 제공될 수 있다. 이에 따라 변환기(30)를 구현하기 위한 가능한 실시예는 도 6과 관련하여 후술된다. 일반적으로, 변환기(30)에는 현재의 샘플링율로 정보 신호의 이전의 영역의 윈도우 버전이 제공되고 나서, 리샘플러(14)에 의해 변환기(30)에 정보 신호의 다음의 부분적 중복 영역을 공급하며, 그 후 윈도우 버전의 변환은 변환기(30)에 의해 생성된다. 필요한 시간 앨리어싱 소거가 변환기(30)보다는 오히려 재변환기(36)에서 행해질 필요가 있으므로 추가적인 문제는 발생하지 않는다. 그러나, 재변환기(36)에서, 재변환기(36)가 앞서 언급된 바로 뒤따르는 영역의 재변환이 서로 다른 샘플링율에 관계할 때 시간 앨리어싱 소거를 수행할 수 없다는 점에서 샘플링율의 변화는 문제를 발생시킨다. 아래에 더 설명되는 실시예는 이러한 문제를 극복한다. 이러한 실시예에 따르면, 재변환기(36)는 아래에 더 설명되는 정보 신호 재구성기에 의해 대체될 수 있다.
그러나, 도 1a 및 1b에 대해 설명된 환경에서, 코어 인코더(16) 및 코어 디코더(22)가 변환 코딩 타입인 경우에만 문제가 발생하지 않는다. 오히려, 문제는 또한, 각각, 리샘플러들(14, 24)을 형성하는 랩핑 변환 기반 필터 뱅크를 이용하는 경우에 발생할 수 있다. 예를 들어, 도 3a 및 3b를 참조한다. 도 3a 및 3b는 리샘플러들(14, 24)을 실현하기 위한 일 특정 실시예를 도시한다. 도 3a 및 3b의 실시예에 따르면, 두 개의 리샘플러는, 각각, 합성 필터뱅크들(32, 44)가 뒤따르는, 각각, 분석 필터팽크들(38, 40)의 연결(concatenation)을 이용하여 구현된다. 도 3a 및 3b에 예시된 바와 같이, 분석 및 합성 필터 뱅크(38 내지 44)는 QMF 필터 뱅크, 즉, 사전에 정보 신호를 분할하여 이 신호를 다시 재연결(re-joining)하는 QMF를 이용하는 MDCT 기반 필터 뱅크로서 구현될 수 있다. QMF는, 10이 단지 예인 10 블록의 중복을 가진 다채널 변조 필터 뱅크를 의미하는 MPEG HE-AAC 또는 AAC-ELD의 SBR 부분에 이용된 QMF와 유사하게 구현될 수 있다. 따라서, 랩핑 변환 표현은 분석 필터뱅크들(38, 40)에 의해 생성되고, 리샘플링 신호는 합성 필터뱅크들(42, 44)의 경우에 랩핑 변환 표현에서 재구성된다. 샘플링율 변화를 야기시키기 위해, 합성 필터 뱅크(42) 및 분석 필터 뱅크(40)는 변화하는 변환 길이에서 동작하도록 구현될 수 있지만, 필터 뱅크 또는 QMF율, 즉, 연속 변환이 한편으로 제각기 분석 필터 뱅크(38 및 40)에 의해 생성되고, 다른 한편으로 제각기 합성 필터 뱅크(42 및 44)에 의해 재변환되는 율은 일정하고, 모든 구성 요소(38 내지 44)에 대해 동일하다. 그러나, 변환 길이를 변경하면, 샘플링율이 변화된다. 예를 들면, 분석 필터 뱅크(38) 및 합성 필터 뱅크(42)의 쌍을 고려한다. 분석 필터 뱅크(38)는 일정한 변환 길이 및 일정한 필터 뱅크 또는 변환율을 이용하여 동작한다고 가정한다. 이 경우에, 분석 필터 뱅크(38)에 의해 출력되는 입력 신호의 랩핑 변환 표현은 일정한 샘플 길이를 가진 입력 신호의 연속적인 중복 영역의 각각에 대해 각각의 영역의 윈도우 버전의 변환을 포함하며, 이러한 변환은 또한 일정한 길이를 갖는다. 즉, 분석 필터 뱅크(38)는 합성 필터 뱅크(42)로 일정한 시간/주파수 해상도의 스펙트로그램(spectrogram)을 전송한다. 그러나, 합성 필터 뱅크의 변환 길이는 변화한다. 예를 들면, 분석 필터 뱅크(38)의 입력에서의 입력 샘플율과 합성 필터 뱅크(42)의 출력에서의 신호 출력의 샘플링율 사이의 제 1 다운샘플링율에서 제 2 다운샘플링율로 다운샘플링하는 경우를 고려한다. 제 1 다운샘플링율이 유효하는 한, 분석 필터 뱅크(38)에 의해 출력되는 랩핑 변환 표현 또는 스펙트로그램은 단지 부분적으로 합성 필터 뱅크(42) 내에 재변환을 공급하는데 이용된다. 합성 필터 뱅크(42)의 재변환은 간단하게 분석 필터 뱅크(38)의 스펙트로그램 내의 연속 변환의 낮은 주파수 부분에 적용된다. 합성 필터 뱅크(42)의 재변환에 이용되는 낮은 변환 길이로 인해, 합성 필터 뱅크(42)의 재변환 내의 샘플의 수는 또한, 중복 시간 부분의 클러스터에서, 필터 뱅크(38)에서 변환된 샘플의 수에 비해 적어, 분석 필터 뱅크(38)의 입력을 입력하는 정보 신호의 원래의 샘플링율에 비해 더 낮은 샘플링율을 생성한다. 연속 재변환과 필터 뱅크(42)의 출력에서의 출력 신호의 연속 중복 영역 사이의 중복에서 시간 앨리어싱 소거를 수행하기 위해 다운샘플링율이 합성 필터 뱅크(42)에 대해 여전히 문제가 없을 때와 동일하게 유지하는 한 문제가 발생하지 않는다.
제 1 다운샘플링율에서 보다 큰 제 2 다운샘플링율로의 변화와 같은 다운샘플링율의 변화가 발생할 때마다 문제가 발생한다. 이 경우에, 합성 필터 뱅크(42)의 재변환 내에 이용되는 변환 길이는 더욱 감소되어, 시간의 샘플링율 변화 지점 후에 각각의 다음의 영역 동안에 더 낮은 샘플링율을 생성한다. 다시 말하면, 시간의 샘플링율 변화 지점보다 바로 앞선 영역에 관한 재변환과 시간의 샘플링율 변화 지점 바로 다음의 리샘플링 신호의 영역에 관한 재변환 사이의 시간 앨리어싱 소거가 문제의 재변환 사이의 시간 앨리어싱 소거를 방해할 때에 합성 필터 뱅크(42)에 대한 문제가 발생한다. 따라서, 변화하는 변환 길이를 가진 분석 필터 뱅크(40)가 일정한 변환 길이의 합성 필터 뱅크(44)보다 우선하는 디코딩 측에서 유사한 문제가 발생하지 않는다는 것이 상당한 도움이 되지 않는다. 여기서, 합성 필터 뱅크(44)는 일정한 QMF/변환율의 스펙트로그램에 적용하지만, 주파수 해상도가 서로 다르며, 즉, 연속 변환은, 분석 필터 뱅크(40)에서, 일정한 율로 하지만, 서로 다른 또는 시간 변화 변환 길이를 가진 합성 필터 뱅크(44)로 전송되어, 0으로 전체 변환 길이의 높은 주파수 부분을 패딩(padding)하여 합성 필터 뱅크(44)의 전체 변환 길이의 낮은 주파수 부분을 보존한다. 합성 필터 뱅크(44)에 의해 출력되는 연속 재변환 사이의 시간 앨리어싱 소거는 합성 필터 뱅크(44)의 출력에서 출력되는 재구성된 신호의 샘플링율이 일정한 샘플율을 가질 때에는 문제가 되지 않는다.
따라서, 다시 말하면, 도 1a 및 1b에 대해 위에 제시된 샘플율 변화/적응을 실현하고자 할 때에 문제가 있지만, 이러한 문제는 정보 신호 재구성기에 대한 다음에 설명되는 일부 실시예에 따라 도 3a의 역 또는 합성 필터 뱅크(42)를 구현함으로써 극복될 수 있다.
샘플링율 적응/변화에 관한 위의 생각은 코딩 개념을 고려할 때 훨씬 더 흥미를 일으키며, 이에 따라 코딩될 정보 신호의 높은 주파수 부분은, 예를 들어, SBR(Spectral Band Replication)을 이용하여 파라메트릭(parametric) 방식으로 코딩되는 반면에, 낮은 주파수 부분은 변환 코딩 및/또는 예측 코딩 등을 이용하여 코딩된다. 예를 들면, 정보 신호 인코더 및 정보 신호 디코더의 쌍을 도시한 도 4a 및 4b를 참조한다. 인코딩 측에서, 코어 인코더(16)는 도 3a에 도시된 바와 같이 실시된 리샘플러, 즉 분석 필터 뱅크(38) 및 변화하는 변환 길이 합성 필터 뱅크(42)의 연결에 따른다. 상술한 바와 같이, 분석 필터 뱅크(38)의 입력 및 합성 필터 뱅크(42)의 출력 사이의 시간 변화 다운샘플율을 달성하기 위해, 합성 필터 뱅크(42)는 이의 재변환을 일정한 범위의 스펙트럼의 서브 부분, 즉, 서브 부분이 합성 필터 뱅크(42)의 변환 길이의 시간 변화 길이를 갖는 분석 필터 뱅크(38)에 의해 출력되는 일정한 길이 및 일정한 변환율(46)의 변환에 적용한다. 시간 변화는 이중 방향의 화살표(double-headed arrow)(48)로 예시된다. 분석 필터 뱅크(38) 및 합성 필터 뱅크(42)의 연결에 의해 리샘플링되는 낮은 주파수 부분(50)이 코어 인코더(16)에 의해 인코딩되지만, 나머지, 즉 스펙트럼(46)의 나머지 주파수 부분을 구성하는 높은 주파수 부분(52)은 파라메트릭 엔벨로프 코더(parametric envelope code, 54)의 엔벨로프의 파라메트릭 코딩이 이루어질 수 있다. 따라서, 코어 데이터 스트림(56)은 파라메트릭 엔벨로프 코더(54)에 의해 출력되는 파라메트릭 코딩 데이터 스트림(58)을 수반한다.
디코딩 측에서, 디코더는 또한 코어 디코더(22) 다음에 도 3b에 도시된 바와 같이 구현되는 리샘플러가 따르며, 즉, 분석 필터 뱅크(40) 다음에 합성 필터 뱅크(44)가 따르며, 분석 필터 뱅크(40)는 인코딩 측에서 합성 필터 뱅크(42)의 변환 길이의 시간 변화에 동기화된 시간 변화 변환 길이를 갖는다. 코어 디코더(22)는디코딩하기 위해 코어 데이터 스트림(56)을 수신하지만, 파라메트릭 엔벨로프 디코더(60)는 파라메트릭 데이터 스트림(58)을 수신하여, 이로부터 높은 주파수 부분 52'을 도출하기 위해 제공되며, 이는 변화하는 변환 길이, 즉, 인코딩 측에서 합성 필터 뱅크(42)에 의해 이용되는 변환 길이의 시간 변화에 동기화되고, 코어 디코더(22)에 의해 출력되는 샘플링율의 변화에 동기화되는 길이의 낮은 주파수 부분(50)을 보완한다.
도 4a의 인코더의 경우, 분석 필터 뱅크(38)는 어쨌든 리샘플러의 형성이 단지 합성 필터 뱅크(42)의 추가만을 필요로 하도록 제공되는 것이 유리하다. 샘플율을 전환함으로써, 단지 파라메트릭 엔벨로프 코딩만이 이루어지기 쉬운 HF 부분에 비해 더욱 정확한 코어 인코딩이 이루어지는 스펙트럼(46)의 LF 부분의 비율에 적응할 수 있다. 특히, 이러한 비율은 전체 데이터 스트림 등을 전송하기 위한 이용 가능한 전송 대역폭과 같은 외부 조건에 따라 효율적인 방식으로 제어될 수 있다. 인코딩 측에서 제어되는 시간 변화는 예를 들어 각각의 보조(side) 정보 데이터를 통해 디코딩 측으로 신호를 보내기가 용이하다.
따라서, 도 1a 내지 4b에 관련하여, 시간 앨리어싱 소거를 필요로 하는 랩핑 변환 표현의 사용에도 불구하고 샘플링율 변화를 효율적으로 가능하게 하는 개념을 가까이에 갖는 것이 유리한 것으로 도시되었다. 도 5는, 도 2b에서 합성 필터 뱅크(42) 또는 재변환기(36)를 구현하는데 이용될 경우에, 상술한 문제를 극복하여, 상술한 바와 같은 샘플율 변화의 이점을 이용하는 이점을 달성하는 정보 신호 재구성기의 실시예를 도시한다.
도 5에 도시된 정보 신호 재구성기는 정보 신호 재구성기(80)의 입력(76)과 출력(78) 사이에서 언급하는 순서로 직렬 연결되는 재변환기(70), 리샘플러(72) 및 조합기(74)를 포함한다.
도 5에 도시된 정보 신호 재구성기는, 앨리어싱 소거를 이용하여, 입력(76)에서 입력하는 정보 신호의 랩핑 변환 표현으로부터 정보 신호를 재구성하기 위한 것이다. 즉, 정보 신호 재구성기는 입력(76)에 입력할 시에 이러한 정보 신호의 랩핑 변환 표현을 이용하여 시간 변화 샘플율로 출력(78)에서 정보 신호를 출력하기 위한 것이다. 정보 신호의 랩핑 변환 표현은, 정보 신호의 연속적인 중복 시간 영역(또는 시간 간격)의 각각에 대해, 각각의 영역의 윈도우 버전의 변환을 포함한다. 아래에 보다 상세히 설명되는 바와 같이, 정보 신호 재구성기(80)는 정보 신호(90)의 이전의 영역(84)과 다음의 영역(86) 사이의 경계(82)에서 변화하는 샘플율로 정보 신호를 재구성하도록 구성된다.
정보 신호 재구성기(80)의 개개의 모듈(70 내지 74)의 기능을 설명하기 위해, 입력(76)에서 입력하는 정보 신호의 랩핑 변환 표현은 일정한 시간/주파수 해상도, 즉, 시간 및 주파수가 일정한 해상도를 갖는다는 것이 사전에 가정된다. 다른 시나리오는 나중에 논의된다.
바로 언급된 가정에 따르면, 랩핑 변환 표현은 도 5에서 (92)로 도시된 바와 같은 생각일 수 있다. 도시된 바와 같이, 랩핑 변환 표현은 어떤 변환율 △t로 시간적으로 연속한 변환의 시퀀스를 포함한다. 각 변환(94)은 정보 신호의 각각의 시간 영역 i의 윈도우 버전의 변환을 나타낸다. 특히, 주파수 해상도가 표현(92)을 위해 시간적으로 일정할 때, 각 변환(94)은 변환 계수의 상수, 즉 Nk를 포함한다. 이것은 효과적으로 표현(92)이 도 5에 예시된 바와 같이 스펙트럼 축 k를 따라 엄격하게 순서가 정해질 수 있는 Nk 스펙트럼 구성 요소 또는 서브 대역을 포함하는 정보 신호의 스펙트로그램임을 의미한다. 각각의 스펙트럼 구성 요소 또는 서브 대역에서, 스펙트로그램 내의 변환 계수는 변환율 △t로 발생한다.
이와 같이 일정한 시간/주파수 해상도를 가진 랩핑 변환 표현(92)은, 예를 들어, 도 3a에 도시된 바와 같이 QMF 분석 필터 뱅크에 의해 출력된다. 이 경우에, 각 변환 계수는 복소수이며, 즉 각 변환 계수는 예를 들어 실수 부분 및 허수 부분을 갖는다. 그러나, 랩핑 변환 표현(92)의 변환 계수는 반드시 복소수일 필요는 없을 뿐만 아니라, 순수 MDCT의 경우에서와 같이 오로지 실수일 수 있다. 이 외에도, 도 5의 실시예는 또한 시간 영역의 중복 부분에서 앨리어싱을 일으키는 다른 랩핑 변환 표현으로 이동 가능하다는 것이 주목되며, 이의 변환(94)은 랩핑 변환 표현(92) 내에 연속적으로 배열된다.
재변환기(70)는, 각 변환(94)에 대해, 연속 시간 영역들(84, 86)에 대한 각각의 시간 엔벨로프(96)에 의해 예시되는 재변환을 획득하기 위해 변환(94)에 재변환을 적용하도록 구성되며, 시간 엔벨로프는 변환(94)의 시퀀스를 생성하기 위해 정보 신호의 상술한 시간 부분에 적용되는 윈도우에 거의 대응한다. 이전의 시간 영역(84)이 관계되는 한, 도 5는 랩핑 변환 표현(92)에서 영역(84)과 관련된 전체 변환(94)에 재변환을 적용함으로써, 영역(84)에 대한 재변환(96)이 예를 들어 Nk 샘플 또는 두배의 Nk 샘플을 포함한다는 것을 가정하며, 어쨌든, 각각의 변환(94)이 획득된 윈도우 부분을 구성하는 만큼 많은 샘플은 표현(92)의 변환(94)이 생성된 단위로 연속 시간 영역 사이의 중복을 결정하는 요소인 요소 a를 가진 시간 영역(84)의 전체 시간적 길이 △t·a를 샘플링한다. 시간 영역(84) 내의 시간 샘플의 수 및 시간 영역(84)에 속하는 변환(94) 내의 변환 계수의 수의 균등성(equality)(또는 이중성)은 단지 예시를 위해 선택되었고, 균등성(또는 이중성)은 또한 이용된 상세한 랩핑 변환에 따라 대안적인 실시예에 의해 양방의 수 사이의 다른 일정한 비율에 의해 대체될 수 있다는 것이 주목되어야 한다.
정보 신호 재구성기는 시간 영역 84(84)과 시간 영역 86(86) 사이의 정보 신호의 샘플율을 변화시키고자 하는 것으로 추정된다. 그렇게 할 동기는 외부 신호(98)에서 생길 수 있다. 예를 들면, 정보 신호 재구성기(80)가 각각 도 3a 및 도 4a의 합성 필터 뱅크(42)를 구현하기 위해 이용될 경우, 샘플율 변화가 데이터 스트림의 전송 조건의 변화의 코스와 같이 더욱 효율적인 코딩을 약속할 때마다 신호(98)가 제공될 수 있다.
본 발명에서, 예시적인 목적을 위해, 정보 신호 재구성기(80)는 시간 영역들(84, 86) 사이에서 샘플율을 감소시키고자 하는 것으로 추정된다. 따라서, 재변환기(70)는 또한 다음 영역(86)에 대한 재변환(100)을 획득하기 위해 다음 영역(86)의 윈도우 버전의 변환에 재변환을 적용하지만, 이때 재변환기(70)는 재변환을 수행하기 위해 낮은 변환 길이를 이용한다. 더 정확하게 하기 위해, 재변환기(70)는 획득된 재변환(100)이 낮은 샘플율을 포함하도록 다음 영역(86)만에 대한 변환의 변환 계수, 즉 변환 계수 1 ... Nk' 중 가장 낮은 Nk' < Nk로 재변환을 수행하며, 즉, 그것은 Nk 대신에 단지 Nk'(또는 후자 수의 대응하는 분수)로 샘플링된다.
도 5에 도시된 바와 같이, 재변환(96)과 재변환(100) 사이에서 발생하는 문제는 다음과 같다. 이전의 영역(84)에 대한 재변환(96) 및 다음의 영역(86)에 대한 재변환(100)은 이전의 영역(84)과 다음의 영역(86) 사이의 경계(82)에서의 앨리어싱 소거 부분(102)에서 중복하며, 앨리어싱 소거 부분의 시간 길이는 예를 들어 (a - 1)·△t이지만, 이러한 앨리어싱 소거 부분(102) 내의 재변환(96)의 샘플의 수는 동일한 앨리어싱 소거 부분(102) 내의 재변환(100)의 샘플의 수(본 예에서는 보다 높다)와 상이하다. 따라서, 시간 간격(102) 내에서 양방의 재변환(96, 100)을 중복-추가를 수행함으로써 시간 앨리어싱 소거는 간단하지 않다.
따라서, 리샘플러(72)는 재변환기(70)와 조합기(74) 사이에 연결되며, 이 중 후자는 시간 앨리어싱 소거를 수행할 책임이 있다. 특히, 리샘플러(72)는, 보간에 의해, 경계(82)에서의 샘플율 변화에 따라 앨리어싱 소거 부분(102)에서 이전의 영역(84)에 대한 재변환(96) 및/또는 다음의 영역(86)에 대한 재변환(100)을 리샘플링하도록 구성된다. 재변환(96)이 재변환(100)보다 일찍 리샘플러(72)의 입력에 도달할 때, 리샘플러(72)는 이전의 영역(84)에 대한 재변환(96)으로 리샘플링을 수행하는 것이 바람직할 수 있다. 즉, 보간(104)에 의해, 앨리어싱 소거 부분(102) 내에 포함되는 재변환(96)의 대응하는 부분은 동일한 앨리어싱 소거 부분(102) 내의 재변환(100)의 샘플링 조건 또는 샘플 위치에 대응하기 위해 리샘플링된다. 그 후, 조합기(74)는 새로운 샘플율에서 시간 간격(102) 내에서 재구성된 신호(90)를 획득하기 위해 재변환(96) 및 재변환(100)의 재샘플링된 버전으로부터 공동 위치된 샘플을 간단히 추가할 수 있다. 이 경우에, 출력 재구성된 신호의 샘플율은 시간 부분(86)의 선단(leading end)(시작)에서 이전의 샘플율로부터 새로운 샘플율로 전환한다. 그러나, 보간은 또한 재구성된 신호(90)의 샘플율 전환을 위해 시간적으로 다른 지점(82)을 달성하기 위해 시간 간격(102)의 선단 및 후단 절반에 대해 다르게 적용될 수 있다. 따라서, 시간 순간(instant)(82)은 도 5에서 단지 예시적인 목적을 위해 부분 84 및 86(84, 86) 사이의 중복의 중간에 있도록 도시되었고, 다른 실시예에 따라 시간의 동일한 지점은 부분 86(86)의 시작과 부분 84(84)의 끝 사이의 다른 곳에 놓을 수 있고, 양방을 포함할 수 있다.
따라서, 조합기(74)는 그 후 앨리어싱 소거 부분(102)에서 리샘플링에 의해 획득될 때, 각각 이전의 및 다음의 영역들(84, 86)에 대한 재변환들(96, 100) 사이의 앨리어싱 소거를 수행할 수 있다. 좀 더 정확하게 말한다면, 앨리어싱 소거 부분(102) 내에서 앨리어싱을 소거하기 위해, 조합기(74)는 리샘플러(72)에 의해 획득된 바와 같은 리샘플링된 버전을 이용하여 부분(102) 내의 재변환(96 및 100) 사이의 중복-추가 프로세스를 수행한다. 정보 신호(90)의 샘플율이 시간 순간(82)에서 높은 샘플율에서 낮은 샘플율로 변화할지라도, 중복-추가 프로세스는, 변환(94)을 생성하는 윈도잉과 함께, 심지어 경계(82) 맞은편의 출력(78)에서 앨리어싱 없이 지속적으로 증폭된 정보 신호(90)의 재구성을 생성한다.
따라서, 도 5의 상기 설명으로부터 나타난 바와 같이, 이전의 시간 영역(84)의 윈도우 버전의 변환(94)에 적용된 재변환의 변환 길이 대 이전의 영역(84)의 시간적 길이의 비율은 양쪽 모두의 영역들(84, 86) 사이의 경계(82)에서의 샘플율 변화에 대응하는 인수만큼 다음의 영역(86)의 윈도우 버전에 적용된 재변환의 변환 길이 대 다음의 영역(86)의 시간적 길이의 비율과 다르다. 방금 설명된 예에서, 이러한 비율 변화는 외부 신호(98)에 의해 예시적으로 초기화되었다. 이전의 및 다음의 시간 영역들(84, 86)의 시간적 길이는 서로 동등한 것으로 가정되었고, 재변환기(70)는, 예를 들어, 변환의 최대 제 Nk' 변환 계수와 같이 낮은 주파수 부분에서 다음의 영역(86)의 윈도우 버전의 변환(94)에 재변환의 적용을 제한하도록 구성되었다. 당연히, 이와 같은 그래빙(grabbing)은 또한 이전의 영역(84)의 윈도우 버전의 변환(94)에 대해 이미 생성되었다. 더욱이, 상기 예시와는 달리, 경계(82)에서의 샘플율 변화는 다른 방향으로 수행될 수 있어서, 다음의 영역(86)에 대해서는 그래빙이 수행될 수 없지만, 대신에 이전의 영역(84)의 윈도우 버전의 변환(94)에 대해서만 그래빙이 수행될 수 있다.
좀 더 정확하게 말한다면, 지금까지, 도 5의 정보 신호 재구성기의 동작의 모드는 정보 신호의 영역의 윈도우 버전의 변환(94)의 변환 길이 및 정보 신호의 영역의 시간적 길이가 일정한 경우, 즉 랩핑 변환 표현(92)이 일정한 시간/주파수 해상도를 가진 스펙트로그램인 경우에 대해 예시적으로 설명되었다. 경계(82)를 위치하기 위해, 정보 신호 재구성기(80)는 제어 신호(98)에 응답하기 위해 예시적으로 설명되었다.
따라서, 이러한 구성에서, 도 5의 정보 신호 재구성기(80)는 도 3a의 리샘플러(14)의 부분일 수 있다. 즉, 도 3의 리샘플러(14)는 정보 신호의 랩핑 변환 표현을 제공하는 필터 뱅크(38), 및 앨리어싱 소거를 이용하여, 지금까지 설명된 바와 같이 정보 신호의 랩핑 변환 표현으로부터 정보 신호를 재구성하도록 구성된 정보 신호 재구성기(80)를 포함하는 역 필터 뱅크의 연결로 구성될 수 있다. 따라서, 도 5의 재변환기(70)는 QMF 합성 필터 뱅크로 구성될 수 있고, 필터 뱅크(38)는 예를 들어 QMF 분석 필터 뱅크로 구현된다.
도 1a 및 4a의 설명으로부터 명백해지듯이, 정보 신호 인코더는 코어 인코더(16) 또는 복합 코어 인코더(16) 및 파라메트릭 엔벨로프 코더(54)와 같은 압축단과 함께 이와 같은 리샘플러를 포함할 수 있다. 압축단은 재구성된 정보 신호를 압축하도록 구성된다. 도 1a 및 4a에 도시된 바와 같이, 이와 같은 정보 신호 인코더는, 예를 들어, 이용 가능한 전송 비트율에 관한 외부 정보에 따라 제어 신호(98)를 제어하도록 구성된 샘플율 제어기를 더 포함할 수 있다.
그러나, 대안적으로, 도 5의 정보 신호 재구성기는 랩핑 변환 표현 내에서 정보 신호의 영역의 윈도우 버전의 변환 길이의 변화를 검출하여 경계(82)를 위치시키도록 구성될 수 있다. 이러한 가능한 구현을 더욱 명확하게 하기 위해, 인바운드(inbound) 랩핑 변환 표현의 예가 도시되는 도 5에서 (92')를 참조하며, 이에 따라 표현(92') 내의 연속 변환(94)은 일정한 변환율 △t로 재변환기(70)에 여전히 도달하지만, 개개의 변환의 변환 길이는 변화한다. 도 5에서, 예를 들어, 이전의 시간 영역(84)의 윈도우 버전의 변환의 변환 길이는 단지 Nk'인 것으로 가정되는 다음의 영역(86)의 윈도우 버전의 변환의 변환 길이보다 더 크다(즉, Nk)는 것이 가정된다. 아무래도, 재변환기(70)는 입력 데이터 스트림으로부터 랩핑 변환 표현(92')에 관한 정보를 정확하게 구문 분석(parse)할 수 있으며, 이에 따라 재변환기(70)는 정보 신호의 연속 영역의 윈도우 버전의 변환에 적용된 재변환의 변환 길이를 랩핑 변환 표현(92')의 연속 변환의 변환 길이에 적응시킬 수 있다. 따라서, 재변환기(70)는 이전의 시간 영역(84)의 윈도우 버전의 변환(94)의 재변환을 위한 Nk의 변환 길이, 및 다음의 시간 영역(86)의 윈도우 버전의 변환의 재변환을 위한 Nk'의 변환 길이를 이용하여, 이미 상술되었고, 도 5의 상부 중간에 도시되는 재변환 사이에서 샘플율 불일치를 획득할 수 있다. 따라서, 도 5의 정보 신호 재구성기(80)의 동작 모드가 관계되는 한, 이러한 동작 모드는 재변환의 변환 길이를 랩핑 변환 표현(92') 내에서 변환의 변환 길이에 적응시킬 시에 방금 언급된 차이 이외에 상기 설명과 일치한다.
따라서, 후자의 기능에 따라, 정보 신호 재구성기는 외부 제어 신호(98)에 응답할 필요가 없다. 오히려, 인바운드 랩핑 변환 표현(92')은 시간의 샘플율 변화 지점에 관해 정보 신호 재구성기에 알리는데 충분할 수 있다.
상술한 바와 같이 동작하는 정보 신호 재구성기(80)는 도 2의 재변환기(36)를 형성하기 위해 이용될 수 있다. 즉, 정보 신호 디코더는 데이터 스트림으로부터 정보 신호의 랩핑 변환 표현(92')을 재구성하도록 구성된 압축 해제기(34)를 포함할 수 있다. 이미 상술한 바와 같이, 재구성은 엔트로피 디코딩을 포함할 수 있다. 변환(94)의 시간 변화 변환 길이는 적절한 방식으로 압축 해제기(34)에 입력하는 데이터 스트림 내에 신호 전송될 수 있다. 도 5에 도시된 바와 같이 정보 신호 재구성기는 재구성기(36)로 이용될 수 있다. 이는, 앨리어싱 소거를 이용하여, 압축 해제기(34)에 의해 제공되는 랩핑 변환 표현으로부터 정보 신호를 재구성하도록 구성될 수 있다. 후자의 경우에, 재변환기(70)는, 예를 들어, 재변환을 수행하기 위해 IMDCT를 이용하도록 수행될 수 있으며, 변환(94)은 복소수 계수보다 실수 계수에 의해 표현될 수 있다.
따라서, 상기 실시예는 많은 이점을 달성할 수 있다. 예를 들어, 초당 8 kb 내지 초당 128 kb와 같은 비트율의 전체 범위에서 동작하는 오디오 코덱의 경우, 최적의 샘플율은 도 4a 및 도 4b에 대해 상술한 바와 같이 비트율에 의존할 수 있다. 낮은 비트율의 경우, 낮은 주파수만이, 예를 들어, ACELP 또는 변환 코딩과 같은 더욱 정확한 코딩 방법으로 코딩되어야 하지만, 높은 주파수는 파라메트릭 방식으로 코딩되어야 한다. 높은 비트율의 경우, 전체 스펙트럼은, 예를 들어, 정확한 방법으로 코딩되어야 한다. 이것은, 예를 들어, 이러한 정확한 방법이 항상 최적의 표현에서 신호를 코딩해야 한다는 것을 의미한다. 이러한 신호의 샘플율은 나이퀴스트(Nyquist) 정리에 따라 가장 관련된 신호 주파수 성분의 운반을 허용하도록 최적화되어야 한다. 따라서, 도 4a에서 보면, 여기에 도시된 샘플율 제어기(120)는 정보 신호가 이용 가능한 전송 비트율에 따라 코어 인코더(16)에 공급되는 샘플 비트율을 제어하도록 구성될 수 있다. 이것은 코어 인코더(16)로 분석 필터 뱅크의 스펙트럼의 낮은 주파수 서브 부분만을 공급하는 것에 대응한다. 나머지 높은 주파수 부분은 파라메트릭 엔벨로프 코더(54)에 공급될 수 있다. 각각, 상술한 바와 같이, 샘플율 및 전송 비트율의 시간 변화는 문제가 되지 않는다.
도 5의 설명은 샘플율 변화 시간 인스턴스에서 시간 앨리어싱 소거 문제를 해결하기 위해 이용될 수 있는 정보 신호 재구성에 관한 것이다. 도 1 내지 도 4b에 대해 이미 상술한 바와 같이, 일부 방법은 또한 도 1 내지 도 4b의 배경에서 연속 모듈 사이의 인터페이스에서 행해져야 하며, 여기서, 변환기는 도 5의 정보 신호 재구성기에 입력할 때 랩핑 변환 표현을 생성해야 한다.
도 6은 정보 신호 변환기에 대한 이러한 실시예를 도시한다. 도 6의 정보 신호 변환기는 샘플의 시퀀스의 형식으로 정보 신호를 수신하는 입력(105), 정보 신호의 연속적인 중복 영역을 그래빙(grabbing)하도록 구성되는 그래버(grabber)(106), 연속적인 중복 영역의 각각이 연속적인 중복 영역 중에서 변화하는 일정한 샘플율을 갖도록 연속적인 중복 영역의 적어도 서브세트에 리샘플링을 적용하도록 구성된 리샘플러(107), 연속적인 중복 영역에 윈도잉을 적용하도록 구성된 윈도우어(108), 및 도 6의 정보 신호 변환기의 출력(110)에서 출력되는 랩핑 변환 표현(92')을 형성하는 변환(94)의 시퀀스를 획득하기 위해 윈도우 부분에 개별적으로 변환을 적용하도록 구성된 변환기를 포함한다. 윈도우어(108)는 해밍(Hamming) 윈도잉 등을 이용할 수 있다.
그래버(106)는 정보 신호의 연속적인 중복 영역이, 예를 들어, 각각 20 ms와 같은 시간의 동일한 길이를 갖도록 그래빙을 수행하기 위해 구성될 수 있다.
따라서, 그래버(106)는 정보 신호 부분의 시퀀스를 리샘플러(107)로 전송한다. 예를 들면, 인바운드 정보 신호가 미리 정해진 시간 순간에 제 1 샘플율에서 제 2 샘플율로 전환하는 시간 변화 샘플율을 갖는다고 가정하면, 리샘플러(107)는 도 6의 (111)에 예시된 바와 같이 연속 샘플율이 제 1 샘플율에서 제 2 샘플율로 한번 변화하도록 미리 정해진 시간 순간을 시간적으로 포함하는 인바운드 정보 신호를 보간에 의해 리샘플링하도록 구성될 수 있다. 이를 더욱 명확하게 하기 위해, 도 6은 샘플율이 어떤 시간 순간(113)에서 전환하는 샘플(112)의 시퀀스를 예시적으로 도시하며, 일정한 시간 길이 영역(114a 내지 114d)은, 일정한 영역 시간 길이와 함께, 영역의 연속 쌍 당 50%의 중복과 같은 연속 영역(114a 내지 114d) 사이의 미리 정해진 중복을 정의하는 일정한 영역 오프셋 △t(115)으로 예시적으로 그래빙되지만, 이것은 단지 일례로서 이해되어야 한다. 시간 순간(113) 전의 제 1 샘플율은 δt1로 예시되고, 시간 순간(113) 후의 샘플율은 δt2로 나타낸다. 부호 111에 예시된 바와 같이, 리샘플러(107)는, 예를 들어, 일정한 샘플율 δt1을 갖기 위해 영역(114b)을 리샘플링하도록 구성될 수 있지만, 시간적으로 다음의 영역(114c)은 일정한 샘플율 δt2을 갖도록 리샘플링된다. 원칙적으로, 그것은 리샘플러(107)가, 보간에 의해, 아직 타겟 샘플율을 갖지 않은 시간 순간(113)을 시간적으로 포함하는 각각의 영역들(114b, 114c)의 서브 부분을 리샘플링하는 경우에 충분할 수 있다. 예를 들면, 영역(114b)의 경우에, 그것은 리샘플러(107)가 시간적 시간 순간(113) 다음의 영역(114b)의 서브 부분을 리샘플링하는 경우에 충분할 수 있는 반면에, 영역(114c)의 경우에는, 시간 순간(113) 이전의 서브 부분만이 리샘플링될 수 있다. 이 경우에, 그래핑된(grabbed) 영역(114a 내지 114d)의 일정한 시간 길이로 인해, 각 리샘플링된 영역은 각각의 일정한 샘플율δt1,2에 대응하는 시간 샘플 N1,2의 수를 갖는다. 윈도우어(108)는 이의 윈도우 또는 윈도우 길이를 각 인바운드 부분의 이러한 샘플의 수에 적응시킬 수 있으며, 이는 이에 따라 변환의 변환 길이를 적응시킬 수 있는 변환기(109)에 적용한다. 즉, 도 6의 (111)에 도시된 예의 경우에, 출력(110)에서의 랩핑 변환 표현은 변환의 시퀀스를 가지며, 이의 변환 길이는 연속 영역의 샘플의 수에 따라, 즉, 선형적으로 의존하여 변화하며, 즉 증가하고 감소하여, 각각의 영역이 리샘플링된 일정한 샘플율에 선형적으로 의존한다.
리샘플러(107)는 각각의 영역 내에서 리샘플링되어야 하는 샘플의 수가 최소로 되도록 연속 영역(114a 내지 114d) 사이의 샘플율 변화를 등록하도록 구성될 수 있다는 것이 주목되어야 한다. 그러나, 리샘플러(107)는, 대안적으로, 다르게 구현될 수 있다. 예를 들면, 리샘플러(107)는 다운샘플링보다 업샘플링을 선호하거나 그 반대이도록, 즉 시간 순간(113)과 중복하는 모든 영역이 제 1 샘플율 δt1 또는 제 2 샘플율 δt2로 리샘플링되도록 리샘플링을 수행하도록 구성될 수 있다.
도 6의 정보 신호 변환기는, 예를 들어, 도 2a의 변환기(109)를 구현하는데 이용될 수 있다. 이 경우에, 예를 들면, 변환기(109)는 MDCT를 수행하도록 구성될 수 있다.
이 점에서, 변환기(109)에 의해 적용되는 변환의 변환 길이는 리샘플링된 샘플의 수로 측정된 영역(114c)의 크기보다 더 클 수 있다는 것이 주목되어야 한다. 이 경우에, 윈도우어(108)에 의해 출력되는 윈도우 영역 이상으로 확장하는 변환 길이의 영역은 변환기(109)에 의해 이러한 영역에 변환을 적용하기 전에 0으로 설정될 수 있다.
도 5에서의 보간(104) 및 도 6에서의 리샘플러(107) 내의 보간을 더욱 상세히 실현하기 위한 가능한 구현을 계속 설명하기 전에, 도 1a 및 도 1b의 인코더 및 디코더에 대한 가능한 구현을 도시하는 도 7a 및 도 7b에 대한 참조가 행해진다. 특히, 리샘플러들(14, 24)는 도 3a 및 도 3b에 도시된 바와 같이 실시되는 반면에, 코어 인코더 및 코어 디코더(16, 22)는, 각각, 한편으로 MDCT 기반 변환 코딩과 다른 한편으로 ACELP 코딩과 같은 CELP 코딩 사이에서 전환할 수 있는 코덱으로 실시된다. MDCT 기반 코딩/디코딩 브랜치들(122, 124)은, 각각, 예를 들어, 각각, TCX 인코더 및 TCX 디코더일 수 있다. 대안적으로, AAC 코더/디코더 쌍이 이용될 수 있다. CELP 코딩의 경우, ACELP 인코더(126)는 코어 인코더(16)의 다른 코딩 브랜치를 형성할 수 있고, ACELP 디코더(128)는 코어 디코더(22)의 다른 디코딩 브랜치를 형성할 수 있다. 양쪽 모두의 코딩 브랜치 사이의 전환은 USAC [2] 또는 AMR-WB+ [1]에서 흔히 있는 일이지만 프레임별로 이들 코딩 모듈에 관해 더욱 상세히 참조가 행해지는 표준 텍스트로 수행될 수 있다.
도 7a 및 도 7b의 인코더 및 디코더를 더 특정 예로 취하면, 코딩 브랜치들(122, 126)에 입력하여, 디코딩 브랜치들(124, 128)에 의해 재구성하기 위한 내부 샘플링율의 전환을 허용하는 방식이 아래 더욱 상세히 설명된다. 특히, 입력(12)에 입력하는 입력 신호는, 예를 들어, 32 kHz와 같은 일정한 샘플율을 가질 수 있다. 이러한 신호는 상술한 방식으로 QMF 분석 및 합성 필터 뱅크 쌍(38, 42)을 이용하여, 즉, 예를 들어, 25.6 kHz 또는 12.8 kHz의 전용 샘플율을 가진 코어 인코더(16)에 입력하는 내부 시간 신호로 이어지는 1.25 또는 2.5와 같은 대역의 수에 관한 적절한 분석 및 합성 비율로 리샘플링될 수 있다. 따라서, 다운샘플링된 신호는, 코딩 브랜치(122)의 경우에 MDCT 표현 및 전형적인 변환 코딩 방식을 이용하는 것과 같은 코딩 모드의 코딩 브랜치 중 하나를 이용하거나, 예를 들어 코딩 브랜치(126)에서 ACELP를 이용하는 시간 도메인에 코딩된다. 따라서, 코어 인코더(16)의 코딩 브랜치들(126, 122)에 의해 형성된 데이터 스트림은 이것이 재구성되는 디코딩 측으로 출력되고 전송된다.
내부 샘플율을 전환하는 경우, 필터 뱅크(38 내지 44)는 코어 인코더(16) 및 코어 디코더(22)가 동작하는 내부 샘플율에 따라 프레임별로 적응될 필요가 있다. 도 8은 몇 가지 가능한 전환 시나리오를 도시하며, 도 8은 단지 인코더 및 디코더의 MDCT 코딩 경로를 도시한다.
특히, 도 8은 32 kHz인 것으로 가정되는 입력 샘플율이 입력 샘플율을 유지하는 추가적인 가능성을 가진 어느 25.6 kHz, 12.8 kHz 또는 8 kHz로 다운샘플링될 수 있음을 도시한다. 입력 샘플율 및 내부 샘플율 사이의 선택된 샘플율 비율에 따라, 한편으로 필터 뱅크 분석과 다른 한편으로는 필터 뱅크 합성 사이의 변환 길이 비율이 있다. 이러한 비율은 회색 음영 박스: 각각, 선택된 내부 샘플율과 무관한 필터 뱅크들(38, 44) 내의 40 서브 대역, 및 각각, 선택된 내부 샘플율에 따른 필터 뱅크들(42, 40) 내의 40, 32, 16 또는 10 서브 대역 내에서 도 8로부터 도출할 수 있다. 코어 인코더 내에 이용되는 MDCT의 변환 길이는 시간적으로 측정된 생성된 변환율 또는 변환 피치 간격이 일정하거나 선택된 내부 샘플율과 무관하도록 생성된 내부 샘플율에 적응된다. 그것은, 예를 들어, 각각, 선택된 내부 샘플율에 따라 640, 512, 256 및 160의 변환 길이를 지속적으로 생성하는 20 ms일 수 있다.
상술한 원리를 이용하여, 필터 뱅크 전환에 관한 다음의 제약 조건에 따라 내부 샘플율을 전환할 수 있다:
- 추가적인 지연은 전환 동안에 발생되지 않는다.
- 전환 또는 샘플율 변화는 즉시 발생할 수 있다.
- 전환 아티팩트는 최소화되거나 적어도 감소된다.
- 계산 복잡성이 낮다.
기본적으로, 필터 뱅크(38 내지 44) 및 코어 코더 내의 MDCT는 랩핑 변환이며, 필터 뱅크는 코어 인코더 및 디코더의 MDCT에 비해 윈도우 영역의 많은 중복을 이용할 수 있다. 예를 들면, 10번 중복은 필터 뱅크에 적용할 수 있는 반면에, 2번 중복은 MDCT(122, 124)에 적용할 수 있다. 랩핑 변환의 경우, 상태 버퍼는 분석 필터 뱅크 및 MDCT에 대한 분석 윈도우 버퍼, 및 합성 필터 뱅크 및 IMDCT에 대한 중복-추가 버퍼로 나타낼 수 있다. 율 전환의 경우에, 이러한 상태 버퍼는 도 5 및 도 6에 대해 상술한 방식으로 샘플율 전환에 따라 조정되어야 한다. 다음에는, 도 5에 대해 논의된 합성 경우보다는 도 6에서 논의된 분석 측에서 수행될 수도 있는 보간에 관해 더욱 상세한 논의가 제공된다. 랩핑 변환의 프로토타입(prototype) 또는 윈도우가 적응될 수 있다. 전환 아티팩트를 감소시키기 위해, 상태 버퍼 내의 신호 구성 요소는 랩핑 변환의 앨리어싱 소거 속성을 유지하기 위해 보존되어야 한다.
다음에는,리샘플러(72) 내에서 보간(104)을 수행하는 방법에 관한 더욱 상세한 설명이 제공된다.
두 경우가 구별될 수 있다:
1) 상향 전환(switching up)은 샘플율이 이전의 시간 부분(84)에서 후속 또는 다음의 시간 부분(86)으로 증가하는 프로세스이다.
2) 하향 전환(switching down)은 샘플율이 이전의 시간 부분(84)에서 다음의 시간 부분(86)으로 감소하는 프로세스이다.
상향 전환, 즉 12.8 kHz(20 ms 당 256 샘플)에서 32 kHz(20 ms 당 640 샘플)으로의 상향 전환을 가정하면, 도 5에서 참조 부호 130으로 예시적으로 도시된 리샘플러(72)의 상태 버퍼와 같은 상태 버퍼 또는 이의 콘텐츠는 주어진 예에서 2.5와 같이 샘플율 변화에 대응하는 인수만큼 확장될 필요가 있다. 추가 지연을 유발하지 않고 확장에 대한 가능한 솔루션은, 예를 들어, 선형 보간 또는 스플라인 보간이다. 즉, 리샘플러(72)는, 즉시, 상태 버퍼(130) 내에서, 시간 간격(102) 내에 있는 이전의 시간 영역(84)에 관한 재변환(96)의 후단의 샘플을 보간할 수 있다. 상태 버퍼는, 도 5에 도시된 바와 같이, 선입 선출 버퍼 역할을 할 수 있다. 당연히, 완전한 앨리어싱 소거에 필요한 모든 주파수 구성 요소가 이러한 절차에 의해 획득될 수 없지만, 예를 들어, 0 내지 6.4 kHz와 같은 적어도 낮은 주파수는 어떤 왜곡없이 음향 심리학적 관점에서 생성될 수 있으며, 이러한 주파수는 가장 관련성이 많은 주파수이다.
낮은 샘플율으로 하향 전환하는 경우에, 선형 또는 스플라인 보간은 또한 추가적인 지연을 유발하지 않고 이에 따라 상태 버퍼를 데시메이트(decimate)하는데 이용될 수 있다. 즉, 리샘플러(72)는 보간에 의해 샘플율을 데시메이트할 수 있다. 그러나, 데시메이션 인수가 2.5인, 32 kHz(20 ms 당 640 샘플)에서 12.8 kHz(20 ms 당 256 샘플)로의 전환과 같이 데시메이션 인수가 큰 샘플율로의 하향 전환은 높은 주파수 성분이 제거되지 않을 경우에 심하게 교란하는 앨리어싱을 발생시킬 수 있다. 이러한 현상을 바꾸기 위해, 높은 주파수 성분이 필터 뱅크 또는 재변환기를 "플러싱(flushing)"하여 제거될 수 있는 합성 필터링이 관계될 수 있다. 이것은 필터 뱅크가 전환 순간에 낮은 주파수 성분을 합성하여, 높은 스펙트럼 성분에서 중복-추가 버퍼를 삭제하는 것을 의미한다. 더 정확하게 말하자면, 이전의 시간 영역(84)에 대한 제 1 샘플율에서 다음의 시간 영역(86)에 대한 보다 낮은 샘플율로의 하향 전환을 상상한다. 상기 설명에서 벗어나면, 재변환기(70)는 이전의 시간 영역(84)의 윈도우 버전의 변환(94)의 모든 주파수 성분을 재변환에 참여시키지 않게 하여 하향 전환을 준비하도록 구성될 수 있다. 오히려, 재변환는 변환(94)의 관련되지 않은 높은 주파수 성분을 예를 들어 0으로 설정하거나, 점진적으로 점점 더 이러한 높은 주파수 성분을 감쇠하는 것과 같이 재변환에 상기 성분의 영향력을 감소시킴으로써, 재변환으로부터 변환의 관련되지 않은 높은 주파수 성분을 제외할 수 있다. 예를 들면, 영향을 받는 높은 주파수 성분은 이러한 성분 위의 주파수 성분 Nk'일 수 있다. 따라서, 생성된 정보 신호에서, 시간 영역(84)은 의도적으로 입력(76)에서 입력되는 랩핑 변환 표현에 이용할 수 있는 대역폭보다 낮은 스펙트럼 대역폭으로 재구성되었다. 그러나, 한편, 보간(104)이 회피됨에도 불구하고 조합기(74) 내에서 앨리어싱 소거 프로세스에 높은 주파수 부분을 무심코 도입하여 중복-추가 프로세스에서 앨리어싱 문제가 발생한다.
대안으로, 추가적인 낮은 샘플 표현은 높은 샘플율 표현에서의 전환을 위해 적절한 상태 버퍼에 이용되도록 동시에 생성될 수 있다. 이것은 데시메이션 인수(데시메이션이 필요한 경우)가 항상 비교적 낮게(즉, 2보다 작게) 유지되어, 따라서 앨리어싱으로부터 유발된 교란 아티팩트가 발생하지 않는다는 것을 확인한다. 상술한 바와 같이, 이것은 모든 주파수 성분을 유지하지 않고, 음향 심리학적 관련성에 관한 관심을 끌 수 있는 적어도 낮은 주파수를 유지한다.
따라서, 특정 실시예에 따르면, USAC의 낮은 지연 버전을 획득하기 위해 다음과 같은 방식으로 USAC 코덱을 수정할 수 있다. 첫째로, TCX 및 ACELP 코딩 모드만이 허용될 수 있다. AAC 모드는 회피될 수 있다. 프레임 길이는 20 ms의 프레임을 획득하기 위해 선택될 수 있다. 그런 다음, 다음과 같은 시스템 매개 변수는 동작 모드((FB)(초광대역(SWB), 광대역(WB), 협대역(NB), 전체 대역폭(FB)) 및 비트율에 따라 선택될 수 있다. 시스템 매개 변수의 개요는 다음의 표에 주어진다.
모드 입력 샘플링율
[kHz]
내부 샘플링율
[kHz]
프레임 길이
[샘플]
NB 8kHz 12.8kHz 256
WB 16kHz 12.8kHz 256
SWB 낮은 율
(12-32kbps)
32kHz 12.8kHz 256
SWB 높은 율
(48-64kbps)
32kHz 25.6kHz 512
SWB 매우 높은 율
(96-128kbps)
32kHz 32kHz 640
FB 48kHz 48kHz 960
협대역 모드가 관계되는 한, 내부 샘플링율을 입력 샘플링율과 동일하게 설정하여, 즉, 8 kHz를 설정하고, 이에 따라 프레임 길이를, 즉 샘플 길이가 160이도록 선택하여 샘플율 증가는 회피되어 대체될 수 있다. 마찬가지로, 16 kHz는 TCX에 대한 MDCT의 프레임 길이를 샘플 길이가 256 대신에 320이도록 선택하여 광대역 동작 모드에 대해 선택될 수 있다.
특히, 동작 지점의 전체 리스트, 즉, 지원된 샘플링율, 비트율 및 대역폭을 통해 전환 동작을 지원할 수 있다. 다음의 표는 USAC 코덱의 예상된 낮은 지연 버전의 내부 샘플링율에 관한 여러 구성을 나타낸다.
대역폭 입력 샘플링율
8kHz 16kHz 32kHz 48kHz
NB 12.8kHz 12.8kHz 12.8kHz 12.8kHz
WB 12.8kHz 12.8kHz 12.8kHz
SWB 12.8, 25.6, 32kHz 12.8, 25.6,
32kHz
FB 12.8, 25.6,
32, 48kHz
낮은 지연 USAC 코덱의 내부 샘플링율 모드의 매트릭스를 나타낸 표
보조 정보로서, 도 2a 및 도 2b에 따른 리샘플러는 이용될 필요가 없다는 것이 주목되어야 한다. IIR 필터 세트는 대안적으로 입력 샘플링율에서 전용 코어 샘플링 주파수까지 리샘플링 기능에 대한 책임을 맡도록 제공될 수 있다. 이러한 IIR 필터의 지연은 0.5 ms 이하이지만, 입력 및 출력 주파수 사이의 홀수 비율로 인해, 복잡성이 꽤 상당하다. 모든 IIR 필터에 대한 동일한 지연을 가정하면, 서로 다른 샘플링율 사이의 전환은 가능해질 수 있다.
따라서, 도 2a 및 도 2b의 리샘플러 실시예의 이용이 바람직할 수 있다. 파라메트릭 엔벨로프 모듈(즉, SBR)의 QMF 필터 뱅크는 상술한 바와 같이 리샘플링 기능을 예시하도록 협력할 시에 참여할 수 있다. SWB의 경우에, 이것은 합성 필터 뱅크단을 인코더에 추가하지만, 분석단은 SBR 인코더 모듈로 인해 이미 사용 중에 있다. 디코더 측에서, QMF는 SBR가 가능해질 때 업샘플링 기능을 제공할 책임이 이미 있다. 이러한 방식은 다른 모든 대역폭 모드에 이용될 수 있다. 다음의 표는 필요한 QMF 구성에 대한 개요를 제공한다.
내부 SR
LD-USAC
입력 샘플링율
8kHz 16kHz 32kHz 48kHz
12.8 kHz 20/32 40/32 80/32 120/32
25.6 kHz 80/64 120/64
32 kHz 지연에 의한 바이패스 120/80
48kHz 지연에 의한 바이패스
인코더 측에서 QMF 구성의 표 리스트(분석 대역의 수/합성 대역 수). 다른 가능한 구성은 2의 인수에 의해 모든 숫자를 분할함으로써 획득될 수 있다.
일정한 입력 샘플링 주파수를 가정하면, 내부 샘플링율 사이의 전환은 QMF 합성 프로토 타입을 전환하여 가능해질 수 있다. 디코드 측에서, 역 동작이 적용될 수 있다. 한 QMF 대역의 대역폭은 동작점의 전체 범위에 걸쳐 동일하다는 것을 주목한다.
일부 양태가 장치와 관련하여 설명되었지만, 이러한 양태는 또한 대응하는 방법에 대한 설명을 나타내는 것이 자명하며, 여기서, 블록 또는 장치는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게도, 방법 단계와 관련하여 설명된 양태는 또한 대응하는 장치의 대응하는 블록 또는 항목 또는 특징에 대한 설명을 나타낸다. 방법 단계의 일부 또는 모두는 예를 들어 마이크로 프로세서, 프로그램 가능한 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 이용하여) 실행될 수 있다. 일부 실시예에서, 가장 중요한 방법 단계 중 일부 하나 이상은 이와 같은 장치에 의해 실행될 수 있다.
어떤 구현 요구 사항에 따라, 본 발명의 실시예는 하드웨어 또는 소프트웨어로 구현될 수 있다. 구현은 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력하는 (또는 협력할 수 있는) 전자식으로 판독 가능한 제어 신호를 저장한 디지털 저장 매체, 예를 들어, 플로피 디스크, DVD, 블루레이, CD, ROM, PROM, EPROM, EEPROM 또는 플래시 메모리를 이용하여 수행될 수 있다.
본 발명에 따른 일부 실시예는 여기에 설명된 방법 중 하나가 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력할 수 있는 전자식으로 판독 가능한 제어 신호를 가진 데이터 캐리어를 포함한다.
일반적으로, 본 발명의 실시예는 프로그램 코드를 가진 컴퓨터 프로그램 제품으로 구현될 수 있으며, 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행할 때 방법 중 하나를 수행하기 위해 동작한다. 프로그램 코드는 예를 들어 머신 판독 가능한 캐리어에 저장될 수 있다.
다른 실시예는 머신 판독 가능한 캐리어에 저장되는 여기에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
그래서, 환언하면, 본 발명의 방법의 실시예는 컴퓨터 프로그램이 컴퓨터에서 실행할 때 여기에 설명된 방법 중 하나를 수행하기 위해 프로그램 코드를 가진 컴퓨터 프로그램이다.
그래서, 본 발명의 방법의 다른 실시예는 여기에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함하는 기록한 데이터 캐리어(또는 디지털 저장 매체 또는 컴퓨터 판독 가능한 매체)이다. 데이터 캐리어, 디지털 저장 매체 또는 기록된 매체는 전형적으로 실체적인(tangible) 및/또는 비과도적(non-transitionary)이다.
그래서, 본 발명의 방법의 다른 실시예는 여기에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호의 시퀀스이다. 데이터 스트림 또는 신호의 시퀀스는 예를 들어 데이터 통신 연결, 예를 들어 인터넷을 통해 전송되도록 구성될 수 있다.
다른 실시예는 처리 수단, 예를 들어, 여기에 설명된 방법 중 하나를 수행하도록 구성되거나 적응되는 컴퓨터 또는 프로그램 가능한 논리 장치를 포함한다.
다른 실시예는 여기에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 설치한 컴퓨터를 포함한다.
본 발명에 따른 다른 실시예는 여기에 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 (예를 들어, 전자식으로 또는 광학식으로) 수신기로 전송하도록 구성된 장치 또는 시스템을 포함한다. 수신기는, 예를 들어, 컴퓨터, 이동 장치, 메모리 장치 등일 수 있다. 장치 또는 시스템은, 예를 들어, 컴퓨터 프로그램을 수신기로 전송하는 파일 서버를 포함할 수 있다.
일부 실시예에서, 프로그램 가능한 논리 장치(예를 들어, 필드 프로그램 가능한 게이트 어레이)는 여기에 설명된 방법의 기능의 일부 또는 모두를 수행하는데 이용될 수 있다. 일부 실시예에서, 필드 프로그램 가능한 게이트 어레이는 여기에 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 방법은 바람직하게는 어떤 하드웨어 장치에 의해 수행된다.
상술한 실시예는 본 발명의 원리에 대해 단지 예시적이다. 여기에 설명된 배치 및 상세 사항의 수정 및 변형은 당업자에게는 자명할 것으로 이해된다. 그래서, 여기서 실시예의 설명에 의해 제시되는 특정 상세 사항에 의해서가 아니라 임박한 특허 청구 범위에 의해서만 제한되도록 의도된다.
참고 문헌:
[1]: 3 GPP, "Audio codec processing functions; Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec; Transcoding functions", 2009, 3 GPP TS 26.290.
[2]: USAC codec (Unified Speech and Audio Codec), ISO/IEC CD 23003-3 dated September 24, 2010

Claims (22)

  1. 앨리어싱 소거를 이용하여, 정보 신호의 연속적인 중복 영역의 각각에 대해, 각각의 영역의 윈도우 버전의 변환을 포함하는 상기 정보 신호의 랩핑 변환 표현으로부터 상기 정보 신호를 재구성하고, 상기 정보 신호의 이전의 영역(84)과 다음의 영역(86) 사이의 경계(82)에서 변화하는 샘플율로 상기 정보 신호를 재구성하도록 구성된 정보 신호 재구성기로서,
    상기 이전의 영역(84)에 대한 재변환(96)을 획득하기 위해 상기 이전의 영역(84)의 윈도우 버전의 변환(94)에 재변환을 적용하고, 상기 다음의 영역(86)에 대한 재변환(100)을 획득하기 위해 상기 다음의 영역(86)의 윈도우 버전의 변환에 재변환을 적용하도록 구성된 재변환기(70)로서, 상기 이전의 영역(84)에 대한 재변환(96) 및 상기 다음의 영역(86)에 대한 재변환(106)은 상기 이전의 영역과 상기 다음의 영역 사이의 경계(82)에서의 앨리어싱 소거 부분(102)에서 중복하는, 상기 재변환기(70);
    보간에 의해, 상기 경계(82)에서의 샘플율 변화에 따라 상기 앨리어싱 소거 부분(102)에서 상기 이전의 영역(84)에 대한 재변환(96) 및/또는 상기 다음의 영역(86)에 대한 재변환(100)을 리샘플링하도록 구성되는 리샘플러(72); 및
    상기 앨리어싱 소거 부분(102)에서 상기 리샘플링에 의해 획득되는 바와 같이 상기 이전의 및 다음의 영역(84, 86)에 대한 재변환(96, 100) 사이에서 앨리어싱 소거를 수행하도록 구성되는 조합기(74)를 포함하는, 정보 신호 재구성기.
  2. 청구항 1에 있어서,
    상기 리샘플러는 상기 경계에서의 상기 샘플율 변화에 따라 상기 앨리어싱 소거 부분에서 상기 이전의 영역에 대한 재변환(96)을 리샘플링하도록 구성되는, 정보 신호 재구성기.
  3. 청구항 1에 있어서,
    상기 이전의 영역(84)의 상기 윈도우 버전의 변환(94)에 적용된 상기 재변환의 변환 길이 대 상기 이전의 영역(84)의 시간적 길이의 비율은 상기 다음의 영역(86)의 상기 윈도우 버전에 적용된 상기 재변환의 변환 길이 대 상기 다음의 영역(86)의 시간적 길이의 비율과 상기 샘플율 변화에 대응하는 인수만큼 다른, 정보 신호 재구성기.
  4. 청구항 3에 있어서,
    상기 이전의 및 다음의 영역(84, 86)의 상기 시간적 길이는 서로 동일하며, 상기 재변환기(70)는 상기 이전의 영역(84)의 상기 윈도우 버전의 변환에 대한 재변환의 적용을 상기 이전의 영역의 상기 윈도우 버전의 변환의 낮은 주파수 부분으로 제한하고, 및/또는 상기 다음의 영역의 상기 윈도우 버전의 변환에 재변환의 적용을 상기 다음의 영역의 상기 윈도우 버전의 변환의 낮은 주파수 부분으로 제한하도록 구성되는, 정보 신호 재구성기.
  5. 청구항 1에 있어서,
    상기 정보 신호의 상기 영역의 상기 윈도우 버전의 변환의 변환 길이 및 상기 정보 신호의 상기 영역의 시간적 길이는 일정하고, 상기 정보 신호 재구성기는 제어 신호(98)에 응답하여 상기 경계(82)를 위치시키도록 구성되는, 정보 신호 재구성기.
  6. 정보 신호의 랩핑 변환 표현을 제공하는 필터 뱅크(38), 및 앨리어싱 소거를 이용하여, 청구항 5에 따라 상기 정보 신호의 상기 랩핑 변환 표현으로부터 상기 정보 신호를 재구성하도록 구성되는 정보 신호 재구성기(80)를 포함하는 역 필터 뱅크(42)의 연결로 구성되는, 리샘플러.
  7. 청구항 6에 따른 리샘플러, 및 상기 재구성된 정보 신호를 압축하도록 구성되는 압축단(16)을 포함하는 정보 신호 인코더로서,
    이용 가능한 전송 비트율의 외부 정보에 따라 상기 제어 신호(98)를 제어하도록 구성되는 샘플율 제어부를 더 포함하는, 정보 신호 인코더.
  8. 청구항 1에 있어서,
    상기 정보 신호의 상기 영역의 상기 윈도우 버전의 변환의 상기 변환 길이는 변화하지만, 상기 정보 신호의 상기 영역의 시간적 길이는 일정하며, 상기 정보 신호 재구성기는 상기 정보 신호의 상기 영역의 상기 윈도우 버전의 상기 변환 길이의 변화를 검출하여 상기 경계(82)를 위치시키도록 구성되는, 정보 신호 재구성기.
  9. 청구항 8에 있어서,
    상기 이전의 및 다음의 영역의 상기 윈도우 버전의 변환에 적용된 상기 재변환의 변환 길이를 상기 이전의 및 다음의 영역의 상기 윈도우 버전의 변환의 변환 길이에 적응시키도록 구성되는, 정보 신호 재구성기.
  10. 데이터 스트림으로부터 정보 신호의 랩핑 변환 표현을 재구성하도록 구성되는 압축 해제기(34), 및 앨리어싱 소거를 이용하여, 상기 랩핑 변환 표현으로부터 상기 정보 신호를 재구성하도록 구성되는 청구항 9에 따른 정보 신호 재구성기를 포함하는, 정보 신호 재구성기.
  11. 청구항 1에 있어서,
    상기 랩핑 변환은 MDCT와 같이 임계적으로 샘플링되는, 정보 신호 재구성기.
  12. 청구항 1에 있어서,
    상기 랩핑 변환 표현은 복소수 필터 뱅크인, 정보 신호 재구성기.
  13. 청구항 1에 있어서,
    리샘플러는 상기 보간을 위한 선형 또는 스플라인 보간을 이용하도록 구성되는, 정보 신호 재구성기.
  14. 청구항 1에 있어서,
    상기 샘플율은 상기 경계(82)에서 감소하고, 상기 재변환기(70)는, 상기 이전의 영역(84)의 상기 윈도우 버전의 변환(94)에 상기 재변환을 적용할 시에, 상기 이전의 영역(84)의 상기 윈도우 버전의 변환(94)의 주파수의 감쇠시키거나, 0 이상으로 설정하도록 구성되는, 정보 신호 재구성기.
  15. 앨리어싱 발생 랩핑 변환을 이용하여 정보 신호의 랩핑 변환 표현을 생성하도록 구성되는 정보 신호 변환기로서,
    샘플의 시퀀스의 형식으로 상기 정보 신호를 수신하는 입력(105);
    상기 정보 신호의 연속적인 중복 영역을 그래빙하도록 구성되는 그래버(grabber)(106);
    연속적인 중복 부분의 각각이 각각의 일정한 샘플율을 갖지만, 상기 각각의 일정한 샘플율이 상기 연속적인 중복 영역 중에서 변화하도록 보간에 의해 상기 정보 신호의 상기 연속적인 중복 영역의 적어도 서브세트에 리샘플링을 적용하도록 구성되는 리샘플러(107);
    상기 정보 신호의 상기 연속적인 중복 영역에 윈도잉을 적용하도록 구성되는 윈도우어(108); 및
    윈도우 영역에 변환을 개별적으로 적용하도록 구성되는 변환기(109)를 포함하는, 정보 신호 변환기.
  16. 청구항 15에 있어서,
    상기 그래버(106)는 상기 정보 신호의 상기 연속적인 중복 영역이 일정한 시간 길이이도록 상기 정보 신호의 상기 연속적인 중복 영역의 그래빙을 수행하도록 구성되는, 정보 신호 변환기.
  17. 청구항 15에 있어서,
    상기 그래버(106)는 상기 정보 신호의 상기 연속적인 중복 영역이 일정한 시간 오프셋을 갖도록 상기 정보 신호의 상기 연속적인 중복 영역의 그래빙을 수행하도록 구성되는, 정보 신호 변환기.
  18. 청구항 16에 있어서,
    상기 샘플의 시퀀스는 미리 정해진 시간 순간(113)에 제 1 샘플율에서 제 2 샘플율로 전환하는 변화하는 샘플율을 가지며, 상기 리샘플러(107)는 상기 일정한 샘플율이 상기 제 1 샘플율에서 상기 제 2 샘플율로 한번만 전환하도록 상기 미리 정해진 시간 순간과 중복하는 상기 연속적인 중복 영역(114b,c)에 상기 리샘플링을 적용하도록 구성되는, 정보 신호 변환기.
  19. 청구항 18에 있어서,
    상기 변환기는 각 윈도우 영역의 변환의 변환 길이를 각각의 윈도우 영역의 샘플의 수에 적응시키도록 구성되는, 정보 신호 변환기.
  20. 앨리어싱 소거를 이용하여, 정보 신호의 연속적인 중복 영역의 각각에 대해, 각각의 영역의 윈도우 버전의 변환을 포함하는 상기 정보 신호의 랩핑 변환 표현으로부터 상기 정보 신호를 재구성하는 방법으로서, 정보 신호 재구성기는 상기 정보 신호의 이전의 영역(84)과 다음의 영역(86) 사이의 경계(82)에서 변화하는 샘플율로 상기 정보 신호를 재구성하도록 구성되는, 상기 정보 신호 재구성 방법에 있어서,
    상기 이전의 영역(84)에 대한 재변환(96)을 획득하기 위해 상기 이전의 영역(84)의 상기 윈도우 버전의 변환(94)에 재변환을 적용하고, 상기 다음의 영역(86)에 대한 재변환(100)을 획득하기 위해 상기 다음의 영역(86)의 상기 윈도우 버전의 변환(94)에 재변환을 적용하는 단계로서, 상기 이전의 영역(84)에 대한 재변환(96) 및 상기 다음의 영역(86)에 대한 재변환(106)은 상기 이전의 영역과 상기 다음의 영역 사이의 경계(82)에서의 앨리어싱 소거 부분(102)에서 중복하는, 상기 적용 단계;
    보간에 의해, 상기 경계(82)에서의 샘플율 변화에 따라 상기 앨리어싱 소거 부분(102)에서 상기 이전의 영역(84)에 대한 재변환(96) 및/또는 상기 다음의 영역(86)에 대한 재변환(100)을 리샘플링하는 단계; 및
    상기 앨리어싱 소거 부분(102)에서 상기 리샘플링에 의해 획득되는 바와 같이 상기 이전의 및 다음의 영역(84, 86)에 대한 재변환(96, 100) 사이에서 앨리어싱 소거를 수행하는 단계를 포함하는, 정보 신호 재구성 방법.
  21. 앨리어싱 발생 랩핑 변환을 이용하여 정보 신호의 랩핑 변환 표현을 생성하는 방법으로서,
    샘플의 시퀀스의 형식으로 상기 정보 신호를 수신하는 단계;
    상기 정보 신호의 연속적인 중복 영역을 그래빙하는 단계;
    연속적인 중복 부분의 각각이 각각의 일정한 샘플율을 갖지만, 상기 각각의 일정한 샘플율이 상기 연속적인 중복 영역 중에서 변화하도록 보간에 의해 상기 정보 신호의 상기 연속적인 중복 영역의 적어도 서브세트에 리샘플링을 적용하는 단계;
    상기 정보 신호의 상기 연속적인 중복 영역에 윈도잉을 적용하는 단계; 및
    윈도우 영역에 변환을 개별적으로 적용하는 단계를 포함하는, 정보 신호의 랩핑 변환 표현 생성 방법.
  22. 청구항 20 또는 청구항 21에 따른 방법을 컴퓨터에서 실행하기 위한 프로그램 코드가 기록된 컴퓨터 판독 가능한 기록 매체.
KR1020127029497A 2011-02-14 2012-02-14 랩핑 변환을 이용한 정보 신호 표현 KR101424372B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
US61/442,632 2011-02-14
PCT/EP2012/052458 WO2012110478A1 (en) 2011-02-14 2012-02-14 Information signal representation using lapped transform

Publications (2)

Publication Number Publication Date
KR20130007651A KR20130007651A (ko) 2013-01-18
KR101424372B1 true KR101424372B1 (ko) 2014-08-01

Family

ID=71943597

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127029497A KR101424372B1 (ko) 2011-02-14 2012-02-14 랩핑 변환을 이용한 정보 신호 표현

Country Status (18)

Country Link
US (1) US9536530B2 (ko)
EP (1) EP2550653B1 (ko)
JP (2) JP5712288B2 (ko)
KR (1) KR101424372B1 (ko)
CN (1) CN102959620B (ko)
AR (1) AR085222A1 (ko)
AU (1) AU2012217158B2 (ko)
BR (1) BR112012029132B1 (ko)
CA (1) CA2799343C (ko)
ES (1) ES2458436T3 (ko)
HK (1) HK1181541A1 (ko)
MX (1) MX2012013025A (ko)
MY (1) MY166394A (ko)
PL (1) PL2550653T3 (ko)
RU (1) RU2580924C2 (ko)
SG (1) SG185519A1 (ko)
TW (2) TWI564882B (ko)
WO (1) WO2012110478A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3111501C (en) * 2011-09-26 2023-09-19 Sirius Xm Radio Inc. System and method for increasing transmission bandwidth efficiency ("ebt2")
US9842598B2 (en) 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
TWI557727B (zh) 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
JP6013646B2 (ja) 2013-04-05 2016-10-25 ドルビー・インターナショナル・アーベー オーディオ処理システム
RU2641253C2 (ru) * 2013-08-23 2018-01-16 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров
PT3000110T (pt) 2014-07-28 2017-02-15 Fraunhofer Ges Forschung Seleção de um de entre um primeiro algoritmo de codificação e um segundo algoritmo de codificação com o uso de redução de harmônicos.
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
CN110870006B (zh) * 2017-04-28 2023-09-22 Dts公司 对音频信号进行编码的方法以及音频编码器
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007051548A1 (en) * 2005-11-03 2007-05-10 Coding Technologies Ab Time warped modified transform coding of audio signals
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction

Family Cites Families (215)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2568984C (en) 1991-06-11 2007-07-10 Qualcomm Incorporated Variable rate vocoder
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
KR100419545B1 (ko) 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
JP3304717B2 (ja) * 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
EP0720316B1 (en) 1994-12-30 1999-12-08 Daewoo Electronics Co., Ltd Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) * 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
DE69926821T2 (de) 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
JP2003501925A (ja) 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ES2269112T3 (es) 2000-02-29 2007-04-01 Qualcomm Incorporated Codificador de voz multimodal en bucle cerrado de dominio mixto.
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US7136418B2 (en) * 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
KR100464369B1 (ko) 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) * 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP3815323B2 (ja) * 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) * 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
US20040010329A1 (en) * 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) * 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
ES2259158T3 (es) 2002-09-19 2006-09-16 Matsushita Electric Industrial Co., Ltd. Metodo y aparato decodificador audio.
WO2004034379A2 (en) 2002-10-11 2004-04-22 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
US7548852B2 (en) 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
DE10331803A1 (de) * 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
CA2475282A1 (en) 2003-07-17 2005-01-17 Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre Volume hologram
DE10345996A1 (de) * 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
US7418396B2 (en) * 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
US20050091044A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
EP1683133B1 (en) 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
EP1711938A1 (en) * 2004-01-28 2006-10-18 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
WO2005086138A1 (ja) 2004-03-05 2005-09-15 Matsushita Electric Industrial Co., Ltd. エラー隠蔽装置およびエラー隠蔽方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
JP2007538282A (ja) 2004-05-17 2007-12-27 ノキア コーポレイション 各種の符号化フレーム長でのオーディオ符号化
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
AU2006208529B2 (en) 2005-01-31 2010-10-28 Microsoft Technology Licensing, Llc Method for weighted overlap-add
CN100593197C (zh) 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
JP5129115B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 高帯域バーストの抑制のためのシステム、方法、および装置
US8917874B2 (en) 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
CA2609945C (en) 2005-06-18 2012-12-04 Nokia Corporation System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
JP5032314B2 (ja) * 2005-06-23 2012-09-26 パナソニック株式会社 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US20110057818A1 (en) 2006-01-18 2011-03-10 Lg Electronics, Inc. Apparatus and Method for Encoding and Decoding Signal
CN101371296B (zh) 2006-01-18 2012-08-29 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
WO2008007699A1 (en) 2006-07-12 2008-01-17 Panasonic Corporation Audio decoding device and audio encoding device
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
EP2549440B1 (en) 2006-07-24 2017-01-11 Sony Corporation A hair motion compositor system and optimization techniques for use in a hair/fur graphics pipeline
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
KR101041895B1 (ko) 2006-08-15 2011-06-16 브로드콤 코포레이션 패킷 손실 후 디코딩된 오디오 신호의 시간 워핑
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8126721B2 (en) * 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8041578B2 (en) * 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
EP2076901B8 (en) * 2006-10-25 2017-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
AU2007331763B2 (en) * 2006-12-12 2011-06-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
SG179433A1 (en) 2007-03-02 2012-04-27 Panasonic Corp Encoding device and encoding method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
EP2128855A1 (en) 2007-03-02 2009-12-02 Panasonic Corporation Voice encoding device and voice encoding method
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
PT2165328T (pt) * 2007-06-11 2018-04-24 Fraunhofer Ges Forschung Codificação e descodificação de um sinal de áudio tendo uma parte do tipo impulso e uma parte estacionária
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2658942T3 (es) 2007-08-27 2018-03-13 Telefonaktiebolaget Lm Ericsson (Publ) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2250641B1 (en) * 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
US8423852B2 (en) 2008-04-15 2013-04-16 Qualcomm Incorporated Channel decoding-based error detection
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
CA2871268C (en) 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2144171B1 (en) 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
MX2011000366A (es) 2008-07-11 2011-04-28 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar muestras de audio.
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
ES2401487T3 (es) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
PL2311033T3 (pl) * 2008-07-11 2012-05-31 Fraunhofer Ges Forschung Dostarczanie sygnału aktywującego dopasowanie czasowe i kodowanie sygnału audio z jego użyciem
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
EP2345030A2 (en) 2008-10-08 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-resolution switched audio encoding/decoding scheme
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
ES2901735T3 (es) 2009-01-16 2022-03-23 Dolby Int Ab Transposición armónica mejorada de productos de cruce
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2382625B1 (en) 2009-01-28 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8805694B2 (en) 2009-02-16 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
PL2234103T3 (pl) 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio
KR20100115215A (ko) 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
EP3764356A1 (en) * 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
ES2453098T3 (es) 2009-10-20 2014-04-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Códec multimodo de audio
EP4358082A1 (en) 2009-10-20 2024-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
WO2011048118A1 (en) 2009-10-20 2011-04-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for providing an encoded representation of an audio content, method for providing a decoded representation of an audio content and computer program for use in low delay applications
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN103069484B (zh) 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
WO2011147950A1 (en) 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
WO2012110415A1 (en) 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
ES2681429T3 (es) 2011-02-14 2018-09-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generación de ruido en códecs de audio

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007051548A1 (en) * 2005-11-03 2007-05-10 Coding Technologies Ab Time warped modified transform coding of audio signals
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction

Also Published As

Publication number Publication date
EP2550653B1 (en) 2014-04-02
RU2580924C2 (ru) 2016-04-10
CA2799343A1 (en) 2012-08-23
BR112012029132B1 (pt) 2021-10-05
TWI564882B (zh) 2017-01-01
EP2550653A1 (en) 2013-01-30
HK1181541A1 (en) 2013-11-08
RU2012148250A (ru) 2014-07-27
MY166394A (en) 2018-06-25
TW201506906A (zh) 2015-02-16
PL2550653T3 (pl) 2014-09-30
AU2012217158A1 (en) 2012-12-13
JP2013531820A (ja) 2013-08-08
JP5712288B2 (ja) 2015-05-07
JP6099602B2 (ja) 2017-03-22
AU2012217158B2 (en) 2014-02-27
CN102959620B (zh) 2015-05-13
US9536530B2 (en) 2017-01-03
AR085222A1 (es) 2013-09-18
SG185519A1 (en) 2012-12-28
US20130064383A1 (en) 2013-03-14
CN102959620A (zh) 2013-03-06
MX2012013025A (es) 2013-01-22
ES2458436T3 (es) 2014-05-05
KR20130007651A (ko) 2013-01-18
TW201246186A (en) 2012-11-16
JP2014240973A (ja) 2014-12-25
BR112012029132A2 (pt) 2020-11-10
TWI483245B (zh) 2015-05-01
CA2799343C (en) 2016-06-21
WO2012110478A1 (en) 2012-08-23

Similar Documents

Publication Publication Date Title
KR101424372B1 (ko) 랩핑 변환을 이용한 정보 신호 표현
US20200227054A1 (en) Low bitrate audio encoding/decoding scheme having cascaded switches
KR101414305B1 (ko) 저 지연 애플리케이션들에서 사용하기 위한 오디오 신호 인코더, 오디오 신호 디코더, 오디오 콘텐츠의 인코딩된 표현을 제공하는 방법, 오디오 콘텐츠의 디코딩된 표현을 제공하는 방법 및 컴퓨터 프로그램
CA2739736C (en) Multi-resolution switched audio encoding/decoding scheme
EP2301020B1 (en) Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
KR20170133378A (ko) 인코딩된 오디오 신호를 디코딩하기 위한 디코더 및 오디오 신호를 인코딩하기 위한 인코더
KR20120063543A (ko) 멀티-모드 오디오 신호 디코더, 멀티-모드 오디오 신호 인코더 및 선형-예측-코딩 기반의 노이즈 성형을 사용하는 방법 및 컴퓨터 프로그램
JP2011528129A (ja) 切り換え可能なバイパスを有するオーディオ符号化/復号化方式
AU2015221516B2 (en) Improved Harmonic Transposition
AU2023282303A1 (en) Improved Harmonic Transposition
AU2009301358B2 (en) Multi-resolution switched audio encoding/decoding scheme

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180716

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190716

Year of fee payment: 6