KR101273486B1 - 신호 분석 및 합성을 위한 적응형 하이브리드 변환 - Google Patents

신호 분석 및 합성을 위한 적응형 하이브리드 변환 Download PDF

Info

Publication number
KR101273486B1
KR101273486B1 KR1020067015751A KR20067015751A KR101273486B1 KR 101273486 B1 KR101273486 B1 KR 101273486B1 KR 1020067015751 A KR1020067015751 A KR 1020067015751A KR 20067015751 A KR20067015751 A KR 20067015751A KR 101273486 B1 KR101273486 B1 KR 101273486B1
Authority
KR
South Korea
Prior art keywords
transform
signal
coefficients
spectral coefficients
spectral
Prior art date
Application number
KR1020067015751A
Other languages
English (en)
Other versions
KR20070001123A (ko
Inventor
마크 스튜아트 빈톤
그렌트 앨렌 데이비드손
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20070001123A publication Critical patent/KR20070001123A/ko
Application granted granted Critical
Publication of KR101273486B1 publication Critical patent/KR101273486B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Discrete Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Resistance Or Impedance (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Control Of Eletrric Generators (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

오디오 및 비디오 코딩 시스템들에 사용된 것들과 같은 분석과 합성 필터 뱅크들은 하나 이상의 2차 변환들과 연결한 1차 변환를 포함하는 하이브리드 변환에 의해 각각 구현된다. 상기 필터 뱅크들용 1차 변환들은 시간-도메인 에일리어싱 아티팩트가 제거된 분석/합성 시스템을 구현한다. 상기 1차 변환들과 연결한 상기 2차 변환들은 변환 계수들의 블록들에 적용된다. 상기 블록들의 길이는 상기 분석과 합성 뱅크들의 시간 분해능을 적응시키도록 변화된다.
뱅크, 변환, 분석/합성 시스템, 하이브리드 변환, 아트팩트

Description

신호 분석 및 합성을 위한 적응형 하이브리드 변환{ADAPTIVE HYBRID TRANSFORM FOR SIGNAL ANALYSIS AND SYNTHESIS}
본 발명은 일반적으로 오디오 및 비디오 코딩 시스템들에 사용될 수 있는 것들과 같은 신호 분석 및 합성 필터 뱅크들에 관한 것이다. 특히, 본 발명은 상기 필터 뱅크들의 시간 및 주파수 분해능(frequency resolutions)을 적응시킬 수 있는 블록 변환들의 캐스케이드에 의해 구현되는 분석 및 합성 필터 뱅크들에 관한 것이다.
코딩 시스템들은 종종 소스 신호를 적절히 표현하도록 요구된 정보량을 감소시키는데 사용된다. 정보 용량 전제조건들을 감소시킴으로써, 신호 표현은 더 낮은 대역폭을 갖는 채널들을 통해 전송되거나 적은 공간을 사용하여 매체에 저장될 수 있다. 코딩은 신호에서 리던던트(redundant) 성분들 또는 무관한 성분들을 제거함으로써, 소스 신호의 정보 용량 전제조건들을 감소시킬 수 있다. 이른바 인지 코딩 방법들과 시스템들은 종종 필터 뱅크들을 사용하여, 스펙트럼 성분들의 기본 세트를 사용하여 소스 신호를 비상관시킴으로써 리던던시를 감소시키고, 의사-인지 기준에 따라 스펙트럼 성분들의 적응형 양자화에 의해 무관성(irrelevancy)을 감소시킨다.
다양한 인지 코딩 시스템들은 블록 변환들에 의해 필터 뱅크들을 구현한다. 오디오 코딩 시스템에서, 예를 들면, 시간-도메인 샘플들의 시간 세그먼트들 또는 블록들로 표현되는 소스 오디오 신호는 소스 신호의 스펙트럼 내용을 표현하는 주파수-도메인 계수들의 세트들로 변환된다. 세그먼트들의 길이는 필터 뱅크의 시간 분해능과 주파수 분해능 모두를 수립한다. 시간 분해능은 세그먼트 길이가 감소함에 따라 증가한다. 주파수 분해능은 세그먼트 길이가 증가함에 따라 증가한다. 이러한 관계로 인해, 세그먼트 길이의 선택은 블록 변환 필터 뱅크의 시간 및 주파수 분해능 간의 상충관계를 부과한다.
세그먼트 길이의 단일 선택은 전형적인 코딩 시스템들에 의해 부딪치는 모든 소스 신호 조건들에 대한 분해능 간의 최적의 상충관계를 제공할 수 있다. 느리게 변하거나 정적인 소스 신호들은, 필터 뱅크가 더 높은 주파수 분해능을 가지면 더 효율적으로 엔코드될 수 있으며, 더 긴 세그먼트 길이가 사용되면 제공될 수 있다. 고속으로 변하거나 매우 정적이지 않은 소스 신호들은 일반적으로, 필터 뱅크가 더 높은 시간 분해능을 가지면 더 효율적으로 엔코드될 수 있으며, 더 짧은 세그먼트 길이가 사용되면 제공될 수 있다. 소스 신호 조건들의 변화에 응답하여 세그먼트 길이를 적응시킴으로써, 블록 변환 필터 뱅크는 그 시간 및 주파수 분해능 간의 상충관계를 최적화할 수 있다.
다양한 변환들은, 예를 들면, 오디오 코딩 시스템들에서 필터 뱅크들을 구현하는데 사용될 수 있지만, 특정 수정된 이산 코사인 변환(MDCT)은, 인접한 소스 신호 세그먼트들이 서로 중첩되게 하면서 임계 샘플링을 제공할 능력을 포함하는 오 디오 코딩을 위한 몇몇 매우 유리한 특성들을 가지므로 널리 사용된다. MDCT는 세그먼트 내에서 실질적으로 정적인 소스 신호에서 모든 리던던트 성분들을 실질적으로 제거할 수 있으므로 또한 매력적이다. MDCT 필터 뱅크의 적당한 동작은 1987년 5월, 프린센(Princen) 등에 의해 Acoustics, Speech and Signal Processing(ICASSP)의 1987 국제 학회의 Proc.에서의 페이지 2161-64에 기재된 "시간 도메인 에일리어싱 제거에 기초한 필터 뱅크 설계를 사용하는 서브대역/변환 코딩"의 특정 기준을 만족하는 중첩된 소스-신호 세그먼트들과 윈도우 함수들의 사용을 필요로 한다. 불행하게도, 소스 신호 세그먼트들의 중첩에 적용되어야 하는 윈도우 함수들에 부과되는 전제조건들로 인해 신호 조건들에 응답하여 MDCT 필터 뱅크들의 시간 및 주파수 분해능을 적응시키기 어렵다.
종종 "윈도우 스위칭"이라 하는 하나의 공지된 기술은 갑작스런 신호 변화들 또는 크기 천이들과 같은 임의의 신호 조건들의 검출에 응답하여 2개의 다른 윈도우 함수들 사이를 적응적으로 전환시킴으로써 MDCT 필터 뱅크의 시간 분해능을 적응시킬 수 있다. 1993년 5월25일 에들러(Edler)에 의해 발행된 미국특허공보 제5,214,742호에 기재된 이러한 기술에 따르면, 세그먼트 길이들은 변하지 않지만, 시간 분해능은 필터 뱅크에 의해 변환된 각각의 세그먼트에서 넌-제로(non-zero) 샘플들의 갯수를 감소시키기 위해, 다른 윈도우 함수 형태들 사이를 전환시킴으로써 적응된다. 불행하게도, 이 기술은 필터 뱅크의 주파수 분해능을 적응시키지 않고 필터 뱅크의 주파수 선택도는, 윈도우 전환에 필요한 윈도우 함수들의 형태가 MDCT의 적당한 동작을 위한 전제조건들을 만족시키는데 차선이어야 하므로 시간 분 해능이 감소될 때마다 심각하게 저하된다.
종종 "블록 전환"이라 하는 다른 공지된 기술은 다른 윈도우 함수 형태들 사이를 전환한다는 점에서 상술된 윈도우-전환 기술과 유사하지만, 블록-전환 기술은 급격한 신호 변화들 또는 크기 천이들과 같은 임의의 신호 조건들의 검출에 응답하여 2개의 다른 세그먼트 길이들 사이를 적응적으로 또한 전환시킴으로써 MDCT 필터 뱅크의 시간 및 주파수 분해능 모두를 적응시킬 수 있다. 이 기술은 1997년10월, 보시(Bosi) 등에 의한 J.Audio Eng. Soc. vol.45, no. 10의 페이지 789-814에 기재된 "ISO/IEC MPEG-2 진보된 오디오 코딩"의 진보된 오디오 코딩(AAC)에 사용된다.
AAC에서, MDCT 필터 뱅크는 2048 샘플들과 동일한 길이를 갖는 정적인 소스 신호 세그먼트들에 적용되고 256 샘플들과 동일한 길이를 갖는 비-정적 소스 신호 세그먼트들에 적용된다. 블록 전환은 더 긴 세그먼트들에 적절한 "긴 윈도우 함수들", 더 짧은 세그먼트들에 적절한 "짧은 윈도우 함수들", 더 긴 세그먼트 길이에서 더 짧은 세그먼트 길이로의 전환을 허용하는 "쟁-대-단 브릿징 윈도우 함수(long-to-short bridging funtions)", 및 더 짧은 세그먼트 길이에서 더 긴 세그먼트 길이로의 전환을 허용하는 "단-대-장 브릿징 윈도우 함수"을 사용하여 AAC에서 실현된다. 2개의 브릿징 윈도우 함수들은 MDCT의 적당한 동작에 필요한 기준을 만족시키면서 다른 세그먼트 길이 간의 전환을 허용한다. 더 긴 세그먼트 길이에서 더 짧은 세그먼트 길이 및 다시 더 긴 길이로의 전환은 MDCT를 장-대-단 브릿징 윈도우 함수를 사용하여 긴 세그먼트에 적용하며, 상기 MDCT를 짧은 윈도우 함수를 사용하여 8개의 짧은 세그먼트들의 정수배에 적용하고, MDCT를 단-대-장 브릿징 윈 도우 함수를 사용하여 긴 세그먼트에 적용함으로써 실현된다. 그 직후에, MDCT는 긴 세그먼트에 적용되어야 하지만, 긴 윈도우 함수는 사용될 수 있거나, 장-대-단 브릿징 윈도우 함수는 다른 블록 전환이 필요해지면 사용될 수 있다.
블록 전환이 MDCT 필터 뱅크의 시간 및 주파수 분해능을 적응시키는 방식을 제공하더라도, 몇몇 이유들로 이상적인 해결책은 없다. 하나의 이유는, 변환의 주파수 선택도가 브릿지 윈도우 함수의 형태가 세그먼트-길이 전환을 허용하고 MDCT의 적당한 동작을 위한 전제조건을 만족시키는 차선이어야 하므로 블록 길이들의 전환 동안에 저하된다는 것이다. 다른 이유는 임의의 시간에서 발생할 수 없다는 것이다. 상술된 바와 같이, MDCT는 더 긴 세그먼트 길이로 전환한 직후에, 다른 긴 세그먼트에 적용되어야 한다. 더 짧은 길이로의 즉각적인 전환은 불가능하다. 이 블록 전환 기술은 또한, 전환 메카니즘이 모든 신호 조건들에 최적이 아닌 2개의 세그먼트 길이들만을 제공하므로 이상적인 해결책이 아니다. 예를 들면, AAC에서 2개의 세그먼트 길이들은 AAC에서 더 길거나 더 짧은 세그먼트 길이가 최고의 스피치 신호 세그먼트들에 최적화되지 않으므로, 최적이 아니다. 2048-샘플 세그먼트들은 일반적으로 스피치의 비-정적인 특성에 대한 너무 길고 256-샘플 세그먼트들은 일반적으로 너무 짧아서 리던던트 성분들을 효과적으로 제거하지 못한다. 게다가, 2048 샘플들 보다 긴 세그먼트 길이는 더 최적일 많은 정적 신호들이 있다. 그 결과, AAC의 성능은 MDCT 필터 뱅크의 시간 및 주파수 뱅크를 적응시키는 블록 전환의 한정된 능력에 의해 악화된다.
블록 전환의 다른 형식은 돌비 디지털 엔코드된 비트 스트림 표준에 따른 코 딩 시스템들에서 사용된다. 종종 AC-3라 하는 이 코딩 표준은 2001년8월20일 공개된 "갱신 A 대 디지털 오디오 압축(AC-3) 표준"의 진보된 텔레비젼 시스템 위원회(ATSC) A/52A 문서에 기재되어 있다. AC-3 코딩 시스템들에 사용된 블록 전환의 형식은 MDCT를 정적 신호들을 위한 512 샘플들 또는 비-정적 신호들을 위한 256 샘플들의 소스 신호 세그먼트들에 적용한다. AC-3 코딩 시스템에 사용된 블록 전환 기술은 길이 전환이 이뤄질 때의 선택에서 더 유연성을 제공한다. 게다가, 코딩 성능은 스피치와 같이 비-정적 소스 신호들에 합리적으로 우수하지만, 더 정적인 신호들에 대한 코딩 성능은 더 긴 세그먼트에 의해 제공된 비교적 낮은 주파수 분해능에 의해 한정된다.
MDCT 필터 뱅크의 시간 및 주파수 분해능의 적응적 제어를 위한 다른 기술들은 1995년2월28일, 데이비드슨에 의해 발행된 미국특허공보 제5,394,473호에 기재되어 있다. 이들 기술들 중 일부는 MDCT 필터 뱅크가 다른 공지된 기술들에 의해 가능한 것 보다 훨씬 우수한 주파수 응답을 제공하는 윈도우 함수들을 사용하여 필수적으로 임의의 길이의 세그먼트들에 적용되게 한다. 불행하게도, 이들 기술들은 MDCT의 커넬 또는 기본 함수들을 적응시켜야 하고, 이에 따라, 상술된 AC-3 표준과 같은 기존의 비트 스트림 표준들과 호환하지 못한다. 이들 기술들은 또한 계산 집중적이다.
필요한 것은 MDCT와 같은 변환들에 의해 구현되는 필터 뱅크들의 주파수 분해능을 적응시키는 더 효율적이고 효과적인 방식이다. 바람직하게, 상기 분해능은 기존의 비트 스트림 표준들과 호환가능한 시스템들로의 포함을 간략화하는 구현을 제공해야한다. 이는 블록 변환들의 캐스케이드에 의해 구현될 수 있는 하이브리드-변환 필터 뱅크를 사용하여 달성된다.
본 발명의 가르침에 따르면, 분석 및 합성 필터 뱅크들은 하나 이상의 2차 변환과 연결한 1차 변환을 포함하는 하이브리드 변환에 의해 구현된다. 하나의 구현예에서, 상기 1차 변환은 세그먼트 길이의 절반 만큼 서로 중첩하는 소스 신호 세그먼트들에 적용되는 MDCT이고 상기 2차 변환은 시간을 통해 특정 주파수에 대한 MDCT 계수들의 비-중첩 블록들에 적용되는 DCT이다. 상기 필터 뱅크들의 주파수 분해능은 상기 하나 이상의 2차 변환들에 의해 변환되는 블록들에서의 계수들의 갯수를 증가시킴으로써 증가될 수 있다. 상기 하나 이상의 2차 변환들은 계수 주파수에 따라 변하는 다수의 계수들을 갖는 MDCT 계수들의 블록들에 적용될 수 있어, 상기 필터 뱅크의 주파수 분해능이 광범위한 방식들로 적응되게 한다.
본 발명의 다양한 특징들과 그 바람직한 실시예들은 몇몇 특징들에서 유사한 참조번호들이 유사한 소자들을 가리키는 다음의 설명과 첨부한 도면들을 참조하여 더 이해될 수 있다. 다음의 설명과 도면들의 내용들은 예제로서만 언급되고 본 발명의 범위에 대한 한정을 표현하는 것으로 이해되지 않아야 한다.
도 1은 코딩 시스템에서 사용되는 전송기의 개략적인 블록도이다.
도 2는 코딩 시스템에서 사용되는 수신기의 개략적인 블록도이다.
도 3은 본 발명의 다양한 특징들을 구현하는데 사용될 수 있는 장치의 개략 적인 블록도이다.
도 4는 본 발명의 다양한 특징들을 포함하는 분석 필터 뱅크의 개략적인 블록도이다.
도 5는 본 발명의 다양한 특징들을 포함하는 분석 필터 뱅크의 개략적인 블록도이다.
A. 개요
본 발명은 주파수 분해능이 쉽게 적응될 수 있는 하이브리드 변환에 의해 구현되는 필터 뱅크를 제공한다. 도 1 및 도 2는 각각 본 발명의 다양한 특징들을 포함할 수 있는 오디오 코딩 시스템에서 전송기 및 수신기의 개략적인 블록도를 도시한다. 도시된 전송기 및 수신기의 특징들은 다음의 섹션들에서 간략하게 설명된다. 이 설명에 따라, 분석 및 합성 필터 뱅크들의 관련 특징들이 설명된다.
1. 전송기
도 1에 도시된 전송기는 상기 소스 신호의 스펙트럼 내용을 표현하는 스펙트럼 계수들을 발생시키기 위해 상기 분석 필터 뱅크(3)를 경로 1로부터 수신된 소스 신호에 적용하며, 엔코드된 정보를 발생시키기 위해 상기 엔코더(5)를 상기 스펙트럼 계수들에 적용하고, 경로 9를 따르는 전송에 적당한 출력 신호를 발생시키기 위해 상기 엔코드된 정보에 적용한다. 상기 출력 신호는 수신기에 바로 전달될 수 있거나 다음의 전달을 위해 기록될 수 있다. 상기 분석 필터 뱅크(3)는 이하에 기재되는 바와 같은 다양한 방식들로 구현될 수 있다.
이 설명에서, "엔코더" 및 "엔코딩"과 같은 용어들은 정보 처리의 임의의 특정 형태를 유추하도록 의도되지 않는다. 예를 들면, 엔코딩은 종종 정보 용량 전제조건들을 감소시키는데 사용되지만, 여기에서 이들 용어들은 반드시 이러한 형태의 처리를 언급하지 않는다. 상기 엔코더(5)는 바라는 임의의 형태의 처리를 필수적으로 수행할 수 있다. 하나의 구현예에서, 엔코드된 정보는 2001년6월12일, 데이비드슨(Davidson) 등에 의해 허여된 미국특허공보 제6,246,345호에 기재된 벡터 양자화 및 이득-적응 양자화를 포함하는 광범위한 양자화 기술들을 사용한 인지 모델에 따라 스펙트럼 계수들을 양자화함으로써 발생된다.
2. 수신기
도 2에 도시된 수신기는 엔코드된 정보를 얻기 위해 상기 디포맷터(23)를 경로 21로부터 수신된 입력 신호에 적용하며, 소스 신호의 스펙트럼 내용을 표현하는 스펙트럼 계수들을 얻기 위해 상기 디코더(25)를 상기 엔코드된 정보에 적용하고, 상기 소스 신호의 복제물이지만 정확한 복제물일 수 없는 경로 29를 따르는 출력 신호를 발생시키기 위해 상기 합성 필터 뱅크(27)를 상기 스펙트럼 계수들에 적용한다. 상기 합성 필터 뱅크(27)는 상기 분석 필터 뱅크(3)의 구현에 상보적인 다양한 방식들로 구현될 수 있다.
이 개시에서, "디코더" 및 "디코딩"과 같은 용어들은 임의의 특정 형태의 정보 처리를 유추하도록 의도되지 않는다. 상기 디코더(25)는 요구되거나 바라는 임의의 형태의 처리를 필수적으로 수행할 수 있다. 상술된 엔코딩 과정에 반대인 하나의 구현예에서, 양자화된 스펙트럼 성분들은 양자화되지 않은 스펙트럼 계수들로 디코드된다. 특정 형태의 디코딩은 본 발명에서는 중요하지 않다.
B. 적응형 하이브리드 변환
상기 분석 필터 뱅크(3) 및 상기 합성 필터 뱅크(27)는 도 4 및 도 5에 도시된 바와 같이 구현될 수 있는 하이브리드 변환을 각각 도시한다.
도 4에 도시된 분석 필터 뱅크(3)는 1차 변환(43) 및 상기 1차 변환와 연결한 하나 이상의 2차 변환(45)를 포함한다. 상기 1차 변환는 상기 소스 신호 세그먼트들의 스펙트럼 콘텐츠를 표현하는 스펙트럼 계수들의 세트들을 발생시키기 위해 소스 신호의 세그먼트들에 적용된다. 상기 하나 이상의 2차 변환 각각은 시간을 통해 특정 주파수에 대한 스펙트럼 계수들의 블록들에 적용된다. 각각의 블록에서 계수들의 갯수는 제어 신호에 응답하여 적응된다.
도 5에 도시된 합성 필터 뱅크(27)는 하나 이상의 역 2차 변환들(52) 및 상기 역 2차 변환와 연결한 역 1차 변환(54)를 포함한다. 상기 하나 이상의 역 2차 변환들 각각은 시간을 통해 특정 주파수에 대한 스펙트럼 계수들의 블록들을 발생시킨다. 각각의 블록에서 계수들의 갯수는 제어 신호에 응답하여 적응된다. 스펙트럼 계수들의 블록들은 주파수에 걸쳐 특정 시간에 대한 스펙트럼 계수들의 세트들로 조립되고 상기 1차 변환는 원래 소스 신호의 복제물을 제공하도록 조합된 신호의 세그먼트들을 발생시키기 위해 스펙트럼 계수들의 세트들에 적용된다.
상기 분석 필터 뱅크 및 상기 합성 필터 뱅크에 대한 1차 변환들은 역 1차 변환이 순방향 1차 변환에 의해 발생되는 시간-도메인 에일리어싱 아티팩트들을 제거하는 분석/합성 시스템을 구현한다. 예를 들면, 상술된 프린센 논문에 기재된 상기 수정된 이산 코사인 변환(MDCT) 및 상기 역 MDCT(IMDCT)는 홀수로 스택된 임계 샘플된 단일-측대역 분석/합성 시스템에 등가한 시간 도메인을 구현한다. 이들 변환들은 여기서 홀수로-스택된 시간-도메인 에일리어싱 제거(O-TDAC) 변환들이라 한다. 다른 TDAC 구현은 1986년 프린센 등에 의해 IEEE Trans. on Acoust., Speech, Signal Proc., vol. ASSP-34, 페이지 1153-1161에 기재된 "시간 도메인 에일리어싱 제거에 기초한 분석/합성 필터 뱅크 설계"에 기재되어 있다. 이 구현예에서 상기 분석 필터 뱅크는 대안 신호 세그먼트들에 MDCT 및 수정된 이산 사인 변환(MDST)의 적용을 포함한다. 상기 합성 필터 뱅크는 IMDCT 및 역 MDST(IMDST)의 적용을 포함한다. 이들 변환들은 짝수로-스택된 임계 샘플된 단일-측대역 분석/합성 시스템에 등가한 시간-도메인을 구현하고 짝수로-스택된 시간-도메인 에일리어싱 제거 변환들이라 한다.
상기 2차 변환들은 상기 이산 코사인 변환(DCT), 상기 이산 사인 변환(DST), 및 상기 이산 푸리에 변환(DFT)을 포함한 다수의 변환들 중 임의의 변환에 의해 구현될 수 있다.
상기 분석 필터 뱅크(3)의 바람직한 구현에서, type-II DCT는 상술된 O-TDAC MDCT와 연결하여 사용된다. 상기 합성 필터 뱅크(27)의 대조적인 구현에서, 상기 O-TDAC IMDCT는 type-II 역 DCT(IDCT)와 연결하여 사용된다. 이들 구현들은 이하 더 상세하게 기재된다.
1. 분석 필터 뱅크
도 4를 참조하면, 소스 신호 샘플들의 시퀀스는 경로 1로부터 수신되고 상기 버퍼(41)에 저장된다. 상기 분석기(47)는 일부 분석 과정을 저장된 샘플들에 적용함으로써 다음의 처리를 위해 사용하기 위해, 각 세그먼트에서 소스 신호 샘플들의 개수, 또는 세그먼트 길이를 결정하는 선택적 구성요소이다. 임의의 분석 과정은 바라는대로 필수적으로 사용될 수 있다. 예를 들면, 크기 천이들은 상술된 ATSC A/52A에 기재된 바와 같이 검출될 수 있다. 선택된 세그먼트 길이들을 표현하는 정보는 경로 2를 따라 출력 신호에 포함하기 위해 상기 포맷터(7)로 통과된다. 고정된 길이 세그먼트들은 상기 분석기(47) 및 상기 경로 2를 생략한 대안의 구현예에서 사용된다.
a) 분석 윈도우 함수
상기 윈도우(42)는 분석 윈도우 함수에 따라 각각의 세그먼트에서 소스 신호 샘플들을 가중함으로써 중첩 세그먼트들의 시퀀스를 형성한다. 각각의 세그먼트를 위한 상기 분석 윈도우 함수의 길이 및 형태는 상기 경로 2로부터 수신된 세그먼트 길이 정보에 응답하여 적응된다. 광범위한 윈도우 함수들은 사용될 수 있지만, 카이저-베젤-도출(KBD) 윈도우 함수는 일반적으로, 탁월한 주파수 선택비 특성들을 가지므로 바람직하다. 이 윈도우 함수는 식(1)로서 표현될 수 있는 카이저-베젤 윈도우 함수로부터 도출된다.
Figure 112006055886608-pct00001
α=카이저-베젤 알파 인자,
n=윈도우 함수 샘플 번호,
N=샘플들의 번호에서 윈도우 함수 길이, 및
Figure 112006055886608-pct00002
이다.
4 내지 7의 범위에서의 알파 값은 전형적인 오디오 코딩 응용들에서 잘 동작한다.
상기 도출은 소정의 윈도우 함수 길이 N - 중첩 간격 γ과 동일한 길이를 갖는 수직 윈도우 함수와 상기 카이저-베젤 윈도우 함수 W(n)를 콘볼루션시킨다. 식(2)를 참조한다. 이 콘볼루션은 식(3)에 도시된 바와 같이 간략화될 수 있다.
Figure 112006055886608-pct00003
여기서, γ=상기 세그먼트 중첩 간격 내의 샘플들의 번호,
N=상기 윈도우 함수의 소정의 길이,
W(n)=길이 γ+1의 카이저-베젤 윈도우 함수,
WP(n)=길이 N의 도출된 곱셈-윈도우,
s(k)= 0≤k<N-γ인 경우 1, 다른 경우에는 0이다.
상기 KBD 분석 윈도우 함수는 상기 도출된 곱셈-윈도우 WP(n)의 제곱근을 취하여 구해질 수 있다. 이 분석 윈도우 함수는 식(4)로 표현될 수 있다.
Figure 112006055886608-pct00004
(b) 1차 변환
상기 1차 변환(43)은 윈도우된 소스 신호 샘플들의 각 세그먼트를 스펙트럼 계수들의 세트로 변환한다. 계수들의 세트에서 각 계수는 특정 주파수에 대한 윈도우된 세그먼트의 스펙트럼 내용을 표현한다. 상기 O-TDAC MDCT는 바람직한 구현에서 사용된다. 이 변환은 식(5)로 표현될 수 있다.
Figure 112006055886608-pct00005
여기서, k=주파수 계수 번호,
n=입력 신호 샘플 번호,
m=소스 신호 세그먼트 번호,
N=소스 신호 세그먼트 길이,
x(n)=샘플 n에서 소스 신호 x의 값, 및
C(k)=MDCT 계수 k이다.
상기 O-TDAC MDCT는 식(6)의 스펙트럼 계수들의 세트를 생성한다.
Figure 112006055886608-pct00006
상기 1차 변환은 식(5)에 따라 직접 구현될 수 있거나 미국특허공보 제 5,394,473호에 기재된 고속 푸리에 변환(FFT)을 사용한 것들과 같이 계산적으로 더 효율적인 과정들에 의해 구현될 수 있다. 상기 분석 윈도우 함수 및 상기 1차 변환은 요구될 수 있는 필수적으로 임의의 과정을 사용한 세그먼트 길이에 응답하여 적응될 수 있다. 일부 기술들은 미국특허공보 제5,214,742호, 미국특허공보 제5,394,473호, 상기 ATSC A/52A 문서, 및 상기 인용된 상기 ISO/MPEG AAC 문서에 개시되어 있다.
하나 이상의 개별 주파수들 각각에 대한 상기 윈도우된 소스 신호 세그먼트들의 스펙트럼 내용을 표현한 스펙트럼 계수들은 개별 신호 경로들을 따라 통과되고 버퍼들에 저장된다. 도 4에 도시된 전송기는, 예를 들면, 상기 버퍼들(44a 및 44b)에의 저장을 위한 2개의 신호 경로들 중 하나를 따라 2개의 개별 주파수들 각각에 대한 스펙트럼 계수들을 통과시킨다. 단 2개의 신호 처리 경로들이 명확성을 위해 도 4에 도시되어 있다. 전형적인 시스템들에 사용하기 위한 상기 분석 필터 뱅크(3)의 구현예들이 수백 개의 경로들을 가질 수 있다.
c) 스펙트럼 성분 분석
도 4에 도시된 상위 신호 경로를 참조하면, 세그먼트들의 시퀀스에서 특정 주파수에 대한 스펙트럼 계수들은 상기 버퍼(44a)에 저장되고 블록들로 조립된다. 상기 분석기(48a)는 블록 길이인 각각의 블록에서 계수들의 갯수를 결정하고, 상기 경로(49a)를 따라 이 길이를 통과시킨다. 이 길이는 상기 버퍼(44a)에 저장된 계수들을 분석함으로써 결정될 수 있다. 분석의 특정 방법은 본 발명에 원리상 중요하다. 일부 분석 방법들은 여기에 기재되어 있다.
하나의 기본 방법은, 개별 블록에서의 계수들이 크기에서 충분히 유사한 스펙트럼 계수들의 가장 긴 가능한 블록들을 형성한다. 이는 다양한 방식들로 결정될 수 있다. 하나의 방식은 인접한 스펙트럼 계수들 간의 크기 차이를 계산하고 평균 차이가 일부 임계치 미만인 인접한 계수들의 가장 긴 블록을 구별한다. 다른 방식은 다수의 신호 경로들을 위해 버퍼들에 저장된 스펙트럼 계수들을 사용한다. 이 방법은 스펙트럼 계수들의 대역에 대한 크기 차이들을 합산하고 상기 대역에 걸친 평균 차이가 사람의 청각 체계의 이른바 임계 대역폭들과 같은 크기일 수 있다.
다른 기본 방법은 전송기에 어디서든 수행되는 신호 엔코딩 과정들에 의해 수행되는 신호 분석에 의존한다. 상기 인용된 A/52A 문서에 기재된 비트 스트림 표준과 호환가능한 전송기는, 예를 들면, 스케일 인자들과 관련된 스케일된 값들로서 표현된 스펙트럼 계수들을 갖는 엔코드된 신호를 발생시킨다. 상기 스케일 인자들은 스케일 인자들의 공통 세트를 공유할 수 있는 MDCT 계수 세트들의 시퀀스들을 구별하도록 분석된다. 상기 분석기(48a)는 지수들을 공유하는 계수 세트들의 갯수를 동일하게 하도록 개별 신호 경로에 대한 블록 길이를 적응시킨다.
d) 2차 변환
상기 2차 변환(45a)은 스펙트럼 계수들의 각 블록을 하이브리드-변환 계수들의 세트로 변환한다. 상기 변환의 길이는 상기 경로(49a)로부터 수신되는 블록 길이 정보에 응답하여 적응된다. 바람직한 구현예에서, type II DCT는 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용된다. 이 변환은 식(7)로서 표현될 수 있다.
Figure 112006055886608-pct00007
여기서, X(k,j)=MDCT 계수 k에 대한 하이브리드 변환 계수 j,
M=MDCT 계수 k의 블록의 길이, 그리고
Figure 112006055886608-pct00008
이다.
상기 2차 변환은 식(7)에 따라 직접 구현될 수 있거나 1990년 Academic Press, Inc.의 라오(Rao) 등에 의한 "이산 코사인 변환"의 제4장에 기재된 것들과 같이 계산적으로 더 효율적인 공지된 과정들에 의해 구현될 수 있다.
e) 포맷터 및 다른 신호 경로들
상기 포맷터(46a)는 상기 하이브리드-변환 계수들과 블록 길이 정보를 상기 엔코더(5) 및 상기 포맷터(7)가 처리할 수 있는 데이터로 조립하는데 사용될 수 있는 선택적인 구성요소이다. 이는 도 1에 도시된 상기 전송기에서의 분석 필터 뱅크(3)가 상기 전송기의 나머지 부분에 대한 최소의 변화들을 갖는 하이브리드 변환에 의해 구현되게 한다.
상기 버퍼(44b), 상기 분석기(48b), 상기 2차 변환(45b), 및 상기 포맷터(46b)는 상기 상위 신호 경로에서 개별 구성요소들에 대해 상술된 것들과 유사한 하위 신호 경로에서의 과정들을 수행한다.
f) 엔코딩
전형적인 시스템들에서, 상기 엔코더(5)는 일부 엔코드된 형식에서 하이브리 드-변환 계수들을 표현하는 엔코드된 정보를 발생시킨다. 인지 엔코딩 과정들이 사용되면, 상기 하이브리드-변환 계수들은 인지 무관성을 감소시키는 형식으로 엔코드된다. 인지 엔코딩 과정들은 일반적으로 수신기에 의해 복원되거나 재생성될 수 없도록 스펙트럼 정보를 손실되게 한다. 이 손실의 가능성은 상기 하이브리드 변환에 의해 발생된 하이브리드-변환 계수들에 대한 가능한 수정을 가리키는 심볼 ~X(k,j)로 이하에 표현된다. 이러한 엔코딩 과정들의 사용은 본 발명에 중요하지 않다.
2. 합성 필터 뱅크
도 5를 참조하면, 상기 디포맷터들(51a 및 51b)은 하이브리드 변환 계수들과 상기 경로들(26a 및 26b)로부터 수신되는 데이터로부터의 블록 길이 정보를 얻는다. 상기 블록 길이 정보는 상기 경로(59a 및 59b)를 따라 통과되고 상기 하이브리드-변환 계수들은 상기 역 2차 변환들(52a 및 52b)에 통과된다. 2개의 신호 처리 경로들만이 명확성을 위해 도 5에 도시되어 있다. 전형적인 시스템들에서 사용하기 위한 상기 합성 필터 뱅크(27)의 구현예들은 수백 개의 경로들을 가질 수 있다.
상기 디포맷터(51b), 상기 역 2차 변환(52b), 및 상기 버퍼(53b)는 상기 상부 신호 경로에서 개별 구성요소들에 대해 상술된 것들과 유사한 하위 신호 경로에서의 과정들을 수행한다.
a) 디포맷터
도 5에 도시된 상위 신호 경로를 참조하면, 상기 디포맷터(51a)는 상기 디포 맷터(23) 및 상기 디코더(25)로부터 수신되는 데이터로부터 하이브리드-변환 계수들의 세트들과 블록 길이 정보를 분해하는데 사용될 수 있는 선택적 구성요소이다. 이는 상기 합성 필터 뱅크(27)의 하이브리드-변환 구현이 상기 수신기의 나머지에 대한 최소한의 변화들에 따라 도 2에 도시된 기존의 수신기로 포함되게 한다.
b) 역 2차 변환
상기 역 2차 변환(52a)은 하이브리드-변환 계수들의 세트를 소스 신호 세그먼트들의 시퀀스의 특정 주파수에 대한 스펙트럼 내용을 표현하는 스펙트럼 계수들의 블록으로 변환한다. 스펙트럼 계수들의 블록은 상기 버퍼(53a)에 저장된다. 상기 변환의 블록은 상기 경로(59a)로부터 수신된 블록 길이 정보에 응답하여 적응된다. 바람직한 구현예에서, type II IDCT는 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용된다. 이 변환은식(8)로 표현될 수 있다.
Figure 112006055886608-pct00009
여기서,엔코드된 하이브리드-변환 계수들로부터 구한
Figure 112006055886608-pct00010
계수 k이다.
상기 역 2차 변환은 식(8)에 따라 직접 구현될 수 있거나, 계산적으로 더 효율적인 공지된 과정들에 의해 구현될 수 있다.
c) 역 1차 변환
상기 버퍼들(53a 및 53b)은 스펙트럼 계수들을 저장하고, 상기 역 1차 변환이 개별 소스 신호 세그먼트들의 스펙트럼 내용을 표현하는 스펙트럼 계수들의 세 트들을 수신하는 방식으로 그들을 상기 역 1차 변환(54)으로 통과시킨다. 신호 샘플들의 세그먼트들은 역 변환을 상기 스펙트럼 계수들의 세트들에 적용함으로써 발생되고 상기 버퍼(55)에 저장된다. 상기 역 1차 변환의 길이는 상기 경로(22)로부터 수신된 세그먼트 길이 정보에 응답하여 적응된다. 상기 O-TDAC IMDCT는 바람직한 구현에서 사용된다.
전형적인 응용들에서, 상기 MDCT 계수들의 절반은 상기 전송기에서 폐기된다. 상기 폐기된 계수들은 다음의 식(9)를 사용하여 상기 수신기에 의해 복원될 수 있다.
Figure 112006055886608-pct00011
상기 O-TDAC IMDCT는 식(10)으로서 표현될 수 있다.
Figure 112006055886608-pct00012
여기서,
Figure 112006055886608-pct00013
=복원된 신호 샘플이다.
상기 역 1차 변환은 식(10)에 따라 직접 구현될 수 있거나, 미국특허공보 제5,394,473호에서 기재된 FFT를 사용하는 것들과 같이 계산적으로 더 효율적인 공지된 과정들에 의해 구현될 수 있다.
d) 합성 윈도우 함수
상기 윈도우(56)는 합성 윈도우 함수에 따라 상기 버퍼(55)에 저장된 신호 샘플들의 세그먼트들을 가중화하고 상기 중첩 부분들에서 서로에 중첩 세그먼트들 에서 가중된 샘플들을 부가함으로써 상기 경로(29)를 따라 출력 신호를 발생시킨다. 상기 역 1차 변환, 합성 윈도우 함수 및 상기 중첩-부가 과정은 순방향 변환에 의해 발생된 시간-도메인 에일리어싱 아티팩트들의 적어도 실질적인 부분을 제거한다. 제거는 엔코딩 과정들 및 상기 1차와 2차 변환들의 계산들에서 미세한 산술적 정밀성에 의해 유발된 변환 계수들에 대한 수정들로 인해 정확할 수 없다. 각각의 세그먼트에 대한 상기 합성 윈도우 함수의 길이 및 형태는 상기 경로(22)로부터 수신된 세그먼트 길이 정보에 응답하여 적응된다. 식(4)에 상술된 부넉 윈도우 함수 WA와 동일한 KBD 윈도우 함수는 바람직한 구현예에서 사용된다.
상기 합성 윈도우 함수 및 상기 역 1차 변환은 상술된 것들과 같은 과정들을 사용하여 세그먼트 길이 정보에 응답하여 적응될 수 있다.
C. 구현
이전의 개시는 약간의 구현예 만을 언급한다. 다양한 변환들과 변환 형태들이 사용될 수 있다. 본 발명의 원리들은 적용될 수 있고 광범위한 방식들로 구현될 수 있다.
본 발명의 다양한 특징들을 포함하는 장치들은 컴퓨터 또는 범용 컴퓨터에서의 것들과 유사한 구성요소들에 결합된 디지털 신호 프로세서(DSP)와 같은 더 특수화된 구성요소들을 포함하는 일부 다른 장치에 의한 실행을 위한 소프트웨어를 포함하는 다양한 방식들로 구현될 수 있다. 도 3은 본 발명의 특징들을 구현하는데 사용될 수 있다. DSP(72)는 컴퓨팅 리소스들을 제공한다. RAM(73)은 신호 처리를 위한 DSP(72)에 의해 사용된 시스템 랜덤 액세스 메모리(RAM)이다. ROM(74)은 장 치(70)를 동작시키고 본 발명의 다양한 특징들을 실행하는데 필요한 프로그램들을 저장하기 위한 판독 전용 메모리(ROM)와 같은 지속적인 저장소의 일부 형식을 표현한다. I/O 제어(75)는 통신 채널들(76, 77)에 의해 신호들을 수신 및 전송하는 인터페이스 회로를 나타낸다. 아날로그-디지털 변환기들과 디지털-아날로그 변환기들은 아날로그 신호들이 수신 및/또는 전송되도록 I/O 제어(75)에 포함될 수 있다. 도시된 실시예에서, 모든 주요 시스템 구성요소들은 버스(71)에 접속하며, 하나 이상의 물리적 버스를 나타낼 수 있으나, 버스 아키텍처는 본 발명을 구현하도록 요구되지 않는다.
범용 컴퓨터 시스템에서 구현되는 실시예들에서, 추가 구성요소들은 키보드 또는 마우스 및 표시기와 같은 장치에 인터페이스하고, 자기 테이프 또는 디스크와 같은 저장 매체를 갖는 저장 장치를 제어하기 위해 포함될 수 있다. 상기 저장 매체는 시스템들, 유틸리티들 및 응용들을 동작시키기 위한 프로그램들의 명령들을 기록하는데 사용될 수 있고, 본 발명의 다양한 특징들을 구현하는 프로그램들의 실시예들을 포함할 수 있다.
본 발명의 다양한 특징들을 실시하는데 필요한 기능들은 이산 논리 소자들, 집적 회로들, 하나 이상의 ASIC 및/또는 프로그램-제어된 프로세서들을 포함하는 광범위한 방식들로 구현되는 구성요소들에 의해 수행될 수 있다. 이들 구성요소들이 구현되는 방식은 본 발명에는 중요하지 않다.
본 발명의 소프트웨어 구현들은 기저대역 또는 초음속에서 자외선 주파수들까지 포함하는 스펙트럼을 통한 변조된 통신 경로들과 같은 다양한 기기 판독가능 한 매체 또는 자기 테이프 카드들 또는 디스크, 광 카드 또는 디스크, 및 종이와 같은 매체 상의 검출가능한 마킹들을 포함한 필수적인 임의의 기록 기술을 사용하여 정보를 운반하는 저장 매체에 의해 운반될 수 있다.

Claims (24)

  1. 출력 신호를 발생시키는 방법에 있어서,
    스펙트럼 내용을 갖는 소스 신호의 샘플들을 수신하는 단계;
    복수의 세트의 스펙트럼 계수들을 발생시키기 위해, 1차 변환을 상기 샘플들의 중첩(overlapping) 세그멘트들에 적용하는 단계로서, 상기 1차 변환는 수정된 이산 코사인 변환이며, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱 아티팩트(time-domain aliasing artifacts)를 갖고 주파수 세트를 위한 개별 소스 신호 세그먼트의 스펙트럼 내용을 표현하는, 단계;
    상기 복수의 세트의 스펙트럼 계수들로부터 상기 주파수 세트들에서 동일한 주파수를 표현하고, 상기 복수의 스펙트럼 계수들을 상기 스펙트럼 계수들의 하나 이상의 블록들로 조립하는 복수의 스펙트럼 계수들을 구하는 단계로서, 상기 하나 이상의 블록들 각각에서 조립되는 스펙트럼 계수들의 갯수는 블록-길이 제어 신호에 응답하여 적응되는, 단계;
    하나 이상의 세트의 하이브리드-변환 계수들을 발생시기키 위해, 2차 변환을 상기 하나 이상의 블록의 스펙트럼 계수들에 적용하는 단계로서, 상기 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용되는 이산 코사인 변환이며, 상기 하나 이상의 블록들의 스펙트럼 계수들 각각에 적용되는 상기 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되는, 단계; 및
    상기 하나 이상의 세트들의 하이브리드-변환 계수들 및 상기 블록-길이 제어 신호를 표현하는 정보를 상기 출력 신호로 조립하는 단계;를 포함하는 것을 특징으로 하는 방법.
  2. 삭제
  3. 제1항에 있어서,
    복수의 세트의 스펙트럼 성분들 내에서 스펙트럼 성분 크기들에 대한 유사성의 측정치를 발생시키는 단계, 및
    상기 유사성의 측정치에 응답하여 상기 블록-길이 제어 신호를 발생시키는 단계를 포함하는 것을 특징으로 하는 방법.
  4. 제1항 또는 제3항에 있어서,
    세그먼트-길이 제어 신호를 발생시키기 위해 상기 소스 신호의 샘플들을 분석하는 단계, 및
    분석 윈도우 함수를 상기 소스 신호의 샘플들의 세그먼트에 적용하는 단계를 포함하며,
    상기 분석 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적용되는 것을 특징으로 하는 방법.
  5. 제4항에 있어서,
    상기 1차 변환는 기본 함수들의 세트를 갖고, 상기 방법은 상기 세그먼트-길이 제어 신호에 응답하여 상기 기본 함수의 세트를 적응시키는 단계를 포함하는 것을 특징으로 하는 방법.
  6. 출력 신호를 발생시키는 방법에 있어서,
    소스 신호의 스펙트럼 내용을 표현하는 입력 신호를 수신하는 단계;
    상기 입력 신호로부터 하나 이상의 세트의 하이브리드-변환 계수들과 블록-길이 제어 신호를 얻는 단계;
    주파수 세트에서 동일한 주파수에 대한 상기 소스 신호의 스펙트럼 내용을 표현하는 하나 이상의 블록들의 스펙트럼 계수들을 발생시키기 위해, 역 2차 변환을 상기 하나 이상의 세트의 하이브리드-변환 계수들에 적용하는 단계로서, 상기 역 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들을 표현하는 하이브리드-변환 계수들의 세트들에 적용되는 역 이산 코사인 변환이며, 상기 하이브리드-변환 계수들의 세트에 적용되는 상기 역 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되는, 단계;
    상기 스펙트럼 계수들을 스펙트럼 계수들의 세트로 조립하는 단계로서, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱을 갖고 상기 주파수 세트에서 모든 주파수들에 대한 상기 소스 신호의 세그먼트의 스펙트럼 내용을 표현하는, 단계; 및
    상기 소스 신호의 세그먼트들에 대응하는 출력 신호 세그먼트들을 발생시키기 위해, 역 1차 변환을 상기 스펙트럼 계수들의 세트에 적용하는 단계로서, 상기 역 1차 변환은 역 수정된 이산 코사인 변환이고, 상기 역 1차 변환은 상기 시간-도메인 에일리어싱 아트팩트들을 실질적으로 제거하는, 단계;를 포함하는 것을 특징으로 하는 방법.
  7. 삭제
  8. 제6항에 있어서,
    상기 입력 신호로부터 세그먼트-길이 제어 신호를 얻는 단계, 및
    합성 윈도우 함수를 출력 신호 세그먼트에 적용하는 단계를 포함하며,
    상기 합성 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 방법.
  9. 제8항에 있어서,
    상기 역 1차 변환은 기본 함수들의 세트들을 갖고 상기 방법은 상기 세그먼트-길이 제어 신호에 응답하여 상기 기본 함수들의 세트를 적응시키는 단계를 포함하는 것을 특징으로 하는 방법.
  10. 출력 신호를 발생시키기 위한 장치에 있어서,
    (a) 입력 단자;
    (b) 출력 단자; 및
    (c) 상기 입력 단자 및 상기 출력 단자에 결합되는 신호 처리 회로;를 포함하며,
    상기 신호 처리 회로는,
    상기 입력 단자로부터 스펙트럼 내용을 갖는 소스 신호의 샘플들을 수신하고,
    복수의 세트의 스펙트럼 계수들을 발생시키기 위해, 1차 변환을 상기 샘플들의 중첩 세그먼트들에 적용하되, 상기 1차 변환은 수정된 이산 코사인 변환이고, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱 아티팩트들을 갖고 주파수 세트에 대한 개별 소스 신호 세그먼트의 스펙트럼 내용을 표현하며,
    상기 복수의 세트의 스펙트럼 계수들로부터 상기 주파수 세트에서 동일한 주파수를 표현하는 복수의 스펙트럼 계수들을 얻고, 상기 복수의 스펙트럼 계수들을 하나 이상의 블록들의 스펙트럼 계수들로 조립하되, 상기 하나 이상의 블록들 각각에서 조립되는 스펙트럼 계수들의 갯수는 블록-길이 제어 신호에 응답하여 적응되며,
    하나 이상의 세트들의 하이브리드-변환 계수들을 발생시키기 위해 2차 변환을 상기 하나 이상의 블록들의 스펙트럼 계수들에 적용하되, 상기 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용되는 이산 코사인 변환이며, 상기 하나 이상의 블록들의 스펙트럼 계수들 각각에 적용되는 상기 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되고,
    상기 하나 이상의 세트들의 하이브리드-변환 계수들과 상기 블록-길이 제어 신호를 표현하는 정보를 상기 출력 단자에 전송되는 출력 신호로 조립하는 것을 특징으로 하는 장치.
  11. 삭제
  12. 제10항에 있어서,
    상기 신호 처리 회로는
    복수의 세트들의 스펙트럼 성분들 내에서 스펙트럼 성분 크기들에 대한 유사성의 측정치를 발생시키고,
    상기 유사성의 측정치에 응답하여 상기 블록-길이 제어 신호를 발생시키도록 적응되는 것을 특징으로 하는 장치.
  13. 제10항 또는 제12항에 있어서,
    상기 신호 처리 회로는 세그먼트-길이 제어 신호를 발생시키기 위해 상기 소스 신호의 샘플들을 분석하고,
    분석 윈도우 함수를 상기 소스 신호의 샘플들의 세그먼트에 적용하도록 적응되며,
    상기 분석 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 장치.
  14. 제13항에 있어서,
    상기 1차 변환은 기본 함수의 세트를 갖고 상기 신호 처리 회로는 상기 세그먼트-길이 제어 신호에 응답하여 기본 함수들의 세트들을 적응시키는 것을 특징으로 하는 장치.
  15. 출력 신호를 발생시키기 위한 장치에 있어서,
    (a) 입력 단자;
    (b) 출력 단자; 및
    (c) 상기 입력 단자 및 상기 출력 단자에 결합되는 신호 처리 회로;를 포함하며,
    상기 신호 처리 회로는,
    상기 입력 단자로부터 소스 신호의 스펙트럼 내용을 표현하는 입력 신호를 수신하며,
    상기 입력 신호로부터 하나 이상의 세트들의 하이브리드-변환 계수들과 블록-길이 제어 신호를 얻고,
    주파수 세트에서 동일한 주파수에 대한 상기 소스 신호의 스펙트럼 내용을 표현하는 하나 이상의 블록들의 스펙트럼 계수들을 발생시키기 위해, 역 2차 변환을 상기 하나 이상의 블록들의 스펙트럼 계수들을 적용하되, 상기 역 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들을 표현하는 하이브리드-변환 계수들의 세트들에 적용되는 역 이산 코사인 변환이고, 상기 하이브리드-변환 계수들의 세트들에 적용되는 상기 역 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되며,
    상기 스펙트럼 계수들을 스펙트럼 계수들의 세트들로 조립하되, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리이싱 아티팩트들을 갖고 상기 주파수의 세트들에서 모든 주파수들에 대한 상기 소스 신호의 세그먼트의 스펙트럼 내용을 표현하고,
    상기 소스 신호의 세그먼트들에 대응하는 출력 신호 세그먼트들을 발생시키기 위해, 역 1차 변환을 상기 스펙트럼 계수들의 세트들에 적용하며, 상기 역 1차 변환은 역 수정된 이산 코사인 변환이고, 상기 역 1차 변환은 상기 시간-도메인 에일리어싱 아티팩트들을 실질적으로 제거하고 상기 출력 신호 세그먼트들은 상기 출력 단자에 전송되는 것을 특징으로 하는 장치.
  16. 삭제
  17. 제15항에 있어서, 상기 신호 처리 회로는 ,
    상기 입력 신호로부터 세그먼트-길이 제어 신호를 얻고,
    합성 윈도우 함수를 출력 신호 세그먼트에 적용하도록 적응되며,
    상기 합성 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 장치.
  18. 제17항에 있어서,
    상기 역 1차 변환은 기본 함수들의 세트를 갖고 상기 신호 처리 회로는 상기 세그먼트-길이 제어 신호에 응답하여 상기 기본 함수들의 세트를 적응시키는 것을 특징으로 하는 장치.
  19. 출력 신호를 발생시키는 방법을 수행하기 위해 장치에 의해 실행가능한 명령들의 프로그램을 운반하기 위한 매체로서,
    스펙트럼 내용을 갖는 소스 신호의 샘플들을 수신하는 단계,
    복수의 세트의 스펙트럼 계수들을 발생시키기 위해, 1차 변환을 상기 샘플들의 중첩 세그멘트들에 적용하는 단계로서, 상기 1차 변환은 수정된 이산 코사인 변환이고, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱 아티팩트를 갖고 주파수 세트를 위한 개별 소스 신호 세그먼트의 스펙트럼 내용을 표현하며,
    상기 복수의 세트의 스펙트럼 계수들로부터 상기 주파수 세트들에서 동일한 주파수를 표현하고, 상기 복수의 스펙트럼 계수들을 상기 스펙트럼 계수들의 하나 이상의 블록들로 조립하는 복수의 스펙트럼 계수들을 구하는 단계로서, 상기 하나 이상의 블록들 각각에서 조립되는 스펙트럼 계수들의 개수는 블록-길이 제어 신호에 응답하여 적응되며,
    하나 이상의 세트의 하이브리드-변환 계수들을 발생시기키 위해, 2차 변환을 상기 하나 이상의 블록의 스펙트럼 계수들에 적용하는 단계로서, 상기 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용되는 이산 코사인 변환이며, 상기 하나 이상의 블록들의 스펙트럼 계수들 각각에 적용되는 상기 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되며,
    상기 하나 이상의 세트들의 하이브리드-변환 계수들 및 상기 블록-길이 제어 신호를 표현하는 정보를 상기 출력 신호로 조립하는 단계를 포함한, 매체.
  20. 삭제
  21. 제19항에 있어서,상기 방법이,
    세그먼트-길이 제어 신호를 발생시키기 위해 상기 소스 신호의 샘플들을 분석하는 단계, 및
    분석 윈도우 함수를 상기 소스 신호의 샘플들의 세그먼트에 적용하는 단계를 포함하며,
    상기 분석 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 매체.
  22. 출력 신호를 발생시키는 방법을 수행하기 위해 장치에 의해 실행가능한 명령들의 프로그램을 운반하기 위한 매체로서,
    소스 신호의 스펙트럼 내용을 표현하는 입력 신호를 수신하는 단계,
    상기 입력 신호로부터 하나 이상의 세트의 하이브리드-변환 계수들과 블록-길이 제어 신호를 얻는 단계,
    주파수 세트에서 동일한 주파수에 대한 상기 소스 신호의 스펙트럼 내용을 표현하는 하나 이상의 블록들의 스펙트럼 계수들을 발생시키기 위해, 역 2차 변환을 상기 하나 이상의 세트의 하이브리드-변환 계수들에 적용하는 단계로서, 상기 역 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들을 표현하는 하이브리드-변환 계수들에 적용되는 역 이산 코사인 변환이고, 상기 하이브리드-변환 계수들의 세트에 적용되는 상기 역 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되며,
    상기 스펙트럼 계수들을 스펙트럼 계수들의 세트로 조립하는 단계로서, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱을 갖고 상기 주파수 세트에서 모든 주파수들에 대한 상기 소스 신호의 세그먼트의 스펙트럼 내용을 표현하며,
    상기 소스 신호의 세그먼트들에 대응하는 출력 신호 세그먼트들을 발생시키기 위해, 역 1차 변환을 상기 스펙트럼 계수들의 세트에 적용하는 단계로서, 상기 역 1차 변환은 역 수정된 이산 코사인 변환이고, 상기 역 1차 변환은 상기 시간-도메인 에일리어싱 아트팩트들을 실질적으로 제거하는, 단계를 포함한, 매체.
  23. 삭제
  24. 제22항에 있어서, 상기 방법이,
    상기 입력 신호로부터 세그먼트-길이 제어 신호를 얻는 단계, 및
    합성 윈도우 함수를 상기 출력 신호 세그먼트에 적용하는 단계를 포함하며,
    상기 합성 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 매체.
KR1020067015751A 2004-02-19 2006-08-03 신호 분석 및 합성을 위한 적응형 하이브리드 변환 KR101273486B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/783,951 2004-02-19
US10/783,951 US7516064B2 (en) 2004-02-19 2004-02-19 Adaptive hybrid transform for signal analysis and synthesis
PCT/US2005/001923 WO2005083682A1 (en) 2004-02-19 2005-01-21 Adaptive hybrid transform for signal analysis and synthesis

Publications (2)

Publication Number Publication Date
KR20070001123A KR20070001123A (ko) 2007-01-03
KR101273486B1 true KR101273486B1 (ko) 2013-06-14

Family

ID=34861377

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067015751A KR101273486B1 (ko) 2004-02-19 2006-08-03 신호 분석 및 합성을 위한 적응형 하이브리드 변환

Country Status (22)

Country Link
US (1) US7516064B2 (ko)
EP (3) EP2088583B1 (ko)
JP (1) JP4689625B2 (ko)
KR (1) KR101273486B1 (ko)
CN (2) CN101826071B (ko)
AT (1) ATE526660T1 (ko)
AU (2) AU2005217943B2 (ko)
BR (1) BRPI0507806B1 (ko)
CA (4) CA2880055C (ko)
CY (1) CY1122444T1 (ko)
DE (1) DE602005015427D1 (ko)
DK (1) DK1723638T3 (ko)
ES (1) ES2329384T3 (ko)
HK (2) HK1092925A1 (ko)
IL (1) IL177093A (ko)
LT (1) LT2293293T (ko)
MY (2) MY146425A (ko)
PL (1) PL1723638T3 (ko)
PT (1) PT1723638E (ko)
SI (1) SI2088583T1 (ko)
TW (2) TWI463790B (ko)
WO (1) WO2005083682A1 (ko)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050229769A1 (en) * 2004-04-05 2005-10-20 Nathaniel Resnikoff System and method for assigning visual markers to the output of a filter bank
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
ATE547898T1 (de) 2006-12-12 2012-03-15 Fraunhofer Ges Forschung Kodierer, dekodierer und verfahren zur kodierung und dekodierung von datensegmenten zur darstellung eines zeitdomänen-datenstroms
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
MX2010001763A (es) * 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Analisis/sintesis espectral de baja complejidad utilizando la resolucion temporal seleccionable.
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
US9384748B2 (en) * 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
CA2763793C (en) * 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
WO2011013983A2 (en) * 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
UA100353C2 (uk) 2009-12-07 2012-12-10 Долбі Лабораторіс Лайсензін Корпорейшн Декодування цифрових потоків кодованого багатоканального аудіосигналу з використанням адаптивного гібридного перетворення
BR122021008583B1 (pt) 2010-01-12 2022-03-22 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo
TR201900663T4 (tr) 2010-01-13 2019-02-21 Voiceage Corp Doğrusal öngörücü filtreleme kullanarak ileri doğru zaman alanı alıasıng iptali ile ses kod çözümü.
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
EP4398248A3 (en) * 2010-07-08 2024-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder using forward aliasing cancellation
MX2013010537A (es) 2011-03-18 2014-03-21 Koninkl Philips Nv Codificador y decodificador de audio con funcionalidad de configuracion.
EP2695161B1 (en) 2011-04-08 2014-12-17 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
WO2013022426A1 (en) * 2011-08-08 2013-02-14 Hewlett-Packard Development Company, L.P. Method and system for compression of a real-time surveillance signal
US8527264B2 (en) 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
US9648322B2 (en) * 2012-07-10 2017-05-09 Qualcomm Incorporated Coding random access pictures for video coding
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
US9349196B2 (en) 2013-08-09 2016-05-24 Red Hat, Inc. Merging and splitting data blocks
DE102014101307A1 (de) * 2014-02-03 2015-08-06 Osram Opto Semiconductors Gmbh Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
EP3276620A1 (en) 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
EP3616197A4 (en) 2017-04-28 2021-01-27 DTS, Inc. AUDIO ENCODER WINDOW SIZES AND TIME-FREQUENCY TRANSFORMATIONS
EP3644313A1 (en) * 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214742A (en) 1989-02-01 1993-05-25 Telefunken Fernseh Und Rundfunk Gmbh Method for transmitting a signal
US5394473A (en) 1990-04-12 1995-02-28 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5107345A (en) * 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
JPH1175157A (ja) * 1997-08-29 1999-03-16 Sony Corp 映像信号及び音声信号の記録装置
US6430529B1 (en) * 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
JP3762579B2 (ja) * 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
JP2002091500A (ja) * 2000-09-19 2002-03-27 Sharp Corp デジタルデータ符号化方法
JP3894722B2 (ja) * 2000-10-27 2007-03-22 松下電器産業株式会社 ステレオオーディオ信号高能率符号化装置
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
JP3725876B2 (ja) * 2002-03-27 2005-12-14 株式会社東芝 オーディオ符号化器とその符号化処理プログラム
JP2003345779A (ja) * 2003-03-26 2003-12-05 Seiko Epson Corp フィルタリング処理方法およびフィルタリング処理装置
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5214742A (en) 1989-02-01 1993-05-25 Telefunken Fernseh Und Rundfunk Gmbh Method for transmitting a signal
US5394473A (en) 1990-04-12 1995-02-28 Dolby Laboratories Licensing Corporation Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio

Also Published As

Publication number Publication date
HK1130358A1 (en) 2009-12-24
CA2880055C (en) 2016-05-31
MY143979A (en) 2011-07-29
CA2554381A1 (en) 2005-09-09
JP4689625B2 (ja) 2011-05-25
JP2007526691A (ja) 2007-09-13
TW200529548A (en) 2005-09-01
PT1723638E (pt) 2009-09-24
AU2010203126A1 (en) 2010-08-12
CN101826071B (zh) 2011-09-14
CN1926609B (zh) 2010-05-26
DE602005015427D1 (en) 2009-08-27
US20050185850A1 (en) 2005-08-25
TW201214949A (en) 2012-04-01
CA2924281C (en) 2017-11-07
BRPI0507806B1 (pt) 2019-06-25
PL1723638T3 (pl) 2009-11-30
CA2860180C (en) 2015-08-11
CA2554381C (en) 2014-11-04
CN101826071A (zh) 2010-09-08
CA2924281A1 (en) 2005-09-09
KR20070001123A (ko) 2007-01-03
IL177093A0 (en) 2006-12-10
LT2293293T (lt) 2020-01-10
US7516064B2 (en) 2009-04-07
HK1092925A1 (en) 2007-02-16
WO2005083682A1 (en) 2005-09-09
TWI463790B (zh) 2014-12-01
BRPI0507806A (pt) 2007-07-10
IL177093A (en) 2010-12-30
AU2010203126B2 (en) 2012-12-13
AU2005217943A1 (en) 2005-09-09
SI2088583T1 (sl) 2012-07-31
TWI369852B (en) 2012-08-01
MY146425A (en) 2012-08-15
EP2088583B1 (en) 2011-09-28
EP1723638B1 (en) 2009-07-15
CN1926609A (zh) 2007-03-07
CA2880055A1 (en) 2005-09-09
DK1723638T3 (da) 2009-09-07
ES2329384T3 (es) 2009-11-25
CA2860180A1 (en) 2005-09-09
EP2088583A3 (en) 2009-08-19
EP2293293B1 (en) 2019-11-27
EP2088583A2 (en) 2009-08-12
ATE526660T1 (de) 2011-10-15
EP2293293A1 (en) 2011-03-09
CY1122444T1 (el) 2021-01-27
EP1723638A1 (en) 2006-11-22
AU2005217943B2 (en) 2010-05-13

Similar Documents

Publication Publication Date Title
KR101273486B1 (ko) 신호 분석 및 합성을 위한 적응형 하이브리드 변환
JP6472863B2 (ja) パラメトリック・マルチチャネル・エンコードのための方法
CA2907595A1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
CN116018640A (zh) 对过渡段编码失真具有鲁棒性的音频编码/解码设备和方法
AU2012247062B2 (en) Adaptive Hybrid Transform for Signal Analysis and Synthesis
CN111862994A (zh) 一种声波信号解码的方法及装置
MXPA06009424A (es) Transformada hibrida adaptiva para analisis y sintesis de señal
KR100424036B1 (ko) 시간영역얼라이싱소거를이용한효율적인기수스택단측대역필터뱅크를구비한분해/합성필터링시스템
US10410644B2 (en) Reduced complexity transform for a low-frequency-effects channel
JPH06232762A (ja) 信号符号化装置および信号復号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20111228

Effective date: 20130419

S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160525

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170526

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20180525

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190529

Year of fee payment: 7