KR101273486B1 - 신호 분석 및 합성을 위한 적응형 하이브리드 변환 - Google Patents
신호 분석 및 합성을 위한 적응형 하이브리드 변환 Download PDFInfo
- Publication number
- KR101273486B1 KR101273486B1 KR1020067015751A KR20067015751A KR101273486B1 KR 101273486 B1 KR101273486 B1 KR 101273486B1 KR 1020067015751 A KR1020067015751 A KR 1020067015751A KR 20067015751 A KR20067015751 A KR 20067015751A KR 101273486 B1 KR101273486 B1 KR 101273486B1
- Authority
- KR
- South Korea
- Prior art keywords
- transform
- signal
- coefficients
- spectral coefficients
- spectral
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 43
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 26
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 26
- 230000003044 adaptive effect Effects 0.000 title description 4
- 230000003595 spectral effect Effects 0.000 claims description 110
- 230000006870 function Effects 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 53
- 230000004044 response Effects 0.000 claims description 35
- 238000012545 processing Methods 0.000 claims description 17
- 239000002131 composite material Substances 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000002789 length control Methods 0.000 claims 33
- 230000009466 transformation Effects 0.000 abstract description 14
- 230000007704 transition Effects 0.000 description 13
- 239000000872 buffer Substances 0.000 description 12
- 230000003068 static effect Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 230000001149 cognitive effect Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 1
- IXKSXJFAGXLQOQ-XISFHERQSA-N WHWLQLKPGQPMY Chemical compound C([C@@H](C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CNC=N1 IXKSXJFAGXLQOQ-XISFHERQSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Discrete Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Resistance Or Impedance (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereophonic System (AREA)
- Control Of Eletrric Generators (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Stereo-Broadcasting Methods (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
오디오 및 비디오 코딩 시스템들에 사용된 것들과 같은 분석과 합성 필터 뱅크들은 하나 이상의 2차 변환들과 연결한 1차 변환를 포함하는 하이브리드 변환에 의해 각각 구현된다. 상기 필터 뱅크들용 1차 변환들은 시간-도메인 에일리어싱 아티팩트가 제거된 분석/합성 시스템을 구현한다. 상기 1차 변환들과 연결한 상기 2차 변환들은 변환 계수들의 블록들에 적용된다. 상기 블록들의 길이는 상기 분석과 합성 뱅크들의 시간 분해능을 적응시키도록 변화된다.
뱅크, 변환, 분석/합성 시스템, 하이브리드 변환, 아트팩트
Description
본 발명은 일반적으로 오디오 및 비디오 코딩 시스템들에 사용될 수 있는 것들과 같은 신호 분석 및 합성 필터 뱅크들에 관한 것이다. 특히, 본 발명은 상기 필터 뱅크들의 시간 및 주파수 분해능(frequency resolutions)을 적응시킬 수 있는 블록 변환들의 캐스케이드에 의해 구현되는 분석 및 합성 필터 뱅크들에 관한 것이다.
코딩 시스템들은 종종 소스 신호를 적절히 표현하도록 요구된 정보량을 감소시키는데 사용된다. 정보 용량 전제조건들을 감소시킴으로써, 신호 표현은 더 낮은 대역폭을 갖는 채널들을 통해 전송되거나 적은 공간을 사용하여 매체에 저장될 수 있다. 코딩은 신호에서 리던던트(redundant) 성분들 또는 무관한 성분들을 제거함으로써, 소스 신호의 정보 용량 전제조건들을 감소시킬 수 있다. 이른바 인지 코딩 방법들과 시스템들은 종종 필터 뱅크들을 사용하여, 스펙트럼 성분들의 기본 세트를 사용하여 소스 신호를 비상관시킴으로써 리던던시를 감소시키고, 의사-인지 기준에 따라 스펙트럼 성분들의 적응형 양자화에 의해 무관성(irrelevancy)을 감소시킨다.
다양한 인지 코딩 시스템들은 블록 변환들에 의해 필터 뱅크들을 구현한다. 오디오 코딩 시스템에서, 예를 들면, 시간-도메인 샘플들의 시간 세그먼트들 또는 블록들로 표현되는 소스 오디오 신호는 소스 신호의 스펙트럼 내용을 표현하는 주파수-도메인 계수들의 세트들로 변환된다. 세그먼트들의 길이는 필터 뱅크의 시간 분해능과 주파수 분해능 모두를 수립한다. 시간 분해능은 세그먼트 길이가 감소함에 따라 증가한다. 주파수 분해능은 세그먼트 길이가 증가함에 따라 증가한다. 이러한 관계로 인해, 세그먼트 길이의 선택은 블록 변환 필터 뱅크의 시간 및 주파수 분해능 간의 상충관계를 부과한다.
세그먼트 길이의 단일 선택은 전형적인 코딩 시스템들에 의해 부딪치는 모든 소스 신호 조건들에 대한 분해능 간의 최적의 상충관계를 제공할 수 있다. 느리게 변하거나 정적인 소스 신호들은, 필터 뱅크가 더 높은 주파수 분해능을 가지면 더 효율적으로 엔코드될 수 있으며, 더 긴 세그먼트 길이가 사용되면 제공될 수 있다. 고속으로 변하거나 매우 정적이지 않은 소스 신호들은 일반적으로, 필터 뱅크가 더 높은 시간 분해능을 가지면 더 효율적으로 엔코드될 수 있으며, 더 짧은 세그먼트 길이가 사용되면 제공될 수 있다. 소스 신호 조건들의 변화에 응답하여 세그먼트 길이를 적응시킴으로써, 블록 변환 필터 뱅크는 그 시간 및 주파수 분해능 간의 상충관계를 최적화할 수 있다.
다양한 변환들은, 예를 들면, 오디오 코딩 시스템들에서 필터 뱅크들을 구현하는데 사용될 수 있지만, 특정 수정된 이산 코사인 변환(MDCT)은, 인접한 소스 신호 세그먼트들이 서로 중첩되게 하면서 임계 샘플링을 제공할 능력을 포함하는 오 디오 코딩을 위한 몇몇 매우 유리한 특성들을 가지므로 널리 사용된다. MDCT는 세그먼트 내에서 실질적으로 정적인 소스 신호에서 모든 리던던트 성분들을 실질적으로 제거할 수 있으므로 또한 매력적이다. MDCT 필터 뱅크의 적당한 동작은 1987년 5월, 프린센(Princen) 등에 의해 Acoustics, Speech and Signal Processing(ICASSP)의 1987 국제 학회의 Proc.에서의 페이지 2161-64에 기재된 "시간 도메인 에일리어싱 제거에 기초한 필터 뱅크 설계를 사용하는 서브대역/변환 코딩"의 특정 기준을 만족하는 중첩된 소스-신호 세그먼트들과 윈도우 함수들의 사용을 필요로 한다. 불행하게도, 소스 신호 세그먼트들의 중첩에 적용되어야 하는 윈도우 함수들에 부과되는 전제조건들로 인해 신호 조건들에 응답하여 MDCT 필터 뱅크들의 시간 및 주파수 분해능을 적응시키기 어렵다.
종종 "윈도우 스위칭"이라 하는 하나의 공지된 기술은 갑작스런 신호 변화들 또는 크기 천이들과 같은 임의의 신호 조건들의 검출에 응답하여 2개의 다른 윈도우 함수들 사이를 적응적으로 전환시킴으로써 MDCT 필터 뱅크의 시간 분해능을 적응시킬 수 있다. 1993년 5월25일 에들러(Edler)에 의해 발행된 미국특허공보 제5,214,742호에 기재된 이러한 기술에 따르면, 세그먼트 길이들은 변하지 않지만, 시간 분해능은 필터 뱅크에 의해 변환된 각각의 세그먼트에서 넌-제로(non-zero) 샘플들의 갯수를 감소시키기 위해, 다른 윈도우 함수 형태들 사이를 전환시킴으로써 적응된다. 불행하게도, 이 기술은 필터 뱅크의 주파수 분해능을 적응시키지 않고 필터 뱅크의 주파수 선택도는, 윈도우 전환에 필요한 윈도우 함수들의 형태가 MDCT의 적당한 동작을 위한 전제조건들을 만족시키는데 차선이어야 하므로 시간 분 해능이 감소될 때마다 심각하게 저하된다.
종종 "블록 전환"이라 하는 다른 공지된 기술은 다른 윈도우 함수 형태들 사이를 전환한다는 점에서 상술된 윈도우-전환 기술과 유사하지만, 블록-전환 기술은 급격한 신호 변화들 또는 크기 천이들과 같은 임의의 신호 조건들의 검출에 응답하여 2개의 다른 세그먼트 길이들 사이를 적응적으로 또한 전환시킴으로써 MDCT 필터 뱅크의 시간 및 주파수 분해능 모두를 적응시킬 수 있다. 이 기술은 1997년10월, 보시(Bosi) 등에 의한 J.Audio Eng. Soc. vol.45, no. 10의 페이지 789-814에 기재된 "ISO/IEC MPEG-2 진보된 오디오 코딩"의 진보된 오디오 코딩(AAC)에 사용된다.
AAC에서, MDCT 필터 뱅크는 2048 샘플들과 동일한 길이를 갖는 정적인 소스 신호 세그먼트들에 적용되고 256 샘플들과 동일한 길이를 갖는 비-정적 소스 신호 세그먼트들에 적용된다. 블록 전환은 더 긴 세그먼트들에 적절한 "긴 윈도우 함수들", 더 짧은 세그먼트들에 적절한 "짧은 윈도우 함수들", 더 긴 세그먼트 길이에서 더 짧은 세그먼트 길이로의 전환을 허용하는 "쟁-대-단 브릿징 윈도우 함수(long-to-short bridging funtions)", 및 더 짧은 세그먼트 길이에서 더 긴 세그먼트 길이로의 전환을 허용하는 "단-대-장 브릿징 윈도우 함수"을 사용하여 AAC에서 실현된다. 2개의 브릿징 윈도우 함수들은 MDCT의 적당한 동작에 필요한 기준을 만족시키면서 다른 세그먼트 길이 간의 전환을 허용한다. 더 긴 세그먼트 길이에서 더 짧은 세그먼트 길이 및 다시 더 긴 길이로의 전환은 MDCT를 장-대-단 브릿징 윈도우 함수를 사용하여 긴 세그먼트에 적용하며, 상기 MDCT를 짧은 윈도우 함수를 사용하여 8개의 짧은 세그먼트들의 정수배에 적용하고, MDCT를 단-대-장 브릿징 윈 도우 함수를 사용하여 긴 세그먼트에 적용함으로써 실현된다. 그 직후에, MDCT는 긴 세그먼트에 적용되어야 하지만, 긴 윈도우 함수는 사용될 수 있거나, 장-대-단 브릿징 윈도우 함수는 다른 블록 전환이 필요해지면 사용될 수 있다.
블록 전환이 MDCT 필터 뱅크의 시간 및 주파수 분해능을 적응시키는 방식을 제공하더라도, 몇몇 이유들로 이상적인 해결책은 없다. 하나의 이유는, 변환의 주파수 선택도가 브릿지 윈도우 함수의 형태가 세그먼트-길이 전환을 허용하고 MDCT의 적당한 동작을 위한 전제조건을 만족시키는 차선이어야 하므로 블록 길이들의 전환 동안에 저하된다는 것이다. 다른 이유는 임의의 시간에서 발생할 수 없다는 것이다. 상술된 바와 같이, MDCT는 더 긴 세그먼트 길이로 전환한 직후에, 다른 긴 세그먼트에 적용되어야 한다. 더 짧은 길이로의 즉각적인 전환은 불가능하다. 이 블록 전환 기술은 또한, 전환 메카니즘이 모든 신호 조건들에 최적이 아닌 2개의 세그먼트 길이들만을 제공하므로 이상적인 해결책이 아니다. 예를 들면, AAC에서 2개의 세그먼트 길이들은 AAC에서 더 길거나 더 짧은 세그먼트 길이가 최고의 스피치 신호 세그먼트들에 최적화되지 않으므로, 최적이 아니다. 2048-샘플 세그먼트들은 일반적으로 스피치의 비-정적인 특성에 대한 너무 길고 256-샘플 세그먼트들은 일반적으로 너무 짧아서 리던던트 성분들을 효과적으로 제거하지 못한다. 게다가, 2048 샘플들 보다 긴 세그먼트 길이는 더 최적일 많은 정적 신호들이 있다. 그 결과, AAC의 성능은 MDCT 필터 뱅크의 시간 및 주파수 뱅크를 적응시키는 블록 전환의 한정된 능력에 의해 악화된다.
블록 전환의 다른 형식은 돌비 디지털 엔코드된 비트 스트림 표준에 따른 코 딩 시스템들에서 사용된다. 종종 AC-3라 하는 이 코딩 표준은 2001년8월20일 공개된 "갱신 A 대 디지털 오디오 압축(AC-3) 표준"의 진보된 텔레비젼 시스템 위원회(ATSC) A/52A 문서에 기재되어 있다. AC-3 코딩 시스템들에 사용된 블록 전환의 형식은 MDCT를 정적 신호들을 위한 512 샘플들 또는 비-정적 신호들을 위한 256 샘플들의 소스 신호 세그먼트들에 적용한다. AC-3 코딩 시스템에 사용된 블록 전환 기술은 길이 전환이 이뤄질 때의 선택에서 더 유연성을 제공한다. 게다가, 코딩 성능은 스피치와 같이 비-정적 소스 신호들에 합리적으로 우수하지만, 더 정적인 신호들에 대한 코딩 성능은 더 긴 세그먼트에 의해 제공된 비교적 낮은 주파수 분해능에 의해 한정된다.
MDCT 필터 뱅크의 시간 및 주파수 분해능의 적응적 제어를 위한 다른 기술들은 1995년2월28일, 데이비드슨에 의해 발행된 미국특허공보 제5,394,473호에 기재되어 있다. 이들 기술들 중 일부는 MDCT 필터 뱅크가 다른 공지된 기술들에 의해 가능한 것 보다 훨씬 우수한 주파수 응답을 제공하는 윈도우 함수들을 사용하여 필수적으로 임의의 길이의 세그먼트들에 적용되게 한다. 불행하게도, 이들 기술들은 MDCT의 커넬 또는 기본 함수들을 적응시켜야 하고, 이에 따라, 상술된 AC-3 표준과 같은 기존의 비트 스트림 표준들과 호환하지 못한다. 이들 기술들은 또한 계산 집중적이다.
필요한 것은 MDCT와 같은 변환들에 의해 구현되는 필터 뱅크들의 주파수 분해능을 적응시키는 더 효율적이고 효과적인 방식이다. 바람직하게, 상기 분해능은 기존의 비트 스트림 표준들과 호환가능한 시스템들로의 포함을 간략화하는 구현을 제공해야한다. 이는 블록 변환들의 캐스케이드에 의해 구현될 수 있는 하이브리드-변환 필터 뱅크를 사용하여 달성된다.
본 발명의 가르침에 따르면, 분석 및 합성 필터 뱅크들은 하나 이상의 2차 변환과 연결한 1차 변환을 포함하는 하이브리드 변환에 의해 구현된다. 하나의 구현예에서, 상기 1차 변환은 세그먼트 길이의 절반 만큼 서로 중첩하는 소스 신호 세그먼트들에 적용되는 MDCT이고 상기 2차 변환은 시간을 통해 특정 주파수에 대한 MDCT 계수들의 비-중첩 블록들에 적용되는 DCT이다. 상기 필터 뱅크들의 주파수 분해능은 상기 하나 이상의 2차 변환들에 의해 변환되는 블록들에서의 계수들의 갯수를 증가시킴으로써 증가될 수 있다. 상기 하나 이상의 2차 변환들은 계수 주파수에 따라 변하는 다수의 계수들을 갖는 MDCT 계수들의 블록들에 적용될 수 있어, 상기 필터 뱅크의 주파수 분해능이 광범위한 방식들로 적응되게 한다.
본 발명의 다양한 특징들과 그 바람직한 실시예들은 몇몇 특징들에서 유사한 참조번호들이 유사한 소자들을 가리키는 다음의 설명과 첨부한 도면들을 참조하여 더 이해될 수 있다. 다음의 설명과 도면들의 내용들은 예제로서만 언급되고 본 발명의 범위에 대한 한정을 표현하는 것으로 이해되지 않아야 한다.
도 1은 코딩 시스템에서 사용되는 전송기의 개략적인 블록도이다.
도 2는 코딩 시스템에서 사용되는 수신기의 개략적인 블록도이다.
도 3은 본 발명의 다양한 특징들을 구현하는데 사용될 수 있는 장치의 개략 적인 블록도이다.
도 4는 본 발명의 다양한 특징들을 포함하는 분석 필터 뱅크의 개략적인 블록도이다.
도 5는 본 발명의 다양한 특징들을 포함하는 분석 필터 뱅크의 개략적인 블록도이다.
A. 개요
본 발명은 주파수 분해능이 쉽게 적응될 수 있는 하이브리드 변환에 의해 구현되는 필터 뱅크를 제공한다. 도 1 및 도 2는 각각 본 발명의 다양한 특징들을 포함할 수 있는 오디오 코딩 시스템에서 전송기 및 수신기의 개략적인 블록도를 도시한다. 도시된 전송기 및 수신기의 특징들은 다음의 섹션들에서 간략하게 설명된다. 이 설명에 따라, 분석 및 합성 필터 뱅크들의 관련 특징들이 설명된다.
1. 전송기
도 1에 도시된 전송기는 상기 소스 신호의 스펙트럼 내용을 표현하는 스펙트럼 계수들을 발생시키기 위해 상기 분석 필터 뱅크(3)를 경로 1로부터 수신된 소스 신호에 적용하며, 엔코드된 정보를 발생시키기 위해 상기 엔코더(5)를 상기 스펙트럼 계수들에 적용하고, 경로 9를 따르는 전송에 적당한 출력 신호를 발생시키기 위해 상기 엔코드된 정보에 적용한다. 상기 출력 신호는 수신기에 바로 전달될 수 있거나 다음의 전달을 위해 기록될 수 있다. 상기 분석 필터 뱅크(3)는 이하에 기재되는 바와 같은 다양한 방식들로 구현될 수 있다.
이 설명에서, "엔코더" 및 "엔코딩"과 같은 용어들은 정보 처리의 임의의 특정 형태를 유추하도록 의도되지 않는다. 예를 들면, 엔코딩은 종종 정보 용량 전제조건들을 감소시키는데 사용되지만, 여기에서 이들 용어들은 반드시 이러한 형태의 처리를 언급하지 않는다. 상기 엔코더(5)는 바라는 임의의 형태의 처리를 필수적으로 수행할 수 있다. 하나의 구현예에서, 엔코드된 정보는 2001년6월12일, 데이비드슨(Davidson) 등에 의해 허여된 미국특허공보 제6,246,345호에 기재된 벡터 양자화 및 이득-적응 양자화를 포함하는 광범위한 양자화 기술들을 사용한 인지 모델에 따라 스펙트럼 계수들을 양자화함으로써 발생된다.
2. 수신기
도 2에 도시된 수신기는 엔코드된 정보를 얻기 위해 상기 디포맷터(23)를 경로 21로부터 수신된 입력 신호에 적용하며, 소스 신호의 스펙트럼 내용을 표현하는 스펙트럼 계수들을 얻기 위해 상기 디코더(25)를 상기 엔코드된 정보에 적용하고, 상기 소스 신호의 복제물이지만 정확한 복제물일 수 없는 경로 29를 따르는 출력 신호를 발생시키기 위해 상기 합성 필터 뱅크(27)를 상기 스펙트럼 계수들에 적용한다. 상기 합성 필터 뱅크(27)는 상기 분석 필터 뱅크(3)의 구현에 상보적인 다양한 방식들로 구현될 수 있다.
이 개시에서, "디코더" 및 "디코딩"과 같은 용어들은 임의의 특정 형태의 정보 처리를 유추하도록 의도되지 않는다. 상기 디코더(25)는 요구되거나 바라는 임의의 형태의 처리를 필수적으로 수행할 수 있다. 상술된 엔코딩 과정에 반대인 하나의 구현예에서, 양자화된 스펙트럼 성분들은 양자화되지 않은 스펙트럼 계수들로 디코드된다. 특정 형태의 디코딩은 본 발명에서는 중요하지 않다.
B. 적응형 하이브리드 변환
상기 분석 필터 뱅크(3) 및 상기 합성 필터 뱅크(27)는 도 4 및 도 5에 도시된 바와 같이 구현될 수 있는 하이브리드 변환을 각각 도시한다.
도 4에 도시된 분석 필터 뱅크(3)는 1차 변환(43) 및 상기 1차 변환와 연결한 하나 이상의 2차 변환(45)를 포함한다. 상기 1차 변환는 상기 소스 신호 세그먼트들의 스펙트럼 콘텐츠를 표현하는 스펙트럼 계수들의 세트들을 발생시키기 위해 소스 신호의 세그먼트들에 적용된다. 상기 하나 이상의 2차 변환 각각은 시간을 통해 특정 주파수에 대한 스펙트럼 계수들의 블록들에 적용된다. 각각의 블록에서 계수들의 갯수는 제어 신호에 응답하여 적응된다.
도 5에 도시된 합성 필터 뱅크(27)는 하나 이상의 역 2차 변환들(52) 및 상기 역 2차 변환와 연결한 역 1차 변환(54)를 포함한다. 상기 하나 이상의 역 2차 변환들 각각은 시간을 통해 특정 주파수에 대한 스펙트럼 계수들의 블록들을 발생시킨다. 각각의 블록에서 계수들의 갯수는 제어 신호에 응답하여 적응된다. 스펙트럼 계수들의 블록들은 주파수에 걸쳐 특정 시간에 대한 스펙트럼 계수들의 세트들로 조립되고 상기 1차 변환는 원래 소스 신호의 복제물을 제공하도록 조합된 신호의 세그먼트들을 발생시키기 위해 스펙트럼 계수들의 세트들에 적용된다.
상기 분석 필터 뱅크 및 상기 합성 필터 뱅크에 대한 1차 변환들은 역 1차 변환이 순방향 1차 변환에 의해 발생되는 시간-도메인 에일리어싱 아티팩트들을 제거하는 분석/합성 시스템을 구현한다. 예를 들면, 상술된 프린센 논문에 기재된 상기 수정된 이산 코사인 변환(MDCT) 및 상기 역 MDCT(IMDCT)는 홀수로 스택된 임계 샘플된 단일-측대역 분석/합성 시스템에 등가한 시간 도메인을 구현한다. 이들 변환들은 여기서 홀수로-스택된 시간-도메인 에일리어싱 제거(O-TDAC) 변환들이라 한다. 다른 TDAC 구현은 1986년 프린센 등에 의해 IEEE Trans. on Acoust., Speech, Signal Proc., vol. ASSP-34, 페이지 1153-1161에 기재된 "시간 도메인 에일리어싱 제거에 기초한 분석/합성 필터 뱅크 설계"에 기재되어 있다. 이 구현예에서 상기 분석 필터 뱅크는 대안 신호 세그먼트들에 MDCT 및 수정된 이산 사인 변환(MDST)의 적용을 포함한다. 상기 합성 필터 뱅크는 IMDCT 및 역 MDST(IMDST)의 적용을 포함한다. 이들 변환들은 짝수로-스택된 임계 샘플된 단일-측대역 분석/합성 시스템에 등가한 시간-도메인을 구현하고 짝수로-스택된 시간-도메인 에일리어싱 제거 변환들이라 한다.
상기 2차 변환들은 상기 이산 코사인 변환(DCT), 상기 이산 사인 변환(DST), 및 상기 이산 푸리에 변환(DFT)을 포함한 다수의 변환들 중 임의의 변환에 의해 구현될 수 있다.
상기 분석 필터 뱅크(3)의 바람직한 구현에서, type-II DCT는 상술된 O-TDAC MDCT와 연결하여 사용된다. 상기 합성 필터 뱅크(27)의 대조적인 구현에서, 상기 O-TDAC IMDCT는 type-II 역 DCT(IDCT)와 연결하여 사용된다. 이들 구현들은 이하 더 상세하게 기재된다.
1. 분석 필터 뱅크
도 4를 참조하면, 소스 신호 샘플들의 시퀀스는 경로 1로부터 수신되고 상기 버퍼(41)에 저장된다. 상기 분석기(47)는 일부 분석 과정을 저장된 샘플들에 적용함으로써 다음의 처리를 위해 사용하기 위해, 각 세그먼트에서 소스 신호 샘플들의 개수, 또는 세그먼트 길이를 결정하는 선택적 구성요소이다. 임의의 분석 과정은 바라는대로 필수적으로 사용될 수 있다. 예를 들면, 크기 천이들은 상술된 ATSC A/52A에 기재된 바와 같이 검출될 수 있다. 선택된 세그먼트 길이들을 표현하는 정보는 경로 2를 따라 출력 신호에 포함하기 위해 상기 포맷터(7)로 통과된다. 고정된 길이 세그먼트들은 상기 분석기(47) 및 상기 경로 2를 생략한 대안의 구현예에서 사용된다.
a) 분석 윈도우 함수
상기 윈도우(42)는 분석 윈도우 함수에 따라 각각의 세그먼트에서 소스 신호 샘플들을 가중함으로써 중첩 세그먼트들의 시퀀스를 형성한다. 각각의 세그먼트를 위한 상기 분석 윈도우 함수의 길이 및 형태는 상기 경로 2로부터 수신된 세그먼트 길이 정보에 응답하여 적응된다. 광범위한 윈도우 함수들은 사용될 수 있지만, 카이저-베젤-도출(KBD) 윈도우 함수는 일반적으로, 탁월한 주파수 선택비 특성들을 가지므로 바람직하다. 이 윈도우 함수는 식(1)로서 표현될 수 있는 카이저-베젤 윈도우 함수로부터 도출된다.
α=카이저-베젤 알파 인자,
n=윈도우 함수 샘플 번호,
N=샘플들의 번호에서 윈도우 함수 길이, 및
4 내지 7의 범위에서의 알파 값은 전형적인 오디오 코딩 응용들에서 잘 동작한다.
상기 도출은 소정의 윈도우 함수 길이 N - 중첩 간격 γ과 동일한 길이를 갖는 수직 윈도우 함수와 상기 카이저-베젤 윈도우 함수 W(n)를 콘볼루션시킨다. 식(2)를 참조한다. 이 콘볼루션은 식(3)에 도시된 바와 같이 간략화될 수 있다.
여기서, γ=상기 세그먼트 중첩 간격 내의 샘플들의 번호,
N=상기 윈도우 함수의 소정의 길이,
W(n)=길이 γ+1의 카이저-베젤 윈도우 함수,
WP(n)=길이 N의 도출된 곱셈-윈도우,
s(k)= 0≤k<N-γ인 경우 1, 다른 경우에는 0이다.
상기 KBD 분석 윈도우 함수는 상기 도출된 곱셈-윈도우 WP(n)의 제곱근을 취하여 구해질 수 있다. 이 분석 윈도우 함수는 식(4)로 표현될 수 있다.
(b) 1차 변환
상기 1차 변환(43)은 윈도우된 소스 신호 샘플들의 각 세그먼트를 스펙트럼 계수들의 세트로 변환한다. 계수들의 세트에서 각 계수는 특정 주파수에 대한 윈도우된 세그먼트의 스펙트럼 내용을 표현한다. 상기 O-TDAC MDCT는 바람직한 구현에서 사용된다. 이 변환은 식(5)로 표현될 수 있다.
여기서, k=주파수 계수 번호,
n=입력 신호 샘플 번호,
m=소스 신호 세그먼트 번호,
N=소스 신호 세그먼트 길이,
x(n)=샘플 n에서 소스 신호 x의 값, 및
C(k)=MDCT 계수 k이다.
상기 O-TDAC MDCT는 식(6)의 스펙트럼 계수들의 세트를 생성한다.
상기 1차 변환은 식(5)에 따라 직접 구현될 수 있거나 미국특허공보 제 5,394,473호에 기재된 고속 푸리에 변환(FFT)을 사용한 것들과 같이 계산적으로 더 효율적인 과정들에 의해 구현될 수 있다. 상기 분석 윈도우 함수 및 상기 1차 변환은 요구될 수 있는 필수적으로 임의의 과정을 사용한 세그먼트 길이에 응답하여 적응될 수 있다. 일부 기술들은 미국특허공보 제5,214,742호, 미국특허공보 제5,394,473호, 상기 ATSC A/52A 문서, 및 상기 인용된 상기 ISO/MPEG AAC 문서에 개시되어 있다.
하나 이상의 개별 주파수들 각각에 대한 상기 윈도우된 소스 신호 세그먼트들의 스펙트럼 내용을 표현한 스펙트럼 계수들은 개별 신호 경로들을 따라 통과되고 버퍼들에 저장된다. 도 4에 도시된 전송기는, 예를 들면, 상기 버퍼들(44a 및 44b)에의 저장을 위한 2개의 신호 경로들 중 하나를 따라 2개의 개별 주파수들 각각에 대한 스펙트럼 계수들을 통과시킨다. 단 2개의 신호 처리 경로들이 명확성을 위해 도 4에 도시되어 있다. 전형적인 시스템들에 사용하기 위한 상기 분석 필터 뱅크(3)의 구현예들이 수백 개의 경로들을 가질 수 있다.
c) 스펙트럼 성분 분석
도 4에 도시된 상위 신호 경로를 참조하면, 세그먼트들의 시퀀스에서 특정 주파수에 대한 스펙트럼 계수들은 상기 버퍼(44a)에 저장되고 블록들로 조립된다. 상기 분석기(48a)는 블록 길이인 각각의 블록에서 계수들의 갯수를 결정하고, 상기 경로(49a)를 따라 이 길이를 통과시킨다. 이 길이는 상기 버퍼(44a)에 저장된 계수들을 분석함으로써 결정될 수 있다. 분석의 특정 방법은 본 발명에 원리상 중요하다. 일부 분석 방법들은 여기에 기재되어 있다.
하나의 기본 방법은, 개별 블록에서의 계수들이 크기에서 충분히 유사한 스펙트럼 계수들의 가장 긴 가능한 블록들을 형성한다. 이는 다양한 방식들로 결정될 수 있다. 하나의 방식은 인접한 스펙트럼 계수들 간의 크기 차이를 계산하고 평균 차이가 일부 임계치 미만인 인접한 계수들의 가장 긴 블록을 구별한다. 다른 방식은 다수의 신호 경로들을 위해 버퍼들에 저장된 스펙트럼 계수들을 사용한다. 이 방법은 스펙트럼 계수들의 대역에 대한 크기 차이들을 합산하고 상기 대역에 걸친 평균 차이가 사람의 청각 체계의 이른바 임계 대역폭들과 같은 크기일 수 있다.
다른 기본 방법은 전송기에 어디서든 수행되는 신호 엔코딩 과정들에 의해 수행되는 신호 분석에 의존한다. 상기 인용된 A/52A 문서에 기재된 비트 스트림 표준과 호환가능한 전송기는, 예를 들면, 스케일 인자들과 관련된 스케일된 값들로서 표현된 스펙트럼 계수들을 갖는 엔코드된 신호를 발생시킨다. 상기 스케일 인자들은 스케일 인자들의 공통 세트를 공유할 수 있는 MDCT 계수 세트들의 시퀀스들을 구별하도록 분석된다. 상기 분석기(48a)는 지수들을 공유하는 계수 세트들의 갯수를 동일하게 하도록 개별 신호 경로에 대한 블록 길이를 적응시킨다.
d) 2차 변환
상기 2차 변환(45a)은 스펙트럼 계수들의 각 블록을 하이브리드-변환 계수들의 세트로 변환한다. 상기 변환의 길이는 상기 경로(49a)로부터 수신되는 블록 길이 정보에 응답하여 적응된다. 바람직한 구현예에서, type II DCT는 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용된다. 이 변환은 식(7)로서 표현될 수 있다.
여기서, X(k,j)=MDCT 계수 k에 대한 하이브리드 변환 계수 j,
M=MDCT 계수 k의 블록의 길이, 그리고
상기 2차 변환은 식(7)에 따라 직접 구현될 수 있거나 1990년 Academic Press, Inc.의 라오(Rao) 등에 의한 "이산 코사인 변환"의 제4장에 기재된 것들과 같이 계산적으로 더 효율적인 공지된 과정들에 의해 구현될 수 있다.
e) 포맷터 및 다른 신호 경로들
상기 포맷터(46a)는 상기 하이브리드-변환 계수들과 블록 길이 정보를 상기 엔코더(5) 및 상기 포맷터(7)가 처리할 수 있는 데이터로 조립하는데 사용될 수 있는 선택적인 구성요소이다. 이는 도 1에 도시된 상기 전송기에서의 분석 필터 뱅크(3)가 상기 전송기의 나머지 부분에 대한 최소의 변화들을 갖는 하이브리드 변환에 의해 구현되게 한다.
상기 버퍼(44b), 상기 분석기(48b), 상기 2차 변환(45b), 및 상기 포맷터(46b)는 상기 상위 신호 경로에서 개별 구성요소들에 대해 상술된 것들과 유사한 하위 신호 경로에서의 과정들을 수행한다.
f) 엔코딩
전형적인 시스템들에서, 상기 엔코더(5)는 일부 엔코드된 형식에서 하이브리 드-변환 계수들을 표현하는 엔코드된 정보를 발생시킨다. 인지 엔코딩 과정들이 사용되면, 상기 하이브리드-변환 계수들은 인지 무관성을 감소시키는 형식으로 엔코드된다. 인지 엔코딩 과정들은 일반적으로 수신기에 의해 복원되거나 재생성될 수 없도록 스펙트럼 정보를 손실되게 한다. 이 손실의 가능성은 상기 하이브리드 변환에 의해 발생된 하이브리드-변환 계수들에 대한 가능한 수정을 가리키는 심볼 ~X(k,j)로 이하에 표현된다. 이러한 엔코딩 과정들의 사용은 본 발명에 중요하지 않다.
2. 합성 필터 뱅크
도 5를 참조하면, 상기 디포맷터들(51a 및 51b)은 하이브리드 변환 계수들과 상기 경로들(26a 및 26b)로부터 수신되는 데이터로부터의 블록 길이 정보를 얻는다. 상기 블록 길이 정보는 상기 경로(59a 및 59b)를 따라 통과되고 상기 하이브리드-변환 계수들은 상기 역 2차 변환들(52a 및 52b)에 통과된다. 2개의 신호 처리 경로들만이 명확성을 위해 도 5에 도시되어 있다. 전형적인 시스템들에서 사용하기 위한 상기 합성 필터 뱅크(27)의 구현예들은 수백 개의 경로들을 가질 수 있다.
상기 디포맷터(51b), 상기 역 2차 변환(52b), 및 상기 버퍼(53b)는 상기 상부 신호 경로에서 개별 구성요소들에 대해 상술된 것들과 유사한 하위 신호 경로에서의 과정들을 수행한다.
a) 디포맷터
도 5에 도시된 상위 신호 경로를 참조하면, 상기 디포맷터(51a)는 상기 디포 맷터(23) 및 상기 디코더(25)로부터 수신되는 데이터로부터 하이브리드-변환 계수들의 세트들과 블록 길이 정보를 분해하는데 사용될 수 있는 선택적 구성요소이다. 이는 상기 합성 필터 뱅크(27)의 하이브리드-변환 구현이 상기 수신기의 나머지에 대한 최소한의 변화들에 따라 도 2에 도시된 기존의 수신기로 포함되게 한다.
b) 역 2차 변환
상기 역 2차 변환(52a)은 하이브리드-변환 계수들의 세트를 소스 신호 세그먼트들의 시퀀스의 특정 주파수에 대한 스펙트럼 내용을 표현하는 스펙트럼 계수들의 블록으로 변환한다. 스펙트럼 계수들의 블록은 상기 버퍼(53a)에 저장된다. 상기 변환의 블록은 상기 경로(59a)로부터 수신된 블록 길이 정보에 응답하여 적응된다. 바람직한 구현예에서, type II IDCT는 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용된다. 이 변환은식(8)로 표현될 수 있다.
상기 역 2차 변환은 식(8)에 따라 직접 구현될 수 있거나, 계산적으로 더 효율적인 공지된 과정들에 의해 구현될 수 있다.
c) 역 1차 변환
상기 버퍼들(53a 및 53b)은 스펙트럼 계수들을 저장하고, 상기 역 1차 변환이 개별 소스 신호 세그먼트들의 스펙트럼 내용을 표현하는 스펙트럼 계수들의 세 트들을 수신하는 방식으로 그들을 상기 역 1차 변환(54)으로 통과시킨다. 신호 샘플들의 세그먼트들은 역 변환을 상기 스펙트럼 계수들의 세트들에 적용함으로써 발생되고 상기 버퍼(55)에 저장된다. 상기 역 1차 변환의 길이는 상기 경로(22)로부터 수신된 세그먼트 길이 정보에 응답하여 적응된다. 상기 O-TDAC IMDCT는 바람직한 구현에서 사용된다.
전형적인 응용들에서, 상기 MDCT 계수들의 절반은 상기 전송기에서 폐기된다. 상기 폐기된 계수들은 다음의 식(9)를 사용하여 상기 수신기에 의해 복원될 수 있다.
상기 O-TDAC IMDCT는 식(10)으로서 표현될 수 있다.
상기 역 1차 변환은 식(10)에 따라 직접 구현될 수 있거나, 미국특허공보 제5,394,473호에서 기재된 FFT를 사용하는 것들과 같이 계산적으로 더 효율적인 공지된 과정들에 의해 구현될 수 있다.
d) 합성 윈도우 함수
상기 윈도우(56)는 합성 윈도우 함수에 따라 상기 버퍼(55)에 저장된 신호 샘플들의 세그먼트들을 가중화하고 상기 중첩 부분들에서 서로에 중첩 세그먼트들 에서 가중된 샘플들을 부가함으로써 상기 경로(29)를 따라 출력 신호를 발생시킨다. 상기 역 1차 변환, 합성 윈도우 함수 및 상기 중첩-부가 과정은 순방향 변환에 의해 발생된 시간-도메인 에일리어싱 아티팩트들의 적어도 실질적인 부분을 제거한다. 제거는 엔코딩 과정들 및 상기 1차와 2차 변환들의 계산들에서 미세한 산술적 정밀성에 의해 유발된 변환 계수들에 대한 수정들로 인해 정확할 수 없다. 각각의 세그먼트에 대한 상기 합성 윈도우 함수의 길이 및 형태는 상기 경로(22)로부터 수신된 세그먼트 길이 정보에 응답하여 적응된다. 식(4)에 상술된 부넉 윈도우 함수 WA와 동일한 KBD 윈도우 함수는 바람직한 구현예에서 사용된다.
상기 합성 윈도우 함수 및 상기 역 1차 변환은 상술된 것들과 같은 과정들을 사용하여 세그먼트 길이 정보에 응답하여 적응될 수 있다.
C. 구현
이전의 개시는 약간의 구현예 만을 언급한다. 다양한 변환들과 변환 형태들이 사용될 수 있다. 본 발명의 원리들은 적용될 수 있고 광범위한 방식들로 구현될 수 있다.
본 발명의 다양한 특징들을 포함하는 장치들은 컴퓨터 또는 범용 컴퓨터에서의 것들과 유사한 구성요소들에 결합된 디지털 신호 프로세서(DSP)와 같은 더 특수화된 구성요소들을 포함하는 일부 다른 장치에 의한 실행을 위한 소프트웨어를 포함하는 다양한 방식들로 구현될 수 있다. 도 3은 본 발명의 특징들을 구현하는데 사용될 수 있다. DSP(72)는 컴퓨팅 리소스들을 제공한다. RAM(73)은 신호 처리를 위한 DSP(72)에 의해 사용된 시스템 랜덤 액세스 메모리(RAM)이다. ROM(74)은 장 치(70)를 동작시키고 본 발명의 다양한 특징들을 실행하는데 필요한 프로그램들을 저장하기 위한 판독 전용 메모리(ROM)와 같은 지속적인 저장소의 일부 형식을 표현한다. I/O 제어(75)는 통신 채널들(76, 77)에 의해 신호들을 수신 및 전송하는 인터페이스 회로를 나타낸다. 아날로그-디지털 변환기들과 디지털-아날로그 변환기들은 아날로그 신호들이 수신 및/또는 전송되도록 I/O 제어(75)에 포함될 수 있다. 도시된 실시예에서, 모든 주요 시스템 구성요소들은 버스(71)에 접속하며, 하나 이상의 물리적 버스를 나타낼 수 있으나, 버스 아키텍처는 본 발명을 구현하도록 요구되지 않는다.
범용 컴퓨터 시스템에서 구현되는 실시예들에서, 추가 구성요소들은 키보드 또는 마우스 및 표시기와 같은 장치에 인터페이스하고, 자기 테이프 또는 디스크와 같은 저장 매체를 갖는 저장 장치를 제어하기 위해 포함될 수 있다. 상기 저장 매체는 시스템들, 유틸리티들 및 응용들을 동작시키기 위한 프로그램들의 명령들을 기록하는데 사용될 수 있고, 본 발명의 다양한 특징들을 구현하는 프로그램들의 실시예들을 포함할 수 있다.
본 발명의 다양한 특징들을 실시하는데 필요한 기능들은 이산 논리 소자들, 집적 회로들, 하나 이상의 ASIC 및/또는 프로그램-제어된 프로세서들을 포함하는 광범위한 방식들로 구현되는 구성요소들에 의해 수행될 수 있다. 이들 구성요소들이 구현되는 방식은 본 발명에는 중요하지 않다.
본 발명의 소프트웨어 구현들은 기저대역 또는 초음속에서 자외선 주파수들까지 포함하는 스펙트럼을 통한 변조된 통신 경로들과 같은 다양한 기기 판독가능 한 매체 또는 자기 테이프 카드들 또는 디스크, 광 카드 또는 디스크, 및 종이와 같은 매체 상의 검출가능한 마킹들을 포함한 필수적인 임의의 기록 기술을 사용하여 정보를 운반하는 저장 매체에 의해 운반될 수 있다.
Claims (24)
- 출력 신호를 발생시키는 방법에 있어서,스펙트럼 내용을 갖는 소스 신호의 샘플들을 수신하는 단계;복수의 세트의 스펙트럼 계수들을 발생시키기 위해, 1차 변환을 상기 샘플들의 중첩(overlapping) 세그멘트들에 적용하는 단계로서, 상기 1차 변환는 수정된 이산 코사인 변환이며, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱 아티팩트(time-domain aliasing artifacts)를 갖고 주파수 세트를 위한 개별 소스 신호 세그먼트의 스펙트럼 내용을 표현하는, 단계;상기 복수의 세트의 스펙트럼 계수들로부터 상기 주파수 세트들에서 동일한 주파수를 표현하고, 상기 복수의 스펙트럼 계수들을 상기 스펙트럼 계수들의 하나 이상의 블록들로 조립하는 복수의 스펙트럼 계수들을 구하는 단계로서, 상기 하나 이상의 블록들 각각에서 조립되는 스펙트럼 계수들의 갯수는 블록-길이 제어 신호에 응답하여 적응되는, 단계;하나 이상의 세트의 하이브리드-변환 계수들을 발생시기키 위해, 2차 변환을 상기 하나 이상의 블록의 스펙트럼 계수들에 적용하는 단계로서, 상기 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용되는 이산 코사인 변환이며, 상기 하나 이상의 블록들의 스펙트럼 계수들 각각에 적용되는 상기 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되는, 단계; 및상기 하나 이상의 세트들의 하이브리드-변환 계수들 및 상기 블록-길이 제어 신호를 표현하는 정보를 상기 출력 신호로 조립하는 단계;를 포함하는 것을 특징으로 하는 방법.
- 삭제
- 제1항에 있어서,복수의 세트의 스펙트럼 성분들 내에서 스펙트럼 성분 크기들에 대한 유사성의 측정치를 발생시키는 단계, 및상기 유사성의 측정치에 응답하여 상기 블록-길이 제어 신호를 발생시키는 단계를 포함하는 것을 특징으로 하는 방법.
- 제1항 또는 제3항에 있어서,세그먼트-길이 제어 신호를 발생시키기 위해 상기 소스 신호의 샘플들을 분석하는 단계, 및분석 윈도우 함수를 상기 소스 신호의 샘플들의 세그먼트에 적용하는 단계를 포함하며,상기 분석 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적용되는 것을 특징으로 하는 방법.
- 제4항에 있어서,상기 1차 변환는 기본 함수들의 세트를 갖고, 상기 방법은 상기 세그먼트-길이 제어 신호에 응답하여 상기 기본 함수의 세트를 적응시키는 단계를 포함하는 것을 특징으로 하는 방법.
- 출력 신호를 발생시키는 방법에 있어서,소스 신호의 스펙트럼 내용을 표현하는 입력 신호를 수신하는 단계;상기 입력 신호로부터 하나 이상의 세트의 하이브리드-변환 계수들과 블록-길이 제어 신호를 얻는 단계;주파수 세트에서 동일한 주파수에 대한 상기 소스 신호의 스펙트럼 내용을 표현하는 하나 이상의 블록들의 스펙트럼 계수들을 발생시키기 위해, 역 2차 변환을 상기 하나 이상의 세트의 하이브리드-변환 계수들에 적용하는 단계로서, 상기 역 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들을 표현하는 하이브리드-변환 계수들의 세트들에 적용되는 역 이산 코사인 변환이며, 상기 하이브리드-변환 계수들의 세트에 적용되는 상기 역 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되는, 단계;상기 스펙트럼 계수들을 스펙트럼 계수들의 세트로 조립하는 단계로서, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱을 갖고 상기 주파수 세트에서 모든 주파수들에 대한 상기 소스 신호의 세그먼트의 스펙트럼 내용을 표현하는, 단계; 및상기 소스 신호의 세그먼트들에 대응하는 출력 신호 세그먼트들을 발생시키기 위해, 역 1차 변환을 상기 스펙트럼 계수들의 세트에 적용하는 단계로서, 상기 역 1차 변환은 역 수정된 이산 코사인 변환이고, 상기 역 1차 변환은 상기 시간-도메인 에일리어싱 아트팩트들을 실질적으로 제거하는, 단계;를 포함하는 것을 특징으로 하는 방법.
- 삭제
- 제6항에 있어서,상기 입력 신호로부터 세그먼트-길이 제어 신호를 얻는 단계, 및합성 윈도우 함수를 출력 신호 세그먼트에 적용하는 단계를 포함하며,상기 합성 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 방법.
- 제8항에 있어서,상기 역 1차 변환은 기본 함수들의 세트들을 갖고 상기 방법은 상기 세그먼트-길이 제어 신호에 응답하여 상기 기본 함수들의 세트를 적응시키는 단계를 포함하는 것을 특징으로 하는 방법.
- 출력 신호를 발생시키기 위한 장치에 있어서,(a) 입력 단자;(b) 출력 단자; 및(c) 상기 입력 단자 및 상기 출력 단자에 결합되는 신호 처리 회로;를 포함하며,상기 신호 처리 회로는,상기 입력 단자로부터 스펙트럼 내용을 갖는 소스 신호의 샘플들을 수신하고,복수의 세트의 스펙트럼 계수들을 발생시키기 위해, 1차 변환을 상기 샘플들의 중첩 세그먼트들에 적용하되, 상기 1차 변환은 수정된 이산 코사인 변환이고, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱 아티팩트들을 갖고 주파수 세트에 대한 개별 소스 신호 세그먼트의 스펙트럼 내용을 표현하며,상기 복수의 세트의 스펙트럼 계수들로부터 상기 주파수 세트에서 동일한 주파수를 표현하는 복수의 스펙트럼 계수들을 얻고, 상기 복수의 스펙트럼 계수들을 하나 이상의 블록들의 스펙트럼 계수들로 조립하되, 상기 하나 이상의 블록들 각각에서 조립되는 스펙트럼 계수들의 갯수는 블록-길이 제어 신호에 응답하여 적응되며,하나 이상의 세트들의 하이브리드-변환 계수들을 발생시키기 위해 2차 변환을 상기 하나 이상의 블록들의 스펙트럼 계수들에 적용하되, 상기 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용되는 이산 코사인 변환이며, 상기 하나 이상의 블록들의 스펙트럼 계수들 각각에 적용되는 상기 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되고,상기 하나 이상의 세트들의 하이브리드-변환 계수들과 상기 블록-길이 제어 신호를 표현하는 정보를 상기 출력 단자에 전송되는 출력 신호로 조립하는 것을 특징으로 하는 장치.
- 삭제
- 제10항에 있어서,상기 신호 처리 회로는복수의 세트들의 스펙트럼 성분들 내에서 스펙트럼 성분 크기들에 대한 유사성의 측정치를 발생시키고,상기 유사성의 측정치에 응답하여 상기 블록-길이 제어 신호를 발생시키도록 적응되는 것을 특징으로 하는 장치.
- 제10항 또는 제12항에 있어서,상기 신호 처리 회로는 세그먼트-길이 제어 신호를 발생시키기 위해 상기 소스 신호의 샘플들을 분석하고,분석 윈도우 함수를 상기 소스 신호의 샘플들의 세그먼트에 적용하도록 적응되며,상기 분석 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 장치.
- 제13항에 있어서,상기 1차 변환은 기본 함수의 세트를 갖고 상기 신호 처리 회로는 상기 세그먼트-길이 제어 신호에 응답하여 기본 함수들의 세트들을 적응시키는 것을 특징으로 하는 장치.
- 출력 신호를 발생시키기 위한 장치에 있어서,(a) 입력 단자;(b) 출력 단자; 및(c) 상기 입력 단자 및 상기 출력 단자에 결합되는 신호 처리 회로;를 포함하며,상기 신호 처리 회로는,상기 입력 단자로부터 소스 신호의 스펙트럼 내용을 표현하는 입력 신호를 수신하며,상기 입력 신호로부터 하나 이상의 세트들의 하이브리드-변환 계수들과 블록-길이 제어 신호를 얻고,주파수 세트에서 동일한 주파수에 대한 상기 소스 신호의 스펙트럼 내용을 표현하는 하나 이상의 블록들의 스펙트럼 계수들을 발생시키기 위해, 역 2차 변환을 상기 하나 이상의 블록들의 스펙트럼 계수들을 적용하되, 상기 역 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들을 표현하는 하이브리드-변환 계수들의 세트들에 적용되는 역 이산 코사인 변환이고, 상기 하이브리드-변환 계수들의 세트들에 적용되는 상기 역 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되며,상기 스펙트럼 계수들을 스펙트럼 계수들의 세트들로 조립하되, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리이싱 아티팩트들을 갖고 상기 주파수의 세트들에서 모든 주파수들에 대한 상기 소스 신호의 세그먼트의 스펙트럼 내용을 표현하고,상기 소스 신호의 세그먼트들에 대응하는 출력 신호 세그먼트들을 발생시키기 위해, 역 1차 변환을 상기 스펙트럼 계수들의 세트들에 적용하며, 상기 역 1차 변환은 역 수정된 이산 코사인 변환이고, 상기 역 1차 변환은 상기 시간-도메인 에일리어싱 아티팩트들을 실질적으로 제거하고 상기 출력 신호 세그먼트들은 상기 출력 단자에 전송되는 것을 특징으로 하는 장치.
- 삭제
- 제15항에 있어서, 상기 신호 처리 회로는 ,상기 입력 신호로부터 세그먼트-길이 제어 신호를 얻고,합성 윈도우 함수를 출력 신호 세그먼트에 적용하도록 적응되며,상기 합성 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 장치.
- 제17항에 있어서,상기 역 1차 변환은 기본 함수들의 세트를 갖고 상기 신호 처리 회로는 상기 세그먼트-길이 제어 신호에 응답하여 상기 기본 함수들의 세트를 적응시키는 것을 특징으로 하는 장치.
- 출력 신호를 발생시키는 방법을 수행하기 위해 장치에 의해 실행가능한 명령들의 프로그램을 운반하기 위한 매체로서,스펙트럼 내용을 갖는 소스 신호의 샘플들을 수신하는 단계,복수의 세트의 스펙트럼 계수들을 발생시키기 위해, 1차 변환을 상기 샘플들의 중첩 세그멘트들에 적용하는 단계로서, 상기 1차 변환은 수정된 이산 코사인 변환이고, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱 아티팩트를 갖고 주파수 세트를 위한 개별 소스 신호 세그먼트의 스펙트럼 내용을 표현하며,상기 복수의 세트의 스펙트럼 계수들로부터 상기 주파수 세트들에서 동일한 주파수를 표현하고, 상기 복수의 스펙트럼 계수들을 상기 스펙트럼 계수들의 하나 이상의 블록들로 조립하는 복수의 스펙트럼 계수들을 구하는 단계로서, 상기 하나 이상의 블록들 각각에서 조립되는 스펙트럼 계수들의 개수는 블록-길이 제어 신호에 응답하여 적응되며,하나 이상의 세트의 하이브리드-변환 계수들을 발생시기키 위해, 2차 변환을 상기 하나 이상의 블록의 스펙트럼 계수들에 적용하는 단계로서, 상기 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들에 적용되는 이산 코사인 변환이며, 상기 하나 이상의 블록들의 스펙트럼 계수들 각각에 적용되는 상기 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되며,상기 하나 이상의 세트들의 하이브리드-변환 계수들 및 상기 블록-길이 제어 신호를 표현하는 정보를 상기 출력 신호로 조립하는 단계를 포함한, 매체.
- 삭제
- 제19항에 있어서,상기 방법이,세그먼트-길이 제어 신호를 발생시키기 위해 상기 소스 신호의 샘플들을 분석하는 단계, 및분석 윈도우 함수를 상기 소스 신호의 샘플들의 세그먼트에 적용하는 단계를 포함하며,상기 분석 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 매체.
- 출력 신호를 발생시키는 방법을 수행하기 위해 장치에 의해 실행가능한 명령들의 프로그램을 운반하기 위한 매체로서,소스 신호의 스펙트럼 내용을 표현하는 입력 신호를 수신하는 단계,상기 입력 신호로부터 하나 이상의 세트의 하이브리드-변환 계수들과 블록-길이 제어 신호를 얻는 단계,주파수 세트에서 동일한 주파수에 대한 상기 소스 신호의 스펙트럼 내용을 표현하는 하나 이상의 블록들의 스펙트럼 계수들을 발생시키기 위해, 역 2차 변환을 상기 하나 이상의 세트의 하이브리드-변환 계수들에 적용하는 단계로서, 상기 역 2차 변환은 서로 중첩하지 않는 스펙트럼 계수들의 블록들을 표현하는 하이브리드-변환 계수들에 적용되는 역 이산 코사인 변환이고, 상기 하이브리드-변환 계수들의 세트에 적용되는 상기 역 2차 변환의 길이는 상기 블록-길이 제어 신호에 응답하여 적응되며,상기 스펙트럼 계수들을 스펙트럼 계수들의 세트로 조립하는 단계로서, 상기 스펙트럼 계수들의 각 세트는 시간-도메인 에일리어싱을 갖고 상기 주파수 세트에서 모든 주파수들에 대한 상기 소스 신호의 세그먼트의 스펙트럼 내용을 표현하며,상기 소스 신호의 세그먼트들에 대응하는 출력 신호 세그먼트들을 발생시키기 위해, 역 1차 변환을 상기 스펙트럼 계수들의 세트에 적용하는 단계로서, 상기 역 1차 변환은 역 수정된 이산 코사인 변환이고, 상기 역 1차 변환은 상기 시간-도메인 에일리어싱 아트팩트들을 실질적으로 제거하는, 단계를 포함한, 매체.
- 삭제
- 제22항에 있어서, 상기 방법이,상기 입력 신호로부터 세그먼트-길이 제어 신호를 얻는 단계, 및합성 윈도우 함수를 상기 출력 신호 세그먼트에 적용하는 단계를 포함하며,상기 합성 윈도우 함수의 형태 또는 길이는 상기 세그먼트-길이 제어 신호에 응답하여 적응되는 것을 특징으로 하는 매체.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/783,951 | 2004-02-19 | ||
US10/783,951 US7516064B2 (en) | 2004-02-19 | 2004-02-19 | Adaptive hybrid transform for signal analysis and synthesis |
PCT/US2005/001923 WO2005083682A1 (en) | 2004-02-19 | 2005-01-21 | Adaptive hybrid transform for signal analysis and synthesis |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20070001123A KR20070001123A (ko) | 2007-01-03 |
KR101273486B1 true KR101273486B1 (ko) | 2013-06-14 |
Family
ID=34861377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020067015751A KR101273486B1 (ko) | 2004-02-19 | 2006-08-03 | 신호 분석 및 합성을 위한 적응형 하이브리드 변환 |
Country Status (22)
Country | Link |
---|---|
US (1) | US7516064B2 (ko) |
EP (3) | EP2088583B1 (ko) |
JP (1) | JP4689625B2 (ko) |
KR (1) | KR101273486B1 (ko) |
CN (2) | CN101826071B (ko) |
AT (1) | ATE526660T1 (ko) |
AU (2) | AU2005217943B2 (ko) |
BR (1) | BRPI0507806B1 (ko) |
CA (4) | CA2880055C (ko) |
CY (1) | CY1122444T1 (ko) |
DE (1) | DE602005015427D1 (ko) |
DK (1) | DK1723638T3 (ko) |
ES (1) | ES2329384T3 (ko) |
HK (2) | HK1092925A1 (ko) |
IL (1) | IL177093A (ko) |
LT (1) | LT2293293T (ko) |
MY (2) | MY146425A (ko) |
PL (1) | PL1723638T3 (ko) |
PT (1) | PT1723638E (ko) |
SI (1) | SI2088583T1 (ko) |
TW (2) | TWI463790B (ko) |
WO (1) | WO2005083682A1 (ko) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050229769A1 (en) * | 2004-04-05 | 2005-10-20 | Nathaniel Resnikoff | System and method for assigning visual markers to the output of a filter bank |
KR101037931B1 (ko) * | 2004-05-13 | 2011-05-30 | 삼성전자주식회사 | 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법 |
US8744862B2 (en) * | 2006-08-18 | 2014-06-03 | Digital Rise Technology Co., Ltd. | Window selection based on transient detection and location to provide variable time resolution in processing frame-based data |
US7895034B2 (en) * | 2004-09-17 | 2011-02-22 | Digital Rise Technology Co., Ltd. | Audio encoding system |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US8036903B2 (en) * | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
ATE547898T1 (de) | 2006-12-12 | 2012-03-15 | Fraunhofer Ges Forschung | Kodierer, dekodierer und verfahren zur kodierung und dekodierung von datensegmenten zur darstellung eines zeitdomänen-datenstroms |
FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
US8214200B2 (en) * | 2007-03-14 | 2012-07-03 | Xfrm, Inc. | Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
MX2010001763A (es) * | 2007-08-27 | 2010-03-10 | Ericsson Telefon Ab L M | Analisis/sintesis espectral de baja complejidad utilizando la resolucion temporal seleccionable. |
US20090099844A1 (en) * | 2007-10-16 | 2009-04-16 | Qualcomm Incorporated | Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders |
MX2011000375A (es) * | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
US9384748B2 (en) * | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
CA2763793C (en) * | 2009-06-23 | 2017-05-09 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
WO2011013983A2 (en) * | 2009-07-27 | 2011-02-03 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2011048099A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
UA100353C2 (uk) | 2009-12-07 | 2012-12-10 | Долбі Лабораторіс Лайсензін Корпорейшн | Декодування цифрових потоків кодованого багатоканального аудіосигналу з використанням адаптивного гібридного перетворення |
BR122021008583B1 (pt) | 2010-01-12 | 2022-03-22 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
TR201900663T4 (tr) | 2010-01-13 | 2019-02-21 | Voiceage Corp | Doğrusal öngörücü filtreleme kullanarak ileri doğru zaman alanı alıasıng iptali ile ses kod çözümü. |
TWI443646B (zh) | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
EP4398248A3 (en) * | 2010-07-08 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
MX2013010537A (es) | 2011-03-18 | 2014-03-21 | Koninkl Philips Nv | Codificador y decodificador de audio con funcionalidad de configuracion. |
EP2695161B1 (en) | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
FR2977969A1 (fr) * | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
WO2013022426A1 (en) * | 2011-08-08 | 2013-02-14 | Hewlett-Packard Development Company, L.P. | Method and system for compression of a real-time surveillance signal |
US8527264B2 (en) | 2012-01-09 | 2013-09-03 | Dolby Laboratories Licensing Corporation | Method and system for encoding audio data with adaptive low frequency compensation |
CN103548080B (zh) * | 2012-05-11 | 2017-03-08 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
US9648322B2 (en) * | 2012-07-10 | 2017-05-09 | Qualcomm Incorporated | Coding random access pictures for video coding |
CN103714821A (zh) | 2012-09-28 | 2014-04-09 | 杜比实验室特许公司 | 基于位置的混合域数据包丢失隐藏 |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
US9349196B2 (en) | 2013-08-09 | 2016-05-24 | Red Hat, Inc. | Merging and splitting data blocks |
DE102014101307A1 (de) * | 2014-02-03 | 2015-08-06 | Osram Opto Semiconductors Gmbh | Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
EP3276620A1 (en) | 2016-07-29 | 2018-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
EP3616197A4 (en) | 2017-04-28 | 2021-01-27 | DTS, Inc. | AUDIO ENCODER WINDOW SIZES AND TIME-FREQUENCY TRANSFORMATIONS |
EP3644313A1 (en) * | 2018-10-26 | 2020-04-29 | Fraunhofer Gesellschaft zur Förderung der Angewand | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5214742A (en) | 1989-02-01 | 1993-05-25 | Telefunken Fernseh Und Rundfunk Gmbh | Method for transmitting a signal |
US5394473A (en) | 1990-04-12 | 1995-02-28 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5357594A (en) * | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
US5107345A (en) * | 1990-02-27 | 1992-04-21 | Qualcomm Incorporated | Adaptive block size image compression method and system |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
JPH1175157A (ja) * | 1997-08-29 | 1999-03-16 | Sony Corp | 映像信号及び音声信号の記録装置 |
US6430529B1 (en) * | 1999-02-26 | 2002-08-06 | Sony Corporation | System and method for efficient time-domain aliasing cancellation |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
JP3762579B2 (ja) * | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US6678647B1 (en) * | 2000-06-02 | 2004-01-13 | Agere Systems Inc. | Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution |
JP2002118517A (ja) * | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
JP2002091500A (ja) * | 2000-09-19 | 2002-03-27 | Sharp Corp | デジタルデータ符号化方法 |
JP3894722B2 (ja) * | 2000-10-27 | 2007-03-22 | 松下電器産業株式会社 | ステレオオーディオ信号高能率符号化装置 |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
JP3725876B2 (ja) * | 2002-03-27 | 2005-12-14 | 株式会社東芝 | オーディオ符号化器とその符号化処理プログラム |
JP2003345779A (ja) * | 2003-03-26 | 2003-12-05 | Seiko Epson Corp | フィルタリング処理方法およびフィルタリング処理装置 |
US7383180B2 (en) * | 2003-07-18 | 2008-06-03 | Microsoft Corporation | Constant bitrate media encoding techniques |
-
2004
- 2004-02-19 US US10/783,951 patent/US7516064B2/en active Active
-
2005
- 2005-01-21 EP EP09007093A patent/EP2088583B1/en active Active
- 2005-01-21 CA CA2880055A patent/CA2880055C/en active Active
- 2005-01-21 CN CN2010101660941A patent/CN101826071B/zh active Active
- 2005-01-21 WO PCT/US2005/001923 patent/WO2005083682A1/en active Application Filing
- 2005-01-21 DE DE602005015427T patent/DE602005015427D1/de active Active
- 2005-01-21 LT LTEP10183648.4T patent/LT2293293T/lt unknown
- 2005-01-21 CA CA2554381A patent/CA2554381C/en active Active
- 2005-01-21 BR BRPI0507806-7A patent/BRPI0507806B1/pt active IP Right Grant
- 2005-01-21 EP EP10183648.4A patent/EP2293293B1/en active Active
- 2005-01-21 AU AU2005217943A patent/AU2005217943B2/en active Active
- 2005-01-21 CN CN2005800053012A patent/CN1926609B/zh active Active
- 2005-01-21 SI SI200531468T patent/SI2088583T1/sl unknown
- 2005-01-21 CA CA2924281A patent/CA2924281C/en active Active
- 2005-01-21 ES ES05705987T patent/ES2329384T3/es active Active
- 2005-01-21 CA CA2860180A patent/CA2860180C/en active Active
- 2005-01-21 PL PL05705987T patent/PL1723638T3/pl unknown
- 2005-01-21 JP JP2006554100A patent/JP4689625B2/ja active Active
- 2005-01-21 DK DK05705987T patent/DK1723638T3/da active
- 2005-01-21 EP EP05705987A patent/EP1723638B1/en active Active
- 2005-01-21 PT PT05705987T patent/PT1723638E/pt unknown
- 2005-01-21 AT AT09007093T patent/ATE526660T1/de not_active IP Right Cessation
- 2005-01-27 TW TW100140903A patent/TWI463790B/zh active
- 2005-01-27 TW TW094102495A patent/TWI369852B/zh active
- 2005-02-18 MY MYPI2010000721A patent/MY146425A/en unknown
- 2005-02-18 MY MYPI20050623A patent/MY143979A/en unknown
-
2006
- 2006-07-25 IL IL177093A patent/IL177093A/en active IP Right Grant
- 2006-08-03 KR KR1020067015751A patent/KR101273486B1/ko active IP Right Grant
- 2006-12-05 HK HK06113316.4A patent/HK1092925A1/xx unknown
-
2009
- 2009-09-04 HK HK09108094.9A patent/HK1130358A1/xx unknown
-
2010
- 2010-07-22 AU AU2010203126A patent/AU2010203126B2/en active Active
-
2019
- 2019-12-23 CY CY20191101356T patent/CY1122444T1/el unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5214742A (en) | 1989-02-01 | 1993-05-25 | Telefunken Fernseh Und Rundfunk Gmbh | Method for transmitting a signal |
US5394473A (en) | 1990-04-12 | 1995-02-28 | Dolby Laboratories Licensing Corporation | Adaptive-block-length, adaptive-transforn, and adaptive-window transform coder, decoder, and encoder/decoder for high-quality audio |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101273486B1 (ko) | 신호 분석 및 합성을 위한 적응형 하이브리드 변환 | |
JP6472863B2 (ja) | パラメトリック・マルチチャネル・エンコードのための方法 | |
CA2907595A1 (en) | Method and apparatus for compressing and decompressing a higher order ambisonics representation | |
CN116018640A (zh) | 对过渡段编码失真具有鲁棒性的音频编码/解码设备和方法 | |
AU2012247062B2 (en) | Adaptive Hybrid Transform for Signal Analysis and Synthesis | |
CN111862994A (zh) | 一种声波信号解码的方法及装置 | |
MXPA06009424A (es) | Transformada hibrida adaptiva para analisis y sintesis de señal | |
KR100424036B1 (ko) | 시간영역얼라이싱소거를이용한효율적인기수스택단측대역필터뱅크를구비한분해/합성필터링시스템 | |
US10410644B2 (en) | Reduced complexity transform for a low-frequency-effects channel | |
JPH06232762A (ja) | 信号符号化装置および信号復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
J201 | Request for trial against refusal decision | ||
AMND | Amendment | ||
B601 | Maintenance of original decision after re-examination before a trial | ||
J301 | Trial decision |
Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20111228 Effective date: 20130419 |
|
S901 | Examination by remand of revocation | ||
GRNO | Decision to grant (after opposition) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160525 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170526 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20180525 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190529 Year of fee payment: 7 |