KR20070112834A - 코딩 효율을 향상시키기 위한 적응성 파라미터 그룹핑 - Google Patents

코딩 효율을 향상시키기 위한 적응성 파라미터 그룹핑 Download PDF

Info

Publication number
KR20070112834A
KR20070112834A KR1020077022723A KR20077022723A KR20070112834A KR 20070112834 A KR20070112834 A KR 20070112834A KR 1020077022723 A KR1020077022723 A KR 1020077022723A KR 20077022723 A KR20077022723 A KR 20077022723A KR 20070112834 A KR20070112834 A KR 20070112834A
Authority
KR
South Korea
Prior art keywords
parameters
sequence
tuples
representation
tuple
Prior art date
Application number
KR1020077022723A
Other languages
English (en)
Other versions
KR100954181B1 (ko
Inventor
랄프 스페르슈나이더
쥐르겐 헤르
카르스튼 린즈메어어
요한니스 힐퍼트
Original Assignee
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. filed Critical 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Publication of KR20070112834A publication Critical patent/KR20070112834A/ko
Application granted granted Critical
Publication of KR100954181B1 publication Critical patent/KR100954181B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은, 파라미터들이 제1 시퀀스의 터플에 그리고 제2 시퀀스의 터플에 배치될 때, 오리지널 신호의 제1 부분의 표현에 대한 제1 세트의 파라미터들을 포함하며 오리지널 신호의 제2 부분의 표현에 대한 제2 세트의 파라미터들을 포함하는 파라미터들이 효율적으로 인코딩될 수 있으며, 제1 시퀀스의 터플이 오리지널 신호의 단일 부분으로부터의 두 개의 파라미터를 갖는 파라미터의 터플을 포함하며, 제2 시퀀스의 터플이 오리지널 신호의 제1 부분으로부터의 하나의 파라미터와 제2 부분으로부터의 하나의 파라미터를 갖는 파라미터의 터플들을 포함한다는 사실에 기초한다. 효율적인 인코딩은 제1 및 제2 시퀀스의 터플을 인코딩하는 데 필요한 비트들의 수를 평가하기 위한 비트 평가기를 이용하여 달성될 수 있으며, 여기서 단지 터플들의 시퀀스만이 인코딩되며, 그 결과 더 적은 수의 비트가 야기된다.
파라미터, 시퀀스, 터플, 인코드, 비트 평가기, 비트

Description

코딩 효율을 향상시키기 위한 적응성 파라미터 그룹핑{ADAPTIVE GROUPING OF PARAMETERS FOR ENHANCED CODING EFFICIENCY}
본 발명은 파라미터의 무손실 인코딩에 관한 것으로서, 특히, 효율적인 파라미터 압축을 위한 인코딩 규칙의 생성 및 사용에 관한 것이다.
최근에, 멀티-채널 오디오 재생 기술이 점점 더 중요해지고 있다. 이는 잘 알려진 mp3 기술과 같은 오디오 압축/인코딩 기술이, 인터넷 또는 제한된 대역폭을 갖는 다른 전송 채널을 통해, 오디오 기록물을 배포할 수 있게 하였다는 사실에 기인한다. mp3 코딩 기술은 스테레오 포맷, 즉 제1 또는 좌측 스테레오 그리고 제2 또는 우측 스테레오 채널을 포함하는 모든 오디오 기록물을 배포할 수 있다는 사실 때문에 매우 유명해졌다.
그럼에도 불구하고, 기존의 2-채널 사운드 시스템에는 근본적인 단점이 있다. 따라서 서라운드 기술이 개발되었다. 권고 멀티-채널-서라운드 표현은, 2개의 스테레오 채널 L과 R에 더해, 추가적인 중앙 채널 C와 2개의 서라운드 채널 Ls, Rs을 포함한다. 이러한 기준 사운드 포맷은 또한 3/2-스테레오라고 불리며, 이는 3개의 전방 채널과 2개의 서라운드 채널을 의미한다. 일반적으로, 5개의 전송 채널이 필요하다. 재생 환경에서, 적소에 설치된 5개의 라우드스피커로부터의 일정거리에 서 최적의 스위트 스폿(sweet spot)을 얻기 위해서는, 5개의 적절한 위치에 있는 적어도 5개의 스피커가 필요하다.
멀티-채널 오디오 신호의 전송에 요구되는 데이터 량을 줄이기 위한 여러 가지 기술이 해당 기술 분야에 알려져 있다. 그러한 기술들은 조인트 스테레오(joint stereo) 기술이라고 불린다. 이를 위해, 도 5를 참조하면, 조인트 스테레오 장치(60)가 도시되어 있다. 이 장치는 예를 들어 인텐시티 스테레오(intensity stereo: IS) 또는 바이노럴 큐 코딩(binaural cue coding: BCC)을 구현하는 장치일 수 있다. 그러한 장치는 일반적으로 -입력으로서- 적어도 2개의 채널(CH1, CH2, … CHn)을 수신하고, 적어도 하나의 캐리어 채널과 파라메트릭 데이터를 출력한다. 파라메트릭 데이터는, 디코더에서 오리지널 채널(CH1, CH2, … CHn)의 근사치(approximation)가 계산될 수 있도록 정의된다.
보통, 캐리어 채널은, 기저 신호에 대한 상대적으로 양호한 표현을 제공하는, 서브밴드 샘플들, 스펙트럼 계수들, 시간 도메인 샘플들 등등을 포함할 것이며, 반면에 파라메트릭 데이터는 그러한 스펙트럼 계수들의 샘플을 포함하지 않고 대신 곱하기, 타임 시프팅(time shifting), 주파수 시프팅(frequency shifting), 위상 시프팅(phase shifting) 등등과 같은 어느 재구성(reconstruction) 알고리즘을 제어하기 위한 제어 파라미터들을 포함한다. 따라서 파라메트릭 데이터는, 상대적으로 조악한, 신호 또는 결합 채널의 표현만을 포함한다. 수치로 표현하면, 캐리어 채널에 의해 요구된 데이터 량은 60 내지 70 kbit/s의 범위 내일 것이며, 반면 하나의 채널에 대한 파라메트릭 부수 정보에 의해 요구된 데이터 량은 전형적으로 1,5 내지 2,5 kbit/s의 범위 내일 것이다. 파라메트릭 데이터에 대한 하나의 예는, 아래에서 설명되는 바와 같이, 잘 알려진 스케일 팩터(scale factor)들, 인텐시티 스테리오 정보 또는 바이노럴 큐 파라미터들이다.
BCC 기술은 예를 들어 씨, 폴러(C. Faller), 에프. 바움가르트(F. Baumgarte)에 의한 AES(Audio Engineering Society) 회의보 5574의 "스테레오 및 멀티-채널 오디오 압축에 적용된 바이노럴 큐 코딩(Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression)", 2002년 5월, 뮌헨, IEEE WASPAA 회의보 "지각(perceptual) 파라미터화를 이용한 공간 오디오의 효율적인 표현(Efficient representation of spatial audio using perceptual parametrization)", 2001년 10월, 뉴욕, 몽크(Mohonk), "플렉시블 렌더링(rendering)을 이용하여 오디오 압축에 적용된 바이노럴 큐 코딩(Binaural cue coding applied to audio compression with flexible rendering)", 씨. 폴러 및 에프. 바움가르트, AES 113차 회의, 로스앤젤레스, 예보(Preprint) 5686, 2002년 10월, 및 "바이노럴 큐 코딩- Ⅱ 부: 구성 및 응용(Binaural cue coding - Part Ⅱ: Schemes and applications", 씨. 폴러 및 에프. 바움가르트, IEEE 학회, 음성 및 오디오 회보, 11 부, 6번, 2003년 11월, 에 개시되었다.
BCC 인코딩에서는, 다수개의 오디오 입력 채널이, 중첩하는 윈도우들을 갖는 DFT(이산 푸리에 변환: Discrete Fourier Transform) 기반 변환을 이용하여, 스펙트럼 표현으로 변환된다. 얻어진 균일한 스펙트럼은 비-중첩(non-overlapping) 파티션들로 나뉜다. 각 파티션은 대체로 등가 직사각 대역폭(equivalent rectangular bandwidth: ERB)에 비례하는 대역폭을 갖는다. 이 BCC 파라미터들은 보통 기준 채널과 관련하여 각 채널에 주어지고, 또한 양자화된다. 전송된 파라미터들은 마지막으로 미리 정해진 식(인코딩된)들에 따라 계산되며, 이는 또한 처리되는 신호의 특정 파티션들에 의존할 수 있다.
다수개의 BBC 파라미터가 존재한다. ICLD 파라미터는, 예를 들어, 2개의 비교 채널(compared channel)에 포함된 에너지의 차이(비율)를 나타낸다. ICC 파라미터(채널-간 가간섭성/상관도: inter-channel coherence/correlation)는 2개 채널 간의 상관도을 나타내며, 이는 2개 채널의 파형 유사도로서 이해될 수 있다. ICTD 파라미터(채널-간 시간 차)는 2개 채널 간의 글로벌 타임 시프트를 나타내고, 반면 IPD 파라미터(채널-간 위상 차)는 신호들의 위상들에 대하여 차이를 나타낸다.
오디오 신호의 프레임-형 프로세싱에서, BCC 분석은 또한 프레임-형, 즉 시간-가변, 그리고 또한 주파수-형으로 수행된다는 것을 인지하여야 한다. 이는, 각 스펙트럼 대역에 대해, BCC 파라미터들이 개별적으로 획득된다는 것을 의미한다. 이는 또한, 오디오 필터 뱅크가 입력 신호를, 예를 들어 32 대역 통과 신호로 분해하는 경우에, BCC 분석 블록이 32 대역들 각각에 대해 한 세트의 파라미터를 획득한다는 것을 의미한다.
파라메트릭 스테레오라고 알려지기도 한 관련 기술이, 제이. 브리바르트(J. Breebaart), 에스. 반데바르(S. van de Par), 에이. 콜라우쉬(A. Kohlrausch), 및 이. 쉬이제르스(E. Schuijers)에 의한 "저 비트 레이트에서의 고품질 파라메트릭 공간 오디오 코딩(High-Quality Parametric Spatial Audio Coding at Low Bitrates)", AES 116차 회의, 베를린, 예보 6072, 2004년 5월과, 이. 쉬이제르스, 제이. 브리바르트, 에취. 푸르나겐(H. Purnhagen), 및 제이. 엥데가르트(J. Engdegard)에 의한 "저 복잡성 파라메트릭 스테레오 코딩(Low Complexity Parametric Stereo Coding)", AES 116차 회의, 베를린, 예보 6073, 2004년 5월에 개시되어 있다.
요약하면, 멀티-채널 오디오 신호의 파라메트릭 코딩에 대한 최근의 연구 방식들은, (모노화 될 수 있거나 여러 개의 채널을 포함할 수 있는) 다운믹스 신호 및 인지된 공간 사운드 스테이지를 특징짓는 파라메트릭 부수 정보 ("공간 큐")를 이용하여 멀티-채널 오디오 신호를 표현한다. 오버헤드 정보를 최소화하고 그만큼의 다운믹스 신호들의 코딩을 위해 이용가능한 전송 용량을 남기기 위해, 부수 정보의 전송률을 가능한 한 낮게 유지하는 것이 바람직하다.
부수 정보의 전송률을 낮게 유지하는 하나의 방법은, 예를 들어 부수 정보에 엔트로피 코딩 알고리즘을 적용함으로써, 공간 오디오 구성의 부수 정보를 무손실 인코딩하는 것이다.
무손실 코딩은, 양자화된 스펙트럼 계수들 및 다른 부수 정보에 대한 최적의 간결한 표현을 보장하기 위해, 일반적으로 오디오 코딩에 광범위하게 적용되고 있다. 적합한 인코딩 구성 및 방법에 대한 예가 ISO/IEC 표준 MPEG1 part 3, MPEG2 part 7 및 MPEG4 part 3 내에 제공된다.
이들 표준과, 예를 들어 IEEE 논문 "MPEG-2 고급 오디오 코딩에서 양자화된 스펙트럼 계수들의 무잡음 코딩(Noiseless Coding of Quantized Spectral Coefficients in MPEG-2 Advanced Audio Coding)", 에스. 알. 콱켄부시(S. R. Quackenbush), 제이. 디. 존스톤(J. D. Johnston), IEEE WASPAA, 뉴욕, 몽크, 1997년 11월은 양자화된 파라미터들을 무손실 코딩하기 위한 다음의 대책(measure)들을 포함하는 기술의 상태를 개시한다:
● 양자화된 스펙트럼 계수들의 다차원 호프만 코딩
● 계수 세트들에 대한 공통(다차원) 호프만 코드북의 이용
● 상기 값을 홀(hole)로서 코딩하거나 코딩 부호(sign) 정보와 크기(magnitude) 정보로 분리하여, 코딩(즉, 코드북 크기를 "부호화된(signed)" 대비 "비부호화된(unsigned)"으로 축소하는, 주어진 절대 값에 대한 호프만 코드북 엔트리만을 갖는다)
● 다른 최대 절대 값(LAV)들, 즉 인코딩되는 파라미터들 내에서 다른 최대 절대 값들을 갖는 다른(alternative) 코드북의 이용
● 각 LAV에 대하여 다른 통계 분포를 갖는 다른 코드북의 이용
● 호프만 코드북의 선택을 부수 정보로서 디코더로 전송
● 선택된 호프만 코드북의 적용 범위를 정의하는 "섹션(section)들"의 이용
● 주파수에 대하여 스케일팩터(scalefactor)들의 차분 인코딩 및 그 결과에 대한 후속 호프만 코딩
조악하게 양자화된 값을 싱글 PCM 코드로 무손실 인코딩하기 위한 또 다른 기술이 MPEG1 오디오 표준 내에서 제안된다(표준 내에서의 그룹핑이라고 불리우고 계층 2를 위해 이용된다). 이는 표준 ISO/IEC 11172-3:93 내에서 보다 상세하게 설 명된다.
간행물 "바이노럴 큐 코딩- II 부: 구성 및 응용", 씨. 폴러(C. Faller) 및 에프. 바움가르트(F. Baumgarte), IEEE 회의, 음성 및 오디오 회의, 11 부, 6번, 2003년 11월은 BCC 파라미터의 코딩에 관한 몇 가지 정보를 제공한다. 양자화된 ICLD 파라미터들을 다음과 같이 미분적으로 인코딩하는 것을 제안한다.
● 주파수에 대하여, 그리고 이어 그 결과물을 호프만 인코딩한다(1 차원 호프만 코드를 이용함)
● 시간에 대하여, 그리고 이어 그 결과들을 호프만 인코딩한다(1 차원 호프만 코드를 이용함)
그리고 마지막으로, 보다 효율적인 변형물(variant)이 오리지널 오디오 채널의 표현으로서 선택된다.
상술한 바와 같이, 주파수에 대하여 그리고 대안적으로 시간에 대하여 차분 코딩을 적용하고, 보다 효율적인 변형물을 선택하는 것에 의하여 압축 성능을 최적화하는 것이 제안되었다. 선택된 변형물은 이어 몇몇 부수 정보를 통해 디코더로 시그널링된다.
다운믹서 오디오 챈널과 그에 상응하는 부수 정보의 크기를 줄이려는 노력이 있어 왔다. 그럼에도 불구하고 성취되는 비트율은 가능한 여러가지 응용들을 위하여는 아직도 너무 높다. 예로서, 모바일 폰의 오디오 및 비디오 콘텐츠는 최소한의 가능한 비트율을 요구하고 있으며, 그래서 콘텐츠를 인코딩하는 더욱 효율적인 방식이 요구되고 있다.
본 발명의 목적은 더 높은 효율을 갖는 파라미터 값들의 무손실 압축을 달성하는 개선된 코딩 개념을 제공하는 것이다.
본 발명의 제1 특징에 따라서, 이러한 목적은 파라미터들의 압축을 위한 압축 장치에 의해서 달성되는데, 상기 파라미터들은 오리지널 신호의 제1 부분에 대한 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분에 대한 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분에 이웃한다. 본 발명의 압축 장치는, 각각 적어도 두 개의 파라미터들을 갖는 제1 및 제2 터플(tuple)을 공급하기 위한 공급기(supplier)로서, 상기 제1 터플은 상기 제1 세트의 파라미터들로부터의 두 개의 파라미터들을 가지며 상기 제2 터플은 상기 제1 세트의 파라미터들로부터의 하나의 파라미터 및 상기 제2 세트의 파라미터들로부터의 하나의 파라미터를 갖는, 공급기; 인코딩 규칙에 따라서, 상기 제1 터플을 포함하는 제1 시퀀스의 터플들을 이용하여 파라미터의 세트들을 인코딩하며 상기 제2 터플을 포함하는 제2 시퀀스의 터플들을 이용하여 파라미터의 세트들을 인코딩하는 데 필요한 다수의 비트들을 평가하기 위한 비트 평가기; 및 인코딩된 블록들을 제공하며, 상기 인코딩된 블록들이 도출되는 터플의 시퀀스를 나타내는 시퀀스 인디케이션(indication)을 제공하기 위한 제공기(provider)로서, 터플 시퀀스를 이용하여 상기 인코딩된 블록들을 제공하도록 동작하여 결과적으로 더 적은 비트 수를 야기하는, 제공기를 포함하는 것을 특징으로 한다.
본 발명의 제2 특징에 따라서, 이러한 목적은 인코딩된 파라미터 블록들을 디코딩하며 시퀀스 인디케이션을 처리하기 위한 디코더에 의해서 달성되는데, 상기 파라미터들은 오리지널 신호의 제1 부분에 대한 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분과 이웃한다. 본 발명의 디코더는, 압축해제기로서, 터플 시퀀스를 인코딩하기 위해서 사용되는 인코딩 규칙에 따른 디코딩 규칙을 이용하여, 파라미터의 터플 시퀀스를 도출하기 위해 인코딩된 파라미터 블록을 압축해제하도록 동작하며, 각각의 터플은 적어도 두 개의 파라미터들을 갖는, 압축해제기; 및 상기 시퀀스 인디케이션을 수신하며, 사용된 터플 시퀀스의 정보를 이용하여 파라미터 세트들을 구축하기 위한 프레임 구축기(frame builder)로서, 상기 시퀀스 인디케이션은 인코딩된 블록의 하부에 놓인 다수의 상이한 시퀀스들로부터의 사용된 터플 시퀀스를 나타내는, 프레임 구축기를 포함하는 것을 특징으로 한다.
본 발명의 제3 특징에 따라서, 이러한 목적은 파라미터들의 압축 방법에 의해서 달성되는데, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분에 이웃함을 특징으로 한다.
본 발명의 제4 특징에 따라서, 이러한 목적은, 컴퓨터 상에서 실행될 때, 전술된 방법을 수행하는 컴퓨터 프로그램에 의해서 달성되는 것을 특징으로 한다.
본 발명의 제5 특징에 따라서, 이러한 목적은 인코딩된 파라미터 블록들을 디코딩하며 시퀀스 인디케이션을 처리하기 위한 방법에 의해서 달성되는데, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터를 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터를 더 포함하며, 상기 제2 부분은 상기 제1 부분과 이웃함을 특징으로 한다.
본 발명의 제6 특징에 따라서, 이러한 목적은, 컴퓨터 상에서 실행될 때, 전술된 방법을 수행하는 컴퓨터 프로그램에 의해서 달성되는 것을 특징으로 한다.
본 발명의 제7 특징에 따라서, 이러한 목적은 압축된 파라미터 표현에 의해서 달성되는데, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분에 이웃하며, 압축된 파라미터 표현은, 사용된 터플의 시퀀스를 표현하는 인코딩된 파라미터의 블록; 및 인코딩된 파라미터의 블록의 하부에 놓인 제1 또는 제2 시퀀스에 대한 사용된 터플들의 시퀀스를 나타내는 시퀀스 인디케이션으로서, 상기 제1 시퀀스는 제1 세트의 파라미터로부터의 두 개의 파라미터를 갖는 제1 터플을 포함하며 상기 제2 시퀀스는 상기 제1 세트의 파라미터로부터 하나의 파라미터를 가지며 상기 제2 세트의 파라미터로부터의 하나의 파라미터를 갖는 제2 터플을 포함하는, 시퀀스 인디케이션을 포함하는 것을 특징으로 한다.
본 발명은, 파라미터들이 제1 시퀀스의 터플에 그리고 제2 시퀀스의 터플에 배치될 때, 오리지널 신호의 제1 부분의 표현에 대한 제1 세트의 파라미터들을 포함하며 오리지널 신호의 제2 부분의 표현에 대한 제2 세트의 파라미터들을 포함하는 파라미터들이 효율적으로 인코딩될 수 있으며, 제1 시퀀스의 터플이 오리지널 신호의 단일 부분으로부터의 두 개의 파라미터를 갖는 파라미터의 터플을 포함하며, 제2 시퀀스의 터플이 오리지널 신호의 제1 부분으로부터의 하나의 파라미터와 제2 부분으로부터의 하나의 파라미터를 갖는 파라미터의 터플들을 포함한다는 사실에 기초한다. 효율적인 인코딩은 제1 및 제2 시퀀스의 터플을 인코딩하는 데 필요한 비트들의 수를 평가하기 위한 비트 평가기를 이용하여 달성될 수 있으며, 여기서 단지 터플들의 시퀀스만이 인코딩되며, 그 결과 더 적은 수의 비트가 야기된다.
그러므로 기본적인 원리는, 예를 들어, 시간 및 주파수에 있어서 파라미터들이 인코딩되도록 재배치하며, 결과적으로 압축을 위해 파라미터들에 대한 하나의 배치(터플의 시퀀스)를 이용하며, 그 결과 압축된 파라미터들에 대해 더 적은 수의 비트가 야기된다는 것이다.
본 발명의 일 실시예에서, 오리지널 신호의 두 개의 연속되는 시간 부분에 대한 스펙트럼 표현을 기술하는 두 세트의 스펙트럼 파라미터가, 코딩 효율을 향상시키기 위해서 두 개의 파라미터로 된 쌍으로 적응성 있게 그룹핑된다. 그러므로, 한편으로는, 터플의 시퀀스는 동일 시간 부분으로부터의 두 개의 이웃하는 주파수 파라미터로 이루어지는 파라미터의 터플들을 이용하여 생성된다. 다른 한편으로는, 제2 시퀀스의 터플이 터플들을 이용하여 생성되며, 이는 오리지널 신호의 제1 시간 부분으로부터의 제1 파라미터와 제2 시간 부분으로부터의 그에 대응하는 파라미터를 이용하여 구축된다. 이어서, 양쪽 시퀀스의 터플은 2차원 허프만(Huffman) 코드를 이용하여 인코딩된다. 두 개의 인코딩된 시퀀스의 터플은 크기에 있어서 비교되며 더 적은 수의 비트를 야기하는 터플이 최종적으로 선택되어 전송된다. 인코딩된 데이터를 구축하는 데 사용된 터플 종류에 대한 정보는 부가적인 부가정보로서 디코더에 전송된다.
전술된 본 발명의 인코더의 한가지 장점은, 두 개의 파라미터로 이루어지는 터플로 파라미터를 그룹핑하기 때문에, 2차원 허프만 코드가 압축을 위해 이용될 수 있으며, 이는 일반적으로 더 낮은 비트 속도를 야기시킨다는 점이다.
제2의 장점은, 적응성 있는 그룹핑을 통해, 즉, 인코딩 과정 중에서 두 개의 가능성 있는 그룹핑 전략 중 하나를 동적으로 결정함으로써, 부가정보의 비트 속도를 낮출 수 있게 된다는 것이다.
두 개의 그룹핑 방법들 사이에서 두 개의 연속되는 프레임 세트에 대해서 단지 한 번만 결정하는 것은 요구되는 부가정보의 양을 부가적으로 감소시키는데, 이는 인코딩 동안에 어떤 그룹핑 전략이 사용되었는지에 대한 인디케이션이 두 개의 완전한 연속적 시간 프레임의 세트에 대해서 단지 한 번만 전송되어야 하기 때문이다.
본 발명의 또 다른 실시예에서, 본 발명의 압축 장치는 부가적으로, 차동 인코더를 포함하는데, 이는 적응성 그룹핑에 앞서서 시간 또는 주파수에 있어서 파라미터들을 차동으로 인코드한다. 그 차동 인코딩은 적응성 그룹핑 및 적당한 허프만 코드북과 함께 전송될 부가정보의 크기를 더 줄이게 된다. 두 개의 차동 인코딩 가능성은 두 개의 그룹핑 전략과 함께 모두 네 개의 가능한 조합을 야기하며, 인코딩 규칙을 발견할 가능성을 더 증가시키게 되어, 결과적으로 낮은 부가정보 비트 속도를 야기시킨다.
본 발명의 또 다른 실시예에서, 본 발명의 개념은 압축해제 장치에 대해 적용되는데, 인코딩된 파라미터 블록을 디코딩하며 인코딩된 파라미터 블록에 내재하는 그룹핑 스킴(scheme)에 신호를 보내는 부가정보에 기초하여 오리지널 프레임을 재구축하도록 한다. 유리한 수정 예에서, 본 발명의 디코더는 또한 적응성 있게 그룹핑되지 않은 데이터의 디코딩을 허용하며, 따라서 기존의 장치와 본 발명의 디코더가 호환 가능하게 될 수 있다.
도 1은 본 발명의 압축 장치를 도시한 도면이며,
도 2는 파라미터를 적응성 있게 그룹핑하는 두 개의 가능성을 도시한 도면이며,
도 3은 파라미터를 적응성 있게 그룹핑하는 몇몇 부가적인 가능성을 도시한 도면이며,
도 4는 차동 인코딩 스킴을 도시한 도면이며,
도 5는 본 발명의 디코더를 도시한 도면이며,
도 6은 종래의 다중-채널 인코더를 도시한 도면이다.
*도면의 주요 부분에 대한 부호의 설명*
100: 제공기
102: 비트 평가기
104: 공급기
202: 압축해제기
204: 프레임 구축기
212a: 프레임 1
212b: 프레임 2
본 발명의 바람직한 실시 예가 도면을 참조하면서 설명된다.
도 1은 본 발명의 압축 장치(90)로서, 공급기(100), 비트 평가기(102) 및 제공기(104)를 포함한다.
공급기(100)는 두 개의 데이터 출력에서 제1 시퀀스의 터플(106a) 및 제2 시퀀스의 터플(106b)을 공급한다. 제공기(104)는 두 개의 데이터 입력(108a, 108b)에서 터플들(106a, 106b)을 수신한다. 비트 평가기는 그 데이터 입력(110a, 110b)에서 두 개의 터플들을 수신한다.
비트 평가기(102)는 두 개의 터플들(106a, 106b)에 인코딩 규칙을 적용함으로써 야기되는 비트의 수를 평가한다. 비트 평가기(102)는, 터플(106a 또는 106b)이 더 적은 수의 비트를 야기시키는 것에 관계 없이, 터플을 선택하여 결과적으로 시그널링 출력(112a)을 통해서 더 적은 수의 비트 및 신호를 야기시킨다.
비트 평가기(102)의 결정에 따라서, 더 적은 수의 비트를 야기하는 터플이 결과적으로 인코딩된 블록(118)으로 인코딩되며, 이는 제공기(104)의 출력(120a)을 통해서 제공되며, 여기서 제공기는 그 시그널링 라인(120b)에서 시퀀스 인디케이션에 신호를 더 전달하여, 터플들(106a 또는 106b)의 어떤 오리지널 시퀀스가 인코딩되어 인코딩된 블록들(118)을 도출하였는지를 나타낸다.
또 다른 실시예에서는, 공급기(100)와 제공기(104) 사이의 점선으로 된 접속(112a, 112b)이 생략될 때, 동일한 기능이 달성될 수 있다. 이 대체 시나리오에서, 비트 평가기(102)는 터플들(106a, 106b)의 시퀀스를 인코딩하며, 두 개의 상이한 인코딩된 블록들(124a, 124b)을 제공기(104)에 전달하며, 여기서 제공기는 원래의 터플들(106a, 106b)의 시퀀스중 어느 것으로부터 인코딩된 블록(124a, 124b)이 도출되는지를 부가적으로 알린다. 이러한 목적으로, 비트 평가기(102)의 시그널링 출력(112a)이 사용될 수 있거나 시그널링이 제공기(104)에 의해서 암시적으로 도출될 수 있다.
본 대체 실시예에서, 제공기(104)는 더 적은 수의 비트를 갖는 인코딩된 블록을 그 출력(120a)에 간단히 전달하여, 부가적으로 시퀀스 인디케이션을 제공한다.
도 2는 인코딩되는 터플들의 시퀀스를 도출하는 데 사용되는 두 개의 적응성 그룹핑 스킴의 일례를 도시한다. 본 발명의 적응성 그룹핑의 원리를 설명하기 위해서, 오리지널 신호에 대한 네 개의 연속되는 시간 프레임(130a 내지 130d)이 도시되며, 여기서 각각의 프레임은 다섯 개의 스펙트럼 파라미터(132a 내지 132e)의 세트를 갖는다.
본 발명에 따라서, 두 개의 연속되는 프레임의 스펙트럼 파라미터는, 터플들 의 시퀀스를 구축하기 위해서, 터플들(134a, 136b)에 의해서 예시되듯이 주파수에서 그룹핑되거나 또는 터플들(136a, 136b)에 의해서 예시되듯이 시간에서 그룹핑된다. 시간에서의 그룹핑은 제1 시퀀스의 터플들(138)을 야기하는 반면에, 주파수에서의 그룹핑은 제2 시퀀스의 터플들(140)을 야기한다.
터플들(138, 140)의 시퀀스는 예를 들어 허프만 코드북을 이용하여 인코딩되어, 코드 워드(142, 144)의 두 개의 상이한 시퀀스를 야기한다. 본 발명에 따라서, 더 적은 수의 비트를 요구하는 코드 워드의 시퀀스는 최종적으로 디코더로 전송되며, 이는 부가적으로 시퀀스 인디케이션을 수신해야 하며, 코드 워드의 시퀀스가 시간 그룹핑인지 또는 주파수 그룹핑인지를 알린다. 도 2에 도시된 바와 같이, 파라미터들의 쌍의 적응성 그룹핑의 도시된 예에 대해서(2차원), 시퀀스 인디케이션은 단지 하나의 단일 비트로 이루어질 수 있다.
도 2는 파라미터(2차원)를 적응성 있게 그룹핑하는 예를 보이고 있으며, 시퀀스 표시는 단지 한 비트만으로 구성될 수 있는 것이다.
도 3은 대체 그룹핑 전략을 도시하는 것으로서, 본 발명의 적응성 그룹핑을 수행하는 데 사용될 수 있으며, 2보다 큰 차원을 갖는 허프만 코드를 허용한다.
도 3은 2차원 허프만 코드(146a), 3차원 허프만 코드(146b) 및 4차원 허프만 코드(146c)에 대한 그룹핑 전략을 도시한다. 각각의 전략에 대해서 두 개의 연속되는 시간 프레임이 예시되는데, 여기서 동일 터플에 속하는 파라미터는 동일한 대문자로 표현된다.
2차원 허프만 코드의 경우에 그룹핑은 도 2에 이미 도시된 바와 같이 수행되 어, 주파수(148a) 및 시간(148b)에 대해서 2차원 터플을 구축한다. 세 개의 파라미터를 구성하는 터플을 구축하는 경우에, 주파수 터플들(158a)은 하나의 프레임 내의 세 개의 이웃하는 주파수 파라미터들이 하나의 터플을 형성하기 위해서 함께 그룹핑되는 방식이다. 시간 터플들(150b)은, 도 3에 도시된 바와 같이, 하나의 프레임으로부터의 두 개의 이웃하는 파라미터가 다른 프레임으로부터의 하나의 파라미터와 결합되도록 구축될 수 있다.
4차원의 시간으로 그룹핑된 터플들(152a)은 하나의 프레임의 네 개의 이웃하는 파라미터를 하나의 터플로 그룹핑함으로써 다른 시간 터플들에 대응하게 구축된다. 시간 그룹핑 터플들(152b)은, 하나의 프레임의 두 개의 이웃하는 파라미터가 다른 프레임의 두 개의 이웃하는 파라미터와 결합되도록 구축되며, 여기서 단일 프레임의 파라미터 쌍들은 두 개의 연속되는 시간 프레임의 동일 스펙트럼 특성을 기술한다.
도 3에 도시된 바와 같이, 상이한 그룹핑 스킴을 허용함으로써, 부가정보의 비트 속도를 상당히 줄일 수 있으며, 예를 들어, 상이한 규격의 미리 정의된 다양한 허프만 코드북을 이용하면, 그룹핑의 규격은 인코딩 과정에서 변동이 될 수 있어서 인코딩 과정에서 언제나 가장 낮은 비트 속도를 야기하는 표현이 사용되도록 할 수 있다.
도 4는, 허프만 인코딩 처리 전에 차동 인코딩을 적용함으로써, 차동 인코더를 부가적으로 포함하는 본 발명의 압축 장치가 부가정보를 더 줄이는 데 사용되는 방법을 도시한다.
시간 및 주파수 또는 시간 및 주파수에서 차동 인코딩을 예시하기 위해서, 이미 도 2에 도시된 동일한 파라미터(160)의 절대 표현이 여러 차동 인코딩 단계들에 대한 기초로서 사용된다. 첫 번째 가능성은 주파수에 있어서 절대 표현(160)의 파라미터를 차동으로 인코딩하는 것으로서, 결과적으로 차동으로 인코딩된 파라미터(162)를 야기한다. 도 4에서 알 수 있듯이, 절대적인 표현(160)을 차동으로 인코딩하기 위해서, 각 프레임의 제1 파라미터는 변하지 않은 채로 남겨지는 반면에, 제2 파라미터는 절대 표현(160)의 제2 파라미터 및 제1 파라미터의 차로 교체된다. 차동으로 인코딩된 표현 내의 다른 파라미터들은 동일 규칙에 따라서 구축된다.
또 다른 가능성은 시간에서 차동으로 코딩하여, 표현(164)을 산출하는 것이다. 이 표현은 완전한 제1 프레임을 변화시키지 않은 채 남겨 놓음으로써 구축되는 반면에, 도 4에서 알 수 있듯이, 이어지는 프레임들의 파라미터들이 절대 표현의 파라미터와 이전 프레임의 동일 파라미터의 차로 교체된다.
세 번째 가능성은 먼저 주파수에 있어서 차동으로 인코딩하고 이어서 시간에 있어서 차동 인코딩하거나 또는 그와 반대로 하는 것으로서, 모두 동일하게 인코딩된 표현(166)을 야기시키며, 이는 시간 및 주파수에 있어서 차동으로 인코딩된다.
오리지널 신호의 이와 같은 네개의 상이한 표현을 적응성 그룹핑에 대한 입력으로서 사용할 기회를 가짐을 유의해야 한다. 주어진 예의 파라미터의 상이한 표현(160 내지 166)을 보면, 차동 인코딩이 부가정보의 전송 속도에 얼마나 충격을 주는지를 명백히 알 수 있다. 절대 표현(160)을 보면, 시간이나 주파수에서 어떤 그룹핑도 동일 내용을 갖는 터플을 야기하지 않음을 인식할 수 있다. 그러므로 어 떤 적당한 허프만 코드북도 구성될 수 없어서, 가장 짧은 코드 워드를 가장 많이 발생하는 터플에 할당하게 된다.
이 경우는 주파수에서 차동으로 인코딩된 표현(162)을 달리 보는 경우로서, 완전한 표현을 커버하기 위해 네 개의 엔트리만이 필요한 허프만 코드북을 구성할 수 있으며, 간단한 부가정보를 달성하기 위해서, 터플 (1, 1) 또는 터플 (2, 2)에 최소의 길이를 갖는 코드 워드가 할당될 수 있다.
시간에서 차동으로 인코딩되는 표현(164)에서는 장점이 덜 분명하다. 그럼에도 불구하고, 주파수에서 그룹핑함으로써 여러 터플들 (5,5) 및 (10, 10)을 이용할 수 있다.
시간 및 주파수에서 차동으로 인코딩되는 표현(166)의 경우, 표현(162)에서 보다 부가정보 비트 속도가 더 감소하게 되는데, 이는 시간에서의 그룹핑이 도면에 도시된 바와 같이, 터플 (1, 0)의 높은 증배를 야기시켜서, 허프만 코드북을 구성하도록 하므로, 이전 터플에 가장 짧은 코드 워드를 할당하기 때문이다.
도 4에서 명확히 알 수 있듯이, 적응성 그룹핑 및 차동 인코딩을 이용하는 본 발명의 개념에 대한 높은 융통성으로 인해서 오리지널 오디오 신호에 가장 적합한 전략을 선택하여, 부가정보 비트 속도를 느리게 유지할 수 있다.
요약하면, 바람직한 일 실시예에서, 양자화된 파라미터 값들은 먼저 시간상에서 차동으로 인코딩되며(변형 1) 주파수상에서 차동으로 인코딩된다(변형 2). 결과적인 파라미터들은 시간상에서(변형 a) 및 주파수상에서(변형 b) 적응성으로 그룹될 수 있다. 결과적으로, 네 개의 조합이 가능한데(1a, 1b, 2a, 2b) 이로 부 터 최선이 선택되어 디코더로 알려진다. 이것은 2 비트 정보에 의해서만 수행될 수 있으며, 예를 들어, 비트 조합(00, 01, 10, 11)에 의해서 변형(1a, 1b, 2a, 2b)을 표현한다.
도 5는 본 발명에 따른 디코더로서, 인코딩된 파라미터의 블록들을 디코딩하는 것을 도시하며, 여기서 파라미터의 블록은 제1 스펙트럼 파라미터의 세트를 갖는 제1 프레임과 제2 스펙트럼 파라미터의 세트를 갖는 제2 프레임을 포함한다.
디코더(200)는 압축해제기(202) 및 프레임 구축기(204)를 포함한다. 압축해제기는 입력에서 인코딩된 파라미터(206)의 블록을 수신한다. 압축해제기는, 디코딩 규칙을 이용하여, 인코딩된 파라미터(206)의 블록으로부터 파라미터(208)의 터플 시퀀스를 도출한다. 이러한 파라미터(208) 터플의 시퀀스는 프레임 구축기(204)로 입력된다.
프레임 구축기는 시퀀스 인디케이션(210)을 부가적으로 수신하며, 이는 인코딩된 파라미터의 블록을 구축하기 위해 인코더에 의해서 어떤 터플 시퀀스가 사용되었는지를 나타낸다.
프레임 구축기(204)는 이어서, 파라미터(208) 터플의 시퀀스로부터 제1 프레임(112a) 및 제2 프레임(112b)을 재구성하기 위한 시퀀스 인디케이션(210)에 의해서 조종되는 터플(208)의 시퀀스를 재배치한다.
전술된 본 발명의 바람직한 실시예들은 다차원 허프만 코드를 이용하여 코드되는 값의 적응성 그룹핑을 도입함으로써 코딩 효율을 더 향상시킨다. 일례로서, 시간상에서의 값에 대한 2차원 그룹핑은 물론이고 주파수상에서의 값에 대한 2차원 그룹핑이 모두 수행될 수 있다. 인코딩 스킴은 인코딩의 두 가지 유형을 수행하며 더 유리한 것(즉, 비트를 덜 요구하는 변형)을 선택한다. 이러한 결정은 부가정보를 통해서 디코더로 알려진다.
또 다른 예들에서, 도 3에 도시된 바와 같이, 더 높은 차원의 허프만 코드를 구축하여, 터플들을 구축하도록 상이한 그룹핑 전략을 적용하는 것이 가능하다. 주어진 예들은 두 개의 연속되는 프레임만으로부터 파라미터들을 함께 그룹핑함으로써 터플들을 구축하는 그룹핑 전략을 도시한다. 세 개 이상의 연속되는 프레임들로부터의 파라미터들을 이용하여 그룹핑을 수행하여, 직접 전방으로 그룹핑을 수행하는 것 역시 가능하다.
본 발명의 인코더의 수정에서, 부가정보에 대한 가장 짧은 가능성 있는 표현을 도출하기 위해서 상이한 허프만 코드북을 이용하여 차동 그룹핑 및 차동 인코딩 전략을 결합하는 것도 가능하다. 이것은 부가적인 부가정보 파라미터들을 가지므로 인코딩된 오디오 신호의 부가정보 비트 속도를 더 감소시킬 수 있으며, 이를 인코딩에 사용된 허프만 코드북에 알린다.
본 발명의 전술된 바람직한 실시예들은 발명의 개념을 예를 들어서 나타내며, 여기서 그룹핑 전략은 두 개의 연속되는 시간 프레임들에서는 변하지 않는다. 본 발명의 변형에서, 두 개의 프레임의 세트 내에서 시간 및 주파수에서의 그룹핑 사이에서 다수의 변경을 갖는 것도 물론 가능한데, 이는 시퀀스 인디케이션이 그룹핑 전략의 변경에 대해서 알리기 위해, 프레임 내에서 공급되는 것을 암시한다.
주어진 예들에서, 파라미터들은 허프만으로 인코딩되기 전에 차동으로 인코 딩된다. 물론 모든 다른 무손실 인코딩 규칙 역시 파라미터의 허프만 인코딩 전에 가능하며, 인코딩의 목적은 가능한 동일한 컨텐츠를 갖는 많은 터플들을 도출하는 것이다.
도 4에는 네 개의 상이하고 가능성 있는 파라미터 표현이 주어져 있는데, 이른바, 절대적인 표현, 주파수에 있어서 차동 표현, 시간에 있어서 차동 표현 및 시간 및 주파수에 있어서 차동 표현이다. 네 개의 표현들 사이에서 선택하기 위해서, 표현이 사용된 부가정보 신호전달은 도 4에 표현된 바와 같이, 크기에 있어서 적어도 두 개의 비트가 되어야 한다. 코딩 대 부가적인 스펙트럼 표현 인디케이션의 가능한 효율 이득의 획득을 평가하기 위해서, 주로 단지 두 개의 가능한 표현을 허용하도록 결정하는 것 역시 가능해서, 단일 비트의 길이에 스펙트럼 표현 인디케이션을 감소시키게 된다.
본 발명의 디코더의 일례로서, 도 5는 인코딩된 파라미터(206) 블록에 더해서 일부 부가정보를 수신하는 디코더(200)를 도시한다. 프레임 구축기(204)를 조정하는 부가정보만이 주어진 예에서 시퀀스 인디케이션(210)을 포함한다. 본 발명에 따른 디코더는 요구된 임의의 다른 부가정보, 특히 오리지널 프레임들을 인코딩하는 데 사용된 스펙트럼 표현을 나타내는 스펙트럼 표현 인디케이션을 처리할 수 있다.
수행 요구조건에 따라서, 본 발명의 방법은 하드웨어 또는 소프트웨어로 수행될 수 있다. 이러한 수행은 디지털 저장 매체, 특히 프로그램 가능한 컴퓨터 시스템과 협동하여 본 발명의 방법이 수행되는 전자적으로 판독 가능한 제어 신호를 갖는 디스크, DVD, 또는 CD를 이용하여 수행될 수 있다. 일반적으로, 본 발명은 기계판독 가능한 캐리어 상에 저장된 프로그램 코드를 갖는 컴퓨터 프로그램 제품이며, 이 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터 상에서 실행될 때 본 발명의 방법을 수행하기 위해 동작된다. 다시 말해서, 본 발명의 방법은 컴퓨터 프로그램이 컴퓨터 상에서 실행될 때 본 발명의 방법의 적어도 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
전술된 바가 그 특정 실시예들을 참조하여 특별히 도시 및 설명되었지만, 당업자라면 발명의 사상 및 범위에서 벗어나지 않는 한 형태 및 세부점에 있어서 여러 가지 다른 변경이 가능함을 알 수 있을 것이다. 본원에 개시된 더 넓은 개념으로부터 벗어나지 않는 한 여러 실시예들에 적응하여 여러 변경이 가능하며 이러한 변경은 첨부되는 청구범위를 통해서 이해할 수 있다.
본 발명을 실시함으로써, 더 높은 효율을 갖는 파라미터 값들의 무손실 압축이 가능하게 된다.
또한, 본 발명을 실시함으로써, 효율적인 파라미터 압축을 위한 인코딩 규칙을 생성 및 사용하는 것이 가능하다.

Claims (34)

  1. 파라미터들의 압축을 위한 압축 장치로서, 상기 파라미터들은 오리지널 신호의 제1 부분에 대한 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분에 대한 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분에 이웃하는 압축 장치에 있어서,
    각각 적어도 두 개의 파라미터들을 갖는 제1 및 제2 터플(tuple)을 공급하기 위한 공급기(supplier)로서, 상기 제1 터플은 상기 제1 세트의 파라미터들로부터의 두 개의 파라미터들을 가지며 상기 제2 터플은 상기 제1 세트의 파라미터들로부터의 하나의 파라미터 및 상기 제2 세트의 파라미터들로부터의 하나의 파라미터를 갖는, 공급기;
    인코딩 규칙에 따라서, 상기 제1 터플을 포함하는 제1 시퀀스의 터플들을 이용하여 파라미터의 세트들을 인코딩하며 상기 제2 터플을 포함하는 제2 시퀀스의 터플들을 이용하여 파라미터의 세트들을 인코딩하는 데 필요한 다수의 비트들을 평가하기 위한 비트 평가기; 및
    인코딩된 블록들을 제공하며, 상기 인코딩된 블록들이 도출되는 터플의 시퀀스를 나타내는 시퀀스 인디케이션(indication)을 제공하기 위한 제공기(provider)로서, 터플 시퀀스를 이용하여 상기 인코딩된 블록들을 제공하도록 동작하여 결과적으로 더 적은 수의 비트들을 야기하는, 제공기를 포함하는 것을 특징으로 하는 압축 장치.
  2. 제 1 항에 있어서,
    상기 제1 및 제2 세트의 파라미터들은 상기 오리지널 신호의 제1 및 제2 부분의 스펙트럼 표현을 표현(representation)으로서 포함하는 것을 특징으로 하는 압축 장치.
  3. 제 1 항에 있어서,
    상기 오리지널 신호의 제1 및 제2 부분은 시간 또는 공간에 있어서 이웃하는 것을 특징으로 하는 압축 장치.
  4. 제 1 항에 있어서,
    상기 제1 세트의 파라미터들은 오리지널 오디오 또는 비디오 신호의 제1 프레임의 표현을 포함하며 상기 제1 세트의 파라미터들은 오리지널 오디오 또는 비디오 신호의 제2 프레임의 표현을 포함하는 것을 특징으로 하는 압축 장치.
  5. 제 1 항에 있어서,
    상기 공급기는 하나의 단일 세트의 파라미터들로부터의 파라미터들을 갖는 터플들만을 이용하여 상기 제1 시퀀스의 터플들의 상기 제1 터플 및 나머지 모든 터플들을 공급하며, 상기 제1 세트의 파라미터들로부터의 적어도 하나의 파라미터 와 제2 세트의 파라미터들로부터의 적어도 하나의 파라미터를 갖는 터플들만을 이용하여 상기 제2 시퀀스의 터플들의 제1 터플 및 나머지 모든 터플들을 공급하기 위해서 동작하며;
    상기 제공기는 하나의 인코딩된 블록에 대해서 단일 시퀀스 인디케이션을 제공하도록 동작하는 것을 특징으로 하는 압축 장치.
  6. 제 1 항에 있어서,
    상기 공급기는,
    단일 세트의 파라미터들로부터의 두 개의 파라미터들로 이루어지는 제1 터플을 공급하도록 동작하며, 상기 두 개의 파라미터들은 상기 오리지널 신호의 표현내에서 이웃하는 파라미터들이며,
    상기 제1 세트의 파라미터들로부터의 제1 파라미터와 상기 제2 세트의 파라미터들로부터의 제2 파라미터로 이루어지는 제2 터플을 공급하도록 동작하며, 상기 제1 및 제2 파라미터는 상기 표현 내의 오리지널 신호의 동일 특성을 기술하는 것을 특징으로 하는 압축 장치.
  7. 제 1 항에 있어서,
    상기 공급기는,
    단일 세트의 파라미터들로부터의 두 개의 파라미터들의 정수배로 이루어지는 제1 터플을 공급하도록 동작하며, 상기 파라미터들은 오리지널 신호의 표현 내에서 이웃하는 파라미터들이며,
    제1 세트의 파라미터들로부터의 두 개 이상의 파라미터들로 이루어지는 제2 터플을 공급하도록 동작하며, 상기 파라미터들은 오리지널 신호 그리고 상기 제2 세트의 파라미터들로부터의 동일 수의 파라미터들의 표현 내에서 이웃하며, 상기 파라미터들은 오리지널 신호의 표현 내에서 이웃하며, 상기 제1 및 제2 세트의 파라미터들로부터의 파라미터들은 상기 표현 내의 오리지널 신호의 동일 특성들을 기술하는 것을 특징으로 하는 압축 장치.
  8. 제 1 항에 있어서,
    상기 공급기는,
    한 세트의 파라미터들로부터의 오리지널 신호의 표현에 대한 홀수개의 이웃하는 파라미터들로 이루어지는 제1 터플을 공급하도록 동작하며;
    한 세트의 파라미터들로부터의 오리지널 신호의 표현에 대한 다수의 이웃하는 파라미터들 및 다른 세트의 파라미터들로부터의 오리지널 신호의 표현에 대한 소수의 이웃하는 파라미터들로 이루어지는 제2 터플을 공급하도록 동작하며, 상기 다수의 파라미터들은 제2 시퀀스의 터플들의 연속되는 터플들에 대한 제1 및 제2 세트의 파라미터들로부터 교차하여 취해지는 것을 특징으로 하는 압축 장치.
  9. 제 1 항에 있어서,
    상기 비트 평가기는, 상기 인코딩 규칙에 따라서, 제1의 인코딩된 블록을 도 출하고 제2 시퀀스의 터플들을 인코딩하여 제2의 인코딩된 블록을 도출하도록 상기 제1 시퀀스의 터플들을 인코딩하며, 상기 제1 및 제2의 인코딩된 블록의 비트들을 계수함으로써 필요한 수의 비트들을 평가하도록 동작하며;
    상기 제공기는 제1 또는 제2의 인코딩된 블록을 전달하도록 동작되며, 더 적은 수의 비트들을 갖는 블록을 선택하는 것을 특징으로 하는 압축 장치.
  10. 제 1 항에 있어서,
    상기 비트 평가기는 상기 인코딩 규칙에 따라서 터플의 시퀀스들을 인코딩하는 데 필요한 비트들을 평가하도록 동작하며,
    상기 제공기는 더 적은 수의 비트들을 갖는 인코딩된 블록을 제공하는 터플의 시퀀스를 인코딩하도록 동작하는 것을 특징으로 하는 압축 장치.
  11. 제 1 항에 있어서,
    상기 파라미터 세트들은 비디오 신호 또는 오디오 신호의 파라미터 표현을 포함하는 것을 특징으로 하는 압축 장치.
  12. 제 1 항에 있어서,
    상기 인코딩 규칙은, 동일 길이를 갖지만 상이한 파라미터들을 갖는 인코딩 터플들이 상이한 길이의 코드 워드를 야기시킬 수 있도록 하는 것을 특징으로 하는 압축 장치.
  13. 제 1 항에 있어서,
    상기 파라미터들은 제1 및 제2의 오리지널 오디오 채널 사이의 공간 상호관계를 기술하는 BCC 파라미터들을 포함하며 상기 BCC 파라미터들은 BCC 파라미터들의 다음 리스트, 즉,
    채널간 간섭/상관 (ICC),
    채널간 레벨차(ICLD),
    채널간 시간차(ICTD) 및
    채널간 위상차(IPD)로부터 선택되는 것을 특징으로 하는 압축 장치.
  14. 제 1 항에 있어서,
    상기 오리지널 신호를 처리하기 위한 차동 인코더를 더 포함하여, 제1 파라미터 세트와 제2 파라미터 세트가 차(difference) 표현을 포함하며, 상기 차는 시간, 주파수 또는 시간 및 주파수에 있어서의 차인 것을 특징으로 하는 압축 장치.
  15. 제 14 항에 있어서,
    상기 공급기는 제1 그룹의 터플들 및 제2 그룹의 터플들을 공급하도록 동작하며, 상기 그룹의 터플들내의 터플들은 다음 표현, 즉,
    시간에 있어서 차동 표현, 주파수에 있어서 차동 표현, 시간 및 주파수에 있어서 차동 표현, 및 절대 표현 중 하나로 부터의 파라미터들을 가지며;
    상기 제1 그룹의 터플들은 제1 세트의 파라미터들로부터의 두 개의 파라미터들을 갖는 터플들을 가지며, 제2 그룹의 터플들은 제1 세트의 파라미터들로부터의 하나의 파라미터를 그리고 제2 세트의 파라미터들로부터의 하나의 파라미터를 가지며;
    상기 비트 평가기는 적어도 여덟 개의 시퀀스의 터플들에 대한 터플 시퀀스들을 인코딩하는 데 필요한 비트 수를 평가하도록 동작하며, 각각의 시퀀스는 상기 그룹의 터플들의 터플중 하나를 가지며;
    상기 제공기는, 시퀀스 인디케이션에 더해서, 상기 표현을 나타내는 표현 인디케이션을 알리도록 동작하여, 결과적으로 더 적은 수의 비트들을 야기하는 것을 특징으로 하는 압축 장치.
  16. 제 15 항에 있어서,
    상기 제공기는 적어도 세 개의 비트들을 갖는 이진 데이터 워드를 이용하여 상기 시퀀스 인디케이션 및 표현 인디케이션을 알리도록 동작하는 것을 특징으로 하는 압축 장치.
  17. 제 1 항에 있어서,
    상기 인코딩 규칙은, 각각의 터플이 한 그룹의 상이한 코드 워드들의 단일 코드 워드와 연관되도록 하는 것을 특징으로 하는 압축 장치.
  18. 제 1 항에 있어서,
    상기 인코딩 규칙은 허프만 코드북을 포함하는 것을 특징으로 하는 압축 장치.
  19. 인코딩된 파라미터 블록들을 디코딩하며 시퀀스 인디케이션을 처리하기 위한 디코더로서, 상기 파라미터들은 오리지널 신호의 제1 부분에 대한 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분과 이웃한, 디코더에 있어서,
    압축해제기로서, 터플 시퀀스를 인코딩하기 위해서 사용되는 인코딩 규칙에 따른 디코딩 규칙을 이용하여, 파라미터의 터플 시퀀스를 도출하기 위해 인코딩된 파라미터 블록을 압축해제하도록 동작하며, 각각의 터플은 적어도 두 개의 파라미터들을 갖는, 압축해제기; 및
    상기 시퀀스 인디케이션을 수신하며, 사용된 터플 시퀀스의 정보를 이용하여 파라미터 세트들을 구축하기 위한 프레임 구축기(builder)로서, 상기 시퀀스 인디케이션은 인코딩된 블록의 하부에 놓인 다수의 상이한 시퀀스들로부터의 사용된 터플 시퀀스를 나타내는, 프레임 구축기를 포함하는 것을 특징으로 하는 디코더.
  20. 제 19 항에 있어서,
    상기 제1 및 제2 세트의 파라미터들은 상기 오리지널 신호의 제1 및 제2 부 분의 스펙트럼 표현을 표현으로서 포함하는 것을 특징으로 하는 디코더.
  21. 제 19 항에 있어서,
    상기 오리지널 신호의 제1 및 제2 부분은 시간 또는 공간에 있어서 이웃하는 것을 특징으로 하는 디코더.
  22. 제 19 항에 있어서,
    상기 제1 세트의 파라미터들은 오리지널 오디오 또는 비디오 신호의 제1 프레임의 표현을 포함하며 상기 제2 세트의 파라미터들은 상기 오리지널 오디오 또는 비디오 신호의 제2 프레임의 표현을 포함하는 것을 특징으로 하는 디코더.
  23. 제 19 항에 있어서,
    상기 프레임 구축기는 하나의 인코딩된 파라미터 블록에 대한 단일 시퀀스 인디케이션을 수신하며, 상기 시퀀스 인디케이션에 의해서 나타난 유형의 터플들만 포함하는 터플 시퀀스를 이용함으로써 파라미터 세트들을 구축하도록 동작하는 것을 특징으로 하는 디코더.
  24. 제 19 항에 있어서,
    상기 프레임 구축기는 비디오 신호 또는 오디오 신호의 파라미터 표현을 포함하는 파라미터 세트들을 구축하기 위해서 동작하는 것을 특징으로 하는 디코더.
  25. 제 19 항에 있어서,
    상기 프레임 구축기는 제1 및 제2의 오디오 채널 사이의 공간 상호관계를 기술하는 BCC 파라미터들을 포함하는 파라미터 세트들을 구축하도록 동작하며 상기 BCC 파라미터들은 BCC 파라미터들의 다음 리스트, 즉,
    채널간 간섭/상관 (ICC),
    채널간 레벨차(ICLD),
    채널간 시간차(ICTD) 및
    채널간 위상차(IPD)로부터 선택되는 것을 특징으로 하는 디코더.
  26. 제 19 항에 있어서,
    표현 인디케이션을 수신하며 파라미터 세트들을 처리하기 위한 차동 디코더를 더 포함하여 상기 파라미터들이 차 스펙트럼 표현로부터 도출되며, 상기 차는 시간, 주파수 또는 시간 및 주파수에 있어서 차이며, 상기 차동 디코더는 상기 표현 인디케이션에 따라서 제1 및 제2 세트의 파라미터들을 처리하도록 동작하는 것을 특징으로 하는 디코더.
  27. 제 26 항에 있어서,
    상기 프레임 구축기 및 차동 디코더는 적어도 세 개의 비트를 갖는 이진 데이터 워드로서 시퀀스 인디케이션 및 표현 인디케이션을 수신하기 위해 동작하는 것을 특징으로 하는 디코더.
  28. 제 19 항에 있어서,
    상기 디코딩 규칙은 상기 인코딩된 파라미터 블록 내의 각각의 코드 워드가 한 그룹의 상이한 터플들의 단일 터플과 연관되도록 하는 것을 특징으로 하는 디코더.
  29. 파라미터들의 압축 방법으로서, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분에 이웃하는, 파라미터들의 압축 방법에 있어서,
    제1 및 제2 터플을 공급하며, 각각의 터플은 적어도 두 개의 파라미터를 가지며, 상기 제1 터플은 제1 세트의 파라미터들로부터의 두 개의 파라미터를 가지며 상기 제2 터플은 제1 세트의 파라미터들로부터의 하나의 파라미터 및 제2 세트의 파라미터들로부터의 하나의 파라미터를 가지며;
    인코딩 규칙에 따라서, 제1 터플을 포함하는 제1 시퀀스의 터플들을 이용하여 파라미터 세트들을 인코딩하며 상기 제2 터플을 포함하는 제2 시퀀스의 터플들을 이용하여 프레임들을 인코딩하는데 필요한 다수의 비트를 평가하며;
    터플의 시퀀스를 이용하여 인코딩된 블록들을 제공하여 결과적으로 더 적은 수의 비트를 야기시키며;
    상기 인코딩된 블록들이 도출되는 터플의 시퀀스를 표현하는 시퀀스 인디케이션을 제공하는 단계를 포함하는 것을 특징으로 하는 파라미터들의 압축 방법.
  30. 인코딩된 파라미터 블록들을 디코딩하며 시퀀스 인디케이션을 처리하기 위한 방법으로서, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터를 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터를 더 포함하며, 상기 제2 부분은 상기 제1 부분과 이웃하는, 방법에 있어서,
    터플 시퀀스를 인코딩하기 위해 사용되는 인코딩 규칙에 따른 디코딩 규칙을 이용하여, 파라미터들의 터플의 시퀀스를 도출하기 위해 인코딩된 파라미터 블록을 압축해제하며, 각각의 터플은 적어도 두 개의 파라미터를 가지며;
    상기 인코딩된 블록의 하부에 놓인 다수의 상이한 시퀀스들로부터 사용된 터플 시퀀스를 나타내는 시퀀스 인디케이션을 수신하며;
    사용된 터플의 시퀀스의 정보를 이용하여 파라미터의 세트들을 구축하는 단계를 포함하는 것을 특징으로 하는 방법.
  31. 컴퓨터에서 실행될 때, 파라미터들의 압축 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램으로서, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분과 이웃하는 컴퓨터 프로그램에 있어서,
    제1 터플 및 제2 터플을 공급하며, 각각의 터플은 적어도 두 개의 파라미터를 가지며, 상기 제1 터플은 제1 세트의 파라미터들로부터의 두 개의 파라미터를 가지며 상기 제2 터플은 제1 세트의 파라미터들로부터의 하나의 파라미터와 제2 세트의 파라미터들로부터의 하나의 파라미터를 가지며;
    인코딩 규칙에 따라서, 제1 터플을 포함하는 제1 시퀀스의 터플들을 이용하여 파라미터 세트들을 인코딩하며 제2 터플을 포함하는 제2 시퀀스의 터플들을 이용하여 프레임들을 인코딩하는 데 필요한 다수의 비트들을 평가하며;
    터플들의 시퀀스를 이용하여 인코딩된 블록들을 제공하여 결과적으로 더 적은 수의 비트를 야기시키며;
    인코딩된 블록들이 도출되는 터플들의 시퀀스를 나타내는 시퀀스 인디케이션을 제공하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 프로그램.
  32. 컴퓨터에서 실행될 때, 인코딩된 파라미터의 블록들을 디코딩하는 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램으로서, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터를 더 포함하며, 상기 제2 부분은 상기 제1 부분과 이웃하는, 컴퓨터 프로그램에 있어서,
    터플의 시퀀스들을 인코딩하는 데 사용되는 인코딩 규칙에 따른 디코딩 규칙을 이용하여, 파라미터들의 터플들의 시퀀스를 도출하기 위해 인코딩된 파라미터들의 블록들을 압축해제하며, 각각의 터플은 적어도 두 개의 파라미터를 가지며;
    상기 시퀀스 인디케이션를 수신하며, 상기 시퀀스 인디케이션은 인코딩된 블록의 하부에 놓인 다수의 상이한 시퀀스들로부터 사용된 터플의 시퀀스를 나타내며;
    사용된 터플의 시퀀스의 정보를 이용하여 파라미터들의 세트들을 구축하는 단계를 포함하는 것을 특징으로 하는 컴퓨터 프로그램.
  33. 압축된 파라미터 표현로서, 상기 파라미터들은 오리지널 신호의 제1 부분의 표현을 포함하는 제1 세트의 파라미터들을 포함하며, 상기 파라미터들은 상기 오리지널 신호의 제2 부분의 표현을 포함하는 제2 세트의 파라미터들을 더 포함하며, 상기 제2 부분은 상기 제1 부분에 이웃하는, 압축된 파라미터 표현에 있어서,
    사용된 터플의 시퀀스를 표현하는 인코딩된 파라미터의 블록; 및
    인코딩된 파라미터의 블록의 하부에 놓인 제1 또는 제2 시퀀스에 대한 사용된 터플들의 시퀀스를 나타내는 시퀀스 인디케이션으로서, 상기 제1 시퀀스는 제1 세트의 파라미터로부터의 두 개의 파라미터를 갖는 제1 터플을 포함하며 상기 제2 시퀀스는 상기 제1 세트의 파라미터로부터의 하나의 파라미터를 가지며 상기 제2 세트의 파라미터로부터의 하나의 파라미터를 갖는 제2 터플을 포함하는, 시퀀스 인디케이션을 포함하는 것을 특징으로 하는 압축된 파라미터 표현.
  34. 제 33 항에 있어서,
    컴퓨터로 판독가능한 매체 상에 저장되는 것을 특징으로 하는 압축된 파라미터 표현.
KR1020077022723A 2005-04-13 2006-02-13 코딩 효율을 향상시키기 위한 압축장치, 압축방법, 디코더, 디코딩 방법, 컴퓨터 프로그램을 수록한 기록매체 및 압축된 파라미터 표현을 수록한 기록매체 KR100954181B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US67099305P 2005-04-13 2005-04-13
US60/670,993 2005-04-13
US11/243,915 US7991610B2 (en) 2005-04-13 2005-10-05 Adaptive grouping of parameters for enhanced coding efficiency
US11/243,915 2005-10-05

Publications (2)

Publication Number Publication Date
KR20070112834A true KR20070112834A (ko) 2007-11-27
KR100954181B1 KR100954181B1 (ko) 2010-04-21

Family

ID=36581385

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077022723A KR100954181B1 (ko) 2005-04-13 2006-02-13 코딩 효율을 향상시키기 위한 압축장치, 압축방법, 디코더, 디코딩 방법, 컴퓨터 프로그램을 수록한 기록매체 및 압축된 파라미터 표현을 수록한 기록매체

Country Status (18)

Country Link
US (2) US7991610B2 (ko)
EP (2) EP3503409A1 (ko)
JP (1) JP5027799B2 (ko)
KR (1) KR100954181B1 (ko)
CN (1) CN101160726B (ko)
AU (1) AU2006233512C1 (ko)
BR (3) BR122019014976B1 (ko)
CA (1) CA2607460C (ko)
ES (1) ES2739531T3 (ko)
IL (1) IL186315A (ko)
MX (1) MX2007012663A (ko)
MY (1) MY141958A (ko)
NO (1) NO343207B1 (ko)
PL (1) PL1869774T3 (ko)
PT (1) PT1869774T (ko)
RU (1) RU2368074C2 (ko)
TW (1) TWI321316B (ko)
WO (1) WO2006108464A1 (ko)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126859A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP5227794B2 (ja) 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007004833A2 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8073702B2 (en) 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
WO2007027051A1 (en) 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
JP4568363B2 (ja) 2005-08-30 2010-10-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
WO2007040364A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857111B1 (ko) 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7653533B2 (en) 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
US20080004729A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format
CN101529504B (zh) * 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法
CA2874451C (en) * 2006-10-16 2016-09-06 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US9760677B2 (en) 2009-04-29 2017-09-12 Onemednet Corporation Methods, systems, and devices for managing medical images and records
US9171344B2 (en) 2007-10-30 2015-10-27 Onemednet Corporation Methods, systems, and devices for managing medical images and records
US8065166B2 (en) 2007-10-30 2011-11-22 Onemednet Corporation Methods, systems, and devices for managing medical images and records
US20110002469A1 (en) * 2008-03-03 2011-01-06 Nokia Corporation Apparatus for Capturing and Rendering a Plurality of Audio Channels
WO2010003479A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
JP5752134B2 (ja) * 2009-10-15 2015-07-22 オランジュ 最適化された低スループットパラメトリック符号化/復号化
CA2786944C (en) * 2010-01-12 2016-03-15 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
JP2013005204A (ja) * 2011-06-16 2013-01-07 Sony Corp ビデオ送信装置、ビデオ受信装置、およびビデオ送信方法
US8400335B2 (en) 2011-07-21 2013-03-19 International Business Machines Corporation Using variable length code tables to compress an input data stream to a compressed output data stream
US8669889B2 (en) 2011-07-21 2014-03-11 International Business Machines Corporation Using variable length code tables to compress an input data stream to a compressed output data stream
US8692696B2 (en) 2012-01-03 2014-04-08 International Business Machines Corporation Generating a code alphabet of symbols to generate codewords for words used with a program
US9860527B2 (en) 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
US8581753B2 (en) 2012-01-19 2013-11-12 Sharp Laboratories Of America, Inc. Lossless coding technique for CABAC in HEVC
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
US9654139B2 (en) 2012-01-19 2017-05-16 Huawei Technologies Co., Ltd. High throughput binarization (HTB) method for CABAC in HEVC
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
US8552890B2 (en) * 2012-01-19 2013-10-08 Sharp Laboratories Of America, Inc. Lossless coding with different parameter selection technique for CABAC in HEVC
CN104704825B (zh) 2012-08-21 2019-08-30 Emc 公司 分段图像数据的无损压缩
WO2014174344A1 (en) * 2013-04-26 2014-10-30 Nokia Corporation Audio signal encoder
KR20160015280A (ko) * 2013-05-28 2016-02-12 노키아 테크놀로지스 오와이 오디오 신호 인코더
EP3074970B1 (en) * 2013-10-21 2018-02-21 Dolby International AB Audio encoder and decoder
JP6235725B2 (ja) 2014-01-13 2017-11-22 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
PL3123469T3 (pl) * 2014-03-25 2018-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie kodera audio i urządzenie dekodera audio z wydajnym kodowaniem wzmocnienia w sterowaniu zakresem dynamiki
GB2567427B (en) 2017-10-06 2020-10-07 Imagination Tech Ltd Data compression
GB2576769A (en) 2018-08-31 2020-03-04 Nokia Technologies Oy Spatial parameter signalling
GB2585187A (en) * 2019-06-25 2021-01-06 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
JP2023554411A (ja) * 2020-12-15 2023-12-27 ノキア テクノロジーズ オサケユイチア 空間音声パラメータの量子化
GB2624874A (en) * 2022-11-29 2024-06-05 Nokia Technologies Oy Parametric spatial audio encoding
CN115865099B (zh) * 2022-12-01 2024-04-16 河南大学 基于霍夫曼编码的多类型数据分段压缩方法及系统

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63284974A (ja) 1987-05-15 1988-11-22 Matsushita Electric Works Ltd 画像圧縮方式
SU1711331A1 (ru) 1987-05-28 1992-02-07 Всесоюзный научно-исследовательский институт радиовещательного приема и акустики им.А.С.Попова Устройство кодировани и декодировани сигналов звукового вещани
US5225904A (en) * 1987-10-05 1993-07-06 Intel Corporation Adaptive digital video compression system
US5532694A (en) 1989-01-13 1996-07-02 Stac Electronics, Inc. Data compression apparatus and method using matching string searching and Huffman encoding
JPH0773249B2 (ja) 1989-06-29 1995-08-02 富士通株式会社 音声符号化・復号化伝送方式
US5325091A (en) 1992-08-13 1994-06-28 Xerox Corporation Text-compression technique using frequency-ordered array of word-number mappers
US5550540A (en) 1992-11-12 1996-08-27 Internatioal Business Machines Corporation Distributed coding and prediction by use of contexts
US5717394A (en) 1993-02-10 1998-02-10 Ricoh Company Ltd. Method and apparatus for encoding and decoding data
JPH07203441A (ja) 1993-12-28 1995-08-04 Matsushita Graphic Commun Syst Inc 符号化装置及び復号化装置
US5550541A (en) 1994-04-01 1996-08-27 Dolby Laboratories Licensing Corporation Compact source coding tables for encoder/decoder system
CA2156889C (en) 1994-09-30 1999-11-02 Edward L. Schwartz Method and apparatus for encoding and decoding data
KR100209877B1 (ko) 1994-11-26 1999-07-15 윤종용 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치
JPH08179794A (ja) * 1994-12-21 1996-07-12 Sony Corp サブバンド符号化方法及び装置
US5721720A (en) 1994-12-28 1998-02-24 Kabushiki Kaisha Toshiba Optical recording medium recording pixel data as a compressed unit data block
US5819215A (en) 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
CN1158050A (zh) 1995-12-27 1997-08-27 汤姆森消费电子有限公司 图像数据压缩系统和方法
US5870436A (en) 1997-01-02 1999-02-09 Raytheon Company Uniform discrete fourier transform filter parameter encoder
US6237496B1 (en) 1997-02-26 2001-05-29 Northrop Grumman Corporation GPS guided munition
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
RU2214047C2 (ru) 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6862278B1 (en) 1998-06-18 2005-03-01 Microsoft Corporation System and method using a packetized encoded bitstream for parallel compression and decompression
US6166664A (en) 1998-08-26 2000-12-26 Intel Corporation Efficient data structure for entropy encoding used in a DWT-based high performance image compression
US6546049B1 (en) 1998-10-05 2003-04-08 Sarnoff Corporation Parameterized quantization matrix adaptation for video encoding
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
US6624761B2 (en) 1998-12-11 2003-09-23 Realtime Data, Llc Content independent data compression method and system
SE9903552D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching
JP3323175B2 (ja) * 1999-04-20 2002-09-09 松下電器産業株式会社 符号化装置
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE9903191D0 (sv) 1999-09-08 1999-09-08 Pacesetter Ab Compression and decompression coding scheme and apparatus
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
RU2159507C1 (ru) 1999-10-29 2000-11-20 Аликов Сергей Владимирович Узел кодирования и/или декодирования информации, система передачи информации с уплотнением каналов, система передачи информации в телекоммуникационной сети
JP2001151413A (ja) 1999-11-29 2001-06-05 Shinkawa Ltd ワイヤボンダにおけるスプールホルダ構造
JP3609323B2 (ja) * 2000-05-08 2005-01-12 日本電信電話株式会社 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体
JP2001339311A (ja) 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
US6813438B1 (en) 2000-09-06 2004-11-02 International Business Machines Corporation Method to customize the playback of compact and digital versatile disks
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
JP4125565B2 (ja) 2001-08-31 2008-07-30 松下電器産業株式会社 画像符号化方法、画像復号化方法及びその装置
US20030081685A1 (en) * 2001-10-31 2003-05-01 Montgomery Dennis L. Method and apparatus for determining patterns within adjacent blocks of data
DE60218068T2 (de) * 2001-11-30 2007-11-22 Koninklijke Philips Electronics N.V. Signalkodierung
US7200275B2 (en) 2001-12-17 2007-04-03 Microsoft Corporation Skip macroblock coding
EP1500083B1 (en) * 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4369140B2 (ja) 2003-02-17 2009-11-18 パナソニック株式会社 オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
US7426462B2 (en) 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
US7617166B2 (en) * 2004-04-14 2009-11-10 The Boeing Company Neural network for aeroelastic analysis
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
EP1749296B1 (en) * 2004-05-28 2010-07-14 Nokia Corporation Multichannel audio extension
DE102004063950B4 (de) * 2004-08-07 2009-02-19 Tropf, Hermann Kanalcodiervorrichtung
US7161507B2 (en) * 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
KR100857111B1 (ko) * 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
WO2010003479A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder

Also Published As

Publication number Publication date
AU2006233512A1 (en) 2006-10-19
US9043200B2 (en) 2015-05-26
RU2368074C2 (ru) 2009-09-20
BRPI0612356A8 (pt) 2019-01-08
BR122019014628B1 (pt) 2021-05-11
US7991610B2 (en) 2011-08-02
TWI321316B (en) 2010-03-01
CN101160726A (zh) 2008-04-09
PL1869774T3 (pl) 2019-11-29
CA2607460A1 (en) 2006-10-19
EP3503409A1 (en) 2019-06-26
MX2007012663A (es) 2007-12-13
MY141958A (en) 2010-07-30
PT1869774T (pt) 2019-09-12
AU2006233512B2 (en) 2010-04-22
JP5027799B2 (ja) 2012-09-19
CN101160726B (zh) 2013-05-22
IL186315A (en) 2013-06-27
RU2007141934A (ru) 2009-05-20
EP1869774B1 (en) 2019-06-05
CA2607460C (en) 2017-07-25
JP2008536182A (ja) 2008-09-04
US20060235679A1 (en) 2006-10-19
EP1869774A1 (en) 2007-12-26
WO2006108464A1 (en) 2006-10-19
TW200710826A (en) 2007-03-16
AU2006233512C1 (en) 2012-01-12
BRPI0612356B1 (pt) 2019-11-12
US20110060598A1 (en) 2011-03-10
NO20075796L (no) 2008-01-03
KR100954181B1 (ko) 2010-04-21
BR122019014976B1 (pt) 2020-12-29
IL186315A0 (en) 2008-01-20
BRPI0612356A2 (pt) 2010-11-03
ES2739531T3 (es) 2020-01-31
AU2006233512B8 (en) 2010-12-23
NO343207B1 (no) 2018-12-03

Similar Documents

Publication Publication Date Title
KR100954181B1 (ko) 코딩 효율을 향상시키기 위한 압축장치, 압축방법, 디코더, 디코딩 방법, 컴퓨터 프로그램을 수록한 기록매체 및 압축된 파라미터 표현을 수록한 기록매체
US7788106B2 (en) Entropy coding with compact codebooks
KR100954180B1 (ko) 보장된 최대 비트 레이트를 가지는 정보의 무손실 인코딩
CA2601821A1 (en) Planar multiband antenna

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130401

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140409

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160411

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170404

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180403

Year of fee payment: 9