KR101050261B1 - 콘텍스트 기반의 신호 엔코딩 및 디코딩 - Google Patents

콘텍스트 기반의 신호 엔코딩 및 디코딩 Download PDF

Info

Publication number
KR101050261B1
KR101050261B1 KR1020077003321A KR20077003321A KR101050261B1 KR 101050261 B1 KR101050261 B1 KR 101050261B1 KR 1020077003321 A KR1020077003321 A KR 1020077003321A KR 20077003321 A KR20077003321 A KR 20077003321A KR 101050261 B1 KR101050261 B1 KR 101050261B1
Authority
KR
South Korea
Prior art keywords
context
bit plane
bit
value
residue
Prior art date
Application number
KR1020077003321A
Other languages
English (en)
Other versions
KR20070040392A (ko
Inventor
롱샨 유
시아오 린
수산토 라하르드자
Original Assignee
에이전시 포 사이언스, 테크놀로지 앤드 리서치
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이전시 포 사이언스, 테크놀로지 앤드 리서치 filed Critical 에이전시 포 사이언스, 테크놀로지 앤드 리서치
Publication of KR20070040392A publication Critical patent/KR20070040392A/ko
Application granted granted Critical
Publication of KR101050261B1 publication Critical patent/KR101050261B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

입력 신호를 콘텍스트에 기반하여 엔코딩하는 콘텍스트 기반 시스템은 영역 변환 모듈 및 콘텍스트 기반 코딩 모듈을 포함한다. 영역 변환 모듈은 입력 신호를 변환 계수 시퀀스 c[i]로 변환한다. 콘텍스트 기반 코딩 모듈은 비트 플레인 스캐닝 모듈, 콘텍스트 모델링 모듈 및 통계 엔코딩 모듈을 포함한다. 비트 플레인 스캐닝 모듈은 변환 계수 c[i] 및 비트 플레인 [bp] 각각에 대해 비트 플레인 심볼 bps[i,bp]를 생성하도록 동작가능하다. 콘텍스트 모델링 모듈은 하나 이상의 콘텍스트 값들을 수신된 비트 플레인 심볼 bps[i,bp] 각각에 할당하도록 동작가능하다. 통계 코딩 모듈은 각 비트 플레인 심볼 bps[i,bp]를 하나 이상의 해당 콘텍스트 값들의 함수로 코딩하도록 동작가능하여 콘텍스트 기반의 엔코딩된 심볼 스트림을 생성한다.

Description

콘텍스트 기반의 신호 엔코딩 및 디코딩{Context­based encoding and decoding of signals}
본 발명은 데이터를 코딩하는 시스템 및 방법에 관한 것으로, 특히 콘텍스트 기반의 코딩 시스템 및 방법에 관한 것이다.
콘텍스트 기반 코딩 기술은 유한한 문장 또는 콘텍스트에 대한 통계적인 모델 사용을 기반으로 하여 소스(source)로부터 생성된 샘플들의 통계적인 의존도를 획득하는 것이다. 콘텍스트 기반 코딩 시스템에서, 주어진 샘플에 대한 코딩에서의 확률 할당은 엔코더 및 디코더 모두에게 이미 알려진 정보, 예를 들어 이미 코딩되어 전송된 과거의 샘플들을 사용하여 만들어진 콘텍스에 종속한다. 콘텍스트에 대한 자세한 설계는 다른 애플리케이션들에 따라 달라진다. 예를 들어, 텍스트 압축에서, 문자의 코딩에 대한 콘텍스트는 그에 앞선 문자들에 의해 형성될 수 있다. 이미지 코딩에서, 주어진 픽셀의 코딩에 대한 확률 할당은 그 이웃(코딩된) 픽셀들의 값에 의해 결정된다.
도 1은 이 기술 분야에서 알려진 종래의 콘텍스트 기반 코딩 시스템을 도시한 것이다. 종래의 시스템(100)에서, 데이터 소스(110)로부터 출력된 각 샘플은 콘텍스트 모델링 모듈(130)에 의해 결정되는 확률 할당을 갖는, 보통 산술 코드인 통 계 코더(statistical coder)(120)를 사용하여 코딩된다. 관례적으로 콘텍스트 모델링 모듈은 주어진 콘텍스트에 대한 확률 할당을 결정하는데 두 접근 방법 중 하나를 사용한다. 첫 번째 접근 방법은 고정 주파수 테이블을 사용하는 것이다. 각 콘텍스트는 고정되고, 미리 학습된 주파수 테이블을 사용하며, 이 주파수 테이블은 콘텍스트가 적합하면 호출되는 가능한 샘플들에 대한 확률 할당을 저장한다. 두 번째 접근 방법은 적응적인 주파수 테이블을 사용하는 것이다. 각 콘텍스트에서 그 콘텍스트로 코딩된 샘플들에 따라 코딩 과정 동안 주파수 테이블이 조절된다.
비트 플레인(bit-plane) 코딩 기술은 이전에, 예를 들어, A. Said and W.A. Pearlman의 "A New, Fast, and Efficient Image Codec Based on Set Partitioning in Hierarchical Trees", IEEE Transactions on Circuits and Systems For Video Technology, vol.6, no.3, pp.243-250, June 1996에서 이미지 코딩에 사용되었다. 비트 플레인 코딩은 미세 입자 비트율 스켈러빌러티(fine granular bit-rate scalability)를 얻는 코딩 시스템을 만들기 위해 멀티미디어 코딩 애플리케이션에 넓게 사용되었다. 비트 플레인 코딩에서, 코딩될 디지털 샘플들은 먼저 일련의 벡터들로 그루핑된다. 다음으로 각 벡터는 데이터 엘레멘트들이 최상위 비트(MSB)로부터 최하위 비트(LSB)까지 순차적으로 코딩되는, 순차적인 비트 플레인 스캐닝(scanning) 및 코딩 방법을 사용하여 코딩된다. 콘텍스트 기반 코딩 기술은 각 비트 플레인 심볼이 자신의 콘텍스트에 따라 콘텍스트 모델링 모듈에 의해 주어지는 확률 할당으로 코딩되는 방식으로 비트 플레인 코딩에 적용될 수 있다. 이는 콘텍스트 기반 비트 플레인 코딩(context based bit-plane coding, CB-BPC) 기술을 유도한다. CB-BPC 기술은 JPEG 2000 [참조: D.Taubman, "High Performance Scalable Image Compression with EBCOT", IEEE Trans. Image Processing, vol. 9, No.7, pp. 1158-1170, July 2000] 및 MPEG Audio BSAC [참조: S.H.Park, Y.B.Kim 및 Y.S. S대 "Multi-layer bit-sliced bit0rate scalable audio coder", 103rd AES convention preprint 4520, 1997] 과 같은 멀티미디어 코딩 애플리케이션에 폭넓게 사용되어 왔다.
필요한 것은 더 나은 압축 성능을 얻기 위해 관심대상의 데이터에 대한 좋은 모델을 제공하고 바람직하게는 비트 플레인 코딩의 스캘러빌리티를 결합하는 개선된 콘텍스트 기반 코딩 과정이다.
본 발명은 비트 플레인 코딩을 결합하여 스캘러빌리티를 허용하는 콘텍스트 기반 엔코딩 및 디코딩 시스템 및 과정을 제공한다. 선택적으로, 주파수 대역, 디스턴스 투 레이지 비트 플레인(distance-to-lazy bit-plane), 계수들의 유의 상태(significance state) 및 양자화 간격(quantization interval)과 같은 특별한 콘텍스트 특징들과 코딩 과정이 포함되어 성능을 더 개선할 수 있다.
일실시예에서, 콘텍스트 기반 엔코딩 시스템은 영역 변환(domain transform) 모듈 및 콘텍스트 기반 코딩 모듈을 포함한다. 상기 영역 변환 모듈은 입력 신호를 변환 계수 시리즈 c[i]로 변환하도록 동작할 수 있다. 콘텍스트 기반 코딩 모듈은 비트 플레인 스캐닝 모듈, 콘텍스트 모델링 모듈 및 통계 엔코딩 모듈을 포함한다. 상기 비트 플레인 스캐닝 모듈은 각 변환 계수 c[i] 및 각 비트 플레인 [bp]에 대해 비트 플레인 심볼 bps[i,bp]을 생성하도록 동작할 수 있다. 콘텍스트 모델링 모듈은 하나 이상의 콘텍스트 값들을 수신된 각 비트 플레인 심볼 bps[i,bp]에 할당하도록 동작할 수 있다. 통계 코딩 모듈은 각 비트 플레인 심볼 bps[i.bp]을 하나 이상의 해당 콘텍스트 값들의 함수로 코딩하여 콘텍스트 기반의 엔코딩된 심볼 스트림을 생성하도록 동작할 수 있다.
본 발명의 이러한 특징들 및 다른 특징들은 다음의 도면과 상세한 설명에 의해 잘 이해될 것이다.
도 1은 종래 기술의 콘텍스트 기반 엔코딩 시스템을 도시한 것이다.
도 2a 및 2b는 본 발명에 따른 콘텍스트 기반 엔코더 및 동작 방법에 대한 제1실시예를 각각 도시한 것이다.
도 3a 및 3b는 본 발명에 따른 콘텍스트 기반 엔코더 및 동작 방법에 대한 제2실시예를 각각 도시한 것이다.
도 4a 및 4b는 본 발명에 따른 콘텍스트 기반 디코더 및 동작 방법에 대한 제1실시예를 각각 도시한 것이다.
도 5a 및 5b는 본 발명에 따른 콘텍스트 기반 디코더 및 동작 방법에 대한 제2실시예를 각각 도시한 것이다.
본 발명은 입력 디지털 신호의 비트 플레인 심볼들의 콘텍스트 기반 코딩 문 제에 대한 새로운 콘텍스트 설계를 제시한다. 그 설계는 오디오 컨텐츠에 특별한 적용 가능성을 가지나, 스트리밍 비디오(streaming video) 뿐만 아니라 이미지 기반의 데이터를 처리하는 다른 실시예들에서도 사용될 수 있다.
본 발명에 따르면, 4가지 타입의 콘텍스트들은 개별적으로 또는 서로 결합하여 입력 신호를 코딩한다. 콘텍스트들은 여기에서는 디스턴스 투 레이지 비트 플레인(distance-to-lazy nit-plane, D2L) 콘텍스트, 주파수 대역(Frequency Band, FB) 콘텍스트, 유의 상태(Significance State, SS) 콘텍스트 및 양자화 간격(Quantization Interval, QL) 콘텍스트로 참조된다. 아래에서 더 설명되는 바와 같이, 비트 플레인 bp로부터 변환 계수 c[i], i=0, …, N-1, 의 각 비트 플레인 심볼 b[i,bp]은 하기되는 바와 같이 하나 이상의 D2L, FB, SS, QL 콘텍스트들을 사용하여 코딩된다. 더 작은 bp는 최하위(least significant) 비트 플레인을 의미하고, bp는 0에서 시작하는 것이 더 정의된다. 그러므로, 다음 식을 얻을 수 있다.
Figure 112007012637415-pct00001
여기서, s[i] 및 M은 각각 c[i]에 대한 부호 및 워드 길이(word length)이다.
비록 본 발명이 속하는 기술 분야의 당업자는 이들 설계에 대한 작은 변경들이 본 발명을 다른 컨텐츠 형태를 포함하는 신호들의 엔코딩 및 디코딩에 적용하는데 사용될 수 있음을 알겠지만, 다음의 콘텍스트 설계는 입력 오디오 신호에 관해 설명된다.
콘텍스트1 : 주파수 대역( FB )
FB 콘텍스트는 그 주파수 위치에 따라 각 변환 계수에 할당되고, 변환 계수들의 비트 플레인 심볼들의 확률 분포의 그 주파수 위치에 대한 의존성을 획득하는데 사용된다. 예시적인 실시예에서, 변환 계수 c[i]는 그 주파수 위치에 따라 세 개의 다른 대역들, 즉, 저대역(0~4 kHz), 중대역(4 kHz~11 kHz) 및 고대역(11 kHz 이상)으로 구분된다. 다음으로, 각 변환 계수에 대한 FB 콘텍스트가 자신에 속한 각 주파수 대역에 따라 할당된다.
콘텍스트 번호 주파수 범위
0(저대역) 0~4 kHz
1(중대역) 4~11 kHz
2(고대역) 11kHz 이상
물론, 다른 콘텍스트 번호 및/또는 다른 주파수 범위 구분을 갖는 다른 주파수 대역의 구성을 사용할 수 있다.
콘텍스트 2: 디스턴스 투 레이지 비트 플레인( D2L )
본 발명에 채용된 제2 콘텍스트는 미리 결정된 정수 코딩 파라미터 lazy_bp에 대한, 코딩될 비트 플레인 심볼의 비트 플레인 번호의 관계를 설명한다. 이 콘텍스트의 구현은 오디오 신호로부터 비트 플레인 심볼들이 파라미터 lazy-bp까지 동일한 거리를 가질 때 그 비트 플레인 심볼들의 분포가 비슷한 확률 스큐(skew)를 보이는 경향이 있다는 관찰로부터 비롯된다. 본 발명에서 D2L 콘텍스트는 D2L(bp)=bp-lazy_bp로 정의된다.
더욱이, 비트 플레인 심볼들의 확률 스큐는 더 작은 bp에 대해 감소하는 경향을 보이는 것으로 관찰된다. 그러므로, D2L(bp)<L을 만족하는 모든 D2L 콘텍스트들을 비트 플레인 심볼들이 동일한 확률 분포, 즉, 1/2의 확률 할당으로 코딩되는 하나의 콘텍스트로 그루핑함으로써 콘텍스트 설계를 단순화할 수 있다. 여기서 L은 미리 선택된 파라미터이다.
특별한 실시예에서, 최적의 코딩 성능을 위해 CB_BPC 엔코더에서 선택되는 파라미터 lazy_bp는 CB-BPC 디코더로 전송되어 정확하게 복호화함으로써 정확하게 D2L콘텍스트를 복원할 수 있다.
콘텍스트 3: 유의 상태( SS )
유의 상태 콘텍스트는 오디오 신호에 대한 이웃 변환 계수들의 크기 사이의 상관관계를 모델링하는데 채용된다. 특별한 실시예에서, 유의 상태 sig_state(i,bp)는 다음과 같이 정의된다.
Figure 112007012637415-pct00002
여기서, "비유의" 및 "유의"는 j<bp일 때 논제로(non-zero) 비트 플레인 심볼 b[i,j]가 존재/비존재 함을 의미한다. 다음으로, 코딩될 각 비트 플레인 심볼에 대한 SS 콘텍스트는 그 이웃 계수들의 유의 상태에 의해 주어진다. 예를 들어, 4개의 가장 가까운 이웃 계수들을 고려한다면, 비트 플레인 심볼 b[i,bp]에 대한 SS 콘텍스트는 다음 식과 같이 주어진다.
Figure 112007012637415-pct00003
콘텍스트 4: 양자화 간격( QI )
몇몇 코딩 시스템 아키텍쳐들(architectures)은 향상된 오디오 집(Advanced Audio Zip) [R.Yu, X.Lin, S.Rahardja 및 C.C.Ko, "A Scalable Lossy to Lossless Audio Coder for MPEG-4 Audio Scalable Lossless Coding", Proc. ICASSP 2004 를 참조], 무손실 오디오 코더의 FGS 와 같은 코어(core) 엔코더를 결합한다. 그러한 시스템에서, 코어 엔코더는 변환 계수 c[i], i=0, …, N-1 에서 양자화 및 코딩 과정을 수행하여 입력 신호의 기본 품질(quality)/속도(rate)의 코딩된 유닛을 나타내는 코어 비트 스트림을 생성한다. 다음으로, 에러 매핑은 코어 비트 스트림에서 이미 코딩되었던 정보를 제거함으로써 레지듀(residual) 신호 e[i], i=0, …, N-1 를 생성하는데 사용된다. 이러한 레지듀 신호는 결국 CB-BPAC 코딩 과정으로 코딩되어 FGS 비트 스트림을 생성한다. 이 아키텍쳐의 예시적인 실시예가 도 3a에 도시되고 아래에서 설명된다.
레지듀 신호 e[i], i=0, …, N-1 가 c[i], i=0, …, N-1 에 대해 수행되는 양자화 동작으로부터 레지듀로 생성될 때, 그 크기는 보통 코어 엔코더 양자화기의 양자화 간격에 종속하는 다음의 값에 의해 제한된다.
Figure 112007012637415-pct00004
여기서, interval[i]는 c[i]에 대한 양자화 간격과 채용된 상세한 에러 매핑 과정에 종속된다. 예를 들어, 만일 양자화 간격 Δ를 갖는 일정한 양자화기가 사용되면, 레지듀 신호는 c[i]에서 양자화 간격의 중간값
Figure 112007012637415-pct00005
을 감산하여 얻어진다.
이러한 특성을 코딩 성능을 개선하는데 사용하기 위해서, 양자화 간격 콘텍스트 QI는 또한 코어 엔코더를 사용하는 실시예들에 사용할 수 있으며, 이 양자화 간격 콘텍스트는 다음 식과 같이 주어진다.
Figure 112007012637415-pct00006
여기서,
Figure 112007012637415-pct00007
는 b[i,bp] 이전에 모든 비트 플레인 심볼들이 수신되었을 때 e[i]에 대해 부분적으로 재구성된 값이다.
수학식 4로부터, QI=2일 때 현재 비트 플레인 심볼들 b[i,bp]가 1의 확률로 0이므로 이 심볼들은 코딩될 필요가 없는(널(null) 콘텍스트) 것으로 결론짓는 것이 타당하다. 더하여, 콘텍스트 QI=0 와 비교하여, b[i,bp]가 1일 확률은 QI=1 일 때와 비교하여 매우 낮으므로 이 둘은 본 발명에서 두 개의 콘텍스트로 취급된다.
콘텍스트 기반 코딩 아키텍쳐 및 방법들
도 2a는 오디오 신호를 엔코딩하는데 사용되는 콘텍스트 기반 엔코딩 시스템 의 예시적인 블록도이고, 도 2b는 해당 동작 방법을 도시한 것이다. 먼저, 도 1a의 엔코더 블록도를 참조하면, 엔코더(200)는 변환 모듈(210), 콘텍스트 기반 비트 플레인 산술 코더(context-based bit-plane arithmetic coder, CB-BPAC)(220) 및 멀티플렉서(230)을 포함한다. 콘텍스트 기반 엔코더(220)는 비트 플레인 스캐닝 모듈(222), 콘텍스트 모델링 모듈(224) 및 통계 엔코더(226)를 더 포함한다. 콘텍스트 기반 엔코더(220)의 예시적인 실시예는 산술 엔코더이다.
도 2a 및 2b를 참조하여 엔코더의 동작을 설명하면, 오디오 신호(202)는 변환 모듈(210)로 공급되어 변환 계수 c[i], i=0,…,N-1로 변환된다(도 2b의 251 단계). 특별한 실시예에서, 변환 모듈(210)은 공급된 신호에 이산 웨이블릿 변환(discrete wavelet transformation)을 제공하도록 동작할 수 있으며, 다른 변환으로서 이산 코사인 변환(discrete cosine transformation), 이산 푸리에 변환(discrete Fourier transformation)과 함께 다른 변환 타입들도 본 발명하의 다른 실시예로 사용될 수 있다.
252 단계에서, 변환 계수 c[i]는 순차적으로 비트 플레인 스캐닝 모듈에 공급되어 각 변환 계수 c[i] 및 각 비트 플레인 bp에 대해 비트 플레인 심볼 bps[i,bp]를 생성하도록 동작한다. 일실시예에서, 비트 플레인 스캐닝 순서는 최상위(the most significant) 비트 플레인으로부터 최하위 비트 플레인까지, 즉, c[i]의 최대 워드 길이 M으로부터 0까지 수행된다.
다음으로 비트 플레인 심볼 bps[i,bp]는 콘텍스트 모델링 모듈(224) 및 상술한 실시예에서와 같이 산술 코더를 포함하는 통계 코더(226)로 공급된다. 콘텍스트 모델링 모듈(224)은 여기에서 설명된 4가지 콘텍스트 모델들 중 하나 이상을 결합하고, 수신된 비트 플레인 심볼 bps[i,bp]을 기반으로 하여 상술한 하나 이상의 콘텍스트 모델들에 대한 콘텍스트 값을 할당 및 출력하도록 동작할 수 있다(254 단계). 하나 이상의 콘텍스트 값은 이전에 엔코딩된 비트 플레인 심볼들을 사용하여 계산된 유의 상태 콘텍스트 값 또는 주파수 대역 콘텍스트 값 및/또는 현재 처리된 비트 플레인 심볼들의 위치에 의해 결정되는 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함할 수 있다. 특별한 실시예들에서, 콘텍스트 모델링 모듈(224)은 오직 하나의 콘텍스트 값, 예를 들어 변환 계수의 주파수 대역 또는 현재 처리된 비트 플레인 심볼 bps[i,bp]의 디스턴스 투 레이지 비트 플레인에 해당하는 콘텍스트 값을 통계 코더(226)에 할당 및 출력한다. 다른 실시예에서, 콘텍스트 모델링 모듈은 현재 처리된 비트 플레인 심볼 bps[i,bp]에 대한 복수의 콘텍스트 값들, 예를 들어, 주파수 대역 콘텍스트, 디스턴스 투 레이지 비트 플레인 콘텍스트 및 유의 상태 콘텍스트를 할당 및 출력하도록 구성될 수 있다. 물론, 세 콘텍스트 모델들 중 임의의 둘을 결합한 것도 채용될 수 있다.
255 단계에서, 통계 코더(226)는 비트 플레인 심볼 bps[i,bp]을 수신하여 해당 콘텍스트 값(들)의 함수로 코딩한다. 그 결과에 따른 콘텍스트 기반의 엔코딩된 비트 스트림은 순차적으로 다중화되어(multiplexed) 압축 비트 스트림을 생성한다.
도 3a는 오디오 신호를 엔코딩하는데 사용되는 콘텍스트 기반 엔코딩 시스템에 대한 두 번째 예시적인 블록도이고, 도 3b는 해당 동작 방법을 도시한 것이다. 이전에 확인된 콤포넌트들에 더하여, 시스템(300)은 코어 엔코더(310) 및 에러 매 핑 모듈(320)을 더 포함하여 알려진 바와 같은 레지듀 신호 계층을 생성한다.
엔코더의 동작을 설명하기 위해 도 3a 및 3b를 참조하면, 오디오 신호(302)는 변환 모듈(210)로 공급되어 변환 계수 c[i], i=0,…,N-1로 변환된다(도 3b의 351 단계). 상술한 바와 같이, 변환 모듈(210)은 이산 웨이블릿 변환, 이산 코사인 변환, 이산 푸리에 변환 등과 같은 다양한 시간/주파수 변환을 구현할 수 있다.
352 단계에서, 변환 계수들은 코어 엔코더(310)로 공급되며, 코어 엔코더(310)는 변환 계수들을 계수 x[i]의 코어 비트 스트림으로 엔코딩하도록 동작한다. 코어 엔코더(310)는 미리 정의된 양자화 간격을 사용하여 비트 스트림을 엔코딩하고, 미리 정의된 양자화 간격은 상술한 바와 같이 본 발명의 코딩 과정에서 QI 콘텍스트를 결정하는데 사용된다.
353 단계에서, 에러 매핑 모듈(320)은 변환 계수 시퀀스 c[i] 및 코어 비트 스트림을 수신하고, 그들 사이의 차를 얻어서 레지듀 계수 스트림 e[i]를 생성한다. 순차적으로, 코딩 과정은 상술한 바와 유사한 방식으로 진행되어 레지듀 계수들 e[i]가 엔코더(220)에 의해 콘텍스트 기반으로 엔코딩된다. 명확하게, 코딩 모듈(220) 내에서 레지듀 계수들 e[i]은 코딩 모듈(220) 내의 비트 플레인 스캐닝 모듈로 공급되고, 비트 플레인 스캐닝 모듈은 각 레지듀 계수 e[i] 및 각 비트 플레인 bp에 대해 레지듀 비트 플레인 심볼 rbps[i,bp]을 생성하도록 동작한다(354 단계). 다음으로, 레지듀 비트 플레인 심볼들 rbps[i,bp]은 콘텍스트 모델링 모듈 밑 통계 코더로 공급된다. 콘텍스트 모델링 모듈은 여기에서 설명된 4 개의 콘텍스트 모델들 중 하나 이상을 결합하고, 수신된 레지듀 비트 플레인 심볼 rbps[i,bp]를 기반으로 하여 상술한 콘텍스트 모델들중 하나 이상의 콘텍스트 값을 생성하도록 동작할 수 있다(356 단계). 하나 이상의 콘텍스트 값들은 이전에 엔코딩된 레지듀 비트 플레인 심볼들을 사용하여 계산된 유의 상태 콘텍스트 값 또는 주파수 대역 콘텍스트 값 및/또는 현재 처리된 레지듀 비트 플레인 심볼들의 위치에 의해 결정되는 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함할 수 있다. 또한 엔코딩 과정은 양자화 간격 콘텍스트 모델의 구현을 포함하여 양자화 간격 콘텍스트 값을 계산할 수 있다. 콘텍스트 모델링 모듈은 4개의 콘텍스트 모델들 각각(또는 이들 중 둘 또는 세 개의 콘텍스트 모델들의 임의의 결합)에 대한 콘텍스트 값들을 할당 및 출력하도록 동작할 수 있다.
357 단계에서, 코딩 모듈(220) 내의 통계 코더는 레지듀 비트 플레인 심볼 rbps[i,bp]를 수신하여 해당 콘텍스트 값(들)의 함수로 코딩한다. 그 결과에 따른 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림은 순차적으로 코어 비트 스트림과 다중화되어 압축된 비트 스트림을 생성한다.
도 4a 및 4b는 본 발명에 따라 상술한 도 2a 및 2b에 도시된 엔코더와 상보적인 콘텍스트 기반 디코더 및 동작 방법을 도시한 것이다. 먼저, 도 4a의 디코더 블록도를 참조하면, 디코더(400)는 디멀티플렉서(410), 콘텍스트 기반 비트 플레인 산술 디코더(context-based bit-plane arithmetic decoder, CB-BPAD)(420) 및 역변환 모듈(430)을 포함한다. 콘텍스트 기반 디코더(420)는 예시적인 실시예에서 산술 디코더인 통계 디코더(422), 콘텍스트 모델링 모듈(424) 및 비트 플레인 재구성 모듈(426)을 더 포함한다.
디코더(400)는 상술한 엔코더(200)의 역으로 동작한다. 451 단계에서, 압축 비트 스트림(402)이 수신되고 콘텍스트 기반의 엔코딩된 비트 스트림(404)으로 역다중화된다. 452 단계에서, 통계 코더(422)는 콘텍스트 기반의 엔코딩된 비트 스트림(404)를 수신하고, 그에 응답하여 디코딩된 비트 플레인 심볼 스트림 bps'[i,bp]을 대응 콘텍스트 값(들)의 함수로 생성한다. 콘텍스트 값(408)은 유의 상태 콘텍스트 값과 같이 이전에 디코딩된 비트 플레인 심볼 bps'[i,bp], 및/또는 주파수 대역 콘텍스트 값 및/또는 디스턴스 투 레이지 비트 플레인 콘텍스트 값과 같이 현재 처리된 비트 플레인 심볼의 위치를 기반으로 하는 콘텍스트 모델링 모듈(424)에 의해 생성된다. 특별한 실시예들에서, 콘텍스트 모델링 모듈(424)은 오직 하나의 콘텍스트 값, 예를 들어 변환 계수의 주파수 대역 또는 현재 처리된 비트 플레인 심볼의 디스턴스 투 레이지 비트 플레인에 해당하는 콘텍스트 값을 할당하고 통계 디코더(422)로 출력한다. 다른 실시예에서, 콘텍스트 모델링 모듈은 현재 처리되는 비트 플레인 심볼에 대한 복수의 콘텍스트 값들, 예를 들어 주파수 대역 콘텍스트, 디스턴스 투 레이지 비트 플레인 콘텍스트 및 유의 상태 콘텍스트에 대한 콘텍스트 값들을 할당 및 출력하도록 구성될 수 있다. 물론, 세 콘텍스트 모델들 중 임의의 둘의 결합도 또한 채용될 수 있다. 아포스트로피(')는 이전에 확인된 데이터의 디코딩된 버젼(예를 들어, 디코딩된 비트 플레인 심볼들은 bps'[i,bp])을 나타내며, 디코딩된 데이터는, 이상적으로는 엔코딩된 버젼의 복사본이지만, 달리 말하면 예를 들어 불완전한 전송 또는 디코딩 과정의 결과로서 시스템 구현시 불완전함에 의한 데이터를 포함하거나 생략한 버젼을 포함한다.
453 단계에서, 디코딩된 비트 플레인 심볼들 bps'[i,bp]은 비트 플레인 재구성 모듈(426)로 공급되고, 비트 플레인 재구성 모듈은 그에 대응하여 디코딩된 계수 스트림(412)을 생성한다. 다음으로 454 단계에서, 디코딩된 계수 스트림(412)은 역변환하여 디코딩된 출력 오디오 신호(414)를 생성하도록 동작하는 역변환 모듈(430)로 입력된다. 역변환 모듈(430)은 엔코더(200)에서 사용된 영역 변환의 역(inverse)을 적용하고, 역 이산 웨이블릿, 푸리에 또는 코사인 변환을 포함하거나 신호 처리에 적용할 수 있는 다른 역 영역 변환을 포함할 수 있다.
도 5a 및 5b는 상술한 도 3a 및 3b에 도시된 엔코더와 상보적인 콘텍스트 기반 디코더 및 동작 방법을 도시한 것으로, 도 4a의 디코딩 시스템의 구성요소들에 대한 참조번호가 유지된다. 이전에 확인된 콤포넌트들에 더하여 디코더(500)는 코어 디코더(440) 및 에러 디매핑(demapping) 모듈(450)을 더 포함한다.
디코더의 동작을 설명하기 위해 도 5a 및 5b를 참고하면, 먼저 551 단계에서 압축된 비트 스트림(502)이 수신되고 별도의 콘텍스트 기반의 엔코딩된 레지듀 및 코어 비트 스트림들(504, 506)로 역다중화된다. 552 단계에서, 콘텍스트 기반 디코더(420)는 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림(504)을 디코딩된 레지듀 계수 스트림 e'[i]로 디코딩하도록 동작한다. 특히, 디코딩 모듈(420)의 통계 디코더는 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림(504)을 수신하고, 수신한 콘텍스트 값(들)의 함수로서 레지듀 비트 플레인 심볼 rbps'[i.bp]로 디코딩한다. 디코딩 과정에 사용된 콘텍스트 값들은 현재 처리된 비트 플레인 심볼의 위치로부터 결정되는 주파수 대역 콘텍스트 값 및/또는 디스턴스 투 레이지 비트 플레인 콘텍스 트 값일 수 있으며, 이전에 디코딩된 레지듀 비트 플레인 심볼을 사용하여 계산된 유의 상태 콘텍스트 값일 수 있다. 더욱이, 디코딩 과정은 양자화 간격 콘텍스트 값을 계산하는 양자화 간격 콘텍스트 모델의 구현을 포함할 수 있다. 임의의 하나, 둘, 셋 또는 네 개의 콘텍스트 모델들 및 그들에 대응하는 콘텍스트 값들은 레지듀 비트 스트림(504)을 레지듀 비트 플레인 심볼 rbps'[i,bp]로 디코딩하는데 사용된다. 더욱 상세하게, 코어 디코딩 모듈(540)은 도 3a 및 3b를 참조하는 상술한 엔코딩 과정에 적용된 동일한 양자화 간격을 디코딩 과정에 적용한다. 디코딩된 레지듀 비트 플레인 심볼 rbps'[i,bp]는 순차적으로 레지듀 에러 계수 e'[i]로 비트 플레인에서 재구성된다.
553 단계에서, 코어 디코더 모듈(540)은 코어 비트 스트림(506)을 수신하고 그에 응답하여 디코딩된 코어 계수 x'[i]를 생성한다. 다음으로 554 단계에서, 에러 디매핑 모듈(550)은 디코딩된 코어 및 레지듀 계수들 x'[i] 및 e'[i]를 수신하고 그에 대응하여 해당 디코딩된 변환 계수들 c'[i](512)를 생성한다. 마지막으로 555 단계에서, 디코딩된 변환 계수 스트림 c'[i]은 역변환 모듈(430)로 입력되고, 역변환 모듈(430)은 상보적인 영역 변환을 적용하여 출력 오디오 신호(514)를 생성한다.
당업자에게 잘 알려진 바와 같이 설명된 과정은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 적절한 결합으로 구현될 수 있다. 더욱이, 설명된 과정들의 일부 또는 모두는 컴퓨터가 읽을 수 있는 매체(착탈식 디스크, 프로세서에 내장된 휘발성 또는 비휘발성 메모리 등)에 상주하는 컴퓨터로 읽을 수 있는 명령어 코드로 구 현될 수 있고, 명령어 코드는 의도된 기능들을 수행하는 다른 그러한 프로그램 가능한 디바이스의 컴퓨터를 프로그램하도록 동작할 수 있다.
참고문헌
다음의 참고문헌들은 여기에서 다양한 목적으로 전체적으로 참조된다:
Khalid Saywood, Introduction to Data Compression, Ch.1, pp. 19-21, Morgan kaufmann, 2000.
A. Said and W.A. Pearlman, "A new, fast and efficient image code based on set partitioning in hierarchical trees", IEEE Transactions on Circuits and Systems For Video Technology, vol. 6, no.3, pp. 243-250, June 1996.
D. Taubman, "High performance scalable image compression with EBCOT", IEE Tran. Image processing, vol. 9, no.7, pp. 1158-1170, July 2000.
S.H.Park, Y.B.Kim and Y.S.S대 "Multi-layer bit-sliced bit-rate scalable audio coder", 103rd AES convention preprint 4520, 1997.
R.Yu, X.Lin, S.Rahardja and C.C.Ko, "A Scalable Lossy to Lossless Audio Coder for MPEG-4 Audio Scalable Lossless Coding", to be appeared in Proc. ICASSP 2004.
이상과 같이 본 발명의 상세한 설명이 기재되었지만, 이는 단지 예시적이며, 다양한 변형, 변경 및 등가물이 여기에서 설명된 다양한 장치 및 과정들에 채용될 수 있다. 따라서, 본 발명의 범위는 다음의 청구범위에 의해 정의된다.

Claims (45)

  1. 입력 신호를 수신하도록 결합되는 입력부 및 출력부를 구비하고, 상기 입력 신호를 변환 계수(transform coefficients) 시퀀스 c[i]로 변환하도록 동작가능한 영역 변환 모듈; 및
    콘텍스트 기반 코딩 모듈을 포함하고, 상기 콘텍스트 기반 코딩 모듈은
    상기 변환 계수 시퀀스를 수신하도록 결합되는 입력부를 구비하고 각각의 변환 계수 c[i] 및 각각의 비트 플레인(bit-plane)[bp]에 대해 비트 플레인 심볼 bps[i,bp]를 생성하도록 동작가능한 비트 플레인 스캐닝 모듈;
    상기 비트 플레인 심볼들 bps[i,bp]을 수신하도록 결합된 입력부를 구비하고, 하나 이상의 콘텍스트 값들을 상기 수신된 비트 플레인 심볼 bps[i,bp]에 할당하도록 동작가능하며, 상기 각각의 할당된 콘텍스트 값은 콘텍스트 모델로부터 얻어지는 콘텍스트 모델링 모듈; 및
    각각의 비트 플레인 심볼 bps[i,bp]를 수신하도록 결합되는 제1입력부, 하나 이상의 해당 콘텍스트 값들을 수신하도록 결합되는 제2입력부 및 출력부를 구비하고, 상기 각각의 비트 플레인 심볼 bps[i,bp]을 하나 이상의 해당 콘텍스트 값들의 함수로 코딩하도록 동작가능하여 콘텍스트 기반의 엔코딩된 심볼 스트림을 생성하는 통계 코딩 모듈을 포함하며,
    상기 하나 이상의 콘텍스 모델들은 디스턴스 투 레이지(distance-to-lazy) 비트 플레인 콘텍스트 D2L[bp]를 포함하고, 그 콘텍스트 값은 상기 비트 플레인 [bp]의 번호와 미리 결정된 코딩 파라미터[lazy_bp] 사이의 미리 정의된 관계에 따라 결정되는 것을 특징으로 하는 콘텍스트 기반 엔코더.
  2. 제1항에 있어서,
    상기 하나 이상의 콘텍스트 모델들은 주파수 대역(frequency band) 콘텍스트 FB[i]를 포함하고, 그 콘텍스트 값은 상기 해당 변환 계수 c[i]의 주파수 위치에 따라 결정되는 것을 특징으로 하는 콘텍스트 기반 엔코더.
  3. 제2항에 있어서,
    상기 하나 이상의 콘텍스트 모델들은 상기 주파수 대역 콘텍스트 및 상기 디스턴스 투 레이지 비트 플레인 콘텍스트를 포함하고, 상기 통계 코딩 모듈은 각 비트 플레인 심볼 bps[i,bp]를 상기 해당 주파수 대역 콘텍스트 값 및 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값의 함수로 코딩하도록 동작가능한 것을 특징으로 하는 콘텍스트 기반 엔코더.
  4. 제3항에 있어서,
    상기 하나 이상의 콘텍스트 모델들은 유의 상태(significance state) 콘텍스트 sig_state[i,bp]를 더 포함하고, 그 콘텍스트 값은 비트 플레인[bp]을 따라 이웃 변환 계수들 c[i-1] 및 c[i]에 대한 크기 값의 미리 정의된 상관관계에 따라 결정됨을 특징으로 하는 콘텍스트 기반 엔코더.
  5. 제4항에 있어서,
    상기 통계 코딩 모듈은 상기 각 비트 플레인 심볼 bps[i,bp]을 상기 해당 주파수 대역 콘텍스트 값, 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값 및 상기 유의 상태 콘텍스트 값의 함수로 코딩하도록 동작가능한 것을 특징으로 하는 콘텍스트 기반 엔코더.
  6. 제1항에 있어서,
    상기 각 변환 계수 c[i]를 수신하도록 결합되는 입력부를 포함하고, 미리 정의된 간격으로 간격[i]을 양자화하며 상기 각 변환 계수 c[i]를 엔코딩하여 코어 비트 스트림을 생성하는 코어 엔코딩 모듈; 및
    상기 각 변환 계수 c[i]를 수신하도록 결합되는 제1입력부 및 상기 코어 비트 스트림을 수신하도록 결합되는 제2입력부를 포함하고, 상기 변환 계수 스트림 c[i]으로부터 상기 코어 비트 스트림을 제거하도록 동작가능하여 계수들의 레지듀 신호 e[i]를 생성하는 에러 매핑 모듈; 및
    멀티플렉서를 더 포함하고,
    상기 콘텍스트 기반 엔코더는 상기 레지듀 신호를 수신하고, 그에 응답하여 콘텍스트 기반의 엔코딩된 레지듀 신호를 생성하도록 동작가능하며, 상기 멀티플렉서는 상기 코어 비트 스트림을 수신하도록 결합되는 제1입력부, 상기 콘텍스트 기반의 엔코딩된 레지듀 신호를 수신하도록 결합되는 제2입력부 및 출력부를 구비하 고, 상기 코어 비트 스트림 및 상기 콘텍스트 기반의 엔코딩된 레지듀 신호를 상기 멀티플렉서로부터 출력되는 압축된 비트스트림으로 결합하도록 동작가능한 것을 특징으로 하는 콘텍스트 기반 엔코더.
  7. 제6항에 있어서,
    상기 하나 이상의 콘텍스트 모델들은 양자화 간격(quantization interval) 콘텍스트 QI[i,bp]를 더 포함하고, 그 콘텍스트 값은 상기 양자화 간격의 함수로 결정되는 것을 특징으로 하는 콘텍스트 기반 엔코더.
  8. 제7항에 있어서,
    상기 통계 코딩 모듈은 상기 각 비트 플레인 심볼 bps[i,bp]을 상기 해당 주파수 대역 콘텍스 값, 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값, 유의 상태 콘텍스트 값 및 상기 양자화 간격 콘텍스트 값의 함수로 코딩하도록 동작가능한 것을 특징으로 하는 콘텍스트 기반 엔코더.
  9. 제8항에 있어서, 상기 주파수 대역 콘텍스트 값 FB[i]는
    Figure 112007012637415-pct00008
    을 포함함을 특징으로 하는 콘텍스트 기반 엔코더.
  10. 제8항에 있어서, 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값 D2L[bp]는
    Figure 112007012637415-pct00009
    을 포함함을 특징으로 하는 콘텍스트 기반 엔코더.
  11. 제8항에 있어서, 상기 유의 상태 콘텍스트 값 sig_stat[i,bp]는
    Figure 112007012637415-pct00010
    를 포함함을 특징으로 하는 콘텍스트 기반 엔코더.
  12. 제8항에 있어서, 상기 양자화 간격 콘텍스트 값 QI[i,bp]는
    Figure 112007012637415-pct00011
    여기서,
    Figure 112007012637415-pct00012
    는 b[i,bp] 이전에 모든 비트 플레인 심볼들이 수신되었을 때 e[i]에 대해 부분적으로 재구성된 값
    을 포함함을 특징으로 하는 콘텍스트 기반 엔코더.
  13. 입력 신호를 복수의 변환 계수들로 영역 변환하는 단계; 및
    상기 변환된 계수들에 콘텍스트 기반의 엔코딩을 적용하여 코딩된 출력 비트 스트림을 생성하는 단계를 포함하고, 상기 코딩된 출력 비트 스트림을 생성하는 단계는
    상기 변환 계수들을 비트 플레인 스캐닝 및 코딩하여 복수의 비트 플레인 심볼들을 생성하는 단계;
    상기 비트 플레인 심볼들에 대해 하나 이상의 콘텍스트 모델들을 정의하는 단계;
    상기 정의된 하나 이상의 콘텍스트 모델들을 사용하여 상기 비트 플레인 심볼들에 대해 각각 하나 이상의 콘텍스트 값들을 할당하는 단계; 및
    상기 각 비트 플레인 심볼을 상기 하나 이상의 해당 콘텍스트 값들의 함수로 통계 코딩하여 코딩된 출력 비트 스트림을 생성하는 단계를 더 포함하고,
    상기 하나 이상의 콘텍스트 모델들을 정의하는 단계는 디스턴스 투 레이지 비트 플레인 콘텍스트 모델을 정의하는 단계를 포함하고, 그 콘텍스트 값은 상기 해당 비트 플레인 심볼의 비트 플레인 번호와 미리 결정된 코딩 파라미터 사이의 미리 정의된 관계에 따라 결정되는 것을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  14. 제13항에 있어서,
    상기 하나 이상의 콘텍스트 모델을 정의하는 단계는 주파수 대역 콘텍스트 모델을 정의하는 단계를 포함하고, 그 콘텍스트 값은 상기 해당 변환 계수의 상기 주파수 위치에 따라 결정되는 것을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  15. 제14항에 있어서,
    상기 하나 이상의 콘텍스트 모델을 정의하는 단계는 상기 주파수 대역 콘텍스트 모델 및 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 모델을 정의하는 단계를 포함하고,
    상기 하나 이상의 텍스트 값들을 할당하는 단계는 상기 해당 비트 플레인 심볼에 주파수 대역 콘텍스트 값, 디스턴스 투 레이지 콘텍스트 값을 할당하는 단계를 포함하며,
    상기 각 비트 플레인 심볼을 통계 코딩하는 단계는 상기 비트 플레인 심볼을 상기 주파수 대역 콘텍스트 값 및 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값의 함수로 통계 코딩하는 단계를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  16. 제15항에 있어서,
    상기 하나 이상의 콘텍스트 모델들을 정의하는 단계는 유의 상태 콘텍스트 모델을 정의하는 단계를 포함하고, 그 콘텍스트 값은 이웃 변환 계수들에 대한 크기 값들의 미리 정의된 상관관계에 따라 결정되는 것을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  17. 제16항에 있어서,
    상기 하나 이상의 콘텍스트 값들을 할당하는 단계는 주파수 대역 콘텍스트 값, 디스턴스 투 레이지 비트 플레인 콘텍스트 값 및 유의 상태 콘텍스트 값을 상기 해당 비트 플레인 심볼에 할당하는 단계를 포함하고,
    상기 각 비트 플레인 심볼을 통계 코딩하는 단계는 상기 비트 플레인 심볼을 상기 주파수 대역 콘텍스트 값, 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값 및 상기 유의 상태 콘텍스트 값의 함수로 통계 코딩하는 단계를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  18. 입력 신호를 복수의 변환 계수들로 영역 변환하는 단계;
    상기 변환 계수들을 엔코딩하여 코어 비트 스트림을 생성하고, 상기 엔코딩 단계는 미리 정의된 간격으로 상기 변환 계수들을 양자화하는 단계를 포함하며,
    상기 코어 비트 스트림에 대해 상기 변환 계수들을 에러 매핑하여 레지듀 계수 스트림을 생성하는 단계;
    상기 레지듀 계수 스트림에 콘텍스트 기반 엔코딩을 적용하여 엔코딩된 레지듀 출력 비트 스트림을 생성하는 단계를 포함하고, 상기 엔코딩된 레지듀 출력 비트 스트림을 생성하는 단계는
    상기 레지듀 계수들을 비트 플레인 스캐닝하여 복수의 레지듀 비트 플레인 심볼들을 생성하는 단계;
    상기 레지듀 비트 플레인 심볼에 대해 하나 이상의 콘텍스트 모델을 정의하 는 단계;
    상기 정의된 하나 이상의 콘텍스트 모델들을 이용하여 상기 레지듀 비트 플레인 심볼들에 대해 각각 하나 이상의 해당 콘텍스트 값들을 할당하는 단계; 및
    상기 각각의 레지듀 비트 플레인 심볼을 상기 하나 이상의 콘텍스트 값들의 함수로 코딩하여 코딩된 출력 비트 스트림을 생성하는 단계를 포함하며,
    상기 하나 이상의 콘텍스트 모델들을 정의하는 단계는 양자화 간격 콘텍스트 모델을 정의하는 단계를 포함하고, 그 콘텍스트 값은 미리 정의된 양자화 간격의 함수로 결정되는 것을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  19. 제18항에 있어서, 상기 하나 이상의 콘텍스트 모델들을 정의하는 단계는
    주파수 대역 콘텍스트 모델을 정의하고, 그 콘텍스트 값은 상기 해당 변환 계수의 상기 주파수 위치에 따라 결정되는 단계;
    디스턴스 투 레이지 비트 플레인 콘텍스트 모델을 정의하고, 그 콘텍스트 값은 상기 해당 비트 플레인 심볼의 비트 플레인 번호와 미리 결정된 코딩 파라미터 사이의 미리 정의된 관계에 따라 결정되는 단계; 및
    유의 상태 콘텍스트 모델을 정의하고, 그 콘텍스트 값은 이웃 변환 계수들에 대한 크기 값들의 미리 정의된 상관관계에 따라 결정되는 단계를 더 포함함을 특지응로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  20. 제19항에 있어서,
    상기 하나 이상의 콘텍스트 값들을 할당하는 단계는 주파수 대역 콘텍스트 값, 디스턴스 투 레이지 비트 플레인 콘텍스트 값, 유의 상태 콘텍스트 값 및 상기 해당 비트 플레인 심볼에 대한 양자화 상태 콘텍스트 값을 할당하는 단계를 포함하고,
    상기 각 비트 플레인 심볼을 통계 코딩하는 단계는 상기 비트 플레인 심볼을 상기 주파수 대역 콘텍스트 값, 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값, 상기 유의 상태 콘텍스트 값 및 상기 양자화 콘텍스트 값의 함수로 통계적으로 코딩하는 단계를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  21. 제20항에 있어서, 상기 주파수 대역 콘텍스트 값 FB[i]는
    Figure 112010084548824-pct00013
    를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  22. 제20항에 있어서, 상기 디스턴스 투 레이지 비트 플레인 콘텍스트 값 D2L[bp]는
    Figure 112010084548824-pct00014
    를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  23. 제20항에 있어서, 상기 유의 상태 콘텍스트 값 sig_state[i,bp]는
    Figure 112010084548824-pct00015
    를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  24. 제20항에 있어서, 상기 양자화 간격 콘텍스트 값 QI[i,bp]는
    Figure 112010084548824-pct00016
    여기서,
    Figure 112010084548824-pct00017
    는 b[i,bp] 이전에 모든 비트 플레인 심볼들이 수신되었을 때 e[i]에 대해 부분적으로 재구성된 값
    를 포함함을 특징으로 하는 신호의 콘텍스트 기반 엔코딩 방법.
  25. 비트 플레인 bp를 따라 영역 변환된 계수 시퀀스 c[i]로 코딩된 입력 신호를 포함하는 콘텍스트 기반의 엔코딩된 스트림을 디코딩하도록 동작가능한 디코더에 있어서,
    콘텍스트 기반 디코딩 모듈을 포함하고, 상기 콘텍스트 기반 디코딩 모듈은
    콘텍스트 기반의 엔코딩된 비트 스트림을 수신하도록 결합되는 제1입력부, 하나 이상의 콘텍스트 값들을 수신하도록 결합된 제2입력부 및 출력부를 구비하고, 상기 하나 이상의 콘텍스트 값들의 함수로서 상기 콘텍스트 기반의 엔코딩된 비트 스트림을 디코딩된 비트 플레인 심볼 bps'[i,bp]로 디코딩하도록 동작가능하고, 상기 하나 이상의 콘텍스트 값들은 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함하는 통계 코딩 모듈;
    상기 비트 플레인 심볼 bps'[i,bp]를 수신하는 입력부 및 출력부를 구비하고, 디코딩된 계수 스트림 c'[i]를 생성하도록 동작가능한 비트 플레인 재구성 모듈; 및
    순서를 갖는 디코딩된 계수 스트림 c'[i]를 수신하도록 결합되는 입력부 및 출력부를 구비하고, 상기 디코딩된 계수 스트림 c'[i]를 출력 오디오 신호로 변환하는 역 영역 변환 모듈을 포함함을 특징으로 하는 콘텍스트 기반 디코더.
  26. 제25항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 주파수 대역 콘텍스트 값을 더 포함함을 특징으로 하는 콘텍스트 기반 디코더.
  27. 제25항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 유의 상태 콘텍스트 값을 더 포함함을 특징으로 하는 콘텍스트 기반 디코더.
  28. 제27항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 주파수 대역 콘텍스트 값, 디스턴스 투 레이지 비트 플레인 콘텍스트 값 및 유의 상태 콘텍스트 값을 포함함을 특징으로 하는 콘텍스트 기반 디코더.
  29. 제25항에 있어서,
    상기 콘텍스트 기반 디코더가 상기 콘텍스트 기반의 엔코딩된 비트 스트림을 수신하고 그에 응답하여 디코딩된 레지듀 계수들 e'[i]를 생성하도록 동작가능할 때, 콘텍스트 기반의 엔코딩된 레지듀 스트림 및 코어 비트 스트림을 포함하는 압축된 비트 스트림을 수신하고 상기 콘텍스트 기반의 엔코딩된 레지듀 스트림 및 코어 비트 스트림을 분리하여 출력하도록 동작하는 디멀티플렉서;
    코어 비트 스트림에 결합되는 입력부 및 출력부를 구비하고, 상기 코어 비트 스트림을 디코딩된 코어 계수들 x'[i]로 디코딩하도록 동작가능한 코어 디코딩 모듈;
    상기 코어 계수들 x'[i]를 수신하도록 결합되는 제1입력부, 상기 디코딩된 레지듀 계수들 x'[i]을 수신하도록 결합되는 제2입력부 및 출력부를 포함하고, 수신된 계수들에 응답하여 디코딩된 변환 계수들 c'[i]를 생성하도록 동작가능한 에러 디매핑 모듈; 및
    디코딩된 변환 계수들 c'[i]를 수신하도록 결합되는 입력부를 구비하고 상기 디코딩된 변환 계수들에 응답하여 출력 오디오 신호를 생성하도록 동작하는 역 영역 변환 모듈을 포함함을 특징으로 하는 콘텍스트 기반 디코더.
  30. 제29항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 양자화 콘텍스트 값을 포함함을 특징으로 하는 콘텍스트 기반 디코더.
  31. 비트 플레인 bp를 따라 영역 변환된 계수 시퀀스 c[i]로 코딩된 입력 신호를 포함하는 엔코딩된 콘텍스트 기반 비트 스트림을 디코딩하는 방법에 있어서,
    하나 이상의 콘텍스트 값들의 함수로서 상기 엔코딩된 콘텍스트 기반 비트 스트림을 디코딩된 비트 플레인 심볼들 bps'[i,bp]로 통계 디코딩하고, 상기 하나 이상의 콘텍스트 값들은 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함하는 단계;
    상기 디코딩된 비트 플레인 심볼들 bps'[i,bp]를 순서를 갖는 디코딩된 계수 스트림 c[i] 로 비트 플레인 재구성하는 단계;
    상기 순서를 갖는 디코딩된 계수 스트림 c'[i]를 출력 신호로 역변환하는 단계를 포함함을 특징으로 하는 방법.
  32. 제31항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 주파수 대역 콘텍스트 값을 포함함을 특징으로 하는 방법.
  33. 제31항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 유의 상태 콘텍스트 값을 포함함을 특징으로 하는 방법.
  34. 비트 플레인 bp를 따라 영역 변환된 계수 시퀀스 c[i]로 코딩된 입력 신호를 포함하는 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림 및 코어 비트 스트림을 포함하는 엔코딩된 비트 스트림을 디코딩하는 방법에 있어서,
    상기 코어 비트 스트림을 디코딩된 코어 계수들 x'[i]로 디코딩하는 단계;
    하나 이상의 콘텍스트 값들의 함수로서, 상기 콘텍스트 기반의 엔코딩된 비트 스트림을 디코딩된 레지듀 계수들 e'[i]로 디코딩하고, 상기 하나 이상의 콘텍스트 값들은 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함하는 단계;
    상기 디코딩된 코어 계수들 x'[i] 및 상기 디코딩된 레지듀 계수들 e[i]에 대해 디코딩된 변환 계수들 c'[i]를 생성하는 단계; 및
    상기 디코딩된 계수들 c'[i]를 출력 신호로 역변환하는 단계를 포함함을 특징으로 하는 방법.
  35. 제34항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 주파수 대역 콘텍스트 값을 포함함을 특징으로 하는 방법.
  36. 제34항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 양자화 간격 콘텍스트 값을 포함함을 특징으로 하는 방법.
  37. 제34항에 있어서, 상기 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림을 디코딩하는 단계는
    상기 하나 이상의 콘텍스트 값들의 함수로서, 상기 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림을 디코딩된 레지듀 비트 플레인 심볼들 rbps'[i,bp]로 통계 디코딩하는 단계;
    상기 디코딩된 레지듀 비트 플레인 심볼들 rbps'[i,bp]를 디코딩된 레지듀 계수들 e'[i]로 비트 플레인 재구성하는 단계를 포함함을 특징으로 하는 방법.
  38. 데이터의 콘텍스트 기반의 엔코딩에 대한 명령 코드를 실행하도록 동작가능한 컴퓨터 프로그램을 저장하는, 컴퓨터로 읽을 수 있는 저장 매체에 있어서,
    상기 컴퓨터 프로그램은,
    입력 신호를 복수의 변환 계수들로 영역 변환하는 명령 코드; 및
    상기 변환된 계수들에 대해 콘텍스트 기반 엔코딩을 적용하여 코딩된 출력 비트 스트림을 생성하는 명령 코드를 포함하고,
    상기 코딩된 출력 비트 스트림을 생성하는 명령 코드는
    상기 변환 계수들을 비트 플레인 스캐닝 및 코딩하여 복수의 비트 플레인 심볼들을 생성하는 명령 코드;
    상기 비트 플레인 심볼들에 대해 하나 이상의 콘텍스트 모델들을 정의하는 명령 코드;
    상기 정의된 하나 이상의 콘텍스트 모델들을 사용하여 상기 비트 플레인 심볼들에 대해 각각 하나 이상의 콘텍스트 값들을 할당하는 명령 코드;
    상기 각각의 비트 플레인 심볼을 상기 하나 이상의 해당 콘텍스트 값들의 함수로 통계 코딩하여 코딩된 출력 비트 스트림을 생성하는 명령 코드를 더 포함하고,
    상기 하나 이상의 콘텍스트 모델들을 정의하는 명령 코드는 디스턴스 투 레이지 비트 플레인 콘텍스트 모델을 정의하는 명령 코드를 포함하고, 그 콘텍스트 값은 상기 해당 비트 플레인 심볼의 상기 비트 플레인 번호와 미리 결정된 코딩 파라미터 사이의 미리 정의된 관계에 따라 결정되는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  39. 제38항에 있어서,
    상기 하나 이상의 콘텍스트 모델을 정의하는 명령 코드는 주파수 대역 콘텍스트 모델을 정의하는 명령 코드를 포함하고, 그 콘텍스트 값은 상기 해당 변환 계수의 상기 주파수 위치에 따라 결정되는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  40. 데이터의 콘텍스트 기반 엔코딩에 대한 명령 코드를 실행하도록 동작가능하고 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체에 있어서,
    상기 컴퓨터 프로그램은,
    입력 신호를 복수의 변환 계수들로 영역 변환하는 명령 코드;
    상기 변환 계수들을 엔코딩하여 코어 비트 스트림을 생성하고, 상기 엔코딩은 미리 정의된 간격으로 상기 변환 계수들을 양자화하는 것을 포함하며,
    상기 코어 비트 스트림에 대해 상기 변환 계수들을 에러 매핑하여 레지듀 계수 스트림을 생성하는 명령 코드;
    상기 레지듀 계수 스트림에 콘텍스트 기반 엔코딩을 적용하여 코딩된 레지듀 출력 비트 스트림을 생성하는 명령 코드를 포함하고, 상기 코딩된 레지듀 출력 비트 스트림을 생성하는 명령 코드는
    상기 레지듀 계수들에 의해 비트 플레인 스캐닝 및 코딩을 수행하여 복수의 레지듀 비트 플레인 심볼들을 생성하는 명령 코드;
    상기 레지듀 비트 플레인 심볼에 대해 하나 이상의 콘텍스트 모델을 정의하는 명령 코드;
    상기 정의된 하나 이상의 콘텍스트 모델들을 이용하여 상기 레지듀 비트 플레인 심볼들에 대해 각각 하나 이상의 해당 콘텍스트 값들을 할당하는 명령 코드; 및
    상기 각각의 레지듀 비트 플레인 심볼을 상기 하나 이상의 콘텍스트 값들의 함수로 코딩하여 코딩된 출력 비트 스트림을 생성하는 명령 코드를 포함하며,
    상기 하나 이상의 콘텍스트 모델들을 정의하는 명령 코드는 양자화 간격 콘텍스트 모델을 정의하는 명령 코드를 포함하고, 그 콘텍스트 값은 미리 정의된 양자화 간격의 함수로 결정되는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  41. 비트 플레인 bp를 따라 영역 변환된 계수 시퀀스 c[i]로 코딩된 입력 신호를 포함하는 콘텍스트 기반의 엔코딩된 비트 스트림을 디코딩하는 명령 코드를 실행하도록 동작 가능한 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체에 있어서,
    상기 컴퓨터 프로그램은,
    하나 이상의 콘텍스트 값들의 함수로서 상기 콘텍스트 기반의 엔코딩된 비트 스트림을 디코딩된 비트 플레인 심볼들 bps'[i,bp]로 통계 디코딩하고, 상기 하나 이상의 콘텍스트 값들은 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함하는 명령 코드;
    상기 디코딩된 비트 플레인 심볼들 bps'[i,bp]를 순서를 갖는 디코딩된 계수 스트림 c[i] 로 비트 플레인 재구성하는 명령 코드;
    상기 순서를 갖는 디코딩된 계수 스트림 c'[i]를 출력 신호로 역변환하는 명령 코드를 포함함을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  42. 제41항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 주파수 대역 콘텍스트 값을 포함함을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  43. 비트 플레인 bp를 따라 영역 변환된 계수 시퀀스 c[i]로 코딩된 입력 신호를 포함하는 콘텍스트 기반의 엔코딩된 레지듀 비트 스트림 및 코어 비트 스트림을 포함하는 엔코딩된 비트 스트림을 디코딩하는 명령 코드를 실행하도록 동작 가능한 컴퓨터 프로그램을 저장하는 컴퓨터로 읽을 수 있는 저장 매체에 있어서,
    상기 컴퓨터 프로그램은,
    상기 코어 비트 스트림을 디코딩된 코어 계수들 x'[i]로 디코딩하는 명령 코드;
    하나 이상의 콘텍스트 값들의 함수로서, 상기 콘텍스트 기반의 레지듀 비트 스트림을 디코딩된 레지듀 계수들 e'[i]로 디코딩하고, 상기 하나 이상의 콘텍스트 값들은 디스턴스 투 레이지 비트 플레인 콘텍스트 값을 포함하는 명령 코드;
    상기 디코딩된 코어 계수들 x'[i] 및 상기 디코딩된 레지듀 계수들 e[i]에 대해 디코딩된 변환 계수들 c'[i]를 생성하는 명령 코드; 및
    상기 디코딩된 계수들 c'[i]를 출력 신호로 역변환하는 명령 코드를 포함함을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  44. 제43항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 주파수 대역 콘텍스트 값을 포함함을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
  45. 제43항에 있어서,
    상기 하나 이상의 콘텍스트 값들은 미리 정의된 양자화 간격 콘텍스트 값을 포함함을 특징으로 하는 컴퓨터로 읽을 수 있는 저장 매체.
KR1020077003321A 2004-07-14 2004-07-14 콘텍스트 기반의 신호 엔코딩 및 디코딩 KR101050261B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SG2004/000211 WO2006006936A1 (en) 2004-07-14 2004-07-14 Context-based encoding and decoding of signals

Publications (2)

Publication Number Publication Date
KR20070040392A KR20070040392A (ko) 2007-04-16
KR101050261B1 true KR101050261B1 (ko) 2011-07-19

Family

ID=35784185

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077003321A KR101050261B1 (ko) 2004-07-14 2004-07-14 콘텍스트 기반의 신호 엔코딩 및 디코딩

Country Status (11)

Country Link
US (1) US7656319B2 (ko)
EP (2) EP2006839A3 (ko)
JP (1) JP4842265B2 (ko)
KR (1) KR101050261B1 (ko)
CN (1) CN100584023C (ko)
AU (1) AU2004321469B2 (ko)
BR (1) BRPI0418954A (ko)
MX (1) MX2007000459A (ko)
MY (1) MY143951A (ko)
TW (1) TWI361574B (ko)
WO (1) WO2006006936A1 (ko)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100928968B1 (ko) * 2004-12-14 2009-11-26 삼성전자주식회사 영상 부호화 및 복호화장치와 그 방법
DE102005032080A1 (de) * 2005-07-08 2007-01-11 Siemens Ag Verfahren zum Senden eines Mediadatenstroms und Verfahren zum Empfangen und Erstellen eines rekonstruierten Mediadatenstroms, sowie dazugehörige Sendevorrichtung und Empfangsvorrichtung
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
KR100750165B1 (ko) * 2006-02-22 2007-08-17 삼성전자주식회사 압축률 향상을 위해 개선된 컨텍스트 모델 선택을 사용하는cabac 부호화 방법 및 장치, 그리고 cabac복호화 방법 및 장치
KR101411901B1 (ko) * 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
EP2301019B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
PT2491553T (pt) * 2009-10-20 2017-01-20 Fraunhofer Ges Forschung Codificador de áudio, descodificador de áudio, método para codificar uma informação de áudio, método para descodificar uma informação de áudio e programa de computador que utiliza uma redução iterativa de tamanho de intervalo
MX2012008075A (es) 2010-01-12 2013-12-16 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar e informacion de audio, metodo para decodificar una informacion de audio y programa de computacion utilizando una modificacion de una representacion de un numero de un valor de contexto numerico previo.
US8436755B2 (en) * 2010-05-21 2013-05-07 Research In Motion Limited Methods and devices for reducing sources in binary entropy coding and decoding
KR101676477B1 (ko) * 2010-07-21 2016-11-15 삼성전자주식회사 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
USRE47366E1 (en) 2011-06-23 2019-04-23 Sun Patent Trust Image decoding method and apparatus based on a signal type of the control parameter of the current block
MX2013013508A (es) 2011-06-23 2014-02-27 Panasonic Corp Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
TWI581615B (zh) 2011-06-24 2017-05-01 Sun Patent Trust A decoding method, a coding method, a decoding device, an encoding device, and a coding / decoding device
RU2603552C2 (ru) 2011-06-24 2016-11-27 Сан Пэтент Траст Способ декодирования изображения, способ кодирования изображения, устройство декодирования изображения, устройство кодирования изображения и устройство кодирования и декодирования изображения
MX2013013483A (es) 2011-06-27 2014-02-27 Panasonic Corp Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
CN103563377B (zh) 2011-06-28 2017-05-10 太阳专利托管公司 解码方法及解码装置
MX2013010892A (es) 2011-06-29 2013-12-06 Panasonic Corp Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
MX339141B (es) 2011-06-30 2016-05-13 Panasonic Ip Corp America Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
WO2013001769A1 (ja) 2011-06-30 2013-01-03 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置
AU2012281918C1 (en) 2011-07-11 2016-11-17 Sun Patent Trust Decoding Method, Coding Method, Decoding Apparatus, Coding Apparatus, And Coding and Decoding Apparatus
US8682091B2 (en) 2011-08-18 2014-03-25 International Business Machines Corporation Real-time image compression
PL3849199T3 (pl) * 2011-11-07 2023-04-17 Tagivan Ii Llc Sposób kodowania obrazu i urządzenie kodujące obraz
CN105141966B (zh) * 2015-08-31 2018-04-24 哈尔滨工业大学 视频压缩中变换系数的上下文建模方法
US11113846B2 (en) * 2018-08-31 2021-09-07 Hulu, LLC Coefficient context modeling in video coding
CN112447165A (zh) * 2019-08-15 2021-03-05 阿里巴巴集团控股有限公司 信息处理、模型训练和模型构建方法、电子设备、智能音箱

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1107608A2 (en) 1999-12-02 2001-06-13 Lucent Technologies Inc. Methods and apparatus for context selection of block transform coefficients
WO2003027940A1 (en) 2001-09-14 2003-04-03 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
US6646578B1 (en) 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5603012A (en) * 1992-06-30 1997-02-11 Discovision Associates Start code detector
US6195465B1 (en) * 1994-09-21 2001-02-27 Ricoh Company, Ltd. Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US6141446A (en) * 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
EP0956701B1 (en) * 1997-02-03 2005-11-23 Sharp Kabushiki Kaisha An embedded image coder with rate-distortion optimization
US6263109B1 (en) * 1998-09-25 2001-07-17 Hewlett-Packard Company Context-based ordering and coding of transform coefficient bit-planes for embedded bitstreams
US6466698B1 (en) * 1999-03-25 2002-10-15 The United States Of America As Represented By The Secretary Of The Navy Efficient embedded image and video compression system using lifted wavelets
US6625215B1 (en) * 1999-06-07 2003-09-23 Lucent Technologies Inc. Methods and apparatus for context-based inter/intra coding mode selection
AUPQ618500A0 (en) * 2000-03-13 2000-04-06 Canon Kabushiki Kaisha Memory management of compressed images data
AUPQ982400A0 (en) * 2000-09-01 2000-09-28 Canon Kabushiki Kaisha Entropy encoding and decoding
JP2002149153A (ja) * 2000-11-10 2002-05-24 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体
AUPR192800A0 (en) * 2000-12-06 2001-01-04 Canon Kabushiki Kaisha Digital image compression and decompression
JP2002223446A (ja) * 2001-01-26 2002-08-09 Ricoh Co Ltd 画像圧縮装置および画像撮像装置
US6898323B2 (en) * 2001-02-15 2005-05-24 Ricoh Company, Ltd. Memory usage scheme for performing wavelet processing
US7062101B2 (en) * 2001-03-30 2006-06-13 Ricoh Co., Ltd. Method and apparatus for storing bitplanes of coefficients in a reduced size memory
JP2003235042A (ja) * 2002-02-12 2003-08-22 Sony Corp 画像符号化装置及びその符号化方法
JP4003628B2 (ja) * 2002-12-02 2007-11-07 ソニー株式会社 画像符号化装置及び方法、並びにプログラム
JP2004032772A (ja) * 2003-06-23 2004-01-29 Ricoh Co Ltd 画像処理装置
KR20050087956A (ko) * 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
KR100928968B1 (ko) * 2004-12-14 2009-11-26 삼성전자주식회사 영상 부호화 및 복호화장치와 그 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1107608A2 (en) 1999-12-02 2001-06-13 Lucent Technologies Inc. Methods and apparatus for context selection of block transform coefficients
WO2003027940A1 (en) 2001-09-14 2003-04-03 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
US6646578B1 (en) 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method

Also Published As

Publication number Publication date
EP2006839A3 (en) 2009-02-11
MX2007000459A (es) 2007-07-25
CN101015216A (zh) 2007-08-08
EP1774791A1 (en) 2007-04-18
US7656319B2 (en) 2010-02-02
TWI361574B (en) 2012-04-01
CN100584023C (zh) 2010-01-20
AU2004321469A1 (en) 2006-01-19
EP1774791A4 (en) 2007-11-28
TW200620847A (en) 2006-06-16
JP2008506987A (ja) 2008-03-06
JP4842265B2 (ja) 2011-12-21
EP2006839A2 (en) 2008-12-24
BRPI0418954A (pt) 2007-12-04
KR20070040392A (ko) 2007-04-16
AU2004321469B2 (en) 2009-08-20
MY143951A (en) 2011-07-29
US20080094259A1 (en) 2008-04-24
WO2006006936A1 (en) 2006-01-19

Similar Documents

Publication Publication Date Title
KR101050261B1 (ko) 콘텍스트 기반의 신호 엔코딩 및 디코딩
JP5384780B2 (ja) 無損失オーディオ符号化方法、無損失オーディオ符号化装置、無損失オーディオ復号化方法、無損失オーディオ復号化装置及び記録媒体
RU2224302C2 (ru) Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
JP4037271B2 (ja) 信号圧縮装置及び方法
JP2023098967A (ja) スペクトルエンベロープのサンプル値のコンテキストベースエントロピー符号化
US20020009233A1 (en) Color encoding and decoding method
EP1939863A2 (en) Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
KR100736096B1 (ko) 비디오 신호를 그룹별로 인코딩 및 디코딩하는 방법 및장치
CA2703700A1 (en) Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs
KR20050012760A (ko) 라플라스-마르코프 데이터 소스에 대한 엔트로피 제한스칼라 양자화기
Cruz et al. Region of Interest coding in JPEG2000 for interactive client/server applications
US20070071088A1 (en) Method and apparatus for entropy encoding and entropy decoding fine-granularity scalability layer video data
JP3466080B2 (ja) デジタルデータの符号化/復号化方法及び装置
KR100643269B1 (ko) Roi를 지원하는 영상 코딩 방법 및 장치
JP2022536512A (ja) 符号化器及び一連のフレームを符号化する方法
KR20090089304A (ko) 부호화 방법, 복호화 방법, 부호화기, 복호화기 및 컴퓨터 프로그램 제품
KR100989686B1 (ko) 데이터 소스에 의해 생성된 비트 심볼들을 처리하기 위한 방법 및 장치, 컴퓨터 판독가능 매체, 컴퓨터 프로그램 요소
Andreopoulos et al. A hybrid image compression algorithm based on fractal coding and wavelet transform
EP0930788A1 (en) Method and device for compressing and expanding image
KR100319919B1 (ko) 가변 확률모형을 사용한 개선된 산술 부호화기 및/또는 복호화기
Pawadshetty et al. JPEG 2000 region of interest coding methods
KR20100062777A (ko) 스케일러블 비디오 인코딩, 디코딩 방법 및 스케일러블 비디오 인코더, 디코더
KR101075328B1 (ko) 동영상의 복호화 방법 및 장치
Bindulal et al. Object coding using a shape adaptive wavelet transform with scalable WDR method
Singh Wavelet Based Embedded Coding for Images (A novel extension of SPIHT and SPECK)

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee