KR102364942B1

KR102364942B1 - 비트-플래인 코딩

Info

Publication number: KR102364942B1
Application number: KR1020207003863A
Authority: KR
Inventors: 요아힘 카이너트; 토마스 리쓰터; 미구엘 앙게르 마르티네즈 델 아모르; 마누엘 드 프루토스 로페즈; 크리스티안 슈엘; 허버트 토마; 지그프리드 포셀
Original assignee: 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우
Priority date: 2017-07-10
Filing date: 2018-03-12
Publication date: 2022-02-18
Also published as: JP2020527303A; KR20200024318A; US20190045206A1; EP3652944B1; US11457232B2; WO2019011484A1; US20200404307A1; CN110915218A; EP4114007A1; US11438617B2; EP3652944A1; US20200374539A1; US10743014B2; CN110915218B; JP7128580B2

Abstract

코딩된 비트-플래인들의 세트가 예측적으로 데이터스트림에 시그널링되는 계수 그룹들이 두개의 그룹 세트들로 그룹화되는 방법으로 비트-플래인 코딩을 수행하고, 만일 하나의 그룹 세트에 대해, 각 그룹 세트의 모든 계수 그룹들의 코딩된 비트-플래인들의 세트가 비어 있는지 여부, 즉, 각 그룹 세트들 내의 모든 계수들이 비유의한지 여부를 시그널링하는 데이터 스트림에 신호가 사용된다면, 코딩 효율은 향상된다. 다른 양태에 따르면, 상기 각 그룹 세트내에 요청 그룹들을 위한 코딩된 비트-플래인들에 대한 코팅된 예측 잔차가 없음이 시그널링되는 그룹 세트들을 위한 신호에 대해 대안적인 코팅 옵션으로서, 상기 제1 양태에 따른 그룹-세트-별 비유의성 신호를 가진 비트-플래인 코딩을 제공함으로써, 코팅 효율은 향상된다.

Description

비트-플래인 코딩

본 출원은 정리 화상들 및/또는 비디오들의 코딩을 위한 비트-플래인 화상 코딩과 같은 비트-플래인 코딩에 관한 것이다.

비트-플래인 코딩에서, 코딩된 비트-플래인들을 이용 가능한 비트-플래인들의 총량의 일부로 제한함으로써 필요한 코딩양을 감소시키려는 노력이 계속되어 왔다. 대부분, 상기 비트-플래인 코딩은 변환 계수들, 즉 화상의 스펙트럼 분해 변환과 같이 코딩될 실제 데이터의 변환 계수들에 대해 수행된다. 이러한 변환은 전체 신호 에너지를 더 적은 양의 샘플들, 즉 변환 계수들로 이미 "압축"하며, 이용 가능한 비트-플래인들 중에서 최상위 비트-플래인 즉, 각각의 변환 계수에서 0이 아닌 비트를 갖는 최상위 비트-플래인, 의 위치가 관련되는 한, 유사한 통계를 공유하는 인접 변환 계수들을 초래한다. 따라서, 새로 나올 JPEG XS의 현재 구상된 버전에서, 화상을 나타내는 변환 계수들은 변환 계수들의 그룹들의 유닛들에서 신택스(syntax) 요소를 소비하는 상기 데이터 스트림과 함께, 변환 계수 그룹 단위로 코딩되며, 이는 즉, GCLI(greatest coded line index)라고 불리는, 그룹 내 변환 계수들의 비트들로 채워진 최상위 비트-플래인을 가리킨다. 대체 이름들은 MSB 위치(position) 또는 비트 플레인 카운트(bitplane count)이다. 이 GCLI 값은 이웃하는 변환 계수 그룹들로부터의 공간 예측을 사용하는 것과 같은 예측 방식으로 상기 데이터 스트림에 코딩된다. 이러한 GCLI 그룹들은, 차례로, SIG 그룹들로 그룹화되고, GCLI 그룹들의 각각의 이러한 SIG 그룹에 대해, 플래그는 GCLI 값들에 대해 코딩된 예측 잔차가 상기 SIG 그룹내의 모든 상기 GCLI 그룹들에 대해 모두 0인 경우를 시그널링하는 상기 데이터 스트림에서 소비된다. 이러한 플래그가 SIG 그룹 내에서 GCLI에 대한 모든 예측 잔차들이 0이라는 신호를 보내면, GCLI 예측 잔차들이 전송될 필요가 없고, 비트율이 저장된다.

그러나, 예를 들어 압축 및/또는 코딩 복잡성 측면에서 방금 설명한 비트-플래인 개념의 코딩 효율을 개선하려는 요구가 여전히 존재한다.

[1] EP1 162866.2, Decoder for decoding image data from a data stream, encoder for encoding image data into a data stream, and data stream comprising image data and data on greatest coded line index values

[2] intoPIX, "intoPIX Codec Submission for JPEG-XS CfP, Design Description", wg1m73019 [3] AMBROISE RENAUD ; BUYSSCHAERT CHARLES ; PELLEGRIN PASCAL ; ROUVROY GAEL, "Method and Device for display stream compression", EP2773122 A1 [4] AMBROISE RENAUD ; BUYSSCHAERT CHARLES ; PELLEGRIN PASCAL ; ROUVROY GAEL, "Method and Device for Display Stream Compression", US9332258 BB [5] Jean-Baptiste Lorent, "TICO Lightweight Codec Used in IP Networked or in SDI Infrastructure", SMPTE RDD 35:2016 [6] Toshiaki Kojima, "LLVC - Low Latency Video Codec for Network Transfer", SMPTE RDD 34:2015 [7] J. Kim and C. M. Kyung, "A Lossless Embedded Compression Using Significant Bit Truncation for HD Video Coding", IEEE Transactions on Circuits and Systems for Video Technology, 2010

본 발명의 목적은 보다 효율적인 비트-플래인 코딩 개념을 제공하는 것이다. 이 목적은 독립항들의 주제에 의해 이루어된다.

제1 양태에 따르면, 상기 코딩된 비트-플래인들의 세트가 상기 데이터 스트림에 시그널링되는 계수 그룹들이 두개의 그룹 세트들로 그룹화되는 방식으로 비트-플래인 코딩이 수행되는 경우 및 하나의 그룹 세트에 대하여, 각 그룹 세트의 모든 계수 그룹들의 코딩된 비트-플래이들의 세트가 비어있는지 여부, 즉, 각 그룹 세트들 내의 모든 계수들이 비유의적인지 여부를 시그널링하는 데이터 스트림에서 신호가 소비되는 경우에, 코딩 효율이 향상될 수 있다는 것에, 본 출원은 기초한다. 이 측정에 의해, 그럼에도 불구하고, 특정 그룹 세트 내의 모든 계수 그룹들 내의 모든 변환 계수들이 비유의함으로써 압축이 개선되는 경향이 있는 경우에, 특정 그룹 세트 내의 계수 그룹들에 대한 코딩된 비트-플래인 세트를 코딩하기 위해 0이 아닌 예측 잔차들에 대해 불필요한 비트들을 소비하는 것은 회피될 수 있다. 이 외에도, 인코더에 관한 한, 일종의 그룹-세트-방식으로 비유의적 신호화를 사용하여 병렬 구현을 더 용이하게 함으로써, 변환 계수들이 비유의한지 아닌지 여부, 즉 코딩된 비트-플래인들의 세트, 즉 0이 아닌 비트-플래인들,이 모두 양자화 임계값 아래에 있는지의 여부가, 병렬로 된 각 그룹 세트에서, 즉 서로 독립적으로, 결정될 수 있다.

본 출원의 다른 양태에 따르면, 본 명세서의 도입 부분에 논의했던 그룹 세트들에 대한 상기 신호화에 관련한 코딩 옵션 대안으로서, 전술한 제1 양태에 따른 그룹-세트-방식으로(group-set-wise) 비유의적 신호화가 제공되는 경우, 코팅 효율이 향상될 수 있으며, 이는 각 그룹 세트 내에서 요청 그룹들에 대한 코딩된 비트-플래인들에 대한 코딩된 예측 잔차가 없다는 것을 그룹 세트에 대해 시그널링할 수 있는 것에 따른 것이라는 것이 밝혀졌다. 이를 위해, 제2 양태에 따르면, 상기 데이터 스트림은 유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트 및 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보를 제공한다. 상기 그룹 세트들의 제1 서브세트는 "정상적으로" 코딩되는데, 즉, 상기 데이터 스트림은 그러한 그룹 세트의 계수 그룹들의 코딩된 비트-플래인들에 대한 예측 잔차들을 제공하고, 만일 유의적이라면, 상기 코딩된 비트-플래인들 내의 비트들이 상기 데이터 스트림에서 코딩된다. 상기 그룹 세트들의 제2 서브세트에 대해, 상기 데이터 스트림은 상기 유의성 코딩 모드의 표시 또는 사양을 포함한다. 다시 말해서, 이 표시 또는 사양은 상기 그룹 세트들의 제2 서브세트가 어떻게 처리될 것인지, 또는 다르게 말하면, 상기 그룹 세트들의 제2 서브세트의 식별이 어떻게 해석되는지에 대해 상기 디코더에 시그널링한다. 상기 유의성 코딩 모드의 제1 모드는, 이러한 그룹 세트 내의 상기 계수 그룹들에 대한 코딩된 비트-플래인 신호화에 대한 예측 잔차가 0인 해석에 대응한다. 이를 위해, 제1 유의성 코딩 모드 유형에 따르면, 상기 코딩된 비트-플래인 신호화에 대한 상기 예측 잔차 신호화는 상기 그룹 세트들의 제2 서브세트에 대해 단순히 생략된다. 상기 유의성 코딩 모드가 제2 모드인 것으로 표시되면, 상기 제2 서브세트의 그룹 세트들은 비유의한 계수들의 집합들로 취급된다. 이를 위해, 상기 디코더는 그러한 그룹 세트의 각 계수 그룹에 대해, 그 계수들이 비유의하다는 것을 따른다(inherit). 이 제2 양태에 따르면, 상기 인코더에는 두개의 유의성 코딩 모드 옵션들 사이에서 전환할 수 있는 기회가 제공되며, 상기 인코더는 더 높은 코딩 효율을 유도하는 상기 코딩 모드를 자유롭게 선택할 수 있다. 그러나 이 외에도, 어떤 유의성 코딩 모드 옵션이 사용되었는지를 상기 디코더가 알 수 있는 기회를 상기 데이터 스트림에 제공함으로써, 상기 인코더 설계시 상기 인코더 측의 의도된 구현 목적에 더 적합한 상기 유의성 코딩 모드 옵션을 선택할 수 있는 기회를 제공한다. 예를 들어, 더 높은 병렬화를 달성하는데 관심이 높은 경우, 상기 비유의성 신호화 모드, 즉 제2 모드,가 바람직할 수도 있는 반면, 상기 제1 모드는 상기 인코더의 단일-스레드(thread) 구현의 경우에 더 선호될 수도 있다. 즉, 상기 인코더는, 상기 인코더의 구현에 적합하도록 선택된, 두 가지 모드 유형들 중 하나에서만 동작하도록 구현될 수 있다. 유리하게도, 디코더 복잡도는 상기 유의성 코딩 모드의 두 모드 유형들 간에 크게 다르지 않다.

본 출원에 따르면, 디코더 복잡도는 유의성 코딩 모드의 두 모드 유형들 간에 크게 다르지 않으므로, 인코더 설계시 구현 목적에 더 적합한 유의성 코딩 모드 옵션을 선택할 수 있는 기회를 제공한다. 또한, 인코더는 두개의 유의성 코딩 모드 옵션들 사이에서 인코더의 구현에 적합한 모드로 전환할 수 있어 더 높은 코딩 효율을 도모할 수 있으며, 디코더는 데이터 스트림을 통해 어떤 유의성 코딩 모드 옵션이 사용되었는지를 알 수 있다.

도 1은 현재 예상되는 JPEG XS의 디코더 동작을 도시한 블록도;
도 2는 비트-플래인 코딩의 대상, 즉 변환 계수들에 대한 예로서 웨이블릿(wavelet) 변환을 사용하여 화상(12)을 변환 계수들로 분해하는 것을 도시한 개략도;
도 3은 GCLI 델타 코딩에 의해 코딩된 비트-플래인들의 세트의 예측 기반 코딩을 사용하여 계수 그룹들의 단위들로 변환 계수들의 비트-플래인 코딩을 도시하는 개략도;
도 4는 웨이블릿 변환을 구역들(precincts)로 세분한 것을 예시하는 개략도;
도 5는 유의성 코딩 모드를 설명하기 위해 계수 그룹들 중 하나의 그룹 세트 구성을 도시한 개략도;
도 6aa 내지 6bf는 즉 코딩된 비트플래인 시그널링에 대한 제로 예측 잔차를 시그널링하는 코딩 모드인 RSF, 관련 계수들에 대해 모두 0인 비유성을 시그널링하는 코딩 모드인 CSF, 또는 인코더가 그들 사이에서 스위칭하기 위해 두 코딩 모드들이 이용 가능한 경우인 이들의 조합을 사용하는 비트-플래인 코딩에 의해 얻어진 PSNR 시뮬레이션 결과들을 도시함;
도 7은 일실시예에 따른 인코더의 블록도;
도 8은 일실시예에 따른 디코더의 블록도;
도 9는 일실시예에 따른 인코더, 여기서 상기 인코더는 CSF 코딩 모드들을 사용함;
도 10은 도 9의 인코더에 적합한 디코더의 블록도;
도 11은 RSF 코딩 모드 사용을 나타내는 데이터 스트림을 형성하면서 RSF 코딩 모드를 사용하는 인코더의 블록도;
도 12는 CSF 및 RSF 사용 중 하나를 표시하는 방식으로 데이터 스트림 표시를 처리할 수 있는 디코더의 블록도;및
도 13은 RSF 또는 CSF 사용의 표시를 포함하는 상기 데이터 스트림을 형성하는 예를 설명하기 위한 의사코드(pseudocode).

본 출원의 유리한 측면들은 종속항의 주제이다. 본 출원의 바람직한 실시예들은 다음의 도면들과 관련하여 아래에서 설명된다.

본 출원의 실시예들에 대한 다음의 설명은 JPEG XS 표준화 프로세스, 즉 JPEG XS에 대한 현재 논의된 버전의 현재 상태의 간략한 프리젠테이션으로 시작하며, 여기서 이 버전이 어떻게 수정되어 본 출원의 실시예들로 귀결될 수 있는지에 대해 개괄된다. 이후에, 개별적으로 설명된 추가 실시예들을 도출하기 위해, 이들 실시예들이 확대되었지만, 이전에 논의된 특정 세부 사항들에 대한 개별 참조들을 포함한다.

도 1은 본 출원의 실시예들이 후술될 바와 같이 적용될 수 있는 JPEG XS에 대해 현재 예상되는 디코딩 프로세스의 예를 제공한다. 후술하는 확장된 실시예로부터 명백해지는 바와 같이, 본 출원은 이러한 종류의 디코딩 프로세스 및 대응하는 코딩 프로세스로 제한되지 않는다. 그럼에도 불구하고, 도 1은 숙련된 독자가 본 출원의 개념들을 더 잘 이해하도록 도와준다.

도 1에 따르면, 코드 스트림 디코딩은 블록 1에서 신텍스(syntax) 분석 부분, 다수의 블록들(2.1~2.4)로 구성된 엔트로피-디코딩 단계, 블록 3에서의 역 양자화, 블록 4에서의 역 웨이블릿 변환 및 블록 5에서의 역 다중 구성요소 비상관화(decorrelation)로 그룹화된다. 블록 6에서 샘플 값들이 측정되고, DC 오프셋이 추가되며, 그들이 공칭 범위들로 고정된다.

블록 1에서, 상기 디코더는 상기 코드 스트림 신택스를 분석하고, 샘플링 그리드의 레이아웃 및 소위 슬라이스들 및 구역들의 차원(dimension)들에 관한 정보를 검색한다.

그런 다음, 상기 코드 스트림의 엔트로피-코딩된 데이터 세그먼트의 서브 패킷들은 유의적 정보, 신호 정보, MSB 위치 정보(GCLI 정보라고도 함) 및 이 모든 정보를 사용하여 웨이블릿 계수 데이터로 디코딩된다. 이 동작은 도 1의 블록(2.1~2.4)에서 수행된다.

이미지 및 비디오 압축을 위해 일반적으로 엔트로피 코딩을 실행하기 전에 변환을 적용한다. 예를 들어, 선행기술문헌 [7]은 블록-기반 예측을 사용하는 반면, 선행기술문헌 [4], [3], [5], [6]은 웨이블릿 변환들을 지지한다. 웨이블릿은 도 1의 경우에 사용되지만, 다시 도 1은 단지 예로서 역할을 하며, 웨이블릿 변환의 사용에 대해서도 동일하게 적용된다.

이러한 웨이블릿 변환은 도 2에 도시되어 있다. 이미지를 다수의 부대역들로 분해한다. 각각의 부대역은 상기 화상(12)의 공간적 다운 샘플링되고, 부대역-특히 스펙트럼으로 대역통과-필터링된 버전을 나타낸다. 도 2에 도시된 바와 같이, 수평 분해들의 수는 수직 분해들의 수와 다를 수 있다. 각 분해 단계에서, 이전 분해된 저역-통과 서브대역이 추가로 분해된다. 예를 들어, L5 서브대역은 서브 샘플링된 이미지 버전을 나타내고, 다른 서브대역들은 세부-정보를 포함한다.

상기 주파수 변환 후, 상기 서브 대역들의 계수들은 엔트로피-코딩된다. 다시 말해, A,B∈{L, H}, m∈N을 갖는 서브 대역 ABm의 g≥1 계수들은 계수 그룹으로 배열된다. 그런 다음 상기 계수 그룹의 최상위 0이 아닌 비트 플래인에 신호를 보내고, 원시 데이터 비트들이 이어진다. 상기 코딩 기술에 대한 자세한 내용은 다음에 설명한다.

도 3은 신택스 구성요소들로 귀결되는 GCLI 코딩의 원리를 도시하며, 그 신택스 구성요소들의 디코딩은, 예를 들어, 도 1의 블록(2.2)가 참여(attend)한다. 따라서, 상기 GCLI 코딩은 최상위 비트 위치들을 코딩하는 것에 관한 것이며, 따라서 상기 코딩된 비트 플래인들의 표시에 관한 것이다. 이것은 다음과 같은 방식으로 수행된다. 1보다 크고, 주파수 변환이 동일한 서브 대역들에 속하는 계수들의 수가, 하나의 그룹으로 결합되고, 이를 이제부터 계수 그룹이라고 부른다. 예를 들어, 도 2를 참조하라. 여기에 도시된 웨이블릿 변환(10)은 화상(12)의 변환에 대한 예이다. 다시, 웨이블릿 변환은 본 출원의 실시예들이 적용될 수 있는 변환들에 대한 예일 뿐이다. 화상(12)의 샘플들 또는 픽셀들(14)의 값들을 직접 코딩하는 대신, 상기 코딩은 변환(10)의 변환 계수들(16)에 대해 수행된다. 도 3은 계수 그룹이 4개의 계수들로 구성되어 있다고 가정한다. 그러나, 그 수는 단지 예시를 위해 선택된 것이고, 다르게 선택될 수 있다. 도 2는, 예를 들어, 그러한 계수 그룹(18)이 4개의 공간적으로 인접한 변환 계수(16)들을 포함하고, 이들 모두는 변환(10)의 동일한 서브 대역에 속한다는 것을 도시한다. 도 2는 하나의 계수 그룹(18)에 포함된 상기 계수들(16)이 수평적으로 서로 이웃하고 있음을 도시하고 있으나, 이것은 또한 단지 예일 뿐이며 계수(16)들을 계수 그룹들(18)로 그룹화하는 것은 다르게 수행될 수 있다. 도 3은 좌측에 있는 제1 계수 그룹(20) 및 제2 계수 그룹(22)에 대한 각 계수의 비트 표현을 도시한다. 각 계수의 절대값의 비트들은 열을 따라 각 계수에 대해 확산된다. 따라서, 각각 20 및 22에 4개의 열들이 도시되어 있다. 각각의 비트는 특정 비트 플래인에 속하며, 도 3의 가장 낮은(lowest) 비트는 최하위(least significant) 비트 플래인에 속하며, 반면 가장 높은(upper most) 비트들은 최상위(most significant) 비트 플래인에 속한다. 설명을 위해, 8개의 사용 가능한 비트 플래인들이 도 3에 나와 있지만, 숫자는 다를 수 있다. 상기 변환 계수들의 크기 비트들(magnitude bits)(24) 외에, 도 3은 각 계수에 대해 대응하는 크기 비트들 위의 사인(sign) 비트(26)를 도시한다. 상기 GCLI 코딩은 이제 도 3과 관련하여 더 상세히 설명된다.

이미 설명한 바와 같이, 상기 계수들은 사인-크기(sign-magnitude) 표현으로 표시된다. 각 계수 그룹에서 가장 큰 계수는 이 계수 그룹에 대한 활성 비트 플래인들의 수를 결정한다. 비트 플래인 자체 또는 어느 더 높은 비트 플래인(더 큰 숫자를 나타내는 비트 플래인)의 적어도 하나의 계수 비트(24)가 0이 아니면, 상기 비트 플래인은 활성이라고 한다. 활성 비트 플래인들의 수는 소위 GCLI 값, 즉 가장 큰 코딩된 라인 인덱스(coded line index)로 제공된다. 계수 그룹 20의 경우, 예를 들어, 상기 GCLI는 6이고, 제2 계수 그룹(22)의 경우, 상기 GCLI는 예시적으로 7이다. GCLI 값이 0이면 비트 플래인들이 활성화되어 있지 않으므로, 상기 완전한 계수 그룹은 0이 된다는 것을 의미한다. 이 상황은 비유의성 GCLI로 알려져 있으며, 그 반대는 유의성 GCLI로 알려져 있다. 압축을 달성하기 위해, 상기 활성 비트 플래인들만이 비트 스트림에 배치, 즉 코딩된다.

손실 인코딩의 경우, 계수 그룹에 대해 전송되는 비트 플래인들의 수가 상기 GCLI 값보다 작도록 일부 비트 플래인들을 절단할(truncated) 필요가 있다. 이 절단은 소위 GTLI, 즉 가장 큰 트림된(trimmed) 라인 인덱스로 지정된다. 다른 이름은 절단 위치이다. GTLI가 0이면 절단되지 않는 것에 해당한다. GTLI 값이 1이면, 계수 그룹에 대해 전송된 비트 플래인들의 수가 상기 GCLI 값보다 1이 작다는 것을 의미한다. 다시 말하면, 상기 GTLI는 비트 스트림에 포함된 가장 작은 비트 플래인 위치를 정의한다. 단순한 데드 존 양자화 방식(dead zone quantization scheme)의 경우, 전송된 비트 플래인들은 상기 절단된 비트 플래인들이 없는 상기 계수 그룹의 비트 플래인들과 동일하다. 보다 진보된 양자화 방식들의 경우, 계획된 절단된 비트의 일부 정보는 상기 양자화 빈(bin)들을 수정함으로써 상기 전송된 비트 플래인들로 "푸시"될 수 있다. 자세한 내용들은 선행기술문헌 [6]에서 확인할 수 있다.

각 계수에 대해 나머지 비트 플래인들의 수가 상기 GCLI 및 상기 GTLI 값들 사이의 차이와 같기 때문에, GCLI들이 상기 GTLI 값보다 작거나 같은 계수 그룹들이 상기 비트 스트림에 포함되지 않는 것이 분명하다. 다시 말해서, 이들 계수 그룹들에 대한 비트 스트림에는 (데이터)비트들(24)이 전달되지 않는다. 그들의 계수들은 비유의하다(insignificant).

절단 및 양자화 후에 남아 있는 활성 비트 플래인들은 다음의, 또는 대안적으로 말하면, 절단된 GCLI에서 나머지 비트 플래인들이라고 불린다. 게다가, 이하에서는 또한, 상기 GTLI를 절단점이라고도 한다. 상기 나머지 비트 플래인들이 0인 경우, 상기 GCLI는 비유의적(insignificant) 절단된 GCLI로 알려져 있다.

이 나머지 비트 플래인들은 그 후 원시 비트들로서 상기 디코더에 전송된다. 도 1의 블록(2.3)은 상기 비트 스트림으로부터 이들 비트들을 도출하는 책임을 진다. 그러나, 정확한 디코딩을 가능하게 하기 위해, 상기 디코더는 모든 계수 그룹(18)의 GCLI 값을 알아야 한다. 상기 디코더에 또한 시그널링되는 상기 GTLI 값과 함께, 상기 디코더는 상기 비트 스트림에 있는 원시 데이터 비트 플래인들의 수를 추론할 수 있다.

상기 GCLI 값들 자체는 이전 계수 그룹의 GCLI 값과의 차이를 나타내는 가변 길이 코드로 시그널링된다. 이 이전 계수 그룹은 원칙적으로 상기 인코더가 이전에 이미 인코딩한 임의의 계수 그룹일 수 있다. 따라서, 예를 들어, 수평 또는 수직 이웃 그룹일 수 있다. 상기 예측으로부터의 출력은 2개의 계수 그룹들 사이의 잔여 비트 플래인들의 수의 차이이며, 비트 플래인들이 남은 델타(delta remaining bit planes)로 이어진다. 예를 들어, 도 3은 20으로 도시된 좌측 계수 그룹이 코딩 순서에서 계수 그룹(22)보다 우선하고, 그 20에서의 GCLI이 계수 그룹 22의 GCLI에 대한 예측자 역할을 한다고 가정한다. 더 자세한 내용은 후술한다. 상기 계수들은 어떠한 경우에도 상기 비트 스트림에 포함되지 않기 때문에, 상기 GTLI 값 아래에 있는 GCLI 값들은 관심밖이라는 것을 유념하라. 결과적으로, 상기 예측은 상기 GCLI가 상기 GTLI보다 큰지 여부를 상기 디코더가 추정할 수 있는 방식으로 수행되며, 그렇다면 상기 GCLI의 값은 얼마인지를 추정하는 방식으로 수행된다.

아래에 설명된 방법은 다른 비트 스트림 부분들의 전송 순서와 무관하다. 예를 들어, 먼저 상기 비트 스트림에 모든 서브 대역들의 GCLI 계수들을 배치한 후, 모든 서브 대역들의 상기 데이터 비트들을 배치할 수 있다. 대안적으로, GCLI 및 데이터 비트들은 상기 데이터 스트림에서 인터리빙될(interleaved) 수도 있다.

도 2에 도시된 상기 주파수 변환의 계수들은 소위 구역들(precincts)(30)로 구성된다. 이것은 도 4에 도시되어 있다. 이것은 입력 이미지(12)의 주어진 공간 영역(32)에 기여하는 상이한 서브 대역들의 구역 그룹 계수들이다.

상기 디코더가 상기 신호를 복구할 수 있게 하려면, 모든 계수 그룹(18)에 대한 GCLI 값을 알아야 한다. 선행기술문헌 [3]에 따르면, 그것들을 효율적으로 시그널링하기 위해 다른 방법들이 이용 가능하다.

RAW 모드에서는, 상기 GCLI 값들이 예측없이 전송된다.

따라서, F₁은 다음에 인코딩될 계수 그룹이라고 하자. 그런 다음 상기 GCLI 값은 그 값을 나타내는 고정 길이 코드워드(codeword)로 인코딩될 수 있다.

수평 예측에서, 상기 코딩된 심벌은 상기 GCLI 값과 동일한 라인 및 동일한 웨이블릿 서브 대역에 속하면서, GTLI를 고려한, 이전에 코딩된 GCLI의 값 사이의 차이이다. 이 차이 값은 잔차(residual) 또는 다음에서 δ값이라 한다.

F₁과 F₂를 g>1 계수들로 구성된, 두 개의 수평으로 인접한 계수 그룹들이라고 하자. F₂는 현재 코딩될 계수 그룹으로 하자. 다음과 같이 계산된 잔차를 전송함으로써 GCLI(F₂)가 상기 디코더에 시그널링될 수 있다:

상기 디코더는 컴퓨팅을 통해 GCLI(F₂)를 복구한다

수평 예측에서는 일반적으로 GTLI(F₁)=GTLI(F₂)이다. 또한, δ는 선행기술문헌 [4]에 설명된 대로 가변 길이 코드로 전송된다는 점에 유의하라.

두 서브 대역 라인들 사이의 수직 예측에서, 상기 결과는 상기 GCLI 값과 이전에 코딩된 라인의 계수들의 동일한 서브세트의 GCLI 사이의 차이이다.

F₁과 F₂를 g>1 계수들로 구성된 두 개의 수직으로 인접한 계수 그룹들이라고 하자. F₂는 현재 코딩될 계수 그룹으로 하자. 그러면, 수평 예측에서와 동일한 방식으로 GCLI(F₂)가 인코딩될 수 있다.

수직 예측은 슬라이스 내로 제한되며, 이는 사전 정의된 연속 라인들 세트(예: 64 라인들)이다. 이런 식으로, 상기 슬라이스의 첫 번째 구역(precinct)은 수직적으로 예측될 수 없다.

수직 예측의 다른 방법은, 위에서 설명한 예측 대신, 다음 예측 공식이 사용된다:

수직 예측의 또 다른 대안은 소위 경계 코드를 사용하는 것이다.

와

g_i는 인코딩할 GCLI

g_i ^r은 참조로 사용된 GCLI

t_i는 g_i를 적용하기 위한 절단(truncation)

t_i ^r은 g_i ^r에 적용된 절단(truncation)

이러한 코드는 δ≥0의 속성을 가지므로, 효율적인 단항 코딩이 가능하다.

동일한 예측 방법을 적용할 수도 있다.

선행기술문헌 [1]에서, 이스케이프(escape) 코드들은 미리 정의된 절단 임계 값보다 작은 복수의 계수들로 구성된 계수 그룹들의 시퀀스를 시그널링하기 위한 GCLI 코딩에서 사용되었다. 이들 수단들에 의해, 계수 그룹당 코드 워드를 요구하는 대신, 다수의 제로 계수 그룹들이 하나의 이스케이프(escape) 워드로 표현될 수 있기 때문에 코딩 효율이 향상될 수 있다.

이 방법은 유의성 플래그들 측면에서 오버 헤드들을 요구하지 않는 이점이 있지만, 이스케이프 코드를 사용하지 않을 때 필요한 비트들과 비교하여 추가 비트들을 계산하면 약간의 복잡성이 유발된다. 또한 일부 코딩 방법들에서는 이스케이프 코드들을 쉽게 사용할 수 없다.

예를 들어, 도 5를 참조하면, 계수 그룹들(18) 사이에 정의된 코딩 순서(38)와 관련하여 즉시 연속될 수 있는 계수 그룹들(18)을 도시하지만, 이것이 필수적인 것은 아니다. 방금 언급된 이스케이프 코딩에 따르면, 계수 그룹(18)에 대한 상기 데이터 스트림에서 전송된 상기 GCLI 값은, 상기 이스케이프 코드를 가정하여, 그 계수들 및 다수의 후속 계수 그룹들(18)의 상기 계수들이, 함께 그룹 세트(40)를 형성하여, 모두 비유의하다는 것을, 시그널링할 수 있다. 어떤 계수 그룹들(18)이 그룹 세트(40)에 속하는지에 대한 질문은 기본적으로 알려지거나 시그널링될 수 있다. 예를 들어, 연속적인 GCLI 계수 그룹들(18)이 비유의한 절단된(truncated) GCLI 값들을 가질 때, 이들은, 예를 들어, 이러한 수단들에 의해 코딩 효율을 향상시키기 위해 상기 코드 스트림으로부터 폐기될 수 있다. 이 공간 제로 런(spatial zero runs) 방법에서, 이것은 비유의한(insignificant) 상기 그룹 세트(40)의 상기 제1 계수에 대한 이스케이프 값들을 코딩하는 것에 수행된다. 그러나, 방금 언급한 바와 같이, 이러한 코딩 이스케이프 값들을 소비하는 것은 상기 코딩 복잡성을 증가 시키므로, 극도로 낮은 복잡성 경우들에는 적합하지 않다.

선행기술문헌 [1]에서 가르치는 소위 RSF 방법에 따르면, 상기 GCLI 값들을 코딩하는 부담은 도 5의 그룹 세트(40)와 같은 그룹 세트들에 대하여 시그널링함으로써 감소되며, 상기 계수 그룹들(18)의 비유의한 절단된 GCLI 값들은 그룹 세트(40) 내의 모든 이들에 대해 0과 동일한 잔차로 이어지는 기준 GCLI 값들로부터 예측된다. 이를 위해, 상기 계수 그룹들(18)은 그룹 세트들(40)로 그룹화되고, 상기 데이터 스트림은 각 그룹 세트(40)에 대해, 상기 GCLI의 예측 전차들이 모두 그룹 세트(40) 내에서 0인지를 알려주는 RSF 플래그를 포함하며, 이러한 경우, 자연적으로, 예측 전차들은 상기 데이터 스트림에서 전송될 필요가 없다. 그러나 RSF는 해당 잔차들이 0이 아닌 경우, 비유의한 GCLI들의 코딩을 스킵하지 않는다.

집합 40의 GCLI들에 대한 예측 잔차들은 0이 아닌 반면, 절단(truncation)으로 인해, 각 그룹 세트(40) 내의 모든 계수 그룹들(18)의 모든 계수들은 비유의적(insignificant)일 수 있다.

아래에 설명된 실시예들은 RSF의 해석을 수정함으로써 상기 코드 스트림으로부터 비유의한 절단된 GCLI들을 삭제할 수 있는 기회를 제공하여, 낮은 복잡성에서 방금 설명한 RSF 방법에 상보적일 수 있다.

이에 대해서는 다음에서 더 자세히 설명한다.

선행기술문헌 [1]에서 논의된 RSF 방법에서, GCLI 계수들은 이후부터는 SIG 그룹들이라 불리는 각 서브 대역 내부의 그룹들로 배열된다. 도 5의 요소(40)는, 예를 들어, 그러한 SIG 그룹이다. SIG 그룹 크기는 8이거나 1보다 큰 임의의 다른 수일 수 있다. 즉, SIG 그룹(40)은 둘 이상의 계수 그룹들(18)을 포함할 수 있다. 한편, 하나의 SIG 그룹(40)에 의해 구성된 계수 그룹들(18)은, 방금 설명한 바와 같이, 상기 전환(10)의 하나의 서브 대역에 속할 수 있으나, 이것이 필수적인 것은 아니다. 상기 서브 대역이 8과 같은 SIG 그룹 크기의 배수가 아닌 경우, 마지막 계수들은 불완전한 그룹으로 취급될 수 있다.

구역(30)에 대한 상기 코드 스트림의 시작에서, 예를 들어, 일련의 플래그들이 시그널링된다. 각 플래그는 상기 구역 내 각 SIG 그룹(40)에 해당한다. 상기 플래그가 설정되면, 이는, 해당 그룹(40)에 대응하는 모든 GCLI 잔차들이 0이므로, 상기 코드 스트림에 존재하지 않음을 의미한다.

앞에서 언급했듯이 SIG 그룹의 상기 GCLI들이 완전히 절단된 경우(또는 단순히 0), 그들의 잔차들이 0이 아닌 상황들이 있다. 예를 들어, 상기 GCLI들이 유의한 행 또는 열로부터 수직으로 예측되는 경우에 발생할 수 있다. 여기서, RSF는 그들의 잔차들이 시그널링되는 것을 방지하는데 성공하지 못하는데, 예를 들어, 실제로 0과 상이한 잔차들은 단항 코딩을 위해 더 많은 예산을 요구한다는 점에서 유리할 수 있다.

따라서, 계수 유의성 플래그들(CSF)은 RSF 대신에 본 출원의 실시예에 따라 사용되어, RSF의 정의를 더 확장시키는 것을 목표로 한다. 새로운 GCLI 코딩 방법을 도입함으로써, CSF는 또한 모든 SIG 그룹(40)에 하나의 플래그를 전용하지만, 이들은 상기 SIG 그룹(40)의 계수 그룹들(18)의 GCLI가 절단 후에 모두 비유의로 될 때마다, 즉 이들 계수 그룹들(18)에 대한 코딩된 비트 플래인들의 세트가 비어 있을 때마다 설정된다. 따라서 RSF와 동일한 양의 플래그들이 필요하다. 후술되는 바와 같이, CSF 코딩은, 예를 들어, 구역(30)마다 또는 서브 대역마다 선택될 수 있도록 대안적인 코딩 옵션들에 따라 모두 사용될 수 있다는 점에서 RSF 코딩과 결합될 수 있다. 여기서, 상기 데이터 스트림에서의 동일한 플래그들은 상기 데이터 스트림에서의 몇개의 추가적인 신호화에 따라 RSF 또는 CSF로 해석된다.

SIG 그룹	0				1				2				3
예측기 GCLIs	6	2	5	7	5	6	5	8	4	5	2	5	5	6	6	7
GCLI 값	5	4	2	3	5	6	5	8	0	0	0	2	5	5	6	8
절단된 GCLIs (GTLI = 5)	0	0	0	0	0	1	0	3	0	0	0	0	0	0	1	3
잔차	-1	0	0	-2	0	0	0	0	0	0	0	0	0	-1	0	1
RSF	0				1				1				0
CSF	1				0				1				0

표 1은 4개의 예시적인 SIG 그룹들의 예와 이러한 SIG 그룹들에 대해 RSF 및 CSF가 어떻게 설정되는지 표시를 나타낸다.

표 1은 CSF 및 RSF 방법의 예와 비교를 보여준다. SIG 그룹 0의 경우, 상기 절단된 GCLI 값들이 모두 0이기 때문에, CSF가 선택되는 반면, RSF 플래그는 상기 잔차들이 0이 아니면 선택되지 않는다. SIG 그룹 1의 경우 상황이 반대이다. SIG 그룹 2의 경우, GCLI와 잔차가 모두 0이므로, CSF도 1이고 RSF도 1이 된다. 마지막으로, SIG 그룹 3에서는 RSF와 CSF가 모두 선택되지 않는데, 즉 RSF와 CSF가 0으로 설정된다.

이하에서, 상기 CSF 변형이 추가로 논의된다.

예를 들어, 상기 CSF 플래그들의 사용은 SIG 그룹당 예산 절약이 달성될 수 있다는 데 영향을 미친다.

단항 코딩을 위한 알파벳들은 일반적으로 잔차 값 0을 시그널링하기 위해 1 비트를 사용한다. 따라서, RSF에 의해 절약된 예산은 항상 삭제된 모든 SIG 그룹에 대해 동일하며, 상기 그룹의 크기와 정확히 같다. 반면, 이 방법에 의해 도입된 상기 예산 오버헤드(overhead)는 상기 이미지를 통해 일정하며, 항상 필요한 RSF의 양과 같다.

CSF와 관련하여, 상기 예산 오버헤드는 RSF와 정확히 동일하다. 그러나, 반대로, SIG 그룹당 최대 예산 절약은 RSF보다 크거나 같다. 실제로 CSF에 의해 제거된 잔차들은 0과 같거나 다를 수 있으므로, 그들의 예산이 상기 그룹의 크기보다 크거나 같을 수 있다.

RSF는 예측에 투명하게 사용될 수 있지만, 그것이 후-처리(엔코더에서) 또는 전처리(디코더에서)인 경우, CSF에 대하여 디코더 및 인코더에서의 예측 모듈들은 약간 수정된다.

상기 인코더에서, SIG 그룹에 비유의한 절단된 GCLI들만 포함되어 있다고 발견될 때마다, 해당 코딩을 완전히 스킵할 수 있다. 그러나, 상기 잔차들에 의해 절약된 비트량을 얻기 위해서는 예산 계산이 더 많은 계산들을 수행해야 한다. 상기 디코더에서, CSF를 갖는 그들의 삭제된 GCLI들의 역 예측도 스킵하고, 대신 0으로 대체될 수 있다.

이하에서는, 방금 설명한 CSF를 이용한 화상 코딩에 대하여 보다 상세하게 설명한다. 이를 위해, 일부 함수 정의들은 다음과 같이 사용된다.

α를 인코딩될 계수 그룹이라고 하자. 그 때

GCLI(α): GCLI 값 계수 그룹 a를 반환함(return)

PREF(α): 계수 그룹 α의 GCLI 값을 예측하는 데 사용되는 계수 그룹을 반환함

GTLI(α): 계수 그룹 α에 적용할 GTLI 값을 반환함. 따라서 GTLI(α)는 그룹 α의 구역과 서브 대역에 의존함

PRED(g _α , t _α , g _b , t _b ): 각각의 GTLIs t_α 및 t_b와 함께, 기준 GCLI g_b를 사용하여 GCLI g_α의 예측에 대응하는 잔차를 반환함

PRED ^-1 (δ, t _α , g _b , t _b ): 각각의 GTLIs t_α 및 t_b와 함께, 기준 GCLI g_b, 잔차 δ를 사용하여 계수 그룹에 해당하는 역 예측을 반환함

SIZE(s): 한 줄의 서브 대역들에서의 계수 그룹들의 수

SIGGRP(α): 계수 그룹 α이 속한 SIG 그룹의 인덱스를 반환함

CSF(g): CSF 플래그가 SIG 그룹 g와 연관되어 있는지 여부를 반환함. True는 상기 그룹이 비유의함을 의미함

RSF(g): RSF 플래그가 SIG 그룹 g와 연관되어 있는지 여부를 반환함. True는 상기 그룹이 비유의함을 의미함

SIGSIZE(s): 서브 대역마다 다를 수 있는 SIG 그룹 크기

CSF 관리를 위한 의사코드는 다음과 같이 제공된다.

서브 대역의 GCLI 값들의 디코딩은 다음과 같이 수행된다.

CSF를 사용할 때, 상기 디코더는 다음과 같이 설명될 수 있다. 서브 대역 s의 경우, 계수 그룹 a_i에 대한 GCLI(a_i) 값들의 세트는 다음과 같이 디코딩된다:

상기 서브 대역의 GCLI 값들의 인코딩은 다음과 같이 수행된다.

다음과 같이 SIG 그룹의 모든 GCLI들이 비유의하게 되는 GTLI를 정의하라.

즉, 상기 그룹의 최대 GCLI 값이다. 따라서, 서브 대역 s의 계수 그룹들 a_i의 인코딩은 다음과 같이 수행될 수 있다:

이에 비교하여, RSF 관리를 위한 의사코드가 레퍼런스로 아래에 제공된다.

먼저, 서브 대역의 GCLI 값들의 디코딩이 검사된다.

RSF를 사용할 때, 상기 디코더는 다음과 같이 설명될 수 있다. 서브 대역 s에 대해, 계수 그룹들(a_i)에 대한 GCLI(a_i)값들의 세트는 다음과 같이 디코딩된다 :

RSF를 사용하는 경우 서브 대역의 GCLI 값들의 인코딩은 다음과 같다.

다음과 같이, SIG 그룹의 모든 잔차들이 비유의하게 되는 GTLI를 정의하라.

따라서, 서브 대역 s의 계수 그룹들 a_j의 인코딩은 다음과 같이 수행될 수 있다 :

계수 및 잔차 유의 플래그들 간의 스위칭이 지원될 수 있다. 전술한 바와 같이, 계수 유의성 플래그들은, 예측 잔차들이 0이 아닌 경우에도, 양자화 후 0인 일련의 계수 그룹들(소위 SIG 그룹이라고 함)의 존재를 나타낼 수 있다. SIG 그룹을 나타내는 유의성 정보 또는 유의성 플래그를 대응하여 설정함으로써, 예측 잔차를 나타내는 코드 워드들을 비트 스트림으로 배치하는 것을 피할 수 있고, 따라서 코딩 효율을 증가시킨다.

한편, 잔차 유의성 플래그들은, 0인 모든 예측 잔차들을 갖는 양자화된 SIG 그룹의 존재를 시그널링한다. 다시 말해, SIG 그룹의 모든 양자화된 계수들이 그들의 예측값과 동일한 값(0과 다를 수 있음)을 갖는 경우, 상기 SIG 그룹에 대응하는 유의 비트(들)가 적절하게 설정되었을 때, 상기 0인 예측 잔차들은 상기 비트 스트림에 배치될 필요가 없다.

이를 위해, 모든 구역(또는 심지어 모든 서브 대역)의 상기 비트 스트림은 두 개의 유의 플래그들 중 어느 것이 선택되는지를 시그널링한다. 이러한 수단들로, 상기 인코더는 모든 구역 또는 모든 서브 대역에 대해 최상의 대안을 선택하여, 아래 설명된대로 일부 코딩 게인(gain)을 제공할 수 있다.

도 6aa 내지 6bf는 위에 제시된 상기 코딩 프레임워크를 사용하여, 즉 RSF 코딩, CSF 코딩 또는 두 코딩 모드들 사이의 스위칭을 허용하는 변형과 결합된 상기 GCLI 코딩을 사용하여, 얻은 PSNR 결과들을 제시한다. 도 6aa 내지 6af은 RGB 444 8 비트의 코딩을 나타내는데, 즉 RSF/CSF 전환가능성(switchability)에 대해 서로 다른 bpp(픽셀 당 비트) 제약 조건에서 PSNR 최적화, RSF 전용, CSF 전용 및 RSF/CSF 스위칭을 각각 비교하면서 4bpp의 비트율 제약 조건에서 시각적 최적화, RSF 전용, CSF 전용 및 RSF/CSF 스위칭을 각각 비교하면서 6bbp의 비트율 제약 조건에서 PSNR 최적화, RSF 전용, CSF 전용 및 RSF/CSF 스위칭을 각각 비교하면서 12bbp의 비트율 제약 조건에서 PSNR 최적화, RSF 전용, CSF 전용 및 RSF/CSF 스위칭을 각각 비교하면서 4bbp의 비트율 제약 조건에서 시각적 최적화, 및 RSF 전용, CSF 전용 및 RSF/CSF 스위칭을 각각 비교하면서 12bbp의 비트율 제약 조건에서 시각적 최적화를 나타낸다. 헤드 라인들에 표시된 것과 유사한 시뮬레이션 결과들을 RGB 444 10 비트 코팅의 경우, 도 6ag 내지 도 6aj에 나타내었고, YUV 422 10 비트 코딩의 경우 도 6ak 내지 6an에 나타내었다. 다중 생성 최대 PSNR 및 평균 PSNR 결과들은 도 6ao 내지 6bf에 표시되었는데, 즉 도 6ao 내지 6at에 RGB 444 8 비트, 도 6au 내지 6az에 RGB 444 10 비트 및 도 6ba 내지 도 6bf에 YUV 422 10 비트를 표시하였다.

이하에서, CSF 및 RSF와 관련하여 일부 복잡성 측면이 논의된다. 그러나, 그 전에, 도 7과 관련하여 인코더 구조가 제시된다. 상기 인코더는 앞서 논의된 웨이블릿 변환(10)을 시작점으로서 사용하는 방식으로 참조 부호 50을 사용하여 도 7에 도시되어 있다. 상기 웨이블릿 변환(10)은 도 7에 도시되지 않은 변압기에 의한 웨이블릿 변환에 의해 획득되었을 수 있다. 상기 웨이블릿 변환(10)을 인코딩하기 위해, 인코더(50)는 계수 그룹(18) 당 최대 코딩된 라인 인덱스를 결정하는 GCLI-추출기(52)를 포함한다. 상기 인코더(50)는, 예를 들어, 구역-방식(precinct-wise)으로 작동하며 특정 비트율 제한을 충족시키려고 한다. 상기 GCLI 추출기(52)는 상기 결정된 GCLI 값들을 GCLI 버퍼(54) 및 run/GTLI 모듈(56)에 공급한다. 모듈(56)은 유의적 그룹의 모든 계수 그룹들이 0으로 절단되도록 하는 가장 작은 GTLI를 계산한다. 자세한 내용은 아래에 설명되어 있다. 모듈(56)은 GCLI 값들 및 비유의적 유의적 그룹으로 이어지는 가장 작은 GTLI를, GTLI 후보값 당 비트 예산을 계산하는 후속 예산 컴퓨터(58)로 전달한다. 이를 위해, 모듈(58)은, 변환 계수 라인들이 코딩 순서에서 다음으로 작동될 수 있도록, 버퍼(60) 내의 이전 변환 계수 라인의 GCLI 값들에 엑세스하고 업데이트된다. 정확한 예산은 이전에 사용할 수 없었던 이전 구역의 GTLI에 의존하기 때문에, 모듈 58은 GTLI 후보 당 비트 예산들의 초기 근사값만 계산한다. 보다 정확하게는, 상기 예산 컴퓨터(58)는 현재 구역의 변환 계수들의 라인에서 동작한다. 상기 GCLI 버퍼(54)에 연결된 구역 예산 업데이터(62)는 구역 예산 업데이트를 제공한다. 상기 이전 예산 근사값과 상기 실제 비트 예산 사이의 편차를 수정한다. 이를 위해, 모듈(62)은 모듈(64)에 의해 다음에 인코딩하는 구역에서 작동하여, 이는 상기 이전 구역의 GTLI를 이미 이용 가능하게 한다. 컴퓨터(58)에 의해 결정된 구역 예산 업데이트 및 예산 값들에 기초하여, 상기 RA 모듈(63)은 전술한 비트율 제약을 충족시키기 위해 다음에 인코딩하는 구역에 효과적으로 적용하는 GTLI 값을 계산한다. 또한, 이 GTLI 값은, 상기 GCLI 버퍼(54)로부터 상기 GCLI 값들을 수신하는, GCLI 코더(64)에 대한 입력으로서 제공된다. 상기 GCLI 코더(64)는 이전 라인 GCLI 버퍼(60)의 형태로 GCLI 값들의 이전 라인들에 액세스하고, 레지스터(66)에 의해 상기 이전 라인의 GTLI에 엑세스한다. GCLI 코더(64)는 상술한 바와 같이 GCLI 값을 상세하게 코딩하여, 버퍼(68)로 출력한다. 상기 변환(10)의 계수들은 또한 버퍼(70)에서 버퍼링되고, 버퍼(68)에서 코딩된 GCLI 값들에 의해 상기 데이터 스트림에서 시그널링되는 바와 같이 코딩된 비트 플래인들에 있는 그 비트들은, 계수 인코더 72를 통해 상기 데이터 스트림에 삽입된다. 전술한 바와 같이, 이는 상기 비트들을 원시 데이터로서 상기 데이터 스트림에 배치하는 형태로 수행될 수 있다. 패커(packer)(74)는 상기 코딩된 GCLI 데이터 및 상기 미가공 데이터 비트를 상기 데이터 스트림에 패키징한다.

강조된 도 7의 블록들, 즉 56, 58 및 64는 2개의 상이한 유형들의 유의성 플래그들, 즉 RSF 및 CSF의 사용에 관한 것이다. 참고용으로 그 내용이 본 명세서에 포함된 선행기술문헌 [1]에서 더 설명되는 바와 같이, 상기 웨이블릿 변환(10)의 상기 웨이블릿 계수들은 인코더(72)에 의한 이후의 데이터 코딩을 위해 상기 계수 버퍼(70)에 저장된다. 선행기술문헌 [1]에서 설명된 바와 같이, 상기 GCLI 추출기(52)는 상기 GCLI 값을 결정하고, 이를 버퍼(54)에 저장한다.

상기 두개의 다른 시그플래그들(sigflags) 방법들을 결합하려면, 모듈 56과 같이 유의성 그룹별로 다음 값들을 계산해야 한다:

ㆍg _j 는 GCLI j임

ㆍt _j 는 GCLI g _j 에 적용하는 양자화/절단

ㆍg _i ^r 은 g _j 예측에 사용되는 기준 GCLI(즉, 수평 또는 수직하는 이웃)

ㆍt _j ^r 은 GCLI g _j 에 적용하는 양자화/절단

ㆍPRED는 t 및 t _j ^r 을 사용하여 g _i ^r 로부터 값 g _j 를 예측하는 예측함수

ㆍs _sig 는 현재 처리된 유의성 그룹

t _i ^RSF 가 선행기술문헌 [2]에서 사용된 것과 동일한 값인 경우, 그 복잡성은 더 이상 논의하지 않는다. t _i ^CSF 의 계산은, 비교기(<= 5 LUTs)와 서브 대역당 4 비트의 하나의 레지스터를 사용하여, 할 수 있다. 또한 상기 GCLI 값들을 하나의 유의성 그룹으로 지연시킴으로써 초기 예산 계산을 단순화한다. 하나의 수직 웨이블릿 분해 레벨(3ㆍ8 서브 대역들)의 경우, 3ㆍ8ㆍ8ㆍ4 = 768 비트들이 필요하다. Xilinx의 경우, 이는 2ㆍ48 = 96 LUTs, 또는 Altera 장치들의 경우 2 MLAB 블록들에 해당한다.

상기 GCLI 코더에는 또 다른 약간의 수정이 필요하다. 상기 잔차 유의성 플래그들(선행기술문헌 [1]에서와 같이) 만을 사용하는 경우, s _sig 예측 잔차들은 그것들이 모두 0인지를 결정하기 위해 그것들을 인코딩하기 전에 버퍼링되어야 한다. 이것은 상기 예측 잔차들을 출력하거나, 상기 SIG 그룹을 상기 유의성 플래그들에 의해 비유의한 것으로 시그널링할 수 있게 한다. t _i ^CSF 를 사용할 때, 상기 코더는 또한 인코딩할 모든 GCLI g _i 가 모두 선택된 양자화/절단 파라미터 t _i 아래에 있는지를 확인해야 한다. 그러나 이것은 사소한 것이며, 추가 버퍼링이 필요하지 않다.

계수 유의성 플래그들에 대한 예산 절감 계산은 다음과 같이 수행된다.

계수 유의성 플래그를 사용하여 유의성 그룹이 비유의한 것으로 시그널링될 때마다, 도 7의 상기 예산 계산 모듈은 상기 예측 잔차들을 상기 비트 스트림에 배치하지 않음으로써 절약된 비트들의 수를 추적할 필요가 있다.

따라서 두 방법들의 전체 예산은 다음과 같이 계산할 수 있다.

ㆍ유의성 플래그들 없이 예산 계산

ㆍ상기 잔차 유의성 플래그들에 대한 예산 절감 계산

ㆍ상기 계수 유의성 플래그들에 대한 예산 절감 계산

이는 두 가지 방법들을 모두 사용하여 복잡성이 증가하면 아래에 설명된대로 추가 예산 절약을 계산하는 것 만으로 구성된다는 것을 의미한다.

위에서 논의된 첫 번째 옵션에 따른 수직 예측이 적용된다고 가정하자.

이 예측 방법에는 다음 방정식들이 사용된다.

(1)

전류 및 기준 GTLI t _i 및 t _i-1 가 모두 동일한 경우, 식(1)은 다음으로 단순화된다.

(2)

예산 절약은 t _i ≥t _i ^CSF ≥g _i 에 대해서만 발생할 수 있다는 것을 알고, 식(1)로부터 다음의 식을 얻을 수 있다:

따라서 상기 예산 절감은 g _i-1 및 t _i ^CSF 와 및 매개 변수 t _i-1 및 t _i 에 고유하게 의존하므로, 쉽게 계산할 수 있다.

상기 두 번째 수직 예측 옵션이 적용되면, 다음 방정식들이 사용된다.

(3)

상기 전류 및 기준 GTLI t _i 및 t _i-1 가 모두 동일한 경우, 식(1)은 다음으로 단순화된다.

(4)

상기 예산 절약은 t _i ≥t _i ^CSF ≥g _i 에 대해서만 발생할 수 있다는 것을 알고, 식(3)으로부터 다음의 식을 얻을 수 있다:

대응하는 디코딩 구조가 도 8에 도시되어 있다. 도 8의 상기 디코더는 참조 부호(80)를 사용하여 일반적으로 표시된다. 입력 디멀티플렉서(demultiplexer)(82)는 상기 데이터 스트림을 수신하고, 그로부터 상기 코딩된 비트 플래인들 내의 상기 코딩된 계수 비트들(즉 84)을 도출하고, GCLI 잔차들(86)을 도출하고 및 RSF 또는 CSF(즉 88)일 수 있는 플래그들을 도출한다. 상기 비트들(84)은 상기 데이터 버퍼(90)에 저장되고, 상기 GCLI 잔차 값들은 GCLI 버퍼(92)에 저장되고, 상기 플래그들(88)은 버퍼(94)에 저장된다. 도 8에 도시된 바와 같이, 버퍼(92)에 저장된 상기 GCLI 잔차 값들은 단항 코딩되거나 또는 원시 데이터로서 코딩될 수 있고, 이에 따라, 원시 디코더(96) 또는 단항 디코더(98)는 상기 GCLI 잔차 값들을 디코딩하는데 사용된다. 서브 대역 GCLI 버퍼(100)는 선택적으로, 디코더(96) 및 디코더(98)에 각각 액세스할 수 있다. GCLI 패커(102)를 통해, 역 GCLI 예측기(104)는 상기 GCLI 잔차들을 수신하고, 이전 GCLI(106) 및 상기 RSF 플래그에 기초하여 상기 GCLI 값들을 재구성한다: RSF가 적용되고 현재 GCLI에 대한 상기 RSF 플래그가 설정되면, 역 예측기(104)에는 어쨌든 0인 상기 예측 잔차, 즉 상기 GCLI 잔차가 통지된다. 이전 GCLI(106)에 기초하여 결정된 상기 예측기는 그후 현재 GCLI로서 사용된다. 상기 역 예측기(104)는 상기 결정된 GCLI를 출력하고, 멀티플렉서는 현재 GCLI에 적용되는 CSF 플래그에 따라 이 예측 출력 또는 제로 대체를 선택한다: 상기 CSF 플래그가 설정되면, 어쨌든 상기 대응하는 SIG 그룹 내에는 코딩된 비트 플레인이 없고, 상기 GCLI는 그에 따라, 즉 0 또는 현재 GTLI를 고려하여 비유의한 변환 계수들 코딩으로 이어지는 어떤 값으로 설정된다. 언패커 제어기(unpacker controller)(110)는 상기 멀티플렉서(108)의 출력을 수신하고, 이 멀티플렉서(108)의 출력은 차례로 이전 GCLI로서 상기 역 예측기(104)로 또한 피드백되고, 상기 현재 GCLI에 기초하여 데이터 버퍼(90)으로부터 상기 현재 계수 그룹에 대하여 코딩된 비프 플래인들의 계수 비트들을 검색하는 언패커(112)를 차례로 제어한다. 상기 언패커(112)의 출력에서, 상기 각각의 변환 계수들이 생성된다.

따라서, 도 8은 디코더의 블록도를 도시하고, 특히 선행기술문헌 [1]에 더하여 두가지 유의성 플래그 타입들을 모두 지원할 수 있는 확장을 도시한다. 완전성을 위해, 도 8은 선행기술문헌 [1]과 비교하여 추가적인 GCLI 패커(102)를 도시한다는 점에 유의해야 한다.

구역(또는 서브 대역)이 잔차 유의성 플래그들로 인코딩된 경우, 상기 역 예측기(predictor)는 상기 GCLI 패커(102)로부터 그것들을 판독하는 대신에 예측 잔차를 단순히 0으로 가정한다. 상기 계수 유의성 플래그들을 사용할 때, 상기 역 예측기(104)는 동일한 작업을 정확히 수행한다. 그러나 이 예측 결과를 사용하는 대신, 상기 값은 단순히 0값으로 대체된다. 따라서, 두 플래그 유형들을 모두 처리하기 위해, 도 8의 상기 디코더는 4 비트 MUX2 요소, 즉 108을 포함하고, 이는 상기 유의성 플래그 버퍼(94)의 출력 및 사용된 유의성 플래그의 유형에 의해 제어된다. 따라서, 상기 디코더에 관한 한 로직의 증가는 무시할 만하다.

상기 현재 예상되는 JPEG XS 버전의 확장 또는 수정으로서 본 출원의 특정 실시예들을 기술한 후에, 디코더 및 인코더 및 데이터 스트림에 대한 추가 실시예들을 전술한 실시예들을 일종의 일반화로서 설명한다. 도 9는 인코더(100)를 도시한다. 상기 도 9의 인코더는 변환 계수들(16)을 데이터 스트림(102)으로 인코딩하기 위한 것이다. 상술한 바와 같이, 상기 변환 계수들(16)은 화상 변환의 변환 계수들일 수 있다. 변환 계수들(16)은 화상의 스펙트럼 분해의 복수의 서브-부분들 중 하나의 서브-부분을 형성할 수 있고, 상기 인코더(100)는 서브-부분 기초마다 인코딩을 수행하도록 구성될 수 있다. 이러한 서브-부분은 웨이블릿 변환의 서브 대역와 같은 서브 대역, 또는 구역에 대응하는 영역(32)과 같이 상기 화상이 세분화된 공간 영역들의 대응하는 공간 영역에 관한 변환 계수들의 그룹들일 수 있다. 상기 변환 계수들(16)은 또한, 예를 들어, DCT 등과 같은 다른 변환의 계수들일 수 있음이 명백해야 한다. 상기 변환 계수들은 계수 그룹들(18)으로 그룹화된다. 그룹(18) 당 계수들(16)의 수는, 전술한 바와 같이, 1보다 큰 임의의 수일 수 있고, 도 9에 도시된 4로 제한되지 않는다. 계수들(16)을 그룹들(18)로 그룹화하는 것은, 하나의 그룹(18)에 속하는 계수들(16)이 동일한 서브 대역에 속하도록 하는 방식으로 수행될 수 있다. 웨이블릿 변환의 경우, 하나의 그룹(18)에 속하는 계수들(16)은, 예를 들어, 하나의 서브 대역의 공간적 이웃들일 수 있고, 변환 계수들(16)이 DCT 계수들인 경우, 그룹(18)은 화상의 공간적으로 인접한 영역들로부터 획득된 상이한 DCT 변환 블록들로부터 유래된 계수들(16)로 구성될 수 있고, 이는 이들 DCT 변환 블록들 내의 하나의 주파수 성분 또는 계수에 대응하는 하나의 그룹의 계수들이다. 특히, DCT 변환의 경우, 화상은 블록 단위로 동일한 크기의 DCT 변환 블록들로 변환될 수 있으며, 각 계수 위치는 별도의 서브 대역를 나타낼 것이다. 예를 들어, 이들 DCT 변환 블록들의 모든 DC 계수들은 상기 DC 서브 대역, 다른 서브 대역의 오른쪽의 계수들 등을 나타낼 것이다. 그룹들(18)은 그 후 상기 화상의 이웃 블록들로부터 획득된 DCT 변환 블록들의 하나의 서브 대역의 계수들을 수집할 수 있다.

상기 계수 그룹들(16)은 차례로 그룹 세트들(40)로 그룹화된다. 이는 상이한 서브 대역들의 계수들을 혼합하지 않는 방식으로 수행될 수 있다. 또한, 하나의 그룹 세트(40) 내의 계수 그룹들(18)의 계수들(16)은 모두 동일한 서브 대역로부터 유래할 수 있다.

도 9의 상기 인코더(100)는 유의성 코딩 모드가 사용되지 않을 그룹 세트들(40)의 제1 서브세트, 즉 GCLI 잔차들이 코딩되는 그룹 세트들(40), 및 상기 유의성 코딩 모드가 사용되는 그룹 세트들의 제2 서브세트, 즉 GCLI 잔차가 코딩되지 않는 그룹 세트들(40)을 식별하는 정보(104)를 상기 데이터 스트림(102)에 삽입한다. 전술한 설명에서, 하나의 CSF 플래그는 정보(104)를 형성하기 위해 각 그룹 세트(40)에 대한 데이터 스트림(102)에 삽입된다. 상기 그룹 세트들(40)의 제1 서브세트는, CSF가 0이거나 설정되지 않은 그룹 세트들(40)인 반면, 제2 서브세트는 CSF가 1인 그들의 그룹 세트들(40)을 포함한다. 현재 그룹 세트(40)에 대한 정보(104)를 설정하기 위해, 인코더(100)는 그룹 세트(40) 내의 모든 변환 계수들(16)이 비유의한지, 즉 0으로 양자화되는지를 검사한다(106). 인코더(100)는 하나 이상의 절단된 최하위 비트 플래인들의 세트를 나타내는 절단 정보(108)를 데이터 스트림(102)에 삽입할 수 있다. 위에서 논의된 상기 GTLI 값은 정보(108)의 일부를 형성할 수 있다. 상기 GTLI(108)는 전술한 서브 부분들로 세분화하여, 예를 들어, 즉 구역마다, 예를 들어, 또는 서브 대역들 단위들 또는 계수 그룹 열들 단위들에서와 같은 다른 레벨에서, 데이터 스트림(102)으로 전송될 수 있다. 한 측면으로서, 상기 계수 그룹들(18)은, 도면들에 예시적으로 도시된 것 외에, 상기 계수 열들(41)에 대해 기울어진 방향을 따라 서로 이웃하는 계수들(16)을 수집할 수 있음에 유의한다. 상기 정보(118)가 상기 예측 잔차들을 제공하는 GCLI 값들은, 데이터 스트림 (102)에 코딩될 최상위 비트 플래인을 상기 GTLI에 대한 인덱스로서 나타낼 수 있으며, 이는 결국 상기 크기(magnitude) 비트들(24)이 절단될 수 있는 곳까지 최하위 비트 플래인들 중에서 최상위 비트 플래인을 인덱싱할 수 있다. 현재 그룹 세트(40) 내의 모든 그룹들(18)의 모든 계수들이 0이면, 이 그룹 세트(40)에 대한 상기 CSF 플래그는 110에서 설정되고, 그렇지 않으면 112에 도시된 바와 같이 설정되지 않는다. 설정되지 않으면, 인코더(100)는, 예를 들어, 이웃 계수 그룹들(18)에 기초하여 114에서 이 세트를 예측하고, 상기 예측 잔차를 상기 데이터 스트림(102)에 삽입하여(116), 데이터 스트림(102)에 상기 GCLI 데이터(118)를 형성함으로써, 코딩된 비트 플래인들의 세트를 상기 데이터 스트림(102)에 시그널링한다. 예를 들어, 상기 코딩된 비트 플래인들의 세트는 인덱싱, 즉 가장 큰 코딩된 라인을 인덱싱함으로써, 데이터 스트림(102)에서 시그널링 될 수 있다. 상기 GCLI가 상기 GTLI보다 큰(118), 현재 그룹 세트(40) 내의 계수 그룹들(18)에 대해, 인코더(100)는 각각의 계수 그룹(18)의 계수들(16)의 대응하는 계수 비트들, 즉 비트들(24)을 데이터 스트림(102)으로 인코딩한다. 이러한 비트 삽입(120)은 보다 구체적으로 말하면, 상기 비트들을 원시 비트들로서 삽입함으로써, 1의 코드율에서 수행될 수 있다. 상기 GCLI 데이터 값들은, 차례로 가변 길이 코드, 예를 들어, 전술한 바와 같이 단항 코드와 같은 코드로서, 데이터 스트림(102)으로 코딩될 수 있다. 120에서 삽입된 상기 원시 비트들은 도 9의 122에 도시되어 있다. 전술한 바와 같이, 데이터 스트림(102) 내에서, 원시 비트들(122), GCLI 데이터(118) 및 플래그들(104)은 인터리빙되거나 비-인터리빙될 수 있다. 알 수 있는 바와 같이, CSF=1은 그룹 세트(40)를 나타내는 매우 압축된 방법이다. 110 또는 120 중 어느 하나 후에, 상기 처리는 동일한 방식으로 다른 그룹 세트(40)에서 진행될 수 있다.

도 10은 상기 도 9의 인코더에 대응하는 디코더를 도시한다. 상기 도 10의 디코더(200)는 데이터 스트림(102)으로부터 상기 변환 계수들(16)을 재구성하도록 동작하고, 이를 위해, 디코더(200)가 그룹 세트(40) 내의 모든 변환 계수들(16)을 0으로 한 경우, 즉 0으로 설정하거나 또는 이 변환 계수들(16)에 노이즈를 합성한 경우로 현재 그룹 세트(40)에 대한 상기 CSF가 맞춰졌는지를 체크한다. 이를 위해, 상기 체크(206)가 현재 그룹 세트(40)에 대해 유의성 코딩 모드가 사용됨을 나타내는 경우, 어떤 종류의 비유의성 처리(210)가 현재 그룹 세트(40)에 대해 수행된다. 그러나, 그렇지 않으면, 디코더(200)는 상기 그룹 세트(40)를 정상적으로 처리한다. 즉, 디코더(200)는 상기 현재 그룹 세트(40) 내의 각각의 계수 그룹(18)의 GCLI를 예측하고(214), 데이터 스트림(102)으로부터 취한 상기 예측 잔차를 사용하여 예측을 수정한다(216). 전술한 바와 같이, 가변 길이 디코딩은 상기 예측 잔차(118)를 도출하는데 사용될 수 있다. 상기 예측은 상기 현재 계수 그룹 또는 현재 그룹(40)에 수직으로 인접한 계수 그룹(18)의 GCLI를 사용하여 수행될 수 있는데, 이는 본 예에서, 현재 세트(40) 내의 모든 그룹들(18)에 대해 상기 예측 기준, 즉 수직적으로 이웃하는 그룹(18)이 현재 세트(40)의 외부에 있음을 의미한다. 대안적으로, 상기 예측(214)은 상기 현재 계수 그룹 또는 상기 현재 그룹(40)에 수평으로 인접한 계수 그룹(18)의 GCLI를 사용하여 수행될 수 있는데, 이는 본 예에서, 가장 왼쪽에 있는 것을 제외한 상기 현재 세트(40) 내의 대부분의 그룹(18)에 대하여, 예를 들어, 상기 예측 기준, 즉 상기 수평적으로 이웃하는 그룹(18)은 현재 세트(40) 내에 있음을 의미한다. 자연적으로, 상기 데이터 스트림에서 각 그룹(18)에 대한 예측 소스를 시그널링하는 것이 가능할 수 있다. 심지어 비-예측도 가능한 모드일 수 있다. 예측(214)에 대한 세부 사항들은 자연스럽게, 예측(114)으로 또한 전송될 수 있다. 모드 스위칭은 계수 열들(41) 또는 그룹들(18)의 열들과 같은 그룹들(18) 또는 세트들(40), 서브 대역들 또는 구역들(30)과는 다른 세분성으로 상기 인코더에 의해 대안적으로 시그널링되고 선택될 수 있다.

218에서 디코더(200)에 의해 체크된 바와 같이, 상기 GCLI가 상기 GTLI보다 큰, 즉 상기 코딩된 비트 플래인들의 세트가 양자화 임계값 아래에 있지 않은, 각각의 계수 그룹(18)에 대해, 각각의 계수 그룹(18) 내의 상기 계수들(16)의 대응하는 코딩된 비트 플래인들의 비트들은 데이터 스트림(102)으로부터 220에서 판독된다. 이는, 디코더(200)가 데이터 스트림(102)의 비트들을 판독하거나, 상기 GCLI 및 상기 GTLI에 의해 표시된 그러한 비트 플레인들로 직접 비트들을 디코딩(즉 122)하는 것을 의미하는데, 즉 데이터 스트림(102)으로부터 미리 정해진 맵핑 규칙에 따라 상기 비트 플레인들 사이로 상기 비트들을 삽입한다.

도 9에, 상기 정보(104)가 이러한 종류의 유의성 표시에 관련되어 있다는 것, 즉, 예를 들어 RSF보다는 CSF에 관련되어 있다는 사실을, 상기 인코더(100)가 선택적으로, 데이터 스트림(102) 내에서 시그널링할 수 있음이 추가적으로 도시되어 있다. 이 표시는 인코더(100)에 의해 250에서 데이터 스트림(102)으로 선택적으로 삽입되는 것으로 도시되어 있다.

도 11은 CSF 대신 RSF를 사용하도록 구성된 인코더(300)를 도시한다. 도 11의 상기 인코더(300)는 다음의 방법으로 동작한다. 특히, 다음의 설명은 상기 도 9의 인코더(100)의 동작과의 차이점에 집중한다.

도 11의 인코더(300)는, 314에서 그 그룹 세트(40)의 모든 계수 그룹들(18)에 대한 GCLI 예측자들을 결정하고, 316에서 모든 예측들이 정확히 맞는지, 즉 상기 예측 잔차들이 그룹 세트(40) 내의 모든 계수 그룹들(18)에 대해 모두 0인지를 결정함으로써, 현재 그룹 세트(40)에서 동작한다. 이 경우, 그 후 인코더(300)는 318에서 데이터 스트림(102)의 상기 유의성 정보(104) 내에서 RSF = 1을 설정함으로써 이를 시그널링한다. 여기서, 표시(250)는, 도 9의 표시(250)에 의해 표시되는 것과 같은 CSF 시그널링 대신에, RSF 시그널링이 데이트 스트림(102)의 정보 필드(104)에서 전달됨을 나타낸다. 그러나, 모든 GCLI 예측 잔차들이 0이 아닌 경우, 이 그룹 세트(40)에 대한 RSF 플래그는 220에서 0으로 설정되고, 상기 현재 그룹 세트(40)의 상기 계수 그룹들(18)에 대한 상기 GLCI 값들에 대한 상기 예측 잔차들이, 322에서, 데이터 스트림(102), 즉 필드(118) 내에 삽입된다. RSF가 설정되었는지 여부에 관계없이, 각각의 계수 그룹에 대해 절단되지 않은 코딩된 비트 플래인들이 존재하는지 여부가 체크되며, 만약 그렇다면, 그들은, 326에서, 데이터 스트림(102)에 삽입된다.

다른 실시예에 따른 인코더는, 즉, 예를 들어, 코딩 효율에 따라 RSF 또는 CSF 중 어떤 옵션이 선호되는지를 결정하기 위해 그 중에서 선택함에 있어, 도 9에 따라 또는 도 11인 두개의 모드들에 따라, 동작할 수 있음을 유의해야 한다.

도 12는 표시(250)가 CSF 또는 RSF 코딩의 사용을 나타내는지 여부에 관계없이 상기 표시(250)를 포함하는 데이터 스트림(102)을 처리할 수 있는 디코더(400)를 도시한다. 도 10의 참조 부호들이 재사용되었지만, 정보(104)의 플래그들의 의미가 표시(250)에 의존한다는 것을 나타내기 위해 정보(104)는 "CSF"대신 "R/CSF"로 표시되어 있다. 상기 비유의성 처리(210)는 상기 현재 그룹 세트(40)에 대한 대응 플래그가 설정되고, 상기 CSF 모드가 표시(250)에 의해 동시에 표시되는 경우에만 디코더(400)에 의해 수행된다. 그렇지 않은 경우, 도 10과 비교한 작동 모드의 또 다른 차이는, 만약 상기 R/CSF 플래그가 상기 현재 그룹 세트(40)에 대해 설정되어 있고 상기 표시(250)가 상기 RSF 모드를 표시한다는 사실을 체크(402)시 산출된다면, 상기 예측 수정(216)이 디코더(400)에 의해서 스킵된다는 것이다. 그렇지 않다면, 상기 예측 수정(216)이 수행된다.

도 12와 관련하여, 상기 도 12의 디코더(400)는 상기 도 10의 디코더와 거의 다르지 않다는 것이 주목된다. RSF 및 CSF 코딩 모두를 처리하는 능력은 거의 운영 경비(operational overhead)를 발생시키지 않는다. 한편, 디코더(12)를 공급하기 위한 데이터 스트림(102) 생성용 인코더를 설치하고자 하는 모든 사람들은, 표시(250)가 사용되는 경우, 도 11의 상기 RSF 옵션 또는 도 9의 상기 CSF 옵션 중에서 선택할 기회를 제공받는다. 이와 관련하여, 상기 CSF 옵션은 병렬 처리 능력과 관련하여 이점을 가질 수 있는 반면, 상기 도 11의 RSF 옵션은, 예를 들어, FPGA 등의 형태인, 순차적 동작 스타일에서 상기 인코더를 구현하는 경우에 유리할 수 있음에 유의해야 한다. 특히, 상기 RSF 설정은 단계(322)에서의 예측을 위한, 예측 기준 베이스에 의존하지만, 상기 CSF 설정은 상기 GTLI, 즉 양자화에 대해 알아야 할 필요성을 제외하고는, 임의의 다른 변환 계수들과 독립적으로 수행될 수 있다.

도 9 내지 도 12와 관련하여, 상기 데이터 스트림(102)은 유의성 모드가 어쨌든 사용되는지 여부에 대한 정보 또는 플래그를 상기 인코더에 의해 제공할 수 있고, 이에 따라 정보(104) 및 선택적으로 사용되는 시그널링(250)은, 정상 모드로 대신하여 처리되는 모든 그룹 세트들(40)에서 데이터 스트림(250)에 존재할 수 없을 수 있음에 유의해야 한다.

정의 및 약어

이것들은 문서와 함께 사용될 몇 가지 정의들이다.

GCLI 가장 큰 코딩된 라인 인덱스

GCLI 계수 그룹 하나의 GCLI 값으로 표시되는 웨이블릿 계수 그룹

이스케이프 GCLI 디코더에 특정 조건을 시그널링하는 데 사용될 수있는 일반 코딩에 사용되지 않는 값

유의성 GCLI 0보다 큰 값을 가진 GCLI

비유의성 GCLI 0인 값을 가진 GCLI

GTLI 가장 큰 절단된 라인 인덱스

절단된 GCLI max(GCLI-GTLI, 0)의 결과

비유의성 절단된 GCLI 계수 그룹에 대하여 그 값이 GTLI보다 작거나 같은 GCLI

GCLI 잔차 GCLI 값에 적용된 예측 결과. 이를 위해서는 참조 GCLI 및 해당 GTLI 값들이 필요함. 수평 및 수직 예측의 두 가지 변형이 있음

구역(Precinct) 입력 이미지의 주어진 공간 영역에 기여하는 다른 서브 대역들의 계수들 그룹

시나리오 다른 웨이브릿 서브 대역에 대한 GTLI 값을 도출하는 데 사용될 수 있는 구역 기지(base)에 정의된 양자화 매개변수

RSF 잔차 유의성 플래그, 비유의성 플래그라고도 함(선행기술문헌 [1]).

SIG 그룹 SIG 플래그가 할당된 GCLI 계수 그룹들의 그룹, 유의성 그룹이라고도 함

CSF 계수 유의성 플래그

도 13은 데이터 스트림(102)의 의사코드의 예를 도시한다. 이 의사코드에서, 상기 표시(250)는 "Rm"이라는 파라미터 내에서 전달된다. Rm=1은 CSF 코딩 모드의 사용을 나타내며, 504에서 계산된 상기 GCLI 예측기의 수정(502)이, 506에서 테스트된 바와 같이 양자화 임계값(T)를 초과하지 못하도록 충분히 작은 임의의 경우로 되는 그런 값까지 500에서 상기 예측 잔차 △m을 합성하여 설정함으로써, 임의의 비트 도출 스킵핑(skipping)이 요구된다. 상기 데이터 스트림으로부터의 임의의 GCLI 잔차 판독의 스킵핑은, 상기 유의성 플래그들(Z)에 기초한 임의의 예측 잔차, 즉 △m, 를 판독함으로써, 508에서 상기 유의성 플래그 정보에 기초하여 수행된다. Rm이 0 또는 1인지의 여부는, 508에서의 상기 유의성 플래그에 대한 510에서의 상기 예측 잔차 판독의 이 의존성에 영향을 미치지 않는다. Rm이 0이면, 즉 RSF 모드가 활성화되면, 상기 예측 잔차 △m은 512에서 0으로 설정된다. 코딩된 비트 플래인들의 비트 도출은 도 13에 도시되지 않으나, 오로지 M이 0보다 큰 변환 계수 그룹들에 대해서만 수행된다.

일부 양상들은 장치와 관련하여 설명되었지만, 이들 양상들은 또한 대응하는 방법의 설명을 나타내는 것이 명백하며, 여기서 블록 또는 장치는 방법 단계 또는 방법 단계의 특징에 대응한다. 유사하게, 방법 단계의 맥락에서 설명된 양상들은 또한 대응하는 장치의 대응하는 블록 또는 아이템 또는 특징의 설명을 나타낸다. 상기 방법 단계들 중 일부 또는 전부는, 예를 들어, 마이크로 프로세서, 프로그램 가능 컴퓨터 또는 전자 회로와 같은 하드웨어 장치에 의해 (또는 사용하여) 실행될 수 있다. 일부 실시예들에서, 가장 중요한 방법 단계들 중 하나 이상이 그러한 장치에 의해 실행될 수 있다.

본 발명의 인코딩된 데이터 스트림은 디지털 저장 매체에 저장되거나 무선 전송 매체와 같은 전송 매체 또는 인터넷과 같은 유선 전송 매체에서 전송될 수 있다.

특정 구현 요구에 따라, 본 발명의 실시예들은 하드웨어 또는 소프트웨어로 구현될 수 있다. 상기 구현은 전자적으로 판독 가능한 제어 신호를 저장한 플로피 디스크, DVD, 블루 레이, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리와 같은 디지털 저장 매체를 사용하여 수행될 수 있고, 이는 각각의 방법이 수행되도록 프로그램 가능한 컴퓨터 시스템과 협력한다(또는 협력할 수 있다). 따라서, 상기 디지털 저장 매체는 컴퓨터 판독가능할 수 있다.

본 발명에 따른 일부 실시예들은, 전술한 방법들 중 하나가 수행되도록, 프로그램 가능 컴퓨터 시스템과 협력할 수 있는, 전자적으로 판독 가능한 제어 신호들을 갖는 데이터 캐리어를 포함한다.

일반적으로, 본 발명의 실시예들은 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있으며, 상기 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터에서 실행될 때 상기 방법들 중 하나를 수행하도록 동작한다. 상기 프로그램 코드는, 예를 들어, 기계 판독 가능 캐리어 상에 저장될 수 있다.

다른 실시예들은 머신 판독 가능 캐리어 상에 저장된, 전술한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.

다시 말해서, 본 발명의 방법의 실시예는, 따라서, 컴퓨터 프로그램이 컴퓨터에서 실행될 때, 전술한 방법들 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.

따라서, 본 발명의 방법의 다른 실시예는, 전술한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램이 저장되어 포함되는 데이터 캐리어(또는 디지털 저장 매체 또는 컴퓨터 판독 가능 매체)이다. 상기 데이터 캐리어, 상기 디지털 저장 매체 또는 기록된 매체는 일반적으로 유형적 및/또는 비-일시적이다.

따라서, 본 발명의 방법의 다른 실시예는, 전술한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 데이터 스트림 또는 신호 시퀀스이다. 상기 데이터 스트림 또는 신호 시퀀스는, 데이터 통신 연결을 통해, 예를 들어, 인터넷을 통해, 전송되도록 구성될 수 있다.

다른 실시예는 전술한 방법들 중 하나를 수행하도록 구성되거나 적응된 처리 수단들, 예를 들어, 컴퓨터 또는 프로그램 가능 논리 장치를 포함한다.

다른 실시예는 전술한 방법들 중 하나를 수행하기 위해 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.

본 발명에 따른 또 다른 실시예는, 전술한 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 수신기로 (예를 들어, 전자적으로 또는 광학적으로) 전송하도록 구성된 장치 또는 시스템을 포함한다. 상기 수신기는, 예를 들어, 컴퓨터, 모바일 장치, 메모리 장치 등일 수 있다. 상기 장치 또는 시스템은, 예를 들어, 컴퓨터 프로그램을 상기 수신기로 전송하기 위한 파일 서버를 포함할 수 있다.

일부 실시예들에서, 프로그램 가능 논리 장치(예를 들어, 필드 프로그램 가능 게이트 어레이)는 전술한 방법들의 기능들 중 일부 또는 전부를 수행하기 위해 사용될 수 있다. 일부 실시예에서, 필드 프로그램 가능 게이트 어레이는 전술한 방법들 중 하나를 수행하기 위해 마이크로 프로세서와 협력할 수 있다. 일반적으로, 상기 방법들은 바람직하게는 임의의 하드웨어 장치에 의해 수행된다.

전술한 장치는, 하드웨어 장치를 사용하거나, 컴퓨터를 사용하거나, 하드웨어 장치와 컴퓨터의 조합을 사용하여 구현될 수 있다.

전술한 장치, 또는 전술한 장치의 임의의 구성요소들은 적어도 부분적으로 하드웨어 및/또는 소프트웨어로 구현될 수 있다.

전술한 방법들은, 하드웨어 장치를 사용하거나, 컴퓨터를 사용하거나, 하드웨어 장치와 컴퓨터의 조합을 사용하여 수행될 수 있다.

전술한 방법들, 또는 전술한 장치의 임의의 구성요소들은 적어도 부분적으로 하드웨어 및/또는 소프트웨어에 의해 수행될 수 있다.

전술한 실시예들은 단지 본 발명의 원리를 설명하기 위한 것일 뿐이다. 여기에 설명된 배열들 및 세부 사항들의 수정 및 변형은 당업자에게 명백할 것이다. 그러므로, 하기의 특허청구범위에 의해서만 제한되고, 본 명세서의 실시예들의 묘사 및 설명에 의해 제시된 특정 세부 사항들에 의해 제한되는 것은 아니다.

Claims

데이터 스트림(102)으로부터 변환 계수들(16)을 디코딩하도록 구성된 디코더로서, 상기 변환 계수들은 계수 그룹들(18)로 그룹화되고, 상기 계수 그룹들(18)은 그룹 세트들(40)로 그룹화되고, 상기 디코더는,
상기 데이터 스트림(102)으로부터, 유의성 코딩 모드의 표시(250)를 도출하도록 구성되고;
상기 데이터 스트림(102)으로부터, 유의성 코딩 모드가 사용되지 않을 그룹 세트들(40)의 제1 서브세트, 및 상기 유의성 코딩 모드가 사용될 그룹 세트들(40)의 제2 서브세트를 식별하는 정보(104)를 도출하도록 구성되고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 디코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계(214), 상기 데이터 스트림으로부터 도출된 제1 예측 잔차(118)를 이용하여 상기 제1 예측을 정정하여 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계(216)에 의하여, 코딩된 비트 플래인들의 상기 제1 세트를 식별하고,
상기 데이터 스트림으로부터 코딩된 비트 플래인들의 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 도출(220)하도록 구성되고;
상기 유의성 코딩 모드가 제1 모드인 경우, 상기 제2 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 디코딩된 제2 계수 그룹에 기초하여 코딩된 비트 플래인들의 제2 세트에 대한 제2 예측을 도출함으로써(214) 코딩된 비트 플래인들의 상기 제2 세트를 식별하고,
상기 데이터 스트림으로부터 코딩된 비트 플래인들의 상기 제2 세트에 대한 상기 제2 예측 내에서 상기 각각의 계수 그룹의 비트들을 도출(220)하도록 구성되고; 및
상기 유의성 코딩 모드(significace coding mode)가 제2 모드인 경우, 상기 제2 서브세트의 각 그룹 세트에 대해,
각각의 그룹 세트의 각각의 계수 그룹에 대해, 상기 각각의 계수 그룹의 계수들이 비유의하다는 것을 따르도록(inherit, 210) 구성된, 디코더.
제1항에 있어서,
상기 변환 계수들은 화상(12)의 스펙트럼 분해의 복수의 서브-부분들 중 하나의 서브-부분을 형성하는 디코더.
제2항에 있어서,
상기 디코더는 상기 데이터 스트림으로부터 단위 서브-부분 기초에서 상기 유의성 코딩 모드를 도출하도록 구성되는 디코더.
제3항에 있어서,
상기 서브-부분들은 상기 화상(12)이 서브-분할되는 공간 영역들의 대응하는 공간 영역(32)에 관한 서브-밴드들 또는 변환 계수들의 그룹들인, 디코더.
제2항에 있어서,
상기 데이터 스트림으로부터, 각각의 계수 그룹에 대한 하나 이상의 절단된 최하위 비트 플래인들의 세트를 나타내는 절단 정보(108), 및 하나 이상의 절단된 최하위 비트 플레인들의 세트의 최상위 절단된 비트 플레인에 대한 최상위 비트 플레인 인덱스를 나타내는 상기 제1 예측, 정정된 예측 및 상기 제2 예측을 도출하도록 구성된 디코더.
제5항에 있어서,
상기 데이터 스트림으로부터, 상기 화상(12)이 서브-분할되는 공간 영역들의 대응하는 공간 영역(32)과 관련된 계수 그룹 열들, 서브-대역들 또는 변환 계수들의 그룹들의 단위(granularity)로 하나 이상의 절단된 최하위 비트 플래인들의 세트를 나타내는 상기 절단 정보(108)를 도출하도록 구성된 디코더.
제1항에 있어서,
상기 변환 계수들은 화상(12)의 스펙트럼 분해(10)의 스펙트럼 계수들인 디코더.
제1항에 있어서,
상기 변환 계수들은 DCT 또는 웨이블릿 계수들인 디코더.
제1항에 있어서,
상기 변환 계수들은 화상(12)을 서브-대역들로 스펙트럼 분해(10)하는 스펙트럼 계수들이고, 하나의 계수 그룹(18) 내의 변환 계수들(16)이 동일한 서브-대역에 속하는 방식으로 상기 계수 그룹들(18)로 그룹화되는 디코더.
제1항에 있어서,
플래그가 제1 상태를 가정하는 그룹 세트들(40)은 그룹 세트들의 상기 제1 서브세트에 속하고, 상기 플래그가 제2 상태를 가정하는 그룹 세트들은 그룹 세트들의 상기 제2 서브세트에 속하며, 상기 데이터 스트림으로부터 그룹 세트(40) 당 하나의 상기 플래그로서 상기 정보(104)를 도출하도록 구성된 디코더.
제1항에 있어서,
1의 코드율에서 상기 비트들의 도출(220)을 수행하도록 구성된 디코더.
제1항에 있어서,
비유의성 계수들을 0 또는 의사 노이즈(pseudo noise)로 설정하도록 구성된 디코더.
데이터 스트림(102)으로 변환 계수들(16)을 인코딩하도록 구성된 인코더로서, 상기 변환 계수들은 계수 그룹들(18)로 그룹화되고, 상기 계수 그룹들은 그룹 세트들로 그룹화되고, 상기 인코더는
상기 데이터 스트림(102)에서 제1 모드 또는 제2 모드인 유의성 코딩 모드(250)를 시그널링하고,
상기 유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트 및 상기 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보(104)를 상기 데이터 스트림(102)에 삽입하도록 구성되고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계(114), 상기 제1 예측을 정정하기 위해 제1 예측 잔차(118)을 상기 데이터 스트림(102)에 삽입하여 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계(116)에 의하여, 상기 데이터 스트림에서 코딩된 비트 플래인들의 상기 제1 세트를 식별하고,
코딩된 비트 플래인들의 상기 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 상기 데이터 스트림에 삽입(120)하도록 구성되고;
상기 유의성 코딩 모드가 상기 제1 모드인 경우, 상기 제2 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 코딩된 제2 계수 그룹에 기초하여 코딩된 비트 플래인들의 제2 세트에 대한 제2 예측을 도출(114)함으로써 코딩된 비트 플래인들의 상기 제2 세트를 식별하고,
상기 데이터 스트림으로 코딩된 비트 플래인들의 상기 제2 세트에 대한 상기 제2 예측 내에서 비트들을 삽입(120)하도록 구성되고; 및
상기 제2 모드인 상기 유의성 코딩 모드는, 상기 제2 서브세트의 각 그룹 세트에 대하여, 각각의 그룹 세트의 각 계수 그룹에 대하여, 상기 각 계수 그룹의 계수들이 비유의하다는 것을 시그널링하는, 인코더.
제13항에 있어서,
상기 변환 계수들은 화상의 스펙트럼 분해의 복수의 서브-부분들 중 하나의 서브-부분을 형성하는, 인코더.
제14항에 있어서,
상기 인코더는 상기 데이터 스트림에서의 신호화에 의해, 서브-부분 기초마다 적어도 상기 제1 및 제2 모드 중에서 상기 유의성 코딩 모드를 선택하고 변경하도록 구성되는 인코더.
제15항에 있어서,
상기 서브-부분들은 상기 화상이 서브-분할되는 공간 영역들의 대응하는 공간 영역에 관한 서브-대역들 또는 변환 계수들의 그룹들인 인코더.
제14항에 있어서,
상기 데이터 스트림으로, 각각의 계수 그룹에 대한 하나 이상의 절단된 최하위 비트-플래인들의 세트를 나타내는 절단 정보, 및 하나 이상의 절단된 최하위 비트 플레인들의 세트의 최상위 절단된 비트 플레인에 대한 최상위 비트 플레인 인덱스를 나타내는 상기 제1 예측, 정정된 예측 및 상기 제2 예측을 삽입하도록 구성된 인코더.
제17항에 있어서,
상기 데이터 스트림으로, 상기 화상이 서브-분할되는 공간 영역들의 대응하는 공간 영역과 관련된 계수 그룹 열들, 서브-대역들 또는 변환 계수들의 그룹들의 단위(granularity)로 하나 이상의 절단된 최하위 비트 플래인들의 세트를 나타내는 상기 절단 정보(108)를 삽입하도록 구성된 인코더.
제13항에 있어서,
상기 인코더는 기본적으로 적어도 상기 제1 및 제2 모드 중에서 상기 유의성 코딩 모드를 선택하도록 구성되거나,
상기 인코더는, 상기 제1 및 제2 모드를 포함하는 코딩 모드들의 세트를 테스트하고, 미리 결정된 기준에 따라 상기 코딩 모드 세트 중에서 최상의 코딩 모드를 선택함으로써, 적어도 상기 제1 및 제2 모드 중에서 상기 유의성 코딩 모드를 선택하도록 구성되는, 인코더.
제19항에 있어서,
상기 미리 결정된 기준은 코딩율 및/또는 코딩 왜곡에 의존하는 인코더.
제13항에 있어서,
상기 변환 계수들은 화상의 스펙트럼 분해의 스펙트럼 계수들인 인코더.
제13항에 있어서,
상기 변환 계수들은 DCT 또는 웨이블릿 계수들인 인코더.
제13항에 있어서,
상기 변환 계수들은 화상을 서브-대역들로 스펙트럼 분해하는 스펙트럼 계수들이고, 하나의 계수 그룹 내의 변환 계수들이 동일한 서브-대역에 속하는 방식으로 상기 계수 그룹들로 그룹화되는 인코더.
제13항에 있어서,
플래그가 제1 상태를 가정하는 그룹 세트들은 그룹 세트들의 상기 제1 서브세트에 속하고, 상기 플래그가 제2 상태를 가정하는 그룹 세트들은 그룹 세트들의 상기 제2 서브세트에 속하며, 그룹 세트 당 하나의 상기 플래그로서 상기 데이터 스트림으로 상기 정보를 삽입하도록 구성된 인코더.
제13항에 있어서,
1의 코드율에서 상기 비트들의 삽입을 수행하도록 구성된 인코더.
제13항에 있어서,
비유의성 계수들은 0 또는 의사 노이즈로 설정되도록 시그널링되는 인코더.
데이터 스트림(102)으로부터 변환 계수들(16)을 디코딩하도록 구성된 디코더로서, 상기 변환 계수들(16)은 계수 그룹들(18)로 그룹화되고, 상기 계수 그룹들은 그룹 세트들(40)로 그룹화되고, 상기 디코더는,
상기 데이터 스트림(102)으로부터, 유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트, 및 상기 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보(104)를 도출하도록 구성되고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 디코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계(214), 상기 데이터 스트림으로부터 도출된 제1 예측 잔차(118)를 이용하여 상기 제1 예측을 정정하여, 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계(216)에 의하여 코딩된 비트 플래인들의 상기 제1 세트를 식별하고,
코드율 1에서, 상기 데이터 스트림으로부터 코딩된 비트 플래인들의 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 도출하도록 구성되며;
상기 제2 서브세트의 각 그룹 세트에 대해, 각 그룹 세트의 각 계수 그룹에 대해 상기 각 계수 그룹의 계수들이 비유의적이라는 것을 따르도록(inherit, 210) 구성된, 디코더.
제27항에 있어서,
상기 유의성 코딩 모드가 적용되는지의 여부를 상기 데이터 스트림(102)으로부터 도출하고;
상기 유의성 코딩 모드가 적용되지 않으면, 상기 데이터 스트림으로부터 상기 정보의 도출을 스킵하고, 상기 제2 서브세트가 비어 있다고 추론하도록, 구성된 디코더.
제28항에 있어서,
상기 변환 계수들은 화상의 스펙트럼 분해의 복수의 서브-부분들 중 하나의 서브-부분을 형성하고, 상기 디코더는 서브-부분 기초별로, 상기 유의성 코딩 모드가 적용되는지 여부를 상기 데이터 스트림으로부터 도출하도록 구성되는 디코더.
제29항에 있어서,
상기 서브-부분들은 상기 화상이 서브-분할되는 공간 영역들의 대응하는 공간 영역에 관한 서브-대역들 또는 변환 계수들의 그룹들인 디코더.
제27항에 있어서,
상기 데이터 스트림으로부터, 각각의 계수 그룹에 대한 하나 이상의 절단된 최하위 비트 플래인들의 세트를 나타내는 절단 정보, 및 하나 이상의 절단된 최하위 비트 플레인들의 세트의 최상위 절단된 비트 플레인에 대한 최상위 비트 플레인 인덱스를 나타내는 상기 제1 예측 및 상기 정정된 예측을 도출하도록 구성된 디코더.
제 31항에 있어서,
상기 데이터 스트림으로부터, 화상이 서브-분할되는 공간 영역들의 대응하는 공간 영역과 관련된 계수 그룹 열들, 서브-대역들 또는 변환 계수들의 그룹들의 단위(granularity)로 하나 이상의 절단된 최하위 비트 플래인들의 세트를 나타내는 상기 절단 정보를 도출하도록 구성된 디코더.
제27항에 있어서,
상기 변환 계수들은 화상의 스펙트럼 분해의 스펙트럼 계수들인 디코더.
제27항에 있어서,
상기 변환 계수들은 DCT 또는 웨이블릿 계수들인 디코더.
제27항에 있어서,
상기 변환 계수들은 화상을 서브-대역들로 스펙트럼 분해하는 스펙트럼 계수들이고, 하나의 계수 그룹 내의 변환 계수들이 같은 서브-대역에 속하는 방식으로, 상기 계수 그룹들로 그룹화되는 디코더.
제27항에 있어서,
플래그가 제1 상태를 가정하는 그룹 세트들은 그룹 세트들의 상기 제1 서브세트에 속하고, 상기 플래그가 제2 상태를 가정하는 그룹 세트들은 그룹 세트들의 상기 제1 서브세트에 속하며, 상기 데이터 스트림으로부터 그룹 세트 당 하나의 상기 플래그로서 상기 정보를 도출하도록 구성된 디코더.
제27항에 있어서,
단항 VLC 코드를 사용하여 상기 제1 예측 잔차를 도출하는 단계를 수행하도록 구성되는 디코더.
제27항에 있어서,
비유의성 계수들을 0 또는 의사 노이즈로 설정하도록 구성된 디코더.
데이터 스트림으로 변환 계수들을 인코딩하도록 구성된 인코더로서, 상기 변환 계수들은 계수 그룹들로 그룹화되고, 상기 계수 그룹들은 그룹 세트들로 그룹화되고, 상기 인코더는,
유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트, 및 상기 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보를 상기 데이터 스트림에 삽입하도록 구성되고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계, 상기 제1 예측을 정정하기 위해 제1 예측 잔차를 상기 데이터 스트림에 삽입하여 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계에 의하여, 코딩된 비트 플래인들의 상기 제1 세트를 식별하고,
코드율 1에서, 코딩된 비트 플래인들의 상기 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 상기 데이터 스트림에 삽입하고,
상기 제2 서브세트의 각 그룹 세트에 대하여, 각 그룹 세트의 각 계수 그룹에 대하여, 상기 각 계수 그룹의 계수들은 비유의하도록 구성된, 인코더.
데이터 스트림(102)으로부터 변환 계수들(16)을 디코딩하는 방법으로서, 상기 변환 계수들은 계수 그룹들(18)로 그룹화되고, 상기 계수 그룹들(18)은 그룹 세트(40)들로 그룹화되고, 상기 방법은,
상기 데이터 스트림(102)으로부터, 유의성 코딩 모드의 표시(250)를 도출하는 단계;
상기 데이터 스트림(102)으로부터, 유의성 코딩 모드가 사용되지 않을 그룹 세트들(40)의 제1 서브세트, 및 유의성 코딩 모드가 사용될 그룹 세트들(40)의 제2 서브세트를 식별하는 정보(104)를 도출하는 단계를 포함하며;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 디코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계(214), 상기 데이터 스트림으로부터 도출된 제1 예측 잔차(118)를 이용하여 상기 제1 예측을 정정하여 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계(216)에 의하여, 코딩된 비트 플래인들의 상기 제1 세트를 식별하는 단계,
상기 데이터 스트림으로부터 코딩된 비트 플래인들의 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 도출하는 단계(220)를 포함하며;
상기 유의성 코딩 모드가 제1 모드인 경우, 상기 제2 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 디코딩된 제2 계수 그룹에 기초하여 코딩된 비트 플래인들의 제2 세트에 대한 제2 예측을 도출함으로써(214) 코딩된 비트 플래인들의 제2 세트를 식별하는 단계, 및
상기 데이터 스트림으로부터 코딩된 비트 플래인들의 상기 제2 세트에 대한 상기 제2 예측 내에서 상기 각각의 계수 그룹의 비트들을 도출하는 단계(220)를 포함하며; 및
상기 유의성 코딩 모드(significace coding mode)가 제2 모드인 경우, 상기 제2 서브세트의 각 그룹 세트에 대해,
각각의 그룹 세트의 각각의 계수 그룹에 대해, 상기 각각의 계수 그룹의 계수들이 비유의하다는 것을 따르는(inherit, 210) 단계를 포함하는, 방법.
데이터 스트림(102)으로 변환 계수들(16)을 인코딩하는 방법으로서, 상기 변환 계수들은 계수 그룹들(18)로 그룹화되고, 상기 계수 그룹들은 그룹 세트들(40)로 그룹화되고, 상기 방법은,
상기 데이터 스트림(102)에서 제1 모드 또는 제2 모드인 유의성 코딩 모드(250)를 시그널링하는 단계;
상기 유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트 및 상기 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보(104)를 상기 데이터 스트림(102)에 삽입하는 단계를 포함하고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계(114), 상기 제1 예측을 정정하기 위한 제1 예측 잔차(118)를 상기 데이터 스트림(102)에 삽입하여 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계(116)에 의하여, 상기 데이터 스트림에서 코딩된 비트 플래인들의 상기 제1 세트를 식별하는 단계,
코딩된 비트 플래인들의 상기 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 상기 데이터 스트림에 삽입하는 단계(120)를 포함하고;
상기 유의성 코딩 모드가 상기 제1 모드인 경우, 상기 제2 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 코딩된 제2 계수 그룹에 기초하여 코딩된 비트 플래인들의 제2 세트에 대한 제2 예측을 도출하는 단계(114)에 의하여, 코딩된 비트 플래인들의 상기 제2 세트를 식별하는 단계, 및
상기 데이터 스트림으로 코딩된 비트 플래인들의 상기 제2 세트에 대한 상기 제2 예측 내에서 비트들을 삽입하는 단계(120)를 포함하며; 및
상기 제2 모드인 상기 유의성 코딩 모드는, 상기 제2 서브세트의 각 그룹 세트에 대하여, 각각의 그룹 세트의 각 계수 그룹에 대하여, 상기 각 계수 그룹의 계수들이 비유의하다는 것을 시그널링하는, 방법.
데이터 스트림(102)으로부터 변환 계수들(16)을 디코딩하는 방법으로서, 상기 변환 계수들(16)은 계수 그룹들(18)로 그룹화되고, 상기 계수 그룹들은 그룹 세트들(40)로 그룹화되고, 상기 방법은,
상기 데이터 스트림(102)으로부터, 유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트, 및 상기 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보(104)를 도출하는 단계를 포함하고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 디코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계(214), 상기 데이터 스트림으로부터 도출된 제1 예측 잔차(118)를 이용하여 상기 제1 예측을 정정하여 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계(216)에 의하여, 코딩된 비트 플래인들의 상기 제1 세트를 식별하는 단계,
코드율 1에서, 상기 데이터 스트림으로부터 코딩된 비트 플래인들의 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 도출하는 단계를 포함하고;
상기 제2 서브세트의 각 그룹 세트에 대해, 각 그룹 세트의 각 계수 그룹에 대해 상기 각 계수 그룹의 계수들이 비유의적이라는 것을 따르는(inherit, 210) 단계를 포함하는, 방법.
데이터 스트림으로 변환 계수들을 인코딩하는 방법으로서, 상기 변환 계수들은 계수 그룹들로 그룹화되고, 상기 계수 그룹들은 그룹 세트들로 그룹화되고, 상기 방법은,
유의성 코딩 모드가 사용되지 않을 그룹 세트들의 제1 서브세트 및 상기 유의성 코딩 모드가 사용될 그룹 세트들의 제2 서브세트를 식별하는 정보(104)를 상기 데이터 스트림에 삽입하는 단계를 포함하고;
상기 제1 서브세트 중에서 각 그룹 세트에 대하여, 상기 각 그룹 세트의 각 계수 그룹에 대하여,
이전에 코딩된 제1 계수 그룹에 기초하여 코딩된 비트 플래인들의 제1 세트에 대한 제1 예측을 도출하는 단계, 상기 제1 예측을 정정하기 위해 제1 예측 잔차를 상기 데이터 스트림에 삽입하여, 코딩된 비트 플래인들의 상기 제1 세트에 대한 정정된 예측을 획득하는 단계에 의하여, 코딩된 비트 플래인들의 상기 제1 세트를 식별하는 단계,
코드율 1에서, 코딩된 비트 플래인들의 상기 제1 세트에 대한 상기 정정된 예측 내에서 상기 각각의 계수 그룹의 비트들을 상기 데이터 스트림에 삽입하는 단계를 포함하며,
여기서, 상기 제2 서브세트의 각 그룹 세트에 대해, 각 그룹 세트의 각 계수 그룹에 대해, 상기 각 계수 그룹의 계수들이 비유의한, 방법.
제41항 또는 제43항에 따른 방법에 의해 생성된 데이터 스트림을 저장하는 디지털 저장 매체.
컴퓨터에서 실행될 때, 제40항, 제41항, 제42항 및 제43항 중 어느 한 항에 따른 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램.