KR20140018873A - 영상 정보 부호화 방법 및 복호화 방법 - Google Patents

영상 정보 부호화 방법 및 복호화 방법 Download PDF

Info

Publication number
KR20140018873A
KR20140018873A KR1020137020513A KR20137020513A KR20140018873A KR 20140018873 A KR20140018873 A KR 20140018873A KR 1020137020513 A KR1020137020513 A KR 1020137020513A KR 20137020513 A KR20137020513 A KR 20137020513A KR 20140018873 A KR20140018873 A KR 20140018873A
Authority
KR
South Korea
Prior art keywords
information
block
mode
residual
current
Prior art date
Application number
KR1020137020513A
Other languages
English (en)
Inventor
박준영
박승욱
임재현
김정선
최영희
전병문
전용준
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20140018873A publication Critical patent/KR20140018873A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 영상 정보의 부호화 및 복호화 방법에 관한 것으로서, 본 발명의 일 실시형태에 따른 영상 정보 부호화 방법은 현재 예측 유닛에 대한 예측을 수행하는 단계, 상기 현재 예측 유닛에 대한 정보를 엔트로피 부호화하는 단계 및 상기 엔트로피 부호화된 정보를 전송하는 단계를 포함하며, 상기 예측 수행 단계에서 상기 현재 예측 유닛은 깊이가 0인 2Nx2N의 블록이며, 상기 현재 예측 유닛에 대해 머지 모드가 적용된 경우에는, 상기 현재 예측 유닛에 대한 레지듀얼 신호가 존재하는 것으로 추정할 수 있다. 본 발명에 의하면, 화면 간 예측의 각 모드들에 대한 정보 전송의 중복성을 고려함으로써 전송 정보량을 줄일 수 있다.

Description

영상 정보 부호화 방법 및 복호화 방법{METHOD FOR ENCODING AND DECODING IMAGE INFORMATION}
본 발명은 영상 정보 압축 기술에 관한 것으로서, 구체적으로는 화면 간 예측에 있어서 적용되는 모드들에 대하여 정보 전송의 중복성을 고려함으로써 전송 정보량을 줄이는 방법에 관한 것이다.
최근, 고해상도, 고품질의 영상에 대한 요구가 다양한 응용 분야에서 증가하고 있다. 하지만, 영상의 고해상도, 고품질이 될수록 해당 영상에 관한 정보량도 함께 증가한다. 따라서 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 정보를 전송하거나 기존의 저장 매체를 이용해 영상 정보를 저장하는 경우, 정보의 전송 비용과 저장 비용이 증가하게 된다.
고해상도, 고품질 영상의 정보를 효과적으로 전송하거나 저장하고, 재생하기 위해 고효율의 영상 압축 기술을 이용할 수 있다.
영상 압축의 효율을 높이기 위해, 화면 간 예측과 화면 내 예측을 이용할 수 있다. 화면 간 예측 방법에서는 다른 픽처의 정보를 참조하여 현재 픽처(picture)의 화소값을 예측하며, 화면 내 예측 방법에서는 동일한 픽처 내에서 화소 간 연관 관계를 이용하여 화소값을 예측한다.
한편, 엔트로피 코딩의 방법으로서 CABAC(Context-based Adaptive Binary Arithmetic Coding)을 적용하는 방법과 CAVLC(Context-based Adaptive Variable Length Coding)를 적용하는 방법이 있다.
CABAC은 콘택스트에 따라서 각 신택스 엘리먼트(element)에 대한 확률 모델을 선택하고, 내부적인 통계를 통해 확률 모델의 확률을 변경하며, 산술 코딩을 이용해서 압축을 수행한다. 엔트로피 코딩 모드로서 CAVLC가 사용되는 경우에는, 각 신택스 엘리먼트에 대해 소정의 VLC(Variavle Length Coding) 테이블을 이용하여 부호화를 수행한다.
본 발명의 일 기술적 과제는 화면 간 예측의 각 모드들에 대한 정보 전송의 중복성을 고려함으로써 전송 정보량을 줄이는 방법 및 장치를 제공하는 것이다.
본 발명의 다른 기술적 과제는 중복 전송되는 정보를 줄일 수 있는 신택스 구조를 제공하는 것이다.
본 발명의 또 다른 기술적 과제는 신택스 구조의 변경 없이, 정보의 중복을 고려하여 엔트로피 부호화 및 엔트로피 복호화를 수행하는 방법 및 장치를 제공하는 것이다.
본 발명의 또 다른 기술적 과제는 정보의 중복을 고려하여 인덱스 매핑 테이블 및 인버스 인덱스 매핑 테이블을 이용하는 방법 및 장치를 제공하는 것이다.
(1) 본 발명의 일 실시형태는 영상 정보 부호화 방법으로서, 현재 예측 유닛에 대한 예측을 수행하는 단계, 상기 현재 예측 유닛에 대한 정보를 엔트로피 부호화하는 단계 및 상기 엔트로피 부호화된 정보를 전송하는 단계를 포함하며, 상기 예측 수행 단계에서 상기 현재 예측 유닛은 깊이가 0인 2Nx2N의 블록이며, 상기 현재 예측 유닛에 대해 머지 모드가 적용된 경우에는, 상기 현재 예측 유닛에 대한 레지듀얼 신호가 존재하는 것으로 추정할 수 있다.
(2) (1)에서, 상기 전송 단계에서는, 상기 엔트로피 부호화의 모드가 CABAC(Context-Adaptive Binary Arithmetic Coding)이면, 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이 아니거나 상기 현재 예측 유닛에 적용된 예측 모드가 머지 모드가 아닌 경우에만 현재 예측 유닛에 대한 레지듀얼 정보가 전송될 수도 있다.
(3) (1)에서, 상기 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이며 머지 모드가 적용된 경우에는, 상기 현재 예측 유닛의 루마 변환 블록에 대한 레지듀얼 정보 및 크로마 변환 블록의 레지듀얼 정보 중 적어도 하나의 존재가 추정되며, 상기 전송 단계에서는 추정된 레지듀얼 정보의 존부를 지시하는 정보를 전송하지 않을 수 있다.
(4) (3)에서, 상기 루마 변환 블록에 대한 레지듀얼 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보가 모두 존재하는 것으로 추정될 수 있다.
(5) (3)에서, 상기 루마 변환 블록에 대한 레지듀얼 정보의 존재가 추정될 수 있으며, 상기 전송 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 전송할 수 있다
(6) (3)에서, 상기 전송 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 전송하며, 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보가 상기 크로마 변환 블록에 대한 레지듀얼 정보가 존재하지 않는 것을 지시한 경우에, 상기 루마 변환 블록에 대한 레지듀얼 정보가 존재하는 것으로 추정될 수도 있다.
(7) (1)에서, 상기 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이며 머지 모드가 적용된 경우에, 상기 현재 예측 유닛에 대한 레지듀얼 정보가 존재하지 않는 경우에 대한 신택스 엘리먼트 값은 이용가능한(available) 신택스 엘리먼트 값에서 제외할 수 있다.
(8) (1)에서, 상기 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이며 머지 모드가 적용된 경우에, 상기 엔트로피 부호화 단계에서, 인덱스 매핑 테이블 상에서 상기 현재 예측 유닛에 대한 레지듀얼 정보가 존재하지 않는 경우에 대한 코드 번호(codeNum)는 이용 불가능(Non-Available: NA)으로 전환하며, 상기 코드 번호보다 큰 값을 가지는 코드 번호들은 1만큼 작은 값으로 전환될 수 있다.
(9) (8)에서, 상기 인덱스 매핑 테이블은 상기 루마 변환 블록에 대한 레지듀얼 정보의 존부에 관한 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부에 대한 정보의 패턴에 대응하는 코드 넘버를 할당하며, 상기 할당된 코드 넘버는 VLC(Variable Length Coding) 테이블 상에서 상기 할당된 코드 넘버에 대응하는 코드워드로 매핑될 수 있다.
(10) 본 발명의 다른 실시형태는 영상 정보의 복호화 방법으로서, 부호화된 정보를 수신하는 단계, 상기 수신한 정보를 엔트로피 복호화하는 단계 및 상기 엔트로피 복호화된 정보를 기반으로 영상을 복원하는 단계를 포함하며, 상기 엔트로피 복호화 단계에서는, 현재 블록이 깊이가 0인 2Nx2N의 블록이며, 상기 현재 블록에 머지 모드가 적용된 경우에, 상기 현재 블록에 대한 레지듀얼 신호가 존재하는 것으로 추정할 수 있다.
(11) (10)에서, 상기 현재 블록에 적용된 엔트로피 부호화의 모드가 CABAC(Context-Adaptive Binary Arithmetic Coding)이고, 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 적용된 예측 모드가 머지 모드인 경우에, 상기 엔트로피 복호화 단계에서는 상기 현재 블록에 대한 레지듀얼 정보의 존재를 추정할 수 있다.
(12) (11)에서, 상기 수신 단계에서는, 상기 현재 블록에 대한 레지듀얼 신호의 존부에 관한 정보를 수신하지 않을 수 있다.
(13) (10)에서, 상기 현재 블록에 대한 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 머지 모드가 적용된 경우에는, 상기 엔트로피 복호화 단계에서 상기 현재 블록의 루마 변환 블록에 대한 레지듀얼 정보 및 크로마 변환 블록의 레지듀얼 정보 중 적어도 하나의 존재를 추정할 수 있다.
(14) (13)에서, 상기 수신 단계에서는 상기 현재 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보가 수신하지 않으며, 상기 엔트로피 복호화 단계에서는 상기 루마 변환 블록에 대한 레지듀얼 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보가 모두 존재하는 것으로 추정할 수 있다.
(15) (13)에서, 상기 수신 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 수신할 수 있으며, 상기 엔트로피 복호화 단계에서는 상기 루마 변환 블록에 대한 레지듀얼 정보의 존재를 추정할 수 있다.
(16) (13)에서, 상기 수신 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 수신할 수 있으며, 상기 엔트로피 복호화 단계에서는, 상기 크로마 변환 블록에 대한 레지듀얼 정보가 존재하지 않는 경우에 상기 루마 변환 블록에 대한 레지듀얼 정보의 존재를 추정할 수 있다.
(17) (10)에서, 상기 현재 블록에 대한 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 머지 모드가 적용된 경우에, 상기 엔트로피 복호화 단계에서는, 상기 현재 블록에 대한 레지듀얼 정보가 존재하지 않는 경우에 대한 신택스 엘리먼트 값을 이용가능한(available) 신택스 엘리먼트 값에서 제외할 수 있다.
(18) (10)에서, 상기 현재 블록에 대한 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 머지 모드가 적용된 경우에, 상기 엔트로피 복호화 단계에서, 인버스 인덱스 매핑 테이블 상에서 상기 현재 블록에 대한 레지듀얼 정보가 존재하지 않는 경우의 코드 번호(codeNum)는 이용 불가능(Non-Available: NA)로 전환하며, 상기 코드 번호보다 같거나 작은 값을 가지는 코드 번호들은 1만큼 더 큰 값으로 전환될 수 있다.
(19) (18)에서, 상기 인버스 인덱스 매핑 테이블은, 상기 수신된 정보에 대응하는 코드 넘버를 상기 루마 변환 블록에 대한 레지듀얼 정보의 존부에 관한 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부에 대한 정보의 패턴에 매핑시킬 수 있다.
본 발명에 의하면, 화면 간 예측의 각 모드들에 대한 정보 전송의 중복성을 고려함으로써 전송 정보량을 줄일 수 있다.
본 발명에 의하면, 화면 간 예측의 각 모드들에 대한 정보 전송의 중복성을 고려한신택스를 이용함으로써, 정보 전송량을 줄일 수 있다.
본 발명에 의하면, 엔트로피 부호화 및 엔트로피 복호화를 수행할 때 정보의 중복성을 고려함으로써 전송 정보량을 줄일 수 있다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치(부호화기)를 개략적으로 도시한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 영상 복호화기를 개략적으로 나타낸 블록도이다.
도 3은 머지 모드에서 현재 블록의 머지 대상이 되는 후보 블록들의 일 예를 개략적으로 나타낸 것이다.
도 4는 머지 모드에서 현재 블록의 머지 대상이 되는 후보 블록들의 다른 예를 개략적으로 나타낸 것이다.
도 5는 VLC 테이블을 이용한 엔트로피 부호화 방법의 일 예를 개략적으로 도시한 것이다.
도 6은 VLC 테이블을 이용한 엔트로피 복호화 방법의 일 예를 개략적으로 도시한 것이다.
도 7은 본 발명이 적용되는 시스템에서 부호화기의 동작을 개략적으로 설명하는 순서도이다.
도 8은 본 발명이 적용되는 시스템에서 복호화기의 동작을 개략적으로 설명하는 순서도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니다. 본 명세서에서 사용하는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명의 기술적 사상을 한정하려는 의도로 사용되는 것은 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
한편, 본 발명에서 설명되는 도면상의 각 구성들은 영상 부호화/복호화 장치에서 서로 다른 특징적인 기능들에 관한 설명의 편의를 위해 독립적으로 도시된 것으로서, 각 구성들이 서로 별개의 하드웨어나 별개의 소프트웨어로 구현된다는 것을 의미하지는 않는다. 예컨대, 각 구성 중 두 개 이상의 구성이 합쳐져 하나의 구성을 이룰 수도 있고, 하나의 구성이 복수의 구성으로 나뉘어질 수도 있다. 각 구성이 통합 및/또는 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리범위에 포함된다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 이하, 도면상의 동일한 구성 요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성 요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치(부호화기)를 개략적으로 도시한 블록도이다. 도 1을 참조하면, 영상 부호화 장치(100)는 픽처 분할부(105), 예측부(110), 변환부(115), 양자화부(120), 재정렬부(125), 엔트로피 부호화부(130), 역양자화부(135), 역변환부(140), 필터부(145) 및 메모리(150)를 구비한다.
픽처 분할부(105)는 입력된 픽처를 적어도 하나의 처리 단위로 분할할 수 있다. 이때, 처리 단위는 예측 유닛(Prediction Unit, 이하 ‘PU’라 함)일 수도 있고, 변환 유닛(Transform Unit, 이하 ‘TU’라 함)일 수도 있으며, 코딩 유닛(Coding Unit, 이하 ‘CU’라 함)일 수도 있다.
예측부(110)는 후술하는 바와 같이, 화면 간 예측을 수행하는 화면 간 예측부와 화면 내 예측을 수행하는 화면 내 예측부를 포함한다. 예측부(110)는, 픽처 분할부(105)에서 픽처의 처리 단위에 대하여 예측을 수행하여 예측 블록을 생성한다. 예측부(110)에서 픽처의 처리 단위는 CU일 수도 있고, TU일 수도 있고, PU일 수도 있다. 또한, 해당 처리 단위에 대하여 실시되는 예측이 화면 간 예측인지 화면 내 예측인지를 결정하고, 각 예측 방법의 구체적인 내용(예컨대, 예측 모드 등)를 정할 수 있다. 이때, 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 다를 수 있다. 예컨대, 예측의 방법과 예측 모드 등은 PU 단위로 결정되고, 예측의 수행은 TU 단위로 수행될 수도 있다.
화면 간 예측을 통해서는 현재 픽처의 이전 픽처 및/또는 이후 픽처 중 적어도 하나의 픽처의 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다. 또한, 화면 내 예측을 통해서는 현재 픽처 내의 화소 정보를 기초로 예측을 수행하여 예측 블록을 생성할 수 있다.
화면 간 예측에서는 PU에 대하여, 참조 픽처를 선택하고 PU와 동일한 크기의 참조 블록을 정수 화소 샘플 단위로 선택할 수 있다. 이어서, 현재 PU와의 레지듀얼(residual) 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되는 예측 블록을 생성한다. 화면 내 예측의 방법으로서, 스킵(skip) 모드, 머지(merge) 모드, MVP(Motion Vector Predtiction) 등을 이용할 수 있다. 예측 블록은 1/2 화소 샘플 단위와 1/4 화소 샘플 단위와 같이 정수 이하 샘플 단위로 생성될 수도 있다. 이때, 움직임 벡터 역시 정수 화소 이하의 단위로 표현될 수 있다. 예컨대 휘도 화소에 대해서는 1/4 화소 단위로, 색차 화소에 대해서는 1/8 화소 단위로 표현될 수 있다.
화면 간 예측을 통해 선택된 참조 픽처의 인덱스, 움직임 벡터(ex. Motion Vector Predictor), 레지듀얼 신호 등의 정보는 엔트로피 부호화되어 복호화기에 전달된다.
화면 내 예측을 수행하는 경우에는, PU 단위로 예측 모드가 정해져서 PU 단위로 예측이 수행될 수 있다. 또한, PU 단위로 예측 모드가 정해지고 TU 단위로 화면 내 예측이 수행될 수도 있다.
화면 내 예측에서 예측 모드는 33개의 방향성 예측 모드와 적어도 2개 이상의 비방향성 모드를 가질 수 있다. 비방향성 모드는 DC 예측 모드 및 플레너 모드(Planar 모드)을 포함할 수 있다.
화면 내 예측에서는 예측 모드에 따라 참조 화소에 AIS(Adaptive Intra Smoothing) 필터를 적용한 후 예측 블록을 생성할 수 있다. 참조 화소에 적용되는 AIS 필터의 종류는 상이할 수 있다. 또한, 화면 내 예측에서는 현재 블록의 예측 모드에 따라 참조 화소를 1/8 화소 단위로 보간하여 예측을 수행할 수 있다.
PU는 다양한 사이즈/형태를 가질 수 있으며, 예컨대 화면 간 예측의 경우에 PU는 2N×2N, 2N×N, N×2N, 또는 N×N 등의 크기를 가질 수 있다. 화면 내 예측의 경우에 PU는 2N×2N 또는 N×N (N은 정수) 등의 크기를 가질 수 있다. 이때, N×N 크기의 PU는 특정한 경우에만 적용하도록 설정할 수 있다. 예컨대 최소 크기 코딩 유닛에 대해서만 NxN의 PU를 이용하도록 정하거나 화면 내 예측에 대해서만 이용하도록 정할 수도 있다. 또한, 상술한 크기의 PU 외에, N×mN, mN×N, 2N×mN 또는 mN×2N (m<1) 등의 크기를 가지는 PU를 더 정의하여 사용할 수도 있다.
생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(115)로 입력된다. 또한, 예측을 위해 사용한 예측 모드 정보, 움직임 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(130)에서 부호화되어 복호화기에 전달된다.
변환부(115)는 변환 단위로 레지듀얼 블록에 대한 변환을 수행하고 변환 계수를 생성한다. 변환부(115)에서의 변환 단위는 TU일 수 있으며, 쿼드 트리(quad tree) 구조를 가질 수 있다. 이때, 변환 단위의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 변환부(115)는 레지듀얼 블록을 DCT(Discrete Cosine Transform) 및/또는 DST(Discrete Sine Transform)를 이용하여 변환할 수 있다.
양자화부(120)는 변환부(115)에서 변환된 레지듀얼 값들을 양자화하여 양자화 계수를 생성할 수 있다. 양자화부(120)에서 산출된 값은 역양자화부(135)와 재정렬부(125)에 제공된다.
재정렬부(125)는 양자화부(120)로부터 제공된 양자화 계수를 재정렬한다. 양자화 계수를 재정렬함으로써 엔트로피 부호화부(130)에서의 부호화의 효율을 높일 수 있다. 재정렬부(125)는 계수 스캐닝(Coefficient Scanning) 방법을 통해 2차원 블록 형태의 양자화 계수들을 1차원의 벡터 형태로 재정렬할 수 있다. 재정렬부(125)에서는 양자화부에서 전송된 계수들의 확률적인 통계를 기반으로 계수 스캔닝의 순서를 변경함으로써 엔트로피 부호화부(130)에서의 엔트로피 부호화 효율을 높일 수도 있다.
엔트로피 부호화부(130)는 재정렬부(125)에 의해 재정렬된 양자화 계수들에 대한 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화에는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법을 사용할 수 있다. 엔트로피 부호화부(130)는 재정렬부(125) 및 예측부(110)로부터 전달받은 CU의 양자화 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, PU 정보 및 전송 단위 정보, 움직임 벡터 정보, 참조 픽처 정보, 블록의 보간 정보, 필터링 정보 등 다양한 정보를 부호화할 수 있다.
또한, 엔트로피 부호화부(130)는 필요한 경우에, 전송하는 파라미터 셋 또는 신택스에 일정한 변경을 가할 수도 있다.
역양자화부(135)는 양자화부(120)에서 양자화된 값들을 역양자화하고, 역변환부(140)는 역양자화부(135)에서 역양자화된 값들을 역변환한다. 역양자화부(135) 및 역변환부(140)에서 생성된 레지듀얼 값은 예측부(110)에서 예측된 예측 블록과 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다.
필터부(145)는 디블록킹 필터, ALF(Adaptive Loop Filter), SAO(Sample Adaptive Offset)를 복원된 픽처에 적용할 수 있다.
디블록킹 필터는 복원된 픽처에서 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. ALF(Adaptive Loop Filter)는 디블록킹 필터를 통해 블록이 필터링된 후 복원된 영상과 원래의 영상을 비교한 값을 기초로 필터링을 수행할 수 있다. ALF는 고효율을 적용하는 경우에만 수행될 수도 있다. SAO는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 화소 단위로 원본 영상과의 오프셋 차이를 복원하며, 밴드 오프셋(Band Offset), 에지 오프셋(Edge Offset) 등의 형태로 적용된다.
한편, 화면 간 예측에 사용되는 복원 블록에 대해서 필터부(145)는 필터링을 적용하지 않을 수 있다.
메모리(150)는 필터부(145)를 통해 산출된 복원 블록 또는 픽처를 저장할 수 있다. 메모리(150)에 저장된 복원 블록 또는 픽처는 화면 간 예측을 수행하는 예측부(110)에 제공될 수 있다.
도 2는 본 발명의 일 실시예에 따른 영상 복호화기를 개략적으로 나타낸 블록도이다. 도 2를 참조하면, 영상 복호화기(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 예측부(230), 필터부(235) 메모리(240)를 포함할 수 있다.
영상 부호화기에서 영상 비트 스트림이 입력된 경우, 입력된 비트 스트림은 영상 부호화기에서 영상 정보가 처리된 절차에 따라서 복호화될 수 있다.
예컨대, 영상 부호화기에서 엔트로피 부호화를 수행하기 위해 CAVLC 등의 가변 길이 부호화(Variable Length Coding: VLC, 이하 ‘VLC’ 라 함)가 사용된 경우에, 엔트로피 복호화부(210)도 부호화기에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 복호화를 수행할 수 있다. 또한, 영상 부호화기에서 엔트로피 부호화를 수행하기 위해 CABAC을 이용한 경우에, 엔트로피 복호화부(210)는 이에 대응하여 CABAC을 이용한 엔트로피 복호화를 수행할 수 있다.
엔트로피 복호화부(210)에서 복호화된 정보 중 예측 블록을 생성하기 위한 정보는 예측부(230)로 제공되고 엔트로피 복호화부에서 엔트로피 복호화가 수행된 레지듀얼 값은 재정렬부(215)로 입력될 수 있다.
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트 스트림을 영상 부호화기에서 재정렬한 방법을 기초로 재정렬할 수 있다. 재정렬부(215)는 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 재정렬부(215)는 부호화기에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 해당 부호화부에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통해 재정렬을 수행할 수 있다.
역양자화부(220)는 부호화기에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다.
역변환부(225)는 영상 부호화기에서 수행된 양자화 결과에 대해, 부호화기의 변환부가 수행한 DCT 및 DST에 대해 역DCT 및/또는 역DST를 수행할 수 있다. 역변환은 부호화기에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다. 부호화기의 변환부에서 DCT 및/또는 DST는 예측 방법, 현재 블록의 크기 및 예측 방향 등 복수의 정보에 따라 선택적으로 수행될 수 있고, 복호화기의 역변환부(225)는 부호화기의 변환부에서 수행된 변환 정보를 기초로 역변환을 수행할 수 있다.
예측부(230)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성 관련 정보와 메모리(240)에서 제공된 이전에 복호화된 블록 및/또는 픽처 정보를 기초로 예측 블록을 생성할 수 있다. 복원 블록은 예측부(230)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용해 생성될 수 있다. 현재 PU에 대한 예측 모드가 인트라 예측(intra prediction) 모드(화면 내 예측 모드)인 경우에, 현재 픽처 내의 화소 정보를 기초로 예측 블록을 생성하는 화면 내 예측을 수행할 수 있다.
현재 PU에 대한 예측 모드가 인터 예측(inter prediction) 모드(화면 간 예측 모드)인 경우에, 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나의 픽처에 포함된 정보를 기초로 현재 PU에 대한 화면 간 예측을 수행할 수 있다. 이때, 영상 부호화기에서 제공된 현재 PU의 화면 간 예측에 필요한 움직임 정보, 예컨대 움직임 벡터, 참조 픽처 인덱스 등에 관한 정보는 부호화기로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.
복원된 블록 및/또는 픽처는 필터부(235)로 제공될 수 있다. 필터부(235)는 복원된 블록 및/또는 픽처에 디블록킹 필터링, SAO(Sample Adaptive Offset) 및/또는 적응적 루프 필터링 등을 적용한다.
메모리(240)는 복원된 픽처 또는 블록을 저장하여 참조 픽처 또는 참조 블록으로 사용할 수 있도록 할 수 있고 또한 복원된 픽처를 출력부로 제공할 수 있다.
한편, 현재 블록의 화면 간 예측을 수행하는 경우에, 예측에 따른 전송 정보량을 줄이기 위해 머지(merge) 모드, 스킵(skip) 모드 또는 다이렉트(direct) 모드 등의 예측 모드를 이용할 수 있다.
머지 모드에서 하나의 CU는 수직 또는 수평의 인접한 다른 블록과 머지할 수 있다. 여기서, 머지(merge)한다는 것은, 현재 블록의 화면 간 예측에 있어서, 예측 정보를 인접한 블록의 화면 간 예측 정보로부터 얻어 오는 것을 말한다. 현재 블록의 머지에 관한 정보는, 현재 블록이 머지 되었는지 여부를 나타내는 정보, 예컨대 머지 플래그(merge_flag), 현재 블록의 좌측 인접 블록 또는 상측 인접 블록 등과 같이 현재 블록이 어떤 인접 블록과 머지 하는지를 나타내는 정보, 예컨대 머지 인덱스(merge_index) 등을 이용하여 표현할 수 있다. 이때, 현재 블록이 어느 블록과 머지 하는지를 나타내는 정보는 현재 블록이 머지 되었음을 지시하는 경우(예컨대, merge_flag=1)에만 획득되도록 할 수도 있다.
도 3은 머지 모드에서 현재 블록의 머지 대상이 되는 후보 블록들의 일 예를 개략적으로 나타낸 것이다. 도 3을 참조하면, 현재 블록(310)의 좌측 영역에서 인접하는 블록의 화면 간 예측 정보(A, D), 상측 영역에서 인접하는 블록의 화면 간 예측 정보(B, C) 및 동일 위치(co-located)의 시간적(temporal) 인접 블록의 화면 간 예측 정보(T)가, 현재 블록의 머지 후보들이 될 수 있다. 구체적으로, 도 3에서 인접 블록들의 화면 간 예측 정보(A, B, C, D)는 현재 픽처에서 이미 복원된 영역의 화면 간 예측 정보를 나타낸다. 또한, 화면 간 예측 정보(T)는, 이미 복원된 픽처의 특정 위치, 예를 들면 동일 위치 블록(co-located block)에서의 화면 간 예측 정보를 나타낸다. 이 화면 간 예측 정보들 중에서 어떤 인접 블록의 화면 간 예측 정보를 현재 블록에 대하여 사용할 것인지, 현재 블록을 어떤 인접 블록에 머지할 것인지는 상술한 머지 인덱스(merge_index)를 이용하여 나타낼 수 있다.
도 4는 머지 모드에서 현재 블록의 머지 대상이 되는 후보 블록들의 다른 예를 개략적으로 나타낸 것이다. 도 4를 참조하면, 이 경우에도 현재 블록(410)의 좌측과 상측 영역 인접 블록의 화면 간 예측 정보를 현재 블록에 이용할 수 있다. 도 4의 경우에는, 현재 블록(410)의 좌측 영역에서 인접하는 블록의 화면 간 예측 정보(E0, E1), 상측 영역에서 인접하는 블록의 화면 간 예측 정보(F0, F1, F2) 및 동일 위치(co-located)의 시간적(temporal) 인접 블록의 화면 간 예측 정보(T’) 가 현재 블록(410)의 머지 후보들이 될 수 있다. 현재 블록(410)을 어떤 인접 블록에 머지 하여, 어떤 화면 간 예측 정보를 현재 블록에 이용할 것인지는 머지 인덱스(merge_index)를 이용하여 나타낼 수 있다.
스킵 모드(skip mode)에서는 현재 블록에 대한 움직임(motion) 벡터 정보 외의 신택스 정보를 전송하지 않는다. 움직임 벡터 정보는 현재 블록에 인접한 블록들 중에서 어느 한 블록을 지정하여 해당 블록의 움직임 벡터 정보를 현재 블록에 이용하도록 하는 방식으로 전송될 수도 있다. 다이렉트 모드(direct mode)에서는 움직임(motion) 정보 자체도 전송되지 않는다.
한편, 스킵 모드에서는 현재 블록의 화면 간 예측 정보를 획득하기 위해, 상기 머지 모드에서 사용하는 방법과 동일한 방법을 사용하도록 할 수 있다. 예컨대, 머지 후보가 도 3과 같은 경우에는, 도 3에 도시된 바와 같은 현재 블록의 인접 블록들이 머지 후보로 사용되는 경우에는, 스킵 모드에서도 머지 인덱스(merge_index)에 의해 지시된 블록의 화면 간 예측 정보를 그대로 현재 블록의 화면 간 예측 정보로 사용할 수 있다. 머지 후보가 도 4와 같은 경우에도, 스킵 모드에서 머지 인덱스(merge_index)에 의해 지시된 블록의 화면 간 예측 정보를 그대로 현재 블록의 화면 간 예측 정보로 사용할 수 있다.
스킵 모드와 머지 모드에서 현재 블록에 대한 화면 간 예측 정보를 획득하기 위해 동일한 방법(예컨대, 동일한 후보 블록)을 사용할 때, 어떤 CU에 대해 스킵 모드가 적용된 경우와 2Nx2N 파티션(partition)을 갖는 일반적인 인터 모드로서 2Nx2N의 해당 블록에 대해 머지 모드가 적용되었지만 레지듀얼 정보가 없는 경우를 고려할 수 있다. 즉, 2Nx2N 블록에 스킵 모드가 적용된 경우와 머지 모드가 적용되었으나 레지듀얼 정보가 없는 경우는, 서로 표현 방법이 다르지만, 머지 인덱스가 동일한 경우에는 동일한 디코딩 결과를 얻게 된다. 결과적으로, 부호화기로부터 전송되는 신택스 상에서 중복성이 존재할 수 있다.
따라서, 전송 정보상의 중복성을 제거하기 위해, 일반적인 인터 모드로서 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서는, 레지듀얼 정보가 존재한다고 결정하고, 관련 신택스를 전송하지 않고 추정(infer)하도록 할 수 있다. 예컨대 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서는, 레지듀얼 정보의 존재에 관한 신택스를 전송하지 않고, 레지듀얼 정보가 존재하는 것으로 신택스 값들이 추정되도록 할 수 있다.
이 경우, 엔트로피 코딩 모드가 CABAC(Context-based Adaptive Binary Arithmetic Coding)인지 CAVLC(Context-based Adaptive Variable Length Coding)인지에 따라 다르게 대처할 수 있다.
CABAC은 콘택스트에 따라서 각 신택스 엘리먼트(element)에 대한 확률 모델을 선택하고, 내부적인 통계를 통해 확률 모델의 확률을 변경하며, 산술 코딩을 이용해서 압축을 수행한다. 스킵 모드가 아닌 일반적인 인터 모드로서 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서 엔트로피 코딩의 모드가 CABAC인 경우에는 레지듀얼 정보가 없음을 나타내는 정보를 전송하지 않고, 레지듀얼 정보가 존재하는 것으로 추정하여 복호화가 진행되도록 할 수 있다. 예컨대, 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고, no_residual_data_flag의 값을 0으로 추정(infer)하도록 할 수 있다.
엔트로피 코딩 모드로서 CAVLC가 사용되는 경우에는, 각 신택스 엘리먼트에 대해 소정의 VLC(Variavle Length Coding) 테이블을 이용하여 부호화를 수행한다. VLC 테이블에서 해당 신택스 엘리먼트에 대한 코드 넘버(code number)를 획득한 후 대응하는 소팅 테이블(sorting table)의 테이블 인덱스를 매핑해서 심볼값을 얻게 된다. 소팅 테이블의 테이블 인덱스는 콘텍스트를 반영하여 스와핑될 수 있으며, 각 심볼의 코드워드를 적응적으로 조절하게 된다.
CABAC의 경우와 달리, CAVLC가 사용되는 경우에는 레지듀얼 정보가 존재하지 않는다는 것을 지시하기 위해 전송되는 신택스가 따로 사용되지 않는다. 따라서, 일반적인 인터 모드로서 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서 엔트로피 코딩의 모드가 CAVLC인 경우에는, 레지듀얼 정보의 존재를 지시하는 정보에 대한 중복성을 제거하기 위해 다음과 같은 방법을 이용할 수 있다. 예컨대, CAVLC의 경우에는, 루마(Y), 크로마(U, V) 각각에 대하여 코딩된 정보, 즉 변환 계수를 가지는 블록이 있는지를 나타내는 코디드 블록 플래그(Coded Block Flag: cbf, 이하 ‘cbf’라 함)와 변환 부호화를 위해 현재 블록이 더 작은 블록으로 분할(split)하는지를 나타내는 분할 변환 플래그(transform_split_flag 혹은 split_transform_flag)을 조인트 코딩될 수 있다.
루마(Y)에 대한 cbf 값은 cbf_luma[x0][y0][trafoDepth]로 나타낼 수 있다. cbf_luma의 값이 1인 경우에는 루마 변환 블록이 하나 이상의 0이 아닌 변환 계수 레벨을 갖는 것을 나타낸다. 어레이 인덱스 x0과 y0은 픽처의 좌상측(top-left) 루마 샘플에 대한 대상 변환 블록(considered transform block)의 좌상측(top-left) 루마 샘플의 위치를 특정할 수 있다. 어레이 인덱스 trafoDepth는 변환 코딩을 위해 블록으로 나뉘어진 CU의 현재 서브디비전(subdivision) 레벨을 특정할 수 있다. 예컨대, trafoDepth의 값이 0인 블록은 CU에 대응하게 된다.
크로마에 대한 cbf 값 중 Cb에 대한 cbf 값은 cbf_cb[x0][y0][trafoDepth]로 나타낼 수 있다. cbf_cb의 값이 1인 경우에는 Cb 변환 블록이 하나 이상의 0이 아닌 변환 계수 레벨을 갖는 것을 나타낸다. 어레이 인덱스 x0과 y0은 픽처의 좌상측(top-left) 루마 샘플에 대한 대상 변환 블록(considered transform block)의 좌상측(top-left) 샘플의 위치를 특정할 수 있다. 어레이 인덱스 trafoDepth는 변환 코딩을 위해 블록으로 나뉘어진 CU의 현재 서브디비전(subdivision) 레벨을 특정할 수 있다. 예컨대, trafoDepth의 값이 0인 블록은 CU에 대응하게 된다.
크로마에 대한 cbf 값 중 Cr에 대한 cbf 값은 cbf_cr[x0][y0][trafoDepth]로 나타낼 수 있다. cbf_cr의 값이 1인 경우에는 Cr 변환 블록이 하나 이상의 0이 아닌 변환 계수 레벨을 갖는 것을 나타낸다. 어레이 인덱스 x0과 y0은 픽처의 좌상측(top-left) 루마 샘플에 대한 대상 변환 블록(considered transform block)의 좌상측(top-left) 샘플의 위치를 특정할 수 있다. 어레이 인덱스 trafoDepth는 변환 코딩을 위해 블록으로 나뉘어진 CU의 현재 서브디비전(subdivision) 레벨을 특정할 수 있다. 예컨대, trafoDepth의 값이 0인 블록은 CU에 대응하게 된다.
분할 변환 플래그는 split_transform_flag[x0][y0][trafoDepth] 또는 transform_split_flag[x0][y0][trafoDepth]로 나타낼 수 있다. 분할 변환 플래그는 변환 코딩을 위해 블록이 더 작은 수평 혹은 수직 사이즈를 갖는 네 개의 블록으로 분할되는지를 지시한다. 어레이 인덱스 x0과 y0은 픽처의 좌상측(top-left) 루마 샘플에 대한 대상 변환 블록(considered transform block)의 좌상측(top-left) 샘플의 위치를 특정할 수 있다. 어레이 인덱스 trafoDepth는 변환 코딩을 위해 블록으로 나뉘어진 CU의 현재 서브디비전(subdivision) 레벨을 특정할 수 있다. 예컨대, trafoDepth의 값이 0인 블록은 CU에 대응하게 된다.
cbf_luma, cbf_cb, cbf_cr 및 분할 변환 플래그를 상술한 바와 같이 조인트 코딩하여 하나의 정보로 나타낼 수 있다. 조인트 코딩된 정보는 루마 블록과 크로마 블록에 0이 아닌 변환 계수 레벨이 존재하는지에 대한 패턴(Coded Block Pattern)과 블록의 분할 여부를 지시하며, 예컨대, cbp_and_split_transform으로 표현할 수 있다. cbp_and_split_transform는 복수의 코디드 블록 플래그 및/또는 분할 변환 플래그를 포함할 수 있다.
플래그 패턴(flagPattern)에 따라서, cbp_and_split_transform의 값은 표 1과 같이 정의될 수 있다.
<표 1>
Figure pct00001
여기서, Luma, Cb, Cr 및 Split은 각각 cbf_luma[x0][y0][trafoDepth], cbf_cb[x0][y0][trafoDepth], cbf_cr[x0][y0][trafoDepth] 및 split_transform_flag[x0][y0][trafoDepth]의 값을 나타낸다. 또한, Luma1, Luma2 및 Luma3은 cbf_luma[x1][y1][trafoDepth], cbf_luma[x2][y2][trafoDepth] 및 cbf_luma[x3][y3][trafoDepth]를 나타낸다.
블록이 4개의 하위 블록으로 분할될 때, x0, y0, x1, y1, x2, y2, x3, y3은 분할된 네 블록에서 좌상측 샘플의 위치를 낸다.
분할 전 블록의 폭과 높이를 각각 log2TrafoWidth, log2TrafoHeight로 나타낸다면, 원래 블록의 수평 사이즈의 절반인 수평 사이즈 및 원래 블록의 수직 사이즈의 절반인 수직 사이즈를 가지는 네 개의 블록으로 분할되는 경우에, x1, y1, x2, y2, x3, y3은 수학식 1과 같다.
Figure pct00002
원래 블록의 수평 사이즈와 동일한 수평 사이즈를 갖되 원래 블록의 수직 사이즈의 1/4인 수직 사이즈를 가지는 네 블록으로 분할되거나, 원래 블록의 수직 사이즈와 동일한 수직 사이즈를 갖되 원래 블록의 수평 사이즈의 1/4인 수평 사이즈를 가지는 네 블록으로 분할되는 경우에는 수학식 2와 같이 x1, y1, x2, y2, x3, y3를 나타낼 수 있다.
Figure pct00003
수학식 2에서 D는 분할된 블록이 원래 블록과 동일한 수평 사이즈와 1/4의 수직 사이즈를 가지는 경우에는 0의 값으로, 원래 블록과 동일한 수직 사이즈와 1/4의 수평 사이즈를 가지는 경우에는 1의 값으로 정의될 수 있다.
또한, 플래그 값은 신택스 엘리먼트 cbp_and split_transform에 포함된 관련 cbf_luma, cbf_cb, cbf_cr, 분할 변환 플래그(split_transform_flag)로부터 특정될 수 있다. 구체적으로, cbf_luma, cbf_cb, cbf_cr, 분할 변환 플래그(split_transform_flag)로부터 특정되는 codeLuma, codeCb, codeCr, codeSplitTrans로부터 수학식 3과 같이 플래그 패턴을 구할 수 있다.
Figure pct00004
수학식 3에서, log2TrafoSize는 현재 블록의 사이즈를 특정하며, Log2MinTrafoSize, Log2MaxTrafoSize 및 maxDepth는 현재 블록이 가질 수 있는 최소 사이즈, 최대 사이즈 및 최대 깊이를 특정한다. intraSplitFlag는 화면 내 예측 모드(인트라 모드)에서 해당 블록이 형태를 지시한다. 예컨대, intraSplitFlag의 값이 0이면 2Nx2N 블록, 1이면 NxN 블록을 지시할 수 있다.
한편, 상술한 바와 같이, 스킵 모드가 아닌 일반적인 인터 모드로서 2Nx2N 파티션을 가지며 머지 모드가 적용되는 경우에는 레지듀얼 신호가 존재하는 것으로 결정함으로써, 스킵 모드와 머지 모드 사이의 중복성을 제거할 수 있다.
이하, 스킵 모드와 머지 모드 사이의 중복성을 제거하기 위해서, 스킵 모드가 아닌 일반적인 인터 모드로서 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대한 처리 방법을 신택스 상에서의 처리 방법과 파싱(parsing) 과정에서의 처리 방법으로 나누어 설명한다.
<신택스 상에서의 처리 방법>
우선 엔트로피 코딩의 모드가 CAVLC인 경우에 스킵 모드가 아닌 일반적인 인터 모드로서 2Nx2N 파티션을 가지며 머지 모드에 대해서는 Y, U, V에 대한 cbf의 값을 추정하고 분할 변환 플래그를 독립적으로 전송하는 방법을 이용할 수 있다.
표 2는 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서, 엔트로피 코딩 모드가 CABAC인 경우에 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고 no_residual_data_flag의 값을 0으로 추정(infer)하며, 엔트로피 코딩 모드가 CAVLC인 경우에 루마(Y), 크로마(U, V)에 대한 cbf의 값을 모두 1로 추정(infer)하고 분할 변환 플래그를 독립적으로 전송하는 신택스 구조의 일 예를 개략적으로 나타낸 것이다.
<표 2>
Figure pct00005
표 3은 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서, 엔트로피 코딩 모드가 CABAC인 경우에 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고 no_residual_data_flag의 값을 0으로 추정(infer)하며, 엔트로피 코딩 모드가 CAVLC인 경우에 루마(Y), 크로마(U, V)에 대한 cbf의 값을 모두 1로 추정(infer)하고 분할 변환 플래그를 독립적으로 전송하는 신택스 구조의 다른 예를 개략적으로 나타낸 것이다.
<표 3>
Figure pct00006
표 2 및 표 3의 예를 참조하면, 엔트로피 코딩의 모드가 CABAC이면(entropy_coding_mode_flag=1)에, no_residual_data_flag는 파티션 모드가 2Nx2N이고 머지 모드 적용된 경우가 아닐 때 전송된다.
또한, 표 2 및 표 3의 예를 참조하면, 엔트로피 코딩의 모드가 CAVLC이고, 파티션 모드가 2Nx2N이며 머지 모드가 적용된 경우에, cbf_luma, cbf_cb, cbf_cr 값이 전송되지 않고, cbf_luma, cbf_cb, cbf_cr 값이 1로 추정(infer)된다. 표 1의 예에서는 cbf_luma, cbf_cb, cbf_cr 값이 전송되는 경우에 cbf_luma, cbf_cb, cbf_cr 값으로부터 특정되는 codeLuma, codeCb, codeCr 값도 각각 거짓(false)으로 추정된다.
표 4는 상기 표 2의 예를 변환 트리 신택스(transform tree syntax)에 적용한 일 예를 개략적으로 나타낸 것이다.
<표 4>
Figure pct00007
Figure pct00008
표 5는 상기 표 3의 예를 변환 트리 신택스에 적용한 일 예를 개략적으로 나타낸 것이다.
<표 5>
Figure pct00009
Figure pct00010
표 4 및 표 5의 예를 참조하면, 변환 트리 신택스 내에서, 상술한 바와 같이 엔트로피 코딩 모드가 CABAC이면(entropy_coding_mode_flag=1), no_residual_data_flag는 파티션 모드가 2Nx2N이고 머지 모드가 적용된 경우가 아닐 때 전송되고, 파티션 모드가 2Nx2N이고 머지 모드가 적용된 경우에는 no_residual_data_flag가 거짓(false)로 추정(infer)된다.
또한, 표 4 및 표 5의 예를 참조하면, 엔트로피 코딩의 모드가 CAVLC이고, 파티션 모드가 2Nx2N이며 머지 모드가 적용된 경우에, cbf_luma, cbf_cb, cbf_cr 값이 전송되지 않고, cbf_luma, cbf_cb, cbf_cr 값이 1로 추정(infer)된다.
한편, 전체 cbf_luma, cbf_cb, cbf_cr값을 모두 추정하지 않고, cbf_luma, cbf_cb, cbf_cr 중 적어도 하나의 값은 추정하되 나머지 값은 전송하는 방법을 이용할 수도 있다.
표 6은 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서, 엔트로피 코딩 모드가 CABAC인 경우에 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고 no_residual_data_flag의 값을 0으로 추정(infer)하며, 엔트로피 코딩 모드가 CAVLC인 경우에 루마(Y)에 대한 cbf 값을 1로 추정(infer)하고, 크로마(U, V)에 대한 cbf의 값과 분할 변환 플래그를 독립적으로 전송하는 신택스 구조의 일 예를 개략적으로 나타낸 것이다.
<표 6>
Figure pct00011
표 7은 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서, 엔트로피 코딩 모드가 CABAC인 경우에 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고 no_residual_data_flag의 값을 0으로 추정(infer)하며, 엔트로피 코딩 모드가 CAVLC인 경우에 루마(Y)에 대한 cbf 값을 1로 추정(infer)하고, 크로마(U, V)에 대한 cbf의 값과 분할 변환 플래그를 독립적으로 전송하는 신택스 구조의 다른 예를 개략적으로 나타낸 것이다.
<표 7>
Figure pct00012
표 6 및 표 7의 예에서, 엔트로피 코딩의 모드가 CABAC이면(entropy_coding_mode_flag=1), no_residual_data_flag는 파티션 모드가 2Nx2N이고 머지 모드가 적용된 경우가 아닐 때 전송된다.
또한, 표 6 및 표 7의 예를 참조하면, 엔트로피 코딩의 모드가 CAVLC이고, 파티션 모드가 2Nx2N이며 머지 모드가 적용된 경우에, cbf_luma 값이 전송되지 않고, cbf_luma 값이 1로 추정(infer)된다. 이때, 3 개의 신택스, 크로마에 대한 두 개의 cbf와 분할 변환 플래그는 독립적으로 전송된다.
표 6의 예에서는 cbf_luma 값이 전송되는 경우에 cbf_luma 값으로부터 특정되는 codeLuma 값도 거짓(false)으로 추정된다.
표 8은 상기 표 6의 예를 변환 트리 신택스 구조에 적용한 일 예를 개략적으로 나타낸 것이다.
<표 8>
Figure pct00013
Figure pct00014
표 9는 표 7의 예를 변환 트리 신택스에 적용한 일 예를 개략적으로 나타낸 것이다.
<표 9>
Figure pct00015
Figure pct00016
표 8 및 표 9의 예에 나타난 변환 트리 신택스에서는, 엔트로피 코딩의 모드가 CABAC인 경우(entropy_coding_mode_flag=1)에, no_residual_data_flag는 파티션 모드가 2Nx2N이고 머지 모드가 적용된 경우가 아닐 때 전송된다.
또한, 표 8 및 표 9의 예에서, 엔트로피 코딩의 모드가 CAVLC이고, 파티션 모드가 2Nx2N이며 머지 모드가 적용된 경우에, cbf_luma 값이 전송되지 않고, cbf_luma 값이 1로 추정(infer)된다.
표 6 및 표 7의 예와 달리, 루마(Y)보다 크로마(U, V)를 먼저 고려하는 방법을 이용할 수도 있다.
표 10은 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서, 엔트로피 코딩 모드가 CABAC인 경우에 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고 no_residual_data_flag의 값을 0으로 추정(infer)하며, 엔트로피 코딩 모드가 CAVLC인 경우에 먼저 크로마(U, V)에 관한 cbf를 전송하고, 크로마에 관한 두 cbf(cbf_cr, cbf_cb)의 값이 모두 0인 경우에 루마(Y)의 cbf 값을 1로 추정(infer)하는 신택스 구조의 일 예를 개략적으로 나타낸 것이다.
<표 10>
Figure pct00017
또한, 표 11은 2Nx2N 파티션을 가지며 머지 모드가 적용된 블록에 대해서, 엔트로피 코딩 모드가 CABAC인 경우에 레지듀얼 정보가 없음을 나타내는 플래그(no_residual_data_flag)를 전송하지 않고 no_residual_data_flag의 값을 0으로 추정(infer)하며, 엔트로피 코딩 모드가 CAVLC인 경우에 먼저 크로마(U, V)에 관한 cbf를 전송하고, 크로마에 관한 두 cbf(cbf_cr, cbf_cb)의 값이 모두 0인 경우에 루마(Y)의 cbf 값을 1로 추정(infer)하는 신택스 구조의 다른 예를 개략적으로 나타낸 것이다.
<표 11>
Figure pct00018
표 10 및 표 11의 예에서, 엔트로피 코딩의 모드가 CABAC이면(entropy_coding_mode_flag=1), no_residual_data_flag는 파티션 모드가 2Nx2N이고 머지 모드가 적용된 경우가 아닐 때 전송된다.
또한, 표 10 및 표 11의 예를 참조하면, 엔트로피 코딩의 모드가 CAVLC이고, 파티션 모드가 2Nx2N이며 머지 모드가 적용된 경우에, 크로마(U, V)에 관한 두 cbf(cbf_cr, cbf_cb)가 먼저 전송되고, cbf_cr, cbf_cb 값이 모두 0인 경우에는 루마(Y)에 관한 cbf(cbf_luma) 값을 1로 추정(infer)한다. 이 때, 크로마(U, V) 에 관한 두 cbf 값 중 적어도 하나의 값이 1인 경우에는 루마(Y)에 관한 cbf(cbf_luma)를 전송한다.
표 12는 상기 표 10의 예를 변환 트리 신택스 구조에 적용한 일 예를 개략적으로 나타낸 것이다.
<표 12>
Figure pct00019
Figure pct00020
표 13은 상기 표 11의 예를 변환 트리 신택스 구조에 적용한 일 예를 개략적으로 나타낸 것이다.
<표 13>
Figure pct00021
Figure pct00022
표 12 및 표 13에 나타난 변환 트리 신택스에서는, 엔트로피 코딩의 모드가 CABAC이면(entropy_coding_mode_flag=1), no_residual_data_flag는 파티션 모드가 2Nx2N이고 머지 모드가 적용된 경우가 아닐 때 전송된다.
또한, 표 12 및 표 13의 예에서, 엔트로피 코딩의 모드가 CAVLC이고, 파티션 모드가 2Nx2N이며 머지 모드가 적용된 경우에, 크로마(U, V)에 관한 두 cbf(cbf_cr, cbf_cb)가 먼저 전송된다. 크로마(U, V)에 관한 두 cbf_cr, cbf_cb 값이 모두 0인 경우에 루마(Y)에 관한 cbf(cbf_luma) 값은 1로 추정(infer)된다. 크로마(U, V) 에 관한 두 cbf 값 중 적어도 하나의 값이 1인 경우에는 루마(Y)에 관한 cbf(cbf_luma)가 전송된다.
<파싱 과정에서의 처리 방법>
신택스 상에서는 2Nx2N 블록의 머지 모드에 대해서 상술한 바와 같은 예외를 적용하지 않고, 파싱(parsing) 과정에서 2Nx2N 블록의 머지 모드와 스킵 모드 사이의 중복성을 고려할 수도 있다. 즉, 2Nx2N 블록의 머지 모드와 스킵 모드 사이의 중복성은 VLC(Variable Length Coding) 테이블을 이용한 엔트로피 부호화 복호화 과정에서 고려될 수 있다.
표 14 및 표 15는 신택스 상에서 2Nx2N 블록의 머지 모드와 스킵 모드 사이 중복성을 고려하지 않는 경우에 구성 가능한 변환 트리 신택스의 예들을 나타낸 것이다.
<표 14>
Figure pct00023
Figure pct00024
<표 15>
Figure pct00025
표 14 및 표 15의 예와 같이, 신택스 상에서 2Nx2N 블록의 머지에 대해 스킵 모드와의 중복성을 고려하진 않는 경우에 이용한 엔트로피 부호화/복호화 과정에서 VLC 테이블을 이용하여 신택스 엘리먼트를 파싱(parsing)하면서 중복성을 고려할 수 있다.
구체적으로 신택스 엘리먼트 cbp_and_split_transform의 파싱 과정에서, 2Nx2N 블록에 머지 모드가 적용된 경우에, 레지듀얼 신호가 없는 경우를 가능한 신택스 값에서 제외하고 처리함으로써 전송 비트량을 줄일 수 있다. 이 경우에, 스킵 모드의 적용 여부는 부호화 유닛 단위, 즉 trafoDepth가 0인 경우에 판단되므로, 머지 모드와의 중복성이 고려될 수 있는 경우를 trafoDepth가 0인 경우로 한정할 수도 있다.
이하, trafoDepth가 0인 2Nx2N 블록에 머지 모드가 적용되는 경우를 설명의 편의를 위해 2Nx2N_Merge 모드라 한다.
따라서, 2Nx2N_Merge 모드의 경우에, cbf_luma[x0][y0][0], cbf_cb[x0][y0][0] 및 cbf_cr[x0][y0][0]의 값이 모두 0이 되는 경우가 존재하지 않는 것으로 결정하고 가능한 신택스 값에서 cbf_luma[x0][y0][0], cbf_cb[x0][y0][0] 및 cbf_cr[x0][y0][0]의 값이 모두 0이 되는 경우를 제외함으로써, cbp_and_split_transform을 나타내는데 필요한 비트량을 절약할 수 있다. 예컨대, cbp_and_split_transform의 이진화(binarization) 방법이 유너리(unary) VLC 코딩인 경우에는, 최대(max)값이 1만큼 줄어들 수 있다. 또한, 인덱스 매핑 테이블(index mapping table 혹은 소팅(sorting) 테이블이라고도 함)상에서 2Nx2N_Merge 모드의 경우에는 레지듀얼 정보가 없는 것으로 처리할 수도 있다.
이와 관련하여, 도 5는 VLC 테이블을 이용한 엔트로피 부호화 방법의 일 예를 개략적으로 도시한 것이다.
부호화기는 전송하고자 하는 신택스 엘리먼트 값에 대응하는 codeNum을 인덱스 매핑 테이블(510)상에서 할당한다. 예컨대, 신택스 엘리먼트 값 S_n이 입력되면, codeNum_n이 S_n에 할당된다.
인덱스 매핑 테이블(510)상에서 할당된 codeNum에 대해서, 부호화기는 VLC 테이블(520)을 통해 전송할 코드워드(codeword)를 할당한다. 예컨대, codeNum_n이 인덱스 매핑 테이블(510)에서 할당된 경우에, codeNum_n에 대해서 VLC 테이블(520)을 통해 코드워드 C_n이 할당될 수 있다.
인덱스 매핑 테이블(510)은 각 신택스 엘리먼트 값의 빈도에 따라서, 자주 발생하는 신택스 엘리먼트 값에는 VLC 테이블(520)상에서 더 짧은 코드워드에 대응되는 codeNum이 할당되도록 갱신될 수 있다. 부호화기측의 인덱스 매핑 테이블(510)이 갱신되는 경우에는, 복호화기측의 인버스 인덱스 매핑 테이블(inverse index mapping table)도 동일한 방식으로 갱신된다.
또한, 도 5에서는 신택스 엘리먼트 값이 직접 인덱스 매핑 테이블에 입력되는 것으로 설명했으나, 신택스 엘리먼트 값을 인덱스 매핑 테이블을 이용하기 위한 별도의 인덱스로 매핑하는 테이블을 더 거치도록 할 수도 있다.
도 6은 VLC 테이블을 이용한 엔트로피 복호화 방법의 일 예를 개략적으로 도시한 것이다.
복호화기는 수신한 코드워드에 대응하는 codeNum을 인버스 VLC 테이블(inverse VLC table)을 이용해서 할당한다. 예컨대, 코드워드 C_m이 입력되면, 인버스 VLC 테이블을 통해서 C_m에 대응하는 codeNum_m이 할당될 수 있다.
이어서, 인버스 VLC 테이블(610)상에서 할당된 codeNum에 대해서, 복호화기는 인버스 인덱스 매핑 테이블(620)을 통해 신택스 엘리먼트 값을 할당한다. 예컨대, codeNum_m이 인버스 VLC 테이블(510)에서 할당된 경우에, codeNum_m에 대해서 인버스 인덱스 매핑 테이블(620)을 통해 신택스 엘리먼트 값 S_m이 할당될 수 있다.
상술한 바와 같이, 복호화기의 인버스 인덱스 매핑 테이블(610)은, 부호화기의 인덱스 매핑 테이블(inverse index mapping table)과 함께 갱신될 수 있다. 또한, 도 6에서는 인버스 인덱스 매핑 테이블을 통해 신택스 엘리먼트 값이 바로 할당되는 것으로 설명했으나, 인버스 인덱스 매핑 테이블에서 할당된 소정의 인덱스를 신택스 엘리먼트 값에 매핑하는 테이블을 추가적으로 이용할 수도 있다.
따라서, 2Nx2N_Merge 모드의 경우에는, 전송하고자 하는 신텍스 값에 대해 인덱스 매핑 테이블(소팅(sorting) 테이블)에서 할당된 코드 넘버(이하, ‘codeNum’이라 함)가 모든 cbf(cbf_luma, cbf_cb, cbf_cr)의 값이 0인 경우에 대해 할당된 codeNum 보다 큰 경우에는, 전송하고자 하는 신텍스 값이 할당된 codeNum 보다 1 작은 codeNum에 대응하는 코드워드(codeword)를 전송할 수 있다.
복호화기측에서는 신택스 엘리먼트 cbp_and_split_transform을 파싱하는 과정에서 인버스 인덱스 매핑 테이블에 입력된 codeNum이 모든 cbf(cbf_luma, cbf_cb, cbf_cr)의 값이 0인 경우의 codeNum보다 크거나 같으면, 입력된 codeNum의 값에 1을 더해서 원래의 codeNum을 복원할 수 있다.
이처럼, 유너리(unary) VLC에서 최대값이 줄어드는 것과 인덱스 매핑 테이블에서 더 낮은 값의 codeNum을 신택스 엘리먼트 값이 할당하는 것은 모두 VLC 테이블에서 짧은 길이의 코드워드가 할당되도록 한다. 따라서, 전송 정보량을 줄일 수 있게 한다.
한편, 표 1을 참조하면, 플래그 패턴(flagpattern)에 따라서 모든 cbf 값이 0인 경우는 두 종류로 나눌 수 있다. 즉, 표 1의 플래그 패턴 11, 13, 15 등과 같이 분할에 관한 정보가 전송되는 경우와 표 1의 14 등과 같이 분할에 관한 정보가 전송되지 않는 경우를 생각할 수 있다.
예컨대, 플래그 패턴이 14인 경우에는, 표 1과 같이 3 종류의 cbf(cbf_luma, cbf_cb, cbf_cr) 값이 전송된다. 이 경우에는 레지듀얼 정보가 없는 경우로서, 모든 cbf 값이 0인 경우가 존재한다. 이 경우에는, 가능한 신택스 엘리먼트 값들에서 모든 cbf 값이 0이 되는 경우에 대한 신택스 엘리먼트 값을 제외할 수 있다. 예컨대, 인덱스 매핑 테이블상에서 모든 cbf 값이 0이 되는 경우에 대한 codeNum을 NA(non-available) 상태로 설정해서 전송 비트량을 줄일 수 있다.
한편, 플래그 패턴이 15인 경우에는, 표 1과 같이, 3 종류의 cbf(cbf_luma, cbf_cb, cbf_cr)의 값과 분할 변환 플래그(split_transform_flag 또는 transform_split_flag)를 모두 조인트 코딩하여 전송한다. 이 경우에는 레지듀얼 신호가 없는 경우로서, 모든 cbf 값이 0이고 분할 변환 플래그의 값 역시 0인 경우와 모든 cbf 값이 0이고 분할 변환 플래그의 값은 1인 경우의 두 경우가 존재한다. 이 경우에는 가능한 신택스 엘리먼트 값에서 모든 cbf 값이 0인 두 경우에 대한 신택스 엘리먼트 값을 제외할 수 있다.
예컨대, 위 두 경우(모든 cbf 값이 0이고 분할 변환 플래그 값이 0인 경우 및 모든 cbf 값이 0이고 분할 변환 플래그 값이 1인 경우)에 대한 codeNum 값을 a와 b (a<b)이고, 전송하고자 하는 신택스 엘리먼트 값에 대한 codeNum 값이 c인 경우를 가정하자.
부호화기에서는, c가 a보다 작으면, 전송하고자 하는 신택스 엘리먼트에 대한 codeNum 값으로 c를 그대로 사용한다. 부호화기는 VLC 테이블상에서 codeNum이 c인 경우에 대응하는 코드워드를 전송할 수 있다. c가 a보다 크고 b보다 작은 경우에는, 전송하고자 하는 신택스 엘리먼트에 대한 codeNum 값으로 c-1을 사용한다. 부호화기는 VLC 테이블상에서 codeNum이 c-1인 경우에 대응하는 코드워드를 전송할 수 있다. c가 b보다 큰 경우에는, 전송하고자 하는 신택스 엘리먼트에 대한 codeNum 값으로 c-2를 사용한다. 부호화기는 VLC 테이블상에서 codeNum이 c-2인 경우에 대응하는 코드워드를 전송할 수 있다.
복호화기에서는, 파싱한 codeNum c의 값이 a 보다 작으면, codeNum 값으로 c를 그대로 사용한다. 복호화기는 인버스 인덱스 매핑 테이블상에서 c값에 대응하는 신택스 엘리먼트 값을 획득할 수 있다. 파싱한 codeNum c의 값이 a보다 크고 b보다 작으면, c+1을 원래의 codeNum 값으로서 사용한다. 복호화기는 인버스 인덱스 매핑 테이블상에서 c+1값에 대응하는 신택스 엘리먼트 값을 획득할 수 있다. 파싱한 codeNum c의 값이 b보다 크면, c+2를 원래의 codeNum 값으로서 사용한다. 복호화기는 인버스 인덱스 매핑 테이블상에서 c+2값에 대응하는 신택스 엘리먼트 값을 획득할 수 있다.
한편, 플래그 패턴이 15인 경우에, 상술한 예와 달리, 모든 cbf 값이 0이고 분할 변환 플래그의 값은 1인 경우는 인터 모드에서 2Nx2N_Merge 모드인지 여부와 상관없이 항상 N/A(Non-Available)인 것으로 처리할 수도 있다. 왜냐하면, 모든 cbf의 값이 0이므로, 분할하여 변환할 필요가 없기 때문이다. 따라서, 플래그 패턴이 15인 경우에도, 2Nx2N_Merge 모드인지를 판단하여, 2Nx2N_Merge 모드인 경우에 제외되는 신택스 엘리멘트 값은 하나가 되도록 할 수도 있다.
예컨대, 모든 cbf 값이 0이고 분할 변환 플래그 값이 0인 경우에 대한 codeNum 값을 a라 하고, 전송하고자 하는 신택스 엘리먼트 값에 대한 codeNum 값이 b인 경우를 가정하자.
부호화기에서는, b가 a보다 작으면, 전송하고자 하는 신택스 엘리먼트에 대한 codeNum 값으로 b를 그대로 사용한다. 부호화기는 VLC 테이블상에서 codeNum이 b인 경우에 대응하는 코드워드를 전송할 수 있다.
b가 a보다 큰 경우에는, 전송하고자 하는 신택스 엘리먼트에 대한 codeNum 값으로 b-1을 사용한다. 부호화기는 VLC 테이블상에서 codeNum이 b-1인 경우에 대응하는 코드워드를 전송할 수 있다.
복호화기에서는, 파싱한 codeNum b가 a 보다 작으면, codeNum 값으로 b를 그대로 사용한다. 복호화기는 인버스 인덱스 매핑 테이블상에서 b값에 대응하는 신택스 엘리먼트 값을 획득할 수 있다. 파싱한 codeNum b의 값이 a보다 크면, b+1을 원래의 codeNum 값으로서 사용한다. 복호화기는 인버스 인덱스 매핑 테이블상에서 b+1값에 대응하는 신택스 엘리먼트 값을 획득할 수 있다.
상술한 바와 같이, 2Nx2N_Merge 모드의 경우에는 레지듀얼 정보가 항상 존재한다고 보고, 이에 따라서 엔트로피 코딩 모드가 CAVLC 코딩인 경우에 대한 cbp_and_split_transform 신택스를 조정할 수 있다. 즉, 부호화 유닛의 trafoDepth가 0인 2Nx2N 블록으로서 머지 모드가 적용되는 경우에는 cbf가 모두 0인 경우는 일시적인 이용 불능(disable) 상태로 둘 수 있다.
이 경우에 대한 부호화기 및 복호화기의 동작을 표와 함께 설명한다.
표 16은 플래그 패턴이 11, 13, 15인 경우로서 부호화 유닛이 인터 코딩되는(inter-coded) 경우에 루마(Y) 및 크로마(U, V)에 대한 cbp와 분할 변환 플래그를 조인트 코딩하기 위한 테이블의 예이다. 예컨대, 표 16은 cbp_yuv_split_trans 또는 cbp_and_split_transform에 대한 부호화기측의 인덱스 매핑 테이블(랭킹 테이블) 혹은 복호화기측의 인버스 인덱스 매핑 테이블(인버스 랭킹 테이블)이다.
<표 16>
Figure pct00026
① 부호화기 측면 - 표 16을 참조하면, 2Nx2N_Merge 모드가 아닌 경우에는, 루마(Luma)와 크로마(CbCr)에 대한 cbf 값과 분할 플래그의 조합으로 구성되는 신택스 엘리먼트 값에 대응해서 정상 케이스의 코드워드 인덱스가 codeNum으로서 할당된다. 2Nx2N_Merge 모드의 경우에는 신택스 엘리먼트 값에 대응해서 2Nx2N_Merge 모드의 코드워드 인덱스가 codeNum으로서 할당된다.
구체적으로 2Nx2N_Merge 모드의 경우에는 정상 케이스의 코드워드 인덱스가 2Nx2N_Merge 모드의 코드워드 인덱스로 전환된다. 상술한 바와 같이, 2Nx2N_Merge 모드의 경우에는 모든 cbf 값이 0이 되는 경우는 일시적인 불능(NA)로 설정한다. 따라서, 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 codeNum(코드워드 인덱스)보다 큰 값을 가지는 codeNum(코드워드 인덱스)들은 2Nx2N_Merge 모드의 경우에 1만큼 감소한 codeNum(코드워드 인덱스) 값을 가지게 된다.
codeNum으로서 할당된 코드워드 인덱스는 표 16에 대응하는 VCL 테이블을 통해서 소정의 코드워드에 매핑된다.
표 16을 참조하면, 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 코드워드 인덱스 4는 2Nx2N_Merge 모드에서 NA로 전환된다. 또한, 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 코드워드 인덱스 4보다 큰 값을 가지는 코드워드 인덱스(5, 6)가, 동일한 신택스 엘리먼트에 대한 2Nx2N_Merge 모드에서는 1만큼 감소한 값(4, 5)이 된다.
② 복호화기 측면 - 부호화 유닛이 2Nx2N_Merge 모드로 부호화된 경우에 복호화기는 2Nx2N_Merge 모드에 대한 codeNum를 수신한다. 이때, 복호화기는 수신한 codeNum이 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 codeNum보다 같거나 큰 경우에는 1만큼 더 큰 codeNum으로 복원해서 인버스 인덱스 매핑 테이블을 통해 신택스 엘리먼트 값과 매핑한다. 가령, 부호화 유닛이 2Nx2N_Merge 모드로 부호화된 경우에, A를 cbp_and_split_transform 또는 cbp_yuv_split_trans에 대한 코드워드 인덱스(codeNum) 값이라고 하고, B를 정상 케이스에서 모든 cbf 값이 0일 때의 코드워드 인덱스(codeNum)이라고 하자. A가 B보다 작으면, 코드워드 인덱스(codeNum) 값으로 A를 사용한다. A가 B보다 크거나 같으면, 코드워드 인덱스(codeNum) 값으로 A+1을 사용한다.
표 16을 참조하면, 2Nx2N_Merge 모드에 대한 코드워드 인덱스, 즉 codeNum이 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 코드워드 인덱스 4보다 같거나 큰 경우(4, 5)에는, 1만큼 더 큰 코드워드 인덱스(5, 6)로 복원되어 신택스 엘리먼트 값(cbf_Luma, cbf_CbCr, 분할 플래그 값)에 매핑된다.
표 17은 플래그 패턴이 14인 경우로서 부호화 유닛이 인터 코딩되고 trafoDepth가 0인 경우에 루마(Y) 및 크로마(U, V)에 대한 cbp를 조인트 코딩하기 위한 테이블의 예이다. 예컨대, 표 17은 cbp_yuv_split_trans 또는 cbp_and_split_transform에 대한 부호화기측의 인덱스 매핑 테이블(랭킹 테이블) 혹은 복호화기측의 인버스 인덱스 매핑 테이블(인버스 랭킹 테이블)이다.
<표 17>
Figure pct00027
① 부호화기 측면 - 표 17을 참조하면, 2Nx2N_Merge 모드가 아닌 경우에는, 루마(Luma)와 크로마(CbCr)에 대한 cbf 값과 분할 플래그의 조합으로 구성되는 신택스 엘리먼트 값에 대응해서 정상 케이스의 코드워드 인덱스가 codeNum으로서 할당된다. 2Nx2N_Merge 모드의 경우에는 신택스 엘리먼트 값에 대응해서 2Nx2N_Merge 모드의 코드워드 인덱스가 codeNum으로서 할당된다.
구체적으로 2Nx2N_Merge 모드의 경우에는 정상 케이스의 코드워드 인덱스가 2Nx2N_Merge 모드의 코드워드 인덱스로 전환된다. 상술한 바와 같이, 2Nx2N_Merge 모드의 경우에는 모든 cbf 값이 0이 되는 경우는 일시적인 불능(NA)로 설정한다. 따라서, 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 codeNum(코드워드 인덱스)보다 큰 값을 가지는 codeNum(코드워드 인덱스)들은 2Nx2N_Merge 모드의 경우에 1만큼 감소한 codeNum(코드워드 인덱스) 값을 가지게 된다.
codeNum으로서 할당된 코드워드 인덱스는 표 17에 대응하는 VCL 테이블을 통해서 소정의 코드워드에 매핑된다.
표 17을 참조하면, 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 코드워드 인덱스 3은 2Nx2N_Merge 모드에서 NA로 전환된다. 또한, 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 코드워드 인덱스 3보다 큰 값을 가지는 코드워드 인덱스(4, 5, 6, 7)가, 동일한 신택스 엘리먼트에 대한 2Nx2N_Merge 모드에서는 1만큼 감소한 값(3, 4, 5, 6)이 된다.
② 복호화기 측면 - 부호화 유닛이 2Nx2N_Merge 모드로 부호화된 경우에 복호화기는 2Nx2N_Merge 모드에 대한 codeNum를 수신한다. 이때, 복호화기는 수신한 codeNum이 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 codeNum보다 같거나 큰 경우에는 1만큼 더 큰 codeNum으로 복원해서 인버스 인덱스 매핑 테이블을 통해 신택스 엘리먼트 값과 매핑한다. 가령, 부호화 유닛이 2Nx2N_Merge 모드로 부호화된 경우에, A를 cbp_and_split_transform 또는 cbp_yuv_split_trans에 대한 코드워드 인덱스(codeNum) 값이라고 하고, B를 정상 케이스에서 모든 cbf 값이 0일 때의 코드워드 인덱스(codeNum)이라고 하자. A가 B보다 작으면, 코드워드 인덱스(codeNum) 값으로 A를 사용한다. A가 B보다 크거나 같으면, 코드워드 인덱스(codeNum) 값으로 A+1을 사용한다.
표 17을 참조하면, 2Nx2N_Merge 모드에 대한 코드워드 인덱스, 즉 codeNum이 정상 케이스에서 모든 cbf 값이 0인 경우에 대한 코드워드 인덱스 3보다 같거나 큰 경우(3, 4, 5, 6)에는, 1만큼 더 큰 코드워드 인덱스(4, 5, 6, 7)로 복원되어 신택스 엘리먼트 값(cbf_Luma, cbf_CbCr, 분할 플래그 값)에 매핑된다.
한편, 상술한 파싱 단계는 엔트로피 코딩 모드가 CAVLC인 경우에 레지듀얼 정보가 존재하는지에 관한 신택스 엘리먼트(cbp_and_split_transform)를 파싱하기 위해 개시된다. 예컨대, 파싱 단계는 복호화기의 엔트로피 복호화부에서 수행될 수 있고, 이에 대응하여 전송 정보를 구성하는 동작은 부호화기의 엔트로피 부호화기에서 수행될 수 있다.
2Nx2N_Merge 모드가 아닌 정상 케이스에 대해서는, 슬라이스 데이터로부터의 비트들, 변수 cbpVlcNumIdx, trafoDepth 및 변수 열(variable array) cpbSplitTransTable 등이 파싱 프로세스의 입력 정보로서 이용된다. cbpVlcNumIdx는 cbpVlcNumTable과 같은 소정의 테이블을 통해, 파싱에 사용될 VLC 테이블을 지시하는 vlcNum과 매핑될 수 있다. cpbSplitTransTable은 수신한 심볼에 대응하는 codeNum을 현재 블록의 cbp와 분할 정보를 나타내는 소정의 값으로 매핑하는 테이블이다. 매핑되는 소정의 값은 신택스 엘리먼트 값일 수도 있고, 신택스 엘리먼트 값과 매핑되는 인덱스일 수도 있다.
파싱 프로세스를 거치면, 레지듀얼 정보와 분할 정보가 조인트 코딩된 신택스 엘리먼트 cbp_and split_transform와 값이 업데이트된 cbpVlcNumIdx 및 cbpSplitTransTable이 출력된다. cbpVlcNumIdx와 cbpSplitTransTable은 대응하는 정보의 발생 빈도에 따라서 업데이트될 수 있다.
정상 케이스에서 cbp_and_split_transform 값을 유도하기 위해서,
- 플래그 패턴의 4 비트 값을 획득한다.
- 표 18과 같이 플래그 패턴에 의해 특정되는 변수 k의 값을 유도한다.
<표 18>
Figure pct00028
- 현재 블록에 대한 예측 모드를 지시하는 n 값을 설정한다. 예컨대, n값은 n=(PreMode==MODE_INTRA? 0:1)과 같이 설정될 수 있다.
- vlcNum의 값을 획득한다.
플래그 패턴이 8이면, vlcNum=(n==0? cbpVlcNumTable[cbpVlcNumIdx]:11) 이 되고, 플래그 패턴이 11, 13 또는 15이고 n 값이 0이라면, vlcNum의 값을 15로 설정한다. 위 경우가 아니면, vlcNum을 14로 설정한다.
- vlcNum이 14면, 변수 cMax 값을 획득한다. cMax 값은 플래그 패턴과 n 값에 따라서 아래 표 19를 통해 획득할 수 있다.
<표 19>
Figure pct00029
- vlcNum과 cMax를 기반으로 codeNum을 출력한다. 예컨대, vlcNum에 대응하는 초기 비트에 cMax를 상한으로 두는 소정의 루프를 적용하여 codeNum을 획득할 수 있다.
- 상기 cbp_and_split_transform의 값을 cpbSplitTransTable을 이용하여 cpbSplitTransTable[k][n][codeNum]로 설정한다
- 표 18과 같은 소정의 관계에 기반해서, 업데이트를 위한 counterNum을 획득하고, cpbSplitTransTable[k][n], codeNum, counterNum을 기반으로 변수 열 cpbSplitTransTable[k][n]을 업데이트한다.
한편, 2Nx2N_Merge 모드가 적용되는 경우를 고려하면 파싱 프로세스를 수정할 수 있다. 2Nx2N_Merge 모드인 경우에도 엔트로피 부호화의 모드가 CAVLC인 경우에 아래와 같은 파싱 모드가 개시된다. 2Nx2N_Merge 모드인 경우에도, 슬라이스 데이터로부터의 비트들, 변수 cbpVlcNumIdx, trafoDepth 및 변수 열(variable array) cpbSplitTransTable 등이 파싱 프로세스의 입력 정보로서 이용된다. 또한, 현재 픽처의 상좌측(top-left) 샘플에 대한 현재 예측 유닛의 좌상측(top-left) 루마 샘플을 특정하는 루마 위치(xP, yP)가 입력 정보로서 이용된다.
파싱 프로세스를 거치면, cbp_and split_transform와 값이 업데이트된 cbpVlcNumIdx 및 cbpSplitTransTable이 출력된다. cbpVlcNumIdx와 cbpSplitTransTable은 대응하는 정보의 발생 빈도에 따라서 업데이트될 수 있다.
cbp_and_split_transform 값을 유도하기 위해서,
- 플래그 패턴의 4 비트 값을 획득한다.
- 표 18과 같이 플래그 패턴에 의해 특정되는 변수 k의 값을 유도한다.
- 현재 블록에 대한 예측 모드를 지시하는 n 값을 설정한다. 예컨대, n값은 n=(PreMode==MODE_INTRA? 0:1)과 같이 설정될 수 있다.
- vlcNum의 값을 획득한다.
플래그 패턴이 8이면, vlcNum=(n==0? cbpVlcNumTable[cbpVlcNumIdx]:11) 이 되고, 플래그 패턴이 11, 13 또는 15이고 n 값이 0이라면, vlcNum의 값을 15로 설정한다. 위 경우가 아니면, vlcNum을 14로 설정한다.
- vlcNum이 14면, 변수 cMax 값을 획득한다. cMax 값은 플래그 패턴과 n 값에 따라서 표 20을 통해 획득할 수 있다. 표 20은 표 19와 달리, 2Nx2N_Merge 모드인지를 지시하는 2Nx2N_Merge_ZeroTrafoDepth에 따라서 동일한 플래그 패턴에 대해서도 상이한 cMax 값이 할당될 수 있다.
<표 20>
Figure pct00030
- vlcNum과 cMax를 기반으로 codeNum을 출력한다. 예컨대, vlcNum에 대응하는 초기 비트에 cMax를 상한으로 두는 소정의 루프를 적용하여 codeNum을 획득할 수 있다.
- 2Nx2N_Merge 모드인지를 지시하는 2Nx2N_Merge_ZeroTrafoDepth를 다음과 같이 유도한다.
- 예측 모드(PredMode)가 인터 모드(MODE_INTER)이고, 파티션 모드가 2Nx2N(PART_2Nx2N)이며, 현재 예측 유닛이 머지 모드인지를 지시하는 머지 플래그(merge_flag[xP][yP])의 값이 1이고, trafoDepth의 값이 0인 경우에는 2Nx2N_Merge_ZeroTrafoDepth의 값을 1로 설정한다.
- 그렇지 않은 경우에는 2Nx2N_Merge_ZeroTrafoDepth의 값을 0으로 설정한다.
- 2Nx2N_Merge_ZeroTrafoDepth의 값이 1이면, 다음과 같은 절차를 적용한다.
- 변수 codeNumCbfZero를 유도한다. codeNumCbfZero는 상술한 바와 같이 인덱스 매핑 테이블(인버스 인덱스 매핑 테이블)에서 모든 cbf 값이 0이 되는 경우에 대응하는 codeNum 값을 나타낸다. 표 21과 같이, codeNumCbfZero의 값을 0으로 두고, cpbSplitTransTable[k][n][codeNum]의 값이 0이 될 때까지 codeNumCbfZero의 값을 증가시켜, codeNumCbfZero의 값을 획득할 수 있다.
<표 21>
Figure pct00031
- 만약 codeNum이 codeNumCbfZero보다 크면 codeNum을 증가시킨다(codeNum++). 2Nx2N_Merge 모드(2Nx2N_Merge_ZeroTrafoDepth = 1)에 대해서는 증가시킨 codeNum 값을 이용한다.
- 상기 cbp_and_split_transform의 값을 cpbSplitTransTable을 이용하여 cpbSplitTransTable[k][n][codeNum]로 설정한다.
- 표 20과 같은 소정의 관계에 기반해서, 업데이트를 위한 counterNum을 획득하고, cpbSplitTransTable[k][n], codeNum, counterNum을 기반으로 변수 열 cpbSplitTransTable[k][n]을 업데이트한다.
도 7은 본 발명이 적용되는 시스템에서 부호화기의 동작을 개략적으로 설명하는 순서도이다.
도 7을 참조하면, 부호화기는 현재 예측 유닛에 대한 예측을 수행한다(S710). 이어서, 부호화기는 전송할 정보를 엔트로피 부호화하며(S720), 부호화된 정보를 포함하는 비트 스트림을 복호화기로 전송한다(S730). 엔트로피 부호화는 도 1에 도시된 엔트로피 부호화부에서 수행될 수 있다.
도 7에 도시된 동작을 수행하는 경우에, 부호화기는 상술한 바와 같이 엔트로피 코딩의 모드가 CABAC 인 경우로서, 예측 단계(S710)에서 2Nx2N_Merge 모드(인터 예측이 수행되는 trafoDepth=0인 2Nx2N 블록에 머지 모드가 적용된 경우)가 적용되었으면 레지듀얼 신호의 존부를 지시하는 플래그를 전송하지 않는다. 따라서, 해당 정보는 상기 전송 단계(S730)에서 전송되지 않는다. 구체적인 내용은 상술한 바와 같다.
또한, 엔트로피 코딩의 모드가 CAVLC인 경우로서, 예측 단계(S710)에서 2Nx2N_Merge 모드가 적용되었으면, 레지듀얼 신호의 존부를 나타내는 정보들 중 일부 또는 전부를 전송하지 않을 수 있다. 예컨대, 앞서 설명한 바와 같이 루마(Y), 크로마(U, V)에 대한 cbf 중 일부 또는 전부를 전송하지 않고 해당 값이 추정되도록 할 수 있다. 따라서, 추정되는 정보 정보는 상기 전송 단계(S730)에서 전송되지 않는다. 구체적인 내용은 상술한 바와 같다.
또한, 엔트로피 코딩의 모드가 CAVLC인 경우로서, 예측 단계(S710)에서 2Nx2N_Merge 모드가 적용되었으면 레지듀얼 신호의 존부를 나타내는 정보(신택스 엘리먼트 값)들 중에서 레지듀얼 신호가 없는 경우에 대응하는 신택스 엘리먼트 값을 엔트로피 부호화 단계(S720)에서 배제할 수 있다. 인덱스 매핑 테이블상에서 신택스 엘리먼트에 매칭되는 codeNum의 값들은 레지듀얼 신호가 없는 경우를 고려하여 조정되며, 이에 따라서 정보의 전송량이 줄어들 수 있다. 구체적인 내용은 상술한 바와 같다.
도 8은 본 발명이 적용되는 시스템에서 복호화기의 동작을 개략적으로 설명하는 순서도이다.
도 8을 참조하면, 복호화기는 부호화된 정보가 포함된 비트스트림을 수신하며(S810), 수신된 정보를 엔트로피 복호화한다(S820). 복호화기는 엔트로피 복호화된 정보와 예측된 정보를 기반으로 영상 정보를 복원한다(S830)
도 8에 도시된 동작을 수행하는 경우에, 엔트로피 코딩의 모드가 CABAC 인 경우로서, 2Nx2N_Merge 모드(인터 예측이 수행되는 trafoDepth=0인 2Nx2N 블록에 머지 모드가 적용된 경우)이면 레지듀얼 신호의 존부를 지시하는 플래그를 전송되지 않는다. 복호화기는 레지듀얼 신호가 존재하는 것으로 추정(infer)하여 엔트로피 복호화 단계(S820)를 수행한다. 구체적인 내용은 상술한 바와 같다.
또한, 엔트로피 코딩의 모드가 CAVLC인 경우로서, 2Nx2N_Merge 모드이면, 레지듀얼 신호의 존부를 나타내는 정보들 중 일부 또는 전부를 전송되지 않을 수 있다. 복호화기는 전송되지 않는 정보에 대해서 해당 정보의 값을 추정하여 엔트로피 복호화 단계(S820)를 수행할 수 있다. 예컨대, 2Nx2N_Merge 모드의 경우에, 수신 단계(S810)에서 cbf_luma, cbf_cb, cbf_cr의 값이 모두 수신되지 않았으면, 복호화기는 cbf_luma, cbf_cb, cbf_cr의 값을 모두 1(레지듀얼 신호 존재)로 추정(infer)할 수 있다. 구체적인 내용은 상술한 바와 같다.
또한, 엔트로피 코딩의 모드가 CAVLC인 경우로서, 2Nx2N_Merge 모드이면 레지듀얼 신호의 존부를 나타내는 정보(신택스 엘리먼트 값)들 중에서 레지듀얼 신호가 없는 경우에 대응하는 신택스 엘리먼트 값을 엔트로피 복호화 단계(S820)에서 배제할 수 있다. 인버스 인덱스 매핑 테이블상에서 신택스 엘리먼트에 매칭되는 codeNum의 값들은 레지듀얼 신호가 없는 경우를 고려하여 조정될 수 있다. 구체적인 내용은 상술한 바와 같다.
상술한 예시적인 시스템에서, 방법들은 일련의 단계 또는 블록으로써 순서도를 기초로 설명되고 있지만, 본 발명은 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 상술한 실시예들은 다양한 양태의 예시들을 포함한다. 따라서, 본 발명은 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.
지금까지 본 발명에 관한 설명에서 일 구성 요소가 타 구성 요소에 "연결되어" 있다거나 "접속되어"있다고 언급된 때에는, 상기 일 다른 구성 요소가 상기 타 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 상기 두 구성 요소 사이에 다른 구성 요소가 존재할 수도 있다고 이해되어야 한다. 반면에, 일 구성 요소가 타 구성 요소에 "직접 연결되어"있다거나 "직접 접속되어"있다고 언급된 때에는, 두 구성 요소 사이에 다른 구성요소가 존재하지 않는 것으로 이해되어야 한다.

Claims (19)

  1. 현재 예측 유닛에 대한 예측을 수행하는 단계;
    상기 현재 예측 유닛에 대한 정보를 엔트로피 부호화하는 단계; 및
    상기 엔트로피 부호화된 정보를 전송하는 단계를 포함하며,
    상기 예측 수행 단계에서 상기 현재 예측 유닛은 깊이가 0인 2Nx2N의 블록이며, 상기 현재 예측 유닛에 대해 머지 모드가 적용된 경우에는,
    상기 현재 예측 유닛에 대한 레지듀얼 신호가 존재하는 것으로 추정하는 것을 특징으로 하는 영상 정보 부호화 방법.
  2. 제1항에 있어서, 상기 전송 단계에서는,
    상기 엔트로피 부호화의 모드가 CABAC(Context-Adaptive Binary Arithmetic Coding)이면, 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이 아니거나 상기 현재 예측 유닛에 적용된 예측 모드가 머지 모드가 아닌 경우에만 현재 예측 유닛에 대한 레지듀얼 정보가 전송되는 것을 특징으로 하는 영상 정보 부호화 방법.
  3. 제1항에 있어서, 상기 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이며 머지 모드가 적용된 경우에는, 상기 현재 예측 유닛의 루마 변환 블록에 대한 레지듀얼 정보 및 크로마 변환 블록의 레지듀얼 정보 중 적어도 하나의 존재가 추정되며,
    상기 전송 단계에서는 추정된 레지듀얼 정보의 존부를 지시하는 정보를 전송하지 않는 것을 특징으로 하는 영상 정보 부호화 방법.
  4. 제3항에 있어서, 상기 루마 변환 블록에 대한 레지듀얼 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보가 모두 존재하는 것으로 추정되는 것을 특징으로 하는 영상 정보 부호화 방법.
  5. 제3항에 있어서, 상기 루마 변환 블록에 대한 레지듀얼 정보의 존재가 추정되며, 상기 전송 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 전송하는 것을 특징으로 하는 영상 정보 부호화 방법.
  6. 제3항에 있어서, 상기 전송 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 전송하며, 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보가 상기 크로마 변환 블록에 대한 레지듀얼 정보가 존재하지 않는 것을 지시한 경우에, 상기 루마 변환 블록에 대한 레지듀얼 정보가 존재하는 것으로 추정되는 것을 특징으로 하는 영상 정보 부호화 방법.
  7. 제1항에 있어서, 상기 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이며 머지 모드가 적용된 경우에,
    상기 현재 예측 유닛에 대한 레지듀얼 정보가 존재하지 않는 경우에 대한 신택스 엘리먼트 값은 이용가능한(available) 신택스 엘리먼트 값에서 제외하는 것을 특징으로 하는 영상 정보 부호화 방법.
  8. 제1항에 있어서, 상기 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 예측 유닛이 깊이가 0인 2Nx2N 블록이며 머지 모드가 적용된 경우에,
    상기 엔트로피 부호화 단계에서,
    인덱스 매핑 테이블 상에서 상기 현재 예측 유닛에 대한 레지듀얼 정보가 존재하지 않는 경우에 대한 코드 번호(codeNum)는 이용 불가능(Non-Available: NA)으로 전환하며, 상기 코드 번호보다 큰 값을 가지는 코드 번호들은 1만큼 작은 값으로 전환되는 것을 특징으로 하는 영상 정보 부호화 방법.
  9. 제8항에 있어서, 상기 인덱스 매핑 테이블은 상기 루마 변환 블록에 대한 레지듀얼 정보의 존부에 관한 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부에 대한 정보의 패턴에 대응하는 코드 넘버를 할당하며, 상기 할당된 코드 넘버는 VLC(Variable Length Coding) 테이블 상에서 상기 할당된 코드 넘버에 대응하는 코드워드로 매핑되는 것을 특징으로 하는 영상 정보 부호화 방법.
  10. 부호화된 정보를 수신하는 단계;
    상기 수신한 정보를 엔트로피 복호화하는 단계; 및
    상기 엔트로피 복호화된 정보를 기반으로 영상을 복원하는 단계를 포함하며,
    상기 엔트로피 복호화 단계에서는,
    현재 블록이 깊이가 0인 2Nx2N의 블록이며, 상기 현재 블록에 머지 모드가 적용된 경우에,
    상기 현재 블록에 대한 레지듀얼 신호가 존재하는 것으로 추정하는 것을 특징으로 하는 영상 정보 복호화 방법.
  11. 제10항에 있어서, 상기 현재 블록에 적용된 엔트로피 부호화의 모드가 CABAC(Context-Adaptive Binary Arithmetic Coding)이고, 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 적용된 예측 모드가 머지 모드인 경우에, 상기 엔트로피 복호화 단계에서는 상기 현재 블록에 대한 레지듀얼 정보의 존재를 추정하는 것을 특징으로 하는 영상 정보 복호화 방법.
  12. 제11항에 있어서, 상기 수신 단계에서는,
    상기 현재 블록에 대한 레지듀얼 신호의 존부에 관한 정보를 수신하지 않는 것을 특징으로 하는 영상 정보 복호화 방법.
  13. 제10항에 있어서, 상기 현재 블록에 대한 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 머지 모드가 적용된 경우에는,
    상기 엔트로피 복호화 단계에서 상기 현재 블록의 루마 변환 블록에 대한 레지듀얼 정보 및 크로마 변환 블록의 레지듀얼 정보 중 적어도 하나의 존재를 추정하는 것을 특징으로 하는 영상 정보 복호화 방법.
  14. 제13항에 있어서, 상기 수신 단계에서는 상기 현재 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보가 수신하지 않으며,
    상기 엔트로피 복호화 단계에서는 상기 루마 변환 블록에 대한 레지듀얼 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보가 모두 존재하는 것으로 추정하는 것을 특징으로 하는 영상 정보 복호화 방법.
  15. 제13항에 있어서, 상기 수신 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 수신하며,
    상기 엔트로피 복호화 단계에서는 상기 루마 변환 블록에 대한 레지듀얼 정보의 존재를 추정하는 것을 특징으로 하는 영상 정보 복호화 방법.
  16. 제13항에 있어서, 상기 수신 단계에서는 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부를 지시하는 정보를 수신하며,
    상기 엔트로피 복호화 단계에서는, 상기 크로마 변환 블록에 대한 레지듀얼 정보가 존재하지 않는 경우에 상기 루마 변환 블록에 대한 레지듀얼 정보의 존재를 추정하는 것을 특징으로 하는 영상 정보 복호화 방법.
  17. 제10항에 있어서, 상기 현재 블록에 대한 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 머지 모드가 적용된 경우에,
    상기 엔트로피 복호화 단계에서는,
    상기 현재 블록에 대한 레지듀얼 정보가 존재하지 않는 경우에 대한 신택스 엘리먼트 값을 이용가능한(available) 신택스 엘리먼트 값에서 제외하는 것을 특징으로 하는 영상 정보 복호화 방법.
  18. 제10항에 있어서, 상기 현재 블록에 대한 엔트로피 부호화의 모드가 CAVLC(Context-Adaptive Variable Length Coding)이고 상기 현재 블록이 깊이가 0인 2Nx2N 블록이며 상기 현재 블록에 머지 모드가 적용된 경우에,
    상기 엔트로피 복호화 단계에서,
    인버스 인덱스 매핑 테이블 상에서 상기 현재 블록에 대한 레지듀얼 정보가 존재하지 않는 경우의 코드 번호(codeNum)는 이용 불가능(Non-Available: NA)로 전환하며, 상기 코드 번호보다 같거나 작은 값을 가지는 코드 번호들은 1만큼 더 큰 값으로 전환되는 것을 특징으로 하는 영상 정보 복호화 방법.
  19. 제18항에 있어서, 상기 인버스 인덱스 매핑 테이블은,
    상기 수신된 정보에 대응하는 코드 넘버를 상기 루마 변환 블록에 대한 레지듀얼 정보의 존부에 관한 정보 및 상기 크로마 변환 블록에 대한 레지듀얼 정보의 존부에 대한 정보의 패턴에 매핑시키는 것을 특징으로 하는 영상 정보 복호화 방법.
KR1020137020513A 2011-04-07 2011-11-25 영상 정보 부호화 방법 및 복호화 방법 KR20140018873A (ko)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201161472633P 2011-04-07 2011-04-07
US61/472,633 2011-04-07
US201161489257P 2011-05-24 2011-05-24
US61/489,257 2011-05-24
US201161491877P 2011-05-31 2011-05-31
US61/491,877 2011-05-31
US201161504234P 2011-07-03 2011-07-03
US61/504,234 2011-07-03
US201161506157P 2011-07-10 2011-07-10
US61/506,157 2011-07-10
PCT/KR2011/009075 WO2012138032A1 (ko) 2011-04-07 2011-11-25 영상 정보 부호화 방법 및 복호화 방법

Publications (1)

Publication Number Publication Date
KR20140018873A true KR20140018873A (ko) 2014-02-13

Family

ID=46969394

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137020513A KR20140018873A (ko) 2011-04-07 2011-11-25 영상 정보 부호화 방법 및 복호화 방법

Country Status (2)

Country Link
KR (1) KR20140018873A (ko)
WO (1) WO2012138032A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020076047A1 (ko) * 2018-10-09 2020-04-16 삼성전자 주식회사 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10321157B2 (en) 2013-10-18 2019-06-11 Lg Electronics Inc. Video decoding method and apparatus for decoding multi-view video
WO2015057032A1 (ko) * 2013-10-18 2015-04-23 엘지전자 주식회사 멀티 뷰를 포함하는 비디오 부호화/복호화 방법 및 장치
US10477227B2 (en) * 2015-01-15 2019-11-12 Kt Corporation Method and apparatus for predicting and restoring a video signal using palette entry and palette mode
CN107040740B (zh) * 2017-04-26 2019-05-14 中国人民解放军国防科学技术大学 基于信息散度的视频大数据冗余删除方法
JP2021502771A (ja) * 2018-05-03 2021-01-28 エルジー エレクトロニクス インコーポレイティド 画像コーディングシステムにおいてブロックサイズに応じた変換を使用する画像デコード方法およびその装置
KR102617221B1 (ko) * 2019-02-01 2023-12-27 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 파라미터 세트들을 사용한 인-루프 재성형 정보의 시그널링
KR20220151233A (ko) * 2019-02-28 2022-11-14 삼성전자주식회사 크로마 성분을 예측하는 비디오 부호화 및 복호화 방법, 및 크로마 성분을 예측하는 비디오 부호화 및 복호화 장치
CN113632462B (zh) 2019-03-23 2023-08-22 北京字节跳动网络技术有限公司 默认的环内整形参数
KR20210158391A (ko) 2019-06-20 2021-12-30 엘지전자 주식회사 루마 샘플들의 맵핑 및 크로마 샘플들의 스케일링 기반 비디오 또는 영상 코딩
US11877010B2 (en) * 2019-06-23 2024-01-16 Lg Electronics Inc. Signaling method and device for merge data syntax in video/image coding system
WO2021040486A1 (ko) * 2019-08-31 2021-03-04 엘지전자 주식회사 영상 디코딩 방법 및 그 장치
CN114365488A (zh) 2019-09-09 2022-04-15 北京字节跳动网络技术有限公司 视频编解码块的递归划分
JP7479457B2 (ja) * 2019-09-20 2024-05-08 北京字節跳動網絡技術有限公司 ビデオ・データを処理する方法、装置及び記憶媒体
KR20220050967A (ko) * 2019-10-04 2022-04-25 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100378795B1 (ko) * 2001-04-02 2003-04-03 엘지전자 주식회사 동영상에서 b픽쳐의 신축적인 다이렉트 모드 코딩 방법
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
KR101431545B1 (ko) * 2008-03-17 2014-08-20 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020076047A1 (ko) * 2018-10-09 2020-04-16 삼성전자 주식회사 비디오 복호화 방법 및 장치, 비디오 부호화 방법 및 장치
US11558622B2 (en) 2018-10-09 2023-01-17 Samsung Electronics Co., Ltd. Video decoding method and apparatus, and video encoding method and apparatus involving sub-block merge index context and bypass model

Also Published As

Publication number Publication date
WO2012138032A1 (ko) 2012-10-11

Similar Documents

Publication Publication Date Title
US11616989B2 (en) Entropy decoding method, and decoding apparatus using same
US10812808B2 (en) Intra prediction method and encoding apparatus and decoding apparatus using same
US11539973B2 (en) Method and device for processing video signal using multiple transform kernels
KR101549911B1 (ko) 화면 내 예측 모드에 기초한 적응적인 변환 방법 및 이러한 방법을 사용하는 장치
WO2012138032A1 (ko) 영상 정보 부호화 방법 및 복호화 방법
KR102492009B1 (ko) 영상 정보 부호화 및 복호화 방법
KR101425772B1 (ko) 영상 부호화 및 복호화 방법과 이를 이용한 장치
KR101965388B1 (ko) 양자화 계수 부/복호화 방법 및 이러한 방법을 사용하는 장치
KR20130086334A (ko) 쿼드 트리를 이용한 영상 부호화 방법 및 컴퓨터로 판독 가능한 저장매체
KR20130099852A (ko) 화면 내 예측 모드의 부호화 방법 및 복호화 방법
KR20130069685A (ko) 시간적 후보 움직임 벡터 유도 방법 및 이러한 방법을 사용하는 장치

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid