WO2019143103A1

WO2019143103A1 - 다양한 변환 기술을 사용하는 비디오 코딩 방법 및 장치

Info

Publication number: WO2019143103A1
Application number: PCT/KR2019/000603
Authority: WO
Inventors: 안용조; 류호찬
Original assignee: 인텔렉추얼디스커버리 주식회사
Priority date: 2018-01-17
Filing date: 2019-01-15
Publication date: 2019-07-25
Also published as: KR20190088020A; CN111602397B; US20220021895A1; US20200351511A1; US20240022746A1; CN117834918A; CN117834919A; CN117834920A; CN117834922A; CN117834921A; CN111602397A; US11166039B2; CN117834917A

Abstract

본 발명은 영상 복호화 방법 및 장치에 대하여, 비디오 코딩 기술 중 변환/역변환 과정에서 다양한 형태의 변환/역변환을 수행하여 부호화/복호화 효율을 향상시키는 방법 및 장치에 관한 것이다.

Description

다양한 변환 기술을 사용하는 비디오 코딩 방법 및 장치

본 발명은 영상 복호화 장치 및 그 방법에 관한 것으로서, 보다 상세하게는 비디오 압축 기술에서 다양한 변환 기술을 사용하는 방법 및 장치에 관한 것이다.

최근 고해상도, 고화질 비디오에 대한 요구가 증가함에 따라 차세대 비디오 서비스를 위한 고효율 비디오 압축 기술에 대한 필요성이 대두되었다. 이러한 필요성에 기반하여 비디오 압축 표준을 제정하기 위한 연구 및 탐색을 진행하고 있다.

비디오 압축 기술에서 변환 기술은 양자화 및 엔트로피 부호화를 효과적으로 수행하기 위해 공간 영역 (Spatial domain)의 신호를 주파수 영역 (Frequency domain)의 신호로 도메인을 변경하는 기술이다.

본 발명은 비디오 코딩 방법 및 장치에 있어, 부호화기 또는 복호화기의 변환 또는 역 변환 단계에서 다양한 변환 방법을 사용함으로써 기존의 비디오 압축 기술 대비 부호화 효율을 향상시키는 방법 및 장치를 제공하는 것을 그 목적으로 한다.

다만, 본 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.

상기 과제를 해결하기 위하여 본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 비트스트림으로부터 제1 역변환을 위한 변환 타입 정보를 추출하는 단계, 상기 추출한 정보를 이용해 다수의 역변환 타입에서 선택적으로 역변환 타입을 결정하는 단계, 상기 결정한 역변환 타입을 이용해 수평방향 또는 수직방향 역변환을 수행하는 단계를 포함한다.

상기 과제를 해결하기 위하여 본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 비트스트림으로부터 제1 역변환을 위한 역변환 타입 정보를 추출하여 수평방향 역변환 또는 수직방향 역변환의 변환 타입을 결정하는 단계, 상기 결정된 역변환 타입에 따라 수평방향 역변환 또는 수직방향 역변환을 생략하는 단계를 포함한다.

상기 과제를 해결하기 위하여 본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 제1 역변환의 변환 타입에 따라 제2 역변환을 생략하는 단계를 포함한다.

상기 과제를 해결하기 위하여 본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 변환 계수의 형태에 따라 역변환 여부를 결정하는 단계를 포함한다.

상기 과제를 해결하기 위하여 본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 제1 역변환 변환 타입에 따라 주파수별 가중 양자화 파라미터를 결정하여 가중 역양자화를 수행하는 단계를 포함한다.

상기 과제를 해결하기 위하여 본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 제2 역변환 인덱스에 따라 주파수별 가중 양자화 파라미터를 결정하여 가중 역양자화를 수행하는 단계를 포함한다.

본 발명은 부호화 효율 향상을 위하여 다양한 변환 기술을 사용하는 방법 및 장치를 제공하는 것을 그 목적으로 한다.

본 발명의 일 실시 예에 따르면, 제1 변환 또는 제1 역변환 단계에서 다양한 변환 타입을 선택적으로 사용함으로써 부호화 효율을 향상 시킬 수 있다.

도 1은 본 발명의 일 실시예에 따른 비디오 부호화 방법 및 장치의 구성을 나타내는 블록도를 도시한다.

도 2는 본 발명의 일 실시예에 따른 비디오 복호화 방법 및 장치의 구성을 나타내는 블록도를 도시한다.

도 3은 본 발명의 일 실시예에 따른 부호화기의 변환부에서 다양한 변환을 사용하는 기술을 도시한다.

도 4는 본 발명의 일 실시예에 따른 복호화기의 역변환부에서 다양한 역변환을 사용하는 기술을 도시한다.

도 5는 본 발명의 일 실시예에 따른 비트스트림으로부터 제1 역변환을 위한 정보를 추출하는 순서를 도시한다.

도 6은 본 발명의 일 실시예에 따른 다양한 역변환 타입에 따른 제1 역변환 수행 과정을 도시한다.

도 7은 본 발명의 일 실시예에 따른 제2 역변환 수행 과정을 도시한다.

도 8은 본 발명의 일 실시예에 따른 다양한 역변환 기술의 사용 여부를 신택스 (syntax)에 의하여 시그널링 하는 방법을 도시한다.

도 9는 본 발명의 일 실시예에 따른 다양한 역변환 기술을 사용하는 방법 및 장치에서 다양한 역변환 기술의 수행을 위한 정보를 비트스트림 내의 신택스 (syntax) 중 코딩 유닛 신택스에 의해 시그널링하는 방법을 도시한다.

도 10은 본 발명의 일 실시예에 따른 다양한 역변환 기술을 사용하는 방법 및 장치에서 역변환 과정의 또 다른 예를 도시한다.

도 11은 본 발명의 일 실시예에 따른 다양한 역변환 기술을 사용하는 경우, 서로 다른 주파수별 가중 양자화를 수행하는 과정을 도시한다.

도 12는 본 발명의 일 실시예에 따른 제2 역변환 기술을 사용하는 경우, 서로 다른 주파수별 가중 양자화를 수행하는 과정을 도시한다.

도 13은 본 발명의 일 실시예에 따른 다양한 역변환 또는 제2 역변환을 수행하는 경우, 가중 양자화를 위한 정보를 신택스(syntax)에 의하여 시그널링 하는 방법을 도시한다.

본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 비트스트림으로부터 제1 역변환을 위한 변환 타입 정보를 추출하는 단계, 상기 추출한 정보를 이용해 다수의 역변환 타입에서 선택적으로 역변환 타입을 결정하는 단계, 상기 결정한 역변환 타입을 이용해 수평방향 또는 수직방향 역변환을 수행하는 단계를 포함한다.

본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 비트스트림으로부터 제1 역변환을 위한 역변환 타입 정보를 추출하여 수평방향 역변환 또는 수직방향 역변환의 변환 타입을 결정하는 단계, 상기 결정된 역변환 타입에 따라 수평방향 역변환 또는 수직방향 역변환을 생략하는 단계를 포함한다.

본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 제1 역변환의 변환 타입에 따라 제2 역변환을 생략하는 단계를 포함한다.

본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 변환 계수의 형태에 따라 역변환 여부를 결정하는 단계를 포함한다.

본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 제1 역변환 변환 타입에 따라 주파수별 가중 양자화 파라미터를 결정하여 가중 역양자화를 수행하는 단계를 포함한다.

본 발명의 실시예에 따른 비디오 코딩 방법 및 장치는 제2 역변환 인덱스에 따라 주파수별 가중 양자화 파라미터를 결정하여 가중 역양자화를 수행하는 단계를 포함한다.

하기는 본 명세서에 첨부된 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 명세서 전체에서 어떤 부분이 다른 부분과 '연결'되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우 뿐만 아니라, 그 중간에 다른 소자를 사이에 두고 전기적으로 연결되어 있는 경우도 포함한다.

또한, 본 명세서 전체에서 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.

본 명세서 전체에서 사용되는 정도의 용어 ~(하는) 단계 또는 ~의 단계는 ~를 위한 단계를 의미하지 않는다.

또한, 제 1, 제 2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

덧붙여, 본 발명의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 기술되고, 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 발명의 본질에서 벗어나지 않는 한 본 발명의 권리 범위에 포함된다.

이하 본 명세서에 기재된 본 발명의 다양한 실시예들에서, “~부”, “~기”, “~유닛”, “~모듈”, “~블록” 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.

이하 본 발명의 일 실시예에 따라 제안하는 다양한 변환 기술을 사용하는 비디오 코딩 방법 및 장치에 대하여 도 4를 참조하여 구체적으로 설명하기로 한다.

일 실시예에 따른 비디오 부호화 방법 및 장치는 화면 간 예측부(120), 화면 내 예측부(125), 감산부(130), 변환부(140), 양자화부(150), 엔트로피 부호화부(160), 역변환부(145), 역양자화부(155), 가산부(135), 양방향 필터부(180), 인루프 필터부(180), 복원 픽쳐 버퍼(190)를 포함할 수 있다.

화면 간 예측부(120)는 입력 영상(110)과 복원 픽쳐 버퍼(190)에 저장되어 있는 복원 영상을 이용하여 움직임 예측을 수행하여 예측 신호를 생성한다.

화면 내 예측부(125)는 부호화되는 현재 블록과 공간적으로 인접하는 기-복원된 주변 블록의 화소 값을 이용하여 공간적 예측을 수행하여 예측 신호를 생성한다.

감산부(130)는 입력 영상과 화면 간 예측부(120) 혹은 화면 내 예측부(125)를 통해 생성된 예측 신호를 이용하여 잔차 신호 (residual signal)를 생성한다.

변환부(140) 및 양자화부(150)는 감산부(130)를 통해 생성된 잔차 신호에 대하여 변환 및 양자화를 수행하여 양자화된 계수 (quantized coefficient)를 생성한다.

엔트로피 부호화부(160)는 비디오 압축 표준에 정의된 신택스 요소 (syntax elements) 및 양자화된 계수 등과 같은 부호화 정보에 대하여 엔트로피 부호화를 수행하여 비트스트림을 출력한다.

역변환부(145) 및 역양자화부(155)는 양자화 계수를 수신하여 역양자화 및 역변환을 차례대로 수행하고, 복원된 잔차 신호를 생성한다.

가산부(135)는 화면 간 예측부(120) 혹은 화면 내 예측부(125)를 통해 생성된 예측 신호와 복원된 잔차 신호를 이용하여 복원 신호를 생성한다.

상기 복원 신호는 인루프 필터부(180)로 전달되어 디블록킹 필터, SAO (Sample Adaptive Offset), ALF (Adaptive Loop Filter)와 같은 하나 혹은 그 이상의 인루프 필터를 적용하여 최종 복원 픽쳐를 생성하여 복원 픽쳐 버퍼(190)에 저장된다.

상기 복원 픽쳐 버퍼(190)에 저장된 복원 픽쳐는 화면 간 예측부(120)에서 참조 픽쳐로 사용될 수 있다.

일 실시예에 따른 비디오 복호화 장치 및 방법은 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 화면 내 예측부(240), 화면 간 예측부(250), 가산부(260), 양방향 필터부(270), 인루프 필터부(280), 복원 픽쳐 버퍼(290)를 포함할 수 있다.

엔트로피 복호화부(210)는 입력된 비트스트림(200)을 복호화하여 신택스 요소 (syntax elements) 및 양자화된 계수 등과 같은 복호화 정보를 출력한다.

역양자화부(220) 및 역변환부 (230)는 양자화 계수를 수신하여 역양자화 및 역변환을 차례대로 수행하고, 잔차 신호 (residual signal)를 출력한다.

화면 내 예측부(240)는 복호화되는 현재 블록과 인접하는 기-복호화된 주변 블록의 화소 값을 이용하여 공간적 예측을 수행하여 예측 신호를 생성한다.

화면 간 예측부(250)는 비트스트림으로부터 추출된 움직임 벡터와 복원 픽쳐 버퍼(280)에 저장되어 있는 복원 영상을 이용하여 움직임 보상을 수행하여 예측 신호를 생성한다.

가산부(260)는 화면 내 예측부(240) 혹은 화면 간 예측부(250)를 통해 생성된 예측 신호와 복원된 잔차 신호를 이용하여 복원 신호를 생성한다.

양방향 필터부(270)는 가산부(260)를 통해 생성된 복원 신호에 대하여 양방향 필터를 수행하여, 필터가 적용된 신호를 생성한다.

상기 복원 신호는 인루프 필터부(270)로 전달되어 디블록킹 필터, SAO (Sample Adaptive Offset), ALF (Adaptive Loop Filter)와 같은 하나 혹은 그 이상의 인-루프 필터를 적용하여 최종 복원 픽쳐를 생성하여 복원 픽쳐 버퍼(280)에 저장된다.

상기 복원 픽쳐 버퍼(280)에 저장된 복원 픽쳐는 화면 간 예측부(250)에서 참조 픽쳐로 사용될 수 있다.

부호화기의 변환부(310)는 제1 변환부(320) 또는 제2 변환부(330) 중 적어도 하나로 구성될 수 있다. 제1 변환부에서 변환을 수행하고 그 결과를 제2 변환부에서 사용할 수 있다. 또는, 제1 변환부 또는 제2 변환부 중 어느 하나에서만 변환이 선택적으로 수행될 수 있다.

제1 변환부(320)에서는 수평방향 변환과 수직방향 변환을 분리하여 수행할 수 있으며, 수평방향과 수직방향에 대해서 변환 타입이 각각 결정될 수 있다. 상기 변환 타입은 부호화기에 기-정의된 복수의 변환 타입 중 어느 하나로 결정될 수 있다.

즉, 본 발명의 일 실시예에 따른 제1 변환부(320)에서는 다수개의 변환 타입 중 하나의 변환 타입을 수평방향 혹은 수직방향 각각에 대하여 선택적으로 사용할 수 있다. 상기 다수개의 변환 타입은 DCT-II(DCT2), DCT-IV(DCT4), DCT-V(DCT5), DCT-VIII(DCT8), DST-I(DST1), DST-IV(DST4), DST-VII(DST7), 또는 ID (IDentity) 중 적어도 하나를 포함할 수 있다. 전술한 변환 타입 중 어느 하나는 디폴트 변환 타입(default transform type)으로 정의될 수 있다. 예를 들어, 상기 디폴트 변환 타입은 DCT2일 수 있으나, 이에 한정되지 아니한다.

제1 변환부(320)에서 이용 가능한 변환 타입의 개수는, 1개, 2개, 3개, 4개, 5개 또는 그 이상일 수 있다. 상기 개수는, 부호화기에 기-약속된 고정된 개수일 수 있다. 또는, 부호화기는 최적의 개수를 결정하고, 변환 타입의 개수를 특정하는 정보를 부호화할 수도 있다. 여기서, 상기 정보는, 비디오 시퀀스, 픽쳐, 슬라이스, 타일 또는 소정의 조각 영역(예를 들어, 코딩 블록, 변환 블록)의 레벨에서 시그날링될 수 있다. 또는, 상기 개수는, 부호화 파라미터에 기초하여 가변적으로 결정될 수도 있다. 상기 부호화 파라미터는, 블록의 크기(너비와 높이의 길이), 형태, 분할 타입, 분할 뎁스, 예측 모드, 화면 간 예측 모드의 종류, 화면 내 예측 모드의 값, 성분(예를 들어, 휘도 성분, 색차 성분) 등을 포함할 수 있다. 여기서, 블록은 현재 블록 또는 현재 블록에 인접한 이웃 블록을 의미할 수 있다. 현재 블록은, 코딩 블록, 예측 블록 또는 변환 블록을 의미할 수 있다.

예를 들어, 현재 블록의 크기가 n보다 큰 경우, 이용 가능한 변환 타입(즉, 후보 변환 타입)의 개수는 1개이고, 현재 블록의 크기가 n보다 작은 경우, 후보 변환 타입의 개수는 2개, 3개 또는 그 이상일 수 있다. 여기서, n 값은 16 또는 32일 수 있다. 후보 변환 타입의 개수가 1개인 경우, 해당 후보 변환 타입으로 전술한 디폴트 변환 모드가 이용될 수 있다.

상기 변환 타입 중 ID (IDentity)는 변환의 커널로써 단위 행렬 (Identity matrix)를 사용하는 것을 의미하며, 단위 행렬을 사용하여 변환을 수행한다는 의미는 변환을 수행하지 않는다는 의미로 해석 될 수 있다. 따라서, 본 발명의 일 실시예에 따르면 제1 변환부(320)에서 다수개의 변환 타입 중 하나의 변환 타입으로 수평방향 혹은 수직방향으로 변환을 수행함에 있어, ID가 선택되는 것은 수평방향 혹은 수직방향의 변환을 생략하는 것을 의미한다. 이를 통해, 수평방향 및 수직방향 중 어느 하나에 대해서 변환 스킵을 선택적으로 적용할 수 있다.

수평방향 변환에서 변환 타입 ID가 선택되면 수평방향 변환을 생략하는 것을 의미하고, 수직방향에서 변환 타입 ID가 선택되면 수직방향 변환을 생략하는 것을 의미한다.

수평방향 변환과 수직방향 변환에서 모두 변환 타입 ID가 선택되면 수평방향 변환과 수직방향 변환을 모두 생략하는 것을 의미한다.

수평방향 변환과 수직방향 변환에서 모두 변환 타입 ID가 선택되면 변환 단계를 수행하지 않음을 의미하는 변환 스킵 플래그 (transform skip flag)를 비트스트림에 포함하지 않을 수 있다.

또는, 전술한 복수의 변환 타입은, 상기 ID를 포함하지 않을 수 있다. 이 경우, 변환 스킵을 위한 별도의 정보가 부호화될 수 있다. 여기서, 상기 정보는, 변환이 수행되는지, 스킵되는지 여부를 특정하는 플래그를 의미할 수 있다. 상기 플래그는, 수직/수평방향에 관계없이 하나의 블록 단위로 부호화될 수 있다. 또는, 상기 플래그는, 수직방향과 수평방향 각각에 대해서 부호화될 수 있다. 상기 부호화는, 현재 블록의 크기가 소정의 제1 문턱값보다 작거나 같은 경우에만 수행될 수 있다. 상기 제1 문턱값은, 변환 스킵이 허용되는 최대크기를 나타낼 수 있다. 부호화기는 변환 스킵이 허용되는 최적의 최대크기를 결정하고, 이를 부호화하여 시그날링할 수 있다. 상기 현재 블록의 크기는, 현재 블록의 너비와 높이 중 최대값 또는 최소값으로 표현될 수 있다. 상기 최대크기는, 4, 8 또는 16,32,64 일 수 있다.

제1 변환부에서 다양한 변환 타입을 사용할지 여부는 플래그 (flag) 형태로 비트스트림에 포함될 수 있다.

여기서, 상기 플래그는, 복수의 변환 타입 중 어느 하나를 선택할지, 아니면 부호화기에 기-정의된 디폴트 변환 타입을 사용할지를 특정할 수 있다. 예를 들어, 상기 플래그가 제1 값인 경우, 현재 블록의 변환 타입은 복수의 변환 타입으로부터 유도되고, 그렇지 않은 경우, 현재 블록의 변환 타입은 디폴트 변환 타입으로 유도될 수 있다.

상기 플래그는, 블록의 크기, 형태, 분할 타입, 예측 모드, 화면 간 예측 모드의 종류, 인트라 예측 모드의 값, 또는 성분 중 적어도 하나에 기초하여 선택적으로 부호화될 수 있다.

일 예로, 상기 플래그는, 블록의 크기가 m보다 작거나 같은 경우에만 부호화될 수 있다. 여기서, 블록의 크기는, 블록의 너비(W)와 높이(H) 중 최대값 또는 최소값으로 정의될 수 있다. 상기 m 값은 8 또는 16 또는 32일 수 있다. 상기 블록의 크기는, 합(W+H), 넓이(W*H) 등으로 정의될 수도 있다.

일 예로, 상기 플래그는, 블록의 형태(shape)가 정사각형인 경우에만 부호화될 수 있다. 즉, 블록의 너비와 높이의 비가 1이 아닌 경우, 상기 플래그는 부호화되지 않을 수 있다. 역으로, 상기 플래그는, 블록의 형태가 직사각형인 경우에만 부호화될 수도 있다. 또는, 상기 플래그는, 블록의 형태가 직사각형인 경우라도 블록의 너비와 높이의 비(W/H 또는 H/W)가 소정의 제2 문턱값보다 크거나 같은 경우에만 부호화될 수도 있다. 부호화기는, 최적의 너비와 높이의 비를 결정하고, 이를 상기 제2 문턱값으로 설정할 수 있다.

일 예로, 상위 블록의 분할 타입이 제1 분할 타입이 아닌 경우에만, 하위 블록에 대해서 상기 플래그가 부호화될 수 있다. 분할 타입은, 쿼드 트리(QT), 바이너리 트리(BT) 또는 터너리 트리(TT) 중 적어도 하나를 포함하고, 상기 제1 분할 타입은 전술한 분할 타입 중 어느 하나(예를 들어, TT)일 수 있다. 상위 블록이 제1 분할 타입으로 분할되는 경우라도, 하위 블록의 위치에 따라 상기 플래그가 선택적으로 부호화될 수 있다.

예를 들어, 상위 블록이 BT로 분할된 경우, 상위 블록은 2개의 하위 블록(BLK0, BLK1)으로 구성될 수 있다. 이때, 상기 플래그는, 좌측(또는 상단) 하위 블록에 대해서만 부호화되고, 우측(또는 하단) 하위 블록에 대해서는 부호화되지 않을 수 있다. 또는, 상기 플래그는, 좌측(또는 상단) 하위 블록에 대해서 부호화되지 않고, 우측(또는 하단) 하위 블록에 대해서만 부호화될 수도 있다.

예를 들어, 상위 블록이 TT로 분할된 경우, 상위 블록은 3개의 하위 블록(BLK0, BLK1, BLK2)으로 구성될 수 있다. 이때, 상기 플래그는, 중앙 하위 블록(BLK1)에 대해서는 부호화되지 않고, 나머지 하위 블록(BLK0, BLK2)에 대해서만 부호화될 수 있다. 또는, 상기 플래그는, 우측 하위 블록(BLK2)에 대해서는 부호화되지 않고, 나머지 하위 블록(BLK0, BLK1)에 대해서만 부호화될 수 있다.

일 예로, 상기 플래그는, 블록의 예측 모드가 화면 간 예측 모드인 경우에만 부호화될 수 있다. 또는, 블록의 예측 모드가 화면 간 예측 모드인 경우라도, 화면 간 예측 모드가 제1 모드인 경우에만 부호화될 수 있다. 여기서, 제1 모드는, 머지 모드, AMVP 모드, 어파인 모드 등 부호화기에 기-정의된 화면 간 예측 모드 중 어느 하나를 의미할 수 있다. 반대로, 상기 플래그는, 블록의 예측 모드가 화면 내 예측 모드인 경우에만 부호화될 수도 있다. 또는, 블록의 예측 모드가 화면 내 예측 모드인 경우라도, 화면 내 예측 모드의 값(또는 각도)이 소정의 범위에 속하는지 여부를 고려하여 부호화될 수 있다. 예를 들어, 상기 화면 내 예측 모드의 값이 모드 2 내지 모드 66의 범위에 속하는 경우에만, 상기 플래그가 부호화될 수 있다.

일 예로, 상기 플래그는, 블록의 성분이 휘도 성분인 경우에만 부호화될 수 있다. 이 경우, 색차 성분의 변환 타입은, 휘도 성분의 변환 타입에 기초하여 유도되거나, 디폴트 변환 타입으로 유도될 수 있다.

전술한 실시예는 독립적으로 적용되는 것은 아니며, 상기 플래그는 전술한 실시예 중 적어도 2개의 조합에 기초하여 부호화될 수 있다. 한편, 상기 플래그는 전술한 실시예 중 적어도 하나와 관계없이 부호화될 수도 있음은 물론이다.

제1 변환부에서 다양한 변환 타입을 사용하지 않는 경우(즉, 플래그가 제1 값인 경우), 현재 블록의 변환 타입은 디폴트 변환 타입으로 설정될 수 있다.

반면, 제1 변환부에서 다양한 변환 타입을 사용하는 경우(즉, 플래그가 제2 값인 경우), 복수의 변환 타입 중 어느 하나를 현재 블록의 변환 타입으로 설정할 수 있다. 이하, 복수의 변환 타입에 기반하여 현재 블록의 변환 타입을 결정하는 방법에 대해서 살펴 보기로 한다.

부호화기는 최적의 변환 타입을 결정하고, 결정된 변환 타입에 대한 정보를 비트스트림에 포함할 수 있다(실시예 1).

부호화기는, 기-약속된 테이블에 기초하여 상기 변환 타입에 대한 정보(이하, 변환 타입 인덱스라 함)를 부호화할 수 있다. 기-약속된 테이블은 아래 표 1과 같다.

변환 타입 인덱스	trTypeHor	trTypeVer
1	0	0
0	1	1
1	2	1
2	1	2
3	2	2

trTypeHor과 trTypeVer이 동일한 경우, 부호화기는 변환 타입 인덱스의 값을 0 또는 3으로 부호화할 수 있다. 또는, trTypeHor과 trTypeVer이 서로 다른 경우, 부호화기는 변환 타입 인덱스의 값을 1 또는 2로 부호화할 수 있다.

여기서, trTypeHor은 수평방향의 변환을, trTypeVer은 수직방향의 변환을 각각 의미한다. 1인 trTypeHor(또는, trTypeVer)은 전술한 복수의 변환 타입 중 어느 하나를 의미하고, 2인 trTypeHor(또는, trTypeVer)은 전술한 복수의 변환 타입 중 다른 하나를 의미할 수 있다. 표 1은, trTypeHor과 trTypeVer의 조합의 예로, (0,0), (1,1), (1,2), (2,1), (2,2)를 언급하나, 이에 한정되지 아니한다. 예를 들어, (0,1), (1,0) 등의 조합이 추가될 수 있고, 표 1의 조합 중 적어도 하나가 제외될 수도 있다. 상기 조합의 개수는, 2개, 3개, 4개, 5개, 6개, 7개 또는 그 이상일 수 있다.

부호화기는, 블록의 크기, 위치, 형태 또는 예측 모드 중 적어도 하나에 기초하여 현재 블록의 변환 타입을 결정할 수 있다(실시예 2).

일 예로, 변환 타입은 현재 블록의 너비와 높이 간의 길이 비교에 기초하여 결정될 수 있다. 예를 들어, 너비와 높이 중 짧은 쪽의 변환 타입은 제1 변환 타입으로 결정되고, 긴 쪽의 변환 타입은 제2 변환 타입으로 결정될 수 있다. 여기서, 제1 변환 타입은 복수의 변환 타입 중 어느 하나이며, 제2 변환 타입은 복수의 변환 타입 중 다른 하나이다. 예를 들어, 제1 변환 타입은 DCT(e.g., DCT2, DCT4, 또는 DCT8)로 결정되고, 제2 변환 타입은 DST(e.g., DST4, DST7)로 결정될 수 있으며, 이하 동일하게 해석될 수 있다. 또는 역으로, 제1 변환 타입은 DST로 결정되고, 제2 변환 타입은 DCT로 결정될 수도 있다. 상기 너비 및/또는 높이가 소정의 제3 문턱값보다 크거나 같은 경우, 변환 타입은 디폴트 변환 타입으로 결정될 수 있다. 여기서, 제3 문턱값은 16, 32 또는 64일 수 있다.

일 예로, 변환 타입은, 현재 블록의 위치에 기초하여 결정될 수 있다. 이하 설명에서 현재 블록은 하위 블록에 대응한다. 상위 블록은 복수의 하위 블록으로 분할될 수 있다. 상기 분할은, QT, BT, TT 또는 ABT(asymmetry binary tree) 중 적어도 하나에 기초하여 수행될 수 있다. 여기서, ABT는 하나의 블록을 비대칭의 2개의 서브 블록(SB0, SB1)으로 분할하는 기법이다. 즉, SB0와 SB1의 너비 또는 높이의 비율은, (1:r) 또는 (r:1)이며, r 값은 2, 3, 4, 또는 그 이상의 정수일 수 있다. 부호화기는 최적의 비율을 결정하고, 이를 부호화하여 복호화기로 시그날링할 수 있다.

변환 타입은, 상위 블록 내에서 하위 블록의 위치를 고려하여 결정될 수 있다.

(1) 상위 블록이 QT로 분할된 경우, 좌상단 하위 블록(BLK0)의 변환 타입은 제1 변환 타입으로 결정되고, 우하단 하위 블록(BLK3)의 변환 타입은 제2 변환 타입으로 결정될 수 있다. 상기 좌상단/우하단 하위 블록의 변환 타입은 수평/수직방향에 대해서 동일할 수 있다.

나머지 하위 블록(BLK1, BLK2)의 변환 타입은, 제1 변환 타입 및/또는 제2 변환 타입으로 결정될 수 있다. 상기 나머지 하위 블록의 변환 타입은 수평/수직방향에 대해서 동일할 수 있다. 또는, 우상단 하위 블록(BLK1)에 대해서, 수직 방향의 변환 타입은 제1 변환 타입으로, 수평 방향의 변환 타입은 제2 변환 타입으로 각각 결정될 수 있다. 좌하단 하위 블록(BLK2)는 BLK1과 동일하게 결정될 수 있다. 또는, BLK2에 대해서, 수평 방향의 변환 타입은 제1 변환 타입으로, 수직 방향의 변환 타입은 제2 변환 타입으로 각각 결정될 수 있다.

또는, 전술한 BLK1, BLK2, 또는 BLK3 중 적어도 하나에 대한 변환 타입은, 디폴트 변환 타입으로 결정될 수도 있다.

(2) 상위 블록이 BT 또는 ABT로 분할된 경우, 좌측(또는 상단) 하위 블록의 변환 타입은 제1 변환 타입으로 결정되고, 우측(또는 하단) 하위 블록의 변환 타입은 제2 변환 타입으로 결정될 수 있다.

나아가, 좌측(또는 상단) 하위 블록의 변환 타입은 수평/수직방향에 대해서 동일할 수도 있고, 서로 상이할 수도 있다. 예를 들어, 좌측 하위 블록에 대해서, 수평방향의 변환 타입은 제1 변환 타입이나, 수직방향의 변환 타입은 제2 변환 타입일 수 있다. 또는, 상단 하위 블록에 대해서, 수직방향의 변환 타입은 제1 변환 타입이나, 수평방향의 변환 타입은 제2 변환 타입일 수 있다.

우측(또는 하단) 하위 블록의 변환 타입은 수평/수직방향에 대해서 서로 동일하도록 제한될 수 있다. 또는, 우측(또는 하단) 하위 블록의 변환 타입은 수평/수직방향에 대해서 서로 상이하게 결정될 수도 있다.

(3) 상위 블록이 TT로 분할된 경우, 좌측(또는 상단) 하위 블록(BLK0)의 변환 타입은 제1 변환 타입으로 결정되고, 우측(또는 하단) 하위 블록(BLK2)의 변환 타입은 제2 변환 타입으로 결정될 수 있다.

한편, 중앙 하위 블록(BLK1)의 변환 타입은, 제1 변환 타입 및/또는 제2 변환 타입으로 결정될 수 있다. BLK1에 대해서, 수직 방향의 변환 타입은 수평 방향의 변환 타입과 상이할 수 있다. 또는, BLK1에 대한 변환 타입은, 부호화기에 기-정의된 디폴트 변환 타입으로 결정될 수도 있다.

일 예로, 변환 타입은, 현재 블록의 예측 모드가 화면 간 예측인지 여부에 기초하여 결정될 수 있다. 예를 들어, 현재 블록의 예측 모드가 화면 간 예측인 경우에는 제1 변환 타입 또는 제2 변환 타입이 이용되고, 그렇지 않은 경우에는 디폴트 변환 타입이 이용될 수 있다. 또는, 현재 블록의 예측 모드가 화면 간 예측인 경우에는 제1 변환 타입이 이용되고, 그렇지 않은 경우에는 제2 변환 타입 또는 디폴트 변환 타입이 이용될 수 있다.

전술한 실시예는 독립적으로 적용될 수도 있고, 부호화기는 제1/제2 실시예의 조합에 기초하여 변환 타입을 결정할 수도 있다. 전술한 제1 실시예에 기초하여 결정된 변환 타입은, 제2 실시예에 기초하여 결정된 변환 타입에 의해서 대체될 수도 있다. 역으로, 전술한 제2 실시예에 기초하여 결정된 변환 타입은, 제1 실시예에 기초하여 결정된 변환 타입에 의해서 대체될 수도 있다.

제1 변환부에서는, 상기 결정된 변환 타입에 기초하여 변환을 수행할 수 있다.

제2 변환부(330)에서는 제1 변환부(320)에서 수행된 신호에 대하여 추가적으로 변환을 수행한다. 상기 추가적 변환의 수행은 생략될 수도 있다.

제2 변환부(330)에서는 수평방향 변환과 수직방향 변환을 통합된 형태로 수행할 수 있으며, 변환의 방법은 블록의 크기 및 블록의 예측모드에 의해 결정될 수 있다.

제2 변환부(330)에서 수행한 변환에 대한 정보는 인덱스 (index) 형태로 비트스트림에 포함될 수 있다.

복호화기의 역변환부(410)는 제1 역변환부(420) 또는 제2 역변환부(430) 중 적어도 하나로 구성될 수 있다. 제2 역변환부에서 역변환을 수행하고 그 결과를 제1 역변환부에서 사용한다. 다만, 도 3에서 살펴본 바와 같이, 제1 역변환부 또는 제2 역변환부 중 어느 하나에서만 역변환이 선택적으로 수행될 수도 있다.

제1 역변환부(420)에서는 수평방향 역변환과 수직방향 역변환을 분리하여 수행할 수 있으며, 수평 방향과 수직 방향에 대해서 역변환 타입이 각각 결정될 수 있다. 상기 역변환 타입은, 복호화기에 기-정의된 복수의 역변환 타입 중 어느 하나로 결정될 수 있다.

상기 복수의 역변환 타입은 DCT-II(DCT2), DCT-IV(DCT4), DCT-V(DCT5), DCT-VIII(DCT8), DST-I(DST1), DST-IV(DST4), DST-VII(DST7), 또는 ID (IDentity) 중 적어도 하나를 포함할 수 있다. 전술한 역변환 타입 중 어느 하나는 디폴트 역변환 타입(default inverse-transform type)으로 정의될 수 있다. 예를 들어, 상기 디폴트 역변환 타입은 DCT2일 수 있으나, 이에 한정되지 아니한다.

한편, 제1 역변환부에서 이용 가능한 역변환 타입의 개수는 도 3에서 살펴본 바와 같은바, 여기서 자세한 설명은 생략하기로 한다.

수평방향 역변환에서 변환 타입 ID가 선택되면 수평방향 역변환을 생략하는 것을 의미하고, 수직방향에서 역변환 타입 ID가 선택되면 수직방향 역변환을 생략하는 것을 의미한다. 이를 통해, 수평방향 및 수직방향 중 어느 하나에 대해서 변환 스킵을 선택적으로 적용할 수 있다.

수평방향 역변환과 수직방향 역변환에서 모두 변환 타입 ID가 선택되면 수평방향 역변환과 수직방향 역변환을 모두 생략하는 것을 의미한다.

수평방향 역변환과 수직방향 역변환에서 모두 변환 타입 ID가 선택되면 역변환 단계를 수행하지 않음을 의미하는 변환 스킵 플래그 (transform skip flag) 추출을 생략할 수 있다.

또는, 전술한 복수의 역변환 타입은, 상기 ID를 포함하지 않을 수 있다. 이 경우, 변환 스킵을 위한 별도의 정보가 시그날링될 수 있다. 여기서, 상기 정보는, 역변환이 수행되는지, 스킵되는지 여부를 특정하는 플래그를 의미할 수 있다. 상기 플래그는, 수직/수평 방향에 관계없이 하나의 블록 단위로 복호화될 수 있다. 또는, 상기 플래그는, 수직방향과 수평방향 각각에 대해서 복호화될 수 있다. 상기 복호화는, 현재 블록의 크기가 소정의 제1 문턱값보다 작거나 같은 경우에만 수행될 수 있다. 상기 제1 문턱값은, 변환 스킵이 허용되는 최대크기를 나타낼 수 있다. 앞서 언급한 바와 같이, 부호화기는 변환 스킵이 허용되는 최적의 최대크기를 결정하고, 이를 부호화하여 복호화기로 시그날링할 수 있다. 상기 현재 블록의 크기는, 현재 블록의 너비와 높이 중 최대값 또는 최소값으로 표현될 수 있다. 상기 최대크기는, 4, 8, 16, 32, 또는 64일 수 있다.

제1 역변환부에서 다양한 변환 타입을 사용할지 여부는 비트스트림에 포함된 플래그 (flag) 정보를 이용해 결정할 수 있다. 상기 플래그 정보와 관련해서는 도 3에서 자세히 살펴본 바와 같으며, 여기서 자세한 설명은 생략하기로 한다.

상기 플래그 정보가 제1 역변환부에서 다양한 변환 타입을 사용하지 않음을 의미하는 경우(즉, 플래그가 제1 값인 경우), 현재 블록의 변환 타입은 디폴트 변환 타입으로 설정될 수 있다.

상기 플래그 정보가 제1 역변환부에서 다양한 변환 타입을 사용함을 의미하는 경우(즉, 플래그가 제2 값인 경우), 복수의 변환 타입 중 어느 하나를 현재 블록의 변환 타입으로 결정할 수 있다. 복수의 변환 타입에 기반하여 현재 블록의 변환 타입을 결정하는 방법에 대해서는 도 3에서 살펴본 바와 같으며, 여기서 자세한 설명은 생략하기로 한다.

상기 제1 역변환부는, 상기 결정된 역변환 타입에 기초하여, 복호화된 잔차 계수에 대해 역변환을 수행할 수 있다.

상기 역변환을 위한 매트릭스(matrix)는 역변환 타입 별로 부호화기/복호화기에 기-정의될 수 있다. 상기 매트릭스는, 4x4, 8x8, 16x16, 32x32 또는 64x64의 크기로 정의될 수 있다. 상기 매트릭스는, 역변환 타입 별로 소정의 개수만큼 정의될 수 있다. 예를 들어, 제1 역변환 타입에 대해 p1개의 N1xN1 매트릭스가, 제2 역변환 타입에 대해 p2개의 N2xN2 매트릭스가, 디폴트 역변환 타입에 대해 p3개의 N3xN3 매트릭스가 각각 정의될 수 있다.

여기서, p1 내지 p3은, 1, 2, 3, 또는 4일 수 있다. p1 내지 p3은 서로 동일한 값일 수도 있고, p1 내지 p3 중 적어도 하나는 다른 하나와 상이할 수 있다. 또는, p1 내지 p3 중 어느 하나는 0일 수 있다. 예를 들어, p1=1이고, p2=0인 경우, 제2 역변환 타입에 대한 매트릭스는, 제1 역변환 타입에 대한 매트릭스에 기반하여 유도될 수 있다. 상기 유도는, 제1 역변환 타입에 대한 매트릭스를 소정의 각도(e.g., 90도, 180도, -90도, -180도)로 회전하여 수행될 수 있다. 또는, 상기 유도는, 매트릭스를 구성하는 성분 중 적어도 하나의 부호(sign)를 변경하여 수행될 수 있다. 상기 유도는, 상기 회전과 부호 변경을 모두 사용하여 수행될 수도 있다.

상기 N1 내지 N3은 각각 4, 8, 16, 32 또는 64 중 어느 하나일 수 있다. N1 내지 N3은 서로 동일한 값일 수도 있고, N1 내지 N3 중 적어도 하나는 다른 하나와 상이할 수 있다. 복호화기는 64x64 매트릭스를 정의하고, 이로부터 4x4, 8x8, 16x16 또는 32x32 중 적어도 하나의 매트릭스를 유도할 수 있다.

제2 역변환부(430)에서는 수평방향 역변환과 수직방향 역변환을 통합된 형태로 수행할 수 있으며, 제2 역변환의 방법은 블록의 크기, 블록의 예측모드, 비트스트림에 포함된 제2 역변환 인덱스 (index) 정보에 의해 결정될 수 있다.

한편, 도 3 및 도 4에서, 블록 또는 현재 블록은, 코딩 블록(CU)을 의미할 수 있다. 여기서, 코딩 블록은 소정의 분할 타입(QT, BT, TT, ABT 등)에 의해서 더 이상 분할되지 않는 코딩 블록을 의미할 수 있다. 또는, 상기 블록 또는 현재 블록은, 상기 코딩 블록에서 추가적으로 분할된 서브 블록을 의미할 수 있다. 즉, 코딩 블록 단위로 변환이 수행될 수도 있고, 서브 블록 단위로 변환이 수행될 수도 있다. 상기 코딩 블록의 서브 블록 중 일부 서브 블록에 대해서만 변환이 수행되고, 나머지 서브 블록에 대해서는 변환이 생략될 수도 있다.

여기서, 분할은, 소정의 분할 타입(QT, BT, TT, ABT 등)에 기초하여 수행될 수 있다. 또는, 상기 분할은, QT 및/또는 BT만을 이용하여 수행되도록 제한될 수 있다. 상기 추가적인 분할의 횟수는 1회로 한정될 수 있다.

상기 서브 블록으로의 분할은, 소정의 부호화 파라미터에 기초하여 수행될 수 있다. 상기 부호화 파라미터는, 코딩 블록이 소정의 분할 타입에 기초하여 추가적으로 분할되는지 여부를 나타내는 플래그(sbt_flag)를 의미할 수 있다. 또는 상기 부호화 파라미터는, 상기 코딩 블록 전체에 대해서 변환이 수행되는지, 아니면 코딩 블록 내 복수의 서브 블록 중 일부 서브 블록에 대해서만 변환이 수행되는지 여부를 나타내는 플래그(sbt_flag)를 의미할 수 있다.

상기 플래그(sbt_flag)는 비디오 시퀀스, 픽쳐, 슬라이스, 또는 블록 중 적어도 하나의 레벨에서 시그날링될 수 있다. 상기 시그날링은, 블록의 크기, 형태, 또는 예측 모드 중 적어도 하나에 기초하여 수행될 수 있다.

예를 들어, 상기 플래그(sbt_flag)는, 블록의 크기가 소정의 제4 문턱값보다 작거나 같은 경우에만 시그날링될 수 있다. 여기서, 블록의 크기는 현재 블록의 너비와 높이 중 최대값 또는 최소값으로 표현될 수 있다. 상기 제4 문턱값은 서브 블록으로의 추가 분할이 허용되는 최대 블록 크기를 의미할 수 있다. 또는, 플래그(sbt_flag)는, 블록의 크기가 소정의 제4 문턱값보다 크거나 같은 경우에만 시그날링될 수 있다. 여기서, 블록의 크기는 현재 블록의 너비와 높이 중 최대값 또는 최소값으로 표현될 수 있다. 상기 제4 문턱값은 서브 블록으로의 추가 분할이 허용되는 최소 블록 크기를 의미할 수 있다. 상기 제4 문턱값은, 부호화기/복호화기에 기-약속된 고정된 값일 수도 있고, 부호화기에서 부호화되어 복호화기로 시그날링될 수도 있다.

예를 들어, 상기 플래그(sbt_flag)는, 블록의 형태가 정사각형인 경우에만 시그날링될 수 있다. 또는, 상기 플래그(sbt_flag)는, 블록의 형태가 직사각형인 경우에만 시그날링될 수 있다.

예를 들어, 상기 플래그(sbt_flag)는, 블록의 예측 모드가 화면 간 예측인 경우에만 시그날링될 수 있다. 또는, 상기 플래그(sbt_flag)는, 블록의 예측 모드가 화면 내 예측인 경우에만 시그날링될 수 있다. 상기 플래그의 시그날링은, 전술한 블록의 크기, 형태, 또는 예측 모드 중 적어도 하나에 관계없이 수행될 수도 있다.

상기 플래그(sbt_flag)에 따라 일부 서브 블록에 대해서만 변환이 수행되는 경우, 상기 일부 서브 블록을 특정하는 정보가 시그날링될 수 있다. 일부 서브 블록은 적어도 하나의 넌-제로 변환 계수를 포함한 서브 블록을 의미할 수 있다. 따라서, 상기 정보는, 적어도 하나의 넌-제로 변환 계수를 포함하는지 여부를 나타내는 플래그(coded_block_flag)일 수도 있다. 상기 플래그(coded_block_flag)는, 서브 블록의 단위로 각각 시그날링될 수 있다.

또는 상기 정보는, 적어도 하나의 넌-제로 변환 계수를 가진 서브 블록의 위치를 나타내는 위치 정보일 수도 있다. 예를 들어, 코딩 블록이 QT로 분할된 경우, 서브 블록에 0 내지 3의 인덱스가 각각 할당될 수 있다. 인덱스 0의 위치 정보가 시그날링된 경우, 좌상단 서브 블록은 적어도 하나의 넌-제로 변환 계수를 가진 블록으로 결정될 수 있다.

또는, 상기 정보는, 적어도 하나의 넌-제로 변환 계수를 가지지 않은 서브 블록의 위치를 나타내는 위치 정보일 수도 있다. 예를 들어, 코딩 블록이 BT로 분할된 경우, 서브 블록에 0 내지 1의 인덱스가 각각 할당될 수 있다. 인덱스 1의 위치 정보가 시그날링된 경우, 우측(또는 하단) 서브 블록은 적어도 하나의 넌-제로 변환 계수를 가지지 않은 블록으로 결정되고, 반대로 좌측(또는 상단) 서브 블록은 적어도 하나의 넌-제로 변환 계수를 가진 블록으로 결정될 수 있다.

상기 플래그(coded_block_flag) 또는 위치 정보에 의해 특정되는 일부 서브 블록에 대해서만 역변환 타입이 결정될 수 있다. 즉, 상기 특정된 서브 블록에 대해서만 역변환 타입을 결정하기 위한 정보가 복호화되거나 전술한 역변환 타입의 유도 과정이 수행될 수 있다. 상기 위치 정보에 의해 특정되지 않은 서브 블록에 대해서는, 변환 계수의 값이 0으로 설정될 수 있다.

도 3 및 도 4의 실시예는, 도 5 내지 도 13의 실시예에서도 동일/유사하게 적용될 수 있으며, 이하 중복적인 설명은 생략하기로 한다.

먼저 비트스트림으로부터 다양한 역변환 타입을 사용하는 역변환을 수행할지를 나타내는 플래그 (flag)를 추출(510)한다.

상기 추출한 플래그가 다양한 역변환 타입을 사용하는 역변환 수행을 의미하지 않을 경우, 다양한 역변환을 위한 정보 추출 단계를 끝낸다.

다양한 역변환 타입을 사용하는 역변환을 수행하지 않는 경우, 미리 정해진 변환 타입을 이용해 역변환을 수행할 수 있다.

상기 추출한 플래그가 다양한 역변환 타입을 사용하는 역변환 수행을 의미하는 경우, 다양한 역변환을 위한 추가적인 정보 추출을 수행한다.

화면 내 예측을 수행하는 블록이 아닐 경우, 다양한 역변환 타입 결정을 위한 인덱스 값을 추출한다.

화면 내 예측을 수행하는 블록일 경우, 역양자화 결과로 얻어진 0이 아닌 변환 계수의 개수가 임계 값 (threshold)보다 크면 다양한 역변환 타입 결정을 위한 인덱스 값을 추출(520)하고, 그렇지 않으면 다양한 역변환 타입 결정을 위한 인덱스 값을 추출하지 않는다.

먼저 비트스트림으로부터 다양한 역변환 타입을 사용하는 역변환을 수행할지를 나타내는 플래그 (flag)를 추출(610)한다.

상기 추출한 다양한 역변환 타입을 이용한 역변환을 수행할지를 나타내는 플래그가 다양한 역변환 타입을 사용하는 역변환 수행을 의미하지 않는 경우, 미리 정해진 변환 타입을 이용해 역변환(630)을 수행한다.

상기 추출한 다양한 역변환 타입을 이용한 역변환을 수행할지를 나타내는 플래그가 다양한 변환 타입을 사용하는 역변환 수행을 의미하는 경우, 다양한 역변환 타입 결정을 위한 인덱스 값을 추출(620)한다.

상기 추출한 인덱스 값을 통해 얻은 수평 방향 역변환 타입이 ID일 경우, 역변환 수행 단계(630)에서 수평 방향 역변환은 생략하고 수직 방향 역변환만 수행한다.

상기 추출한 인덱스 값을 통해 얻은 수직 방향 역변환 타입이 ID일 경우, 역변환 수행 단계(630)에서 수직 방향 역변환은 생략하고 수평 방향 역변환만 수행한다.

상기 추출한 인덱스 값을 통해 얻은 수평 방향 역변환 타입과 수직 방향 역변환 타입이 모두 ID일 경우, 역변환 수행 단계(730)를 생략한다.

먼저 역 양자화를 통해 얻은 변환 계수 중 0이 아닌 변환 계수의 개수를 카운트(710)하여 제2 역변환 인덱스 추출여부를 결정한다.

상기 0이 아닌 변환 계수의 개수가 임계 값보다 많을 경우 제2 역변환 인덱스 추출(720) 단계를 생략한다.

상기 0이 아닌 변환 계수의 개수가 임계 값보다 클 경우 제2 역변환 수행 단계(730)를 생략한다.

상기 0이 아닌 변환 계수의 개수가 임계 값 보다 작을 경우 제2 역변환 인덱스를 추출(720)한다.

제2 역변환 수행(730) 단계에서는 상기 추출한 제2 역변환 인덱스에 따라 역변환을 수행한다.

제2 역변환 수행 단계(730)에서는 블록의 크기, 예측 모드에 따라 제2 역변환 수행 방법이 결정될 수 있다.

제안하는 다양한 역변환 기술의 사용 여부는 압축된 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (810) 내에 포함될 수 있다. 또한, 화면 내 예측을 사용하는 블록과 화면 간 예측을 사용하는 블록은 상호 독립적으로 다양한 종류의 변환 타입을 적용하는 변환 기술을 사용하거나 사용하지 않을 수 있다. 즉, 본 발명의 일 실시예에 따르면 화면 내 예측을 사용하는 블록에서만 다양한 종류의 변환 타입을 적용하는 변환 기술을 사용하고, 화면 간 예측을 사용하는 블록에서는 고정된 변환 타입을 적용하는 변환 기술을 사용할 수 있다.

화면 내 예측을 사용하는 블록의 다양한 역변환 타입 사용 여부(820)는 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (810) 내에 포함될 수 있다.

화면 간 예측을 사용하는 블록의 다양한 역변환 타입 사용 여부(830)는 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (810) 내에 포함될 수 있다.

제2 역변환의 사용 여부(840)는 압축된 비트스트림 내에 존재하는 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (810) 내에 포함될 수 있다.

도 9는 본 발명의 일 실시예에 따른 다양한 역변환 기술을 사용하는 방법 및 장치에서 다양한 변환 기술의 수행을 위한 정보를 비트스트림 내의 신택스 (syntax) 중 코딩 유닛 신택스에 의해 시그널링하는 방법을 도시한다.

다양한 역변환 기술의 사용 여부를 의미하는 플래그(920)는 압축된 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 코딩 유닛 신택스(910) 내에 포함될 수 있다.

다양한 역변환 기술의 사용 여부를 나타내는 플래그가 가 다양한 역변환 기술을 사용함을 의미하는 경우, 다양한 역변환 타입 정보를 나타내는 다양한 역변환 타입 인덱스(930)는 압축된 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 코딩 유닛 신택스(910) 내에 포함될 수 있다.

제2 역변환에 대한 정보를 나타내는 제2 역변환 인덱스(940)는 압축된 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 코딩 유닛 신택스(1010) 내에 포함될 수 있다.

다양한 역변환 기술의 사용 여부는 플래그 형태로 비트스트림에 포함되지 않을 수 있으며, 역변환 타입 인덱스로만 비트스트림에 포함되어 해당 인덱스를 통해 제1 역변환과정의 수행여부를 결정할 수 있다.

먼저, 비트스트림으로부터 역변환 타입 인덱스 추출(1010)을 통해 역변환 타입을 결정한다.

상기 결정한 수평 및 수직 방향 역변환 타입이 모두 ID를 의미하는 경우, 제2 역변환 인덱스 추출 과정(1020) 및 제2 역변환 수행 과정(1030)을 생략할 수 있다.

상기 결정한 수평 및 수직 방향 역변환 타입이 모두 ID를 의미하는 경우, 제1 역변환 수행 과정(1040)을 생략할 수 있다.

상기 결정한 수평 및 수직 방향 역변환 타입이 모두 ID를 의미하는 경우, 역변환을 수행하지 않음을 의미하는 변환 스킵 플래그 (transform skip flag) 추출을 생략할 수 있다.

수평 및 수직 방향 역변환 타입이 모두 ID가 아닌 경우, 제2 역변환 인덱스를 추출(1020)하고 추출한 인덱스에 따라 제2 역변환을 수행(1030)한다.

수평 방향 역변환 타입이 ID를 의미하는 경우 제1 역변환 수행 단계(1040)에서 수평 방향 역변환은 생략하고 수직 방향 역변환만을 수행한다.

수직 방향 역변환 타입이 ID를 의미하는 경우, 제1 역변환 수행 단계(1040)에서 수직 방향 역변환은 생략하고 수평 방향 역변환만을 수행한다.

수평 및 수평 방향 역변환 타입이 모두 ID가 아닌 경우, 제1 역변환 수행 단계(1040)에서 수평 및 수직 방향 역변환을 모두 수행한다.

다양한 역변환 기술을 사용하는 경우, 추출된 역변환 타입 인덱스에 의해 결정된 역변환 타입에 따라 주파수별 가중 역양자화를 수행할 수 있다.

역변환 타입에 따라 주파수별 가중 역양자화를 수행하는 경우, 주파수별 가중 양자화 파라미터 결정 단계(1110)와 가중 역양자화 수행 단계(1120)에서 비트스트림에 포함된 양자화 파라미터를 이용해 역변환 타입에 따른 주파수별 가중 역양자화를 수행할 수 있다.

역변환 타입에 따라 주파수별 가중 역양자화를 수행하는 경우, 주파수별 가중 양자화 파라미터 결정 단계(1110)와 가중 역양자화 수행 단계(1120)에서 미리 정의된 양자화 파라미터들 중 역변환 타입에 따라 양자화 파라미터 값을 선택하여 가중 역양자화를 수행할 수 있다.

제2 역변환 기술을 사용하는 경우, 추출된 제2 역변환 인덱스에 따라 주파수별 가중 역양자화를 수행할 수 있다.

제2 역변환 인덱스에 따라 주파수별 가중 역양자화를 수행하는 경우, 가중 양자화 파라미터 결정 단계(1210)와 가중 역양자화 수행단계(1220)에서 비트스트림에 포함된 양자화 파라미터를 이용해 가중 역양자화를 수행할 수 있다.

제2 역변환 인덱스에 따라 주파수별 가중 역양자화를 수행하는 경우, 가중 양자화 파라미터 결정 단계(1210)와 가중 역양자화 수행단계(1220)에서 미리 정의된 양자화 파라미터들 중 제2 역변환 인덱스에 따라 양자화 파라미터를 선택하여 가중 역양자화를 수행할 수 있다.

도 13은 본 발명의 일 실시예에 따른 다양한 역변환 또는 제2 역변환을 수행하는 경우, 가중 양자화를 위한 정보를 신택스 (syntax)에 의하여 시그널링 하는 방법을 도시한다.

다양한 역변환 또는 제2 역변환을 수행하는 경우의 가중 양자화를 위한 정보는 압축된 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (1310) 내에 포함될 수 있다.

다양한 역변환 또는 제2 역변환을 수행하는 경우의 가중 양자화의 사용 여부를 나타내는 플래그(1320)는 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (1310) 내에 포함될 수 있다.

상기 가중 양자화 여부를 나타내는 플래그(1320)가 가중 양자화 사용을 의미하는 경우, 시퀀스 단위 가중 양자화 파라미터 전송을 의미하는 플래그(1330)가 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 SPS (Sequence Parameter Set) (1310) 내에 포함될 수 있다.

상기 시퀀스 단위 가중 양자화 파라미터 전송을 의미하는 플래그(1330)가 가중 양자화 파라미터 전송을 의미할 경우, 양자화 파라미터들이 비트스트림에 포함될 수 있고, 해당 파라미터들을 추출하는 과정(1340)을 수행한다.

다양한 역변환 또는 제2 역변환을 수행하는 경우의 가중 양자화를 위한 정보는 압축된 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 PPS (Picture Parameter Set) (1350) 내에 포함될 수 있다.

픽쳐 단위 가중 양자화 파라미터 전송을 의미하는 플래그(1360)는 비트스트림 내에 존재하는 NAL (Network Abstract Layer) 중 PPS (Picture Parameter Set) (1350) 내에 포함될 수 있다.

상기 픽쳐 단위 가중 양자화 파라미터 전송을 의미하는 플래그(1360)가 가중 양자화 파라미터 전송을 의미할 경우, 양자화 파라미터들이 비트스트림에 포함될 수 있고, 해당 파라미터들을 추출하는 과정(1370)을 수행한다.

본 발명은 다양한 변환 기술을 사용하여 비디오 신호를 부호화/복호화하는데 이용될 수 있다.

Claims

비디오 복호화 방법에 있어서,

비트스트림으로부터 제1 역변환을 위한 변환 타입 정보를 추출하는 단계;

상기 추출한 정보를 이용해 다수의 역변환 타입에서 선택적으로 역변환 타입을 결정하는 단계; 및

상기 결정한 역변환 타입을 이용해 수평방향 또는 수직방향 역변환을 수행하는 단계를 포함하는 비디오 복호화 방법.
제 1항에 있어서,

비트스트림으로부터 제1 역변환을 위한 변환 타입 정보를 추출하는 단계는

비트스트림으로부터 제1 역변환 수행 여부를 나타내는 정보를 획득하는 단계; 및

상기 획득한 정보가 제1 역변환 수행을 의미하는 경우, 추가로 제1 역변환 타입 결정을 위한 정보를 획득하는 단계를 포함하는 비디오 복호화 방법.
제 1항에 있어서,

상기 추출한 정보를 이용해 다수의 역변환 타입에서 선택적으로 역변환 타입을 결정하는 단계는

비트스트림으로부터 추출한 역변환 타입 결정을 위한 정보에 의해 결정된 역변환 타입에 따라 다수의 역변환 타입에서 선택적으로 수평방향 역변환 타입을 결정하는 단계; 및

비트스트림으로부터 추출한 역변환 타입 결정을 위한 정보에 의해 결정된 역변환 타입에 따라 다수의 역변환 타입에서 선택적으로 수직방향 역변환 타입을 결정하는 단계를 포함하는 비디오 복호화 방법.
제 1항에 있어서,

상기 결정한 변환 타입을 이용해 수평 방향 또는 수직 방향 역변환을 수행하는 단계는

다수의 역변환 타입 중 결정된 수평 방향 역변환 타입을 이용해 제1 역변환을 수행하는 단계; 및

다수의 역변환 타입 중 결정된 수직 방향 역변환 타입을 이용해 제1 역변환을 수행하는 단계를 포함하는 비디오 복호화 방법.
비디오 복호화 방법에 있어서,

비트스트림으로부터 제1 역변환을 위한 역변환 타입 정보를 추출하여 수평방향 역변환 또는 수직방향 역변환의 변환 타입을 결정하는 단계; 및

상기 결정된 역변환 타입에 따라 수평방향 역변환 또는 수직방향 역변환을 생략하는 단계를 포함하는 비디오 복호화 방법.
제 5항에 있어서,

비트스트림으로부터 제1 역변환을 위한 역변환 타입 정보를 추출하여 수평방향 역변환 또는 수직방향 역변환의 변환 타입을 결정하는 단계는

비트스트림으로부터 제1 역변환을 위한 역변환 타입 정보를 추출하는 단계; 및

상기 추출한 역변환 타입 정보를 이용해 다양한 역변환 타입 중에서 수평 방향 또는 수직방향 역변환에 사용할 역변환 타입을 결정하는 단계를 포함하는 비디오 복호화 방법.
제 5항에 있어서,

상기 결정된 역변환 타입에 따라 수평 방향 역변환 또는 수직방향 역변환을 생략하는 단계는

결정된 수평방향 역변환을 위한 변환 타입이 역변환을 수행하지 않음을 의미하는 변환 타입일 경우, 수평방향 제1 역변환을 생략하는 단계;

결정된 수직방향 역변환을 위한 변환 타입이 역변환을 수행하지 않음을 의미하는 변환 타입일 경우, 수직방향 제1 역변환을 생략하는 단계; 및

결정된 수평방향 역변환을 위한 변환 타입 및 수직방향 역변환을 위한 변환 타입이 역변환을 수행하지 않음을 의미하는 경우, 제1 역변환을 생략하는 단계를 포함하는 비디오 복호화 방법.