KR102523384B1 - 비디오 신호의 복호화 방법 및 이의 장치 - Google Patents

비디오 신호의 복호화 방법 및 이의 장치 Download PDF

Info

Publication number
KR102523384B1
KR102523384B1 KR1020220035103A KR20220035103A KR102523384B1 KR 102523384 B1 KR102523384 B1 KR 102523384B1 KR 1020220035103 A KR1020220035103 A KR 1020220035103A KR 20220035103 A KR20220035103 A KR 20220035103A KR 102523384 B1 KR102523384 B1 KR 102523384B1
Authority
KR
South Korea
Prior art keywords
transform
block
prediction
unit
information
Prior art date
Application number
KR1020220035103A
Other languages
English (en)
Other versions
KR20220040451A (ko
Inventor
한종기
이재영
Original Assignee
세종대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020170060576A external-priority patent/KR102378803B1/ko
Application filed by 세종대학교 산학협력단 filed Critical 세종대학교 산학협력단
Publication of KR20220040451A publication Critical patent/KR20220040451A/ko
Priority to KR1020230049183A priority Critical patent/KR20230054805A/ko
Application granted granted Critical
Publication of KR102523384B1 publication Critical patent/KR102523384B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 비디오 신호의 복호화 방법 및 이의 장치에 관한 것이다. 본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법 및 이의 장치는, 복수 개의 변환 계수 그룹을 포함하는 변환 블록을 스캔하는 방법에 있어서, 상기 변환 블록에 포함되는 적어도 하나 이상의 변환 영역을 나타내는 변환 영역 정보를 획득하는 단계; 상기 변환 영역 정보에 기초하여 제 1 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 스캔하는 단계; 상기 변환 블록 내의 제 2 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 스캔하는 단계를 포함한다.

Description

비디오 신호의 복호화 방법 및 이의 장치 {A METHOD OF DECODING A VIDEO SIGNAL AND AN APPARATUS HAVING THE SAME}
본 발명은 비디오 신호의 복호화 방법 및 이의 장치에 관한 것으로서, 더욱 상세하게는, 복수 개의 변환 영역별로 변환 계수 그룹을 스캔하는 비디오 신호의 복호화 방법 및 이의 장치에 관한 것이다.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비하여 상대적으로 데이터량이 증가하기 때문에, 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용하여 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 영상 데이터가 고해상도, 고품질화 됨에 따라 발생하는 이러한 문제들을 해결하기 위하여 고효율의 영상 압축 기술들이 활용될 수 있다.
비디오 압축 기술들에서는, 종래의 압축 기술에 비하여 2 배 이상으로 압축률을 향상시키기 위하여 다양한 효과적인 방법들을 채택하고 있다. 화면간 예측 기술로는 모션 벡터 예측자(Motion Vector Predictor)를 이용하는 방법, 머지 모드 및 스킵 모드를 이용하는 방법들이 사용된다. 이는 모두 화면간 예측을 효율적으로 하기 위한 기술들이다.
또한, 기존의 비디오 코덱들은 하나의 픽쳐를 16x16 크기 블록 단위인 매크로 블록(Macro Block)으로 분할하여 분할하였으나, 최근 HEVC 에서는 부호화 기본단위로서 코딩 유닛(Coding Unit: CU)을 이용하고 있다. 상기 코딩 유닛은 시퀀스 파라미터 셋에 저장된 파라미터값이 지정하는 최대 및 최소 크기까지 분할될 수 있다. 예측 부호화를 위한 기본 단위는 예측 유닛(Prediction Unit: PU)로 정의되며, 상기 하나의 코딩 유닛은 복수 개의 상기 예측 유닛으로 분할되어 예측되다. 또한, 각 코딩 유닛의 부호화 및 복호화 순서는 래스터 스캔(Raster scan) 방식을 이용한다.
이와 같이, HEVC 에서는 다양한 크기의 코딩 유닛을 이용함으로써, 영상의 공간 해상도 및 블록 특성을 효과적으로 고려하여 부호화할 수 있다. 일반적으로 영상의 해상도가 작거나 화소값들이 국지적으로 크게 변화하는 경우에는 작은 크기의 코딩 유닛들을 이용하여 화면내 및 화면간 예측을 수행하는 것이 효율적일 수 있다. 이와 같이, 작은 크기의 코딩 유닛을 이용하는 경우, 부호화에 필요한 헤더 비트량은 증가하지만, 상대적으로 예측이 정밀하게 이루어져 양자화 에러와 변환 계수의 부호화에 필요한 비트량이 감소하는 장점이 있다.
반대로, 영상의 공간 해상도가 크거나 화소값들의 변화가 적은 영역에서는 큰 코딩 유닛을 이용하는 것이 부호화 효율을 높일 수 있다. 이 경우, 큰 코딩 유닛을 이용하여도 작은 코딩 유닛을 이용하여 예측하는 경우에 비하여 예측 오차가 크게 증가하지 않는 경향이 있으므로 이러한 블록들을 부호화하는 경우, 큰 코딩 유닛을 이용하여 전송 비트량을 절약하는 것이 효율적일 수 있다. 그러나, 종래의 다양한 코딩 유닛을 이용하더라도 높은 해상도를 갖는 다양한 이미지를 효율적으로 코딩하기 어려운 단점이 있다.
본 발명이 해결하고자 하는 과제는 다양한 모양의 변환 블록을 이용하여 화면내 예측의 코딩 효율을 향상시키는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.
또한, 본 발명이 해결하고자 하는 다른 과제는 고주파 영역보다 저주파 영역의 변환 계수 그룹을 먼저 코딩함으로써, 코딩 효율을 높일 수 있는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 비디오 신호의 복호화 방법은, 복수 개의 변환 계수 그룹을 포함하는 변환 블록을 스캔하는 방법에 있어서, 상기 변환 블록에 포함되는 적어도 하나 이상의 변환 영역을 나타내는 변환 영역 정보를 획득하는 단계; 상기 변환 영역 정보에 기초하여 제 1 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 스캔하는 단계; 상기 변환 블록 내의 제 2 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 스캔하는 단계를 포함한다.
상기 복수 개의 변환 계수 그룹은 저주파 영역의 변환 계수 그룹이 고주파 영역의 변환 계수 그룹보다 선행하여 스캔될 수 있다.
일 실시예에서, 상기 변환 영역 정보는 인코더로부터 수신되거나 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 획득될 수 있다. 또한, 상기 변환 영역 정보는 복호화기에서 기결정된 방법으로 획득될 수 있다.
상기 변환 영역 정보를 획득하는 단계 이전에, 상기 변환 블록이 비정방형 블록인지 판단하는 단계를 더 포함할 수 있다. 상기 판단하는 단계는 상기 변환 블록의 가로의 길이 및 세로의 길이에 기초하여 수행될 수 있다.
상기 다른 과제를 해결하기 위한 본 발명의 일 실시예에 따른 비디오 신호의 복호화 장치는, 변환 블록에 포함되는 적어도 하나 이상의 변환 영역을 나타내는 변환 영역 정보를 획득하는 변환 영역 정보 획득부; 및 상기 변환 영역 정보에 기초하여 상기 적어도 하나 이상의 변환 영역별로 상기 변환 영역에 포함되는 복수 개의 변환 계수 그룹을 차례로 스캔하는 변환 계수 그룹 스캔부를 포함할 수 있다.
본 발명의 실시예에 따르면, 변환 블록이 비정방형 블록인 경우 상기 변환 블록을 복수 개의 변환 계수 그룹 중 일부를 포함하는 적어도 하나 이상의 변환 영역으로 분할하여 상기 변환 영역 내에 포함된 변환 계수 그룹들을 차례로 스캔함으로써, 화면내 예측의 코딩 효율을 향상시키는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.
또한, 본 발명의 다른 실시예에 따르면, 변환 블록을 적어도 하나 이상의 변환 영역으로 분할하고, 상기 분할된 변환 영역 내에 포함된 변환 계수 그룹들을 차례로 스캔함으로써, 고주파 영역보다 저주파 영역의 변환 계수 그룹을 먼저 코딩함으로써 코딩 효율을 높일 수 있는 비디오 신호의 복호화 방법 및 이의 장치를 제공하는 것이다.
도 1은 본 발명의 일 실시예에 따른 비디오 부호화 장치를 개략적으로 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 비디오 복호화 장치를 개략적으로 나타낸 블록도이다.
도 3은 종래의 변환 블록의 구조를 설명하기 위한 것이다.
도 4는 종래의 16x16 변환 블록을 구성하는 변환 계수 그룹을 설명하기 위한 것이다.
도 5는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 변환 스캔 방법을 설명하기 위한 것이다.
도 6a 내지 도 6d는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 스캔 방법의 종류를 설명하기 위한 것이다.
도 7a 및 도 7b는 본 발명의 일 실시예에 따른 변환 블록에 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.
도 8은 16x8 변환 블록의 변환 계수에 대하여 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.
도 9는 본 발명의 일 실시예에 따른 변환 계수 그룹을 스캔하는 방법을 나타내는 순서도이다.
도 10는 본 발명의 일 실시예에 따른 변환 계수 그룹을 스캔하는 장치를 도시한 것이다.
도 11a 및 도 11b는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 방법을 설명하기 위한 것이다.
도 12a 내지 도 13d는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 다양한 방법을 설명하기 위한 예이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.
또한, 도면에서 각 유닛의 두께나 크기는 설명의 편의 및 명확성을 위하여 과장된 것이며, 도면상에서 동일 부호는 동일한 요소를 지칭한다. 본 명세서에서 사용된 바와 같이, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다.
본 명세서에서 사용된 용어는 특정 실시예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이, 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있다. 또한, 본 명세서에서 사용되는 경우 "포함한다 (comprise)" 및/또는 "포함하는 (comprising)"은 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는 것이며, 하나 이상의 다른 형상, 숫자, 동작, 부재, 요소 및/또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다.
본 명세서에서 제 1, 제 2 등의 용어가 다양한 구성요소, 부재, 부품, 영역, 및/또는 부분들을 설명하기 위하여 사용되지만, 이들 구성요소, 부재, 부품, 영역, 및/또는 부분들은 이들 용어에 의해 한정되어서는 안됨은 자명하다. 이들 용어는 하나의 구성요소, 부재, 부품, 영역 또는 부분을 다른 영역 또는 부분과 구별하기 위하여만 사용된다. 따라서, 이하 상술할 제 1 구성요소, 부재, 부품, 영역 또는 부분은 본 발명의 가르침으로부터 벗어나지 않고서도 제 2 구성요소, 부재, 부품, 영역 또는 부분을 지칭할 수 있다. 또한, 및/또는 용어는 복수의 관련되어 기재되는 항목들의 조합 또는 복수의 관련되어 기재되는 항목들 중의 어느 항목을 포함한다.
어느 구성요소가 다른 구성요소에 "연결되어" 있거나 "접속되어" 있다고 언급되는 경우에는, 상기 다른 구성요소에 직접적으로 연결되어 있거나 접속되어 있는 경우 뿐만 아니라, 상기 어느 구성요소와 상기 다른 구성요소 사이에 다른 구성요소가 존재하는 경우를 포함하여 이해되어야 한다. 그러나, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있거나 "직접 접속되어" 있다고 지칭되는 경우에는, 중간에 다른 구성요소가 존재하지 아니하고 상기 어느 구성요소와 상기 다른 구성요소가 직접 연결 또는 접속된 것으로 이해되어야 할 것이다.
이하, 본 발명의 실시예들은 본 발명의 이상적인 실시예들을 개략적으로 도시하는 도면들을 참조하여 설명한다. 도면들에 있어서, 예를 들면, 부재들의 크기와 형상은 설명의 편의와 명확성을 위하여 과장될 수 있으며, 실제 구현시, 도시된 형상의 변형들이 예상될 수 있다. 따라서, 본 발명의 실시예는 본 명세서에 도시된 영역의 특정 형상에 제한된 것으로 해석되어서는 아니된다.
도 1은 본 발명의 일 실시예에 따른 영상 부호화 장치를 개략적으로 나타낸 블록도이다.
도 1을 참조하면, 영상 부호화 장치(100)는 영상 분할부(105), 화면간 예측부(110), 화면내 예측부(115), 변환부(120), 양자화부(125), 재정렬부(130), 엔트로피 부호화부(135), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함한다.
도 1에 나타난 각 구성요소들은 영상 부호화 장치에서 서로 다른 특징적인 기능들을 나타내기 위하여 독립적으로 도시한 것이며, 각 구성요소들이 분리된 하드웨어나 각각 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성요소는 설명의 편의상 각각의 구성요소로 나열하여 포함한 것으로 각 구성요소 중 적어도 두 개의 구성요소가 합쳐져 하나의 구성요소로 이루어지거나, 하나의 구성요소가 복수개의 구성요소로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성요소가 통합된 실시예 또는 분리된 실시예도 본 발명의 본질적인 측면에서 벗어나지 않는 한 본 발명의 권리범위에 포함될 수 있다.
영상 분할부(105)는 입력된 영상을 적어도 하나의 처리 단위로 분할할 수 있다. 상기 처리 단위는 예측 블록(Prediction Unit, 이하 "PU"라 함)일 수 있고, 변환 블록(Transform Unit, 이하 "TU"라 함)일 수도 있으며, 코딩 블록(Coding Unit, 이하 "CU"라 함)일 수도 있다. 다만, 본 명세서에서는 설명의 편의를 위해, 예측 블록을 예측 단위, 변환 블록을 변환 단위, 부호화 또는 복호화 블록을 부호화 단위 또는 복호화 단위로 표현할 수도 있다.
일 실시예에서, 영상 분할부(105)는 하나의 영상에 대하여 복수의 부호화 블록, 예측 블록, 및 변환 블록의 조합으로 분할하고, 소정의 기준(예를 들어, 비용 함수)에 기초하여 하나의 부호화 블록, 예측 블록, 및 변환 블록의 조합을 선택하여 영상을 부호화할 수 있다.
예를 들어, 하나의 영상은 복수 개의 코딩 블록으로 분할될 수 있다. 일 실시예에서, 하나의 영상은 쿼드 트리 구조(Quad Tree Structure) 또는 바이너리 트리 구조와 같은 재귀적인 트리 구조를 사용하여 상기 코딩 블록을 분할할 수 있으며, 하나의 영상 또는 최대 크기 코딩 블록(largest coding unit)를 루트로 하여 다른 코딩 블록으로 분할되는 코딩 블록은 분할된 코딩 블록의 개수만큼의 자식 노드를 가지고 분할될 수 있다. 이러한 과정을 통하여 더 이상 분할되지 아니하는 코딩 블록은 리프 노드가 될 수 있다. 예를 들어, 하나의 코딩 블록에 대하여 정방형 분할만이 가능하다고 가정한 경우에는 하나의 코딩 블록은 예를 들어, 4 개의 코딩 블록으로 분할될 수 있다. 그러나, 본 발명에서는 상기 코딩 블록, 예측 블록 및/또는 변환 블록은 분할 시 대칭 분할에 한정하지 아니하고, 비대칭 분할(Asymmetric Partition)도 가능하며 4 개의 분할 뿐만 아니라 2 개의 분할도 가능하다. 그러나, 이러한 분할 개수는 예시적일 뿐 본 발명이 이에 한정되는 것은 아니다.
예측 블록도 하나의 코딩 블록 내에서 동일한 크기의 적어도 하나의 정방형(square) 또는 비정방형(non-square) 등의 형태를 가지고 분할된 것일 수 있고, 하나의 코딩 블록 내에서 분할된 예측 블록 중 어느 하나의 예측 블록이 다른 하나의 예측 블록과 상이한 형태와 크기를 가지도록 분할될 수도 있다. 일 실시예에서는, 코딩 블록과 예측 블록이 동일할 수 있다. 즉, 코딩 블록과 예측 블록을 구분하지 아니하고, 분할된 코딩 블록을 기준으로 예측이 수행될 수도 있다.
예측부는 화면간 예측(inter prediction)을 수행하는 화면간 예측부(110) 및 화면내 예측(intra prediction)을 수행하는 화면내 예측부(115)를 포함할 수 있다. 코딩 효율을 높이기 위하여, 영상 신호를 그대로 부호화하는 것이 아니라, 이미 부호화 및 복호화가 완료된 영상 내부의 특정 영역을 이용하여 영상을 예측하고, 원래의 영상과 예측 영상 사이의 레지듀얼 값을 부호화한다. 또한, 예측을 위하여 사용된 예측 모드 정보, 모션 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(135)에서 부호화되어 복호화부에 전달될 수 있다. 특정한 부호화 모드를 이용하는 경우에는 화면간 예측부(110) 및 화면내 예측부(115)를 통하여 예측 블록을 생성하지 아니하고, 원본 블록을 그대로 부호화하여 복호화부에 전송하는 것도 가능하다.
일 실시예에서, 화면간 예측부(110) 및 화면내 예측부(115)는 예측 블록에 대하여 화면간 예측을 수행할 것인지 화면내 예측을 수행할 것인지를 결정하고, 화면간 예측 모드, 모션 벡터, 및 참조 영상과와 같은 상기 예측 방법 각각에 따른 구체적인 정보들을 결정할 수 있다. 이 경우, 예측이 수행되는 처리 단위와 예측 방법, 그리고 세부 처리 단위는 각각 다를 수 있다. 예를 들어, 예측 모드와 예측 방법은 예측 블록에 따라 결정되더라도, 예측의 수행은 변환 블록에 따라 수행될 수 있다.
화면간 예측부(110) 및 화면내 예측부(115)는, 영상 분할부(105)에서 분할된 영상의 처리 단위에 대하여 예측을 수행하여 예측된 샘플로 구성되는 예측 블록을 생성할 수 있다. 화면간 예측부(110) 및 화면내 예측부(115)에서의 영상 처리 단위는 코딩 블록 단위일 수 있고, 변환 블록 단위일 수도 있으며, 예측 블록 단위일 수도 있다.
화면간 예측부(110)는 현재 영상의 이전 영상 또는 이후 영상 중 적어도 하나 이상의 영상의 정보를 기초로 예측 블록을 예측할 수 있고, 경우에 따라 현재 영상 내의 코딩이 완료된 일부 영역의 정보를 기초로 예측 블록을 예측할 수 있다. 화면간 예측부(110)는 참조 영상 보간부, 모션 예측부, 및 모션보상부를 포함할 수 있다.
일 실시예에서, 화면간 예측부(110)에서 예측을 위하여 이용되는 상기 하나 이상의 영상의 정보는 이미 부호화 및 복호화가 진행된 영상들의 정보일 수 있고, 임의의 방법으로 변형되어 저장된 영상들의 정보일 수 있다. 예를 들어, 상기 임의의 방법으로 변형되어 저장된 영상은 부호화 및 복호화가 진행된 영상을 확대 또는 축소한 영상일 수 있고, 또는 영상 내의 모든 픽셀 값의 밝기를 변형시키거나, 칼라 포맷을 변형시킨 영상일 수도 있다.
참조 영상 보간부는 메모리(155)로부터 참조 영상 정보를 제공받아 참조 영상에서 정수 픽셀 이하의 픽셀 정보를 생성할 수 있다. 휘도 픽셀의 경우, 필터의 계수를 달리하는 DCT 기반의 8-탭 보간 필터(DCT-based Interpolation Filter)를 이용하여 1/4 픽셀 단위로 정수 이하의 픽셀 정보를 생성할 수 있다. 색차 신호의 경우에는 필터의 계수를 달리하는 DCT 기반의 4-탭 보간 필터(DCT-based Interpolation Filter)를 이용하여 1/8 픽셀 단위로 정수 이하의 픽셀 정보를 생성할 수 있다. 그러나, 필터의 종류 및 정수 이하의 픽셀 정보를 생성하는 단위는 이에 한정되지는 아니하고, 다양한 보간 필터를 이용하여 정수 이하의 픽셀 정보를 생성하는 단위가 결정될 수 있을 것이다.
모션 예측부는 상기 참조 영상 보간부에 의하여 보간된 참조 영상을 기초로 하여 모션 예측을 수행할 수 있다. 모션 벡터를 산출하기 위하여 다양한 방법이 사용될 수 있다. 모션 벡터는 보간된 픽셀을 기초로 하여 정수 픽셀 단위 또는 1/2 또는 1/4 픽셀 단위의 모션 벡터값을 가질 수 있다. 일 실시예에서는, 모션 예측부에서 모션 예측 방법을 다르게 하여 현재 블록의 예측 단위를 예측할 수 있다. 상기 모션 예측 방법은 머지(Merge) 방법, AMVP(Advanced Motion Vector Prediction) 방법, 및 스킵(Skip) 방법을 포함하여 다양한 방법이 사용될 수 있다. 이와 같이, 화면간 예측부(110)에서 선택된 참조 영상의 인덱스, 예측 모션 벡터(MVP), 레지듀얼 신호를 포함하는 정보들은 엔트로피 코딩되어 복호화기로 전송될 수 있다.
화면내 예측부(115)는 화면간 예측과 달리 현재 영상 내의 픽셀 정보인 현재 블록 주변의 참조 픽셀 정보들을 기초로 하여 예측 블록을 생성할 수 있다. 상기 예측 블록의 주변 블록들은 화면간 예측을 수행한 블록인 경우, 즉, 참조 픽셀이 화면간 예측을 수행한 픽셀인 경우에는 화면간 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 화면내 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수도 있다.
또한, 화면내 예측부(115)는 화면내 예측 모드를 부호화하기 위하여 이웃 블록들로부터 획득한 가장 가능성 있는 화면내 예측 모드(MPM : Most Probable mode)를 이용할 수 있다. 본 발명의 다양한 실시예에 따르면, 상기 가장 가능성 있는 화면내 예측 모드들로 구성되는 가장 가능성 있는 화면내 예측 모드 리스트(MPM List)는 다양한 방법으로 구성될 수 있다.
화면내 예측부(115)가 화면내 예측을 수행하는 경우에도 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수 있다. 예를 들어, 예측 모드가 예측 단위(PU)로 정해져서 상기 예측 단위로 예측이 수행될 수도 있고, 예측 모드는 예측 단위로 정해지되 예측의 수행은 변환 단위(TU)로 수행될 수도 있다. 일 실시예에서, 예측 모드가 코딩 블록(CU) 단위로 결정되고, 상기 코딩 블록 단위와 예측 단위가 동일하여 상기 코딩 블록 단위로 예측이 수행될 수도 있다.
화면내 예측의 예측 모드는 65개의 방향성 예측 모드 및 적어도 2 개 이상의 비방향성 모드를 포함할 수 있다. 상기 비방향성 모드는 DC 예측 모드 및 플래너 모드(Planar Mode)를 포함할 수 있다. 상기 67개의 화면간 예측 모드의 개수는 예시적일 뿐, 본 발명이 이에 한정되는 것은 아니며, 다양한 방법으로 예측하기 위하여 더 많은 방향성 또는 비방향성 모드로 화면내 예측을 수행할 수 있다.
일 실시예에서, 화면내 예측은 참조 픽셀에 필터를 적용한 후 예측 블록을 생성할 수 있다. 이 경우, 상기 참조 픽셀에 필터를 적용할지 여부는 현재 블록의 화면내 예측 모드 및/또는 크기에 따라 결정될 수 있다.
예측 단위(PU)는 더 이상 분할되지 않는 코딩 유닛(CU)으로부터 다양한 사이즈 및 형태로 결정될 수 있다. 예를 들어, 화면간 예측의 경우 예측 단위는 2N x 2N, 2N x N, N x 2N 또는 N x N와 같은 크기를 가질 수 있다. 화면내 예측의 경우 예측 단위는 2N x 2N 또는 N x N (N은 정수)와 같은 크기를 가질 수 있으나, 이와 같은 정방향 크기 뿐만 아니라 비정방향 크기 모양으로도 화면내 예측을 수행할 수 있다. 이 경우, N x N 크기의 예측 단위는 특정한 경우에만 적용하도록 설정할 수도 있다. 또한, 상술한 크기의 예측 단위 이외에도, N x mN, mN x N, 2N x mN 또는 mN x 2N (m은 분수 또는 정수임) 와 같은 크기를 갖는 화면내 예측 단위를 더 정의하여 사용할 수도 있다.
화면내 예측부(115)에서 생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(120)에 입력될 수 있다. 또한, 예측을 위하여 사용되는 예측 모드 정보, 보간 필터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(135)에서 부호화되어 복호화기로 전달될 수 있다.
변환부(120)는 변환 단위로 원본 블록과 예측부(110, 115)를 통하여 생성된 예측 단위의 레지듀얼 값 정보를 포함하는 레지듀얼 블록을 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), KLT(Karhunen Loeve Transform)과 같은 변환 방법을 이용하여 변환시킬 수 있다. 레지듀얼 블록을 변환하기 위하여 DCT, DST 또는 KLT 를 적용할지는 레지듀얼 블록을 생성하기 위하여 사용된 예측 단위의 화면내 예측 모드 정보를 기초로 결정할 수 있다.
변환부(120)에서의 변환 블록은 TU일 수 있고, 상기 변환 블록은 정방형(square) 모양의 블록 및/또는 비정방형(non-square) 모양의 블록을 포함할 수 있고, 상기 변환 블록들은 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조 또는 바이너리 트리(binary tree) 구조를 가질 수 있다. 일 실시예에서, 변환 단위의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 또한, 하나의 변환 블록은 서브 변환 블록으로 더 분할될 수 있으며, 상기 서브 변환 블록들은 정방형(square) 모양의 블록 및/또는 비정방형(non-square) 모양의 블록을 포함할 수 있고, 상기 서브 변환 블록들은 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조 또는 바이너리 트리(binary tree) 구조를 가질 수 있다. 상기와 같은 다양한 크기, 모양, 및 구조를 갖는 변환 블록은 잔차 신호의 지역적 특성을 효과적으로 고려하여 부호화하기 위하여 이용될 수 있다.
양자화부(125)는 변환부(120)에서 변환된 레지듀얼 값들을 양자화하여 양자화 계수를 생성할 수 있다. 일 실시예에서, 상기 변환된 레지듀얼 값들은 주파수 영역으로 변환된 값일 수 있다. 상기 양자화 계수는 변환 단위에 따라 또는 영상의 중요도에 따라 변경될 수 있으며, 양자화부(125)에서 산출된 값은 역양자화부(140) 및 재정렬부(130)에 제공될 수 있다.
재정렬부(130)는 양자화부(125)로부터 제공된 양자화 계수를 재정렬할 수 있다. 재정렬부(130)는 상기 양자화 계수를 재정렬함으로써 엔트로피 부호화부(135)에서의 부호화 효율을 향상시킬 수 있다. 재정렬부(130)는 계수 스캐닝(Coefficient Scanning) 방법을 통하여 2차원 블록 형태의 양자화 계수들을 1차원의 벡터 형태로 재정렬할 수 있다. 상기 계수 스캐닝 방법은 변환 단위의 크기 및 화면내 예측 모드에 따라 어떠한 스캔 방법이 사용될지 여부가 결정될 수 있다. 상기 계수 스캐닝 방법은 지그-재그 스캔, 2차원의 블록 형태의 계수를 열 방향으로 스캔하는 수직 스캔, 및 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔을 포함할 수 있다. 일 실시예에서, 재정렬부(130)는 양자화부에서 전송되는 계수들의 확률적인 통계를 기반으로 계수 스캐닝의 순서를 변경함으로써 엔트로피 부호화부(135)에서의 엔트로피 부호화 효율을 높일 수도 있다.
엔트로피 부호화부(135)는 재정렬부(130)에 의하여 재정렬된 양자화 계수들에 대한 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Content-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 이용할 수 있다.
엔트로피 부호화부(135)는 재정렬부(130) 및 예측부(110, 115)로부터 전달받은 코딩 유닛의 양자화 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, 예측 유닛 정보 및 전송 단위 정보, 모션 벡터 정보, 참조 영상 정보, 블록의 보간 정보, 필터링 정보와 같은 다양한 정보를 부호화할 수 있다. 또한, 일 실시예에서 엔트로피 부호화부(135)는 필요한 경우에, 전송하는 파라미터 셋 또는 신택스에 일정한 변경을 가할 수도 있다.
역양자화부(140)는 양자화부(125)에서 양자화된 값들을 역양자화하고, 역변환부(145)는 역양자화부(140)에서 역양자화된 값들을 역변화한다. 역양자화부(140) 및 역변환부(145)에서 생성된 레지듀얼 값은 예측부(110,115)에서 예측된 예측 블록과 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다. 상기 생성된 복원 블록들로 구성된 영상은 모션보상 영상 또는 MC 영상(Motion Compensated Picture)일 수 있다.
상기 모션보상 영상은 필터부(150)에 입력될 수 있다. 필터부(150)는 디블록킹 필터부, 오프셋 보정부(Sample Adaptive Offset, SAO), 및 적응적 루프 필터부(Adaptive Loop Filter, ALF)를 포함할 수 있으며, 요약하자면, 상기 모션보상 영상는 디블록킹 필터부에서 디블록킹 필터가 적용되어 블록킹 잡음(blocking artifact)를 감소 또는 제거 시킨 후, 오프셋 보정부에 입력되어 오프셋을 보정시킬 수 있다. 상기 오프셋 보정부에서 출력된 영상은 상기 적응적 루프 필터부에 입력되어 ALF(Adaptive Loop Filter) 필터를 통과하며, 상기 필터를 통과한 영상은 메모리(155)로 전송될 수 있다.
필터부(150)에 대하여 구체적으로 설명하면, 상기 디블록킹 필터부는 복원된 영상에서 블록 간의 경계에 생성된 블록 내의 왜곡을 제거할 수 있다. 디블록킹을 수행할지 여부를 판단하기 위해서는 블록에 포함된 몇 개의 열 또는 행에 포함된 픽셀을 기초로 현재 블록에 디블록킹 필터를 적용할지 여부를 판단할 수 있다. 블록에 디블록킹 필터를 적용하는 경우, 필요한 디블록킹 필터링 강도에 따라 강한 필터(Strong Filter) 또는 약한 필터(Weak Filter)를 적용할 수 있다. 또한, 디블록킹 필터를 적용함에 있어 수직 필터링 및 수평 필터링 수행시 수평 방향 필터링 및 수직 방향 필터링이 병행 처리되도록 할 수 있다.
오프셋 보정부는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 픽셀 단위로 원본 영상과의 오프셋을 보정할 수 있다. 특정 영상에 대한 오프셋을 보정하기 위하여 영상에 포함된 픽셀을 일정한 수의 영역으로 구분한 후, 오프셋을 수행할 영역을 결정하고, 해당 영역에 오프셋을 적용하는 방법(Band Offset) 또는 각 픽셀의 에지 정보를 고려하여 오프셋을 적용하는 방법(Edge Offset)의 형태로 적용될 수 있다. 그러나, 일 실시예에서 화면간 예측에 사용되는 복원 블록에 대하여는 필터부(150)에서 필터링을 적용하지 아니할 수 있다.
적응적 루프 필터부(Adaptive Loop Filter, ALF)는 필터링한 복원 영상과 원래의 영상을 비교한 값을 기초로, 고효율을 적용하는 경우에만 수행될 수 있다. 영상에 포함된 픽셀을 소정의 그룹으로 나눈 후, 해당 그룹에 적용될 하나의 필터를 결정하여 그룹마다 차별적으로 필터링을 수행할 수 있다. 상기 ALF를 적용할지 여부에 관련된 정보는 휘도 신호는 부호화 단위(Coding Unit, CU) 별로 전송될 수 있고, 각각의 블록에 따라 적용될 ALF 필터의 모양 및 필터 계수는 달라질 수 있다. 또한, 적용 대상 블록의 특성에 관계없이 동일한 형태(고정된 형태)의 ALF 필터가 적용될 수도 있다.
메모리(155)는 필터부(150)을 통하여 산출된 복원 블록 또는 영상을 저장할 수 있다. 메모리(155)에 저장된 복원 블록 또는 영상은 화면간 예측을 수행하는 화면간 예측부(110) 또는 화면내 예측부(115)에 제공될 수 있다. 화면내 예측부(115)에서 사용되는 복원 블록들의 화소값은 디블록킹 필터부, 오프셋 보정부, 및 적응적 루프 필터부가 적용되지 아니한 데이터들 일 수 있다.
도 2는 본 발명의 일 실시예에 따른 영상 복호화 장치를 개략적으로 나타낸 블록도이다. 도 2 를 참조하면, 영상 복호화 장치(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 화면간 예측부(230), 화면내 예측부(235), 필터부(240), 메모리(245)를 포함한다.
영상 부호화 장치로부터 영상 비트스트림이 입력되는 경우, 입력된 비트스트림은 부호화 장치에서 영상 정보가 처리된 절차의 역과정으로 복호화될 수 있다. 예를 들어, 영상 부호화 장치에서 엔트로피 부호화를 수행하기 위하여 CAVLC와 같은 가변 길이 부호화(Variable Length Coding: VLC, 이하 "VLC"라 함)가 사용된 경우에는, 엔트로피 복호화부(210)도 부호화 장치에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 복호화를 수행할 수 있다. 또한, 부호화 장치에서 엔트로피 부호화를 수행하기 위하여 CABAC을 이용한 경우에는 엔트로피 복호화부(210)에서 이에 대응하여 CABAC을 이용한 엔트로피 복호화를 수행할 수 있다.
엔트로피 복호화부(210)에서는 복호화된 정보 중 예측 블록을 생성하기 위한 정보를 화면간 예측부(230) 및 화면내 예측부(235)로 제공하고, 엔트로피 복호화부에서 엔트로피 복호화가 수행된 레지듀얼 값은 재정렬부(215)로 입력될 수 있다.
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림을 영상 부호화기에서 재정렬한 방법을 기초로 재정렬할 수 있다. 재정렬부(215)는 부호화 장치에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 부호화 장치에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통하여 재정렬을 수행할 수 있다.
역양자화부(220)는 부호화 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다. 역변환부(225)는 영상 부호화 장치에서 수행된 양자화 결과에 대하여, 부호화 장치의 변환부가 수행한 DCT, DST, 또는 KLT 에 대해 역DCT, 역DST, 또는 역KLT를 수행할 수 있다. 역변환은 부호화 장치에서 결정된 전송 단위 또는 영상의 분할 단위를 기초로 수행될 수 있다. 인코딩 장치의 변환부에서는 예측 방법, 현재 블록의 크기 및 예측 방향과 같은 정보에 따라 DCT, DST, 또는 KLT를 선택적으로 수행할 수 있고, 복호화 장치의 역변환부(225)는 부호화 장치의 변환부에서 수행된 변환 정보를 기초로 역변환 방법이 결정되어 역변환을 수행할 수 있다.
예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성과 관련된 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 및/또는 영상 정보를 기초로 예측 블록을 생성할 수 있다. 복원 블록은 예측부(230, 235)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용하여 생성될 수 있다. 예측부(230, 235)에서 수행하는 구체적인 예측의 방법은 부호화 장치의 예측부(110, 115)에서 수행되는 예측의 방법과 동일할 수 있다.
예측부(230, 235)는 예측 단위 판별부(미도시), 화면간 예측부(230), 및 화면내 예측부(235)를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 입력되는 예측 단위 정보, 화면내 예측 방법의 예측 모드 정보, 화면간 예측 방법의 모션 예측 관련 정보와 같은 다양한 정보를 입력 받아, 현재 코딩 블록에서의 예측 블록을 구분하고, 예측 블록이 화면간 예측을 수행하는지 아니면 화면내 예측을 수행하는지 여부를 판별할 수 있다.
화면간 예측부(230)는 영상 부호화기에서 제공된 현재 예측 블록의 화면간 예측에 필요한 정보를 이용하여 현재 예측 블록이 포함된 현재 영상의 이전 영상 또는 이후 영상 중 적어도 하나의 영상에 포함된 정보를 기초로 현재 예측 블록에 대한 화면간 예측을 수행할 수 있다.
구체적으로 화면간 예측에서는 현재 블록에 대하여, 참조 영상을 선택하고 현재 블록에 대한 참조 블록을 선택하여 현재 블록에 대한 예측 블록을 생성할 수 있다. 이 때, 참조 영상의 정보를 이용하기 위하여, 현재 영상의 주변 블록들의 정보를 이용할 수 있다. 예를 들어, 스킵(skip) 모드, 머지(merge) 모드, 및 AMVP(Advanced Motion Vector Prediction)와 같은 방법을 이용하여 주변 블록의 정보에 기반하여 현재 블록에 대한 예측 블록을 생성할 수 있다.
AMVP 모드에서는 현재 블록의 시간상 및 공간상 주변 블록을 이용하여 모션 정보 후보자를 선택하여 예측 모션 벡터 리스트를 구성할 수 있다. 또한, 부호화 장치로부터 수신한 현재 블록의 예측 모션 벡터로 선택된 모션 정보 후보자에 대한 인덱스 정보 및 차분 모션 벡터(MVD)를 이용하여 현재 블록의 모션 벡터를 복호화할 수 있다.
또한, Merge 모드에서도 현재 블록의 시간상 및 공간상 주변 블록을 이용하여 머지 후보로서 모션 정보 후보자들을 획득할 수 있다. 이들 중 부호화 장치로부터 수신한 현재 블록의 모션 정보 후보자에 대한 인덱스 정보를 이용하여 현재 블록의 모션 벡터를 획득할 수 있다. 상기 모션 벡터 후보자들은 현재 블록의 공간적 이웃 블록으로부터 공간적 모션 벡터 후보자로서 획득되거나 상기 현재 블록의 참조 영상에 포함되는 대응 블록으로부터 시간적 모션 벡터 후보자로서 획득될 수 있다.
예측 블록은 1/2 픽셀 샘플 단위와 1/4 픽셀 샘플 단위와 같이 정수 이하의 샘플 단위로 생성될 수 있다. 이 경우, 모션 벡터 역시 정수 픽셀 이하의 단위로 표현될 수 있다. 예를 들어, 휘도 픽셀에 대해서는 1/4 픽셀 단위로, 색차 픽셀에 대하여는 1/8 픽셀 단위로 표현될 수 있다.
현재 블록의 화면간 예측에 필요한 모션 벡터 및 참조 영상 인덱스를 포함하는 모션정보는 부호화 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.
화면내 예측부(235)는 현재 영상 내의 픽셀 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 화면내 예측을 수행한 예측 단위인 경우에는 영상 부호화기에서 제공된 예측 단위의 화면내 예측 모드 정보를 기초로 화면내 예측을 수행할 수 있다. 상기 예측 단위의 주변 블록들은 화면간 예측을 수행한 블록인 경우, 즉, 참조 픽셀이 화면간 예측을 수행한 픽셀인 경우에는 화면간 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 화면내 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수도 있다.
또한, 화면내 예측부(235)는 화면내 예측 모드를 부호화하기 위하여 이웃 블록들로부터 획득한 가장 가능성 있는 화면내 예측 모드(MPM: Most Probable Mode)을 이용할 수 있다. 일 실시예에서, 상기 가장 가능성 있는 화면내 예측 모드는 현재 블록의 공간적 이웃 블록의 화면내 예측 모드를 이용할 수 있다.
일 실시예에서, 화면내 예측부(235)에서 예측이 수행되는 처리 단위와 예측 방법 및 구체적인 내용이 정해지는 처리 단위는 서로 다를 수 있다. 예를 들어, 예측 단위로 예측 모드가 정해져 예측 단위로 예측이 수행될 수 있고, 예측 단위로 예측 모드가 정해지고 변환 단위로 화면내 예측이 수행될 수도 있다.
이 경우, 예측 블록(PU)은 더 이상 분할되지 않는 코딩 블록(CU)으로부터 다양한 사이즈 및 형태로 결정될 수 있다. 예를 들어, 화면내 예측의 경우 예측 블록은 2N x 2N 또는 N x N (N은 정수)와 같은 크기를 가질 수 있으나, 이와 같은 정방향 크기 뿐만 아니라 비정방향 크기 모양인 N x mN, mN x N, 2N x mN 또는 mN x 2N (m은 분수 또는 정수임)으로도 화면내 예측을 수행할 수 있다. 이 경우, N x N 크기의 예측 단위는 특정한 경우에만 적용하도록 설정할 수도 있다.
또한, 변환 블록(TU)도 다양한 사이즈 및 형태로 결정될 수 있다. 예를 들어, 변환 블록은 2N x 2N 또는 N x N (N은 정수)와 같은 크기를 가질 수 있으나, 이와 같은 정방향 크기 뿐만 아니라 비정방향 크기 모양인 N x mN, mN x N, 2N x mN 또는 mN x 2N (m은 분수 또는 정수임)으로도 화면내 예측을 수행할 수 있다. 이 경우, N x N 크기의 예측 단위는 특정한 경우에만 적용하도록 설정할 수도 있다. 일 실시예에서, 변환 블록은 정방형(square) 구조, 비정방형(non-square) 구조, 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조, 또는 바이너리 트리(binary tree) 구조로 갖는 블록들 중 하나일 수 있다. 일 실시예에서, 변환 블록의 크기는 소정의 최대 및 최소 크기의 범위 내에서 정해질 수 있다. 또한, 하나의 변환 블록은 서브 변환 블록으로 분할될 수 있으며, 이 경우 상기 서브 변환 블록들도 정방형(square) 구조, 비정방형(non-square) 구조, 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조, 또는 바이너리 트리(binary tree) 구조로 분할될 수 있다.
화면내 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터부, 참조 픽셀 보간부, DC 필터부를 포함할 수 있다. 상기 AIS 필터부는 현재 블록의 참조 픽셀에 필터링을 수행하는 부분으로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 영상 부호화기에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 픽셀에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 아니하는 모드인 경우에는, 상기 AIS 필터부는 현재 블록에 적용되지 아니할 수 있다.
참조 픽셀 보간부는 예측 단위의 예측 모드가 참조 픽셀을 보간한 샘플값을 기초로 화면내 예측을 수행하는 예측 단위인 경우에, 참조 픽셀을 보간하여 정수값 이하의 픽셀 단위의 참조 픽셀을 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 픽셀을 보간하지 아니하고 예측 블록을 생성하는 예측 모드인 경우, 참조 픽셀은 보간되지 아니할 수 있다. DC 필터부는 현재 블록의 예측 모드가 DC 모드인 경우에 필터링을 통하여 예측 블록을 생성할 수 있다.
복원된 블록 및/또는 영상은 필터부(240)로 제공될 수 있다. 필터부(240)는 복원된 블록 및/또는 영상에 디블록킹 필터부, 오프셋 보정부(Sample Adaptive Offset) 및/또는 적응적 루프 필터부를 포함할 수 있다. 상기 디블록킹 필터부는 영상 부호화기로부터 해당 블록 또는 영상에 디블록킹 필터가 적용되었는지 여부를 나타내는 정보 및 디블록킹 필터가 적용된 경우 강한 필터 또는 약한 필터를 적용하였는지를 나타내는 정보를 제공받을 수 있다. 상기 디블록킹 필터부는 영상 부호화기에서 제공된 디블록킹 필터 관련 정보를 제공받고, 영상 복호화기에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.
상기 오프셋 보정부는 부호화시 영상에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 영상에 오프셋 보정을 수행할 수 있다. 상기 적응적 루프 필터부는 부호화기로부터 제공된 적응적 루프 필터의 적용 여부에 관한 정보, 적응적 루프 필터의 계수 정보와 같은 정보들을 기초로 부호화 단위로 적용될 수 있다. 상기 적응적 루프 필터와 관련된 정보들은 특정 파라미터 셋(parameter set)에 포함되어 제공될 수 있다.
메모리(245)는 복원된 영상 또는 블록을 저장하여 이후에 참조 영상 또는 참조 블록으로 사용할 수 있고, 또한 복원된 영상을 출력부로 제공할 수 있다.
본 명세서에서는 설명의 편의를 위하여 생략하였지만, 복호화 장치에 입력되는 비트스트림은 파싱(parsing) 단계를 거쳐 엔트로피 복호화부로 입력될 수 있다. 또한, 엔트로피 복호화부에서 파싱 과정을 수행하도록 할 수 있다.
본 명세서에서 코딩은 경우에 따라 부호화 또는 복호화로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements), 플래그(flag) 등을 모두 포함하는 것으로 이해될 수 있다. '화면' 또는 '영상(picture)'는 일반적으로 특정 시간대의 하나의 영상을 나타내는 단위를 의미하며, '슬라이스(slice)', '프레임(frame)' 등은 실제 비디오 신호의 코딩에 있어서 영상의 일부를 구성하는 단위이며, 필요에 따라서는 영상과와 서로 혼용되어 사용될 수 있다.
'픽셀(pixel)', '픽셀' 또는 'pel'은 하나의 영상을 구성하는 최소의 단위를 나타낸다. 또한, 특정한 픽셀의 값을 나타내는 용어로서, '샘플(sample)'을 사용할 수 있다. 샘플은 휘도(Luma) 및 색차(Chroma) 성분으로 나누어질 수 있으나, 일반적으로는 이를 모두 포함하는 용어로 사용될 수 있다. 상기에서 색차 성분은 정해진 색상들 간의 차이를 나타내는 것으로 일반적으로 Cb 및 Cr로 구성된다.
'유닛(unit)'은 상술한 부호화 유닛, 예측 유닛, 변환 유닛과 같이 영상 처리의 기본 단위 또는 영상의 특정 위치를 지칭하며, 경우에 따라서는 '블록' 또는 '영역(area)'등의 용어와 서로 혼용하여 사용될 수 있다. 또한, 블록은 M개의 열과 N개의 행으로 구성된 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타내는 용어로 사용될 수도 있다.
도 3 및 도 4는 일반적인 방법에 따른 변환 블록의 구조 및 16x16 변환 블록을 구성하기 위한 변환 계수 그룹을 설명하기 위한 것이다.
도 3을 참조하면, 하나의 코딩 블록(CB)은 복수 개의 변환 블록들(TB0, TB1,...,TB12)을 포함할 수 있다. 상기 복수 개의 변환 블록들은 다양한 모양 및/또는 크기를 갖는 변환 블록들을 포함할 수 있다. 상기 변환 블록은 정방형 모양의 블록 및 비정방형 모양의 블록을 포함할 수 있고, 상기 변환 블록은 정방형 쿼드 트리(square quad tree) 구조, 비정방형 쿼드 트리(non-square quad tree) 구조, 또는 바이너리 트리(binary tree) 구조로 갖는 블록들 중 하나일 수 있다.
도 4를 참조하면, 변환 블록(10)은 적어도 하나 이상의 변환 계수 그룹(CG0,CG1,...,CG15)을 포함할 수 있다. 예를 들어, 변환 블록(10)이 16x16 크기의 블록이고, 상기 변환 블록에 포함되는 변환 계수 그룹의 크기는 4x4 일 수 있다. 즉, 16x16 크기의 변환 블록은 16 개의 4x4 크기의 변환 계수 그룹을 포함할 수 있으며, 상기 변환 계수 그룹의 인덱스는 도 4에 나타낸 바와 같은 변환 계수 스캔 순서를 따를 수 있다.
도 5는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 변환 스캔 방법을 설명하기 위한 것이다.
도 5를 참조하면, 일반적으로는 변환 블록(20)의 변환 계수 그룹 스캔 순서는 변환 계수의 스캔 순서와 동일할 수 있다. 예를 들면, 변환 블록(20)이 8x8 크기이고, 변환 계수 그룹의 크기가 4x4 크기의 블록이며, 변환 블록(20)에 대하여 업-라이트 다이아고날(Up-right diagonal) 스캔 방법을 사용하는 경우, 변환 계수 그룹은 변환 계수와 동일한 스캔 방법을 적용한다. 도 5에서 나타낸 바와 같이, 변환 블록(20)의 우측 하단의 변환 계수 그룹인 CG3에 포함된 변환 계수 15 부터 0까지 업-라이트 다이아고날 방법으로 변환 계수를 스캔하고, 이후 우측 상단의 변환 계수 그룹인 CG2에 대하여 동일한 방법으로 변환 계수를 스캔한 후, 좌측 하단의 변환 계수 그룹 CG1, 좌측 상단의 변환 계수 그룹 CG0의 순서로 상기 변환 계수 그룹에 포함된 변환 계수들을 동일한 방법으로 스캔할 수 있다.
도 6a 내지 도 6d는 일반적인 방법에 따른 변환 계수 그룹 및 상기 변환 계수 그룹의 스캔 방법의 다양한 예를 설명하기 위한 것이다. 도 6a 내지 도 6c는 화면내 예측 모드에서의 변환 계수 그룹의 스캔 방법을 나타내며, 도 6d는 화면간 예측 모드에서 변환 계수 그룹의 스캔 방법을 나타낸다.
도 6a 내지 도 6c를 참조하면, 화면내 예측의 경우 우측 하단으로부터 좌측 상단 순서로 스캔하는 업-라이트 다이아고날 스캔(Up-right diagonal scan, 도 6a), 우측으로부터 좌측으로, 하단으로부터 상단의 방향으로 스캔하는 호리젠탈 스캔(Horizontal scan, 도 6b), 및 하단으로부터 상단으로, 우측으로부터 좌측의 방향으로 스캔하는 버티칼 스캔(Vertical scan, 도 6c) 방법들을 이용할 수 있다. 도 6d를 참조하면, 화면간 예측의 경우는 업-라이트 다이아고날 스캔 방법만을 이용할 수 있다.
일 실시예에서, 화면내 예측에서의 변환 계수 그룹의 스캔 방법은 화면내 예측 모드에 따라 결정될 수 있다. 예를 들어, 화면내 예측 모드가 가로 방향으로의 예측인 화면내 예측 모드 인덱스 6 내지 14인 경우는 버티컬 스캔 방법을 이용하여 변환 계수 그룹이 스캔될 수 있고, 화면내 예측 모드가 세로 방향의 예측인 인덱스 22 내지 30인 경우에는 호리젠탈 스캔 방법이 이용되며, 나머지 화면내 예측 모드에 대해서는 업-라이트 다이아고날 스캔 방법이 이용될 수 있다.
최근까지의 비디오 코딩에서는 변환 블록으로 항상 정방향 변환 블록을 고려하고 있다. 그러므로, 변환 계수 그룹 및 상기 변환 계수 그룹 내의 변환 계수의 스캔 방법으로도 정방향 변환 블록에 적합하도록 설계되어왔다. 그러나, 변환 블록을 비정방형 변환 블록을 이용하는 경우에는 기존의 변환 계수 그룹 및 변환 계수의 스캔 방법을 적용하는 경우 코딩 효율이 저하될 수 있다. 따라서, 이하 도 7a 내지 도 12b에서는 본 발명의 일 실시예에 따른 코딩 효율을 개선할 수 있는 변환 계수 그룹을 스캔하는 방법에 대하여 설명하기로 한다.
도 7a 및 도 7b는 본 발명의 일 실시예에 따른 변환 블록에 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.
도 7a를 참조하면, 현재 변환 블록 TB1 (30a)이 비정방형 블록이고, 8x16 의 크기를 갖는 경우에 변환 계수 그룹 및 변환 계수를 스캔하는 방법으로 기존의 방법을 적용하면 3 가지 스캔 방법 중 선택될 수 있다. 예를 들면, 현재 변환 블록(30a)에 기존의 3 가지 스캔 방법을 적용하여 변환 계수 그룹을 스캔하는 도시한 예 중에 좌측으로부터 업-라이트 스캔 방법, 버티컬 스캔 방법, 및 호리젠탈 스캔 방법을 적용하여 변환 계수 그룹을 스캔할 수 있다.
도 7b를 참조하면, 현재 변환 블록 TB2 (30b)가 비정방형 블록이고, 16x8 의 크기를 갖는 경우에 변환 계수 그룹 및 변환 계수를 스캔하는 방법으로 기존의 방법을 적용하면 3 가지 스캔 방법 중 선택될 수 있다. 예를 들면, 현재 변환 블록(30b)에 기존의 3 가지 스캔 방법을 적용하여 변환 계수 그룹을 스캔하는 도시한 예 중에 좌측으로부터 업-라이트 스캔 방법, 버티컬 스캔 방법, 및 호리젠탈 스캔 방법을 적용하여 변환 계수 그룹을 스캔할 수 있다.
도 8은 16x8 변환 블록의 변환 계수에 대하여 일반적인 스캔 방법을 적용한 예를 설명하기 위한 것이다.
도 8을 참조하면, 현재 변환 블록 TB2(30b)에 호리젠탈 스캔 방법을 적용하는 경우 변환 계수 및 변환 계수 그룹은 동일한 스캔 방법인 호리젠탈 방식이 적용될 수 있다. 예를 들면, 복수 개의 변환 계수를 포함하는 복수 개의 변환 계수 그룹은 각 변환 계수 그룹 단위로 스캔될 수 있다. 변환 블록 중 가장 우측 하단에 있는 변환 계수 그룹에 포함된 변환 계수들을 호리젠탈 방식으로 스캔한 후, 상기 가장 우측 하단에 있는 변환 계수 그룹의 좌측에 위치하는 변환 계수 그룹에 포함된 변환 계수들을 호리젠탈 방식으로 스캔할 수 있다. 이후 동일한 방식으로 상기 변환 계수 그룹 단위에서도 호리젠탈 방식으로 스캔될 수 있다.
이러한 변환 과정을 통하여 레지듀얼 신호의 대부분의 에너지는 좌측 상단의 DC 영역으로 모일 수 있다. 그러므로, 엔트로피 코딩의 효율을 위하여는 저주파 영역의 변환 계수 및/또는 변환 계수 그룹들이 작은 값의 스캔 순서를 나타내는 인덱스를 갖는 것이 효율적일 수 있다. 그러나, 비정방형 변환 블록에 대하여 도 7a 내지 도 8에서 나타난 바와 같은 일반적인 변환 계수 그룹의 스캔 순서를 적용하는 경우 저주파 영역의 변환 계수 그룹 이전에 고주파 영역의 변환 계수 그룹이 먼저 코딩될 수 있으므로 코딩 효율이 떨어질 수 있다.
그러므로, 본 발명의 일 실시예에 따른 변환 스캔 계수의 스캔 방법은 변환 블록을 복수 개의 변환 스캔 계수를 포함하는 상위 영역인 변환 영역으로 분할하고, 상기 분할된 변환 영역별로 변환 스캔 계수를 스캔하는 방법을 포함할 수 있다.
도 9 및 도 10은 본 발명의 일 실시예에 따른 변환 계수 그룹을 스캔하는 방법을 나타내는 순서도 및 장치를 나타내는 것이다.
도 9 및 도 10을 참조하면, 변환부는 변환 계수 그룹을 스캔하기 위하여 변환 영역 정보 획득부(40)에서 변환 블록에 포함되는 복수 개의 변환 계수 그룹을 적어도 하나 이상의 구획으로 분할하는 변환 영역을 나타내는 변환 영역 정보를 획득할 수 있다(S10). 상기 변환 블록은 다양한 크기 및/또는 모양을 가질 수 있다. 일 실시예에서, 상기 변환 블록은 비정방형 모양의 변환 블록일 수 있다.
상기 변환 영역 정보는 상기 변환 블록을 적어도 하나 이상의 영역으로 분할할 수 있으며, 각 변환 영역은 복수 개의 변환 계수 그룹을 포함할 수 있다. 상기 변환 계수 그룹은 복수 개의 변환 계수들을 포함하는 것은 물론이다. 또한, 상기 변환 영역 정보는 인코더로부터 수신되는 정보일 수 있다. 예를 들면, 상기 변환 영역 정보는 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 획득될 수 있으며, 본 발명은 이에 한정되지는 아니하고 어떠한 형태로 어떠한 레벨의 신택스에 포함되어 있는지를 한정하지 아니하고 인코더로부터 수신된 정보이면 무방하다
일 실시예에서, 상기 변환 영역 정보는 복호화 장치에서 기결정된 방법으로 획득될 수 있다. 예를 들면, 상기 변환 영역 정보는 변환 블록의 가로 길이 및 세로 길이를 바탕으로 변환 영역의 가로 길이 및 세로 길이를 산출하여 변환 영역의 크기 및 개수를 결정함으로써 획득될 수 있다. 또는, 상기 변환 영역 정보는 변환 블록의 가로 및 세로 길이 중 작은 길이를 변환 계수 그룹의 블록 크기로 나눔으로써 변환 영역의 크기 및 개수를 결정할 수도 있다. 이러한 상기 변환 영역 정보가 나타내는 변환 영역의 가로 및 세로의 길이, 모양, 및 개수는 복호화 장치에서 결정된 방법을 따를 수 있으며, 상술한 예에 한정되지 아니한다.
이후, 변환 계수 그룹 스캔부(50)는 상기 변환 영역 정보에 기초하여 분할된 적어도 하나 이상의 변환 영역 내의 복수 개의 변환 계수 그룹을 스캔할 수 있다. 변환 계수 그룹 스캔부(50)는 분할된 변환 영역들의 변환 계수 그룹들을 스캔하기 위하여, 제 1 변환 영역 스캔부(51) 및 제 2 변환 영역 스캔부(52)를 포함할 수 있다. 상기 변환 영역 스캔부는 제 1 변환 영역 스캔부(51) 및 제 2 변환 영역 스캔부(52)에 한정되지 아니하며, 상기 변환 블록이 분할된 변환 영역의 개수에 대응하여 포함될 수 있다.
먼저, 제 1 변환 영역 스캔부(51)는 상기 변환 영역 정보에 기초하여 분할된 복수 개의 변환 영역 중 제 1 변환 영역에 포함되는 복수 개의 변환 계수 그룹들을 스캔할 수 있다(S20). 이후, 제 2 변환 영역 스캔부(52)가 제 2 변환 영역에 포함되는 복수 개의 변환 계수 그룹들을 스캔할 수 있다. 만일 변환 영역 스캔부가 세 개 이상 포함되는 경우에는, 차례로 변환 영역에 포함되는 변환 계수 그룹들을 스캔한다 할 것이다.
일 실시예에서, 제 1 변환 영역 스캔부(51)는 제 2 변환 영역 스캔부(52)보다 저주파 영역의 변환 계수 그룹들을 포함할 수 있다. 이와 같이, 본 발명의 변환 계수 그룹들의 스캔 방법은 저주파 영역의 변환 계수 그룹들이 고주파 영역의 변환 계수 그룹들보다 먼저 스캔되도록 스캔 오더가 결정됨으로써, 고주파 영역의 변환 계수 그룹이 먼저 코딩되어 전송되고, 저주파 영역의 변환 계수 그룹들이 큰 값의 스캔 오더 인덱스를 갖아 코딩 효율을 저해시키는 단점을 해소할 수 있게 된다.
또한, 일 실시예에서는 변환 영역 정보를 획득하기 이전에 상기 변환 블록이 비정방형 블록인지 여부를 먼저 판단할 수 있다. 고주파 영역에 해당하는 변환 계수 그룹이 저주파 영역에 해당하는 변환 계수 그룹이 비하여 먼저 스캔되어 코딩 효율을 저해시키는 것은, 변환 블록이 비정방형 블록인 경우 빈번하게 발생할 수 있다. 그러므로, 변환 영역 정보를 획득하기 이전에 현재 변환 블록이 비정방형 블록인지 여부를 먼저 판단할 수 있다.
일 실시예에서, 상기 변환 블록이 비정방형 블록인지 판단하기 위하여 다양한 방법을 채택할 수 있다. 예를 들면, 상기 변환 블록의 가로 길이 및 세로 길이를 비교함으로써 상기 변환 블록이 비정방형 블록인지 판단할 수 있다. 또는, 상기 변환 블록의 크기 및 모양에 대한 정보를 부호화 장치로부터 수신하거나 복호화 장치치에서 기획득된 상기 변환 블록의 분할 정보, 방향 정보, α, β및 픽셀 정보 중 어느 하나 이상을 기초로 하여 판단될 수 있다.
또한, 상기 변환 블록의 타입을 나타내는 변환 블록 타입 정보에 기초하여 판단될 수도 있다. 상기 변환 블록 타입 정보는 부호화 장치로부터 수신될 수도 있으나, 복호화 장치에서 상기 변환 블록의 분할 정보, 방향 정보, 픽셀 정보, 및 가로 길이와 세로 길이 정보 중 어느 하나 이상을 기초로 하여 산출될 수도 있다. 이와 같은 방법으로 상기 변환 블록이 비정방형 블록으로 판단되는 경우, 도 9 및 도 10을 참조하여 상술한 방법으로 변환 블록의 변환 영역별로 상기 변환 영역에 포함된 변환 계수 그룹을 스캔할 수 있다.
도 11a 및 도 11b는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 방법을 설명하기 위한 것이다.
도 11a를 참조하면, 본 발명의 비정방형 변환 블록(60a, 60b)은 가로 길이(A) 및 세로 길이(B)를 가질 수 있다. AxB 크기를 갖는 비정방형 변환 블록(60a, 60b)은 복수 개의 변환 계수 그룹을 포함하며, αxβ 크기의 변환 블록 영역으로 분할될 수 있다. 상기 α 및 β는 변환 블록에 포함되는 변환 계수 그룹의 수를 나타낸다. 즉, αxβ 크기의 영역은 가로 방향에 대하여 α 개의 변환 계수 그룹이 있고, 세로 방향에 대하여 β 개의 변환 계수 그룹이 있는 영역을 나타낼 수 있다. 일 실시예에서, 변환 영역 정보는 상기 α 및 β에 대한 정보를 포함할 수 있다. 또한, 변환 영역 정보는 변환 영역의 가로 및 세로 크기를 나타내는 정보를 포함할 수 있다. 예를 들면, 비정방형 변환 블록(60a)이 8x16 의 크기를 갖는 경우, 변환 영역의 구조를 나타내는 αxβ 는 2x2 이고, 변환 블록(60a)을 분할하는 변환 영역의 크기는 8x8 일 수 있다.
이러한 변환 영역 정보는 상위 파라미터나 이전의 복호화 과정에서 산출될 수 있고, 간단하게는, 비정방형 변환 블록의 가로 및 세로 길이 중 작은 길이를 변환 계수 블록의 크기로 나눈 수로부터 산출될 수 있다. 그러나, 본 발명에서 변환 영역 정보를 획득하는 방법은 이에 제한되지 아니한다.
도 11b를 참조하면, 복수 개의 변환 영역으로 분할된 변환 블록(60a, 60b)은, 각 변환 영역마다 상위 파라미터 또는 상위 과정으로부터 결정된 스캔 방법을 적용하여 변환 계수 그룹을 스캔할 수 있다. 예를 들어, 16x8의 크기를 갖는 변환 블록(60b)가 8x8 의 크기를 갖는 변환 영역(αxβ = 2x2)으로 분할되고, 업-라이트 스캔 방법으로 변환 영역 및 변환 계수 그룹이 스캔되는 경우, CG Region 1 내의 변환 계수 그룹이 먼저 업-라이트 스캔 방법으로 스캔되고, 이후 CG Region 2 내의 변환 계수 그룹이 업-라이트 스캔 방법으로 스캔될 수 있다.
도 12a 내지 도 13d는 본 발명의 일 실시예에 따른 비정방형 변환 블록을 위한 변환 계수 그룹을 스캔하는 다양한 방법을 설명하기 위한 것이다.
도 12a 내지 도 12d를 참조하면, 변환 블록(70)이 변환 블록의 작은 변 길이를 갖는 변환 영역으로 분할된 경우의 변환 계수 그룹은 다양한 방법으로 스캔될 수 있다. 도 12a에서 나타난 바와 같이, 변환 블록(70)이 16x32 의 크기를 갖는 경우, 각각의 변환 영역 CG Region 0, CG Region 1 (71, 72)은 16x16 의 크기를 가질 수 있다. 여기서 가로 및 세로 방향으로의 변환 영역의 크기를 나타내는 α 및 β는 α=β=4 일 수 있다.
일 실시예에서, 변환 블록(70)은 변환 영역별로 각각의 변환 영역에 포함된 변환 계수 그룹을 차례로 스캔할 수 있다. 예를 들면, 도 12b에 나타난 바와 같이, 변환 블록(70)이 업-라이트 스캔 방법으로 스캔되는 경우에는 하단의 제 2 변환 영역(CG Region 1)에 포함된 제 32 변환 계수 그룹(CG 31)으로부터 제 17 변환 계수 그룹(CG 16)이 차례로 스캔되고, 이후 제 1 변환 영역(CG Region 0)에 포함된 제 16 변환 계수 그룹(CG 15)으로부터 제 1 변환 계수 그룹(CG 0)이 차례로 스캔될 수 있다. 또한, 변환 블록이 두 개의 변환 영역으로 분할되고, 버티컬 스캔 방법 및 호리젠탈 스캔 방법을 상기 변환 블록에 적용하는 경우는 도 12c 및 도 12d에 나타난 것과 동일하다.
도 13a 내지 도 13d를 참조하면, 변환 블록(80)이 변환 블록(80)의 작은 변 길이를 갖는 변환 영역으로 분할된 경우의 변환 계수 그룹은 다양한 방법으로 스캔될 수 있다. 도 13a에서 나타난 바와 같이, 변환 블록(80)이 32x16 의 크기를 갖는 경우, 각각의 변환 영역 CG Region 0, CG Region 1 (81, 82)은 16x16 의 크기를 가질 수 있다. 여기서 가로 및 세로 방향으로의 변환 영역의 개수를 나타내는 α 및 β는 α=β=4 일 수 있다.
일 실시예에서, 변환 블록(80)은 변환 영역별로 각각의 변환 영역에 포함된 변환 계수 그룹을 차례로 스캔할 수 있다. 예를 들면, 도 13b에 나타난 바와 같이, 변환 블록(80)이 업-라이트 스캔 방법으로 스캔되는 경우에는 우측의 제 2 변환 영역(82)에 포함된 제 32 변환 계수 그룹(CG 31)으로부터 제 17 변환 계수 그룹(CG 16)이 업라이트 방식에 따라 차례로 스캔되고, 이후 제 1 변환 영역(CG Region 0)에 포함된 제 16 변환 계수 그룹(CG 15)으로부터 제 1 변환 계수 그룹(CG 0)이 차례로 스캔될 수 있다. 또한, 도 13c에 나타난 바와 같이, 변환 블록(80)이 버티컬 스캔 방법으로 스캔되는 경우에는 우측의 제 2 변환 영역(82)에 포함된 제 32 변환 계수 그룹(CG 31)으로부터 제 17 변환 계수 그룹(CG 16)이 버티컬 방식에 따라 차례로 스캔되고, 이후 제 1 변환 영역(CG Region 0)에 포함된 제 16 변환 계수 그룹(CG 15)으로부터 제 1 변환 계수 그룹(CG 0)이 차례로 스캔될 수 있다. 변환 블록이 두 개의 변환 영역으로 분할되고, 호리젠탈 스캔 방법을 상기 변환 블록에 적용하는 경우는 도 13d에 나타난 것과 동일하다.
이와 같이 변환 블록을 복수 개의 변환 계수 그룹을 포함하는 적어도 하나 이상의 변환 영역으로 분할하고 상기 변환 영역별로 스캔하는 방법에 따르면, 저주파 영역의 변환 계수 그룹을 고주파 영역의 변환 계수 그룹보다 먼저 스캔하여 전송하게 되므로 코딩 효율을 높일 수 있다.
이상에서 설명한 본 발명이 전술한 실시예 및 첨부된 도면에 한정되지 않으며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러가지 치환, 변형 및 변경이 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

Claims (10)

  1. 변환 블록에 포함되며, 가로 방향 또는 세로 방향으로 적어도 2 개 이상으로 상기 변환 블록이 분할되는 변환 영역들을 나타내는 변환 영역 정보를 포함하는 비트스트림을 수신하는 단계;
    상기 변환 영역 정보를 이용하여 상기 변환 블록을 상기 적어도 2개 이상의 변환 영역들로 분할하는 단계;
    상기 변환 영역 정보로부터 상기 분할된 변환 영역들 각각의 스캔 방법을 획득하는 단계; 및
    상기 스캔 방법에 따라 상기 분할된 제 1 변환 영역 및 제 2 변환 영역에 포함된 복수의 변환 계수 그룹들을 스캔하는 단계를 포함하며,
    상기 제 1 변환 영역의 제 1 복수의 변환 계수 그룹들을 스캔하기 위한 제 1 스캔 방법과 상기 제 2 변환 영역의 제 2 복수의 변환 계수 그룹들을 스캔하기 위한 제 2 스캔 방법은 서로 다르고,
    상기 변환 계수 그룹은 복수의 변환 계수를 포함하는 비디오 신호의 복호화 방법.
  2. 변환 블록에 포함되며, 가로 방향 또는 세로 방향으로 적어도 2 개 이상으로 상기 변환 블록이 분할되는 변환 영역들을 나타내는 변환 영역 정보를 포함하는 비트스트림을 수신하는 단계;
    상기 변환 블록이 비정방형 블록인 경우, 상기 변환 영역 정보를 이용하여 상기 변환 블록을 상기 적어도 2개 이상의 변환 영역들로 분할하는 단계;
    상기 변환 영역 정보로부터 상기 분할된 변환 영역들 각각의 스캔 방법을 획득하는 단계; 및
    상기 스캔 방법에 따라 상기 분할된 제 1 변환 영역 및 제 2 변환 영역에 포함된 복수의 변환 계수 그룹들을 스캔하는 단계를 포함하며,
    상기 변환 계수 그룹은 복수의 변환 계수를 포함하고,
    상기 적어도 2개 이상의 변환 영역들 중 저주파 영역의 변환 계수 그룹들을 포함하는 제 1 변환 영역이 우선적으로 스캔되는 비디오 신호의 복호화 방법.
  3. ◈청구항 3은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 변환 영역 정보는 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 결정되며, 인코더로부터 수신되는 것을 특징으로 하는 비디오 신호의 복호화 방법.
  4. ◈청구항 4은(는) 설정등록료 납부시 포기되었습니다.◈
    제 1 항에 있어서,
    상기 변환 블록의 타입을 결정하는 단계를 더 포함하는 것을 특징으로 하는 비디오 신호의 복호화 방법.
  5. ◈청구항 5은(는) 설정등록료 납부시 포기되었습니다.◈
    제 4 항에 있어서,
    상기 변환 블록의 타입을 결정하는 단계는 상기 변환 블록의 가로 길이 및 세로 길이를 기초로 하여 수행되는 것을 특징으로 하는 비디오 신호의 복호화 방법.
  6. 변환 블록에 포함되며, 가로 방향 또는 세로 방향으로 적어도 2 개 이상으로 상기 변환 블록이 분할되는 변환 영역들을 나타내는 변환 영역 정보를 포함하는 비트스트림을 수신하고, 상기 변환 영역 정보를 이용하여 상기 변환 블록을 상기 적어도 2개 이상의 변환 영역들로 분할하는 변환 영역 분할부; 및
    상기 변환 영역 정보로부터 상기 분할된 변환 영역들 각각의 스캔 방법을 획득하고, 상기 스캔 방법에 따라 상기 분할된 제 1 변환 영역 및 제 2 변환 영역에 포함된 복수의 변환 계수 그룹들을 스캔하는 변환 계수 스캔부를 포함하며,
    상기 제 1 변환 영역의 제 1 복수의 변환 계수 그룹들을 스캔하기 위한 제 1 스캔 방법과 상기 제 2 변환 영역의 제 2 복수의 변환 계수 그룹들을 스캔하기 위한 제 2 스캔 방법은 서로 다르고,
    상기 변환 계수 그룹은 복수의 변환 계수를 포함하는 비디오 신호의 복호화 장치.
  7. 변환 블록에 포함되며, 가로 방향 또는 세로 방향으로 적어도 2 개 이상으로 상기 변환 블록이 분할되는 변환 영역들을 나타내는 변환 영역 정보를 포함하는 비트스트림을 수신하고, 상기 변환 블록이 비정방형 블록인 경우, 상기 변환 영역 정보를 이용하여 상기 변환 블록을 상기 적어도 2개 이상의 변환 영역들로 분할하는 변환 영역 분할부; 및
    상기 변환 영역 정보로부터 상기 분할된 변환 영역들 각각의 스캔 방법을 획득하고, 상기 스캔 방법에 따라 상기 분할된 제 1 변환 영역 및 제 2 변환 영역에 포함된 복수의 변환 계수 그룹들을 스캔하는 변환 계수 스캔부를 포함하며,
    상기 변환 계수 그룹은 복수의 변환 계수를 포함하고,
    상기 적어도 2개 이상의 변환 영역들 중 저주파 영역의 변환 계수 그룹들을 포함하는 제 1 변환 영역이 우선적으로 스캔되는 비디오 신호의 복호화 장치.
  8. ◈청구항 8은(는) 설정등록료 납부시 포기되었습니다.◈
    제 6 항에 있어서,
    상기 변환 영역 정보는 시퀀스 파라미터 셋(SPS) 및 슬라이스 헤더 중 적어도 하나 이상으로부터 결정되며, 인코더로부터 수신되는 것을 특징으로 하는 비디오 신호의 복호화 장치.
  9. ◈청구항 9은(는) 설정등록료 납부시 포기되었습니다.◈
    제 6 항에 있어서,
    상기 비트스트림은 상기 변환 블록의 타입에 대한 정보를 더 포함하는 것을 특징으로 하는 비디오 신호의 복호화 장치.
  10. ◈청구항 10은(는) 설정등록료 납부시 포기되었습니다.◈
    제 9 항에 있어서,
    상기 변환 블록의 타입에 대한 정보는 상기 변환 블록의 가로 길이 및 세로 길이를 기초로 하며,
    상기 변환 영역 분할부는 상기 변환 블록의 타입에 대한 정보를 기초로 하여 상기 변환 블록의 타입을 결정하는 것을 특징으로 하는 비디오 신호의 복호화 장치.
KR1020220035103A 2016-06-17 2022-03-22 비디오 신호의 복호화 방법 및 이의 장치 KR102523384B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230049183A KR20230054805A (ko) 2016-06-17 2023-04-14 비디오 신호의 복호화 방법 및 이의 장치

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20160075787 2016-06-17
KR1020160075787 2016-06-17
KR1020170060576A KR102378803B1 (ko) 2016-06-17 2017-05-16 비디오 신호의 복호화 방법 및 이의 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170060576A Division KR102378803B1 (ko) 2016-05-28 2017-05-16 비디오 신호의 복호화 방법 및 이의 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020230049183A Division KR20230054805A (ko) 2016-06-17 2023-04-14 비디오 신호의 복호화 방법 및 이의 장치

Publications (2)

Publication Number Publication Date
KR20220040451A KR20220040451A (ko) 2022-03-30
KR102523384B1 true KR102523384B1 (ko) 2023-04-20

Family

ID=80948400

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220035103A KR102523384B1 (ko) 2016-06-17 2022-03-22 비디오 신호의 복호화 방법 및 이의 장치

Country Status (1)

Country Link
KR (1) KR102523384B1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2868133T3 (es) * 2010-09-27 2021-10-21 Lg Electronics Inc Método para partición de bloque y dispositivo de decodificación
US9414056B2 (en) * 2011-01-13 2016-08-09 Samsung Electronics Co., Ltd. Video-encoding method and apparatus for same and video-decoding method and apparatus for same using a selective scan mode
KR20120100836A (ko) * 2011-03-03 2012-09-12 한국전자통신연구원 변환 계수 스캔 방법 및 그 장치
KR20130049524A (ko) * 2011-11-04 2013-05-14 오수미 인트라 예측 블록 생성 방법

Also Published As

Publication number Publication date
KR20220040451A (ko) 2022-03-30

Similar Documents

Publication Publication Date Title
KR101552635B1 (ko) 예측 단위의 파티션 모드에 기초한 계수 스캔 방법 및 장치
KR101794199B1 (ko) 참조 픽쳐 리스트 관리 방법 및 이러한 방법을 사용하는 장치
JP7391958B2 (ja) ビデオ信号符号化/復号方法及び前記方法に用いられる機器
KR20220165694A (ko) 타일 구조의 구성 방법 및 이의 장치
KR20170108367A (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
KR20230054805A (ko) 비디오 신호의 복호화 방법 및 이의 장치
US11736712B2 (en) Method and apparatus for encoding or decoding video signal
KR20180086094A (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR101468078B1 (ko) 화면 내 예측 방법 및 장치
KR20180032775A (ko) 적응적 블록 분할에 기반한 비디오 신호 처리 방법 및 장치
KR102345458B1 (ko) 예측 모션 벡터 리스트를 구성하는 방법 및 이의 장치
KR101455183B1 (ko) 시간적 후보 움직임 벡터 유도 방법 및 이러한 방법을 사용하는 장치
KR20180072539A (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR20230074086A (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR102447951B1 (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR102523384B1 (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR102534604B1 (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR102410326B1 (ko) 영상 부호화/복호화 방법 및 장치
KR20220134476A (ko) 영상 신호 부호화/복호화 방법 및 이를 기초로 생성된 비트스트림을 저장하는 기록 매체
KR20210082877A (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
KR20210082876A (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
KR20210111602A (ko) 비디오 신호 처리 방법 및 장치
KR20210103763A (ko) 비디오 신호 처리 방법 및 장치
KR20210103731A (ko) 비디오 신호 처리 방법 및 장치
KR20210120243A (ko) 비디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
AMND Amendment
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)