KR20230148277A - 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치 - Google Patents

블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치 Download PDF

Info

Publication number
KR20230148277A
KR20230148277A KR1020237035181A KR20237035181A KR20230148277A KR 20230148277 A KR20230148277 A KR 20230148277A KR 1020237035181 A KR1020237035181 A KR 1020237035181A KR 20237035181 A KR20237035181 A KR 20237035181A KR 20230148277 A KR20230148277 A KR 20230148277A
Authority
KR
South Korea
Prior art keywords
block
coding unit
coding
current
divided
Prior art date
Application number
KR1020237035181A
Other languages
English (en)
Other versions
KR102660093B1 (ko
Inventor
진보라
박민우
김찬열
민정혜
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020247013016A priority Critical patent/KR20240056656A/ko
Publication of KR20230148277A publication Critical patent/KR20230148277A/ko
Application granted granted Critical
Publication of KR102660093B1 publication Critical patent/KR102660093B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치가 개시된다. 개시된 일 실시예에 따른 영상 복호화 방법 및 장치는 부호화된 영상의 비트스트림을 수신하고, 비트스트림으로부터 획득된 분할 정보를 이용하여 픽처 내의 하나 이상의 블록을 결정하고, 하나 이상의 블록 중 이전 블록이 복호화되었는지 여부를 나타내는 블록 맵을 결정하고, 블록 맵에 기초하여 하나 이상의 블록 중 소정 스캔 순서에 따라 복호화를 수행할 현재 블록이 참조 가능한 주변 영역을 결정하고, 참조 가능한 주변 영역에 기초하여 현재 블록을 복호화한다.

Description

블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치 {METHOD AND APPARATUS FOR ENCODING OR DECODING IMAGE BY USING BLOCK MAP}
본 명세서는 영상 부호화, 영상 복호화 방법 및 장치에 관한 것으로 보다 상세하게는 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치에 관한 것이다.
영상 데이터는 소정의 데이터 압축 표준, 예를 들면 MPEG(Moving Picture Expert Group) 표준에 따른 코덱에 의하여 부호화된 후 비트스트림의 형태로 기록매체에 저장되거나 통신 채널을 통해 전송된다.
고해상도 또는 고화질 영상 컨텐트를 재생, 저장할 수 있는 하드웨어의 개발 및 보급에 따라, 고해상도 또는 고화질 영상 컨텐트를 효과적으로 부호화 또는 복호화 하는 코덱(codec)의 필요성이 증대하고 있다. 부호화된 영상 컨텐트는 복호화됨으로써 재생될 수 있다. 최근에는 이러한 고해상도 또는 고화질 영상 컨텐트를 효과적으로 압축하기 위한 방법들이 실시되고 있다. 예를 들면, 부호화 하려는 영상을 임의적 방법으로 처리하는 과정을 통한 효율적 영상 압축 방법이 실시되고 있다.
영상을 압축하기 위하여 다양한 데이터 단위가 이용될 수 있으며 이러한 데이터 단위들 간에 포함관계가 존재할 수 있다. 이러한 영상 압축에 이용되는 데이터 단위의 크기를 결정하기 위해 다양한 방법에 의해 데이터 단위가 분할될 수 있으며 영상의 특성에 따라 최적화된 데이터 단위가 결정됨으로써 영상의 부호화 또는 복호화가 수행될 수 있다.
해결하고자 하는 기술적 과제는 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치를 제공하는데 있다.
상기 기술적 과제를 해결하기 위한 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법은 부호화된 영상의 비트스트림을 수신하는 단계; 상기 비트스트림으로부터 획득된 분할 정보를 이용하여 픽처 내의 하나 이상의 블록을 결정하는 단계; 상기 하나 이상의 블록 중 복호화된 블록을 나타내는 블록 맵을 결정하는 단계; 상기 블록 맵에 기초하여, 상기 하나 이상의 블록 중 소정 스캔 순서에 따라 복호화를 수행할 현재 블록이 참조 가능한 주변 영역을 결정하는 단계; 및 상기 참조 가능한 주변 영역에 기초하여, 상기 현재 블록을 복호화하는 단계를 포함한다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 블록 맵은 상기 하나 이상의 블록에 대응하는 영역을 포함하고, 상기 블록 맵은 상기 하나 이상의 블록 중 복호화된 블록에 대응하는 영역이 이용가능한(available) 영역으로 설정되고, 상기 하나 이상의 블록 중 복호화되지 않은 블록에 대응하는 영역이 이용가능하지 않은(not-available) 영역으로 설정될 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 블록 맵을 결정하는 단계는, 상기 하나 이상의 블록 중 각각의 블록이 복호화될 때마다 상기 각각의 블록이 복호화되었음을 나타내는 값을 상기 블록 맵에 업데이트하는 단계를 포함할 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 하나 이상의 블록은, 하나 이상의 부호화 단위로 구성되거나 하나 이상의 변환 단위로 구성될 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 블록 맵은, 최대 부호화 단위에 대해 생성될 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 하나 이상의 블록은, 정사각형 형태 또는 비-정사각형 형태일 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 참조 가능한 주변 영역은, 상기 현재 블록에 시간적으로 이웃하는 영역 및 상기 현재 블록에 공간적으로 이웃하는 영역 중 적어도 하나를 포함할 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 참조 가능한 주변 영역을 결정하는 단계는, 상기 현재 블록의 움직임 정보를 유도하기 위해 상기 현재 블록의 공간적 주변 영역 또는 시간적 주변 영역 중 적어도 하나를 포함하는 복수의 머지 후보자(merge candidates)를 구성하는 단계; 및 상기 복수의 머지 후보자 중에서 동일한 부호화 단위에 포함되는 둘 이상의 머지 후보자가 존재하는 경우, 상기 둘 이상의 머지 후보자 중 적어도 하나를 다른 부호화 단위에 포함되는 머지 후보자로 대체하는 단계를 포함하고, 상기 현재 블록을 복호화하는 단계는, 상기 복수의 머지 후보자에 기초하여 상기 현재 블록의 움직임 정보를 유도하는 단계; 및 상기 유도된 움직임 정보를 이용하여 상기 현재 블록의 예측을 수행하는 단계를 포함할 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 참조 가능한 주변 영역을 결정하는 단계는, 상기 현재 블록의 움직임 정보를 유도하기 위해 상기 현재 블록의 공간적 주변 영역 또는 시간적 주변 영역 중 적어도 하나를 포함하는 복수의 머지 후보자를 구성하는 단계; 및 상기 복수의 머지 후보자 중에서 동일한 움직임 정보를 갖는 둘 이상의 머지 후보자가 존재하는 경우, 상기 둘 이상의 머지 후보자 중 적어도 하나를 다른 움직임 정보를 갖는 머지 후보자로 대체하는 단계를 포함하고, 상기 현재 블록을 복호화하는 단계는, 상기 복수의 머지 후보자에 기초하여 상기 현재 블록의 움직임 정보를 유도하는 단계; 및 상기 유도된 움직임 정보를 이용하여 상기 현재 블록의 예측을 수행하는 단계를 포함할 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 복호화 방법에서, 상기 참조 가능한 주변 영역을 결정하는 단계는,
상기 현재 블록의 움직임 정보를 유도하기 위해 상기 현재 블록의 공간적 주변 영역 또는 시간적 주변 영역 중 적어도 하나를 포함하는 복수의 머지 후보자를 구성하는 단계; 및
상기 복수의 머지 후보자 중에서 상기 블록 맵의 상기 이용가능하지 않은 영역에 대응하는 제 1 주변 영역이 존재하는 경우, 상기 제 1 주변 영역을 상기 블록 맵의 상기 이용가능한 영역에 대응하는 제 2 주변 영역으로 대체하는 단계를 포함하고, 상기 현재 블록을 복호화하는 단계는, 상기 복수의 머지 후보자에 기초하여 상기 현재 블록의 움직임 정보를 유도하는 단계; 및 상기 유도된 움직임 정보를 이용하여 상기 현재 블록의 예측을 수행하는 단계를 포함할 수 있다.
일 실시예에 따른 블록 맵을 이용한 영상 부호화 방법은, 픽처 내의 하나 이상의 블록을 결정하는 단계; 상기 하나 이상의 블록 중 복호화된 블록을 나타내는 블록 맵을 결정하는 단계; 상기 블록 맵에 기초하여, 상기 하나 이상의 블록 중 소정 스캔 순서에 따라 부호화를 수행할 현재 블록이 참조 가능한 주변 영역을 결정하는 단계; 및 상기 참조 가능한 주변 영역에 기초하여, 상기 현재 블록을 부호화하는 단계를 포함한다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 부호화 방법에서, 상기 블록 맵은 상기 하나 이상의 블록에 대응하는 영역을 포함하고, 상기 블록 맵은 상기 하나 이상의 블록 중 복호화된 블록에 대응하는 영역이 이용가능한(available) 영역으로 설정되고, 상기 하나 이상의 블록 중 복호화되지 않은 블록에 대응하는 영역이 이용가능하지 않은(not-available) 영역으로 설정될 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 부호화 방법에서, 상기 블록 맵을 결정하는 단계는, 상기 하나 이상의 블록 중 각각의 블록이 복호화될 때마다 상기 각각의 블록이 복호화되었음을 나타내는 값을 상기 블록 맵에 업데이트하는 단계를 포함할 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 부호화 방법에서, 상기 하나 이상의 블록은, 정사각형 형태 또는 비-정사각형 형태일 수 있다.
또한, 일 실시예에 따른 블록 맵을 이용한 영상 부호화 방법에서, 상기 참조 가능한 주변 영역은, 상기 현재 블록에 시간적으로 이웃하는 영역 및 상기 현재 블록에 공간적으로 이웃하는 영역 중 적어도 하나를 포함할 수 있다.
일 실시예에 따른 블록 맵을 이용한 영상 복호화 장치는, 부호화된 영상의 비트스트림을 수신하는 수신부; 및 상기 비트스트림으로부터 획득된 분할 정보를 이용하여 픽처 내의 하나 이상의 블록을 결정하고, 상기 하나 이상의 블록 중 복호화된 블록을 나타내는 블록 맵을 결정하고, 상기 블록 맵에 기초하여 상기 하나 이상의 블록 중 소정 스캔 순서에 따라 복호화를 수행할 현재 블록이 참조 가능한 주변 영역을 결정하고, 상기 참조 가능한 주변 영역에 기초하여 상기 현재 블록을 복호화하는 복호화부를 포함한다.
도 1는 일 실시예에 따른 영상 부호화 장치(100)의 개략적인 블록도를 도시한다.
도 2는 일 실시예에 따른 영상 복호화 장치(200)의 개략적인 블록도를 도시한다.
도 3은 일 실시예에 따라 참조 가능한 영역을 판단하는 방법을 나타낸 도면이다.
도 4는 일 실시예에 따른 블록 맵을 나타낸 도면이다.
도 5는 일 실시예에 따라 현재 블록의 움직임 정보를 유도하기 위해 복수의 머지 후보자를 구성하는 방법을 나타낸 도면이다.
도 6은 다양한 실시예에 따라 동일한 움직임 정보를 갖는 머지 후보자를 변경하는 방법을 나타낸 도면이다.
도 7은 다양한 실시예에 따라 참조 가능하지 않은 영역의 머지 후보자를 변경하는 방법을 나타낸 도면이다.
도 8은 일 실시예에 따른 영상 부호화 방법을 설명하기 위한 흐름도이다.
도 9는 일 실시예에 따른 영상 복호화 방법을 설명하기 위한 흐름도이다.
도 10은 일 실시예에 따라 현재 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.
도 11은 일 실시예에 따라 비-정사각형의 형태인 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.
도 12는 일 실시예에 따라 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위가 분할되는 과정을 도시한다.
도 13은 일 실시예에 따라 홀수개의 부호화 단위들 중 소정의 부호화 단위가 결정되는 방법을 도시한다.
도 14는 일 실시예에 따라 현재 부호화 단위가 분할되어 복수개의 부호화 단위들이 결정되는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.
도 15는 일 실시예에 따라 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것으로 결정되는 과정을 도시한다.
도 16은 일 실시예에 따라 제1 부호화 단위가 분할되어 적어도 하나의 부호화 단위가 결정되는 과정을 도시한다.
도 17은 일 실시예에 따라 제1 부호화 단위가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우, 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.
도 18은 일 실시예에 따라 분할 형태 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 정사각형 형태의 부호화 단위가 분할되는 과정을 도시한다
도 19는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.
도 20은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.
도 21은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.
도 22는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.
도 23은 일 실시예에 따라 픽쳐에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 기술분야에서 통상의 지식을 가진 자에게 본 명세서의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 다양한 실시예에 대해 구체적으로 설명하기로 한다.
본 명세서에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.
이하, "영상"은 비디오의 정지영상와 같은 정적 이미지이거나 동영상, 즉 비디오 그 자체와 같은 동적 이미지를 나타낼 수 있다.
이하 "샘플"은, 영상의 샘플링 위치에 할당된 데이터로서 프로세싱 대상이 되는 데이터를 의미한다. 예를 들어, 공간영역의 영상에서 픽셀값, 변환 영역 상의 변환 계수들이 샘플들일 수 있다. 이러한 적어도 하나의 샘플들을 포함하는 단위를 블록이라고 정의할 수 있다.
아래에서는 첨부한 도면을 참고하여 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.
이하 도 1 내지 도 23을 참조하여 일 실시예에 따른 영상 부호화 장치 및 영상 복호화 장치, 영상 부호화 방법 및 영상 복호화 방법이 상술된다. 도 1 내지 도 9를 참조하여 일 실시예에 따라 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치가 후술되고, 도 10 내지 도 23을 참조하여 일 실시예에 따른 영상의 데이터 단위를 결정하는 방법이 후술된다.
이하 도 1 내지 도 9를 참조하여 본 발명의 일 실시예에 따라 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치가 상술된다.
도 1은 일 실시예에 따른 영상 부호화 장치(100)의 개략적인 블록도를 도시한다. 일 실시예에 따른 영상 부호화 장치(100)는 부호화부(110) 및 전송부(120)를 포함한다.
일 실시예에 따라 부호화부(110)는 부호화 단위의 최대 크기에 따라, 현재 픽처의 영상 데이터를 최대 부호화 단위로 분할할 수 있다. 각각의 최대 부호화 단위는 블록 형태 및 분할 형태별로 분할되는 부호화 단위들을 포함할 수 있다. 일 실시예에 따른 최대 부호화 단위는 최대 부호화 단위에 포함된 공간 영역(spatial domain)의 영상 데이터가 블록 형태 및 분할 형태에 따라 계층적으로 분류될 수 있다. 부호화 단위의 블록 형태는 정사각형 또는 직사각형일 수 있으며, 임의의 기하학적 형태일 수 있으므로, 일정한 크기의 데이터 단위로 제한되는 것은 아니다.
부호화되는 픽처의 크기가 커짐에 따라, 더 큰 단위로 영상을 부호화하면 더 높은 영상 압축률로 영상을 부호화할 수 있다. 그러나, 부호화 단위를 크게 하고, 그 크기를 고정시켜버리면, 계속해서 변하는 영상의 특성을 반영하여 효율적으로 영상을 부호화할 수 없다.
예를 들어, 바다 또는 하늘에 대한 평탄한 영역을 부호화할 때에는 부호화 단위를 크게 할수록 압축률이 향상될 수 있으나, 사람들 또는 빌딩에 대한 복잡한 영역을 부호화할 때에는 부호화 단위를 작게 할수록 압축률이 향상된다.
이를 위해 일 실시예에 따른 부호화부(110)는 픽처 또는 슬라이스마다 상이한 크기의 최대 부호화 단위를 설정하고, 최대 부호화 단위로부터 분할되는 하나 이상의 부호화 단위의 블록 형태 및 분할 형태를 설정한다. 블록 형태 및 분할 형태에 따라 최대 부호화 단위에 포함된 부호화 단위의 크기를 가변적으로 설정할 수 있게 된다.
하나 이상의 부호화 단위의 블록 형태 및 분할 형태는 R-D 코스트(Rate-Distortion Cost) 계산에 기초해 결정될 수 있다. 블록 형태 및 분할 형태는 픽처 또는 슬라이스마다 상이하게 결정되거나, 각각의 최대 부호화 단위마다 상이하게 결정될 수도 있다. 결정된 블록 형태 및 분할 형태는 부호화 단위별 영상 데이터의 부호화를 위해 이용된다.
일 실시예에 따라, 최대 부호화 단위로부터 분할되는 부호화 단위는 블록 형태 및 분할 형태로 특징지어질 수 있다. 블록 형태 및 분할 형태로 부호화 단위를 결정하는 구체적인 방식에 대해서는 도 10 내지 도 23을 통해 보다 상세히 후술하기로 한다.
일 실시예에 따라, 최대 부호화 단위에 포함된 부호화 단위들은 상이한 크기의 처리 단위에 기초해 예측 또는 변환(예를 들어, 픽셀 도메인의 값들을 주파수 도메인의 값들로 변환)될 수 있다. 다시 말해, 영상 부호화 장치(100)는 영상 부호화를 위한 복수의 처리 단계들을 다양한 크기 및 다양한 형태의 처리 단위에 기초해 수행할 수 있다. 영상 데이터의 부호화를 위해서는 예측, 변환, 엔트로피 부호화 등의 처리 단계를 거치는데, 모든 단계에 걸쳐서 동일한 크기의 처리 단위가 이용될 수도 있으며, 단계별로 상이한 크기의 처리 단위를 이용할 수 있다.
일 실시예에 따라, 부호화 단위의 예측 모드는 인트라 모드, 인터 모드 및 스킵 모드 중 적어도 하나일 수 있으며, 특정 예측 모드는 특정 크기 또는 형태의 부호화 단위에 대해서만 수행될 수 있다. 일 실시예에 따라, 각각의 부호화 단위에 대해 예측을 수행하여 부호화 오차가 가장 작은 예측 모드가 선택될 수 있다.
인트라 예측의 경우에, 부호화부(110)는 현재 블록이 속하는 현재 픽처 내의 주변 블록 화소를 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 이때, 부호화부(110)는 (i) 현재 블록의 주변 참조 샘플들의 평균 혹은 인터폴레이션을 기반으로 하는 예측 샘플을 유도할 수도 있고, (ii) 현재 블록의 주변 블록들 중 예측 대상 픽셀에 대하여 특정 방향에 존재하는 참조 샘플을 기반으로 예측 샘플을 유도할 수도 있다. 부호화부(110)는 주변 블록에 적용된 예측 모드를 이용하여, 현재 블록에 적용되는 예측 모드를 결정할 수도 있다.
일 실시예에 따른 부호화부(110)는, 현재 블록에 인접하는 주변(neighboring) 블록들 중에서, 현재 블록보다 이전에 복원된 주변 블록을 검색한다. 부호화부(110)는 현재 블록에 대한 인트라 예측을 위해 현재 블록보다 이전에 복원된 주변 블록들을 참조할 수 있다.
인터 예측의 경우에, 부호화부(110)는 참조 픽처 상에서 움직임 벡터에 의해 특정되는 샘플들을 기반으로 현재 블록에 대한 예측 샘플을 유도할 수 있다. 부호화부(110)는 스킵(skip) 모드, 머지(merge) 모드, 및 MVP 모드 중 어느 하나를 적용하여 현재 블록에 대한 예측 샘플을 유도할 수 있다. 스킵 모드와 머지 모드의 경우에, 부호화부(110)는 주변 블록의 움직임 정보를 현재 블록의 움직임 정보로 이용할 수 있다. 스킵 모드의 경우, 머지 모드와 달리 예측 샘플과 복원 샘플 사이의 잔차(레지듀얼)가 전송되지 않는다. MVP 모드의 경우, 주변 블록의 움직임 벡터를 움직임 벡터 예측자(motion vector predictor: MVP)로 이용하여 현재 블록의 움직임 벡터와의 차분 정보를 부호화할 수 있다.
인터 예측의 경우에, 주변 블록은 현재 픽처 내에 존재하는 공간적 주변 블록과 참조 픽처(collocated picture)에 존재하는 시간적 주변 블록을 포함한다. 움직임 정보는 움직임 벡터와 참조 픽처를 포함한다. 스킵 모드와 머지 모드에서 시간적 주변 블록의 움직임 정보가 이용되는 경우에, 참조 픽처 리스트 상의 최상위 픽처가 참조 픽처로서 이용될 수도 있다.
일 실시예에 따른 부호화부(110)는, 전술한 바와 같은 인터 예측을 수행하기 위해 현재 블록보다 이전에 복원된 블록을 검색할 수 있다. 이전에 복원된 블록은 현재 블록의 공간적 주변 블록일 수도 있고 현재 블록의 시간적 주변 블록일 수도 있다. 부호화부(110)는 현재 블록의 움직임 정보를 유도하기 위해 현재 블록보다 이전에 복원된 블록들을 참조할 수 있다.
전술한 바와 같이, 인트라 예측 및 인터 예측에서는 현재 블록보다 이전에 복원된 블록들이 참조된다. 여기서, 블록들의 복원 순서는 소정 스캔 순서에 따라 순차적으로 복원될 수 있다. 소정 스캔 순서는 래스터 스캔(raster scan), Z 스캔(Z-scan), N 스캔(N-scan), 우상향 대각 스캔(up-right diagonal scan), 수평적 스캔(horizontal scan), 수직적 스캔(vertical scan) 등 다양한 순서 중 하나일 수 있으나, 상기 스캔 순서들에 한정되는 것은 아니다. 또한, 전술한 실시예에서 소정 스캔 순서는 블록들의 복원 순서를 위한 것으로 한정 해석되는 것은 아니며, 데이터 저장, 데이터 로딩, 데이터 액세스 등을 위한 것일 수 있다.
한편, 도 10 내지 도 23을 통해 후술되는 바와 같이 부호화 단위의 블록 형태는 정사각형 또는 직사각형일 수 있고, 임의의 기하학적 형태일 수도 있다. 따라서, 최대 부호화 단위 내에는 정사각형 형태의 부호화 단위들과 비-정사각형 형태의 부호화 단위들이 혼재할 수 있다. 일 실시예에 따른 영상 부호화부(110)는, 최대 부호화 단위 내의 각 부호화 단위에 포함된 소정 스캔 인덱스에 따라 데이터 액세스를 수행할 수 있다.
일 실시예에 따라, 기준 부호화 단위 내에 비-정사각형 형태의 부호화 단위가 존재하지 않는 경우, 기준 부호화 단위 내의 부호화 단위들은 서로 인접하는 경계가 연속적일 수 있다. 이 경우, 각각의 부호화 단위들은 소정 스캔 순서에 따라 데이터 액세스를 수행할 수 있다.
일 실시예에 따라, 기준 부호화 단위 내에 비-정사각형 형태의 부호화 단위가 적어도 하나 이상 존재하는 경우, 기준 부호화 단위 내의 부호화 단위들 간의 경계는 불연속적일 수 있다. 여기서, 불연속적인 경계에 맞닿아 있는 부호화 단위들 간의 데이터 액세스 순서는 단절(disconnection)될 수 있다. 따라서, 불연속적인 경계에 맞닿아 있는 부호화 단위들 사이에서는 스캔 순서가 적응적으로 조정될 수 있다. 예를 들어, 수직 방향의 직사각형 형태의 부호화 단위 내에서는 N 스캔 또는 수직적 스캔 순서로 데이터 액세스가 수행될 수 있고, 수평 방향의 직사각형 형태의 부호화 단위 내에서는 Z 스캔 또는 수평적 스캔 순서로 데이터 액세스가 수행될 수 있다. 스캔 순서와 관련해서는 도 14를 통해 상세히 후술하기로 한다.
전술한 바와 같이, 최대 부호화 단위 또는 기준 부호화 단위 내에는 하나 이상의 스캔 순서가 조합될 수 있다. 따라서, 인트라 예측 및 인터 예측 시 참조되는 블록들의 복원 순서 또한 하나 이상의 스캔 순서에 따라 결정될 수 있다. 일 실시예에 따른 부호화부(110)는 현재 블록 이전에 복호화된 블록을 검색하기 위해 블록 맵을 이용할 수 있다. 일 실시예에 따른 부호화부(110)는 블록 맵에 기초하여, 현재 블록이 참조 가능한 주변 블록을 결정할 수 있다. 또한, 부호화부(110)는 각각의 블록이 복호화될 때마다 각각의 블록이 복호화되었는지 여부를 나타내는 값을 블록 맵에 업데이트할 수 있다. 일 실시예에 따른 블록 맵은 픽처 내의 하나 이상의 블록에 대응하는 영역을 포함하고, 하나 이상의 블록 중 복호화된 블록에 대응하는 영역이 이용가능한(available) 영역으로 설정되고, 하나 이상의 블록 중 복호화되지 않은 블록에 대응하는 영역이 이용가능하지 않은(not-available) 영역으로 설정될 수 있다.
또한, 일 실시예에 따른 부호화부(110)는, 영상 데이터의 부호화를 위한 부호화 단위 뿐만 아니라, 부호화 단위와 다른 데이터 단위를 기반으로 부호화 단위의 영상 데이터의 변환을 수행할 수 있다.
부호화 단위의 변환을 위해서는, 부호화 단위보다 작거나 같은 크기의 데이터 단위를 기반으로 변환이 수행될 수 있다. 예를 들어, 변환을 위한 데이터 단위는, 인트라 모드를 위한 데이터 단위 및 인터 모드를 위한 데이터 단위를 포함할 수 있다. 이하, 변환의 기반이 되는 데이터 단위는 ‘변환 단위’라고 지칭될 수 있다.
부호화에 이용되는 정보는, 블록 형태 및 분할 형태에 관한 정보 뿐만 아니라 예측 관련 정보 및 변환 관련 정보가 필요하다. 따라서, 부호화부(110)는 최소 부호화 오차를 발생시킨 블록 형태, 분할 형태, 부호화 단위별 예측 모드, 변환을 위한 변환 단위의 크기 등을 결정할 수 있다.
부호화부(110)는 부호화 단위의 부호화 오차를 라그랑지 곱(Lagrangian Multiplier) 기반의 율-왜곡 최적화 기법(Rate-Distortion Optimization)을 이용하여 측정할 수 있다.
전송부(120)는, 부호화부(110)에서 결정된 적어도 하나의 부호화 단위에 기초하여 부호화된 최대 부호화 단위의 영상 데이터 및 부호화 단위별 부호화 모드에 관한 정보를 비트스트림 형태로 출력하여 복호화 장치로 전송한다.
부호화된 영상 데이터는 영상의 잔차 데이터의 부호화 결과일 수 있다.
부호화 단위별 부호화 모드에 관한 정보는, 블록 형태, 분할 형태, 부호화 단위별 예측 모드 정보, 변환 단위의 크기 정보 등을 포함할 수 있다.
도 2는 일 실시예에 따른 영상 복호화 장치(200)의 개략적인 블록도를 도시한다.
일 실시예에 따른 영상 복호화 장치(200)는 수신부(210) 및 복호화부(220)를 포함한다. 일 실시예에 따른 영상 복호화 장치(200)의 각종 프로세싱을 위한 부호화 단위, 블록 형태 정보, 분할 형태 정보, 변환 단위, 예측 모드에 관한 정보 등 각종 용어의 정의는, 도 1 및 영상 부호화 장치(100)을 참조하여 전술한 바와 동일하다.
수신부(210)는 부호화된 영상에 대한 비트스트림을 수신하여 파싱(parsing)한다. 수신부(210)는 파싱된 비트스트림으로부터 최대 부호화 단위별로 영상 데이터를 추출하여 영상 데이터 복호화부(220)로 출력한다. 수신부(210)는 현재 픽처 또는 슬라이스에 대한 파라미터 셋 RBSP(Raw byte sequence payload)로부터 현재 픽처 또는 슬라이스에 대한 정보를 추출할 수 있다.
또한, 수신부(210)는 파싱된 비트스트림으로부터 최대 부호화 단위로부터 분할되는 부호화 단위의 블록 형태 정보 및 분할 형태 정보를 추출한다. 추출된 블록 형태 정보 및 분할 형태 정보는 복호화부(220)로 출력된다. 즉, 비트열의 영상 데이터를 최대 부호화 단위로 분할하여, 복호화부(220)가 최대 부호화 단위마다 영상 데이터를 복호화하도록 할 수 있다.
또한, 수신부(210)는 파싱된 비트스트림으로부터 부호화 단위별 부호화 모드에 관한 정보를 추출할 수 있다. 부호화 모드에 관한 정보는, 하나 이상의 부호화 단위에 대해 설정될 수 있으며, 부호화 단위별 예측 모드 정보 및 변환 단위의 크기 정보 등을 포함할 수 있다.
수신부(210)가 추출한 부호화 모드에 관한 정보는, 일 실시예에 따른 영상 부호화 장치(100)와 같이 부호화단에서, 부호화 단위마다 반복적으로 부호화를 수행하여 최소 부호화 오차를 발생시키는 것으로 결정된 부호화 모드에 관한 정보이다. 따라서, 영상 복호화 장치(200)는 최소 부호화 오차를 발생시키는 부호화 방식에 따라 데이터를 복호화하여 영상을 복원할 수 있다.
수신부(210)는 최소 부호화 단위별로 부호화 모드에 관한 정보를 추출할 수 있다. 최소 부호화 단위별로, 해당 부호화 모드에 관한 정보가 기록되어 있다면, 동일한 부호화 모드에 관한 정보를 갖고 있는 최소 부호화 단위들은 동일한 최대 부호화 단위에 포함되는 데이터 단위로 유추될 수 있다. 즉, 동일한 정보의 최소 부호화 단위를 모아 복호화하면, 부호화 오차가 가장 작은 부호화 단위를 기반으로 한 복호화가 가능하다.
복호화부(220)는 부호화 단위별 부호화 모드에 관한 정보에 기초하여 각각의 부호화 단위의 영상 데이터를 복호화하여 현재 픽처를 복원한다. 복호화 과정은 역양자화 과정, 역변환 과정, 및 인트라 예측 및 움직임 보상을 포함하는 예측 과정을 포함할 수 있다.
*구체적으로, 복호화부(220)는 엔트로피 디코딩된 비트스트림을 영상 부호화 장치(100)에서 재정렬한 방법을 기초로 재정렬할 수 있다. 복호화부(220)는 1차원 벡터 형태로 표현된 계수들을 다시 2차원의 블록 형태의 계수로 복원하여 재정렬할 수 있다. 복호화부(220)는 영상 부호화 장치(100)에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 영상 부호화 장치(100)에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통해 재정렬을 수행할 수 있다. 또한, 복호화부(220)는 영상 부호화 장치(100)에서 제공된 양자화 파라미터와 재정렬된 블록의 계수 데이터를 기초로 역양자화를 수행할 수 있다. 복호화부(220)는 영상 부호화 장치(100)에서 수행된 양자화 결과에 대해, 영상 부호화 장치(100)가 수행한 이산 코사인 변환(Discrete Cosine Transform; DCT) 또는 이산 사인 변환(Discrete Sine Transform; DST)에 대해 역DCT 또는 역DST를 수행할 수 있다. 역변환은 영상 부호화 장치(100)에서 결정된 전송 단위 또는 영상의 분할단위를 기초로 수행될 수 있다.
복호화부(220)는 수신부(210)에서 제공된 예측 관련 정보와 이전에 복호화된 블록 및/또는 픽처 정보를 기초로 부호화 단위의 예측 데이터를 생성할 수 있다. 복원 데이터는 부호화 단위의 예측 데이터와 잔차 데이터를 이용하여 생성될 수 있다. 복호화부(220)에서 수행하는 구체적인 예측의 방법은 영상 부호화 장치(100)의 부호화부(110)에서 수행되는 예측의 방법과 동일하다.
구체적으로, 복호화부(220)는 현재 블록에 대한 예측 모드가 인트라 예측(intra prediction) 모드인 경우에, 현재 픽처 내의 화소 정보를 기초로 예측 블록을 생성하는 인트라 예측을 수행할 수 있다. 여기서, 현재 블록은 현재 부호화 단위일 수 있다.
현재 블록에 대한 예측 모드가 인터 예측(inter prediction) 모드인 경우에, 복호화부(220)는 현재 픽처의 이전 픽처 또는 이후 픽처 중 적어도 하나를 참조 픽처로 하고, 참조 픽처에 포함된 정보를 기초로 현재 블록에 대한 인터 예측을 수행할 수 있다. 구체적으로, 인터 예측에서는 현재 블록에 대하여, 참조 픽처를 선택하고 현재 블록과 동일한 크기의 참조 블록을 선택해서, 현재 블록에 대한 예측 블록을 생성할 수 있다. 예컨대, 인터 예측에서는 현재 블록과의 잔차 신호가 최소화되며 움직임 벡터 크기 역시 최소가 되도록 예측 블록을 생성할 수 있다. 이때, 참조 픽처의 정보를 이용하기 위해, 현재 픽처의 주변 블록들의 정보를 이용할 수 있다. 예컨대, 스킵 모드, 머지 모드, MVP 모드 등을 통해, 주변 블록의 정보에 기반하여 현재 블록에 대한 예측 블록을 생성할 수 있다.
복호화부(220)는, 일 실시예에 따른 영상 부호화 장치(100)와 같이, 현재 블록 이전에 복호화된 블록을 검색하고, 참조가능한 주변 블록을 결정하기 위해 블록 맵을 이용할 수 있다.
일 실시예에 따른 영상 복호화 장치(200)는, 부호화 과정에서 부호화 단위마다 재귀적으로 부호화를 수행하여 최소 부호화 오차를 발생시킨 부호화 단위에 대한 정보를 획득하여, 현재 픽처에 대한 복호화에 이용할 수 있다. 즉, 부호화 단위마다 최적 부호화 단위로 영상 데이터의 복호화가 가능해진다.
따라서, 높은 해상도의 영상 또는 데이터량이 과도하게 많은 영상이라도 부호화단으로부터 전송된 최적 부호화 모드에 관한 정보를 이용하여, 영상의 특성에 적응적으로 결정된 부호화 단위의 크기 및 부호화 모드에 따라 효율적으로 영상 데이터를 복호화하여 복원할 수 있다.
도 3은 일 실시예에 따라 참조 가능한 영역을 판단하는 방법을 나타낸 도면이다.
일 실시예에 따라, 블록들(310, 320, 330)은 데이터 저장, 데이터 로딩, 데이터 액세스 등을 위해 소정 스캔 순서에 따라 스캔될 수 있다. 일 실시예에 따른 블록들(310, 320, 330)은 최대 부호화 단위(300)에 포함된 부호화 단위 또는 변환 단위일 수 있다. 또한, 일 실시예에 따른 블록들(310, 320, 330)은 정사각형 또는 비-정사각형 형태일 수 있다.
일 실시예에 따른 영상 복호화 장치(200)(또는 영상 부호화 장치(100))는 현재 블록(330)의 데이터 처리를 위해 현재 블록(330) 이전에 복호화된 주변 블록을 참조할 수 있다. 예를 들어, 데이터 처리는 인트라 예측, 인터 예측 또는 주변 영역을 참조하는 다양한 기술들을 포함할 수 있다. 예를 들어, 현재 블록(330)이 참조하는 주변 영역이 블록(320)에 포함된 26번 인덱스의 블록(영역)인 경우, 현재 블록(330)이 26번 인덱스의 블록를 참조 가능한지 여부는 블록들(310, 320, 330)의 스캔 순서에 따라 결정될 수 있다. 만일, 블록들(310, 320, 330)의 스캔 순서가 Z 스캔 순서(302)를 따른다면 26번 인덱스의 블록(320)은 현재 블록(330)의 데이터 처리 이전에 복호화된 블록이므로, 현재 블록(330)은 26번 인덱스의 블록(320)을 참조 가능하다. 그러나, 만일 블록들(310, 320, 330)의 스캔 순서가 N 스캔 순서(304)를 따른다면 26번 인덱스의 블록(320)은 현재 블록(330)의 데이터 처리 이후에 복호화되므로, 현재 블록(330)은 26번 인덱스의 블록(320)을 참조할 수 없다. 즉, 현재 블록(330)의 주변 블록이 참조되기 위해서는 주변 블록이 현재 블록(330) 이전에 복호화되었는지 여부를 알 수 있어야 한다. 그런데, 블록들(310, 320, 330)의 형태가 비-정사각형일 경우, 블록들(310, 320, 330)의 스캔 순서가 적응적으로 조정되거나 변경될 수 있다. 따라서, 블록들(310, 320, 330)의 복호화 순서를 정확히 파악하고 현재 블록(330) 이전에 복호화된 주변 블록을 찾기 위해 블록 맵이 이용될 수 있다.
도 4는 일 실시예에 따른 블록 맵을 나타낸 도면이다.
일 실시예에 따른 블록 맵(410, 420)은 현재 최대 부호화 단위에 대하여 생성될 수 있다. 현재 최대 부호화 단위 이전에 이미 복호화된 최대 부호화 단위는 현재 최대 부호화 단위의 참조로서 이용가능(available)하기 때문에, 현재 최대 부호화 단위 이전에 이미 복호화된 최대 부호화 단위에 대한 블록 맵은 더 이상 저장될 필요가 없다.
일 실시예에 따른 블록 맵(410, 420)은 하나 이상의 블록에 대응하는 영역을 포함할 수 있다. 일 실시예에 따른 블록 맵(410)은 최대 부호화 단위 내의 하나 이상의 부호화 단위에 대응하는 영역들(411, 412, 413, 414, 415)을 포함할 수 있다. 또한, 일 실시예에 따른 블록 맵(420)은 최대 부호화 단위 내의 하나 이상의 변환 단위에 대응하는 영역들(421, 422, 423, 424, 425, 426, 427, 428)을 포함할 수 있다.
일 실시예에 따른 블록 맵(410)은 하나 이상의 부호화 단위 중 복호화된 부호화 단위에 대응하는 영역이 이용가능한(available) 영역(411, 412, 413)으로 설정되고, 하나 이상의 부호화 단위 중 복호화되지 않은 부호화 단위에 대응하는 영역이 이용가능하지 않은(not-available) 영역(415)으로 설정될 수 있다.
일 실시예에 따른 블록 맵(410)은 각각의 부호화 단위가 복호화되는 시점 에서 업데이트될 수 있다. 예를 들어, 부호화 단위들이 소정 스캔 순서에 따라 복호화될 때마다 복호화된 부호화 단위들 각각에 대응하는 블록 맵(410)의 영역(411, 412, 413)이 이용가능한 영역의 값(예를 들어, ‘TRUE’ 값)으로 순차적으로 업데이트되고, 그 이외의 영역(415)은 이용가능하지 않은 영역의 값(예를 들어, ‘FALSE’ 값)으로 유지될 수 있다. 그리고, 블록 맵(410)의 이용가능한 영역(411, 412, 413)은 현재 부호화 단위(414)의 참조로서 이용될 수 있다.
일 실시예에 따른 블록 맵(420)은 하나 이상의 블록 중 복호화된 변환 단위에 대응하는 영역이 이용가능한 영역(421, 422, 423, 424, 425, 426)으로 설정되고, 하나 이상의 변환 단위 중 복호화되지 않은 변환 단위에 대응하는 영역이 이용가능하지 않은(not-available) 영역(428)으로 설정될 수 있다.
일 실시예에 따른 블록 맵(420)은 각각의 변환 단위가 복호화되는 시점에서 업데이트될 수 있다. 예를 들어, 변환 단위들이 소정 스캔 순서에 따라 복호화될 때마다 복호화된 변환 단위들 각각에 대응하는 블록 맵(420)의 영역(421, 422, 423, 424, 425, 426)이 이용가능한 영역의 값(예를 들어, ‘TRUE’ 값)으로 순차적으로 업데이트되고, 그 이외의 영역(428)은 이용가능하지 않은 영역의 값(예를 들어, ‘FALSE’ 값)으로 유지될 수 있다. 그리고, 블록 맵(422)의 이용가능한 영역(421, 422, 423, 424, 425, 426)은 현재 변환 단위(427)의 참조로서 이용될 수 있다.
일 실시예에 따른 블록 맵(410, 420)의 각 영역의 값이 이용가능한 영역의 값 또는 이용가능하지 않은 값인지 여부를 확인하여 현재 부호화 단위(414) 또는 현재 변환 단위(427)가 참조 가능한 영역인지 여부가 결정될 수 있다.
일 실시예에 따른 블록 맵(410, 420)은 현재 블록에 공간적으로 이웃하는 영역 뿐만 아니라 현재 블록에 시간적으로 이웃하는 영역도 참조 가능한 영역으로 결정할 수 있다.
일 실시예에 따른 블록 맵(410, 420)의 하나 이상의 블록에 대응하는 영역들은 전술한 부호화 단위들의 형태와 마찬가지로 정사각형이거나 비-정사각형 형태일 수 있다.
일 실시예에 따른 블록 맵(410, 420)은 최대 부호화 단위 별로 생성될 수 있고, 최대 부호화 단위 내의 각 부호화 단위 또는 각 변환 단위가 복호화 될 때마다 기 생성된 블록 맵이 업데이트될 수 있다.
일 실시예에 따른 블록 맵(410, 420)은 최대 부호화 단위에 대해 생성될 수 있으므로, 현재 최대 부호화 단위를 벗어나는 영역에 대해서는 최대 부호화 단위들의 프로세싱 순서를 판단하여 이용가능성 여부가 판단될 수 있다. 즉, 현재 최대 부호화 단위보다 먼저 복호화된 최대 부호화 단위에 속한 영역은 이용가능한 영역이라고 판단될 수 있으며, 아직 복호화되지 않은 최대 부호화 단위에 속한 영역은 이용가능하지 않은 영역이라고 판단될 수 있다.
블록 맵(410, 420)을 이용하여 현재 블록이 참조하는 주변 블록의 이용가능성(availability)을 결정하거나 현재 블록이 참조하는 주변 블록을 적응적으로 변경하는 다양한 실시예들을 이하에서 후술하기로 한다.
일 실시예에 따라, 영상 복호화 장치(200)(또는 영상 부호화 장치(100))는, 현재 블록을 픽처 내의 현재 블록에 인접하는 주변 블록을 이용하여 예측하는 인트라 예측을 수행할 수 있다. 일 실시예에 따라, 하나 이상의 주변 블록의 하나 이상의 화소값(Pixel Value)에 가중치(Weight Value)를 부가하여 현재 블록의 각 화소의 예측 화소값(Predicted Pixel Value)을 계산함으로써 현재 블록이 예측될 수 있다.
여기서, 주변 블록은 현재 블록 이전에 복원된 블록으로서, 전술한 바와 같이 블록 맵을 통해 이용가능성 여부가 결정될 수 있다. 일 실시예에 따라, 인트라 예측에 이용되는 주변 블록은 현재 블록의 주변에 위치한 하나 이상의 주변 블록일 수 있으며, 예를 들어 현재 블록의 좌측 블록 및 현재 블록의 상단 블록 중 하나 이상일 수 있다.
일 실시예에 따라, 영상 복호화 장치(200)(또는 영상 부호화 장치(100))는, 현재 블록의 움직임 정보를 도출하고, 도출된 움직임 정보에 기반하여 현재 블록에 대한 인터 예측을 수행할 수도 있다.
현재 블록의 예측에 이용되는 영상을 참조 픽처(reference picture) 또는 참조 프레임(reference frame)이라고 한다. 참조 픽처 내의 영역은 참조 픽처를 지시하는 참조 픽처 인덱스(refIdx) 및 움직임 벡터(motion vector) 등을 이용하여 나타낼 수 있다.
현재 픽처에 대하여, 예측을 위하여 사용되는 픽처들로 참조 픽처 리스트를 구성할 수 있으며, 참조 픽처 인덱스는 참조 픽처 리스트에서 특정 참조 픽처를 지시할 수 있다. P 픽처의 경우에는 하나의 참조 픽처 리스트, 예컨대 참조 리스트 0을 필요로 하며, B 픽처의 경우에는 두 개의 참조 픽처 리스트, 예컨대 참조 리스트 0 및 참조 리스트 1을 필요로 한다.
구체적으로, I 픽처는 인트라 예측에 의해서 부호화/복호화되는 픽처이다. P 픽처는 각 블록의 샘플 값을 예측하기 위해 적어도 하나의 움직임 벡터 및 참조 픽처 인덱스를 이용한 인터 예측 또는 인트라 예측을 이용해서 부호화/복호화될 수 있는 픽처이다. B 픽처는 각 블록의 샘플 값을 예측하기 위해 적어도 두 개의 움직임 벡터들과 참조 픽처 인덱스들을 이용한 인터 예측 또는 인트라 예측을 이용해서 부호화/복호화될 수 있는 픽처이다.
P 픽처에서는 한 개의 참조 픽처 리스트를 필요로 하며, 이를 참조 픽처 리스트 0(reference picture list 0: L0)이라 지칭한다.
B 픽처는 하나 이상, 예를 들어 2 개의 참조 픽처를 이용하여 순방향, 역방향 또는 양 방향 인터 예측에 의해 부호화될 수 있는 픽처다. B 픽처는 두 개의 참조 픽처 리스트를 필요로 하며, 두 개의 참조 픽처 리스트는 각각 참조 픽처 리스트 0(reference picture list 0: L0), 참조 픽처 리스트 1(reference picture list 1: L1)이라 지칭한다.
L0으로부터 선택된 참조 픽처를 사용하는 인터 예측을 L0 예측이라 하며, L1으로부터 선택된 참조 픽처를 사용하는 인터 예측을 L1 예측이라 한다. L0 예측은 순방향 예측에 사용될 수 있고, L1 예측은 역방향 예측에 사용될 수 있으나, L0 예측 및 L1의 예측 방향은 상기 실시예에 한정되는 것은 아니다. 또한 L0과 L1으로부터 각각 선택된 두 개의 참조 픽처를 사용하는 인터 예측을 쌍 예측(bi prediction)이라고도 한다.
상기 I 픽처, P 픽처, B 픽처의 특징은 픽처 단위가 아닌 슬라이스 단위로도 정의될 수 있다. 예컨대, 슬라이스 단위에서 I 픽쳐의 특징을 갖는 I 슬라이스, P 픽쳐의 특징을 갖는 P 슬라이스, B 픽쳐의 특징을 갖는 B 슬라이스가 정의될 수 있다.
예컨대, 현재 블록에 대한 슬라이스 타입이 B이고 L0으로부터 colPic이 선택되는 경우 또는 현재 블록에 대한 슬라이스 타입이 P인 경우에 colPic은 L0에서 선택될 수 있다.
한편, 지연(low delay)을 방지하기 위하여, 참조 리스트 0과 1의 예측 방향을 모두 순방향으로만 제한할 수도 있다.
인터 예측에 있어서, 스킵 모드의 경우에는 주변 블록의 정보를 그대로 현재 블록에 이용할 수 있다. 따라서, 스킵 모드의 경우에는, 현재 블록의 움직임 정보로서 어떤 블록의 움직임 정보를 이용할 것인지를 지시하는 정보 외에 잔차 등과 같은 신택스 정보를 전송하지 않는다.
또한, 머지 모드의 경우에는, 주변 블록의 움직임 정보를 그대로 이용하여 현재 블록에 대한 예측 블록을 생성할 수 있다. 영상 부호화 장치(100)는 머지 모드를 적용하는지에 관한 정보와 어떤 블록의 움직임 정보를 이용할지에 관한 정보, 잔차 정보 등을 영상 복호화 장치(200)로 전송할 수 있다. 영상 복호화 장치(200)는 예측 블록과 영상 부호화 장치(100)로부터 전송되는 잔차를 더하여 현재 블록을 복원할 수 있다.
머지 모드에서 어떤 블록의 정보를 이용할 것인지를 지시하는 방법 등은 스킵 모드와 일반적인 인터 예측 모드의 경우에 적용될 수도 있다. 예컨대, 머지 모드에서 현재 블록의 움직임 정보로서 이용될 정보를 가지는 후보 블록을 다른 인터 예측 모드와 공동으로 이용할 수도 있고, 어떤 주변 블록의 움직임 정보를 이용할 것인지를 지시하는 방법을 동일하게 할 수도 있다.
이때, 스킵 모드와 일반적인 인터 예측 모드에서는 주변 블록의 참조 픽처 인덱스나 예측 방향(참조 픽처 리스트)이 현재 블록의 참조 픽처 인덱스나 예측 방향(참조 픽처 리스트)에 부합하는 경우에만 이용 가능한 움직임 정보를 가지는 것으로 판단하여 현재 블록에 대한 움직임 벡터 예측자 후보로 해당 블록의 움직임 벡터를 이용하도록 할 수도 있다.
도 5는 일 실시예에 따라 현재 블록의 움직임 정보를 유도하기 위해 복수의 머지 후보자(merge candidates)를 구성하는 방법을 나타낸 도면이다.
도 5를 참조하면, 현재 블록(500)의 머지 후보자는, 첫 번째로 좌측 하단 블록(502; 인덱스 45번), 두 번째로 상단 우측 블록(504; 인덱스 66번), 세 번째로 좌측 하단 블록(506; 인덱스 39번), 네 번째로 상단 우측 블록(508; 인덱스 23번), 다섯 번째로 상단 좌측 블록(510; 인덱스 7번)이 될 수 있다. 또한, 여섯 번째로 시간적 후보 예측 블록(미도시)이 존재할 수 있다.
머지 후보자는 고정된 수를 가질 수 있다. 예를 들어, 머지 후보자는 고정적으로 5개일 수 있다. 또한, 머지 후보자 중에서 공간적인 후보 예측 블록의 개수는 일정한 수로 제한될 수 있다. 예를 들어, 머지 후보자가 4개의 공간적인 후보 예측 블록을 포함하는 것이 가능한 경우, 좌측 하단 블록(502; 인덱스 45번), 상단 우측 블록(504; 인덱스 66번), 좌측 하단 블록(506; 인덱스 39번), 상단 우측 블록(508; 인덱스 23번) 중 이용가능하지 않은 블록이 있다면, 우선 순위 순서로 다섯 번째인 상단 좌측 블록(510; 인덱스 7번)이 머지 후보자의 리스트에서 이용가능하지 않은 블록을 대체할 수 있다.
움직임 벡터 예측자(MVP)를 사용하는 경우, 좌측 하단 블록(502; 인덱스 45번)에서 좌측 하단 블록(506; 인덱스 39번) 순서로 블록의 이용가능성 여부를 판단하여 이용가능한 첫번째 블록의 움직임 벡터를 후보 예측 움직임 벡터로 사용할 수 있다. 다음으로, 상단 우측 블록(504; 인덱스 66번), 상단 우측 블록(508; 인덱스 23번), 상단 좌측 블록(510; 인덱스 7번) 순서로 블록의 이용가능성 여부를 판단하여 이용가능한 첫번째 블록의 움직임 벡터를 후보 예측 움직임 벡터로 선택하고 마지막으로 시간적인 후보 예측 블록의 움직임 벡터를 후보 예측 움직임 벡터로 사용할 수 있다.
일 실시예에 따른 영상 복호화 장치(200)(또는 영상 부호화 장치(100))는 머지 후보자를 구성하는 블록들의 이용가능성 여부를 블록 맵에 기초하여 판단할 수 있다.
일 실시예에 따라 머지 후보자에 기초하여 현재 블록의 움직임 정보가 유도되고, 유도된 움직임 정보를 이용하여 현재 블록의 예측이 수행될 수 있다. 일 실시예에 따라, 움직임 정보는 움직임 벡터, 예측 방향, 참조 픽처의 인덱스 등에 대한 정보를 포함할 수 있다.
도 6은 다양한 실시예에 따라 동일한 움직임 정보를 갖는 머지 후보자를 변경하는 방법을 나타낸 도면이다.
도 6을 참조하면, 현재 블록(600)의 머지 후보자는, 첫 번째로 좌측 하단 A0 블록(610), 두 번째로 상단 우측 B0 블록(620), 세 번째로 좌측 하단 A1 블록(630), 네 번째로 상단 우측 B1 블록(640), 다섯 번째로 상단 좌측 B2 블록(650)이 될 수 있다. 또한, 여섯 번째로 시간적 후보 예측 블록(미도시)이 존재할 수 있다.
일 실시예에 따라, 현재 블록(600)의 공간적 머지 후보자들(610, 620, 630, 640, 650) 중 둘 이상의 머지 후보자들이 동일한 부호화 단위에 포함되는 경우가 존재할 수 있다. 이 경우, 동일한 부호화 단위에 속하는 둘 이상의 머지 후보자들은 동일한 움직임 벡터를 가질 수 있다. 따라서, 동일한 부호화 단위에 속하는 둘 이상의 머지 후보자들 중 적어도 하나의 머지 후보자는 새로운 머지 후보자로 대체될 수 있다. 머지 후보자를 대체하기 위해, 블록 맵을 이용하여 이용가능한 머지 후보자가 검색될 수 있다. 따라서, 일 실시예에 따라 블록 맵을 이용함으로써 현재 블록(600)의 참조 대상이 되는 주변 영역이 선택될 수 있다.일 실시예에 따라, 현재 블록(600)의 공간적 머지 후보자들(610, 620, 630, 640, 650) 중 좌측 하단 A0 블록(610) 및 좌측 하단 A1 블록(630)이 동일한 부호화 단위에 포함될 수 있다. 이 경우, 동일한 부호화 단위에 포함되는 좌측 하단 A0 블록(610) 및 좌측 하단 A1 블록(630)은 동일한 움직임 벡터를 가지므로, 좌측 하단 A0 블록(610) 및 좌측 하단 A1 블록(630) 중 적어도 하나가 다른 움직임 정보를 갖는 다른 위치의 머지 후보자로 대체될 수 있다.
일 실시예에 따라, 좌측 하단 A0 블록(610) 및 좌측 하단 A1 블록(630)이 동일한 부호화 단위에 포함되면서 동일한 움직임 벡터를 갖는 경우, 머지 후보자 중에서 좌측 하단 A0 블록(610)이 좌측 하단 A0 블록(610)에 인접한 A0` 블록(612)으로 대체될 수 있다. 또한, 일 실시예에 따라, 좌측 하단 A0 블록(610) 및 좌측 하단 A1 블록(630)이 동일한 부호화 단위에 포함되면서 동일한 움직임 벡터를 갖는 경우, 머지 후보자 중에서 좌측 하단 A1 블록(630)이 좌측 하단 A1 블록(630)에 인접한 A1` 블록(632)으로 대체될 수도 있다. 즉, 동일한 부호화 단위에 포함되면서 동일한 움직임 벡터를 갖는 좌측 하단 A0 블록(610)과 좌측 하단 A1 블록(630) 중 적어도 하나는, 좌측 하단 A0 블록(610)과 좌측 하단 A1 블록(630)이 속한 부호화 단위와 인접한 다른 부호화 단위에 포함된 블록(예를 들어, A0` 블록(612) 또는 A1` 블록(632))으로 대체될 수도 있다.
그러나, A0 블록(610) 및 A1 블록(630) 중 적어도 하나가 A0 블록(610) 및 A1 블록(630)이 속하는 부호화 단위와 다른 부호화 단위에 속하는 블록(예를 들어, A0` 블록(612) 또는 A1` 블록(632))으로 대체되더라도, 여전히 대체된 블록의 움직임 벡터가 A0 블록(610) 또는 A1 블록(630)의 움직임 벡터와 동일한 경우가 발생할 수 있다. 이 경우, A0 블록(610) 및 A1 블록(630) 중 적어도 하나가 A0 블록(610) 및 A1 블록(630)이 속하는 부호화 단위에 가장 근접하면서, 다른 움직임 벡터를 갖는 블록(예를 들어, A1`` 블록(634))으로 대체될 수 있다.
상술한 실시예에서, 대체된 머지 후보자 A0` 블록(612), A1` 블록(632) 또는 A1`` 블록(634)은 블록 맵에서 이용가능한 영역으로 설정된 블록일 수 있다. 즉, 대체된 머지 후보자는 현재 블록(600)의 예측 수행 이전에 복호화된 블록일 수 있다.
다른 실시예에 따라, 현재 블록(600)의 공간적 머지 후보자들(610, 620, 630, 640, 650) 및 시간적 머지 후보자 중 동일한 부호화 단위에 포함되지 않는 둘 이상의 머지 후보자들이 동일한 움직임 벡터를 가질 수도 있다. 이 경우, 동일한 부호화 단위에 포함되지 않으면서 동일한 움직임 벡터를 갖는 둘 이상의 머지 후보자들 중 적어도 하나의 머지 후보자가 새로운 머지 후보자로 대체될 수도 있다. 머지 후보자를 대체하기 위해, 블록 맵을 이용하여 이용가능한 머지 후보자가 검색될 수 있다. 따라서, 일 실시예에 따라 블록 맵을 이용함으로써 현재 블록(600)의 참조 대상이 되는 주변 영역이 선택될 수 있다.
일 실시예에 따라, 머지 후보자들 중 좌측 하단 A0 블록(610) 및 좌측 하단 A1` 블록(632)은 다른 부호화 단위에 속해 있으나 동일한 움직임 벡터를 가질 수 있다. 이 경우, A0 블록(610) 및 A1` 블록(632) 중 적어도 하나가 A0 블록(610) 및 A1` 블록(632)의 움직임 벡터와 다른 움직임 벡터를 가지는 블록(예를 들어, A1`` 블록 (634))으로 대체될 수 있다. 일 실시예에 따라, 다른 움직임 벡터를 가지는 블록은 A0 블록(610) 또는 A1` 블록(632)에 인접한 부호화 단위의 블록 중에서 선택될 수 있다.머지 후보자를 대체하는 실시예는 상술한 실시예에 한정 해석되는 것은 아니며, 블록 맵의 이용가능한 영역으로 설정된 블록 중에서 현재 블록(600)의 임의의 주변 영역이 머지 후보자로 변경될 수 있다. 예를 들어, 변경되는 머지 후보자는 현재 블록에 인접한 주변 블록들 중에서 선택될 수 있고, 변경 전 머지 후보자와 다른 부호화 단위에 포함되는 블록 중에서 선택될 수도 있으며, 현재 블록에 인접하면서 변경 전 머지 후보자와 가장 가까운 블록들 중에서 선택될 수도 있다.
전술한 실시예에 따라, 영상 복호화 장치(200)(또는 영상 부호화 장치(100))는 변경된 머지 후보자에 기초하여 현재 블록(600)의 움직임 정보를 유도하고, 유도된 움직임 정보를 이용하여 현재 블록(600)의 예측을 수행할 수 있다.
도 7은 다양한 실시예에 따라 참조 가능하지 않은 영역의 머지 후보자를 변경하는 방법을 나타낸 도면이다.
도 7을 참조하면, 현재 블록(700)의 머지 후보자는, 첫 번째로 좌측 하단 A0 블록(710), 두 번째로 상단 우측 B0 블록(720), 세 번째로 좌측 하단 A1 블록(730), 네 번째로 상단 우측 B1 블록(740), 다섯 번째로 상단 좌측 B2 블록(750)이 될 수 있다. 또한, 여섯 번째로 시간적 후보 예측 블록(미도시)이 존재할 수 있다.
일 실시예에 따라, 현재 블록(700)의 공간적 머지 후보자들(710, 720, 730, 740, 750) 및 시간적 머지 후보자 중에서 블록 맵의 이용가능하지 않은 영역에 대응하는 머지 후보자가 존재하는 경우, 블록 맵의 이용가능하지 않은 영역에 대응하는 머지 후보자가 블록 맵의 이용가능한 영역에 대응하는 머지 후보자로 대체될 수 있다.
예를 들어, 현재 블록(700)의 공간적 머지 후보자들(710, 720, 730, 740, 750) 중 A0 블록(710), A1 블록(730), B1 블록(740) 및 B2 블록(750)이 블록 맵의 이용가능한 영역에 대응하고, B0 블록(720)이 블록 맵의 이용가능하지 않은 영역에 대응할 수 있다. 이 경우, B0 블록(720)은 현재 블록(700)의 참조로 이용될 수 없으므로, 머지 후보자들 중 B0 블록(720)은 블록 맵의 이용가능한 영역의 B0` 블록(722)으로 변경될 수 있다.
또한, 예를 들어, 변경된 머지 후보자의 B0` 블록(722)이 다른 머지 후보자인 B1 블록(740)과 동일한 부호화 단위에 포함되어 있는 경우에는, 머지 후보자가 중복되는 것을 방지하기 위해, 블록 맵의 이용가능한 영역에 대응하는 다른 머지 후보자 B1 블록(740)이 이웃하는 B1` 블록(742)으로 변경될 수 있다. 이 경우, B1` 블록(742)도 마찬가지로 블록 맵의 이용가능한 영역에 대응하는 블록 중에서 결정될 수 있다.
전술한 실시예에 따라, 영상 복호화 장치(200)(또는 영상 부호화 장치(100))는 변경된 머지 후보자에 기초하여 현재 블록(700)의 움직임 정보를 예측하고, 예측된 움직임 정보를 이용하여 현재 블록(700)의 움직임 정보를 복원할 수 있다.
한편, MVP 모드가 적용되는 경우에는 참조 픽처에 대한 현재 블록과 주변 블록의 움직임 벡터 차이(Motion Vector difference: MVD)와 참조 픽처에 대한 주변 블록의 움직임 벡터 예측자(Motion Vector Predictor: MVP)의 합으로 참조 픽처에 대한 현재 블록의 움직임 정보가 유도될 수 있다.
구체적으로, 영상 부호화 장치(100)는 주변 블록들의 움직임 정보를 이용하여 현재 블록의 움직임 벡터를 예측하고, 현재 블록의 움직임 벡터와 예측된 움직임 벡터 사이의 차이를 참조 픽처를 지시하는 참조 픽처 인덱스와 함께 전송할 수 있다. 영상 복호화 장치(200)는 주변 블록의 움직임 정보들을 이용하여 현재 블록의 움직임 벡터를 예측하고, 영상 부호화 장치(100)로부터 수신한 잔차를 이용하여 현재 블록에 대한 움직임 벡터을 유도할 수 있다. 영상 복호화 장치(200)는 유도한 움직임 벡터와 영상 부호화 장치(100)로부터 수신한 참조 픽처 인덱스 정보를 기반으로 현재 블록에 대한 예측 블록을 생성할 수 있다.
일 실시예에 따라, 인터 예측에서 MVP 모드가 적용되는 경우, 현재 블록에 대한 움직임 벡터 예측자(MVP) 후보 리스트가 생성되는 방식은, 도 5 내지 도 7을 통해 전술한 머지 후보자 리스트를 생성하는 방식과 동일할 수 있다.
일 실시예에 따라, 영상 부호화 장치(100) 또는 영상 복호화 장치(200)는 현재 블록에 대한 MVP 후보 리스트를 생성할 수 있다. 움직임 벡터 예측자는 현재 블록의 움직임 벡터에 대한 예측값을 나타낼 수 있다. 이 때, MVP 후보 리스트는 현재 블록에 인접하고 이용가능한(available) 주변 블록 및/또는 현재 블록과 동일 위치에 있는(co-located) 각 참조 픽처의 블록들 중에서 이용가능한(available) 블록의 움직임 벡터를 이용하여 생성될 수 있다.
즉, MVP 후보 리스트를 구성하는 블록들의 이용가능성 여부가 블록 맵에 기초하여 판단될 수 있다. 한편, 현재 픽처보다 먼저 복원된 픽처의 콜로케이티드(co-located) 블록은 블록 맵의 이용 없이 이용가능한 영역이라고 판단될 수 있다.
영상 부호화 장치(100)는 MVP 후보 리스트에 포함된 MVP 후보들에 대해 움직임 벡터 경쟁(Motion Vector Competition: MVC)을 적용하여, 현재 블록에 대한 최적의 MVP를 선택할 수 있다. 영상 부호화 장치(100)는 선택된 MVP 인덱스, MVD(Motion Vector Difference), 그리고 참조 픽처 인덱스를 비트 스트림을 통해 영상 복호화 장치(200)로 전송할 수 있다. MVP 인덱스는, 현재 블록의 MVP를 지시하는 인덱스로서 MVP 후보 리스트에 포함된 MVP 후보들 중에서 어느 하나를 지시할 수 있다. 또한, 참조 픽처 인덱스는, 현재 블록의 참조 픽처를 지시하는 인덱스로서 참조 픽처 리스트에 포함된 참조 픽처 후보들 중에서 어느 하나를 지시할 수 있다. MVD는 현재 블록의 움직임 벡터와 선택된 MVP의 차이로서, MVD의 값이 적을수록 전송되는 정보량을 줄일 수 있다.
영상 복호화 장치(200)는 영상 부호화 장치(100)로부터 MVP 인덱스와 참조 픽처 인덱스를 수신할 수 있다. 수신한 MVP 인덱스를 이용하여, 영상 복호화 장치(200)는 MVP 후보 리스트에 포함된 MVP 후보들 중 현재 블록에 대한 MVP를 선택할 수 있다. 수신한 참조 픽처 인덱스를 이용하여, 영상 복호화 장치(200)는 참조 픽처 리스트에 포함된 참조 픽처 후보들 중에서 현재 블록에 대한 참조 픽처를 선택할 수 있다.
영상 복호화 장치(200)는 선택된 MVP 및 참조 픽처를 수신한 MVD와 함께 이용하여 현재 블록의 움직임 벡터를 도출할 수 있다. 예컨대, 영상 복호화 장치(200)는 MVP에 수신한 MVD를 더하여 현재 블록의 움직임 벡터를 복원할 수 있다.
전술한 바와 같이, 블록 맵은 머지 후보자 또는 MVP 후보를 구성함에 있어서, 주변 블록이 참조가능한 영역인지 여부를 판별하기 위해 사용될 수 있다. 또한, 주변 블록의 이용가능성(availability) 여부에 따라 참조되는 주변 블록의 위치는 적응적으로 변경될 수도 있다.
블록 맵은, 머지 후보자 또는 MVP 후보 리스트를 생성하는데 이용될 수 있을 뿐만 아니라, 부호화 및 복호화 동작에서 주변(neighboring) 영역을 참조하는 모든 기술들에 이용될 수 있다. 예를 들어, 전술한 바와 같이 인트라 예측 시 픽처 내의 현재 블록에 인접하는 주변 블록이 참조가능한지 여부를 결정하기 위해 블록 맵이 이용될 수 있다.
도 8은 일 실시예에 따른 영상 부호화 방법을 설명하기 위한 흐름도이다.
단계 S810에서, 픽처 내의 하나 이상의 블록이 결정된다. 하나 이상의 블록은 하나 이상의 부호화 단위로 구성되거나 하나 이상의 변환 단위로 구성될 수 있다. 또한, 하나 이상의 블록은 정사각형 형태 또는 비-정사각형 형태일 수 있다.
단계 S820에서, 하나 이상의 블록 중 복호화된 블록을 나타내는 블록 맵이 결정된다. 블록 맵은 각각의 블록이 복호화될 때마다 업데이트될 수 있다. 또한, 블록 맵은 최대 부호화 단위 별로 생성될 수 있다. 또한, 블록 맵은 하나 이상의 블록에 대응하는 영역을 포함하고, 복호화된 블록에 대응하는 영역이 이용가능한 영역으로 설정되고, 복호화되지 않은 블록에 대응하는 영역이 이용가능하지 않은 영역으로 설정될 수 있다.
단계 S830에서, 블록 맵에 기초하여, 하나 이상의 블록 중 소정 스캔 순서에 따라 부호화를 수행할 현재 블록이 참조 가능한 주변 영역이 결정된다. 소정 스캔 순서는 래스터 스캔, Z 스캔, N 스캔, 우상향 대각 스캔, 수평적 스캔, 수직적 스캔 등 다양한 순서 중 하나일 수 있으며, 상기 스캔 순서들에 한정되는 것은 아니다.
단계 S840에서, 참조 가능한 주변 영역에 기초하여 현재 블록이 부호화된다. 최대 부호화 단위마다, 적어도 하나의 부호화 단위의 부호화된 영상 데이터가 복호화단으로 전송될 수 있다. 또한, 부호화 단위를 분할하는 블록 형태 정보 및 블록 분할 정보, 부호화 단위의 예측 모드에 대한 정보, 변환 단위의 크기 정보, 형태 정보, 분할 정보 등이 부호화된 영상 데이터와 함께 복호화단으로 전송될 수 있다.
도 9는 일 실시예에 따른 영상 복호화 방법을 설명하기 위한 흐름도이다.
단계 S910에서, 부호화된 영상의 비트스트림이 수신된다. 비트스트림에는 부호화 단위를 분할하는 블록 형태 정보 및 블록 분할 정보, 부호화 단위의 예측 모드에 대한 정보, 변환 단위의 크기 정보, 형태 정보, 분할 정보 등이 부호화된 영상 데이터와 함께 포함될 수 있다.
단계 S920에서, 비트스트림으로부터 획득된 분할 정보를 이용하여 픽처 내의 하나 이상의 블록이 결정된다. 분할 정보는 부호화 단위를 분할하는 블록 형태 정보 및 블록 분할 정보를 포함할 수 있다. 또한, 하나 이상의 블록은 정사각형 형태 또는 비-정사각형 형태일 수 있다.
단계 S930에서, 하나 이상의 블록 중 복호화된 블록을 나타내는 블록 맵이 결정된다. 블록 맵은 각각의 블록이 복호화될 때마다 업데이트될 수 있다. 또한, 블록 맵은 최대 부호화 단위 별로 생성될 수 있다. 또한, 블록 맵은 하나 이상의 블록에 대응하는 영역을 포함하고, 복호화된 블록에 대응하는 영역이 이용가능한 영역으로 설정되고, 복호화되지 않은 블록에 대응하는 영역이 이용가능하지 않은 영역으로 설정될 수 있다.
단계 S940에서, 블록 맵에 기초하여, 하나 이상의 블록 중 소정 스캔 순서에 따라 복호화를 수행할 현재 블록이 참조 가능한 주변 영역이 결정된다. 소정 스캔 순서는 래스터 스캔, Z 스캔, N 스캔, 우상향 대각 스캔, 수평적 스캔, 수직적 스캔 등 다양한 순서 중 하나일 수 있으며, 상기 스캔 순서들에 한정되는 것은 아니다.
단계 S950에서, 참조 가능한 주변 영역에 기초하여 현재 블록이 복호화된다.
이하, 도 10 내지 도 23을 참조하여 일 실시예에 따른 영상의 데이터 단위를 결정하는 방법이 상술된다.
도 10은 일 실시예에 따라 영상 복호화 장치(200)가 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보를 이용하여 부호화 단위의 형태를 결정할 수 있고, 분할 형태 정보를 이용하여 부호화 단위가 어떤 형태로 분할되는지를 결정할 수 있다. 즉, 영상 복호화 장치(200)가 이용하는 블록 형태 정보가 어떤 블록 형태를 나타내는지에 따라 분할 형태 정보가 나타내는 부호화 단위의 분할 방법이 결정될 수 있다.
일 실시예에 따라, 영상 복호화 장치(200)는 현재 부호화 단위가 정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 예를 들어 영상 복호화 장치(200)는 분할 형태 정보에 따라 정사각형의 부호화 단위를 분할하지 않을지, 수직으로 분할할지, 수평으로 분할할지, 4개의 부호화 단위로 분할할지 등을 결정할 수 있다. 도 10을 참조하면, 현재 부호화 단위(1000)의 블록 형태 정보가 정사각형의 형태를 나타내는 경우, 복호화부(1030)는 분할되지 않음을 나타내는 분할 형태 정보에 따라 현재 부호화 단위(1000)와 동일한 크기를 가지는 부호화 단위(1010a)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 정보에 기초하여 분할된 부호화 단위(1010b, 1010c, 1010d 등)를 결정할 수 있다.
도 10을 참조하면 영상 복호화 장치(200)는 일 실시예에 따라 수직방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수직방향으로 분할한 두개의 부호화 단위(1010b)를 결정할 수 있다. 영상 복호화 장치(200)는 수평방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수평방향으로 분할한 두개의 부호화 단위(1010c)를 결정할 수 있다. 영상 복호화 장치(200)는 수직방향 및 수평방향으로 분할됨을 나타내는 분할 형태 정보에 기초하여 현재 부호화 단위(1000)를 수직방향 및 수평방향으로 분할한 네개의 부호화 단위(1010d)를 결정할 수 있다. 다만 정사각형의 부호화 단위가 분할될 수 있는 분할 형태는 상술한 형태로 한정하여 해석되어서는 안되고, 분할 형태 정보가 나타낼 수 있는 다양한 형태가 포함될 수 있다. 정사각형의 부호화 단위가 분할되는 소정의 분할 형태들은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.
도 11은 일 실시예에 따라 영상 복호화 장치(200)가 비-정사각형의 형태인 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위가 비-정사각형 형태임을 나타내는 블록 형태 정보를 이용할 수 있다. 영상 복호화 장치(200)는 분할 형태 정보에 따라 비-정사각형의 현재 부호화 단위를 분할하지 않을지 소정의 방법으로 분할할지 여부를 결정할 수 있다. 도 11을 참조하면, 현재 부호화 단위(1100 또는 1150)의 블록 형태 정보가 비-정사각형의 형태를 나타내는 경우, 영상 복호화 장치(200)는 분할되지 않음을 나타내는 분할 형태 정보에 따라 현재 부호화 단위(1100 또는 1150)와 동일한 크기를 가지는 부호화 단위(1110 또는 1160)를 분할하지 않거나, 소정의 분할방법을 나타내는 분할 형태 정보에 따라 기초하여 분할된 부호화 단위(1120a, 1120b, 1130a, 1130b, 1130c, 1170a, 1170b, 1180a, 1180b, 1180c)를 결정할 수 있다. 비-정사각형의 부호화 단위가 분할되는 소정의 분할 방법은 이하에서 다양한 실시예를 통해 구체적으로 설명하도록 한다.
일 실시예에 따라 영상 복호화 장치(200)는 분할 형태 정보를 이용하여 부호화 단위가 분할되는 형태를 결정할 수 있고, 이 경우 분할 형태 정보는 부호화 단위가 분할되어 생성되는 적어도 하나의 부호화 단위의 개수를 나타낼 수 있다. 도 11를 참조하면 분할 형태 정보가 두개의 부호화 단위로 현재 부호화 단위(1100 또는 1150)가 분할되는 것을 나타내는 경우, 영상 복호화 장치(200)는 분할 형태 정보에 기초하여 현재 부호화 단위(1100 또는 1150)를 분할하여 현재 부호화 단위에 포함되는 두개의 부호화 단위(1120a, 11420b, 또는 1170a, 1170b)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)가 분할 형태 정보에 기초하여 비-정사각형의 형태의 현재 부호화 단위(1100 또는 1150)를 분할하는 경우, 비-정사각형의 현재 부호화 단위(1100 또는 1150)의 긴 변의 위치를 고려하여 현재 부호화 단위를 분할할 수 있다. 예를 들면, 영상 복호화 장치(200)는 현재 부호화 단위(1100 또는 1150)의 형태를 고려하여 현재 부호화 단위(1100 또는 1150)의 긴 변을 분할하는 방향으로 현재 부호화 단위(1100 또는 1150)를 분할하여 복수개의 부호화 단위를 결정할 수 있다.
일 실시예에 따라, 분할 형태 정보가 홀수개의 블록으로 부호화 단위를 분할하는 것을 나타내는 경우, 영상 복호화 장치(200)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있다. 예를 들면, 분할 형태 정보가 3개의 부호화 단위로 현재 부호화 단위(1100 또는 1150)를 분할하는 것을 나타내는 경우, 영상 복호화 장치(200)는 현재 부호화 단위(1100 또는 1150)를 3개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)로 분할할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있으며, 결정된 부호화 단위들의 크기 모두가 동일하지는 않을 수 있다. 예를 들면, 결정된 홀수개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c) 중 소정의 부호화 단위(1130b 또는 1180b)의 크기는 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)들과는 다른 크기를 가질 수도 있다. 즉, 현재 부호화 단위(1100 또는 1150)가 분할되어 결정될 수 있는 부호화 단위는 복수의 종류의 크기를 가질 수 있고, 경우에 따라서는 홀수개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)가 각각 서로 다른 크기를 가질 수도 있다.
일 실시예에 따라 분할 형태 정보가 홀수개의 블록으로 부호화 단위가 분할되는 것을 나타내는 경우, 영상 복호화 장치(200)는 현재 부호화 단위(1100 또는 1150)에 포함되는 홀수개의 부호화 단위를 결정할 수 있고, 나아가 영상 복호화 장치(200)는 분할하여 생성되는 홀수개의 부호화 단위들 중 적어도 하나의 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 도 11을 참조하면 영상 복호화 장치(200)는 현재 부호화 단위(1100 또는 1150)가 분할되어 생성된 3개의 부호화 단위(1130a, 1130b, 1130c, 1180a, 1180b, 1180c)들 중 중앙에 위치하는 부호화 단위(1130b, 1180b)에 대한 복호화 과정을 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)와 다르게 할 수 있다. 예를 들면, 영상 복호화 장치(200)는 중앙에 위치하는 부호화 단위(1130b, 1180b)에 대하여는 다른 부호화 단위(1130a, 1130c, 1180a, 1180c)와 달리 더 이상 분할되지 않도록 제한하거나, 소정의 횟수만큼만 분할되도록 제한할 수 있다.
도 12는 일 실시예에 따라 영상 복호화 장치(200)가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위를 분할하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1200)를 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 일 실시예에 따라 분할 형태 정보가 수평 방향으로 제1 부호화 단위(1200)를 분할하는 것을 나타내는 경우, 영상 복호화 장치(200)는 제1 부호화 단위(1200)를 수평 방향으로 분할하여 제2 부호화 단위(1210)를 결정할 수 있다. 일 실시예에 따라 이용되는 제1 부호화 단위, 제2 부호화 단위, 제3 부호화 단위는 부호화 단위 간의 분할 전후 관계를 이해하기 위해 이용된 용어이다. 예를 들면, 제1 부호화 단위를 분할하면 제2 부호화 단위가 결정될 수 있고, 제2 부호화 단위가 분할되면 제3 부호화 단위가 결정될 수 있다. 이하에서는 이용되는 제1 부호화 단위, 제2 부호화 단위 및 제3 부호화 단위의 관계는 상술한 특징에 따르는 것으로 이해될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 결정된 제2 부호화 단위(1210)를 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다. 도 12를 참조하면 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)를 분할하여 결정된 비-정사각형의 형태의 제2 부호화 단위(1210)를 적어도 하나의 제3 부호화 단위(1220a, 1220b, 1220c, 1220d 등)로 분할하거나 제2 부호화 단위(1210)를 분할하지 않을 수 있다. 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 획득할 수 있고 영상 복호화 장치(200)는 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)를 분할하여 다양한 형태의 복수개의 제2 부호화 단위(예를 들면, 1210)를 분할할 수 있으며, 제2 부호화 단위(1210)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1200)가 분할된 방식에 따라 분할될 수 있다.
일 실시예에 따라, 제1 부호화 단위(1200)가 제1 부호화 단위(1200)에 대한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제2 부호화 단위(1210)로 분할된 경우, 제2 부호화 단위(1210) 역시 제2 부호화 단위(1210)에 대한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제3 부호화 단위(예를 들면, 1220a, 1220b, 1220c, 1220d 등)으로 분할될 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 관련된 분할 형태 정보 및 블록 형태 정보 중 적어도 하나에 기초하여 재귀적으로 분할될 수 있다. 따라서 비-정사각형 형태의 부호화 단위에서 정사각형의 부호화 단위가 결정될 수 있고, 이러한 정사각형 형태의 부호화 단위가 재귀적으로 분할되어 비-정사각형 형태의 부호화 단위가 결정될 수도 있다. 도 12를 참조하면, 비-정사각형 형태의 제2 부호화 단위(1210)가 분할되어 결정되는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 소정의 부호화 단위(예를 들면, 가운데에 위치하는 부호화 단위 또는 정사각형 형태의 부호화 단위)는 재귀적으로 분할될 수 있다. 일 실시예에 따라 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 하나인 정사각형 형태의 제3 부호화 단위(1220c)는 수평 방향으로 분할되어 복수개의 제4 부호화 단위로 분할될 수 있다. 복수개의 제4 부호화 단위 중 하나인 비-정사각형 형태의 제4 부호화 단위(1240)는 다시 복수개의 부호화 단위들로 분할될 수 있다. 예를 들면, 비-정사각형 형태의 제4 부호화 단위(1240)는 홀수개의 부호화 단위(1250a, 1250b, 1250c)로 다시 분할될 수도 있다.
부호화 단위의 재귀적 분할에 이용될 수 있는 방법에 대하여는 다양한 실시예를 통해 후술하도록 한다.
일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제3 부호화 단위(1220a, 1220b, 1220c, 1220d 등) 각각을 부호화 단위들로 분할하거나 제2 부호화 단위(1210)를 분할하지 않는 것으로 결정할 수 있다. 영상 복호화 장치(200)는 일 실시예에 따라 비-정사각형 형태의 제2 부호화 단위(1210)를 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d)로 분할할 수 있다. 영상 복호화 장치(200)는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 소정의 제3 부호화 단위에 대하여 소정의 제한을 둘 수 있다. 예를 들면 영상 복호화 장치(200)는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d) 중 가운데에 위치하는 부호화 단위(1220c)에 대하여는 더 이상 분할되지 않는 것으로 제한하거나 또는 설정 가능한 횟수로 분할되어야 하는 것으로 제한할 수 있다. 도 12를 참조하면, 영상 복호화 장치(200)는 비-정사각형 형태의 제2 부호화 단위(1210)에 포함되는 홀수개의 제3 부호화 단위(1220b, 1220c, 1220d)들 중 가운데에 위치하는 부호화 단위(1220c)는 더 이상 분할되지 않거나, 소정의 분할 형태로 분할(예를 들면 4개의 부호화 단위로만 분할하거나 제2 부호화 단위(1210)가 분할된 형태에 대응하는 형태로 분할)되는 것으로 제한하거나, 소정의 횟수로만 분할(예를 들면 n회만 분할, n>0)하는 것으로 제한할 수 있다. 다만 가운데에 위치한 부호화 단위(1220c)에 대한 상기 제한은 단순한 실시예들에 불과하므로 상술한 실시예들로 제한되어 해석되어서는 안되고, 가운데에 위치한 부호화 단위(1220c)가 다른 부호화 단위(1220b, 1220d)와 다르게 복호화 될 수 있는 다양한 제한들을 포함하는 것으로 해석되어야 한다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위를 분할하기 위해 이용되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 현재 부호화 단위 내의 소정의 위치에서 획득할 수 있다.
도 13은 일 실시예에 따라 영상 복호화 장치(200)가 홀수개의 부호화 단위들 중 소정의 부호화 단위를 결정하기 위한 방법을 도시한다. 도 13을 참조하면, 현재 부호화 단위(1300)의 블록 형태 정보 및 분할 형태 정보 중 적어도 하나는 현재 부호화 단위(1300)에 포함되는 복수개의 샘플 중 소정 위치의 샘플(예를 들면, 가운데에 위치하는 샘플(1340))에서 획득될 수 있다. 다만 이러한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나가 획득될 수 있는 현재 부호화 단위(1300) 내의 소정 위치가 도 13에서 도시하는 가운데 위치로 한정하여 해석되어서는 안되고, 소정 위치에는 현재 부호화 단위(1300)내에 포함될 수 있는 다양한 위치(예를 들면, 최상단, 최하단, 좌측, 우측, 좌측상단, 좌측하단, 우측상단 또는 우측하단 등)가 포함될 수 있는 것으로 해석되어야 한다. 영상 복호화 장치(200)는 소정 위치로부터 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 획득하여 현재 부호화 단위를 다양한 형태 및 크기의 부호화 단위들로 분할하거나 분할하지 않는 것으로 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위가 소정의 개수의 부호화 단위들로 분할된 경우 그 중 하나의 부호화 단위를 선택할 수 있다. 복수개의 부호화 단위들 중 하나를 선택하기 위한 방법은 다양할 수 있으며, 이러한 방법들에 대한 설명은 이하의 다양한 실시예를 통해 후술하도록 한다.
일 실시예에 따라 영상 복호화 장치(200) 는 현재 부호화 단위를 복수개의 부호화 단위들로 분할하고, 소정 위치의 부호화 단위를 결정할 수 있다.
도 13은 일 실시예에 따라 영상 복호화 장치(200)가 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위한 방법을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 홀수개의 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 홀수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 도 13을 참조하면, 영상 복호화 장치(200)는 현재 부호화 단위(1300)를 분할하여 홀수개의 부호화 단위들(1320a, 1320b, 1320c)을 결정할 수 있다. 영상 복호화 장치(200)는 홀수개의 부호화 단위들(1320a, 1320b, 1320c)의 위치에 대한 정보를 이용하여 가운데 부호화 단위(1320b)를 결정할 수 있다. 예를 들면 영상 복호화 장치(200)는 부호화 단위들(1320a, 1320b, 1320c)에 포함되는 소정의 샘플의 위치를 나타내는 정보에 기초하여 부호화 단위들(1320a, 1320b, 1320c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 구체적으로, 영상 복호화 장치(200)는 부호화 단위들(1320a, 1320b, 1320c)의 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보에 기초하여 부호화 단위(1320a, 1320b, 1320c)의 위치를 결정함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다.
일 실시예에 따라 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 포함할 수 있다. 일 실시예에 따라 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 정보는 현재 부호화 단위(1300)에 포함되는 부호화단위(1320a, 1320b, 1320c)들의 너비 또는 높이를 나타내는 정보를 포함할 수 있고, 이러한 너비 또는 높이는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 좌표 간의 차이를 나타내는 정보에 해당할 수 있다. 즉, 영상 복호화 장치(200)는 부호화 단위(1320a, 1320b, 1320c)의 픽쳐 내에서의 위치 또는 좌표에 대한 정보를 직접이용하거나 좌표간의 차이값에 대응하는 부호화 단위의 너비 또는 높이에 대한 정보를 이용함으로써 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다.
일 실시예에 따라, 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 나타내는 정보는 (xa, ya) 좌표를 나타낼 수 있고, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 위치를 나타내는 정보는 (xb, yb) 좌표를 나타낼 수 있고, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 위치를 나타내는 정보는 (xc, yc) 좌표를 나타낼 수 있다. 영상 복호화 장치(200)는 부호화 단위(1320a, 1320b, 1320c)에 각각 포함되는 좌측 상단의 샘플(1330a, 1330b, 1330c)의 좌표를 이용하여 가운데 부호화 단위(1320b)를 결정할 수 있다. 예를 들면, 좌측 상단의 샘플(1330a, 1330b, 1330c)의 좌표를 오름차순 또는 내림차순으로 정렬하였을 때, 가운데에 위치하는 샘플(1330b)의 좌표인 (xb, yb)를 포함하는 부호화 단위(1320b)를 현재 부호화 단위(1300)가 분할되어 결정된 부호화 단위(1320a, 1320b, 1320c) 중 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 좌측 상단의 샘플(1330a, 1330b, 1330c)의 위치를 나타내는 좌표는 픽쳐 내에서의 절대적인 위치를 나타내는 좌표를 나타낼 수 있고, 나아가 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 기준으로, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 상대적 위치를 나타내는 정보인 (dxb, dyb)좌표, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 상대적 위치를 나타내는 정보인 (dxc, dyc)좌표를 이용할 수도 있다. 또한 부호화 단위에 포함되는 샘플의 위치를 나타내는 정보로서 해당 샘플의 좌표를 이용함으로써 소정 위치의 부호화 단위를 결정하는 방법이 상술한 방법으로 한정하여 해석되어서는 안되고, 샘플의 좌표를 이용할 수 있는 다양한 산술적 방법으로 해석되어야 한다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위(1300)를 복수개의 부호화 단위(1320a, 1320b, 1320c)로 분할할 수 있고, 부호화 단위(1320a, 1320b, 1320c)들 중 소정의 기준에 따라 부호화 단위를 선택할 수 있다. 예를 들면, 영상 복호화 장치(200)는 부호화 단위(1320a, 1320b, 1320c) 중 크기가 다른 부호화 단위(1320b)를 선택할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 상단 부호화 단위(1320a)의 좌측 상단의 샘플(1330a)의 위치를 나타내는 정보인 (xa, ya) 좌표, 가운데 부호화 단위(1320b)의 좌측 상단의 샘플(1330b)의 위치를 나타내는 정보인 (xb, yb) 좌표, 하단 부호화 단위(1320c)의 좌측 상단의 샘플(1330c)의 위치를 나타내는 정보인 (xc, yc) 좌표를 이용하여 부호화 단위(1320a, 1320b, 1320c) 각각의 너비 또는 높이를 결정할 수 있다. 영상 복호화 장치(200)는 부호화 단위(1320a, 1320b, 1320c)의 위치를 나타내는 좌표인 (xa, ya), (xb, yb), (xc, yc)를 이용하여 부호화 단위(1320a, 1320b, 1320c) 각각의 크기를 결정할 수 있다.
일 실시예에 따라, 영상 복호화 장치(200)는 상단 부호화 단위(1320a)의 너비를 xb-xa로 결정할 수 있고 높이를 yb-ya로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 가운데 부호화 단위(1320b)의 너비를 xc-xb로 결정할 수 있고 높이를 yc-yb로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 하단 부호화 단위의 너비 또는 높이는 현재 부호화 단위의 너비 또는 높이와 상단 부호화 단위(1320a) 및 가운데 부호화 단위(1320b)의 너비 및 높이를 이용하여 결정할 수 있다. 영상 복호화 장치(200)는 결정된 부호화 단위(1320a, 1320b, 1320c)의 너비 및 높이에 기초하여 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정할 수 있다. 도 13을 참조하면, 영상 복호화 장치(200)는 상단 부호화 단위(1320a) 및 하단 부호화 단위(1320c)의 크기와 다른 크기를 가지는 가운데 부호화 단위(1320b)를 소정 위치의 부호화 단위로 결정할 수 있다. 다만 상술한 영상 복호화 장치(200)가 다른 부호화 단위와 다른 크기를 갖는 부호화 단위를 결정하는 과정은 샘플 좌표에 기초하여 결정되는 부호화 단위의 크기를 이용하여 소정 위치의 부호화 단위를 결정하는 일 실시예에 불과하므로, 소정의 샘플 좌표에 따라 결정되는 부호화 단위의 크기를 비교하여 소정 위치의 부호화 단위를 결정하는 다양한 과정이 이용될 수 있다.
다만 부호화 단위의 위치를 결정하기 위하여 고려하는 샘플의 위치는 상술한 좌측 상단으로 한정하여 해석되어서는 안되고 부호화 단위에 포함되는 임의의 샘플의 위치에 대한 정보가 이용될 수 있는 것으로 해석될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위의 형태를 고려하여, 현재 부호화 단위가 분할되어 결정되는 홀수개의 부호화 단위들 중 소정 위치의 부호화 단위를 선택할 수 있다. 예를 들면, 현재 부호화 단위가 너비가 높이보다 긴 비-정사각형 형태라면 영상 복호화 장치(200)는 수평 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 영상 복호화 장치(200)는 수평 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다. 현재 부호화 단위가 높이가 너비보다 긴 비-정사각형 형태라면 영상 복호화 장치(200)는 수직 방향에 따라 소정 위치의 부호화 단위를 결정할 수 있다. 즉, 영상 복호화 장치(200)는 수직 방향으로 위치를 달리 하는 부호화 단위들 중 하나를 결정하여 해당 부호화 단위에 대한 제한을 둘 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 짝수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 짝수개의 부호화 단위들 각각의 위치를 나타내는 정보를 이용할 수 있다. 영상 복호화 장치(200)는 현재 부호화 단위를 분할하여 짝수개의 부호화 단위들을 결정할 수 있고 짝수개의 부호화 단위들의 위치에 대한 정보를 이용하여 소정 위치의 부호화 단위를 결정할 수 있다. 이에 대한 구체적인 과정은 도 13에서 상술한 홀수개의 부호화 단위들 중 소정 위치(예를 들면, 가운데 위치)의 부호화 단위를 결정하는 과정에 대응하는 과정일 수 있으므로 생략하도록 한다.
일 실시예에 따라, 비-정사각형 형태의 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여 분할 과정에서 소정 위치의 부호화 단위에 대한 소정의 정보를 이용할 수 있다. 예를 들면 영상 복호화 장치(200)는 현재 부호화 단위가 복수개로 분할된 부호화 단위들 중 가운데에 위치하는 부호화 단위를 결정하기 위하여 분할 과정에서 가운데 부호화 단위에 포함된 샘플에 저장된 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다.
도 13을 참조하면 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 현재 부호화 단위(1300)를 복수개의 부호화 단위들(1320a, 1320b, 1320c)로 분할할 수 있으며, 복수개의 부호화 단위들(1320a, 1320b, 1320c) 중 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 나아가 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나가 획득되는 위치를 고려하여, 가운데에 위치하는 부호화 단위(1320b)를 결정할 수 있다. 즉, 현재 부호화 단위(1300)의 블록 형태 정보 및 분할 형태 정보 중 적어도 하나는 현재 부호화 단위(1300)의 가운데에 위치하는 샘플(1340)에서 획득될 수 있으며, 상기 블록 형태 정보 및 상기 분할 형태 정보 중 적어도 하나에 기초하여 현재 부호화 단위(1300)가 복수개의 부호화 단위들(1320a, 1320b, 1320c)로 분할된 경우 상기 샘플(1340)을 포함하는 부호화 단위(1320b)를 가운데에 위치하는 부호화 단위로 결정할 수 있다. 다만 가운데에 위치하는 부호화 단위로 결정하기 위해 이용되는 정보가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나로 한정하여 해석되어서는 안되고, 다양한 종류의 정보가 가운데에 위치하는 부호화 단위를 결정하는 과정에서 이용될 수 있다.
일 실시예에 따라 소정 위치의 부호화 단위를 식별하기 위한 소정의 정보는, 결정하려는 부호화 단위에 포함되는 소정의 샘플에서 획득될 수 있다. 도 13을 참조하면, 영상 복호화 장치(200)는 현재 부호화 단위(1300)가 분할되어 결정된 복수개의 부호화 단위들(1320a, 1320b, 1320c) 중 소정 위치의 부호화 단위(예를 들면, 복수개로 분할된 부호화 단위 중 가운데에 위치하는 부호화 단위)를 결정하기 위하여 현재 부호화 단위(1300) 내의 소정 위치의 샘플(예를 들면, 현재 부호화 단위(1300)의 가운데에 위치하는 샘플)에서 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다. . 즉, 영상 복호화 장치(200)는 현재 부호화 단위(1300)의 블록 블록 형태를 고려하여 상기 소정 위치의 샘플을 결정할 수 있고, 영상 복호화 장치(200)는 현재 부호화 단위(1300)가 분할되어 결정되는 복수개의 부호화 단위(1320a, 1320b, 1320c)들 중, 소정의 정보(예를 들면, 블록 형태 정보 및 분할 형태 정보 중 적어도 하나)가 획득될 수 있는 샘플이 포함된 부호화 단위(1320b)를 결정하여 소정의 제한을 둘 수 있다. 도 13을 참조하면 일 실시예에 따라 영상 복호화 장치(200)는 소정의 정보가 획득될 수 있는 샘플로서 현재 부호화 단위(1300)의 가운데에 위치하는 샘플(1340)을 결정할 수 있고, 영상 복호화 장치(200)는 이러한 샘플(1340)이 포함되는 부호화 단위(1320b)를 복호화 과정에서의 소정의 제한을 둘 수 있다. 다만 소정의 정보가 획득될 수 있는 샘플의 위치는 상술한 위치로 한정하여 해석되어서는 안되고, 제한을 두기 위해 결정하려는 부호화 단위(1320b)에 포함되는 임의의 위치의 샘플들로 해석될 수 있다.
일 실시예에 따라 소정의 정보가 획득될 수 있는 샘플의 위치는 현재 부호화 단위(1300)의 형태에 따라 결정될 수 있다. 일 실시예에 따라 블록 형태 정보는 현재 부호화 단위의 형태가 정사각형인지 또는 비-정사각형인지 여부를 결정할 수 있고, 형태에 따라 소정의 정보가 획득될 수 있는 샘플의 위치를 결정할 수 있다. 예를 들면, 영상 복호화 장치(200)는 현재 부호화 단위의 너비에 대한 정보 및 높이에 대한 정보 중 적어도 하나를 이용하여 현재 부호화 단위의 너비 및 높이 중 적어도 하나를 반으로 분할하는 경계 상에 위치하는 샘플을 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다. 또다른 예를 들면, 영상 복호화 장치(200)는 현재 부호화 단위에 관련된 블록 형태 정보가 비-정사각형 형태임을 나타내는 경우, 현재 부호화 단위의 긴 변을 반으로 분할하는 경계에 인접하는 샘플 중 하나를 소정의 정보가 획득될 수 있는 샘플로 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위를 복수개의 부호화 단위로 분할한 경우, 복수개의 부호화 단위들 중 소정 위치의 부호화 단위를 결정하기 위하여, 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 부호화 단위에 포함된 소정 위치의 샘플에서 획득할 수 있고, 영상 복호화 장치(200)는 현재 부호화 단위가 분할되어 생성된 복수개의 부호화 단위들을 복수개의 부호화 단위 각각에 포함된 소정 위치의 샘플로부터 획득되는 분할 형태 정보 및 블록 형태 정보 중 적어도 하나를 이용하여 분할할 수 있다. 즉, 부호화 단위는 부호화 단위 각각에 포함된 소정 위치의 샘플에서 획득되는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용하여 재귀적으로 분할될 수 있다. 부호화 단위의 재귀적 분할 과정에 대하여는 도 12를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위를 분할하여 적어도 하나의 부호화 단위를 결정할 수 있고, 이러한 적어도 하나의 부호화 단위가 복호화되는 순서를 소정의 블록(예를 들면, 현재 부호화 단위)에 따라 결정할 수 있다.
도 14는 일 실시예에 따라 영상 복호화 장치(200)가 현재 부호화 단위를 분할하여 복수개의 부호화 단위들을 결정하는 경우, 복수개의 부호화 단위들이 처리되는 순서를 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보에 따라 제1 부호화 단위(1400)를 수직 방향으로 분할하여 제2 부호화 단위(1410a, 1410b)를 결정하거나 제1 부호화 단위(1400)를 수평 방향으로 분할하여 제2 부호화 단위(1430a, 1430b)를 결정하거나 제1 부호화 단위(1400)를 수직 방향 및 수평 방향으로 분할하여 제2 부호화 단위(1450a, 1450b, 1450c, 1450d)를 결정할 수 있다.
도 14를 참조하면, 영상 복호화 장치(200)는 제1 부호화 단위(1400)를 수직 방향으로 분할하여 결정된 제2 부호화 단위(1410a, 1410b)를 수평 방향(1410c)으로 처리되도록 순서를 결정할 수 있다. 영상 복호화 장치(200)는 제1 부호화 단위(1400)를 수평 방향으로 분할하여 결정된 제2 부호화 단위(1430a, 1430b)의 처리 순서를 수직 방향(1430c)으로 결정할 수 있다. 영상 복호화 장치(200)는 제1 부호화 단위(1400)를 수직 방향 및 수평 방향으로 분할하여 결정된 제2 부호화 단위(1450a, 1450b, 1450c, 1450d)를 하나의 행에 위치하는 부호화 단위들이 처리된 후 다음 행에 위치하는 부호화 단위들이 처리되는 소정의 순서(예를 들면, 래스터 스캔 순서((raster scan order) 또는 z 스캔 순서(z scan order)(1450e) 등)에 따라 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 부호화 단위들을 재귀적으로 분할할 수 있다. 도 14를 참조하면, 영상 복호화 장치(200)는 제1 부호화 단위(1400)를 분할하여 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)을 결정할 수 있고, 결정된 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d) 각각을 재귀적으로 분할할 수 있다. 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)을 분할하는 방법은 제1 부호화 단위(1400)를 분할하는 방법에 대응하는 방법이 될 수 있다. 이에 따라 복수개의 부호화 단위들(1410a, 1410b, 1430a, 1430b, 1450a, 1450b, 1450c, 1450d)은 각각 독립적으로 복수개의 부호화 단위들로 분할될 수 있다. 도 14를 참조하면 영상 복호화 장치(200)는 제1 부호화 단위(1400)를 수직 방향으로 분할하여 제2 부호화 단위(1410a, 1410b)를 결정할 수 있고, 나아가 제2 부호화 단위(1410a, 1410b) 각각을 독립적으로 분할하거나 분할하지 않는 것으로 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 좌측의 제2 부호화 단위(1410a)를 수평 방향으로 분할하여 제3 부호화 단위(1420a, 1420b)로 분할할 수 있고, 우측의 제2 부호화 단위(1410b)는 분할하지 않을 수 있다.
일 실시예에 따라 부호화 단위들의 처리 순서는 부호화 단위의 분할 과정에 기초하여 결정될 수 있다. 다시 말해, 분할된 부호화 단위들의 처리 순서는 분할되기 직전의 부호화 단위들의 처리 순서에 기초하여 결정될 수 있다. 영상 복호화 장치(200)는 좌측의 제2 부호화 단위(1410a)가 분할되어 결정된 제3 부호화 단위(1420a, 1420b)가 처리되는 순서를 우측의 제2 부호화 단위(1410b)와 독립적으로 결정할 수 있다. 좌측의 제2 부호화 단위(1410a)가 수평 방향으로 분할되어 제3 부호화 단위(1420a, 1420b)가 결정되었으므로 제3 부호화 단위(1420a, 1420b)는 수직 방향(1420c)으로 처리될 수 있다. 또한 좌측의 제2 부호화 단위(1410a) 및 우측의 제2 부호화 단위(1410b)가 처리되는 순서는 수평 방향(1410c)에 해당하므로, 좌측의 제2 부호화 단위(1410a)에 포함되는 제3 부호화 단위(1420a, 1420b)가 수직 방향(1420c)으로 처리된 후에 우측 부호화 단위(1410b)가 처리될 수 있다. 상술한 내용은 부호화 단위들이 각각 분할 전의 부호화 단위에 따라 처리 순서가 결정되는 과정을 설명하기 위한 것이므로, 상술한 실시예에 한정하여 해석되어서는 안되고, 다양한 형태로 분할되어 결정되는 부호화 단위들이 소정의 순서에 따라 독립적으로 처리될 수 있는 다양한 방법으로 이용되는 것으로 해석되어야 한다.
도 15는 일 실시예에 따라 영상 복호화 장치(200)가 소정의 순서로 부호화 단위가 처리될 수 없는 경우, 현재 부호화 단위가 홀수개의 부호화 단위로 분할되는 것임을 결정하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 획득된 블록 형태 정보 및 분할 형태 정보에 기초하여 현재 부호화 단위가 홀수개의 부호화 단위들로 분할되는 것을 결정할 수 있다. 도 15를 참조하면 정사각형 형태의 제1 부호화 단위(1500)가 비-정사각형 형태의 제2 부호화 단위(1510a, 1510b)로 분할될 수 있고, 제2 부호화 단위(1510a, 1510b)는 각각 독립적으로 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)로 분할될 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 제2 부호화 단위 중 좌측 부호화 단위(1510a)는 수평 방향으로 분할하여 복수개의 제3 부호화 단위(1520a, 1520b)를 결정할 수 있고, 우측 부호화 단위(1510b)는 홀수개의 제3 부호화 단위(1520c, 1520d, 1520e)로 분할할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 제3 부호화 단위들(1520a, 1520b, 1520c, 1520d, 1520e)이 소정의 순서로 처리될 수 있는지 여부를 판단하여 홀수개로 분할된 부호화 단위가 존재하는지를 결정할 수 있다. 도 15를 참조하면, 영상 복호화 장치(200)는 제1 부호화 단위(1500)를 재귀적으로 분할하여 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)를 결정할 수 있다. 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여, 제1 부호화 단위(1500), 제2 부호화 단위(1510a, 1510b) 또는 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)가 분할되는 형태 중 홀수개의 부호화 단위로 분할되는지 여부를 결정할 수 있다. 예를 들면, 제2 부호화 단위(1510a, 1510b) 중 우측에 위치하는 부호화 단위가 홀수개의 제3 부호화 단위(1520c, 1520d, 1520e)로 분할될 수 있다. 제1 부호화 단위(1500)에 포함되는 복수개의 부호화 단위들이 처리되는 순서는 소정의 순서(예를 들면, z-스캔 순서(z-scan order)(1530))가 될 수 있고, 영상 복호화 장치(200)는 우측 제2 부호화 단위(1510b)가 홀수개로 분할되어 결정된 제3 부호화 단위(1520c, 1520d, 1520e)가 상기 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 판단할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 제1 부호화 단위(1500)에 포함되는 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제3 부호화 단위(1520a, 1520b, 1520c, 1520d, 1520e)의 경계에 따라 제2 부호화 단위(1510a, 1510b)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 예를 들면 비-정사각형 형태의 좌측 제2 부호화 단위(1510a)의 높이를 반으로 분할하여 결정되는 제3 부호화 단위(1520a, 1520b)는 조건을 만족하지만, 우측 제2 부호화 단위(1510b)를 3개의 부호화 단위로 분할하여 결정되는 제3 부호화 단위(1520c, 1520d, 1520e)들의 경계가 우측 제2 부호화 단위(1510b)의 너비 또는 높이를 반으로 분할하지 못하므로 제3 부호화 단위(1520c, 1520d, 1520e)는 조건을 만족하지 못하는 것으로 결정될 수 있고, 영상 복호화 장치(200)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 우측 제2 부호화 단위(1510b)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
도 16은 일 실시예에 따라 영상 복호화 장치(200)가 제1 부호화 단위(1600)를 분할하여 적어도 하나의 부호화 단위를 결정하는 과정을 도시한다. 일 실시예에 따라 영상 복호화 장치(200)는 수신부(210)를 통해 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1600)를 분할할 수 있다. 정사각형 형태의 제1 부호화 단위(1600)는 4개의 정사각형 형태를 가지는 부호화 단위로 분할되거나 또는 비-정사각형 형태의 복수개의 부호화 단위로 분할할 수 있다. 예를 들면 도 16을 참조하면, 블록 형태 정보가 제1 부호화 단위(1600)는 정사각형임을 나타내고 분할 형태 정보가 비-정사각형의 부호화 단위로 분할됨을 나타내는 경우 영상 복호화 장치(200)는 제1 부호화 단위(1600)를 복수개의 비-정사각형의 부호화 단위들로 분할할 수 있다. 구체적으로, 분할 형태 정보가 제1 부호화 단위(1600)를 수평 방향 또는 수직 방향으로 분할하여 홀수개의 부호화 단위를 결정하는 것을 나타내는 경우, 영상 복호화 장치(200)는 정사각형 형태의 제1 부호화 단위(1600)을 홀수개의 부호화 단위들로서 수직 방향으로 분할되어 결정된 제2 부호화 단위(1610a, 1610b, 1610c) 또는 수평 방향으로 분할되어 결정된 제2 부호화 단위(1620a, 1620b, 1620c)로 분할할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 제1 부호화 단위(1600)에 포함되는 제2 부호화 단위(1610a, 1610b, 1610c, 1620a, 1620b, 1620c)가 소정의 순서에 따라 처리될 수 있는 조건을 만족하는지를 결정할 수 있으며, 상기 조건은 제2 부호화 단위(1610a, 1610b, 1610c, 1620a, 1620b, 1620c)의 경계에 따라 제1 부호화 단위(1600)의 너비 및 높이 중 적어도 하나를 반으로 분할되는지 여부와 관련된다. 도 16를 참조하면 정사각형 형태의 제1 부호화 단위(1600)를 수직 방향으로 분할하여 결정되는 제2 부호화 단위(1610a, 1610b, 1610c)들의 경계가 제1 부호화 단위(1600)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(1600)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 또한 정사각형 형태의 제1 부호화 단위(1600)를 수평 방향으로 분할하여 결정되는 제2 부호화 단위(1620a, 1620b, 1620c)들의 경계가 제1 부호화 단위(1600)의 너비를 반으로 분할하지 못하므로 제1 부호화 단위(1600)는 소정의 순서에 따라 처리될 수 있는 조건을 만족하지 못하는 것으로 결정될 수 있다. 영상 복호화 장치(200)는 이러한 조건 불만족의 경우 스캔 순서의 단절(disconnection)로 판단하고, 판단 결과에 기초하여 제1 부호화 단위(1600)는 홀수개의 부호화 단위로 분할되는 것으로 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 홀수개의 부호화 단위로 분할되는 경우 분할된 부호화 단위들 중 소정 위치의 부호화 단위에 대하여 소정의 제한을 둘 수 있으며, 이러한 제한 내용 또는 소정 위치 등에 대하여는 다양한 실시예를 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라, 영상 복호화 장치(200)는 제1 부호화 단위를 분할하여 다양한 형태의 부호화 단위들을 결정할 수 있다.
도 16을 참조하면, 영상 복호화 장치(200)는 정사각형 형태의 제1 부호화 단위(1600), 비-정사각형 형태의 제1 부호화 단위(1630 또는 1650)를 다양한 형태의 부호화 단위들로 분할할 수 있다.
도 17은 일 실시예에 따라 영상 복호화 장치(200)가 제1 부호화 단위(1700)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위가 소정의 조건을 만족하는 경우 제2 부호화 단위가 분할될 수 있는 형태가 제한되는 것을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 수신부(210)를 통해 획득한 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 정사각형 형태의 제1 부호화 단위(1700)를 비-정사각형 형태의 제2 부호화 단위(1710a, 1710b, 1720a, 1720b)로 분할하는 것으로 결정할 수 있다. 제2 부호화 단위(1710a, 1710b, 1720a, 1720b)는 독립적으로 분할될 수 있다. 이에 따라 영상 복호화 장치(200)는 제2 부호화 단위(1710a, 1710b, 1720a, 1720b) 각각에 관련된 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 복수개의 부호화 단위로 분할하거나 분할하지 않는 것을 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 수직 방향으로 제1 부호화 단위(1700)가 분할되어 결정된 비-정사각형 형태의 좌측 제2 부호화 단위(1710a)를 수평 방향으로 분할하여 제3 부호화 단위(1712a, 1712b)를 결정할 수 있다. 다만 영상 복호화 장치(200)는 좌측 제2 부호화 단위(1710a)를 수평 방향으로 분할한 경우, 우측 제2 부호화 단위(1710b)는 좌측 제2 부호화 단위(1710a)가 분할된 방향과 동일하게 수평 방향으로 분할될 수 없도록 제한할 수 있다. 만일 우측 제2 부호화 단위(1710b)가 동일한 방향으로 분할되어 제3 부호화 단위(1714a, 1714b)가 결정된 경우, 좌측 제2 부호화 단위(1710a) 및 우측 제2 부호화 단위(1710b)가 수평 방향으로 각각 독립적으로 분할됨으로써 제3 부호화 단위(1712a, 1712b, 1714a, 1714b)가 결정될 수 있다. 하지만 이는 영상 복호화 장치(200)가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1700)를 4개의 정사각형 형태의 제2 부호화 단위(1730a, 1730b, 1730c, 1730d)로 분할한 것과 동일한 결과이며 이는 영상 복호화 측면에서 비효율적일 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 수평 방향으로 제1 부호화 단위(11300)가 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1720a 또는 1720b)를 수직 방향으로 분할하여 제3 부호화 단위(1722a, 1722b, 1724a, 1724b)를 결정할 수 있다. 다만 영상 복호화 장치(200)는 제2 부호화 단위 중 하나(예를 들면 상단 제2 부호화 단위(1720a))를 수직 방향으로 분할한 경우, 상술한 이유에 따라 다른 제2 부호화 단위(예를 들면 하단 부호화 단위(1720b))는 상단 제2 부호화 단위(1720a)가 분할된 방향과 동일하게 수직 방향으로 분할될 수 없도록 제한할 수 있다.
도 18은 일 실시예에 따라 분할 형태 정보가 4개의 정사각형 형태의 부호화 단위로 분할하는 것을 나타낼 수 없는 경우, 영상 복호화 장치(200)가 정사각형 형태의 부호화 단위를 분할하는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1800)를 분할하여 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 결정할 수 있다. 분할 형태 정보에는 부호화 단위가 분할될 수 있는 다양한 형태에 대한 정보가 포함될 수 있으나, 다양한 형태에 대한 정보에는 정사각형 형태의 4개의 부호화 단위로 분할하기 위한 정보가 포함될 수 없는 경우가 있다. 이러한 분할 형태 정보에 따르면, 영상 복호화 장치(200)는 정사각형 형태의 제1 부호화 단위(1800)를 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할하지 못한다. 분할 형태 정보에 기초하여 영상 복호화 장치(200)는 비-정사각형 형태의 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 비-정사각형 형태의 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등)를 각각 독립적으로 분할할 수 있다. 재귀적인 방법을 통해 제2 부호화 단위(1810a, 1810b, 1820a, 1820b 등) 각각이 소정의 순서대로 분할될 수 있으며, 이는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 제1 부호화 단위(1800)가 분할되는 방법에 대응하는 분할 방법일 수 있다.
예를 들면 영상 복호화 장치(200)는 좌측 제2 부호화 단위(1810a)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1812a, 1812b)를 결정할 수 있고, 우측 제2 부호화 단위(1810b)가 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1814a, 1814b)를 결정할 수 있다. 나아가 영상 복호화 장치(200)는 좌측 제2 부호화 단위(1810a) 및 우측 제2 부호화 단위(1810b) 모두 수평 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1816a, 1816b, 1816c, 1816d)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1800)가 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.
또 다른 예를 들면 영상 복호화 장치(200)는 상단 제2 부호화 단위(1820a)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1822a, 1822b)를 결정할 수 있고, 하단 제2 부호화 단위(1820b)가 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1824a, 1824b)를 결정할 수 있다. 나아가 영상 복호화 장치(200)는 상단 제2 부호화 단위(1820a) 및 하단 제2 부호화 단위(1820b) 모두 수직 방향으로 분할되어 정사각형 형태의 제3 부호화 단위(1822a, 1822b, 1824a, 1824b)를 결정할 수도 있다. 이러한 경우 제1 부호화 단위(1800)가 4개의 정사각형 형태의 제2 부호화 단위(1830a, 1830b, 1830c, 1830d)로 분할된 것과 동일한 형태로 부호화 단위가 결정될 수 있다.
도 19는 일 실시예에 따라 복수개의 부호화 단위들 간의 처리 순서가 부호화 단위의 분할 과정에 따라 달라질 수 있음을 도시한 것이다.
일 실시예에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보에 기초하여 제1 부호화 단위(1900)를 분할할 수 있다. 블록 형태 정보가 정사각형 형태를 나타내고, 분할 형태 정보가 제1 부호화 단위(1900)가 수평 방향 및 수직 방향 중 적어도 하나의 방향으로 분할됨을 나타내는 경우, 영상 복호화 장치(200)는 제1 부호화 단위(1900)를 분할하여 제2 부호화 단위(예를 들면, 1910a, 1910b, 1920a, 1920b, 1930a, 1930b, 1930c, 1930d 등)를 결정할 수 있다. 도 19를 참조하면 제1 부호화 단위1900)가 수평 방향 또는 수직 방향만으로 분할되어 결정된 비-정사각형 형태의 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)는 각각에 대한 블록 형태 정보 및 분할 형태 정보에 기초하여 독립적으로 분할될 수 있다. 예를 들면 영상 복호화 장치(200)는 제1 부호화 단위(1900)가 수직 방향으로 분할되어 생성된 제2 부호화 단위(1910a, 1910b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 결정할 수 있고, 제1 부호화 단위(1900)가 수평 방향으로 분할되어 생성된 제2 부호화 단위(1920a, 1920b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 결정할 수 있다. 이러한 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)의 분할 과정은 도 17과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 영상 복호화 장치(200)는 소정의 순서에 따라 부호화 단위를 처리할 수 있다. 소정의 순서에 따른 부호화 단위의 처리에 대한 특징은 도 14과 관련하여 상술하였으므로 자세한 설명은 생략하도록 한다. 도 19를 참조하면 영상 복호화 장치(200)는 정사각형 형태의 제1 부호화 단위(1900)를 분할하여 4개의 정사각형 형태의 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)를 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 제1 부호화 단위(1900)가 분할되는 형태에 따라 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)의 처리 순서를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 수직 방향으로 분할되어 생성된 제2 부호화 단위(1910a, 1910b)를 수평 방향으로 각각 분할하여 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 결정할 수 있고, 영상 복호화 장치(200)는 좌측 제2 부호화 단위(1910a)에 포함되는 제3 부호화 단위(1916a, 1916b)를 수직 방향으로 먼저 처리한 후, 우측 제2 부호화 단위(1910b)에 포함되는 제3 부호화 단위(1916c, 1916d)를 수직 방향으로 처리하는 순서(1917)에 따라 제3 부호화 단위(1916a, 1916b, 1916c, 1916d)를 처리할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 수평 방향으로 분할되어 생성된 제2 부호화 단위(1920a, 1920b)를 수직 방향으로 각각 분할하여 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 결정할 수 있고, 영상 복호화 장치(200)는 상단 제2 부호화 단위(1920a)에 포함되는 제3 부호화 단위(1926a, 1926b)를 수평 방향으로 먼저 처리한 후, 하단 제2 부호화 단위(1920b)에 포함되는 제3 부호화 단위(1926c, 1926d)를 수평 방향으로 처리하는 순서(1927)에 따라 제3 부호화 단위(1926a, 1926b, 1926c, 1926d)를 처리할 수 있다.
도 19를 참조하면, 제2 부호화 단위(1910a, 1910b, 1920a, 1920b)가 각각 분할되어 정사각형 형태의 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)가 결정될 수 있다. 수직 방향으로 분할되어 결정된 제2 부호화 단위(1910a, 1910b) 및 수평 방향으로 분할되어 결정된 제2 부호화 단위(1920a, 1920b)는 서로 다른 형태로 분할된 것이지만, 이후에 결정되는 제3 부호화 단위(1916a, 1916b, 1916c, 1916d, 1926a, 1926b, 1926c, 1926d)에 따르면 결국 동일한 형태의 부호화 단위들로 제1 부호화 단위(1900)가 분할된 결과가 된다. 이에 따라 영상 복호화 장치(200)는 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 상이한 과정을 통해 재귀적으로 부호화 단위를 분할함으로써 결과적으로 동일한 형태의 부호화 단위들을 결정하더라도, 동일한 형태로 결정된 복수개의 부호화 단위들을 서로 다른 순서로 처리할 수 있다.
도 20은 일 실시예에 따라 부호화 단위가 재귀적으로 분할되어 복수개의 부호화 단위가 결정되는 경우, 부호화 단위의 형태 및 크기가 변함에 따라 부호화 단위의 심도가 결정되는 과정을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 부호화 단위의 심도를 소정의 기준에 따라 결정할 수 있다. 예를 들면 소정의 기준은 부호화 단위의 긴 변의 길이가 될 수 있다. 영상 복호화 장치(200)는 현재 부호화 단위의 긴 변의 길이가 분할되기 전의 부호화 단위의 긴 변의 길이보다 2n (n>0) 배로 분할된 경우, 현재 부호화 단위의 심도는 분할되기 전의 부호화 단위의 심도보다 n만큼 심도가 증가된 것으로 결정할 수 있다. 이하에서는 심도가 증가된 부호화 단위를 하위 심도의 부호화 단위로 표현하도록 한다.
도 20을 참조하면, 일 실시예에 따라 정사각형 형태임을 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는 ′0: SQUARE′를 나타낼 수 있음)에 기초하여 영상 복호화 장치(200)는 정사각형 형태인 제1 부호화 단위(2000)를 분할하여 하위 심도의 제2 부호화 단위(2002), 제3 부호화 단위(2004) 등을 결정할 수 있다. 정사각형 형태의 제1 부호화 단위(2000)의 크기를 2Nx2N이라고 한다면, 제1 부호화 단위(2000)의 너비 및 높이를 1/21배로 분할하여 결정된 제2 부호화 단위(2002)는 NxN의 크기를 가질 수 있다. 나아가 제2 부호화 단위(2002)의 너비 및 높이를 1/2크기로 분할하여 결정된 제3 부호화 단위(2004)는 N/2xN/2의 크기를 가질 수 있다. 이 경우 제3 부호화 단위(2004)의 너비 및 높이는 제1 부호화 단위(2000)의 1/22배에 해당한다. 제1 부호화 단위(2000)의 심도가 D인 경우 제1 부호화 단위(2000)의 너비 및 높이의 1/21배인 제2 부호화 단위(2002)의 심도는 D+1일 수 있고, 제1 부호화 단위(2000)의 너비 및 높이의 1/22배인 제3 부호화 단위(2004)의 심도는 D+2일 수 있다.
일 실시예에 따라 비-정사각형 형태를 나타내는 블록 형태 정보(예를 들면 블록 형태 정보는, 높이가 너비보다 긴 비-정사각형임을 나타내는 ′1: NS_VER′ 또는 너비가 높이보다 긴 비-정사각형임을 나타내는 ′2: NS_HOR′를 나타낼 수 있음)에 기초하여, 영상 복호화 장치(200)는 비-정사각형 형태인 제1 부호화 단위(2010 또는 2020)를 분할하여 하위 심도의 제2 부호화 단위(2012 또는 2022), 제3 부호화 단위(2014 또는 2024) 등을 결정할 수 있다.
영상 복호화 장치(200)는 Nx2N 크기의 제1 부호화 단위(2010)의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 2002, 2012, 2022 등)를 결정할 수 있다. 즉, 영상 복호화 장치(200)는 제1 부호화 단위(2010)를 수평 방향으로 분할하여 NxN 크기의 제2 부호화 단위(2002) 또는 NxN/2 크기의 제2 부호화 단위(2022)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 N/2xN 크기의 제2 부호화 단위(2012)를 결정할 수도 있다.
일 실시예에 따라 영상 복호화 장치(200)는 2NxN 크기의 제1 부호화 단위(2020) 의 너비 및 높이 중 적어도 하나를 분할하여 제2 부호화 단위(예를 들면, 2002, 2012, 2022 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(200)는 제1 부호화 단위(2020)를 수직 방향으로 분할하여 NxN 크기의 제2 부호화 단위(2002) 또는 N/2xN 크기의 제2 부호화 단위(2012)를 결정할 수 있고, 수평 방향 및 수직 방향으로 분할하여 NxN/2 크기의 제2 부호화 단위(2022)를 결정할 수도 있다.
일 실시예에 따라 영상 복호화 장치(200)는 NxN 크기의 제2 부호화 단위(2002) 의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(200)는 제2 부호화 단위(2002)를 수직 방향 및 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004)를 결정하거나 N/22xN/2 크기의 제3 부호화 단위(2014)를 결정하거나 N/2xN/22 크기의 제3 부호화 단위(2024)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 N/2xN 크기의 제2 부호화 단위(2012)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(200)는 제2 부호화 단위(2012)를 수평 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004) 또는 N/2xN/22 크기의 제3 부호화 단위(2024)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/22xN/2 크기의 제3 부호화 단위(2014)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 NxN/2 크기의 제2 부호화 단위(2014)의 너비 및 높이 중 적어도 하나를 분할하여 제3 부호화 단위(예를 들면, 2004, 2014, 2024 등)를 결정할 수도 있다. 즉, 영상 복호화 장치(200)는 제2 부호화 단위(2012)를 수직 방향으로 분할하여 N/2xN/2 크기의 제3 부호화 단위(2004) 또는 N/22xN/2 크기의 제3 부호화 단위(2014)를 결정하거나 수직 방향 및 수평 방향으로 분할하여 N/2xN/22크기의 제3 부호화 단위(2024)를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 정사각형 형태의 부호화 단위(예를 들면, 2000, 2002, 2004)를 수평 방향 또는 수직 방향으로 분할할 수 있다. 예를 들면, 2Nx2N 크기의 제1 부호화 단위(2000)를 수직 방향으로 분할하여 Nx2N 크기의 제1 부호화 단위(2010)를 결정하거나 수평 방향으로 분할하여 2NxN 크기의 제1 부호화 단위(2020)를 결정할 수 있다. 일 실시예에 따라 심도가 부호화 단위의 가장 긴 변의 길이에 기초하여 결정되는 경우, 2Nx2N 크기의 제1 부호화 단위(2000, 2002 또는 2004)가 수평 방향 또는 수직 방향으로 분할되어 결정되는 부호화 단위의 심도는 제1 부호화 단위(2000, 2002 또는 2004)의 심도와 동일할 수 있다.
일 실시예에 따라 제3 부호화 단위(2014 또는 2024)의 너비 및 높이는 제1 부호화 단위(2010 또는 2020)의 1/22배에 해당할 수 있다. 제1 부호화 단위(2010 또는 2020)의 심도가 D인 경우 제1 부호화 단위(2010 또는 2020)의 너비 및 높이의 1/2배인 제2 부호화 단위(2012 또는 2014)의 심도는 D+1일 수 있고, 제1 부호화 단위(2010 또는 2020)의 너비 및 높이의 1/22배인 제3 부호화 단위(2014 또는 2024)의 심도는 D+2일 수 있다.
도 21은 일 실시예에 따라 부호화 단위들의 형태 및 크기에 따라 결정될 수 있는 심도 및 부호화 단위 구분을 위한 인덱스(part index, 이하 PID)를 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 정사각형 형태의 제1 부호화 단위(2100)를 분할하여 다양한 형태의 제2 부호화 단위를 결정할 수 있다. 도 21를 참조하면, 영상 복호화 장치(200)는 분할 형태 정보에 따라 제1 부호화 단위(2100)를 수직 방향 및 수평 방향 중 적어도 하나의 방향으로 분할하여 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)를 결정할 수 있다. 즉, 영상 복호화 장치(200)는 제1 부호화 단위(2100)에 대한 분할 형태 정보에 기초하여 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)를 결정할 수 있다.
일 실시예에 따라 정사각형 형태의 제1 부호화 단위(2100)에 대한 분할 형태 정보에 따라 결정되는 제2 부호화 단위(2102a, 2102b, 2104a, 2104b, 2106a, 2106b, 2106c, 2106d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제1 부호화 단위(2100)의 한 변의 길이와 비-정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 긴 변의 길이가 동일하므로, 제1 부호화 단위(2100)와 비-정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 심도는 D로 동일하다고 볼 수 있다. 이에 반해 영상 복호화 장치(200)가 분할 형태 정보에 기초하여 제1 부호화 단위(2100)를 4개의 정사각형 형태의 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)로 분할한 경우, 정사각형 형태의 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)의 한 변의 길이는 제1 부호화 단위(2100)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(2106a, 2106b, 2106c, 2106d)의 심도는 제1 부호화 단위(2100)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 높이가 너비보다 긴 형태의 제1 부호화 단위(2110)를 분할 형태 정보에 따라 수평 방향으로 분할하여 복수개의 제2 부호화 단위(2112a, 2112b, 2114a, 2114b, 2114c)로 분할할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 너비가 높이보다 긴 형태의 제1 부호화 단위(2120)를 분할 형태 정보에 따라 수직 방향으로 분할하여 복수개의 제2 부호화 단위(2122a, 2122b, 2124a, 2124b, 2124c)로 분할할 수 있다.
일 실시예에 따라 비-정사각형 형태의 제1 부호화 단위(2110 또는 2120)에 대한 분할 형태 정보에 따라 결정되는 제2 부호화 단위(2112a, 2112b, 2114a, 2114b, 2116a, 2116b, 2116c, 2116d)는 긴 변의 길이에 기초하여 심도가 결정될 수 있다. 예를 들면, 정사각형 형태의 제2 부호화 단위(2112a, 2112b)의 한 변의 길이는 높이가 너비보다 긴 비-정사각형 형태의 제1 부호화 단위(2110)의 한 변의 길이의 1/2배이므로, 정사각형 형태의 제2 부호화 단위(2102a, 2102b, 2104a, 2104b)의 심도는 비-정사각형 형태의 제1 부호화 단위(2110)의 심도 D보다 한 심도 하위의 심도인 D+1이다.
나아가 영상 복호화 장치(200)가 분할 형태 정보에 기초하여 비-정사각형 형태의 제1 부호화 단위(2110)를 홀수개의 제2 부호화 단위(2114a, 2114b, 2114c)로 분할할 수 있다. 홀수개의 제2 부호화 단위(2114a, 2114b, 2114c)는 비-정사각형 형태의 제2 부호화 단위(2114a, 2114c) 및 정사각형 형태의 제2 부호화 단위(2114b)를 포함할 수 있다. 이 경우 비-정사각형 형태의 제2 부호화 단위(2114a, 2114c)의 긴 변의 길이 및 정사각형 형태의 제2 부호화 단위(2114b)의 한 변의 길이는 제1 부호화 단위(2110)의 한 변의 길이의 1/2배 이므로, 제2 부호화 단위(2114a, 2114b, 2114c)의 심도는 제1 부호화 단위(2110)의 심도인 D보다 한 심도 하위인 D+1의 심도일 수 있다. 영상 복호화 장치(200)는 제1 부호화 단위(2110)와 관련된 부호화 단위들의 심도를 결정하는 상기 방식에 대응하는 방식으로, 너비가 높이보다 긴 비-정사각형 형태의 제1 부호화 단위(2120)와 관련된 부호화 단위들의 심도를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 분할된 부호화 단위들의 구분을 위한 인덱스(PID)를 결정함에 있어서, 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 21를 참조하면, 홀수개로 분할된 부호화 단위들(2114a, 2114b, 2114c) 중 가운데에 위치하는 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)와 너비는 동일하지만 높이가 다른 부호화 단위들(2114a, 2114c)의 높이의 두 배일 수 있다. 즉, 이 경우 가운데에 위치하는 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)의 두 개를 포함할 수 있다. 따라서, 스캔 순서에 따라 가운데에 위치하는 부호화 단위(2114b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(2114c)는 인덱스가 2가 증가한 3일수 있다. 즉 인덱스의 값의 불연속성이 존재할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 이러한 분할된 부호화 단위들 간의 구분을 위한 인덱스의 불연속성의 존재 여부에 기초하여 홀수개로 분할된 부호화 단위들이 서로 동일한 크기가 아닌지 여부를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위로부터 분할되어 결정된 복수개의 부호화 단위들을 구분하기 위한 인덱스의 값에 기초하여 특정 분할 형태로 분할된 것인지를 결정할 수 있다. 도 21를 참조하면 영상 복호화 장치(200)는 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(2110)를 분할하여 짝수개의 부호화 단위(2112a, 2112b)를 결정하거나 홀수개의 부호화 단위(2114a, 2114b, 2114c)를 결정할 수 있다. 영상 복호화 장치(200)는 복수개의 부호화 단위 각각을 구분하기 위하여 각 부호화 단위를 나타내는 인덱스(PID)를 이용할 수 있다. 일 실시예에 따라 PID는 각각의 부호화 단위의 소정 위치의 샘플(예를 들면, 좌측 상단 샘플)에서 획득될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 부호화 단위의 구분을 위한 인덱스를 이용하여 분할되어 결정된 부호화 단위들 중 소정 위치의 부호화 단위를 결정할 수 있다. 일 실시예에 따라 높이가 너비보다 긴 직사각형 형태의 제1 부호화 단위(2110)에 대한 분할 형태 정보가 3개의 부호화 단위로 분할됨을 나타내는 경우 영상 복호화 장치(200)는 제1 부호화 단위(2110)를 3개의 부호화 단위(2114a, 2114b, 2114c)로 분할할 수 있다. 영상 복호화 장치(200)는 3개의 부호화 단위(2114a, 2114b, 2114c) 각각에 대한 인덱스를 할당할 수 있다. 영상 복호화 장치(200)는 홀수개로 분할된 부호화 단위 중 가운데 부호화 단위를 결정하기 위하여 각 부호화 단위에 대한 인덱스를 비교할 수 있다. 영상 복호화 장치(200)는 부호화 단위들의 인덱스에 기초하여 인덱스들 중 가운데 값에 해당하는 인덱스를 갖는 부호화 단위(2114b)를, 제1 부호화 단위(2110)가 분할되어 결정된 부호화 단위 중 가운데 위치의 부호화 단위로서 결정할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 분할된 부호화 단위들의 구분을 위한 인덱스를 결정함에 있어서, 부호화 단위들이 서로 동일한 크기가 아닌 경우, 부호화 단위들 간의 크기 비율에 기초하여 인덱스를 결정할 수 있다. 도 21를 참조하면, 제1 부호화 단위(2110)가 분할되어 생성된 부호화 단위(2114b)는 다른 부호화 단위들(2114a, 2114c)와 너비는 동일하지만 높이가 다른 부호화 단위들(2114a, 2114c)의 높이의 두 배일 수 있다. 이 경우 가운데에 위치하는 부호화 단위(2114b)의 인덱스(PID)가 1이라면 그 다음 순서에 위치하는 부호화 단위(2114c)는 인덱스가 2가 증가한 3일수 있다. 이러한 경우처럼 균일하게 인덱스가 증가하다가 증가폭이 달라지는 경우, 영상 복호화 장치(200)는 다른 부호화 단위들과 다른 크기를 가지는 부호화 단위를 포함하는 복수개의 부호화 단위로 분할된 것으로 결정할 수 있다, 일 실시예에 따라 분할 형태 정보가 홀수개의 부호화 단위로 분할됨을 나타내는 경우, 영상 복호화 장치(200)는 홀수개의 부호화 단위 중 소정 위치의 부호화 단위(예를 들면 가운데 부호화 단위)가 다른 부호화 단위와 크기가 다른 형태로 현재 부호화 단위를 분할할 수 있다. 이 경우 영상 복호화 장치(200)는 부호화 단위에 대한 인덱스(PID)를 이용하여 다른 크기를 가지는 가운데 부호화 단위를 결정할 수 있다. 다만 상술한 인덱스, 결정하고자 하는 소정 위치의 부호화 단위의 크기 또는 위치는 일 실시예를 설명하기 위해 특정한 것이므로 이에 한정하여 해석되어서는 안되며, 다양한 인덱스, 부호화 단위의 위치 및 크기가 이용될 수 있는 것으로 해석되어야 한다.
일 실시예에 따라 영상 복호화 장치(200)는 부호화 단위의 재귀적인 분할이 시작되는 소정의 데이터 단위를 이용할 수 있다.
도 22는 일 실시예에 따라 픽쳐에 포함되는 복수개의 소정의 데이터 단위에 따라 복수개의 부호화 단위들이 결정된 것을 도시한다.
일 실시예에 따라 소정의 데이터 단위는 부호화 단위가 블록 형태 정보 및 분할 형태 정보 중 적어도 하나를 이용하여 재귀적으로 분할되기 시작하는 데이터 단위로 정의될 수 있다. 즉, 현재 픽쳐를 분할하는 복수개의 부호화 단위들이 결정되는 과정에서 이용되는 최상위 심도의 부호화 단위에 해당할 수 있다. 이하에서는 설명 상 편의를 위해 이러한 소정의 데이터 단위를 기준 데이터 단위라고 지칭하도록 한다.
일 실시예에 따라 기준 데이터 단위는 소정의 크기 및 형태를 나타낼 수 있다. 일 실시예에 따라, 기준 부호화 단위는 MxN의 샘플들을 포함할 수 있다. 여기서 M 및 N은 서로 동일할 수도 있으며, 2의 승수로 표현되는 정수일 수 있다. 즉, 기준 데이터 단위는 정사각형 또는 비-정사각형의 형태를 나타낼 수 있으며, 이후에 정수개의 부호화 단위로 분할될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 픽쳐를 복수개의 기준 데이터 단위로 분할할 수 있다. 일 실시예에 따라 영상 복호화 장치(200)는 현재 픽쳐를 분할하는 복수개의 기준 데이터 단위를 각각의 기준 데이터 단위에 대한 분할 정보를 이용하여 분할할 수 있다. 이러한 기준 데이터 단위의 분할 과정은 쿼드 트리(quad-tree)구조를 이용한 분할 과정에 대응될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 픽쳐에 포함되는 기준 데이터 단위가 가질 수 있는 최소 크기를 미리 결정할 수 있다. 이에 따라, 영상 복호화 장치(200)는 최소 크기 이상의 크기를 갖는 다양한 크기의 기준 데이터 단위를 결정할 수 있고, 결정된 기준 데이터 단위를 기준으로 블록 형태 정보 및 분할 형태 정보를 이용하여 적어도 하나의 부호화 단위를 결정할 수 있다.
도 22를 참조하면, 영상 복호화 장치(200)는 정사각형 형태의 기준 부호화 단위(2200)를 이용할 수 있고, 또는 비-정사각형 형태의 기준 부호화 단위(2202)를 이용할 수도 있다. 일 실시예에 따라 기준 부호화 단위의 형태 및 크기는 적어도 하나의 기준 부호화 단위를 포함할 수 있는 다양한 데이터 단위(예를 들면, 시퀀스(sequence), 픽쳐(picture), 슬라이스(slice), 슬라이스 세그먼트(slice segment), 최대부호화단위 등)에 따라 결정될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)의 수신부(210)는 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보 중 적어도 하나를 상기 다양한 데이터 단위마다 비트스트림으로부터 획득할 수 있다. 정사각형 형태의 기준 부호화 단위(2200)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 10의 현재 부호화 단위(300)가 분할되는 과정을 통해 상술하였고, 비-정사각형 형태의 기준 부호화 단위(2200)에 포함되는 적어도 하나의 부호화 단위가 결정되는 과정은 도 11의 현재 부호화 단위(1100 또는 1150)가 분할되는 과정을 통해 상술하였으므로 자세한 설명은 생략하도록 한다.
일 실시예에 따라 영상 복호화 장치(200)는 소정의 조건에 기초하여 미리 결정되는 일부 데이터 단위에 따라 기준 부호화 단위의 크기 및 형태를 결정하기 위하여, 기준 부호화 단위의 크기 및 형태를 식별하기 위한 인덱스를 이용할 수 있다. 즉, 수신부(210)는 비트스트림으로부터 상기 다양한 데이터 단위(예를 들면, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 최대부호화단위 등) 중 소정의 조건(예를 들면 슬라이스 이하의 크기를 갖는 데이터 단위)을 만족하는 데이터 단위로서 슬라이스, 슬라이스 세그먼트, 최대부호화 단위 등 마다, 기준 부호화 단위의 크기 및 형태의 식별을 위한 인덱스만을 획득할 수 있다. 영상 복호화 장치(200)는 인덱스를 이용함으로써 상기 소정의 조건을 만족하는 데이터 단위마다 기준 데이터 단위의 크기 및 형태를 결정할 수 있다. 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 상대적으로 작은 크기의 데이터 단위마다 비트스트림으로부터 획득하여 이용하는 경우, 비트스트림의 이용 효율이 좋지 않을 수 있으므로, 기준 부호화 단위의 형태에 대한 정보 및 기준 부호화 단위의 크기에 대한 정보를 직접 획득하는 대신 상기 인덱스만을 획득하여 이용할 수 있다. 이 경우 기준 부호화 단위의 크기 및 형태를 나타내는 인덱스에 대응하는 기준 부호화 단위의 크기 및 형태 중 적어도 하나는 미리 결정되어 있을 수 있다. 즉, 영상 복호화 장치(200)는 미리 결정된 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 인덱스에 따라 선택함으로써, 인덱스 획득의 기준이 되는 데이터 단위에 포함되는 기준 부호화 단위의 크기 및 형태 중 적어도 하나를 결정할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 하나의 최대 부호화 단위에 포함하는 적어도 하나의 기준 부호화 단위를 이용할 수 있다. 즉, 영상을 분할하는 최대 부호화 단위에는 적어도 하나의 기준 부호화 단위가 포함될 수 있고, 각각의 기준 부호화 단위의 재귀적인 분할 과정을 통해 부호화 단위가 결정될 수 있다. 일 실시예에 따라 최대 부호화 단위의 너비 및 높이 중 적어도 하나는 기준 부호화 단위의 너비 및 높이 중 적어도 하나의 정수배에 해당할 수 있다. 일 실시예에 따라 기준 부호화 단위의 크기는 최대부호화단위를 쿼드 트리 구조에 따라 n번 분할한 크기일 수 있다. 즉, 영상 복호화 장치(200)는 최대부호화단위를 쿼드 트리 구조에 따라 n 번 분할하여 기준 부호화 단위를 결정할 수 있고, 다양한 실시예들에 따라 기준 부호화 단위를 블록 형태 정보 및 분할 형태 정보 중 적어도 하나에 기초하여 분할할 수 있다.
도 23은 일 실시예에 따라 픽쳐(2300)에 포함되는 기준 부호화 단위의 결정 순서를 결정하는 기준이 되는 프로세싱 블록을 도시한다.
일 실시예에 따라 영상 복호화 장치(200)는 픽쳐를 분할하는 적어도 하나의 프로세싱 블록을 결정할 수 있다. 프로세싱 블록이란, 영상을 분할하는 적어도 하나의 기준 부호화 단위를 포함하는 데이터 단위로서, 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위는 특정 순서대로 결정될 수 있다. 즉, 각각의 프로세싱 블록에서 결정되는 적어도 하나의 기준 부호화 단위의 결정 순서는 기준 부호화 단위가 결정될 수 있는 다양한 순서의 종류 중 하나에 해당할 수 있으며, 각각의 프로세싱 블록에서 결정되는 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록마다 결정되는 기준 부호화 단위의 결정 순서는 래스터 스캔(raster scan), Z 스캔(Z-scan), N 스캔(N-scan), 우상향 대각 스캔(up-right diagonal scan), 수평적 스캔(horizontal scan), 수직적 스캔(vertical scan) 등 다양한 순서 중 하나일 수 있으나, 결정될 수 있는 순서는 상기 스캔 순서들에 한정하여 해석되어서는 안 된다.
일 실시예에 따라 영상 복호화 장치(200)는 프로세싱 블록의 크기에 대한 정보를 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 영상 복호화 장치(200)는 프로세싱 블록의 크기에 대한 정보를 비트스트림으로부터 획득하여 영상에 포함되는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있다. 이러한 프로세싱 블록의 크기는 프로세싱 블록의 크기에 대한 정보가 나타내는 데이터 단위의 소정의 크기일 수 있다.
일 실시예에 따라 영상 복호화 장치(200)의 수신부(210)는 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 특정의 데이터 단위마다 획득할 수 있다. 예를 들면 프로세싱 블록의 크기에 대한 정보는 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트 등의 데이터 단위로 비트스트림으로부터 획득될 수 있다. 즉 수신부(210)는 상기 여러 데이터 단위마다 비트스트림으로부터 프로세싱 블록의 크기에 대한 정보를 획득할 수 있고 영상 복호화 장치(200)는 획득된 프로세싱 블록의 크기에 대한 정보를 이용하여 픽쳐를 분할하는 적어도 하나의 프로세싱 블록의 크기를 결정할 수 있으며, 이러한 프로세싱 블록의 크기는 기준 부호화 단위의 정수배의 크기일 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 픽쳐(2300)에 포함되는 프로세싱 블록(2302, 2312)의 크기를 결정할 수 있다. 예를 들면, 영상 복호화 장치(200)는 비트스트림으로부터 획득된 프로세싱 블록의 크기에 대한 정보에 기초하여 프로세싱 블록의 크기를 결정할 수 있다. 도 23을 참조하면, 영상 복호화 장치(200)는 일 실시예에 따라 프로세싱 블록(2302, 2312)의 가로크기를 기준 부호화 단위 가로크기의 4배, 세로크기를 기준 부호화 단위의 세로크기의 4배로 결정할 수 있다. 영상 복호화 장치(200)는 적어도 하나의 프로세싱 블록 내에서 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다.
일 실시예에 따라, 영상 복호화 장치(200)는 프로세싱 블록의 크기에 기초하여 픽쳐(2300)에 포함되는 각각의 프로세싱 블록(2302, 2312)을 결정할 수 있고, 프로세싱 블록(2302, 2312)에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서를 결정할 수 있다. 일 실시예에 따라 기준 부호화 단위의 결정은 기준 부호화 단위의 크기의 결정을 포함할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 비트스트림으로부터 적어도 하나의 프로세싱 블록에 포함되는 적어도 하나의 기준 부호화 단위의 결정 순서에 대한 정보를 획득할 수 있고, 획득한 결정 순서에 대한 정보에 기초하여 적어도 하나의 기준 부호화 단위가 결정되는 순서를 결정할 수 있다. 결정 순서에 대한 정보는 프로세싱 블록 내에서 기준 부호화 단위들이 결정되는 순서 또는 방향으로 정의될 수 있다. 즉, 기준 부호화 단위들이 결정되는 순서는 각각의 프로세싱 블록마다 독립적으로 결정될 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 특정 데이터 단위마다 기준 부호화 단위의 결정 순서에 대한 정보를 비트스트림으로부터 획득할 수 있다. 예를 들면, 수신부(210)는 기준 부호화 단위의 결정 순서에 대한 정보를 영상, 시퀀스, 픽쳐, 슬라이스, 슬라이스 세그먼트, 프로세싱 블록 등의 데이터 단위로마다 비트스트림으로부터 획득할 수 있다. 기준 부호화 단위의 결정 순서에 대한 정보는 프로세싱 블록 내에서의 기준 부호화 단위 결정 순서를 나타내므로, 결정 순서에 대한 정보는 정수개의 프로세싱 블록을 포함하는 특정 데이터 단위 마다 획득될 수 있다.
영상 복호화 장치(200)는 일 실시예에 따라 결정된 순서에 기초하여 적어도 하나의 기준 부호화 단위를 결정할 수 있다.
일 실시예에 따라 수신부(210)는 비트스트림으로부터 프로세싱 블록(2302, 2312)과 관련된 정보로서, 기준 부호화 단위 결정 순서에 대한 정보를 획득할 수 있고, 영상 복호화 장치(200)는 상기 프로세싱 블록(2302, 2312)에 포함된 적어도 하나의 기준 부호화 단위를 결정하는 순서를 결정하고 부호화 단위의 결정 순서에 따라 픽쳐(2300)에 포함되는 적어도 하나의 기준 부호화 단위를 결정할 수 있다. 도 23을 참조하면, 영상 복호화 장치(200)는 각각의 프로세싱 블록(2302, 2312)과 관련된 적어도 하나의 기준 부호화 단위의 결정 순서(2304, 2314)를 결정할 수 있다. 예를 들면, 기준 부호화 단위의 결정 순서에 대한 정보가 프로세싱 블록마다 획득되는 경우, 각각의 프로세싱 블록(2302, 2312)과 관련된 기준 부호화 단위 결정 순서는 프로세싱 블록마다 상이할 수 있다. 프로세싱 블록(2302)과 관련된 기준 부호화 단위 결정 순서(2304)가 래스터 스캔(raster scan)순서인 경우, 프로세싱 블록(2302)에 포함되는 기준 부호화 단위는 래스터 스캔 순서에 따라 결정될 수 있다. 이에 반해 다른 프로세싱 블록(2312)과 관련된 기준 부호화 단위 결정 순서(2314)가 래스터 스캔 순서의 역순인 경우, 프로세싱 블록(2312)에 포함되는 기준 부호화 단위는 래스터 스캔 순서의 역순에 따라 결정될 수 있다.
영상 복호화 장치(200)는 일 실시예에 따라, 결정된 적어도 하나의 기준 부호화 단위를 복호화할 수 있다. 영상 복호화 장치(200)는 상술한 실시예를 통해 결정된 기준 부호화 단위에 기초하여 영상을 복호화 할 수 있다. 기준 부호화 단위를 복호화 하는 방법은 영상을 복호화 하는 다양한 방법들을 포함할 수 있다.
일 실시예에 따라 영상 복호화 장치(200)는 현재 부호화 단위의 형태를 나타내는 블록 형태 정보 또는 현재 부호화 단위를 분할하는 방법을 나타내는 분할 형태 정보를 비트스트림으로부터 획득하여 이용할 수 있다. 블록 형태 정보 또는 분할 형태 정보는 다양한 데이터 단위와 관련된 비트스트림에 포함될 수 있다. 예를 들면, 영상 복호화 장치(200)는 시퀀스 파라미터 세트(sequence parameter set), 픽쳐 파라미터 세트(picture parameter set), 비디오 파라미터 세트(video parameter set), 슬라이스 헤더(slice header), 슬라이스 세그먼트 헤더(slice segment header)에 포함된 블록 형태 정보 또는 분할 형태 정보를 이용할 수 있다. 나아가, 영상 복호화 장치(200)는 최대 부호화 단위, 기준 부호화 단위, 프로세싱 블록마다 비트스트림으로부터 블록 형태 정보 또는 분할 형태 정보에 대응하는 신택스를 비트스트림으로부터 획득하여 이용할 수 있다.
이제까지 다양한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
한편, 상술한 본 발명의 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.

Claims (3)

  1. 상위 블록을 좌측 블록, 현재 블록, 및 우측 블록을 포함하는 복수 개의 블록들로 수직 방향으로 분할하는 단계;
    상기 상위 블록이 상기 수직 방향으로 분할되어 상기 현재 블록이 획득됨으로써, 상기 현재 블록이 상기 수직 방향으로 2개의 하위 블록들로 분할되지 않는 것으로 결정하는 단계;
    상기 현재 블록이 수평 방향으로 2개의 하위 블록들 또는 3개의 하위 블록들로 분할되는지 여부를 나타내는 분할 형태 정보를 획득하는 단계;
    상기 분할 형태 정보가 상기 현재 블록이 상기 수평 방향으로 상기 2개의 하위 블록들로 분할되는 것을 나타내면, 상기 현재 블록을 상기 수평 방향으로 제1 하위 블록과 제2 하위 블록으로 분할하는 단계;
    상기 제1 하위 블록이 복호화되면, 상기 제1 하위 블록이 주변 하위 블록으로 이용가능함을 나타내는 값으로 블록 맵을 업데이트하는 단계; 및
    상기 블록 맵을 이용하여 상기 제2 하위 블록을 복호화하는 단계를 포함하고,
    상기 블록 맵은 상기 상위 블록을 포함하는 최대 부호화 단위에 대하여 결정되는, 블록 맵을 이용한 영상 복호화 방법.
  2. 상위 블록을 좌측 블록, 현재 블록, 및 우측 블록을 포함하는 복수 개의 블록들로 수직 방향으로 분할하는 단계;
    상기 상위 블록이 상기 수직 방향으로 분할되어 상기 현재 블록이 획득됨으로써, 상기 현재 블록이 상기 수직 방향으로 2개의 하위 블록들로 분할되지 않는 것으로 결정하는 단계;
    상기 현재 블록이 수평 방향으로 2개의 하위 블록들 또는 3개의 하위 블록들로 분할되는지 여부를 나타내는 분할 형태 정보를 생성하는 단계;
    상기 분할 형태 정보가 상기 현재 블록이 상기 수평 방향으로 상기 2개의 하위 블록들로 분할되는 것을 나타내면, 상기 현재 블록을 상기 수평 방향으로 제1 하위 블록과 제2 하위 블록으로 분할하는 단계;
    상기 제1 하위 블록이 부호화되면, 상기 제1 하위 블록이 주변 하위 블록으로 이용가능함을 나타내는 값으로 블록 맵을 업데이트하는 단계; 및
    상기 블록 맵을 이용하여 상기 제2 하위 블록을 부호화하는 단계를 포함하고,
    상기 블록 맵은 상기 상위 블록을 포함하는 최대 부호화 단위에 대하여 결정되는, 블록 맵을 이용한 영상 부호화 방법.
  3. 비트스트림을 기록한 비-일시적 컴퓨터로 판독가능한 기록 매체에 있어서, 상기 비트스트림은,
    현재 블록의 분할 형태 정보를 포함하고,
    상기 현재 블록의 상기 분할 형태 정보는:
    상위 블록을 좌측 블록, 상기 현재 블록, 및 우측 블록을 포함하는 복수 개의 블록들로 수직 방향으로 분할하고;
    상기 상위 블록이 상기 수직 방향으로 분할되어 상기 현재 블록이 획득됨으로써, 상기 현재 블록이 상기 수직 방향으로 2개의 하위 블록들로 분할되지 않는 것으로 결정하고;
    상기 현재 블록이 수평 방향으로 2개의 하위 블록들 또는 3개의 하위 블록들로 분할되는지 여부를 나타내는 상기 분할 형태 정보를 생성하고;
    상기 분할 형태 정보가 상기 현재 블록이 상기 수평 방향으로 상기 2개의 하위 블록들로 분할되는 것을 나타내면, 상기 현재 블록을 상기 수평 방향으로 제1 하위 블록과 제2 하위 블록으로 분할하고;
    상기 제1 하위 블록이 부호화되면, 상기 제1 하위 블록이 주변 하위 블록으로 이용가능함을 나타내는 값으로 블록 맵을 업데이트하고;
    상기 블록 맵을 이용하여 상기 제2 하위 블록을 부호화;함으로써 획득되고,
    상기 블록 맵은 상기 상위 블록을 포함하는 최대 부호화 단위에 대하여 결정되는, 비-일시적 컴퓨터로 판독가능한 기록 매체.
KR1020237035181A 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치 KR102660093B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020247013016A KR20240056656A (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020227024031A KR102593443B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
PCT/KR2016/011289 WO2018070549A1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020227024031A Division KR102593443B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247013016A Division KR20240056656A (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20230148277A true KR20230148277A (ko) 2023-10-24
KR102660093B1 KR102660093B1 (ko) 2024-04-23

Family

ID=61905667

Family Applications (6)

Application Number Title Priority Date Filing Date
KR1020217008671A KR102283545B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020237035181A KR102660093B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020217023413A KR102421721B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020197008603A KR102233431B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020227024031A KR102593443B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020247013016A KR20240056656A (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020217008671A KR102283545B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Family Applications After (4)

Application Number Title Priority Date Filing Date
KR1020217023413A KR102421721B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020197008603A KR102233431B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020227024031A KR102593443B1 (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR1020247013016A KR20240056656A (ko) 2016-10-10 2016-10-10 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치

Country Status (5)

Country Link
US (1) US20190246101A1 (ko)
EP (2) EP3509302A4 (ko)
KR (6) KR102283545B1 (ko)
CN (5) CN110024396B (ko)
WO (1) WO2018070549A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3759928A1 (en) * 2018-02-26 2021-01-06 InterDigital VC Holdings, Inc. Gradient based boundary filtering in intra prediction
WO2020009960A1 (en) * 2018-07-02 2020-01-09 Futurewei Technologies, Inc. Method and apparatus for motion vector prediction
WO2020092535A1 (en) * 2018-10-31 2020-05-07 Interdigital Vc Holdings, Inc. Multi-reference line intra prediction and most probable mode

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8885707B2 (en) * 2005-04-01 2014-11-11 Panasonic Corporation Image decoding apparatus and image decoding method
JP5396600B2 (ja) * 2008-07-01 2014-01-22 オランジュ 改善された予測を実施する画像符号化方法および装置と、対応する復号化方法および装置と、信号およびコンピュータ・プログラム
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20110068793A (ko) * 2009-12-16 2011-06-22 한국전자통신연구원 영상 부호화 및 복호화를 위한 장치 및 방법
KR101379188B1 (ko) * 2010-05-17 2014-04-18 에스케이 텔레콤주식회사 인트라 블록 및 인터 블록이 혼합된 코딩블록을 이용하는 영상 부호화/복호화 장치 및 그 방법
SI2924995T1 (sl) * 2010-07-09 2018-10-30 Samsung Electronics Co., Ltd. Postopek za dekodiranje videa z uporabo združevanja blokov
KR20130002243A (ko) * 2011-06-28 2013-01-07 주식회사 케이티 블록 중첩을 이용한 화면 간 예측 방법 및 장치
BR112013033697A2 (pt) * 2011-07-01 2017-07-11 Samsung Electronics Co Ltd método de codificação de vídeo com previsão intra usando processo de verificação para possibilidade de referência unificada, método de decodificação de vídeo e seu dispositivo
US9736489B2 (en) * 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
CN108040259B (zh) * 2011-10-05 2022-02-01 太阳专利托管公司 图像编码方法以及图像编码装置
WO2013067942A1 (zh) * 2011-11-08 2013-05-16 华为技术有限公司 一种帧内预测方法和装置
JP6422011B2 (ja) * 2012-05-11 2018-11-14 サン パテント トラスト 動画像符号化方法、動画像復号化方法、動画像符号化装置および動画像復号化装置
AU2013285749B2 (en) * 2012-07-02 2016-06-16 Samsung Electronics Co., Ltd. Method and apparatus for predicting motion vector for coding video or decoding video
AU2013228045A1 (en) * 2013-09-13 2015-04-02 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
CN104717510B (zh) * 2013-12-13 2018-08-17 华为技术有限公司 用于图像处理的方法和装置
US10623767B2 (en) * 2015-10-19 2020-04-14 Lg Electronics Inc. Method for encoding/decoding image and device therefor
TWI820197B (zh) * 2018-08-28 2023-11-01 大陸商北京字節跳動網絡技術有限公司 與擴展四叉樹相關的分割的二值化
WO2020125490A1 (en) * 2018-12-18 2020-06-25 Mediatek Inc. Method and apparatus of encoding or decoding video blocks with constraints during block partitioning
CN114175657B (zh) * 2019-07-26 2023-12-26 北京字节跳动网络技术有限公司 基于块尺寸的图片分割模式确定
TWI751657B (zh) * 2019-08-23 2022-01-01 聯發科技股份有限公司 具有分割限制條件之小尺寸編碼單元分割方法和裝置
KR102649584B1 (ko) * 2019-09-21 2024-03-21 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 크로마 인트라 모드에 기초한 크기 제한
US11589044B2 (en) * 2019-10-14 2023-02-21 Hfi Innovation Inc. Video encoding and decoding with ternary-tree block partitioning
US11310497B2 (en) * 2019-11-15 2022-04-19 Qualcomm Incorporated Geometric partition mode with increased efficiency
US20210314567A1 (en) * 2020-04-04 2021-10-07 Qualcomm Incorporated Block partitioning for image and video coding

Also Published As

Publication number Publication date
CN116248873A (zh) 2023-06-09
KR20190039816A (ko) 2019-04-15
CN110024396B (zh) 2023-04-14
EP3509302A4 (en) 2019-09-25
KR20210035335A (ko) 2021-03-31
KR102421721B1 (ko) 2022-07-15
KR102283545B1 (ko) 2021-07-29
CN116248871A (zh) 2023-06-09
US20190246101A1 (en) 2019-08-08
KR102660093B1 (ko) 2024-04-23
WO2018070549A1 (ko) 2018-04-19
EP3509302A1 (en) 2019-07-10
KR20210095237A (ko) 2021-07-30
CN116248874A (zh) 2023-06-09
KR102233431B1 (ko) 2021-03-30
CN116248872A (zh) 2023-06-09
EP4167569A1 (en) 2023-04-19
KR102593443B1 (ko) 2023-10-24
KR20240056656A (ko) 2024-04-30
CN110024396A (zh) 2019-07-16
KR20220103825A (ko) 2022-07-22

Similar Documents

Publication Publication Date Title
EP3632104B1 (en) Motion vector refinement for multi-reference prediction
JP7247282B2 (ja) ピクチャ外郭線の符号化単位を符号化または復号する方法及びその装置
KR20180085714A (ko) 머지 후보 리스트를 이용한 비디오 복호화 방법 및 비디오 복호화 장치
JP7229774B2 (ja) ビデオコーディングのための動きベクトル予測のためのマージ候補
US10218998B2 (en) Method and apparatus for encoding/decoding images using a motion vector of a previous block as a motion vector for the current block
JP6272948B2 (ja) 動き情報の復号化方法
KR20180093950A (ko) 영상 부호화 방법 및 장치와 영상 복호화 방법 및 장치
KR20190092382A (ko) 인트라 예측에서 참조 샘플을 필터링하는 방법 및 장치
KR20190020161A (ko) 루마 블록 및 크로마 블록을 부호화 또는 복호화하는 방법 및 장치
KR102593443B1 (ko) 블록 맵을 이용하여 영상을 부호화 또는 복호화하는 방법 및 장치
KR20180067598A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20180107082A (ko) 비디오 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR20180075518A (ko) 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR20180075483A (ko) 픽셀의 기울기에 기초하여 인트라 또는 인터 예측 블록을 후처리하는 방법 및 장치
KR20190094467A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
KR20180075484A (ko) 영상을 부호화/복호화 하는 방법 및 그 장치
NZ760521B2 (en) Motion vector refinement for multi-reference prediction

Legal Events

Date Code Title Description
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant