KR20220165694A - 타일 구조의 구성 방법 및 이의 장치 - Google Patents

타일 구조의 구성 방법 및 이의 장치 Download PDF

Info

Publication number
KR20220165694A
KR20220165694A KR1020220162621A KR20220162621A KR20220165694A KR 20220165694 A KR20220165694 A KR 20220165694A KR 1020220162621 A KR1020220162621 A KR 1020220162621A KR 20220162621 A KR20220162621 A KR 20220162621A KR 20220165694 A KR20220165694 A KR 20220165694A
Authority
KR
South Korea
Prior art keywords
tile
information
tiles
unit
division
Prior art date
Application number
KR1020220162621A
Other languages
English (en)
Inventor
한종기
이재영
Original Assignee
세종대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 세종대학교산학협력단 filed Critical 세종대학교산학협력단
Priority to KR1020220162621A priority Critical patent/KR20220165694A/ko
Publication of KR20220165694A publication Critical patent/KR20220165694A/ko
Priority to KR1020240100054A priority patent/KR20240122378A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 타일 구조의 구성 방법 및 이의 장치에 관한 것이다. 본 발명의 일 실시예에 따른 타일 구조의 구성 방법은, 현재 픽쳐는 적어도 두 개 이상의 타일을 포함하고, 상기 적어도 두 개 이상의 타일은 열 분할 및 행 분할에 의하여 분할되며, 상기 열 분할 및 상기 행 분할은 적어도 하나 이상이 상기 현재 픽쳐의 세로 길이 또는 가로 길이보다 짧은 분할 길이를 이용하여 분할된다.

Description

타일 구조의 구성 방법 및 이의 장치 {A METHOD OF CONSTRUCTING THE TILES AND AN APPARATUS HAVING THE SAME}
본 발명은 타일 구조의 구성 방법 및 이의 장치에 관한 것으로서, 더욱 상세하게는, 다양한 형태를 갖는 타일 구조를 구성하는 방법 및 이의 장치에 관한 것이다.
최근 HD(High Definition) 픽쳐 및 UHD(Ultra High Definition) 픽쳐와 같은 고해상도, 고품질의 픽쳐에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 픽쳐 데이터가 고해상도, 고품질이 될수록 기존의 픽쳐 데이터에 비하여 상대적으로 데이터량이 증가하기 때문에, 기존의 유무선 광대역 회선과 같은 매체를 이용하여 픽쳐 데이터를 전송하거나 기존의 저장 매체를 이용하여 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 픽쳐 데이터가 고해상도, 고품질화 됨에 따라 발생하는 이러한 문제들을 해결하기 위하여 고효율의 픽쳐압축 기술들이 활용될 수 있다.
비디오 압축 기술들에서는 연속되는 픽쳐들 간의 시간적 중복성을 제거하기 위하여 모션 예측이 이용된다. 시간적 중복성을 검출하기 위하여, 복수 개의 참조 픽쳐들을 사용하여 현재 블록의 움직임을 예측하고, 모션보상을 수행하여 예측 블록을 생성한다. 모션정보는 적어도 하나의 참조 픽쳐 인덱스와 적어도 하나의 모션 벡터를 포함한다. 또한, 모션 정보를 획득하기 위하여 현재 블록은 공간적 이웃 블록 및/또는 시간적 이웃 블록으로부터 공간적 모션 정보 후보자 및/또는 시간적 모션 정보 후보자를 획득할 수 있다.
또한, HEVC에서, 이미지를 직사각형 영역(타일)들로 분할하고 개별 영역들의 부호화 및 복호화를 독립적으로 수행하는, 타일 분할 방법이라고 불리는 기술이 채용되고 있다. 앞서 서술한 바와 같이, 최근 영상이 고해상도, 고품질이 될수록 데이터량이 증가하므로, 이미지 중 필요에 따라 일부 영역에 많은 데이터를 활용하여 적응적으로 이미지를 코딩하는 방법에 대한 연구를 필요로 한다. 이를 위하여, 타일을 이용한 비디오 신호의 코딩의 활용도가 커질 수 있으며, 이러한 타일을 이용한 코딩에 대한 개선도 필요할 수 있다.
본 발명이 해결하고자 하는 과제는 다양한 형태의 구조를 갖는 타일을 구성함으로써, 이미지의 코딩 효율을 향상시키는 타일 구조의 구성 방법 및 이의 장치를 제공하는 것이다.
또한, 본 발명이 해결하고자 하는 다른 과제는 타일을 구성하는 복수 개의 슬라이스들이 다양한 형태의 구조를 가짐으로써, 코딩 효율을 높일 수 있는 타일 내 슬라이스의 구성 방법 및 이의 장치를 제공하는 것이다.
또한, 본 발명이 해결하고자 하는 또 다른 과제는 타일 내 코딩 트리 블록 및/또는 코딩 블록을 적응적으로 변경가능한 순서로 스캔함으로써, 코딩 효율을 향상시키는 타일 내 슬라이스의 구성 방법 및 이의 장치를 제공하는 것이다.
상기 과제를 해결하기 위한 본 발명의 일 실시예에 따른 타일 구조의 구성 방법은, 현재 픽쳐는 적어도 두 개 이상의 타일을 포함하고, 상기 적어도 두 개 이상의 타일은 열 분할 및 행 분할에 의하여 분할되며, 상기 열 분할 및 상기 행 분할은 적어도 하나 이상이 상기 현재 픽쳐의 세로 길이 또는 가로 길이보다 짧은 분할 길이를 이용하여 분할될 수 있다.
일 실시예에서, 상기 열 분할 및 상기 행 분할이 타일 개수 정보, 타일 크기 정보, 분할 방향 정보, 분할 영역 개수 정보, 타일 크기 정보, 타일 병합 플래그 정보, 타일 병합 개수 정보, 타일 인덱스 정보, 타일 위치 정보, 타일 가로 크기 정보, 및 타일 세로 크기 정보 중 적어도 하나 이상을 이용하여 결정되는 단계를 포함할 수 있다.
또한, 상기 열 분할 및 상기 행 분할이 결정되는 단계는, 상기 분할 방향 정보 및 상기 제 1 분할 영역 개수 정보를 수신하여 상기 현재 픽쳐를 적어도 두 개 이상의 타일들로 분할하는 단계; 상기 분할된 타일에 대하여 각각 제 2 분할 영역 개수 정보를 수신하는 단계; 및 상기 제 2 분할 영역 개수 정보에 기초하여 상기 분할 방향 정보가 나타내는 분할 방향과 수직인 방향으로 상기 분할된 타일을 재분할하는 단계를 포함할 수 있다.
일 실시예에서, 상기 분할된 타일을 재분할하는 단계는 반복되며, 상기 재분할 단계는 이전 분할 단계에서 분할된 방향과 수직인 방향으로 상기 분할된 타일을 재분할할 수 있다. 또한, 상기 열 분할 및 상기 행 분할을 결정하는 단계는, 상기 현재 픽쳐를 분할 방향 정보 및 분할 영역 개수 정보를 이용하여 적어도 두 개 이상의 타일로 1 차 분할하는 단계; 및 상기 타일 병합 플래그 정보, 상기 병합 개수 정보, 및 상기 타일 인덱스 정보 중 적어도 하나 이상을 이용하여 상기 1 차 분할된 타일들의 적어도 두 개 이상의 타일을 병합하는 단계를 포함한다.
상기 열 분할 및 상기 행 분할이 결정되는 단계는, 상기 현재 픽쳐 내의 분할되는 타일 개수를 나타내는 상기 타일 개수 정보를 수신하는 단계; 상기 타일 개수 정보가 나타내는 타일의 위치를 나타내는 상기 타일 위치 정보, 상기 타일의 가로 및 세로 크기를 나타내는 상기 타일 가로 크기 정보, 및 상기 타일 세로 크기 정보를 수신하는 단계를 포함할 수 있다.
일 실시예에서, 상기 타일 개수 정보, 상기 타일 위치 정보, 상기 타일 가로 크기 정보, 및 상기 타일 세로 크기 정보를 이용하여 상기 현재 픽쳐를 적어도 두 개 이상의 타일로 분할하는 단계를 포함한다.
상기 다른 과제를 해결하기 위한 본 발명의 일 실시예에 따른 타일 내 슬라이스의 구성 방법은, 현재 픽쳐에 포함되는 적어도 하나 이상의 타일은 적어도 두 개 이상의 슬라이스를 포함하며, 상기 슬라이스의 경계는 세로 방향 또는 대각선 방향일 수 있다.
일 실시예에서, 상기 타일은 타일별로 가변적인 스캔 순서를 가질 수 있으며, 상기 가변적인 스캔 순서는 래스터 스캔, 버티컬 스캔, 호리젠탈 스캔, 대각선 스캔, 및 기설정된 임의의 스캔 중 어느 하나로 상기 타일에 포함되는 코딩 트리 블록에 적용되며, 상기 가변적인 스캔 순서는 타일별로 상이할 수 있다.
또한, 일 실시예에서, 상기 가변적인 스캔 순서는 상기 타일의 적어도 두 개 이상의 슬라이스로의 분할 방향에 종속되거나, 상기 타일의 적어도 두 개 이상의 슬라이스로의 분할 방향에 독립될 수 있다.
상기 또 다른 과제를 해결하기 위한 본 발명의 일 실시예에 따른 코딩 트리 블록의 복호화 방법은, 현재 픽쳐는 복수 개의 코딩 트리 블록들을 포함하고, 상기 코딩 트리 블록은 복수 개의 코딩 블록들을 포함하며, 상기 코딩 블록들의 복호화 순서는 상기 코딩 트리 블록 별로 결정될 수 있다.
일 실시예에서, 상기 현재 픽쳐에 포함되는 적어도 하나 이상의 타일은 적어도 두 개 이상의 슬라이스를 포함하며, 상기 코딩 블록들의 복호화 순서는 상기 타일 내 슬라이스의 분할 방향에 종속될 수 있다.
본 발명의 실시예에 따르면, 현재 픽쳐에 포함되는 적어도 두 개 이상의 타일이 상기 현재 픽쳐의 세로 또는 가로 길이보다 짧은 적어도 하나 이상의 분할 길이인 열 분할 또는 행 분할을 이용하여 분할됨으로써, 다양한 형태의 구조를 갖는 타일을 구성하여 이미지의 코딩 효율을 향상시키는 타일 구조의 구성 방법 및 이의 장치를 제공하는 것이다.
또한, 본 발명의 다른 실시예에 따르면, 타일을 구성하는 적어도 두 개 이상의 슬라이스의 경계를 세로 또는 대각선 방향으로 결정함으로써, 코딩 효율을 높일 수 있고, 상기 타일 내의 코딩 트리 블록 또는 코딩 블록을 타일별로 적응적인 스캔 방법에 따라 스캔함으로써, 픽쳐에 맞춰 코딩 효율이 향상되는 타일 내 슬라이스의 구성 방법 및 이의 장치를 제공하는 것이다.
도 1은 본 발명의 일 실시예에 따른 비디오 부호화 장치를 개략적으로 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 비디오 복호화 장치를 개략적으로 나타낸 블록도이다.
도 3a 및 도 3b는 일반적인 방법에 따른 현재 픽쳐의 슬라이스 및 타일 분할 방법을 설명하기 위한 것이다.
도 4는 일반적인 방법에 따른 현재 픽쳐의 타일을 구성하기 위한 신택스이다.
도 5a 내지 도 6은 일반적인 방법에 따라 구성될 수 있는 현재 픽쳐의 타일 분할 구조를 나타내는 것이다.
도 7 및 도 8은 본 발명의 일 실시예에 따른 현재 픽쳐의 타일 구조 및 타일 구조의 구성 방법을 설명하는 순서도이다.
도 9는 본 발명의 일 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 나타내는 개략도이고, 도 10은 이를 구성하기 위한 신택스이다.
도 11은 본 발명의 다른 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 설명하는 순서도이고, 도 12는 도 11의 순서도에 따라 구성된 타일 구조를 나타내며, 도 13은 이를 구성하기 위한 신택스이다.
도 14는 본 발명의 또 다른 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 설명하는 순서도이고, 도 15는 도 14의 순서도에 따라 구성된 타일 구조를 나타내며, 도 16은 이를 구성하기 위한 신택스이다.
도 17은 본 발명의 일 실시예에 따른 타일 내 슬라이스의 구성 방법을 설명하는 순서도이고, 도 18은 도 17의 순서도에 따라 구성된 타일 내 슬라이스의 구조를 나타낸다.
도 19a는 일반적인 방법으로 구성된 타일 내 코딩 트리 블록의 구조 및 스캔 순서에 대하여 나타내는 것이고, 도 19b는 일반적인 방법으로 구성된 복수 개의 타일 구조에서 코딩 트리 블록의 스캔 순서를 나타내는 것이다.
도 19c는 본 발명의 일 실시예에 따른 적응적인 타일 내 코딩 트리 블록의 스캔 순서를 나타내며, 도 19d는 본 발명의 일 실시예에 따른 적응적인 스캔 순서를 갖는 다양한 슬라이스 구조를 나타내는 것이다.
도 20은 본 발명의 일 실시예에 따른 적응적인 스캔 순서를 갖는 타일을 구성하기 위한 신택스이다.
도 21a 및 도 21b는 본 발명의 일 실시예에 따른 적응적인 부호화 및 복호화 순서를 갖는 타일 및 코딩 트리 블록의 예시이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.
또한, 도면에서 각 유닛의 두께나 크기는 설명의 편의 및 명확성을 위하여 과장된 것이며, 도면상에서 동일 부호는 동일한 요소를 지칭한다. 본 명세서에서 사용된 바와 같이, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다.
본 명세서에서 사용된 용어는 특정 실시예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이, 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있다. 또한, 본 명세서에서 사용되는 경우 "포함한다 (comprise)" 및/또는 "포함하는 (comprising)"은 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는 것이며, 하나 이상의 다른 형상, 숫자, 동작, 부재, 요소 및/또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다.
본 명세서에서 제 1, 제 2 등의 용어가 다양한 구성요소, 부재, 부품, 영역, 및/또는 부분들을 설명하기 위하여 사용되지만, 이들 구성요소, 부재, 부품, 영역, 및/또는 부분들은 이들 용어에 의해 한정되어서는 안됨은 자명하다. 이들 용어는 하나의 구성요소, 부재, 부품, 영역 또는 부분을 다른 영역 또는 부분과 구별하기 위하여만 사용된다. 따라서, 이하 상술할 제 1 구성요소, 부재, 부품, 영역 또는 부분은 본 발명의 가르침으로부터 벗어나지 않고서도 제 2 구성요소, 부재, 부품, 영역 또는 부분을 지칭할 수 있다. 또한, 및/또는 용어는 복수의 관련되어 기재되는 항목들의 조합 또는 복수의 관련되어 기재되는 항목들 중의 어느 항목을 포함한다.
어느 구성요소가 다른 구성요소에 "연결되어" 있거나 "접속되어" 있다고 언급되는 경우에는, 상기 다른 구성요소에 직접적으로 연결되어 있거나 접속되어 있는 경우 뿐만 아니라, 상기 어느 구성요소와 상기 다른 구성요소 사이에 다른 구성요소가 존재하는 경우를 포함하여 이해되어야 한다. 그러나, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있거나 "직접 접속되어" 있다고 지칭되는 경우에는, 중간에 다른 구성요소가 존재하지 아니하고 상기 어느 구성요소와 상기 다른 구성요소가 직접 연결 또는 접속된 것으로 이해되어야 할 것이다.
이하, 본 발명의 실시예들은 본 발명의 이상적인 실시예들을 개략적으로 도시하는 도면들을 참조하여 설명한다. 도면들에 있어서, 예를 들면, 부재들의 크기와 형상은 설명의 편의와 명확성을 위하여 과장될 수 있으며, 실제 구현시, 도시된 형상의 변형들이 예상될 수 있다. 따라서, 본 발명의 실시예는 본 명세서에 도시된 영역의 특정 형상에 제한된 것으로 해석되어서는 아니된다.
도 1은 본 발명의 일 실시예에 따른 부호화 장치를 개략적으로 나타낸 블록도이다.
도 1을 참조하면, 부호화 장치(100)는 픽쳐 분할부(105), 화면간 예측부(110), 화면내 예측부(115), 변환부(120), 양자화부(125), 재정렬부(130), 엔트로피 부호화부(135), 역양자화부(140), 역변환부(145), 필터부(150) 및 메모리(155)를 포함한다.
도 1에 나타난 각 구성요소들은 부호화 장치에서 서로 다른 특징적인 기능들을 나타내기 위하여 독립적으로 도시한 것이며, 각 구성요소들이 분리된 하드웨어나 각각 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성요소는 설명의 편의상 각각의 구성요소로 나열하여 포함한 것으로 각 구성요소 중 적어도 두 개의 구성요소가 합쳐져 하나의 구성요소로 이루어지거나, 하나의 구성요소가 복수개의 구성요소로 나뉘어져 기능을 수행할 수 있다. 이러한 각 구성요소가 통합된 실시예 또는 분리된 실시예도 본 발명의 본질적인 측면에서 벗어나지 않는 한 본 발명의 권리범위에 포함될 수 있다.
픽쳐 분할부(105)는 입력된 픽쳐를 슬라이스 또는 타일로 분할할 수 있으며, 상기 타일은 복수 개의 슬라이스를 포함할 수 있다. 상기 슬라이스 또는 타일은 모두 복수 개의 코딩 트리 블록들의 집합일 수 있다. 상기 타일은 현재 픽쳐에서 독립적으로 코딩 처리를 수행할 수 있으므로, 영상의 병렬 처리를 위하여 중요한 구분이라 할 수 있다. 상기 타일 또는 슬라이스는 현재 제한적인 구조를 갖으나, 픽쳐를 구분하여 독립적으로 코딩할 필요성이 대두됨에 따라, 필요성에 맞도록 다양한 구조를 갖도록 분할되는 것이 필요하다. 이에 대한 상세한 실시예는 도 3a 내지 도 21b를 참조하여 후술하기로 한다.
또한, 픽쳐 분할부(105)는 입력된 픽쳐를 적어도 하나의 처리 단위로 분할할 수 있다. 여기서, 상기 처리 단위는 슬라이스 또는 타일과 양립 불가능한 단위가 아니며, 상기 슬라이스 또는 타일은 상기 처리 단위들을 포함하는 상위 개념일 수 있다. 상기 처리 단위는 예측 블록(Prediction Unit, 이하 'PU'라 함)일 수 있고, 변환 블록(Transform Unit, 이하 'TU'라 함)일 수도 있으며, 코딩 블록(Coding Unit, 이하 'CU'라 함)일 수도 있다. 다만, 본 명세서에서는 설명의 편의를 위해, 예측 블록을 예측 단위, 변환 블록을 변환 단위, 부호화 또는 복호화 블록을 부호화 단위 또는 복호화 단위로 표현할 수도 있다.
일 실시예에서, 픽쳐 분할부(105)는 하나의 픽쳐에 대하여 복수의 부호화 블록, 예측 블록, 및 변환 블록의 조합으로 분할하고, 소정의 기준(예를 들어, 비용 함수)에 기초하여 하나의 부호화 블록, 예측 블록, 및 변환 블록의 조합을 선택하여 픽쳐를 부호화할 수 있다.
예를 들어, 하나의 픽쳐는 복수 개의 코딩 블록으로 분할될 수 있다. 일 실시예에서, 하나의 픽쳐는 쿼드 트리 구조(Quad Tree Structure) 또는 바이너리 트리 구조와 같은 재귀적인 트리 구조를 사용하여 상기 코딩 블록을 분할할 수 있으며, 최대 크기 코딩 블록(largest coding unit)을 루트로 하여 다른 코딩 블록으로 분할되는 코딩 블록은 분할된 코딩 블록의 개수만큼의 자식 노드를 가지고 분할될 수 있다. 이러한 과정을 통하여 더 이상 분할되지 아니하는 코딩 블록은 리프 노드가 될 수 있다.
예측 블록도 하나의 코딩 블록 내에서 동일한 크기의 적어도 하나의 정방형(square) 또는 비정방형(non-square) 등의 형태를 가지고 분할된 것일 수 있고, 하나의 코딩 블록 내에서 분할된 예측 블록 중 어느 하나의 예측 블록이 다른 하나의 예측 블록과 상이한 형태와 크기를 가지도록 분할될 수도 있다. 일 실시예에서는, 코딩 블록과 예측 블록이 동일할 수 있다. 즉, 코딩 블록과 예측 블록을 구분하지 아니하고, 분할된 코딩 블록을 기준으로 예측이 수행될 수도 있다.
예측부는 화면간 예측(inter prediction)을 수행하는 화면간 예측부(110) 및 화면내 예측(intra prediction)을 수행하는 화면내 예측부(115)를 포함할 수 있다. 코딩 효율을 높이기 위하여, 픽쳐 신호를 그대로 부호화하는 것이 아니라, 이미 부호화 및 복호화가 완료된 픽쳐 내부의 특정 영역을 이용하여 픽쳐를 예측하고, 원래의 픽쳐와 예측 픽쳐 사이의 레지듀얼 값을 부호화한다. 또한, 예측을 위하여 사용된 예측 모드 정보, 모션 벡터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(135)에서 부호화되어 복호화부에 전달될 수 있다. 특정한 부호화 모드를 이용하는 경우에는 예측부(110, 115)를 통하여 예측 블록을 생성하지 아니하고, 원본 블록을 그대로 부호화하여 복호화부에 전송하는 것도 가능하다.
일 실시예에서, 예측부(110, 115)는 예측 블록에 대하여 화면간 예측을 수행할 것인지 화면내 예측을 수행할 것인지를 결정하고, 화면간 예측 모드, 모션 벡터, 및 참조 픽쳐과와 같은 상기 예측 방법 각각에 따른 구체적인 정보들을 결정할 수 있다. 이 경우, 예측이 수행되는 처리 단위와 예측 방법, 그리고 세부 처리 단위는 각각 다를 수 있다. 예를 들어, 예측 모드와 예측 방법은 예측 블록에 따라 결정되더라도, 예측의 수행은 변환 블록에 따라 수행될 수 있다.
예측부(110, 115)는, 픽쳐분할부(105)에서 분할된 픽쳐의 처리 단위에 대하여 예측을 수행하여 예측된 샘플로 구성되는 예측 블록을 생성할 수 있다. 예측부(110, 115)에서의 픽쳐처리 단위는 코딩 블록 단위일 수 있고, 변환 블록 단위일 수도 있으며, 예측 블록 단위일 수도 있다.
화면간 예측부(110)는 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐중 적어도 하나 이상의 픽쳐의 정보를 기초로 예측 블록을 예측할 수 있고, 경우에 따라 현재 픽쳐내의 코딩이 완료된 일부 영역의 정보를 기초로 예측 블록을 예측할 수 있다. 화면간 예측부(110)는 참조 픽쳐보간부, 모션 예측부, 및 모션보상부를 포함할 수 있다.
화면내 예측부(115)는 화면간 예측과 달리 현재 픽쳐내의 픽셀 정보인 현재 블록 주변의 참조 픽셀 정보들을 기초로 하여 예측 블록을 생성할 수 있다. 상기 예측 블록의 주변 블록들은 화면간 예측을 수행한 블록인 경우, 즉, 참조 픽셀이 화면간 예측을 수행한 픽셀인 경우에는 화면간 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 화면내 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수도 있다.
화면내 예측부(115)에서 생성된 예측 블록과 원본 블록 사이의 레지듀얼 값(레지듀얼 블록 또는 레지듀얼 신호)은 변환부(120)에 입력될 수 있다. 또한, 예측을 위하여 사용되는 예측 모드 정보, 보간 필터 정보 등은 레지듀얼 값과 함께 엔트로피 부호화부(135)에서 부호화되어 복호화기로 전달될 수 있다.
변환부(120)는 변환 단위로 원본 블록과 예측부(110, 115)를 통하여 생성된 예측 단위의 레지듀얼 값 정보를 포함하는 레지듀얼 블록을 DCT(Discrete Cosine Transform), DST(Discrete Sine Transform), KLT(Karhunen Loeve Transform)과 같은 변환 방법을 이용하여 변환시킬 수 있다. 레지듀얼 블록을 변환하기 위하여 DCT, DST 또는 KLT 등 다양한 변환 방법들 중에서 어떠한 방법을 적용할지는 레지듀얼 블록을 생성하기 위하여 사용된 예측 단위의 화면내 예측 모드 정보를 기초로 결정할 수 있다.
양자화부(125)는 변환부(120)에서 변환된 레지듀얼 값들을 양자화하여 양자화 계수를 생성할 수 있다. 일 실시예에서, 상기 변환된 레지듀얼 값들은 주파수 영역으로 변환된 값일 수 있다. 상기 양자화 계수는 변환 단위에 따라 또는 픽쳐의 중요도에 따라 변경될 수 있으며, 양자화부(125)에서 산출된 값은 역양자화부(140) 및 재정렬부(130)에 제공될 수 있다.
재정렬부(130)는 양자화부(125)로부터 제공된 양자화 계수를 재정렬할 수 있다. 재정렬부(130)는 상기 양자화 계수를 재정렬함으로써 엔트로피 부호화부(135)에서의 부호화 효율을 향상시킬 수 있다. 재정렬부(130)는 계수 스캐닝(Coefficient Scanning) 방법을 통하여 2차원 블록 형태의 양자화 계수들을 1차원의 벡터 형태로 재정렬할 수 있다. 상기 계수 스캐닝 방법은 변환 단위의 크기 및 화면내 예측 모드에 따라 어떠한 스캔 방법이 사용될지 여부가 결정될 수 있다. 상기 계수 스캐닝 방법은 지그-재그 스캔, 2차원의 블록 형태의 계수를 열 방향으로 스캔하는 수직 스캔, 및 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔을 포함할 수 있다. 일 실시예에서, 재정렬부(130)는 양자화부에서 전송되는 계수들의 확률적인 통계를 기반으로 계수 스캐닝의 순서를 변경함으로써 엔트로피 부호화부(135)에서의 엔트로피 부호화 효율을 높일 수도 있다.
엔트로피 부호화부(135)는 재정렬부(130)에 의하여 재정렬된 양자화 계수들에 대한 엔트로피 부호화를 수행할 수 있다. 엔트로피 부호화는 예를 들어, 지수 골롬(Exponential Golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Content-Adaptive Binary Arithmetic Coding)과 같은 다양한 부호화 방법을 이용할 수 있다.
엔트로피 부호화부(135)는 재정렬부(130) 및 예측부(110, 115)로부터 전달받은 코딩 유닛의 양자화 계수 정보 및 블록 타입 정보, 예측 모드 정보, 분할 단위 정보, 예측 유닛 정보 및 전송 단위 정보, 모션 벡터 정보, 참조 픽쳐정보, 블록의 보간 정보, 필터링 정보와 같은 다양한 정보를 부호화할 수 있다. 또한, 일 실시예에서 엔트로피 부호화부(135)는 필요한 경우에, 전송하는 파라미터 셋 또는 신택스에 일정한 변경을 가할 수도 있다.
역양자화부(140)는 양자화부(125)에서 양자화된 값들을 역양자화하고, 역변환부(145)는 역양자화부(140)에서 역양자화된 값들을 역변화한다. 역양자화부(140) 및 역변환부(145)에서 생성된 레지듀얼 값은 예측부(110,115)에서 예측된 예측 블록과 합쳐져 복원 블록(Reconstructed Block)이 생성될 수 있다. 상기 예측 블록들로 구성된 픽쳐는 모션보상 픽쳐 또는 MC 픽쳐(Motion Compensated Picture)일 수 있다. 상기 생성된 복원 블록들로 구성된 픽쳐는 복원 픽쳐일 수 있다.
상기 복원 픽쳐는 필터부(150)에 입력될 수 있다. 필터부(150)는 디블록킹 필터부, 오프셋 보정부(Sample Adaptive Offset, SAO), 및 적응적 루프 필터부(Adaptive Loop Filter, ALF)를 포함할 수 있으며, 요약하자면, 상기 복원 픽쳐는 디블록킹 필터부에서 디블록킹 필터가 적용되어 블록킹 잡음(blocking artifact)를 감소 또는 제거 시킨 후, 오프셋 보정부에 입력되어 오프셋을 보정시킬 수 있다. 상기 오프셋 보정부에서 출력된 픽쳐는 상기 적응적 루프 필터부에 입력되어 ALF(Adaptive Loop Filter) 필터를 통과하며, 상기 필터를 통과한 픽쳐는 메모리(155)로 전송될 수 있다.
오프셋 보정부는 디블록킹 필터가 적용된 레지듀얼 블록에 대하여, 픽셀 단위로 원본 픽쳐와의 오프셋을 보정할 수 있다. 적응적 루프 필터부(Adaptive Loop Filter, ALF)는 필터링한 복원 픽쳐와 원래의 픽쳐를을 비교한 값을 기초로, 복원 영상이 원본 영상과 유사해지게 만드는 기술로써 블록별로 또는 픽쳐별로 선택적으로 사용될 수 있다.
메모리(155)는 필터부(150)을 통하여 산출된 복원 블록 또는 픽쳐를 저장할 수 있다. 메모리(155)에 저장된 복원 블록 또는 픽쳐는 화면간 예측을 수행하는 화면간 예측부(110) 또는 화면내 예측부(115)에 제공될 수 있다. 화면내 예측부(115)에서 사용되는 복원 블록들의 화소값은 디블록킹 필터부, 오프셋 보정부, 및 적응적 루프 필터부가 적용되지 아니한 데이터들 일 수 있다.
도 2는 본 발명의 일 실시예에 따른 복호화 장치를 개략적으로 나타낸 블록도이다. 도 2 를 참조하면, 픽쳐 복호화 장치(200)는 엔트로피 복호화부(210), 재정렬부(215), 역양자화부(220), 역변환부(225), 화면간 예측부(230), 화면내 예측부(235), 필터부(240), 메모리(245)를 포함한다.
부호화 장치로부터 픽쳐 비트스트림이 입력되는 경우, 입력된 비트스트림은 부호화 장치에서 픽쳐 정보가 처리된 절차의 역과정으로 복호화될 수 있다. 예를 들어, 부호화 장치에서 엔트로피 부호화를 수행하기 위하여 CAVLC와 같은 가변 길이 부호화(Variable Length Coding: VLC, 이하 'VLC'라 함)가 사용된 경우에는, 엔트로피 복호화부(210)도 부호화 장치에서 사용한 VLC 테이블과 동일한 VLC 테이블로 구현하여 엔트로피 복호화를 수행할 수 있다. 또한, 부호화 장치에서 엔트로피 부호화를 수행하기 위하여 CABAC을 이용한 경우에는 엔트로피 복호화부(210)에서 이에 대응하여 CABAC을 이용한 엔트로피 복호화를 수행할 수 있다.
엔트로피 복호화부(210)에서는 복호화된 정보 중 예측 블록을 생성하기 위한 정보를 화면간 예측부(230) 및 화면내 예측부(235)로 제공하고, 엔트로피 복호화부에서 엔트로피 복호화가 수행된 레지듀얼 값은 재정렬부(215)로 입력될 수 있다.
재정렬부(215)는 엔트로피 복호화부(210)에서 엔트로피 복호화된 비트스트림을 부호화기에서 재정렬한 방법을 기초로 재정렬할 수 있다. 재정렬부(215)는 부호화 장치에서 수행된 계수 스캐닝에 관련된 정보를 제공받고 부호화 장치에서 수행된 스캐닝 순서에 기초하여 역으로 스캐닝하는 방법을 통하여 재정렬을 수행할 수 있다.
역양자화부(220)는 부호화 장치에서 제공된 양자화 파라미터와 재정렬된 블록의 계수값을 기초로 역양자화를 수행할 수 있다. 역변환부(225)는 픽쳐부호화 장치에서 수행된 양자화 결과에 대하여, 부호화 장치의 변환부가 수행한 DCT, DST, 또는 KLT 에 대해 역DCT, 역DST, 또는 역KLT를 수행할 수 있다. 역변환은 부호화 장치에서 결정된 전송 단위 또는 픽쳐의 분할 단위를 기초로 수행될 수 있다. 인코딩 장치의 변환부에서는 예측 방법, 현재 블록의 크기 및 예측 방향과 같은 정보에 따라 DCT, DST, 또는 KLT를 선택적으로 수행할 수 있고, 복호화 장치의 역변환부(225)는 부호화 장치의 변환부에서 수행된 변환 정보를 기초로 역변환 방법이 결정되어 역변환을 수행할 수 있다.
예측부(230, 235)는 엔트로피 복호화부(210)에서 제공된 예측 블록 생성과 관련된 정보와 메모리(245)에서 제공된 이전에 복호화된 블록 및/또는 픽쳐 정보를 기초로 예측 블록을 생성할 수 있다. 복원 블록은 예측부(230, 235)에서 생성된 예측 블록과 역변환부(225)에서 제공된 레지듀얼 블록을 이용하여 생성될 수 있다. 예측부(230, 235)에서 수행하는 구체적인 예측의 방법은 부호화 장치의 예측부(110, 115)에서 수행되는 예측의 방법과 동일할 수 있다.
예측부(230, 235)는 예측 단위 판별부(미도시), 화면간 예측부(230), 및 화면내 예측부(235)를 포함할 수 있다. 예측 단위 판별부는 엔트로피 복호화부(210)에서 복호화되는 예측 단위 정보, 화면내 예측 방법의 예측 모드 정보, 화면간 예측 방법의 모션 예측 관련 정보와 같은 다양한 정보를 입력 받아, 현재 코딩 블록에서의 예측 블록을 구분하고, 예측 블록이 화면간 예측을 수행하는지 아니면 화면내 예측을 수행하는지 여부를 판별할 수 있다.
화면간 예측부(230)는 부호화 장치에서 제공된 현재 예측 블록의 화면간 예측에 필요한 정보를 이용하여 현재 예측 블록이 포함된 현재 픽쳐의 이전 픽쳐 또는 이후 픽쳐중 적어도 하나의 픽쳐에 포함된 정보를 기초로 현재 예측 블록에 대한 화면간 예측을 수행할 수 있다. 현재 블록의 화면간 예측에 필요한 모션 벡터 및 참조 픽쳐 인덱스를 포함하는 모션정보는 부호화 장치로부터 수신한 스킵 플래그, 머지 플래그 등을 확인하고 이에 대응하여 유도될 수 있다.
화면내 예측부(235)는 현재 픽쳐내의 픽셀 정보를 기초로 예측 블록을 생성할 수 있다. 예측 단위가 화면내 예측을 수행한 예측 단위인 경우에는 부호화기에서 제공된 예측 단위의 화면내 예측 모드 정보를 기초로 화면내 예측을 수행할 수 있다. 상기 예측 단위의 주변 블록들은 화면간 예측을 수행한 블록인 경우, 즉, 참조 픽셀이 화면간 예측을 수행한 픽셀인 경우에는 화면간 예측을 수행한 블록에 포함되는 참조 픽셀을 주변의 화면내 예측을 수행한 블록의 참조 픽셀 정보로 대체하여 사용할 수도 있다.
또한, 화면내 예측부(235)는 화면내 예측 모드를 부호화하기 위하여 이웃 블록들로부터 획득한 가장 가능성 있는 화면내 예측 모드(MPM: Most Probable Mode)을 이용할 수 있다. 일 실시예에서, 상기 가장 가능성 있는 화면내 예측 모드는 현재 블록의 공간적 이웃 블록의 화면내 예측 모드를 이용할 수 있다.
화면내 예측부(235)에는 AIS(Adaptive Intra Smoothing) 필터부, 참조 픽셀 보간부, DC 필터부를 포함할 수 있다. 상기 AIS 필터부는 현재 블록의 참조 픽셀에 필터링을 수행하는 부분으로써 현재 예측 단위의 예측 모드에 따라 필터의 적용 여부를 결정하여 적용할 수 있다. 부호화기에서 제공된 예측 단위의 예측 모드 및 AIS 필터 정보를 이용하여 현재 블록의 참조 픽셀에 AIS 필터링을 수행할 수 있다. 현재 블록의 예측 모드가 AIS 필터링을 수행하지 아니하는 모드인 경우에는, 상기 AIS 필터부는 현재 블록에 적용되지 아니할 수 있다.
참조 픽셀 보간부는 예측 단위의 예측 모드가 참조 픽셀을 보간한 샘플값을 기초로 화면내 예측을 수행하는 예측 단위인 경우에, 참조 픽셀을 보간하여 정수값 이하의 픽셀 단위의 참조 픽셀을 생성할 수 있다. 현재 예측 단위의 예측 모드가 참조 픽셀을 보간하지 아니하고 예측 블록을 생성하는 예측 모드인 경우, 참조 픽셀은 보간되지 아니할 수 있다. DC 필터부는 현재 블록의 예측 모드가 DC 모드인 경우에 필터링을 통하여 예측 블록을 생성할 수 있다.
복원된 블록 및/또는 픽쳐는 필터부(240)로 제공될 수 있다. 필터부(240)는 복원된 블록 및/또는 픽쳐에 디블록킹 필터부, 오프셋 보정부(Sample Adaptive Offset) 및/또는 적응적 루프 필터부를 포함할 수 있다. 상기 디블록킹 필터부는 부호화기로부터 해당 블록 또는 픽쳐에 디블록킹 필터가 적용되었는지 여부를 나타내는 정보 및 디블록킹 필터가 적용된 경우 강한 필터 또는 약한 필터를 적용하였는지를 나타내는 정보를 제공받을 수 있다. 상기 디블록킹 필터부는 부호화기에서 제공된 디블록킹 필터 관련 정보를 제공받고, 복호화기에서 해당 블록에 대한 디블록킹 필터링을 수행할 수 있다.
상기 오프셋 보정부는 부호화시 픽쳐에 적용된 오프셋 보정의 종류 및 오프셋 값 정보 등을 기초로 복원된 픽쳐에 오프셋 보정을 수행할 수 있다. 상기 적응적 루프 필터부는 부호화기로부터 제공된 적응적 루프 필터의 적용 여부에 관한 정보, 적응적 루프 필터의 계수 정보와 같은 정보들을 기초로 부호화 단위로 적용될 수 있다. 상기 적응적 루프 필터와 관련된 정보들은 특정 파라미터 셋(parameter set)에 포함되어 제공될 수 있다.
메모리(245)는 복원된 픽쳐 또는 블록을 저장하여 이후에 참조 픽쳐 또는 참조 블록으로 사용할 수 있고, 또한 복원된 픽쳐를 출력부로 제공할 수 있다.
본 명세서에서는 설명의 편의를 위하여 생략하였지만, 복호화 장치에 입력되는 비트스트림은 파싱(parsing) 단계를 거쳐 엔트로피 복호화부로 입력될 수 있다. 또한, 엔트로피 복호화부에서 파싱 과정을 수행하도록 할 수 있다.
본 명세서에서 코딩은 경우에 따라 부호화 또는 복호화로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements), 플래그(flag) 등을 모두 포함하는 것으로 이해될 수 있다. '화면' 또는 '픽쳐(picture)'는 일반적으로 특정 시간대의 하나의 픽쳐를 나타내는 단위를 의미하며, '슬라이스(slice)', '프레임(frame)' 등은 실제 비디오 신호의 코딩에 있어서 픽쳐의 일부를 구성하는 단위이며, 필요에 따라서는 픽쳐와 서로 혼용되어 사용될 수 있다.
'픽셀(pixel)', '픽셀' 또는 'pel'은 하나의 픽쳐를 구성하는 최소의 단위를 나타낸다. 또한, 특정한 픽셀의 값을 나타내는 용어로서, '샘플(sample)'을 사용할 수 있다. 샘플은 휘도(Luma) 및 색차(Chroma) 성분으로 나누어질 수 있으나, 일반적으로는 이를 모두 포함하는 용어로 사용될 수 있다. 상기에서 색차 성분은 정해진 색상들 간의 차이를 나타내는 것으로 일반적으로 Cb 및 Cr로 구성된다.
'유닛(unit)'은 상술한 부호화 유닛, 예측 유닛, 변환 유닛과 같이 픽쳐처리의 기본 단위 또는 픽쳐의 특정 위치를 지칭하며, 경우에 따라서는 '블록' 또는 '영역(area)'등의 용어와 서로 혼용하여 사용될 수 있다. 또한, 블록은 M개의 열과 N개의 행으로 구성된 샘플들 또는 변환 계수(transform coefficient)들의 집합을 나타내는 용어로 사용될 수도 있다.
도 3a 및 도 3b는 일반적인 방법에 따른 현재 픽쳐의 슬라이스 및 타일 분할 방법을 설명하기 위한 것이다.
도 3a은 한 픽쳐를 종래의 방법으로 3 개의 슬라이스로 분할된 구조를 나타낸다. 도 3a을 참조하면, 한 픽쳐(Picture)는 적어도 하나 이상의 슬라이스(Slice segment 0, 1, 2)로 분할될 수 있다. 상기 슬라이스는 하나 또는 복수 개의 코딩 트리 블록(Coding Tree Block)으로 구성될 수 있으며, 상기 슬라이스의 경계(Slice Boundary)는 가로 방향 또는 가로 방향으로 연장된 계단 방향일 수 있다. 일 실시예에서, 상기 슬라이스는 래스터 스캔 순서로 구성된 코딩 트리 블록들의 집합일 수 있다.
도 3b를 참조하면, 한 픽쳐(Picture)는 적어도 하나 이상의 타일로 분할될 수 있다. 상기 타일은, 또한, 적어도 하나 이상의 슬라이스들로 구성될 수 있다. 예를 들면, 한 픽쳐는 타일 0(Tile 0) 및 타일 1(Tile 2)과 같이 2 개의 타일로 분할될 수 있고, 타일 0(Tile 0)은 2 개의 슬라이스인 Slice segment 0 및 Slice segment 1으로 구성될 수 있고, 타일 1(Tile 1)도 2 개의 슬라이스(Slice segment 0, Slice segment 1)으로 구성될 수 있다.
본 발명에서는 현재 픽쳐가 2 개의 타일 및 각 타일이 2 개의 슬라이스들로 구성되는 예에 대하여 개시하고 있으나, 본 발명의 분할되는 타일 및 슬라이스의 개수는 이에 제한되지 아니한다. 또한, 현재 픽쳐를 가로 방향으로 분할한 타일 구조에 대하여 개시하고 있으나, 현재 픽쳐는 세로 방향으로 분할된 타일 구조를 가질 수도 있다.
도 4는 일반적인 방법에 따른 현재 픽쳐의 타일을 구성하기 위한 신택스이다. 픽쳐를 적어도 하나 이상의 타일로 분할하기 위한 다양한 정보들은 픽쳐 파라미터 셋(Picture parameter Set)에 의하여 전송될 수 있다. 도 5a 및 도 5b는 도 4의 신택스를 이용하여 일반적인 방법에 따라 구성될 수 있는 현재 픽처의 타일 분할 구조를 나타내는 것이다.
도 4를 참조하면, 현재 픽쳐가 타일 구조를 이용하는지 여부를 나타내는 타일 이용 플래그(tiles_enabled_flag)가 1인 경우는 현재 픽쳐가 적어도 두 개 이상의 타일들로 분할되는 것을 의미한다. 한편, 타일 이용 플래그가 0 인 경우는 현재 픽쳐는 하나의 타일로 나타내는 것을 의미한다. 이후, 현재 픽쳐의 열 방향으로의 타일을 분할하는 횟수(열 방향으로 구분되는 타일의 개수 - 1)를 나타내는 열 방향 분할 횟수 정보(num_tile_column_minus1) 및 행 방향으로의 타일을 분할하는 횟수(행 방향으로 구분되는 타일의 개수 - 1)를 나타내는 행 방향 분할 횟수 정보(num_tile_rows_minus1)를 수신할 수 있다. 예를 들어, 상기 열 방향 분할 횟수 정보(num_tile_column_minus1)가 2 이고, 상기 행 방향 분할 횟수 정보(num_tile_rows_minus1)가 1 인 경우, 도 5a에서 나타난 바와 같이, 현재 픽쳐는 현재 픽쳐를 열 방향으로 2 번 분할하고, 행 방향으로 1 번 분할하는 타일 구조(Tile 0 내지 Tile 5)를 가질 수 있다.
또한, 도 4를 다시 참조하면, 상기 열 방향 분할 횟수 정보 및 상기 행 방향 분할 횟수 정보를 수신한 이후, 현재 픽쳐가 균등한 크기의 타일로 구성되는지 여부를 나타내는 타일 균등 분할 플래그(uniform_spacing_flag)를 수신할 수 있다. 상기 타일 균등 분할 플래그가 1 이면, 상기 열 방향 분할 횟수 정보 및 상기 행 방향 분할 횟수 정보에 기초하여 현재 픽쳐는 열과 행의 코딩 트리 블록의 수를 균등하게 분할하여 타일을 구성할 수 있다.
일 실시예에서, 상기 타일 균등 분할 플래그가 0인 경우에는 열 및 행 방향으로 분할되는 타일의 크기를 나타내는 열 분할 크기 정보(column_width_minus1[i]) 및 행 분할 크기 정보(row_height_minus1[i])를 더 수신할 수 있다. 도 5b를 참조하면, 상기 타일 균등 분할 플래그가 0 이고, 상기 열 방향 분할 횟수 정보 및 상기 행 방향 분할 횟수 정보가 모두 1(각각 한 번의 분할)인 경우, 현재 픽쳐는 4 개의 타일들(Tile 0 내지 Tile 3)로 분할될 수 있다. 또한, 상기 열 분할 크기 정보 및 상기 행 분할 크기 정보를 이용하여 상기 분할되는 타일의 크기가 결정될 수 있다.
이러한 타일 분할 방법은 픽쳐를 열 또는 행 방향으로 분할하는 열 분할 또는 행 분할에 있어서 항상 픽쳐의 세로 길이 또는 가로 길이와 동일한 분할 길이를 이용하여 분할될 수 있다. 그러나, 이러한 분할 방법은 도 6과 같이 ROI를 고려하여 타일을 분할하는 경우, 타일로 분할하여 독립적으로 코딩을 수행할 필요가 없는 주변 영역에 대하여도 타일로 분할하여 독립적으로 코딩이 수행되기 때문에 코딩 효율이 저하될 수 밖에 없다.
최근 고화질 영상 뿐만 아니라 가상 현실(VR) 영상의 활용도가 높아지기 있기 때문에, 타겟 영역에 대하여는 고화질로 코딩하고, 주변 영역에 대하여는 저화질로 코딩하는 등의 하나의 픽쳐 내에서 고화질 및 저화질로 독립적인 코딩을 수행하고자 하는 필요성이 높아지고 있다. 따라서, 본 발명에서는 현재 픽쳐를 일반적인 종래의 분할하는 방법에 그치지 아니하고, 다양한 구조를 갖는 타일들로 분할하는 방법에 대하여 설명하기로 한다.
도 7은 본 발명의 일 실시예에 따른 현재 픽쳐의 타일 구조 및 타일 구조의 구성 방법을 설명하는 순서도이다.
*도 7을 참조하면, 현재 픽쳐(10)는 열 분할 및 행 분할에 의하여 적어도 두 개 이상의 타일(Tile 0 내지 3)로 분할될 수 있다. 본 발명에서 상기 열 분할은 현재 픽쳐를 세로 방향의 타일로 분할하기 위하여 세로 방향의 분할선으로 구획하는 것을 지칭한다. 또한, 상기 행 분할은 현재 픽쳐를 가로 방향의 타일로 분할하기 위하여 가로 방향의 분할선으로 구획하는 것을 지칭한다.
본 발명의 일 실시예에 따른 타일 구조의 구성 방법은, 상기 열 분할 및 상기 행 분할 중 적어도 하나 이상은 현재 픽쳐의 세로 길이 또는 가로 길이보다 짧은 분할 길이를 이용하여 분할될 수 있다. 예를 들면, 도 7에서 나타낸 바와 같이, 현재 픽쳐(10)는 현재 픽쳐의 세로 길이보다 짧은 길이의 열 분할 및 현재 픽쳐의 가로 길이와 동일한 길이의 행 분할을 이용하여 적어도 두 개 이상의 타일들(Tile 0 내지 Tile 3)로 분할될 수 있다. 이와 같이, 본 발명의 타일 구조의 구성 방법은, 현재 픽쳐의 세로 또는 가로 길이보다 짧은 길이의 열 분할 또는 행 분할에 의하여 타일을 구성함으로써, 다양한 타일 구조를 형성할 수 있다. 따라서, 이러한 다양한 타일 구조에 의하여 실질적으로 필요한 영역에 해당하는 타겟 영역을 분할하여 코딩함으로써 코딩 효율을 향상시킬 수 있다.
도 8은 본 발명의 일 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 설명하는 순서도이고, 도 9는 일 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 나타내는 개략도이고, 도 10은 이를 구성하기 위한 신택스이다.
도 8 내지 도 10을 참조하면, 현재 픽쳐는 먼저 열 방향 또는 행 방향 중 하나의 방향으로 분할될 수 있다. 먼저, 현재 픽쳐를 어느 방향으로 분할하는지를 나타내는 분할 방향 정보, 상기 분할 방향 정보로 현재 픽쳐를 몇 개의 타일로 분할하는지를 나타내는 제 1 분할 영역 개수 정보, 상기 분할되는 타일의 크기를 나타내는 타일 크기 정보를 수신할 수 있다(S11). 예를 들면, 픽쳐 파라미터 셋(PPS)에 포함된 분할 방향 정보인 first_tile_split_direction(21)을 이용하여 현재 픽쳐(10)를 깊이 0(depth 0)의 tile 0 및 tile 1 로 분할할 수 있다. 이 경우, 상기 분할은 수신된 제 1 분할 영역 개수 정보인 num_tile_in_dir_minus1(22) 및 타일 크기 정보인 tile_size_minus1[i](23)를 이용하여 깊이 0을 갖는 두 개 이상의 타일로 분할될 수 있다(S12).
상기 타일 크기 정보는 분할된 타일의 크기를 나타내며, 예를 들면, 상기 타일 크기 정보는 코팅 트리 블록을 포함하는 부호화 또는 복호화 유닛의 개수에 의하여 나타낼 수 있다. 또한, 여기서 i는 i 번째 분할 영역을 나타낼 수 있다.
일 실시예에서, 분할된 타일에 대하여 재분할이 있는지 여부를 나타내는 타일 재분할 플래그(tile_split_flag[i], 24)를 수신할 수 있다(S13). 깊이 0의 분할된 타일의 타일 재분할 플래그(24)가 0인 경우(S13의 No)는, 해당 타일은 더 분할되지 아니한다. 한편, 깊이 0의 분할된 타일의 타일 재분할 플래그(24)가 1인 경우(S13의 Yes)는, 해당 타일은 적어도 두 개 이상의 타일들로 재분할 될 수 있다. 상기 타일 재분할 플래그(24)가 1인 경우는, 재분할되는 타일의 개수를 나타내는 제 2 분할 영역 개수 정보를 더 수신할 수 있다(S14). 일 실시예에서, 상기 타일 재분할 플래그(24)가 1 인 경우, 타일 재분할 프로세스 또는 모듈(25, tile_adpative_split(tile_split_direction))이 실행될 수 있다. 상기 타일 재분할 프로세스에서는 상위 레벨의 분할 방향 정보(tile_split_direction 및 parent_tile_split_direction)를 사용할 수 있으며, 상기 타일 재분할 프로세스는 상기 제 2 분할 영역 개수 정보(num_tile_in_dir_minus1; 26), 상기 타일 크기 정보(tile_size_minus1; 27), 및 타일 재분할 플래그(tile_split_flag; 28)를 발생시킬 수 있다.
상기 타일 재분할 플래그(24)가 1인 경우는 수신된 상기 제 2 분할 영역 개수 정보(26) 및 크기 정보(27)에 기초하여, 상기 해당 타일을 재분할할 수 있다(S14 및 S15). 이 경우, 이전 레벨의 분할 방향인 상기 분할 방향 정보(parent_tile_split_direction)가 나타내는 분할 방향과 수직인 방향으로 분할할 수 있다. 이후, 타일 재분할 플래그(28)를 확인하여(S16) 상기 타일 재분할 플래그(28)가 1인 경우(S16의 Yes)에는, 상기 재분할된 타일의 개수를 나타내는 제 3 분할 영역 개수 정보를 이전 분할 방향과 수직인 방향으로 재분할할 수 있으며(S15), 타일 재분할 플래그(28)가 0인 경우(S16의 No)에는, 타일의 재분할이 종료되며 현재 픽쳐의 타일 구성이 완료될 수 있다.
일 실시예에서는 현재 픽쳐를 분할하는 첫 번째 분할 방향을 나타내는 분할 방향 정보(first_tile_split_direction; 21)만을 신택스를 통하여 수신할 수 있다. 이외의 다른 정보는 복호화 장치에서 기 전송된 정보들을 이용하여 획득될 수 있다. 또한, 분할 방향 정보 이외에 도 10을 참조하여 설명된 정보들 중 일부만을 신택스를 통하여 수신하고, 일부 정보들은 기 전송된 정보들을 이용하여 복호화 장치에서 획득될 수도 있다.
또한, 다양한 형상의 타일 구조를 구성하기 위한 다른 실시예를 설명하기로 한다. 도 11은 본 발명의 다른 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 설명하는 순서도이고, 도 12는 도 11의 순서도에 따라 구성된 타일 구조를 나타내며, 도 13은 이를 구성하기 위한 신택스이다.
도 11 내지 도 13을 참조하면, 먼저, 현재 픽쳐를 적어도 두 개 이상의 타일들로 분할하기 위하여 분할 방향을 나타내는 분할 방향 정보 및 현재 픽쳐를 분할하기 위한 분할 영역 개수 정보를 수신할 수 있다(S31). 현재 픽쳐는 상기 분할 방향 정보 및 상기 분할 영역 개수 정보를 이용하여 적어도 두 개 이상의 타일로 1차 분할될 수 있다(S32). 예를 들어, num_tile_columns_minus1이 2이고, num_tile_rows_minus1이 1 이면, 현재 픽쳐(30)은 타일 0 내지 5(TILE 0 내지 TILE 5)로 1차 분할될 수 있다.
이후, 각 타일 영역에 대하여 다른 타일과의 병합 여부를 나타내는 타일 병합 플래그 정보인 tile_merge_flag[i](41), 몇 개의 타일과 병합하는지를 나타내는 병합 개수 정보인 num_merge_tile_minus1(42), 및 병합되는 타일을 나타내는 타일 인덱스 정보인 target_tile_ID[i](43)를 수신할 수 있다(S33). 상기 타일 병합 플래그 정보가 0 인 경우에는, 해당 타일은 다른 타일과 병합하지 아니할 수 있다. 한편, 상기 타일 병합 플래그 정보가 1 인 경우에는, 해당 타일은 다른 타일과 병합할 수 있다. 여기서, i는 1차 분할된 타일 중 해당 타일의 타일 인덱스를 나타내는 것이다.
상기 타일 병합 플래그 정보가 1 인 경우, 병합 개수 정보(42) 및 병합될 타일들의 인덱스 정보(43)를 이용하여 상기 1차 분할된 타일들의 적어도 두 개 이상의 타일을 병합할 수 있다(S34). 예를 들어, tile_merge_flag[3]=1 (Tile 3이 병합된다는 의미)이고, num_merge_tile_minus1=1 이라고 하면, Tile 3과 병합되는 다른 타일들의 개수는 총 2개(num_merge_tile_minus1 + 1)이다. 그 다음으로 복호화되는 정보인 target_tile_ID에 대한 정보가 target_tile_ID[0]=4, target_tile_ID[1]=5 라고 하면, 도 12에서 나타난 바와 같이, 1차 분할된 TILE 3 내지 TILE 5가 병합되어 최종 TILE 3을 형성할 수 있다. 이와 같은 방법에 따라, 종래의 타일 구성 방법과는 달리 현재 픽쳐(30)는 다양한 형태를 갖는 적어도 두 개 이상의 타일인 TILE 0 내지 TILE 3(31 내지 34)로 구성될 수 있다. 그러나, 도 13에서 예시한 신택스는 제안하는 본 발명을 구성하기 위한 일 예일 뿐, 신택스의 설계는 이에 한정되지 아니한다.
다양한 형상의 타일 구조를 구성하기 위한 또 다른 실시예도 존재할 수 있다. 도 14는 본 발명의 또 다른 실시예에 따른 현재 픽쳐의 타일 구조의 구성 방법을 설명하는 순서도이고, 도 15는 도 14의 순서도에 따라 구성된 타일 구조를 나타내며, 도 16는 이를 구성하기 위한 신택스이다.
도 14 및 도 15를 참조하면, 현재 픽쳐(50)를 적어도 두 개 이상의 타일들로 분할하기 위하여 타일 개수 정보, 타일 위치 정보, 타일 가로 크기 정보, 및 타일 세로 크기 정보를 수신할 수 있다(S51). 상기 타일 개수 정보는 현재 픽쳐를 몇 개의 타일로 분할하는지 나타내는 것이고, 상기 타일 위치 정보는 해당 타일의 위치를 알려주는 것이다. 상기 타일 개수 정보 및 상기 타일 위치 정보는 코딩 트리 블록을 포함하는 코딩 유닛의 인덱스로 표현할 수 있다. 일 실시예에서는, 상기 타일 개수 정보 및 상기 타일 위치 정보는 현재 픽쳐의 가로 및 세로를 코딩 트리 블록을 포함하는 코딩 유닛 단위로 구분하는 좌표 정보로 표현할 수도 있다. 이와 같이, 본 발명은 상기 타일 개수 정보 및 상기 타일 위치 정보를 위해 해당 타일 영역의 위치를 나타내는 정보를 산출 또는 표현하는 방법에 대하여는 제한하지 아니한다.
상기 타일 가로 크기 정보 및 상기 타일 세로 크기 정보는 해당 타일의 가로 및 세로 크기를 나타내는 것이며, 이 또한, 코딩 트리 블록을 포함하는 코딩 유닛 단위의 인덱스로 표현할 수 있다. 그러나, 상기 타일 가로 크기 정보 및 상기 타일 세로 크기 정보를 표현하는 방법도 이에 제한되지 아니한다고 할 것이다. 상기 수신된 정보들인 상기 타일 개수 정보, 상기 타일 위치 정보, 상기 타일 가로 크기 정보, 및 상기 타일 세로 크기 정보 중 적어도 하나 이상을 이용하여, 현재 픽쳐(50)를 적어도 두 개 이상의 타일(TILE 0 내지 TILE 3)로 분할할 수 있다(S52).
도 16을 참조하면, 먼저 픽쳐 파라미터 셋에 포함된 타일 개수 정보인 num_tile_in_picture_minus1(51)을 수신할 수 있다. 그리고, 해당 타일에 대한 타일 위치 정보인 tile_start_ctb_address_in_picture[i](52)를 수신할 수 있다. 또한, 타일 가로 크기 정보 및 타일 세로 크기 정보인 column_width_minus1[i](53) 및 row_height_minus1[i](54)를 수신할 수 있다. 여기서 현재 픽쳐(50)를 구성하는 타일의 개수를 N 이라고 하면, i는 0 부터 N-2까지의 값을 가질 수 있다. 즉, 0번째 타일부터 N-2번째 타일의 정보를 상기 정보로 표현할 수 있고, 마지막 타일인 N-1 번째 타일은 0 부터 N-2 번째 타일 영역을 포함하지 아니한 영역일 수 있다.
이러한 본 발명의 여러가지 실시예들을 따라 본 발명은 현재 픽쳐를 다양한 형태로 분할된 적어도 두 개 이상의 타일 구조로 구성할 수 있다. 그러나, 도 10, 도 13, 및 도 16에서 예시한 신택스는 제안하는 본 발명을 구성하기 위한 일 예일 뿐, 신택스의 설계는 이에 한정되지 아니한다.
현재 픽쳐는 적어도 두 개 이상의 타일로 구성될 수 있으며, 상기 타일은 독립적인 코딩이 가능한 단위일 수 있다. 또한, 상기 타일은 적어도 두 개 이상의 슬라이스로 구성될 수 있다. 종래의 슬라이스들은 가로 방향의 슬라이스 경계를 갖거나, 가로 방향이되 계단 형태의 슬라이스 경계를 가질 수 있었다. 그러나, 본 발명의 일 실시예에 따른 타일 내 슬라이스의 구성 방법은, 타일이 다양한 구조를 가질 수 있음에 따라, 다양한 형태의 슬라이스 경계를 가질 수 있다.
도 17은 본 발명의 일 실시예에 따른 타일 내 슬라이스의 구성 방법을 설명하는 순서도이고, 도 18은 도 17의 순서도에 따라 구성된 타일 내 슬라이스의 구조를 나타낸다.
도 17 및 도 18을 참조하면, 먼저 현재 픽쳐를 적어도 두 개 이상의 타일들로 분할할 수 있으며(S61), 예를 들면, 2 개의 타일들(TILE 0 및 TILE 1)로 분할할 수 있다. 이후, 각 타일들은 적어도 두 개 이상의 슬라이스들로 분할할 수 있다(S62). 상기 슬라이스들은 세로 방향의 경계를 갖거나 대각선 방향의 슬라이스 경계로 분할될 수 있다. 예를 들면, TILE 0은 세로 방향의 슬라이스 경계를 가지고 세로 방향의 슬라이스인 Slice segment 0 및 Slice segment 1로 분할될 수 있고, TILE 1은 대각선 방향의 슬라이스 경계를 가지고 대각선으로 분할된 슬라이스인 Slice segment 0 및 Slice segment 1로 분할될 수 있다.
이와 같이, 다양한 경계를 갖는 슬라이스로 타일을 구성함으로써, 현재 픽쳐를 영상의 특성에 따라 효율적으로 코딩하는 것이 가능하게 된다. 또한, 타일은 타일 내에 포함되는 코딩 트리 블록을 포함하는 코딩 유닛의 스캔 방법으로서, 상기 타일마다 적응적으로 타일 내 스캔 방법을 결정할 수 있다.
상기 타일 내 스캔 방법은 래스터 스캔, 버티컬 스캔, 호리젠탈 스캔 및 대각선 스캔 방법 중 하나 일 수 있고, 상기 스캔 방법 이외의 임의의 방법이 선택될 수도 있다. 상기 타일 내 스캔 방법은 슬라이스의 방향에 종속적일 수 있다. 예를 들어, 상기 타일 내 슬라이스가 세로 방향으로 분할된 경우는, 상기 타일 내 스캔 방법은 버티컬 스캔 방법일 수 있고, 상기 타일 내 슬라이스가 대각선 방향으로 분할된 경우는, 상기 타일내 스캔 방법은 래스터 스캔 방법일 수 있다. 일 실시예에서는, 상기 타일 내 스캔 방법은 슬라이스의 방향에 독립적으로 결정될 수도 있다. 예를 들어, 상기 타일 내 슬라이스가 세로 방향으로 분할된 경우는, 상기 타일 내 스캔 방법이 호리젠탈 스캔 방법일 수 있다. 만일 상기 타일 내 스캔 방법이 슬라이스의 분할 방향에 종속적인 경우에는 타일 내 슬라이스의 코딩 효율이 향상될 수 있다.
도 19a는 일반적인 방법으로 구성된 타일 내 코딩 트리 블록의 구조 및 스캔 순서에 대하여 나타내는 것이고, 도 19b는 일반적인 방법으로 구성된 복수 개의 타일 구조에서 코딩 트리 블록의 스캔 순서를 나타내는 것이다.
도 19c는 본 발명의 일 실시예에 따른 적응적인 타일 내 코딩 트리 블록의 스캔 순서를 나타내며, 도 19d는 본 발명의 일 실시예에 따른 적응적인 스캔 순서를 갖는 다양한 슬라이스 구조를 나타내는 것이다.
도 19a를 참조하면, 40개의 코딩 트리 블록들이 가로 방향으로 8개씩 총 5개 라인으로 구성된 현재 픽쳐(70a)를 종래의 타일 내 스캔 방법인 래스터 스캔 방법으로 스캔한 것이다. 이 경우, 상기 코딩 트리 블록들은 좌측 상단으로부터 우측으로 한 행을 스캔하고, 다음 행의 좌측 코딩 트리 블록으로부터 우측 방향으로 차례로 트리 블록들을 스캔하게 된다. 도 19b를 참조하면, 현재 픽쳐(70b)가 세로 방향으로 분할되어 두 개의 타일(TILE 0 및 TILE 1)으로 구성된 경우의 스캔 방법을 확인할 수 있다.
이 경우, 현재 픽쳐(70b)는 종래의 타일 내 스캔 방법에 따라 첫번째 타일(TILE 0)을 가장 상측 행의 좌측으로부터 우측 방향으로 스캔하고, 다음 행의 좌측으로부터 우측 방향으로 진행하며 코딩 블록 유닛을 스캔할 수 있다. 이러한 방법으로 첫번째 타일(TILE 0)을 모두 스캔하고, 두번째 타일(TILE 0)의 가장 상측 행의 좌측으로부터 가장 하단의 우측 코딩 블록 유닛까지 우측 방향으로 진행하면서 순차적으로 스캔할 수 있다. 종래에는 타일의 구성 방법에 상관없이 이러한 래스터 스캔 방법으로 코딩 블록 유닛을 스캔할 수 있다. 이하에서는, 본 발명의 일 실시예에 따른 타일이 적어도 하나 이상의 슬라이스로 구성되는 경우, 타일 내 스캔 방법에 대하여 살펴보기로 한다.
도 19c를 참조하면, 본 발명의 일 실시예에 따른 타일 내 스캔 방법은 타일 별로 적응적으로 결정되는 타일 내 스캔 방법을 이용하여 코딩 트리 블록을 포함하는 코딩 유닛을 스캔할 수 있다. 예를 들어, 현재 픽쳐(70c)가 세로 방향으로 분할되어 두 개의 타일(TILE 0 및 TILE 1)으로 구성된 경우, 첫번째 타일(TILE 0)의 코딩 트리 블록을 포함하는 코딩 유닛들은 버티컬 스캔 방법을 이용하여 스캔할 수 있다. 또한, 두번째 타일(TILE 1)의 코딩 트리 블록을 포함하는 코딩 유닛들은 대각선 방향의 스캔 방법과 같이 타일 별로 상이한 방법으로 스캔될 수 있다. 본 발명의 일 실시예에서는 타일 내 스캔 방법으로 버티컬 스캔 방법 및 대각선 방향의 스캔 방법을 예시하고 있으나, 본 발명의 타일 내 스캔 방향 및 순서는 이에 제한되지 아니한다. 또한, 본 발명의 일 실시예에 따른 타일 내 스캔 방법은, 타일에 포함되는 코딩 트리 블록 및 코딩 유닛의 부호화 및 복호화 순서와 동일하지 아니할 수 있다.
도 19d를 참조하면, 본 발명의 일 실시예에 따른 타일 내 슬라이스들은 가변적인 구조를 가질 수 있다. 예를 들어, 현재 픽쳐(70d)는 두 개의 세로 방향의 타일들로 분할될 수 있고, 상기 타일은 각각 두 개의 슬라이스 영역으로 구성될 수 있다. 첫번째 타일(TILE 0)은 세로 방향으로 연장된 계단 형태의 슬라이스 경계를 이용하여 분할될 수 있으며, 첫번째 슬라이스는 적응적인 타일 내 스캔 순서상 0 내지 7 의 인덱스를 갖는 코딩 트리 블록들로 구성될 수 있다. 첫번째 타일(TILE 0)의 두번째 타일은 타일 내 스캔 순서상 8 내지 14 의 인덱스를 갖는 코딩 트리 블록들로 구성될 수 있다.
또한, 두번째 타일(TILE 1)은 대각선 방향으로 연장된 슬라이스 경계를 이용하여 분할될 수 있으며, 첫번째 슬라이스는 적응적인 타일 내 스캔 순서상 15 내지 29 의 인덱스를 갖는 코딩 트리 블록들로 구성될 수 있다. 두번째 타일(TILE 1)의 두번째 슬라이스는 타일 내 스캔 순서상 30 내지 39 의 인덱스를 갖는 코딩 트리 블록들로 구성될 수 있다.
일 실시예에서, 본 발명의 타일 내 스캔 방법은 도 19a에서 나타낸 바와 같은 코딩 트리 블록의 스캔 방법과 매칭될 수 있다. 동일 픽쳐 내의 코딩 트리 블록의 스캔 순서는 각 코딩 트리 블록의 위치 정보를 포함하기 때문에, 복호화된 코딩 블록의 정보를 픽쳐 내의 정확한 위치에 저장할 수 있다. 여기서 본 발명의 타일 내 코딩 트리 블록들의 스캔 방법과 매칭되는 코딩 트리 블록의 스캔 방법으로 도 19a의 스캔 순서를 예시하나, 본 발명은 이에 한정되지는 아니한다.
예를 들어, 도 19d를 참조하면, 첫번째 타일(TILE 0)의 첫번째 슬라이스를 구성하는 코딩 트리 블록들을 본 발명의 일 실시예에 따른 타일 내 스캔 방법으로 스캔한 순서와 일반적인 스캔 방법으로 코딩 트리 블록을 스캔한 순서와 매핑시킨 정보를 이용할 수 있으며, 이러한 매핑 예를 하기 표 1에 나타낸다.
CtbAddrInAdaptiveTs CtbAddrInTs CtbAddrInRs
0 0 0
1 3 8
2 6 16
3 9 24
4 12 32
5 1 1
6 4 9
7 7 17
표 1의 CtbAddInAdaptiveTs 는 제 1 인덱스로서, 본 발명의 일 실시예에 따른 타일 내 스캔 순서에 따른 코딩 트리 블록들의 인덱스를 나타낼 수 있다. 예를 들면, 도 19d 의 첫번째 타일의 첫번째 슬라이스는 상기 제 1 인덱스에 0 내지 7의 값을 가질 수 있다. CtbAddInTs 는 제 2 인덱스로서, 도 19b에서와 같이 각 타일이 포함하는 코딩 트리 블록 전체를 가로 방향인 래스터 스캔 방법에 따라 인덱싱하는 경우, 도 19d의 Tile 0 내부의 Slice 0가 포함하는 코딩 트리 블록들의 인덱스를 도 19b의 인덱스로 표현한 것이다. 또한, CtbAddInRs는 제 3 인덱스로서, 도 19a에서와 같이 현재 픽쳐를 적어도 두 개 이상의 타일들로 나누지 않았다는 가정하여, 현재 픽쳐 전체의 코딩 블록 유닛들을 래스터 스캔 방법에 따라 인덱싱하는 경우, 도 19d의 Tile 0 내부의 Slice 0가 포함하는 코딩 트리 블록들의 인덱스를 도 19a의 인덱스로 표현한 것이다. 예를 들면, 상기 제 1 인덱스 중 '6'의 값을 갖는 코딩 트리 블록은 상기 제 2 인덱스의 인덱스 값 '4'로 매핑된 후, 상기 제 3 인덱스의 인덱스 값 '9'로 매핑될 수 있다. 또는, 상기 제 1 인덱스에서 '6'의 값을 갖는 코딩 트리 블록은 상기 제 3 인덱스의 '9'의 값으로 바로 매핑될 수도 있으며, 이러한 매핑 순서 및 방법은 본 발명에 제한되지 아니한다. 일 실시예에서, 슬라이스는 상기 제 1 인덱스 또는 상기 제 2 인덱스를 따라 상기 슬라이스 내의 코딩 트리 블록을 구성할 수 있다. 그러나, 상기 코딩 트리 블록을 복호화하는 순서는 이에 제한하지 아니하며, 다른 스캔 방법에 따라 복호화할 수도 있다.
도 20은 본 발명의 일 실시예에 따른 적응적인 스캔 순서를 갖는 타일을 구성하기 위한 신택스이다.
도 20을 참조하면, 본 발명의 일 실시예에 따른 타일별로 적응적인 타일 스캔 방법을 이용하는지 여부를 나타내는 적응적 타일 스캔 플래그인 adaptive_ctb_scan_in_tile_flag(71)를 수신할 수 있다. 상기 적응적 타일 스캔 플래그가 0 인 경우에는, 기존의 방법인 래스터 스캔으로 타일 내 코딩 트리 블록들을 스캔할 수 있다. 만일 상기 적응적 타일 스캔 플래그가 1 인 경우에는, 타일 스캔 방식을 나타내는 타일 스캔 방식 정보인 scan_dir_in_tile[i](72)을 더 수신하여, 상기 타일 스캔 방식 정보가 나타내는 타일 스캔 방식에 따라 타일 내 코딩 트리 블록들을 스캔할 수 있다. 그러나, 도 20의 신택스는 본 발명의 일 실시예에 따른 타일 내 코딩 트리 블록 및 코딩 유닛을 스캔하는 방법의 일 예에 지나지 아니하며, 본 발명은 이에 한정되지 아니한다. 또한, 상기 스캔 방법은 픽쳐 파라미터 셋 또는 상위 파라미터로부터 획득될 수 있다.
본 발명은 현재 픽쳐에 포함되는 코딩 트리 블록 또는 코딩 유닛의 코딩 순서도 기존의 방법에 제한되지 아니하고 다양한 방법으로 변경할 수 있다. 도 21a 및 도 21b는 본 발명의 일 실시예에 따른 적응적인 부호화 및 복호화 순서를 갖는 타일 및 코딩 트리 블록의 예시이다.
도 21a를 참조하면, 현재 픽쳐를 구성하는 타일 영역마다 타일 내 부호화 및 복호화 순서를 변경하여 적용할 수 있다. 이로써, 해당 타일이 두 개 이상의 슬라이스로 구성되는 경우, 상기 슬라이스 영역들의 모양을 결정할 수 있으며, 상기 슬라이스 내의 코딩 트리 블록을 포함하는 코딩 유닛의 부호화 및 복호화 순서도 결정할 수 있다. 다만, 상기 코딩 트리 블록을 포함하는 코딩 유닛의 부호화 및 복호화 순서 및 방법은 이에 제한되지 아니한다.
도 21b를 참조하면, 현재 픽쳐의 코딩 트리 블록이 복수 개의 코딩 블록으로 분할되어 있는 경우, Z 모양의 스캔 방법(좌상->우상->좌하->우하) 뿐만 아니라 위 아래 반전된 N 모양의 스캔 방법(좌상->좌하->우상->우하)을 이용하여 각 코딩 블록의 부호화 및 복호화 순서를 결정할 수 있다. 상기 스캔 방법 및 순서는 이에 제한되지 아니한다.
일 실시예에서는, 코딩 트리 블록 내의 코딩 블록의 스캔 순서는 타일 내 슬라이스의 분할 방향에 종속될 수 있거나 독립적일 수 있다. 도 21a를 참조하여 다시 설명하면, 예를 들어, 첫번째 타일(TILE 0)은 세로 방향의 슬라이스로 분할되었기 때문에, 코딩 트리 블록 내의 코딩 블록은 위 아래 반전된 N 방향 순서로 부호화 및 복호화될 수 있다. 또한, 타일이 가로 방향의 슬라이스로 분할된 경우에는, 코딩 트리 블록 내의 코딩 블록은 Z 방향으로 부호화 및 복호화 될 수 있다.
이와 같이, 본 발명의 일 실시예에 따른 타일 구조의 구성 방법은, 현재 픽쳐에 포함되는 적어도 두 개 이상의 타일이 상기 현재 픽쳐의 세로 또는 가로 길이보다 짧은 적어도 하나 이상의 분할 길이인 열 분할 또는 행 분할을 이용하여 분할됨으로써, 다양한 형태의 구조를 갖는 타일을 구성하여 이미지의 코딩 효율을 향상시킬 수 있다. 또한, 본 발명의 다른 실시예인 타일 내 슬라이스의 구성 방법 및 스캔 방법은, 타일을 구성하는 적어도 두 개 이상의 슬라이스의 경계를 세로 또는 대각선 방향으로 결정함으로써, 코딩 효율을 높일 수 있고, 상기 타일 내의 코딩 트리 블록 또는 코딩 블록을 타일별로 적응적인 부호화 및 복호화 순서에 따라 부호화 및 복호화를 수행함으로써, 픽쳐에 맞춰 코딩 효율이 향상될 수 있다.
이상에서 설명한 본 발명이 전술한 실시예 및 첨부된 도면에 한정되지 않으며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러가지 치환, 변형 및 변경이 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

Claims (6)

  1. 현재 픽쳐를 열 분할 정보 및 행 분할 정보 중 적어도 하나를 이용하여 복수 개의 타일로 분할하는 단계;
    상기 분할된 복수 개의 타일 중 적어도 2 이상의 타일들의 병합 여부를 나타내는 병합 플래그 정보를 확인하는 단계;
    상기 병합 플래그 정보가 상기 적어도 2 이상의 타일들을 병합할 것을 나타내는 경우, 상기 분할된 복수 개의 타일 중 적어도 2 이상의 타일들을 병합하여 상위 타일 구조를 형성하는 단계를 포함하며,
    상기 상위 타일 구조를 형성하는 단계는 상기 상위 타일 구조의 타일 병합 정보를 확인하는 단계를 포함하고,
    상기 타일 병합 정보는 상기 상위 타일 구조의 왼쪽-상위 타일을 기준으로 가로 방향으로의 병합 타일의 개수와 세로 방향으로의 병합 타일의 개수를 나타내는 타일 구조의 구성 방법.
  2. 제 1 항에 있어서,
    상기 병합된 타일들은 서로 인접하는 것을 특징으로 하는 타일 구조의 구성 방법.
  3. 제 1 항에 있어서,
    상기 상위 타일 구조를 형성하는 단계는
    상기 분할된 타일 중 병합되는 타일을 나타내는 타일 인덱스 정보를 확인하는 단계를 포함하는 타일 구조의 구성 방법.
  4. 제 1 항에 있어서,
    상기 상위 타일 구조는 비정방형 또는 정방형인 타일 구조의 구성 방법.
  5. 제 1 항에 있어서,
    상기 상위 타일 구조는 직사각형의 슬라이스(rectangular slice)을 포함하는 타일 구조의 구성 방법.
  6. 제 1 항에 있어서,
    상기 열 분할 및 상기 행 분할이 타일 개수 정보, 타일 크기 정보, 분할 방향 정보, 분할 영역 개수 정보, 타일 크기 정보, 타일 병합 플래그 정보, 타일 병합 개수 정보, 타일 인덱스 정보, 타일 위치 정보, 타일 가로 크기 정보, 및 타일 세로 크기 정보 중 적어도 하나 이상을 이용하여 결정되는 단계를 포함하는 타일 구조의 구성 방법.
KR1020220162621A 2017-08-31 2022-11-29 타일 구조의 구성 방법 및 이의 장치 KR20220165694A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220162621A KR20220165694A (ko) 2017-08-31 2022-11-29 타일 구조의 구성 방법 및 이의 장치
KR1020240100054A KR20240122378A (ko) 2017-08-31 2024-07-29 타일 구조의 구성 방법 및 이의 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170110978A KR20190024212A (ko) 2017-08-31 2017-08-31 타일 구조의 구성 방법 및 이의 장치
KR1020220162621A KR20220165694A (ko) 2017-08-31 2022-11-29 타일 구조의 구성 방법 및 이의 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020170110978A Division KR20190024212A (ko) 2017-08-31 2017-08-31 타일 구조의 구성 방법 및 이의 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020240100054A Division KR20240122378A (ko) 2017-08-31 2024-07-29 타일 구조의 구성 방법 및 이의 장치

Publications (1)

Publication Number Publication Date
KR20220165694A true KR20220165694A (ko) 2022-12-15

Family

ID=65527776

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020170110978A KR20190024212A (ko) 2017-08-31 2017-08-31 타일 구조의 구성 방법 및 이의 장치
KR1020220162621A KR20220165694A (ko) 2017-08-31 2022-11-29 타일 구조의 구성 방법 및 이의 장치
KR1020240100054A KR20240122378A (ko) 2017-08-31 2024-07-29 타일 구조의 구성 방법 및 이의 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020170110978A KR20190024212A (ko) 2017-08-31 2017-08-31 타일 구조의 구성 방법 및 이의 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020240100054A KR20240122378A (ko) 2017-08-31 2024-07-29 타일 구조의 구성 방법 및 이의 장치

Country Status (3)

Country Link
US (3) US11297317B2 (ko)
KR (3) KR20190024212A (ko)
WO (1) WO2019045445A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112740680A (zh) * 2018-09-19 2021-04-30 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
KR20230163584A (ko) * 2019-02-28 2023-11-30 엘지전자 주식회사 Aps 시그널링 기반 비디오 또는 영상 코딩
US20220174295A1 (en) * 2019-03-11 2022-06-02 Lg Electronics Inc. Luma mapping- and chroma scaling-based video or image coding
MX2021012283A (es) 2019-04-08 2022-01-18 Lg Electronics Inc Método y dispositivo de codificación basado en la partición de imágenes.
WO2020209478A1 (ko) * 2019-04-08 2020-10-15 엘지전자 주식회사 픽처를 복수의 타일들로 분할하는 방법 및 장치
CN112789860A (zh) * 2019-04-17 2021-05-11 株式会社 Xris 用于对图像信号进行编码/解码的方法及其装置
JP7492542B2 (ja) 2019-06-20 2024-05-29 エックスリス、コーポレーション 映像信号の符号化/復号化方法及びそのための装置
MX2021015419A (es) * 2019-06-22 2022-01-24 Xris Corp Método de codificación/descodificación de la señal de imagen y dispositivo para el mismo.
CN114223197A (zh) * 2019-08-12 2022-03-22 韩华泰科株式会社 用于高级图像划分和图像编码/解码的方法和装置
AU2020388606A1 (en) 2019-11-20 2022-04-21 Xris Corporation Image signal encoding/decoding method and apparatus therefor
US20210176475A1 (en) * 2019-12-05 2021-06-10 Mediatek Inc. Specifying Layout In Video Pictures
CN115152210A (zh) 2020-02-24 2022-10-04 字节跳动有限公司 子图片的高度的推导
KR20220143857A (ko) 2020-03-03 2022-10-25 바이트댄스 아이엔씨 비디오 코딩에서의 저 주파수 비-분리가능 변환 시그널링
EP4120681A4 (en) * 2020-03-09 2024-03-06 LG Electronics, Inc. IMAGE CODING/DECODING METHOD AND APPARATUS FOR SELECTIVE ENCODING SIZE INFORMATION RECTANGULAR SLICE AND METHOD FOR TRANSMITTING A BIT STREAM
WO2023195819A1 (ko) * 2022-04-07 2023-10-12 엘지전자 주식회사 적응적 슬라이스 스캔 방식에 기반한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장하는 기록 매체

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130085389A (ko) * 2012-01-19 2013-07-29 삼성전자주식회사 서브영역별로 엔트로피 부호화의 병렬 처리가 가능한 비디오 부호화 방법 및 장치, 서브영역별로 엔트로피 복호화의 병렬 처리가 가능한 비디오 복호화 방법 및 장치
KR102351132B1 (ko) * 2012-06-26 2022-01-13 엘지전자 주식회사 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
US9621905B2 (en) * 2012-06-29 2017-04-11 Qualcomm Incorporated Tiles and wavefront parallel processing
AU2013322041B2 (en) * 2012-09-26 2017-03-09 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
US9749627B2 (en) * 2013-04-08 2017-08-29 Microsoft Technology Licensing, Llc Control data for motion-constrained tile set
KR20150033194A (ko) * 2013-09-23 2015-04-01 삼성전자주식회사 병렬 부호화/복호화 방법 및 장치

Also Published As

Publication number Publication date
WO2019045445A1 (ko) 2019-03-07
US11297317B2 (en) 2022-04-05
US11917149B2 (en) 2024-02-27
KR20190024212A (ko) 2019-03-08
US20240155125A1 (en) 2024-05-09
US20220394251A1 (en) 2022-12-08
KR20240122378A (ko) 2024-08-12
US20210160493A1 (en) 2021-05-27

Similar Documents

Publication Publication Date Title
US11917149B2 (en) Method for constructing tile structure and apparatus therefor
KR102424328B1 (ko) 쿼드 트리를 이용한 블록 정보 부/복호화 방법 및 이러한 방법을 사용하는 장치
KR102435500B1 (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR20200104251A (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
KR20150096375A (ko) 영상 인코딩/디코딩 방법 및 이를 이용하는 장치
KR20230054805A (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR102698394B1 (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR102345458B1 (ko) 예측 모션 벡터 리스트를 구성하는 방법 및 이의 장치
KR101468078B1 (ko) 화면 내 예측 방법 및 장치
KR20210035062A (ko) 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
KR20220019731A (ko) 비디오 부호화/복호화 방법 및 장치
KR102435502B1 (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR102447951B1 (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR20210118768A (ko) 비디오 신호 처리 방법 및 장치
KR102523384B1 (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR20210123950A (ko) 비디오 신호 처리 방법 및 장치
KR102534604B1 (ko) 비디오 신호의 부호화 또는 복호화 방법 및 장치
KR20240157009A (ko) 비디오 신호의 복호화 방법 및 이의 장치
KR20210082877A (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
KR20220134476A (ko) 영상 신호 부호화/복호화 방법 및 이를 기초로 생성된 비트스트림을 저장하는 기록 매체
KR20210082876A (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
KR20210103731A (ko) 비디오 신호 처리 방법 및 장치
KR20210085404A (ko) 영상 신호 부호화/복호화 방법 및 이를 위한 장치
KR20210075552A (ko) 비디오 신호 처리 방법 및 장치
KR20210120243A (ko) 비디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E601 Decision to refuse application