KR20210074388A

KR20210074388A - 코딩 유형 또는 코딩 트리 유형의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 방법 및 장치

Info

Publication number: KR20210074388A
Application number: KR1020217015420A
Authority: KR
Inventors: 파브리스 레린넥; 프랑크 갈핀; 필립 보흐; 에두아르 프랑수아
Original assignee: 인터디지털 브이씨 홀딩스 인코포레이티드
Priority date: 2018-10-25
Filing date: 2019-10-24
Publication date: 2021-06-21
Also published as: WO2020086817A1; BR112021007038A2; US20210344962A1; EP3871419A1; CN112913248A

Abstract

상이한 구현들이 설명되고, 특히, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소 또는 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 구현들이 제시된다. 구현에 따르면, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소가 인코딩/디코딩되고, 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 픽처의 직사각형 영역 중 하나이고, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용되고; 픽처의 적어도 하나의 영역의 코딩 트리 유형이 암시적으로 또는 명시적으로 획득되고, 코딩 트리 유형은 공동 또는 듀얼 중 하나이고; 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들이 인코딩/디코딩된다. 변형 구현에서, 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소가 인코딩/디코딩되고, 픽처의 적어도 하나의 영역의 코딩 유형이 암시적으로 또는 명시적으로 획득된다.

Description

코딩 유형 또는 코딩 트리 유형의 시그널링을 이용한 비디오 인코딩 및 디코딩을 위한 방법 및 장치

본 실시예들 중 적어도 하나는 일반적으로, 예를 들어, 비디오 인코딩 또는 디코딩을 위한 방법 또는 장치에 관한 것이고, 더 상세하게는, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소 또는 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소의 시그널링을 이용한 방법 또는 장치에 관한 것이다.

하나 이상의 구현들의 기술 분야는 일반적으로 비디오 압축과 관련된다. 적어도 일부 실시예들은 HEVC(HEVC는 "ITU-T H.265 Telecommunication standardization sector of ITU (10/2014), series H: audiovisual and multimedia systems, infrastructure of audiovisual services - coding of moving video, High efficiency video coding, Recommendation ITU-T H.265"에서 설명된 H.265 및 MPEG-H Part 2로 또한 공지된 고효율 비디오 코딩(High Efficiency Video Coding)을 지칭함)와 같은 기존의 비디오 압축 시스템들과 비교하여 또는 VVC(JVET(Joint Video Experts Team)에 의해 개발되고 있는 새로운 표준인 다기능 비디오 코딩(Versatile Video Coding))와 같은 개발중인 비디오 압축 시스템들과 비교하여 압축 효율을 개선하는 것과 관련된다.

높은 압축 효율을 달성하기 위해, 이미지 및 비디오 코딩 방식들은 통상적으로 비디오 콘텐츠에서 공간적 및 시간적 리던던시를 레버리지하기 위해 모션 벡터 예측 및 변환을 포함하는 이미지의 파티셔닝, 예측을 이용한다. 일반적으로, 인트라 또는 인터 프레임 상관을 활용하기 위해 인트라 또는 인터 예측이 사용되며, 예측 에러들 또는 예측 잔차들로 종종 표시되는 원래의 이미지와 예측된 이미지 사이의 차이들은 변환, 양자화 및 엔트로피 코딩된다. 비디오를 재구성하기 위해, 압축된 데이터는 엔트로피 디코딩, 역양자화, 역변환 및 예측에 대응하는 역 프로세스들에 의해 디코딩된다.

새로운 비디오 코딩 방식들의 출현으로, 파티셔닝 방식은 더 복잡해지고 높은 압축을 달성하기 위해 루마 및 크로마에 대한 듀얼 코딩 트리를 허용한다. 또한, 인트라 및 넌-인트라 픽처 둘 모두에 대해 공동 또는 분리된 코딩 트리를 허용하는 것이 바람직하다. 따라서, 인트라 및 넌-인트라 픽처 둘 모두에서 공동 또는 분리된 코딩 트리를 일관된 방식으로 허용하는 신택스를 시그널링하기 위한 방법이 바람직하다.

본 발명의 목적은 종래 기술의 단점들 중 적어도 하나를 극복하는 것이다. 이를 위해, 적어도 하나의 실시예의 일반적 양상에 따르면, 비디오 인코딩을 위한 방법이 제시되고, 방법은, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 단계 - 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 픽처의 직사각형 영역 중 하나이고, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -; 픽처의 적어도 하나의 영역의 코딩 트리 유형을 획득하는 단계 - 코딩 트리 유형은 공동 또는 듀얼 중 하나임 -; 및 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하는 단계를 포함한다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 비디오 인코딩을 위한 방법이 제시되고, 방법은, 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 단계 - 코딩 트리 유형은 듀얼 또는 공동 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 픽처의 직사각형 영역 중 하나이고, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -; 픽처의 적어도 하나의 영역의 코딩 유형을 획득하는 단계 - 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나임 -; 및 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하는 단계를 포함한다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 비디오 디코딩을 위한 방법이 제시되고, 방법은, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하는 단계 - 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 픽처의 직사각형 영역 중 하나이고, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -; 픽처의 적어도 하나의 영역의 코딩 트리 유형을 획득하는 단계 - 상기 코딩 트리 유형은 공동 또는 듀얼 중 하나임 -; 및 상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하는 단계를 포함한다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 비디오 디코딩을 위한 방법이 제시되고, 방법은, 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하는 단계 - 코딩 트리 유형은 듀얼 또는 공동 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 픽처의 직사각형 영역 중 하나이고, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -; 픽처의 적어도 하나의 영역의 코딩 유형을 획득하는 단계 - 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나임 -; 및 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하는 단계를 포함한다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 인코딩 방법들의 실시예들 중 임의의 하나를 구현하기 위한 수단을 포함하는 비디오 인코딩을 위한 장치가 제시된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 디코딩 방법들의 실시예들 중 임의의 하나를 구현하기 위한 수단을 포함하는 비디오 디코딩을 위한 장치가 제시된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 하나 이상의 프로세서들 및 적어도 하나의 메모리를 포함하는, 비디오 인코딩을 위한 장치가 제공된다. 하나 이상의 프로세서들은 인코딩 방법들의 실시예들 중 임의의 하나를 구현하도록 구성된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 하나 이상의 프로세서들 및 적어도 하나의 메모리를 포함하는, 비디오 디코딩을 위한 장치가 제공된다. 하나 이상의 프로세서들은 디코딩 방법들의 실시예들 중 임의의 하나를 구현하도록 구성된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 코딩 트리 유형을 획득하는 것은 코딩 유형으로부터 코딩 트리 유형을 유도하는 것을 포함하고, 공동 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하고, 듀얼 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시하고, 코딩 트리 유형은 적어도 하나의 영역의 코딩 유형이 인트라 코딩인 경우 듀얼이고, 코딩 트리 유형은 적어도 하나의 영역의 코딩 유형이 인터 코딩인 경우 공동이다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 코딩 트리 유형을 획득하는 것은 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩 또는 인코딩하는 것을 포함하고, 공동 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하고, 듀얼 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시한다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소는 적어도 하나의 영역의 헤더 데이터 또는 적어도 하나의 영역의 제1 CTU의 헤더 데이터로부터 디코딩되거나 그 안에서 인코딩된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 공동 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하고, 듀얼 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시한다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 픽처의 적어도 하나의 영역에 대한 코딩 유형은 코딩 트리 유형으로부터 유도되고, 적어도 하나의 영역의 코딩 유형은 코딩 트리 유형이 듀얼인 경우 인트라 코딩이고, 적어도 하나의 영역의 코딩 유형은 코딩 트리 유형이 공동인 경우 인터 코딩이다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소 데이터가 인코딩 또는 디코딩된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소는 적어도 하나의 영역의 헤더 데이터 또는 적어도 하나의 영역의 제1 CTU의 헤더 데이터로부터 디코딩되거나 그 안에서 인코딩된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 코딩 트리 유형은 크기 RegionTypeSize의 픽처의 직사각형 영역과 관련되고, RegionTypeSize는 시퀀스-레벨 헤더 정보 또는 이미지-레벨 헤더 정보로부터 디코딩되거나 그 안에서 인코딩된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 선행 설명들 중 임의의 것의 방법 또는 장치에 따라 생성된 데이터 콘텐츠를 포함하는 비일시적 컴퓨터 판독가능 매체가 제시된다.

적어도 하나의 실시예의 다른 일반적 양상에 따르면, 선행 설명들 중 임의의 것의 방법 또는 장치에 따라 생성된 비디오 데이터를 포함하는 신호가 제공된다.

또한, 본 실시예들 중 하나 이상은 전술된 방법들 중 임의의 것에 따라 비디오 데이터를 인코딩 또는 디코딩하기 위한 명령들이 저장된 컴퓨터 판독가능 저장 매체를 제공한다. 또한, 본 실시예들은 전술된 방법들에 따라 생성된 비트스트림이 저장된 컴퓨터 판독가능 저장 매체를 제공한다. 본 실시예들은 또한 앞서 설명된 방법들에 따라 생성된 비트스트림을 송신하기 위한 방법 및 장치를 제공한다. 본 실시예들은 또한 설명된 방법들 중 임의의 것을 수행하기 한 명령들을 포함하는 컴퓨터 프로그램 제품을 제공한다.

도 1은 압축된 HEVC 픽처를 표현하기 위한 코딩 트리 유닛(CTU) 및 코딩 트리(CT) 개념들의 예를 예시한다.
도 2는 코딩 트리 유닛을 코딩 유닛들, 예측 유닛들 및 변환 유닛들로 분할하는 예를 예시한다.
도 3은 쿼드-트리 플러스 바이너리-트리(Quad-Tree plus Binary-Tree; QTBT) 방식에서 코딩 유닛 및 연관된 코딩 트리의 파티셔닝의 예를 예시한다.
도 4 및 도 5는 CU 바이너리 또는 트리플 트리 파티셔닝의 예들을 예시한다.
도 6 및 도 7은 적어도 하나의 실시예의 일반적인 양상에 따른 디코딩 방법의 다양한 예들을 예시한다.
도 8 및 도 9는 적어도 하나의 실시예의 일반적인 양상에 따른 인코딩 방법의 다양한 예들을 예시한다.
도 10, 도 11 및 도 12는 다양한 실시예들에 따른 타일 배열들의 다양한 예들을 예시한다.
도 13, 도 14 및 도 15는 다양한 실시예들에 따라 CTU에 대한 코딩 유형 또는 코딩 트리 유형을 할당하는 다양한 예들을 예시한다.
도 17은 실시예들의 다양한 양상들이 구현될 수 있는 비디오 인코더의 실시예의 블록도를 예시한다.
도 18은 실시예들의 다양한 양상들이 구현될 수 있는 비디오 디코더의 실시예의 블록도를 예시한다.
도 19는 실시예들의 다양한 양상들이 구현될 수 있는 예시적인 장치의 블록도를 예시한다.

도면들 및 설명들은, 명료성을 위해, 통상적인 인코딩 및/또는 디코딩 디바이스들에서 발견되는 많은 다른 요소들을 제거하면서, 본 원리들의 명확한 이해와 관련된 요소들을 예시하기 위해 단순화되었음을 이해해야 한다. 제1 및 제2라는 용어들이 본 명세서에서 다양한 요소들을 설명하기 위해 사용될 수 있지만, 이러한 요소들은 이러한 용어들에 의해 제한되어서는 안됨을 이해할 것이다. 이러한 용어들은 하나의 요소를 다른 요소로부터 구별하기 위해서만 사용된다.

이미지의 인코딩/디코딩과 관련하여 다양한 실시예들이 설명된다. 이들은 이미지들의 슬라이스 또는 타일, 타일 그룹 또는 전체 시퀀스와 같은 이미지의 일부를 인코딩/디코딩하기 위해 적용될 수 있다.

다양한 방법들이 앞서 설명되었고, 방법들 각각은 설명된 방법을 달성하기 위한 하나 이상의 단계들 또는 동작들을 포함한다. 방법의 적절한 동작을 위해 단계들 또는 동작들의 특정 순서가 요구되지 않으면, 특정 단계들 및/또는 동작들의 순서 및/또는 사용은 수정되거나 결합될 수 있다.

적어도 일부 실시예들은 신택스가 시그널링되는 비디오를 인코딩 또는 디코딩하기 위한 방법에 관한 것으로, 신택스는 비디오 시퀀스에서 인코딩/디코딩할 픽처 영역의 인트라/인터 또는 I/P/B 유형을 표현하고, 코딩 트리 유형은 일부 CTU(코딩 트리 유닛)를 블록들 또는 코딩 유닛들(CU)로 분할하기 위해 사용된다.

HEVC 비디오 압축 표준에서, 픽처는, 통상적으로 크기가 64x64, 128x128 또는 256x256 픽셀들인 소위 코딩 트리 유닛들(CTU)로 분할된다. 도 1은 압축된 HEVC 픽처를 표현하기 위한 코딩 트리 유닛(CTU) 및 코딩 트리(CT) 개념들의 예를 예시한다. 각각의 CTU는 압축 도메인에서 코딩 트리에 의해 표현된다. 이는, 도 1에 예시된 바와 같이, CTU의 쿼드-트리 부분이고, 여기서 각각의 잎은 코딩 유닛(CU)으로 지칭된다. 그 다음, 각각의 CU에는 인트라 또는 인터 예측 파라미터들(예측 정보)가 부여된다. 이를 수행하기 위해, 이는 하나 이상의 예측 유닛(PU)들로 공간적으로 파티셔닝되며 각각의 PU에는 일부 예측 정보가 할당된다. 도 2에 도시된 바와 같이, 인트라 또는 인터 코딩 모드는 CU 레벨에서 할당된다.

새롭게 등장하는 비디오 압축 도구들은 보다 유연한 방식으로 픽처 데이터를 표현하기 위해 압축된 도메인에 코딩 트리 유닛 표현을 포함한다. 코딩 트리의 이러한 보다 유연한 표현의 이점은 이것이 HEVC 표준의 CU/PU/TU 배열에 비해 증가된 압축 효율을 제공한다는 점이다.

도 3은 쿼드-트리 플러스 바이너리-트리(QTBT) 방식에서 코딩 유닛 및 연관된 코딩 트리의 파티셔닝의 예를 예시한다. 쿼드-트리 플러스 바이너리-트리(QTBT) 코딩 도구는 이러한 증가된 유연성은 제공한다. 이는, 코딩 유닛들이 쿼드-트리 방식 및 바이너리-트리 방식 둘 모두로 분리될 수 있는 코딩 트리로 구성된다. 코딩 트리 유닛의 이러한 코딩 트리 표현은 도 3에 예시된다.

코딩 유닛의 분리는 인코더 측에서, 최소 레이트 왜곡 비용으로 CTU의 QTBT 표현을 결정하는 것으로 구성된 레이트 왜곡 최적화 절차를 통해 판정된다.

QTBT 기술에서, CU는 정사각형 또는 직사각형 형상을 갖는다. 코딩 유닛의 크기는 항상 2의 거듭제곱이고 통상적으로 4 내지 128에 이른다.

코딩 유닛에 대한 이러한 다양한 직사각형 형상들에 추가로, 이러한 새로운 CTU 표현은 HEVC와 비교하여 다음과 같은 상이한 특성들을 갖는다.

CTU의 QTBT 분해는 2개의 스테이지들로 이루어지는데, 즉, 먼저 CTU가 쿼드-트리 방식으로 분리되고, 이어서 각각의 쿼드-트리 잎이 바이너리 방식으로 추가로 분할될 수 있다. 이는 도 3의 우측에 예시되고, 여기서 실선들은 쿼드-트리 분해 위상을 표현하고, 파선들은 쿼드-트리 잎들에 공간적으로 내장된 바이너리 분해를 표현한다.

내부 슬라이스들에서, 루마 및 크로마 블록 파티셔닝 구조는 분리되어 독립적으로 판정된다.

예측 유닛들 또는 변환 유닛으로의 CU 파티셔닝이 더 이상 이용되지 않는다. 즉, 각각의 코딩 유닛은 체계적으로 단일 예측 유닛(2Nx2N 예측 유닛 파티션 유형) 및 단일 변환 유닛(변환 트리로의 분할 없음)으로 이루어진다.

마지막으로, 일부 다른 CU 바이너리 또는 트리플 트리 파티셔닝이 또한 CTU의 코딩 트리의 표현에서 이용될 수 있다. 도 4 및 도 5는 CU 바이너리 또는 트리플 트리 파티셔닝의 예들을 예시한다. 추가적인 비대칭 바이너리 및 트리 분리 모드들에서, 비대칭 바이너리 분리 모드들 중 하나, 예를 들어, HOR_UP(horizontal-up)을 통해 분리될 크기(w, h)(폭 및 높이)를 갖는 직사각형 코딩 유닛은 개개의 직사각형 크기들

및

를 갖는 2개의 서브-코딩 유닛들을 도출할 것이다.

또한, 소위 CU의 트리플 트리 파티셔닝이 사용되어, 도 5에 주어진 가능한 파티션들의 세트를 도출할 수 있다. 트리플 트리는 고려된 배향에서 부모 CU에 상대적인 크기(1/4,1/2,1/4)의 트리 서브-CU로 CU를 분리하는 것으로 구성된다.

전술된 새로운 토폴로지들을 사용하여 상당한 코딩 효율 개선이 이루어진다. 특히, 일 크기의 루마 컴포넌트와 다른 측의 2개의 크로마 컴포넌트들 사이에서 코딩 트리의 분리로 인해, 크로마에서 상당한 이득이 획득된다.

그러나, 현재 표준화되고 있는 VVC 비디오 압축에서 일관된 방식으로 루마와 크로마 컴포넌트들 사이의 분리된 또는 듀얼 코딩 트리의 관리가 특정되는 것이 바람직하다. 이러한 일관성은 인트라 및 넌-인트라 픽처 둘 모두에서 공동 또는 분리된 코딩 트리를 이용할 가능성을 포함한다. 따라서, 인트라 및 넌-인트라 픽처 둘 모두에서 공동 또는 분리된 코딩 트리를 허용하는 신택스를 시그널링하기 위한 방법이 바람직하다.

본 원리들의 적어도 하나의 실시예는 비디오 시퀀스에서 인코딩/디코딩할 픽처 영역의 인트라/인터 또는 I/P/B 유형을 시그널링하는 일관된 신택스 설계를 제공하는 문제를 처리하고, 코딩 트리 유형은 일부 CTU(코딩 트리 유닛)를 블록들 또는 코딩 유닛들(CU)로 분할하기 위해 사용된다. 적어도 하나의 실시예의 특정 특징에 따르면, 코딩 트리의 유형은 2개의 유형들 사이에서 결정되는데, 즉, 루마와 크로마 컴포넌트들 사이에서 분리되거나 루마와 크로마 컴포넌트들 사이에서 공유된다. 일관성이란, 인트라/인터 유형 및 공유/분리의 시그널링이 압축 또는 압축해제될 비디오 시퀀스의 모든 픽처에서 동일하다는 것을 의미한다.

본 개시의 적어도 하나의 실시예는 동일한 코딩 유형 및 동일한 코딩 트리 유형을 첨부한 픽처 내의 영역들을 결정하는 것을 포함한다. 영역 코딩 유형의 예는 인트라 또는 인터이며, 여기서 인트라는 영역이 인트라 코딩되는 것, 즉, 영역에 포함된 모든 코딩 유닛들이 인트라 모드로 코딩되는 것을 의미한다. 영역은 인터 또는 달리 넌-인트라로 지칭되며, 즉 그 영역의 CU들은 인터 또는 인트라 모드로 코딩될 수 있다. 영역 코딩 트리 유형의 예는 듀얼 또는 공동이다. 유형 듀얼의 코딩 트리는 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들에 대응한다. 유형 공동의 코딩 트리는 루마 및 크로마 컴포넌트들 사이의 공유된 코딩 트리에 대응한다. 영역의 예는 타일, 타일-그룹, CTU 또는 동일한 코딩 유형 또는/및 코딩 트리 유형을 갖는 결정된 크기의 새로운 영역이다.

섹션 1에서, 코딩 유형 및 코딩 트리 유형 중 상위 레벨에서 디코딩된 신택스 요소에 대응하는 디코딩 방법에 대한 2개의 실시예들이 개시된다.

섹션 2에서, 코딩 유형 및 코딩 트리 유형 중 상위 레벨에서 인코딩된 신택스 요소에 대응하는 인코딩 방법에 대한 2개의 실시예들이 개시된다.

섹션들 3 내지 10은 영역 레벨(타일, CTU, 직사각형 영역) 및 신택스 요소(코딩 유형 및 코딩 트리 유형)의 조합에 따른 인코딩 또는 디코딩 방법의 다양한 실시예들을 개시한다.

1. 디코딩 방법에 대한 실시예들

상위 레벨에서 시그널링된 신택스 요소에 대응하는 디코딩 방법에 대한 2개의 실시예들이 개시되며, 실시예의 첫번째는 코딩 트리 유형 전에 상위 레벨에서 디코딩된 코딩 유형에 대응하고, 실시예의 두번째는 상위 레벨에서 또는 코딩 유형 전에 디코딩된 코딩 트리 유형에 대응한다.

도 6은 제1 실시예의 일반적 양상에 따른 디코딩 방법을 예시한다. 본 개시의 적어도 하나의 양상에 따르면, 디코딩 방법(600)이 개시된다. 디코딩 방법(600)은 단계(610)에서, 디코딩될 픽처의 적어도 하나의 영역에 액세스하는 것을 포함한다. 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 예를 들어 RegionTypeSize 크기인 픽처의 직사각형 영역 중 하나이며, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용된다. 본 원리들에 따른 영역의 예는 섹션 7에 개시된다. 이어서, 단계(620)에서, 적어도 하나의 신택스 데이터 요소가 디코딩된다. 이 실시예에서, 신택스 데이터 요소는 픽처의 적어도 하나의 영역의 코딩 유형과 관련되고, 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이다. 유리하게는, 방법은 이어서, 단계(630)에서 픽처의 적어도 하나의 영역의 코딩 트리 유형을 획득하는 것을 포함하고, 코딩 트리 유형은 공동 또는 듀얼 중 하나이다. 공동 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하는 반면, 듀얼 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시한다. 이하 설명되는 바와 같이, 코딩 트리 유형은 코딩 유형으로부터 암시적으로 유도되거나 다른 신택스 요소로부터 명시적으로 디코딩된다. 마지막으로, 단계(660)에서, 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들이 디코딩된다.

유리하게는, 개시된 방법은 디코더에서의 구현의 복잡성을 감소시키면서 영역의 CTU들의 코딩 유형/코딩 트리 유형의 선택에 더 많은 유연성을 허용한다.

예를 들어 섹션 3에서 논의되는 상이한 변형들에 따르면, 코딩 트리 유형이 암시적으로 또는 명시적으로 획득된다. 제1 변형에 따르면, 코딩 트리 유형을 획득하는 것은 코딩 유형으로부터 픽처의 적어도 하나의 영역에 대한 코딩 트리 유형을 유도하는 것을 포함하며, 코딩 트리 유형은 적어도 하나의 영역의 코딩 유형이 인트라 코딩인 경우 듀얼이고, 코딩 트리 유형은 적어도 하나의 영역의 코딩 유형이 인터 코딩인 경우 공동이다. 제2 변형에 따르면, 코딩 트리 유형을 획득하는 것은 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하는 것을 포함한다.

특정 특징에 따르면, 픽처의 적어도 하나의 영역의 코딩 유형 및/또는 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소는 적어도 하나의 영역(타일, 타일-그룹 또는 코딩/코딩 트리를 공유하기 위해 정의된 직사각형 영역)의 헤더 데이터 또는 적어도 하나의 영역의 제1 CTU의 헤더 데이터로부터 디코딩된다.

특정 특징에 따르면, RegionTypeSize는 시퀀스 레벨 헤더 정보 또는 이미지 레벨 헤더 정보로부터 디코딩된다.

도 7은 제2 실시예의 일반적 양상에 따른 디코딩 방법을 예시한다. 본 개시의 적어도 하나의 양상에 따르면, 디코딩 방법(700)이 개시된다. 디코딩 방법(700)은 단계(710)에서, 디코딩될 픽처의 적어도 하나의 영역에 액세스하는 것을 포함한다. 이어서, 단계(740)에서, 적어도 하나의 신택스 데이터 요소가 디코딩된다. 이 실시예에서, 신택스 데이터 요소는 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된다. 유리하게는, 방법은 이어서, 단계(750)에서, 픽처의 적어도 하나의 영역의 코딩 유형을 획득하는 것을 포함하고, 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이다. 마지막으로, 단계(760)에서, 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들이 디코딩된다.

이전과 같이, 개시된 방법은 유리하게는 디코더에서의 구현의 복잡성을 감소시키면서 영역의 CTU들의 코딩 유형/코딩 트리 유형의 선택에 더 많은 유연성을 허용한다.

또한, 예를 들어 섹션 4에서 논의되는 상이한 변형들에 따르면, 코딩 유형이 암시적으로 또는 명시적으로 획득된다. 제1 변형에 따르면, 코딩 유형을 획득하는 것은 코딩 트리 유형으로부터 픽처의 적어도 하나의 영역에 대한 코딩 유형을 유도하는 것을 포함하고, 적어도 하나의 영역의 코딩 유형은 코딩 트리 유형이 듀얼인 경우 인트라 코딩이고, 적어도 하나의 영역의 코딩 유형은 코딩 트리 유형이 공동인 경우 인터 코딩이다. 제2 변형에 따르면, 코딩 유형을 획득하는 것은 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하는 것을 포함한다.

2. 인코딩 방법에 대한 실시예들

상위 레벨에서 시그널링된 신택스 요소에 대응하는 인코딩 방법에 대한 2개의 실시예들이 개시되며, 실시예의 첫번째는 상위 레벨에서 또는 코딩 트리 유형 전에 인코딩된 코딩 유형에 대응하고, 실시예의 두번째는 상위 레벨에서 또는 코딩 유형 전에 인코딩된 코딩 트리 유형에 대응한다.

도 8은 제1 실시예의 일반적 양상에 따른 인코딩 방법을 예시한다. 본 개시의 적어도 하나의 양상에 따르면, 인코딩 방법(800)이 개시된다. 인코딩 방법(800)은 단계(810)에서, 인코딩될 픽처의 적어도 하나의 영역 및 코딩 유형 및 코딩 트리 유형과 같은 연관된 인코딩 파라미터들에 액세스하는 것을 포함한다. 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 예를 들어 RegionTypeSize 크기인 픽처의 직사각형 영역 중 하나이며, 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용된다. 본 원리들에 따른 영역의 예는 섹션 8에 개시된다. 단계(820)에서, 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소가 먼저 인코딩된다. 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이다. 이어서, 다양한 실시예들에 따르면, 단계(820)에서, 픽처의 적어도 하나의 영역의 코딩 트리 유형이 획득되고, 코딩 트리 유형은 공동 또는 듀얼 중 하나이다. 또한, 공동 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하는 반면, 듀얼 코딩 트리 유형은 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시한다. 마지막으로, 단계(860)에서, 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들이 인코딩된다.

유리하게는, 개시된 방법은 코더에서의 구현의 복잡성을 감소시키면서 영역의 CTU들의 코딩 유형/코딩 트리 유형의 선택에 더 많은 유연성을 허용한다.

제1 변형에 따르면, 픽처의 적어도 하나의 영역에 대한 코딩 트리 유형은 인코딩되지 않고, 코딩 유형으로부터 디코더 측에서 유도되며, 코딩 트리 유형은 적어도 하나의 영역의 코딩 유형이 인트라 코딩인 경우 듀얼이고, 코딩 트리 유형은 적어도 하나의 영역의 코딩 유형이 인터 코딩인 경우 공동이다. 제2 변형에 따르면, 코딩 트리 유형을 명시적으로 코딩하는 것은 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 것을 포함한다.

특정 특징에 따르면, 픽처의 적어도 하나의 영역의 코딩 유형 및/또는 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소는 적어도 하나의 영역(타일, 타일-그룹 또는 코딩/코딩 트리를 공유하기 위해 정의된 직사각형 영역)의 헤더 데이터 또는 적어도 하나의 영역의 제1 CTU의 헤더 데이터에서 인코딩된다.

특정 특징에 따르면, RegionTypeSize는 시퀀스 레벨 헤더 정보 또는 이미지 레벨 헤더 정보에서 인코딩된다.

도 9는 제2 실시예의 일반적 양상에 따른 인코딩 방법을 예시한다. 본 개시의 적어도 하나의 양상에 따르면, 인코딩 방법(900)이 개시된다. 인코딩 방법(900)은 단계(910)에서, 인코딩될 픽처의 적어도 하나의 영역 및 코딩 유형 및 코딩 트리 유형과 같은 연관된 인코딩 파라미터들에 액세스하는 것을 포함한다. 이어서, 단계(940)에서, 적어도 하나의 신택스 데이터 요소가 픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련되고, 코딩 트리 유형은 공동 또는 듀얼 중 하나이다. 단계(950)에서, 픽처의 적어도 하나의 영역의 코딩 유형이 획득되고, 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이다. 마지막으로, 단계(960)에서, 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들이 인코딩된다.

제1 변형에 따르면, 픽처의 적어도 하나의 영역에 대한 코딩 유형은 인코딩되지 않고, 코딩 트리 유형으로부터 디코더 측에서 유도되며, 적어도 하나의 영역의 코딩 유형은 코딩 트리 유형이 듀얼인 경우 인트라 코딩이고, 적어도 하나의 영역의 코딩 유형은 코딩 트리 유형이 공동인 경우 인터 코딩이다. 제2 변형에 따르면, 코딩 트리 유형을 명시적으로 코딩하는 것은 픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 것을 포함한다.

다음 섹션들은 인코딩 또는 디코딩을 위한 일반적인 대안적 방법의 다양한 실시예들을 설명한다.

3. 변형 실시예 1: 인트라/P/B 코딩 유형의 타일 레벨 표시

제1 실시예의 변형인 변형 실시예 1에 따르면, 픽처는 타일(들)로 분할되고, 타일에는 인트라/인터 코딩 유형, 즉 인트라 또는 인터가 할당된다. 이러한 코딩 유형은 고려되는 타일의 헤더 데이터로서 시그널링될 수 있다. 다른 변형에서 코딩 유형은 타일-그룹 헤더에서 시그널링된다. 고려되는 타일의 헤더 데이터로서 시그널링될 때, 타일의 헤더는 상이한 형태들을 취할 수 있다. 제1 형태에 따르면, 코딩 유형은 고려되는 타일에 포함된 제1 CTU의 헤더에서 코딩된다. 제2 형태에 따르면, 타일-헤더 신택스 요소 세트가 정의된다. 이는 고려되는 타일의 인트라/인터 코딩 유형에 대응하는 필드를 포함한다.

또한, 각각의 타일은 통상적으로 128x128 크기의 코딩 트리 유닛들(CTU들)로 분할된다. 타일이 인트라 유형인 경우, 타일 내의 모든 CTU들은 루마와 크로마 컴포넌트들 사이의 분리된 코딩 트리들을 통해 압축된 도메인에서 표현된다. 타일이 인터 유형인 경우, 타일 내의 모든 CTU들은 루마 및 크로마 컴포넌트들에 의해 공유된 단일 코딩 트리로 코딩/디코딩된다.

도 10은 제1 실시예의 변형을 예시한다. 도 10의 예시된 픽처는 4개의 타일들(굵은 선들)로 분할된다. 특정 예에 따르면, 4개의 타일들에 대해 각각의 유형의 코딩 유형(인트라의 경우 I, 및 코딩 유닛들이 이중 예측으로 코딩될 수 있는 인터의 경우 B)이 예시된다. CTU로 파티셔닝된 타일뿐만 아니라 2개의 B 타일들 중 하나의 CTU의 코딩 트리 표현이 또한 도시된다. 제1 실시예의 이러한 변형의 결과로서, 각각의 픽처는 고려되는 픽처에서 코딩된 블록들의 유형을 표시하기 위해 동일한 유형의 하이 레벨 신택스를 이용한다. 이는 설계를 모든 픽처들 사이에서 일관되게 한다. 이러한 접근법에서, 더 이상 슬라이스가 고려되지 않으며 HEVC의 경우처럼 하이 레벨 신택스의 설계에 슬라이스 유형(인트라, B, P)이 존재하지 않음에 유의한다.

다른 변형에 따르면, 추가적인 타일-레벨 신택스 요소는, 타일이 인트라인 경우, 타일 내의 CTU들이 공동 루마/크로마 코딩 트리 또는 별개의 루마/크로마 코딩 트리들로 코딩되는지 여부를 표시한다. 따라서, 이러한 신택스 요소는 플래그의 형태를 취하고, 이는, 예를 들어, 타일 내의 CTU들의 코딩 트리가 루마와 크로마 사이에서 분리되면 참과 동일하고, 그렇지 않으면 거짓과 동일하다.

추가적 변형에 따르면, 타일 내의 모든 CTU들에서, CTU-레벨 플래그는 CTU를 코딩하기 위해 공동 또는 분리된 코딩 트리가 사용되는지 여부를 표시한다 그러한 경우, 각각의 픽처의 각각의 CTU는, CTU를 코딩하기 위해 공동 또는 분리된 코딩 트리가 사용되는지 여부를 표시하는 플래그를 포함한다.

4. 변형 실시예 2: 공동/분리된 코딩 트리의 타일-레벨 표시

이 섹션에 제시된 제2 실시예의 변형인 변형 실시예 2에 따르면, 코딩 트리의 유형은 픽처 영역의 인트라/인터 또는 I/P/B 코딩 유형보다 상위 레벨에서 시그널링된다. 실제로, 제2 실시예의 변형에 따르면, 타일-레벨 플래그는 타일 내의 각각의 CTU의 코딩 트리가 루마와 크로마 컴포넌트들 사이의 공동 코딩 트리인지 또는 분리된 코딩 트리인지 여부를 표시한다.

도 11은 제2 실시예의 변형을 예시한다. 이러한 실시예에서, 타일-레벨 코딩 트리 유형이 루마와 크로마 사이에서 듀얼이면(즉, 분리됨), 고려되는 타일에 포함된 모든 CTU들은 인트라 모드에서 추론된다. 타일-레벨 코딩 트리 유형이 루마와 크로마 사이에서 공동이면(즉, 분리지 않음), 고려되는 타일에 포함된 모든 CTU들은 인터 또는 인트라 모드에서 코딩된다. 그러한 경우, CU-레벨 신택스는 현재 VVC 드래프트 표준 버전에서 수행되는 바와 같이, 인트라 또는 인터 CU 코딩 모드를 표시한다.

이 실시예에서, 다른 변형에 따르면, 각각의 CTU에는 인트라/인터 또는 I/P/B 코딩 모드가 할당된다. 따라서, 일부 CTU-레벨 신택스 요소는 CTU 코딩 모드를 표시한다. 이러한 변형의 이점은 코덱 설계에 더 많은 유연성을 도입하여 더 높은 코딩 효율을 도출할 수 있다는 점이다. 실제로, 이러한 모드에서, 공동 루마/크로마 코딩 트리의 분리는 CTU 코딩 모드들 둘 모두에서 사용될 수 있다.

또 다른 변형에 따르면, CTU-레벨 인트라/인터 또는 I/P/B 코딩 모드는 공동 코딩 트리 유형이 타일 헤더에서 시그널링되는 경우에만 시그널링된다. 마지막 변형은 도 12에 예시되어 있다. 공동 유형의 우측 상단 및 좌측 하단 타일들의 경우, 코딩 모드 인트라/인터가 시그널링되는 반면, 듀얼 유형의 좌측 상단 및 우측 하단 타일들의 경우, CTU들에 대해 모드 인트라가 추론된다.

다른 변형에서, 공동/분리된 코딩 트리 유형은 타일 레벨보다는 타일-그룹 헤더에서 시그널링된다. 이어서, 이 섹션에서 이전에 설명된 것과 동일한 변형들이 타일-그룹 헤더 레벨로 적용된다.

5. 변형 실시예 2: 공동/분리된 코딩 트리의 슬라이스-레벨 표시

제2 실시예의 이러한 변형에서, 공동/듀얼 코딩 트리 유형은 시퀀스 파라미터 세트(SPS) 레벨에서 시그널링될 수 있다. 추가적으로, 이는, SPS 레벨 코딩 트리 유형의 오버라이드를 시그널링할 수 있는 슬라이스 헤더 신택스 요소를 통해 슬라이스 레벨에서 오버라이드될 수 있다. 오버라이드되면, 공동 또는 듀얼 코딩 트리 유형이 슬라이스 헤더에서 시그널링될 수 있다.

변형에서, SPS 레벨 코딩 트리가 슬라이스에서 오버라이드된 것으로 시그널링되면, 고려되는 슬라이스의 코딩 트리 유형은 SPS-레벨 시그널링된 코딩 트리 유형과는 상이한 코딩 트리 유형으로서 추론될 수 있다.

변형에서, 슬라이스 헤더에서 코딩될 수 있는 단일 플래그는, 대응하는 슬라이스에서 사용되는 코딩 트리가 SPS 레벨 시그널링된 것과 동일한지 여부를 표시하기 위해 시그널링될 수 있다.

6. 변형 실시예 2: 공동/분리된 코딩 트리의 PPS-레벨 표시

제2 실시예의 이러한 변형에서, 코딩 트리의 유형은 슬라이스 헤더에서 시그널링된다.

이러한 실시예에서, 공동/듀얼 코딩 트리 유형은 시퀀스 파라미터 세트(SPS) 레벨에서 시그널링될 수 있다. 추가적으로, 이는, SPS 레벨 코딩 트리 유형의 오버라이드를 시그널링할 수 있는 PPS 신택스 요소를 통해 픽처 파라미터 세트(PPS) 레벨에서 오버라이드될 수 있다. 오버라이드되면, 공동 또는 듀얼 코딩 트리 유형이 PPS에서 시그널링될 수 있다.

변형에서, SPS 레벨 코딩 트리가 PPS에서 오버라이드된 것으로 시그널링되면, 고려되는 PPS에 부착된 코딩 트리 유형은 SPS-레벨 시그널링된 코딩 트리 유형과는 상이한 코딩 트리 유형으로서 추론될 수 있다.

변형에서, PPS에서 코딩될 수 있는 단일 플래그는, 고려되는 PPS에 부착된 코딩 트리가 SPS 레벨 시그널링된 것과 동일한지 여부를 표시하기 위해 시그널링될 수 있다.

7. 변형 실시예 3: I/P/B 코딩 모드 시그널링의 CTU-레벨 인트라/인터

제2 실시예의 변형인 변형 실시예 3에 따르면, 코딩 트리의 유형 및 하이-레벨 인트라/인터 코딩 모드는 타일 레벨에서 더 이상 시그널링되지 않고 CTU-레벨에서 시그널링된다. 변형 실시예 3은 기본적으로 CTU 레벨에서 인트라/인터 또는 I/P/B 코딩 모드뿐만 아니라 코딩 트리 유형을 시그널링하는 것을 포함한다. 이들 파라미터는 이전 실시예에서와 같이 타일 레벨에서 더 이상 코딩되지 않고 CTU 레벨에서 코딩된다.

도 13은 코딩 모드 인트라/인터 또는 I/P/B를 각각의 CTU에 할당하고 이를 CTU 레벨에서 시그널링하는 실시예의 예를 예시한다. 이러한 변형 실시예 3에서, 특정 특징에 따르면, CTU-레벨 인트라/인터 시그널링 플래그는 콘텍스트-기반 산술 코딩된다. 이를 수행하기 위해, CTU-레벨 코딩 모드가 인터/인트라 코딩 모드를 포함하면 플래그가 코딩된다. 좌측 및 상단 이웃 CTU의 플래그 값에 기초한 CABAC 콘텍스트가, 이용가능한 경우, 이용된다. 이러한 이웃 CTU들의 플래그 값들에 따르면, 현재 CTU의 인트라/인터 코딩 모드 플래그를 인코딩하기 위해 3개의 상이한 CABAC 콘텍스트들이 사용될 수 있다.

따라서 현재 CTU에 사용되는 콘텍스트 인덱스는,

로서 컴퓨팅되고, 여기서 a 및 b는 좌측 및 상단 CTU들의 플래그들을 표현한다. 도 14는 현재 CTU의 인트라/인터 코딩 모드 플래그 x의 이러한 콘텍스트 코딩을 예시한다.

도 15는 CTU-레벨 인트라/인터 코딩 모드 플래그 x를 인코딩하기 위해 사용되는 더 풍부한 콘텍스트들의 세트를 갖는 현재 CTU의 인트라/인터 코딩 모드 플래그 x의 이러한 콘텍스트 코딩의 다른 예를 예시한다.

변형 실시예 3에서, CTU가 인트라 코딩 유형이면, 고려되는 CTU의 블록-기반 파티셔닝을 생성하기 위해 분리된 코딩 트리가 사용된다. 그러한 경우, 코딩 트리는 VVC 드래프트 버전에서와 같이 64x64 크기로 루마와 크로마 사이에서 공유되며 그 블록 크기까지 CTU의 쿼드-트리 분할이 수행된다. CTU가 넌-인트라 또는 인터 유형인 경우, 고려되는 CTU의 루마 및 크로마 컴포넌트들 둘 모두를 인코딩하기 위해 통상적으로 단일 코딩 트리가 사용된다.

또 다른 변형에 따르면, CTU가 인트라 유형인 경우, 루마 및 크로마 컴포넌트들의 블록 파티셔닝에서 공동 코딩 트리 또는 별개의 트리가 사용되면 추가적인 CTU-레벨 플래그가 코딩된다.

또 다른 변형에 따르면, CTU-레벨 코딩 모드가 무엇이든지, 루마 및 크로마 컴포넌트들의 블록 파티셔닝에서 공동 코딩 트리 또는 별개의 트리가 사용되면 추가적인 CTU-레벨 플래그가 코딩된다.

8. 변형 실시예 4: CTU-레벨 인트라/인터 모드를 시그널링하거나 유도하기 전에 CTU-레벨 코딩 트리 유형의 시그널링.

제4 실시예의 변형인 변형 실시예 4에 따르면, CTU 레벨에서 플래그는 CTU 레벨에서 코딩되지만 변형 실시예 3과 비교하여 상이한 시맨틱을 갖는다. 변형 실시예 4에서, CTU-레벨 플래그는 고려되는 타일에 포함된 CTU들이 루마와 크로마 컴포넌트들 사이에서 별개의 또는 공통 코딩 트리들을 이용하는지 여부를 표시한다. 도 16은 공동 또는 듀얼인 코딩 트리 유형의 CTU-레벨에서의 시그널링의 예를 예시한다. 이어서, 실제로, CTU-레벨 인트라/인터 모드를 유도하기 위해 이러한 실시예 내에 3개의 상이한 변형들이 존재한다.

첫째로, CTU가 별개의 트리들을 사용하면, 고려되는 CTU에 대해 인트라 코딩 유형이 추론된다. 추가적으로, CTU가 루마 및 크로마에 대해 동일한 코딩 트리를 사용하는 경우, 현재 CTU에 대해 인터 코딩이 추론된다.

둘째로, CTU가 별개의 트리들을 사용하면, 고려되는 CTU에 대해 인트라 코딩 유형이 추론된다. 추가적으로, CTU가 루마 및 크로마에 대해 동일한 코딩 트리를 사용하는 경우, 인트라 또는 인터 코딩을 표시하기 위해 CTU 코딩 모드 플래그가 표시된다.

셋째로, 공동 또는 별개의 루마/크로마 코딩 트리들의 사용에 관계없이, CTU-레벨 플래그가 코딩되고 관련 CTU에서 인트라 또는 인터 코딩 모드를 표시한다.

9. 변형 실시예 5: 영역 유형 크기의 새로운 개념

제4 실시예의 변형인 변형 실시예 5에 따르면, CTU 코딩 모드 및 코딩 트리의 유형은 실시예 3에서와 같이 CTU-레벨에서 시그널링된다.

추가적으로, 영역 유형 크기의 새로운 개념이 도입된다. 영역 유형 크기는 루마/크로마 블록 파티셔닝에서 단일 코딩 트리 유형이 이용되는 직사각형 픽처 영역의 크기이다. 영역 트리 유형 크기는 CTU 크기 이하이다. 다음으로 regionTypeSize가 언급된다.

일반적으로, 영역 유형 크기는 CTU 크기와 동일하다. 그러한 경우, 영역의 인트라/인터 코딩 유형 및 그 픽처 영역에서 분리된 또는 공동 루마/크로마 코딩 트리의 사용을 시그널링하기 위해 실시예들 1 또는 3 중 하나가 사용된다. 여기서 영역 1은 사용되는 1 또는 3 사이의 실시예에 따라 타일 또는 CTU를 의미한다.

그러나, 일부 구성들에서, 이는 더 낮을 수 있다. 예를 들어, CTU 크기는 256x256일 수 있고 영역 유형 크기는 128x128과 동일할 수 있다.

실시예 5의 변형인 이러한 경우, CTU가 쿼드-트리 방식으로 분리되는지 여부를 표시하는 qt_split_flag는, CTU-레벨 인트라/인터 모드 또는 CTU-레벨 코딩 트리 유형과 관련된 정보를 코딩하기 전에 CTU 레벨로 코딩될 수 있다. 이러한 접근법은 최적화된 코딩 효율을 위해 사용될 수 있다.

- 이러한 경우, qt_split_flag가 거짓이면, 인트라/인터 플래그는 전체 CTU에 대해 인터와 동일한 것으로 추론된다. 실제로, VVC 드래프트에서는, 인트라 픽처 또는 슬라이스에서 CTU가 영역 유형 크기까지 쿼드-트리 방식으로 체계적으로 분할된다고 언급되어 있다. 따라서, 영역 유형 크기보다 큰 CU에서 바이너리 또는 테너리(ternary) 분리가 사용되는 경우 해당 CTU는 반드시 넌-인트라 모드이다. 또한, 그러한 경우, 루마 및 크로마 컴포넌트들은 동일한 코딩 트리들을 사용할 수 있다.

- 그렇지 않고, qt_split_flag가 참이면, CTU는 4개의 CU들로 분리된다.

각각의 결과적 CU에 대해, 상기 프로세스는 쿼드-트리 파티셔닝으로부터 발행된 각각의 CU에 반복적으로 적용된다. regionTypeSize와 동일한 크기의 CU에 도달할 때, 그 CU의 임의의 분리 정보 전에 인트라/인터 유형 플래그가 시그널링된다.

변형에 따르면, regionTypeSize 레벨에서, 인트라/인터 유형 플래그가 현재 영역의 인트라 유형을 표시하면, 루마 및 크로마 코딩 트리들이 분리된다. 또한, 인트라-인터 유형 플래그가 인터 유형을 표시하는 경우, 모든 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리가 사용된다.

다른 변형에 따르면, regionTypeSize 레벨에서, 인터 모드가 인트라/인터 플래그에 의해 시그널링되면, 루마와 크로마 컴포넌트들 사이에서 공동 코딩 트리가 사용된다. 그러나, 인트라 모드가 시그널링되면, 루마 및 크로마 컴포넌트들이 공동 코딩 트리 또는 분리된 코딩 트리들을 사용하는지 여부를 추가 플래그가 표시한다.

- 대안적으로, 다른 변형에서, CTU를 포함하는 영역(타일/픽처/ctu)의 인트라/인터 유형에 관계없이 CTU 레벨에서 플래그가 시그널링되어, CTU 내의 코딩 트리가 루마와 크로마 컴포넌트들 사이에서 공유되는지 또는 분리되는지 여부를 시그널링한다.

- 추가적 변형에서, CTU가 인트라 유형인 경우 분리된/공동 코딩 트리 유형은 VPDU(64x64) 레벨에서 코딩된다. 실제로, CTU는 항상 루마 및 크로마에서 64x64 루마 블록 크기까지 쿼드-트리 방식으로 분리되기 때문에, 현재 CTU의 분리에 약간의 추가 유연성이 추가되어 잠재적으로 더 높은 코딩 효율을 도출할 수 있다.

10. 변형 실시예 6: 영역 트리 유형 크기의 새로운 개념

제4 실시예의 변형에 따르면, 상기와 같이 regionTypeSize가 사용되지만, 인트라/인터 모드 정보 이전에 공동/별개의 코딩 트리 정보가 코딩된다. 이는 하기 형태를 취한다.

일반적으로, 영역 유형 크기는 CTU 크기와 동일하다. 그러한 경우, 실시예들 2 또는 4 중 하나는 영역의 코딩 트리 유형 및 그 픽처 영역에서의 인트라/인터 모드의 사용을 시그널링하기 위해 사용된다. 여기서 영역 2는 사용되는 1 또는 4 사이의 실시예에 따라 타일 또는 CTU를 의미한다.

그러나, 일부 구성들에서, 영역 유형 크기는 더 낮을 수 있다. 예를 들어, CTU 크기는 256x256일 수 있고 영역 유형 크기는 128x128과 동일할 수 있다.

이러한 경우, 실시예 6의 변형에서, CTU가 쿼드-트리 방식으로 분리되는지 여부를 표시하는 qt_split_flag는, CTU-레벨 코딩 트리 유형 또는 CTU-레벨 인트라/인터 모드와 관련된 정보를 코딩하기 전에 CTU 레벨로 코딩될 수 있다. 이러한 접근법은 최적화된 코딩 효율을 위해 사용될 수 있다.

- 이러한 경우, qt_split_flag가 거짓이면, 코딩 트리 유형은 공동과 동일한 것으로 추론된다. 실제로, VVC 드래프트에서는, 인트라 픽처 또는 슬라이스에서 CTU가 영역 유형 크기까지 쿼드-트리 방식으로 체계적으로 분할된다고 언급되어 있다. 따라서, 영역 트리 크기보다 큰 CU에서 바이너리, 테너리 분리된 또는 분리 없는 파티셔닝 모드가 사용되면, 해당 CTU는 반드시 넌-인트라 모드이며 루마와 크로마 컴포넌트들 사이에서 단일 코딩 트리가 공유된다. 따라서 이러한 변형 실시예에서, 고려되는 상황에서, 루마와 크로마 컴포넌트들이 동일한 코딩 트리를 공유하는 것으로 추론된다.

각각의 결과적 CU에 대해, 상기 프로세스는 쿼드-트리 파티셔닝으로부터 발행된 각각의 CU에 반복적으로 적용된다. regionTypeSize와 동일한 크기의 CU에 도달할 때, 그 CU의 임의의 분리 정보 전에 별개의/공유된 코딩 트리 유형 플래그가 시그널링된다.

변형에 따르면, regionTypeSize 레벨에서, 루마/크로마 코딩 트리들이 분리되면, 현재 영역의 인트라 유형이 추론된다. 또한, 분리된/공유된 트리 유형 플래그가 공유된 유형을 표시하는 경우, 고려되는 영역에 대해 인터 모드가 추론된다.

다른 변형에 따르면, regionTypeSize 레벨에서 별개의 트리 모드가 공유된/별개의 플래그에 의해 시그널링되는 경우, 고려되는 영역에 대해 인트라 모드가 추론된다. 그러나, 공유된 모드가 시그널링되면, 추가적 플래그는 영역이 인트라로 완전히 코딩되었는지 여부를 표시한다.

- 대안적으로, 다른 변형에서, CTU를 포함하는 영역(타일/픽처/ctu)의 공유된/별개의 유형에 관계없이 CTU 레벨에서 플래그가 시그널링되어, CTU 내의 코딩 모드가 완전한 인트라인지 여부를 시그널링한다.

- 추가적 변형에서, 코딩 트리가 공유된 유형인 경우, 인트라/인터 영역 유형은 VPDU(64x64) 레벨에서 코딩된다. 실제로, CTU는 항상 루마 및 크로마에서 64x64 루마 블록 크기까지 쿼드-트리 방식으로 분리되기 때문에, 현재 CTU의 분리에 약간의 추가 유연성이 추가되어 잠재적으로 더 높은 코딩 효율을 도출할 수 있다.

11. 추가적인 실시예들 및 정보

본 출원은 도구들, 특징들, 실시예들, 모델들, 접근법들 등을 포함하는 다양한 양상들을 설명한다. 이러한 양상들 대부분은 구체적으로 설명되며, 적어도 개별 특성들을 보여주기 위해 종종 제한적으로 들릴 수 있는 방식으로 설명된다. 그러나, 이는 설명을 명확하게 하기 위한 것이며 이러한 양상들의 적용 또는 범위를 제한하지 않는다. 실제로, 모든 다른 양상들이 조합되고 추가 양상들을 제공하도록 교환될 수 있다. 또한, 양상들은 이전 파일에서 또한 설명된 양상들과 조합 및 교환될 수 있다.

본 출원에서 설명되고 고려되는 양상들은 많은 상이한 형태들로 구현될 수 있다. 아래의 도 17, 도 18 및 도 19는 일부 실시예들을 제공하지만, 다른 실시예들이 고려되고 도 17, 도 18 및 도 19의 논의는 구현들의 폭을 제한하지 않는다. 양상들 중 적어도 하나는 일반적으로 비디오 인코딩 및 디코딩에 관한 것이고, 적어도 하나의 다른 양상은 일반적으로 생성되거나 인코딩된 비트스트림을 송신하는 것에 관한 것이다. 이러한 양상들 및 다른 양상들은 설명된 방법들 중 임의의 것에 따라 비디오 데이터를 인코딩 또는 디코딩하기 위한 방법, 장치, 명령들을 저장한 컴퓨터 판독가능 저장 매체 및/또는 설명된 방법들 중 임의의 것에 따라 생성된 비트스트림을 저장한 컴퓨터 판독가능 저장 매체로서 구현될 수 있다.

본 출원에서, 용어들 "재구성된" 및 "디코딩된"은 교환가능하게 사용될 수 있고, 용어들 "픽셀" 및 "샘플"은 교환가능하게 사용될 수 있고, 용어들 "이미지", "픽처 "및 "프레임"은 교환가능하게 사용될 수 있다. 필수적은 아니지만 통상적으로, 용어 "재구성된"은 인코더 측에서 사용되는 한편, "디코딩된"은 디코더 측에서 사용된다.

다양한 방법들이 본 명세서에 설명되고, 방법들 각각은 설명된 방법을 달성하기 위한 하나 이상의 단계들 또는 동작들을 포함한다. 방법의 적절한 동작을 위해 단계들 또는 동작들의 특정 순서가 요구되지 않으면, 특정 단계들 및/또는 동작들의 순서 및/또는 사용은 수정되거나 결합될 수 있다.

본 출원에 설명된 다양한 방법들 및 다른 양상들은 도 16 및 도 17에 도시된 바와 같이 비디오 인코더(100) 및 디코더(200)의 모듈들, 예를 들어 파티셔닝 모듈(102, 235)을 수정하기 위해 사용될 수 있다. 또한, 본 양상들은 VVC 또는 HEVC로 제한되지 않으며, 예를 들어, 이미 존재하는지 또는 장래에 개발되는지와 관계없이, 다른 표준들 및 추천들, 및 임의의 이러한 표준들 및 추천들(VVC 및 HEVC를 포함함)의 확장들에 적용될 수 있다. 달리 표시되거나 기술적으로 배제되지 않는 한, 본 출원에서 설명된 양상들은 개별적으로 또는 조합하여 사용될 수 있다.

본 출원에서, 다양한 수치 값들, 예를 들어, regionTypeSize가 사용된다. 특정 값들은 예시를 위한 것이며 설명된 양상들은 이러한 특정 값들로 제한되지 않는다.

도 17은 인코더(100)를 예시한다. 이러한 인코더(100)의 변형들이 고려되지만, 인코더(100)는 모든 예상되는 변형들을 설명하지 않고 명확성을 위해 아래에서 설명된다.

인코딩되기 전에, 비디오 시퀀스는 인코딩 전 프로세싱(101), 예를 들어 입력 컬러 픽처에 컬러 변환을 적용하는 것(예를 들어, RGB 4:4:4로부터 YCbCr 4:2:0로의 변환), 또는 (예를 들어, 컬러 컴포넌트들 중 하나의 히스토그램 등화를 사용하여) 압축에 더 탄력적인 신호 분포를 얻기 위해 입력 픽처 컴포넌트들의 리맵핑(remapping)을 수행하는 것을 겪을 수 있다. 메타 데이터는 사전 프로세싱과 연관되고 비트 스트림에 첨부될 수 있다.

인코더(100)에서, 픽처는 아래에서 설명되는 바와 같이 인코더 요소들에 의해 인코딩된다. 인코딩될 픽처는 예를 들어, CU들의 단위들로 파티셔닝(102) 및 프로세싱된다. 각각의 유닛은 예를 들어, 인트라 또는 인터 모드를 사용하여 인코딩된다. 유닛이 인트라 모드에서 인코딩되는 경우, 인트라 예측(160)을 수행한다. 인터 모드에서, 모션 추정(175) 및 보상(170)이 수행된다. 인코더는, 유닛을 인코딩하기 위해 인트라 모드 또는 인터 모드 중 어느 것을 사용할지를 결정하고(105), 예를 들어, 예측 모드 플래그에 의해 인트라/인터 결정을 표시한다. 예측 잔차들은 예측 원래의 이미지 블록으로부터 예측된 블록을 감산(110)함으로써 계산된다.

이어서, 예측 잔차들은 변환되고(125) 양자화된다(130). 양자화된 변환 계수들 뿐만 아니라 모션 벡터들 및 다른 신택스 요소들은 비트스트림을 출력하도록 엔트로피 코딩된다(145). 인코더는 변환을 스킵하고, 비-변환된 잔차 신호에 직접 양자화를 적용할 수 있다. 인코더는 변환 및 양자화 둘 모두를 우회할 수 있는데, 즉, 잔차는 변환 또는 양자화 프로세스들의 적용 없이 직접 코딩된다.

인코더는 추가적 예측들을 위한 기준을 제공하기 위해 인코딩된 블록을 디코딩한다. 예측 잔차들을 디코딩하기 위해, 양자화된 변환 계수들은 역양자화되고(140) 역변환된다(150). 디코딩된 예측 잔차들 및 예측된 블록을 결합하면(155), 이미지 블록이 재구성된다. 인-루프 필터들(in-loop filters)(165)은, 예를 들어, 인코딩 아티팩트들을 감소시키기 위한 디블로킹/SAO(Sample Adaptive Offset) 필터링을 수행하기 위해, 재구성된 픽처에 적용된다. 필터링된 이미지는 기준 픽처 버퍼(180)에 저장된다.

도 18은 비디오 디코더(200)의 블록도를 예시한다. 디코더(200)에서, 비트스트림은 아래에서 설명되는 바와 같이 디코더 요소들에 의해 디코딩된다. 비디오 디코더(200)는 일반적으로 도 17에 설명된 바와 같이 인코딩 패스에 역인 디코딩 패스를 수행한다. 인코더(100)는 또한 일반적으로 비디오 데이터를 인코딩하는 것의 일부로서 비디오 디코딩을 수행한다.

특히, 디코더의 입력은 비디오 인코더(100)에 의해 생성될 수 있는 비디오 비트스트림을 포함한다. 비트스트림은, 변환 계수들, 모션 벡터들 및 다른 코딩된 정보를 획득하기 위해 먼저 엔트로피 디코딩된다(230). 픽처 파티션 정보는 픽처가 파티셔닝되는 방법을 표시한다. 따라서, 디코더는 디코딩된 픽처 파티셔닝 정보에 따라 픽처를 분할한다(235). 예측 잔차들을 디코딩하기 위해, 변환 계수들은 역양자화되고(240) 역변환된다(250). 디코딩된 예측 잔차들 및 예측된 블록을 결합하면(255), 이미지 블록이 재구성된다. 예측된 블록은 인트라 예측(260) 또는 모션-보상된 예측(즉, 인터 예측)(275)으로부터 획득될 수 있다(270). 인-루프 필터들(265)은 재구성된 이미지에 대해 적용된다. 필터링된 이미지는 기준 픽처 버퍼(280)에 저장된다.

디코딩된 픽처는 디코딩 후 프로세싱(285), 예를 들어 컬러 역변환(예를 들어, YCbCr 4:2:0으로부터 RGB 4:4:4로의 변환) 또는 인코딩 전 프로세싱(101)에서 수행된 리맵핑 프로세스의 역을 수행하는 역 리맵핑을 추가로 겪을 수 있다. 디코딩 후 프로세싱은 인코딩 전 프로세싱에서 유도되고 비트스트림에서 시그널링되는 메타데이터를 사용할 수 있다.

도 19는 다양한 양상들 및 실시예들이 구현되는 시스템의 예의 블록도를 예시한다. 시스템(1000)은 아래에서 설명되는 다양한 컴포넌트들을 포함하는 디바이스로서 구현될 수 있고, 본 문헌에서 설명되는 양상들 중 하나 이상을 수행하도록 구성된다. 이러한 디바이스들의 예들은, 개인용 컴퓨터들, 랩톱 컴퓨터들, 스마트폰들, 태블릿 컴퓨터들, 디지털 멀티미디어 셋톱 박스들, 디지털 텔레비전 수신기들, 개인용 비디오 레코딩 시스템들, 연결된 가전 제품들 및 서버들과 같은 다양한 전자 디바이스들을 포함하지만 이에 제한되는 것은 아니다. 시스템(1000)의 요소들은 단독으로 또는 조합하여 단일 집적 회로(IC), 다수의 IC들 및/또는 개별 컴포넌트들로 구현될 수 있다. 예를 들어, 적어도 하나의 실시예에서, 시스템(1000)의 프로세싱 및 인코더/디코더 요소들은 다수의 IC들 및/또는 개별 컴포넌트들에 걸쳐 분산된다. 다양한 실시예들에서, 시스템(1000)은 예를 들어 통신 버스를 통해 또는 전용 입력 및/또는 출력 포트들을 통해 하나 이상의 다른 시스템들 또는 다른 전자 디바이스들에 통신가능하게 결합된다. 다양한 실시예들에서, 시스템(1000)은 본 문헌에 설명된 양상들 중 하나 이상을 구현하도록 구성된다.

시스템(1000)은 예를 들어, 본 문헌에서 설명된 다양한 양상들을 구현하기 위해 로딩된 명령들을 실행하도록 구성되는 적어도 하나의 프로세서(1010)를 포함한다. 프로세서(1010)는 본 기술분야에 공지된 바와 같이 내장 메모리, 입력 출력 인터페이스 및 다양한 다른 회로들을 포함할 수 있다. 시스템(1000)은 적어도 하나의 메모리(1020)(예를 들어, 휘발성 메모리 디바이스, 및/또는 비휘발성 메모리 디바이스)를 포함한다. 시스템(1000)은 EEPROM(Electrically Erasable Programmable Read-Only Memory), ROM(Read-Only Memory), PROM(Programmable Read-Only Memory), RAM(Random Access Memory), DRAM(Dynamic Random Access Memory), SRAM(Static Random Access Memory), 플래시, 자기 디스크 드라이브 및/또는 광학 디스크 드라이브를 포함하지만 이에 제한되지 않는 비휘발성 메모리 및/또는 휘발성 메모리를 포함할 수 있는 저장 디바이스(1040)를 포함한다. 저장 디바이스(1040)는 비제한적 예들로서, 내부 저장 디바이스, 부착된 저장 디바이스(착탈식 및 비착탈식 저장 디바이스들을 포함함) 및/또는 네트워크 액세스가능한 저장 디바이스를 포함할 수 있다.

시스템(1000)은 예를 들어 데이터를 프로세싱하여 인코딩된 비디오 또는 디코딩된 비디오를 제공하도록 구성된 인코더/디코더 모듈(1030)을 포함하고, 인코더/디코더 모듈(1030)은 자체 프로세서 및 메모리를 포함할 수 있다. 인코더/디코더 모듈(1030)은 인코딩 및/또는 디코딩 기능들을 수행하기 위해 디바이스에 포함될 수 있는 모듈(들)을 표현한다. 공지된 바와 같이, 디바이스는 인코딩 및 디코딩 모듈들 중 하나 또는 둘 모두를 포함할 수 있다. 추가적으로, 인코더/디코더 모듈(1030)은 시스템(1000)의 개별 요소로서 구현될 수 있거나 또는 본 기술분야의 통상의 기술자들에게 공지된 바와 같이 하드웨어 및 소프트웨어의 조합으로서 프로세서(1010) 내에 통합될 수 있다.

본 문헌에 설명된 다양한 양상들을 수행하기 위해 프로세서(1010) 또는 인코더/디코더(1030) 상에 로딩될 프로그램 코드는 저장 디바이스(1040)에 저장될 수 있고, 후속적으로 프로세서(1010)에 의한 실행을 위해 메모리(1020) 상에 로딩될 수 있다. 다양한 실시예들에 따르면, 프로세서(1010), 메모리(1020), 저장 디바이스(1040) 및 인코더/디코더 모듈(1030) 중 하나 이상은 본 문헌에 설명된 프로세스들의 수행 동안 다양한 항목들 중 하나 이상을 저장할 수 있다. 이러한 저장된 항목들은 입력 비디오, 디코딩된 비디오 또는 디코딩된 비디오의 부분들, 비트스트림, 매트릭스들, 변수들 및 수식들, 공식들, 연산들 및 연산 로직의 프로세싱으로부터의 중간 또는 최종 결과들을 포함할 수 있지만 이에 제한되지 않는다.

일부 실시예들에서, 프로세서(1010) 및/또는 인코더/디코더 모듈(1030) 내부의 메모리는 명령들을 저장하고 인코딩 또는 디코딩 동안 필요한 프로세싱을 위한 동작 메모리를 제공하기 위해 사용된다. 그러나, 다른 실시예들에서, 프로세싱 디바이스(예를 들어, 프로세싱 디바이스는 프로세서(1010) 또는 인코더/디코더 모듈(1030)일 수 있음) 외부의 메모리가 이러한 기능들 중 하나 이상에 사용된다. 외부 메모리는 메모리(1020) 및/또는 저장 디바이스(1040), 예를 들어 동적 휘발성 메모리 및/또는 비휘발성 플래시 메모리일 수 있다. 몇몇 실시예들에서, 외부 비휘발성 플래시 메모리는 예를 들어 텔레비전의 운영 체제를 저장하기 위해 사용된다. 적어도 하나의 실시예에서, RAM과 같은 빠른 외부 동적 휘발성 메모리는 MPEG-2(MPEG는 Moving Picture Experts Group을 나타내고, MPEG-2는 또한 ISO/IEC 13818로 지칭되고, 13818-1은 또한 H.222로 공지되고, 13818-2는 또한 H.262로 공지됨), HEVC(HEVC는 H.265 및 MPEG-H Part 2로 또한 공지된 High Efficiency Video Coding을 나타냄) 또는 VVC(JVET, Joint Video Experts Team에 의해 개발중인 새로운 표준인 Versatile Video Coding)와 같은 비디오 코딩 및 디코딩 동작들을 위한 동작 메모리로서 사용된다.

시스템(1000)의 요소들에 대한 입력은 블록(1130)에 표시된 바와 같은 다양한 입력 디바이스들을 통해 제공될 수 있다. 이러한 입력 디바이스들은 (i) 예를 들어, 방송사에 의해 무선으로 송신되는 RF 신호를 수신하는 무선 주파수(RF) 부분, (ii) 컴포넌트(COMP) 입력 단자(또는 COMP 입력 단자들의 세트), (iii) 범용 직렬 버스(USB) 입력 단자 및/또는 (iv) HDMI(High Definition Multimedia Interface) 입력 단자를 포함하지만 이에 제한되지 않는다. 도 10에 도시되지 않은 다른 예들은 복합 비디오를 포함한다.

다양한 실시예들에서, 블록(1130)의 입력 디바이스들은 당업계에 공지된 바와 같이 연관된 각각의 입력 프로세싱 요소들을 갖는다. 예를 들어, RF 부분은 (i) 원하는 주파수를 선택하는 것(또한 신호를 선택하는 것 또는 신호를 주파수들의 대역으로 대역 제한하는 것으로 지칭됨), (ii) 선택된 신호를 하향변환하는 것, (iii) (예를 들어) 특정 실시예들에서 채널로 지칭될 수 있는 신호 주파수 대역을 선택하기 위해 주파수들의 더 좁은 대역으로 다시 대역 제한하는 것, (iv) 하향변환되고 대역 제한된 신호를 복조하는 것, (v) 에러 정정을 수행하는 것, 및 (vi) 데이터 패킷들의 원하는 스트림을 선택하기 위해 디멀티플렉싱하는 것에 적합한 요소들과 연관될 수 있다. 다양한 실시예들의 RF 부분은 이러한 기능들을 수행하기 위한 하나 이상의 요소들, 예를 들어, 주파수 선택기들, 신호 선택기들, 대역 제한기들, 채널 선택기들, 필터들, 하향변환기들, 복조기들, 에러 정정기들 및 디멀티플렉서들을 포함한다. RF 부분은 예를 들어 수신된 신호를 더 낮은 주파수(예를 들어, 중간 주파수 또는 근-기저대역 주파수) 또는 기저대역으로 하향변환하는 것을 포함하는 이러한 다양한 기능들을 수행하는 튜너를 포함할 수 있다. 하나의 셋톱 박스 실시예에서, RF 부분 및 연관된 입력 프로세싱 요소는 유선(예를 들어, 케이블) 매체를 통해 송신된 RF 신호를 수신하고, 필터링, 하향변환 및 원하는 주파수 대역으로 다시 필터링함으로써 주파수 선택을 수행한다. 다양한 실시예들은 전술된(및 다른) 요소들의 순서를 재배열하고, 이들 요소들 중 일부를 제거하고, 그리고/또는 유사하거나 상이한 기능들을 수행하는 다른 요소들을 추가한다. 요소들을 추가하는 것은 예를 들어, 증폭기들 및 아날로그-디지털 변환기를 삽입하는 것과 같이 기존 요소들 사이에 요소들을 삽입하는 것을 포함할 수 있다. 다양한 실시예들에서, RF 부분은 안테나를 포함한다.

추가로, USB 및/또는 HDMI 단자들은 시스템(1000)을 USB 및/또는 HDMI 연결부들을 통해 다른 전자 디바이스들에 연결하기 위한 각각의 인터페이스 프로세서들을 포함할 수 있다. 예를 들어, 리드-솔로몬(Reed-Solomon) 에러 정정과 같은 입력 프로세싱의 다양한 양상들은 예를 들어 별도의 입력 프로세싱 IC 내에서 또는 필요에 따라 프로세서(1010) 내에서 구현될 수 있음을 이해해야 한다. 유사하게, USB 또는 HDMI 인터페이스 프로세싱의 양상들은 별도의 인터페이스 IC 내에서 또는 필요에 따라 프로세서(1010) 내에서 구현될 수 있다. 복조, 오류 정정 및 디멀티플렉싱된 스트림은 예를 들어, 출력 디바이스 상에의 제시를 위해 필요에 따라 데이터스트림을 프로세싱하기 위해 메모리 및 저장 요소들과 조합하여 동작하는 프로세서(1010) 및 인코더/디코더(1030)를 포함하는 다양한 프로세싱 요소들에 제공된다.

시스템(1000)의 다양한 요소들은 통합된 하우징 내에 제공될 수 있다. 통합된 하우징 내에서, 다양한 요소들은 상호연결될 수 있으며, 예를 들어 Inter-IC(I2C) 버스, 배선 및 인쇄 회로 보드들을 포함하는 당업계에 공지된 내부 버스와 같은 적합한 연결 배열을 사용하여 그 사이에서 데이터를 송신할 수 있다.

시스템(1000)은 통신 채널(1060)을 통해 다른 디바이스들과의 통신을 가능하게 하는 통신 인터페이스(1050)를 포함한다. 통신 인터페이스(1050)는 통신 채널(1060)을 통해 데이터를 송신 및 수신하도록 구성된 트랜시버를 포함할 수 있지만, 이에 제한되는 것은 아니다. 통신 인터페이스(1050)는 모뎀 또는 네트워크 카드를 포함할 수 있지만 이에 제한되는 것은 아니며, 통신 채널(1060)은 예를 들어, 유선 및/또는 무선 매체 내에서 구현될 수 있다.

데이터는 Wi-Fi 네트워크, 예를 들어 IEEE 802.11(IEEE는 Institute of Electrical and Electronics Engineers를 나타냄)과 같은 무선 네트워크를 사용하여 다양한 실시예들에서 시스템(1000)에 스트리밍되거나 그렇지 않으면 제공된다. 이들 실시예들의 Wi-Fi 신호는 Wi-Fi 통신들에 적응된 통신 채널(1060) 및 통신 인터페이스(1050)를 통해 수신된다. 이러한 실시예들의 통신 채널(1060)은 통상적으로 스트리밍 애플리케이션들 및 다른 OTA(over-the-top) 통신들을 허용하기 위해 인터넷을 포함한 외부 네트워크들에 대한 액세스를 제공하는 액세스 포인트 또는 라우터에 연결된다. 다른 실시예들은 입력 블록(1130)의 HDMI 연결을 통해 데이터를 전달하는 셋톱 박스를 사용하여 시스템(1000)에 스트리밍된 데이터를 제공한다. 또 다른 실시예들은 입력 블록(1130)의 RF 연결을 사용하여 시스템(1000)에 스트리밍된 데이터를 제공한다. 전술된 바와 같이, 다양한 실시예들은 비-스트리밍 방식으로 데이터를 제공한다. 추가적으로, 다양한 실시예들은 Wi-Fi 이외의 무선 네트워크들, 예를 들어 셀룰러 네트워크 또는 블루투스 네트워크를 사용한다.

시스템(1000)은 디스플레이(1100), 스피커(1110) 및 다른 주변 디바이스들(1120)을 포함하는 다양한 출력 디바이스들에 출력 신호를 제공할 수 있다. 다양한 실시예들의 (1100)는 예를 들어, 터치스크린 디스플레이, 유기 발광 다이오드(OLED) 디스플레이, 곡면 디스플레이 및/또는 폴더블 디스플레이 중 하나 이상을 포함한다. 디스플레이(1100)는 텔레비전, 태블릿, 랩톱, 셀 폰(모바일 폰) 또는 다른 디바이스를 위한 것일 수 있다. 디스플레이(1100)는 또한 (예를 들어, 스마트 폰에서와 같이) 다른 컴포넌트들과 통합되거나 별개일 수 있다(예를 들어, 랩톱을 위한 외부 모니터). 다른 주변 디바이스(1120)는 실시예들의 다양한 예들에서, 독립형 디지털 비디오 디스크(또는 디지털 다용도 디스크)(두 용어 모두에 대해 DVR), 디스크 플레이어, 스테레오 시스템 및/또는 조명 시스템 중 하나 이상을 포함한다. 다양한 실시예들은 시스템(1000)의 출력에 기초한 기능을 제공하는 하나 이상의 주변 디바이스들(1120)을 사용한다. 예를 들어, 디스크 플레이어는 시스템(1000)의 출력을 재생하는 기능을 수행한다.

다양한 실시예들에서, 제어 신호들은, 사용자 개입으로 또는 개입없이 디바이스-대-디바이스 제어를 가능하게 하는 AV.Link, CEC(Consumer Electronics Control) 또는 다른 통신 프로토콜들과 같은 시그널링을 사용하여 시스템(1000)과 디스플레이(1100), 스피커들(1110) 또는 다른 주변 디바이스들(1120) 사이에서 통신된다. 출력 디바이스들은 각각의 인터페이스들(1070, 1080 및 1090)을 통한 전용 연결들을 통해 시스템(1000)에 통신가능하게 결합될 수 있다. 대안적으로, 출력 디바이스들은 통신 인터페이스(1050)를 통해 통신 채널(1060)을 사용하여 시스템(1000)에 연결될 수 있다. 디스플레이(1100) 및 스피커들(1110)은 예를 들어 텔레비전과 같은 전자 디바이스에서 시스템(1000)의 다른 컴포넌트들과 단일 유닛으로 통합될 수 있다. 다양한 실시예들에서, 디스플레이 인터페이스(1070)는 예를 들어 타이밍 제어기(T Con) 칩과 같은 디스플레이 드라이버를 포함한다.

예를 들어, 입력(1130)의 RF 부분이 별도의 셋톱 박스의 일부인 경우, 디스플레이(1100) 및 스피커(1110)는 대안적으로 다른 컴포넌트들 중 하나 이상과 별개일 수 있다. 디스플레이(1100) 및 스피커들(1110)이 외부 컴포넌트들인 다양한 실시예들에서, 출력 신호는 예를 들어 HDMI 포트들, USB 포트들 또는 COMP 출력들을 포함하는 전용 출력 연결들을 통해 제공될 수 있다.

실시예들은 프로세서(1010)에 의해 또는 하드웨어에 의해, 또는 하드웨어와 소프트웨어의 조합에 의해 구현되는 컴퓨터 소프트웨어에 의해 수행될 수 있다. 비제한적인 예로서, 실시예들은 하나 이상의 집적 회로들에 의해 구현될 수 있다. 메모리(1020)는 기술적인 환경에 적합한 임의의 유형일 수 있고, 임의의 적합한 데이터 저장 기술, 예를 들어, 비제한적인 예들로서, 광 메모리 디바이스들, 자기 메모리 디바이스들, 반도체 기반 메모리 디바이스들, 고정 메모리 및 착탈식 메모리를 사용하여 구현될 수 있다. 프로세서(1010)는 기술적인 환경에 적합한 임의의 유형일 수 있고, 비제한적 예들로서 마이크로프로세서들, 범용 컴퓨터들, 특수 목적 컴퓨터들 및 멀티-코어 아키텍처에 기초한 프로세서들 중 하나 이상을 포함할 수 있다.

다양한 구현들은 디코딩을 수반한다. 본 출원에서 사용되는 바와 같이 "디코딩"은 예를 들어, 디스플레이에 적합한 최종 출력을 생성하기 위해 수신된 인코딩된 시퀀스에서 수행되는 프로세스들의 전부 또는 일부를 포함할 수 있다. 다양한 실시예들에서, 이러한 프로세스들은 통상적으로 디코더에 의해 수행되는 프로세스들 중 하나 이상, 예를 들어 엔트로피 디코딩, 역양자화, 역변환 및 차등 디코딩을 포함한다. 다양한 실시예들에서, 이러한 프로세스들은 또한 또는 대안적으로 본 출원에서 설명된 다양한 구현들의 디코더에 의해 수행되는 프로세스들, 예를 들어, 픽처의 적어도 하나의 영역의 코딩 유형 또는 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하는 것, 및 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하는 것을 포함하고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 크기 RegionTypeSize인 픽처의 직사각형 영역 중 하나이다.

추가 예들로서, 일 실시예에서 "디코딩"은 엔트로피 디코딩만을 지칭하고, 다른 실시예에서 "디코딩"은 차등 디코딩만을 지칭하고, 다른 실시예에서 "디코딩"은 엔트로피 디코딩 및 차등 디코딩의 조합을 지칭한다. 어구 "디코딩 프로세스"가 구체적으로 동작들의 서브세트를 지칭하는지 또는 일반적으로 더 넓은 디코딩 프로세스를 지칭하도록 의도되는지 여부는 특정 설명들의 맥락에 기초하여 명백할 것이고, 본 기술분야의 통상의 기술자들에 의해 잘 이해될 것으로 여겨진다.

다양한 구현들은 인코딩을 수반한다. "디코딩"에 대한 상기 논의와 유사한 방식으로, 본 출원에서 사용된 바와 같은 "인코딩"은 예를 들어 인코딩된 비트스트림을 생성하기 위해 입력 비디오 시퀀스에서 수행되는 프로세스들의 전부 또는 일부를 포함할 수 있다. 다양한 실시예들에서, 이러한 프로세스들은 인코더에 의해 통상적으로 수행되는 프로세스들 중 하나 이상, 예를 들어 파티셔닝, 차등 인코딩, 변환, 양자화 및 엔트로피 인코딩을 포함한다. 다양한 실시예들에서, 이러한 프로세스들은 또한 또는 대안적으로 본 출원에서 설명된 다양한 구현들의 인코더에 의해 수행되는 프로세스들, 예를 들어, 픽처의 적어도 하나의 영역의 코딩 유형 또는 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 것, 및 코딩 유형 및 코딩 트리 유형에 따라 픽처의 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하는 것을 포함하고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 크기 RegionTypeSize인 픽처의 직사각형 영역 중 하나이다.

추가 예들로서, 일 실시예에서 "인코딩"은 엔트로피 인코딩만을 지칭하고, 다른 실시예에서 "인코딩"은 차등 인코딩만을 지칭하고, 다른 실시예에서 "인코딩"은 차등 인코딩 및 엔트로피 인코딩의 조합을 지칭한다. 어구 "인코딩 프로세스"가 구체적으로 동작들의 서브세트를 지칭하는지 또는 일반적으로 더 넓은 인코딩 프로세스를 지칭하도록 의도되는지 여부는 특정 설명들의 맥락에 기초하여 명백할 것이고, 본 기술분야의 통상의 기술자들에 의해 잘 이해될 것으로 여겨진다.

본 명세서에서 사용되는 바와 같은 신택스 요소들, 예를 들어, 인트라 또는 인터를 포함하는 코딩 유형 및 공동 또는 듀얼을 포함하는 코딩 트리 유형은 설명적인 용어들임에 유의한다. 따라서, 이들은 다른 신택스 요소 이름들의 사용을 배제하지 않는다. 예를 들어 인터 대신 넌-인트라, 듀얼 대신에 분리된이 사용될 수 있다.

도면이 흐름도로서 제시될 때, 이는 또한 대응하는 장치의 블록도를 제공함을 이해해야 한다. 유사하게, 도면이 블록도로서 제시될 때, 이는 또한 대응하는 방법/프로세스의 흐름도를 제공함을 이해해야 한다.

본 명세서에서 설명되는 구현들 및 양상들은, 예를 들어, 방법 또는 프로세스, 장치, 소프트웨어 프로그램, 데이터 스트림 또는 신호에서 구현될 수 있다. 오직 단일 형태의 구현의 상황에서 논의되는(예를 들어, 오직 방법으로서만 논의되는) 경우에도, 논의되는 특징들의 구현은 또한 다른 형태들(예를 들어, 장치 또는 프로그램)로 구현될 수 있다. 장치는 예를 들어, 적절한 하드웨어, 소프트웨어 및 펌웨어로 구현될 수 있다. 방법들은, 예를 들어, 컴퓨터, 마이크로프로세서, 집적 회로 또는 프로그래밍가능 로직 디바이스를 포함하는 일반적인 프로세싱 디바이스들을 지칭하는, 예를 들어, 프로세서로 구현될 수 있다. 프로세서들은 또한, 예를 들어, 컴퓨터들, 셀 폰들, 휴대용/개인 휴대 정보 단말("PDA들"), 및 최종 사용자들 사이에서 정보의 통신을 용이하게 하는 다른 디바이스들과 같은 통신 디바이스들을 포함한다.

"일 실시예" 또는 "실시예" 또는 "일 구현" 또는 "구현" 뿐만 아니라 이들의 다른 변화예들에 대한 참조는, 실시예와 관련하여 설명되는 특정한 특징, 구조, 특성 등이 적어도 하나의 실시예에 포함되는 것을 의미한다. 따라서, 본 명세서 전반에 걸친 다양한 위치들에서 등장하는 구 "일 실시예에서" 또는 "실시예에서" 또는 "일 구현에서" 또는 "구현에서" 뿐만 아니라 다른 변화예들은, 반드시 동일한 실시예 전부를 참조할 필요는 없다.

추가적으로, 본 출원은, 정보의 다양한 조각들을 "결정"하는 것을 참조할 수 있다. 정보를 결정하는 것은, 예를 들어, 정보를 추정하는 것, 정보를 계산하는 것, 정보를 예측하는 것 또는 메모리로부터 정보를 검색하는 것 중 하나 이상을 포함할 수 있다.

추가로, 본 출원은, 정보의 다양한 조각들에 "액세스"하는 것을 참조할 수 있다. 정보에 액세스하는 것은, 예를 들어, 정보를 수신하는 것, (예를 들어, 메모리로부터) 정보를 검색하는 것, 정보를 저장하는 것, 정보를 이동시키는 것, 정보를 카피하는 것, 정보를 계산하는 것, 정보를 결정하는 것, 정보를 예측하는 것 또는 정보를 추정하는 것 중 하나 이상을 포함할 수 있다.

추가적으로, 본 출원은, 정보의 다양한 조각들을 "수신"하는 것을 참조할 수 있다. 수신하는 것은, "액세스하는 것"에서와 같이 광의의 용어로 의도된다. 정보를 수신하는 것은, 예를 들어, 정보에 액세스하는 것 또는 (예를 들어, 메모리로부터) 정보를 검색하는 것 중 하나 이상을 포함할 수 있다. 추가적으로, "수신하는 것"은 통상적으로, 예를 들어, 정보를 저장하는 것, 정보를 프로세싱하는 것, 정보를 송신하는 것, 정보를 이동시키는 것, 정보를 카피하는 것, 정보를 소거하는 것, 정보를 계산하는 것, 정보를 결정하는 것, 정보를 예측하는 것 또는 정보를 추정하는 것과 같은 동작들 동안 하나의 방식 또는 다른 방식으로 수반된다.

예를 들어, "A/B", "A 및/또는 B", 및 "A 및 B 중 적어도 하나"의 경우들에서, "/", "및/또는" 및 "~ 중 적어도 하나" 중 임의의 것을 사용하는 것은 제1 나열된 옵션(A)만을 선택하는 것, 또는 제2 나열된 옵션(B)만을 선택하는 것, 또는 옵션들 둘 모두(A 및 B)를 선택하는 것을 포함하도록 의도된다. 추가 예로서, "A, B 및/또는 C" 및 "A, B 및 C 중 적어도 하나"의 경우들에서, 이러한 문구는 제1 나열된 옵션(A)만을 선택하는 것, 또는 제2 나열된 옵션(B)만을 선택하는 것, 또는 제3 나열된 옵션(C)만을 선택하는 것, 또는 제1 및 제2 나열된 옵션들(A 및 B)만을 선택하는 것, 또는 제1 및 제3 나열된 옵션들(A 및 C)만을 선택하는 것, 또는 제2 및 제3 나열된 옵션들(B 및 C)만을 선택하는 것, 또는 모든 3개의 옵션들(A 및 B 및 C)을 선택하는 것을 포함하도록 의도된다. 이것은, 본 기술분야 및 관련 기술분야의 당업자에게 자명한 바와 같이, 많은 항목들이 나열되는 만큼 확장될 수 있다.

또한, 본 명세서에서 사용되는 바와 같이, "신호"라는 단어는 무엇보다도, 대응하는 디코더에 대한 무언가를 표시하는 것을 의미한다. 예를 들어, 특정 실시예들에서, 인코더는 코딩 유형 또는 코딩 트리 유형으로서 영역 코딩을 위한 복수의 파라미터들 중 특정 파라미터를 시그널링한다. 이러한 방식으로, 일 실시예에서 동일한 파라미터가 인코더 측 및 디코더 측 둘 모두에서 사용된다. 따라서, 예를 들어, 인코더는 디코더가 동일한 특정 파라미터를 사용할 수 있도록 디코더에 특정 파라미터를 송신할 수 있다(명시적 시그널링). 반대로, 디코더가 이미 특정 파라미터들뿐만 아니라 다른 것들을 가진 경우, 디코더가 특정 파라미터를 알고 선택하도록 간단히 허용하기 위해 송신없이 시그널링이 사용될 수 있다(암시적 시그널링). 임의의 실제 기능들의 송신을 피함으로써, 다양한 실시예들에서 비트 절감이 실현된다. 시그널링은 다양한 방식들로 달성될 수 있음을 이해해야 한다. 예를 들어, 하나 이상의 신택스 요소들, 플래그들 등은 다양한 실시예들에서 대응하는 디코더에 정보를 시그널링하기 위해 사용된다. 상기 내용이 "신호"라는 단어의 동사 형태에 관한 것이지만, "신호"라는 단어는 본 명세서에서 또한 명사로 사용될 수 있다.

본 기술분야의 통상의 기술자에게 자명할 바와 같이, 구현들은, 예를 들어, 저장 또는 송신될 수 있는 정보를 반송하도록 포맷된 다양한 신호들을 생성할 수 있다. 정보는, 예를 들어, 방법을 수행하기 위한 명령들, 또는 설명된 구현들 중 하나에 의해 생성되는 데이터를 포함할 수 있다. 예를 들어, 신호는, 설명된 실시예의 비트스트림을 반송하도록 포맷될 수 있다. 이러한 신호는, 예를 들어, (예를 들어, 스펙트럼의 무선 주파수 부분을 사용하는) 전자기 파로서 또는 기저대역 신호로서 포맷될 수 있다. 포맷은, 예를 들어, 데이터 스트림을 인코딩하는 것 및 인코딩된 데이터 스트림과 캐리어를 변조하는 것을 포함할 수 있다. 신호가 반송하는 정보는, 예를 들어, 아날로그 또는 디지털 정보일 수 있다. 신호는, 공지된 바와 같이, 다양한 상이한 유선 또는 무선 링크들을 통해 송신될 수 있다. 신호는 프로세서-판독가능 매체 상에 저장될 수 있다.

다수의 실시예들을 설명한다. 이들 실시예들의 특징들은 단독으로 또는 임의의 조합으로 제공될 수 있다. 또한, 실시예들은 다양한 청구 카테고리들 및 유형들에 걸쳐 다음의 특징들, 장치들 또는 양상들 중 하나 이상을 단독으로 또는 임의의 조합으로 포함할 수 있다:

디코더 및/또는 인코더에 적용된 코딩 유형/코딩 트리 유형을 수정한다.

디코더 및/또는 인코더에서 코딩 유형/코딩 트리 유형이 적용되는 영역 레벨을 수정한다.

디코더 및/또는 인코더에서 여러 진보된 코딩/코딩 트리 예측 방법들을 가능하게 한다.

디코더가 영역 레벨에서 루마 및 크로마 컴포넌트들에 대한 코딩 유형/코딩 트리 유형을 식별할 수 있게 하는 신택스 요소들을 시그널링에 삽입한다.

이러한 신택스 요소들에 기초하여, 디코더에서 적용할 코딩/코딩 트리 예측 방법을 선택한다.

논의된 실시예들 중 임의의 것에 따른 루마 및 크로마를 디코딩/인코딩한다.

설명된 신택스 요소들 또는 그 변형들 중 하나 이상을 포함하는 비트스트림 또는 신호.

영역(코딩/코딩 트리를 공유하기 위해 정의된 타일, 타일 그룹 또는 직사각형 영역임)의 헤더 데이터 또는 영역의 제1 CTU의 헤더 데이터의 신택스 요소들을 시그널링에 삽입한다.

시퀀스-레벨 헤더 정보 또는 이미지-레벨 헤더 정보로부터 RegionTypeSize를 디코딩/인코딩한다.

설명된 신택스 요소들 또는 그 변형들 중 하나 이상을 포함하는 비트스트림 또는 신호를 생성 및/또는 송신 및/또는 수신 및/또는 디코딩한다.

설명된 실시예들 중 임의의 것에 따라 픽처의 영역의 인코딩/디코딩을 수행하는 TV, 셋톱 박스, 셀 폰, 태블릿 또는 다른 전자 디바이스.

설명된 실시예들 중 임의의 것에 따라 픽처의 영역의 인코딩/디코딩을 수행하고 결과 이미지를 (예를 들어, 모니터, 스크린 또는 다른 유형의 디스플레이를 사용하여) 디스플레이하는 TV, 셋톱 박스, 셀 폰, 태블릿 또는 다른 전자 디바이스.

설명된 실시예들 중 임의의 것에 따라 인코딩된 이미지 및 인코딩된 신택스 요소를 포함하는 신호를 수신하기 위해 (예를 들어, 튜너를 사용하여) 채널을 튜닝하는 TV, 셋톱 박스, 셀 폰, 태블릿 또는 다른 전자 디바이스.

설명된 실시예들 중 임의의 것에 따라 인코딩된 이미지 및 인코딩된 신택스 요소를 포함하는 신호를 무선을 통해 (예를 들어, 안테나를 사용하여) 수신하는 TV, 셋톱 박스, 셀 폰, 태블릿 또는 다른 전자 디바이스.

Claims

방법으로서,
픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스(syntax) 데이터 요소를 디코딩하는 단계 - 상기 코딩 유형은 인트라 코딩(Intra coding) 또는 인터 코딩(Inter coding) 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛(coding tree unit) CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마(luma) 및 크로마(chroma) 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 트리 유형을 획득하는 단계 - 상기 코딩 트리 유형은 공동(joint) 또는 듀얼(dual) 중 하나임 -; 및
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하는 단계를 포함하는,
방법.
디코더(200)를 포함하는 장치로서,
픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하고 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 트리 유형을 획득하고 - 상기 코딩 트리 유형은 공동 또는 듀얼 중 하나임 -;
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하기 위한,
장치.
방법으로서,
픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 단계 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 트리 유형을 획득하는 단계 - 상기 코딩 트리 유형은 공동 또는 듀얼 중 하나임 -; 및
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하는 단계를 포함하는,
방법.
인코더(100)를 포함하는 장치로서,
픽처의 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하고 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 트리 유형을 획득하고 - 상기 코딩 트리 유형은 공동 또는 듀얼 중 하나임 -;
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하기 위한,
장치.
제1항 또는 제3항의 방법 또는 제2항 또는 제4항의 장치로서,
코딩 트리 유형을 획득하는 것은 상기 코딩 유형으로부터 상기 코딩 트리 유형을 유도하는 것을 포함하고, 공동 코딩 트리 유형은 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하고, 듀얼 코딩 트리 유형은 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시하고,
상기 코딩 트리 유형은 상기 적어도 하나의 영역의 코딩 유형이 인트라 코딩인 경우 듀얼이고, 상기 코딩 트리 유형은 상기 적어도 하나의 영역의 코딩 유형이 인터 코딩인 경우 공동인 것인,
방법 또는 장치.
제1항 또는 제3항의 방법 또는 제2항 또는 제4항의 장치로서,
코딩 트리 유형을 획득하는 것은 픽처의 상기 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩 또는 인코딩하는 것을 포함하고, 공동 코딩 트리 유형은 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하고, 듀얼 코딩 트리 유형은 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시하는 것인,
방법 또는 장치.
방법으로서,
픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하는 단계 - 상기 코딩 트리 유형은 듀얼 또는 공동 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 유형을 획득하는 단계 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나임 -; 및
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하는 단계를 포함하는,
방법.
디코더(200)를 포함하는 장치로서,
픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩하고 - 상기 코딩 트리 유형은 듀얼 또는 공동 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 유형을 획득하고 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나임 -;
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 디코딩하기 위한,
장치.
방법으로서,
픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하는 단계 - 상기 코딩 트리 유형은 듀얼 또는 공동 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 유형을 획득하는 단계 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나임 -; 및
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하는 단계를 포함하는,
방법.
인코더(100)를 포함하는 장치로서,
픽처의 적어도 하나의 영역의 코딩 트리 유형과 관련된 적어도 하나의 신택스 데이터 요소를 인코딩하고 - 상기 코딩 트리 유형은 듀얼 또는 공동 중 하나이고, 픽처의 영역은 타일, 코딩 트리 유닛 CTU, 상기 픽처의 직사각형 영역 중 하나이고, 상기 직사각형 영역의 루마 및 크로마 컴포넌트들에 대해 동일한 코딩 트리 유형이 사용됨 -;
픽처의 상기 적어도 하나의 영역의 코딩 유형을 획득하고 - 상기 코딩 유형은 인트라 코딩 또는 인터 코딩 중 하나임 -;
상기 코딩 유형 및 코딩 트리 유형에 따라 픽처의 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들을 인코딩하기 위한,
장치.
제7항 또는 제9항의 방법 또는 제8항 또는 제10항의 장치로서,
공동 코딩 트리 유형은 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들에 의해 단일 코딩 트리가 공유되는 것을 표시하고, 듀얼 코딩 트리 유형은 상기 적어도 하나의 영역의 루마 및 크로마 컴포넌트들 사이의 분리된 코딩 트리들이 사용되는 것을 표시하는 것인,
방법 또는 장치.
제7항, 제9항 또는 제11항 중 어느 한 항의 방법 또는 제8항, 제10항 또는 제11항 중 어느 한 항의 장치로서,
픽처의 상기 적어도 하나의 영역에 대한 코딩 유형은 상기 코딩 트리 유형으로부터 유도되고,
상기 적어도 하나의 영역의 상기 코딩 유형은 상기 코딩 트리 유형이 듀얼인 경우 인트라 코딩이고, 상기 적어도 하나의 영역의 상기 코딩 유형은 상기 코딩 트리 유형이 공동인 경우 인터 코딩인 것인,
방법 또는 장치.
제7항, 제9항 또는 제11항 중 어느 한 항의 방법 또는 제8항, 제10항 또는 제11항 중 어느 한 항의 장치로서, 픽처의 상기 적어도 하나의 영역의 코딩 유형과 관련된 적어도 하나의 신택스 데이터 요소를 디코딩 또는 인코딩하는 것을 더 포함하는,
방법 또는 장치.
비디오 신호 데이터로서,
비디오의 픽처의 적어도 하나의 인코딩된 영역; 및
상기 적어도 하나의 인코딩된 영역에 대한 적어도 하나의 인코딩된 신택스 데이터 요소를 포함하고;
픽처의 상기 적어도 하나의 영역 및 상기 적어도 하나의 인코딩된 신택스 데이터 요소는 제3항, 제5항, 제6항, 제9항, 제11항, 제12항, 제13항 중 어느 한 항의 인코딩 방법에 따라 인코딩되는 것인,
비디오 신호 데이터.
컴퓨터 상에서 프로그램이 실행되는 경우, 제1항, 제5항, 제6항, 제7항, 제11항, 제12항, 제13항 중 어느 한 항의 디코딩 방법을 실행하거나 제3항, 제5항, 제6항, 제9항, 제11항, 제12항, 제13항 중 어느 한 항의 인코딩 방법을 실행하기 위한 프로그램 코드 명령들을 포함하는 컴퓨터 프로그램 제품.