KR20210125086A

KR20210125086A - 선형 모델을 사용한 인트라 예측을 위한 방법 및 장치

Info

Publication number: KR20210125086A
Application number: KR1020217029813A
Authority: KR
Inventors: 알렉세이 콘스탄티노비치 필리포브; 바실리 알렉시비치 루피트스키이; 장러 천
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2019-02-22
Filing date: 2020-02-24
Publication date: 2021-10-15
Also published as: CN117041552A; CN116405668A; AU2020226573A1; BR112021016560A2; ZA202106297B; MX2021010130A; EP3928517A1; JP2022521757A; EP3928517A4; CL2021002220A1; CA3131027A1; CN116437077A; CN117278744A; WO2020169113A1; US20210385440A1; CN113545063A; CN113545063B; CN116418981A; CN116506599A

Abstract

본 발명은 픽처 처리 분야에 관한 것이다. 특히, 본 발명은 크로스 컴포넌트 선형 모델링(CCLM)을 사용한 인트라 예측(이를테면, 크로마 인트라 예측)의 개선 그리고 보다 구체적으로는 상이한 크로마 포맷들을 이용한 인트라 예측을 위해 크로스 컴포넌트 선형 모델에서 사용되는 공간 필터링을 다룬다. 픽처에 대한 크로스 컴포넌트 예측을 위한 장치, 인코더, 디코더 및 대응하는 방법들이 제공되며, 여기서 예측 동안 적용되는 다운샘플링 필터들의 세트는 코딩 효율을 개선하기 위해 다수의 지원되는 크로마 포맷들 중 하나일 수 있는 크로마 포맷에 의존한다.

Description

선형 모델을 사용한 인트라 예측을 위한 방법 및 장치

본 특허출원은 2019년 2월 22일자 출원된 미국 가특허출원 번호 제62/809,555호에 대한 우선권, 2019년 3월 28일자 출원된 미국 가특허출원 제62/825,021호에 대한 우선권, 및 2019년 3월 28일자 출원된 미국 가특허출원 제62/825,796호에 대한 우선권을 주장한다. 앞서 언급한 특허출원들의 개시내용은 이로써 그 전체가 인용에 의해 포함된다.

본 개시내용의 실시예들은 일반적으로 픽처(picture) 처리 분야에 관한 것으로, 보다 구체적으로는 크로스 컴포넌트 선형 모델링(CCLM: cross component linear modeling)을 사용한 인트라 예측(이를테면, 크로마 인트라 예측(chroma intra prediction))에 그리고 보다 구체적으로는 상이한 크로마 포맷들을 이용한 인트라 예측을 위해 크로스 컴포넌트 선형 모델에서 사용되는 공간 필터링에 관한 것이다.

비디오 코딩(비디오 인코딩 및/또는 디코딩)은 넓은 범위의 디지털 비디오 애플리케이션들, 예를 들어 방송, 디지털 TV, 인터넷 및 모바일 네트워크들을 통한 비디오 전송, 실시간 대화형 애플리케이션들, 이를테면 비디오 채팅, 화상 회의, DVD 및 블루레이 디스크들, 비디오 콘텐츠 획득 및 편집 시스템들, 그리고 캠코더들의 보안 애플리케이션들에 사용된다.

비교적 짧은 비디오라도 묘사하는 데 필요한 비디오 데이터의 양은 상당할 수 있으며, 이는 데이터가 스트리밍되거나 아니면 제한된 대역폭 용량을 갖는 통신 네트워크를 통해 전달되어야 할 때 어려움들을 야기할 수 있다. 따라서 비디오 데이터는 일반적으로 현대의 통신 네트워크들을 통해 전달되기 전에 압축된다. 메모리 자원들이 제한될 수 있기 때문에 비디오가 저장 디바이스에 저장될 때 비디오의 크기가 또한 문제가 될 수 있다. 비디오 압축 디바이스들은 종종 소스(source)에서 소프트웨어 및/또는 하드웨어를 사용하여 전송 또는 저장 전에 비디오 데이터를 코딩함으로써, 디지털 비디오 이미지들을 표현하는 데 필요한 데이터의 양을 감소시킨다. 압축된 데이터는 다음에, 비디오 데이터를 디코딩하는 비디오 압축 해제 디바이스에 의해 목적지에서 수신된다. 제한된 네트워크 자원들을 이용하여 그리고 더 높은 비디오 품질에 대한 요구들이 계속 증가함에 따라, 픽처 품질을 거의 또는 전혀 희생하지 않고 더 높은 압축비의 개선된 압축 및 압축 해제 기술들이 바람직하다.

특히, 현재의 다용도 비디오 코딩 및 테스트 모델(VTM: Versatile Video Coding and Test Model) 코더(coder)는 입력 픽처 포맷으로서 주로 크로마 포맷 4:2:0을 지원한다. 입력 크로마 포맷이 4:4:4가 될 때 VTM 코더 충돌이 발생할 수 있다. 그러한 문제를 피하기 위해, 다른 크로마 포맷들(이를테면, 4:4:4 또는 4:2:2)을 지원하는 코더가 매우 바람직하고 심지어 매우 다양한 애플리케이션들에 대해 필수이다.

위에서 언급된 난제들을 고려하여, 다수의 크로마 포맷들을 지원하기 위한 비디오 코딩 프로세스에 대한 수정이 본 개시내용에서 제안된다. 특히, 본 출원의 실시예들은 픽처에 대한 크로스 컴포넌트 예측을 위한 장치, 인코더, 디코더 및 대응하는 방법들을 제공하는 것을 목표로 하며, 여기서 예측 동안 적용되는 다운샘플링 필터들의 세트는 코딩 효율을 개선하기 위해 다수의 지원되는 크로마 포맷들 중 하나일 수 있는 크로마 포맷에 의존한다.

실시예들은 독립 청구항들의 특징들에 의해 정의되고, 실시예들의 추가 유리한 구현들은 종속 청구항들의 특징들에 의해 정의된다.

특정 실시예들은 첨부된 독립 청구항들에서 개요가 설명되며, 다른 실시예들은 종속 청구항들에서 개요가 설명된다.

앞서 말한 과제 및 다른 과제들은 독립 청구항들의 청구 대상에 의해 달성된다. 추가 구현 형태들은 종속 청구항들, 상세한 설명 및 도면들로부터 명백하다.

본 발명의 제1 양상에 따르면, 선형 모델을 사용하여 인트라 예측을 수행하기 위한 방법이 제공되며, 이 방법은:

크로마 포맷 정보에 기초하여 한 세트의 다운샘플링(down-sampling) 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계 ― 크로마 포맷 정보는 현재 블록이 속하는 픽처의 크로마 포맷을 지시함 ―;

한 세트의 다운샘플링 필터들 중(한 세트의 다운샘플링 필터들로부터 선택된) 개개의 다운샘플링 필터들을 사용하여 현재 블록의 루마(luma) 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 (루마 블록에 인접한) 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하는 단계;

다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는 (선택된 또는 이용 가능한) 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하는 단계; 및

선형 모델 계수들 및 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하는 단계를 포함한다.

따라서 크로마 포맷 정보에 기초한 필터 세트의 선택에 의해 보다 정확한 크로마 예측 신호 및 예측 오차 감소를 가능하게 하는 개선된 방법이 제공된다. 더 작은 예측 오차의 기술적 결과는 잔차 신호 에너지의 감소이다. 이러한 코딩 방법은 재구성된 신호의 왜곡을 감소시키거나, 잔차 신호를 인코딩하는 데 필요한 비트 레이트를 감소시키거나, 왜곡과 비트 레이트 모두를 감소시키기 위해, 이러한 감소를 이용할 수 있다. 본 발명에 의해 달성되는 이러한 유리한 효과들은 본 발명을 사용하는 코딩 방법의 전체 압축 성능의 값들을 개선한다.

본 개시내용에서는 "블록", "코딩 블록" 또는 "이미지 블록"이라는 용어가 사용되며, 이는 변환 유닛(TU: transform unit)들, 예측 유닛(PU: prediction unit)들, 코딩 유닛(CU: coding unit)들 등에 적용될 수 있다는 점이 주목된다. VVC에서는 일반적으로, TU 타일링(tiling) 또는 서브블록 변환(SBT: sub block transform)이 사용되는 경우의 몇몇 시나리오들을 제외하고는 변환 유닛들 및 코딩 유닛들이 대부분 정렬된다. "블록/이미지 블록/코딩 블록/변환 블록" 및 "블록 크기/변환 블록 크기"라는 용어들은 본 개시내용에서 서로 교환될 수 있다고 이해될 수 있다. "샘플/픽셀"이라는 용어들은 본 개시내용에서 서로 교환될 수 있다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 크로마 포맷 정보에 기초하여 한 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계는:

크로마 포맷 정보에 기초하여 수평 방향 및 수직 방향에서의 서브샘플링(subsampling) 비율 정보(이를테면, SubWidthC 및 SubHeightC 변수들)를 결정하는 단계; 및

서브샘플링 비율 정보(이를테면, SubWidthC 및 SubHeightC 변수들)에 기초하여 한 세트의 다운샘플링 필터들을 결정하는 단계를 포함한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 크로마 포맷이 4:2:0 크로마 포맷인 경우, 제1 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)이 현재 블록의 루마 블록에 사용되거나;

크로마 포맷이 4:2:2 크로마 포맷인 경우, 제2 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)이 현재 블록의 루마 블록에 사용되거나; 또는 크로마 포맷이 4:4:4 크로마 포맷인 경우, 제3 세트의 다운샘플링 필터들(즉, 계수 [1]을 갖는, 즉 바이패스 필터인 필터)이 현재 블록의 루마 블록에 사용된다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링 비율 정보에 기초하여 한 세트의 다운샘플링 필터들을 결정하는 단계는:

변수들이 SubWidthC=2 그리고 SubHeightC=2일 때, 현재 블록의 루마 블록에 대한 제1 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계;

SubWidthC=2 그리고 SubHeightC=1일 때, 현재 블록의 루마 블록에 대한 제2 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계; 또는

SubWidthC=1 그리고 SubHeightC=1일 때, 현재 블록의 루마 블록에 대한 제3 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계 중 하나 이상을 포함한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅(co-locate)될 때,

한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하는 단계는:

제1 세트의 재구성된 루마 샘플들에 제1 다운샘플링 필터를 적용함으로써 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하는 단계 ― 제1 세트의 재구성된 루마 샘플들은: 재구성된 루마 샘플(다운샘플링된 루마 샘플)의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 및

제2 세트의 재구성된 루마 샘플들에 제1 다운샘플링 필터를 적용함으로써 적어도 하나의 선택된 참조 루마 샘플들의 다운샘플링된 루마 참조 샘플을 획득하는 단계를 포함하며, 제2 세트의 재구성된 루마 샘플들은: 선택된 참조 루마 샘플(다운샘플링된 루마 샘플)의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;

제1 다운샘플링 필터는 한 세트의 다운샘플링 필터들로부터 선택된다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용될 때, 제1 다운샘플링 필터는 1D 비분리형(non-separable) 필터이거나; 또는

4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용될 때, 제1 다운샘플링 필터는 2D 비분리형 필터이다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용될 때, 제1 다운샘플링 필터(표준에 언급된 1D 비분리형 필터(F2))는 [1, 2, 1] 또는

으로 표현되며, 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 인접한 포지션들에 0이 아닌 계수들이 있고, 계수 "2"를 갖는 중앙 포지션은 필터링되는 재구성된 루마 샘플의 포지션에 대응한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용된다면, 제1 다운샘플링 필터(VVC 표준에 언급된 2D 비분리형 필터(F3))는

으로 표현되며, 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 0이 아닌 계수들이 있고, 계수 "4"를 갖는 중앙 포지션은 필터링되는 재구성된 루마 샘플의 포지션에 대응한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되지 않을 때,

제3 세트의 재구성된 루마 샘플들에 제2 다운샘플링 필터를 적용함으로써 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하는 단계 ― 제3 세트의 재구성된 루마 샘플들은: 재구성된 루마 샘플(다운샘플링된 루마 샘플)의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 및

제4 세트의 재구성된 루마 샘플들에 제2 다운샘플링 필터들을 적용함으로써 적어도 하나의 선택된 참조 루마 샘플의 다운샘플링된 루마 참조 샘플을 획득하는 단계를 포함하며, 제4 세트의 재구성된 루마 샘플들은: 선택된 참조 루마 샘플(다운샘플링된 루마 샘플)의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;

제2 다운샘플링 필터는 한 세트의 다운샘플링 필터들로부터 선택된다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용된다면, 제2 다운샘플링 필터는 1D 비분리형 필터이거나; 또는 4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용된다면, 제2 다운샘플링 필터는 2D 비분리형 필터이다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용된다면, 제2 다운샘플링 필터(표준에 언급된 1D 비분리형 필터(F1, F2))는 [2, 0] 또는 [1, 2, 1] 또는

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용된다면, 제2 다운샘플링 필터(VVC 표준에 언급된 2D 비분리형 필터(F4))는

로 표현되며, 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 또는 수직으로 인접한 포지션들에 0이 아닌 계수들이 있고, 계수 "2"를 갖는 중앙 포지션은 필터링되는 재구성된 루마 샘플의 포지션에 대응한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되는 것은, 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:

- 크로마 샘플 타입 2, 또는

- 크로마 샘플 타입 4

중 임의의 타입을 포함할 때 발생한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되지 않는 것은, 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:

- 크로마 샘플 타입 0,

- 크로마 샘플 타입 1,

- 크로마 샘플 타입 3, 또는

- 크로마 샘플 타입 5

중 임의의 타입을 포함할 때 발생한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 한 세트의 다운샘플링 필터들은 다음과 같이 결정된다:

크로마 포맷이 4:4:4 크로마 포맷이라면, 바이패스 필터가 사용되고; 그렇지 않으면, 한 세트의 필터들 {F2, F3, F5, F6}은 다음과 같이 결정된다:

F3[0] = 1, F3[1] = 2, F3[2] = 1

F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2

크로마 포맷이 4:2:0 크로마 포맷이라면,

F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

크로마 포맷이 4:2:2 크로마 포맷이라면,

F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0.

위와 같이, 크로마 포맷 4:2:0 및 4:2:2에 대한 필터들은 이웃 샘플들에 대한 최소 액세스에 의해 계산 복잡성을 최소화하는 것이 허용된다. 따라서 이는 원하는 스펙트럼 특성들 및 평활화 효과를 제공할 수 있게 한다. 추가로, 이는 크로마 컴포넌트가 서브샘플링되지 않는 경우에 대한 루마 필터링 프로세스를 특정할 수 있게 한다.

적어도 SubWidthC==1 그리고 SubHeightC==1을 포함하는 제1 조건이 충족되지 않는다면, 한 세트의 필터들 {F2, F3, F5, F6}은 다음과 같이 결정된다:

F3[0] = 1, F3[1] = 2, F3[2] = 1

F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2

적어도 제2 조건이 충족되며, 제2 조건이 SubWidthC==2 그리고 SubHeightC==2를 포함한다면,

F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

그렇지 않으면,

F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0.

위와 같이, 크로마 포맷 4:2:0 및 4:2:2에 대한 필터들은 이웃 샘플들에 대한 최소 액세스에 의해 계산 복잡성을 최소화하는 것이 허용된다. 따라서 이는 원하는 스펙트럼 특성들 및 평활화 효과를 제공할 수 있게 한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 선택된 루마 참조 샘플들은:

루마 블록 위에 있고 L개의 이용 가능한 크로마 참조 샘플들에 기초하여 선택되는 이웃 루마 샘플들, 또는

루마 블록 좌측에 있고 L개의 이용 가능한 크로마 참조 샘플들에 기초하여 선택되는 이웃 루마 샘플들 중 적어도 하나를 포함한다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 이용 가능한 크로마 참조 샘플들의 포지션들은:

LM 모드가 적용되며 위와 좌측 이웃 샘플들 모두가 이용 가능할 때는 S[W'/4, -1], S[3W'/4, -1], S[-1, H'/4], S[-1, 3H'/4]로;

LM-A 모드가 적용되거나 위의 이웃 샘플들만이 이용 가능할 때는 S[W'/8, -1], S[3W'/8, -1], S[5W'/8, -1], S[7W'/8, -1]로; 또는

LM-L 모드가 적용되거나 좌측 이웃 샘플들만이 이용 가능할 때는 S[-1, H'/8], S[-1, 3H'/8], S[-1, 5H'/8], S[-1, 7H'/8]로 특정되며;

크로마 블록 치수들은 W×H이고, W' 및 H'는,

LM 모드가 적용될 때는 W'=W, H'=H로;

LM-A 모드가 적용될 때는 W'=W+H로;

LM-L 모드가 적용될 때는 H'=H+W로 설정된다.

제1 양상의 임의의 선행 구현 및 그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하는 단계는:

다운샘플링된 루마 참조 샘플들에 기초하여 최대 루마 값 및 최소 루마 값을 결정하는 단계;

최대 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제1 크로마 값을 획득하는 단계;

최소 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제2 크로마 값을 획득하는 단계;

제1 크로마 값, 제2 크로마 값, 최대 루마 값 및 최소 루마 값에 기초하여 하나 이상의 선형 모델 계수들을 계산하는 단계를 포함한다.

본 발명의 제2 양상에 따르면, 비디오 데이터의 현재 이미지 블록의 크로스 컴포넌트 예측에 사용되는 하나 이상의 다운샘플링 필터들(루마 다운샘플링 필터)을 결정하는 방법이 제공되며, 이 방법은:

크로마 포맷 정보에 기초하여 수평 방향 및 수직 방향의 크로마 스케일링 계수(scaling factor)들을 결정하는 단계 ― 크로마 포맷 정보는 현재 이미지 블록이 속하는 현재 픽처의 크로마 포맷을 지시함 ―;

수평 방향 및 수직 방향의 크로마 스케일링 계수들의 값들이 제1 값과 같을 때, 현재 블록의 루마 블록에 대한 제1 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계;

수평 방향의 크로마 스케일링 계수의 값이 제1 값과 같고 수직 방향의 크로마 스케일링 계수의 값이 제2 값과 같을 때, 현재 블록의 루마 블록에 대한 제2 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계; 또는

수평 방향 및 수직 방향의 크로마 스케일링의 값들이 제2 값과 같을 때, 현재 블록의 루마 블록에 대한 제3 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계를 포함한다.

본 발명의 제3 양상에 따르면, 비디오 데이터의 현재 블록의 크로스 컴포넌트 예측에 사용되는 하나 이상의 루마 다운샘플링 필터들을 결정하는 방법으로서, 이 방법은:

현재 블록이 속하는 픽처의 크로마 포맷을 결정하는 단계;

크로마 포맷이 4:2:0 크로마 포맷일 때, 현재 블록의 루마 블록에 사용될 제1 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계;

크로마 포맷이 4:2:2 크로마 포맷일 때, 현재 블록의 루마 블록에 사용될 제2 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계;

크로마 포맷이 4:4:4 크로마 포맷일 때, 현재 블록의 루마 블록에 사용될 제3 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하는 단계를 포함한다.

본 발명의 제4 양상에 따르면, 선형 모델을 사용한 인트라 예측을 위한 장치는:

크로마 포맷 정보에 기초하여 한 세트의 다운샘플링 필터들을 결정하도록 구성된 결정 유닛 ― 크로마 포맷 정보는 현재 블록이 속하는 픽처의 크로마 포맷을 지시함 ―;

한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하도록 구성된 필터링 유닛;

다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하도록 구성된 선형 모델 도출 유닛; 및

선형 모델 계수들 및 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하도록 구성된 예측 처리 유닛을 포함한다.

본 개시내용에서는 "블록", "코딩 블록" 또는 "이미지 블록"이라는 용어가 사용되며, 이는 변환 유닛(TU)들, 예측 유닛(PU)들, 코딩 유닛(CU)들 등에 적용될 수 있다는 점이 주목된다. VVC에서는 일반적으로, TU 타일링 또는 서브블록 변환(SBT)이 사용되는 경우의 몇몇 시나리오들을 제외하고는 변환 유닛들 및 코딩 유닛들이 대부분 정렬된다. "블록/이미지 블록/코딩 블록/변환 블록" 및 "블록 크기/변환 블록 크기"라는 용어들은 본 개시내용에서 서로 교환될 수 있다고 이해될 수 있다. "샘플/픽셀"이라는 용어들은 본 개시내용에서 서로 교환될 수 있다.

따라서 크로마 포맷 정보에 기초한 필터 세트의 선택에 의해 보다 정확한 크로마 예측 신호 및 예측 오차 감소를 가능하게 하는 개선된 디바이스가 제공된다. 더 작은 예측 오차의 기술적 결과는 잔차 신호 에너지의 감소이다. 이러한 코딩 방법은 재구성된 신호의 왜곡을 감소시키거나, 잔차 신호를 인코딩하는 데 필요한 비트 레이트를 감소시키거나, 왜곡과 비트 레이트 모두를 감소시키기 위해, 이러한 감소를 이용할 수 있다. 본 발명에 의해 달성되는 이러한 유리한 효과들은 본 발명을 사용하는 코딩 방법의 전체 압축 성능의 값들을 개선한다.

그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 결정 유닛은:

크로마 포맷 정보에 기초하여 수평 방향 및 수직 방향에서의 서브샘플링 비율 정보를 결정하고; 그리고

서브샘플링 비율 정보에 기초하여 한 세트의 다운샘플링 필터들을 결정하도록 구성된다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서,

크로마 포맷이 4:2:0 크로마 포맷인 경우, 제1 세트의 다운샘플링 필터들이 현재 블록의 루마 블록에 사용되거나;

크로마 포맷이 4:2:2 크로마 포맷인 경우, 제2 세트의 다운샘플링 필터들이 현재 블록의 루마 블록에 사용되거나; 또는

크로마 포맷이 4:4:4 크로마 포맷인 경우, 제3 세트의 다운샘플링 필터들이 현재 블록의 루마 블록에 사용된다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 결정 유닛은:

변수들이 SubWidthC=2 그리고 SubHeightC=2일 때, 현재 블록의 루마 블록에 대한 제1 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하거나;

SubWidthC=2 그리고 SubHeightC=1일 때, 현재 블록의 루마 블록에 대한 제2 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하거나; 또는

SubWidthC=1 그리고 SubHeightC=1일 때, 현재 블록의 루마 블록에 대한 제3 세트의 다운샘플링 필터들(한 세트의 다운샘플링 필터 계수들)을 결정하도록 구성된다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅될 때,

필터링 유닛은: 제1 세트의 재구성된 루마 샘플들에 제1 다운샘플링 필터를 적용함으로써 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하고 ― 제1 세트의 재구성된 루마 샘플들은: 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 그리고

제2 세트의 재구성된 루마 샘플들에 제1 다운샘플링 필터를 적용함으로써 적어도 하나의 선택된 참조 루마 샘플들의 다운샘플링된 루마 참조 샘플을 획득하도록 구성되며, 제2 세트의 재구성된 루마 샘플들은: 선택된 참조 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용될 때, 제1 다운샘플링 필터는 1D 비분리형 필터이거나; 또는

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용될 때, 제1 다운샘플링 필터(표준에 언급된 1D 비분리형 필터(F2))는 [1, 2, 1] 또는

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용된다면, 제1 다운샘플링 필터(VVC 표준에 언급된 2D 비분리형 필터(F3))는

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되지 않을 때,

필터링 유닛은: 제3 세트의 재구성된 루마 샘플들에 제2 다운샘플링 필터를 적용함으로써 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하고 ― 제3 세트의 재구성된 루마 샘플들은: 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 그리고

제4 세트의 재구성된 루마 샘플들에 제2 다운샘플링 필터들을 적용함으로써 적어도 하나의 선택된 참조 루마 샘플의 다운샘플링된 루마 참조 샘플을 획득하도록 구성되며, 제4 세트의 재구성된 루마 샘플들은: 선택된 참조 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용된다면, 제2 다운샘플링 필터는 1D 비분리형 필터이거나; 또는

4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용된다면, 제2 다운샘플링 필터는 2D 비분리형 필터이다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 4:2:2 크로마 포맷(SubWidthC=2 그리고 SubHeightC=1)이 사용된다면, 제2 다운샘플링 필터(표준에 언급된 1D 비분리형 필터(F1, F2))는 [2, 0] 또는 [1, 2, 1] 또는

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 4:2:0 크로마 포맷(SubWidthC=2 그리고 SubHeightC=2)이 사용된다면, 제2 다운샘플링 필터(VVC 표준에 언급된 2D 비분리형 필터(F4))는

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되는 것은, 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:

- 크로마 샘플 타입 2, 또는

- 크로마 샘플 타입 4 중 임의의 타입일 때 발생한다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되지 않는 것은, 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:

- 크로마 샘플 타입 0,

- 크로마 샘플 타입 1,

- 크로마 샘플 타입 3, 또는

- 크로마 샘플 타입 5 중 임의의 타입을 포함할 때 발생한다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 결정 유닛은 한 세트의 다운샘플링 필터들을 결정하도록 구성되며:

F3[0] = 1, F3[1] = 2, F3[2] = 1

F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2

크로마 포맷이 4:2:0 크로마 포맷이라면,

F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

크로마 포맷이 4:2:2 크로마 포맷이라면,

F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 결정 유닛은 한 세트의 필터들 {F2, F3, F5, F6}을 다음과 같이 결정하도록 구성되며:

F3[0] = 1, F3[1] = 2, F3[2] = 1

F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2

F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

그렇지 않으면,

F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 선택된 루마 참조 샘플들은:

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 이용 가능한 크로마 참조 샘플들의 포지션들은:

LM 모드가 적용되며 위와 좌측 이웃 크로마 샘플들 모두가 이용 가능할 때는 S[W'/4, -1], S[3W'/4, -1], S[-1, H'/4], S[-1, 3H'/4]로;

LM-A 모드가 적용되거나 위의 이웃 크로마 샘플들만이 이용 가능할 때는 S[W'/8, -1], S[3W'/8, -1], S[5W'/8, -1], S[7W'/8, -1]로;

LM-L 모드가 적용되거나 좌측 이웃 크로마 샘플들만이 이용 가능할 때는 S[-1, H'/8], S[-1, 3H'/8], S[-1, 5H'/8], S[-1, 7H'/8]로 특정되며;

크로마 블록 치수들은 W×H이고, W' 및 H'는,

LM 모드가 적용될 때는 W'=W, H'=H로;

LM-A 모드가 적용될 때는 W'=W+H로;

LM-L 모드가 적용될 때는 H'=H+W로 설정된다.

제4 양상의 임의의 선행 구현 및 그러한 제4 양상에 따른 디바이스의 가능한 구현 형태에서, 선형 모델 도출 유닛은, 다운샘플링된 루마 참조 샘플들에 기초하여 최대 루마 값 및 최소 루마 값을 결정하고;

최대 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제1 크로마 값을 획득하고;

최소 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제2 크로마 값을 획득하고;

제1 크로마 값, 제2 크로마 값, 최대 루마 값 및 최소 루마 값에 기초하여 하나 이상의 선형 모델 계수들을 계산하도록 구성된다.

제5 양상에 따르면, 본 개시내용은 인코딩 디바이스에 의해 구현되는 인코딩 방법에 관한 것으로, 이 방법은:

이전 양상들 중 임의의 양상에 따라 선형 모델(이를테면, 크로스 컴포넌트 선형 모델(CCLM) 또는 다방향 선형 모델(MDLM: multi-directional linear model))을 사용하여 인트라 예측을 수행하는 단계; 및

복수의 신택스(syntax) 엘리먼트들을 포함하는 비트스트림을 생성하는 단계를 포함하며, 복수의 신택스 엘리먼트들은 블록에 속하는 루마 샘플에 대한 필터의 선택(이를테면, CCLM의 루마 필터, 특히 sps_cclm_colocated_chroma_flag와 같은 SPS 플래그의 선택)을 지시하는 신택스 엘리먼트를 포함한다.

그러한 제5 양상에 따른 방법의 가능한 구현 형태에서, 신택스 엘리먼트의 값이 0 또는 거짓(false)일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되고; 그리고

신택스 엘리먼트의 값이 1 또는 참(true)일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되지 않는다.

제6 양상에 따르면, 본 개시내용은 디코딩 디바이스에 의해 구현되는 디코딩 방법에 관한 것으로, 이 방법은:

비트스트림으로부터 복수의 신택스 엘리먼트들을 파싱(parse)하는 단계 ― 복수의 신택스 엘리먼트들은 블록에 속하는 루마 샘플에 대한 필터의 선택(이를테면, CCLM의 루마 필터, 특히 sps_cclm_colocated_chroma_flag와 같은 SPS 플래그의 선택)을 지시하는 신택스 엘리먼트를 포함함 ―; 및

이전 양상들 중 임의의 양상에 따라, 지시된 선형 모델(이를테면, CCLM)을 사용하여 인트라 예측을 수행하는 단계를 포함한다.

그러한 제6 양상에 따른 방법의 가능한 구현 형태에서, 신택스 엘리먼트의 값이 0 또는 거짓일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되고;

신택스 엘리먼트의 값이 1 또는 참일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되지 않는다. 예컨대, 콜로케이팅될 때는 루마 필터를 사용하지 않는다.

제7 양상에 따르면, 본 개시내용은 디코더에 관한 것으로, 디코더는:

하나 이상의 프로세서들; 및

프로세서들에 결합되며 프로세서들에 의한 실행을 위한 프로그래밍을 저장하는 비-일시적 컴퓨터 판독 가능 저장 매체를 포함하며, 프로그래밍은 프로세서들에 의해 실행될 때, 선행 양상들 중 임의의 양상 또는 선행 양상들의 임의의 가능한 실시예에 따른 방법을 실행하도록 디코더를 구성한다.

제8 양상에 따르면, 본 개시내용은 인코더에 관한 것으로, 인코더는:

하나 이상의 프로세서들; 및

프로세서들에 결합되며 프로세서들에 의한 실행을 위한 프로그래밍을 저장하는 비-일시적 컴퓨터 판독 가능 저장 매체를 포함하며, 프로그래밍은 프로세서들에 의해 실행될 때, 선행 양상들 또는 선행 양상들의 임의의 가능한 실시예에 따른 방법을 실행하도록 인코더를 구성한다.

본 개시내용의 제1 양상에 따른 방법은 본 개시내용의 제4 양상에 따른 장치에 의해 수행될 수 있다. 본 개시내용의 제6 양상에 따른 방법의 추가 특징들 및 구현 형태들은 본 개시내용의 제1 양상에 따른 장치의 특징들 및 구현 형태들에 대응한다.

본 개시내용의 제1 양상에 따른 방법은 본 개시내용의 제4 양상에 따른 장치에 의해 수행될 수 있다. 본 개시내용의 제1 양상에 따른 방법의 추가 특징들 및 구현 형태들은 본 개시내용의 제4 양상에 따른 장치의 특징들 및 구현 형태들에 대응한다.

다른 양상에 따르면, 본 개시내용은 비디오 스트림을 디코딩하기 위한 장치에 관한 것으로, 이 장치는 프로세서 및 메모리를 포함한다. 메모리는, 프로세서로 하여금 제1 또는 제3 양상에 따른 방법을 수행하게 하는 명령들을 저장하고 있다.

다른 양상에 따르면, 본 개시내용은 비디오 스트림을 인코딩하기 위한 장치에 관한 것으로, 이 장치는 프로세서 및 메모리를 포함한다. 메모리는, 프로세서로 하여금 제2 양상에 따른 방법을 수행하게 하는 명령들을 저장하고 있다.

다른 양상에 따르면, 실행될 때, 하나 이상의 프로세서들로 하여금 비디오 데이터를 코딩하게 하는 명령들이 저장된 컴퓨터 판독 가능 저장 매체가 제안된다. 명령들은 하나 이상의 프로세서들로 하여금 제1 또는 제2 양상, 또는 제1 또는 제2 또는 제3 양상의 임의의 가능한 실시예에 따른 방법을 수행하게 한다.

다른 양상에 따르면, 본 개시내용은 컴퓨터 상에서 실행될 때 제1 또는 제2 또는 제3 양상, 또는 제1 또는 제2 또는 제3 양상의 임의의 가능한 실시예에 따른 방법을 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램에 관한 것이다.

하나 이상의 실시예들의 세부사항들이 아래 첨부 도면들 및 상세한 설명에서 제시된다. 다른 특징들, 과제들 및 이점들은 설명, 도면들 및 청구항들로부터 자명할 것이다.

다음에, 첨부된 도표들 및 도면들을 참조하여 실시예들이 보다 상세히 설명된다.
도 1a는 본 명세서에 개시된 실시예들을 구현하도록 구성된 비디오 코딩 시스템의 일례를 보여주는 블록도이다.
도 1b는 본 명세서에 개시된 실시예들을 구현하도록 구성된 비디오 코딩 시스템의 다른 예를 보여주는 블록도이다.
도 2는 본 명세서에 개시된 실시예들을 구현하도록 구성된 비디오 인코더의 일례를 보여주는 블록도이다.
도 3은 본 명세서에 개시된 실시예들을 구현하도록 구성된 비디오 디코더의 예시적인 구조를 보여주는 블록도이다.
도 4는 본 명세서에 개시된 일 실시예에 따른 인코딩 장치 또는 디코딩 장치의 일례를 예시하는 블록도이다.
도 5는 본 명세서에 개시된 예시적인 실시예에 따른 인코딩 장치 또는 디코딩 장치의 다른 예를 예시하는 블록도이다.
도 6a는 픽처에서 4:2:0 루마 및 크로마 샘플들의 공칭 수직 및 수평 위치들을 예시하는 일례이다.
도 6b는 픽처에서 4:2:2 루마 및 크로마 샘플들의 공칭 수직 및 수평 위치들을 예시하는 일례이다.
도 6c는 픽처에서 4:4:4 루마 및 크로마 샘플들의 공칭 수직 및 수평 위치들을 예시하는 일례이다.
도 6d는 인터레이싱된 이미지에 대한 다양한 샘플링 패턴들을 예시한다.
도 6e는 크로마 인트라 예측을 위한 크로스 컴포넌트 선형 모델의 개념을 예시하는 도면이다.
도 7a는 현재 픽처의 크로마 포맷이 4:2:0일 때, 현재 픽처의 현재 이미지 블록 및 연관된 루마 및 크로마 참조 샘플들에 포함되는 콜로케이팅된 루마 및 크로마 블록들을 예시하는 일례이다.
도 7b는 현재 픽처의 크로마 포맷이 4:2:2일 때, 현재 픽처의 현재 이미지 블록 및 연관된 루마 및 크로마 참조 샘플들에 포함되는 콜로케이팅된 루마 및 크로마 블록들을 예시하는 일례이다.
도 7c는 현재 픽처의 크로마 포맷이 4:4:4일 때, 현재 픽처의 현재 이미지 블록 및 연관된 루마 및 크로마 참조 샘플들에 포함되는 콜로케이팅된 루마 및 크로마 블록들을 예시하는 일례이다.
도 7d는 현재 픽처의 크로마 포맷이 4:2:0일 때, 루마 블록(711)의 선택된 루마 참조 샘플들(715)의 다운샘플링된 루마 참조 샘플들(719) 및 다운샘플링된 루마 참조 샘플들(719)에 대응하는 크로마 참조 샘플들(705)을 예시하는 일례이다.
도 8은 선형 모델 파라미터 도출에 사용되는 예시적인 크로마 및 루마 참조 샘플들을 예시하는 도면이다.
도 9는 현재 픽처의 크로마 포맷이 4:2:0일 때 크로스 컴포넌트 인트라 예측 동안 다운샘플링에 수반되는 루마 샘플들의 공간 포지션들을 예시하는 도면이다.
도 10은 크로스 컴포넌트 인트라 예측을 지원하기 위한 다운샘플링의 예시적인 메커니즘들을 예시하는 개략도이다.
도 11은 본 개시내용의 일부 양상들에 따라 크로스 컴포넌트 인트라 예측을 수행하기 위한 프로세스를 예시하는 흐름도이다.
도 12는 본 개시내용의 일부 양상들에 따라 크로스 컴포넌트 인트라 예측을 수행하도록 구성된 디바이스의 개략도이다.
도 13은 콘텐츠 전달 서비스를 실현하는 콘텐츠 공급 시스템의 예시적인 구조를 도시하는 블록도이다.
도 14는 단말 디바이스의 일례의 구조를 도시하는 블록도이다.
다음에, 명시적으로 달리 지정되지 않는다면, 동일한 참조 부호들이 동일한 또는 적어도 기능적으로 동등한 특징들을 지칭할 것이다.

다음의 설명에서, 본 개시내용의 일부를 형성하며 본 명세서에 개시된 실시예들의 특정 양상들 또는 본 명세서에 개시된 실시예들이 사용될 수 있는 특정 양상들을 예시로 도시하는 첨부 도면들이 참조된다. 본 명세서에 개시된 실시예들은 다른 양상들에서 사용될 수 있으며, 도면들 도시되지 않은 구조적 또는 논리적 변경들을 포함할 수 있다고 이해된다. 따라서 다음의 상세한 설명은 한정의 의미로 여겨지는 것이 아니며, 본 개시내용의 범위는 첨부된 청구항들에 의해 정의된다.

다음의 약어들이 적용된다:

예컨대, 설명되는 방법과 관련한 개시내용은 방법을 수행하도록 구성된 대응하는 디바이스 또는 시스템에 대해서도 또한 사실을 유지할 수 있고 그 반대도 마찬가지라고 이해된다. 다른 한편으로는, 예를 들어 특정 장치가 하나 또는 복수의 유닛들, 예컨대 기능 유닛들을 기반으로 설명된다면, 대응하는 방법은 설명되는 하나 또는 복수의 방법 단계들을 수행할 하나 또는 복수의 유닛들, 예컨대 기능 유닛들(예컨대, 하나 또는 복수의 단계들을 수행하는 하나의 유닛들, 또는 복수의 단계들 중 하나 이상을 각각 수행하는 복수의 유닛들)이 도면들에 명시적으로 설명 또는 예시되지 않더라도, 그러한 하나 이상의 유닛들을 포함할 수 있다. 다른 한편으로는, 예를 들어 특정 장치가 하나 또는 복수의 유닛들, 예컨대 기능 유닛들을 기반으로 설명된다면, 대응하는 방법은 하나 또는 복수의 유닛들의 기능을 수행할 하나의 단계(예컨대, 하나 또는 복수의 유닛들의 기능을 수행하는 하나의 단계, 또는 복수의 유닛들 중 하나 이상의 유닛들의 기능을 각각 수행하는 복수의 단계들)를, 그러한 하나 또는 복수의 단계들이 도면들에 명시적으로 설명 또는 예시되지 않더라도, 포함할 수 있다. 또한, 본 명세서에서 설명되는 다양한 예시적인 실시예들 및/또는 양상들의 특징들은, 구체적으로 달리 명시되지 않는 한 서로 조합될 수 있다고 이해된다.

비디오 코딩은 통상적으로 비디오 또는 비디오 시퀀스를 형성하는 픽처들의 시퀀스를 처리하는 것을 의미한다. 비디오 코딩 분야에서는 "픽처"라는 용어 대신, "프레임" 또는 "이미지"라는 용어가 동의어들로 사용될 수 있다. 비디오 코딩(또는 일반적으로 코딩)은 비디오 인코딩과 비디오 디코딩 두 부분들을 포함한다. 비디오 인코딩은 소스 측에서 수행되어, 통상적으로 (보다 효율적인 저장 및/또는 전송을 위해) 비디오 픽처들을 표현하는 데 필요한 데이터의 양을 줄이도록 원본 비디오 픽처들을 (예컨대, 압축에 의해) 처리하는 것을 포함한다. 비디오 디코딩은 목적지 측에서 수행되며, 통상적으로 비디오 픽처들을 재구성하도록 인코더와 비교하여 역 처리를 포함한다. 비디오 픽처들(또는 일반적으로 픽처들)의 "코딩"을 언급하는 실시예들은 비디오 픽처들 또는 각각의 비디오 시퀀스의 "인코딩" 또는 "디코딩"에 관련되는 것으로 이해될 것이다. 인코딩 부분과 디코딩 부분의 조합은 또한 코덱(CODEC(Coding and Decoding))으로 지칭된다.

무손실 비디오 코딩의 경우, 원본 비디오 픽처들이 재구성될 수 있는데, 즉 재구성된 비디오 픽처들은 (저장 또는 전송 중에 전송 손실 또는 다른 데이터 손실이 없다고 가정하면) 원본 비디오 픽처들과 동일한 품질을 갖는다. 손실 비디오 코딩의 경우에는, 예컨대 양자화에 의한 추가 압축이 수행되어, 디코더에서 완벽하게 재구성될 수 없는 비디오 픽처들을 나타내는 데이터의 양을 감소시키는데, 즉 재구성된 비디오 픽처들의 품질은 원본 비디오 픽처들의 품질에 비해 더 낮거나 더 나쁘다.

여러 비디오 코딩 표준들은 "손실 하이브리드 비디오 코덱들"의 그룹에 속한다(즉, 샘플 도메인에서의 공간 및 시간 예측과 변환 도메인에서 양자화를 적용하기 위한 2D 변환 코딩을 조합한다). 비디오 시퀀스의 각각의 픽처는 통상적으로 한 세트의 비중첩 블록들로 파티셔닝(partition)되며, 코딩은 통상적으로 블록 레벨로 수행된다. 즉, 인코더에서 비디오는 통상적으로, 예컨대 공간(인트라 픽처) 예측 및/또는 시간(인터 픽처) 예측을 사용하여 예측 블록을 생성하고, (블록 현재 처리된/처리될) 현재 블록으로부터 예측 블록을 감산하여 잔차 블록을 획득하고, 잔차 블록을 변환하고 잔차 블록을 변환 도메인에서 양자화하여 전송될 데이터의 양을 감소(압축)시킴으로써 블록(비디오 블록) 레벨로 처리, 즉 인코딩되는 반면, 디코더에서는, 표현을 위해 현재 블록을 재구성하도록, 인코딩 또는 압축된 블록에 대해 인코더와 비교되는 역 처리가 적용된다. 더욱이, 인코더는 디코더 처리 루프를 복제하여, 인코더와 디코더 둘 다 후속 블록들을 처리, 즉 코딩하기 위해 동일한 예측들(예컨대, 인트라 예측 및 인터 예측) 및/또는 재구성을 생성할 것이다.

다음에는, 도 1 내지 도 3을 기초로 비디오 코딩 시스템(10), 비디오 인코더(20) 및 비디오 디코더(30)의 실시예들이 설명된다.

도 1a는 본 출원의 기술들을 이용할 수 있는 예시적인 코딩 시스템(10), 예컨대 비디오 코딩 시스템(10)(또는 줄여서 코딩 시스템(10))을 예시하는 개략적인 블록도이다. 비디오 코딩 시스템(10)의 비디오 인코더(20)(또는 줄여서 인코더(20)) 및 비디오 디코더(30)(또는 줄여서 디코더(30))는 본 출원에서 설명되는 다양한 예들에 따른 기술들을 수행하도록 구성될 수 있는 디바이스들의 예들을 나타낸다.

도 1a에 도시된 바와 같이, 코딩 시스템(10)은 예컨대, 인코딩된 픽처 데이터(21)를 디코딩하기 위한 목적지 디바이스(14)로 인코딩된 픽처 데이터(21)를 제공하도록 구성된 소스 디바이스(12)를 포함한다.

소스 디바이스(12)는 인코더(20)를 포함하고, 픽처 소스(16), 전처리기(또는 후처리 유닛)(18), 예컨대 픽처 전처리기(18) 및 통신 인터페이스 또는 통신 유닛(22)을 추가로, 즉 선택적으로 포함할 수 있다.

픽처 소스(16)는 임의의 종류의 픽처 캡처 디바이스, 예를 들어 실세계 픽처를 캡처하기 위한 카메라, 및/또는 임의의 종류의 픽처 생성 디바이스, 예를 들어 컴퓨터 애니메이션 픽처를 생성하기 위한 컴퓨터 그래픽 프로세서, 또는 실세계 픽처, 컴퓨터 애니메이션 픽처(예컨대, 화면 콘텐츠, 가상 현실(VR: virtual reality) 픽처) 및/또는 이들의 임의의 조합(예컨대, 증강 현실(AR: augmented reality) 픽처)를 획득 및/또는 제공하기 위한 임의의 종류의 다른 디바이스를 포함할 수 있거나 그러한 디바이스일 수 있다. 픽처 소스는 앞서 언급한 픽처들 중 임의의 픽처를 저장하는 임의의 종류의 메모리 또는 저장소일 수 있다.

전처리기(18) 및 전처리 유닛(18)에 의해 수행되는 처리와 구별하여, 픽처 또는 픽처 데이터(17)는 원시 픽처 또는 원시 픽처 데이터(17)로 또한 지칭될 수 있다.

전처리기(18)는 (원시) 픽처 데이터(17)를 수신하도록 그리고 픽처 데이터(17)에 대해 전처리를 수행하여 전처리된 픽처(19) 또는 전처리된 픽처 데이터(19)를 획득하도록 구성된다. 전처리기(18)에 의해 수행되는 전처리는 예컨대, 트리밍, (예컨대, RGB에서 YCbCr로의) 색 포맷 전환, 색 보정 또는 잡음 제거를 포함할 수 있다. 전처리 유닛(18)은 선택적인 컴포넌트일 수 있다고 이해될 수 있다.

비디오 인코더(20)는 전처리된 픽처 데이터(19)를 수신하고 인코딩된 픽처 데이터(21)를 제공하도록 구성된다(추가 세부사항들은 아래에서 예컨대, 도 2에 기초하여 설명될 것이다).

소스 디바이스(12)의 통신 인터페이스(22)는 인코딩된 픽처 데이터(21)를 수신하도록 그리고 인코딩된 픽처 데이터(21)(또는 그의 임의의 추가 처리된 버전)를 통신 채널(13)을 통해 저장 또는 직접 재구성을 위한 다른 디바이스, 예컨대 목적지 디바이스(14) 또는 임의의 다른 디바이스에 전송하도록 구성될 수 있다.

목적지 디바이스(14)는 디코더(30)(예컨대, 비디오 디코더(30))를 포함하고, 통신 인터페이스 또는 통신 유닛(28), 후처리기(32)(또는 후처리 유닛(32)) 및 디스플레이 디바이스(34)를 추가로, 즉 선택적으로 포함할 수 있다.

목적지 디바이스(14)의 통신 인터페이스(28)는 예컨대, 직접 소스 디바이스(12)로부터 또는 임의의 다른 소스, 예컨대 저장 디바이스, 예컨대 인코딩된 픽처 데이터 저장 디바이스로부터 인코딩된 픽처 데이터(21)(또는 그의 임의의 추가 처리된 버전)를 수신하고, 인코딩된 픽처 데이터(21)를 디코더(30)에 제공하도록 구성된다.

통신 인터페이스(22) 및 통신 인터페이스(28)는 인코딩된 픽처 데이터(21) 또는 인코딩된 데이터(13)를 소스 디바이스(12)와 목적지 디바이스(14) 간의 직접 통신 링크, 예컨대 직접 유선 또는 무선 연결을 통해, 또는 임의의 종류의 네트워크, 예컨대 유선 또는 무선 네트워크 또는 이들의 임의의 조합, 또는 임의의 종류의 사설 및 공용 네트워크, 또는 이들의 임의의 종류의 조합을 통해 전송 또는 수신하도록 구성될 수 있다.

통신 인터페이스(22)는 예컨대, 인코딩된 픽처 데이터(21)를 적절한 포맷, 예컨대 패킷들로 패키징하고, 그리고/또는 통신 링크 또는 통신 네트워크를 통한 전송을 위해 임의의 종류의 전송 인코딩 또는 처리를 사용하여 인코딩된 픽처 데이터를 처리하도록 구성될 수 있다.

통신 인터페이스(22)의 대응부를 형성하는 통신 인터페이스(28)는 예컨대, 전송된 데이터를 수신하고 임의의 종류의 대응하는 전송 디코딩 또는 처리 및/또는 디-패키징을 사용하여 전송 데이터를 처리하여 인코딩된 픽처 데이터(21)를 획득하도록 구성될 수 있다.

통신 인터페이스(22)와 통신 인터페이스(28) 둘 다, 소스 디바이스(12)로부터 목적지 디바이스(14)를 가리키는, 도 1a의 통신 채널(13)에 대한 화살표로 지시된 바와 같은 단방향 통신 인터페이스들, 또는 양방향 통신 인터페이스들로서 구성될 수 있고, 예컨대 접속을 설정하기 위해 예컨대, 메시지들을 송신 및 수신하여, 통신 링크 및/또는 데이터 전송, 예컨대 인코딩된 픽처 데이터 전송과 관련된 임의의 다른 정보를 확인 응답 및 교환하도록 구성될 수 있다.

디코더(30)는 인코딩된 픽처 데이터(21)를 수신하고 디코딩된 픽처 데이터(31) 또는 디코딩된 픽처(31)를 제공하도록 구성된다(추가 세부사항들은 아래에서 예컨대, 도 3 또는 도 5에 기초하여 설명될 것이다).

목적지 디바이스(14)의 후처리기(32)는 (재구성된 픽처 데이터로도 또한 지칭되는) 디코딩된 픽처 데이터(31), 예컨대 디코딩된 픽처(31)를 후처리하여, 후처리된 픽처 데이터(33), 예컨대 후처리된 픽처 데이터(33)를 획득하도록 구성된다. 후처리 유닛(32)에 의해 수행되는 후처리는 예컨대, (예컨대, YCbCr에서 RGB로의) 색 포맷 전환, 색 보정, 트리밍 또는 리샘플링, 또는 예컨대, 디코딩된 픽처 데이터(31)를 예컨대, 디스플레이 디바이스(34)에 의해 디스플레이할 준비를 위한 임의의 다른 처리를 포함할 수 있다.

목적지 디바이스(14)의 디스플레이 디바이스(34)는 예컨대, 사용자 또는 시청자에게 픽처를 디스플레이하기 위해 후처리된 픽처 데이터(33)를 수신하도록 구성된다. 디스플레이 디바이스(34)는 재구성된 픽처를 표현하기 위한 임의의 종류의 디스플레이, 예컨대 통합 또는 외부 디스플레이 또는 모니터일 수 있거나 이를 포함할 수 있다. 디스플레이는 예컨대, 액정 디스플레이(LCD: liquid crystal display)들, 유기 발광 다이오드(OLED: organic light emitting diode) 디스플레이들, 플라즈마 디스플레이들, 프로젝터들, 마이크로 LED 디스플레이들, 액정 온 실리콘(LCoS: liquid crystal on silicon), 디지털 광 프로세서(DLP: digital light processor) 또는 임의의 종류의 다른 디스플레이를 포함할 수 있다.

도 1a는 소스 디바이스(12)와 목적지 디바이스(14)를 별개의 디바이스들로 도시하고 있지만, 디바이스들의 실시예들은 또한, 소스 디바이스(12)와 목적지 디바이스(14) 둘 다 또는 소스 디바이스(12) 또는 대응하는 기능 및 목적지 디바이스(14) 또는 대응하는 기능 중 두 디바이스들 모두 또는 두 기능들 모두를 포함할 수 있다. 이러한 실시예들에서 소스 디바이스(12) 또는 대응하는 기능과 목적지 디바이스(14) 또는 대응하는 기능은 동일한 하드웨어 및/또는 소프트웨어를 사용하여, 그리고/또는 별도의 하드웨어 및/또는 소프트웨어에 의해 또는 이들의 임의의 조합으로 구현될 수 있다.

설명에 기초하여 당해 기술분야에서 통상의 지식을 가진 자들에게 명백한 바와 같이, 도 1a에 도시된 소스 디바이스(12) 및/또는 목적지 디바이스(14) 내의 서로 다른 유닛들 또는 기능들의 존재 및 (정확한) 기능들의 분할은 실제 디바이스 및 애플리케이션에 따라 달라질 수 있다.

인코더(20)(예컨대, 비디오 인코더(20)) 또는 디코더(30)(예컨대, 비디오 디코더(30)) 또는 인코더(20)와 디코더(30) 둘 다는 도 1b에 도시된 처리 회로, 이를테면 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서(DSP: digital signal processor)들, 주문형 집적 회로(ASIC: application-specific integrated circuit)들, 필드 프로그래밍 가능 게이트 어레이(FPGA: field-programmable gate array)들, 이산 로직, 하드웨어, 비디오 코딩 전용 또는 이들의 임의의 조합들을 통해 구현될 수 있다. 인코더(20)는 도 2의 인코더(20) 및/또는 본 명세서에서 설명되는 임의의 다른 인코더 시스템 또는 서브시스템에 대해 논의된 바와 같이 다양한 모듈들을 구현하도록 처리 회로(46)를 통해 구현될 수 있다. 디코더(30)는 도 3의 디코더(30) 및/또는 본 명세서에서 설명되는 임의의 다른 디코더 시스템 또는 서브시스템에 대해 논의된 바와 같이 다양한 모듈들을 구현하도록 처리 회로(46)를 통해 구현될 수 있다. 처리 회로는 나중에 논의되는 바와 같이 다양한 동작들을 수행하도록 구성될 수 있다. 도 5에 도시된 바와 같이, 기술들이 부분적으로는 소프트웨어로 구현된다면, 디바이스는 소프트웨어에 대한 명령들을 적절한 비-일시적 컴퓨터 판독 가능 저장 매체에 저장할 수 있고, 본 개시내용의 기술들을 수행하도록 하나 이상의 프로세서들을 사용하여 하드웨어에서 명령들을 실행할 수 있다. 비디오 인코더(20) 및 비디오 디코더(30) 중 어느 하나는 예를 들어, 도 1b에 도시된 바와 같이, 단일 디바이스에서 결합된 인코더/디코더(CODEC)의 일부로서 통합될 수 있다.

소스 디바이스(12) 및 목적지 디바이스(14)는 임의의 종류의 핸드헬드 또는 고정 디바이스들, 예컨대 노트북 또는 랩톱 컴퓨터들, 휴대폰들, 스마트폰들, 태블릿들 또는 태블릿 컴퓨터들, 카메라들, 데스크톱 컴퓨터들, 셋톱 박스들, 텔레비전들, 디스플레이 디바이스들, 디지털 미디어 플레이어들, 비디오 게임 콘솔들, 비디오 스트리밍 디바이스들(이를테면, 콘텐츠 서비스 서버들 또는 콘텐츠 전달 서버들), 브로드캐스트 수신기 디바이스, 브로드캐스트 전송기 디바이스 등을 포함하는 광범위한 디바이스들 중 임의의 디바이스를 포함할 수 있으며, 운영 시스템을 사용하지 않거나 임의의 종류의 운영 시스템을 사용할 수 있다. 일부 경우들에, 소스 디바이스(12) 및 목적지 디바이스(14)는 무선 통신을 위해 장착될 수 있다. 따라서 소스 디바이스(12) 및 목적지 디바이스(14)는 무선 통신 디바이스들일 수 있다.

일부 경우들에, 도 1a에 예시된 비디오 코딩 시스템(10)은 단지 일례일 뿐이며, 본 출원의 기술들은 인코딩 디바이스와 디코딩 디바이스 간의 임의의 데이터 통신을 반드시 포함하지는 않는 비디오 코딩 설정들(예컨대, 비디오 인코딩 또는 비디오 디코딩)에 적용될 수 있다. 다른 예들에서, 데이터는 로컬 메모리로부터 리트리브되거나, 네트워크를 통해 스트리밍되는 식이다. 비디오 인코딩 디바이스는 데이터를 인코딩하여 메모리에 저장할 수 있고, 그리고/또는 비디오 디코딩 디바이스는 메모리로부터 데이터를 리트리브하여 디코딩할 수 있다. 일부 예들에서, 인코딩 및 디코딩은 서로 통신하는 것이 아니라 단순히 데이터를 메모리로 인코딩하고 그리고/또는 메모리로부터 데이터를 리트리브하여 디코딩하는 디바이스들에 의해 수행된다.

설명의 편의상, 실시예들은 예를 들어, 고효율 비디오 코딩(HEVC: High-Efficiency Video Coding) 또는 다용도 비디오 코딩(VVC: Versatile Video coding)의 참조 소프트웨어, ITU-T 비디오 코딩 전문가 그룹(VCEG: Video Coding Experts Group) 및 ISO/IEC 동화상 전문가 그룹(MPEG: Motion Picture Experts Group)의 비디오 코딩에 관한 공동 협력 팀(JCT-VC: Joint Collaboration Team on Video Coding)에 의해 개발된 차세대 비디오 코딩 표준을 참조하여 본 명세서에서 설명된다. 당해 기술분야에서 통상의 지식을 가진 자는 본 명세서에 개시된 실시예들이 HEVC 또는 VVC로 제한되지 않는다고 이해할 것이다.

인코더 및 인코딩 방법

도 2는 본 출원의 기술들을 구현하도록 구성되는 예시적인 비디오 인코더(20)의 개략적인 블록도를 도시한다. 도 2의 예에서, 비디오 인코더(20)는 입력(201)(또는 입력 인터페이스(201)), 잔차 계산 유닛(204), 변환 처리 유닛(206), 양자화 유닛(208), 역양자화 유닛(210) 및 역변환 처리 유닛(212), 재구성 유닛(214), 루프 필터 유닛(220), 디코딩된 픽처 버퍼(DPB: decoded picture buffer)(230), 모드 선택 유닛(260), 엔트로피 인코딩 유닛(270) 및 출력(272)(또는 출력 인터페이스(272))을 포함한다. 모드 선택 유닛(260)은 인터 예측 유닛(244), 인트라 예측 유닛(254) 및 파티셔닝 유닛(262)을 포함할 수 있다. 인터 예측 유닛(244)은 (도시되지 않은) 모션 추정 유닛 및 모션 보상 유닛을 포함하지 수 있다. 도 2에 도시된 비디오 인코더(20)는 또한 하이브리드 비디오 인코더 또는 하이브리드 비디오 코덱에 따른 비디오 인코더로 지칭될 수 있다.

잔차 계산 유닛(204), 변환 처리 유닛(206), 양자화 유닛(208), 모드 선택 유닛(260)은 인코더(20)의 순방향 신호 경로를 형성하는 것으로 언급될 수 있는 반면, 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214), 버퍼(216), 루프 필터(220), 디코딩된 픽처 버퍼(DPB)(230), 인터 예측 유닛(244) 및 인트라 예측 유닛(254)은 비디오 인코더(20)의 역방향 신호 경로를 형성하는 것으로 언급될 수 있으며, 비디오 인코더(20)의 역방향 신호 경로는 디코더의 신호 경로에 대응한다(도 3의 비디오 디코더(30) 참조). 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214), 루프 필터(220), 디코딩된 픽처 버퍼(DPB)(230), 인터 예측 유닛(244) 및 인트라 예측 유닛(254)은 또한, 비디오 인코더(20)의 "내장 디코더"를 형성하는 것으로 언급된다.

픽처들 및 픽처 파티셔닝(픽처들 및 블록들)

인코더(20)는 예컨대, 입력(201)을 통해, 픽처(17)(또는 픽처 데이터(17)), 예컨대 비디오 또는 비디오 시퀀스를 형성하는 픽처들의 시퀀스의 픽처를 수신하도록 구성될 수 있다. 수신된 픽처 또는 픽처 데이터는 또한, 전처리된 픽처(19)(또는 전처리된 픽처 데이터(19))일 수 있다. 간략하게 하기 위해, 다음의 설명은 픽처(17)를 참조한다. 픽처(17)는 현재 픽처 또는 (특히, 현재 픽처를 다른 픽처들, 예컨대 동일한 비디오 시퀀스, 즉 현재 픽처를 또한 포함하는 비디오 시퀀스의 이전에 인코딩 및/또는 디코딩된 픽처들과 구별하기 위한 비디오 코딩에서는) 코딩될 픽처로도 또한 지칭될 수 있다.

(디지털) 픽처는 강도 값들을 갖는 샘플들의 2차원 배열 또는 행렬이거나 그러한 2차원 배열 또는 행렬로 간주될 수 있다. 배열 내의 샘플은 또한 픽셀(단축 형태의 픽처 엘리먼트) 또는 화소로 지칭될 수 있다. 배열 또는 픽처의 수평 및 수직 방향(또는 축)에서의 샘플들의 수는 픽처의 크기 및/또는 해상도를 정의한다. 색상의 표현을 위해, 통상적으로 3개의 색상 컴포넌트들이 이용되는데, 즉 픽처는 3개의 샘플 배열들로 표현되거나 3개의 샘플 배열들을 포함할 수 있다. RBG 포맷 또는 색 공간에서 픽처는 대응하는 적색, 녹색 및 청색 샘플 배열을 포함한다. 그러나 비디오 코딩에서, 각각의 픽셀은 통상적으로, Y로 지시된 휘도 컴포넌트(간혹 L이 또한 대신 사용됨)와 Cb 및 Cr로 지시된 2개의 색차 컴포넌트들을 포함하는 휘도 및 색차 포맷 또는 색 공간, 예컨대 YCbCr로 표현된다. 휘도(luminance)(또는 줄여서 루마(luma)) 컴포넌트(Y)는 (예컨대, 회색 스케일 픽처에서와 같은) 밝기 또는 회색 레벨 강도를 나타내는 한편, 2개의 색차(chrominance)(또는 줄여서 크로마(chroma)) 컴포넌트들(Cb, Cr)은 색도 또는 색상 정보 컴포넌트들을 나타낸다. 이에 따라, YCbCr 포맷의 픽처는 휘도 샘플 값들(Y)의 휘도 샘플 배열과 색차 값들(Cb, Cr)의 2개의 색차 샘플 배열들을 포함한다. RGB 포맷의 픽처들은 YCbCr 포맷으로 전환 또는 변환될 수 있고, 그 반대로도 가능하며, 프로세스는 색 변환 또는 전환으로 또한 알려져 있다. 픽처가 단색이라면, 픽처는 휘도 샘플 배열만을 포함할 수 있다. 이에 따라, 픽처는 예를 들어, 단색 포맷의 루마 샘플들의 배열 또는 4:2:0, 4:2:2 및 4:4:4 색 포맷의 루마 샘플들의 배열 및 크로마 샘플들의 2개의 대응하는 배열들일 수 있다.

비디오 인코더(20)의 실시예들은 픽처(17)를 복수의 (통상적으로는 중첩하지 않는) 픽처 블록들(203)로 파티셔닝하도록 구성된 (도 2에 도시되지 않은) 픽처 파티셔닝 유닛을 포함할 수 있다. 이러한 블록들은 또한 루트 블록들, 매크로 블록들(H.264/AVC) 또는 코딩 트리 블록(CTB: coding tree block)들 또는 코딩 트리 유닛(CTU: coding tree unit)들(H.265/HEVC 및 VVC)로 지칭될 수 있다. 픽처 파티셔닝 유닛은 비디오 시퀀스의 모든 픽처들에 대해 동일한 블록 크기 및 현재 블록 크기를 정의하는 대응하는 그리드를 사용하도록, 또는 픽처들 또는 픽처들의 서브세트들 또는 그룹들 간에 현재 블록 크기를 변경하고, 각각의 픽처를 대응하는 블록들로 파티셔닝하도록 구성될 수 있다.

추가 실시예들에서, 비디오 인코더는 픽처(17)의 블록(203), 예컨대 픽처(17)를 형성하는 하나의, 여러 개의 또는 모든 블록들을 직접 수신하도록 구성될 수 있다. 픽처 블록(203)은 또한 현재 픽처 블록 또는 코딩될 픽처 블록으로 지칭될 수 있다.

픽처(17)와 같이, 픽처 블록(203)은 픽처(17)보다 더 작은 치수지만, 강도 값들(샘플 값들)을 갖는 샘플들의 2차원 배열 또는 행렬이거나 또는 그러한 2차원 배열 또는 행렬로 간주될 수 있다. 즉, 현재 블록(203)은 예컨대, 적용되는 색 포맷에 따라, 하나의 샘플 배열(예컨대, 단색 픽처(17)의 경우 루마 배열, 또는 색 픽처의 경우 루마 또는 크로마 배열) 또는 3개의 샘플 배열들(예컨대, 컬러 픽처(17)의 경우 루마 배열 및 2개의 크로마 배열들) 또는 임의의 다른 수 및/또는 종류의 배열들을 포함할 수 있다. 현재 블록(203)의 수평 및 수직 방향(또는 축)에서의 샘플들의 수는 블록(203)의 크기를 정의한다. 이에 따라, 블록은 예를 들어, 샘플들의 M×N(M-열 x N-행) 배열, 또는 변환 계수들의 M×N 배열일 수 있다.

도 2에 도시된 바와 같은 비디오 인코더(20)의 실시예들은 블록 단위로 픽처(17)를 인코딩하도록 구성될 수 있는데, 예컨대 인코딩 및 예측이 블록(203)마다 수행된다.

도 2에 도시된 바와 같은 비디오 인코더(20)의 실시예들은 (비디오 슬라이스(slice)들로도 또한 지칭되는) 슬라이스들을 사용함으로써 픽처를 파티셔닝 및/또는 인코딩하도록 추가로 구성될 수 있으며, 여기서 픽처는 (통상적으로는 중첩하지 않는) 하나 이상의 슬라이스들로 파티셔닝되거나 또는 하나 이상의 슬라이스들을 사용하여 인코딩될 수 있고, 각각의 슬라이스는 하나 이상의 블록들(예컨대, CTU들)을 포함할 수 있다.

도 2에 도시된 바와 같은 비디오 인코더(20)의 실시예들은 (비디오 타일 그룹들로도 또한 지칭되는) 타일 그룹들 및/또는 (비디오 타일들로도 또한 지칭되는) 타일들을 사용함으로써 픽처를 파티셔닝 및/또는 인코딩하도록 추가로 구성될 수 있으며, 여기서 픽처는 (통상적으로는 중첩하지 않는) 하나 이상의 타일 그룹들로 파티셔닝되거나 또는 하나 이상의 타일 그룹들을 사용하여 인코딩될 수 있고, 각각의 타일 그룹은 예컨대, 하나 이상의 블록들(예컨대, CTU들) 또는 하나 이상의 타일들을 포함할 수 있고, 각각의 타일은 예컨대 직사각형 형상일 수 있고, 하나 이상의 블록들(예컨대, CTU들), 예컨대 완전 또는 부분 블록들을 포함할 수 있다.

잔차 계산

잔차 계산 유닛(204)은 픽처 블록(203) 및 예측 블록(265)(예측 블록(265)에 관한 추가 세부사항들은 나중에 제공됨)에 기초하여, 예컨대 픽처 블록(203)의 샘플 값들에서 예측 블록(265)의 샘플 값들을 샘플 단위로(픽셀 단위로) 감산함으로써 (잔차(205)로도 또한 지칭되는) 잔차 블록(205)을 계산하여 샘플 도메인에서 잔차 블록(205)을 획득하도록 구성된다.

변환

변환 처리 유닛(206)은 잔차 블록(205)의 샘플 값들에 변환, 예컨대 이산 코사인 변환(DCT: discrete cosine transform) 또는 이산 사인 변환(DST: discrete sine transform)을 적용하여 변환 도메인에서 변환 계수들(207)을 획득하도록 구성된다. 변환 계수들(207)은 또한 변환 잔차 계수들로 지칭될 수 있고, 변환 도메인에서 잔차 블록(205)을 나타낼 수 있다.

변환 처리 유닛(206)은 H.265/HEVC에 대해 지정된 변환들과 같은 DCT/DST의 정수 근사들을 적용하도록 구성될 수 있다. 직교 DCT 변환과 비교하여, 이러한 정수 근사들은 통상적으로 특정 계수에 의해 스케일링된다. 순방향 및 역방향 변환들에 의해 처리되는 잔차 블록의 노름(norm)을 보존하기 위해, 변환 프로세스의 일부로서 추가 스케일링 계수들이 적용된다. 스케일링 계수들은 통상적으로, 시프트 연산들을 위해 2의 거듭제곱인 스케일링 계수들, 변환 계수들의 비트 깊이, 정확도와 구현 비용 간의 절충 등과 같은 특정 제약들에 기초하여 선택된다. 예를 들어, 예컨대, 역변환 처리 유닛(212)에 의한 역방향 변환(그리고 예컨대, 비디오 디코더(30)의 역변환 처리 유닛(312)에 의한 대응하는 역방향 변환)에 대해 특정 스케일링 계수들이 지정되고, 그에 따라, 예컨대 인코더(20)의 변환 처리 유닛(206)에 의한 순방향 변환에 대해 대응하는 스케일링 계수들이 지정될 수 있다.

비디오 인코더(20)(각각 변환 처리 유닛(206))의 실시예들은 변환 파라미터들, 예컨대 직접 또는 엔트로피 인코딩 유닛(270)을 통해 인코딩 또는 압축된 변환들의 타입을 출력하도록 구성될 수 있으므로, 예컨대 비디오 디코더(30)는 디코딩을 위해 변환 파라미터들을 수신하여 사용할 수 있다.

양자화

양자화 유닛(208)은 예컨대, 스칼라 양자화 또는 벡터 양자화를 적용함으로써 변환 계수들(207)을 양자화하여 양자화된 계수들(209)을 획득하도록 구성될 수 있다. 양자화된 계수들(209)은 양자화된 변환 계수들(209) 또는 양자화된 잔차 계수들(209)로도 또한 지칭될 수 있다.

양자화 프로세스는 변환 계수들(207) 중 일부 또는 전부와 연관된 비트 깊이를 감소시킬 수 있다. 예를 들어, 양자화 중에 n 비트 변환 계수(207)는 m 비트 변환 계수로 반내림(round down)될 수 있으며, 여기서 n은 m보다 크다. 양자화의 정도는 양자화 파라미터(QP: quantization parameter)를 조정함으로써 수정될 수 있다. 예를 들어, 스칼라 양자화의 경우, 더 미세한 또는 더 대략적인 양자화를 달성하도록 서로 다른 스케일링이 적용될 수 있다. 더 작은 양자화 단계 크기들은 더 미세한 양자화에 대응하는 반면, 더 큰 양자화 단계 크기들은 더 대략적인 양자화에 대응한다. 적용 가능한 양자화 단계 크기는 양자화 파라미터(QP)에 의해 지시될 수 있다. 양자화 파라미터는 예를 들어, 미리 정의된 세트의 적용 가능한 양자화 단계 크기들에 대한 인덱스일 수 있다. 예를 들어, 작은 양자화 파라미터들은 미세 양자화(작은 양자화 단계 크기들)에 대응할 수 있고 큰 양자화 파라미터들은 대략적인 양자화(큰 양자화 단계 크기들)에 대응할 수 있거나, 그 반대일 수 있다. 양자화는 양자화 단계 크기에 의한 나눗셈을 포함할 수 있고, 예컨대 역양자화 유닛(210)에 의한 대응하는 그리고/또는 역양자화는 양자화 단계 크기에 의한 곱셈을 포함할 수 있다. 일부 표준들, 예컨대 HEVC에 따른 실시예들은 양자화 파라미터를 사용하여 양자화 단계 크기를 결정하도록 구성될 수 있다. 일반적으로, 양자화 단계 크기는 나눗셈을 포함하는 식의 고정 소수점 근사를 사용하여 양자화 파라미터를 기초로 계산될 수 있다. 잔차 블록의 노름을 복원하기 위해 양자화 및 역양자화에 추가 스케일링 계수들이 도입될 수 있는데, 잔차 블록의 노름은 양자화 단계 크기 및 양자화 파라미터에 대한 식의 고정 소수점 근사에 사용된 스케일링으로 인해 수정될 수도 있다. 일 예시적인 구현에서는, 역변환과 역양자화의 스케일링이 조합될 수 있다. 대안으로, 맞춤형 양자화 표들이 사용되며 인코더로부터 디코더로, 예컨대 비트스트림으로 시그널링될 수 있다. 양자화는 손실이 있는 연산이며, 여기서는 양자화 단계 크기들의 증가에 따라 손실이 증가한다.

비디오 인코더(20)(각각 양자화 유닛(208))의 실시예들은 예컨대, 직접 또는 엔트로피 인코딩 유닛(270)을 통해 인코딩된 양자화 파라미터들(QP)을 출력하도록 구성될 수 있으므로, 예컨대 비디오 디코더(30)는 디코딩을 위해 양자화 파라미터들을 수신하여 적용할 수 있다.

역양자화

역양자화 유닛(210)은 예컨대, 양자화 유닛(208)과 동일한 양자화 단계 크기에 기반하여 또는 이를 사용하여 양자화 유닛(208)에 의해 적용된 양자화 방식의 역을 적용함으로써, 양자화된 계수들에 양자화 유닛(208)의 역양자화를 적용하여 역양자화된 계수들(211)을 획득하도록 구성된다. 역양자화된 계수들(211)은 또한 역양자화된 잔차 계수들(211)로 지칭될 수 있고, ― 양자화에 의한 손실로 인해 통상적으로는 변환 계수들과 동일하지는 않지만 ― 변환 계수들(207)에 대응한다.

역변환

역변환 처리 유닛(212)은 변환 처리 유닛(206)에 의해 적용된 변환의 역변환, 예컨대 역 이산 코사인 변환(DCT) 또는 역 이산 사인 변환(DST) 또는 다른 역변환들을 적용하여 샘플 도메인에서 재구성된 잔차 블록(213)(또는 대응하는 역양자화된 계수들(213))을 획득하도록 구성된다. 재구성된 잔차 블록(213)은 또한 변환 블록(213)으로도 지칭될 수 있다.

재구성

재구성 유닛(214)(예컨대, 가산기 또는 합산기(214))은 예컨대, 재구성된 잔차 블록(213)의 샘플 값들 및 예측 블록(265)의 샘플 값들을 ― 샘플 단위로 ― 더함으로써, 예측 블록(265)에 변환 블록(213)(즉, 재구성된 잔차 블록(213))을 더하여 샘플 도메인에서 재구성된 블록(215)을 획득하도록 구성된다.

필터링

루프 필터 유닛(220)(또는 짧은 "루프 필터"(220))은 재구성된 블록(215)을 필터링하여 필터링된 블록(221)을 획득하도록, 또는 일반적으로, 재구성된 샘플들을 필터링하여 필터링된 샘플들을 획득하도록 구성된다. 루프 필터 유닛은 예컨대, 픽셀 전환들을 매끄럽게 하거나 다른 방식으로 비디오 품질을 개선하도록 구성된다. 루프 필터 유닛(220)은 하나 이상의 루프 필터들, 이를테면 블록 분리 필터, 샘플 적응 오프셋(SAO: sample-adaptive offset) 필터 또는 하나 이상의 다른 필터들, 예컨대 양방향 필터, 적응 루프 필터(ALF: adaptive loop filter), 선명화, 평활화 필터들 또는 협업 필터들, 또는 이들의 임의의 조합을 포함할 수 있다. 도 2에서는 루프 필터 유닛(220)이 루프 내 필터인 것으로 도시되지만, 다른 구성들에서 루프 필터 유닛(220)은 포스트 루프 필터로서 구현될 수 있다. 필터링된 블록(221)은 필터링된 재구성 블록(221)으로도 또한 지칭될 수 있다.

비디오 인코더(20)(각각 루프 필터 유닛(220))의 실시예들은 예컨대, 직접 또는 엔트로피 인코딩 유닛(270)을 통해 인코딩된 루프 필터 파라미터들(이를테면, 샘플 적응 오프셋 정보)을 출력하도록 구성될 수 있으므로, 예컨대 디코더(30)는 디코딩을 위해 동일한 루프 필터 파라미터들 또는 각각의 루프 필터들을 수신하여 적용할 수 있다.

디코딩된 픽처 버퍼

디코딩된 픽처 버퍼(DPB)(230)는 비디오 인코더(20)에 의해 비디오 데이터를 인코딩하기 위한 참조 픽처들, 또는 일반적으로 참조 픽처 데이터를 저장하는 메모리일 수 있다. DPB(230)는 다양한 메모리 디바이스들, 이를테면 동기식 DRAM(SDRAM: synchronous DRAM)을 포함하는 동적 랜덤 액세스 메모리(DRAM: dynamic random access memory), 자기 저항성 RAM(MRAM: magnetoresistive RAM), 저항성 RAM(RRAM: resistive RAM), 또는 다른 타입들의 메모리 디바이스들 중 임의의 메모리 디바이스에 의해 형성될 수 있다. 디코딩된 픽처 버퍼(DPB)(230)는 하나 이상의 필터링된 블록들(221)을 저장하도록 구성될 수 있다. 디코딩된 픽처 버퍼(230)는 동일한 현재 픽처의 또는 상이한 픽처들, 예컨대 이전에 재구성된 픽처들의 이전에 필터링된 다른 블록들, 예컨대 이전에 재구성되고 필터링된 블록들(221)을 저장하도록 추가로 구성될 수 있고, 완전한 이전에 재구성된, 즉 디코딩된 픽처들(및 대응하는 참조 블록들 및 샘플들) 및/또는 부분적으로 재구성된 현재 픽처(및 대응하는 참조 블록들 및 샘플들)를 예를 들어, 인터 예측을 위해 제공할 수 있다. 디코딩된 픽처 버퍼(DPB)(230)는 또한 예컨대, 재구성된 블록(215)이 루프 필터 유닛(220)에 의해 필터링되지 않는다면, 하나 이상의 필터링되지 않은 재구성된 블록들(215) 또는 일반적으로, 필터링되지 않은 재구성된 샘플들, 또는 재구성된 블록들 또는 샘플들의 임의의 다른 추가 처리된 버전을 저장하도록 구성될 수 있다.

모드 선택(파티셔닝 및 예측)

모드 선택 유닛(260)은 파티셔닝 유닛(262), 인터 예측 유닛(244) 및 인트라 예측 유닛(254)을 포함하고, 원본 픽처 데이터, 예컨대 원본 블록(203)(현재 픽처(17)의 현재 블록(203)), 및 재구성된 픽처 데이터, 예컨대 동일한(현재) 픽처의 그리고/또는 하나 또는 복수의 이전에 디코딩된 픽처들로부터의, 예컨대 디코딩된 픽처 버퍼(230) 또는 다른 버퍼들(예컨대, 도시되지 않은 라인 버퍼)로부터의 필터링된 그리고/또는 필터링되지 않은 재구성된 샘플들 또는 블록들을 수신하거나 획득하도록 구성된다. 재구성된 픽처 데이터는 예측, 예컨대 인터 예측 또는 인트라 예측을 위한 참조 픽처 데이터로서 사용되어 예측 블록(265) 또는 예측기(265)를 획득한다.

모드 선택 유닛(260)은 (파티셔닝을 포함하지 않는) 현재 블록 예측 모드 및 예측 모드(예컨대, 인트라 또는 인터 예측 모드)에 대한 파티셔닝을 결정 또는 선택하고, 잔차 블록(205)의 계산을 위해 그리고 재구성된 블록(215)의 재구성을 위해 사용되는 대응하는 예측 블록(265)을 생성하도록 구성될 수 있다.

모드 선택 유닛(260)의 실시예들은 (예컨대, 모드 선택 유닛(260)에 의해 지원되는 또는 모드 선택 유닛(260)에 이용 가능한 것들로부터) 최상의 매칭 또는 다시 말해서 최소 잔차(최소 잔차는 전송 또는 저장을 위한 더 나은 압축을 의미함), 또는 최소 시그널링 오버헤드(최소 시그널링 오버헤드는 전송 또는 저장을 위한 더 나은 압축을 의미함)을 제공하는, 또는 이 둘 모두를 고려하거나 이 둘의 균형을 유지하는 파티셔닝 및 예측 모드를 선택하도록 구성될 수 있다. 모드 선택 유닛(260)은 레이트 왜곡 최적화(RDO: rate distortion optimization)에 기초하여 파티셔닝 및 예측 모드를 결정하도록, 즉 최소 레이트 왜곡을 제공하는 예측 모드를 선택하도록 구성될 수 있다. 이러한 맥락에서 "최상", "최소", "최적" 등과 같은 용어들은 반드시 전체적인 "최상", "최소", "최적" 등을 의미하는 것이 아니라, 임계치를 초과하거나 그 미만으로 떨어지는 값과 같은 종결 또는 선택 기준의 충족 또는 잠재적으로 "차선의 선택"으로 이어지지만 복잡성 및 처리 시간을 감소시키는 다른 제약들을 또한 의미할 수 있다.

다시 말해서, 파티셔닝 유닛(262)은 예컨대, 반복적으로 쿼드 트리 파티셔닝(QT: quad-tree-partitioning), 이진 파티셔닝(BT: binary partitioning) 또는 삼진 트리 파티셔닝(TT: triple-tree-partitioning) 또는 이들의 임의의 조합을 사용하여 현재 블록(203)을 더 작은 블록 파티션들 또는 서브블록들(이들은 다시 블록들을 형성함)로 파티셔닝하도록, 그리고 예컨대, 현재 블록 파티션들 또는 서브블록들 각각에 대한 예측을 수행하도록 구성될 수 있으며, 모드 선택은 파티셔닝된 블록(203)의 트리 구조의 선택을 포함하고, 현재 블록 파티션들 또는 서브블록 각각에 예측 모드들이 적용된다.

다음에, 예시적인 비디오 인코더(20)에 의해 수행되는 (예컨대, 파티셔닝 유닛(260)에 의한) 파티셔닝 및 (인터 예측 유닛(244) 및 인트라 예측 유닛(254)에 의한) 예측 처리가 보다 상세히 설명될 것이다.

파티셔닝

파티셔닝 유닛(262)은 현재 블록(203)을 더 작은 파티션들, 예컨대 정사각형 또는 직사각형 크기의 더 작은 블록들로 파티셔닝(또는 분할)할 수 있다. (서브블록들로도 또한 지칭될 수 있는) 이러한 더 작은 블록들은 훨씬 더 작은 파티션들로 추가로 파티셔닝될 수 있다. 이는 또한 트리 파티셔닝 또는 계층적 트리 파티셔닝으로 지칭되며, 여기서 예컨대, 루트 트리 레벨 0(계층 구조 레벨 0, 깊이 0)에서의 루트 블록은 재귀적으로 파티셔닝될 수 있는데, 예컨대 다음 하위 트리 레벨의 2개 이상의 블록들, 예컨대 트리 레벨 1(계층 구조 레벨 1, 깊이 1)의 노드들로 파티셔닝될 수 있고, 이러한 블록들은 예를 들어, 종결 기준이 충족되기 때문에, 예컨대 최대 트리 깊이 또는 최소 블록 크기에 도달하기 때문에, 파티셔닝이 종결될 때까지 다시 다음 하위 레벨, 예컨대 트리 레벨 2(계층 구조 레벨 2, 깊이 2)의 2개 이상의 블록들로 파티셔닝될 수 있는 식이다. 추가로 파티셔닝되지 않은 블록들은 또한, 트리의 리프 블록(leaf-block)들 또는 리프 노드들로 지칭된다. 2개의 파티션들로의 파티셔닝을 사용하는 트리는 이진 트리(BT)로 지칭되고, 3개의 파티션들로의 파티셔닝을 사용하는 트리는 삼진 트리(TT)로 지칭되며, 4개의 파티션들로의 파티셔닝을 사용하는 트리는 쿼드 트리(QT)로 지칭된다.

이전에 언급된 바와 같이, 본 명세서에서 사용되는 바와 같은 "블록"이라는 용어는 픽처의 부분, 특히 정사각형 또는 직사각형 부분일 수 있다. 예를 들어, HEVC 및 VVC를 참조하면, 현재 블록은 코딩 트리 유닛(CTU), 코딩 유닛(CU), 예측 유닛(PU) 및 변환 유닛(TU)일 수 있거나 그에 대응할 수 있고 그리고/또는 대응하는 블록들, 예컨대 코딩 트리 블록(CTB), 코딩 블록(CB: coding block), 변환 블록(TB: transform block) 또는 예측 블록(PB: prediction block)일 수 있거나 그에 대응할 수 있다.

예를 들어, 코딩 트리 유닛(CTU)은 루마 샘플들의 CTB, 3개의 샘플 배열들을 갖는 픽처의 크로마 샘플들의 2개의 대응하는 CTB들, 또는 샘플들을 코딩하는 데 사용되는 3개의 별개의 색 평면들 및 신택스 구조들을 사용하여 코딩되는 픽처 또는 단색 픽처의 샘플들의 CTB이거나 이를 포함할 수 있다. 대응하게, 코딩 트리 블록(CTB)은 CTB들로의 컴포넌트의 분할이 파티셔닝이 되도록 어떤 값의 N에 대한 샘플들의 NxN 블록일 수 있다. 코딩 유닛(CU)은 루마 샘플들의 코딩 블록, 3개의 샘플 배열들을 갖는 픽처의 크로마 샘플들의 2개의 대응하는 코딩 블록들, 또는 샘플들을 코딩하는 데 사용되는 3개의 별개의 색 평면들 및 신택스 구조들을 사용하여 코딩되는 픽처 또는 단색 픽처의 샘플들의 코딩 블록이거나 이를 포함할 수 있다. 대응하게, 코딩 블록(CB)은 코딩 블록으로의 CTB의 분할이 파티셔닝이 되도록 어떤 값들의 M 및 N에 대한 샘플들의 M×N 블록일 수 있다.

실시예들에서, 예컨대, HEVC에 따르면, 코딩 트리 유닛(CTU)은 코딩 트리로서 표기된 쿼드 트리 구조를 사용함으로써 CU들로 분할될 수 있다. 픽처 간(inter-picture)(시간) 또는 픽처 내(intra-picture)(공간) 예측을 사용함으로써 픽처 영역을 코딩할지 여부의 결정이 CU 레벨에서 이루어진다. 각각의 CU는 PU 분할 타입에 기초하여 1개, 2개 또는 4개의 PU들로 더 분할될 수 있다. 하나의 PU 내에서는, 동일한 예측 프로세스가 적용되고 관련 정보가 PU 단위로 디코더에 전송된다. PU 분할 타입에 기초하여 예측 프로세스를 적용함으로써 잔차 블록을 획득한 후, CU는 CU에 대한 코딩 트리와 유사한 다른 쿼드 트리 구조에 따라 변환 유닛(TU)들로 파티셔닝될 수 있다.

실시예들에서, 예컨대, 다용도 비디오 코딩(VVC)으로 지칭되는, 현재 개발 중인 최신 비디오 코딩 표준에 따르면, 조합된 쿼드 트리와 이진 트리(QTBT: Quad-tree and binary tree) 파티셔닝이 예를 들어, 코딩 블록을 파티셔닝하는 데 사용된다. QTBT 블록 구조에서, CU는 정사각형 또는 직사각형 형상을 가질 수 있다. 예를 들어, 코딩 트리 유닛(CTU)이 먼저 쿼드 트리 구조에 의해 파티셔닝된다. 쿼드 트리 리프 노드들은 이진 트리 또는 삼진(또는 트리플) 트리 구조에 의해 추가로 파티셔닝된다. 파티셔닝 트리 리프 노드들은 코딩 유닛(CU)들로 지칭되며, 어떠한 추가 파티셔닝도 없이 예측 및 변환 처리를 위해 해당 세그먼트화가 사용된다. 이는 CU, PU 및 TU가 QTBT 코딩 블록 구조에서 동일한 블록 크기를 갖는다는 것을 의미한다. 병행하여, 다수의 파티션, 예컨대 트리플 트리 파티션이 QTBT 블록 구조와 함께 사용될 수 있다.

일례로, 비디오 인코더(20)의 모드 선택 유닛(260)은 본 명세서에서 설명되는 파티셔닝 기술들의 임의의 조합을 수행하도록 구성될 수 있다.

앞서 설명한 바와 같이, 비디오 인코더(20)는 한 세트의 (예컨대, 미리 결정된) 예측 모드들 중에서 최상의 또는 최적의 예측 모드를 결정 또는 선택하도록 구성된다. 예측 모드들의 세트는 예컨대, 인트라 예측 모드들 및/또는 인터 예측 모드들을 포함할 수 있다.

인트라 예측

한 세트의 인트라 예측 모드들은 35개의 서로 다른 인트라 예측 모드들, 예컨대 DC(또는 평균) 모드 및 평면 모드와 같은 비-방향성 모드들 또는 예컨대, HEVC에 정의된 것과 같은 방향성 모드들을 포함할 수 있거나, 67개의 서로 다른 인트라 예측 모드들, 예컨대 DC(또는 평균) 모드 및 평면 모드와 같은 비-방향성 모드들 또는 예컨대, VVC에 대해 정의된 것과 같은 방향성 모드들을 포함할 수 있다.

인트라 예측 유닛(254)은 동일한 현재 픽처의 이웃하는 블록들의 재구성된 샘플들을 사용하여 인트라 예측 모드들의 세트의 인트라 예측 모드에 따라 인트라 예측 블록(265)을 생성하도록 구성된다.

인트라 예측 유닛(254)(또는 일반적으로 모드 선택 유닛(260))은 인트라 예측 파라미터들(또는 일반적으로 현재 블록에 대해 선택된 인트라 예측 모드를 지시하는 정보)을 인코딩된 픽처 데이터(21)에 포함되도록 신택스 엘리먼트들(266)의 형태로 엔트로피 인코딩 유닛(270)에 출력하도록 추가로 구성되므로, 예컨대 비디오 디코더(30)는 디코딩을 위해 예측 파라미터들을 수신하여 사용할 수 있다.

인터 예측

한 세트의(또는 가능한) 인터 예측 모드들은 이용 가능한 참조 픽처들(즉, 예컨대, DPB(230)에 저장된 이전의 적어도 부분적으로 디코딩된 픽처들) 및 다른 인터 예측 파라미터들, 예컨대 최상의 매칭 참조 블록을 탐색하는 데 전체 참조 픽처가 사용되는지 아니면 단지 참조 픽처의 부분, 예컨대 현재 블록의 영역 주위의 탐색 윈도우 영역이 사용되는지, 그리고/또는 예컨대, 픽셀 보간이 적용되는지 여부, 예컨대 하프/반 픽셀(half/semi-pel) 및/또는 쿼터 픽셀(quarter-pel) 보간이 적용되는지 여부에 의존한다.

위의 예측 모드들에 추가로, 스킵 모드 및/또는 직접 모드가 적용될 수 있다.

인터 예측 유닛(244)은 (둘 다 도 2에 도시되지 않은) 모션 추정(ME: motion estimation) 유닛 및 모션 보상(MC: motion compensation) 유닛을 포함할 수 있다. 모션 추정 유닛은 모션 추정을 위해 픽처 블록(203)(현재 픽처(17)의 현재 픽처 블록(203)) 및 디코딩된 픽처(231), 또는 적어도 하나 또는 복수의 이전에 재구성된 블록들, 예컨대, 재구성된 블록들, 예컨대 하나 또는 복수의 다른/서로 다른 이전에 디코딩된 픽처들(231)의 재구성된 블록들을 수신 또는 획득하도록 구성된다. 예컨대, 비디오 시퀀스는 현재 픽처 및 이전에 디코딩된 픽처들(231)을 포함할 수 있거나, 다시 말해서, 현재 픽처와 이전에 디코딩된 픽처들(231)은 비디오 시퀀스를 형성하는 픽처들의 시퀀스를 형성하거나 그 일부일 수 있다.

인코더(20)는 예컨대, 동일한 또는 복수의 다른 픽처들의 서로 다른 픽처들의 복수의 참조 블록들 중에서 참조 블록을 선택하고, 참조 블록의 포지션(x, y 좌표들)과 현재 블록의 포지션 간의 오프셋(공간 오프셋) 및/또는 참조 픽처(또는 참조 픽처 인덱스)를 모션 추정 유닛에 대한 인터 예측 파라미터들로서 제공하도록 구성될 수 있다. 이 오프셋은 또한 모션 벡터(MV: motion vector)라 한다.

모션 보상 유닛은 인터 예측 파라미터를 획득, 예컨대 수신하도록 그리고 인터 예측 파라미터에 기초하여 또는 인터 예측 파라미터를 사용하여 인터 예측을 수행하여 인터 예측 블록(265)을 획득하도록 구성된다. 모션 보상 유닛에 의해 수행되는 모션 보상은 모션 추정에 의해 결정된 모션/블록 벡터에 기초하여 예측 블록을 페치(fetch) 또는 생성, 가능하게는 서브픽셀 정밀도로의 보간들을 수행하는 것을 수반할 수 있다. 보간 필터링은 알려진 픽셀 샘플들로부터 추가 픽셀 샘플들을 생성하여, 픽처 블록을 코딩하는 데 사용될 수 있는 후보 예측 블록들의 수를 잠재적으로 증가시킬 수 있다. 현재 픽처 블록의 PU에 대한 모션 벡터를 수신하면, 모션 보상 유닛은 참조 픽처 리스트들 중 하나에서 모션 벡터가 가리키는 예측 블록의 위치를 찾을 수 있다.

모션 보상 유닛은 또한 비디오 슬라이스의 픽처 블록들을 디코딩할 때 비디오 디코더(30)에 의한 사용을 위해 현재 블록들 및 비디오 슬라이스들과 연관된 신택스 엘리먼트들을 생성할 수 있다. 슬라이스들 및 개개의 신택스 엘리먼트들에 추가로 또는 대안으로서, 타일 그룹들 및/또는 타일들과 개개의 신택스 엘리먼트들이 생성 또는 사용될 수 있다.

엔트로피 코딩

엔트로피 인코딩 유닛(270)은 예컨대, 인코딩된 비트스트림(21)의 형태로 출력(272)을 통해 출력될 수 있는 인코딩된 픽처 데이터(21)를 획득하기 위해, 양자화된 잔차 계수(209), 인터 예측 파라미터들, 인트라 예측 파라미터들, 루프 필터 파라미터들 및/또는 다른 신택스 엘리먼트들에 예를 들어, 엔트로피 인코딩 알고리즘 또는 방식(예컨대, 가변 길이 코딩(VLC: variable length coding) 방식, 컨텍스트 적응적 VLC(CAVLC: context adaptive VLC) 방식, 산술 코딩 방식, 이진화, 컨텍스트 적응적 이진 산술 코딩(CABAC: context adaptive binary arithmetic coding), 신택스 기반 컨텍스트 적응적 이진 산술 코딩(SBAC: syntax-based context-adaptive binary arithmetic coding), 확률 구간 파티셔닝 엔트로피(PIPE: probability interval partitioning entropy) 코딩, 또는 다른 엔트로피 인코딩 방법 또는 기술)을 적용하거나 바이패스(비압축)하도록 구성되므로, 예컨대 비디오 디코더(30)는 디코딩을 위해 파라미터들을 수신하여 사용할 수 있다. 인코딩된 비트스트림(21)은 비디오 디코더(30)에 전송되거나, 비디오 디코더(30)에 의한 이후의 전송 또는 리트리브를 위해 메모리에 저장될 수 있다.

비디오 인코더(20)의 다른 구조적 변형들이 비디오 스트림을 인코딩하는 데 사용될 수 있다. 예를 들어, 비-변환 기반 인코더(20)가 특정 블록들 또는 프레임들에 대해 변환 처리 유닛(206) 없이 직접 잔차 신호를 양자화할 수 있다. 다른 구현에서, 인코더(20)는 단일 유닛으로 조합된 양자화 유닛(208) 및 역양자화 유닛(210)을 가질 수 있다.

디코더 및 디코딩 방법

도 3은 본 출원의 기술들을 구현하도록 구성되는 비디오 디코더(30)의 일례를 도시한다. 비디오 디코더(30)는 예컨대, 인코더(20)에 의해 인코딩된, 인코딩된 픽처 데이터(21)(예컨대, 인코딩된 비트스트림(21))를 수신하여 디코딩된 픽처(331)를 획득하도록 구성된다. 인코딩된 픽처 데이터 또는 비트스트림은 인코딩된 픽처 데이터, 예컨대 인코딩된 비디오 슬라이스의 픽처 블록들(및/또는 타일 그룹들 또는 타일들) 및 연관된 신택스 엘리먼트들을 나타내는 데이터를 디코딩하기 위한 정보를 포함한다.

도 3의 예에서, 디코더(30)는 엔트로피 디코딩 유닛(304), 역양자화 유닛(310), 역변환 처리 유닛(312), 재구성 유닛(314)(예컨대, 합산기(314)), 루프 필터(320), 디코딩된 픽처 버퍼(DPB)(330), 모드 적용 유닛(360), 인터 예측 유닛(344) 및 인트라 예측 유닛(354)을 포함한다. 인터 예측 유닛(344)은 모션 보상 유닛이거나 모션 보상 유닛을 포함할 수 있다. 비디오 디코더(30)는 일부 예들에서, 도 2로부터 비디오 인코더(100)에 대해 설명된 인코딩 패스에 일반적으로 상반하는 디코딩 패스를 수행할 수 있다.

인코더(20)와 관련하여 설명된 바와 같이, 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214), 루프 필터(220), 디코딩된 픽처 버퍼(DPB)(230), 인터 예측 유닛(344) 및 인트라 예측 유닛(354)은 또한, 비디오 인코더(20)의 "내장 디코더"를 형성하는 것으로 언급된다. 이에 따라, 역양자화 유닛(310)은 역양자화 유닛(110)과 기능면에서 동일할 수 있고, 역변환 처리 유닛(312)은 역변환 처리 유닛(212)과 기능면에서 동일할 수 있으며, 재구성 유닛(314)은 재구성 유닛(214)과 기능면에서 동일할 수 있고, 루프 필터(320)는 루프 필터(220)와 기능면에서 동일할 수 있으며, 디코딩된 픽처 버퍼(330)는 디코딩된 픽처 버퍼(230)와 기능면에서 동일할 수 있다. 따라서, 비디오 인코더(20)의 각각의 유닛들 및 기능들에 대해 제공된 설명들은 비디오 디코더(30)의 각각의 유닛들 및 기능들에 대응하게 적용된다.

엔트로피 디코딩

엔트로피 디코딩 유닛(304)은 비트스트림(21)(또는 일반적으로 인코딩된 픽처 데이터(21))을 파싱하고 예를 들어, 인코딩된 픽처 데이터(21)에 대한 엔트로피 디코딩을 수행하여, 예컨대 양자화된 계수들(309) 및/또는 (도 3에 도시되지 않은) 디코딩된 코딩 파라미터들, 예컨대 인터 예측 파라미터들(예컨대, 참조 픽처 인덱스 및 모션 벡터), 인트라 예측 파라미터(예컨대, 인트라 예측 모드 또는 인덱스), 변환 파라미터들, 양자화 파라미터들, 루프 필터 파라미터들 및/또는 다른 신택스 엘리먼트들 중 임의의 파라미터 또는 모든 파라미터들을 획득하도록 구성된다. 엔트로피 디코딩 유닛(304)은 인코더(20)의 엔트로피 인코딩 유닛(270)과 관련하여 설명된 인코딩 방식들에 대응하는 디코딩 알고리즘들 또는 방식들을 적용하도록 구성될 수 있다. 엔트로피 디코딩 유닛(304)은 인터 예측 파라미터들, 인트라 예측 파라미터 및/또는 다른 신택스 엘리먼트들을 모드 적용 유닛(360)에 제공하고, 다른 파라미터들을 디코더(30)의 다른 유닛들에 제공하도록 추가로 구성될 수 있다. 비디오 디코더(30)는 비디오 슬라이스 레벨 및/또는 비디오 블록 레벨에서 신택스 엘리먼트들을 수신할 수 있다. 슬라이스들 및 개개의 신택스 엘리먼트들에 추가로 또는 대안으로서, 타일 그룹들 및/또는 타일들과 개개의 신택스 엘리먼트들이 수신 및/또는 사용될 수 있다.

역양자화

역양자화 유닛(310)은 인코딩된 픽처 데이터(21)로부터 (예컨대, 엔트로피 디코딩 유닛(304)에 의한 예컨대, 파싱 및/또는 디코딩에 의해) 양자화 파라미터들(QP)(또는 일반적으로, 역양자화와 관련된 정보) 및 양자화된 계수들을 수신하도록 그리고 양자화 파라미터들에 기초하여 디코딩된 양자화된 계수들(309)에 역양자화를 적용하여, 변환 계수들(311)로도 또한 지칭될 수 있는 역양자화된 계수들(311)을 획득하도록 구성될 수 있다. 역양자화 프로세스는 양자화의 정도 그리고 마찬가지로, 적용되어야 하는 역양자화의 정도를 결정하기 위해 비디오 슬라이스(또는 타일 또는 타일 그룹)의 각각의 비디오 블록에 대해 비디오 인코더(20)에 의해 결정된 양자화 파라미터를 사용하는 것을 포함할 수 있다.

역변환

역변환 처리 유닛(312)은 변환 계수들(311)로도 또한 지칭되는 역양자화된 계수들(311)을 수신하도록, 그리고 샘플 도메인에서 재구성된 잔차 블록들(213)을 획득하기 위해 역양자화된 계수들(311)에 변환을 적용하도록 구성될 수 있다. 재구성된 잔차 블록들(213)은 또한 변환 블록들(313)로 지칭될 수 있다. 변환은 역변환, 예컨대 역 DCT, 역 DST, 역 정수 변환, 또는 개념적으로 유사한 역변환 프로세스일 수 있다. 역변환 처리 유닛(312)은 인코딩된 픽처 데이터(21)로부터 (예컨대, 엔트로피 디코딩 유닛(304)에 의한, 예컨대 파싱 및/또는 디코딩에 의해) 변환 파라미터들 또는 대응하는 정보를 수신하여, 역양자화된 계수들(311)에 적용될 변환을 결정하도록 추가로 구성될 수 있다.

재구성

재구성 유닛(314)(예컨대, 가산기 또는 합산기(314))은 예컨대, 재구성된 잔차 블록(313)의 샘플 값들 및 예측 블록(365)의 샘플 값들을 더함으로써, 예측 블록(365)에 재구성된 잔차 블록(213)을 더하여 샘플 도메인에서 재구성된 블록(315)을 획득하도록 구성될 수 있다.

필터링

(코딩 루프 내의 또는 코딩 루프 뒤의) 루프 필터 유닛(320)은 예컨대, 픽셀 전환들을 매끄럽게 하거나 다른 방식으로 비디오 품질을 개선하기 위해, 재구성된 블록(315)을 필터링하여 필터링된 블록(321)을 획득하도록 구성된다. 루프 필터 유닛(320)은 하나 이상의 루프 필터들, 이를테면 블록 분리 필터, 샘플 적응 오프셋(SAO) 필터 또는 하나 이상의 다른 필터들, 예컨대 양방향 필터, 적응 루프 필터(ALF), 선명화, 평활화 필터들 또는 협업 필터들, 또는 이들의 임의의 조합을 포함할 수 있다. 도 3에서는 루프 필터 유닛(320)이 루프 내 필터인 것으로 도시되지만, 다른 구성들에서 루프 필터 유닛(320)은 포스트 루프 필터로서 구현될 수 있다.

디코딩된 픽처 버퍼

이어서, 픽처의 디코딩된 비디오 블록들(321)은 디코딩된 픽처 버퍼(330)에 저장되며, 디코딩된 픽처 버퍼(330)는 디코딩된 픽처들(331)을 다른 픽처들에 대한 후속 모션 보상을 위한 그리고/또는 각각 출력 디스플레이를 위한 참조 픽처들로서 저장한다.

디코더(30)는 디코딩된 픽처(311)를 사용자에게 제시하거나 보여주기 위해, 예컨대 출력(312)을 통해 출력하도록 구성된다.

예측

인터 예측 유닛(344)은 인터 예측 유닛(244)(특히, 모션 보상 유닛)과 동일할 수 있고, 인트라 예측 유닛(354)은 기능 면에서 인터 예측 유닛(254)과 동일할 수 있으며, 인코딩된 픽처 데이터(21)로부터 수신된 각각의 정보 또는 파티셔닝 및/또는 예측 파라미터들에 기초하여(예컨대, 엔트로피 디코딩 유닛(304)에 의한 예컨대, 파싱 및/또는 디코딩에 의해) 분할 또는 파티셔닝 결정들 및 예측을 수행한다. 모드 적용 유닛(360)은 재구성된 픽처들, 블록들 또는 (필터링된 또는 필터링되지 않은) 각각의 샘플들에 기초하여 블록마다 예측(인트라 또는 인터 예측)을 수행하여 예측 블록(365)을 획득하도록 구성될 수 있다.

비디오 슬라이스가 인트라 코딩된(I) 슬라이스로서 코딩될 때, 모드 적용 유닛(360)의 인트라 예측 유닛(354)은 현재 픽처의 이전에 디코딩된 블록들로부터 시그널링된 인트라 예측 모드 및 데이터에 기초하여 현재 비디오 슬라이스의 픽처 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 비디오 픽처가 인터 코딩된(즉, B 또는 P) 슬라이스로서 코딩될 때, 모드 적용 유닛(360)의 인터 예측 유닛(344)(예컨대, 모션 보상 유닛)은 엔트로피 디코딩 유닛(304)으로부터 수신된 모션 벡터들 및 다른 신택스 엘리먼트들에 기초하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 블록들(365)을 생성하도록 구성된다. 인터 예측의 경우, 예측 블록들은 참조 픽처 리스트들 중 하나의 리스트 내의 참조 픽처들 중 하나로부터 생성될 수 있다. 비디오 디코더(30)는 DPB(330)에 저장된 참조 픽처들을 기초로 디폴트 구성 기술들을 사용하여 참조 프레임 리스트인 리스트 0 및 리스트 1을 구성할 수 있다. 슬라이스들(예컨대, 비디오 슬라이스들)에 추가로 또는 대안으로 타일 그룹들(예컨대, 비디오 타일 그룹들) 및/또는 타일들(예컨대, 비디오 타일들)을 사용하는 실시예들에 대해 또는 실시예들에 의해 동일하거나 유사하게 적용될 수 있는데, 예컨대 비디오는 I, P 또는 B 타일 그룹들 및 /또는 타일들을 사용하여 코딩될 수 있다.

모드 적용 유닛(360)은 모션 벡터들 또는 관련 정보 및 다른 신택스 엘리먼트들을 파싱함으로써 현재 비디오 슬라이스의 비디오 블록에 대한 예측 정보를 결정하도록 구성되며, 디코딩되고 있는 현재 비디오 블록에 대한 예측 블록을 생성하는 데 예측 정보를 사용한다. 예를 들어, 모드 적용 유닛(360)은 수신된 신택스 엘리먼트들 중 일부를 사용하여, 비디오 슬라이스의 비디오 블록들을 코딩하는 데 사용되는 예측 모드(예컨대, 인트라 또는 인터 예측), 인터 예측 슬라이스 타입(예컨대, B 슬라이스, P 슬라이스 또는 GPB 슬라이스), 슬라이스에 대한 참조 픽처 리스트들 중 하나 이상에 대한 구성 정보, 슬라이스의 각각의 인터 인코딩된 비디오 블록에 대한 모션 벡터들, 슬라이스의 각각의 인터 코딩된 비디오 블록에 대한 인터 예측 상태, 및 현재 비디오 슬라이스의 비디오 블록들을 디코딩하기 위한 다른 정보를 결정한다. 슬라이스들(예컨대, 비디오 슬라이스들)에 추가로 또는 대안으로 타일 그룹들(예컨대, 비디오 타일 그룹들) 및/또는 타일들(예컨대, 비디오 타일들)을 사용하는 실시예들에 대해 또는 실시예들에 의해 동일하거나 유사하게 적용될 수 있는데, 예컨대 비디오는 I, P 또는 B 타일 그룹들 및/또는 타일들을 사용하여 코딩될 수 있다.

도 3에 도시된 바와 같은 비디오 디코더(30)의 실시예들은 (비디오 슬라이스들로도 또한 지칭되는) 슬라이스들을 사용함으로써 픽처를 파티셔닝 및/또는 디코딩하도록 구성될 수 있으며, 여기서 픽처는 (통상적으로는 중첩하지 않는) 하나 이상의 슬라이스들로 파티셔닝되거나 또는 하나 이상의 슬라이스들을 사용하여 디코딩될 수 있고, 각각의 슬라이스는 하나 이상의 블록들(예컨대, CTU들)을 포함할 수 있다.

도 3에 도시된 바와 같은 비디오 디코더(30)의 실시예들은 (비디오 타일 그룹들로도 또한 지칭되는) 타일 그룹들 및/또는 (비디오 타일들로도 또한 지칭되는) 타일들을 사용함으로써 픽처를 파티셔닝 및/또는 디코딩하도록 구성될 수 있으며, 여기서 픽처는 (통상적으로는 중첩하지 않는) 하나 이상의 타일 그룹들로 파티셔닝되거나 또는 하나 이상의 타일 그룹들을 사용하여 디코딩될 수 있고, 각각의 타일 그룹은 예컨대, 하나 이상의 블록들(예컨대, CTU들) 또는 하나 이상의 타일들을 포함할 수 있고, 각각의 타일은 예컨대 직사각형 형상일 수 있고, 하나 이상의 블록들(예컨대, CTU들), 예컨대 완전 또는 부분 블록들을 포함할 수 있다.

인코딩된 픽처 데이터(21)를 디코딩하기 위해 비디오 디코더(30)의 다른 변형들이 사용될 수 있다. 예를 들어, 디코더(30)는 루프 필터링 유닛(320) 없이 출력 비디오 스트림을 생성할 수 있다. 예를 들어, 비-변환 기반 디코더(30)는 특정 블록들 또는 프레임들에 대해 역변환 처리 유닛(312) 없이 직접 잔차 신호를 역양자화할 수 있다. 다른 구현에서, 비디오 디코더(30)는 단일 유닛으로 조합된 역양자화 유닛(310) 및 역변환 처리 유닛(312)을 가질 수 있다.

인코더(20) 및 디코더(30)에서, 현재 단계의 처리 결과는 추가 처리된 후에 다음 단계로 출력될 수 있다고 이해되어야 한다. 예를 들어, 보간 필터링, 모션 벡터 도출 또는 루프 필터링 후에, 보간 필터링, 모션 벡터 도출 또는 루프 필터링의 처리 결과에 대해 추가 동작, 이를테면 클립 또는 시프트가 수행될 수 있다.

(아핀 모드의 제어 포인트 모션 벡터들, 아핀, 평면형, ATMVP 모드들, 시간적 모션 벡터들 등을 포함하지만 이에 제한되지 않는) 현재 블록의 도출된 모션 벡터들에 추가 동작들이 적용될 수 있다는 점이 주목되어야 한다. 예를 들어, 모션 벡터의 값은 그의 표현 비트에 따라 미리 정의된 범위로 제한된다. 모션 벡터의 표현 비트가 bitDepth라면, 범위는 -2^(bitDepth-1) ~ 2^(bitDepth-1)-1이며, 여기서 "^"는 지수화를 의미한다. 예를 들어, bitDepth가 16과 같다면, 범위는 -32768 ~ 32767이고; bitDepth가 18이라면, 범위는 -131072~131071이다. 예를 들어, 도출된 모션 벡터의 값(예컨대, 하나의 8x8블록 내의 4개의 4x4 서브블록들의 MV들)은, 4개의 4x4 서브블록 MV들의 정수 부분들 간의 최대 차이가 N개 이하의 픽셀들, 이를테면 1개 이하의 픽셀이 되도록 제한된다. 여기서, bitDepth에 따라 모션 벡터를 제한하기 위한 두 가지 방법들을 제공한다.

방법 1: 다음과 같이 연산들의 플로우에 의해 오버플로우 MSB(최상위 비트)를 제거하며:

여기서 mvx는 이미지 블록 또는 서브블록의 모션 벡터의 수평 컴포넌트이고, mvy는 이미지 블록 또는 서브블록의 모션 벡터의 수직 컴포넌트이고, ux 및 uy는 중간값을 지시한다;

예를 들어, 식(1) 및 식(2)을 적용한 후, mvx의 값이 -32769이라면, 결과적인 값은 32767이다. 컴퓨터 시스템에서는, 십진수들이 2의 보수로서 저장된다. -32769의 2의 보수는 1,0111,1111,1111,1111(17 비트)이고, 다음에 MSB는 폐기되므로, 결과적인 2의 보수는 0111,1111,1111,1111(십진수는 32767)이며, 이는 식(1) 및 (2)를 적용함으로써 출력과 동일하다.

연산들은 식(5) 내지 (8)에 도시된 바와 같이, mvp 및 mvd의 합 동안 적용될 수 있다.

방법 2: 값을 클리핑함으로써 오버플로우 MSB를 제거하며:

vx는 이미지 블록 또는 서브블록의 모션 벡터의 수평 컴포넌트이고, vy는 이미지 블록 또는 서브블록의 모션 벡터의 수직 컴포넌트이며; x, y 및 z는 각각 MV 클리핑 프로세스의 3개의 입력 값에 대응하고, 함수 Clip3의 정의는 다음과 같다:

도 4는 본 개시내용의 일 실시예에 따른 비디오 코딩 디바이스(400)의 개략도이다. 비디오 코딩 디바이스(400)는 본 명세서에서 설명되는 바와 같이 개시된 실시예들을 구현하기에 적합하다. 일 실시예에서, 비디오 코딩 디바이스(400)는 디코더, 이를테면 도 1a의 디코더(30) 또는 인코더, 이를테면 도 1a의 비디오 인코더(20)일 수 있다.

비디오 코딩 디바이스(400)는 데이터를 수신하기 위한 진입 포트들(410)(또는 입력 포트들(410)) 및 수신기 유닛들(RX)(420); 데이터를 처리하기 위한 프로세서, 로직 유닛 또는 중앙 처리 유닛(CPU: central processing unit)(430); 데이터를 전송하기 위한 전송기 유닛들(Tx)(440) 및 진출 포트들(450)(또는 출력 포트들(450)); 그리고 데이터를 저장하기 위한 메모리(460)를 포함한다. 비디오 코딩 디바이스(400)는 또한 광 또는 전기 신호들의 진출 또는 진입을 위한 진입 포트들(410), 수신기 유닛들(420), 전송기 유닛들(440) 및 진출 포트들(450)에 결합된 광-전기(OE: optical-to-electrical) 컴포넌트들 및 전기-광(EO: electrical-to-optical) 컴포넌트들을 포함할 수 있다.

프로세서(430)는 하드웨어 및 소프트웨어에 의해 구현된다. 프로세서(430)는 하나 이상의 CPU 칩들, 코어들(예컨대, 멀티 코어 프로세서로서), FPGA들, ASIC들 및 DSP들로서 구현될 수 있다. 프로세서(430)는 진입 포트들(410), 수신기 유닛들(420), 전송기 유닛들(440), 진출 포트들(450) 및 메모리(460)와 통신한다. 프로세서(430)는 코딩 모듈(470)을 포함한다. 코딩 모듈(470)은 위에서 설명한 개시된 실시예들을 구현한다. 예컨대, 코딩 모듈(470)은 프로세스들을 구현하거나, 다양한 코딩 연산들을 준비 또는 제공한다. 따라서 코딩 모듈(470)의 포함은 비디오 코딩 디바이스(400)의 기능에 실질적인 개선을 제공하고 비디오 코딩 디바이스(400)의 다른 상태로의 변환에 영향을 미친다. 대안으로, 코딩 모듈(470)은 메모리(460)에 저장되어 프로세서(430)에 의해 실행되는 명령들로서 구현될 수 있다.

메모리(460)는 하나 이상의 디스크들, 테이프 드라이브들, 고체 상태 드라이브들을 포함할 수 있으며, 프로그램들이 실행을 위해 선택될 때 그러한 프로그램들을 저장하기 위한, 그리고 프로그램 실행 중에 판독되는 명령들 및 데이터를 저장하기 위한 오버플로우 데이터 저장 디바이스로서 사용될 수 있다. 메모리(460)는 예를 들어, 휘발성 및/또는 비휘발성일 수 있으며, 판독 전용 메모리(ROM: read-only memory), 랜덤 액세스 메모리(RAM: random access memory), 3원 내용 주소화 메모리(TCAM: ternary content-addressable memory) 및/또는 정적 랜덤 액세스 메모리(SRAM: static random-access memory)일 수 있다.

도 5는 예시적인 실시예에 따라, 도 1의 소스 디바이스(12) 및 목적지 디바이스(14) 중 어느 하나 또는 둘 다로서 사용될 수 있는 장치(500)의 단순화된 블록도이다.

장치(500) 내의 프로세서(502)는 또한 중앙 처리 유닛으로 지칭될 수 있다. 대안으로, 프로세서(502)는 임의의 다른 타입의 디바이스, 또는 현재 존재하는 또는 향후 개발되는 정보를 조작 또는 처리할 수 있는 다수의 디바이스들일 수 있다. 개시된 구현들은 도시된 바와 같이 단일 프로세서, 예컨대 프로세서(502)로 실시될 수 있지만, 하나보다 많은 프로세서를 사용하여 속도 및 효율의 이점들이 달성될 수 있다.

장치(500)의 메모리(504)는 구현에서 판독 전용 메모리(ROM) 디바이스 및 랜덤 액세스 메모리(RAM) 디바이스일 수 있다. 임의의 다른 적절한 타입의 저장 디바이스가 메모리(504)로서 사용될 수 있다. 메모리(504)는 버스(512)를 사용하여 프로세서(502)에 의해 액세스되는 코드 및 데이터(506)를 포함할 수 있다. 메모리(504)는 운영 시스템(508) 및 애플리케이션 프로그램들(510)을 더 포함할 수 있으며, 애플리케이션 프로그램들(510)은 프로세서(502)가 본 명세서에서 설명되는 방법들을 수행할 수 있게 하는 적어도 하나의 프로그램을 포함한다. 예를 들어, 애플리케이션 프로그램들(510)은 본 명세서에서 설명되는 방법들을 수행하는 비디오 코딩 애플리케이션을 더 포함하는 애플리케이션 1 내지 애플리케이션 N을 포함할 수 있다.

장치(500)는 또한 디스플레이(518)와 같은 하나 이상의 출력 디바이스들을 포함할 수 있다. 디스플레이(518)는 일례로, 터치 입력들을 감지하도록 동작 가능한 터치 감지 엘리먼트와 디스플레이를 결합하는 터치 감지 디스플레이일 수 있다. 디스플레이(518)는 버스(512)를 통해 프로세서(502)에 결합될 수 있다.

본 명세서에서는 단일 버스로서 도시되지만, 장치(500)의 버스(512)는 다수의 버스들로 구성될 수 있다. 추가로, 2차 저장소(514)가 장치(500)의 다른 컴포넌트들에 직접 결합될 수 있거나, 네트워크를 통해 액세스될 수 있고, 메모리 카드와 같은 단일 통합 유닛 또는 다수의 메모리 카드들과 같은 다수의 유닛들을 포함할 수 있다. 따라서 장치(500)는 매우 다양한 구성들로 구현될 수 있다.

본 명세서에서 제시되는 실시예들은 다음과 같이 보다 상세히 설명될 것이다. 비트스트림에 의해 표현되는 비디오 소스는 디코딩 순서로 픽처들의 시퀀스를 포함할 수 있다.

(소스 픽처 또는 디코딩된 픽처일 수 있는) 픽처들 각각은 다음의 샘플 배열들 중 하나 이상을 포함한다:

- 루마(Y)만(단색).

- 루마 및 2 크로마(YCbCr 또는 YCgCo).

- 녹색, 청색 및 적색(RGB로도 또한 알려진 GBR).

- 다른 불특정 단색 또는 3-자극 컬러 샘플링들을 나타내는 배열들(예컨대, XYZ로도 또한 알려진 YZX).

본 개시내용에서의 표기법 및 용어의 편의상, 이러한 배열들과 연관된 변수들 및 항들은 루마(또는 L 또는 Y) 및 크로마로 지칭되며, 여기서 2개의 크로마 배열들은 Cb 및 Cr로 지칭된다.

도 6a는 4:2:0 샘플링 방식에 대한 크로마 컴포넌트 위치들을 예시한다. 4:2:0 샘플링 방식에서, 2개의 크로마 배열들 각각은 루마 배열의 절반의 높이 및 절반의 폭을 갖는다. 도 6b는 4:2:2 샘플링 방식에 대한 크로마 컴포넌트 위치들을 예시한다. 4:2:2 샘플링 방식에서, 2개의 크로마 배열들 각각은 루마 배열의 동일한 높이 및 절반의 폭을 갖는다. 도 6c는 4:4:4 샘플링 방식에 대한 크로마 컴포넌트 위치들을 예시한다. 4:4:4 샘플링 방식에서, separate_colour_plane_flag가 0과 같다면, 2개의 크로마 배열들 각각은 루마 배열과 동일한 높이 및 폭을 갖는다. 도 6d는 인터레이싱된 이미지에 대한 다양한 샘플링 패턴들을 도시한다. 도 6d에서는, 크로마 샘플 타입 0, 크로마 샘플 타입 1, 크로마 샘플 타입 2, 크로마 샘플 타입 3, 크로마 샘플 타입 4 및 크로마 샘플 타입 5가 표현된다.

크로마 샘플들의 인트라 예측은 재구성된 루마 블록의 샘플들을 사용하여 수행될 수 있다.

HEVC 개발 동안, 크로스 컴포넌트 선형 모델(CCLM) 크로마 인트라 예측이 제안되었다[J. Kim, S.-W. Park, J.-Y. Park, 및 B.-M. Jeon, Intra Chroma Prediction Using Inter Channel Correlation, JCTVC-B021 문헌, 2010년 7월]. CCLM은 크로마 샘플의 포지션에 대응하는, 코딩 블록 내의 포지션에서 크로마 샘플과 루마 샘플 간의 선형 상관을 사용한다. CCLM을 사용하여 크로마 블록이 코딩될 때, 선형 회귀를 통해 재구성된 이웃 루마 및 크로마 샘플들로부터 선형 모델이 도출된다. 이어서, 현재 블록의 크로마 샘플들은 (도 6e에 도시된 바와 같이) 도출된 선형 모델에 현재 블록의 재구성된 루마 샘플들을 사용하여 예측될 수 있으며:

여기서 C 및 L은 각각 크로마 샘플 값 및 루마 샘플 값을 나타낸다. 파라미터들(α, β)은 다음과 같이 최소 제곱법에 의해 도출되며:

여기서 M(A)는 A의 평균을 나타내고, R(A,B)는 다음과 같이 정의된다:

.

인코딩된 또는 디코딩된 픽처가 루마 및 크로마 컴포넌트들에 대해 상이한 수의 샘플들을 특정하는 포맷(예컨대, 도 6에 도시된 바와 같은 4:2:0 YCbCr 포맷)을 갖는다면, 루마 샘플들은 모델링 및 예측 전에 다운샘플링된다.

이 방법은 VTM2.0에서의 사용을 위해 채택되었다. 구체적으로, 파라미터 도출은 다음과 같이 수행되며:

,

여기서 L(n)은 다운샘플링된 최상부 및 좌측 이웃하는 재구성된 루마 샘플들을 나타내고, C(n)은 최상부 및 좌측 이웃하는 재구성된 크로마 샘플들을 나타낸다.

[G. Laroche, J. Taquet, C. Gisquet, P. Onno (Canon), "CE3: Cross-component linear model simplification (Test 5.1)", 2018년 10월, 중국 마카오에서의 제12차 JVET 회의에 대한 입력 문헌]에서, α 및 β를 도출하는 상이한 방법이 (도 8에 도시된 바와 같이) 제안되었다. 특히, 선형 모델 파라미터들(α, β)은 다음 식들에 따라 획득되며:

,

여기서 B = argmax(L(n)) 및 A = argmin(L(n))은 루마 샘플들에서의 최대 값 및 최소 값의 포지션들이다.

도 7a는 YCbCr 4:2:0 크로마 포맷이 사용 중이라면 CCLM 모드에 수반되는 현재 블록의 샘플들 및 최상부 그리고 좌측 인과(causal) 샘플들의 위치를 도시한다. "최상부 및 좌측 샘플들"은 또한, "좌측 및 상부 샘플들", "좌측 및 최상부 샘플들" 또는 "상부 및 좌측 샘플들"로도 지칭될 수 있다고 이해되어야 한다. 이러한 샘플들은 현재 블록의 좌측에 그리고 최상부(또는 상부)의 이웃 블록들의 샘플들을 의미한다.

크로스 컴포넌트 예측을 수행하기 위해, 4:2:0 크로마 포맷의 경우, 재구성된 루마 블록은 크로마 신호 또는 크로마 샘플들 또는 크로마 블록의 크기와 매칭하도록 다운샘플링될 필요가 있다. CCLM 모드에서 사용되는 디폴트 다운샘플링 필터는 다음과 같다.

(0)

이러한 다운샘플링은 루마 샘플들의 포지션들에 대한 크로마 샘플들의 포지션들에 대해 "타입 0" 위상 관계, 즉 수평으로의 콜로케이팅된 샘플링 및 수직으로의 중간(interstitial) 샘플링을 가정한다는 점을 주목한다. 식(0)에 도시된 위의 6-탭 다운샘플링 필터는 단일 모델 CCLM 모드와 다중 모델 CCLM 모드 모두에 대한 디폴트 필터로서 사용된다. 이러한 6-탭 다운샘플링 필터에 의해 사용되는 샘플들의 공간 포지션들이 도 9에 예시된다. 이 도면에서, 상이한 라인 패턴들을 사용하여 마킹되는 샘플(901), 샘플들(902) 및 샘플들(903)이 존재한다. 필터링 동안, 샘플들(901, 902, 903)은 각각 2, 1 및 0의 가중치들을 갖는다.

루마 샘플들이 블록 경계 상에 위치되고 인접한 최상부 및 좌측 블록들이 이용 가능하지 않다면, 다음 공식들이 사용된다:

y = 0인 행이 CTU의 첫 번째 행이고, x = 0일 뿐만 아니라 좌측 및 최상부 인접 블록들이 이용 가능하지 않다면,

; 또는

y = 0인 행이 CTU의 첫 번째 행이고 최상부 인접 블록이 이용 가능하지 않다면,

; 또는

x = 0일 뿐만 아니라 좌측 및 최상부 인접 블록들이 이용 가능하지 않다면,

이다.

4:2:0 샘플링 방식에서 루마 및 크로마 컴포넌트들의 샘플링을 고려할 때, 루마 및 크로마 컴포넌트 그리드들 사이에 시프트가 있을 수 있다. 2×2 픽셀들의 블록에서, 크로마 컴포넌트들은 실제로 (도 6a에 예시되는) 루마 컴포넌트와 비교하여 수직으로 픽셀의 절반만큼 시프트된다. 이러한 시프트는 다운샘플링이 수행될 때 또는 업샘플링(up-sampling)이 수행될 때 보간 필터들에 영향을 미칠 수 있다. 위에서 설명된 것과 동일한 것이 도 6b 또는 도 6c에 도시된 바와 같은 다른 샘플링 방식들에 적용될 수 있다. 도 6d에서는, 인터레이싱된 이미지에 대한 다양한 샘플링 패턴들이 표현된다. 이는 패리티, 즉 픽셀들이 인터레이싱된 이미지의 최상부 필드에 있는지 또는 최하부 필드에 있는지가 또한 고려된다는 것을 의미한다.

[2019년 1월, Morocco, Marrakech에서의 제13차 JVET 회의에 대한 입력 문헌 JVET-M0142인 P. Hanhart, Y. He, "CE3: Modified CCLM downsampling filter for "type-2" content (Test 2.4)"]에 제안되고 VVC 규격 초안(버전 4)에 포함된 바와 같이, "타입-2" 콘텐츠에 대한 CCLM의 다운샘플링된 루마 샘플들과 크로마 샘플들 간의 오정렬을 피하기 위해, 다음의 다운샘플링 필터들이 선형 모델 결정 및 예측을 위해 루마 샘플들에 적용된다:

3-탭:

5-탭:

라인 버퍼의 수를 증가시키는 것을 피하기 위해, 이러한 수정들은 최상부 CTU 경계에는 적용되지 않는다. 다운샘플링 필터 선택은 SPS 플래그(sps_cclm_colocated_chroma_flag)에 의해 관리된다. sps_cclm_colocated_chroma_flag의 값이 0 또는 거짓일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플들에 다운샘플링 필터가 적용되고; sps_cclm_colocated_chroma_flag의 값이 1 또는 참일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플들에 다운샘플링 필터가 적용되지 않는다. 위에서 설명된 바와 같이 선형 모델 파라미터들을 도출하는 데 사용되는 경계 루마 재구성된 샘플들(L())은 필터링된 루마 샘플들(Rec' _L [x,y])로부터 서브샘플링된다.

이전 설계에서의 루마 샘플 필터링 및 서브샘플링의 프로세스는 VVC 규격의 8.3.4.2.8에서 설명된다:

8.3.4.2.8. INTRA_LT_CCLM, INTRA_L_CCLM 및 INTRA_T_CCLM 인트라 예측 모드의 규격

이 프로세스에 대한 입력들은 다음과 같다:

- 인트라 예측 모드(predModeIntra),

- 현재 픽처의 최상부 좌측 샘플에 대한 현재 변환 블록의 최상부 좌측 샘플의 샘플 위치( xTbC, yTbC ),

- 변환 블록 폭을 특정하는 변수 nTbW,

- 변환 블록 높이를 특정하는 변수 nTbH,

- x = -1, y = 0..2 * nTbH - 1 그리고 x = 0..2 * nTbW - 1, y = - 1인 크로마 이웃 샘플들 p[ x ][ y ].

이 프로세스의 출력은 예측된 샘플들 predSamples[ x ][ y ]이며, x = 0..nTbW - 1, y = 0..nTbH - 1이다.

현재 루마 위치( xTbY, yTbY )는 다음과 같이 도출된다:

( xTbY, yTbY ) = ( xTbC << 1, yTbC << 1 ) (8-155)

변수들(availL, availT, availTL)은 다음과 같이 도출된다:

- 현재 크로마 위치( xCurr, yCurr )가 ( xTbC, yTbC )와 같게 그리고 이웃 크로마 위치( xTbC - 1, yTbC )를 입력들로서 설정하여 블록에 대한 좌측 이웃 샘플들의 이용 가능성 도출 프로세스가 호출되고, 출력이 availL에 할당된다.

- 현재 크로마 위치( xCurr, yCurr )가 ( xTbC, yTbC )와 같게 그리고 이웃 크로마 위치( xTbC, yTbC - 1 )를 입력들로서 설정하여 블록에 대한 최상부 이웃 샘플들의 이용 가능성 도출 프로세스가 호출되고, 출력이 availT에 할당된다.

- 현재 크로마 위치( xCurr, yCurr )가 ( xTbC, yTbC )와 같게 그리고 이웃 크로마 위치( xTbC - 1, yTbC - 1 )를 입력들로서 설정하여 블록에 대한 최상부 좌측 이웃 샘플들의 이용 가능성 도출 프로세스가 호출되고, 출력이 availTL에 할당된다.

- 이용 가능한 최상부 우측 이웃 크로마 샘플들의 수(numTopRight)는 다음과 같이 도출된다:

- 변수 numTopRight는 0과 같게 설정되고 availTR은 TRUE와 같게 설정된다.

- predModeIntra가 INTRA_T_CCLM과 같을 때, availTR이 FALSE와 같거나 x가 2 * nTbW - 1과 같을 때까지 x = nTbW..2 * nTbW - 1에 대해 다음이 적용된다:

- 현재 크로마 위치( xCurr, yCurr )가 ( xTbC, yTbC )와 같게 그리고 이웃 크로마 위치( xTbC + x, yTbC - 1 )를 입력들로서 설정하여 블록에 대한 이용 가능성 도출 프로세스가 호출되고, 출력이 availableTR에 할당된다.

- availableTR이 TRUE와 같을 때, numTopRight가 1씩 증분된다.

- 이용 가능한 좌측 아래 이웃 크로마 샘플들의 수(numLeftBelow)는 다음과 같이 도출된다:

- 변수 numLeftBelow는 0과 같게 설정되고 availLB는 TRUE와 같게 설정된다.

- predModeIntra가 INTRA_L_CCLM과 같을 때, availLB가 FALSE와 같거나 y가 2 * nTbH - 1과 같을 때까지 y = nTbH..2 * nTbH - 1에 대해 다음이 적용된다:

- 현재 크로마 위치( xCurr, yCurr )가 ( xTbC, yTbC )와 같게 그리고 이웃 크로마 위치( xTbC - 1, yTbC + y )를 입력들로서 설정하여 블록에 대한 이용 가능성 도출 프로세스가 호출되고, 출력이 availableLB에 할당된다.

- availableLB가 TRUE와 같을 때, numLeftBelow가 1씩 증분된다.

최상부 및 최상부 우측의 이용 가능한 이웃 크로마 샘플들의 수(numTopSamp) 및 좌측 및 좌측 아래의 이용 가능한 이웃 크로마 샘플들의 수(nLeftSamp)는 다음과 같이 도출된다:

- predModeIntra가 INTRA_LT_CCLM과 같다면, 다음이 적용된다:

numSampT = availT ? nTbW : 0 (8-156)

numSampL = availL ? nTbH : 0 (8-157)

- 그렇지 않으면, 다음이 적용된다:

numSampT = ( availT && predModeIntra == INTRA_T_CCLM ) ? ( nTbW + numTopRight ) : 0 (8-158)

numSampL = ( availL && predModeIntra == INTRA_L_CCLM ) ? ( nTbH + numLeftBelow ) : 0 (8-159)

변수 bCTUboundary는 다음과 같이 도출된다:

bCTUboundary = ( yTbC & ( 1 << ( CtbLog2SizeY - 1 ) - 1 ) == 0 ) ? TRUE : FALSE. (8-160)

0..nTbW - 1, y = 0..nTbH - 1인 예측 샘플들 predSamples[ x ][ y ]는 다음과 같이 도출된다:

- numSampL과 numSampT 둘 다 0과 같다면, 다음이 적용된다:

predSamples[ x ][ y ] = 1 << ( BitDepth_C - 1 ) (8-161)

- 그렇지 않으면, 다음과 같은 순서의 단계들이 적용된다:

1. x = 0..nTbW * 2 - 1, y= 0..nTbH * 2 - 1인 콜로케이팅된 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY + x, yTbY + y )에서의 블록 분리(deblocking) 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

2. 이웃 루마 샘플들 pY[ x ][ y ]은 다음과 같이 도출된다:

- numSampL이 0보다 클 때, x = -1..-3, y = 0..2 * numSampL - 1인 이웃하는 좌측 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY + x, yTbY +y )에서의 블록 분리 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

- numSampT가 0보다 클 때, x = 0..2 * numSampT - 1, y = -1, -2인 이웃하는 최상부 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY+ x, yTbY + y )에서의 블록 분리 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

- availTL이 TRUE와 같을 때, x = -1, y = -1, -2인 이웃하는 최상부 좌측 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY+ x, yTbY + y )에서의 블록 분리 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

3. x = 0..nTbW - 1, y = 0..nTbH - 1인 다운샘플링된 콜로케이팅된 루마 샘플들 pDsY[ x ][ y ]는 다음과 같이 도출된다:

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

- x = 1..nTbW - 1, y = 1..nTbH - 1인 pDsY[ x ][ y ]는 다음과 같이 도출된다:

pDsY[ x ][ y ] = ( pY[ 2 * x ][ 2 * y - 1 ] +

pY[ 2 * x - 1 ][ 2 * y ] + 4 * pY[ 2 * x ][ 2 * y ] +

pY[ 2 * x + 1 ][ 2 * y ] + pY[ 2 * x ][ 2 * y + 1 ] + 4 ) >> 3

(8-162)

- availL이 TRUE와 같다면, y = 1..nTbH - 1인 pDsY[ 0 ][ y ]는 다음과 같이 도출된다:

pDsY[ 0 ][ y ] = ( pY[ 0 ][ 2 * y - 1 ] +

pY[ -1 ][ 2 * y ] + 4 * pY[ 0 ][ 2 * y ] +

pY[ 1 ][ 2 * y ] + pY[ 0 ][ 2 * y + 1 ] + 4 ) >> 3

(8-163)

- 그렇지 않으면, y = 1..nTbH - 1인 pDsY[ 0 ][ y ]는 다음과 같이 도출된다:

pDsY[ 0 ][ y ] = ( pY[ 0 ][ 2 * y - 1 ] + 2 * pY[ 0 ][ 2 * y ] + pY[ 0 ][ 2 * y + 1 ] + 2 ) >> 2 (8-164)

- availT가 TRUE라면, x = 1..nTbW - 1인 pDsY[ x ][ 0 ]은 다음과 같이 도출된다:

pDsY[ x ][ 0 ] = ( pY[ 2 * x ][ -1 ] +

pY[ 2 * x - 1 ][ 0 ] + 4 * pY[ 2 * x ][ 0 ] +

pY[ 2 * x + 1 ][ 0 ] + pY[ 2 * x ][ 1 ] + 4 ) >> 3

(8-165)

- 그렇지 않으면, x = 1..nTbW - 1인 pDsY[ x ][ 0 ]은 다음과 같이 도출된다:

pDsY[ x ][ 0 ] = ( pY[ 2 * x - 1 ][ 0 ] + 2 * pY[ 2 * x ][ 0 ] + pY[ 2 * x + 1 ][ 0 ] + 2 ) >> 2

(8-166)

- availL이 TRUE와 같고 availT가 TRUE와 같다면, pDsY[ 0 ][ 0 ]은 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] = ( pY[ 0 ][ -1 ] + pY[ -1 ][ 0 ] +

4 * pY[ 0 ][ 0 ] + pY[ 1 ][ 0 ] + pY[ 0 ][ 1 ] + 4 ) >> 3

(8-167)

- 그렇지 않으면, availL은 TRUE와 같고 availT는 FALSE와 같다면, pDsY[ 0 ][ 0 ]은 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] = ( pY[ -1 ][ 0 ] + 2 * pY[ 0 ][ 0 ] + pY[ 1 ][ 0 ] + 2 ) >> 2 (8-168)

- 그렇지 않으면, availL은 FALSE와 같고 availT는 TRUE와 같다면, pDsY[ 0 ][ 0 ]은 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] = ( pY[ 0 ][ -1 ] + 2 * pY[ 0 ][ 0 ] + pY[ 0 ][ 1 ] + 2 ) >> 2 (8-169)

- 그렇지 않으면(availL은 FALSE와 같고 availT는 FALSE와 같다면), pDsY[ 0 ][ 0 ]은 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] = pY[ 0 ][ 0 ] (8-170)

- 그렇지 않으면, 다음이 적용된다:

- x = 1..nTbW - 1, y = 0..nTbH - 1인 pDsY[ x ][ y ]는 다음과 같이 도출된다:

pDsY[ x ][ y ] = ( pY[ 2 * x - 1 ][ 2 * y ] +

pY[ 2 * x - 1 ][ 2 * y + 1 ] +

2* pY[ 2 * x ][ 2 * y ] +

2*pY[ 2 * x ][ 2 * y + 1 ] +

pY[ 2 * x + 1 ][ 2 * y ] +

pY[ 2 * x + 1 ][ 2 * y + 1 ] + 4 ) >> 3 (8-171)

- availL이 TRUE와 같다면, y = 0..nTbH - 1인 pDsY[ 0 ][ y ]는 다음과 같이 도출된다:

pDsY[ 0 ][ y ] = ( pY[ -1 ][ 2 * y ] + pY[ -1 ][ 2 * y + 1 ] +

2* pY[ 0 ][ 2 * y ] + 2*pY[ 0 ][ 2*y + 1 ] +

pY[ 1 ][ 2 * y ] + pY[ 1 ][ 2 * y + 1 ] + 4 ) >> 3

(8-172)

- 그렇지 않으면, y = 0..nTbH - 1인 pDsY[ 0 ][ y ]는 다음과 같이 도출된다:

pDsY[ 0 ][ y ] = ( pY[ 0 ][ 2 * y ] + pY[ 0 ][ 2 * y + 1 ] + 1 ) >> 1

(8-173)

CCLM은 크로마 블록과 공간적으로 콜로케이팅되는 서브샘플링된 루마 블록(다운샘플링된 루마 블록)을 사용함으로써 크로마 블록 내의 크로마 샘플들의 값들을 예측한다. 루마 블록의 서브샘플링 또는 다운샘플링은 스펙트럼 미러링(mirroring)에 의해 야기되는 에일리어싱 아티팩트(aliasing artifact)들을 억제하기 위한 필터링을 포함한다. 보간 필터 타입의 선택은 서브샘플링 타입 및 원본 픽처의 크로마 샘플과 루마 샘플 사이의 서브 샘플 공간 오프셋들의 값에 의존한다.

이전 설계에서, 한 세트의 보간 필터들은 크로마 포맷을 고려하지 않고 정의되었으며, 그러므로 수평 방향의 크로마 서브샘플링 비율(SubWidthC)이 수직 방향의 크로마 서브샘플링 비율(SubHeightC)과 같지 않을 때, 다음의 결함들이 발생할 수 있다:

- 여분의 평활화;

- 필터링된 휘도 신호의 잘못된 위상 시프트들.

본 개시내용은 루마 샘플들로부터 크로마 샘플들을 예측할 때 픽처의 크로마 포맷을 고려하기 위한 방법을 제공한다. 크로마 포맷에 기초하여 필터 세트를 선택함으로써, 이전 설계의 결함들이 제거될 수 있으며, 이는 보다 정확한 크로마 예측 신호 및 그에 따른 예측 오차 감소를 야기한다. 더 작은 예측 오차의 기술적 결과는 잔차 신호 에너지의 감소이다. 코딩 방법들은 재구성된 신호의 왜곡을 감소시키거나, 잔차 신호를 인코딩하는 데 필요한 비트 레이트를 감소시키거나, 왜곡과 비트 레이트 모두를 감소시키기 위해, 이러한 감소를 이용할 수 있다. 본 개시내용에 의해 달성되는 이러한 유리한 효과들은 코딩 방법의 전체 압축 성능을 개선한다.

표 1은 본 개시내용에서 지원될 수 있는 크로마 포맷들을 도시한다. 크로마 포맷 정보, 이를테면 chroma_format_idc 및/또는 separate_colour_plane_flag가 SubWidthC 및 SubHeightC 변수들의 값들을 결정하는 데 사용될 수 있다.

chroma_format_idc	separate_colour_plane_flag	크로마 포맷	SubWidthC	SubHeightC
0	0	단색	1	1
1	0	4:2:0	2	2
2	0	4:2:2	2	1
3	0	4:4:4	1	1
3	1	4:4:4	1	1

chroma_format_idc는 루마 샘플링에 대한 크로마 샘플링을 특정한다. chroma_format_idc의 값은 0부터 3까지의 범위에 있을 것이다.1과 같은 separate_colour_plane_flag는 4:4:4 크로마 포맷의 3개의 컬러 컴포넌트들이 개별적으로 코딩되는 것을 특정한다. 0과 같은 separate_colour_plane_flag는 컬러 컴포넌트들이 개별적으로 코딩되지 않는 것을 특정한다. separate_colour_plane_flag가 존재하지 않으면, 이는 0과 같은 것으로 추론된다. separate_colour_plane_flag가 1과 같을 때, 코딩된 픽처는 3개의 개별 컴포넌트들로 구성되며, 이들 각각은 하나의 컬러 평면의 코딩된 샘플들(Y, Cb 또는 Cr)로 구성되고 단색 코딩 신택스를 사용한다.

크로마 포맷은 크로마 배열들의 우선순위 및 서브샘플링을 결정하고;

단색 샘플링에서는, 명목상 루마 배열로 간주되는 단 하나의 샘플 배열만이 존재한다.

4:2:0 샘플링에서는, 도 6a에 도시된 바와 같이, 2개의 크로마 배열들 각각이 루마 배열의 절반의 높이 및 절반의 폭을 갖는다.

4:2:2 샘플링에서는, 도 6b에 도시된 바와 같이, 2개의 크로마 배열들 각각이 루마 배열의 동일한 높이 및 절반의 폭을 갖는다.

4:4:4 샘플링에서, separate_colour_plane_flag의 값에 따라, 다음이 적용된다:

- separate_colour_plane_flag가 0과 같다면, 도 6c에 도시된 바와 같이, 2개의 크로마 배열들 각각은 루마 배열과 동일한 높이 및 폭을 갖는다.

- 그렇지 않으면(separate_colour_plane_flag가 1과 같다면), 3개의 컬러 평면들은 단색 샘플링된 픽처들로서 개별적으로 처리된다.

본 개시내용에서, 선형 모델의 파라미터들을 결정하기 위한 입력 데이터로서 사용되는 루마 샘플들을 처리하기 위한 방법이 제공된다. 선형 모델은 크로스 컴포넌트 선형 모델(CCLM) 또는 다방향 선형 모델(MDLM)을 포함할 수 있지만, 이에 제한되는 것은 아니다. 이 방법은 수직 방향 및 수평 방향으로 조건부 적용되는 한 세트의 필터들(이를테면, 2개의 필터들)의 결정을 포함한다.

일부 실시예들에서, 재구성된 루마 샘플들에 적용될 필터의 계수들을 결정하기 위해 체크되는 한 세트의 조건들이 도입된다. 한 세트의 조건들은 크로마 샘플링 비율들(또한, 다시 말해서, 크로마 샘플링 팩터들, 이를테면 SubWidthC 및 SubHeightC 변수들)을 수반하는 조건들을 포함하지만, 이에 제한되는 것은 아니다.

도 7a는 CCLM 인트라 예측(700)을 수행하는 예시적인 메커니즘을 예시하는 개략도이다. CCLM 인트라 예측(700)은 크로스 컴포넌트 인트라 예측의 하나의 타입이다. 그러므로 CCLM 인트라 예측(700)은 인코더(20)의 인트라 예측 유닛(254) 및/또는 디코더(30)의 인트라 예측 유닛(354)에 의해 수행될 수 있으며, CCLM 인트라 예측(700)은 크로마 블록(701)에서 크로마 샘플들(703)을 예측한다. 크로마 샘플들(703)은 교차하는 라인들에 의해 형성된 셀들 또는 그리드들로서 도시된 정수 포지션들에 나타난다. 예측은 흑색 원들로서 묘사되는 이웃하는 참조 샘플들에 부분적으로 기반한다. 크로마 샘플들(703)은 재구성된 크로마 샘플들(Rec'C)로서 지시되는 이웃 크로마 참조 샘플들(705)에만 기초하여 예측되지 않는다. 크로마 샘플들(703)은 또한, 재구성된 루마 샘플들(713) 및 이웃 루마 참조 샘플들(715)에 기초하여 예측된다. 구체적으로, CU는 루마 블록(711) 및 2개의 크로마 블록들(701)을 포함한다. 동일한 CU에서 크로마 샘플들(703)과 재구성된 루마 샘플들(713)을 상관시키는 모델이 생성된다. 모델에 대한 선형 계수들은 이웃 루마 참조 샘플들(715)을 이웃 크로마 참조 샘플들(705)과 비교함으로써 결정될 수 있는데, 일례로, 모델에 대한 선형 계수들은 선택된 이웃 루마 참조 샘플들(715)의 다운샘플링된 루마 참조 샘플들(719)을 선택된 이웃 크로마 참조 샘플들(705)과 비교함으로써 결정될 수 있고, 선택된 이웃 크로마 참조 샘플들(705)의 포지션들은 다운샘플링된 루마 참조 샘플들(719)의 포지션들에 대응할 수 있다.

이웃 크로마 참조 샘플들(705)은 크로마 블록(701)에 인접한 이웃 블록들의 크로마 샘플들로부터 선택된다. 이웃 크로마 참조 샘플들(705)은 최상부 템플릿(707) 및/또는 좌측 템플릿(706) 중에서 선택된다. 예를 들어, 이웃 크로마 참조 샘플들(705)은 최상부 템플릿(707) 및/또는 좌측 템플릿(706)의 이용 가능성에 기초하여 선택될 수 있다. 도 7d에 도시된 바와 같이, 4개의 이웃 크로마 참조 샘플들(705)이 선택될 수 있다. 이웃 크로마 참조 샘플들(705)이 재구성된 샘플들이기 때문에, 이웃 크로마 참조 샘플들(705)은 재구성된 크로마 샘플들(Rec'C)로서 지시된다. 재구성된 루마 샘플들(713)은 크로마 블록(701)과 동일한 CU의 루마 블록(711)으로부터 획득된다. 이웃 루마 참조 샘플들(715)은 루마 블록(711)에 인접한 이웃 블록들의 루마 샘플들로부터 선택된다. 이웃 루마 참조 샘플들(715)은 최상부 템플릿(717) 및/또는 좌측 템플릿(716) 중에서 선택된다. 예를 들어, 도 7d에 도시된 바와 같이, 선택된 4개의 이웃 크로마 참조 샘플들(705)에 대응하는 4개의 다운샘플링된 루마 참조 샘플들(719)(즉, 4개의 다운샘플링된 루마 참조 샘플들(719)의 포지션들은 선택된 4개의 이웃 크로마 참조 샘플들(705)의 포지션들에 대응함)을 획득하기 위해, 이웃 루마 참조 샘플들(715)이 선택된다. 이를테면, 6-탭 다운샘플링 필터가 적용된다면, 6개의 이웃 루마 참조 샘플들(715)이 하나의 선택된 이웃 크로마 참조 샘플(705)에 대응하는 하나의 다운샘플링된 루마 참조 샘플(719)을 획득하는 데 사용된다. 재구성된 루마 샘플들(713)은 Rec'L로서 표기된다. 또한, 본 명세서에서 사용되는 바와 같이, 템플릿(706, 707, 716, 717)은 이웃 루마 참조 샘플들(715)을 이웃 크로마 참조 샘플들(705)에 상관시키는 메커니즘이다.

도시된 바와 같이, 루마 블록(711)은 크로마 블록(701)보다 4배의 샘플들을 포함한다. 구체적으로, 크로마 블록(701)은 N×N개의 샘플들을 포함하는 한편, 루마 블록(711)은 2N×2N개의 샘플들을 포함한다. 그러므로 루마 블록(711)은 크로마 블록(701)의 분해능의 4배이다. 재구성된 루마 샘플들(713) 및 (선택된) 이웃 루마 참조 샘플들(715)에 대해 예측이 동작하기 위해, 재구성된 루마 샘플들(713) 및 (선택된) 이웃 루마 참조 샘플들(715)은 이웃 크로마 참조 샘플들(705)과 크로마 샘플들(703)의 정확한 비교를 제공하기 위해 다운샘플링된다. 다운샘플링은 샘플들의 그룹의 분해능을 감소시키는 프로세스이다.

(선택된) 이웃 루마 참조 샘플들(715) 및 재구성된 루마 샘플들(713)이 다운샘플링되면, 크로마 블록(701)의 크로마 샘플들(703)을 예측하기 위한 모델이 생성될 수 있다. 구체적으로, CCLM 인트라 예측(700)에서, 크로마 블록(701)의 크로마 샘플들(703)에 대한 예측은 아래 식(1)에 의해 설명되는 모델에 따라 결정될 수 있으며:

pred _C (i,j) = α·rec _L '(i,j) + β (1)

여기서 pred _C (i,j)는 위치(i,j)에서의 크로마 블록(701)의 예측 크로마 샘플(703)이고, i는 수평 인덱스이고 j는 수직 인덱스이다.rec _L '(i,j)는 재구성된 루마 샘플(713)의 위치(i,j)에서 다운샘플링된 루마 샘플이고, α 및 β는 (선택된) 이웃 루마 참조 샘플들(715) 및 (선택된) 크로마 참조 샘플들(705)의 다운샘플링된 루마 참조 샘플들에 기초하여 결정된 선형 계수들이다. YUV 4:2:0 포맷의 경우, 각각의 크로마 샘플은 4개의 콜로케이팅된 루마 샘플들을 가지며, 따라서 α 및 β를 도출하기 위해 사용된 루마 샘플들 및 예측된 크로마 샘플들을 계산하기 위해 사용된 샘플들 모두가 다운샘플링된다(도 6a 참조).

일례로, α 및 β는 도 8 및 도 7d와 관련하여 논의된 바와 같이, 선택된 이웃 루마 참조 샘플들(715)의 다운샘플링된 이웃 루마 참조 샘플들(719)의 최소 및 최대 값에 기초하여 결정된다. 하나의 예시적인 구현에서, 최대 루마 값 및 최소 루마 값은 다운샘플링된 루마 참조 샘플들(719)에 기초하여 결정되고; 제1 크로마 값은 최대 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들(이를테면, 2개의 다운샘플링된 루마 참조 샘플들)의 하나 이상의 포지션들(이를테면, 2개의 포지션들)에 적어도 부분적으로 기초하여 획득되고; 예를 들어, 제1 크로마 값은 최대 루마 값과 연관된 2개의 다운샘플링된 루마 참조 샘플들에 대응하는 2개의 포지션들에서의 2개의 크로마 참조 샘플들에 기초하여 획득된다. 최소 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제2 크로마 값이 획득되는데; 예를 들어, 제2 크로마 값은 최소 루마 값과 연관된 2개의 다운샘플링된 루마 참조 샘플들에 대응하는 2개의 포지션들에서의 2개의 크로마 참조 샘플들에 기초하여 획득된다. 선형 모델 계수들(α, β)은 제1 크로마 값, 제2 크로마 값, 최대 루마 값 및 최소 루마 값에 기초하여 계산된다(도 7d 및 도 8 참조).

위에서 언급된 바와 같이, (선택된) 이웃 루마 참조 샘플들(715) 및 재구성된 루마 샘플들(713)은 선형 모델을 생성하기 전에 다운샘플링된다. 추가로, 이웃 루마 참조 샘플들(715)을 생성하기 위해 다수의 라인들/행들 및 열들을 이용하는 것은 CCLM 인트라 예측(700)에 따라 나머지 계산들의 정확도를 상당히 증가시키지는 않는다. 이에 따라, 다운샘플링 동안 이웃 루마 참조 샘플들(715)의 단일 행 및/또는 열이 이용될 수 있으며, 이는 CCLM 인트라 예측(700)의 정확도 및/또는 코딩 효율에 크게 영향을 미치지 않으면서 라인 버퍼 메모리의 이용을 감소시킨다.

도 7b는 YCbCr 4:4:4 크로마 포맷이 사용 중이라면 CCLM 모드에 수반되는 현재 블록의 샘플 및 좌측과 상부의 인과 샘플들의 위치들을 도시한다. 이 경우, CCLM에 대해 어떠한 다운샘플링도 수행되지 않는다.

도 7c는 YCbCr … 크로마 포맷이 사용 중이라면, CCLM 모드에 수반되는 현재 블록의 샘플 및 좌측과 상부의 인과 샘플들의 위치들을 도시한다. 이 경우, CCLM에 대해 수평 방향으로 루마 샘플들을 다운샘플링하기 전에 필터링이 수행된다.

도 10은 크로스 컴포넌트 인트라 예측을 지원하기 위한 다운샘플링의 예시적인 메커니즘(1500)을 예시하는 개략도이다.

메커니즘(1500)은 단일 행(1518)의 이웃 루마 참조 샘플들 및 단일 열(1520)의 이웃 루마 참조 샘플들을 이용한다. 행(1518) 및 열(1520)은, 크로스 컴포넌트 인트라 예측에 따라 예측되는 크로마 블록과 CU를 공유하는 루마 블록(1511)에 바로 인접한다. 다운샘플링 후에, 이웃 루마 참조 샘플들의 행(1518)은 다운샘플링된 이웃 루마 참조 샘플들의 행(1516)이 된다. 추가로, 이웃 루마 참조 샘플들의 열(1520)이 다운샘플링되어, 다운샘플링된 이웃 루마 참조 샘플들의 단일 열(1517)이 된다. 이어서, 행(1516) 및 열(1517)로부터의 다운샘플링된 이웃 루마 참조 샘플들은 식(1)에 따라 크로스 컴포넌트 인트라 예측에 이용될 수 있다.

이에 따라, 하나의 예시적인 구현에서, 단일 행(1518)의 이웃 루마 참조 샘플들 및 단일 열(1520)의 이웃 루마 참조 샘플들이 크로스 컴포넌트 인트라 예측에서의 사용을 위해 다운샘플링된다. 다른 예시적인 구현에서, 단일 행(1518)의 이웃 루마 참조 샘플들 중 선택된 루마 참조 샘플들 및 단일 열(1520)의 이웃 루마 참조 샘플들 중 선택된 루마 참조 샘플들은 크로스 컴포넌트 인트라 예측에서의 사용을 위해 다운샘플링된다는 점이 주목된다.

루마 블록(1511)의 경우, A1로 표기된 최상부 이웃 행(1518)은 A로 표기된 다운샘플링된 이웃 행(1516)을 얻기 위한 다운샘플링에 사용된다. A[i]는 A의 i번째 샘플이고, A1[i]는 A1의 i번째 샘플이다. 특정 예에서, 픽처의 크로마 포맷에 따라 결정되거나 선택되는 하나 이상의 다운샘플링 필터들이 이웃 행(1518)에 적용되어, 다운샘플링된 이웃 행(1516)을 획득할 수 있다. 다른 특정 예에서, 픽처의 크로마 포맷에 따라 결정되거나 선택되는 하나 이상의 다운샘플링 필터들이 단일 행(1518)의 일부 선택된 루마 참조 샘플들(A1[i])에 적용되어, 도 7d에 도시된 바와 같이, 다운샘플링된 루마 참조 샘플들을 획득할 수 있다. 이와 관련하여 세부사항들은 아래에서 소개될 것이다.

또한, L1로 표기되는 좌측 이웃 열(1520)은 L로 표기된 다운샘플링된 이웃 열(1517)을 얻기 위한 다운샘플링에 사용된다. L[i]는 L의 i번째 샘플이고, L1[i]는 L1의 i번째 샘플이다. 특정 예에서, 픽처의 크로마 포맷에 따라 결정되거나 선택되는 하나 이상의 다운샘플링 필터들이 이웃 열(1520)에 적용되어, 다운샘플링된 이웃 열(1517)을 획득할 수 있다. 이와 관련하여 세부사항들은 아래에서 소개될 것이다. 다른 특정 예에서, 픽처의 크로마 포맷에 따라 결정되거나 선택되는 하나 이상의 다운샘플링 필터들이 단일 열(1520)의 일부 선택된 루마 참조 샘플들(L1[i])에 적용되어, 도 7d에 도시된 바와 같이, 다운샘플링된 루마 참조 샘플들을 획득할 수 있다.

추가로, 메커니즘(1500)은 또한 행들(1518 및/또는 1516) 및/또는 열들(1520 및/또는 1517)의 치수들이 루마 블록(1511) 또는 다운샘플링된 루마 블록(1512)의 폭 또는 높이보다 더 클 때 적용될 수 있다는 점이 주목되어야 한다. 대안적인 설계에서, 그 메커니즘(1500)은 또한 일부 선택된 이웃 참조 샘플들(A1[i]) 및/또는 일부 선택된 이웃 참조 샘플들(L1[i])에 적용될 수 있다.

도 11은 본 개시내용의 일부 실시예들에 따라 선형 모델을 사용하여 인트라 예측을 수행하기 위한 예시적인 프로세스(1100)의 흐름도이다. 이 방법은 도 1a 및 도 1b에 도시된 코덱 시스템(10 또는 40)의 비디오 인코더(20) 및/또는 비디오 디코더(30)에 의해 수행될 수 있다. 특히, 이 방법은 도 2에 도시된 비디오 인코더(20)의 인트라 예측 유닛(244) 및/또는 도 3에 도시된 비디오 디코더(30)의 인트라 예측 유닛(354)에 의해 수행될 수 있다.

블록(1101)에서, 크로마 포맷 정보에 기초하여 한 세트의 다운샘플링 필터들이 결정되며, 여기서 크로마 포맷 정보는 현재 블록이 속하는 픽처의 크로마 포맷을 지시하고; 현재 블록은 루마 블록 및 콜로케이팅된 크로마 블록을 포함한다. 한 세트의 다운샘플링 필터들의 각각의 다운샘플링 필터는 하나 이상의 다운샘플링 필터 계수들에 의해 정의될 수 있다고 이해될 수 있다. 이는 아래와 같이 상세히 설명될 것이다.

블록(1103)에서, 한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 루마 블록의(루마 블록에 인접한) 선택된 루마 참조 샘플들(또한 다시 말해서, 선택된 루마 이웃 샘플들)의 다운샘플링된 루마 참조 샘플들이 획득된다;

루마 블록의 공간 분해능은 대개 크로마 블록보다 더 크고, 도 10에 예시된 바와 같이, 루마 블록(즉, 재구성된 루마 블록)이 다운샘플링되어 다운샘플링된 루마 블록을 획득한다고 이해될 수 있다. 선택된 이웃 루마 샘플(다운샘플링된 루마 참조 샘플)에 수평으로 그리고/또는 수직으로 인접한 재구성된 루마 샘플들은, 도 9 또는 도 10에 예시된 바와 같이, 루마 블록 외부의 선택된 이웃 루마 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하는 데 사용된다.

블록(1105)에서, 다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는(또는 다운샘플링된 루마 참조 샘플들과 연관되는) 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들이 결정 또는 도출되고; 그리고

블록(1107)에서, 선형 모델 계수들 및 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 루마 블록에 대응하는 크로마 블록의 예측 샘플들이 획득된다.

블록(1101)은 코딩되는 픽처의 크로마 포맷을 지시하는 크로마 포맷 정보에 기초하여 SubWidthC 및 SubHeightC 변수들의 값들을 결정 또는 획득하거나 얻는 것이다.

블록(1101)은 SubWidthC 및 SubHeightC 변수들의 값들에 대해 사용되는 필터 "F"를 정의하거나 결정하는 것이다.

필터들이 SubWidthC 및 SubHeightC의 대응하는 값들과 어떻게 연관될 수 있는지의 예시적인 실시예들이 표 2 - 표 5에 도시된다. 공간 필터 "F"는 계수들의 행렬의 형태로 정의된다. 그러한 계수들이 적용되는 샘플들의 포지션들은 다음과 같이 정의되며, 여기서 필터링된 또는 수정된 루마 샘플의 포지션은 (x,y)로 표기된다:

. (5)

출력 필터링되는 재구성된 샘플의 포지션이 블록 경계 상에 있을 때, 이웃하는 블록들이 이용 가능하지 않기 때문에, 이웃하는 포지션들 중 일부는 이용 가능하지 않게 될 수 있다. 이 경우, 입력 샘플들의 선택은 블록 경계에서 샘플들을 복제하도록 수정된다. 이러한 수정은 상이한 필터 계수들을 갖는 샘플들을 갖는 다른 필터를 더 작은 세트의 샘플들에 적용하는 것으로 구현될 수 있다.

구체적으로, 출력 샘플이 현재 블록의 좌측 경계에 있고 루마 블록의 좌측에 인접한 샘플들이 이용 가능하지 않을 때, 필터링에 사용되는 샘플들의 포지션들은 다음과 같이 정의된다:

. (6)

출력 샘플이 현재 블록의 최상부 경계에 있고 루마 블록의 최상부 측에 인접한 샘플들이 이용 가능하지 않을 때, 필터링에 사용되는 샘플들의 포지션들은 다음과 같이 정의된다:

. (7)

출력 샘플의 포지션이 현재 블록의 우측 경계에 있을 때, 필터링에 사용되는 샘플들의 포지션들은 다음과 같이 정의된다:

. (8)

출력 샘플의 포지션이 현재 블록의 최하부 경계에 있을 때, 필터링에 사용되는 샘플들의 포지션들은 다음과 같이 정의된다:

(9)

표 2. SubWidthC 및 SubHeightC의 값들에 대한 공간 필터의 연관의 일례

SubWidthC	SubHeightC	공간 필터 F
1	1
1	2
2	1
2	2

표 3. SubWidthC 및 SubHeightC의 값들에 대한 공간 필터의 연관의 일례

SubWidthC	SubHeightC	공간 필터
1	1
1	2
2	1
2	2

표 4. SubWidthC 및 SubHeightC의 값들에 대한 공간 필터의 연관의 일례

SubWidthC	SubHeightC	공간 필터 F
1	1
1	2
2	1
2	2

표 5. SubWidthC 및 SubHeightC의 값들에 대한 공간 필터의 연관의 일례

SubWidthC	SubHeightC	공간 필터 F
1	1
1	2
2	1
2	2

블록(1103)은 필터링된 루마 샘플 값들(Rec' _L [x,y])을 획득하기 위해, 재구성된 루마 샘플의 필터링을 수행하는 것이다. 특히, 이는 선택된 필터 "F"를 재구성된 샘플들(Rec _L [x,y])에 적용함으로써 수행되며:

,

여기서 F는 공간 필터를 나타내고, N은 공간 필터(F)의 계수들의 합이고, (x,y)는 재구성된 샘플의 포지션을 나타낸다. 이 필터링은 식(5)에 묘사된 시나리오에 대응한다. 다른 시나리오들에서, 이를테면 식(6) - 식(9)과 관련하여 위에서 설명된 것들에서, 필터링은 식(6) - 식(9)에 도시된 샘플들의 포지션들에 기초하여 위의 필터링을 조정함으로써 적용될 수 있다.

추가 실시예에서, 필터는 루마 샘플들에 대한 서브샘플링된 크로마 샘플들의 포지션에 의존하여 상이한 필터 타입들(이를테면, 표 2 - 표 5에서 정의된 다양한 필터 연관들) 간에 스위칭할 수 있다. 일례로, 서브샘플링된 크로마 샘플들이 대응하는 루마 샘플들과 콜로케이팅되지 않을 때(도 6d에 도시한 바와 같이, 비트스트림에서 (0의 값인 sps_cclm_colocated_chroma_flag와 같은) 플래그에 의해 시그널링되는 크로마 샘플 타입 0, 1, 3 또는 5 참조), 표 4가 사용된다. 그렇지 않으면, 현재 블록에 대해 표 2 또는 표 3이 사용된다.

표 2 또는 표 3을 사용하는 결정은 현재 블록 내의 루마 샘플들의 수에 기초하여 이루어질 수 있다. 예를 들어, 64개 이하의 샘플들을 포함하는 블록들에 대해, 어떠한 크로마 서브샘플링도 수행되지 않을 때는 어떠한 크로마 필터링도 적용되지 않는다(그에 따라 표 2가 사용을 위해 선택됨). 다른 한편으로, 블록 크기가 64개의 샘플들보다 클 때는, 표 3이 필터 "F"를 정의하는 데 사용된다. 64는 단지 일례로 사용되며, 샘플들의 수에 대한 다른 임계값들이 사용될 수 있다는 점이 주목되어야 한다.

다른 실시예에서, 필터(F)는 표 6 - 표 10에 도시된 바와 같이 크로마 포맷 및 크로마 타입을 지시하는 정보에 따라 선택된다. 크로마 타입은 크로마 컴포넌트의 변위를 특정하며, 도 6d에 도시된다. 도 6d에서, 크로마 샘플 타입 2 및 크로마 샘플 타입 4의 경우, 서브샘플링된 크로마 샘플은 대응하는 루마 샘플과 콜로케이팅된다. 크로마 샘플 타입들 0, 1, 3 및 5의 경우, 서브샘플링된 크로마 샘플은 대응하는 루마 샘플과 콜로케이팅되지 않는다. 표 6 - 표 10에서, "YUV 4:2:0" 열에 특정된 필터들은 VVC 초안의 이전 설계에서 사용된다. "YUV 4:2:2" 열 및 "YUV 4:4:4" 열은 대응하는 크로마 포맷이 정의될 때 "YUV 4:2:0" 열에 정의된 필터들을 대체할 수 있는 필터들을 정의한다.

표 6. 크로마 타입 및 크로마 포맷의 값들에 대한 공간 필터(F)의 연관성, 크로마 타입들은 도 6d에 도시된다.

크로마 타입	YUV 4:2:0	YUV 4:2:2	YUV 4:4:4
크로마 타입-0



크로마 타입-2
크로마 타입-2

표 7. 크로마 타입 및 크로마 포맷의 값들에 대한 공간 필터(F)의 연관성

표 8. 크로마 타입 및 크로마 포맷의 값들에 대한 공간 필터(F)의 연관성

표 9. 크로마 타입 및 크로마 포맷의 값들에 대한 공간 필터(F)의 연관성

표 10. 크로마 타입 및 크로마 포맷의 값들에 대한 공간 필터(F)의 연관성

필터

은 필터 바이패스 연산을 포함하는 상이한 방식들로(즉, 출력 값을 입력 값으로 설정함으로써, 즉 필터가 바이패스 필터임) 구현될 수 있다. 대안으로, 이는 유사한 덧셈 및 시프트(add and shift) 연산들을 사용하여 구현될 수 있는데, 즉:

제안된 변경들에 따르면, 본 명세서에 제시된 하나의 예시적인 실시예에 따라 선형 모델(블록의 크로스 컴포넌트 예측)을 사용하여 인트라 예측을 수행하기 위한 프로세스의 세부사항들은 VVC 초안의 규격의 일부의 포맷으로 다음과 같이 설명된다:

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

pDsY[ x ][ y ] =

( F[1][0] * pY[ SubWidthC * x ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ SubHeightC * y ] +

+ F[1][1] * pY[ SubWidthC * x ][ SubHeightC * y ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ SubHeightC * y ] +

+ F[1][2] * pY[ SubWidthC * x ][ SubHeightC * y + 1 ] + 4 ) >> 3

pDsY[ 0 ][ y ] =

( F[1][0] * pY[ 0 ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[ - 1 ][ SubHeightC * y ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ 2 ) >> 2

pDsY[ 0 ][ y ] =

( 2 * F[1][0] * pY[ 0 ][ SubHeightC * y - 1 ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ 2 ) >> 2

pDsY[ x ][ 0 ] =

( F[1][0] * pY[ SubWidthC * x ][ - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ 0 ] +

+ F[1][1] * pY[ SubWidthC * x ][ 0 ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ 0 ] +

+ F[1][2] * pY[ SubWidthC * x ][ 1 ] + 4 ) >> 3

pDsY[ x ][ 0 ] =

( F[1][0] * pY[ SubWidthC * x ][ - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ 0 ] +

+ F[1][1] * pY[ SubWidthC * x ][ 0 ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ 0 ] +

+ F[1][2] * pY[ SubWidthC * x ][ 1 ] + 4 ) >> 3

pDsY[ 0 ][ 0 ] =

( F[1][0] * pY[ 0 ][ - 1 ] +

+ F[0][1] * pY[ - 1 ][ 0 ] +

+ F[1][1] * pY[ 0 ][ 0 ] +

+ F[2][1] * pY[ 1 ][ 0 ] +

+ F[1][2] * pY[ 0 ][ 1 ] + 4 ) >> 3

pDsY[ 0 ][ 0 ] =

( F[0][1] * pY[ - 1 ][ 0 ] +

+ F[1][1] * pY[ 0 ][ 0 ] +

+ F[2][1] * pY[ 1 ][ 0 ] +

+ 2 ) >> 2

pDsY[ 0 ][ 0 ] = pY[ 0 ][ 0 ] (8-170)

- 그렇지 않으면, 다음이 적용된다:

pDsY[ x ][ y ] =

(F[0][1] * pY[ SubWidthC * x - 1 ][ SubHeightC * y ] +

+ F[0][2] * pY[ SubWidthC * x - 1 ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ SubWidthC * x ][ SubHeightC * y ] +

+ F[1][2] * pY[ SubWidthC * x ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ SubHeightC * y ] +

+ F[2][2] * pY[ SubWidthC * x +1][ SubHeightC * y + 1 ] + 4 ) >> 3

pDsY[ 0 ][ y ] =

(F[0][1] * pY[ - 1 ][ SubHeightC * y ] +

+ F[0][2] * pY[ - 1 ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ F[1][2] * pY[ 0 ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ 1 ][ SubHeightC * y ] +

+ F[2][2] * pY[ 1 ][ SubHeightC * y + 1 ] + 4 ) >> 3

pDsY[ 0 ][ y ] =

( F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ F[1][2] * pY[ 0 ][ SubHeightC * y + 1] + 1 ) >> 1

위의 설명에서 언급된 필터 F[i][j]는 본 명세서에서 제시된 실시예들에 따라 특정된다.

다른 예시적인 실시예에 따라 선형 모델(블록의 크로스 컴포넌트 예측)을 사용하여 인트라 예측을 수행하기 위한 프로세스의 세부사항들은 VVC 초안의 규격의 일부의 포맷으로 다음과 같이 설명된다:

8.4.4.2.8 INTRA_LT_CCLM, INTRA_L_CCLM 및 INTRA_T_CCLM 인트라 예측 모드의 규격

이 프로세스에 대한 입력들은 다음과 같다:

- 인트라 예측 모드(predModeIntra),

- 변환 블록 폭을 특정하는 변수 nTbW,

- 변환 블록 높이를 특정하는 변수 nTbH,

현재 루마 위치( xTbY, yTbY )는 다음과 같이 도출된다:

( xTbY, yTbY ) = ( xTbC << (SubWidthC - 1), yTbC << (SubHeightC - 1) )

(8-156)

변수들(availL, availT, availTL)은 다음과 같이 도출된다:

- availableTR이 TRUE와 같을 때, numTopRight가 1씩 증분된다.

- availableLB가 TRUE와 같을 때, numLeftBelow가 1씩 증분된다.

- predModeIntra가 INTRA_LT_CCLM과 같다면, 다음이 적용된다:

numSampT = availT ? nTbW : 0

numSampL = availL ? nTbH : 0

- 그렇지 않으면, 다음이 적용된다:

numSampT =

( availT && predModeIntra == INTRA_T_CCLM ) ? ( nTbW + numTopRight ) : 0

numSampL =

( availL && predModeIntra == INTRA_L_CCLM ) ? ( nTbH + numLeftBelow ) : 0

변수 bCTUboundary는 다음과 같이 도출된다:

bCTUboundary = ( yTbC & ( 1 << ( CtbLog2SizeY - 1 ) - 1 ) == 0 ) TRUE : FALSE.

- numSampL과 numSampT 둘 다 0과 같다면, 다음이 적용된다:

predSamples[ x ][ y ] = 1 << ( BitDepth_C - 1 )

- 그렇지 않으면, 다음과 같은 순서의 단계들이 적용된다:

1. x = 0..nTbW * SubWidthC - 1, y= 0..nTbH * SubHeightC - 1인 콜로케이팅된 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY + x, yTbY + y )에서의 블록 분리 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

2. 이웃 루마 샘플들 pY[ x ][ y ]은 다음과 같이 도출된다:

- numSampL이 0보다 클 때, x = -1..-3, y = 0.. SubHeightC * numSampL - 1인 이웃하는 좌측 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY + x, yTbY +y )에서의 블록 분리 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

- numSampT가 0보다 클 때, x = 0.. SubWidthC * numSampT - 1, y = -1, -2인 이웃하는 최상부 루마 샘플들 pY[ x ][ y ]가 위치들( xTbY+ x, yTbY + y )에서의 블록 분리 필터 프로세스 전에, 재구성된 루마 샘플들과 같게 설정된다.

- SubWidthC==1 그리고 SubHeightC==1이라면, 다음이 적용된다:

- x=1..nTbW-1, y=1..nTbH - 1인 pDsY[x][y]는 다음과 같이 도출된다:

pDstY[x][y] = pY[x][y]

// 주석: 다운샘플링이 요구되지 않는데, 즉 4:4:4일 때(SubWidthC와 SubHeightC 둘 다 1과 같다면) 필터링이 수행되지 않으며, 이는 또한 계수 [1]을 갖는 필터로서, 즉 바이패스 필터로서 해석될 수 있다//

- 그렇지 않으면, 한 세트의 필터들 {F3, F5, F6}에 대해 다음이 적용된다. // 주석: 여기서는 4:2:0 또는 4:2:2일 때(SubWidthC와 SubHeightC 둘 다 1과 같지 않다면) 필터들의 계수들을 정의하며, 여기서 F2는 다운샘플링 필터들의 제1 세트 및 제2 세트 모두에 속한다 //

-

F3[0] = 1, F3[1] = 2, F3[2] = 1

- SubWidthC==2 그리고 SubHeightC==2라면

F5[0][1] = 1, F5[1][1] = 4, F3[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

- 그렇지 않으면

F5[0][1] = 0, F5[1][1] = 8, F3[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

- x = 1..nTbW - 1, y = 1..nTbH - 1인 pDsY[ x ][ y ]는 F를 F5로 설정함으로써 다음과 같이 도출된다:

- pDsY[ x ][ y ] =

( F[1][0] * pY[ SubWidthC * x ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ SubHeightC * y ] +

+ F[1][1] * pY[ SubWidthC * x ][ SubHeightC * y ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ SubHeightC * y ] +

+ F[1][2] * pY[ SubWidthC * x ][ SubHeightC * y + 1 ] + 4 ) >> 3

// 주석: F5는 청구된 제1 다운샘플링 필터에 대응한다//

//

- availL이 TRUE와 같다면, y = 1..nTbH - 1인 pDsY[ 0 ][ y ]는 F5로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ y ] =

( F[1][0] * pY[ 0 ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[- 1][ SubHeightC * y ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ F[2][1] * pY[ 1 ] [ SubHeightC * y ] +

+ F[1][2] * pY[0][ SubHeightC * y + 1 ] + 4 ) >> 3

- 그렇지 않으면, y = 1..nTbH - 1인 pDsY[ 0 ][ y ]는 F3으로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ y ] =

( F[0] * pY[ 0 ][ SubHeightC * y - 1 ] +

+ F[1] * pY[ 0 ][ SubHeightC * y ] +

+ F[2] * pY[ 0 ][ SubHeightC * y + 1 ] +

+ 2 ) >> 2

- availT가 TRUE라면, x = 1..nTbW - 1인 pDsY[ x ][ 0 ]은 F5로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ x ][ 0 ] =

( F[1][0] * pY[ SubWidthC * x ][ - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ 0 ] +

+ F[1][1] * pY[ SubWidthC * x ][ 0 ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ 0 ] +

+ F[1][2] * pY[ SubWidthC * x ][ 1 ] + 4 ) >> 3

- 그렇지 않으면, x = 1..nTbW - 1인 pDsY[ x ][ 0 ]은 F3으로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ x ][ 0 ] =

= ( F[0] * pY[ SubWidthC * x - 1 ][ 0 ] +

+ F[1] * pY[ SubWidthC * x ][ 0 ] +

+ F[2] * pY[ SubWidthC * x + 1 ][ 0 ] + 2 ) >> 2

- availL이 TRUE와 같고 availT가 TRUE와 같다면, pDsY[ 0 ][ 0 ]은 F5로 설정된 F5에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] =

( F[1][0] * pY[ 0 ][ - 1 ] +

+ F[0][1] * pY[ - 1 ][ 0 ] +

+ F[1][1] * pY[ 0 ][ 0 ] +

+ F[2][1] * pY[ 1 ][ 0 ] +

+ F[1][2] * pY[ 0 ][ 1 ] + 4 ) >> 3

- 그렇지 않으면, availL은 TRUE와 같고 availT는 FALSE와 같다면, pDsY[ 0 ][ 0 ]은 F3으로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] =

( F[0] * pY[ - 1 ][ 0 ] +

+ F[1] * pY[ 0 ][ 0 ] +

+ F[2] * pY[ 1 ][ 0 ] +

+ 2 ) >> 2

- 그렇지 않으면, availL은 FALSE와 같고 availT는 TRUE와 같다면, pDsY[ 0 ][ 0 ]은 F3으로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ 0 ] =

( F[0] * pY[ 0 ][ -1 ] +

+ F[1] * pY[ 0 ][ 0 ] ++ F[2] * pY[ 0 ][ 1 ] +

+ 2 ) >> 2

pDsY[ 0 ][ 0 ] = pY[ 0 ][ 0 ]

- 그렇지 않으면, 다음이 적용된다:

- x = 1..nTbW - 1, y = 0..nTbH - 1인 pDsY[ x ][ y ]는 F6으로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ x ][ y ] =

(F[0][1] * pY[ SubWidthC * x - 1 ][ SubHeightC * y ] +

+ F[0][2] * pY[ SubWidthC * x - 1 ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ SubWidthC * x ][ SubHeightC * y ] +

+ F[1][2] * pY[ SubWidthC * x ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ SubHeightC * y ] +

+ F[2][2] * pY[ SubWidthC * x +1][ SubHeightC * y + 1 ] + 4 ) >> 3

- availL이 TRUE와 같다면, y = 0..nTbH - 1인 pDsY[ 0 ][ y ]는 F6으로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ y ] =

(F[0][1] * pY[ - 1 ][ SubHeightC * y ] +

+ F[0][2] * pY[ - 1 ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ F[1][2] * pY[ 0 ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ 1 ][ SubHeightC * y ] +

+ F[2][2] * pY[ 1 ][ SubHeightC * y + 1 ] + 4 ) >> 3

- 그렇지 않으면, y = 0..nTbH - 1인 pDsY[ 0 ][ y ]는 F2로 설정된 F에 대해 다음과 같이 도출된다:

pDsY[ 0 ][ y ] =

( F[0] * pY[ 0 ][ SubHeightC * y ] +

+ F[1] * pY[ 0 ][ SubHeightC * y + 1] + 1 ) >> 1

// 단계 3은 개개의 다운샘플링 필터들을 사용하여 현재 블록의 루마 블록에서 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들을 획득하기 위한 구현이다.//

4. numSampL이 0보다 클 때, y = 0..numSampL - 1인 다운샘플링된 이웃하는 좌측 루마 샘플들 pLeftDsY[ y ]는 다음과 같이 도출된다:

- SubWidthC==1 그리고 SubHeightC==1이라면, 다음이 적용된다:

- y=0..nTbH - 1인 pLeftDsY[y]는 다음과 같이 도출된다: pLeftDsY[y] = pY[-1][y]

그렇지 않으면 다음이 적용된다:

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

- y = 1..nTbH - 1인 pLeftDsY[ y ]는 F5로 설정된 F에 대해 다음과 같이 도출된다:

pLeftDsY[ y ] =

= F[1][0] * pY[ - SubWidthC ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[ -1 - SubWidthC ][ SubHeightC * y ] +

+ F[1][1] * pY[ - SubWidthC ][ SubHeightC * y ] +

+ F[2][1] * pY[ 1 - SubWidthC ][ SubHeightC * y ] +

+ F[1][2] * pY[ - SubWidthC ][ SubHeightC * y + 1 ] + 4 ) >> 3

- availTL이 TRUE와 같다면, pLeftDsY[ 0 ]은 F5로 설정된 F에 대해 다음과 같이 도출된다:

pLeftDsY[ 0 ] =

= F[1][0] * pY[ - SubWidthC ][ - 1 ] +

+ F[0][1] * pY[ -1 - SubWidthC ][ 0 ] +

+ F[1][1] * pY[ - SubWidthC ][ 0 ] +

+ F[2][1] * pY[ 1 - SubWidthC ][ 0 ] +

+ F[1][2] * pY[ - SubWidthC ][ 1 ] + 4 ) >> 3

pLeftDsY [ 0 ] =

( F[0] * pY[ -1 - SubWidthC ][ 0 ] +

+ F[1] * pY[ - SubWidthC ][ 0 ] +

+ F[2] * pY[ 1 - SubWidthC ][ 0 ] +

+ 2 ) >> 2

- 그렇지 않으면, F6으로 설정된 F에 대해 다음이 적용된다:

pLeftDsY[ y ] =

= (F[0][1] * pY[ -1 - SubWidthC ][ SubHeightC * y ] +

+ F[0][2] * pY[ -1 - SubWidthC ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ - SubWidthC ][ SubHeightC * y ] +

+ F[1][2] * pY[ - SubWidthC ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ 1 - SubWidthC ][ SubHeightC * y ] +

+ F[2][2] * pY[ 1 - SubWidthC][ SubHeightC * y + 1 ] + 4 ) >> 3

// 주석: 단계 4 및 단계 5는 개개의 다운샘플링 필터들을 사용하여 루마 블록의 선택된 이웃 루마 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하기 위한 구현이다.//

5. numSampT가 0보다 클 때, x = 0..numSampT - 1인 다운샘플링된 이웃하는 최상부 루마 샘플들 pTopDsY[ x ]는 다음과 같이 특정된다:

- SubWidthC==1 그리고 SubHeightC==1이라면, 다음이 적용된다:

- x=0..numSampT-1에 대해 pTopDsY[x] = pY[x][-1]

- 그렇지 않으면, 다음이 적용된다:

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

- x = 1..numSampT - 1인 pTopDsY[ x ]는 다음과 같이 도출된다:

- bCTUboundary가 FALSE와 같다면, F5로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ x ] =

= ( F[1][0] * pY[ SubWidthC * x ][ - 1 - SubHeightC ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ - SubHeightC ] +

+ F[1][1] * pY[ SubWidthC * x ][ - SubHeightC] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ - SubHeightC] +

+ F[1][2] * pY[ SubWidthC * x ][ 1 - SubHeightC ] + 4 ) >> 3

- 그렇지 않으면(bCTUboundary가 TRUE와 같다면), F3으로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ x ] =

= ( F[0] * pY[ SubWidthC * x - 1 ][ -1 ] +

+ F[1] * pY[ SubWidthC * x ][ -1 ] +

+ F[2] * pY[ SubWidthC * x + 1 ][ -1 ] +

+ 2 ) >> 2

- pTopDsY[ 0 ]은 다음과 같이 도출된다:

- availTL이 TRUE와 같고 bCTUboundary가 FALSE와 같다면, F5로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ 0 ] =

= F[1][0] * pY[ - 1 ] [ - 1- SubHeightC ] +

+ F[0][1] * pY[ - 1 ] [ - SubHeightC ] +

+ F[1][1] * pY[ 0 ] [ - SubHeightC ] +

+ F[2][1] * pY[ 1 ] [ - SubHeightC ] ++

+ F[1][2] pY[ - 1 ] [ 1 - SubHeightC ] ++ 4 ) >> 3

- 그렇지 않으면, availTL이 TRUE와 같고 bCTUboundary가 TRUE와 같다면, F3으로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ 0 ] =

= ( F[0] * pY[ -1 ][ -1 ] +

+ F[1] * pY[ 0 ][ -1 ] +

+ F[2] * pY[ 1 ][ -1 ] +

+ 2 ) >> 2

- 그렇지 않으면, availTL이 FALSE와 같고 bCTUboundary가 FALSE와 같다면, F3으로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ 0 ] =

= ( F[0] * pY[ 0 ][ -1 ] +

+ F[1] * pY[ 0 ][ -2 ] +

+ F[2] * pY[ 0 ][ -1 ] +

+ 2 ) >> 2

- 그렇지 않으면(availTL이 FALSE와 같고 bCTUboundary가 TRUE와 같으면), 다음이 적용된다:

pTopDsY[ 0 ] = pY[ 0 ][ -1 ]

- 그렇지 않으면, 다음이 적용된다:

- x = 1..numSampT - 1인 pTopDsY[ x ]는 다음과 같이 도출된다:

- bCTUboundary가 FALSE와 같다면, F6로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ x ] =

= (F[0][1] * pY[ SubWidthC * x - 1 ][ -2 ] +

+ F[0][2] * pY[ SubWidthC * x - 1 ][ -1 ] +

+ F[1][1] * pY[ SubWidthC * x ][ -2 ] +

+ F[1][2] * pY[ SubWidthC * x ][ -1] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ -2 ] +

+ F[2][2] * pY[ SubWidthC * x + 1 ][ -1 ] + 4 ) >> 3

pTopDsY[ x ] =

= ( F[0] * pY [ SubWidthC * y - 1 ] [- 1 ] +

+ F[1] * pY[ SubWidthC * y ] [ - 1 ] +

+ F[2] * pY[ SubWidthC * y + 1] [ - 1 ] +

+ 2 ) >> 2

- pTopDsY[ 0 ]은 다음과 같이 도출된다:

- availTL이 TRUE와 같고 bCTUboundary가 FALSE와 같다면, F6로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ 0 ] =

= (F[0][1] * pY[- 1 ][ -2 ] +

+ F[0][2] * pY[ -1 ][ -1 ] +

+ F[1][1] * pY[ 0 ][ -2 ] +

+ F[1][2] * pY[ 0 ][ -1] +

+ F[2][1] * pY[ 1 ][ -2 ] +

+ F[2][2] * pY[ 1 ][ -1 ] + 4 ) >> 3

pTopDsY[ 0 ] =

= ( F[0] * pY [ - 1 ] [- 1 ] +

+ F[1] * pY[ 0 ] [ - 1 ] +

+ F[2] * pY[ 1] [ - 1 ] +

+ 2 ) >> 2

- 그렇지 않으면, availTL이 FALSE와 같고 bCTUboundary가 FALSE와 같다면, F2로 설정된 F에 대해 다음이 적용된다:

pTopDsY[ 0 ] = ( F[1] * pY[ 0 ][ -2 ] + F[0] * pY[ 0 ][ -1 ] + 1 ) >> 1

pTopDsY[ 0 ] = pY[ 0 ][ -1 ]

// 주석: 단계 4 및 단계 5는 개개의 다운샘플링 필터를 적용함으로써 루마 블록의 선택된 이웃 루마 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하기 위한 구현이다.//

6. 변수들(nS, xS, yS)은 다음과 같이 도출된다:

- predModeIntra가 INTRA_LT_CCLM과 같다면, 다음이 적용된다:

nS = ( ( availL && availT ) ? Min( nTbW, nTbH ) : ( availL ? nTbH : nTbW ) )

xS = 1 << ( ( ( nTbW > nTbH ) && availL && availT ) ? ( Log2( nTbW) - Log2( nTbH ) ) : 0 ) (8-192)

yS = 1 << ( ( ( nTbH > nTbW ) && availL && availT ) ? ( Log2( nTbH) - Log2( nTbW ) ) : 0 ) (8-193)

- 그렇지 않으면, predModeIntra가 INTRA_L_CCLM과 같다면, 다음이 적용된다:

nS = numSampL

xS = 1

yS = 1

- 그렇지 않으면(predModeIntra가 INTRA_T_CCLM과 같으면), 다음이 적용된다:

nS = numSampT

xS = 1

yS = 1

7. 변수들(minY, maxY, minC, maxC)은 다음과 같이 도출된다:

- 변수 minY는 1 << (BitDepth_Y) + 1과 같게 설정되고 변수 maxY는 -1과 같게 설정된다.

- availT가 TRUE와 같다면, x = 0..nS - 1인 변수들(minY, maxY, minC, maxC)은 다음과 같이 도출된다:

- minY가 pTopDsY[ x * xS ]보다 크다면, 다음이 적용된다:

minY = pTopDsY[ x * xS ]

minC = p[ x * xS ][ -1 ]

- maxY가 pTopDsY[ x * xS ]보다 작다면, 다음이 적용된다:

maxY = pTopDsY[ x * xS ]

maxC = p[ x * xS ][ -1 ]

- availL이 TRUE와 같다면, y = 0..nS - 1인 변수들(minY, maxY, minC, maxC)은 다음과 같이 도출된다:

- minY가 pLeftDsY[ y * yS ]보다 크다면, 다음이 적용된다:

minY = pLeftDsY[ y * yS ]

minC = p[ -1 ][ y * yS ]

- maxY가 pLeftDsY[ y * yS ]보다 작다면, 다음이 적용된다:

maxY = pLeftDsY[ y * yS ]

maxC = p[ -1 ][ y * yS ]

8. 변수들(a, b, k)은 다음과 같이 도출된다:

- numSampL이 0과 같고, numSampT가 0과 같다면, 다음이 적용된다:

k = 0

a = 0

b = 1 << ( BitDepth_C - 1)

- 그렇지 않으면, 다음이 적용된다:

diff = maxY - minY

- diff가 0과 같지 않다면, 다음이 적용된다:

diffC = maxC - minC

x = Floor( Log2( diff ) )

normDiff = ( ( diff << 4 ) >> x ) & 15

x += ( normDiff != 0 ) ? 1 : 0

y = Floor( Log2( Abs ( diffC ) ) ) + 1

a = ( diffC * ( divSigTable[ normDiff ] | 8 ) + 2^{y - 1} ) >> y

k = ( ( 3 + x - y ) < 1 ) ? 1 : 3 + x - y

a = ( ( 3 + x - y ) < 1 ) ? Sign( a ) * 15 : a

b = minC - ( ( a * minY ) >> k )

여기서 divSigTable[ ]은 다음과 같이 명시된다:

divSigTable[ ] = { 0, 7, 6, 5, 5, 4, 4, 3, 3, 2, 2, 1, 1, 1, 1, 0 }

- 그렇지 않으면(diff가 0과 같으면), 다음이 적용된다:

k = 0

a = 0

b = minC

// 주석: 단계 6 - 단계 8은 선택된 이웃 루마 샘플들의 다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하기 위한 구현이며; 특히, 선형 모델 계수들의 결정은 minY, maxY, minC 및 maxC에 기초한다.//

9. 0..nTbW - 1, y = 0..nTbH - 1인 예측 샘플들 predSamples[ x ][ y ]는 다음과 같이 도출된다:

predSamples[ x ][ y ] = Clip1C( ( ( pDsY[ x ][ y ] * a ) >> k ) + b )

// 주석: 단계 9는 선형 모델 계수들 및 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하기 위한 구현이다.//

본 개시내용에서, 한 세트의 필터들 {F2, F3, F5, F6}에 대해, "F" 다음에 오는 1자리 숫자는 필터 세트 내의 상이한 필터들을 표현하는 데 사용되는 인덱스라는 점이 주목되어야 한다. 필터는 대응하는 샘플들에 적용될 하나 이상의 필터 계수들에 의해 정의된다. 예를 들어, F3의 대응하는 샘플들에 적용될 하나 이상의 다운샘플링 필터 계수들이 F2의 대응하는 샘플들에 적용될 하나 이상의 다운샘플링 필터 계수들과 동일하다면, F3과 F2가 동일한 필터라고 이해될 수 있는데; 이를테면, F3[0] = 1, F3[1] = 2, F3[2] = 1 그리고 F2[ 0 ] = 1, F2[ 1 ] = 2, F2[ 2 ] = 1이라면, F3=F2이다.

예를 들어, F5의 대응하는 샘플들에 적용될 하나 이상의 다운샘플링 필터 계수들이 F5의 대응하는 샘플들에 적용될 하나 이상의 다운샘플링 필터 계수들과 상이하다면, 둘의 이름이 동일하더라도 F5와 F5가 상이한 필터들이라고 이해될 수 있는데; 이를테면, F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1 그리고 F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0이라면, F5≠F5이다.

계수 [1]을 갖는 필터, 즉 본 개시내용에는 바이패스 필터로서, 1D 비분리형 필터(F[i]) 및 2D 비분리형 필터(F[i][j])가 존재한다는 점이 주목되어야 한다.

다른 실시예는 최대 4개의 이웃 크로마 샘플들 및 이들의 대응하는 다운샘플링된 루마 샘플들로 CCLM 파라미터들을 도출하기 위한 방법을 설명한다.

현재 크로마 블록 치수들이 W×H라고 가정하면, W' 및 H'는 다음과 같이 설정된다:

LM 모드가 적용될 때는 W '= W, H'= H(LM 모드에서 최상부 및 좌측 템플릿들이 사용됨);

LM-A 모드가 적용될 때는 W'=W+H(LM-A 모드에서 최상부 템플릿만이 사용됨);

LM-L 모드가 적용될 때는 H'=H+W(LM-L 모드에서 좌측 템플릿들만이 사용됨);

상부 이웃 샘플들(즉, 현재 블록 위에 있는 이웃 크로마 샘플들)은 S[0, -1]…S[W'-1, -1]로 표기되고, 좌측 이웃 샘플들(즉, 현재 블록의 좌측에 있는 이웃 크로마 샘플들)은 S[-1, 0]…S[-1, H'-1]로 표기된다. 여기서, S[x,y]는 포지션(x,y)에서의 샘플을 표기한다. (x,y)는 현재 블록의 최상부 좌측 샘플에 대해 측정된다(즉, 블록의 최상부 좌측 샘플은 (0,0)으로서 마킹된다). 이어서, CCLM 파라미터들을 도출하기 위해 사용되는 4개의 이웃 크로마 샘플들은 다음과 같이 특정될 수 있다(대응하게, 선택된 이웃 루마 샘플들의 4개의 다운샘플링된 이웃 루마 샘플들의 포지션들은 다음과 같이 지시된다):

LM 모드가 적용되며 위와 좌측 이웃 샘플들 모두가 이용 가능할 때는 S[W'/4, -1], S[3W'/4, -1], S[-1, H'/4], S[-1, 3H'/4];

LM-A 모드가 적용되거나 위의 이웃 샘플들만이 이용 가능할 때는 S[W'/8, -1], S[3W'/8, -1], S[5W'/8, -1], S[7W'/8, -1];

LM-L 모드가 적용되거나 좌측 이웃 샘플들만이 이용 가능할 때는 S[-1, H'/8], S[-1, 3H'/8], S[-1, 5H'/8], S[-1, 7H'/8];

4개의 다운샘플링된 이웃 루마 샘플들 각각은 선택된 이웃 루마 샘플들 중 일부 또는 전체에 개개의 다운샘플링 필터를 적용함으로써 획득된다. 위에서 선택된 4개의 이웃 크로마 샘플들에 대응하는 4개의 다운샘플링된 이웃 루마 샘플들이 4회 비교되어 2개의 더 작은 값들: x ⁰ _A 및 x ¹ _A , 그리고 2개의 더 큰 값들: x ⁰ _B 및 x ¹ _B 을 찾고, 여기서 x ⁰ _B 및 x ¹ _B 중 임의의 것은 x ⁰ _A 및 x ¹ _A 중 임의의 것보다 크다. 이들의 대응하는 크로마 샘플 값들은 y ⁰ _A , y ¹ _A , y ⁰ _B 및 y ¹ _B 로 표기된다. 그 다음, x _A , x _B , y _A 및 y _B 가 다음과 같이 도출된다:

.

본 명세서에 제시된 다른 예시적인 실시예에 따라 선형 모델(블록의 크로스 컴포넌트 예측)을 사용하여 인트라 예측을 수행하기 위한 프로세스의 세부사항들은 VVC 초안의 규격의 일부의 포맷으로 다음과 같이 설명된다(아래의 섹션 8.4.4.2.8의 버전은 위의 섹션 8.4.4.2.8의 버전과 다르다):

이 프로세스에 대한 입력들은 다음과 같다:

- 인트라 예측 모드(predModeIntra),

- 변환 블록 폭을 특정하는 변수 nTbW,

- 변환 블록 높이를 특정하는 변수 nTbH,

현재 루마 위치( xTbY, yTbY )는 다음과 같이 도출된다:

( xTbY, yTbY ) = ( xTbC << (SubWidthC - 1), yTbC << (SubHeightC - 1) )

변수들(availL, availT, availTL)은 다음과 같이 도출된다:

- availableTR이 TRUE와 같을 때, numTopRight가 1씩 증분된다.

- availableLB가 TRUE와 같을 때, numLeftBelow가 1씩 증분된다.

- predModeIntra가 INTRA_LT_CCLM과 같다면, 다음이 적용된다:

numSampT = availT ? nTbW : 0

numSampL = availL ? nTbH : 0

- 그렇지 않으면, 다음이 적용된다:

numSampT = ( availT && predModeIntra == INTRA_T_CCLM ) ?

( nTbW + Min( numTopRight, nTbH )) : 0

numSampL = ( availL && predModeIntra == INTRA_L_CCLM ) ?

( nTbH + Min( numLeftBelow, nTbW )) : 0

변수 bCTUboundary는 다음과 같이 도출된다:

bCTUboundary = ( yTbC & ( 1 << ( CtbLog2SizeY - 1 ) - 1 ) == 0 ) TRUE : FALSE.

N이 L 및 T로 대체되는 변수 cntN 및 배열 pickPosN[]은 다음과 같이 도출된다:

- 변수 numIs4N은 (( availT && availL && predModeIntra == INTRA_LT_CCLM ) ? 0 : 1)과 같게 설정된다.

- 변수 startPosN은 numSampN >> ( 2 + numIs4N )과 같게 설정된다.

- 변수 pickStepN은 Max( 1, numSampN >> ( 1 + numIs4N ))과 같게 설정된다.

- availN이 TRUE와 같고 predModeIntra가 INTRA_LT_CCLM 또는 INTRA_N_CCLM과 같다면, cntN은 Min( numSampN, ( 1 + numIs4N ) << 1 )과 같게 설정되고, pickPosN[ pos ]는 (startPosN + pos * pickStepN)과 같게 설정되며, pos = 0..( cntN - 1 )이다.

- 그렇지 않으면, cntN은 0과 같게 설정된다.

- numSampL과 numSampT 둘 다 0과 같다면, 다음이 적용된다:

predSamples[ x ][ y ] = 1 << ( BitDepth_C - 1 )

- 그렇지 않으면, 다음과 같은 순서의 단계들이 적용된다:

2. 이웃 루마 샘플들 pY[ x ][ y ]은 다음과 같이 도출된다:

- SubWidthC==1 그리고 SubHeightC==1이라면, 다음이 적용된다:

- pDsY[x][y] with x=1..nTbW-1, y=1..nTbH - 1은 다음과 같이 도출된다:

pDstY[x][y] = pY[x][y]

//주석: 오직 설명을 위해서만: YUV 4:4:4에 대한 필터가 없고 다운샘플링이 요구되지 않는데, 즉 4:4:4일 때(SubWidthC와 SubHeightC 둘 다 1과 같다면) 필터링이 수행되지 않으며, 이는 또한 계수 [1]을 갖는 필터로서, 즉 바이패스 필터로서 해석될 수 있다//

F3[0] = 1, F3[1] = 2, F3[2] = 1

- SubWidthC==2 그리고 SubHeightC==2라면

F5[0][1] = 1, F5[1][1] = 4, F3[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

- 그렇지 않으면

F5[0][1] = 0, F5[1][1] = 8, F3[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

pDsY[ x ][ y ] =

( F[1][0] * pY[ SubWidthC * x ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ SubHeightC * y ] +

+ F[1][1] * pY[ SubWidthC * x ][ SubHeightC * y ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ SubHeightC * y ] +

+ F[1][2] * pY[ SubWidthC * x ][ SubHeightC * y + 1 ] + 4 ) >> 3

//주석: F5는 청구된 제1 다운샘플링 필터에 대응한다//

pDsY[ 0 ][ y ] =

( F[1][0] * pY[ 0 ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[- 1][ SubHeightC * y ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ F[2][1] * pY[ 1 ] [ SubHeightC * y ] +

+ F[1][2] * pY[0][ SubHeightC * y + 1 ] + 4 ) >> 3

pDsY[ 0 ][ y ] =

( F[0] * pY[ 0 ][ SubHeightC * y - 1 ] +

+ F[1] * pY[ 0 ][ SubHeightC * y ] +

+ F[2] * pY[ 0 ][ SubHeightC * y + 1 ] +

+ 2 ) >> 2

pDsY[ x ][ 0 ] =

( F[1][0] * pY[ SubWidthC * x ][ - 1 ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ 0 ] +

+ F[1][1] * pY[ SubWidthC * x ][ 0 ] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ 0 ] +

+ F[1][2] * pY[ SubWidthC * x ][ 1 ] + 4 ) >> 3

pDsY[ x ][ 0 ] =

= ( F[0] * pY[ SubWidthC * x - 1 ][ 0 ] +

+ F[1] * pY[ SubWidthC * x ][ 0 ] +

+ F[2] * pY[ SubWidthC * x + 1 ][ 0 ] + 2 ) >> 2

pDsY[ 0 ][ 0 ] =

( F[1][0] * pY[ 0 ][ - 1 ] +

+ F[0][1] * pY[ - 1 ][ 0 ] +

+ F[1][1] * pY[ 0 ][ 0 ] +

+ F[2][1] * pY[ 1 ][ 0 ] +

+ F[1][2] * pY[ 0 ][ 1 ] + 4 ) >> 3

pDsY[ 0 ][ 0 ] =

( F[0] * pY[ - 1 ][ 0 ] +

+ F[1] * pY[ 0 ][ 0 ] +

+ F[2] * pY[ 1 ][ 0 ] +

+ 2 ) >> 2

pDsY[ 0 ][ 0 ] =

( F[0] * pY[ 0 ][ -1 ] +

+ F[1] * pY[ 0 ][ 0 ] +

+ F[2] * pY[ 0 ][ 1 ] +

+ 2 ) >> 2

pDsY[ 0 ][ 0 ] = pY[ 0 ][ 0 ]

- 그렇지 않으면, 다음이 적용된다:

pDsY[ x ][ y ] =

(F[0][1] * pY[ SubWidthC * x - 1 ][ SubHeightC * y ] +

+ F[0][2] * pY[ SubWidthC * x - 1 ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ SubWidthC * x ][ SubHeightC * y ] +

+ F[1][2] * pY[ SubWidthC * x ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ SubHeightC * y ] +

+ F[2][2] * pY[ SubWidthC * x +1][ SubHeightC * y + 1 ] + 4 ) >> 3

pDsY[ 0 ][ y ] =

(F[0][1] * pY[ - 1 ][ SubHeightC * y ] +

+ F[0][2] * pY[ - 1 ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ 0 ][ SubHeightC * y ] +

+ F[1][2] * pY[ 0 ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ 1 ][ SubHeightC * y ] +

+ F[2][2] * pY[ 1 ][ SubHeightC * y + 1 ] + 4 ) >> 3

pDsY[ 0 ][ y ] =

( F[0] * pY[ 0 ][ SubHeightC * y ] +

+ F[1] * pY[ 0 ][ SubHeightC * y + 1] + 1 ) >> 1

4. numSampL이 0보다 클 때, 선택된 이웃하는 좌측 크로마 샘플들 pSelC[idx]는 p[-1 ][ pickPosL[ idx ]]와 같게 설정되며, idx = 0..(cntL - 1)이고, idx = 0..(cntL-1)인 선택된 다운샘플링된 이웃하는 좌측 루마 샘플들 pSelDsY [ idx ]는 다음과 같이 도출된다:

- 변수 y는 pickPosL[ idx ]와 같게 설정된다.

- SubWidthC==1 그리고 SubHeightC==1이라면, 다음이 적용된다:

- pSelDsY [i] = pY[-1][y]

- 그렇지 않으면 다음이 적용된다:

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

y > 0 || availTL == TRUE라면, F5로 설정된 F에 대해:

pSelDsY [ idx] =

= F[1][0] * pY[ - SubWidthC ][ SubHeightC * y - 1 ] +

+ F[0][1] * pY[ -1 - SubWidthC ][ SubHeightC * y ] +

+ F[1][1] * pY[ - SubWidthC ][ SubHeightC * y ] +

+ F[2][1] * pY[ 1 - SubWidthC ][ SubHeightC * y ] +

+ F[1][2] * pY[ - SubWidthC ][ SubHeightC * y + 1 ] + 4 ) >> 3

- 그렇지 않으면, F3으로 설정된 F에 대해:

pSelDsY [ idx ] =

( F[0] * pY[ -1 - SubWidthC ][ 0 ] +

+ F[1] * pY[ - SubWidthC ][ 0 ] +

+ F[2] * pY[ 1 - SubWidthC ][ 0 ] +

+ 2 ) >> 2

- 그렇지 않으면, F6으로 설정된 F에 대해 다음이 적용된다:

pSelDsY [ idx ] =

= (F[0][1] * pY[ -1 - SubWidthC ][ SubHeightC * y ] +

+ F[0][2] * pY[ -1 - SubWidthC ][ SubHeightC * y + 1 ] +

+ F[1][1] * pY[ - SubWidthC ][ SubHeightC * y ] +

+ F[1][2] * pY[ - SubWidthC ][ SubHeightC * y + 1] +

+ F[2][1] * pY[ 1 - SubWidthC ][ SubHeightC * y ] +

+ F[2][2] * pY[ 1 - SubWidthC][ SubHeightC * y + 1 ] + 4 ) >> 3

5. numSampT가 0보다 클 때, 선택된 이웃하는 최상부 크로마 샘플들 pSelC[ idx ]는 p[ pickPosT[ idx - cntL ]][ -1 ]과 같게 설정되고, idx = cntL..( cntL + cntT - 1 )이며, idx = cntL.. cntL+ cntT - 1인 다운샘플링된 이웃하는 최상부 루마 샘플들 pSelDsY [ idx ]는 다음과 같이 특정된다:

- 변수 x는 pickPosT[ idx - cntL ]과 같게 설정된다.

- SubWidthC==1 그리고 SubHeightC==1이라면, 다음이 적용된다:

- pSelDsY [idx] = pY[x][-1]

- 그렇지 않으면, 다음이 적용된다:

- sps_cclm_colocated_chroma_flag가 1과 같다면, 다음이 적용된다:

- x > 0이라면:

pSelDsY [ idx ] =

= ( F[1][0] * pY[ SubWidthC * x ][ - 1 - SubHeightC ] +

+ F[0][1] * pY[ SubWidthC * x - 1 ][ - SubHeightC ] +

+ F[1][1] * pY[ SubWidthC * x ][ - SubHeightC] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ - SubHeightC] +

+ F[1][2] * pY[ SubWidthC * x ][ 1 - SubHeightC ] + 4 ) >> 3

pSelDsY [ idx ] =

= ( F[0] * pY[ SubWidthC * x - 1 ][ -1 ] +

+ F[1] * pY[ SubWidthC * x ][ -1 ] +

+ F[2] * pY[ SubWidthC * x + 1 ][ -1 ] +

+ 2 ) >> 2

- 그렇지 않으면:

pSelDsY [ idx ] =

= F[1][0] * pY[ - 1 ] [ - 1- SubHeightC ] +

+ F[0][1] * pY[ - 1 ] [ - SubHeightC ] +

+ F[1][1] * pY[ 0 ] [ - SubHeightC ] +

+ F[2][1] * pY[ 1 ] [ - SubHeightC ] +

+ F[1][2] pY[ - 1 ] [ 1 - SubHeightC ] + 4 ) >> 3

pSelDsY [ idx ] =

= ( F[0] * pY[ -1 ][ -1 ] +

+ F[1] * pY[ 0 ][ -1 ] +

+ F[2] * pY[ 1 ][ -1 ] +

+ 2 ) >> 2 (8-182)

pSelDsY [ idx ] =

= ( F[0] * pY[ 0 ][ -1 ] +

+ F[1] * pY[ 0 ][ -2 ] +

+ F[2] * pY[ 0 ][ -1 ] +

+ 2 ) >> 2

pSelDsY [ idx ] = pY[ 0 ][ -1 ]

- 그렇지 않으면, 다음이 적용된다:

- x > 0이라면:

pSelDsY [ idx ] =

= (F[0][1] * pY[ SubWidthC * x - 1 ][ -2 ] +

+ F[0][2] * pY[ SubWidthC * x - 1 ][ -1 ] +

+ F[1][1] * pY[ SubWidthC * x ][ -2 ] +

+ F[1][2] * pY[ SubWidthC * x ][ -1] +

+ F[2][1] * pY[ SubWidthC * x + 1 ][ -2 ] +

+ F[2][2] * pY[ SubWidthC * x + 1 ][ -1 ] + 4 ) >> 3

pSelDsY [ idx ] =

= ( F[0] * pY [ SubWidthC * y - 1 ] [- 1 ] +

+ F[1] * pY[ SubWidthC * y ] [ - 1 ] +

+ F[2] * pY[ SubWidthC * y + 1] [ - 1 ] +

+ 2 ) >> 2

- 그렇지 않으면:

pSelDsY [ idx ] =

= (F[0][1] * pY[- 1 ][ -2 ] +

+ F[0][2] * pY[ -1 ][ -1 ] +

+ F[1][1] * pY[ 0 ][ -2 ] +

+ F[1][2] * pY[ 0 ][ -1] +

+ F[2][1] * pY[ 1 ][ -2 ] +

+ F[2][2] * pY[ 1 ][ -1 ] + 4 ) >> 3

pSelDsY [ idx ] =

= ( F[0] * pY [ - 1 ] [- 1 ] +

+ F[1] * pY[ 0 ] [ - 1 ] +

+ F[2] * pY[ 1] [ - 1 ] +

+ 2 ) >> 2

pSelDsY [ idx ] = ( F[1] * pY[ 0 ][ -2 ] + F[0] * pY[ 0 ][ -1 ] + 1 ) >> 1

pSelDsY [ idx ] = pY[ 0 ][ -1 ]

6. cntT+ cntL이 0과 같지 않을 때, 변수들(minY, maxY, minC, maxC)은 다음과 같이 도출된다:

- cntT+cntL이 2와 같을 때, pSelComp[3]을 pSelComp[0]과 같게, pSelComp[2]를 pSelComp[1]과 같게, pSelComp[0]을 pSelComp[1]과 같게, 그리고 pSelComp[1]을 pSelComp[3]과 같게 설정하며, Comp는 DsY 및 C로 대체된다.

- 배열들 minGrpIdx[] 및 maxGrpIdx[]는: minGrpIdx[0] = 0, minGrpIdx[1] = 2, maxGrpIdx[0] = 1, maxGrpIdx[1] = 3으로 설정된다.

- pSelDsY[minGrpIdx[0]] > pSelDsY[minGrpIdx[1]]이라면, Swap(minGrpIdx[0], minGrpIdx[1])이다.

- pSelDsY[maxGrpIdx[0]] > pSelDsY[maxGrpIdx[1]]이라면, Swap(maxGrpIdx[0], maxGrpIdx[1])이다.

- pSelDsY[minGrpIdx[0]] > pSelDsY[maxGrpIdx[1]]이라면, Swap(minGrpIdx, maxGrpIdx )이다.

- pSelDsY[minGrpIdx[1]] > pSelDsY[maxGrpIdx[0]]이라면, Swap(minGrpIdx[1], maxGrpIdx[0])이다.

- maxY = ( pSelDsY[maxGrpIdx[0]] + pSelDsY[maxGrpIdx[1]] + 1 ) >> 1.

- maxC = ( pSelC[maxGrpIdx[0]] + pSelC[maxGrpIdx[1]] + 1 ) >> 1.

- minY = ( pSelDsY[minGrpIdx[0]] + pSelDsY[minGrpIdx[1]] + 1 ) >> 1.

- minC = ( pSelC[minGrpIdx[0]] + pSelC[minGrpIdx[1]] + 1 ) >> 1.

7. 변수들(a, b, k)은 다음과 같이 도출된다:

- numSampL이 0과 같고, numSampT가 0과 같다면, 다음이 적용된다:

k = 0

a = 0

b = 1 << ( BitDepth_C - 1)

- 그렇지 않으면, 다음이 적용된다:

diff = maxY - minY

- diff가 0과 같지 않다면, 다음이 적용된다:

diffC = maxC - minC

x = Floor( Log2( diff ) )

normDiff = ( ( diff << 4 ) >> x ) & 15

x += ( normDiff != 0 ) ? 1 : 0

y = Floor( Log2( Abs ( diffC ) ) ) + 1

a = ( diffC * ( divSigTable[ normDiff ] | 8 ) + 2^{y - 1} ) >> y

k = ( ( 3 + x - y ) < 1 ) ? 1 : 3 + x - y

a = ( ( 3 + x - y ) < 1 ) ? Sign( a ) * 15 : a

b = minC - ( ( a * minY ) >> k )

여기서 divSigTable[ ]은 다음과 같이 명시된다:

divSigTable[ ] = { 0, 7, 6, 5, 5, 4, 4, 3, 3, 2, 2, 1, 1, 1, 1, 0 }

- 그렇지 않으면(diff가 0과 같으면), 다음이 적용된다:

k = 0

a = 0

b = minC

// 주석: 단계 6 - 단계 7은 선택된 이웃 루마 샘플들의 다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하기 위한 구현이며; 특히, 선형 모델 계수들의 결정은 minY, maxY, minC 및 maxC에 기초한다.//

8. 0..nTbW - 1, y = 0..nTbH - 1인 예측 샘플들 predSamples[ x ][ y ]는 다음과 같이 도출된다:

predSamples[ x ][ y ] = Clip1C( ( ( pDsY[ x ][ y ] * a ) >> k ) + b ) // 주석: 단계 8은 선형 모델 계수들 및 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하기 위한 구현이다.//

도 12는 본 개시내용의 다른 양상에 따라 선형 모델을 사용하여 인트라 예측을 수행하기 위한 디바이스를 예시한다. 디바이스(1200)는:

크로마 포맷 정보에 기초하여 한 세트의 다운샘플링 필터들을 결정하도록 구성된 결정 유닛(1201) ― 크로마 포맷 정보는 현재 블록이 속하는 픽처의 크로마 포맷을 지시함 ―;

한 세트의 다운샘플링 필터들 중(한 세트의 다운샘플링 필터들로부터 선택된) 개개의 다운샘플링 필터들을 사용하여 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 루마 블록의 선택된 루마 참조 샘플들(또는 선택된 루마 이웃 샘플들)의 다운샘플링된 루마 참조 샘플들을 획득하도록 구성된 필터링 유닛(1203);

다운샘플링된 루마 참조 샘플들 및 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하도록 구성된 선형 모델 도출 유닛(1205); 및

선형 모델 계수들 및 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하도록 구성된 예측 유닛(1207)을 포함한다.

대응하게, 일례로, 디바이스(1200)의 예시적인 구조는 도 2의 인코더(20)에 대응할 수 있다. 다른 예에서, 디바이스(1200)의 예시적인 구조는 도 3의 디코더(30)에 대응할 수 있다.

다른 예에서, 디바이스(1200)의 예시적인 구조는 도 2의 인트라 예측 유닛(254)에 대응할 수 있다. 다른 예에서, 디바이스(1200)의 예시적인 구조는 도 3의 인트라 예측 유닛(354)에 대응할 수 있다.

본 개시내용은 다음의 추가 양상들을 제공한다.

제1 양상에 따르면, 본 개시내용은 선형 모델을 사용한 인트라 예측을 위한 방법에 관한 것이다. 이 방법은 코딩 장치(특히, 인트라 예측을 위한 장치)에 의해 수행된다. 이 방법은:

- 현재 블록이 속하는 픽처의 크로마 포맷에 기초하여, 블록에 속하는 (각각의 루마 샘플과 같은) 루마 샘플(즉, 현재 블록의 내부 샘플들)에 대한 필터를 결정하는 단계 ― 특히, 상이한 루마 샘플들은 상이한 필터에 대응할 수 있음. 기본적으로, 루마 샘플이 경계에 있는지 여부에 좌우됨 ―;

- 필터링되는 재구성된 루마 샘플(이를테면, Rec' _L [x,y])을 획득하기 위해, 현재 블록에 속하는 루마 샘플(이를테면, 각각의 루마 샘플)의 포지션에서, 결정된 필터를 재구성된 루마 샘플들의 영역에 적용하는 단계;

- 필터링되는 재구성된 루마 샘플에 기초하여, 선형 모델 도출의 입력으로서 사용되는 한 세트의 루마 샘플들을 획득하는 단계; 및

- 선형 모델 도출의 선형 모델 계수들 및 필터링되는 재구성된 루마 샘플에 기초하여 크로스 컴포넌트 예측(이를테면, 루마로부터의 크로스 컴포넌트 크로마 예측 또는 CCLM 예측)을 수행하는 단계를 포함한다.

본 개시내용은 CCLM의 루마 필터에 관한 것이다. 본 개시내용은 루마 샘플들을 필터링하는 것에 관한 것이다. 본 개시내용은 CCLM 내에서 수행되는 필터 선택에 관한 것이다.

CCLM은 크로마 예측과 관련되며, 이는 재구성된 루마를 사용하여 크로마 신호를 예측한다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 필터를 결정하는 단계는:

현재 블록 내의 루마 샘플의 포지션 및 크로마 포맷에 기초하여 필터를 결정하는 단계; 또는

현재 블록 내의 루마 샘플들의 개개의 포지션들 및 크로마 포맷에 기초하여, 현재 블록에 속하는 복수의 루마 샘플들에 대한 개개의 필터들을 결정하는 단계를 포함한다. 현재 블록에 인접한 샘플들이 이용 가능하다면, 필터는 현재 블록의 경계 영역을 필터링하기 위해서도 또한 이러한 샘플들을 사용할 수 있다고 이해될 수 있다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 필터를 결정하는 단계는: 다음 중 하나 이상에 기초하여 필터를 결정하는 단계를 포함한다:

현재 블록이 속하는 픽처의 크로마 포맷,

현재 블록 내의 루마 샘플의 포지션,

현재 블록에 속하는 루마 샘플들의 수,

현재 블록의 폭과 높이, 그리고

현재 블록 내의 루마 샘플에 대한 서브샘플링된 크로마 샘플의 포지션.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 대응하는 루마 샘플과 콜로케이팅되지 않을 때, 현재 블록의 폭 및 높이의 값들과 복수의 필터들 간의 제1 관계(이를테면, 표 4)가 필터의 결정에 사용되며;

서브샘플링된 크로마 샘플이 대응하는 루마 샘플과 콜로케이팅될 때, 현재 블록의 폭 및 높이의 값들과 복수의 필터들 간의 제2 또는 제3 관계(이를테면, 표 2 또는 표 3)가 필터의 결정에 사용된다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 현재 블록의 폭 및 높이의 값들과 복수의 필터들 간의 제2 또는 제3 관계(이를테면, 표 2 또는 표 3)는 현재 블록에 속하는 루마 샘플들의 수에 기초하여 결정된다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 필터는, 현재 블록의 크로마 컴포넌트가 서브샘플링되지 않을 때, 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 그리고 수직으로 인접한 포지션들에서 0이 아닌 계수들을 포함한다.

(이를테면

, 여기서 계수 "4"를 갖는 중앙 포지션은 필터링되는 재구성된 루마 샘플의 포지션에 대응한다)

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 재구성된 루마 샘플들의 영역은 필터링되는 재구성된 샘플의 포지션에 대한 복수의 재구성된 루마 샘플들을 포함하고, 필터링되는 재구성된 루마 샘플의 포지션은 현재 블록에 속하는 루마 샘플의 포지션에 대응하며, 필터링되는 재구성된 루마 샘플의 포지션은 현재 블록의 루마 블록 내에 있다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 재구성된 루마 샘플들의 영역은 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 그리고 수직으로 인접한 포지션들에 복수의 재구성된 루마 샘플들을 포함하고, 필터링되는 재구성된 루마 샘플의 포지션은 현재 블록에 속하는 루마 샘플의 포지션에 대응하며, 필터링되는 재구성된 루마 샘플의 포지션은 현재 블록(이를테면, 현재 루마 블록 또는 현재 블록의 루마 컴포넌트) 내에 있다. 이를테면, 필터링되는 재구성된 루마 샘플의 포지션은 현재 블록 내에 있다(도 8의 우측 부분, 루마 샘플들에 필터를 적용함).

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 크로마 포맷은 YCbCr 4:4:4 크로마 포맷, YCbCr 4:2:0 크로마 포맷, YCbCr 4:2:2 크로마 포맷, 또는 단색을 포함한다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 선형 모델 도출의 입력으로서 사용되는 한 세트의 루마 샘플들은:

필터링되는 재구성된 루마 샘플들(이를테면, Rec' _L [x,y])로부터 서브샘플링되는 경계 루마 재구성된 샘플들을 포함한다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 현재 크로마 블록에 대한 예측자는 다음 식에 기초하여 획득된다:

pred _C (i,j) = α·rec _L '(i,j) + β

여기서 pred _C (i,j)는 크로마 샘플을 나타내고, rec _L (i,j)는 대응하는 재구성된 루마 샘플을 나타낸다.

그러한 제1 양상에 따른 방법의 가능한 구현 형태에서, 선형 모델은 다방향 선형 모델(MDLM)이며, 선형 모델 계수들이 MDLM을 획득하는 데 사용된다.

본 개시내용의 제2 양상에 따르면, 선형 모델을 사용한 인트라 예측을 위한 방법이 제공되며, 이 방법은:

- 현재 블록이 속하는 픽처의 크로마 포맷에 기초하여, 현재 블록의 루마 컴포넌트에 대한 필터를 결정하는 단계;

- 필터링되는 재구성된 루마 샘플들(예컨대, (현재 블록의 루마 컴포넌트와 같은) 현재 블록 내의 필터링되는 재구성된 루마 샘플)을 획득하기 위해, 현재 블록의 루마 컴포넌트의 재구성된 루마 샘플들 및 현재 블록에 이웃하는 선택된 포지션(현재 블록의 좌측 또는 최상부 측에 인접한 하나 또는 여러 행들/열들)의 루마 샘플들의 영역에 결정된 필터를 적용하는 단계;

- 선형 모델 도출의 입력(예컨대, 한 세트의 루마 샘플들은 현재 블록 내의 필터링되는 재구성된 루마 샘플들 및 현재 블록 외부의 필터링된 이웃 루마 샘플들을 포함하며, 예를 들어 결정된 필터는 현재 블록 외부의 이웃 루마 샘플들에 또한 적용될 수 있음)으로서 필터링되는 재구성된 루마 샘플들에 기초하여 선형 모델 계수들을 획득하는 단계; 및

- 현재 크로마 블록의 예측자를 획득하기 위해, 획득된 선형 모델 계수들 및 현재 블록의 필터링되는 재구성된 루마 샘플들(예컨대, (현재 블록의 루마 컴포넌트와 같은) 현재 블록 내의 필터링되는 재구성된 루마 샘플들)에 기초하여 크로스 컴포넌트 예측을 수행하는 단계를 포함한다.

그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 필터를 결정하는 단계는:

현재 블록 내의 루마 샘플들의 개개의 포지션들 및 크로마 포맷에 기초하여, 현재 블록에 속하는 복수의 루마 샘플들에 대한 개개의 필터들을 결정하는 단계를 포함한다.

그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 결정하는 단계는: 다음 중 하나 이상에 기초하여 필터를 결정하는 단계를 포함한다:

서브샘플링 비율 정보(이를테면, 현재 블록이 속하는 픽처의 크로마 포맷에 따라 표로부터 획득될 수 있는 SubWidthC 및 SubHeightC),

현재 블록이 속하는 픽처의 크로마 포맷(이를테면, 여기서 크로마 포맷은 서브샘플링 비율 정보(이를테면, SubWidthC 및 SubHeightC)를 획득하는 데 사용됨),

현재 블록 내의 루마 샘플의 포지션,

현재 블록에 속하는 루마 샘플들의 수,

현재 블록의 폭과 높이, 및/또는

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 서브샘플링된 크로마 샘플이 대응하는 루마 샘플과 콜로케이팅되지 않을 때, (SubWidthC 및 SubHeightC와 같은, 또는 현재 블록의 폭과 높이의 값들과 같은) 서브샘플링 비율 정보와 복수의 필터들 간의 미리 설정된 제1 관계(이를테면, 표 4)가 필터에 사용되고; 그리고/또는

서브샘플링된 크로마 샘플이 대응하는 루마 샘플과 콜로케이팅될 때, (SubWidthC 및 SubHeightC와 같은, 또는 현재 블록의 폭 및 높이의 값들과 같은) 서브샘플링 비율 정보와 복수의 필터들 간의 미리 설정된 제2 또는 미리 설정된 제3 관계(이를테면, 표 2 또는 표 3)가 필터의 결정에 사용된다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, (SubWidthC 및 SubHeightC와 같은, 또는 현재 블록의 폭 및 높이의 값들과 같은) 서브샘플링 비율 정보와 복수의 필터들 간의 제2 또는 제3 관계(이를테면, 표 2 또는 표3)는 현재 블록에 속하는 특정 루마 샘플들(이를테면, 이용 가능한 루마 샘플)의 수에 기초하여 결정된다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 필터는 다음과 같이 조건부 결정된다:

제1 조건(이를테면, 규격에 정의된 표로부터 획득된 서브샘플링 비율 정보, 이를테면 SubWidthC==1 그리고 SubHeightC==1)이 충족되지 않는다면, 한 세트의 필터들 {F3, F5, F6}에 대해 다음이 적용되고;

F3[0] = 1, F3[1] = 2, F3[2] = 1;

제2 조건(이를테면, 표로부터 획득된 서브샘플링 비율 정보, 이를테면 SubWidthC==2 그리고 SubHeightC==1)이 충족된다면,

F5[0][1] = 1, F5[1][1] = 4, F3[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1

F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,

F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,

F2[0] = 1, F2[1] = 1

그렇지 않으면, (예컨대, 제2 조건(표로부터 획득된 서브샘플링 비율 정보, 이를테면 SubWidthC==2 그리고 SubHeightC==2)이 충족되지 않으면),

F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0

F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,

F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,

F2[0] = 2, F2[1] = 0.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 필터는, 현재 블록의 크로마 컴포넌트가 서브샘플링되지 않을 때, 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에서 0이 아닌 계수들을 포함한다.

(이를테면

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 재구성된 루마 샘플들의 영역은 필터링되는 재구성된 샘플의 포지션에 대한 복수의 재구성된 루마 샘플들을 포함하고, 필터링되는 재구성된 루마 샘플의 포지션은 블록에 속하는 루마 샘플의 포지션에 대응하며, 필터링되는 재구성된 루마 샘플의 포지션은 블록의 루마 블록 내에 있다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 재구성된 루마 샘플들의 영역은 필터링되는 재구성된 루마 샘플의 포지션에 수평으로 그리고 / 수직으로 인접한 포지션들에 복수의 재구성된 루마 샘플들을 포함하고, 필터링되는 재구성된 루마 샘플의 포지션은 블록에 속하는 루마 샘플의 포지션에 대응하며, 필터링되는 재구성된 루마 샘플의 포지션은 블록(이를테면, 현재 루마 블록 또는 현재 블록의 루마 컴포넌트) 내에 있다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 크로마 포맷은 YCbCr 4:4:4 크로마 포맷, YCbCr 4:2:0 크로마 포맷, YCbCr 4:2:2 크로마 포맷, 또는 단색을 포함한다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 선형 모델 도출의 입력으로서 사용되는 한 세트의 루마 샘플들은:

필터링되는 재구성된 루마 샘플들(이를테면,

)로부터 서브샘플링되는 경계 루마 재구성된 샘플들을 포함한다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 현재 크로마 블록에 대한 예측자는 다음 식에 기초하여 획득된다:

여기서 pred _C (i,j)는 크로마 샘플을 나타내고, rec _L (i,j)는 루마 샘플의 대응하는 재구성된 값을 나타내고(이를테면, 대응하는 재구성된 루마 샘플의 포지션은 현재 블록 내에 있음), α 및 β는 선형 모델 계수들을 나타낸다.

제2 양상의 임의의 선행 구현 또는 그러한 제2 양상에 따른 방법의 가능한 구현 형태에서, 선형 모델은 다방향 선형 모델(MDLM)이며, 선형 모델 계수들이 MDLM을 획득하는 데 사용된다.

본 개시내용의 제3 양상에 따르면, 인코딩 디바이스에 의해 구현되는 인코딩 방법이 제공되며, 이 방법은:

본 개시내용에서 설명되는 바와 같이 선형 모델(이를테면, 크로스 컴포넌트 선형 모델(CCLM) 또는 다방향 선형 모델(MDLM))을 사용하여 인트라 예측을 수행하는 단계; 및

복수의 신택스 엘리먼트들을 포함하는 비트스트림을 생성하는 단계를 포함하며, 복수의 신택스 엘리먼트들은 블록에 속하는 루마 샘플에 대한 필터의 선택(이를테면, CCLM의 루마 필터, 특히 sps_cclm_colocated_chroma_flag와 같은 SPS 플래그의 선택)을 지시하는 신택스 엘리먼트를 포함한다.

그러한 제3 양상에 따른 방법의 가능한 구현 형태에서, 신택스 엘리먼트의 값이 1 또는 참일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되지 않고;

신택스 엘리먼트의 값이 0 또는 거짓일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용된다.

본 개시내용의 제4 양상에 따르면, 디코딩 디바이스에 의해 구현되는 디코딩 방법은:

비트스트림으로부터 복수의 신택스 엘리먼트들을 파싱하는 단계 ― 복수의 신택스 엘리먼트들은 블록에 속하는 루마 샘플에 대한 필터의 선택(이를테면, CCLM의 루마 필터, 특히 sps_cclm_colocated_chroma_flag와 같은 SPS 플래그의 선택)을 지시하는 신택스 엘리먼트를 포함함 ―; 및

본 개시내용에서 설명되는 바와 같이, 지시된 선형 모델(이를테면, CCLM)을 사용하여 인트라 예측을 수행하는 단계를 포함한다.

그러한 제4 양상에 따른 방법의 가능한 구현 형태에서, 신택스 엘리먼트의 값이 0 또는 거짓일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되고;

신택스 엘리먼트의 값이 1 또는 참일 때는, 선형 모델 결정 및 예측을 위한 루마 샘플에 필터가 적용되지 않는다.

본 개시내용의 제5 양상에 따르면, 선형 모델을 사용한 인트라 예측을 위한 장치가 제공되며, 이 장치는:

- 현재 블록이 속하는 픽처의 크로마 포맷에 기초하여, 블록에 속하는 루마 샘플에 대한 필터를 결정하도록 구성된 결정 유닛;

- 필터링되는 재구성된 루마 샘플을 획득하기 위해, 현재 블록에 속하는 루마 샘플의 포지션에서, 결정된 필터를 재구성된 루마 샘플들의 영역에 적용하도록 구성된 필터링 유닛;

- 필터링되는 재구성된 루마 샘플에 기초하여, 선형 모델 도출의 입력으로서 사용되는 한 세트의 루마 샘플들을 획득하도록 구성된 획득 유닛; 및

- 선형 모델 도출의 선형 모델 계수들 및 필터링되는 재구성된 루마 샘플에 기초하여 크로스 컴포넌트 예측을 수행하도록 구성된 예측 유닛을 포함한다.

제5 양상의 임의의 선행 구현 및 그러한 제5 양상에 따른 디바이스의 가능한 구현 형태에서, 필터링되는 재구성된 샘플들의 수는 현재 루마 블록의 크기와 같거나 그보다 크다.

제5 양상의 임의의 선행 구현 및 그러한 제5 양상에 따른 디바이스의 가능한 구현 형태에서, 다운샘플링되는 재구성된 샘플들에 대해 CCLM이 수행된다.

제5 양상의 임의의 선행 구현 및 그러한 제5 양상에 따른 디바이스의 가능한 구현 형태에서, 현재 크로마 블록의 현재 블록이 최상부 경계에 있을 때, 필터링되는 재구성된 샘플들을 획득하기 위해, 이웃하는 재구성된 루마 샘플들의 하나의 행만이 사용된다.

제5 양상의 임의의 선행 구현 또는 그러한 제5 양상에 따른 디바이스의 가능한 구현 형태에서, 선형 모델은 다방향 선형 모델(MDLM)이며, 선형 모델 계수들이 MDLM을 획득하는 데 사용된다.

현재 루마 블록의 최상부 템플릿에만 속하는 또는 현재 루마 블록의 좌측 템플릿에만 속하는, 필터링되는 재구성된 샘플들에 대해서만 CCLM 또는 MDLM 파라미터 도출이 수행되거나, 또는 재구성된 샘플들은 현재 루마 블록의 최상부 템플릿 및 현재 루마 블록의 좌측 템플릿에 속한다.

제5 양상의 임의의 선행 구현 또는 그러한 제5 양상에 따른 디바이스의 가능한 구현 형태에서, 현재 블록에 이웃하는 선택된 포지션의 루마 샘플들은 현재 블록의 최상부에 이웃하는 샘플 행에서 그리고/또는 현재 블록의 좌측에 이웃하는 샘플 열에서 이들 사이의 간격/거리/픽셀들의 수만큼 균등하게 분리된다.

제5 양상의 임의의 선행 구현 또는 그러한 제5 양상에 따른 디바이스의 가능한 구현 형태에서, 현재 블록에 이웃하는 선택된 포지션은 다음과 같이 지시된다:

LM-L 모드가 적용되거나 좌측 이웃 샘플들만이 이용 가능할 때는 S[-1, H'/8], S[-1, 3H'/8], S[-1, 5H'/8], S[-1, 7H'/8].

디코더(30)의 제6 양상은 제1 양상 내지 제3 양상 중 어느 한 양상에 따른 방법을 실행하기 위한 처리 회로를 포함한다.

컴퓨터 프로그램 제품의 제7 양상은 제1 양상 내지 제3 양상 중 어느 한 양상에 따른 방법을 수행하기 위한 프로그램 코드를 포함한다.

디코더의 제8 양상은:

하나 이상의 프로세서들; 및 프로세서들에 결합되며 프로세서들에 의한 실행을 위한 프로그래밍을 저장하는 비-일시적 컴퓨터 판독 가능 저장 매체를 포함하며, 프로그래밍은 프로세서들에 의해 실행될 때, 제1 양상 내지 제3 양상 중 어느 한 양상에 따른 방법을 실행하도록 디코더를 구성한다.

인코더의 제9 양상은:

하나 이상의 프로세서들; 및 프로세서들에 결합되며 프로세서들에 의한 실행을 위한 프로그래밍을 저장하는 비-일시적 컴퓨터 판독 가능 저장 매체를 포함하며, 프로그래밍은 프로세서들에 의해 실행될 때, 제1 양상 내지 제3 양상 중 어느 한 양상에 따른 방법을 실행하도록 인코더를 구성한다.

비-일시적 컴퓨터 판독 가능 매체의 제10 양상은 컴퓨터 디바이스에 의해 실행될 때, 컴퓨터 디바이스로 하여금 제1 양상 내지 제3 양상 중 어느 한 양상에 따른 방법을 수행하게 하는 프로그램 코드를 전달한다.

인코더(20)의 제11 양상은 제1 양상 내지 제3 양상 중 어느 한 양상에 따른 방법을 실행하기 위한 처리 회로를 포함한다.

상기에 기초하여, 본 명세서에 개시된 실시예들은 다음의 기술적 이점들을 갖는데: 본 명세서에 개시된 실시예들은 루마 샘플들로부터 크로마 샘플들을 예측할 때 픽처의 크로마 포맷을 고려한다. 크로마 포맷에 기초하여 필터 세트를 선택함으로써, 이전 설계의 결함들이 제거되어, 예측 오차 감소 및 그에 따라 보다 정확한 크로마 예측으로 이어진다. 더 작은 예측 오차의 기술적 결과는 잔차 신호 에너지의 감소이다. 코딩 방법들은 재구성된 신호의 왜곡을 감소시키거나, 잔차 신호를 인코딩하는 데 필요한 비트 레이트를 감소시키거나, 왜곡과 비트 레이트 모두를 감소시키기 위해, 이러한 잔차 신호 에너지 감소를 이용할 수 있다. 본 명세서에서 제시된 실시예들에 의해 달성되는 이러한 유리한 효과들은 코딩 방법의 전체 압축 성능을 개선한다.

추가로, 본 명세서에 개시된 필터들은 다음의 2개의 특성들을 갖는다:

- 수평 방향 및 수직 방향의 탭들의 수는 3을 초과하지 않는다.

- 계수들의 값들은 2의 거듭제곱이다.

제1 특성은 필터링을 위해 액세스되는 구역이 3개의 샘플들(가능한 가장 작은 비-위상 시프트 필터 지원 크기)을 초과하지 않게 한다. 제2 특성(2개의 계수들의 거듭제곱)은 필터들이 곱셈 없이 구현될 수 있게 한다. 대신에, 필터들은 일정한 값만큼의 좌측 시프트를 사용하여 구현될 수 있으며, 이는 하드웨어 설계에서 최소의 복잡성을 요구한다.

위의 특성들을 갖는 실제적인 FIR(finite impulse response) 필터들을 제안한 종래 기술은 없다. 당해 기술분야의 FIR 필터들 중 어느 것도 동일한 평활화 특성들을 제공할 수 없고, 한편으로는 본 명세서에 개시된 것들과 동일한 간단한 구현을 갖는다.

다음은, 위에서 언급된 실시예들에서 도시된 바와 같은 인코딩 방법뿐만 아니라 디코딩 방법, 그리고 이들을 사용하는 시스템의 적용들의 설명이다.

도 13은 콘텐츠 분배 서비스를 실현하기 위한 콘텐츠 공급 시스템(3100)을 도시하는 블록도이다. 이 콘텐츠 공급 시스템(3100)은 캡처 디바이스(3102), 단말 디바이스(3106)를 포함하고, 선택적으로 디스플레이(3126)를 포함한다. 캡처 디바이스(3102)는 통신 링크(3104)를 통해 단말 디바이스(3106)와 통신한다. 통신 링크는 위에서 설명된 통신 채널(13)을 포함할 수 있다. 통신 링크(3104)는 WiFi, 이더넷, 케이블, 무선(3G/4G/5G), USB, 또는 이들의 임의의 종류의 조합 등을 포함하지만 이에 제한되지 않는다.

캡처 디바이스(3102)는 데이터를 생성하고, 위의 실시예들에서 도시된 바와 같이 인코딩 방법에 의해 데이터를 인코딩할 수 있다. 대안으로, 캡처 디바이스(3102)는 데이터를 (도면들에 도시되지 않은) 스트리밍 서버에 분배할 수 있고, 서버는 데이터를 인코딩하고 인코딩된 데이터를 단말 디바이스(3106)에 전송한다. 캡처 디바이스(3102)는 카메라, 스마트폰 또는 패드, 컴퓨터 또는 랩탑, 화상 회의 시스템, PDA, 차량 탑재 디바이스, 또는 이들 중 임의의 것의 조합 등을 포함하지만, 이에 제한되는 것은 아니다. 예를 들어, 캡처 디바이스(3102)는 위에서 설명된 바와 같이 소스 디바이스(12)를 포함할 수 있다. 데이터가 비디오를 포함할 때, 캡처 디바이스(3102)에 포함된 비디오 인코더(20)는 실제로 비디오 인코딩 처리를 수행할 수 있다. 데이터가 오디오(즉, 음성)를 포함할 때, 캡처 디바이스(3102)에 포함된 오디오 인코더는 실제로 오디오 인코딩 처리를 수행할 수 있다. 일부 실제 시나리오들의 경우, 캡처 디바이스(3102)는 인코딩된 비디오 및 오디오 데이터를 함께 멀티플렉싱함으로써 이들을 분배한다. 다른 실제 시나리오들의 경우, 예를 들어 화상 회의 시스템에서, 인코딩된 오디오 데이터 및 인코딩된 비디오 데이터는 멀티플렉싱되지 않는다. 캡처 디바이스(3102)는 인코딩된 오디오 데이터 및 인코딩된 비디오 데이터를 단말 디바이스(3106)에 개별적으로 분배한다.

캡처 디바이스(3102)는 인코딩된 오디오 데이터 및 인코딩된 비디오 데이터를 단말 디바이스(3106)에 개별적으로 분배한다. 단말 디바이스(3106)는 데이터 수신 및 복원 능력을 갖는 디바이스, 이를테면 스마트폰 또는 패드(3108), 컴퓨터 또는 랩탑(3110), 네트워크 비디오 레코더(NVR: network video recorder)/디지털 비디오 레코더(DVR: digital video recorder)(3112), TV(3114), 셋톱 박스(STB: set top box)(3116), 화상 회의 시스템(3118), 비디오 감시 시스템(3120), 개인용 디지털 보조기기(PDA: personal digital assistant)(3122), 차량 탑재 디바이스(3124), 또는 이들 중 임의의 것의 조합 등일 수 있으며, 이들은 위에서 언급된 인코딩된 데이터를 디코딩할 수 있다. 예를 들어, 단말 디바이스(3106)는 위에서 설명된 바와 같은 목적지 디바이스(14)를 포함할 수 있다. 인코딩된 데이터가 비디오를 포함할 때, 단말 디바이스에 포함된 비디오 디코더(30)는 비디오 디코딩을 수행하도록 우선순위가 정해진다. 인코딩된 데이터가 오디오를 포함할 때, 단말 디바이스에 포함된 오디오 디코더는 오디오 디코딩 처리를 수행하도록 우선순위가 정해진다.

디스플레이를 갖는 단말 디바이스, 예를 들어 스마트폰 또는 패드(3108), 컴퓨터 또는 랩탑(3110), 네트워크 비디오 레코더(NVR)/디지털 비디오 레코더(DVR)(3112), TV(3114), 개인용 디지털 보조기기(PDA)(3122) 또는 차량 탑재 디바이스(3124)의 경우, 단말 디바이스는 디코딩된 데이터를 자신의 디스플레이에 공급할 수 있다. 디스플레이가 장착되지 않은 단말 디바이스, 예를 들어 STB(3116), 화상 회의 시스템(3118) 또는 비디오 감시 시스템(3120)의 경우, 외부 디스플레이(3126)가 내부에서 접촉되어, 디코딩된 데이터를 수신하고 보여준다.

이 시스템의 각각의 디바이스가 인코딩 또는 디코딩을 수행할 때, 위에서 언급된 실시예들에 도시된 것과 같은 픽처 인코딩 디바이스 또는 픽처 디코딩 디바이스가 사용될 수 있다.

도 14는 단말 디바이스(3106)의 일례의 구조를 도시하는 도면이다. 단말 디바이스(3106)가 캡처 디바이스(3102)로부터 스트림을 수신한 후에, 프로토콜 진행 유닛(3202)이 스트림의 전송 프로토콜을 분석한다. 프로토콜은 실시간 스트리밍 프로토콜(RTSP: Real Time Streaming Protocol), 하이퍼텍스트 전송 프로토콜(HTTP: Hyper Text Transfer Protocol), HTTP 라이브 스트리밍 프로토콜(HLS: HTTP Live streaming protocol), MPEG-DASH, 실시간 전송 프로토콜(RTP: Real-time Transport protocol), 실시간 메시징 프로토콜(RTMP: Real Time Messaging Protocol), 또는 이들의 임의의 종류의 조합 등을 포함하지만 이에 제한되는 것은 아니다.

프로토콜 진행 유닛(3202)이 스트림을 처리한 후에, 스트림 파일이 생성된다. 파일은 디멀티플렉싱 유닛(3204)에 출력된다. 디멀티플렉싱 유닛(3204)은 멀티플렉싱된 데이터를 인코딩된 오디오 데이터 및 인코딩된 비디오 데이터로 분리할 수 있다. 위에서 설명된 바와 같이, 일부 실제 시나리오들의 경우, 예를 들어 화상 회의 시스템에서, 인코딩된 오디오 데이터 및 인코딩된 비디오 데이터는 멀티플렉싱되지 않는다. 이러한 상황에서, 인코딩된 데이터는 디멀티플렉싱 유닛(3204)을 통하지 않고 비디오 디코더(3206) 및 오디오 디코더(3208)에 전송된다.

디멀티플렉싱 처리를 통해, 비디오 기본 스트림(ES: elementary stream), 오디오 ES, 그리고 선택적으로 자막이 생성된다. 위에서 언급된 실시예들에서 설명된 바와 같은 비디오 디코더(30)를 포함하는 비디오 디코더(3206)는, 비디오 프레임을 생성하기 위해 위에서 언급된 실시예들에서 도시된 바와 같은 디코딩 방법에 의해 비디오(ES)를 디코딩하고, 이 데이터를 동기 유닛(3212)에 공급한다. 오디오 디코더(3208)는 오디오 ES를 디코딩하여 오디오 프레임을 생성하고, 이 데이터를 동기 유닛(3212)에 피드(feed)한다. 대안으로, 비디오 프레임은 이를 동기 유닛(3212)에 피드하기 전에 (도 14에 도시되지 않은) 버퍼에 저장될 수 있다. 유사하게, 오디오 프레임은 이를 동기 유닛(3212)에 피드하기 전에 (도 14에 도시되지 않은) 버퍼에 저장될 수 있다.

동기 유닛(3212)은 비디오 프레임과 오디오 프레임을 동기화하고, 비디오/오디오를 비디오/오디오 디스플레이(3214)에 공급한다. 예를 들어, 동기 유닛(3212)은 비디오 및 오디오 정보의 프리젠테이션(presentation)을 동기화한다. 정보는 코딩된 오디오 및 시각 데이터의 프리젠테이션에 관한 타임 스탬프들 및 데이터 스트림 자체의 전달에 관한 타임 스탬프들을 사용하여 신택스로 코딩될 수 있다.

자막이 스트림에 포함된다면, 자막 디코더(3210)가 자막을 디코딩하고, 이를 비디오 프레임 및 오디오 프레임과 동기화하고, 비디오/오디오/자막을 비디오/오디오/자막 디스플레이(3216)에 공급한다.

본 발명은 위에서 언급된 시스템으로 제한되지 않으며, 위에서 언급된 실시예들에서의 픽처 인코딩 디바이스 또는 픽처 디코딩 디바이스는 다른 시스템, 예를 들어 자동차 시스템에 통합될 수 있다.

수학 연산자들

본 출원에서 사용되는 수학 연산자들은 C 프로그래밍 언어에서 사용되는 것들과 유사하다. 그러나 정수 나눗셈 및 산술 시프트 연산들의 결과들은 더 정확하게 정의되고, 추가 연산들, 이를테면 지수화 및 실수 값 나눗셈이 정의된다. 넘버링 및 카운팅 관습들은 일반적으로 0에서부터 시작하는데, 예컨대 "첫 번째"는 제0과 동등하고, "두 번째"는 제1과 동등한 식이다.

산술 연산자들

다음의 산술 연산자들은 다음과 같이 정의된다:

+ 덧셈

- (2-인수 연산자로서) 뺄셈 또는 (단항 접두사 연산자로서) 부정

* 행렬 곱을 포함하는 곱셈

x^y 지수화. x를 y의 거듭제곱으로 특정한다. 다른 맥락들에서, 그러한 표기법은 지수화로서의 해석을 위해 의도되지 않은 위첨자에 사용된다.

/ 0을 향한 결과의 절단(truncation)에 의한 정수 나눗셈. 예를 들어, 7/4 및 -7/-4은 1로 절단되고, -7/4 및 7/4은 -1로 절단된다.

÷ 절단 또는 반올림(rounding)이 의도되지 않은 수학식들에서 나눗셈을 표기하는 데 사용된다.

절단 또는 반올림이 의도되지 않은 수학식들에서 나눗셈을 표기하는 데 사용된다.

i가 x에서부터 y를 포함하여 y까지의 모든 정수 값을 취하는 f(i)의 합산.

x % y 모듈러스(modulus). x를 y로 나눈 나머지로, x >= 0 그리고 y > 0인 정수들 x 및 y에 대해서만 정의된다.

논리 연산자들

다음의 논리 연산자들은 다음과 같이 정의된다:

x && y x와 y의 불(Boolean logical) 논리 "and"

x || y x와 y의 불 논리 "or"

! 불 논리 "not"

x ? y : z x가 TRUE이거나 0이 아니라면, y의 값으로 평가되고; 그렇지 않으면, z의 값으로 평가된다.

관계 연산자들

다음의 관계 연산자들은 다음과 같이 정의된다:

> 초과

>= 이상

< 미만

<= 이하

== 같음

!= 같지 않음

"na"(적용 가능하지 않음) 값이 할당된 신택스 엘리먼트 또는 변수에 관계 연산자가 적용될 때, "na" 값은 신택스 엘리먼트 또는 변수에 대한 별개의 값으로서 취급된다. "na" 값은 임의의 다른 값과 동일하지 않은 것으로 간주된다.

비트 단위(bit-wise) 연산자들

다음의 비트 단위 연산자들이 다음과 같이 정의된다.

& 비트 단위 "and". 정수 인수들에 대해 연산할 때, 정수 값의 2의 보수 표현에 대해 연산한다. 다른 인수보다 더 적은 비트들을 포함하는 이진 인수에 대해 연산할 때, 더 짧은 인수는 0과 동일한 더 중요한 비트들을 추가함으로써 확장된다.

| 비트 단위 "or". 정수 인수들에 대해 연산할 때, 정수 값의 2의 보수 표현에 대해 연산한다. 다른 인수보다 더 적은 비트들을 포함하는 이진 인수에 대해 연산할 때, 더 짧은 인수는 0과 동일한 더 중요한 비트들을 추가함으로써 확장된다.

^ 비트 단위 "배타적 or". 정수 인수들에 대해 연산할 때, 정수 값의 2의 보수 표현에 대해 연산한다. 다른 인수보다 더 적은 비트들을 포함하는 이진 인수에 대해 연산할 때, 더 짧은 인수는 0과 동일한 더 중요한 비트들을 추가함으로써 확장된다.

x >> y y의 이진 숫자들에 의한 x의 2의 보수 정수 표현의 산술적 우측 시프트. 이 함수는 y의 음이 아닌 정수 값들에 대해서만 정의된다. 우측 시프트의 결과로서 최상위 비트(MSB: most significant bit)들로 시프트된 비트들은 시프트 연산 이전의 x의 MSB와 동일한 값을 갖는다.

x << y y의 이진 숫자들에 의한 x의 2의 보수 정수 표현의 산술적 좌측 시프트. 이 함수는 y의 음이 아닌 정수 값들에 대해서만 정의된다. 좌측 시프트의 결과로서 최하위 비트(LSB: least significant bit)들로 시프트된 비트들은 0과 동일한 값을 갖는다.

할당 연산자들

다음의 산술 연산자들은 다음과 같이 정의된다:

= 할당 연산자

++ 증분, 즉 x++는 x = x + 1과 동등하고; 배열 인덱스에서 사용될 때, 증분 연산 전에 변수의 값으로 평가된다.

-- 감소, 즉, x--는 x = x - 1과 동등하고; 배열 인덱스에서 사용될 때, 감소 연산 전에 변수의 값으로 평가된다.

+= 지정된 양만큼의 증분, 즉 x += 3은 x = x + 3과 동일하고, x += (-3)은 x = x + (-3)과 동등하다.

-= 지정된 양만큼의 감소, 즉 x -= 3은 x = x - 3과 동등하고, x -= (-3)은 x = x - (-3)와 동등하다.

범위 표기법

다음 표기법은 값들의 범위를 특정하는 데 사용된다:

x = y..z x는 y에서 z까지의 정수 값들을 취하며, x, y 및 z는 정수들이고 z는 y보다 크다.

수학 함수들

다음의 수학 함수들이 정의된다:

Asin( x ) -1.0 내지 1.0의 범위에 있는 인수 x에 대해 동작하는 역 삼각 사인 함수(trigonometric inverse sine function), 출력 값은 라디안 단위의 -π÷2부터 π÷2까지의 범위 이내임

Atan( x ) 인수 x에 대해 동작하는 역 삼각 탄젠트 함수(trigonometric inverse tangent function), 출력 값은 라디안 단위의 -π÷2부터 π÷2까지의 범위 이내임

Ceil( x ) x보다 크거나 같은 최소 정수.

Clip1_Y( x ) = Clip3( 0, ( 1 << BitDepth_Y ) - 1, x )

Clip1_C( x ) = Clip3( 0, ( 1 << BitDepth_C ) - 1, x )

Cos( x ) 라디안 단위의 인수 x에 대해 동작하는 삼각 코사인 함수(trigonometric cosine function).

Floor( x ) x보다 작거나 같은 가장 큰 정수.

Ln( x ) x의 자연 로그(밑수가 e인 로그, e는 자연 로그 밑 상수 2.718 281 828…).

Log2( x ) x의 밑이 2인 로그.

Log10( x ) x의 밑이 10인 로그.

Round( x ) = Sign( x ) * Floor( Abs( x ) + 0.5 )

Sin( x ) 라디안 단위의 인수 x에 대해 동작하는 삼각 사인 함수

Sqrt( x ) =

Swap( x, y ) = ( y, x )

Tan( x ) 라디안 단위의 인수 x에 대해 동작하는 삼각 탄젠트 함수

연산 우선순위

괄호의 사용에 의해 식의 우선순위가 명시적으로 지시되지 않을 때, 다음의 규칙들이 적용된다:

- 더 낮은 우선순위의 임의의 연산 전에 더 높은 우선순위의 연산들이 평가된다.

- 동일한 우선순위의 연산들이 좌측에서 우측으로 순차적으로 평가된다.

아래의 표는 가장 높은 것에서부터 가장 낮은 것까지 연산들의 우선순위를 특정하며; 표에서 더 높은 포지션은 더 높은 우선순위를 지시한다.

C 프로그래밍 언어에서 또한 사용되는 그러한 연산자들의 경우, 본 명세서에서 사용되는 우선순위는 C 프로그래밍 언어에서 사용되는 것과 동일하다.

표: (표의 최상부에서의) 가장 높은 것에서부터 (표의 최하부에서의) 가장 낮은 것까지의 연산 우선순위

연산(피연산자들 x, y 및 z 사용)

"x++", "x--"

"!x", "-x"(단항 접두사 연산자로서)

x^y

"x * y", "x / y", "x ÷ y",

, "x % y"

"x + y", "x - y"(2-인수 연산자로서),

"x << y", "x >> y"

"x < y", "x <= y", "x > y", "x >= y"

"x == y", "x != y"

"x & y"

"x | y"

"x && y"

"x || y"

"x ? y : z"

"x..y"

"x = y", "x += y", "x -= y"

논리 연산들의 텍스트 설명

텍스트에서, 다음의 형태로 수학적으로 설명될 논리 연산들의 명령문이:

if( 조건 0 )

명령문 0

else if( 조건 1 )

명령문 1

…

else /* 나머지 조건에 대한 유용한 언급 */

명령문 n

다음의 방식으로 설명될 수 있다:

… 다음과 같다 / … 다음이 적용된다:

- 조건 0이라면, 명령문 0

- 그렇지 않으면, 조건 1이라면, 명령문 1

- …

- 그렇지 않으면(나머지 조건에 대한 유용한 언급), 명령문 n

텍스트에서 각각 "…라면. 그렇지 않으면, …라면. 그렇지 않으면, …" 명령문이 "… 다음과 같다" 또는 "… 다음이 적용된다"에 도입되며, 바로 다음에 "…라면"이 뒤따른다. "…라면. 그렇지 않으면, …라면. 그렇지 않으면, …"의 마지막 조건은 항상 "그렇지 않으면, …"이다. 인터리빙된 "…라면. 그렇지 않으면, …라면. 그렇지 않으면, …" 명령문들은 "… 다음과 같다" 또는 "… 다음이 적용된다"를 마지막 "그렇지 않으면, …"과 매칭시킴으로써 식별될 수 있다.

if( 조건 0a && 조건 0b )

명령문 0

else if( 조건 1a || 조건 1b )

명령문 1

…

else

명령문 n

다음의 방식으로 설명될 수 있다:

… 다음과 같다 / … 다음이 적용된다:

- 다음 조건들 모두가 참이라면, 명령문 0:

- 조건 0a

- 조건 0b

- 그렇지 않으면, 다음 조건들 중 하나 이상이 참이라면, 명령문 1:

- 조건 1a

- 조건 1b

- …

- 그렇지 않으면, 명령문 n

if( 조건 0 )

명령문 0

if( 조건 1 )

명령문 1

다음의 방식으로 설명될 수 있다:

조건 0일 때, 명령문 0

조건 1일 때, 명령문 1.

본 명세서에 개시된 실시예들은 주로 비디오 코딩에 기반하여 설명되었지만, 코딩 시스템(10), 인코더(20) 및 디코더(30)(및 대응하는 시스템(10)) 및 본 명세서에서 설명된 다른 실시예들이 또한 정지 화상 처리 또는 코딩, 즉, 비디오 코딩에서와 같이 임의의 선행 또는 연속 픽처와 독립적인 개별 픽처의 처리 또는 코딩을 위해 구성될 수 있다는 점이 주목되어야 한다. 일반적으로, 픽처 처리 코딩이 단일 픽처(17)로 제한되는 경우에는 인터 예측 유닛들(244(인코더), 344(디코더))만이 이용 가능하지 않을 수 있다. 비디오 인코더(20) 및 비디오 디코더(30)의 (도구들 또는 기술들로도 또한 지칭되는) 모든 다른 기능들은 정지 화상 처리, 예컨대 잔차 계산(204/304), 변환(206), 양자화(208), 역양자화(210/310), (역) 변환(212/312), 파티셔닝(262/362), 인트라 예측(254/354) 및/또는 루프 필터링(220, 320), 및 엔트로피 코딩(270) 및 엔트로피 디코딩(304)을 위해 동일하게 사용될 수 있다.

예컨대, 인코더(20) 및 디코더(30)의 실시예들, 및 예컨대, 인코더(20) 및 디코더(30)를 참조하여 본 명세서에서 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수 있다. 소프트웨어로 구현된다면, 기능들은 컴퓨터 판독 가능 매체 상에 저장되거나, 하나 이상의 명령들 또는 코드로서 통신 매체를 통해 전송되어 하드웨어 기반 처리 유닛에 의해 실행될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터 판독 가능 저장 매체를 포함할 수 있으며, 이는 데이터 저장 매체와 같은 유형 매체, 또는 예컨대, 통신 프로토콜에 따라 한 장소에서 다른 장소로 컴퓨터 프로그램의 전달을 가능하게 하는 임의의 매체를 포함하는 통신 매체에 대응한다. 이런 식으로, 컴퓨터 판독 가능 매체는 일반적으로 (1) 비-일시적인 유형의 컴퓨터 판독 가능 저장 매체 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수 있다. 데이터 저장 매체는 본 개시내용에서 설명된 기술들의 구현을 위한 명령들, 코드 및/또는 데이터 구조들을 리트리브하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용 가능한 매체일 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독 가능 매체를 포함할 수 있다.

한정이 아닌 예시로, 이러한 컴퓨터 판독 가능 저장 매체는 RAM, ROM, EEPROM, CD-ROM이나 다른 광 디스크 저장소, 자기 디스크 저장소 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 명령들이나 데이터 구조들의 형태로 원하는 프로그램 코드를 저장하는 데 사용될 수 있으며 컴퓨터에 의해 액세스 가능한 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속이 컴퓨터 판독 가능 매체로 적절히 지칭된다. 예를 들어, 명령들이 동축 케이블, 광섬유 케이블, 꼬임 쌍선, 디지털 가입자 회선(DSL: digital subscriber line), 또는 적외선, 라디오 및 마이크로파와 같은 무선 기술들을 이용하여 웹사이트, 서버 또는 다른 원격 소스로부터 송신된다면, 동축 케이블, 광섬유 케이블, 꼬임 쌍선, DSL, 또는 적외선, 라디오 및 마이크로파와 같은 무선 기술들이 매체의 정의에 포함된다. 그러나 컴퓨터 판독 가능 저장 매체 및 데이터 저장 매체는 접속들, 반송파들, 신호들 또는 다른 일시적인 매체를 포함하는 것이 아니라, 대신 비-일시적인 유형의 저장 매체에 관련된다고 이해되어야 한다. 본 명세서에서 사용된 것과 같은 디스크(disk 및 disc)는 콤팩트 디스크(CD: compact disc), 레이저 디스크(laser disc), 광 디스크(optical disc), 디지털 다기능 디스크(DVD: digital versatile disc), 플로피 디스크(floppy disk) 및 블루레이 디스크(Blu-ray disc)를 포함하며, 여기서 디스크(disk)들은 보통 데이터를 자기적으로 재생하는 한편, 디스크(disc)들은 데이터를 레이저들에 의해 광학적으로 재생한다. 상기의 것들의 조합들이 또한 컴퓨터 판독 가능 매체의 범위 내에 포함되어야 한다.

명령들은 하나 이상의 프로세서들, 이를테면 하나 이상의 디지털 신호 프로세서(DSP)들, 범용 마이크로프로세서들, 주문형 집적 회로(ASIC)들, 필드 프로그래밍 가능 로직 어레이(FPGA)들 또는 다른 대등한 집적 또는 이산 로직 회로에 의해 실행될 수 있다. 이에 따라, 본 명세서에서 사용되는 "프로세서"라는 용어는 앞서 말한 구조 또는 본 명세서에서 설명되는 기술들의 구현에 적합한 임의의 다른 구조 중 임의의 구조를 의미할 수 있다. 또한, 일부 양상들에서, 본 명세서에서 설명되는 기능은 인코딩 및 디코딩을 위해 구성된 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공될 수 있거나, 결합된 코덱으로 통합될 수 있다. 또한, 이 기술들은 하나 이상의 회로들 또는 로직 엘리먼트들로 완전히 구현될 수 있다.

본 개시내용의 기술들은 무선 핸드셋, 집적 회로(IC: integrated circuit) 또는 IC들의 세트(예컨대, 칩셋)를 포함하는 매우 다양한 디바이스들 또는 장치들에서 구현될 수 있다. 개시된 기술들을 수행하도록 구성된 디바이스들의 기능적 양상들을 강조하기 위해 본 개시내용에서는 다양한 컴포넌트들, 모듈들 또는 유닛들이 설명되지만, 이들이 반드시 서로 다른 하드웨어 유닛들에 의한 실현을 필요로 하는 것은 아니다. 그보다는, 앞서 설명한 바와 같이, 다양한 유닛들이 코덱 하드웨어 유닛으로 결합되거나, 적절한 소프트웨어 및/또는 펌웨어와 함께, 앞서 설명한 바와 같은 하나 이상의 프로세서들을 포함하는 상호 작용 하드웨어 유닛들의 집합에 의해 제공될 수 있다.

Claims

선형 모델을 사용하여 인트라(intra) 예측을 수행하기 위한 방법으로서,
크로마 포맷(chroma format) 정보에 기초하여 한 세트의 다운샘플링 필터(down-sampling filter)들을 결정하는 단계 ― 상기 크로마 포맷 정보는 현재 블록이 속하는 픽처(picture)의 크로마 포맷을 지시함 ―;
상기 한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 상기 현재 블록의 루마(luma) 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 상기 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하는 단계;
상기 다운샘플링된 루마 참조 샘플들 및 상기 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하는 단계; 및
상기 선형 모델 계수들 및 상기 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 상기 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하는 단계를 포함하는,
방법.
제1항에 있어서,
상기 크로마 포맷 정보에 기초하여 한 세트의 다운샘플링 필터들을 결정하는 단계는:
상기 크로마 포맷 정보에 기초하여 수평 방향 및 수직 방향에서의 서브샘플링(subsampling) 비율 정보를 결정하는 단계; 및
상기 서브샘플링 비율 정보에 기초하여 상기 한 세트의 다운샘플링 필터들을 결정하는 단계
를 포함하는, 방법.
제1항에 있어서,
상기 크로마 포맷이 4:2:0 크로마 포맷인 경우, 제1 세트의 다운샘플링 필터들이 상기 현재 블록의 루마 블록에 사용되거나;
상기 크로마 포맷이 4:2:2 크로마 포맷인 경우, 제2 세트의 다운샘플링 필터들이 상기 현재 블록의 루마 블록에 사용되거나; 또는
상기 크로마 포맷이 4:4:4 크로마 포맷인 경우, 상기 제3 세트의 다운샘플링 필터들이 상기 현재 블록의 루마 블록에 사용되는,
방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅(co-locate)될 때,
상기 한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 상기 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 상기 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하는 단계는:
제1 세트의 재구성된 루마 샘플들에 제1 다운샘플링 필터를 적용함으로써 상기 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하는 단계 ― 상기 제1 세트의 재구성된 루마 샘플들은: 상기 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 및
제2 세트의 재구성된 루마 샘플들에 상기 제1 다운샘플링 필터를 적용함으로써 적어도 하나의 선택된 참조 루마 샘플들의 다운샘플링된 루마 참조 샘플을 획득하는 단계
를 포함하며,
상기 제2 세트의 재구성된 루마 샘플들은, 상기 선택된 참조 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;
상기 제1 다운샘플링 필터는 상기 한 세트의 다운샘플링 필터들로부터 선택되는,
방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되지 않을 때,
상기 한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 상기 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 상기 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하는 단계는:
제3 세트의 재구성된 루마 샘플들에 제2 다운샘플링 필터를 적용함으로써 상기 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하는 단계 ― 상기 제3 세트의 재구성된 루마 샘플들은: 상기 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 및
제4 세트의 재구성된 루마 샘플들에 상기 제2 다운샘플링 필터들을 적용함으로써 적어도 하나의 선택된 참조 루마 샘플의 다운샘플링된 루마 참조 샘플을 획득하는 단계
를 포함하며,
상기 제4 세트의 재구성된 루마 샘플들은, 상기 선택된 참조 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;
상기 제2 다운샘플링 필터는 상기 한 세트의 다운샘플링 필터들로부터 선택되는,
방법.
제4항에 있어서,
상기 서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되는 것은, 상기 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:
- 크로마 샘플 타입 2, 또는
- 크로마 샘플 타입 4
중 임의의 타입을 포함할 때 발생하는,
방법.
제5항에 있어서,
상기 서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되는 것은, 상기 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:
- 크로마 샘플 타입 0,
- 크로마 샘플 타입 1,
- 크로마 샘플 타입 3, 또는
- 크로마 샘플 타입 5
중 임의의 타입을 포함할 때 발생하는,
방법.
제1항 내지 제7항 중 어느 한 항에 있어서,
상기 한 세트의 다운샘플링 필터들은, 상기 크로마 포맷을 포함하는 적어도 하나의 조건이 4:4:4 크로마 포맷인 것이 충족된다면 바이패스(bypass) 필터를 포함하거나; 또는
상기 한 세트의 다운샘플링 필터들은, 상기 크로마 포맷을 포함하는 적어도 하나의 조건이 4:2:0 크로마 포맷인 것이 충족된다면 한 세트의 필터들 { F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1
F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,
F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,
F2[0] = 1, F2[1] = 1; 또는,
상기 한 세트의 다운샘플링 필터들은: 상기 크로마 포맷을 포함하는 적어도 하나의 조건이 4:2:2 크로마 포맷인 것이 충족된다면 한 세트의 필터들 { F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0
F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,
F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,
F2[0] = 2, F2[1] = 0인,
방법.
제2항 내지 제7항 중 어느 한 항에 있어서,
수평 방향 및 수직 방향으로의 상기 서브샘플링 비율 정보는 각각 SubWidthC 및 SubHeightC 변수들의 값들로 표현되고; 그리고
상기 한 세트의 다운샘플링 필터들은: SubWidthC==2 그리고 SubHeightC==2를 포함하는 적어도 하나의 조건이 충족된다면 한 세트의 필터들 {F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1
F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,
F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,
F2[0] = 1, F2[1] = 1이고,
상기 한 세트의 다운샘플링 필터들은: SubWidthC==2 그리고 SubHeightC==1을 포함하는 적어도 하나의 조건이 충족된다면 한 세트의 필터들 {F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0
F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,
F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,
F2[0] = 2, F2[1] = 0인,
방법.
제1항 내지 제9항 중 어느 한 항에 있어서,
상기 선택된 루마 참조 샘플들은:
상기 루마 블록 위에 있고 L개의 이용 가능한 크로마 참조 샘플들에 기초하여 선택되는 이웃 루마 샘플들, 또는
상기 루마 블록 좌측에 있고 L개의 이용 가능한 크로마 참조 샘플들에 기초하여 선택되는 이웃 루마 샘플들 중 적어도 하나를 포함하는,
방법.
제10항에 있어서,
상기 이용 가능한 크로마 참조 샘플들의 포지션들은:
LM 모드가 적용되며 위와 좌측 이웃 샘플들 모두가 이용 가능할 때는 S[W'/4, -1], S[3W'/4, -1], S[-1, H'/4], S[-1, 3H'/4]로;
LM-A 모드가 적용되거나 위의 이웃 샘플들만이 이용 가능할 때는 S[W'/8, -1], S[3W'/8, -1], S[5W'/8, -1], S[7W'/8, -1]로; 또는
LM-L 모드가 적용되거나 좌측 이웃 샘플들만이 이용 가능할 때는 S[-1, H'/8], S[-1, 3H'/8], S[-1, 5H'/8], S[-1, 7H'/8]로
특정되며;
크로마 블록 치수들은 W×H이고, W' 및 H'는,
상기 LM 모드가 적용될 때는 W'=W, H'=H로;
상기 LM-A 모드가 적용될 때는 W'=W+H로;
상기 LM-L 모드가 적용될 때는 H'=H+W로
설정되는,
방법.
제1항 내지 제11항 중 어느 한 항에 있어서,
상기 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들 및 상기 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하는 단계는:
상기 다운샘플링된 루마 참조 샘플들에 기초하여 최대 루마 값 및 최소 루마 값을 결정하는 단계;
상기 최대 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제1 크로마 값을 획득하는 단계;
상기 최소 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제2 크로마 값을 획득하는 단계;
상기 제1 크로마 값, 상기 제2 크로마 값, 상기 최대 루마 값 및 상기 최소 루마 값에 기초하여 상기 하나 이상의 선형 모델 계수들을 계산하는 단계를 포함하는,
방법.
선형 모델을 사용한 인트라 예측을 위한 장치로서,
크로마 포맷 정보에 기초하여 한 세트의 다운샘플링 필터들을 결정하도록 구성된 결정 유닛 ― 상기 크로마 포맷 정보는 현재 블록이 속하는 픽처의 크로마 포맷을 지시함 ―;
상기 한 세트의 다운샘플링 필터들 중 개개의 다운샘플링 필터들을 사용하여 상기 현재 블록의 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들 및 상기 루마 블록의 선택된 루마 참조 샘플들의 다운샘플링된 루마 참조 샘플들을 획득하도록 구성된 필터링 유닛;
상기 다운샘플링된 루마 참조 샘플들 및 상기 다운샘플링된 루마 참조 샘플들에 대응하는 크로마 참조 샘플들에 기초하여 하나 이상의 선형 모델 계수들을 결정하도록 구성된 선형 모델 도출 유닛; 및
상기 선형 모델 계수들 및 상기 루마 블록 내의 재구성된 루마 샘플들의 다운샘플링된 루마 샘플들에 기초하여 상기 루마 블록에 대응하는 크로마 블록의 예측 샘플들을 획득하도록 구성된 예측 처리 유닛
을 포함하는 장치.
제13항에 있어서,
상기 결정 유닛은:
상기 크로마 포맷 정보에 기초하여 수평 방향 및 수직 방향에서의 서브샘플링 비율 정보를 결정하고; 그리고
상기 서브샘플링 비율 정보에 기초하여 상기 한 세트의 다운샘플링 필터들을 결정하도록 구성되는,
장치.
제13항에 있어서,
상기 크로마 포맷이 4:2:0 크로마 포맷인 경우, 제1 세트의 다운샘플링 필터들이 상기 현재 블록의 루마 블록에 사용되거나;
상기 크로마 포맷이 4:2:2 크로마 포맷인 경우, 제2 세트의 다운샘플링 필터들이 상기 현재 블록의 루마 블록에 사용되거나; 또는
상기 크로마 포맷이 4:4:4 크로마 포맷인 경우, 상기 제3 세트의 다운샘플링 필터들이 상기 현재 블록의 루마 블록에 사용되는,
장치.
제13항 내지 제15항 중 어느 한 항에 있어서,
서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅될 때,
상기 필터링 유닛은: 제1 세트의 재구성된 루마 샘플들에 제1 다운샘플링 필터를 적용함으로써 상기 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하고 ― 상기 제1 세트의 재구성된 루마 샘플들은: 상기 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 그리고
제2 세트의 재구성된 루마 샘플들에 상기 제1 다운샘플링 필터를 적용함으로써 적어도 하나의 선택된 참조 루마 샘플들의 다운샘플링된 루마 참조 샘플을 획득하도록 구성되며,
상기 제2 세트의 재구성된 루마 샘플들은: 상기 선택된 참조 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고;
상기 제1 다운샘플링 필터는 상기 한 세트의 다운샘플링 필터들로부터 선택되는,
장치.
제13항 내지 제15항 중 어느 한 항에 있어서,
서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되지 않을 때,
상기 필터링 유닛은: 제3 세트의 재구성된 루마 샘플들에 제2 다운샘플링 필터를 적용함으로써 상기 루마 블록에서 재구성된 루마 샘플의 다운샘플링된 루마 샘플을 획득하고 ― 상기 제3 세트의 재구성된 루마 샘플들은: 상기 재구성된 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함함 ―; 그리고
제4 세트의 재구성된 루마 샘플들에 상기 제2 다운샘플링 필터들을 적용함으로써 적어도 하나의 선택된 참조 루마 샘플의 다운샘플링된 루마 참조 샘플을 획득하도록 구성되며,
상기 제4 세트의 재구성된 루마 샘플들은: 상기 선택된 참조 루마 샘플의 포지션에 수평으로 그리고/또는 수직으로 인접한 포지션들에 재구성된 루마 샘플들을 포함하고,
상기 제2 다운샘플링 필터는 상기 한 세트의 다운샘플링 필터들로부터 선택되는,
장치.
제16항에 있어서,
상기 서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되는 것은, 상기 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:
- 크로마 샘플 타입 2, 또는
- 크로마 샘플 타입 4
중 임의의 타입을 포함할 때 발생하는,
장치.
제17항에 있어서,
상기 서브샘플링된 크로마 샘플이 상기 현재 블록 내에서 대응하는 루마 샘플과 콜로케이팅되는 것은, 상기 서브샘플링된 크로마 샘플의 크로마 샘플 타입이:
- 크로마 샘플 타입 0,
- 크로마 샘플 타입 1,
- 크로마 샘플 타입 3, 또는
- 크로마 샘플 타입 5
중 임의의 타입을 포함할 때 발생하는,
장치.
제13항 내지 제19항 중 어느 한 항에 있어서,
상기 결정 유닛은 한 세트의 다운샘플링 필터들을 결정하도록 구성되고,
상기 한 세트의 다운샘플링 필터들은: 상기 크로마 포맷을 포함하는 적어도 하나의 조건이 4:4:4 크로마 포맷인 것이 충족된다면 바이패스 필터를 포함하거나; 또는
상기 한 세트의 다운샘플링 필터들은: 상기 크로마 포맷을 포함하는 적어도 하나의 조건이 4:2:0 크로마 포맷인 것이 충족된다면 한 세트의 필터들 { F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1
F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,
F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,
F2[0] = 1, F2[1] = 1; 또는,
상기 한 세트의 다운샘플링 필터들은: 상기 크로마 포맷을 포함하는 적어도 하나의 조건이 4:2:2 크로마 포맷인 것이 충족된다면 한 세트의 필터들 { F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0
F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,
F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,
F2[0] = 2, F2[1] = 0인,
장치.
제14항 내지 제19항 중 어느 한 항에 있어서,
수평 방향 및 수직 방향으로의 상기 서브샘플링 비율 정보는 각각 SubWidthC 및 SubHeightC 변수들의 값들로 표현되고; 그리고
상기 결정 유닛은 상기 한 세트의 다운샘플링 필터들을 결정하도록 구성되며:
상기 한 세트의 다운샘플링 필터들은: SubWidthC==2 그리고 SubHeightC==2를 포함하는 적어도 하나의 조건이 충족된다면 한 세트의 필터들 {F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 1, F5[1][1] = 4, F5[2][1] = 1, F5[1][0] = 1, F5[1][2] = 1
F6[0][1] = 1, F6[1][1] = 2, F6[2][1] = 1,
F6[0][2] = 1, F6[1][2] = 2, F6[2][2] = 1,
F2[0] = 1, F2[1] = 1이고,
상기 한 세트의 다운샘플링 필터들은: SubWidthC==2 그리고 SubHeightC==1을 포함하는 적어도 하나의 조건이 충족된다면 한 세트의 필터들 {F2, F3, F5, F6}을 포함하며,
F3[0] = 1, F3[1] = 2, F3[2] = 1
F5[ i ][ j ] = F6[ i ][ j ] = 0, i = 0..2, j = 0..2
F5[0][1] = 0, F5[1][1] = 8, F5[2][1] = 0, F5[1][0] = 0, F5[1][2] = 0
F6[0][1] = 2, F6[1][1] = 4, F6[2][1] = 2,
F6[0][2] = 0, F6[1][2] = 0, F6[2][2] = 0,
F2[0] = 2, F2[1] = 0인,
장치.
제13항 내지 제21항 중 어느 한 항에 있어서,
상기 선택된 루마 참조 샘플들은:
상기 루마 블록 위에 있고 L개의 이용 가능한 크로마 참조 샘플들에 기초하여 선택되는 이웃 루마 샘플들, 또는
상기 루마 블록 좌측에 있고 L개의 이용 가능한 크로마 참조 샘플들에 기초하여 선택되는 이웃 루마 샘플들 중 적어도 하나를 포함하는,
장치.
제22항에 있어서,
상기 이용 가능한 크로마 참조 샘플들의 포지션들은:
LM 모드가 적용되며 위와 좌측 이웃 크로마 샘플들 모두가 이용 가능할 때는 S[W'/4, -1], S[3W'/4, -1], S[-1, H'/4], S[-1, 3H'/4]로;
LM-A 모드가 적용되거나 위의 이웃 크로마 샘플들만이 이용 가능할 때는 S[W'/8, -1], S[3W'/8, -1], S[5W'/8, -1], S[7W'/8, -1]로; 또는
LM-L 모드가 적용되거나 좌측 이웃 크로마 샘플들만이 이용 가능할 때는 S[-1, H'/8], S[-1, 3H'/8], S[-1, 5H'/8], S[-1, 7H'/8]로
특정되며;
크로마 블록 치수들은 W×H이고, W' 및 H'는,
상기 LM 모드가 적용될 때는 W'=W, H'=H로;
상기 LM-A 모드가 적용될 때는 W'=W+H로;
상기 LM-L 모드가 적용될 때는 H'=H+W로
설정되는,
장치.
제13항 내지 제23항 중 어느 한 항에 있어서,
상기 선형 모델 도출 유닛은, 상기 다운샘플링된 루마 참조 샘플들에 기초하여 최대 루마 값 및 최소 루마 값을 결정하고; 상기 최대 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제1 크로마 값을 획득하고; 상기 최소 루마 값과 연관된 하나 이상의 다운샘플링된 루마 참조 샘플들의 하나 이상의 포지션들에 적어도 부분적으로 기초하여 제2 크로마 값을 획득하고; 그리고 상기 제1 크로마 값, 상기 제2 크로마 값, 상기 최대 루마 값 및 상기 최소 루마 값에 기초하여 상기 하나 이상의 선형 모델 계수들을 계산하도록 구성되는,
장치.
제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하기 위한 처리 회로를 포함하는 인코더(20).
제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하기 위한 처리 회로를 포함하는 디코더(30).
제1항 내지 제12항 중 어느 한 항에 따른 방법을 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램 제품.
컴퓨터 디바이스에 의해 실행될 때, 상기 컴퓨터 디바이스로 하여금 제1항 내지 제12항 중 어느 한 항의 방법을 수행하게 하는 프로그램 코드를 전달하는,
비-일시적 컴퓨터 판독 가능 매체.
디코더로서,
하나 이상의 프로세서들; 및
상기 프로세서들에 결합되며 상기 프로세서들에 의한 실행을 위한 프로그래밍을 저장하는 비-일시적 컴퓨터 판독 가능 저장 매체를 포함하며,
상기 프로그래밍은 상기 프로세서들에 의해 실행될 때, 제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하도록 상기 디코더를 구성하는,
디코더.
인코더로서,
하나 이상의 프로세서들; 및
상기 프로세서들에 결합되며 상기 프로세서들에 의한 실행을 위한 프로그래밍을 저장하는 비-일시적 컴퓨터 판독 가능 저장 매체를 포함하며,
상기 프로그래밍은 상기 프로세서들에 의해 실행될 때, 제1항 내지 제12항 중 어느 한 항에 따른 방법을 실행하도록 상기 인코더를 구성하는,
인코더.