KR102578075B1 - 역 양자화 장치 및 방법 - Google Patents
역 양자화 장치 및 방법 Download PDFInfo
- Publication number
- KR102578075B1 KR102578075B1 KR1020217007947A KR20217007947A KR102578075B1 KR 102578075 B1 KR102578075 B1 KR 102578075B1 KR 1020217007947 A KR1020217007947 A KR 1020217007947A KR 20217007947 A KR20217007947 A KR 20217007947A KR 102578075 B1 KR102578075 B1 KR 102578075B1
- Authority
- KR
- South Korea
- Prior art keywords
- block
- value
- values
- chrominance
- current block
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
픽처의 현재 블록의 역 양자화 방법이 제공된다. 상기 방법은: 디코더에 의해 수행되고, 상기 픽처는 휘도 성분과 색차 성분을 포함하고, 상기 휘도 성분 및 상기 색차 성분은 다중 블록으로 분할된다. 상기 방법은: 비트스트림으로부터 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하는 단계 - 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록과 관련됨 - ; 상기 하나 이상의 기존 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계; 상기 결정된 QP 값을 사용하여 상기 색차 성분의 현재 블록에 대해 역 양자화를 수행하는 단계를 포함한다.
Description
본 개시는 이미지 및/또는 비디오 디코딩 기술 분야에 관한 것이며, 특히 역 양자화 장치 및 방법에 관한 것이다.
디지털 비디오 통신 및 저장 애플리케이션은 다양한 디지털 장치, 예를 들어, 디지털 카메라, 셀룰러 라디오 전화, 랩톱, 방송 시스템, 화상 회의 시스템 등에 의해 구현된다. 이러한 애플리케이션에서 가장 중요하고 까다로운 작업 중 하나는 비디오 압축이다. 비디오 압축 작업은 복잡하며 두 가지 상반되는 파라미터: 압축 효율성과 계산 복잡성에 의해 제한된다. ITU-T H.264/AVC 또는 ITU-T H.265/HEVC와 같은 비디오 코딩 표준은 이러한 파라미터 간에 적절한 균형을 제공한다. 이러한 이유로 비디오 코딩 표준의 지원은 거의 모든 비디오 압축 애플리케이션의 필수 요구 사항이다.
인터 예측, 인트라 예측 및 루프 필터와 같은 비디오 압축 기술은 효과적인 것으로 입증되어 H.264/AVC 및 H.265/HEVC와 같은 다양한 비디오 코딩 표준에 채택되었다.
비디오 압축의 기본 처리 유닛은 일반적으로 픽처의 일부인 매크로 블록이라고 하며 크기는 예를 들어 16x16 또는 64x64 픽셀이다. 최신 비디오 코딩 표준에서는 코딩 트리 유닛(Coding Tree Unit, CTU)이라고 하는 H.265/HEVC가 기본 처리 유닛으로 사용된다. CTU는 최대 코딩 단위(largest coding unit, LCU)라고도 한다. H.265/HEVC에서 CTU는 루마 CTB 1 개와 크로마 CTB 2 개로 구성되어 휘도 및 색차 비디오 신호 부분 Y, Cb, Cr 성분을 나타낸다. CTU는 픽처의 왼쪽 상단에서 오른쪽 하단 모서리까지 스캔 순서대로 하나씩 처리된다. 각 CTU는 예를 들어, 쿼드 트리 분할을 사용하여 더 작은 코딩 단위(CU)로 더 나눌 수 있다. 각 CU는 더 작은 CU 또는 예측 단위(PU)로 더 분할될 수 있다. PU는 PU의 픽셀에 적용되는 처리 유형에 따라 인트라 또는 인터 예측될 수 있다. 인터 예측의 경우 PU는 PU에 대해 지정된 모션 벡터를 사용하여 모션 보상에 의해 처리되는 픽셀 영역을 나타낸다. 인트라 예측에 있어서, 인접 블록의 인접 픽셀은 현재 블록을 예측하기 위한 참조 샘플로 사용된다. PU는 이 PU에 포함된 모든 변환 단위(TU)에 대한 인트라 예측 모드 세트에서 선택되는 예측 모드를 지정한다. TU는 다양한 크기(예를 들어, 4x4, 8x8, 16x16 및 32x32 픽셀)를 가질 수 있으며 다양한 방식으로 처리될 수 있다. TU의 경우 변환 코딩이 수행되며, 즉 예측 오류는 이산 코사인 변환 또는 이산 사인 변환(HEVC/H.265 표준에서는 인트라 코딩된 블록에 적용된다)으로 변환되고 양자화된다. 따라서 재구성된 픽셀에는 DBF, SAO 및 ALF와 같은 인-루프 필터(in-loop filter)가 억제하려고 하는 양자화 노이즈가 포함된다(예를 들어, 단위 사이의 막힘, 날카로운 에지와 함께 링잉 아티팩트 등으로 명백해질 수 있다). 정교한 예측 코딩(예를 들어, 모션 보상 및 인트라 예측) 및 분할 기술(예를 들어, CU 및 PU에 대한 QT, HEVC/H.265 표준의 TU에 대한 RQT 및 버전 BMS-1.0 및 VTM-1.0부터 시작되는 VVC 참조 소프트웨어에 대한 다중 트리(MT))의 사용은 PU에서의 중복성을 크게 줄일 수 있다. QT와 MT 분할 메커니즘의 근본적인 차이점은 후자의 경우에도 이진 및 트리플 트리 기반 분할을 사용하여 직사각형 블록을 허용하고 쿼드 트리 접근 방식을 사용하여 정사각형 블록을 허용한다는 것이다. 비디오 생성 및 사용이 점점 더 보편화됨에 따라 비디오 트래픽은 통신 네트워크에 대한 가장 큰 부하이며 데이터 스토리지 요구를 증가시키는 동인이다. 따라서, 대부분의 비디오 코딩 표준의 목표 중 하나는 화질 저하없이 이전 버전에 비해 코딩 복잡성을 낮추는 것이다.
본 출원의 실시예는 독립항에 따른 인코딩 및 디코딩을 위한 장치 및 방법을 제공한다.
전술한 목적 및 다른 목적은 독립 청구항의 주제에 의해 달성된다. 추가 구현 형태는 종속 청구항, 설명 및 도면으로부터 명백하다.
특정 실시예는 첨부된 독립 청구항에 설명되어 있으며, 다른 실시예는 종속 청구항에 나와 있다.
경계 분할을 위한 장치 및 방법이 개시된다. 장치 및 방법은 코딩 복잡도를 감소시키기 위해 특정 경계 파티션 처리를 사용한다. 경계 분할 처리는 픽처 또는 이미지 경계 핸들링이라고도 한다.
본 발명의 제1 관점에 따르면, 픽처의 현재 블록의 역 양자화 방법이 제공된다. 픽처는 휘도 성분과 색차 성분을 포함하고, 휘도 성분과 색차 성분은 별도의 파티션 트리에 의해 여러 블록(예를 들어, 코딩 단위, CU)으로 분할된다. 이 방법은 디코더가 (예를 들어, 수신된) 비트스트림으로부터 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하는 것과, 여기서 하나 이상의 기존 QP 값은 색차 성분의 현재 블록(즉, 처리 중인 블록)과 관련되며, 하나 이상의 기존 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 것과, 결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 역 양자화를 수행하는 것을 포함한다.
비디오 이미지는 휘도(루미넌스 또는 루마) 성분 및 색차(크로미넌스 또는 크로마) 성분으로 나눌 수 있다. 휘도 또는 루마 성분은 이미지의 밝기(이미지의 "흑백" 또는 무채색 부분)를 나타내고, 색차 또는 크로마 성분(들)은 이미지의 색상 정보를 나타낸다. 예를 들어 [Y, Cb, 및 Cr]의 색 공간에 픽처나 이미지를 표시할 때 Y 성분은 휘도(또는 루마) 성분이고 Cb 및 Cr 성분은 색차 성분 또는 크로마 성분이다.
휘도 성분 및 색차 성분은 별도의 파티션 트리에 의해 다중 블록으로 분할된다. 다시 말해, 휘도 성분과 색차 성분이 별도로 분할된다. 예를 들어 쿼드 트리(quad-tree, QT), 이진 트리(binary tree, BT), 삼진 트리(ternary tree, TT) 및 이러한 파티션 트리의 조합, 예를 들어, 쿼드 트리 + 이진 트리(QTBT), 또는 쿼드 트리 + 이진 트리 또는 삼진 트리(QT-BT/TT) 등과 같은 서로 다른 파티션 트리가 있는 것으로 알려져 있다.
"하나 이상의 기존 QP 값은 색차 성분의 현재 블록과 관련된다"라는 표현은 색차 성분의 현재 블록과 관련된 기존 QP 값에 대응한다. 예를 들어, 기존 QP 값은: 휘도 성분의 병치된 블록의 QP 값; 휘도 성분의 병치된 블록의 하나 이상의 인접 블록; 및 색차 성분의 현재 블록의 하나 이상의 인접 블록을 포함한다.
비트스트림은 수신된 비트스트림일 수 있으며, 이는 여기서 처리를 위해 디코더에서 수신된 비트스트림을 의미한다. 여기서 접수는 예를 들어 스토리지 또는 네트워크 등으로부터의 모든 종류 또는 접수와 관련이 있다.
픽처의 색차 성분 내의 블록에 대해, 색차 성분 내의 블록의 양자화 파라미터는 수신된 비트스트림으로부터 획득된 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값에 의해 결정될 수 있다. 이것은 색차 성분의 블록에 대한 양자화 파라미터를 결정하는 효율적인 방법을 제공하고 색차 성분의 각 블록에 대한 양자화 파라미터를 결정하기 위해 디코더의 처리 과부하를 완화한다.
본 발명의 제1 관점의 예에 따르면, 하나 이상의 기존 QP 값은 다음: 휘도 성분의 병치된 블록의 QP 값; 휘도 성분의 병치된 블록의 하나 이상의 인접 블록의 기존 QP 값; 및 색차 성분의 현재 블록의 하나 이상의 인접 블록의 기존 QP 값 중 적어도 하나를 포함한다.
이것은 기존의 QP 값을 정의하고, 픽처의 색차 성분에서 블록의 QP 값을 결정하는 효율적인 방법을 제공한다.
본 발명의 제1 관점의 다른 예에 따르면, 상기 방법은 휘도 성분의 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
용어 "휘도 성분의 병치된 블록"은 색차 성분의 블록에 병치된 휘도 성분의 블록이며, 여기서 "병치된(collocated)"이라는 용어는 영상의 휘도와 색차 성분 간의 매핑 관계를 의미한다.
이 예는 색차 성분에서 블록의 QP 값을 결정하는 쉬운 방법을 제공한다. 픽처의 휘도 성분과 색차 성분은 관계가 있기 때문에 휘도 성분의 병치된 블록의 QP 값을 색차 성분에서 블록의 QP 값으로 간주하는 것이 쉽고 직접적인 방법이다.
휘도 성분의 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계는, 임의의 이전 예 및 제1 관점에 따라: 현재 색차 블록의 특정 위치에 있는 샘플과 함께 병치된 휘도 블록을 결정하는 단계; 결정된 휘도 블록의 QP 값(예를 들어, )을 검색하는 단계; 결정된 휘도 블록의 QP 값(예를 들어, )에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 포함한다.
특정 샘플에 따라 병치된 블록을 결정하면 루마 블록과 크로마 블록이 서로 다른 파티션을 가질 수 있는 경우에도 신뢰성과 모호하지 않을 뿐만 아니라 복잡하지 않은 구현이 가능하다.
예에서, 특정 위치의 샘플은 현재 색차 블록의 오른쪽 하단 쿼터에 있는 왼쪽 상단 샘플이다.
이러한 특정 위치는 대략 블록의 중심에 해당하고, 따라서 병치된 블록의 QP의 적절한 추정을 제공한다.
대안적으로 또는 추가적으로, 색차 성분의 현재 블록에 대한 QP 값은 다음 공식 또는 다음 공식으로부터 유도된 새로운 공식에 따라 결정되며: Qp′Cb = QpCb + QpBdOffsetC + , Qp'Cr = QpCr + QpBdOffsetC + , 여기서 QpCb 및 QpCr은 크로마 QP 매핑 함수를 적용하여 결정된 휘도 블록의 QP 값에 기초하여 획득된 및 파라미터로부터 획득된다. 특히, 일부 특정 예에서, qPiCb 및 qPiCr은 QpY_basic에 기초하여 계산되는 크로마 매핑 함수(테이블)의 인덱스이다. QpY_basic은 결정된 휘도 블록의 QP 값에 해당한다.
예시적인 구현에 따르면, 방법은 2 개의 픽처 파라미터 세트, PPS-기반 제어 플래그에 기초하여 루마 및 크로마 평면에 대해 개별적으로 적용되며; 제1 제어 플래그가 참이면, 방법은 루마 QP 유도에 적용되거나; 또는 제1 제어 플래그가 거짓이면, 방법은 루마 QP 유도에 적용되지 않으며; 및/또는 제2 제어 플래그가 참이면, 방법은 크로마 QP 유도를 위해 적용되거나; 또는 제2 제어 플래그가 거짓이면 방법은 크로마 QP 유도에 적용되지 않는다.
이것은 비트스트림에 대한 효율적이고 확장 가능한 구문의 제공을 용이하게 한다.
본 발명의 제1 관점의 예에 따르면, 방법은: 하나 이상의 기존 QP 값 및 다음: 색차 델타 QP 수신된 비트스트림에서 시그널링된 값 또는 수신된 비트스트림에서 시그널링된 색차 QP 오프셋 값 중 적어도 하나에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
본 발명의 제1 관점의 예에 따르면, 상기 방법은: 현재 블록의 파티션 깊이 값을 획득하는 단계, 및 파티션 깊이 값이 임계 값보다 낮으면 수신된 비트스트림에서 시그널링되는 색차 델타 QP 값 및 하나 이상의 기존 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
이러한 방식으로, 임계 값 이상의 깊이 값을 갖는 블록에 이러한 방식을 적용할 필요가 없기 때문에 계산의 복잡성이 감소된다.
본 발명의 제1 관점의 예에 따르면, 임계 값은 미리 정의된 수 또는 파라미터 세트에서 시그널링된 수에 기초하여 결정된다.
예를 들어, 이 수는 프로그래머에 의해 미리 정의되거나, 예를 들어 픽처 파라미터 세트(picture parameter set, PPS) 또는 시퀀스 파라미터 세트(sequence parameter set, SPS)와 같은 파라미터 세트에서 시그널링될 수 있다.
본 발명의 제1 관점의 예에 따르면, 휘도 성분 및 색차 성분은 별도의 파티션 트리에 의해 다중 블록(예를 들어, 코딩 단위, CU)으로 분할된다.
역 양자화를 위한 조화된 방법이 제공되며, 이 방법은 단일 파티션(single partition, ST) 모드(즉, 루마 성분 및 크로마 성분(들)이 단일 파티션으로 분할된다)에 적용될 뿐만 아니라 이중 파티션(double partition, DT) 모드(예를 들어, 루마 성분 및 크로마 성분(즉, 루마 성분 및 크로마 성분(들)이 별도의 파티션 트리에 의해 독립적으로 분할된다)에도 적용된다.
본 발명의 일 실시예에 따르면, 제1 관점의 방법 및 제1 관점의 예 중 임의의 하나를 수행하기 위한 처리 회로를 포함하는 디코딩 장치가 제공된다.
제2 관점에 따르면, 픽처의 현재 블록의 양자화 방법이 제공되며, 여기서 방법은 인코더에 의해 수행되고, 픽처는 휘도 성분 및 색차 성분, 휘도 성분 및/또는 상기 색차 성분은 다수의 블록으로 분할되며, 상기 방법은: 결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 양자화를 수행하는 단계; 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하고 하나 이상의 기존 QP를 비트스트림에 포함시키는 단계 - 하나 이상의 기존 QP 값은 색차 성분의 현재 블록과 관련됨 - ; 하나 이상의 기존 QP 값 및 상기 결정된 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계; 및 QP 파라미터를 비트스트림에 포함시키는 단계를 포함한다.
본 발명의 제2 관점의 예에 따르면, 하나 이상의 기존 QP 값은 다음: 휘도 성분의 병치된 블록의 QP 값; 휘도 성분의 병치된 블록의 하나 이상의 인접 블록의 기존 QP 값; 및 색차 성분의 현재 블록의 하나 이상의 인접 블록의 기존 QP 값 중 적어도 하나를 포함한다.
본 발명의 제1 관점의 다른 예에 따르면, QP 파라미터를 결정하는 단계는 휘도 성분의 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계를 포함한다.
휘도 성분의 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계는 임의의 이전 예 및 제1 관점에 따라: 현재 색차 블록의 특정 위치에 있는 샘플과 함께 병치된 휘도 블록의 QP 값을 검색하는 단계; 및 결정된 휘도 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 포함한다. 구현의 예로서, 휘도 성분에서 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계는: 현재 색차 블록의 특정 위치에 있는 샘플과 병치된 휘도 블록을 결정하는 단계; 결정된 휘도 블록의 QP 값(예를 들어, )을 검색하는 단계; 결정된 휘도 블록의 QP 값(예를 들어, )에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계를 포함하다.
예를 들어, 특정 위치의 샘플은 현재 색차 블록의 오른쪽 하단 쿼터에 있는 왼쪽 상단 샘플이다.
대안적으로 또는 추가적으로, 색차 성분의 현재 블록에 대한 QP 값은 다음 공식 또는 다음 공식으로부터 유도된 새로운 공식에 따라 결정되며: Qp′Cb = QpCb + QpBdOffsetC + , Qp'Cr = QpCr + QpBdOffsetC + , 여기서 QpCb 및 QpCr은 크로마 QP 매핑 함수를 적용하여 결정된 휘도 블록의 QP 값에 기초하여 획득된 및 파라미터로부터 획득된다.
예시적인 구현에 따르면, 방법은 2 개의 픽처 파라미터 세트, PPS-기반 제어 플래그에 기초하여 루마 및 크로마 평면에 대해 개별적으로 적용되며; 제1 제어 플래그가 참이면 방법은 루마 QP 유도에 적용되거나; 또는 제1 제어 플래그가 거짓이면, 방법은 루마 QP 유도에 적용되지 않으며; 및/또는 제2 제어 플래그가 참이면, 방법은 크로마 QP 유도에 적용되거나; 또는 제2 제어 플래그가 거짓이면, 방법은 크로마 QP 유도에 적용되지 않으며, 여기서 방법은 제1 플래그 및/또는 제2 플래그를 비트스트림에 포함시키는 단계를 더 포함한다.
본 발명의 제1 관점의 예에 따르면, 방법은: 하나 이상의 기존 QP 값 및 다음: 수신된 비트스트림에서 시그널링된 색차 델타 QP 값 또는 수신된 비트스트림에서 시그널링된 색차 QP 오프셋 값 중 적어도 하나에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계를 더 포함한다. 방법은 셀타 QP 또는 QP 오프셋을 비트스트림에 삽입하는 단계를 더 포함할 수 있다.
본 발명의 제1 관점의 예에 따르면, 방법은: 현재 블록의 파티션 깊이 값을 결정하는 단계 (및 가능하게는 비트스트림에 포함하는 단계), 및 파티션 깊이 값이 임계 값보다 낮으면, 하나 이상의 기존 QP 값 및 비트스트림에 포함된 색차 델타 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계를 더 포함한다.
본 발명의 제1 관점의 예에 따르면, 임계 값은 미리 정의된 수 또는 파라미터 세트에서 시그널링된 수에 기초하여 결정된다.
예를 들어, 이 수는 프로그래머에 의해 미리 정의될 수 있거나, 예를 들어 픽처 파라미터 세트(picture parameter set, PPS) 또는 시퀀스 파라미터 세트(sequence parameter set, SPS)와 같은 파라미터 세트에서 시그널링될 수 있다.
본 발명의 제1 관점의 예에 따르면, 휘도 성분 및 색차 성분은 개별 파티션 트리에 의해 다중 블록(예를 들어, 코딩 단위, CU)으로 분할된다.
본 발명의 제3 관점에 따르면, 컴퓨터 프로그램이 컴퓨팅 장치에서 실행될 때, 제1 관점의 방법 및 제1 관점의 예 중 임의의 하나를 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램 제품이 제공된다. 컴퓨터 프로그램은 비 일시적 매체에 저장될 수 있다.
본 발명의 제4 관점에 따르면, 픽처의 현재 블록의 경계 분할을 위한 디코딩 장치가 제공된다. 디코딩 장치는: 하나 이상의 프로세서; 및 상기 프로세서에 결합되고 상기 프로세서에 의한 실행을 위한 프로그래밍을 저장하는 비 일시적 컴퓨터 판독 가능형 저장 매체를 포함하고, 상기 프로그래밍은 상기 프로세서에 의해 실행될 때, 디코더가 상기 제1 관점의 방법 및 제1 관점의 예 중 어느 하나의 예를 수행하도록 구성한다.
제5 관점에 따르면, 픽처의 현재 블록의 경계 파티션을 위한 인코딩 장치가 제공되며, 인코딩 장치는 하나 이상의 프로세서; 및 상기 프로세서에 결합되고 상기 프로세서에 의한 실행을 위한 프로그래밍을 저장하는 비 일시적 컴퓨터 판독 가능형 저장 매체를 포함하고, 상기 프로그래밍은 상기 프로세서에 의해 실행될 때, 인코더가 상기 제2 관점의 방법 및 상기 제2 관점의 예 중 어느 하나를 수행하도록 구성한다.
제6 관점에 따르면, 픽처의 현재 블록의 역 양자화 장치가 제공되며, 여기서 픽처는 휘도 성분 및 색차 성분을 포함하고, 휘도 성분 및/또는 색차 성분은 다중 블록으로 분할되며, 상기 장치는: 비트스트림으로부터 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하기 위한 비트스트림 파서(1110) - 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록에 관련됨 - ; 하나 이상의 기존 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 QP 결정 유닛(1120); 결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 역 양자화를 수행하는 역 양자화기(1130)를 포함한다.
제7 관점에 따르면, 픽처의 현재 블록의 양자화 장치가 제공되며, 여기서 픽처는 휘도 성분 및 색차 성분을 포함하고, 휘도 성분 및/또는 색차 성분은 다중 블록으로 분할되고, 상기 장치는: 결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 양자화를 수행하는 양자화기(1210); 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하고 하나 이상의 기존 QP를 비트스트림에 포함시키는 페칭 유닛(1220) - 하나 이상의 기존 QP 값은 색차 성분의 현재 블록에 관련됨 - ; 하나 이상의 기존 QP 값 및 상기 결정된 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하기 위한 QP 결정 유닛(1230); 및 QP 파라미터를 비트스트림에 포함시키기 위한 비트스트림 생성 유닛(1240)을 포함한다.
제8 실시예에 따르면, 전술한 장치 중 하나를 구현하는 집적 회로가 제공된다.
제2, 제3 및 제4 관점의 구현 형태는 제1 관점의 각각의 구현 형태에 대응한다. 따라서, 방법의 구현 형태는 디코딩 장치의 대응하는 구현 형태의 특징(들)을 포함하고 그 반대도 마찬가지이다. 디코딩 장치는 인코딩된 비디오 비트스트림을 디코딩하기 위한 칩셋으로 구현될 수 있다.
제1 관점에 따른 방법의 장점은 제2 관점 및 제4 측면에 따른 디코딩 장치의 대응하는 구현 형태에 대한 장점과 동일하다.
다음의 예시적인 실시예에서 첨부된 도면 및 도면을 참조하여보다 상세하게 설명된다.
도 1a는 본 발명의 실시예들을 구현하도록 구성된 비디오 코딩 시스템의 예를 보여주는 블록도이다.
도 1b는 본 발명의 실시예들을 구현하도록 구성된 비디오 코딩 시스템의 다른 예를 보여주는 블록도이다.
도 2는 본 발명의 실시예를 구현하도록 구성된 비디오 인코더의 예를 보여주는 블록도이다.
도 3은 본 발명의 실시예를 구현하도록 구성된 비디오 디코더의 예시적인 구조를 나타내는 블록도이다.
도 4는 인코딩 장치 또는 디코딩 장치의 일 예를 나타내는 블록도이다.
도 5는 인코딩 장치 또는 디코딩 장치의 다른 예를 나타내는 블록도이다.
도 6a는 본 개시의 일 실시예에 따른 쿼드 트리(QT) 분할을 예시하는 개략도이다.
도 6b는 본 개시 내용의 실시예에 따라 수직 방향으로 분할된 이진 트리(BT)를 예시하는 개략도이다.
도 6c는 본 개시의 일 실시예에 따라 수평 방향으로 분할된 이진 트리(BT)를 예시하는 개략도이다.
도 6d는 본 개시의 일 실시예에 따라 수직 방향으로 분할된 TT(ternary tree)를 예시하는 개략도이다.
도 6e는 본 개시의 일 실시예에 따른 수평 배향으로 분할된 TT(ternary tree)를 예시하는 개략도이다.
도 7a는 픽처에서 4:2:0 루마 및 크로마 샘플의 공칭 수직 및 수평 위치를 나타내는 개략도이다.
도 7b는 픽처에서 4:2:2 루마 및 크로마 샘플의 공칭 수직 및 수평 위치를 나타내는 개략도이다.
도 7c는 픽처에서 4:4:4 루마 및 크로마 샘플의 공칭 수직 및 수평 위치를 나타내는 개략도이다.
도 8은 색차 (또는 색차) 분할에서 휘도 (또는 루마) 분할로의 매핑 포인트를 나타내는 개략도이다.
도 9는 크로마 성분 (또는 크로마 블록 QP 값)에서 블록에 대한 QP 값을 결정하는 절차를 예시하는 예시적인 흐름도이다.
도 10은 현재 블록에 대한 비트스트림에 삽입될 QP 파라미터를 결정하기 위한 절차를 예시하는 예시적인 흐름도이다.
도 11은 디코더의 일부일 수 있는 역 양자화를 위한 예시적인 장치를 나타내는 블록도이다.
도 12는 인코더의 일부일 수 있는 양자화를 위한 예시적인 장치를 나타내는 블록도이다.
도 13은 콘텐츠 전송 서비스를 실현하는 콘텐츠 공급 시스템의 구성 예를 나타내는 블록도이다.
도 14는 단말 장치의 일례의 구조를 나타내는 블록도이다.
다음의 동일한 참조 부호에서 명시적으로 달리 명시되지 않은 경우 동일하거나 적어도 기능적으로 동등한 특징을 지칭한다.
도 1a는 본 발명의 실시예들을 구현하도록 구성된 비디오 코딩 시스템의 예를 보여주는 블록도이다.
도 1b는 본 발명의 실시예들을 구현하도록 구성된 비디오 코딩 시스템의 다른 예를 보여주는 블록도이다.
도 2는 본 발명의 실시예를 구현하도록 구성된 비디오 인코더의 예를 보여주는 블록도이다.
도 3은 본 발명의 실시예를 구현하도록 구성된 비디오 디코더의 예시적인 구조를 나타내는 블록도이다.
도 4는 인코딩 장치 또는 디코딩 장치의 일 예를 나타내는 블록도이다.
도 5는 인코딩 장치 또는 디코딩 장치의 다른 예를 나타내는 블록도이다.
도 6a는 본 개시의 일 실시예에 따른 쿼드 트리(QT) 분할을 예시하는 개략도이다.
도 6b는 본 개시 내용의 실시예에 따라 수직 방향으로 분할된 이진 트리(BT)를 예시하는 개략도이다.
도 6c는 본 개시의 일 실시예에 따라 수평 방향으로 분할된 이진 트리(BT)를 예시하는 개략도이다.
도 6d는 본 개시의 일 실시예에 따라 수직 방향으로 분할된 TT(ternary tree)를 예시하는 개략도이다.
도 6e는 본 개시의 일 실시예에 따른 수평 배향으로 분할된 TT(ternary tree)를 예시하는 개략도이다.
도 7a는 픽처에서 4:2:0 루마 및 크로마 샘플의 공칭 수직 및 수평 위치를 나타내는 개략도이다.
도 7b는 픽처에서 4:2:2 루마 및 크로마 샘플의 공칭 수직 및 수평 위치를 나타내는 개략도이다.
도 7c는 픽처에서 4:4:4 루마 및 크로마 샘플의 공칭 수직 및 수평 위치를 나타내는 개략도이다.
도 8은 색차 (또는 색차) 분할에서 휘도 (또는 루마) 분할로의 매핑 포인트를 나타내는 개략도이다.
도 9는 크로마 성분 (또는 크로마 블록 QP 값)에서 블록에 대한 QP 값을 결정하는 절차를 예시하는 예시적인 흐름도이다.
도 10은 현재 블록에 대한 비트스트림에 삽입될 QP 파라미터를 결정하기 위한 절차를 예시하는 예시적인 흐름도이다.
도 11은 디코더의 일부일 수 있는 역 양자화를 위한 예시적인 장치를 나타내는 블록도이다.
도 12는 인코더의 일부일 수 있는 양자화를 위한 예시적인 장치를 나타내는 블록도이다.
도 13은 콘텐츠 전송 서비스를 실현하는 콘텐츠 공급 시스템의 구성 예를 나타내는 블록도이다.
도 14는 단말 장치의 일례의 구조를 나타내는 블록도이다.
다음의 동일한 참조 부호에서 명시적으로 달리 명시되지 않은 경우 동일하거나 적어도 기능적으로 동등한 특징을 지칭한다.
다음의 설명에서, 본 개시의 일부를 형성하고, 예시로서 본 발명의 실시예의 특정 관점 또는 본 발명의 실시예가 사용될 수 있는 특정 관점을 나타내는 첨부 도면을 참조한다. 본 발명의 실시예는 다른 관점에서 사용될 수 있고 도면에 도시되지 않은 구조적 또는 논리적 변화를 포함할 수 있음이 이해된다. 따라서, 다음의 상세한 설명은 제한적인 의미로 받아들여서는 안 되며, 본 발명의 범위는 첨부된 청구 범위에 의해 정의된다.
예를 들어, 설명된 방법과 관련된 개시는 또한 방법을 수행하도록 구성된 대응하는 장치 또는 시스템에 대해 참일 수 있고 그 반대의 경우도 마찬가지인 것으로 이해된다. 예를 들어, 하나 또는 복수의 특정 방법 단계가 설명된 경우, 해당 장치는 하나 또는 복수의 유닛을 포함할 수 있으며, 이러한 하나 이상의 유닛이 도면에 명시적으로 설명하거나 예시하지 않더라도, 예를 들어, 설명된 하나 또는 복수의 방법 단계를 수행하기 위한 기능 유닛(예를 들어, 하나 또는 복수의 단계를 수행하는 하나의 유닛, 또는 복수의 단계 중 하나 이상을 각각 수행하는 복수의 유닛)을 포함할 수 있다. 반면에, 예를 들어, 특정 장치가 하나 또는 복수의 유닛, 예를 들어, 기능 유닛에 기초하여 기술되는 경우, 이러한 하나 또는 복수의 단계가 도면에 명시적으로 설명되거나 도시되지 않더라도, 대응하는 방법은 하나 또는 복수의 유닛의 기능을 수행하는 하나의 단계(예를 들어, 하나 또는 복수의 유닛의 기능을 수행하는 하나의 단계, 또는 각각 하나 이상의 기능을 수행하는 복수의 단계)를 포함할 수 있다. 또한, 본 명세서에 설명된 다양한 예시적인 실시예들 및/또는 관점들의 특징들은 특별히 달리 언급되지 않는 한 서로 결합될 수 있다는 것이 이해된다.
비디오 코딩은 일반적으로 비디오 또는 비디오 시퀀스를 형성하는 일련의 픽처를 처리하는 것을 말한다. 비디오 코딩 분야에서는 용어 "픽처" 대신에 용어 "프레임" 또는 "이미지"가 동의어로 사용될 수 있다. 본 출원(또는 본 개시)에서 사용되는 비디오 코딩은 비디오 인코딩 또는 비디오 디코딩을 나타낸다. 비디오 인코딩은 (더 효율적인 저장 및/또는 전송을 위해) 비디오 화상을 표현하는 데 필요한 데이터의 양을 감소시키기 위해 (예를 들어, 압축에 의해) 원본 비디오 화상을 처리하는 것을 전형적으로 포함하는 소스 측에서 수행된다. 비디오 디코딩은 목적지 측에서 수행되며 일반적으로 비디오 화상을 재구성하기 위해 인코더에 비해 역 처리를 포함한다. 비디오 픽처(또는 일반적으로 나중에 설명되는 바와 같이 픽처)의 "코딩"을 참조하는 실시예는 비디오 시퀀스에 대한 "인코딩" 또는 "디코딩"과 관련되는 것으로 이해되어야 한다. 인코딩 유닛분과 디코딩 부분의 조합을 코덱(Coding and Decoding, CODEC)이라고도 한다.
무손실 비디오 코딩의 경우, 원본 비디오 픽처가 재구성될 수 있으며, 즉, 재구성된 비디오 픽처는 원본 비디오 픽처와 동일한 품질을 갖는다(저장 또는 전송 동안 전송 손실 또는 다른 데이터 손실이 없다고 가정한다). 손실 비디오 코딩의 경우, 디코더에서 완전히 재구성될 수 없는 비디오 픽처를 나타내는 데이터의 양을 줄이기 위해 예를 들어 양자화에 의한 추가 압축이 수행되며, 즉, 재구성된 비디오 픽처의 품질이 원본 비디오 픽처의 품질에 비해 낮거나 나쁘다.
H.261 이후의 여러 비디오 코딩 표준은 "손실 하이브리드 비디오 코덱" 그룹에 속한다(즉, 변환 도메인에서 양자화를 적용하기 위해 샘플 도메인의 공간 및 시간 예측과 2D 변환 코딩을 결합한다). 비디오 시퀀스의 각각의 픽처는 일반적으로 겹치지 않는 블록의 세트로 분할되고 코딩은 일반적으로 블록 레벨에서 수행된다. 다시 말해, 인코더에서 비디오는 일반적으로 블록(비디오 블록) 수준에서 처리되는데, 예를 들어, 공간(인트라 픽처) 예측 및 시간(인터 픽처) 예측을 사용하여 예측 블록을 생성하고, 현재 블록(현재 처리/처리할 블록)에서 예측 블록을 빼서 잔여 블록을 획득하고, 잔여 블록을 변환하고, 전송될 데이터의 양을 줄이기 위해 변환 도메인의 잔여 블록을 양자화(압축)하는 반면, 디코더에서 인코더와 비교한 역 처리는 현재 블록을 재구성하여 표현하기 위해 인코딩되거나 압축된 블록에 부분적으로 적용된다. 더욱이, 인코더는 디코더 프로세싱 루프를 복제하여 둘 다 동일한 예측(예를 들어, 인트라 및 인터 예측) 및/또는 후속 블록을 처리하기 위한 재구성, 즉 코딩을 생성할 것이다.
본 명세서에서 사용되는 용어 "블록"은 픽처 또는 프레임의 일부일 수 있다. 설명의 편의를 위해, 본 발명의 실시예는 고효율 ITU-T VCEG(Video Coding Experts Group) 및 ISO/IEC MPEG(Motion Picture Experts Group)의 비디오 코딩에 관한 합동 작업 팀(Joint Collaboration Team on Video Coding, JCT-VC)에 의해 개발된 비디오 코딩(High-Efficiency Video Coding, HEVC) 또는 버서타일 비디오 코딩(Versatile Video Coding, VVC)의 참조 소프트웨어를 참조하여 설명된다. 당업자는 본 발명의 실시예가 HEVC 또는 VVC에 제한되지 않음을 이해할 것이다. CU, PU 및 TU를 참조할 수 있다. HEVC에서 CTU는 코딩 트리로 표시된 쿼드 트리 구조를 사용하여 CU로 분할된다. 인터 픽처(시간적) 또는 인트라 픽처(공간적) 예측을 사용하여 화상 영역을 코딩할지는 CU 레벨에서 결정된다. 각 CU는 PU 분할 유형에 따라 1 개, 2 개 또는 4 개의 PU로 추가로 분할될 수 있다. 하나의 PU 내부에서는 동일한 예측 프로세스가 적용되고 관련 정보가 PU 단위로 디코더로 전송된다. PU 분할 유형에 따른 예측 과정을 적용하여 잔여 블록을 획득한 후 CU를 위한 코딩 트리와 유사한 다른 쿼드 트리 구조에 따라 CU를 TU(Transform Unit)로 분할할 수 있다. 비디오 압축 기술의 최신 개발에서 쿼드 트리 및 이진 트리(QTBT) 분할 프레임은 코딩 블록을 분할하는 데 사용된다. QTBT 블록 구조에서 CU는 정사각형 또는 직사각형 모양을 가질 수 있다. 예를 들어, 코딩 트리 단위(CTU)는 먼저 쿼드 트리 구조에 의해 분할된다. 쿼드 트리 리프 노드는 이진 트리 구조에 의해 추가로 분할된다. 이진 트리 리프 노드를 코딩 단위(coding unit, CU)라고 하며 그 세분화는 추가 분할 없이 예측 및 변환 처리에 사용된다. 이는 CU, PU 및 TU가 QTBT 코딩 블록 구조에서 동일한 블록 크기를 가짐을 의미한다. 병렬로 다중 분할, 예를 들어 트리플 트리 분할도 QTBT 블록 구조와 함께 사용하도록 제안되었다.
인코더(20)의 다음 실시예에서, 디코더(30) 및 코딩 시스템(10)이 도 1 내지 도 3에 기초하여 설명된다.
도 1a는 예시적인 코딩 시스템(10), 예를 들어, 본 출원(본 개시)의 기술을 이용할 수 있는 비디오 코딩 시스템(10)을 예시하는 개념적 또는 개략적인 블록도이다. 비디오 코딩 시스템(10)의 인코더(20)(예를 들어, 비디오 인코더(20)) 및 디코더(30)(예를 들어, 비디오 디코더(30))는 본 출원에서 설명된 다양한 예에 따라 기술을 수행하도록 구성될 수 있는 장치의 예를 나타낸다. 도 1a에 도시된 바와 같이, 코딩 시스템(10)은 인코딩된 데이터(13), 예를 들어, 인코딩된 픽처(13)를, 예를 들어 인코딩된 데이터(13)를 디코딩하기 위한 목적지 장치(14)에 제공하도록 구성된 소스 장치(12)를 포함한다.
소스 장치(12)는 인코더(20)를 포함하고, 추가적으로, 즉 선택적으로 픽처 소스(16), 예를 들어 프리-프로세싱 유닛(18), 예를 들어 픽처 프리-프로세싱 유닛(18) 및 통신 인터페이스 또는 통신 유닛(22)을 포함할 수 있다.
픽처 소스(16)는 예를 들어 실제 픽처를 캡처하기 위한 임의의 종류의 화상 캡처 장치 및/또는 임의의 종류의 픽처 또는 코멘트(스크린 콘텐츠 코딩의 경우, 스크린 상의 일부 텍스트도 인코딩될 픽처 또는 이미지의 일부로 간주된다) 생성 장치, 예를 들어 컴퓨터 애니메이션 픽처를 생성하기 위한 컴퓨터-그래픽 프로세서, 또는 실제 픽처, 컴퓨터 애니메이션 픽처(예를 들어, 스크린 콘텐츠, 가상 현실(virtual reality, VR) 픽처) 및/또는 이들의 임의의 조합(예를 들어, 증강 현실(augmented reality, AR) 픽처)를 획득 및/또는 제공하기 위한 임의의 종류의 장치일 수 있거나 포함할 수 있다.
(디지털) 픽처는 강도 값이 있는 2 차원 배열 또는 샘플 행렬로 간주되거나 간주될 수 있다. 어레이의 샘플은 픽셀(픽처 요소의 약어) 또는 펠(pel)이라고도 한다. 어레이 또는 픽처의 수평 및 수직 방향(또는 축)의 샘플 수는 픽처의 크기 및/또는 해상도를 정의한다. 색상을 표현하기 위해 일반적으로 세 가지 색상 성분이 사용되는데, 즉, 픽처는 세 개의 샘플 어레이를 표현하거나 포함할 수 있다. RBG 형식 또는 색 공간에서 픽처는 대응하는 적색, 녹색 및 청색 샘플 배열로 구성된다. 그러나 비디오 코딩에서 각 픽셀은 일반적으로 휘도/색차 형식 또는 색 공간, 예를 들어, YCbCr로 표현되고, 이것은 Y로 표시된 휘도 성분(때로는 대신 L이 사용된다)과 Cb 및 Cr로 표시된 두 개의 색차 성분으로 구성된다. 휘도(또는 루마로 약칭) 성분 Y는 밝기 또는 그레이 레벨 강도(예를 들어, 그레이스케일 픽처에서와 같이)를 나타내는 반면, 두 가지 색차(또는 크로마로 약칭) 성분 Cb 및 Cr은 색차 또는 색상 정보 성분을 나타낸다. 따라서, YCbCr 형식의 픽처는 휘도 샘플 값(Y)의 휘도 샘플 어레이와 색차 값(Cb 및 Cr)의 두 개의 색차 샘플 어레이로 구성된다. RGB 형식의 픽처는 YCbCr 형식으로 변환하거나 변환할 수 있으며 그 반대의 경우도 마찬가지이다. 이 프로세스는 색상 변환 또는 변환이라고도 한다. 픽처가 단색이면 픽처는 휘도 샘플 어레이만 포함할 수 있다.
단색 샘플링에는 명목상 루마 배열로 간주되는 하나의 샘플 배열만 있다.
4:2:0 샘플링에서, 도 7a에 도시된 바와 같이, 2 개의 크로마 어레이 각각은 루마 어레이의 높이의 절반과 폭의 절반을 갖는다.
4:2:2 샘플링에서, 도 7b에 도시된 바와 같이, 2 개의 크로마 어레이 각각은 동일한 높이와 루마 어레이의 폭의 절반을 갖는다.
4:4:4 샘플링에서, 도 7c에 도시된 바와 같이, separate_colour_plane_flag의 값에 따라 다음이 적용된다:
- 만약 Separate_colour_plane_flag가 0이면, 두 크로마 어레이 각각은 루마 어레이와 동일한 높이와 폭를 갖는다.
- 그렇지 않으면(separate_colour_plane_flag는 1과 같다), 3 개의 컬러 평면이 단색 샘플 픽처로 별도로 처리된다.
픽처 소스(16)(예를 들어, 비디오 소스(16))는 예를 들어 픽처를 캡처하기 위한 카메라, 이전에 캡처되거나 생성된 픽처 및/또는 픽처를 획득하거나 수신하기 위한 임의의 종류의 인터페이스(내부 또는 외부)를 포함하거나 저장하는 메모리, 예를 들어 픽처 메모리일 수 있다. 카메라는 예를 들어 소스 장치에 통합된 로컬 또는 통합 카메라일 수 있으며, 메모리는 예를 들어 로컬 또는 예를 들어 소스 장치에 통합된 통합 메모리일 수 있다. 인터페이스는 예를 들어 외부 비디오 소스로부터 픽처를 수신하기 위한 외부 인터페이스, 예를 들어 카메라와 같은 외부 픽처 캡처 장치, 외부 메모리 또는 외부 픽처 생성 장치, 예를 들어, 외부 컴퓨터 그래픽, 프로세서, 컴퓨터 또는 서버일 수 있다. 인터페이스는 모든 종류의 인터페이스가 될 수 있으며, 예를 들어, 독점적이거나 표준화된 인터페이스 프로토콜에 따른 유선 또는 무선 인터페이스, 광학 인터페이스가 될 수 있다. 픽처 데이터(17)를 획득하기 위한 인터페이스는 통신 인터페이스(22)와 동일한 인터페이스이거나 그 일부일 수 있다.
프리-프로세싱 유닛(18) 및 프리-프로세싱 유닛(18)에 의해 수행되는 처리와 구별하여, 픽처 또는 픽처 데이터(17)(예를 들어, 비디오 데이터(16))는 또한 원시 픽처 또는 원시 픽처 데이터(17)로 지칭될 수 있다.
프리-프로세싱 유닛(18)은 (원시) 픽처 데이터(17)를 수신하고 이 픽처 데이터(17)에 대해 프리-프로세싱을 수행하여 프리-프로세싱된 픽처(19) 또는 프리-프로세싱된 픽처 데이터(19)를 획득하도록 구성된다. 프리-프로세싱에 의해 수행되는 프리-프로세싱 -프로세싱 유닛(18)은 예를 들어 트리밍, 컬러 포맷 변환(예를 들어 RGB에서 YCbCr로의 변환), 컬러 보정 또는 노이즈 제거를 포함할 수 있다. 프리-프로세싱 유닛(18)은 선택적 구성 요소일 수 있음을 이해할 수 있다.
인코더(20)(예를 들어, 비디오 인코더(20))는 프리-프로세싱된 픽처 데이터(19)를 수신하고 인코딩된 픽처 데이터(21)를 제공하도록 구성된다(자세한 내용은 예를 들어, 도 2 또는 도 4에 기초하여 이하에서 설명될 것이다).
소스 장치(12)의 통신 인터페이스(22)는 인코딩된 픽처 데이터(21)를 수신하고 이를 다른 장치, 예를 들어, 저장 또는 직접 재구성을 위해 목적지 장치(14) 또는 임의의 다른 장치로 전송하여, 인코딩된 데이터(13)를 저장하기 전에 및/또는 인코딩된 데이터(13)를 다른 장치, 예를 들어 다른 장치, 예를 들어 디코딩 또는 저장을 위한 목적지 장치(14) 또는 임의의 다른 장치로 전송하기 전에 인코딩된 픽처 데이터(21)를 각각 처리하도록 구성될 수 있다.
목적지 장치(14)는 디코더(30)(예를 들어, 비디오 디코더(30))를 포함하고, 추가적으로, 즉 선택적으로 통신 인터페이스 또는 통신 유닛(28), 포스트-프로세싱 유닛(32) 및 디스플레이 장치(34)를 포함할 수 있다.
목적지 장치(14)의 통신 인터페이스(28)는 예를 들어 인코딩된 픽처 데이터(21) 또는 인코딩된 데이터(13)를 수신하도록 구성되며, 소스 장치(12)로부터 직접 또는 다른 소스, 예를 들어 저장 장치, 예를 들어, 인코딩된 픽처 데이터 저장 장치로부터 수신하도록 구성된다.
통신 인터페이스(22) 및 통신 인터페이스(28)는 예를 들어 소스 장치(12)와 목적지 장치(14) 사이의 직접 통신 링크를 통해, 직접 유선 또는 무선 연결 또는 모든 종류의 네트워크(예를 들어, 유선 또는 무선 네트워크 또는 이들의 조합, 또는 모든 종류의 사설 및 공용 네트워크, 또는 이들의 모든 종류의 조합을 통해, 인코딩된 픽처 데이터(21) 또는 인코딩된 데이터(13)를 전송 또는 수신하도록 구성될 수 있다.
통신 인터페이스(22)는 예를 들어 인코딩된 픽처 데이터(21)를 적절한 포맷, 예를 들어, 통신 링크 또는 통신 네트워크를 통한 전송을 위한 패킷으로 패키지화하도록 구성될 수 있다.
통신 인터페이스(22)의 대응물을 형성하는 통신 인터페이스(28)는 예를 들어, 인코딩된 픽처 데이터(21)를 획득하기 위해 인코딩된 데이터(13)를 디 패키징하도록 구성될 수 있다.
통신 인터페이스(22) 및 통신 인터페이스(28) 모두는 소스 장치(12)에서 목적지 장치(14)로 향하는 도 1a의 인코딩된 픽처 데이터(13)에 대해 화살표로 표시된 바와 같이 단방향 통신 인터페이스, 또는 양방향 통신 인터페이스로 구성될 수 있거나, 메시지를 송수신하도록, 예를 들어, 연결을 설정하고, 통신 링크 및/또는 데이터 전송과 관련된 기타 정보, 예를 들어, 인코딩된 픽처 데이터 전송을 확인하고 교환하도록 구성될 수 있다.
디코더(30)는 인코딩된 픽처 데이터(21)를 수신하고 디코딩된 픽처 데이터(31) 또는 디코딩된 픽처(31)를 제공하도록 구성된다(더 자세한 사항은 예를 들어, 도 3 내지 도 5에 기초하여 아래에서 설명될 것이다).
목적지 장치(14)의 포스트-프로세서(32)는 디코딩된 픽처 데이터(31)(또한 재구성된 픽처 데이터라고도 함), 예를 들어, 디코딩된 픽처(31)를 포스트-프로세싱하여, 포스트-프로세싱된 픽처 데이터(33), 예를 들어 포스트-프로세싱된 픽처(33)를 획득하도록 구성된다. 포스트-프로세싱 유닛(32)에 의해 수행되는 포스트-프로세싱은 예를 들어, 디스플레이 장치(34)에 의한 디스플레이를 위해 디코딩된 픽처 데이터(31)를 준비하기 위해, 예를 들어, 색상 형식 변환(예를 들어, YCbCr에서 RGB로의 변환), 색상 보정, 트리밍 또는 리-샘플링 또는 기타 처리를 포함할 수 있다.
목적지 장치(14)의 디스플레이 장치(34)는 예를 들어 픽처를 예를 들어 사용자 또는 뷰어에게 표시하기 위한 포스트-프로세싱된 픽처 데이터(33)를 수신하도록 구성된다. 디스플레이 장치(34)는 예를 들어, 재구성된 화상을 표현하기 위한 임의의 종류의 디스플레이, 예를 들어 통합 또는 외부 디스플레이 또는 모니터를 포함할 수 있다. 디스플레이는 예를 들어 액정 디스플레이(LCD), 유기 발광 다이오드(OLED) 디스플레이, 플라즈마 디스플레이, 프로젝터, 마이크로 LED 디스플레이, 액정 온 실리콘(liquid crystal on silicon, LCoS), 디지털 조명 프로세서(DLP) 또는 기타 모든 종류의 디스플레이로 구성된다.
비록 도 1a가 소스 장치(12)와 목적지 장치(14)를 별개의 장치로 도시하고 있지만, 장치의 실시예는 소스 장치(12) 또는 대응하는 기능과 목적지 장치(14) 또는 대응하는 기능 모두 또는 둘 모두를 포함할 수 있다. 이러한 실시예에서, 소스 장치(12) 또는 대응하는 기능 및 목적지 장치(14) 또는 대응하는 기능은 동일한 하드웨어 및/또는 소프트웨어를 사용하거나 별개의 하드웨어 및/또는 소프트웨어 또는 이들의 임의의 조합에 의해 구현될 수 있다.
설명에 기초하여 당업자에게 명백한 바와 같이, 도 1a에 도시된 바와 같이 소스 장치(12) 및/또는 목적지 장치(14) 내의 상이한 유닛 또는 기능의 존재 및 (정확한) 분할은 실제 장치 및 응용 프로그램에 따라 달라질 수 있다.
인코더(20)(예를 들어, 비디오 인코더(20)) 및 디코더(30)(예를 들어, 비디오 디코더(30))는 각각 하나 이상의 마이크로프로세서, 디지털 신호 프로세서(DSP), 주문형 집적 회로(ASIC), 필드-프로그래머블 게이트 어레이(Field-Programmable Gate Array, FPGA), 이산 로직, 하드웨어 또는 이들의 조합과 같은 다양한 적절한 회로 중 하나로 구현될 수 있다. 기술이 소프트웨어에서 부분적으로 구현되는 경우, 장치는 소프트웨어에 대한 명령을 적절한 비 일시적 컴퓨터 판독 가능형 저장 매체에 저장할 수 있고 본 개시의 기술을 수행하기 위해 하나 이상의 프로세서를 사용하여 하드웨어에서 명령을 실행할 수 있다. 전술한 것(하드웨어, 소프트웨어, 하드웨어와 소프트웨어의 조합 등 포함)은 하나 이상의 프로세서로 간주될 수 있다. 비디오 인코더(20) 및 비디오 디코더(30) 각각은 하나 이상의 인코더 또는 디코더에 포함될 수 있으며, 이들 중 어느 하나는 각각의 장치에서 결합된 인코더/디코더(CODEC)의 일부로서 통합될 수 있다.
소스 장치(12)는 비디오 인코딩 장치 또는 비디오 인코딩 장치로 지칭될 수 있다. 목적지 장치(14)는 비디오 디코딩 장치 또는 비디오 디코딩 장치로 지칭될 수 있다. 소스 장치(12) 및 목적지 장치(14)는 비디오 코딩 장치 또는 비디오 코딩 장치의 예일 수 있다.
소스 장치(12) 및 목적지 장치(14)는 임의의 종류의 핸드헬드 또는 고정 장치, 예를 들어, 노트북 또는 랩톱 컴퓨터, 휴대폰, 스마트 폰, 태블릿 또는 태블릿 컴퓨터, 카메라, 데스크톱 컴퓨터, 셋톱 박스, 텔레비전, 디스플레이 장치, 디지털 미디어 플레이어, 비디오 게임 콘솔, 비디오 스트리밍 장치(예를 들어, 콘텐츠 서비스 서버 또는 콘텐츠 전송 서버), 방송 수신기 장치, 방송 송신기 장치 등을 포함할 수 있으며 어떤 종류의 운영 체제를 전혀 사용하지 않을 수 있다.
일부 경우에, 소스 장치(12) 및 목적지 장치(14)는 무선 통신을 위해 장착될 수 있다. 따라서, 소스 장치(12) 및 목적지 장치(14)는 무선 통신 장치일 수 있다.
일부 경우에, 도 1a에 도시된 비디오 코딩 시스템(10)은 단지 예일 뿐이며, 본 출원의 기술은 인코딩 및 디코딩 장치 사이의 임의의 데이터 통신을 반드시 포함하지 않는 비디오 코딩 설정(예를 들어, 비디오 인코딩 또는 비디오 디코딩)에 적용될 수 있다. 다른 예에서, 데이터는 로컬 메모리로부터 검색되거나, 네트워크 등을 통해 스트리밍된다. 비디오 인코딩 장치는 데이터를 인코딩하고 메모리에 저장할 수 및/또는 비디오 디코딩 장치는 메모리로부터 데이터를 검색하고 디코딩할 수 있다. 일부 예들에서, 인코딩 및 디코딩은 서로 통신하지 않고 단순히 데이터를 메모리로 인코딩 및/또는 메모리로부터 데이터를 검색 및 디코딩하는 장치에 의해 수행된다.
비디오 인코더(20)를 참조하여 설명된 각각의 상기 예에 대해, 비디오 디코더(30)는 상호 프로세스를 수행하도록 구성될 수 있다는 것을 이해해야 한다. 시그널링 구문 요소와 관련하여, 비디오 디코더(30)는 그러한 구문 요소를 수신 및 파싱하고 그에 따라 연관된 비디오 데이터를 디코딩하도록 구성될 수 있다. 일부 예에서, 비디오 인코더(20)는 하나 이상의 구문 요소를 인코딩된 비디오 비트스트림으로 엔트로피 인코딩할 수 있다. 그러한 예들에서, 비디오 디코더(30)는 그러한 구문 요소를 파싱하고 그에 따라 연관된 비디오 데이터를 디코딩할 수 있다.
도 1b는 도 2의 인코더(20)를 포함하는 다른 예시적인 비디오 코딩 시스템(40) 및/또는 예시적인 실시예에 따른 도 3의 디코더(30)의 예시적인 다이어그램을 도시한다. 시스템(40)은 본 출원에 설명된 다양한 예에 따라 기술을 구현할 수 있다. 예시된 구현에서, 비디오 코딩 시스템(40)은 이미징 장치(들)(41), 비디오 인코더(100), 비디오 디코더(30)(및/또는 프로세싱 유닛(들)(46)의 논리 회로(47)를 통해 구현된 비디오 코더), 안테나(42), 하나 이상의 프로세서(들)(43), 하나 이상의 메모리 저장소(들)(44) 및/또는 디스플레이 장치(45)를 포함할 수 있다.
예시된 바와 같이, 이미징 장치(들)(41), 안테나(42), 프로세싱 유닛(들)(46), 논리 회로(47), 비디오 인코더(20), 비디오 디코더(30), 프로세서(들)(43), 메모리 저장소(들)(44) 및/또는 디스플레이 장치(45)는 서로 통신할 수 있다. 논의된 바와 같이, 비디오 인코더(20) 및 비디오 디코더(30) 둘 다로 예시되었지만, 비디오 코딩 시스템(40)은 다양한 예들에서 비디오 인코더(20)만을 포함하거나 비디오 디코더(30)만을 포함할 수 있다.
도시된 바와 같이, 일부 예들에서, 비디오 코딩 시스템(40)은 안테나(42)를 포함할 수 있다. 안테나(42)는 예를 들어 비디오 데이터의 인코딩된 비트스트림을 송신 또는 수신하도록 구성될 수 있다. 또한, 일부 예들에서, 비디오 코딩 시스템(40)은 디스플레이 장치(45)를 포함할 수 있다. 디스플레이 장치(45)는 비디오 데이터를 제공하도록 구성될 수 있다. 도시된 바와 같이, 일부 예들에서, 로직 회로(47)는 프로세싱 유닛(들)(46)을 통해 구현될 수 있다. 프로세싱 유닛(들)(46)은 주문형 집적 회로(ASIC) 로직, 그래픽 프로세서(들), 범용 프로세서(들) 등을 포함할 수 있다. 비디오 코딩 시스템(40)은 또한 유사하게 주문형 집적 회로(ASIC) 로직, 그래픽 프로세서(들), 범용 프로세서(들) 등을 포함할 수 있는 선택적 프로세서(들)(43)를 포함할 수 있다. 일부 예들에서, 논리 회로(47)는 하드웨어, 비디오 코딩 전용 하드웨어 등을 통해 구현될 수 있고, 프로세서(들)(43)는 범용 소프트웨어, 운영 체제 등을 구현할 수 있다. 또한, 메모리 저장소(들)(44)는 휘발성 메모리(예를 들어, 정적 랜덤 액세스 메모리(SRAM), 동적 랜덤 액세스 메모리(DRAM) 등) 또는 비 휘발성 메모리(예를 들어, 플래시 메모리 등) 등이 될 수 있다. 비 제한적인 예에서, 메모리 저장소(들)(44)는 캐시 메모리에 의해 구현될 수 있다. 일부 예들에서, 로직 회로(47)는(예를 들어 이미지 버퍼의 구현을 위해) 메모리 저장소(들)(44)에 액세스할 수 있다. 다른 예들에서, 논리 회로(47) 및/또는 프로세싱 유닛(들)(46)은 이미지 버퍼 등의 구현을 위한 메모리 저장소(예를 들어, 캐시 등)를 포함할 수 있다.
일부 예들에서, 논리 회로를 통해 구현된 비디오 인코더(100)는 이미지 버퍼(예를 들어, 프로세싱 유닛(들)(46) 또는 메모리 저장소(들)(44)를 통해) 및 그래픽 프로세싱 유닛(예를 들어, 프로세싱 유닛(들)(46)을 통해)을 포함할 수 있다. 그래픽 프로세싱 유닛은 이미지 버퍼에 통신 가능하게 결합될 수 있다. 그래픽 프로세싱 유닛은 논리 회로(47)를 통해 구현되는 비디오 인코더(100)를 포함하여 도 2와 관련하여 논의된 다양한 모듈 및/또는 여기에 설명된 임의의 다른 인코더 시스템 또는 서브시스템을 구현할 수 있다. 논리 회로는 본 명세서에서 논의되는 다양한 동작을 수행하도록 구성될 수 있다.
비디오 디코더(30)는 논리 회로(47)를 통해 구현되는 것과 유사한 방식으로 구현되어 도 3의 디코더(30)와 관련하여 논의된 바와 같이 다양한 모듈 및/또는 여기에 설명된 임의의 다른 디코더 시스템 또는 서브시스템을 구현할 수 있다. 일부 예에서, 비디오 디코더(30)는 논리 회로를 통해 구현될 수 있으며 이미지 버퍼(예를 들어, 프로세싱 유닛(들)(420) 또는 메모리 저장소(들)(44)를 통해)) 및 그래픽 프로세싱 유닛(예를 들어, 프로세싱 유닛(들)(46)을 통해)을 포함할 수 있다. 그래픽 프로세싱 유닛은 이미지 버퍼에 통신 가능하게 결합될 수 있다. 그래픽 프로세싱 유닛은 논리 회로(47)를 통해 구현되는 비디오 디코더(30)를 포함하여 도 3과 관련하여 논의된 다양한 모듈 및/또는 여기에 설명된 임의의 다른 디코더 시스템 또는 서브시스템을 구현할 수 있다.
일부 예들에서, 비디오 코딩 시스템(40)의 안테나(42)는 비디오 데이터의 인코딩된 비트스트림을 수신하도록 구성될 수 있다. 논의된 바와 같이, 인코딩된 비트스트림은 코딩 파티션과 연관된 데이터(예를 들어, 변환 계수 또는 양자화된 변환 계수, (논의된 바와 같은) 선택적 인디케이터, 및/또는 코딩 파티션을 정의하는 데이터)와 관련된 데이터와 같이, 본 발명에서 언급된 바와 같이 비디오 프레임을 인코딩하는 것과 연관된 데이터, 인디케이터, 인덱스 값, 모드 선택 데이터 등을 포함할 수 있다. 비디오 코딩 시스템(40)은 또한 안테나(42)에 결합되고 인코딩된 비트스트림을 디코딩하도록 구성된 비디오 디코더(30)를 포함할 수 있다. 비디오 프레임을 표시하도록 구성된 디스플레이 장치(45).
인코더 및 인코딩 방법(ENCODER & ENCODING METHOD)
도 2는 본 출원의 기술을 구현하도록 구성된 예시적인 비디오 인코더(20)의 개략적/개념적 블록도를 도시한다. 도 2의 픽처의 예에서, 비디오 인코더(20)는 잔여 계산 유닛(204), 변환 프로세싱 유닛(206), 양자화 유닛(208), 역 양자화 유닛(210) 및 역변환 프로세싱 유닛(212), 재구성 유닛(214), 버퍼(216), 루프 필터 유닛(220), 디코딩된 픽처 버퍼(Decoded Picture buffer, DPB)(230), 예측 프로세싱 유닛(260) 및 엔트로피 인코딩 유닛(270)을 포함한다. 예측 프로세싱 유닛(260)은 인터 예측 유닛(244), 인트라 예측 유닛(254) 및 모드 선택 유닛(262)을 포함할 수 있다. 인터 예측 유닛(244)은 모션 추정 유닛 및 모션 보상 유닛(도시되지 않음)을 포함할 수 있다. 도 2에 도시된 비디오 인코더(20)는 또한 하이브리드 비디오 인코더 또는 하이브리드 비디오 코덱에 따른 비디오 인코더로 지칭될 수 있다.
예를 들어, 잔여 계산 유닛(204), 변환 프로세싱 유닛(206), 양자화 유닛(208), 예측 프로세싱 유닛(260) 및 엔트로피 인코딩 유닛(270)은 인코더(20)의 순방향 신호 경로를 형성하는 반면, 예를 들어, 역 양자화 유닛(210), 역변환 프로세싱 유닛(212), 복원 부(214), 버퍼(216), 루프 필터(220), 디코딩된 픽처 버퍼(DPB)(230), 예측 프로세싱 유닛(260)은 인코더의 역방향 신호 경로를 형성하며, 여기서 인코더의 역방향 신호 경로는 디코더의 신호 경로에 대응한다(도 3의 디코더(30)를 참조한다).
인코더(20)는 예를 들어, 입력(202), 픽처(201) 또는 픽처(201)의 블록(203)에 의해 비디오 또는 비디오 시퀀스를 형성하는 일련의 픽처의 픽처를 수신하도록 구성된다. 픽처 블록(203)은 또한 코딩될 현재 픽처 블록 또는 픽처 블록으로 지칭될 수 있고, 픽처(201)는 현재 픽처 또는 코딩될 픽처로서 지칭될 수 있다(특히, 현재 픽처를 다른 픽처와 구별하기 위한 비디오 코딩에서, 예를 들어 이전에 인코딩된 및/또는 동일한 비디오 시퀀스의 디코딩된 픽처, 즉 현재 픽처도 포함하는 비디오 시퀀스에서).
분할(PARTITIONING)
인코더(20)의 실시예는 픽처(201)를 복수의 블록, 예를 들어, 블록(203)과 같은 블록으로 분할하도록, 일반적으로 복수의 비 중첩 블록으로 분할하도록 구성된 분할 유닛(도 2에 도시되지 않음)을 포함할 수 있다. 분할 유닛은 비디오 시퀀스의 모든 픽처와 블록 크기를 정의하는 해당 그리드에 대해 동일한 블록 크기를 사용하도록 구성되거나, 픽처 또는 픽처의 서브세트 또는 그룹 간의 블록 크기를 변경하고 각각의 픽처를 해당하는 블록으로 분할하도록 구성된다.
일례에서, 비디오 인코더(20)의 예측 프로세싱 유닛(260)은 위에서 설명된 분할 기술의 임의의 조합을 수행하도록 구성될 수 있다.
픽처(201)와 같이, 블록(203)은 다시 픽처(201)보다는 치수가 작지만 강도 값(샘플 값)을 갖는 2 차원 배열 또는 행렬의 샘플로 간주될 수 있다. 다시 말해, 블록(203)은 예를 들어, 하나의 샘플 어레이(예를 들어, 단색 픽처(201)의 경우 루마 어레이) 또는 세 개의 샘플 어레이(예를 들어, 컬러 픽처(201)의 경우 루마 및 두 개의 크로마 어레이)를 포함할 수 있거나 또는 적용된 색상 형식에 따라 임의의 다른 수 및/또는 종류의 어레이를 포함할 수 있다. 블록(203)의 수평 및 수직 방향(또는 축)의 샘플 수는 블록(203)의 크기를 정의한다.
도 2에 도시된 인코더(20)는 예를 들어 블록 단위로 픽처(201)를 인코딩하도록 구성되며, 예를 들어, 인코딩 및 예측은 블록(203)마다 수행된다.
분할 유닛은 픽처를 비디오 시퀀스로부터 코딩 트리 유닛(CTU)의 시퀀스로 분할하도록 구성될 수 있고, 분할 유닛은 코딩 트리 유닛(CTU)을 예를 들어, 더 작은 파티션, 예를 들어 정사각형 또는 직사각형 크기의 작은 블록으로 분할(또는 스플리트할)할 수 있다. 세 개의 샘플 어레이가 있는 픽처의 경우 CTU는 두 개의 대응하는 크로마 샘플 블록과 함께 루마 샘플의 N×N 블록으로 구성된다. CTU에서 루마 블록의 최대 허용 크기는 개발 중인 버서타일 비디오 코딩(versatile video coding, VVC)에서 128×128로 지정되지만 향후 128x128이 아닌 값, 예를 들어, 256x256으로 지정할 수 있다. 픽처의 CTU는 슬라이스/타일 그룹, 타일 또는 브릭으로 클러스터링/그룹화될 수 있다. 타일은 픽처의 직사각형 영역을 덮고 타일은 하나 이상의 브릭(brick)으로 나눌 수 있다. 브릭은 타일 내의 여러 CTU 행으로 구성된다. 여러 브릭으로 분할되지 않은 타일을 브릭이라고 할 수 있다. 그러나 브릭은 타일의 진정한 서브세트이며 타일이라고 하지 않는다. VVC에서는 두 가지 타일 그룹 모드, 즉 래스터 스캔 슬라이스/타일 그룹 모드(raster-scan slice/tile group mode)와 직사각형 슬라이스 모드(rectangular slice mode)가 지원된다. 래스터 스캔 타일 그룹 모드에서 슬라이스/타일 그룹은 픽처의 타일 래스터 스캔에 일련의 타일을 포함한다. 직사각형 슬라이스 모드에서 슬라이스에는 픽처의 직사각형 영역을 집합적으로 형성하는 픽처의 여러 브릭이 포함된다. 직사각형 슬라이스 내의 브릭은 슬라이스의 브릭 래스터 스캔 순서이다. 이러한 작은 블록(서브-블록이라고도 함)은 더 작은 파티션으로 더 분할될 수 있다. 이것은 또한 트리 분할 또는 계층적 트리 분할이라고도 하며, 여기서 예를 들어 루트 트리 레벨 0(계층 레벨 0, 깊이 0)에서 루트 블록이 재귀적으로 분할될 수 있으며, 예를 들어, 다음 하위 트리 레벨의 두 개 이상의 블록, 트리 레벨 1의 노드(계층 레벨 1, 깊이 1)로 분할되며, 여기서 이러한 블록은 다시 다음 하위 레벨, 예를 들어 트리 레벨 2(계층 레벨 2, 깊이 2)의 두 개 이상의 블록으로 분할될 수 있으며, 이것은 분할이 종료될 때까지 계속되며, 이는 예를 들어, 종료 기준이 충족되었기 때문이며, 예를 들어, 최대 트리 깊이 또는 최소 블록 크기에 도달하기 때문이다. 더 이상 분할되지 않은 블록은 트리의 리프 블록(leaf-block) 또는 리프 노드(leaf node)라고도 한다. 2 개의 파티션으로 분할하는 트리를 2 진 트리(binary-tree, BT), 3 개의 분할로 분할하는 트리를 삼진-트리(ternary-tree, TT), 4 개의 분할로 분할하는 트리를 쿼드-트리(quad-tree, QT)라고 한다.
예를 들어, 코딩 트리 단위(CTU)는 루마 샘플의 CTB일 수 있거나 포함할 수 있거나, 3 개의 샘플 어레이를 갖는 픽처의 크로마 샘플의 2개의 대응하는 CTB일 수 있거나 포함할 수 있거나, 또는 샘플을 코딩하는 데 사용되는 세 개의 개별 색상 평면과 구문 구조를 사용하여 코딩되는 픽처 또는 모노크롬 픽처의 샘플의 CTB이거나 포함할 수 있다. 이에 상응해서, 코딩 트리 블록(CTB)은 컴포넌트를 CTB로 분할하는 것이 파티셔닝이 되도록 N의 일부 값에 대한 샘플의 NxN 블록일 수 있다. 코딩 단위(CU)는 루마 샘플의 코딩 블록, 3 개의 샘플 어레이를 갖는 픽처의 크로마 샘플의 2 개의 대응하는 코딩 블록, 또는 모노크롬 픽처의 코딩 블록 또는 샘플을 코딩하는 데 사용되는 세 개의 개별 색상 평면과 구문 구조를 사용하여 코딩된 픽처이거나 이를 포함할 수 있다. 이에 상응해서 코딩 블록(CB)은 CTB를 코딩 블록으로 나누는 것이 파티셔닝이 되도록 M 및 N의 일부 값에 대한 샘플의 MxN 블록일 수 있다.
예를 들어, HEVC에 따르면, 코딩 트리 단위(CTU)는 코딩 트리로 표시된 쿼드 트리 구조를 사용하여 CU로 분할될 수 있다. 인터 픽처(시간적) 또는 인트라 픽처(공간적) 예측을 사용하여 픽처 영역을 코딩할지가 리프 CU 레벨에서 결정된다. 각 리프 CU는 PU 스플리팅 유형에 따라 1 개, 2 개 또는 4 개의 PU로 추가로 분할될 수 있다. 하나의 PU 내부에서는 동일한 예측 프로세스가 적용되고 관련 정보가 PU 단위로 디코더로 전송된다. PU 분할 유형에 기반한 예측 과정을 적용하여 잔여 블록을 획득한 후, 리프 CU는 CU에 대한 코딩 트리와 유사한 다른 쿼드 트리 구조에 따라 변환 단위(TU)로 분할될 수 있다.
실시예에서, 예를 들어 버서타일 비디오 코딩(VVC)이라 하는 현재 개발 중인 최신 비디오 코딩 표준에 따르면, 결합된 쿼드 트리는 코딩 트리 단위를 분할하는 데 사용되는 이진 및 삼진 스플리트 세그멘테이션 구조를 사용하는 다중 유형 트리를 품는다. 코딩 트리 단위 내의 코딩 트리 구조에서 CU는 정사각형 또는 직사각형 모양을 가질 수 있다. 예를 들어, 코딩 트리 단위(CTU)는 먼저 4 차 트리(quaternary tree)에 의해 분할된다. 그런 다음 4 차 트리 리프 노드를 다중 유형 트리 구조로 더 분할할 수 있다. 다중 유형 트리 구조에는 수직 이진 분할(SPLIT_BT_VER), 수평 이진 분할(SPLIT_BT_HOR), 수직 삼진 분할(SPLIT_TT_VER) 및 수평 삼진 분할(SPLIT_TT_HOR)의 네 가지 분할 유형이 있다. 다중 유형 트리 리프 노드를 CU(코딩 단위)라고 하며 CU가 최대 변환 길이에 비해 너무 크지 않은 경우, 이 세그멘테이션은 추가 분할 없이 예측 및 변환 처리에 사용된다. 이것은 대부분의 경우 CU, PU 및 TU가 다중 유형 트리 코딩 블록 구조를 품은 쿼드 트리에서 동일한 블록 크기를 가진다는 것을 의미한다. 지원되는 최대 변환 길이가 CU의 색상 성분의 폭 또는 높이보다 작은 경우 예외가 발생한다. VVC는 다중 유형 트리 코딩 트리 구조를 품은 쿼드 트리에서 파티션 분할 정보의 고유한 신호 메커니즘을 개발한다. 시그널링 메커니즘에서, 코딩 트리 단위(CTU)는 4 차 트리의 루트로 취급되고 4 차 트리 구조에 의해 먼저 분할된다. 그런 다음 각 4 차 트리 리프 노드(허용할만큼 충분히 클 때)는 다중 유형 트리 구조에 의해 추가로 분할된다. 다중 유형 트리 구조에서, 제1 플래그(mtt_split_cu_flag)는 노드가 더 분할되었는지를 나타내기 위해 시그널링되고; 노드가 추가로 분할되면 스플리팅 방향을 나타내기 위해 제2 플래그(mtt_split_cu_vertical_flag)가 시그널링되고, 그런 다음 스플리트가 이진 분할인지 삼진 분할인지를 나타내는 제3 플래그(mtt_split_cu_binary_flag)가 시그널링된다. mtt_split_cu_vertical_flag 및 mtt_split_cu_binary_flag의 값에 기초하여 CU의 다중 유형 트리 스플리팅 모드(MttSplitMode)는 미리 정의된 규칙 또는 테이블을 기반으로 디코더에 의해 유도될 수 있다. VVC 하드웨어 디코더의 64×64 루마 블록 및 32×32 크로마 파이프 라이닝 설계와 같은 특정 설계의 경우, 루마 코딩 블록의 폭 또는 높이가 64보다 크면 TT 분할이 금지된다. 크로마 코딩 블록의 폭 또는 높이가 32보다 클 때 TT 분할도 금지된다. 파이프 라이닝 설계는 픽처에서 겹치지 않는 단위로 정의되는 가상 파이프 라인 데이터 단위(Virtual pipeline data unit, VPDU)로 픽처를 분할한다. 하드웨어 디코더에서 연속적인 VPDU는 여러 파이프 라인 단계에서 동시에 처리된다. VPDU 크기는 대부분의 파이프 라인 단계에서 버퍼 크기에 거의 비례하므로 VPDU 크기를 작게 유지하는 것이 중요하다. 대부분의 하드웨어 디코더에서 VPDU 크기는 최대 변환 블록(TB) 크기로 설정할 수 있다. 그러나 VVC에서는 삼진 트리(Ternary Tree, TT) 및 이진 트리(Binary Tree, BT) 파티션으로 인해 VPDU 크기가 증가할 수 있다.
또한, 트리 노드 블록의 일부가 하단 또는 오른쪽 픽처 경계를 초과하면, 모든 코딩된 CU의 모든 샘플이 픽처 경계 내에 위치할 때까지 트리 노드 블록이 강제로 분할된다는 점에 유의해야 한다.
예를 들어, ISP(Intra Sub-Partitions) 도구는 루마 인트라 예측 블록을 블록 크기에 따라 수직 또는 수평으로 2 개 또는 4 개의 서브-파티션으로 나눌 수 있다.
잔여 계산(RESIDUAL CALCULATION)
잔여 계산 유닛(204)은 예를 들어 픽처 블록(203) 및 예측 블록(265)에 기초하여 샘플 도메인에서 잔여 블록(205)을 획득하기 위해 예를 들어 픽처 블록(203)의 샘플 값으로부터 예측 블록(265)의 샘플 값을 샘플 단위로(픽셀 단위로) 감산함으로써 잔여 블록(205)을 계산하도록 구성된다(예측 블록(265)에 대한 추가 세부 사항은 나중에 제공된다).
변환(TRANSFORM)
변환 프로세싱 유닛(206)은 예를 들어, 변환을 적용하도록 구성되며, 예를 들어 변환 도메인에서 변환 계수(207)를 얻기 위해 잔여 블록(205)의 샘플 값에 대한 이산 코사인 변환(DCT) 또는 이산 사인 변환(DST)을 적용하도록 구성된다. 변환 계수(207)는 또한 변환 잔여 계수로 지칭될 수 있고 변환 도메인에서 잔여 블록(205)을 나타낼 수 있다.
변환 프로세싱 유닛(206)은 HEVC/H.265에 대해 지정된 변환과 같은 DCT/DST의 정수 근사치를 적용하도록 구성될 수 있다. 직교 DCT 변환과 비교할 때 이러한 정수 근사는 일반적으로 특정 요인에 의해 스케일링된다. 순방향 및 역변환에 의해 처리되는 잔여 블록의 표준을 보존하기 위해 추가 스케일링 계수가 변환 프로세스의 일부로 적용된다. 스케일링 계수는 일반적으로 시프트 연산에 대한 2의 거듭제곱인 스케일링 계수, 변환 계수의 비트 깊이, 정확도와 구현 비용 사이의 균형 등과 같은 특정 제약 조건에 따라 선택된다. 특정 스케일링 계수는 예를 들어 디코더(30)에서, 예를 들어, 역변환 프로세싱 유닛(212)에 의한 역 변환에 대해 지정되고(그리고 예를 들어 인코더(20)에서 역변환 프로세싱 유닛(212)에 의한 대응하는 역변환에 대해 지정되고) 그리고 인코더(20)에서 예를 들어, 변환 프로세싱 유닛(206)에 의한 순방향 변환에 대한 대응하는 스케일링 인자가 그에 따라 지정될 수 있다.
정량화(QUANTIZATION)
양자화 유닛(208)은 스칼라 양자화 또는 벡터 양자화를 적용함으로써 예를 들어 양자화된 변환 계수(209)를 얻기 위해 변환 계수(207)를 양자화하도록 구성된다. 양자화된 변환 계수(209)는 양자화된 잔여 계수(209)라고도 지칭될 수 있다. 양자화 프로세스는 변환 계수(207)의 일부 또는 전부와 관련된 비트 심도를 감소시킬 수 있다. 예를 들어, n-비트 변환 계수는 양자화 동안 m-비트 변환 계수로 반올림될 수 있고, 여기서 n은 m보다 크다. 양자화의 정도는 양자화 파라미터(QP)를 조정함으로써 수정될 수 있다. 예를 들어, 스칼라 양자화의 경우, 더 미세하거나 거친 양자화를 달성하기 위해 다른 스케일링이 적용될 수 있다. 더 작은 양자화 단계 크기는 더 미세한 양자화에 대응하는 반면, 더 큰 양자화 단계 크기는 더 거친 양자화에 대응한다. 적용 가능한 양자화 단계 크기는 양자화 파라미터(QP)로 표시될 수 있다. 양자화 파라미터는 예를 들어 적용 가능한 양자화 단계 크기의 미리 정의된 세트에 대한 인덱스일 수 있다. 예를 들어, 작은 양자화 파라미터는 미세 양자화(작은 양자화 단계 크기)에 대응할 수 있고 큰 양자화 파라미터는 거친 양자화(큰 양자화 단계 크기)에 대응하거나 그 반대일 수 있다. 양자화는 양자화 단계 크기에 의한 분할을 포함할 수 있고, 예를 들어 역 양자화(210)에 의한 대응 또는 인버스 역 양자화는 양자화 단계 크기에 의한 곱셈을 포함할 수 있다. 일부 표준에 따른 실시예, 예를 들어, HEVC에 따른 실시예는 양자화 단계 크기를 결정하기 위해 양자화 파라미터를 사용하도록 구성될 수 있다. 일반적으로 양자화 단계 크기는 나눗셈을 포함하는 방정식의 고정 소수점 근사를 사용하여 양자화 파라미터를 기반으로 계산될 수 있다. 잔여 블록의 놈(norm)을 복원하기 위해 양자화 및 역 양자화에 추가 스케일링 계수가 도입될 수 있으며, 이는 양자화 단계 크기 및 양자화 파라미터에 대한 방정식의 고정 소수점 근사에서 사용되는 스케일링으로 인해 수정될 수 있다. 하나의 예시적인 구현에서, 역변환 및 역 양자화의 스케일링이 결합될 수 있다. 대안으로, 맞춤형 양자화 테이블이 사용되어 비트스트림으로 인코더에서 디코더로 시그널링될 수 있다. 양자화는 손실 연산이며, 양자화 단계 크기가 증가함에 따라 손실이 증가한다.
역 양자화 유닛(210)은 양자화 유닛(208)과 동일한 양자화 단계 크기에 기초하거나 이를 사용하여 양자화 유닛(208)에 의해 적용된 양자화 방식의 역을 적용함으로써, 예를 들어 역 양자화 계수(211)를 획득하기 위해 양자화된 계수에 양자화 유닛(208)의 역 양자화를 적용하도록 구성된다. 역 양자화 계수(211)는 역 양자화된 잔여 계수(211)로 지칭될 수도 있고 - 일반적으로 양자화에 의한 손실로 인해 변환 계수와 동일하지는 않지만 - 변환 계수(207)에 대응할 수도 있다.
역 변환 프로세싱 유닛(212)은 예를 들어, 변환 프로세싱 유닛(206)에 의해 적용된 변환의 역 변환을 적용하도록 구성된다. 역 이산 코사인 변환(DCT) 또는 역 이산 사인 변환(DST)은 샘플 도메인에서 역 변환 블록(213)을 얻는다. 역변환 블록(213)은 또한 역변환 역 양자화 블록(213) 또는 역변환 잔여 블록(213)으로 지칭될 수 있다.
재구성 유닛(214)(예를 들어, 합산기(Summer)(214))은 역변환 블록(213)(즉, 재구성된 잔여 블록(213))을 예측 블록(265)에 추가하여 예를 들어, 재구성된 잔여 블록(213)의 샘플 값과 예측 블록(265)의 샘플 값을 더함으로써 샘플 도메인에서 재구성된 블록(215)을 획득하도록 구성된다.
선택적으로, 버퍼 유닛(216)(또는 "버퍼"(216)로 약칭), 예를 들어. 라인 버퍼(216)는 예를 들어 인트라 예측을 위해 재구성된 블록(215) 및 각각의 샘플 값을 버퍼링하거나 저장하도록 구성된다. 추가 실시예에서, 인코더는 임의의 종류의 추정 및/또는 예측, 예를 들어, 인트라 예측을 위해 필터링되지 않고 재구성된 블록 및/또는 버퍼 유닛(216)에 저장된 각각의 샘플 값을 사용하도록 구성될 수 있다.
인코더(20)의 실시예는, 예를 들어 버퍼 유닛(216)은 인트라 예측(254)을 위한 재구성된 블록(215)을 저장하기 위해 사용될 뿐만 아니라 루프 필터 유닛(220)(도 2에 도시되지 않음)에 대해 사용되도록 구성될 수 있으며, 그리고/또는 예를 들어, 버퍼 유닛(216) 및 디코딩된 픽처 버퍼 유닛(230)은 하나의 버퍼를 형성하도록 구성될 수 있다. 추가 실시예는 필터링된 블록(221) 및/또는 디코딩된 픽처 버퍼(230)(둘 다 도 2에 도시되지 않음)로부터의 블록 또는 샘플을 인트라 예측(254)에 대한 입력 또는 기초로서 사용하도록 구성될 수 있다.
루프 필터 유닛(220)(또는 "루프 필터"(220)로 약칭)은, 예를 들어 필터링된 블록(221)을 얻기 위해, 예를 들어 픽셀 전환을 부드럽게 하기 위해, 그렇지 않으면 비디오 품질을 향상시키기 위해, 재구성된 블록(215)을 필터링하도록 구성된다. 루프 필터 유닛(220)은 디 블로킹 필터, 샘플 적응 오프셋(SAO) 필터 또는 예를 들어 다른 필터, 예를 들어 양방향 필터 또는 적응형 루프 필터(ALF) 또는 선명화 또는 평활화 필터 또는 협업 필터와 같은 하나 이상의 루프 필터를 나타내도록 의도된다. 루프 필터 유닛(220)이 도 2에 인-루프 필터인 것처럼 도시되어 있지만, 다른 구성에서 루프 필터 유닛(220)은 포스트 루프 필터로 구현될 수 있다. 필터링된 블록(221)은 필터링된 복원 블록(221)이라고도 할 수 있다. 디코딩된 픽처 버퍼(230)는 루프 필터 유닛(220)이 복원된 코딩 블록에 대해 필터링 동작을 수행한 후에 복원된 코딩 블록을 저장할 수 있다.
인코더(20)(각각 루프 필터 유닛(220))의 실시예는 루프 필터 파라미터(예를 들어 샘플 적응 오프셋 정보)를 직접적으로 출력되도록 구성될 수 있거나, 직접적으로 또는 엔트로피 인코딩 유닛(270) 또는 임의의 다른 엔트로피 코딩 유닛을 통해 엔트로피 인코딩되도록 구성될 수 있으므로, 예를 들어, 디코더(30)는 디코딩을 위해 동일한 루프 필터 파라미터를 수신하고 적용할 수 있다.
디코딩된 픽처 버퍼(decoded picture buffer, DPB)(230)는 비디오 인코더(20)에 의해 비디오 데이터를 인코딩하는 데 사용하기 위한 참조 픽처 데이터를 저장하는 참조 픽처 메모리일 수 있다. DPB(230)는 동기식 DRAM(SDRAM), 자기 저항성 RAM(MRAM), 저항성 RAM(RRAM) 또는 기타 유형의 메모리 장치를 포함한 동적 랜덤 액세스 메모리(DRAM)와 같은 다양한 메모리 장치에 의해 형성될 수 있다. DPB(230) 및 버퍼(216)는 동일한 메모리 장치 또는 별도의 메모리 장치에 의해 제공될 수 있다. 일부 예에서, 디코딩된 픽처 버퍼(DPB)(230)는 필터링된 블록(221)을 저장하도록 구성된다. 디코딩된 픽처 버퍼(230)는 동일한 현재 픽처 또는 상이한 픽처, 예를 들어, 이전에 재구성된 픽처의 다른 이전에 필터링된 블록, 예를 들어 이전에 재구성되고 필터링된 블록(221)을 저장하도록 추가로 구성될 수 있으며, 예를 들어 인터 예측을 위해, 완전한 이전에 재구성된, 즉 디코딩된 픽처(및 대응하는 참조 블록 및 샘플) 및/또는 부분적으로 재구성된 현재 픽처(및 대응하는 참조 블록 및 샘플)를 제공할 수 있다. 일부 예에서, 재구성된 블록(215)이 재구성되었지만 인-루프 여과가 없는 경우, 디코딩된 픽처 버퍼(DPB)(230)는 재구성된 블록(215)을 저장하도록 구성된다.
블록 예측 프로세싱 유닛(260)으로도 지칭되는 예측 프로세싱 유닛(260)은 블록(203)(현재 픽처(201)의 현재 블록(203)) 및 재구성된 픽처 데이터를 수신 또는 획득하고, 예를 들어, 버퍼(216)로부터 동일한 (현재) 픽처의 참조 샘플 및/또는 디코딩된 픽처 버퍼(230)로부터의 하나 또는 복수의 이전에 디코딩된 픽처로부터 참조 픽처 데이터(231)를 수신 또는 획득하고, 예측을 위해 이러한 데이터를 처리하도록 구성될 수 있고, 즉 인터-예측된 블록(245) 또는 인트라-예측된 블록(255)일 수 있는 예측 블록(265)을 제공하도록 구성될 수 있다.
모드 선택 유닛(262)은 잔여 블록(205)의 계산을 위해 그리고 재구성된 블록(215)의 재구성을 위해 예측 블록(265)으로 사용될 예측 모드(예를 들어, 인트라 또는 인터 예측 모드) 및/또는 대응하는 예측 블록(245 또는 255)을 선택하도록 구성될 수 있다.
모드 선택 유닛(262)의 실시예는 (예를 들어, 예측 프로세싱 유닛(260)에 의해 지원되는 것들로부터) 예측 모드를 선택하도록 구성될 수 있으며, 이는 최상의 매칭을 제공하거나 다시 말해, 최소 잔여(최소 잔여는 전송 또는 저장을 위한 더 나은 압축을 의미함)를 제공하거나, 또는 최소 시그널링 오버헤드(최소 시그널링 오버헤드는 전송 또는 저장을 위한 더 나은 압축을 의미함)를 제공하며, 이것은 둘 다 고려하거나 균형을 유지한다. 모드 선택 유닛(262)은 레이트 왜곡 최적화(rate distortion optimization, RDO)에 기초하여 예측 모드를 결정하도록 구성될 수 있으며, 즉, 최소 레이트 왜곡 최적화를 제공하거나 연관된 레이트 왜곡이 적어도 예측 모드 선택 기준을 충족시키는 예측 모드를 선택하도록 구성될 수 있다.
다음에서, 예시적인 인코더(20)에 의해 수행되는 예측 처리(예를 들어, 예측 프로세싱 유닛(260) 및 모드 선택(예를 들어, 모드 선택 유닛(262)에 의해))가 더 상세히 설명될 것이다.
전술한 바와 같이, 인코더(20)는(미리 결정된) 예측 모드들의 세트로부터 최적 또는 최적 예측 모드를 결정하거나 선택하도록 구성된다. 예측 모드의 세트는 예를 들어, 인트라 예측 모드 및/또는 인터 예측 모드를 포함할 수 있다.
인트라-예측 모드의 세트는 예를 들어, 35 개의 상이한 인트라-예측 모드, 예를 들어, H.265에 정의된 바와 같은 DC (또는 평균) 모드 및 평면 모드와 같은 비 방향 모드 또는 방향 모드를 포함할 수 있거나, 또는 예를 들어, 개발 중인 H.266에 정의된 바와 같이 67 개의 서로 다른 인트라 예측 모드, 예를 들어 DC (또는 평균) 모드 및 평면 모드와 같은 비 방향 모드 또는 방향 모드를 포함할 수 있다.
(또는 가능한) 인터-예측 모드의 세트는 이용 가능한 참조 픽처(즉, DBP(230)에 저장된 이전의 적어도 부분적으로 디코딩된 픽처) 및 기타 인터-예측 파라미터에 따라 달라지는데, 예를 들어 참조 픽처의 전체 참조 픽처 또는 일부 픽처, 예를 들어, 현재 블록 영역 주변의 검색 창 영역이 가장 일치하는 참조 블록을 검색하는 데 사용되는지, 및/또는 예를 들어. 픽셀 보간이 예를 들어, 하프/세미-pel(half/semi-pel) 및/또는 쿼터-pel(quarter-pel) 보간에 적용되는지에 따라 달라진다.
상기 예측 모드에 추가로, 스킵 모드 및/또는 직접 모드가 적용될 수 있다.
예측 프로세싱 유닛(260)은 블록(203)을 예를 들어 더 작은 블록 파티션 또는 서브-블록, 예를 들어, 반복적으로 사용하는 쿼드 트리 분할(QT), 이진 분할(BT) 또는 트리플 트리 분할(TT) 또는 이들의 조합으로 분할하고, 예를 들어 각각의 블록 파티션 또는 서브-블록에 대한 예측을 수행하도록 추가로 구성될 수 있으며, 여기서 모드 선택은 분할된 블록(203)의 트리 구조의 선택 및 각 블록 파티션 또는 서브 블록에 적용되는 예측 모드를 포함한다.
인터 예측 유닛(244)은 모션 추정(motion estimation, ME) 유닛(도 2에 도시되지 않음) 및 모션 보상(motion compensation, MC) 유닛(도 2에 도시되지 않음)을 포함할 수 있다. 모션 추정 유닛은 모션 추정을 위해 픽처 블록(203)(현재 픽처(201)의 현재 픽처 블록(203)) 및 디코딩된 픽처(231), 또는 적어도 하나 또는 복수의 이전에 재구성된 블록, 예를 들어, 하나 또는 복수의 기타/다른/이전에 디코딩된 픽처(231)의 재구성된 블록 픽처 블록(203)을 수신하거나 획득하도록 구성된다. 예를 들어, 비디오 시퀀스는 현재 픽처 및 이전에 디코딩된 픽처(231)를 포함할 수 있거나, 다시 말해, 현재 픽처 및 이전에 디코딩된 픽처(231)는 비디오 시퀀스를 형성하는 픽처의 시퀀스의 일부이거나 형성할 수 있다.
인코더(20)는 예를 들어, 복수의 다른 픽처 중 동일하거나 상이한 픽처의 복수의 참조 블록으로부터 참조 블록을 선택하고 참조 픽처(또는 참조 픽처 인덱스, ...) 및/또는 제공하도록 구성될 수 있다. 또는 참조 블록의 위치 (x, y 좌표)와 현재 블록의 위치 사이의 오프셋(공간적 오프셋)을 모션 추정 유닛(도 2에 도시되지 않음)에 대한 인터 예측 파라미터로서 제공하도록 구성될 수 있다. 이 오프셋은 모션 벡터(motion vector, MV)라고도 한다.
모션 보상 유닛은 예를 들어, 인터 예측 파라미터를 수신하고 인터 예측 파라미터에 기초하여 또는 인터 예측 파라미터를 사용하여 인터 예측을 수행하여 인터 예측 블록(245)을 획득한다. 모션 보상 유닛(도 2에 도시되지 않음)에 의해 수행되는 모션 보상은 다음을 가져 오거나 생성하는 것을 포함할 수 있다. 모션 추정에 의해 결정된 모션/블록 벡터를 기반으로 하는 예측 블록으로, 서브 픽셀 정밀도로 보간을 수행할 수 있다. 보간 필터링은 알려진 픽셀 샘플로부터 추가 픽셀 샘플을 생성할 수 있으므로, 화상 블록을 코딩하는 데 사용될 수 있는 후보 예측 블록의 수를 잠재적으로 증가시킬 수 있다. 모션 보상 유닛(246)은 현재 픽처 블록의 PU에 대한 모션 벡터를 수신하면 참조 픽처 리스트 중 하나에서 모션 벡터가 가리키는 예측 블록을 찾을 수 있다. 모션 보상 유닛(246)은 또한 비디오 슬라이스의 픽처 블록을 디코딩할 때 비디오 디코더(30)에 의해 사용하기 위해 블록 및 비디오 슬라이스와 연관된 구문 요소를 생성할 수 있다.
인트라 예측 유닛(254)은 예를 들어 블록(203)(현재 픽처 블록) 및 하나 또는 복수의 이전에 재구성된 블록, 예를 들어 인트라 추정을 위해 동일한 픽처의 재구성된 인접 블록을 획득하도록, 예를 들어 수신하도록 구성된다. 인코더(20)는 예를 들어, 복수의 (미리 결정된) 인트라 예측 모드 중에서 인트라 예측 모드를 선택하도록 구성될 수 있다.
인코더(20)의 실시예는 예를 들어 최소 잔여(예를 들어 현재 픽처 블록(203)과 가장 유사한 예측 블록(255)을 제공하는 인트라 예측 모드) 또는 최소 레이트 왜곡과 같이, 최적화 기준에 기초하여 인트라-예측 모드를 선택하도록 구성될 수 있다.
인트라 예측 유닛(254)은 예를 들어 인트라 예측 파라미터에 기초하여 예를 들어 선택된 인트라 예측 모드, 인트라 예측 블록(255)을 결정하도록 추가로 구성된다. 임의의 경우에, 블록에 대한 인트라 예측 모드를 선택한 후, 인트라 예측 유닛(254)은 또한 인트라 예측 파라미터, 즉 블록에 대해 선택된 인트라 예측 모드를 나타내는 정보를 엔트로피 인코딩 유닛(270)에 제공하도록 구성된다. 일 예에서, 인트라 예측 유닛(254)은 후술하는 인트라 예측 기술의 임의의 조합을 수행하도록 구성될 수 있다.
엔트로피 인코딩 유닛(270)은 양자화된 잔여 계수(209), 인터 예측 파라미터, 인트라 예측 파라미터 및/또는 루프 필터 파라미터에 대해 엔트로피 인코딩 알고리즘 또는 방식(예를 들어, 가변 길이 코딩(VLC) 방식, 컨텍스트 적응 VLC 방식(CALVC), 산술 코딩 방식, 컨텍스트 적응 이진 산술 코딩(CABAC), 구문 기반 컨텍스트 적응 이진 산술 코딩(SBAC), 확률 간격 분할 엔트로피(PIPE) 코딩 또는 다른 엔트로피 인코딩 방법론 또는 기술)을 적용하여, 예를 들어, 출력(272)에 의해 출력될 수 있는 인코딩된 픽처 데이터(21)를 예를 들어 인코딩된 비트스트림(21)의 형태로 개별적으로 또는 공동으로 (또는 전혀) 획득한다. 인코딩된 비트스트림(21)은 비디오 디코더(30)로 전송되거나, 비디오 디코더(30)에 의한 추후 전송 또는 검색을 위해 보관될 수 있다. 엔트로피 인코딩 유닛(270)은 코딩중인 현재 비디오 슬라이스에 대한 다른 구문 요소를 엔트로피 인코딩하도록 추가로 구성될 수 있다.
비디오 인코더(20)의 다른 구조적 변형이 비디오 스트림을 인코딩하기 위해 사용될 수 있다. 예를 들어, 비 변환 기반 인코더(20)는 특정 블록 또는 프레임에 대해 변환 프로세싱 유닛(206) 없이 직접 잔여 신호를 양자화할 수 있다. 다른 구현에서, 인코더(20)는 단일 유닛으로 결합된 양자화 유닛(208) 및 역 양자화 유닛(210)을 가질 수 있다.
도 3은 본 출원의 기술을 구현하도록 구성된 예시적인 비디오 디코더(30)를 도시한다. 비디오 디코더(30)는 디코딩된 픽처(131)를 얻기 위해 예를 들어 인코더(100)에 의해 인코딩된 픽처 데이터(예를 들어, 인코딩된 비트스트림)(21)를 수신하도록 구성된다. 디코딩 프로세스 동안, 비디오 디코더(30)는 예를 들어 비디오 데이터를 수신하며, 예를 들어 인코딩된 비디오 슬라이스의 픽처 블록 및 비디오 인코더(100)로부터의 관련 구문 요소를 나타내는 인코딩된 비디오 비트스트림을 수신한다.
도 3의 픽처의 예에서, 디코더(30)는 엔트로피 디코딩 유닛(304), 역 양자화 유닛(310), 역 변환 프로세싱 유닛(312), 재구성 유닛(314)(예를 들어, 누산기(314)), 버퍼(316), 루프 필터(320), 디코딩된 픽처 버퍼(330) 및 예측 프로세싱 유닛(360)을 포함한다. 예측 프로세싱 유닛(360)은 인터 예측 유닛(344), 인트라 예측 유닛(354) 및 모드 선택 유닛(362)을 포함할 수 있다. 비디오 디코더(30)는 일부 예들에서 도 2로부터 비디오 인코더(100)에 대해 설명된 인코딩 패스와 일반적으로 역인 디코딩 패스를 수행할 수 있다.
엔트로피 디코딩 유닛(304)은 예를 들어 양자화된 계수(309) 및/또는 디코딩된 코딩 파라미터(도 3에 도시되지 않음), 예를 들어 (디코딩된) 인터 예측 파라미터, 인트라 예측 파라미터, 루프 필터 파라미터 및/또는 기타 구문 요소 중 일부 또는 전부를 획득하기 위해 인코딩된 픽처 데이터(21)에 대한 엔트로피 디코딩을 수행하도록 구성된다. 엔트로피 디코딩 유닛(304)은 또한 인터 예측 파라미터, 인트라 예측 파라미터 및/또는 다른 구문 요소를 예측 프로세싱 유닛(360)으로 전달하도록 구성된다. 비디오 디코더(30)는 비디오 슬라이스 레벨 및/또는 비디오 블록 레벨에서 구문 요소를 수신할 수 있다.
역 양자화 유닛(310)은 역 양자화 유닛(110)과 기능면에서 동일할 수 있고, 역변환 프로세싱 유닛(312)은 역변환 프로세싱 유닛(112)과 기능면에서 동일할 수 있으며, 복원 유닛(314)은 재구성 유닛(114)과 기능면에서 동일할 수 있고, 버퍼(316)는 버퍼(116)와 기능면에서 동일할 수 있고, 루프 필터(320)는 루프 필터(120)와 기능면에서 동일할 수 있으며, 디코딩된 픽처 버퍼(330)는 디코딩된 픽처 버퍼(130)와 기능면에서 동일할 수 있다.
예측 프로세싱 유닛(360)은 인터 예측 유닛(344) 및 인트라 예측 유닛(354)을 포함할 수 있고, 인터 예측 유닛(344)은 기능적으로 인터 예측 유닛(144)과 유사할 수 있고, 인트라 예측 유닛(354)은 기능적으로 인트라 예측 유닛(154)과 유사할 수 있다. 예측 프로세싱 유닛(360)은 일반적으로 블록 예측을 수행하고 및/또는 인코딩된 데이터(21)로부터 예측 블록(365)을 획득하고, 예를 들어, 엔트로피 디코딩 유닛(304)으로부터 예측 관련 파라미터 및/또는 선택된 예측 모드에 대한 정보를 (명시적으로 또는 묵시적으로) 수신하거나 획득하도록 구성된다.
비디오 슬라이스가 인트라 코딩된 (I) 슬라이스로 코딩될 때, 예측 프로세싱 유닛(360)의 인트라 예측 유닛(354)은 시그널링된 인트라 예측 모드 및 현재 프레임 또는 픽처의 이전에 디코딩된 블록으로부터의 데이터에 기초하여 현재 비디오 슬라이스의 픽처 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 비디오 프레임이 인터 코딩된(즉, B 또는 P) 슬라이스로 코딩될 때, 예측 프로세싱 유닛(360)의 인터 예측 유닛(예를 들어, 모션 보상 유닛)은 엔트로피 디코딩 유닛(304)으로부터 수신된 모션 벡터 및 다른 구문 요소에 기초하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 인터 예측을 위해, 예측 블록은 참조 픽처 리스트 중 하나 내의 참조 픽처 중 하나로부터 생성될 수 있다. 비디오 디코더(30)는 DPB(330)에 저장된 참조 픽처에 기초한 디폴트 구성 기술을 사용하여 참조 프레임 목록, 목록 0 및 목록 1을 구성할 수 있다.
예측 프로세싱 유닛(360)은 모션 벡터 및 다른 구문 요소를 파싱함으로써 현재 비디오 슬라이스의 비디오 블록에 대한 예측 정보를 결정하도록 구성되고, 예측 정보를 사용하여 디코딩되는 현재 비디오 블록에 대한 예측 블록을 생성한다. 예를 들어, 예측 프로세싱 유닛(360)은 비디오 슬라이스의 비디오 블록을 코딩하는데 사용되는 예측 모드(예를 들어, 인트라 또는 인터 예측), 인터 예측 슬라이스 유형(예를 들어, B 슬라이스, P 슬라이스 또는 GPB 슬라이스), 슬라이스에 대한 참조 픽처 목록 중 하나 이상에 대한 구성 정보, 슬라이스의 각 인터 인코딩된 비디오 블록에 대한 모션 벡터, 슬라이스의 각 인터 코딩된 비디오 블록에 대한 인터 예측 상태 및 기타 현재 비디오 슬라이스의 비디오 블록을 디코딩하기 위한 정보를 결정하기 위해 수신된 구문 요소 중 일부를 사용한다.
역 양자화 유닛(310)은 비트스트림에 제공되고 엔트로피 디코딩 유닛(304)에 의해 디코딩된 양자화된 변환 계수를 역 양자화, 즉 역 양자화하도록 구성된다. 역 양자화 프로세스는 비디오 인코더(100)에 의해 계산된 양자화 파라미터의 사용을 포함하여, 비디오 슬라이스의 각 비디오 블록에 대해 양자화 정도 및 마찬가지로 적용되어야 하는 역 양자화 정도를 결정할 수 있다.
역 변환 프로세싱 유닛(312)은 픽셀 도메인에서 잔여 블록을 생성하기 위해 역 변환, 예를 들어 역 DCT, 역 정수 변환 또는 개념적으로 유사한 역 변환 프로세스를 변환 계수에 적용하도록 구성된다.
재구성 유닛(314)(예를 들어, Summer 314)은 예를 들어 재구성된 잔여 블록(313)의 샘플 값과 예측 블록(365)의 샘플 값을 더함으로써, 역 변환 블록(313)(즉, 재구성된 잔여 블록(313))을 예측 블록(365)에 추가하여 예를 들어, 샘플 도메인에서 재구성된 블록(315)을 획득하도록 구성된다.
루프 필터 유닛(320)(코딩 루프에서 또는 코딩 루프 이후)은 예를 들어 필터링된 블록(321)을 획득하기 위해, 예를 들어 픽셀 전환을 부드럽게 하거나 그렇지 않으면 비디오 품질을 향상시키기 위해, 재구성된 블록(315)을 필터링하도록 구성된다. 일 예에서, 루프 필터 유닛(320)은 후술하는 필터링 기술의 임의의 조합을 수행하도록 구성될 수 있다. 루프 필터 유닛(320)은 디 블로킹 필터, 샘플 적응 오프셋(SAO) 필터 또는 다른 필터, 예를 들어 양방향 필터 또는 적응형 루프 필터(ALF) 또는 선명하게 하기 또는 평활화 필터 또는 협업 필터와 같은 하나 이상의 루프 필터를 나타내도록 의도된다. 루프 필터 유닛(320)은 도 3에 도시된 인-루프 필터로서, 다른 구성에서 루프 필터 유닛(320)은 포스트 루프 필터로 구현될 수 있다.
주어진 프레임 또는 픽처 내의 디코딩된 비디오 블록(321)은 이후의 모션 보상을 위해 사용되는 참조 픽처를 저장하는 디코딩된 픽처 버퍼(330)에 저장된다.
디코더(30)는 사용자에게 표시하거나 보이기 위해 출력(312)을 통해 예를 들어 디코딩된 픽처(311)을 출력하도록 구성된다.
비디오 디코더(30)의 다른 변형이 압축된 비트스트림을 디코딩하는 데 사용될 수 있다. 예를 들어, 디코더(30)는 루프 필터링 유닛(320) 없이 출력 비디오 스트림을 생성할 수 있다. 예를 들어, 비 변환 기반 디코더(30)는 특정 블록 또는 프레임에 대해 역변환 프로세싱 유닛(312) 없이 직접 잔여 신호를 역 양자화할 수 있다. 다른 구현에서, 비디오 디코더(30)는 역 양자화 유닛(310) 및 역변환 프로세싱 유닛(312)이 단일 유닛으로 결합될 수 있다.
도 4는 본 개시의 실시예에 따른 비디오 코딩 장치(400)의 개략도이다. 비디오 코딩 장치(400)는 본 명세서에 설명된 바와 같이 개시된 실시예를 구현하기에 적합하다. 일 실시예에서, 비디오 코딩 장치(400)는 도 1a의 비디오 디코더(30)와 같은 디코더 및 도 1a의 비디오 인코더(20)와 같은 인코더일 수 있다. 일 실시예에서, 비디오 코딩 장치(400)는 전술한 바와 같이 도 1a의 비디오 디코더(30) 또는 도 1a의 비디오 인코더(20)의 하나 이상의 컴포넌트일 수 있다.
비디오 코딩 장치(400)는 데이터를 수신하기 위한 수신 포트(410) 및 수신기 유닛(Rx)(420); 데이터를 처리하는 프로세서, 로직 유닛 또는 중앙 처리 장치(CPU)(430); 데이터를 전송하기 위한 송신기 유닛(Tx)(440) 및 출구 포트(450); 및 데이터를 저장하기 위한 메모리(460)를 포함한다. 비디오 코딩 장치(400)는 또한 광학적 또는 전기적 신호의 유출 또는 유입을 위한 입력 포트(410), 수신기 유닛(420), 송신기 유닛(440) 및 송신 포트(450)에 결합된 광-전기(OE) 구성 요소 및 전기-광(EO) 구성 요소를 포함할 수 있다.
프로세서(430)는 하드웨어 및 소프트웨어에 의해 구현된다. 프로세서(430)는 하나 이상의 CPU 칩, 코어(예를 들어, 멀티 코어 프로세서), FPGA, ASIC 및 DSP로 구현될 수 있다. 프로세서(430)는 입구 포트(410), 수신기 유닛(420), 송신기 유닛(440), 출구 포트(450) 및 메모리(460)와 통신한다. 프로세서(430)는 코딩 모듈(470)을 포함한다. 코딩 모듈(470)은 위에서 설명된 개시된 실시예를 구현한다. 예를 들어, 코딩 모듈(470)은 다양한 코딩 동작을 구현, 처리, 준비 또는 제공한다. 따라서 코딩 모듈(470)의 포함은 비디오 코딩 장치(400)의 기능에 실질적인 개선을 제공하고 비디오 코딩 장치(400)의 다른 상태로의 변환에 영향을 미친다. 대안적으로, 코딩 모듈(470)은 메모리(460)에 저장되고 프로세서(430)에 의해 실행되는 명령으로서 구현된다.
메모리(460)는 하나 이상의 디스크, 테이프 드라이브 및 솔리드 스테이트 드라이브를 포함하고 오버플로우 데이터 저장 장치로 사용될 수 있으며, 이러한 프로그램이 실행을 위해 선택될 때 프로그램을 저장하고, 프로그램 실행 중에 읽은 명령 및 데이터를 저장하는 데 사용될 수 있다. 메모리(460)는 휘발성 및/또는 비 휘발성일 수 있으며 리드-온리 메모리(read-only memory, ROM), 랜덤 액세스 메모리(random access memory, RAM), 삼진 콘텐츠-어드레서블 메모리(ternary content-addressable memory, TCAM) 및/또는 정적 랜덤 액세스 메모리(static random-access memory, SRAM)일 수 있다.
도 5는 예시적인 실시예에 따라 도 1의 소스 장치(310) 및 목적지 장치(320) 중 하나 또는 둘 모두로서 사용될 수 있는 장치(500)의 단순화된 블록도이다. 장치(500)는 전술한 본 출원의 기술을 구현할 수 있다. 장치(500)는 다수의 컴퓨팅 장치를 포함하는 컴퓨팅 시스템의 형태일 수 있거나, 단일 컴퓨팅 장치의 형태일 수 있으며, 예를 들어 모바일 폰, 태블릿 컴퓨터, 랩톱 컴퓨터, 노트북 컴퓨터, 데스크톱 컴퓨터 등이 될 수 있다.
장치(500)의 프로세서(502)는 중앙 처리 장치일 수 있다. 대안적으로, 프로세서(502)는 현재 존재하거나 향후 개발될 정보를 조작하거나 처리할 수 있는 임의의 다른 유형의 장치 또는 다중 장치일 수 있다. 개시된 구현은 도시된 바와 같이 단일 프로세서, 예를 들어 프로세서(502)로 실행될 수 있지만, 속도 및 효율성의 이점은 하나 이상의 프로세서를 사용하여 달성될 수 있다.
장치(500)의 메모리(504)는 구현에서 읽기 전용 메모리(ROM) 장치 또는 랜덤 액세스 메모리(RAM) 장치일 수 있다. 임의의 다른 적절한 유형의 저장 장치가 메모리(504)로서 사용될 수 있다. 메모리(504)는 버스(512)를 사용하여 프로세서(502)에 의해 액세스되는 코드 및 데이터(506)를 포함할 수 있다. 메모리(504)는 운영 체제(508) 및 애플리케이션 프로그램(510)을 더 포함할 수 있고 애플리케이션 프로그램(510)은 프로세서(502)가 여기에 설명된 방법을 수행하도록 허용하는 적어도 하나의 프로그램을 포함한다. 예를 들어, 애플리케이션 프로그램(510)은 여기에 설명된 방법을 수행하는 비디오 코딩 애플리케이션을 더 포함하는 애플리케이션 1 내지 N을 포함할 수 있다. 장치(500)는 또한 예를 들어 모바일 컴퓨팅 장치와 함께 사용되는 메모리 카드일 수 있는 보조 저장소(514) 형태의 추가 메모리를 포함할 수 있다. 비디오 통신 세션은 상당한 양의 정보를 포함할 수 있기 때문에, 그것들은 전체적으로 또는 부분적으로 보조 저장소(514)에 저장될 수 있고 처리를 위해 필요에 따라 메모리(504)에 로드될 수 있다.
장치(500)는 또한 디스플레이(518)와 같은 하나 이상의 출력 장치를 포함할 수 있다. 디스플레이(518)는, 일례에서, 디스플레이를 터치 입력을 감지하도록 작동 가능한 터치 감지 요소와 결합하는 터치 감지 디스플레이일 수 있다. 디스플레이(518)는 버스(512)를 통해 프로세서(502)에 결합될 수 있다. 사용자가 장치(500)를 프로그래밍하거나 다른 방식으로 사용하도록 허용하는 다른 출력 장치가 디스플레이(518)에 추가로 또는 대안으로서 제공될 수 있다. 출력 장치가 디스플레이이거나 디스플레이를 포함하는 경우, 디스플레이는 액정 디스플레이(LCD), 음극선 관(CRT) 디스플레이, 플라즈마 디스플레이 또는 유기물과 같은 발광 다이오드(LED) 디스플레이를 포함하여 다양한 방식으로 구현될 수 있다. LED(OLED) 디스플레이.
장치(500)는 또한 이미지 감지 장치(520), 예를 들어 카메라, 또는 장치(500)를 조작하는 사용자의 이미지와 같은 이미지를 감지할 수 있는 현재 존재하거나 향후 개발될 임의의 다른 이미지 감지 장치(520)를 포함하거나 그와 통신할 수 있다. 이미지 감지 장치(520)는 장치(500)를 조작하는 사용자를 향하도록 위치할 수 있다. 예에서, 이미지 감지 장치(520)의 위치 및 광축은 시야가 디스플레이(518)에 직접 인접하고 디스플레이(518)가 보일 수 있는 영역을 포함하도록 구성될 수 있다.
장치(500)는 또한 소리 감지 장치(522), 예를 들어 마이크로폰, 또는 장치(500) 근처에서 소리를 감지할 수 있는 현재 존재하거나 향후 개발될 임의의 다른 소리 감지 장치를 포함하거나 그와 통신할 수 있다. 감지 장치(522)는 장치(500)를 작동하는 사용자를 향하도록 위치될 수 있고, 사용자가 장치(500)를 작동하는 동안 사용자에 의해 만들어진 소리, 예를 들어 음성 또는 다른 발화를 수신하도록 구성될 수 있다.
도 5는 장치(500)의 프로세서(502) 및 메모리(504)가 단일 유닛으로 통합되는 것으로 도시하고 있으나, 다른 구성이 이용될 수 있다. 프로세서(502)의 동작은 직접적으로 또는 로컬 영역 또는 다른 네트워크에 걸쳐 결합될 수 있는 다수의 기계(각 기계가 하나 이상의 프로세서를 가짐)에 걸쳐 분산될 수 있다. 메모리(504)는 네트워크 기반 메모리 또는 장치(500)의 동작을 수행하는 다수의 머신의 메모리와 같은 다수의 머신에 분산될 수 있다. 여기서는 단일 버스로 도시되어 있지만, 장치(500)의 버스(512)는 다수의 버스로 구성될 수 있다. 또한, 보조 저장소(514)는 장치(500)의 다른 구성 요소에 직접 결합될 수 있거나 네트워크를 통해 액세스될 수 있고 메모리 카드와 같은 단일 통합 유닛 또는 다중 메모리 카드와 같은 다중 유닛을 포함할 수 있다. 따라서 장치(500)는 매우 다양한 구성으로 구현될 수 있다.
비디오 인코더(20)는 인코딩 전에 입력 비디오 프레임을 블록으로 분할할 수 있다. 본 명세서에서 용어 "블록"은 임의의 유형 블록 또는 임의의 깊이 블록에 대해 사용되며, 예를 들어 "블록"이라는 용어가 포함되지만 루트 블록, 블록, 서브 블록, 리프 노드 등에 제한되지 않는다. 코딩할 블록의 크기가 반드시 같지는 않다. 하나의 픽처는 서로 다른 크기의 블록을 포함할 수 있으며 비디오 시퀀스의 서로 다른 픽처의 블록 래스터도 다를 수 있다. 도 6a-6e는 VVC에서의 코딩 트리 유닛(CTU)/코딩 유닛(CU) 분할 모드를 예시한다.
도 6a는 쿼드 트리(QT) 분할을 채택한 블록 파티션 구조를 나타낸다. QT는 4Mx4N 크기의 노드를 2Mx2N 크기의 4 개의 자식 노드로 분할할 수 있는 블록 분할을 위한 트리 구조이다.
도 6b는 수직 방향으로 분할된 이진 트리(BT)를 채택한 블록 분할 구조를 예시한다.
도 6c는 수평 방향으로 분할된 이진 트리(BT)를 채택한 블록 분할 구조를 예시한다. BT는 크기가 4Mx4N인 노드가 크기가 4Mx2N인 두 개의 자식 노드로 수평 분할되거나 크기가 2Mx4N인 두 개의 자식 노드로 수직 분할될 수 있는 블록 분할을 위한 트리 구조이다.
도 6d는 수직 방향으로 분할된 TT(ternary tree)를 채택함으로써 블록 파티션 구조를 예시한다.
도 6e는 수평 방향으로 분할된 TT(ternary tree)를 채택함으로써 블록 분할 구조를 예시한다. TT는 4Mx4N 크기의 노드가 각각 4MxN, 4Mx2N 및 4MxN 크기의 3 개의 자식 노드로 수평 분할될 수 있는 블록 분할을 위한 트리 구조이거나; 또는 각각 Mx4N, 2Mx4N 및 Mx4N 크기의 3 개의 자식 노드로 수직 분할된다. 도 6d 또는 도 6e 3에 도시된 3 개의 자식 노드 중에서 가장 큰 노드는 중앙에 위치한다.
쿼드 트리 + 이진 트리(QTBT)는 쿼드 트리 + 이진 트리 구조로서, 블록이 먼저 쿼드 트리 분할을 사용하여 분할되고 그런 다음 각 쿼드 트리 자식 노드가 이진 트리 분할을 사용하여 더 분할될 수 있다. 쿼드 트리 + 이진 트리 또는 삼진 트리(QT-BT/TT)는 쿼드 트리 + 이진 트리 또는 삼진 트리 구조로서, 블록이 먼저 쿼드 트리 분할을 사용하여 분할되고 그런 다음 각 쿼드 트리 자식 노드가 이진 트리 또는 삼진 트리 분할을 사용하여 추가로 분할된다.
특정 파티션 깊이와 연관된 블록에 대해, 인코더(20)는 어떤 파티션 유형(추가 분할 없음을 포함)이 사용되는지를 결정하고 결정된 파티션 유형을 명시적으로 또는 묵시적으로(예를 들어, 파티션 유형은 미리 결정된 규칙으로부터 유도될 수 있음) 디코더(30)에 시그널링한다. 인코더(20)는 예를 들어, 상이한 파티션 유형을 사용하는 블록에 대한 레이트 왜곡 비용을 확인하는 것에 기초하여 사용할 파티션 유형을 결정할 수 있다.
본 발명에서 용어 "블록"은 루트 블록, 블록, 서브 블록, 리프 노드 등을 포함 하나 이에 제한되지 않는 일반화된 용어이다.
비디오 코딩 표준은 HEVC/H.265 표준에서 사용된 단일 트리(ST) 코딩에 추가하여 듀얼 트리(DT) 코딩을 도입했다. ST 또는 DT는 슬라이스 또는 프레임 유형(예를 들어, 인트라 프레임 또는 인터 프레임, 인트라 슬라이스 또는 인터 슬라이스)에 따라 선택된다. 단일 트리 코딩 모드하에서 휘도(루미넌스 또는 루마) 및 색차(크로미넌스 또는 크로마) 성분은 동일한 분할 트리를 공유한다. 듀얼 트리 코딩 모드에서는 휘도(루미넌스 또는 루마) 성분 및 색차(크로미넌스 또는 크로마) 성분이 별도로 분할되며, 즉, 루마 성분 및 크로마 성분에 대해 독립적인 분할 방식을 사용한다.
픽처 압축 레벨은 전체 픽처에 대해 (예를 들어, 동일한 양자화 파라미터 값을 사용하여) 고정될 수 있는 양자화 파라미터(QP)에 의해 제어되거나, 픽처의 다른 영역에 대해 상이한 양자화 파라미터 값을 가질 수 있다.
양자화 파라미터를 결정하기 위한 한 가지 솔루션은 코딩 단위(CU) 레벨에서 시그널링하는 양자화 파라미터(QP)이다. 이 접근 방식을 사용하면 특히 일부 CU 깊이(즉, 파티션 레이어를 정의하는 파티션 깊이)에서 픽처의 여러 영역에 대한 QP 값을 유연하게 변경할 수 있다. 영상의 특정 영역에 대한 QP를 시그널링하기 위해 델타(Delta) QP 시그널링 방법이 사용된다. 이 방법에서는 예측된 QP)와 현재 영역의 실제 QP의 차이(즉, 델타 QP)가 비트스트림을 통해 시그널링된다. 델타 QP 값과 그 그래뉼래리티(granularity)(예를 들어, 분할된 블록의 크기)는 픽처 파라미터 세트(picture parameter set, PPS)의 온-오프 제어 플래그 및 최대 깊이(예를 들어, 델타 QP 구문 요소)에 의해 정의된다. 파티션 깊이가 더 높은 모든 CU의 경우 델타 QP 값이 시그널링되지 않지만 최상위 수준 CU에서 상속될 수 있다. HEVC 표준에서 휘도(또는 루마) 코딩 블록(CB)에 대한 QP 값은 예측된 ()를 기반으로 유도되며, 이는 차례로 프레임/슬라이스/타일의 CB 위치에 따라 달라진다. 그러면 변수는 다음 식 1에 의해 유도된다:
(식 1)
여기서 는 코딩 단위(CU)에 대해 시그널링되거나 유도되는 델타 QP 값이고; 는 루마 비트 심도에 따라 달라지는 상수 오프셋이다(HEVC 표준에서 이 용어는 "루마 어레이의 샘플의 비트 심도"에 해당한다). 마지막으로, 휘도(또는 루마) 성분의 양자화 파라미터 는 다음 식 2에 의해 계산될 수 있다:
(식 2)
변수 및 는 각각 또는 와 같은 인덱스 를 기반으로 양자화 테이블(예를 들어, 표 1)에 지정된 의 값과 동일하게 설정되며, 및 는 다음과 같이 식 3에 의해 유도된다:
(식 3)
여기서 는 크로마 비트 깊이에 따라 달라지는 상수 오프셋이고(HEVC 표준에서 이 용어는 "크로마 어레이 샘플의 비트 깊이"에 해당한다); 또는 는 픽처 파라미터 세트(picture parameter set, PPS)에 의해 시그널링되는 Cb 컴포넌트 또는 Cr 컴포넌트에 대한 고정 오프셋이고, 또는 는 슬라이스 헤더에서 시그널링되는 Cb 컴포넌트 또는 Cr 컴포넌트에 대한 고정 오프셋이다.
(식 4)
< 30 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | >43 | |
= | 29 | 30 | 31 | 32 | 33 | 33 | 34 | 34 | 35 | 35 | 36 | 36 | 37 | 37 | = -6 |
일례로 HEVC에서
의 기능으로서
사양
성분 및
성분(
및
)에 대한 크로마 양자화 파라미터는 다음 식 5와 같이 유도된다:
(식 5)
위에서 설명한 델타 QP 메커니즘은 단일 트리(ST)에 대해서만 작동하며 휘도(또는 루마) 성분 및 색차(또는 크로마) 성분이 서로 다른 분할 트리를 사용할 수 있기 때문에 듀얼 트리(DT)에 적용되지 않을 수 있다.
일반적으로, 본 발명의 실시예(들)는 비디오 코딩 분야에 관한 것이다. 구체적으로, 본 발명의 실시예(들)는 비디오 디코딩 장치에서 역 양자화 장치의 일부인 델타 QP 시그널링에 관한 것이다. 본 발명의 실시예(들)는 듀얼 트리(DT)가 적용되는 경우 델타 QP 메커니즘을 적용하는 다른 방법을 제안한다.
단일 트리(ST)에 대해서만 작동하는 위에서 설명한 델타 QP 메커니즘과 유사하게, 트리 유형(ST 또는 DT)에 관계없이, Cb 성분 및 Cr 성분에 대한 크로마 양자화 파라미터는 식 6에 따른 값에 기초하여 유도된다:
(식 6)
여기서 및 는 양자화 테이블 또는 매핑 테이블(예를 들어, 표 1)을 기반으로 유도되고 값에 따라 달라진다. 단일 트리에 대한 델타 QP 시그널링과 달리, 본 발명의 본 실시예는 다음 식 7에 따라 트리 유형(예를 들어, 단일 트리 또는 듀얼 트리)에 관계없이 색차(또는 크로마) 성분에 대한 값을 계산한다고 가정한다:
(식 7)
여기서 는 값에 의존하는 기본 크로마 블록 QP 값이며 아래에 설명된 다른 방법 중 하나로 계산할 수 있다.
계산 및 의 식 7에서 상수 69는 양자화 테이블(예를 들어, 표 1)에 따라 선택되고 QP 63을 최대 허용 값으로 가정하므로 이 상수는 와 의 최대 차이에 추가된 최대 QP 값으로 계산된다. 일반적으로 이 상수는 미리 정의되거나 일부 값에 대해 신호를받을 수 있다.
듀얼 트리(DT) 코딩 접근 방식은 루마 성분 및 크로마 성분이 서로 다른 파티션 트리를 갖고 있으며 각각 자체 파티션 트리를 소유한다고 가정한다. 하나의 크로마 블록(즉, 색차 성분의 블록)이 둘 이상의 루마 블록(즉, 휘도 성분의 블록)에 해당하거나 그 반대가 될 수 있다. 픽처 8은 4:2:0 크로마 서브샘플링의 예를 보여주며, 여기서 전체 크로마 블록은 여러 분할된 루마 블록에 해당한다. 픽처의 수는 루마 성분과 크로마 성분(또는 평면) 사이에 병치된 지점(픽셀)을 나타낸다.
도 9는 픽처의 현재 블록에 대해 역 양자화를 수행하는 절차를 나타내는 예시적인 흐름도이다. 이 절차는 디코더에 의해 수행될 수 있다. 픽처는 휘도 성분과 색차 성분을 포함하고, 휘도 성분과 색차 성분은 별도의 파티션 트리에 의해 여러 블록으로 분할된다.
단계 902: 수신된 비트스트림으로부터 하나 이상의 기존 양자화 파라미터 QP 값을 획득하고, 여기서 하나 이상의 기존 QP 값은 색차 성분의 현재 블록과 관련된다.
이 단계에서 기존 QP 값은 현재 블록(예를 들어, 역 양자화에 의해 수행될 블록)과 관련된다. 예를 들어, 이러한 기존 QP 값은 다음 중 적어도 하나를 포함할 수 있다: 루마 성분의 병치된 블록에 대한 QP 값, 크로마 성분에 있는 현재 블록의 하나 이상의 인접 블록에 대한 QP 값, 루마 성분에서 병치된 블록의 하나 이상의 인접 블록.
루마 성분의 병치된 블록은 크로마 성분의 현재 블록과 매핑 관계를 갖는 블록이다.
단계 904: 하나 이상의 기존 QP 값에 기초하여 색차(또는 크로마) 성분에서 현재 블록에 대한 QP 값을 결정한다.
크로마 성분(또는 크로마 블록 QP 값, )에서 블록에 대한 QP 값을 결정하는 여러 가지 방법이 있다. 요약하면, 첫 번째 방법 집합은 기존 관련 QP 값(예를 들어, 예측으로 보임)을 기반으로 크로마 블록 QP 값을 결정하는 것에 초점을 맞추고, 두 번째 방법 집합은 기존 관련 QP 값(예를 들어, 예측으로 보임)을 기반으로 크로마 블록 QP 값을 결정하고, 수신된 비트스트림에서 시그널링된 색차 델타 QP 값(예를 들어, 델타로 보임)을 결정하는 것이고, 세 번째 방법 집합은 기존 관련 QP 값(예를 들어, 예측으로 보임)을 기반으로 색차 블록 QP 값을 결정하고 수신된 비트스트림에서 시그널링된 색차 QP 오프셋 값(예를 들어 조정 오프셋으로 보임)을 결정하는 것이다.
단계 906: 결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 역 양자화를 수행한다.
이 단계에서, 색차 성분(또는 색차 블록 QP 값)에서 현재 블록에 대한 QP 값을 결정한 후, 색차 성분의 블록에 대해 역 양자화를 수행한다.
도 10은 픽처의 현재 블록에 대해 역 양자화를 수행하는 절차를 나타내는 예시적인 흐름도이다. 이 절차는 인코더에 의해 수행될 수 있다.
단계 1010: 이 단계에서, 색차 성분의 현재 블록의 양자화는 결정된 QP를 사용하여 수행된다. QP는 예를 들어 사용자 설정 및/또는 레이트 왜곡 최적화 등에 의해 결정될 수 있다.
단계 1020: 하나 이상의 기존 양자화 파라미터, QP 값이 획득된다. 이/이들 기존 QP 값(들)도 비트스트림에 포함된다. 하나 이상의 기존 QP 값(들)은 색차 성분의 현재 블록과 관련된다.
단계 1030: 색차 성분의 현재 블록에 대한 QP 파라미터가 하나 이상의 기존 QP 값 및 상기 결정된 QP 값에 기초하여 결정/표현된다. 특히, 색차 성분(결정된 QP)에서 현재 블록에 대한 QP의 값을 전달하기 위해, 파라미터가 비트스트림에 포함되며, 여기서 파라미터는 하나 이상의 기존 QP 값을 사용하여 결정된다. 사용은 그 결정된 QP에서 하나 이상의 기존 QP 값을 빼거나 다른 방식으로, 예를 들어, 추가 파라미터도 포함하는 공식에 의해 수행될 수 있다.
단계 1040: 그런 다음 QP 파라미터가 비트스트림에 포함된다. 비트스트림에 포함시키는 것은 정수 코드 또는 산술 코드 또는 임의의 다른 가변 길이 코드와 같은 엔트로피 코딩을 더 포함할 수 있다. 엔트로피 코드는 컨텍스트 적응형일 수 있다. 그렇지만, 이것들은 단지 예일 뿐이며 본 개시는 고정 길이 코딩을 포함하는 임의의 종류의 코딩과 함께 작동할 수 있다.
일 실시예에 따르면, 양자화 및 역 양자화를 위한 장치가 제공되며, 이는 각각의 인코더 및 디코더에서 사용될 수 있다. 위의 인코딩 및 디코딩 방법에 해당하는 기능이 있다.
특히, 픽처의 현재 블록의 역 양자화 장치로서, 픽처는 휘도 성분과 색차 성분을 포함하고, 휘도 성분 및/또는 색차 성분은 다중 블록으로 분할된다. 장치는 장치(1100)로서 도 11에 도시되어 있다. 이는 다음의 기능 유닛(회로)을 더 포함한다:
비트스트림으로부터 하나 이상의 기존 양자화 파라미터 QP 값을 획득하기 위한 비트스트림 파서(비트스트림 파싱 유닛 _(또는 회로)라고도 함)(1110). 하나 이상의 기존 QP 값은 색차 성분의 현재 블록과 관련된다. 색차 성분은 임의의 하나 이상의 색차 성분일 수 있다.
하나 이상의 기존 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하기 위한 QP 결정 유닛(또는 회로)(1120).
결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 역 양자화를 수행하기 위한 역 양자화기(역 양자화 유닛(또는 회로)라고도 함)(1130).
또한, 픽처의 현재 블록의 양자화를 위해 도 12에 도시된 장치(1200)가 제공된다. 픽처는 휘도 성분과 색차 성분을 포함하고, 휘도 성분 및/또는 색차 성분은 여러 블록으로 분할된다. 장치는 다음을 포함한다:
결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 양자화를 수행하기 위한 양자화기(양자화 유닛(또는 회로)라고도 함)(1210).
하나 이상의 기존 양자화 파라미터, QP 값을 획득하고 하나 이상의 기존 QP를 비트스트림에 포함하기 위한 페칭 유닛(또는 회로)(1220), 여기서 하나 이상의 기존 QP 값은 색차 성분의 현재 블록과 관련된다.
하나 이상의 기존 QP 값 및 상기 결정된 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하기 위한 QP 결정 유닛(또는 회로)(1230).
비트스트림에 QP 파라미터를 포함하기 위한 비트스트림 생성 유닛(또는 비트스트림 생성기로도 지칭되는 회로)(1240).
아래는 크로마 블록 QP 값을 결정하기 위한 실시예이다.
I. 하나 이상의 관련 기존 QP 값에 기초하여 크로마 블록 QP 값 결정
첫 번째 방법 집합에서, 세 그룹의 방법이 제공된다.
A. 첫 번째 방법 그룹: 이 방법 그룹에서, 크로마 블록 QP 값 은 로 표시되는 병치된 루마 QP 값에 기초하여 계산된다.
(1) 첫 번째 방법은 휘도 성분에 있는 병치된 블록의 QP 값에 기초하여 색차 성분(즉, 크로마 블록 QP 값)의 현재 블록에 대한 QP 값을 결정하는 것이다. 크로마 평면(Chroma Plane)(또는 성분)의 한 지점이 선택되고(매핑 지점, 예를 들어 C5 지점으로 표시된다), 는 루마(또는 휘도) 평면에서 현재 매핑 지점(예를 들어, 지점 L5)과 함께 병치된 블록의 QP 값으로 결정된다. 예를 들어, 도 8의 지점이 매핑 지점으로 선택되면, 는 루마 코딩 블록(예를 들어, L5 지점이 위치한 블록)의 대응하는 지점의 루마 QP 값과 같다. 도 8의 위의 예를 포함하지만 이에 제한되지 않는 임의의 크로마 포인트가 매핑 포인트로 선택될 수 있음을 이해해야 한다.
보다 구체적으로, 식 7은 다음과 같은 방식으로 재작성될 수 있다:
(식 7.1)
여기서 QpY_basic은 다음과 같이 분할 트리 유형에 따라 결정된다:
- treeType이 SINGLE_TREE와 같으면, QpY_basic은 QpY와 같게 설정된다.
- 그렇지 않으면, QpY_basic은 좌표(xCb + cbWidth/2, yCb + cbHeight/2)가 있는 루마 샘플을 포함하는 병치된 루마 CU의 QpY 값과 동일하게 설정된다.
그리고 (xCb, yCb) 현재 픽처의 왼쪽 상단 루마 샘플에 대해 현재 크로마 코딩 블록과 함께 병치된 루마 코딩 블록의 왼쪽 상단 샘플을 지정한다.
또한 QpY 값은 다음 식에 따라 계산할 수 있다:
Where , , are calculated in usual way for collocated Luma CU. The constant was changed to 64.
여기서 , , 는 병치된 루마 CU에 대해 일반적인 방식으로 계산된다. 상수가 64로 변경되었다.
다시 말해, 예시적인 구현에서, 색차 성분의 현재 블록의 QP는 병치된 블록의(기존) 파라미터에 기초하여 결정된다. 병치된 블록은 현재 블록과 병치된 휘도 성분 블록일 수 있다. 일반적으로 휘도(코딩 트리) 블록의 분할은(코딩 트리) 색차 블록의 분할과 다를 수 있다. 따라서, 동일한 색차 블록과 동일한 화상 영역을 덮는 휘도 블록이 더 많거나 적거나 같을 수 있다. 따라서, 본 예에서는 현재 색차 블록의 미리 정의된 특정 샘플을 포함하는 영역을 포함하는 휘도 블록으로 병치된 블록이 결정된다. 예를 들어, 특정 샘플은 현재 색차 블록의 오른쪽 하단 쿼터에 있는 왼쪽 상단 샘플일 수 있다. 이 예시적인 샘플 위치는 중앙 또는 현재 블록의 근접(또는 내부)에 있다. 그렇지만, 본 개시 내용은 이러한 특정 샘플 위치로 제한되지 않는다. 왼쪽 상단 등과 같은 다른 위치를 취할 수 있다.
부록 A는 양자화 파라미터에 대한 유도 프로세스의 자세한 예를 제공한다.
(2) 두 번째 방법은 색차 성분(즉, 크로마 블록 QP 값)에서 현재 블록에 대한 QP 값이 휘도 성분에서 병치된 블록의 하나 이상의 인접 블록의 기존 QP 값의 가중 합계를 기반으로 결정되는 것이다. 이 방법에서 는 동일한 가중치를 가진 여러 특정 지점에서 루마 QP 값의 병치된 값에 기초하여 계산된다. 예를 들어, 는 다음 식에 의해 모서리 크로마 포인트 에 병치되는 지점으로부터의 루마 QP 값에 기초하여 계산될 수 있다:
(식 8)
여기서 ,..., 는 도 8의 위치에 있는 루마 CU의 QP 값이다.
(3) 세 번째 방법은 다음 방법 중 하나에서 크로마 코딩 블록(CU) 값과 병치된 루마 CU(들)의 교차점을 기반으로 를 계산하는 것이다:
옵션 1: 크로마 CU가 하나의 루마 CU에 의해 완전히 커버되면, 는 루마 CU로부터 취해진다.
옵션 2: 크로마 CU가 하나 이상의 루마 CU에 의해 커버되고 그러한 모든 루마 CU가 동일한 QP 값을 갖는 경우, 는 루마 CU로부터 취해진다.
옵션 3: 크로마 CU가 하나 이상의 루마 CU에 의해 커버되고 그러한 모든 루마 CU가 동일한 QP 값을 갖지 않는 경우, 루마 CU에 대한 QP 값의 가중 함수에 기초하여 가 루마 CU로부터 취해지고, 여기서 각 루마 CU 델타 QP에 대한 가중치는 현재 크로마 CU와 루마 CU 간의 공간적 대응에 의해 결정된다.
B. 두 번째 방법 그룹: 이 방법 그룹에서 크로마 CU QP 예측은 인접한 크로마 CUs QP 값(즉, 색차 성분에서 블록의 하나 이상의 인접 블록의 QP 값)을 기반으로 계산되며 로 표시된다. 즉, 색차 성분의 현재 블록에 대한 QP 값(즉, 크로마 CUs QP 값)은 색차 성분의 현재 블록의 주변 블록의 기존 QP 값의 가중 합에 기초하여 결정된다. 이 그룹에서의 방법은 디코더 측에서 이미 사용 가능한 인접 크로마 CU와 함께 작동할 수 있다. 이 경우 는 다음 식 9로 계산할 수 있다:
(식 9)
여기서 은 수 N을 가진 인접 CU의 집합이고 는 집합에서 n 번째 인접 CU에 해당하는 QP 값이다.
C. 세 번째 방법 그룹: 이 방법 그룹에서 크로마 CU QP 값(또는 예측)은 및 모두를 기반으로 계산되며, 위에서 언급한 방법 중 하나로 계산될 수 있으며 크로마 CU QP 예측은 로 표시된다. 이 방법에서는 색차 성분에서 현재 블록에 대한 QP 값(즉, Chroma CUs QP 값)이 휘도 성분의 병치된 블록의 QP 값과 색차 성분에서 현재 블록의 인접 블록의 기존 QP 값의 가중 합을 기반으로 결정된다. 대안적으로, 색차 성분의 현재 블록에 대한 QP 값(즉, Chroma CUs QP 값)은 색차 성분에서 현재 블록의 인접 블록의 기존 QP 값의 가중 합과 휘도 성분에서 병치된 블록의 인접 블록의 기존 QP 값의 가중 합 모두에 기초하여 결정된다. 예를 들어, 는 및 의 가중 합계로 계산될 수 있다. 예를 들어, 다음 식 10으로 계산할 수 있다:
(식 10)
II. 크로마 블록 QP 값을 결정하기 위한 두 번째 방법 설정
이 방법 집합에서 색차 성분(또는 색차 블록 QP 값)의 현재 블록에 대한 QP 값은 하나 이상의 기존 QP 값과 수신된 비트스트림에서 시그널링된 색차 델타 QP 값 및 하나 이상의 기존 QP 값은 색차 성분의 현재 블록과 관련이 있다.
이 섹션은 듀얼 트리가 가능할 때 도출(또는 델타)을 결정하기 위한 다양한 접근법을 설명한다.
(1) 첫 번째 방법: 이 방법에서 값은 , 또는 값 중 하나로부터 직접 취해지며, 이는 첫 번째 방법 집합에서 위에서 언급한 대응 접근 방식 중 하나에서 계산된다. 이 방법에서 듀얼 트리(Dual Tree)를 사용하는 경우 루마 CU는 델타 루마 QP 표현을 위한 구문 요소를 포함하고 크로마 CU는 델타 크로마 QP 표현을 위한 구문 요소를 포함하지 않는다.
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
... | |
if( treeType = = SINGLE_TREE | | treeType = = DUAL_TREE_LUMA ){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ]) | |
delta_qp() | |
} | |
if( treeType = = SINGLE_TREE | | treeType = = DUAL_TREE_CHROMA ) { | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
} | |
... | |
} |
첫 번째 방법에 대한 델타 QP 시그널링의 예
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
if( treeType = = SINGLE_TREE){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] | | tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ] ) | |
delta_qp( ) | |
} | |
else{ | |
if(treeType = = DUAL_TREE_LUMA){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] ) | |
delta_qp( ) | |
} | |
else /* DUAL_TREE_CROMA */{ | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
} | |
} | |
... | |
} |
첫 번째 방법에 대한 델타 QP 시그널링의 다른 예
표 2와 표 3은 이 방법에서 시그널링 메커니즘을 구현할 수 있는 두 가지 예를 제공한다.
이 방법에서,
는
와 같으며,
,
또는
값 중 하나와 같을 수 있다. 이 경우 Cb 및 Cr 성분의
값은 다음 식 11에 의해 계산될 수 있다:
(식 11)
여기서 및 각각의 은 위에서 언급한 방법 중 하나에 의해 유도된다. 보다 구체적으로, 현재 방법을 위에서 언급한 유도의 방법 1과 결합하면 식 11을 다음과 같이 다시 작성할 수 있다:
(식 11.1)
여기서 QpY_basic은 다음과 같이 분할 트리 유형에 따라 결정된다:
- treeType이 SINGLE_TREE와 같으면, QpY_basic은 QpY와 같게 설정된다.
- 그렇지 않으면, QpY_basic은 좌표(xCb + cbWidth/2, yCb + cbHeight/2)가 있는 루마 샘플을 포함하는 병치된 루마 CU의 QpY 값과 동일하게 설정된다.
그리고 (xCb, yCb) 현재 픽처의 왼쪽 상단 루마 샘플에 대해 현재 크로마 코딩 블록과 함께 병치된 루마 코딩 블록의 왼쪽 상단 샘플을 지정한다.
그리고 QpY 값은 다음 식에 따라 계산할 수 있다:
(식 11.1a)
여기서 , , 는 병치된 루마 CU에 대해 기존 방식으로 계산된다.
식 11 및 11.1에서의 상수 69는 6만큼 증가된 최대 가능한 QP 값을 나타낸다. 식 11.1a에서 상수 64는 1만큼 증가된 최대 QP 값을 나타낸다. 부록 A는 양자화 파라미터에 대한 유도 프로세스의 자세한 예를 제공한다.
이 방법에서는 예를 들어 다음의 방식으로 delta_qp 시그널링 기능을 구현할 수 있다.
delta_qp( ) { | 설명자 |
if( cu_qp_delta_enabled_flag && !IsCuQpDeltaCoded ) { | |
cu_qp_delta_abs | ae(v) |
if( cu_qp_delta_abs ) | |
cu_qp_delta_sign_flag | ae(v) |
} | |
} |
방법 집합의 첫 번째 방법에 대한 delta_qp() 함수 시그널링의 예
표 4에서, 구문 요소 cu_qp_delta_enabled_flag는 델타 QP가 현재 슬라이스/픽처/시퀀스에 대해 허용되는지를 지정하는 상위 레벨 플래그를 나타내고; IsCuLumaQpDeltaCoded 플래그는 델타 QP가 현재 깊이에서 시그널링되는지를 지정하고; 더 높거나 같은 깊이의 CU 블록의 경우 delta_qp는 가장 가까운 시그널링된 블록에서 상속된다. IsCuQpDeltaCoded 플래그 유도에 사용되는 구문 요소 cu_qp_delta_enabled_flag 및 diff_cu_qp_delta_depth는 픽처 파라미터 세트(picture parameter set, PPS)에서 시그널링될 수 있다.
pic_parameter_set_rbsp( ) { | Descriptor |
... | |
cu_qp_delta_enabled_flag | u(1) |
if( cu_qp_delta_enabled_flag ) | |
diff_cu_qp_delta_depth | ue(v) |
... | |
} |
방법 세트의 첫 번째 방법에 대한 PPS 확장의 예
보다 구체적으로, 1과 동일한 cu_qp_delta_enabled_flag는 diff_cu_qp_delta_depth 구문 요소가 PPS에 존재하고 cu_qp_delta_abs 및 cu_qp_delta_sign_flag가 변환 단위 구문에 존재할 수 있음을 지정한다. 0과 같은 cu_qp_delta_enabled_flag는 diff_cu_qp_delta_depth 구문 요소가 PPS에 없고 cu_qp_delta_abs 및 cu_qp_delta_sign_flag가 변환 단위 구문에 존재하지 않음을 지정한다.
cu_qp_delta_abs는 현재 코딩 단위의 루마 양자화 파라미터와 그 예측 사이의 차이 CuQpDeltaVal의 절대 값을 지정한다.
cu_qp_delta_sign_flag는 다음과 같이 CuQpDeltaVal의 부호를 지정한다:
- cu_qp_delta_sign_flag가 0이면 해당 CuQpDeltaVal은 양의 값을 가진다.
- 그렇지 않으면(cu_qp_delta_sign_flag가 1과 같음), 해당 CuQpDeltaVal은 음의 값을 가진다.
cu_qp_delta_sign_flag가 없으면 0과 같은 것으로 추론된다.
cu_qp_delta_abs가 있는 경우 IsCuQpDeltaCoded 및 CuQpDeltaVal 변수는 다음과 같이 유도된다:
IsCuQpDeltaCoded = 1
CuQpDeltaVal = * cu_qp_delta_abs
CuQpDeltaVal의 값은 -(32 + QpBdOffsetY/2) 내지 +(31 + QpBdOffsetY/2) 범위에 있어야 한다.
이 방법은 모든 크로마 CU 깊이에 대해 Cb 성분 및 Cr 성분에 대한 파라미터 유도에 사용할 수 있다. 또는 미리 정의된 값보다 작은 깊이에 대해서만 더 높거나 같은 깊이에 위치한 CU 블록은 가장 가까운 처리된 값에서 값을 상속한다.
대안적으로, 제1 방법은 또한 크로마 성분에 대한 델타 QP에 대한 개별 구문을 시그널링할 수 있다.
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
if( treeType = = SINGLE_TREE){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] | | tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ] ) | |
delta_qp_y( ) | |
} | |
else{ | |
if(treeType = = DUAL_TREE_LUMA){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] ) | |
delta_qp_y( ) | |
} | |
else /* DUAL_TREE_CROMA */{ | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_c( ) | |
} | |
} | |
... | |
} |
첫 번째 방법에서 분리된 델타 QP 시그널링의 예
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
if( treeType = = SINGLE_TREE){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ]) | |
delta_qp_y( ) | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_c( ) | |
} | |
else{ | |
if(treeType = = DUAL_TREE_LUMA){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] ) | |
delta_qp_y( ) | |
} | |
else /* DUAL_TREE_CROMA */{ | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_c( ) | |
} | |
} | |
... | |
} |
첫 번째 방법에서 분리된 델타 QP 시그널링의 다른 예
표 6 및 표 7은 듀얼 트리 케이스의 크로마 CU 전용 또는 개별 트리 케이스의 듀얼 트리 및 단일 CU 모두에 대한 크로마 구성 요소에 대한 별도의 델타 QP 구문 신호의 두 가지 예를 제공한다. 표 6 및 표 7의 delta_qp_y( ) 및 delta_qp_c( ) 절차는 표 4에 나와 있는 delta_qp( ) 절차와 유사한 방식으로 구현된다. 크로마 CU에 대한 별도의 시그널링 델타 QP 구문의 경우에 유의해야 한다. 듀얼 트리 케이스 및/또는 단일 CU의 크로마 평면의 경우, 표 4의 PPS 레벨 제어 플래그 cu_qp_delta_enabled_flag는 luma 및 크로마 구성 요소 모두에 대해 한 번(공동으로) 또는 별도로 두 개의 제어 플래그(cu_qp_delta_enabled_flag_luma 및 cu_qp_delta_enabled_flag_chroma)로 구현할 수 있다.
이 방법이 위에서 언급한 유도의 방법 1과 결합될 때 특정한 경우를 가정하면, 듀얼 트리 경우의 크로마 CU 또는(적용되는 경우) 듀얼 트리의 경우 크로마 CU 및 별도의 트리 경우의 단일 CU에 대한 식 11은 다음과 같이 재작성될 수 있다:
(식 11.2)
여기서 QpY_basic은 다음과 같이 분할 트리 유형에 따라 결정된다:
- treeType이 SINGLE_TREE와 같으면, QpY_basic은 QpY와 같게 설정된다.
- 그렇지 않으면, QpY_basic은 좌표(xCb + cbWidth/2, yCb + cbHeight/2)가 있는 루마 샘플을 포함하는 병치된 루마 CU의 QpY 값과 동일하게 설정된다.
그리고 (xCb, yCb) 현재 픽처의 왼쪽 상단 루마 샘플에 대해 현재 크로마 코딩 블록과 함께 병치된 루마 코딩 블록의 왼쪽 상단 샘플을 지정한다.
그리고 QpY 값은 다음 식에 따라 계산할 수 있다:
(식 11.3)
여기서 , , 는 병치된 루마 CU에 대해 기존 방식으로 계산된다.
식 11.2의 상수 69는 가능한 최대 QP 값이 6만큼 증가함을 나타낸다. 식 11.3에서 상수 64는 가능한 최대 QP 값이 1 증가함을 나타낸다.
또는 Qp′Cb 및 Qp′Cb에 대한 최종 방정식에 _ 값을 추가할 수 있다.
Qp′Cb = QpCb + QpBdOffsetC +
Qp′Cr = QpCr + QpBdOffsetC +
이 경우 및 값을 계산하기 위해 방정식 11.1을 사용하고, 크로마 QP 매핑 함수를 사용하여 및 를 기반으로 기존 방식으로 QpCb 및 QpCr 값 계산을 수행한다. 기존의 크로마 QP 매핑 기능은 표 15에 설명되어 있다.
(2) 두 번째 방법: 이 방법에서, 값은 전술한 대응 예측 접근법 중 어느 하나에서 계산된 , 또는 값 중 하나의 합으로 도출되고, 값은 크로마 CU에서 시그널링될 수 있다. 이 방법에서 듀얼 트리의 경우 루마 CU는 델타 루마 CU 표현을 위한 구문 요소를 포함하고, 크로마 CU는 델타 크로마 CU 차이 표현을 위한 구문 요소를 포함한다.
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
... | |
if( treeType = = SINGLE_TREE | | treeType = = DUAL_TREE_LUMA ){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ]) | |
delta_qp_luma() | |
} | |
if( treeType = = SINGLE_TREE | | treeType = = DUAL_TREE_CHROMA ) { | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] || tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_chroma() | |
} | |
... | |
} |
두 번째 방법에 대한 델타 QP 시그널링의 예
이 방법에서 는 다음 식 12로 계산할 수 있다:
(식 12)
여기서 및 각각의 은 위에서 언급한 방법 중 하나에 의해 유도되며; 는 크로마 블록의 델타 QP 값으로, 식 13에 따라 유도할 수 있다:
(식 13)
이 경우 Cb 및 Cr 성분의 값은 다음 식 14로 계산할 수 있다:
(식 14)
이 방법에서는 예를 들어 다음 방식으로 delta_qp_luma 및 delta_qp_chroma 시그널링 기능을 구현할 수 있다.
delta_qp_luma( ) { | 설명자 |
if( cu_luma_qp_delta_enabled_flag && !IsLumaCuQpDeltaCoded ) { | |
cu_luma_qp_delta_abs | ae(v) |
if( cu_luma_qp_delta_abs ) | |
cu_luma_qp_delta_sign_flag | ae(v) |
} | |
} |
두 번째 방법에 대한 delta_qp_luma 시그널링의 예
표 7에서 구문 요소 cu_luma_qp_delta_enabled_flag는 델타 루마 QP가 현재 슬라이스/픽처/시퀀스에 대해 허용되는지를 지정하는 상위 레벨 플래그를 나타내며; IsCuLumaQpDeltaCoded 플래그는 델타 QP가 현재 깊이에서 시그널링되는지를 지정하고; 더 높거나 같은 깊이의 루마 CU 블록의 경우 delta_luma_qp() 요소는 가장 가까운 시그널링된 요소에서 상속된다. 구문 요소 cu_luma_qp_delta_enabled_flag 및 diff_cu_luma_qp_delta_depth는 IsLumaCuQpDeltaCoded 플래그 유도에 사용되며 PPS에서 신호를받을 수 있다.
delta_qp_chroma( ) { | 설명자 |
if( cu_chroma_qp_delta_enabled_flag && !IsChromaCuQpDeltaCoded ) { | |
cu_chroma_qp_delta_abs | ae(v) |
if( cu_chroma_qp_delta_abs ) | |
cu_chroma_qp_delta_sign_flag | ae(v) |
} | |
} |
두 번째 방법에 대한 delta_qp_chroma 시그널링의 예
표 10에서 구문 요소 cu_chroma_qp_delta_enabled_flag는 델타 크로마 CU가 현재 슬라이스/픽처/시퀀스에 대해 허용되는지를 지정하는 상위 레벨 플래그를 나타내고; IsCuChromaQpDeltaCoded 플래그는 델타 QP가 현재 깊이에서 시그널링되는지를 지정하고; 더 높거나 동일한 깊이에 있는 Chroma CU 블록의 경우 delta_chroma_qp() 요소는 가장 가까운 시그널링된 요소에서 상속된다. 구문 요소 cu_chroma_qp_delta_enabled_flag 및 diff_cu_chroma_qp_delta_depth는 IsChromaCuQpDeltaCoded 플래그 유도에 사용되며 PPS에서 신호를받을 수 있다.
pic_parameter_set_rbsp( ) { | 설명자 |
... | |
cu_luma qp_delta_enabled_flag | u(1) |
cu_chroma qp_delta_enabled_flag | u(1) |
if( cu_luma_qp_delta_enabled_flag ) | |
diff_cu_luma_qp_delta_depth | ue(v) |
if( cu_chroma_qp_delta_enabled_flag ) | |
diff_cu_chroma_qp_delta_depth | ue(v) |
... | |
} |
두 번째 방법에 대한 PPS 확장의 예
(3) 세 번째 방법: 이 방법에서 값은 위에서 언급한 대응 예측 접근법 중 하나에서 계산된 , 또는 값 중 하나와 일부 미리 정의된 깊이의 크로마 CU 깊이에서만 크로마 CU에서 시그널링될 수 있는 값의 합으로 도출된다. 깊이가 사전 정의된 것보다 높은 모든 크로마 CU, 값은 가장 가까운 처리된 CU에서 상속된다. 이 방법에서 듀얼 트리의 경우 루마 CU는 델타 루마 QP 표현을 위한 구문 요소를 포함하고, 크로마 CU는 사전 정의된 깊이보다 작거나 같은 깊이를 가진 크로마 CU에 대해서만 델타 크로마 QP 표현을 위한 구문 요소를 포함한다.
이 방법에서는 표 5와 표 6에 따라 델타 QP 값을 시그널링할 수 있으며 delta_qp_chroma() 함수는 다음과 같은 방식으로 구현할 수 있다:
delta_qp_chroma( ) { | 설명자 |
if( cu_chroma_qp_delta_enabled_flag && !IsChromaCuQpDeltaCoded ) { | |
cu_chroma_qp_delta_abs | ae(v) |
if( cu_chroma_qp_delta_abs ) | |
cu_chroma_qp_delta_sign_flag | ae(v) |
} | |
} |
두 번째 방법에 대한 delta_qp_chroma 시그널링의 예
표 12의 IsChromaCuQpDeltaCoded 플래그는 깊이가 사전 정의된 것보다 작거나 같은 크로마 CU에 대해서만 0과 같다.
(4) 네 번째 방법: 이 방법에서 특별한 구문 요소는 어떤 유형의 예측 계산이 사용되는지를 지정할 수 있다. 높은 수준의 요소 cu_qp_chroma_der_type은 코덱 파라미터 세트 중 하나, 예를 들어 PPP에서 시그널링될 수 있고 위에서 언급한 예측자 계산 방법의 유형을 지정한다.
pic_parameter_set_rbsp( ) { | 설명자 |
... | |
if( cu_qp_delta_enabled_flag ) | |
cu_qp_chroma_der_type | u(n) |
... | |
} |
네 번째 방법에 대한 PPS 확장의 예
이 방법에서 cu_qp_chroma_der_type은 어느 그룹의 예측 유형을 지정할 수 있으며, 그런 다음 미리 정의된 특정 예측을 그룹 내에서 사용할 수 있다.
cu_qp_chroma_der_type은 집합 의 인덱스를 나타내고, Cb 및 Cr 성분에 대한 값은 첫 번째부터 세 번째까지 전술한 방법 중 하나에서 을 기반으로 도출된다는 점에 유의해야 한다.
(5) 다섯 번째 방법: 이 방법에서 cu_qp_chroma_der_type은 모든 그룹 중 하나의 특정 예측 유형을 지정할 수 있다. 예를 들어, 다음 가능한 예측 세트를 가정하면
cu_qp_chroma_der_type은 집합 의 인덱스를 나타내고 Cb 성분 및 Cr 성분에 대한 값은 위에서 언급한 첫 번째부터 세 번째까지의 방법 중 하나에서 를 기반으로 도출된다.
여기서 이다.
III. 크로마 블록 QP 값을 결정하기 위한 세 번째 방법 설정
수신된 비트스트림에서 시그널링된 하나 이상의 기존 QP 값 및 색차 QP 오프셋 값(또는 델타 QP 오프셋)을 기반으로 색차 성분의 현재 블록에 대한 QP 값을 결정하고, 하나 이상의 기존 QP 값은 색차 성분에서 현재 블록과 관련된다.
이 섹션에서는 분리 트리(ST)가 가능한 경우 Chroma QP 오프셋 메커니즘 사용을 개시한다.
첫 번째 방법에서, Cb 및 Cr QP 값 및 는 및 에 기초하여 계산되며, 여기서 및 는 다음 식 15에 의해 계산된다:
(식 15)
여기서 값이 , 또는 값 중 하나에서 직접 취해지고, 이것은 위에서 언급한 대응 예측 접근법 중 하나에서 계산되며; / 변수는 cb_qp_offset_list 및 cu_chroma_qp_offset_idx 구문 요소를 기반으로 식 16에 따라 유도된다:
(식 16)
구문 요소 및 는 오프셋 테이블이며, 예를 들어 다음과 같은 방식으로 PPS에서 파라미터 세트에서 신호를 보낼 수 있다.
pic_parameter_set_rbsp( ) { | 설명자 |
... | |
chroma_qp_offset_list_enabled_flag | u(1) |
if( chroma_qp_offset_list_enabled_flag ) { | |
chroma_qp_offset_list_len_minus1 | ue(v) |
for( i = 0; i <= chroma_qp_offset_list_len_minus1; i++ ) { | |
cb_qp_offset_list[ i ] | se(v) |
cr_qp_offset_list[ i ] | se(v) |
} | |
} | |
... | |
} |
PPS에서 크로마 QP 오프셋 시그널링의 예
표 12에서 chroma_qp_offset_list_enabled_flag는 Chroma QP 목록 메커니즘이 사용되는지를 지정하며; chroma_qp_offset_list_len_minus1은 Cb 성분 및 Cr 성분에 대한 오프셋 목록의 길이를 지정하고; cb_qp_offset_list 및 cr_qp_offset_list는 Cb 성분 및 Cr 성분에 대해 가능한 오프셋을 지정한다.
는 및 계산에 사용될 수 있는 cb_qp_offset_list 및 cr_qp_offset_list에서 특정 요소를 지정한다.
표 15는 시그널링의 예를 보여준다.
chroma_qp_offset( ) { | 설명자 |
if( cu_chroma_qp_offset_enabled_flag && !IsCuChromaQpOffsetCoded ) { | |
cu_chroma_qp_offset_flag | ae(v) |
if( cu_chroma_qp_offset_flag && chroma_qp_offset_list_len_minus1 > 0 ) | |
cu_chroma_qp_offset_idx | ae(v) |
} | |
} |
크로마 QP 오프셋 시그널링의 예
별도의 트리가 가능한 경우 델타 QP 오프셋의 구문은 다음 표 16에 설명되어 있다.
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
... | |
if( treeType = = SINGLE_TREE | | treeType = = DUAL_TREE_LUMA ){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ]) | |
delta_qp_luma() | |
} | |
if( treeType = = SINGLE_TREE | | treeType = = DUAL_TREE_CHROMA ) { | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] || tu_cbf_cr[ x0 ][ y0 ]) | |
chroma_qp_offset() | |
} | |
... | |
} |
별도의 트리의 경우 델타 QP 오프셋 사용의 예
본 발명의 다른 실시예에 따르면, 양자화 파라미터에 대한 도출 프로세스를 위한 방법은 다음과 같이 설명된다.
부록 A. 양자화 파라미터에 대한 유도 프로세스
이 과정에서 루마 양자화 파라미터 Qp′ Y와 색차 양자화 파라미터 Qp′Cb 및 Qp′Cr이 도출된다.
이 프로세스에 대한 입력은 treeType이 SINGLE_TREE 또는 DUAL_TREE_LUMA와 같은 경우 현재 픽처의 왼쪽 상단 루마 샘플에 관련된 현재 루마 코딩 블록의 왼쪽 상단 샘플을 지정하는 루마 위치(xCb, yCb); 및 treeType이 DUAL_TREE_CHROMA와 같은 경우 현재 픽처의 왼쪽 상단 루마 샘플에 관련된 현재 크로마 코딩 블록과 함께 병치된 루마 코딩 블록의 왼쪽 상단 샘플을 지정하는 (xCb, yCb)이다.
이 과정에서 변수 QpY, 루마 양자화 파라미터 Qp′Y, 색차 양자화 파라미터 Qp′이 유도된다.
루마 위치(xQg, yQg)는 현재 픽처의 왼쪽 상단 루마 샘플을 기준으로 현재 양자화 그룹의 왼쪽 상단 루마 샘플을 지정한다. 수평 및 수직 위치 xQg 및 yQg는 xCb-(xCb & ((1 << Log2MinCuQpDeltaSize) - 1)) 및 yCb - (yCb & ((1 << Log2MinCuQpDeltaSize) - 1과 동일하게 각각 설정된다. 동일한 qPY_PRED를 공유하는 코딩 트리 블록 내에서 가장 작은 영역의 루마 크기를 결정한다.
예측 루마 양자화 파라미터 qPY_PRED는 다음 순서 단계에 의해 유도된다:
1. 변수 qPY_PREV는 다음과 같이 유도된다:
- 다음 조건 중 하나 이상이 참이면 qPY_PREV는 SliceQpY와 동일하게 설정된다.
- 현재 양자화 그룹은 슬라이스의 첫 번째 양자화 그룹이다.
- 현재 양자화 그룹은 타일의 첫 번째 양자화 그룹이다.
- 현재 양자화 그룹은 코딩 트리 블록 행의 첫 번째 양자화 그룹이고 entropy_coding_sync_enabled_flag는 1과 같다.
- 그렇지 않으면, qPY_PREV는 디코딩 순서에서 이전 양자화 그룹의 마지막 코딩 단위의 루마 양자화 파라미터 QpY와 동일하게 설정된다.
2. XXX 절에 지정된 z-scan 순서의 블록에 대한 가용성 유도 프로세스는 (xCb, yCb)와 같게 설정된 위치 (xCurr, yCurr) 및 (xQg - 1, yQg)와 같게 설정된 인접 위치 (xNbY, yNbY)로 입력으로서 호출되고, 출력은 availableA에 할당된다. 변수 QpY_A는 다음과 같이 유도된다:
- 다음 조건 중 하나 이상이 참이면 QpY_A는 qPY_PREV와 동일하게 설정된다:
- availableA는 FALSE와 같다.
- 루마 위치 (xQg-1, yQg)를 커버하는 루마 코딩 블록을 포함하는 코딩 트리 블록의 코딩 트리 블록 주소 ctbAddrA는 CtbAddrInTs와 같지 않으며, 여기서 ctbAddrA는 다음과 같이 유도된다:
xTmp =( xQg - 1 ) >> Log2MinTrafoSize
yTmp = yQg >> Log2MinTrafoSize
minTbAddrA = MinTbAddrZs[ xTmp ][ yTmp ]
ctbAddrA = minTbAddrA >>( 2 *( CtbLog2SizeY - Log2MinTrafoSize ) )
- 그렇지 않으면, QpY_A는 루마 코딩 블록 커버링 (xQg - 1, yQg)을 포함하는 코딩 단위의 루마 양자화 파라미터 QpY와 동일하게 설정된다.
3. XXX 절에 지정된 z-scan 순서의 블록에 대한 가용성 유도 프로세스는 (xCb, yCb)와 같게 설정된 위치(xCurr, yCurr) 및 (xQg, yQg - 1)와 같게 설정된 인접 위치(xNbY, yNbY)로 입력으로서 호출되고, 출력은 availableB에 할당된다. 변수 QpY_B는 다음과 같이 유도된다:
- 다음 조건 중 하나 이상이 참이면 QpY_B는 qPY_PREV와 동일하게 설정된다:
- availableB는 FALSE와 같다.
루마 위치(xQg, yQg-1)를 포함하는 루마 코딩 블록을 포함하는 코딩 트리 블록의 코딩 트리 블록 주소 ctbAddrB는 CtbAddrInTs와 같지 않으며, 여기서 ctbAddrB는 다음과 같이 유도된다.
xTmp = xQg >> Log2MinTrafoSize
yTmp =( yQg - 1 ) >> Log2MinTrafoSize
minTbAddrB = MinTbAddrZs[ xTmp ][ yTmp ]
ctbAddrB = minTbAddrB >>( 2 *( CtbLog2SizeY - Log2MinTrafoSize ) )
- 그렇지 않으면, QpY_B는 루마 코딩 블록 커버링(xQg, yQg-1)을 포함하는 코딩 단위의 루마 양자화 파라미터 QpY와 동일하게 설정된다.
4. 예측 루마 양자화 파라미터 qPY_PRED는 다음과 같이 유도된다:
qPY_PRED =(QpY_A + QpY_B + 1 ) >> 1
변수 QpY는 다음과 같이 유도된다:
QpY =((qPY_PRED + CuQpDeltaVal + 64 + 2 * QpBdOffsetY )%( 64 + QpBdOffsetY ) ) - QpBdOffsetY
루마 양자와 파라미터 Qp′Y는 다음과 같이 유도된다:
Qp′Y = QpY + QpBdOffsetY
QpCb 및 QpCr 변수는 각각 qPiCb 및 qPiCr과 동일한 인덱스 qPi를 기반으로 표 17에 지정된 QpC 값과 동일하게 설정되며, qPiCb 및 qPiCr은 다음과 같이 도출된다:
qPiCb = Clip3( -QpBdOffsetC, 69, QpY_basic + pps_cb_qp_offset + slice_cb_qp_offset )
qPiCr = Clip3( *?*QpBdOffsetC, 69, QpY_basic + pps_cr_qp_offset + slice_cr_qp_offset )
여기서 QpY_basic은 다음과 같이 분할 트리 유형에 따라 결정된다:
- treeType이 SINGLE_TREE와 같으면 QpY_basic은 QpY와 같게 설정된다.
- 그렇지 않으면 QpY_basic은 좌표(xCb + cbWidth/2, yCb + cbHeight/2)가 있는 루마 샘플을 포함하는 병치된 Luma CU의 QpY 값과 동일하게 설정된다.
Cb 성분 및 Cr 성분 Qp′ Cb 및 Qp′ Cr에 대한 색차 양자화 파라미터는 다음과 같이 유도된다:
Qp′Cb = QpCb + QpBdOffsetC
Qp′Cr = QpCr + QpBdOffsetC
qPi | <30 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | > 43 |
QpC | = qPi | 29 | 30 | 31 | 32 | 33 | 33 | 34 | 34 | 35 | 35 | 36 | 36 | 37 | 37 | = qPi - 6 |
qPi의 기능으로서 QpC의 사양(크로마 QP 매핑 기능)
본 발명의 제1 관점의 예에 따르면, 상기 방법은: 휘도 성분에서 병치된 블록의 하나 이상의 인접 블록의 기존 QP 값의 가중 합에 기초하여 색차 성분에서 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
예를 들어, 휘도 성분에서 병치된 블록의 인접 블록이 4 개 있으므로 색차 성분에서 현재 블록의 QP 값은 휘도 성분에서 병치된 블록의 인접 블록 4 개에 대한 QP 값의 평균 합계가 된다.
여기에서 언급할 필요가 있는 경우, 병치된 블록의 인접 블록이 존재하지 않을 수 있다. 이러한 상황에서 다른 기존 QP 값을 사용하여 색차 성분에서 블록의 QP 값을 결정하는 것이 좋다.
본 발명의 제1 관점의 예에 따르면, 상기 방법은 색차 성분의 현재 블록의 인접 블록의 기존 QP 값의 가중 합에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
본 발명의 제1 관점의 예에 따르면, 상기 방법은 휘도 성분의 병치된 블록의 QP 값 및 색차 성분의 현재 블록의 인접 블록의 기존 QP 값의 가중 합 모두에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
본 발명의 제1 관점의 예에 따르면, 상기 방법은: 색차 성분에서 현재 블록의 인접 블록의 기존 QP 값의 가중 합 및 색차 성분에서 병치된 블록의 인접 블록의 기존 QP 값의 가중 합 모두에 기초하여 색차 성분에서 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
다음은 전술한 실시예에서 나타낸 인코딩 방법 및 디코딩 방법의 애플리케이션 및 이를 사용하는 시스템에 대한 설명이다.
도 13은 콘텐츠 분배 서비스를 실현하기 위한 콘텐츠 공급 시스템(3100)을 나타내는 블록도이다. 이 콘텐츠 공급 시스템(3100)은 캡처 장치(3102), 단말 장치(3106)를 포함하고, 선택적으로 디스플레이(3126)를 포함한다. 캡처 장치(3102)는 통신 링크(3104)를 통해 단말 장치(3106)와 통신한다. 통신 링크는 위에서 설명된 통신 채널(13)을 포함할 수 있다. 통신 링크(3104)는 WIFI, 이더넷, 케이블, 무선(3G/4G/5G), USB 또는 이들의 임의의 종류의 조합 등을 포함하지만 이에 제한되지 않는다.
캡처 장치(3102)는 데이터를 생성하고, 상기 실시예에서 도시된 바와 같은 인코딩 방법으로 데이터를 인코딩할 수 있다. 대안적으로, 캡처 장치(3102)는 스트리밍 서버(도면에 도시되지 않음)에 데이터를 분배할 수 있고, 서버는 데이터를 인코딩하고 인코딩된 데이터를 단말 장치(3106)로 전송한다. 캡처 장치(3102)는 카메라, 스마트 폰 또는 패드, 컴퓨터 또는 랩톱, 화상 회의 시스템, PDA, 차량 탑재 장치 또는 이들의 조합 등을 포함하지만 이에 제한되지는 않는다. 예를 들어, 캡처 장치(3102)는 전술한 바와 같이 소스 장치(12)를 포함할 수 있다. 데이터가 비디오를 포함하는 경우, 캡처 장치(3102)에 포함된 비디오 인코더(20)는 실제로 비디오 인코딩 처리를 수행할 수 있다. 데이터가 오디오(즉, 음성)를 포함하는 경우, 캡처 장치(3102)에 포함된 오디오 인코더는 실제로 오디오 인코딩 처리를 수행할 수 있다. 일부 실제 시나리오의 경우, 캡처 장치(3102)는 인코딩된 비디오 및 오디오 데이터를 함께 다중화하여 분배한다. 예를 들어 화상 회의 시스템과 같은 다른 실제 시나리오에서는 인코딩된 오디오 데이터와 인코딩된 비디오 데이터가 다중화되지 않는다. 캡처 장치(3102)는 인코딩된 오디오 데이터 및 인코딩된 비디오 데이터를 단말 장치(3106)에 개별적으로 분배한다. 콘텐츠 공급 시스템(3100)에서 단말 장치(310)는 인코딩된 데이터를 수신하여 재생한다. 단말 장치(3106)는 와 같은 데이터 수신 및 복구 기능을 갖춘 장치일 수 있으며, 예를 들어, 전술한 인코딩된 데이터를 디코딩할 수 있는 스마트 폰 또는 패드(3108), 컴퓨터 또는 랩탑(3110), 네트워크 비디오 레코더(NVR)/디지털 비디오 레코더(DVR)(3112), TV(3114), 셋톱 박스(STB)(3116), 화상 회의 시스템(3118), 비디오 감시 시스템(3120), 퍼스널 디지털 어시스턴트(Personal Digital Assistant, PDA)(3122), 차량 탑재 장치(3124), 또는 이들 중 임의의 조합 등이 될 수 있다. 예를 들어, 단말 장치(3106)는 전술한 바와 같이 목적지 장치(14)를 포함할 수 있다. 인코딩된 데이터가 비디오를 포함하는 경우, 단말 장치에 포함된 비디오 디코더(30)가 비디오 디코딩을 수행하기 위해 우선 순위를 갖는다. 인코딩된 데이터가 오디오를 포함하는 경우, 단말 장치에 포함된 오디오 디코더가 오디오 디코딩 처리를 수행하기 위해 우선 순위를 갖는다.
그 디스플레이가 있는 단말 장치의 경우, 예를 들어, 스마트 폰 또는 패드(3108), 컴퓨터 또는 노트북(3110), 네트워크 비디오 레코더(NVR)/디지털 비디오 레코더(DVR)(3112), TV(3114), 퍼스널 디지털 어시스턴트(Personal Digital Assistant, PDA)(3122) 또는 차량 탑재 장치(3124)의 경우, 단말 장치는 디코딩된 데이터를 그 디스플레이에 공급할 수 있다. 디스플레이가 없는 단말 장치, 예를 들어, STB(3116), 화상 회의 시스템(3118) 또는 비디오 감시 시스템(3120)의 경우, 외부 디스플레이(3126)가 내부에 접촉되어 디코딩된 데이터를 수신하고 보여준다.
본 시스템의 각 장치가 인코딩 또는 디코딩을 수행할 때, 전술한 실시예에 도시된 바와 같이 픽처 인코딩 장치 또는 픽처 디코딩 장치가 사용될 수 있다.
도 14는 단말 장치(3106)의 일례의 구조를 도시하는 도면이다. 단말 장치(3106)가 캡처 장치(3102)로부터 스트림을 수신한 후, 프로토콜 프로세싱 유닛(3202)은 스트림의 전송 프로토콜을 분석한다. 프로토콜에는 실시간 스트리밍 프로토콜(Real Time Streaming Protocol, RTSP), 하이퍼 텍스트 트랜스퍼 프로토콜(Hyper Text Transfer Protocol, HTTP), HTTP 라이브 스트리밍 프로토콜(HTTP Live Streaming Protocol, HLS), MPEG-DASH, 실시간 트랜스포트 프로토콜(Real-time Transport Protocol, RTP), 실시간 메시징 프로토콜(Real Time Messaging Protocol, RTMP), 또는 이들의 임의의 종류의 조합 등이 포함되지만 이에 국한되지는 않는다.
프로토콜 프로시딩 유닛(protocol proceeding unit)(3202)가 스트림을 처리한 후 스트림 파일이 생성된다. 파일은 역 다중화 유닛(3204)으로 출력된다. 역 다중화 유닛(3204)은 다중화된 데이터를 인코딩된 오디오 데이터와 인코딩된 비디오 데이터로 분리할 수 있다. 위에서 설명한 바와 같이, 예를 들어 화상 회의 시스템과 같은 일부 실제 시나리오의 경우, 인코딩된 오디오 데이터와 인코딩된 비디오 데이터는 다중화되지 않는다. 이러한 상황에서, 인코딩된 데이터는 역 다중화 유닛(3204)을 통하지 않고 비디오 디코더(3206) 및 오디오 디코더(3208)로 전송된다.
역 다중화 처리를 통해 비디오 ES(Elementary Stream), 오디오 ES 및 선택적으로 자막이 생성된다. 전술한 실시예에서 설명된 비디오 디코더(30)를 포함하는 비디오 디코더(3206)는 전술한 실시예에 도시된 디코딩 방법에 의해 비디오 ES를 디코딩하여 비디오 프레임을 생성하고, 이 데이터를 동기 유닛(3212)에 공급한다. 오디오 디코더(3208)는 오디오 ES를 디코딩하여 오디오 프레임을 생성하고 이 데이터를 동기 유닛(3212)에 공급한다. 대안적으로, 비디오 프레임은 동기 유닛(3212)에 공급하기 전에 버퍼(도 14에 도시되지 않음)에 저장할 수 있다. 유사하게, 오디오 프레임은 동기 유닛(3212)에 공급하기 전에 버퍼(도 14에 도시되지 않음)에 저장할 수 있다.
동기 유닛(3212)은 비디오 프레임과 오디오 프레임을 동기화하고, 비디오/오디오를 비디오/오디오 디스플레이(3214)에 공급한다. 예를 들어, 동기 유닛(3212)은 비디오 및 오디오 정보의 프리젠테이션을 동기화한다. 정보는 코딩된 시청각 데이터의 표현과 관련된 타임 스탬프와 데이터 스트림 자체의 전달에 관한 타임 스탬프를 사용하여 구문으로 코딩할 수 있다.
스트림에 자막이 포함된 경우, 자막 디코더(3210)는 자막을 디코딩하여 비디오 프레임 및 오디오 프레임과 동기화하여 비디오/오디오/자막 디스플레이(3216)에 비디오/오디오/자막을 제공한다.
본 발명은 전술한 시스템에 제한되지 않고, 전술한 실시예에서의 화상 인코딩 장치 또는 화상 디코딩 장치는 다른 시스템, 예를 들어 자동차 시스템에 통합될 수 있다.
첫 번째 예에서, 픽처의 현재 블록의 역 양자화를 위한 방법이 제공되며, 여기서 방법은 디코더에 의해 수행되고, 픽처는 휘도 성분 및 색차 성분, 휘도 성분 및/또는 상기 색차 성분은 다수의 블록으로 분할되며, 상기 방법은: 수신된 비트스트림으로부터 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하는 단계 - 여기서 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록과 관련됨 - ; 하나 이상의 기존 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계; 결정된 QP 값을 사용하여 색차 성분의 현재 블록에 대해 역 양자화를 수행하는 단계를 포함한다.
예를 들어, 하나 이상의 기존 QP 값은 다음: 휘도 성분의 병치된 블록의 QP 값; 휘도 성분의 병치된 블록의 하나 이상의 인접 블록; 및 색차 성분의 현재 블록의 하나 이상의 인접 블록 중 적어도 하나를 포함한다.
예시적인 구현에서, 상기 방법은: 휘도 성분의 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
대안적으로 또는 추가적으로, 휘도 성분의 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계는: 현재 색차 블록의 오른쪽 하단 쿼터에 있는 왼쪽 상단 샘플과 병치된 휘도 블록을 결정하는 단계; 결정된 휘도 블록의 QP 값()을 검색하는 단계; 다음 식 또는 다음 식으로부터 유도된 새로운 식을 사용하여 현재 색차 블록에 대한 파라미터 및 파라미터를 결정하는 단계: , 및/또는 ; 및 파라미터 또는 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 포함한다.
예시적인 구현에서, 색차 성분의 현재 블록에 대한 QP 값은 다음 식 또는 다음 식으로부터 유도된 새로운 공식에 따라 결정된다: Qp′Cb = QpCb + QpBdOffsetC + , 및/또는 Qp′Cr = QpCr + QpBdOffsetC + ; 여기서 QpCb 및 QpCr은 크로마 QP 매핑 함수를 적용하여 파라미터 및 파라미터로부터 획득된다.
예를 들어, 휘도 성분에서 병치된 블록의 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계는: 현재 색차 블록의 오른쪽 하단 쿼터의 좌측 상단 샘플과 병치된 휘도 블록을 결정하는 단계; 결정된 휘도 블록의 QP 값()을 검색하는 단계; 다음 식 또는 다음 식으로부터 유도된 새로운 공식을 사용하여 현재 색차 블록에 대한 및 파라미터를 결정하는 단계: , 및/또는 ; 파라미터 및 파라미터 또는 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 포함한다.
일부 예시적인 구현에서, 방법은 단일 CU에 적용되고 휘도 성분의 병치 블록은 현재 블록과 동일하다.
예를 들어, 이 방법은 하나의 PPS-신호 제어 플래그(예를 들어, cu_qp_delta_enabled_flag)를 기반으로 루마 및 크로마 평면에 대해 공동으로 적용되며; 제어 플래그(예를 들어, cu_qp_delta_enabled_flag)가 참(true)이면 방법은 루마 및 크로마 QP 유도에 적용되거나; 또는 제어 플래그(예를 들어, cu_qp_delta_enabled_flag)가 거짓(false)이면, 방법은 루마 및 크로마 QP 유도 모두에 적용되지 않는다.
일부 예시적인 구현에서, 방법은 2 개의 PPS-기반 제어 플래그(예를 들어, cu_qp_delta_enabled_flag_luma 및 cu_qp_delta_enabled_flag_chroma)에 기반하여 루마 및 크로마 평면에 대해 개별적으로 적용되며; 제1 제어 플래그(예를 들어, cu_qp_delta_enabled_flag_luma)가 참이면, 방법은 루마 QP 유도에 적용되거나; 또는 제1 제어 플래그(예를 들어, cu_qp_delta_enabled_flag_luma)가 거짓이면, 방법은 루마 QP 유도에 적용되지 않거나; 및/또는 제2 제어 플래그(예를 들어 cu_qp_delta_enabled_flag_chroma)가 참이면, 방법은 크로마 QP 유도를 위해 적용되거나; 또는 제2 제어 플래그(예를 들어, cu_qp_delta_enabled_flag_chroma)가 거짓이면, 방법은 크로마 QP 유도에 적용되지 않는다.
예를 들어, 상기 방법은 휘도 성분의 병치된 블록의 하나 이상의 인접 블록의 기존 QP 값의 가중 합에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
대안적으로 또는 추가적으로, 상기 방법은 색차 성분의 현재 블록의 하나 이상의 인접 블록의 기존 QP 값의 가중 합에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
대안적으로 또는 추가적으로, 상기 방법은 휘도 성분의 병치된 블록의 QP 값 및 색차 성분의 현재 블록의 하나 이상의 인접 블록의 기존 QP 값의 가중 합 모두에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
대안적으로 또는 추가적으로, 상기 방법은: 색차 성분의 현재 블록의 인접 블록의 기존 QP 값의 가중 합 및 휘도 성분의 병치된 블록의 인접 블록의 기존 QP 값의 가중 합 모두에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
일부 예시적인 구현에서, 상기 방법은: 하나 이상의 기존 QP 값 및 다음 중 적어도 하나에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다: 수신된 비트스트림에서 시그널링된 색차 델타 QP 값 수신된 비트스트림, 또는 수신된 비트스트림에서 시그널링된 색차 QP 오프셋 값.
일부 예시적인 구현에서, 방법은: 현재 블록의 파티션 깊이 값을 획득하는 단계, 및 파티션 깊이 값이 임계 값보다 낮으면, 하나 이상의 기존 QP 값 및 수신된 비트스트림에서 시그널링된 색차 델타 QP 값에 기초하여 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계를 더 포함한다.
예를 들어 임계 값은 미리 정의된 수 또는 파라미터 세트에서 시그널링된 수에 기초하여 결정된다.
예를 들어, 휘도 성분 및 색차 성분은 단일 파티션 트리에 의해 다중 블록으로 분할되거나, 휘도 성분 및 색차 성분이 별도의 분할 트리에 의해 독립적으로 분할된다.
일부 예시적인 구현에서, 델타 QP 구문 요소(예컨대, 색차 델타 QP 값을 나타내는 델타 QP 구문 요소, 즉 delta_qp_c)는 다음 표에 따라 비트스트림에서 시그널링된다:
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
if( treeType = = SINGLE_TREE){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] | | tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ] ) | |
delta_qp( ) | |
} | |
else{ | |
if(treeType = = DUAL_TREE_LUMA){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] ) | |
delta_qp( ) | |
} | |
else /* DUAL_TREE_CROMA */{ | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
} | |
} | |
... | |
} |
일부 예시적인 실시예에서, 델타 QP 구문 요소(예를 들어, 색차 델타 QP 값을 나타내는 델타 QP 구문 요소, 즉 delta_qp_c)는 다음 표에 따라 비트스트림에서 시그널링된다:
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
if( treeType = = SINGLE_TREE){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] | | tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ] ) | |
delta_qp_y( ) | |
} | |
else{ | |
if(treeType = = DUAL_TREE_LUMA){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] ) | |
delta_qp_y( ) | |
} | |
else /* DUAL_TREE_CROMA */{ | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_c( ) | |
} | |
} | |
... | |
} |
일부 예시적인 구현에서, 델타 QP 구문 요소(예를 들어, 색차 델타 QP 값을 나타내는 델타 QP 구문 요소, 즉 delta_qp_c)는 다음 표에 따라 비트스트림에서 시그널링된다:
transform_unit( x0, y0, tbWidth, tbHeight, treeType ) { | 설명자 |
if( treeType = = SINGLE_TREE){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ]) | |
delta_qp_y( ) | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_c( ) | |
} | |
else{ | |
if(treeType = = DUAL_TREE_LUMA){ | |
tu_cbf_luma[ x0 ][ y0 ] | ae(v) |
if( tu_cbf_luma[ x0 ][ y0 ] ) | |
delta_qp_y( ) | |
} | |
else /* DUAL_TREE_CROMA */{ | |
tu_cbf_cb[ x0 ][ y0 ] | ae(v) |
tu_cbf_cr[ x0 ][ y0 ] | ae(v) |
if(tu_cbf_cb[ x0 ][ y0 ] | | tu_cbf_cr[ x0 ][ y0 ]) | |
delta_qp_c( ) | |
} | |
} | |
... | |
} |
일부 실시예에서, 전술한 방법 중 임의의 것을 수행하기 위한 처리 회로를 포함하는 디코딩 장치가 제공된다.
일부 실시예에서, 컴퓨터 프로그램이 컴퓨팅 장치에서 실행될 때, 전술한 방법 중 임의의 것에 따라 방법을 수행하기 위한 프로그램 코드를 포함하는 컴퓨터 프로그램 제품.
예시적인 구현에서, 픽처의 현재 블록의 경계 파티션을 위한 디코딩 장치가 제공되며, 장치는: 하나 이상의 프로세서; 및 프로세서에 결합되고 프로세서에 의한 실행을 위한 프로그래밍을 저장하는 비 일시적 컴퓨터 판독 가능형 저장 매체를 포함하고, 상기 프로그래밍은 프로세서에 의해 실행될 때, 전술한 임의의 방법을 수행하도록 디코더를 구성한다.
일 실시예에서, 컴퓨터로 읽을 수 있는 저장 매체가 제공되며, 컴퓨터로 하여금 전술한 방법 중 어느 하나에 따라 방법을 실행하게 하는 프로그램을 기록한다.
하나 이상의 예들에서, 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수 있다. 소프트웨어로 구현되는 경우, 기능은 컴퓨터 판독 가능 매체에 하나 이상의 명령 또는 코드로 저장되거나 전송될 수 있으며 하드웨어 기반 처리 장치에 의해 실행될 수 있다. 컴퓨터 판독 가능 매체는 데이터 저장 매체와 같은 유형의 매체에 해당하는 컴퓨터 판독 가능형 저장 매체 또는 예를 들어 통신 프로토콜에 따라 컴퓨터 프로그램을 한 장소에서 다른 장소로 전송하는 것을 용이하게 하는 임의의 매체를 포함하는 통신 매체를 포함할 수 있다. 이러한 방식으로, 컴퓨터 판독 가능 매체는 일반적으로 (1) 비 일시적인 유형의 컴퓨터 판독 가능형 저장 매체 또는 (2) 신호 또는 반송파와 같은 통신 매체에 대응할 수 있다. 데이터 저장 매체는 본 개시에 설명된 기술의 구현을 위한 명령어, 코드 및/또는 데이터 구조를 검색하기 위해 하나 이상의 컴퓨터 또는 하나 이상의 프로세서에 의해 액세스될 수 있는 임의의 이용 가능한 매체일 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독 가능 매체를 포함할 수 있다.
제한이 아닌 예로서, 이러한 컴퓨터 판독 가능형 저장 매체는 RAM, ROM, EEPROM, CD-ROM 또는 기타 광학 디스크 저장 장치, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 플래시 메모리, 또는 명령 또는 데이터 구조의 형태로 원하는 프로그램 코드를 저장하는 데 사용할 수 있으며 컴퓨터에서 액세스할 수 있다. 또한 모든 연결을 컴퓨터 판독 가능 매체라고 한다. 예를 들어, 동축 케이블, 광섬유 케이블, 트위스트 페어, 디지털 가입자 회선(DSL) 또는 적외선, 라디오 및 마이크로파와 같은 무선 기술을 사용하여 웹 사이트, 서버 또는 기타 원격 소스에서 지침이 전송되는 경우 동축 케이블, 광섬유 케이블, 연선, DSL 또는 적외선, 라디오 및 마이크로파와 같은 무선 기술이 매체의 정의에 포함된다. 그렇지만, 컴퓨터 판독 가능형 저장 매체 및 데이터 저장 매체는 연결, 반송파, 신호 또는 기타 일시적인 매체를 포함하지 않고 대신 비 일시적 유형의 저장 매체에 대한 것임을 이해해야 한다. 여기에 사용된 디스크 및 디스크에는 콤팩트 디스크(compact disc, CD), 레이저 디스크, 광 디스크, 디지털 버서타일 디스크(Digital Versatile Disc, DVD), 플로피 디스크 및 블루-레이(Blu-ray) 디스크가 포함된다. 디스크는 일반적으로 데이터를 자기적으로 재생하는 반면 디스크는 레이저로 데이터를 광학적으로 재생한다. 위의 조합도 컴퓨터 판독 가능 매체의 범위 내에 포함되어야 한다.
명령은 하나 이상의 디지털 신호 프로세서(digital signal processor, DSP), 범용 마이크로프로세서, 주문형 집적 회로(application specific integrated circuits, ASIC), 필드 프로그래머블 로직 어레이(field programmable logic array, FPGA) 또는 기타 동등한 통합 또는 이산 논리 회로와 같은 하나 이상의 프로세서에 의해 실행될 수 있다. 따라서, 본 명세서에서 사용되는 용어 "프로세서"는 전술한 구조 또는 본 명세서에 설명된 기술의 구현에 적합한 임의의 다른 구조를 지칭할 수 있다. 또한, 일부 양상에서, 여기에 설명된 기능은 인코딩 및 디코딩을 위해 구성된 전용 하드웨어 및/또는 소프트웨어 모듈 내에 제공되거나 결합된 코덱에 통합될 수 있다. 또한, 기술은 하나 이상의 회로 또는 논리 요소에서 완전히 구현될 수 있다.
본 개시의 기술은 무선 핸드셋, 집적 회로(IC) 또는 IC 세트(예를 들어, 칩 세트)를 포함하는 매우 다양한 장치 또는 장치에서 구현될 수 있다. 개시된 기술을 수행하도록 구성된 장치의 기능적 측면을 강조하기 위해 다양한 구성 요소, 모듈 또는 유닛이 본 개시에서 설명되지만, 반드시 상이한 하드웨어 유닛에 의한 실현을 필요로 하는 것은 아니다. 오히려, 위에서 설명된 바와 같이, 다양한 유닛이 코덱 하드웨어 유닛으로 결합되거나, 적절한 소프트웨어 및/또는 펌웨어와 함께, 위에서 설명된 하나 이상의 프로세서를 포함하는 상호 작동 하드웨어 유닛의 집합에 의해 제공될 수 있다.
논리 연산자
다음 논리 연산자는 다음과 같이 정의된다.
x && y x와 y의 부울 논리 "논리곱"
x | | y x 및 y의 부울 논리 "논리합"
! 논리 부울 "논리부정"
x ? y:z x가 TRUE이거나 0이 아니면 y 값으로 평가되고; 그렇지 않으면 z 값으로 평가된다.
관계 연산자
다음 관계 연산자는 다음과 같이 정의된다:
> 보다 크다
> = 크거나 같다
< 작다
<= 보다 작거나 같다
= = 같다
! = 같지 않다
관계 연산자가 값 "na"(해당 없음)(not applicable)가 할당된 구문 요소 또는 변수에 적용되면 값 "na"는 구문 요소 또는 변수에 대한 고유한 값으로 처리된다. 값 "na"는 임의의 다른 값과 같지 않은 것으로 간주된다.
비트 연산자
다음 비트 연산자는 다음과 같이 정의된다:
& 비트 단위 "그리고". 정수 인수에 대해 연산할 때 정수 값의 2의 보수 표현에 대해 연산한다. 다른 인수보다 적은 비트를 포함하는 이진 인수에 대해 작업할 때 더 짧은 인수는 0과 같은 더 많은 중요한 비트를 추가하여 확장된다.
| 비트 단위 "또는". 정수 인수에 대해 연산할 때 정수 값의 2의 보수 표현에 대해 연산한다. 다른 인수보다 적은 비트를 포함하는 이진 인수에 대해 작업할 때 더 짧은 인수는 0과 같은 더 많은 중요한 비트를 추가하여 확장된다.
^ 비트 단위 "배타적 또는". 정수 인수에 대해 연산할 때 정수 값의 2의 보수 표현에 대해 연산한다. 다른 인수보다 적은 비트를 포함하는 이진 인수에 대해 작업할 때 더 짧은 인수는 0과 같은 더 많은 중요한 비트를 추가하여 확장된다.
x >> y x를 y 이진수로 표현한 2의 보수 정수 표현의 산술 오른쪽 시프트. 이 함수는 y의 음이 아닌 정수 값에 대해서만 정의된다. 오른쪽 시프트의 결과로 MSB(최상위 비트)로 시프트된 비트는 시프트 연산 이전의 x의 MSB와 동일한 값을 가진다.
x << y y 이진수 x의 2의 보수 정수 표현의 산술 왼쪽 시프트. 이 함수는 y의 음이 아닌 정수 값에 대해서만 정의된다. 왼쪽 이동의 결과로 최하위 비트(LSB)로 이동된 비트의 값은 0이다.
할당 연산자
다음 산술 연산자는 다음과 같이 정의된다:
= 할당 연산자
+ + 증가, 즉 x + +는 x = x + 1과 같다. 배열 인덱스에서 사용되는 경우 증분 연산 전에 변수 값으로 평가된다.
- - 감소, 즉 x--는 x = x-1과 동일하다. 배열 인덱스에서 사용되는 경우 감소 연산 전에 변수 값으로 평가된다.
+= 지정된 양만큼 증가, 즉 x + = 3은 x = x + 3과 동일하고 x + =(-3)는 x = x +(-3)과 동일하다.
-= 지정된 양만큼 감소, 즉 x-= 3은 x = x-3과 동일하고 x -=(-3)는 x = x -(-3)과 동일하다.
범위 표기
다음 표기법은 값 범위를 지정하는 데 사용된다:
x는 y에서 z까지의 정수 값을 취하고, x, y, z는 정수이고 z는 y보다 크다.
Claims (25)
- 픽처의 현재 블록의 역 양자화 방법으로서,
상기 역 양자화 방법은 디코더에 의해 수행되고, 상기 픽처는 휘도 성분과 색차 성분을 포함하고, 상기 휘도 성분 및/또는 상기 색차 성분은 다중 블록으로 분할되고, 상기 역 양자화 방법은:
비트스트림으로부터 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하는 단계(902) - 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록과 관련됨 - ;
상기 하나 이상의 기존 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계(904); 및
상기 결정된 QP 값을 사용하여 상기 색차 성분의 현재 블록에 대해 역 양자화를 수행하는 단계(906)
를 포함하고,
상기 하나 이상의 기존 QP 값은 상기 휘도 성분의 병치된 블록(collocated block)의 QP 값을 포함하며,
상기 하나 이상의 기존 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계(904)는:
상기 휘도 성분의 병치된 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계
를 포함하고,
상기 휘도 성분의 병치된 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계는:
상기 현재 색차 블록의 특정 위치에서 샘플과 함께 병치된 휘도 블록의 QP 값을 검색하는 단계; 및
상기 결정된 휘도 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계
를 포함하며,
상기 특정 위치에 있는 샘플은 상기 현재 색차 블록의 오른쪽 하단 쿼터(bottom right quarter) 내의 왼쪽 상단 샘플(top-left sample)인, 역 양자화 방법. - 제1항에 있어서,
상기 역 양자화 방법은 cu_qp_delta_enabled_flag와 같은 하나의 PPS-신호 제어 플래그에 기초하여 루마 및 크로마(Luma and Chroma) 평면에 대해 공동으로 적용되며;
cu_qp_delta_enabled_flag와 같은 상기 제어 플래그가 참(true)이면, 상기 역 양자화 방법은 루마 및 크로마 QP 유도 모두에 적용되거나; 또는
cu_qp_delta_enabled_flag와 같은 상기 제어 플래그가 거짓(false)이면, 상기 역 양자화 방법은 루마 및 크로마 QP 유도에 적용되지 않는, 역 양자화 방법. - 제1항에 있어서,
상기 역 양자화 방법은 두 개의 픽처 파라미터 세트인 PPS-기반 제어 플래그에 기초하여 루마 및 크로마 평면에 대해 공동으로 적용되며;
제1 제어 플래그가 참이면, 상기 역 양자화 방법은 루마 QP 유도에 적용되거나; 또는 상기 제1 제어 플래그가 거짓이면, 상기 역 양자화 방법은 루마 QP 유도에 적용되지 않으며; 및/또는
제2 제어 플래그가 참이면, 상기 역 양자화 방법은 크로마 QP 유도에 적용되거나; 또는 상기 제2 제어 플래그가 거짓이면, 상기 역 양자화 방법은 크로마 QP 유도에 적용되지 않는, 역 양자화 방법. - 제1항에 있어서,
상기 역 양자화 방법은:
상기 휘도 성분의 상기 병치된 블록의 상기 하나 이상의 인접 블록의 기존 QP 값의 가중 합에 기초하여 상기 색차 성분의 상기 현재 블록에 대한 QP 값을 결정하는 단계
를 더 포함하는 역 양자화 방법. - 제1항에 있어서,
상기 역 양자화 방법은:
상기 하나 이상의 기존 QP 값 및 다음:
상기 비트스트림에서 시그널링된 색차 델타 QP 값, 또는
상기 비트스트림에서 시그널링된 색차 QP 오프셋 값
중 하나 이상에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계
를 더 포함하는 역 양자화 방법. - 제5항에 있어서,
상기 역 양자화 방법은:
상기 현재 블록의 파티션 깊이 값을 획득하는 단계, 및
상기 파티션 깊이 값이 임계 값보다 낮으면, 상기 하나 이상의 기존 QP 값 및 상기 비트스트림에서 시그널링된 색차 델타 QP 값에 기초하여 상기 색차 성분의 상기 현재 블록에 대한 QP 값을 결정하는 단계
를 더 포함하는 역 양자화 방법. - 제6항에 있어서,
상기 임계 값은 미리 정의된 숫자(pre-defined number) 또는 파라미터 세트에서 시그널링된 숫자에 기초하여 결정되는, 역 양자화 방법. - 제1항에 있어서,
상기 휘도 성분 및 상기 색차 성분은 별도의 파티션 트리에 의해 독립적으로 분할되는, 역 양자화 방법. - 픽처의 현재 블록의 양자화 방법으로서,
상기 양자화 방법은 인코더에 의해 수행되고, 상기 픽처는 휘도 성분과 색차 성분을 포함하고, 상기 휘도 성분 및/또는 상기 색차 성분은 다중 블록으로 분할되고, 상기 양자화 방법은:
결정된 QP 값을 사용하여 색차 성분의 상기 현재 블록에 대해 양자화를 수행하는 단계(1010);
하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하고 상기 하나 이상의 기존 QP를 비트스트림에 포함시키는 단계(1020) - 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록과 관련됨 - ;
상기 하나 이상의 기존 QP 값 및 상기 결정된 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하는 단계(1030); 및
상기 QP 파라미터를 상기 비트스트림에 포함시키는 단계(1040)
를 포함하고,
상기 하나 이상의 기존 QP 값은 상기 휘도 성분의 병치된 블록(collocated block)의 QP 값을 포함하며,
상기 하나 이상의 기존 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계(1030)는:
상기 휘도 성분의 병치된 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계
를 포함하고,
상기 휘도 성분의 병치된 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계는:
상기 현재 색차 블록의 특정 위치에서 샘플과 함께 병치된 휘도 블록의 QP 값을 검색하는 단계; 및
상기 결정된 휘도 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하는 단계
를 포함하며,
상기 특정 위치에 있는 샘플은 상기 현재 색차 블록의 오른쪽 하단 쿼터(bottom right quarter) 내의 왼쪽 상단 샘플(top-left sample)인, 양자화 방법. - 프로그램이 기록되어 있는 컴퓨터 판독 가능형 저장 매체로서,
상기 프로그램은 컴퓨터가 제1항 내지 제9항 중 어느 한 항의 방법을 수행할 수 있게 하는, 컴퓨터 판독 가능형 저장 매체. - 픽처의 현재 블록의 경계 분할을 위한 디코딩 장치로서,
하나 이상의 프로세서; 및
상기 프로세서에 결합되고 상기 프로세서에 의한 실행을 위한 프로그래밍을 저장하는 비 일시적 컴퓨터 판독 가능형 저장 매체
를 포함하며, 상기 프로그래밍은 상기 프로세서에 의해 실행될 때, 상기 디코더가 제1항 내지 제8항 중 어느 한 항에 따른 방법을 수행하도록 구성하는, 디코딩 장치. - 픽처의 현재 블록의 경계 분할을 위한 인코딩 장치로서,
하나 이상의 프로세서; 및
상기 프로세서에 결합되고 상기 프로세서에 의한 실행을 위한 프로그래밍을 저장하는 비 일시적 컴퓨터 판독 가능형 저장 매체
를 포함하며, 상기 프로그래밍은 상기 프로세서에 의해 실행될 때, 상기 인코더가 제9항에 따른 방법을 수행하도록 구성하는, 인코딩 장치. - 픽처의 현재 블록의 역 양자화 장치로서,
상기 픽처는 휘도 성분 및 색차 성분을 포함하고, 상기 휘도 성분 및/또는 색차 성분은 다중 블록으로 분할되고, 상기 역 양자화 장치는:
비트스트림으로부터 하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하기 위한 비트스트림 파서(1110) - 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록과 관련됨 - ;
상기 하나 이상의 기존 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하기 위한 QP 결정 유닛(1120);
상기 결정된 QP 값을 사용하여 상기 색차 성분의 현재 블록에 대해 역 양자화를 수행하기 위한 역 양자화기(1130)
를 포함하고,
상기 하나 이상의 기존 QP 값은 상기 휘도 성분의 병치된 블록(collocated block)의 QP 값을 포함하며, 상기 QP 결정 유닛(1120)은, 상기 휘도 성분의 병치된 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하도록 더 구성되고,
상기 QP 결정 유닛(1120)은, 상기 현재 색차 블록의 특정 위치에서 샘플과 함께 병치된 휘도 블록의 QP 값을 검색하고, 상기 결정된 휘도 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하도록 더 구성되며,
상기 특정 위치에 있는 샘플은 상기 현재 색차 블록의 오른쪽 하단 쿼터(bottom right quarter) 내의 왼쪽 상단 샘플(top-left sample)인, 역 양자화 장치. - 픽처의 현재 블록의 양자화 장치로서,
상기 픽처는 휘도 성분 및 색차 성분을 포함하고, 상기 휘도 성분 및/또는 색차 성분은 다중 블록으로 분할되고, 상기 양자화 장치는:
결정된 QP 값을 사용하여 상기 색차 성분의 현재 블록에 대해 양자화를 수행하기 위한 양자화기(1210);
하나 이상의 기존 양자화 파라미터(quantization parameter, QP) 값을 획득하고 상기 하나 이상의 기존 QP를 비트스트림에 포함시키기 위한 페칭 유닛(1220) - 상기 하나 이상의 기존 QP 값은 상기 색차 성분의 현재 블록과 관련됨 - ;
상기 하나 이상의 기존 QP 값 및 상기 결정된 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 파라미터를 결정하기 위한 QP 결정 유닛(1230); 및
상기 QP 파라미터를 상기 비트스트림에 포함시키기 위한 비트스트림 생성 유닛(1240)
을 포함하고,
상기 하나 이상의 기존 QP 값은 상기 휘도 성분의 병치된 블록(collocated block)의 QP 값을 포함하며, 상기 QP 결정 유닛(1230)은, 상기 휘도 성분의 병치된 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하도록 더 구성되고,
상기 QP 결정 유닛(1230)은, 상기 현재 색차 블록의 특정 위치에서 샘플과 함께 병치된 휘도 블록의 QP 값을 검색하고, 상기 결정된 휘도 블록의 QP 값에 기초하여 상기 색차 성분의 현재 블록에 대한 QP 값을 결정하도록 더 구성되며,
상기 특정 위치에 있는 샘플은 상기 현재 색차 블록의 오른쪽 하단 쿼터(bottom right quarter) 내의 왼쪽 상단 샘플(top-left sample)인, 양자화 장치. - 제13항 또는 제14항 중 어느 한 항에 따른 장치를 구현하는 집적 회로.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020237030714A KR20230135159A (ko) | 2018-09-21 | 2019-09-21 | 역 양자화 장치 및 방법 |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862734982P | 2018-09-21 | 2018-09-21 | |
US62/734,982 | 2018-09-21 | ||
US201862744125P | 2018-10-10 | 2018-10-10 | |
US62/744,125 | 2018-10-10 | ||
US201862745983P | 2018-10-15 | 2018-10-15 | |
US62/745,983 | 2018-10-15 | ||
PCT/CN2019/107134 WO2020057662A1 (en) | 2018-09-21 | 2019-09-21 | Apparatus and method for inverse quantization |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237030714A Division KR20230135159A (ko) | 2018-09-21 | 2019-09-21 | 역 양자화 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210045458A KR20210045458A (ko) | 2021-04-26 |
KR102578075B1 true KR102578075B1 (ko) | 2023-09-12 |
Family
ID=69888333
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237030714A KR20230135159A (ko) | 2018-09-21 | 2019-09-21 | 역 양자화 장치 및 방법 |
KR1020217007947A KR102578075B1 (ko) | 2018-09-21 | 2019-09-21 | 역 양자화 장치 및 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237030714A KR20230135159A (ko) | 2018-09-21 | 2019-09-21 | 역 양자화 장치 및 방법 |
Country Status (11)
Country | Link |
---|---|
US (2) | US11689723B2 (ko) |
EP (1) | EP3841748A4 (ko) |
JP (2) | JP7343573B2 (ko) |
KR (2) | KR20230135159A (ko) |
CN (3) | CN112690000B (ko) |
AU (2) | AU2019342803B2 (ko) |
BR (1) | BR112021004984A2 (ko) |
CA (1) | CA3111118A1 (ko) |
MX (1) | MX2021003166A (ko) |
SG (1) | SG11202101799WA (ko) |
WO (1) | WO2020057662A1 (ko) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3700205A1 (en) * | 2019-02-19 | 2020-08-26 | Nokia Technologies Oy | Quantization parameter derivation for cross-channel residual encoding and decoding |
MX2022002085A (es) | 2019-08-22 | 2022-03-17 | Lg Electronics Inc | Metodo de decodificacion de imagen y dispositivo para el mismo. |
CN114270840A (zh) * | 2019-08-22 | 2022-04-01 | Lg 电子株式会社 | 使用色度量化参数的图像解码方法及其装置 |
WO2021037258A1 (en) * | 2019-08-30 | 2021-03-04 | Beijing Bytedance Network Technology Co., Ltd. | Sub-partitioning in intra coding |
US11395014B2 (en) * | 2019-09-18 | 2022-07-19 | Qualcomm Incorporated | Transform unit design for video coding |
WO2021091214A1 (ko) * | 2019-11-05 | 2021-05-14 | 엘지전자 주식회사 | 크로마 양자화 파라미터 오프셋 관련 정보를 코딩하는 영상 디코딩 방법 및 그 장치 |
WO2021170058A1 (en) | 2020-02-27 | 2021-09-02 | Beijing Bytedance Network Technology Co., Ltd. | Transform skip residual coding |
WO2021197445A1 (en) * | 2020-04-01 | 2021-10-07 | Beijing Bytedance Network Technology Co., Ltd. | Constraints on adaptation parameter set syntax elements |
CN115606183A (zh) | 2020-04-07 | 2023-01-13 | 抖音视界有限公司(Cn) | 参考图片环绕的剪裁操作 |
CN115668917A (zh) | 2020-04-09 | 2023-01-31 | 抖音视界有限公司 | 视频编解码中的去块信令通知 |
WO2021204251A1 (en) | 2020-04-10 | 2021-10-14 | Beijing Bytedance Network Technology Co., Ltd. | Use of header syntax elements and adaptation parameter set |
US11381820B2 (en) * | 2020-04-13 | 2022-07-05 | Tencent America LLC | Method and apparatus for video coding |
WO2021209061A1 (en) | 2020-04-17 | 2021-10-21 | Beijing Bytedance Network Technology Co., Ltd. | Presence of adaptation parameter set units |
KR20230002447A (ko) | 2020-04-26 | 2023-01-05 | 바이트댄스 아이엔씨 | 비디오 코딩 신택스 요소의 조건적 시그널링 |
KR20230016047A (ko) * | 2020-05-27 | 2023-01-31 | 바이트댄스 아이엔씨 | 비디오 코딩에서의 서브픽처들 및 타일들의 사용 |
JP2023030585A (ja) * | 2021-08-23 | 2023-03-08 | キヤノン株式会社 | 画像符号化装置及び方法及びプログラム |
CN117221564A (zh) * | 2022-01-21 | 2023-12-12 | 杭州海康威视数字技术股份有限公司 | 一种视频解码方法、装置及存储介质 |
WO2023237119A1 (en) * | 2022-06-10 | 2023-12-14 | Beijing Bytedance Network Technology Co., Ltd. | Method, apparatus, and medium for video processing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180020241A1 (en) * | 2016-07-15 | 2018-01-18 | Qualcomm Incorporated | Signaling of quantization information in non-quadtree-only partitioned video coding |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4617644B2 (ja) * | 2003-07-18 | 2011-01-26 | ソニー株式会社 | 符号化装置及び方法 |
US9451258B2 (en) * | 2012-04-03 | 2016-09-20 | Qualcomm Incorporated | Chroma slice-level QP offset and deblocking |
US9414054B2 (en) * | 2012-07-02 | 2016-08-09 | Microsoft Technology Licensing, Llc | Control and use of chroma quantization parameter values |
GB2512826B (en) * | 2013-04-05 | 2017-05-10 | Canon Kk | Method and device for determining the value of a quantization parameter |
EP4366308A3 (en) * | 2013-06-28 | 2024-07-10 | Velos Media International Limited | Methods and devices for emulating low-fidelity coding in a high-fidelity coder |
US9294766B2 (en) * | 2013-09-09 | 2016-03-22 | Apple Inc. | Chroma quantization in video coding |
US10142642B2 (en) * | 2014-06-04 | 2018-11-27 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
CN105338352B (zh) * | 2014-07-24 | 2019-04-19 | 华为技术有限公司 | 一种视频编码中自适应反量化方法及装置 |
US9883184B2 (en) * | 2014-10-07 | 2018-01-30 | Qualcomm Incorporated | QP derivation and offset for adaptive color transform in video coding |
KR102150979B1 (ko) * | 2014-12-19 | 2020-09-03 | 에이치에프아이 이노베이션 인크. | 비디오 및 이미지 코딩에서의 비-444 색채 포맷을 위한 팔레트 기반 예측의 방법 |
JP6937695B2 (ja) * | 2015-01-30 | 2021-09-22 | インターデジタル ヴイシー ホールディングス, インコーポレイテッド | カラー・ピクチャを符号化および復号する方法および装置 |
KR102570911B1 (ko) * | 2015-07-08 | 2023-08-24 | 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 | 교차 평면 필터링을 이용한 향상된 크로마 코딩 |
CN108293124B (zh) * | 2015-11-30 | 2022-05-13 | 瑞典爱立信有限公司 | 视频中画面的编码 |
WO2017219342A1 (en) * | 2016-06-24 | 2017-12-28 | Mediatek Inc. | Methods of signaling quantization parameter for quad-tree plus binary tree structure |
CN109644276B (zh) | 2016-08-01 | 2022-12-30 | 韩国电子通信研究院 | 图像编码/解码方法 |
CN118714296A (zh) | 2016-10-04 | 2024-09-27 | Lx 半导体科技有限公司 | 图像编码/解码方法和图像数据的发送方法 |
-
2019
- 2019-09-21 SG SG11202101799WA patent/SG11202101799WA/en unknown
- 2019-09-21 EP EP19861798.7A patent/EP3841748A4/en active Pending
- 2019-09-21 MX MX2021003166A patent/MX2021003166A/es unknown
- 2019-09-21 JP JP2021515469A patent/JP7343573B2/ja active Active
- 2019-09-21 AU AU2019342803A patent/AU2019342803B2/en active Active
- 2019-09-21 KR KR1020237030714A patent/KR20230135159A/ko not_active Application Discontinuation
- 2019-09-21 CN CN201980060158.9A patent/CN112690000B/zh active Active
- 2019-09-21 CA CA3111118A patent/CA3111118A1/en active Pending
- 2019-09-21 WO PCT/CN2019/107134 patent/WO2020057662A1/en unknown
- 2019-09-21 CN CN202210119577.9A patent/CN115052144A/zh active Pending
- 2019-09-21 BR BR112021004984-3A patent/BR112021004984A2/pt unknown
- 2019-09-21 KR KR1020217007947A patent/KR102578075B1/ko active IP Right Grant
- 2019-09-21 CN CN202210118438.4A patent/CN114598875B/zh active Active
-
2021
- 2021-03-19 US US17/249,946 patent/US11689723B2/en active Active
-
2023
- 2023-05-09 US US18/195,007 patent/US20230291902A1/en active Pending
- 2023-08-31 JP JP2023140910A patent/JP2023164490A/ja active Pending
- 2023-10-11 AU AU2023248107A patent/AU2023248107A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180020241A1 (en) * | 2016-07-15 | 2018-01-18 | Qualcomm Incorporated | Signaling of quantization information in non-quadtree-only partitioned video coding |
Also Published As
Publication number | Publication date |
---|---|
US20210218968A1 (en) | 2021-07-15 |
US11689723B2 (en) | 2023-06-27 |
EP3841748A4 (en) | 2021-10-27 |
WO2020057662A1 (en) | 2020-03-26 |
BR112021004984A2 (pt) | 2021-06-08 |
AU2023248107A1 (en) | 2023-11-09 |
JP2023164490A (ja) | 2023-11-10 |
AU2019342803A1 (en) | 2021-03-18 |
KR20210045458A (ko) | 2021-04-26 |
CN114598875B (zh) | 2023-03-24 |
MX2021003166A (es) | 2021-05-14 |
JP2022500943A (ja) | 2022-01-04 |
CN114598875A (zh) | 2022-06-07 |
CA3111118A1 (en) | 2020-03-26 |
KR20230135159A (ko) | 2023-09-22 |
EP3841748A1 (en) | 2021-06-30 |
CN112690000A (zh) | 2021-04-20 |
CN112690000B (zh) | 2022-02-18 |
CN115052144A (zh) | 2022-09-13 |
SG11202101799WA (en) | 2021-03-30 |
AU2019342803B2 (en) | 2023-07-13 |
US20230291902A1 (en) | 2023-09-14 |
JP7343573B2 (ja) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102578075B1 (ko) | 역 양자화 장치 및 방법 | |
KR102628895B1 (ko) | 조인트 크로마 코딩을 사용하는 블록에 대해 크로마 디블로킹을 수행하기 위한 인코더, 디코더 및 대응 방법 | |
KR102660119B1 (ko) | 비디오 인코더, 비디오 디코더 및 방법 | |
KR102618466B1 (ko) | 보간 필터를 사용하는 인트라 예측을 위한 방법 및 장치 | |
KR20240136469A (ko) | 이미지 예측 방법 및 디바이스 | |
KR102525179B1 (ko) | 파티션 제한 요소들 간의 관계 | |
KR102542433B1 (ko) | 비디오 처리 방법, 비디오 처리 장치, 인코더, 디코더, 매체 및 컴퓨터 프로그램 | |
KR20210125088A (ko) | 매트릭스 기반 인트라 예측 및 2차 변환 코어 선택을 조화시키는 인코더, 디코더 및 대응 방법 | |
CA3162821A1 (en) | Cross-component adaptive loop filtering for video coding | |
KR20240074918A (ko) | 인코더, 디코더 및 디블로킹 필터 적응 방법 | |
JP2023153802A (ja) | イントラ・サブパーティション・コーディング・ツールによって引き起こされるサブパーティション境界のためのデブロッキングフィルタ | |
KR102595146B1 (ko) | 비디오 인코더, 비디오 디코더 및 그에 대응하는 방법 | |
KR20220065880A (ko) | 아핀 모션 보상에서 dct 기반 보간 필터 및 향상된 쌍선형 보간 필터의 사용 | |
KR20220140858A (ko) | 슬라이스에 대한 픽처 파티셔닝 정보를 시그널링하기 위한 디코더 및 대응하는 방법 | |
KR20210145824A (ko) | 제산 없는 인트라 예측을 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |