KR20210006305A - 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치 - Google Patents

동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20210006305A
KR20210006305A KR1020200083979A KR20200083979A KR20210006305A KR 20210006305 A KR20210006305 A KR 20210006305A KR 1020200083979 A KR1020200083979 A KR 1020200083979A KR 20200083979 A KR20200083979 A KR 20200083979A KR 20210006305 A KR20210006305 A KR 20210006305A
Authority
KR
South Korea
Prior art keywords
block
intra prediction
current block
prediction
mode
Prior art date
Application number
KR1020200083979A
Other languages
English (en)
Inventor
강제원
박상효
박승욱
임화평
Original Assignee
현대자동차주식회사
이화여자대학교 산학협력단
기아자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사, 이화여자대학교 산학협력단, 기아자동차주식회사 filed Critical 현대자동차주식회사
Priority to PCT/KR2020/008910 priority Critical patent/WO2021006612A1/ko
Priority to US17/276,540 priority patent/US11284073B2/en
Publication of KR20210006305A publication Critical patent/KR20210006305A/ko
Priority to US17/519,997 priority patent/US11683486B2/en
Priority to US17/520,031 priority patent/US11909962B2/en
Priority to US17/520,057 priority patent/US11778174B2/en
Priority to US17/519,871 priority patent/US11902512B2/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치를 개시한다.
본 개시의 일 측면에 따르면, 비디오 데이터를 복호화하는 장치는 비트스트림으로부터 비디오 데이터의 현재 블록의 인트라 예측 타입을 지시하는 신택스 엘리먼트를 복호화하는 복호화부 및 상기 신택스 엘리먼트가 지시하는 현재 블록의 인트라 예측 타입에 기반하여 행렬 기반 인트라 예측 또는 정규 인트라 예측을 선택적으로 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 인트라 예측부를 포함한다.

Description

동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치{METHOD AND APPARATUS FOR INTRA PREDICTION CODING OF VIDEO DATA}
본 발명은 동영상 데이터의 부호화 및 복호화에 관한 것이다.
동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.
따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.
그러나, 픽쳐의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.
본 발명은 동영상 데이터의 블록을 인트라 예측 코딩하는 개선된 기법들을 제시한다.
본 개시의 일 측면에 따르면, 비디오 데이터를 복호화하는 방법으로서, 비트스트림으로부터 비디오 데이터의 현재 블록의 인트라 예측 타입을 지시하는 신택스 엘리먼트를 복호화하는 단계 - 상기 인트라 예측 타입은 행렬 기반 인트라 예측(matrix based intra prediction: MIP)과 정규 인트라 예측(regular intra prediction)을 포함함 -; 및 상기 신택스 엘리먼트가 지시하는 현재 블록의 인트라 예측 타입에 기반하여 행렬 기반 인트라 예측 또는 정규 인트라 예측을 선택적으로 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 단계를 포함한다.
상기 방법은, 상기 행렬 기반 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 단계의 일부로서, 상기 비트스트림으로부터, 상기 현재 블록의 너비 및 높이에 대해 허용되는 복수의 행렬 기반 인트라 예측 모드들 중에서 하나를 특정하는 절삭된 이진 코드(truncated binary code)로 표현되는, 상기 현재 블록에 대한 행렬 기반 인트라 예측 모드를 지시하는 신택스 엘리먼트를 복호화하는 단계; 상기 현재 블록의 너비 및 높이에 기초하여 상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하는 단계; 상기 행렬 기반 인트라 예측 모드에 대해 미리 정의된 행렬과 상기 입력 경계 벡터 간의 행렬-벡터 곱셈에 기초하여, 상기 현재 블록에 대한 예측 샘플들을 생성하는 단계; 및 상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하는 단계를 더 포함한다.
상기 방법은, 상기 정규 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 단계의 일부로서, 상기 방법은 상기 현재 블록에 인접한 주변 블록들의 정규 인트라 예측 모드를 기초로 MPM(Most Probable Mode) 후보들을 도출하여 상기 현재 블록에 대한 MPM 리스트를 구성하는 단계 및 상기 MPM 리스트에 기초하여 상기 현재 블록에 대한 정규 인트라 예측 모드를 도출하는 단계를 더 포함한다. MPM 후보들을 도출함에 있어서, 상기 주변 블록의 인트라 예측 타입이 행렬 기반 인트라 예측인 경우에, 상기 주변 블록의 정규 인트라 예측 모드는 PLANAR 모드로 설정(간주)된다.
본 개시의 다른 측면에 따르면, 비디오 데이터를 복호화하는 장치로서, 비트스트림으로부터 비디오 데이터의 현재 블록의 인트라 예측 타입을 지시하는 신택스 엘리먼트를 복호화하는 복호화부 - 상기 인트라 예측 타입은 행렬 기반 인트라 예측과 정규 인트라 예측을 포함함 -; 및 상기 신택스 엘리먼트가 지시하는 현재 블록의 인트라 예측 타입에 기반하여행렬 기반 인트라 예측 또는 정규 인트라 예측을 선택적으로 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 인트라 예측부를 포함한다.
상기 행렬 기반 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 것의 일부로서, 상기 인트라 예측부는, 상기 비트스트림으로부터, 상기 현재 블록의 너비 및 높이에 대해 허용되는 복수의 행렬 기반 인트라 예측 모드들 중에서 하나를 특정하는 절삭된 이진 코드(truncated binary code)로 표현되는, 상기 현재 블록에 대한 행렬 기반 인트라 예측 모드를 지시하는 신택스 엘리먼트를 복호화하는 단계; 상기 현재 블록의 너비 및 높이에 기초하여 상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하는 단계; 상기 행렬 기반 인트라 예측 모드에 대해 미리 정의된 행렬과 상기 입력 경계 벡터 간의 행렬-벡터 곱셈에 기초하여, 상기 현재 블록에 대한 예측 샘플들을 생성하는 단계; 및 상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하는 단계를 더 수행할 수 있다.
상기 인트라 예측부는, 상기 정규 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 것의 일부로서, 상기 현재 블록에 인접한 주변 블록들의 정규 인트라 예측 모드를 기초로 MPM 후보들을 도출하여 상기 현재 블록에 대한 MPM 리스트를 구성하고, 상기 MPM 리스트에 기초하여 상기 현재 블록에 대한 정규 인트라 예측 모드를 도출한다. MPM 후보들을 도출함에 있어서, 상기 인트라 예측부는 상기 주변 블록의 인트라 예측 타입이 행렬 기반 인트라 예측인 경우에 상기 주변 블록의 정규 인트라 예측 모드를 PLANAR 모드로 설정(간주)한다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.
도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.
도 3a는 복수의 인트라 예측 모드들을 나타낸 도면이다.
도 3b는 광각 인트라 예측모드들을 포함한 복수의 인트라 예측 모드들을 나타낸 도면이다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.
도 5는 본 개시의 기법들에서 사용될 수도 있는 MIP 기술의 주요 프로세스를 도식화한 개념도이다.
도 6은 참조샘플들을 구성하기 위한 스무딩 필터링과 보간 필터링을 예시한다.
도 7a 내지 도 7c는 왼쪽 이웃 샘플들을 이용하여 행렬-벡터 곱셈 연산에 입력되는 경계 벡터를 구성하는 예시적인 방법을 보이는 개념도이다.
도 8a 내지 도 8c는 위쪽 이웃 샘플들을 이용하여 행렬-벡터 곱셈 연산에 입력되는 경계 벡터를 구성하는 예시적인 방법을 보이는 개념도이다.
도 9는 본 발명의 일 실시예에 따른 비디오 데이터를 복호화하는 방법을 예시하는 흐름도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 부호화 장치는 픽처 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 재정렬부(150), 엔트로피 부호화부(155), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.
영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 슬라이스 내의 모든 블록들에 공통적으로 적용되는 정보는 슬라이스 헤더의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다. 또한, 하나의 타일 또는 타일 그룹에 공통으로 적용되는 정보는 타일 또는 타일 그룹 헤더의 신택스로서 부호화될 수도 있다.
픽처 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.
픽처 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.
트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 지칭될 수 있다.
도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 엔트로피 부호화부(155)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 엔트로피 부호화부(155)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 대안적으로, 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)를 부호화하기에 앞서, 그 노드가 분할되는지 여부를 지시하는 CU 분할 플래그(split_cu_flag)가 부호화될 수도 있다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할됨을 지시하는 경우, 영상 부호화 장치는 전술한 방식으로 제1 플래그부터 부호화를 시작한다.
트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 엔트로피 부호화부(155)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.
CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다. QTBTTT 분할의 채용에 따라, 현재블록의 모양은 정사각형뿐만 아니라 직사각형일 수도 있다.
예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.
일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.
인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3a에서 보는 바와 같이, 복수의 인트라 예측모드는 PLANAR 모드와 DC 모드를 포함하는 2개의 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다. 아래 표는 인트라 예측 모드들 번호와 이름을 열거한다.
Figure pat00001
직사각형 모양의 현재블록에 대한 효율적인 방향성 예측을 위해, 도 3b에 점선 화살표로 도시된 방향성 모드들(67 ~ 80번, -1 ~ -14 번 인트라 예측모드들)이 추가로 사용될 수 있다. 이들은 "광각 인트라 예측모드들(wide angle intra-prediction modes)"로 지칭될 수 있다. 도 3b에서 화살표들은 예측에 사용되는 대응하는 참조샘플들을 가리키는 것이며, 예측 방향을 나타내는 것이 아니다. 예측 방향은 화살표가 가리키는 방향과 반대이다. 광각 인트라 예측모드들은 현재블록이 직사각형일 때 추가적인 비트 전송 없이 특정 방향성 모드를 반대방향으로 예측을 수행하는 모드이다. 이때 광각 인트라 예측모드들 중에서, 직사각형의 현재블록의 너비와 높이의 비율에 의해, 현재블록에 이용 가능한 일부 광각 인트라 예측모드들이 결정될 수 있다. 예컨대, 45도보다 작은 각도를 갖는 광각 인트라 예측모드들(67 ~ 80번 인트라 예측모드들)은 현재블록이 높이가 너비보다 작은 직사각형 형태일 때 이용 가능하고, -135도보다 큰 각도를 갖는 광각 인트라 예측모드들(-1 ~ -14 번 인트라 예측모드들)은 현재블록이 높이가 너비보다 큰 직사각형 형태일 때 이용 가능하다.
인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측모드를 선택할 수도 있다.
인트라 예측부(122)는 복수의 인트라 예측모드 중에서 하나의 인트라 예측모드를 선택하고, 선택된 인트라 예측모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측모드에 대한 정보는 엔트로피 부호화부(155)에 의해 부호화되어 영상 복호화 장치로 전달된다.
또한, 인트라 예측부(122)는 후술하는 행렬 기반 인트라 예측(Matrix-based Intra Prediction: MIP)을 이용하여, 현재블록에 대한 예측블록을 생성할 수도 있다. 인트라 예측부(122)는 현재블록의 좌측에 재구성된 샘플들과 현재블록의 상측에 재구성된 샘플들로부터 유도된 경계 벡터와 미리 정의된 행렬 및 오프셋 벡터를 이용하여 현재블록에 대한 예측블록을 생성할 수도 있다.
인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 인터 예측부(124)는 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 엔트로피 부호화부(155)에 의해 부호화되어 영상 복호화 장치로 전달된다.
감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.
변환부(140)는 잔차블록을 하나 이상의 변환블록들로 나누고, 변환을 하나 이상의 변환 블록들에 적용하여, 변환블록들의 잔차 값들을 픽셀 도메인에서 주파수 도메인으로 변환한다. 주파수 도메인에서, 변환된 블록들은 하나 이상의 변환 계수 값들을 포함하는 계수 블록들이라고 지칭된다. 변환에는 2차원 변환 커널이 사용될 수 있으며, 수평 방향 변환과 수직 방향 방향에 각각 1차원 변환 커널이 사용될 수도 있다. 변환 커널은 이산 코사인 변환(DCT), 이산 사인 변환(DST) 등에 기반할 수 있다.
변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있다. 또한, 변환부(140)는 잔차블록을 수평 혹은 수직 방향으로 2개의 서브블록으로 분할하고, 변환을 2개의 서브블록 중 하나에만 수행할 수 있다. 따라서, 변환 블록의 사이즈는 잔차 블록의 사이즈(따라서 예측블록의 사이즈)와 상이할 수도 있다. 변환이 수행되지 않는 서브블록에는 논-제로 잔차 샘플 값들이 존재하지 않거나 매우 희소할 수 있다. 변환이 수행되지 않는 서브블록의 잔차 샘플들은 시그널링되지 않으며, 영상 복호화 장치에 의해 모두 "0"으로 간주될 수 있다. 분할 방향과 분할 비율에 따라 여러 파티션 타입들이 존재할 수 있다. 변환부(140)는 잔차블록의 코딩 모드(혹은 변환 모드)에 관한 정보(예컨대, 잔차 블록을 변환하였는지 아니면 잔차 서브블록을 변환하였는지를 나타내는 정보, 잔차블록을 서브블록들로 분할하기 위해 선택된 파티션 타입을 나타내는 정보, 변환이 수행되는 서브블록을 식별하는 정보 등을 포함하는 정보)를 엔트로피 부호화부(155)에 제공할 수 있다. 엔트로피 부호화부(155)는 잔차블록의 코딩 모드(혹은 변환 모드)에 관한 정보를 부호화할 수 있다.
양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 엔트로피 부호화부(155)로 출력한다. 양자화부(145)는, 어떤 블록 혹은 프레임에 대해, 변환 없이, 관련된 잔차 블록을 곧바로 양자화할 수도 있다.
재정렬부(150)는 양자화된 잔차값에 대해 계수값의 재정렬을 수행할 수 있다. 재정렬부(150)는 계수 스캐닝(coefficient scanning)을 통해 2차원의 계수 어레이를 1차원의 계수 시퀀스로 변경할 수 있다. 예를 들어, 재정렬부(150)에서는 지그-재그 스캔(zig-zag scan) 또는 대각선 스캔(diagonal scan)을 이용하여 DC 계수부터 고주파수 영역의 계수까지 스캔하여 1차원의 계수 시퀀스를 출력할 수 있다. 변환 단위의 크기 및 인트라 예측모드에 따라 지그-재그 스캔 대신 2차원의 계수 어레이를 열 방향으로 스캔하는 수직 스캔, 2차원의 블록 형태 계수를 행 방향으로 스캔하는 수평 스캔이 사용될 수도 있다. 즉, 변환 단위의 크기 및 인트라 예측모드에 따라 지그-재그 스캔, 대각선 스캔, 수직 방향 스캔 및 수평 방향 스캔 중에서 사용될 스캔 방법이 결정될 수도 있다.
엔트로피 부호화부(155)는, CABAC(Context-based Adaptive Binary Arithmetic Code), 지수 골롬(Exponential Golomb) 등의 다양한 부호화 방식을 사용하여, 재정렬부(150)로부터 출력된 1차원의 양자화된 변환 계수들의 시퀀스를 부호화함으로써 비트스트림을 생성한다.
또한, 엔트로피 부호화부(155)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 타입, MTT 분할 방향 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다. 또한, 엔트로피 부호화부(155)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.
역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.
가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.
필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.
디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.
디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용될 수 있다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 기능 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 복호화 장치는 엔트로피 복호화부(410), 재정렬부(415), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.
도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
엔트로피 복호화부(410)는 영상 부호화 장치에 의해 생성된 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.
엔트로피 복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.
예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.
또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, 제1 플래그(QT_split_flag)를 추출할 수도 있다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.
다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.
한편, 엔트로피 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 엔트로피 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측모드)에 대한 신택스 엘리먼트를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 엔트로피 복호화부(410)는 인터 예측정보에 대한 신택스 엘리먼트, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.
한편, 엔트로피 복호화부(410)는 잔차블록의 코딩 모드에 관한 정보(예컨대, 잔차블록이 부호화되었는지 잔차블록의 서브블록만이 부호화되었는지 여부에 관한 정보, 잔차블록을 서브블록들로 분할하기 위해 선택된 파티션 타입을 나타내는 정보, 부호화된 잔차 서브블록을 식별하는 정보, 양자화 파라미터 등)를 비트스트림으로부터 추출한다. 또한, 엔트로피 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.
재정렬부(415)는, 영상 부호화 장치에 의해 수행된 계수 스캐닝 순서의 역순으로, 엔트로피 복호화부(410)에서 엔트로피 복호화된 1차원의 양자화된 변환계수들의 시퀀스를 다시 2차원의 계수 어레이(즉, 블록)로 변경할 수 있다.
역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는, 잔차블록의 코딩 모드에 관한 정보를 기초로, 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 복원된 잔차블록을 생성한다.
역변환부(430)는, 잔차블록의 코딩 모드에 관한 정보가 영상 부호화 장치에서 현재블록의 잔차블록이 부호화되었다고 지시하는 경우에, 역양자화된 변환계수들에 대해 현재블록의 사이즈(따라서, 복원될 잔차블록의 사이즈)를 변환 단위로 사용하여 역변환을 수행하여 현재블록에 대한 복원된 잔차블록을 생성한다.
또한, 역변환부(430)는, 잔차블록의 코딩 모드에 관한 정보가 영상 부호화 장치에서 잔차블록의 하나의 서브블록만이 부호화되었다고 지시하는 경우에, 역양자화된 변환계수들에 대해, 변환된 서브블록의 사이즈를 변환 단위로 사용하여, 역변환을 수행하여 변환된 서브블록에 대한 잔차신호들을 복원하고, 비변환된 서브블록에 대한 잔차신호들을 "0" 값으로 채움으로써, 현재블록에 대한 복원된 잔차블록을 생성한다.
예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.
인트라 예측부(442)는 엔트로피 복호화부(410)로부터 추출된 인트라 예측모드에 대한 신택스 엘리먼트로부터 복수의 인트라 예측모드 중 현재블록의 인트라 예측모드를 결정하고, 인트라 예측모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다. 또한, 인트라 예측부(442)는 후술하는 행렬 기반 인트라 예측(Matrix-based Intra Prediction: MIP)을 이용하여, 현재블록에 대한 예측블록을 생성할 수도 있다. 인트라 예측부(422)는 현재블록의 좌측에 재구성된 샘플들과 현재블록의 상측에 재구성된 샘플들로부터 유도된 경계 벡터와 미리 정의된 행렬 및 오프셋 벡터를 이용하여 현재블록에 대한 예측블록을 생성할 수도 있다.
인터 예측부(444)는 엔트로피 복호화부(410)로부터 추출된 인트라 예측모드에 대한 신택스 엘리먼트를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.
가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.
필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
본 개시의 기술들은 일반적으로 인트라 예측 코딩과 관련되어 있다. 이하의 설명은 주로 복호화 기술, 즉 비디오 복호화기의 동작에 초점이 맞춰져 있으며, 부호화 기술들에 대한 설명은, 포괄적으로 설명된 복호화 기술과 반대이므로, 간략화된다.
차세대 비디오 코딩 표준(VVC; Versatile Video Coding)에 대한 논의에서, HEVC(High Efficiency Video Coding) 표준과 비교하여 더 나은 코딩 성능을 가능하게 하는 몇 가지 새로운 코딩 도구들이 도입되었다.
인트라 예측에 가장 인접한 참조 샘플 라인만을 사용할 수 있는 HEVC와 달리, VVC는 MRL(Multiple Reference Line) 인트라 예측으로 알려진, 두 개의 추가적인 참조 라인을 사용할 수 있다. 추가적인 참조 라인들은 MPM 모드들에 대해서만 사용할 수 있으며, non-MPM 모드들은 사용할 수 없다. 부호화기는 각 방향성 모드에 대해 예측을 수행할 때, RD COST를 기초로 세 개의 참조 라인들 중에서 하나의 참조 라인을 선택한다. 선택된 참조라인의 인덱스(mrl_idx)은 별도로 시그널링되어 복호화기로 전달된다.
ISP(Intra Sub-Partitions)는 CU를 그 크기에 따라 수직 또는 수평 방향으로 동일한 크기의 복수의 서브블록으로 나누고 각 서브블록에 대해 동일한 인트라 예측모드로 예측을 수행하는 코딩 툴이다. 각 서브블록의 재구성된 샘플 값들은 다음 서브블록의 예측에 이용가능하며, 이는 각 서브블록에 대해 반복적으로 처리된다. ISP가 적용 가능한 최소 블록 크기는 4×8 또는 8×4이며, 블록의 크기가 크기가 4×8 또는 8×4이면 2개로 분할되며, 이보다 크면 4개로 분할될 수 있다. 블록의 MRL 인덱스가 0이 아닌 경우에, ISP는 사용되지 않는다.
LMCS(Luma Mapping with Chroma Scaling)는 복원된 영상에 직접적으로 적용하는 일반적인 인루프 필터링과 달리, 영상 신호의 동적 범위(dynamic range)에 대한 코드워드(codeword)를 재분배함으로써 효율적인 예측 및 양자화가 가능하게 하여 부호화 성능 향상 및 화질 향상을 얻는다. LMCS는 루마 성분 매핑과 크로마 성분 스케일링을 포함한다.
루마 매핑은 입력되는 루마 신호의 동적 범위(dynamic range)에 대한 코드워드(codeword)를 재분배함으로써 부호화 성능을 향상시킬 수 있는 코드워드로 재분배하는 인루프 매핑을 의미한다. 순방향 매핑(forward mapping)과 이에 대응하는 역방향 매핑(backward mapping)을 통해 루마 신호 매핑을 수행할 수 있다. 순방향 매핑은 기존 동적 범위를 동일한 16개의 구간으로 분할한 뒤 각 구간에 대한 선형모델을 통해서 입력 영상의 코드워드 재분배를 수행하고 역방향 매핑은 매핑된 동적 범위에서 기존 동적 범위로 역매핑을 수행한다. 크로마 스케일링은 루마 신호와 이에 대응하는 크로마 신호 사이의 상관 관계에 따라 크로마 신호를 보정한다.
행렬 기반 인트라 예측(Matrix-based Intra Prediction: MIP)은 VTM 5.0에 도입된 새로운 인트라 예측 기술이다. 원래의 아이디어는 신경망에 기초한 인트라 예측 기술, 즉, 인접한 재구성된 픽셀들에 기초하여 현재의 PU 픽셀 값들을 예측하기 위해 다층 신경망을 사용하는 것이다. 그러나 신경망을 이용한 예측 방법의 높은 복잡성으로 인해, 사전에 훈련된 행렬들을 이용한 아핀 선형 변환에 기초한 인트라 예측 기술이 도입되었다.
너비 W 및 높이 H를 갖는 직사각형 블록 PU를 예측하기 위해, MIP는 블록의 좌측에 재구성된 H개의 샘플들과 블록 상측의 재구성된 W개의 샘플들을 입력으로서 취한다. 그리고 최종 예측된 픽셀들은 평균화(Averaging), 행렬-벡터 곱셈(Matrix-Vector Multiplication) 및 선형 보간(Linear Interpolation) 등에 의해 얻어진다.
MIP가 적용되는 블록의 사이즈들은 다음과 같이 3개의 카테고리로 분류된다.
Figure pat00002
idx(W,H)에 따라, MIP 모드의 개수(numModes), 경계크기(boundarySize), 예측블록의 크기(predW, predH, predC)가 다음과 같이 정의된다. 아래 표에서 MipSizeId = idx(W,H)이다.
Figure pat00003
도 5는 본 개시의 기법들에서 사용될 수도 있는 MIP 기술의 주요 프로세스를 도식화한 개념도이다.
(1) 평균 연산(Averaging)
이 단계의 주요 목적은 참조 샘플들을 정규화하는 것이다. 블록 크기 및 형상(너비 및 높이)에 따라(즉, MipSizeId에 따라), 4 또는 8개의 샘플들이 얻어진다. 현재 블록의 너비와 높이가 모두 4인 경우(W=H=4), 왼쪽으로부터 2개와 상단으로부터 2개를 포함한 총 4개의 샘플들이 얻어진다(boundarySize = 2). 나머지 경우에는 왼쪽으로부터 4개와 상단으로부터 4개를 포함한 총 8개의 샘플들이 얻어진다(boundarySize = 4).
도 5에서 보이듯이, 상측 이웃 샘플들은
Figure pat00004
로 표기되고, 좌측 이웃 샘플들은
Figure pat00005
로 표기된다.
Figure pat00006
Figure pat00007
에 대해 각각 평균 연산을 수행하여, 다운 샘플링된 샘플 세트
Figure pat00008
Figure pat00009
가 얻어진다. 평균 연산은 다음과 같은 다운 샘플링 프로세스이다.
Figure pat00010
위 수학식에서 bDwn은 다운 샘플링의 스케일 값(nTbs / boundarySize)이며, refS는 오리지널 참조샘플을 가리킨다. 계산된 redS는 좌측 이웃의 경우
Figure pat00011
로 저장되고, 상측 이웃의 경우
Figure pat00012
로 저장된다.
다운 샘플링된 참조 샘플들은 길이 4 또는 8의 벡터로 스티칭된다. 벡터-행렬 곱셈 연산에 입력되는 축소된 경계 벡터
Figure pat00013
은 아래의 수학식과 같이 정의된다. 예를 들어, W=H=4이고 MIP 모드가 18 미만인 경우
Figure pat00014
Figure pat00015
의 순서로 접합하여 경계 벡터를 구성하며, W=H=4이고 MIP 모드가 18이상이면
Figure pat00016
Figure pat00017
의 순서로 접합된다. 아래 수학식에서, "mode" 는 MIP 모드를 의미한다.
Figure pat00018
(2) 행렬-벡터 곱셈(Matrix-Vector Multiplication)
이 단계에서, 축소된 경계 벡터
Figure pat00019
로부터 현재 블록의 다운 샘플링된 예측 신호
Figure pat00020
가 생성된다.
Figure pat00021
는 행렬-벡터의 곱과 오프셋의 합으로 다음과 같이 계산한다.
Figure pat00022
*
Figure pat00023
의 크기는 Wred × Hred 이며, Wred 와 Hred 는 현재 블록의 크기와 형상에 따라 아래와 같이 정의된다. 행렬 A 는 Wred * Hred 만큼의 행(row)들을 가지고, W=H=4 인 경우는 4 개의 열(column)을 가지며, 그 외에는 8 개의 열들을 가진다. 오프셋 벡터 b 는 Wred * Hred 크기의 벡터이다.
Figure pat00024
코딩 블록에 대해 사용될 수 있는 행렬 A 와 오프셋 벡터 b 의 세트들 S0, S1, S2이 코딩 블록의 사이즈들의 카테고리별로 미리 정의된다. 세트 S 의 인덱스(0, 1, 2)는 전술한 MipSizeId(즉, idx(W,H))에 따라 선택되며, 행렬 A 와 오프셋 벡터 b 는 세트 S0, S1, S2 중 하나의 세트로부터 현재 블록에 대해 적용되는 MIP 모드에 따라 추출된다.
세트 S0 은 각각 16행과 4열을 갖는 18개의 행렬( A 0) 과 18개의 16차원 오프셋 벡터( b 0)로 구성되며, 4×4 인 블록에 사용된다. 세트 S1 은 각각 16행과 8열을 갖는 10개의 행렬( A 1)와 10개의 16차원 오프셋 벡터( b 1)로 구성되며, 4×8, 8×4 및 8×8 크기의 블록에 사용된다. 마지막으로, 세트 S2 는 각각 64행과 8열을 갖는 6개의 행렬( A 2)과 6개의 64차원 오프셋 벡터( b 2)으로 구성되며, 나머지 모든 블록 모양에 사용된다.
(3) 픽셀 보간 (interpolation)
보간은 업 샘플링 프로세스이다. 전술한 바와 같이,
Figure pat00025
는 원래 블록의 다운 샘플링된 예측 신호이다. 이 때 크기 predW 과 predH 을 갖는 다운 샘플링된 예측 블록이 다음과 같이 정의된다.
predred[x][y], with x = 0..predW - 1, y = 0..predH - 1
나머지 위치에서의 예측 신호를 각 방향에 따라 선형 보간하여 생성되는 원 블록 크기(nTbW, nTbH)의 예측 블록은 다음과 같이 정의된다.
predSamples[x][y], with x = 0..nTbW - 1, y = 0..nTbH - 1
수평 및 수직 업샘플링 스케일 팩터인 upHor(= nTbW / predW)과 upVer (= nTbH / predH)에 의존하여, 다음과 같이,
Figure pat00026
로부터 predSamples의 일부 혹은 전부가 채워진다.
predSamples[(x+1) * upHor - 1][(y+1) * upVer - 1] = predred [x][y]
upHor = 1이면
Figure pat00027
로부터 predSamples의 수평 방향의 모든 위치가 채워지며, upVer = 1이면
Figure pat00028
로부터 predSamples의 수직 방향의 모든 위치가 채워진다.
이 후 bi-linear 보간법을 통해 predSamples의 나머지 비어있는 샘플들이 채워진다. 수평 방향의 보간과 수직 방향의 보간은 업샘플링 프로세스이다. predSamples 내 좌측 및 상측 샘플들의 보간을 위해, 다운 샘플링된 샘플들
Figure pat00029
이 predSamples[x][-1] 값들에 할당되며, 좌측의 원래 참조샘플들
Figure pat00030
이 predSamples[-1][y] 값들에 할당된다. 보간 순서는 현재블록의 크기에 따라 결정된다. 즉, 짧은 크기의 방향으로 먼저 보간이 수행되며 후속하여 긴 크기의 방향으로 보간이 수행된다.
(4) MIP 인트라 예측 모드의 시그널링
인트라 예측 코딩되는 각 코딩 유닛(CU)에 대해, 행렬 기반의 인트라 예측 모드(즉, MIP 모드)가 적용되는지 여부를 나타내는 플래그가 전송된다. VVC 5 draft에서는 MIP 모드의 시그널링을 위해, 행렬 기반의 인트라 예측이 아닌 기존의 인트라 예측 모드(이하 '정규 인트라 예측 모드')와 유사하게, 3개의 MPM들로 구성된 MPM 리스트를 사용한다. 예를 들어, MIP 모드의 시그널링을 위해 intra_mip_mpm_flag, intra_mip_mpm_idx, 및 intra_mip_mpm_remainder가 사용된다. intra_mip_mpm_idx는 truncated binary code로 코딩되며, intra_mip_mpm_remainder는 fixed length code로 코딩된다.
코딩 블록(CU)의 크기에 따라, 최대 35개의 MIP 모드들이 지원될 수 있다. 예를 들어, max (W, H) <= 8 및 W*H <32 인 CU에 대해, 35 개의 모드가 이용 가능하다. 그리고 각각 max(W, H) = 8 과 max(W, H) > 8인 CU에 대해 각각 19개 및 11개의 예측 모드가 사용된다. 또한, 한 쌍의 모드(두 개의 모드)가, 메모리 요구 사항을 줄이기 위해, 행렬 및 오프셋 벡터를 공유할 수 있다. 구체적인 공유 모드는 다음과 같이 계산된다. 예컨대, 4×4 코딩 블록에 대해, mode 19는 mode 2에 대해 할당된 행렬의 전치 행렬 (transposed matrix)을 사용한다.
Figure pat00031
행렬 기반의 인트라 예측(MIP)가 아닌 정규 인트라 예측 모드가 적용되는 블록(이하 '정규 블록'으로 지칭됨)의 주위에 MIP가 적용이 되는 블록이 있는 경우에 정규 블록의 MPM 유도를 위해 MIP 모드와 정규 모드들 간에 정의된 맵핑 테이블이 이용될 수 있다. 맵핑 테이블은 이웃 MIP가 적용되는 블록의 MIP 모드로부터 유사한 특성의 정규 모드를 도출하는데 사용된다. 이렇게 유도한 정규 모드는 정규 블록의 MPM 유도에 사용된다. 유사하게 크로마 DM 유도에서 사용하는 동일 위치의 휘도 블록이 MIP를 적용하는 경우에도 매핑 테이블을 이용해서 정규 모드를 도출하고 크로마 DM 유도에 사용한다. 아래 식은 표 3과 표 4의 맵핑 테이블들을 이용한 정규 모드와 MIP 모드 간의 맵핑을 표현한다.
Figure pat00032
Figure pat00033
Figure pat00034
이상에서 설명한 바와 같이, VVC draft 5에서는, 블록을 MIP 기반으로 예측할 때, 항상 블록 좌측의 재구성된 주변 샘플들
Figure pat00035
과 블록 상단의 재구성된 주변 샘플들
Figure pat00036
이 이용된다. 이러한 접근법은 블록의 텍스처가 방향 특성을 가지는 블록에 대한 예측 성능을 저해할 수도 있다. 또한, VVC draft 5에서는 predSamples 내 상측 샘플들의 보간을 위해, 도 5에 보인 바와 같이, 다운 샘플링된 샘플 세트
Figure pat00037
을 predSamples[x][-1] 값들에 할당하여 사용함으로써, 보간 프로세스를 필요 이상으로 복잡하게 만든다. 나아가, VVC draft 5에서는, MIP 모드와 정규 모드의 시그널링을 위해 각각 MPM 리스트를 사용함에 따라, MIP 모드와 정규 모드 간의 매핑 등이 요구되는 등 많은 검사와 조건으로 인해 구현이 매우 복잡해질 수 있다.
이러한 관점에서, 본 개시는 MIP 모드의 구현 복잡도를 낮추고 예측 성능을 향상시킬 수 있는 몇몇 개선된 기법을 제시한다.
스무딩 필터링된 참조샘플의 사용
전형적인 인트라 예측 코딩에서, 방향성 모드에 대한 참조샘플들을 얻기 위해 스무딩 필터(smoothing filter), 가우시안 보간 필터(Gaussian interpolation filter) 및 큐빅 보간 필터(cubic interpolation filter)가 선택적으로 이용될 수 있다. 도 6은 스무딩 필터링과 보간 필터링을 예시한다. 참조샘플의 필터링 프로세스에서, 인트라 예측 모드는 3가지 그룹으로 분류된다. 그룹A는 수평예측모드과 수직예측모드로 구성되고, 그룹B는 45도의 배수인 대각(diagonal)모드들로 구성되며, 그룹C는 그외 방향성 모드들로 구성된다. 그룹A에 대해서는 어느 필터도 적용되지 않는다. 그룹B에 속하는 대각모드들은 정수 위치의 화소를 참조하기 때문에, 보간 필터를 적용할 필요가 없으며, 참조샘플에 대해 [1, 2, 1]/4 스무딩 필터만 적용된다. 그룹C에 대해서는 [1, 2, 1]/4 스무딩 필터를 적용하지 않고 조건에 따라 4-탭 가우시안 보간 필터 혹은 4-탭 큐빅 보간 필터를 적용하여 소수 위치의 참조샘플을 얻는다.
참조샘플들에 대한 스무딩 필터링은 다음과 같이 이루어질 수 있다. 이하에서, 필터링을 수행하기 전의 참조샘플이 refUnfilt[x][y]로 표기되고, 필터링 후의 참조샘플이 refFilt[x][y]로 표기된다. 여기서, 필터링에는 [1, 2, 1]/4 스무딩 필터가 사용된다. refH와 refW는 각각 좌측 참조샘플들의 개수와 상측 참조샘플들의 개수이다.
- 좌상단 코너 참조샘플의 필터링
Figure pat00038
- 좌측 참조샘플의 필터링
Figure pat00039
- 상측 참조샘플의 필터링
Figure pat00040
위 수식과 같이, 동일한 참조라인에 위치한 인접한 참조샘플들 간에 필터링이 수행될 수도 있지만, 서로 다른 참조라인에 있는 참조샘플들 간에 필터링이 수행될 수도 있다. 예를 들어, MRL index 0과 1에 위치한 두 샘플의 평균을 계산하여 필터링된 참조 샘플을 얻을 수도 있다.
전술한 바와 같이, MIP를 사용하는 경우에 코딩 블록 상단과 좌측에 위치한 이미 복호화된 인접블록의 경계샘플들이 참조샘플들을 구성할 수 있다. 이 때, 어떠한 필터링도 수행하지 않은 경계샘플들이 참조샘플들로 사용된다. MIP 모드는 저주파 성분을 예측하고 복원하는데 자주 사용됨을 고려할 때 참조샘플을 필터링하여 고주파 성분이 제거된 샘플값들을 MIP 예측 프로세스에 사용하는 것이 유리할 수 있다.
본 개시의 일 측면에 따르면, 정규 인트라 예측의 방향성 모드에서와 같이, 참조 샘플들을 필터링하여 MIP 모드에 사용할 수 있다. 필터링된 참조 샘플들과 필터링되지 않은 참조 샘플들은 블록의 예측 모드, 블록의 크기, MIP 모드의 종류 등에 따라 적응적으로 사용될 수 있다.
참조샘플들에 대한 필터링은 다음 조건들이 모두 참인 경우에 수행될 수 있다. 따라서, 다음 조건들 중 어느 하나라도 만족하지 않는 경우에, refUnfil의 값들이 필터링 없이 그대로 refFilt로 복사된다. 일부의 경우에, 코딩 블록에 ISP가 적용되는 경우에, 분할된 서브블록의 너비 또는 높이 중 길이가 16 이상이면 해당 변의 경계에 필터링이 수행될 수도 있다.
- MRL index가 0이다.
- nTbW와 nTbH의 곱이 32보다 크다.
- cIdx가 0이다(즉, 루마 샘플이다).
- IntraSubPartitionsSplitType이 ISP_NO_SPLIT이다(즉, ISP가 적용되지 않는다).
- refFilterFlag 가 1이다(즉, 인트라 예측 모드가 0, 14, 12, 10, 6, 2, 34, 66, 72, 76, 78, 80 중 하나이거나 MIP 모드들 중 하나이다).
MIP가 적용되는 블록의 사이즈에 따라 적응적으로 참조픽셀의 필터링 수행 여부가 결정될 수도 있다. 전술한 바와 같이, MIP가 적용되는 블록의 사이즈들은 3개의 카테고리로 분류되며, idx(W,H)에 의존하여 참조픽셀의 필터링 수행 여부가 결정될 수도 있다. 일 예로, Idx가 2보다 작은 경우(즉, 4×4, 4×8, 8×4 크기의 블록들)에는 refUnfilt를 이용하고 2와 같은 경우에는 refFilt를 이용할 수 있다. 혹은 그 반대도 가능하다. 다른 일 예로, Idx가 1보다 작은 경우에는 refUnfilt를 이용하고 1보다 크거나 같은 경우에는 refFilt를 이용한다. 혹은 그 반대도 가능하다. 또 다른 일 예로, 블록의 크기가 4×4, 4×8, 8×4인 경우에는 refUnFilt를 이용하고, 그 외에는 refFilt를 이용할 수 있다. 혹은 그 반대도 가능하다. 또 다른 일 예로, 블록의 너비 또는 높이 중 어느 하나라도 4와 같으면 refFilt를 사용하지 않을 수 있다. 또 다른 일 예로, 블록의 너비와 높이 중 어느 하나라도 4와 같으면 refFilt를 사용하지 않을 수 있다.
MIP가 적용되는 블록의 형상에 따라 적응적으로 참조픽셀의 필터링 수행 여부가 결정될 수도 있다. 일 예로, 코딩블록의 너비와 높이가 같은 경우에만 refFilt를 사용할 수 있다. 다른 일 예로, 코딩블록의 너비와 높이의 크기가 다른 경우에만 refFilt를 사용할 수 있다. 또 다른 예로, 코딩블록의 너비와 높이를 비교하여, 길이가 긴 블록의 경계에 대해서만 refFilt를 사용할 수 있다. 혹은 그 길이가 짧은 블록의 경계에 대해서만 refFilt를 사용하는 것도 가능하다. 또 다른 예로, 블록의 너비 또는 높이 중 16 이상인(혹은 32 이상인) 변의 경계에 대해서만 refFilt를 사용할 수 있다.
일부 실시예들에서, MIP 코딩되는 블록 주변의 참조샘플 세트
Figure pat00041
Figure pat00042
는 다음과 같이 구성될 수도 있다. 일 예로, 참조샘플 세트는 블록 주위에서 LMCS (Luma Mapping with Chroma Scaling) 이후 맵핑한 루마 샘플로부터 구성될 수 있으며, 블록 주위에서 LMCS 전 맵핑한 루마 샘플로부터 구성될 수도 있다. 다른 예로, 참조샘플 세트는 정규 인트라 예측 수행을 위한 블록경계 필터링을 수행하기 전 주변블록의 루마 샘플들로부터 구성될 수 있으며, 블록경계 필터링을 수행한 후 주변블록의 루마 샘플들로부터 구성될 수도 있다. 또 다른 예로, 참조샘플 세트는 블록 주위에서 정규 인트라 예측 수행에 사용되는 동일한 프로세스를 거쳐 구성될 수도 있다.
입력 경계 벡터의 생성
전술한 바와 같이, 코딩블록을 MIP 기반으로 예측할 때, 블록 좌측의 재구성된 주변 샘플들
Figure pat00043
과 블록 상단의 재구성된 주변 샘플들
Figure pat00044
이 이용될 수 있다. 그러나 이러한 방식은 블록의 텍스처가 방향 특성을 가지는 블록의 경우에 예측 성능을 저해할 수도 있다.
따라서, 블록의 텍스처가 가질 수 있는 방향 특성을 반영할 수 있도록,
Figure pat00045
Figure pat00046
중에서 입력 경계 벡터를 생성하는 데에 사용할 주변 샘플 세트를 선택적으로 사용하는 것이 유리할 수 있다. 예컨대, 현재의 코딩 블록의 픽셀들이 수평 방향 특성을 가지는 경우에, 왼쪽 이웃 샘플들을 이용하여 예측 신호를 생성하는 것이 유리할 수 있다. 유사하게, 현재의 코딩 블록의 픽셀들이 수직 방향 특성을 가지는 경우에, 위쪽 이웃 샘플들을 이용하여 예측 신호를 생성하는 것이 유리할 수 있다. 입력 경계 벡터를 생성하는 데에 사용할 주변 샘플 세트는 코딩블록에 적용되는 MIP 모드에 따라 상이하게 결정될 수도 있다.
이하에서는 설명의 편의를 위해, 왼쪽 이웃 샘플들을 이용하는 경우와 위쪽 이웃 샘플들을 이용하는 경우를 구분하여, 경계 벡터 및 이로부터 예측 샘플들을 결정하는 몇몇 방법들을 설명한다.
A. 왼쪽 이웃 샘플들 이용한 경계 벡터 구성
도 7a 내지 도 7c는 왼쪽 이웃 샘플들을 이용하여 행렬-벡터 곱셈 연산에 입력되는 경계 벡터를 구성하는 예시적인 방법을 보이는 개념도이다.
일 예로, 도 7a에 예시된 바와 같이, 현재의 코딩 블록의 크기(높이)와 경계 벡터
Figure pat00047
의 크기가 동일한 경우에, 왼쪽 이웃 샘플 세트
Figure pat00048
을 이용하여 같은 크기의 경계 벡터
Figure pat00049
가 채워질 수 있다. 예컨대, 왼쪽 이웃 샘플들 각각이 경계 벡터의 엔트리에 포함될 수 있다.
다른 일 예로, 도 7b에 예시된 바와 같이, 왼쪽 이웃 샘플 세트
Figure pat00050
로부터 얻어진 다운 샘플링된 샘플 세트
Figure pat00051
을 이용하여 경계 벡터
Figure pat00052
가 채워질 수도 있다. 예컨대,
Figure pat00053
Figure pat00054
을 두 샘플씩 평균하여 얻어질 수 있다.
또 다른 일 예로, 도 7c에 예시된 바와 같이, 왼쪽에 이웃한 두 개의 열을 이용하여, 각 행의 두 픽셀 간의 평균값을 계산함으로써, 경계 벡터
Figure pat00055
가 채워질 수 있다.
코딩 블록의 크기에 따라, 적응적으로
Figure pat00056
Figure pat00057
가 사용될 수도 있다. 예를 들어, 아래 수학식과 같이, H<=8 이면
Figure pat00058
가 사용되고, 그 외에는
Figure pat00059
가 사용될 수 있다.
Figure pat00060
일부 실시예에서,
Figure pat00061
로부터 다운 샘플링된 샘플 세트
Figure pat00062
를 생성하는 데 있어서, 동영상 콘텐츠 특성에 따라 상이한 방식의 다운 샘플링이 수행될 수도 있다. 스크린 콘텐츠 코딩(screen content coding: SCC)과 같이, 동영상 콘텐츠가 특정 영역 안에 동일한 픽셀 값 혹은 intensity 값을 갖거나 점진적으로 픽셀 값 혹은 intensity 값이 증가/감소하는 특성을 가질 수도 있다. 그러한 경우에, 평균값 연산을 통해
Figure pat00063
로부터 다운 샘플링된
Figure pat00064
를 생성하는 것보다는
Figure pat00065
의 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들만을 샘플링하여
Figure pat00066
를 생성하는 것이 다운 샘플링 복잡도를 낮추는 데에 유용할 수 있다.
예컨대,
Figure pat00067
가 [0]부터 [H-1]까지 H 개의 엔트리를 가지며 이로부터 H/2 크기의
Figure pat00068
를 생성한다고 할 때, 아래 수식과 같이, H≤8 이면
Figure pat00069
를 그대로 이용하고, 그 외에는 0을 포함한 짝수 위치에 해당하는 엔트리들을 취하여
Figure pat00070
이 생성될 수 있다.
Figure pat00071
나아가,
Figure pat00072
의 첫 번째 위치의 엔트리 값으로
Figure pat00073
의 모든 엔트리를 채우는 방식으로 다운 샘플링 복잡도를 더 단순화할 수도 있다.
Figure pat00074
이러한 단순화된 다운 샘플링과 평균값 연산을 통한 다운 샘플링은 동영상 콘텐츠의 특성에 의존하여 선택될 수 있다. 일 예로, MIP 코딩되는 현재 블록의 왼쪽에 위치하는 코딩 블록이, 스크린 콘텐츠 코딩에 적합한 코딩툴인, 인트라 블록 카피(IBC)가 적용된 경우에, 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들을 취하는 단순한 다운 샘플링이 이용될 수 있다. 다른 일 예로, MIP 코딩되는 현재 블록의 왼쪽에 위치하는 코딩 블록이, 스크린 콘텐츠 코딩에서 자주 사용되는, 변환생략 모드(transform skip mode)가 적용된 경우에, 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들을 취하는 단순한 다운 샘플링이 이용될 수 있다. 또 다른 일 예로, 평균값 연산을 통한 다운 샘플링은 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들을 취하는 단순한 다운 샘플링으로 완전히 대체될 수 있다.
B. 위쪽 이웃 샘플들 이용한 경계 벡터 구성
도 8a 내지 도 8c는 위쪽 이웃 샘플들을 이용하여 행렬-벡터 곱셈 연산에 입력되는 경계 벡터를 구성하는 예시적인 방법을 보이는 개념도이다.
일 예로, 도 8a에 예시된 바와 같이, 현재의 코딩 블록의 크기(너비)와 경계 벡터
Figure pat00075
의 크기가 동일한 경우에, 위쪽 이웃 샘플 세트
Figure pat00076
을 이용하여 같은 크기의 경계 벡터
Figure pat00077
가 채워질 수 있다. 예컨대, 위쪽 이웃 샘플들 각각이 경계 벡터의 엔트리에 포함될 수 있다.
또 다른 일 예로, 도 8b에 예시된 바와 같이, 위쪽 이웃 샘플 세트
Figure pat00078
로부터 얻어진 다운 샘플링된 샘플 세트
Figure pat00079
을 이용하여 경계 벡터
Figure pat00080
가 채워질 수도 있다. 예컨대,
Figure pat00081
Figure pat00082
을 두 샘플씩 평균하여 얻어질 수 있다.
또 다른 일 예로, 도 8c에 예시된 바와 같이, 위쪽에 이웃한 두 개의 행을 이용하여, 각 열의 두 픽셀 간의 평균값을 계산함으로써, 경계 벡터
Figure pat00083
가 채워질 수 있다.
코딩 블록의 크기에 따라, 적응적으로
Figure pat00084
Figure pat00085
가 사용될 수도 있다. 예를 들어, 아래 수학식과 같이, W<=8 이면
Figure pat00086
가 사용되고, 그 외에는
Figure pat00087
가 사용될 수 있다.
Figure pat00088
전술한 바와 같이, 평균값 연산을 통해
Figure pat00089
로부터 다운 샘플링된
Figure pat00090
를 생성하는 것보다는
Figure pat00091
의 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들만을 샘플링하여
Figure pat00092
를 생성하는 것이 다운 샘플링 복잡도를 낮추는 데에 유용할 수 있다.
예컨대,
Figure pat00093
가 [0]부터 [W-1]까지 W 개의 엔트리를 가지며 이로부터 W/2 크기의
Figure pat00094
를 생성한다고 할 때, 아래 수식과 같이, W≤8 이면
Figure pat00095
를 그대로 이용하고, 그 외에는 0을 포함한 짝수 위치에 해당하는 엔트리들을 취하여
Figure pat00096
이 생성될 수 있다.
Figure pat00097
나아가,
Figure pat00098
의 첫 번째 위치의 엔트리 값으로
Figure pat00099
의 모든 엔트리를 채우는 방식으로 다운 샘플링 복잡도를 더 단순화할 수도 있다.
Figure pat00100
이러한 단순화된 다운 샘플링과 평균값 연산을 통한 다운 샘플링은 동영상 콘텐츠의 특성에 의존하여 선택될 수 있다. 일 예로, MIP 코딩되는 현재 블록의 왼쪽(혹은 상측)에 위치하는 코딩 블록이, 스크린 콘텐츠 코딩에 적합한 코딩툴인, 인트라 블록 카피(IBC)가 적용된 경우에, 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들을 취하는 단순한 다운 샘플링이 이용될 수 있다. 다른 일 예로, MIP 코딩되는 현재 블록의 왼쪽(혹은 상측)에 위치하는 코딩 블록이, 스크린 콘텐츠 코딩에서 자주 사용되는, 변환생략 모드(transform skip mode)가 적용된 경우에, 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들을 취하는 단순한 다운 샘플링이 이용될 수 있다. 또 다른 일 예로, 평균값 연산을 통한 다운 샘플링은 짝수 위치(혹은 홀수 위치)에 해당하는 엔트리들을 취하는 단순한 다운 샘플링으로 완전히 대체될 수 있다.
행렬-벡터 곱셈
VVC draft 5에 기술된 MIP 기법에 따르면, 좌측 주변 샘플 세트와 상측 주변 샘플 세트로부터 길이 4 또는 8의 경계 벡터
Figure pat00101
가 얻어진다. 경계 벡터
Figure pat00102
는 벡터-행렬 곱셈 연산에 입력된다. 경계 벡터
Figure pat00103
에 곧바로 벡터-행렬 곱셈을 적용하는 이러한 방식 대신에, 벡터-행렬 곱셈을 적용하기에 앞서 경계 벡터
Figure pat00104
로부터 DC 성분을 제거하고, 벡터-행렬 곱셈을 적용한 후에 DC 성분을 더하는 방식을 사용하는 것이 연산 및 하드웨어 복잡도 측면에서 유리할 수 있다. 이러한 방식에 따르면, 벡터-행렬 곱셈에 사용되는 가중치 행렬의 모든 엔트리들이 부호 없는 정수형(unsigned integer)으로 표현 가능하게 한다. 즉, 경계 벡터
Figure pat00105
에 벡터-행렬 곱셈을 적용하기에 앞서,
Figure pat00106
에 포함된 엔트리들의 평균을 0으로 만들거나 그에 가깝게 변환하는 것이 유리할 수 있다.
일 예로, 벡터-행렬 곱셈을 적용하기에 앞서,
Figure pat00107
의 각 엔트리로부터
Figure pat00108
에 속하는 하나의 픽셀값을 뺄 수 있다. 다른 일 예로, 벡터-행렬 곱셈을 적용하기에 앞서,
Figure pat00109
의 각 엔트리로부터
Figure pat00110
의 평균값을 뺄 수 있다. 또 다른 일 예로, 벡터-행렬 곱셈을 적용하기에 앞서,
Figure pat00111
의 각 엔트리로부터
Figure pat00112
의 첫 번째 엔트리의 픽셀값을 뺄 수 있다.
일 구현 예로서, 비디오 부호화기 및 복호화기는 경계 벡터
Figure pat00113
의 평균값을 계산하고, 경계 벡터
Figure pat00114
의 각 엔트리에서 평균값을 감산함으로써 얻어지는 벡터에 벡터-행렬 곱셈을 적용할 수 있다. 벡터-행렬 곱셈 연산에 입력되는 입력 경계 벡터
Figure pat00115
는 다음과 같이 정의될 수 있다. 여기서, p_avr은 경계 벡터
Figure pat00116
의 평균값이고, bitDepth는 루마 비트 심도(luma bit-depth)를 나타낸다.
MipSizeId (= idx(W,H))가 0 또는 1인 경우에,
Figure pat00117
MipSizeId (= idx(W,H))가 2인 경우에,
Figure pat00118
다른 일 구현 예로서, 평균값 계산을 피하고자, 평균값을 경계 벡터
Figure pat00119
의 첫 번째 엔트리로 교체하는 것이 고려될 수 있다. 이 경우, 벡터-행렬 곱셈 연산에 입력되는 입력 경계 벡터
Figure pat00120
는 다음과 같이 정의될 수 있다.
MipSizeId (= idx(W,H))가 0 또는 1인 경우에,
Figure pat00121
MipSizeId (= idx(W,H))가 2인 경우에,
Figure pat00122
즉, MipSizeId가 0 또는 1인 경우에 대해, 입력 경계 벡터
Figure pat00123
의 첫 번째 엔트리는 비트 뎁스(bit depth)로 표현될 수 있는 최대값의 절반(
Figure pat00124
)과 경계 벡터
Figure pat00125
의 첫 번째 엔트리 간의 차분에 기초하여 얻어지고, 입력 경계 벡터
Figure pat00126
의 후속하는 엔트리들은 경계 벡터
Figure pat00127
의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것에 기초하여 얻어진다. MipSizeId = 2에 대해, 차분 벡터는 길이 7을 가지게 되며, 따라서 이에 대해 사용되는 세트 S2의 가중치 행렬들(A2)는 각각 64행과 7열을 갖는다(VVC draft 5에서 가중치 행렬들(A2)는 각각 64행과 8열을 갖는다).
또한, 가중치 행렬들(A0, A1, A2)들에 오프셋 벡터를 미리 차분해 둔 행렬 mWeight[ x ][ y ]을 사용함으로써, 약간의 오차를 수반하는 예측값을 얻는 대신에,
Figure pat00128
에서 오프셋 벡터(b)을 제거할 수 있다. 개선된 방식에 따르면, 예측 샘플 세트 predred[x][y]는 다음과 같이 계산될 수 있다.
Figure pat00129
여기서,
Figure pat00130
, inSize는
Figure pat00131
의 크기이다.
선형 보간
Figure pat00132
의 엔트리의 수가 예측블록의 샘플 수보다 작은 경우 보간이 필요하다. 크기 predW 과 predH 을 갖는 다운 샘플링된 예측 블록이 다음과 같이 정의된다.
predred[x][y], with x = 0..predW - 1, y = 0..predH - 1
나머지 위치에서의 예측 신호를 각 방향에 따라 선형 보간하여 생성되는, 코딩블록에 대응되는, 크기(nTbW, nTbH)의 예측 블록은 다음과 같이 정의된다.
predSamples[x][y], with x = 0..nTbW - 1, y = 0..nTbH - 1
수평 및 수직 업샘플링 스케일 팩터인 upHor(= nTbW / predW)과 upVer (= nTbH / predH)에 의존하여, 다음과 같이,
Figure pat00133
로부터 predSamples의 일부 혹은 전부가 채워진다.
predSamples[(x+1) * upHor - 1][(y+1) * upVer - 1] = predred [x][y]
upHor = 1이면
Figure pat00134
로부터 predSamples의 수평 방향의 모든 위치가 채워지며, upVer = 1이면
Figure pat00135
로부터 predSamples의 수직 방향의 모든 위치가 채워진다.
이 후 bi-linear 보간법을 통해 predSamples의 나머지 비어있는 샘플들이 채워진다. 수평 방향의 보간과 수직 방향의 보간은 업샘플링 프로세스이다. 보간 순서는 코딩 블록의 크기에 상관없이 고정된 순서로 수행될 수 있다. 일 예로 항상 코딩 블록의 수평 방향으로 먼저 보간이 수행되고, 후속하여 수직 방향으로 보간이 수행될 수 있다. 이 때, 업샘플링 전에, predred[x][y] 혹은 predSamples[x][y]의 값들이 0 내지 2bitDepth-1 사이에 놓이도록 클리핑(clipping)이 수행될 수 있다. 2bitDepth-1는 비트 뎁스(bit depth)로 표현될 수 있는 최대값이다.
보간을 위해서
Figure pat00136
와 이웃 블록의 참조픽셀들이 다음과 같이 참조될 수 있다. 일 예로, 상단의 오리지널 참조샘플들
Figure pat00137
이 predSamples[x][-1] 값들에 할당되고, 좌측의 오리지널 참조샘플들
Figure pat00138
이 predSamples[-1][y] 값들에 할당될 수 있다. 다른 일 예로, LMCS이 적용되기 전 혹은 후의 이웃 블록 내 루마 샘플들이 predSamples[x][-1] 위치들과 predSamples[-1][y] 위치들에 할당될 수 있다. 또 다른 일 예로, 코딩 블록 주위에서 인트라 예측 수행을 위한 블록경계 필터링을 수행하기 전 혹은 후의 이웃 블록 내 루마 샘플들이 predSamples[x][-1] 위치들과 predSamples[-1][y] 위치들에 할당될 수 있다.
mip_transpose_flag
전술한 바와 같이, VVC draft 5는 코딩블록(CU)의 크기 및 형상에 따라 최대 35개의 MIP 모드들이 지원한다. 예를 들어, max (W, H) <= 8 && W*H <32 인 CU에 대해, 35 개의 모드가 이용 가능하며, 각각 max(W, H) = 8 및 max(W, H) > 8인 CU에 대해 각각 19개 및 11개의 예측 모드가 사용된다. 또한, 한 쌍의 모드(두 개의 모드)가, 메모리 요구 사항을 줄이기 위해, 행렬 및 오프셋 벡터를 공유할 수 있다. 예컨대, 4×4 코딩 블록에 대해, mode 19는 mode 2에 대해 할당된 행렬의 전치 행렬(transposed matrix)을 사용한다. 나아가, MIP 모드와 블록의 크기에 따라 결정되는 순서로
Figure pat00139
Figure pat00140
를 접합함으로써, 벡터-행렬 곱셈 연산에 입력되는 경계 벡터
Figure pat00141
가 생성된다.
복잡도를 낮추면서도 실질적으로 동등한 수준의 코딩 효율을 달성할 수 있는 개선된 방식이 사용될 수 있다. 본 개시의 다른 측면에 따르면, 하나의 모드가 다른 하나의 모드가 사용하는 행렬을 전치하여 사용하는 종래의 방식 대신에, 각 모드에 대해, 벡터-행렬 곱셈에 사용되는 경계 벡터
Figure pat00142
를 구성하는
Figure pat00143
Figure pat00144
를 접합하는 순서를 변경 가능하도록 구성된 새로운 방식이 사용될 수 있다. 비디오 부호화기는 각 모드에 대해, 경계 벡터
Figure pat00145
를 구성하는
Figure pat00146
Figure pat00147
를 접합하는 순서를 지시하는 신택스 엘리먼트(mip_transpose_flag)를 시그널링할 수 있다. 신택스 엘리먼트(mip_transpose_flag)가
Figure pat00148
Figure pat00149
의 순서로 접합하는 것을 지시하는 경우에, 행렬-벡터 곱셈 연산을 통해 얻어진 예측 행렬도 전치될 수 있다. 이러한 방식에 따르면, 가용한 MIP 모드의 수는 기존의 방식에 비해 절반 수준으로 줄어들 수 있으며, 경계 벡터의 생성 및 벡터-행렬 곱셈 연산을 위한 코딩 복잡도가 감소될 수 있다.
MIP 모드의 시그널링
인트라 예측 모드로 코딩된 코딩 유닛(CU)에 대해, 인트라 예측 타입이 행렬 기반의 인트라 예측(MIP)인지 여부를 나타내는 플래그가 시그널링 될 수 있다. MIP가 적용되는 경우에, 가용한 복수의 MIP 모드들 중에서, 현재의 코딩 유닛에 사용된 MIP 모드를 지시하는 신택스 엘리먼트가 추가로 시그널링될 수 있다.
기존의 인트라 예측 모드(정규 인트라 예측 모드)와 상이하게, MIP 모드의 시그널링을 위해 MPM 리스트가 사용되지 않을 수 있다. 예를 들어, 복수의 MIP 모드들 중에서, 현재의 코딩 유닛에 사용된 MIP 모드를 지시하는, 절삭된 이진 코드(truncated binary code)로 코딩될 수 있는, 하나의 신택스 엘리먼트(예컨대, intra_mip_mode)가 사용될 수 있다.
VVC 5 draft에 기초하여 제안된 예시적인 코딩 유닛 신택스의 일부가 이하에 제공된다. 아래의 신택스에서, 엘리먼트들의 회색화는 이해를 돕기 위해 사용된다.
Figure pat00150
intra_mip_flag [ x0 ][ y0 ] 가 1인 경우는 현재 블록의 인트라 예측 타입이 행렬 기반의 인트라 예측(MIP)임을 가리킨다. intra_mip_flag [ x0 ][ y0 ] 가 0인 경우는 현재 블록의 인트라 예측 타입이 행렬 기반의 인트라 예측이 아닌 정규의 인트라 예측임을 가리킨다. intra_mip_flag [ x0 ][ y0 ] 이 존재하지 않으면 0과 같다고 추론될 수 있다. intra_mip_mode [ x0 ][ y0 ] 는 행렬 기반의 인트라 예측(MIP)에서 현재의 블록에 대해 사용되는 MIP 모드를 지시하며, 절삭된 이진 코드(truncated binary code)로 표현된다.
MPM(Most Probable Mode)
종래의 접근법에서, MPM(Most Probable Mode)를 사용하는 인트라 예측 코딩이 사용될 수 있다. 예를 들어, HEVC에서, 3개의 MPM들의 리스트는 왼쪽 및 위쪽 블록의 인트라 예측 모드로부터 구성된다. 이러한 방법의 단점은 더 많은 모드(MPM이 아닌 인트라 모드)가 더 많은 비트로 코딩되어야 하는 non-MPM들에 속한다는 것이다. MPM의 수를 3개 이상의 엔트리(예를 들어, 6개의 MPM 모드)로 확장하기 위한 몇몇 방법이 제안되었다. 그러나 더 많은 엔트리가 포함된 이러한 MPM 리스트를 구성하려면 더 많은 검사와 조건이 필요할 수 있으며 이로 인해 구현이 더 복잡해질 수 있다.
MPM 리스트 구성의 복잡성을 낮게 유지하기 위해, 현재블록에 인접한 좌측블록 및 상단블록의 인트라 예측 모드를 이용하여 6개의 MPM 후보들을 포함하는 MPM 리스트가 구성될 수 있다. MPM 후보들은 디폴트 인트라 예측 모드(예컨대, PLANAR 모드), 주변 블록의 인트라 예측 모드, 주변 블록의 인트라 예측 모드로부터 파생된 인트라 예측 모드로 구성될 수 있다. 주변 블록의 인트라 예측 모드가 이용하지 않을 때(예를 들어, 주변 블록이 인터 예측된 경우, 주변 블록이 다른 슬라이스 혹은 다른 타일에 위치한 경우), 주변 블록의 인트라 예측 모드의 인트라 예측 모드는 PLANAR로 설정될 수 있다.
좌측블록의 모드(Left) 및 상단블록의 모드(Above)의 인트라 예측 모드의 타입에 따라 크게 4가지 경우로 구분되며, Left와 Above가 서로 다르며 두 모드가 모두 방향성 모드인 경우 Left와 Above의 차이에 따라 더 구분하여 MPM 리스트가 생성될 수 있다. 아래 표에서 Max는 Left와 Above 중 큰 모드를 가리키며, MIN는 Left와 Above 중 작은 모드를 가리킨다.
Figure pat00151
비디오 부호화기는 현재블록의 인트라 예측 모드가 MPM에 해당하는지 여부를 나타내는 1비트 플래그(예컨대, mpm_flag)를 시그널링할 수 있다. 전형적으로, 현재블록의 인트라 예측 모드가 MPM에 해당하는 경우에, 6개의 MPM들 중에서 하나(즉, PLANAR 모드)를 지시하는 MPM 인덱스가 추가로 시그널링된다. 표 6에서 PLANAR 모드가 항상 MPM 리스트에 포함됨에 주목한다. 즉, 6개의 MPM들은 PLANAR 와 5개의 non-PLANAR MPM들로 구분될 수 있다. 따라서, 부호화기는 현재블록의 인트라 예측 모드가 PLANAR 모드인 경우에, 현재블록의 인트라 예측 모드가 PLANAR 모드인지 여부를 (예컨대, 1비트 플래그를 이용하여) 명시적으로 시그널링하고, 현재블록의 인트라 예측 모드가 나머지 5개의 non-PLANAR MPM 중 하나와 동일한 경우에, 나머지 5개의 non-PLANAR MPM 중에서 하나를 지시하는 MPM 인덱스를 추가로 시그널링하는 것이 효율적일 수 있다. 현재블록의 인트라 예측 모드가 MPM에 해당하지 않는 경우에, 6개의 MPM들을 제외한 나머지 61개의 non-MPM들 중 하나를 지시하는 신택스 엘리먼트가 절삭된 이진 코드(truncated binary code)를 이용하여 부호화될 수 있다.
A. MIP 모드와 정규 모드 간의 매핑 테이블의 제거
VVC draft 5에서는, MIP 모드와 정규 모드의 시그널링을 위해 각각 MPM 리스트가 사용되고, MIP 리스트를 구성하기 위해 MIP 모드와 정규 모드 간의 매핑 테이블이 요구된다. 평균값 연산과 보간 연산을 포함하는 행렬 기반 인트라 예측(MIP) 기법의 특성상, MIP가 적용된 블록의 잔차신호는 변환 도메인에서 저주파수 성분이 우세할 수 있다. 이러한 잔차신호의 특성은 PLANAR 모드 혹은 DC 모드가 적용된 블록의 잔차신호와 유사할 수 있다. 따라서, 정규 인트라 예측 모드로 코딩되는 블록의 MPM 리스트를 유도함에 있어서, 이러한 잔차신호의 유사성에 착안하여, MIP 모드와 정규 모드 간의 매핑 테이블의 이용을 피할 수 있다.
본 개시의 일 측면에 따르면, 정규의 인트라 예측 모드로 코딩된 블록(즉, 정규 블록)에 대해 MPM 리스트를 유도함에 있어서, 주변 블록이 MIP 모드로 코딩된 경우에, 주변 블록의 인트라 예측 모드가 PLANAR 모드(혹은 DC 모드)인 것으로 간주될 수 있다. 일 예로, 주변 블록에 MIP 모드가 적용된 경우에, 그 주변 블록의 MIP 모드 대신 PLANAR 모드(혹은 DC 모드)를 MPM 리스트에 추가할 수 있다. 이로서, 부호화기와 복호화기가 MIP 모드와 정규 모드 간의 매핑 테이블을 메모리에 저장할 필요성이 제거된다.
유사하게, 크로마 DM(direct mode) 유도 시에도, 동일 위치의 루마 블록에 MIP가 적용된 경우에, MIP 모드와 정규 모드 간의 매핑 테이블을 사용하는 대신에, 그 루마 블록의 인트라 예측 모드는 PLANAR 모드(혹은 DC 모드)로 간주될 수 있다. 따라서, 부호화기는, 크로마 블록에 대한 인트라 예측 모드를 특정하는 신택스 엘리먼트를 파싱하고, 그 신택스 엘리먼트에 의해 크로마 블록의 인트라 예측 모드가 동일 위치의 루마 블록의 인트라 예측 모드를 그대로 이용한다고 지시되고, 그 동일 위치의 루마 블록에 MIP가 적용된 경우에, 그 루마 블록의 인트라 예측 모드는 PLANAR 모드(혹은 DC 모드)로 간주될 수 있다. 즉, 크로마 DM(direct mode) 에서 동일 위치의 루마 블록에 MIP가 적용된 경우에, 크로마 블록의 인트라 예측 모드는 PLANAR 모드(혹은 DC 모드)로 결정될 수 있다.
B. 정규 인트라 모드로의 MIP 모드 통합
한편, VVC draft 5에서는 행렬 기반 인트라 예측(MIP)을 정규 인트라 예측과는 다른 별도의 인트라 예측 타입으로 취급하고, CU 레벨에서 intra_mip_flag를 이용하여 MIP 사용 여부를 시그널링한다. MIP를 사용하는 경우에는 현재의 CU에 대해 선택된 MIP 모드가 코딩하고, MIP를 사용하지 않는 경우에는 현재의 CU에 대해 선택된 정규 인트라 예측 모드가 코딩된다. 이하에서는, 인트라 예측 모드의 시그널링 효율을 개선할 수도 있는 대안적인 접근법이 제시된다. 제안된 접근법은 정규 모드 중 하나(예컨대, PLANAR, DC, 방향성 모드)를 MIP 모드로 대체하거나 정규 모드의 하나로서 MIP 모드를 추가하는 것에 기초한다. 정규 모드 중 하나를 MIP 모드로 대체하는 것은 MIP 모드와 어떠한 정규 모드 사이에 중복성이 존재할 수도 있는 경우에 유용할 수 있다. 그러한 경우에, 제안된 접근법은 인트라 예측 모드의 시그널링 효율을 개선할 수도 있다.
전술한 67개 모드 중 DC 모드를 MIP 모드로 대체하는 경우에, 코딩 블록의 인트라 예측 모드를 복호화하는 방식이 예시적으로 설명된다.
비디오 복호화기는 코딩 블록에 대한 intra_predictiton_mode[ x0 ][ y0 ]를 결정하기 위해 MPM 리스트를 이용할 수 있다. 비디오 복호화기는 intra_predictiton_mode[ x0 ][ y0 ]를 결정하기 위해 MPM 관련 신택스 엘리먼트들을 복호화할 수 있다. intra_predictiton_mode[ x0 ][ y0 ]의 값이 {0, 2 ... 66} 중 하나이면, 코딩 블록의 인트라 예측 타입은 정규 인트라 예측으로 설정된다. intra_predictiton_mode[ x0 ][ y0 ]의 값이 (기존의 INTRA_DC의 모드 인덱스였던) 1이면, 비디오 복호화기는 코딩 블록의 인트라 예측 타입을 행렬 기반 인트라 예측(MIP) 으로 설정하고, 코딩 블록의 부호화에 사용된 MIP 예측 모드를 가리키는 신택스 엘리먼트를 복호화한다.
현재의 코딩블록에 인접한 좌측블록 및 상단블록의 인트라 예측 모드를 이용하여, 예컨대, 6개의 MPM 후보들을 포함하는 MPM 리스트가 구성될 수 있다. 좌측블록의 모드(Left)와 상단블록의 모드(Above)가 방향성 모드인지 여부에 따라 크게 4가지 경우로 구분되며, Left와 Above가 서로 다르며 두 모드가 모두 방향성 모드인 경우 Left와 Above의 차이에 따라 2가지로 경우로 더 구분하여, MPM 리스트가 생성될 수 있다. 아래 표 7에서 Max는 Left와 Above 중 큰 모드를 가리키며, Min은 Left와 Above 중 작은 모드를 가리킨다.
Figure pat00152
표 7에서 MIP 모드가 항상 MPM 리스트에 포함됨에 주목한다. 즉, 6개의 MPM들은 MIP와 5개의 non-MIP MPM들로 구분될 수 있다. 따라서, 부호화기는 현재블록의 인트라 예측 모드가 MPM인 경우에, 현재블록의 인트라 예측 모드가 MIP 모드인지 여부를 (예컨대, 1비트 플래그를 이용하여) 먼저 시그널링하고, 현재블록의 인트라 예측 모드가 MIP 모드가 아니면 현재블록의 인트라 예측 모드가 나머지 5개의 non-MIP MPM 중에서 하나를 지시하는 MPM 인덱스를 추가로 시그널링하는 것이 효율적일 수 있다. 현재블록의 인트라 예측 모드가 MPM이 아닌 경우에, 6개의 MPM들을 제외한 나머지 61개의 non-MPM들 중 하나를 지시하는 신택스 엘리먼트가 절삭된 이진 코드(truncated binary code)를 이용하여 부호화될 수 있다.
정규 인트라 예측 모드는 VVC의 Multiple reference line(MRL)과 Intra sub-partition(ISP)와 함께 적용이 가능함에 반해, MIP 모드는 MRL index가 0인 경우(즉, 첫번째 라인의 참조 샘플들을 사용하는 경우)와 ISP가 적용이 되지 않는 경우에만 사용가능할 수 있다. 그러나 MRL과 ISP의 적용 여부에 관계없이, MIP 모드가 사용가능할 수도 있다.
예시적인 인트라 예측 모드 관련 신택스의 일부가 이하에 제공된다. 아래의 신택스에서, 엘리먼트들의 회색화는 이해를 돕기 위해 사용된다.
Figure pat00153
루마 성분의 코딩 블록에 대한 인트라 예측 모드는 intra_luma_mpm_flag, intra_luma_not_MIP_flag, intra_luma_mpm_idx, intra_mip_mode 및 intra_luma_mpm_remainder를 포함하는 신택스 엘리먼트들을 이용하여 시그널링될 수 있다.
intra_luma_mpm_flag는 코딩 블록의 인트라 예측 모드가 MPM 모드인지 여부를 나타낸다. intra_luma_mpm_flag가 존재하지 않으면, Intra_luma_mpm_flag는 1과 같다고 추론된다. intra_luma_not_MIP_flag는 코딩 블록의 인트라 예측 모드가 MIP 모드인지 여부를 나타내고, intra_luma_not_MIP_flag가 1 이면 코딩 블록의 인트라 예측 모드는 MIP 모드가 아님을(즉, 정규 인트라 모드임을) 나타낸다. intra_mip_mode는 현재 코딩블록의 크기에 대해 이용가능한 복수의 MIP 모드들 중에서 하나의 MIP 모드를 특정하며, 절삭된 이진 코드(truncaed binary code)로 코딩될 수 있다. intra_luma_mpm_flag가 존재하지 않으면 intra_luma_mpm_flag는 1과 같다고 추론된다.
intra_luma_mpm_idx는 5개의 non-MIP MPM들 중에서 코딩 블록의 인트라 예측 모드와 동일한 하나의 MPM 모드를 특정한다. intra_luma_mpm_remainder는 non-MPM들 중에서 코딩 블록의 인트라 예측 모드와 동일한 하나의 non-MPM 모드를 특정한다. intra_luma_mpm_remainder는 절삭된 이진 코드(truncaed binary code)로 코딩될 수 있다.
표 8를 참조하면, 비디오 복호화기는 intra_luma_mpm_flag가 1이고 MRL INDEX가 0인 경우(즉, intra_luma_ref_idx = 0)에 intra_luma_not_MIP_flag를 파싱한다. intra_luma_not_MIP_flag가 0 이면, 코딩 블록의 인트라 예측 타입은 MIP이고, 따라서 비디오 복호화기는 코딩 블록에 사용된 MIP 모드를 식별하기 위해 intra_mip_mode를 복호화한다. intra_luma_not_MIP_flag가 1 이면, 비디오 복호화기는 5개의 non-MIP MPM들로 구성된 MPM 리스트를 구성한 뒤에 MPM INDEX를 가리키는 intra_luma_mpm_idx를 복호화한다. intra_luma_mpm_flag가 0이면, intra_luma_mpm_remainder를 복호화한다.
도 9는 본 발명의 일 실시예에 따른, 전술한 몇몇 개선사항들을 채용한, 비디오 데이터를 복호화하는 방법을 예시하는 흐름도이다.
비디오 복호화기는 비트스트림으로부터 비디오 데이터의 현재 블록의 인트라 예측 타입을 지시하는 신택스 엘리먼트를 복호화할 수 있다(S910). 인트라 예측 타입은 행렬 기반 인트라 예측(matrix based intra prediction: MIP)과 정규 인트라 예측(regular intra prediction)을 포함한다. 상기 신택스 엘리먼트는 현재 블록의 크기 및 형상에 대해 허용되는 복수의 행렬 기반 인트라 예측 모드들 중에서 하나를 특정하는 절삭된 이진 코드(truncated binary code) 일 수 있다.
비디오 복호화기는 현재 블록의 인트라 예측 타입에 기반하여 행렬 기반 인트라 예측 또는 정규 인트라 예측을 선택적으로 수행하여 현재 블록에 대한 예측 블록을 생성할 수 있다.
비디오 복호화기는 정규 인트라 예측을 수행하여 현재 블록에 대한 예측 블록을 생성하는 것의 일부로서, 다음과 같은 단계들(S920~S940)을 수행할 수 있다. 비디오 복호화기는 현재 블록에 인접한 주변 블록들의 정규 인트라 예측 모드를 기초로 MPM(Most Probable Mode) 후보들을 도출하여 상기 현재 블록에 대한 MPM 리스트를 구성하고(S920), MPM 리스트에 기초하여 상기 현재 블록에 대한 정규 인트라 예측 모드를 도출할 수 있다(S930). 주변 블록들의 정규 인트라 예측 모드를 기초로 MPM 후보들을 도출함에 있어서, 비디오 복호화기는 주변 블록의 인트라 예측 타입이 행렬 기반 인트라 예측인 경우에, 주변 블록의 정규 인트라 예측 모드는 PLANAR 모드로 설정(간주)할 수 있다. 복호화기는 현재 블록의 정규 인트라 예측 모드를 이용하여 현재 블록에 대한 예측 블록을 생성할 수 있다(S940).
비디오 복호화기는 행렬 기반 인트라 예측을 수행하여 현재 블록에 대한 예측 블록을 생성하는 것의 일부로서, 다음과 같은 단계들(S921~S951)을 수행할 수 있다. 비디오 복호화기는, 현재 블록에 대한 행렬 기반 인트라 예측 모드를 결정하기 위해, 비트스트림으로부터 현재 블록에 대한 행렬 기반 인트라 예측 모드를 지시하는 신택스 엘리먼트를 복호화할 수 있다(S921). 비디오 복호화기는 현재 블록의 너비 및 높이에 기초하여 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하고(S931), 현재 블록에 대한 행렬 기반 인트라 예측 모드에 대해 미리 정의된 행렬과 입력 경계 벡터 간의 행렬-벡터 곱셈에 기초하여, 현재 블록에 대한 예측 샘플들을 생성할 수 있다(S941). 비디오 복호화기는 예측 샘플들을 기초로 클리핑, 선형 보간 등을 수행하여 현재 블록에 대한 예측 블록을 도출할 수 있다(S951).
비디오 복호화기는, 상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하기 위해, 상기 현재 블록의 너비 및 높이에 따라, 상기 현재 블록에 인접한 주변 샘플들 또는 상기 주변 샘플들로부터 다운 샘플링된 값들로 채워지는 초기 경계 벡터를 생성하고, 상기 초기 경계 벡터로부터 DC 성분을 제거하여 상기 행렬-벡터 곱셈이 적용될 입력 경계 벡터를 생성할 수 있다. 일 예로, 상기 초기 경계 벡터로부터 DC 성분을 제거하는 것은 상기 초기 경계 벡터의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것이거나 이를 포함할 수 있다. 상기 입력 경계 벡터의 첫 번째 엔트리는 비트 뎁스(bit depth)로 표현될 수 있는 최대값의 절반과 상기 초기 경계 벡터의 첫 번째 엔트리 간의 차분에 기초하여 얻어지고, 상기 입력 경계 벡터의 후속하는 엔트리들은 상기 초기 경계 벡터의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것에 기초하여 얻어질 수 있다.
비디오 복호화기는, 상기 초기 경계 벡터를 생성하기 위해, 상기 비트스트림으로부터 상기 현재 블록에 인접한 좌측 주변 샘플들로부터 도출된 상기 초기 경계 벡터의 제 1 엔트리들과 상기 현재 블록에 인접한 상측 주변 샘플들로부터 도출된 상기 초기 경계 벡터의 제 2 엔트리들 간의 접합 순서를 지시하는 신택스 엘리먼트를 복호화하고, 상기 접합 순서에 따라 상기 제 1 엔트리들과 상기 제 2 엔트리들을 접합하여 상기 초기 경계 벡터를 생성할 수 있다.
비디오 복호화기는, 상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하기 위해, 상기 예측 샘플들을 상기 예측 블록 내 위치들에 할당하고, 상기 예측 샘플들, 상기 현재 블록에 인접한 좌측 주변 샘플들 및 상기 현재 블록에 인접한 상측 주변 샘플들에 대한 수평 방향 보간 및 수직 방향 보간을 수행하여 상기 예측 블록 내 상기 예측 샘플들이 할당되지 않은 위치들에 대한 예측 샘플값을 생성할 수 있다. 상기 수평 방향 보간은 상기 수직 방향 보간에 선행하여 수행될 수 있다.
상기 현재 블록이 루마(luma) 성분으로 이루어진 루마 블록이고 상기 행렬 기반 인트라 예측이 수행된 경우에, 상기 루마 블록에 대응하는 크로마 블록의 인트라 예측 모드가 상기 루마 블록의 인트라 예측 모드를 그대로 이용하는 경우에, 상기 크로마 블록의 인트라 예측 모드는 PLANAR 모드로 설정될 수 있다.
이상의 설명에서 예시적인 실시예들은 많은 다른 방식으로 구현될 수 있다는 것을 이해해야 한다. 하나 이상의 예시들에서 설명된 기능들 혹은 방법들은 하드웨어, 소프트웨어, 펌웨어 또는 이들의 임의의 조합으로 구현될 수 있다. 본 명세서에서 설명된 기능적 컴포넌트들은 그들의 구현 독립성을 특히 더 강조하기 위해 "...부(unit)" 로 라벨링되었음을 이해해야 한다.
한편, 본 개시에서 설명된 다양한 기능들 혹은 방법들은 하나 이상의 프로세서에 의해 판독되고 실행될 수 있는 비일시적 기록매체에 저장된 명령어들로 구현될 수도 있다. 비일시적 기록매체는, 예를 들어, 컴퓨터 시스템에 의하여 판독가능한 형태로 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 예를 들어, 비일시적 기록매체는 EPROM(erasable programmable read only memory), 플래시 드라이브, 광학 드라이브, 자기 하드 드라이브, 솔리드 스테이트 드라이브(SSD)와 같은 저장매체를 포함한다.
이상의 설명은 본 발명의 기술적 사상에 따른 몇몇 실시예를 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 예시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술적 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (20)

  1. 비디오 데이터를 복호화하는 방법으로서,
    비트스트림으로부터 비디오 데이터의 현재 블록의 인트라 예측 타입을 지시하는 신택스 엘리먼트를 복호화하는 단계 - 상기 인트라 예측 타입은 행렬 기반 인트라 예측(matrix based intra prediction: MIP)과 정규 인트라 예측(regular intra prediction)을 포함함 -; 및
    상기 신택스 엘리먼트가 지시하는 현재 블록의 인트라 예측 타입에 기반하여 행렬 기반 인트라 예측 또는 정규 인트라 예측을 선택적으로 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 단계
    를 포함하고,
    상기 행렬 기반 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 단계는,
    상기 비트스트림으로부터, 상기 현재 블록의 너비 및 높이에 대해 허용되는 복수의 행렬 기반 인트라 예측 모드들 중에서 하나를 특정하는 절삭된 이진 코드(truncated binary code)로 표현되는, 상기 현재 블록에 대한 행렬 기반 인트라 예측 모드를 지시하는 신택스 엘리먼트를 복호화하는 단계;
    상기 현재 블록의 너비 및 높이에 기초하여 상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하는 단계;
    상기 행렬 기반 인트라 예측 모드에 대해 미리 정의된 행렬과 상기 입력 경계 벡터 간의 행렬-벡터 곱셈에 기초하여, 상기 현재 블록에 대한 예측 샘플들을 생성하는 단계; 및
    상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하는 단계
    을 포함하는, 방법.
  2. 제 1 항에 있어서,
    상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하는 단계는,
    상기 현재 블록의 너비 및 높이에 따라, 상기 현재 블록에 인접한 주변 샘플들 또는 상기 주변 샘플들로부터 다운 샘플링된 값들로 채워지는 초기 경계 벡터를 생성하는 단계; 및
    상기 초기 경계 벡터로부터 DC 성분을 제거하여 상기 행렬-벡터 곱셈이 적용될 입력 경계 벡터를 생성하는 단계를 포함하는 것을 특징으로 하는, 방법.
  3. 제 2 항에 있어서,
    상기 초기 경계 벡터로부터 DC 성분을 제거하는 것은,
    상기 초기 경계 벡터의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것을 포함하는 것을 특징으로 하는, 방법.
  4. 제 2 항에 있어서,
    상기 입력 경계 벡터의 첫 번째 엔트리는 비트 뎁스(bit depth)로 표현될 수 있는 최대값의 절반과 상기 초기 경계 벡터의 첫 번째 엔트리 간의 차분에 기초하여 얻어지고,
    상기 입력 경계 벡터의 후속하는 엔트리들은 상기 초기 경계 벡터의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것에 기초하여 얻어지는 것을 특징으로 하는, 방법.
  5. 제 2 항에 있어서,
    상기 초기 경계 벡터를 생성하는 단계는,
    상기 비트스트림으로부터 상기 현재 블록에 인접한 좌측 주변 샘플들로부터 도출된 상기 초기 경계 벡터의 제 1 엔트리들과 상기 현재 블록에 인접한 상측 주변 샘플들로부터 도출된 상기 초기 경계 벡터의 제 2 엔트리들 간의 접합 순서를 지시하는 신택스 엘리먼트를 복호화하는 단계; 및
    상기 접합 순서에 따라 상기 제 1 엔트리들과 상기 제 2 엔트리들을 접합하여 상기 초기 경계 벡터를 생성하는 단계
    를 포함하는 것을 특징으로 하는, 방법.
  6. 제 1 항에 있어서,
    상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하는 단계는,
    상기 예측 샘플들을 상기 예측 블록 내 위치들에 할당하는 단계; 및
    상기 예측 샘플들, 상기 현재 블록에 인접한 좌측 주변 샘플들 및 상기 현재 블록에 인접한 상측 주변 샘플들에 대한 수평 방향 보간 및 수직 방향 보간을 수행하여, 상기 예측 블록 내 상기 예측 샘플들이 할당되지 않은 위치들에 대한 예측 샘플값을 생성하는 단계
    를 포함하는 것을 특징으로 하는, 방법.
  7. 제 6 항에 있어서,
    상기 수평 방향 보간은 상기 수직 방향 보간에 선행하여 수행되는 것을 특징으로 하는, 방법.
  8. 제 6 항에 있어서,
    상기 수평 방향 보간 및 수직 방향 보간을 수행하기 이전에, 상기 예측 샘플들이 0 내지 2bitDepth - 1 사이에 놓이도록, 상기 예측 샘플들에 대해 클리핑(clipping)을 수행하는 것을 특징으로 하는, 방법.
  9. 제 1 항에 있어서,
    상기 현재 블록은 루마(luma) 성분으로 이루어진 루마 블록이고,
    상기 루마 블록에 상기 행렬 기반 인트라 예측이 수행되고, 상기 루마 블록에 대응하는 크로마 블록의 인트라 예측 모드가 상기 루마 블록의 인트라 예측 모드를 그대로 이용하는 경우에, 상기 크로마 블록의 인트라 예측 모드는 PLANAR 모드로 설정되는 것을 인 것을 특징으로 하는, 방법.
  10. 제 1 항에 있어서,
    상기 정규 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 단계는,
    상기 현재 블록에 인접한 주변 블록들의 정규 인트라 예측 모드를 기초로 MPM(Most Probable Mode) 후보들을 도출하여 상기 현재 블록에 대한 MPM 리스트를 구성하는 단계; 및
    상기 MPM 리스트에 기초하여 상기 현재 블록에 대한 정규 인트라 예측 모드를 도출하는 단계를 포함하고,
    상기 주변 블록의 인트라 예측 타입이 행렬 기반 인트라 예측인 경우에, 상기 주변 블록의 정규 인트라 예측 모드는 PLANAR 모드로 간주되는 것을 특징으로 하는, 방법.
  11. 비디오 데이터를 복호화하는 장치로서,
    비트스트림으로부터 비디오 데이터의 현재 블록의 인트라 예측 타입을 지시하는 신택스 엘리먼트를 복호화하는 복호화부 - 상기 인트라 예측 타입은 행렬 기반 인트라 예측과 정규 인트라 예측을 포함함 -; 및
    상기 신택스 엘리먼트가 지시하는 현재 블록의 인트라 예측 타입에 기반하여 행렬 기반 인트라 예측 또는 정규 인트라 예측을 선택적으로 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 인트라 예측부
    를 포함하고,
    상기 인트라 예측부는,
    상기 행렬 기반 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 것의 일부로서,
    상기 비트스트림으로부터, 상기 현재 블록의 너비 및 높이에 대해 허용되는 복수의 행렬 기반 인트라 예측 모드들 중에서 하나를 특정하는 절삭된 이진 코드(truncated binary code)로 표현되는, 상기 현재 블록에 대한 행렬 기반 인트라 예측 모드를 지시하는 신택스 엘리먼트를 복호화하는 단계;
    상기 현재 블록의 너비 및 높이에 기초하여 상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하는 단계;
    상기 행렬 기반 인트라 예측 모드에 대해 미리 정의된 행렬과 상기 입력 경계 벡터 간의 행렬-벡터 곱셈에 기초하여, 상기 현재 블록에 대한 예측 샘플들을 생성하는 단계; 및
    상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하는 단계
    를 수행하는 것을 특징으로 하는, 장치.
  12. 제 11 항에 있어서,
    상기 현재 블록에 인접한 주변 샘플들을 이용하여 입력 경계 벡터를 도출하는 단계는,
    상기 현재 블록의 너비 및 높이에 따라, 상기 현재 블록에 인접한 주변 샘플들 또는 상기 주변 샘플들로부터 다운 샘플링된 값들로 채워지는 초기 경계 벡터를 생성하는 단계; 및
    상기 초기 경계 벡터로부터 DC 성분을 제거하여 상기 행렬-벡터 곱셈이 적용될 입력 경계 벡터를 생성하는 단계를 포함하는 것을 특징으로 하는, 장치.
  13. 제 12 항에 있어서,
    상기 초기 경계 벡터로부터 DC 성분을 제거하는 것은,
    상기 초기 경계 벡터의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것을 포함하는 것을 특징으로 하는, 장치.
  14. 제 12 항에 있어서,
    상기 입력 경계 벡터의 첫 번째 엔트리는 비트 뎁스(bit depth)로 표현될 수 있는 최대값의 절반과 상기 초기 경계 벡터의 첫 번째 엔트리 간의 차분에 기초하여 얻어지고,
    상기 입력 경계 벡터의 후속하는 엔트리들은 상기 초기 경계 벡터의 각 엔트리로부터 첫 번째 엔트리의 값을 차분하는 것에 기초하여 얻어지는 것을 특징으로 하는, 장치.
  15. 제 12 항에 있어서,
    상기 초기 경계 벡터를 생성하는 단계는,
    상기 비트스트림으로부터 상기 현재 블록에 인접한 좌측 주변 샘플들로부터 도출된 상기 초기 경계 벡터의 제 1 엔트리들과 상기 현재 블록에 인접한 상측 주변 샘플들로부터 도출된 상기 초기 경계 벡터의 제 2 엔트리들 간의 접합 순서를 지시하는 신택스 엘리먼트를 복호화하는 단계; 및
    상기 접합 순서에 따라 상기 제 1 엔트리들과 상기 제 2 엔트리들을 접합하여 상기 초기 경계 벡터를 생성하는 단계
    를 포함하는 것을 특징으로 하는, 장치.
  16. 제 11 항에 있어서,
    상기 예측 샘플들을 기초로 상기 현재 블록에 대한 예측 블록을 도출하는 단계는,
    상기 예측 샘플들을 상기 예측 블록 내 위치들에 할당하는 단계; 및
    상기 예측 샘플들, 상기 현재 블록에 인접한 좌측 주변 샘플들 및 상기 현재 블록에 인접한 상측 주변 샘플들에 대한 수평 방향 보간 및 수직 방향 보간을 수행하여, 상기 예측 블록 내 상기 예측 샘플들이 할당되지 않은 위치들에 대한 예측 샘플값을 생성하는 단계
    를 포함하는 것을 특징으로 하는, 장치.
  17. 제 16 항에 있어서,
    상기 수평 방향 보간은 상기 수직 방향 보간에 선행하여 수행되는 것을 특징으로 하는, 장치.
  18. 제 16 항에 있어서,
    상기 수평 방향 보간 및 수직 방향 보간을 수행하기 이전에, 상기 예측 샘플들이 0 내지 2bitDepth - 1 사이에 놓이도록, 상기 예측 샘플들에 대해 클리핑을 수행하는 것을 특징으로 하는, 장치.
  19. 제 11 항에 있어서,
    상기 현재 블록은 루마(luma) 성분으로 이루어진 루마 블록이고,
    상기 루마 블록에 상기 행렬 기반 인트라 예측이 수행되고, 상기 루마 블록에 대응하는 크로마 블록의 인트라 예측 모드가 상기 루마 블록의 인트라 예측 모드를 그대로 이용하는 경우에, 상기 크로마 블록의 인트라 예측 모드는 PLANAR 모드로 설정되는 것을 인 것을 특징으로 하는, 장치.
  20. 제 11 항에 있어서,
    상기 인트라 예측부는,
    상기 정규 인트라 예측을 수행하여 상기 현재 블록에 대한 예측 블록을 생성하는 것의 일부로서,
    상기 현재 블록에 인접한 주변 블록들의 정규 인트라 예측 모드를 기초로 MPM(Most Probable Mode) 후보들을 도출하여 상기 현재 블록에 대한 MPM 리스트를 구성하는 단계; 및
    상기 MPM 리스트에 기초하여 상기 현재 블록에 대한 정규 인트라 예측 모드를 도출하는 단계를 수행하고,
    상기 주변 블록의 인트라 예측 타입이 행렬 기반 인트라 예측인 경우에, 상기 주변 블록의 정규 인트라 예측 모드는 PLANAR 모드로 간주되는 것을 특징으로 하는,
    를 포함하는 것을 특징으로 하는, 장치.
KR1020200083979A 2019-07-08 2020-07-08 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치 KR20210006305A (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
PCT/KR2020/008910 WO2021006612A1 (ko) 2019-07-08 2020-07-08 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치
US17/276,540 US11284073B2 (en) 2019-07-08 2020-07-08 Method and apparatus for intra prediction coding of video data involving matrix based intra-prediction
US17/519,997 US11683486B2 (en) 2019-07-08 2021-11-05 Method and apparatus for intra-prediction coding of video data involving matrix-based intra-prediction
US17/520,031 US11909962B2 (en) 2019-07-08 2021-11-05 Method and apparatus for intra-prediction coding of video data involving matrix-based intra-prediction
US17/520,057 US11778174B2 (en) 2019-07-08 2021-11-05 Method and apparatus for intra-prediction coding of video data
US17/519,871 US11902512B2 (en) 2019-07-08 2021-11-05 Method and apparatus for intra-prediction coding of video data involving matrix-based intra-prediction

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
KR20190082130 2019-07-08
KR1020190082130 2019-07-08
KR20190102494 2019-08-21
KR1020190102495 2019-08-21
KR20190102495 2019-08-21
KR1020190102494 2019-08-21
KR1020190123492 2019-10-06
KR20190123492 2019-10-06

Publications (1)

Publication Number Publication Date
KR20210006305A true KR20210006305A (ko) 2021-01-18

Family

ID=74236872

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200083979A KR20210006305A (ko) 2019-07-08 2020-07-08 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치

Country Status (3)

Country Link
EP (1) EP3993412A4 (ko)
KR (1) KR20210006305A (ko)
CN (1) CN114128294A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023277577A1 (ko) * 2021-06-30 2023-01-05 엘지전자 주식회사 Mpm 리스트를 이용하는 인트라 예측 방법 및 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115866247B (zh) * 2023-03-02 2023-05-09 中南大学 基于mae预训练模型的视频编码帧内预测方法和系统
CN116095316B (zh) * 2023-03-17 2023-06-23 北京中星微人工智能芯片技术有限公司 视频图像处理方法及装置、电子设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY191819A (en) * 2011-02-10 2022-07-18 Sony Group Corp Image processing device and image processing method
KR102488123B1 (ko) * 2016-12-26 2023-01-12 에스케이텔레콤 주식회사 인트라 예측을 이용한 영상의 부호화 및 복호화
WO2019023200A1 (en) * 2017-07-24 2019-01-31 Arris Enterprises Llc INTRA-MODE JVET CODING
US10856003B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Coding affine prediction motion information for video coding
KR102402539B1 (ko) * 2017-11-28 2022-05-27 한국전자통신연구원 양방향 인트라 예측 방법 및 장치
US10284844B1 (en) * 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023277577A1 (ko) * 2021-06-30 2023-01-05 엘지전자 주식회사 Mpm 리스트를 이용하는 인트라 예측 방법 및 장치

Also Published As

Publication number Publication date
EP3993412A4 (en) 2023-03-08
CN114128294A (zh) 2022-03-01
EP3993412A1 (en) 2022-05-04

Similar Documents

Publication Publication Date Title
US11683486B2 (en) Method and apparatus for intra-prediction coding of video data involving matrix-based intra-prediction
JP7560078B2 (ja) 動画データのイントラ予測コーディングのための方法及び装置
US11930180B2 (en) Method and apparatus for intra-prediction coding of video data
KR20210018137A (ko) 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치
EP3993412A1 (en) Method and device for intra prediction coding of video data
KR20220118334A (ko) 서브블록 분할 기반 인트라 예측을 이용하는 비디오 코딩방법 및 장치
US20240007645A1 (en) Video encoding and decoding method using adaptive reference pixel selection
US20240007620A1 (en) Image encoding and decoding method using adaptive alternative mode
KR20210000282A (ko) 동영상 데이터의 인트라 예측 코딩을 위한 방법 및 장치
KR20220071128A (ko) 적응적 대체 모드를 이용한 영상 부호화 및 복호화 방법
KR20210025507A (ko) 차등 부호화를 이용하는 비디오 부호화 및 복호화
CN116648905A (zh) 利用自适应参考像素选择的影像编码和解码方法

Legal Events

Date Code Title Description
A201 Request for examination