KR20220013415A - Mpm 리스트 구성 방법, 크로마 블록 인트라 예측 모드 획득 방법, 및 장치 - Google Patents

Mpm 리스트 구성 방법, 크로마 블록 인트라 예측 모드 획득 방법, 및 장치 Download PDF

Info

Publication number
KR20220013415A
KR20220013415A KR1020217043040A KR20217043040A KR20220013415A KR 20220013415 A KR20220013415 A KR 20220013415A KR 1020217043040 A KR1020217043040 A KR 1020217043040A KR 20217043040 A KR20217043040 A KR 20217043040A KR 20220013415 A KR20220013415 A KR 20220013415A
Authority
KR
South Korea
Prior art keywords
intra prediction
block
prediction mode
mode
neighboring block
Prior art date
Application number
KR1020217043040A
Other languages
English (en)
Inventor
샹 마
하이타오 양
인 자오
롄 장
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20220013415A publication Critical patent/KR20220013415A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 출원은 MPM 리스트를 구성하기 위한 방법, 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법, 및 장치를 개시한다. 특정 구현에서, MIP 모드가 현재 블록에 사용되고, MPM 리스트를 구성하기 위한 방법은: 이웃 블록의 인트라 예측 모드 정보를 획득하는 단계; 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계; 및 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 것을 스킵하거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 단계를 포함한다. 본 출원의 구현은 MPM 리스트 구성의 복잡성을 감소시킬 수 있다.

Description

MPM 리스트 구성 방법, 크로마 블록 인트라 예측 모드 획득 방법, 및 장치
본 출원은 2019년 6월 5일자로 중국 지적 재산권 관리국에 출원되고 발명의 명칭이 "METHOD FOR CONSTRUCTING MPM LIST, METHOD FOR OBTAINING INTRA PREDICTION MODE OF CHROMA BLOCK, AND APPARATUS"인 중국 특허 출원 제201910486183.5호에 대한 우선권을 주장하며, 그 전체가 본 명세서에 참고로 포함된다.
본 출원은 비디오 코딩 분야에 관한 것으로, 특히, MPM 리스트를 구성하기 위한 방법, 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법, 및 장치에 관한 것이다.
인트라 예측은 현재 블록이 위치하는 픽처 내의 재구성된 픽셀을 사용하여 현재 블록을 예측하는 것을 지칭한다. 일반적으로, 현재 블록의 픽셀의 예측 값은 현재 블록 주위의 재구성된 이웃 블록의 픽셀을 사용하여 도출된다. 인트라 예측은 참조 픽셀을 특정 방향으로 현재 블록 내의 각각의 픽셀 위치에 매핑하여, 대응하는 위치에서의 픽셀의 예측 값을 획득하는 것이다. 따라서, 다양한 상이한 텍스처 또는 구조 특성들을 커버하기 위해, 복수의 매핑 방향 또는 매핑 방식이 있다. 일반적으로, 매핑 방향 또는 매핑 방식은 인트라 예측 모드라고 지칭된다. 인트라 예측 모드들의 세트는 35개의 상이한 인트라 예측 모드, 예를 들어, DC(또는 평균) 모드 및 평면 모드와 같은 비-방향성 모드들, 또는 H.265에 정의된 것들과 같은 방향성 모드들을 포함할 수 있거나, 67개의 상이한 인트라 예측 모드, 예를 들어, DC(또는 평균) 모드 및 평면 모드와 같은 비-방향성 모드들, 또는 개발 중인 H.266에 정의된 것들과 같은 방향성 모드들을 포함할 수 있다. 또한, 제14회 JVET 회의에서는, JVET-N0217 제안에서 행렬-기반 인트라 예측(Matrix-based Intra Prediction, MIP) 모드가 제안되었다. 인트라 예측은 현재 블록의 상부 에지 샘플 및 좌측 에지 샘플을 사용하여 주로 수행된다.
인트라 예측은 현재 블록에 대해 사용될 가능성이 가장 높은 복수의(예를 들어, 3개 또는 5개의) 인트라 예측 모드를 포함할 수 있는 최고 확률 모드(Most Probable Mode, MPM) 리스트에 관한 것이다. MPM 리스트는 MIP에 적용될 수 있다. 구체적으로, MPM 리스트는 이웃 블록의 인트라 예측 모드에 기초하여 구성된다.
그러나, 기존의 인트라 예측 방법에서는, MPM 리스트를 구성하기 위해 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초하여 MIP와 다른 인트라 예측 모드 사이에서 변환이 수행될 필요가 있다. 이는 높은 복잡성을 초래한다.
본 출원의 실시예들은 MPM 리스트를 구성하기 위한 방법, 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법, 및 MPM 리스트 구성의 복잡도를 감소시키기 위한 장치를 제공한다.
제1 양태에 따르면, 본 출원의 실시예는 MPM 리스트를 구성하기 위한 방법을 제공하며, MIP 모드는 현재 블록에 사용되고, 이 방법은:
이웃 블록의 인트라 예측 모드 정보를 획득하는 단계- 이웃 블록은 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -; 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계; 및 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 것을 스킵하거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 단계를 포함한다. MIP 모드는 VVC에서 새롭게 추가된 인트라 예측 기술이고, 인트라 예측은 현재 블록의 상부 에지 샘플 및 좌측 에지 샘플을 사용하여 주로 수행된다. 폭 W 및 높이 H를 갖는 직사각형 블록의 샘플을 예측하기 위해, 직사각형 블록의 좌측의 H개의 재구성된 이웃 샘플들의 열 및 직사각형 블록 위의 W개의 재구성된 이웃 샘플들의 행이 MIP 모드에서 입력으로서 사용된다. 재구성된 이웃 샘플들이 이용가능하지 않은 경우, 샘플은 종래의 인트라 예측에서와 같이 생성된다. 예측 신호는 다음의 3개의 단계: 평균화, 행렬 벡터 곱셈, 및 선형 보간에 기초하여 생성된다.
이 실시예의 구현에서, MIP 모드가 현재 블록에 사용될 때, 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용되지 않게 되고, 따라서 MPM 리스트 구성의 복잡성이 감소될 수 있다.
가능한 구현에서, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 것을 스킵하는 단계는: 이웃 블록의 인트라 예측 모드를 이용불가능하게 설정하는 단계를 포함한다.
가능한 구현에서, 이 방법은: 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, candMipModeX의 값을 -1로 설정하는 단계를 추가로 포함한다.
가능한 구현에서, 이 방법은: 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 디폴트 모드를 사용하는 단계를 추가로 포함한다.
가능한 구현에서, 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 단계는: 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록과 이웃 블록의 크기 인덱스들이 동일한지를 결정하는 단계; 및 현재 블록과 이웃 블록의 크기 인덱스들이 상이한 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 것을 스킵하거나; 또는 현재 블록 및 이웃 블록의 크기 인덱스들이 동일한 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 단계를 포함한다.
가능한 구현에서, 이 방법은: 이웃 블록의 인트라 예측 모드 정보에 기초하여 이웃 블록의 인트라 예측 모드를 획득하는 단계를 추가로 포함한다.
가능한 구현에서, 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계는: 플래그 MIP_FLAG에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계를 포함하고, 여기서 이웃 블록의 인트라 예측 모드 정보는 MIP_FLAG를 포함한다.
제2 양태에 따르면, 본 출원의 실시예는 MPM 리스트를 구성하기 위한 방법을 제공하며, MIP 모드는 현재 블록에 사용되지 않고, 이 방법은:
이웃 블록의 인트라 예측 모드 정보를 획득하는 단계- 이웃 블록은 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -; 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계; 및 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 것을 스킵하거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 단계를 포함한다.
이 실시예의 구현에서, MIP 모드가 현재 블록에 사용되지 않을 때, 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용되지 않게 되고, 따라서 MPM 리스트 구성의 복잡도가 감소될 수 있다.
가능한 구현에서, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하는 것을 스킵하는 단계는: 이웃 블록의 인트라 예측 모드를 이용불가능하게 설정하는 단계를 포함한다.
가능한 구현에서, 이 방법은: 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해 candIntraPredModeX의 값을 -1로 설정하는 단계를 추가로 포함한다.
가능한 구현에서, 이 방법은: 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 디폴트 모드를 사용하는 단계를 추가로 포함한다.
가능한 구현에서, 이 방법은: 이웃 블록의 인트라 예측 모드 정보에 기초하여 이웃 블록의 인트라 예측 모드를 획득하는 단계를 추가로 포함한다.
가능한 구현에서, 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계는: 플래그 MIP_FLAG에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계를 포함하고, 여기서 이웃 블록의 인트라 예측 모드 정보는 MIP_FLAG를 포함한다.
제3 양태에 따르면, 본 출원의 실시예는 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법을 제공하고, 이 방법은:
루마 블록의 인트라 예측 모드를 획득하는 단계- 루마 블록은 현재 크로마 블록에 대응하는 루마 블록임 -; 루마 블록의 인트라 예측 모드가 MIP 모드인지를 결정하는 단계; 및 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 루마 블록의 인트라 예측 모드를 현재 크로마 블록의 인트라 예측 모드로서 사용하거나; 또는 루마 블록의 인트라 예측 모드가 MIP 모드인 경우, 디폴트 모드를 크로마 블록의 인트라 예측 모드로서 사용하는 단계를 포함한다.
현재 크로마 블록의 경우, 현재 크로마 블록의 중심 위치를 커버하는 루마 블록의 인트라 예측 모드가 직접 계승된다. 구체적으로, 루마 성분에 대한 것과 동일한 인트라 예측 모드가 크로마 성분에 대해 선택된다. 이것은 크로마 도출 모드(derived mode, DM)가 크로마 블록에 사용될 때 사용되는 인트라 예측 모드 획득 방법이다. 본 출원에서, DM 모드에 기초하여, MIP 모드가 루마 블록에 대해 추가되는 경우에, 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 루마 블록의 인트라 예측 모드가 현재 크로마 블록의 인트라 예측 모드로서 사용되거나, 또는 루마 블록의 인트라 예측 모드가 MIP 모드인 경우, 디폴트 모드가 현재 크로마 블록의 인트라 예측 모드로서 사용되어, 크로마 블록의 인트라 예측 모드를 획득하는 복잡도가 감소될 수 있다.
가능한 구현에서, 디폴트 모드는 평면 모드 또는 DC 모드를 포함한다.
제4 양태에 따르면, 본 출원의 실시예는 인트라 예측 장치를 제공하고, MIP 모드가 현재 블록에 사용되고, 이 장치는:
이웃 블록의 인트라 예측 모드 정보를 획득하도록 구성된 획득 모듈- 이웃 블록은 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -; 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성된 결정 모듈; 및 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하도록 구성된 처리 모듈을 포함한다.
가능한 구현에서, 처리 모듈은 구체적으로 이웃 블록의 인트라 예측 모드를 이용불가능하게 설정하도록 구성된다.
가능한 구현에서, 처리 모듈은 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해 candMipModeX의 값을 -1로 설정하도록 추가로 구성된다.
가능한 구현에서, 처리 모듈은 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 디폴트 모드를 사용하도록 추가로 구성된다.
가능한 구현에서, 처리 모듈은 구체적으로: 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록 및 이웃 블록의 크기 인덱스들이 동일한지를 결정하고; 현재 블록 및 이웃 블록의 크기 인덱스들이 상이한 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 현재 블록 및 이웃 블록의 크기 인덱스들이 동일한 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하도록 구성된다.
가능한 구현에서, 획득 모듈은 이웃 블록의 인트라 예측 모드 정보에 기초하여 이웃 블록의 인트라 예측 모드를 획득하도록 추가로 구성된다.
가능한 구현에서, 결정 모듈은 구체적으로, 플래그 MIP_FLAG에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고, 여기서 이웃 블록의 인트라 예측 모드 정보는 MIP_FLAG를 포함한다.
제5 양태에 따르면, 본 출원의 실시예는 인트라 예측 장치를 제공하고, MIP 모드는 현재 블록에 사용되지 않고, 이 장치는:
이웃 블록의 인트라 예측 모드 정보를 획득하도록 구성된 획득 모듈- 이웃 블록은 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -; 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성된 결정 모듈; 및 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하도록 구성된 처리 모듈을 포함한다.
가능한 구현에서, 처리 모듈은 구체적으로 이웃 블록의 인트라 예측 모드를 이용불가능하게 설정하도록 구성된다.
가능한 구현에서, 처리 모듈은 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해 candIntraPredModeX의 값을 -1로 설정하도록 추가로 구성된다.
가능한 구현에서, 처리 모듈은 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 디폴트 모드를 사용하도록 추가로 구성된다.
가능한 구현에서, 획득 모듈은 이웃 블록의 인트라 예측 모드 정보에 기초하여 이웃 블록의 인트라 예측 모드를 획득하도록 추가로 구성된다.
가능한 구현에서, 결정 모듈은 구체적으로, 플래그 MIP_FLAG에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고, 여기서 이웃 블록의 인트라 예측 모드 정보는 MIP_FLAG를 포함한다.
제6 양태에 따르면, 본 출원의 실시예는 인트라 예측 장치를 제공하고, 이 장치는:
루마 블록의 인트라 예측 모드를 획득하도록 구성된 획득 모듈- 루마 블록은 현재 크로마 블록에 대응하는 루마 블록임 -; 루마 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성된 결정 모듈; 및 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 루마 블록의 인트라 예측 모드를 현재 크로마 블록의 인트라 예측 모드로서 사용하거나; 루마 블록의 인트라 예측 모드가 MIP 모드인 경우, 디폴트 모드를 크로마 블록의 인트라 예측 모드로서 사용하도록 구성된 처리 모듈을 포함한다.
가능한 구현에서, 디폴트 모드는 평면 모드 또는 DC 모드를 포함한다.
제7 양태에 따르면, 본 출원의 실시예는 비디오 코덱을 제공하고, 이 비디오 코덱은 픽처 블록을 인코딩/디코딩하도록 구성되고, 또한:
제4 양태 내지 제6 양태 중 어느 하나에 따른 인트라 예측 장치- 인트라 예측 장치는 현재 블록의 구성된 MPM 리스트에 기초하여 현재 블록의 예측 모드를 결정하고, 그 후 예측 모드에 기초하여 현재 블록의 예측된 픽셀 값을 결정하도록 구성됨 -; 및 예측된 픽셀 값에 기초하여 현재 블록을 재구성하도록 구성된 재구성 모듈을 포함한다.
제8 양태에 따르면, 본 출원의 실시예는 비디오 코딩 디바이스를 제공한다. 비디오 코딩 디바이스는 서로 결합되는 비휘발성 메모리 및 프로세서를 포함한다. 프로세서는 메모리에 저장된 프로그램 코드를 호출하여 제1 양태 내지 제3 양태 중 어느 하나에 따른 방법을 수행한다.
MPM 리스트를 구성하기 위해 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초하여 MIP와 다른 인트라 예측 모드 사이에서 변환이 수행될 필요가 있는 기존의 인트라 예측 방법에 비해, 본 출원의 실시예들에서, 이웃 블록의 인트라 예측 모드는 일부 조건들이 충족될 때 현재 블록의 MPM 리스트 구성에 사용되지 않을 수 있기 때문에, 따라서 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초한 변환이 회피될 수 있고, MPM 리스트 구성의 복잡성이 감소될 수 있다.
본 출원의 실시예들에서의 또는 배경에서의 기술적 해결책들을 보다 명확하게 설명하기 위해, 다음에서는 본 출원 또는 배경의 실시예들을 설명하기 위해 첨부 도면들을 설명한다.
도 1a는 본 출원의 실시예에 따른 비디오 인코딩 및 디코딩 시스템(10)의 예의 블록도이고;
도 1b는 본 출원의 실시예에 따른 비디오 코딩 시스템(40)의 예의 블록도이고;
도 2는 본 출원의 실시예에 따른 인코더(20)의 예시적인 구조의 블록도이고;
도 3은 본 출원의 실시예에 따른 디코더(30)의 예시적인 구조의 블록도이고;
도 4는 본 출원의 실시예에 따른 비디오 코딩 디바이스(400)의 예의 블록도이고;
도 5는 본 출원의 실시예에 따른 인코딩 장치 또는 디코딩 장치의 다른 예의 블록도이고;
도 6은 본 출원의 실시예에 따른 MPM 리스트를 구성하기 위한 방법의 개략적인 흐름도이고;
도 7a 및 도 7b는 MIP 모드의 이웃 블록들의 개략도이고;
도 8은 본 출원의 실시예에 따른 MPM 리스트를 구성하기 위한 방법의 다른 개략적인 흐름도이고;
도 9는 본 출원의 실시예에 따른 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법의 개략적인 흐름도이고;
도 10은 본 출원의 실시예에 따른 인트라 예측 장치(1000)의 개략적인 블록도이다.
다음은 본 출원의 실시예들에서의 첨부 도면들을 참조하여 본 출원의 실시예들을 설명한다. 이하의 설명에서, 본 개시내용의 일부를 형성하고, 본 출원의 실시예들의 특정 양태들 또는 본 출원의 실시예들이 사용될 수 있는 특정 양태들을 예시로서 도시하는 첨부 도면들이 참조된다. 본 출원의 실시예들은 다른 양태들에서 사용될 수 있으며, 첨부 도면들에 도시되지 않은 구조적 또는 논리적 변경들을 포함할 수 있다는 것을 이해해야 한다. 따라서, 다음의 상세한 설명은 제한적인 의미로 취해지지 않을 것이고, 본 출원의 범위는 첨부된 청구항들에 의해 정의된다. 예를 들어, 설명된 방법과 조합된 개시된 내용은 방법을 수행하도록 구성된 대응하는 디바이스 또는 시스템에 대해서도 유효할 수 있고 그 반대도 마찬가지라는 것을 이해해야 한다. 예를 들어, 하나 이상의 특정 방법 단계들이 설명되면, 대응하는 디바이스는 설명된 하나 이상의 방법 단계들을 수행하기 위해 기능 유닛들과 같은 하나 이상의 유닛(예를 들어, 하나 이상의 단계를 수행하는 하나의 유닛, 또는 복수의 단계 중 하나 이상을 각각 수행하는 복수의 유닛)을 포함할 수 있지만, 이러한 하나 이상의 유닛은 첨부 도면들에서 명시적으로 설명되거나 예시되지 않는다. 또한, 예를 들어, 특정 장치가 기능 유닛들과 같은 하나 이상의 유닛에 기초하여 설명되면, 대응하는 방법은 하나 이상의 유닛의 기능을 수행하기 위해 사용되는 단계(예를 들어, 하나 이상의 유닛의 기능을 수행하기 위해 사용되는 하나의 단계, 또는 복수의 유닛 중 하나 이상의 유닛의 기능을 수행하기 위해 각각 사용되는 복수의 단계)를 포함할 수 있지만, 그러한 하나 이상의 단계는 첨부 도면들에서 명시적으로 설명되거나 도시되지 않는다. 또한, 본 명세서에서 설명된 다양한 예시적인 실시예들 및/또는 양태들의 특징들은, 달리 특정되지 않는 한, 서로 조합될 수 있다는 점이 이해되어야 한다.
본 출원의 실시예들에서의 기술적 해결책들은 기존의 비디오 코딩 표준들(예를 들어, H.264 및 HEVC와 같은 표준들)에 적용될 수 있을 뿐만 아니라, 미래의 비디오 코딩 표준들(예를 들어, H.266 표준)에도 적용될 수 있다. 본 출원의 실시예들에서 사용되는 용어들은 본 출원의 특정 실시예들을 설명하기 위해 사용되는 것일 뿐이고, 본 출원을 제한하기 위한 것은 아니다. 다음은 먼저 본 출원의 실시예들에서 사용될 수 있는 일부 개념들을 간단히 설명한다.
비디오 코딩은 전형적으로 픽처 시퀀스의 처리를 지칭하며, 여기서 픽처 시퀀스는 비디오 또는 비디오 시퀀스를 형성한다. 비디오 코딩 분야에서, 용어 "픽처(picture)", "프레임(frame)", 및 "이미지(image)"는 동의어로서 사용될 수 있다. 본 명세서에서 비디오 코딩은 비디오 인코딩 또는 비디오 디코딩을 지칭한다. 비디오 인코딩은 소스 측에서 수행되고, 일반적으로 더 효율적인 저장 및/또는 송신을 위해, 원래의 비디오 픽처를 (예를 들어, 압축을 통해) 처리하여 비디오 픽처를 표현하기 위한 데이터의 양을 감소시키는 것을 포함한다. 비디오 디코딩은 목적지 측에서 수행되고, 일반적으로 비디오 픽처를 재구성하기 위해 인코더에 대한 역 처리를 포함한다. 실시예들에서 비디오 픽처의 "코딩"은 비디오 시퀀스의 "인코딩" 또는 "디코딩"으로서 이해되어야 한다. 인코딩 부분과 디코딩 부분의 조합은 코딩(인코딩 및 디코딩)이라고도 지칭된다.
비디오 시퀀스는 일련의 픽처(picture)들을 포함하고, 픽처는 슬라이스(slice)들로 추가로 분할되고, 슬라이스는 블록(block)들로 추가로 분할된다. 비디오 코딩은 블록에 의해 수행된다. 일부 새로운 비디오 코딩 표준들에서, 개념 "블록"은 더 확장된다. 예를 들어, 매크로블록(macroblock, MB)이 H.264 표준에 도입된다. 매크로블록은 또한 예측 코딩(파티션)에 사용될 수 있는 복수의 예측 블록으로 분할될 수 있다. 고효율 비디오 코딩(high efficiency video coding, HEVC) 표준에서는, "코딩 유닛"(coding unit, CU), "예측 유닛"(prediction unit, PU), 및 "변환 유닛"(transform unit, TU)과 같은 기본 개념들이 사용된다. 복수의 타입의 블록 유닛이 기능 분할을 통해 획득되고, 새로운 트리-기반 구조를 사용하여 설명된다. 예를 들어, CU는 쿼드트리에 기초하여 더 작은 CU들로 분할될 수 있고, 더 작은 CU는 쿼드트리 구조를 생성하기 위해 더 분할될 수 있다. CU는 코딩된 픽처를 분할 및 인코딩하기 위한 기본 단위이다. PU 및 TU는 또한 유사한 트리 구조들을 갖는다. PU는 예측 블록에 대응할 수 있고, 예측 코딩을 위한 기본 단위이다. CU는 분할 모드로 복수의 PU로 더 분할된다. TU는 변환 블록에 대응할 수 있고, 예측 잔차를 변환하기 위한 기본 단위이다. 그러나, 본질적으로, CU, PU, 및 TU 모두는 개념적으로 블록들(또는 픽처 블록들로 지칭됨)이다.
예를 들어, HEVC에서, CTU는 코딩 트리로서 표현되는 쿼드트리 구조를 사용하여 복수의 CU로 분할된다. 픽처 영역을 인터(시간) 또는 인트라(공간) 예측을 통해 인코딩할지에 대한 결정은 CU 레벨에서 이루어진다. 각각의 CU는 PU 분할 패턴에 기초하여 1개, 2개, 또는 4개의 PU로 더 분할될 수 있다. 하나의 PU에서, 동일한 예측 프로세스가 적용되고, 관련 정보가 PU 기반으로 디코더에 송신된다. PU 분할 패턴에 기초한 예측 프로세스를 적용함으로써 잔차 블록이 획득된 후에, CU는 CU에 사용되는 코딩 트리와 유사한 다른 쿼드트리 구조에 기초하여 변환 유닛(transform unit, TU)들로 분할될 수 있다. 비디오 압축 기술들의 최근 개발에서, 코딩 블록을 분할하기 위해 쿼드트리 플러스 이진 트리(quadtree plus binary tree, QTBT) 파티션 프레임이 사용된다. QTBT 블록 구조에서, CU는 정사각형 또는 직사각형일 수 있다.
본 명세서에서, 설명 및 이해의 용이함을 위해, 현재 코딩된 픽처에서의 코딩될 픽처 블록은 현재 블록이라고 지칭될 수 있다. 예를 들어, 인코딩시, 현재 블록은 인코딩되고 있는 블록이고, 디코딩시, 현재 블록은 디코딩되고 있는 블록이다. 참조 픽처에서, 현재 블록을 예측하기 위해 사용되는 디코딩된 픽처 블록은 참조 블록이라고 지칭된다. 구체적으로, 참조 블록은 현재 블록에 대한 참조 신호를 제공하는 블록이고, 참조 신호는 픽처 블록 내의 픽셀 값을 표현한다. 참조 픽처에 있고 현재 블록에 대한 예측 신호를 제공하는 블록은 예측 블록이라고 지칭될 수 있다. 예측 신호는 예측 블록에서의 픽셀 값, 샘플링 값, 또는 샘플링 신호를 표현한다. 예를 들어, 복수의 참조 블록이 순회된 후에, 최적의 참조 블록이 발견된다. 최적의 참조 블록은 현재 블록에 대한 예측을 제공하고, 이 블록은 예측 블록이라고 지칭된다.
무손실(lossless) 비디오 코딩의 경우에, 원래의 비디오 픽처가 재구성될 수 있다. 구체적으로, 재구성되는 비디오 픽처는 원래의 비디오 픽처와 동일한 품질을 갖는다(저장 또는 송신 동안 송신 손실 또는 다른 데이터 손실이 발생하지 않는 것으로 가정함). 손실 비디오 코딩의 경우에, 예를 들어, 양자화를 통해 추가 압축이 수행되어, 비디오 픽처를 표현하기 위한 데이터량을 감소시키지만, 비디오 픽처는 디코더 측에서 완전히 재구성될 수 없다. 구체적으로, 재구성되는 비디오 픽처의 품질은 원래의 비디오 픽처의 품질보다 낮거나 열악하다.
몇몇 H.261 비디오 코딩 표준들은 "손실 하이브리드 비디오 코딩(lossy hybrid video coding)"을 위한 것이다(구체적으로, 샘플 도메인에서의 공간 및 시간 예측은 변환 도메인에서 양자화를 적용하기 위해 2D 변환 코딩과 결합된다). 비디오 시퀀스의 각각의 픽처는 일반적으로 비중첩 블록들의 세트로 분할되고, 코딩은 일반적으로 블록 레벨에서 수행된다. 구체적으로, 인코더 측에서, 비디오는 일반적으로 블록(비디오 블록) 레벨에서 처리, 즉 인코딩된다. 예를 들어, 예측 블록은 공간(인트라) 예측과 시간(인터) 예측을 통해 생성되고, 예측 블록은 현재 블록(처리되고 있거나 처리될 블록)으로부터 감산되어 잔차 블록을 획득하고, 잔차 블록은 변환 도메인에서 변환되고 양자화되어 송신(압축)될 데이터의 양을 감소시킨다. 디코더 측에서, 인코더에 관한 역 처리 부분이 인코딩된 블록 또는 압축된 블록에 적용되어 표현을 위해 현재 블록을 재구성한다. 또한, 인코더는 디코더의 처리 루프를 복제하여, 인코더 및 디코더가 동일한 예측(예를 들어, 인트라 예측 및 인터 예측) 및/또는 재구성을 생성하여 후속 블록들을 처리, 즉 코딩한다.
다음은 본 출원의 실시예들이 적용되는 시스템 아키텍처를 설명한다. 도 1a는 본 출원의 실시예들이 적용되는 비디오 인코딩 및 디코딩 시스템(10)의 예의 개략적인 블록도이다. 도 1a에 도시된 바와 같이, 비디오 인코딩 및 디코딩 시스템(10)은 소스 디바이스(12) 및 목적지 디바이스(14)를 포함할 수 있다. 소스 디바이스(12)는 인코딩된 비디오 데이터를 생성하고, 따라서 소스 디바이스(12)는 비디오 인코딩 장치라고 지칭될 수 있다. 목적지 디바이스(14)는 소스 디바이스(12)에 의해 생성된 인코딩된 비디오 데이터를 디코딩할 수 있고, 따라서 목적지 디바이스(14)는 비디오 디코딩 장치라고 지칭될 수 있다. 다양한 구현 해결책들에서, 소스 디바이스(12), 목적지 디바이스(14), 또는 소스 디바이스(12)와 목적지 디바이스(14) 둘 다는 하나 이상의 프로세서 및 하나 이상의 프로세서에 결합된 메모리를 포함할 수 있다. 본 명세서에서 설명된 바와 같이, 메모리는 RAM, ROM, EEPROM, 플래시 메모리, 또는 컴퓨터에 액세스가능한 명령어 또는 데이터 구조의 형태로 원하는 프로그램 코드를 저장하기 위해 사용될 수 있는 임의의 다른 매체를 포함할 수 있지만, 이에 제한되지 않는다. 소스 디바이스(12)와 목적지 디바이스(14)는 데스크톱 컴퓨터, 모바일 컴퓨팅 장치, 노트북(예를 들어, 랩톱) 컴퓨터, 태블릿 컴퓨터, 셋톱 박스, 소위 "스마트" 폰과 같은 전화 핸드셋, 텔레비전, 카메라, 디스플레이 장치, 디지털 미디어 플레이어, 비디오 게임 콘솔, 차량내 컴퓨터, 무선 통신 디바이스 등을 포함하는 다양한 장치들을 포함할 수 있다.
도 1a는 소스 디바이스(12)와 목적지 디바이스(14)를 별개의 디바이스들로서 도시하고 있지만, 디바이스 실시예는, 대안적으로, 소스 디바이스(12)와 목적지 디바이스(14) 양쪽 모두, 또는 소스 디바이스(12)와 목적지 디바이스(14) 양쪽 모두의 기능, 즉, 소스 디바이스(12) 또는 대응하는 기능과 목적지 디바이스(14) 또는 대응하는 기능을 포함할 수 있다. 이러한 실시예에서, 소스 디바이스(12) 또는 대응하는 기능과 목적지 디바이스(14) 또는 대응하는 기능은, 동일한 하드웨어 및/또는 소프트웨어, 별개의 하드웨어 및/또는 소프트웨어, 또는 이들의 임의의 조합을 사용하여 구현될 수 있다.
소스 디바이스(12)와 목적지 디바이스(14) 사이의 통신 접속은 링크(13)를 통해 구현될 수 있고, 목적지 디바이스(14)는 링크(13)를 통해 소스 디바이스(12)로부터 인코딩된 비디오 데이터를 수신할 수 있다. 링크(13)는 소스 디바이스(12)로부터 목적지 디바이스(14)로 인코딩된 비디오 데이터를 이동시킬 수 있는 하나 이상의 매체 또는 장치를 포함할 수 있다. 예에서, 링크(13)는 소스 디바이스(12)가 인코딩된 비디오 데이터를 실시간으로 목적지 디바이스(14)에 직접 송신할 수 있게 하는 하나 이상의 통신 매체를 포함할 수 있다. 이 예에서, 소스 디바이스(12)는 통신 표준(예를 들어, 무선 통신 프로토콜)에 따라 인코딩된 비디오 데이터를 변조할 수 있고, 변조된 비디오 데이터를 목적지 디바이스(14)로 송신할 수 있다. 하나 이상의 통신 매체는 무선 통신 매체 및/또는 유선 통신 매체, 예를 들어, 무선 주파수(RF) 스펙트럼 또는 하나 이상의 물리적 송신 케이블을 포함할 수 있다. 하나 이상의 통신 매체는 패킷-기반 네트워크의 일부일 수 있고, 패킷-기반 네트워크는, 예를 들어, 근거리 네트워크, 광역 네트워크, 또는 글로벌 네트워크(예를 들어, 인터넷)이다. 하나 이상의 통신 매체는 라우터, 스위치, 기지국, 또는 소스 디바이스(12)로부터 목적지 디바이스(14)로의 통신을 용이하게 하는 다른 디바이스를 포함할 수 있다.
소스 디바이스(12)는 인코더(20)를 포함한다. 선택적으로, 소스 디바이스(12)는 픽처 소스(16), 픽처 전처리기(18), 및 통신 인터페이스(22)를 추가로 포함할 수 있다. 특정 구현 형태에서, 인코더(20), 픽처 소스(16), 픽처 전처리기(18), 및 통신 인터페이스(22)는 소스 디바이스(12) 내의 하드웨어 컴포넌트들일 수 있거나, 또는 소스 디바이스(12) 내의 소프트웨어 프로그램들일 수 있다. 설명들은 다음과 같이 개별적으로 제공된다:
픽처 소스(16)는 예를 들어, 실세계 픽처를 캡처하도록 구성된 임의의 타입의 픽처 캡처링 디바이스; 및/또는 픽처 또는 코멘트를 생성하기 위한 임의의 타입의 디바이스(스크린 콘텐츠 인코딩의 경우, 스크린 상의 일부 텍스트는 또한 인코딩될 픽처 또는 이미지의 일부라고 간주됨), 예를 들어, 컴퓨터 애니메이션 픽처를 생성하도록 구성된 컴퓨터 그래픽 프로세서; 또는 실세계 픽처 또는 컴퓨터 애니메이션 픽처(예를 들어, 스크린 콘텐츠 또는 가상 현실(virtual reality, VR) 픽처)를 획득 및/또는 제공하도록 구성된 임의의 타입의 디바이스; 및/또는 이들의 임의의 조합(예를 들어, 증강 현실(augmented reality, AR) 픽처)일 수 있거나 이들을 포함할 수 있다. 픽처 소스(16)는 픽처를 캡처하도록 구성된 카메라 또는 픽처를 저장하도록 구성된 메모리일 수 있다. 픽처 소스(16)는 이전에 캡처되거나 생성된 픽처가 저장되고/되거나 픽처가 획득되거나 수신되는 임의의 타입의 (내부 또는 외부) 인터페이스를 추가로 포함할 수 있다. 픽처 소스(16)가 카메라일 때, 픽처 소스(16)는 예를 들어, 로컬 카메라 또는 소스 디바이스 내에 통합된 통합 카메라일 수 있다. 픽처 소스(16)가 메모리일 때, 픽처 소스(16)는 로컬 메모리 또는 예를 들어, 소스 디바이스 내에 통합된 통합 메모리일 수 있다. 픽처 소스(16)가 인터페이스를 포함할 때, 인터페이스는 예를 들어, 외부 비디오 소스로부터 픽처를 수신하기 위한 외부 인터페이스일 수 있다. 외부 비디오 소스는, 예를 들어, 카메라, 외부 메모리, 또는 외부 픽처 생성 디바이스와 같은 외부 픽처 캡처링 디바이스이다. 외부 픽처 생성 디바이스는, 예를 들어, 외부 컴퓨터 그래픽 프로세서, 컴퓨터, 또는 서버이다. 인터페이스는 임의의 독점적 또는 표준화된 인터페이스 프로토콜에 따른 임의의 타입의 인터페이스, 예를 들어, 유선 또는 무선 인터페이스 또는 광학 인터페이스일 수 있다.
픽처는 픽처 요소들(picture elements)의 2차원 어레이 또는 행렬로서 간주될 수 있다. 어레이 내의 픽처 요소는 샘플로도 지칭될 수 있다. 어레이 또는 픽처의 수평 및 수직 방향(또는 축)에서의 샘플들의 수량들은 픽처의 크기 및/또는 해상도를 정의한다. 컬러 표현을 위해, 3개의 컬러 성분이 일반적으로 사용된다. 구체적으로, 픽처는 3개의 샘플 어레이로서 표현되거나 이들을 포함할 수 있다. 예를 들어, RBG 포맷 또는 컬러 공간에서, 픽처는 대응하는 적색, 녹색, 및 청색 샘플 어레이들을 포함한다. 그러나, 비디오 코딩시, 각각의 픽셀은 일반적으로 루마/크로마 포맷 또는 컬러 공간으로 표현된다. 예를 들어, YUV 포맷의 픽처는 Y(때때로 대안적으로 L로 표시됨)로 표시된 루마 성분 및 U 및 V로 표시된 2개의 크로마 성분을 포함한다. 휘도(루마) 성분 Y는 밝기 또는 그레이 레벨 강도를 나타내고(예를 들어, 둘 다 그레이-스케일 픽처에서 동일함), 2개의 색차(크로마) 성분 U 및 V는 색차 또는 컬러 정보 성분을 나타낸다. 대응적으로, YUV 포맷의 픽처는 루마 샘플 값들(Y)의 루마 샘플 어레이 및 크로마 값들(U 및 V)의 2개의 크로마 샘플 어레이를 포함한다. RGB 포맷의 픽처는 YUV 포맷으로 변형 또는 변환될 수 있고, 그 반대도 가능하다. 이 프로세스는 컬러 변환 또는 변형이라고도 지칭된다. 픽처가 단색이면, 픽처는 루마 샘플 어레이만을 포함할 수 있다. 본 출원의 이러한 실시예에서, 픽처 소스(16)에 의해 픽처 프로세서로 송신되는 픽처는 또한 원본 픽처 데이터(17)라고 지칭될 수 있다.
픽처 전처리기(18)는 원본 픽처 데이터(17)를 수신하고 원본 픽처 데이터(17)에 전처리를 수행하여 전처리된 픽처(19) 또는 전처리된 픽처 데이터(19)를 획득하도록 구성된다. 예를 들어, 픽처 전처리기(18)에 의해 수행되는 전처리는 트리밍, (예를 들어, RGB 포맷으로부터 YUV 포맷으로의) 컬러 포맷 변환, 컬러 보정, 또는 노이즈 제거를 포함할 수 있다.
인코더(20)(또는 비디오 인코더(20)라고 지칭됨)는 전처리된 픽처 데이터(19)를 수신하고 관련된 예측 모드(예를 들어, 본 명세서의 실시예들에서의 예측 모드)에서 전처리된 픽처 데이터(19)를 처리하여, 인코딩된 픽처 데이터(21)를 제공하도록 구성된다(인코더(20)의 구조적인 세부사항들은 도 2, 도 4, 또는 도 5에 기초하여 아래에 추가로 설명된다). 일부 실시예들에서, 인코더(20)는 본 출원에서 설명되는 크로마 블록 예측 방법의 인코더 측 적용을 구현하기 위해, 아래에 설명되는 다양한 실시예들을 수행하도록 구성될 수 있다.
통신 인터페이스(22)는 인코딩된 픽처 데이터(21)를 수신하고, 인코딩된 픽처 데이터(21)를 저장 또는 직접 재구성하기 위해 링크(13)를 통해 목적지 디바이스(14) 또는 임의의 다른 디바이스(예를 들어, 메모리)에 송신하도록 구성될 수 있다. 다른 디바이스는 디코딩 또는 저장을 위해 사용되는 임의의 디바이스일 수 있다. 통신 인터페이스(22)는, 예를 들어, 링크(13)를 통한 송신을 위해, 인코딩된 픽처 데이터(21)를 적절한 포맷, 예를 들어, 데이터 패킷으로 캡슐화하도록 구성될 수 있다.
목적지 디바이스(14)는 디코더(30)를 포함한다. 선택적으로, 목적지 디바이스(14)는 통신 인터페이스(28), 픽처 후처리기(32) 및 디스플레이 디바이스(34)를 추가로 포함할 수 있다. 설명들은 다음과 같이 개별적으로 제공된다:
통신 인터페이스(28)는 소스 디바이스(12) 또는 임의의 다른 소스로부터 인코딩된 픽처 데이터(21)를 수신하도록 구성될 수 있다. 임의의 다른 소스는, 예를 들어, 저장 디바이스이다. 저장 디바이스는, 예를 들어, 인코딩된 픽처 데이터 저장 디바이스이다. 통신 인터페이스(28)는 소스 디바이스(12)와 목적지 디바이스(14) 사이의 링크(13)를 통해 또는 임의의 타입의 네트워크를 통해 인코딩된 픽처 데이터(21)를 송신 또는 수신하도록 구성될 수 있다. 링크(13)는 예를 들어, 직접 유선 또는 무선 접속이다. 임의의 타입의 네트워크는, 예를 들어, 유선 또는 무선 네트워크 또는 이들의 임의의 조합, 또는 임의의 타입의 사설 또는 공중 네트워크, 또는 이들의 임의의 조합이다. 통신 인터페이스(28)는, 예를 들어, 통신 인터페이스(22)를 통해 송신되는 데이터 패킷을 캡슐제거하여 인코딩된 픽처 데이터(21)를 획득하도록 구성될 수 있다.
통신 인터페이스(28) 및 통신 인터페이스(22) 둘 다는 단방향 통신 인터페이스 또는 양방향 통신 인터페이스로서 구성될 수 있고, 예를 들어, 접속을 설정하기 위해 메시지를 전송 및 수신하고, 통신 링크 및/또는 인코딩된 픽처 데이터 송신과 같은 데이터 송신에 관련된 임의의 다른 정보를 확인 응답 및 교환하도록 구성될 수 있다.
디코더(30)(비디오 디코더(30)라고도 칭함)는 인코딩된 픽처 데이터(21)를 수신하고 디코딩된 픽처 데이터(31) 또는 디코딩된 픽처(31)를 제공하도록 구성된다(디코더(30)의 구조적 세부사항들은 도 3, 도 4, 또는 도 5에 기초하여 이하에서 추가로 설명된다). 일부 실시예들에서, 디코더(30)는 본 출원에서 설명되는 크로마 블록 예측 방법의 디코더 측 적용을 구현하기 위해, 아래에 설명된 다양한 실시예들을 수행하도록 구성될 수 있다.
픽처 후처리기(32)는 디코딩된 픽처 데이터(31)(재구성되는 픽처 데이터라고도 지칭됨)를 후처리하여 후처리된 픽처 데이터(33)를 획득하도록 구성된다. 픽처 후처리기(32)에 의해 수행되는 후처리는 (예를 들어, YUV 포맷으로부터 RGB 포맷으로의) 컬러 포맷 변환, 컬러 보정, 트리밍, 리샘플링(re-sampling), 또는 임의의 다른 처리를 포함할 수 있다. 픽처 후처리기(32)는 후처리된 픽처 데이터(33)를 디스플레이 디바이스(34)에 송신하도록 추가로 구성될 수 있다.
디스플레이 디바이스(34)는 예를 들어, 사용자 또는 뷰어에게 픽처를 디스플레이하기 위해 후처리된 픽처 데이터(33)를 수신하도록 구성된다. 디스플레이 디바이스(34)는 재구성되는 픽처를 제시하기 위한 임의의 타입의 디스플레이, 예를 들어, 통합된 또는 외부 디스플레이 또는 모니터일 수 있거나 이를 포함할 수 있다. 예를 들어, 디스플레이는 액정 디스플레이(liquid crystal display, LCD), 유기 발광 다이오드(organic light emitting diode, OLED) 디스플레이, 플라즈마 디스플레이, 프로젝터, 마이크로 LED 디스플레이, 실리콘 액정(liquid crystal on silicon, LCoS), 디지털 광 프로세서(digital light processor, DLP), 또는 임의의 타입의 다른 디스플레이들을 포함할 수 있다.
도 1a는 소스 디바이스(12)와 목적지 디바이스(14)를 별개의 디바이스들로서 도시하고 있지만, 디바이스 실시예는, 대안적으로, 소스 디바이스(12)와 목적지 디바이스(14) 양쪽 모두, 또는 소스 디바이스(12)와 목적지 디바이스(14) 양쪽 모두의 기능, 즉, 소스 디바이스(12) 또는 대응하는 기능과 목적지 디바이스(14) 또는 대응하는 기능을 포함할 수 있다. 이러한 실시예에서, 소스 디바이스(12) 또는 대응하는 기능과 목적지 디바이스(14) 또는 대응하는 기능은, 동일한 하드웨어 및/또는 소프트웨어, 별개의 하드웨어 및/또는 소프트웨어, 또는 이들의 임의의 조합을 사용하여 구현될 수 있다.
본 설명들에 기초하여, 본 기술분야의 통상의 기술자는 도 1a에 도시된 소스 디바이스(12) 및/또는 목적지 디바이스(14)의 상이한 유닛들 또는 기능들의 존재 및 (정확한) 분할이 실제 디바이스 및 애플리케이션에 따라 변할 수 있다는 것을 명확히 알 수 있다. 소스 디바이스(12) 및 목적지 디바이스(14)는, 임의의 타입의 핸드헬드 또는 고정 디바이스, 예를 들어, 노트북 또는 랩톱 컴퓨터, 모바일 폰, 스마트폰, 태블릿 또는 태블릿 컴퓨터, 비디오 카메라, 데스크톱 컴퓨터, 셋탑 박스, 텔레비전, 카메라, 차량-탑재형 디바이스, 디스플레이 디바이스, 디지털 미디어 플레이어, 비디오 게임 콘솔, (콘텐츠 서비스 서버 또는 콘텐츠 전달 서버 등의) 비디오 스트리밍 디바이스, 방송 수신기 디바이스, 또는 방송 송신기 디바이스를 포함한, 임의의 광범위한 디바이스들을 포함할 수 있고, 임의의 타입의 운영 체제를 사용하거나 사용하지 않을 수 있다.
인코더(20) 및 디코더(30) 각각은 다양한 적절한 회로들, 예를 들어, 하나 이상의 마이크로프로세서, 디지털 신호 프로세서(digital signal processor, DSP), 주문형 집적 회로(application-specific integrated circuit, ASIC), 필드-프로그래머블 게이트 어레이(field-programmable gate array, FPGA), 이산 로직, 하드웨어, 또는 이들의 임의의 조합으로서 구현될 수 있다. 본 기술들이 부분적으로 소프트웨어를 사용하여 구현되는 경우, 디바이스는 소프트웨어 명령어들을 적절한 비일시적 컴퓨터 판독가능 저장 매체에 저장할 수 있고, 본 개시내용의 기술들을 수행하기 위해 하나 이상의 프로세서와 같은 하드웨어를 사용하여 명령어들을 실행할 수 있다. (하드웨어, 소프트웨어, 하드웨어와 소프트웨어의 조합 등을 비롯한) 전술한 콘텐츠 중 임의의 것은 하나 이상의 프로세서로서 간주될 수 있다.
일부 경우들에서, 도 1a에 도시된 비디오 인코딩 및 디코딩 시스템(10)은 단지 일례이고, 본 출원의 기술들은 인코딩 디바이스와 디코딩 디바이스 사이의 임의의 데이터 통신을 반드시 포함하지는 않는 비디오 코딩 설정들(예를 들어, 비디오 인코딩 또는 비디오 디코딩)에 적용될 수 있다. 다른 예들에서, 데이터는 로컬 메모리로부터 검색될 수 있거나, 네트워크를 통해 스트리밍될 수 있거나, 기타 등등이다. 비디오 인코딩 디바이스는 데이터를 인코딩하고 데이터를 메모리 내에 저장할 수 있고, 및/또는 비디오 디코딩 디바이스는 메모리로부터 데이터를 검색하고 데이터를 디코딩할 수 있다. 일부 예들에서, 데이터만을 인코딩하고 데이터를 메모리에 저장하고/하거나 메모리로부터 데이터를 검색하고 데이터를 디코딩하고 서로 통신하지 않는 디바이스들은 인코딩 및 디코딩을 수행한다.
도 1b는 예시적인 실시예에 따른 도 2의 인코더(20) 및/또는 도 3의 디코더(30)를 포함하는 비디오 코딩 시스템(40)의 일례의 예시적인 도면이다. 비디오 코딩 시스템(40)은 본 출원의 실시예들에서 다양한 기술들의 조합을 구현할 수 있다. 도시된 구현에서, 비디오 코딩 시스템(40)은 이미징 디바이스(41), 인코더(20), 디코더(30)(및/또는 처리 유닛(46)의 로직 회로(47)에 의해 구현되는 비디오 인코더/디코더), 안테나(42), 하나 이상의 프로세서(43), 하나 이상의 메모리(44), 및/또는 디스플레이 디바이스(45)를 포함할 수 있다.
도 1b에 도시된 바와 같이, 이미징 디바이스(41), 안테나(42), 처리 유닛(46), 로직 회로(47), 인코더(20), 디코더(30), 프로세서(43), 메모리(44) 및/또는 디스플레이 디바이스(45)는 서로 통신할 수 있다. 설명된 바와 같이, 비디오 코딩 시스템(40)이 인코더(20) 및 디코더(30)와 함께 예시되어 있지만, 비디오 코딩 시스템(40)은 상이한 예들에서 인코더(20)만을 또는 디코더(30)만을 포함할 수 있다.
일부 예들에서, 안테나(42)는 비디오 데이터의 인코딩된 비트스트림을 송신 또는 수신하도록 구성될 수 있다. 또한, 일부 예들에서, 디스플레이 디바이스(45)는 비디오 데이터를 제시하도록 구성될 수 있다. 일부 예들에서, 로직 회로(47)는 처리 유닛(46)에 의해 구현될 수 있다. 처리 유닛(46)은 주문형 집적 회로(application-specific integrated circuit, ASIC) 로직, 그래픽 프로세서, 범용 프로세서 등을 포함할 수 있다. 비디오 코딩 시스템(40)은 또한 선택적 프로세서(43)를 포함할 수 있다. 선택적 프로세서(43)는 유사하게 주문형 집적 회로(application-specific integrated circuit, ASIC) 로직, 그래픽 프로세서, 범용 프로세서 등을 포함할 수 있다. 일부 예들에서, 로직 회로(47)는 하드웨어, 예를 들어, 비디오 코딩을 위한 전용 하드웨어에 의해 구현될 수 있다. 프로세서(43)는 범용 소프트웨어, 운영 체제 등에 의해 구현될 수 있다. 또한, 메모리(44)는 임의의 타입의 메모리, 예를 들어, 휘발성 메모리(예를 들어, 정적 랜덤 액세스 메모리(Static Random Access Memory, SRAM) 또는 동적 랜덤 액세스 메모리(Dynamic Random Access Memory, DRAM)) 또는 비휘발성 메모리(예를 들어, 플래시 메모리)일 수 있다. 비제한적인 예에서, 메모리(44)는 캐시 메모리에 의해 구현될 수 있다. 일부 예들에서, 로직 회로(47)는 (예를 들어, 픽처 버퍼를 구현하기 위해) 메모리(44)에 액세스할 수 있다. 다른 예들에서, 로직 회로(47) 및/또는 처리 유닛(46)은 픽처 버퍼를 구현하기 위한 메모리(예를 들어, 캐시)를 포함할 수 있다.
일부 예들에서, 로직 회로를 사용하여 구현되는 인코더(20)는 픽처 버퍼(예를 들어, 처리 유닛(46) 또는 메모리(44)에 의해 구현됨) 및 그래픽 처리 유닛(예를 들어, 처리 유닛(46)에 의해 구현됨)을 포함할 수 있다. 그래픽 처리 유닛은 픽처 버퍼에 통신가능하게 결합될 수 있다. 그래픽 처리 유닛은 로직 회로(47)를 사용하여 구현되는 인코더(20)를 포함하여, 도 2를 참조하여 설명되는 다양한 모듈들 및/또는 본 명세서에서 설명되는 임의의 다른 인코더 시스템 또는 서브시스템을 구현할 수 있다. 로직 회로는 본 명세서에 설명된 다양한 동작들을 수행하도록 구성될 수 있다.
일부 예들에서, 디코더(30)는 도 3의 디코더(30)를 참조하여 설명되는 다양한 모듈들 및/또는 본 명세서에서 설명되는 임의의 다른 디코더 시스템 또는 서브시스템을 구현하기 위해 유사한 방식으로 로직 회로(47)에 의해 구현될 수 있다. 일부 예들에서, 로직 회로를 사용하여 구현되는 디코더(30)는 픽처 버퍼(처리 유닛(2820) 또는 메모리(44)에 의해 구현됨) 및 그래픽 처리 유닛(예를 들어, 처리 유닛(46)에 의해 구현됨)을 포함할 수 있다. 그래픽 처리 유닛은 픽처 버퍼에 통신가능하게 결합될 수 있다. 그래픽 처리 유닛은 로직 회로(47)를 사용하여 구현되는 디코더(30)를 포함하여, 도 3을 참조하여 설명되는 다양한 모듈들 및/또는 본 명세서에서 설명되는 임의의 다른 디코더 시스템 또는 서브시스템을 구현할 수 있다.
일부 예들에서, 안테나(42)는 비디오 데이터의 인코딩된 비트스트림을 수신하도록 구성될 수 있다. 설명된 바와 같이, 인코딩된 비트스트림은 본 명세서에서 설명되고 비디오 프레임 인코딩에 관련된 데이터, 표시자, 인덱스 값, 모드 선택 데이터 등, 예를 들어, 코딩 분할(coding partitioning)에 관련된 데이터(예를 들어, 변환 계수 또는 양자화된 변환 계수, (설명된) 선택적 표시자, 및/또는 코딩 분할을 정의하는 데이터)를 포함할 수 있다. 비디오 코딩 시스템(40)은 안테나(42)에 결합되고 인코딩된 비트스트림을 디코딩하도록 구성되는 디코더(30)를 추가로 포함할 수 있다. 디스플레이 디바이스(45)는 비디오 프레임을 제시하도록 구성된다.
본 발명의 이 실시예에서, 인코더(20)를 참조하여 설명된 예에 대해, 디코더(30)는 역 프로세스를 수행하도록 구성될 수 있다는 것을 이해해야 한다. 신택스 요소를 시그널링하는 것과 관련하여, 디코더(30)는 이러한 신택스 요소를 수신 및 파싱하고 대응적으로 관련 비디오 데이터를 디코딩하도록 구성될 수 있다. 일부 예들에서, 인코더(20)는 신택스 요소를 인코딩된 비디오 비트스트림으로 엔트로피 인코딩할 수 있다. 이러한 예들에서, 디코더(30)는 신택스 요소를 파싱하고 대응적으로 관련 비디오 데이터를 디코딩할 수 있다.
본 출원의 실시예들에 따라 MPM 리스트를 구성하는 방법 및 크로마 블록의 인트라 예측 모드를 획득하는 방법은 인트라 예측 프로세스에서 주로 사용된다는 점에 유의해야 한다. 이 프로세스는 인코더(20) 및 디코더(30) 모두에 대해 존재한다. 본 출원의 실시예들에서의 인코더(20) 및 디코더(30)는 H.263, H.264, HEVV, MPEG-2, MPEG-4, VP8, 및 VP9와 같은 비디오 표준 프로토콜들 또는 (H.266과 같은) 차세대 비디오 표준 프로토콜들에 대응하는 인코더 및 디코더일 수 있다.
도 2는 본 출원의 실시예에 따른 인코더(20)의 예의 개략적인/개념적인 블록도이다. 도 2의 예에서, 인코더(20)는 잔차 계산 유닛(204), 변환 처리 유닛(206), 양자화 유닛(208), 역양자화 유닛(210), 및 역변환 처리 유닛(212), 재구성 유닛(214), 버퍼(216), 루프 필터 유닛(220), 디코딩된 픽처 버퍼(decoded picture buffer, DPB)(230), 예측 처리 유닛(260), 및 엔트로피 인코딩 유닛(270)을 포함한다. 예측 처리 유닛(260)은 인터 예측 유닛(244), 인트라 예측 유닛(254), 및 모드 선택 유닛(262)을 포함할 수 있다. 인터 예측 유닛(244)은 모션 추정 유닛 및 모션 보상 유닛(도면에 도시되지 않음)을 포함할 수 있다. 도 2에 도시된 인코더(20)는 하이브리드 비디오 인코더 또는 하이브리드 비디오 코덱에 기초하는 비디오 인코더라고도 할 수 있다.
예를 들어, 잔차 계산 유닛(204), 변환 처리 유닛(206), 양자화 유닛(208), 예측 처리 유닛(260), 및 엔트로피 인코딩 유닛(270)은 인코더(20)의 순방향 신호 경로를 형성하는 반면, 예를 들어, 역양자화 유닛(210), 역변환 처리 유닛(212), 재구성 유닛(214), 버퍼(216), 루프 필터(220), 디코딩된 픽처 버퍼(decoded picture buffer, DPB)(230), 및 예측 처리 유닛(260)은 인코더의 역방향 신호 경로를 형성한다. 인코더의 역방향 신호 경로는 디코더(도 3의 디코더(30) 참조)의 신호 경로에 대응한다.
인코더(20)는, 예를 들어, 입력(202)을 통해, 픽처(201) 또는 픽처(201)의 픽처 블록(203), 예를 들어, 비디오를 형성하는 픽처들의 시퀀스에서의 픽처 또는 비디오 시퀀스를 수신한다. 픽처 블록(203)은 현재 픽처 블록 또는 인코딩될 픽처 블록이라고 또한 지칭될 수 있고, 픽처(201)는 (특히 비디오 코딩에서, 현재 픽처를 다른 픽처들, 예를 들어, 동일한 비디오 시퀀스에서의 이전에 인코딩된 및/또는 디코딩된 픽처들, 즉, 현재 픽처를 또한 포함하는 비디오 시퀀스와 구별하기 위해) 현재 픽처 또는 인코딩될 픽처라고 지칭될 수 있다.
인코더(20)의 실시예는 픽처(201)를 픽처 블록들(203)과 같은 복수의 블록으로 분할하도록 구성된 분할 유닛(도 2에 도시되지 않음)을 포함할 수 있다. 픽처(201)는 보통 복수의 비중첩 블록으로 분할된다. 분할 유닛은 비디오 시퀀스에서의 모든 픽처에 대해 동일한 블록 크기 및 블록 크기를 정의하는 대응하는 그리드를 사용하거나, 픽처들 또는 픽처들의 서브세트들 또는 그룹들 사이에서 블록 크기를 변경하고, 각각의 픽처를 대응하는 블록들로 분할하도록 구성될 수 있다.
예에서, 인코더(20)의 예측 처리 유닛(260)은 전술한 분할 기술들의 임의의 조합을 수행하도록 구성될 수 있다.
픽처(201)와 마찬가지로, 픽처 블록(203)은 또한 샘플 값들을 갖는 샘플들의 2차원 어레이 또는 행렬이거나 그로서 또한 고려될 수 있지만, 픽처 블록(203)의 크기는 픽처(201)의 크기보다 작다. 즉, 픽처 블록(203)은, 예를 들어, 하나의 샘플 어레이(예를 들어, 단색 픽처(201)의 경우에는 루마 어레이), 3개의 샘플 어레이(예를 들어, 컬러 픽처의 경우에는 하나의 루마 어레이 및 2개의 크로마 어레이), 또는 적용된 컬러 포맷에 따라 기타 임의의 수량 및/또는 타입의 어레이를 포함할 수 있다. 픽처 블록(203)의 수평 및 수직 방향들(또는 축들)에서의 샘플들의 수량들은 픽처 블록(203)의 크기를 정의한다.
도 2에 도시된 인코더(20)는 픽처(201)를 블록별로 인코딩하도록, 예를 들어, 각각의 픽처 블록(203)에 대해 인코딩 및 예측을 수행하도록 구성된다.
잔차 계산 유닛(204)은 픽처 블록(203) 및 예측 블록(265)에 기초하여 잔차 블록(205)을 계산하도록(예측 블록(265)에 관한 추가적인 세부사항들은 아래에 제공됨), 예를 들어, 샘플별로(픽셀별로) 픽처 블록(203)의 샘플 값들로부터 예측 블록(265)의 샘플 값들을 감산함으로써 샘플 도메인에서의 잔차 블록(205)을 획득하도록 구성된다.
변환 처리 유닛(206)은 변환, 예를 들어, 이산 코사인 변환(discrete cosine transform, DCT) 또는 이산 사인 변환(discrete sine transform, DST)을 잔차 블록(205)의 샘플 값들에 적용하여, 변환 도메인에서 변환 계수들(207)을 획득하도록 구성된다. 변환 계수(207)는 변환 잔차 계수라고도 지칭될 수 있고 변환 도메인에서 잔차 블록(205)을 나타낸다.
변환 처리 유닛(206)은, HEVC/H.265에 대해 명시된 변환들과 같은, DCT/DST의 정수 근사들을 적용하도록 구성될 수 있다. 직교 DCT 변환과 비교하여, 이러한 정수 근사는 일반적으로 인자(factor)에 기초하여 스케일링된다. 순방향 및 역방향 변환을 사용하여 처리되는 잔차 블록의 표준(norm)을 유지하기 위해, 변환 프로세스의 일부로서 추가적인 스케일 인자가 적용된다. 스케일 인자는 일반적으로 일부 제약들에 기초하여 선택된다. 예를 들어, 스케일 인자는 시프트 연산에 대한 2의 거듭제곱, 변환 계수의 비트 심도, 또는 정확도와 구현 비용 사이의 트레이드오프이다. 예를 들어, 디코더(30) 측의 역변환 처리 유닛(212)에 의해 역변환에 대해(그리고, 예를 들어, 인코더(20) 측의 역변환 처리 유닛(212)에 의해 대응하는 역변환에 대해) 특정 스케일 인자가 특정되고, 그에 대응하여, 인코더(20) 측의 변환 처리 유닛(206)에 의해 순방향 변환에 대해 대응하는 스케일 인자가 특정될 수 있다.
양자화 유닛(208)은, 예를 들어, 스칼라 양자화 또는 벡터 양자화를 적용하는 것에 의해, 변환 계수들(207)을 양자화하여 양자화된 변환 계수들(209)을 획득하도록 구성된다. 양자화된 변환 계수(209)는 양자화된 잔차 계수(209)라고도 지칭될 수 있다. 양자화 프로세스는 일부 또는 모든 변환 계수들(207)에 관련된 비트 심도를 감소시킬 수 있다. 예를 들어, n-비트 변환 계수는 양자화 동안 m-비트 변환 계수로 라운딩 다운될 수 있으며, 여기서 n은 m 초과이다. 양자화 정도는 양자화 파라미터(quantization parameter, QP)를 조정함으로써 수정될 수 있다. 예를 들어, 스칼라 양자화의 경우, 더 미세하거나 더 거친 양자화를 달성하기 위해 상이한 스케일들이 적용될 수 있다. 더 작은 양자화 단계는 더 미세한 양자화에 대응하고, 더 큰 양자화 단계는 더 거친 양자화에 대응한다. 적절한 양자화 단계 크기는 양자화 파라미터(quantization parameter, QP)에 의해 표시될 수 있다. 예를 들어, 양자화 파라미터는 적절한 양자화 단계 크기들의 미리 정의된 세트에 대한 인덱스일 수 있다. 예를 들어, 더 작은 양자화 파라미터는 더 미세한 양자화(더 작은 양자화 단계 크기)에 대응할 수 있고, 더 큰 양자화 파라미터는 더 거친 양자화(더 큰 양자화 단계 크기)에 대응할 수 있으며, 그 반대도 가능하다. 양자화는 양자화 단계 크기에 의한 나눗셈 및 예를 들어, 역양자화 유닛(210)에 의해 수행되는 대응하는 양자화 또는 역양자화를 포함할 수 있거나, 양자화 단계 크기에 의한 곱셈을 포함할 수 있다. HEVC와 같은 일부 표준들에 따른 실시예들에서, 양자화 파라미터를 사용하여 양자화 단계 크기를 결정할 수 있다. 일반적으로, 양자화 단계 크기는 나눗셈을 포함하는 방정식의 고정 소수점 근사(fixed point approximation)를 사용하여 양자화 파라미터에 기초하여 계산될 수 있다. 잔차 블록의 표준을 복원하기 위해 양자화 및 역양자화를 위한 추가적인 스케일 인자들이 도입될 수 있고, 여기서, 잔차 블록의 표준은 양자화 단계 크기 및 양자화 파라미터에 대한 방정식의 고정 소수점 근사에서 사용되는 스케일 때문에 수정될 수 있다. 예시적인 구현에서, 역변환의 스케일은 역양자화의 스케일과 결합될 수 있다. 대안적으로, 맞춤화된 양자화 표가 사용되어, 예를 들어, 비트스트림에서 인코더로부터 디코더로 시그널링될 수 있다. 양자화는 손실 연산이며, 여기서 더 큰 양자화 단계 사이즈는 더 높은 손실을 나타낸다.
역양자화 유닛(210)은 양자화 유닛(208)의 역양자화를 양자화 계수에 적용하여 탈양자화된 계수(211)를 획득하도록, 예를 들어, 양자화 유닛(208)과 동일한 양자화 단계 크기에 기초하여 또는 이를 사용하여, 양자화 유닛(208)에 의해 적용되는 양자화 스킴의 역을 적용하도록 구성된다. 탈양자화된 계수(211)는 탈양자화된 잔차 계수(211)로도 지칭될 수도 있고, 변환 계수(207)에 대응하지만, 탈양자화된 계수(211)는 양자화에 의해 유발되는 손실로 인해 일반적으로 변환 계수와 상이하다.
역변환 처리 유닛(212)은 변환 처리 유닛(206)에 의해 적용되는 변환의 역변환, 예를 들어, 역 이산 코사인 변환(discrete cosine transform, DCT) 또는 역 이산 사인 변환(discrete sine transform, DST)을 적용하여, 샘플 도메인에서 역변환 블록(213)을 획득하도록 구성된다. 역변환 블록(213)은 역변환 탈양자화된 블록(213) 또는 역변환 잔차 블록(213)이라고도 지칭될 수 있다.
재구성 유닛(214)(예를 들어, 합산기(214))은 역변환 블록(213)(즉, 재구성된 잔차 블록(213))을 예측 블록(265)에 추가하여, 예를 들어, 재구성된 잔차 블록(213)의 샘플 값들과 예측 블록(265)의 샘플 값들을 가산함으로써, 샘플 도메인에서 재구성된 블록(215)을 획득하도록 구성된다.
선택적으로, 버퍼 유닛(216)(또는 간단히 "버퍼"(216)라고 지칭됨), 예를 들어, 라인 버퍼(216)는, 예를 들어, 인트라 예측을 위해, 재구성된 블록(215) 및 대응하는 샘플 값을 버퍼링 또는 저장하도록 구성된다. 다른 실시예들에서, 인코더는 임의의 타입의 추정 및/또는 예측, 예를 들어, 인트라 예측을 위해 필터링되지 않은 재구성된 블록들 및/또는 버퍼 유닛(216)에 저장된 대응하는 샘플 값들을 사용하도록 구성될 수 있다.
예를 들어, 실시예에서, 인코더(20)는 버퍼 유닛(216)이 인트라 예측 유닛(254)에 사용되는 재구성된 블록(215)뿐만 아니라 루프 필터 유닛(220)에 사용되는 재구성된 블록(도 2에 도시되지 않음)을 저장하게 구성되도록 및/또는 예를 들어, 버퍼 유닛(216) 및 디코딩된 픽처 버퍼(230)가 하나의 버퍼를 형성하도록 구성될 수 있다. 다른 실시예에서, 필터링된 블록(221) 및/또는 디코딩된 픽처 버퍼(230)로부터의 블록 또는 샘플(도 2에 도시되지 않음)은 인트라 예측 유닛(254)에 대한 입력 또는 기초로서 사용된다.
루프 필터 유닛(220)(또는 간단히 "루프 필터"(220)라고 지칭됨)은 재구성된 블록(215)을 필터링하여 필터링된 블록(221)을 획득하여, 픽셀 변환을 원활하게 하거나 비디오 품질을 개선하도록 구성된다. 루프 필터 유닛(220)은 디블록킹 필터, 샘플-적응 오프셋(sample-adaptive offset, SAO) 필터와 같은 하나 이상의 루프 필터, 또는 양방향 필터, 적응 루프 필터(adaptive loop filter, ALF), 샤프닝(sharpening) 또는 평활화 필터, 또는 협업 필터와 같은 다른 필터를 나타내도록 의도된다. 루프 필터 유닛(220)이 도 2에서 인-루프 필터로서 도시되어 있지만, 다른 구성에서, 루프 필터 유닛(220)은 포스트 필터로서 구현될 수 있다. 필터링된 블록(221)은 필터링된 재구성된 블록(221)이라고도 지칭될 수 있다. 디코딩된 픽처 버퍼(230)는 루프 필터 유닛(220)이 재구성된 인코딩된 블록에 대해 필터링 동작을 수행한 후에 재구성된 인코딩된 블록을 저장할 수 있다.
실시예에서, 인코더(20)(대응적으로, 루프 필터 유닛(220))는, 예를 들어, 직접적으로 또는 엔트로피 인코딩 유닛(270) 또는 임의의 다른 엔트로피 인코딩 유닛에 의해 수행되는 엔트로피 인코딩 후에, 루프 필터 파라미터(예를 들어, 샘플 적응적 오프셋 정보)를 출력하도록 구성될 수 있어서, 디코더(30)는 디코딩을 위해 동일한 루프 필터 파라미터를 수신하고 적용할 수 있다.
디코딩된 픽처 버퍼(decoded picture buffer, DPB)(230)는 인코더(20)에 의해 비디오 데이터를 인코딩하기 위해 사용하기 위한 참조 픽처 데이터를 저장하는 참조 픽처 메모리일 수 있다. DPB(230)는 동적 랜덤 액세스 메모리(dynamic random access memory, DRAM)(동기식 DRAM(synchronous DRAM, SDRAM), 자기저항 RAM(magnetoresistive RAM, MRAM), 또는 저항 RAM(resistive RAM, RRAM)을 포함함), 또는 다른 타입의 메모리 디바이스들과 같은 다양한 메모리 디바이스들 중 어느 하나를 포함할 수 있다. DPB(230) 및 버퍼(216)는 동일한 메모리 디바이스 또는 별개의 메모리 디바이스들에 의해 제공될 수 있다. 예에서, 디코딩된 픽처 버퍼(decoded picture buffer, DPB)(230)는 필터링된 블록(221)을 저장하도록 구성된다. 디코딩된 픽처 버퍼(230)는 동일한 현재 픽처 또는 상이한 픽처들, 예를 들어, 이전에 재구성된 픽처들의 다른 이전에 필터링된 블록들, 예를 들어, 이전에 재구성된 및 필터링된 블록들(221)을 저장하도록 추가로 구성될 수 있고, 예를 들어, 인터 예측을 위해, 완전한 이전에 재구성된, 즉, 디코딩된 픽처들(및 대응하는 참조 블록들 및 샘플들) 및/또는 부분적으로 재구성된 현재 픽처(및 대응하는 참조 블록들 및 샘플들)를 제공할 수 있다. 예에서, 재구성된 블록(215)이 인-루프 필터링 없이 재구성되면, 디코딩된 픽처 버퍼(decoded picture buffer, DPB)(230)는 재구성된 블록(215)을 저장하도록 구성된다.
블록 예측 처리 유닛(260)이라고도지칭되는 예측 처리 유닛(260)은, 픽처 블록(203)(현재 픽처(201)의 현재 픽처 블록(203)) 및 재구성된 픽처 데이터, 예를 들어, 버퍼(216)로부터의 동일한(현재) 픽처의 참조 샘플들 및/또는 디코딩된 픽처 버퍼(230)로부터의 하나 이상의 이전에 디코딩된 픽처들의 참조 픽처 데이터(231)를 수신 또는 획득하도록, 그리고 예측을 위해 이러한 데이터를 처리하도록, 즉, 인터 예측 블록(245) 또는 인트라 예측 블록(255)일 수 있는 예측 블록(265)을 제공하도록 구성된다.
모드 선택 유닛(262)은 예측 블록(265)으로서 예측 모드(예를 들어, 인트라 또는 인터 예측 모드) 및/또는 대응하는 예측 블록(245 또는 255)을 선택하여, 잔차 블록(205)의 계산 및 재구성된 블록(215)의 재구성을 위해 구성될 수 있다.
실시예에서, 모드 선택 유닛(262)은 (예를 들어, 예측 처리 유닛(260)에 의해 지원되는 예측 모드들로부터) 예측 모드를 선택하도록 구성될 수 있고, 예측 모드는 최상의 매칭 또는 최소 잔차를 제공하거나(최소 잔차는 송신 또는 저장을 위한 더 나은 압축을 의미함), 또는 최소 시그널링 오버헤드들을 제공하거나(최소 시그널링 오버헤드들은 송신 또는 저장을 위한 더 나은 압축을 의미함), 또는 둘 다를 고려하거나 밸런싱한다. 모드 선택 유닛(262)은 레이트 왜곡 최적화(rate distortion optimization, RDO)에 기초하여 예측 모드를 결정하도록 구성될 수 있는데, 즉, 최소 레이트 왜곡 최적화를 제공하는 예측 모드를 선택하거나, 관련된 레이트 왜곡이 적어도 예측 모드 선택 기준을 충족하는 예측 모드를 선택하도록 구성될 수 있다.
다음은 인코더(20)의 예에 의해 수행되는 예측 처리(예를 들어, 예측 처리 유닛(260)에 의해 수행됨) 및 모드 선택(예를 들어, 모드 선택 유닛(262)에 의해 수행됨)을 상세히 설명한다.
전술된 바와 같이, 인코더(20)는 (미리결정된) 예측 모드들의 세트로부터 최상의 또는 최적의 예측 모드를 결정하거나 선택하도록 구성된다. 예측 모드들의 세트는, 예를 들어, 인트라 예측 모드 및/또는 인터 예측 모드를 포함할 수 있다.
인트라 예측 모드들의 세트는 35개의 상이한 인트라 예측 모드, 예를 들어, DC(또는 평균) 모드 및 평면 모드와 같은 비-방향성 모드들, 또는 H.265에 정의된 것들과 같은 방향성 모드들을 포함할 수 있거나, 67개의 상이한 인트라 예측 모드, 예를 들어, DC(또는 평균) 모드 및 평면 모드와 같은 비-방향성 모드들, 또는 개발 중인 H.266에 정의된 것들과 같은 방향성 모드들을 포함할 수 있다.
가능한 구현에서, 인터 예측 모드들의 세트는 이용가능한 참조 픽처들(즉, 예를 들어, 위에서 설명된 바와 같이, DBP(230)에 저장된 적어도 일부 디코딩된 픽처들) 및 다른 인터 예측 파라미터들에 의존하고, 예를 들어, 전체 참조 픽처 또는 참조 픽처의 일부만, 예를 들어, 현재 블록의 영역 주위의 검색창 영역이 최적의 매칭된 참조 블록을 검색하기 위해 사용되는지에 의존하며, 및/또는 예를 들어, 1/2 픽셀 및/또는 1/4 픽셀 보간과 같은 픽셀 보간이 적용되는지에 의존한다. 인터 예측 모드들의 세트는, 예를 들어, 고급 모션 벡터 예측(Advanced Motion Vector Prediction, AMVP) 모드 및 병합(merge) 모드를 포함할 수 있다. 특정 구현에서, 인터 예측 모드들의 세트는 본 발명의 실시예들에서 개선된 제어 포인트-기반 AMVP 모드 및 개선된 제어 포인트-기반 병합 모드를 포함할 수 있다. 예에서, 인트라 예측 유닛(254)은 이하에 설명된 인트라 예측 기술들의 임의의 조합을 수행하도록 구성될 수 있다.
전술한 예측 모드들 이외에, 스킵 모드 및/또는 직접 모드가 또한 본 출원의 실시예들에서 사용될 수 있다.
예측 처리 유닛(260)은, 예를 들어, 쿼드트리(quadtree, QT) 분할, 이진 트리(binary tree, BT) 분할, 삼진 트리(triple-tree, TT) 분할, 또는 이들의 임의의 조합을 반복적으로 사용함으로써 픽처 블록(203)을 더 작은 블록 분할들 또는 서브블록들로 분할하고, 예를 들어, 블록 분할들 또는 서브블록들 각각에 대한 예측을 수행하도록 추가로 구성될 수 있다. 모드 선택은 분할된 픽처 블록(203)의 트리 구조의 선택 및 블록 분할들 또는 서브블록들 각각에 대해 사용되는 예측 모드의 선택을 포함한다.
인터 예측 유닛(244)은 모션 추정(motion estimation, ME) 유닛(도 2에 도시되지 않음) 및 모션 보상(motion compensation, MC) 유닛(도 2에 도시되지 않음)을 포함할 수 있다. 모션 추정 유닛은, 모션 추정을 위해, 픽처 블록(203)(현재 픽처(201)의 현재 픽처 블록(203)) 및 디코딩된 픽처(231), 또는 적어도 하나 이상의 이전에 재구성된 블록, 예를 들어, 다른/상이한 이전에 디코딩된 픽처들(231)의 하나 이상의 재구성된 블록을 수신 또는 획득하도록 구성된다. 예를 들어, 비디오 시퀀스는 현재 픽처 및 이전에 디코딩된 픽처(31)를 포함할 수 있거나, 또는 즉, 현재 픽처 및 이전에 디코딩된 픽처(31)는 비디오 시퀀스를 형성하는 픽처들의 일부일 수 있거나 또는 그 시퀀스를 형성할 수 있다.
예를 들어, 인코더(20)는 복수의 다른 픽처에서 동일한 픽처 또는 상이한 픽처들의 복수의 참조 블록으로부터 참조 블록을 선택하고, 모션 추정 유닛(도 2에 도시되지 않음)에 대해, 참조 픽처를 제공하고 및/또는 참조 블록의 위치(좌표들 X 및 Y)와 현재 블록의 위치 사이의 오프셋(공간 오프셋)을 인터 예측 파라미터로서 제공하도록 구성될 수 있다. 이 오프셋은 모션 벡터(motion vector, MV)라고도 지칭된다.
모션 보상 유닛은 인터 예측 파라미터를 획득하고, 인터 예측 파라미터에 기초하여 또는 이를 사용하여 인터 예측을 수행하여, 인터 예측 블록(245)을 획득하도록 구성된다. 모션 보상 유닛(도 2에 도시되지 않음)에 의해 수행되는 모션 보상은 모션 추정을 통해 결정된 모션/블록 벡터에 기초하여 예측 블록을 페치하거나 생성하는 것(아마도 서브-픽셀 정밀도에 대한 보간을 수행하는 것)을 포함할 수 있다. 보간 필터링은 알려진 픽셀 샘플로부터 추가 픽셀 샘플을 생성할 수 있고, 그에 의해 픽처 블록을 인코딩하기 위해 사용될 수 있는 후보 예측 블록들의 수량을 잠재적으로 증가시킨다. 현재 픽처 블록의 PU에 대한 모션 벡터를 수신하면, 모션 보상 유닛(246)은 모션 벡터가 가리키는 예측 블록을 참조 픽처 리스트에 위치시킬 수 있다. 모션 보상 유닛(246)은 디코더(30)에 의해 비디오 슬라이스의 픽처 블록을 디코딩하기 위해, 블록 및 비디오 슬라이스와 연관된 신택스 요소들을 추가로 생성할 수 있다.
구체적으로, 인터 예측 유닛(244)은 신택스 요소들을 엔트로피 인코딩 유닛(270)에 송신할 수 있고, 신택스 요소들은 (복수의 인터 예측 모드의 순회 후에 현재 블록의 예측에 사용되는 인터 예측 모드의 선택의 표시 정보와 같은) 인터 예측 파라미터를 포함한다. 가능한 응용 시나리오에서, 하나의 인터 예측 모드만이 있는 경우, 인터 예측 파라미터는 대안적으로 신택스 요소에서 운반되지 않을 수 있다. 이 경우, 디코더(30)는 디폴트 예측 모드에서 디코딩을 직접 수행할 수 있다. 인터 예측 유닛(244)은 인터 예측 기술들의 임의의 조합을 수행하도록 구성될 수 있다는 점이 이해될 수 있다.
인트라 예측 유닛(254)은 인트라 추정을 위해 동일한 픽처의 픽처 블록(203)(현재 픽처 블록) 및 하나 이상의 이전에 재구성된 블록, 예를 들어, 재구성된 이웃 블록을 획득, 예를 들어, 수신하도록 구성된다. 예를 들어, 인코더(20)는 복수의(미리 결정된) 인트라 예측 모드로부터 인트라 예측 모드를 선택하도록 구성될 수 있다.
실시예에서, 인코더(20)는, 예를 들어, 최소 잔차(예를 들어, 현재 픽처 블록(203)과 가장 유사한 예측 블록(255)을 제공하는 인트라 예측 모드) 또는 최소 레이트 왜곡에 기초하여, 최적화 기준에 따라 인트라 예측 모드를 선택하도록 구성될 수 있다.
인트라 예측 유닛(254)은, 예를 들어, 선택된 인트라 예측 모드에서의 인트라 예측 파라미터에 기초하여 인트라 예측 블록(255)을 결정하도록 추가로 구성된다. 어쨌든, 블록에 대한 인트라 예측 모드를 선택한 후에, 인트라 예측 유닛(254)은 또한, 엔트로피 인코딩 유닛(270)에 대해, 인트라 예측 파라미터, 즉, 블록에 대한 선택된 인트라 예측 모드를 나타내는 정보를 제공하도록 추가로 구성된다. 예에서, 인트라 예측 유닛(254)은 인트라 예측 기술들의 임의의 조합을 수행하도록 구성될 수 있다.
구체적으로, 인트라 예측 유닛(254)은 신택스 요소들을 엔트로피 인코딩 유닛(270)에 송신할 수 있고, 신택스 요소들은 (복수의 인트라 예측 모드의 순회 후에 현재 블록의 예측에 사용되는 인트라 예측 모드의 선택의 표시 정보와 같은) 인트라 예측 파라미터를 포함한다. 가능한 응용 시나리오에서, 하나의 인트라 예측 모드만이 있는 경우, 인트라 예측 파라미터는 대안적으로 신택스 요소에서 운반되지 않을 수 있다. 이 경우, 디코더(30)는 디폴트 예측 모드에서 디코딩을 직접 수행할 수 있다.
엔트로피 인코딩 유닛(270)은, 양자화된 잔차 계수(209), 인터 예측 파라미터, 인트라 예측 파라미터, 및/또는 루프 필터 파라미터 중 하나 또는 전부에 대해 엔트로피 코딩 알고리즘 또는 스킴(예를 들어, 가변-길이 코딩(variable-length coding, VLC) 스킴, 컨텍스트-적응 VLC(context-adaptive VLC, CAVLC) 스킴, 산술 코딩 스킴, 컨텍스트-적응 바이너리 산술 코딩(context-adaptive binary arithmetic coding, CABAC), 신택스-기반 컨텍스트-적응 바이너리 산술 코딩(syntax-based context-adaptive binary arithmetic coding, SBAC), 확률 간격 분할 엔트로피(probability interval partitioning entropy, PIPE) 코딩, 또는 다른 엔트로피 코딩 방법론 또는 기술)을 적용(또는 적용 회피)하여, 예를 들어, 인코딩된 비트스트림(21)의 형태로, 출력(272)을 통해 출력될 수 있는 인코딩된 픽처 데이터(21)를 획득하도록 구성된다. 인코딩된 비트스트림은 비디오 디코더(30)에 송신되거나, 비디오 디코더(30)에 의한 이후의 송신 또는 검색을 위해 보관될 수 있다. 엔트로피 인코딩 유닛(270)은 인코딩되고 있는 현재의 비디오 슬라이스에 대한 다른 신택스 요소를 엔트로피 인코딩하도록 추가로 구성될 수 있다.
비디오 인코더(20)의 다른 구조적 변형은 비디오 스트림을 인코딩하기 위해 사용될 수 있다. 예를 들어, 비변환 기반 인코더(20)는 일부 블록들 또는 프레임들에 대해 변환 처리 유닛(206) 없이 잔차 신호를 직접 양자화할 수 있다. 다른 구현에서, 인코더(20)는 단일 유닛으로 결합되는 양자화 유닛(208) 및 역양자화 유닛(210)을 가질 수 있다.
구체적으로, 본 출원의 실시예들에서, 인코더(20)는 다음의 실시예들에서 설명되는 MPM 리스트를 구성하는 방법 및 크로마 블록의 인트라 예측 모드를 획득하는 방법을 구현하도록 구성될 수 있다.
비디오 스트림을 인코딩하기 위해 비디오 인코더(20)의 다른 구조적 변형들이 사용될 수 있다는 점이 이해되어야 한다. 예를 들어, 일부 픽처 블록들 또는 픽처 프레임들에 대해, 비디오 인코더(20)는 잔차 신호를 직접적으로 양자화할 수 있고, 변환 처리 유닛(206)에 의한 처리는 필요하지 않고, 대응적으로, 역변환 처리 유닛(212)에 의한 처리도 필요하지 않다. 대안적으로, 일부 픽처 블록들 또는 픽처 프레임들에 대해, 비디오 인코더(20)는 잔차 데이터를 생성하지 않고, 대응적으로, 변환 처리 유닛(206), 양자화 유닛(208), 역양자화 유닛(210), 및 역변환 처리 유닛(212)에 의한 처리가 필요하지 않다. 대안적으로, 비디오 인코더(20)는 재구성된 픽처 블록을 참조 블록으로서 직접적으로 저장할 수 있고, 필터(220)에 의한 처리가 필요하지 않다. 대안적으로, 비디오 인코더(20) 내의 양자화 유닛(208) 및 역양자화 유닛(210)이 결합될 수 있다. 루프 필터(220)는 선택적이다. 또한, 무손실 압축 인코딩의 경우에, 변환 처리 유닛(206), 양자화 유닛(208), 역양자화 유닛(210), 및 역변환 처리 유닛(212)은 선택적이다. 상이한 응용 시나리오들에서, 인터 예측 유닛(244) 및 인트라 예측 유닛(254)은 선택적으로 사용될 수 있다는 것을 이해해야 한다.
도 3은 본 출원의 실시예를 구현하도록 구성된 디코더(30)의 예의 개략적인/개념적인 블록도이다. 비디오 디코더(30)는 예를 들어, 인코더(20)에 의해 인코딩된 픽처 데이터(예를 들어, 인코딩된 비트스트림)(21)를 수신하여, 디코딩된 픽처(231)를 획득하도록 구성된다. 디코딩 프로세스에서, 비디오 디코더(30)는 비디오 인코더(20)로부터 비디오 데이터, 예를 들어, 인코딩된 비디오 슬라이스의 픽처 블록 및 연관된 신택스 요소를 나타내는 인코딩된 비디오 비트스트림을 수신한다.
도 3의 예에서, 디코더(30)는 엔트로피 디코딩 유닛(304), 역양자화 유닛(310), 역변환 처리 유닛(312), 재구성 유닛(314)(예를 들어, 합산기(314)), 버퍼(316), 루프 필터(320), 디코딩된 픽처 버퍼(330), 및 예측 처리 유닛(360)을 포함한다. 예측 처리 유닛(360)은 인터 예측 유닛(344), 인트라 예측 유닛(354), 및 모드 선택 유닛(362)을 포함할 수 있다. 일부 예들에서, 비디오 디코더(30)는 도 2의 비디오 인코더(20)에 대해 설명된 인코딩 프로세스와 대략적으로 역인 디코딩 프로세스를 수행할 수 있다.
엔트로피 디코딩 유닛(304)은 인코딩된 픽처 데이터(21)를 엔트로피 디코딩하여, 예를 들어, 양자화된 계수(309) 및/또는 디코딩된 인코딩 파라미터(도 3에 도시되지 않음), 예를 들어, 인터 예측 파라미터, 인트라 예측 파라미터, 루프 필터 파라미터, 및/또는 (디코딩된) 다른 신택스 요소 중 임의의 하나 또는 전부를 획득하도록 구성된다. 엔트로피 디코딩 유닛(304)은 인터 예측 파라미터, 인트라 예측 파라미터, 및/또는 다른 신택스 요소를 예측 처리 유닛(360)에 전달하도록 추가로 구성된다. 비디오 디코더(30)는 비디오 슬라이스 레벨 및/또는 비디오 블록 레벨로 신택스 요소들을 수신할 수 있다.
역양자화 유닛(310)은 역양자화 유닛(110)과 동일한 기능을 가질 수 있다. 역변환 처리 유닛(312)는 역변환 처리 유닛(212)과 동일한 기능을 가질 수 있다. 재구성 유닛(314)은 재구성 유닛(214)과 동일한 기능을 가질 수 있다. 버퍼(316)는 버퍼(216)와 동일한 기능을 가질 수 있다. 루프 필터(320)는 루프 필터(220)와 동일한 기능을 가질 수 있다. 디코딩된 픽처 버퍼(330)는 디코딩된 픽처 버퍼(230)와 동일한 기능을 가질 수 있다.
예측 처리 유닛(360)은 인터 예측 유닛(344)과 인트라 예측 유닛(354)을 포함할 수 있다. 인터 예측 유닛(344)은 기능 면에서 인터 예측 유닛(244)과 유사할 수 있고, 인트라 예측 유닛(354)은 기능 면에서 인트라 예측 유닛(254)과 유사할 수 있다. 예측 처리 유닛(360)은 일반적으로 블록 예측을 수행하고 및/또는 인코딩된 데이터(21)로부터 예측 블록(365)을 획득하고, 예를 들어, 엔트로피 디코딩 유닛(304)으로부터, 선택된 예측 모드에 관한 예측-관련 파라미터 및/또는 정보를 (명시적으로 또는 암시적으로) 수신 또는 획득하도록 구성된다.
비디오 슬라이스가 인트라-인코딩된(I) 슬라이스로 인코딩될 때, 예측 처리 유닛(360)의 인트라 예측 유닛(354)은 시그널링된 인트라 예측 모드 및 현재 프레임 또는 픽처의 이전의 디코딩된 블록으로부터의 데이터에 기초하여 현재 비디오 슬라이스의 픽처 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 비디오 프레임이 인터-인코딩된(즉, B 또는 P) 슬라이스로 인코딩될 때, 예측 처리 유닛(360)의 인터 예측 유닛(344)(예를 들어, 모션 보상 유닛)은, 모션 벡터 및 엔트로피 디코딩 유닛(304)으로부터 수신되는 다른 신택스 요소에 기초하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 블록(365)을 생성하도록 구성된다. 인터 예측을 위해, 예측 블록은 하나의 참조 픽처 리스트 내의 참조 픽처들 중 하나로부터 생성될 수 있다. 비디오 디코더(30)는 DPB(330)에 저장된 참조 픽처들에 기초한 디폴트 구성 기술을 사용하여 참조 프레임 리스트들: 리스트 0 및 리스트 1을 구성할 수 있다.
예측 처리 유닛(360)은 모션 벡터 및 다른 신택스 요소를 파싱함으로써 현재 비디오 슬라이스의 비디오 블록에 대한 예측 정보를 결정하고, 예측 정보를 사용하여 디코딩되는 현재 비디오 블록에 대한 예측 블록을 생성하도록 구성된다. 본 출원의 예에서, 예측 처리 유닛(360)은 현재 비디오 슬라이스 내의 비디오 블록을 디코딩하기 위해, 일부 수신된 신택스 요소들을 사용하여, 비디오 슬라이스 내의 비디오 블록을 인코딩하기 위한 예측 모드(예를 들어, 인트라 또는 인터 예측), 인터 예측 슬라이스 타입(예를 들어, B 슬라이스, P 슬라이스, 또는 GPB 슬라이스), 슬라이스에 대한 참조 픽처 리스트들 중 하나 이상의 구성 정보, 슬라이스에 대한 각각의 인터 인코딩된 비디오 블록의 모션 벡터, 슬라이스 내의 각각의 인터 인코딩된 비디오 블록의 인터 예측 상태, 및 다른 정보를 결정한다. 본 개시내용의 다른 예에서, 비트스트림으로부터 비디오 디코더(30)에 의해 수신되는 신택스 요소들은 적응 파라미터 세트(adaptive parameter set, APS), 시퀀스 파라미터 세트(sequence parameter set, SPS), 픽처 파라미터 세트(picture parameter set, PPS), 또는 슬라이스 헤더 중 하나 이상에서의 신택스 요소들을 포함한다.
역양자화 유닛(310)은 비트스트림에 제공되고 엔트로피 디코딩 유닛(304)에 의해 디코딩된 양자화된 변환 계수에 대해 역양자화(즉, 탈양자화)를 수행하도록 구성될 수 있다. 역양자화 프로세스는: 비디오 슬라이스의 각각의 비디오 블록에 대해 비디오 인코더(20)에 의해 계산된 양자화 파라미터를 사용하여, 적용되어야 하는 양자화 정도를 결정하고 적용되어야 하는 역양자화 정도를 결정하는 것을 포함할 수 있다.
역변환 처리 유닛(312)은 역변환(예를 들어, 역 DCT, 역 정수 변환, 또는 개념적으로 유사한 역변환 프로세스)을 변환 계수에 적용하여, 픽셀 도메인에서 잔차 블록을 생성하도록 구성된다.
재구성 유닛(314)(예를 들어, 합산기(314))은 예를 들어, 재구성된 잔차 블록(313)의 샘플 값들과 예측 블록(365)의 샘플 값들을 가산함으로써 역변환 블록(313)(즉, 재구성된 잔차 블록(313))을 예측 블록(365)에 가산하여, 샘플 도메인에서 재구성된 블록(315)을 획득하도록 구성된다.
루프 필터 유닛(320)(코딩 루프시 또는 코딩 루프 이후에)은 재구성된 블록(315)을 필터링하여 필터링된 블록(321)을 획득하여, 픽셀 변환을 원할하게 하거나 비디오 품질을 개선하도록 구성된다. 예에서, 루프 필터 유닛(320)은 아래에 설명되는 필터링 기술들의 임의의 조합을 수행하도록 구성될 수 있다. 루프 필터 유닛(320)은 디블록킹 필터, 샘플-적응 오프셋(sample-adaptive offset, SAO) 필터와 같은 하나 이상의 루프 필터, 또는 양방향 필터, 적응 루프 필터(adaptive loop filter, ALF), 샤프닝(sharpening) 또는 평활화 필터, 또는 협업 필터와 같은 다른 필터를 나타내도록 의도된다. 루프 필터 유닛(320)이 도 3에서 인-루프 필터로서 도시되어 있지만, 다른 구성에서, 루프 필터 유닛(320)은 포스트 필터로서 구현될 수 있다.
그 후, 주어진 프레임 또는 픽처 내의 디코딩된 비디오 블록(321)은 후속 모션 보상을 위해 사용되는 참조 픽처를 저장하는 디코딩된 픽처 버퍼(330)에 저장된다.
디코더(30)는 예를 들어, 사용자에게 제시하거나 사용자가 보기 위해, 출력(332)을 통해 디코딩된 픽처(31)를 출력하도록 구성된다.
비디오 디코더(30)의 다른 변형은 압축된 비트스트림을 디코딩하는데 사용될 수 있다. 예를 들어, 디코더(30)는 루프 필터 유닛(320) 없이 출력 비디오 스트림을 생성할 수 있다. 예를 들어, 비변환 기반 디코더(30)는 일부 블록들 또는 프레임들에 대해 역변환 처리 유닛(312) 없이 직접 잔차 신호를 역양자화할 수 있다. 다른 구현에서, 비디오 디코더(30)는 단일 유닛으로 조합되는 역양자화 유닛(310) 및 역변환 처리 유닛(312)을 가질 수 있다.
구체적으로, 본 출원의 실시예들에서, 디코더(30)는 다음의 실시예들에서 설명되는 MPM 리스트를 구성하는 방법 및 크로마 블록의 인트라 예측 모드를 획득하는 방법을 구현하도록 구성된다.
비디오 디코더(30)의 다른 구조적 변형이 인코딩된 비디오 비트스트림을 디코딩하기 위해 사용될 수 있다는 것을 이해해야 한다. 예를 들어, 비디오 디코더(30)는 필터(320)에 의한 처리 없이 출력 비디오 스트림을 생성할 수 있다. 대안적으로, 일부 픽처 블록들 또는 픽처 프레임들에 대해, 비디오 디코더(30)의 엔트로피 디코딩 유닛(304)은 디코딩을 통해 양자화된 계수들을 획득하지 않고, 이에 대응하여, 역양자화 유닛(310) 및 역변환 처리 유닛(312)이 처리를 수행할 필요가 없다. 루프 필터(320)는 선택적이다. 또한, 무손실 압축의 경우에, 역양자화 유닛(310) 및 역변환 처리 유닛(312)도 선택적이다. 상이한 응용 시나리오들에서, 인터 예측 유닛 및 인트라 예측 유닛은 선택적으로 사용될 수 있다는 것을 이해해야 한다.
도 4는 본 출원의 실시예에 따른 비디오 코딩 디바이스(400)(예를 들어, 비디오 인코딩 디바이스(400) 또는 비디오 디코딩 디바이스(400))의 개략적인 구조도이다. 비디오 코딩 디바이스(400)는 본 명세서에 설명된 실시예들을 구현하기에 적합하다. 실시예에서, 비디오 코딩 디바이스(400)는 비디오 디코더(예를 들어, 도 1a의 디코더(30)) 또는 비디오 인코더(예를 들어, 도 1a의 인코더(20))일 수 있다. 다른 실시예에서, 비디오 코딩 디바이스(400)는 도 1a의 디코더(30) 또는 도 1a의 인코더(20)의 하나 이상의 컴포넌트일 수 있다.
비디오 코딩 디바이스(400)는: 데이터를 수신하기 위한 입구 포트(410) 및 수신 유닛(Rx)(420); 데이터를 처리하기 위한 프로세서, 로직 유닛, 또는 중앙 처리 유닛(CPU)(430); 데이터를 송신하기 위한 송신기 유닛(Tx)(440) 및 출구 포트(450); 및 데이터를 저장하기 위한 메모리(460)를 포함한다. 비디오 코딩 디바이스(400)는 광 신호들 또는 전기 신호들의 출구 또는 입구를 위해 입구 포트(410), 수신기 유닛(420), 송신기 유닛(440), 및 출구 포트(450)에 결합되는 광-전기 변환 컴포넌트 및 전기-광(EO) 컴포넌트를 추가로 포함할 수 있다.
프로세서(430)는 하드웨어 및 소프트웨어에 의해 구현된다. 프로세서(430)는 하나 이상의 CPU 칩, 코어(예를 들어, 멀티-코어 프로세서), FPGA, ASIC, 및 DSP로서 구현될 수 있다. 프로세서(430)는 입구 포트(410), 수신기 유닛(420), 송신기 유닛(440), 출구 포트(450), 및 메모리(460)와 통신한다. 프로세서(430)는 코딩 모듈(470)(예를 들어, 인코딩 모듈(470) 또는 디코딩 모듈(470))을 포함한다. 인코딩/디코딩 모듈(470)은 본 명세서에 개시된 실시예들을 구현하여, 본 출원의 실시예들에서 제공되는 크로마 블록 예측 방법을 구현한다. 예를 들어, 인코딩/디코딩 모듈(470)은 다양한 코딩 동작들을 수행, 처리 또는 제공한다. 따라서, 인코딩/디코딩 모듈(470)은 비디오 코딩 디바이스(400)의 기능들을 실질적으로 개선하고, 비디오 코딩 디바이스(400)의 상이한 상태로의 변환에 영향을 미친다. 대안적으로, 인코딩/디코딩 모듈(470)은 메모리(460)에 저장되고 프로세서(430)에 의해 실행되는 명령어로서 구현된다.
메모리(460)는 하나 이상의 디스크, 테이프 드라이브, 및 솔리드-스테이트 드라이브를 포함하고, 이러한 프로그램들이 실행을 위해 선택될 때 프로그램들을 저장하고, 프로그램 실행 동안 판독되는 명령어들 및 데이터를 저장하기 위해, 오버플로우 데이터 저장 디바이스로서 사용될 수 있다. 메모리(460)는 휘발성 및/또는 비휘발성일 수 있고, 판독 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 3진 콘텐츠-어드레스가능 메모리(ternary content-addressable memory, TCAM), 및/또는 정적 랜덤 액세스 메모리(SRAM)일 수 있다.
도 5는 예시적인 실시예에 따른 도 1a의 소스 디바이스(12) 및 목적지 디바이스(14) 중 하나 또는 둘 다로서 사용될 수 있는 장치(500)의 단순화된 블록도이다. 장치(500)는 본 출원의 기술들을 구현할 수 있다. 즉, 도 5는 본 출원의 실시예에 따른 인코딩 디바이스 또는 디코딩 디바이스(줄여서 코딩 디바이스(500))의 구현의 개략적인 블록도이다. 코딩 디바이스(500)는 프로세서(510), 메모리(530), 및 버스 시스템(550)을 포함할 수 있다. 프로세서 및 메모리는 버스 시스템을 통해 접속된다. 메모리는 명령어를 저장하도록 구성된다. 프로세서는 메모리에 저장된 명령어를 실행하도록 구성된다. 코딩 디바이스의 메모리는 프로그램 코드를 저장한다. 프로세서는 메모리에 저장된 프로그램 코드를 호출하여, 본 출원에서 설명된 다양한 비디오 인코딩 또는 디코딩 방법들을 수행할 수 있다. 반복을 피하기 위해 세부사항들은 여기에 설명되지 않는다.
본 출원의 이 실시예에서, 프로세서(510)는 중앙 처리 유닛(Central Processing Unit, 줄여서 "CPU")일 수 있거나, 또는 프로세서(510)는 다른 범용 프로세서, DSP(digital signal processor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 또는 다른 프로그램가능 로직 디바이스, 이산 게이트 또는 트랜지스터 로직 디바이스, 이산 하드웨어 컴포넌트 등일 수 있다. 범용 프로세서는 마이크로프로세서, 임의의 종래의 프로세서 등일 수 있다.
메모리(530)는 ROM(read-only memory) 디바이스 또는 RAM(random access memory) 디바이스를 포함할 수 있다. 메모리(530)로서 적절한 타입의 임의의 다른 저장 디바이스가 대안적으로 사용될 수 있다. 메모리(530)는 버스(550)를 통해 프로세서(510)에 의해 액세스되는 코드 및 데이터(531)를 포함할 수 있다. 메모리(530)는 운영 체제(533) 및 애플리케이션 프로그램(535)을 추가로 포함할 수 있다. 애플리케이션 프로그램(535)은 프로세서(510)가 본 출원에서 설명되는 비디오 인코딩 또는 디코딩 방법(본 출원에서 설명되는 MPM 리스트를 구성하기 위한 방법 및 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법)을 수행할 수 있게 하는 적어도 하나의 프로그램을 포함한다.
버스 시스템(550)은, 데이터 버스 이외에, 전력 버스, 제어 버스, 상태 신호 버스 등을 추가로 포함할 수 있다. 그러나, 명확한 설명을 위해, 도면에서 다양한 타입의 버스가 버스 시스템(550)으로 표시되어 있다.
선택적으로, 코딩 디바이스(500)는 하나 이상의 출력 디바이스, 예를 들어, 디스플레이(570)를 추가로 포함할 수 있다. 예에서, 디스플레이(570)는 터치 입력을 감지하도록 동작가능한 터치 유닛과 디스플레이를 결합한 터치 감지 디스플레이일 수 있다. 디스플레이(570)는 버스(550)를 통해 프로세서(510)에 접속될 수 있다.
다음은 본 출원의 실시예들에서의 해결책들을 상세히 설명한다.
도 6은 본 출원의 실시예에 따른 MPM 리스트를 구성하기 위한 방법의 개략적인 흐름도이다. 프로세스(600)는 비디오 인코더(20) 또는 비디오 디코더(30)에 의해 수행될 수 있다. 프로세스(600)는 일련의 단계들 또는 동작들로서 설명된다. 프로세스(600)의 단계들 또는 동작들은 다양한 시퀀스들로 및/또는 동시에 수행될 수 있으며, 도 6에 도시된 실행 시퀀스로 한정되지 않는다는 것을 이해해야 한다. 도 6에 도시된 바와 같이, MIP 모드가 현재 블록에 사용되고, MPM 리스트를 구성하기 위한 방법은 다음의 단계들을 포함한다.
단계 601: 이웃 블록의 인트라 예측 모드 정보를 획득한다.
도 7a 및 도 7b에 도시된 바와 같이, 인트라 예측은 MIP 모드에서 현재 블록의 상부 이웃 블록 및 좌측 이웃 블록을 주로 사용하여 수행되기 때문에, 본 출원에서의 이웃 블록은 현재 블록의 좌측 이웃 블록 (A) 및/또는 상부 이웃 블록 (B)을 포함한다.
현재 블록에 대해 수행되는 인트라 예측은 현재 블록의 이웃 블록의 예측 값에 기초하여 수행되는 예측이고, 이웃 블록은 재구성된 픽처 블록일 필요가 있다. 따라서, 이웃 블록이 이용가능한지, 즉, 이웃 블록이 존재하고 재구성되는지는, 일반적으로 먼저 결정될 필요가 있다. 예를 들어, 좌측 이웃 블록이 존재하지 않으면, 좌측 이웃 블록은 이용가능하지 않다. 대안적으로, 상부 이웃 블록이 존재하지만 재구성되지 않는다면, 상부 이웃 블록은 이용가능하지 않다. 이용가능한 이웃 블록이 재구성되고, 이용가능한 이웃 블록의 재구성 동안 인트라 예측 모드를 사용하여 인트라 예측이 수행되었다. 따라서, 이웃 블록의 인트라 예측 모드 정보가 직접 판독될 수 있다. 이웃 블록의 인트라 예측 모드 정보는 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 표시하기 위해 사용되는 플래그(예를 들어, MIP_FLAG 또는 intra_mip_flag)를 포함하고, 이웃 블록의 특정 인트라 예측 모드, 예를 들어, IntraPredModeY[xNbX][yNbX]를 사용하여 표시되는 인트라 예측 모드를 표시하기 위해 사용되는 정보를 추가로 포함한다. IntraPredModeY[xNbX][yNbX]는 좌표가 (xNbX, yNbX)인 픽처 블록의 인트라 예측 모드를 표시하기 위해 사용되고, 좌표 (xNbX, yNbX)는 픽처 블록이 위치하는 픽처의 좌측 상부 코너에 대한 픽처 블록의 좌측 상부 코너의 위치를 표시한다.
단계 602: 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정한다.
표 1은 다른 인트라 예측과 MIP 모드 간의 대응관계를 나타내고, sizeId는 MIP 모드가 사용되는 픽처 블록의 크기 인덱스를 나타내기 위해 사용된다. 예를 들어, 인트라 예측 모드 IntraPredModeY[xNbX][yNbX]가 0인 픽처 블록에 대해, 픽처 블록의 sizeId가 0일 때, 대응하는 MIP 모드는 17이거나; 픽처 블록의 sizeId가 1일 때, 대응하는 MIP 모드는 0이거나; 또는 픽처 블록의 sizeId가 2일 때, 대응하는 MIP 모드는 5이다. 인트라 예측 모드 IntraPredModeY[xNbX][yNbX]가 18인 픽처 블록에 대해, 픽처 블록의 sizeId가 1일 때, 대응하는 MIP 모드는 7이다.
Figure pct00001
Figure pct00002
표 2는 MIP 모드와 다른 인트라 예측 모드 간의 대응관계를 나타낸다. MIP 모드 세트는 표 2의 35개 타입의 모드를 포함한다. 4x4 픽처 블록(크기 인덱스가 0임)에 대응하는 35개 타입의 모드가 있다. 8x4, 4x8, 또는 8x8 픽처 블록(크기 인덱스가 1임)에 대응하는 19개 타입의 모드가 있다. 다른 크기의 픽처 블록(크기 인덱스가 2임)에 대응하는 11개 타입의 모드가 있다. IntraPredModeY[xNbX][yNbX]는 좌표가 (xNbX, yNbX)인 픽처 블록의 특정의 MIP 모드를 표시하기 위해 사용되고, 좌표 (xNbX, yNbX)는 픽처 블록이 위치하는 픽처의 좌측 상부 코너에 대한 픽처 블록의 좌측 상부 코너의 위치를 표시하고, sizeId는 인트라 예측 모드(비-MIP 모드)가 사용되는 픽처 블록의 크기 인덱스를 표시하는데 사용된다. 예를 들어, MIP 모드 IntraPredModeY[xNbX][yNbX]가 0인 픽처 블록에 대해, 픽처 블록의 sizeId가 0일 때, 대응하는 인트라 예측 모드는 0이거나; 픽처 블록의 sizeId가 1일 때, 대응하는 인트라 예측 모드는 0이거나; 또는 픽처 블록의 sizeId가 2일 때, 대응하는 인트라 예측 모드는 1이다. MIP 모드 IntraPredModeY[xNbX][yNbX]가 18인 픽처 블록에 대해, 픽처 블록의 sizeId가 1일 때, 대응하는 인트라 예측 모드는 0이다.
Figure pct00003
Figure pct00004
전술된 바와 같이, 이웃 블록의 인트라 예측 모드 정보는 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 표시하는데 사용되는 플래그를 포함한다(예를 들어, 플래그는 MIP_FLAG 또는 intra_mip_flag이거나, 또는 다른 플래그일 수 있고, 이것은 특별히 제한되지 않는다). 따라서, 이웃 블록의 인트라 예측 모드가 MIP 모드인지는 MIP_FLAG 또는 intra_mip_flag에 기초하여 결정될 수 있다. 예를 들어, MIP_FLAG의 값이 0이면, 이것은 이웃 블록의 인트라 예측 모드가 MIP 모드가 아님을 표시하거나, 또는 MIP_FLAG의 값이 1이면, 이것은 이웃 블록의 인트라 예측 모드가 MIP 모드임을 표시한다. intra_mip_flag의 값이 1이면, 이것은 이웃 블록의 인트라 예측 모드가 MIP 모드임을 표시하거나, 또는 intra_mip_flag의 값이 0이면, 이것은 이웃 블록의 인트라 예측 모드가 MIP 모드가 아님을 표시한다.
단계 603: 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않는다.
본 출원에서, 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닐 때, 이웃 블록의 인트라 예측 모드는, 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, 이용불가능하게 설정된다. 이것은 MIP 모드가 현재 블록 및 이웃 블록 둘 다에 대해 사용되지 않기 때문에, MPM 리스트를 구성하기 위해 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초하여 MIP와 다른 인트라 예측 모드 사이에서 변환이 수행될 필요가 있는 경우를 회피할 수 있어, MPM 리스트 구성의 복잡성이 감소된다.
이 경우, MPM 리스트 구성은 이하의 "2. candMipModeX의 값에 기초하여 현재 블록의 MPM 리스트를 구성한다"에서 "(2) (1)의 조건이 충족되지 않는 경우"의 예를 사용하여 설명된다.
단계 604: 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용한다.
본 출원에서, 이웃 블록의 인트라 예측 모드가 MIP 모드일 때, 현재 블록과 이웃 블록의 크기 인덱스들이 동일한지가 추가로 결정될 필요가 있고; 현재 블록과 이웃 블록의 크기 인덱스들이 상이한 경우, 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용되지 않거나; 또는 현재 블록과 이웃 블록의 크기 인덱스들이 동일한 경우, 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용된다.
예를 들어, 전술한 단계에서, candMipModeX의 값을 -1로 설정하여, 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시할 수 있다.
본 출원에서, MIP 모드가 현재 블록에 사용될 때, 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용되지 않아서, MPM 리스트 구성의 복잡성이 감소될 수 있다.
도 6에 도시된 방법 실시예가 아래에 상세히 설명된다. 예를 들어, 현재 블록이 위치하는 픽처의 좌측 상부 코너가 원점으로서 사용되고, 좌표 (xCb, yCb)는 원점에 대한 현재 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있고, 좌표 (xNbA, yNbA)는 원점에 대한 좌측 이웃 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있고(또는 좌측 이웃 블록, 즉 (xCb-1, yCb)은 현재 블록의 좌표들에 기초하여 획득될 수 있고), 좌표 (xNbB, yNbB)는 원점에 대한 상부 이웃 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있다(또는 상부 이웃 블록, 즉 (xCb, yCb-1)은 현재 블록의 좌표들에 기초하여 획득될 수 있다).
1. candMipModeX의 값을 결정한다.
여기서, candMipModeX는 MIP 모드가 현재 블록에 대해 사용될 때 MPM 리스트 구성에 사용되는, 이웃 블록의 인트라 예측 모드의 후보 값을 표시하기 위해 사용되고, 인트라 예측 모드를 표시한다. X가 A일 때, 이는 이웃 블록이 좌측 이웃 블록임을 표시한다. X가 B일 때, 이는 이웃 블록이 상부 이웃 블록임을 표시한다.
(1) 다음의 조건들 중 하나 이상이 충족되면, candMipModeX의 값은 -1로 설정된다.
a. 이웃 블록 (X)은 이용가능하지 않다.
본 출원에서, 이웃 블록이 이용가능하지 않다는 것은, 이웃 블록이 존재하지 않거나 재구성되지 않거나, 이웃 블록의 인트라 예측 모드가 MIP 모드가 아니라는 것을 표시한다. 이웃 블록이 이용가능한지를 결정하기 위해 다른 조건이 대안적으로 사용될 수 있다는 점에 유의해야 한다. 이는 본 출원에서 특별히 제한되지 않는다.
b. 이웃 블록 (X)의 예측 모드는 인트라 예측이 아니고, 조합된 인터 및 인트라 예측(combined inter and intra prediction, CIIP) 모드가 아니다.
c. pcm_flag[xNbX][yNbX]는 1이다.
본 출원에서, 플래그 pcm_flag는 PCM 모드가 대응하는 이웃 블록에 대해 사용되는지를 표시하기 위해 사용된다. 예를 들어, pcm_flag[xNbA][yNbA]가 1인 경우, 이는 PCM 모드가 좌측 이웃 블록에 대해 사용된다는 것을 표시하고, pcm_flag[xNbB][yNbB]가 0인 경우, 이는 PCM 모드가 상부 이웃 블록에 대해 사용되지 않는다는 것을 표시한다. 일반적으로, 이웃 블록이 대응하는 pcm_flag를 갖지 않는 경우, 디폴트로 이웃 블록의 pcm_flag의 값이 0인 것으로 간주된다.
d. 이웃 블록이 상부 이웃 블록일 때, 현재 블록과 상부 이웃 블록은 동일한 CTU에 있다.
(2) (1)에서의 조건들 중 어느 것도 충족되지 않는 경우, 현재 블록과 이웃 블록의 크기 인덱스들(sizeId)이 동일한지가 결정된다.
MIP에서는, 픽처 블록의 크기에 기초하여 크기와 인덱스 간의 대응관계가 설정된다. 예를 들어, 표 3은 픽처 블록의 크기와 크기 인덱스 사이의 대응관계의 일 예이다.
Figure pct00005
이 단계에서의 결정 프로세스는, 비교를 통해, sizeId[xCb][yCb]와 sizeId[xNbX][yNbX]가 동일한지를 결정하는 것이다. sizeId[xCb][yCb]와 sizeId[xNbX][yNbX]가 동일하지 않으면, candMipModeX의 값은 -1로 설정된다. sizeId[xCb][yCb]와 sizeId[xNbX][yNbX]가 동일하면, candMipModeX=IntraPredModeY[xNbX][yNbX]이고, 여기서 IntraPredModeY[xNbX][yNbX]는 이웃 블록의 인트라 예측 모드를 표시한다.
2. candMipModeX의 값에 기초하여 현재 블록의 MPM 리스트를 구성한다.
(1) candMipModeA 및 candMipModeB의 값들이 둘 다 -1이면, MPM 후보는 표 4에서의 방법에 따라 획득된다.
Figure pct00006
표 4에서의 제2 행에서의 0, 1, 및 2 각각은 픽처 블록의 크기 인덱스(sizeId)를 나타낸다. 예를 들어, 현재 블록의 sizeId가 0이면, 현재 블록의 MPM 리스트는 표 4에서의 인덱스 0에 대응하는 열이다. 즉, MPM 리스트에서, MPM[0]=17, MPM[1]=0, 및 MPM[2]=1이다. 대안적으로, 현재 블록의 sizeId가 2이면, 현재 블록의 MPM 리스트는 표 4에서의 인덱스 2에 대응하는 열이다. 즉, MPM 리스트에서, MPM[0]=5, MPM[1]=16, 및 MPM[2]=6이다.
예를 들어, 이웃 블록들의 인트라 예측 모드들 중 어느 것도 현재 블록의 MPM 리스트 구성에 사용될 수 없는 경우, 디폴트 모드들 mipMpmCand[0], mipMpmCand[1], 및 mipMpmCand[2]가 현재 블록의 MPM 리스트 구성에 사용된다.
(2) (1)에서의 조건이 충족되지 않으면, MPM 리스트는 다음의 단계들에 따라 구성된다.
a. candMipModeA 및 candMipModeB의 값들이 동일하거나, 또는 candMipModeA 및 candMipModeB 중 적어도 하나의 값이 -1이면, candMipModeA의 값이 -1인지가 결정된다. candMipModeA의 값이 -1이 아닌 경우, MPM[0]=candMipModeA이거나; 또는 candMipModeA의 값이 -1인 경우, MPM[0]=candMipModeB이다. 전술한 단계에서 결정된 MPM[0] 및 표 4에서의 mipMpmCand[0]이 비교된다. 전술한 단계에서 결정된 MPM[0] 및 표 4에서의 mipMpmCand[0]이 동일한 경우, MPM[1]=mipMpmCand[1]이고 MPM[2]=mipMpmCand[2]이다. 전술한 단계에서 결정된 MPM[0]과 표 4에서의 mipMpmCand[0]이 상이한 경우, MPM[1]=mipMpmCand[0]이고 MPM[2]=(MPM[0]!=mipMpmCand[1])?mipMpmCand[1]:mipMpmCand[2]이다.
예를 들어, 적어도 하나의 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용될 수 없으면, 디폴트 모드 및 이웃 블록의 이용가능한 인트라 예측 모드가 중복 제거된 후에, 중복 제거 후에 획득된 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용된다. 디폴트 모드는 mipMpmCand[0], mipMpmCand[1] 및 mipMpmCand[2] 중 하나 이상을 포함한다.
b. candMipModeA 및 candMipModeB의 값들이 상이하고, candMipModeA 및 candMipModeB의 값들 중 어느 것도 -1이 아닌 경우, MPM[0]=candMipModeA이고 MPM[1]=candMipModeB이다. 표 4에서의 현재 블록의 sizeId에 대응하는 열에서의 3개의 값 mipMpmCand[0], mipMpmCand[1], 및 mipMpmCand[2]는 결정된 MPM[0] 및 MPM[1]로 순차적으로 중복제거되고, 3개의 값에서의 이용가능한 값은 MPM[2]로서 사용된다. 예를 들어, MPM[0]=17, MPM[1]=7이고, 현재 블록의 sizeId는 0이다. 0에 대응하는 열{17, 0, 1}은 중복제거된다. 17은 MPM[0]과 동일하기 때문에, MPM[2]=0이다. 대안적으로, MPM[0]=5, MPM[1]=6이고, 현재 블록의 sizeId는 2이다. 2에 대응하는 열{5, 16, 6}은 중복제거된다. 5는 MPM[0]과 동일하고, 6은 MPM[1]과 동일하기 때문에, MPM[2]=16이다.
예를 들어, 이웃 블록들의 모든 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용될 수 있으면, 이웃 블록들의 인트라 예측 모드들은 현재 블록의 MPM 리스트 구성에 사용된다. 그 후, 이웃 블록의 디폴트 모드 및 이용가능한 인트라 예측 모드가 중복제거된 후에, 중복제거 후에 획득된 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용된다. 디폴트 모드는 mipMpmCand[0], mipMpmCand[1] 및 mipMpmCand[2] 중 하나 이상을 포함한다.
이것은 MIP 모드가 현재 블록 및 이웃 블록 둘 다에 대해 사용되지 않기 때문에, MPM 리스트를 구성하기 위해 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초하여 MIP와 다른 인트라 예측 모드 사이에서 변환이 수행될 필요가 있는 경우를 회피할 수 있어, MPM 리스트 구성의 복잡성이 감소된다.
도 8은 본 출원의 실시예에 따른 MPM 리스트를 구성하기 위한 방법의 다른 개략적인 흐름도이다. 프로세스(800)는 비디오 인코더(20) 또는 비디오 디코더(30)에 의해 수행될 수 있다. 프로세스(800)는 일련의 단계들 또는 동작들로서 설명된다. 프로세스(800)의 단계들 또는 동작들은 다양한 시퀀스들로 및/또는 동시에 수행될 수 있으며, 도 8에 도시된 실행 시퀀스로 한정되지 않는다는 것을 이해해야 한다. 이 실시예와 도 6에 도시된 실시예 사이의 차이는 MIP 모드가 현재 블록에 사용되지 않는다는 점에 있다. 도 8에 도시된 바와 같이, MPM 리스트를 구성하기 위한 방법은 다음의 단계들을 포함한다.
단계 801: 이웃 블록의 인트라 예측 모드 정보를 획득한다.
단계 802: 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정한다.
이 실시예에서의 단계들 801 및 802의 원리들은 도 6에 도시된 실시예에서의 단계들 601 및 602의 원리들과 유사하고, 세부사항들은 여기서 다시 설명되지 않는다.
단계 803: 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않는다.
본 출원에서, 마찬가지로, 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용되지 않는다. 단계 803에서의 제약은 이웃 블록의 인트라 예측 모드가 MIP 모드라는 것이다. 그러나, 단계 603에서의 제약은 이웃 블록의 인트라 예측 모드가 MIP 모드가 아니라는 것이다. 2개의 제약의 공통 원리는, 이웃 블록의 인트라 예측 모드와 현재 블록의 인트라 예측 모드 양쪽 모두가 MIP 모드는 아니라는 것이다.
본 출원에서, 이웃 블록의 인트라 예측 모드가 MIP 모드일 때, 이웃 블록의 인트라 예측 모드는, 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, 이용불가능하게 설정된다. 이것은 MIP 모드가 현재 블록 및 이웃 블록 둘 다에 대해 사용되지 않기 때문에, MPM 리스트를 구성하기 위해 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초하여 MIP와 다른 인트라 예측 모드 사이에서 변환이 수행될 필요가 있는 경우를 회피할 수 있어, MPM 리스트 구성의 복잡성이 감소된다.
단계 804: 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용한다.
본 출원에서, 마찬가지로, 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용된다. 단계 804에서의 제약은 이웃 블록의 인트라 예측 모드가 MIP 모드가 아니라는 것이다. 그러나, 단계 604에서의 제약은 이웃 블록의 인트라 예측 모드가 MIP 모드라는 것이다. 2개의 제약의 공통 원리는 이웃 블록의 인트라 예측 모드 및 현재 블록의 인트라 예측 모드가 MIP 모드라는 것이다.
예를 들어, 전술한 단계에서, candIntraPredModeX의 값을 -1로 설정하여, 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시할 수 있다.
본 출원에서, MIP 모드가 현재 블록에 사용되지 않을 때, 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 이웃 블록의 인트라 예측 모드는 현재 블록의 MPM 리스트 구성에 사용되지 않아서, MPM 리스트 구성의 복잡성이 감소될 수 있다.
도 8에 도시된 방법 실시예가 아래에 상세히 설명된다. 예를 들어, 현재 블록이 위치하는 픽처의 좌측 상부 코너가 원점으로서 사용되고, 좌표 (xCb, yCb)는 원점에 대한 현재 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있고, 좌표 (xNbA, yNbA)는 원점에 대한 좌측 이웃 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있고, 좌표 (xNbB, yNbB)는 원점에 대한 상부 이웃 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있다.
1. candIntraPredModeX의 값을 결정한다.
여기서, candIntraPredModeX는 MIP 모드가 현재 블록에 대해 사용되지 않을 때 MPM 리스트 구성에 사용되는, 이웃 블록의 인트라 예측 모드의 후보 값을 표시하기 위해 사용되고, 인트라 예측 모드를 표시한다. X가 A일 때, 이는 이웃 블록이 좌측 이웃 블록임을 표시한다. X가 B일 때, 이는 이웃 블록이 상부 이웃 블록임을 표시한다.
(1) 다음의 조건들 중 하나 이상이 충족되면, candIntraPredModeX의 값은 평면 모드(INTRA_PLANAR)로 설정된다.
a. 이웃 블록 (X)은 이용가능하지 않다.
본 출원에서, 이웃 블록이 이용가능하지 않다는 것은, 이웃 블록이 존재하지 않거나 재구성되지 않거나, 이웃 블록의 인트라 예측 모드가 MIP 모드라는 것을 표시한다. 이웃 블록이 이용가능한지를 결정하기 위해 다른 조건이 대안적으로 사용될 수 있다는 점에 유의해야 한다. 이는 본 출원에서 특별히 제한되지 않는다.
b. 이웃 블록 (X)의 예측 모드는 인트라 예측도 아니고 CIIP 모드도 아니다.
c. pcm_flag[xNbX][yNbX]는 1이다.
d. 이웃 블록이 상부 이웃 블록일 때, 현재 블록과 상부 이웃 블록은 동일한 CTU에 있다.
(2) (1)에서의 조건들 중 어느 것도 충족되지 않으면, candIntraPredModeX=IntraPredModeY[xNbX][yNbX]이고, 여기서 IntraPredModeY[xNbX][yNbX]는 이웃 블록의 인트라 예측 모드를 표시한다.
2. candIntraPredModeX의 값에 기초하여 현재 블록의 MPM 리스트를 구성한다.
MPM 리스트는 전술한 단계에서 획득되는 candMipModeA 및 candMipModeB의 값들 및 INTRA_PLANAR과 INTRA_DC 사이의 모드 크기 관계에 기초하여 구성된다.
표 5는 모드 명칭과 모드 크기 간의 대응관계를 나타낸다. 다음은 예를 사용하여 MPM 리스트 구성 프로세스를 설명한다.
Figure pct00007
(1) candIntraPredModeB 및 candIntraPredModeA가 동일하고, candIntraPredModeA가 INTRA_DC보다 큰 경우, MPM 리스트 candModeList[x]는 다음과 같고, 여기서 x의 값은 0 내지 4의 범위에 있다:
candModeList[0]=candIntraPredModeA이고;
candModeList[1] = 2 + ((candIntraPredModeA + 61)%64)이고;
candModeList[2] = 2 + ((candIntraPredModeA - 1)%64)이고;
candModeList[3]=INTRA_DC이며;
candModeList[4] = 2 + ((candIntraPredModeA + 60)%64)이다.
예를 들어, 이웃 블록들의 모든 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용될 수 있으면, 이웃 블록들의 인트라 예측 모드들은 현재 블록의 MPM 리스트 구성에 사용된다. 그 후, 현재 블록의 MPM 리스트는 디폴트 모드 및 이웃 블록들의 인트라 예측 모드들에 기초한 디폴트 알고리즘을 사용하여 구성된다. 디폴트 모드는 INTRA_DC이다. 디폴트 알고리즘은 전술한 바와 같을 수 있다.
(2) candIntraPredModeB 및 candIntraPredModeA가 동일하지 않고, candIntraPredModeA 및 candIntraPredModeB 중 하나 또는 둘 다가 INTRA_DC보다 큰 경우, 이하의 방법이 사용된다.
a. candIntraPredModeA 및 candIntraPredModeB에서, 더 큰 것이 maxAB로서 취해지고, 더 작은 것이 minAB로서 취해진다.
b. candIntraPredModeB 및 candIntraPredModeA 둘 다가 INTRA_DC보다 큰 경우,
candModeList[0]=candIntraPredModeA이고;
candModeList[1]=candIntraPredModeB이고;
candModeList[2]=INTRA_DC이며;
maxAB-minAB의 범위가 2 내지 62인 경우,
candModeList[3] = 2 + ((maxAB + 61)%64)이고;
candModeList[4] = 2 + ((maxAB - 1)%64)이거나; 또는
maxAB-minAB의 범위가 2 내지 62가 아닌 경우,
candModeList[3] = 2 + ((maxAB + 60)%64)이고;
candModeList[4] = 2 + ((maxAB)%64)이다.
예를 들어, 이웃 블록들의 모든 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용될 수 있으면, 이웃 블록들의 인트라 예측 모드들은 현재 블록의 MPM 리스트 구성에 사용된다. 그 후, 현재 블록의 MPM 리스트는 디폴트 모드, maxAB, 및 이웃 블록들의 인트라 예측 모드들에 기초한 디폴트 알고리즘을 사용하여 구성된다. 디폴트 모드는 INTRA_DC이다. 디폴트 알고리즘은 전술한 바와 같을 수 있다.
c. candIntraPredModeA 및 candIntraPredModeB 중 하나가 INTRA_DC보다 큰 경우,
candModeList[0] = maxAB이고;
candModeList[1] = INTRA_DC이고;
candModeList[2] = 2 + ((maxAB + 61)%64)이고;
candModeList[3] = 2 + ((maxAB - 1)%64)이며;
candModeList[4] = 2 + ((maxAB + 60)%64)이다.
예를 들어, 이웃 블록들의 모든 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용될 수 있으면, 현재 블록의 MPM 리스트는 디폴트 모드, maxAB, 및 이웃 블록들의 인트라 예측 모드들에 기초한 디폴트 알고리즘을 사용하여 구성된다. 디폴트 모드는 INTRA_DC이다. 디폴트 알고리즘은 전술한 바와 같을 수 있다.
(3) (1)과 (2) 중 어느 것도 충족되지 않는 경우,
candModeList[0] = INTRA_DC이고;
candModeList[1] = INTRA_ANGULAR50이고;
candModeList[2] = INTRA_ANGULAR18이고;
candModeList[3] = INTRA_ANGULAR46이며;
candModeList[4] = INTRA_ANGULAR54이다.
예를 들어, 이웃 블록들의 인트라 예측 모드들 중 어느 것도 현재 블록의 MPM 리스트 구성에 사용될 수 없다면, 현재 블록의 MPM 리스트는 디폴트 모드들에 기초하여 구성된다. 디폴트 모드들은 INTRA_DC, INTRA_ANGULAR50, INTRA_ANGULAR18, INTRA_ANGULAR46, 및 INTRA_ANGULAR54를 포함한다.
이것은 MIP 모드가 현재 블록 및 이웃 블록 둘 다에 대해 사용되지 않기 때문에, MPM 리스트를 구성하기 위해 MIP와 다른 인트라 예측 모드 사이의 대응관계에 기초하여 MIP와 다른 인트라 예측 모드 사이에서 변환이 수행될 필요가 있는 경우를 회피할 수 있어, MPM 리스트 구성의 복잡성이 감소된다.
도 9는 본 출원의 실시예에 따른 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법의 개략적인 흐름도이다. 프로세스(900)는 비디오 인코더(20) 또는 비디오 디코더(30)에 의해 수행될 수 있다. 프로세스(900)는 일련의 단계들 또는 동작들로서 설명된다. 프로세스(900)의 단계들 또는 동작들은 다양한 시퀀스들로 및/또는 동시에 수행될 수 있으며, 도 9에 도시된 실행 시퀀스로 한정되지 않는다는 것을 이해해야 한다. 도 9에 도시된 바와 같이, 크로마 블록의 인트라 예측 모드를 획득하는 방법은 다음의 단계들을 포함한다.
단계 901: 루마 블록의 인트라 예측 모드를 획득한다.
루마 블록은 현재 크로마 블록에 대응하는 루마 블록이다. 구체적으로, 루마 블록 및 현재 크로마 블록은 동일한 픽처 블록의 루마 성분 및 크로마 성분이다. 루마 블록과 유사하게, 크로마 블록의 인트라 예측은 또한 현재 크로마 블록 주위의 이웃하는 재구성된 블록의 경계 픽셀을 현재 블록의 참조 픽셀로서 사용하고, 참조 픽셀을 특정 예측 모드에 기초하여 현재 크로마 블록 내의 픽셀에 매핑하여, 현재 크로마 블록 내의 픽셀의 예측된 값으로서 역할한다. 차이점은, 크로마 블록의 텍스처가 일반적으로 비교적 간단하기 때문에, 크로마 블록의 인트라 예측 모드들의 수량은 일반적으로 루마 블록의 인트라 예측 모드들의 수량보다 적다는 점에 있다. 예를 들어, H.265에서는, 크로마 블록의 단지 5개의 인트라 예측 모드, 즉 평면 모드, 수직 모드, 수평 모드, DC 모드, 및 DM 모드가 있다. 예를 들어, 모드 인덱스 0 내지 4에 각각 대응하는 HEVC에서 크로마 블록의 5개의 인트라 예측 모드가 있다. 모드 인덱스 0은 (루마 블록의 모드 0에 대응하는) 평면 모드이다. 모드 인덱스 1은 (루마 블록의 모드 26에 대응하는) 수직 모드이다. 모드 인덱스 2는 (루마 블록의 모드 10에 대응하는) 수평 모드이다. 모드 인덱스 3은 (루마 블록의 모드 1에 대응하는) DC 모드이다. 모드 인덱스 4는 DM 모드이다.
단계 902: 루마 블록의 인트라 예측 모드가 MIP 모드인지를 결정한다.
전술한 바와 같이, 루마 블록의 인트라 예측 모드 정보는 루마 블록의 인트라 예측 모드가 MIP 모드인지를 표시하기 위해 사용되는 플래그(MIP_FLAG)를 포함한다. 따라서, 루마 블록의 인트라 예측 모드가 MIP 모드인지는 MIP_FLAG에 기초하여 결정될 수 있다. 예를 들어, MIP_FLAG의 값이 0이면, 이는 루마 블록의 인트라 예측 모드가 MIP 모드가 아님을 표시하거나, 또는 MIP_FLAG의 값이 1이면, 이는 루마 블록의 인트라 예측 모드가 MIP 모드임을 표시한다.
루마 블록의 인트라 예측 모드 정보는 루마 블록의 특정 인트라 예측 모드를 표시하기 위해 사용되는 정보, 예를 들어, IntraPredModeY[xCb][yCb]를 사용하여 표시되는 인트라 예측 모드를 추가로 포함한다. 예를 들어, 현재 블록이 위치하는 픽처의 좌측 상부 코너가 원점으로서 사용되고, 좌표 (xCb, yCb)는 원점에 대한 현재 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있다.
단계 903: 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 루마 블록의 인트라 예측 모드를 현재 크로마 블록의 인트라 예측 모드로서 사용한다.
단계 904: 루마 블록의 인트라 예측 모드가 MIP 모드인 경우 디폴트 모드를 크로마 블록의 인트라 예측 모드로서 사용한다.
크로마 블록의 디폴트 모드는 평면 모드 또는 DC 모드를 포함한다.
현재 크로마 블록의 경우, 현재 크로마 블록의 중심 위치를 커버하는 루마 블록의 인트라 예측 모드가 직접 계승된다. 구체적으로, 루마 성분에 대한 것과 동일한 인트라 예측 모드가 크로마 성분에 대해 선택된다. 이것은 DM 모드가 크로마 블록에 사용될 때 사용되는 인트라 예측 모드 획득 방법이다. 본 출원에서, DM 모드에 기초하여, MIP 모드가 루마 블록에 대해 추가되는 경우에, 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 루마 블록의 인트라 예측 모드가 현재 크로마 블록의 인트라 예측 모드로서 사용되거나, 또는 루마 블록의 인트라 예측 모드가 MIP 모드인 경우, 디폴트 모드가 현재 크로마 블록의 인트라 예측 모드로서 사용되어, 크로마 블록의 인트라 예측 모드를 획득하는 복잡도가 감소될 수 있다.
도 9에 도시된 방법 실시예가 아래에 상세히 설명된다. DM은 현재 크로마 블록에 사용된다. 예를 들어, 현재 블록이 위치하는 픽처의 좌측 상부 코너가 원점으로서 사용되고, 좌표 (xCb, yCb)는 원점에 대한 현재 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있고, 좌표 (xNbA, yNbA)는 원점에 대한 좌측 이웃 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있고, 좌표 (xNbB, yNbB)는 원점에 대한 상부 이웃 블록의 좌측 상부 코너의 위치를 표시하기 위해 사용될 수 있다.
루마 블록의 인트라 예측 모드 lumaIntraPredMode[xCb][yCb]가 획득된다.
a. 루마 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 크로마 블록의 예측 모드는 디폴트 값(디폴트 모드, 여기서 이 값은 인코더 측과 디코더 측 간의 합의된 값으로 간주됨), 예를 들어, 평면 모드 또는 DC 모드로 직접 설정된다. 이 경우, 다음의 단계가 요구되지 않는다.
b. 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 크로마 블록의 예측 모드는 루마 블록의 인트라 예측 모드 lumaIntraPredMode[xCb][yCb]로 직접 설정된다. 루마 블록의 인트라 예측 모드 lumaIntraPredMode[xCb][yCb]는 IntraPredModeY[xCb+cbWidth/2][yCb+cbHeight/2]와 동일하고, 여기서 cbWidth는 루마 블록의 폭을 표시하고, cbHeight는 루마 블록의 높이를 표시한다. 구체적으로, 이 경우, 좌측 상단 코너가 현재 블록의 중심 픽셀인 픽처 블록에 사용되는 인트라 예측 모드가 루마 블록의 인트라 예측 모드로서 사용된다. 그 후, 현재 크로마 블록의 인트라 예측 모드는 대응하는 루마 블록의 인트라 예측 모드로 직접 설정된다.
도 10은 본 출원의 실시예에 따른 인트라 예측 장치(1000)의 개략적인 블록도이다. 인트라 예측 장치(1000)는 획득 모듈(1001), 결정 모듈(1002), 및 처리 모듈(1003)을 포함할 수 있다.
MIP 모드가 현재 블록에 대해 사용될 때, 획득 모듈(1001)은 이웃 블록의 인트라 예측 모드 정보를 획득하도록 구성되고, 여기서 이웃 블록은 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함하고; 결정 모듈(1002)은, 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고; 처리 모듈(1003)은 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하도록 구성된다.
가능한 구현에서, 처리 모듈(1003)은 구체적으로 이웃 블록의 인트라 예측 모드를 이용불가능하게 설정하도록 구성된다.
가능한 구현에서, 처리 모듈(1003)은 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해 candMipModeX의 값을 -1로 설정하도록 추가로 구성된다.
가능한 구현에서, 처리 모듈(1003)은 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 디폴트 모드를 사용하도록 추가로 구성된다.
가능한 구현에서, 처리 모듈(1003)은 구체적으로: 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록 및 이웃 블록의 크기 인덱스들이 동일한지를 결정하고; 현재 블록 및 이웃 블록의 크기 인덱스들이 상이한 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 현재 블록 및 이웃 블록의 크기 인덱스들이 동일한 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하도록 구성된다.
가능한 구현에서, 획득 모듈(1001)은 이웃 블록의 인트라 예측 모드 정보에 기초하여 이웃 블록의 인트라 예측 모드를 획득하도록 추가로 구성된다.
가능한 구현에서, 결정 모듈(1002)은 구체적으로, 플래그 MIP_FLAG에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고, 여기서 이웃 블록의 인트라 예측 모드 정보는 MIP_FLAG를 포함한다.
MIP 모드가 현재 블록에 사용되지 않을 때, 획득 모듈(1001)은 이웃 블록의 인트라 예측 모드 정보를 획득하도록 구성되고, 여기서 이웃 블록은 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함하고; 결정 모듈(1002)은, 이웃 블록의 인트라 예측 모드 정보에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고; 처리 모듈(1003)은 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 이웃 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 현재 블록의 MPM 리스트 구성에 이웃 블록의 인트라 예측 모드를 사용하도록 구성된다.
가능한 구현에서, 처리 모듈(1003)은 구체적으로 이웃 블록의 인트라 예측 모드를 이용불가능하게 설정하도록 구성된다.
가능한 구현에서, 처리 모듈(1003)은 이웃 블록의 인트라 예측 모드가 현재 블록의 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해 candIntraPredModeX의 값을 -1로 설정하도록 추가로 구성된다.
가능한 구현에서, 처리 모듈(1003)은 이웃 블록의 인트라 예측 모드가 MIP 모드인 경우, 현재 블록의 MPM 리스트 구성에 디폴트 모드를 사용하도록 추가로 구성된다.
가능한 구현에서, 획득 모듈(1001)은 이웃 블록의 인트라 예측 모드 정보에 기초하여 이웃 블록의 인트라 예측 모드를 획득하도록 추가로 구성된다.
가능한 구현에서, 결정 모듈(1002)은 구체적으로, 플래그 MIP_FLAG에 기초하여, 이웃 블록의 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고, 여기서 이웃 블록의 인트라 예측 모드 정보는 MIP_FLAG를 포함한다.
DM이 현재 크로마 블록에 사용될 때, 획득 모듈(1001)은 루마 블록의 인트라 예측 모드를 획득하도록 구성되고, 여기서 루마 블록은 현재 크로마 블록에 대응하는 루마 블록이고; 결정 모듈(1002)은 루마 블록의 인트라 예측 모드가 행렬-기반 인트라 예측 MIP 모드인지를 결정하도록 구성되고; 처리 모듈(1003)은: 루마 블록의 인트라 예측 모드가 MIP 모드가 아닌 경우, 루마 블록의 인트라 예측 모드를 현재 크로마 블록의 인트라 예측 모드로서 사용하거나; 또는 루마 블록의 인트라 예측 모드가 MIP 모드인 경우, 디폴트 모드를 크로마 블록의 인트라 예측 모드로서 사용하도록 구성된다.
가능한 구현에서, 디폴트 모드는 평면 모드 또는 DC 모드를 포함한다.
인트라 예측 장치(1000) 내의 획득 모듈(1001), 결정 모듈(1002), 및 처리 모듈(1003)은 인코더 측 또는 디코더 측 상의 인트라 예측 프로세스에서 사용될 수 있다는 점에 유의해야 한다. 현재 블록의 MPM 리스트가 구성된 후에, 현재 블록의 구성된 MPM 리스트에 기초하여 현재 블록의 특정 예측 모드가 결정될 수 있고, 그 후 특정 예측 모드에 기초하여 현재 블록의 예측된 픽셀 값이 결정된다. 구체적으로, 인코더 측에서, 모듈들은 인코더(20)의 예측 처리 유닛(260) 내의 인트라 예측 유닛(254)에서 사용될 수 있다. 디코더 측에서, 모듈들은 디코더(30)의 예측 처리 유닛(360) 내의 인트라 예측 유닛(354)에서 사용될 수 있다.
획득 모듈(1001), 결정 모듈(1002), 및 처리 모듈(1003)의 특정 구현 프로세스들에 대해서는, 도 6 내지 도 9의 임의의 실시예의 상세한 설명들을 참조한다는 점에 추가로 유의해야 한다. 본 명세서의 간결성을 위해, 세부사항들은 여기서 설명되지 않는다.
본 기술분야의 통상의 기술자는 본 명세서에 개시되고 설명되는 다양한 예시적인 논리 블록들, 모듈들, 및 알고리즘 단계들을 참조하여 설명되는 기능들이 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합에 의해 구현될 수 있다는 점을 이해할 수 있다. 예시적인 논리 블록들, 모듈들 및 단계들을 참조하여 설명되는 기능들은, 소프트웨어에 의해 구현되면, 하나 이상의 명령어 또는 코드로서 컴퓨터 판독가능 매체에 저장되거나 또는 이를 통해 송신될 수 있고 하드웨어-기반 처리 유닛에 의해 실행될 수 있다. 컴퓨터 판독가능 매체는 데이터 저장 매체와 같은 유형의 매체에 대응하는 컴퓨터 판독가능 저장 매체를 포함할 수 있거나, 또는 (예를 들어, 통신 프로토콜에 따라) 한 장소로부터 다른 장소로의 컴퓨터 프로그램의 송신을 용이하게 하는 임의의 통신 매체를 포함할 수 있다. 이러한 방식으로, 컴퓨터 판독가능 매체는 일반적으로 (1) 비일시적 유형의 컴퓨터 판독가능 저장 매체 또는 (2) 신호 또는 캐리어와 같은 통신 매체에 대응할 수 있다. 데이터 저장 매체는 본 출원에서 설명되는 기술들을 구현하기 위한 명령어들, 코드, 및/또는 데이터 구조들을 검색하기 위해 하나 이상의 컴퓨터 또는 하나 이상의 프로세서에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수 있다.
제한이 아닌 예로서, 이러한 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 콤팩트 디스크 저장 장치, 자기 디스크 저장 장치 또는 다른 자기 저장 장치, 플래시 메모리, 또는 원하는 프로그램 코드를 명령어 또는 데이터 구조의 형태로 저장하기 위해 사용될 수 있는 그리고 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속은 컴퓨터 판독가능 매체라고 적절히 지칭된다. 예를 들어, 명령어가 동축 케이블, 광섬유, 트위스티드 페어, 디지털 가입자 회선(DSL), 또는 적외선, 라디오, 또는 마이크로파와 같은 무선 기술을 통해 웹사이트, 서버, 또는 다른 원격 소스로부터 송신되면, 동축 케이블, 광섬유, 트위스티드 페어, DSL, 또는 적외선, 라디오, 또는 마이크로파와 같은 무선 기술은 매체의 정의에 포함된다. 그러나, 컴퓨터 판독가능 저장 매체 및 데이터 저장 매체는 접속들, 캐리어들, 신호들, 또는 다른 일시적 매체를 포함하지 않지만, 비일시적인 유형의 저장 매체를 실제로 의미한다는 점을 이해해야 한다. 본 명세서에서 사용되는 디스크들(disks) 및 디스크들(discs)은 CD(compact disc), 레이저 디스크, 광 디스크, DVD(digital versatile disc), 및 블루-레이(Blu-ray) 디스크를 포함한다. 디스크들(disks)은 일반적으로 자기적으로 데이터를 재생하고, 한편 디스크들(discs)은 데이터를 레이저들을 사용하여 광학적으로 재생한다. 전술된 아이템들의 조합들은 또한 컴퓨터 판독가능 매체의 범위 내에 포함되어야 한다.
명령어는 하나 이상의 디지털 신호 프로세서(DSP), 범용 마이크로프로세서, 주문형 집적 회로(ASIC), 필드 프로그래머블 게이트 어레이(FPGA), 또는 다른 등가의 집적 또는 개별 로직 회로와 같은 하나 이상의 프로세서에 의해 실행될 수 있다. 따라서, 본 명세서에서 사용되는 용어 "프로세서(processor)"는 전술한 구조들 중 임의의 것 또는 본 명세서에서 설명되는 기술들을 구현하기에 적합한 임의의 다른 구조일 수 있다. 또한, 일부 양태들에서, 본 명세서에서 설명되는 예시적인 논리 블록들, 모듈들, 및 단계들을 참조하여 설명되는 기능들은 인코딩 및 디코딩을 위해 구성되는 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공될 수 있거나, 또는 조합된 코덱에 통합될 수 있다. 또한, 기술들은 모두 하나 이상의 회로 또는 로직 요소에서 구현될 수 있다.
본 출원의 기술들은, 무선 핸드셋, IC(integrated circuit), 또는 IC들의 세트(예를 들어, 칩 세트)을 포함하는, 다양한 장치들 또는 디바이스들에서 구현될 수 있다. 개시된 기술들을 수행하도록 구성되는 장치들의 기능 양태들을 강조하기 위해 다양한 컴포넌트들, 모듈들, 또는 유닛들이 본 출원에서 설명되지만, 반드시 상이한 하드웨어 유닛들에 의해 구현되는 것은 아니다. 실제로, 전술한 바와 같이, 다양한 유닛들은 적절한 소프트웨어 및/또는 펌웨어와 조합하여 코덱 하드웨어 유닛으로 결합될 수 있거나, (전술한 하나 이상의 프로세서를 포함하는) 상호운용 가능한 하드웨어 유닛들에 의해 제공될 수 있다.
전술한 실시예들에서, 각각의 실시예에서의 설명들은 각각의 주안점들을 갖는다. 실시예에서 상세히 설명되지 않은 부분에 대해서는, 다른 실시예들에서의 관련 설명들을 참조한다.
전술한 설명들은 단지 본 출원의 구체적인 구현들의 예들이지만, 본 출원의 보호 범위를 제한하도록 의도되는 것은 아니다. 본 출원에서 개시되는 기술적 범위 내에서 해당 분야에서의 기술자에 의해 용이하게 도출되는 임의의 변형 또는 대체는 본 출원의 보호 범위 내에 있을 것이다. 따라서, 본 출원의 보호 범위는 청구항들의 보호 범위에 종속될 것이다.

Claims (32)

  1. MPM 리스트를 구성하기 위한 방법으로서,
    행렬-기반 인트라 예측 MIP 모드는 현재 블록에 사용되고, 상기 방법은:
    이웃 블록의 인트라 예측 모드 정보를 획득하는 단계- 상기 이웃 블록은 상기 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -;
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여, 상기 이웃 블록의 인트라 예측 모드가 상기 MIP 모드인지를 결정하는 단계; 및
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 것을 스킵하거나; 또는
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 단계를 포함하는 방법.
  2. 제1항에 있어서,
    상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 것을 스킵하는 것은:
    상기 이웃 블록의 상기 인트라 예측 모드를 이용불가능하게 설정하는 것을 포함하는 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 현재 블록의 상기 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, candMipModeX의 값을 -1로 설정하는 단계를 추가로 포함하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 현재 블록의 상기 MPM 리스트 구성에 디폴트 모드를 사용하는 단계를 추가로 포함하는 방법.
  5. 제1항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 것은:
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록 및 상기 이웃 블록의 크기 인덱스들이 동일한지를 결정하는 것; 및
    상기 현재 블록 및 상기 이웃 블록의 크기 인덱스들이 동일한 경우, 상기 현재 블록의 상기 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 것을 포함하는 방법.
  6. 제1항 또는 제5항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여 상기 이웃 블록의 상기 인트라 예측 모드를 획득하는 단계를 추가로 포함하는 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여, 상기 이웃 블록의 인트라 예측 모드가 상기 MIP 모드인지를 결정하는 단계는:
    플래그 MIP_FLAG에 기초하여, 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인지를 결정하는 단계- 상기 이웃 블록의 상기 인트라 예측 모드 정보는 MIP_FLAG를 포함함 -를 포함하는 방법.
  8. MPM 리스트를 구성하기 위한 방법으로서,
    행렬-기반 인트라 예측 MIP 모드는 현재 블록에 사용되지 않고, 상기 방법은:
    이웃 블록의 인트라 예측 모드 정보를 획득하는 단계- 상기 이웃 블록은 상기 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -;
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여, 상기 이웃 블록의 인트라 예측 모드가 상기 MIP 모드인지를 결정하는 단계; 및
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 것을 스킵하거나; 또는
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 단계를 포함하는 방법.
  9. 제8항에 있어서,
    상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하는 것을 스킵하는 것은:
    상기 이웃 블록의 상기 인트라 예측 모드를 이용불가능하게 설정하는 것을 포함하는 방법.
  10. 제8항 또는 제9항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 현재 블록의 상기 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, candIntraPredModeX의 값을 -1로 설정하는 단계를 추가로 포함하는 방법.
  11. 제8항 내지 제10항 중 어느 한 항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 상기 MPM 리스트 구성에 디폴트 모드를 사용하는 단계를 추가로 포함하는 방법.
  12. 제8항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여 상기 이웃 블록의 상기 인트라 예측 모드를 획득하는 단계를 추가로 포함하는 방법.
  13. 제8항 내지 제12항 중 어느 한 항에 있어서,
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여, 상기 이웃 블록의 인트라 예측 모드가 상기 MIP 모드인지를 결정하는 단계는:
    플래그 MIP_FLAG에 기초하여, 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인지를 결정하는 단계- 상기 이웃 블록의 상기 인트라 예측 모드 정보는 MIP_FLAG를 포함함 -를 포함하는 방법.
  14. 크로마 블록의 인트라 예측 모드를 획득하기 위한 방법으로서,
    루마 블록의 인트라 예측 모드를 획득하는 단계- 상기 루마 블록은 현재 크로마 블록에 대응하는 루마 블록임 -;
    상기 루마 블록의 상기 인트라 예측 모드가 행렬-기반 인트라 예측 MIP 모드인지를 결정하는 단계; 및
    상기 루마 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 루마 블록의 상기 인트라 예측 모드를 상기 현재 크로마 블록의 인트라 예측 모드로서 사용하거나; 또는
    상기 루마 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 디폴트 모드를 상기 크로마 블록의 인트라 예측 모드로서 사용하는 단계를 포함하는 방법.
  15. 제14항에 있어서,
    상기 디폴트 모드는 평면 모드 또는 직류 성분 DC 모드를 포함하는 방법.
  16. 인트라 예측 장치로서,
    행렬-기반 인트라 예측 MIP 모드는 현재 블록에 사용되고, 상기 장치는:
    이웃 블록의 인트라 예측 모드 정보를 획득하도록 구성된 획득 모듈- 상기 이웃 블록은 상기 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -;
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여, 상기 이웃 블록의 인트라 예측 모드가 상기 MIP 모드인지를 결정하도록 구성된 결정 모듈; 및
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하지 않거나; 또는 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하도록 구성된 처리 모듈을 포함하는 인트라 예측 장치.
  17. 제16항에 있어서,
    상기 처리 모듈은 구체적으로 상기 이웃 블록의 상기 인트라 예측 모드를 이용불가능하게 설정하도록 구성되는 인트라 예측 장치.
  18. 제16항 또는 제17항에 있어서,
    상기 처리 모듈은 상기 이웃 블록의 상기 인트라 예측 모드가 상기 현재 블록의 상기 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, candMipModeX의 값을 -1로 설정하도록 추가로 구성되는 인트라 예측 장치.
  19. 제16항 내지 제18항 중 어느 한 항에 있어서,
    상기 처리 모듈은 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 현재 블록의 상기 MPM 리스트 구성에 디폴트 모드를 사용하도록 추가로 구성되는 인트라 예측 장치.
  20. 제16항에 있어서,
    상기 처리 모듈은 구체적으로: 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록 및 상기 이웃 블록의 크기 인덱스들이 동일한지를 결정하고; 상기 현재 블록 및 상기 이웃 블록의 크기 인덱스들이 동일한 경우, 상기 현재 블록의 상기 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하도록 구성되는 인트라 예측 장치.
  21. 제16항 또는 제20항에 있어서,
    상기 획득 모듈은 상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여 상기 이웃 블록의 상기 인트라 예측 모드를 획득하도록 추가로 구성되는 인트라 예측 장치.
  22. 제16항 내지 제21항 중 어느 한 항에 있어서,
    상기 결정 모듈은 구체적으로, 플래그 MIP_FLAG에 기초하여, 상기 이웃 블록의 상기 인트라 예측 모드가 MIP 모드인지를 결정하도록 구성되고, 상기 이웃 블록의 상기 인트라 예측 모드 정보는 MIP_FLAG를 포함하는 인트라 예측 장치.
  23. 인트라 예측 장치로서,
    행렬-기반 인트라 예측 MIP 모드가 현재 블록에 사용되지 않고,
    상기 장치는:
    이웃 블록의 인트라 예측 모드 정보를 획득하도록 구성된 획득 모듈- 상기 이웃 블록은 상기 현재 블록의 상부 이웃 블록 및/또는 좌측 이웃 블록을 포함함 -;
    상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여, 상기 이웃 블록의 인트라 예측 모드가 상기 MIP 모드인지를 결정하도록 구성된 결정 모듈; 및
    상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 인트라 예측 모드를 사용하지 않거나; 또는 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 현재 블록의 MPM 리스트 구성에 상기 이웃 블록의 상기 인트라 예측 모드를 사용하도록 구성된 처리 모듈을 포함하는 인트라 예측 장치.
  24. 제23항에 있어서,
    상기 처리 모듈은 구체적으로 상기 이웃 블록의 상기 인트라 예측 모드를 이용불가능하게 설정하도록 구성되는 인트라 예측 장치.
  25. 제23항 또는 제24항에 있어서,
    상기 처리 모듈은 상기 이웃 블록의 상기 인트라 예측 모드가 상기 현재 블록의 상기 MPM 리스트 구성에 사용되지 않는다는 것을 표시하기 위해, candIntraPredModeX의 값을 -1로 설정하도록 추가로 구성되는 인트라 예측 장치.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서,
    상기 처리 모듈은 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 상기 현재 블록의 상기 MPM 리스트 구성에 디폴트 모드를 사용하도록 추가로 구성되는 인트라 예측 장치.
  27. 제23항에 있어서,
    상기 획득 모듈은 상기 이웃 블록의 상기 인트라 예측 모드 정보에 기초하여 상기 이웃 블록의 상기 인트라 예측 모드를 획득하도록 추가로 구성되는 인트라 예측 장치.
  28. 제23항 내지 제27항 중 어느 한 항에 있어서,
    상기 결정 모듈은 구체적으로, 플래그 MIP_FLAG에 기초하여, 상기 이웃 블록의 상기 인트라 예측 모드가 상기 MIP 모드인지를 결정하도록 구성되고, 상기 이웃 블록의 상기 인트라 예측 모드 정보는 상기 MIP_FLAG를 포함하는 인트라 예측 장치.
  29. 인트라 예측 장치로서,
    루마 블록의 인트라 예측 모드를 획득하도록 구성된 획득 모듈- 상기 루마 블록은 현재 크로마 블록에 대응하는 루마 블록임 -;
    상기 루마 블록의 상기 인트라 예측 모드가 행렬-기반 인트라 예측 MIP 모드인지를 결정하도록 구성된 결정 모듈; 및
    상기 루마 블록의 상기 인트라 예측 모드가 상기 MIP 모드가 아닌 경우, 상기 루마 블록의 상기 인트라 예측 모드를 상기 현재 크로마 블록의 인트라 예측 모드로서 사용하거나; 또는 상기 루마 블록의 상기 인트라 예측 모드가 상기 MIP 모드인 경우, 디폴트 모드를 상기 크로마 블록의 인트라 예측 모드로서 사용하도록 구성된 처리 모듈을 포함하는 인트라 예측 장치.
  30. 제29항에 있어서,
    상기 디폴트 모드는 평면 모드 또는 직류 성분 DC 모드를 포함하는 인트라 예측 장치.
  31. 비디오 코덱으로서,
    상기 비디오 코덱은 픽처 블록을 인코딩/디코딩하도록 구성되고,
    제16항 내지 제30항 중 어느 한 항에 따른 인트라 예측 장치- 상기 인트라 예측 장치는: 현재 블록의 구성된 MPM 리스트에 기초하여 상기 현재 블록의 예측 모드를 결정하고, 그 후 상기 예측 모드에 기초하여 상기 현재 블록의 예측된 픽셀 값을 결정하도록 구성됨 -; 및
    상기 예측된 픽셀 값에 기초하여 상기 현재 블록을 재구성하도록 구성된 재구성 모듈을 포함하는 비디오 코덱.
  32. 비디오 코딩 디바이스로서,
    서로 결합되는 비휘발성 메모리 및 프로세서를 포함하고, 상기 프로세서는 상기 메모리에 저장된 프로그램 코드를 호출하여, 제1항 내지 제15항 중 어느 한 항에 따른 방법을 수행하는 비디오 코딩 디바이스.
KR1020217043040A 2019-06-05 2020-06-04 Mpm 리스트 구성 방법, 크로마 블록 인트라 예측 모드 획득 방법, 및 장치 KR20220013415A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910486183.5A CN112055200A (zh) 2019-06-05 2019-06-05 Mpm列表构建方法、色度块的帧内预测模式获取方法及装置
CN201910486183.5 2019-06-05
PCT/CN2020/094387 WO2020244579A1 (zh) 2019-06-05 2020-06-04 Mpm列表构建方法、色度块的帧内预测模式获取方法及装置

Publications (1)

Publication Number Publication Date
KR20220013415A true KR20220013415A (ko) 2022-02-04

Family

ID=73608897

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217043040A KR20220013415A (ko) 2019-06-05 2020-06-04 Mpm 리스트 구성 방법, 크로마 블록 인트라 예측 모드 획득 방법, 및 장치

Country Status (7)

Country Link
US (1) US20220094947A1 (ko)
EP (1) EP3972255A4 (ko)
JP (2) JP7346601B2 (ko)
KR (1) KR20220013415A (ko)
CN (2) CN117241014A (ko)
BR (1) BR112021024381A2 (ko)
WO (1) WO2020244579A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7362786B2 (ja) * 2019-06-13 2023-10-17 エルジー エレクトロニクス インコーポレイティド 単純化されたmpmリスト生成方法を用いる画像符号化/復号化方法、装置、及びビットストリームを伝送する方法
CN112640461A (zh) * 2019-06-25 2021-04-09 Oppo广东移动通信有限公司 映射方法、编码器、解码器以及计算机存储介质
KR20220038127A (ko) * 2019-08-22 2022-03-25 엘지전자 주식회사 매트릭스 기반 인트라 예측 장치 및 방법
WO2022218316A1 (en) * 2021-04-13 2022-10-20 Beijing Bytedance Network Technology Co., Ltd. Method, device, and medium for video processing

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102857764B (zh) * 2011-07-01 2016-03-09 华为技术有限公司 帧内预测模式处理的方法和装置
KR20130049525A (ko) * 2011-11-04 2013-05-14 오수미 잔차 블록 복원을 위한 역변환 방법
KR102186404B1 (ko) * 2012-02-29 2020-12-03 한국전자통신연구원 화면 내 예측 모드의 부호화 방법 및 복호화 방법
US10277896B2 (en) * 2016-01-22 2019-04-30 Apple Inc. Intra-frame prediction systems and methods
WO2017204427A1 (ko) * 2016-05-23 2017-11-30 가온미디어 주식회사 영상 처리 방법, 그를 이용한 영상 복호화 및 부호화 방법
EP4075798A1 (en) * 2016-10-04 2022-10-19 HFI Innovation Inc. Method and apparatus for intra chroma coding in image and video coding
KR20200074081A (ko) * 2017-11-14 2020-06-24 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
CN113748675A (zh) * 2019-04-10 2021-12-03 北京达佳互联信息技术有限公司 使用改进的基于矩阵的帧内预测编解码模式的视频编解码方法和装置
WO2020207493A1 (en) * 2019-04-12 2020-10-15 Beijing Bytedance Network Technology Co., Ltd. Transform coding based on matrix-based intra prediction
JP7414843B2 (ja) * 2019-04-24 2024-01-16 バイトダンス インコーポレイテッド 符号化映像の量子化残差差分パルス符号変調表現
EP4340367A3 (en) * 2019-04-27 2024-04-24 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods of intra prediction
US11284093B2 (en) * 2019-05-09 2022-03-22 Qualcomm Incorporated Affine linear weighted intra prediction in video coding
CN114009043A (zh) * 2019-06-03 2022-02-01 Lg电子株式会社 基于矩阵的帧内预测装置和方法

Also Published As

Publication number Publication date
US20220094947A1 (en) 2022-03-24
JP7346601B2 (ja) 2023-09-19
EP3972255A1 (en) 2022-03-23
EP3972255A4 (en) 2022-11-02
WO2020244579A1 (zh) 2020-12-10
JP2023164515A (ja) 2023-11-10
CN112055200A (zh) 2020-12-08
JP2022535859A (ja) 2022-08-10
BR112021024381A2 (pt) 2022-02-15
CN117241014A (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
CN115243039B (zh) 一种视频图像预测方法及装置
US20220094947A1 (en) Method for constructing mpm list, method for obtaining intra prediction mode of chroma block, and apparatus
CN115243048B (zh) 视频图像解码、编码方法及装置
US20210321101A1 (en) Prediction mode determining method and apparatus, encoding device, and decoding device
CN111416981B (zh) 视频图像解码、编码方法及装置
CN111277828A (zh) 视频编解码方法、视频编码器和视频解码器
US11516470B2 (en) Video coder and corresponding method
AU2024201357A1 (en) Picture prediction method and apparatus, and computer-readable storage medium
CN111432219B (zh) 一种帧间预测方法及装置
US11985303B2 (en) Context modeling method and apparatus for flag
US11902506B2 (en) Video encoder, video decoder, and corresponding methods
CN111294603B (zh) 视频编解码方法及装置
CN111277840A (zh) 变换方法、反变换方法以及视频编码器和视频解码器
AU2020205376B2 (en) Image prediction method, device, apparatus and system and storage medium
CN113615191B (zh) 图像显示顺序的确定方法、装置和视频编解码设备
CN111770337B (zh) 视频编码方法、视频解码方法及相关设备
WO2020119525A1 (zh) 一种帧间预测的方法及装置
AU2020205376A1 (en) Image prediction method, device, apparatus and system and storage medium
KR20210103561A (ko) 인터 예측 방법 및 장치
CN118075484A (zh) 基于三角预测单元模式的处理方法及装置
CN118118688A (zh) 基于三角预测单元模式的处理方法及装置