KR20220109453A - Bdpcm을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 - Google Patents

Bdpcm을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 Download PDF

Info

Publication number
KR20220109453A
KR20220109453A KR1020227022817A KR20227022817A KR20220109453A KR 20220109453 A KR20220109453 A KR 20220109453A KR 1020227022817 A KR1020227022817 A KR 1020227022817A KR 20227022817 A KR20227022817 A KR 20227022817A KR 20220109453 A KR20220109453 A KR 20220109453A
Authority
KR
South Korea
Prior art keywords
bdpcm
information
flag
block
chroma
Prior art date
Application number
KR1020227022817A
Other languages
English (en)
Inventor
전병우
박지윤
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Publication of KR20220109453A publication Critical patent/KR20220109453A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

BDPCM을 이용한 부호화/복호화를 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 기록한 저장 매체가 제공된다. 본 개시에 따른 영상 복호화 방법은 영상 복호화 장치에 의해 수행되는 영상 복호화 방법으로서, 현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 획득하는 단계, 상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 획득하는 단계, 상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 획득하는 단계, 및 상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하는 단계를 포함할 수 있다. 상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타낼 수 있다.

Description

BDPCM을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
본 개시는 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체에 관한 것이다. 보다 상세하게는 BDPCM(Block-based Differential Pulse Coded Modulation)을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체에 관한 것이다.
최근 HD(High Definition) 영상 및 UHD(Ultra High Definition) 영상과 같은 고해상도, 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질이 될수록 기존의 영상 데이터에 비해 상대적으로 데이터량이 증가한다. 따라서, 기존의 유무선 광대역 회선과 같은 매체를 이용하여 영상 데이터를 전송하거나 기존의 저장 매체를 이용해 영상 데이터를 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 영상 데이터가 고해상도, 고품질화 됨에 따라 발생하는 이러한 문제들을 해결하기 위해서는 고해상도 및 고화질을 갖는 영상에 대한 고효율 영상 부호화(encoding)/복호화(decoding) 기술이 요구된다.
영상 압축 기술로 현재 픽처의 이전 또는 이후 픽처로부터 현재 픽처에 포함된 화소 값을 예측하는 화면 간 예측 기술, 현재 픽처 내의 화소 정보를 이용하여 현재 픽처에 포함된 화소 값을 예측하는 화면 내 예측 기술, 잔여 신호의 에너지를 압축하기 위한 변환 및 양자화 기술, 출현 빈도가 높은 값에 짧은 부호를 할당하고 출현 빈도가 낮은 값에 긴 부호를 할당하는 엔트로피 부호화 기술 등 다양한 기술이 존재하고 이러한 영상 압축 기술을 이용해 영상 데이터를 효과적으로 압축하여 전송 또는 저장할 수 있다.
본 개시는 압축 효율이 향상된 영상 부호화/복호화 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 개시는 BDPCM 관련 정보를 효율적으로 시그널링하는 영상 부호화/복호화 방법 및 장치를 제공하는 것을 목적으로 한다.
또한, 본 개시는 본 개시에 따른 영상 부호화 방법 또는 영상 부호화 장치에 의해 생성된 비트스트림을 전송하는 방법을 제공하는 것을 목적으로 한다.
또한, 본 개시는 본 개시에 따른 영상 부호화 방법 또는 영상 부호화 장치에 의해 생성된 비트스트림을 저장한 기록 매체를 제공하는 것을 목적으로 한다.
또한, 본 개시는 본 개시에 따른 영상 복호화 장치에 의해 수신되고 복호화되어 영상의 복원에 이용되는 비트스트림을 저장한 기록 매체를 제공하는 것을 목적으로 한다.
본 개시에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 개시의 일 양상에 따른 영상 복호화 장치에 의해 수행되는 영상 복호화 방법은, 현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 획득하는 단계, 상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 획득하는 단계, 상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 획득하는 단계, 및 상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하는 단계를 포함할 수 있다. 상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타낼 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 제1 정보는 시퀀스 레벨에서 전송될 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 제2 정보는 CU 레벨에서 전송될 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 제2 정보는, 상기 제1 정보가 상기 현재 영상에 대해 BDPCM이 적용 가능함을 나타내는 경우에 획득될 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 제3 정보는, 상기 제2 정보가 상기 현재 블록에 대해 상기 BDPCM이 적용됨을 나타내는 경우에 획득될 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 제2 정보는, 상기 현재 블록의 크기가 소정의 크기 이하인 경우에 획득될 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 현재 블록이 루마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기일 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 현재 블록이 크로마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기이고, 상기 현재 블록의 크기는 상기 현재 블록에 대응하는 루마 성분 블록의 크기와 크로마 스케일링 팩터(chroma scaling factor)에 기반하여 결정될 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 크로마 스케일링 팩터는 2일 수 있다.
본 개시에 따른 영상 복호화 방법에 있어서, 상기 크로마 스케일링 팩터는 상기 현재 영상의 컬러 포맷에 기반하여 결정될 수 있다.
본 개시의 다른 양상에 따른 영상 복호화 장치는 메모리 및 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는 현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 획득하고, 상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 획득하고, 상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 획득하고, 상기 제3 정보에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용할 수 있다. 상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타낼 수 있다.
본 개시의 또 다른 양상에 따른 영상 부호화 장치에 의해 수행되는 영상 부호화 방법은, 현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 부호화하는 단계, 상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 부호화하는 단계, 상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 부호화하는 단계, 및 상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하는 단계를 포함할 수 있다. 상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타낼 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 제1 정보는 시퀀스 레벨에서 부호화될 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 제2 정보는 CU 레벨에서 부호화될 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 제2 정보는, 상기 제1 정보가 상기 현재 영상에 대해 BDPCM이 적용 가능함을 나타내는 경우에 부호화될 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 제3 정보는, 상기 제2 정보가 상기 현재 블록에 대해 상기 BDPCM이 적용됨을 나타내는 경우에 부호화될 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 제2 정보는, 상기 현재 블록의 크기가 소정의 크기 이하인 경우에 부호화될 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 현재 블록이 루마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기일 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 현재 블록이 크로마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기이고, 상기 현재 블록의 크기는 상기 현재 블록에 대응하는 루마 성분 블록의 크기와 크로마 스케일링 팩터(chroma scaling factor)에 기반하여 결정될 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 크로마 스케일링 팩터는 2일 수 있다.
본 개시에 따른 영상 부호화 방법에 있어서, 상기 크로마 스케일링 팩터는 상기 현재 영상의 컬러 포맷에 기반하여 결정될 수 있다.
본 개시의 다른 양상에 따른 영상 부호화 장치는 메모리 및 적어도 하나의 프로세서를 포함할 수 있다. 상기 적어도 하나의 프로세서는 현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 부호화하고, 상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 부호화하고, 상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 부호화하고, 상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용할 수 있다. 상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타낼 수 있다.
본 개시의 또 다른 양상에 따른 전송 방법은, 본 개시의 영상 부호화 장치 또는 영상 부호화 방법에 의해 생성된 비트스트림을 전송할 수 있다.
본 개시의 또 다른 양상에 따른 컴퓨터 판독 가능한 기록 매체는, 본 개시의 영상 부호화 방법 또는 영상 부호화 장치에 의해 생성된 비트스트림을 저장할 수 있다.
본 개시의 또 다른 양상에 따른 컴퓨터 판독 가능한 기록 매체는, 본 개시의 영상 복호화 방법 또는 영상 복호화 장치에 의해 수신되고 복호화되어 영상을 복원하는데 이용되는 비트스트림을 저장할 수 있다.
본 개시에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 개시의 상세한 설명의 예시적인 양상일 뿐이며, 본 개시의 범위를 제한하는 것은 아니다.
본 개시에 따르면, 압축 효율이 향상된 영상 부호화/복호화 방법 및 장치가 제공될 수 있다.
또한, 본 개시에 따르면, BDPCM 관련 정보를 효율적으로 시그널링하는 영상 부호화/복호화 방법 및 장치가 제공될 수 있다.
또한, 본 개시에 따르면, 본 개시에 따른 영상 부호화 방법 또는 영상 부호화 장치에 의해 생성된 비트스트림을 전송하는 방법이 제공될 수 있다.
또한, 본 개시에 따르면, 본 개시에 따른 영상 부호화 방법 또는 영상 부호화 장치에 의해 생성된 비트스트림을 저장한 기록 매체가 제공될 수 있다.
또한, 본 개시에 따르면, 본 개시에 따른 영상 복호화 장치에 의해 수신되고 복호화되어 영상의 복원에 이용되는 비트스트림을 저장한 기록 매체가 제공될 수 있다.
본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 개시에 따른 실시예가 적용될 수 있는 영상 부호화 장치의 일 예를 도시한 블록도이다.
도 2는 본 개시에 따른 실시예가 적용될 수 있는 영상 복호화 장치의 일 예를 도시한 블록도이다.
도 3은 BDPCM 기술을 사용하는 부호화 장치의 구성을 개략적으로 나타낸 도면이다.
도 4는 BDPCM 기술을 사용하는 복호화 장치의 구성을 개략적으로 나타낸 도면이다.
도 5는 종래 기술에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 6은 종래 기술에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 7은 변환 블록에 대한 신택스 요소들을 시그널링하는 TU 신택스 레벨에서 BDPCM 플래그가 사용되는 예를 도시한 도면이다.
도 8은 본 개시의 실시예 1에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 9는 본 개시의 실시예 1에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 10은 본 개시의 실시예 2에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 11은 본 개시의 실시예 2에 따른 TU 레벨의 신택스 구조를 도시한 도면이다.
도 12는 본 개시의 실시예 3에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 13은 본 개시의 실시예 3에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 14는 본 개시의 실시예 3에 따른 크로마 채널에 대한 CU 레벨 신택스 요소를 파싱하는 방법을 설명하기 위한 도면이다.
도 15는 본 개시의 실시예 4에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 16은 본 개시의 실시예 4에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 17은 본 개시의 실시예 4에 따른 TU 레벨의 신택스 구조를 설명하기 위한 도면이다.
도 18은 본 개시의 실시예 5에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 19는 본 개시의 실시예 6에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 20은 본 개시의 실시예 7에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 21은 본 개시의 실시예 7에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 22는 본 개시의 실시예 7에 따른 CU 레벨의 신택스 요소를 파싱하는 과정을 설명하기 위한 도면이다.
도 23은 본 개시의 실시예 7에 따른 TU 레벨의 신택스 구조를 설명하기 위한 도면이다.
도 24는 본 개시에 따라 BDPCM 관련 정보를 결정하고 BDPCM을 수행하는 영상 부호화 방법을 설명하기 위한 흐름도이다.
도 25는 본 개시에 따라 BDPCM 관련 정보를 획득하고 BDPCM을 수행하는 영상 복호화 방법을 설명하기 위한 흐름도이다.
이하, 도면을 참조하여 본 개시의 실시 형태에 대하여 구체적으로 설명한다. 본 개시의 실시예를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
어떤 구성 요소가 다른 구성 요소에 “연결되어” 있다거나 “접속되어” 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있으나, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 아울러, 본 개시에서 특정 구성을 “포함”한다고 기술하는 내용은 해당 구성 이외의 구성을 배제하는 것이 아니며, 추가적인 구성이 본 개시의 실시 또는 본 개시의 기술적 사상의 범위에 포함될 수 있음을 의미한다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 개시의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
또한 본 개시의 실시예에 나타나는 구성부들은 서로 다른 특징적인 기능들을 나타내기 위해 독립적으로 도시되는 것으로, 각 구성부들이 분리된 하드웨어나 하나의 소프트웨어 구성단위로 이루어짐을 의미하지 않는다. 즉, 각 구성부는 설명의 편의상 각각의 구성부로 나열하여 포함한 것으로 각 구성부 중 적어도 두 개의 구성부가 합쳐져 하나의 구성부로 이루어지거나, 하나의 구성부가 복수 개의 구성부로 나뉘어져 기능을 수행할 수 있고 이러한 각 구성부의 통합된 실시예 및 분리된 실시예도 본 개시의 본질에서 벗어나지 않는 한 본 개시의 권리범위에 포함된다.
또한, 일부의 구성 요소는 본 개시에서 본질적인 기능을 수행하는 필수적인 구성 요소는 아니고 단지 성능을 향상시키기 위한 선택적 구성 요소일 수 있다. 본 개시는 단지 성능 향상을 위해 사용되는 구성 요소를 제외한 본 개시의 본질을 구현하는데 필수적인 구성부만을 포함하여 구현될 수 있고, 단지 성능 향상을 위해 사용되는 선택적 구성 요소를 제외한 필수 구성 요소만을 포함한 구조도 본 개시의 권리범위에 포함된다.
도 1은 본 개시에 따른 실시예가 적용될 수 있는 영상 부호화 장치의 일 예를 도시한 블록도이다.
스케일러블(scalable) 비디오 부호화/복호화 방법 또는 장치는 스케일러빌리티(scalability)를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장(extension)에 의해 구현될 수 있으며, 도 1의 블록도는 스케일러블 비디오 부호화 장치의 기초가 될 수 있는 영상 부호화 장치의 일 실시예를 나타낸다.
도 1을 참조하면, 영상 부호화 장치(100)는 예측부, 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조 픽처 버퍼(190)를 포함할 수 있다.
영상 부호화 장치(100)의 예측부는 인트라 예측을 수행하는 인트라 예측부(120), 인터 예측을 수행하는 인터 예측부 및 인트라 카피 예측(intra block copy(IBC) prediction)을 수행하는 IBC 예측부를 포함할 수 있다. 인터 예측부는 움직임 예측부(111) 및 움직임 보상부(112)를 포함할 수 있다. 현재 블록의 예측 모드에 따라 스위치(115)가 인터 예측부와 인트라 예측부 또는 IBC 예측부(미도시) 사이에서 전환될 수 있다. 현재 블록에 대해 인터 예측, 인트라 예측 또는 IBC 예측이 수행됨으로써 현재 블록의 예측 블록이 생성될 수 있다. 영상 부호화 장치(100)는 입력 영상 내 현재 블록에 대한 예측 블록을 생성한 후, 입력 블록과 예측 블록의 차분을 부호화할 수 있다.
현재 블록의 예측 모드가 인트라 모드인 경우, 인트라 예측부(120)는 현재 블록 주변의 이미 부호화/복호화된 블록의 화소값을 이용하여 공간적 예측을 수행하여 현재 블록의 예측 블록을 생성할 수 있다.
현재 블록의 예측 모드가 인터 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 픽처 버퍼(190)에 저장되어 있는 참조 픽처에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 현재 블록의 움직임 벡터를 구할 수 있다. 움직임 보상부(112)는 움직임 벡터와 참조 픽처 버퍼(190)에 저장되어 있는 참조 픽처를 이용하여 움직임 보상을 수행함으로써 현재 블록의 예측 블록을 생성할 수 있다.
현재 블록의 예측 모드가 IBC 모드인 경우, IBC 예측부는 현재 픽처 내에서 움직임 예측, 즉 탐색을 수행하여 현재 블록과 유사한 영역을 판별한 후, 이를 현재 블록에 대한 예측 블록으로 이용할 수 있다. 또한, 해당 예측 블록의 위치를 나타내는 블록 벡터를 구할 수 있다.
감산기(125)는 입력 블록(현재 블록)과 생성된 예측 블록의 차분에 의해 잔여 블록(residual block)을 생성할 수 있다. 변환부(130)는 잔여 블록에 대해 변환(transform)을 수행하여 변환 계수(transform coefficient)를 출력할 수 있다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 파라미터에 따라 양자화하여 양자화된 계수(quantized coefficient)를 출력할 수 있다. 변환 및 양자화 중 적어도 하나는 현재 블록의 부호화 모드에 따라 생략될 수 있다.
엔트로피 부호화부(150)는, 양자화부(140)에서 산출된 값 또는 부호화 과정에서 산출된 부호화 파라미터 값 등을 기초로, 심볼(symbol)을 확률 분포에 따라 엔트로피 부호화하여 비트스트림(bitstream)을 출력할 수 있다. 출력된 비트스트림은 컴퓨터 판독가능한 기록 매체에 저장되거나, 유무선의 전송 채널을 통해 외부(예컨대, 영상 복호화 장치)로 전송될 수 있다.
엔트로피 부호화 방법은 다양한 값을 갖는 심볼을 입력 받아, 통계적 중복성을 제거하면서, 복호 가능한 2진수의 열로 표현하는 방법이다. 여기서, 심볼이란 부호화/복호화 대상 구문 요소(syntax element) 및 부호화 파라미터(coding parameter), 잔여 신호(residual signal)의 값 등을 의미할 수 있다. 부호화 파라미터는 부호화 및 복호화에 필요한 매개 변수로서, 구문 요소와 같이 부호화 장치에서 부호화되어 복호화 장치로 전달되는 정보뿐만 아니라, 부호화 혹은 복호화 과정에서 유추될 수 있는 정보를 포함할 수 있다. 또는, 부호화 파라미터는 영상을 부호화하거나 복호화할 때 필요한 정보를 의미할 수 있다. 부호화 파라미터는 예를 들어 인트라/인터 예측모드, 이동/움직임 벡터, 참조 픽처 색인, 부호화 블록 패턴, 잔여 신호 유무, 변환 계수, 양자화된 변환 계수, 양자화 파라미터, 블록 크기, 블록 분할 정보 등의 값 또는 통계를 포함할 수 있다. 또한 잔여 신호는 원신호와 예측 신호의 차이를 의미할 수 있다. 또는, 잔여 신호는 원신호와 예측 신호의 차이가 변환(transform)된 형태의 신호를 의미할 수도 있다. 또는, 잔여 신호는 원신호와 예측 신호의 차이가 변환되고 양자화된 형태의 신호를 의미할 수도 있다. 잔여 신호는 블록 단위에서는 잔여 블록이라 호칭할 수 있다.
엔트로피 부호화가 적용되는 경우, 높은 발생 확률을 갖는 심볼에 적은 수의 비트가 할당되고 낮은 발생 확률을 갖는 심볼에 많은 수의 비트가 할당되어 심볼이 표현됨으로써, 부호화 대상 심볼들에 대한 비트열의 크기가 감소될 수 있다. 따라서 엔트로피 부호화를 통해서 영상 부호화의 압축 성능이 높아질 수 있다.
엔트로피 부호화를 위해 지수 골룸(exponential golomb), CAVLC(Context-Adaptive Variable Length Coding), CABAC(Context-Adaptive Binary Arithmetic Coding)과 같은 부호화 방법이 사용될 수 있다. 예를 들어, 엔트로피 부호화부(150)에는 가변 길이 부호화(VLC: Variable Lenghth Coding/Code) 테이블과 같은 엔트로피 부호화를 수행하기 위한 테이블이 저장될 수 있다. 엔트로피 부호화부(150)는 저장된 가변 길이 부호화(VLC) 테이블을 사용하여 엔트로피 부호화를 수행할 수 있다. 또한 엔트로피 부호화부(150)는 대상 심볼의 이진화(binarization) 방법 및 대상 심볼/빈(bin)의 확률 모델(probability model)을 도출한 후, 도출된 이진화 방법 또는 확률 모델을 사용하여 엔트로피 부호화를 수행할 수도 있다.
양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환될 수 있다. 역양자화 및 역변환 중 적어도 하나는 현재 블록의 부호화 모드에 따라 생략될 수 있다. 역양자화/역변환된 계수는 가산기(175)를 통해 예측 블록과 더해짐으로써 복원 블록이 생성될 수 있다.
복원 블록은 필터부(180)에 입력될 수 있다. 필터부(180)는 디블록킹 필터(deblocking filter), SAO(Sample Adaptive Offset), ALF(Adaptive Loop Filter) 중 적어도 하나 이상을 복원 블록 또는 복원 픽처에 적용할 수 있다. 필터부(180)를 거친 복원 블록은 참조 픽처 버퍼(190)에 저장될 수 있다.
도 2는 본 개시에 따른 실시예가 적용될 수 있는 영상 복호화 장치의 일 예를 도시한 블록도이다.
도 1에서 상술한 바와 같이 스케일러블 비디오 부호화/복호화 방법 또는 장치는 스케일러빌리티를 제공하지 않는 일반적인 영상 부호화/복호화 방법 또는 장치의 확장에 의해 구현될 수 있으며, 도 2의 블록도는 스케일러블 비디오 복호화 장치의 기초가 될 수 있는 영상 복호화 장치의 일 실시예를 나타낸다.
도 2를 참조하면, 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 예측부, 필터부(260) 및 참조 픽처 버퍼(270)를 포함할 수 있다.
영상 복호화 장치(200)는 영상 부호화 장치(100)에서 생성된 비트스트림을 입력 받아 인트라 모드, 인터 모드 또는 IBC 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력할 수 있다. 영상 복호화 장치(200)는 컴퓨터 판독 가능한 기록 매체에 저장된 비트스트림을 독출함으로써 영상 부호화 장치(100)에서 생성된 비트스트림을 수신할 수 있다. 또는, 영상 복호화 장치(200)는 유무선의 전송 채널을 통해 영상 부호화 장치(100)에서 생성된 비트스트림을 수신할 수 있다.
영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 복원된 잔여 블록(residual block)을 얻고, 예측 블록을 생성한 후, 복원된 잔여 블록과 예측 블록을 더함으로써 재구성된 블록, 즉 복원 블록을 생성할 수 있다.
엔트로피 복호화부(210)는, 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여, 양자화된 계수(quantized coefficient) 형태의 심볼을 포함한 심볼들을 생성할 수 있다. 엔트로피 복호화 방법은 2진수의 열을 입력 받아 각 심볼들을 생성하는 방법이다. 엔트로피 복호화 방법은 상술한 엔트로피 부호화 방법과 유사하다.
양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환된 결과, 복원된 잔여 블록(residual block)이 생성될 수 있다. 역양자화 및 역변환 중 적어도 하나는 현재 블록의 부호화 모드에 따라 생략될 수 있다.
예측부는 인트라 예측을 수행하는 인트라 예측부(240), 인터 예측을 수행하는 움직임 보상부(250), 인트라 카피 예측(intra block copy(IBC) prediction)을 수행하는 IBC 예측부(미도시)를 세부적인 구성 요소로 포함할 수 있다.
현재 블록의 예측 모드가 인트라 모드인 경우, 인트라 예측부(240)는 현재 블록 주변의 이미 복호화된 블록의 화소값을 이용하여 공간적 예측을 수행함으로써 현재 블록의 예측 블록을 생성할 수 있다.
현재 블록의 예측 모드가 인터 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 픽처 버퍼(270)에 저장되어 있는 참조 픽처를 이용하여 움직임 보상을 수행함으로써 현재 블록의 예측 블록을 생성할 수 있다.
현재 블록의 예측 모드가 IBC 모드인 경우, IBC 예측부는 비트스트림으로부터 획득된 블록 벡터를 이용하여 현재 픽처 내에서 현재 블록에 대한 예측 블록을 생성할 수 있다.
복원된 잔여 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)에 입력될 수 있다. 필터부(260)는 디블록킹 필터, SAO, ALF 중 적어도 하나 이상을 복원 블록 또는 복원 픽처에 적용할 수 있다. 필터부(260)는 필터링된 영상을 복원 영상으로서 출력할 수 있다. 복원 영상은 참조 픽처 버퍼(270)에 저장되어 화면 간 예측에 사용될 수 있다.
상기 영상 복호화 장치(200)에 포함되어 있는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 예측부, 필터부(260) 및 참조 픽처 버퍼(270) 중 영상의 복호화에 직접적으로 관련된 구성요소들, 예컨대, 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 등을 다른 구성요소와 구분하여 복호화부 또는 디코딩부로 표현할 수 있다.
또한, 영상 복호화 장치(200)는 비트스트림에 포함되어 있는 인코딩된 영상에 관련된 정보를 파싱하는 파싱부(미도시)를 더 포함할 수 있다. 파싱부는 엔트로피 복호화부(210)를 포함할 수도 있고, 엔트로피 복호화부(210)에 포함될 수도 있다. 이러한 파싱부는 또한 디코딩부의 하나의 구성요소로 구현될 수도 있다.
본 개시는 4K 또는 8K와 같은 고해상도 영상에 대해 예측 부호화와 다양한 변환, 그리고 블록 DPCM (Block-based Differential Pulse Coded Modulation, BDPCM) 기술 등을 적용하여 영상을 부호화/복호화하는 방법에 관한 것이다. 보다 구체적으로, 본 개시에 따르면, BDPCM 기술을 위하여 결정된 부호화 결정 정보(BDPCM 관련 정보)를 응용 및 전송 채널, 원하는 부호화 성능 등에 따라, 채널 간에 공유하거나, 각 채널 간에 독립적으로 사용하도록 부호화할 수 있다. 또한, 본 개시에 따르면, 이렇게 부호화된 압축 비트스트림 또는 압축 데이터를 복호화하기 위하여 BDPCM에 관한 부호화 결정 정보(BDPCM 관련 정보)를 채널 간에 공유하거나 채널별로 독립적으로 사용할 수 있다. 본 개시에 따르면, 종래에 비해 압축률 및 화질을 개선할 수 있다.
영상을 부호화/복호화할 때, 일반적으로 변환을 수행하지만, 경우에 따라서는 변환을 수행하지 않는 것이 유리할 수 있다. 특히 블록 내의 대부분의 화소들이 유사한 값을 갖지만 일부 화소들에서 불연속성이 심하게 나타나는 경우, 변환을 수행하면 오히려 모든 변환 계수의 값이 큰 값을 갖게 된다. 즉, 에너지 모임 현상(Energy Compaction)이 뚜렷이 나타나지 않는다. 이러한 경우는 변환을 생략하는 것이 압축에 보다 유리할 수 있다. 특히, 화소 값의 변화도가 공간적으로 집중되어 있는 영상에 대해 종래 기술을 적용하는 경우 압축률 및 화질 저하의 문제가 심하게 발생한다. 이런 경우 특히 본 개시의 BDPCM 기술을 사용하면 영상 압축 효율을 증가시키거나 화질을 개선할 수 있다.
BDPCM 관련 정보를 채널간 공유하거나 채널간 독립적으로 사용하도록 부호화하는 본 개시의 실시예에 따르면, BDPCM의 수행 여부를 지시하는 BDPCM 플래그 (e.g. bdpcm_flag) 정보를 변환 생략 플래그(transform_skip_flag)와 같이 전송되도록 함으로써, 압축률을 높이면서도 동시에 좋은 화질을 추가적으로 얻을 수 있는 효과가 있다.
본 개시에서, 채널간 공유할 복호화에 필요한 부호화 정보를 설명함에 있어, 동작 설명 및 도면, 그리고 수학식 등 본 개시의 전체적인 설명과 이해의 편의를 위해, 채널간 공유할 복호화에 필요한 부호화 정보로서 bdpcm_flag를 예로 사용하여 설명한다. 그러나, bdpcm_flag는 구체적인 하나의 예에 불과할 뿐, 본 개시가 적용되는 채널간 공유할 복호화에 필요한 부호화 정보가 bdpcm_flag만을 의미하는 것이 아니다. 또한, 공유할 부호화 정보로 bdpcm_flag를 예시하였으나, BDPCM을 수행하기 위해, 또는 BDPCM을 적용하여 압축된 데이터를 복호화하기 위해, bdpcm_flag 외에도, BDPCM의 예측 방향에 관한 정보도 필요하다. 따라서, 설명의 편의상 bdpcm_flag 만을 언급하는 경우에도 필요시 BDPCM을 위한 예측 방향 정보도 상술한 부호화 정보에 포함되는 것으로 이해할 필요가 있다.
또한, 본 개시에 따른 복호화에 필요한 부호화 정보를 공유할 채널을 설명함에 있어, YCbCr 컬러 공간을 예시로 설명한다. 그러나 YCbCr은 컬러 공간에 대한 구체적인 하나의 예이며, 본 개시에서 대상으로 하는 컬러 공간은 YUV, XYZ, RGB 등등 다양한 컬러 공간들을 포함할 수 있다. 또한, 컬러 공간을 구성하는 각 채널을 지칭하기 위한 채널 인덱스 cIdx가 사용될 수 있다. cIdx는 예컨대, YCbCr 과 YUV에 대하여는 표시된 채널 순서대로 0/1/2 (또는 0/2/1)의 값을 가질 수 있다. 또한, RGB 및 XYZ에 대하여는 표시된 채널 순서대로 cIdx가 1/0/2 (또는 2/0/1)의 값을 가질 수 있다. 예컨대, YCbCr의 컬러 공간에서, Y 채널의 cIdx는 0, Cb 채널의 cIdx 및 Cr 채널의 cIdx는 각각 1 및 2 (또는 2 및 1)일 수 있다. 예컨대, RGB의 컬러 공간에서, R 채널의 cIdx는 1 (또는 2), G 채널의 cIdx 및 B 채널의 cIdx는 각각 0 및 2 (또는 0 및 1)일 수 있다.
최근 UHD(Ultra High Definition) 영상과 같은 고해상도와 고품질의 영상에 대한 수요가 다양한 응용 분야에서 증가하고 있다. 영상 데이터가 고해상도, 고품질화 될수록 기존의 영상 데이터에 비해 데이터량이 상대적으로 증가하기 때문에, 유무선 광대역 회선과 같은 통신매체나 위성/지상파/IP망/무선/케이블/이동 통신망 등의 다양한 방송 매체를 이용하여 영상 데이터를 전송하거나 CD/DVD/USB/HD-DVD 등의 다양한 저장 매체를 이용해 영상 데이터를 저장하는 경우, 전송 비용과 저장 비용이 증가하게 된다. 영상 데이터가 점차로 더욱 고해상도, 고품질화 됨에 따라 필연적으로 더욱 심화되어 발생하는 이러한 문제들을 해결하며 더 높은 해상도 및 화질을 갖는 영상에 대한 고효율 영상 부호화(encoding)/복호화(decoding) 기술이 요구된다.
이런 목적으로 개발되었거나 개발되고 있는 영상 압축 기술로서, 현재 픽처의 이전 또는 이후 픽처로부터 현재 픽처에 포함된 화소 값을 예측하는 화면 간 예측 기술, 현재 픽처 내의 화소 정보를 이용하여 현재 픽처에 포함된 화소 값을 예측하는 화면 내 예측 기술, 예측 오차로 남는 잔여 신호의 에너지를 압축하기 위한 변환 및 양자화 기술, 출현 빈도가 높은 값에 짧은 부호를 할당하고 출현 빈도가 낮은 값에 긴 부호를 할당하는 엔트로피 부호화, 산술 부호화 기술 등 다양한 기술이 존재하며, 이러한 영상 압축 기술을 이용해 영상 데이터를 효과적으로 압축하여 전송 또는 저장할 수 있다.
영상의 부호화에 사용될 수 있는 압축 기술은 매우 다양하다. 또한, 부호화 대상 영상의 성질에 따라 특정 기술이 다른 기술에 비하여 유리할 수 있다. 따라서 부호화기는 복수 개의 다양한 압축 기술들을 부호화 대상 블록에 대하여 사용할지 사용하지 않을지 여부를 적응적으로 결정함으로써 부호화 대상 블록에 대한 가장 유리한 압축을 수행할 수 있다. 선택 가능한 여러 압축 기술들 중, 부호화 대상 블록에 대하여 가장 유리한 압축 기술을 선택하기 위하여, 부호화기는 통상 율-왜곡 최적화(Rate-Distortion Optimization, RDO)를 수행한다. 영상을 부호화하기 위하여 선택할 수 있는 다양한 부호화 기술들 중 어떤 것이 율-왜곡 측면에서 가장 최적인지 미리 알 수 없다. 따라서, 부호화기는 가능한 모든 부호화 기술들의 조합들의 각각을 이용하여 부호화 대상 블록에 대한 부호화(또는 간이화된 부호화)를 수행하고, 이에 대한 율-왜곡값들을 산출한 후, 가장 작은 율-왜곡값을 갖는 부호화 기술을 해당 부호화 대상 블록에 대한 최종 부호화 기술로 결정할 수 있다. 부호화기는 RDO 또는 여타의 방법에 따라 결정된 부호화 기술을 비트스트림에 기록하고, 복호화기는 비트스트림을 통해 시그널링된 정보를 파싱하여 복호화 대상 블록에 적용된 부호화 기술을 식별함으로써 부호화에 대응하는 정확한 역과정(복호화)을 수행할 수 있다. 이 때, 비트스트림을 통해 시그널링되는 상기 정보를 “복호화에 필요한 부호화 정보”, 또는 더욱 간단히 “부호화 정보”, 또는 “부호화 결정 정보”라고 호칭할 수 있다. 특히 BDPCM 기술의 사용 여부를 지시하는 부호화 정보인 bdpcm_flag를 채널간 공유하거나 채널별로 독립적으로 사용하도록 함으로써, 응용에 따른 효율적인 부호화를 수행할 수 있다.
영상의 YUV, YCbCr 또는 RGB, XYZ 등의 컬러 공간을 구성하는 각 채널은 일반적으로는 채널(또는 같은 의미로 컬러) 상호간에 항상 같거나 유사한 성질을 갖지는 않는다. 따라서, 압축률 향상의 측면에서는 각 채널별로 독립적인 부호화 결정들을 내리는 것이 일반적으로 더 우수한 성능을 보일 수 있다. 상기에 언급한 부호화 결정의 한 가지 예로서, 부호화 대상 블록에 대해 BDPCM을 수행할지 여부에 대한 결정이 있다. 또한 그 결정은 bdpcm_flag와 같은 신택스 요소로서 부호화되어 시그널링될 수 있다. 즉, 부호화기는 부호화 대상 블록 별로 BDPCM을 수행하는지 수행하지 않는지를 결정하고, 이를 지시하는 bdpcm_flag를 부호화 정보로서 비트스트림에 기록(부호화)할 수 있다. 또한 BDPCM을 수행하기 위하여는 (또는 BDPCM을 적용하여 압축된 데이터를 복호화하려면) BDPCM 기술의 수행 여부를 지시하는 bdpcm_flag 외에도, BDPCM을 위한 예측 방향 정보도 시그널링될 수 있다.
종래의 영상 압축 기술을 적용할 경우, 영상 압축 부호화에 있어 변환은 항상 수행되어 왔다. 그러나 압축하고자 하는 해당 영상 블록내의 공간적 화소값의 변화도가 매우 크거나 특히 그 변화가 국부적으로 매우 한정되어 있는 경우, 변환을 적용하여도 영상 에너지가 저주파로 집중하는 정도가 크지 않을 수 있다. 이 경우, 오히려 비교적 큰 값을 갖는 고주파 영역의 변환 계수가 매우 많이 발생할 수 있다. 따라서, 변환 후 양자화 과정을 통하여 저주파 신호 성분은 주로 유지하고 고주파 신호 성분은 없애 버리거나 양자화를 강하게 적용하여 데이터량을 줄이는 변환 양자화 기술을 적용할 경우, 심각한 화질 저하가 초래될 수 있다. 특히, 공간적 화소값의 변화가 매우 크거나 국부적으로 매우 한정된 곳에 화소 값의 변화가 집중된 경우, 이러한 문제점은 더욱 크다. 이런 문제를 해결하기 위하여 영상 블록에 일률적으로 변환을 수행하는 대신, 변환 없이 공간 영역에서 화소값을 직접 부호화하는 것도 가능하다. 이 기술에 따르면, 부호화기는 변환 블록별로 변환의 수행 여부 또는 생략 여부를 결정하고, 이 결정에 따라 변환을 수행 또는 생략하여 부호화를 수행할 수 있다. 변환의 수행 여부 또는 생략 여부를 나타내는 정보는 비트스트림에 포함되어 부호화될 수 있다.
변환 생략이 유리한 경우는 스크린 컨텐츠와 같은 인공적인 영상의 경우가 많다. 인공적인 영상의 경우, 변환 생략뿐만 아니라 블록별로 DPCM을 수행하는 BDPCM을 수행하는 것이 더 유리한 경우가 많다.
예측을 통하여 얻어진 예측 오차, 즉 잔차 신호는 여전히 높은 공간적 연관성을 가질 수 있다. BDPCM 기술은, 이러한 높은 공간적 연관성을 고려하여, 블록 내 현재 화소와 가장 인접한 블록 내 화소를 예측 화소로서 사용하여 현재 화소를 예측하는 기술이다. BDPCM 기술은 특히 스크린 컨텐츠와 같은 인공 영상에서 유리한 효과를 보이는 경우가 많다. 한편, 블록 별로 BDPCM 기술의 수행 여부를 지시하는 플래그 정보가 필요하다. 이러한 플래그 정보의 예가 bdpcm_flag이다. 즉, bdpcm_flag가 제1 값(e.g. 1)인 경우, 해당 블록에 대해 BDPCM 기술이 사용됨을 나타낼 수 있다. 또한, bdpcm_flag가 제2 값(e.g. 0)인 경우, 해당 블록에 대해 BDPCM 기술이 사용되지 않음을 나타낼 수 있다.
도 3은 BDPCM 기술을 사용하는 부호화 장치의 구성을 개략적으로 나타낸 도면이다.
도 3에 도시된 바와 같이, 부호화 장치는 양자화기(Quantizer), BDPCM 예측기(BDPCM) 및 엔트로피 부호화기(Entropy Coder)를 포함할 수 있다. 도 3의 양자화기 및 엔트로피 부호화기는 각각 도 1의 양자화부(140) 및 엔트로피 부호화부(150)에 대응될 수 있다.
BDPCM이 사용될 경우(if bdpcm_flag = 1), 양자화된 잔차 신호(dz)에 대하여 블록 별로 수평(Horizontal) 또는 수직(Vertical) 방향 BDPCM 예측을 수행하여 BDPCM 예측 잔차 신호를 계산할 수 있다. 부호화 대상 블록의 크기가 M (높이) × N (폭) 이며, 이 블록 내의 (i, j) 공간 화소 위치 (0≤i≤M-1, 0≤j≤N-1)에서의 양자화된 잔차 신호를 Q(ri,j)이라고 하자. BDPCM 기술은 양자화된 잔차 신호(dz)에 블록 DPCM을 적용하여 BDPCM 예측 잔차 신호를 얻는다. 이때, (i, j) 위치의 BDPCM 예측 잔차 신호를 r'i,j 라고 할 때, r'i,j는 아래의 수학식 1과 같이 계산될 수 있다. 여기서, ri,j는 인트라 예측에 의해 생성된 예측 블록과 현재 블록(원본 블록)과의 차분에 해당하는 잔차 신호(인트라 예측 오차 신호)를 의미하며, Q(.)는 괄호안의 값이 양자화된 값을 의미한다. 따라서, Q(ri,j)는 양자화된 인트라 예측 오차 신호를 의미한다.
Figure pct00001
부호화 대상 블록의 bdpcm_flag가 1이면 상기 수학식 1에 따라 BDPCM 예측이 수행될 수 있다. 이는 도 3의 경로 ②에 해당할 수 있다. 부호화 대상 블록의 bdpcm_flag가 0이면 BDPCM 예측이 수행되지 않으며, 도 3의 경로 ①에 따라 부호화가 수행될 수 있다. 상술한 바와 같이, bdpcm_flag는 해당 블록에 대해 BDPCM이 수행되는지 여부를 지시하는 정보(플래그)이다.
도 4는 BDPCM 기술을 사용하는 복호화 장치의 구성을 개략적으로 나타낸 도면이다.
도 4에 도시된 바와 같이, 복호화 장치는 엔트로피 복호화기(Entropy Decoder), BDPCM 예측기(Inv BDPCM) 및 역양자화기(Dequantizer)를 포함할 수 있다. 도 4의 엔트로피 복호화기 및 역양자화기는 각각 도 2의 엔트로피 복호화부(210) 및 역양자화부(220)에 대응될 수 있다.
BDPCM 복호화는 도 3을 참조하여 설명한 BDPCM 부호화 과정의 역과정에 대응될 수 있으며, 다음과 같이 수행될 수 있다.
BDPCM이 사용될 경우(if bdpcm_flag = 1), 엔트로피 복호화기에 의하여 복호화된 계수 데이터 r'i,j 에 대하여, 블록 별로 수평(Horizontal) 또는 수직(Vertical) 방향 BDPCM 예측의 역과정 즉, BDPCM 복호화가 수행될 수 있다. 이 경우, 아래의 수학식 2가 이용될 수 있다. 예컨대, 복호화기는 수학식 2를 이용하여, r'i,j에 대해 BDPCM 예측을 수행함으로써, 양자화된 잔차 신호 Q(ri,j)를 생성할 수 있다. 양자화된 잔차 신호는 Q(ri,j)는 역양자화기(Dequantizer)에 입력될 수 있다.
Figure pct00002
복호화 대상 블록의 bdpcm_flag가 1이면 상기 수학식 2를 이용하여 BDPCM 예측에 대한 역과정이 수행될 수 있다. 이는 도 4의 경로 ②에 해당할 수 있다. 복호화 대상 블록의 bdpcm_flag가 0이면 BDPCM 예측에 대한 역과정이 수행되지 않고, 도 4의 경로 ①에 따른 복호화가 수행될 수 있다.
도 3, 도 4, 수학식 1 및 수학식 2를 참조하여 설명한 BDPCM 부호화 및 BDPCM 복호화를 수행함에 있어, BDPCM 수행 여부를 지시하는 정보(bdpcm_flag)뿐만 아니라, BDPCM 예측의 방향을 나타내는 BDPCM 방향 정보도 필요하다. 일반적으로 대상 블록이 인트라 예측될 때, BDPCM의 예측 방향과 인트라 예측의 예측 방향을 일치시키는 것이 효율적일 수 있다. 따라서, 하나의 예측 방향(예컨대, 수평 방향 또는 수직 방향)을 정하여 이를 BDPCM의 예측 방향 및 인트라 예측의 예측 방향으로 사용할 수 있다.
또는, 현재 블록에 대해 BDPCM이 적용된 경우, BDPCM의 예측 방향에 따라 현재 블록의 인트라 예측의 예측 방향을 결정할 수 있다. 예를 들어, 현재 블록에 대한 BDPCM의 예측 방향이 수직 방향인 경우, 현재 블록의 인트라 예측의 예측 방향은 수직 방향으로 결정될 수 있다. 이 경우, 현재 블록의 인트라 예측의 예측 방향에 관한 정보를 시그널링하지 않아도 되므로, 전송되는 비트량이 감소할 수 있다.
또는 반대로, 현재 블록의 인트라 예측의 예측 방향에 따라 현재 블록에 대한 BDPCM의 예측 방향을 결정할 수 있다. 예컨대, 현재 블록의 인트라 예측의 예측 방향이 수평 방향(또는 유사 수평 방향)인 경우, 현재 블록에 대한 BDPCM의 예측 방향을 수평 방향으로 결정할 수 있다. 이 경우, 현재 블록에 대한 BDPCM의 예측 방향을 시그널링하지 않아도 되므로, 전송되는 비트량이 감소할 수 있다. 상기에서 유사 수평 방향이란 수평 방향에 인접한 방향을 의미하며, 예컨대, 수평 방향으로부터 소정의 각도만큼 이격된 방향들을 포함할 수 있다.
BDPCM의 복호화를 위해 필요한 정보들 및 시그널링 방법에 대해서는 후술한다.
BDPCM 기술의 가용(enable) 여부는 BDPCM 기술이 현재 영상의 부호화/복호화에 사용될 수 있는지 여부를 의미할 수 있다. 본 개시에서 BDPCM 기술의 “가용 여부”는 “사용 가능 여부”, “적용 가능 여부”, “활성화/비활성화”, “허용 여부” 등의 용어로 혼용되어 기술될 수 있다.
BDPCM 기술의 가용 여부를 나타내는 정보는 상위 레벨, 예컨대, 시퀀스 레벨에서 시그널링될 수 있다. 예컨대, BDPCM 기술의 가용 여부를 나타내는 정보는 SPS(Sequence Parameter Set)의 bdpcm_enable_flag일 수 있다. BDPCM 기술이 사용 가능한 경우, 즉, bdpcm_enabled_flag가 제1 값(e.g. 1)인 경우, 각 CU 별로 BDPCM이 사용되는지 여부를 나타내는 정보(e.g. bdpcm_flag)가 CU 레벨에서 시그널링될 수 있다. BDPCM의 사용 여부는 현재 CU의 부호화/복호화에 BDPCM이 사용되는지 여부를 의미할 수 있다. 본 개시에서 BDPCM의 “사용 여부”는 “적용 여부”, “수행 여부” 등의 용어로 혼용되어 기술될 수 있다.
BDPCM의 사용 여부를 나타내는 정보(e.g. bdpcm_flag)는 현재 CU의 크기가 루마 성분 기준으로 MaxTsSize보다 크지 않고, 현재 CU에 예측 모드가 인트라 예측 모드인 경우에만 시그널링될 수 있다. 상기 MaxTsSize는 변환 생략 모드가 허용되는 최대 블록 크기를 의미할 수 있다. bdpcm_flag는 해당 CU가 BDPCM으로 부호화 되었는지를 지시하며, BDPCM이 사용되는 경우, BDPCM의 예측 방향(즉, 수직 방향 또는 수평 방향)을 지시하는 정보(e.g. bdpcm_dir_flag)가 추가로 시그널링될 수 있다.
종래 기술에 따르면, 루마 채널에 대한 BDPCM이 사용 가능한 경우에만 크로마 채널에 대한 BDPCM이 사용 가능할 수 있다. BDPCM의 사용 가능 여부를 시그널링하기 위해, 루마 채널과 크로마 채널의 각각에 대해 BDPCM의 사용 가능 여부를 나타내는 정보가 예컨대, 시퀀스 레벨(SPS)에서 전송되고 있다. 종래 기술에 따르면, 루마 채널에 대해 BDPCM이 사용 가능하고, 컬러 포맷이 4:4:4인 경우에만 크로마 채널에 대한 BDPCM이 사용 가능하다. 본 개시는 상기 종래 기술에 따른 문제점을 해결하고, BDPCM 관련 정보의 시그널링을 체계적이고 보다 효율적으로 수행하는 다양한 방법을 제공할 수 있다.
도 5는 종래 기술에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
영상 압축을 위하여 사용 가능한 여러 가지 기술들이 있다. 이 중, BDPCM 기술의 사용 여부는 영상에 따라서 또는 부호화기의 판단에 의하여 결정될 수 있다. 예컨대, 부호화기는 영상의 압축을 위해 BDPCM 기술이 사용 가능하도록 BDPCM 기술을 허용(활성화 또는 enable)하거나 BDPCM 기술이 사용 가능하지 않도록 BDPCM 기술을 비활성화(disable)할 수 있다. 부호화기는 BDPCM의 사용 가능 여부를 결정하고, 이에 관한 정보를 부호화함으로써 복호화기에 해당 결정을 시그널링할 수 있다.
도 5에 도시된 종래 기술에 있어서, BDPCM의 사용 가능 여부를 나타내는 정보는 시퀀스 레벨(SPS)에서 전송되는 sps_bdpcm_enabled_flag와 sps_bdpcm_chroma_enabled_flag이다.
도 5에 도시된 예에서, sps_transform_skip_enabled_flag는 변환 스킵 코딩(변환 생략 모드)이 사용 가능한지 여부를 나타낸다. 또한, sps_bdpcm_enabled_flag는 루마 채널에 대해 BDPCM이 사용 가능한지 여부를 나타낸다. 또한, sps_bdpcm_chroma_enabled_flag는 크로마 채널에 대해 BDPCM이 사용 가능한지 여부를 나타낸다.
도 5에 도시된 바와 같이, sps_bdpcm_enabled_flag 와 sps_bdpcm_chroma_enabled_flag는 SPS를 통하여 변환 생략 모드가 활성화된 경우에만 (즉, sps_transform_skip_enabled_flag가 1인 경우에만) 시그널링된다. 만약 sps_transform_skip_enabled_flag가 0인 경우에는, sps_bdpcm_enabled_flag의 값은 별도로 신호되지 않고 항상 0의 값으로 추론된다.
도 5에 도시된 예에서, sps_transform_skip_enabled_flag의 값이 1일 때, BDPCM 기술의 사용을 허용하려면 부호화기는 sps_bdpcm_enabled_flag의 값을 1로 부호화한다. 이는 BDPCM 기술이 활성화, 즉 enable 되었다는 것을 의미하는데, 더욱 구체적으로는 루마 채널에 대해 BDPCM 기술을 적용할 수 있음을 의미한다. 도 5에 도시된 예에서, sps_bdpcm_enabled_flag는 루마 채널에 대해 BDPCM 기술의 사용이 허용(enable) 되는지 여부를 지시하는 정보이다.
한편, sps_bdpcm_chroma_enabled_flag는 크로마 채널에 대해 BDPCM 기술의 사용이 허용되는지 여부를 지시한다. 도 5에 도시된 바와 같이, sps_bdpcm_enabled_flag의 값이 1이고 동시에 chroma_format_idc의 값이 3인 경우에만 sps_bdpcm_chroma_enabled_flag가 시그널링(전송 또는 파싱)된다. 이 두가지 조건이 동시에 만족하지 않는 경우, sps_bdpcm_chroma_enabled_flag는 시그널링되지 않으며, sps_bdpcm_chroma_enabled_flag의 값은 0으로 추론된다. 즉, sps_bdpcm_chroma_enabled_flag가 시그널링되지 않는 경우, 크로마 채널에 대해 BDPCM 기술이 허용되지 않는 것으로 결정된다. 여기서, chroma_format_idc는 영상을 구성하는 컬러 채널들의 포맷(컬러 포맷)을 나타내는 정보이다. chroma_format_idc의 값이 1이면 YCbCr 영상의 컬러 포맷이 4:2:0로 구성되었음을, 2이면 4:2:2 로 구성되었음을, 그리고 3이면 4:4:4로 구성되었음을 의미한다. 따라서, 종래 기술에 따르면, BDPCM 기술이 루마 채널에 대해 허용되고, 압축 대상 영상의 컬러 포맷이 4:4:4인 경우에만 크로마 채널에 대해 BDPCM이 허용될 수 있도록 설계되어 있다. 즉, 종래 기술은 BDPCM 기술의 사용이 매우 제한적이라는 단점을 갖는다.
도 6은 종래 기술에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
BDPCM 기술의 사용이 허용(enable)될 경우, 부호화 유닛(Coding unit, CU) 별로 BDPCM이 실제로 적용되는지 여부를 복호화기에 시그널링할 필요가 있다. 이를 위하여, 도 6에 도시된 바와 같이, 루마 채널에 대하여 intra_bdpcm_luma_flag와 intra_bdpcm_luma_dir_flag 정보를, 그리고 크로마 채널에 대하여 intra_bdpcm_chroma_flag와 intra_bdpcm_chroma_dir_flag 정보를 비트스트림에 포함시켜 부호화기에서 복호화기로 시그널링한다. 도 6에 도시된 정보들은 CU 레벨에서 전송되는 정보이다.
도 6에서, intra_bdpcm_luma_flag는 부호화 (또는 복호화) 대상 블록(현재 CU)의 루마 채널에 대해 BDPCM 기술이 적용되는지 여부를 나타낸다. intra_bdpcm_luma_flag가 제1 값(e.g. 1)인 경우, 현재 CU의 루마 채널에 대해 BDPCM 기술이 적용됨을 지시한다. 그리고 intra_bdpcm_luma_flag가 제2 값(e.g. 0)인 경우, 현재 CU의 루마 채널에 대해 BDPCM 기술이 적용되지 않음을 지시한다.
유사하게, intra_bdpcm_chroma_flag는 부호화 (또는 복호화) 대상 블록(현재 CU)의 크로마 채널에 대해 BDPCM 기술이 적용되는지 여부를 나타낸다. intra_bdpcm_chroma_flag가 제1 값(e.g. 1)인 경우, 현재 CU의 크로마 채널(e.g. Cb, Cr)에 대해 BDPCM 기술이 적용됨을 지시한다. 그리고 intra_bdpcm_chroma_flag가 제2 값(e.g. 0)인 경우, 현재 CU의 크로마 채널(e.g. Cb, Cr)에 대해 BDPCM 기술이 적용되지 않음을 지시한다.
BDPCM 기술을 사용하기 위해서는 BDPCM의 예측 방향(즉, 수직 방향 또는 수평 방향)을 지시하는 정보도 필요하다. 상기 예측 방향 정보는 루마 채널의 경우, intra_bdpcm_luma_dir_flag, 크로마 채널의 경우 intra_bdpcm_chroma_dir_flag이다. 예컨대, intra_bdpcm_luma_dir_flag (또는 intra_bdpcm_chroma_dir_flag)의 값이 0인 경우, BDPCM의 예측 방향은 수직 방향(Vertical)임을 의미한다. intra_bdpcm_luma_dir_flag (또는 intra_bdpcm_chroma_dir_flag)의 값이 1인 경우, BDPCM의 예측 방향은 수평 방향(Horizontal)임을 의미한다.
복호화기는 부호화기로부터 전송받은 비트스트림으로부터 intra_bdpcm_luma_flag (또는 intra_bdpcm_chroma_flag)를 파싱한다. intra_bdpcm_luma_flag (또는 intra_bdpcm_chroma_flag)의 값이 0인 경우, 복호화기는 해당 채널에 대해 BDPCM이 적용되지 않음을 인식한다. intra_bdpcm_luma_flag (또는 intra_bdpcm_chroma_flag)의 값이 1인 경우, 복호화기는 해당 채널에 대해 BDPCM이 적용됨을 인식한다. 복호화기는 상기 플래그의 값에 기반한 인식에 따라 비트스트림의 복호화를 수행한다.
또한, intra_bdpcm_luma_flag (또는 intra_bdpcm_chroma_flag)의 값이 1인 경우, 복호화기는 비트스트림으로부터 intra_bdpcm_luma_dir_flag (또는 intra_bdpcm_chroma_dir_flag)를 파싱한다. intra_bdpcm_luma_dir_flag (또는 intra_bdpcm_chroma_dir_flag)의 값이 0인 경우, 복호화기는 BDPCM의 예측 방향이 수직 방향임을 인식한다. intra_bdpcm_luma_dir_flag (또는 intra_bdpcm_chroma_dir_flag)의 값이 1인 경우, 복호화기는 BDPCM의 예측 방향이 수평 방향임을 인식한다. 복호화기는 상기 인식된 BDPCM의 예측 방향에 따라 BDPCM을 수행한다.
상술한 종래 기술에 따르면, BDPCM의 사용 여부는 루마 채널과 크로마 채널의 각각에 대하여 설정된다. 따라서, 크로마 신호를 구성하는 Cb 채널 및 Cr 채널에 각각 독립적으로 BDPCM을 적용할 수는 없다. 예컨대 Cb 채널에 대해서는 BDPCM을 적용하고, Cr 채널에 대해서는 BDPCM을 적용하지 않도록 설정할 수 없다. 즉, 종래 기술에 따르면, 크로마 채널에 대한 BDPCM 기술의 사용 여부는 Cb 채널과 Cr 채널에 대해 동일하게 설정되는 단점이 있다.
도 7은 변환 블록에 대한 신택스 요소들을 시그널링하는 TU 신택스 레벨에서 BDPCM 플래그가 사용되는 예를 도시한 도면이다.
도 7에 도시된 예에서, (x0, y0)는 현재 부호화 (또는 복호화) 대상 블록의 좌상단의 공간 위치를 나타내는 공간 좌표이며, cIdx는 영상의 컬러 채널 중 하나를 지시하는 컬러 채널 (또는 컴포넌트) 인덱스이다. 즉, Y 컴포넌트는 cIdx = 0, 그리고 Cb 컴포넌트 및 Cr 컴포넌트는 각각 cIdx = 1, cIdx = 2에 해당할 수 있다. BdpcmFlag [ x0 ][ y0 ][cIdx]는 공간 좌표 (x0, y0)에 해당하는 블록의 cIdx 가 지시하는 채널에 대한 BDPCM 플래그이다. 예컨대, BdpcmFlag가 1인 경우, 현재 블록에 대해 BDPCM이 적용됨을 나타내고, BdpcmFlag가 0인 경우, 현재 블록에 대해 BDPCM이 적용되지 않음을 나타낼 수 있다. cIdx가 지시하는 채널의 (x0, y0)의 좌표에 해당하는 블록에 대해 BDPCM이 적용되는지 여부를 나타내는 BDPCM 플래그 정보는 일반적으로 BdpcmFlag [ x0 ][ y0 ][cIdx]로 표시될 수 있다. 그러나, 이 후의 설명에서 BdpcmFlag [ x0 ][ y0 ][ cIdx ]는, 동작 이해에 지장이 없는 한, 설명의 편의상 일부 정보를 제외하여 BdpcmFlag 또는 BdpcmFlag [Channel Type]로 표시하여 설명한다.
도 5 내지 도 7을 참조하여 설명한 종래 기술에 따르면, 적어도 다음의 측면에서 기술적인 문제가 발생할 수 있다.
첫째, 종래의 bdpcm 기술은 4:4:4 영상에 대해서만, 즉, chroma_format_idc가 3인 경우에만 적용될 수 있다. 따라서, 종래 기술에 따르면, 부호화/복호화 대상 영상이 4:2:0 영상 (e.g. chroma_format_idc = 1) 또는 4:2:2 영상 (e.g. chroma_format_idc = 2)인 경우에는, BDPCM을 적용하여 압축률 향상이나 화질 개선의 효과를 얻을 수 있을 것으로 예상되더라도 해당 영상에 대해 BDPCM을 적용할 수 없다.
둘째, 종래 기술에 따르면, 루마(즉, Y 신호) 채널과 크로마 채널(즉, Cb 신호 및 Cr 신호) 간에 독립적으로 bdpcm을 허용하는 것이 불가능하다. Bdpcm의 압축 효율 또는 화질 개선 효과는, 영상에 따라서 루마 채널에서만 주로 나타날 경우가 있다. 또는, 반대로 크로마 채널 신호에 대하여만 Bdpcm의 효과가 나타날 수도 있다. 한편 일부 영상에서는 루마 채널과 크로마 채널의 양쪽 모두에서 bdpcm을 사용하는 것이 유리할 수도 있다. 도 5를 참조하여 설명한 종래 기술에 따르면, 크로마 채널에 대해 bdpcm 기술을 허용하려면 먼저 sps_bdpcm_enabled_flag의 값을 1로 설정해야 한다. 즉, 루마 채널에 대해 bdpcm 기술을 허용해야 한다. 도 5에 도시된 종래 기술에 따르면 sps_bdpcm_enabled_flag의 값이 1인 경우에만, sps_bdpcm_chroma_enabled_flag를 파싱할 수 있기 때문다. 즉, bdpcm 기술이 루마 채널에 대해 적용될 수 있도록 활성화(enable)되어 있는 경우에만, 크로마 채널에 대한 bdpcm이 허용될 수 있다. 결론적으로, 종래 기술에 따르면 루마 채널에 대해서는 bdpcm을 허용하지 않고 크로마 채널에 대해서만 bdpcm을 허용하는 것이 원천적으로 불가능하다. 따라서, bdpcm 기술의 적용에 따른 효과가 크로마 채널에만 있는 경우라도, 루마 채널에 대하여 bdpcm을 활성화하지 않으면(즉, sps_bdpcm_enabled_flag가 0으로 설정되면), 부호화기는 sps_bdpcm_chroma_enabled_flag를 시그널링할 수 없고, 복호화기는 sps_bdpcm_chroma_enabled_flag를 파싱할 수 없게 된다. 즉, 크로마 채널에서의 bdpcm의 효과를 얻을 수 없다. 따라서, 종래 기술에 따르면, bdpcm의 효과가 크로마 채널에만 있는 경우에도 루마 채널에 대해서도 bdpcm의 사용이 가능하도록 설정해야 한다. 즉, 종래 기술에 따르면, intra_bdpcm_luma_flag 및/또는 intra_bdpcm_luma_dir_flag 값이 항상 전송되어야 하므로 비효율적이다. 따라서 루마 채널과 크로마 채널에 대해 각각 독립적으로 bdpcm의 적용 여부를 결정하고, 관련 정보(활성화 정보)를 독립적으로 시그널링할 수 있도록 개선될 필요가 있다.
셋째, 종래 기술에 따르면, 크로마 채널에 대한 bdpcm 사용 가능 여부는 SPS 단에서 전송되는 sps_bdpcm_chroma_enabled_flag에 의해 시그널링되며, Cb 채널 및 Cr 채널에 대해 bdpcm 사용 가능 여부가 동일하게 설정된다. 따라서, 종래 기술에 따르면, Cb 채널과 Cr 채널 간에 영상 성질의 차이가 있어서, bdpcm 기술이 Cb 채널에서만 유용하고 Cr 채널에서는 유용하지 않은 경우 (또는 이와 반대의 경우)에도 양쪽 채널에 대해 bdpcm 기술이 동일하게 활성화되거나 비활성화될 수밖에 없는 비효율성의 문제가 발생한다. 이 문제는 도 5의 sps_bdpcm_chroma_enabled_flag 뿐만 아니라 도 6의 intra_bdpcm_chroma_flag 및 intra_bdpcm_chroma_dir_flag에 대해서도 동일하게 발생한다. 즉, Cb 채널에 대한 BDPCM 정보와 Cr 채널에 대한 BDPCM 정보가 동일한 신택스 요소에 의해 동일하게 결정되므로, Cb 채널에 대한 BDPCM의 설정 및 Cr 채널에 대한 BDPCM의 설정을 상이하게 할 수 없는 문제가 존재한다.
넷째, 종래 기술에 따르면, 인트라 예측되는 블록에 대하여만 bdpcm 기술이 적용될 수 있다. 즉, 인트라 예측을 사용하지 않는 블록, 예를 들어 움직임 보상을 수행하여 인터 예측되는 블록에 대해서는 bdpcm이 원천적으로 사용될 수 없는 문제가 있다.
BDPCM은 변환 생략이 수행되는 경우에 사용될 수 있으므로, 특히 무손실 압축으로 영상 부호화할 때 사용될 수 있다. 따라서, lossless coding을 하거나 그래픽스 영상과 같이 컴퓨터로 만들어진 영상(이를 간단히 Screen Content 라고 지칭할 수 있다)의 경우에 특히 BDPCM이 YCbCr 채널 모두에 유리한 경우가 많다. 따라서 본 개시는 적어도 위의 문제점들을 해결하여 영상의 압축률을 향상시키거나, 화질을 향상시킬 수 있는 다양한 실시예들을 포함한다.
일반적으로, 영상의 세 채널 데이터는 YCbCr 컬러 공간에서 Luma (Y, 또는 휘도) 채널, Chroma (Cb 및/또는 Cr) 채널로 나뉘어질 수 있다. BDPCM은 블록의 화면 내 예측 (즉, 인트라 예측) 모드가 지시하는 예측 방향과 동일한 방향으로 적용되고, 또한 변환을 생략한 상태에서 양자화를 진행한다. 따라서, BDPCM 관련 정보를 Y, Cb, Cr 3개의 채널로 전송해줄 필요 없이 Luma 채널과 Chroma 채널에 대해 BDPCM 플래그 정보와 BDPCM의 방향 정보를 전송(또는 파싱)할 수 있다. 이하의 설명에서는 시그널링 정보로서 BDPCM 플래그를 대상으로 설명한다. 그러나, 본 개시가 적용되는 시그널링 정보는 BDPCM 플래그로 한정되지 않으며, 본 개시의 기술적 사상이 동일하게 적용될 수 있는 모든 시그널링 정보를 포함할 수 있다. 예컨대, 본 개시가 적용되는 시그널링 정보는 상기에서 나열한 정보의 각각, 또는 그들 중 적어도 하나의 정보들을 포함할 수 있다. 이러한 정보들은 편의상 "부호화 정보"라고 지칭될 수 있다.
<실시예 1>
이하, 상술한 종래 기술의 첫번째 문제를 해결하기 위한 본 개시에 따른 일 실시예를 설명한다.
chroma_format_idc는 컬러 채널이 어떻게 구성되었는가를 나타낼 수 있다. chroma_format_idc가 1이면 YCbCr 컬러 채널이 4:2:0 컬러 포맷으로 구성되었음을 지시할 수 있다. 또한, chroma_format_idc가 2이면 4:2:2 컬러 포맷, chroma_format_idc가 3이면 4:4:4 컬러 포맷으로 구성되었음을 지시할 수 있다. 종래 기술에 따르면, chroma_format_idc의 값이 3인 경우, 즉, 현재 영상이 4:4:4 컬러 포맷 영상인 경우에만 크로마 블록에 대한 BDPCM을 수행할 수 있다. 그러나 본 실시예에 따르면, 현재 영상이 4:4:4 컬러 포맷 영상인 경우뿐만 아니라, 현재 영상이 4:2:2 컬러 포맷 영상 또는 4:2:0 컬러 포맷 영상인 경우에도 크로마 블록에 대한 BDPCM을 수행할 수 있다.
도 8은 본 개시의 실시예 1에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 8a에 도시된 예에 따르면, 크로마 블록에 대한 BDPCM 활성화 정보(sps_bdpcm_chroma_enabled_flag)는 chroma_format_idc가 2보다 큰 경우에 시그널링될 수 있다. 즉, sps_bdpcm_chroma_enabled_flag는 chroma_format_idc가 2 또는 3인 경우에 시그널링될 수 있다. 따라서, 도 8a에 도시된 예에 따르면, 현재 영상이 4:4:4 컬러 포맷 영상이거나 4:2:2 컬러 포맷 영상인 경우, 크로마 블록에 대한 BDPCM의 활성화가 가능할 수 있다.
도 8b에 도시된 예에 따르면, 크로마 블록에 대한 BDPCM 활성화 정보(sps_bdpcm_chroma_enabled_flag)는 chroma_format_idc가 0이 아닌 경우에 시그널링될 수 있다. 즉, sps_bdpcm_chroma_enabled_flag는 chroma_format_idc가 1, 2 또는 3인 경우에 시그널링될 수 있다. 따라서, 도 8b에 도시된 예에 따르면, 입력 영상이 4:4:4 컬러 포맷 영상이거나 4:2:2 컬러 포맷 영상이거나 4:2:0 컬러 포맷 영상인 경우, 크로마 블록에 대한 BDPCM의 활성화가 가능할 수 있다. chroma_format_idc는 통상 0 내지 3의 값을 갖고, chroma_format_idc가 0인 것은 현재 영상이 Y 채널만으로 구성된 모노크롬 영상임을 의미할 수 있다. 따라서, 도 8b에 도시된 예는 실질적으로 현재 영상이 크로마 채널을 포함하는 경우에 크로마 블록에 대한 BDPCM의 활성화 정보를 전송하는 것으로 이해될 수 있다.
또는, sps_bdpcm_chroma_enabled_flag가 시그널링되는 조건으로서 separate_colour_plane_flag가 1인지 여부를 포함할 수 있다. separate_colour_plane_flag가 1인 것은 4:4:4 컬러 포맷 영상의 세 가지 색상 성분의 각각이 별도로 부호화/복호화되는 것을 의미할 수 있다. 예컨대, 컬러 공간이 YCbCr 이 아니라 XYZ 또는 RGB 채널의 컬러 공간인 경우이다. 즉, separate_colour_plane_flag가 1인 것은 현재 영상의 3개의 채널이 상호 독립적으로 부호화/복호화되어야 하는 경우를 의미할 수 있다. 본 개시에 따른 실시예에서는 상기와 같은 경우를 제외하고 크로마 성분에 대하여 BDPCM이 활성화될 수 있다.
현재 영상의 컬러 포맷이 4:4:4가 아닐 경우, 도 6에 도시된 종래 기술에 따른 BDPCM 플래그 및 BDPCM 예측 방향 정보 전송 방법(CU syntax 레벨)은 더 이상 사용할 수 없다.
도 9는 본 개시의 실시예 1에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 9에 도시된 바와 같이, 크로마 채널에 대하여 종래 기술과는 다른 새로운 CU 신택스 레벨에서의 파싱과 복호화 동작이 필요하다. 도 9에서 cbWidth 와 cbHeight는 루마 블록의 폭과 높이를 각각 나타낸다. 또한, SubWidthC 와 SubHeightC는 chroma_format_idc의 값에 따라 루마 블록의 폭과 높이를 크로마 블록의 폭과 높이로 맞추어 주기 위한 스케일링 값(chroma scaling factors)을 나타낼 수 있다.
chroma_format_idc에 따른 SubWidthC와 SubHeightC의 값은 아래 표 1과 같이 나타낼 수 있다.
chroma_format_idc separate_colour_plane_flag Chroma format SubWidthC SubHeightC
0 0 Monochrome 1 1
1 0 4:2:0 2 2
2 0 4:2:2 2 1
3 0 4:4:4 1 1
3 1 4:4:4 1 1
도 9에 도시된 바와 같이, sps_bdpcm_luma_enabled_flag가 1이고, 현재 루마 블록의 너비(cbWidth) 및 높이(cbHeight)가 모두 MaxTsSize 이하일 때, intra_bdpcm_luma_flag가 파싱될 수 있다. 또한, intra_bdpcm_luma_flag가 1일 때, intra_bdpcm_luma_dir_flag가 파싱될 수 있다.
유사하게, sps_bdpcm_chroma_enabled_flag가 1이고, 현재 크로마 블록의 너비(cbWidth/SubWidthC) 및 높이(cbHeight/SubHeightC)가 모두 MaxTsSize 이하일 때, intra_bdpcm_chroma_flag가 파싱될 수 있다. 또한, intra_bdpcm_chroma_flag가 1일 때, intra_bdpcm_chroma_dir_flag가 파싱될 수 있다.
후술하는 실시예 7에서, 루마 채널에 대한 BDPCM 가용 여부와 크로마 채널에 대한 BDPCM 가용 여부는 동일한 정보(BDPCM 활성화 플래그)에 의해 시그널링될 수 있다. 실시예 7의 상기 구성을 본 실시예 1에 병합하는 경우, 루마 채널과 크로마 채널에 공통인 BDPCM 활성화 플래그가 시그널링될 수 있다. 이 경우, 본 실시예 1에서, sps_bdpcm_luma_enabled_flag와 sps_bdpcm_chroma_enabled_flag는 공통의 동일한 플래그(e.g. sps_bdpcm_enabled_flag)로 대체될 수 있다.
<실시예 2>
이하, 상기 종래 기술의 두번째 문제를 해결하기 위한 본 개시에 따른 실시예를 설명한다.
본 실시예에 따르면, 루마 채널 및 크로마 채널에 대한 BDPCM 활성화 플래그를 각각 상호 독립적으로 전송(또는 파싱)할 수 있다. 본 실시예에 따르면, sps_bdpcm_luma_enabled_flag와 sps_bdpcm_chroma_enabled_flag를 독립적으로 전송할 수 있다. sps_bdpcm_luma_enabled_flag는 루마 채널에 대해 BDPCM 기술이 활성화되는지 여부를 지시할 수 있다. sps_bdpcm_chroma_enabled_flag는 크로마 채널에 대해 BDPCM 기술이 활성화되는지 여부를 지시할 수 있다.
도 10은 본 개시의 실시예 2에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
본 실시예에 따르면, 루마 채널 및 크로마 채널에 대한 bdpcm_enabled_flag가 각각 독립적으로 시그널링될 수 있다.
구체적으로, 도 10a는 루마 채널 및 크로마 채널에 대한 bdpcm_enabled_flag를 각각 독립적으로 시그널링하는 일 예를 도시한 도면이다.
도 10a에 따르면, sps_bdpcm_chroma_enabled_flag는 chroma_format_idc가 3인 경우에 시그널링될 수 있다. 이 때, sps_bdpcm_luma_enabled_flag는 고려되지 않을 수 있다. 즉, sps_bdpcm_chroma_enabled_flag의 시그널링은 sps_bdpcm_luma_enabled_flag의 값과 독립적으로 수행될 수 있다.
도 10a에 도시된 예는 컬러 포맷이 4:2:2 또는 4:2:0인 영상에 대해서도 적용될 수 있다.
도 10b는 컬러 포맷이 4:4:4 또는 4:2:2인 경우에 루마 채널 및 크로마 채널에 대한 bdpcm_enabled_flag를 각각 독립적으로 시그널링하는 다른 예를 도시한 도면이다.
도 10b에 도시된 바와 같이, chroma_format_idc가 2 이상인 경우, sps_bdpcm_chroma_enabled_flag가 시그널링될 수 있으며, 이 때, sps_bdpcm_luma_enabled_flag의 값은 고려되지 않을 수 있다.
도 10c는 컬러 포맷이 4:4:4, 4:2:2 또는 4:2:0 인 경우(또는 모노크롬 영상이 아닌 경우)에 루마 채널 및 크로마 채널에 대한 bdpcm_enabled_flag를 각각 독립적으로 시그널링하는 또 다른 예를 도시한 도면이다.
도 10c에 도시된 바와 같이, chroma_format_idc가 0이 아닌 경우, 즉, 현재 영상이 모노크롬 영상이 아닌 경우, sps_bdpcm_chroma_enabled_flag가 시그널링될 수 있으며, 이 때, sps_bdpcm_luma_enabled_flag의 값은 고려되지 않을 수 있다.
도 10에 도시된 실시예 2에 따른 BDPCM 플래그 및 BDPCM 예측 방향 정보의 전송 방법은 도 9를 참조하여 설명한 바와 동일할 수 있다. 이 때, 도 10a에 도시된 실시예에 따른 BDPCM 플래그 및 BDPCM 예측 방향 정보의 전송 방법은 도 6을 참조하여 설명한 바와 동일할 수도 있다.
도 11은 본 개시의 실시예 2에 따른 TU 레벨의 신택스 구조를 도시한 도면이다.
즉, 도 9의 CU 레벨의 신택스 구조를 파싱하여 얻어진 intra_bdpcm_luma_flag 및 intra_bdpcm_chroma_flag 값을 참조하여 현재 CU 블록의 Y, Cb, Cr 채널 별로 bdpcm 기술의 적용 여부가 결정되며, 이 결정에 따라 BDPCM 복호화가 수행될 수 있다.
도 11을 참조하면, 루마 채널의 경우, 복호화하는 현재 CU 블록에 대한 intra_bdpcm_luma_flag의 값(즉, intra_bdpcm_luma_flag[ x0 ][ y0 ]에 저장되어 있는 intra_bdpcm_luma_flag 값)에 따라, BDPCM 기술의 사용 여부가 지시될 수 있다. Cb 채널의 경우, 복호화하는 현재 CU 블록에 대한 intra_bdpcm_chroma_flag의 값(즉, intra_bdpcm_chroma_flag[ x0 ][ y0 ]에 저장되어 있는 intra_bdpcm_chroma_flag 값)에 따라, BDPCM 기술의 사용 여부가 지시될 수 있다. 마찬가지로 Cr채널의 경우에도, 복호화하는 현재 CU 블록에 대한 intra_bdpcm_chroma_flag의 값(즉, intra_bdpcm_chroma_flag[ x0 ][ y0 ]에 저장되어 있는 intra_bdpcm_chroma_flag 값)에 따라, BDPCM 기술의 사용 여부가 지시될 수 있다.
<실시예 3>
이하, 상기 종래 기술의 세번째 문제를 해결하기 위한 본 개시에 따른 실시예를 설명한다.
본 실시예에 따르면, Cb 채널과 Cr 채널에 대해 각각 독립적으로 BDPCM을 활성화시킬 수 있다. 본 실시예에 따르면, 종래 기술의 두번째 및 세번째 문제가 동시에 해결될 수 있다. 본 실시예에 따르면, sps_bdpcm_luma_enabled_flag와 sps_bdpcm_chroma_common_enabled_flag를 전송하도록 구현될 수 있다. sps_bdpcm_luma_enabled_flag는 상술한 바와 마찬가지로 루마 채널에 대해 BDPCM 기술이 활성화되는지 여부를 지시할 수 있다. sps_bdpcm_chroma_common_enabled_flag는 크로마 채널에 대해 BDPCM 기술이 활성화되는지 여부를 지시할 수 있다. 보다 구체적으로, sps_bdpcm_chroma_common_enabled_flag는 Cb 채널과 Cr 채널의 구별없이 크로마 채널에 대해 공통적으로 BDPCM 기술의 활성화 여부가 지시되는지 또는 Cb 채널과 Cr 채널의 각각에 대해 독립적으로 지시되는지를 나타낼 수 있다. 예컨대, sps_bdpcm_chroma_common_enabled_flag 값이 1인 경우, Cb 채널과 Cr 채널에 공통적으로 BDPCM 활성화 여부가 지시됨을 의미할 수 있다. 따라서, 이 경우 크로마 채널에 대해 intra_bdpcm_flag(즉, intra_bdpcm_chroma_flag) 및/또는 intra_bdpcm_dir_flag(즉, intra_bdpcm_chroma_dir_flag)의 두 플래그가 전송되고, 그 값들을 Cb 채널과 Cr 채널이 공유할 수 있다. 예컨대, sps_bdpcm_chroma_common_enabled_flag 값이 0인 경우, CU 레벨의 syntax에서 Cb 채널과 Cr 채널의 각각에 대해 intra_bdpcm_flag 및/또는 intra_bdpcm_dir_flag가 독립적으로 전송(또는 파싱)될 수 있다. 즉, Cb 채널에 대해서는 intra_bdpcm_chroma_cb_flag 및/또는 intra_bdpcm_chroma_cb_dir_flag가 시그널링되고, Cr 채널에 대해서는 intra_bdpcm_chroma_cr_flag 및/또는 intra_bdpcm_chroma_cr_dir_flag가 시그널링될 수 있다.
도 12는 본 개시의 실시예 3에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 12a에 도시된 예에 따르면, sps_bdpcm_chroma_common_enabled_flag는 chroma_format_idc가 3인 경우에 시그널링될 수 있다.
도 12a에 도시된 예는 컬러 포맷이 4:2:2 또는 4:2:0인 영상에 대해서도 적용될 수 있다.
도 12b에 도시된 예에 따르면, sps_bdpcm_chroma_common_enabled_flag는 chroma_format_idc가 2 이상인 경우에 시그널링될 수 있다. 즉, 컬러 포맷이 4:4:4 또는 4:2:2인 경우에 sps_bdpcm_chroma_common_enabled_flag가 시그널링될 수 있다.
도 12c에 도시된 예에 따르면, sps_bdpcm_chroma_common_enabled_flag는 chroma_format_idc가 0이 아닌 경우에 시그널링될 수 있다. 즉, 컬러 포맷이 모노크롬이 아닌 경우, 예컨대, 컬러 포맷이 4:4:4, 4:2:2 또는 4:2:0 인 경우에 sps_bdpcm_chroma_common_enabled_flag가 시그널링될 수 있다.
도 12를 참조하여 설명한 예와 도 10을 참조하여 설명한 예에서 공통되는 부분에 대한 설명은 공통적으로 적용될 수 있다. 예컨대, 도 12를 참조하여 설명한 예에서, 크로마 채널에 대한 sps_bdpcm_chroma_common_enabled_flag는 루마 채널에 대한 sps_bdpcm_luma_enabled_flag와 독립적으로 시그널링될 수 있다.
도 13은 본 개시의 실시예 3에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 13에 도시된 예에서, 도 9를 참조하여 설명한 예와 동일한 부분에 대한 설명은 생략한다.
도 14는 본 개시의 실시예 3에 따른 크로마 채널에 대한 CU 레벨 신택스 요소를 파싱하는 방법을 설명하기 위한 도면이다.
이하에서, 도 13 및 도 14를 참조하여, 본 실시예에 따른 CU 레벨 신택스의 시그널링에 대해 설명한다.
먼저, sps_bdpcm_chroma_common_enabled_flag가 1인 경우, 비트스트림으로부터 intra_bdpcm_chroma_common_flag를 파싱(획득)할 수 있다. intra_bdpcm_chroma_common_flag는 모든 크로마 채널에 대해 BDPCM이 적용되는지 여부를 지시하는 공통 플래그일 수 있다. intra_bdpcm_chroma_common_flag가 1인 경우, 모든 크로마 채널에 대해 BDPCM이 적용되는 것을 나타낼 수 있다. intra_bdpcm_chroma_common_flag가 0인 경우, 모든 크로마 채널에 대해 BDPCM이 적용되지 않는 것을 나타낼 수 있다. 따라서, sps_bdpcm_chroma_common_enabled_flag가 1인 경우, Cb 채널 및 Cr 채널에 대해 BDPCM이 적용되는지 여부를 나타내는 플래그들(BdpcmFlag[ x0 ][ y0 ][ 1 ] 및 BdpcmFlag[ x0 ][ y0 ][ 2 ])의 값은 공통적으로 intra_bdpcm_chroma_common_flag [ x0 ][ y0 ]의 값으로 설정될 수 있다. 이 때, 루마 채널에 대해 BDPCM이 적용되는지 여부를 나타내는 플래그(BdpcmFlag[ x0 ][ y0 ][ 0 ])의 값은 intra_bdpcm_luma_flag [ x0 ][ y0 ]의 값으로 설정될 수 있다.
만일, sps_bdpcm_chroma_common_enabled_flag가 0인 경우, 비트스트림으로부터 Cb 채널에 대한 플래그(intra_bdpcm_chroma_cb_flag) 및 Cr 채널에 대한 플래그(intra_bdpcm_chroma_cr_flag)를 파싱(획득)할 수 있다. intra_bdpcm_chroma_cb_flag는 Cb 채널에 대해 BDPCM이 적용되는지 여부를 지시하는 플래그일 수 있다. intra_bdpcm_chroma_cb_flag가 1인 경우, Cb 채널에 대해 BDPCM이 적용되는 것을 나타낼 수 있다. intra_bdpcm_chroma_cb_flag가 0인 경우, Cb 채널에 대해 BDPCM이 적용되지 않는 것을 나타낼 수 있다. 유사하게, intra_bdpcm_chroma_cr_flag는 Cr 채널에 대해 BDPCM이 적용되는지 여부를 지시하는 플래그일 수 있다. intra_bdpcm_chroma_cr_flag가 1인 경우, Cr 채널에 대해 BDPCM이 적용되는 것을 나타낼 수 있다. intra_bdpcm_chroma_cr_flag가 0인 경우, Cr 채널에 대해 BDPCM이 적용되지 않는 것을 나타낼 수 있다. 따라서, sps_bdpcm_chroma_common_enabled_flag가 0인 경우, Cb 채널 및 Cr 채널에 대해 BDPCM이 적용되는지 여부를 나타내는 플래그들(BdpcmFlag[ x0 ][ y0 ][ 1 ] 및 BdpcmFlag[ x0 ][ y0 ][ 2 ])의 값은 각각 intra_bdpcm_chroma_cb_flag [ x0 ][ y0 ] 및 intra_bdpcm_chroma_cr_flag [ x0 ][ y0 ]의 값으로 설정될 수 있다. 이 때, 루마 채널에 대해 BDPCM이 적용되는지 여부를 나타내는 플래그(BdpcmFlag[ x0 ][ y0 ][ 0 ])의 값은 intra_bdpcm_luma_flag [ x0 ][ y0 ]의 값으로 설정될 수 있다.
상기와 같이 설정된 BdpcmFlag[ x0 ][ y0 ][ 0 ], BdpcmFlag[ x0 ][ y0 ][ 1 ] 및 BdpcmFlag[ x0 ][ y0 ][ 2 ]에 기반하여 TU 레벨에서의 파싱 및 복호화가 도 7을 참조하여 설명한 바에 따라 수행될 수 있다.
<실시예 4>
이하, 상기 종래 기술의 네번째 문제를 해결하기 위한 본 개시에 따른 실시예를 설명한다.
종래 기술에 따르면 BDPCM은 반드시 인트라 모드로 예측된 블록(인트라 블록)에만 적용될 수 있다. 또한, BDPCM을 위한 예측 방향은 인트라 블록에 적용되는 인트라 예측 방향과 일치시켜 사용한다. 그러나, 스크린 컨텐츠에 주로 효과적인 BDPCM 기술을 인터 모드로 예측된 블록(인터 블록)에 대해 적용할 경우, 압축 효율 증대와 화질 개선의 효과를 얻을 수 있다. 본 실시예는 상술한 종래 기술을 개선하여 인터 블록에도 BDPCM 기술을 적용할 수 있다.
부호화기는 인터 블록에 대해 BDPCM 기술의 사용을 활성화할지(enable) 또는 비활성화(disable)할지 여부를 결정하고, 그 결정된 내용을 복호화기에 시그널링할 수 있다.
도 15는 본 개시의 실시예 4에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 15에 도시된 바와 같이, 본 실시예에 따른 시퀀스 레벨 신택스 구조는 sps_inter_bdpcm_enabled_flag 및/또는 sps_inter_bdpcm_chroma_enabled_flag를 포함할 수 있다.
도 15a에 도시된 바와 같이, 인터 블록에 대한 BDPCM 기술의 허용 여부는 시퀀스 레벨인 SPS(Sequence Parameter Set)의 sps_inter_bdpcm_enabled_flag와 sps_inter_bdpcm_chroma_enabled_flag에 의하여 지시될 수 있다. 또한, 상기 두 플래그들은 SPS를 통하여 변환 생략 모드가 활성화된 경우에만 (즉, sps_transform_skip_enabled_flag가 1인 경우에만) 시그널링될 수 있다.
다른 응용예로서, 도 15b에 도시된 바와 같이, 인터 블록에 대한 BDPCM 기술의 허용 여부를 지시하는 sps_inter_bdpcm_enabled_flag와 sps_inter_bdpcm_chroma_enabled_flag는 sps_bdpcm_enabled_flag가 1인 경우에만, 즉, 인트라 블록(또는 모든 블록)에 대한 BDPCM 기술이 허용되는 경우에만 시그널링될 수 있다.
도 15의 예에서, 크로마 채널에 대한 플래그는 루마 채널에 대한 플래그에 종속적으로 시그널링된다. 그러나 이에 한정되지 않으며, 상술한 본 개시의 다른 실시예와의 결합에 의해, 루마 채널에 대한 플래그와는 독립적으로 크로마 채널에 대한 플래그를 시그널링할 수도 있다.
도 15의 예에서, 크로마 채널에 대한 플래그는 컬러 포맷이 4:4:4인 경우에 시그널링된다. 그러나 이에 한정되지 않으며, 상술한 본 개시의 다른 실시예와의 결합에 의해, 컬러 포맷이 4:2:2 또는 4:2:0인 경우에도 시그널링할 수도 있다.
또 다른 응용예로서, sps_inter_bdpcm_enabled_flag와 sps_inter_bdpcm_chroma_enabled_flag는 각각 sps_intra_bdpcm_enabled_flag와 sps_intra_bdpcm_chroma_enabled_flag의 값으로 설정될 수도 있다. 즉, 인터 블록에 대한 BDPCM 활성화 정보를 별도로 시그널링하지 않고, 인트라 블록에 대한 BDPCM 활성화 정보를 그대로 공유할 수 있다.
또 다른 응용예로서, 인터 블록에 대한 플래그와 인트라 블록에 대한 플래그는 하나의 플래그로서 시그널링될 수 있다. 예컨대, sps_bdpcm_luma_enabled_flag는 인터 블록의 루마 채널 및 인트라 블록의 루마 채널에 대해 BDPCM이 적용가능한지 여부를 공통으로 지시할 수 있다. 또한, sps_bdpcm_chroma_enabled_flag는 인터 블록의 루마 채널 및 인트라 블록의 크로마 채널에 대해 BDPCM이 적용가능한지 여부를 공통으로 지시할 수 있다.
인터 블록에 대해 BDPCM 기술의 사용이 허용(enable)될 경우, 코딩 유닛 (Coding unit, CU) 별로 BDPCM이 적용되는지 여부를 시그널링할 수 있다.
도 16은 본 개시의 실시예 4에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 16에 도시된 예에서, 루마 채널에 대해 inter_bdpcm_luma_flag와 inter_bdpcm_luma_dir_flag가 시그널링될 수 있다. 또한, 크로마 채널에 대해 inter_bdpcm_chroma_flag와 inter_bdpcm_chroma_dir_flag가 시그널링될 수 있다.
inter_bdpcm_luma_flag는 인터 블록의 루마 채널에 대해 BDPCM이 적용되는지 여부를 지시할 수 있다. inter_bdpcm_luma_dir_flag는 인터 블록의 루마 채널에 대한 BDPCM의 예측 방향을 지시할 수 있다.
inter_bdpcm_chroma_flag는 인터 블록의 크로마 채널에 대해 BDPCM이 적용되는지 여부를 지시할 수 있다. inter_bdpcm_chroma_dir_flag는 인터 블록의 크로마 채널에 대한 BDPCM의 예측 방향을 지시할 수 있다. 크로마 채널의 경우, 상술한 본 개시의 다른 실시예와의 결합에 의해 Cb 채널 및 Cr 채널의 각각에 대해 CU 레벨에서의 BDPCM 관련 정보를 시그널링할 수도 있다. 예컨대, inter_bdpcm_chroma_flag 대신에 inter_bdpcm_chroma_cb_flag와 inter_bdpcm_chroma_cr_flag를 시그널링할 수 있다. 또한, inter_bdpcm_chroma_dir_flag 대신에 inter_bdpcm_chroma_cb_dir_flag와 inter_bdpcm_chroma_cr_dir_flag를 시그널링할 수 있다.
또는 본 개시의 실시예들에 있어서, BDPCM의 예측 방향은 소정의 방향으로 고정될 수 있다. 예를 들어 DC 예측 모드 또는 Planar 예측 모드가 사용될 수 있다.
도 17은 본 개시의 실시예 4에 따른 TU 레벨의 신택스 구조를 설명하기 위한 도면이다.
도 17에 도시된 TU 레벨의 신택스 구조와 본 개시의 다른 실시예에서 설명된 TU 레벨의 신택스 구조에서 동일한 부분에 대한 중복적인 설명은 생략한다.
본 실시예의 변형예로서, 인터 블록인 경우, 루마 블록에 대해서만 BDPCM을 적용하고, 크로마 블록에 대해서는 BDPCM을 적용하지 않도록 제한할 수 있다. 또는, 루마 블록에 대해 BDPCM이 적용되는 경우, 루마 블록에 대한 BDPCM의 예측 방향을 크로마 블록에 대해서도 동일하게 사용할 수 있다. 이 경우, 크로마 블록에 대한 BDPCM의 예측 방향에 관한 정보를 전송(또는 파싱)하지 않아도 되는 효과가 있다.
지금까지 설명한 본 개시에 따른 BDPCM 기술의 여러 실시예들은 변환 생략을 수행할 때 같이 사용되도록 구현될 수 있다. 이렇게 하는 경우, 특히 무손실 압축으로 영상을 부호화할 때 BDPCM 기술을 사용함으로써, 더욱 우수한 영상 화질 개선 효과를 얻을 수 있다.
<실시예 5>
본 실시예에 따르면, 루마 채널에 대해 BDPCM이 활성화된 경우에 한하여, 크로마 채널에 대해 BDPCM이 활성화되는지 여부를 나타내는 정보, 예컨대, sps_bdpcm_chroma_common_enabled_flag를 시그널링할 수 있다. 본 실시예에 따르면, 관련 신택스 요소의 파싱은 아래와 같이 동작할 수 있다.
parse sps_bdpcm_luma_enabled_flag
if (sps_bdpcm_luma_enabled_flag)
parse sps_bdpcm_chroma_common_enabled_flag
도 18은 본 개시의 실시예 5에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 18에 도시된 바와 같이, sps_transform_skip_enabled_flag가 파싱되고, 해당 값이 1인 경우에만 sps_bdpcm_luma_enabled_flag가 파싱될 수 있다. 또한, sps_bdpcm_luma_enabled_flag가 1인 경우에만 sps_bdpcm_chroma_common_enabled_flag가 파싱될 수 있다.
<실시예 6>
본 실시예에 따르면, 루마 채널과는 독립적으로 Cb 채널 및 Cr 채널의 각각에 대해 BDPCM 기술이 활성화되는지 여부를 나타내는 정보를 시그널링할 수 있다. 이 때, 예컨대, sps_bdpcm_chroma_cb_enabled_flag와 sps_bdpcm_chroma_cr_enabled_flag가 이용될 수 있다.
본 실시예에 따르면, 관련 신택스 요소의 파싱은 아래와 같이 동작할 수 있다.
parse sps_bdpcm_luma_enabled_flag
parse sps_bdpcm_chroma_cb_enabled_flag
parse sps_bdpcm_chroma_cr_enabled_flag
도 19는 본 개시의 실시예 6에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 19에 도시된 바와 같이, sps_transform_skip_enabled_flag가 파싱되고, 해당 값이 1인 경우에만 sps_bdpcm_luma_enabled_flag가 파싱될 수 있다. 또한, sps_bdpcm_luma_enabled_flag의 값과 무관하게, chroma_format_idc가 3인 경우, sps_bdpcm_chroma_cb_enabled_flag 및 sps_bdpcm_chroma_cr_enabled_flag가 파싱될 수 있다. 이 때, chroma_format_idc에 관한 조건은 본 개시의 다른 실시예에서 설명된 바와 같이 변경될 수 있다.
<실시예 7>
본 실시예에 따르면, BDPCM 적용시 채널들 간의 선택적인 정보 공유를 수행할 수 있다. 즉, 채널간 예측이 효과적인 영상 또는 블록에 대하여는, bdpcm_enabled_flag 정보가 복수의 채널들의 각각에 대해 시그널링될 필요가 없다. 왜냐하면, 채널들 간의 유사성이 높은 경우, 각 채널들에 대한 bdpcm_enabled_flag의 값들이 동일할 확률이 높기 때문이다. 이러한 영상의 특징이 존재함에도 불구하고, 영상을 구성하는 채널들의 각각에 대해 bdpcm_enabled_flag를 전송하는 것은 압축률의 관점에서 효율적이지 않다. 따라서 채널간 연관성(유사성)이 높다고 간주되는 특정 조건하에서 크로마 채널에 대한 bdpcm_enabled_flag를 별도로 파싱하지 않을 수 있다. 이 때, 크로마 채널에 대해서는 루마 채널에 대한 bdpcm_enabled_flag의 값을 공유할 수 있다.
도 20은 본 개시의 실시예 7에 따른 시퀀스 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 20에 도시된 바와 같이, sps_transform_skip_enabled_flag가 파싱되고, 해당 값이 1인 경우에만 sps_bdpcm_luma_enabled_flag가 파싱될 수 있다. 또한, sps_bdpcm_chroma_enabled_flag는 시그널링되지 않을 수 있다. 이 때, sps_bdpcm_chroma_enabled_flag의 값은 sps_bdpcm_luma_enabled_flag의 값으로 설정될 수 있다.
도 21은 본 개시의 실시예 7에 따른 CU 레벨에서의 BDPCM 관련 정보의 시그널링을 설명하기 위한 도면이다.
도 21에 도시된 바와 같이, CU 레벨에서의 BDPCM 관련 정보는 루마 채널에 대한 intra_bdpcm_luma_flag 및/또는 intra_bdpcm_luma_dir_flag를 포함할 수 있다. 이 때, 크로마 채널에 대한 intra_bdpcm_chroma_flag와 intra_bdpcm_chroma_dir_flag는 별도로 시그널링되지 않을 수 있다.
도 22는 본 개시의 실시예 7에 따른 CU 레벨의 신택스 요소를 파싱하는 과정을 설명하기 위한 도면이다.
도 22에 도시된 바와 같이, 현재 블록이 루마 성분인 경우에는 BDPCM 기술의 적용 여부를 지시하는 intra_bdpcm_luma_flag를 파싱할 수 있다. intra_bdpcm_luma_flag가 1인 경우, BDPCM의 예측 방향을 나타내는 intra_bdpcm_luma_dir_flag를 파싱할 수 있다. 현재 블록이 크로마 성분인 경우에는 루마 성분에 대한 intra_bdpcm_luma_flag와 intra_bdpcm_luma_dir_flag를 공유할 수 있다. 따라서, 별도의 신택스 요소를 파싱하지 않고, intra_bdpcm_chroma_flag와 intra_bdpcm_chroma_dir_flag는 각각 intra_bdpcm_luma_flag와 intra_bdpcm_luma_dir_flag의 값으로 설정할 수 있다.
도 23은 본 개시의 실시예 7에 따른 TU 레벨의 신택스 구조를 설명하기 위한 도면이다.
본 개시의 실시예 7에 따르면, BDPCM 적용 여부는 3개의 채널 모두 공통의 신택스 요소(intra_bdpcm_luma_flag)에 기반하여 결정된다. 따라서, 도 23에 도시된 바와 같이, 각 채널에 대한 BDPCM 적용 여부를 검사할 때, 공통적으로 intra_bdpcm_luma_flag의 값을 이용할 수 있다.
상술한 실시예 1 내지 실시예 7은 단독으로 구현되거나 2개 이상의 실시예들이 결합된 형태로 구현될 수 있다. 2개 이상의 실시예들이 결합될 때, 하나의 실시예의 전부 또는 일부가 다른 실시예의 전부 또는 일부와 결합될 수 있다. 예컨대, 실시예 1과 실시예 7을 결합하여 새로운 실시예가 구현될 수 있다. 보다 구체적으로, BDPCM 가용 여부를 나타내는 플래그(bdpcm_enabled_flag)는 실시예 7에서와 같이 루마 채널과 크로마 채널에 대해 공통적으로 시그널링될 수 있다. 즉, sps_bdpcm_enabled_flag가 1인 것은, 루마 채널과 크로마 채널의 모두에 대해 BDPCM이 적용 가능한 것을 나타낼 수 있다. 또한, sps_bdpcm_enabled_flag가 0인 것은, 루마 채널과 크로마 채널의 모두에 대해 BDPCM이 적용 가능하지 않은 것을 나타낼 수 있다. 또한, sps_bdpcm_enabled_flag가 1일 때, CU 레벨에서의 BDPCM 관련 정보(bdpcm_flag 및/또는 bdpcm_dir_flag)의 시그널링은 실시예 1에서와 같이 영상의 컬러 포맷을 고려하여 수행될 수 있다. 보다 구체적으로, 도 9를 참조하여 설명한 바와 같이, 영상의 컬러 포맷에 따라 유도되는 SubWidthC 및 SubHeightC에 기반하여 intra_bdpcm_chroma_flag의 시그널링 여부를 결정할 수 있다.
이하에서, 본 개시의 실시예에 따른 영상 부호화 방법 및 영상 복호화 방법을 설명한다.
도 24는 본 개시에 따라 BDPCM 관련 정보를 결정하고 BDPCM을 수행하는 영상 부호화 방법을 설명하기 위한 흐름도이다.
도 24에 도시된 바와 같이, 영상 부호화 장치는 현재 영상에 대해 BDPCM을 활성화할지 여부를 결정할 수 있다(S2410). 영상 부호화 장치는 RDO 등 다양한 방법에 따라 BDPCM의 활성화 여부를 결정할 수 있다.
현재 영상에 대해 BDPCM이 활성화되지 않은 경우(S2420-No), 영상 부호화 장치는 현재 영상에 대한 BDPCM을 수행하지 않을 수 있다.
현재 영상에 대해 BDPCM이 활성화된 경우(S2420-Yes), 영상 부호화 장치는 현재 영상 내 블록들에 대해 BDPCM을 수행할 수 있다. 현재 영상에 대해 BDPCM을 활성화하는 것으로 결정된 경우, 이를 지시하는 정보를 비트스트림에 부호화하여 영상 복호화 장치로 전송할 수 있다. 예컨대, bdpcm_enabled_flag가 BDPCM 활성화 정보로서 부호화될 수 있다. 본 개시에 따르면, bdpcm_enabled_flag는 상위 레벨(e.g. 시퀀스 레벨)에서 시그널링될 수 있다. 또한, bdpcm_enabled_flag는 루마 채널과 크로마 채널에 대한 BDPCM 활성화 여부를 공통으로 나타낼 수 있다. 또한, 본 개시의 다른 실시예에 따르면 루마 채널에 대한 BDPCM 활성화 정보(e.g. bdpcm_luma_enabled_flag)와 크로마 채널에 대한 BDPCM 활성화 정보(e.g. bdpcm_chroma_enabled_flag)가 별개로 또는 독립적으로 시그널링될 수 있다. 또한, 본 개시의 다른 실시예에 따르면, Cb 채널과 Cr 채널에 대한 BDPCM 관련 정보가 공통되는지 여부를 나타내는 정보(e.g. bdpcm_chroma_common_flag)가 전송될 수 있다. 또한, 본 개시의 다른 실시예에 따르면, 인터 예측된 블록에 대한 BDPCM 활성화 정보(e.g. inter_bdpcm_enabled_flag)가 별도로 전송될 수 있다.
현재 영상에 대해 BDPCM이 활성화된 경우, 소정의 조건이 만족되는 블록에 대해서만 BDPCM이 수행될 수 있다. 예컨대, 현재 블록의 크기가 소정의 크기 이하일 때, BDPCM이 수행될 수 있다. 본 개시에 기재된 바와 같이, 예컨대, 현재 블록의 너비 및 높이가 MaxTsSize 이하일 때, 해당 블록에 대해 BDPCM이 수행될 수 있다. 본 개시의 다른 실시예에 따르면, 현재 블록이 크로마 블록일 때, 현재 블록의 너비 및 높이는 대응 루마 블록의 크기를 소정의 크로마 스케일링 팩터(chroma scaling factor)로 나눈 값으로 결정될 수 있다. 예컨대, 대응 루마 블록의 너비를 cbWidth, 높이를 cbHeight라 하고, 크로마 스케일링 팩터를 SubWidthC, SubHeightC라 할 때, 현재 크로마 블록의 너비 및 높이는 cbWidth/SubWidthC 및 cbHeignt/SubHeightC로 계산할 수 있다. 상기 크로마 스케일링 팩터는 현재 영상의 컬러 포맷에 따라 유도될 수 있음은 상술한 바와 같다.
또는 현재 블록이 크로마 블록일 때, 대응 루마 블록의 너비 및 높이가 각각 MaxTsSize와 크로마 스케일링 팩터를 곱한 값 이하일 때, 현재 크로마 블록에 대한 BDPCM 플래그를 시그널링할 수도 있다.
현재 블록의 크기가 소정의 조건을 만족하지 않는 경우(S2430-No), 영상 부호화 장치는 상기 현재 블록에 대해 BDPCM을 적용하지 않는 것으로 결정할 수 있다.
현재 블록의 크기가 소정의 조건을 만족하는 경우(S2430-Yes), 영상 부호화 장치는 상기 현재 블록에 대해 BDPCM을 적용할지 여부를 결정할 수 있다(S2440). 상술한 바와 같이, 영상 부호화 장치는 RDO 등의 다양한 방법을 통해 상기 현재 블록의 부호화에 BDPCM을 적용할지 여부를 결정할 수 있다.
현재 블록에 대해 BDPCM을 적용하지 않는 것으로 결정된 경우(S2450-No), 영상 부호화 장치는 BDPCM을 적용하지 않고 상기 현재 블록을 부호화할 수 있다. 이 경우, 영상 부호화 장치는 상기 현재 블록에 대한 BDPCM 플래그(e.g. bdpcm_flag)를 제2 값(예컨대, 0)으로 부호화할 수 있다. 또한, 이 경우, BDPCM의 예측 방향에 관한 정보는 부호화되지 않을 수 있다.
현재 블록에 대해 BDPCM을 적용하는 것으로 결정된 경우(S2450-Yes), 영상 부호화 장치는 상기 현재 블록에 대한 BDPCM 플래그(e.g. bdpcm_flag)를 제1 값(예컨대, 1)으로 부호화할 수 있다. 또한, 영상 부호화 장치는 BDPCM의 예측 방향을 결정하고(S2460), 상기 결정된 예측 방향에 따라 현재 블록에 대해 BDPCM을 수행할 수 있다. 상기 결정된 예측 방향은 BDPCM 방향 플래그(e.g. bdpcm_dir_flag)에 의해 시그널링될 수 있음은 상술한 바와 같다.
본 개시의 일 실시예에 따르면, 루마 채널 및 크로마 채널에 대해 공통의 BDPCM 플래그(bdpcm_flag)가 시그널링될 수 있다. 본 개시의 다른 실시예에 따르면, 루마 채널 및 크로마 채널의 각각에 대해 별개의 BDPCM 플래그(bdpcm_luma_flag, bdpcm_chroma_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 루마 채널, Cb 채널 및 Cr 채널의 각각에 대해 별개의 BDPCM 플래그(bdpcm_luma_flag, bdpcm_cb_flag, bdpcm_cr_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 인터 예측된 블록에 대한 BDPCM 플래그(inter_bdpcm_flag)가 별개로 시그널링될 수 있다.
또한, 본 개시의 일 실시예에 따르면, 루마 채널 및 크로마 채널에 대해 공통의 BDPCM 방향 플래그(bdpcm_dir_flag)가 시그널링될 수 있다. 본 개시의 다른 실시예에 따르면, 루마 채널 및 크로마 채널의 각각에 대해 별개의 BDPCM 방향 플래그(bdpcm_luma_dir_flag, bdpcm_chroma_dir_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 루마 채널, Cb 채널 및 Cr 채널의 각각에 대해 별개의 BDPCM 방향 플래그(bdpcm_luma_dir_flag, bdpcm_cb_dir_flag, bdpcm_cr_dir_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 인터 예측된 블록에 대한 BDPCM 플래그(inter_bdpcm_dir_flag)가 별개로 시그널링될 수 있다.
도 24에 도시된 실시예에서, 단계 S2440에 선행하여 단계 S2420 및 단계 S2430이 순차적으로 진행되는 것으로 설명되었다. 그러나 이에 한정되지 않으며, 단계 S2430이 단계 S2420에 선행하여 수행될 수도 있고, 단계 S2430과 단계 S2420이 동시에 수행될 수도 있다.
도 25는 본 개시에 따라 BDPCM 관련 정보를 획득하고 BDPCM을 수행하는 영상 복호화 방법을 설명하기 위한 흐름도이다.
도 25에 도시된 바와 같이, 영상 복호화 장치는 현재 영상에 대해 BDPCM을 활성화할지 여부를 나타내는 정보(BDPCM 활성화 정보)를 획득할 수 있다(S2510). 예컨대, bdpcm_enabled_flag가 BDPCM 활성화 정보로서 획득될 수 있다. 본 개시에 따르면, bdpcm_enabled_flag는 상위 레벨(e.g. 시퀀스 레벨)에서 시그널링될 수 있다. 또한, bdpcm_enabled_flag는 루마 채널과 크로마 채널에 대한 BDPCM 활성화 여부를 공통으로 나타낼 수 있다. 또한, 본 개시의 다른 실시예에 따르면 루마 채널에 대한 BDPCM 활성화 정보(e.g. bdpcm_luma_enabled_flag)와 크로마 채널에 대한 BDPCM 활성화 정보(e.g. bdpcm_chroma_enabled_flag)가 별개로 또는 독립적으로 시그널링될 수 있다. 또한, 본 개시의 또 다른 실시예에 따르면, Cb 채널과 Cr 채널에 대한 BDPCM 관련 정보가 공통되는지 여부를 나타내는 정보(e.g. bdpcm_chroma_common_flag)가 전송될 수 있다. 또한, 본 개시의 또 다른 실시예에 따르면, 인터 예측된 블록에 대한 BDPCM 활성화 정보(e.g. inter_bdpcm_enabled_flag)가 별도로 전송될 수 있다.
영상 복호화 장치는 획득한 BDPCM 활성화 정보에 기반하여 현재 영상에 대해 BDPCM이 활성화되는지 여부를 판단할 수 있다(S2520). 현재 영상에 대해 BDPCM이 활성화되지 않은 경우(S2520-No), 영상 복호화 장치는 현재 영상에 대한 BDPCM을 수행하지 않을 수 있다.
현재 영상에 대해 BDPCM이 활성화된 경우(S2520-Yes), 영상 복호화 장치는 현재 영상 내 블록들에 대해 BDPCM을 수행할 수 있다.
현재 영상에 대해 BDPCM이 활성화된 경우, 소정의 조건이 만족되는 블록에 대해서만 BDPCM이 수행될 수 있다. 예컨대, 현재 블록의 크기가 소정의 크기 이하일 때, BDPCM이 수행될 수 있다. 본 개시에 기재된 바와 같이, 예컨대, 현재 블록의 너비 및 높이가 MaxTsSize 이하일 때, 해당 블록에 대해 BDPCM이 수행될 수 있다. 본 개시의 다른 실시예에 따르면, 현재 블록이 크로마 블록일 때, 현재 블록의 너비 및 높이는 대응 루마 블록의 크기를 소정의 크로마 스케일링 팩터(chroma scaling factor)로 나눈 값으로 결정될 수 있다. 예컨대, 대응 루마 블록의 너비를 cbWidth, 높이를 cbHeight라 하고, 크로마 스케일링 팩터를 SubWidthC, SubHeightC라 할 때, 현재 크로마 블록의 너비 및 높이는 cbWidth/SubWidthC 및 cbHeignt/SubHeightC로 계산할 수 있다. 상기 크로마 스케일링 팩터는 현재 영상의 컬러 포맷에 따라 유도될 수 있음은 상술한 바와 같다.
따라서, 현재 영상에 대해 BDPCM이 활성화된 경우, 영상 복호화 장치는 현재 블록의 크기가 상기 소정의 조건을 만족하는지 여부를 확인할 수 있다(S2530).
현재 블록의 크기가 상기 소정의 조건을 만족하지 않는 경우(S2530-No), 영상 복호화 장치는 상기 현재 블록에 대해 BDPCM을 적용하지 않는 것으로 결정할 수 있다.
현재 블록의 크기가 상기 소정의 조건을 만족하는 경우(S2530-Yes), 영상 복호화 장치는 상기 현재 블록에 대해 BDPCM을 적용할지 여부를 나타내는 정보(BDPCM 적용 여부 정보)를 획득할 수 있다(S2540). 예컨대, bdpcm_flag가 BDPCM 적용 여부 정보로서 획득될 수 있다.
영상 복호화 장치는 획득한 BDPCM 적용 여부 정보에 기반하여 현재 블록에 대해 BDPCM을 적용할 지 여부를 판단할 수 있다(S2550).
현재 블록에 대해 BDPCM을 적용하지 않는 것으로 결정된 경우(S2550-No), 영상 복호화 장치는 BDPCM을 적용하지 않고 상기 현재 블록을 복호화할 수 있다.
현재 블록에 대해 BDPCM을 적용하는 것으로 결정된 경우(S2550-Yes), 영상 복호화 장치는 BDPCM의 예측 방향을 나타내는 BDPCM 방향 정보를 획득할 수 있다(S2560). 예컨대, bdpcm_dir_flag가 BDPCM 방향 정보로서 획득될 수 있다.
이후, 영상 복호화 장치는 BDPCM 방향 정보에 기반하여 결정된 BDPCM의 예측 방향에 따라 현재 블록에 대해 BDPCM을 수행할 수 있다(S2570).
본 개시의 일 실시예에 따르면, 루마 채널 및 크로마 채널에 대해 공통의 BDPCM 플래그(bdpcm_flag)가 시그널링될 수 있다. 본 개시의 다른 실시예에 따르면, 루마 채널 및 크로마 채널의 각각에 대해 별개의 BDPCM 플래그(bdpcm_luma_flag, bdpcm_chroma_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 루마 채널, Cb 채널 및 Cr 채널의 각각에 대해 별개의 BDPCM 플래그(bdpcm_luma_flag, bdpcm_cb_flag, bdpcm_cr_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 인터 예측된 블록에 대한 BDPCM 플래그(inter_bdpcm_flag)가 별개로 시그널링될 수 있다.
또한, 본 개시의 일 실시예에 따르면, 루마 채널 및 크로마 채널에 대해 공통의 BDPCM 방향 플래그(bdpcm_dir_flag)가 시그널링될 수 있다. 본 개시의 다른 실시예에 따르면, 루마 채널 및 크로마 채널의 각각에 대해 별개의 BDPCM 방향 플래그(bdpcm_luma_dir_flag, bdpcm_chroma_dir_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 루마 채널, Cb 채널 및 Cr 채널의 각각에 대해 별개의 BDPCM 방향 플래그(bdpcm_luma_dir_flag, bdpcm_cb_dir_flag, bdpcm_cr_dir_flag)가 시그널링될 수 있다. 본 개시의 또 다른 실시예에 따르면, 인터 예측된 블록에 대한 BDPCM 플래그(inter_bdpcm_dir_flag)가 별개로 시그널링될 수 있다.
도 25에 도시된 실시예에서, 단계 S2540에 선행하여 단계 S2520 및 단계 S2530이 순차적으로 진행되는 것으로 설명되었다. 그러나 이에 한정되지 않으며, 단계 S2530이 단계 S2520에 선행하여 수행될 수도 있고, 단계 S2530과 단계 S2520이 동시에 수행될 수도 있다.
본 개시에 기재된 신택스 요소의 의미는 해당 신택스 요소의 이름에 기초하여 다음과 같이 해석될 수 있다. 신택스 요소의 이름에 포함된 “sps_”는 해당 신택스 요소가 시퀀스 레벨(e.g. 시퀀스 파라미터 세트)에서 시그널링됨을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_bdpcm_”은 해당 신택스 요소가 bdpcm과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_intra_”은 해당 신택스 요소가 인트라 예측과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_inter_”은 해당 신택스 요소가 인터 예측과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_luma_”은 해당 신택스 요소가 루마 채널(성분)과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_chroma_”은 해당 신택스 요소가 크로마 채널(성분)과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_cb_”은 해당 신택스 요소가 Cb 채널(성분)과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_cr_”은 해당 신택스 요소가 Cr 채널(성분)과 관련된 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_bdpcm_…_enabled_flag”은 해당 신택스 요소가 BDPCM의 허용 여부를 나타내는 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_bdpcm_…_dir_flag”은 해당 신택스 요소가 BDPCM의 예측 방향을 나타내는 정보임을 나타낼 수 있다. 신택스 요소의 이름에 포함된 “_chroma_common_”은 해당 신택스 요소가 크로마 채널에 공통으로 적용되는 정보임을 나타낼 수 있다.
상술한 실시예들에서, 방법들은 일련의 단계 또는 유닛으로서 순서도를 기초로 설명되고 있으나, 본 개시는 단계들의 순서에 한정되는 것은 아니며, 어떤 단계는 상술한 바와 다른 단계와 다른 순서로 또는 동시에 발생할 수 있다. 또한, 당해 기술 분야에서 통상의 지식을 가진 자라면 순서도에 나타난 단계들이 배타적이지 않고, 다른 단계가 포함되거나, 순서도의 하나 또는 그 이상의 단계가 본 개시의 범위에 영향을 미치지 않고 삭제될 수 있음을 이해할 수 있을 것이다.
상술한 실시예는 다양한 양태의 예시들을 포함한다. 다양한 양태들을 나타내기 위한 모든 가능한 조합을 기술할 수는 없지만, 해당 기술 분야의 통상의 지식을 가진 자는 다른 조합이 가능함을 인식할 수 있을 것이다. 따라서, 본 개시는 이하의 특허청구범위 내에 속하는 모든 다른 교체, 수정 및 변경을 포함한다고 할 것이다.
이상 설명된 본 개시에 따른 실시예들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 개시를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 개시에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상에서 본 개시가 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나, 이는 본 개시의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 개시가 상기 실시예들에 한정되는 것은 아니며, 본 개시가 속하는 기술분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형을 꾀할 수 있다.
따라서, 본 개시의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 개시의 사상의 범주에 속한다고 할 것이다.
본 개시에 따른 실시예는 영상을 부호화/복호화하는데 이용될 수 있다.

Claims (23)

  1. 영상 복호화 장치에 의해 수행되는 영상 복호화 방법으로서,
    상기 영상 복호화 방법은
    현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 획득하는 단계;
    상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 획득하는 단계;
    상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 획득하는 단계; 및
    상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하는 단계를 포함하고,
    상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타내는 영상 복호화 방법.
  2. 제1항에 있어서,
    상기 제1 정보는 시퀀스 레벨에서 전송되는 영상 복호화 방법.
  3. 제1항에 있어서,
    상기 제2 정보는 CU 레벨에서 전송되는 영상 복호화 방법.
  4. 제1항에 있어서,
    상기 제2 정보는, 상기 제1 정보가 상기 현재 영상에 대해 BDPCM이 적용 가능함을 나타내는 경우에 획득되는 영상 복호화 방법.
  5. 제1항에 있어서,
    상기 제3 정보는, 상기 제2 정보가 상기 현재 블록에 대해 상기 BDPCM이 적용됨을 나타내는 경우에 획득되는 영상 복호화 방법.
  6. 제1항에 있어서,
    상기 제2 정보는, 상기 현재 블록의 크기가 소정의 크기 이하인 경우에 획득되는 영상 복호화 방법.
  7. 제6항에 있어서,
    상기 현재 블록이 루마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기인 영상 복호화 방법.
  8. 제6항에 있어서,
    상기 현재 블록이 크로마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기이고, 상기 현재 블록의 크기는 상기 현재 블록에 대응하는 루마 성분 블록의 크기와 크로마 스케일링 팩터(chroma scaling factor)에 기반하여 결정되는 영상 복호화 방법.
  9. 제8항에 있어서,
    상기 크로마 스케일링 팩터는 2임을 특징으로 하는 영상 복호화 방법.
  10. 제8항에 있어서,
    상기 크로마 스케일링 팩터는 상기 현재 영상의 컬러 포맷에 기반하여 결정되는 영상 복호화 방법.
  11. 영상 부호화 장치에 의해 수행되는 영상 부호화 방법으로서,
    상기 영상 부호화 방법은
    현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 결정하는 단계;
    상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 결정하는 단계;
    상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 결정하는 단계; 및
    상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하는 단계를 포함하고,
    상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타내는 영상 부호화 방법.
  12. 제11항에 있어서,
    상기 제1 정보는 시퀀스 레벨에서 부호화되는 영상 부호화 방법.
  13. 제11항에 있어서,
    상기 제2 정보는 CU 레벨에서 부호화되는 영상 부호화 방법.
  14. 제11항에 있어서,
    상기 제2 정보는, 상기 제1 정보가 상기 현재 영상에 대해 BDPCM이 적용 가능함을 나타내는 경우에 부호화되는 영상 부호화 방법.
  15. 제11항에 있어서,
    상기 제3 정보는, 상기 제2 정보가 상기 현재 블록에 대해 상기 BDPCM이 적용됨을 나타내는 경우에 부호화되는 영상 부호화 방법.
  16. 제11항에 있어서,
    상기 제2 정보는, 상기 현재 블록의 크기가 소정의 크기 이하인 경우에 부호화되는 영상 부호화 방법.
  17. 제16항에 있어서,
    상기 현재 블록이 루마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기인 영상 부호화 방법.
  18. 제16항에 있어서,
    상기 현재 블록이 크로마 성분 블록인 경우, 상기 소정의 크기는 변환 스킵이 가능한 최대 블록 크기이고, 상기 현재 블록의 크기는 상기 현재 블록에 대응하는 루마 성분 블록의 크기와 크로마 스케일링 팩터(chroma scaling factor)에 기반하여 결정되는 영상 부호화 방법.
  19. 제18항에 있어서,
    상기 크로마 스케일링 팩터는 2임을 특징으로 하는 영상 부호화 방법.
  20. 제18항에 있어서,
    상기 크로마 스케일링 팩터는 상기 현재 영상의 컬러 포맷에 기반하여 결정되는 영상 부호화 방법.
  21. 메모리 및 적어도 하나의 프로세서를 포함하는 영상 복호화 장치로서,
    상기 적어도 하나의 프로세서는
    현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 획득하고,
    상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 획득하고,
    상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 획득하고,
    상기 제3 정보에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하고,
    상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타내는 영상 복호화 장치.
  22. 메모리 및 적어도 하나의 프로세서를 포함하는 영상 부호화 장치로서,
    상기 적어도 하나의 프로세서는
    현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 결정하고,
    상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 결정하고,
    상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 결정하고,
    상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하고,
    상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타내는 영상 부호화 장치.
  23. 영상 부호화 방법에 의해 생성된 비트스트림을 저장한 컴퓨터 판독 가능한 기록 매체로서, 상기 영상 부호화 방법은,
    현재 영상에 대해 BDPCM(Block-based Differential Pulse Coded Modulation)이 적용 가능한지 여부를 나타내는 제1 정보를 결정하는 단계;
    상기 제1 정보에 기반하여 상기 현재 영상 내 현재 블록에 대해 상기 BDPCM이 적용되는지 여부를 나타내는 제2 정보를 결정하는 단계;
    상기 제2 정보에 기반하여 상기 BDPCM의 예측 방향을 나타내는 제3 정보를 결정하는 단계; 및
    상기 BDPCM의 예측 방향에 기반하여 상기 현재 블록에 대해 상기 BDPCM을 적용하는 단계를 포함하고,
    상기 제1 정보는 상기 현재 블록의 루마 성분과 크로마 성분의 모두에 대한 BDPCM의 활성화 여부를 나타내는 컴퓨터 판독 가능한 기록 매체.
KR1020227022817A 2020-01-10 2021-01-11 Bdpcm을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 KR20220109453A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020200003617 2020-01-10
KR20200003617 2020-01-10
PCT/KR2021/000309 WO2021141462A1 (ko) 2020-01-10 2021-01-11 Bdpcm을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Publications (1)

Publication Number Publication Date
KR20220109453A true KR20220109453A (ko) 2022-08-04

Family

ID=76788840

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227022817A KR20220109453A (ko) 2020-01-10 2021-01-11 Bdpcm을 이용한 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Country Status (5)

Country Link
US (1) US20230044258A1 (ko)
EP (1) EP4090029A4 (ko)
KR (1) KR20220109453A (ko)
CN (1) CN115244929A (ko)
WO (1) WO2021141462A1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11323747B2 (en) * 2013-06-05 2022-05-03 Qualcomm Incorporated Residual differential pulse code modulation (DPCM) extensions and harmonization with transform skip, rotation, and scans
KR101845622B1 (ko) * 2016-08-31 2018-04-05 이화여자대학교 산학협력단 영상에 대한 적응적 rdpcm 방법, 적응적 rdpcm에 기반한 인코딩 방법 및 적응적 rdpcm에 기반한 디코딩 방법

Also Published As

Publication number Publication date
US20230044258A1 (en) 2023-02-09
WO2021141462A1 (ko) 2021-07-15
EP4090029A1 (en) 2022-11-16
EP4090029A4 (en) 2023-07-19
CN115244929A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
US11943485B2 (en) Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto
KR101867884B1 (ko) 인트라 예측 모드 부호화/복호화 방법 및 장치
US9888249B2 (en) Devices and methods for sample adaptive offset coding and/or selection of edge offset parameters
EP3205094B1 (en) Qp derivation and offset for adaptive color transform in video coding
EP3080991B1 (en) Improved palette mode in hevc
EP3257246B1 (en) Restriction on palette block size in video coding
US9924175B2 (en) Determining application of deblocking filtering to palette coded blocks in video coding
EP3080988B1 (en) Parameter derivation for entropy coding of a syntax element
US7711196B2 (en) Apparatus and method for generating coded block pattern for alpha channel image and alpha channel image encoding/decoding apparatus and method using the same
US9872034B2 (en) Devices and methods for signaling sample adaptive offset (SAO) parameters
US20140169452A1 (en) Video encoding method and apparatus using the same
KR20160070771A (ko) 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징
WO2012138032A1 (ko) 영상 정보 부호화 방법 및 복호화 방법
US20140092975A1 (en) Devices and methods for using base layer motion vector for enhancement layer motion vector prediction
US11039166B2 (en) Devices and methods for using base layer intra prediction mode for enhancement layer intra mode prediction
US11483587B2 (en) Video encoding/decoding method and device using BDPCM, and method for transmitting bitstream
GB2521410A (en) Method and apparatus for encoding or decoding blocks of pixel
KR20220051373A (ko) 변환 스킵 및 팔레트 코딩 관련 정보의 시그널링 기반 영상 또는 비디오 코딩
US11962782B2 (en) Encoding and decoding with refinement of the reconstructed picture
KR102349435B1 (ko) 양자화 행렬의 부호화 방법 및 복호화 방법과 이를 이용하는 장치
US20230044258A1 (en) Image encoding/decoding method and apparatus using bdpcm, and recording medium storing bitstream
KR20200081207A (ko) 움직임정보 표현 방법 및 이를 이용한 영상 복호화 장치
CN114830650A (zh) 图像编码方法和图像解码方法
CN114788270A (zh) 图像编码方法和图像解码方法