KR20170008816A - 팔레트 기반 비디오 코딩에서 팔레트 인덱스에 기초한 런 값들의 코딩 - Google Patents

팔레트 기반 비디오 코딩에서 팔레트 인덱스에 기초한 런 값들의 코딩 Download PDF

Info

Publication number
KR20170008816A
KR20170008816A KR1020167035380A KR20167035380A KR20170008816A KR 20170008816 A KR20170008816 A KR 20170008816A KR 1020167035380 A KR1020167035380 A KR 1020167035380A KR 20167035380 A KR20167035380 A KR 20167035380A KR 20170008816 A KR20170008816 A KR 20170008816A
Authority
KR
South Korea
Prior art keywords
palette
coding
run
bin
video
Prior art date
Application number
KR1020167035380A
Other languages
English (en)
Other versions
KR102416949B1 (ko
Inventor
바딤 세레긴
라잔 랙스맨 조쉬
마르타 카르체비츠
웨이 푸
로할스 호엘 솔레
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20170008816A publication Critical patent/KR20170008816A/ko
Application granted granted Critical
Publication of KR102416949B1 publication Critical patent/KR102416949B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

일 예에서, 비디오 데이터를 프로세싱하는 방법은 비디오 데이터의 블록의 팔레트 인덱스의 런의 런 길이를 나타내는 런 값을 결정하는 단계로서, 상기 팔레트 인덱스는 상기 비디오 데이터의 블록을 코딩하기 위해 컬러 값들의 팔레트에서의 컬러 값과 연관되는, 상기 런 값을 결정하는 단계를 포함하고, 상기 방법은 또한, 상기 팔레트 인덱스에 기초하여 상기 런 값을 표현하는 데이터의 콘텍스트 적응 코딩을 위한 콘텍스트를 결정하는 단계, 및 결정된 콘텍스트에 기초하여 비트스트림으로부터 런 값을 표현하는 상기 데이터를 코딩하는 단계를 더 포함한다.

Description

팔레트 기반 비디오 코딩에서 팔레트 인덱스에 기초한 런 값들의 코딩{CODING RUN VALUES BASED ON PALETTE INDEX IN PALETTE-BASED VIDEO CODING}
본 출원은 2014년 5월 23일자로 출원된 미국 임시 출원 제62/002,717호, 2014년 6월 9일 자로 출원된 미국 임시 출원 제62/009,772호, 2014년 6월 20일자로 출원된 미국 임시 출원 제62/015,261호, 2014년 6월 30일자로 출원된 미국 임시 출원 제62/019,223호, 2014년 10월 3일자로 출원된 미국 임시 출원 제62/059,659호, 및 2014년 10월 17일자로 출원된 미국 임시 출원 제62/065,526호를 우선권 주장하며, 그것들의 각각의 전체 내용들은 참조로 본원에 통합된다.
본 개시물은 비디오 인코딩 및 디코딩에 관한 것이다.
디지털 비디오 능력들은 디지털 텔레비전들, 디지털 직접 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, 개인 정보 단말기들 (personal digital assistants, PDA들), 랩톱 또는 데스크톱 컴퓨터들, 태블릿 컴퓨터들, e-북 리더들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 무선 전화기들, 이른바 "스마트 폰들", 비디오 원격회의 디바이스들, 비디오 스트리밍 디바이스들 등을 포함한 넓은 범위의 디바이스들에 통합될 수 있다. 디지털 비디오 디바이스들은 MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, 파트 10, 고급 비디오 코딩 (Advanced Video Coding, AVC) 에 의해 규정된 표준들, 현재 개발중인 고 효율 비디오 코딩 (High Efficiency Video Coding, HEVC) 표준, 및 이러한 표준들의 확장본들에 기재된 것들과 같은 비디오 압축 기법들을 구현한다. 비디오 디바이스들은 이러한 비디오 압축 기법들을 구현하는 것에 의해 디지털 비디오 정보를 더 효율적으로 송신, 수신, 인코딩, 디코딩, 및/또는 저장할 수도 있다.
비디오 압축 기법들은 공간적 (픽처 내) 예측 및/또는 시간적 (픽처 간) 예측을 수행하여 비디오 시퀀스들에 내재하는 리던던시를 감소시키거나 또는 제거한다. 블록 기반 비디오 코딩의 경우, 비디오 슬라이스 (즉, 비디오 프레임 또는 비디오 프레임의 부분) 가 비디오 블록들로 구획화될 수도 있다. 픽처의 인트라 코딩식 (intra-coded; I) 슬라이스에서의 비디오 블록들은 동일한 픽처의 이웃 블록들에서의 참조 샘플들에 관한 공간적 예측을 이용하여 인코딩된다. 픽처의 인터 코딩식 (inter-coded; P 또는 B) 슬라이스에서의 비디오 블록들은 동일한 픽처의 이웃 블록들에서의 참조 샘플들에 관한 공간적 예측 또는 다른 참조 픽처들에서의 참조 샘플들에 관한 시간적 예측을 이용할 수도 있다. 픽처들은 프레임들이라고 지칭될 수도 있고, 참조 픽처들은 참조 프레임들이라고 지칭될 수도 있다.
공간적 또는 시간적 예측은 코딩될 블록에 대한 예측 블록이 생겨나게 한다. 잔차 데이터는 코딩될 원래의 블록과 예측 블록 사이의 화소 차이들을 나타낸다. 인터 코딩식 블록이 예측 블록을 형성하는 참조 샘플들의 블록을 가리키는 모션 벡터 (motion vector) 에 따라 인코딩되고, 잔차 데이터는 코딩된 블록 및 예측 블록 간의 차이를 나타낸다. 인트라 코딩식 블록이 인트라 코딩 모드 및 잔차 데이터에 따라 인코딩된다. 추가 압축을 위해, 잔차 데이터는 화소 도메인으로부터 변환 도메인으로 변환될 수도 있으며, 결과적으로 잔차 계수들이 생겨나며, 그 계수들은 그 다음에 양자화될 수도 있다. 처음에는 2차원 어레이로 배열된 양자화된 계수들은, 계수들의 1차원 벡터를 생성하기 위하여 스캔될 수도 있고, 엔트로피 코딩이 더 많은 압축을 달성하기 위해 적용될 수도 있다.
본 개시물의 기법들은 팔레트 (palette) 기반 비디오 코딩에 관련된다. 예를 들어, 팔레트 기반 코딩에서, 비디오 코더 (비디오 인코더 또는 비디오 디코더) 가 특정 영역 (예컨대, 주어진 블록) 의 비디오 데이터를 표현하기 위한 컬러들의 테이블로서 "팔레트"를 형성할 수도 있다. 팔레트 기반 코딩은 비교적 적은 수의 컬러들을 갖는 비디오 데이터의 영역들을 코딩하는데 특히 유용할 수도 있다. 실제 화소 값들 (또는 그것들의 잔차들) 을 코딩하는 것이 아니라, 비디오 코더는 화소들을 그 화소들의 컬러들을 표현하는 팔레트에서의 엔트리들과 관련시키는 하나 이상의 화소들에 대한 인덱스 값들을 코딩할 수도 있다. 본 개시물에서 설명되는 기법들은 팔레트 엔트리들을 예측하는 것, 팔레트 인덱스들의 런들을 코딩하는 것, 및 다양한 다른 팔레트 코딩 기법들 중 하나 이상의 다양한 조합들을 위한 기법들을 포함할 수도 있다.
일 예에서, 비디오 데이터를 프로세싱하는 방법이, 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정하는 단계로서, 제 1 팔레트는 하나 이상의 팔레트 엔트리들을 포함하며 각각의 팔레트 엔트리는 비디오 데이터의 블록을 코딩하기 위한 컬러 값에 연관되는 팔레트 인덱스를 포함하는, 상기 제 1 팔레트를 결정하는 단계, 제 1 블록 뒤에 코딩되는 블록들의 제 1 행에서의 비디오 데이터의 적어도 하나의 제 2 블록의 적어도 하나의 제 2 팔레트를 구축하기 위한 예측자 (predictor) 팔레트를 생성하는 단계로서, 예측자 팔레트는 제 1 블록이 아닌 제 1 행의 하나 이상의 블록들로부터의 적어도 하나의 팔레트 엔트리를 포함하는, 상기 예측자 팔레트를 생성하는 단계, 블록들의 제 2 행에 위치된 비디오 데이터의 제 3 블록의 제 3 팔레트를 결정하기 위해 예측자 팔레트를 재초기화하는 단계로서, 예측자 팔레트를 재초기화하는 단계는 제 1 팔레트의 하나 이상의 팔레트 엔트리들 또는 제 1 블록을 코딩한 후에 생성된 초기 예측자 팔레트에 기초하여 예측자 팔레트를 재초기화하는 단계를 포함하는, 상기 예측자 팔레트를 재초기화하는 단계, 재초기화된 예측자 팔레트에 기초하여 제 3 블록의 제 3 팔레트를 결정하는 단계, 및 제 3 팔레트를 사용하여 제 3 블록을 코딩하는 단계를 포함한다.
다른 예에서, 비디오 데이터를 프로세싱하는 디바이스가, 비디오 데이터의 제 1 블록, 비디오 데이터의 적어도 하나의 제 2 블록 및 비디오 데이터의 제 3 블록을 저장하도록 구성되는 메모리와, 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정하는 것으로서, 제 1 팔레트는 하나 이상의 팔레트 엔트리들을 포함하며 각각의 팔레트 엔트리는 비디오 데이터의 블록을 코딩하기 위한 컬러 값에 연관되는 팔레트 인덱스를 포함하는, 상기 제 1 팔레트를 결정하고, 제 1 블록 뒤에 코딩되는 블록들의 제 1 행에서의 비디오 데이터의 적어도 하나의 제 2 블록의 적어도 하나의 제 2 팔레트를 구축하기 위한 예측자 팔레트를 생성하는 것으로서, 예측자 팔레트는 제 1 블록이 아닌 제 1 행의 하나 이상의 블록들로부터의 적어도 하나의 팔레트 엔트리를 포함하는, 상기 예측자 팔레트를 생성하고, 블록들의 제 2 행에 위치된 비디오 데이터의 제 3 블록의 제 3 팔레트를 결정하기 위해 예측자 팔레트를 재초기화하는 것으로서, 예측자 팔레트를 재초기화하는 것은 제 1 팔레트의 상기 하나 이상의 팔레트 엔트리들 또는 제 1 블록을 코딩한 후에 생성된 초기 예측자 팔레트에 기초하여 예측자 팔레트를 재초기화하는 것을 포함하는, 상기 예측자 팔레트를 재초기화하고, 재초기화된 예측자 팔레트에 기초하여 제 3 블록의 제 3 팔레트를 결정하고, 그리고 제 3 팔레트를 사용하여 제 3 블록을 코딩하도록 구성되는 하나 이상의 프로세서들을 포함한다.
다른 예에서, 비디오 데이터를 프로세싱하는 장치가, 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정하는 수단으로서, 제 1 팔레트는 하나 이상의 팔레트 엔트리들을 포함하며 각각의 팔레트 엔트리는 비디오 데이터의 블록을 코딩하기 위한 컬러 값에 연관되는 팔레트 인덱스를 포함하는, 상기 제 1 팔레트를 결정하는 수단, 제 1 블록 뒤에 코딩되는 블록들의 제 1 행에서의 비디오 데이터의 적어도 하나의 제 2 블록의 적어도 하나의 제 2 팔레트를 구축하기 위한 예측자 팔레트를 생성하는 수단으로서, 예측자 팔레트는 제 1 블록이 아닌 제 1 행의 하나 이상의 블록들로부터의 적어도 하나의 팔레트 엔트리를 포함하는, 상기 예측자 팔레트를 생성하는 수단, 블록들의 제 2 행에 위치된 비디오 데이터의 제 3 블록의 제 3 팔레트를 결정하기 위해 예측자 팔레트를 재초기화하는 수단으로서, 예측자 팔레트를 재초기화하는 것은 제 1 팔레트의 하나 이상의 팔레트 엔트리들 또는 제 1 블록을 코딩한 후에 생성된 초기 예측자 팔레트 또는 제 1 블록을 코딩한 후에 생성된 초기 예측자 팔레트에 기초하여 예측자 팔레트를 재초기화하는 것을 포함하는, 상기 예측자 팔레트를 재초기화하는 수단, 재초기화된 예측자 팔레트에 기초하여 제 3 블록의 제 3 팔레트를 결정하는 수단, 및 제 3 팔레트를 사용하여 제 3 블록을 코딩하는 수단을 포함한다.
다른 예에서, 비일시적 컴퓨터 판독가능 매체는 저장된 명령들을 갖고, 상기 명령들은, 실행되는 경우, 하나 이상의 프로세서들로 하여금, 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정하게 하는 것으로서, 제 1 팔레트는 하나 이상의 팔레트 엔트리들을 포함하며 각각의 팔레트 엔트리는 비디오 데이터의 상기 블록을 코딩하기 위한 컬러 값에 연관되는 팔레트 인덱스를 포함하는, 상기 제 1 팔레트를 결정하게 하고, 제 1 블록 뒤에 코딩되는 블록들의 제 1 행에서의 비디오 데이터의 적어도 하나의 제 2 블록의 적어도 하나의 제 2 팔레트를 구축하기 위한 예측자 팔레트를 생성하게 하는 것으로서, 예측자 팔레트는 제 1 블록이 아닌 제 1 행의 하나 이상의 블록들로부터의 적어도 하나의 팔레트 엔트리를 포함하는, 상기 예측자 팔레트를 생성하게 하고, 블록들의 제 2 행에 위치된 비디오 데이터의 제 3 블록의 제 3 팔레트를 결정하기 위해 예측자 팔레트를 재초기화하게 하는 것으로서, 예측자 팔레트를 재초기화하는 것은 제 1 팔레트의 하나 이상의 팔레트 엔트리들 또는 제 1 블록을 코딩한 후에 생성된 초기 예측자 팔레트에 기초하여 예측자 팔레트를 재초기화하는 것을 포함하는, 상기 예측자 팔레트를 재초기화하게 하고, 재초기화된 예측자 팔레트에 기초하여 제 3 블록의 제 3 팔레트를 결정하게 하며, 그리고 제 3 팔레트를 사용하여 제 3 블록을 코딩하게 한다.
다른 예에서, 비디오 데이터를 프로세싱하는 방법이, 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정하는 단계로서, 팔레트 인덱스는 비디오 데이터의 블록을 코딩하기 위한, 컬러 값들의 팔레트에서의 컬러 값에 연관되는, 상기 런 값을 결정하는 단계, 팔레트 인덱스에 기초하여 런 값을 나타내는 데이터의 콘텍스트 적응 코딩에 대한 콘텍스트를 결정하는 단계, 및 결정된 콘텍스트를 사용하여 비트스트림으로부터 런 값을 나타내는 데이터를 코딩하는 단계를 포함한다.
다른 예에서, 비디오 데이터를 프로세싱하는 디바이스는, 비디오 데이터의 블록을 저장하도록 구성되는 메모리와, 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정하는 것으로서, 팔레트 인덱스는 비디오 데이터의 블록을 코딩하기 위한, 컬러 값들의 팔레트에서의 컬러 값에 연관되는, 상기 런 값을 결정하고, 팔레트 인덱스에 기초하여 런 값을 나타내는 데이터의 콘텍스트 적응 코딩에 대한 콘텍스트를 결정하고, 그리고 결정된 콘텍스트를 사용하여 비트스트림으로부터 런 값을 나타내는 데이터를 코딩하도록 구성되는 하나 이상의 프로세서들을 포함한다.
다른 예에서, 비디오 데이터를 프로세싱하는 장치는, 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정하는 수단으로서, 팔레트 인덱스는 비디오 데이터의 블록을 코딩하기 위한, 컬러 값들의 팔레트에서의 컬러 값에 연관되는, 상기 런 값을 결정하는 수단, 팔레트 인덱스에 기초하여 런 값을 나타내는 데이터의 콘텍스트 적응 코딩에 대한 콘텍스트를 결정하는 수단, 및 결정된 콘텍스트를 사용하여 비트스트림으로부터 런 값을 나타내는 데이터를 코딩하는 수단을 포함한다.
다른 예에서, 비일시적 컴퓨터 판독가능 매체는 저장된 명령들을 갖고, 상기 명령들은, 실행되는 경우, 하나 이상의 프로세서들로 하여금, 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정하게 하는 것으로서, 팔레트 인덱스는 비디오 데이터의 블록을 코딩하기 위한, 컬러 값들의 팔레트에서의 컬러 값에 연관되는, 상기 런 값을 결정하게 하고, 팔레트 인덱스에 기초하여 런 값을 나타내는 데이터의 콘텍스트 적응 코딩에 대한 콘텍스트를 결정하게 하고, 그리고 결정된 콘텍스트를 사용하여 비트스트림으로부터 런 값을 나타내는 데이터를 코딩하게 한다.
다른 예에서, 비디오 데이터를 프로세싱하는 방법은, 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정하는 단계로서, 팔레트 인덱스들은 비디오 데이터의 블록을 코딩하기 위한 하나 이상의 컬러들의 팔레트에 대응하고, 제 1 행의 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들 및 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 1 행의 팔레트 인덱스들을 결정하는 단계와, 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 코딩하는 단계로서, 런은 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 2 행의 팔레트 인덱스들의 런을 코딩하는 단계를 포함한다.
다른 예에서, 비디오 데이터를 프로세싱하는 디바이스는, 비디오 데이터의 블록을 저장하도록 구성되는 메모리와, 하나 이상의 프로세서들을 포함하고, 상기 하나 이상의 프로세서들은, 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정하는 것으로서, 팔레트 인덱스들은 비디오 데이터의 블록을 코딩하기 위한 하나 이상의 컬러들의 팔레트에 대응하고, 제 1 행의 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 1 행의 팔레트 인덱스들을 결정하고, 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 코딩하는 것으로서, 런은 팔레트에서의 컬러 값에 연관된 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 2 행의 팔레트 인덱스들의 런을 코딩하도록 구성된다.
다른 예에서, 비디오 데이터를 프로세싱하는 장치가, 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정하는 수단으로서, 팔레트 인덱스들은 비디오 데이터의 블록을 코딩하기 위한 하나 이상의 컬러들의 팔레트에 대응하고, 제 1 행의 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 1 행의 팔레트 인덱스들을 결정하는 수단과, 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 코딩하는 수단으로서, 런은 팔레트에서의 컬러 값에 연관된 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 2 행의 팔레트 인덱스들의 런을 코딩하는 수단을 포함한다.
다른 예에서, 비일시적 컴퓨터 판독가능 매체는 저장된 명령들을 갖고, 상기 명령들은, 실행되는 경우, 하나 이상의 프로세서들로 하여금, 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정하게 하는 것으로서, 팔레트 인덱스들은 비디오 데이터의 블록을 코딩하기 위한 하나 이상의 컬러들의 팔레트에 대응하고, 제 1 행의 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 1 행의 팔레트 인덱스들을 결정하게 하고, 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 코딩하게 하는 것으로서, 런은 팔레트에서의 컬러 값에 연관된 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함하는, 상기 제 2 행의 팔레트 인덱스들의 런을 코딩하게 하게 한다.
본 개시물의 하나 이상의 예들의 상세는 첨부 도면들 및 다음의 설명에서 언급된다. 다른 특징들, 목적들, 및 장점들은 상세한 설명, 도면들, 및 청구항들로부터 명확하게 될 것이다.
도 1은 본 개시물에서 설명되는 기법들을 이용할 수도 있는 일 예의 비디오 코딩 시스템을 도시하는 블록도이다.
도 2는 본 개시물에서 설명되는 기법들을 구현할 수도 있는 일 예의 비디오 인코더를 도시하는 블록도이다.
도 3은 본 개시물에서 설명되는 기법들을 구현할 수도 있는 일 예의 비디오 디코더를 도시하는 블록도이다.
도 4는 본 개시물의 기법들에 부합하는 팔레트 기반 비디오 코딩을 위한 팔레트 엔트리들을 결정하는 일 예를 도시하는 개념도이다.
도 5는 고 효율 비디오 코딩 (HEVC) 표준에 따라 예의 타일들을 도시하는 개념도이다.
도 6은 파면 병렬 프로세싱 (wavefront parallel processing, WPP) 을 위한 파면들을 예시하는 개념도이다.
도 7은 본 개시물의 기법들에 부합하는 다수의 타일들 및 파면들의 존재 시의 예측자 팔레트 재설정의 일 예를 도시하는 개념도이다.
도 8은 본 개시물의 기법들에 부합하는 화소들의 블록에 대한 팔레트로의 인덱스들을 결정하는 일 예를 도시하는 개념도이다.
도 9는 본 개시물의 기법들에 부합하는 예측자 팔레트를 결정하는 일 예의 프로세스를 도시하는 흐름도이다.
도 10은 본 개시물의 기법들에 부합하는 팔레트 인덱스들의 런의 런 값을 코딩하기 위한 일 예의 프로세스를 도시하는 흐름도이다.
도 11은 본 개시물의 기법들에 부합하는 하나를 초과하는 팔레트 코딩 모드로 코딩된 인덱스들의 런을 코딩하는 일 예의 프로세스를 도시하는 흐름도이다.
본 개시물의 양태들은 비디오 코딩 및 비디오 데이터 압축을 위한 기법들에 관한 것이다. 특히, 본 개시물은 비디오 데이터의 팔레트 기반 코딩을 위한 기법들을 설명한다. 전통적인 비디오 코딩에서, 이미지들이 연속 톤이고 공간적으로 매끄러운 것으로 가정된다. 이들 가정들에 기초하여, 블록 기반 변환, 필터링, 및 다른 코딩 도구들과 같은 다양한 도구들이 개발되었고, 이러한 도구들은 자연 콘텐츠 비디오들에 대해 양호한 성능을 보여 주었다.
그러나, 원격 데스크톱, 협력 작업 및 무선 디스플레이 같은 애플리케이션들에서, 컴퓨터 생성된 스크린 콘텐츠가 압축될 지배적인 콘텐츠일 수도 있다. 이 유형의 콘텐츠는 이산 톤의 피처 예리한 라인들을 갖고 높은 콘트라스트 물체 경계들을 나타내는 경향이 있다. 연속-톤 및 평활도의 가정은 더 이상 적용할 수도 없고, 따라서 전통적인 비디오 코딩 기법들은 콘텐츠를 압축함에 있어서 비효율적일 수도 있다.
본 개시물은 팔레트 기반 코딩을 설명하는데, 이는 스크린 생성된 콘텐츠 코딩 또는 하나 이상의 전통적 코딩 도구들이 비효율적인 다른 콘텐츠에 특히 적합할 수도 있다. 비디오 데이터의 팔레트 기반 코딩을 위한 기법들은 하나 이상의 다른 코딩 기법들, 이를테면 인터-예측 또는 인트라-예측 코딩을 위한 기법들과 함께 사용될 수도 있다. 예를 들어, 아래에서 더욱 상세히 설명되는 바와 같이, 인코더 또는 디코더, 또는 결합된 인코더-디코더 (코덱) 가, 인터 예측 및 인트라 예측 코딩, 뿐만 아니라 팔레트 기반 코딩을 수행하도록 구성될 수도 있다.
일부 예들에서, 팔레트 기반 코딩 기법들은 하나 이상의 비디오 코딩 표준들과 함께 사용하기 위해 구성될 수도 있다. 예를 들어, 고 효율 비디오 코딩 (HEVC) 은, ITU-T 비디오 코딩 전문가 그룹 (Video Coding Experts Group, VCEG) 및 ISO/IEC 동 화상 전문가 그룹 (Motion Picture Experts Group, MPEG) 의 JCT-VC (Joint Collaboration Team on Video Coding) 에 의해 개발된 새로운 비디오 코딩 표준이다. 최근의 HEVC 텍스트 규격 초안이 『Bross et al., "High Efficiency Video Coding (HEVC) Text Specification Draft 10 (for FDIS & Consent)," JCVC-L1003_v13, 12th Meeting of JCT-VC of ITU-T SG16 WP 3 and ISO/IEC JCT 1/SC 29/WG 11, 14 - 23 Jan. 2013』 ("HEVC 초안 10") 에서 설명되어 있다.
HEVC 프레임워크에 관해, 일 예로서, 팔레트 기반 코딩 기법들이 코딩 유닛 (coding unit, CU) 모드로서 사용되도록 구성될 수도 있다. 다른 예들에서, 팔레트 기반 코딩 기법들은 HEVC의 프레임워크에서 PU 모드로서 사용되도록 구성될 수도 있다. 따라서, CU 모드의 맥락에서 설명되는 다음의 개시된 프로세스들의 모두가, 부가적으로 또는 대안으로, PU에 적용될 수도 있다. 그러나, 이들 HEVC 기반 예들은 본원에서 설명되는 팔레트 기반 코딩 기법들의 제약 또는 제한으로서 간주되지 않아야 하는데, 이러한 기법들이 독립적으로 또는 다른 기존의 또는 아직 개발되지 않은 시스템들/표준들의 부분으로서 작동하기 위해 적용될 수도 있어서이다. 이들 경우들에서, 팔레트 코딩을 위한 유닛은 정사각형 블록들, 직사각형 블록들 또는 심지어 비-직사각형 형상의 지역들일 수 있다.
팔레트 기반 코딩에서 비디오 데이터의 특정 영역이 상대적으로 적은 수의 컬러들을 갖는 것으로 가정될 수도 있다. 비디오 코더 (비디오 인코더 또는 비디오 디코더) 가 특정 영역 (예컨대, 주어진 블록) 의 비디오 데이터를 표현하기 위한 컬러들의 테이블로서 이른바 "팔레트"를 코딩할 수도 있다. 각각의 화소는 화소의 컬러를 표현하는 팔레트에서의 엔트리와 연관될 수도 있다. 예를 들어, 비디오 코더는 화소 값을 팔레트에서의 적절한 값에 관련시키는 인덱스를 코딩할 수도 있다.
위의 예에서, 비디오 인코더는 비디오 데이터의 블록을, 그 블록에 대한 팔레트를 결정하는 것, 각각의 화소의 값을 표현하기 위한 팔레트에서의 엔트리의 위치를 찾아내는 것, 그리고 화소 값을 팔레트에 관련시키는 화소들에 대한 인덱스 값들로 팔레트를 인코딩하는 것에 의해, 인코딩할 수도 있다. 비디오 디코더가, 인코딩된 비트스트림으로부터, 블록에 대한 팔레트, 뿐만 아니라 블록의 화소들에 대한 인덱스 값들을 획득할 수도 있다. 비디오 디코더는 블록의 화소 값들을 복원하기 위해 화소들의 인덱스 값들을 팔레트의 엔트리들에 관련시킬 수도 있다. 화소들 (및/또는 화소 값을 나타내는 관련된 인덱스 값들) 은 샘플들로서 일반적으로 지칭될 수도 있다.
블록에서의 샘플들은 수평 래스터 스캐닝 순서를 사용하여 프로세싱 (예컨대, 스캐닝) 된다고 가정된다. 예를 들어, 비디오 인코더는 수평 래스터 스캐닝 순서를 사용하여 인덱스들을 스캐닝함으로써 인덱스들의 2차원 블록을 1차원 어레이로 전환할 수도 있다. 비슷하게, 비디오 디코더는 수평 래스터 스캐닝 순서를 사용하여 인덱스들의 블록을 복원할 수도 있다. 따라서, 본 개시물은 블록에서 현재 코딩되고 있는 샘플을 스캐닝 순서에서 선행하는 샘플로서 이전 샘플을 지칭할 수도 있다. 수평 래스터 스캔이 아닌 스캔들, 이를테면 수직 래스터 스캐닝 순서가, 또한 적용 가능할 수도 있다는 것이 이해되어야 한다. 위의 예는 팔레트 기반 코딩의 일반적인 설명을 제공하려는 것이다.
팔레트가, 인덱스에 의해 번호 부여된 그리고 적어도 하나의 컬러 성분 (예를 들어, RGB, YUV 등의 적어도 하나의 성분) 값들 또는 세기들을 표현하는 엔트리들을 통상적으로 포함한다. 비디오 인코더 및 비디오 디코더 양쪽 모두는 팔레트 엔트리들의 수, 각각의 팔레트 엔트리에 대한 컬러 성분 값들 및 현재 블록에 대한 팔레트 엔트리들의 정확한 순서를 결정한다. 본 개시물에서, 각각의 팔레트 엔트리가 샘플의 모든 컬러 성분들에 대한 값들을 특정한다고 가정된다. 그러나, 본 개시물의 개념들은 각각의 컬러 성분에 대해 별개의 팔레트를 사용하는 것에 적용 가능하다.
일부 예들에서, 팔레트가 이전에 코딩된 블록들 또는 이전에 코딩된 팔레트들로부터의 정보를 사용하여 구성될 수도 있다. 다시 말하면, 팔레트가 이전 블록(들)을 코딩하는데 사용된 팔레트(들)로부터 예측되는 예측된 팔레트 엔트리들을 포함할 수도 있다. 예를 들어, 표준 제안 문서『Wei Pu et al., "AHG10: Suggested Software for Palette Coding based on RExt6.0," JCTVC-Q0094, Valencia, ES, 27 March - 4 April 2014』 (이하 JCTVC-Q0094) 에서 설명된 바와 같이, 팔레트가 예측자 팔레트로부터 복사되는 엔트리들을 포함할 수도 있다. 예측자 팔레트가 팔레트 모드 또는 다른 복원된 샘플들을 사용하여 이전에 코딩된 블록들로부터의 팔레트 엔트리들을 포함할 수도 있다. 예측자 팔레트는 이전에 코딩된 팔레트의 전부 또는 일부를 사용할 수도 있거나, 또는 여러 이전에 코딩된 팔레트들의 엔트리들로 구성될 수도 있다.
일부 예들에서, 예측자 팔레트에서의 각각의 엔트리에 대해, (예컨대, 플래그 = 1에 의해 나타내어지는) 이진 플래그가 그 플래그에 연관된 엔트리가 현재 팔레트에 복사되는지의 여부를 나타내기 위해 코딩될 수도 있다. 이진 플래그들의 문자열은 이진 팔레트 예측 벡터라고 지칭될 수도 있다. 현재 블록을 코딩하기 위한 팔레트는, (예컨대, 팔레트 예측 벡터와는 별개로) 명시적으로 코딩될 수도 있는 다수의 새로운 팔레트 엔트리들을 또한 포함할 수도 있다. 새로운 엔트리들의 수의 표시가 또한 코딩될 수도 있다. 예측된 엔트리들 및 새로운 엔트리들의 합이 블록에 대한 총 팔레트 사이즈를 나타낼 수도 있다.
제안된 JCTVC-Q0094처럼, 팔레트 기반 코딩 모드로 코딩된 블록에서의 각각의 샘플은, 아래에서 언급되는 바와 같이, 세 개의 팔레트 모드들 중 하나를 사용하여 코딩될 수도 있다:
Figure pct00001
이스케이프 (Escape) 모드 : 이 모드에서, 샘플 값은 팔레트 속에 팔레트 엔트리로서 포함되지 않고 양자화된 샘플 값은 모든 컬러 성분들에 대해 명시적으로 시그널링된다. 그것은 새로운 팔레트 엔트리들의 시그널링과 유사하지만, 새로운 팔레트 엔트리들에 대해, 컬러 성분 값들은 양자화되지 않는다.
Figure pct00002
상단에서복사 (CopyFromTop) 모드 (또한 상측복사 (CopyAbove) 모드라고 지칭됨): 이 모드에서, 현재 샘플에 대한 팔레트 엔트리 인덱스는 블록에서 바로 위에 위치된 샘플로부터 복사된다.
Figure pct00003
값 모드 (Value mode) (또한 인덱스 모드 (Index mode) 라고 지칭됨): 이 모드에서, 팔레트 엔트리 인덱스의 값은 명시적으로 시그널링된다.
본원에서 설명되는 바와 같이, 팔레트 엔트리 인덱스가 팔레트 인덱스 또는 단순히 인덱스라고 지칭될 수도 있다. 이들 용어들은 본 개시물의 기법들을 설명하기 위해 교환적으로 사용될 수 있다. 덧붙여서, 아래에서 더욱 상세히 설명되는 바와 같이, 팔레트 인덱스가 하나 이상의 연관된 컬러 또는 세기 값들을 가질 수도 있다. 예를 들어, 팔레트 인덱스가 화소의 단일 컬러 또는 세기 성분 (예컨대, RGB 데이터의 적색 성분, YUV 데이터의 Y 성분 등) 에 연관되는 단일의 연관된 컬러 또는 세기 값을 가질 수도 있다. 다른 예에서, 팔레트 인덱스가 다수의 연관된 컬러 또는 세기 값들을 가질 수도 있다. 일부 사례들에서, 팔레트 기반 코딩은 모노크롬 비디오를 코딩하기 위해 적용될 수도 있다. 따라서, "컬러 값"은 화소 값을 생성하는데 사용되는 임의의 컬러 또는 비-컬러 성분을 일반적으로 지칭할 수도 있다.
상단에서복사 모드 및 값 모드의 경우, 런 값 (이는 단순히 런으로서 또한 지칭될 수도 있음) 이 또한 시그널링될 수도 있다. 런 값이 팔레트-코딩된 블록에서 특정 스캔 순서로 함께 코딩되는 연속적인 샘플들의 수 (예컨대, 샘플들의 런) 를 나타낼 수도 있다. 일부 사례들에서, 샘플들의 런은 팔레트 인덱스들의 런이라고 또한 지칭될 수도 있는데, 런의 각각의 샘플이 팔레트에 대한 연관된 인덱스를 갖기 때문이다.
런 값이 동일한 팔레트-코딩 모드를 사용하여 코딩되는 팔레트 인덱스들의 런을 나타낼 수도 있다. 예를 들어, 값 모드에 관해, 비디오 코더 (비디오 인코더 또는 비디오 디코더) 가 팔레트 인덱스 (또한 팔레트 인덱스 값 또는 단순히 인덱스 값이라고 지칭됨) 와, 동일한 팔레트 인덱스를 갖는 그리고 팔레트 인덱스로 코딩된 것들인, 스캔 순서에서의 연속적인 샘플들의 수를 나타내는 런 값을 코딩할 수도 있다. 상단에서복사 모드에 관해, 비디오 코더는, 현재 샘플 값에 대한 인덱스가 상측-이웃 샘플 (예컨대, 블록에서 현재 코딩되고 있는 샘플 상측에 위치된 샘플) 의 인덱스와, 상측-이웃 샘플로부터 팔레트 인덱스를 또한 복사하는 그리고 팔레트 인덱스로 코딩되어 있는, 스캔 순서에서의 연속적인 샘플들의 수를 나타내는 런 값에 기초하여 복사된다는 표시를 코딩할 수도 있다. 따라서, 위의 예들에서, 팔레트 인덱스들의 런은 동일한 값을 갖는 팔레트 인덱스들의 런 또는 상측-이웃 팔레트 인덱스들로부터 복사되는 팔레트 인덱스들의 런을 지칭한다.
그런고로, 런은, 주어진 모드에 대해, 동일한 모드에 속하는 후속 샘플들의 수를 특정할 수도 있다. 일부 사례들에서, 인덱스 및 런 값을 시그널링하는 것은 런 길이 코딩과 유사할 수도 있다. 예시의 목적을 위한 일 예에서, 블록의 연속적인 인덱스들의 문자열이 (예컨대, 각각의 인덱스가 블록에서의 샘플에 대응하는 경우) 0, 2, 2, 2, 2, 5일 수도 있다. 이 예에서, 비디오 코더가 값 모드를 사용하여 두 번째 샘플 (예컨대, 2의 첫 번째 인덱스 값) 을 코딩할 수도 있다. 2와 동일한 인덱스를 코딩한 후, 비디오 코더는, 세 개의 후속 샘플들이 2의 동일한 인덱스 값을 또한 가짐을 나타내는 3의 런을 코딩할 수도 있다. 유사한 방식으로, 상단에서복사 모드를 사용하여 인덱스를 코딩한 후에 4의 런을 코딩하는 것은 총 다섯 개 인덱스들이 현재 코딩되고 있는 샘플 포지션 상측의 행에서의 대응 인덱스들로부터 복사됨을 나타낼 수도 있다.
아래에서 더욱 상세히 설명되는 바와 같이, 비디오 코더 (예컨대, 비디오 인코더 및 비디오 디코더) 가 샘플마다 기반으로 샘플이 이스케이프 샘플로서 코딩되는지의 여부를 나타내는 데이터를 인코딩 또는 디코딩할 수도 있다. 이스케이프 샘플들 (또한 이스케이프 화소들이라고 지칭됨) 은 블록을 코딩하기 위한 팔레트에서 표현되는 대응 컬러를 갖지 않는 블록의 샘플들 (또는 화소들) 일 수도 있다. 따라서, 이스케이프 샘플들은 팔레트로부터의 컬러 엔트리 (또는 화소 값) 을 사용하여 복원되지 않을 수도 있다. 대신, 이스케이프 샘플들에 대한 컬러 값들은 팔레트의 컬러 값들과는 별개로 비트스트림에서 시그널링된다. 대체로, "이스케이프 모드"를 사용하여 샘플을 코딩하는 것은 블록을 코딩하기 위한 팔레트에서 표현되는 대응 컬러를 갖지 않는 블록의 샘플을 코딩하는 것을 일반적으로 지칭할 수도 있다. 위에서 언급했듯이, 이러한 샘플들은 이스케이프 샘플들 또는 이스케이프 화소들이라고 지칭될 수도 있다.
일부 예들에서, 비디오 코더는 샘플이 이스케이프 샘플로서 코딩되는지의 여부를 나타내는 각각의 샘플에 대한 플래그를 코딩할 수도 있다 (이 기법은, 도 1의 예를 참조하여 아래에서 더욱 상세히 설명되는 바와 같이, 명시적 이스케이프 시그널링이라고 지칭될 수도 있다). 다른 예에서, 비디오 코더는 특정 샘플이 이스케이프 샘플로서 코딩됨을 나타내기 위해 팔레트에 대한 추가적인 인덱스 값을 코딩할 수도 있다 (이 기법은, 도 1의 예를 참조하여 더욱 상세히 설명되는 바와 같이, 암시적 이스케이프 시그널링이라고 지칭될 수도 있다).
본 개시물에서 설명되는 기법들은 팔레트 엔트리들을 예측하는 것, 팔레트 인덱스들의 런들을 코딩하는 것, 및 다양한 다른 팔레트 코딩 기법들의 다양한 조합들에 대한 기법들을 포함할 수도 있다. 아래에서 더욱 상세히 설명되는 바와 같이, 본 개시물의 기법들은, 일부 사례들에서, 팔레트 모드를 사용하여 비디오 데이터를 코딩하는 경우 효율을 개선하고 비트레이트를 개선할 수도 있다.
예를 들어, 본 개시물의 특정한 양태들은 비디오 데이터의 블록에 대한 팔레트 엔트리들을 예측하기 위한 기법들에 관한 것이다. 일부 사례들에서, 예측자 팔레트가 픽처의 좌측 에지에서 블록에 대해 재설정될 수도 있다. 다시 말하면, 픽처의 좌측 에지에서 블록에 대한 팔레트를 생성하는 경우, 예측자 팔레트는 0으로 재설정될 수도 있다 (예컨대, 예측자 팔레트는 엔트리들을 갖지 않고 현재 팔레트는 예측자 팔레트를 사용하여 예측되지 않는다). 예측자는, 이런 방식으로 재설정될 수도 있는데, (예컨대, 좌측에서 우측으로의 래스터 스캔을 가정하면) 예측자 팔레트가 라인을 디코딩한 후에 픽처의 우측에 위치된 블록들의 팔레트들에 주로 속하는 팔레트 엔트리들을 포함할 수도 있기 때문이다. 따라서, 다음 행의 첫 번째 블록 (픽처의 최좌측 에지에서의 블록) 을 코딩할 시, 예측자 팔레트는 현재 코딩되고 있는 블록으로부터 상대적으로 멀리 위치된 블록들의 컬러들을 포함할 수도 있다. 따라서, 예측자 팔레트는 현재 블록에 대한 현재 팔레트를 예측할 때에 매우 효과적이지 않을 수도 있다 (예컨대, 픽처의 좌측에 있는 화소들의 컬러들은 픽처의 우측에 있는 화소들의 컬러들과는 상이할 수도 있다).
그러나, 일부 사례들에서, 예측자 팔레트를 재설정하는 것은 코딩 손실들로 이어질 수도 있다. 예를 들어, 예측자 팔레트 없이, 비디오 코더 (비디오 인코더 (20) 또는 비디오 디코더) 가 비트스트림에서 팔레트의 엔트리들의 모두 (예컨대, 팔레트 인덱스들 및 관련된 컬러 값들의 모두) 를 나타내는 데이터를 코딩할 수도 있다. 이는 예측된 팔레트 엔트리들에 연관된 데이터에 비하여 상대적으로 많은 양의 데이터일 수도 있다. 따라서, 예측자 팔레트를 재설정하는 것은 팔레트 기반 코딩으로 코딩된 비디오 데이터의 비트레이트에 악영향을 미칠 수도 있다.
본 개시물의 양태들에 따르면, 제 1 라인에서의 비디오 데이터의 블록에 대한 팔레트를 구축하기 위한 예측자 팔레트가 다른 라인의 하나 이상의 블록들에 기초하여 재초기화될 수도 있다. 예를 들어, 비디오 코더가 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정할 수도 있다. 비디오 코더는 제 1 행에서의 하나 이상의 다른 블록들을 코딩하는 경우 예측자 팔레트를 또한 생성할 수도 있다. 제 2 행에서의 블록을 코딩할 시, 비디오 코더는 제 1 팔레트의 엔트리들에 기초하여 제 2 행에서의 블록의 팔레트를 결정하기 위한 예측자 팔레트를 재초기화할 수도 있다. 본 개시물의 일부 양태들에 따르면, 블록들의 행은 특정한 사이즈의 블록들의 행 (예컨대, 아래에서 설명되는 바와 같이, 코딩 트리 유닛들 (coding tree units, CTU들) 의 행) 일 수도 있다. 행 길이는 선택된 블록 유닛들에서의 픽처 폭을 표현할 수도 있고, 행들의 수는 선택된 블록 유닛들에서의 픽처 높이를 표현할 수도 있다.
일부 예들에서, 재초기화된 예측자 팔레트는 현재 코딩되고 있는 블록에 상대적으로 더 가깝게 위치된 하나 이상의 블록들의 팔레트의 엔트리들을 포함한다. 따라서, 예측자 팔레트는 현재 코딩되고 있는 블록의 팔레트에 포함된 (예컨대, 현재 블록으로부터 멀리 위치된 블록들에 기초한 예측자 팔레트 또는 재설정된 예측자 팔레트에 비하여) 더 높은 공산을 갖는 엔트리들을 포함할 수도 있다. 이런 방식으로, 본 개시물의 기법들은 코딩 효율을 증가시킬 수도 있는데, 비디오 코더가 비트스트림에서의 팔레트의 엔트리들을 코딩하는 것이 아니라 예측자 팔레트를 사용하여 현재 블록에 대한 팔레트를 결정할 수도 있기 때문이다.
본 개시물의 다른 양태들은 팔레트 인덱스들의 런의 런-길이를 나타내는 런 값을 코딩 (즉, 인코딩 또는 디코딩) 하는 것에 관한 것이다. 예를 들어, 위에서 언급했듯이, 런이, 주어진 모드로 현재 코딩되고 있는 인덱스에 대해, 동일한 모드를 사용하여 현재 인덱스로 코딩되는 후속 샘플들의 수를 특정할 수도 있다.
일부 사례들에서는, 런 값을 나타내는 데이터는 콘텍스트 적응 코딩 기법, 이를테면 콘텍스트 적응 이진 산술 코딩 (Context Adaptive Binary Arithmetic Coding, CABAC), 콘텍스트 적응 가변 길이 코딩 (context adaptive variable length coding, CAVLC), 또는 다른 콘텍스트 적응 코딩 기법을 사용하여 코딩될 수도 있다. 예를 들어, 비디오 코더 (비디오 인코더 및/또는 비디오 디코더) 가 비디오 데이터의 블록에 연관된 심볼들을 코딩하기 위해 콘텍스트에 따라 운용하는 확률 모델 또는 "콘텍스트 모델"을 선택할 수도 있다. 다시 말하면, 콘텍스트 모델 (Ctx) 은 각각의 콘텍스트가 특정 확률 모델에 대응할 수도 있는 복수의 상이한 콘텍스트들 중 하나의 콘텍스트를 선택하기 위해 적용되는 인덱스 또는 오프셋일 수도 있다.
일부 사례들에서는, 단일 콘텍스트가 런 값을 나타내는 데이터를 코딩하는데 사용될 수도 있다. 예를 들어, 이진화된 런 값이, 런 값이 0보다 더 큰지의 여부를 나타내는 제 1 빈, 런 값이 1보다 더 큰지의 여부를 나타내는 제 2 빈, 런 값이 2보다 더 큰지의 여부를 나타내는 제 3 빈, 및 런 값을 표현하는데 필요한 임의의 다른 빈들을 포함할 수도 있다. 이 예에서, 동일한 콘텍스트는 이진화된 런 값의 첫 번째 세 개의 빈들을 콘텍스트 코딩하는데 사용될 수도 있다. 그러나, 다수의 빈들을 코딩하기 위해 동일한 확률 모델을 사용하는 것은 연속하는 코딩 사이클들 간에 지연이 생기게 할 수도 있다. 더구나, 런 값의 빈들의 상관은 확률 모델을 업데이트하는 것에 연관된 시간 및 계산 리소스들을 보장 (warrant) 하기에 충분하지 않을 수도 있다.
본 개시물의 양태들에 따르면, 콘텍스트는 코딩되고 있는 런 값의 인덱스 값에 기초하여 선택될 수도 있다. 예를 들어, 비디오 코더가 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정할 수도 있다. 비디오 코더는 팔레트 인덱스 값에 기초하여 런 값을 표현하는 데이터를 콘텍스트 적응 코딩하기 위한 콘텍스트를 또한 결정할 수도 있다. 그 기법들은 코딩 효율을 개선시킬 수도 있다.
일부 예들에서, 런 코딩하기 위한 콘텍스트들을 유도하는데 사용되는 팔레트 인덱스는 팔레트로부터 컬러 값을 취출하기 위해 사용되는 팔레트 인덱스일 수도 있다. 다른 예들에서, 런 코딩하기 위한 콘텍스트들을 유도하는데 사용되는 팔레트 인덱스는 파싱된 팔레트 인덱스, 즉, 비트스트림에서 시그널링되는 팔레트 인덱스 (이는, 아래에서 더욱 상세히 설명되는 바와 같이, 팔레트 컬러들에 액세스하는데 사용되는 팔레트 인덱스와는 상이할 수도 있음) 일 수도 있다.
일부 예들에서, 세 개의 콘텍스트들은 런 값을 코딩하는데 사용될 수도 있다. 이러한 예들에서, 본 개시물의 양태들에 따르면, 비디오 코더가 0보다 큰 인덱스에 기초하여 런 값을 코딩하기 위해 제 1 콘텍스트를 선택할 수도 있다. 비디오 코더는 0보다 큰 인덱스에 기초하여 런 값을 코딩하기 위해 제 1 콘텍스트를 선택할 수도 있다. 비디오 코더는 1보다 큰 인덱스에 기초하여 런 값을 코딩하기 위해 제 2 콘텍스트를 선택할 수도 있다. 비디오 코더는 2보다 큰 인덱스에 기초하여 런 값을 코딩하기 위해 제 3 콘텍스트를 선택할 수도 있다. 위에서 설명된 세 개의 콘텍스트 코딩된 빈 예에 관해, 비디오 코더는 세 개의 빈들의 임의의 조합을 코딩하기 위해 세 개의 콘텍스트들을 선택할 수도 있다. 위의 예가 인덱스 값의 세 가지 특성들에 연관된 세 개의 콘텍스트들을 정의하는 것에 관해 설명되지만, 본원에서 설명되는 기법들은 인덱스 값의 다른 특성들에 기초하여 다른 수의 콘텍스트들을 정의하는 것으로 확장될 수도 있다는 것이 이해되어야 한다.
본 개시물의 다른 양태들은 하나를 초과하는 팔레트 모드를 사용하여 코딩되는 팔레트 인덱스들의 런들을 코딩하는 것에 관한 것이다. 대체로, 상이한 팔레트 모드들을 사용하여 코딩되는 인덱스들은 동일한 런으로 코딩되지 않을 수도 있다. 예시의 목적을 위한 일 예에서, 상단에서복사 모드를 사용하여 코딩된 런이 이스케이프 샘플들로서 코딩되는 임의의 인덱스들을 포함하지 않을 수도 있다. 이 예에서, 이스케이프 샘플로서 코딩된 화소가 런을 종료시킬 수도 있는데, 이는 주어진 블록에 대한 상대적으로 더 짧은 런으로 인해 코딩 효율에 악영향을 줄 수도 있다.
본 개시물의 양태들에 따르면, 런이 하나를 초과하는 팔레트 모드를 사용하여 코딩되는 샘플들을 포함할 수도 있다. 예를 들어, 비디오 코더가 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정할 수도 있고, 그 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트 (이는 그 신택스 엘리먼트가 인덱스 값에 반드시 대응하지는 않음에도 불구하고 팔레트 인덱스라고 지칭될 수도 있음) 를 포함한다. 비디오 코더는 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 또한 코딩할 수도 있는데, 그 런은 팔레트에서의 컬러 값에 연관된 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함한다.
일부 예들에서, 팔레트 인덱스들의 런은 상단에서복사 모드로 코딩된 화소들과, 예컨대, 이스케이프 모드를 사용하여 이스케이프 샘플들로서 코딩된 화소들을 포함할 수도 있다. 예를 들어, 팔레트에서의 컬러 값에 연관되는 인덱스들은 상단에서복사 모드로 코딩될 수도 있고 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트는 이스케이프 샘플로서 코딩될 수도 있다. 일부 예들에서, 아래에서 더욱 상세히 설명되는 바와 같이, 신택스 엘리먼트는 팔레트에서의 컬러 값에 연관되지 않는 인덱스와 연관될 수도 있다. 일부 예들에서, 이스케이프 샘플들로서 코딩된 화소들의 값들은 인덱스들의 런에 뒤따라 시그널링될 수도 있고, 이스케이프 샘플들로서 코딩된 화소들은 동일하도록 요구되지 않는다. 다른 예들에서, 이스케이프 샘플이 상단에서복사 모드에 의해 표현될 수도 있고 이스케이프 샘플은 비-이스케이프 코딩된 샘플들 (예컨대, 컬러 값들이 팔레트에서 표현되는 화소들) 과 함께 동일한 화소들의 그룹에 포함될 수도 있으며, 그 화소들의 그룹은 런 값에 의해 식별된다. 이런 식으로, 그 기법들은 런들의 길이를 증가시키는데 사용될 수도 있으며, 이는 코딩 효율을 개선시킬 수도 있다.
도 1은 본 개시물의 기법들을 이용할 수도 있는 일 예의 비디오 코딩 시스템 (10) 을 도시하는 블록도이다. 본원에서 사용되는 바와 같이, "비디오 코더"라는 용어는 비디오 인코더들 및 비디오 디코더들 양쪽 모두를 일반적으로 지칭한다. 본 개시물에서, "비디오 코딩" 또는 "코딩"이란 용어들은 비디오 인코딩 또는 비디오 디코딩을 일반적으로 지칭할 수도 있다. 비디오 코딩 시스템 (10) 의 비디오 인코더 (20) 및 비디오 디코더 (30) 는 본 개시물에서 설명되는 다양한 예들에 따라 팔레트 기반 비디오 코딩을 위한 기법들을 수행하도록 구성될 수도 있는 디바이스들의 예들을 나타낸다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 기반 코딩 또는 비-팔레트 기반 코딩 중 어느 하나를 사용하여 비디오 데이터의 다양한 블록들, 이를테면 HEVC 코딩에서의 CU들 또는 PU들을, 선택적으로 코딩하도록 구성될 수도 있다. 비-팔레트 기반 코딩 모드들은 다양한 인터 예측 시간적 코딩 모드들 또는 인터 예측 공간적 코딩 모드들, 이를테면 HEVC 초안 10에 의해 명시된 다양한 코딩 모드들을 지칭할 수도 있다.
도 1에 도시된 바와 같이, 비디오 코딩 시스템 (10) 은 소스 디바이스 (12) 와 목적지 디바이스 (14) 를 구비한다. 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 생성한다. 따라서, 소스 디바이스 (12) 는 비디오 인코딩 디바이스 또는 비디오 인코딩 장치라고 지칭될 수도 있다. 목적지 디바이스 (14) 는 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오 데이터를 디코딩할 수도 있다. 따라서, 목적지 디바이스 (14) 는 비디오 디코딩 디바이스 또는 비디오 디코딩 장치라고 지칭될 수도 있다. 소스 디바이스 (12) 와 목적지 디바이스 (14) 는 비디오 코딩 디바이스들 또는 비디오 코딩 장치들의 예들일 수도 있다.
소스 디바이스 (12) 와 목적지 디바이스 (14) 는 데스크톱 컴퓨터들, 모바일 컴퓨팅 디바이스들, 노트북 (예컨대, 랩톱) 컴퓨터들, 태블릿 컴퓨터들, 셋톱 박스들, 이른바 "스마트" 폰들과 같은 전화기 핸드셋들, 텔레비전들, 카메라들, 디스플레이 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 콘솔들, 차량내 컴퓨터들 등을 포함한 다양한 범위의 디바이스들을 포함할 수도 있다.
목적지 디바이스 (14) 는 소스 디바이스 (12) 로부터의 인코딩된 비디오 데이터를 채널 (16) 을 통해 수신할 수도 있다. 채널 (16) 은 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 인코딩된 비디오 데이터를 이동시킬 수 있는 하나 이상의 매체들 또는 디바이스들을 포함할 수도 있다. 하나의 예에서, 채널 (16) 은 소스 디바이스 (12) 가 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 직접 실시간으로 송신하는 것을 가능하게 하는 하나 이상의 통신 매체들을 포함할 수도 있다. 이 예에서, 소스 디바이스 (12) 는 인코딩된 비디오 데이터를 통신 표준, 이를테면 무선 통신 프로토콜에 따라 변조할 수도 있고, 변조된 비디오 데이터를 목적지 디바이스 (14) 로 송신할 수도 있다. 하나 이상의 통신 매체들은 무선 및/또는 유선 통신 매체들, 이를테면 라디오 주파수 (radio frequency, RF) 스펙트럼 또는 하나 이상의 물리적 송신 라인들을 포함할 수도 있다. 하나 이상의 통신 매체들은 패킷 기반 네트워크, 이를테면 로컬 영역 네트워크, 광역 네트워크, 또는 글로벌 네트워크 (예컨대, 인터넷) 의 일부를 형성할 수도 있다. 하나 이상의 통신 매체들은 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로의 통신을 용이하게 하는 다른 장비를 포함할 수도 있다.
다른 예에서, 채널 (16) 은 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오 데이터를 저장하는 저장 매체를 포함할 수도 있다. 이 예에서, 목적지 디바이스 (14) 는 예컨대, 디스크 액세스 또는 카드 액세스를 통해 저장 매체에 액세스할 수도 있다. 저장 매체는 블루 레이 디스크들, DVD들, CD-ROM들, 플래시 메모리, 또는 인코딩된 비디오 데이터를 저장하기 위한 다른 적합한 디지털 저장 매체들과 같은 다양한 국부적으로 액세스되는 데이터 저장 매체들을 포함할 수도 있다.
추가의 예에서, 채널 (16) 은 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오 데이터를 저장하는 파일 서버 또는 다른 중간 저장 디바이스를 포함할 수도 있다. 이 예에서, 목적지 디바이스 (14) 는 파일 서버 또는 다른 중간 저장 디바이스에 저장된 인코딩된 비디오 데이터를 스트리밍 또는 다운로드를 통해 액세스할 수도 있다. 파일 서버는 인코딩된 비디오 데이터를 저장하고 그 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 송신할 수 있는 유형의 서버일 수도 있다. 예의 파일 서버들은 웹 서버들 (예컨대, 웹사이트용), 파일 전송 프로토콜 (file transfer protocol, FTP) 서버들, 네트워크 부속 스토리지 (network attached storage, NAS) 디바이스들, 및 로컬 디스크 드라이브들을 포함한다.
목적지 디바이스 (14) 는 표준 데이터 접속, 이를테면 인터넷 접속을 통해, 인코딩된 비디오 데이터에 액세스할 수도 있다. 예의 유형들의 데이터 접속들은 파일 서버 상에 저장된 인코딩된 비디오 데이터에 액세스하기에 적합한 무선 채널들 (예컨대, Wi-Fi 접속들), 유선 접속들 (예컨대, DSL, 케이블 모뎀 등), 또는 양쪽 모두의 조합들을 포함할 수도 있다. 파일 서버로부터의 인코딩된 비디오 데이터의 송신은 스트리밍 송신, 다운로드 송신, 또는 양쪽 모두의 조합일 수도 있다.
본 개시물의 기법들은 무선 애플리케이션들 또는 설정 (setting) 들로 제한되지 않는다. 그 기법들은, OTA (over-the-air) 텔레비전 브로드캐스트들, 케이블 텔레비전 송신들, 위성 텔레비전 송신들, 예컨대, 인터넷을 통한 스트리밍 비디오 송신들, 데이터 저장 매체 상의 저장을 위한 비디오 데이터의 인코딩, 데이터 저장 매체 상에 저장된 비디오 데이터의 디코딩, 또는 다른 애플리케이션들과 같은, 다양한 멀티미디어 애플리케이션들을 지원하는 비디오 코딩에 적용될 수도 있다. 일부 예들에서, 비디오 코딩 시스템 (10) 은 비디오 스트리밍, 비디오 플레이백, 비디오 브로드캐스팅, 및/또는 화상 통화와 같은 애플리케이션들을 지원하기 위해 단방향 또는 양방향 비디오 송신을 지원하도록 구성될 수도 있다.
도 1에 예시된 비디오 코딩 시스템 (10) 은 단지 일 예이고 본 개시물의 기법들은 인코딩 및 디코딩 디바이스들 간에 임의의 데이터 통신을 반드시 포함하지는 않는 비디오 코딩 설정들 (예컨대, 비디오 인코딩 또는 비디오 디코딩) 에 적용될 수도 있다. 다른 예들에서, 데이터는 로컬 메모리로부터 취출되거나, 네트워크를 통해 스트리밍되거나 기타 등등이다. 비디오 인코딩 디바이스가 데이터를 인코딩하고 메모리에 저장할 수도 있으며, 그리고/또는 비디오 디코딩 디바이스가 메모리로부터 데이터를 취출하고 디코딩할 수도 있다. 많은 예들에서, 인코딩 및 디코딩은, 서로 통신하지 않지만 단순히 데이터를 메모리에 인코딩하고 및/또는 메모리로부터 데이터를 취출하고 디코딩하는 디바이스들에 의해 수행된다.
도 1의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20), 및 출력 인터페이스 (22) 를 구비한다. 일부 예들에서, 출력 인터페이스 (22) 는 변조기/복조기 (모뎀) 및/또는 송신기를 구비할 수도 있다. 비디오 소스 (18) 는 비디오 캡처 디바이스, 예컨대, 비디오 카메라, 이전에 캡처된 비디오 데이터를 포함한 비디오 아카이브, 비디오 콘텐츠 제공자로부터 비디오 데이터를 수신하는 비디오 피드 인터페이스, 및/또는 비디오 데이터를 생성하는 컴퓨터 그래픽 시스템, 또는 비디오 데이터의 이러한 소스들의 조합을 포함할 수도 있다.
비디오 인코더 (20) 는 비디오 소스 (18) 로부터의 비디오 데이터를 인코딩할 수도 있다. 일부 예들에서, 소스 디바이스 (12) 는 출력 인터페이스 (22) 를 통해 목적지 디바이스 (14) 로 인코딩된 비디오 데이터를 직접 송신할 수도 있다. 다른 예들에서, 인코딩된 비디오 데이터는 또한, 디코딩 및/또는 플레이백을 위한 목적지 디바이스 (14) 에 의한 나중의 액세스를 위해 저장 매체 또는 파일 서버 상에 또한 저장될 수도 있다.
도 1의 예에서, 목적지 디바이스 (14) 는 입력 인터페이스 (28), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 구비한다. 일부 예들에서, 입력 인터페이스 (28) 는 수신기 및/또는 모뎀을 구비한다. 입력 인터페이스 (28) 는 채널 (16) 을 통해 인코딩된 비디오 데이터를 수신할 수도 있다. 디스플레이 디바이스 (32) 는 목적지 디바이스 (14) 와 통합되거나 또는 그것 외부에 있을 수도 있다. 대체로, 디스플레이 디바이스 (32) 는 디코딩된 비디오 데이터를 디스플레이한다. 디스플레이 디바이스 (32) 는 액정 디스플레이 (LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (OLED) 디스플레이, 또는 다른 유형의 디스플레이 디바이스와 같은 다양한 디스플레이 디바이스들을 포함할 수도 있다.
비디오 인코더 (20) 와 비디오 디코더 (30) 각각은 다양한 적합한 회로, 이를테면 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서들 (digital signal processors, DSP들), 주문형 집적회로들 (application-specific integrated circuits, ASIC들), 필드 프로그램가능 게이트 어레이들 (field-programmable gate arrays, FPGA들), 개별 로직, 하드웨어, 또는 그것들의 임의의 조합 중 임의의 것으로서 구현될 수도 있다. 그 기법들이 부분적으로 소프트웨어로 구현되면, 디바이스가 적합한 비일시적 (non-transitory) 컴퓨터 판독가능 저장 매체 내에 소프트웨어에 대한 명령을 저장할 수도 있고 하나 이상의 프로세서들을 사용하여 하드웨어에서 그 명령들을 실행하여 본 개시물의 기법들을 수행할 수도 있다. 전술한 바 (하드웨어, 소프트웨어, 하드웨어 및 소프트웨어의 조합 등을 포함) 중 임의의 것은 하나 이상의 프로세서들이라고 간주될 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 의 각각은 하나 이상의 인코더들 또는 디코더들 내에 구비될 수도 있고, 그것들 중 어느 하나는 결합형 인코더/디코더 (CODEC) 의 일부로서 개별 디바이스 내에 통합될 수도 있다.
본 개시물은 다른 디바이스, 이를테면 비디오 디코더 (30) 에 특정 정보를 "시그널링하는" 또는 "송신하는" 비디오 인코더 (20) 에 일반적으로 관련이 있을 수도 있다. "시그널링"또는 "송신"이란 용어는 압축된 비디오 데이터를 디코딩하는데 사용되는 신택스 엘리먼트들 및/또는 다른 데이터의 통신을 일반적으로는 지칭할 수도 있다. 이러한 통신은 실시간 또는 거의 실시간으로 일어날 수도 있다. 대안으로, 이러한 통신은, 인코딩 시에 신택스 엘리먼트들을 인코딩된 비트스트림으로 컴퓨터 판독가능 저장 매체에 저장하고 그 신택스 엘리먼트들이 이 매체에 저장된 후의 임의의 시간에 디코딩 디바이스에 의해 취출될 수도 있는 경우에 일어날 바와 같이 어떤 기간 (span of time) 에 걸쳐 일어날 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 비디오 압축 표준, 이를테면 위에서 언급되고 HEVC 초안 10에서 설명된 HEVC 표준에 따라 동작한다. 기본 HEVC 표준 외에도, HEVC에 대한 스케일러블 비디오 코딩, 멀티뷰 비디오 코딩, 및 3D 코딩 확장본들을 생성하기 위한 진행중인 노력들이 있다. 덧붙여서, 예컨대 본 개시물에서 설명되는 바와 같은, 팔레트 기반 코딩 모드들은, HEVC 표준의 확장본에 대해 제공될 수도 있다. 일부 예들에서, 팔레트 기반 코딩에 대한 본 개시물에서 설명된 기법들은 다른 비디오 코딩 표준들, 이를테면 ITU-T-H.264/AVC 표준 또는 장래의 표준들에 따라 동작하도록 구성되는 인코더들 및 디코더들에 적용될 수도 있다. 따라서, HEVC 코덱에서의 코딩 유닛들 (CU들) 또는 예측 유닛들 (prediction units, PU들) 의 코딩을 위한 팔레트 기반 코딩 모드의 애플리케이션이 예의 목적들을 위해 설명된다.
HEVC 및 다른 비디오 코딩 표준들에서, 비디오 시퀀스가 일련의 픽처들을 통상 포함한다. 픽처들은 "프레임들"이라고 또한 지칭될 수도 있다. 픽처가 SL, SCb 및 SCr로 표시되는 세 개의 샘플 어레이들을 포함할 수도 있다. SL은 루마 샘플들의 2차원 어레이 (즉, 블록) 이다. SCb는 Cb 색차 샘플들의 2차원 어레이이다. SCr은 Cr 색차 샘플들의 2차원 어레이이다. 색차 샘플들은 본원에서 "크로마" 샘플들이라고 또한 지칭될 수도 있다. 다른 경우들에서, 픽처가 모노크롬일 수도 있고 루마 샘플들의 어레이만을 포함할 수도 있다.
픽처의 인코딩된 표현을 생성하기 위해, 비디오 인코더 (20) 는 코딩 트리 유닛 (CTU) 들의 세트를 생성할 수도 있다. CTU들의 각각은, 루마 샘플들의 코딩 트리 블록 (coding tree block), 크로마 샘플들의 두 개의 대응 코딩 트리 블록들, 및 코딩 트리 블록들의 샘플들을 코딩하는데 사용된 신택스 구조들일 수도 있다. 코딩 트리 블록이 샘플들의 NxN 블록일 수도 있다. CTU가 "트리 블록" 또는 "최대 코딩 유닛 (largest coding unit; LCU)"이라고 또한 지칭될 수도 있다. HEVC의 CTU들은 다른 표준들, 이를테면 H.264/AVC의 매크로블록들과 대체로 유사할 수도 있다. 그러나, CTU가 특정 사이즈로 반드시 제한되는 것은 아니고 하나 이상의 코딩 유닛들 (CU들) 을 포함할 수도 있다. 슬라이스가 래스터 스캔으로 연속하여 순서화된 정수 개의 CTU들을 포함할 수도 있다.
코딩된 CTU를 생성하기 위해, 비디오 인코더 (20) 는 CTU의 코딩 트리 블록들에 대해 쿼드트리 구획화를 재귀적으로 수행하여 코딩 트리 블록들을 코딩 블록들로 나눌 수도 있으며, 그래서 그 이름이 "코딩 트리 유닛들"이다. 코딩 블록이 샘플들의 NxN 블록이다. CU가, 루마 샘플 어레이, Cb 샘플 어레이 및 Cr 샘플 어레이를 갖는 픽처의 루마 샘플들의 코딩 블록 및 크로마 샘플들의 대응하는 두 개의 코딩 블록들과, 그 코딩 블록들의 샘플들을 코딩하는데 사용된 신택스 구조들일 수도 있다. 비디오 인코더 (20) 는 CU의 코딩 블록을 하나 이상의 예측 블록들로 구획화할 수도 있다. 예측 블록이 동일한 예측이 적용되는 샘플들의 직사각형 (즉, 정사각형 또는 정사각형 아닌) 블록일 수도 있다. CU의 예측 유닛 (PU) 이 픽처의 루마 샘플들의 예측 블록, 크로마 샘플들의 두 개의 대응하는 예측 블록들, 및 예측 블록 샘플들을 예측하는데 사용된 신택스 구조들일 수도 있다. 비디오 인코더 (20) 는 CU의 각각의 PU의 루마, Cb 및 Cr 예측 블록들에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다.
비디오 인코더 (20) 는 PU에 대한 예측 블록들을 생성하기 위해 인트라 예측 또는 인터 예측을 사용할 수도 있다. 비디오 인코더 (20) 가 PU의 예측 블록들을 생성하기 위해 인트라 예측을 사용하면, 비디오 인코더 (20) 는 그 PU에 연관된 픽처의 디코딩된 샘플들에 기초하여 그 PU의 예측 블록들을 생성할 수도 있다.
비디오 인코더 (20) 가 PU의 예측 블록들을 생성하기 위해 인터 예측을 사용하면, 비디오 인코더 (20) 는 그 PU에 연관된 픽처 이외의 하나 이상의 픽처들의 디코딩된 샘플들에 기초하여 그 PU의 예측 블록들을 생성할 수도 있다. 비디오 인코더 (20) 는 PU의 예측 블록들을 생성하기 위해 단-예측 (uni-prediction) 또는 양-예측 (bi-prediction) 을 사용할 수도 있다. 비디오 인코더 (20) 가 단-예측을 사용하여 PU에 대한 예측 블록들을 생성하는 경우, 그 PU는 단일 모션 벡터 (MV) 를 가질 수도 있다. 비디오 인코더 (20) 가 양예측을 사용하여 PU에 대한 예측 블록들을 생성하는 경우, PU는 두 개의 MV들을 가질 수도 있다.
비디오 인코더 (20) 가 CU의 하나 이상의 PU들에 대한 예측 루마, Cb 및 Cr 블록들을 생성한 후, 비디오 인코더 (20) 는 그 CU에 대한 루마 잔차 블록을 생성할 수도 있다. CU의 루마 잔차 블록에서의 각각의 샘플은 CU의 예측 루마 블록들 중 하나의 예측 루마 블록에서의 루마 샘플 및 CU의 원래의 루마 코딩 블록에서의 대응하는 샘플 사이의 차이를 나타낸다. 덧붙여서, 비디오 인코더 (20) 는 CU에 대한 Cb 잔차 블록을 생성할 수도 있다. CU의 Cb 잔차 블록에서의 각각의 샘플은 CU의 예측 Cb 블록들 중 하나의 예측 Cb 블록에서의 Cb 샘플과 CU의 원래의 Cb 코딩 블록에서의 대응 샘플 간의 차이를 나타낼 수도 있다. 비디오 인코더 (20) 는 CU에 대한 Cr 잔차 블록을 또한 생성할 수도 있다. CU의 Cr 잔차 블록에서의 각각의 샘플은 CU의 예측 Cr 블록들 중 하나의 예측 Cr 블록에서의 Cr 샘플 및 CU의 원래의 Cr 코딩 블록에서의 대응 샘플 간의 차이를 나타낼 수도 있다.
더욱이, 비디오 인코더 (20) 는 쿼드트리 구획화를 사용하여 CU의 루마, Cb 및 Cr 잔차 블록들을 하나 이상의 루마, Cb 및 Cr 변환 블록들로 분해할 수도 있다. 변환 블록이 동일한 변환이 적용되는 샘플들의 직사각형 블록일 수도 있다. CU의 변환 유닛 (transform unit, PU) 이 루마 샘플들의 변환 블록, 크로마 샘플들의 2 개의 대응하는 변환 블록들, 및 변환 블록 샘플들을 변환하는데 사용된 신택스 구조들일 수도 있다. 따라서, CU의 각각의 TU는 루마 변환 블록, Cb 변환 블록, 및 Cr 변환 블록에 연관될 수도 있다. TU에 연관된 루마 변환 블록은 CU의 루마 잔차 블록의 서브블록일 수도 있다. Cb 변환 블록은 CU의 Cb 잔차 블록의 서브블록일 수도 있다. Cr 변환 블록은 CU의 Cr 잔차 블록의 서브블록일 수도 있다.
비디오 인코더 (20) 는 하나 이상의 변환들을 TU의 루마 변환 블록에 적용하여 그 TU에 대한 루마 계수 블록을 생성할 수도 있다. 계수 블록이 변환 계수들의 2차원 어레이일 수도 있다. 변환 계수가 스칼라 양일 수도 있다. 비디오 인코더 (20) 는 하나 이상의 변환들을 TU의 Cb 변환 블록에 적용하여 TU에 대한 Cb 계수 블록을 생성할 수도 있다. 비디오 인코더 (20) 는 하나 이상의 변환들을 TU의 Cr 변환 블록에 적용하여 TU에 대한 Cr 계수 블록을 생성할 수도 있다.
계수 블록 (예컨대, 루마 계수 블록, Cb 계수 블록 또는 Cr 계수 블록) 을 생성한 후, 비디오 인코더 (20) 는 그 계수 블록을 양자화할 수도 있다. 양자화는 변환 계수들이 그 변환 계수들을 표현하는데 사용된 데이터의 양을 가능한 한 줄이도록 양자화되어서, 추가의 압축을 제공하는 프로세스를 일반적으로 지칭한다. 비디오 인코더 (20) 가 계수 블록을 앙자화한 후, 비디오 인코더 (20) 는 양자화된 변환 계수들을 나타내는 신택스 엘리먼트들을 엔트로피 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 양자화된 변환 계수들을 나타내는 신택스 엘리먼트들에 대해 콘텍스트 적응 이진 산술 코딩 (CABAC) 을 수행할 수도 있다.
CABAC에 관해, 일 예로서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 콘텍스트에 기초하여 비디오 데이터의 블록에 연관된 심볼들을 코딩하기 위해 확률 모델 (또한 콘텍스트 모델이라고도 지칭됨) 을 선택할 수도 있다. 예를 들어, 콘텍스트 모델 (Ctx) 이 각각의 콘텍스트가 특정 확률 모델에 대응할 수도 있는 복수의 상이한 콘텍스트들 중 하나의 콘텍스트를 선택하기 위해 적용되는 인덱스 또는 오프셋일 수도 있다. 따라서, 상이한 확률 모델이 각각의 콘텍스트에 대해 통상 정의된다. 빈을 인코딩 또는 디코딩한 후, 확률 모델은 빈에 대한 가장 최신의 확률 추정값들을 반영하기 위해 빈의 값에 기초하여 추가로 업데이트된다. 예를 들어, 확률 모델이 유한 상태 머신에서의 상태로서 유지될 수도 있다. 각각의 특정 상태는 특정 확률 값에 대응할 수도 있다. 확률 모델의 업데이트에 대응하는 다음의 상태는, 현재 빈 (예컨대, 현재 코딩되고 있는 빈) 의 값에 의존할 수도 있다. 따라서, 확률 모델의 선택은 이전에 코딩된 빈들의 값들에 의해 영향을 받을 수도 있는데, 그 값들이, 적어도 부분적으로는, 주어진 값을 갖는 빈의 확률을 나타내기 때문이다. 위에서 설명된 콘텍스트 코딩 프로세스는 콘텍스트-적응 코딩 모드 라고 일반적으로 지칭될 수도 있다.
그런고로, 비디오 인코더 (20) 는 확률 모델을 사용하여 타겟 심볼을 인코딩할 수도 있다. 비슷하게, 비디오 디코더 (30) 는 확률 모델을 사용하여 타겟 심볼을 파싱할 수도 있다. 일부 사례들에서, 비디오 인코더 (20) 는 콘텍스트 적응 코딩 및 비-콘텍스트 적응 코딩의 조합을 사용하여 신택스 엘리먼트들을 코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 빈들을 코딩하기 위해 콘텍스트에 따라 운용하는 확률 모델 또는 "콘텍스트 모델"을 선택함으로써 빈들을 콘텍스트 코딩할 수도 있다. 그 반면, 비디오 인코더 (20) 는 빈들을 코딩하는 경우 정규 산술 코딩 (regular arithmetic coding) 프로세스를 바이패스 또는 생략함으로써 빈들을 바이패스 코딩할 수도 있다. 그런 예들에서, 비디오 코더 (20) 는 빈들을 바이패스 코딩하기 위해 고정 확률 모델을 사용할 수도 있다. 다시 말하면, 바이패스 코딩된 빈들은 콘텍스트 또는 확률 업데이트들을 포함하지 않는다.
비디오 인코더 (20) 는 엔트로피 인코딩된 신택스 엘리먼트들을 포함하는 비트스트림을 출력할 수도 있다. 그 비트스트림은 코딩된 픽처들 및 연관된 데이터의 표현을 형성하는 비트들의 시퀀스를 포함할 수도 있다. 그 비트스트림은 네트워크 추상화 계층 (network abstraction layer, NAL) 유닛들의 시퀀스를 포함할 수도 있다. NAL 유닛들의 각각은 NAL 유닛 헤더를 포함하고 원시 바이트 시퀀스 패이로드 (raw byte sequence payload, RBSP) 를 캡슐화한다. NAL 유닛 헤더는 NAL 유닛 유형 코드를 나타내는 신택스 엘리먼트를 포함할 수도 있다. NAL 유닛의 NAL 유닛 헤더에 의해 명시된 NAL 유닛 유형 코드는 NAL 유닛의 유형을 나타낸다. RBSP가 NAL 유닛 내에 캡슐화되는 정수 개의 바이트들을 포함하는 신택스 구조일 수도 있다. 일부 사례들에서, RBSP가 영 비트들을 포함한다.
상이한 유형들의 NAL 유닛들이 상이한 유형들의 RBSP들을 캡슐화할 수도 있다. 예를 들어, 제 1 유형의 NAL 유닛이 픽처 파라미터 세트 (picture parameter set, PPS) 에 대한 RBSP를 캡슐화할 수도 있으며, 제 2 유형의 NAL 유닛이 코딩된 슬라이스에 대한 RBSP를 캡슐화할 수도 있으며, 제 3 유형의 NAL 유닛이 SEI에 대한 RBSP를 캡슐화할 수도 있고 기타 등등이다. 비디오 코딩 데이터에 대한 RBSP들 (파라미터 세트들 및 SEI 메시지들에 대한 RBSP과는 대조적임) 을 캡슐화하는 NAL 유닛들은, 비디오 코딩 계층 (video coding layer, VCL) NAL 유닛들이라고 지칭될 수도 있다.
비디오 디코더 (30) 는 비디오 인코더 (20) 에 의해 생성된 비트스트림을 수신할 수도 있다. 덧붙여서, 비디오 디코더 (30) 는 그 비트스트림으로부터 신택스 엘리먼트들을 디코딩하기 위해 그 비트스트림을 파싱할 수도 있다. 비디오 디코더 (30) 는 비트스트림으로부터 디코딩된 신택스 엘리먼트들에 적어도 부분적으로 기초하여 비디오 데이터의 픽처들을 복원할 수도 있다. 비디오 데이터를 복원하는 프로세스는 비디오 인코더 (20) 에 의해 수행된 프로세스에 일반적으로 역일 수도 있다. 예를 들면, 비디오 디코더 (30) 는 현재 CU의 PU들에 대한 예측 블록들을 결정하기 위해 그 PU들의 MV들을 사용할 수도 있다. 덧붙여서, 비디오 디코더 (30) 는 현재 CU의 TU들에 연관된 변환 계수 블록들을 역 양자화할 수도 있다. 비디오 디코더 (30) 는 현재 CU의 TU들에 연관된 변환 블록들을 복원하기 위해 변환 계수 블록들에 대해 역 변환들을 수행할 수도 있다. 비디오 디코더 (30) 는 현재 CU의 PU들에 대한 예측 블록들의 샘플들을 현재 CU의 TU들의 변환 블록들의 대응하는 샘플들에 가산함으로써 현재 CU의 코딩 블록들을 복원할 수도 있다. 픽처의 각각의 CU에 대한 코딩 블록들을 복원함으로써, 비디오 디코더 (30) 는 그 픽처를 복원할 수도 있다.
HEVC는 타일들 및 파면 병렬 프로세싱 (WPP) 을 포함하여 코덱을 더욱 병렬 친화적이게 하는 여러 제안들을 포함한다. HEVC WD10은, 타일의 코딩 트리 블록 래스터 스캔으로 연속하여 순서화되는, 하나의 열 및 하나의 행에서 함께 발생하는 정수 개의 코딩 트리 블록들을 타일들로서 정의한다. 각각의 픽처의 타일들로의 분할은 구획화이다. 타일들의 수와 그 타일들의 경계들의 로케이션들은 전체 시퀀스에 대해 정의되거나 또는 픽처마다 변경될 수도 있다. 타일 경계들은, 슬라이스 경계들과 유사하게, 타일이 독립적으로 프로세싱될 수 있도록 파싱 및 예측 의존관계들을 깨뜨리지만, 루프 내 필터들 (블록화제거 및 샘플 적응 오프셋 (sample adaptive offset, SAO)) 은 타일 경계들을 여전히 가로지를 수 있다. HEVC WD10은 슬라이스들과 타일들 간의 관계에 대한 일부 제약조건들을 또한 명시한다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 기반 코딩을 수행하도록 구성될 수도 있다. 예를 들어, 팔레트 기반 코딩에서는, 위에서 설명된 인트라 예측 또는 인터 예측 코딩 기법들을 수행하는 것이 아니라, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 특정 영역 (예컨대, 주어진 블록) 의 비디오 데이터를 표현하기 위한 컬러들의 테이블로서 이른바 팔레트를 코딩할 수도 있다. 각각의 화소는 화소의 컬러를 표현하는 팔레트에서의 엔트리와 연관될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 화소 값을 팔레트에서의 적절한 값에 관련시키는 인덱스를 코딩할 수도 있다.
위의 예에서, 비디오 인코더 (20) 는 비디오 데이터의 블록을, 블록에 대한 팔레트를 결정하며, 각각의 화소의 값을 표현하기 위해 팔레트에서 엔트리의 위치를 찾아내고, 화소 값을 팔레트에 관련시키는 화소들에 대한 인덱스 값들로 팔레트를 인코딩함으로써, 인코딩할 수도 있다. 비디오 디코더 (30) 는, 인코딩된 비트스트림으로부터, 블록에 대한 팔레트, 뿐만 아니라 그 블록의 화소들에 대한 인덱스 값들을 획득할 수도 있다. 비디오 디코더 (30) 는 블록의 화소 값들을 복원하기 위해 화소들의 인덱스 값들을 팔레트의 엔트리들에 관련시킬 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 하나 이상의 이전에 코딩된 블록들로부터의 팔레트 엔트리들을 사용하여 팔레트를 구축하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 모드 또는 다른 복원된 샘플들을 사용하여 이전에 코딩된 블록들로부터의 팔레트 엔트리들을 포함하는 예측자 팔레트로부터 현재 블록을 코딩하기 위한 하나 이상의 팔레트 엔트리들을 복사하도록 구성될 수도 있다. 예측자 팔레트에서의 각각의 엔트리에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 플래그에 연관된 엔트리가 현재 팔레트에 복사되는지의 여부를 나타내는 (예컨대, 플래그 = 1에 의해 나타내어진) 이진 플래그를 코딩하도록 구성될 수도 있다. 이진 플래그들의 문자열은 이진 팔레트 예측 벡터라고 지칭될 수도 있다. 현재 블록을 코딩하기 위한 팔레트는, (예컨대, 팔레트 예측 벡터와는 별개로) 명시적으로 코딩될 수도 있는 다수의 새로운 팔레트 엔트리들을 또한 포함할 수도 있다.
위에서 언급했듯이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트의 인덱스들을 코딩하기 위해 다수의 상이한 팔레트 코딩 모드들을 사용할 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 블록의 인덱스들을 코딩하기 위해 이스케이프 모드, 상단에서복사 모드 (또한 상측복사 모드라고 지칭됨), 또는 값 모드 (또한 인덱스 모드라고 지칭됨) 을 사용할 수도 있다. 대체로, "이스케이프 모드"를 사용하여 샘플을 코딩하는 것은 블록을 코딩하기 위한 팔레트에서 표현되는 대응 컬러를 갖지 않는 블록의 샘플을 코딩하는 것을 일반적으로 지칭할 수도 있다. 위에서 언급했듯이, 이러한 샘플들은 이스케이프 샘플들 또는 이스케이프 화소들이라고 지칭될 수도 있다.
다른 예로서, 제 3 스크린 콘텐츠 코딩 코어 실험, 서브테스트 B.6에서는, 『Yu-Wen Huang et al., "Description of Screen Content Core Experiment 3 (SCCE3): Palette Mode," JCTVC-Q1123, Valencia, ES, 27 March - 4 April 2014 (hereinafter Q1123) 』에서 설명된 바와 같이, 다른 모드가 2014년 5월 26일자로 Canon에 의해 발표된 소프트웨어에 도입되었다. 이 모드에 대한 매크로는 "CANON_NEW_RUN_LAST_TRANSITION"으로서 정의될 수도 있고 본원에서는 전이 런 (Transition Run) 모드라고 지칭될 수도 있다. 전이 런은, 비디오 인코더 (20) 또는 비디오 디코더 (30) 가 동일한 팔레트 인덱스를 갖는 후속 샘플들의 수를 특정하는 런이 뒤따르는 인덱스 값을 코딩할 수도 있다는 점에서 값 모드와 유사할 수도 있다.
값 모드와 전이 런 모드 간의 하나의 차이는 전이 런 모드의 인덱스 값이 비트스트림에서 시그널링되지 않는다는 것이다. 오히려, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 전이 런 모드에 대한 인덱스 값을 추론할 수도 있다. 본원에서 설명되는 바와 같이, 값을 추론하는 것은 비트스트림에서의 코딩된 값을 표현하는 전용 신택스를 참조하는 일이 없는 값의 결정을 지칭할 수도 있다. 다시 말하면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 비트스트림에서의 값에 대한 전용 신택스 엘리먼트를 코딩하는 일 없이 값을 추론할 수도 있다. 추론된 인덱스는 전이 인덱스라고 지칭할 수도 있다.
일부 예들에서, 팔레트 모드들을 시그널링하는 두 가지 방법들이 있을 수도 있다. 팔레트 모드들을 시그널링하기 위한 제 1 기법이 명시적 이스케이프 시그널링이라고 지칭될 수도 있다. 예를 들어, JCTVC-Q0094에서, 매크로 "PLT_REMOVE_ESCAPE_FLAG"가 0이면, 비디오 인코더 (20) 는 블록에서 코딩되고 있는 샘플이 이스케이프 모드에서 코딩되는지의 여부를 나타내기 위해 블록의 각각의 샘플에 대한 이스케이프 플래그를 명시적으로 인코딩할 수도 있다. 샘플이 이스케이프 모드로 코딩되지 않는다면, 비디오 인코더 (20) 는 그 모드가 상단에서복사인지 또는 값인지를 나타내기 위해 추가적인 데이터를 인코딩할 수도 있다. 일부 사례들에서, 추가적인 데이터는 SPoint 플래그라고 본원에서 지칭되는 플래그일 수도 있다 (예컨대, 0의 SPoint 플래그 값이 상단에서복사 모드를 나타낼 수도 있고 1의 SPoint 플래그 값이 값 모드를 나타낼 수도 있거나, 또는 반대의 경우도 마찬가지이다).
그런고로, 명시적 이스케이프 시그널링으로, SPoint 플래그는 지시된 모드에 연관된 화소 값들의 런에 대한 특정 런 유형을 나타내는데 사용될 수도 있다. 예를 들어, 비디오 인코더 (20) 는 현재 코딩되고 있는 인덱스와 런에서 코딩되고 있는 후속 인덱스 값들의 런이 상단에서복사 모드를 사용하여 코딩되는지 또는 값 모드를 사용하여 코딩되는지를 나타내기 위해 SPoint 플래그를 인코딩할 수도 있다. 비디오 인코더 (20) 는 후속 런 샘플들에 대해 이스케이프 플래그 (예컨대, "PLT_REMOVE_ESCAPE_FLAG") 와 SPoint 플래그 (필요할 때) 를 인코딩하지 않는다. 다시 말하면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런에 포함된 샘플들에 대해 이스케이프 플래그 및 SPoint 플래그의 값들을 추론할 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 비트스트림에서의 이러한 값들을 표현하는 전용 신택스를 참조하여 런에 포함되는 샘플들에 대한 이스케이프 플래그 및 SPoint 플래그의 값을 결정할 수도 있다.
팔레트 모드들을 시그널링하기 위한 제 2 기법이 암시적 이스케이프 시그널링이라고 지칭될 수도 있다. 예를 들어, JCTVC-Q0094로부터의 매크로 "PLT_REMOVE_ESCAPE_FLAG"가 1이면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 블록의 인덱스들 중 임의의 인덱스에 대응하지 않는 팔레트에 대한 특수 인덱스를 수용하기 위해 팔레트의 팔레트 엔트리들의 수를 1만큼 증가시키도록 구성될 수도 있다. 일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 주어진 블록에 대한 증가된 팔레트에서의 마지막 팔레트 인덱스로서 추가적인 인덱스를 포함할 수도 있다. 추가적인 인덱스는 이스케이프 샘플의 표시로서 사용될 수도 있다.
이 암시적 이스케이프 시그널링에서, 비디오 인코더 (20) 는, 블록의 특정 샘플 값에 대해, 추가적인 샘플이 이스케이프 모드를 사용하여 코딩됨을 나타내기 위하여 추가적인 인덱스를 표현하는 데이터를 인코딩할 수도 있다. 비디오 인코더 (20) 는 이스케이프 샘플의 컬러 값을 또한 인코딩할 수도 있다. 따라서, 암시적 이스케이프 시그널링의 경우, 명시적 신택스를 사용하여 시그널링될 단지 두 개의 가능한 모드들 (예컨대, 상단에서복사 모드 또는 값 모드) 이 있다. 예를 들어, SPoint 플래그만이 모드들 간을 구별하기 위해 시그널링될 수도 있다. 샘플이 값 모드로 코딩되고 값 모드에 대한 인덱스가 이스케이프 인덱스 (예컨대, 팔레트에 대해 위에서 언급된 추가적인 인덱스) 와 동일하다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 이스케이프 모드에서 코딩될 샘플을 추론할 수도 있다. 이 경우 런은 시그널링되지 않는다. 전이 런 모드로 암시적 이스케이프 시그널링을 사용하는 경우, SPoint 플래그는 값 0 (예컨대, 값 모드), 값 1 (예컨대, 상단에서복사 모드) 또는 값 2 (예컨대, 전이 런 모드) 를 취할 수도 있다.
본 개시물에서 설명되는 기법들은 암시적 이스케이프 시그널링과 팔레트 인덱스들의 시그널링 및 팔레트 예측 중 하나 이상의 다양한 조합들을 위한 기법들을 포함할 수도 있다. 예를 들어, 본 개시물의 양태들은 예측자 팔레트를 재설정하는 것에 관련된다. 예를 들어, 예측자 팔레트를 재설정하는 것은 예측자 팔레트의 사이즈를 0으로 설정하는 것을 포함할 수도 있어서, 예측자 팔레트는 현재 코딩되고 있는 블록에 대한 팔레트를 구축하는데 사용되지 않을 수도 있다. 이 경우, 이진 팔레트 예측 벡터가 비트스트림에서 시그널링되지 않고 팔레트 엔트리들은 예측자 팔레트로부터 예측되지 않는다.
JCTVC-Q0094에서, 예측자 팔레트가 픽처의 좌측 에지에서 (예컨대, 픽처에서의 CTB들의 행 ("CTB 행") 의 시작부분에서) 코딩 트리 블록 (CTB) 에 대해 재설정된다. CTB 행의 시작부분에서 예측자 팔레트를 재설정하기 위한 합리적인 것은 두 부분으로 될 수도 있다. 먼저, CTB들의 라인을 코딩한 후, 예측자 팔레트는 픽처의 우측에 위치된 블록들의 팔레트들에 주로 속하는 팔레트 엔트리들을 포함할 수도 있다. 따라서, 예측자 팔레트는 픽처의 좌측에 위치될 수도 있는 CTB 행의 제 1 CTB에 대해 현재 팔레트를 예측할 때에 매우 효과적이지 않을 수도 있다 (예컨대, 픽처의 좌측에 있는 화소들의 컬러들은 픽처의 우측에 있는 화소들의 컬러들과는 상이할 수도 있다). 덧붙여서, 둘 이상의 파면들이 특정 픽처를 코딩하기 위해 사용되고 있는 경우, CABAC 상태들에 더하여, 파면들 간에 예측자 팔레트에 관한 정보를 전파하는 것이 필요할 것이다.
예를 들어, 파면은 코딩하기 위한 비디오 데이터의 단위일 수도 있고, 다른 파면들과 병렬로 코딩될 수도 있다. 예를 들어, 파면 병렬 프로세싱 (WPP) 과 중첩 파면 (Overlapped Wavefront, OWF) 를 포함하는 두 개의 병렬화 접근법들이 HEVC에 포함된다. WPP는 높은 코딩 손실들을 초래하는 일 없이 병렬로 프로세싱될 수 있는 픽처 구획들을 생성하는 것을 허용한다. WPP에서 CTB들의 행들은 모든 코딩 의존성들을 보존하면서 병렬로 프로세싱된다. OWF는 파면들을 사용하여 연속적인 픽처들의 실행을 중첩하는 것을 허용한다.
그러나, 일부 사례들에서, 예측자 팔레트를 재설정하는 것은 코딩 손실들로 이어질 수도 있다. 예를 들어, 예측자 팔레트 없이, 비디오 인코더 (20) 와 비디오 디코더 (30) 가 비트스트림에서 팔레트의 엔트리들의 모두 (예컨대, 팔레트 인덱스들 및 관련된 컬러 값들의 모두) 를 나타내는 데이터를 코딩할 수도 있다. 이 팔레트 데이터는 단일 플래그를 사용하여 비트스트림에서 나타내어질 수도 있는 예측된 팔레트 엔트리들에 비하여 상대적으로 많은 양의 데이터일 수도 있다. 따라서, 예측자 팔레트를 재설정하는 것은 팔레트 기반 코딩으로 코딩된 비디오 데이터의 비트레이트에 악영향을 미칠 수도 있다.
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 1 또는 0 (즉, 파면들이 없음) 인 픽처를 코딩하는데 사용되는 파면들의 수에 기초하여 예측자 팔레트의 재설정을 불능화하도록 구성될 수도 있다. 다시 말하면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 1 또는 0의 파면들이 픽처를 코딩하는데 사용되는 경우 예측자 팔레트를 재설정하지 않도록 구성될 수도 있다. 그러나, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 둘 이상의 파면들이 픽처를 코딩하는데 사용되는 경우 예측자 팔레트의 재설정을 가능화하도록 구성될 수도 있다. 이 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 단일 파면 경우에서의 코딩 손실들을 여전히 피하면서도, 파면들 간에 예측자 팔레트에 관한 정보를 전파하는 것이 필요하지 않을 수도 있다.
본 개시물의 양태들에 따르면, 다수의 타일들과 다수의 파면들이 픽처를 코딩하는데 사용되는 (예컨대, 비디오 인코더 (20) 와 비디오 디코더 (30) 가 픽처를 코딩하기 위해 둘 이상의 타일들과 둘 이상의 파면들을 사용하는) 경우, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 각각의 타일 CTB 행의 시작부분에서 예측자 팔레트를 재설정하도록 구성될 수도 있다. 타일 CTB 행이 특정 타일에 속하는 CTB 행으로부터의 CTB들을 포함할 수도 있다. 블록들을 코딩하는데 사용되는 특정 스캔 순서에 의존하여, "행"은 수직으로 또는 수평으로 배향될 수도 있다는 것이 이해되어야 한다. 행이 라인으로서 본원에서 또한 지칭될 수도 있고, 용어들은 본원에서 교환적으로 사용될 수도 있다.
본원에서 사용되는 기법들은 팔레트 전이 테이블에 또한 적용될 수도 있다. 예를 들어, 표준 제출 문서 『Yu-Chen Sun et al., "CE6 Test C.2 Transition Copy Mode," JCTVC-S0078, Strasbourg, FR, 17-24 October』 (JCTVC-S0078) 는 전이 복사 모드를 설명한다. 전이 복사는 전이 복사 런 (TC 런) 모드라고 또한 지칭될 수도 있다. TC 런 모드에서, 디코더가 인접한 컬러 인덱스 패턴들을 기록하고 코딩될 인덱스들을 예측하기 위해 패턴들을 사용한다. TC 런 모드에서, 일 예로서, 현재 화소 (C) 는 1과 동일한 파일럿 컬러 인덱스를 갖는다. 코딩된 화소들의 인과 영역 (causal area) 으로부터, 비디오 코더 (이를테면 비디오 인코더 (20) 또는 비디오 디코더 (30)) 가 (예컨대, 좌측에서 우측으로의 스캔을 가정하면) 1과 동일한 컬러 인덱스의 우측에 대한 컬러 인덱스가 2일 가능성이 있다고 결정할 수도 있다. 1부터 2까지의 이 전이 패턴은 컬러 인덱스 예측 효율을 향상시키기 위해 전이 복사 테이블 (TC 테이블) 에 기록될 수도 있다.
JCTVC-S0078에서, TC 테이블이 코딩되고 있는 현재 CU가 슬라이스의 첫 번째 CU인 경우 재설정되거나, 또는 현재 CU가 슬라이스의 첫 번째가 아닌 CU인 경우 현재 CU는 이전 CU의 TC 테이블을 상속받는다. 이 상속 속성은 "TC 테이블 전파"라고 지칭될 수도 있다. TC 테이블은 유지되고 CU에서의 화소들이 코딩됨에 따라 업데이트된다.
일부 예들에서는, 전이 복사 모드에서, 두 개의 전이 테이블들, 즉, 짝수 인덱싱된 행들에 대한 테이블 및 홀수 인덱싱된 행들에 대한 다른 테이블이 유지된다. 이전의 기여분들은 단일 전이 테이블을 사용하여 설명되었다. 그렇더라도, 대체로, 위에서 언급했듯이, 이전의 팔레트 코딩된 CU (또는 블록) 로부터의 전이 테이블이 팔레트 모드에서 코딩되는 현재 CU (또는 블록) 에 대한 전이 테이블을 초기화하는데 사용될 수도 있다.
본 개시물의 양태들에 따르면, CTB 행에서의 제 1 CTB 또는 CTB 행의 타일에서의 제 1 CTB의 시작부분에서 팔레트를 재설정하는 개념은, 다수의 파면들이 사용되고 있는 경우, 위에서 설명된 바와 같이, 그들 로케이션들에서도 팔레트 전이 테이블 (또는 테이블들) 을 재설정하는 것으로 확장될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 다수의 파면들 (또는, 동등하게는, CTB들 내의 첫 번째 팔레트-코딩된 CU들) 이 사용되고 있는 경우, CTB 행에서의 첫 번째 CTB 또는 CTB 행의 타일에서의 첫 번째 CTB에 대해 팔레트 전이 테이블에서의 엔트리들의 모두를 0으로 (또는 임의의 다른 고정된 팔레트 인덱스, 또는 임의의 다른 패턴으로) 설정하도록 구성될 수도 있다. 본 개시물의 양태들에 따르면, 예측자 팔레트 및 팔레트 전이 테이블들의 재설정은 하나의 팔레트-코딩된 CU로부터 다른 팔레트-코딩된 CU로 전파될 수도 있는 임의의 다른 팔레트 관련된 데이터로 일반화될 수도 있다.
다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트 재설정 (및/또는 위에서 언급된 팔레트 전이 테이블들과 같은 다른 정보의 재설정) 이 각각의 CTB 행의 시작부분에서 수행되는지의 여부를 나타내는 비디오 파라미터 세트 (video parameter set, VPS), 시퀀스 파라미터 세트 (sequence parameter set, SPS), 픽처 파라미터 세트 (picture parameter set, PPS), 슬라이스 헤더의 플래그를, 타일 레벨에서, 블록 레벨에서 또는 다른 곳에서 코딩하도록 구성될 수도 있다. 플래그가 타일 레벨에서 시그널링되는 사례들에서, 플래그는 예측자 팔레트 재설정이 각각의 타일 CTB 행의 시작부분에서 (예컨대, 타일에서의 CTB들의 각각의 행의 시작부분에서) 수행되는지의 여부를 나타낼 수도 있다. 대안적으로, CTB들의 행에서 팔레트 모드를 사용하여 코딩되는 첫 번째 블록에 대해, 예측자 팔레트 재설정이 수행되는지의 여부를 나타내는 플래그가 시그널링될 수도 있다.
다른 예에서, 플래그 (예컨대, 플래그가 하나 이상의 신택스 엘리먼트들일 수도 있음) 가, 예측자 팔레트 재설정이 수행되어야 하는지의 여부를 나타내기 위해 팔레트 모드를 사용하여 코딩된 각각의 블록에 대해 시그널링될 수도 있다. 일부 예들에서, 이 기법은 비디오 인코더 (20) 와 비디오 디코더 (30) 가 명시적으로 시그널링된 모든 팔레트 엔트리들을 갖는 기법들 또는 예측자 팔레트를 사용하여 팔레트 엔트리들의 일부를 예측하는 기법들 사이에서 선택할 수 있는 것을 허용하는 장점을 가질 수도 있다. 일부 예들에서, 플래그 값은 추론될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 각각의 파면에 대한 플래그의 값을 추론하도록 구성될 수도 있어서, 추론된 값은 예측자 팔레트가 재설정됨을 나타낸다. 대안적으로 또는 부가적으로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 슬라이스 또는 타일의 첫 번째 블록에 대한 플래그의 값을 추론하도록 구성될 수도 있어서, 추론된 값은 각각의 슬라이스 및/또는 타일의 시작부분에서 예측자 팔레트가 재설정됨을 나타낸다.
다른 예에서, 예측자 팔레트 재설정을 나타내기 위해 플래그를 시그널링하기 보다는, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 규칙 또는 규칙들의 세트에 따라 예측자 팔레트를 재설정하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 규칙 또는 규칙들의 세트를 적용하도록 양쪽 모두가 구성될 수도 있다. 하나의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트를 재설정할지의 여부를 결정하기 위해 다음의 규칙을 적용하도록 구성될 수도 있다: 현재 블록에서의 팔레트가 예측자 팔레트로부터 예측되는 엔트리들을 갖지 않는다면, 예측자 팔레트가 이 현재 블록에 대해 재설정되어서 (예컨대, 예측자 팔레트가 0의 길이를 갖도록 설정되어서), 이전 블록들로부터의 팔레트 엔트리들이 아니라, 현재 팔레트만이 다음 블록들에 대한 예측자로서 사용될 수도 있다.
위의 예에서, 비디오 인코더 (20) 는 팔레트 재설정을 제어할 수도 있다. 예를 들어, 팔레트가 재설정될 경우, 비디오 인코더 (20) 는 예측자 팔레트로부터의 임의의 엔트리들을 그냥 사용하지 않을 수도 있다. 이 프로세스를 구현하는 하나의 잠재적 이점은 새로운 신택스 엘리먼트들이 추가되지 않고, 팔레트 재설정은 더욱 세밀하고 더욱 유연하게 제어될 수도 있다는 것이다. 예를 들어, 유연성/세분도는 예측자 팔레트 재설정이 수행되는 조건들을 변경하는 능력으로 인해 성취될 수도 있다.
일부 예들에서, 비디오 인코더 (20) 는 다음 경우들, 즉, 각각의 LCU 행에서의 첫 번째 LCU의 경우, 파면 코딩이 가능하게 되는 경우; 타일에서의 첫 번째 블록의 경우, 또는 슬라이스에서의 첫 번째 블록의 경우 중 적어도 하나에서 예측자 팔레트를 사용하지 않을 수도 있다.
본 개시물의 양태들에 따르면, 예측자 팔레트가 재초기화될 수도 있다. 예를 들어, 예측자 팔레트를 재초기화하는 것은 예측자 팔레트의 엔트리들을 새로운 엔트리들로 대체하는 것을 일반적으로 지칭할 수도 있다. 예를 들어, 인덱스들의 블록을 코딩한 후 예측자 팔레트가 코딩될 다음 블록의 팔레트를 예측하기 위한 다수의 엔트리들을 포함할 수도 있다. 예측자 팔레트를 재초기화하는 것은 다수의 엔트리들을 제거하는 것과 코딩될 다음 블록의 팔레트를 예측하기 위해 새로운 엔트리들을 예측자 팔레트에 추가하는 것을 포함할 수도 있다.
일부 예들에서, 본 개시물의 양태들에 따르면, 각각의 CTB 라인의 시작부분에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 현재 CTB 라인이 픽처/슬라이스/타일에서의 첫 번째 CTB 라인이 아니면, 현재 CTB 상측의 CTB 라인의 제 1 CTB로부터의 팔레트 엔트리들을 사용하여 현재 CTB의 현재 팔레트를 결정하기 위한 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 이 경우, 아래의 도 5의 예에 관해 더 상세히 설명되는 바와 같이, 첫 번째 CTB의 코딩을 종료한 후 그리고 상측의 CTB 라인에서의 두 번째 CTB를 코딩하기 전 (첫 번째 CTB가 픽처/슬라이스/타일에서의 첫 번째 CTB 라인이 아니라면), 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트를 사용하여 현재 CTB 라인의 시작부분에서 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 현재 CTB 라인이 픽처/슬라이스/타일에서의 첫 번째 것이면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트 엔트리들의 수를 (예컨대, JCTVC-Q0094에서 설명된 바와 같이) 설정하고, 현재 CTB에 대한 팔레트를 결정하는 경우 임의의 팔레트 엔트리들을 예측하지 않도록 구성될 수도 있다.
다른 예에서, 예측자 팔레트를 재초기화하는 개념은 일반화될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 (CTB들의 라인이 픽처/슬라이스/타일에서의 첫 번째 CTB 라인이 아니라면) 현재 코딩되고 있는 CTB 상측의 CTB들의 라인의 N 개의 CTB들을 코딩한 후 그리고 현재 코딩되고 있는 CTB 상측의 CTB 라인에서의 N+1번째 CTB의 코딩을 시작하기 전에 예측자 팔레트를 생성하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 생성된 예측자 팔레트를 사용하여, 현재 코딩되고 있는 CTB의 팔레트를 결정하기 위한 예측자 팔레트를 초기화하도록 구성될 수도 있다. 현재 코딩되고 있는 CTB는 (현재 CTB가 픽처/슬라이스/타일에서의 첫 번째 CTB 라인이 아니라면) 현재 CTB 라인의 첫 번째 CTB일 수도 있다. 여기서, N은 1과 CTB 라인에서의 CTB들의 수 사이일 수도 있다. 이 예측자 팔레트 재초기화 기법과 파면 코딩을 개념적으로 정렬하기 위해, N은 2 이하로 선택될 수도 있다. 이런 식으로, 동일한 예측자 팔레트 재초기화 프로세스는 픽처를 코딩하는데 사용되는 파면들의 수에 상관없이 사용될 수도 있다.
위에서 언급했듯이, CTB가 LCU라고 또한 지칭될 수도 있다. 일부 예들에서, 예측자 팔레트 재초기화는 (예컨대, 다양한 예측 (인터 모드 또는 인트라-모드) 또는 팔레트 모드들이 CTB를 코딩하는데 사용될 수도 있는 사례들에서, 팔레트 모드가 CTB의 임의의 블록을 예측하는데 사용되는 블록들의 라인의 첫 번째 CTB에 대해 수행될 수도 있다. 위의 예들이 예시를 목적으로 CTB들에 관해 설명되지만, 그 기법들은 비디오 데이터의 블록의 임의의 유형으로 확장될 수도 있다는 것이 이해되어야 한다.
본 개시물의 양태들에 따르면, 위에서 설명된 팔레트 재초기화 프로세스는 팔레트 전이 테이블들로 확장될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 (현재 CTB가 픽처/슬라이스/타일에서의 첫 번째 CTB 라인이 아니라면) N 개의 CTB들을 코딩한 후 그리고 현재 CTB 상측의 CTB 라인에서의 N+1번째 CTB의 코딩을 시작하기 전에 생성된 팔레트 전이 테이블들을 사용하여 현재 CTB 행의 시작부분에서 팔레트 전이 테이블들을 재초기화하도록 구성될 수도 있다. 여기서, N은 1과 CTB 라인에서의 CTB들의 수 사이일 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 2 이하인 N의 값을 선택하도록 구성될 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 전이 테이블들 자체들 외에도 전이 테이블들의 사이즈를 복사하도록 구성될 수도 있다. 실제로, 팔레트 코딩 정보 (예컨대, 예측자 팔레트 정보, 팔레트 전이 테이블 정보 등) 를 재초기화하는 이 프로세스는 팔레트-코딩된 CU로부터 다음의 팔레트-코딩된 CU로 전파되는 임의의 다른 팔레트 관련된 데이터에 대해 생성될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 N 개의 CTB들을 코딩한 후 그리고 현재 CTB 상측의 CTB 라인에서의 N+1번째 CTB의 코딩을 시작하기 전에 생성된 팔레트 데이터에 기초하여 현재 CTB에 대한 팔레트 관련된 데이터를 재초기화하도록 구성될 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 모든 적용가능 CTB들 (예컨대, CTB들의 라인에서의 처음에 코딩된 CTB들) 에 대해 재초기화를 사용하도록 구성될 수도 있다. 다른 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 오직 픽처 또는 타일을 코딩하는데 사용되고 있는 파면들의 수가 둘 이상인 경우 재초기화 기법들을 수행하도록 구성될 수도 있다.
본 개시물의 양태들에 따르면, 타일들 및 파면들이 특정 픽처를 코딩하기 위해 함께 사용되고 있는 경우, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 마치 타일들이 별개의 픽처들인 것처럼 재초기화 기법들을 타일들에 적용하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 아래의 도 7에 관해 더 상세히 설명되는 바와 같이, 제 1 타일 CTB가 타일에서의 첫 번째 CTB 라인이 아니라면, 제 1 타일 CTB에 대해 위에서 설명된 재초기화 프로세스를 적용하도록 구성될 수도 있다.
본 개시물의 다른 양태들은 암시적 이스케이프 시그널링이 사용되는 예들에서 이스케이프 샘플들을 시그널링하는 것에 관련된다. 예를 들어, JCTVC-Q0094에서는, 위에서 설명된 암시적 이스케이프 기법에 대해, 팔레트의 사이즈는 1만큼 증가되고 확장된 팔레트에서의 마지막 인덱스는 샘플이 이스케이프 샘플로서 코딩되는지의 여부를 나타내기 위해 배정된다. 절단 이진 코딩 (truncated binary coding) 이 인덱스들을 코딩하는데 사용된다면, 마지막 인덱스는 인덱스 0보다 더 많은 비트를 사용할 수도 있다. 마찬가지로, 다른 가변 길이 코딩 전략이 사용된다면, 길이들에서의 차이는 훨씬 크게 될 수도 있다.
통상적으로, 특정한 블록 사이즈들에 대해, 다른 사이즈들의 블록들보다는 이스케이프 샘플들로서 코딩되는 더 많은 샘플들이 있을 수도 있다. 이 관계를 활용하여 인덱스들의 코딩을 개선하기 위해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 이스케이프 샘플로서 코딩된 더 많은 화소들을 가질 가능성이 있는 블록들에 대해 이스케이프 샘플을 나타내는데 사용되는 인덱스에 팔레트의 0 인덱스를 배정하도록 구성될 수도 있다. 이스케이프 샘플들로서 코딩된 상대적으로 더 적은 샘플들을 가질 수도 있는 다른 블록들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 이스케이프 샘플을 나타내기 위해 확장된 팔레트로부터의 최고 인덱스를 배정하는 현재 스킴을 추종하도록 구성될 수도 있다.
예시의 목적을 위한 일 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 블록 사이즈들 32×32 이하에 대한 이스케이프 샘플을 나타내는데 사용되는 인덱스에 0 인덱스를 배정하도록 구성될 수도 있다. 이 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 64×64 블록들 이상에 대한 이스케이프 샘플을 나타내는데 사용된 인덱스에 최고 (예컨대, 팔레트 인덱스들의 숫자상으로 최대) 인덱스를 배정하도록 구성될 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 각각의 블록 사이즈에 대한 동일한 이스케이프 인덱스 배정 규칙을 선험적으로 구현하도록 구성될 수도 있다. 다른 예에서, 이스케이프 인덱스 배정 규칙이, 비디오 파라미터 세트 (VPS), 시퀀스 파라미터 세트 (SPS), 픽처 파라미터 세트 (PPS), 슬라이스 헤더에, 타일 레벨에서 또는 다른 곳에서 명시적으로 시그널링될 수도 있다.
본 개시물의 다른 양태들은 명시적 이스케이프 시그널링이 사용되는 예들에서 이스케이프 샘플들을 시그널링하는 것에 관련된다. 명시적 이스케이프 시그널링의 경우, 이스케이프 모드는 플래그로 시그널링될 수도 있다. 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 블록 사이즈에 기초하여 이스케이프 플래그들을 콘텍스트 적응적으로 코딩하도록 구성될 수도 있다. 예를 들어, 콘텍스트들은, 특정한 블록 사이즈들에 대해, 다른 블록 사이즈들에 비하여 이스케이프 샘플을 사용하여 코딩되는 더 많은 샘플들이 있을 수도 있다는 관계를 이용하기 위하여 이스케이프 플래그들을 코딩하도록 설계될 수도 있다. 이 경우, 플래그에 대한 콘텍스트는 블록 사이즈에 따라 달라질 수도 있다. 덧붙여, 일부 예들에서, 팔레트 사이즈가 CU에서 시그널링될 이스케이프 샘플들의 양/수와 일부 상관을 가질 수도 있다. 그러므로, 콘텍스트는 팔레트 사이즈에 또는 팔레트 사이즈가 최대 팔레트 사이즈와 동일한지 (또는 최대 팔레트 사이즈와 동일하지 않은지) 에 의존할 수도 있다.
본 개시물의 다른 양태들은 값 팔레트 모드를 사용하여 코딩된 인덱스들의 런들에 대한 런 값들을 시그널링하는 것에 관련된다. 예를 들어, 표준 제출 문서『Guillaume Laroche et al., "AHG10: Run Coding for Palette Mode," JCTVC-Q0066, Valencia, ES, 27 March - 4 April 2014』 (JCTVC-Q0066) 에서, 팔레트를 사용하여 코딩된 각각의 블록에 대해, 인데스-임계값이 시그널링될 수도 있다는 것이 제안된다. 값 모드에서 코딩되어 있는 인덱스가 인덱스-임계값 이상이면, 런이 값 모드에 대해 시그널링되지 않는다. 본 개시물은 이 방법을 "제한된 런 (Limited Run)"으로서 지칭할 수도 있다.
본 개시물의 양태들에 따르면, Q0066에서 설명된 프로세스에 대해 수정들이 이루어질 수도 있다. 제 1 인덱스들이 신택스 엘리먼트 num_skip에 의해 나타내어진 제 1 예에서, 런이 항상 시그널링된다. 일부 예들에서, 신택스 엘리먼트 num_skip은 2와 동일하며, 그래서 런은 인덱스들 (0 및 1) 에 대해 항상 시그널링된다. 신택스 엘리먼트 num_skip에 의해 나타내어진 값은 비디오 인코더 (20) 와 비디오 디코더 (30) 둘 다에 선험적으로 알려질 (예컨대, 비디오 코더들에서 미리 결정될) 수도 있거나, 또는 비디오 파라미터 세트 (VPS), 시퀀스 파라미터 세트 (SPS), 픽처 파라미터 세트 (PPS), 슬라이스 헤더에, 타일 레벨에서 또는 다른 곳에서 명시적으로 시그널링될 수도 있다.
제 2 예에서, 팔레트 사이즈가 특정 팔레트 사이즈 임계값 미만이면, 인덱스 임계치는 시그널링되지 않고 런은 각각의 인덱스에 대해 시그널링된다. 플레트 사이즈 임계값은 비디오 인코더 (20) 와 비디오 디코더 (30) 둘 다에 선험적으로 알려질 수도 있거나, 또는 비디오 파라미터 세트 (VPS), 시퀀스 파라미터 세트 (SPS), 픽처 파라미터 세트 (PPS), 슬라이스 헤더에, 타일 레벨에서 또는 다른 곳에서 명시적으로 시그널링될 수도 있다.
제 3 예에서, 인덱스 임계치가 시그널링되는지의 여부를 나타내기 위해, 팔레트 사이즈가 팔레트 사이즈 임계값보다 더 큰 모든 블록에 대해 플래그가 시그널링될 수도 있다. 그 플래그는 특정한 블록 사이즈들 및/또는 팔레트 사이즈들에 대해서만 시그널링될 수도 있다. 인덱스 임계치가 시그널링되지 않는다면, 런은 모든 인덱스들에 대해 시그널링된다. 대안적 예에서, 명시적 플래그를 시그널링하는 대신, 팔레트 사이즈의 인덱스 임계치가, 런이 모든 인덱스들에 대해 시그널링됨을 나타내기 위해 시그널링된다.
제 4 예에서, 절단된 이진화 (예를 들어, 2014년 5월 22일자로 출원된 미국 임시 출원 제62/002,054호에서 설명된 바와 같은 절단 이진 코딩) 는, 팔레트의 사이즈가 팔레트-사이즈-임계값을 초과한다면, 블록에 대한 인덱스-임계값을 코딩하는데 사용될 수도 있다. 위의 제 3 예에서와 같은 명시적 플래그가 시그널링된다면, 절단된 이진화에 대한 최대 값은 (현재 팔레트 사이즈 - num_skip) 일 수도 있다. 명시적 플래그가 전송되고 있지 않다면, 절단된 이진화에 대한 최대 값은 (현재 팔레트 사이즈 - num_skip + 1) 일 수도 있다.
제 5 예에서, 팔레트 인덱스 재배열, 재순서화 또는 재매핑 후에 런 값이 코딩될 수도 있다. 예를 들어, 일부 팔레트 코딩 기법들이 인덱스들의 더 긴 런들을 갖도록 인덱스들을 그룹화하는데 사용될 수도 있다. 하나의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스들의 적응적 스캔을 수행하도록 또는 버로우즈 휠러 변환 (Burrows Wheeler transform) 을 적용하도록 구성될 수도 있다.
제 6 예에서, 인덱스 임계치는 제 3 예에 관해 위에서 설명된 명시적 플래그가 시그널링되는 사례들에서 (팔레트 사이즈 - 인덱스 임계치) 으로서 시그널링될 수도 있다. 마찬가지로, 인덱스 임계치는 이러한 명시적 플래그가 시그널링되지 않는 사례들에서 (팔레트 사이즈 + 1 - 인덱스 임계치) 으로서 시그널링될 수도 있다. 일부 사례들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 블록 사이즈 및/또는 팔레트 사이즈에 기초하여 인덱스 임계치 또는 (팔레트 사이즈 - 인덱스 임계치) 을 코딩하도록 구성될 수도 있다. 일부 예들에서, 유사한 전략이 명시적 플래그가 시그널링되지 않는 사례들에서 사용될 수도 있다.
6 개의 위에서 설명된 예들의 기법들은 비디오 인코더 (20) 와 비디오 디코더 (30) 에 의해 개별적으로 또는 조합하여 구현될 수도 있다. 덧붙여서, 그 기법들은 블록 사이즈 및/또는 팔레트 사이즈에 의존하여 선택적으로 구현될 수도 있다. 블록 사이즈 및/또는 플레트 사이즈에 대한 이러한 의존관계는 비디오 인코더 (20) 와 비디오 디코더 (30) 둘 다에 선험적으로 알려질 수도 있거나, 또는 비디오 파라미터 세트 (VPS), 시퀀스 파라미터 세트 (SPS), 픽처 파라미터 세트 (PPS), 슬라이스 헤더에, 타일 레벨에서 또는 다른 곳에서 명시적으로 시그널링될 수도 있다.
JCTVC-Q0066과는 대조적으로, 본 개시물의 양태들에 따르면, 위에서 설명된 기법들은 규범적일 수도 있다. 예를 들어, 이는 유효한 비트스트림 (예컨대, 특정 표준에 부합하는 디코더에 의해 디코딩 가능한 비트스트림) 이 값 모드를 사용하여 코딩되고 연속적인 포지션들에서 발생할 런이 시그널링되지 않는 인덱스를 갖는 것이 허용되지 않는다는 것을 의미한다. 다시 말하면, 동일한 인덱스 값을 갖는 두 개의 연속적인 포지션들이 값 모드를 사용하여 코딩되지 않을 수도 있다. 이 제약조건은 비트스트림에 대한 규범적 제약조건으로서 취급될 수도 있다. 다시 말하면, 부합하는 비트스트림이, 런이 시그널링되지 않는 동일한 인덱스 값들을 갖는 값 모드로 코딩된 임의의 둘 이상의 연속적인 화소들을 포함하지 않을 것이다. 이는 『C. Gisquet et al., "AHG10: Palette Index Coding," JCTVC-Q0064, Valencia, ES, 27 March - 4 April 2014』 (JCTVC-Q0064) 에서 설명되는 이른바 불가능한 인덱스 값들의 제거뿐만 아니라, 2014년 5월 22일자로 출원된 미국 임시 출원 제62/002,054호에서 설명된 모든 리던던시 제거들의 적용을 가능하게 한다.
전이 런 모드가 또한 사용된다면, 제한된 런 기법은 전이 런 모드로도 확장될 수도 있다. 이 경우, 모드가 값 또는 전이 런이고 팔레트 인덱스 (값 모드의 경우) 또는 추론된 팔레트 인덱스 (전이 런 모드의 경우) 가 인덱스 임계치를 초과한다면, 런은 시그널링되지 않고 동일한 규범적 비트스트림 제약조건이 위에서 설명된 바와 같이 적용될 수도 있다.
본 개시물의 다른 양태들은 팔레트 인덱스들의 런의 런-길이를 나타내는 런 값을 코딩하는 것에 관련된다. 예에서, 그 기법들은 값 모드를 사용하여 코딩된 인덱스의 런 값을 코딩하는데 사용될 수도 있다.
예를 들어, 일부 예들에서, 세 개의 콘텍스트 코딩된 플래그들이 값 모드에서 런 값을 코딩하는데 사용될 수도 있다. 이러한 예들에서, 세 개의 콘텍스트 코딩된 플래그들은 런 값이 0보다 더 큰지의 여부를 나타내는 0보다 더 큰 플래그, 런 값이 1보다 더 큰지의 여부를 나타내는 1보다 더 큰 플래그, 및 런 값이 2보다 더 큰지의 여부를 나타내는 2보다 더 큰 플래그를 포함할 수도 있다. 일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 단일 콘텍스트를 사용하여 세 개의 플래그들의 각각을 코딩하도록 구성될 수도 있다.
그러나, 단일 콘텍스트를 사용하는 것은 플래그들의 각각을 코딩한 후 콘텍스트에 연관된 확률 모델을 업데이트하도록 비디오 인코더 (20) 와 비디오 디코더 (30) 에 요구할 수도 있다. 더욱이, 위의 확률 업데이팅 프로세스는 코딩 프로세스에 지연을 도입할 수도 있다. 예시의 목적을 위한 일 예에서, 세 개의 빈들이 콘텍스트 적응 코딩의 목적으로 동일한 콘텍스트 모델 (예컨대, ctx (0)) 을 사용한다. 이 예에서, 제 1 빈이 코딩하기 위한 확률 모델을 결정하기 위해 ctx (0) 를 사용할 수도 있다. 제 1 빈의 값은 ctx (0) 에 연관된 확률 모델에 영향을 준다. 따라서, 확률 업데이트가 ctx (0) 으로 제 2 빈을 코딩하기 전에 수행된다. 추가적인 확률 업데이트가 ctx (0) 으로 제 3 빈을 코딩하기 전에 또한 수행된다. 이런 식으로, 확률 업데이트는 코딩 사이클에 지연을 도입할 수도 있다.
더구나, 런 값의 제 1 빈, 제 2 빈, 및 제 3 빈 사이의 상관은 확률 모델을 업데이트하는 것에 연관된 시간 및 계산적 리소스들을 보장하는데 불충분할 수도 있다. 다시 말하면, 콘텍스트 적응 코딩의 하나의 잠재적 이점은 (동일한 콘텍스트이 주어진다고 하면) 이전에 코딩된 빈들에 기초하여 확률 모델을 적응하는 능력이다. 그러나, 제 1 빈의 값이 후속 빈의 값에 관련이 거의 없다면, 확률 업데이트에 연관된 효율 이득이 거의 없을 수도 있다. 따라서, 낮은 상관을 나타내는 빈들이 상대적으로 더 높은 상관들을 갖는 빈들만큼 콘텍스트 적응 코딩으로부터 혜택을 받지 못할 수도 있다.
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값의 인덱스에 기초하여 런 값을 코딩하기 위한 콘텍스트를 결정하도록 구성될 수도 있다. 부가적으로 또는 대안으로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 현재 코딩되고 있는 블록의 블록 사이즈, 또는 현재 코딩되고 있는 블록에 대한 팔레트의 팔레트 사이즈에 기초하여 런 값을 코딩하기 위한 콘텍스트를 결정하도록 구성될 수도 있다. 일부 예들에서, 본 개시물의 양태들은 런 값을 코딩하기 위해 다수의 콘텍스트들을 사용하는 것을 포함한다.
하나의 예에서, 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 코딩하기 위한 7 개의 콘텍스트들을 사용하도록 구성될 수도 있다. 예를 들어, 7 개의 콘텍스트들이 런 값이 0보다 크다는 것을 나타내는 플래그를 코딩하기 위해 정의될 수도 있다. 이 예는 아래의 표 1에서 예시되어 있다:
표 1 - 인덱스에 기초하여 런을 코딩하기 위한 7 개의 콘텍스트들
인덱스 런 콘텍스트
0 0
1 1
2 2
3 3
[4, 7] 4
[8, 15] 5
[16, 31] 6
표 1의 예가 7 개의 콘텍스트들을 예시하지만, 다른 예들에서, 대안적 수의 콘텍스트들이 코딩되고 있는 런의 인덱스 값에 기초하여 정의될 수도 있다. 표 1은 MAX_PLT_SIZE 신택스 엘리먼트가 32라고 가정할 수도 있다.
다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스 값에 기초하여 값 모드에 대한 런 값들을 코딩하기 위해 두 개의 콘텍스트들을 사용하도록 구성될 수도 있다. 예를 들어, 값 모드 인덱스 0에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (0) 을 사용하도록 구성될 수도 있다. 이 예에서, 모든 다른 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (1) 을 사용하도록 구성될 수도 있다.
다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스 값에 기초하여 값 모드에서의 런 값들을 코딩하기 위해 두 개의 콘텍스트들을 사용하도록 구성될 수도 있다. 이 예들에서, 값 인덱스들 (0 및 1) 에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (0) 을 사용하도록 구성될 수도 있다. 1보다 큰 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (1) 을 사용하도록 구성될 수도 있다.
또 다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스 값에 기초하여 값 모드에서의 런 값들을 코딩하기 위해 세 개의 콘텍스트들을 사용하도록 구성될 수도 있다. 예를 들어, 값 인덱스 0에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (0) 을 사용하도록 구성될 수도 있다. 1 및 2의 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (1) 을 사용하도록 구성될 수도 있다. 2보다 큰 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (2) 를 사용하도록 구성될 수도 있다.
또 다른 예에서, 세 개의 콘텍스트들은 인덱스 값에 기초하여 값 모드에서의 런 값들을 코딩하는데 사용될 수도 있다. 예를 들어, 값 인덱스들 (0 및 1) 에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (0) 을 사용하도록 구성될 수도 있다. 2 내지 5 를 포함한 범위에서의 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (1) 을 사용하도록 구성될 수도 있다. 5보다 큰 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (2) 를 사용하도록 구성될 수도 있다.
다른 예에서, 네 개의 콘텍스트들이 인덱스 값에 의존하여 (예컨대, 기초하여) 값 모드에서의 런 값들을 코딩하는데 사용될 수도 있다. 예를 들어, 값 인덱스 0에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (0) 을 사용하도록 구성될 수도 있다. 값 인덱스들 (1 및 2) 에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (1) 을 사용하도록 구성될 수도 있다. 3 내지 6을 포함한 범위에서의 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (2) 를 사용하도록 구성될 수도 있다. 6보다 큰 값 인덱스들에 대해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값이 사용될 수도 있다는 것을 나타내는 데이터를 코딩하기 위해 런 콘텍스트 (3) 을 사용하도록 구성될 수도 있다. 일부 사례들에서는, 위의 기법들의 임의의 조합이 콘텍스트를 결정하는데 사용될 수도 있다.
위에서 설명된 기법들은 이진화된 런 값의 빈들의 임의의 조합을 코딩하는데 사용될 수도 있다. 예를 들어, 위에서 언급했듯이, 이진화된 런 값이, 런 값이 0보다 더 큰지의 여부를 나타내는 제 1 빈, 런 값이 1보다 더 큰지의 여부를 나타내는 제 2 빈, 런 값이 2보다 더 큰지의 여부를 나타내는 제 3 빈, 및 런 값을 표현하는데 필요한 임의의 다른 빈들을 포함할 수도 있다. 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 이진화된 런 값의 제 1 빈, 이진화된 런 값의 제 2 빈, 이진화된 런 값의 제 3 빈, 또는 그것들의 임의의 조합을 코딩하기 위한 위에서 정의된 콘텍스트들을 선택하도록 구성될 수도 있다. 그 기법들은 런 값의 다른 이진화들에 또한 적용될 수도 있다.
본 개시물의 양태들에 따르면, 콘텍스트는 실제 인덱스 값 또는 조정된 인덱스 값에 기초할 수도 있다. 예를 들어, 하나의 예에서, 런 콘텍스트들은 신택스 palette_index가 아니라 신택스 엘리먼트 adjusted_palette_index에 따라 달라질 수도 있으며, 여기서 신택스 엘리먼트 adjusted_palette_index는 다음의 조건들에 기초하여 조정된 인덱스를 나타낼 수도 있다:
(adjusted_palette_index >= adjustedRefIndex) 이면, palette_index = adjusted_palette_index+1
그렇지 않으면, (palette_index = adjusted_palette_index)
이는 『Wei Pu et al., "SCCE3: Test B.12 - Binarization of Escape Sample and Palette Index," JCTVC-R0065, Sapporo, JP, 30 June - 9 July 2014』 (JCTVC-R0065) 에서 설명되는 바와 같다. 다시 말하면, 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 조정된 팔레트 인덱스가 비트스트림에서 시그널링되는 사례들에서, 블록의 샘플을 코딩하는데 실제로 사용되는 팔레트 인덱스가 아니라, 비트스트림에서 시그널링되는 팔레트 인덱스에 기초하여 런 값을 코딩하기 위한 콘텍스트 (이는 adjusted_palette_index 신택스 엘리먼트에 연관될 수도 있음) 를 결정하도록 구성될 수도 있다.
다른 예에서, 절단된 이진 코드가 인덱스를 코딩함에 있어서 사용된다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 (예컨대, 예를 들어 JCTVC-R0065의 섹션 9.3.3.x에서 설명된 바와 같이) 인덱스 신택스의 첫 번째 'k' 개 비트들에 기초하여 런 콘텍스트들을 선택하도록 구성될 수도 있다. 예를 들어, 절단된 이진 코드를 사용하여, 팔레트 인덱스를 표현하기 위한 신택스 엘리먼트는, (JCTVC-R0065의 섹션 9.3.3.x에서 설명된 바와 같이) 아래에서 설명되는 변수 u에 대한 팔레트 인덱스의 상대 값에 기초하여, k 비트들 또는 k+1 비트들을 사용할 수도 있다:
이 프로세스에의 입력은 값 synVal, cMax를 갖는 신택스 엘리먼트에 대한 TB 이진화를 위한 요청이다. 이 프로세스의 출력은 신택스 엘리먼트의 TB 이진화이다.
2k ≤ n < 2k+1 이 되도록 n = cMax + 1, k = floor (log2 (n)) 이라고 하자 그리고 u = 2k+1 - n이라고 하자.
synVal < u 이면, TB 빈 문자열은 길이 k를 갖는 synVal의 이진 표현에 의해 특정된다.
그렇지 않으면, TB 빈 문자열은 길이 k + 1을 갖는 synVal + u의 이진 표현에 의해 특정된다.
이 예에서, 런 콘텍스트들은 첫 번째 k 개의 디코딩된 비트들에만 의존한다. 그런고로, 예를 들어, 비디오 디코더 (30) 는 콘텍스트들을 결정하기 전에 가능한 k+1 비트를 디코딩하는 것을 기다릴 필요는 없다.
다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스 값, 현재 코딩되고 있는 블록의 팔레트의 사이즈, 및/또는 현재 코딩되고 있는 블록의 사이즈에 기초하여 다수의 콘텍스트들을 사용하도록 구성될 수도 있다. 위에서 설명된 제한된 런 모드가 블록을 코딩하는데 사용된다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스 값, 블록의 사이즈, 및/또는 초과되면 런이 시그널링되지 않는 인덱스 임계치에 기초하여 콘텍스트를 선택하도록 구성될 수도 있다.
전이 런 모드가 또한 사용된다면, 이 기법은 전이 런 모드로도 확장될 수도 있다. 이 경우, 전이 런 모드의 경우, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스 값, 블록의 사이즈, 및/또는 초과되면 런이 시그널링되지 않는 인덱스 임계치에 기초하여 런을 코딩하기 위한 콘텍스트들을 결정하도록 구성될 수도 있다. 이 경우, 콘텍스트들의 별개의 세트들이 값 모드 및 전이 런 모드에 대응하는 런들을 위해 사용될 수도 있다.
본 개시물의 다른 양태들은 하나를 초과하는 팔레트 모드를 사용하여 코딩되는 팔레트 인덱스들의 런들을 코딩하는 것에 관련된다. 예를 들어, JCTVC-Q0094에서 설명되는 상단에서복사 모드에서, 라인으로부터 이스케이프 샘플 또는 이스케이프 플래그로서 코딩되는 샘플을 복사하는 것이 가능하지 않다. 인덱스들의 두 개의 행들의 하나의 예는 아래의 표 2에 도시되어 있다:
표 2 - 예의 인덱스들
상측 라인 1 2 2 4 ESC 5 1
현재 라인 1 2 2 4 ESC 5 2
여기서 숫자 값들은 인덱스들을 나타내고 ESC는 이스케이프 샘플로서 코딩된 샘플을 나타낸다. 이 예에서, 위의 예에서 최좌측 샘플로부터 시작하여, JCTVC-Q0094에 따라, 비디오 인코더 (20) 는 상단에서복사 모드를 시그널링할 수도 있다. 이스케이프 값들 또는 플래그들을 복사하는 것이 허용되지 않으므로, 비디오 인코더 (20) 는 3의 런 값을 또한 시그널링할 수도 있다. 따라서, 이스케이프 샘플로서 코딩된 샘플은 런을 종료시킨다.
표준 제출 문서 『Jianqing Zhu et al., "AHG10: Modified Copy Above Mode for Palette Based Coding," JCTVC-Q0174, Valencia, ES, 27 March - 4 April 2014』 (JCTVC-Q0174) 는 런에서 이스케이프 값들 (예컨대, 실제 화소 값들) 의 복사를 허용하는 것을 설명한다. 그러나, 이 기법은 이스케이프 샘플들에 연관된 값들이 동일할 것을 요구한다.
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스들의 런에서 하나를 초과하는 팔레트 모드를 나타내는 데이터를 코딩하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트에서 연관된 컬러 값들을 갖는 다른 인덱스들과 (명시적 이스케이프 시그널링에서) 이스케이프 플래그들 또는 (암시적 이스케이프 시그널링에서) 이스케이프 인덱스를 복사하도록 구성될 수도 있다. 위의 표 2의 예에 관해, 비디오 인코더 (20) 는 6의 런 값을 나타내는 데이터가 뒤따르는 상단에서복사 모드를 시그널링하도록 구성될 수도 있다. 이 기법은 런들의 사이즈를 증가시키는 장점을 성취할 수도 있는데, 이는 개선된 데이터 압축을 초래할 수도 있다.
본 개시물의 양태들에 따르면, 다른 행의 인덱스들에 관하여 코딩된 인덱스들의 런 동안, 런의 샘플이 이스케이프 샘플로서 코딩된 샘플 바로 상측에 위치된 샘플을 갖는다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 샘플이 이스케이프 샘플로서 코딩된다고 추론하도록 구성될 수도 있다. 이 예에서, 샘플의 실제 값은 런을 뒤따라 시그널링될 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상측-이웃 샘플 (예컨대, 코딩되고 있는 샘플 바로 상측에 위치된 샘플) 이 이스케이프 샘플로서 코딩된다면 샘플에 대해 상단에서복사 모드를 사용하지 않도록 구성될 수도 있다. 이스케이프 샘플들로서 코딩된 샘플들이 (위에서 설명된 바와 같이) 상단에서복사 팔레트 모드에 연관된 런에 포함될 것이 허용되는 사례들에서 이스케이프 모드를 시그널링하는 것에 연관된 일부 리던던시들은 제거될 수도 있다. 제 1 예에서, 본 개시물의 양태들에 따르면, 인덱스들의 런을 뒤따르는 샘플이 이스케이프 샘플로서 코딩되는 상측-이웃 샘플을 갖는다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 다음 샘플을 이스케이프 샘플로서 코딩하지 않도록 구성될 수도 있다. 이 예에서, 샘플은 이스케이프 샘플로서 코딩되지 않을 수도 있는데, 그렇지 않으면 상단에서복사 런에 포함될 것이기 때문이다. 이 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 이스케이프 플래그 또는 이스케이프 인덱스의 코딩을 스킵하도록 구성될 수도 있는데, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 샘플이 이스케이프 샘플로서 코딩되지 않는다는 것을 추론하도록 구성될 수도 있다.
위에서 설명된 예와 동일한 이유들로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상단에서복사 런을 뒤따라 상단에서복사 모드를 사용하여 샘플을 코딩하지 않도록 구성될 수도 있다. 따라서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 모드-관련된 신택스 엘리먼트의 코딩 (예컨대, 상단에서복사 또는 값 모드들 사이를 구별하는 플래그) 을 스킵하도록 구성될 수도 있고, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 샘플이 값 모드에서 코딩된다는 것을 추론하도록 구성될 수도 있다.
제 2 예에서, 상단에서복사 런에 포함된 마지막 샘플이 이스케이프 샘플이고 다음 샘플이 값 모드로 코딩된다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 다음 샘플에 대해 상측-이웃 샘플의 인덱스 값을 체크함으로써 (값 인덱스를 코딩하기 위해 절단된 이진화에서 사용될 수도 있는 최대 가능 인덱스들의 수뿐만 아니라) 값 모드의 인덱스를 조정하도록 구성될 수도 있다. 이 경우, 상측-이웃 화소가 인덱스를 갖는다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스의 값이 상측 인덱스보다 더 크다면 값 인덱스를 1만큼 감소시키도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인덱스를 코딩하기 위해 최대 가능 인덱스들의 수를 1만큼 감소시키도록 구성될 수도 있다. 복원 스테이지에서, 비디오 디코더 (30) 는 인덱스가 상측-이웃 인덱스 이상인지의 여부를 결정하기 위해 디코딩된 인덱스 값을 체크하고, 만약 그렇다면, 디코딩된 값을 1만큼 증가시킬 수도 있다.
도 2는 본 개시물의 기법들을 구현할 수도 있는 하나의 예의 비디오 인코더 (20) 를 도시하는 블록도이다. 도 2는 설명의 목적으로 제공되고 본 개시물에서 폭넓게 예시되고 설명된 바와 같은 기법들의 제한으로서 고려되지 않아야 한다. 설명의 목적으로, 본 개시물은 HEVC 코딩의 맥락에서 비디오 인코더 (20) 를 설명한다. 그러나, 본 개시물의 기법들은 다른 코딩 표준들 또는 방법들에 적용 가능할 수도 있다.
비디오 인코더 (20) 는 본 개시물에서 설명되는 다양한 예들에 따라 팔레트 기반 비디오 코딩을 위한 기법들을 수행하도록 구성될 수도 있는 디바이스의 일 예를 나타낸다. 예를 들어, 비디오 인코더 (20) 는 팔레트 기반 코딩 또는 비-팔레트 기반 코딩 중 어느 하나를 사용하여 비디오 데이터의 다양한 블록들, 이를테면 HEVC 코딩에서의 CU들 또는 PU들을, 선택적으로 코딩하도록 구성될 수도 있다. 비-팔레트 기반 코딩 모드들은 다양한 인터 예측 시간적 코딩 모드들 또는 인트라 예측 공간적 코딩 모드들, 이를테면 HEVC 초안 10에 의해 명시된 다양한 코딩 모드들을 지칭할 수도 있다. 비디오 인코더 (20) 는, 하나의 예에서, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하고, 비디오 데이터의 블록의 적어도 일부 화소 로케이션들의 화소 값들을 표현하기 위해 팔레트에서의 화소 값들을 선택하고, 그리고 비디오 데이터의 블록에서의 화소 로케이션들 중 적어도 일부의 화소 로케이션과 팔레트에서의 선택된 화소 값들에 각각 대응하는 팔레트에서의 엔트리들을 연관시키는 정보를 시그널링하도록 구성될 수도 있다. 시그널링된 정보는 비디오 데이터를 디코딩하기 위해 비디오 디코더 (30) 에 의해 사용될 수도 있다.
도 2의 예에서, 비디오 인코더 (20) 는 예측 프로세싱 부 (100), 비디오 데이터 메모리 (101), 잔차 생성 부 (102), 변환 프로세싱 부 (104), 양자화 부 (106), 역 양자화 부 (108), 역 변환 프로세싱 부 (110), 복원 부 (112), 필터 부 (114), 디코딩된 픽처 버퍼 (116), 및 엔트로피 인코딩 부 (118) 를 포함한다. 예측 프로세싱 부 (100) 는 인터 예측 프로세싱 부 (120) 와 인트라 예측 프로세싱 부 (126) 를 구비한다. 인터 예측 프로세싱 부 (120) 는 모션 추정 부와 모션 보상 부 (미도시) 를 구비한다. 비디오 인코더 (20) 는 또한, 본 개시물에서 설명되는 팔레트 기반 코딩 기법들의 다양한 양태들을 수행하도록 구성되는 팔레트 기반 인코딩 부 (122) 를 구비한다. 다른 예들에서, 비디오 인코더 (20) 는 더 많거나, 더 적거나, 또는 상이한 기능성 컴포넌트들을 포함할 수도 있다.
비디오 데이터 메모리 (101) 는 비디오 인코더 (20) 의 컴포넌트들에 의해 인코딩될 비디오 데이터를 저장할 수도 있다. 비디오 데이터 메모리 (101) 에 저장된 비디오 데이터는, 예를 들어, 비디오 소스 (18) 로부터 획득될 수도 있다. 디코딩된 픽처 버퍼 (116) 가, 예컨대, 인트라 코딩 또는 인터 코딩 모드들에서 비디오 인코더 (20) 에 의해 비디오 데이터를 인코딩함에 있어서의 사용을 위해 참조 비디오 데이터를 저장하는 참조 픽처 메모리일 수도 있다. 비디오 데이터 메모리 (101) 와 디코딩된 픽처 버퍼 (116) 는 동기식 DRAM (SDRAM) 을 포함하는 다이나믹 랜덤 액세스 메모리 (DRAM), 자기저항 RAM (MRAM), 저항 RAM (RRAM), 또는 다른 유형들의 메모리 디바이스들과 같은 다양한 메모리 디바이스들 중 임의의 것에 의해 형성될 수도 있다. 비디오 데이터 메모리 (101) 와 디코딩된 픽처 버퍼 (116) 는 동일한 메모리 디바이스 또는 별개의 메모리 디바이스들에 의해 제공될 수도 있다. 다양한 예들에서, 비디오 데이터 메모리 (101) 는 비디오 인코더 (20) 의 다른 컴포넌트들과 온-칩, 또는 그들 컴포넌트들에 대하여 오프-칩될 수도 있다.
비디오 인코더 (20) 는 비디오 데이터를 수신할 수도 있다. 비디오 인코더 (20) 는 비디오 데이터의 픽처의 슬라이스에서의 각각의 CTU를 인코딩할 수도 있다. CTU들의 각각은 픽처의 동일 사이즈로 된 루마 코딩 트리 블록들 (CTB들) 및 대응하는 CTB들에 연관될 수도 있다. CTU를 인코딩하는 부분으로서, 예측 프로세싱 부 (100) 는 쿼드트리 구획화를 수행하여 CTU의 CTB들을 점차적으로 더 작은 블록들로 분할할 수도 있다. 더 작은 블록은 CU들의 코딩 블록들일 수도 있다. 예를 들어, 예측 프로세싱 부 (100) 는 CTU에 연관된 CTB를 네 개의 동일 사이즈로 된 서브-블록들로 구획화하며, 그 서브-블록들 중 하나 이상을 네 개의 동일 사이즈로 된 서브 서브-블록들로 구획화하는 등등을 수행할 수도 있다.
비디오 인코더 (20) 는 CTU의 CU들을 인코딩하여 CU들의 인코딩된 표현들 (즉, 코딩된 CU들) 을 생성할 수도 있다. CU를 인코딩하는 부분으로서, 예측 프로세싱 부 (100) 는 CU의 하나 이상의 PU들 중에서 CU에 연관된 코딩 블록들을 구획화할 수도 있다. 따라서, 각각의 PU는 루마 예측 블록 및 대응하는 크로마 예측 블록들에 연관될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 다양한 사이즈들을 갖는 PU들을 지원할 수도 있다. 위에서 나타낸 바와 같이, CU의 사이즈는 CU의 루마 코딩 블록의 사이즈를 지칭할 수도 있고 PU의 사이즈는 PU의 루마 예측 블록의 사이즈를 지칭할 수도 있다. 특정 CU의 사이즈가 2Nx2N이라고 가정하면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인트라 예측을 위한 2Nx2N 또는 NxN의 PU 사이즈들과, 인터 예측을 위한 2Nx2N, 2NxN, Nx2N, NxN, 또는 유사한 것의 대칭적 PU 사이즈들을 지원할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 인터 예측을 위해 2NxnU, 2NxnD, nLx2N, 및 nRx2N의 PU 사이즈들에 대한 비대칭 구획화를 또한 지원할 수도 있다.
인터 예측 프로세싱 부 (120) 는 CU의 각각의 PU에 대해 인터 예측을 수행함으로써 PU에 대한 예측 데이터를 생성할 수도 있다. PU에 대한 예측 데이터는 PU의 예측 블록들 및 그 PU에 대한 모션 정보를 포함할 수도 있다. 인터 예측 부 (121) 는 PU가 I 슬라이스, P 슬라이스, 또는 B 슬라이스 중 어느 것에 있는지에 의존하여 CU의 PU에 대해 상이한 동작들을 수행할 수도 있다. I 슬라이스에서, 모든 PU들이 인트라 예측된다. 그런고로, PU가 I 슬라이스에 있으면, 인터 예측 부 (121) 는 PU에 대해 인터 예측을 수행하지 않는다. 따라서, I-모드에서 인코딩된 블록들에 대해, 예측된 블록은 동일한 프레임 내의 이전에 인코딩된 이웃 블록들로부터 공간적 예측을 사용하여 형성된다.
PU가 P 슬라이스에 있다면, 인터 예측 프로세싱 부 (120) 의 모션 추정 부는 PU에 대한 참조 지역을 참조 픽처들의 리스트 (예컨대, "RefPicList0") 에서의 참조 픽처들에서 검색할 수도 있다. PU에 대한 참조 지역은, 참조 픽처 내의, PU의 샘플 블록들에 가장 밀접하게 대응하는 샘플 블록들을 포함하는 지역일 수도 있다. 모션 추정 부는 PU에 대한 참조 지역을 포함하는 참조 픽처의 RefPicList0에서의 포지션을 나타내는 참조 인덱스를 생성할 수도 있다. 덧붙여서, 모션 추정 부는 PU의 코딩 블록 및 참조 지역에 연관된 참조 로케이션 사이의 공간적 변위를 나타내는 MV를 생성할 수도 있다. 예를 들면, MV는 현재 코딩된 픽처에서의 좌표들로부터 참조 픽처에서의 좌표들로의 오프셋을 제공하는 2차원 벡터일 수도 있다. 모션 추정 부는 참조 인덱스 및 MV를 PU의 모션 정보로서 출력할 수도 있다. 인터 예측 프로세싱 부 (120) 의 모션 보상 부는 PU의 모션 벡터에 의해 가리켜진 참조 로케이션에 있는 실제 또는 보간된 샘플들에 기초하여 PU의 예측 블록들을 생성할 수도 있다.
PU가 B 슬라이스에 있다면, 모션 추정 부는 PU에 대해 단-예측 또는 양-예측을 수행할 수도 있다. PU에 대한 단-예측을 수행하기 위해, 모션 추정 부는 PU에 대한 참조 지역을 RefPicList0 또는 제 2 참조 픽처 리스트 ("RefPicList1") 의 참조 픽처들에서 검색할 수도 있다. 모션 추정 부는, PU의 모션 정보로서, 참조 지역을 포함하는 참조 픽처의 RefPicList0 또는 RefPicList1에서의 포지션을 나타내는 참조 인덱스, PU의 예측 블록 및 참조 지역에 연관된 참조 로케이션 사이의 공간적 변위를 나타내는 MV, 및 참조 픽처가 RefPicList0에 있는지 또는 RefPicList1에 있는지를 나타내는 하나 이상의 예측 방향 표시자들을 출력할 수도 있다. 인터 예측 프로세싱 부 (120) 의 모션 보상 부는 PU의 모션 벡터에 의해 가리켜진 참조 지역에 있는 실제 또는 보간된 샘플들에 적어도 부분적으로 기초하여 PU의 예측 블록들을 생성할 수도 있다.
PU에 대한 양방향 인터 예측을 수행하기 위해, 모션 추정 부는 그 PU에 대한 참조 지역을 RefPicList0에서의 참조 픽처들에서 검색할 수도 있고, 또한 그 PU에 대한 다른 참조 지역을 RefPicList1에서의 참조 픽처들에서 검색할 수도 있다. 모션 추정 부는 참조 지역들을 포함하는 참조 픽처들의 RefPicList0 및 RefPicList1에서의 포지션들을 나타내는 참조 픽처 인덱스들을 생성할 수도 있다. 덧붙여서, 모션 추정 부는 참조 지역들에 연관된 참조 로케이션 및 PU의 샘플 블록 사이의 공간적 변위들을 나타내는 MV들을 생성할 수도 있다. PU의 모션 정보는 PU의 MV들 및 참조 인덱스들을 포함할 수도 있다. 모션 보상 부는 PU의 모션 벡터들에 의해 나타내어진 참조 지역들에 있는 실제 또는 보간된 샘플들에 적어도 부분적으로 기초하여 PU의 예측 블록들을 생성할 수도 있다.
본 개시물의 다양한 예들에 따라, 비디오 인코더 (20) 는 팔레트 기반 코딩을 수행하도록 구성될 수도 있다. HEVC 프레임워크에 관해, 일 예로서, 팔레트 기반 코딩 기법들이 코딩 유닛 (CU) 모드로서 사용되도록 구성될 수도 있다. 다른 예들에서, 팔레트 기반 코딩 기법들은 HEVC의 프레임워크에서 PU 모드로서 사용되도록 구성될 수도 있다. 따라서, CU 모드의 콘텍스트에서 (본 개시물 전체에 걸쳐) 본원에서 설명되는 개시된 프로세스들의 모두는 PU에 부가적으로 또는 대안으로 적용될 수도 있다. 그러나, 이들 HEVC 기반 예들은 본원에서 설명되는 팔레트 기반 코딩 기법들의 제약 또는 제한으로서 간주되지 않아야 하는데, 이러한 기법들이 독립적으로 또는 다른 기존의 또는 아직 개발되지 않은 시스템들/표준들의 부분으로서 작동하기 위해 적용될 수도 있기 때문이다. 이들 경우들에서, 팔레트 코딩을 위한 유닛은 정사각형 블록들, 직사각형 블록들 또는 심지어 비-직사각형 형상의 지역들일 수 있다.
예를 들어, 팔레트 기반 인코딩 부 (122) 는, 팔레트 기반 인코딩 모드가, 예컨대, CU 또는 PU에 대해 선택되는 경우, 팔레트 기반 디코딩을 수행할 수도 있다. 예를 들어, 팔레트 기반 인코딩 부 (122) 는, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하고, 비디오 데이터의 블록의 적어도 일부 포지션들의 화소 값들을 표현하기 위해 팔레트에서의 화소 값들을 선택하고, 그리고 비디오 데이터의 블록의 포지션들 중 적어도 일부의 포지션들과 선택된 화소 값들에 각각 대응하는 팔레트에서의 엔트리들을 연관시키는 정보를 시그널링하도록 구성될 수도 있다. 비록 다양한 기능들이 팔레트 기반 인코딩 부 (122) 에 의해 수행되는 것으로서 설명되지만, 이러한 기능들의 일부 또는 전부는 다른 프로세싱 유닛들, 또는 상이한 프로세싱 유닛들의 조합에 의해 수행될 수도 있다.
본 개시물의 양태들에 따르면, 팔레트 기반 인코딩 부 (122) 는 본원에서 설명되는 팔레트 코딩을 위한 기법들의 임의의 조합을 수행하도록 구성될 수도 있다. 예를 들어, 아래의 도 4 내지 도 7을 참조하여 설명되는 바와 같이, 본 개시물의 양태들에 따르면, 팔레트 기반 인코딩 부 (122) 는 다른 라인의 하나 이상의 블록들에 기초하여 비디오 데이터의 블록에 대한 팔레트를 구축하기 위한 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 예를 들어, 본원에서 설명된 바와 같이 팔레트 기반 인코딩 부 (122) 는 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정할 수도 있다. 팔레트 기반 인코딩 부 (122) 는 제 1 행에서의 하나 이상의 다른 블록들을 인코딩하는 경우 예측자 팔레트를 또한 생성할 수도 있다. 제 2 행에서의 블록을 코딩할 시, 팔레트 기반 인코딩 부 (122) 는 제 1 팔레트의 엔트리들에 기초하여 제 2 행에서의 블록의 팔레트를 결정하기 위한 예측자 팔레트를 재초기화할 수도 있다.
다른 예에서, 팔레트 기반 인코딩 부 (122) 는 하나를 초과하는 팔레트 모드를 사용하여 코딩되는 샘플들을 포함하는 인덱스들의 런을 인코딩하도록 구성될 수도 있다. 예를 들어, 팔레트 기반 인코딩 부 (122) 는 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정할 수도 있는데, 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함한다. 팔레트 기반 인코딩 부 (122) 는 또한, 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 또한 코딩할 수도 있는데, 그 런은 팔레트에서의 컬러 값에 연관된 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함한다.
인트라 예측 프로세싱 부 (126) 는 PU에 대해 인트라 예측을 수행함으로써 그 PU에 대한 예측 데이터를 생성할 수도 있다. PU에 대한 예측 데이터는 PU에 대한 예측 블록들과 다양한 신택스 엘리먼트들을 포함할 수도 있다. 인트라 예측 프로세싱 부 (126) 는 I 슬라이스들, P 슬라이스들, 및 B 슬라이스들에서의 PU들에 대해 인트라 예측을 수행할 수도 있다.
PU에 대해 인트라 예측을 수행하기 위해, 인트라 예측 프로세싱 부 (126) 는 PU에 대한 예측 데이터의 다수의 세트들을 생성하기 위해 다수의 인트라 예측 모드들을 사용할 수도 있다. 인트라 예측 프로세싱 부 (126) 는 이웃하는 PU들의 샘플 블록들로부터의 샘플들을 사용하여 PU에 대한 예측 블록을 생성할 수도 있다. PU들, CU들, 및 CTU들에 대한 좌측에서 우측으로, 상단에서 하단으로의 인코딩 순서를 가정하면, 이웃하는 PU들은 PU의 상측, 우상측, 좌상측, 또는 좌측에 있을 수도 있다. 인트라 예측 프로세싱 부 (126) 는 다양한 수들의 인트라 예측 모드들, 예컨대, 33 개의 방향성 인트라 예측 모드들을 사용할 수도 있다. 일부 예들에서, 인트라 예측 모드들의 수는 PU에 연관된 지역의 사이즈에 의존할 수도 있다.
예측 프로세싱 부 (100) 는 CU의 PU들에 대한 예측 데이터를, 그 PU들에 대해 인터 예측 프로세싱 부 (120) 에 의해 생성된 예측 데이터 또는 그 PU들에 대해 인트라 예측 프로세싱 부 (126) 에 의해 생성된 예측 데이터 중에서 선택할 수도 있다. 일부 예들에서, 예측 프로세싱 부 (100) 는 예측 데이터의 세트들의 레이트/왜곡 메트릭들에 기초하여 CU의 PU들에 대한 예측 데이터를 선택한다. 선택된 예측 데이터의 예측 블록들은 본원에서는 선택된 예측 블록들이라고 지칭될 수도 있다.
잔차 생성 부 (102) 는, CU의 루마, Cb 및 Cr 코딩 블록과 CU의 PU들의 선택된 예측 루마, Cb 및 Cr 블록들에 기초하여, CU의 루마, Cb 및 Cr 잔차 블록들을 생성할 수도 있다. 예를 들면, 잔차 생성 부 (102) 는 CU의 잔차 블록들에서의 각각의 샘플이 그 CU의 코딩 블록에서의 샘플 및 그 CU의 PU의 대응하는 선택된 예측 블록에서의 대응하는 샘플 사이의 차이와 동일한 값을 가지도록 CU의 잔차 블록들을 생성할 수도 있다.
변환 프로세싱 부 (104) 는 쿼드트리 구획화를 수행하여 CU에 연관된 잔차 블록들을 그 CU의 TU들에 연관된 변환 블록들로 구획화할 수도 있다. 따라서, TU가 루마 변환 블록 및 두 개의 크로마 변환 블록들에 연관될 수도 있다. CU의 TU들의 루마 및 크로마 변환 블록들의 사이즈들 및 포지션들은 그 CU의 PU들의 예측 블록들의 사이즈들 및 포지션들에 기초할 수도 있거나 또는 기초하지 않을 수도 있다. "잔차 쿼드-트리 (residual quad-tree)" (RQT) 로서 알려진 쿼드트리 구조가 지역들의 각각에 연관된 노드들을 포함할 수도 있다. CU의 TU들은 RQT의 리프 노드들에 대응할 수도 있다.
변환 프로세싱 부 (104) 는 CU의 각각의 TU에 대한 변환 계수 블록들을, 하나 이상의 변환들을 그 TU의 변환 블록들에 적용함으로써 생성할 수도 있다. 변환 프로세싱 부 (104) 는 다양한 변환들을 TU에 연관된 변환 블록에 적용할 수도 있다. 예를 들어, 변환 프로세싱 부 (104) 는 이산 코사인 변환 (discrete cosine transform, DCT), 방향성 변환, 또는 개념적으로 유사한 변환을 변환 블록에 적용할 수도 있다. 일부 예들에서, 변환 프로세싱 부 (104) 는 변환들을 변환 블록에 적용하지 않는다. 그런 예들에서, 변환 블록은 변환 계수 블록으로서 다루어질 수도 있다.
양자화 부 (106) 는 계수 블록에서의 변환 계수들을 양자화할 수도 있다. 양자화 프로세스는 변환 계수들의 일부 또는 전부에 연관된 비트 깊이를 감소시킬 수도 있다. 예를 들어, n-비트 변환 계수가 양자화 동안에 m-비트 변환 계수로 절사될 (rounded down) 수도 있으며, 여기서 nm보다 크다. 양자화 부 (106) 는 CU에 연관된 양자화 파라미터 (quantization parameter, QP) 값에 기초하여 그 CU의 TU에 연관된 계수 블록을 양자화할 수도 있다. 비디오 인코더 (20) 는 CU에 연관된 QP 값을 조정함으로써 그 CU에 연관된 계수 블록들에 적용되는 양자화 정도를 조정할 수도 있다. 양자화는 정보의 손실을 도입할 수도 있고, 따라서 양자화된 변환 계수들은 원래의 것들보다 더 낮은 정밀도를 가질 수도 있다.
역 양자화 부 (108) 와 역 변환 프로세싱 부 (110) 는 계수 블록으로부터 잔차 블록을 복원하기 위해 역 양자화 및 역 변환들을 계수 블록에 각각 적용할 수도 있다. 복원 부 (112) 는 TU에 연관된 복원된 변환 블록을 생성하기 위해 복원된 잔차 블록을 예측 프로세싱 부 (100) 에 의해 생성된 하나 이상의 예측 블록들로부터의 대응하는 샘플들에 가산할 수도 있다. CU의 각각의 TU에 대한 변환 블록들을 이런 식으로 복원함으로써, 비디오 인코더 (20) 는 CU의 코딩 블록들을 복원할 수도 있다.
필터 부 (114) 는 하나 이상의 블록화제거 (deblocking) 동작들을 수행하여 CU에 연관된 코딩 블록들에서의 블록화 아티팩트들을 감소시킬 수도 있다. 디코딩된 픽처 버퍼 (116) 는, 필터 부 (114) 가 복원된 코딩 블록들에 대해 하나 이상의 블록화제거 동작들을 수행한 후에 복원된 코딩 블록들을 저장할 수도 있다. 인터 예측 프로세싱 부 (120) 는 다른 픽처들의 PU들에 대해 인터 예측을 수행하기 위해 복원된 코딩 블록들을 포함하는 참조 픽처를 사용할 수도 있다. 덧붙여서, 인트라 예측 프로세싱 부 (126) 는 CU와 동일한 픽처에서의 다른 PU들에 대해 인트라 예측을 수행하기 위해 디코딩된 픽처 버퍼 (116) 에서의 복원된 코딩 블록들을 사용할 수도 있다.
엔트로피 인코딩 부 (118) 는 비디오 인코더 (20) 의 다른 기능성 컴포넌트들로부터 데이터를 수신할 수도 있다. 예를 들어, 엔트로피 인코딩 부 (118) 는 양자화 부 (106) 로부터 계수 블록들을 수신할 수도 있고 예측 프로세싱 부 (100) 로부터 신택스 엘리먼트들을 수신할 수도 있다. 엔트로피 인코딩 부 (118) 는 그 데이터에 대해 하나 이상의 엔트로피 인코딩 동작들을 수행하여 엔트로피 인코딩된 데이터를 생성할 수도 있다. 예를 들어, 엔트로피 인코딩 부 (118) 는 그 데이터에 대해 콘텍스트 적응 가변 길이 코딩 (CAVLC) 동작, CABAC 동작, 가변 대 가변 (variable-to-variable, V2V) 길이 코딩 동작, 신택스 기반 콘텍스트 적응 이진 산술 코딩 (syntax-based context-adaptive binary arithmetic coding, SBAC) 동작, 확률 간격 구획화 엔트로피 (Probability Interval Partitioning Entropy, PIPE) 코딩 동작, 지수-골롬 (Exponential-Golomb) 인코딩 동작, 또는 다른 유형의 엔트로피 인코딩 동작을 수행할 수도 있다.
CABAC를 수행하기 위해, 엔트로피 인코딩 부 (118) 는 특정한 콘텍스트에 적응하는 콘텍스트 모델을 선택함으로써 송신될 심볼들을 인코딩할 수도 있다. 본 개시물의 양태들에 따르면, 엔트로피 인코딩 부 (118) 는 코딩되고 있는 런 값의 인덱스 값에 기초하여 콘텍스트를 사용하도록 구성될 수도 있다. 예를 들어, 엔트로피 인코딩 부 (118) 는 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정하도록 구성될 수도 있다. 엔트로피 인코딩 부 (118) 는 팔레트 인덱스 값에 기초하여 런 값을 표현하는 데이터를 콘텍스트 적응 코딩하기 위한 콘텍스트를 결정하도록 구성될 수도 있다.
비디오 인코더 (20) 는 엔트로피 인코딩 부 (118) 에 의해 생성된 엔트로피-인코딩된 데이터를 포함하는 비트스트림을 출력할 수도 있다. 예를 들면, 그 비트스트림은 CU에 대한 RQT를 표현하는 데이터를 포함할 수도 있다.
도 3은 본 개시물의 기법들을 구현하도록 구성되는 일 예의 비디오 디코더 (30) 를 도시하는 블록도이다. 도 3은 설명의 목적으로 제공되고 본 개시물에서 폭넓게 예시되고 설명된 바와 같은 기법들로 제한하고 있지는 않다. 설명의 목적으로, 본 개시물은 HEVC 코딩의 맥락에서 비디오 디코더 (30) 를 설명한다. 그러나, 본 개시물의 기법들은 다른 코딩 표준들 또는 방법들에 적용 가능할 수도 있다.
비디오 인코더 (30) 는 본 개시물에서 설명되는 다양한 예들에 따라 팔레트 기반 비디오 코딩을 위한 기법들을 수행하도록 구성될 수도 있는 디바이스의 일 예를 나타낸다. 예를 들어, 비디오 인코더 (30) 는 팔레트 기반 코딩 또는 비-팔레트 기반 코딩 중 어느 하나를 사용하여 비디오 데이터의 다양한 블록들, 이를테면 HEVC 코딩에서의 CU들 또는 PU들을, 선택적으로 디코딩하도록 구성될 수도 있다. 비-팔레트 기반 코딩 모드들은 다양한 인터 예측 시간적 코딩 모드들 또는 인트라 예측 공간적 코딩 모드들, 이를테면 HEVC 초안 10에 의해 특정된 다양한 코딩 모드들을 지칭할 수도 있다. 비디오 디코더 (30) 는, 하나의 예에서, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하고, 비디오 데이터의 블록의 적어도 일부 화소 로케이션들과 팔레트에서의 엔트리들을 연관시키는 정보를 수신하고, 그 정보에 기초하여 팔레트에서의 화소 값들을 선택하고, 그리고 팔레트에서의 선택된 화소 값들에 기초하여 블록의 화소 값들을 복원하도록 구성될 수도 있다.
도 3의 예에서, 비디오 디코더 (30) 는 엔트로피 디코딩 부 (150), 비디오 데이터 메모리 (151), 예측 프로세싱 부 (152), 역 양자화 부 (154), 역 변환 프로세싱 부 (156), 복원 부 (158), 필터 부 (160), 및 디코딩된 픽처 버퍼 (162) 를 구비한다. 예측 프로세싱 부 (152) 는 모션 보상 부 (164) 와 인트라 예측 프로세싱 부 (166) 를 구비한다. 비디오 디코더 (30) 는 또한, 본 개시물에서 설명되는 팔레트 기반 코딩 기법들의 다양한 양태들을 수행하도록 구성되는 팔레트 기반 디코딩 부 (165) 를 구비한다. 다른 예들에서, 비디오 디코더 (30) 는 더 많거나, 더 적거나, 또는 상이한 기능성 컴포넌트들을 포함할 수도 있다.
비디오 데이터 메모리 (151) 는, 비디오 디코더 (30) 의 컴포넌트들에 의해 디코딩될 인코딩된 비디오 비트스트림과 같은 비디오 데이터를 저장할 수도 있다. 비디오 데이터 메모리 (151) 에 저장된 비디오 데이터는, 예를 들어, 컴퓨터 판독가능 매체 (16) 로부터, 예컨대, 카메라와 같은 로컬 비디오 소스로부터, 비디오 데이터의 유선 또는 무선 네트워크 통신을 통해, 또는 물리적 데이터 저장 매체들에 액세스함으로써 획득될 수도 있다. 비디오 데이터 메모리 (151) 는 인코딩된 비디오 비트스트림으로부터의 인코딩된 비디오 데이터를 저장하는 코딩된 픽처 버퍼 (CPB) 를 형성할 수도 있다. 디코딩된 픽처 버퍼 (162) 가, 예컨대, 인트라 코딩 또는 인터 코딩 모드들에서 비디오 디코더 (30) 에 의해 비디오 데이터를 디코딩함에 있어서의 사용을 위해 참조 비디오 데이터를 저장하는 참조 픽처 메모리일 수도 있다. 비디오 데이터 메모리 (151) 와 디코딩된 픽처 버퍼 (162) 는 동기식 DRAM (SDRAM) 을 포함한 다이나믹 랜덤 액세스 메모리 (DRAM), 자기저항 RAM (MRAM), 저항 RAM (RRAM), 또는 다른 유형들의 메모리 디바이스들과 같은 다양한 메모리 디바이스들 중 임의의 것에 의해 형성될 수도 있다. 비디오 데이터 메모리 (151) 와 디코딩된 픽처 버퍼 (162) 는 동일한 메모리 디바이스 또는 별개의 메모리 디바이스들에 의해 제공될 수도 있다. 다양한 예들에서, 비디오 데이터 메모리 (151) 는 비디오 디코더 (30) 의 다른 컴포넌트들과 온-칩, 또는 그들 컴포넌트들에 대하여 오프-칩될 수도 있다.
코딩된 픽처 버퍼 (coded picture buffer, CPB) 가 비트스트림의 인코딩된 비디오 데이터 (예컨대, NAL 유닛들) 를 수신 및 저장할 수도 있다. 엔트로피 디코딩 부 (150) 는 CPB로부터 인코딩된 비디오 데이터 (예컨대, NAL 유닛들) 를 수신하고 신택스 엘리먼트들을 디코딩하기 위해 그 NAL 유닛들을 파싱할 수도 있다. 엔트로피 디코딩 부 (150) 는 NAL 유닛들에서의 엔트로피 인코딩된 신택스 엘리먼트들을 엔트로피 디코딩할 수도 있다.
본 개시물의 양태들에 따르면, 엔트로피 디코딩 부 (150) 는 코딩되고 있는 런 값의 인덱스 값에 기초하여 콘텍스트를 사용하도록 구성될 수도 있다. 예를 들어, 엔트로피 디코딩 부 (150) 는 비디오 데이터의 블록의 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정하도록 구성될 수도 있다. 엔트로피 디코딩 부 (150) 는 팔레트 인덱스 값에 기초하여 런 값을 표현하는 데이터를 콘텍스트 적응 코딩하기 위한 콘텍스트를 결정하도록 구성될 수도 있다.
예측 프로세싱 부 (152), 역 양자화 부 (154), 역 변환 프로세싱 부 (156), 복원 부 (158), 및 필터 부 (160) 는 비트스트림으로부터 추출된 신택스 엘리먼트들에 기초하여 디코딩된 비디오 데이터를 생성할 수도 있다.
비트스트림의 NAL 유닛들은 코딩된 슬라이스 NAL 유닛들을 포함할 수도 있다. 비트스트림을 디코딩하는 부분으로서, 엔트로피 디코딩 부 (150) 는 코딩된 슬라이스 NAL 유닛들로부터 신택스 엘리먼트들을 추출하고 엔트로피 디코딩할 수도 있다. 코딩된 슬라이스들의 각각은 슬라이스 헤더 및 슬라이스 데이터를 포함할 수도 있다. 슬라이스 헤더는 슬라이스에 관계된 신택스 엘리먼트들을 포함할 수도 있다. 슬라이스 헤더에서의 신택스 엘리먼트들은 슬라이스를 포함하는 픽처에 연관된 PPS를 식별하는 신택스 엘리먼트를 포함할 수도 있다.
비트스트림으로부터 신택스 엘리먼트들을 디코딩하는 것에 더하여, 비디오 디코더 (30) 는 비구획화된 CU에 대해 복원 동작을 수행할 수도 있다. 비구획화된 CU에 대해 복원 동작을 수행하기 위해, 비디오 디코더 (30) 는 CU의 각각의 TU에 대해 복원 동작을 수행할 수도 있다. CU의 각각의 TU에 대한 복원 동작을 수행함으로써, 비디오 디코더 (30) 는 CU의 잔차 블록들을 복원할 수도 있다.
CU의 TU에 대해 복원 동작을 수행하는 부분으로서, 역 양자화 부 (154) 는 TU에 연관된 계수 블록들을 역 양자화, 즉, 탈양자화 (de-quantization) 할 수도 있다. 역 양자화 부 (154) 는 TU의 CU에 연관된 QP 값을 사용하여 양자화 정도와, 비슷하게, 역 양자화 부 (154) 에 대해 적용할 역 양자화 정도를 결정할 수도 있다. 다시 말하면, 압축 비율, 즉, 원래의 시퀀스 및 압축된 시퀀스를 표현하는데 사용된 비트들의 수의 비율은, 변환 계수들을 양자화하는 경우에 사용된 QP의 값을 조정함으로써 제어될 수도 있다. 압축 비율은 채용된 엔트로피 코딩하는 방법에 또한 의존할 수도 있다.
역 양자화 부 (154) 가 계수 블록을 역 양자화한 후, 역 변환 프로세싱 부 (156) 는 TU에 연관된 잔차 블록을 생성하기 위하여 하나 이상의 역 변환들을 계수 블록에 적용할 수도 있다. 예를 들어, 역 변환 프로세싱 부 (156) 는 역 DCT, 역 정수 변환, 역 카루넨-뢰베 변환 (Karhunen-Loeve transform, KLT), 역 회전 변환, 역 방향성 변환, 또는 다른 역 변환을 계수 블록에 적용할 수도 있다.
PU가 인트라 예측을 사용하여 인코딩되면, 인트라 예측 프로세싱 부 (166) 는 PU에 대한 예측 블록들을 생성하기 위해 인트라 예측을 수행할 수도 있다. 인트라 예측 프로세싱 부 (166) 는 인트라 예측 모드를 사용하여 공간적으로 이웃하는 PU들의 예측 블록들에 기초하여 PU에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다. 인트라 예측 프로세싱 부 (166) 는 비트스트림으로부터 디코딩된 하나 이상의 신택스 엘리먼트들에 기초하여 PU에 대한 인트라 예측 모드를 결정할 수도 있다.
예측 프로세싱 부 (152) 는 비트스트림으로부터 추출된 신택스 엘리먼트들에 기초하여 제 1 참조 픽처 리스트 (RefPicList0) 및 제 2 참조 픽처 리스트 (RefPicList1) 를 구축할 수도 있다. 더욱이, PU가 인터 예측을 사용하여 인코딩되면, 엔트로피 디코딩 부 (150) 는 그 PU에 대한 모션 정보를 추출할 수도 있다. 모션 보상 부 (164) 는, PU의 모션 정보에 기초하여, PU에 대한 하나 이상의 참조 지역들을 결정할 수도 있다. 모션 보상 부 (164) 는, PU에 대한 하나 이상의 참조 블록들에서의 샘플 블록들에 기초하여, PU에 대한 예측 루마, Cb 및 Cr 블록들을 생성할 수도 있다.
복원 부 (158) 는, 적용가능한 경우, CU의 TU들에 연관된 루마, Cb 및 Cr 변환 블록들과 그 CU의 PU들의 예측 루마, Cb 및 Cr 블록들, 즉 인트라 예측 데이터 또는 인터 예측 데이터 중 어느 하나를 사용하여 그 CU의 루마, Cb 및 Cr 코딩 블록들을 복원할 수도 있다. 예를 들어, 복원 부 (158) 는 루마, Cb 및 Cr 변환 블록들의 샘플들을 예측 루마, Cb 및 Cr 블록들의 대응하는 샘플들에 가산하여 CU의 루마, Cb 및 Cr 코딩 블록들을 복원할 수도 있다.
필터 부 (160) 는 블록화제거 동작을 수행하여 CU의 루마, Cb 및 Cr 코딩 블록들에 연관된 블록화 아티팩트들을 감소시킬 수도 있다. 비디오 디코더 (30) 는 CU의 루마, Cb 및 Cr 코딩 블록들을 디코딩된 픽처 버퍼 (162) 에 저장할 수도 있다. 디코딩된 픽처 버퍼 (162) 는 후속하는 모션 보상, 인트라 예측, 및 디스플레이 디바이스, 이를테면 도 1의 디스플레이 디바이스 (32) 상의 프레젠테이션을 위해 참조 픽처들을 제공할 수도 있다. 예를 들면, 비디오 디코더 (30) 는, 디코딩된 픽처 버퍼 (162) 에서의 루마, Cb 및 Cr 블록들에 기초하여, 다른 CU들의 PU들에 대해 인트라 예측 또는 인터 예측 동작들을 수행할 수도 있다.
위에서 언급했듯이, 비디오 디코더 (30) 는 팔레트 기반 코딩을 수행하도록 구성될 수도 있다. 예를 들어, 팔레트 기반 디코딩 부 (165) 는, 팔레트 기반 디코딩 모드가, 예컨대, CU 또는 PU에 대해 선택되는 경우, 팔레트 기반 디코딩을 수행할 수도 있다. 예를 들어, 팔레트 기반 디코딩 부 (165) 는, 화소 값들을 나타내는 엔트리들을 갖는 팔레트를 생성하고, 비디오 데이터의 블록에서의 적어도 일부 화소 로케이션들과 팔레트에서의 엔트리들을 연관시키는 정보를 수신하고, 그 정보에 기초하여 팔레트에서의 화소 값들을 선택하고, 그리고 팔레트에서의 선택된 화소 값들에 기초하여 블록의 화소 값들을 복원하도록 구성될 수도 있다. 비록 다양한 기능들이 팔레트 기반 디코딩 부 (165) 에 의해 수행되는 것으로서 설명되지만, 이러한 기능들의 일부 또는 전부는 다른 프로세싱 유닛들, 또는 상이한 프로세싱 유닛들의 조합에 의해 수행될 수도 있다.
팔레트 기반 디코딩 부 (165) 는 팔레트 코딩 모드 정보를 수신하고, 팔레트 코딩 모드가 블록에 적용됨을 팔레트 코딩 모드 정보가 나타내는 경우 위의 동작들을 수행할 수도 있다. 팔레트 코딩 모드가 블록에 적용되지 않음을 팔레트 코딩 모드 정보가 나타내는 경우, 또는 다른 모드 정보가 상이한 모드의 사용을 나타내는 경우, 팔레트 기반 디코딩 부 (165) 는 비-팔레트 기반 코딩 모드, 예컨대, 이러한 HEVC 인터 예측 또는 인트라 예측 코딩 모드를 사용하여 비디오 데이터의 블록을 디코딩한다. 비디오 데이터의 블록은, 예를 들어, HEVC 코딩 프로세스에 따라 생성된 CU 또는 PU일 수도 있다.
본 개시물의 양태들에 따르면, 팔레트 기반 디코딩 부 (165) 는 본원에서 설명되는 팔레트 코딩을 위한 기법들의 임의의 조합을 수행하도록 구성될 수도 있다. 예를 들어, 아래의 도 4 내지 도 7을 참조하여 설명되는 바와 같이, 본 개시물의 양태들에 따르면, 팔레트 기반 디코딩 부 (165) 는 다른 라인의 하나 이상의 블록들에 기초하여 비디오 데이터의 블록에 대한 팔레트를 구축하기 위한 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 예를 들어, 본원에서 설명된 바와 같이 팔레트 기반 디코딩 부 (165) 는 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정할 수도 있다. 팔레트 기반 디코딩 부 (165) 는 제 1 행에서의 하나 이상의 다른 블록들을 디코딩하는 경우 예측자 팔레트를 또한 생성할 수도 있다. 제 2 행에서의 블록을 코딩할 시, 팔레트 기반 디코딩 부 (165) 는 제 1 팔레트의 엔트리들에 기초하여 제 2 행에서의 블록의 팔레트를 결정하기 위한 예측자 팔레트를 재초기화할 수도 있다.
다른 예에서, 아래에서 도 8에 관해 설명되는 바와 같이, 팔레트 기반 디코딩 부 (165) 는 하나를 초과하는 팔레트 모드를 사용하여 코딩되는 샘플들을 포함하는 인덱스들의 런을 디코딩하도록 구성될 수도 있다. 예를 들어, 팔레트 기반 디코딩 부 (165) 는 비디오 데이터의 블록의 제 1 행의 팔레트 인덱스들을 결정할 수도 있는데, 팔레트 인덱스들은 팔레트에서의 컬러 값에 연관되는 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함한다. 팔레트 기반 디코딩 부 (165) 는 제 1 행의 팔레트 인덱스들에 관하여 비디오 데이터의 블록의 제 2 행의 팔레트 인덱스들의 런을 또한 디코딩할 수도 있는데, 그 런은 팔레트에서의 컬러 값에 연관된 하나 이상의 인덱스들과 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트를 포함한다.
도 4는 본 개시물의 기법들에 부합하는, 비디오 데이터를 코딩하기 위한 팔레트를 결정하는 일 예를 도시하는 개념도이다. 도 4의 예는 제 1 팔레트들 (184) 에 연관되는 제 1 코딩 유닛 (CU) (180) 과 제 2 팔레트들 (192) 에 연관되는 제 2 CU (188) 를 갖는 픽처 (178) 를 포함한다. 아래에서 더욱 상세히 그리고 본 개시물의 기법들에 따라 설명되는 바와 같이, 제 2 팔레트들 (192) 은 제 1 팔레트들 (184) 에 기초한다. 픽처 (178) 는 인트라 예측 코딩 모드로 코딩된 블록 (196) 과 인터 예측 코딩 모드로 코딩되어 있는 블록 (200) 을 또한 포함한다.
도 4의 기법들은 설명의 목적으로 비디오 인코더 (20) (도 1 및 도 2) 와 비디오 디코더 (30) (도 1 및 도 3) 의 맥락에서 그리고 HEVC 비디오 코딩 표준에 관해 설명된다. 그러나, 본 개시물의 기법들은 이런 식으로 제한되지 않고, 다른 비디오 코딩 프로세스들 및/또는 표준들에서 다른 비디오 코딩 프로세서들 및/또는 디바이스들에 의해 적용될 수도 있다는 것이 이해되어야 한다.
대체로, 팔레트가 현재 코딩되고 있는 CU, 즉 도 4의 예에서의 CU (188) 에 대해 우세하거나 및/또는 대표하는 다수의 화소 값들을 나타낸다. 제 1 팔레트들 (184) 과 제 2 팔레트들 (192) 은 다수의 팔레트들을 포함하는 것으로서 도시되어 있다. 일부 예들에서, 본 개시물의 양태들에 따르면, 비디오 코더 (이를테면 비디오 인코더 (20) 또는 비디오 디코더 (30)) 가 CU의 각각의 컬러 성분에 대해 팔레트들을 따로따로 코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 CU의 루마 (Y) 성분에 대한 팔레트, CU의 크로마 (U) 성분에 대한 다른 팔레트, 및 CU의 크로마 (V) 성분에 대한 또 다른 팔레트를 인코딩할 수도 있다. 이 예에서, Y 팔레트의 엔트리들은 CU의 화소들의 Y 값들을 표현할 수도 있으며, U 팔레트의 엔트리들은 CU의 화소들의 U 값들을 표현할 수도 있고, V 팔레트의 엔트리들은 CU의 화소들의 V 값들을 표현할 수도 있다.
다른 예들에서, 비디오 인코더 (20) 는 CU의 모든 컬러 성분들에 대해 단일 팔레트를 인코딩할 수도 있다. 이 예에서, 비디오 인코더 (20) 는 Yi, Ui, 및 Vi를 포함하는 3중 값인 i번째 엔트리를 갖는 팔레트를 인코딩할 수도 있다. 이 경우, 팔레트는 화소들의 성분들의 각각에 대한 값들을 포함한다. 따라서, 다수의 개개의 팔레트들을 갖는 팔레트들의 세트로서의 팔레트들 (184 및 192) 의 표현은 단지 하나의 예이고 제한하려는 의도는 아니다.
도 4의 예에서, 제 1 팔레트들 (184) 은 엔트리 인덱스 값 1, 엔트리 인덱스 값 2, 및 엔트리 인덱스 값 3을 각각 갖는 세 개의 엔트리들 (202~206) 을 포함한다. 엔트리들 (202~206) 은 인덱스 값들을 화소 값 A, 화소 값 B, 및 화소 값 C를 각각 포함하는 화소 값들에 관련시킨다. 본원에서 설명된 바와 같이, 제 1 CU (180) 의 실제 화소 값들을 코딩하는 것이 아니라, 비디오 코더 (이를테면 비디오 인코더 (20) 또는 비디오 디코더 (30)) 가 인덱스들 (1~3) 을 사용하여 블록의 화소들을 코딩하기 위해 팔레트 기반 코딩을 사용할 수도 있다. 다시 말하면, 제 1 CU (180) 의 각각의 화소 포지션에 대해, 비디오 인코더 (20) 는 화소에 대한 인덱스 값을 인코딩할 수도 있으며, 여기서 인덱스 값은 제 1 팔레트들 (184) 중 하나 이상의 제 1 팔레트들에서의 화소 값에 연관된다. 비디오 디코더 (30) 는 비트스트림으로부터 인덱스 값들을 획득하고 그 인덱스 값들 및 하나 이상의 제 1 팔레트들 (184) 을 사용하여 화소 값들을 복원할 수도 있다. 따라서, 제 1 팔레트들 (184) 은 팔레트 기반 디코딩에서 비디오 디코더 (30) 에 의한 사용을 위해 인코딩된 비디오 데이터 비트스트림에서 비디오 인코더 (20) 에 의해 송신된다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 제 1 팔레트들 (184) 에 기초하여 제 2 팔레트들 (192) 을 결정할 수도 있다. 예를 들어, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 예측 팔레트들, 이 예에서는 제 1 팔레트들 (184) 이 결정되는 하나 이상의 블록들의 위치를 찾아낼 수도 있다. 예측을 목적으로 사용되고 있는 엔트리들의 조합은 예측자 팔레트라고 지칭될 수도 있다.
도 4의 예에서, 제 2 팔레트들 (192) 은 엔트리 인덱스 값 1, 엔트리 인덱스 값 2, 및 엔트리 인덱스 값 3을 각각 갖는 세 개의 엔트리들 (208~212) 을 포함한다. 엔트리들 (208~212) 은 인덱스 값들을 화소 값 A, 화소 값 B, 및 화소 값 D를 각각 포함하는 화소 값들에 관련시킨다. 이 예에서, 비디오 인코더 (20) 는 제 1 팔레트들 (184) 중 어떤 엔트리들 (예측자 팔레트를 표현하지만, 예측자 팔레트는 다수의 블록들의 엔트리들을 포함할 수도 있음) 이 제 2 팔레트들 (192) 에 포함되는지를 나타내는 하나 이상의 신택스 엘리먼트들을 코딩할 수도 있다.
도 4의 예에서, 하나 이상의 신택스 엘리먼트들은 벡터 (216) 로서 예시된다. 벡터 (216) 는 다수의 연관된 빈들 (또는 비트들) 을 가지며; 각각의 빈은 그 빈에 연관된 예측자 팔레트가 현재 팔레트의 엔트리를 예측하기 위해 사용되는지의 여부를 나타낸다. 예를 들어, 벡터 (216) 는 제 1 팔레트들 (184) 의 처음 두 개의 엔트리들 (202 및 204) 이 제 2 팔레트들 (192) 에 포함되는 반면 (벡터 (216) 에서의 "1"의 값), 제 1 팔레트들 (184) 의 제 3 엔트리는 제 2 팔레트들 (192) 에 포함되지 않는다 (벡터 (216) 에서의 "0" 의 값) 는 것을 나타낸다. 도 4의 예에서, 벡터는 부울 벡터 (Boolean vector) 이다. 그 벡터는 팔레트 예측 벡터라고 지칭될 수도 있다.
일부 예들에서, 위에서 언급했듯이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 예측을 수행하는 경우 예측자 팔레트 (이는 예측자 팔레트 테이블 또는 예측자 팔레트 리스트라고 또한 지칭될 수도 있음) 를 결정할 수도 있다. 팔레트 예측자는 현재 블록을 코딩하기 위한 팔레트의 하나 이상의 엔트리들을 예측하는데 사용되는 하나 이상의 이웃 블록들의 팔레트들로부터의 엔트리들을 포함할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 그 리스트를 동일한 방식으로 구축할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트의 어떤 엔트리들이 현재 블록을 코딩하기 위한 팔레트에 복사될 것인지를 나타내기 위해 데이터 (이를테면 벡터 (216)) 를 코딩할 수도 있다.
본 개시물의 양태들에 따르면, 예측자 팔레트 (이를테면 벡터 (216) 에 연관된 예측자 팔레트) 가 비디오 데이터의 픽처 및/또는 타일에서의 특정한 블록들에 연관된 팔레트를 생성하기 위해 재초기화될 수도 있다. 예를 들어, 아래의 도 5 내지 도 7의 예들에 관해 더 상세히 설명되는 바와 같이, 제 1 라인에서의 비디오 데이터의 블록에 대한 팔레트를 구축하기 위한 예측자 팔레트가 다른 라인의 하나 이상의 블록들에 기초하여 재초기화될 수도 있다. 하나의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 제 1 행에서의 하나 이상의 다른 블록들을 코딩하는 경우 예측자 팔레트를 또한 생성할 수도 있다. 제 2 행에서의 블록을 코딩할 시, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 제 1 팔레트의 엔트리들에 기초하여 제 2 행에서의 블록의 팔레트를 결정하기 위해 예측자 팔레트를 재초기화할 수도 있다.
도 5는 고 효율 비디오 코딩 (HEVC) 표준에 따라 예의 타일들을 도시하는 개념도이다. HEVC는 타일들 및 파면 병렬 프로세싱 (WPP) 을 포함하여 코덱을 더욱 병렬 친화적이게 하는 여러 제안들을 포함한다. HEVC WD10은, 타일을, 그 타일의 CTB 래스터 스캔에서 연속하여 순서화되는, 하나의 열 및 하나의 행에서 함께 발생하는 정수 개의 CTB들로서 정의한다. 각각의 픽처의 타일들로의 분할은 구획화로서 지칭될 수도 있다. 픽처에서의 타일들은 도 5에 도시된 바와 같이 그 픽처의 타일 래스터 스캔에서 연속적으로 순서화된다.
예를 들어, 도 5는 타일 경계들이 두꺼운 선들로 표시되는 다수의 타일들 (222A, 222B, 222C, 222D, 222E, 222F, 222G, 222H, 및 222I) (총칭하여, "타일들 (222)") 로 구획화되는 픽처 (220) 에 대한 일 예의 CTB 코딩 순서를 예시한다. 픽처 (220) 에서의 각각의 정사각형 블록은 CTB에 연관된 화소 블록을 나타낸다. 화소 블록들에서의 숫자들은 픽처 (220) 에 대한 타일 코딩 순서에서의 대응하는 CTB들 (예컨대, LCU들) 의 포지션들을 나타낸다.
도 5의 예에서 도시된 바와 같이, 타일 (222A) 에서의 CTB들이 먼저 코딩된 다음, 뒤이어 타일 (222B) 에서의 CTB들, 뒤이어 타일 (222C) 에서의 CTB들, 뒤이어 타일 (222D) 에서의 CTB들, 뒤이어 타일 (222E) 에서의 CTB들, 뒤이어 타일 (222F) 에서의 CTB들, 뒤이어 타일 (222G) 에서의 CTB들, 뒤이어 타일 (222H) 에서의 CTB들, 뒤이어 타일 (222I) 에서의 CTB들이 코딩된다. 타일들 (222) 을 프로세싱하는 순서는 타일들 (222) 에 포함되는 숫자들에 의해 일반적으로 예시된다. 타일들 (222) 의 각각 내에서, CTB들은 래스터 스캔 순서에 따라 코딩된다.
타일들의 수와 그 타일들의 경계들의 로케이션들은 전체 시퀀스에 대해 정의되거나 또는 픽처마다 변경될 수도 있다. 타일 경계들은, 슬라이스 경계들과 유사하게, 파싱 및 예측 의존관계들을 깨뜨려서 타일이 독립적으로 프로세싱될 수 있다. 그러나, 일부 경우들에서, 루프 내 필터들 (예컨대, 블록화제거 및 샘플 적응 오프셋 (SAO) 필터들) 이, 타일 경계들을 여전히 가로지를 수도 있다.
타일들을 사용하는 것은 병렬성 (parallelism) 을 향상시킬 수도 있는데, 엔트로피 디코딩 및 모션 보상 복원을 위한 프로세서들 또는 프로세서 코어들 간에는 통신이 전혀 없기 (또는 상대적으로 거의 없기) 때문이다. 덧붙여서, 타일들은 슬라이스들과 비교해 볼 때 상대적으로 더 나은 코딩 효율을 보일 수도 있는데, 타일들이 슬라이스들보다 잠재적으로 더 높은 상관을 갖는 샘플들을 포함하는 픽처 구획 형상들을 허용하기 때문이다. 타일들은 슬라이스 헤더 오버헤드를 또한 감소시킬 수도 있다.
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 다른 CTB의 팔레트에 기초하여 CTB의 팔레트를 결정하기 위한 예측자 팔레트를 재초기화할 수도 있다. 예시의 목적을 위한 일 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 각각의 CTB 라인의 시작부분에서 현재 CTB의 현재 팔레트를 결정하기 위한 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 현재 CTB 상측의 CTB 라인의 첫 번째 CTB로부터의 팔레트 엔트리들을 사용하여 예측자 팔레트를 재초기화할 수도 있다,
예시의 목적을 위한 일 예에서, 팔레트 기반 코딩을 사용하여 (타일 (222A) 의) CTB (4) 를 코딩한 후, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 (타일 (222A) 의) CTB (5) 의 팔레트를 결정하기 위한 예측자 팔레트를 생성하도록 구성될 수도 있다. 덧붙여서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 팔레트 기반 코딩 모드를 사용하여 CTB (5), CTB (6), 및 CTB (7) 의 각각을 코딩한 후 예측자 팔레트를 업데이트하도록 구성될 수도 있다. 다시 말하면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (5), CTB (6), 및 CTB (7) 의 각각을 코딩한 후 예측자 팔레트의 하나 이상의 엔트리들을 대체 또는 추가할 수도 있다.
본 개시물의 양태들에 따르면, (래스터 스캔 순서를 가정하여) CTB (4) 를 포함하는 CTB 라인 하측의 CTB 라인의 CTB (8) 를 코딩하는 경우, 비디오 인코더 (20) 는 CTB (8) 를 코딩하기 위한 팔레트를 생성하기 전에 예측자 팔레트를 재초기화할 수도 있다. 예를 들어, CTB (7) 에 기초하여 이전에 업데이트된 바와 같은 예측자 팔레트를 사용하지 않고, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상측-이웃 CTB 행의 첫 번째 CTB, 즉, CTB (4) 에 연관된 팔레트의 엔트리들에 기초하여 예측자 팔레트를 재초기화할 수도 있다. 이런 방식으로, CTB (8) 에 대한 팔레트를 생성하기 위한 예측자 팔레트는 CTB (8) 에서 사용되는 컬러들과 유사한 컬러들을 가질 더 많은 가능성이 있을 수도 있는데, CTB (4) 가 CTB (7) 보다는 CTB (4) 에 공간적으로 더 가깝게 위치되기 때문이다.
위에서 언급했듯이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상측-이웃 CTB 행의 첫 번째 CTB, 즉, CTB (4) 의 팔레트의 엔트리들에 기초하여 예측자 팔레트를 재초기화할 수도 있다. 일부 예들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (8) 에 대한 예측자 팔레트, 예컨대, CTB (8) 의 샘플들을 코딩하기 위한 팔레트를 생성하는데 사용되는 예측자 팔레트를, 그 예측자 팔레트의 엔트리들을 CTB (4) 를 코딩하는데 사용된 팔레트로부터의 엔트리들로 대체함으로써, 재초기화하도록 구성될 수도 있다.
다른 예에서, 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (4) 의 팔레트로부터의 엔트리들을 포함하는 CTB (4) 에 연관된 예측자 팔레트에 기초하여 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 예를 들어, 위에서 언급했듯이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (4) 를 코딩한 후 예측자 팔레트를 생성 (또는 이전에 생성된 예측자 팔레트를 업데이트) 할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 생성된 또는 업데이트된 예측자 팔레트에서의 CTB (4) 로부터의 엔트리들을 포함할 수도 있다. 이 경우, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (4) 를 코딩한 후에 그리고 CTB (5) 를 코딩하기 전에 예측자 팔레트의 엔트리들에 기초하여 예측자 팔레트를 재초기화할 수도 있다. 이 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (4) 의 코딩을 종료한 후에 그리고 CTB (5) 를 코딩하기 전에 CTB (8) 의 예측자 팔레트를 재초기화하도록 구성될 수도 있다.
위의 예가 CTB (4) 와 CTB (5) 에 관해 설명되지만, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 일반화된 기법들을 유사한 방식으로 적용하도록 구성될 수도 있다. 예를 들어, CTB (8) 에 대한 예측자 팔레트를 재초기화하는 예에 관해, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CTB (8) 상측의 CTB 라인 (예컨대, CTB들의 상측-이웃 라인이며, CTB (4) 를 포함함) 의 N 개의 CTB들을 코딩한 후 예측자 팔레트를 생성 및/또는 업데이트하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 생성된 (또는 업데이트된) 예측자 팔레트에 기초하여 그리고 CTB (4) 상측의 CTB 라인에서의 N+1번째 CTB의 코딩을 시작하기 전에 CTB (8) 에 대한 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 따라서, 일부 예들에서, 재초기화를 위해 사용된 예측자 팔레트는 CTB (4) 에 대한 팔레트의 엔트리들과는 상이한 (또는 그런 엔트리들에 추가하여) 엔트리들을 포함할 수도 있다.
하나의 예에서, CTB (4) 에 대한 위에서 설명된 프로세스는 대신에 CTB (5) 에 대해 수행될 수도 있다. 예를 들어, CTB (5) 뒤에 생성된 예측자 팔레트는 위의 예에서 CTB (4) 대신 사용될 수도 있다. 이 경우, 팔레트 재초기화 프로세스를 위해 사용되는 CTB는, 팔레트 재초기화와 콘텍스트 초기화 프로세스를 잠재적으로 조화를 이루게 할, 파면들에 적용된 CABAC 콘텍스트 초기화 프로세스를 위해 사용되는 동일한 CTB일 수도 있다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 픽처 또는 타일의 (상단에서 하단으로의 래스터 스캔을 가정하여) 상단 라인에 위치된 초기 CTB에 대한 예측자 팔레트를 재초기화하지 않도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 (타일 (222A) 의) CTB (0) 에 대한 예측자 팔레트를 재초기화하지 않도록 구성될 수도 있는데, CTB (0) 상측에 위치된 CTB가 없기 때문이다.
도 5의 예들이 예시를 목적으로 CTB들에 관해 설명되지만, 그 기법들은 비디오 데이터의 블록의 임의의 유형으로 확장될 수도 있다는 것이 이해되어야 한다.
도 6은 파면 병렬 프로세싱 (WPP) 을 위한 파면들을 예시하는 개념도이다. HEVC는 WPP 기법을 정의한다. WPP가 가능하게 되는 경우, 픽처의 각각의 CTU 행이 분리된 구획이다. 슬라이스들 및 타일들과 비교하면, 그러나, 코딩 의존관계들이 CTU 행 경계들에서 깨지지 않는다. 덧붙여, CABAC 확률들은 이전 행의 두 번째 CTU로부터 전파되어, 코딩 손실들을 더욱 감소시킨다. 또한, WPP는 일반 래스터 스캔 순서를 변경시키지 않는다. 의존관계들이 깨지지 않기 때문에, WPP 비트스트림의 레이트-왜곡 손실은, 비병렬 비트스트림에 비하여, 작다.
WPP가 가능하게 되는 경우, CTU 행들의 수까지의 개수의 프로세서들이, CTU 행 (또는 라인들) 을 프로세싱하기 위해 병렬로 작동할 수 있다. 파면 의존관계들은, 그러나, 모든 CTU 행들이 픽처의 시작부분에서 디코딩을 시작하는 것을 허용하지 않는다. 결과적으로, CTU 행들은 또한, 픽처의 말단에서 동시에 디코딩을 종료할 수 없다. 이는 매우 많은 수의 프로세서들이 사용되는 경우 더욱 분명해지는 병렬화 비효율성을 도입한다. 도 6은, WPP가 CTB들의 행들을 병렬로 프로세싱하는 방법을 예시하며, 각각의 행은 상측 행의 두 번째 CTB를 프로세싱한 후 이용 가능한 CABAC 확률들로 시작한다.
본 개시물의 양태들에 따르면, 아래에서 더욱 상세히 설명되는 바와 같이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 도 6에 예시된 파면들에 기초하여 예측자 팔레트를 재설정할지의 여부를 결정할 수도 있다.
도 7은 본 개시물의 기법들에 부합하는, 다수의 타일들 및 파면들의 존재 시의 예측자 팔레트 재설정의 일 예를 도시하는 개념도이다. 도 7의 예에서, 상대적으로 더 두꺼운 실선들이 타일 경계들, 이를테면 타일 (230) 의 타일 경계들을 나타낼 수도 있다. 파선들은 CTB 경계들을 나타낸다. 예를 들어, CTB 행 (232) 은 타일 (230) 의 두 개의 최상측 CTB들을 포함하는 CTB들의 타일 행을 나타낸다.
본 개시물의 일부 기법들은 픽처, 이를테면 픽처 (234) 를 코딩하는데 사용되는 파면들의 수 및/또는 타일들의 수에 기초하여 예측자 팔레트를 재설정하는 것을 포함한다. 예를 들어, 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 다수의 파면들 및 다수의 타일들 (이를테면 각각 도 5 및 도 6에 도시된 타일들 및 파면들) 이 픽처 (234) 를 코딩하는데 사용되는 경우 첫 번째 타일 CTB들 (이를테면 타일 (230) 의 상부 최좌측 CTB) 에 대한 예측자 팔레트를 재설정할 수도 있다. 도 7의 예에서, CTB들 내에 포함된 속이 찬 원들은 팔레트 재설정이 수행되는 타일들의 첫 번째 타일 CTB를 나타낸다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 예측자 팔레트 사이즈를 0으로 설정하고 현재 블록을 코딩하는데 사용된 팔레트의 임의의 팔레트 엔트리를 예측하지 않음으로써 팔레트를 재설정할 수도 있다.
도 8은 본 개시물의 기법들과 부합하는, 화소들의 블록에 대한 팔레트로의 인덱스들을 결정하는 일 예를 도시하는 개념도이다. 예를 들어, 도 5는 인덱스 값들에 연관된 화소들의 각각의 포지션들을 팔레트들 (244) 의 엔트리에 관련시키는 인덱스들의 맵 (240) 을 포함한다. 예를 들어, 인덱스 1은 값 A와 연관되며, 인덱스 2는 값 B와 연관되고, 인덱스 3은 값 C와 연관된다. 덧붙여서, 이스케이프 샘플들이 암시적 이스케이프 시그널링을 사용하여 나타내어지는 경우, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 인덱스 4에 연관된 맵 (240) 의 샘플들이 이스케이프 샘플들임을 나타낼 수도 있는, 도 5에서 인덱스 4로서 예시된 추가적인 인덱스를 팔레트들 (244) 에 또한 추가할 수도 있다. 이 경우에, 화소 값이 팔레트들 (244) 에 포함되지 않는다면, 맵 (240) 에서의 포지션에 대한 실제 화소 값 (또는 그것의 양자화된 버전) 의 표시를 비디오 인코더 (20) 는 인코딩할 수도 있 (고 비디오 디코더 (30) 는 인코딩된 비트스트림으로 획득할 수도 있) 다.
일부 예들에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 어떤 화소 포지션들이 인덱스 값들에 연관되는지를 나타내는 추가적인 맵을 코딩하도록 구성될 수도 있다. 예를 들어, 맵에서의 (i, j) 엔트리가 CU의 (i, j) 포지션에 대응한다고 가정한다. 비디오 인코더 (20) 는 맵의 각각의 엔트리 (즉, 각각의 화소 포지션) 에 대해 그 엔트리가 연관된 인덱스 값을 갖는지의 여부를 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 CU에서의 (i, j) 로케이션에 있는 화소 값이 팔레트들 (244) 에서의 값들 중 하나임을 나타내는 1의 값을 갖는 플래그를 인코딩할 수도 있다.
비디오 인코더 (20) 는, 이러한 일 예에서, 팔레트에서 그 화소 값을 나타내기 위해 그리고 비디오 디코더가 그 화소 값을 복원하는 것을 허용하기 위해 팔레트 인덱스 (도 8의 예에서 값 1~3으로서 도시됨) 를 또한 인코딩할 수도 있다. 팔레트들 (244) 이 단일 엔트리 및 연관된 화소 값을 포함하는 경우들에서, 비디오 인코더 (20) 는 인덱스 값의 시그널링을 스킵할 수도 있다. 비디오 인코더 (20) 는 CU에서의 (i, j) 로케이션에 있는 화소 값이 팔레트들 (244) 에서의 값들 중 하나가 아님을 나타내기 위해 0의 값을 갖도록 플래그를 인코딩할 수도 있다. 이 예에서, 비디오 인코더 (20) 는 화소 값을 복원함에 있어서 비디오 디코더 (30) 에 의한 사용을 위해 화소 값의 표시를 또한 인코딩할 수도 있다. 일부 경우들에서, 화소 값은 손실 방식으로 코딩될 수도 있다.
CU의 하나의 포지션에서의 화소의 값은 CU의 다른 포지션들에서의 하나 이상의 다른 화소들의 값들의 표시를 제공할 수도 있다. 예를 들어, CU의 이웃하는 화소 포지션들이 동일한 화소 값을 갖게 될 것이거나 또는 동일한 인덱스 값에 매핑될 수도 있을 비교적 높은 확률이 있을 수도 있다 (손실 코딩의 경우, 하나를 초과하는 화소 값이 단일 인덱스 값에 매핑될 수도 있다). 따라서, 비디오 인코더 (20) 는 동일한 인덱스를 갖는 주어진 스캔 순서에서의 다수의 연속적인 인덱스 값들을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 위에서 언급했듯이, 이 방식으로 인덱스들을 코딩하는 것은 값 팔레트 모드라고 지칭될 수도 있다.
위에서 언급했듯이, 런들은 상단에서복사 또는 값 모드와 연계하여 사용될 수도 있다. 예시 목적을 위한 일 예에서, 맵 (240) 의 행들 (264, 및 268) 을 고려한다. 수평, 좌측에서 우측으로의 스캔 방향을 가정하면, 행 (264) 은 세 개의 "1"의 인덱스 값들, 두 개의 "2"의 인덱스 값들, 및 세 개의 "3"의 인덱스 값들을 포함한다. 행 (268) 은 다섯 개의 "1"의 인덱스 값들, 두 개의 "3"의 인덱스 값들, 및 팔레트들 (244) 에 포함되지 않는 하나의 샘플 (인덱스 4에 의해 표현되지만, 샘플-레벨 이스케이프 플래그가 명시적 이스케이프 시그널링을 위해 사용될 수도 있음) 을 포함하는데, 이는 이스케이프 샘플이라고 지칭될 수도 있다.
이 예에서, 비디오 인코더 (20) 는 상단에서복사 모드를 사용하여 행 (268) 에 대한 데이터를 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 행 (268) 의 제 1 포지션 (행 (268) 의 최좌측 포지션) 이 행 (264) 의 제 1 포지션과 동일하다는 것을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 비디오 인코더 (20) 는 행 (268) 의 스캔 방향에서의 두 개의 연속적인 엔트리들의 다음의 런이 행 (264) 의 제 1 포지션과 동일함을 나타내는 하나 이상의 신택스 엘리먼트들을 또한 인코딩할 수도 있다.
행 (264) 의 제 1 포지션과 두 개의 엔트리들의 런 (위에서 언급됨) 을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩한 후, 비디오 인코더 (20) 는 값 모드를 사용하여, 행 (268) 에서의 (좌측에서 우측으로의) 제 4 및 제 5 포지션들을 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 (예컨대, 값 모드인) 제 4 포지션에 대한 1의 값을 나타내는 하나 이상의 신택스 엘리먼트들과 1의 런을 나타내는 하나 이상의 신택스 엘리먼트들을 인코딩할 수도 있다. 그런고로, 비디오 인코더 (20) 는 이들 두 개의 포지션들을 다른 라인에 대한 참조 없이 인코딩한다.
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 값 모드를 사용하여 코딩된 인덱스에 대한 런 값을 그 인덱스의 값에 기초하여 콘텍스트 코딩할 수도 있다. 예를 들어, 본원에서 설명된 바와 같이, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 CABAC 코딩 프로세스의 콘텍스트 적응 모드를 사용하여 런 값을 나타내는 데이터를 코딩할 수도 있다. 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런의 인덱스에 기초하여 데이터를 코딩하기 위한 콘텍스트를 결정하도록 구성될 수도 있다.
도 8의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵 (40) 의 위에서 언급된 제 4 포지션에 대해 1의 인덱스를 코딩한다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵 (240) 의 제 4 포지션에 대한 1의 런 값을 또한 이진화할 수도 있다. 하나의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값이 0보다 더 크지만 1보다 크지 않음을 나타내는 플래그를 생성할 수도 있다 (이는 별개의 플래그를 사용하여 나타내어질 수도 있다).
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 1의 인덱스 값에 기초하여 0보다 더 큰 플래그를 코딩하기 위한 콘텍스트를 선택할 수도 있다. 예를 들어, 일부 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런 값을 코딩하기 위한 콘텍스트들의 세트를 정의할 수도 있다. 콘텍스트들의 세트는 하나의 콘텍스트, 두 개의 콘텍스트들, 콘텍스트들, 네 개의 콘텍스트들, 또는 더 많은 콘텍스트들을 포함할 수도 있다.
하나의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 0과 동일한 인덱스에 기초하여 런 콘텍스트 (0) 를 선택하도록 구성될 수도 있다. 이 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 0 이 아닌 어느 값인 인덱스에 기초하여 런 콘텍스트 (1) 를 선택하도록 구성될 수도 있다. 이 예로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵 (240) 의 제 4 포지션에 대한 1인 인덱스에 기초하여 (1) 의 런 콘텍스트를 선택한다.
다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 0과 동일한 인덱스에 기초하여 런 콘텍스트 (0) 를 선택하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 1인 인덱스에 기초하여 런 콘텍스트 (1) 를 선택하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 1보다 더 큰 어느 값인 인덱스에 기초하여 런 콘텍스트 (2) 를 선택하도록 구성될 수도 있다. 이 예로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵 (240) 의 제 4 포지션에 대한 1인 인덱스에 기초하여 (1) 의 런 콘텍스트를 선택한다.
다른 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 0과 동일한 인덱스에 기초하여 런 콘텍스트 (0) 를 선택하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 1 또는 2인 인덱스에 기초하여 런 콘텍스트 (1) 를 선택하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 2보다 더 큰 인덱스에 기초하여 런 콘텍스트 (1) 를 선택하도록 구성될 수도 있다. 이 예로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵 (240) 의 제 4 포지션에 대한 1인 인덱스에 기초하여 (1) 의 런 콘텍스트를 선택한다.
본 개시물의 양태들에 따르면, 콘텍스트는 실제 인덱스 값 또는 조정된 인덱스 값에 기초할 수도 있다. 예를 들어, 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 조정된 팔레트 인덱스가 비트스트림에서 시그널링되는 사례들에서, 블록에서 샘플을 코딩하는데 실제로 사용되는 팔레트 인덱스가 아니라, 비트스트림에서 시그널링되는 팔레트 인덱스에 기초하여 런 값을 코딩하기 위한 콘텍스트 (이는 adjusted_palette_index 신택스 엘리먼트에 연관될 수도 있음) 를 결정하도록 구성될 수도 있다.
맵 (240) 의 제 4 포지션에 연관된 런을 코딩한 후, 비디오 인코더 (20) 는 그 다음에 상부 행 (264) 에 관하여 상단에서복사 모드를 사용하여 행 (268) 에서의 3의 인덱스 값을 갖는 제 1 포지션을 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 상단에서복사 모드와 1의 런을 시그널링할 수도 있다. 따라서, 비디오 인코더 (20) 는 라인의 화소 또는 인덱스 값들을 라인의 다른 값들에 관하여 예컨대, 런을 사용하여 코딩하는 것, 라인의 화소 또는 인덱스 값들을 다른 라인 (또는 열) 의 값들에 관하여 코딩하는 것, 또는 그 조합 사이에서 선택할 수도 있다. 비디오 인코더 (20) 는, 일부 예들에서, 선택하기 위해 레이트/왜곡 최적화를 수행할 수도 있다.
비디오 인코더 (20) 는 그 다음에 제 1 팔레트들 (244) 에 포함되지 않는 행 (268) 의 최종 샘플에 대한 이스케이프 샘플을 (좌측에서 우측으로) 인코딩할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 행 (268) 의 최종 포지션을 이스케이프 샘플로서 인코딩할 수도 있다. 다시 말하면, 비디오 인코더 (20) 는 행 (268) 의 최종 포지션이 이스케이프 샘플 (예컨대, 인덱스 4) 이라는 표시, 뿐만 아니라 샘플 값의 표시를 인코딩할 수도 있다. 비디오 디코더 (30) 는 인코딩된 비트스트림으로부터 위에서 설명된 신택스를 획득하고 이러한 신택스를 사용하여 행 (268) 을 복원할 수도 있다.
위에서 언급했듯이, 이스케이프 샘플로서 코딩된 샘플로서의 표시를 코딩하기 위한 둘 이상의 기법들이 있을 수도 있다. 예를 들어, 명시적 이스케이프 시그널링으로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 맵 (240) 의 각각의 샘플 포지션에 대해 명시적 이스케이프 플래그를 코딩할 수도 있다. 특정 샘플 (이를테면 행 (268) 의 최종 샘플) 이 이스케이프 샘플로서 코딩된다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 특정 샘플에 대한 컬러 값을 나타내는 데이터를 코딩할 수도 있다. 샘플이 이스케이프 샘플로서 코딩되지 않는다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 모드가 상단에서복사인지 또는 값인지를 나타내기 위해 추가적인 데이터, 이를테면 SPoint 플래그를 코딩할 수도 있다.
암시적 이스케이프 시그널링으로, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 추가적인 인덱스를 팔레트들 (244) (엔트리 인덱스 4) 에 추가할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 샘플이 이스케이프 샘플로서 코딩됨을 나타내기 위해 팔레트들 (244) 에 대한 추가적인 인덱스를 사용할 수도 있다. 추가적인 인덱스는, 그러나, 연관된 컬러 값을 갖지 않는다. 오히려, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 추가적인 인덱스에 연관되는 각각의 샘플에 대한 컬러 값들을 또한 코딩한다. 샘플이 이스케이프 샘플로서 코딩되지 않는다면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 모드가 상단에서복사인지 또는 값인지를 나타내기 위해 데이터, 이를테면 SPoint 플래그를 코딩할 수도 있다.
본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 이스케이프 샘플들로서 코딩되는 하나 이상의 샘플들을 포함하는 상단에서복사 모드를 사용하여 인덱스들의 런을 코딩하도록 구성될 수도 있다. 일부 사례들에서, 이스케이프 샘플들로서 코딩되는 샘플들은, 샘플들이 팔레트의 컬러 값에 매핑되는 인덱스를 갖지 않는 이스케이프 샘플들로서 코딩되었음에도 불구하고, 런에 포함되는 "인덱스들"로서 지칭될 수도 있다 (예컨대, 추가적인 인덱스가 이스케이프 샘플들로서 코딩되는 샘플들을 나타낼 목적으로 팔레트에 추가되지만, 대응하는 컬러 값을 갖지 않는다). 예를 들어, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상단에서복사 팔레트 모드로 복사된 팔레트에서의 연관된 컬러 값들을 갖는 다른 인덱스들의 런 내에 (명시적 이스케이프 시그널링에서) 이스케이프 플래그들 또는 (암시적 이스케이프 시그널링에서) 이스케이프 인덱스를 복사하도록 구성될 수도 있다. 이스케이프 플래그들과 이스케이프 인덱스 둘 다는 팔레트에서의 컬러 값에 연관되지 않는 신택스 엘리먼트라고 지칭될 수도 있는데, 플래그도 이스케이프 인덱스도 팔레트에 포함되지 않기 때문이다.
그런고로, 본 개시물의 양태들에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 는, 상단에서복사 팔레트 모드에 연관된 런에 포함된 현재 샘플 (예컨대, 다른 행의 샘플에 관하여 코딩된 샘플) 이,그 현재 샘플에 대한 상측-이웃 샘플이 이스케이프 샘플로서 코딩된다면, 이스케이프 샘플로서 코딩된다고 추론하도록 구성될 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 런에 뒤따르는 이스케이프 샘플로서 코딩된 모든 샘플들에 대한 관련된 이스케이프 값들을 또한 코딩할 수도 있다.
도 8에 관해, 행 (270) 의 제 3 샘플은 이스케이프 샘플로서 코딩되고 행 (272) 의 제 3 샘플은 이스케이프 샘플로서 코딩된다 (좌측에서 우측으로의 래스터 스캔을 가정함). 도 8의 예에서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상단에서복사 모드를 사용하여 행 (270) 의 제 1 샘플을 코딩할 수도 있다. 덧붙여서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 상단에서복사 모드에 대해 15의 런-길이를 나타내는 런 값을 코딩할 수도 있다. 그 런은 행 (270) 의 제 3 샘플과 행 (272) 의 제 3 샘플 둘 다를 포함한다. 따라서, 비디오 인코더 (20) 와 비디오 디코더 (30) 는 행 (270) 의 제 3 샘플에 대한 이스케이프 값 (예컨대, 컬러 값) 을 나타내는 데이터를 코딩할 수도 있다. 비디오 인코더 (20) 와 비디오 디코더 (30) 는 행 (270) 의 이스케이프 값과는 상이할 수도 있는, 행 (272) 의 제 3 샘플에 대한 이스케이프 값 (예컨대, 컬러 값) 을 나타내는 데이터를 또한 코딩할 수도 있다.
도 9는 본 개시물의 기법들과 부합하는, 예측자 팔레트를 결정하는 일 예의 프로세스를 도시하는 흐름도이다. 도 9의 프로세스는 비디오 인코더 (20), 비디오 디코더 (30), 또는 다양한 다른 프로세서들을 포함할 수도 있는 비디오 코더에 의해 수행되고 있는 것으로서 일반적으로 설명된다.
도 9의 예에서, 비디오 코더는 블록들의 제 1 행에 위치되는 비디오 데이터의 제 1 블록에 대한 제 1 팔레트를 결정할 수도 있다 (290). 예시를 목적으로 "행들"에 관해 설명되지만, 그 기법들은 비디오 코더가 블록들을 열 순서로 스캔하는 사례들에서 블록들의 열들에 또한 적용될 수도 있다. 어쨌든, 제 1 블록에 대한 제 1 팔레트는 각각의 팔레트 엔트리가 블록을 코딩하기 위한 컬러 값에 연관되는 팔레트 인덱스를 갖는 하나 이상의 팔레트 엔트리들을 포함할 수도 있다.
비디오 코더는 제 1 행에 위치된 적어도 하나의 제 2 블록의 적어도 하나의 팔레트를 생성 또는 구축하는 예측자 팔레트를 또한 생성한다 (292). 예를 들어, 비디오 코더는 제 1 블록을 코딩한 후 제 1 팔레트의 엔트리들에 기초하여 예측자 팔레트를 생성할 수도 있다. 비디오 코더는 팔레트 기반 코딩을 사용하여 코딩된 제 1 행의 각각의 후속하여 코딩된 블록에 대해 예측자 팔레트를 또한 업데이트할 수도 있다.
본 개시물의 양태들에 따르면, 비디오 코더는 블록들의 제 2 행에 위치된 제 3 블록의 제 3 팔레트를 결정하기 위한 예측자 팔레트를 재초기화할 수도 있다 (294). 제 3 블록은 블록들의 제 2 행에서 코딩되는 첫 번째 블록일 수도 있다. 제 3 블록은 첫 번째 블록 바로 밑에 위치될 수도 있다.
비디오 코더는 제 1 블록의 팔레트의 엔트리들에 기초하여 예측자 팔레트를 재초기화할 수도 있다. 일부 예들에 따르면, 비디오 코더는 예측자 팔레트의 엔트리들을 제 1 팔레트로부터의 엔트리들로 대체함으로써 예측자 팔레트를 재초기화하도록 구성될 수도 있다. 일부 예들에서, 비디오 코더는 첫 번째 블록을 코딩한 후에 (예컨대, 제 1 행에서의 두 번째 블록을 코딩하기 전에) 생성된 예측자 팔레트 또는 제 1 행의 하나 이상의 다른 블록들을 코딩한 후에 업데이트되는 것으로서의 업데이트된 예측자 팔레트를 사용하여 예측자 팔레트를 재초기화하도록 구성될 수도 있다.
비디오 코더는 재초기화된 예측자 팔레트에 기초하여 제 3 팔레트를 결정할 수도 있다 (296). 예를 들어, 비디오 코더는 예측자 팔레트의 어떤 엔트리들을 제 3 팔레트에 복사할 것인지를 결정하고 관련 있는 엔트리들을 복사할 수도 있다. 일부 예들에서, 본원에서 설명된 바와 같이, 비디오 코더는 예측 벡터에 기초하여 복사할 예측자 팔레트의 엔트리들을 결정할 수도 있다.
비디오 코더는 그 다음에 제 3 팔레트를 사용하여 블록을 인코딩/디코딩할 수도 있다 (298). 예를 들어, 비디오 코더가 비디오 인코더 (이를테면 비디오 인코더 (20)) 로서 동작하는 사례들에서, 비디오 인코더는 결정된 팔레트를 사용하여 제 3 블록의 인덱스들을 표현하는 데이터를 인코딩된 비트스트림에 인코딩할 수도 있다. 비디오 코더가 비디오 디코더 (이를테면 비디오 디코더 (30)) 로서 동작하는 사례들에서, 비디오 디코더는 제 3 팔레트를 사용하여 제 3 블록의 인덱스들에 대한 샘플 값들을 결정할 수도 있다.
도 10은 본 개시물의 기법들에 부합하는 팔레트 인덱스들의 런의 런 값을 코딩하기 위한 일 예의 프로세스를 도시하는 흐름도이다. 도 10의 프로세스는 비디오 인코더 (20), 비디오 디코더 (30), 또는 다양한 다른 프로세서들을 포함할 수도 있는 비디오 코더에 의해 수행되고 있는 것으로서 일반적으로 설명된다.
도 10의 예에서, 비디오 코더는 팔레트 인덱스의 런의 런-길이를 나타내는 런 값을 결정한다 (310). 예를 들어, 비디오 코더는 팔레트 인덱스의 표시를, 예컨대, 값 팔레트 모드를 사용하여 코딩할 수도 있다. 비디오 코더는 코딩된 인덱스와 동일한 값을 갖는 스캐닝 순서에서의 연속적인 샘플들의 수를 또한 결정할 수도 있다. 연속적인 샘플들의 수는 런 값일 수도 있다.
비디오 코더는 팔레트 인덱스에 기초하여 결정된 런 값을 나타내는 결정된 데이터를 콘텍스트 적응 코딩하기 위한 콘텍스트를 또한 결정할 수도 있다 (312). 예를 들어, 비디오 코더는 팔레트 인덱스에 기초하여 결정된 런 값을 CABAC 코딩하기 위한 하나 이상의 콘텍스트들을 결정할 수도 있다. 일부 예들에서, 비디오 코더는 런 값을 코딩하기 위해 정의된 복수의 콘텍스트들로부터 선택할 수도 있다.
다음으로 비디오 코더는 결정된 콘텍스트를 사용하여 런 값을 나타내는 데이터를 인코딩/디코딩할 수도 있다 (314). 예를 들어, 비디오 코더가 비디오 인코더 (이를테면 비디오 인코더 (20)) 로서 동작하는 사례들에서, 비디오 인코더는 인코딩된 비트스트림에 런 값을 나타내는 데이터를 인코딩할 수도 있다. 비디오 코더가 비디오 디코더 (이를테면 비디오 디코더 (30)) 로서 동작하는 사례들에서, 비디오 디코더는 인코딩된 비트스트림으로부터 런 값을 나타내는 데이터를 파싱 (디코딩) 할 수도 있다.
도 11은 본 개시물의 기법들에 부합하는 하나를 초과하는 팔레트 코딩 모드로 코딩된 인덱스들의 런을 코딩하는 일 예의 프로세스를 도시하는 흐름도이다. 도 11의 프로세스는 비디오 인코더 (20), 비디오 디코더 (30), 또는 다양한 다른 프로세서들을 포함할 수도 있는 비디오 코더에 의해 수행되고 있는 것으로서 일반적으로 설명된다.
비디오 코더는 팔레트의 컬러에 연관된 인덱스들과 팔레트의 컬러에 연관되지 않는 하나 이상의 신택스 엘리먼트들을 포함하는 블록의 제 1 행의 인덱스들을 결정한다 (320). 예를 들어, 비디오 코더는 팔레트 인덱스들이 코딩된 샘플들과 이스케이프 팔레트 모드에서 코딩된 샘플들을 결정할 수도 있다.
비디오 코더는 제 1 행의 팔레트 인덱스들에 관하여 제 2 행의 인덱스들의 런을 또한 인코딩/디코딩할 수도 있다 (322). 예를 들어, 비디오 코더가 비디오 인코더 (이를테면 비디오 인코더 (20)) 로서 동작하는 사례들에서, 비디오 인코더는 상단에서복사 모드의 표시 및 런의 런 길이의 표시를 인코딩할 수도 있다. 비디오 코더가 비디오 디코더 (이를테면 비디오 디코더 (30)) 로서 동작하는 사례들에서, 비디오 디코더는 상단에서복사 모드의 표시와 런의 런-길이의 표시를 디코딩할 수도 있다. 어느 경우에나, 런은 연관된 컬러들을 갖는 인덱스들뿐만 아니라 팔레트의 컬러에 연관되지 않는 하나 이상의 신택스 엘리먼트, 예컨대, 상단에서복사 모드에서뿐만 아니라 이스케이프 샘플들로서 코딩된 샘플들을 포함한다.
비디오 코더는 그 다음에 팔레트의 컬러에 연관되지 않는 신택스 엘리먼트들에 대한 컬러 값들을 나타내는 데이터를 인코딩/디코딩할 수도 있다 (324). 예를 들어, 비디오 코더가 비디오 인코더 (이를테면 비디오 인코더 (20)) 로서 동작하는 사례들에서, 비디오 인코더는 신택스 엘리먼트들에 의해 표현되는 샘플들의 컬러 값들을 나타내는 데이터를 인코딩된 비트스트림에 인코딩할 수도 있다. 비디오 코더가 비디오 디코더 (이를테면 비디오 디코더 (30)) 로서 동작하는 사례들에서, 비디오 디코더는 비트스트림으로부터의 신택스 엘리먼트들에 의해 표현되는 샘플들의 컬러 값들을 나타내는 데이터를 디코딩할 수도 있다.
본원에서 설명되는 기법들의 모두는 개별적으로 또는 조합하여 사용될 수도 있다는 것이 이해되어야 한다. 본 개시물은 블록 사이즈, 팔레트 사이즈, 슬라이스 유형 등과 같은 특정한 팩터들에 의존하여 변할 수도 있는 여러 시그널링 방법들을 포함한다. 신택스 엘리먼트들을 시그널링 또는 추론함에 있어서의 이러한 변동들은 인코더 및 디코더에 선험적으로 알려질 수도 있거나 또는 비디오 파라미터 세트 (VPS), 시퀀스 파라미터 세트 (SPS), 픽처 파라미터 세트 (PPS), 슬라이스 헤더에, 타일 레벨 또는 다른 곳에서 명시적으로 시그널링될 수도 있다.
예에 의존하여, 상이한 시퀀스로 수행될 수도 있는 본원에서 설명된 기법들 중 임의의 기법의 특정 액트들 또는 이벤트들이 부가되거나, 병합되거나, 또는 다 함께 제외될 수도 있다 (예컨대, 모든 설명된 액트들 또는 이벤트들이 그 기법들의 실시에 필요한 것은 아니다) 는 것이 이해되어야 한다. 더구나, 특정 예들에서, 액트들 또는 이벤트들은 순차적으로라기 보다는, 예컨대, 다중 스레드식 프로세싱, 인터럽트 프로세싱, 또는 다수의 프로세서들을 통하여 동시에 수행될 수도 있다. 덧붙여서, 본 개시물의 특정한 양태들이 명료함을 위해 단일 모듈 또는 유닛에 의해 수행되는 것으로 설명되어 있지만, 본 개시물의 기법들은 비디오 코더에 연관된 유닛들 또는 모듈들의 조합에 의해 수행될 수도 있다는 것이 이해되어야 한다.
본 개시물의 특정 양태들은 예시의 목적으로 개발되는 HEVC 표준에 대해 설명되었다. 그러나, 본 개시물에서 설명된 기법들은, 아직 개발되지 않은 다른 표준 또는 사유의 비디오 코딩 프로세스들을 포함하는 다른 비디오 코딩 프로세스들에 대해 유용할 수도 있다.
위에서 설명된 기법들은 비디오 인코더 (20) (도 1 및 도 2) 및/또는 비디오 디코더 (30) (도 1 및 도 3) 에 의해 수행될 수도 있으며, 그것들의 양쪽 모두는 비디오 코더라고 일반적으로 지칭될 수도 있다. 비슷하게, 비디오 코딩은 적용가능한 경우 비디오 인코딩 또는 비디오 디코딩을 지칭할 수도 있다.
그 기법들의 다양한 양태들의 특정 조합들이 위에서 설명되었지만, 이들 조합들은 본 개시물에서 설명된 기법들의 예들을 도시하기 위해서만 제공된다. 따라서, 본 개시물의 기법들은 이들 예의 조합들로 제한되지 않아야 하고 본 개시물에서 설명된 기법들의 다양한 양태들의 임의의 상상 가능한 조합을 포괄할 수도 있다.
하나 이상의 예들에서, 설명된 기능들은 하드웨어, 소프트웨어, 펌웨어, 또는 그것들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현된다면, 그 기능들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독가능 매체 상에 저장되거나 또는 그것을 통해 송신될 수도 있고 하드웨어 기반 프로세싱 유닛에 의해 실행될 수도 있다. 컴퓨터 판독가능 매체들은, 데이터 저장 매체들과 같은 유형의 (tangible) 매체에 대응하는 컴퓨터 판독가능 저장 매체들, 또는 예컨대 통신 프로토콜에 따라 한 장소에서 다른 장소로 컴퓨터 프로그램의 전달을 용이하게 하는 임의의 매체를 포함하는 통신 매체들을 포함할 수도 있다. 이런 방식으로, 컴퓨터 판독가능 매체들은 일반적으로 (1) 비일시적 (non-transitory) 인 유형의 컴퓨터 판독가능 저장 매체들 또는 (2) 신호 또는 반송파와 같은 통신 매체에 해당할 수도 있다. 데이터 저장 매체들은 본 개시물에서 설명된 기법들의 구현을 위한 명령들, 코드 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 이용가능 매체들일 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수도 있다.
비제한적인 예로, 이러한 컴퓨터 판독가능 저장 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광 디스크 스토리지, 자기 디스크 스토리지, 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 소망의 프로그램 코드를 컴퓨터에 의해 액세스될 수 있는 명령들 또는 데이터 구조들의 형태로 저장하는데 사용될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속이 컴퓨터 판독가능 매체로 적절히 칭해진다. 예를 들어, 명령들이 웹사이트, 서버, 또는 다른 원격 자원으로부터 동축 케이블, 광섬유 케이블, 연선 (twisted pair), 디지털 가입자 회선 (DSL), 또는 무선 기술들 이를테면 적외선, 라디오, 및/또는 마이크로파를 이용하여 송신된다면, 동축 케이블, 광섬유 케이블, 연선, DSL, 또는 적외선, 라디오, 및 마이크로파와 같은 무선 기술은 매체의 정의에 포함된다. 그러나, 컴퓨터 판독가능 저장 매체들 및 데이터 저장 매체들은 커넥션들, 반송파들, 신호들, 또는 다른 일시적인 매체들을 포함하지 않지만, 대신 비일시적, 유형의 저장 매체들을 지향하고 있음이 이해되어야 한다. 디스크 (disk 및 disc) 는 본원에서 사용되는 바와 같이, 콤팩트 디스크 (compact disc, CD), 레이저 디스크, 광 디스크, 디지털 다용도 디스크 (DVD), 플로피 디스크 (floppy disk) 및 블루레이 디스크를 포함하는데, disk들은 보통 데이터를 자기적으로 재생하지만, disc들은 레이저들로써 광적으로 데이터를 재생한다. 상기한 것들의 조합들은 또한 컴퓨터 판독가능 매체들의 범위 내에 포함되어야 한다.
명령들은 하나 이상의 프로세서들, 이를테면 하나 이상의 디지털 신호 프로세서들 (DSP들), 범용 마이크로프로세서들, 주문형 집적회로들 (ASIC들), 필드 프로그램가능 로직 어레이들 (FPGA들), 또는 다른 동등한 집적 또는 개별 로직 회로에 의해 실행될 수도 있다. 따라서, 본원에서 사용되는 바와 같은 "프로세서"라는 용어는 앞서의 구조 또는 본원에서 설명된 기법들의 구현에 적합한 임의의 다른 구조 중 임의의 것을 나타낼 수도 있다. 덧붙여서, 일부 양태들에서, 본원에서 설명된 기능성은 인코딩 및 디코딩을 위해 구성되는, 또는 결합형 코덱 (codec) 으로 통합되는 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공될 수도 있다. 또한, 본 기법들은 하나 이상의 회로들 또는 로직 엘리먼트들 내에 완전히 구현될 수 있다.
본 개시물의 기법들은 무선 핸드셋, 집적회로 (IC) 또는 IC들의 세트 (예컨대, 칩 셋) 를 포함하는 매우 다양한 디바이스들 또는 장치들로 구현될 수도 있다. 다양한 컴포넌트들, 모듈들, 또는 유닛들이 개시된 기법들을 수행하도록 구성된 디바이스들의 기능적 양태들을 강조하기 위해 본 개시물에서 설명되지만, 상이한 하드웨어 유닛들에 의한 실현을 반드시 요구하지는 않는다. 대신에, 위에서 설명된 바와 같이, 다양한 유닛들은 코덱 하드웨어 유닛에 결합되거나 또는 적합한 소프트웨어 및/또는 펌웨어와 함께, 위에서 설명된 바와 같은 하나 이상의 프로세서들을 포함하는, 상호운용적 하드웨어 유닛들의 컬렉션에 의해 제공될 수도 있다.
다양한 예들이 설명되어 있다. 이들 및 다른 예들은 다음의 청구항들의 범위 내에 있다.

Claims (30)

  1. 비디오 데이터를 프로세싱하는 방법으로서,
    비디오 데이터의 블록의 팔레트 인덱스의 런의 런 길이를 표시하는 런 값을 결정하는 단계로서, 상기 팔레트 인덱스는 상기 비디오 데이터의 블록을 코딩하기 위한 컬러 값들의 팔레트에서의 컬러 값과 연관되는, 상기 런 값을 결정하는 단계;
    상기 팔레트 인덱스에 기초하여 상기 런 값을 표현하는 데이터의 콘텍스트 적응 코딩을 위한 콘텍스트를 결정하는 단계; 및
    상기 결정된 콘텍스트를 이용하여 비트스트림으로부터 런 값을 표현하는 상기 데이터를 코딩하는 단계
    를 포함하는, 비디오 데이터를 프로세싱하는 방법.
  2. 제 1 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하는 단계는 상기 런 값이 0 보다 큰지 여부를 나타내는 제 1 빈을 코딩하는 단계, 상기 런 값이 1 보다 큰지 여부를 나타내는 제 2 빈을 코딩하는 단계, 및 상기 런 값이 2 보다 큰지 여부를 나타내는 제 3 빈을 코딩하는 단계를 포함하는, 비디오 데이터를 프로세싱하는 방법.
  3. 제 1 항에 있어서,
    상기 팔레트 인덱스에 기초하여 상기 콘텍스트를 결정하는 단계는 상기 팔레트 인덱스에 기초하여 3개의 콘텍스트들로부터 선택하는 단계를 포함하는, 비디오 데이터를 프로세싱하는 방법.
  4. 제 3 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하는 단계는 상기 런 값이 0 보다 큰지 여부를 나타내는 제 1 빈을 코딩하는 단계, 상기 런 값이 1 보다 큰지 여부를 나타내는 제 2 빈을 코딩하는 단계, 및 상기 런 값이 2 보다 큰지 여부를 나타내는 제 3 빈을 코딩하는 단계를 포함하고,
    상기 3개의 콘텍스트들로부터 선택하는 단계는
    상기 팔레트 인덱스가 0 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 1 콘텍스트를 선택하는 단계;
    상기 팔레트 인덱스가 1 또는 2 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 2 콘텍스트를 선택하는 단계; 및
    상기 팔레트 인덱스가 2 보다 큰 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 3 콘텍스트를 선택하는 단계를 포함하는, 비디오 데이터를 프로세싱하는 방법.
  5. 제 1 항에 있어서,
    상기 팔레트 인덱스에 기초하여 상기 콘텍스트를 결정하는 단계는 상기 팔레트 인덱스에 기초하여 2개의 콘텍스트들로부터 선택하는 단계를 포함하는, 비디오 데이터를 프로세싱하는 방법.
  6. 제 5 항에 있어서,
    상기 2개의 콘텍스트들로부터 선택하는 단계는
    상기 팔레트 콘텍스트가 0 인 것에 기초하여, 상기 2개의 콘텍스트들 중 제 1 콘텍스트를 선택하는 단계; 및
    상기 팔레트 콘텍스트가 0 이 아닌 어느 값인 것에 기초하여, 상기 2개의 콘텍스트들 중 제 2 콘텍스트를 선택하는 단계를 포함하는, 비디오 데이터를 프로세싱하는 방법.
  7. 제 1 항에 있어서,
    상기 비트스트림으로부터 상기 팔레트 인덱스를 표현하는 데이터를 코딩하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
  8. 제 1 항에 있어서,
    상기 팔레트 인덱스는 조정된 팔레트 인덱스를 포함하고, 상기 방법은 상기 비트스트림으로부터 상기 조정된 팔레트 인덱스를 표현하는 상기 데이터를 파싱하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
  9. 제 1 항에 있어서,
    상기 콘텍스트를 결정하는 단계는 상기 컬러 값들의 팔레트의 사이즈 또는 상기 블록의 사이즈에 기초하여 상기 콘텍스트를 결정하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
  10. 제 1 항에 있어서,
    상기 런 값을 나타내는 상기 데이터를 코딩하는 단계는 상기 데이터를 인코딩하는 단계를 포함하고, 상기 방법은
    컬러들의 팔레트를 나타내는 데이터를 인코딩하는 단계; 및
    상기 팔레트 인덱스와 연관된 화소에 대하여, 상기 화소를 인코딩하는데 사용된 팔레트 모드를 나타내는 데이터를 인코딩하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
  11. 제 1 항에 있어서,
    상기 런 값을 나타내는 상기 데이터를 코딩하는 단계는 상기 데이터를 디코딩하는 단계를 포함하고, 상기 방법은
    인코딩된 비트스트림으로부터, 컬러들의 팔레트를 나타내는 데이터를 획득하는 단계; 및
    상기 컬러들의 팔레트를 이용하여 상기 런의 샘플들 및 화소의 값을 결정하는 단계를 더 포함하는, 비디오 데이터를 프로세싱하는 방법.
  12. 비디오 데이터를 프로세싱하는 디바이스로서,
    비디오 데이터의 블록을 저장하도록 구성된 메모리; 및
    하나 이상의 프로세서들을 포함하고,
    상기 하나 이상의 프로세서들은
    상기 비디오 데이터의 블록의 팔레트 인덱스의 런의 런 길이를 표시하는 런 값을 결정하는 것으로서, 상기 팔레트 인덱스는 상기 비디오 데이터의 블록을 코딩하기 위한 컬러 값들의 팔레트에서의 컬러 값과 연관되는, 상기 런 값을 결정하고;
    상기 팔레트 인덱스에 기초하여 상기 런 값을 표현하는 데이터의 콘텍스트 적응 코딩을 위한 콘텍스트를 결정하고; 그리고
    상기 결정된 콘텍스트를 이용하여 비트스트림으로부터 런 값을 표현하는 상기 데이터를 코딩하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  13. 제 12 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하기 위하여, 상기 하나 이상의 프로세서들은 상기 런 값이 0 보다 큰지 여부를 나타내는 제 1 빈을 코딩하고, 상기 런 값이 1 보다 큰지 여부를 나타내는 제 2 빈을 코딩하고, 그리고 상기 런 값이 2 보다 큰지 여부를 나타내는 제 3 빈을 코딩하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  14. 제 12 항에 있어서,
    상기 팔레트 인덱스에 기초하여 상기 콘텍스트를 결정하기 위하여, 상기 하나 이상의 프로세서들은 상기 팔레트 인덱스에 기초하여 3개의 콘텍스트들로부터 선택하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  15. 제 14 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하기 위하여, 상기 하나 이상의 프로세서들은 상기 런 값이 0 보다 큰지 여부를 나타내는 제 1 빈을 코딩하고, 상기 런 값이 1 보다 큰지 여부를 나타내는 제 2 빈을 코딩하고, 그리고 상기 런 값이 2 보다 큰지 여부를 나타내는 제 3 빈을 코딩하도록 구성되고, 상기 3개의 콘텍스트들로부터 선택하기 위하여, 상기 하나 이상의 프로세서들은
    상기 팔레트 인덱스가 0 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 1 콘텍스트를 선택하고;
    상기 팔레트 인덱스가 1 또는 2 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 2 콘텍스트를 선택하고; 그리고
    상기 팔레트 인덱스가 2 보다 큰 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 3 콘텍스트를 선택하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  16. 제 12 항에 있어서,
    상기 팔레트 인덱스에 기초하여 상기 콘텍스트를 결정하기 위하여, 상기 하나 이상의 프로세서들은 상기 팔레트 인덱스에 기초하여 2개의 콘텍스트들로부터 선택하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  17. 제 16 항에 있어서,
    상기 2개의 콘텍스트들로부터 선택하기 위하여, 상기 하나 이상의 프로세서들은
    상기 팔레트 콘텍스트가 0 인 것에 기초하여, 상기 2개의 콘텍스트들 중 제 1 콘텍스트를 선택하고; 그리고
    상기 팔레트 콘텍스트가 0 이 아닌 어느 값인 것에 기초하여, 상기 2개의 콘텍스트들 중 제 2 콘텍스트를 선택하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  18. 제 12 항에 있어서,
    상기 하나 이상의 프로세서들은 또한, 상기 비트스트림으로부터 상기 팔레트 인덱스를 표현하는 데이터를 코딩하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  19. 제 12 항에 있어서,
    상기 팔레트 인덱스는 조정된 팔레트 인덱스를 포함하고, 상기 하나 이상의 프로세서들은 또한 상기 비트스트림으로부터 상기 조정된 팔레트 인덱스를 표현하는 데이터를 코딩하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  20. 제 12 항에 있어서,
    상기 콘텍스트를 결정하기 위하여, 상기 하나 이상의 프로세서들은 상기 컬러 값들의 팔레트의 사이즈 또는 상기 블록의 사이즈에 기초하여 상기 콘텍스트를 결정하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  21. 제 12 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하기 위하여, 상기 하나 이상의 프로세서들은 상기 데이터를 인코딩하도록 구성되고, 상기 하나 이상의 프로세서들은 또한
    컬러들의 팔레트를 나타내는 데이터를 인코딩하고; 그리고
    상기 팔레트 인덱스와 연관된 화소에 대하여, 상기 화소를 인코딩하는데 사용된 팔레트 모드를 나타내는 데이터를 인코딩하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  22. 제 21 항에 있어서,
    상기 비디오 데이터의 블록을 포함하는 픽처를 캡처하도록 구성된 카메라를 더 포함하는, 비디오 데이터를 프로세싱하는 디바이스.
  23. 제 12 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하기 위하여, 상기 하나 이상의 프로세서들은 상기 데이터를 디코딩하도록 구성되고, 상기 하나 이상의 프로세서들은 또한
    인코딩된 비트스트림으로부터, 컬러들의 팔레트를 나타내는 데이터를 획득하고; 그리고
    상기 컬러들의 팔레트를 이용하여 상기 런의 샘플들 및 화소의 값을 결정하도록 구성되는, 비디오 데이터를 프로세싱하는 디바이스.
  24. 제 23 항에 있어서,
    상기 디코딩된 블록을 디스플레이하도록 구성된 디스플레이를 더 포함하는, 비디오 데이터를 프로세싱하는 디바이스.
  25. 제 12 항에 있어서,
    상기 디바이스는
    집적 회로;
    마이크로프로세서; 또는
    무선 통신 디바이스
    중 적어도 하나를 포함하는, 비디오 데이터를 프로세싱하는 디바이스.
  26. 비디오 데이터를 프로세싱하는 장치로서,
    비디오 데이터의 블록의 팔레트 인덱스의 런의 런 길이를 표시하는 런 값을 결정하는 수단으로서, 상기 팔레트 인덱스는 상기 비디오 데이터의 블록을 코딩하기 위한 컬러 값들의 팔레트에서의 컬러 값과 연관되는, 상기 런 값을 결정하는 수단;
    상기 팔레트 인덱스에 기초하여 상기 런 값을 표현하는 데이터의 콘텍스트 적응 코딩을 위한 콘텍스트를 결정하는 수단; 및
    상기 결정된 콘텍스트를 이용하여 비트스트림으로부터 런 값을 표현하는 상기 데이터를 코딩하는 수단
    을 포함하는, 비디오 데이터를 프로세싱하는 장치.
  27. 제 26 항에 있어서,
    상기 팔레트 인덱스에 기초하여 상기 콘텍스트를 결정하는 단계는 상기 팔레트 인덱스에 기초하여 3개의 콘텍스트들로부터 선택하는 단계를 포함하는, 비디오 데이터를 프로세싱하는 장치.
  28. 제 27 항에 있어서,
    상기 런 값을 표현하는 상기 데이터를 코딩하는 수단은 상기 런 값이 0 보다 큰지 여부를 나타내는 제 1 빈을 코딩하는 수단, 상기 런 값이 1 보다 큰지 여부를 나타내는 제 2 빈을 코딩하는 수단, 및 상기 런 값이 2 보다 큰지 여부를 나타내는 제 3 빈을 코딩하는 수단을 포함하고, 상기 3개의 콘텍스트들로부터 선택하는 수단은
    상기 팔레트 인덱스가 0 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 1 콘텍스트를 선택하는 수단;
    상기 팔레트 인덱스가 1 또는 2 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 2 콘텍스트를 선택하는 수단; 및
    상기 팔레트 인덱스가 2 보다 큰 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 3 콘텍스트를 선택하는 수단을 포함하는, 비디오 데이터를 프로세싱하는 장치.
  29. 저장된 명령들을 갖는 비일시적 컴퓨터 판독가능 매체로서,
    상기 명령들은 실행될 때 하나 이상의 프로세서들로 하여금,
    비디오 데이터의 블록의 팔레트 인덱스의 런의 런 길이를 표시하는 런 값을 결정하게 하는 것으로서, 상기 팔레트 인덱스는 상기 비디오 데이터의 블록을 코딩하기 위한 컬러 값들의 팔레트에서의 컬러 값과 연관되는, 상기 런 값을 결정하게 하고;
    상기 팔레트 인덱스에 기초하여 상기 런 값을 표현하는 데이터의 콘텍스트 적응 코딩을 위한 콘텍스트를 결정하게 하고; 그리고
    상기 결정된 콘텍스트를 이용하여 비트스트림으로부터 런 값을 표현하는 상기 데이터를 코딩하게 하는, 비일시적 컴퓨터 판독가능 매체.
  30. 제 29 항에 있어서,
    상기 팔레트 인덱스에 기초하여 상기 콘텍스트를 결정하기 위하여, 상기 명령들은 상기 하나 이상의 프로세서들로 하여금, 상기 팔레트 인덱스에 기초하여 3개의 콘텍스트들로부터 선택하게 하고, 상기 런 값을 표현하는 상기 데이터를 코딩하기 위하여, 상기 명령들은 상기 하나 이상의 프로세서들로 하여금 상기 런 값이 0 보다 큰지 여부를 나타내는 제 1 빈을 코딩하게 하고, 상기 런 값이 1 보다 큰지 여부를 나타내는 제 2 빈을 코딩하게 하고, 그리고 상기 런 값이 2 보다 큰지 여부를 나타내는 제 3 빈을 코딩하게 하고, 그리고 상기 3개의 콘텍스트들로부터 선택하기 위하여, 상기 명령들은 상기 하나 이상의 프로세서들로 하여금
    상기 팔레트 인덱스가 0 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 1 콘텍스트를 선택하게 하고;
    상기 팔레트 인덱스가 1 또는 2 인 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 2 콘텍스트를 선택하게 하고; 그리고
    상기 팔레트 인덱스가 2 보다 큰 것에 기초하여, 상기 제 1 빈, 상기 제 2 빈, 및 상기 제 3 빈 중 적어도 하나를 코딩하기 위해 상기 3개의 콘텍스트들 중 제 3 콘텍스트를 선택하게 하는, 비일시적 컴퓨터 판독가능 매체.
KR1020167035380A 2014-05-23 2015-05-22 팔레트 기반 비디오 코딩에서 팔레트 인덱스에 기초한 런 값들의 코딩 KR102416949B1 (ko)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US201462002717P 2014-05-23 2014-05-23
US62/002,717 2014-05-23
US201462009772P 2014-06-09 2014-06-09
US62/009,772 2014-06-09
US201462015261P 2014-06-20 2014-06-20
US62/015,261 2014-06-20
US201462019223P 2014-06-30 2014-06-30
US62/019,223 2014-06-30
US201462059659P 2014-10-03 2014-10-03
US62/059,659 2014-10-03
US201462065526P 2014-10-17 2014-10-17
US62/065,526 2014-10-17
US14/719,263 2015-05-21
US14/719,263 US10382749B2 (en) 2014-05-23 2015-05-21 Coding run values based on palette index in palette-based video coding
PCT/US2015/032282 WO2015179827A1 (en) 2014-05-23 2015-05-22 Coding run values based on palette index in palette-based video coding

Publications (2)

Publication Number Publication Date
KR20170008816A true KR20170008816A (ko) 2017-01-24
KR102416949B1 KR102416949B1 (ko) 2022-07-04

Family

ID=53718109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167035380A KR102416949B1 (ko) 2014-05-23 2015-05-22 팔레트 기반 비디오 코딩에서 팔레트 인덱스에 기초한 런 값들의 코딩

Country Status (10)

Country Link
US (1) US10382749B2 (ko)
EP (1) EP3146726B1 (ko)
JP (1) JP6541692B2 (ko)
KR (1) KR102416949B1 (ko)
CN (1) CN106464872B (ko)
BR (1) BR112016027426B1 (ko)
CA (1) CA2947042C (ko)
ES (1) ES2746102T3 (ko)
HU (1) HUE045219T2 (ko)
WO (1) WO2015179827A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019017562A1 (ko) * 2017-07-20 2019-01-24 삼성전자 주식회사 이미지의 에러 데이터를 보정하여 압축하기 위한 장치 및 그에 관한 방법

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102275639B1 (ko) 2013-10-14 2021-07-08 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 영상 코딩 및 디코딩에 대한 기본 색상 인덱스 맵 모드의 특징
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
US10038915B2 (en) 2014-05-22 2018-07-31 Qualcomm Incorporated Escape sample coding in palette-based video coding
US10750198B2 (en) 2014-05-22 2020-08-18 Qualcomm Incorporated Maximum palette parameters in palette-based video coding
US10264285B2 (en) 2014-05-22 2019-04-16 Qualcomm Incorporated Coding runs in palette-based video coding
US10291940B2 (en) 2014-05-23 2019-05-14 Qualcomm Incorporated Coding runs with escape in palette-based video coding
US11323733B2 (en) 2014-05-23 2022-05-03 Qualcomm Incorporated Predictor palette initialization in palette-based video coding
US10687064B2 (en) 2014-08-04 2020-06-16 Qualcomm Incorporated Palette mode encoding and decoding with inferred pixel scan order
JP2017535145A (ja) 2014-09-30 2017-11-24 マイクロソフト テクノロジー ライセンシング,エルエルシー 波面並列処理が可能にされた場合のピクチャ内予測モードに関する規則
WO2016057323A1 (en) * 2014-10-06 2016-04-14 Huawei Technologies Co., Ltd. Improved palette mode in high efficiency video coding (hevc) screen content coding (scc)
US9596479B2 (en) * 2014-10-07 2017-03-14 Hfi Innovation Inc. Method of pulse-code modulation and palette coding for video coding
JP6461355B2 (ja) * 2015-01-29 2019-01-30 キヤノン株式会社 画像を符号化または復号する装置、方法、プログラム
WO2016197314A1 (en) * 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US20170055003A1 (en) * 2015-08-20 2017-02-23 Futurewei Technologies, Inc. Context Reduction Of Palette Run Type In High Efficiency Video Coding (HEVC) Screen Content Coding (SCC)
EP3794825A1 (en) 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Update of look up table: fifo, constrained fifo
JP7295230B2 (ja) * 2018-06-29 2023-06-20 北京字節跳動網絡技術有限公司 スライス/タイル/lcuの行ごとのルックアップテーブルのリセット
CN114900694A (zh) 2018-06-29 2022-08-12 抖音视界(北京)有限公司 哪个查找表需要更新或不更新
EP4322533A3 (en) 2018-06-29 2024-03-06 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in lut
WO2020003282A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Managing motion vector predictors for video coding
TWI719525B (zh) 2018-06-29 2021-02-21 大陸商北京字節跳動網絡技術有限公司 Lut與amvp之間的交互
EP3791586A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
JP7460617B2 (ja) 2018-06-29 2024-04-02 北京字節跳動網絡技術有限公司 Lut更新条件
BR112020024142A2 (pt) 2018-06-29 2021-03-02 Beijing Bytedance Network Technology Co., Ltd. método para processamento de vídeo, aparelho para codificação de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório
TWI748202B (zh) 2018-07-02 2021-12-01 大陸商北京字節跳動網絡技術有限公司 Lamvr中取整和修剪的順序
WO2020013498A1 (ko) * 2018-07-13 2020-01-16 엘지전자 주식회사 컨텐츠 서비스 시스템에서 영상 서비스 처리 방법 및 그 장치
CN111064961B (zh) 2018-09-12 2023-06-09 北京字节跳动网络技术有限公司 视频处理方法和装置
WO2020143741A1 (en) 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Invoke of lut updating
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
CN113302937A (zh) 2019-01-16 2021-08-24 北京字节跳动网络技术有限公司 运动候选推导
CA3130472A1 (en) 2019-02-24 2020-08-27 Beijing Bytedance Network Technology Co., Ltd. Independent coding of palette mode usage indication
US10924750B2 (en) 2019-03-01 2021-02-16 Alibaba Group Holding Limited Palette size constraint in palette mode for video compression system
US11503311B2 (en) 2019-03-08 2022-11-15 Sony Group Corporation Hybrid palette-DPCM coding for image compression
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
CN117459744A (zh) 2019-07-20 2024-01-26 北京字节跳动网络技术有限公司 调色板模式使用指示的条件相关编解码
CN114145013B (zh) 2019-07-23 2023-11-14 北京字节跳动网络技术有限公司 调色板模式编解码的模式确定
WO2021018166A1 (en) * 2019-07-29 2021-02-04 Beijing Bytedance Network Technology Co., Ltd. Scanning order improvements for palette mode coding
US11206413B2 (en) * 2019-08-13 2021-12-21 Qualcomm Incorporated Palette predictor updates for local dual trees
WO2021061744A1 (en) * 2019-09-23 2021-04-01 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for quantization and de-quantization design in video coding

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022080A (ko) * 2008-06-25 2011-03-04 퀄컴 인코포레이티드 비디오 코딩에 대한 시간 압축에서의 프래그먼트된 기준
US20130195182A1 (en) * 2012-02-01 2013-08-01 General Instrument Corporation Simplification of significance map coding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040077921A (ko) 2002-02-01 2004-09-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 가변 길이 칼라 코드들로 팔레트화된 칼라 화상들의 압축
CN101317197B (zh) 2005-09-23 2012-10-03 喷流数据有限公司 对数字化彩色图像进行渐进编码的方法和系统
KR101059178B1 (ko) 2006-12-28 2011-08-25 니폰덴신뎅와 가부시키가이샤 영상 부호화 방법 및 복호방법, 그들의 장치, 그들의 프로그램을 기록한 기억매체
US8406573B2 (en) 2008-12-22 2013-03-26 Microsoft Corporation Interactively ranking image search results using color layout relevance
US9491491B2 (en) * 2011-06-03 2016-11-08 Qualcomm Incorporated Run-mode based coefficient coding for video coding
US9357185B2 (en) * 2011-11-08 2016-05-31 Qualcomm Incorporated Context optimization for last significant coefficient position coding
US9729875B2 (en) 2013-07-08 2017-08-08 Sony Corporation Palette coding mode
BR112016012417B1 (pt) 2013-12-18 2023-04-11 Hfi Innovation Inc Método e aparelho para inicialização e gerenciamento de paleta
GB2526337A (en) * 2014-05-21 2015-11-25 Canon Kk Method and apparatus for syntax element encoding in video coding and decoding
US10038915B2 (en) 2014-05-22 2018-07-31 Qualcomm Incorporated Escape sample coding in palette-based video coding
US11323733B2 (en) 2014-05-23 2022-05-03 Qualcomm Incorporated Predictor palette initialization in palette-based video coding
US10291940B2 (en) 2014-05-23 2019-05-14 Qualcomm Incorporated Coding runs with escape in palette-based video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110022080A (ko) * 2008-06-25 2011-03-04 퀄컴 인코포레이티드 비디오 코딩에 대한 시간 압축에서의 프래그먼트된 기준
US20130195182A1 (en) * 2012-02-01 2013-08-01 General Instrument Corporation Simplification of significance map coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BUGDAYCI D ET AL, AHG10: Improvements on palette coding, (JCTVC-Q0071-v2), JCT-VC of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 17th Meeting: Valencia, ES, (2014.03.28.)* *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019017562A1 (ko) * 2017-07-20 2019-01-24 삼성전자 주식회사 이미지의 에러 데이터를 보정하여 압축하기 위한 장치 및 그에 관한 방법
KR20190009911A (ko) * 2017-07-20 2019-01-30 삼성전자주식회사 이미지의 에러 데이터를 보정하여 압축하기 위한 장치 및 그에 관한 방법
US11451699B2 (en) 2017-07-20 2022-09-20 Samsung Electronics Co., Ltd. Device for correcting and compressing image error data, and method related thereto

Also Published As

Publication number Publication date
CA2947042A1 (en) 2015-11-26
BR112016027426B1 (pt) 2024-01-16
ES2746102T3 (es) 2020-03-04
EP3146726B1 (en) 2019-06-19
WO2015179827A1 (en) 2015-11-26
BR112016027426A2 (ko) 2017-08-15
HUE045219T2 (hu) 2019-12-30
JP2017520158A (ja) 2017-07-20
CN106464872B (zh) 2019-07-26
KR102416949B1 (ko) 2022-07-04
CN106464872A (zh) 2017-02-22
US10382749B2 (en) 2019-08-13
EP3146726A1 (en) 2017-03-29
US20150341635A1 (en) 2015-11-26
CA2947042C (en) 2023-02-21
JP6541692B2 (ja) 2019-07-10

Similar Documents

Publication Publication Date Title
KR101958534B1 (ko) 팔레트 기반 비디오 코딩에서 이스케이프를 갖는 런들의 코딩
KR102416949B1 (ko) 팔레트 기반 비디오 코딩에서 팔레트 인덱스에 기초한 런 값들의 코딩
KR102388221B1 (ko) 팔레트 기반 비디오 코딩에서의 예측자 팔레트 초기화
EP3350997B1 (en) Restriction of escape pixel signaled values in palette mode video coding
EP3178226B1 (en) Palette mode encoding and decoding design
KR102142181B1 (ko) 비디오 코딩에서의 팔레트 블록 사이즈에 대한 제한
WO2015191838A1 (en) Determining quantization parameter (qp) values and delta qp values for palette coded blocks in video coding
US9848198B2 (en) Diagonal copy for palette mode coding

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant