KR102245704B1 - 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙 - Google Patents

파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙 Download PDF

Info

Publication number
KR102245704B1
KR102245704B1 KR1020177011675A KR20177011675A KR102245704B1 KR 102245704 B1 KR102245704 B1 KR 102245704B1 KR 1020177011675 A KR1020177011675 A KR 1020177011675A KR 20177011675 A KR20177011675 A KR 20177011675A KR 102245704 B1 KR102245704 B1 KR 102245704B1
Authority
KR
South Korea
Prior art keywords
current
intra
picture
ctu
wpp
Prior art date
Application number
KR1020177011675A
Other languages
English (en)
Other versions
KR20170063885A (ko
Inventor
빈 리
지젱 수
Original Assignee
마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 filed Critical 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority to KR1020217010079A priority Critical patent/KR102330740B1/ko
Publication of KR20170063885A publication Critical patent/KR20170063885A/ko
Application granted granted Critical
Publication of KR102245704B1 publication Critical patent/KR102245704B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/55Motion estimation with spatial constraints, e.g. at image or region borders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Error Detection And Correction (AREA)

Abstract

다양한 혁신안은 파면 병렬 프로세싱("WPP")이 인에이블되는 경우, 인코더 또는 디코더에 의한 인트라 픽쳐 예측 모드, 예를 들면, 팔레트 예측 모드, 인트라 블록 카피 모드, 인트라 라인 카피 모드 및 인트라 스트링 카피 모드의 사용을 용이하게 한다. 예를 들면, 팔레트 코딩/디코딩 모드의 경우, 인코더 또는 디코더는 픽쳐의 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터를 사용하여 픽쳐의 현재 WPP 행의 최초 유닛에 대한 팔레트를 예측한다. 또는, 다른 예로, 인트라 카피 모드(예를 들어, 인트라 블록 카피 모드, 인트라 스트링 카피 모드, 인트라 라인 카피 모드)의 경우, 인코더는 WPP에 기인한 하나 이상의 제약을 시행하거나, 또는 디코더는 WPP에 기인한 하나 이상의 제약을 충족하는 인코딩된 데이터를 수신 및 디코딩한다.

Description

파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙{RULES FOR INTRA-PICTURE PREDICTION MODES WHEN WAVEFRONT PARALLEL PROCESSING IS ENABLED}
엔지니어는 디지털 비디오의 비트 레이트를 감소시키기 위해 압축(소스 코딩 또는 소스 인코딩으로도 또한 칭해짐)을 사용한다. 압축은 정보를 더 낮은 비트 레이트 형태로 변환하는 것에 의해 비디오 정보를 저장 및 송신하는 비용을 감소시킨다. 압축해제(decompression)(디코딩으로도 또한 칭해짐)는 압축된 형태로부터 원래의 정보의 버전을 재구성한다. "코덱"은 인코더/디코더 시스템이다.
지난 25년에 걸쳐, 다양한 비디오 코덱 표준이 채택되었는데, ITU-T H.261, H.262 (MPEG-2 또는 ISO/IEC 13818-2), H.263 및 H.264 (MPEG-4 AVC 또는 ISO/IEC 14496-10) 표준, MPEG-1 (ISO/IEC 11172-2) 및 MPEG-4 비주얼(ISO/IEC 14496-2) 표준, 및 SMPTE 421M(VC-1) 표준을 포함한다. 보다 최근에는, H.265/HEVC 표준(ITU-T H.265 또는 ISO/IEC 23008-2)이 승인되었다. (예를 들면, 스케일러블 비디오 코딩/디코딩을 위한, 샘플 비트 깊이 또는 크로마 샘플링 레이트의 관점에서 충실도가 더 높은 비디오의 코딩/디코딩을 위한, 스크린 캡쳐 컨텐츠를 위한, 또는 멀티뷰 코딩/디코딩을 위한) H.265/HEVC 표준에 대한 확장안이 현재 개발 중에 있다. 비디오 코덱 표준은 통상적으로, 인코딩된 비디오 비트스트림의 신택스(syntax)에 대한 옵션을 정의하고, 인코딩 및 디코딩에서 특정 피쳐가 사용되는 경우 비트스트림에서의 파라미터를 상술한다. 많은 경우에서, 비디오 코덱 표준은 또한, 디코딩에서의 일치하는 결과를 달성하기 위해 디코더가 수행해야 하는 디코딩 동작에 관한 상세를 제공한다. 코덱 표준 외에, 다양한 독점적 코덱 포맷은 인코딩된 비디오 비트스트림의 신택스에 대한 다른 옵션 및 대응하는 디코딩 동작을 정의한다.
파면 병렬 프로세싱("WPP")은 H.265/HEVC 표준에서 인코딩 및 디코딩을 위해 이용가능한 툴이다. WPP가 인에이블되는 경우, 픽쳐의 일부는 코딩 트리 유닛("CTU")으로 지칭되는 특수한 섹션의 행으로 분할된다. 인코딩 또는 디코딩 동안, CTU의 제 1 행은 좌측에서 우측으로 CTU별로 프로세싱될 수 있다. CTU의 제 2 행의 프로세싱(인코딩 또는 디코딩)은 CTU의 제 1 행에 대한 프로세싱의 완료를 대기할 필요가 없다. 그 대신, 제 2 행의 프로세싱은, 제 2 행의 최초 CTU를 프로세싱하는 경우에 사용되는 정보를 제공하는 제 1 행의 CTU 중 몇몇에 대한 프로세싱이 완료한 후 시작할 수 있다. 유사하게, CTU의 제 3 행의 프로세싱은 제 2 행의 CTU 중 몇몇에 대한 프로세싱이 완료된 후 시작할 수 있다. WPP는 CTU의 상이한 행의 병렬적 프로세싱을 용이하게 한다. 상이한 스레드 또는 프로세싱 코어가 스태거링된 시간-지연 기반으로 CTU의 상이한 행에 대한 프로세싱을 수행할 수 있다.
인트라 블록 카피(block copy; "BC")는 H.265/HEVC 확장안에 대해 개발 중에 있는 예측 모드이다. 인트라 BC 예측 모드의 경우, 픽쳐의 현재 블록의 샘플 값은, 동일 픽쳐에서 이전에 재구성된 샘플 값을 사용하여 예측된다. 블록 벡터(block vector; "BV")는, 현재 블록으로부터, 예측을 위해 사용되는 이전에 재구성된 샘플 값을 포함하는 픽쳐의 참조 블록까지의 변위를 나타낸다. BV는 비트스트림에서 시그널링된다. 인트라 BC 예측은 인트라 픽쳐 예측의 형태이다 - 픽쳐의 블록에 대한 인트라 BC 예측은 동일 픽쳐에서의 샘플 값 외에는 어떠한 샘플 값도 사용하지 않는다. 인트라 스트링 카피(string copy; "SC") 모드 및 인트라 라인 카피(line copy; "LC") 모드는 인트라 픽쳐 예측 모드의 다른 예이고, 이는 인트라 BC 모드와 같이, 예측을 위해 사용된 이전에 재구성된 샘플 값에서의 위치까지의 변위를 나타내기 위해 오프셋 값을 사용한다. 인트라 픽쳐 예측 모드의 다른 예인 팔레트(palette) 예측 모드는 코딩 유닛("CU")과 같은 섹션에서 컬러를 표현하기 위해 사용되는 팔레트를 예측한다. H.265/HEVC 표준에 대한 확장에 대해 현재 고유한 바와 같이, WPP가 인에이블되는 경우 다양한 인트라 픽쳐 예측 모드는 효과적으로 사용되지 않는다.
요약하면, 상세한 설명은 파면 병렬 프로세싱("WPP")이 인에이블되는 경우 인트라 픽쳐 예측 모드에 대해 시행된 규칙에서 혁신안을 제시한다. 비트스트림의 신택스 엘리먼트는 비디오 시퀀스, 픽쳐의 세트 또는 픽쳐에 대해 WPP가 인에이블되는지 여부를 나타낼 수 있다. 혁신안은 WPP가 인에이블되는 경우, 인코더 또는 디코더에 의한 인트라 픽쳐 예측 모드, 예를 들면, 팔레트 예측 모드, 인트라 블록 카피 모드, 인트라 라인 카피 모드 및 인트라 스트링 카피 모드의 사용을 용이하게 한다.
본원에서 설명되는 혁신안 중 일 양태에 따르면, 인코더는 WPP가 인에이블된 상태에서 픽쳐를 인코딩한다. 인코딩은 인코딩된 데이터를 생성한다. 팔레트 코딩 모드의 경우, 인코더는 픽쳐의 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터를 사용하여 픽쳐의 현재 WPP 행의 최초 유닛에 대한 팔레트를 예측한다. 인코더는 인코딩된 데이터를 비트스트림의 일부로서 출력한다.
대응하는 디코더는 인코딩된 데이터를 비트스트림의 일부로서 수신한다. 디코더는 WPP가 인에이블된 상태에서 인코딩된 데이터를 디코딩한다. 디코딩은 픽쳐를 재구성한다. 팔레트 디코딩 모드의 경우, 디코더는 픽쳐의 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터를 사용하여 픽쳐의 현재 WPP 행의 최초 유닛에 대한 팔레트를 예측한다.
본원에서 설명되는 혁신안 중 다른 양태에 따르면, 인코더는 WPP가 인에이블된 상태에서 픽쳐를 인코딩한다. 인코딩은 인코딩된 데이터를 생성한다. 인트라 카피 모드(예를 들면, 인트라 블록 카피 모드, 인트라 스트링 카피 모드, 인트라 라인 카피 모드)의 경우, 인코더는 WPP에 기인하는 하나 이상의 제약을 시행한다. 인코더는 인코딩된 데이터를 비트스트림의 일부로서 출력한다.
대응하는 디코더는 인코딩된 데이터를 비트스트림의 일부로서 수신한다. 인트라 카피 모드(예를 들면, 인트라 블록 카피 모드, 인트라 스트링 카피 모드, 인트라 라인 카피 모드)의 경우, 인코딩된 데이터는 WPP에 기인하는 하나 이상의 제약을 충족한다. 디코더는 WPP가 인에이블된 상태에서 인코딩된 데이터를 디코딩한다. 디코딩은 픽쳐를 재구성한다.
혁신안은, 한 방법의 일부로서, 그 방법을 수행하도록 구성되는 컴퓨팅 시스템의 일부로서 또는 컴퓨팅 시스템으로 하여금 그 방법을 수행하게 하기 위한 컴퓨터 실행가능 명령어를 저장하는 유형의(tangible) 컴퓨터 판독가능한 매체의 일부로서 구현될 수 있다. 다양한 혁신안은 조합하여 또는 개별적으로 사용될 수 있다. 본 요약은, 아래의 상세한 설명에서 추가로 설명되는 개념의 단순화된 형태의 선택을 도입하기 위해 제공된다. 본 요약은, 청구된 청구물의 핵심적인 특징 또는 필수적인 특징을 식별하려는 의도가 아니며, 청구된 청구물의 범주를 제한하기 위해 사용되도록 의도되는 것도 아니다. 본 발명의 상기 및 다른 목적, 피쳐, 및 이점은, 첨부의 도면을 참조로 진행하는 하기의 상세한 설명으로부터 더욱 명확하게 될 것이다.
도 1은 몇몇 설명된 실시형태가 구현될 수 있는 예시적인 컴퓨팅 시스템의 도면이다.
도 2a 및 도 2b는 몇몇 설명된 실시형태가 구현될 수 있는 예시적인 네트워크 환경의 도면이다.
도 3은 몇몇 설명된 실시형태가 연계하여 구현될 수 있는 예시적인 인코더 시스템의 도면이다.
도 4는 몇몇 설명된 실시형태가 연계하여 구현될 수 있는 예시적인 디코더 시스템의 도면이다.
도 5a 및 도 5b는 몇몇 설명된 실시형태가 연계하여 구현될 수 있는 예시적인 비디오 인코더를 예시하는 도면이다.
도 6은 몇몇 설명된 실시형태가 연계하여 구현될 수 있는 예시적인 비디오 디코더를 예시하는 도면이다.
도 7은 WPP의 타이밍을 예시하는 도면이고, 도 8은 WPP가 인에이블되는 경우 예측을 위해 사용될 수 있는 재구성된 컨텐츠를 예시하는 도면이다.
도 9 및 도 10은 몇몇 설명된 실시형태에 따른 팔레트 예측의 양태를 예시하는 도면이다.
도 11 및 도 12는 몇몇 설명된 실시형태에 따라 WPP가 인에이블되는 경우, 각각 팔레트 예측에 의한 인코딩 및 디코딩을 예시하는 흐름도이다.
도 13 및 도 14는 픽쳐의 현재 블록에 대한 인트라 블록 카피 예측의 예의 양태를 예시하는 도면이다.
도 15 및 도 16은 각각 인트라 라인 카피 예측 및 인트라 스트링 카피 예측의 예의 양상을 예시하는 도면이다.
도 17은 픽쳐의 유닛에 대한 예시적인 z 스캔 순서를 예시하는 도면이다.
도 18은 몇몇 설명된 실시형태에 따라, WPP가 인에이블되는 경우 인트라 카피 모드에 대한 참조 영역의 위치에 대한 제약의 예를 예시하는 도면이다.
도 19 및 도 20은 몇몇 설명된 실시형태에 따라 WPP가 인에이블되는 경우, 각각 인트라 카피 모드에 대해 시행된 규칙에 의한 인코딩 및 디코딩을 예시하는 흐름도이다.
상세한 설명은 파면 병렬 프로세싱("WPP")이 인에이블되는 경우 인트라 픽쳐 예측 모드에 대해 시행된 규칙에서 혁신안을 제시한다. 예를 들면, 혁신안 중 몇몇은 WPP가 인에이블된 경우 팔레트 코딩/디코딩 모드에 대한 팔레트의 예측에 관한 것이다. 다른 혁신안은 WPP가 인에이블되는 경우 (인트라 블록 카피 모드, 인트라 라인 카피 모드 또는 인트라 스트링 카피 모드와 같은) 인트라 카피 모드 동안 시행된 제약에 관한 것이다. 혁신안은 WPP가 인에이블되는 경우 인코더 또는 디코더에 의한 인트라 픽쳐 예측 모드의 사용을 용이하게 한다.
본원에서 설명되는 동작이 비디오 인코더 또는 비디오 디코더에 의해 수행되고 있는 것으로 여기저기에 설명되지만, 많은 경우에서, 동작은 다른 타입의 미디어 프로세싱 툴(예를 들면, 이미지 인코더, 이미지 디코더)에 의해 수행될 수 있다.
본원에서 설명되는 혁신안 중 몇몇은 H.265/HEVC 표준의 확장에 고유한 항목을 참조로 예시된다. 예를 들면, H.265/HEVC 표준에 대한 스크린 컨텐츠 코딩/디코딩 확장의 드래프트 버전 JCTVC-R1005 - 2014년 8월의 JCTVC-R1005_v2 "High Efficiency Video Coding (HEVC) Screen Content Coding: Draft 1"에 대한 참조가 이루어진다. 본원에서 설명되는 혁신안은 또한, 다른 표준 또는 포맷에 대해 구현될 수 있다.
본원에서 설명되는 혁신안 중 많은 것은, 스크린 캡쳐 컨텐츠와 같은 소정의 "인공적으로 생성된(artificially-created)" 비디오 컨텐츠를 인코딩할 때 레이트-왜곡 성능을 향상시킬 수 있다. 일반적으로, 스크린 캡쳐 비디오(스크린 컨텐츠 비디오로도 또한 칭해짐)는, 카메라 캡쳐 비디오 컨텐츠만을 대상으로 하는 것과는 반대로, 렌더링된 텍스트, 컴퓨터 그래픽, 애니메이션 생성 컨텐츠 또는, 컴퓨터 디스플레이로 렌더링될 때 캡쳐되는 다른 유사한 타입의 컨텐츠를 포함하는 비디오이다. 스크린 캡쳐 컨텐츠는 통상적으로 반복된 구조(예를 들면, 그래픽, 텍스트 문자)를 포함한다. 스크린 캡쳐 컨텐츠는, 일반적으로, 높은 크로마 샘플링 해상도를 갖는 포맷(예를 들면, YUV 4:4:4 또는 RGB 4:4:4)으로 인코딩되지만, 스크린 캡쳐 컨텐츠는 또한 더 낮은 크로마 샘플링 해상도(예를 들면, YUV 4:2:0)를 갖는 포맷으로 인코딩될 수도 있다. 스크린 캡쳐 컨텐츠의 인코딩/디코딩에 대한 공통 시나리오는, 원격 데스크탑 회의 및 미가공 비디오(natural video) 또는 다른 "혼합된 컨텐츠" 비디오 상의 그래픽 오버레이의 인코딩/디코딩을 포함한다. 본원에서 설명되는 혁신안 중 몇몇은 스크린 컨텐츠 비디오 또는 다른 인공적으로 생성된 비디오의 인코딩을 위해 적응된다. 이들 혁신안은 또한 미가공 비디오에 대해 사용될 수 있지만, 그 만큼 효과적이지는 않을 수도 있다.
보다 일반적으로는, 본원에서 설명되는 예에 대한 다양한 대안예도 가능하다. 예를 들면, 본원에서 설명되는 방법 중 몇몇은, 설명되는 방법 액트(act)의 순서를 변경하는 것에 의해, 소정의 방법 액트를 분할, 반복, 또는 생략하는 것에 의해, 등등에 의해 변경될 수 있다. 개시된 기술의 다양한 양태는 조합하여 또는 개별적으로 사용될 수 있다. 상이한 실시형태는 설명된 혁신안 중 하나 이상을 사용한다. 본원에서 설명되는 혁신안 중 몇몇은 배경에서 언급된 문제점 중 하나 이상을 중점적으로 다룬다. 통상적으로는, 주어진 기술/툴은 이러한 문제점 모두를 해결하지는 않는다.
I. 예시적인 컴퓨팅 시스템.
도 1은, 설명된 혁신안 중 몇몇이 구현될 수도 있는 적절한 컴퓨팅 시스템(100)의 일반화된 예를 예시한다. 컴퓨팅 시스템(100)은, 혁신안이 다양한 범용의 또는 특수 목적의 컴퓨팅 시스템에서 구현될 수도 있기 때문에, 사용 또는 기능성의 범위에 관해 어떠한 제한도 제시하도록 의도되지는 않는다.
도 1을 참조하면, 컴퓨팅 시스템(100)은 하나 이상의 프로세싱 유닛(110, 115) 및 메모리(120, 125)를 포함한다. 프로세싱 유닛(110, 115)은 컴퓨터 실행가능 명령어를 실행한다. 프로세싱 유닛은 범용 중앙 프로세싱 유닛(central processing unit; "CPU"), 주문형 반도체(application-specific integrated circuit; "ASIC")에서의 프로세서, 또는 임의의 다른 타입의 프로세서일 수 있다. 다중 프로세싱 시스템에서, 프로세싱 파워를 증가시키기 위해 다수의 프로세싱 유닛이 컴퓨터 실행가능 명령어를 실행한다. 예를 들면, 도 1은 중앙 프로세싱 유닛(110)뿐만 아니라 그래픽 프로세싱 유닛 또는 코프로세싱 유닛(co-processing unit)(115)을 도시한다. 유형의(tangible) 메모리(120, 125)는 휘발성 메모리(예를 들면, 레지스터, 캐시, RAM), 불휘발성 메모리(예를 들면, ROM, EEPROM, 플래시 메모리 등등), 또는 프로세싱 유닛(들)에 의해 액세스될 수 있는 이 둘의 어떤 조합일 수도 있다. 메모리(120, 125)는, WPP가 인에이블되는 경우 인트라 픽쳐 예측 모드에 대해 시행된 규칙에 대한 하나 이상의 혁신안을 구현하는 소프트웨어(180)를, 프로세싱 유닛(들)에 의한 실행에 적합한 컴퓨터 실행가능 명령어의 형태로 저장한다.
컴퓨팅 시스템은 추가적인 피쳐를 구비할 수도 있다. 예를 들면, 컴퓨팅 시스템(100)은 스토리지(140), 하나 이상의 입력 디바이스(150), 하나 이상의 출력 디바이스(160), 및 하나 이상의 통신 연결부(170)를 포함한다. 인터커넥션 메커니즘(interconnection mechanism)(도시되지 않음), 예컨대 버스, 컨트롤러, 또는 네트워크는 컴퓨팅 시스템(100)의 컴포넌트를 인터커넥트한다. 통상적으로, 오퍼레이팅 시스템 소프트웨어(도시되지 않음)는 컴퓨팅 시스템(100)에서 실행하는 다른 소프트웨어에 대한 동작 환경을 제공하고, 컴퓨팅 시스템(100)의 컴포넌트의 활동을 조화시킨다(coordinate).
유형의 스토리지(140)는 착탈식 또는 비착탈식일 수도 있고, 자기 디스크, 자기 테이프 또는 카세트, CD-ROM, DVD, 또는 정보를 저장하기 위해 사용될 수 있고 컴퓨팅 시스템(100) 내에서 액세스될 수 있는 임의의 다른 매체를 포함한다. 스토리지(140)는 WPP가 인에이블되는 경우 인트라 픽쳐 예측 모드에 대해 시행된 규칙에 대한 하나 이상의 혁신안을 구현하는 소프트웨어(180)에 대한 명령어를 저장한다.
입력 디바이스(들)(150)는 터치 입력 디바이스 예컨대 키보드, 마우스, 펜, 또는 트랙볼, 음성 입력 디바이스, 스캐닝 디바이스, 또는 컴퓨팅 시스템(100)으로 입력을 제공하는 다른 디바이스일 수도 있다. 비디오의 경우, 입력 디바이스(들)(150)는 카메라, 비디오 카드, TV 튜너 카드, 스크린 캡쳐 모듈, 또는 비디오 입력을 아날로그 또는 디지털 형태로 받아들이는 유사한 디바이스, 또는 비디오 입력을 컴퓨팅 시스템(100) 안으로 읽어들이는 CD-ROM 또는 CD-RW일 수도 있다. 출력 디바이스(들)(160)는 디스플레이, 프린터, 스피커, CD-라이터, 또는 컴퓨팅 시스템(100)으로부터의 출력을 제공하는 다른 디바이스일 수도 있다.
통신 연결부(들)(170)는 통신 매체를 통한 다른 컴퓨팅 엔티티로의 통신을 가능하게 한다. 통신 매체는 컴퓨터 실행가능 명령어, 오디오 또는 비디오 입력 또는 출력, 또는 변조된 데이터 신호에서의 다른 데이터와 같은 정보를 전달한다. 변조된 데이터 신호는, 자신의 특성 중 하나 이상을, 신호에서 정보를 인코딩하는 것과 같은 방식으로 설정하거나 변경한 신호를 의미한다. 비제한적인 예로서, 통신 매체는 전기적 캐리어, 광학적 캐리어, RF 캐리어, 또는 다른 캐리어를 사용할 수 있다.
혁신안은 컴퓨터 판독가능한 매체의 일반적 맥락에서 설명될 수 있다. 컴퓨터 판독가능한 매체는, 컴퓨팅 환경 내에서 액세스될 수 있는 임의의 이용가능한 유형의 매체이다. 비제한적인 예로서, 컴퓨팅 시스템(100)과 관련하여, 컴퓨터 판독가능한 매체는 메모리(120, 125), 스토리지(140), 및 상기 중 임의의 것의 조합을 포함한다.
혁신안은, 컴퓨팅 시스템에서 타겟인 실제 또는 가상의 프로세서 상에서 실행되고 있는, 프로그램 모듈에 포함되는 것과 같은 컴퓨터 실행가능 명령어의 일반적 맥락에서 설명될 수 있다. 일반적으로, 프로그램 모듈은, 특정한 태스크를 수행하거나 또는 특정한 추상 데이터 타입을 구현하는 루틴, 프로그램, 라이브러리, 오브젝트, 클래스, 컴포넌트, 데이터 구조 등등을 포함한다. 프로그램 모듈의 기능성은 다양한 실시형태에서 소망되는 바에 따라 프로그램 모듈 사이에서 분할되거나 또는 결합될 수도 있다. 프로그램 모듈에 대한 컴퓨터 실행가능 명령어는 로컬 컴퓨팅 시스템 또는 분산형 컴퓨팅 시스템 내에서 실행될 수도 있다.
용어 "시스템" 및 "디바이스"는 본원에서 상호교환적으로 사용된다. 문맥상 그렇지 않다고 명확하게 나타내지 않는 한, 어떠한 용어도 컴퓨팅 디바이스 또는 컴퓨팅 시스템의 타입에 대해 아무런 제한도 내포하지 않는다. 일반적으로, 컴퓨팅 시스템 또는 컴퓨팅 디바이스는 로컬이거나 또는 분산될 수도 있으며, 본원에서 설명되는 기능성을 구현하는 소프트웨어와의 특수 목적의 하드웨어 및/또는 범용 하드웨어의 임의의 조합을 포함할 수 있다.
개시된 방법은 또한, 개시된 방법 중 임의의 것을 수행하도록 구성되는 특수한 컴퓨팅 하드웨어를 사용하여 구현될 수 있다. 예를 들면, 개시된 방법은, 개시된 방법 중 임의의 것을 구현하도록 특별하게 설계되거나 구성되는 집적 회로(예를 들면, ASIC(예컨대 ASIC 디지털 신호 프로세싱 유닛(digital signal process unit; "DSP"), 그래픽 프로세싱 유닛(graphics processing unit; "GPU"), 또는 프로그래머블 로직 디바이스(programmable logic device; "PLD"), 예컨대 필드 프로그래머블 게이트 어레이(field programmable gate array; "FPGA")))에 의해 구현될 수 있다.
표현 때문에, 상세한 설명은, 컴퓨팅 시스템에서의 컴퓨터 동작을 설명하기 위해, "결정한다" 및 "사용한다"와 같은 용어를 사용한다. 이들 용어는 컴퓨터에 의해 수행되는 동작에 대한 하이 레벨의 추상개념이며 사람에 의해 수행되는 행위와 혼돈되어선 안된다. 이들 용어에 대응하는 실제 컴퓨터 동작은 구현예에 따라 달라진다.
II. 예시적인 네트워크 환경
도 2a 및 도 2b는 비디오 인코더(220) 및 비디오 디코더(270)를 포함하는 예시적인 네트워크 환경(201, 202)을 도시한다. 인코더(220) 및 디코더(270)는 적절한 통신 프로토콜을 사용하여 네트워크(250)를 통해 연결된다. 네트워크(250)는 인터넷 또는 다른 컴퓨터 네트워크를 포함할 수 있다.
도 2a에서 도시되는 네트워크 환경(201)에서, 각각의 실시간 통신(real-time communication; "RTC") 툴(210)은 양방향 통신을 위해 인코더(220) 및 디코더(270) 둘 다를 포함한다. 주어진 인코더(220)는, H.265/HEVC 표준, SMPTE 421M 표준, ISO-IEC 14496-10 표준(H.264 또는 AVC로 또한 알려짐), 다른 표준, 또는 독점적 포맷의 변형안 또는 확장안을 따르는 출력을 생성할 수 있는데, 대응하는 디코더(270)가 인코더(220)로부터 인코딩된 데이터를 받아들이게 된다. 양방향 통신은 화상 회의, 영상 전화, 또는 다른 양자간 또는 다자간 통신 시나리오의 일부일 수 있다. 도 2a의 네트워크 환경(201)이 두 개의 실시간 통신 툴(210)을 포함하지만, 네트워크 환경(201)은, 대신, 다자간 통신(multiparty communication)에 참여하는 세 개 이상의 실시간 통신 툴(210)을 포함할 수 있다.
실시간 통신 툴(210)은 인코더(220)에 의한 인코딩을 관리한다. 도 3은 실시간 통신 툴(210)에 포함될 수 있는 예시적인 인코더 시스템(300)을 도시한다. 대안적으로, 실시간 통신 툴(210)은 다른 인코더 시스템을 사용한다. 실시간 통신 툴(210)은 또한 디코더(270)에 의한 디코딩을 관리한다. 도 4는 실시간 통신 툴(210)에 포함될 수 있는 예시적인 디코더 시스템(400)을 도시한다. 대안적으로, 실시간 통신 툴(210)은 다른 디코더 시스템을 사용한다.
도 2b에서 도시되는 네트워크 환경(202)에서, 인코딩 툴(212)은, 디코더(270)를 포함하는 다수의 재생 툴(214)로 전달하기 위해 비디오를 인코딩하는 인코더(220)를 포함한다. 단방향 통신은, 비디오 감시 시스템, 웹 카메라 모니터링 시스템, 원격 데스크탑 회의 프리젠테이션 또는 비디오가 인코딩되어 한 장소에서 하나 이상의 다른 장소로 전송되는 다른 시나리오에 대해 제공될 수 있다. 도 2b의 네트워크 환경(202)이 두 개의 재생 툴(214)을 포함하지만, 네트워크 환경(202)은 더 많은 또는 더 적은 재생 툴(214)을 포함할 수 있다. 일반적으로, 재생 툴(214)은, 재생 툴(214)이 수신할 비디오의 스트림을 결정하기 위해 인코딩 툴(212)과 통신한다. 재생 툴(214)은 스트림을 수신하고, 수신된 인코딩된 데이터를 적절한 기간 동안 버퍼링하고, 디코딩 및 재생을 시작한다.
도 3은 인코딩 툴(212)에 포함될 수 있는 예시적인 인코더 시스템(300)을 도시한다. 대안적으로, 인코딩 툴(212)은 다른 인코더 시스템을 사용한다. 인코딩 툴(212)은 또한, 하나 이상의 재생 툴(214)과의 연결을 관리하기 위한 서버측 컨트롤러 로직을 포함할 수 있다. 도 4는, 재생 툴(214)에 포함될 수 있는 예시적인 디코더 시스템(400)을 도시한다. 대안적으로, 재생 툴(214)은 다른 디코더 시스템을 사용한다. 재생 툴(214)은 또한, 인코딩 툴(212)과의 연결을 관리하기 위한 클라이언트측 컨트롤러 로직을 포함할 수 있다.
III. 예시적인 인코더 시스템.
도 3은 몇몇 설명된 실시형태가 연계하여 구현될 수도 있는 예시적인 인코더 시스템(300)의 블록도이다. 인코더 시스템(300)은, 다수의 인코딩 모드 예컨대 실시간 통신을 위한 로우 레이턴시(low-latency) 인코딩 모드, 트랜스코딩 모드, 및 파일 또는 스트림으로부터 재생용 미디어를 생성하기 위한 더 높은 레이턴시의 인코딩 모드 중 임의의 것에서 동작할 수 있는 범용 인코딩 툴일 수 있거나, 또는 인코더 시스템(300)은 하나의 이러한 인코딩 모드에 대해 적응되는 특수 목적의 인코딩 툴일 수 있다. 인코더 시스템(300)은 특정한 타입의 컨텐츠(예를 들면, 스크린 캡쳐 컨텐츠)의 인코딩을 위해 적응될 수 있다. 인코더 시스템(300)은 오퍼레이팅 시스템 모듈의 일부로서, 애플리케이션 라이브러리의 일부로서, 독립형 애플리케이션의 일부로서 또는 특수 목적 하드웨어를 사용하여 구현될 수 있다. 종합하면, 인코더 시스템(300)은 비디오 소스(310)로부터 소스 비디오 픽쳐(311)의 시퀀스를 수신하고 인코딩된 데이터를 채널(390)로의 출력으로서 생성한다. 채널로 출력되는 인코딩된 데이터는, WPP가 인에이블되는 경우 인트라 픽쳐 예측 모드에 대해 시행된 규칙을 사용하여 인코딩된 컨텐츠를 포함할 수 있다.
비디오 소스(310)는 카메라, 튜너 카드, 저장 매체, 스크린 캡쳐 모듈, 또는 다른 디지털 비디오 소스일 수 있다. 비디오 소스(310)는, 예를 들면, 초당 30프레임의 프레임 레이트에서 비디오 픽쳐의 시퀀스를 생성한다. 본원에서 사용되는 바와 같이, 용어 "픽쳐"는 일반적으로, 소스, 코딩된 또는 재구성된 이미지 데이터를 지칭한다. 순차 스캔 비디오(progressive-scan video)의 경우, 픽쳐는 순차 스캔 비디오 프레임이다. 인터레이스 방식의 비디오(interlaced video)의 경우, 예시적인 실시형태에서, 인터레이스 방식의 비디오 프레임은 인코딩 이전에 디인터레이스된다(de-interlaced). 대안적으로, 두 개의 상보적 인터레이스 방식의 비디오 필드가 단일의 비디오 프레임으로서 함께 인코딩되거나 또는 두 개의 별개로 인코딩된 필드로서 인코딩된다. 순차 스캔 비디오 프레임 또는 인터레이스 방식 스캔 비디오 프레임을 나타내는 것 외에, 용어 "픽쳐"는 단일의 짝을 이루지 않는 비디오 필드(single non-paired video field), 비디오 필드의 상보적 쌍, 주어진 시간에 비디오 오브젝트를 나타내는 비디오 오브젝트 플레인, 또는 더 큰 이미지에서의 주목(of interest) 영역을 나타낼 수 있다. 비디오 오브젝트 플레인 또는 영역은, 한 장면의 다수의 오브젝트 또는 영역을 포함하는 더 큰 이미지의 일부일 수 있다.
도달하는 소스 픽쳐(311)는, 다수의 픽쳐 버퍼 저장 영역(321, 322, …, 32n)을 포함하는 소스 픽쳐 임시 메모리 저장 영역(320)에 저장된다. 픽쳐 버퍼(321, 322 등등)는 소스 픽쳐 저장 영역(320)에 하나의 소스 프레임을 유지한다. 소스 픽쳐(311) 중 하나 이상이 픽쳐 버퍼(321, 322, 등등)에 저장된 이후, 픽쳐 선택기(330)는 소스 픽쳐 저장 영역(320)으로부터 개개의 소스 픽쳐를 선택한다. 인코더(340)로의 입력을 위해 픽쳐 선택기(330)에 의해 픽쳐가 선택되는 순서는, 비디오 소스(310)에 의해 픽쳐가 생성되는 순서와는 상이할 수도 있다, 예를 들면, 몇몇 나중의 픽쳐가 먼저 인코딩되는 것을 허용하기 위해 따라서 시간적으로 역방향의 예측(temporally backward prediction)을 용이하게 하기 위해, 몇몇 픽쳐의 인코딩은 순서에서 지연될 수도 있다. 인코더(340) 이전에, 인코더 시스템(300)은, 인코딩 이전에, 선택된 픽쳐(331)의 전처리(pre-processing)(예를 들면, 필터링)를 수행하는 전처리기(pre-processor)(도시되지 않음)를 포함할 수 있다. 전처리는 주 성분(예를 들면, 루마)과 부성분(예를 들면, 레드쪽으로의 그리고 블루쪽으로의 크로마 차이)으로의 컬러 공간 변환 및 인코딩을 위한 (예를 들면, 크로마 성분의 공간 해상도를 감소시키는) 재샘플링 프로세싱을 포함할 수 있다. 인코딩 이전에, 비디오는 YUV와 같은 컬러 공간으로 변환될 수도 있는데, 여기서 루마(Y) 성분의 샘플 값은 휘도 또는 강도(intensity) 값을 나타내고, 크로마(U, V) 성분의 샘플 값은 컬러 차이 값을 나타낸다. 컬러 차이 값(및 RGB와 같은 다른 컬러 공간으로부터 YUV 컬러 공간으로의/YUV 컬러 공간으로부터 RGB와 같은 다른 컬러 공간으로의 변환 동작)의 정확한 정의는 구현예에 의존한다. 일반적으로, 본원에서 사용되는 바와 같이, 용어 YUV는, 루마(또는 휘도) 성분 및 하나 이상의 크로마(또는 색차(chrominance)) 성분을 갖는 임의의 컬러 공간을 나타내는데, Y'UV, YIQ, Y'IQ 및 YDbDr뿐만 아니라 YCbCr 및 YCoCg와 같은 변형예를 포함한다. 크로마 샘플 값은 (예를 들면, YUV 4:2:0 포맷에 대해) 더 낮은 크로마 샘플링 레이트로 서브샘플링될 수도 있거나, 또는 크로마 샘플 값은 (예를 들면, YUV 4:4:4 포맷에 대해) 루마 샘플 값과 동일한 해상도를 가질 수도 있다. 또는 비디오는 다른 포맷(예를 들면, RGB 4:4:4 포맷, GBR 4:4:4 포맷 또는 BGR 4:4:4 포맷)으로 인코딩될 수 있다. 특히, 스크린 컨텐츠 비디오는 RGB 4:4:4 포맷, GBR 4:4:4 포맷 또는 BGR 4:4:4 포맷으로 인코딩될 수도 있다.
인코더(340)는, 코딩된 픽쳐(341)를 생성하기 위해, 선택된 픽쳐(331)를 인코딩하고 또한 메모리 관리 제어 동작(memory management control operation; "MMCO") 신호(342) 또는 참조 픽쳐 세트(reference picture set; "RPS") 정보를 생성한다. RPS는, 현재 픽쳐 또는 임의의 후속하는 픽쳐에 대한 모션 보상에서 참조를 위해 사용될 수도 있는 픽쳐의 세트이다. 현재 픽쳐가 인코딩된 첫 번째 픽쳐가 아니고, 자신의 인코딩 프로세스를 수행하고 있는 경우, 인코더(340)는, 디코딩된 픽쳐 임시 메모리 저장 영역(360)에 저장되어 있는 하나 이상의 이전에 인코딩된/디코딩된 픽쳐(369)를 사용할 수도 있다. 이렇게 저장된 디코딩된 픽쳐(369)는 현재 소스 픽쳐(331)의 컨텐츠의 인터 픽쳐 예측(inter-picture prediction)을 위한 참조 픽쳐로서 사용된다. MMCO/RPS 정보(342)는 디코더에게, 어떤 재구성된 픽쳐가 참조 픽쳐로서 사용될 수도 있는지를 나타내고, 따라서 픽쳐 저장 영역에 저장되어야 한다.
일반적으로, 인코더(340)는, 타일로의 구획화, 인트라 픽쳐 예측 추정 및 예측, 모션 추정 및 보상, 주파수 변환, 양자화 및 엔트로피 코딩과 같은 인코딩 태스크를 수행하는 다수의 인코딩 모듈을 포함한다. 인코더(340)에 의해 수행되는 정확한 동작은 압축 포맷에 의존하여 변할 수 있다. 출력된 인코딩된 데이터의 포맷은, H.265/HEVC 포맷, 윈도우 미디어 비디오(Windows Media Video) 포맷, VC-1 포맷, MPEG-x 포맷(예를 들면, MPEG-1, MPEG-2, 또는 MPEG-4), H.26x 포맷(예를 들면, H.261, H.262, H.263, H.264), 또는 다른 포맷의 변형안 또는 확장안일 수 있다.
인코더(340)는 픽쳐를 동일한 사이즈의 또는 상이한 사이즈의 다수의 타일로 구획할 수 있다. 예를 들면, 인코더(340)는, 픽쳐 경계와 함께, 픽쳐 내에서의 타일의 수평 및 수직 경계를 정의하는 타일 행(row) 및 타일 열(column)을 따라 픽쳐를 분할하는데, 이 경우 각각의 타일은 직사각형 영역이다. 타일은 종종 병렬 프로세싱을 위한 옵션을 제공하기 위해 사용된다. 픽쳐는 또한 하나 이상의 슬라이스로서 편제될(organized) 수 있는데, 이 경우 슬라이스는 전체 픽쳐 또는 픽쳐의 섹션일 수 있다. 슬라이스는 픽쳐의 다른 슬라이스와는 무관하게 디코딩될 수 있는데, 슬라이스가 픽쳐의 다른 슬라이스와는 무관하게 디코딩되는 것은 에러 복원성(error resilience)을 향상시킨다. 슬라이스 또는 타일의 컨텐츠는 인코딩 및 디코딩의 목적을 위해 블록 또는 샘플 값의 다른 세트로 더 구획된다. 특정 블록의 행(예를 들면, H.265/HEVC 표준에 따른 슬라이스의 코딩 트리 유닛의 행)은 아래에서 추가로 설명되는 바와 같이 WPP를 사용하여 병렬적으로 인코딩될 수 있다.
H.265/HEVC 표준에 따른 신택스의 경우, 인코더는 픽쳐(또는 슬라이스 또는 타일)의 컨텐츠를 코딩 트리 유닛으로 분할한다. 코딩 트리 유닛(coding tree unit; "CTU")은 루마 코딩 트리 블록(luma coding tree block; "CTB")으로 편제되는 루마 샘플 값 및 두 개의 크로마 CTB로 편제되는 대응하는 크로마 샘플 값을 포함한다. CTU(및 CTU의 CTB)의 사이즈는 인코더에 의해 선택된다. 루마 CTB는, 예를 들면, 64×64, 32×32 또는 16×16 루마 샘플 값을 포함할 수 있다. CTU는 하나 이상의 코딩 유닛을 포함한다. 코딩 유닛(coding unit; "CU")은 루마 코딩 블록(coding block; "CB") 및 두 개의 대응하는 크로마 CB를 구비한다. 예를 들면, 64×64 루마 CTB 및 두 개의 64×64 크로마 CTB를 갖는 CTU(YUV 4:4:4 포맷)는, 각각의 CU가 32×32 루마 CB 및 두 개의 32×32 크로마 CB를 포함하면서, 그리고 각각의 CU가 어쩌면 더 작은 CU로 더 분할되면서, 네 개의 CU로 분할될 수 있다. 또는, 다른 예로서, 64×64 루마 CTB 및 두 개의 32×32 크로마 CTB를 갖는 CTU(YUV 4:2:0 포맷)는, 각각의 CU가 32×32 루마 CB 및 두 개의 16×16 크로마 CB를 포함하면서, 그리고 각각의 CU가 어쩌면 더 작은 CU로 더 분할되면서, 네 개의 CU로 분할될 수 있다. CU의 가장 작은 허용가능한 사이즈(예를 들면, 8×8, 16×16)는 비트스트림에서 시그널링될 수 있다.
일반적으로, CU는 인터 또는 인트라와 같은 예측 모드를 갖는다. CU는 예측 정보(예컨대 예측 모드 상세, 변위 값 등등) 및/또는 예측 프로세싱을 시그널링하는 목적을 위한 하나 이상의 예측 유닛을 포함한다. 예측 유닛(prediction unit; "PU")은 루마 예측 블록(prediction block; "PB") 및 두 개의 크로마 PB를 구비한다. H.265/HEVC 표준에 따르면, 인트라 예측된 CU의 경우, CU가 최소 사이즈(예를 들면, 8×8)를 갖지 않는 한, PU는 CU와 동일한 사이즈를 갖는다. 그 경우, CU는 네 개의 더 작은 PU(예를 들면, 인트라 픽쳐 예측의 경우, 최소 CU 사이즈가 8×8이면 각각 4×4)로 분할될 수 있거나 또는 PU는, CU에 대한 신택스 엘리먼트에 의해 나타내어지는 바와 같이, 최소 CU 사이즈를 가질 수 있다. 그러나, 인트라 BC 예측에서 사용되는 대칭 또는 비대칭 구획의 경우, 더 큰 CU는 다수의 PU로 분할될 수 있다.
CU는 또한 잔차(residual) 코딩/디코딩의 목적을 위해 하나 이상의 변환 유닛을 갖는데, 변환 유닛(transform unit; "TU")은 루마 변환 블록(transform block; "TB") 및 두 개의 크로마 TB를 갖는다. 인트라 예측된 CU에서의 PU는 단일의 TU(사이즈에서 PU와 동일) 또는 다수의 TU를 포함할 수도 있다. 인코더는 비디오를 CTU, CU, PU, TU 등등으로 구획하는 방법을 결정한다.
H.265/HEVC 구현예에서, 슬라이스는 단일의 슬라이스 세그먼트(독립 슬라이스 세그먼트)를 포함할 수 있거나 또는 다수의 슬라이스 세그먼트(독립 슬라이스 세그먼트 및 하나 이상의 종속 슬라이스 세그먼트)로 분할될 수 있다. 슬라이스 세그먼트는, 단일의 네트워크 추상화 레이어(network abstraction layer; "NAL") 유닛에 포함되는, 타일 스캔에서 연속적으로 순서가 정해지는 정수 개수의 CTU이다. 독립 슬라이스 세그먼트의 경우, 슬라이스 세그먼트 헤더는 독립 슬라이스 세그먼트에 적용되는 신택스 엘리먼트의 값을 포함한다. 종속 슬라이스 세그먼트의 경우, 잘려진 슬라이스 세그먼트 헤더는 그 종속 슬라이스 세그먼트에 적용되는 신택스 엘리먼트의 몇몇 값을 포함하고, 종속 슬라이스 세그먼트에 대한 다른 신택스 엘리먼트의 값은 디코딩 순서에서 선행하는 독립 슬라이스 세그먼트에 대한 값으로부터 추론된다.
본원에서 사용되는 바와 같이, 용어 "블록"은, 상황에 따라, 매크로블록, 잔차 데이터 유닛, 또는 CB, PB 또는 TB, 또는 샘플 값의 몇몇 다른 세트를 나타낼 수 있다. 용어 "유닛"은 매크로블록, CTU, CU, PU, TU 또는 블록의 몇몇 다른 세트를 나타낼 수 있거나 또는 문맥에 따라 단일 블록을 나타낼 수 있다.
도 3을 참조하면, 인코더는 픽쳐(331)에서 다른 이전에 재구성된 샘플 값으로부터의 예측의 관점에서 소스 픽쳐(331)의 인트라 코딩된 블록, 라인 또는 스트링을 표현한다. 인트라 카피 예측의 경우, 인트라 픽쳐 추정기는 현재 블록, 라인 또는 스트링으로부터, 다른 이전에 재구성된 샘플 값에서의 위치까지의 변위를 추정한다. 픽쳐에서 샘플 값의 참조 블록, 라인 또는 스트링은 현재 블록, 라인 또는 스트링에 대한 예측 값을 생성하기 위해 사용된다. 예를 들면, 인트라 블록 카피("BC") 예측의 경우, 인트라 픽쳐 추정기는 현재 블록으로부터, 픽쳐에서 이전에 재구성된 샘플 값에서의 위치까지의 변위를 추정한다. 참조 블록은 픽쳐에서 현재 블록에 대한 BC-예측 값을 제공하는 샘플 값의 블록이다. 참조 블록은 (BV 추정에서 결정된) 블록 벡터("BV") 값으로 나타내어질 수 있다. 다른 예로, 인트라 라인 카피("LC") 예측의 경우, 인트라 픽쳐 추정기는 (현재 블록의) 현재 라인으로부터, 픽쳐에서 이전에 재구성된 샘플 값에서의 위치까지의 변위를 추정한다. 참조 라인은 픽쳐에서 현재 라인에 대한 LC-예측 값을 제공하는 샘플 값의 라인이다. 참조 라인은 현재 라인으로부터 참조 라인까지의 변위를 나타내는 오프셋 값으로 나타내어질 수 있다. 다른 예로, 인트라 스트링 카피("SC") 예측의 경우, 인트라 픽쳐 추정기는 (현재 블록의) 현재 스트링으로부터, 픽쳐에서 이전에 재구성된 샘플 값에서의 위치까지의 변위를 추정한다. 참조 스트링은 픽쳐에서 현재 스트링에 대한 SC-예측 값을 생성하기 위해 사용되는 일련의 샘플 값이다. 참조 스트링은 (현재 스트링으로부터 참조 스트링까지의 변위를 나타내는) 오프셋 값 및 스트링 길이 값으로 나타내어질 수 있다. 구현예에 따라, 인코더는 입력 샘플 값 또는 재구성된 샘플 값(동일한 픽쳐에서 이전에 인코딩된 샘플 값)을 사용하여 블록, 라인 또는 스트링에 대한 오프셋 추정을 수행할 수 있다. WPP가 인에이블되는 경우, 인트라 픽쳐 추정기는 아래에서 설명되는 바와 같이, 참조 영역의 위치에 대한 제약과 일치하는 (예를 들면, 인트라 BC 예측에서 BV 값에 대한 또는 인트라 SC 예측 또는 인트라 LC 예측에서 오프셋 값에 대한) 변위를 결정할 수 있다.
블록에 대한 인트라 공간 예측의 경우, 인트라 픽쳐 추정기는, 이웃하는 재구성된 샘플 값의 블록으로의 외삽(extrapolation)을 추정한다.
인트라 픽쳐 추정기는 예측 정보(예컨대 인트라 BC 예측을 위한 BV 값, 인트라 LC 예측 또는 인트라 SC 예측을 위한 오프셋 값 또는 인트라 공간 예측을 위한 예측 모드(방향))를 출력할 수 있는데, 예측 정보는 엔트로피 코딩된다. 인트라 픽쳐 예측 예측기(intra-picture prediction predictor)는 인트라 예측 값을 결정하기 위해 예측 정보를 적용한다.
팔레트 코딩 모드의 경우, 인코더(340)는 팔레트를 사용하여 CU 또는 다른 유닛의 샘플 값 중 적어도 몇몇을 표현한다. 팔레트는 유닛에서 사용되는 컬러를 표현한다. 예를 들면, 팔레트는 인덱스 값 0, 1, 2, ..., p를 대응하는 컬러에 맵핑한다. 유닛의 인코딩 동안, 대략적인 인덱스 값이 유닛의 위치에서 샘플 값을 대체한다. 유닛의 희귀 값은 팔레트의 인덱스 값을 사용하는 대신에, 이스케이프(escape) 코드 값 및 문자 값을 사용하여 인코딩될 수 있다. 팔레트는 유닛마다 변할 수 있고, 팔레트를 특정하는 정보는 비트스트림에서 시그널링될 수 있다.
인코더(340)는, 소스 픽쳐(331)의 인터 픽쳐 코딩되고 예측된 블록을, 참조 픽쳐로부터의 예측의 관점에서 나타낸다. 모션 추정기는 하나 이상의 참조 픽쳐(369)에 대한 블록의 모션을 추정한다. 다수의 참조 픽쳐가 사용되는 경우, 다수의 참조 픽쳐는 상이한 시간적 방향 또는 동일한 시간적 방향으로부터 유래할 수 있다. 모션 보상된 예측 참조 영역은, 현재 픽쳐의 샘플 값의 블록에 대한 모션 보상된 예측 값을 생성하기 위해 사용되는, 참조 픽쳐(들)에서의 샘플 값의 영역이다. 모션 추정기는 모션 벡터("MV") 정보와 같은 모션 정보를 출력하는데, 모션 정보는 엔트로피 코딩된다. 모션 보상기는 참조 픽쳐(369)에 MV를 적용하여 인터 픽쳐 예측을 위한 모션 보상된 예측 값을 결정한다.
인코더는 블록의 예측 값(인트라 또는 인터)과 대응하는 원래의 값 사이의 차이를 (만약 존재한다면) 결정할 수 있다. 이들 예측 잔차 값은 또한, 주파수 변환(예를 들면, 주파수 변환이 스킵되지 않은 경우), 양자화 및 엔트로피 인코딩을 사용하여 인코딩된다. 예를 들면, 인코더(340)는, 비디오의 픽쳐, 타일, 슬라이스 및/또는 다른 부분에 대한 양자화 파라미터(quantization parameter; "QP")에 대한 값을 설정하고, 상응하여 변환 계수를 양자화한다. 인코더(340)의 엔트로피 코더는 양자화된 변환 계수 값뿐만 아니라 소정의 부가 정보(side information)(예를 들면, MV 정보, BV 정보, QP 값, 모드 결정, 파라미터 선택)를 압축한다. 통상적인 엔트로피 코딩 기술은, 지수 골룸 코딩(Exp-Golomb coding), 골룸 라이스 코딩(Golomb-Rice coding), 산술 코딩(arithmetic coding), 차분 코딩(differential coding), 허프만 코딩(Huffman coding), 런 길이 코딩(run length coding), 가변 길이 대 가변 길이(variable-length-to-variable-length; "V2V") 코딩, 가변 길이 대 고정 길이(variable-length-to-fixed-length; "V2F") 코딩, 렘펠 지브(Lempel-Ziv; "LZ") 코딩, 딕셔너리 코딩(dictionary coding), 확률 구간 구획화 엔트로피 코딩(probability interval partitioning entropy coding; "PIPE"), 및 상기의 조합을 포함한다. 엔트로피 코더는 상이한 종류의 정보에 대해 상이한 코딩 기술을 사용할 수 있고, 다수의 기술을 (예를 들면, 골룸 라이스 코딩 및 후속하여 산술 코딩을 적용하는 것에 의한) 조합으로 적용할 수 있고, 특정한 코딩 기술 내에서의 다수의 코드 테이블 중에서 선택할 수 있다. 몇몇 구현예에서, 주파수 변환은 스킵될 수 있다. 이 경우, 예측 잔차 값은 양자화될 수 있고 엔트로피 코딩될 수 있다. 팔레트 코딩 모드가 사용되는 경우, 엔트로피 코더는 팔레트 데이터를 인코딩할 수 있다. 인코더(340)는 아래에서 설명되는 바와 같이 팔레트 예측을 사용할 수 있다.
디코딩된 픽쳐에서 블록 경계 행 및/또는 열에 걸친 불연속부를 평활화하기 위해, 인코더(340)의 모션 보상 루프 내에 적응적 디블로킹 필터(adaptive deblocking filter)가 포함된다(즉, "루프 내(in-loop)" 필터링). 3루프 내 필터링 동작(in-loop filtering operation)으로서, 다른 필터링(예컨대 디링잉 필터링(de-ringing filtering), 적응적 루프 필터링(adaptive loop filtering; "ALF"), 또는 샘플 적응 오프셋(sample-adaptive offset; "SAO") 필터링; 도시되지 않음)이 대안적으로 또는 추가적으로 적용될 수 있다.
인코더(340)에 의해 생성되는 인코딩된 데이터는 비트스트림 신택스의 다양한 레이어에 대한 신택스 엘리먼트를 포함한다. H.265/HEVC 표준에 따른 신택스의 경우, 예를 들면, 픽쳐 파라미터 세트(picture parameter set; "PPS")는, 픽쳐와 관련될 수도 있는 신택스 엘리먼트를 포함하는 신택스 구조이다. PPS는 단일의 픽쳐에 대해 사용될 수 있거나, 또는 PPS는 한 시퀀스의 다수의 픽쳐에 대해 재사용될 수 있다. PPS는 통상적으로 픽쳐에 대한 인코딩된 데이터(예를 들면, PPS에 대한 하나의 네트워크 추상화 레이어(network abstraction layer; "NAL") 유닛, 및 픽쳐에 대한 인코딩된 데이터에 대한 하나 이상의 다른 NAL 유닛)와는 별개로 시그널링된다. 픽쳐에 대한 인코딩된 데이터 내에서, 신택스 엘리먼트는 픽쳐에 대해 어떤 PPS를 사용할지를 나타낸다. 마찬가지로, H.265/HEVC 표준에 따른 신택스의 경우, 시퀀스 파라미터 세트(sequence parameter set; "SPS")는, 픽쳐의 시퀀스와 관련될 수도 있는 신택스 엘리먼트를 포함하는 신택스 구조이다. 비트스트림은 단일의 SPS 또는 다수의 SPS를 포함할 수 있다. SPS는 통상적으로 시퀀스에 대한 다른 데이터와는 별개로 시그널링되고, 다른 데이터의 신택스 엘리먼트는 어떤 SPS를 사용할지를 나타낸다.
코딩된 픽쳐(341) 및 MMCO/RPS 정보(342)(또는, 픽쳐에 대한 종속성(dependency) 및 순서 구조(ordering structure)가 인코더(340)에서 이미 알려져 있기 때문에, MMCO/RPS 정보(342) 정보와 등가의 정보)는 디코딩 프로세스 에뮬레이터(350)에 의해 프로세싱된다. 디코딩 프로세스 에뮬레이터(350)는 디코더의 기능성 중 몇몇, 예를 들면, 참조 픽쳐를 재구성하는 디코딩 태스크를 구현한다. MMCO/RPS 정보(342)와 부합하는 방식에서, 디코딩 프로세스 에뮬레이터(350)는, 인코딩될 후속 픽쳐의 인터 픽쳐 예측에서의 참조 픽쳐로서의 사용을 위해, 주어진 코딩된 픽쳐(341)가 재구성되고 저장될 필요가 있는지의 여부를 결정한다. 코딩된 픽쳐(341)가 저장될 필요가 있다면, 디코딩 프로세스 에뮬레이터(350)는, 코딩된 픽쳐(341)를 수신하는 그리고 대응하는 디코딩된 픽쳐(351)를 생성하는 디코더에 의해 행해질 디코딩 프로세스를 모델링한다. 이렇게 함에 있어서, 디코딩된 픽쳐 저장 영역(360)에 저장되어 있던 디코딩된 픽쳐(들)(369)를 인코더(340)가 사용한 경우, 디코딩 프로세스 에뮬레이터(350)는 또한, 디코딩 프로세스의 일부로서, 저장 영역(360)으로부터의 디코딩된 픽쳐(들)(369)를 사용한다.
디코딩된 픽쳐 임시 메모리 저장 영역(360)은 다수의 픽쳐 버퍼 저장 영역(361, 362, …, 36n)을 포함한다. MMCO/RPS 정보(342)와 부합하는 방식에서, 디코딩 프로세스 에뮬레이터(350)는, 참조 픽쳐로서의 사용을 위해 인코더(340)에 의해 더 이상 필요로 되지 않는 픽쳐를 갖는 임의의 픽쳐 버퍼(361, 362, 등등)를 식별하기 위해, 저장 영역(360)의 컨텐츠를 관리한다. 디코딩 프로세스를 모델링한 이후, 디코딩 프로세스 에뮬레이터(350)는 이 방식으로 식별된 픽쳐 버퍼(361, 362 등등)에 새롭게 디코딩된 픽쳐(351)를 저장한다.
코딩된 픽쳐(341) 및 MMCO/RPS 정보(342)는 임시적인 코딩된 데이터 영역(temporary coded data area; 370)에 버퍼링된다. 코딩된 데이터 영역(370)에 집성되는 코딩된 데이터는, 기본 코딩된 비디오 비트스트림의 신택스의 일부로서, 하나 이상의 픽쳐에 대한 인코딩된 데이터를 포함한다. 코딩된 데이터 영역(370)에 집성되는 코딩된 데이터는 또한, 코딩된 비디오 데이터에 관련이 있는 미디어 메타데이터를 (예를 들면, 하나 이상의 보충적인 향상 정보(supplemental enhancement information; "SEI") 메시지 또는 비디오 사용가능성 정보(video usability information; "VUI") 메시지에서의 하나 이상의 파라미터로서) 포함할 수 있다.
임시적인 코딩된 데이터 영역(370)으로부터의 집성된 데이터(371)는 채널 인코더(380)에 의해 프로세싱된다. 채널 인코더(380)는, 미디어 스트림으로서의 송신 또는 저장을 위해, 집성된 데이터를 (예를 들면, ITU-T H.222.0 | ISO/IEC 13818-1과 같은 미디어 프로그램 스트림 또는 전송 스트림 포맷 또는 IETF RFC 3550과 같은 인터넷 실시간 전송 프로토콜 포맷에 따라) 패킷화할 수 있고/있거나 멀티플렉싱할 수 있는데, 이 경우, 채널 인코더(380)는 신택스 엘리먼트를 미디어 송신 스트림의 신택스의 일부로서 추가할 수 있다. 또는, 채널 인코더(380)는, 파일로서의 저장을 위해, 집성된 데이터를 (예를 들면, ISO/IEC 14496-12와 같은 미디어 컨테이너 포맷에 따라) 편제할 수 있는데, 이 경우, 채널 인코더(380)는 신택스 엘리먼트를 미디어 저장 파일의 신택스의 일부로서 추가할 수 있다. 또는, 보다 일반적으로는, 채널 인코더(380)는 하나 이상의 미디어 시스템 멀티플렉싱 프로토콜 또는 전송 프로토콜을 구현할 수 있는데, 이 경우, 채널 인코더(380)는 신택스 엘리먼트를 프로토콜(들)의 신택스의 일부로서 추가할 수 있다. 채널 인코더(380)는 채널(390)로 출력을 제공하는데, 채널(390)은 출력에 대한 저장, 통신 연결, 또는 다른 채널을 나타낸다. 채널 인코더(380) 또는 채널(390)은 또한, 예를 들면, 순방향 에러 정정(forward-error correction; "FEC") 인코딩 및 아날로그 신호 변조를 위해, 다른 엘리먼트(도시되지 않음)를 포함할 수도 있다.
IV. 예시적인 디코더 시스템.
도 4은 몇몇 설명된 실시형태가 연계하여 구현될 수도 있는 예시적인 디코더 시스템(400)의 블록도이다. 디코더 시스템(400)은, 다수의 디코딩 모드 예컨대 실시간 통신을 위한 로우 레이턴시 디코딩 모드 및 파일 또는 스트림으로부터의 미디어 재생을 위한 더 높은 레이턴시의 디코딩 모드 중 임의의 것에서 동작할 수 있는 범용 디코딩 툴일 수 있거나, 또는 그것은 하나의 이러한 디코딩 모드에 대해 적응되는 특수 목적의 디코딩 툴일 수 있다. 디코더 시스템(400)은 오퍼레이팅 시스템 모듈의 일부로서, 애플리케이션 라이브러리의 일부로서, 독립형 애플리케이션의 일부로서 또는 특수 목적 하드웨어를 사용하여 구현될 수 있다. 종합하면, 디코더 시스템(400)은 채널(410)로부터 코딩된 데이터를 수신하고 출력 목적지(490)에 대한 출력으로서 재구성된 픽쳐를 생성한다. 수신된 인코딩된 데이터는, WPP가 인에이블되는 경우 인트라 픽쳐 예측 모드에 대해 시행된 규칙을 사용하여 인코딩된 컨텐츠를 포함할 수 있다.
디코더 시스템(400)은 채널(410)을 포함하는데, 채널(410)은 코딩된 데이터에 대한 저장, 통신 연결, 또는 다른 채널을 입력으로서 나타낼 수 있다. 채널(410)은 채널 코딩된 코딩 데이터를 생성한다. 채널 디코더(420)는 코딩된 데이터를 프로세싱할 수 있다. 예를 들면, 채널 디코더(420)는, 미디어 스트림으로서의 송신 또는 저장을 위해, 집성된 데이터를 (예를 들면, ITU-T H.222.0 | ISO/IEC 13818-1과 같은 미디어 프로그램 스트림 또는 전송 스트림 포맷 또는 IETF RFC 3550과 같은 인터넷 실시간 전송 프로토콜 포맷에 따라) 패킷화해제할 수 있고/있거나 디멀티플렉싱할 수 있는데, 이 경우, 채널 디코더(420)는 미디어 송신 스트림의 신택스의 일부로서 추가된 신택스 엘리먼트를 파싱할 수 있다. 또는, 채널 디코더(420)는, 파일로서의 저장을 위해 집성되었던 코딩된 비디오 데이터를 (예를 들면, ISO/IEC 14496-12와 같은 미디어 컨테이너 포맷에 따라) 분리하는데, 이 경우, 채널 디코더(420)는 미디어 저장 파일의 신택스의 일부로서 추가된 신택스 엘리먼트를 파싱할 수 있다. 또는, 보다 일반적으로는, 채널 디코더(420)는 하나 이상의 미디어 시스템 디멀티플렉싱 프로토콜 또는 전송 프로토콜을 구현할 수 있는데, 이 경우, 채널 디코더(420)는 프로토콜(들)의 신택스의 일부로서 추가된 신택스 엘리먼트를 파싱할 수 있다. 채널(410) 또는 채널 디코더(420)는 또한, 예를 들면, FEC 디코딩 및 아날로그 신호 변조를 위해, 다른 엘리먼트(도시되지 않음)를 포함할 수도 있다.
채널 디코더(420)로부터 출력되는 코딩된 데이터(421)는, 충분한 양의 이러한 데이터가 수신될 때까지 임시적인 코딩된 데이터 영역(430)에 저장된다. 코딩된 데이터(421)는 코딩된 픽쳐(431) 및 MMCO/RPS 정보(432)를 포함한다. 코딩된 데이터 영역(430)의 코딩된 데이터(421)는, 기본 코딩된 비디오 비트스트림의 신택스의 일부로서, 하나 이상의 픽쳐에 대한 코딩된 데이터를 포함한다. 코딩된 데이터 영역(430)의 코딩된 데이터(421)는 또한, 인코딩된 비디오 데이터에 관련이 있는 미디어 메타데이터를 (예를 들면, 하나 이상의 SEI 메시지 또는 VUI 메시지에서의 하나 이상의 파라미터로서) 포함할 수 있다.
일반적으로, 코딩된 데이터 영역(430)은, 이러한 코딩된 데이터(421)가 디코더(450)에 의해 사용될 때까지, 코딩된 데이터(421)를 일시적으로 저장한다. 그때, MMCO/RPS 정보(432) 및 코딩된 픽쳐(431)에 대한 코딩된 데이터는 코딩된 데이터 영역(430)으로부터 디코더(450)로 전송된다. 디코딩이 진행함에 따라, 새로 코딩된 데이터가 코딩된 데이터 영역(430)에 추가되고 코딩된 데이터 영역(430)에 남아 있는 가장 오래된 코딩된 데이터는 디코더(450)로 전송된다.
디코더(450)는 코딩된 픽쳐(431)를 디코딩하여 대응하는 디코딩된 픽쳐(451)를 생성한다. 픽쳐는 동일한 사이즈의 또는 상이한 사이즈의 다수의 타일로 구획될 수 있다. 픽쳐는 또한 하나 이상의 슬라이스로 편제될 수 있다. 슬라이스 또는 타일의 컨텐츠는 블록 또는 샘플 값의 다른 세트로 더 구획될 수 있다. 픽쳐가 WPP가 인에이블된 상태에서(WPP를 사용하거나 또는 그렇지 않으면 디코딩 동안 WPP의 사용과 일치하는 방식으로) 인코딩되었다면, 특정 블록의 행(예를 들면, H.265/HEVC 표준에 따른 CTU의 행)은 아래에서 추가로 설명되는 바와 같이 WPP를 사용하여 병렬적으로 디코딩될 수 있다.
적절하다면, 자신의 디코딩 프로세스를 수행하고 있을 때, 디코더(450)는 하나 이상의 이전에 디코딩된 픽쳐(469)를, 인터 픽쳐 예측을 위한 참조 픽쳐로서 사용할 수도 있다. 디코더(450)는 이러한 이전에 디코딩된 픽쳐(469)를 디코딩된 픽쳐 임시 메모리 저장 영역(460)으로부터 판독한다. 일반적으로, 디코더(450)는, 타일의 엔트로피 디코딩, 인트라 픽쳐 예측, 모션 보상된 인터 픽쳐 예측, 역 양자화, 역 주파수 변환(스킵되지 않은 경우), 및 병합과 같은 디코딩 태스크를 수행하는 다수의 디코딩 모듈을 포함한다. 디코더(450)에 의해 수행되는 정확한 동작은 압축 포맷에 의존하여 변할 수 있다.
예를 들면, 디코더(450)는 압축된 픽쳐 또는 픽쳐의 시퀀스에 대한 인코딩된 데이터를 수신하고 디코딩된 픽쳐(451)를 포함하는 출력을 생성한다. 디코더(450)에서, 버퍼는 압축된 픽쳐에 대한 인코딩된 데이터를 수신하고, 적절한 시간에, 수신된 인코딩된 데이터를 엔트로피 디코더가 이용가능하게 만든다. 엔트로피 디코더는, 엔트로피 코딩된 양자화된 데이터뿐만 아니라 엔트로피 코딩된 부가 정보를 엔트로피 디코딩하는데, 통상적으로는, 인코더에서 수행된 엔트로피 인코딩의 역을 적용한다. 팔레트 디코딩 모드가 사용되는 경우, 엔트로피 디코더는 팔레트 데이터를 디코딩할 수 있다. 디코더(450)는 아래에서 설명되는 바와 같이 팔레트 예측을 사용할 수 있다.
모션 보상기는 하나 이상의 참조 픽쳐에 대해 모션 정보를 적용하여, 재구성되고 있는 픽쳐의 임의의 인터 코딩된 블록에 대한 모션 보상된 예측 값을 형성한다. 인트라 픽쳐 예측 모듈은 이웃하는 이전에 재구성된 샘플 값으로부터 현재 블록의 샘플 값을 공간적으로 예측할 수 있다. 또는 인트라 BC 예측, 인트라 LC 예측 또는 인트라 SC 예측의 경우, 인트라 픽쳐 예측 모듈은 변위 값으로 나타내어지는 픽쳐의 참조 블록, 라인 또는 스트링의 이전에 재구성된 샘플 값을 사용하여 현재 블록, 라인 또는 스트링의 샘플 값을 예측할 수 있다. 구체적으로는, 참조 블록/라인/스트링은 BV 값(인트라 BC 예측의 경우), 오프셋 값(인트라 LC 예측의 경우) 또는 오프셋 값 및 스트링 길이 값(인트라 SC 예측의 경우)으로 나타내어질 수 있다. WPP가 인에이블되는 경우, 아래에서 설명되는 바와 같이, (예를 들면, 인트라 BC 예측에서 BV 값에 대한 또는 인트라 SC 예측 또는 인트라 LC 예측에서 오프셋 값에 대한) 변위는 참조 영역의 위치에 대한 제약과 일치한다.
디코더(450)는 또한 예측 잔차 값을 재구성한다. 역 양자화기는 엔트로피 디코딩된 데이터를 역 양자화한다. 예를 들면, 디코더(450)는, 비트 스트림의 신택스 엘리먼트에 기초하여 비디오의 픽쳐, 타일, 슬라이스 및/또는 다른 부분에 대한 QP에 대한 값을 설정하고, 그에 따라 변환 계수를 역 양자화한다. 역 주파수 변환은 양자화된 주파수 도메인 데이터를 공간 도메인 데이터로 변환한다. 몇몇 구현예에서, 주파수 변환은 스킵될 수 있는데, 이 경우 역 주파수 변환도 또한 스킵된다. 주파수 변환이 스킵되어 역 주파수 변환도 또한 스킵되면, 예측 잔차 값은 엔트로피 디코딩되고 역 양자화된다. 인터 픽쳐 예측된 블록의 경우, 디코더(450)는 재구성된 예측 잔차 값을 모션 보상된 예측 값과 결합한다. 마찬가지로, 디코더(450)는 예측 잔차 값을 인트라 픽쳐 예측으로부터의 예측 값과 결합할 수 있다.
팔레트 디코딩 모드의 경우, 디코더(450)는 CU 또는 다른 유닛의 샘플 값 중 적어도 몇몇을 표현하는 팔레트를 사용한다. 팔레트는 인덱스 값을 대응하는 컬러에 맵핑한다. 디코딩 동안, 유닛의 위치에 대해, 팔레트로부터의 인덱스 값은 적절한 샘플 값으로 대체된다. 유닛에서 이스케이프 코딩된 값은 이스케이프 코드 값 및 문자 값을 사용하여 디코딩될 수 있다. 팔레트는 유닛마다 변할 수 있고, 팔레트를 특정하는 정보는 비트스트림에서 시그널링될 수 있다.
디코딩된 픽쳐(451)에서 블록 경계 행 및/또는 열에 걸친 불연속부를 평활화하기 위해, 비디오 디코더(450)의 모션 보상 루프 내에 적응적 디블로킹 필터가 포함된다. 루프 내 필터링 동작으로서, 다른 필터링(예컨대 디링잉 필터링, ALF, 또는 SAO 필터링; 도시되지 않음)이 대안적으로 또는 추가적으로 적용될 수 있다.
디코딩된 픽쳐 임시 메모리 저장 영역(460)은 다수의 픽쳐 버퍼 저장 영역(461, 462, …, 46n)을 포함한다. 디코딩된 픽쳐 저장 영역(460)은 디코딩된 픽쳐 버퍼의 예이다. 디코더(450)는, 디코딩된 픽쳐(451)를 내부에 저장할 수 있는 픽쳐 버퍼(461, 462 등등)를 식별하기 위해 MMCO/RPS 정보(432)를 사용한다. 디코더(450)는 그 픽쳐 버퍼에 디코딩된 픽쳐(451)를 저장한다.
출력 시퀀서(output sequencer; 480)는, 출력 순서에서 생성될 다음 픽쳐가 디코딩된 픽쳐 저장 영역(460)에서 이용가능할 때를 식별한다. 출력 순서에서 생성될 다음 픽쳐(481)가 디코딩된 픽쳐 저장 영역(460)에서 이용가능할 때, 다음 픽쳐(481)는 출력 시퀀서(480)에 의해 판독되고 출력 목적지(490)(예를 들면, 디스플레이)로 출력된다. 일반적으로, 디코딩된 픽쳐 저장 영역(460)으로부터 출력 시퀀서(480)에 의해 픽쳐가 출력되는 순서는, 픽쳐가 디코더(450)에 의해 디코딩되는 순서와는 상이할 수도 있다.
V. 예시적인 비디오 인코더.
도 5a 및 도 5b는 몇몇 설명된 실시형태가 연계하여 구현될 수 있는 일반화된 비디오 인코더(500)의 블록도이다. 인코더(500)는 현재 픽쳐를 입력 비디오 신호(505)로서 포함하는 비디오 픽쳐의 시퀀스를 수신하고 인코딩된 데이터를 코딩된 비디오 비트스트림(595)에서 출력으로서 생성한다.
인코더(500)는 블록 기반이며 구현예에 의존하는 블록 포맷을 사용한다. 블록은 상이한 스테이지에서, 예를 들면, 예측, 주파수 변환 및/또는 엔트로피 인코딩 스테이지에서, 추가로 세분된다(sub-divided). 예를 들면, 픽쳐는 64×64 블록, 32×32 블록 또는 16×16 블록으로 분할될 수 있는데, 이들은 종국에는 코딩 및 디코딩을 위해 샘플 값의 더 작은 블록으로 분할될 수 있다. H.265/HEVC 표준에 대한 인코딩의 구현예에서, 인코더는 픽쳐를 CTU(CTB), CU(CB), PU(PB) 및 TU(TB)로 구획한다.
인코더(500)는 인트라 픽쳐 코딩 및/또는 인터 픽쳐 코딩을 사용하여 픽쳐를 압축한다. 인코더(500)의 컴포넌트 중 많은 것은 인트라 픽쳐 코딩 및 인터 픽쳐 코딩 둘 다에 대해 사용된다. 이들 컴포넌트에 의해 수행되는 정확한 동작은, 압축되고 있는 정보의 타입에 의존하여 변할 수 있다.
타일화 모듈(tiling module; 510)은, 옵션적으로, 픽쳐를, 동일한 사이즈의 또는 상이한 사이즈의 다수의 타일로 구획한다. 예를 들면, 타일링 모듈(510)은, 픽쳐 경계와 함께, 픽쳐 내에서의 타일의 수평 및 수직 경계를 정의하는 타일 행 및 타일 열을 따라 픽쳐를 분할하는데, 이 경우 각각의 타일은 직사각형 영역이다. H.265/HEVC 구현예에서, 인코더(500)는 픽쳐를 하나 이상의 슬라이스로 구획하는데, 이 경우 각각의 슬라이스는 하나 이상의 슬라이스 세그먼트를 포함한다. 특정 블록의 행(예를 들면, H.265/HEVC 표준에 따른 슬라이스의 CTU의 행)은 아래에서 추가로 설명되는 바와 같이 WPP를 사용하여 병렬적으로 인코딩될 수 있다.
일반적인 인코딩 제어부(520)는 입력 비디오 신호(505)에 대한 픽쳐뿐만 아니라 인코더(500)의 다양한 모듈로부터 피드백(도시되지 않음)을 수신한다. 종합하면, 일반적인 인코딩 제어부(520)는, 인코딩 동안 코딩 파라미터를 설정하고 변경하기 위해, 제어 신호(도시되지 않음)를 다른 모듈(예컨대 타일화 모듈(510), 변환기/스케일러/양자화기(530), 스케일러/역변환기(535), 인트라 픽쳐 추정기(540), 모션 추정기(550) 및 인트라/인터 스위치)로 제공한다. 특히, 일반적인 인코딩 제어부(520)는 인코딩 동안 팔레트 예측, 인트라 BC 예측, 인트라 LC 예측 및 인트라 SC 예측을 사용할지의 여부 및 그 사용 방법을 결정할 수 있다. 일반적인 인코딩 제어부(520)는 또한, 인코딩 동안, 예를 들면, 레이트 왜곡 분석을 수행하는 동안 중간 결과를 평가할 수 있다. 일반적인 인코딩 제어부(520)는, 인코딩 동안 만들어진 결정을 나타내는 일반적인 제어 데이터(522)를 생성하고, 그 결과, 대응하는 디코더는 일관된 결정을 행할 수 있다. 일반적인 제어 데이터(522)는 헤더 포맷터(header formatter)/엔트로피 코더(590)로 제공된다.
현재 픽쳐가 인터 픽쳐 예측을 사용하여 예측되면, 모션 추정기(550)는, 하나 이상의 참조 픽쳐에 대한 입력 비디오 신호(505)의 현재 픽쳐의 샘플 값의 블록의 모션을 추정한다. 디코딩된 픽쳐 버퍼(570)는, 참조 픽쳐로서의 사용을 위해 하나 이상의 재구성된 이전에 코딩된 픽쳐를 버퍼링한다. 다수의 참조 픽쳐가 사용되는 경우, 다수의 참조 픽쳐는 상이한 시간적 방향 또는 동일한 시간적 방향으로부터 유래할 수 있다. 모션 추정기(550)는, MV 데이터와 같은 모션 데이터(552), 병합 모드 인덱스 값, 및 참조 픽쳐 선택 데이터를 부가 정보로서 생성한다. 모션 데이터(552)는 헤더 포맷터/엔트로피 코더(590)뿐만 아니라 모션 보상기(555)로 제공된다.
모션 보상기(555)는 MV를, 디코딩된 픽쳐 버퍼(570)로부터의 재구성된 참조 픽쳐(들)에 적용한다. 모션 보상기(555)는 현재 픽쳐에 대한 모션 보상된 예측치를 생성한다.
인코더(500) 내에서의 별개의 경로에서, 인트라 픽쳐 추정기(540)는, 입력 비디오 신호(505)의 현재 픽쳐의 샘플 값의 블록에 대한 인트라 픽쳐 예측을 수행하는 방법을 결정한다. 현재 픽쳐는 인트라 픽쳐 코딩을 사용하여 전적으로 또는 부분적으로 코딩된다. 현재 픽쳐의 재구성(538)의 값을 사용하여, 인트라 공간 예측에 대해, 인트라 픽쳐 추정기(540)는, 현재 픽쳐의 이웃하는 이전에 재구성된 샘플 값으로부터, 현재 픽쳐의 현재 블록의 샘플 값을 공간적으로 예측하는 방법을 결정한다.
또는, 인트라 카피 예측의 경우, 인트라 픽쳐 추정기(540)는 현재 블록, 라인 또는 스트링으로부터, 다른 이전에 재구성된 샘플 값에서의 위치까지의 변위를 추정한다. 픽쳐에서 샘플 값의 참조 블록, 라인 또는 스트링은 현재 블록, 라인 또는 스트링에 대한 예측 값을 생성하기 위해 사용된다. 예를 들면, 인트라 BC 예측의 경우, 인트라 픽쳐 추정기(540)는 현재 블록으로부터, BV 값으로 나타내어질 수 있는 참조 블록까지의 변위를 추정한다. 다른 예로, 인트라 LC 예측의 경우, 인트라 예측 추정기(540)는, (현재 블록의) 현재 라인으로부터, (현재 라인으로부터 참조 라인까지의 변위를 나타내는) 오프셋 값으로 나타내어질 수 있는 참조 라인까지의 변위를 추정한다. 다른 예로, 인트라 SC 예측의 경우, 인트라 픽쳐 추정기는, (현재 블록의) 현재 스트링으로부터, (현재 스트링으로부터 참조 스트링까지의 변위를 나타내는) 오프셋 값 및 스트링 길이 값으로 나타내어질 수 있는 참조 스트링까지의 변위를 추정한다. WPP가 인에이블되는 경우, 인트라 픽쳐 추정기(540)는 아래에서 설명되는 바와 같이, 참조 영역의 위치에 대한 제약과 일치하는 (예를 들면, 인트라 BC 예측에서 BV 값에 대한 또는 인트라 SC 예측 또는 인트라 LC 예측에서 오프셋 값에 대한) 변위를 결정할 수 있다.
구현예에 따라서, 인트라 픽쳐 추정기(540)는, 입력 샘플 값, 루프 내 필터링 이전의 재구성된 샘플 값, 또는 루프 내 필터링 이후의 재구성된 샘플 값을 사용하여 현재 블록, 라인 또는 스트링에 대한 오프셋 추정을 수행할 수 있다. 일반적으로, 오프셋 추정을 위해 입력 샘플 값 또는 필터링되지 않은 재구성된 샘플 값을 사용하는 것에 의해, 인트라 픽쳐 추정기(540)는 순차 프로세싱 병목현상(sequential-processing bottleneck)(순차 프로세싱 병목현상은, 오프셋 추정/인트라 카피 예측 이전에 참조 블록, 라인, 스트링 등등의 재구성된 샘플 값을 필터링하는 것으로부터 유래할 수도 있다)을 방지할 수 있다. 한편, 필터링되지 않은 재구성된 샘플 값을 저장하는 것은 추가적인 메모리를 사용한다. 또한, 루프 내 필터링이 오프셋 추정 이전에 적용되면, 현재 블록/라인/스트링이 디코딩된 이후 적용될 필터링 프로세스와 오프셋 추정/인트라 카피 예측을 위해 사용되고 있는 영역 사이에서 중첩하는 영향의 영역이 존재할 수도 있다. 이러한 경우, 오프셋 추정/인트라 카피 예측은 필터링 동작의 그 양태 이전에 적용될 것이다. 몇몇 구현예에서, 인코더는, 오프셋 추정/인트라 카피 예측 이전에 몇몇 루프 내 필터링 동작을 적용할 수 있고, 나중의 프로세싱 스테이지에서 추가적인 또는 대안적인 필터링을 수행할 수 있다.
인트라 픽쳐 추정기(540)는, 부가 정보로서, 인트라 예측이 공간 예측을 사용하는지, 인트라 BC 예측을 사용하는지, 인트라 LC 예측을 사용하는지 또는 인트라 SC 예측을 사용하는지의 여부를 나타내는 정보, 예측 모드 방향(인트라 공간 예측의 경우), BV 값(인트라 BC 예측의 경우), 오프셋 값(인트라 LC 예측의 경우) 또는 오프셋 값 및 길이 값(인트라 SC 예측의 경우)과 같은 인트라 예측 데이터(542)를 생성한다. 인트라 예측 데이터(542)는, 헤더 포맷터/엔트로피 코더(590)뿐만 아니라 인트라 픽쳐 예측기(545)에도 제공된다.
인트라 예측 데이터(542)에 따르면, 인트라 픽쳐 예측기(545)는, 현재 픽쳐의 이웃하는 이전에 재구성된 샘플 값으로부터, 현재 픽쳐의 현재 블록의 샘플 값을 공간적으로 예측한다. 또는, 인트라 카피 예측의 경우, 인트라 픽쳐 예측기(545)는, 참조 블록, 라인, 스트링, 또는 현재 블록, 라인, 스트링 등등에 대한 변위(BV 값, 오프셋 값 등등)에 의해 표현되는 다른 섹션의 이전에 재구성된 샘플 값을 사용하여 현재 블록, 라인, 스트링 또는 다른 섹션의 샘플 값을 예측한다. 일부 경우에서, BV 값(또는 다른 오프셋 값)은 예측된 값일 수 잇다. 다른 경우에서, BV 값(또는 다른 오프셋 값)은 자신의 예측된 값과 상이할 수 있는데, 이 경우 차이는 예측된 값과 BV 값(또는 다른 오프셋 값) 사이의 차이를 나타낸다. 인트라 SC 모드의 경우, 인트라 픽쳐 예측기(545)는 또한 현재 스트링의 샘플 값을 예측하는 경우 스트링 길이 값을 사용한다.
팔레트 코딩 모드의 경우, 인코더(500)는 팔레트를 사용하여 CU 또는 다른 유닛의 샘플 값 중 적어도 몇몇을 표현한다. 팔레트는 유닛에서 사용되는 컬러를 표현한다. 예를 들면, 팔레트는 인덱스 값 0, 1, 2, ..., p를 대응하는 컬러에 맵핑하고, 이는 RGB 4:4:4 포맷, BGR 4:4:4 포맷, GBR 4:4:4 포맷, YUV 4:4:4 포맷 또는 다른 포맷(컬러 공간, 컬러 샘플링 레이트)일 수 있다. 인덱스 값은 픽셀에 대한 RGB 트리플릿, BGR 트리플릿 또는 GBR 트리플릿을 표현할 수 있고, 여기서 픽셀은 코-로케이트된 샘플 값의 세트이다. 유닛의 인코딩의 경우, 인덱스 값이 유닛의 픽셀에서 샘플 값을 대체한다. 유닛의 희귀 값은 팔레트의 인덱스 값을 사용하는 대신에, 이스케이프(escape) 코드 값 및 문자 값을 사용하여 인코딩될 수 있다. 팔레트는 유닛마다 변할 수 있고, 팔레트를 특정하는 팔레트 데이터는 비트스트림에서 시그널링될 수 있다.
인트라/인터 스위치는, 주어진 블록에 대한 예측(558)이 모션 보상된 예측일 것인지 또는 인트라 픽쳐 예측일 것인지의 여부를 선택한다.
몇몇 예시적인 구현예에서, 팔레트 코딩 모드 또는 인트라 코딩 모드(인트라 BC 예측, 인트라 LC 예측 또는 인트라 SC 예측)에서 인코딩된 유닛에 대해 어떠한 잔차도 계산되지 않는다. 그 대신, 잔차 코딩은 스킵되고, 예측된 샘플 값이 재구성된 샘플 값으로 사용된다.
잔차 코딩이 스킵되지 않는 경우, 예측(558)의 블록과 입력 비디오 신호(505)의 원래의 현재 픽쳐의 대응하는 부분 사이의 차이는 (만약 있다면) 잔차(518)의 값을 제공한다. 현재 픽쳐의 재구성 동안, 잔차 값이 인코딩/시그널링되었다면, 재구성된 잔차 값은 예측치(558)와 결합되어 비디오 신호(505)로부터의 원래의 컨텐츠의 근사하는 또는 정확한 재구성치(538)를 생성한다. (손실성 압축에서, 몇몇 정보는 여전히 비디오 신호(505)로부터 상실된다.)
잔차 코딩의 일부로서, 변환기/스케일러/양자화기(530)에서, 주파수 변환이 스킵되지 않는 경우, 주파수 변환기는 공간 도메인 비디오 정보를 주파수 도메인(즉, 스펙트럼, 변환) 데이터로 변환한다. 블록 기반의 비디오 코딩을 위해, 주파수 변환기는, 예측 잔차 데이터(또는 예측(558)이 널(null)인 경우 샘플 값 데이터)의 블록에 대해, 이산 코사인 변환(discrete cosine transform; "DCT"), 그 정수 근사, 또는 다른 타입의 순방향 블록 변환(forward block transform)(예를 들어, 이산 사인 변환 또는 이산 사인 변환의 정수 근사)을 적용하여, 주파수 변환 계수의 블록을 생성하게 된다. 변환기/스케일러/양자화기(530)는 가변 블록 사이즈를 가지고 변환을 적용할 수 있다. 이 경우, 변환기/스케일러/양자화기(530)는, 현재 블록에 대한 잔차 값에 대해 어떤 블록 사이즈의 변환을 사용할지를 결정할 수 있다. 스케일러/양자화기는 변환 계수를 스케일링하고 양자화한다. 예를 들면, 양자화기는, 픽쳐 유닛 기반으로, 타일 유닛 기반으로, 슬라이스 유닛 기반으로, 블록 유닛 기반으로, 주파수 특정(frequency-specific) 기반으로 또는 다른 기반으로 변하는 양자화 스텝 사이즈를 갖는 데드 존 스칼라 양자화(dead-zone scalar quantization)를 주파수 도메인 데이터에 적용할 수 있다. 양자화된 변환 계수 데이터(532)는 헤더 포맷터/엔트로피 코더(590)에 제공된다. 주파수 변환이 스킵되면, 스케일러/양자화기는 예측 잔차 데이터(또는 예측치(558)가 널(null)인 경우 샘플 값 데이터)의 블록을 스케일링 및 양자화하여, 헤더 포맷터/엔트로피 코더(590)로 제공되는 양자화된 값을 생성할 수 있다.
잔차 값을 재구성하기 위해, 스케일러/역 변환기(535)에서, 스케일러/역 양자화기는, 양자화된 변환 계수에 관해 역 스케일링 및 역 양자화를 수행한다. 변환 스테이지가 스킵되지 않은 경우, 역 주파수 변환기는 역 주파수 변환을 수행하여, 재구성된 예측 잔차 값 또는 샘플 값의 블록을 생성한다. 변환 스테이지가 스킵된 경우, 역 주파수 변환도 또한 스킵된다. 이 경우, 스케일러/역 양자화기는 예측 잔차 데이터(또는 샘플 값 데이터)의 블록에 대해 역 스케일링 및 역 양자화를 수행하여, 재구성된 값을 생성할 수 있다. 잔차 값이 인코딩/시그널링되었다면, 인코더(500)는 재구성된 잔차 값을 예측(558)의 값(예를 들면, 모션 보상된 예측 값, 인트라 픽쳐 예측 값)과 결합하여 재구성치(538)를 형성한다. 잔차 값이 인코딩/시그널링되지 않은 경우, 인코더(500)는 예측(558)의 값을 재구성치(538)로서 사용한다.
인트라 픽쳐 예측의 경우, 재구성(538)의 값은 인트라 픽쳐 추정기(540) 및 인트라 픽쳐 예측기(545)로 다시 공급될 수 있다. 또한, 재구성(538)의 값은 후속하는 픽쳐의 모션 보상된 예측에 대해 사용될 수 있다. 재구성(538)의 값은 추가로 필터링될 수 있다. 필터링 제어부(560)는, 비디오 신호(505)의 주어진 픽쳐에 대해, 재구성(538)의 값에 관한 디블록 필터링 및 샘플 적응 오프셋(sample adaptive offset; "SAO") 필터링을 수행하는 방법을 결정한다. 필터링 제어부(560)는 필터 제어 데이터(562)를 생성하는데, 필터 제어 데이터(562)는 헤더 포맷터/엔트로피 코더(590) 및 병합기/필터(들)(565)로 제공된다.
병합기/필터(들)(565)에서, 인코더(500)는 상이한 타일로부터의 컨텐츠를 픽쳐의 재구성된 버전으로 병합한다. 인코더(500)는, 픽쳐에서의 경계에 걸친 불연속부를 적응적으로 평활화하기 위해, 필터 제어 데이터(562) 및 필터 적응을 위한 규칙에 따라 디블록 필터링 및 SAO 필터링을 선택적으로 수행한다. 다른 필터링(예컨대 디링잉 필터링 또는 ALF; 도시되지 않음)이 대안적으로 또는 추가적으로 적용될 수 있다. 타일 경계는, 인코더(500)의 설정에 의존하여, 선택적으로 필터링될 수 있거나 또는 전혀 필터링되지 않을 수도 있고, 인코더(500)는 이러한 필터링이 적용되었는지 또는 그렇지 않은지의 여부를 나타내기 위해 코딩된 비트스트림 내에 신택스 엘리먼트를 제공할 수도 있다. 디코딩된 픽쳐 버퍼(570)는, 후속하는 모션 보상된 예측에서의 사용을 위해 재구성된 현재 픽쳐를 버퍼링한다.
헤더 포맷터/엔트로피 코더(590)는, 일반적인 제어 데이터(522), 양자화된 변환 계수 데이터(532), 인트라 예측 데이터(542), 모션 데이터(552), 및 필터 제어 데이터(562)를 포맷하고 및/또는 엔트로피 코딩한다. 모션 데이터(552)의 경우, 헤더 포맷터/엔트로피 코더(590)는 병합 모드 인덱스 값을 선택 및 엔트로피 코딩할 수 있거나, 또는 디폴트 MV 예측자가 사용될 수 있다. 몇몇 경우에서, 헤더 포맷터/엔트로피 코더(590)는 또한, (MV 값에 대한 MV 예측자를 기준으로 하는) MV 값에 대한 MV 차이를 결정하고, 그 MV 차이를, 예를 들면, 콘텍스트 적응 이진 산술 코딩(context-adaptive binary arithmetic coding)을 사용하여 엔트로피 코딩한다. 인트라 예측 데이터(542)의 경우, BV 값(또는 다른 오프셋 값)은 예측을 사용하여 인코딩될 수 있다. 예측은 디폴트 예측자(예를 들면, 하나 이상의 이웃 블록으로부터의 BV 값 또는 다른 오프셋 값)를 사용할 수 있다. 다수의 예측자가 가능한 경우, 예측자 인덱스는, BV 값(또는 다른 오프셋 값)의 예측을 위해 다수의 예측자 중 어떤 것을 사용할지를 나타낼 수 있다. 헤더 포맷터/엔트로피 코더(590)는 (인트라 카피 예측을 위해) 예측자 인덱스 값을 선택 및 엔트로피 코딩할 수 있거나, 또는 디폴트 예측자가 사용될 수 있다. 몇몇 경우에서, 헤더 포맷터/엔트로피 코더(590)는 또한, (BV 값 또는 다른 오프셋 값에 대한 예측자에 대해) 차이를 결정하고, 그 차이를, 예를 들면, 콘텍스트 적응 이진 산술 코딩을 사용하여 엔트로피 코딩한다. 팔레트 코딩 모드의 경우, 헤더 포맷터/엔트로피 코더(590)는 팔레트 데이터를 인코딩할 수 있다. 특히, 헤더 포맷터/엔트로피 코더(590)는 아래에서 설명되는 바와 같이 팔레트 예측을 사용할 수 있다.
헤더 포맷터/엔트로피 코더(590)는 코딩된 비트스트림(595)에서 인코딩된 데이터를 제공한다. 코딩된 비디오 비트스트림(595)의 포맷은, H.265/HEVC 포맷, 윈도우 미디어 비디오(Windows Media Video) 포맷, VC-1 포맷, MPEG-x 포맷(예를 들면, MPEG-1, MPEG-2, 또는 MPEG-4), H.26x 포맷(예를 들면, H.261, H.262, H.263, H.264), 또는 다른 포맷의 변형안 또는 확장안일 수 있다.
소망되는 압축의 타입 및 구현예에 따라서, 인코더(500)의 모듈은 추가될 수 있고, 생략될 수 있고, 다수의 모듈로 분할될 수 있고, 다른 모듈과 결합될 수 있고 및/또는 유사한 모듈로 대체될 수 있다. 대안적인 실시형태에서, 상이한 모듈 및/또는 모듈의 다른 구성을 갖는 인코더는 설명된 기술 중 하나 이상을 수행한다. 인코더의 특정 실시형태는, 통상적으로, 인코더(500)의 변형예 또는 보충된 버전을 사용한다. 인코더(500) 내에서의 모듈 사이에 도시되는 관계는, 인코더에서의 정보의 일반적인 흐름을 나타내며; 다른 관계는 간략화를 위해 도시되지 않는다.
VI. 예시적인 비디오 디코더.
도 6은 몇몇 설명된 실시형태가 연계하여 구현될 수도 있는 일반화된 디코더(600)의 블록도이다. 디코더(600)는 인코딩된 데이터를 코딩된 비트스트림(605)에서 수신하고 재구성된 비디오(695)에 대한 픽쳐를 포함하는 출력을 생성한다. 코딩된 비디오 비트스트림(605)의 포맷은, H.265/HEVC 포맷, 윈도우 미디어 비디오(Windows Media Video) 포맷, VC-1 포맷, MPEG-x 포맷(예를 들면, MPEG-1, MPEG-2, 또는 MPEG-4), H.26x 포맷(예를 들면, H.261, H.262, H.263, H.264), 또는 다른 포맷의 변형안 또는 확장안일 수 있다.
픽쳐는 동일한 사이즈의 또는 상이한 사이즈의 다수의 타일로서 편제될 수 있다. 픽쳐는 또한 하나 이상의 슬라이스로 편제될 수 있다. 슬라이스 또는 타일의 컨텐츠는 블록 또는 샘플 값의 다른 세트로서 더 편제될 수 있다. 디코더(600)는 블록 기반이며 구현예에 의존하는 블록 포맷을 사용한다. 블록은 상이한 스테이지에서 더 세분될 수도 있다. 예를 들면, 픽쳐는 64×64 블록, 32×32 블록 또는 16×16 블록으로 분할될 수 있는데, 이들은 종국에는 샘플 값의 더 작은 블록으로 분할될 수 있다. H.265/HEVC 표준에 대한 디코딩의 구현예에서, 픽쳐는 CTU(CTB), CU(CB), PU(PB) 및 TU(TB)로 구획된다. WPP가 인에이블된 상태에서(WPP를 사용하거나 또는 디코딩 동안 WPP의 사용과 일치하는 방식으로) 픽쳐가 인코딩되었다면, 특정 블록의 행(예를 들면, H.265/HEVC 표준에 따른 CTU의 행)은 아래에서 추가로 설명되는 바와 같이 WPP를 사용하여 병렬적으로 디코딩될 수 있다.
디코더(600)는 인트라 픽쳐 디코딩 및/또는 인터 픽쳐 디코딩을 사용하여 픽쳐를 압축해제한다. 디코더(600)의 컴포넌트 중 많은 것은 인트라 픽쳐 디코딩 및 인터 픽쳐 디코딩 둘 다에 대해 사용된다. 이들 컴포넌트에 의해 수행되는 정확한 동작은, 압축해제되고 있는 정보의 타입에 의존하여 변할 수 있다.
버퍼는 인코딩된 데이터를 코딩된 비디오 비트스트림(605)에서 수신하고 수신된 인코딩된 데이터를 파서/엔트로피 디코더(610)가 이용가능하게 만든다. 파서/엔트로피 디코더(610)는 엔트로피 코딩된 데이터를 엔트로피 디코딩하는데, 통상적으로는 인코더(500)에서 수행된 엔트로피 코딩(예를 들면, 콘텍스트 적응 이진 산술 디코딩)의 역을 적용한다. 파싱 및 엔트로피 디코딩의 결과로서, 파서/엔트로피 디코더(610)는, 일반적인 제어 데이터(622), 양자화된 변환 계수 데이터(632), 인트라 예측 데이터(642), 모션 데이터(652) 및 필터 제어 데이터(662)를 생성한다. 인트라 예측 데이터(642)의 경우, 예측자 인덱스 값이 시그널링되면, 파서/엔트로피 디코더(610)는, 예를 들면, 콘텍스트 적응 이진 산술 디코딩(context-adaptive binary arithmetic decoding)을 사용하여 예측자 인덱스 값을 엔트로피 디코딩할 수 있다. 몇몇 경우에서, 파서/엔트로피 디코더(610)는 또한 (예를 들면, 콘텍스트 적응 이진 산술 디코딩을 사용하여) BV 값 또는 다른 오프셋 값에 대한 차이를 엔트로피 디코딩하고, 그 다음, 그 차이를, 대응하는 예측자와 결합하여 BV 값(또는 다른 오프셋 값)을 재구성한다. 다른 경우에서, 차이는 비트스트림으로부터 생략되고, BV 값(또는 다른 오프셋 값)은 단순히 (예를 들면, 예측자 인덱스 값으로 나타내어지는) 예측자이다. 팔레트 코딩 모드의 경우, 파서/엔트로피 디코더(610)는 팔레트 데이터를 디코딩할 수 있다. 특히, 파서/엔트로피 디코더(610)는 아래에서 설명되는 바와 같이 팔레트 예측을 사용할 수 있다.
일반적인 디코딩 제어부(620)는 일반적인 제어 데이터(622)를 수신하고, 디코딩 동안 디코딩 파라미터를 설정하고 변경하기 위해, 제어 신호(도시되지 않음)를 다른 모듈(예컨대, 스케일러/역 변환기(635), 인트라 픽쳐 예측기(645), 모션 보상기(655) 및 인트라/인터 스위치)로 제공한다.
현재 픽쳐가 인터 픽쳐 예측을 사용하여 예측되면, 모션 보상기(655)는 모션 데이터(652), 예컨대 MV 데이터, 참조 픽쳐 선택 데이터 및 병합 모드 인덱스 값을 수신한다. 모션 보상기(655)는 MV를, 디코딩된 픽쳐 버퍼(670)로부터의 재구성된 참조 픽쳐(들)에 적용한다. 모션 보상기(655)는 현재 픽쳐의 인터 코딩된 블록에 대한 모션 보상된 예측치를 생성한다. 디코딩된 픽쳐 버퍼(670)는 참조 픽쳐로서의 사용을 위해 하나 이상의 이전에 재구성된 픽쳐를 저장한다.
디코더(600) 내의 별개의 경로에서, 인트라 픽쳐 예측기(645)는, 인트라 픽쳐 예측이 공간 예측을 사용하는지, 인트라 BC 예측을 사용하는지, 인트라 LC 예측을 사용하는지 또는 인트라 SC 예측을 사용하는지의 여부를 나타내는 정보뿐만 아니라 예측 모드 방향(인트라 공간 예측의 경우), BV 값(인트라 BC 예측의 경우), 오프셋 값(인트라 LC 예측의 경우) 또는 오프셋 값 및 길이 값(인트라 SC 예측의 경우)과 같은 인트라 예측 데이터(642)를 수신한다. 인트라 공간 예측의 경우, 현재 픽쳐의 재구성(638)의 값을 사용하여, 예측 모드 데이터에 따라, 인트라 픽쳐 예측기(645)는, 현재 픽쳐의 이웃하는 이전에 재구성된 샘플 값으로부터, 현재 픽쳐의 현재 블록의 샘플 값을 공간적으로 예측한다. 또는, 인트라 카피 예측의 경우, 인트라 픽쳐 예측기(645)는, 참조 블록, 라인, 스트링, 또는 현재 블록, 라인, 스트링 등등에 대한 변위(BV 값, 오프셋 값 등등)에 의해 표현되는 다른 섹션의 이전에 재구성된 샘플 값을 사용하여 현재 블록, 라인, 스트링 또는 다른 섹션의 샘플 값을 예측한다. 일부 경우에서, BV 값(또는 다른 오프셋 값)은 예측된 값일 수 잇다. 다른 경우에서, BV 값(또는 다른 오프셋 값)은 자신의 예측된 값과 상이할 수 있는데, 이 경우 BV 값(또는 다른 오프셋 값)은 차이 및 예측된 값을 사용하여 재구성된다. 인트라 SC 모드의 경우, 인트라 픽쳐 예측기(645)는 또한 현재 스트링의 샘플 값을 예측하는 경우 스트링 길이 값을 사용한다.
팔레트 디코딩 모드의 경우, 디코더(600)는 CU 또는 다른 유닛의 샘플 값 중 적어도 몇몇을 표현하는 팔레트를 사용한다. 팔레트는 인덱스 값을 유닛에서 사용되는 대응하는 컬러에 맵핑한다. 예를 들면, 팔레트는 인덱스 값 0, 1, 2, ..., p를 대응하는 컬러에 맵핑하고, 이는 RGB 4:4:4 포맷, BGR 4:4:4 포맷, GBR 4:4:4 포맷, YUV 4:4:4 포맷 또는 다른 포맷(컬러 공간, 컬러 샘플링 레이트)일 수 있다. 인덱스 값은 픽셀에 대한 RGB 트리플릿, BGR 트리플릿 또는 GBR 트리플릿을 표현할 수 있다. 디코딩 동안, 유닛의 위치에 대해, 팔레트로부터의 인덱스 값은 적절한 샘플 값으로 대체된다. 유닛에서 이스케이프 코딩된 값은 이스케이프 코드 값 및 문자 값을 사용하여 디코딩될 수 있다. 팔레트는 비트스트림에서 시그널링되는 팔레트 데이터에 기초하여 유닛마다 변할 수 있다.
인트라/인터 스위치는, 주어진 블록에 대한 예측(658)으로서 사용하기 위한 모션 보상된 예측 또는 인트라 픽쳐 예측의 값을 선택한다. 예를 들면, H.265/HEVC 신택스가 후속되면, 인트라/인터 스위치는, 인트라 예측된 CU 및 인터 예측된 CU를 포함할 수 있는 픽쳐의 CU에 대해 인코딩되는 신택스 엘리먼트에 기초하여 제어될 수 있다. 잔차 값이 인코딩/시그널링되었다면, 디코더(600)는 예측치(658)를 재구성된 잔차 값과 결합하여, 비디오 신호로부터의 컨텐츠의 재구성치(638)를 생성한다. 잔차 값이 인코딩/시그널링되지 않은 경우, 디코더(600)는 예측(658)의 값을 재구성치(638)로서 사용한다.
잔차 값이 인코딩/시그널링 된 경우 잔차를 재구성하기 위해, 스케일러/역 변환기(635)는 양자화된 변환 계수 데이터(632)를 수신 및 프로세싱한다. 스케일러/역 변환기(635)에서, 스케일러/역 양자화기는, 양자화된 변환 계수에 관해 역 스케일링 및 역 양자화를 수행한다. 역 주파수 변환기는 역 주파수 변환을 수행하여, 재구성된 예측 잔차 값 또는 샘플 값의 블록을 생성한다. 예를 들면, 역 주파수 변환기는 주파수 변환 계수에 대해 역 블록 변환을 적용하여, 샘플 값 데이터 또는 예측 잔차 데이터를 생성한다. 역 주파수 변환은 역 DCT, 역 DCT의 정수 근사, 또는 다른 타입의 역 주파수 변환(예를 들면, 역 이산 사인 변환 또는 역 이산 사인 변환의 정수 근사)일 수 있다. 인코딩 동안 주파수 변환이 스킵되었다면, 역 주파수 변환도 또한 스킵된다. 이 경우, 스케일러/역 양자화기는 예측 잔차 데이터(또는 샘플 값 데이터)의 블록에 대해 역 스케일링 및 역 양자화를 수행하여, 재구성된 값을 생성할 수 있다.
인트라 픽쳐 예측의 경우, 재구성(638)의 값은 인트라 픽쳐 예측기(645)로 다시 공급될 수 있다. 인터 픽쳐 예측의 경우, 재구성(638)의 값은 추가로 필터링될 수 있다. 병합기/필터(들)(665)에서, 디코더(600)는 상이한 타일로부터의 컨텐츠를 픽쳐의 재구성된 버전으로 병합한다. 디코더(600)는, 픽쳐에서의 경계에 걸친 불연속부를 적응적으로 평활화하기 위해, 필터 제어 데이터(662) 및 필터 적응을 위한 규칙에 따라 디블록 필터링 및 SAO 필터링을 선택적으로 수행한다. 다른 필터링(예컨대 디링잉 필터링 또는 ALF; 도시되지 않음)이 대안적으로 또는 추가적으로 적용될 수 있다. 타일 경계는, 인코딩된 비트스트림 데이터 내에서의 신택스 엘리먼트(syntax element) 또는 디코더(600)의 설정에 의존하여, 선택적으로 필터링될 수 있거나 또는 전혀 필터링되지 않을 수 있다. 디코딩된 픽쳐 버퍼(670)는, 후속하는 모션 보상된 예측에서의 사용을 위해 재구성된 현재 픽쳐를 버퍼링한다.
디코더(600)는 또한 후처리 필터(post-processing filter)를 포함할 수 있다. 후처리 필터(608)는, 디블록 필터링, 디링잉 필터링, 적응적 위이너 필터링(adaptive Wiener filtering), 필름 그레인 재현 필터링(film-grain reproduction filtering), SAO 필터링 또는 다른 종류의 필터링을 포함할 수 있다. 반면 모션 보상 루프에서 픽쳐의 재구성된 샘플 값에 대해 "루프 내" 필터링이 수행되고, 그에 따라 참조 픽쳐의 샘플 값에 영향을 끼치는 까닭에, 후처리 필터(608)는, 디스플레이를 위한 출력 이전에, 모션 보상 루프 외부에서, 재구성된 샘플 값에 적용된다.
소망되는 압축해제의 타입 및 구현예에 따라서, 디코더(600)의 모듈은 추가될 수 있고, 생략될 수 있고, 다수의 모듈로 분할될 수 있고, 다른 모듈과 결합될 수 있고 및/또는 유사한 모듈로 대체될 수 있다. 대안적인 실시형태에서, 상이한 모듈 및/또는 모듈의 다른 구성을 갖는 디코더는 설명된 기술 중 하나 이상을 수행한다. 디코더의 특정 실시형태는, 통상적으로, 디코더(600)의 변형예 또는 보충된 버전을 사용한다. 디코더(600) 내에서의 모듈 사이에 도시되는 관계는, 디코더에서의 정보의 일반적인 흐름을 나타내며; 다른 관계는 간략화를 위해 도시되지 않는다.
VII. WPP가 인에이블되는 경우 인트라 픽쳐 예측 모드에 대한 규칙
본 섹션은 파면 병렬 프로세싱("WPP")이 인에이블되는 경우 인트라 픽쳐 예측 모드에 대한 규칙의 예를 제시한다. 혁신안은 WPP가 인에이블되는 경우, 인코더 또는 디코더에 의한 인트라 픽쳐 예측 모드, 예를 들면, 팔레트 예측 모드, 인트라 블록 카피("BC") 모드, 인트라 라인 카피("LC") 모드 및 인트라 스트링 카피("SC") 모드의 사용을 용이하게 한다.
A. 파면 병렬 프로세싱 - 도입
일반적으로, WPP는, 픽쳐에서 유닛의 행에 대한 프로세싱의 시작을 차동적으로 지연시킴으로써 병렬적 프로세싱을 용이하게 하는 코딩/디코딩 툴이다. WPP가 인에이블되는 경우, 픽쳐에서 유닛의 상이한 행이 병렬적으로 인코딩 또는 디코딩될 수 있다. 인코딩 또는 디코딩 동안, 유닛의 제 1 행은 좌측에서 우측으로 유닛별로 프로세싱될 수 있다. 유닛의 제 2 행의 프로세싱(인코딩 또는 디코딩)은 유닛의 제 1 행 전체에 대한 프로세싱의 완료를 대기할 필요가 없다. 그 대신, 유닛의 제 2 행의 프로세싱은, 제 2 행의 최초 유닛을 프로세싱하는 경우에 사용되는 정보를 제공하는 제 1 행의 유닛 중 몇몇에 대한 프로세싱이 완료한 후 시작할 수 있다. 유사하게, 유닛의 제 3 행의 프로세싱은 제 2 행의 유닛 중 몇몇에 대한 프로세싱이 완료된 후 시작할 수 있다. 따라서, WPP는, 상이한 스레드 또는 프로세싱 코어의 상이한 행의 병렬적 프로세싱이 스태거링된 시간-지연 기반으로 유닛의 상이한 행에 대한 프로세싱을 수행할 수 있는 것을 용이하게 한다.
예를 들면, H.265/HEVC 표준에 따라 WPP가 인에이블되는 경우, 슬라이스는 CTU의 행으로 분할된다. 인코딩 또는 디코딩 동안, CTU의 제 1 행은 CTU별로 프로세싱될 수 있다. CTU의 제 2 행의 프로세싱은, 제 2 행의 최초 CTU를 프로세싱하는 경우 사용될 정보(예를 들면, 재구성된 샘플 값, 재구성된 MV 값 또는 BV 값, 콘텍스트 모델 정보)를 제공하는 제 1 행의 처음 두 개의 CTU에 대한 프로세싱이 완료된 후 시작할 수 있다. 유사하게, CTU의 제 3 행의 프로세싱은 제 2 행의 처음 두 개의 CTU에 대한 프로세싱이 완료된 후 시작할 수 있다.
도 7은 H.265/HEVC 표준에 따른 현재 픽쳐(710)에 대한 WPP의 타이밍(700)을 예시한다. 픽쳐(710)는 CTU로 구획되고, 이는 CTU 열 및 CTU 행으로 편제된다. 상이한 CTU 행은 WPP를 사용하여 병렬적으로 인코딩 또는 디코딩될 수 있다. WPP의 타이밍은 인코딩 또는 디코딩 동안 CTU 사이의 의존도를 반영한다. 이 예에서, 주어진 CTU는 (1) 자신의 좌측의 이웃 CTU(들), (2) 자신의 위 및 좌측의 이웃 CTU(들), (3) 주어진 CTU 위의 이웃 CTU(들), 및 (4) 주어진 CTU의 위 및 우측의 이웃 CTU(들)로부터의 정보(이를테면 재구성된 샘플 값, 재구성된 MV 값 또는 BV 값, 콘텍스트 모델 정보)에 의존할 수도 있고, 여기서 이러한 이웃 CTU (1) 내지 (4)는 이용가능하다(예를 들면, 픽쳐 내에서 동일한 슬라이스 및 타일에 있다). 각각의 이웃 CTU는 종국에는, 이용가능하다면 자신의 이웃 CTU (1) 내지 (4)에 의존할 수도 있다. 도 8은 제 5 CTU 행의 최초 CTU에 대한 캐스케이딩 의존도를 예시한다. 제 5 CTU 행의 최초 CTU는 제 4 CTU 행의 처음 두 개의 CTU에 의존하고, 제 4 CTU 행의 처음 두 개의 CTU는 제 3 CTU 행의 처음 세 개의 CTU에 의존하는 식이다.
도 7을 참조하면, WPP의 경우, 제 1 CTU 행(즉, CTU 행 0)은 웨이브 0에 대해 CTU별로 프로세싱된다. 웨이브 1의 경우, CTU 행 1의 최초 CTU의 프로세싱은 CTU 행 0의 제 2 CTU의 인코딩/디코딩이 종료된 후 시작할 수 있다. 마찬가지로, 웨이브 2의 경우, CTU 행 2의 최초 CTU의 프로세싱은 CTU 행 1의 제 2 CTU의 인코딩/디코딩이 종료된 후 시작할 수 있다. 웨이브 3의 경우, CTU 행 3의 최초 CTU의 프로세싱은 CTU 행 2의 제 2 CTU의 인코딩/디코딩이 종료된 후 시작할 수 있고, 웨이브 4의 경우, CTU 행 4의 최초 CTU의 프로세싱은 CTU 행 3의 제 2 CTU의 인코딩/디코딩이 종료된 후 시작한다.
CTU 행이 병렬적으로 프로세싱되는 경우에도, 이러한 스태거링된 시간-지연 프로세싱은, 프로세싱이 CTU 행에 대해 시작하는 경우 CTU 사이의 의존도가 충족되는 것을 보장한다. 도 7에서, 각각의 CTU 행에 대한 두 개의 CTU 리드(lead)는 프로세싱 동안 유지된다. 각각의 CTU 행의 경우, (굵은 외곽선으로 도시된) 현재 CTU에 대한 프로세싱은 다음 CTU 행의 현재 CTU에 대한 프로세싱에 앞선 두 개의 CTU이다. 그러나, 실제로, 주어진 CTU 행에 대한 프로세싱은 지연되거나 느려져서, 주어진 CTU 행의 CTU에 대한 프로세싱의 완료에 (직접적으로 또는 간접적으로) 의존하는 추후의 CTU 행에 대한 프로세싱에서의 캐스케이딩 지연을 초래한다. 추후의 CTU 행의 주어진 CTU의 경우, 의존도는 이전 CTU 행으로부터 캐스케이드된다. 도 8에 도시된 예(800)에서, 프레임(810)의 제 5 CTU 행의 최초 CTU의 경우, 제 4 CTU 행의 처음 두 개의 CTU는 프로세싱되었다. 그렇지 않으면, 제 5 CTU 행의 최초 CTU에 대한 프로세싱은 시작할 수 없다. 확장에 의해, 제 3 CTU 행의 제 3 CTU는 프로세싱되었는데, 이는, 그렇지 않으면, 제 4 CTU 행의 제 2 CTU에 대한 프로세싱이 시작될 수 없었기 때문이다. 마찬가지로, 제 3 CTU 행의 제 3 CTU에 대한 프로세싱에 대한 선결조건으로서, 제 2 CTU 행의 제 4 CTU는 프로세싱되었다. 마지막으로, 제 2 CTU 행의 제 4 CTU에 대한 프로세싱에 대한 선결조건으로서, 제 1 CTU 행의 제 5 CTU는 프로세싱되었다. 따라서, 도 8은 WPP가 인에이블되는 경우 웨이브 4(제 5 CTU 행)의 최초 CTU의 예측에 이용가능하도록 보장되는 재구성된 컨텐츠를 도시한다.
반대로, WPP가 인에이블되지 않는 경우, CTU는 픽쳐(또는 사용된다면 슬라이스 및 타일)의 위부터 아래까지 CTU 행별로 CTU 행의 좌측에서 우측으로 프로세싱된다. 주어진 CTU에 대해 사용되는 콘텍스트 모델 정보(또한 CABAC 상태 정보 또는 엔트로피 코딩 정보로 지칭됨)는 동일한 CTU 행 및 코딩/디코딩 순서에서 더 앞선 CTU인 픽쳐(또는 슬라이스/타일)의 임의의 이전 CTU 행의 임의의 이전 CTU를 프로세싱한 결과를 설명한다. 예를 들면, CTU 행의 제 2 CTU의 프로세싱은 CTU 행의 제 1 CTU의 프로세싱의 결과에 의존하는 식이다. 다른 예로, CTU 행의 최초 CTU에 대한 프로세싱은 픽쳐(또는 슬라이스/타일)에서 이전 CTU 행의 마지막 CTU의 프로세싱의 결과에 의존한다.
한편, WPP가 인에이블되는 경우, CTU 행의 최초 CTU에 대한 프로세싱은 픽쳐(또는 슬라이스/타일)에서 이전 CTU 행의 마지막 CTU의 프로세싱의 결과에 의존하지 않는다. CTU 행의 최초 CTU에 대한 프로세싱은, 이전 CTU 행의 마지막 CTU로부터의 콘텍스트 모델 정보가 이용불가능한 경우에도, 픽쳐(또는 슬라이스/타일)에서 이전 CTU 행의 제 2 CTU에 대한 프로세싱이 종료된 후 시작할 수 있다. 이전 CTU 행의 제 3 CTU의 프로세싱은, WPP가 인에이블되지 않은 경우처럼 그 CTU 행의 제 2 CTU의 프로세싱의 결과에 여전히 의존한다.
WPP가 인에이블되는 경우, 인코더는 인코딩 동안 WPP를 실제로 사용할 수도 있거나 사용하지 않을 수도 있다. 그럼에도 불구하고, 인코더는 WPP가 실제로 사용되는 경우 적용하는 제약 및 예측 규칙을 시행한다. 마찬가지로, WPP가 인에이블되는 경우, 디코더는 디코딩 동안 WPP를 실제로 사용할 수도 있거나 사용하지 않을 수도 있다. 비트스트림의 신택스 엘리먼트는 비디오 시퀀스, 픽쳐의 세트 또는 픽쳐에 대해 WPP가 인에이블되는지 여부를 나타낼 수 있다. 예를 들면, 신택스 엘리먼트는 비트스트림에서 SPS, PPS 또는 다른 신택스 구조에서 시그널링될 수 있다. 예를 들면, H.265/HEVC 구현예에서, PPS 신택스 구조에서 시그널링되는 신택스 엘리먼트 entropy_coding_sync_enabled_flag의 값은, PPS 신택스 구조와 연관된 픽쳐(들)에 대해 WPP가 인에이블되는지 여부를 나타낸다. entropy_coding_sync_enabled_flag가 1과 동일하면, WPP는 픽쳐(들)에 대해 인에이블된다. 그렇지 않으면, WPP는 픽쳐(들)에 대해 인에이블되지 않는다.
B. 팔레트 코딩/디코딩 모드 및 팔레트 예측 - 도입
일반적으로, 팔레트 코딩/디코딩 모드는 유닛(예를 들면, H.265/HEVC 구현예의 CU 또는 다른 유닛)의 샘플 값 중 적어도 몇몇을 표현하기 위해 팔레트를 사용한다. 예를 들면, 팔레트는 인덱스 값 0, 1, 2, ..., p를 대응하는 컬러에 맵핑하고, 이는 RGB 4:4:4 포맷, BGR 4:4:4 포맷, GBR 4:4:4 포맷, YUV 4:4:4 포맷 또는 다른 포맷(컬러 공간, 컬러 샘플링 레이트)일 수 있다. 인덱스 값은 픽셀에 대한 RGB 트리플릿, BGR 트리플릿 또는 GBR 트리플릿을 표현할 수 있다. 도 9는 팔레트의 두 개의 예를 도시한다. 현재 유닛에 대한 팔레트(즉, "현재 팔레트")는 RGB 트리플릿과 연관된 p개의 인덱스 값 0,...,p-1을 포함한다. ("이전 팔레트 데이터"에서 표현되는) 이전 유닛에 대한 팔레트는 RGB 트리플릿과 연관된 q개의 인덱스 값 0,...,q-1을 포함한다. p 및 q의 값은 동일하거나 상이할 수 있다. 인코딩 동안, 인코더는 인덱스 값을 사용하여 픽셀의 샘플 값을 대체할 수 있고, 이는 예를 들면, 엔트로피 코딩을 사용하여 더 인코딩될 수도 있다. 디코딩 동안, 디코더는 예를 들면 인덱스 값의 엔트로피 디코딩 이후, 팔레트를 사용하여 인덱스 값으로부터 픽셀의 샘플 값을 복원할 수 있다.
특히, 팔레트 코딩/디코딩 모드는, 유닛이 스크린 컨텐츠 비디오에 대한 공통 특징인 비교적 적은 별개의 컬러를 포함하는 경우 효과적일 수 있다. 예를 들면, RGB 4:4:4 포맷에서 64×64개의 CU는 64×64=4096개의 픽셀을 포함하지만, 훨씬 더 적은 컬러(예를 들면, 1 내지 20개의 컬러)를 포함할 수도 있다. 유닛의 희귀 컬러는 팔레트에 직접 희귀 컬러를 포함시키는 대신에, (각각의 샘플 값에 대한) 이스케이프 코드 값 및 문자 값을 사용하여 인코딩될 수 있다.
두 개의 유닛은 동일한 팔레트를 사용할 수 있지만, 컬러는 통상적으로 픽쳐 내에서 유닛별로 변한다. 따라서, 팔레트는 통상적으로 픽쳐 내에서 유닛별로 변한다. 팔레트의 경우, 인코더는 비트스트림에서 엔트로피 코딩될 수도 있는 팔레트 데이터를 시그널링한다. 디코더는 팔레트 데이터를 수신 및 파싱하고, 이를 적절히 엔트로피 디코딩하고, 팔레트를 재구성한다. 인코더 및 디코더는 팔레트 예측을 사용하여 시그널링 팔레트 데이터와 연관된 비트 레이트를 감소시킬 수 있다.
일반적으로, 팔레트 예측은 이전 유닛(이전 팔레트 데이터)에 대한 하나 이상의 팔레트로부터의 팔레트 데이터를 사용하여 현재 유닛(현재 팔레트)에 대한 팔레트의 값을 예측하기 위해 인코딩 또는 디코딩 동안 사용되는 임의의 접근법일 수 있다. 컬러는 통상적으로 픽쳐 내에서 유닛별로 변하지만 많은 경우, 주어진 유닛의 컬러 중 적어도 몇몇은 인접한 유닛에서 또한 사용된다. 팔레트 예측은 팔레트 데이터에 대한 비트 레이트를 감소시키기 위해 그러한 관측을 이용한다.
도 9는 현재 유닛(현재 팔레트)에 대한 팔레트가 (이전 팔레트 데이터에서 표현된) 이전 유닛에 대한 팔레트를 사용하여 예측되는 팔레트 예측의 단순화된 예(900)를 도시한다. 예를 들면, 이전 유닛이 팔레트 코딩/디코딩 모드를 사용했다면, 이전 팔레트 데이터는 현재 유닛 전에 인코딩 또는 디코딩된 이전 유닛에 의해 사용된 팔레트로부터 기인할 수 있다. 이전 유닛이 팔레트 코딩/디코딩 모드를 사용하지 않았다면, 현재 유닛의 이전 팔레트 데이터는 이전 유닛으로부터 "승계"될 수 있다. 즉, 이전 유닛에 대해 이용가능했던 이전 팔레트 데이터가 현재 유닛에 대해 이용가능한 이전 팔레트 데이터로서 재사용될 수 있다. (몇몇 예시적인 구현예에서, 이전 팔레트 데이터는 실제로 현재 유닛에 대한 스테이터스 또는 상태 정보이다. 자체로 팔레트 코딩/디코딩 모드를 사용하지 않는 주어진 유닛은 여전히 다음 유닛에 의해 승계될 수도 있는 이전 팔레트 데이터를 갖는다). 따라서, 승계의 체인을 통해, 현재 유닛에 대한 이전 팔레트 데이터는 팔레트 코딩/디코딩 모드를 사용한 가장 최근 이전에 프로세싱된 유닛(존재하는 경우)의 팔레트로부터의 팔레트 데이터를 포함할 수 있다.
팔레트 예측의 경우, 인코더는, 현재 팔레트가 이전 팔레트 데이터와 동일한지 여부를 결정할 수 있다. 동일하다면, 인코더는 단순히, 이전 팔레트 데이터가 현재 팔레트로서 재사용될 것을 나타낼 수 있다. 그렇지 않으면(현재 팔레트가 이전 팔레트 데이터와 상이하면), 인코더는 이전 팔레트 데이터와 현재 팔레트 사이의 변경을 결정하고, 변경을 나타내는 신택스 엘리먼트를 시그널링한다. 예를 들어, 도 9에 도시된 바와 같이, 현재 팔레트의 주어진 인덱스 값에 대해, 인코더는, 주어진 인덱스 값에 대한 대응하는 컬러가 이전 팔레트 데이터의 컬러("prev")인지 또는 새로운 컬러("new")인지 여부를 시그널링한다. 대응하는 컬러가 이전 팔레트 데이터의 컬러이면, 인코더는, 현재 팔레트를 파퓰레이트하기 위해 사용될 수 있는 이전 팔레트 데이터의 컬러에 대한 (이전 팔레트 데이터로부터의) 인덱스 값을 시그널링한다. 도 9에서, 이전 팔레트 데이터의 인덱스 값 1에 대한 컬러는 현재 팔레트의 인덱스 값 0에 재할당되고, 이전 팔레트 데이터의 인덱스 값 0에 대한 컬러는 현재 팔레트의 인덱스 값 2에 재할당된다. 따라서, 컬러는 팔레트별로 위치를 변경할 수 있어서, 가장 공통적인 컬러는 가장 낮은 인덱스 값을 갖고, 이는 엔트로피 코딩의 효율을 개선시킬 수도 있다. 주어진 인덱스 값에 대한 대응하는 컬러가 새로운 컬러이면, 인코더는 새로운 컬러에 대한 트리플릿을 시그널링한다. 예를 들면, 도 9에서, 현재 팔레트의 인덱스 값 1에 대해, 인코더는 현재 팔레트를 업데이트하기 위해 사용되는 새로운 트리플릿(215, 170, 200)을 시그널링한다.
인코더에 의해 시그널링된 신택스 엘리먼트에 기초하여, 디코더는, 현재 팔레트가 디코더에서 이용가능한 이전 팔레트 데이터와 동일한지 여부를 결정할 수 있다. 동일하다면, 디코더는, 이전 팔레트 데이터를 현재 팔레트로서 재사용할 수 있다. 그렇지 않으면(현재 팔레트가 이전 팔레트 데이터와 상이하면), 디코더는, 이전 팔레트 데이터와 현재 팔레트 사이의 변경을 나타내는 신택스 엘리먼트를 수신 및 파싱한다. 예를 들어, 도 9에 도시된 바와 같이, 현재 팔레트의 주어진 인덱스에 대해, 디코더는, 주어진 인덱스 값에 대한 대응하는 컬러가 이전 팔레트 데이터의 컬러("prev")인지 또는 새로운 컬러("new")인지 여부를 결정한다. 대응하는 컬러가 이전 팔레트 데이터의 컬러이면, 디코더는, 현재 팔레트를 파퓰레이트하기 위해 사용될 수 있는 이전 팔레트 데이터의 컬러에 대한 (이전 팔레트 데이터로부터의) 인덱스 값을 나타내는 신택스 엘리먼트를 수신 및 파싱한다. 주어진 인덱스 값에 대한 대응하는 컬러가 새로운 컬러이면, 디코더는 새로운 컬러를 나타내는 신택스 엘리먼트를 수신 및 파싱한다.
현재 팔레트를 구성한 후, 인코더 및 디코더는 현재 팔레트로부터의 팔레트 데이터를 저장하기 위해 다음 유닛에 대한 이전 팔레트 데이터를 업데이트한다. 이 새로운 "이전 팔레트 데이터"는 다음 유닛에 대한 팔레트를 예측하기 위해 사용될 수 있다.
도 9는 단순화된 예(900)를 도시한다. 실제로, 팔레트 데이터를 시그널링하기 위해 사용되는 신택스 엘리먼트 및 규칙은 더 복잡할 수 있다. 예시적인 구현예의 팔레트 코딩/디코딩 및 팔레트 예측에 대한 추가적인 세부사항의 경우, 예를 들면, JCTVC-R1005의 섹션 7.3.8.8, 7.4.9.6 및 8.4.1을 참조한다. 대안적으로, 팔레트 데이터를 시그널링하기 위해 다른 접근법이 사용된다.
C. WPP가 인에이블되는 경우 팔레트 예측
일반적으로, 현재 유닛의 팔레트(현재 팔레트)를 예측하기 위해, 팔레트 예측을 위한 이전 팔레트 데이터가 사용된다. 예를 들면, (이웃 유닛이 팔레트 코딩/디코딩 모드를 사용했다면) 이전 팔레트 데이터는 현재 유닛 전에 인코딩 또는 디코딩된 이웃 유닛으로부터의 실제 팔레트 데이터일 수 있다. 또는 (이웃 유닛이 팔레트 코딩/디코딩 모드를 사용하지 않았다면), 이웃 유닛에 대해 이용가능한 이전 팔레트 데이터는 현재 유닛에 대한 이전 팔레트 데이터로서 재사용(또는 "승계")될 수 있다.
몇몇 예시적인 구현예에서, WPP가 인에이블되지 않은 경우, 현재 행의 최초 유닛에 대해, 이전 팔레트 데이터는 이전 행의 마지막 유닛으로부터(예를 들면, 마지막 유닛이 팔레트 코딩/디코딩 모드를 사용했다면 마지막 유닛의 팔레트; 그렇지 않으면, 마지막 유닛에 대해 이용가능한 이전 팔레트 데이터로부터) 기인한다. WPP가 인에이블되는 경우, 현재 행의 최초 유닛에 대해, 이전 행의 마지막 유닛으터의 이전 팔레트 데이터는 이용가능하지 않을 수도 있다. 그러나, 유닛의 각각의 행의 시작에서 팔레트 예측을 재설정하는 것(현재 유닛의 최초 유닛에 대한 팔레트 예측을 위한 어떠한 예측자도 없음)은 코딩 효율에 부정적인 영향을 미칠 수 있다.
그 대신, WPP가 인에이블되는 경우, 인코더 또는 디코더는, 현재 행의 최초 유닛의 프로세싱이 시작하기 위해 이미 프로세싱된, 이전 행의 처음 두 개의 유닛 중 하나(예를 들면, 이전 행의 처음 두 개의 CTU에서 처음 두 개의 CU 중 하나)로부터의 이전 팔레트 데이터를 사용할 수 있다. 예를 들면, 현재 행의 최초 유닛에 대해, 팔레트 예측을 위해 이전 팔레트 데이터는, 이전 행의 제 2 유닛(제 2 유닛이 팔레트 코딩/디코딩 모드를 사용했다면, 제 2 유닛의 실제 팔레트 데이터, 또는 그렇지 않으면, 이전 행의 제 2 유닛에 대해 이용가능한 이전 팔레트 데이터)로부터 기인한다. 따라서, 현재 행의 최초 유닛에 대해, 제 2 유닛이 팔레트 코딩/디코딩 모드를 사용하지 않았다면, 이전 팔레트 데이터는 잠재적으로 (제 1 유닛이 팔레트 코딩/디코딩 모드를 사용한 경우) 이전 행의 제 1 유닛으로부터의 팔레트 데이터, 또는 (이전 행의 처음 두 개의 유닛 중 어느 것도 팔레트 코딩/디코딩 모드를 사용하지 않았다면) 이전 행 전의 행의 제 2 유닛에 대한 팔레트 등등에 의존할 수 있는 이전 행의 제 1 유닛으로부터의 이전 팔레트 데이터이다. (대안적으로, 이전 행의 처음 두 개의 유닛 중 어느 것도 팔레트 코딩/디코딩 모드를 사용하지 않았다면, 이전 팔레트 데이터는 널(null) - 예측자 없음 -일 수 있거나 또는 디폴트 예측자를 사용할 수 있다). 현재 행의 최초 유닛 이후에, 현재 유닛에 대해, 팔레트 예측을 위한 이전 팔레트 데이터는 (이웃 유닛이 팔레트 코딩/디코딩 모드를 사용한 경우) 현재 유닛 이전에 인코딩 또는 디코딩된 이웃 유닛으로부터의 팔레트 데이터, 또는 (이웃 유닛이 팔레트 코딩/디코딩 모드를 사용하지 않았다면) WPP가 인에이블되지 않은 경우처럼 이웃 유닛에 대해 이용가능한 이전 팔레트 데이터이다.
도 10은 몇몇 예시적인 구현예에 따라 WPP가 인에이블된 상태에서 프로세싱된 현재 픽쳐(1010)에 대한 팔레트 예측 의존도(1000)를 도시한다. 픽쳐(1010)는 CTU 행 및 CTU 열에 의해 편제된다. 도 10의 예에서, 각각의 CTU는 단일 CU를 포함한다. 더 일반적으로, 주어진 CTU는 재귀적으로 다수의 CU로 분할될 수 있다(예를 들면, 단일 CU는 네 개의 CU로 분할될 수 있고, 이들 각각은 더 작은 CU로 더 분할될 수 있다). 프로세싱의 상태(예를 들면, 현재 CTU가 인코딩 또는 디코딩되고 있는 것)는 일반적으로 도 7에 도시된 프로세싱의 상태에 대응한다. 도 10의 화살표는 WPP가 인에이블된 경우 팔레트 예측의 방향을 도시한다. 제 1 CTU 행의 최초 CU의 경우, 어떠한 예측자도 존재하지 않는다. 대안적으로, 디폴트 예측자가 사용될 수 있다. 제 1 CTU 행의 각각의 추후의 CU의 경우, 이전 팔레트 데이터가 좌측의 CU로부터 기인한다. 제 1 CTU 행 이후의 임의의 CTU 행의 최초 CU의 경우, 이전 팔레트 데이터는 이전 행의 제 2 CU로부터 기인한다. 제 1 CTU 행 이후의 임의의 CTU 행의 각각의 추후의 CU의 경우, 이전 팔레트 데이터는 동일한 행의 이전 CU로부터 기인한다. 팔레트 코딩/디코딩 모드를 사용한 임의의 CU의 경우, 이의 팔레트는 다음 CU의 팔레트의 예측을 위해 이전 팔레트 데이터를 구성하기 위해 사용된다. 주어진 CU가 팔레트 코딩/디코딩 모드를 사용하지 않으면, 주어진 CU에 대해 이용가능했던 이전 팔레트 데이터는 다음 CU의 이전 팔레트 데이터로서 유지된다.
CTU가 다수의 CU를 포함하는 경우, 현재 CU에 대한 팔레트 예측을 위해, 이전 CU는 z 스캔 순서에서 더 앞선 CU일 수 있다. 더 앞선 CU는 (CTU의 제 1 CU에 대해) 동일한 CTU 또는 상이한 CTU에 있을 수 있다. 섹션 VII. D는 도 17을 참조하여, 몇몇 예시적인 구현예에서 z 스캔 순서의 예를 설명한다.
인코더 및 디코더는 메모리를 사용하여, 팔레트 예측을 위해 사용되는 이전 팔레트 데이터를 저장할 수 있다. 이전 팔레트 데이터에 대해 저장되는 팔레트 데이터의 양은 구현예에 의존한다. 일반적으로, 이전 팔레트 데이터는 이전 팔레트 데이터의 컬러의 카운트 C 및 컬러에 대한 샘플 값의 세부사항(예를 들면, RGB 4:4:4 포맷, GBR 4:4:4 포맷, BGR 4:4:4 포맷, YUV 4:4:4 포맷 또는 다른 포맷의 컬러 트리플릿)을 포함할 수 있다. 인코더 및 디코더는 이전 팔레트에 대한 모든 팔레트 데이터를 저장할 수 있다. 그러나, 이전 팔레트에 대한 모든 팔레트 데이터를 저장하는 것은 큰 팔레트를 위한 상당한 양의 메모리를 소모할 수 있다. 대안적으로, 몇몇 경우에 메모리 소모를 감소시키기 위해, 인코더 및 디코더는 C를 임계 카운트로 제한하고, 여기서 임계 카운트는 구현예에 의존한다. 이 경우, 인코더 및 디코더는 이전 팔레트의 처음 C 개의 상이한 컬러에 대한 이전 팔레트 데이터를 저장하고, 여기서 C는 임계 카운트로 제한된다. 예를 들면, 임계 카운트는 16 또는 32이다. 또는, WPP가 인에이블되는 경우, 현재 행의 최초 유닛에 대한 팔레트 예측에 대해, 인코더 및 디코더는, 기껏해야, 처음 C1 개의 상이한 컬러에 대한 이전 팔레트 데이터를 저장한다. 그 후, 인코더 및 디코더는 현재 행 내의 팔레트 예측을 위해, 기껏해야 처음 C2 개의 상이한 컬러에 대한 이전 팔레트 데이터를 저장한다. 예를 들면, C1은 16 또는 32이고, C2는 64이다.
도 11은 WPP가 인에이블되는 경우, 팔레트 예측을 포함하는 인코딩을 위한 일반화된 기술(1100)을 도시한다. 도 3 또는 도 5a 및 도 5b에 도시된 인코더 또는 다른 인코더와 같은 인코더가 기술(1100)을 수행할 수 있다. 도 12은 WPP가 인에이블되는 경우, 팔레트 예측을 포함하는 디코딩을 위한 일반화된 기술(1200)을 도시한다. 도 4 또는 도 6에 도시된 디코더 또는 다른 디코더와 같은 디코더가 기술(1200)을 수행할 수 있다.
도 11을 참조하면, 인코더는 WPP가 인에이블된 상태에서 픽쳐를 인코딩한다(1110). 인코딩(1110)은 인코딩된 데이터를 생성한다. 인코딩(1110)의 일부로서, 팔레트 코딩 모드의 경우, 인코더는 픽쳐의 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터를 사용하여 픽쳐의 현재 WPP 행의 최초 유닛에 대한 팔레트를 예측한다. 인코더는 인코딩된 데이터를 비트스트림의 일부로서 출력한다(1120).
도 12를 참조하면, 디코더는 인코딩된 데이터를 비트스트림의 일부로서 수신한다(1210). 디코더는 WPP가 인에이블된 상태에서 인코딩된 데이터를 디코딩한다(1220). 디코딩(1220)은 픽쳐를 재구성한다. 디코딩(1220)의 일부로서, 팔레트 디코딩 모드의 경우, 디코더는 픽쳐의 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터를 사용하여 픽쳐의 현재 WPP 행의 최초 유닛에 대한 팔레트를 예측한다.
몇몇 예시적인 구현예에서는, 인코더 또는 디코더에서, 현재 WPP 행 및 이전 WPP 행은 CTU의 행이고, 최초 유닛 및 이전 유닛은 CU이다. 대안적으로, WPP 행은 다른 타입의 유닛의 행이고 그리고/또는 초기 및 이전 유닛은 다른 타입의 유닛이다. 비트스트림의 신택스 엘리먼트는 비디오 시퀀스, 픽쳐의 세트 또는 픽쳐에 대해 WPP가 인에이블되는지 여부를 나타낼 수 있다. 신택스 엘리먼트는 비트스트림에서 SPS 신택스 구조, PPS 신택스 구조(예를 들면, H.265/HEVC 구현예에서 신택스 엘리먼트 entropy_coding_sync_enabled_flag) 또는 다른 신택스 구조로 시그널링될 수 있다.
일반적으로, 인코딩 또는 디코딩 동안, 현재 WPP 행의 최초 유닛에 대한 팔레트는 현재 WPP 행의 최초 유닛에서 사용된 적어도 몇몇 컬러를 표현한다. 이전 WPP 행의 이전 유닛로부터의 이전 팔레트 데이터는 이전 WPP 행의 이전 유닛에 대한 팔레트에서 사용되는 적어도 몇몇 컬러를 표현할 수 있다(이전 유닛이 팔레트 코딩/디코딩 모드를 사용한 경우). 또는 (이전 유닛이 팔레트 코딩/디코딩 모드를 사용하지 않았다면), 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터는, 팔레트 코딩/디코딩 모드를 사용했을 수도 있는 또는 자체로 이전 팔레트 데이터를 승계했을 수 있는 더 앞선 유닛으로부터의 이전 유닛에 의해 승계되었을 수도 있다. 팔레트에 표현되지 않은 컬러는 이스케이프 코딩될 수 있다. 이전 WPP 행은 현재 WPP 행의 바로 위의 WPP 행일 수 있다. 이전 WPP 행의 이전 유닛은 현재 WPP 행의 이전 유닛 위(예를 들면, 도 10의 이전 행의 제 1 유닛)에 있을 수 있거나, 또는 현재 WPP 행의 최초 유닛의 우측 위(예를 들면, 도 10의 이전 행의 제 2 유닛)에 있을 수 있다. 현재 WPP 행의 최초 유닛을 프로세싱한 후, 픽쳐의 현재 WPP 행의 후속 유닛의 팔레트에 대해, 인코더 또는 디코더는 현재 WPP 행의 최초 유닛에 대한 팔레트로부터의 팔레트 데이터를 사용하여 (후속 유닛의) 팔레트를 예측할 수 있다.
인코딩 또는 디코딩 동안, 팔레트 예측은 몇몇 스테이지를 포함할 수 있다. 예를 들면, 인코딩 동안 인코더는, 이전 WPP 행의 이전 유닛로부터의 이전 팔레트 데이터를, 현재 WPP 행의 최초 유닛에 대한 팔레트(현재 팔레트)로서 재사용할지 여부를 (현재 팔레트와 이전 팔레트 데이터의 비교에 기초하여) 결정할 수 있다. 디코딩 동안 디코더는, 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터를, 현재 WPP 행의 최초 유닛에 대한 팔레트(현재 팔레트)로서 재사용할지 여부를 (인코더에 의해 시그널링된 정보에 기초하여) 결정할 수 있다. 다른 예로, 인코딩 동안 팔레트에 대한 변화가 존재하는 경우, 인코더는 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터로부터 하나 이상의 컬러를, 현재 WPP 행의 최초 유닛에 대한 팔레트(현재 팔레트)에 포함시키기 위해 선택할 수 있다. 인코더는 선택된 컬러를 나타내는 신택스 엘리먼트를 시그널링한다. 그 다음, 디코딩 동안 디코더는 신택스 엘리먼트를 수신 및 파싱할 수 있고, 신택스 엘리먼트에 기초하여, 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터로부터 하나 이상의 컬러를, 현재 WPP 행의 최초 유닛에 대한 팔레트(현재 팔레트)에 포함시키기 위해 선택할 수 있다. 대안적으로, 인코더 및 디코더는 팔레트 데이터를 시그널링하기 위해 다른 접근법을 사용할 수 있다.
인코더 및 디코더는 이전 유닛으로부터의 모든 이전 팔레트 데이터를 이전 WPP 행에 저장할 수 있다. 예를 들면, 인코더 및 디코더는 이전 WPP 행의 이전 유닛으로부터의 이전 팔레트 데이터에서 C 개의 컬러 각각에 대해 하나 이상의 컬러 성분 값을 저장할 수 있다. 대안적으로, 몇몇 경우에 메모리 소모를 감소시키기 위해, 인코더 및 디코더는 C를 이전 팔레트 데이터에 대한 임계 카운트로 제한할 수 있어서, 임계 카운트로 제한된 제 1 C 개의 컬러에 대한 팔레트 데이터가 팔레트 예측을 위해 저장된다.
D. 인트라 카피 예측 - 도입
일반적으로, 인트라 카피 모드는 픽쳐 내의 현재 블록, 라인, 스트링 또는 다른 섹션이 동일한 픽쳐의 참조 블록, 라인, 스트링 또는 다른 섹션에서 이전에 재구성된 샘플 값을 사용하여 예측되는 인트라 카피 예측을 사용한다. 예를 들면, 인트라 카피 모드는 인트라 블록 카피("BC") 예측, 인트라 라인 카피("LC") 예측 또는 인트라 스트링 카피("SC") 예측을 사용할 수 있다.
일반적으로, 인트라 BC 모드는, 픽쳐의 현재 블록의 샘플 값이, 동일 픽쳐의 샘플 값을 사용하여 예측되는 인트라 BC 예측을 사용한다. 블록 벡터(block vector; "BV") 값은, 현재 블록으로부터, 예측을 위해 사용된 샘플 값을 포함하는 픽쳐의 블록("참조 블록")까지의 변위를 나타낸다. 참조 블록은 현재 블록에 대한 예측된 값을 제공한다. 예측을 위해 사용된 샘플 값은 이전에 재구성된 샘플 값이고, 따라서, 이는, 인코딩 동안 인코더에서 및 디코딩 동안 디코더에서 이용가능하다. BV 값은 비트스트림에서 시그널링되고, 디코더는 BV 값을 사용하여, 예측을 위해 사용할 픽쳐의 참조 블록을 결정할 수 있다.
도 13은 현재 픽쳐(1310)의 현재 블록(1330)에 대한 인트라 BC 예측의 예(1300)를 도시한다. 현재 블록은 코딩 유닛("CU")의 코딩 블록("CB"), 예측 유닛("PU")의 예측 블록("PB"), 변환 유닛("TU")의 변환 블록("TB") 또는 다른 블록일 수 있다. 현재 블록의 사이즈는 64×64, 32×32, 16×16, 8×8 또는 어떤 다른 사이즈일 수 있다. 블록들은 인트라 BC 예측을 위해 대칭적으로 또는 비대칭적으로 더 작은 블록으로 구획될 수 있다. 보다 일반적으로는, 현재 블록의 사이즈는 m×n인데, 여기서 m 및 n의 각각은 0을 포함한 자연수(whole number)이고, m 및 n은 서로 동일할 수 있거나 또는 상이한 값을 가질 수 있다. 따라서, 현재 블록은 정사각형 또는 직사각형일 수 있다. 대안적으로, 현재 블록은 몇몇 다른 형태를 가질 수 있다.
BV(1340)는, 현재 블록(1330)으로부터 예측을 위해 사용되는 샘플 값을 포함하는 픽쳐의 참조 블록(1350)까지의 변위(또는 오프셋)를 나타낸다. 참조 블록(1350)은 현재 블록(1330)과 동일할 수 있거나, 또는 참조 블록은 현재 블록(1330)의 근사치일 수 있다. 현재 블록의 좌상(top-left) 위치가 현재 픽쳐의 위치 (x0, y0)에 있다고 가정하고, 참조 영역의 좌상 위치가 현재 픽쳐의 위치 (x1, y1)에 있다고 가정한다. BV는 변위 (x1-x0, y1-y0)를 나타낸다. 예를 들면, 현재 블록의 좌상 위치가 위치 (256, 128)에 있고, 참조 블록의 좌상 위치가 위치 (126, 104)에 있으면, BV 값은 (-130, -24)이다. 이 예에서, 음의 수평 변위는, 현재 블록의 좌측에 있는 위치를 나타내고, 음의 수직 변위는 현재 블록 위의 위치를 나타낸다.
인트라 BC 예측은, BC 동작을 사용하여 중복성(redundancy)(예컨대 픽쳐 내부에서의 반복된 패턴)을 활용하는 것에 의해 코딩 효율성을 향상시킬 수 있다. 그러나, 인코더가 평가할 수도 있는 후보 참조 블록의 수를 고려하면, 현재 블록에 대한 매칭하는 참조 블록을 찾는 것은 계산적으로 복잡하고 시간 소모적일 수 있다. 도 14는 WPP가 인에이블되지 않은 경우 현재 픽쳐(1410)의 현재 블록(1430)에 대한 후보 참조 블록 중 몇몇을 예시하는 예(1400)를 도시한다. 네 개의 BV(1441, 1442, 1443, 1444)는 네 개의 후보 참조 블록에 대한 변위를 나타낸다. WPP가 인에이블되지 않은 경우, 후보 참조 블록은 현재 픽쳐(1410)의 재구성된 컨텐츠 내의 임의의 곳에 있을 수 있다. (블록은 일반적으로 좌에서 우로, 그 다음 위에서 아래로 코딩된다.) BV(1443, 1444)에 의해 나타내어진 후보 참조 블록에 대해 도시된 바와 같이, 후보 참조 블록은 다른 후보 참조 블록과 중첩할 수 있다. 몇몇 예시적인 구현예에서, 참조 블록은 현재 블록과 동일한 슬라이스 및 타일 내로 제한된다. 이러한 인트라 BC 예측은 다른 슬라이스 또는 타일의 샘플 값을 사용하지 않는다. 참조 블록의 위치는 아래에서 설명되는 바와 같이 하나 이상의 다른 제약, 예를 들면, WPP가 인에이블되는 경우의 제약을 겪을 수도 있다.
인트라 BC 예측의 예측 모드를 갖는 블록은 CB, PB 또는 다른 블록일 수 있다. 블록이 CB인 경우, 블록에 대한 BV는 CU 레벨에서 시그널링될 수 있다(그리고 CU에서의 다른 CB는 동일한 BV 또는 그 스케일링된 버전을 사용한다). 또는, 블록이 PB인 경우, 블록에 대한 BV는 PU 레벨에서 시그널링될 수 있다(그리고 PU에서의 다른 PB는 동일한 BV 또는 그 스케일링된 버전을 사용한다). 보다 일반적으로는, 인트라 BC 예측 블록에 대한 BV는 블록에 대한 적절한 신택스 레벨에서 시그널링된다.
일반적으로, 인트라 LC 모드는, 픽쳐의 현재 블록의 현재 라인의 샘플 값이, 동일 픽쳐의 샘플 값을 사용하여 예측되는 인트라 LC 예측을 사용한다. 오프셋 값은, 현재 라인으로부터, 예측을 위해 사용된 샘플 값을 포함하는 픽쳐의 라인("참조 라인")까지의 변위를 나타낸다. 오프셋 값은 비트스트림에서 시그널링되고, 디코더는 오프셋 값을 사용하여, 예측을 위해 사용할 참조 라인을 결정할 수 있다.
도 15는 현재 픽쳐의 현재 블록(1530)의 라인에 대한 인트라 LC 예측의 예(1500)를 예시한다. 현재 블록은 CU의 CB, PU의 PB, TU의 TB 또는 다른 블록일 수 있다. 현재 블록의 사이즈는 64×64, 32×32, 16×16, 8×8 또는 어떤 다른 사이즈일 수 있다. 보다 일반적으로는, 현재 블록의 사이즈는 m×n인데, 여기서 m 및 n의 각각은 0을 포함한 자연수(whole number)이고, m 및 n은 서로 동일할 수 있거나 또는 상이한 값을 가질 수 있다. 따라서, 현재 블록은 정사각형 또는 직사각형일 수 있다. 인트라 LC 예측의 경우, 블록은 수평 라인 또는 수직 라인으로 분할된다. 수평 라인은 1 개 샘플의 높이를 갖고, 현재 블록의 폭을 갖는다. 수직 라인은 1 개 샘플의 폭을 갖고, 현재 블록의 높이를 갖는다.
도 15에서, 제 1 오프셋(1551)은 현재 블록(1530)의 제 1 라인(1541)으로부터 제 1 라인(1541)의 예측에 사용된 샘플 값을 포함하는 기준 라인(1561)까지의 변위를 나타낸다. 참조 라인은 주어진 라인과 동일할 수 있거나 또는 참조 라인은 주어진 라인의 근사치일 수 있다. 제 2 오프셋(1552)은 현재 블록(1530)의 제 2 라인(1542)으로부터 제 2 라인(1542)의 예측에 사용된 샘플 값을 포함하는 기준 라인(1562)까지의 변위를 나타낸다. 오프셋 값(1551, 1552)은 현재 픽쳐 내의 변위를 나타낸다는 점에서 BV 값과 유사하다. 도 15가 수평 라인을 도시하지만, 현재 블록(1530)은 그 대신 인트라 LC 예측에 대한 수직 라인으로 분할될 수 있다. 블록당, 유닛당 또는 픽쳐당 신택스 엘리먼트는 인트라 LC 예측에 대해 수평 라인이 사용되는지 또는 수직 라인이 사용되는지 여부를 나타낼 수 있다.
인트라 LC 예측은, LC 동작을 사용하여 중복성(예컨대 픽쳐 내부에서의 반복된 패턴)을 활용하는 것에 의해 코딩 효율성을 향상시킬 수 있다. WPP가 인에이블되지 않은 경우, 후보 참조 라인은 현재 픽쳐의 재구성된 컨텐츠 내의 임의의 곳에 있을 수 있다. 후보 참조 라인은 다른 후보 참조 라인과 중첩할 수 있다. 몇몇 예시적인 구현예에서, 참조 라인은 현재 라인과 동일한 슬라이스 및 타일 내로 제한된다. 참조 라인의 위치는 아래에서 설명되는 바와 같이 하나 이상의 다른 제약, 예를 들면, WPP가 인에이블되는 경우의 제약을 겪을 수도 있다.
일반적으로, 인트라 SC 모드는, 픽쳐의 현재 블록의 현재 스트링의 샘플 값이, 동일 픽쳐의 샘플 값을 사용하여 예측되는 인트라 SC 예측을 사용한다. 오프셋 값은, 현재 스트링으로부터, 예측을 위해 사용된 샘플 값을 포함하는 픽쳐의 스트링("참조 스트링")까지의 변위를 나타낸다. 스트링 길이 값은 샘플 값의 관점에서 스트링의 길이를 나타낸다. 오프셋 값 및 스트링 길이 값은 비트스트림에서 시그널링되고, 디코더는 오프셋 값 및 스트링 길이 값을 사용하여, 예측을 위해 사용할 참조 스트링을 결정할 수 있다.
도 16은 현재 픽쳐의 현재 블록(1630)의 스트링에 대한 인트라 SC 예측의 예(1600)를 도시한다. 현재 블록은 CU의 CB, PU의 PB, TU의 TB 또는 다른 블록일 수 있다. 현재 블록의 사이즈는 64×64, 32×32, 16×16, 8×8 또는 어떤 다른 사이즈일 수 있다. 보다 일반적으로는, 현재 블록의 사이즈는 m×n인데, 여기서 m 및 n의 각각은 0을 포함한 자연수(whole number)이고, m 및 n은 서로 동일할 수 있거나 또는 상이한 값을 가질 수 있다. 따라서, 현재 블록은 정사각형 또는 직사각형일 수 있다. 인트라 SC 예측의 경우, 블록은 하나 이상의 스트링으로 분할된다. 도 16에서, 현재 블록(1630)은 세 개의 스트링으로 분할된다. 블록의 스트링은 주어진 행에서 좌에서 우로 수평으로 스캔될 수 있고, 그 다음, 다음 행에서 스캔될 수 있는 식이다. 또는, 블록의 스트링은 주어진 열에서 위에서 아래로 수직으로 스캔될 수 있고, 그 다음, 다음 열에서 스캔될 수 있는 식이다. 도 16의 스트링은 수평으로 스캔된다.
도 16에서, 제 1 오프셋(1651)은 현재 블록(1630)의 제 1 스트링(1641)으로부터 제 1 스트링(1641)의 예측에 사용된 샘플 값을 포함하는 기준 스트링(1661)까지의 변위를 나타낸다. 제 1 스트링(1641) 및 대응하는 참조 스트링(1661) 각각의 길이는 6 개의 샘플 값이다. 참조 스트링은 주어진 스트링과 동일할 수 있거나 또는 참조 스트링은 주어진 스트링의 근사치일 수 있다. 제 2 오프셋(1652)은 현재 블록(1630)의 제 2 스트링(1642)으로부터 제 2 스트링(1642)의 예측에 사용된 샘플 값을 포함하는 기준 스트링(1662)까지의 변위를 나타낸다. 제 2 스트링(1642) 및 대응하는 참조 스트링(1662) 각각의 길이는 14 개의 샘플 값이다. 현재 블록(1630)의 제 3 스트링에 대해 어떠한 오프셋도 도시되지 않았고, 이는 44 개의 샘플의 길이를 갖는다. BV 값과 마찬가지로, 오프셋 값(1651, 1652)은 현재 픽쳐 내의 변위를 나타낸다. 도 16이 수평 스캔을 도시하지만, 현재 블록(1630)은 그 대신 인트라 SC 예측을 위해 수직으로 스캔되는 스트링으로 분할될 수 있다. 블록당, 유닛당 또는 픽쳐당 신택스 엘리먼트는 인트라 SC 예측에 대해 수평 스캔 순서가 사용되는지 또는 수직 스캔 순서가 사용되는지 여부를 나타낼 수 있다.
인트라 SC 예측은, SC 동작을 사용하여 중복성(예컨대 픽쳐 내부에서의 반복된 패턴)을 활용하는 것에 의해 코딩 효율성을 향상시킬 수 있다. 인트라SC 예측은 인트라 BC 예측 또는 인트라 LC 예측보다 더 유연하지만(단지 고정된 구획이 아닌 임의적인 스트링으로의 구획을 허용함), 더 많은 정보(오프셋 값에 부가하여 스트링 길이 값)를 시그널링한다. WPP가 인에이블되지 않은 경우, 후보 참조 스트링은 현재 픽쳐의 재구성된 컨텐츠 내의 임의의 곳에 있을 수 있다. 후보 참조 스트링은 다른 후보 참조 스트링과 중첩할 수 있다. 몇몇 예시적인 구현예에서, 참조 스트링은 현재 스트링과 동일한 슬라이스 및 타일 내로 제한된다. 참조 스트링의 위치는 아래에서 설명되는 바와 같이 하나 이상의 다른 제약, 예를 들면, WPP가 인에이블되는 경우의 제약을 겪을 수도 있다.
인트라 BC 모드, 인트라 LC 모드 또는 인트라 SC 모드에 대한 인트라 카피 예측 동작은 CB(BV 값 또는 다른 오프셋 값이 CB당 또는 그 일부당 시그널링되는 경우) 또는 PB(BV 값 또는 다른 오프셋 값이 PB당 또는 그 일부당 시그널링되는 경우)의 레벨에서 적용될 수 있다. 이 경우, 참조 영역은 현재 영역 또는 현재 영역을 포함하는 블록과 중첩하지 않도록 제한된다. 대안적으로, 인트라 카피 예측 동작은, BV 값 또는 다른 오프셋 값이 PB 또는 CB(또는 그 일부)에 대해 시그널링되는 경우에도 PB 또는 CB 내의 더 작은 섹션에 적용될 수 있다. 예를 들면, 블록의 제 1 섹션의 경우, 참조 영역은 블록 외부의 위치를 포함한다. 그러나, 블록의 제 2 섹션의 경우, 인트라 카피 예측 동작에서 사용되는 참조 영역은 동일한 블록의 이전에 재구성된 제 1 섹션의 위치를 포함할 수 있다. 이러한 방식으로, BV 값 또는 오프셋 값은 동일한 PB 또는 CB의 위치를 참조할 수 있다. 인트라 카피 예측 동작이 PB 또는 CB 내의 섹션에 대해 적용되도록 허용하는 것은 비교적 작은 크기를 갖는 BV 값 또는 다른 오프셋의 사용을 용이하게 한다.
현재 유닛 내의 현재 영역에 대한 참조 영역이 동일한 유닛 내의 위치를 포함할 수 있는 경우, 인코더는 (동일한 슬라이스 및 동일한 타일에 있는) 현재 영역 및 참조 영역의 z 스캔 순서를 고려함으로써 BV 값 또는 다른 오프셋 값의 유효성을 체크할 수 있다. 예를 들면, 인코더는 참조 영역의 우하 위치 (x0 + offsetx + m-1, y0 + offsety + n-1)를 포함하는 블록의 z 스캔 순서가 현재 영역의 좌상 위치(x0, y0)를 포함하는 블록의 z 스캔 순서보다 작은 것을 체크하고, 여기서 오프셋은 오프셋 값을 나타내고 현재 영역 및 참조 영역은 m × n의 치수를 갖는다. 만약 그렇다면, 참조 영역의 우하 위치를 포함하는 블록은 이전에 재구성되었다(그리고 그에 따라 참조 영역의 나머지를 갖는다). 인코더는 또한 오프셋 값이 조건들 offsetx+m≤0 및 offsety+n≤0 중 적어도 하나를 충족하는 것을 체크할 수 있어서, 참조 영역이 현재 영역과 중첩하지 않는 것을 보장한다.
일반적으로, z 스캔 순서는, 픽쳐를 구획하는 유닛의 순차적으로 명시된 순서화를 따른다. 도 17은, 참조 영역의 우하 위치를 포함할 수도 있는 유닛 및 현재 영역(1730)에 대한 예시적인 z 스캔 순서(1700)를 도시한다. 현재 영역(1730)은 CB, PB 또는 다른 블록, 라인, 또는 스트링을 포함하는 직사각형일 수 있다. z 스캔 순서는 일반적으로 한 행의 좌에서 우로 순차적으로 유닛에 대해 할당되고, 연속하는 행에서 위에서 아래로 반복한다. 유닛이 분할되면, z 스캔 순서는 분할된 유닛 내에서, 재귀적으로, 할당된다. H.265/HEVC 표준에 대한 인코딩/디코딩의 구현예의 경우, z 스캔 순서는 CTU 래스터 스캔 패턴(CTU 행에서 좌에서 우로, 연속하는 CTU 행에서 위에서 아래로 반복함)을 따라 CTU 유닛으로 진행한다. CTU가 분할되면, z 스캔 순서는 분할된 CTU 내에서 쿼드트리의 CU에 대한 래스터 스캔 패턴을 따른다. 그리고, CU가 (예를 들면, 다수의 CU로, 또는 다수의 PU로) 분할되면, z 스캔 순서는 분할된 CU 내에서 블록에 대한 래스터 스캔 패턴을 따른다.
몇몇 예시적인 구현예에서, BV 값 또는 다른 오프셋 값은 CU, PU 또는 다른 유닛에 대해 시그널링되고, 유닛의 모든 블록에 적용된다. 컬러 공간 및 컬러 샘플링 레이트에 따라, BV 값 또는 다른 오프셋 값은 스케일링없이 모든 블록에 사용될 수 있거나, 또는 다른 컬러 성분의 블록에 대해 스케일링될 수 있다. 대안적으로, 상이한 BV 값 또는 다른 오프셋 값이 유닛의 상이한 블록에 대해 시그널링 될 수 있다. 몇몇 예시적인 구현에서, 동일한 예측 모드(예를 들면, 인트라 BC 모드)는 유닛의 모든 블록에 적용된다. 대안적으로, 상이한 블록은 상이한 예측 모드를 가질 수 있다.
E. WPP가 인에이블되는 경우 인트라 카피 예측에 대한 제약.
일반적으로, 인트라 BC 예측, 인트라 LC 예측 및 인트라 SC 예측은 픽쳐 내의 이전에 재구성된 샘플 값을 사용하여 동일한 픽쳐의 현재 블록, 라인 또는 스트링의 샘플 값을 예측한다. 일반적으로, WPP가 인에이블되는 경우 이전에 재구성된 샘플 값을 포함하는 픽쳐의 영역은, WPP가 인에이블되지 않은 경우 이전에 재구성된 샘플 값을 포함하는 픽쳐의 영역과 상이하다. 인트라 카피 예측의 경우, WPP가 인에이블되는지 여부에 관계없이, 참조 영역의 위치에 대한 몇몇 제약이 시행된다. WPP가 인에이블되는 경우 참조 영역의 위치에 대한 하나 이상의 다른 제약이 적용된다. 참조 영역의 위치에 대한 제약은 인트라 BC 예측에 대해 허용된 BV 값에 대한 제한 또는 인트라 LC 예측 또는 인트라 SC 예측에 대해 허용된 오프셋 값에 대한 제한의 형태를 취할 수 있다.
도 18은 몇몇 예시적인 구현예에 따라 WPP가 인에이블되는 경우 픽쳐(1810)의 현재 영역(1830)에 대한 참조 영역의 위치에 대한 제약의 예(1800)를 도시한다. 픽쳐(1810)는 CTU 행 및 CTU 열에 의해 편제된다.
현재 영역(1830)은 인트라 카피 모드로 인코딩 또는 디코딩된다. 현재 영역(1830)은 현재 CTU의 일부이다. 현재 CTU의 경우 종속성이 이전 CTU 행으로부터 캐스케이드된다. WPP가 인에이블되는 경우 현재 CTU의 프로세싱이 시작하기 위해, 동일한 행에서 왼쪽의 CTU(들)가 프로세싱되었고, 우상 CTU까지의 이전 행의 CTU가 프로세싱되었다. 마찬가지로, 이들은 이미 프로세싱된 CTU 중 임의의 하나에 대해, 동일한 행의 좌측에 있는 CTU 및 우상 CTU까지의 이전 행의 CTU가 프로세싱되었다. 도 18에 도시된 바와 같이, 이들 이전에 프로세싱된 CTU는 WPP가 인에이블되는 경우 인트라 카피 예측을 위해 이용가능하도록 보장된 재구성된 컨텐츠를 제공한다.
도 18은 현재 픽쳐(1810)의 현재 영역(1830)에 대한 후보 참조 영역의 일부를 도시한다. 네 개의 오프셋 값(1841, 1842, 1843, 1844)은 네 개의 후보 참조 영역에 대한 변위를 나타낸다. 후보 참조 영역은 다른 후보 참조 영역과 중첩할 수 있다. 후보 참조 영역은 현재 픽쳐(1810)의 재구성된 컨텐츠 내의 임의의 곳에 있을 수 있다. WPP가 인에이블되지 않는 경우, 현재 픽쳐의 재구성된 컨텐츠(1810)는 일반적으로 현재 CTU의 왼쪽에 있는 CTU 및 이전 CTU 행의 모든 CTU를 포함한다. 그러나, WPP가 인에이블되는 경우, 도 18에 도시된 바와 같이, 보다 적은 재구성된 컨텐츠가 이용가능하다. 도 18에서, 세 개의 오프셋 값(1841, 1842, 1843)은 유효 참조 영역을 나타낸다. 이들 유효 참조 영역은, WPP가 인에이블되는 경우 인트라 카피 예측을 위해 이용가능하도록 보장된 재구성된 컨텐츠 내의 샘플 값만을 포함한다. 오프셋 값들(1844) 중 하나는 WPP가 인에이블되는 경우 인트라 카피 예측을 위해 이용가능하도록 보장된 재구성된 컨텐츠 외부의 적어도 몇몇 샘플 값을 포함하는 무효 참조 영역을 나타낸다.
1. WPP가 인에이블되는 경우 인트라 카피 모드에 대한 제약으로의 인코딩 및 디코딩.
도 19는 WPP가 인에이블되는 경우, 인트라 카피 예측에 대해 시행되는 규칙으로 인코딩하기 위한 일반화된 기술(1900)을 도시한다. 도 3 또는 도 5a 및 도 5b에 도시된 인코더 또는 다른 인코더와 같은 인코더가 기술(1900)을 수행할 수 있다. 도 20은 WPP가 인에이블되는 경우, 인트라 카피 예측에 대해 시행되는 규칙으로 디코딩하기 위한 일반화된 기술(2000)을 도시한다. 도 4 또는 도 6에 도시된 디코더 또는 다른 디코더와 같은 디코더가 기술(2000)을 수행할 수 있다.
도 19을 참조하면, 인코더는 WPP가 인에이블된 상태에서 픽쳐를 인코딩한다(1910). 인코딩(1910)은 인코딩된 데이터를 생성한다. 인코딩(1910)의 일부로서, 인트라 카피 모드(예를 들면, 인트라 BC 예측, 인트라 LC 예측 또는 인트라 SC 예측을 사용하는 모드)의 경우, 인코더는 WPP에 기인하는 하나 이상의 제한을 시행한다. 인코더는 인코딩된 데이터를 비트스트림의 일부로서 출력한다(1920).
도 20를 참조하면, 디코더는 인코딩된 데이터를 비트스트림의 일부로서 수신한다(2010). 인코딩된 데이터는, 인트라 카피 모드(예를 들면, 인트라 BC 예측, 인트라 LC 예측 또는 인트라 SC 예측을 사용하는 모드)에 대해, WPP에 기인하는 하나 이상의 제한을 충족한다. 디코더는 WPP가 인에이블된 상태에서 인코딩된 데이터를 디코딩한다(2020). 디코딩(2020)은 픽쳐를 재구성한다.
비트스트림의 신택스 엘리먼트는 비디오 시퀀스, 픽쳐의 세트 또는 픽쳐에 대해 WPP가 인에이블되는지 여부를 나타낼 수 있다. 신택스 엘리먼트는 비트스트림에서 SPS 신택스 구조, PPS 신택스 구조(예를 들면, H.265/HEVC 구현예에서 신택스 엘리먼트 entropy_coding_sync_enabled_flag) 또는 다른 신택스 구조로 시그널링될 수 있다.
인트라 카피 모드는 인트라 BC 모드일 수 있다. 이 경우, 픽쳐 내의 현재 블록에 대해, 오프셋 값은 픽쳐 내의 참조 블록에 대한 변위를 나타낸다. 참조 블록은 이전에 재구성된 샘플 값을 포함한다. 또는 인트라 카피 모드는 인트라 LC 모드일 수 있다. 이 경우, 픽쳐의 블록 내의 현재 라인에 대해, 오프셋 값은 픽쳐 내의 참조 라인에 대한 변위를 나타낸다. 참조 라인은 수평 또는 수직일 수 있는 라인 스캔 방향 라인으로 스캔되는 이전에 재구성된 샘플 값을 포함한다. 또는, 인트라 카피 모드는 인트라 SC 모드일 수 있다. 이 경우, 픽쳐의 블록 내의 현재 스트링에 대해, 오프셋 값은 픽쳐 내의 참조 스트링에 대한 변위를 나타낸다. 참조 스트링은 수평 또는 수직일 수 있는 스트링 스캔 순서로 스캔되는 이전에 재구성된 샘플 값을 포함한다. 현재 스트링의 경우, 길이 값은 현재 스트링 및 참조 스트링 각각에 대한 길이를 나타낸다. 또는, 인트라 카피 모드는, 오프셋 값을 사용하여 동일한 픽쳐의 현재 블록, 라인, 스트링 또는 다른 섹션에 대해, 픽쳐의 참조 블록, 라인, 스트링 또는 다른 섹션을 발견하는 몇몇 다른 모드 일 수 있고, 여기서 참조 블록, 라인, 스트링 등은 이전에 재구성된 샘플 값을 포함한다.
WPP에 기인하는 제약(들)은 참조 영역으로부터 현재 영역까지의 수평 변위 값이 현재 영역으로부터 참조 영역까지의 수직 변위 값보다 작거나 그와 같다는 제약을 포함할 수 있다. 예를 들면, 수평 변위 값은, 참조 영역의 우측 에지를 포함하는 WPP 열로부터 현재 영역의 좌측 에지를 포함하는 WPP 열까지의 차이를 측정하고, 수직 변위 값은, 현재 영역의 상부 에지를 포함하는 WPP 행으로부터 참조 영역의 하부 에지를 포함하는 WPP 행까지의 차이를 측정한다. 몇몇 예시적인 구현예에서, WPP 열 각각은 CTU의 열이고, WPP 행 각각은 CTU의 행이다. 대안적으로, WPP에 기인하는 제약(들)은 하나 이상의 다른 및/또는 추가 제약을 포함한다.
인트라 카피 모드가 인트라 BC 모드이면, 현재 영역은 현재 블록이고, 참조 영역은 참조 블록이다. 인트라 카피 모드가 인트라 LC 모드이면, 현재 영역은 현재 라인이고, 참조 영역은 참조 라인이다. 인트라 카피 모드가 인트라 SC 모드이면, 현재 영역은 현재 스트링을 포함하는 직사각형이고, 참조 영역은 참조 스트링을 포함하는 직사각형이다. 인코더 또는 디코더는, 현재 스트링의 시작 위치, 현재 스트링의 종료 위치 및 스트링 스캔 순서(예를 들면, 수평, 수직)에서 현재 스트링의 시작 위치와 종료 위치 사이의 임의의 위치를 포함하는 직사각형을 결정함으로써 현재 스트링을 포함하는 직사각형을 식별할 수 있다. 인코더 또는 디코더는, 현재 스트링을 포함하는 직사각형에 적용된 오프셋 값을 사용하여 참조 스트링을 포함하는 직사각형을 식별할 수 있다.
인코더는 또한 WPP에 기인하지 않는 하나 이상의 다른 제약을 시행할 수 있다. 예를 들어, 인코더는 현재 영역의 좌상 위치 및 참조 영역의 좌상 위치가, 적용가능한 경우, 동일한 슬라이스에 있고, 적용가능한 경우, 동일한 타일에 있는 것을 체크할 수 있다. 다른 예로, 인코더는 현재 영역의 좌상 위치 및 참조 영역의 우하 위치가, 적용가능한 경우, 동일한 슬라이스에 있고, 적용가능한 경우, 동일한 타일에 있는 것을 체크할 수 있다. 또 다른 예로, 인코더는, 하기 세 가지 조건 중 하나가 충족되는 것을 체크할 수 있다: (a) 참조 영역의 하부 에지를 포함하는 CTU 행이, 현재 영역의 상부 에지를 포함하는 CTU 행 위에 있는 것; (b) 참조 영역의 하부 에지를 포함하는 CTU 행이, 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 참조 영역의 우측 에지를 포함하는 CTU 열이 현재 영역의 좌측 에지를 포함하는 CTU 열의 좌측인 것; 및 (c) 참조 영역의 하부 에지를 포함하는 CTU 행이 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 그리고 참조 영역의 우측 에지를 포함하는 CTU 열이 현재 영역의 좌측 에지를 포함하는 CTU 열과 동일하면, 참조 영역의 우하 위치가 현재 영역의 좌상 위치보다 z 스캔 순서에서 더 앞선 것.
하기 섹션들은 몇몇 예시적인 구현예에 따라 WPP가 인에이블되는 경우, 인코더가 인트라 BC 예측, 인트라 LC 예측 및 인트라 SC 예측을 위해 각각 시행할 수 있는 제약의 예를 구체화한다.
2. WPP가 인에이블되는 경우 인트라 BC 예측을 위한 BV 값에 대한 예시적인 제약.
본 섹션은 WPP가 인에이블되는 경우 인트라 BC 예측을 위해 인코더가 시행할 수 있는 제약의 예를 구체화한다. 현재 블록에 대해, 제약은, BV 값에 의해 나타내어지는 후보 참조 블록이, WPP가 인에이블되는 경우에도, 현재 블록이 인코딩 또는 디코딩되는 경우 이용가능할 재구성된 샘플 값을 포함하는 것을 검증한다.
정의. 현재 블록은 현재 픽쳐의 좌상 위치에 대한 위치 (x0, y0)에서 시작한다. 현재 블록의 폭 및 높이는 각각 wblock 및 hblock이다. 현재 블록은 현재 CU의 일부이다. CTU 사이즈는 S이다. 현재 CU는 픽쳐의 좌상 위치에 대한 위치 (xCU, yCU)에서 시작한다. 블록 벡터는 (BVx, BVy)이다.
인코더는 하기 제약들 모두가 충족되는 것을 검증한다.
제 1 제약. 인코더는 위치 (x0, y0) 및 위치 (x0+BVx, y0+BVy)가 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 즉, 인코더는 현재 블록의 좌상 위치 및 참조 블록의 좌상 위치가, 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 두 개의 위치가 상이한 슬라이스 또는 상이한 타일에 있으면, 제 1 제약은 충족되지 않는다.
제 2 제약. 인코더는 위치 (x0, y0) 및 위치 (x0+BVx+wblock-1, y0+BVy+hblock-1)가 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 즉, 인코더는 현재 블록의 좌상 위치 및 참조 블록의 우하 위치가, 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 두 개의 위치가 상이한 슬라이스 또는 상이한 타일에 있으면, 제 2 제약은 충족되지 않는다.
제 1 및 제 2 제약의 경우, 다수의 슬라이스가 사용되지 않으면, 체크된 두 개의 위치는 필수적으로 동일한 슬라이스에 있고, 슬라이스에 대한 제 1 및 제 2 제약은 체크될 필요가 없다. 마찬가지로, 다수의 타일이 사용되지 않으면, 체크된 두 개의 위치는 필수적으로 동일한 타일에 있고, 타일에 대한 제 1 및 제 2 제약은 체크될 필요가 없다. 현재 블록의 모든 위치는 단일 슬라이스 및 단일 타일에 있다. 제 1 및 제 2 제약이 충족되면, 참조 블록의 모든 위치는 또한 그 슬라이스 및 타일에 있다. 인코더는 WPP가 인에이블되는지 여부와 무관하게 제 1 및 제 2 제약을 체크한다.
제 3 제약. 제 3 제약의 경우, 인코더는 하기 세 개의 조건 중 하나가 충족되는 것을 검증한다. 인코더는 WPP가 인에이블되는지 여부와 무관하게 제 3 제약을 체크한다.
제 3 제약의 제 1 조건. 인코더는 (y0+BVy+hblock-1)/S<y0/S 여부를 체크한다. 즉, 인코더는 참조 블록의 하부 에지 (y0+BVy+hblock-1)/S를 포함하는 CTU 행을 계산한다. 인코더는 또한 현재 블록의 상부 에지 y0/S를 포함하는 CTU 행을 계산한다. 그 다음, 인코더는, 참조 블록의 하부 에지를 포함하는 CTU 행이, 현재 블록의 상부 에지를 포함하는 CTU 행 위에 있는지 여부를 체크한다. 만약 그렇다면, 적어도 WPP가 인에이블되지 않은 경우, 참조 블록은 필수적으로 이전에 재구성된 샘플 값을 포함한다.
제 3 제약의 제 2 조건. (y0+BVy+hblock-1)/S==y0/S인 경우, 인코더는 (x0+BVx+wblock-1)/S<x0/S인지 여부를 체크한다. 즉, 참조 블록의 하부 에지를 포함하는 CTU 행이, 현재 블록(동일한 CTU 행)의 상부 에지를 포함하는 CTU 행과 동일하면, 인코더는 (a) 참조 블록의 우측 에지 ((x0+BVx+wblock-1)/S)를 포함하는 CTU 열, 및 (b) 현재 블록의 좌측 에지(x0/S)를 포함하는 CTU 열을 계산한다. 그 다음, 인코더는, 참조 블록의 우측 에지를 포함하는 CTU 열이, 현재 블록의 좌측 에지를 포함하는 CTU 열 좌측에 있는지 여부를 체크한다. 만약 그렇다면, 참조 블록은 필수적으로 이전에 재구성된 샘플 값을 포함한다.
제 3 제약의 제 3 조건. (y0+BVy+hblock-1)/S==y0/S 및 (x0+BVx+wblock-1)/S==x0/S인 경우, 인코더는, 위치 (x0+BVx+wblock-1, y0+yBV+hblock-1)의 z 스캔 순서가 위치 (x0, y0)의 z 스캔 순서보다 작은지 여부를 체크한다. 즉, 참조 블록의 하부 에지를 포함하는 CTU 행이 현재 블록(동일한 CTU 행)의 상부 에지를 포함하는 CTU 행과 동일하고, 참조 블록의 우측 에지를 포함하는 CTU 열이 현재 블록(동일한 CTU 열)의 좌측 에지를 포함하는 CTU 열과 동일하면, 인코더는, 참조 블록의 우하 위치가 현재 블록의 좌상 위치보다 z 스캔 순서에서 더 앞서는지 여부를 체크한다. 제 3 조건은, 현재 CU 내로부터의 예측이 허용되는 경우 적용된다. 현재 CU 내로부터의 예측이 허용되지 않으면, (x0, y0)는 (xCU, yCU)이어야 한다.
제 4 제약. 인코더는 WPP가 인에이블되는 경우 제 4 제약을 체크한다. 제 4 제약의 경우, 인코더는 (x0+BVx+wblock-1)/S-x0/S<=y0/S-(y0+BVy+hblock-1)/S인 것을 검증한다. 즉, 인코더는, 참조 블록의 우측 에지를 포함하는 CTU 열과, 현재 블록의 좌측 에지 (x0+BVx+wblock-1)/S-x0/S를 포함하는 CTU 열 사이의 차이를 계산한다. 인코더는 또한, 현재 블록의 상부 에지를 포함하는 CTU 행과, 참조 블록의 하부 에지 y0/S-(y0+BVy+hblock-1)/S를 포함하는 CTU 행 사이의 차이를 계산한다. 인코더는 (CTU 열 사이의) 제 1 차이가 (CTU 행 사이의) 제 2 차이보다 작거나 동일한 것을 검증한다. 도 8 또는 도 18에서 현재 CTU로부터 위 및 우측으로의 CTU의 톱니형 라인에 도시된 바와 같이, 인코더는, WPP가 인에이블되는 경우 참조 블록이 예측을 위해 이용가능하도록 보장되는 재구성된 컨텐츠의 일부인 것을 검증한다.
3. WPP가 인에이블되는 경우 인트라 LC 예측을 위한 오프셋 값에 대한 예시적인 제약.
본 섹션은 WPP가 인에이블되는 경우 인트라 LC 예측을 위해 인코더가 시행할 수 있는 제약의 예를 구체화한다. 현재 라인에 대해, 제약은, 오프셋 값에 의해 나타내어지는 후보 참조 라인이, WPP가 인에이블되는 경우에도, 현재 라인이 인코딩 또는 디코딩되는 경우 이용가능할 재구성된 샘플 값을 포함하는 것을 검증한다.
정의. 현재 블록은 현재 픽쳐의 좌상 위치에 대한 위치 (x0, y0)에서 시작한다. 현재 블록의 폭 및 높이는 각각 wblock 및 hblock이다. 현재 블록은 현재 CU의 일부이다. CTU 사이즈는 S이다. 현재 라인에 대한 오프셋 값은 (offsetx, offsety)이다. 현재 블록의 L 개의 라인은 이미 프로세싱되었다.
인코더는 현재 블록의 현재 라인의 시작 및 종료 위치를 정의한다. 위치 (xcurr_line_start, ycurr_line_start)는 현재 라인의 시작 위치이고, (xcurr_line_end, ycurr_line_end)는 현재 라인의 종료 위치이다. 수평 스캔(또한 행 모드로 지칭됨)이 사용되는 경우, 모든 라인은 현재 블록의 행이다: (xcurr_line_start, ycurr_line_start) = (x0, y0+L) 및 (xcurr_line_end, ycurr_line_end) = (x0+ wblock-1, y0+L). 수직 스캔(또한 열 모드로 지칭됨)이 사용되는 경우, 모든 라인은 현재 블록의 열이다: (xcurr_line_start, ycurr_line_start) = (x0+L, y0) 및 (xcurr_line_end, ycurr_line_end) = (x0+L, y0+hblock-1).
인코더는 또한 현재 라인을 예측하는 후보 참조 라인의 시작 및 종료 위치를 정의한다. 위치 (xref_line_start, yref_line_start)는 참조 라인의 시작 위치이다. 위치 (xref_line_end, yref_line_end)는 참조 라인의 종료 위치이다. 참조 라인은 행(수평 스캔이 사용되는 경우) 또는 열(수직 스캔이 사용되는 경우)일 수 있다. 수평 스캔(행 모드)이 사용되든 또는 수직 스캔(열 모드)이 사용되든: (xref_line_start, yref_line_start) = (xcurr_line_start, ycurr_line_start) + (offsetx, offsety) 및 (xref_line_end, yref_end) = (xcurr_line_end, ycurr_line_end) + (offsetx, offsety)이다.
인코더는 하기 제약들 모두가 충족되는 것을 검증한다. 이들 제약 중 몇몇의 경우, 현재 블록의 좌상 위치 (x0, y0)가 고려된다. 이러한 제약의 경우, 대안적으로, 현재 라인의 시작 위치 (xcurr_line_start, ycurr_line_start)는 현재 블록의 좌상 위치 (x0, y0) 대신에 체크될 수 있다.
제 1 제약. 인코더는 위치 (x0, y0) 및 위치 (xref_line_start, yref_line_start)가 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 즉, 인코더는 현재 블록의 좌상 위치 및 참조 라인의 시작 위치가, 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 두 개의 위치가 상이한 슬라이스 또는 상이한 타일에 있으면, 제 1 제약은 충족되지 않는다.
제 2 제약. 인코더는 위치 (x0, y0) 및 위치 (xref_line_end, yref_line_end)가 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 즉, 인코더는 현재 블록의 좌상 위치 및 참조 라인의 종료 위치가, 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 두 개의 위치가 상이한 슬라이스 또는 상이한 타일에 있으면, 제 2 제약은 충족되지 않는다.
제 1 및 제 2 제약의 경우, 다수의 슬라이스가 사용되지 않으면, 체크된 두 개의 위치는 필수적으로 동일한 슬라이스에 있고, 슬라이스에 대한 제 1 및 제 2 제약은 체크될 필요가 없다. 마찬가지로, 다수의 타일이 사용되지 않으면, 체크된 두 개의 위치는 필수적으로 동일한 타일에 있고, 타일에 대한 제 1 및 제 2 제약은 체크될 필요가 없다. 현재 라인의 모든 위치는 단일 슬라이스 및 단일 타일에 있다. 제 1 및 제 2 제약이 충족되면, 참조 라인의 모든 위치는 또한 그 슬라이스 및 타일에 있다. 인코더는 WPP가 인에이블되는지 여부와 무관하게 제 1 및 제 2 제약을 체크한다.
제 3 제약. 제 3 제약의 경우, 인코더는 하기 세 개의 조건 중 하나가 충족되는 것을 검증한다. 인코더는 WPP가 인에이블되는지 여부와 무관하게 제 3 제약을 체크한다.
제 3 제약의 제 1 조건. 인코더는 (yref_line_end/S<y0/S 여부를 체크한다. 즉, 인코더는 참조 라인의 하부 에지 또는 위치 yref_line_end/S를 포함하는 CTU 행을 계산한다. 인코더는 또한 현재 블록의 상부 에지 y0/S를 포함하는 CTU 행을 계산한다. 그 다음, 인코더는, 참조 라인의 하부 에지 또는 위치를 포함하는 CTU 행이, 현재 블록의 상부 에지를 포함하는 CTU 행 위에 있는지 여부를 체크한다. 만약 그렇다면, 적어도 WPP가 인에이블되지 않은 경우, 참조 라인은 필수적으로 이전에 재구성된 샘플 값을 포함한다.
제 3 제약의 제 2 조건. yref_line_end/S==y0/S인 경우, 인코더는 xref_line_end/S<x0/S 여부를 체크한다. 즉, 참조 라인의 하부 에지 또는 위치를 포함하는 CTU 행이, 현재 블록(동일한 CTU 행)의 상부 에지를 포함하는 CTU 행과 동일하면, 인코더는 (a) 참조 라인의 우측 에지 또는 위치 (xref_line_end/S)를 포함하는 CTU 열, 및 (b) 현재 블록의 좌측 에지 (x0/S)를 포함하는 CTU 열을 계산한다. 그 다음, 인코더는, 참조 라인의 우측 에지 또는 위치를 포함하는 CTU 열이, 현재 블록의 좌측 에지를 포함하는 CTU 열 좌측에 있는지 여부를 체크한다. 만약 그렇다면, 참조 라인은 필수적으로 이전에 재구성된 샘플 값을 포함한다.
제 3 제약의 제 3 조건. yref_line_end/S==y0/S 및 xref_line_end/S==x0/S인 경우, 인코더는 위치 (xref_line_end, yref_line_end)의 z 스캔 순서가 위치 (xcurr_line_start, ycurr_line_start)의 z 스캔 순서보다 작은지 여부를 체크한다. 즉, 참조 라인의 하부 에지 또는 위치를 포함하는 CTU 행이 현재 블록(동일한 CTU 행)의 상부 에지를 포함하는 CTU 행과 동일하고, 참조 라인의 우측 에지 또는 위치를 포함하는 CTU 열이 현재 블록(동일한 CTU 열)의 좌측 에지를 포함하는 CTU 열과 동일하면, 인코더는, 참조 라인의 종료 위치가 현재 라인의 시작 위치보다 z 스캔 순서에서 더 앞서는지 여부를 체크한다. 제 3 조건은, 현재 CU 내로부터의 예측이 허용되는 경우 적용된다. 현재 CU 내로부터의 예측이 허용되지 않으면, (xcurr_line_start, ycurr_line_start)는 (x0, y0)이어야 한다.
제 4 제약. 인코더는 WPP가 인에이블되는 경우 제 4 제약을 체크한다. 제 4 제약의 경우, 인코더는 xref_line_end/S-x0/S<=y0/S-yref_line_end/S인 것을 검증한다. 즉, 인코더는, 참조 라인의 우측 에지 또는 위치를 포함하는 CTU 열과, 현재 블록의 좌측 에지 xref_line_end/S-x0/S를 포함하는 CTU 열 사이의 차이를 계산한다. 인코더는 또한, 현재 블록의 상부 에지를 포함하는 CTU 행과, 참조 라인의 하부 에지 또는 위치 y0/S-yref_line_end/S를 포함하는 CTU 행 사이의 차이를 계산한다. 인코더는 (CTU 열 사이의) 제 1 차이가 (CTU 행 사이의) 제 2 차이보다 작거나 동일한 것을 검증한다.
4. WPP가 인에이블되는 경우 인트라 SC 예측을 위한 오프셋 값에 대한 예시적인 제약.
본 섹션은 WPP가 인에이블되는 경우 인트라 SC 예측을 위해 인코더가 시행할 수 있는 제약의 예를 구체화한다. 현재 스트링에 대해, 제약은, 오프셋 값 및 길이 값에 의해 나타내어지는 후보 참조 스트링이, WPP가 인에이블되는 경우에도, 현재 스트링이 인코딩 또는 디코딩되는 경우 이용가능할 재구성된 샘플 값을 포함하는 것을 검증한다.
정의. 현재 블록은 현재 픽쳐의 좌상 위치에 대한 위치 (x0, y0)에서 시작한다. 현재 블록의 폭 및 높이는 각각 wblock 및 hblock이다. 현재 블록은 현재 CU의 일부이다. CTU 사이즈는 S이다. 현재 스트링에 대한 오프셋 값은 (offsetx, offsety)이고, 현재 스트링에 대한 스트링 길이 값은 lengthstring이다. 현재 블록의 K 개의 픽셀은 인트라 SC 예측을 사용하여 이미 프로세싱되었다.
인코더는 현재 블록의 현재 스트링의 시작 및 종료 위치를 정의한다. 위치 (xcurr_string_start, ycurr_string_start)는 현재 스트링의 시작 위치이고, (xcurr_string_end, ycurr_string_end)는 현재 스트링의 종료 위치이다. 인코더는 또한, 현재 스트링의 시작 위치, 현재 스트링의 종료 위치, 및 현재 스트링의 시작 위치와 종료 위치 사이의 임의의 (스트링 스캔 순서에서의) 위치를 포함하는 경계 직사각형을 정의한다. 경계 직사각형의 좌상 위치는 (xcurr_rect_TL, ycurr_rect_TL)이다. 경계 직사각형의 우하 위치는 (xcurr_rect_BR, ycurr_rect_BR)이다. 인코더는 오프셋 값만큼 변위되는 경계 직사각형으로서 (참조 스트링을 포함하는) 참조 직사각형을 정의한다. 참조 직사각형의 좌상 위치는 (xref_rect_TL, yref_rect_TL)이다. 경계 직사각형의 우하 위치는 (xref_rect_BR, yref_rect_BR)이다.
수평 스트링 스캔이 (위 행으로부터 아래 행으로, 현재 블록의 행에서 좌에서 우로) 사용되는 경우, 시작 위치는 (xcurr_string_start, ycurr_string_start) = (x0+K% wblock, y0+K/wblock)이다. 종료 위치는 (xcurr_string_end, ycurr_string_end) = (x0+ (K+lengthstring-1) % wblock, y0+ (K+lengthstring-1)/wblock)이다. 현재 스트링의 시작 위치 및 종료 위치가 현재 블록의 동일한 행에 있는 경우, (xcurr_rect_TL, ycurr_rect_TL) = (xcurr_string_start, ycurr_string_start) 및 (xcurr_rect_BR, ycurr_rect_BR) = (xcurr_string_end, ycurr_string_end)이다. 그렇지 않으면, 경계 직사각형의 좌상 위치는 (xcurr_rect_TL, ycurr_rect_TL) = (x0, y0+K/wblock)이고, 경계 직사각형의 우하 위치는 (xcurr_rect_BR, ycurr_rect_BR) = (x0+wblock-1), y0+ (K+lengthstring-1)/wblock)이다.
수직 스트링 스캔이 (좌측 열로부터 우측 열로, 현재 블록의 열에서 위에서 아래로) 사용되는 경우, 시작 위치는 (xcurr_string_start, ycurr_string_start) = (x0+K/hblock, y0+K% hblock)이다. 종료 위치는 (xcurr_string_end, ycurr_string_end) = (x0+ (K+lengthstring-1)/hblock, y0+ (K+lengthstring-1) % hblock)이다. 현재 스트링의 시작 위치 및 종료 위치가 현재 블록의 동일한 열에 있는 경우, (xcurr_rect_TL, ycurr_rect_TL) = (xcurr_string_start, ycurr_string_start) 및 (xcurr_rect_BR, ycurr_rect_BR) = (xcurr_string_end, ycurr_string_end)이다. 그렇지 않으면, 경계 직사각형의 좌상 위치는 (xcurr_rect_TL, ycurr_rect_TL) = (x0+K/hblock, y0)이고, 경계 직사각형의 우하 위치는 (xcurr_rect_BR, ycurr_rect_BR) = (x0+ (K+lengthstring -1)/hblock), y0+hblock-1)이다.
수평 스캔이 사용되든 또는 수직 스캔이 사용되든, 참조 직사각형의 좌상 위치는 (xref_rect_TL, yref_rect_TL) = (xcurr_rect_TL, ycurr_rect_TL) + (offsetx, offsety)이고, 참조 직사각형의 우하 위치는 (xref_rect_BR, yref_rect_BR) = (xcurr_rect_BR, ycurr_rect_BR) + (offsetx, offsety)이다. 마지막으로, 참조 스트링의 시작 위치는 (xref_string_start, yref_string_start) = (xcurr_string_start, ycurr_string_start) + (offsetx, offsety)이다.
인코더는 하기 제약들 모두가 충족되는 것을 검증한다. 이들 제약 중 몇몇의 경우, 현재 블록의 좌상 위치 (x0, y0)가 고려된다. 이러한 제약의 경우, 대안적으로, 현재 스트링의 시작 위치 또는 경계 직사각형의 좌상 위치는 현재 블록의 좌상 위치 (x0, y0) 대신에 체크될 수 있다.
제 1 제약. 인코더는 위치 (x0, y0) 및 위치 (xref_rect_TL, yref_rect_TL)가 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 즉, 인코더는 현재 블록의 좌상 위치 및 참조 직사각형의 좌상 위치가, 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 두 개의 위치가 상이한 슬라이스 또는 상이한 타일에 있으면, 제 1 제약은 충족되지 않는다.
제 2 제약. 인코더는 위치 (x0, y0) 및 위치 (xref_rect_BR, yref_rect_BR)가 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 즉, 인코더는 현재 블록의 좌상 위치 및 참조 직사각형의 우하 위치가, 동일한 슬라이스 및 동일한 타일에 있는 것을 검증한다. 두 개의 위치가 상이한 슬라이스 또는 상이한 타일에 있으면, 제 2 제약은 충족되지 않는다.
제 1 및 제 2 제약의 경우, 다수의 슬라이스가 사용되지 않으면, 체크된 두 개의 위치는 필수적으로 동일한 슬라이스에 있고, 슬라이스에 대한 제 1 및 제 2 제약은 체크될 필요가 없다. 마찬가지로, 다수의 타일이 사용되지 않으면, 체크된 두 개의 위치는 필수적으로 동일한 타일에 있고, 타일에 대한 제 1 및 제 2 제약은 체크될 필요가 없다. 현재 스트링의 모든 위치는 단일 슬라이스 및 단일 타일에 있다. 제 1 및 제 2 제약이 충족되면, 참조 직사각형(및 그에 따른 참조 스트링)의 모든 위치는 또한 그 슬라이스 및 타일에 있다. 인코더는 WPP가 인에이블되는지 여부와 무관하게 제 1 및 제 2 제약을 체크한다.
제 3 제약. 제 3 제약의 경우, 인코더는 하기 조건 중 하나 이상이 충족되는 것을 검증한다. 인코더는 WPP가 인에이블되는지 여부와 무관하게 제 3 제약을 체크한다.
제 3 제약의 제 1 조건. 인코더는 yref_rect_BR/S<y0/S 여부를 체크한다. 즉, 인코더는 참조 직사각형의 하부 에지 yref_rect_BR/S를 포함하는 CTU 행을 계산한다. 인코더는 또한 현재 블록의 상부 에지 y0/S를 포함하는 CTU 행을 계산한다. 그 다음, 인코더는, 참조 직사각형의 하부 에지를 포함하는 CTU 행이, 현재 블록의 상부 에지를 포함하는 CTU 행 위에 있는지 여부를 체크한다. 만약 그렇다면, 적어도 WPP가 인에이블되지 않은 경우, 참조 직사각형은 필수적으로 이전에 재구성된 샘플 값을 포함한다.
제 3 제약의 제 2 조건. yref_rect_BR/S==y0/S인 경우, 인코더는 xref_rect_BR/S<x0/S 여부를 체크한다. 즉, 참조 직사각형의 하부 에지를 포함하는 CTU 행이, 현재 블록(동일한 CTU 행)의 상부 에지를 포함하는 CTU 행과 동일하면, 인코더는 (a) 참조 직사각형의 우측 에지 (xref_rect_BR/S)를 포함하는 CTU 열, 및 (b) 현재 블록의 좌측 에지 (x0/S)를 포함하는 CTU 열을 계산한다. 그 다음, 인코더는, 참조 직사각형의 우측 에지를 포함하는 CTU 열이, 현재 블록의 좌측 에지를 포함하는 CTU 열 좌측에 있는지 여부를 체크한다. 만약 그렇다면, 참조 직사각형은 필수적으로 이전에 재구성된 샘플 값을 포함한다.
제 3 제약의 제 3 조건. yref_rect_BR/S==y0/S 및 xref_rect_BR/S==x0/S인 경우, 인코더는 위치 (xref_rect_BR, yref_rect_BR)의 z 스캔 순서가 위치 (x0, y0)의 z 스캔 순서보다 작은지 여부를 체크한다. 즉, 참조 직사각형의 하부 에지를 포함하는 CTU 행이 현재 블록(동일한 CTU 행)의 상부 에지를 포함하는 CTU 행과 동일하고, 참조 직사각형의 우측 에지를 포함하는 CTU 열이 현재 블록(동일한 CTU 열)의 좌측 에지를 포함하는 CTU 열과 동일하면, 인코더는, 참조 직사각형의 우하 위치가 현재 블록의 좌상 위치보다 z 스캔 순서에서 더 앞서는지 여부를 체크한다.
제 3 제약의 제 4 조건. 현재 CU 내로부터의 예측이 허용되면, yref_string_start==y0인 경우, 인코더는 xref_string_start<x0을 체크한다. 즉, 현재 CU 내로부터의 예측이 허용되면, 제 3 제약은, 현재 스트링 및 참조 스트링이 동일한 행에서 시작하고 참조 스트링이 현재 스트링의 좌측에서 시작하는 경우 충족될 수 있다.
제 4 제약. 인코더는 WPP가 인에이블되는 경우 제 4 제약을 체크한다. 제 4 제약의 경우, 인코더는 xref_rect_BR/S-x0/S<=y0/S-yref_rect_BR/S인 것을 검증한다. 즉, 인코더는, 참조 직사각형의 우측 에지 또는 위치를 포함하는 CTU 열과, 현재 블록의 좌측 에지 xref_rect_BR/S-x0/S를 포함하는 CTU 열 사이의 차이를 계산한다. 인코더는 또한, 현재 블록의 상부 에지를 포함하는 CTU 행과, 참조 직사각형의 하부 에지 또는 위치 y0/S-yref_rect_BR/S를 포함하는 CTU 행 사이의 차이를 계산한다. 인코더는 (CTU 열 사이의) 제 1 차이가 (CTU 행 사이의) 제 2 차이보다 작거나 동일한 것을 검증한다.
제 5 제약. 제 5 제약의 경우, 인코더는 K+ lengthstring<=wblock*hblock인 것을 검증한다. 즉, 인코더는 이미 프로세싱된 위치의 카운트를 고려하여 현재 블록이 현재 스트링에 대해 충분한 위치를 포함하는 것을 체크한다.
F. 대안예 및 변형예
본원에서 설명되는 예 중 많은 것에서, 인트라 카피 예측 및 모션 보상은 별개의 컴포넌트 또는 프로세스에서 구현되고, 오프셋 추정 및 모션 추정은 별개의 컴포넌트 또는 프로세스에서 구현된다. 대안적으로, 인트라 카피 예측은 모션 보상의 특수한 경우로서 구현될 수 있고, 오프셋 추정은 모션 추정의 특수한 경우로서 구현될 수 있는데, 이것에 대해서는 현재 픽쳐가 참조 픽쳐로서 사용된다. 이러한 구현예에서, 오프셋 값은, 인트라 픽쳐 예측이 아니라 (현재 픽쳐 내에서) 인트라 카피 예측을 위해 단지 사용되는 MV 값으로서 시그널링될 수 있다. 용어가 본원에서 사용될 때, "인트라 카피 예측"은, 그 예측이 인트라 픽쳐 예측 모듈을 사용하여 제공되든, 모션 보상 모듈을 사용하여 제공되든, 또는 어떤 다른 모듈을 사용하여 제공되든 간에, 현재 픽쳐 내에서의 예측을 나타낸다. 마찬가지로, BV 값 또는 다른 오프셋 값은 MV 값을 사용하여 또는 상이한 타입의 파라미터 또는 신택스 엘리먼트를 사용하여 표현될 수 있고, 오프셋 추정은 인트라 픽쳐 추정 모듈, 모션 추정 모듈 또는 어떤 다른 모듈을 사용하여 제공될 수 있다.
개시된 발명의 원칙이 적용될 수도 있는 많은 가능한 실시형태의 관점에서, 예시된 실시형태는 단지 본 발명의 바람직한 예에 불과하며 본 발명의 범위를 제한하는 것으로 간주되어선 안된다는 것이 인식되어야 한다. 대신, 본 발명의 범위는 하기의 청구범위에 의해 정의된다. 따라서, 이들 특허청구범위의 취지와 범위 내에 있는 모든 것을 본 발명으로서 주장한다.

Claims (21)

  1. 컴퓨팅 시스템에서의 방법으로서,
    파면 병렬 프로세싱(wavefront parallel processing; "WPP")이 인에이블된 상태에서 픽쳐를 인코딩하는 단계 - 상기 인코딩하는 단계는, 상기 픽쳐의 현재 영역에 대한 인트라 카피 모드의 경우, 상기 픽쳐의 참조 영역의 위치에 대한 하나 이상의 제약(constraint)을 시행하는 것을 포함하여 인코딩된 데이터를 생성하고, 상기 하나 이상의 제약은, 상기 참조 영역이 상기 현재 영역의 위에 그리고 상기 현재 영역의 우측에 있는 경우, 상기 참조 영역으로부터 상기 현재 영역까지의 수평 변위 값이 상기 현재 영역으로부터 상기 참조 영역까지의 수직 변위 값보다 작거나 그와 같다는 제약을 포함함 -; 및
    상기 인코딩된 데이터를 비트스트림의 일부로서 출력하는 단계
    를 포함하는 것인 컴퓨팅 시스템에서의 방법.
  2. 제1항에 있어서,
    상기 수평 변위 값은, 상기 참조 영역의 우측 에지를 포함하는 WPP 열로부터 상기 현재 영역의 좌측 에지를 포함하는 WPP 열까지의 차이를 측정하고,
    상기 수직 변위 값은, 상기 현재 영역의 상부(top) 에지를 포함하는 WPP 행으로부터 상기 참조 영역의 하부(bottom) 에지를 포함하는 WPP 행까지의 차이를 측정하는 것인 컴퓨팅 시스템에서의 방법.
  3. 제2항에 있어서,
    상기 WPP 열들 각각은 코딩 트리 유닛(coding tree unit; "CTU")들의 열이고, 상기 WPP 행들 각각은 CTU들의 행인 것인 컴퓨팅 시스템에서의 방법.
  4. 제1항에 있어서,
    상기 인트라 카피 모드의 경우, 상기 하나 이상의 제약은 또한,
    (1) 상기 현재 영역의 좌상(top-left) 위치 및 상기 참조 영역의 좌상 위치가, 적용가능한 경우, 동일한 슬라이스에 있고 그리고 적용가능한 경우, 동일한 타일에 있는 것과,
    (2) 상기 현재 영역의 좌상 위치 및 상기 참조 영역의 우하(bottom-right) 위치가, 적용가능한 경우, 동일한 슬라이스에 있고 그리고 적용가능한 경우, 동일한 타일에 있는 것과,
    (3) 세 개의 조건 중 하나가 충족되는 것을 포함하고,
    상기 세 개의 조건은,
    (a) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이, 상기 현재 영역의 상부 에지를 포함하는 CTU 행 위에 있는 것과,
    (b) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이, 상기 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 상기 참조 영역의 우측 에지를 포함하는 CTU 열이 상기 현재 영역의 좌측 에지를 포함하는 CTU 열의 좌측인 것과,
    (c) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이 상기 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 그리고 상기 참조 영역의 우측 에지를 포함하는 CTU 열이 상기 현재 영역의 좌측 에지를 포함하는 CTU 열과 동일하면, 상기 참조 영역의 우하 위치가 상기 현재 영역의 좌상 위치보다 z 스캔 순서에 있어서 더 앞선 것인 컴퓨팅 시스템에서의 방법.
  5. 제1항에 있어서,
    상기 인트라 카피 모드는 인트라 블록 카피 모드, 인트라 라인 카피 모드, 및 인트라 스트링 카피 모드 중 하나이고,
    상기 인트라 카피 모드가 상기 인트라 블록 카피 모드이면, 상기 현재 영역은 현재 블록이고, 상기 참조 영역은 참조 블록이고,
    상기 인트라 카피 모드가 상기 인트라 라인 카피 모드이면, 상기 현재 영역은 현재 라인이고, 상기 참조 영역은 참조 라인이고,
    상기 인트라 카피 모드가 상기 인트라 스트링 카피 모드이면, 상기 현재 영역은 현재 스트링을 포함하는 직사각형이고, 상기 참조 영역은 참조 스트링을 포함하는 직사각형인 것인 컴퓨팅 시스템에서의 방법.
  6. 제5항에 있어서,
    상기 인트라 카피 모드가 상기 인트라 스트링 카피 모드인 경우,
    상기 현재 스트링의 시작 위치, 상기 현재 스트링의 종료 위치, 및 스트링 스캔 순서에서 상기 현재 스트링의 시작 위치와 종료 위치 사이의 임의의 위치들을 포함하는 직사각형을 결정함으로써, 상기 현재 스트링을 포함하는 직사각형을 식별하는 단계와,
    상기 현재 스트링을 포함하는 직사각형에 적용된 오프셋 값을 사용하여, 상기 참조 스트링을 포함하는 직사각형을 식별하는 단계를 더 포함하는 컴퓨팅 시스템에서의 방법.
  7. 제1항에 있어서,
    상기 현재 영역은 상기 픽쳐의 현재 블록이고, 상기 참조 영역은 상기 픽쳐의 참조 블록이고, 상기 인트라 카피 모드는 인트라 블록 카피 모드이고, 상기 인트라 블록 카피 모드에 따라, 상기 현재 블록에 대해, 오프셋 값은 상기 참조 블록에 대한 변위를 나타내고, 상기 참조 블록은 이전에 재구성된 샘플 값들을 포함하는 것인 컴퓨팅 시스템에서의 방법.
  8. 제1항에 있어서,
    상기 현재 영역은 상기 픽쳐의 현재 스트링을 포함하는 직사각형이고, 상기 참조 영역은 상기 픽쳐의 참조 스트링을 포함하는 직사각형이고,
    상기 인트라 카피 모드는 인트라 스트링 카피 모드이고, 상기 인트라 스트링 카피 모드에 따라, 상기 현재 스트링에 대해:
    오프셋 값은 상기 참조 스트링에 대한 변위를 나타내고, 상기 참조 스트링은 스트링 스캔 순서로 스캔되는 이전에 재구성된 샘플 값들을 포함하고,
    길이 값은 상기 현재 스트링 및 상기 참조 스트링 각각에 대한 길이를 나타내는 컴퓨팅 시스템에서의 방법.
  9. 제1항에 있어서,
    상기 현재 영역은 상기 픽쳐의 현재 라인이고, 상기 참조 영역은 상기 픽쳐의 참조 라인이고,
    상기 인트라 카피 모드는 인트라 라인 카피 모드이고, 상기 인트라 라인 카피 모드에 따라, 상기 현재 라인에 대해, 오프셋 값은 상기 참조 라인에 대한 변위를 나타내고, 상기 참조 라인은 라인 스캔 방향으로 스캔되는 이전에 재구성된 샘플 값들을 포함하는 것인 컴퓨팅 시스템에서의 방법.
  10. 컴퓨터 실행가능한 명령어들을 저장한 컴퓨터 판독가능한 저장 장치에 있어서, 상기 컴퓨터 실행가능한 명령어들은, 하나 이상의 프로세싱 유닛이 상기 컴퓨터 실행가능한 명령어들로 프로그래밍될 때 상기 하나 이상의 프로세싱 유닛으로 하여금,
    파면 병렬 프로세싱(wavefront parallel processing; "WPP")이 인에이블된 상태에서 픽쳐를 인코딩하는 동작 - 상기 인코딩하는 단계는, 상기 픽쳐의 현재 영역에 대한 인트라 카피 모드의 경우, 상기 픽쳐의 참조 영역의 위치에 대한 하나 이상의 제약(constraint)을 시행하는 것을 포함하여 인코딩된 데이터를 생성하고, 상기 하나 이상의 제약은, 상기 참조 영역이 상기 현재 영역의 위에 그리고 상기 현재 영역의 우측에 있는 경우, 상기 참조 영역으로부터 상기 현재 영역까지의 수평 변위 값이 상기 현재 영역으로부터 상기 참조 영역까지의 수직 변위 값보다 작거나 그와 같다는 제약을 포함함 -; 및
    상기 인코딩된 데이터를 비트스트림의 일부로서 출력하는 동작
    을 포함하는 동작들을 수행하게 하기 위한 것인 컴퓨터 판독가능한 저장 장치.
  11. 제10항에 있어서,
    상기 수평 변위 값은, 상기 참조 영역의 우측 에지를 포함하는 WPP 열로부터 상기 현재 영역의 좌측 에지를 포함하는 WPP 열까지의 차이를 측정하고,
    상기 수직 변위 값은, 상기 현재 영역의 상부 에지를 포함하는 WPP 행으로부터 상기 참조 영역의 하부 에지를 포함하는 WPP 행까지의 차이를 측정하는 것인 컴퓨터 판독가능한 저장 장치.
  12. 제11항에 있어서,
    상기 WPP 열들 각각은 코딩 트리 유닛(coding tree unit; "CTU")들의 열이고, 상기 WPP 행들 각각은 CTU들의 행인 것인 컴퓨터 판독가능한 저장 장치.
  13. 제10항에 있어서,
    상기 현재 영역은 현재 블록이고, 상기 참조 영역은 이전에 재구성된 샘플 값들을 포함하는 참조 블록이고, 상기 인트라 카피 모드는 인트라 블록 카피 모드이고, 상기 인트라 블록 카피 모드에 따라, 상기 현재 블록에 대해, 오프셋 값은 상기 픽쳐의 상기 참조 블록에 대한 변위를 나타내는 것인 컴퓨터 판독가능한 저장 장치.
  14. 컴퓨터 시스템에 있어서,
    파면 병렬 프로세싱(wavefront parallel processing; "WPP")이 인에이블된 상태에서 픽쳐를 인코딩하여 인코딩된 데이터를 생성하도록 구성된 비디오 인코더 - 상기 비디오 인코더는, 상기 픽쳐의 현재 영역에 대한 인트라 카피 모드의 경우, 상기 픽쳐의 참조 영역의 위치에 대한 하나 이상의 제약(constraint)을 시행하도록 구성되고, 상기 하나 이상의 제약은, 상기 참조 영역이 상기 현재 영역의 위에 그리고 상기 현재 영역의 우측에 있는 경우, 상기 참조 영역으로부터 상기 현재 영역까지의 수평 변위 값이 상기 현재 영역으로부터 상기 참조 영역까지의 수직 변위 값보다 작거나 그와 같다는 제약을 포함함 -; 및
    상기 인코딩된 데이터를 비트스트림의 일부로서 출력하도록 구성된 버퍼
    를 포함하는 컴퓨터 시스템.
  15. 제14항에 있어서,
    상기 수평 변위 값은, 상기 참조 영역의 우측 에지를 포함하는 WPP 열로부터 상기 현재 영역의 좌측 에지를 포함하는 WPP 열까지의 차이를 측정하고,
    상기 수직 변위 값은, 상기 현재 영역의 상부 에지를 포함하는 WPP 행으로부터 상기 참조 영역의 하부 에지를 포함하는 WPP 행까지의 차이를 측정하는 것인 컴퓨터 시스템.
  16. 제15항에 있어서,
    상기 WPP 열들 각각은 코딩 트리 유닛(coding tree unit; "CTU")들의 열이고, 상기 WPP 행들 각각은 CTU들의 행인 것인 컴퓨터 시스템.
  17. 제14항에 있어서,
    상기 현재 영역은 현재 블록이고, 상기 참조 영역은 이전에 재구성된 샘플 값들을 포함하는 참조 블록이고, 상기 인트라 카피 모드는 인트라 블록 카피 모드이고, 상기 인트라 블록 카피 모드에 따라, 상기 현재 블록에 대해, 오프셋 값은 상기 픽쳐의 상기 참조 블록에 대한 변위를 나타내는 것인, 컴퓨터 시스템.
  18. 제14항에 있어서,
    상기 인트라 카피 모드의 경우, 상기 하나 이상의 제약은 또한,
    (1) 상기 현재 영역의 좌상(top-left) 위치 및 상기 참조 영역의 좌상 위치가, 적용가능한 경우, 동일한 슬라이스에 있고 그리고 적용가능한 경우, 동일한 타일에 있는 것과,
    (2) 상기 현재 영역의 좌상 위치 및 상기 참조 영역의 우하(bottom-right) 위치가, 적용가능한 경우, 동일한 슬라이스에 있고 그리고 적용가능한 경우, 동일한 타일에 있는 것을 포함하는 것인, 컴퓨터 시스템.
  19. 제18항에 있어서,
    상기 인트라 카피 모드의 경우, 상기 하나 이상의 제약은 또한,
    (3) 세 개의 조건 중 하나가 충족되는 것을 포함하고,
    상기 세 개의 조건은,
    (a) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이, 상기 현재 영역의 상부 에지를 포함하는 CTU 행 위에 있는 것과,
    (b) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이, 상기 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 상기 참조 영역의 우측 에지를 포함하는 CTU 열이 상기 현재 영역의 좌측 에지를 포함하는 CTU 열의 좌측인 것과,
    (c) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이 상기 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 그리고 상기 참조 영역의 우측 에지를 포함하는 CTU 열이 상기 현재 영역의 좌측 에지를 포함하는 CTU 열과 동일하면, 상기 참조 영역의 우하 위치가 상기 현재 영역의 좌상 위치보다 z 스캔 순서에 있어서 더 앞선 것인 컴퓨터 시스템.
  20. 제10항에 있어서,
    상기 인트라 카피 모드의 경우, 상기 하나 이상의 제약은 또한,
    (1) 상기 현재 영역의 좌상(top-left) 위치 및 상기 참조 영역의 좌상 위치가, 적용가능한 경우, 동일한 슬라이스에 있고 그리고 적용가능한 경우, 동일한 타일에 있는 것과,
    (2) 상기 현재 영역의 좌상 위치 및 상기 참조 영역의 우하(bottom-right) 위치가, 적용가능한 경우, 동일한 슬라이스에 있고 그리고 적용가능한 경우, 동일한 타일에 있는 것을 포함하는 것인, 컴퓨터 판독가능한 저장 장치.
  21. 제20항에 있어서,
    상기 인트라 카피 모드의 경우, 상기 하나 이상의 제약은 또한,
    (3) 세 개의 조건 중 하나가 충족되는 것을 포함하고,
    상기 세 개의 조건은,
    (a) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이, 상기 현재 영역의 상부 에지를 포함하는 CTU 행 위에 있는 것과,
    (b) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이, 상기 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 상기 참조 영역의 우측 에지를 포함하는 CTU 열이 상기 현재 영역의 좌측 에지를 포함하는 CTU 열의 좌측인 것과,
    (c) 상기 참조 영역의 하부 에지를 포함하는 CTU 행이 상기 현재 영역의 상부 에지를 포함하는 CTU 행과 동일하면, 그리고 상기 참조 영역의 우측 에지를 포함하는 CTU 열이 상기 현재 영역의 좌측 에지를 포함하는 CTU 열과 동일하면, 상기 참조 영역의 우하 위치가 상기 현재 영역의 좌상 위치보다 z 스캔 순서에 있어서 더 앞선 것인 컴퓨터 판독가능한 저장 장치.
KR1020177011675A 2014-09-30 2014-09-30 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙 KR102245704B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020217010079A KR102330740B1 (ko) 2014-09-30 2014-09-30 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/087885 WO2016049839A1 (en) 2014-09-30 2014-09-30 Rules for intra-picture prediction modes when wavefront parallel processing is enabled

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020217010079A Division KR102330740B1 (ko) 2014-09-30 2014-09-30 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙

Publications (2)

Publication Number Publication Date
KR20170063885A KR20170063885A (ko) 2017-06-08
KR102245704B1 true KR102245704B1 (ko) 2021-04-27

Family

ID=55629266

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020217010079A KR102330740B1 (ko) 2014-09-30 2014-09-30 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙
KR1020177011675A KR102245704B1 (ko) 2014-09-30 2014-09-30 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020217010079A KR102330740B1 (ko) 2014-09-30 2014-09-30 파면 병렬 프로세싱이 인에이블되는 경우의 인트라 픽쳐 예측 모드에 대한 규칙

Country Status (10)

Country Link
US (4) US10812817B2 (ko)
EP (2) EP3202150B1 (ko)
JP (1) JP2017535145A (ko)
KR (2) KR102330740B1 (ko)
CN (1) CN105874795B (ko)
AU (1) AU2014408228B2 (ko)
CA (2) CA2959682C (ko)
MX (1) MX2017004211A (ko)
RU (1) RU2679201C2 (ko)
WO (1) WO2016049839A1 (ko)

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102257269B1 (ko) 2013-10-14 2021-05-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐
CA2925183C (en) 2013-10-14 2020-03-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
EP3058736B1 (en) 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
JP6355744B2 (ja) 2014-01-03 2018-07-11 マイクロソフト テクノロジー ライセンシング,エルエルシー ビデオ及び画像符号化/デコーディングにおけるブロックベクトル予測
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
EP4044602A1 (en) 2014-03-14 2022-08-17 Vid Scale, Inc. Palette coding for screen content coding
US10136141B2 (en) * 2014-06-11 2018-11-20 Qualcomm Incorporated Determining quantization parameter (QP) values and delta QP values for palette coded blocks in video coding
EP3158734A4 (en) 2014-06-19 2017-04-26 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes
US20160014415A1 (en) * 2014-07-08 2016-01-14 Mediatek Inc. Method and apparatus for performing wave-front parallel encoding procedure with constraint on coding mode and/or quantization parameter selection
CA2959682C (en) 2014-09-30 2022-12-06 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
CN111131818B (zh) 2014-10-01 2023-05-26 株式会社Kt 对视频信号进行解码的方法和对视频信号进行编码的方法
GB2531001B (en) * 2014-10-06 2019-06-05 Canon Kk Method and apparatus for vector encoding in video coding and decoding
US10212445B2 (en) * 2014-10-09 2019-02-19 Qualcomm Incorporated Intra block copy prediction restrictions for parallel processing
WO2016074627A1 (en) * 2014-11-12 2016-05-19 Mediatek Inc. Methods of escape pixel coding in index map coding
CN105704491B (zh) * 2014-11-28 2020-03-13 同济大学 图像编码方法、解码方法、编码装置和解码装置
CN107211136B (zh) * 2015-01-30 2019-10-29 联发科技股份有限公司 具有大字母表的源样本的熵编码与熵解码的方法
US9900624B2 (en) * 2015-02-05 2018-02-20 Mediatek Inc. Methods and apparatus of decoding process for palette syntax
US9955185B2 (en) * 2015-02-12 2018-04-24 Mediatek Inc. Method and apparatus of constrained intra block copy for coding video
CN107683606B (zh) * 2015-06-05 2021-11-05 索尼公司 图像处理装置和图像处理方法
GB2539211A (en) * 2015-06-08 2016-12-14 Canon Kk Enhanced coding and decoding using intra block copy mode
WO2016197314A1 (en) 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US20160366439A1 (en) * 2015-06-12 2016-12-15 Qualcomm Incorporated Palette copy extension
CN107071450B (zh) * 2016-02-10 2021-07-27 同济大学 数据压缩的编码、解码方法及装置
CN109076241B (zh) * 2016-05-04 2023-06-23 微软技术许可有限责任公司 利用样本值的非相邻参考线进行帧内图片预测
FR3068557A1 (fr) * 2017-07-05 2019-01-04 Orange Procede de codage et decodage d'images,dispositif de codage et decodage et programmes d'ordinateur correspondants
US10986349B2 (en) 2017-12-29 2021-04-20 Microsoft Technology Licensing, Llc Constraints on locations of reference blocks for intra block copy prediction
GB2570879B (en) * 2018-02-06 2022-08-17 Advanced Risc Mach Ltd Encoding data arrays
EP3777168B1 (en) * 2018-03-29 2023-07-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Accelerating video encoding and decoding
CN118138779A (zh) * 2018-06-01 2024-06-04 夏普株式会社 图像解码装置以及图像编码装置
TWI792578B (zh) * 2018-07-09 2023-02-11 弗勞恩霍夫爾協會 用於經編碼圖像多樣化空間劃分之編碼器、解碼器、編碼方法及解碼方法
US11606575B2 (en) 2018-07-10 2023-03-14 Qualcomm Incorporated Multiple history based non-adjacent MVPs for wavefront processing of video coding
WO2020058894A1 (en) 2018-09-19 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. Multiple prediction blocks for one intra-coded block
US11172236B2 (en) 2018-09-21 2021-11-09 Tencent America LLC Method and apparatus for video decoding that defines a search range for a reference block indicated by a block vector
US10848782B2 (en) 2018-09-21 2020-11-24 Tencent America LLC Method and apparatus for video coding
CN117857785A (zh) * 2018-10-04 2024-04-09 Lg电子株式会社 图像解码和编码方法、数据的发送方法及存储介质
AU2018278914A1 (en) * 2018-12-12 2020-07-02 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
AU2018278915A1 (en) * 2018-12-12 2020-07-02 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding a transformed block of video samples
WO2020130139A1 (ja) * 2018-12-21 2020-06-25 シャープ株式会社 動画像符号化装置および動画像復号装置
US11025935B2 (en) * 2019-01-10 2021-06-01 Tencent America LLC Method and apparatus for history based motion information buffer update with parallel processing capability
US10771799B2 (en) * 2019-01-15 2020-09-08 Tencent America LLC Method and apparatus for video coding
WO2020156549A1 (en) 2019-02-02 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Buffer access methods for intra block copy in video coding
WO2020169104A1 (en) 2019-02-24 2020-08-27 Beijing Bytedance Network Technology Co., Ltd. Joint coding of palette mode usage indication
US10924750B2 (en) * 2019-03-01 2021-02-16 Alibaba Group Holding Limited Palette size constraint in palette mode for video compression system
CN117395439A (zh) 2019-03-01 2024-01-12 北京字节跳动网络技术有限公司 用于视频编解码中的帧内块复制的基于方向的预测
KR20210125506A (ko) 2019-03-04 2021-10-18 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 복사를 위한 버퍼 관리
US11677969B2 (en) * 2019-03-22 2023-06-13 Tencent America LLC Method and apparatus for video coding
CN109982079B (zh) * 2019-04-03 2021-04-02 北京电子工程总体研究所 一种结合纹理空间相关性的帧内预测模式选择方法
KR102630415B1 (ko) 2019-04-24 2024-01-29 바이트댄스 아이엔씨 코딩 된 비디오의 양자화된 잔차 차동 펄스 코드 변조 표현의 제약
CN113728631B (zh) * 2019-04-27 2024-04-02 北京字节跳动网络技术有限公司 帧内子块分割和多变换选择
WO2020223467A1 (en) * 2019-05-01 2020-11-05 Bytedance Inc. Intra coded video using quantized residual differential pulse code modulation coding
CN115955561A (zh) 2019-05-02 2023-04-11 北京字节跳动网络技术有限公司 使用多个参考滤波器的帧内视频编解码
WO2020223615A1 (en) 2019-05-02 2020-11-05 Bytedance Inc. Coding mode based on a coding tree structure type
WO2020231220A1 (ko) * 2019-05-15 2020-11-19 현대자동차주식회사 동영상 데이터의 병렬 부호화 및 복호화를 위한 방법 및 장치
CN113853789B (zh) * 2019-05-15 2024-06-04 现代自动车株式会社 用于运动图像数据的并行编码和解码的方法
EP3954125A4 (en) 2019-05-31 2022-06-22 ByteDance Inc. INTRA-BLOCK COPY PREDICTION PALETTE MODE
EP3973450A4 (en) * 2019-06-28 2023-02-22 ByteDance Inc. CHROMINANCE INTRA MODE DERIVATION IN SCREEN CONTENT ENCODING
BR112022000358A2 (pt) 2019-07-10 2022-05-10 Beijing Bytedance Network Tech Co Ltd Método e aparelho para processar dados de vídeo e meios de armazenamento e gravação não transitórios legíveis por computador
KR20220030957A (ko) * 2019-07-11 2022-03-11 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 비디오 코딩에서 인트라 블록 카피를 위한 비트스트림 적합 제약
JP7359936B2 (ja) 2019-07-20 2023-10-11 北京字節跳動網絡技術有限公司 パレットモードの使用の指示の条件依存符号化
CN117221536A (zh) 2019-07-23 2023-12-12 北京字节跳动网络技术有限公司 调色板模式编解码的模式确定
WO2021018166A1 (en) 2019-07-29 2021-02-04 Beijing Bytedance Network Technology Co., Ltd. Scanning order improvements for palette mode coding
US11627327B2 (en) * 2019-08-05 2023-04-11 Qualcomm Incorporated Palette and prediction mode signaling
CN114930822A (zh) 2019-08-15 2022-08-19 字节跳动有限公司 用于调色板逸出符号的熵编解码
EP4000269A4 (en) 2019-08-15 2022-09-07 ByteDance Inc. PALLET MODE WITH DIFFERENT DIVISION STRUCTURES
WO2021040460A1 (ko) * 2019-08-30 2021-03-04 주식회사 케이티 비디오 신호 처리 방법 및 장치
JP7323709B2 (ja) 2019-09-09 2023-08-08 北京字節跳動網絡技術有限公司 イントラブロックコピーの符号化および復号化
AU2020347030A1 (en) 2019-09-10 2022-03-31 Xris Corporation Image signal encoding/decoding method and device therefor
BR112022004606A2 (pt) 2019-09-12 2022-05-31 Bytedance Inc Método de processamento de vídeo, aparelho para processar dados de vídeo e meios de armazenamento e de gravação não transitórios legíveis por computador
JP2022548737A (ja) 2019-09-19 2022-11-21 バイトダンス インコーポレイテッド パレット・モードのための量子化パラメータ導出
WO2021188805A1 (en) 2020-03-20 2021-09-23 Bytedance Inc. Order relationship between subpictures
US20200228801A1 (en) * 2020-03-24 2020-07-16 Intel Corporation Content and quality adaptive wavefront split for parallel video coding
US11595694B2 (en) * 2020-04-01 2023-02-28 Tencent America LLC Method and apparatus for video coding
JP2023522224A (ja) 2020-04-20 2023-05-29 バイトダンス インコーポレイテッド 参照ピクチャリスト上の制約
EP4140140A4 (en) * 2020-05-21 2023-07-05 ByteDance Inc. PROGRESSIVE DECODING REFRESH SIGNALING AND REFERENCE PICTURE LISTS
EP4144093A4 (en) 2020-05-22 2023-08-23 ByteDance Inc. SIGNALING OF IMAGE INFORMATION IN ACCESS UNITS
CN112532988B (zh) * 2020-06-02 2022-05-06 腾讯科技(深圳)有限公司 视频编码方法、视频解码方法及相关设备
CN112073719B (zh) * 2020-08-21 2021-09-14 浙江大华技术股份有限公司 一种串匹配预测方法、装置、系统及计算机可读存储介质
CN114125464B (zh) * 2020-08-27 2024-02-06 扬智科技股份有限公司 视频解码方法与视频解码装置
US11627328B2 (en) * 2020-10-16 2023-04-11 Tencent America LLC Method and apparatus for video coding
US11503336B2 (en) * 2020-12-07 2022-11-15 Tencent America LLC Method and apparatus for video coding
US11949894B2 (en) * 2020-12-07 2024-04-02 Tencent America LLC Method and apparatus for string matching with reference location constraints
WO2023028580A1 (en) * 2021-08-26 2023-03-02 Innopeak Technology, Inc. Operation range extension for versatile video coding

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130272370A1 (en) * 2012-04-11 2013-10-17 Qualcomm Incorporated Wavefront parallel processing for video coding

Family Cites Families (311)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2114404B (en) 1982-01-28 1986-07-02 British Broadcasting Corp Generating a colour video signal representative of a stored picture
JPH087553B2 (ja) 1988-10-27 1996-01-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 色画像量子化方法及び装置
US5706290A (en) 1994-12-15 1998-01-06 Shaw; Venson Method and apparatus including system architecture for multimedia communication
US8505108B2 (en) 1993-11-18 2013-08-06 Digimarc Corporation Authentication using a digital watermark
US5515296A (en) 1993-11-24 1996-05-07 Intel Corporation Scan path for encoding and decoding two-dimensional signals
US5999189A (en) 1995-08-04 1999-12-07 Microsoft Corporation Image compression to reduce pixel and texture memory requirements in a real-time image generator
US6389162B2 (en) 1996-02-15 2002-05-14 Canon Kabushiki Kaisha Image processing apparatus and method and medium
JPH10262258A (ja) 1997-03-19 1998-09-29 Sony Corp 画像符号化装置及び方法
JP2000102016A (ja) 1998-09-22 2000-04-07 Victor Co Of Japan Ltd 動き補償予測回路
BR0009534B1 (pt) 1999-04-02 2012-01-24 disco ótico, método e dispositivo de gravação para gravação de um disco ótico e método e dispositivo de reprodução para reprodução de um disco ótico.
JP2001251507A (ja) 2000-03-03 2001-09-14 Fujitsu Ltd 画像処理装置
US6701012B1 (en) 2000-07-24 2004-03-02 Sharp Laboratories Of America, Inc. Out-of-layer pixel generation for a decomposed-image layer
US6748116B1 (en) 2000-08-22 2004-06-08 Airzip, Inc. Apparatus and method for compressing and decompressing image files
DE10049571C1 (de) 2000-10-06 2002-06-13 Siemens Ag Verfahren und Anordnung zum Übertragen eines Vektors
US7023924B1 (en) 2000-12-28 2006-04-04 Emc Corporation Method of pausing an MPEG coded video stream
US6853755B2 (en) 2001-03-28 2005-02-08 Sharp Laboratories Of America, Inc. Method and apparatus for adaptive compression of scanned documents
US7031540B2 (en) 2001-09-12 2006-04-18 Mobitv, Inc. Transformation to increase the lempel-ziv compressibility of images with minimal visual distortion
JP2004007379A (ja) 2002-04-10 2004-01-08 Toshiba Corp 動画像符号化方法及び動画像復号化方法
US7120196B2 (en) 2002-04-29 2006-10-10 Ess Technology, Inc. Intra-prediction using intra-macroblock motion compensation
PT1467491E (pt) 2002-05-02 2007-03-30 Fraunhofer Ges Forschung Codificação aritmética de coeficientes de transformação
RU2314656C2 (ru) 2002-06-11 2008-01-10 Нокиа Корпорейшн Внутреннее кодирование, основанное на пространственном прогнозировании
US7289674B2 (en) 2002-06-11 2007-10-30 Nokia Corporation Spatial prediction based intra coding
US7085420B2 (en) 2002-06-28 2006-08-01 Microsoft Corporation Text detection in continuous tone image segments
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7072512B2 (en) 2002-07-23 2006-07-04 Microsoft Corporation Segmentation of digital video and images into continuous tone and palettized regions
MXPA05007447A (es) 2003-01-10 2005-09-12 Thomson Licensing Sa Aparato de decodificador y metodo para suavizar artefactos creados durante el ocultamiento de error.
DE10301362B4 (de) 2003-01-16 2005-06-09 GEMAC-Gesellschaft für Mikroelektronikanwendung Chemnitz mbH Blockdatenkompressionssystem, bestehend aus einer Kompressionseinrichtung und einer Dekompressionseinrichtung, und Verfahren zur schnellen Blockdatenkompression mit Multi-Byte-Suche
US7373005B2 (en) 2003-04-10 2008-05-13 Micron Technology, Inc. Compression system for integrated sensor devices
US7609763B2 (en) 2003-07-18 2009-10-27 Microsoft Corporation Advanced bi-directional predictive coding of video frames
KR101050828B1 (ko) 2003-08-26 2011-07-21 톰슨 라이센싱 하이브리드 인트라-인터 코딩된 블록을 디코딩하기 위한 방법 및 장치
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7317839B2 (en) 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
KR101044934B1 (ko) 2003-12-18 2011-06-28 삼성전자주식회사 움직임 벡터 추정방법 및 부호화 모드 결정방법
JP4591657B2 (ja) 2003-12-22 2010-12-01 キヤノン株式会社 動画像符号化装置及びその制御方法、プログラム
US8036271B2 (en) 2004-02-24 2011-10-11 Lsi Corporation Method and apparatus for determining a second picture for temporal direct-mode block prediction
JP4338654B2 (ja) 2004-03-18 2009-10-07 三洋電機株式会社 動きベクトル検出装置及び方法、及びその動きベクトル検出装置を利用可能な画像符号化装置
JP4418762B2 (ja) 2004-05-07 2010-02-24 キヤノン株式会社 画像符号化装置及び画像復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US8116374B2 (en) 2004-05-07 2012-02-14 Broadcom Corporation Method and system for generating a transform size syntax element for video decoding
US7978770B2 (en) 2004-07-20 2011-07-12 Qualcomm, Incorporated Method and apparatus for motion vector prediction in temporal video compression
JP2006140683A (ja) 2004-11-11 2006-06-01 Canon Inc 画像符号化装置
JP2006140758A (ja) 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
US7720154B2 (en) 2004-11-12 2010-05-18 Industrial Technology Research Institute System and method for fast variable-size motion estimation
KR100679035B1 (ko) 2005-01-04 2007-02-06 삼성전자주식회사 인트라 bl 모드를 고려한 디블록 필터링 방법, 및 상기방법을 이용하는 다 계층 비디오 인코더/디코더
US20060274070A1 (en) 2005-04-19 2006-12-07 Herman Daniel L Techniques and workflows for computer graphics animation system
US20060282855A1 (en) 2005-05-05 2006-12-14 Digital Display Innovations, Llc Multiple remote display system
KR100716999B1 (ko) 2005-06-03 2007-05-10 삼성전자주식회사 영상의 대칭성을 이용한 인트라 예측 방법, 이를 이용한영상의 복호화, 부호화 방법 및 장치
KR101211665B1 (ko) 2005-08-12 2012-12-12 삼성전자주식회사 영상의 인트라 예측 부호화, 복호화 방법 및 장치
JP2007053561A (ja) 2005-08-17 2007-03-01 Matsushita Electric Ind Co Ltd 画像符号化装置および画像符号化方法
WO2007021227A1 (en) 2005-08-19 2007-02-22 Telefonaktiebolaget Lm Ericsson (Publ) Texture compression based on two hues with modified brightness
US7986844B2 (en) 2005-11-22 2011-07-26 Intel Corporation Optimized video compression using hashing function
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8582905B2 (en) 2006-01-31 2013-11-12 Qualcomm Incorporated Methods and systems for rate control within an encoding device
CN101026761B (zh) 2006-02-17 2010-05-12 中国科学院自动化研究所 一种具有最小误差的快速变尺寸块匹配的运动估计方法
US7668382B2 (en) 2006-02-24 2010-02-23 Microsoft Corporation Block-based fast image compression
US7616816B2 (en) 2006-03-20 2009-11-10 Sarnoff Corporation System and method for mission-driven visual information retrieval and organization
EP2011342B1 (en) 2006-04-14 2017-06-28 Nxp B.V. Motion estimation at image borders
US7965861B2 (en) 2006-04-26 2011-06-21 The Board Of Regents Of The University Of Texas System Methods and systems for digital image security
CA2655970A1 (en) 2006-07-07 2008-01-10 Telefonaktiebolaget L M Ericsson (Publ) Video data management
DE102007035204A1 (de) 2006-07-28 2008-02-07 Mediatek Inc. Videoverarbeitungs- und - betriebsvorrichtung
US8472527B2 (en) 2006-09-13 2013-06-25 Texas Instruments Incorporated Hierarchical motion estimation using original frame for sub-sampled reference
WO2008036112A1 (en) 2006-09-22 2008-03-27 Thomson Licensing Method and apparatus for multiple pass video coding and decoding
FR2906433B1 (fr) 2006-09-22 2009-02-27 Canon Kk Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre
US20080084924A1 (en) 2006-10-05 2008-04-10 Donald Martin Monro Matching pursuits basis selection design
US8170101B2 (en) 2006-10-27 2012-05-01 Sharp Laboratories Of America, Inc. Methods and systems for low-complexity data compression
US8218641B2 (en) 2006-10-31 2012-07-10 Sony Computer Entertainment Inc. Picture encoding using same-picture reference for pixel reconstruction
US8218640B2 (en) 2006-10-31 2012-07-10 Sony Computer Entertainment Inc. Picture decoding using same-picture reference for pixel reconstruction
JP2008154015A (ja) 2006-12-19 2008-07-03 Hitachi Ltd 復号化方法および符号化方法
US7907783B2 (en) 2007-01-24 2011-03-15 Samsung Electronics Co., Ltd. Apparatus and method of matching symbols in a text image coding and decoding system
CN100527842C (zh) 2007-01-26 2009-08-12 清华大学 基于背景的运动估计编码方法
RU2472305C2 (ru) 2007-02-23 2013-01-10 Ниппон Телеграф Энд Телефон Корпорейшн Способ кодирования видео и способ декодирования видео, устройства для этого, программы для этого и носители хранения, на которых хранятся программы
US8031937B2 (en) 2007-04-04 2011-10-04 Telefonaktiebolaget Lm Ericsson (Publ) Frame buffer compression and decompression method for graphics rendering
US8160150B2 (en) 2007-04-10 2012-04-17 Texas Instruments Incorporated Method and system for rate distortion optimization
EP2145482A1 (en) 2007-04-19 2010-01-20 Thomson Licensing Adaptive reference picture data generation for intra prediction
US7903873B2 (en) 2007-09-13 2011-03-08 Microsoft Corporation Textual image coding
CN101420606A (zh) 2007-10-23 2009-04-29 青岛海信电器股份有限公司 图像处理方法和装置
KR101365444B1 (ko) 2007-11-19 2014-02-21 삼성전자주식회사 영상의 해상도의 조정을 통하여 동영상을 효율적으로부호화/복호화하는 방법 및 장치
JP2009147807A (ja) 2007-12-17 2009-07-02 Fujifilm Corp 画像処理装置
CN101232619B (zh) 2008-01-25 2011-05-11 浙江大学 嵌入帧内编码块的视频编码方法
TWI375472B (en) 2008-02-04 2012-10-21 Ind Tech Res Inst Intra prediction method for luma block of video
CN101552924B (zh) 2008-03-31 2011-08-03 深圳市融创天下科技发展有限公司 一种用于视频编码的空间预测方法
EP2263381A1 (en) 2008-04-11 2010-12-22 Thomson Licensing Deblocking filtering for displaced intra prediction and template matching
JP2009260473A (ja) 2008-04-14 2009-11-05 Canon Inc 色処理方法及び装置、プログラム、記録媒体
JP2010035137A (ja) 2008-07-01 2010-02-12 Sony Corp 画像処理装置および方法、並びにプログラム
CN102113326A (zh) 2008-08-04 2011-06-29 杜比实验室特许公司 重叠块差异估计和补偿体系结构
US8213503B2 (en) 2008-09-05 2012-07-03 Microsoft Corporation Skip modes for inter-layer residual video coding and decoding
US8385404B2 (en) 2008-09-11 2013-02-26 Google Inc. System and method for video encoding using constructed reference frame
KR101306834B1 (ko) 2008-09-22 2013-09-10 에스케이텔레콤 주식회사 인트라 예측 모드의 예측 가능성을 이용한 영상 부호화/복호화 장치 및 방법
US8254704B2 (en) 2008-10-30 2012-08-28 Microsoft Corporation Remote computing platforms providing high-fidelity display and interactivity for clients
US8180165B2 (en) 2008-12-19 2012-05-15 Microsoft Corp. Accelerated screen codec
KR101359490B1 (ko) 2008-12-23 2014-02-10 에스케이 텔레콤주식회사 컬러 영상 부호화/복호화 방법 및 장치
TW201028018A (en) 2009-01-07 2010-07-16 Ind Tech Res Inst Encoder, decoder, encoding method and decoding method
CA2750735C (en) 2009-02-02 2018-09-18 Calgary Scientific Inc. Image data transmission
RU2420021C2 (ru) 2009-03-24 2011-05-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ сжатия изображений и видеопоследовательностей
EP2249571A1 (en) 2009-05-04 2010-11-10 Thomson Licensing SA Method and device for encoding an image frame comprising macroblocks
EP2446625A1 (en) 2009-06-22 2012-05-02 Thomson Licensing Process for matching pursuit based coding of video data for a sequence of images
CN102077597A (zh) 2009-07-10 2011-05-25 松下电器产业株式会社 运动图像编码方法、装置、程序、以及集成电路
CN101626512A (zh) 2009-08-11 2010-01-13 北京交通大学 一种基于相关性优化准则的多描述视频编码方法及装置
HUE033566T2 (hu) 2009-10-01 2017-12-28 Sk Telecom Co Ltd Berendezés kép dekódolására hasított réteg felhasználásával
TWI566586B (zh) 2009-10-20 2017-01-11 湯姆生特許公司 一序列形象的現時區塊之寫碼方法和重建方法
WO2011048903A1 (ja) 2009-10-20 2011-04-28 シャープ株式会社 動画像符号化装置、動画像復号装置、および、データ構造
JP5321426B2 (ja) 2009-11-26 2013-10-23 株式会社Jvcケンウッド 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法
KR101623124B1 (ko) 2009-12-03 2016-05-24 에스케이 텔레콤주식회사 비디오 인코딩 장치 및 그 인코딩 방법, 비디오 디코딩 장치 및 그 디코딩 방법, 및 거기에 이용되는 방향적 인트라 예측방법
EP2532159A1 (en) 2010-02-05 2012-12-12 Telefonaktiebolaget L M Ericsson (PUBL) Selecting predicted motion vector candidates
US20110194613A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
JP5375676B2 (ja) 2010-03-04 2013-12-25 富士通株式会社 画像処理装置、画像処理方法、および画像処理プログラム
ES2713173T3 (es) 2010-03-31 2019-05-20 Orange Procedimientos y dispositivos de codificación y de decodificación de una secuencia de imágenes que implementan una predicción por compensación de movimiento anticipado, y programa de ordenador correspondiente
KR102223526B1 (ko) 2010-04-09 2021-03-04 엘지전자 주식회사 비디오 데이터 처리 방법 및 장치
US8619857B2 (en) 2010-04-09 2013-12-31 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
US8644375B2 (en) 2010-04-09 2014-02-04 Sharp Laboratories Of America, Inc. Methods and systems for intra prediction
KR101752418B1 (ko) 2010-04-09 2017-06-29 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US20110261880A1 (en) 2010-04-27 2011-10-27 Sony Corporation Boundary adaptive intra prediction for improving subjective video quality
KR20110123651A (ko) 2010-05-07 2011-11-15 한국전자통신연구원 생략 부호화를 이용한 영상 부호화 및 복호화 장치 및 그 방법
CN103141091A (zh) 2010-06-21 2013-06-05 汤姆逊许可公司 图像数据编码/解码的方法及其设备
CN104853201A (zh) 2010-07-02 2015-08-19 数码士控股有限公司 用于帧内预测的编码/解码图像的装置和方法
KR101484281B1 (ko) 2010-07-09 2015-01-21 삼성전자주식회사 블록 병합을 이용한 비디오 부호화 방법 및 그 장치, 블록 병합을 이용한 비디오 복호화 방법 및 그 장치
CN103004210B (zh) 2010-07-14 2016-01-27 株式会社Ntt都科摩 用于视频编码的低复杂度帧内预测
CN103119937B (zh) 2010-07-20 2016-02-10 Sk电信有限公司 用于解块滤波的方法和装置以及利用该方法和装置进行编码和解码的方法和装置
KR101894355B1 (ko) 2010-11-04 2018-09-04 지이 비디오 컴프레션, 엘엘씨 블록 병합 및 스킵 모드를 지원하는 화상 코딩
US8787459B2 (en) 2010-11-09 2014-07-22 Sony Computer Entertainment Inc. Video coding methods and apparatus
KR101756442B1 (ko) 2010-11-29 2017-07-11 에스케이텔레콤 주식회사 인트라예측모드의 중복성을 최소화하기 위한 영상 부호화/복호화 방법 및 장치
US20120163457A1 (en) 2010-12-28 2012-06-28 Viktor Wahadaniah Moving picture decoding method, moving picture coding method, moving picture decoding apparatus, moving picture coding apparatus, and moving picture coding and decoding apparatus
US8767835B2 (en) 2010-12-28 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding videos using dictionaries
KR101739579B1 (ko) 2011-01-04 2017-05-24 에스케이 텔레콤주식회사 코딩 유닛 단위 병렬 인트라예측을 이용한 부호화/복호화 방법 및 장치
KR20120080122A (ko) 2011-01-06 2012-07-16 삼성전자주식회사 경쟁 기반의 다시점 비디오 부호화/복호화 장치 및 방법
US8913662B2 (en) 2011-01-06 2014-12-16 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding using CABAC
CN106060563B (zh) 2011-01-07 2019-06-21 Lg电子株式会社 编码和解码图像信息的方法和使用该方法的装置
PT3349360T (pt) 2011-01-14 2019-12-09 Ge Video Compression Llc Esquema de codificação e descodificação de entropia
US9066104B2 (en) 2011-01-14 2015-06-23 Google Inc. Spatial block merge mode
US8737480B2 (en) 2011-01-14 2014-05-27 Motorola Mobility Llc Joint spatial and temporal block merge mode for HEVC
US8755437B2 (en) 2011-03-17 2014-06-17 Mediatek Inc. Method and apparatus for derivation of spatial motion vector candidate and motion vector prediction candidate
CN103329534B (zh) 2011-01-19 2017-03-08 瑞萨电子株式会社 图像编码装置及图像解码装置
US9532066B2 (en) 2011-01-21 2016-12-27 Qualcomm Incorporated Motion vector prediction
US8548057B2 (en) 2011-01-25 2013-10-01 Microsoft Corporation Video coding redundancy reduction
US9319716B2 (en) 2011-01-27 2016-04-19 Qualcomm Incorporated Performing motion vector prediction for video coding
US9288501B2 (en) 2011-03-08 2016-03-15 Qualcomm Incorporated Motion vector predictors (MVPs) for bi-predictive inter mode in video coding
US9788019B2 (en) 2011-03-09 2017-10-10 Hfi Innovation Inc. Method and apparatus of transform unit partition with reduced complexity
EP3139611A1 (en) 2011-03-14 2017-03-08 HFI Innovation Inc. Method and apparatus for deriving temporal motion vector prediction
WO2012128540A2 (ko) 2011-03-21 2012-09-27 엘지전자 주식회사 움직임 벡터 예측자 선택 방법 및 이를 이용하는 장치
US8693547B2 (en) 2011-04-06 2014-04-08 Google Inc. Apparatus and method for coding using motion vector segmentation
WO2012144878A2 (en) 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
US20140050414A1 (en) 2011-04-29 2014-02-20 Telefonaktiebolaget L M Ericsson (Publ) Encoder, Decoder and Methods Thereof for Texture Compression
US20120281760A1 (en) 2011-05-04 2012-11-08 Hyung Joon Kim Iterative Grid-Pattern Motion Search
US8971416B2 (en) 2011-05-05 2015-03-03 Vixs Systems, Inc Video decoder with vector processor and methods for use therewith
CN102137263B (zh) 2011-05-09 2013-07-03 松日数码发展(深圳)有限公司 基于cnm关键帧分类的分布式视频编码及解码方法
US20120294353A1 (en) 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
US20140085418A1 (en) 2011-05-16 2014-03-27 Sony Corporation Image processing device and image processing method
CN102238391B (zh) 2011-05-25 2016-12-07 深圳市云宙多媒体技术有限公司 一种预测编码方法、装置
JP5727873B2 (ja) 2011-06-10 2015-06-03 日本放送協会 動きベクトル検出装置、符号化装置、及びこれらのプログラム
CN103688533B (zh) 2011-06-20 2015-12-23 联发科技(新加坡)私人有限公司 可减少行存储器的色度帧内预测方法及装置
CN103621090B (zh) 2011-06-24 2017-09-15 寰发股份有限公司 移除运动向量预测子中冗余的方法与装置
MX2013013483A (es) 2011-06-27 2014-02-27 Panasonic Corp Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
EP2705667B1 (en) 2011-06-30 2016-09-21 Huawei Technologies Co., Ltd. Lossless coding and associated signaling methods for compound video
US9060173B2 (en) 2011-06-30 2015-06-16 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
WO2013009896A1 (en) 2011-07-12 2013-01-17 Huawei Technologies Co. Ltd. Pixel-based intra prediction for coding in hevc
CN102223541B (zh) 2011-07-14 2013-07-03 北京工业大学 一种混合图像的编码方法
US9232237B2 (en) 2011-08-05 2016-01-05 Texas Instruments Incorporated Block-based parallel deblocking filter in video coding
US9769472B2 (en) 2011-08-17 2017-09-19 Mediatek Singapore Pte. Ltd. Method and apparatus for Intra prediction using non-square blocks
CN106851311B (zh) 2011-08-29 2019-08-13 苗太平洋控股有限公司 视频译码装置
US8804816B2 (en) 2011-08-30 2014-08-12 Microsoft Corporation Video encoding enhancements
US9578336B2 (en) 2011-08-31 2017-02-21 Texas Instruments Incorporated Hybrid video and graphics system with automatic content detection process, and other circuits, processes, and systems
RU2577181C2 (ru) 2011-10-21 2016-03-10 Нокиа Текнолоджиз Ой Способ и устройство для кодирования видеосигналов
GB2495990A (en) 2011-10-28 2013-05-01 Canon Kk Motion compensated image coding with omission of coding mode cost calculation for a motion predictor in a set.
US9484952B2 (en) 2011-11-03 2016-11-01 Qualcomm Incorporated Context state and probability initialization for context adaptive entropy coding
US10390046B2 (en) 2011-11-07 2019-08-20 Qualcomm Incorporated Coding significant coefficient information in transform skip mode
BR112014011149A2 (pt) 2011-11-08 2017-05-16 Motorola Mobility Llc dispositivos e métodos para codificação e / ou de sinalização de deslocamento adaptativo de amostra
WO2013070974A2 (en) 2011-11-08 2013-05-16 General Instrument Corporation Method of determining binary codewords for transform coefficients
KR101660605B1 (ko) 2011-11-08 2016-09-27 구글 테크놀로지 홀딩스 엘엘씨 변환 계수들에 대한 이진 코드워드들을 결정하는 방법
EP2777284B1 (en) 2011-11-11 2018-09-05 GE Video Compression, LLC Effective wedgelet partition coding using spatial prediction
US20130121417A1 (en) * 2011-11-16 2013-05-16 Qualcomm Incorporated Constrained reference picture sets in wave front parallel processing of video data
US9883203B2 (en) 2011-11-18 2018-01-30 Qualcomm Incorporated Adaptive overlapped block motion compensation
EP2781091B1 (en) 2011-11-18 2020-04-08 GE Video Compression, LLC Multi-view coding with efficient residual handling
KR102061214B1 (ko) 2011-11-25 2019-12-31 선 페이턴트 트러스트 화상 처리 방법 및 화상 처리 장치
RU2493670C2 (ru) 2011-12-15 2013-09-20 Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "МИЭТ" Способ блочной межкадровой компенсации движения для видеокодеков
WO2013096671A1 (en) 2011-12-20 2013-06-27 General Instrument Corporation Method and apparatus for efficient transform unit encoding
US20130163664A1 (en) 2011-12-22 2013-06-27 Qualcomm Incorporated Unified partition mode table for intra-mode coding
US9762904B2 (en) 2011-12-22 2017-09-12 Qualcomm Incorporated Performing motion vector prediction for video coding
US9900615B2 (en) 2011-12-28 2018-02-20 Microsoft Technology Licensing, Llc Representative motion information for temporal motion prediction in video encoding and decoding
WO2013102293A1 (en) 2012-01-04 2013-07-11 Mediatek Singapore Pte. Ltd. Improvements of luma-based chroma intra prediction
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
US9332259B2 (en) 2012-01-18 2016-05-03 Qualcomm Incorporated Indication of use of wavefront parallel processing in video coding
JP2013150173A (ja) 2012-01-19 2013-08-01 Sony Corp 画像処理装置および方法
US20130188719A1 (en) 2012-01-20 2013-07-25 Qualcomm Incorporated Motion prediction in svc using motion vector for intra-coded block
TWI775701B (zh) 2012-01-20 2022-08-21 美商Ge影像壓縮有限公司 允許平行處理之編碼器、解碼器、傳送解多工器、系統、儲存媒體、方法及電腦程式
JP2013150215A (ja) 2012-01-20 2013-08-01 Fujitsu Ltd 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム
US9210438B2 (en) 2012-01-20 2015-12-08 Sony Corporation Logical intra mode naming in HEVC video coding
US10244246B2 (en) * 2012-02-02 2019-03-26 Texas Instruments Incorporated Sub-pictures for pixel rate balancing on multi-core platforms
WO2013128010A2 (en) 2012-03-02 2013-09-06 Canon Kabushiki Kaisha Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream
US8737824B1 (en) 2012-03-09 2014-05-27 Google Inc. Adaptively encoding a media stream with compound prediction
US9503720B2 (en) 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
JP2015515806A (ja) 2012-03-26 2015-05-28 ユークリッド・ディスカバリーズ・エルエルシーEuclid Discoveries,Llc コンテキストベースの映像符号化及び映像復号化
US20130258052A1 (en) 2012-03-28 2013-10-03 Qualcomm Incorporated Inter-view residual prediction in 3d video coding
US10129540B2 (en) 2012-04-10 2018-11-13 Texas Instruments Incorporated Reduced complexity coefficient transmission for adaptive loop filtering (ALF) in video coding
US20130272409A1 (en) 2012-04-12 2013-10-17 Qualcomm Incorporated Bandwidth reduction in video coding through applying the same reference index
US20150085932A1 (en) 2012-04-24 2015-03-26 Mediatek Inc. Method and apparatus of motion vector derivation for 3d video coding
GB2501535A (en) 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
US9521410B2 (en) 2012-04-26 2016-12-13 Qualcomm Incorporated Quantization parameter (QP) coding in video coding
US20130294524A1 (en) 2012-05-04 2013-11-07 Qualcomm Incorporated Transform skipping and lossless coding unification
US9762903B2 (en) 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
CN102752595B (zh) 2012-06-29 2014-07-09 香港应用科技研究院有限公司 用于深度图编码和解码的混合型跳过模式
US9621905B2 (en) 2012-06-29 2017-04-11 Qualcomm Incorporated Tiles and wavefront parallel processing
US9602827B2 (en) 2012-07-02 2017-03-21 Qualcomm Incorporated Video parameter set including an offset syntax element
US9591302B2 (en) 2012-07-02 2017-03-07 Microsoft Technology Licensing, Llc Use of chroma quantization parameter offsets in deblocking
US9414054B2 (en) 2012-07-02 2016-08-09 Microsoft Technology Licensing, Llc Control and use of chroma quantization parameter values
US9264713B2 (en) 2012-07-11 2016-02-16 Qualcomm Incorporated Rotation of prediction residual blocks in video coding with transform skipping
US9549182B2 (en) 2012-07-11 2017-01-17 Qualcomm Incorporated Repositioning of prediction residual blocks in video coding
US9467692B2 (en) 2012-08-31 2016-10-11 Qualcomm Incorporated Intra prediction improvements for scalable video coding
US20140071235A1 (en) 2012-09-13 2014-03-13 Qualcomm Incorporated Inter-view motion prediction for 3d video
MY181830A (en) 2012-09-26 2021-01-08 Panasonic Ip Corp America Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
CN104685881B (zh) 2012-09-28 2018-05-15 夏普株式会社 图像解码装置、图像编码装置以及图像解码方法
WO2014053099A1 (en) 2012-10-03 2014-04-10 Mediatek Inc. Method and apparatus for motion information inheritance in three-dimensional video coding
US9357214B2 (en) 2012-12-07 2016-05-31 Qualcomm Incorporated Advanced merge/skip mode and advanced motion vector prediction (AMVP) mode for 3D video
US9615090B2 (en) 2012-12-28 2017-04-04 Qualcomm Incorporated Parsing syntax elements in three-dimensional video coding
US9826244B2 (en) 2013-01-08 2017-11-21 Qualcomm Incorporated Device and method for scalable coding of video information based on high efficiency video coding
CN103067716B (zh) 2013-01-10 2016-06-29 华为技术有限公司 深度图像的编解码方法和编解码装置
US9762882B2 (en) 2013-01-11 2017-09-12 Hfi Innovation Inc. Method and apparatus for efficient coding of depth lookup table
US9800857B2 (en) 2013-03-08 2017-10-24 Qualcomm Incorporated Inter-view residual prediction in multi-view or 3-dimensional video coding
US9516306B2 (en) 2013-03-27 2016-12-06 Qualcomm Incorporated Depth coding modes signaling of depth data for 3D-HEVC
US10904551B2 (en) 2013-04-05 2021-01-26 Texas Instruments Incorporated Video coding using intra block copy
US11259020B2 (en) 2013-04-05 2022-02-22 Qualcomm Incorporated Determining palettes in palette-based video coding
CN103237226B (zh) 2013-04-07 2016-08-03 宁波大学 一种立体视频宏块丢失错误隐藏方法
WO2014166104A1 (en) 2013-04-12 2014-10-16 Mediatek Singapore Pte. Ltd. Removal of parsing dependency for illumination compensation
US9609336B2 (en) 2013-04-16 2017-03-28 Fastvdo Llc Adaptive coding, transmission and efficient display of multimedia (acted)
US11323747B2 (en) 2013-06-05 2022-05-03 Qualcomm Incorporated Residual differential pulse code modulation (DPCM) extensions and harmonization with transform skip, rotation, and scans
CN103281538B (zh) 2013-06-06 2016-01-13 上海交通大学 基于滚动哈希和块级别帧内预测的帧内编码方法
US9787989B2 (en) 2013-06-11 2017-10-10 Blackberry Limited Intra-coding mode-dependent quantization tuning
CN111800640B (zh) 2013-06-13 2023-11-10 上海天荷电子信息有限公司 方向交替变换来回扫描串匹配的图像编码解码方法和装置
CN105393542B (zh) 2013-06-18 2019-04-09 Vid拓展公司 Hevc扩展的层间参数集
US9300967B2 (en) 2013-06-19 2016-03-29 Apple Inc. Sample adaptive offset control
US10015515B2 (en) 2013-06-21 2018-07-03 Qualcomm Incorporated Intra prediction from a predictive block
GB2516422A (en) 2013-07-09 2015-01-28 Sony Corp Data encoding and decoding
US20150016533A1 (en) * 2013-07-12 2015-01-15 Qualcomm Incorporated Intra motion compensation extensions
US9558567B2 (en) 2013-07-12 2017-01-31 Qualcomm Incorporated Palette prediction in palette-based video coding
US20150016516A1 (en) 2013-07-15 2015-01-15 Samsung Electronics Co., Ltd. Method for intra prediction improvements for oblique modes in video coding
US9756347B2 (en) 2013-07-23 2017-09-05 Futurewei Technologies, Inc. Screen content coding systems and methods
ES2906238T3 (es) 2013-07-24 2022-04-13 Qualcomm Inc Predicción de movimiento avanzada simplificada para 3D-HEVC
US9774879B2 (en) 2013-08-16 2017-09-26 Sony Corporation Intra-block copying enhancements for HEVC in-range-extension (RExt)
CN104378644B (zh) 2013-08-16 2020-12-04 上海天荷电子信息有限公司 定宽度变长度像素样值串匹配增强的图像压缩方法和装置
CN103428498A (zh) 2013-08-21 2013-12-04 江苏新瑞峰信息科技有限公司 一种无损图像压缩系统
US10313682B2 (en) 2013-08-26 2019-06-04 Qualcomm Incorporated Determining regions when performing intra block copying
US9503715B2 (en) 2013-08-30 2016-11-22 Qualcomm Incorporated Constrained intra prediction in video coding
CN104427338B (zh) * 2013-09-07 2019-11-05 上海天荷电子信息有限公司 一种使用块匹配的图像编码以及图像解码的方法和装置
US20150071357A1 (en) 2013-09-12 2015-03-12 Qualcomm Incorporated Partial intra block copying for video coding
AU2013228045A1 (en) 2013-09-13 2015-04-02 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
US10009629B2 (en) 2013-10-11 2018-06-26 Sony Corporation Video coding system with search range and method of operation thereof
KR102257269B1 (ko) 2013-10-14 2021-05-26 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 비디오 및 이미지 코딩 및 디코딩을 위한 인트라 블록 카피 예측 모드의 피쳐
EP3058736B1 (en) 2013-10-14 2019-02-27 Microsoft Technology Licensing, LLC Encoder-side options for intra block copy prediction mode for video and image coding
CA2925183C (en) 2013-10-14 2020-03-10 Microsoft Technology Licensing, Llc Features of base color index map mode for video and image coding and decoding
US20150110181A1 (en) * 2013-10-18 2015-04-23 Samsung Electronics Co., Ltd. Methods for palette prediction and intra block copy padding
US10291827B2 (en) 2013-11-22 2019-05-14 Futurewei Technologies, Inc. Advanced screen content coding solution
PL3425914T3 (pl) 2013-12-10 2022-02-14 Canon Kabushiki Kaisha Sposób i aparatura do kodowania lub dekodowania palety w trybie kodowania palety
RU2679566C1 (ru) 2013-12-10 2019-02-11 Кэнон Кабусики Кайся Улучшенный палитровый режим в hevc
CN110336999B (zh) 2013-12-18 2021-09-03 寰发股份有限公司 利用调色板编码的编码视频数据区块的方法和装置
US10972742B2 (en) 2013-12-19 2021-04-06 Canon Kabushiki Kaisha Encoding process using a palette mode
GB2521606A (en) 2013-12-20 2015-07-01 Canon Kk Method and apparatus for transition encoding in video coding and decoding
TWI536811B (zh) 2013-12-27 2016-06-01 財團法人工業技術研究院 影像處理方法與系統、解碼方法、編碼器與解碼器
EP3090543A4 (en) 2013-12-30 2017-08-02 QUALCOMM Incorporated Simplification of delta dc residual coding in 3d video coding
US9872040B2 (en) 2014-01-02 2018-01-16 Qualcomm Incorporated Color index coding for palette-based video coding
US10055189B2 (en) 2014-01-02 2018-08-21 Vid Scale, Inc. Two-dimensional palette coding for screen content coding
JP6355744B2 (ja) 2014-01-03 2018-07-11 マイクロソフト テクノロジー ライセンシング,エルエルシー ビデオ及び画像符号化/デコーディングにおけるブロックベクトル予測
US10390034B2 (en) 2014-01-03 2019-08-20 Microsoft Technology Licensing, Llc Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area
US9883197B2 (en) 2014-01-09 2018-01-30 Qualcomm Incorporated Intra prediction of chroma blocks using the same vector
US20150271515A1 (en) 2014-01-10 2015-09-24 Qualcomm Incorporated Block vector coding for intra block copy in video coding
US11284103B2 (en) 2014-01-17 2022-03-22 Microsoft Technology Licensing, Llc Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning
GB2522844A (en) 2014-01-29 2015-08-12 Sony Corp Data encoding and decoding
US9699468B2 (en) 2014-02-10 2017-07-04 Microsoft Technology Licensing, Llc Adaptive screen and video coding scheme
US20150237356A1 (en) 2014-02-18 2015-08-20 Microsoft Corporation Host encoder for hardware-accelerated video encoding
US10555001B2 (en) 2014-02-21 2020-02-04 Mediatek Singapore Pte. Ltd. Method of video coding using prediction based on intra picture block copy
US10542274B2 (en) 2014-02-21 2020-01-21 Microsoft Technology Licensing, Llc Dictionary encoding and decoding of screen content
BR112016018814A8 (pt) 2014-03-04 2020-06-23 Microsoft Technology Licensing Llc dispositivo de computação, método em dispositivo de computação com decodificador de vídeo ou decodificador de imagem e meio legível por computador
US10567754B2 (en) 2014-03-04 2020-02-18 Microsoft Technology Licensing, Llc Hash table construction and availability checking for hash-based block matching
US20150262404A1 (en) 2014-03-13 2015-09-17 Huawei Technologies Co., Ltd. Screen Content And Mixed Content Coding
WO2015135509A1 (en) * 2014-03-14 2015-09-17 Mediatek Inc. Method for palette table initialization and management
EP4044602A1 (en) 2014-03-14 2022-08-17 Vid Scale, Inc. Palette coding for screen content coding
JP6328262B2 (ja) 2014-03-14 2018-05-23 寰發股▲ふん▼有限公司HFI Innovation Inc. パレットスタッフィングによるカラーインデックスコーディング方法
EP3120561B1 (en) 2014-03-16 2023-09-06 VID SCALE, Inc. Method and apparatus for the signaling of lossless video coding
US20150264348A1 (en) * 2014-03-17 2015-09-17 Qualcomm Incorporated Dictionary coding of video content
RU2668723C2 (ru) * 2014-03-17 2018-10-02 Нокиа Текнолоджиз Ой Способ и оборудование для кодирования и декодирования видеосигналов
US10477232B2 (en) * 2014-03-21 2019-11-12 Qualcomm Incorporated Search region determination for intra block copy in video coding
US10432928B2 (en) 2014-03-21 2019-10-01 Qualcomm Incorporated Using a current picture as a reference for video coding
US9654806B2 (en) 2014-03-26 2017-05-16 Qualcomm Incorporated Determining palette size, palette entries and filtering of palette coded blocks in video coding
CN103957412B (zh) 2014-05-06 2017-04-12 北京大学 一种针对屏幕视频帧间残差的基础色索引映射算法
WO2015170243A1 (en) 2014-05-09 2015-11-12 Nokia Technologies Oy Method and technical equipment for video encoding and decoding using palette coding
AU2014202682A1 (en) 2014-05-16 2015-12-03 Canon Kabushiki Kaisha Method, apparatus and system for copying a block of video samples
US10038915B2 (en) 2014-05-22 2018-07-31 Qualcomm Incorporated Escape sample coding in palette-based video coding
US10264285B2 (en) 2014-05-22 2019-04-16 Qualcomm Incorporated Coding runs in palette-based video coding
US10750198B2 (en) 2014-05-22 2020-08-18 Qualcomm Incorporated Maximum palette parameters in palette-based video coding
US10291940B2 (en) 2014-05-23 2019-05-14 Qualcomm Incorporated Coding runs with escape in palette-based video coding
US11323733B2 (en) 2014-05-23 2022-05-03 Qualcomm Incorporated Predictor palette initialization in palette-based video coding
US10382749B2 (en) 2014-05-23 2019-08-13 Qualcomm Incorporated Coding run values based on palette index in palette-based video coding
AU2014202921B2 (en) 2014-05-29 2017-02-02 Canon Kabushiki Kaisha Method, apparatus and system for de-blocking a block of video samples
US10136141B2 (en) 2014-06-11 2018-11-20 Qualcomm Incorporated Determining quantization parameter (QP) values and delta QP values for palette coded blocks in video coding
US9924175B2 (en) 2014-06-11 2018-03-20 Qualcomm Incorporated Determining application of deblocking filtering to palette coded blocks in video coding
EP3158734A4 (en) 2014-06-19 2017-04-26 Microsoft Technology Licensing, LLC Unified intra block copy and inter prediction modes
CN111432220B (zh) 2014-06-19 2022-05-06 Vid拓展公司 采用块向量导出的帧内块复制编码的方法和系统
US9948949B2 (en) 2014-06-20 2018-04-17 Qualcomm Incorporated Intra block copy block vector signaling for video coding
KR101748620B1 (ko) 2014-06-20 2017-07-04 성균관대학교산학협력단 영상의 부호화/복호화 방법 및 이를 이용하는 장치
US10477204B2 (en) 2014-06-20 2019-11-12 Sharp Kabushiki Kaisha Harmonized palette coding
US20150381994A1 (en) * 2014-06-27 2015-12-31 Futurewei Technologies, Inc. Advanced screen content coding with improved palette table and index map coding methods
US10412387B2 (en) * 2014-08-22 2019-09-10 Qualcomm Incorporated Unified intra-block copy and inter-prediction
AU2014216056A1 (en) 2014-08-25 2016-03-10 Canon Kabushiki Kaisha Method, apparatus and system for predicting a block of video samples
CA2959682C (en) * 2014-09-30 2022-12-06 Microsoft Technology Licensing, Llc Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US20160112713A1 (en) 2014-10-20 2016-04-21 Google Inc. Mapping spherical image to 2d representations
US9591325B2 (en) 2015-01-27 2017-03-07 Microsoft Technology Licensing, Llc Special case handling for merged chroma blocks in intra block copy prediction mode
TW201642655A (zh) 2015-04-21 2016-12-01 Vid衡器股份有限公司 基於藝術意向之視訊編碼
US10638140B2 (en) 2015-05-29 2020-04-28 Qualcomm Incorporated Slice level intra block copy and other video coding improvements
WO2016197314A1 (en) 2015-06-09 2016-12-15 Microsoft Technology Licensing, Llc Robust encoding/decoding of escape-coded pixels in palette mode
US10062181B1 (en) 2015-07-30 2018-08-28 Teradici Corporation Method and apparatus for rasterizing and encoding vector graphics
JP2018032949A (ja) 2016-08-23 2018-03-01 キヤノン株式会社 動きベクトル検出装置およびその制御方法
US10817747B2 (en) 2019-03-14 2020-10-27 Ubicquia Iq Llc Homography through satellite image matching

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130272370A1 (en) * 2012-04-11 2013-10-17 Qualcomm Incorporated Wavefront parallel processing for video coding

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
비특허문헌1(PoLin Lai 등, JCTVC-P0153, 2014.01.11)*
비특허문헌2(Yu-Chen Sun 등, JCTVC-Q0083, 2014.03.27)*
비특허문헌3(Madhukar Budagavi 등, JCTVC-M0350, 2013.04.12)*
비특허문헌4(Yao-Jen Chang 등, JCTVC-P0256, 2014.01.10)*
비특허문헌5(Bin Li 등, JCTVC-O0183, 2013.10.24)*
비특허문헌6(Chun-Chi Chen 등, JCTVC-Q0032, 2014.03.27)*
비특허문헌7(Bin Li 등, JCTVC-Q0035, 2014.03.27)*
비특허문헌8(Vadim Seregin 등, JCTVC-R0229, 2014.07.02)*

Also Published As

Publication number Publication date
CN105874795B (zh) 2019-11-29
RU2679201C2 (ru) 2019-02-06
US20200404301A1 (en) 2020-12-24
US20220264131A1 (en) 2022-08-18
KR102330740B1 (ko) 2021-11-23
EP3202150A4 (en) 2017-12-20
WO2016049839A1 (en) 2016-04-07
KR20170063885A (ko) 2017-06-08
US10812817B2 (en) 2020-10-20
US11363283B2 (en) 2022-06-14
AU2014408228A1 (en) 2017-03-16
CA2959682C (en) 2022-12-06
CA3171803A1 (en) 2016-04-07
EP3202150B1 (en) 2021-07-21
EP3917146A1 (en) 2021-12-01
CA2959682A1 (en) 2016-04-07
EP3202150A1 (en) 2017-08-09
MX2017004211A (es) 2017-11-15
US11758162B2 (en) 2023-09-12
CN105874795A (zh) 2016-08-17
KR20210040195A (ko) 2021-04-12
JP2017535145A (ja) 2017-11-24
RU2017110397A3 (ko) 2018-10-01
AU2014408228B2 (en) 2019-09-19
BR112017004041A2 (pt) 2017-12-05
RU2017110397A (ru) 2018-10-01
US20230353767A1 (en) 2023-11-02
US20170238001A1 (en) 2017-08-17

Similar Documents

Publication Publication Date Title
US11758162B2 (en) Rules for intra-picture prediction modes when wavefront parallel processing is enabled
US11910005B2 (en) Block vector prediction in video and image coding/decoding
CN107211155B (zh) 图内块拷贝预测模式下的合并的色度块的特殊情况处理
KR102401946B1 (ko) 인트라 블록 카피 예측에서의 스킵 모드 및 블록 플립핑
KR20160075709A (ko) 비디오 및 이미지 코딩 및 디코딩에서의 해시 값을 갖는 블록의 표현
KR20160075705A (ko) 비디오 및 이미지 코딩에서의 해시 기반 블록 매칭
JP6793778B2 (ja) 波面並列処理が可能にされた場合のピクチャ内予測モードに関する規則

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant