KR20150105373A - 비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시 - Google Patents

비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시 Download PDF

Info

Publication number
KR20150105373A
KR20150105373A KR1020157020825A KR20157020825A KR20150105373A KR 20150105373 A KR20150105373 A KR 20150105373A KR 1020157020825 A KR1020157020825 A KR 1020157020825A KR 20157020825 A KR20157020825 A KR 20157020825A KR 20150105373 A KR20150105373 A KR 20150105373A
Authority
KR
South Korea
Prior art keywords
picture
poc value
video
pictures
point picture
Prior art date
Application number
KR1020157020825A
Other languages
English (en)
Other versions
KR101841333B1 (ko
Inventor
예-쿠이 왕
아다르쉬 크리쉬난 라마수브라모니안
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20150105373A publication Critical patent/KR20150105373A/ko
Application granted granted Critical
Publication of KR101841333B1 publication Critical patent/KR101841333B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 데이터를 디코딩하는 일 예시적인 방법은 복수의 픽처들을 수신하는 단계, 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지에서, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 픽처 순서 카운트 (POC) 값을 나타내는 정보를 수신하는 단계, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 단계, 및 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하는 단계를 포함한다.

Description

비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시{GRADUAL DECODING REFRESH WITH TEMPORAL SCALABILITY SUPPORT IN VIDEO CODING}
본 출원은 2013년 1월 7일자로 출원된 미국 가출원 제61/749,880호의 이익을 주장하며, 그 전체 내용이 여기에 참조로 포함된다.
본 개시물은 비디오 코딩에 관한 것으로, 더욱 구체적으로는 점진적 디코딩 리프레시 (gradual decoding refresh; GDR) 에 따라 비디오를 코딩하는 기법들에 관한 것이다.
디지털 비디오 능력들은 디지털 텔레비전들, 디지털 다이렉트 브로드캐스트 시스템들, 무선 브로드캐스트 시스템들, 개인 휴대 정보 단말기 (PDA) 들, 랩톱 또는 데스크톱 컴퓨터들, 태블릿 컴퓨터들, 전자책 판독기들, 디지털 카메라들, 디지털 레코딩 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 디바이스들, 비디오 게임 콘솔들, 셀룰러 또는 위성 무선 전화들, 소위 "스마트 폰들", 비디오 화상회의 디바이스들, 비디오 스트리밍 디바이스들 등을 포함하는 광범위한 디바이스들에 포함될 수 있다. 디지털 비디오 디바이스들은 MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, Part 10, 어드밴스드 비디오 코딩 (AVC), 현재 개발 중인 고효율 비디오 코딩 (HEVC) 표준에 의해 정의된 표준들, 및 이러한 표준들의 확장들에 설명된 것들과 같은 비디오 압축 기법들을 구현한다. 비디오 디바이스들은 이러한 비디오 압축 기법들을 구현함으로써 더 효율적으로 디지털 비디오 정보를 송신, 수신, 인코딩, 디코딩, 및/또는 저장할 수도 있다.
비디오 압축 기법들은 비디오 시퀀스들에 고유한 리던던시를 감소시키거나 제거하기 위해 공간 (인트라-픽처) 예측 및/또는 시간 (인터-픽처) 예측을 수행한다. 블록 기반 비디오 코딩의 경우, 비디오 슬라이스 (즉, 비디오 프레임 또는 비디오 프레임의 일부) 는 트리블록들, 코딩 유닛 (CU) 들 및/또는 코딩 노드들이라고도 또한 지칭될 수도 있는 비디오 블록들로 파티셔닝될 수도 있다. 픽처의 인트라-코딩된 (I) 슬라이스에서의 비디오 블록들은 동일한 픽처 내의 이웃하는 블록들에서의 참조 샘플들에 대한 공간 예측을 사용하여 인코딩된다. 픽처의 인터-코딩된 (P 또는 B) 슬라이스에서의 비디오 블록들은 동일한 픽처 내의 이웃하는 블록들에서의 참조 샘플들에 대한 공간 예측 또는 다른 참조 픽처들 내의 참조 샘플들에 대한 시간 예측을 사용할 수도 있다. 픽처들은 프레임들이라고 지칭될 수도 있고, 참조 픽처들은 참조 프레임들이라고 지칭될 수도 있다.
공간 또는 시간 예측은 코딩될 블록에 대한 예측 블록을 발생시킨다. 잔차 데이터는 코딩될 오리지널 블록과 예측 블록 사이의 픽셀 차이들을 나타낸다. 인터-코딩된 블록은 예측 블록을 형성하는 참조 샘플들의 블록을 가리키는 모션 벡터, 및 코딩된 블록과 예측 블록 사이의 차이를 나타내는 잔차 데이터에 따라 인코딩된다. 인트라-코딩된 블록은 인트라-코딩 모드 및 잔차 데이터에 따라 인코딩된다. 추가의 압축을 위해, 잔차 데이터는 픽셀 도메인으로부터 변환 도메인으로 변환되어, 그 후에 양자화될 수도 있는 잔차 변환 계수들을 발생시킨다. 초기에 2차원 어레이로 배열된 양자화된 변환 계수들은 변환 계수들의 1차원 벡터를 생성하기 위해 스캐닝될 수도 있고, 엔트로피 코딩이 보다 많은 압축을 달성하기 위해 적용될 수도 있다.
일반적으로, 본 개시물은 시간적으로 스케일러블한 (scalable) 비디오 비트스트림들을 코딩하면서 점진적 디코딩 리프레시 (GDR) 동작들을 지원하는 기법들을 설명한다.
하나의 예에서, 비디오 데이터를 디코딩하는 방법은 인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하는 단계, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 픽처 순서 카운트 (picture order count; POC) 값을 나타내는 정보를 수신하는 단계, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 단계, 및 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하는 단계를 포함한다.
다른 예에서, 비디오 데이터를 디코딩하기 위한 디바이스는 비디오 디코더 및 인코딩된 비디오 데이터를 저장도록 구성된 메모리를 포함한다. 이 예에서, 비디오 디코더는 인코딩된 비디오 데이터의 복수의 픽처들을 수신하고, 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지에서, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하고, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하며, 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하도록 구성된다.
다른 예에서, 컴퓨터 판독가능 저장 매체는, 실행될 때, 컴퓨팅 디바이스의 프로세서로 하여금, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하게 하고, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하게 하고, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하게 하며, 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하게 하는 저장된 명령들을 갖는다.
다른 예에서, 비디오 데이터를 디코딩하기 위한 디바이스는 인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하는 수단, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하는 수단, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 수단, 및 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하는 수단을 포함한다.
다른 예에서, 비디오 데이터를 디코딩하는 방법은 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하는 단계, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하는 단계, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하는 단계, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하는 단계, 및 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타낸다는 결정에 기초하여 픽처를 디코딩하는 단계를 포함한다.
다른 예에서, 비디오 데이터를 디코딩하기 위한 디바이스는 비디오 코더 및 인코딩된 비디오 데이터를 저장하는 메모리를 포함한다. 이 예에서, 비디오 코더는 인코딩된 비디오 데이터의 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하고, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하고, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하고, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하며, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타낸다는 결정에 기초하여 픽처를 디코딩하도록 구성된다.
다른 예에서, 컴퓨터 판독가능 저장 매체는, 실행될 때, 컴퓨팅 디바이스의 프로세서로 하여금, 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하게 하고, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하게 하고, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하게 하고, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하게 하며, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타낸다는 결정에 기초하여 픽처를 디코딩하게 하는 저장된 명령들을 갖는다.
다른 예에서, 비디오 데이터를 디코딩하기 위한 디바이스는 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하는 수단, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하는 수단, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하는 수단, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하는 수단, 및 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타낸다는 결정에 기초하여 픽처를 디코딩하는 수단을 포함한다.
하나 이상의 예들의 세부사항들이 첨부 도면들 및 하기의 설명에서 제시된다. 다른 특징들, 목적들, 및 이점들은 이 설명 및 도면들로부터, 그리고 청구항들로부터 자명해질 것이다.
도 1 은 본 개시물에 설명된 하나 이상의 기법들을 구현할 수도 있는 일 예시적인 비디오 인코딩 및 디코딩 시스템을 예시한 블록도이다.
도 2 는 본 개시물에 설명된 하나 이상의 기법들을 구현할 수도 있는 일 예시적인 비디오 인코더를 예시한 블록도이다.
도 3 은 본 개시물에 설명된 하나 이상의 기법들을 구현할 수도 있는 일 예시적인 비디오 디코더를 예시한 블록도이다.
도 4 는, 본 개시물의 하나 이상의 양태들에 따른, 복구 포인트 픽처를 포함하는 일 예시적인 점진적 디코딩 리프레시 (GDR) 세트를 예시한 개념도이다.
도 5 는, 본 개시물의 하나 이상의 양태들에 따른, 복수 포인트 픽처가 시간 스케일링으로 인해 제거된 일 예시적인 점진적 디코딩 리프레시 (GDR) 세트를 예시한 개념도이다.
도 6 은, 본 개시물의 하나 이상의 양태들에 따른, 비디오 디코더 및/또는 그의 컴포넌트들이 인코딩된 비디오 데이터를 디코딩하도록 수행될 수도 있는 일 예시적인 프로세스를 예시한 플로차트이다.
도 7 은, 본 개시물의 하나 이상의 양태들에 따른, 비디오 디코더 및/또는 그의 컴포넌트들이 인코딩된 비디오 데이터를 디코딩하도록 수행될 수도 있는 일 예시적인 프로세스를 예시한 플로차트이다.
일반적으로, 본 개시물의 기법들은 점진적 디코딩 리프레시 (gradual decoding refresh; GDR) 를 사용하여 비디오 데이터를 코딩하면서, 그 코딩된 비디오 데이터의 시간 스케일러빌리티 (temporal scalability) 를 지원하는 것에 관한 것이다. 본 개시물의 다양한 예들에 따르면, 비디오 코딩 디바이스는 AVC 와 HEVC 표준들 양쪽에 의해 지원된 보충 강화 정보 (supplemental enhancement information; SEI) 메커니즘에 의해 제공된 메시지들을 사용하여, GDR 동작들을 지원하면서, 또한 시간 스케일러빌리티를 지원할 수도 있다. 이러한 방식으로, 본 개시물의 기법들은 비디오 코딩 디바이스들이 기존 하드웨어, 소프트웨어, 및 통신 인프라스트럭처들에 영향력을 미칠 수 있게 하면서, GDR 기반 코딩을 향상시켜 시간 스케일러빌리티를 지원할 수 있게 할 수도 있다.
"HEVC Working Draft 10" 또는 "WD10" 이라고 지칭되는 HEVC 표준의 최근 초안은 「문서 JCTVC-L1003v34, Bross 외, "High efficiency video coding (HEVC) text specification draft 10 (for FDIS & Last Call)", ITU-T SG16 WP3 및 ISO/IEC JTC1/SC29/WG11 의 JCT-VC (Joint Collaborative Team on Video Coding), 12차 회의: 스위스 제네바, 2013년 1월 14일 - 23일」에 설명되어 있고, 이는 2013년 6월 6일자로 http://phenix.int-evry.fr/j ct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip 으로부터 다운로드가능하다. WD10 의 전체 내용이 여기에 참조로 포함된다. AVC (ITU-T) H.264 표준은 여기에서 H.264 표준 또는 H.264 사양, 또는 H.264/AVC 표준 또는 사양이라고 지칭될 수도 있는, 2005년 3월자의 ITU-T Study Group 에 의한 ITU-T 권고안 H.264, 일반적인 시청각 서비스들을 위한 어드밴스드 비디오 코딩에 설명되어 있다. JVT (Joint Video Team) 는 H.264/MPEG-4 AVC 에 대한 확장들에 계속 노력을 들이고 있다.
이하 HEVC WD9 라고 지칭되는 HEVC 의 다른 최근 작업 초안 (WD) 은 http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCT-VC-K1003-v8.zip 으로부터 입수가능하다. HEVC WD9 (BROSS 외, "High efficiency video coding (HEVC) text specification draft 9", 문서 JCTVC-K1003_v7, 11차 회의: 중국 상하이, 2012년 10월 10일 - 19일, 290 pp.) 의 전체 내용들은 여기에 참조로 포함된다.
HEVC WD9 는 GDR 을 사용하여 비디오 데이터의 코딩을 지원하는 코딩 동작들을 설명한다. GDR 은, 디바이스로 하여금, 디코딩 순서로 배열된 픽처들의 시퀀스 또는 시리즈와 같은 픽처들의 세트를 코딩할 수 있게 할 수도 있다. 이러한 픽처들의 시퀀스는 여기에서 "GDR 픽처 세트" 또는 "GDR 세트" 라고 지칭된다. 전체 GDR 세트의 횡단시 (예를 들어, GDR 세트의 끝에 도달시), 비디오 코딩 디바이스는, 디코딩 순서로, 그 세트에 후속하는 하나 이상의 인코딩된 픽처들에 랜덤하게 액세스할 수도 있다. 다양한 예들에서, 비디오 코딩 디바이스는 GDR 세트의 마지막 픽처 전체를 올바르게 또는 정확히 디코딩할 수도 있다. 이러한 예들에서, GDR 세트의 첫 번째 픽처는 "GDR 픽처" 를 나타낼 수도 있고, GDR 세트에서의 마지막 픽처는 "복구 포인트 픽처" 를 나타낼 수도 있다. 복구 포인트 픽처는, 차례로, 전체 픽처가 "리프레시된" 또는 "포그라운드" 영역에 포함된 픽처를 나타낼 수도 있다. 따라서, 픽처는, 복구 포인트 픽처에서, 픽처가 완전히 리프레시될 때까지 GDR 세트에서의 픽처들의 시리즈에 걸쳐 점진적으로 리프레시된다. 비디오 코딩 디바이스는 "복구 포인트" SEI 메시지 및/또는 "영역 리프레시 정보" SEI 메시지와 같은 특정 SEI 메시지들을 사용하여, GDR 세트의 경계들뿐만 아니라, GDR 세트에 관련된 다른 정보를 결정할 수도 있다.
부가적으로, HEVC 와 AVC 표준들 양쪽은 비디오 비트스트림들의 시간 스케일러빌리티를 지원한다. 시간 스케일러빌리티는, 비디오 코딩 디바이스로 하여금, 인코딩된 비디오 데이터의 서브세트가 인코딩된 비디오 데이터의 풀 (full) 비트스트림으로부터 추출될 수도 있는 것을 결정할 수 있게 할 수도 있다. 시간 스케일러빌리티에 따라 풀 비트스트림으로부터 추출된 이러한 인코딩된 비디오 데이터의 서브세트 (예를 들어, 인코딩된 픽처들) 는 "시간 서브세트 (temporal subset)" 라고 지칭될 수도 있다. 차례로, AVC 와 HEVC 표준들에 의해 지원되는 시간 스케일러빌리티는 비디오 코딩 디바이스로 하여금 풀 비트스트림으로부터 다수의 시간 서브세트들을 결정할 수 있게 하여, 다양한 시간 서브세트들이 가변 수들의 인코딩된 픽처들을 포함하도록 할 수도 있다. 보다 낮은, 또는 "보다 거친" 시간 서브세트는 풀 비트스트림으로부터 보다 적은 수의 인코딩된 픽처들을 포함할 수도 있고, 보다 낮은 픽처 레이트 또는 프레임 레이트를 나타낼 수도 있다. 역으로, 보다 높은, 또는 "보다 미세한" 시간 서브세트는 풀 비트스트림으로부터 보다 많은 수의 인코딩된 픽처들을 포함할 수도 있고, 보다 높은 픽처 레이트 또는 프레임 레이트를 나타낼 수도 있다.
시간적으로 스케일러블한 비트스트림들에 GDR 기반 코딩의 기존 구현들을 적용하도록 구성된 비디오 코딩 디바이스들은, GDR 세트에 대한 하나 이상의 잠재적인 부정확성들에 직면하거나 또는 이들이 존재할 수도 있다. 예를 들어, GDR 의 기존 구현들에 따르면, 복구 포인트 SEI 메시지에 포함된 신택스 엘리먼트는, GDR 세트를 형성하는, 디코딩 순서로 GDR 픽처에 후속하는 다수의 연속적인 인코딩된 픽처들을 나타낼 수도 있다. 그 결과, 시간 서브세트가 인코더에 의해 시그널링되는 경우들에서, 복구 포인트 SEI 메시지의 신택스 엘리먼트에 의해 나타낸, GDR 세트에서의 다수의 연속적인 인코딩된 픽처들은 부정확할 수도 있다. 예를 들어, 시간 서브세트가 다른 보다 높은 시간 레이어 또는 풀 비트스트림보다 더 작은 수의 인코딩된 픽처들을 나타내기 때문에, 오리지널 GDR 세트의 하나 이상의 인코딩된 픽처들은 디코더에 의해 실제로 수신된 시간 서브세트에 없을 수도 있다. 시간 서브세트는, 예를 들어, 풀 시간 세트를 수신하는 중간 네트워크 엘리먼트에 의해 추출될 수도 있다. 중간 네트워크 엘리먼트는 그 후에 추출된 시간 서브세트를 디코더를 포함하는 클라이언트 디바이스에 제공한다. 다른 예로서, 서버는 시간 서브세트들을 추출할 수도 있거나 디바이스를 포함하는 클라이언트 디바이스로의 전달을 위해 다수의 시간 서브세트들을 저장할 수도 있다.
GDR 세트에서의 픽처들의 수를 나타내는 신택스 엘리먼트는, 추출된 시간 서브세트의 대응하는 GDR 세트에서의 감소된 수의 인코딩된 픽처들을 반영하도록 동적으로 업데이트되지 않을 수도 있다. 이에 따라, 보다 높은 시간 레이어에 대한 GDR 세트를 형성하는 다수의 연속적인 인코딩된 픽처들과, 그로부터 추출된 보다 낮은 시간 레이어의 대응하는 GDR 세트에서의 다수의 연속적인 인코딩된 픽처들 사이에 미스매치가 존재할 수도 있다. 예를 들어, 복구 포인트 SEI 메시지에 의해 나타낸 복구 포인트 픽처는 보다 낮은 시간 레이어를 형성하는 시간 서브세트의 추출 동안 폐기되었을 수도 있다. 이 예에서, 나타낸 복구 포인트 픽처는 디코더에 의해 수신되는 시그널링된 인코딩된 비디오 비트스트림을 형성하는 보다 낮은 시간 레이어에 대해 "존재하지 않을" 수도 있다. 그 결과, 시간 서브-비트스트림 추출의 경우 GDR 세트에서의 하나 이상의 픽처들의 부존재로 인해, GDR 동작들은 디코더 측에서 적절히 동작하지 않을 수도 있다.
시간적으로 스케일러블한 비트스트림들에 대해 GDR 기반 코딩의 이러한 부정확성들을 완화시키거나 또는 잠재적으로 없애기 위해, 본 개시물의 기법들은, 복구 포인트 SEI 메시지에 나타낸 복구 포인트 픽처가 디코더에 의해 실제로 수신된 인코딩된 비디오 비트스트림에 존재하는지 여부에 관계없이, 비디오 코딩 디바이스가 복구 포인트 픽처를 식별할 수 있게 할 수도 있다. 예를 들어, 비디오 디코딩 디바이스는 인코딩된 비디오 비트스트림이 복구 포인트 픽처의 POC 값을 갖는 인코딩된 픽처를 포함하는지 여부를 결정할 수도 있고, 여기서 POC 값은 비트스트림에 포함된 복구 포인트 SEI 메시지에 나타낸다. 비디오 코딩 디바이스가 복구 포인트 SEI 메시지에 나타낸 POC 값을 갖는 인코딩된 픽처를 비트스트림에서 검출하는 경우, 비디오 코딩 디바이스는 그 검출된 픽처를 복구 포인트 픽처로서 식별할 수도 있다. 부가적으로, 이 예에서, 비디오 코딩 디바이스는 식별된 복구 포인트 픽처가 GDR 세트의 마지막 픽처를 또한 형성하는 것을 결정할 수도 있다.
한편, 여기에 설명된 기법들을 구현하는 비디오 코딩 디바이스가 복구 포인트 SEI 메시지에 나타낸 POC 값 (즉, 복구 포인트 픽처의 POC 값) 을 갖는 픽처를 수신된 비트스트림에서 검출하지 못한 경우, 비디오 코딩 디바이스는, 복구 포인트 픽처로서, 복구 포인트 SEI 메시지에 나타낸 POC 값보다 더 큰 POC 값을 갖는 디코더에 의해 수신된 픽처를 식별할 수도 있다. 예를 들어, 비디오 코딩 디바이스는 복구 포인트 SEI 메시지에 나타낸 POC 값보다 더 큰 POC 값을 갖는, 디코딩 순서의, 비트스트림의 첫 번째 픽처로서 복구 포인트 픽처를 식별할 수도 있다. 부가적으로, 이 시나리오에서, 비디오 코딩 디바이스는, 비트스트림에서 수신되고 GDR 세트에서 마지막 픽처로서 식별된 복구 포인트 픽처의 바로 앞에 선행하는 픽처를 식별할 수도 있다. 예를 들어, 식별된 복구 포인트 픽처의 바로 앞에 선행하는 비트스트림의 픽처는, 식별된 복구 포인트 픽처의 POC 값보다 더 작고 그 POC 값과 가장 가까운 POC 값을 갖는 픽처일 수도 있다.
다시 말해, 이 시나리오에서, 비디오 코딩 디바이스는 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처로서 2개의 상이한 픽처들을 식별할 수도 있다. 예를 들어, 이 시나리오에서, GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처는, 인코딩된 비디오 비트스트림에 포함된, 디코딩 순서의, 2개의 연속적인 픽처들일 수도 있다. 이러한 방식으로, 본 개시물의 하나 이상의 기법들은, 비디오 코딩 디바이스로 하여금 GDR 에 따라 수신된 픽처 세트를 디코딩할 수 있게 하면서, 또한 시간적으로 스케일러블한 비디오 비트스트림들을 지원할 수 있게 할 수도 있다. 예를 들어, 디코딩 순서로 처음에 식별된 픽처 (originally-identified picture) 에 후속하는 픽처로서 복구 포인트 픽처를 식별함으로써, 비디오 코딩 디바이스는 완전히 리프레시된 픽처를 선택할 수도 있는데, 이는 선택된 픽처가 처음에 생성된 비트스트림의 완전히 리프레시된 픽처에 후속하여 위치되기 때문이다.
도 1 은 본 개시물에 설명된 기법들을 구현할 수도 있는 일 예시적인 비디오 인코딩 및 디코딩 시스템 (10) 을 예시한 블록도이다. 도 1 에 도시된 바와 같이, 시스템 (10) 은 목적지 디바이스 (14) 에 의해 이후의 시간에 디코딩될 인코딩된 비디오 데이터를 생성하는 소스 디바이스 (12) 를 포함한다. 소스 디바이스 (12) 및 목적지 디바이스 (14) 는, 데스크톱 컴퓨터들, 노트북 (즉, 랩톱) 컴퓨터들, 태블릿 컴퓨터들, 셋톱 박스들, 소위 "스마트" 폰들과 같은 전화 핸드셋들, 소위 "스마트" 패드들, 텔레비전들, 카메라들, 디스플레이 디바이스들, 디지털 미디어 플레이어들, 비디오 게이밍 콘솔들, 비디오 스트리밍 디바이스 등을 포함하는 광범위한 디바이스들 중 임의의 것을 포함할 수도 있다. 일부 경우들에서, 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 무선 통신을 위해 구비될 수도 있다.
목적지 디바이스 (14) 는 디코딩될 인코딩된 비디오 데이터를 링크 (16) 를 통해 수신할 수도 있다. 링크 (16) 는 인코딩된 비디오 데이터를 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 이동시키는 것이 가능한 임의의 타입의 매체 또는 디바이스를 포함할 수도 있다. 하나의 예에서, 링크 (16) 는 소스 디바이스 (12) 로 하여금 인코딩된 비디오 데이터를 직접 목적지 디바이스 (14) 로 실시간으로 송신할 수 있게 하는 통신 매체를 포함할 수도 있다. 인코딩된 비디오 데이터는 무선 통신 프로토콜과 같은 통신 표준에 따라 변조되어, 목적지 디바이스 (14) 로 송신될 수도 있다. 통신 매체는 무선 주파수 (RF) 스펙트럼 또는 하나 이상의 물리적인 송신 라인들과 같은 임의의 무선 또는 유선 통신 매체를 포함할 수도 있다. 통신 매체는 패킷 기반 네트워크, 예컨대 근거리 네트워크, 광역 네트워크, 또는 인터넷과 같은 글로벌 네트워크의 부분을 형성할 수도 있다. 통신 매체는 라우터들, 스위치들, 기지국들, 또는 소스 디바이스 (12) 로부터 목적지 디바이스 (14) 로 통신을 용이하게 하는데 유용할 수도 있는 임의의 다른 장비를 포함할 수도 있다.
대안적으로, 인코딩된 데이터는 출력 인터페이스 (22) 로부터 저장 디바이스 (31) 로 출력될 수도 있다. 이와 유사하게, 인코딩된 데이터는 입력 인터페이스에 의해 저장 디바이스 (31) 로부터 액세스될 수도 있다. 저장 디바이스 (31) 는 하드 드라이브, 블루-레이 디스크들, DVD들, CD-ROM들, 플래시 메모리, 휘발성 또는 비-휘발성 메모리, 또는 인코딩된 비디오 데이터를 저장하기 위한 임의의 다른 적합한 디지털 저장 매체들과 같은 다양한 분산된 또는 로컬로 액세스되는 데이터 저장 매체들 중 임의의 데이터 저장 매체를 포함할 수도 있다. 추가 예에서, 저장 디바이스 (31) 는 소스 디바이스 (12) 에 의해 생성된 인코딩된 비디오를 유지할 수도 있는 파일 서버 또는 다른 중간 저장 디바이스에 대응할 수도 있다. 목적지 디바이스 (14) 는 스트리밍 또는 다운로드를 통해 저장 디바이스 (31) 로부터의 저장된 비디오 데이터에 액세스할 수도 있다. 파일 서버는 인코딩된 비디오 데이터를 저장하고 그 인코딩된 비디오 데이터를 목적지 디바이스 (14) 로 송신하는 것이 가능한 임의의 타입의 서버일 수도 있다. 예시적인 파일 서버들은 웹 서버 (예컨대, 웹사이트용), FTP 서버, NAS (network attached storage) 디바이스들, 또는 로컬 디스크 드라이브를 포함한다. 목적지 디바이스 (14) 는 인터넷 연결을 포함한 임의의 표준 데이터 연결을 통해, 인코딩된 비디오 데이터에 액세스할 수도 있다. 이것은 파일 서버 상에 저장된 인코딩된 비디오 데이터에 액세스하는데 적합한, 무선 채널 (예컨대, Wi-Fi 연결), 유선 연결 (예컨대, DSL, 케이블 모뎀 등), 또는 이 양쪽의 조합을 포함할 수도 있다. 저장 디바이스 (31) 로부터의 인코딩된 비디오 데이터의 송신은 스트리밍 송신, 다운로드 송신, 또는 이 양쪽의 조합일 수도 있다.
본 개시물의 기법들은 반드시 무선 애플리케이션들 또는 설정들로 제한되지 않는다. 이 기법들은 공중경유 텔레비전 브로드캐스트들, 케이블 텔레비전 송신들, 위성 텔레비전 송신들, 예를 들어, 인터넷을 통한 스트리밍 비디오 송신들, 데이터 저장 매체 상의 저장을 위한 디지털 비디오의 인코딩, 데이터 저장 매체 상에 저장된 디지털 비디오의 디코딩, 또는 다른 애플리케이션들과 같은, 다양한 멀티미디어 애플리케이션들 중 임의의 애플리케이션의 지원 하에서 비디오 코딩에 적용될 수도 있다. 일부 예들에서, 시스템 (10) 은 비디오 스트리밍, 비디오 플레이백, 비디오 브로드캐스팅, 및/또는 비디오 전화통신과 같은 애플리케이션들을 지원하기 위한 1-방향 또는 2-방향 비디오 송신을 지원하도록 구성될 수도 있다.
도 1 의 예에서, 소스 디바이스 (12) 는 비디오 소스 (18), 비디오 인코더 (20) 및 출력 인터페이스 (22) 를 포함한다. 일부 경우들에서, 출력 인터페이스 (22) 는 변조기/복조기 (모뎀) 및/또는 송신기를 포함할 수도 있다. 소스 디바이스 (12) 에서, 비디오 소스 (18) 는 소스 예컨대 비디오 캡처 디바이스, 예를 들어, 비디오 카메라, 이전에 캡처된 비디오를 포함하는 비디오 아카이브, 비디오 콘텐츠 제공자로부터 비디오를 수신하는 비디오 공급 인터페이스, 및/또는 컴퓨터 그래픽 데이터를 소스 비디오로서 생성하기 위한 컴퓨터 그래픽 시스템, 또는 이러한 소스들의 조합을 포함할 수도 있다. 하나의 예로서, 비디오 소스 (18) 가 비디오 카메라인 경우, 소스 디바이스 (12) 및 목적지 디바이스 (14) 는 소위 카메라 폰들 또는 비디오 폰들을 형성할 수도 있다. 그러나, 본 개시물에 설명된 기법들은 비디오 코딩에 일반적으로 적용가능할 수도 있으며, 무선 및/또는 유선 애플리케이션들에 적용될 수도 있다.
캡처되거나, 미리 캡처되거나, 또는 컴퓨터-생성된 비디오는 비디오 인코더 (20) 에 의해 인코딩될 수도 있다. 인코딩된 비디오 데이터는 소스 디바이스 (12) 의 출력 인터페이스 (22) 를 통해 목적지 디바이스 (14) 로 바로 송신될 수도 있다. 인코딩된 비디오 데이터는 또한 (또는 대안적으로) 디코딩 및/또는 플레이백을 위해, 목적지 디바이스 (14) 또는 다른 디바이스들에 의한 추후 액세스를 위해 저장 디바이스 (31) 상으로 저장될 수도 있다.
목적지 디바이스 (14) 는 입력 인터페이스 (28), 비디오 디코더 (30), 및 디스플레이 디바이스 (32) 를 포함한다. 일부 경우들에서, 입력 인터페이스 (28) 는 수신기 및/또는 모뎀을 포함할 수도 있다. 목적지 디바이스 (14) 의 입력 인터페이스 (28) 는 인코딩된 비디오 데이터를 링크 (16) 를 통해 수신한다. 링크 (16) 를 통해 통신되거나, 또는 저장 디바이스 (31) 상에 제공되는 인코딩된 비디오 데이터는, 비디오 데이터를 디코딩함에 있어서, 비디오 디코더 (30) 와 같은 비디오 디코더에 의한 사용을 위해 비디오 인코더 (20) 에 의해 생성되는 다양한 신택스 엘리먼트들을 포함할 수도 있다. 이러한 신택스 엘리먼트들은 통신 매체 상으로 송신되거나, 저장 매체 상에 저장되거나, 또는 파일 서버에 저장되는 인코딩된 비디오 데이터에 포함될 수도 있다.
디스플레이 디바이스 (32) 는 목적지 디바이스 (14) 와 통합되거나 또는 그 외부에 있을 수도 있다. 일부 예들에서, 목적지 디바이스 (14) 는 통합된 디스플레이 디바이스를 포함하며, 또한 외부 디스플레이 디바이스와 인터페이싱하도록 구성될 수도 있다. 다른 예들에서, 목적지 디바이스 (14) 는 디스플레이 디바이스일 수도 있다. 일반적으로, 디스플레이 디바이스 (32) 는 그 디코딩된 비디오 데이터를 사용자에게 디스플레이하며, 액정 디스플레이 (LCD), 플라즈마 디스플레이, 유기 발광 다이오드 (OLED) 디스플레이, 또는 다른 타입의 디스플레이 디바이스와 같은 다양한 디스플레이 디바이스들 중 임의의 디바이스를 포함할 수도 있다.
비디오 인코더 (20) 및 비디오 디코더 (30) 는 현재 개발 중인 고효율 비디오 코딩 (HEVC) 표준과 같은 비디오 압축 표준에 따라 동작할 수도 있으며, HEVC 테스트 모델 (HM) 에 따를 수도 있다. 대안적으로, 비디오 인코더 (20) 및 비디오 디코더 (30) 는, MPEG 4, Part 10, 어드밴스드 비디오 코딩 (AVC) 이라고 대안적으로 지칭되는 ITU-T H.264 표준과 같은 다른 사유 (proprietary) 또는 산업 표준들, 또는 이러한 표준들의 확장들에 따라 동작할 수도 있다. 그러나, 본 개시물의 기법들은 임의의 특정 코딩 표준으로 제한되지 않는다. 비디오 압축 표준들의 다른 예들은 MPEG-2 및 ITU-T H.263 을 포함한다.
도 1 에 도시되지 않았지만, 일부 양태들에서, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 오디오 인코더 및 디코더와 각각 통합될 수도 있으며, 공통 데이터 스트림 또는 별개의 데이터 스트림들에서 오디오와 비디오 양쪽의 인코딩을 핸들링하기 위해 적합한 MUX-DEMUX 유닛들, 또는 다른 하드웨어 및 소프트웨어를 포함할 수도 있다. 적용가능한 경우, 일부 예들에서, MUX-DEMUX 유닛들은 ITU H.223 멀티플렉서 프로토콜, 또는 다른 프로토콜들, 예컨대, 사용자 데이터그램 프로토콜 (UDP) 에 따를 수도 있다.
비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 하나 이상의 마이크로프로세서들, 디지털 신호 프로세서 (DSP) 들, 주문형 집적 회로 (ASIC) 들, 필드 프로그래밍가능 게이트 어레이 (FPGA) 들, 이산 로직, 소프트웨어, 하드웨어, 펌웨어 또는 이들의 임의의 조합들과 같은 다양한 적합한 인코더 회로부 중 임의의 것으로서 구현될 수도 있다. 이 기법들이 소프트웨어로 부분적으로 구현될 때, 디바이스는 본 개시물의 기법들을 수행하기 위해 소프트웨어용 명령들을 적합한 비일시적 컴퓨터 판독가능 매체에 저장하고, 그 명령들을 하드웨어에서 하나 이상의 프로세서들을 사용하여 실행할 수도 있다. 비디오 인코더 (20) 및 비디오 디코더 (30) 각각은 하나 이상의 인코더들 또는 디코더들에 포함될 수도 있으며, 이들 중 어느 쪽이든 각각의 디바이스에서 결합된 인코더/디코더 (코덱) 의 부분으로서 통합될 수도 있다.
JCT-VC 는 HEVC 표준의 개발에 노력하고 있다. HEVC 표준화 노력들은 HEVC 테스트 모델 (HM) 이라고 지칭되는 비디오 코딩 디바이스의 진화 모델에 기초한다. HM 은, 예를 들어, ITU-T H.264/AVC 에 따른 기존 디바이스들에 관련된 비디오 코딩 디바이스들의 여러 부가적인 능력들을 가정한다. 예를 들어, H.264 가 9개의 인트라-예측 인코딩 모드들을 제공하는 반면, HM 은 33개 만큼이나 많은 인트라-예측 인코딩 모드들을 제공할 수도 있다.
일반적으로, HM 의 작업 모델은 비디오 프레임 또는 픽처가 루마 샘플과 크로마 샘플 양쪽을 포함하는 트리블록들 또는 최대 코딩 유닛들 (LCU) 의 시퀀스로 분할될 수도 있다고 설명한다. 트리블록은 H.264 표준의 매크로블록과 유사한 목적을 갖는다. 슬라이스는 코딩 순서로 다수의 연속적인 트리블록들을 포함한다. 비디오 프레임 또는 픽처는 하나 이상의 슬라이스들로 파티셔닝될 수도 있다. 각각의 트리블록은 쿼드트리에 따라 코딩 유닛 (CU) 들로 분할될 수도 있다. 예를 들어, 쿼드트리의 루트 노드로서의 트리블록은, 4개의 자식 노드들로 분할될 수도 있고, 각각의 자식 노드는 차례로 부모 노드일 수도 있으며 다른 4개의 자식 노드들로 분할될 수도 있다. 쿼드트리의 리프 노드로서의 최종의 미분할된 자식 노드는 코딩 노드, 즉, 코딩된 비디오 블록을 포함한다. 코딩된 비트스트림과 연관되는 신택스 데이터는 트리블록이 분할될 수도 있는 최대 횟수를 정의할 수도 있으며, 또한 코딩 노드들의 최소 사이즈를 정의할 수도 있다.
CU 는 루마 코딩 블록 및 2개의 크로마 코딩 블록들을 포함할 수도 있다. CU 는 관련 예측 유닛 (PU) 들 및 변환 유닛 (TU) 들을 가질 수도 있다. PU들 각각은 하나의 루마 예측 블록 및 2개의 크로마 예측 블록들을 포함할 수도 있고, TU들 각각은 하나의 루마 변환 블록 및 2개의 크로마 변환 블록들을 포함할 수도 있다. 코딩 블록들 각각은, 동일한 예측이 적용되는 샘플들에 대한 블록들을 포함하는 하나 이상의 예측 블록들로 파티셔닝될 수도 있다. 코딩 블록들 각각은 또한, 동일한 변환이 적용되는 샘플의 블록들을 포함하는 하나 이상의 변환 블록들로 파티셔닝될 수도 있다.
CU 의 사이즈는 일반적으로 코딩 노드의 사이즈에 대응하고 통상적으로 정사각형 형상이다. CU 의 사이즈는 8 x 8 픽셀들로부터 64 x 64 픽셀들 이상의 최대치를 갖는 트리블록의 사이즈까지의 범위에 있을 수도 있다. 각각의 CU 는 하나 이상의 PU들 및 하나 이상의 TU들을 정의할 수도 있다. CU 에 포함된 신택스 데이터는, 예를 들어, 하나 이상의 예측 블록들로의 코딩 블록의 파티셔닝을 설명할 수도 있다. 파티셔닝 모드들은 CU 가 스킵되는지 또는 직접 모드 인코딩되는지, 인트라-예측 모드 인코딩되는지, 또는 인터-예측 모드 인코딩되는지 간에 다를 수도 있다. 예측 블록들은 정사각형 또는 비-정사각형 형상으로 파티셔닝될 수도 있다. CU 에 포함된 신택스 데이터는 또한, 예를 들어, 쿼드트리에 따른 하나 이상의 변환 블록들로의 코딩 블록의 파티셔닝을 설명할 수도 있다. 변환 블록들은 정사각형 또는 비-정사각형 형상으로 파티셔닝될 수도 있다.
HEVC 표준은, 상이한 CU들에 대해 상이할 수도 있는 TU들에 따른 변환들을 허용한다. TU들은 통상적으로 파티셔닝된 LCU 에 대해 정의된 주어진 CU 내의 PU들의 사이즈에 기초하여 사이징되지만, 이것은 항상 그러한 것은 아닐 수도 있다. TU들은 통상적으로 PU들과 동일한 사이즈이거나 또는 더 작다. 일부 예들에서, CU 에 대응하는 잔차 샘플들은 "잔차 쿼드 트리" (RQT) 로서 알려진 쿼드트리 구조를 사용하여 더 작은 유닛들로 세분될 수도 있다. RQT 의 리프 노드들은 TU들을 나타낼 수도 있다. TU들과 연관된 픽셀 차이 값들은 변환 계수들을 생성하기 위해 변환될 수도 있으며, 그 변환 계수들은 양자화될 수도 있다.
일반적으로, PU 는 예측 프로세스에 관련된 데이터를 포함한다. 예를 들어, PU 가 인트라-모드 인코딩될 때, PU 는 PU 에 대한 인트라-예측 모드를 설명하는 데이터를 포함할 수도 있다. 다른 예로서, PU 가 인터-모드 인코딩될 때, PU 는 PU 에 대한 모션 벡터를 정의하는 데이터를 포함할 수도 있다. PU 에 대한 모션 벡터를 정의하는 데이터는, 예를 들어, 모션 벡터의 수평 컴포넌트, 모션 벡터의 수직 컴포넌트, 모션 벡터에 대한 해상도 (예를 들어, 1/4 픽셀 정밀도 또는 1/8 픽셀 정밀도), 모션 벡터가 가리키는 참조 픽처, 및/또는 모션 벡터에 대한 참조 픽처 리스트 (예를 들어, 리스트 0, 리스트 1, 또는 리스트 C) 를 설명할 수도 있다.
일반적으로, TU 는 변환 및 양자화 프로세스들에 사용된다. 하나 이상의 PU들을 갖는 주어진 CU 는 또한 하나 이상의 TU들을 포함할 수도 있다. 예측에 후속하여, 비디오 인코더 (20) 는 PU 에 따라 코딩 노드에 의해 식별된 비디오 블록으로부터 잔차 값들을 계산할 수도 있다. 코딩 노드는 그 후에 오리지널 비디오 블록보다는 오히려 잔차 값들을 참조하도록 업데이트된다. 잔차 값들은, 변환 계수들로 변환될 수도 있고, 양자화될 수도 있고, 변환들과, 엔트로피 코딩을 위해 직렬화된 변환 계수들을 생성하기 위해 TU들에서 특정된 다른 변환 정보를 사용하여 스캐닝될 수도 있는 픽셀 차이 값들을 포함한다. 코딩 노드는 이들 직렬화된 변환 계수들을 참조하도록 다시 한번 업데이트될 수도 있다. 본 개시물은 통상적으로 CU 의 코딩 노드를 지칭하기 위해 용어 "비디오 블록" 을 사용한다. 일부의 특정한 경우들에 있어서, 본 개시물은 또한 코딩 노드와 PU들 및 TU들을 포함하는 트리블록, 즉, LCU 또는 CU 를 지칭하기 위해 용어 "비디오 블록"을 사용할 수도 있다.
비디오 시퀀스는 통상적으로 비디오 프레임들 또는 픽처들의 시리즈를 포함한다. 픽처들의 그룹 (group of pictures; GOP) 은 일반적으로 비디오 픽처들 중 하나 이상의 비디오 픽처의 시리즈를 포함한다. GOP 는 GOP 의 헤더, 픽처들 중 하나 이상의 픽처의 헤더, 또는 다른 곳에서의 신택스 데이터를 포함할 수도 있고, 이 신택스 데이터는 GOP 에 포함된 다수의 픽처들을 설명한다. 픽처의 각각의 슬라이스는 각각의 슬라이스에 대한 인코딩 모드를 설명하는 슬라이스 신택스 데이터를 포함할 수도 있다. 비디오 인코더 (20) 는 통상적으로 비디오 데이터를 인코딩하기 위해 개별적인 비디오 슬라이스들 내의 비디오 블록들에 대해 동작한다. 비디오 블록은 CU 내의 코딩 노드에 대응할 수도 있다. 비디오 블록들은 고정된 또는 가변 사이즈들을 가질 수도 있고, 특정된 코딩 표준에 따라 사이즈가 상이할 수도 있다.
일 예로서, HM 은 다양한 PU 사이즈들에 있어서의 예측을 지원한다. 특정 CU 의 사이즈가 2N x 2N 이라고 가정하면, HM 은 2N x 2N 또는 N x N 의 PU 사이즈들에 있어서의 인트라-예측과, 2N x 2N, 2N x N, N x 2N, 또는 N x N 의 대칭적인 PU 사이즈들에 있어서의 인터-예측을 지원한다. HM 은 2N x nU, 2N x nD, nL x 2N, 및 nR x 2N 의 PU 사이즈들에 있어서의 인터-예측을 위한 비대칭적 파티셔닝을 또한 지원한다. 비대칭적인 파티셔닝에서는, CU 의 하나의 방향이 파티셔닝되지 않는 한편, 다른 방향은 25% 및 75% 로 파티셔닝된다. 25% 파티션에 대응하는 CU 의 일부는 "n" 과, 그 이후의 "상부 (Up)", "하부 (Down)", "좌측 (Left)", 또는 "우측 (Right)" 의 표시에 의해 나타낸다. 따라서, 예를 들어, "2N x nU" 는 상부의 2N x 0.5N PU 및 하부의 2N x 1.5N PU 로 수평으로 파티셔닝되는 2N x 2N CU 를 지칭한다.
본 개시물에서, "N x N" 및 "N × N" 은 수직 및 수평 차원들의 관점에서의 비디오 블록의 픽셀 차원들, 예를 들어, 16 x 16 픽셀들 또는 16 × 16 픽셀들을 지칭하기 위해 상호교환가능하게 사용될 수도 있다. 일반적으로, 16 x 16 블록은 수직 방향에서의 16개의 픽셀들 (y = 16) 및 수평 방향에서의 16개의 픽셀들 (x = 16) 을 가질 것이다. 이와 마찬가지로, N x N 블록은 일반적으로 수직 방향에서의 N개의 픽셀들 및 수평 방향에서의 N개의 픽셀들을 가지며, 여기서 N 은 음이 아닌 정수 값을 나타낸다. 블록 내의 픽셀들은 로우들 및 컬럼들로 배열될 수도 있다. 또한, 블록들은 수직 방향에서와 동일한 수의 픽셀들을 수평 방향에서 반드시 가질 필요는 없다. 예를 들어, 블록들은 N x M 픽셀들을 포함할 수도 있고, 여기서 M 은 반드시 N 과 동일하지는 않다.
CU 의 PU들을 사용한 인트라-예측 또는 인터-예측 코딩에 후속하여, 비디오 인코더 (20) 는 CU 의 TU들에 의해 특정된 변환들이 적용되는 잔차 데이터를 계산할 수도 있다. 잔차 데이터는 인코딩되지 않은 픽처의 픽셀들과 CU들에 대응하는 예측 값들과의 사이의 픽셀 차이들에 대응할 수도 있다. 비디오 인코더 (20) 는 CU 에 대한 잔차 데이터를 형성할 수도 있고, 그 후에 잔차 데이터를 변환하여 변환 계수들을 생성할 수도 있다.
변환 계수들을 생성하기 위한 임의의 변환들에 후속하여, 비디오 인코더 (20) 는 변환 계수들의 양자화를 수행할 수도 있다. 양자화는 일반적으로, 계수들을 나타내기 위해 사용된 데이터의 양을 가능하다면 감소시키기 위해 변환 계수들이 양자화되어 추가의 압축을 제공하는 프로세스를 지칭한다. 양자화 프로세스는 계수들의 일부 또는 전부와 연관된 비트 심도를 감소시킬 수도 있다. 예를 들어, n-비트 값은 양자화 동안에 m-비트 값으로 버림 (round down) 될 수도 있고, 여기서 n 은 m 보다 더 크다.
일부 예들에서, 비디오 인코더 (20) 는 엔트로피 인코딩될 수 있는 직렬화된 벡터를 생성하기 위해 양자화된 변환 계수들을 스캐닝하기 위한 미리 정의된 스캔 순서를 활용할 수도 있다. 다른 예들에서, 비디오 인코더 (20) 는 적응적 스캔 (adaptive scan) 을 수행할 수도 있다. 1차원 벡터를 형성하기 위해 양자화된 변환 계수들을 스캐닝한 후에, 비디오 인코더 (20) 는, 예를 들어, 콘텍스트 적응 가변 길이 코딩 (context adaptive variable length coding; CAVLC), 콘텍스트 적응 이진 산술 코딩 (context adaptive binary arithmetic coding; CABAC), 신택스-기반 콘텍스트-적응 이진 산술 코딩 (syntax-based context-adaptive binary arithmetic coding; SBAC), 확률 간격 파티셔닝 엔트로피 (Probability Interval Partitioning Entropy; PIPE) 코딩 또는 다른 엔트로피 인코딩 방법론에 따라 1차원 벡터를 엔트로피 인코딩할 수도 있다. 비디오 인코더 (20) 는 비디오 데이터를 디코딩함에 있어서 비디오 디코더 (30) 에 의한 사용을 위해 인코딩된 비디오 데이터와 연관된 신택스 엘리먼트들을 또한 엔트로피 인코딩할 수도 있다.
CABAC 를 수행하기 위해, 비디오 인코더 (20) 는 콘텍스트 모델 내의 콘텍스트를 송신되어야 할 심볼에 배정할 수도 있다. 콘텍스트는, 예를 들어, 심볼의 이웃하는 값들이 비-제로 (non-zero) 인지 아닌지의 여부에 관련될 수도 있다. CAVLC 를 수행하기 위해, 비디오 인코더 (20) 는 송신되어야 할 심볼에 대한 가변 길이 코드를 선택할 수도 있다. VLC 에서의 코드워드 (codeword) 들은, 상대적으로 더 짧은 코드들이 더 확률이 큰 심볼들에 대응하는 한편, 더 긴 코드들이 더 확률이 작은 심볼들에 대응하도록 구성될 수도 있다. 이러한 방법으로, VLC 의 사용은, 예를 들어, 송신되어야 할 각각의 심볼에 대한 동일-길이 코드워드들을 사용하는 것에 비해 비트 절감을 달성할 수도 있다. 확률 결정은 심볼에 배정된 콘텍스트에 기초할 수도 있다.
비디오 인코더 (20) 와 비디오 디코더 (30) 중 하나 또는 양쪽은 점진적 디코딩 리프레시 (GDR) 에 따라 비디오 데이터를 코딩하면서, 시간적으로 스케일러블한 비트스트림들을 지원하도록 본 개시물의 기법들을 구현할 수도 있다. 비디오 인코더 (20) 는 픽처들의 시리즈 또는 시퀀스를 인코딩하여 GDR 세트를 형성하도록 구성되거나 또는 이와 다르게는 동작가능할 수도 있다. 예를 들어, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 GDR 세트의 각각의 픽처는 픽처의 각각의 부분의 인트라-코딩을 통해 점진적으로 리프레시되는 것을 결정할 수도 있다. GDR 세트를 형성하는 픽처들의 시리즈를 통해 상이한 부분들이 연속하여 인트라-리프레시됨에 따라, GDR 세트의 마지막 픽처 (및 하나 이상의 후속 픽처들) 는 완전히 리프레시될 수도 있다. 차례로, 비디오 인코더 (20) 는 인코딩된 비디오 비트스트림의 부분으로서 GDR 세트를 비디오 디코더 (30) 에 시그널링할 수도 있다.
비디오 인코더 (20) 와 비디오 디코더 (30) 중 하나 또는 양쪽은, 첫 번째 GDR 픽처에서 시작하고, 디코딩 순서로 첫 번째 GDR 픽처에 후속하는 하나 이상의 픽처들을 포함하는 픽처들의 시퀀스로서 GDR 세트를 식별할 수도 있다. 부가적으로, GDR 세트를 식별하기 위해, 비디오 인코더 (20) 및/또는 비디오 디코더 (30) 는 복구 포인트 SEI 메시지와 연관된 픽처로서 GDR 픽처를 식별할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 "recovery_poc_cnt" 신택스 엘리먼트를 포함하도록 복구 포인트 SEI 메시지를 생성할 수도 있다. 비디오 인코더 (20) 는 동일한 GDR 세트와 연관된 복구 포인트 픽처와 첫 번째 GDR 픽처의 POC 값 사이의 차이, 또는 델타를 나타내는 값을 갖도록 recovery_poc_cnt 신택스 엘리먼트를 생성할 수도 있다. 복구 포인트 픽처는 통상적으로 비디오 인코더 (20) 에 의해 준비된 오리지널 GDR 세트에서 마지막 픽처일 것이다.
비디오 인코더 (20) 는 또한, GDR 에 따라, GDR 세트에 픽처들의 리프레시된 및 비-리프레시된 영역들 상의 정보를 포함하는 영역 리프레시 정보 SEI 메시지를 생성하고 시그널링할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 GDR 세트의 각각의 인코딩된 픽처에 대한 영역 리프레시 정보 SEI 메시지를 시그널링할 수도 있다. 차례로, 비디오 디코더 (30) 는 각각의 영역 리프레시 정보 SEI 메시지를 디코딩하여 대응하는 픽처의 리프레시된 영역을 결정할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 GDR 세트의 각각의 픽처에 대응하는 AU 에서의 각각의 영역 리프레시 정보 SEI 메시지를 시그널링할 수도 있다. 다양한 예들에서, 비디오 디코더 (30) 는 GDR 세트에서의 마지막 픽처에 대응하는 영역 리프레시 정보 SEI 메시지를 디코딩하여, 전체 픽처가 리프레시된 영역에 대응하는 것을 결정할 수도 있다. 다시 말해, 이러한 예들에서, 비디오 디코더 (30) 는, 비디오 인코더 (20) 에 의해 픽처와 동일한 AU 에서 시그널링된 영역 리프레시 정보 SEI 메시지를 디코딩한 것에 기초하여, 설정된 GDR 에서의 마지막 픽처가 "완전히 리프레시되는" 것을 결정할 수도 있다. HEVC 작업 초안 (예를 들어, "WD9") 에서 지원되는 SEI 메시지들의 개관이 아래의 표 1 에 예시된다.
SEI 메시지 목적
버퍼링 주기 가설 참조 디코더 (HRD) 동작에 대한 초기 지연들
픽처 타이밍 HRD 동작에 대한 픽처 출력 시간 및 픽처/서브-픽처 제거 시간뿐만 아니라, 픽처 구조 관련 정보
팬-스캔 직사각형 출력 픽처들의 픽처 애스팩트비 (PAR) 와는 상이한 PAR 에서 디스플레이
필러 페이로드 특정 제약들을 만족하도록 비트레이트를 조정
사용자 데이터 등록
사용자 데이터 미등록
외부 엔티티들에 의해 특정될 SEI 메시지들
복구 포인트 명확한 랜덤 액세스를 위한 부가적 정보. 점진적 디코딩 리프레시.
장면 정보 장면 변화들 및 천이들에 관한 정보
풀-프레임 스냅샵 관련 디코딩 픽처를 비디오 콘텐츠의 스틸-이미지 스냅샷으로서 라벨링하기 위한 표시
점진적 리파인먼트 세그먼트 특정한 연속적인 픽처들이 움직이는 장면보다는 픽처의 품질의 점진적인 리파인먼트를 나타내는 것을 표시
필름 그레인 특성들 디코더들이 필름 그레인을 합성할 수 있게 함
디블록킹 필터 디스플레이 선호도 디스플레이된 픽처들이 인-루프 디블록킹 필터 프로세스를 경험해야 하는지 아닌지의 여부를 추천
포스트-필터 힌트 제안된 포스트-필터 계수들 또는 포스트-필터 설계를 위한 상관 정보를 제공
톤 맵핑 정보 인코딩시 사용되거나 가정되는 것과는 다른 컬러 공간으로 재맵핑
프레임 팩킹 배열 입체적인 비디오를 HEVC 비트스트림으로 팩킹
디스플레이 배향 출력 픽처들이 디스플레이될 경우 출력 픽처들에 적용되어야 하는 플립핑 및/또는 회전을 특정
픽처 구조 설명 비트스트림의 시간 및 인터 예측 구조를 설명
디코딩된 픽처 해시 에러 검출을 위해 사용될 수도 있는 디코딩된 픽처의 검사합
액티브 파라미터 세트들 액티브 VPS, SPS 등에 관한 정보를 제공
디코딩 유닛 정보 HRD 동작에 대한 서브-픽처 제거 시간뿐만 아니라, 디코딩 유닛 인덱스
시간 레벨 제로 인덱스 시간 레벨 제로 인덱스 값들을 제공
스케일러블 네스팅 상이한 동작 포인트들과 레이어들에 대한 연관을 위한 네스트 SEI 메시지들에 대한 메커니즘을 제공
영역 리프레시 정보 점진적 디코딩 리프레시를 위한 리프레시된 및 비-리프레시된 영역에 대한 정보를 제공
SEI 메시지들의 개관
HEVC WD9 에서 지원되는 복구 포인트 SEI 메시지에 대한 신택스 및 시맨틱스가 아래의 신택스 테이블 1 에 예시된다.
Figure pct00001
신택스 테이블 1
HEVC WD9 에서 지원되는 영역 리프레시 SEI 메시지에 대한 신택스 및 시맨틱스가 아래의 신택스 테이블 2 에 예시된다.
Figure pct00002
신택스 테이블 2
비디오 디코더 (30) 는 수신된 인코딩된 비디오 비트스트림에서 복구 포인트 SEI 메시지를 검출한 것에 기초하여 GDR 세트의 시작을 검출할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 첫 번째 GDR 픽처로서 복구 포인트 SEI 메시지와 연관된 인코딩된 픽처를 식별할 수도 있다. 예를 들어, 복구 포인트 SEI 메시지는 픽처와 동일한 액세스 유닛 (access unit; AU) 에 포함되고 있는 것에 의해 특정 픽처와 연관될 수도 있다. 차례로, 비디오 디코더 (30) 는 GDR 픽처의 POC 값에 대해 recovery_poc_cnt 신택스 엘리먼트의 값을 적용하여, 복구 포인트 픽처의 POC 값을 결정할 수도 있다. 도출된 POC 값을 적용하는 것에 의한 복구 포인트 픽처의 검출시, 비디오 디코더 (30) 는 복구 포인트 픽처가 완전히 리프레시된 픽처인 것과, 복구 포인트 픽처뿐만 아니라, 디코딩 순서로 복구 포인트 픽처에 후속하는 하나 이상의 픽처들이, 올바르게 또는 거의 올바르게 디코딩될 (예를 들어, 인트라-디코딩될) 수 있는 것을 결정할 수도 있다.
부가적으로, 비디오 디코더 (30) 는 비트스트림에서 시그널링된 하나 이상의 영역 리프레시 정보 SEI 메시지들을 디코딩하여, GDR 세트에서의 리프레시된 및 비-리프레시된 영역들에 관한 정보를 획득할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 GDR 세트에서의 각각의 픽처에 대한 개별적인 영역 리프레시 정보 SEI 메시지를 디코딩할 수도 있다. 일 예로서, 비디오 디코더 (30) 는 GDR 세트의 대응하는 픽처를 포함하는 각각의 AU 에 포함된 각각의 영역 리프레시 정보 SEI 메시지를 디코딩할 수도 있다. 차례로, 비디오 디코더 (30) 는, 특정 픽처에 대응하는 영역 리프레시 정보 SEI 메시지를 디코딩하는 것으로부터 획득된 데이터에 기초하여, 특정 픽처의 리프레시된 영역 (및/또는 역으로, 비-리프레시된 영역) 을 결정할 수도 있다. 관련 픽처 전체가 리프레시된 영역에 대응함을 나타내는 영역 리프레시 정보 SEI 메시지의 디코딩시, 비디오 디코더 (30) 는 관련 픽처가 완전히 리프레시되는 것을 결정할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 완전히 리프레시된 픽처가 GDR 세트에서의 마지막 픽처를 형성하는 것을 결정할 수도 있다. 픽처가 GDR 세트에서의 마지막 픽처인 것을 결정하여, 픽처가 완전히 리프레시되는 것을 결정한 것에 기초하여, 비디오 디코더 (30) 는, GDR 세트에서의 마지막 픽처뿐만 아니라, 디코딩 순서로 GDR 세트에서의 마지막 픽처에 후속하는 하나 이상의 픽처들이, 올바르게 또는 거의 올바르게 디코딩될 (예를 들어, 인트라-디코딩될) 수 있는 것을 결정할 수도 있다. 통상적으로, 비디오 디코더 (30) 는, 복구 포인트 SEI 메시지에 의해 식별된 복구 포인트 픽처가, 완전히 리프레시된 상태를 나타내는 대응하는 영역 리프레시 정보 SEI 메시지에 의해 식별된 것과 동일한 GDR 세트에서의 마지막 픽처와 동일한 것을 결정한다.
부가적으로, HEVC WD9 에 따르면, 비디오 인코더 (20) 와 비디오 디코더 (30) 중 하나 또는 양쪽은 인코딩된 비디오 비트스트림들의 시간 스케일러빌리티를 지원할 수도 있다. 예를 들어, 비디오 인코더 (20) 및 비디오 디코더 (30) 는 상이한 인코딩된 비디오 비트스트림들에 의해 제공된 가변 픽처 레이트들 (또는 "프레임 레이트들") 을 지원할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 보다 높은 시간 레이어를 나타내는 풀 인코딩된 비디오 비트스트림을 시그널링할 수도 있다. 풀 인코딩된 비디오 비트스트림보다 더 낮은 시간 픽처 레이트를 지원하기 위해, 비디오 디코더 (30), 또는 비디오 인코더 (20) 와 비디오 디코더 (30) 사이에 위치된 중간 디바이스, 예컨대 중간 네트워크 엘리먼트 또는 서버는, 풀 인코딩된 비디오 비트스트림의 시간 서브세트를 추출할 수도 있다. 특정 예에서, 중간 디바이스는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 서브세트를 추출하고, 그 추출된 서브세트를 비디오 디코더 (30) 에 중계할 수도 있다. 다시 말해, 비디오 디코더 (30) 에서 실제로 수신된 인코딩된 픽처들의 서브세트는, 비디오 인코더 (20) 에 의해 처음에 생성되었던 풀 인코딩된 비디오 비트스트림을 포함할 수도 있고, 또는 시간 스케일링의 경우, 비디오 인코더 (20) 에 의해 처음에 생성되었던 풀 인코딩된 비디오 비트스트림과 비교한다면, 적어도 하나의 보다 적은 인코딩된 픽처를 포함할 수도 있다. 보다 낮은 픽처 레이트를 지원하기 위해 비디오 디코더 (30) 에 의해 수신된 인코딩된 픽처들의 서브세트는 여기에서 "시간 서브세트" 또는 "서브-비트스트림" 이라고 지칭된다.
비디오 디코더 (30) 는, 인코딩된 비디오 비트스트림들의 시간 스케일러빌리티를 통해 제공된 상이한 픽처 레이트들에 따라, 상이한 시간 서브세트들을 수신할 수도 있다. 하나의 예에서, 비디오 디코더 (30) 는 비디오 인코더 (20) 에 의해 처음에 시그널링된 풀 인코딩된 비디오 비트스트림의 제 1 시간 서브세트를 수신하고 디코딩함으로써 낮은 픽처 레이트를 지원할 수도 있다. 이 예에 따르면, 비디오 디코더 (30) 는, 제 1 시간 서브세트보다 더 많은 적어도 하나의 인코딩된 픽처를 포함하지만 풀 인코딩된 비디오 비트스트림보다는 더 적은 적어도 하나의 인코딩된 픽처를 포함하는 제 2 시간 서브세트를 수신하고 디코딩함으로써 중간 픽처 레이트를 지원할 수도 있다. 이 예에서, 비디오 디코더 (20) 는, 비디오 인코더 (20) 에 의해 처음에 시그널링된 풀 인코딩된 비디오 비트스트림의 전체 (예를 들어, 인코딩된 픽처들의 풀 세트) 를 수신하고 디코딩함으로써 가장 높은 가능성의 픽처 레이트를 지원할 수도 있다.
그러나, 비디오 디코더 (30) 가 HEVC WD9 에 따라 시간 서브세트의 부분으로서 GDR 세트를 수신하는 일부 경우들에서, 복구 포인트 픽처는 시간 서브세트의 추출 동안 폐기되어, 디코더에 송신되지 않았을 수도 있어서, 처음에 인코딩된 비트스트림으로부터의 실제 복구 포인트 픽처는 비디오 디코더 (30) 에 의해 수신된 인코딩된 비디오 비트스트림에 존재하지 않을 수도 있다. 그 결과, 이들 예들에서, 비디오 디코더 (30) 는 복구 포인트 SEI 메시지에 포함된 recovery_poc_cnt 신택스 엘리먼트의 값을 적용함으로써 복구 포인트 픽처를 로케이팅하는 것이 불가능할 수도 있다. 다시 말해, 비디오 디코더 (30) 는 GDR 에 따라 완전히 리프레시된 GDR 세트의 끝에서 픽처를 식별하는 것이 가능하지 않을 수도 있다. 그 결과, 디코더 (30) 에서의 GDR 동작은 적절히 동작하지 않을 수도 있다.
시간적으로 스케일링한 GDR 세트들에 대해 상술된 잠재적인 부정확성들을 완화시키거나 또는 없애기 위해, 비디오 디코더 (30) 는 본 개시물의 하나 이상의 기법들을 구현할 수도 있다. 여기에 설명된 기법들의 일부 구현들에서, 비디오 디코더 (30) 는, 복구 포인트 SEI 메시지에서의 recovery_poc_cnt 신택스 엘리먼트에 의해 식별된 복구 포인트 픽처가 수신된 인코딩된 비디오 비트스트림에 포함되는지 아닌지의 여부를 결정할 수도 있다. 비디오 디코더 (30) 가, recovery_poc_cnt 신택스 엘리먼트의 값으로부터의 POC 값을 계산한 것에 기초하여, 복구 포인트 픽처가 인코딩된 비디오 비트스트림에 포함되는 것을 결정하는 경우, 비디오 디코더 (30) 는 이러한 픽처를 복구 포인트 픽처로서 식별할 수도 있다. 그 후에, 디코더 (30) 는 완전히 리프레시된 픽처들로서 후속 픽처들 및 복구 포인트 픽처를 사용할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 랜덤 액세스를 수행함으로써 디코딩 순서로 하나 이상의 후속 픽처들 및 복구 포인트 픽처를 디코딩할 수도 있다. 부가적으로, 이 경우, 비디오 디코더 (30) 는 또한 GDR 세트에서의 마지막 픽처로서 복구 포인트 픽처를 식별할 수도 있다. 비디오 디코더 (30) 에 의해 식별된 GDR 세트에서의 마지막 픽처는 "lastPicInSet" 로 표시된 변수라고 여기에서 지칭될 수도 있다. lastPicInSet 가 복구 포인트 SEI 메시지에서 식별된 복구 포인트 픽처인 예들에서, 비디오 디코더 (30) 는 lastPicInSet 가 GDR 에 따라 완전히 리프레시되는 것을 결정할 수도 있다.
한편, 비디오 디코더 (30) 가 recovery_poc_cnt 신택스 엘리먼트의 값으로부터 도출된 POC 값을 갖는 픽처를 로케이팅하는 것이 불가능한 경우, 비디오 디코더 (30) 는 대체 복구 포인트 픽처를 식별하도록 본 개시물의 하나 이상의 기법들을 구현할 수도 있다. 일부 예들에서, 비디오 디코더 (30) 는 recovery_poc_cnt 신택스 엘리먼트로부터 도출된 POC 값보다 더 큰 POC 값을 갖는, 디코딩 순서의, 첫 번째 픽처로서 복구 포인트 픽처를 식별할 수도 있다. 예를 들어, 비디오 디코더는 첫 번째 GDR 픽처의 POC 값에 recovery_poc_cnt 신택스 엘리먼트의 값을 가산함으로써 식별된 복구 포인트 픽처의 POC 값을 도출할 수도 있다. 부가적으로, 이들 예들에서, 비디오 디코더 (30) 는 lastPicInSet 가 식별된 복구 포인트 픽처의 바로 앞에 선행하는 픽처인 것을 결정할 수도 있다. 예를 들어, lastPicInSet 는 recovery_poc_cnt 신택스 엘리먼트로부터 도출된 POC 값보다 더 작은 POC 값을 갖는 디코딩 순서의 마지막 픽처일 수도 있는 한편, 복구 포인트는 recovery_poc_cnt 신택스 엘리먼트로부터 도출된 POC 값보다 더 큰 POC 값을 갖는 디코딩 순서의 첫 번째 픽처일 수도 있다. 따라서, 복구 포인트 SEI 메시지에 의해 식별된 복구 포인트 픽처가 시간 스케일링 동안 폐기된 예들에서, 비디오 디코더 (30) 는 각각 lastPicInSet 및 복구 포인트 픽처로서 디코딩 순서로 연속적인 2개의 개별적인 픽처들을 식별하도록 본 개시물의 기법들을 구현할 수도 있다.
차례로, 이 예에서, 비디오 디코더 (30) 는 디코딩 순서로 GDR 세트에 후속하는 하나 이상의 픽처들에 대해 랜덤 액세스 디코딩을 수행할 수도 있다. 따라서, 하나의 경우, 복구 포인트 픽처의 POC 값을 갖는 픽처가 디코더 (30) 에 의해 수신된 비트스트림에 존재하는 경우, 디코더는 관련 GDR 세트의 마지막 픽처와 복구 포인트 픽처 양쪽으로서 그 픽처를 선택한다. 다른 경우에서, 복구 포인트 픽처의 POC 값을 갖는 픽처가 디코더 (30) 에 의해 수신된 비트스트림에 존재하지 않는 경우, 디코더는, 상술된 바와 같이, 관련 GDR 세트의 마지막 픽처와는 상이한 픽처 및 복구 포인트 픽처로서 하나의 픽처를 선택한다. 이 두 번째 경우에서, 선택된 복구 포인트 픽처는, recovery_poc_cnt 신택스 엘리먼트로부터 도출된 POC 값보다 더 큰 POC 값을 갖는, 디코딩 순서의, 수신된 비트스트림에서의 첫 번째 픽처이고, GDR 세트에서의 선택된 마지막 픽처는, recovery_poc_cnt 신택스 엘리먼트로부터 도출된 POC 값보다 더 작은 POC 값을 갖는, 디코딩 순서의, 수신된 비트스트림에서의 마지막 픽처, 즉, 선택된 복구 포인트 픽처의 바로 앞에 선행하는 픽처이다. 부가적으로, 이 두 번째 경우에서, 비디오 디코더 (30) 는, GDR 세트에서의 마지막 픽처로서, 대응하는 영역 리프레시 정보 SEI 메시지가 완전히 리프레시되지 않은 것으로 나타내는 픽처 (예를 들어, 리프레시된 및 비-리프레시된 영역들 양쪽을 포함하는 픽처) 를 선택할 수도 있다.
일부 예들에서, 비디오 디코더 (30) 는 GDR 세트의 lastPiclnSet 와 연관된 하나 이상의 영역 리프레시 SEI 메시지들에 대해 본 개시물의 기법들을 구현할 수도 있다. 예를 들어, 비디오 디코더 (30) 가 lastPiclnSet 가 또한 복구 포인트 픽처인 것을 결정한다면, 비디오 디코더 (30) 는, 픽처에 대응하는 영역 리프레시 SEI 메시지가, 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정할 수도 있다. 상술된 바와 같이, 다양한 예들에서, 비디오 디코더 (30) 가 복구 포인트 SEI 메시지에 의해 나타낸 바와 같이 복구 포인트 픽처에 대한 POC 값을 갖는 픽처를 GDR 세트에서 검출하는 경우 비디오 디코더 (30) 는 lastPiclnSet 가 또한 복구 포인트 픽처인 것을 결정할 수도 있다.
하나의 이러한 예에서, 비디오 디코더 (30) 는 영역 리프레시 SEI 메시지가 1 의 값으로 설정된 refreshed_region_flag 신택스 엘리먼트를 포함하고, 픽처를 포함하는 AU 의 첫 번째 슬라이스 세그먼트와 연관되는 것을 결정할 수도 있다. 이 예에 따르면, 1 로 설정된 AU 의 첫 번째 슬라이스 세그먼트에 대한 refreshed_region_flag 신택스 엘리먼트에 기초하여, 비디오 디코더 (30) 는 AU 의 나머지 슬라이스 세그먼트들에 대한 refreshed_region_flag 신택스 엘리먼트들이 1 의 값으로 또한 설정되는 것을 결정할 수도 있다. 이러한 방식으로, 비디오 디코더 (30) 는 lastPiclnSet 가 또한 복구 포인트 픽처일 때, lastPiclnSet 가 완전히 리프레시된 픽처인 것을 결정할 수도 있다.
여기에 설명된 기법들의 잠재적인 이점은, 비디오 디코더 (30) 가 시간적으로 스케일링된 비트스트림들에 대한 GDR 을 지원하면서, 기존 하드웨어 인프라스트럭처에 대한 변화들을 요구하지 않을 수도 있다는 점이다. 부가적으로, 일부 예들에서, 여기에 설명된 기법들은 복구 포인트 SEI 메시지 또는 영역 리프레시 SEI 메시지 중 어느 하나를 생성하는 것과 관련하여 임의의 변화들을 구현하는 것을 비디오 인코더 (20) 에게 요구하지 않는다. 그 대신에, 비디오 디코더 (30) 는 시간적으로 스케일러블한 비트스트림들에 대한 GDR 을 지원하기 위해 복구 포인트 SEI 메시지 및/또는 영역 리프레시 SEI 메시지에 포함된 정보를 프로세싱하도록 하는 기법들을 구현할 수도 있다. 다시 말해, 일부 예들에서, 본 개시물의 기법들은 복구 포인트 SEI 메시지 및/또는 영역 리프레시 SEI 메시지의 시맨틱스에 대한 변화들을, 이들 SEI 메시지들 중 어느 것의 신택스에 대한 어떠한 변화들도 도입시키는 일 없이, 도입시킬 수도 있다.
이러한 방식으로, 목적지 디바이스 (14) 는, 비디오 디코더, 즉, 비디오 디코더 (30) 및 인코딩된 비디오 데이터를 저장하도록 구성된 메모리를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스의 일 예일 수도 있다. 부가적으로, 상술된 기법들에 따르면, 비디오 디코더 (30) 는 복수의 픽처들을 수신하고, 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지에서, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하고, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하며, 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하도록 구성된 비디오 디코더의 일 예일 수도 있다.
부가적으로, 일부 예들에서, 비디오 디코더 (30) 는 또한, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 GDR 세트의 마지막 픽처로서 식별하고, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처들 중 하나를 GDR 세트의 마지막 픽처로서 식별하도록 구성될 수도 있다. 일부 예들에서, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 첫 번째 픽처의 POC 값보다 더 크다. 일부 예들에서, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예에서, SEI 메시지는 복구 포인트 SEI 메시지를 포함한다.
일부 예들에서, 복구 포인트 픽처의 POC 값을 나타내는 정보는, 첫 번째 픽처의 POC 값과 복구 포인트 픽처의 POC 값 사이의 차이를 나타내는 정보를 포함한다. 일부 예들에서, 복구 포인트 픽처의 POC 값을 나타내는 정보는 복구 포인트 픽처의 POC 값을 포함한다. 일부 예들에 따르면, 비디오 코더는 또한, GDR 에 따라 GDR 세트의 하나 이상의 픽처들을 디코딩하도록 구성된다. 하나의 이러한 예에 따르면, 비디오 코더는 또한, 디코딩 순서로 식별된 복구 포인트 픽처에 후속하는 하나 이상의 픽처들 및 식별된 복구 포인트 픽처에 대해 랜덤 액세스 디코딩을 수행하도록 구성된다.
부가적으로, 상술된 기법들에 따르면, 목적지 디바이스는 비디오 코더 및 인코딩된 비디오 데이터를 저장하는 메모리를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스의 일 예일 수도 있다. 이들 예들에서, 비디오 디코더 (30) 는 인코딩된 비디오 데이터의 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하고, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하고, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하며, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하도록 구성된 비디오 코더의 일 예일 수도 있다. 일부 예들에서, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예에서, SEI 메시지는 영역 리프레시 SEI 메시지를 포함한다.
일부 예들에서, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하기 위해, 비디오 코더는 영역 리프레시 SEI 메시지와 연관된 refreshed_region_flag 신택스 엘리먼트가 1 의 값을 갖는 것을 결정하도록 구성될 수도 있다. 하나의 이러한 예에서, refreshed_region_flag 신택스 엘리먼트는 픽처를 포함하는 액세스 유닛 (access unit; AU) 의 첫 번째 슬라이스 세그먼트와 연관되고, 리프레시된 영역에 전체 픽처가 속하는 것을 결정하기 위해, 비디오 코더는 AU 의 첫 번째 슬라이스 세그먼트와는 상이한 AU 의 각각의 슬라이스 세그먼트가 대응하는 refreshed_region_flag 신택스 엘리먼트와 연관되는 것을 결정하도록 구성된다.
도 2 는, 본 개시물의 하나 이상의 양태들에 따른, 비디오 데이터를 인코딩하는 기법들을 구현할 수도 있는 비디오 인코더 (20) 의 일 예를 예시한 블록도이다. 비디오 인코더 (20) 는 비디오 슬라이스들 내의 비디오 블록들의 인트라- 및 인터-코딩을 수행할 수도 있다. 인트라-코딩은 주어진 비디오 프레임 또는 픽처 내의 비디오에서 공간 리던던시를 감소시키거나 또는 제거하기 위해 공간 예측에 의존한다. 인터-코딩은 비디오 시퀀스의 인접 프레임들 또는 픽처들 내의 비디오에서 시간 리던던시를 감소시키거나 또는 제거하기 위해 시간 예측에 의존한다. 인트라-모드 (I 모드) 는 몇몇 공간 기반의 코딩 모드들 중 임의의 코딩 모드를 지칭할 수도 있다. 단방향 예측 (P 모드) 또는 양방향 예측 (B 모드) 과 같은 인터-모드들은 몇몇 시간 기반의 코딩 모드들 중 임의의 코딩 모드를 지칭할 수도 있다
도 2 에 도시된 바와 같이, 비디오 인코더 (20) 는 인코딩될 비디오 프레임 내의 현재 비디오 블록을 수신한다. 도 2 의 예에서, 비디오 인코더 (20) 는 예측 프로세싱 유닛 (40), 참조 프레임 메모리 (64), 합산기 (50), 변환 프로세싱 유닛 (52), 양자화 유닛 (54), 및 엔트로피 인코딩 유닛 (56) 을 포함한다. 예측 프로세싱 유닛 (41) 은, 차례로, 모션 보상 유닛 (44), 모션 추정 유닛 (42), 인트라 예측 유닛 (46), 및 파티션 유닛 (48) 을 포함한다. 비디오 블록 재구성을 위해, 비디오 인코더 (20) 는 또한 역양자화 유닛 (58), 역변환 유닛 (60), 및 합산기 (62) 를 포함한다. 디블록킹 필터 (도 2 에 도시되지 않음) 가 또한 재구성된 비디오로부터 블록키니스 아티팩트들을 제거하기 위해 블록 경계들을 필터링하기 위해 포함될 수도 있다. 원한다면, 디블록킹 필터는 통상적으로 합산기 (62) 의 출력을 필터링할 것이다. 부가적인 필터들 (인 루프 또는 포스트 루프) 이 또한 디블록킹 필터에 부가적으로 사용될 수도 있다. 이러한 필터들은 간략함을 위해 도시되지 않지만, 원한다면, (인-루프 필터로서) 합산기 (62) 의 출력을 필터링할 수도 있다.
인코딩 프로세스 동안, 비디오 인코더 (20) 는 코딩될 비디오 프레임 또는 슬라이스를 수신한다. 프레임 또는 슬라이스는 예측 프로세싱 유닛 (41) 에 의해 다수의 비디오 블록들로 분할될 수도 있다. 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 시간 예측을 제공하기 위해 하나 이상의 참조 프레임들에서의 하나 이상의 블록들에 대해 수신된 비디오 블록의 인터-예측 코딩을 수행한다. 인트라 예측 유닛 (46) 은 공간 예측을 제공하기 위해 코딩될 블록과 동일한 프레임 또는 슬라이스에서의 하나 이상의 이웃하는 블록들에 대해 수신된 비디오 블록의 인트라-예측 코딩을 대안적으로 수행할 수도 있다. 비디오 인코더 (20) 는, 예를 들어, 비디오 데이터의 각 블록에 대한 적절한 코딩 모드를 선택하기 위해 다수의 코딩 패스들을 수행할 수도 있다.
또한, 파티션 유닛 (48) 은 이전 코딩 패스들에서의 이전 파티셔닝 스킴들의 평가에 기초하여 비디오 데이터의 블록들을 서브-블록들로 파티셔닝할 수도 있다. 예를 들어, 파티션 유닛 (48) 은 프레임 또는 슬라이스를 LCU들로 초기에 파티셔닝하고, 레이트-왜곡 분석 (예를 들어, 레이트-왜곡 최적화) 에 기초하여 LCU들 각각을 서브-CU들로 파티셔닝할 수도 있다. 예측 프로세싱 유닛 (40) 은 LCU 의 서브-CU들로의 파티셔닝을 나타내는 쿼드트리 데이터 구조를 추가로 생성할 수도 있다. 쿼드트리의 리프-노드 CU들은 하나 이상의 PU들 및 하나 이상의 TU들을 포함할 수도 있다.
예측 프로세싱 유닛 (40) 은, 예를 들어, 에러 결과들에 기초하여 코딩 모드들 중 하나, 인트라 또는 인터를 선택할 수도 있고, 참조 프레임으로서의 사용을 위해 인코딩된 블록을 재구성하기 위해 합산기 (62) 로 그리고 잔차 블록 데이터를 생성하기 위해 합산기 (50) 로 결과적인 인트라- 또는 인터-코딩된 블록을 제공할 수도 있다. 예측 프로세싱 유닛 (40) 은 또한 엔트로피 인코딩 유닛 (56) 으로 모션 벡터들, 인트라-모드 표시자들, 파티션 정보, 및 다른 이러한 신택스 정보와 같은 신택스 엘리먼트들을 제공한다. 예측 프로세싱 유닛 (40) 은 레이트-왜곡 분석을 사용하여 하나 이상의 인터-모드들을 선택할 수도 있다.
모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 고도로 집적될 수도 있지만, 개념적 목적을 위해 개별적으로 예시된다. 모션 추정 유닛 (42) 에 의해 수행되는 모션 추정은 비디오 블록들에 대한 모션을 추정하는 모션 벡터들을 생성하는 프로세스이다. 모션 벡터는, 예를 들어, 현재 프레임 (또는 다른 코딩된 유닛) 내의 코딩되고 있는 현재 블록에 대한 참조 프레임 (또는 다른 코딩된 유닛) 내의 예측 블록에 대한 현재 비디오 프레임 또는 픽처 내의 비디오 블록의 PU 의 변위를 나타낼 수도 있다. 예측 블록은 픽셀 차이의 관점에서 코딩될 블록에 가깝게 매칭하는 것으로 발견되는 블록이며, 이 픽셀 차이는 SAD (sum of absolute difference), SSD (sum of square difference), 또는 다른 차이 메트릭들에 의해 결정될 수도 있다. 일부 예들에서, 비디오 인코더 (20) 는 참조 프레임 메모리 (64) 에 저장된 참조 픽처들의 서브-정수 픽셀 위치들에 대한 값들을 계산할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 참조 픽처의 1/4 픽셀 위치들, 1/8 픽셀 위치들, 또는 다른 분수 픽셀 위치들의 값들을 보간할 수도 있다. 따라서, 모션 추정 유닛 (42) 은 풀 픽셀 위치들 및 분수 픽셀 위치들에 대한 모션 검색을 수행하고, 분수 픽셀 정밀도를 갖는 모션 벡터를 출력할 수도 있다.
모션 추정 유닛 (42) 은 PU 의 위치를 참조 픽처의 예측 블록의 위치와 비교함으로써 인터-코딩된 슬라이스 내의 비디오 블록의 PU 에 대한 모션 벡터를 계산한다. 참조 픽처는 제 1 참조 픽처 리스트 (리스트 0) 또는 제 2 참조 픽처 리스트 (리스트 1) 로부터 선택될 수도 있으며, 이들 각각은 참조 프레임 메모리 (64) 에 저장된 하나 이상의 참조 픽처들을 식별한다. 모션 추정 유닛 (42) 은 그 계산된 모션 벡터를 엔트로피 인코딩 유닛 (56) 및 모션 보상 유닛 (44) 에 전송한다.
모션 보상 유닛 (44) 에 의해 수행되는 모션 보상은 모션 추정 유닛 (42) 에 의해 결정된 모션 벡터에 기초하여 예측 블록을 페치하거나 생성하는 것을 수반할 수도 있다. 또, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 은 일부 예들에서 기능적으로 통합될 수도 있다. 현재 비디오 블록의 PU 에 대한 모션 벡터의 수신시, 모션 보상 유닛 (44) 은 모션 벡터가 참조 픽처 리스트들 중 하나에서 가리키는 예측 블록을 로케이팅할 수도 있다. 합산기 (50) 는 후술되는 바와 같이 코딩되고 있는 현재 비디오 블록의 픽셀 값들로부터 예측 블록의 픽셀 값들을 감산함으로써 잔차 비디오 블록을 형성하여, 픽셀 차이 값들을 형성한다. 일반적으로, 모션 추정 유닛 (42) 은 루마 코딩 블록들에 대한 모션 추정을 수행하고, 모션 보상 유닛 (44) 은 크로마 코딩 블록들 및 루마 코딩 블록들 양쪽에 대해 루마 코딩 블록들에 기초하여 계산된 모션 벡터들을 사용한다. 예측 프로세싱 유닛 (40) 은 또한 비디오 슬라이스의 비디오 블록들을 디코딩함에 있어서 비디오 디코더 (30) 에 의한 사용을 위해 비디오 블록들 및 비디오 슬라이스와 연관된 신택스 엘리먼트들을 생성할 수도 있다.
인트라 예측 유닛 (46) 은, 상술된 바와 같이, 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의해 수행된 인터-예측에 대한 대안으로서, 현재 블록을 인트라-예측할 수도 있다. 특히, 인트라 예측 유닛 (46) 은 현재 블록을 인코딩하는데 사용할 인트라-예측 모드를 결정할 수도 있다. 일부 예들에서, 인트라 예측 유닛 (46) 은, 예를 들어, 개별적인 인코딩 패스들 동안 다양한 인트라-예측 모드들을 사용하여 현재 블록을 인코딩할 수도 있고, 인트라 예측 유닛 (46) (또는 일부 예들에서 예측 프로세싱 유닛 (40)) 은 테스트된 모드들로부터 사용하기에 적절한 인트라-예측 모드를 선택할 수도 있다.
예를 들어, 인트라 예측 유닛 (46) 은 다양한 테스트된 인트라-예측 모드들에 대한 레이트-왜곡 분석을 사용하여 레이트-왜곡 값들을 계산하고, 테스트된 모드들 중에서 최선의 레이트-왜곡 특성들을 갖는 인트라-예측 모드를 선택할 수도 있다. 레이트-왜곡 분석은 일반적으로 인코딩된 블록을 생성하기 위해 인코딩된 오리지널의 인코딩되지 않은 블록과 인코딩된 블록 사이의 왜곡 (또는 에러) 의 양뿐만 아니라, 인코딩된 블록을 생성하는데 사용된 비트레이트 (즉, 비트들의 수) 를 결정한다. 인트라 예측 유닛 (46) 은 다양한 인코딩된 블록들에 대한 왜곡들 및 레이트들로부터 비율들을 계산하여 어느 인트라-예측 모드가 블록에 대한 최선의 레이트-왜곡 값을 나타내는지를 결정할 수도 있다.
블록에 대한 인트라-예측 모드를 선택한 후에, 인트라 예측 유닛 (46) 은 엔트로피 인코딩 유닛 (56) 으로 블록에 대한 선택된 인트라-예측 모드를 나타내는 정보를 제공할 수도 있다. 엔트로피 인코딩 유닛 (56) 은 그 선택된 인트라-예측 모드를 나타내는 정보를 인코딩할 수도 있다. 비디오 인코더 (20) 는 송신된 비트스트림에 구성 데이터를 포함시킬 수도 있고, 그 구성 데이터는 복수의 인트라-예측 모드 인덱스 테이블들 및 (코드워드 맵핑 테이블들이라고도 또한 지칭되는) 복수의 변경된 인트라-예측 모드 인텍스 테이블들, 다양한 블록들에 대한 인코딩 콘텍스트들의 정의들, 및 가장 가능성있는 인트라-예측 모드, 인트라-예측 모드 인덱스 테이블, 및 콘텍스트들 각각에 대해 사용할 변경된 인트라-예측 모드 인덱스 테이블의 표시들을 포함할 수도 있다.
비디오 인코더 (20) 는 코딩되고 있는 오리지널 비디오 블록으로부터 모드 선택 유닛 (40) 으로부터의 예측 데이터를 감산함으로써 잔차 비디오 블록을 형성한다. 합산기 (50) 는 이러한 감산 동작을 수행하는 컴포넌트 또는 컴포넌트들을 나타낸다. 변환 프로세싱 유닛 (52) 은 잔차 블록에 이산 코사인 변환 (DCT) 또는 개념적으로 유사한 변환과 같은 변환을 적용하여, 잔차 변환 계수 값들을 포함하는 비디오 블록을 생성한다. 변환 프로세싱 유닛 (52) 은 DCT 와 개념적으로 유사한 다른 변환들을 수행할 수도 있다. 웨이블릿 변환들, 정수 변환들, 부대역 변환들 또는 다른 타입들의 변환들이 또한 사용될 수 있을 것이다. 어느 경우든, 변환 프로세싱 유닛 (52) 은 잔차 블록에 변환을 적용하여 잔차 변환 계수들의 블록을 생성한다. 변환은 잔차 정보를 픽셀값 도메인으로부터 주파수 도메인과 같은 변환 도메인으로 컨버팅할 수도 있다. 변환 프로세싱 유닛 (52) 은 결과적인 변환 계수들을 양자화 유닛 (54) 에 전송할 수도 있다. 양자화 유닛 (54) 은 변환 계수들을 양자화하여 비트 레이트를 더욱 감소시킨다. 양자화 프로세스는 그 계수들의 일부 또는 전부와 연관된 비트 심도를 감소시킬 수도 있다. 양자화의 정도는 양자화 파라미터를 조정함으로써 변경될 수도 있다. 일부 예들에서, 양자화 유닛 (54) 은 그 후에 양자화된 변환 계수들을 포함하는 매트릭스의 스캔을 수행할 수도 있다. 대안적으로, 엔트로피 인코딩 유닛 (56) 이 그 스캔을 수행할 수도 있다.
양자화에 후속하여, 엔트로피 인코딩 유닛 (56) 은 양자화된 변환 계수들을 엔트로피 코딩한다. 예를 들어, 엔트로피 인코딩 유닛 (56) 은 콘텍스트 적응 가변 길이 코딩 (CAVLC), 콘텍스트 적응 이진 산술 코딩 (CABAC), 신택스-기반 콘텍스트-적응 이진 산술 코딩 (SBAC), 확률 구간 파티셔닝 엔트로피 (PIPE) 코딩 또는 다른 엔트로피 코딩 기법을 수행할 수도 있다. 콘텍스트 기반 엔트로피 코딩의 경우에, 콘텍스트는 이웃하는 블록들에 기초할 수도 있다. 엔트로피 인코딩 유닛 (56) 에 의한 엔트로피 코딩에 후속하여, 인코딩된 비트스트림은 다른 디바이스 (예를 들어, 비디오 디코더 (30)) 로 송신되거나 이후의 송신 또는 취출을 위해 아카이브될 수도 있다.
역양자화 유닛 (58) 및 역변환 유닛 (60) 은, 예를 들어, 참조 블록으로서 이후의 사용을 위해 픽셀 도메인 내의 잔차 블록을 재구성하기 위해, 역양자화 및 역변환을 각각 적용한다. 모션 보상 유닛 (44) 은 참조 프레임 메모리 (64) 의 프레임들 중 하나의 프레임의 예측 블록에 잔차 블록을 가산함으로써 참조 블록을 계산할 수도 있다. 모션 보상 유닛 (44) 은 또한 모션 추정에서 사용하기 위해 서브-정수 픽셀값들을 계산하기 위해 재구성된 잔차 블록에 하나 이상의 보간 필터들을 적용할 수도 있다. 합산기 (62) 는 참조 프레임 메모리 (64) 에의 저장을 위한 재구성된 비디오 블록을 생성하기 위해 모션 보상 유닛 (44) 에 의해 생성된 모션 보상된 예측 블록에 재구성된 잔차 블록을 가산한다. 재구성된 비디오 블록은 후속하는 비디오 프레임 내의 블록을 인터-코딩하기 위해 참조 블록으로서 모션 추정 유닛 (42) 및 모션 보상 유닛 (44) 에 의해 사용될 수도 있다.
비디오 인코더 (20) 의 다양한 컴포넌트들은 GDR 에 따라 비디오 데이터를 인코딩하면서, 비디오 비트스트림들의 시간 스케일러빌리티를 지원하기 위해 본 개시물의 기법들 중 하나 이상을 구현하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 는 하나 이상의 보충 강화 정보 (SEI) 메시지들을 생성하고 시그널링하기 위해 이 기법들 중 하나 이상을 구현할 수도 있어서, SEI 메시지가 수신 디바이스 (예를 들어, 비디오 디코더 또는 그의 컴포넌트들) 로 하여금 GDR 세트에서 픽처들을 식별할 수 있도록 한다. 예를 들어, 수신 디바이스는 GDR 세트에서의 디코딩 순서의 첫 번째 픽처인 GDR 픽처, GDR 세트의 디코딩 순서의 마지막 픽처, 및 복구 포인트 픽처를 식별하도록 비디오 인코더 (20) 에 의해 생성된 SEI 메시지들에 포함된 데이터를 사용할 수도 있다. 일부 예들에서, 수신 디바이스에서의 디코더는 GDR 세트의 마지막 픽처 ("lastPicInSet") 가 복구 포인트 픽처와 동일한 것을 결정할 수도 있는 한편, 다른 예들에서, 수신 디바이스에서의 디코더는 lastPicInSet 및 복구 포인트 픽처가 개별적인 픽처들인 것을 결정할 수도 있다. 하나의 예에서, 예측 프로세싱 유닛 (40) 은 본 개시물의 하나 이상의 양태들에 따라 복구 포인트 SEI 메시지 및/또는 영역 리프레시 정보 SEI 메시지를 생성하도록 구성될 수도 있다.
비디오 인코더 (20) 는, 인코딩된 비디오 비트스트림에 메타데이터를 포함시키기 위해, HEVC WD9, HEVC WD10, AVC, 또는 다른 비디오 코딩 표준들에 따라, 다양한 피처들로 구성될 수도 있다. 다양한 예들에서, 비디오 인코더 (20) 는 시그널링된 인코딩된 비디오 비트스트림을 디코딩하기 위해 디코더에 의해 요구되지 않은 메타데이터를 포함할 수도 있다. 일부 예들로서, 비디오 인코더 (20) 는 비디오 디코더로 하여금 픽처 출력 타이밍을 결정하는 것, 하나 이상의 픽처들과 연관된 디스플레이 정보를 결정하는 것, 손실 정보를 검출하는 것, 그리고 검출된 손실들을 숨기거나 및/또는 교정하는 것을 가능하게 하는 메타데이터를 시그널링할 수도 있다.
부가적으로, 비디오 인코더 (20) 는 인코딩된 비디오 비트스트림에서 시그널링된 특정 액세스 유닛 (AU) 에서 임의의 수의 SEI 네트워크 추상 레이어 (NAL) 유닛들을 생성할 수도 있다. 차례로, 비디오 인코더 (20) 는 특정 SEI NAL 유닛에 임의의 수의 SEI 메시지들을 포함시킬 수도 있다. 일 예로서, 위의 표 1 은, HEVC WD9 에 따라, 비디오 인코더 (20) 가 생성할 수도 있는 다양한 SEI 메시지들, 및 리스팅된 SEI 메시지들의 대응하는 용도들/목적들을 리스팅한다.
비디오 인코더 (20) 는 GDR 세트들을 생성하고 그 GDR 세트들을 인코딩된 비디오 비트스트림에서 시그널링하도록 구성되거나 또는 이와 다르게는 동작가능할 수도 있다. GDR 기반 인코딩은 수신 디바이스가 비-인트라 픽처로부터의 랜덤 액세스를 수행할 수 있게 할 수도 있다. 부가적으로, 디코딩 순서로 하나 이상의 픽처들에 후속하는, GDR 에 따라 인코딩된 비디오 데이터에 따라, 전체 픽처 영역은 비트스트림에서의 한 위치에서 (예를 들어, 복구 포인트에서) 그리고 그 후에 디스플레이/출력 순서로 올바르게 디코딩될 수 있다. GDR 은 랜덤 액세시빌리티와 향상된 에러 회복력 양쪽을 제공할 수도 있다.
도 1 에 대해 설명된 바와 같이, 예를 들어, HEVC WD9 에 따른 GDR 세트는 디코딩 순서로 인코딩된 픽처들의 시퀀스를 포함할 수도 있다. 일부 예들에서, GDR 세트에서의 인코딩된 픽처들의 시퀀스는 또한 출력 순서에 따라 배열될 수도 있다. 비디오 인코더 (20) 는 GDR 세트의 시작 경계를 나타내기 위해 복구 포인트 SEI 메시지를 시그널링할 수도 있다. 위의 신택스 테이블 1 에 예시된 바와 같이, 비디오 인코더 (20) 는, 일 예로서 HEVC WD9 에 따라, 복구 포인트 SEI 메시지에 recovery_poc_cnt, exact_match_flag, 및 broken_link_flag 와 같은 신택스 엘리먼트들을 포함시킬 수도 있다. HEVC WD9 에 따르면, 비디오 인코더 (20) 는 복구 포인트 픽처와 GDR 픽처의 POC 카운트 사이의 차이를 나타내기 위해 recovery_poc_cnt 신택스 엘리먼트의 값을 설정할 수도 있다. 부가적으로, 비디오 인코더 (20) 는 GDR 픽처와 동일한 액세스 유닛 (AU) 에서 복구 포인트 SEI 메시지를 시그널링할 수도 있다. 이러한 방식으로, 비디오 인코더 (20) 는 수신 디바이스가 GDR 세트의 시작 경계 (예를 들어, 복구 포인트 SEI 메시지와 동일한 AU 에 포함된 첫 번째 GDR 픽처), 및 (예를 들어, GDR 픽처의 POC 값에 recovery_poc_cnt 신택스 엘리먼트의 값을 가산하여 복구 포인트 픽처를 식별하는 것에 의한) GDR 세트의 종단 경계를 식별할 수 있게 할 수도 있다. 이러한 방식으로, 비디오 인코더 (20) 는, 수신 디바이스로 하여금, 랜덤 액세시빌리티 (random accessibility) 와 향상된 에러 회복력과 같은, GDR 에 의해 제공된 하나 이상의 잠재적인 이점들을 활용할 수 있게 할 수도 있다.
부가적으로, 비디오 인코더 (20) 는 GDR 세트의 각각의 픽처에 대한 영역 리프레시 정보 SEI 메시지를 시그널링할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 GDR 세트의 픽처를 포함하는 각각의 AU 에 영역 리프레시 정보 SEI 메시지를 포함시킬 수도 있다. 비디오 인코더 (20) 는 대응하는 픽처의 리프레시된 및/또는 비-리프레시된 영역들을 나타내는 데이터를 포함하도록 각각의 영역 리프레시 정보 SEI 메시지를 생성할 수도 있다. 이러한 방식으로 영역 리프레시 정보 SEI 메시지들을 시그널링함으로써, 비디오 인코더 (20) 는 수신 디바이스로 하여금 GDR 에 따라 리프레시된 픽처의 비율을 결정할 수 있게 할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 영역 리프레시 정보 SEI 메시지가 대응하는 픽처와 동일한 AU 에 영역 리프레시 정보 SEI 메시지를 시그널링할 수도 있다. 이러한 방식으로 영역 리프레시 정보 SEI 메시지를 시그널링함으로써, 비디오 인코더 (20) 는 수신 디바이스로 하여금 GDR 의 어떤 픽처에 특정 영역 리프레시 정보 SEI 메시지가 대응하는지 (이 예에서는, 영역 리프레시 정보 SEI 메시지와 동일한 AU 에 포함된 픽처) 를 결정할 수 있게 할 수도 있다. 부가적으로, 수신 디바이스는 대응하는 픽처의 리프레시된 및/또는 비-리프레시된 영역들을 식별하도록 비디오 인코더 (20) 에 의해 시그널링된 영역 리프레시 정보 SEI 메시지에 포함된 데이터를 사용할 수도 있다.
설명된 바와 같이, 비디오 인코더 (20) 및/또는 그의 컴포넌트들은, 예컨대 HEVC WD9 에 따라, 인코딩된 비디오 비트스트림들의 시간 스케일러빌리티를 지원하도록 구성될 수도 있다. 예를 들어, 비디오 인코더 (20) 는 디코딩 디바이스 또는 중간 디바이스와 같은 수신 디바이스가 서브-비트스트림을 추출할 수도 있게 되는 풀 인코딩된 비디오 비트스트림을 생성할 수도 있다. 예를 들어, 스트리밍 서버 또는 미디어 인식 네트워크 엘리먼트 ("MANE") 와 같은 중간 디바이스는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트로부터 인코딩된 픽처들의 시간 서브세트를 추출하고, 그 추출된 서브-비트스트림을 비디오 디코더를 갖는 클라이언트 디바이스에 전달할 수도 있다. 일부 예들에서, 시간 서브세트는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트의 참 (true) 서브세트를 나타낼 수도 있다. 이들 예들에 따르면, 풀 인코딩된 비디오 비트스트림은 시간 서브세트의 모든 인코딩된 픽처, 및 시간 서브세트에 포함되지 않은 적어도 하나의 부가적인 인코딩된 픽처를 포함할 수도 있다.
시간 스케일러빌리티에 따라 다양한 픽처 레이트들을 지원하기 위해, 중간 디바이스는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트로부터 상이한 픽처 카운트들의 시간 서브세트들을 추출하도록 구성될 수도 있다. (예를 들어, 가변 픽처 레이트들을 지원하기 위해) 중간 디바이스에 의해 추출된 각각의 상이한 시간 서브세트는 독립적으로 디코딩가능한 시간 서브세트 또는 서브-비트스트림을 나타낼 수도 있다. 다시 말해, 풀 인코딩된 비디오 비트스트림으로부터 추출된 시간적으로 스케일링된 서브-비트스트림을 수신하는 비디오 디코더는, 풀 인코딩된 비디오 비트스트림에 포함되지만 서브-비트스트림로부터 배제된 정보와 같은 임의의 부가적인 데이터 없이 인코딩된 픽처들의 시간 서브세트를 디코딩할 수도 있다.
HEVC WD9 에 따라, 비디오 인코더 (20) 에 의해 생성된 풀 인코딩된 비디오 비트스트림은, 몇몇 시간 서브-레이어들을 포함할 수도 있다. 부가적으로, 비디오 인코더 (20) 에 의해 생성된 각각의 NAL 유닛은 대응하는 "TemporalId" 값에 의해 나타낸 바와 같이 특정 서브-레이어에 속할 수도 있다. 예를 들어, 비디오 인코더 (20) 는 대응하는 "temporal_id_plus1" 신택스 엘리먼트의 값 마이너스 1 과 동일한 NAL 유닛의 TemporalId 의 값을 설정할 수도 있다. 부가적으로, 비디오 인코더 (20) 는 단일 픽처의 모든 VCL NAL 유닛들이 단일 서브-레이어 (즉, 동일한 서브-레이어) 에 속하는 것을 결정할 수도 있다. 다시 말해, 비디오 인코더 (20) 는 픽처를 인코딩하여, 인코딩된 픽처 그 자체가 인코딩된 픽처와 연관된 NAL 유닛들에 대응하는 특정 서브-레이어에 속하도록 할 수도 있다.
예를 들어, HEVC WD9 에 따르면, 비디오 인코더 (20) 는 비트스트림의 보다 낮은 서브-레이어의 디코딩 프로세스가 비트스트림의 보다 높은 서브-레이어에서의 데이터에 의존하지 않도록 하는 인코딩된 비디오 비트스트림을 생성할 수도 있다. 부가적으로, 중간 디바이스는, 특정 값보다 더 큰 TemporalId 값과 연관된 모든 NAL 유닛들을 풀 비트스트림으로부터 제거함으로써 HEVC WD9 에 따르는 서브-비트스트림을 풀 비트스트림으로부터 생성할 수도 있다. 차례로, 이러한 방식으로 생성된 서브-비트스트림은 그 자신이 HEVC WD9 에 따르는 비트스트림을 나타낼 수도 있다. 비디오 인코더 (20) 및/또는 그의 하나 이상의 컴포넌트들은 HEVC WD9 에 대한 비트스트림 준수를 위한 모든 조건들 (예를 들어, 버퍼 제약들) 이 풀 인코딩된 비디오 비트스트림에 대해, 그리고 그의 임의의 주어진 서브-레이어에 대해 만족된다는 것을 보장할 수도 있다.
설명된 바와 같이, 풀 인코딩된 비디오 비트스트림을 시간적으로 스케일링함에 있어서, 중간 디바이스는 풀 인코딩된 비디오 비트스트림으로부터 인코딩된 픽처들의 시간 서브세트를 추출할 수도 있다. 예를 들어, 시간 서브세트는 풀 인코딩된 비디오 비트스트림에서 시그널링된 인코딩된 픽처들의 참 서브세트일 수도 있어서, 그에 따라, 중간 디바이스는 풀 인코딩된 비트스트림으로부터 하나 이상의 인코딩된 픽처들을 제거하여 서브-비트스트림을 생성할 수도 있다. 예들에서, 중간 디바이스는 복구 포인트 SEI 메시지의 recovery_poc_cnt 신택스 엘리먼트에 의해 식별된 복구 포인트 픽처를 폐기할 수도 있다. 그러나, 이들 예들에서, 중간 디바이스는, 처음에 나타낸 복구 포인트 메시지의 변화 (즉, 제거) 를 반영하기 위해, 복구 포인트 SEI 메시지에서 시그널링된 데이터를 업데이트하도록 구성되지 않을 수도 있다. 다시 말해, 중간 디바이스는 복구 포인트 SEI 메시지를 포함하지만 대응하는 복구 포인트 픽처를 포함하지 않는 시간 서브세트를 잠재적으로 시그널링할 수도 있다. 차례로, 비디오 디코더에 대해, 복구 포인트 SEI 메시지를 포함하지만 식별된 복구 포인트 픽처를 포함하지 않는 시간 서브세트를 통신함으로써, 중간 디바이스는 수신된 시간 서브세트에 존재하지 않는 복구 포인트 픽처를 식별할 수도 있다.
GDR 세트를 포함하는 인코딩된 비트스트림의 시간 스케일링에 의해 야기되는 잠재적인 이슈들을 완화시키거나 또는 없애기 위해, 본 개시물의 기법들은 비디오 디코딩 디바이스로 하여금 시그널링된 SEI 메시지들에 포함된 데이터를 프로세싱하여 GDR 에 따르도록 하면서, 시간 스케일러빌리티를 지원할 수 있게 할 수도 있다. 예를 들어, 이 기법들은 복구 포인트 SEI 메시지 및/또는 영역 리프레시 정보 SEI 메시지와 연관된 하나 이상의 시맨틱스에 대한 변화들을 도입시킬 수도 있다. 본 개시물의 기법들에 따른 복구 포인트 SEI 메시지 및/또는 영역 리프레시 정보 SEI 메시지와 연관된 시맨틱스에 대한 변화들은 더욱 상세히 후술된다.
도 3 은, 본 개시물의 하나 이상의 양태들에 따른, 비디오 데이터를 디코딩하는 기법들을 구현할 수도 있는 비디오 디코더 (30) 의 일 예를 예시한 블록도이다. 도 3 의 예에서, 비디오 디코더 (30) 는 엔트로피 디코딩 유닛 (70), 모션 보상 유닛 (72), 인트라 예측 유닛 (74), 역양자화 유닛 (76), 역변환 유닛 (78), 합산기 (80), 및 참조 픽처 메모리 (82) 를 포함한다. 도 2 의 예에서, 비디오 디코더 (30) 는 예측 유닛 (71) 을 포함하고, 이 예측 유닛 (71) 은, 차례로, 모션 보상 유닛 (72) 및 인트라 예측 유닛 (74) 을 포함한다. 비디오 디코더 (30) 는, 일부 예들에서, 비디오 인코더 (20) (도 2) 에 대해 설명된 인코딩 패스에 대해 일반적으로 역인 디코딩 패스를 수행할 수도 있다. 모션 보상 유닛 (72) 은 엔트로피 디코딩 유닛 (70) 으로부터 수신된 모션 벡터들에 기초하여 예측 데이터를 생성할 수도 있는 한편, 인트라 예측 유닛 (74) 은 엔트로피 디코딩 유닛 (70) 으로부터 수신된 인트라-예측 모드 표시자들에 기초하여 예측 데이터를 생성할 수도 있다.
도 3 에 예시된 구현에서, 비디오 디코더 (30) 는 네트워크 엘리먼트 (68) 에 커플링된다. 다양한 예들에서, 네트워크 엘리먼트 (68) 는, 미디어 인식 네트워크 엘리먼트 (또는 "MANE"), 스트리밍 서버, 또는 네트워크 헤드앤드 디바이스와 같은 다양한 디바이스들을 포함하거나, 그러한 디바이스들이거나, 또는 그러한 디바이스들의 부분일 수도 있다. 예를 들어, 네트워크 엘리먼트 (68) 는 비디오 인코더 (20) 에 의해 시그널링된 인코딩된 비디오 비트스트림을 수신하고, 인코딩된 비디오 비트스트림을 시간적으로 스케일링하도록 구성될 수도 있다. 이 예에서, 네트워크 엘리먼트 (68) 는 그 시간적으로 스케일링된 비트스트림을 비디오 디코더 (30) 에 중계할 수도 있다. 다양한 예들에서, 네트워크 엘리먼트 (68) 가 도 3 의 예에서 비디오 디코더 (30) 의 외부에 예시된다.
하나의 예로서, 네트워크 엘리먼트 (68) 는 수신된 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트로부터 인코딩된 픽처들의 시간 서브세트를 추출할 수도 있다. 네트워크 엘리먼트 (68) 에 의해 수신된 인코딩된 비디오 비트스트림은 여기에서 "풀 인코딩된 비디오 비트스트림" 이라고 지칭될 수도 있다. 부가적으로, 네트워크 엘리먼트 (68) 에 의해 추출된 시간 서브세트는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트의 참 서브세트를 나타낼 수도 있다. 다시 말해, 네트워크 엘리먼트 (68) 에 의해 수신된 풀 인코딩된 비디오 비트스트림은 시간 서브세트의 모든 인코딩된 픽처, 및 시간 서브세트에 포함되지 않은 적어도 하나의 부가적인 인코딩된 픽처를 포함할 수도 있다.
시간 스케일러빌리티에 따라 다양한 픽처 레이트들을 지원하기 위해, 네트워크 엘리먼트 (68) 는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트로부터 상이한 픽처 카운트들의 시간 서브세트들을 추출하도록 구성될 수도 있다. (예를 들어, 가변 픽처 레이트들을 지원하기 위해) 네트워크 엘리먼트 (68) 에 의해 추출된 각각의 상이한 시간 서브세트는 독립적으로 디코딩가능한 시간 서브세트 또는 서브-비트스트림을 나타낼 수도 있다. 다시 말해, 네트워크 엘리먼트 (68) 에 의해 추출된 시간적으로 스케일링된 서브-비트스트림을 수신하는 비디오 디코더 (30) 와 같은 디바이스는, 풀 인코딩된 비디오 비트스트림에 포함되지만 서브-비트스트림로부터 배제된 정보와 같은 임의의 부가적인 데이터 없이 인코딩된 픽처들의 시간 서브세트를 디코딩할 수도 있다.
네트워크 엘리먼트 (68) 는, HEVC WD9 에 따라, 비디오 인코더 (20) 에 의해 시그널링된 풀 인코딩된 비디오 비트스트림이 몇몇 시간 서브레이어들을 포함하는 것을 결정할 수도 있다. 부가적으로, 네트워크 엘리먼트 (68) 는 비디오 인코더 (20) 에 의해 시그널링된 각각의 NAL 유닛이 대응하는 "TemporalId" 값에 의해 나타낸 바와 같이 특정 서브-레이어에 속하는 것을 결정할 수도 있다. 예를 들어, 네트워크 엘리먼트 (68) 는 NAL 유닛의 TemporalId 의 값이 대응하는 "temporal_id_plus1" 신택스 엘리먼트의 값 마이너스 1 과 동일한 것을 결정할 수도 있다. 부가적으로, 이 예에서, 네트워크 엘리먼트 (68) 는 단일 픽처의 모든 VCL NAL 유닛들이 단일 서브-레이어 (즉, 동일한 서브-레이어) 에 속하는 것을 결정할 수도 있다. 다시 말해, 네트워크 엘리먼트 (68) 는 특정한 인코딩된 픽처 그 자체가 인코딩된 픽처와 연관된 NAL 유닛들에 대응하는 특정 서브-레이어에 속하는 것을 결정할 수도 있다.
예를 들어, HEVC WD9 에 따르면, 비디오 인코더 (20) 는 (예를 들어, 네트워크 엘리먼트 (68) 에 의해 추출된 바와 같이) 비트스트림의 보다 낮은 서브-레이어의 디코딩 프로세스가 비트스트림의 보다 높은 서브-레이어에서의 데이터에 의존하지 않도록 하는 인코딩된 비디오 비트스트림을 생성할 수도 있다. 네트워크 엘리먼트 (68) 는 특정 값보다 더 큰 TemporalId 값과 연관된 모든 NAL 유닛들을 풀 비트스트림으로부터 제거함으로써 HEVC WD9 에 따르는 서브-비트스트림을 풀 비트스트림으로부터 추출할 수도 있다. 차례로, 이러한 방식으로 네트워크 엘리먼트 (68) 에 의해 추출된 서브-비트스트림은 그 자신이 HEVC WD9 에 따르는 비트스트림을 나타낼 수도 있다. 비디오 인코더 (20) 및/또는 그의 하나 이상의 컴포넌트들은 HEVC WD9 에 대한 비트스트림 준수를 위한 모든 조건들 (예를 들어, 버퍼 제약들) 이 각각의 서브-비트스트림에 대해 만족된다는 것을 보장할 수도 있다.
설명된 바와 같이, 풀 인코딩된 비디오 비트스트림을 시간적으로 스케일링함에 있어서, 네트워크 엘리먼트 (68) 는 풀 인코딩된 비디오 비트스트림으로부터 인코딩된 픽처들의 시간 서브세트를 추출할 수도 있다. 예를 들어, 시간 서브세트는 풀 인코딩된 비디오 비트스트림에서 시그널링된 인코딩된 픽처들의 참 서브세트일 수도 있어서, 그에 따라, 네트워크 엘리먼트 (68) 는 풀 인코딩된 비트스트림으로부터 하나 이상의 인코딩된 픽처들을 제거하여 서브-비트스트림을 생성할 수도 있다. 예들에서, 네트워크 엘리먼트 (68) 는 GDR 세트에 포함된 하나 이상의 인코딩된 픽처들을 제거할 수도 있다. 하나의 이러한 예에서, 네트워크 엘리먼트 (68) 는 복구 포인트 SEI 메시지에 의해 식별된 복구 포인트 픽처를 폐기할 수도 있다.
그러나, 하나의 이러한 예에서, 네트워크 엘리먼트 (68) 는 GDR 세트의 첫 번째 픽처를 형성하는 GDR 픽처를 폐기하지 않을 수도 있다. 이 예에서, 복구 포인트 SEI 메시지가 GDR 픽처와 동일한 AU 에 포함될 수도 있음에 따라, 네트워크 엘리먼트 (68) 는 복구 포인트 SEI 메시지를 비디오 디코더 (30) 에 제공할 수도 있다. 그러나, 이 예에서, 네트워크 엘리먼트 (68) 는 복구 포인트 SEI 메시지에서 식별된 복구 포인트 픽처를 비디오 디코더 (30) 에 제공하지 않을 수도 있는데, 이는 처음에 식별된 복구 포인트 픽처가 시간 스케일링 동안 폐기되었기 때문이다. 차례로, 비디오 디코더 (30) 는 GDR 세트의 표시를 수신할 수도 있지만, 수신된 서브-비트스트림에서 GDR 세트의 복구 포인트 픽처를 로케이팅하는 것이 불가능할 수도 있다.
디코딩 프로세스 동안, 비디오 디코더 (30) 는 비디오 인코더 (20) 로부터 인코딩된 비디오 슬라이스의 비디오 블록들 및 관련 신택스 엘리먼트들을 나타내는 인코딩된 비디오 비트스트림을 수신한다. 비디오 디코더 (30) 의 엔트로피 디코딩 유닛 (70) 은 양자화된 계수들, 모션 벡터들 또는 인트라-예측 모드 표시자들, 및 다른 신택스 엘리먼트들을 생성하기 위해 비트스트림을 엔트로피 디코딩한다. 엔트로피 디코딩 유닛 (70) 은 모션 보상 유닛 (72) 으로 모션 벡터들 및 다른 신택스 엘리먼트들을 포워딩한다. 비디오 디코더 (30) 는 비디오 슬라이스 레벨 및/또는 비디오 블록 레벨에서 신택스 엘리먼트들을 수신할 수도 있다.
비디오 슬라이스가 인트라-코딩된 (I) 슬라이스로서 코딩될 때, 인트라 예측 유닛 (74) 은 시그널링된 인트라 예측 모드 및 현재 프레임 또는 픽처의 이전에 디코딩된 블록들로부터의 데이터에 기초하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 데이터를 생성할 수도 있다. 비디오 프레임이 인터-코딩된 (즉, B, P 또는 GPB) 슬라이스로서 코딩될 때, 모션 보상 유닛 (72) 은 엔트로피 디코딩 유닛 (70) 으로부터 수신된 모션 벡터들 및 다른 신택스 엘리먼트들에 기초하여 현재 비디오 슬라이스의 비디오 블록에 대한 예측 블록들을 생성한다. 그 예측 블록들은 참조 픽처 리스트들 중 하나 내의 참조 픽처들 중 하나로부터 생성될 수도 있다. 비디오 디코더 (30) 는 참조 픽처 메모리 (82) 에 저장된 참조 픽처들에 기초하여 디폴트 구성 기법들을 사용하여 참조 프레임 리스트들, 즉, 리스트 0 또는 리스트 1 을 구성할 수도 있다.
모션 보상 유닛 (72) 은 모션 벡터들 및 다른 신택스 엘리먼트들을 파싱함으로써 현재 비디오 슬라이스의 비디오 블록에 대한 예측 정보를 결정하고, 디코딩되고 있는 현재 비디오 블록에 대한 예측 블록들을 생성하기 위해 그 예측 정보를 사용한다. 예를 들어, 모션 보상 유닛 (72) 은 비디오 슬라이스의 비디오 블록들을 코딩하는데 사용되는 예측 모드 (예를 들어, 인트라- 또는 인터-예측), 인터-예측 슬라이스 타입 (예를 들어, B 슬라이스, P 슬라이스, 또는 GPB 슬라이스), 슬라이스에 대한 참조 픽처 리스트들 중 하나 이상의 참조 픽처 리스트에 대한 구성 정보, 슬라이스의 각각의 인터-인코딩된 비디오 블록에 대한 모션 벡터들, 슬라이스의 각각의 인터-코딩된 비디오 블록에 대한 인터-예측 상태, 및 현재 비디오 슬라이스 내의 비디오 블록들을 디코딩하기 위한 다른 정보를 결정하기 위해 수신된 신택스 엘리먼트들의 일부를 사용한다.
모션 보상 유닛 (72) 은 또한 보간 필터들에 기초하여 보간을 수행할 수도 있다. 모션 보상 유닛 (72) 은 참조 블록들의 서브-정수 픽셀들에 대한 보간된 값들을 계산하기 위해 비디오 블록들의 인코딩 동안 비디오 인코더 (20) 에 의해 사용된 바와 같은 보간 필터들을 사용할 수도 있다. 이러한 경우에, 모션 보상 유닛 (72) 은 수신된 신택스 엘리먼트들로부터 비디오 인코더 (20) 에 의해 사용된 보간 필터들을 결정하고 그 보간 필터들을 사용하여 예측 블록들을 생성할 수도 있다.
역양자화 유닛 (76) 은 비트스트림에서 제공되고 엔트로피 디코딩 유닛 (70) 에 의해 디코딩된 양자화된 변환 계수들을 역양자화, 즉, 양자화 해제한다. 역양자화 프로세스는 양자화의 정도, 및 마찬가지로 적용되어야 하는 역양자화의 정도를 결정하기 위해 비디오 슬라이스 내의 각각의 비디오 블록에 대해 비디오 디코더 (30) 에 의해 계산된 양자화 파라미터 QPY 의 사용을 포함할 수도 있다.
역변환 유닛 (78) 은 픽셀 도메인에서 잔차 블록들을 생성하기 위해 변환 계수들에 역변환, 예를 들어, 역 DCT, 역 정수 변환, 또는 개념적으로 유사한 역변환 프로세스를 적용한다.
모션 보상 유닛 (72) 이 모션 벡터들 및 다른 신택스 엘리먼트들에 기초하여 현재 비디오 블록에 대한 예측 블록을 생성한 후에, 비디오 디코더 (30) 는 역변환 유닛 (78) 으로부터의 잔차 블록들을 모션 보상 유닛 (72) 에 의해 생성된 대응하는 예측 블록들과 합산함으로써 디코딩된 비디오 블록을 형성한다. 합산기 (80) 는 이러한 합산 동작을 수행하는 컴포넌트 또는 컴포넌트들을 나타낸다. 원한다면, 디블록킹 필터가 또한 블록키니스 아티팩트들을 제거하기 위해 디코딩된 블록들을 필터링하기 위해 적용될 수도 있다. (코딩 루프 내에서 또는 코딩 루프 후에서) 다른 루프 필터들은 또한 픽셀 천이들을 평활화하거나, 또는 이와 다르게는 비디오 품질을 개선시키기 위해 사용될 수도 있다. 주어진 프레임 또는 픽처 내의 디코딩된 비디오 블록들은 그 후에 후속하는 모션 보상을 위해 사용되는 참조 픽처들을 저장하는 참조 프레임 메모리 (82) 에 저장된다. 디코딩된 픽처 버퍼 (DPB) 라고도 또한 지칭되는 참조 프레임 메모리 (82) 는 또한 도 1 의 디스플레이 디바이스 (32) 와 같은 디스플레이 디바이스 상의 이후의 제시를 위해 디코딩된 비디오를 저장한다.
비디오 디코더 (30), 및 그의 다양한 컴포넌트들은, GDR 에 따라 코딩된 비디오 시퀀스를 디코딩하면서, 시간적으로 스케일러블한 비디오 비트스트림들을 지원하도록 본 개시물의 기법들을 구현할 수도 있다. 하나의 예로서, 엔트로피 디코딩 유닛 (70) 은 비디오 디코더 (30) 에 대해 여기에 설명된 하나 이상의 기능성들을 구현할 수도 있다. 설명된 바와 같이, 비디오 디코더 (30) 는 비디오 인코더에 의해 시그널링되는 인코딩된 비디오 비트스트림을 수신할 수도 있다. 다양한 예들에서, 비디오 디코더 (30) 는, 시간 스케일러빌리티에 따라, 네트워크 엘리먼트 (68) 가 추출할 수도 있는 서브-비트스트림, 또는 풀 인코딩된 비디오 비트스트림을 수신할 수도 있다. 더욱 구체적으로는, 시간적으로 스케일링된 서브-비트스트림은 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 세트로부터 추출된 인코딩된 픽처들의 서브세트를 포함할 수도 있다. 시간 스케일러빌리티에 따라 네트워크 엘리먼트 (68) 에 의해 추출된 픽처 서브세트는 여기에서 "시간 서브세트" 라고 지칭될 수도 있다. 일부 예들에서, 네트워크 엘리먼트 (68) 에 의해 추출된 시간 서브세트는 풀 인코딩된 비디오 비트스트림에서 인코딩된 픽처들의 참 서브세트를 나타낼 수도 있다. 다시 말해, 이들 예들에 따르면, 풀 인코딩된 비디오 비트스트림은 시간 서브세트의 모든 인코딩된 픽처, 및 시간 서브세트에 포함되지 않은 적어도 하나의 부가적인 인코딩된 픽처를 포함할 수도 있다.
부가적으로, HEVC WD9, AVC, 또는 다른 비디오 코딩 표준들에 따르면, 비디오 디코더 (30) 는 수신된 인코딩된 비디오 비트스트림에 포함된 메타데이터를 디코딩하도록 구성되거나 또는 이와 다르게는 동작가능할 수도 있다. 다양한 예들에서, HEVC WD9 에 따르면, 비디오 디코더 (30) 는 인코딩된 비트스트림에서 시그널링되는 인코딩된 픽처들을 디코딩하기 위해 요구되지 않은 메타데이터를 디코딩할 수도 있다. 다양한 예들에서, 비디오 디코더 (30) 는 하나 이상의 픽처들과 연관된 디스플레이 정보, 및 픽처 출력 타이밍 중 하나 이상을 결정하기 위해 메타데이터를 디코딩할 수도 있다. 이들 그리고 다른 예들에서, 비디오 디코더 (30) 는 메타데이터를 디코딩하여 손실 정보를 검출하고, 하나 이상의 검출된 손실들을 숨기거나 및/또는 교정할 수도 있다.
일부 예들에서, 예를 들어, HEVC WD9 에 따르면, 비디오 디코더 (30) 는 수신된 인코딩된 비디오 비트스트림에서 시그널링된 특정 액세스 유닛 (AU) 에서 하나 이상의 보충 강화 정보 (SEI) 네트워크 추상 레이어 (NAL) 유닛들을 디코딩할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 수신된 인코딩된 비디오 비트스트림에서 시그널링되는 단일 SEI NAL 유닛에 포함된 하나 이상의 SEI 메시지들을 디코딩할 수도 있다. 위의 표 1 은, HEVC WD9 에 따라, 비디오 디코더 (30) 가 수신하여 (예를 들어, 엔트로피 디코딩 유닛 (70) 을 사용하여) 디코딩할 수도 있는 다양한 SEI 메시지들, 및 리스팅된 SEI 메시지들의 대응하는 용도들/목적들을 리스팅한다.
부가적으로, 비디오 디코더 (30) 는 수신된 인코딩된 비디오 비트스트림에서 시그널링된 GDR 세트들을 디코딩하도록 구성되거나 또는 이와 다르게는 동작가능할 수도 있다. 더욱 구체적으로는, 비디오 디코더 (30) 는 GDR 에 따라 수신된 GDR 세트를 디코딩할 수도 있다. 도 1 에 대해 설명된 바와 같이, HEVC WD9 에 따른 GDR 세트는 디코딩 순서로 인코딩된 픽처들의 시퀀스를 포함할 수도 있다. 일부 예들에서, GDR 세트에서의 인코딩된 픽처들의 시퀀스는 또한 출력 순서에 따라 배열될 수도 있다. 다양한 예들에서, GDR 세트의 마지막 픽처는 전체 픽처가 리프레시된 영역에 속하게 되는 복구 포인트 픽처를 나타낼 수도 있다.
비디오 디코더 (30) 는 예컨대 엔트로피 디코딩 유닛 (70) 에 의해 제공된 하나 이상의 기능성들을 구현함으로써 복구 포인트 SEI 메시지를 디코딩할 수도 있다. 디코딩된 복구 포인트 SEI 메시지에 기초하여, 비디오 디코더 (30) 는 첫 번째 GDR 픽처와 같은 GDR 세트의 시작 경계를 검출할 수도 있다. 다양한 예들에서, 첫 번째 GDR 픽처는 복구 포인트 SEI 메시지와 동일한 AU 에 포함되는 인코딩된 픽처일 수도 있다. 위의 신택스 테이블 1 에 예시된 바와 같이, 비디오 디코더 (30) 는, HEVC WD9 에 따라, 시그널링된 복구 포인트 SEI 메시지에서 recovery_poc_cnt, exact_match_flag, 및 broken_link_flag 신택스 엘리먼트들을 디코딩할 수도 있다.
HEVC WD9 에 따르면, 비디오 디코더 (30) 가 복구 포인트 SEI 메시지에 의해 식별된 복구 포인트 픽처를 검출할 때까지, 비디오 디코더 (30) 는 GDR 세트가 계속되는 것을 결정할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 GDR 픽처의 POC 값에 디코딩된 recovery_poc_cnt 신택스 엘리먼트의 값을 가산하여 식별된 복구 포인트 픽처의 POC 값을 결정할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 이러한 방식으로 식별된 복구 포인트 픽처가 GDR 세트의 디코딩 순서의 마지막 픽처를 형성하는 것을 결정할 수도 있다. GDR 세트의 마지막 픽처는 여기에서 "lastPicInSet" 로 표시된다.
설명된 바와 같이, 설명된 바와 같이, 비디오 디코더 (30) 및/또는 그의 컴포넌트들은, 예컨대 HEVC WD9 에 따라, 인코딩된 비디오 비트스트림들의 시간 스케일러빌리티를 지원하도록 구성될 수도 있다. 예를 들어, 비디오 디코더 (30) 는 네트워크 엘리먼트 (68) 가 풀 인코딩된 비디오 비트스트림으로부터 추출하는 서브-비트스트림을 수신하고, 비디오 디코더 (30) 와 통신할 수도 있다. 이 예에서, 네트워크 엘리먼트 (68) 는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트로부터 인코딩된 픽처들의 시간 서브세트를 추출하고, 그 시간 서브세트를 서브-비트스트림의 부분으로서 비디오 디코더 (30) 에 제공할 수도 있다. 예를 들어, 시간 서브세트는 풀 인코딩된 비디오 비트스트림에 포함된 인코딩된 픽처들의 풀 세트의 참 서브세트를 나타낼 수도 있다. 시간 서브세트가 인코딩된된 픽처들의 풀 세트의 참 서브세트를 나타내는 시나리오들에서, 풀 인코딩된 비디오 비트스트림은 시간 서브세트의 모든 인코딩된 픽처에 대한 데이터, 및 시간 서브세트에 포함되지 않은 적어도 하나의 부가적인 인코딩된 픽처에 대한 데이터를 포함할 수도 있다.
시간 스케일러빌리티에 따라 다양한 시간 픽처 레이트들을 지원하기 위해, 비디오 디코더 (30) 는, 네트워크 엘리먼트 (68) 가 풀 인코딩된 비디오 비트스트림으로부터 추출할 수도 있는 다양한 서브-비트스트림들과 같은, 가변 픽처 레이트들의 서브-비트스트림들을 수신하고 디코딩하도록 구성될 수도 있다. 더욱 구체적으로는, 가변 픽처 카운트들의 시간 서브세트들을 포함하는 상이한 서브-비트스트림들은 상이한 픽처 레이트들을 나타낼 수도 있다. 시간 스케일러빌리티를 지원하기 위해, 비디오 디코더 (30) 는, 픽처 레이트에 관계없이, 독립적으로 디코딩가능한 비트스트림으로서 임의의 서브-비트스트림을 디코딩할 수도 있다. 다시 말해, 비디오 디코더 (30) 는 풀 인코딩된 비디오 비트스트림에 포함되지만 특정 서브-비트스트림로부터 배제된 정보와 같은 임의의 부가적인 데이터 없이 인코딩된 픽처들의 특정 시간 서브세트를 디코딩할 수도 있다.
비디오 디코더 (30) 가 비디오 인코딩 디바이스에 의해 시그널링된 풀 인코딩된 비디오 비트스트림을 수신하는 예들에서, 풀 인코딩된 비디오 비트스트림은 하나 이상의 시간 서브-레이어들을 포함할 수도 있다. 부가적으로, 비디오 디코더 (30) 에 의해 수신되거나 및/또는 디코딩되는 각각의 NAL 유닛은 대응하는 "TemporalId" 값에 의해 나타낸 바와 같이 특정 서브-레이어에 속할 수도 있다. 더욱 구체적으로는, 비디오 디코더 (30) 는 대응하는 "temporal_id_plus1" 신택스 엘리먼트의 값 마이너스 1 과 동일한 것으로 NAL 유닛의 TemporalId 의 값을 결정할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 단일 픽처의 모든 시그널링된 VCL NAL 유닛들이 단일 서브레이어 (즉, 동일한 서브-레이어) 에 속하는 것을 결정할 수도 있다. 다시 말해, 비디오 디코더 (30) 는, 인코딩된 픽처 그 자체가 인코딩된 픽처와 연관된 NAL 유닛들에 대응하는 특정 서브-레이어에 속한다는 결정에 기초하여, 인코딩된 픽처를 디코딩할 수도 있다.
예를 들어, HEVC WD9 에 따르면, 비디오 디코더 (30) 는, 비트스트림의 보다 낮은 서브-레이어의 디코딩 프로세스가 비트스트림의 보다 높은 서브-레이어에서의 데이터에 의존하지 않도록, 시그널링된 인코딩된 비디오 비트스트림을 디코딩할 수도 있다. 네트워크 엘리먼트 (68) 는 특정 값보다 더 큰 TemporalId 값과 연관된 모든 NAL 유닛들을 풀 비트스트림으로부터 제거함으로써 풀 비트스트림으로부터 서브-비트스트림을 생성할 수도 있다. 비디오 인코딩 디바이스는 HEVC WD9 에 대한 비트스트림 준수를 위한 모든 조건들 (예를 들어, 버퍼 제약들) 이 풀 비트스트림에 대해, 그리고 그에 따라, 네트워크 엘리먼트 (68) 가 풀 비트스트림으로부터 추출할 수도 있는 각각의 서브-비트스트림에 대해 만족된다는 것을 보장할 수도 있다. 차례로, 일부 예들에서, 비디오 디코더 (30) 는 디코딩 프로세스에 대한 어떠한 변화들도 없이, 그리고 하드웨어 및/또는 소프트웨어 인프라스트럭처에 대한 어떠한 변화들도 수반하는 일 없이 임의의 시그널링된 서브-비트스트림을 디코딩할 수도 있다. 다시 말해, 비디오 디코더 (30) 는, 풀 인코딩된 비디오 비트스트림을 디코딩하는 것에 대응하는 방식으로, HEVC WD9 에 따라 시간 스케일러빌리티를 지원하면서, 시그널링된 서브-비트스트림을 디코딩할 수도 있다.
설명된 바와 같이, 풀 인코딩된 비디오 비트스트림을 시간적으로 스케일링함에 있어서, 네트워크 엘리먼트 (68) 는 풀 인코딩된 비디오 비트스트림으로부터 인코딩된 픽처들의 시간 서브세트를 추출할 수도 있다. 예를 들어, 시간 서브세트는 풀 인코딩된 비디오 비트스트림에서 시그널링된 인코딩된 픽처들의 참 서브세트일 수도 있어서, 그에 따라, 네트워크 엘리먼트 (68) 는 풀 인코딩된 비트스트림으로부터 하나 이상의 인코딩된 픽처들을 제거하여 서브-비트스트림을 생성할 수도 있다. 일부 예들에서, 네트워크 엘리먼트 (68) 는 복구 포인트 SEI 메시지에 의해 식별된 복구 포인트 픽처를 제거할 수도 있다. 이들 예들에서, 비디오 디코더 (30) 는 GDR 세트의 경계들을 식별하는 복구 포인트 SEI 메시지를 수신할 수도 있지만, GDR 세트의 lastPicInSet 를 형성하는 복구 포인트 픽처를 수신하지 않을 수도 있다. recovery_poc_cnt 신택스 엘리먼트의 값을 디코딩하고 적용함으로써, 비디오 디코더 (30) 는 식별된 복구 포인트 픽처의 POC 카운트를 결정할 수도 있지만, 수신된 시간 서브세트에서 식별된 복구 포인트 픽처를 로케이팅하는 것이 불가능할 수도 있다.
식별된 복구 포인트 픽처를 폐기한 GDR 세트의 시간 스케일링에 의해 야기되는 잠재적인 이슈들을 완화시키거나 또는 없애기 위해, 비디오 디코더 (30) 및/또는 그의 컴포넌트들, 예컨대 엔트로피 디코딩 유닛 (70) 은, 본 개시물의 하나 이상의 기법들을 구현할 수도 있다. 이 기법들의 일부 구현들에 따르면, 비디오 디코더 (30) 는 처음에 식별된 복구 포인트 픽처의 픽처 순서 카운트 (picture order count; POC) 값을 나타내는 정보를 획득하도록 복구 포인트 SEI 메시지를 디코딩할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 수신된 인코딩된 비트스트림이 복구 포인트 SEI 메시지로부터 획득된 POC 값을 갖는 인코딩된 픽처를 포함하는지 아닌지의 여부를 결정하기 위해 본 개시물의 하나 이상의 기법들을 구현할 수도 있다.
여기에 설명된 기법들에 따르면, 비디오 디코더 (30) 는, 복구 포인트 SEI 메시지에서 식별된 POC 값을 갖는 인코딩된 픽처로서 복구 포인트 픽처만을 단지 정의하는 대신에, 다단계 결정에 따라 복구 포인트 픽처를 정의할 수도 있다. 예를 들어, 비디오 디코더 (30) 가, 수신된 비트스트림에서 디코딩 순서로 현재 픽처 (예를 들어, 현재 SEI 메시지와 연관된 GDR 픽처) 에 후속하고, recovery_poc_cnt 신택스 엘리먼트의 값 플러스 GDR 픽처의 PicOrderCntVal 과 동일한 POC 값 ("PicOrderCntVal") 을 갖는 픽처 ("picA") 를 식별한다면, 비디오 디코더 (30) 는 복구 포인트 픽처로서 picA 를 식별할 수도 있다. 한편, 비디오 디코더 (30) 가 상술된 조건들에 충족하는 picA 를 식별하지 않은 경우, 비디오 디코더 (30) 는 복구 포인트 픽처로서 출력 순서로 picA 의 바로 뒤에 후속하는 픽처를 식별할 수도 있다. 비디오 디코더 (30) 는 또한 복구 포인트 픽처가 디코딩 순서로 첫 번째 GDR 픽처에 선행하지 않는 것을 결정할 수도 있다 (예를 들어, 첫 번째 픽처가 GDR 픽처의 POC 값보다 더 작은 POC 값을 갖는 경우, 비디오 디코더 (30) 는 복구 포인트 픽처로서 첫 번째 픽처를 식별하지 않을 수도 있다). GDR 픽처는 또한 여기에서 "현재" 픽처라고 지칭될 수도 있다.
부가적으로, 본 개시물의 하나 이상의 양태들에 따르면, 비디오 디코더 (30) 는, 복구 포인트 픽처의 첫 번째 GDR 픽처로부터 시작하는 픽처들의 세트로서 GDR 세트 ("gdrPicSet") 를 정의하는 대신에, 후속 다단계 결정에 따라 gdrPicSet 를 정의할 수도 있다. 비디오 디코더 (30) 가, 수신된 비트스트림에서, 수신된 비트스트림 (또는 코딩된 비디오 시퀀스) 에서 디코딩 순서로 GDR 픽처에 후속하고 복구 포인트 SEI 메시지에서 시그널링된 decoded recovery_poc_cnt 신택스 엘리먼트의 값 플러스 GDR 픽처의 PicOrderCntVal 와 동일한 PicOrderCntVal 를 갖는 픽처를 식별하는 경우, 비디오 디코더 (30) 는 가변 lastPicInSet 로 표시된 픽처를 복구 포인트 픽처로서 설정할 수도 있다. 이와 다르게, 비디오 디코더 (30) 가 위에 리스팅된 조건들을 충족하는 코딩된 비디오 시퀀스에서 픽처를 검출하지 않은 경우, 비디오 디코더 (30) 는 출력 순서로 복구 포인트 픽처의 바로 앞에 선행하는 픽처로 lastPicInSet 를 설정할 수도 있다.
부가적으로, 비디오 디코더 (30) 는 픽처 lastPicInSet 가 디코딩 순서로 GDR 픽처에 선행하지 않는 것을 결정할 수도 있다. 이들 예들에서, 비디오 디코더 (30) 는, 출력 순서로 첫 번째 GDR 픽처에서부터 시작하고 픽처 lastPicInSet 에서 끝나는 (그 양쪽의 픽처들을 포함함) 픽처들의 세트인 것으로 gdrPicSet 를 설정할 수도 있다. 그 결과, 일부 예들에서, lastPicInSet 에서 리프레시된 영역은 전체 픽처를 커버할 수도 있고 또는 커버하지 않을 수도 있다. 예를 들어, 비디오 디코더 (30) 가 처음에 식별된 복구 포인트 픽처를 로케이팅하지 않은 경우, 비디오 디코더 (30) 는 처음에 식별된 복구 포인트 픽처에 선행하는 픽처에 대해 lastPicInSet 를 설정하여, GDR 세트의 종단 경계를 결정할 수도 있다. 차례로, lastPicInSet 가 디코딩 순서로 처음에 식별된 복구 포인트 픽처에 선행함에 따라, lastPicInSet 는 완전히 리프레시된 픽처가 아닐 수도 있다. 이들 예들에서, 비디오 디코더 (30) 는 GDR 세트에 대해 식별된 lastPicInSet 의 바로 뒤에 후속하는 픽처를 복구 포인트 픽처로서 식별할 수도 있다.
설명된 바와 같이, 본 개시물의 기법들은 복구 포인트 SEI 메시지 또는 영역 리프레시 정보 SEI 메시지의 기존 신택스에 대한 변화들을 요구하지 않을 수도 있다. 이 기법들은, 다양한 예들에서, WD9 에서 복구 포인트 SEI 메시지 및/또는 영역 리프레시 정보 SEI 메시지의 기존 시맨틱스에 대한 변화들을 도입시킬 수도 있다. 복구 포인트 SEI 메시지와 연관된 시맨틱스는 후술되고, 여기에 설명된 기법들에 의해 기존 시맨틱스에 도입되는 변화들이 언더라인된다.
복구 포인트 SEI 메시지는, 비디오 디코더 (30) 가, 비디오 디코더 (30) 가 랜덤 액세스를 개시한 후에 또는 비디오 인코더 (20) 가 코딩된 비디오 시퀀스에서 브로큰 링크 (broken link) 를 나타낸 후에 디스플레이를 위해 디코딩 프로세스가 수용가능한 픽처들을 생성할 때를 결정하는 것을 돕는다. 비디오 디코더 (30) 가 복구 포인트 SEI 메시지와 연관된 디코딩 순서로 AU 에 의한 디코딩 프로세스를 시작할 때, 이 SEI 메시지에서 특정된 출력 순서로 복구 포인트에서 또는 복구 포인트에 후속하는 모든 디코딩된 픽처들은 콘텐츠에 있어서 올바르게 또는 거의 올바르게 나타난다. 나타낸 복구 포인트 또는 출력 순서의 다음 픽처, 및 복구 포인트 SEI 메시지와 연관된 픽처에서 시작하는 디코딩 프로세스의 동작이, 디코딩 픽처 버퍼 및/또는 참조 픽처 메모리 (82) 에서 입수가능하지 않은 픽처들에 대한 참조들을 포함할 수도 있을 때까지, 복구 포인트 SEI 메시지와 연관된 픽처에서 또는 그 픽처 이전에 랜덤 액세스에 의해 생성된 디코딩된 픽처들은 콘텐츠에 있어서 올바를 필요는 없다.
부가적으로, broken_link_flag 신택스 엘리먼트의 사용에 의해, 비디오 인코더 (20) 는, 디코딩 프로세스가 디코딩 순서로 이전 랜덤 액세스 포인트 (RAP) AU 의 로케이션에서 시작되었을 때라도, 디스플레이되었을 때 시각적 아티팩트들을 잠재적으로 발생시킬 수도 있는 비트스트림에서의 하나 이상의 픽처들의 로케이션을 비디오 디코더 (30) 에게 나타내도록 복구 포인트 SEI 메시지를 사용할 수도 있다. 비디오 인코더 (20) 는, 디코딩 프로세스에서 비디오 디코더 (30) 에 의한 사용을 위해 이용가능하더라도, (예를 들어, 비트스트림의 생성 동안 비디오 인코더 (20) 에 의해 수행된 스플라이싱 동작으로 인해) 비디오 인코더 (20) 가 처음에 비트스트림을 인코딩했을 때 참조를 위해 사용되었던 픽처들이 아닌 픽처들에 대한 참조들을 하나 이상의 픽처들의 디코딩을 위한 디코딩 프로세스가 유발할 수도 있게 되는 포인트의 로케이션을 나타내도록 broken_link_flag 신택스 엘리먼트를 사용할 수도 있다.
비디오 디코더 (30) 가 복구 포인트 SEI 메시지와 연관된 AU 로부터 디코딩을 시작하기 위한 랜덤 액세스를 수행하는 예들에서, 비디오 디코더 (30) 는 관련 픽처가 비트스트림에서의 첫 번째 픽처인 것을 결정할 수도 있고, 복구 포인트 픽처의 PicOrderCntVal 의 도출에 사용되는 변수들 prevPicOrderCntLsb 및 prevPicOrderCntMsb 은 모두 0 과 동일한 것으로 설정된다. 비디오 디코더 (30) 가 수신된 비트스트림에 가설 참조 디코더 (HRD) 정보가 존재하는 것을 결정하는 예들에서, 비디오 디코더 (30) 는, 버퍼링 주기 SEI 메시지가, 랜덤 액세스 후에 HRD 버퍼 모델의 초기화를 확립하기 위해 복구 포인트 SEI 메시지와 연관된 AU 와 연관되는 것을 결정할 수도 있다.
복구 포인트 SEI 메시지와 연관된 픽처에 의해 또는 디코딩 순서로 이러한 픽처에 후속하는 임의의 픽처에 의해 참조되는 임의의 시퀀스 또는 픽처 파라미터 세트 RBSP 는, 비디오 디코더 (30) 가, 복구 포인트 SEI 메시지와 연관된, 디코딩 순서의, AU 로 또는 비트스트림의 시작부에서 디코딩 프로세스를 시작하는지 아닌지의 여부에 관계없이, 그의 활성화 이전에 디코딩 프로세스 동안 비디오 디코더 (30) 에 이용가능할 수도 있다.
recovery_poc_cnt 신택스 엘리먼트는, 비디오 디코더 (30) 에 대해, 출력 순서로 출력 픽처들의 복구 포인트를 특정할 수도 있다. 비디오 디코더 (30) 가 코딩된 비디오 시퀀스에서 디코딩 순서로 현재 픽처 (예를 들어, 현재 SEI 메시지와 연관된 픽처) 에 후속하고, recovery_poc_cnt 의 값 플러스 현재 픽처의 PicOrderCntVal 과 동일한 PicOrderCntVal 을 갖는 픽처 picA 가 존재하는 것을 결정하는 경우, 비디오 디코더 (30) 는 픽처 picA 를 복구 포인트 픽처로서 참조할 수도 있고; 그렇지 않다면 비디오 디코더 (30) 는 출력 순서로 picA 의 바로 뒤에 후속하는 픽처를 복구 포인트 픽처로서 참조할 수도 있다. 비디오 디코더 (30) 는 복구 포인트 픽처가 디코딩 순서로 현재 픽처에 선행하지 않는 것을 결정할 수도 있다. 비디오 디코더 (30) 는, 출력 순서의 모든 디코딩된 픽처들이, 복구 포인트 픽처의 출력 순서 위치에서 시작하는 콘텐츠에 있어서 올바르게 또는 거의 올바르게 나타냄을 나타낼 수도 있다. 비디오 디코더 (30) 는 recovery_poc_cnt 의 값이 -MaxPicOrderCntLsb / 2 내지 MaxPicOrderCntLsb / 2 - 1 의 범위에 있는 것을 결정할 수도 있다.
exact_match_flag 신택스 엘리먼트는 복구 포인트 SEI 메시지와 연관된 AU 에서 디코딩 프로세스를 시작하는 것에 의해 도출된 출력 순서로 특정된 복구 포인트에서의 그리고 그에 후속하는 하나 이상의 디코딩된 픽처들이, 만약 있다면, 수신된 비트스트림에서, 이전 RAP AU 의 로케이션에서 디코딩 프로세스를 시작하는 비디오 디코더 (30) 에 의해 생성되는 하나 이상의 픽처들과의 정확한 매치가 될 것인지 여부를 비디오 디코더 (30) 에게 나타낸다. exact_match_flag 와 연관된 0 의 값은 그 매치가 정확하지 않을 수도 있음을 비디오 디코더 (30) 에게 나타내고, 1 의 값은 그 매치가 정확할 것임을 나타낸다. exact_match_flag 가 1 과 동일할 때, 복구 포인트 SEI 메시지와 연관된 AU 에서 디코딩 프로세스를 시작하는 것에 의해 비디오 디코더 (30) 에 의해 도출된 출력 순서로 특정된 복구 포인트에서의 그리고 그에 후속하는 디코딩된 픽처들이, 만약 있다면, 비트스트림에서, 이전 RAP AU 의 로케이션에서 디코딩 프로세스를 시작하는 것에 의해 생성되는 픽처들과의 정확한 매치가 된다는 비트스트림 준수의 요건이 존재한다.
랜덤 액세스를 수행할 때, 비디오 디코더 (30) 는, exact_match_flag 의 값과 관계없이, 단지 인트라 코딩 블록들만을 포함하고 Y 가 (1 << ( BitDepthY - 1 )) 과 동일하고 Cb 와 Cr 양쪽이 (1 << ( BitDepthC - 1 )) (중간-레벨 그레이) 와 동일하게 주어진 샘플 값들을 갖는 픽처들에 대한 참조들로서 이용불가능한 픽처들에 대한 모든 참조들을 추론할 수도 있다. exact_match_flag 가 0 과 동일할 때, 복구 포인트에서의 근사치의 품질은 인코딩 프로세스 동안 비디오 인코더 (20) 에 의해 선정된다.
broken_link_flag 신택스 엘리먼트는 복구 포인트 SEI 메시지의 로케이션에서의 NAL 유닛 스트림에서의 브로큰 링크의 존재 또는 부존재를 비디오 디코더 (30) 에게 나타내고, 추가의 시맨틱스가 다음과 같이 배정된다: broken_link_flag 가 1 과 동일한 경우, 이전 RAP AU 의 로케이션에서 디코딩 프로세스를 시작하는 것에 의해 비디오 디코더 (30) 에 의해 생성된 픽처들은, 출력 순서로 특정된 복구 포인트까지 디코딩 순서로 복구 포인트 SEI 메시지와 연관된 액세스 유닛에서의 그리고 그에 후속하는 디코딩된 픽처들을 디바이스가 디스플레이해서는 안되는 범위에 바람직하지 않은 시각적 아티팩트들을 포함할 수도 있다. 그렇지 않다면 (예를 들어, 비디오 디코더 (30) 가 broken_link_flag 가 0 과 동일하다는 것을 검출함), 시각적 아티팩트들의 임의의 잠재적인 존재와 관련하여 어떠한 표시도 주어지지 않는다.
현재 픽처가 BLA (broken link access) 픽처인 예들에서, 비디오 디코더 (30) 는 broken_link_flag 의 값이 1 과 동일하다는 것을 검출할 수도 있다. broken_link_flag 의 값에 관계없이, 비디오 디코더 (30) 는 출력 순서로 특정된 복구 포인트에 후속하는 픽처들이 콘텐츠에 있어서 올바르게 또는 거의 올바르게 특정된다는 것을 검출할 수도 있다.
영역 리프레시 정보 SEI 메시지와 연관된 시맨틱스는 후술되고, 여기에 설명된 기법들에 의해 WD9 에서 기존 시맨틱스에 도입되는 변화들이 언더라인된다.
영역 리프레시 정보 SEI 메시지는 (후술되는 바와 같이) 현재 SEI 메시지가 적용되는 슬라이스 세그먼트들이 현재 픽처의 리프레시된 영역에 속하는지 여부를 비디오 디코더 (30) 에게 나타낸다. RAP AU 가 아니고 복구 포인트 SEI 메시지를 포함하는 AU 는 여기에서 점진적 디코딩 리프레시 (GDR) AU 라고 지칭되고, 그의 대응하는 픽처는 GDR 픽처라고 지칭된다. 나타낸 복구 포인트 픽처에 대응하는 AU 는 여기에서 복구 포인트 AU 라고 지칭된다.
비디오 디코더 (30) 는 코딩된 비디오 시퀀스에서 디코딩 순서로 GDR 픽처에 후속하고 복구 포인트 SEI 메시지에서 recovery_poc_cnt 의 값 플러스 GDR 픽처의 PicOrderCntVal 과 동일한 PicOrderCntVal 을 갖는 픽처가 존재하는 경우, 변수 lastPicInSet 는 복구 포인트 픽처이고; 그렇지 않다면 lastPicInSet 는 출력 순서로 복구 포인트 픽처의 바로 앞에 선행하는 픽처인 것을 결정할 수도 있다. 비디오 디코더 (30) 는 픽처 lastPicInSet 가 디코딩 순서로 GDR 픽처에 선행하지 않는 것을 결정할 수도 있다.
비디오 디코더 (30) 는, gdrPicSet 가 출력 순서로 GDR 픽처에서부터 시작하여 픽처 lastPicInSet 까지의 픽처들의 세트인 것을 결정할 수도 있다. 비디오 디코더 (30) 가 GDR AU 로부터 시작되는 디코딩 프로세스를 시작할 때, gdrPicSet 의 각각의 픽처에서의 리프레시된 영역은 콘텐츠에 있어서 올바르거나 또는 거의 올바른 픽처의 영역인 것으로 나타내고, lastPicInSet 가 복구 포인트 픽처일 때, lastPicInSet 에서의 리프레시된 영역은 전체 픽처를 커버한다.
비디오 디코더 (30) 는, 영역 리프레시 정보 SEI 메시지가 적용되는 슬라이스 세그먼트들이, 만약 있다면, 디코딩 순서로, 영역 리프레시 정보 SEI 메시지를 포함하는 SEI NAL 유닛에 후속하고 영역 리프레시 정보 SEI 메시지를 포함하는 다음 SEI NAL 유닛에 선행하는 AU 내의 모든 슬라이스 세그먼트들로 이루어지는 것을 결정할 수도 있다. 이들 슬라이스 세그먼트들은 여기에서 영역 리프레시 정보 SEI 메시지와 연관된 슬라이스 세그먼트들이라고 지칭된다.
부가적으로, 비디오 디코더 (30) 는 gdrAuSet 가 gdrPicSet 에 대응하는 액세스 유닛들의 세트인 것을 결정할 수도 있다. gdrAuSet 및 대응하는 gdrPicSet 는 여기에서 GDR 액세스 유닛에 포함된 복구 포인트 SEI 메시지와 연관되는 것으로 지칭된다. 비디오 디코더 (30) 는 또한, 복구 포인트 SEI 메시지와 연관된 gdrAuSet 에 AU 가 포함되지 않는 한, 영역 리프레시 정보 SEI 메시지들이 AU 에 존재하지 않을 것이라는 것을 결정할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 gdrAuSet 에 포함된 임의의 AU 가 하나 이상의 영역 리프레시 정보 SEI 메시지들을 포함할 때, gdrAuSet 에서의 모든 액세스 유닛들은 하나 이상의 영역 리프레시 정보 SEI 메시지들을 포함할 것이라는 것을 결정할 수도 있다.
refreshed_region_flag 신택스 엘리먼트가 1 과 동일한 경우, 비디오 디코더 (30) 는 refreshed_region_flag 신택스 엘리먼트가 현재 SEI 메시지와 연관된 슬라이스 세그먼트들이 현재 픽처에서의 리프레시된 영역에 속함을 나타내는 것을 결정할 수도 있다. 비디오 디코더 (30) 가 refreshed_region_flag 신택스 엘리먼트가 0 과 동일한 것을 결정한다면, 비디오 디코더 (30) 는 refreshed_region_flag 신택스 엘리먼트가 현재 SEI 메시지와 연관된 슬라이스 세그먼트들이 현재 픽처에서의 리프레시된 영역에 속하지 않을 수도 있음을 나타내는 것을 결정할 수도 있다.
비디오 디코더 (30) 가 하나 이상의 영역 리프레시 정보 SEI 메시지들이 AU 에 존재하고, 디코딩 순서로 AU 의 첫 번째 슬라이스 세그먼트가 관련 영역 리프레시 정보 SEI 메시지를 갖지 않는다는 것을 검출하는 경우들에서, 비디오 디코더 (30) 는 첫 번째 영역 리프레시 정보 SEI 메시지에 선행하는 슬라이스 세그먼트들에 대한 refreshed_region_flag 신택스 엘리먼트의 값을 0 과 동일한 것으로 추론할 수도 있다.
lastPicInSet 가 복구 포인트 픽처이고, 임의의 영역 리프레시 SEI 메시지가 복구 포인트 액세스 유닛에 포함될 때, 비디오 디코더 (30) 는 디코딩 순서로 AU 의 첫 번째 슬라이스 세그먼트가 관련 영역 리프레시 SEI 메시지를 가지며, refreshed_region_flag 의 값이 AU 에서의 모든 영역 리프레시 SEI 메시지들에서 1 과 동일할 것이라는 것을 결정할 수도 있다. 비디오 디코더 (30) 가 하나 이상의 영역 리프레시 정보 SEI 메시지들이 AU 에 존재하는 것을 결정하는 예들에서, 비디오 디코더 (30) 는 1 과 동일한 refreshed_region_flag 를 갖는 영역 리프레시 정보 SEI 메시지들과 연관된 AU 의 모든 슬라이스 세그먼트들에서의 CTU들의 세트로서 픽처에서의 리프레시된 영역이 특정되는 것을 결정할 수도 있다. 비디오 디코더 (30) 는 다른 슬라이스 세그먼트들이 픽처의 비-리프레시된 영역에 속하는 것을 결정할 수도 있다.
비트스트림 준수의 요건은, 의존적인 슬라이스 세그먼트가 리프레시된 영역에 속할 때, 디코딩 순서로 선행하는 슬라이스 세그먼트가 또한 리프레시된 영역에 속해야 한다는 것이다. 예들에서, 비디오 디코더 (30) 는 gdrRefreshedSliceSegmentSet 가 gdrPicSet 에서 리프레시된 영역들에 속하는 모든 슬라이스 세그먼트들의 세트인 것을 결정할 수도 있다. 비디오 디코더 (30) 가 gdrAuSet 가 하나 이상의 영역 리프레시 정보 SEI 메시지들을 포함하는 것을 결정할 때, 다음 제약들 모두가 적용되는 비트스트림 준수의 요건이 존재한다:
Figure pct00003
임의의 리프레시된 영역을 포함하는, 디코딩 순서로 대응하는 gdrPicSet 에 포함된 첫 번째 픽처에서의 리프레시된 영역은, 인트라 코딩 모드에서 코딩된 코딩 유닛 (CU) 들만을 포함해야 한다.
Figure pct00004
gdrPicSet 에 포함된 각각의 픽처에 대해, gdrRefreshedSliceSegmentSet 의 외측의 어떠한 샘플들 또는 모션 벡터 값들도 gdrRefreshedSliceSegmentSet 내의 임의의 샘플들의 디코딩 프로세스에서 인터 예측을 위해 사용되지 않도록 gdrRefreshedSliceSegmentSet 에서의 신택스 엘리먼트들은 제약되어야 한다.
Figure pct00005
출력 순서로 픽처 lastPicInSet 에 후속하는 임의의 픽처에 대해, gdrRefreshedSliceSegmentSet 의 외측의 어떠한 샘플들 또는 모션 벡터 값들도 출력 순서로 픽처 lastPicInSet 에 후속하는 다른 픽처들의 디코딩 프로세스들 이외의 픽처의 디코딩 프로세스에서 인터 예측을 위해 사용되지 않도록 픽처의 슬라이스 세그먼트들의 신택스 엘리먼트들은 제약되어야 한다.
도 3 에 대해 설명된 바와 같이, 비디오 디코더 (30) 및/또는 그의 컴포넌트들은 비디오 데이터를 디코딩하는 방법을 수행할 수도 있고, 이 방법은 인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하는 단계, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 픽처 순서 카운트 (POC) 값을 나타내는 정보를 수신하는 단계, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 단계, 및 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하는 단계를 포함한다.
비디오 디코더 (30) 에 대해 상술된 방법의 일부 예시적인 구현들에 따르면, 이 방법은 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 GDR 세트의 마지막 픽처로서 식별하는 단계, 및 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처들 중 하나를 GDR 세트의 마지막 픽처로서 식별하는 단계를 더 포함한다. 일부 예시적인 구현들에서, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 첫 번째 픽처의 POC 값보다 더 크다. 일부 예시적인 구현들에 따르면, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예시적인 구현에서, SEI 메시지는 복구 포인트 SEI 메시지를 포함한다.
비디오 디코더 (30) 에 대해 상술된 방법의 일부 예시적인 구현들에서, 복구 포인트 픽처의 POC 값을 나타내는 정보는, 첫 번째 픽처의 POC 값과 복구 포인트 픽처의 POC 값 사이의 차이를 나타내는 정보를 포함한다. 일부 예시적인 구현들에 따르면, 복구 포인트 픽처의 POC 값을 나타내는 정보는 복구 포인트 픽처의 POC 값을 포함한다. 일부 예시적인 구현들에서, 비디오 디코더 (30) 에 대해 상술된 방법은 GDR 에 따라 GDR 세트의 하나 이상의 픽처들을 디코딩하는 단계를 더 포함한다. 하나의 이러한 예시적인 구현에 따르면, 이 방법은 디코딩 순서로 식별된 복구 포인트 픽처에 후속하는 하나 이상의 픽처들 및 식별된 복구 포인트 픽처에 대해 랜덤 액세스 디코딩을 수행하는 단계를 더 포함한다.
부가적으로, 비디오 디코더 (30) 및/또는 그의 컴포넌트들은 비디오 데이터를 디코딩하는 방법을 수행할 수도 있고, 이 방법은 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하는 단계, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하는 단계, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하는 단계, 및 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하는 단계를 포함한다. 비디오 디코더 (30) 에 대해 상술된 방법의 일부 예시적인 구현들에서, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예시적인 구현에서, SEI 메시지는 영역 리프레시 SEI 메시지를 포함한다.
비디오 디코더 (30) 에 대해 상술된 방법의 일부 예시적인 구현들에서, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하는 단계는, 영역 리프레시 SEI 메시지와 연관된 refreshed_region_flag 신택스 엘리먼트가 1 의 값을 갖는 것을 결정하는 단계를 포함한다. 하나의 이러한 예시적인 구현에서, refreshed_region_flag 신택스 엘리먼트는 픽처를 포함하는 액세스 유닛 (AU) 의 첫 번째 슬라이스 세그먼트와 연관되고, 리프레시된 영역에 전체 픽처가 속하는 것을 결정하는 것은, AU 의 첫 번째 슬라이스 세그먼트와는 상이한 AU 의 각각의 슬라이스 세그먼트가 대응하는 refreshed_region_flag 신택스 엘리먼트와 연관되는 것을 결정하는 것을 더 포함한다.
다양한 예들에서, 비디오 디코더 (30) 는 데스크톱 컴퓨터, 노트북 (즉, 랩톱) 컴퓨터, 태블릿 컴퓨터, 셋톱 박스, 소위 "스마트" 폰과 같은 전화 핸드셋, 소위 "스마트" 패드, 텔레비전, 카메라, 디스플레이 디바이스, 디지털 미디어 플레이어, 비디오 게이밍 콘솔, 비디오 스트리밍 디바이스 등과 같은, 비디오 데이터를 코딩하기 위한 디바이스에 포함될 수도 있다. 예들에서, 비디오 데이터를 코딩하기 위한 이러한 디바이스는 집적 회로, 마이크로프로세서, 및 비디오 디코더 (30) 를 포함하는 통신 디바이스 중 하나 이상을 포함할 수도 있다.
도 4 는, 본 개시물의 하나 이상의 양태들에 따른, 첫 번째 GDR 픽처 (90A), GDR 세트 픽처들 (90B, 90C 등), 및 복구 포인트 픽처 (90N) 를 포함하는 일 예시적인 점진적 디코딩 리프레시 (GDR) 세트 (90) 를 예시한 개념도이다. GDR 세트 (90) 에 대해 여기에 설명된 기법들이 다양한 디바이스들에 의해 수행될 수도 있지만, 단지 설명의 용이를 위해, 도 4 는 여기에서 도 1 및 도 3 의 비디오 디코더 (30) 에 대해 설명된다. 비디오 디코더 (30) 는 GDR 픽처 (90A) 를 포함하는 액세스 유닛 (AU) 이 또한 복구 포인트 SEI 메시지를 포함한다는 것을 검출할 수도 있다. GDR 픽처 (90A) 와 연관된 복구 포인트 SEI 메시지를 검출한 것에 기초하여, 비디오 디코더 (30) 는 GDR 픽처 (90A) 가 수신된 인코딩된 비디오 비트스트림에서 시그널링된 GDR 세트의 첫 번째 픽처를 형성하는 것을 결정할 수도 있다.
부가적으로, 비디오 디코더 (30) 는 복구 포인트 픽처 (90N) 의 POC 카운트를 획득하기 위해 복구 포인트 SEI 메시지에 포함된 recovery_poc_cnt 신택스 엘리먼트의 값을 적용할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 복구 포인트 픽처 (90N) 의 POC 값을 획득하기 위해, GDR 픽처 (90A) 의 픽처 순서 카운트 (POC) 값에 recovery_poc_cnt 신택스 엘리먼트의 값을 가산할 수도 있다. GDR 세트 (90) 의 예에서, 비디오 디코더 (30) 는 recovery_poc_cnt 신택스 엘리먼트로부터 비디오 디코더 (30) 에 의해 도출된 POC 값을 갖는 픽처, 즉, 복구 포인트 픽처 (90N) 를 로케이팅할 수도 있다. 예를 들어, GDR 세트 (90) 가 네트워크 엘리먼트 (68) 에 의해 추출된 시간 서브세트에 포함되는 경우라도, GDR 세트는 여전히 복구 포인트 SEI 메시지에 의해 식별된 복구 포인트 픽처 (90N) 를 포함할 수도 있다. 다시 말해, GDR 세트 (90) 의 예에서, 복구 포인트 픽처 (90N) 는 시간 스케일링으로 인해 폐기되지 않았다.
recovery_poc_cnt 신택스 엘리먼트의 값을 사용하여 복구 포인트 픽처 (90N) 를 디코딩한 것에 기초하여, 비디오 디코더 (30) 는 복구 포인트 픽처 (90N) 가 리프레시된 영역에 속하는 것과, 복구 포인트 픽처 (90N) 가 GDR 세트 (90) 와 관련하여 lastPicInSet 인 것을 결정하도록 본 개시물의 기법들을 구현할 수도 있다.
도 5 는, 본 개시물의 하나 이상의 양태들에 따른, 시간 스케일링으로 인해 복구 포인트 픽처 (94N) 가 제거된 일 예시적인 점진적 디코딩 리프레시 (GDR) 세트 (94) 를 예시한 개념도이다. GDR 세트 (94) 는 첫 번째 GDR 픽처 (94A), GDR 세트 픽처 (94B), 하나 이상의 부가적인 GDR 세트 픽처들, 및 마지막 GDR 세트 픽처 (94M) 를 포함한다. GDR 세트 픽처들을 라벨링하는데 사용된 문자들은 GDR 세트에서의 특정 수의 픽처들을 나타내려고 의도된 것이 아니며, 라벨들로서 기능하려는 것이다. GDR 세트 (90) 에 대해 여기에 설명된 기법들이 다양한 디바이스들에 의해 수행될 수도 있지만, 단지 설명의 용이를 위해, 도 4 는 여기에서 도 1 및 도 3 의 비디오 디코더 (30) 에 대해 설명된다. GDR 세트 (94) 의 예에서, 네트워크 엘리먼트 (68) 는 시간 스케일링 동안 복구 포인트 SEI 메시지에서 식별된 복구 포인트 픽처 (예를 들어, SEI-식별된 복구 포인트 픽처 (94N)) 를 폐기하였을 수도 있다. SEI-식별된 복구 포인트 픽처 (94N) 는 SEI-식별된 복구 포인트 픽처 (94N) 가 보다 높은 시간 레이어에 존재하였지만, 비디오 디코더 (30) 에 의해 수신된 보다 낮은 시간 레이어에 존재하지 않음을 나타내기 위해 파선 경계들로 예시된다.
도 5 의 코딩된 비디오 시퀀스 (92) 의 예에서, 비디오 디코더 (30) 는 복구 포인트 SEI 메시지가 GDR 세트 (94) 의 복구 포인트 픽처로서 SEI-식별된 복구 포인트 픽처 (94N) 를 식별하는 것을 결정하도록 recovery_poc_cnt 를 사용할 수도 있다. 그러나, SEI-식별된 복구 포인트 픽처 (94N) 가 시간 스케일링 동안 폐기되었기 때문에, 비디오 디코더 (30) 는 수신된 시간 서브세트에서 SEI-식별된 복구 포인트 픽처 (94N) 를 로케이팅하는 것이 불가능할 수도 있다. 차례로, 비디오 디코더 (30) 는 GDR 세트 (94) 의 GDR 기반 디코딩을 지원하면서, 시간적으로 스케일러블한 비트스트림들을 지원하도록 본 개시물이 하나 이상의 기법들을 구현할 수도 있다.
예를 들어, 비디오 디코더 (30) 는 SEI-식별된 복구 포인트 픽처 (94N) 에 대해 도출된 POC 값보다 더 큰 POC 값을 갖는, 코딩된 비디오 시퀀스 (92) 의, 디코딩 순서의 첫 번째 픽처를 로케이팅할 수도 있다. 부가적으로, 비디오 디코더 (30) 는 GDR 세트 (94) 에 대해 복구 포인트 픽처로서 로케이팅된 픽처를 식별하도록 여기에 설명된 하나 이상의 기법들을 구현할 수도 있다. 도 5 의 예에서, 비디오 디코더 (30) 는 SEI-식별된 복구 포인트 픽처 (94N) 의 POC 값보다 더 큰 POC 값을 갖는 코딩된 비디오 시퀀스 (92) 의 첫 번째 픽처로서 복구 포인트 픽처 (96) 를 식별할 수도 있다. 예를 들어, GDR 세트 (94) 에 대해 복구 포인트 픽처로서 복구 포인트 픽처 (96) 를 식별함으로써, 비디오 디코더 (30) 는, 코딩된 비디오 시퀀스 (92) 를 디코딩함에 있어서 랜덤 액세스와 에러 회복력을 위해, 복구 포인트 픽처 (96) 전체가 리프레시된 영역에 속하는 것을 결정할 수도 있다.
부가적으로, 비디오 디코더 (30) 는, GDR 세트 (94) 의 lastPicInSet 로서, 코딩된 비디오 시퀀스 (92) 에서 복구 포인트 픽처 (96) 의 바로 앞에 선행하는 픽처를 식별할 수도 있다. 예를 들어, 코딩된 비디오 시퀀스 (92) 에서 SEI-식별된 복구 포인트 픽처 (94N) 를 로케이팅하는 것이 불가능한 것에 응답하여, 비디오 디코더 (30) 는 GDR 세트 (94) 의 lastPicInSet 로서 last_picture_in_GDR_set (94M) 를 식별하도록 본 개시물의 기법들을 구현할 수도 있다. 이 예에서, 비디오 디코더 (30) 는, GDR 세트 (94) 에 대한 lastPicInSet (94M) 및 복구 포인트 픽처 (96) 로서, 코딩된 비디오 시퀀스 (92) 내에서 디코딩 순서로 연속적인 2개의 개별적인 픽처들을 식별할 수도 있다. 부가적으로, 이 예에서, 비디오 디코더 (30) 에 의해 식별된 복구 포인트 픽처는 GDR 세트 (94) 에 포함되지 않을 수도 있다. 도 5 는, SEI-식별된 복구 포인트 픽처 (94N) 가 시간 스케일링으로 인해 폐기된 경우라도, 비디오 디코더 (30) 가 GDR 세트 (94) 에 대한 lastPicInSet 및 복구 포인트 픽처를 식별하도록 본 개시물의 기법들을 구현할 수도 있는 하나의 예를 예시한다. 이러한 방식으로, 도 5 는, 비디오 디코더 (30) 가 HEVC WD9 에 설명된 바와 같이 GDR 에 따라 GDR 세트 (94) 를 디코딩하면서, 인코딩된 비디오 비트스트림들의 시간 스케일러빌리티를 지원하도록 본 개시물의 기법들을 구현할 수도 있는 일 예를 예시한다.
도 6 은, 본 개시물의 하나 이상의 양태들에 따른, 비디오 디코더 (30) 및/또는 그의 컴포넌트들이 인코딩된 비디오 데이터를 디코딩하도록 수행될 수도 있는 일 예시적인 프로세스 (100) 를 예시한 플로차트이다. 프로세스 (100) 는 수신된 인코딩된 비디오 비트스트림에서 복구 포인트 SEI 메시지를 검출한다 (102). 예를 들어, 비디오 디코더 (30) 는 GDR 액세스 유닛에서 복구 포인트 SEI 메시지를 검출할 수도 있고, 이 GDR 액세스 유닛은 또한 GDR 세트의 첫 번째 GDR 픽처와 같은 인코딩된 GDR 픽처와 연관된 데이터를 포함한다. GDR 액세스 유닛에서 복구 포인트 SEI 메시지를 검출한 것에 기초하여, 비디오 디코더 (30) 는 GDR 액세스 유닛에 포함된 GDR 픽처가 GDR 세트의 첫 번째 픽처를 형성하는 것을 결정할 수도 있다.
부가적으로, 비디오 디코더 (30) 는 복구 포인트 SEI 메시지에서 식별된 복구 포인트 픽처가 수신된 인코딩된 비디오 비트스트림에 포함되는지 여부를 결정할 수도 있다 (104). 예를 들어, 비디오 디코더 (30) 는 SEI-식별된 복구 포인트 픽처의 POC 값을 획득하기 위해, GDR 픽처의 POC 값에 복구 포인트 SEI 메시지의 recovery_poc_cnt 신택스 엘리먼트의 값을 가산할 수도 있다. 하나의 예에서, 비디오 디코더는 시퀀스의 픽처가 도출된 POC 값을 갖는지 여부를 결정하기 위해, 수신된 코딩된 비디오 시퀀스를 횡단하도록 도출된 POC 값을 사용할 수도 있다. 예를 들어, 비디오 디코더 (30) 는 디코딩 순서로 코딩된 비디오 시퀀스를 횡단할 수도 있다. 이 예에서, 비디오 디코더 (30) 가 도출된 POC 값을 갖는 픽처에 도달하는 경우, 비디오 디코더 (30) 는 SEI-식별된 복구 포인트 픽처가 수신된 코딩된 비디오 시퀀스에 포함되는 것을 결정할 수도 있다. 한편, 이 예에서, 비디오 디코더 (30) 가 도출된 POC 값보다 더 큰 POC 값을 갖는 픽처에 도달하지만, 도출된 POC 값을 갖는 픽처를 아직 로케이팅하지 않았다면, 비디오 디코더 (30) 는 SEI-식별된 복구 포인트 픽처가 수신된 인코딩된 비디오 비트스트림에 포함되지 않는 것을 결정할 수도 있다.
비디오 디코더 (30) 가 SEI-식별된 복구 포인트 픽처가 수신된 비트스트림에 포함되는 것을 결정하는 경우 (104 의 '예' 브랜치), 비디오 디코더는 GDR 세트 (lastPicInSet) 에서의 마지막 픽처로서 그리고 GDR 세트에 대한 복구 포인트 픽처로서 그 양쪽으로서 SEI-식별된 복구 포인트 픽처를 식별할 수도 있다 (106). 이 시나리오에서, 비디오 디코더 (30) 는 lastPicInSet 및 복구 포인트 픽처가 동일한 픽처인 것과, 복구 포인트 픽처가 GDR 세트에 포함되는 것을 결정할 수도 있다.
한편, 비디오 디코더 (30) 가 SEI-식별된 복구 포인트 픽처가 수신된 비디오 비트스트림에 포함되지 않는 것을 결정한다면 (104 의 '아니오' 브랜치), 비디오 디코더 (30) 는 GDR 세트에 대한 복구 포인트 픽처로서, SEI-식별된 복구 포인트 픽처에 후속하는 픽처를 식별할 수도 있다 (108). 예를 들어, 비디오 디코더 (30) 는 SEI-식별된 복구 포인트 픽처에 대해 도출된 POC 값보다 더 큰 POC 값을 갖는 수신된 비디오 비트스트림의, 디코딩 순서의, 첫 번째 픽처로서 복구 픽처를 식별할 수도 있다.
부가적으로, 이 시나리오에서, 비디오 디코더 (30) 는, GDR 세트의 lastPicInSet 로서, 디코딩 순서로 식별된 복구 포인트 픽처의 바로 앞에 선행하는 수신된 코딩된 비디오 시퀀스의 픽처, 즉, SEI-식별된 복구 포인트 픽처에 대해 도출된 POC 값보다 더 작은 POC 값을 갖는 마지막 픽처를 식별할 수도 있다 (110). 이 예에서, 비디오 디코더 (30) 는, GDR 세트에 대한 lastPicInSet 및 복구 포인트 픽처로서, 디코딩 순서로 연속적인 2개의 개별적인 픽처들을 식별할 수도 있다. 부가적으로, 이 예에서, 비디오 디코더 (30) 는 lastPicInSet 가 GDR 세트에 포함되는 것과, 복구 포인트 픽처가 GDR 세트에 포함되지 않는 것을 결정할 수도 있다. 예를 들어, 비디오 디코더 (30) 는, 복구 포인트 픽처가, 수신된 인코딩된 비디오 비트스트림에서 GDR 세트에 후속하는, 디코딩 순서의, 첫 번째 픽처인 것을 결정할 수도 있다.
이러한 방식으로, 비디오 디코더 (30) 는 비디오 데이터를 디코딩하기 위한 디바이스의 일 예일 수도 있고, 이 디바이스는 인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하는 수단, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하는 수단, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 수단, 및 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하는 수단을 포함한다.
일부 예들에서, 이 디바이스는 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 GDR 세트의 마지막 픽처로서 식별하는 수단, 및 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처들 중 하나를 GDR 세트의 마지막 픽처로서 식별하는 수단을 더 포함할 수도 있다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 첫 번째 픽처의 POC 값보다 더 크다.
일부 예들에서, 메시지는 복구 포인트 보충 강화 정보 (SEI) 메시지를 포함한다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 첫 번째 픽처의 POC 값보다 더 크다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값을 나타내는 정보는, 첫 번째 픽처의 POC 값과 복구 포인트 픽처의 POC 값 사이의 차이를 나타내는 정보를 포함한다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값을 나타내는 정보는 복구 포인트 픽처의 POC 값을 포함한다. 일부 예들에서, 이 디바이스는 디코딩 순서로 식별된 복구 포인트 픽처에 후속하는 하나 이상의 픽처들 및 식별된 복구 포인트 픽처에 대해 랜덤 액세스 디코딩을 수행하는 수단을 더 포함할 수도 있다.
부가적으로, 이러한 방식으로, 도 1 의 목적지 디바이스 (14) 는, 실행될 때, 컴퓨팅 디바이스의 프로세서로 하여금, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하게 하고, 인코딩된 비디오 비트스트림으로부터 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하게 하고, 디코딩 순서로 첫 번째 픽처에 후속하는 픽처가 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하게 하며, 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 복구 포인트 픽처로서 식별하게 하는 명령들이 저장된 컴퓨터 판독가능 저장 매체를 포함하거나 그 컴퓨터 판독가능 저장 매체에 커플링된 컴퓨팅 디바이스의 일 예일 수도 있다.
일부 예들에서, 컴퓨터 판독가능 저장 매체는, 실행될 때, 또한 컴퓨팅 디바이스의 프로세서로 하여금, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 GDR 세트의 마지막 픽처로서 식별하게 하고, 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 것에 응답하여, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처들 중 하나를 GDR 세트의 마지막 픽처로서 식별하게 하는 저장된 명령들을 가질 수도 있다. 일부 예들에서, 메시지는 복구 포인트 보충 강화 정보 (SEI) 메시지를 포함한다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 첫 번째 픽처의 POC 값보다 더 크다.
일부 예들에서, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예에서, SEI 메시지는 영역 리프레시 SEI 메시지를 포함한다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값을 나타내는 정보는, 첫 번째 픽처의 POC 값과 복구 포인트 픽처의 POC 값 사이의 차이를 나타내는 정보를 포함한다. 일부 예들에 따르면, 복구 포인트 픽처의 POC 값을 나타내는 정보는 복구 포인트 픽처의 POC 값을 포함한다. 일부 예들에서, 컴퓨터 판독가능 저장 매체는, 실행될 때, 또한 컴퓨팅 디바이스의 프로세서로 하여금, 디코딩 순서로 식별된 복구 포인트 픽처에 후속하는 하나 이상의 픽처들 및 식별된 복구 포인트 픽처에 대해 랜덤 액세스 디코딩을 수행하게 하는 저장된 명령들을 가질 수도 있다.
도 7 은, 본 개시물의 하나 이상의 양태들에 따른, 비디오 디코더 (30) 및/또는 그의 컴포넌트들이 인코딩된 비디오 데이터를 디코딩하도록 수행할 수도 있는 일 예시적인 프로세스 (120) 를 예시한 플로차트이다. 프로세스 (120) 는 비디오 디코더 (30) 가 인코딩된 비디오 비트스트림에서 하나 이상의 인코딩된 픽처들의 세트를 수신할 때 (122) 시작할 수도 있다. 다양한 예들에서, 인코딩된 픽처들의 수신된 세트는 GDR 세트를 포함하거나, GDR 세트이거나, 또는 GDR 세트의 부분일 수도 있다.
비디오 디코더 (30) 는 수신된 세트의 현재 픽처가 GDR 세트의 lastPicInSet 라는 것과, 복구 포인트 픽처라는 것 양쪽을 검출할 수도 있다 (124). 하나의 예로서, 비디오 디코더 (30) 는 현재 픽처가 인코딩된 비디오 비트스트림에서 가장 최근에 수신된 복구 포인트 SEI 메시지에 의해 나타낸 POC 값과 매칭하는 POC 값을 갖는 것을 결정할 수도 있다. 이 예에서, 가장 최근에 수신된 복구 포인트 SEI 메시지에서 나타낸 POC 값과 매칭하는 현재 픽처의 POC 값에 기초하여, 비디오 디코더 (30) 는 현재 픽처가 복구 포인트 픽처뿐만 아니라 GDR 세트의 lastPicInSet 양쪽인 것을 결정할 수도 있다.
부가적으로, 비디오 디코더 (30) 는, 수신된 영역 리프레시 SEI 메시지가, 현재 픽처를 포함하는 AU 의 첫 번째 슬라이스 세그먼트에 대해, 1 의 값으로 설정된 refreshed_region_flag 를 포함하는 것을 결정할 수도 있다 (126). 예를 들어, 비디오 디코더 (30) 는 현재 픽처의 각각의 슬라이스 세그먼트에 대응하는 refreshed_region_flag 를 획득하기 위해 현재 픽처와 연관된 영역 리프레시 SEI 메시지를 디코딩할 수도 있다. 일부 예들에서, 비디오 디코더 (30) 는 영역 리프레시 SEI 메시지를 디코딩하여, 순차적인 슬라이스 순서로, 즉, AU 의 첫 번째 슬라이스를 디코딩하는 것으로 시작한 후에 AU 의 두 번째 슬라이스를 디코딩하는 것 등을 하여, AU 의 refreshed_region_flag들을 획득할 수도 있다. 그 결과, AU 의 refreshed_region_flag들을 순차적으로 획득하는 예들에서, 비디오 디코더 (30) 는 AU 의 나머지 슬라이스 세그먼트들에 대한 refreshed_region_flag들을 획득하기 전에 첫 번째 슬라이스 세그먼트에 대한 refreshed_region_flag 를 획득할 수도 있다.
현재 픽처가 lastPicInSet 및 복구 포인트 픽처인 것을 결정하는 것 (124) 그리고 AU 의 첫 번째 슬라이스에 대한 refreshed_region_flag 가 1 의 값으로 설정되는 것 (126) 에 기초하여, 비디오 디코더 (30) 는 영역 리프레시 SEI 메시지가 AU 의 모든 나머지 슬라이스들에 대해 1 의 값으로 설정된 refreshed_region_flag들을 포함하는 것을 결정할 수도 있다 (128). 예를 들어, 1 의 값으로 설정되는 AU 의 첫 번째 슬라이스에 기초하여, 그리고 현재 픽처가 lastPicInSet 및 복구 포인트 픽처인 것을 결정한 것에 기초하여, 비디오 디코더 (30) 는 현재 픽처가 완전히 리프레시된 픽처인 것을 결정할 수도 있다. 다시 말해, 이 예에서, 비디오 디코더 (30) 는 현재 픽처 전체가 현재 픽처의 리프레시된 영역에 속하는 것을 결정할 수도 있다. 차례로, 현재 픽처가 완전히 리프레시된 픽처인 것을 결정한 것에 기초하여, 비디오 디코더 (30) 는 1 의 값으로 설정되는 AU 의 모든 슬라이스들에 대응하는 refreshed_region_flag들의 값을 추론할 수도 있다.
이러한 방식으로, 비디오 디코더 (30) 는, 비디오 디코더 (30) 가 현재 픽처가 완전히 리프레시되는 것을 결정하는 경우들에서, (현재 픽처를 포함하는 AU 에 대해) 영역 리프레시 SEI 메시지에 포함된 모든 refreshed_region_flag들의 값들이 1 의 값으로 설정되는 것을 결정하도록 본 개시물의 기법들을 구현할 수도 있다. 예를 들어, 비디오 디코더는 AU 의 첫 번째 슬라이스에 대한 refreshed_region_flag 를 디코딩하여 1의 값을 획득할 수도 있다. 첫 번째 슬라이스에 대한 refreshed_region_flag 의 값이 1 의 값을 갖는 것과, 현재 픽처가 lastPicInSet 및 복구 포인트 픽처인 것에 기초하여, 비디오 디코더 (30) 는 AU 의 나머지 슬라이스들의 refreshed_region_flag들의 값들을 1 의 값들을 갖는 것으로 추론하여, 완전히 리프레시된 픽처를 나타낼 수도 있다. 완전히 리프레시된 픽처의 경우 remaining refreshed_region_flag들의 값들을 1 의 값들을 갖는 것으로 추론함으로써, 비디오 디코더 (30) 는 디코딩 프로세스에서 컴퓨팅 리소스들을 절약하면서, 완전히 리프레시된 픽처에 대한 디코딩 정확도를 유지시킬 수도 있다.
이러한 방식으로, 비디오 디코더 (30) 는 비디오 데이터를 디코딩하기 위한 디바이스의 일 예일 수도 있고, 이 디바이스는 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하는 수단, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하는 수단, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하는 수단, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하는 수단, 및 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타낸다는 결정에 기초하여 픽처를 디코딩하는 수단을 포함한다. 일부 예들에서, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예에서, SEI 메시지는 영역 리프레시 SEI 메시지를 포함한다.
일부 예들에서, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하는 수단은, 영역 리프레시 SEI 메시지와 연관된 refreshed_region_flag 신택스 엘리먼트가 1 의 값을 갖는 것을 결정하는 수단을 포함한다. 하나의 이러한 예에서, refreshed_region_flag 신택스 엘리먼트는 픽처를 포함하는 액세스 유닛 (AU) 의 첫 번째 슬라이스 세그먼트와 연관되고, 리프레시된 영역에 전체 픽처가 속하는 것을 결정하는 수단은, AU 의 첫 번째 슬라이스 세그먼트와는 상이한 AU 의 각각의 슬라이스 세그먼트가 대응하는 refreshed_region_flag 신택스 엘리먼트와 연관되는 것을 결정하는 수단을 더 포함한다.
부가적으로, 이러한 방식으로, 도 1 의 목적지 디바이스 (14) 는, 실행될 때, 컴퓨팅 디바이스의 프로세서로 하여금, 픽처와 연관된 메시지에서, 픽처의 리프레시된 영역을 나타내는 정보를 수신하게 하고, 픽처가 점진적 디코더 리프레시 (GDR) 세트에서의 마지막 픽처를 포함하는지 여부를 결정하게 하고, 픽처가 복구 포인트 픽처를 포함하는지 여부를 결정하게 하고, 픽처가 GDR 세트에서의 마지막 픽처 및 복구 포인트 픽처를 포함한다는 결정에 응답하여, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하게 하며, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타낸다는 결정에 기초하여 픽처를 디코딩하게 하는 명령들이 저장된 컴퓨터 판독가능 저장 매체를 포함하거나 그 컴퓨터 판독가능 저장 매체에 커플링된 컴퓨팅 디바이스의 일 예일 수도 있다. 일부 예들에서, 메시지는 보충 강화 정보 (SEI) 메시지를 포함한다. 하나의 이러한 예에서, SEI 메시지는 영역 리프레시 SEI 메시지를 포함한다.
일부 예들에서, 컴퓨팅 디바이스의 프로세서로 하여금, 메시지가 픽처의 리프레시된 영역에 전체 픽처가 속함을 나타내는 것을 결정하게 하는 명령들은, 컴퓨팅 디바이스의 프로세서로 하여금, 영역 리프레시 SEI 메시지와 연관된 refreshed_region_flag 신택스 엘리먼트가 1 의 값을 갖는 것을 결정하게 하는 명령들을 포함한다. 하나의 이러한 예에서, refreshed_region_flag 신택스 엘리먼트는 픽처를 포함하는 액세스 유닛 (AU) 의 첫 번째 슬라이스 세그먼트와 연관되고, 컴퓨팅 디바이스의 프로세서로 하여금, 리프레시된 영역에 전체 픽처가 속하는 것을 결정하게 하는 명령들은, 컴퓨팅 디바이스의 프로세서로 하여금, AU 의 첫 번째 슬라이스 세그먼트와는 상이한 AU 의 각각의 슬라이스 세그먼트가 대응하는 refreshed_region_flag 신택스 엘리먼트와 연관되는 것을 결정하게 하는 명령들을 더 포함한다.
하나 이상의 예들에서는, 설명된 기능들이 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합으로 구현될 수도 있다. 소프트웨어로 구현된 경우, 그 기능들은 컴퓨터 판독가능 매체 상에 하나 이상의 명령들 또는 코드로서 저장되거나 송신될 수도 있고 하드웨어 기반 프로세싱 유닛에 의해 실행될 수도 있다. 컴퓨터 판독가능 매체들은, 데이터 저장 매체들과 같은 유형의 매체에 대응하는 컴퓨터 판독가능 저장 매체들, 다양한 컴퓨터 판독가능 저장 디바이스들, 또는, 예를 들어, 통신 프로토콜에 따라, 일 장소로부터 다른 장소로의 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하는 통신 매체들을 포함할 수도 있다. 이러한 방식으로, 컴퓨터 판독가능 매체들은 일반적으로 (1) 비일시적인 유형의 컴퓨터 판독가능 저장 매체들 또는 (2) 신호 또는 캐리어 파와 같은 통신 매체에 대응할 수도 있다. 데이터 저장 매체들은, 본 개시물에 설명된 기법들의 구현을 위해 명령들, 코드 및/또는 데이터 구조들을 취출하기 위해 하나 이상의 컴퓨터들 또는 하나 이상의 프로세서들에 의해 액세스될 수 있는 임의의 가용 매체들일 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독가능 매체를 포함할 수도 있다.
제한이 아닌 예로서, 이러한 컴퓨터 판독가능한 저장 매체들은 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 저장, 자기 디스크 저장, 또는 다른 자기 저장 디바이스들, 플래시 메모리, 또는 명령들 또는 데이터 구조들의 형태로 원하는 프로그램 코드를 저장하기 위해 사용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 맥락이 컴퓨터 판독가능한 매체라고 적절히 칭해진다. 예를 들어, 동축 케이블, 광섬유 케이블, 트위스트 페어 (twisted pair), 디지털 가입자 회선 (digital subscriber line; DSL), 또는 무선 기술들 예컨대 적외선, 라디오 (radio), 및 마이크로파 (microwave) 를 사용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 명령들이 송신되는 경우, 동축 케이블, 광섬유 케이블, 트위스트 페어, DSL, 또는 무선 기술들 예컨대 적외선, 라디오, 및 마이크로파는 매체의 정의 내에 포함된다. 그러나, 컴퓨터 판독가능 저장 매체들 및 데이터 저장 매체들은 연결들, 캐리어 파들, 신호들, 또는 다른 순시적 매체들을 포함하는 것이 아니라, 그 대신에 비-순시적인, 유형의 저장 매체들에 관한 것이라는 것을 이해해야 한다. 여기에 사용된 바와 같은 디스크 (disk) 및 디스크 (disc) 는 콤팩트 디스크 (compact disc; CD), 레이저 디스크 (laser disc), 광학 디스크 (optical disc), 디지털 다기능 디스크 (digital versatile disc; DVD), 플로피 디스크 (floppy disk) 및 블루-레이 디스크 (Blu-ray disc) 를 포함하고, 여기서 디스크 (disk) 들은 통상 데이터를 자기적으로 재생하는 한편, 디스크 (disc) 들은 데이터를 레이저들로 광학적으로 재생한다. 상기의 조합들은 컴퓨터 판독가능 매체들의 범위 내에 또한 포함되어야 한다.
명령들은 하나 이상의 디지털 신호 프로세서 (DSP) 들, 범용 마이크로프로세서들, 주문형 집적 회로 (ASIC) 들, 필드 프로그래밍가능 로직 어레이 (FPGA) 들, 또는 다른 동등한 집적 또는 이산 로직 회로부와 같은 하나 이상의 프로세서들에 의해 실행될 수도 있다. 이에 따라, 여기에 사용된 바와 같은 용어 "프로세서" 는 상기한 구조, 또는 여기에 설명된 기법들의 구현에 적합한 임의의 다른 구조 중 임의의 것을 지칭할 수도 있다. 부가적으로, 일부 양태들에서는, 여기에 설명된 기능성이 인코딩 및 디코딩을 위해 구성되거나 조합된 코덱 내에 포함되는 전용 하드웨어 및/또는 소프트웨어 모듈들 내에 제공될 수도 있다. 또한, 기법들은 하나 이상의 회로들 또는 로직 엘리먼트들에서 완전히 구현될 수 있다.
본 개시물의 기법들은 무선 핸드셋, 집적 회로 (IC) 또는 IC들의 세트 (예를 들어, 칩셋) 를 포함하는 광범위한 디바이스들 또는 장치들에서 구현될 수도 있다. 다양한 컴포넌트들, 모듈들, 또는 유닛들은 개시된 기법들을 수행하도록 구성된 디바이스들의 기능적 양태들을 강조하기 위해 본 개시물에 설명되지만, 상이한 하드웨어 유닛들에 의한 실현을 반드시 요구하지는 않는다. 오히려, 상술된 바와 같이, 다양한 유닛들은 코덱 하드웨어 유닛에 조합될 수도 있거나, 또는 적합한 소프트웨어 및/또는 펌웨어와 함께, 상술된 하나 이상의 프로세서들을 포함하는 상호동작하는 하드웨어 유닛들의 콜렉션에 의해 제공될 수도 있다.
다양한 예들이 설명되었다. 이러한 그리고 다른 예들은 다음의 청구항들의 범위 내에 있다.

Claims (20)

  1. 비디오 데이터를 디코딩하는 방법으로서,
    인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하는 단계;
    상기 인코딩된 비디오 비트스트림으로부터 상기 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (gradual decoder refresh; GDR) 세트의 복구 포인트 픽처의 픽처 순서 카운트 (picture order count; POC) 값을 나타내는 정보를 수신하는 단계;
    디코딩 순서로 상기 첫 번째 픽처에 후속하는 픽처가 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 단계; 및
    상기 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 상기 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 상기 복구 포인트 픽처로서 식별하는 단계
    를 포함하는, 비디오 데이터를 디코딩하는 방법.
  2. 제 1 항에 있어서,
    상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 상기 복구 포인트 픽처로서 식별하는 단계에 응답하여, 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 상기 GDR 세트의 마지막 픽처로서 식별하는 단계; 및
    상기 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처를 상기 복구 포인트 픽처로서 식별하는 단계에 응답하여, 상기 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처들 중 하나를 상기 GDR 세트의 마지막 픽처로서 식별하는 단계
    를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  3. 제 1 항에 있어서,
    상기 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 상기 첫 번째 픽처의 POC 값보다 더 큰, 비디오 데이터를 디코딩하는 방법.
  4. 제 1 항에 있어서,
    상기 메시지는 보충 강화 정보 (supplemental enhancement information; SEI) 메시지를 포함하는, 비디오 데이터를 디코딩하는 방법.
  5. 제 4 항에 있어서,
    상기 SEI 메시지는 복구 포인트 SEI 메시지를 포함하는, 비디오 데이터를 디코딩하는 방법.
  6. 제 1 항에 있어서,
    상기 복구 포인트 픽처의 POC 값을 나타내는 정보는, 상기 첫 번째 픽처의 POC 값과 상기 복구 포인트 픽처의 POC 값 사이의 차이를 나타내는 정보를 포함하는, 비디오 데이터를 디코딩하는 방법.
  7. 제 1 항에 있어서,
    상기 복구 포인트 픽처의 POC 값을 나타내는 정보는 상기 복구 포인트 픽처의 POC 값을 포함하는, 비디오 데이터를 디코딩하는 방법.
  8. 제 1 항에 있어서,
    디코딩 순서로 식별된 상기 복구 포인트 픽처에 후속하는 하나 이상의 픽처들 및 식별된 상기 복구 포인트 픽처에 대해 랜덤 액세스 디코딩을 수행하는 단계를 더 포함하는, 비디오 데이터를 디코딩하는 방법.
  9. 비디오 데이터를 디코딩하기 위한 디바이스로서,
    상기 디바이스는,
    인코딩된 비디오 데이터를 저장하도록 구성된 메모리; 및
    비디오 디코더
    를 포함하고,
    상기 비디오 디코더는,
    상기 인코딩된 비디오 데이터의 복수의 픽처들을 수신하고;
    상기 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지에서, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하고;
    디코딩 순서로 상기 첫 번째 픽처에 후속하는 픽처가 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하며;
    상기 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 상기 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 상기 복구 포인트 픽처로서 식별하도록
    구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
  10. 제 9 항에 있어서,
    비디오 코더는 또한,
    상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 상기 복구 포인트 픽처로서 식별하는 것에 응답하여, 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 상기 GDR 세트의 마지막 픽처로서 식별하고;
    상기 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처를 상기 복구 포인트 픽처로서 식별하는 것에 응답하여, 상기 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처들 중 하나를 상기 GDR 세트의 마지막 픽처로서 식별하도록
    구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
  11. 제 9 항에 있어서,
    상기 복구 포인트 픽처의 POC 값보다 더 작은 POC 값을 갖는 픽처의 POC 값은 상기 첫 번째 픽처의 POC 값보다 더 큰, 비디오 데이터를 디코딩하기 위한 디바이스.
  12. 제 9 항에 있어서,
    상기 메시지는 보충 강화 정보 (SEI) 메시지를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
  13. 제 12 항에 있어서,
    상기 SEI 메시지는 복구 포인트 SEI 메시지를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
  14. 제 9 항에 있어서,
    상기 복구 포인트 픽처의 POC 값을 나타내는 정보는, 상기 첫 번째 픽처의 POC 값과 상기 복구 포인트 픽처의 POC 값 사이의 차이를 나타내는 정보를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
  15. 제 9 항에 있어서,
    상기 복구 포인트 픽처의 POC 값을 나타내는 정보는 상기 복구 포인트 픽처의 POC 값을 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
  16. 제 15 항에 있어서,
    비디오 코더는 또한, 디코딩 순서로 식별된 상기 복구 포인트 픽처에 후속하는 하나 이상의 픽처들 및 식별된 상기 복구 포인트 픽처에 대해 랜덤 액세스 디코딩을 수행하도록 구성되는, 비디오 데이터를 디코딩하기 위한 디바이스.
  17. 명령들을 저장한 컴퓨터 판독가능 저장 매체로서,
    상기 명령들은, 실행될 때, 컴퓨팅 디바이스의 프로세서로 하여금,
    인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하게 하고;
    상기 인코딩된 비디오 비트스트림으로부터 상기 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하게 하고;
    디코딩 순서로 상기 첫 번째 픽처에 후속하는 픽처가 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하게 하며;
    상기 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 상기 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 상기 복구 포인트 픽처로서 식별하게 하는, 컴퓨터 판독가능 저장 매체.
  18. 제 17 항에 있어서,
    상기 메시지는 복구 포인트 보충 강화 정보 (SEI) 메시지를 포함하는, 컴퓨터 판독가능 저장 매체.
  19. 비디오 데이터를 디코딩하기 위한 디바이스로서,
    인코딩된 비디오 비트스트림으로부터 복수의 픽처들을 수신하는 수단;
    상기 인코딩된 비디오 비트스트림으로부터 상기 복수의 픽처들 중 첫 번째 픽처와 연관된 메시지, 점진적 디코더 리프레시 (GDR) 세트의 복구 포인트 픽처의 POC 값을 나타내는 정보를 수신하는 수단;
    디코딩 순서로 상기 첫 번째 픽처에 후속하는 픽처가 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 가질 때, 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖는 픽처를 복구 포인트 픽처로서 식별하는 수단; 및
    상기 첫 번째 픽처에 후속하는 픽처들 중 어떤 것도 상기 복구 포인트 픽처의 POC 값과 동일한 POC 값을 갖지 않을 때, 상기 복구 포인트 픽처의 POC 값보다 더 큰 POC 값을 갖는 픽처들 중 하나를 상기 복구 포인트 픽처로서 식별하는 수단
    을 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
  20. 제 19 항에 있어서,
    상기 메시지는 복구 포인트 보충 강화 정보 (SEI) 메시지를 포함하는, 비디오 데이터를 디코딩하기 위한 디바이스.
KR1020157020825A 2013-01-07 2014-01-07 비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시 KR101841333B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361749880P 2013-01-07 2013-01-07
US61/749,880 2013-01-07
US14/147,973 2014-01-06
US14/147,973 US9571847B2 (en) 2013-01-07 2014-01-06 Gradual decoding refresh with temporal scalability support in video coding
PCT/US2014/010482 WO2014107721A1 (en) 2013-01-07 2014-01-07 Gradual decoding refresh with temporal scalability support in video coding

Publications (2)

Publication Number Publication Date
KR20150105373A true KR20150105373A (ko) 2015-09-16
KR101841333B1 KR101841333B1 (ko) 2018-03-22

Family

ID=51060942

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020157020825A KR101841333B1 (ko) 2013-01-07 2014-01-07 비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시
KR1020157020826A KR101741348B1 (ko) 2013-01-07 2014-01-07 비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020157020826A KR101741348B1 (ko) 2013-01-07 2014-01-07 비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시

Country Status (10)

Country Link
US (2) US9571847B2 (ko)
EP (2) EP2941878B1 (ko)
JP (2) JP6242913B2 (ko)
KR (2) KR101841333B1 (ko)
CN (2) CN104885460B (ko)
DK (2) DK2941878T3 (ko)
ES (2) ES2833149T3 (ko)
HU (2) HUE049430T2 (ko)
TW (2) TWI566585B (ko)
WO (2) WO2014107723A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020184999A1 (ko) * 2019-03-12 2020-09-17 현대자동차주식회사 영상 부호화 및 복호화 방법 및 장치
WO2021201559A1 (ko) * 2020-04-01 2021-10-07 엘지전자 주식회사 Gdr에 대한 리커버리 포인트 관련 정보의 시그널링 기반 영상 또는 비디오 코딩
WO2023132623A1 (ko) * 2022-01-05 2023-07-13 주식회사 케이티 비디오 신호 부호화/복호화 방법, 그리고 비트스트림을 저장한 기록 매체

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9571847B2 (en) 2013-01-07 2017-02-14 Qualcomm Incorporated Gradual decoding refresh with temporal scalability support in video coding
EP3092806A4 (en) * 2014-01-07 2017-08-23 Nokia Technologies Oy Method and apparatus for video coding and decoding
US20170013274A1 (en) * 2015-07-09 2017-01-12 Microsoft Technology Licensing, Llc Intra-refresh for video streaming
EP3836541A4 (en) * 2018-08-06 2022-06-22 Sharp Kabushiki Kaisha MOVING PICTURE DECODING APPARATUS AND MOVING PICTURE CODING APPARATUS
US10630976B2 (en) * 2018-08-17 2020-04-21 Qualcomm Incorporated Display refresh blocks determination for video coding
GB201817784D0 (en) * 2018-10-31 2018-12-19 V Nova Int Ltd Methods,apparatuses, computer programs and computer-readable media
SG11202104942TA (en) * 2018-11-27 2021-06-29 Op Solutions Llc Adaptive block update of unavailable reference frames using explicit and implicit signaling
CN111279694A (zh) * 2018-11-28 2020-06-12 深圳市大疆创新科技有限公司 Gdr码流编码方法、终端设备、机器可读存储介质
US10972755B2 (en) * 2018-12-03 2021-04-06 Mediatek Singapore Pte. Ltd. Method and system of NAL unit header structure for signaling new elements
BR112021012096A2 (pt) 2018-12-20 2021-09-08 Telefonaktiebolaget Lm Ericsson (Publ) Métodos para decodificar e codificar um fluxo contínuo de bits, portadora, e, aparelhos de decodificação e codificação para decodificar e codificar um fluxo contínuo de bits
CN113557733A (zh) * 2019-03-11 2021-10-26 华为技术有限公司 视频译码中的逐步解码刷新
PL3910952T3 (pl) * 2019-04-23 2023-10-30 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Sposób dekodowania obrazu, dekoder i nośnik danych
MX2021013535A (es) 2019-05-06 2022-01-31 Huawei Tech Co Ltd Señalización de punto de recuperación en codificación de video.
EP3973702A1 (en) * 2019-05-22 2022-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder and decoder, encoding method and decoding method for drift-free padding and hashing of independent coding regions
US11457242B2 (en) * 2019-06-24 2022-09-27 Qualcomm Incorporated Gradual random access (GRA) signalling in video coding
WO2021044974A1 (ja) * 2019-09-06 2021-03-11 株式会社ソニー・インタラクティブエンタテインメント 送信装置、受信装置、送信方法、受信方法及びプログラム
EP4026095A4 (en) * 2019-09-24 2023-01-25 Huawei Technologies Co., Ltd. IMAGE HEADER SIGNALING IN VIDEO ENCODING
CN114930825A (zh) 2019-12-26 2022-08-19 字节跳动有限公司 用于在编解码图片中实现解码顺序的技术
EP4082200A4 (en) * 2019-12-27 2023-07-05 Alibaba Group Holding Limited METHODS AND SYSTEMS FOR PERFORMING PROGRESSIVE DECODING REFRESH PROCESSING ON IMAGES
EP4117291A4 (en) * 2020-03-05 2024-03-27 LG Electronics, Inc. METHOD AND DEVICE FOR CODING/DECODING VIDEOS WITH MIXED UNITS AND METHOD FOR TRANSMITTING BIT STREAMS
WO2021188453A1 (en) 2020-03-16 2021-09-23 Bytedance Inc. Gradual decoding refresh access unit in scalable video coding
US20230164334A1 (en) * 2020-04-11 2023-05-25 Lg Electronics Inc. Image decoding method and device for same
CN115668924A (zh) 2020-05-21 2023-01-31 字节跳动有限公司 参考图片信息的约束

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040260827A1 (en) * 2003-06-19 2004-12-23 Nokia Corporation Stream switching based on gradual decoder refresh
JP4578326B2 (ja) * 2005-05-31 2010-11-10 京セラ株式会社 地上波デジタル放送受信機
ES2674908T3 (es) * 2005-07-25 2018-07-04 Thomson Licensing Dtv Método y aparato para ocultación de imágenes de video perdidas
CN101321284B (zh) * 2007-06-10 2012-01-04 华为技术有限公司 一种编解码方法、设备及系统
JP4935746B2 (ja) 2008-04-07 2012-05-23 富士通株式会社 動画像符号化装置、動画像復号化装置及びその符号化、復号化方法
CN102342127A (zh) 2009-01-28 2012-02-01 诺基亚公司 用于视频编码和解码的方法和装置
US20100246683A1 (en) * 2009-03-27 2010-09-30 Jennifer Lois Harmon Webb Error Resilience in Video Decoding
TW201210325A (en) 2010-07-21 2012-03-01 Nokia Corp Method and apparatus for indicating switching points in a streaming session
US20130170561A1 (en) 2011-07-05 2013-07-04 Nokia Corporation Method and apparatus for video coding and decoding
US10244257B2 (en) 2011-08-31 2019-03-26 Nokia Technologies Oy Video coding and decoding
MY167991A (en) * 2012-07-02 2018-10-10 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding appratus
US9571847B2 (en) 2013-01-07 2017-02-14 Qualcomm Incorporated Gradual decoding refresh with temporal scalability support in video coding

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020184999A1 (ko) * 2019-03-12 2020-09-17 현대자동차주식회사 영상 부호화 및 복호화 방법 및 장치
US11706429B2 (en) 2019-03-12 2023-07-18 Hyundai Motor Company Method and device for encoding and decoding image involving gradual refresh technique
WO2021201559A1 (ko) * 2020-04-01 2021-10-07 엘지전자 주식회사 Gdr에 대한 리커버리 포인트 관련 정보의 시그널링 기반 영상 또는 비디오 코딩
WO2023132623A1 (ko) * 2022-01-05 2023-07-13 주식회사 케이티 비디오 신호 부호화/복호화 방법, 그리고 비트스트림을 저장한 기록 매체

Also Published As

Publication number Publication date
JP6242913B2 (ja) 2017-12-06
KR20150105374A (ko) 2015-09-16
CN104904216A (zh) 2015-09-09
WO2014107721A1 (en) 2014-07-10
DK2941878T3 (da) 2020-02-17
DK2941879T3 (da) 2020-09-28
CN104885460B (zh) 2019-05-03
CN104885460A (zh) 2015-09-02
US9398293B2 (en) 2016-07-19
TWI566585B (zh) 2017-01-11
ES2777214T3 (es) 2020-08-04
ES2833149T3 (es) 2021-06-14
EP2941879A1 (en) 2015-11-11
HUE049430T2 (hu) 2020-09-28
JP2016509403A (ja) 2016-03-24
TWI538485B (zh) 2016-06-11
EP2941878B1 (en) 2019-12-11
KR101741348B1 (ko) 2017-05-29
HUE051865T2 (hu) 2021-05-28
TW201444347A (zh) 2014-11-16
WO2014107723A1 (en) 2014-07-10
CN104904216B (zh) 2018-12-04
US20140192897A1 (en) 2014-07-10
KR101841333B1 (ko) 2018-03-22
JP2016509404A (ja) 2016-03-24
TW201444348A (zh) 2014-11-16
EP2941878A1 (en) 2015-11-11
US20140192896A1 (en) 2014-07-10
US9571847B2 (en) 2017-02-14
JP6239650B2 (ja) 2017-11-29
EP2941879B1 (en) 2020-08-26

Similar Documents

Publication Publication Date Title
KR101841333B1 (ko) 비디오 코딩에서 시간 스케일러빌리티 지원 하의 점진적 디코딩 리프레시
KR101672152B1 (ko) 비디오 코딩에서의 시간 스케일러빌리티 지원에 의한 점진적 개선
US9479782B2 (en) Supplemental enhancement information message coding
KR101743852B1 (ko) 비디오 코딩에서의 관심 영역들 및 점진적 디코딩 리프레시의 시그널링
US10051264B2 (en) Marking reference pictures in video sequences having broken link pictures

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant