KR20240051251A - 비디오 처리를 위한 방법, 장치 및 매체 - Google Patents

비디오 처리를 위한 방법, 장치 및 매체 Download PDF

Info

Publication number
KR20240051251A
KR20240051251A KR1020247010675A KR20247010675A KR20240051251A KR 20240051251 A KR20240051251 A KR 20240051251A KR 1020247010675 A KR1020247010675 A KR 1020247010675A KR 20247010675 A KR20247010675 A KR 20247010675A KR 20240051251 A KR20240051251 A KR 20240051251A
Authority
KR
South Korea
Prior art keywords
profile
main
bitstream
video
picture
Prior art date
Application number
KR1020247010675A
Other languages
English (en)
Inventor
예-쿠이 왕
Original Assignee
바이트댄스 아이엔씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이트댄스 아이엔씨 filed Critical 바이트댄스 아이엔씨
Publication of KR20240051251A publication Critical patent/KR20240051251A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명의 실시예들은 비디오 처리를 위한 해결책을 제공한다. 방법은 디코딩 적합성 제약에 따라 비디오의 타겟 비디오 블록과 비디오의 비트스트림 간의 변환을 수행하는 단계를 포함한다. 디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 적어도 하나의 비트스트림의 제1 그림을 디코딩할 수 있음을 명시하고, 상기 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다.

Description

비디오 처리를 위한 방법, 장치 및 매체
관련 애플리케이션에 대한 교차 참조
본 출원은 2021년 9월 30일 목요일 출원된 미국 임시 출원 제63/250,772호의 이익을 주장하며, 그 내용은 본 명세서에 전체적인 참조로 통합된다.
기술분야
본 발명의 실시예는 일반적으로 비디오 코딩 기술에 관한 것이고, 더 상세하게는 다용도 비디오 코딩(VVC) 범위 확장 프로파일을 위한 디코더 기능을 지정하는 것에 관한 것이다.
비디오 코딩 표준은 주로 잘 알려진 ITU-T 및 ISO/IEC 표준의 개발을 통해 발전되었다. ITU-T는 H.261과 H.263을, ISO/IEC는 MPEG-1과 MPEG-4 Visual을, 두 기관은 H.262/MPEG-2 Video와 H.264/MPEG-4 고급 비디오 코딩 (AVC)과 H.265/HEVC 표준을 공동으로 제작하였다. H.262 이후로 비디오 코딩 표준은 시간 예측과 변환 코딩이 사용되는 하이브리드 비디오 코딩 구조를 기반으로 한다. HEVC를 넘어 미래의 비디오 코딩 기술을 탐구하기 위해 2015년 VCEG와 MPEG가 공동으로 합동 비디오 전문가팀(JVET)을 설립하였다. 그 이후로 JVET는 많은 새로운 방법을 채택하여 공동성명 모델(JEM)이라는 이름의 참조 소프트웨어에 넣었다. JVET는 이후 VVC 프로젝트가 공식적으로 시작되며 JVET으로 이름이 바뀌었다. VVC는 HEVC에 비해 비트율를 50% 낮추는 것을 목표로 하는 새로운 코딩 표준이다.
VVC 표준 및 관련 코딩된 비디오 비트스트림을 위한 다용도 보조 기능 강화 정보(VSEI) 표준은 텔레비전 방송, 화상 회의 또는 저장 매체로부터의 재생과 같은 전통적인 용도뿐만 아니라, 적응적 비트레이트 스트리밍, 비디오 영역 추출, 다중 코딩 비디오 비트스트림, 멀티뷰 비디오, 확장 가능한 계층 코딩 및 뷰포트 적응형 360° 몰입형 미디어로부터의 내용의 구성 및 병합과 같은 최대로 광범위한 응용 분야에서 사용하도록 설계되었다. VVC 표준에 대한 최신 개정 초안에는 범위 확장 프로파일 및 기타 측면의 사양이 포함되어 있다.
본 발명의 실시예들은 비디오 처리를 위한 해결책을 제공한다.
제1 측면에서 비디오 처리를 위한 방법이 제안된다. 방법은 디코딩 적합성 제약에 따라 비디오의 타겟 비디오 블록과 비디오의 비트스트림 간의 변환을 수행하는 단계를 포함한다. 디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 적어도 하나의 비트스트림의 제1 그림을 디코딩할 수 있음을 명시하고, 상기 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다. 발명의 제1 측면에 따른 방법은 VVC 범위 확장 프로파일들에 대한 디코더 기능을 개선한다.
제2 측면에서 비디오 데이터를 처리하기 위한 장치가 제안된다. 장치는 프로세서 및 명령어를 포함하는 비일시적 메모리를 포함한다. 명령어들은 프로세서에 의해 실행될 때, 프로세서로 하여금 제1 측면에 따른 방법을 수행하게 한다.
세 번째 측면에서 비디오 데이터를 처리하기 위한 장치가 제안된다. 비일시적 컴퓨터 판독가능한 저장 매체는 프로세서로 하여금 제1 측면에 따른 방법을 수행하게 하는 명령어들을 저장한다.
네 번째 측면에서, 비일시적 컴퓨터 판독가능한 기록 매체가 제안된다. 비일시적 컴퓨터 판독가능한 기록 매체는 비디오 처리 장치에 의해 수행되는 방법에 의해 생성된 비디오의 비트스트림을 저장한다. 이 방법은 디코딩 적합성 제약에 따라 비트스트림을 생성하는 단계를 포함한다. 디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 적어도 하나의 비트스트림의 제1 그림을 디코딩할 수 있음을 명시하고, 상기 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다.
다섯 번째 측면에서 비디오의 비트스트림을 저장하기 위한 또 다른 방법 제안된다. 방법은 디코딩 적합성 제약에 따라 비트스트림을 생성하는 단계 및 상기 비트스트림을 비일시적 컴퓨터 판독가능한 기록 매체에 저장하는 단계를 포함한다. 디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 적어도 하나의 비트스트림의 제1 그림을 디코딩할 수 있음을 명시하고, 상기 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다.
본 발명의 내용은 다음과 같은 상세한 설명에서 진일보한 개념의 선택을 간략한 형식으로 소개하기 위한 것이다. 본 발명의 내용은 보호가 필요한 주제의 핵심 특징이나 기본 특징을 식별하거나 보호가 필요한 주제의 범위를 제한하는 데 사용되지 않는다.
첨부된 도면들을 참조하여 아래의 상세한 설명을 통해, 본 발명의 예시적인 실시예들의 상기와 다른 목적, 특징 및 이점이 보다 명확해질 것이다. 본 발명의 예시적인 실시예에서, 동일한 참조 번호는 일반적으로 동일한 구성요소를 지칭한다.
도 1은 본 발명의 일부 실시예에 따른 비디오 코딩 시스템을 예시하는 블록도를 도시한다.
도 2는 본 발명의 일부 실시예에 따른 제1 예시 비디오 인코더를 예시하는 블록도를 도시한다.
도 3은 본 발명의 일부 실시예에 따른 하나의 예시 비디오 디코더를 예시하는 블록도를 도시한다.
도 4은 본 발명의 일부 실시예에 따른 비디오 처리 방법의 흐름도를 도시한다. 및
도 5는 본 발명의 다양한 실시예들이 구현될 수 있는 컴퓨팅 장치의 블록도를 도시한 것이다.
도면 전체에서 동일하거나 유사한 참조 번호는 일반적으로 동일하거나 유사한 요소를 지칭한다.
본 발명의 원리는 이제 일부 실시예들을 참조하여 설명될 것이다. 이러한 실시예들은 본 발명의 범위에 대한 어떠한 제한도 제시하지 않고, 단지 예시를 목적으로 기술되고 당업자가 본 발명을 이해하고 구현하도록 돕는 것임을 이해하는 것이다. 본 명세서에 기재된 발명 내용은 아래에 기재된 발명 내용 외에 다양한 방식으로 구현될 수 있다.
아래의 기술 및 청구항들에서, 달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어들은 본 발명 내용이 속하는 기술분야의 통상의 기술자들 중 하나에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명에서 “일 실시예”, “한 실시예”,“한 예시적인 실시예” 등에 대한 언급은 기재된 실시예가 특정 특징, 구조 또는 특성을 포함할 수 있음을 나타내지만, 모든 실시예가 특정 특징, 구조 또는 특성을 포함할 필요는 없다. 이 밖에 이런 구절이 반드시 동일한 실시예를 가리키는 것은 아니다. 또한, 특정 특징, 구조 또는 특성이 예시적인 실시예와 관련하여 기술될 때명시적으로 설명되었는지 여부에 관계없이 다른 실시예를 결합하여 그러한 특징, 구조 또는 특성이 해당 분야의 기술자의 지식 범위에 영향을 미친다고 생각한다.
여기서 “제 1” 및 “제 2” 등의 용어가 다양한 요소를 설명하는 데 사용될 수 있지만 이러한 요소가 이러한 용어에 의해 제한되어서는 안 된다는 것을 이해해야 한다. 이 용어는 한 요소와 다른 요소를 구별하는 데만 사용된다. 예를 들어, 제1 요소는 제2 요소로 명명될 수 있고, 유사하게, 예시적인 실시예들의 범위를 벗어나지 않는 경우, 제2 요소는 제1 요소로 명명될 수 있다. 본 발명에서 사용되는 바와 같이, 용어 “및/또는”에는 나열된 용어들 중 하나 이상의 임의의 및 모든 조합이 포함된다.
본 발명에서 사용되는 용어는 특정 실시예들만을 설명하기 위한 목적이며, 예시적인 실시예들을 제한하기 위한 것은 아니다. 본 발명에서 사용되는 바와 같이, 단수 형태 “한”, “일” 및 “그”는 문맥상 명백하게 다르게 뜻하지 않는 한 복수 형태도 포함하도록 되어 있다. 본 발명에서 사용되는 용어 “구성함”, “구성되어 있음”,“보유함”, “보유하고 있음”,“포함” 및/또는 “포함되어 있음”은 명시된 특징, 요소 및/또는 구성요소 등의 존재를 명시하지만, 하나 이상의 다른 특징, 요소, 구성요소 및/또는 이들의 조합의 존재 또는 추가를 배제하는 것은 아니다.
예시 환경
도 1은 본 명세서의 기술을 활용할 수 있는 하나의 예시적인 비디오 코딩 시스템 (100)을 도시하는 블록도이다. 도시된 바와 같이, 비디오 코딩 시스템(100)은 소스 장치(110) 및 목표 장치(120)를 포함할 수 있다. 소스 장치(110)는 비디오 코딩 장치라고도 지칭될 수 있고, 목표 장치(120)는 비디오 디코딩 장치라고도 지칭될 수 있다. 이 동작에서, 소스 장치(110)는 코딩된 비디오 데이터를 생성하도록 구성될 수 있고, 목표 장치(120)는 소스 장치(110)에 의해 생성된 코딩된 비디오 데이터를 디코딩하도록 구성될 수 있다. 소스 장치(110)는 비디오 소스(112), 비디오 인코더(114) 및 입출력(I/O) 인터페이스(116)를 포함할 수 있다.
비디오 소스(112)는 비디오 캡처 장치와 같은 소스를 포함할 수 있다. 비디오 캡처 장치의 예시는 비디오 내용 제공자로부터 비디오 데이터를 수신하기 위한 인터페이스, 비디오 데이터를 생성하기 위한 컴퓨터 그래픽 시스템, 및/또는 이들의 조합을 포함하지만, 이에 제한되지는 않는다.
비디오 데이터는 하나 또는 그 이상의 화면으로 구성될 수 있다. 비디오 인코더(114)는 비디오 소스(112)로부터의 비디오 데이터를 코딩하여 비트스트림을 생성한다. 비트스트림은 비디오 데이터의 코딩된 표현을 형성하는 비트의 시퀀스를 포함할 수 있다. 비트스트림은 코딩된 화면 및 연관된 데이터를 포함할 수 있다. 코딩된 화면은 화면의 코딩된 표현이다. 연관된 데이터는 시퀀스 파라미터 세트, 화면 파라미터 세트, 및 다른 구문 구조를 포함할 수 있다. I/O 인터페이스(116)는 변조기/복조기 및/또는 송신기를 포함할 수 있다. 코딩된 비디오 데이터는 네트워크(130A)를 통해 I/O 인터페이스(116)를 거쳐 목표 장치(120)로 직접 전송될 수 있다. 코딩된 비디오 데이터는 또한 목표 장치(120)에 의한 액세스를 위해 저장 매체/서버(130B) 상에 저장될 수 있다.
목표 장치(120)는 I/O 인터페이스(126), 비디오 디코더(124) 및 표시 장치(122)를 포함할 수 있다. I/O 인터페이스(126)는 수신기 및/또는 모뎀을 포함할 수 있다. I/O 인터페이스(126)는 소스 장치(110) 또는 저장 매체/서버(130B)로부터 코딩된 비디오 데이터를 획득할 수 있다. 비디오 디코더(124)는 코딩된 비디오 데이터를 디코딩할 수 있다. 표시 장치(122)는 디코딩된 비디오 데이터를 사용자에게 표시할 수 있다. 표시 장치(122)는 목표 장치(120)와 일체화될 수도 있고, 외부 표시 장치와 인터페이스하도록 구성된 목표 장치(120)의 외부에 있을 수도 있다.
비디오 인코더(114) 및 비디오 디코더(124)는 고효율 비디오 코딩(HEVC) 표준, 다용도 비디오 코딩(VVC) 표준 및 다른 현재 및/또는 추가 표준과 같은 비디오 압축 표준에 따라 동작할 수 있다.
도 2는 본 발명에서 발명된 일부 실시예에 따른 도 1에 도시된 시스템(100)에서의 비디오 인코더(114)의 일례일 수 있는 비디오 인코더(200)의 일례를 도시하는 블록도이다.
비디오 인코더(200)는 본 명세서의 기술들 중 임의의 것 또는 전부를 구현하도록 구성될 수 있다. 도 2의 예에서, 비디오 인코더(200)는 복수의 기능성 구성요소를 포함한다. 본 명세서에 기술된 기술들은 비디오 인코더(200)의 다양한 구성요소들 간에 공유될 수 있다. 일부 예에서, 프로세서는 본 명세서에 기술된 기술들 중 임의의 것 또는 전부를 수행하도록 구성될 수 있다.
일부 실시예에서, 비디오 인코더(200)는 분할부(201)와 모드 선택부(203), 움직임 추정부(204), 움직임 보상부(205) 및 화면내 예측부(206), 잔차 생성부(207), 변환부(208), 양자화부(209), 역양자화부(210), 역변환부(211), 복원부(212), 버퍼(213) 및 엔트로피 코딩부(214)를 포함할 수 있는 예측부(202)를 포함할 수 있다.
다른 예에서, 비디오 인코더(200)는 더 많거나, 더 적거나, 또는 상이한 기능적 구성요소들을 포함할 수 있다. 일 예에서, 예측부(202)은 블록 내 복제 (IBC) 유닛을 포함할 수 있다. IBC 유닛은 적어도 하나의 참조 화면이 현재 비디오 블록이 위치한 화면인 IBC 모드에서 예측을 수행할 수 있다.
또한, 움직임 추정부(204) 및 움직임 보상부(205)와 같은 일부 구성요소들은 통합될 수 있으나, 도 2의 예에서는 설명을 위해 별도로 표시하였다.
분할부(201)는 화면을 하나 이상의 비디오 블록으로 분할할 수 있다. 비디오 인코더(200) 및 비디오 디코더(300)는 다양한 비디오 블록 크기를 지원할 수 있다.
모드 선택부(203)는 예를 들어, 오류 결과에 기초하여, 코딩된 모드들 중에서 화면내 또는 화면간 중 하나를 선택하고, 결과적으로 화면내-코딩되거나 화면간-코딩된 블록을 잔차 생성부(207)에 제공하여 잔차 블록 데이터를 생성하고, 코딩된 블록을 참조 화면으로서 사용하기 위해 재구성부(212)에 제공할 수도 있다. 일부 예에서, 모드 선택부(203)는 예측이 화면간예측 신호 및 화면내예측 신호에 기초하는 화면간과 화면내 예측(CIIP)모드의 조합을 선택할 수 있다. 모드 선택부(203)는 화면간 예측의 경우 블록에 대한 움직임 벡터(예를 들어, 부분 픽셀 또는 정수형 픽셀 정밀도)에 대한 해상도를 선택할 수도 있다.
움직임 추정부(204)는 현재 비디오 블록에 대한 화면간 예측을 수행하기 위해 버퍼(213)로부터의 하나 이상의 참조 프레임을 현재 비디오 블록과 비교하여 현재 비디오 블록에 대한 움직임 정보를 생성할 수 있다. 움직임 보상부(205)는 현재 비디오 블록과 연관된 화면 이외의 화면들의 움직임 정보 및 버퍼(213)로부터의 디코딩된 샘플들에 기초하여 현재 비디오 블록에 대한 예측 비디오 블록을 결정할 수도 있다.
움직임 추정부(204) 및 움직임 보상부(205)는 예를 들어, 현재 비디오 블록이 I 슬라이스인지, P 슬라이스인지, 또는 B 슬라이스인지에 따라 현재 비디오 블록에 대해 서로 다른 동작을 수행할 수 있다. 본 발명에서 사용되는 바와 같이, “I-슬라이스”는 매크로블록으로 구성된 화면의 일부분을 지칭할 수 있으며, 이들 모두는 동일한 화면 내의 매크로블록을 기반으로 한다. 또한, 본 발명에서 사용되는 바와 같이, 일부 측면에서, “P-슬라이스” 및 “B-슬라이스”은 동일한 화면 내의 매크로블록에 의존하지 않는 매크로블록으로 구성된 화면의 일부분을 지칭할 수도 있다.
일부 예에서, 움직임 추정부(204)는 현재 비디오 블록에 대해 단방향 예측을 수행할 수 있고, 움직임 추정부(204)는 현재 비디오 블록에 대한 참조 비디오 블록에 대해 리스트 0 또는 리스트 1의 참조 화면을 검색할 수 있다. 움직임 추정부(204)는 이후 참조 비디오 블록을 포함하는 리스트 0 또는 리스트 1에서 참조 화면을 나타내는 참조 색인 및 현재 비디오 블록과 참조 비디오 블록 사이의 공간 변위를 나타내는 움직임 벡터를 생성할 수 있다. 움직임 추정부(204)는 참조 색인, 예측 방향 표시기 및 움직임 벡터를 현재 비디오 블록의 움직임 정보로서 출력할 수 있다. 움직임 보상부(205)는 현재 비디오 블록의 움직임 정보에 의해 표시된 참조 비디오 블록을 기반으로 현재 비디오 블록의 예측 비디오 블록을 생성할 수 있다.
또는, 다른 예에서, 움직임 추정부(204)은 현재 비디오 블록에 대해 양방향 예측을 수행할 수 있다. 움직임 추정부(204)는 현재 비디오 블록에 대한 참조 비디오 블록을 위해 리스트 0 내의 참조 화면을 검색할 수 있고, 또한 리스트 1 내의 참조 화면을 현재 비디오 블록에 대한 다른 참조 비디오 블록을 검색할 수도 있다. 움직임 추정부(204)는 이후 참조 비디오 블록을 포함하는 리스트 0 및 리스트 1 내의 참조 화면을 나타내는 참조 색인들 및 참조 비디오 블록과 현재 비디오 블록 사이의 공간 변위를 나타내는 움직임 벡터를 생성할 수도 있다. 움직임 추정부(204)는 참조 색인 및 현재 비디오 블록의 움직임 벡터를 현재 비디오 블록의 움직임 정보로서 출력할 수 있다. 움직임 보상부(205)는 현재 비디오 블록의 움직임 정보에 의해 표시된 참조 비디오 블록을 기반으로 현재 비디오 블록의 예측 비디오 블록을 생성할 수 있다.
다른 예에서, 움직임 추정부(204)은 디코더의 디코딩 처리를 위한 움직임 정보의 전체 그룹을 출력할 수 있다. 또는, 일부 실시예에서, 움직임 추정부(204)는 다른 비디오 블록의 움직임 정보를 참조하여 현재 비디오 블록의 움직임 정보를 신호 알림할 수도 있다. 예를 들어, 움직임 추정부(204)는 현재 비디오 블록의 움직임 정보가 주변 비디오 블록의 움직임 정보와 충분히 유사하다고 판단할 수 있다.
일 예에서, 움직임 추정부(204)는 현재 비디오 블록과 연관된 구문 구조에서, 현재 비디오 블록이 다른 비디오 블록과 동일한 움직임 정보를 갖는다는 것을 비디오 디코더(300)에 나타내는 값을 나타낼 수 있다.
다른 예에서, 움직임 추정부(204)는 현재 비디오 블록과 연관된 구문 구조에서 다른 비디오 블록 및 움직임 벡터 차이(MVD)를 식별할 수 있다. 움직임 벡터 차이는 현재 비디오 블록의 움직임 벡터와 표시된 비디오 블록의 움직임 벡터의 차이를 나타낸다. 비디오 디코더(300)는 지시된 비디오 블록의 움직임 벡터와 움직임 벡터 차이를 이용하여 현재 비디오 블록의 움직임 벡터를 결정할 수 있다.
앞서 설명한 바와 같이, 비디오 인코더(200)는 움직임 벡터를 예측적으로 신호 알림할 수 있다. 비디오 인코더(200)에 의해 구현될 수 있는 예측 신호 알림 기술의 두 가지 예는 고급 움직임 벡터 예측(AMVP) 및 병합 모드 신호 알림을 포함한다.
화면내 예측부(206)는 현재 비디오 블록에 대한 화면내 예측을 수행할 수 있다. 화면내 예측부(206)가 현재 비디오 블록에 대해 화면내 예측을 수행하는 경우, 화면내 예측부(206)는 동일한 화면 내의 다른 비디오 블록의 디코딩된 샘플에 기초하여 현재 비디오 블록에 대한 예측 데이터를 생성할 수도 있다. 현재 비디오 블록에 대한 예측 데이터는 예측된 비디오 블록 및 다양한 구문 요소를 포함할 수 있다.
잔차 생성부(207)는 현재 비디오 블록에서 현재 비디오 블록의 예측된 비디오 블록(들)을 감산(예를 들어, 마이너스 부호로 표시)함으로써 현재 비디오 블록에 대한 잔차 데이터를 생성할 수 있다. 현재 비디오 블록의 잔차 데이터는 현재 비디오 블록 내 샘플의 상이한 샘플 구성요소에 대응하는 잔차 비디오 블록을 포함할 수 있다.
다른 예에서, 예를 들어 스킵 모드에서 현재 비디오 블록에 대한 현재 비디오 블록에 대한 잔차 데이터가 없을 수 있고, 잔차 생성부(207)는 감산 동작을 수행하지 않을 수 있다.
변환 처리부(208)는 현재 비디오 블록과 연관된 잔차 비디오 블록에 하나 또는 그 이상의 변환을 적용함으로써 현재 비디오 블록에 대한 하나 또는 그 이상의 변환 계수 비디오 블록을 생성할 수 있다.
변환 처리부(208)는 현재 비디오 블록과 연관된 변환 계수 비디오 블록을 생성한 후, 양자화부(209)는 현재 비디오 블록과 연관된 하나 또는 그 이상의 양자화 파라미터(QP) 값에 기초하여 현재 비디오 블록과 연관된 변환 계수 비디오 블록을 양자화할 수 있다.
역양자화부(210) 및 역변환부(211)는 변환 계수 비디오 블록에 역양자화 및 역변환을 각각 적용하여 변환 계수 비디오 블록으로부터 잔차 비디오 블록을 복원할 수 있다. 재구성부(212)는 예측부(202)에 의해 생성된 하나 또는 그 이상의 예측된 비디오 블록으로부터의 대응하는 샘플에 재구성된 잔차 비디오 블록을 추가하여 버퍼(213)에 저장하기 위한 현재 비디오 블록과 연관된 재구성된 비디오 블록을 생성할 수도 있다.
재구성부(212)는 비디오 블록을 재구성한 후, 비디오 블록 내의 비디오 차단 아티팩트를 줄이기 위해 루프 필터링 동작이 수행될 수 있다.
엔트로피 코딩부(214)는 비디오 코딩기(200)의 다른 기능적 구성요소들로부터 데이터를 수신할 수 있다. 엔트로피 코딩부(214)가 데이터를 수신하면, 엔트로피 코딩부(214)는 엔트로피 코딩 데이터를 생성하고, 엔트로피 코딩 데이터를 포함하는 비트스트림을 출력하기 위해 하나 또는 그 이상의 엔트로피 코딩 동작을 수행할 수 있다.
도 3은 본 발명의 일부 실시예에 따른 도 1에 도시된 시스템(100)에서 비디오 디코더(124)의 일례일 수 있는 비디오 디코더(300)의 일례를 도시하는 블록도이다.
비디오 디코더(300)는 본 명세서의 기술들 중 임의의 것 또는 전부를 수행하도록 구성될 수 있다. 도 3의 예에서, 비디오 디코더(300)는 복수의 기능성 구성요소들을 포함한다. 본 명세서에 기술된 기술들은 비디오 디코더(300)의 다양한 구성요소들 간에 공유될 수 있다. 일부 예에서, 프로세서는 본 명세서에 기술된 기술들 중 임의의 것 또는 전부를 수행하도록 구성될 수 있다.
도 3의 예에서, 비디오 디코더(300)는 엔트로피 코딩부(301), 움직임 보상부(302), 화면내 예측부(303), 역양자화부(304), 역변환부(305), 및 복원부(306) 및 버퍼(307)를 포함한다. 일부 예에서 비디오 디코더(300)는 일반적으로 비디오 인코더(200)에 대해 기술하는 코딩 패스와 반대되는 디코딩 패스를 수행할 수 있다.
엔트로피 디코딩부(301)는 코딩된 비트스트림을 검색할 수 있다. 코딩된 비트스트림은 엔트로피 코딩된 비디오 데이터(예를 들어, 비디오 데이터의 코딩된 블록들)를 포함할 수 있다. 엔트로피 디코딩부(301)는 엔트로피 코딩된 비디오 데이터를 디코딩하고, 엔트로피 디코딩된 비디오 데이터로부터 움직임 보상부(302)는 움직임 벡터, 움직임 벡터 정밀도, 참조 화면 리스트 색인 및 기타 움직임 정보를 포함하는 움직임 정보를 결정할 수 있다. 움직임 보상부(302)는 예를 들어, AMVP 및 병합 모드를 수행하여 이러한 정보를 결정할 수 있다. AMVP는 인접 PB들의 데이터와 참조 화면을 기반으로 가장 가능성이 높은 여러 후보를 도출하는 것을 포함하여 사용된다. 움직임 정보는 일반적으로 수평 및 수직 움직임 벡터 변위 값들, 하나 또는 두 개의 참조 화면 색인들, 및 B 슬라이스들에서의 예측 영역들의 경우, 어떤 참조 화면 리스트가 각각의 색인과 연관되는지에 대한 식별을 포함한다. 본 발명에서 사용되는 바와 같이, 일부 측면에서, “병합 모드”는 공간적으로 또는 시간적으로 인접 블록들로부터 움직임 정보를 도출하는 것을 지칭할 수 있다.
움직임 보상부(302)는 보간 필터에 기초하여 보간을 수행할 수 있는 움직임 보상 블록을 생성할 수 있다. 부분 픽셀 정밀도로 사용될 보간 필터에 대한 식별자들이 구문 요소에 포함될 수 있다.
움직임 보상부(302)는 참조 블록의 서브 정수형 픽셀에 대한 보간 값을 계산하기 위해 비디오 인코더(200)에 의해 사용되는 보간 필터를 사용할 수 있다. 움직임 보상부(302)는 수신된 구문 정보에 따라 비디오 인코더(200)에서 사용되는 보간 필터를 결정하고, 보간 필터를 이용하여 예측 블록을 생성할 수 있다.
움직임 보상부(302)은 코딩된 비디오 시퀀스의 프레임(들) 및/또는 슬라이스(들)를 코딩하기 위해 사용되는 블록의 크기를 결정하기 위해, 구문 정보의 적어도 일부를 사용할 수도 있고, 코딩된 비디오 시퀀스의 화면의 각각의 매크로블록이 어떻게 분할되는지를 기술하는 분할 정보, 각각의 분할이 코딩되는 방법을 나타내는 모드, 각각의 코딩되는 블록에 대한 하나 또는 그 이상의 참조 프레임(및 참조 프레임 리스트), 및 코딩된 비디오 시퀀스를 디코딩하기 위한 다른 정보이다. 본 발명에서 사용되는 바와 같이, 일부 측면에서, “슬라이스”는 엔트로피 코딩, 신호 예측 및 잔차 신호 재구성의 관점에서, 동일한 화면의 다른 슬라이스들로부터 독립적으로 디코딩될 수 있는 데이터 구조를 지칭할 수도 있다. 슬라이스는 전체 화면 또는 화면의 일 영역이 될 수 있다.
화면내 예측부(303)은 비트스트림에서 수신되는 화면내 예측 모드와 같은 모드를 사용하여 공간적으로 인접한 블록으로부터 예측 블록을 형성할 수 있다. 역양자화부(304)는 비트스트림에 제공되고 엔트로피 디코딩부(301)에 의해 디코딩되고 양자화된 비디오 블록 계수를 역양자화, 즉 탈양자화를 수행한다. 역변환부(305)는 역변환을 적용한다.
재구성부(306)은 예를 들어, 움직임 보상부(302) 또는 화면내 예측부(303)에 의해 생성된 대응하는 예측 블록과 잔차 블록을 합산함으로써 디코딩된 블록을 획득할 수 있다. 원하는 경우, 블록성 아티팩트를 제거하기 위해 디블록킹 필터를 사용하여 디코딩된 블록을 여과할 수도 있다. 그런 다음 디코딩된 비디오 블록은 버퍼(307)에 저장되며, 버퍼(307)는 후속 움직임 보상/화면내 예측을 위한 참조 블록을 제공하고 또한 표시 장치에서 보여주기 위한 디코딩된 비디오를 생성한다.
본 발명의 일부 예시적인 실시예들은 아래에서 상세하게 기술될 것이다. 본 발명 문서에서 세션 제목을 사용하는 것은 이해를 용이하게 하기 위한 것이며, 한 세션에 공개된 실시예를 이 세션으로만 제한하지 않음을 이해해야 한다. 또한, 특정 실시예들이 다기능 비디오 코딩 또는 다른 특정 비디오 코덱을 참조하여 기술되지만, 공개된 기술은 다른 비디오 코딩 기술에도 적용될 수 있다. 게다가, 일부 실시예들이 비디오 코딩 단계를 상세하게 기술하지만, 코딩을 해제하는 해당 단계의 디코딩은 디코더에 의해 구현된다는 것을 이해할 것이다. 또한, 비디오 처리라는 용어는 비디오 코딩 또는 압축, 비디오 디코딩 또는 압축해제 및 비디오 변환 코딩을 포함하며, 여기서 비디오 픽셀은 하나의 압축된 형식으로부터 다른 압축된 형식으로 또는 다른 압축된 비트레이트로 표현된다.
상세한 해결책
1. 발명의 개요
본 발명은 이미지/비디오 코딩 기술에 관한 것이다. 더 상세하게는 VVC 범위 확장 프로파일을 위한 디코더 기능을 지정하는 것에 관한 것이다. 본 발명의 실시예은 임의의 코덱에 의해 코딩된 비디오 비트스트림, 예를 들어, 다용도 비디오 코딩(VVC) 표준에 대해 개별적으로 또는 다양한 조합으로 적용될 수 있다.
2. 약어
APS 적응형 파라미터 세트
AU 액세스 유닛
CLVS 코딩된 계층 비디오 서열
CLVSS 코딩된 계층 비디오 서열 시작
CRC 주기적 중복성 검사
CTI 색상 변환 정보
CVS 코딩된 비디오 서열
FIR 유한 임펄스 응답
IRAP 화면내 랜덤 액세스 포인트
NAL 네트워크 추출 계층
PPS 그림 파라미터 세트
PU 그림 유닛
RASL 랜덤 액세스 선행 건너뛰기
SAR 샘플 종횡비
SARI 샘플 종횡비 정보
SEI 보충 강화 정보
VCL 비디오 코딩 계층
VSEI 다용도 보충 강화 정보(참조. ITU-T H.274 | ISO/IEC 23002-7)
VUI 비디오 가용성 정보
VVC 다용도 비디오 코딩(참조. ITU-T H.266 | ISO/IEC 23090-3)
3. 발명의 배경
3.1. 비디오 코딩 표준
비디오 코딩 표준은 주로 잘 알려진 ITU-T 및 ISO/IEC 표준의 개발을 통해 발전되었다. ITU-T는 H.261과 H.263을, ISO/IEC는 MPEG-1과 MPEG-4 Visual을, 두 기관은 H.262/MPEG-2 Video와 H.264/MPEG-4 고급 비디오 코딩 (AVC)과 H.265/HEVC 표준을 공동으로 제작하였다. H.262 이후로 비디오 코딩 표준은 시간 예측과 변환 코딩이 사용되는 하이브리드 비디오 코딩 구조를 기반으로 한다. HEVC를 넘어 미래의 비디오 코딩 기술을 탐구하기 위해 2015년 VCEG와 MPEG가 공동으로 합동 비디오 전문가팀(JVET)을 설립하였다. 그 이후로 JVET는 많은 새로운 방법을 채택하여 공동성명 모델(JEM)이라는 이름의 참조 소프트웨어에 넣었다. JVET는 이후 다용도 비디오 코딩(VVC) 프로젝트가 공식적으로 시작되며 합동 비디오 전문가팀(JVET)으로 이름이 바뀌었다. VVC는 2020년 7월 1일에 종료된 제19차 회의에서 JVET가 최종 확정한 HEVC 대비 50%의 비트레이트 절감을 목표로 하는 새로운 코딩 표준이다.
다용도 비디오 코딩(VVC) 표준(ITU-T H.266 | ISO/IEC 23090-3) 및 관련 코딩된 비디오 비트스트림을 위한 다용도 보조 기능 강화 정보(VSEI) 표준(ITU-T H.274 | ISO/IEC 23002-7)은 텔레비전 방송, 화상 회의 또는 저장 매체로부터의 재생과 같은 전통적인 용도뿐만 아니라, 적응적 비트율 스트리밍, 비디오 영역 추출, 다중 코딩 비디오 비트스트림, 멀티뷰 비디오, 확장 가능한 계층 코딩 및 뷰포트 적응형 360° 몰입형 미디어로부터의 내용의 구성 및 병합과 같은 최대로 광범위한 응용 분야에서 사용하도록 설계되었다.
기본 비디오 코딩(EVC) 표준(ISO/IEC 23094-1)은 최근 MPEG에 의해 개발된 또 다른 비디오 코딩 표준이다.
VVC 표준에 대한 최신 개정 초안은 JVET-W2005에서 제공된다. 이 개정안에는 범위 확장 프로파일 및 기타 측면의 사양이 포함되어 있다.
3.2. VVC 범위 확장 프로파일
JVET-W2005의 VVC 범위 확장 프로파일을 지정하기 위한 초안 텍스트는 아래에 제공된다.
A3.5 형식 범위 확장 프로파일
이 하위 조항에서는 형식 범위 확장 프로파일이라고 하는 다음 프로파일을 정의한다:
― 메인 12, 메인 12 4:4:4 및 메인 16 4:4:4 프로파일
― 메인 12 화면내, 메인 12 4:4:4 화면내 및 메인 16 4:4:4 화면내 프로파일
― 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 및 메인 16 4:4:4 정지 그림 프로파일
형식 범위 확장 프로파일을 따르는 비트스트림은 다음 제약 조건을 따라야 한다:
― SPS를 참조하는 ptl_multilayer_enable_flag가 0과 동일해야 한다.
― 메인 12 정지 그림, 메인 12 4: 4: 4 정지 그림 및 메인 16 4: 4: 4 정지 그림 프로파일에 따르는 비트스트림에는 비트스트림에 하나의 그림만 포함되어야 한다.
― 메인 12, 메인 12 4:4:4, 메인 16 4:4:4, 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일에 따르는 비트스트림에는 활성 SPS에서 i의 모든 값에 대한 general_level_idc는 255(레벨 15.5로 표시)와 동일하지 않아야 한다.
― 하위 항목 A.4의 메인 12, 메인 12 4:4:4, 메인 16 4:4:4, 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일(해당하는 경우)에 대해 지정된 계층 및 레벨 제약 조건이 충족되어야 한다.
표 A.1 -형식 범위 확장 프로파일의 구문 요소 허용 값
비트스트림과 메인 12 프로파일의 일관성은 general_profile_idc가 2와 같음을 나타낸다.
비트스트림과 메인 12 화면내 프로파일의 일관성은 general_profile_idc가 10와 같음을 나타낸다.
비트스트림과 메인 12 정지 그림 프로파일의 일관성은 general_profile_idc가 66와 같음을 나타낸다.
비트스트림과 메인 12 4:4:4 프로파일의 일관성은 general_profile_idc가 34와 같음을 나타낸다.
비트스트림과 메인 12 4:4:4 화면내 프로파일의 일관성은 general_profile_idc가 42와 같음을 나타낸다.
비트스트림과 메인 12 4:4:4 정지 그림 프로파일의 일관성은 general_profile_idc가 98와 같음을 나타낸다.
비트스트림과 메인 16 4:4:4 프로파일의 일관성은 general_profile_idc가 36와 같음을 나타낸다.
비트스트림과 메인 16 4:4:4 화면내 프로파일의 일관성은 general_profile_idc가 44와 같음을 나타낸다.
비트스트림과 메인 16 4:4:4 정지 그림 프로파일의 일관성은 general_profile_idc가 100와 같음을 나타낸다.
표 A.1에서 general_profile_idc가 2, 10, 66, 34, 42, 98, 36, 44 또는 100과 같은 구문 요소의 다른 모든 조합은 ITU-T | ISO/IEC의 향후 사용을 위해 유지된다. 이러한 조합은 본 문서에 따르는 비트스트림에 존재해서는 안 된다. 그러나 형식 범위 확장 프로파일을 따르는 디코더는 이 하위 조항에서 아래에 명시된 다른 조합이 비트스트림에서 발생하도록 허용해야 한다.
표 A.2-형식 범위 확장 프로파일에 대한 일관성을 위한 비트스트림 표시
특정 계층(general_tier_flag의 특정 값으로 식별)의 특정 레벨(general_level_idc의 특정 값으로 식별)에서 형식 범위 확장 프로파일을 따르는 디코더는 다음 조건이 모두 적용되는 모든 비트스트림 및 부분 계층 표현을 디코딩할 수 있어야 한다:
― 다음 조건 중 하나가 적용된다:
디코더는 메인 12 4:4:4 또는 메인 16 4:4:4 프로파일을 따르며, 비트스트림 또는 부분 계층 표현은 메인 10 프로파일 또는 메인 10 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 12 4:4:4 화면내, 메인 16 4:4:4 화면내, 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 및 비스트스?? 또는 부분 계층 표현은 메인 10 정지 그림 프로파일을 따르도록 표시된다.
General_profile_idc는 비트스트림의 경우 2, 10, 66, 34, 42, 98, 36, 44 또는 100과 동일하며, 표 A.1에 나열된 각 제약 조건 플래그의 값이 표 A.1보다 크거나 같은 행에서 디코더의 일관성을 평가하는 형식 범위 확장 프로파일에 지정된 값이다.
― 비트스트림 또는 부분 계층 표현은 지정된 계층보다 낮거나 같은 계층을 따르도록 표시된다.
― 비트스트림 또는 부분 계층 표현은 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
1. 문제
이러한 프로파일에 대한 디코더 기능의 지정을 포함하여 VVC 범위 확장 프로파일에 대한 현재 정의에는 적어도 다음과 같은 문제가 있다:
1) 메인 12 화면내, 메인 12 4:4:4 화면내 및 메인 16 4:4:4 화면내 프로파일의 경우, 화면간 예측을 사용할 수 없도록 하는 제약 조건이 없다.
2) 메인 10 또는 메인 10 정지 그림 프로파일을 따르는 비트스트림을 디코딩할 수 있도록 메인 12 프로파일을 따르는 디코더의 요구 사항이 없다.
3) 메인 10 4:4:4 프로파일 또는 메인 10 4:4:4 정지 그림 프로파일을 따르는 비트스트림을 디코딩할 수 있도록 메인 12 4:4:4 또는 메인 16 4:4:4 프로파일을 따르는 디코더의 요구 사항이 없다.
4) 메인 10 정지 그림 프로파일을 따르는 비트스트림을 디코딩할 수 있도록 메인 12 화면내 프로파일을 따르는 디코더의 요구 사항이 없다.
5) 메인 10 4:4:4 정지 그림 프로파일을 따르는 비트스트림이 디코딩될 수 있는 메인 12 4:4:4 화면내, 메인 16 4:4:4 화면내, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르는 디코더의 요구 사항이 없다.
6) 다음 항은 범위 확장 프로파일에 따르는 비트스트림의 디코딩을 위한 디코더 능력을 지정하는 텍스트의 핵심 부분이다.
General_profile_idc는 비트스트림의 경우 2, 10, 66, 34, 42, 98, 36, 44 또는 100과 동일하며, 표 A.1에 나열된 각 제약 조건 플래그의 값이 표 A.1보다 크거나 같은 행에서 디코더의 일관성을 평가하는 형식 범위 확장 프로파일에 지정된 값이다.
사양을 잘못 지정하는 여러 가지 문제가 있으므로 디코더 기능이 올바르게 지정되지 않았다:
a) 표 A.1에서 각 구문 요소의 값이 클수록 낮은 기능 대신 높은 기능을 나타낸다.
b) 표 A.1에는 다음 두 가지 측면이 빠져 있다: 1) 둘 이상의 그림 허용, 2) 화면간 코딩 허용.
7) 특정 비트스트림의 제1 그림을 디코딩할 수 있도록 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르는 디코더의 요구 사항이 없다.
2. 세부 사항
상기 문제를 해결하기 위해, 아래에 요약된 방법들이 개시되었다. 발명의 실시예는 일반적인 개념을 설명하기 위한 예시로 간주되어야 하며 편협한 방식으로 해석되어서는 안 된다. 또한, 이러한 실시예는 개별적으로 또는 임의의 방식으로 조합될 수 있다.
1) 문제 1을 해결하기 위해서는 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일을 따르는 비트스트림의 모든 슬라이스가 I 슬라이스여야 한다.
a. 또는 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일을 따르는 비트스트림에서 모든 슬라이스의 경우 sh_slice_type의 값은 2와 같아야 한다.
b. 또는 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일을 따르는 비트스트림에서 gci_intra_only_constraint_flag의 값은 1와 같아야 한다.
2) 문제 2를 해결하기 위해 다음이 지정되었다: 특정 계층의 특정 레벨에서 메인 12 프로파일을 따르는 디코더는 메인 10 프로파일 또는 메인 10 정지 그림 프로파일을 따르고, 지정 계층보다 낮거나 같은 계층을 따르고, 레벨 15.5가 아니고 지정 레벨보다 낮거나 같은 레벨을 따르도록 표시된 비트스트림을 디코딩할 수 있어야 한다.
3) 문제 3를 해결하기 위해 다음이 지정되었다: 특정 계층의 특정 레벨에서 메인 124:4:4 또는 메인 16 4:4:4 프로파일을 따르는 디코더는 메인 10 4:4:4 또는 메인 10 4:4:4 프로파일을 따르는 것으로 표시된 비트스트림을 디코딩할 수 있어야 하며, 지정된 계층보다 낮거나 같은 계층을 따르고, 15.5 레벨이 아니고 지정된 레벨보다 낮거나 같은 레벨을 따라야 한다.
4) 문제 4를 해결하기 위해 다음이 지정되었다: 특정 계층의 특정 레벨에서 메인 12 화면내 프로파일을 따르는 디코더는 메인 10 정지 그림 프로파일 또는 메인 10 정지 그림 프로파일을 따르고, 지정 계층보다 낮거나 같은 계층을 따르고, 레벨 15.5가 아니고 지정 레벨보다 낮거나 같은 레벨을 따르도록 표시된 비트스트림을 디코딩할 수 있어야 한다.
5) 문제 5를 해결하기 위해 다음이 지정되었다: 특정 계층의 특정 레벨에서 메인 12 4:4:4 화면내, 메인 16 4:4:4 화면내, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르는 디코더는 메인 10 프로파일 또는 메인 10 4:4:4 정지 그림 프로파일을 따르고, 지정 계층보다 낮거나 같은 계층을 따르고, 레벨 15.5가 아니고 지정 레벨보다 낮거나 같은 레벨을 따르도록 표시된 비트스트림을 디코딩할 수 있어야 한다.
6) 문제 6을 해결하기 위해 하위 항목 6.a.i에서 6.a.ix 중 하나 또는 그 이상을 사용하여 다음을 지정한다:
특정 계층(general_tier_flag의 특정 값으로 식별)의 특정 레벨(general_level_idc의 특정 값으로 식별)에서 형식 범위 확장 프로파일을 따르는 디코더는 다음 조건이 모두 적용되는 모든 비트스트림 및 부분 계층 표현을 디코딩할 수 있어야 한다:
a. 다음 조건 중 하나가 적용된다:
i. 디코더는 메인 12 프로파일을 따르고 비트스트림은 메인 10, 메인 10 정지 그림, 메인 12,메인 12 화면내 또는 메인 12 정지 그림 프로파일을 따르도록 표시된다.
ii. 디코더는 메인 12 4:4:4 프로파일을 따르고, 비트스트림은 메인 10, 메인 10 정지 그림, 메인 10 4:4:4, 메인 10 4:4:4 정지 그림, 메인 12, 메인 12 화면내, 메인 12 정지 그림, 메인 12 4:4:4, 메인 12 4:4:4 화면내 또는 메인 12 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
iii. 디코더는 메인 16 4:4:4 프로파일을 따르고, 비트스트림은 메인 10, 메인 10 정지 그림, 메인 10 4:4:4, 메인 10 4:4:4 정지 그림 또는 임의의 형식 범위 확장 프로파일을 따르도록 표시된다.
iv. 디코더는 메인 12 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 12 화면내 또는 메인 12 정지 그림 프로파일을 따르도록 표시된다.
v. 디코더는 메인 12 4:4:4 화면내 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 화면내, 메인 12 4:4:4 화면내, 메인 12 정지 그림 또는 메인 12 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
vi. 디코더는 메인 16 4:4:4 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 화면내, 메인 12 4:4:4 화면내, 메인 16 4:4:4 화면내, 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
vii. 디코더는 메인 12 프로파일을 따르고, 비트스트림은 메인 10 정지 그림 또는 메인 12 정지 그림 프로파일을 따르도록 표시된다.
viii. 디코더는 메인 12 4:4:4 정지 그림 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 정지 그림 또는 메인 12 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
ix. 디코더는 메인 16 4:4:4 정지 그림 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
b. 비트스트림은 지정된 계층보다 낮거나 같은 계층을 따르도록 표시된다.
c. 비트스트림은 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
7) 문제 4를 해결하기 위해 다음 항목 중 하나 또는 그 이상을 지정한다:
a. 특정 계층의 특정 레벨에서 메인 12 정지 그림 프로파일을 따르는 디코더는 다음 두 가지 조건이 모두 적용되는 경우 비트스트림의 제1 그림을 디코딩할 수 있어야 한다:
i. 해당 비트스트림은 메인 10, 메인 12 또는 메인 12 화면내 프로파일을 따르고, 지정된 계층보다 낮거나 같은 계층을 따르며, 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
ii. 해당 그림은 IRAP 그림이거나 ph_recovery_poc_cnt가 0이고 출력 계층에 있으며 ph_pic_output_flag가 1인 GDR 그림이다.
b. 특정 계층의 특정 레벨에서 메인 12 4:4:4 정지 그림 프로파일을 따르는 디코더는 다음 두 가지 조건이 모두 적용되는 경우 비트스트림의 제1 그림을 디코딩할 수 있어야 한다:
i. 해당 비트스트림은 메인 10, 메인 10 4:4:4, 메인 12, 메인 12 화면내, 메인 12 4:4:4, 또는 메인 12 4:4:4 화면내 프로파일을 따르고, 지정된 계층보다 낮거나 같은 계층을 따르며, 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
ii. 해당 그림은 IRAP 그림이거나 ph_recovery_poc_cnt가 0이고 출력 계층에 있으며 ph_pic_output_flag가 1인 GDR 그림이다.
c. 특정 계층의 특정 레벨에서 메인 16 4:4:4 정지 그림 프로파일을 따르는 디코더는 다음 두 가지 조건이 모두 적용되는 경우 비트스트림의 제1 그림을 디코딩할 수 있어야 한다:
i. 해당 비트스트림은 메인 10, 메인 10 4:4:4, 메인 12, 메인 12 화면내, 메인 12 4:4:4, 또는 메인 12 4:4:4 화면내, 메인 16 4:4:4, 또는 메인 16 4:4:4 화면내 프로파일을 따르고, 지정된 계층보다 낮거나 같은 계층을 따르며, 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
ii. 해당 그림은 IRAP 그림이거나 ph_recovery_poc_cnt가 0이고 출력 계층에 있으며 ph_pic_output_flag가 1인 GDR 그림이다.
3. 실시예
아래는 섹션 5에서 상기 요약된, 그 하위 항목을 포함하는 본 발명의 실시예에 따른 모든 측면에 대한 일부 예시적인 실시예이다.
3.1. 실시예 1
본 실시예는 VVC에 적용될 수 있다. 추가되거나 수정된 대부분의 관련 부분은 밑줄로 강조 표시되며, 일부 삭제된 부분은 삭제선으로 강조 표시된다. 본질적으로 편집이므로 강조되지 않는 다른 변경 사항이 있을 수 있다.
...
A3.5 형식 범위 확장 프로파일
이 하위 조항에서는 형식 범위 확장 프로파일이라고 하는 다음 프로파일을 정의한다:
― 메인 12, 메인 12 4:4:4 및 메인 16 4:4:4 프로파일
― 메인 12 화면내, 메인 12 4:4:4 화면내 및 메인 16 4:4:4 화면내 프로파일
― 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 및 메인 16 4:4:4 정지 그림 프로파일
형식 범위 확장 프로파일을 따르는 비트스트림은 다음 제약 조건을 따라야 한다:
― SPS를 참조하는 ptl_multilayer_enable_flag가 0과 동일해야 한다.
― 메인 12 정지 그림, 메인 12 4: 4: 4 정지 그림 또는 메인 16 4: 4: 4 정지 그림 프로파일에 따르는 비트스트림에는 비트스트림에 하나의 그림만 포함되어야 한다.
메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일을 따르는 비트스트림에서 모든 슬라이스의 경우 sh_slice_type의 값은 2와 같아야 한다.
― 메인 12, 메인 12 4:4:4, 메인 16 4:4:4, 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일에 따르는 비트스트림에는 활성 SPS에서 i의 모든 값에 대한 general_level_idc는 255(레벨 15.5로 표시)와 동일하지 않아야 한다.
오류! 참조 원본을 찾을 수 없습니다.에 명시된 구문 요소에 대한 허용 값은 다음과 같다.
― 하위 조항A.4 인 경우, 메인 12, 메인 12 4:4:4. 메인 16 4:4:4, 메인 12 화면내, 메인 12 4:4:4 화면내 또는 메인 16 4:4:4 화면내 프로파일에 지정된 계층 및 레벨 제약 조건은 충족되어야 한다.
표 A.1 -형식 범위 확장 프로파일의 구문 요소에 대해 허용되는 최대 값
비트스트림과 메인 12 프로파일의 일관성은 general_profile_idc가 3와 같음을 나타낸다.
비트스트림과 메인 12 화면내 프로파일의 일관성은 general_profile_idc가 11와 같음을 나타낸다.
비트스트림과 메인 12 정지 그림 프로파일의 일관성은 general_profile_idc가 67와 같음을 나타낸다.
비트스트림과 메인 12 4:4:4 프로파일의 일관성은 general_profile_idc가 35와 같음을 나타낸다.
비트스트림과 메인 12 4:4:4 화면내 프로파일의 일관성은 general_profile_idc가 43와 같음을 나타낸다.
비트스트림과 메인 12 4:4:4 정지 그림 프로파일의 일관성은 general_profile_idc가 99와 같음을 나타낸다.
비트스트림과 메인 16 4:4:4 프로파일의 일관성은 general_profile_idc가 37와 같음을 나타낸다.
비트스트림과 메인 16 4:4:4 화면내 프로파일의 일관성은 general_profile_idc가 45와 같음을 나타낸다.
비트스트림과 메인 16 4:4:4 정지 그림 프로파일의 일관성은 general_profile_idc가 101와 같음을 나타낸다.
특정 계층(general_tier_flag의 특정 값으로 식별)의 특정 레벨(general_level_idc의 특정 값으로 식별)에서 형식 범위 확장 프로파일을 따르는 디코더는 다음 조건이 모두 적용되는 모든 비트스트림 및 부분 계층 표현을 디코딩할 수 있어야 한다:
― 다음 조건 중 하나가 적용된다:
디코더는 메인 12 프로파일을 따르고 비트스트림은 메인 10, 메인 10 정지 그림, 메인 12,메인 12 화면내 또는 메인 12 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 12 4:4:4 프로파일을 따르고 비트스트림은 메인메인 10, 메인 10 정지 그림, 메인 10 4:4:4, 메인 10 4:4:4 정지 그림, 메인 12, 메인 12 화면내, 메인 12 정지 그림, 메인 12 4:4:4, 메인 12 4:4:4 화면내, 또는 메인 12 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 16 4:4:4 프로파일을 따르고, 비트스트림은 메인 10, 메인 10 정지 그림, 메인 10 4:4:4, 메인 10 4:4:4 정지 그림 또는 임의의 형식 범위 확장 프로파일을 따르도록 표시된다.
디코더는 메인 12 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 12 화면내 또는 메인 12 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 12 4:4:4 화면내 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 화면내, 메인 12 4:4:4 화면내, 메인 12 정지 그림 또는 메인 12 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 16 4:4:4 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 화면내, 메인 12 4:4:4 화면내, 메인 16 4:4:4 화면내, 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 12 프로파일을 따르고, 비트스트림은 메인 10 정지 그림 또는 메인 12 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 12 4:4:4 정지 그림 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 정지 그림 또는 메인 12 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
디코더는 메인 16 4:4:4 정지 그림 프로파일을 따르고, 비트스트림은 메인 10 정지 그림, 메인 10 4:4:4 정지 그림, 메인 12 정지 그림, 메인 12 4:4:4 정지 그림 또는 메인 16 4:4:4 정지 그림 프로파일을 따르도록 표시된다.
― 비트스트림은 지정된 계층보다 낮거나 같은 계층을 따르도록 표시된다.
― 비트스트림은 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
특정 계층의 특정 레벨에서 메인 12 정지 그림 프로파일을 따르는 디코더는 다음 두 가지 조건이 모두 적용되는 경우 비트스트림의 제1 그림을 디코딩할 수 있어야 한다:
해당 비트스트림은 메인 10, 메인 12 또는 메인 12 화면내 프로파일을 따르고, 지정된 계층보다 낮거나 같은 계층을 따르며, 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
해당 그림은 IRAP 그림이거나 ph_recovery_poc_cnt가 0이고 출력 계층에 있으며 ph_pic_output_flag가 1인 GDR 그림이다.
특정 계층의 특정 레벨에서 메인 12 4:4:4 정지 그림 프로파일을 따르는 디코더는 다음 두 가지 조건이 모두 적용되는 경우 비트스트림의 제1 그림을 디코딩할 수 있어야 한다:
해당 비트스트림은 메인 10, 메인 10 4:4:4, 메인 12, 메인 12 화면내, 메인 12 4:4:4, 또는 메인 12 4:4:4 화면내 프로파일을 따르고, 지정된 계층보다 낮거나 같은 계층을 따르며, 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
해당 그림은 IRAP 그림이거나 ph_recovery_poc_cnt가 0이고 출력 계층에 있으며 ph_pic_output_flag가 1인 GDR 그림이다.
특정 계층의 특정 레벨에서 메인 16 4:4:4 정지 그림 프로파일을 따르는 디코더는 다음 두 가지 조건이 모두 적용되는 경우 비트스트림의 제1 그림을 디코딩할 수 있어야 한다:
해당 비트스트림은 메인 10, 메인 10 4:4:4, 메인 12, 메인 12 화면내, 메인 12 4:4:4, 또는 메인 12 4:4:4 화면내, 메인 16 4:4:4, 또는 메인 16 4:4:4 화면내 프로파일을 따르고, 지정된 계층보다 낮거나 같은 계층을 따르며, 레벨 15.5가 아니고 지정된 레벨보다 낮거나 같은 레벨을 따르도록 표시된다.
해당 그림은 IRAP 그림이거나 ph_recovery_poc_cnt가 0이고 출력 계층에 있으며 ph_pic_output_flag가 1인 GDR 그림이다.
본 발명의 실시예는 VVC 범위 확장 프로파일을 위한 디코더 기능을 지정하는 것에 관한 것이다. 본 실시예은 임의의 코덱에 의해 코딩된 비디오 비트스트림, 예를 들어, VVC 표준에 대해 개별적으로 또는 다양한 조합으로 적용될 수 있다.
본 발명에서 사용되는 바와 같이, “블록”은 슬라이스, 계층, 브릭, 서브 이미지, 코딩 트리 유닛(CTU), 코딩 트리 블록(CTB), CTU 행, CTB 행, 하나 또는 복수의 코딩 유닛(CU), 하나 또는 복수의 코딩 블록(CB), 하나 또는 복수의 CTU, 하나 또는 복수의 CTB, 하나 또는 복수의 가상 파이프라인 데이터 유닛(VPDU), 그림/슬라이스/계층/브릭 내의 부속 영역, 추론 블록 등과/또는 비슷한 것을 나타낼 수 있다. 일부 실시예에서, 블록은 하나 또는 복수의 샘플, 또는 비디오 내의 하나 또는 복수의 픽셀들을 포함할 수 있다.
앞서 설명한 바와 같이, 현재 지정된 형식 범위 확장 프로파일을 따르는 비디오의 비트스트림은 상당히 많은 제약 조건을 준수해야 한다. 그러나 이러한 프로파일에 대한 디코더 기능의 지정을 포함하여 VVC 범위 확장 프로파일에 대한 현재 정의에는 몇 가지 문제가 있다: 예를 들어, 메인 12 화면내, 메인 12 4:4:4 화면내 및 메인 16 4:4:4 화면내 프로파일의 경우, 화면간 예측을 사용할 수 없도록 하는 제약 조건이 없다. 일부 다른 프로파일을 따르는 비트스트림을 디코딩할 수 있도록 일부 프로파일을 따르는 디코더의 요구 사항도 지정되지 않았다. 또한 일부 디코더 기능이 올바르게 지정되지 않았다.
이러한 문제 및 다른 잠재적인 문제의 적어도 일부를 해결하기 위해, 본 발명의 실시예는 아래 도 4를 참조하여 설명될 바와 같이, VVC 범위 확장 프로파일에 대한 해결책을 제안한다. 이러한 실시예는 일반적인 개념을 설명하기 위한 예시이며, 좁은 의미로 해석되어서는 안 된다는 점을 이해해야 한다. 또한 이러한 실시예는 개별적으로 적용되거나 어떤 방식으로든 결합될 수 있음을 이해해야 한다.
도 4은 본 발명의 일부 실시예에 따른 비디오 처리를 위한 방법(400)의 흐름도를 도시한다. 도 4에 도시된 바와 같이, (402)에서, 비디오의 대상 비디오 블록과 비디오의 비트스트림 간의 변환이 디코딩 적합성 제약에 따라 수행된다. 디코딩 적합성 제약은 제1 프로파일에 따르는 디코더가 적어도 하나의 조건이 적용될 때 비트스트림의 적어도 하나의 제1 그림을 디코딩할 수 있음을 지정한다. 적어도 하나의 조건은 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다.
일부 실시예에서, 미리 정의된 값은 10일 수 있다. 즉, 제1 프로파일은 예를 들어, 12, 16 등과 같이 10보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함한다.
일부 실시예에서, 상기 적어도 하나의 제2 비트 심도는 상기 제1 비트 심도보다 낮거나 같을 수 있다. 예를 들어, 제1 비트 심도가 12인 경우, 제2 비트 심도는 10 또는 12일 수 있다. 다른 예로, 제1 비트 심도가 16인 경우, 제2 비트 심도는 10, 12 또는 16일 수 있다.
일부 실시예에서, 제1 프로파일은 메인 12 정지 그림 프로파일을 포함할 수 있고, 적어도 하나의 제2 프로파일은 메인 10 프로파일, 메인 12 프로파일, 메인 12 화면내 프로파일 및/또는 과 같이 포함할 수 있다.
일부 실시예에서, 제1 프로파일은 메인 12 4:4:4 프로파일을 포함할 수 있고, 적어도 하나의 제2 프로파일은 다음 중 적어도 하나를 포함할 수 있다: 메인 10 프로파일, 메인 10 4:4:4 프로파일, 메인 12 프로파일, 메인 12 화면내 프로파일, 메인 12 4:4:4 프로파일 또는 메인 12 4:4:4 화면내 프로파일.
일부 실시예에서, 제1 프로파일은 메인 16 4:4:4 프로파일을 포함할 수 있고, 적어도 하나의 제2 프로파일은 다음 중 적어도 하나를 포함할 수 있다: 메인 10 프로파일, 메인 10 4:4:4 프로파일, 메인 12 프로파일, 메인 12 화면내 프로파일, 메인 12 4:4:4 프로파일, 메인 12 4:4:4 화면내 프로파일, 메인 16 4:4:4 프로파일 또는 메인 16 4:4:4 화면내 프로파일.
일부 실시예에서, 디코딩 적합성 제약은 제1 계층의 제1 레벨에서 제1 프로파일에 따르는 디코더가 적어도 하나의 조건이 적용될 때 비트스트림의 적어도 한나의 제1 그림을 디코딩할 수 있는 것을 추가로 지정할 수 있다.
일부 실시예에서, 적어도 하나의 조건은, 비트스트림이 제1 계층보다 낮거나 같은 계층에 따르도록 지시되는 제2 조건 및/또는 비트스트림이 15.5 레벨이 아니고 제1 레벨보다 낮거나 같은 레벨에 따르도록 지시되는 세 번째 조건을 더 포함할 수 있다.
일부 실시예에서, 적어도 하나의 조건은, 비트스트림의 제1 그림은 화면내 랜덤 액세스 포인트(IRAP) 그림이거나, 수출 순서가 0인 코딩된 그림의 복구 포인트를 갖는 점진적 디코딩 새로 고침(GDR) 그림인 네 번째 조건, 상기 제1 그림이 수출 계층에 있는 다섯 번째 조건 및/또는 상기 제1 그림이 미리 정의된 값으로 설정된 그림 수출 플래그를 갖는 여섯 번째 조건을 더 포함할 수도 있다. 일 예로, 네 번째 조건에서, ph_recovery_poc_cnt는 0과 같을 수 있다. 다른 예로, 여섯 번째 조건에서, 제1 그림는 ph_pic_output_flag가 1과 같을 수도 있다.
일부 실시예에서, 변환은 대상 비디오 블록을 비트스트림으로 코딩하는 것을 포함할 수 있다. 대안적으로, 변환은 비트스트림으로부터 대상 비디오 블록을 디코딩하는 것을 포함할 수도 있다. 즉, 방법(400)은 비트스트림의 인코더 및 디코더 모두에서 수행될 수 있다.
발명의 추가 실시예에 따르면, 제1 비디오의 비트스트림은 비일시적 컴퓨터 판독가능한 기록 매체에 저장될 수 있다. 비트스트림은 디코딩 적합성 제약에 따라 비디오 처리 장치에 의해 수행되는 방법에 의해 생성된다. 디코딩 적합성 제약은 제1 프로파일에 따르는 디코더가 적어도 하나의 조건이 적용될 때 비트스트림의 적어도 하나의 제1 그림을 디코딩할 수 있음을 지정한다. 적어도 하나의 조건은 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다.
일부 실시예에서 비디오의 비트스트림을 저장하기 위한 방법 제안된다. 비트스트림은 디코딩 적합성 제약에 따라 생성된다. 디코딩 적합성 제약은 제1 프로파일에 따르는 디코더가 적어도 하나의 조건이 적용될 때 비트스트림의 적어도 하나의 제1 그림을 디코딩할 수 있음을 지정한다. 적어도 하나의 조건은 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함한다. 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비 정지 그림 프로파일을 포함한다. 그런 다음 비트스트림은 비일시적인 컴퓨터 판독가능한 기록 매체에 저장된다.
본 발명의 실시예는 아래의 조항들을 고려하여 설명될 수 있으며, 그 특징은 어떤 합리적인 방법으로 조합될 수 있다.
조항 1. 비디오 처리를 위한 방법은: 디코딩 적합성 제약에 따라 비디오의 대상 비디오 블록과 비디오의 비트스트림 간의 변환을 수행하는 단계를 포함하고,디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 비트스트림의 적어도 하나의 제1 그림을 디코딩을 수행할 수 있음을 지정하고, 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함하고, 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비정지 그림 프로파일을 포함한다.
조항 2. 조항1에 있어서, 상기 미리 정의된 값은 10인, 방법.
조항 3. 조항1 또는 조항2에 있어서, 상기 적어도 하나의 제2 비트 심도는 제1 비트 심도보다 낮거나 같은, 방법.
조항 4. 조항1 내지 조항3 중 임의의 항에 있어서, 상기 제1 프로파일은 메인 12 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 다음 중 적어도 하나를 포함하는, 방법: 메인 10 프로파일, 메인 12 프로파일, 또는 메인 12 화면내 프로파일.
조항 5. 조항1 내지 조항4 중 임의의 항에 있어서, 상기 제1 프로파일은 메인 12 4:4:4 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 다음 중 적어도 하나를 포함하는, 방법: 메인 10 프로파일, 메인 10 4:4:4 프로파일, 메인 12 프로파일, 메인 12 화면내 프로파일, 메인 12 4:4:4 프로파일 또는 메인 12 4:4:4 화면내 프로파일.
조항 6. 조항1 내지 조항5 중 임의의 항에 있어서, 상기 제1 프로파일은 메인 16 4:4:4 정지 그림 프로파일을 포함하고, 적어도 하나의 세 번째 프로파일은 다음 중 적어도 하나를 포함하는, 방법: 메인 10 프로파일, 메인 10 4:4:4 프로파일, 메인 12 프로파일, 메인 12 화면내 프로파일, 메인 12 4:4:4 프로파일, 메인 12 4:4:4 화면내 프로파일, 메인 16 4:4:4 프로파일 또는 메인 16 4:4:4 화면내 프로파일.
조항 7. 조항1 내지 조항6 중 임의의 항에 있어서, 상기 디코딩 적합성 제약은 제1 계층의 제1 레벨에서 제1 프로파일에 따르는 디코더가 적어도 하나의 조건이 적용될 때 비트스트림의 적어도 하나의 제1 그림을 디코딩할 수 있는 것을 추가로 지정하는, 방법.
조항 8. 조항7에 있어서, 적어도 하나의 조건은 상기 비트스트림이 제1 계층보다 낮거나 같은 계층에 따르도록 지시되는 세 번째 조건, 비트스트림이 15.5 레벨이 아니고 제1 레벨보다 낮거나 같은 레벨에 따르도록 지시되는 제2 조건 중 적어도 하나를 더 포함하는, 적어도 하나의 조건.
조항 9. 조항1 내지 조항 8 중 임의의 항에 있어서, 상기 적어도 하나의 조건은 다음 중 적어도 하나를 더 포함하는, 방법: 비트스트림의 제1 그림은 화면내 랜덤 액세스 포인트(IRAP) 그림이거나, 수출 순서가 0인 코딩된 그림의 복구 포인트를 갖는 점진적 디코딩 새로 고침(GDR) 그림인 네 번째 조건, 상기 제1 그림이 수출 계층에 있는 다섯 번째 조건 및/또는 상기 제1 그림이 미리 정의된 값으로 설정된 그림 수출 플래그를 갖는 여섯 번째 조건을 더 포함할 수도 있다.
조항 10. 조항 1 내지 조항9 중 임의의 항에 있어서, 상기 변환은 상기 대상 비디오 블록을 상기 비트스트림으로 코딩하는 단계를 포함하는, 변환.
조항 11. 조항 1 내지 조항9 중 임의의 항에 있어서, 상기 변환은 상기 비트스트림으로부터 상기 대상 비디오 블록을 디코딩하는 단계를 포함하는, 변환.
조항 12. 조항 1 내지 조항 11 중 임의의 조항에 따른 방법이 상기 프로세서에 의해 실행될 때 상기 명령어는 상기 프로세서로 하여금 수행되도록 하는, 프로세서 및 명령어가 있는 비일시적 메모리를 포함하는, 비디오 데이터를 처리하기 위한 장치.
조항 13. 조항 1 내지 조항 11 중 임의의 조항에 따른 방법을 프로세서로 하여금 수행하게 하는 명령어들을 저장하는, 비일시적 컴퓨터 판독가능한 저장 매체.
조항 14. 비디오 처리 장치에 의해 수행되는 방법에 의해 생성되는 비디오의 비트스트림을 저장하는 비일시적 컴퓨터 판독가능한 기록 매체로서, 상기 방법은 디코딩 적합성 제약에 따라 상기 비트스트림을 생성하는 것을 포함하고,디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 비트스트림의 적어도 하나의 제1 그림을 디코딩을 수행할 수 있음을 지정하고, 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함하고, 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비정지 그림 프로파일을 포함한다.
조항 15. 비디오의 비트스트림을 저장하기 위한 방법은 디코딩 적합성 제약에 따라 비트스트림을 생성하는 것을 포함하고, 디코딩 적합성 제약은, 적어도 하나의 조건이 적용될 때, 제1 프로파일에 따르는 디코더가 비트스트림의 적어도 하나의 제1 그림을 디코딩을 수행할 수 있음을 지정하고, 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일에 따르도록 지시되는 제1 조건을 포함하고, 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 정지 그림 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비정지 그림 프로파일을 포함한다.
예시 장치
도 5는 본 발명의 다양한 실시예가 구현될 수 있는 컴퓨팅 장치(500)의 블록도를 도시한다. 컴퓨팅 장치(500)는 소스 장치(110)(또는 비디오 인코더(114) 또는 (200)) 또는 목표 장치(120)(또는 비디오 디코더(124) 또는 (300))로서 구현되거나 그에 포함될 수 있다.
도 5에 도시된 컴퓨팅 장치(500)는 어떠한 방식으로도 본 발명의 실시예의 기능 및 범위에 대한 어떠한 제한도 제안하지 않고, 단지 도시를 위한 것이라는 것을 인식할 것이다.
도 5에 도시된 바와 같이, 컴퓨팅 장치(500)는 범용 컴퓨팅 장치(500)를 포함한다. 컴퓨팅 장치(500)는 적어도 하나 또는 그 이상의 프로세서들 또는 처리부(510), 메모리(520), 저장부(530), 하나 또는 그 이상의 통신부(540), 하나 또는 그 이상의 입력 장치(550), 및 하나 또는 그 이상의 출력 장치(560)를 포함할 수 있다.
일부 실시예에서, 컴퓨팅 장치(500)는 컴퓨팅 능력을 갖는 임의의 사용자 단말 또는 서버 단말로서 구현될 수 있다. 서버 단말은 서비스 제공자에 의해 제공되는 서버 또는 대규모 컴퓨팅 장치 등일 수 있다. 사용자 단말은 예를 들어, 휴대 전화, 스테이션, 유닛, 장치, 멀티미디어 컴퓨터, 멀티미디어 태블릿, 인터넷 노드, 통신기, 데스크톱 컴퓨터, 휴대용 컴퓨터, 노트북 컴퓨터, 태블릿 컴퓨터, 태블릿 컴퓨터, 개인 통신 시스템(PCS) 장치, 개인 네비게이션 장치, 개인 디지털 어시스턴트(PDA), 오디오/비디오 플레이어, 디지털 카메라/비디오 카메라, 포지셔닝 장치, 텔레비전 수신기, 라디오 방송 수신기, 전자책 장치, 게임 장치, 또는 이들의 임의의 조합을 포함하는 임의의 유형의 휴대 단말일 수 있다. 컴퓨팅 장치(500)는 사용자에 대한 임의의 유형의 인터페이스(예를 들어, “착용식” 회로 등)를 지원할 수 있다고 상상할 수 있다.
처리부(510)는 물리적 프로세서 또는 가상 프로세서일 수 있으며, 메모리(520)에 저장된 프로그램을 기반으로 다양한 프로세스를 구현할 수 있다. 멀티-프로세서 시스템에서, 컴퓨팅 장치(500)의 병렬 처리 능력을 향상시키기 위해, 복수의 처리부는 컴퓨터 실행가능한 명령어를 병렬로 실행한다. 처리부(510)은 중앙처리부(CPU), 마이크로프로세서, 컨트롤러 또는 마이크로컨트롤러로 지칭될 수도 있다.
컴퓨팅 장치(500)는 전형적으로 다양한 컴퓨터 저장 매체를 포함한다. 이러한 매체는 휘발성 및 비휘발성 매체, 또는 분리형 및 비분리형 매체를 포함하되 이에 제한되지 않는 컴퓨팅 장치(500)에 의해 액세스 가능한 임의의 매체일 수 있다. 메모리(520)는 휘발성 메모리(예를 들어, 레지스터, 캐시, 랜덤 액세스 메모리(RAM)), 비 휘발성 메모리(예를 들어, 읽기용 기억 장치(ROM), 전기적 소거 및 프로그램 가능 읽기 전용 기억 장치(EEPROM)), 또는 플래시 메모리 중 임의의 조합일 수 있다. 저장부(530)는 임의의 분리형 또는 비분리형 매체일 수 있고, 메모리, 플래시 메모리 드라이브, 자기 디스크 또는 다른 매체와 같은 기계 판독가능한 매체를 포함할 수 있으며, 이는 정보 및/또는 데이터를 저장하기 위해 사용될 수 있고 컴퓨팅 장치(500)에서 액세스될 수 있다.
컴퓨팅 장치(500)는 추가적인 분리형/비분리형, 휘발성/비휘발성 메모리 매체를 더 포함할 수 있다. 도 5에 도시되지 않았지만, 분리형 및 비휘발성 자기 디스크로 판독 및/또는 기입하기 위한 자기 디스크 드라이브 및 분리형 및 비휘발성 광학 디스크로 판독 및/또는 기입하기 위한 광학 디스크 드라이브를 제공할 수 있다. 이러한 경우 각 드라이브는 하나 이상의 데이터 매체 인터페이스를 통해 버스(미도시)에 연결될 수 있다.
통신부(540)는 통신 매체를 통해 다른 컴퓨팅 장치와 통신을 수행한다. 또한, 컴퓨팅 장치(500) 내의 구성요소의 기능은 통신 연결을 통해 통신할 수 있는 단일 컴퓨팅 클러스터 또는 복수의 컴퓨팅 장치에 의해 구현될 수 있다. 따라서, 컴퓨팅 장치(500)는 하나 또는 그 이상의 다른 서버, 네트워크화된 개인용 컴퓨터(PC)들 또는 더 나아가 일반적인 네트워크 노드와의 논리적인 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다.
입력 장치(550)는 마우스, 키보드, 트래킹 볼, 음성 입력 장치 등과 같은 다양한 입력 장치 중 하나 또는 그 이상일 수 있다. 출력 장치(560)는 디스플레이, 라우드스피커, 프린터 등과 같은 다양한 출력 장치들 중 하나 또는 그 이상일 수 있다. 통신부(540)에 의해, 컴퓨팅 장치(500)는 저장 장치 및 디스플레이 장치와 같은 하나 또는 그 이상의 외부 장치와 통신할 수 있으며, 사용자가 컴퓨팅 장치(500)와 상호 작용할 수 있는 하나 또는 그 이상의 장치 또는 임의의 장치(예: 네트워크 카드, 모뎀 등) 와 통신할 수 있으므로 컴퓨팅 장치(500)는 필요할 때 하나 또는 그 이상의 다른 컴퓨팅 장치와 통신할 수 있다. 이러한 통신은 입력/출력(I/O) 인터페이스(미도시)를 통해 수행될 수 있다.
일부 실시예에서, 단일 장치에 통합되는 대신, 컴퓨팅 장치(500)의 일부 또는 모든 구성요소는 또한 클라우드 컴퓨팅 아키텍처에 배열될 수 있다. 클라우드 컴퓨팅 아키텍처에서, 구성요소는 원격으로 제공될 수 있고, 본 발명에서 기술된 기능을 구현하기 위해 함께 작동할 수 있다. 일부 실시예에서, 클라우드 컴퓨팅은 컴퓨팅, 소프트웨어, 데이터 액세스 및 스토리지 서비스를 제공하며, 이는 최종 사용자가 이러한 서비스를 제공하는 시스템 또는 하드웨어의 물리적 위치 또는 구성을 인식할 필요가 없다. 다양한 실시예에서, 클라우드 컴퓨팅은 적합한 프로토콜을 사용하여 광역 네트워크(예를 들어, 인터넷)를 통해 서비스을 제공한다. 예를 들어, 클라우드 컴퓨팅 제공자는 웹 브라우저 또는 기타 컴퓨팅 구성요소를 통해 액세스할 수 있는 광역 네트워크를 통해 응용 프로그램을 제공한다. 클라우드 컴퓨팅 아키텍처의 소프트웨어 또는 구성요소 및 이에 대응하는 데이터는 원격 위치의 서버에 저장될 수 있다. 클라우드 컴퓨팅 환경의 컴퓨팅 원은 원격 데이터 센터의 위치에 병합되거나 분산될 수 있다. 클라우드 컴퓨팅 인프라는 사용자에게 단일 액세스 포인트 역할을 하지만 공유 데이터 센터를 통해 서비스를 제공할 수 있다. 따라서, 클라우드 컴퓨팅 아키텍처들은 원격 위치의 서비스 제공자로부터 본 명세서에 기술된 구성요소 및 기능을 제공하기 위해 사용될 수 있다. 또는 기존 서버에서 제공하거나 클라이언트 장치에 직접 설치할 수도 있다.
컴퓨팅 장치(500)는 본 발명의 실시예에서 비디오 코딩/복화화를 구현하기 위해 사용될 수 있다. 메모리(520)는 하나 또는 그 이상의 프로그램 명령어를 갖는 하나 또는 그 이상의 비디오 코딩 모듈(525)을 포함할 수 있다. 이들 모듈은 본 발명에 기술된 다양한 실시예의 기능들 수행하기 위해 처리부(510)에 의해 액세스 가능하고 실행가능한다.
비디오 코딩을 수행하는 예시적인 실시예에 있어서, 입력 장치(550)는 코딩될 비디오 데이터를 입력(570)으로 수신할 수 있다. 비디오 데이터는 예를 들어, 비디오 코딩 모듈(525)에 의해 코딩된 비트스트림을 생성하기 위해 처리될 수 있다. 코딩된 비트스트림은 출력 장치(560)를 통해 출력(580)으로서 제공될 수 있다.
비디오 디코딩을 수행하는 예시적인 실시예에 있어서, 입력 장치(550)는 코딩될 비트스트림을 입력(570)으로서 수신할 수 있다. 코딩된 비트스트림은 예를 들어, 비디오 코딩 모듈(525)에 의해 처리되어 디코딩된 비디오 데이터를 생성할 수 있다. 코딩된 비디오 데이터는 출력 장치(560)를 통해 출력(580)으로서 제공될 수 있다.
본 명세서가 특히 그의 바람직한 실시예를 참조하여 도시되고 기술되었지만, 첨부된 청구항들에 의해 정의된 본 출원의 정신 및 범위를 벗어나지 않는 상황에서 그 안에 형식 및 세부 사항의 다양한 변경이 이루어질 수 있음은 당업자들에 의해 이해될 것이다. 이러한 변경은 본 출원의 범위에서 포함되도록 설계되어 있다. 이와 같이, 본 출원의 실시예에 대한 전술된 설명은 제한적인 것을 의도하지 않는다.

Claims (15)

  1. 비디오 처리 방법으로서,
    디코딩 적합성 제약 조건에 따라 비디오의 대상 비디오 블록과 비디오의 비트스트림 간의 변환을 수행하는 단계를 포함하고,
    디코딩 적합성 제약 조건은, 적어도 하나의 조건이 적용될 때, 제1 프로파일을 따르는 디코더가 상기 비트스트림의 적어도 하나의 제1 그림을 디코딩할 수 있음을 지정하고, 적어도 하나의 조건은, 상기 비트스트림이 적어도 하나의 제2 프로파일을 따르도록 지시되는 제1 조건을 포함하고,
    상기 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 스틸 픽처 프로파일을 포함하고, 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비스틸 픽처 프로파일을 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  2. 제1항에 있어서,
    상기 미리 정의된 값은 10인 것을 특징으로 하는, 비디오 처리를 위한 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 적어도 하나의 제2 비트 심도는 제1 비트 심도 이하인 것을 특징으로 하는, 비디오 처리를 위한 방법.
  4. 제1항 내지 제3항 중 임의의 항에 있어서,
    상기 제1 프로파일은 메인 12 스틸 픽처 프로파일을 포함하고,
    상기 적어도 하나의 제2 프로파일은 메인 10 프로파일, 메인 12 프로파일, 또는 메인 12 인트라 프로파일 중 적어도 하나를 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  5. 제1항 내지 제4항 중 임의의 항에 있어서,
    상기 제1 프로파일은 메인 12 4:4:4 스틸 픽처 프로파일을 포함하고,
    상기 적어도 하나의 제2 프로파일은 메인 10 프로파일, 메인 10 4:4:4 프로파일, 메인 12 프로파일, 메인 12 인트라 프로파일, 메인 12 4:4:4 프로파일 또는 메인 12 4:4:4 인트라 프로파일 중 적어도 하나를 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  6. 제1항 내지 제5항 중 임의의 항에 있어서,
    상기 제1 프로파일은 메인 16 4:4:4 스틸 픽처 프로파일을 포함하고,
    상기 적어도 하나의 제2 프로파일은 메인 10 프로파일, 메인 10 4:4:4 프로파일, 메인 12 프로파일, 메인 12 인트라 프로파일, 메인 12 4:4:4 프로파일, 메인 12 4:4:4 인트라 프로파일, 메인 16 4:4:4 프로파일 또는 메인 16 4:4:4 인트라 프로파일 중 적어도 하나를 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  7. 제1항 내지 제6항 중 임의의 항에 있어서,
    상기 디코딩 적합성 제약 조건은 제1 계층의 제1 레벨에서 제1 프로파일을 따르는 디코더가 적어도 하나의 조건이 적용될 때 비트스트림의 적어도 제1 그림을 디코딩할 수 있다는 것을 추가로 지정하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  8. 제7항에 있어서,
    상기 적어도 하나의 조건은,
    상기 비트스트림이 제1 계층보다 낮거나 같은 계층을 따르도록 표시되는 제2 조건, 또는
    비트스트림이 레벨 15.5가 아니고 제1 레벨 이하인 레벨을 따르도록 표시되는 제3 조건 중 적어도 하나를 더 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  9. 제1항 내지 제8항 중 임의의 항에 있어서,
    상기 적어도 하나의 조건은,
    상기 비트스트림의 제1 그림이 인트라 랜덤 액세스 포인트(IRAP) 그림이거나, 출력 순서에서 디코딩된 그림의 복구 포인트가 0인 점진적 디코딩 새로 고침(GDR) 그림인 제4 조건,
    상기 제1 그림이 출력층에 있는 제5 조건, 또는
    상기 제1 그림이 미리 정의된 값으로 설정된 그림 출력 플래그를 갖는 제6 조건 중 적어도 하나를 더 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  10. 제1항 내지 제9항 중 임의의 항에 있어서,
    상기 변환은 상기 대상 비디오 블록을 상기 비트스트림으로 인코딩하는 단계를 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  11. 제1항 내지 제9항 중 임의의 항에 있어서,
    상기 변환은 상기 비트스트림으로부터 상기 대상 비디오 블록을 디코딩하는 단계를 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  12. 프로세서와 명령어가 있는 비일시적 메모리를 포함하는 비디오 데이터를 처리하기위한 장치로서,
    상기 명령어는 상기 프로세서에 의해 실행될 때, 상기 프로세서로 하여금 제1항 내지 제11항 중 임의의 조항에 따른 방법을 수행하도록 하는 것을 특징으로 하는, 비디오 처리를 위한 장치.
  13. 비일시적인 컴퓨터 판독 가능한 저장 매체로서,
    프로세서가 제1항 내지 제11항 중 임의의 항에 따른 방법을 수행하도록 하는 명령어를 저장하는 것을 특징으로 하는, 비디오 처리를 위한 저장 매체.
  14. 비디오 처리 장치를 통해 수행되는 방법에 의해 생성되는 비디오의 비트스트림을 저장하는 비일시적 컴퓨터 판독 가능한 기록 매체로서, 상기 방법은,
    디코딩 적합성 제약 조건에 따라 비트스트림을 생성하는 단계를 포함하고,
    상기 디코딩 적합성 제약 조건은, 적어도 하나의 조건이 적용될 때, 제1 프로파일을 따르는 디코더가 비트스트림의 적어도 제1 그림을 디코딩을 수행할 수 있음을 지정하고, 적어도 하나의 조건은, 상기 비트스트림이 적어도 하나의 제2 프로파일을 따르도록 지시되는 제1 조건을 포함하고,
    상기 제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 스틸 픽처 프로파일을 포함하고, 상기 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비스틸 픽처 프로파일을 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
  15. 비디오의 비트스트림을 저장하는 방법으로서,
    디코딩 적합성 제약 조건에 따라 비트스트림을 생성하는 단계,
    디코딩 적합성 제약 조건은, 적어도 하나의 조건이 적용될 때, 제1 프로파일을 따르는 디코더가 비트스트림의 적어도 하나의 제1 그림을 디코딩할 수 있음을 지정하고, 상기 적어도 하나의 조건은, 비트스트림이 적어도 하나의 제2 프로파일을 따르도록 지시되는 제1 조건을 포함하고,
    제1 프로파일은 미리 정의된 값보다 높은 제1 비트 심도에 대응하는 스틸 픽처 프로파일을 포함하고, 상기 적어도 하나의 제2 프로파일은 적어도 하나의 제2 비트 심도에 대응하는 적어도 하나의 비스틸 픽처 프로파일을 포함하고; 및
    상기 비트스트림을 비일시적 컴퓨터 판독 가능한 기록 매체에 저장하는 단계를 포함하는 것을 특징으로 하는, 비디오 처리를 위한 방법.
KR1020247010675A 2021-09-30 2022-09-29 비디오 처리를 위한 방법, 장치 및 매체 KR20240051251A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163250772P 2021-09-30 2021-09-30
US63/250,772 2021-09-30
PCT/US2022/077265 WO2023056360A1 (en) 2021-09-30 2022-09-29 Method, apparatus and medium for video processing

Publications (1)

Publication Number Publication Date
KR20240051251A true KR20240051251A (ko) 2024-04-19

Family

ID=85783648

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020247010675A KR20240051251A (ko) 2021-09-30 2022-09-29 비디오 처리를 위한 방법, 장치 및 매체
KR1020247010719A KR20240051256A (ko) 2021-09-30 2022-09-29 비디오 처리를 위한 방법, 장치 및 매체
KR1020247010676A KR20240051252A (ko) 2021-09-30 2022-09-30 비디오 처리를 위한 방법, 장치 및 매체

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020247010719A KR20240051256A (ko) 2021-09-30 2022-09-29 비디오 처리를 위한 방법, 장치 및 매체
KR1020247010676A KR20240051252A (ko) 2021-09-30 2022-09-30 비디오 처리를 위한 방법, 장치 및 매체

Country Status (3)

Country Link
KR (3) KR20240051251A (ko)
CN (3) CN118044196A (ko)
WO (3) WO2023056358A1 (ko)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2604669C2 (ru) * 2011-06-28 2016-12-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для предсказания компоненты цветности изображения с использованием компоненты яркости изображения
AU2013206815A1 (en) * 2013-07-11 2015-03-05 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
US10142642B2 (en) * 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
US9918091B2 (en) * 2014-06-20 2018-03-13 Qualcomm Incorporated Systems and methods for assigning a minimum value to a syntax structure in a parameter set
US10091532B2 (en) * 2014-06-26 2018-10-02 Qualcomm Incorporated Bitstream conformance constraints in scalable video coding
WO2017020021A1 (en) * 2015-07-29 2017-02-02 Vid Scale, Inc. Scalable high efficiency video coding to high efficiency video coding transcoding
US10798422B2 (en) * 2015-10-20 2020-10-06 Intel Corporation Method and system of video coding with post-processing indication
FR3078798B1 (fr) * 2018-03-12 2021-04-30 Ateme Procede de selection de profils d'encodage d'un contenu multimedia pour une diffusion a la demande
CN112771885B (zh) * 2018-09-18 2023-04-25 诺基亚技术有限公司 用于针对视频编码的非二进制简档约束信令的方法和装置
EP3857889A4 (en) * 2018-11-16 2021-09-22 Beijing Bytedance Network Technology Co. Ltd. WEIGHTS IN COMBINED INTER-INTRA PREDICTION MODE
WO2020156546A1 (en) * 2019-02-02 2020-08-06 Beijing Bytedance Network Technology Co., Ltd. Prediction using extra-buffer samples for intra block copy in video coding

Also Published As

Publication number Publication date
KR20240051252A (ko) 2024-04-19
WO2023056445A1 (en) 2023-04-06
CN118044196A (zh) 2024-05-14
WO2023056360A1 (en) 2023-04-06
CN118044197A (zh) 2024-05-14
WO2023056358A1 (en) 2023-04-06
CN118056402A (zh) 2024-05-17
KR20240051256A (ko) 2024-04-19

Similar Documents

Publication Publication Date Title
JP7055833B2 (ja) 並列処理のためのイントラブロックコピー予測制限
CN111869212B (zh) 视频解码方法、装置和可读介质
JP6716611B2 (ja) スライスレベルのイントラブロックコピーおよび他のビデオコーディングの改善
CN113632485A (zh) 用于参考图片重采样的信令
KR20220020809A (ko) 스케일러빌리티 지원을 위한 동일한 픽처 순서 카운트 (poc) 넘버링
CN117560496A (zh) 条带类型和视频层的信令通知
CN114270857A (zh) 用于发信号通知跳过模式标志的方法和装置
US20240040157A1 (en) Multiview acquisition information supplemental enhancement information
KR20240050412A (ko) 비디오 처리를 위한 방법, 기기 및 매체
CN112333449B (zh) 视频解码的方法和装置、计算机设备和存储介质
KR20230016050A (ko) 점진적인 디코딩 리프레시 및 레퍼런스 픽처 목록의 시그널링
KR20240051251A (ko) 비디오 처리를 위한 방법, 장치 및 매체
WO2024061136A1 (en) Method, apparatus, and medium for video processing
KR20240068711A (ko) 동영상을 처리하는 방법, 장치 및 매체
RU2773642C1 (ru) Сигнализация для передискретизации опорного изображения
WO2024061331A1 (en) Method, apparatus, and medium for video processing
US20240205394A1 (en) Method, device, and medium for video processing
WO2023092019A1 (en) Method, apparatus, and medium for video processing
WO2023056455A1 (en) Methods, apparatus, and medium for video prcessing
WO2023137477A2 (en) Method, apparatus, and medium for video processing
WO2024054927A1 (en) Method, apparatus, and medium for video processing
WO2023158998A2 (en) Method, apparatus, and medium for video processing
CN118266221A (en) Method, apparatus and medium for video processing
CN117356094A (zh) 用于视频处理的方法、设备和介质
WO2023159143A2 (en) Method, apparatus, and medium for video processing