KR20240068711A - 동영상을 처리하는 방법, 장치 및 매체 - Google Patents

동영상을 처리하는 방법, 장치 및 매체 Download PDF

Info

Publication number
KR20240068711A
KR20240068711A KR1020247012892A KR20247012892A KR20240068711A KR 20240068711 A KR20240068711 A KR 20240068711A KR 1020247012892 A KR1020247012892 A KR 1020247012892A KR 20247012892 A KR20247012892 A KR 20247012892A KR 20240068711 A KR20240068711 A KR 20240068711A
Authority
KR
South Korea
Prior art keywords
profile
bitstream
main
video
general
Prior art date
Application number
KR1020247012892A
Other languages
English (en)
Inventor
예-쿠이 왕
Original Assignee
바이트댄스 아이엔씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이트댄스 아이엔씨 filed Critical 바이트댄스 아이엔씨
Publication of KR20240068711A publication Critical patent/KR20240068711A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

본 발명의 실시예는 동영상을 처리하는 방법을 제공한다. 방법은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 동영상의 타겟 동영상 블록과 동영상의 비트스트림 사이의 변환을 수행하는 단계를 포함하며, 여기서, 일반 프로파일 지시기의 적어도 2개의 비트는 프로파일에 대한 비트 심도를 나타내기 위해 결합된다.

Description

동영상을 처리하는 방법, 장치 및 매체
[관련출원]
본 출원은 2021년 10월 8일에 출원된 미국 가출원 제63/253,890의 우선권을 주장하며, 그 전체 내용은 참조로서 본 명세서에 통합된다.
[기술분야]
본 발명의 실시예는 일반적으로 동영상 코딩 기술에 관한 것이며, 특히 프로파일 지시기 값을 사용하여 프로파일을 표시하는 것에 관한 것이다.
동영상 코딩 표준은 주로 잘 알려진 ITU-T 및 ISO/IEC 표준의 개발을 통해 발전해 왔다. ITU-T는 H.261 및 H.263을 제작하고, ISO/IEC는 MPEG-1 및 MPEG-4 Visual을 제작하며, 이 두 조직이 공동으로 H.262/MPEG-2 동영상, H.264/MPEG-4 고도 동영상 부호화(AVC) 및 H.265/HEVC 표준을 제작하였다. H.262 이후, 동영상 코딩 표준은 시간적 예측과 변환 코딩이 이용되는 하이브리드 동영상 코딩 구조를 기반으로 한다. HEVC 이상의 미래 동영상 코딩 기술을 탐구하기 위해, 2015년에 VCEG와 MPEG가 공동으로 합동영상탐험대(Joint Video Exploration Team, JVET)를 설립하였다. 그 이후로, JVET는 많은 새로운 방법을 채택하여 공동탐사모험(Joint Exploration Model, JEM)이라는 참조 소프트웨어에 추가하였다. 그 후, VVC 프로젝트가 공식적으로 시작되었을 때, JVET는 JVET로 명칭이 변경되었다. VVC는 HEVC에 비해 비트 전송률을 50% 감소시키는 것을 목표로 하는 새로운 코딩 표준이다.
VVC 표준 및 관련된 코딩 동영상 비트스트림용 다용도 보충 강화 정보(Versatile Supplemental Enhancement Information for coded video bitstreams, VSEI) 표준은 텔레비전 방송, 화상 회의 또는 저장 매체에서의 재생과 같은 전통적인 용도뿐만 아니라, 적응형 비트 전송률 스트리밍, 동영상 영역 추출, 여러 코딩된 동영상 비트스트림의 콘텐츠 구성 및 병합, 다중 뷰 동영상, 확장 가능한 레이어 코딩 및 뷰포트 적응형 360° 몰입형 미디어와 같은 새롭고 고급 사용 사례도 포함하여 최대한 광범위한 애플리케이션에서 사용하도록 설계되었다. VVC 표준 개정안의 최신 초안에는 범위 확장 프로파일의 사양 및 기타 측면이 포함되어 있다.
본 발명의 실시예는 동영상을 처리하기 위한 해결책을 제공한다.
제1 측면에서, 동영상 처리 방법이 제안된다. 상기 방법은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 동영상의 타겟 동영상 블록과 상기 동영상의 비트스트림 사이의 변환을 수행하는 단계를 포함하며, 상기 일반 프로파일 지시기의 적어도 2개의 비트는 상기 프로파일에 대한 비트 심도를 나타내기 위해 결합된다. 본 개시의 제1 측면에 따른 방법은, 프로파일의 비트 심도를 표시하기 위한 효율성을 효과적으로 향상시킨다.
제2 측면에서, 동영상 데이터를 처리하는 장치가 제안된다. 장치는 프로세서 및 명령이 포함된 비일시적 메모리를 포함한다. 명령은 프로세서에 의해 실행될 때, 프로세서로 하여금 제1 측면에 따른 방법을 수행하도록 한다.
제3 측면에서, 동영상 데이터를 처리하는 장치가 제안된다. 비일시적 컴퓨터 판독 가능 저장 매체는 프로세서로 하여금 제1 측면에 따른 방법을 수행하도록 하는 명령을 저장한다.
제4 측면에서, 비일시적 컴퓨터 판독 가능 기록 매체가 제안된다. 비일시적 컴퓨터 판독 가능 기록 매체는, 동영상 처리 장치를 통해 수행되는 방법에 의해 생성된 동영상의 비스트림을 저장한다. 상기 방법은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여 비트스트림을 생성하는 단계를 포함하며, 여기서 일반 프로파일 지시기의 적어도 2개의 비트는 프로파일에 대한 비트 심도를 표시하는 위해 결합된다.
제5 측면에서, 동영상의 비스트림을 저장하는 다른 방법이 제안된다. 방법은 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여 비트스트림을 생성하는 단계로서, 일반 프로파일 지시기의 적어도 2개의 비트가 결합되어 프로파일에 대한 비트 심도를 표시하는 단계; 및 비트스트림을 비일시적 컴퓨터 판독 가능 기록 매체에 저장하는 단계를 포함한다.
본 발명 내용은, 아래 상세한 설명에서 추가로 설명되는 단순화된 형태로 개념 선택을 소개하기 위해 제공된다. 본 발명 내용은 청구된 주제의 주요 특징 또는 필수 특징을 식별하려는 의도가 없으며, 청구된 주제의 범위를 제한하기 위해 사용하려는 의도도 없다.
첨부된 도면을 참조한 이하의 상세한 설명을 통해, 본 발명의 예시적인 실시예의 상기 목적 및 기타 목적, 특징 및 이점이 더욱 명백해진다. 본 발명의 실시예에서, 동일한 참조번호는 일반적으로 동일한 구성요소를 지칭한다.
도 1은 본 발명의 일부 실시예에 따른 예시적인 동영상 코딩 시스템(100)을 나타내는 블록도이다.
도 2는 본 발명의 일부 실시예에 따른 제1 예시적인 동영상 인코더(200)를 나타내는 블록도이다.
도 3은 본 발명의 일부 실시예에 따른 예시적인 동영상 디코더(300)를 나타내는 블록도이다.
도 4는 본 발명의 일부 실시예에 따른 동영상 처리 방법(400)을 나타내는 흐름도이다.
도 5는 본 발명의 다양한 실시예를 구현할 수 있는 컴퓨팅 장치(500)를 나타내는 블록도이다.
도면 전반에 걸쳐, 동일하거나 유사한 참조번호는 일반적으로 동일하거나 유사한 구성요소를 지칭한다.
이제 일부 실시예를 참조하여 본 발명의 원리에 대해 설명한다. 이러한 실시예는 설명의 목적으로만 설명되었으며, 본 발명의 범위에 대한 어떠한 제한도 제시하지 않고, 당업자가 본 발명을 이해하고 구현하는 데 도움을 주는 것으로 이해되어야 한다. 본 명세서에서 설명되는 개시는 아래에서 설명되는 것 외에도 다양한 방식으로 구현될 수 있다.
달리 정의되지 않는 한, 다음의 설명 및 청구범위에서 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술분야에서 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명에서 "일 실시예", "실시예", "예시적인 실시예" 등의 언급은 설명된 실시예가 특정 기능, 구조 또는 특성을 포함할 수 있다는 것을 나타내지만, 모든 실시예가 반드시 특정 기능, 구조 또는 특성을 포함해야 하는 것은 아니다. 또한, 이러한 문구는 반드시 동일한 실시예를 언급하는 것은 아니다. 또한, 특정 기능, 구조 또는 특성이 예시적인 실시예와 관련하여 설명되는 경우, 명시적으로 설명되었는지 여부에 관계없이 다른 실시예와 관련하여 이러한 기능, 구조 또는 특성에 영향을 미치는 것은 당업자의 지식 범위 내에 있는 것으로 제출된다.
본 명세서에서, "제1" 및 "제2" 등의 용어가 다양한 요소를 설명하기 위해 사용될 수 있지만, 이러한 요소는 이러한 용어에 의해 제한되어서는 안 된다는 것을 이해해야 한다. 이러한 용어는 한 요소를 다른 요소와 구별하기 위해서만 사용된다. 예를 들어, 실시예의 범위를 벗어나지 않으면서 제1 요소는 제2 요소로 명명될 수 있고, 유사하게 제2 요소를 제1 요소로 명명될 수 있다. 본 명세서에 사용되는 바와 같이, 용어 "및/또는"은 나열된 용어 중 하나 이상의 모든 조합을 포함한다.
본 명세서에 사용된 용어는 특정한 실시예만을 설명하기 위해 사용되는 것으로, 실시예를 한정하려는 의도가 없다. 본 명세서에서 사용된 단수 형태는 문맥상 명백하게 달리 나타내지 않는 한 복수 형태도 포함하도록 의도된다. 본 명세서에 사용된 용어 "구성하다", "구성되는", "갖는", "가지는", "포함하는" 및/또는 "포함되는"은 언급된 특징, 요소 및/또는 구성요소 등의 존재를 지정하지만, 하나 이상의 다른 특징, 요소, 구성요소 및/또는 이들을 조합할 수 있거나, 추가되는 것을 배제하지 않는다.
예제 환경
도 1은 본 발명의 기술을 이용할 수 있는 예시적인 동영상 코딩 시스템(100)을 나타내는 블록도이다. 도시된 바와 같이, 동영상 코딩 시스템(100)은 소스 장치(110) 및 대상 장치(120)를 포함할 수 있다. 소스 장치(110)는 동영상 인코딩 장치라고도 지칭될 수 있으며, 대상 장치(120)는 동영상 디코딩 장치라고도 지칭될 수 있다. 작동 시, 소스 장치(110)는 인코딩된 동영상 데이터를 생성하도록 구성될 수 있고, 대상 장치(120)는 소스 장치(110)에 의해 생성된 인코딩된 동영상 데이터를 디코딩하도록 구성될 수 있다. 소스 장치(110)는 동영상 소스(112), 동영상 인코더(114) 및 입출력(I/O) 인터페이스(116)를 포함할 수 있다.
동영상 소스(112)에는 동영상 캡처 장치와 같은 소스가 포함될 수 있다. 동영상 캡처 장치의 예로는 동영상 콘텐츠 제공자로부터 동영상 데이터를 수신하기 위한 인터페이스, 동영상 데이터를 생성하기 위한 컴퓨터 그래픽 시스템 및/또는 이들의 조합이 포함되지만 이에 제한되지 않는다.
동영상 데이터는 하나 이상의 픽쳐로 구성될 수 있다. 동영상 인코더(114)는 동영상 소스(112)로부터의 동영상 데이터를 인코딩하여 비트스트림을 생성한다. 비트스트림에는 동영상 데이터의 코딩된 표현을 형성하는 비트 서열이 포함될 수 있다. 비트스트림에는 코딩된 픽쳐 및 관련된 데이터가 포함될 수 있다. 코딩된 픽쳐는 픽쳐가 코딩된 표현이다. 관련 데이터에는 서열 매개변수 세트, 픽쳐 매개변수 세트 및 기타 구문 구조가 포함될 수 있다. I/O 인터페이스(116)는 변조기/복조기 및/또는 송신기를 포함할 수 있다. 인코딩된 동영상 데이터는 I/O 인터페이스(116)를 통해 네트워크(130A)에 의해 대상 장치(120)에 직접 전송될 수 있다. 또한, 인코딩된 동영상 데이터는 대상 장치(120)에 의한 액세스를 위해 저장 매체/서버(130B)에 저장될 수 있다.
대상 장치(120)는 I/O 인터페이스(126), 동영상 디코더(124) 및 디스플레이 장치(122)를 포함할 수 있다. I/O 인터페이스(126)에는 수신기 및/또는 모뎀이 포함될 수 있다. I/O 인터페이스(126)는 소스 장치(110) 또는 저장 매체/서버(130B)로부터 인코딩된 동영상 데이터를 획득할 수 있다. 동영상 디코더(124)는 인코딩된 동영상 데이터를 디코딩할 수 있다. 디스플레이 장치(122)는 디코딩된 동영상 데이터를 사용자에게 디스플레이할 수 있다. 디스플레이 장치(122)는 대상 장치(120)와 통합될 수 있거나, 외부 디스플레이 장치와 접속되도록 구성된 대상 장치(120)의 외부에 있을 수 있다.
동영상 인코더(114) 및 동영상 디코더(124)는 고효율 동영상 코딩(HEVC) 표준, 다용도 동영상 코딩(VVC) 표준 및 기타 현재 및/또는 추가 표준과 같은 동영상 압축 표준에 따라 동작할 수 있다.
도 2는 본 발명의 일부 실시예에 따른, 도 1에 예시된 시스템(100)에서 동영상 인코더(114)의 예일 수 있는 동영상 인코더(200)의 예를 나타내는 블록도이다.
동영상 인코더(200)는 본 발명의 기술 중 임의의 것 또는 전부를 구현하도록 구성될 수 있다. 도 2의 예에서, 동영상 인코더(200)는 복수의 기능적 구성요소를 포함한다. 본 발명에서 설명되는 기술은 동영상 인코더(200)의 다양한 구성요소 사이에서 공유될 수 있다. 일부 예에서, 프로세서는 본 개시에 설명된 기술 중 일부 또는 전부를 수행하도록 구성될 수 있다.
일부 실시예에서, 동영상 인코더(200)는 모드 선택 유닛(203), 모션 추정 유닛(204), 모션 보상 유닛(205) 및 인트라 예측 유닛(206)을 포함할 수 있는 예측 유닛(202), 분할 유닛(201), 잔차 생성 유닛(207), 변환 유닛(208), 양자화 유닛(209), 역양자화 유닛(210), 역변환 유닛(211), 재구성 유닛(212), 버퍼(213) 및 엔트로피 인코딩 유닛(214)을 포함할 수 있다.
다른 예에서, 동영상 인코더(200)는 더 많거나, 더 적거나, 다른 기능 구성요소를 포함할 수 있다. 일 예에서, 예측 유닛(202)은 인트라 블록 코피(IBC) 유닛을 포함할 수 있다. IBC 유닛은 적어도 하나의 참조 픽쳐가 현재 동영상 블록이 위치한 픽쳐인 IBC 모드에서 예측을 수행할 수 있다.
또한, 모션 추정 유닛(204) 및 모션 보상 유닛(205)과 같은 일부 구성요소는 통합될 수 있지만, 도 2의 예에서는 설명을 위해 별도로 표시되어 있다.
분할 유닛(201)은 픽쳐를 하나 이상의 동영상 블록으로 분할할 수 있다. 동영상 인코더(200) 및 동영상 디코더(300)는 다양한 동영상 블록 크기를 지원할 수 있다.
모드 선택 유닛(203)은 예를 들어, 오차 결과에 기초하여 인트라 또는 인터 코딩 모드 중 하나를 선택하고, 그 결과 인트라 코딩 또는 인터 코딩된 블록을 잔차 블록 데이터를 생성하는 잔차 생성 유닛(207)으로 제공하고, 참조 픽쳐로 사용하기 위해 인코딩된 블록을 재구성하는 재구성 유닛(212)으로 제공할 수 있다. 일부 예에서, 모드 선택 유닛(203)은 예측이 인터 예측 신호와 인트라 예측 신호에 기초하는 인트라 및 인터 예측(CIIP) 모드의 조합을 선택할 수 있다. 또한, 모드 선택 유닛(203)은 인터 예측의 경우, 블록에 대한 모션 벡터의 해상도(예를 들어, 서브 픽셀 또는 정수 픽셀 정밀도)를 선택할 수 있다.
현재 동영상 블록에 대한 인터 예측을 수행하기 위해, 모션 추정 유닛(204)은 버퍼(213)로부터 하나 이상의 참조 프레임을 현재 동영상 블록과 비교함으로써 현재 동영상 블록에 대한 모션 정보를 생성할 수 있다. 모션 보상 유닛(205)은 현재 동영상 블록과 관련된 픽쳐를 제외한 버퍼(213)에서 모션 정보 및 디코딩된 픽쳐 샘플을 기반으로 현재 동영상 블록에 대한 예측된 동영상 블록을 결정할 수 있다.
모션 추정 유닛(204) 및 모션 보상 유닛(205)은 예를 들어, 현재 동영상 블록이 I-슬라이스, P-슬라이스 또는 B-슬라이스에 있는지 여부에 따라, 현재 동영상 블록에 대해 서로 다른 연산을 수행할 수 있다. 본 명세서에 사용된 바와 같이, "I-슬라이스"는 매크로블록으로 구성된 픽쳐의 일부를 지칭할 수 있으며, 이는 모두 동일한 픽쳐 내의 매크로블록을 기반으로 한다. 또한, 본 명세서에 사용된 바와 같이, 일부 측면에서 "P-슬라이스" 및 "B-슬라이스"는 동일한 픽쳐에서 매크로블록에 의존하지 않는 매크로블록으로 구성된 픽쳐의 일부를 지칭할 수 있다.
일부 예에서, 모션 추정 유닛(204)은 현재 동영상 블록에 대한 단방향 예측을 수행할 수 있고, 모션 추정 유닛(204)은 현재 동영상 블록에 대한 참조 동영상 블록에 대해 리스트 0 또는 리스트 1의 참조 픽쳐를 검색할 수 있다. 그 다음, 모션 추정 유닛(204)은 참조 동영상 블록을 포함하는 리스트 0 또는 리스트 1의 참조 픽쳐를 나타내는 참조 인덱스와 현재 동영상 블록과 참조 동영상 블록 사이의 공간적 변위를 나타내는 모션 벡터를 생성할 수 있다. 모션 추정 유닛(204)은 참조 인덱스, 예측 방향 지시기 및 모션 벡터를 현재 동영상 블록의 모션 정보로 출력할 수 있다. 모션 보상 유닛(205)은 현재 동영상 블록의 모션 정보에 의해 나타내는 참조 동영상 블록을 기반으로, 현재 동영상 블록의 예측된 동영상 블록을 생성할 수 있다.
대안적으로, 다른 예에서, 모션 추정 유닛(204)은 현재 동영상 블록에 대해 양방향 예측을 수행할 수 있다. 모션 추정 유닛(204)은 현재 동영상 블록에 대한 참조 동영상 블록에 대해 리스트 0의 참조 픽쳐를 검색할 수 있고, 또한 현재 동영상 블록에 대한 다른 참조 동영상 블록에 대해 리스트 1의 참조 픽쳐를 검색할 수 있다. 그 다음, 모션 추정 유닛(204)은 참조 동영상 블록을 포함하는 리스트 0 및 리스트 1의 참조 픽처를 나타내는 참조 인덱스 및 참조 동영상 블록과 현재 동영상 블록 사이의 공간적 변위를 나타내는 모션 벡터를 생성할 수 있다. 모션 추정 유닛(204)은 현재 동영상 블록의 참조 인덱스 및 모션 벡터를 현재 동영상 블록의 모션 정보로서 출력할 수 있다. 모션 보상 유닛(205)은 현재 동영상 블록의 모션 정보에 의해 지시되는 참조 동영상 블록을 기반으로, 현재 동영상 블록의 예측 동영상 블록을 생성할 수 있다.
일부 예에서, 모션 추정 유닛(204)은 디코더의 디코딩 처리를 위한 모션 정보의 전체 세트를 출력할 수 있다. 대안적으로, 일부 실시예에서, 모션 추정 유닛(204)은 다른 동영상 블록의 모션 정보를 참조하여 현재 동영상 블록의 모션 정보를 시그널링할 수 있다. 예를 들어, 모션 추정 유닛(204)은 현재 동영상 블록의 모션 정보가 이웃 동영상 블록의 모션 정보와 충분히 유사하다고 결정할 수 있다.
일 예에서, 모션 추정 유닛(204)은 현재 동영상 블록과 연관된 구문 구조에서, 현재 동영상 블록이 다른 동영상 블록과 동일한 모션 정보를 갖는다는 것을 동영상 디코더(300)에 나타내는 값을 나타낼 수 있다.
다른 예에서, 모션 추정 유닛(204)은 현재 동영상 블록과 연관된 구문 구조에서, 다른 동영상 블록 및 모션 벡터 차이(MVD)를 식별할 수 있다. 모션 벡터 차이는 현재 동영상 블록의 모션 벡터와 명시된 동영상 블록의 모션 벡터 간의 차이를 나타낸다. 동영상 디코더(300)는 명시된 동영상 블록의 모션 벡터 및 모션 벡터 차이를 이용하여 현재 동영상 블록의 모션 벡터를 결정할 수 있다.
상술한 바와 같이, 동영상 인코더(200)는 모션 벡터를 예측적으로 시그널링할 수 있다. 동영상 인코더(200)에 의해 구현될 수 있는 예측 시그널링 기술의 두 가지 예에는, 어드밴스드 모션 벡터 예측(AMVP)과 병합 모드 시그널링이 포함된다.
인트라 예측 유닛(206)은 현재 동영상 블록에 대해 인트라 예측을 수행할 수 있다. 인트라 예측 유닛(206)이 현재 동영상 블록에 대해 인트라 예측을 수행하는 경우, 인트라 예측 유닛(206)은 동일 픽쳐 내 다른 동영상 블록의 디코딩된 샘플을 기반으로, 현재 동영상 블록에 대한 예측 데이터를 생성할 수 있다. 현재 동영상 블록에 대한 예측 데이터에는 예측된 동영상 블록 및 다양한 구문 요소가 포함될 수 있다.
잔차 생성 유닛(207)은 현재 동영상 블록에서 현재 동영상 블록의 예측된 동영상 블록을 빼내어(예를 들어, 마이너스 부호로 표시됨), 현재 동영상 블록에 대한 잔차 데이터를 생성할 수 있다. 현재 동영상 블록의 잔차 데이터에는, 현재 동영상 블록에 있는 샘플의 다른 샘플 구성요소에 대응하는 잔차 동영상 블록이 포함될 수 있다.
다른 예에서, 예를 들어 스킵 모드에서 현재 동영상 블록에 대한 잔차 데이터가 없을 수 있으며, 잔차 생성 유닛(207)은 감산 연산을 수행하지 않을 수 있다.
변환 처리 유닛(208)은 현재 동영상 블록과 연관된 잔차 동영상 블록에 하나 이상의 변환을 적용함으로써, 현재 동영상 블록에 대한 하나 이상의 변환 계수 동영상 블록을 생성할 수 있다.
변환 처리 유닛(208)이 현재 동영상 블록과 연관된 변환 계수 동영상 블록을 생성한 후, 양자화 유닛(209)은 현재 동영상 블록과 연관된 하나 이상의 양자화 매개변수(QP) 값을 기반으로, 현재 동영상 블록과 연관된 변환 계수 동영상 블록을 양자화할 수 있다.
역양자화 유닛(210) 및 역변환 유닛(211)은, 변환 계수 동영상 블록에 각각 역양자화 및 역변환을 적용하여 변환 계수 동영상 블록으로부터 잔차 동영상 블록을 재구성할 수 있다. 재구성 유닛(212)은 재구성된 잔차 동영상 블록을 예측 유닛(202)에 의해 생성된 하나 이상의 예측 동영상 블록으로부터 대응하는 샘플에 추가하여, 버퍼(213)에 저장하기 위해 현재 동영상 블록과 연관된 재구성 동영상 블록을 생성할 수 있다.
재구성 유닛(212)으로 동영상 블록을 재구성한 후, 동영상 블록의 동영상 블로킹 아티팩트를 감소시키기 위해 루프 필터링 동작이 수행될 수 있다.
엔트로피 인코딩 유닛(214)은 동영상 인코더(200)의 다른 기능적 구성요소로부터 데이터를 수신할 수 있다. 엔트로피 인코딩 유닛(214)에 데이터가 수신되면, 엔트로피 인코딩 유닛(214)은 하나 이상의 엔트로피 인코딩 동작을 수행하여 엔트로피 인코딩된 데이터를 생성하고 엔트로피 인코딩된 데이터를 포함하는 비트스트림을 출력할 수 있다.
도 3은 본 발명의 일부 실시예에 따른, 도 1에 예시된 시스템(100)의 동영상 디코더(124)의 예일 수 있는 동영상 디코더(300)의 예를 나타내는 블록도이다.
동영상 디코더(300)는 본 발명의 기술 중 일부 또는 전부를 수행하도록 구성될 수 있다. 도 3의 예에서, 동영상 디코더(300)는 복수의 기능 구성요소를 포함한다. 본 발명에 설명된 기술은, 동영상 디코더(300)의 다양한 구성요소 사이에서 공유될 수 있다. 일부 예에서, 프로세서는 본 발명에 설명된 기술 중 일부 또는 전부를 수행하도록 구성될 수 있다.
도 3의 예에서, 동영상 디코더(300)는 엔트로피 디코딩 유닛(301), 모션 보상 유닛(302), 인트라 예측 유닛(303), 역양자화 유닛(304), 역변환 유닛(305) 및 재구성 유닛(306) 및 버퍼 (307)를 포함한다. 동영상 디코더(300)는 일부 예에서, 동영상 인코더(200)에 관하여 설명된 인코딩 패스와 일반적으로 상반되는 디코딩 패스를 수행할 수 있다.
엔트로피 디코딩 유닛(301)은 인코딩된 비트스트림을 검색할 수 있다. 인코딩된 비트스트림은, 엔트로피 코딩된 동영상 데이터(예를 들어, 동영상 데이터의 인코딩된 블록)를 포함할 수 있다. 엔트로피 디코딩 유닛(301)은 엔트로피 코딩된 동영상 데이터를 디코딩할 수 있고, 엔트로피 디코딩된 동영상 데이터로부터 모션 보상 유닛(302)은 모션 벡터, 모션 벡터 정밀도, 참조 픽쳐 리스트 인덱스 및 기타 모션 정보를 포함하는 모션 정보를 결정할 수 있다. 예를 들어, 모션 보상 유닛(302)은 AMVP 및 병합 모드를 수행함으로써 이러한 정보를 결정할 수 있다. 인접한 PB 및 참조 픽쳐의 데이터를 기반으로 가장 가능성이 높은 여러 후보를 도출하는 것을 포함하여 AMVP가 사용된다. 모션 정보에는 일반적으로 수평 및 수직 모션 벡터 변위 값, 하나 또는 두 개의 참조 픽쳐 인덱스 및 B 슬라이스의 예측 영역의 경우 각 인덱스와 연관된 참조 픽쳐 리스트의 식별이 포함된다. 본 명세서에 사용된 바와 같이, 일부 측면에서, "병합 모드"는 공간적으로 또는 시간적으로 인접한 블록으로부터 모션 정보를 도출하는 것을 지칭할 수 있다.
모션 보상 유닛(302)은 모션 보상된 블록을 생성할 수 있으며, 보간 필터를 기반으로 보간을 수행할 수 있다. 서브 픽셀 정밀도로 사용되는 보간 필터에 대한 식별자가 구문 요소에 포함될 수 있다.
모션 보상 유닛(302)은 동영상 블록을 인코딩하는 동안 동영상 인코더(200)에서 사용되는 보간 필터를 사용하여 참조 블록의 하위 정수 픽셀에 대한 보간된 값을 계산할 수 있다. 모션 보상 유닛(302)은 수신된 구문 정보에 따라 동영상 인코더(200)에서 사용되는 보간 필터를 결정하고, 보간 필터를 사용하여 예측 블록을 생성할 수 있다.
모션 보상 유닛(302)은 구문 정보의 적어도 일부를 사용하여 인코딩된 동영상 서열의 프레임 및/또는 슬라이스를 인코딩하는 데 사용되는 블록의 크기, 인코딩된 동영상 서열 픽쳐의 각 매크로블록이 분할되는 방법을 설명하는 분할 정보, 각 분할이 인코딩되는 방법을 나타내는 모드, 상호 인코딩된 각 블록에 대한 하나 이상의 참조 프레임(및 참조 프레임 리스트) 및 인코딩된 동영상 서열을 디코딩하는 기타 정보를 결정할 수 있다. 본 명세서에 사용된 바와 같이, 일부 측면에서, "슬라이스"는 엔트로피 코딩, 신호 예측 및 잔차 신호 재구성의 관점에서, 동일한 픽쳐의 다른 슬라이스로부터 독립적으로 디코딩될 수 있는 데이터 구조를 지칭할 수 있다. 슬라이스는 전체 픽쳐일 수 있고 픽쳐의 영역일 수도 있다.
인트라 예측 유닛(303)은 예를 들어 비트스트림에서 수신된 인트라 예측 모드를 사용하여 공간적으로 인접한 블록으로부터 예측 블록을 형성할 수 있다. 역양자화 유닛(304)은 비트스트림에 제공되고 엔트로피 디코딩 유닛(301)에 의해 디코딩된 양자화된 동영상 블록 계수를 역양자화, 즉 탈양자화한다. 역변환 유닛(305)은 역변환을 적용한다.
재구성 유닛(306)은 예를 들어, 잔차 블록을 모션 보상 유닛(302) 또는 인트라 예측 유닛(303)에 의해 생성된 대응하는 예측 블록과 합산함으로써, 디코딩된 블록을 얻을 수 있다. 원하는 경우, 블록화 아티팩트를 제거하기 위해 디블록킹 필터를 적용하여 디코딩된 블록을 필터링할 수도 있다. 그 다음, 디코딩된 동영상 블록은 버퍼(307)에 저장되며, 이는 후속 모션 보상/인트라 예측을 위한 참조 블록을 제공하고, 또한 디스플레이 장치에 표시하기 위해 디코딩된 동영상을 생성한다.
본 발명의 일부 예시적인 실시예에 대해 이하에서 상세히 설명한다. 본 명세서에서는 이해를 쉽게 하기 위해 섹션 표제가 사용되었으며, 섹션에 개시된 실시예가 해당 섹션에만 제한되지 않는다는 점을 이해해야 한다. 또한, 특정 실시예는 다용도 동영상 코딩(Versatile Video Coding) 또는 다른 특정 동영상 코덱을 참조하여 설명되지만, 개시된 기술은 다른 동영상 코딩 기술에도 적용될 수 있다. 또한, 일부 실시예에서 동영상 코딩 단계를 자세히 설명하지만, 코딩을 취소하는 대응하는 디코딩 단계는 디코더에 의해 구현되는 것으로 이해될 것이다. 또한, 용어 동영상 처리에는 동영상의 코딩 또는 압축, 동영상의 디코딩 또는 압축 해제 및 동영상 픽셀을 하나의 압축 형식에서 다른 압축 형식으로 또는 다른 압축 비트 전송률로 표현하는 동영상 트랜스코딩이 포함된다.
1. 요약
본 발명은 이미지/동영상 코딩 기술에 관한 것이다. 구체적으로, 프로파일 지시기 값을 이용하여 프로파일을 지시하는 것에 관한 것이다. 아이디어는 개별적으로 또는 다양한 조합으로 다용도 동영상 코딩(VVC) 표준과 같은 모든 코덱으로 코딩된 동영상 비트스트림에 적용될 수 있다.
2. 약어
APS: 적응 매개변수 세트
AU: 액세스 유닛
CLVS: 코딩된 레이어 동영상 서열
CLVSS: 코딩된 레이어 동영상 서열 시작
CRC: 순환 중복 검사
CTI: 색상 변환 정보
CVS: 코딩된 동영상 서열
FIR: 유한 임펄스 응답
IRAP: 인트라 랜덤 액세스 포인트
NAL: 네트워크 추상화 레이어
PPS: 픽쳐 매개변수 세트
PU: 픽쳐 유닛
RASL: 랜덤 액세스 건너뛰기 선행
SAR: 샘플 형상비
SARI: 샘플 형상비 정보
SEI: 보충 강화 정보
VCL: 동영상 코딩 레이어
VSEI: 다용도 보충 강화 정보(Rec. ITU-T H.274 | ISO/IEC 23002-7)
VUI: 동영상 사용성 정보
VVC: 다용도 동영상 코딩(Rec. ITU-T H.266 | ISO/IEC 23090-3)
3. 배경
3.1 동영상 코딩 표준
동영상 코딩 표준은 주로 잘 알려진 ITU-T 및 ISO/IEC 표준의 개발을 통해 발전해왔다. ITU-T는 H.261 및 H.263을 제조하고, ISO/IEC는 MPEG-1 및 MPEG-4 Visual을 제조하며, 두 조직은 공동으로 H.262/MPEG-2 Video 및 H.264/MPEG-4 고도 동영상 부호화(AVC) 및 H.265/HEVC 표준을 제조하였다. H.262 이후, 동영상 코딩 표준은 시간 예측과 변환 코딩이 이용되는 하이브리드 동영상 코딩 구조를 기반으로 한다. HEVC 이상의 미래 동영상 코딩 기술을 탐구하기 위해, 2015년 VCEG와 MPEG가 공동으로 합동영상탐험대(Joint Video Exploration Team, JVET)를 설립하였다. 그 이후로 JVET는 많은 새로운 방법을 채택하여 공동탐사모형(Joint Exploration Model, JEM)이라는 참조 소프트웨어에 추가하였다. 그 후, 다용도 동영상 코딩(Versatile Video Coding, VVC) 프로젝트가 공식적으로 시작되면서 JVET는 합동동영상전문가팀(Joint Video Experts Team, JVET)으로 명칭이 변경되었다. VVC는 HEVC에 비해 비트 전송률 50% 감소를 목표로 하는 새로운 코딩 표준으로, 2020년 7월 1일에 끝난 제19차 JVET 회의에서 최종 확정되었다.
다용도 동영상 코딩(VVC) 표준(ITU-T H.266 | ISO/IEC 23090-3) 및 관련된 코딩 동영상 비트스트림용 다용도 보충 강화 정보(VSEI) 표준(ITU-T H.274 | ISO/IEC 23002-7)은 텔레비전 방송, 화상 회의 또는 저장 매체에서의 재생과 같은 전통적인 용도뿐만 아니라, 적응형 비트 전송률 스트리밍, 동영상 영역 추출, 여러 코딩된 동영상 비트스트림의 콘텐츠 구성 및 병합, 다중 뷰 동영상, 확장 가능한 레이어 코딩 및 뷰포트 적응형 360° 몰입형 미디어와 같은 새롭고 고급 사용 사례도 포함하여, 최대한 광범위한 애플리케이션에서에서 사용도록 설계되었다.
필수 동영상 코딩(EVC) 표준(ISO/IEC 23094-1)은 MPEG에서 최근에 개발한 또 다른 동영상 코딩 표준이다.
VVC 표준 개정안의 최신 초안은 JVET-W2005에서 확인할 수 있다. 이 수정안에는 범위 확장 프로파일 사양 및 기타 측면이 포함된다.
3.2. VVC 범위 확장 프로파일
JVET-W2005에서 VVC 범위 확장 프로파일을 지정하기 위한 초안 텍스트를 아래에 제공한다.
A3.5 형식 범위 확장 프로파일
다음 프로파일은, 형식 범위 확장 프로파일이라고 통칭되며, 이 하위 조항에 지정된다.
-Main 12, Main 12 4:4:4 및 Main 16 4:4:4 프로파일
-Main 12 Intra, Main 12 4:4:4 Intra 및 Main 16 4:4:4 Intra 프로파일
-Main 12 Still Picture, Main 12 4:4:4 Still Picture 및 Main 16 4:4:4 Still Picture 프로파일
형식 범위 확장 프로파일을 준수하는 비트스트림은 다음 제약 조건을 따라야 한다.
-참조된 SPS는 ptl_multilayer_enabled_flag가 0이어야 한다.
-Main 12 Still Picture, Main 12 4:4:4 Still Picture 및 Main 16 4:4:4 Still Picture 프로파일을 준수하는 비트스트림에서, 비트스트림에는 하나의 픽쳐만 포함되어야 한다.
-Main 12, Main 12 4:4:4, Main 16 4:4:4, Main 12 Intra, Main 12 4:4:4 Intra 또는 Main 16 4:4:4 Intra 프로파일을 준수하는 비트스트림에서, 활성 SPS의 모든 i 값에 대한 general_level_idc는 255(레벨 15.5를 나타냄)와 동일하지 말아야 한다.
-하위 조항 A.4의 Main 12, Main 12 4:4:4, Main 16 4:4:4, Main 12 Intra, Main 12 4:4:4 Intra 또는 Main 16 4:4:4 Intra 프로파일에 지정된 계층 및 레벨 제약 조건은 해당하는 경우 충족되어야 한다.
표 A.1 - 형식 범위 확장 프로파일에서 구문 요소에 허용되는 값
Main 12 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 2와 동일하게 표시된다.
Main 12 Intra 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 10과 동일하게 표시된다.
Main 12 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 66과 동일하게 표시된다.
Main 12 4:4:4 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 34와 동일하게 표시된다.
Main 12 4:4:4 Intra 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 42와 동일하게 표시된다.
Main 12 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 98과 동일하게 표시된다.
Main 16 4:4:4 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 36과 동일하게 표시된다.
Main 16 4:4:4 인트라 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 44와 동일하게 표시된다.
Main 16 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 100과 동일하게 표시된다.
general_profile_idc가 2, 10, 66, 34, 42, 98, 36, 44 또는 100인 표 A.1의 구문 요소의 다른 모든 조합은 향후 ITU-T | ISO/IEC에서 사용할 수 있도록 보류되어 있다. 이러한 조합은 이 문서를 준수하는 비트스트림에 존재하지 말아야 한다. 그러나 형식 범위 확장 프로파일을 준수하는 디코더는 이 하위 조항에서 아래에 지정된 대로 다른 조합이 비트스트림에서 발생할 수 있도록 허용해야 한다.
표 A.2 - 형식 범위 확장 프로파일에 대한 적합성의 비트스트림 지시
특정 계층(general_tier_flag의 특정 값으로 식별됨)의 특정 레벨(general_level_idc의 특정 값으로 식별됨)에서, 형식 범위 확장 프로파일을 준수하는 디코더는 다음 조건이 모두 적용되는 비트스트림 및 하위 레이어 표현을 디코딩할 수 있어야 한다.
- 다음 조건 중 하나가 적용된다.
- 디코더는 Main 12 4:4:4 또는 Main 16 4:4:4 프로파일을 준수하고, 비트스트림 또는 하위 레이어 표현은 Main 10 프로파일 또는 Main 10 Still Picture 프로파일을 준수하도록 표시된다.
-디코더는 Main 12 4:4:4 Intra, Main 16 4:4:4 Intra, Main 12 Still Picture, Main 12 4:4:4 Still Picture 또는 Main 16 4:4:4 Still Picture 프로파일을 준수하며, 비트스트림 또는 하위 레이어 표현은 Main 10 Still Picture 프로파일을 준수하도록 표시된다.
-general_profile_idc는 비트스트림의 경우 2, 10, 66, 34, 42, 98, 36, 44 또는 100과 동일하며, 표 A.1에 나열된 각 제약 플래그의 값은 디코더 적합성이 평가되는 형식 범위 확장 프로파일에 대해 표 A.1의 행에 지정된 값 이상이다.
-비트스트림 또는 하위 레이어 표현은 지정된 계층 이하의 계층을 준수하도록 표시된다.
-비트스트림 또는 하위 레이어 표현은 레벨 15.5가 아닌 지정된 레벨 이하의 레벨을 준수하도록 표시된다.
4. 문제점
지정된 VVC 프로파일을 표시하기 위한 현재 설계는 다음 일련의 규칙을 따른다.
1) 모든 10비트 프로파일의 경우 7비트 general_profile_idc의 비트 0(즉, 최하위 비트, LSB)은 1과 같다.
2) 모든 12비트 프로파일의 경우 general_profile_idc의 비트 1은 1과 같다.
3) 모든 16비트 프로파일의 경우 general_profile_idc의 비트 2는 1과 같다.
4) 모든 인트라 프로파일의 경우 general_profile_idc의 비트 3은 1과 같다.
5) 모든 다층 프로파일의 경우 general_profile_idc의 비트 4는 1과 같다.
6) 모든 4:4:4 프로파일의 경우 general_profile_idc의 비트 5는 1과 같다.
7) 모든 Still Picture 프로파일의 경우 general_profile_idc의 비트 6은 1과 같다.
위의 항목 1) 내지 3)에서 알 수 있듯이, 현재 설계에서는 최대 허용 비트 심도를 개별적으로 나타내기 위해, general_profile_idc의 3개의 LSB를 사용하며, 각 비트는 하나의 최대 허용 비트 심도 값을 나타내기 때문에, 3개의 다른 최대 허용 비트 심도 값을 지정하는 기능이 있는 3 비트를 사용하는 것이 효율적이다. 그러나, 단지 2개의 LSB 조합을 사용하여, 4개의 서로 다른 최대 허용 비트 심도 값을 나타내는 것이 더 효율적이며(예를 들어, 지정된 경우, 두 LSB의 값 00은 8비트 프로파일에 사용할 수 있음), 동시에 비트 2는 나중에 다른 목적으로 사용될 수 있으므로, 동일한 규칙으로 더 많은 미래의 general_profile_idc 값을 허용할 수 있다.
5. 자세한 해결책
위의 문제를 해결하기 위해, 아래에 요약된 방법이 개시된다. 본 발명의 실시예는 일반적인 개념을 설명하기 위한 예시로 간주되어야 하며, 협소하게 해석되어서는 안된다. 또한, 이러한 실시예는 개별적으로 적용되거나 임의의 방식으로 조합되어 적용될 수도 있다.
1) 7비트의 general_profile_idc 두 개의 최하위 비트(LSB)를 사용하여 프로파일에 최대 허용 비트 심도를 나타낸다.
일 예에서 general_profile_idc의 두 LSB에 대한 값 00은 프로파일이 8비트 프로파일임을 나타낸다.
일 예에서 general_profile_idc의 두 LSB에 대한 값 01은 프로파일이 10비트 프로파일임을 나타낸다.
일 예에서 general_profile_idc의 두 LSB에 대한 값 10은 프로파일이 12비트 프로파일임을 나타낸다.
일 예에서 general_profile_idc의 두 LSB에 대한 값 11은 프로파일이 16비트 프로파일임을 나타낸다.
일 예에서 Main 16 4:4:4 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 35와 동일하게 표시된다.
일 예에서, Main 16 4:4:4 Intra 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 43과 동일하게 표시된다.
일 예에서, Main 16 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 99와 동일하게 표시된다.
6. 실시예
다음은 위의 섹션 5에 요약된 하위 항목을 포함하는 세부 해결책의 모든 측면에 대한 일부 예시적인 실시예이다.
6.1.실시예 1
본 실시예는 VVC에 적용될 수 있다.
A3.5 형식 범위 확장 프로파일
다음 프로파일은 형식 범위 확장 프로파일로 통칭되며, 하위 조항으로 지정된다.
- Main 12, Main 12 4:4:4 및 Main 16 4:4:4 프로파일
- Main 12 Intra, Main 12 4:4:4 Intra 및 Main 16 4:4:4 Intra 프로파일
- Main 12 Still Picture, Main 12 4:4:4 Still Picture 및 Main 16 4:4:4 Still Picture 프로파일
형식 범위 확장 프로파일을 준수하는 비트스트림은 다음 제약 조건을 따라야 한다.
- 참조된 SPS는 ptl_multilayer_enabled_flag가 0이어야 한다.
- Main 12 Still Picture, Main 12 4:4:4 Still Picture 또는 Main 16 4:4:4 Still Picture 프로파일을 준수하는 비트스트림의 경우, 비트스트림에는 하나의 픽쳐만 포함되어야 한다.
- Main 12 Intra, Main 12 4:4:4 Intra 또는 Main 16 4:4:4 Intra 프로파일을 준수하는 비트스트림의 경우, ph_inter_slice_allowed_flag의 값은 모든 픽쳐에 대해 0과 동일해야 한다.
- Main 12, Main 12 4:4:4, Main 16 4:4:4, Main 12 Intra, Main 12 4:4:4 Intra 또는 Main 16 4:4:4 Intra 프로파일을 준수하는 비트스트림의 경우, 참조된 SPS의 general_level_idc는 255(레벨 15.5를 나타냄)와 같지 말아야 한다.
- 표 A.1에 지정된 구문 요소에 허용되는 값을 따라야 한다.
- 하위 조항 A.4의 Main 12, Main 12 4:4:4, Main 16 4:4:4, Main 12 Intra, Main 12 4:4:4 Intra 또는 Main 16 4:4:4 Intra 프로파일에 지정된 계층 및 레벨 제약 조건이 해당되는 경우 충족되어야 한다.
표 A.1 - 형식 범위 확장 프로파일의 구문 요소에 허용되는 값
Main 12 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 2와 동일하게 표시된다.
Main 12 Intra 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 10과 동일하게 표시된다.
Main 12 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 66과 동일하게 표시된다.
Main 12 4:4:4 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 34와 동일하게 표시된다.
Main 12 4:4:4 Intra 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 42와 동일하게 표시된다.
Main 12 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 98과 동일하게 표시된다.
Main 16 4:4:4 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 35와 동일하게 표시된다.
Main 16 4:4:4 Intra 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 43과 동일하게 표시된다.
Main 16 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 general_profile_idc가 99와 동일하게 표시된다.
특정 계층(general_tier_flag의 특정 값으로 식별됨)의 특정 레벨(general_level_idc의 특정 값으로 식별됨)에서 형식 범위 확장 프로파일을 준수하는 디코더는, 다음 조건이 모두 적용되는 모든 비트스트림 및 하위 레이어 표현을 디코딩할 수 있어야 한다.
- 다음 조건 중 어느 하나가 적용된다.
-디코더가 Main 12 프로파일을 준수하고, 비트스트림이 Main 10, Main 10 Still Picture, Main 12, Main 12 Intra 또는 Main 12 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 12 4:4:4 프로파일을 준수하고, 비트스트림이 Main 10, Main 10 Still Picture, Main 10 4:4:4, Main 10 4:4:4 Still Picture, Main 12, Main 12 Intra, Main 12 Still Picture, Main 12 4:4:4, Main 12 4:4:4 Intra 또는 Main 12 4:4:4 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 16 4:4:4 프로파일을 준수하고, 비트스트림이 Main 10, Main 10 Still Picture, Main 10 4:4:4, Main 10 4:4:4 Still Picture 또는 형식 범위 확장 프로파일 중 어느 하나를 준수하는 것으로 표시된다.
-디코더가 Main 12 Intra 프로파일을 준수하고 비트스트림이 Main 10 Still Picture, Main 12 Intra 또는 Main 12 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 12 4:4:4 Intra 프로파일을 준수하고, 비트스트림이 Main 10 Still Picture, Main 10 4:4:4 Still Picture, Main 12 Intra, Main 12 4:4:4 Intra, Main 12 Still Picture 또는 Main 12 4:4:4 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 16 4:4:4 Intra 프로파일을 준수하고, 비트스트림이 Main 10 Still Picture, Main 10 4:4:4 Still Picture, Main 12 Intra, Main 12 4:4:4 Intra, Main 16 4:4:4 Intra, Main 12 Still Picture, Main 12 4:4:4 Still Picture 또는 Main 16 4:4:4 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 12 Still Picture 프로파일을 준수하고, 비트스트림이 Main 10 Still Picture 또는 Main 12 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 12 4:4:4 Still Picture 프로파일을 준수하고, 비트스트림이 Main 10 Still Picture, Main 10 4:4:4 Still Picture, Main 12 Still Picture 또는 Main 12 4:4:4 Still Picture 프로파일을 준수하는 것으로 표시된다.
-디코더가 Main 16 4:4:4 Still Picture 프로파일을 준수하고, 비트스트림이 Main 10 Still Picture, Main 10 4:4:4 Still Picture, Main 12 Still Picture, Main 12 4:4:4 Still Picture 또는 Main 16 4:4:4 Still Picture 프로파일을 준수하는 것으로 표시된다.
- 비트스트림은 지정된 계층 이하의 계층을 준수하도록 표시된다.
- 비트스트림은 레벨 15.5가 아닌 지정된 레벨 이하의 레벨을 준수하는 것으로 표시된다.
특정 계층의 특정 레벨에서 Main 12 Still Picture 프로파일을 준수하는 디코더는 다음 두 조건이 모두 적용되는 경우, 비트스트림의 제1 픽쳐도 디코딩할 수 있어야 한다.
- 해당 비트스트림은 Main 10, Main 12 또는 Main 12 Intra 프로파일을 준수하고, 지정된 계층 이하의 계층을 준수하며, 레벨 15.5가 아닌 지정된 레벨 이하의 레벨을 준수하는 것으로 표시된다.
- 해당 픽쳐는 IRAP 픽쳐이거나 ph_recovery_poc_cnt가 0인 GDR 픽쳐이고, 출력 레이어에 있으며 ph_pic_output_flag가 1이다.
특정 계층의 특정 레벨에서 Main 12 4:4:4 Still Picture 프로파일을 준수하는 디코더는 다음 두 조건이 모두 적용되는 경우, 비트스트림의 제1 픽쳐도 디코딩할 수 있어야 한다.
- 해당 비트스트림은 Main 10, Main 10 4:4:4, Main 12, Main 12 인트라, Main 12 4:4:4 또는 Main 12 4:4:4 Intra 프로파일을 준수하고, 지정된 계층 이하의 계층을 준수하며, 레벨 15.5가 아닌 지정된 레벨 이하의 레벨을 준수하는 것으로 표시된다.
- 해당 픽쳐는 IRAP 픽쳐이거나 ph_recovery_poc_cnt가 0인 GDR 픽쳐이고, 출력 레이어에 있으며 ph_pic_output_flag가 1이다.
특정 계층의 특정 레벨에서 Main 16 4:4:4 Still Picture 프로파일을 준수하는 디코더는 다음 조건이 모두 적용되는 경우, 비트스트림의 제1 픽쳐도 디코딩할 수 있어야 한다.
- 해당 비트스트림은 Main 10, Main 10 4:4:4, Main 12, Main 12 Intra, Main 12 4:4:4, Main 12 4:4:4 Intra, Main 16 4:4:4 또는 Main 16 4:4:4 Intra 프로파일을 준수하고, 지정된 계층 이하의 계층을 준수하며, 레벨 15.5가 아닌 지정된 레벨 이하의 레벨을 준수하는 것으로 표시된다.
- 해당 픽쳐는 IRAP 픽쳐이거나 ph_recovery_poc_cnt가 0인 GDR 픽쳐이고, 출력 레이어에 있으며 ph_pic_output_flag가 1이다.
본 발명의 실시예는, 프로파일 지시기 값을 이용하여 프로파일을 지시하는 것에 관한 것이다. 이러한 실시예는 VVC 표준 등 임의의 코덱에 의해 코딩된 동영상 비트스트림에 대해, 개별적으로 또는 다양한 조합으로 적용될 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "블록"은 슬라이스, 타일, 브릭, 서브픽쳐, 코딩 트리 유닛(Coding Tree Unit, CTU), 코딩 트리 블록(Coding Tree Block, CTB), CTU 행, CTB 행, 하나 이상의 코딩 유닛(CU), 하나 이상의 코딩 블록(CB), 하나 이상의 CTU, 하나 이상의 CTB, 하나 이상의 가상 파이프라인 데이터 유닛(VPDU), 픽쳐/슬라이스/타일/블록 내의 하위 영역, 추론 블록 및/또는 이와 같은 것을 나타낼 수 있다. 일부 실시예에서, 블록은 하나 이상의 샘플 또는 동영상의 하나 이상의 픽셀을 포함할 수 있다.
전술한 바와 같이, 지정된 VVC 프로파일을 표시하기 위한 현재 설계는 일련의 규칙을 따른다. 예를 들어, 모든 10비트 프로파일의 경우, 7비트 general_profile_idc의 비트 0(즉, 최하위 비트, LSB)은 1과 같고, 모든 12비트 프로파일의 경우 general_profile_idc의 비트 1은 1과 같으며, 모든 16비트 프로파일의 경우 general_profile_idc의 비트 2는 1과 같다. 현재 설계에서는, 최대 허용 비트 심도를 개별적으로 표시하기 위해 general_profile_idc의 3개의 LSB를 사용하며, 각 비트는 하나의 최대 허용 비트 심도 값을 나타냄을 알 수 있다. 즉, 3 비트를 개별적으로 사용하지만, 단지 3개의 서로 다른 최대 허용 비트 심도 값을 지정하는 기능을 구현하므로 효율이 떨어진다.
이러한 문제와 다른 잠재적인 문제 중 적어도 일부를 해결하기 위해, 본 발명의 실시예는 프로파일 지시기 값을 사용하여 프로파일을 지시하는 해결책을 제안한다. 구체적으로, 2개 이상의 비트 조합을 사용하여 복수의 서로 다른 최대 허용 비트 심도 값을 나타내는 것을 제안한다. 예를 들어, 단지 2개의 LSB 조합을 사용하여 4개의 서로 다른 최대 허용 비트 심도 값을 나타내는 것이 효율적일 것이며, 동시에 비트 2는 향후 다른 목적을 위해 사용될 수 있기 때문에, 동일한 규칙으로 향후 더 많은 general_profile_idc 값을 허용할 수 있다.
이러한 실시예는 일반적인 개념을 설명하기 위한 예시일 뿐, 협소하게 해석되어서는 안 된다는 점을 이해해야 한다. 또한 이러한 실시예는 개별적으로 적용되거나 임의의 방식으로 조합되어 적용될 수 있음을 이해해야 한다.
도 4는 본 발명의 일부 실시예에 따른 동영상을 처리하는 방법(400)을 나타내는 흐름도이다. 도 4에 도시된 바와 같이, 402에서, 동영상의 타겟 동양상 블록과 동영상의 비트스트림 사이의 변환은 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여 수행된다. 일반 프로파일 지시기는 복수의 비트를 포함할 수 있다. 본 발명의 실시예에 따르면, 일반 프로파일 지시기의 적어도 2 비트가 조합되어 프로파일에 대한 비트 심도를 나타낼 수 있다.
이와 같이, 프로파일에 대한 비트 심도, 예를 들어 최대 허용 비트 심도는 일반 프로파일 지시기의 개별 비트가 아닌 둘 이상의 비트 조합을 사용하여 나타낼 수 있다. 이러한 방식으로, 프로파일을 지시하는 효율성을 효과적으로 향상시킬 수 있다.
프로파일은 비트스트림에 대한 제한 사항을 지정하기 때문에, 비트스트림을 디코딩하는 데 필요한 기능을 제한한다. 또한, 프로파일은 개별 디코더 구현의 기능 및 인코더와 디코더 간의 상호 운용성 지점을 나타내기 위해 사용된다. 각 프로파일은 해당 프로파일을 준수하는 모든 디코더에 의해 지원되어야 하는 알고리즘 특징 및 제한의 서브 세트를 지정한다. 프로파일은 구문 요소, generic_profile_idc를 통해 나타낼 수 있다. 이는 미리 결정된 비트 수를 가지고 있을 수 있다.
본 발명의 실시예에 따르면, 2개 이상의 비트, 예를 들어 LSB가 서로 다른 프로파일을 나타내기 위해 사용될 수 있다. 일부 실시예에서, 프로파일은 Main 16 4:4:4 프로파일일 수 있고, Main 16 4:4:4 프로파일에 대한 비트스트림의 적합성은 일반 프로파일 지시기가 35와 동일하게 나타낼 수 있다.
대안적으로 또는 추가로, 일부 실시예에서, 프로파일은 Main 16 4:4:4 Intra 프로파일일 수 있고, Main 16 4:4:4 Intra 프로파일에 대한 비트스트림의 적합성은 일반 프로파일 지시기가 43과 동일하게 표시될 수 있다.
대안적으로 또는 추가로, 일부 실시예에서, 프로파일은 Main 16 4:4:4 Still Picture 프로파일일 수 있고, Main 16 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 일반 프로파일 지시기가 99와 동일하게 표시될 수 있다.
프로파일 및/또는 일반 프로파일 지시기에 의해 표시되는 값의 예는, 본 발명에 대한 어떠한 제한도 제시하지 않고 예시를 위해 논의된 것임을 이해해야 한다. 또한, 다른 적합한 프로파일 또는 값도 본 발명의 실시예에 적용될 수 있다는 것을 이해해야 한다.
일부 실시예에서, 일반 프로파일 지시기의 2 비트, 예를 들어 2개의 LSB가 조합되어 프로파일에 대해 최대 허용 비트 심도를 나타낼 수 있다. 이 경우, 예를 들어 일반 프로파일 지시기의 두 개의 LSB 값은 "00"일 수 있으며, 이는 해당 프로파일이 8비트 프로파일임을 나타낼 수 있다. 또는 일부 실시예에서, 일반 프로파일 지시기의 두 개의 LSB 값이 "01"일 수 있으며, 해당 프로파일이 10비트 프로파일임을 나타낼 수 있다. 일부 추가적인 대안 실시예에서, 일반 프로파일 지시기의 2개의 LSB 값은 프로파일이 12비트 프로파일일 수 있음을 나타내기 위해 "10"일 수 있다. 또한, 일반 프로파일 지시기의 두 개의 LSB 값은 "11"일 수 있으며, 해당 프로파일이 16비트 프로파일일 수 있음을 나타낸다.
일반 프로파일 지시기의 2개의 LSB 값에 대한 위의 예는, 본 발명에 대한 어떠한 제한도 제시하지 않고 설명을 위해 논의된 것으로 이해되어야 한다. 또한, 2개 이상의 LSB의 다른 적합한 조합 또는 값이 본 발명의 실시예에 적용될 수 있는 것으로 이해되어야 한다.
일부 실시예에서, 변환은 타겟 동영상 블록을 비트스트림으로 인코딩하는 것을 포함할 수 있다. 대안적으로, 변환은 비트스트림으로부터 타겟 동영상 블록을 디코딩하는 단계를 포함할 수 있다. 즉, 방법(400)은 비트스트림의 인코더 및 디코더 모두에서 수행될 수 있다.
본 발명의 다른 실시예에 따르면, 동영상의 비트스트림은 비일시적 컴퓨터 판독 가능 기록 매체에 저장될 수 있다. 비트스트림은, 비트스트림을 디코딩하는 기능을 정의하는 프로파일의 일반적인 프로파일 지시기를 기반으로, 동영상 처리 장치에 의해 수행되는 방법을 통해 생성된다. 일반 프로파일 지시기의 최소 2 비트가 조합되어 프로파일에 대한 비트 심도를 나타낸다.
일부 실시예에서, 동영상의 비트스트림을 저장하는 방법이 제안된다. 비트스트림은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여 생성되며, 일반 프로파일 지시기의 적어도 2 비트가 프로파일에 대한 비트 심도를 나타내기 위해 결합된다. 그 다음, 생성된 비트스트림은 비일시적인 컴퓨터 판독 가능한 기록 매체에 저장된다.
본 발명의 구현은 다음 조항을 고려하여 설명될 수 있으며, 그 특징은 임의의 합리적인 방식으로 결합될 수 있다.
조항 1. 동영상 처리 방법은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 동영상의 타겟 동영상 블록과 동영상의 비트스트림 사이의 변환을 수행하는 단계를 포함하며, 여기서, 일반 프로파일 지시기의 적어도 2 비트는 프로파일에 대한 비트 심도를 나타내기 위해 결합된다.
조항 2. 조항 1에 따른 방법에서, 일반 프로파일 지시기는 구문 요소 general_profile_idc로 표현되고 미리 결정된 수의 비트를 갖는다.
조항 3. 조항 1 또는 2에 따른 방법에서, 프로파일은 Main 16 4:4:4 프로파일이고, Main 16 4:4:4 프로파일에 대한 비트스트림의 적합성은 일반 프로파일 지시기가 35와 동일함을 나타낸다.
조항 4. 조항 1 내지 조항 3 중 어느 하나에 따른 방법에서, 프로파일은 Main 16 4:4:4 Intra 프로파일이고, Main 16 4:4:4 Intra 프로파일에 대한 비트스트림의 적합성은 일반 프로파일 지시기가 43과 동일함을 나타낸다.
조항 5. 조항 1 내지 조항 4 중 어느 하나에 따른 방법에서, 프로파일은 Main 16 4:4:4 Still Picture 프로파일이고, Main 16 4:4:4 Still Picture 프로파일에 대한 비트스트림의 적합성은 일반 프로파일 지시기가 99와 동일함을 나타낸다.
조항 6. 조항 1 내지 조항 5 중 어느 하나에 따른 방법에 있어서, 일반 프로파일 지시기의 2개의 최하위 비트(LSB)는 프로파일에 대한 최대 허용 비트 심도를 나타내기 위해 결합된다.
조항 7. 조항 6에 따른 방법에 있어서, 일반 프로파일 지시기의 두 개의 LSB 값은 "00"이고, 해당 프로파일이 8비트 프로파일임을 나타낸다.
조항 8. 조항 6 또는 조항 7에 따른 방법에 있어서, 일반 프로파일 지시기의 2개의 LSB 값은 "01"이고, 해당 프로파일이 10비트 프로파일임을 나타낸다.
조항 9. 조항 6 내지 조항 8 중 어느 하나에 따른 방법에 있어서, 일반 프로파일 지시기의 2개의 LSB 값은 "10"이고 프로파일이 12비트 프로파일임을 나타낸다.
조항 10. 조항 6 내지 조항 9 중 어느 하나에 따른 방법에 있어서, 일반 프로파일 지시기의 2개의 LSB 값은 "11"이고 프로파일이 16비트 프로파일임을 나타낸다.
조항 11. 조항 1 내지 조항 10 중 어느 하나에 따른 방법에 있어서, 변환은 타겟 동영상 블록을 비트스트림으로 인코딩하는 단계를 포함한다.
조항 12. 조항 1 내지 조항 10 중 어느 하나에 따른 방법에 있어서, 변환은 비트스트림으로부터 타겟 동영상 블록을 디코딩하는 단계를 포함한다.
조항 13. 프로세서 및 명령이 포함된 비일시적인 메모리를 포함하는 동영상 데이터를 처리하는 장치로서, 명령은 프로세서에 의해 실행될 때, 프로세서로 하여금 조항 1 내지 조항12 중 어느 하나에 따른 방법을 수행하도록 한다.
조항 14. 비일시적 컴퓨터 판독 가능 저장 매체에는 프로세서가 조항 1 내지 조항 12 중 어느 하나에 따른 방법을 수행하도록 하는 명령이 저장된다.
조항 15. 동영상 처리 장치를 통해 수행되는 방법에 의해 생성된 동영상의 비트스트림을 저장하는 비일시적 컴퓨터 판독 가능 기록 매체에 있어서, 방법은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 비트스트림을 생성하는 단계를 포함하고, 일반 프로파일 지시기의 적어도 2 비트가 프로파일에 대한 비트 심도를 나타내기 위해 결합된다.
조항 16. 동영상의 비트스트림을 저장하는 방법은, 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 비트스트림을 생성하는 단계로서, 일반 프로파일 지시기의 적어도 2 비트가 프로파일에 대한 비트 심도를 표시하기 위해 결합되는 단계; 및 비트스트림을 비일시적 컴퓨터 판독 가능 기록 매체에 저장하는 단계를 포함한다.
예시 장치
도 5는 본 발명의 다양한 실시예가 구현될 수 있는 컴퓨팅 장치(500)를 나타내는 블록도이다. 컴퓨팅 장치(500)는 소스 장치(110)(또는 동영상 인코더(114 또는 200)) 또는 대상 장치(120)(또는 동영상 디코더(124 또는 300))로서 구현되거나 그 내에 포함될 수 있다.
도 5에 도시된 컴퓨팅 장치(500)는 단지 예시를 위한 것이며, 어떠한 방식으로도 본 발명의 실시예의 기능 및 범위에 대한 제한을 시사하지 않는다는 것이 이해될 것이다.
도 5에 도시된 바와 같이, 컴퓨팅 장치(500)는 범용 컴퓨팅 장치(500)를 포함한다. 컴퓨팅 장치(500)는 적어도 하나 이상의 프로세서 또는 처리 장치(510), 메모리(520), 저장 장치(530), 하나 이상의 통신 유닛(540), 하나 이상의 입력 장치(550) 및 하나 이상의 출력 장치(560)를 포함할 수 있다.
일부 실시예에서, 컴퓨팅 장치(500)는 컴퓨팅 기능이 있는 임의의 사용자 단말기 또는 서버 단말기로서 구현될 수 있다. 서버 단말기는 서비스 제공자가 제공하는 서버, 대규모 컴퓨팅 장치 등이 될 수 있다. 사용자 단말기에는 휴대 전화, 방송국, 유닛, 장치, 멀티미디어 컴퓨터, 멀티미디어 태블릿, 인터넷 노드, 커뮤니케이터, 데스크톱 컴퓨터, 랩톱 컴퓨터, 노트북 컴퓨터, 넷북 컴퓨터, 태블릿 컴퓨터, 개인 통신 시스템(PCS) 장치, 개인 내비게이션 장치, 개인 정보 단말기(PDA), 오디오/동영상 플레이어, 디지털 카메라/동영상 카메라, 위치 확인 장치, 텔레비전 수신기, 라디오 방송 수신기, 전자책 장치, 게임 장치 또는 이들 장치의 액세서리 및 주변 장치 또는 이들의 조합을 포함한 임의의 유형의 이동 단말기, 고정 단말기 또는 휴대용 단말기일 수 있다. 컴퓨팅 장치(500)는 사용자에 대한 임의의 유형의 인터페이스(예를 들어, "웨어러블" 회로 등)를 지원할 수 있는 것으로 고려된다.
처리 장치(510)는 물리적 또는 가상의 프로세서일 수 있으며, 메모리(520)에 저장된 프로그램을 기반으로, 다양한 프로세스를 구현할 수 있다. 다중 프로세서 시스템에서, 다중 처리 장치는 컴퓨팅 장치(500)의 병렬 처리 기능을 향상시키기 위해 컴퓨터 실행 가능 명령을 병렬로 실행한다. 처리 장치(510)는 중앙 처리 장치(CPU), 마이크로프로세서, 컨트롤러 또는 마이크로컨트롤러라고도 칭될 수 있다.
컴퓨팅 장치(500)는 일반적으로 다양한 컴퓨터 저장 매체를 포함한다. 이러한 매체는 휘발성 및 비휘발성 매체, 또는 분리 가능형 및 분리 불가능형 매체를 포함하지만 이에 제한되지 않는 컴퓨팅 장치(500)에 의해 액세스 가능한 임의의 매체일 수 있다. 메모리(520)는 휘발성 메모리(예를 들어, 레지스터, 캐시, 랜덤 액세스 메모리 (RAM)), 비휘발성 메모리(읽기 전용 메모리(ROM)), 전기적으로 소거 가능한 프로그램 가능 읽기 전용 메모리(EEPROM) 또는 플래시 메모리) 또는 이들의 임의의 조합일 수 있다. 저장 유닛(530)은 임의의 분리 가능형 또는 분리 불가능형 매체일 수 있으며, 정보 및/또는 데이터를 저장하는 데 사용될 수 있고, 컴퓨팅 장치(500)에서 액세스될 수 있는 메모리, 플래시 메모리 드라이브, 자기 디스크 또는 다른 매체와 같은 기계 판독 가능 매체를 포함할 수 있다.
컴퓨팅 장치(500)는 추가적인 분리 가능형/분리 불가능형, 휘발성/비휘발성 메모리 매체를 추가로 포함할 수 있다. 도 5에는 도시되지 않았지만, 분리 가능형 비휘발성 자기 디스크에서 읽거나 쓰기 위한 자기 디스크 드라이브와, 분리 가능형 비휘발성 광 디스크에서 읽거나 쓰기 위한 광 디스크 드라이브가 제공될 수 있다. 이러한 경우 각 드라이브는 하나 이상의 데이터 매체 인터페이스를 통해 버스(미도시)에 연결될 수 있다.
통신 유닛(540)은 통신 매체를 통해 추가 컴퓨팅 장치와 통신한다. 또한, 컴퓨팅 장치(500)의 구성요소의 기능은 단일 컴퓨팅 클러스터 또는 통신 연결을 통해 통신할 수 있는 복수의 컴퓨팅 기계에 의해 구현될 수 있다. 따라서, 컴퓨팅 장치(500)는 하나 이상의 다른 서버, 네트워크에 연결된 개인용 컴퓨터(PC) 또는 추가적인 일반 네트워크 노드와 논리적 연결되어 네트워크로 연결된 환경에서 작동할 수 있다.
입력 장치(550)는 마우스, 키보드, 트래킹 볼, 음성 입력 장치 등과 같은 다양한 입력 장치 중 하나 이상일 수 있다. 출력 장치(560)는 디스플레이, 확성기, 프린터 등과 같은 다양한 출력 장치 중 하나 이상일 수 있다. 통신 유닛(540)을 통해, 컴퓨팅 장치(500)는 저장 장치 및 디스플레이 장치와 같은 하나 이상의 외부 장치(미도시), 사용자가 컴퓨팅 장치(500)와 상호 작용할 수 있도록 하는 하나 이상의 장치, 또는 필요한 경우 컴퓨팅 장치(500)가 하나 이상의 다른 컴퓨팅 장치와 통신할 수 있도록 하는 임의의 장치(네트워크 카드, 모뎀 등과 같은)와 추가로 통신할 수 있다. 이러한 통신은 입력/출력(I/O) 인터페이스(미도시)를 통해 수행될 수 있다.
일부 실시예에서, 단일 장치에 통합되는 대신, 컴퓨팅 장치(500)의 일부 또는 모든 구성요소는 클라우드 컴퓨팅 아키텍처로 배열될 수도 있다. 클라우드 컴퓨팅 아키텍처에서 구성요소는 원격으로 제공될 수 있으며 함께 작동하여 본 발명에 설명된 기능을 구현할 수 있다. 일부 실시예에서, 클라우드 컴퓨팅은 컴퓨팅, 소프트웨어, 데이터 액세스 및 저장 서비스를 제공하며, 이러한 서비스를 제공하는 시스템 또는 하드웨어의 물리적 위치 또는 구성을 최종 사용자는 알 필요가 없다. 다양한 실시예에서, 클라우드 컴퓨팅은 적합한 프로토콜을 사용하여 광역 네트워크(인터넷 등)를 통해 서비스를 제공한다. 예를 들어, 클라우드 컴퓨팅 공급자는 웹 브라우저나 기타 컴퓨팅 구성요소를 통해 액세스할 수 있는 광역 네트워크를 통해 애플리케이션을 제공한다. 클라우드 컴퓨팅 아키텍처의 소프트웨어 또는 구성요소와 대응하는 데이터는 원격 위치에 있는 서버에 저장될 수 있다. 클라우드 컴퓨팅 환경의 컴퓨팅 자원은 원격 데이터 센터의 위치에 병합되거나 분산될 수 있다. 클라우드 컴퓨팅 인프라는 사용자를 위한 단일 액세스 지점으로 작동하지만 공유 데이터 센터를 통해 서비스를 제공할 수 있다. 따라서 클라우드 컴퓨팅 아키텍처는 원격 위치에 있는 서비스 제공업체에서 본 명세서에 설명된 구성요소 및 기능을 제공하는 데 사용될 수 있다. 대안적으로, 이들은 기존 서버로부터 제공될 수도 있고, 클라이언트 장치에 직접 또는 다른 방식으로 설치될 수도 있다.
컴퓨팅 장치(500)는 본발명의 실시예에 따른 동영상 인코딩/디코딩을 구현하는 데 사용될 수 있다. 메모리(520)는 하나 이상의 프로그램 명령을 갖는 하나 이상의 동영상 코딩 모듈(525)을 포함할 수 있다. 이러한 모듈은 본 명세서에 설명된 다양한 실시예의 기능을 수행하기 위해 처리 유닛(510)에 의해 액세스 가능하고 실행 가능하다.
동영상 인코딩을 수행하는 예시적인 실시예에서, 입력 장치(550)는 인코딩될 입력(570)으로서 동영상 데이터를 수신할 수 있다. 동영상 데이터는 예를 들어, 동영상 코딩 모듈(525)에 의해 처리되어 인코딩된 비트스트림을 생성할 수 있다. 인코딩된 비트스트림은 출력 장치(560)를 통해 출력(580)으로 제공될 수 있다.
동영상 디코딩을 수행하는 예시적인 실시예에서, 입력 장치(550)는 입력(570)으로서 인코딩된 비트스트림을 수신할 수 있다. 인코딩된 비트스트림은 예를 들어, 동영상 코딩 모듈(525)에 의해 처리되어 디코딩된 동영상 데이터를 생성할 수 있다. 디코딩된 동영상 데이터는 출력 장치(560)를 통해 출력(580)으로 제공될 수 있다.
본 발명은 바람직한 실시예를 참조하여 특별히 도시되고 설명되었지만, 당업자는 첨부된 청구범위를 통해 정의된 바와 같은 본 출원의 사상 및 범위를 벗어나지 않으면서 형태 및 세부 사항의 다양한 변경이 이루어질 수 있음을 이해할 것이다. 이러한 변형은 본 출원의 범위에 포함되도록 의도된다. 따라서, 본 출원의 실시예에 대한 전술한 설명은 제한하려는 의도가 아니다.

Claims (16)

  1. 동영상 처리 방법으로서,
    비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 동영상의 타겟 동영상 블록과 상기 동영상의 비트스트림 사이의 변환을 수행하는 단계를 포함하며, 상기 일반 프로파일 지시기의 적어도 2개의 비트는 상기 프로파일에 대한 비트 심도를 나타내기 위해 결합되는, 방법.
  2. 제1항에 있어서,
    상기 일반 프로파일 지시기는 구문 요소인 general_profile_idc로 표현되며, 미리 정해진 비트 수를 갖는, 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 프로파일은 Main 16 4:4:4 프로파일이고, 상기 Main 16 4:4:4 프로파일에 대한 비트스트림의 적합성은 상기 일반 프로파일 지시기에 의해 35와 동일하게 표시되는, 방법.
  4. 제1항 내지 제3항 중 어느 항에 있어서,
    상기 프로파일은 Main 16 4:4:4 인트라 프로파일이고, 상기 Main 16 4:4:4 인트라 프로파일에 대한 상기 비트스트림의 적합성은 상기 일반 프로파일 지시기에 의해 43과 동일한 것으로 표시되는, 방법.
  5. 제1항 내지 제4항 중 어느 항에 있어서,
    상기 프로파일은 Main 16 4:4:4 Still Picture 프로파일이고, 상기 Main 16 4:4:4 Still Picture 프로파일에 대한 상기 비트스트림의 적합성은 일반 프로파일 지시기에 의해 99와 동일한 것으로 표시되는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 일반 프로파일 지시기의 2개의 최하위 비트(LSB)는 상기 프로파일에 대해 최대 허용 비트 심도를 나타내기 위해 결합되는, 방법.
  7. 제6항에 있어서,
    상기 일반 프로파일 지시기의 두 개의 LSB 값은 "00"이고, 상기 프로파일이 8비트 프로파일임을 나타내는, 방법.
  8. 제6항 또는 제7항에 있어서,
    상기 일반 프로파일 지시기의 두 개의 LSB 값은 "01"이고, 상기 프로파일이 10비트 프로파일임을 나타내는 방법.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서,
    상기 일반 프로파일 지시기의 두 개의 LSB 값은 "10"이고, 상기 프로파일이 12비트 프로파일임을 나타내는, 방법.
  10. 제6항 내지 제9항 중 어느 한 항에 있어서,
    상기 일반 프로파일 지시기의 두 개의 LSB 값은 "11"이고, 상기 프로파일이 16비트 프로파일임을 나타내는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 변환은 상기 타겟 동영상 블록을 상기 비트스트림에 인코딩하는 단계를 포함하는, 방법.
  12. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 변환은 상기 비트스트림으로부터 상기 타겟 동영상 블록을 디코딩하는 단계를 포함하는, 방법.
  13. 프로세서 및 명령이 포함된 비일시적 메모리를 포함하는 동영상 데이터 처리 장치로서,
    상기 명령은 프로세서에 의해 실행될 때, 프로세서로 하여금 제1항 내지 제12항 중 어느 한 항에 따른 방법을 수행하도록 하는, 장치.
  14. 프로세서가 제1항 내지 제12항 중 어느 한 항에 따른 방법을 수행하도록 하는 명령을 저장하는, 비일시적 컴퓨터 판독 가능 저장 매체.
  15. 동영상 처리 장치를 통해 수행되는 방법에 의해 생성된 동영상의 비트스트림을 저장하는, 비일시적 컴퓨터 판독 가능 기록 매체로서,
    상기 방법은,
    상기 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 상기 비트스트림을 생성하는 단계를 포함하고, 상기 일반 프로파일 지시기의 적어도 2개의 비트는 상기 프로파일에 대한 비트 심도를 표시하기 위해 결합되는, 비일시적 컴퓨터 판독 가능 기록 매체.
  16. 동영상의 비트스트림을 저장하는 방법으로서,
    상기 비트스트림을 디코딩하기 위한 기능을 정의하는 프로파일의 일반 프로파일 지시기에 기초하여, 상기 비트스트림을 생성하는 단계로서, 상기 일반 프로파일 지시기의 적어도 2개의 비트는 상기 프로파일에 대한 비트 심도를 표시하기 위해 결합되는 단계; 및
    상기 비트스트림을 비일시적 컴퓨터 판독 가능 기록 매체에 저장하는 단계를 포함하는, 방법.
KR1020247012892A 2021-10-08 2022-09-30 동영상을 처리하는 방법, 장치 및 매체 KR20240068711A (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US63/253,890 2021-10-08

Publications (1)

Publication Number Publication Date
KR20240068711A true KR20240068711A (ko) 2024-05-17

Family

ID=

Similar Documents

Publication Publication Date Title
JP7055833B2 (ja) 並列処理のためのイントラブロックコピー予測制限
CN111869212B (zh) 视频解码方法、装置和可读介质
US11057636B2 (en) Affine motion prediction
JP6716611B2 (ja) スライスレベルのイントラブロックコピーおよび他のビデオコーディングの改善
TW201803348A (zh) 用於在視頻寫碼中之並列參考指標的一致性約束
EP3417620A1 (en) Weighted prediction for screen content coding and multi-layer coding
CN110730353A (zh) 视频解码方法和装置、计算机设备、存储介质
CN112135134B (zh) 视频解码方法、装置、计算机设备和存储介质
CN114902672A (zh) 视频编解码中的档次-层-级别参数集
KR20230150284A (ko) 효율적인 비디오 인코더 아키텍처
KR20240050414A (ko) 비디오 처리를 위한 방법, 기기 및 매체
KR20240068711A (ko) 동영상을 처리하는 방법, 장치 및 매체
CN112118452A (zh) 视频解码的方法和装置、计算机设备
WO2024061136A1 (en) Method, apparatus, and medium for video processing
KR20240051251A (ko) 비디오 처리를 위한 방법, 장치 및 매체
CN118077200A (zh) 用于视频处理的方法、装置和介质
WO2024061331A1 (en) Method, apparatus, and medium for video processing
US20240179345A1 (en) Externally enhanced prediction for video coding
WO2024078632A1 (en) Method, apparatus, and medium for video processing
WO2023092019A1 (en) Method, apparatus, and medium for video processing
WO2024054927A1 (en) Method, apparatus, and medium for video processing
WO2023056455A1 (en) Methods, apparatus, and medium for video prcessing
WO2023137477A2 (en) Method, apparatus, and medium for video processing
CN117356094A (zh) 用于视频处理的方法、设备和介质
WO2023159143A2 (en) Method, apparatus, and medium for video processing