KR20240042167A - 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 - Google Patents
비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR20240042167A KR20240042167A KR1020247009097A KR20247009097A KR20240042167A KR 20240042167 A KR20240042167 A KR 20240042167A KR 1020247009097 A KR1020247009097 A KR 1020247009097A KR 20247009097 A KR20247009097 A KR 20247009097A KR 20240042167 A KR20240042167 A KR 20240042167A
- Authority
- KR
- South Korea
- Prior art keywords
- picture
- syntax element
- flag
- equal
- value
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000011664 signaling Effects 0.000 title description 24
- 230000000750 progressive effect Effects 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 3
- 230000033001 locomotion Effects 0.000 description 29
- 230000002123 temporal effect Effects 0.000 description 28
- 239000013598 vector Substances 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 13
- 230000002457 bidirectional effect Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000005192 partition Methods 0.000 description 8
- 238000009795 derivation Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 241000023320 Luma <angiosperm> Species 0.000 description 4
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- FMYKJLXRRQTBOR-UBFHEZILSA-N (2s)-2-acetamido-4-methyl-n-[4-methyl-1-oxo-1-[[(2s)-1-oxohexan-2-yl]amino]pentan-2-yl]pentanamide Chemical group CCCC[C@@H](C=O)NC(=O)C(CC(C)C)NC(=O)[C@H](CC(C)C)NC(C)=O FMYKJLXRRQTBOR-UBFHEZILSA-N 0.000 description 2
- 241001502919 Gambusia luma Species 0.000 description 2
- 241001482237 Pica Species 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
- H04N19/197—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including determination of the initial value of an encoding parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
Abstract
비디오 코딩을 위한 방법 및 장치가 제공된다. 이 방법은, 픽처 파라미터 세트(PPS)에서, PPS에 대응하는 픽처가 하나 이상의 네트워크 추상화 계층(NAL) 유닛을 포함하는지 여부 및 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하는 제1 신택스 엘리먼트를 디코더가 수신하고, 픽처 헤더(PH)에서, PH에 대응하는 픽처가 인트라 랜덤 액세스 포인트(IRAP) 픽처인지 점진적 인트라 리프레시(GDR) 픽처인지를 명시하는 제2 신택스 엘리먼트를 수신하고, 제2 신택스 엘리먼트의 값을 기초로 제1 신택스 엘리먼트의 값을 결정하거나 제1 신택스 엘리먼트의 값을 기초로 제2 신택스 엘리먼트의 값을 결정하는 것을 포함한다.
Description
본 출원은 "Signaling of Syntax Elements in Video Coding"이라는 명칭으로 2020년 5월 20일자 출원된 미국 가출원 제63/027,718호에 대한 우선권을 주장하며, 이 출원 전체가 모든 목적을 위해 인용에 의해 포함된다.
본 개시내용은 비디오 코딩(video coding) 및 압축에 관한 것으로, 특히, 그러나 이에 제한된 것은 아닌, 비디오 코딩에서의 신택스 엘리먼트(syntax elements)의 시그널링을 위한 방법 및 장치에 관한 것이다.
비디오 데이터를 압축하기 위해 다양한 비디오 코딩 기법이 사용될 수 있다. 비디오 코딩은 하나 이상의 비디오 코딩 표준에 따라 수행된다. 예를 들어, 비디오 코딩 표준은 다용도 비디오 코딩(VVC: versatile video coding), 공동 탐사 테스트 모델(JEM: joint exploration test model), 고효율 비디오 코딩(H.265/HEVC: high-efficiency video coding), 고급 비디오 코딩(H.264/AVC: advanced video coding), 동영상 전문가 그룹(MPEG: moving picture experts group) 코딩 등을 포함한다. 비디오 코딩은 일반적으로 비디오 이미지 또는 시퀀스에 존재하는 리던던시를 이용하는 예측 방법(예컨대, 인터 예측(inter-prediction), 인트라 예측(intra-prediction) 등)을 이용한다. 비디오 코딩 기법의 중요한 목표는 비디오 품질에 대한 열화를 피하거나 최소화하면서 더 낮은 비트 레이트를 사용하는 형태로 비디오 데이터를 압축하는 것이다.
본 개시내용은 비디오 코딩에서의 신택스 엘리먼트의 시그널링에 관련된 기법의 예를 설명한다.
본 개시내용의 제1 양상에 따르면, 비디오 코딩을 위한 방법이 제공된다. 이 방법은, 픽처 파라미터 세트(PPS: picture parameter set)에서 PPS에 대응하는 픽처가 하나보다 많은 네트워크 추상화 계층(NAL: network abstraction layer) 유닛을 포함하는지 여부 및 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하는 제1 신택스 엘리먼트를 디코더(decoder)가 수신하는 것을 포함한다. 추가로, 디코더는 픽처 헤더(PH: picture header)에서 PH에 대응하는 픽처가 인트라 랜덤 액세스 포인트(IRAP: intra random access point) 픽처인지 또는 점진적 인트라 리프레시(GDR: gradual intra refreshing) 픽처인지를 명시하는 제2 신택스 엘리먼트를 수신한다. 또한, 디코더는 1과 동일한 제2 신택스 엘리먼트의 값에 기초하여 제1 신택스 엘리먼트의 값을 결정하거나, 제1 신택스 엘리먼트의 값에 기초하여 제2 신택스 엘리먼트의 값을 결정한다.
본 개시내용의 제2 양상에 따르면, 비디오 코딩을 위한 방법이 제공된다. 이 방법은 디코더가 신택스 엘리먼트를 수신하고 신택스 엘리먼트의 값에 기초하여 디코딩 프로세스를 수행하는 것을 포함한다. 또한, 신택스 엘리먼트는 픽처의 네트워크 추상화 계층(NAL: network abstraction layer) 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하고, 상기 픽처가 점진적 디코딩 리프레시(GDR) 픽처 또는 인트라 랜덤 액세스 포인트(IRAP) 픽처인 경우 상기 신택스 엘리먼트의 값은 0과 동일하다.
본 개시내용의 제3 양상에 따르면, 비디오 코딩을 위한 장치가 제공된다. 이 장치는 하나 이상의 프로세서 및 하나 이상의 프로세서에 의해 실행 가능한 명령을 저장하도록 구성된 메모리를 포함한다. 하나 이상의 프로세서는 명령의 실행 시, 본 개시내용의 제1 양상에 따른 임의의 방법을 수행하도록 구성된다.
본 개시내용의 제4 양상에 따르면, 비디오 코딩을 위한 장치가 제공된다. 이 장치는 하나 이상의 프로세서 및 하나 이상의 프로세서에 의해 실행 가능한 명령을 저장하도록 구성된 메모리를 포함한다. 하나 이상의 프로세서는 명령의 실행 시, 본 개시내용의 제2 양상에 따른 임의의 방법을 수행하도록 구성된다.
본 개시내용의 제5 양상에 따르면, 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 하나 이상의 컴퓨터 프로세서로 하여금 본 개시내용의 제1 양상에 따른 임의의 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장하는, 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체가 제공된다.
본 개시내용의 제6 양상에 따르면, 하나 이상의 컴퓨터 프로세서에 의해 실행될 때 하나 이상의 컴퓨터 프로세서로 하여금 본 개시내용의 제2 양상에 따른 임의의 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장하는, 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체가 제공된다.
본 개시내용의 제7 양상에 따르면, 프로세서에 의해 실행될 때 본 개시내용의 제1 양상에 따른 방법을 수행하는 명령을 포함하는, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 제공된다.
본 개시내용의 제8 양상에 따르면, 프로세서에 의해 실행될 때 본 개시내용의 제2 양상에 따른 방법을 수행하는 명령을 포함하는, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 제공된다.
본 개시내용의 예의 보다 구체적인 설명은 첨부된 도면에 예시된 특정 예를 참조하여 제시될 것이다. 이러한 도면은 단지 일부 예만을 도시할 뿐이며 따라서 범위를 제한하는 것으로 여겨지지 않는다는 점을 고려하면, 예는 첨부 도면의 사용을 통해 추가 특이성 및 세부사항으로 기술 및 설명될 것이다.
도 1은 본 개시내용의 일부 구현에 따른 예시적인 비디오 인코더를 예시하는 블록도이다.
도 2는 본 개시내용의 일부 구현에 따른 예시적인 비디오 디코더를 예시하는 블록도이다.
도 3은 본 개시내용의 일부 구현에 따라 다수의 코딩 트리 유닛(CTU: coding tree unit)으로 분할된 픽처의 일례를 예시한다.
도 4a - 도 4d는 본 개시내용의 일부 구현에 따른 다중 타입 트리 분할 모드를 예시하는 개략도이다.
도 5는 본 개시내용의 일부 구현에 따른 다수의 인터 픽처 중에서 인트라 코딩된 구역을 예시한다.
도 6은 본 개시내용의 일부 구현에 따른 비디오 코딩을 위한 예시적인 장치를 예시하는 블록도이다.
도 7은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 8은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 9는 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 10은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 1은 본 개시내용의 일부 구현에 따른 예시적인 비디오 인코더를 예시하는 블록도이다.
도 2는 본 개시내용의 일부 구현에 따른 예시적인 비디오 디코더를 예시하는 블록도이다.
도 3은 본 개시내용의 일부 구현에 따라 다수의 코딩 트리 유닛(CTU: coding tree unit)으로 분할된 픽처의 일례를 예시한다.
도 4a - 도 4d는 본 개시내용의 일부 구현에 따른 다중 타입 트리 분할 모드를 예시하는 개략도이다.
도 5는 본 개시내용의 일부 구현에 따른 다수의 인터 픽처 중에서 인트라 코딩된 구역을 예시한다.
도 6은 본 개시내용의 일부 구현에 따른 비디오 코딩을 위한 예시적인 장치를 예시하는 블록도이다.
도 7은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 8은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 9는 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
도 10은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
이제 특정한 구현에 대해 상세히 언급될 것이며, 그 예는 첨부 도면에 예시된다. 다음 상세한 설명에서는, 본 명세서에서 제시되는 청구 대상의 이해를 돕기 위해 많은 비-제한적인 특정 세부사항이 제시된다. 그러나 다양한 대안이 사용될 수 있음이 당해 기술분야에서 통상의 지식을 가진 자에게 명백할 것이다. 예를 들어, 본 명세서에서 제시되는 청구 대상이 디지털 비디오 능력을 갖는 많은 타입의 전자 디바이스 상에서 구현될 수 있음이 당해 기술분야에서 통상의 지식을 가진 자에게 명백할 것이다.
본 명세서 전반에 걸쳐 "일 실시예", "실시예", "일례", "일부 실시예", "일부 예" 또는 유사한 언어에 대한 언급은 설명되는 특정한 특징, 구조 또는 특성이 적어도 하나의 실시예 또는 예에 포함되는 것을 의미한다. 하나의 또는 일부 실시예와 관련하여 설명되는 특징, 구조, 엘리먼트 또는 특성은 또한, 달리 명시적으로 특정되지 않는 한, 다른 실시예에 적용 가능하다.
본 개시내용 전반에 걸쳐, "제1", "제2", "제3" 등의 용어는 모두, 달리 명시적으로 특정되지 않는 한, 어떠한 공간 순서나 연대순도 의미하지 않으면서, 관련 엘리먼트, 예컨대 디바이스, 컴포넌트, 조직, 단계 등에 대한 참조만을 위한 명명법으로서 사용된다. 예를 들어, "제1 디바이스" 및 "제2 디바이스"는 2개의 별개로 형성된 디바이스, 또는 동일한 디바이스의 2개의 부분, 컴포넌트 또는 동작 상태에 관련될 수 있고, 임의로 명명될 수 있다.
"모듈", "하위 모듈", "회로", "하위 회로", "회로부", "하위 회로부", "유닛" 또는 "서브-유닛"이라는 용어는 하나 이상의 프로세서에 의해 실행될 수 있는 코드 또는 명령을 저장하는 메모리(공유, 전용 또는 그룹)를 포함할 수 있다. 모듈은 저장된 코드 또는 명령을 갖는 또는 갖지 않는 하나 이상의 회로를 포함할 수 있다. 모듈 또는 회로는 직접적으로 또는 간접적으로 연결되는 하나 이상의 컴포넌트를 포함할 수 있다. 이러한 컴포넌트는 서로 물리적으로 부착되거나 서로 인접하게 위치될 수 있거나 그렇지 않을 수 있다.
본 명세서에서 사용되는 바와 같이, "~라면" 또는 "~일 때"라는 용어는 맥락에 따라 "~ 시에" 또는 "~에 대한 응답으로"를 의미하는 것으로 이해될 수 있다. 이러한 용어는, 청구항에 나타난다면, 관련 제한 또는 특징이 조건부 또는 선택적임을 표시하지 않을 수 있다. 예를 들어, 방법은 ⅰ) 조건 X가 존재하는 경우 또는 존재한다면, 기능 또는 동작 X'가 수행되는 단계, 및 ⅱ) 조건 Y가 존재하는 경우 또는 존재한다면, 기능 또는 동작 Y'가 수행되는 단계를 포함할 수 있다. 이 방법은 기능 또는 동작 X'를 수행하는 능력과 기능 또는 동작 Y'를 수행하는 능력 모두로 구현될 수 있다. 따라서 기능 X'와 기능 Y'는 모두 방법의 다수의 실행 시에 서로 다른 시점에 수행될 수 있다.
유닛 또는 모듈은 순수하게 소프트웨어에 의해, 순수하게 하드웨어에 의해, 또는 하드웨어와 소프트웨어의 조합에 의해 구현될 수 있다. 순수한 소프트웨어 구현에서, 예를 들어 유닛 또는 모듈은 특정 기능을 수행하기 위해 함께 직접적으로 또는 간접적으로 링크되는, 기능적으로 관련된 코드 블록 또는 소프트웨어 컴포넌트를 포함할 수 있다.
도 1은 블록 기반 처리를 사용하여 많은 비디오 코딩 표준과 함께 사용될 수 있는 예시적인 블록 기반 하이브리드 비디오 인코더(100)를 예시하는 블록도를 도시한다. 인코더(100)에서는, 비디오 프레임이 처리를 위해 복수의 비디오 블록으로 파티셔닝(partition)된다. 각각의 주어진 비디오 블록에 대해, 인터 예측 접근 방식 또는 인트라 예측 접근 방식에 기반하여 예측이 형성된다. 인터 예측에서는, 이전에 재구성된 프레임으로부터의 픽셀에 기반하여, 움직임 추정 및 움직임 보상을 통해 하나 이상의 예측자가 형성된다. 인트라 예측에서는, 현재 프레임의 재구성된 픽셀에 기반하여 예측자가 형성된다. 모드 결정을 통해, 현재 블록을 예측하도록 최상의 예측자가 선택될 수 있다.
현재 비디오 블록과 그 예측자 간의 차이를 표현하는 예측 잔차가 변환 회로(102)에 전송된다. 그런 다음, 엔트로피 감소를 위해 변환 회로(102)로부터 양자화 회로(104)로 변환 계수가 송신된다. 이어서, 양자화된 계수가 엔트로피 코딩 회로(106)에 공급되어 압축된 비디오 비트스트림을 생성한다. 도 1에 도시된 바와 같이, 인터 예측 회로 및/또는 인트라 예측 회로(112)로부터의 예측 관련 정보(110), 이를테면 비디오 블록 파티션 정보, 움직임 벡터들, 참조 픽처 인덱스 및 인트라 예측 모드가 또한 엔트로피 코딩 회로(106)를 통해 공급되어 압축된 비디오 비트스트림(114)에 저장된다.
인코더(100)에서는, 예측 목적으로 픽셀을 재구성하기 위해 디코더 관련 회로가 또한 필요하다. 먼저, 역양자화(116) 및 역변환 회로(118)를 통해 예측 잔차가 재구성된다. 이러한 재구성된 예측 잔차는 블록 예측자(120)와 조합되어, 현재 비디오 블록에 대한 필터링되지 않은 재구성된 픽셀을 생성한다.
("공간 예측"으로도 또한 지칭되는) 인트라 예측은 동일한 비디오 픽처 및/또는 슬라이스에서 (참조 샘플로 지칭되는) 이미 코딩된 이웃 블록의 샘플로부터의 픽셀을 사용하여 현재 비디오 블록을 예측한다. 공간 예측은 비디오 신호에 내재된 공간 중복성을 감소시킨다.
("시간 예측"으로도 또한 지칭되는) 인터 예측은 이미 코딩된 비디오 픽처로부터의 재구성된 픽셀을 사용하여 현재 비디오 블록을 예측한다. 시간 예측은 비디오 신호에 내재된 시간 중복성을 감소시킨다. 주어진 코딩 유닛(CU: coding unit) 또는 코딩 블록에 대한 시간 예측 신호는 대개, 현재 CU와 이것의 시간 기준 사이의 움직임의 양 및 방향을 지시하는 하나 이상의 움직임 벡터(MV: motion vector)에 의해 시그널링된다. 추가로, 다수의 참조 픽처가 지원된다면, 하나의 참조 픽처 인덱스가 추가로 송신되며, 이는 참조 픽처 저장소 내의 어느 참조 픽처로부터 시간 예측 신호가 오는지를 식별하는 데 사용된다.
공간 및/또는 시간 예측이 수행된 후에, 인코더(100)의 인트라/인터 모드 결정 회로(121)는 예를 들어, 레이트 왜곡 최적화 방법에 기반하여 최상의 예측 모드를 선택한다. 그 다음, 현재 비디오 블록으로부터 블록 예측자(120)가 감산되고; 결과적인 예측 잔차가 변환 회로(102) 및 양자화 회로(104)를 사용하여 역상관(de-correlate)된다. 결과적인 양자화된 잔류 계수는 역양자화 회로(116)에 의해 역양자화되고, 역변환 회로(118)에 의해 역변환되어, 재구성된 잔차를 형성하고, 재구성된 잔차는 이어서, 예측 블록에 다시 더해져 CU의 재구성된 신호를 형성한다. 또한, 재구성된 CU가 픽처 버퍼(117)의 참조 픽처 저장소에 들어가 차후 비디오 블록을 코딩하는 데 사용되기 전에, 추가 루프 내 필터(115), 이를테면 블록 분리(deblocking) 필터, 샘플 적응 오프셋(SAO: sample adaptive offset) 및/또는 적응형 루프 내 필터(ALF: adaptive in-loop filter)가 재구성된 CU에 적용될 수 있다. 출력 비디오 비트스트림(114)을 형성하기 위해, 코딩 모드(인터 또는 인트라), 예측 모드 정보, 움직임 정보 및 양자화된 잔차 계수가 모두 엔트로피 코딩 유닛(106)에 송신되어 추가로 압축되고 패킹되어 비트스트림을 형성한다.
예를 들어, 블록 분리 필터는 AVC, HEVC뿐만 아니라 VVC의 지금 현재 버전에서 이용 가능하다. HEVC에서, 코딩 효율을 더 향상시키기 위해 SAO(sample adaptive offset)로 지칭되는 추가 루프 내 필터가 정의된다. VVC 표준의 최신 버전에서는, ALF(adaptive loop filter)로 불리는 또 다른 루프 내 필터가 능동적으로 조사되고 있으며, 이는 최종 표준에 포함되는 좋은 기회를 갖는다.
이러한 루프 내 필터 동작은 선택적이다. 이러한 동작을 수행하는 것은 코딩 효율 및 시각적 품질을 향상시키는 데 도움이 된다. 이들은 또한 계산 복잡성을 절약하기 위해 인코더(100)에 의해 제시된 결정으로서 오프 전환될 수 있다.
인트라 예측은 대개, 필터링되지 않은 재구성된 픽셀에 기반하는 한편, 인터 예측은 이러한 필터 옵션이 인코더(100)에 의해 온 전환된다면, 필터링되는 재구성된 픽셀에 기반한다는 점이 주목되어야 한다.
도 2는 많은 비디오 코딩 표준과 함께 사용될 수 있는 예시적인 블록 기반 비디오 디코더(200)를 예시하는 블록도이다. 이 디코더(200)는 도 1의 인코더(100)에 상주하는 재구성 관련 섹션과 유사하다. 디코더(200)에서는, 착신 비디오 비트스트림(201)이 먼저 엔트로피 디코딩(202)을 통해 디코딩되어 양자화된 계수 레벨 및 예측 관련 정보를 도출한다. 이어서, 양자화된 계수 레벨이 역양자화(204) 및 역변환(206)을 통해 처리되어, 재구성된 예측 잔차를 획득한다. 인트라/인터 모드 선택기(212)에서 구현되는 블록 예측자 메커니즘은 디코딩된 예측 정보에 기초하여 인트라 예측(208) 또는 움직임 보상(210)을 수행하도록 구성된다. 합산기(214)를 사용하여, 역변환(206)으로부터의 재구성된 예측 잔차와 블록 예측자 메커니즘에 의해 생성된 예측 출력을 합산함으로써 한 세트의 필터링되지 않은 재구성된 픽셀이 획득된다.
재구성된 블록은 추가로, 참조 픽처 저장소로서 기능하는 픽처 버퍼(213)에 저장되기 전에 루프 내 필터(209)를 거칠 수 있다. 픽처 버퍼(213) 내의 재구성된 비디오가 송신되어 디스플레이 디바이스를 구동할 수 있을 뿐만 아니라, 차후의 비디오 블록을 예측하는 데 사용될 수 있다. 루프 내 필터(209)가 온 전환되는 상황에서, 이러한 재구성된 픽셀에 대해 필터링 동작이 수행되어 최종 재구성된 비디오 출력(222)을 도출한다.
다용도 비디오 코딩(VVC)
2018년 4월 10일-20일, 미국 San Diego에서 개최된 제10차 JVET 회의에서, JVET는 VVC의 첫 번째 초안과 VVC 테스트 모델 1(VTM1: VVC Test Model 1)을 그 참조 소프트웨어 구현으로 정의하였다. VVC의 초기 새로운 코딩 특징으로서 내포형(nested) 다중 타입 트리를 갖는 쿼드 트리(quadtree)를 포함하기로 결정되었다. 다중 타입 트리는 2진 및 3진 분할을 모두 포함하는 코딩 블록 파티션 구조이다. 그 이후로, 인코딩 및 디코딩 프로세스가 모두 구현된 참조 소프트웨어인 VTM은 다음 JVET 회의를 통해 개발 및 업데이트되었다.
VVC에서, 입력 비디오의 픽처는 CTU로 불리는 블록으로 파티셔닝된다. CTU는 내포형 다중 타입 트리 구조를 갖는 쿼드 트리를 사용하여 CU로 분할될 수 있으며, CU는 동일한 예측 모드(예컨대, 인트라 또는 인터)를 공유하는 픽셀의 구역을 정의한다. '유닛'이라는 용어는 루마(luma) 및 크로마(chroma)와 같은 모든 컴포넌트를 커버하는 이미지의 구역을 정의할 수 있다. '블록'이라는 용어는 특정 컴포넌트를 커버하는 구역(예컨대, 루마)을 정의하는 데 사용될 수 있으며, 상이한 컴포넌트의 블록(예컨대, 루마 대 크로마)은 4:2:0과 같이, 크로마 샘플링 포맷을 고려할 때 공간 위치가 상이할 수 있다.
CTU로의 픽처의 파티셔닝
도 3은 본 개시내용 내용의 일부 구현에 따라 다수의 CTU(302)로 분할된 픽처(300)의 일례를 예시한다.
VVC에서, 픽처는 CTU의 시퀀스로 분할된다. CTU 개념은 HEVC의 개념과 동일하다. 3개의 샘플 배열을 갖는 픽처의 경우, CTU는 크로마 샘플의 2개의 대응하는 블록과 함께 루마 샘플의 N×N 블록으로 구성된다.
CTU에서 루마 블록의 최대 허용 크기는 (루마 변환 블록의 최대 크기는 64×64 이지만) 128×128로 특정된다.
트리 구조를 사용한 CTU의 파티셔닝
HEVC에서, CTU는 코딩 트리로서 표기된 4진 트리(quaternary-tree) 구조를 사용하여 다양한 로컬 특성에 적응함으로써 CU로 분할된다. 픽처 간(inter-picture)(시간) 또는 픽처 내(intra-picture)(공간) 예측을 사용함으로써 픽처 영역을 코딩할지 여부의 결정이 리프 CU 레벨에서 이루어진다. 각각의 리프 CU는 PU 분할 타입에 기초하여 1개, 2개 또는 4개의 PU로 더 분할될 수 있다. 하나의 PU 내에서는, 동일한 예측 프로세스가 적용되고 관련 정보가 PU 단위로 디코더에 전송된다. PU 분할 타입에 기초하여 예측 프로세스를 적용함으로써 잔차 블록을 획득한 후, 리프 CU는 CU에 대한 코딩 트리와 유사한 다른 4진 트리 구조에 따라 변환 유닛(TU: transform unit)으로 파티셔닝될 수 있다. HEVC 구조의 주요 특징 중 하나는, HEVC 구조가 CU, PU 및 TU를 포함하는 다수의 파티션 개념을 갖는다는 점이다.
VVC에서, 2진 및 3진 분할 세그먼트화 구조를 사용하는 내포형 다중 타입 트리를 갖는 쿼드 트리는 다수의 파티션 유닛 타입의 개념을 대체하는데, 즉 VVC는 최대 변환 길이에 대해 너무 큰 크기를 갖는 CU에 대해 필요한 경우를 제외하고 CU, PU 및 TU 개념의 분할을 제거하며, CU 파티션 형상에 대해 더 많은 탄력성을 지원한다. 코딩 트리 구조에서, CU는 정사각형 또는 직사각형 형상을 가질 수 있다. CTU가 먼저 4진 트리(일명 쿼드 트리) 구조에 의해 파티셔닝된다. 이어서, 4진 트리 리프 노드가 다중 타입 트리 구조에 의해 추가로 파티셔닝될 수 있다.
도 4a - 도 4d는 본 개시내용의 일부 구현에 따른 다중 타입 트리 분할 모드를 예시하는 개략도이다. 도 4a - 도 4d에 도시된 바와 같이, 다중 타입 트리 구조에는 수직 2진 분할(402)(SPLIT_BT_VER), 수평 2진 분할(404)(SPLIT_BT_HOR), 수직 3진 분할(406)(SPLIT_TT_VER) 및 수평 3진 분할(408)(SPLIT_TT_HOR)의 네 가지 분할 타입이 있다. 다중 타입 트리 리프 노드는 CU로 지칭되고, CU가 최대 변환 길이에 대해 너무 크지 않으면, 이러한 세그먼트화는 어떠한 추가 파티셔닝도 없이 예측 및 변환 처리에 사용된다. 이는 대부분의 경우들에, CU, PU 및 TU가 내포형 다중 타입 트리 코딩 블록 구조를 갖는 쿼드 트리에서 동일한 블록 크기를 갖는다는 것을 의미한다. 지원되는 최대 변환 길이가 CU의 색성분의 폭 또는 높이보다 작을 때 예외가 발생한다.
VVC에서의 신택스
VVC에서, 신택스 시그널링의 비트스트림의 첫 번째 계층은 비트스트림이 한 세트의 NAL 유닛으로 분할되는 NAL이다. 일부 NAL 유닛은 SPS 및 PPS와 같은 공통 제어 파라미터를 디코더에 시그널링한다. 다른 것들은 비디오 데이터를 포함한다. 비디오 코딩 계층(VCL: Video Coding Layer) NAL 유닛은 코딩된 비디오의 슬라이스를 포함한다. 코딩된 픽처는 액세스 유닛으로 불리며 하나 이상의 슬라이스로 인코딩될 수 있다.
코딩된 비디오 시퀀스는 순간 디코더 리프레시(IDR: Instantaneous Decoder Refresh) 픽처로 시작한다. 다음의 모든 비디오 픽처는 슬라이스로서 코딩된다. 새로운 IDR 픽처는 이전 비디오 세그먼트가 종료되고 새로운 세그먼트가 시작됨을 시그널링한다. 각각의 NAL 유닛은 원시 바이트 시퀀스 페이로드(RBSP: Raw Byte Sequence Payload)가 뒤따르는 1바이트 헤더로 시작한다. RBSP는 인코딩된 슬라이스를 포함한다. 슬라이스는 2진 코딩되므로, 슬라이스는 길이가 확실히 정수 바이트가 되게 0 비트로 패딩(pad)될 수 있다. 슬라이스는 슬라이스 헤더와 슬라이스 데이터로 구성된다. 슬라이스 데이터는 일련의 CU로 지정된다.
픽처 헤더 개념은 제16차 JVET 회의에서 픽처의 첫 번째 VCL NAL 유닛으로서 픽처당 한 번씩 전송되도록 채택되었다. 이전에 슬라이스 헤더에 있던 일부 신택스 엘리먼트를 이 픽처 헤더로 그룹화하는 것도 또한 제안되었다. 주어진 픽처에 대해 슬라이스로 여러 번 전송되는 대신, 기능적으로 픽처당 한 번만 전송될 필요가 있는 신택스 엘리먼트가 픽처 헤더로 이동될 수 있다.
VVC 규격에서, 신택스 표는 허용된 모든 비트스트림의 신택스의 수퍼세트를 지정한다. 신택스에 대한 추가 제약은 다른 조항에서 직접 또는 간접적으로 지정될 수 있다. 아래 표 1과 표 2는 VVC에서 슬라이스 헤더와 PH의 신택스 표이다. 일부 신택스의 시맨틱(semantic)은 또한 신택스 표 뒤에 예시된다.
선택된 신택스 엘리먼트의 시맨틱
ph_temporal_mvp_enabled_flag는 픽처 헤더(PH)와 연관된 슬라이스에 대한 인터 예측을 위해 시간적 움직임 벡터 예측자가 사용될 수 있는지 여부를 명시한다. ph_temporal_mvp_enabled_flag가 0과 같다면, PH와 연관된 슬라이스의 신택스 엘리먼트는 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용되지 않도록 제한될 것이다. 그렇지 않으면(ph_temporal_mvp_enabled_flag가 1과 같음), PH와 연관된 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용될 수 있다. ph_temporal_mvp_enabled_flag 값은 존재하지 않는 경우 0과 같다고 유추된다. 디코딩된 픽처 버퍼(DPB: Decoded Picture Buffer)의 참조 픽처가 현재 픽처와 동일한 공간 해상도를 갖지 않는 경우, ph_temporal_mvp_enabled_flag 값은 0과 같을 것이다.
서브블록 기반 병합 MVP 후보의 최대 수(MaxNumSubblockMergeCand)는 다음과 같이 도출된다:
(1)
MaxNumSubblockMergeCand의 값은 0부터 5까지의 범위에 있을 것이다.
1과 같은 slice_collocated_from_l0_flag는 시간적 움직임 벡터 예측에 사용되는 콜로케이트(collocate)된 픽처가 참조 픽처 리스트 0으로부터 도출됨을 명시한다. 0과 같은 slice_collocated_from_l0_flag는 시간적 움직임 벡터 예측에 사용되는 콜로케이트된 픽처가 참조 픽처 리스트 1로부터 도출됨을 명시한다. slice_type이 B 또는 P과 같고, ph_temporal_mvp_enabled_flag가 1과 같으며, slice_collocated_from_l0_flag가 존재하지 않으면, 다음이 적용된다:
-
rpl_info_in_ph_flag가 1과 같을 때, slice_collocated_from_l0_flag는 ph_collocated_from_l0_flag와 같은 것으로 유추된다.
-
그렇지 않으면(rpl_info_in_ph_flag가 0과 같고 slice_type이 P와 같음), slice_collocated_from_l0_flag의 값은 1과 같은 것으로 유추된다.
slice_collocated_ref_idx는 시간적 움직임 벡터 예측에 사용되는 콜로케이트된 픽처의 참조 인덱스를 지정한다.
slice_type이 P와 같을 때 또는 slice_type이 B와 같고 slice_collocated_from_l0_flag가 1과 같을 때, slice_collocated_ref_idx는 참조 픽처 리스트 0의 항목을 참조하고, slice_collocated_ref_idx의 값은 0부터 NumRefIdxActive[ 0 ] - 1까지의 범위에 있을 것이다.
slice_type이 B와 같고 slice_collocated_from_l0_flag가 0과 같을 때, slice_collocated_ref_idx는 참조 픽처 리스트 1의 항목을 참조하고, slice_collocated_ref_idx의 값은 0부터 NumRefIdxActive[ 1 ] - 1까지의 범위에 있을 것이다.
slice_collocated_ref_idx가 존재하지 않을 때, 다음이 적용된다:
-
rpl_info_in_ph_flag가 1과 같다면, slice_collocated_ref_idx의 값은 ph_collocated_ref_idx와 같은 것으로 유추된다.
-
그렇지 않으면(rpl_info_in_ph_flag가 0과 같음), slice_collocated_ref_idx의 값은 0과 같다고 유추된다.
slice_collocated_ref_idx에 의해 참조되는 픽처가 코딩된 픽처의 모든 슬라이스에 대해 동일할 것이라는 것이 비트스트림 적합성의 요건이다.
slice_collocated_ref_idx에 의해 참조되는 참조 픽처의 pic_width_in_luma_samples 및 pic_height_in_luma_samples의 값이 각각 현재 픽처의 pic_width_in_luma_samples 및 pic_height_in_luma_samples의 값과 같을 것이며, RprConstraintsActive[ slice_collocated_from_l0_flag ? 0 : 1 ][ slice_collocated_ref_idx ]는 0과 같을 것이라는 것이 비트스트림 적합성의 요건이다.
RprConstraintsActive[i][j]의 값은 아래에 요약된 VVC 규격의 섹션 8.3.2에서 도출된다는 점이 주목된다.
참조 픽처 리스트 구성에 대한 디코딩 프로세스
이 프로세스는 비-IDR 픽처의 각각의 슬라이스에 대한 디코딩 프로세스의 시작 시에 호출된다. 참조 픽처는 참조 인덱스들을 통해 어드레싱된다. 참조 인덱스는 참조 픽처 리스트에 대한 인덱스이다. I 슬라이스를 디코딩할 때, 슬라이스 데이터의 디코딩에는 참조 픽처 리스트가 사용되지 않는다. P 슬라이스를 디코딩할 때는, 슬라이스 데이터의 디코딩에 참조 픽처 리스트 0(즉, RefPicList[ 0 ])만이 사용된다. B 슬라이스를 디코딩할 때는, 슬라이스 데이터의 디코딩에 참조 픽처 리스트 0과 참조 픽처 리스트 1(즉, RefPicList[ 1 ]) 둘 다 사용된다.
비-IDR 픽처의 각각의 슬라이스에 대한 디코딩 프로세스의 시작 시, 참조 픽처 리스트 RefPicList[ 0 ] 및 RefPicList[ 1 ]이 도출된다. 참조 픽처 리스트는 조항 8.3.3에 명시된 바와 같이 참조 픽처의 마킹에 또는 슬라이스 데이터의 디코딩에 사용된다.
픽처의 첫 번째 슬라이스가 아닌 비-IDR 픽처의 I 슬라이스의 경우, 비트스트림 적합성 검사 목적으로 RefPicList[ 0 ] 및 RefPicList[ 1 ]이 도출될 수 있지만, 현재 픽처 또는 디코딩 순서에서 현재 픽처에 뒤따르는 픽처의 디코딩에 이들의 도출이 필요하지는 않다. 픽처의 첫 번째 슬라이스가 아닌 P 슬라이스의 경우, 비트스트림 적합성 검사 목적으로 RefPicList[ 1 ]이 도출될 수 있지만, 현재 픽처 또는 디코딩 순서에서 현재 픽처에 뒤따르는 픽처의 디코딩에 그 도출이 필요하지는 않다.
참조 픽처 리스트 RefPicList[ 0 ] 및 RefPicList[ 1 ], 참조 픽처 스케일링 비 RefPicScale[ i ][ j ][ 0 ] 및 RefPicScale[ i ][ j ][ 1 ], 그리고 참조 픽처 스케일링된 플래그 RprConstraintsActive[ 0 ][ j ] 및 RprConstraintsActive[ 1 ][ j ]는 다음과 같이 도출된다:
scaling_win_left_offset, scaling_win_right_offset, scaling_win_top_offset 및 scaling_win_bottom_offset은 스케일링 비 계산을 위해 픽처 크기에 적용되는 오프셋을 지정한다. scaling_win_left_offset, scaling_win_right_offset, scaling_win_top_offset 및 scaling_win_bottom_offset의 값은 존재하지 않는 경우 각각 pps_conf_win_left_offset, pps_conf_win_right_offset, pps_conf_win_top_offset 및 pps_conf_win_bottom_offset과 같은 것으로 유추된다.
SubWidthC * ( scaling_win_left_offset + scaling_win_right_offset )의 값은 pic_width_in_luma_samples보다 작을 것이고, SubHeightC * ( scaling_win_top_offset + scaling_win_bottom_offset )의 값은 pic_height_in_luma_samples보다 작을 것이다.
변수 PicOutputWidthL 및 PicOutputHeightL은 다음과 같이 도출된다:
(3)
(4)
refPicOutputWidthL 및 refPicOutputHeightL을 각각 이 PPS를 참조하는 현재 픽처의 참조 픽처의 PicOutputWidthL 및 PicOutputHeightL이라 한다. 다음의 모든 조건이 충족되는 것이 비트스트림 적합성의 요건이다:
-
PicOutputWidthL * 2는 refPicWidthInLumaSamples보다 크거나 같을 것이다.
-
PicOutputHeightL * 2는 refPicHeightInLumaSamples보다 크거나 같을 것이다.
-
PicOutputWidthL은 refPicWidthInLumaSamples * 8보다 작거나 같을 것이다.
-
PicOutputHeightL은 refPicHeightInLumaSamples * 8보다 작거나 같을 것이다.
-
PicOutputWidthL * pic_width_max_in_luma_samples는 refPicOutputWidthL * (pic_width_in_luma_samples - Max( 8, MinCbSizeY ))보다 크거나 같을 것이다.
-
PicOutputHeightL * pic_height_max_in_luma_samples는 refPicOutputHeightL * (pic_height_in_luma_samples - Max( 8, MinCbSizeY ))보다 크거나 같을 것이다.
NAL 유닛 신택스
HEVC와 유사하게, VVC 규격에서는, 전체 길이가 2바이트인 하나의 NAL 유닛 헤더 표가 NAL 유닛의 기본 정보를 지정하도록 각각의 NAL 유닛의 시작에서 시그널링된다. 표 3은 현재 NAL 유닛 헤더에 존재하는 신택스 엘리먼트를 예시한다.
표 3에서, 첫 번째 비트는 전송 중에 발생한 임의의 오류가 있는지 여부를 명시하는 데 사용되는 forbidden_zero_bit이다. 0은 NAL 유닛이 정상임을 의미하는 한편, 1은 신택스 위반이 있음을 의미한다. 따라서 일반 비트스트림의 경우, 그 대응하는 값은 0과 같을 것이다. 다음 비트는 향후 사용을 위해 예비되는 nuh_reserved_zero_bit이며 0과 같을 것이다. 다음 6비트는 신택스 nuh_layer_id의 값을 지정하는 데 사용되는데, NAL 유닛이 속한 계층을 식별한다. nuh_layer_id의 값은 0부터 55까지의 범위에 있을 것이다. nuh_layer_id에 대한 다른 값은 향후 사용을 위해 예비된다. 그 후, 신택스 엘리먼트 nal_unit_type은 NAL 유닛 타입, 즉 표 4에 명시된 바와 같이 NAL 유닛에 포함된 RBSP 데이터 구조의 타입을 지정하는 데 사용된다.
점진적 인트라 리프레시
레이턴시 및 오류 복원력은 실제 비디오 전송 시스템에서 고려되어야 하는 두 가지 중요한 요소이다. IRAP 픽처를 주기적으로 삽입하는 인트라 리프레시는 일반적으로 시간 픽처 간의 오류 전파를 제한하고 비트스트림의 오류 복원력을 향상시키는 데 사용된다. 그러나 인터 코딩의 코딩 효율이 인트라 코딩보다 훨씬 더 좋다는 사실로 인해, 상대적으로 크기가 큰 인트라 픽처는 고정된 전송률로 네트워크를 통해 전송될 때 이러한 픽처는 잠재적으로 레이턴시 문제를 일으킬 수 있다. 이는 바람직하지 않은 네트워크 정체 및 패킷 손실로 이어질 수 있다. 이러한 문제를 해결하기 위해, VVC 표준에 점진적 인트라 리프레시(GDR)가 채택되었는데, 이는 도 5에 도시된 바와 같이 인트라 코딩된 구역을 다수의 인터 픽처 사이로 확산시킨다. 도 5에 도시된 바와 같이, 2개의 영역이 정의된다. 파트 2는 클린(clean) 구역을 나타낸다. 클린 구역은 현재 GDR 기간 동안 리프레시된 픽셀에 대응하고 더티(dirty) 구역은 리프레시되지 않은 한 영역에 대응한다. 파트 1은 인트라 코딩이 적용되는 코딩 블록을 나타낸다. GDR의 원리는 동일한 GDR 기간에서 시간적 참조 픽처의 리프레시된 영역에서만 나오는 픽셀을 사용하여 클린 구역으로부터의 픽셀이 복원됨을 보장하는 것이다. 현재 VVC에는, 픽처 헤더에서 시그널링되는 3개의 GDR 관련 신택스 엘리먼트 ph_gdr_or_irap_pic_flag, ph_gdr_pic_flag 및 ph_recovery_poc_cnt가 있다. 표 5는 픽처 헤더의 대응하는 GDR 시그널링 및 연관된 시맨틱을 예시한다.
1과 같은 ph_gdr_or_irap_pic_flag는 현재 픽처가 GDR 또는 IRAP 픽처임을 명시한다. 0과 같은 ph_gdr_or_irap_pic_flag는 현재 픽처가 GDR 픽처가 아니며 IRAP 픽처일 수도 있고 또는 아닐 수도 있음을 명시한다.
1과 같은 ph_gdr_pic_flag는 PH와 연관된 픽처가 GDR 픽처임을 명시한다. 0과 같은 ph_gdr_pic_flag는 PH와 연관된 픽처가 GDR 픽처가 아님을 명시한다. ph_gdr_pic_flag의 값은 존재하지 않는 경우 0과 같다고 유추된다. sps_gdr_enabled_flag가 0과 같으면, ph_gdr_pic_flag의 값은 0과 같을 것이다.
ph_gdr_or_irap_pic_flag가 1과 같고 ph_gdr_pic_flag가 0과 같을 때, PH와 연관된 픽처는 IRAP 픽처이다.
ph_recovery_poc_cnt는 디코딩된 픽처의 복구 지점을 출력 순서로 명시한다. 현재 픽처가 GDR 픽처인 경우, 변수 recoveryPointPocVal은 다음과 같이 도출된다:
recoveryPointPocVal = PicOrderCntVal + ph_recovery_poc_cnt
(5)
현재 픽처가 GDR 픽처이고, recoveryPointPocVal과 동일한 PicOrderCntVal을 갖는 CLVS에서의 디코딩 순서에서 현재 GDR 픽처를 따르는 픽처 picA가 있는 경우, 픽처 picA는 복구 지점 픽처로 지칭된다. 그렇지 않으면, 출력 순서에서 CLVS에서의 recoveryPointPocVal보다 큰 PicOrderCntVal을 갖는 첫 번째 픽처는 복구 지점 픽처로 지칭된다. 복구 지점 픽처는 디코딩 순서에서 현재 GDR 픽처보다 선행하지 않을 것이다. 현재 GDR 픽처와 연관되며 recoveryPointPocVal보다 작은 PicOrderCntVal을 갖는 픽처는 GDR 픽처의 복구 픽처로 지칭된다. ph_recovery_poc_cnt의 값은 0부터 MaxPicOrderCntLsb - 1까지의 범위에 있을 것이다.
sps_gdr_enabled_flag가 1과 같고 현재 픽처의 PicOrderCntVal이 연관된 GDR 픽처의 recoveryPointPocVal보다 크거나 같을 때, 출력 순서에서 현재 및 후속 디코딩된 픽처는 존재하는 경우, 디코딩 순서에서 연관된 GDR 픽처에 선행하는 이전 IRAP 픽처에서부터 디코딩 프로세스를 시작함으로써 생성된 해당 픽처와 정확히 일치한다.
하나의 픽처에서의 혼합된 NAL 타입
하나의 픽처 내의 슬라이스의 NAL 타입이 동일해야 하는 HEVC 표준과는 달리, 하나의 픽처 내에 IRAP 및 비-IRAP NAL 유닛 타입의 혼합을 갖는 것이 허용된다. 이러한 기능의 동기는 서브픽처를 사용하는 구역 기반 랜덤 액세스이다. 예를 들어, 360도 비디오 스트리밍의 경우, 하나의 360도 비디오의 일부 영역은 다른 영역보다 사용자에 의해 더 많이 시청될 수 있다. 코딩 효율과 평균 시점 스위칭 레이턴시 간의 더 나은 절충을 위해, 다른 영역보다 더 자주 시청되는 영역을 코딩하는 데 더 빈번한 IRAP 픽처가 사용될 수 있다. 이러한 이유로, PPS에 하나의 플래그 pps_mixed_nalu_types_in_pic_flag가 도입된다. 플래그가 1가 같을 때, 이는 PPS를 참조하는 각각의 픽처가 하나보다 많은 NAL 유닛을 갖고 NAL 유닛이 동일한 nal_unit_type 값을 갖지 않음을 지시한다. 그렇지 않으면(플래그가 0과 같을 때), PPS를 참조하는 각각의 픽처는 하나 이상의 NAL 유닛을 갖고 PPS를 참조하는 각각의 픽처의 NAL 유닛은 동일한 nal_unit_type 값을 갖는다. 추가로, 플래그 pps_mixed_nalu_types_in_pic_flag는 1과 같고, 임의의 특정 픽처에 대해 일부 NAL 유닛이 특정 IRAP NAL 유닛 타입을 갖고 다른 NAL 유닛은 특정 비-IRAP NAL 유닛 타입을 갖는다는 하나의 비트스트림 적합성 제약이 추가로 적용된다. 다시 말해서, 아래에 명시된 바와 같이, 임의의 특정 픽처의 NAL 유닛은 하나보다 많은 IRAP NAL 유닛 타입을 가질 수 없고 하나보다 많은 비-IRAP NAL 유닛 타입을 가질 수 없다.
임의의 특정 픽처의 VCL NAL 유닛의 경우, 다음이 적용된다:
-
pps_mixed_nalu_types_in_pic_flag가 0과 같다면, nal_unit_type의 값은 픽처의 모든 VCL NAL 유닛에 대해 동일할 것이며, 픽처 또는 PU는 픽처 또는 PU의 코딩된 슬라이스 NAL 유닛과 동일한 NAL 유닛 타입을 갖는 것으로 언급된다.
-
그렇지 않으면(pps_mixed_nalu_types_in_pic_flag가 1과 같음), 다음이 적용된다:
- 픽처는 적어도 2개의 서브픽처를 포함할 것이다.
- 픽처의 VCL NAL 유닛은 2개 이상의 서로 다른 nal_unit_type 값을 가질 것이다.
- GDR_NUT와 같은 nal_unit_type을 갖는 픽처의 VCL NAL 유닛이 없을 것이다.
- 픽처의 적어도 하나의 서브픽처의 VCL NAL 유닛이 IDR_W_RADL, IDR_N_LP 또는 CRA_NUT와 같은 특정 nal_unit_type 값을 가질 때, 픽처의 다른 서브픽처의 VCL NAL 유닛은 모두 TRAIL_NUT와 같은 nal_unit_type을 가질 것이다.
현재 VVC에서, mvd_l1_zero_flag는 어떠한 조건부 제약도 없이 픽처 헤더(PH)에서 시그널링된다. 그러나 플래그 mvd_l1_zero_flag에 의해 제어되는 특징은 슬라이스가 양방향 예측 슬라이스(B-슬라이스)일 때만 적용 가능하다. 따라서 플래그 시그널링은 픽처 헤더와 관련된 슬라이스가 B-슬라이스가 아닌 경우에는 중복이다.
유사하게, 다른 예에서, ph_disable_bdof_flag 및 ph_disable_dmvr_flag는 각각, 시퀀스 파라미터 세트(SPS: sequence parameter set)에서 시그널링되는 대응하는 인에이블 플래그(sps_bdof_pic_present_flag, sps_dmvr_pic_present_flag)가 참인 경우에만 PH에서 시그널링된다. 그러나 표 6에 도시된 바와 같이, 플래그 ph_disable_bdof_flag 및 ph_disable_dmvr_flag에 의해 제어되는 특징은 슬라이스가 양방향 예측 슬라이스(B-슬라이스)인 경우에만 적용 가능하다. 따라서 이 두 플래그의 시그널링은 픽처 헤더와 연관된 슬라이스가 B-슬라이스가 아닌 경우에는 중복이거나 쓸모가 없다.
표 7에 도시된 바와 같이, 콜로케이트된 픽처가 리스트 0 또는 리스트 1로부터 나옴을 지시하는 신택스 엘리먼트 ph_collocated_from_l0_flag에 대해 하나 이상의 예가 또한 확인될 수 있다. 그리고 표 8에 도시된 바와 같이, 양방향 예측에 대해 표로 기재된 가중치와 관련된 신택스 엘리먼트인 신택스 pred_weight_table( )에 대해 다른 예가 확인될 수 있다.
문제는 신택스 ph_temporal_mvp_enabled_flag와 연관된다. 현재 VVC에서는, TMVP(Temporal motion Vector Prediction) 도출을 위해 선택된 콜로케이트된 픽처의 해상도가 현재 픽처의 해상도와 동일할 것이므로, 아래에 예시된 바와 같이 ph_temporal_mvp_enabled_flag의 값을 확인하기 위한 비트스트림 적합성 제약이 있으며: DPB의 어떤 참조 픽처도 현재 픽처와 동일한 공간 해상도를 갖지 않는 경우, ph_temporal_mvp_enabled_flag의 값은 0과 같을 것이다.
그러나 현재 VVC에서는, 콜로케이트된 픽처의 해상도가 TMVP의 인에이블에 영향을 줄 뿐만 아니라, 스케일링 비 계산을 위해 픽처 크기에 적용되는 오프셋도 TMVP의 인에이블에 영향을 준다. 그러나 현재 VVC에서는, ph_temporal_mvp_enabled_flag의 비트스트림 적합성에서 오프셋은 고려되지 않는다.
더욱이, slice_collocated_ref_idx에 의해 참조되는 픽처가 코딩된 픽처의 모든 슬라이스에 대해 동일할 것이라는 비트스트림 적합성의 요건이 있다. 그러나 코딩된 픽처가 다수의 슬라이스를 갖고 이러한 모든 슬라이스 간에 공통 참조 픽처가 존재하지 않는 경우, 이 비트스트림 적합성은 충족될 기회가 없다. 그리고 이러한 경우, ph_temporal_mvp_enabled_flag는 0으로 제한되어야 한다.
현재 VVC 규격에 따르면, IRAP 픽처는 동일한 nal_unit_type을 갖는 연관된 모든 NAL 유닛이 IRAP NAL 타입에 속하는 하나의 픽처로 지칭된다. 구체적으로, 아래의 설명은 VVC 규격에서 IRAP 픽처를 정의하는 데 사용된다:
인트라 랜덤 액세스 포인트(IRAP) 픽처: 모든 VCL NAL 유닛이 IDR_W_RADL부터 CRA_NUT까지의 범위 내의 동일한 nal_unit_type 값을 갖는 코딩된 픽처.
IRAP 픽처는 디코딩 프로세스에서 인터 예측을 사용하지 않으며, CRA 픽처 또는 IDR 픽처일 수 있다. 디코딩 순서에서 비트스트림의 첫 번째 픽처는 IRAP 또는 GDR 픽처이어야 한다. 필요한 파라미터 세트가 참조되어야 할 때 그러한 파라미터 세트가 이용 가능하다면, 디코딩 순서에서 CLVS의 IRAP 픽처 및 모든 후속 비-RASL 픽처는 디코딩 순서에서 IRAP 픽처에 선행하는 어떠한 픽처의 디코딩 프로세스도 수행하지 않고 올바르게 디코딩될 수 있다.
IRAP 픽처에 대한 pps_mixed_nalu_types_in_pic_flag의 값은 0과 같다. 픽처에 대해 pps_mixed_nalu_types_in_pic_flag가 0과 같고, 픽처의 임의의 슬라이스가 IDR_W_RADL부터 CRA_NUT까지의 범위 내의 nal_unit_type을 가질 때, 픽처의 모든 다른 슬라이스는 동일한 nal_unit_type 값을 갖고, 픽처는 IRAP 픽처로 알려진다.
위에서부터 확인될 수 있듯이, 각각의 IRAP 픽처에 대해, 픽처가 참조하는 대응하는 PPS는 0과 같은 pps_mixed_nalu_types_in_pic_flag를 가져야 한다. 마찬가지로, 현재 VVC 규격에서, GDR 픽처는 픽처와 연관된 모든 NAL의 nal_unit_type이 다음과 같이 명시된 대로 GDR_NUT와 같을 하나의 픽처로 지칭된다.
점진적 디코딩 리프레시(GDR) 픽처: 각각의 VCL NAL 유닛이 GDR_NUT와 같은 nal_unit_type을 갖는 픽처.
하나의 GDR 픽처의 모든 NAL 유닛이 동일한 NAL 타입을 가져야 한다면, GDR 픽처가 참조하는 해당 PPS의 플래그 pps_mixed_nalu_types_in_pic_flag는 1과 같을 수 없다.
다른 한편으로는, 하나의 픽처가 하나의 IRAP 픽처인지 또는 하나의 GDR 픽처인지를 지시할 2개의 플래그, 즉 ph_gdr_or_irap_pic_flag 및 ph_gdr_pic_flag가 픽처 헤더에서 시그널링된다. 플래그 ph_gdr_or_irap_pic_flag가 1과 같고 플래그 ph_gdr_pic_flag가 0과 같을 때, 현재 픽처는 하나의 IRAP 픽처이다. 플래그 ph_gdr_or_irap_pic_flag가 1과 같고 플래그 ph_gdr_pic_flag가 1과 같을 때, 현재 픽처는 하나의 GDR 픽처이다. 현재 VVC 규격에 따르면, PPS의 플래그 pps_mixed_nalu_types_in_pic_flag 값을 고려하지 않고 두 플래그가 1 또는 0으로서 시그널링되는 것이 허용된다. 그러나 앞서 언급된 바와 같이, 하나의 픽처는 픽처 내의 NAL 유닛이 동일한 nal_unit_type을 갖는 경우에만, 즉 해당 pps_mixed_nalu_types_in_pic_flag가 0이어야 하는 경우에만 하나의 IRAP 픽처 또는 하나의 GDR 픽처일 수 있다. 따라서 픽처 헤더의 기존 IRAP/GDR 시그널링은 ph_gdr_or_irap_pic_flag와 ph_gdr_pic_flag 중 어느 하나 또는 둘 다가 1과 같고(즉, 현재 픽처가 IRAP 픽처 또는 GDR 픽처임을 지시함) 해당 pps_mixed_naly_types_in_pic_flag가 1과 같을 때(즉, 현재 픽처에 다수의 NAL 타입이 있음을 지시함) 문제가 된다.
플래그 mvd_l1_zero_flag, ph_disable_bdof_flag 및 ph_disable_dmvr_flag에 의해 제어되는 특징은 슬라이스가 양방향 예측 슬라이스(B-슬라이스)인 경우에만 적용 가능하므로, 본 개시내용의 방법에 따르면, 연관된 슬라이스가 B-슬라이스인 경우에만 이러한 플래그를 시그널링하는 것이 제안된다. 참조 픽처 리스트가 PH에서 시그널링되는 경우(예컨대, rpl_info_in_ph_flag=1), 이는 코딩된 픽처의 모든 슬라이스가 PH에서 시그널링되는 동일한 참조 픽처를 사용함을 의미한다는 점이 주목된다. 따라서 참조 픽처 리스트가 PH로 시그널링되고 시그널링된 참조 픽처 리스트가 현재 픽처가 양방향 예측이 아님을 지시할 때, 플래그 mvd_l1_zero_flag, ph_disable_bdof_flag 및 ph_disable_dmvr_flag는 시그널링될 필요가 없다. 첫 번째 실시예에서, 픽처 헤더의 신택스의 일부에 대해 송신된 부적절한 값으로 인한 중복 시그널링 또는 정의되지 않은 디코딩 거동을 방지하기 위해 픽처 헤더(PH)에서 송신된 그러한 신택스에 일부 조건이 추가된다. 실시예에 기초한 일부 예가 아래에 예시되며, 여기서 변수 num_ref_entries[i][ RplsIdx[ i ]]는 리스트 i 내의 참조 픽처의 수를 나타낸다.
대안으로, 조건은 동일한 결과를 제공하는 보다 간결한 형태로 기록될 수 있다. 양방향 예측 슬라이스(B-슬라이스) 또는 양방향 예측 픽처는 적어도 하나의 리스트 1 참조 픽처를 가져야 하므로, 이는 현재 슬라이스/픽처가 리스트 1 참조 픽처를 갖는지 여부만을 확인할 수 있다. 대안 조건 확인의 일례는 다음과 같다:
mvd_l1_zero_flag의 시맨틱은 또한 이것이 시그널링되지 않는 경우를 처리하도록 수정된다.
1과 같은 mvd_l1_zero_flag는, mvd_coding( x0, y0, 1 ) 신택스 구조가 파싱(parse)되지 않고 compIdx = 0..1 및 cpIdx = 0..2에 대해 MvdL1[ x0 ][ y0 ][ compIdx ] 및 MvdCpL1[ x0 ][ y0 ][ cpIdx ][ compIdx ]가 0과 같게 설정됨을 지시한다. 0과 같은 mvd_l1_zero_flag는 mvd_coding( x0, y0, 1 ) 신택스 구조가 파싱됨을 지시한다. mvd_l1_zero_flag의 값은, 존재하지 않는 경우 0인 것으로 유추된다.
신택스 엘리먼트 ph_disable_dmvr_flag를 조건부로 시그널링하는 몇 가지 예가 아래에 예시된다.
마찬가지로, 대안 조건 확인의 일례는 다음과 같다:
ph_disable_dmvr_flag의 시맨틱은 또한 이것이 시그널링되지 않는 경우를 처리하도록 수정된다.
1과 같은 ph_disable_dmvr_flag는 PH와 연관된 슬라이스에서 디코더 움직임 벡터 개선 기반 인터 양방향 예측이 디세이블됨을 명시한다. 0과 같은 ph_disable_dmvr_flag는 PH와 연관된 슬라이스에서 디코더 움직임 벡터 개선 기반 인터 양방향 예측이 인에이블될 수도 있고 또는 인에이블되지 않을 수도 있음을 명시한다.
ph_disable_dmvr_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 0과 같다고 유추된다.
-
그 밖에 sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 1과 같다면, ph_disable_dmvr_flag의 값은 1과 같은 것으로 유추된다.
-
그렇지 않으면(sps_dmvr_enabled_flag가 0과 같음), ph_disable_dmvr_flag의 값은 1과 같다고 유추된다.
ph_disable_dmvr_flag가 제시되지 않을 때 ph_disable_dmvr_flag의 값을 도출하기 위한 대안 방식이 아래에 예시된다:
-
ph_disable_dmvr_flag 값이 명시적으로 시그널링되거나 암시적으로 도출될 때 그 값의 도출을 위해 모든 조건이 고려된다면: sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 0과 같다고 유추된다.
-
그 밖에 sps_dmvr_enabled_flag가 0과 같고 sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 1과 같은 것으로 유추된다.
-
그 밖에 sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 X와 같은 것으로 유추된다. (X가 명시적으로 시그널링됨)
-
그 밖에 sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] > 0이라면, ph_disable_dmvr_flag의 값은 X와 같은 것으로 유추된다. (X가 명시적으로 시그널링됨)
-
그렇지 않으면(sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] ==0임), ph_disable_dmvr_flag의 값은 1과 같다고 유추된다.
신택스 엘리먼트 ph_disable_dmvr_flag는 세 번째 조건 및 네 번째 조건 하에서 명시적으로 시그널링 되기 때문에, 이들은 ph_disable_dmvr_flag가 존재하지 않을 때 ph_disable_dmvr_flag의 도출로부터 제거될 수 있다:
ph_disable_dmvr_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 0과 같다고 유추된다.
-
그 밖에 sps_dmvr_enabled_flag가 0과 같고 sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 1과 같은 것으로 유추된다.
-
그렇지 않으면(sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] ==0임), ph_disable_dmvr_flag의 값은 1과 같다고 유추된다.
조건은 아래와 같이 편집상 단순화될 수 있다:
ph_disable_ dmvr_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_dmvr_enabled_flag가 1과 같고 sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 0과 같다고 유추된다.
-
그렇지 않으면(sps_dmvr_enabled_flag가 0과 같거나 sps_dmvr_pic_present_flag가 1과 같음), ph_disable_dmvr_flag의 값은 1과 같다고 유추된다.
ph_disable_dmvr_flag가 제시되지 않을 때 ph_disable_dmvr_flag의 값을 도출하기 위한 다른 대안 방식이 아래에 예시된다:
ph_disable_dmvr_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_ dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 1 - sps_dmvr_enabled_flag와 같다고 유추된다.
-
그 밖에 sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 1 - sps_ dmvr_enabled_flag와 같다고 유추된다.
-
그 밖에 sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] > 0이라면, ph_disable_dmvr_flag의 값은 1 - sps_dmvr_enabled_flag와 같다고 유추된다.
-
그렇지 않으면(sps_dmvr_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] ==0임), ph_disable_dmvr_flag의 값은 1과 같다고 유추된다.
신택스 엘리먼트 ph_disable_dmvr_flag는 두 번째 조건 및 세 번째 조건 하에서 명시적으로 시그널링 되기 때문에, 이들은 ph_disable_dmvr_flag가 존재하지 않을 때 ph_disable_dmvr_flag의 도출로부터 제거될 수 있다:
ph_disable_dmvr_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_dmvr_pic_present_flag가 0과 같다면, ph_disable_dmvr_flag의 값은 1 - sps_ dmvr_enabled_flag와 같다고 유추된다.
-
그렇지 않으면, ph_disable_ dmvr_flag의 값은 1과 같다고 유추된다.
신택스 엘리먼트 ph_disable_bdof_flag를 조건부로 시그널링하는 몇 가지 예가 아래에 예시된다.
마찬가지로, 대안 조건 확인의 일례는 다음과 같다:
ph_disable_bdof_flag의 시맨틱은 또한 이것이 시그널링되지 않는 경우를 처리하도록 수정된다.
1과 같은 ph_disable_bdof_flag는 PH와 연관된 슬라이스에서 양방향 광 흐름 인터 예측 기반 인터 양방향 예측이 디세이블됨을 명시한다. 0과 같은 ph_disable_bdof_flag는 PH와 연관된 슬라이스에서 양방향 광 흐름 인터 예측 기반 인터 양방향 예측이 인에이블될 수도 있고 또는 인에이블되지 않을 수도 있음을 명시한다.
ph_disable_bdof_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 0과 같다고 유추된다.
-
그 밖에 sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 1과 같다면, ph_disable_dmvr_flag의 값은 1과 같다고 유추된다.
-
그렇지 않으면(sps_bdof_enabled_flag가 0임), ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
ph_disable_bdof_flag가 제시되지 않을 때 ph_disable_bdof_flag의 값을 도출하기 위한 대안 방식이 아래에 예시된다:
ph_disable_bdof_flag 값이 명시적으로 시그널링되거나 암시적으로 도출될 때 그 값의 도출을 위해 모든 조건이 고려된다면:
-
sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 0과 같다고 유추된다.
-
그 밖에 sps_bdof_enabled_flag가 0과 같고 sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
-
그 밖에 sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 0과 같다면, ph_disable_bdof_flag의 값은 X와 같은 것으로 유추된다. (X가 명시적으로 시그널링됨)
-
그 밖에 sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] > 0이라면, ph_disable_bdof_flag의 값은 X와 같은 것으로 유추된다. (X가 명시적으로 시그널링됨)
-
그렇지 않으면(sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] ==0임), ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
신택스 엘리먼트 ph_disable_bdof_flag는 세 번째 조건 및 네 번째 조건 하에서 명시적으로 시그널링 되기 때문에, 이들은 ph_disable_bdof_flag가 존재하지 않을 때 ph_disable_bdof_flag의 도출로부터 제거될 수 있다:
ph_disable_bdof_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 0과 같다고 유추된다.
-
그 밖에 sps_bdof_enabled_flag가 0과 같고 sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
-
그렇지 않으면(sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] ==0임), ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
조건은 아래와 같이 편집상 단순화될 수 있다:
ph_disable_bdof_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 0과 같다고 유추된다.
-
그렇지 않으면(sps_bdof_enabled_flag가 0과 같고 또는 sps_bdof_pic_present_flag가 1과 같음), ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
ph_disable_bdof_flag가 제시되지 않을 때 ph_disable_bdof_flag의 값을 도출하기 위한 다른 대안 방식이 아래에 예시된다:
ph_disable_bdof_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 1 - sps_bdof_enabled_flag와 같다고 유추된다.
-
그 밖에 sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 0과 같다면, ph_disable_bdof_flag의 값은 1 - sps_bdof_enabled_flag와 같다고 유추된다.
-
그 밖에 sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] > 0이라면, ph_disable_bdof_flag의 값은 1 - sps_bdof_enabled_flag와 같다고 유추된다.
-
그렇지 않으면(sps_bdof_pic_present_flag가 1과 같고 rpl_info_in_ph_flag가 1과 같고 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] ==0임), ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
신택스 엘리먼트 ph_disable_bdof_flag는 두 번째 조건 및 세 번째 조건 하에서 명시적으로 시그널링 되기 때문에, 이들은 ph_disable_bdof_flag가 존재하지 않을 때 ph_disable_bdof_flag의 도출로부터 제거될 수 있다:
ph_disable_bdof_flag가 존재하지 않을 때, 다음이 적용된다:
-
sps_bdof_pic_present_flag가 0과 같다면, ph_disable_bdof_flag의 값은 1 - sps_bdof_enabled_flag와 같다고 유추된다.
-
그렇지 않으면, ph_disable_bdof_flag의 값은 1과 같다고 유추된다.
더욱이, 신택스 엘리먼트 ph_collocated_from_l0_flag 및 weight_table( )에 대한 시그널링 조건은 수정되는데, 이는 연관된 슬라이스가 B-슬라이스인 경우에만 두 가지 타입의 신택스 엘리먼트가 적용 가능하다. 수정된 신택스 엘리먼트 시그널링의 예는 아래의 표 9 - 표 11에 예시된다.
ph_collocated_from_l0_flag의 시맨틱은 또한 이것이 시그널링되지 않는 경우를 처리하도록 수정된다.
1과 같은 ph_collocated_from_l0_flag는 시간적 움직임 벡터 예측에 사용되는 콜로케이트된 픽처가 참조 픽처 리스트 0으로부터 도출됨을 명시한다. 0과 같은 ph_collocated_from_l0_flag는 시간적 움직임 벡터 예측에 사용되는 콜로케이트된 픽처가 참조 픽처 리스트 1로부터 도출됨을 명시한다.
ph_collocated_from_l0_flag가 존재하지 않을 때, 다음이 적용된다:
-
num_ref_entries[ 0 ][ RplsIdx[ 0 ] ]이 1보다 크다면, ph_collocated_from_l0_flag의 값은 1인 것으로 유추된다.
-
그렇지 않으면(num_ref_entries[ 1 ][ RplsIdx[ 1 ] ]이 1보다 큼), ph_collocated_from_l0_flag의 값은 0인 것으로 유추된다.
마찬가지로, 대안 조건 확인의 일례가 아래에 예시된다.
pred_weight_table( )의 신택스 엘리먼트의 시맨틱은 또한 이들이 시그널링되지 않는 경우를 처리하도록 수정된다.
num_l1_weights는 pps_weighted_bipred_flag와 wp_info_in_ph_flag가 둘 다 1과 같을 때 참조 픽처 리스트 1의 항목에 대해 시그널링된 가중치들의 수를 지정한다. num_l1_weights의 값은 0부터 Min( 15, num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] )까지의 범위에 있을 것이다.
변수 NumWeightsL1은 다음과 같이 도출된다:
pred_weight_table( )의 신택스 엘리먼트의 시맨틱에서, num_l1_weights가 제시되지 않을 때 num_l1_weights의 값을 도출하기 위한 대안 방식이 아래에 예시된다:
num_l1_weights는 pps_weighted_bipred_flag와 wp_info_in_ph_flag가 둘 다 1과 같을 때 참조 픽처 리스트 1의 항목에 대해 시그널링된 가중치들의 수를 지정한다. num_l1_weights의 값은 0부터 Min( 15, num_ref_entries[ 1 ][ RplsIdx[ 1 ] ] )까지의 범위에 있을 것이다. num_l1_weights의 값은, 존재하지 않는 경우 0인 것으로 유추된다.
변수 NumWeightsL1은 다음과 같이 도출된다:
pred_weight_table( )의 신택스 엘리먼트의 시맨틱에서, num_l1_weights가 제시되지 않을 때 num_l1_weights의 값을 도출하기 위한 다른 대안 방식이 아래에 예시된다:
개념상, 시그널링 중복 비트를 피하기 위해 B 슬라이스에만 적용 가능한 임의의 신택스 엘리먼트에 대한 리스트 0 및 리스트 1 참조 픽처 리스트 모두로부터의 참조 픽처를 갖는지 여부를 확인하기 위해 시그널링 조건을 추가하는 것이 제안된다. 확인 조건은 두 참조 픽처 리스트(예컨대, 리스트 0/리스트 1 참조 픽처 리스트)의 크기를 확인하기 위한 위에서 언급한 방법에 제한되지 않으며, 확인 조건은 리스트 0 및 리스트 1 참조 픽처 리스트 모두로부터 참조 픽처를 갖는지 여부를 지시하기 위한 임의의 다른 방법일 수 있다. 예를 들어, 현재 픽처가 리스트 0 및 리스트 1 참조 픽처 모두를 갖는지 여부를 지시하는 플래그가 시그널링될 수 있다.
신택스 엘리먼트가 시그널링되지 않고 참조 픽처 리스트 정보가 PH에서 시그널링되면, 현재 픽처가 리스트 0 및 리스트 1 참조 픽처를 모두 갖는지 또는 현재 픽처가 리스트 0 참조 픽처 또는 리스트 1 참조 픽처만을 갖는지의 정보를 사용하여 신택스 엘리먼트의 값이 도출된다. 일례로, ph_collocated_from_l0_flag가 시그널링되지 않으면, 그 값은 현재 픽처가 갖는 유일한 참조 픽처인 것으로 유추된다. 다른 예에서, sps_bdof_enabled_flag가 1과 같고 sps_bdof_pic_present_flag는 1과 같지만 ph_disable_bdof_flag가 시그널링되지 않을 때, 이는 ph_disable_bdof_flag에 대한 제안된 시그널링 조건에 따라 num_ref_entries[ 0 ][ RplsIdx[ 0 ] ]이 0과 같거나 num_ref_entries[ 1 ][ RplsIdx[ 1 ] ]이 0과 같음을 의미한다. 따라서 이 조건 하에서, ph_disable_bdof_flag는 시그널링되지 않고 1로서 유추된다. 현재 VVC에서는, 콜로케이트된 픽처의 해상도가 TMVP의 인에이블에 영향을 줄 수 있을 뿐만 아니라, 스케일링 비 계산을 위해 픽처 크기에 적용된 오프셋도 TMVP의 인에이블에 영향을 줄 수 있다. 그러나 현재 VVC에서는, ph_temporal_mvp_enabled_flag의 비트스트림 적합성에서 오프셋은 고려되지 않는다. 두 번째 실시예에서, ph_temporal_mvp_enabled_flag의 값이 아래에 예시된 바와 같이, 스케일링 비 계산을 위해 픽처 크기에 적용되는 오프셋에 의존할 것을 요구하는 비트스트림 적합성 제약을 현재 VVC에 추가하는 것이 제안된다.
DPB의 어떠한 참조 픽처도 현재 픽처와 동일한 공간 해상도 및 스케일링 비 계산을 위한 픽처 크기에 적용되는 동일한 오프셋을 갖지 않는 경우, ph_temporal_mvp_enabled_flag의 값은 0과 같을 것이다.
위의 문장들은 또한 아래와 같이 다른 방식으로 쓰여질 수 있다:
DPB 내의 어떠한 참조 픽처도 0과 같은 연관된 변수 값 RprConstraintsActive[ i ][ j ]를 갖는 경우, ph_temporal_mvp_enabled_flag의 값은 0과 같을 것이다.
현재 VVC에는, slice_collocated_ref_idx에 의해 참조되는 픽처가 코딩된 픽처의 모든 슬라이스에 대해 동일할 것이라는 비트스트림 적합성의 요건이 있다. 그러나 코딩된 픽처가 다수의 슬라이스를 갖고 이러한 모든 슬라이스 간에 공통 참조 픽처가 존재하지 않는 경우, 이 비트스트림 적합성은 충족될 기회가 없다. 본 개시내용의 세 번째 실시예에서는, 현재 픽처의 모든 슬라이스 사이에 존재하는 공통 참조 픽처가 있는지 여부를 고려하도록 ph_temporal_mvp_enabled_flag에 대한 비트스트림 적합성 요건이 수정된다. 실시예에 기초하여, VVC 규격에 대한 몇 가지 예시적인 수정이 아래에 예시된다.
ph_temporal_mvp_enabled_flag는 PH와 연관된 슬라이스에 대한 인터 예측을 위해 시간적 움직임 벡터 예측자가 사용될 수 있는지 여부를 명시한다. ph_temporal_mvp_enabled_flag가 0과 같다면, PH와 연관된 슬라이스의 신택스 엘리먼트는 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용되지 않도록 제한될 것이다. 그렇지 않으면(ph_temporal_mvp_enabled_flag가 1과 같음), PH와 연관된 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용될 수 있다. ph_temporal_mvp_enabled_flag 값은 존재하지 않는 경우 0과 같다고 유추된다. DPB의 참조 픽처가 현재 픽처와 동일한 공간 해상도를 갖지 않는 경우, ph_temporal_mvp_enabled_flag 값은 0과 같을 것이다. PH와 연관된 모든 슬라이스에 공통 참조 픽처가 존재하지 않으면, ph_temporal_mvp_enabled_flag의 값은 0과 같을 것이다.
ph_temporal_mvp_enabled_flag는 PH와 연관된 슬라이스에 대한 인터 예측을 위해 시간적 움직임 벡터 예측자가 사용될 수 있는지 여부를 명시한다. ph_temporal_mvp_enabled_flag가 0과 같다면, PH와 연관된 슬라이스의 신택스 엘리먼트는 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용되지 않도록 제한될 것이다. 그렇지 않으면(ph_temporal_mvp_enabled_flag가 1과 같음), PH와 연관된 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용될 수 있다. ph_temporal_mvp_enabled_flag 값은 존재하지 않는 경우 0과 같다고 유추된다. DPB의 참조 픽처가 현재 픽처와 동일한 공간 해상도를 갖지 않는 경우, ph_temporal_mvp_enabled_flag 값은 0과 같을 것이다. PH와 연관된 모든 인터 슬라이스에 공통 참조 픽처가 존재하지 않으면, ph_temporal_mvp_enabled_flag의 값은 0과 같을 것이다.
ph_temporal_mvp_enabled_flag는 PH와 연관된 슬라이스에 대한 인터 예측을 위해 시간적 움직임 벡터 예측자가 사용될 수 있는지 여부를 명시한다. ph_temporal_mvp_enabled_flag가 0과 같다면, PH와 연관된 슬라이스의 신택스 엘리먼트는 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용되지 않도록 제한될 것이다. 그렇지 않으면(ph_temporal_mvp_enabled_flag가 1과 같음), PH와 연관된 슬라이스의 디코딩에 시간적 움직임 벡터 예측자가 사용될 수 있다. ph_temporal_mvp_enabled_flag 값은 존재하지 않는 경우 0과 같다고 유추된다. DPB의 참조 픽처가 현재 픽처와 동일한 공간 해상도를 갖지 않는 경우, ph_temporal_mvp_enabled_flag 값은 0과 같을 것이다. PH와 연관된 모든 비-인트라 슬라이스에 공통 참조 픽처가 존재하지 않으면, ph_temporal_mvp_enabled_flag의 값은 0과 같을 것이다.
일례로, slice_collocated_ref_idx에 대한 비트스트림 적합성은 아래와 같이 단순화된다:
slice_collocated_ref_idx에 의해 참조되는 참조 픽처의 pic_width_in_luma_samples 및 pic_height_in_luma_samples의 값이 각각 현재 픽처의 pic_width_in_luma_samples 및 pic_height_in_luma_samples의 값과 같을 것이며, RprConstraintsActive[ slice_collocated_from_l0_flag ? 0 : 1 ][ slice_collocated_ref_idx ]는 0과 같을 것이라는 것이 비트스트림 적합성의 요건이다.
pps_mixed_nalu_types_in_pic_flag의 값이 1과 같을 때, PPS를 참조하는 각각의 픽처는 하나보다 많은 NAL 유닛을 갖고 그러한 NAL 유닛은 동일한 nal_unit_type을 갖지 않는다. 다른 한편으로, 현재 픽처 헤더 시그널링에서, ph_gdr_or_irap_pic_flag 및 ph_gdr_pic_flag의 값은 연관된 PPS의 플래그 pps_mixed_nalu_types_in_pic_flag의 값이 1과 같은 경우에도 1로서 시그널링되는 것이 허용된다. 하나의 IRAP 픽처 또는 하나의 GDR 픽처의 NAL 유닛은 동일한 nal_unit_type을 가져야 하므로, 이러한 시그널링 시나리오는 허용되지 않아야 한다.
일례로, PPS의 pps_mixed_nalu_types_in_pic_flag의 값에 대한 픽처 헤더에서 플래그 ph_gdr_or_irap_pic_flag의 존재를 조절하는 것이 제안된다. 구체적으로, ph_gdr_or_irap_pic_flag는 pps_mixed_nalu_types_in_pic_flag의 값이 0과 같을 때만 시그널링된다. 그렇지 않으면, 플래그 pps_mixed_nalu_types_in_pic_flag가 1과 같을 때, 플래그 ph_gdr_or_irap_pic_flag가 시그널링되지 않고 0인 것으로 유추된다. 제안된 수정이 적용된 이후의 표 12가 예시된다.
일례로, 플래그 pps_mixed_nalu_types_in_pic_flag가 1과 같을 때, 시그널링된 플래그 ph_gdr_or_irap_pic_flag의 대응 값이 1과 같을 것을 요구하도록 하나의 비트 스트림 적합성 제약이 제안된다. 구체적으로 제안된 비트스트림 적합성 제약은 아래와 같이 명시될 수 있다.
1과 같은 ph_gdr_or_irap_pic_flag는 현재 픽처가 GDR 또는 IRAP 픽처임을 명시한다. 0과 같은 ph_gdr_or_irap_pic_flag는 현재 픽처가 GDR 픽처가 아니며 IRAP 픽처일 수도 있고 또는 아닐 수도 있음을 명시한다. pps_mixed_nalu_types_in_pic_flag의 값이 1과 같을 때, ph_gdr_or_irap_pic_flag는 0과 같을 것이다.
일례로, PPS 레벨에서 픽처 레벨, 슬라이스 레벨 또는 다른 코딩 레벨로 pps_mixed_nalu_types_in_pic_flag의 시그널링을 이동시키는 것이 제안된다. 예컨대, 플래그가 픽처 헤더로 이동된다고 가정하면, 플래그는 이름이 ph_mixed_nalu_type_in_pic_flag로 바뀔 수 있다. 추가로, 플래그를 사용하여 ph_gdr_or_irap_pic_flag의 시그널링을 조절하는 것이 제안된다. 구체적으로, ph_gdr_or_rap_pic_flag는 플래그 ph_mixed_nalu_type_in_pic_flag가 0과 같을 때만 시그널링된다. 그렇지 않으면, 플래그 ph_mixed_nalu_type_in_pic_flag가 1일 때, 플래그 ph_gdr_or_rap_pic_flags는 시그널링되지 않고 0인 것으로 유추된다. 다른 예에서, ph_mixed_nalu_type_in_pic_flag의 값이 1과 같을 때 ph_gdr_or_irap_pic_flag의 값이 0과 같아야 한다는 비트스트림 적합성 제약을 추가하는 것이 제안된다. 또 다른 예에서, ph_gdr_or_irap_pic_flag를 사용하여 ph_mixed_nalu_type_in_pic_flag의 존재를 조절하는 것이 제안된다. 구체적으로, 플래그 ph_mixed_nalu_type_in_pic_flag는 ph_gdr_or_rap_pic_flag의 값이 0과 같을 때만 시그널링된다. 그렇지 않으면, ph_gdr_or_rap_pic_flag의 값이 1과 같을 때, 플래그 ph_mixed_nalu_type_in_pic_flag는 시그널링되지 않고 항상 0인 것으로 유추된다.
일례로, pps_mixed_nalu_types_in_pic_flag 값을 IRAP 픽처도 GDR 픽처도 아닌 픽처에만 적용하는 것이 제안된다. 구체적으로, 이러한 방법에 의해, pps_mixed_nalu_types_in_pic_flag의 시맨틱이 다음과 같이 수정되어야 한다:
1과 같은 pps_mixed_nalu_types_in_pic_flag는, PPS를 참조하는 IRAP 픽처도 GDR 픽처도 아닌 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 갖고 VCL NAL 유닛이 동일한 nal_unit_type의 값을 갖지 않음을 명시한다. 0과 같은 pps_mixed_nalu_types_in_pic_flag는, PPS를 참조하는 IRAP 픽처도 GDR 픽처도 아닌 각각의 픽처가 하나 이상의 VCL NAL 유닛들을 갖고 PPS를 참조하는 각각의 픽처의 VCL NAL 유닛들이 동일한 nal_unit_type 값을 가짐을 명시한다.
다른 한편으로는, 현재 VVC 규격에서, 하나의 GDR 픽처 내 모든 NAL 유닛이 GDR_NUT와 같은 동일한 nal_unit_type을 가져야 하는 것이 요구된다. pps_mixed_nal_types_in_pic_flag의 해당 값이 0과 같도록 다음 비트스트림 적합성 제약이 GDR 픽처의 정의에 적용된다.
점진적 디코딩 리프레시(GDR) 픽처: 각각의 VCL NAL 유닛이 GDR_NUT와 같은 nal_unit_type을 갖는 픽처. GDR 픽처에 대한 pps_mixed_nalu_types_in_pic_flag의 값은 0과 같다. 픽처의 임의의 슬라이스가 GDR_NUT와 같은 nal_unit_type을 갖는 경우, 픽처의 다른 모든 슬라이스는 동일한 nal_unit_type 값을 가지며, 픽처는 픽처의 첫 번째 슬라이스를 수신한 후 GDR 픽처인 것으로 알려져 있다.
다른 실시예에서, 현재 픽처가 GDR 픽처인지 여부를 지시하는 데 신택스 엘리먼트 ph_gdr_or_irap_pic_flag 및 ph_gdr_pic_flag만을 사용하면서 NAL 유닛 헤더로부터 GDR NAL 유닛 타입을 제거하는 것이 제안된다.
pps_mixed_nalu_types_in_pic_flag의 제약이 IRAP 픽처와 GDR 픽처 모두에 적용되는 위의 방법과 달리, 이하에서는 제약이 IRAP 픽처에만 적용되고 GDR 픽처에는 적용되지 않는 세 가지 방법이 제안된다.
일례로, PPS의 pps_mixed_nalu_types_in_pic_flag의 값에 대한 픽처 헤더에서 플래그 ph_gdr_pic_flag의 존재를 조절하는 것이 제안된다. 구체적으로, 플래그 ph_gdr_pic_flag는 pps_mixed_nalu_types_in_pic_flag의 값이 0과 같을 때만 시그널링된다. 그렇지 않으면, 플래그 pps_mixed_nalu_types_in_pic_flag가 1과 같을 때, 플래그 ph_gdr_pic_flag가 시그널링되지 않고 0인 것으로 유추되는데, 즉 현재 픽처는 하나의 GDR 픽처일 수 없다. 해당 픽처 헤더 표(표 13)는 제안된 시그널링 조건이 적용된 후 다음과 같이 수정된다.
1과 같은 ph_gdr_pic_flag는 PH와 연관된 픽처가 GDR 픽처임을 명시한다. 0과 같은 ph_gdr_pic_flag는 PH와 연관된 픽처가 GDR 픽처가 아님을 명시한다. ph_gdr_pic_flag의 값은 존재하지 않는 경우, pps_mixed_nalu_types_in_pic_flag가 0일 때는 0과 같다고 유추되고 pps_mixed_nalu_types_in_pic_flag가 1일 때는 ph_gdr_or_irap_pic_flag의 값과 같은 것으로 유추된다. sps_gdr_enabled_flag가 0과 같으면, ph_gdr_pic_flag의 값은 0과 같을 것이다.
일례로, 다음과 같이 명시된 대로, ph_gdr_or_irap_pic_flag가 1이고 pps_mixed_nalu_types_in_pic_flag가 1일 때 ph_gdr_pic_flag가 1과 같아야 한다는 하나의 비트스트림 적합성 제약을 도입하는 것이 제안된다:
1과 같은 ph_gdr_pic_flag는 PH와 연관된 픽처가 GDR 픽처임을 명시한다. 0과 같은 ph_gdr_pic_flag는 PH와 연관된 픽처가 GDR 픽처가 아님을 명시한다. ph_gdr_pic_flag의 값은 존재하지 않는 경우 0과 같다고 유추된다. sps_gdr_enabled_flag가 0과 같으면, ph_gdr_pic_flag의 값은 0과 같을 것이다. ph_gdr_or_irap_pic_flag가 1과 같고 pps_mixed_nalu_types_in_pic_flag가 1과 같을 때, ph_gdr_pic_flag의 값은 1과 같아야 한다. ph_gdr_or_irap_pic_flag가 1과 같고 ph_gdr_pic_flag가 0과 같을 때, PH와 연관된 픽처는 IRAP 픽처이다.
일례로, 플래그 pps_mixed_nalu_types_in_pic_flag를 비-IRAP 픽처에만 적용하는 것이 제안된다. 구체적으로, 이 방법에서, pps_mixed_nalu_types_in_pic_flag의 시맨틱이 다음과 같이 수정되어야 한다:
1과 같은 pps_mixed_nalu_types_in_pic_flag는, PPS를 참조하는 각각의 비-IRAP 픽처가 하나보다 많은 VCL NAL 유닛을 갖고 VCL NAL 유닛이 동일한 nal_unit_type의 값을 갖지 않음을 명시한다. 0과 같은 pps_mixed_nalu_types_in_pic_flag는, PPS를 각각의 비-IRAP 픽처가 하나 이상의 VCL NAL 유닛들을 갖고 PPS를 참조하는 각각의 픽처의 VCL NAL 유닛들이 동일한 nal_unit_type 값을 가짐을 명시한다.
상기 방법은 주문형 집적 회로(ASIC: application specific integrated circuit), 디지털 신호 프로세서(DSP: digital signal processor), 디지털 신호 처리 디바이스(DSPD: digital signal processing device), 프로그래밍 가능 로직 디바이스(PLD: programmable logic device), 필드 프로그래밍 가능 게이트 어레이(FPGA: field programmable gate array), 제어기, 마이크로컨트롤러, 마이크로프로세서 또는 다른 전자 컴포넌트를 포함하는 하나 이상의 회로부를 포함하는 장치를 사용하여 구현될 수 있다. 이 장치는 위에서 설명된 방법을 수행하기 위해 다른 하드웨어 또는 소프트웨어 컴포넌트와 조합하여 회로부를 사용할 수 있다. 위에 개시된 각각의 모듈, 하위 모듈, 유닛 또는 서브-유닛은 적어도 부분적으로는 하나 이상의 회로부를 사용하여 구현될 수 있다.
도 6은 본 개시내용의 일부 구현에 따른 비디오 코딩을 위한 예시적인 장치를 예시하는 블록도이다. 장치(600)는 단말, 이를테면 휴대 전화, 태블릿 컴퓨터, 디지털 브로드캐스트 단말, 태블릿 디바이스 또는 개인용 디지털 보조기기일 수 있다.
도 6에 도시된 바와 같이, 장치(600)는 다음의 컴포넌트: 처리 컴포넌트(602), 메모리(604), 전력 공급 컴포넌트(606), 멀티미디어 컴포넌트(608), 오디오 컴포넌트(610), 입력/출력(I/O: input/output) 인터페이스(612), 센서 컴포넌트(614) 및 통신 컴포넌트(616) 중 하나 이상을 포함할 수 있다.
처리 컴포넌트(602)는 대개 장치(600)의 전체 동작, 이를테면 디스플레이, 전화 통화, 데이터 통신, 카메라 동작 및 레코딩 동작과 관련된 동작을 제어한다. 처리 컴포넌트(602)는 위의 방법의 단계의 전부 또는 일부를 완료하기 위한 명령을 실행하기 위한 하나 이상의 프로세서(620)를 포함할 수 있다. 추가로, 처리 컴포넌트(602)는 처리 컴포넌트(602)와 다른 컴포넌트 간의 상호 작용을 가능하게 할 하나 이상의 모듈을 포함할 수 있다. 예를 들어, 처리 컴포넌트(602)는 멀티미디어 컴포넌트(608)와 처리 컴포넌트(602) 간의 상호 작용을 가능하게 할 멀티미디어 모듈을 포함할 수 있다.
메모리(604)는 장치(600)의 동작을 지원하기 위해 상이한 타입의 데이터를 저장하도록 구성된다. 그러한 데이터의 예는 장치(600) 상에서 동작하는 임의의 애플리케이션 또는 방법에 대한 명령, 연락처 데이터, 전화번호부 데이터, 메시지, 사진, 비디오 등을 포함한다. 메모리(604)는 임의의 타입의 휘발성 또는 비휘발성 저장 디바이스 또는 이들의 조합에 의해 구현될 수 있으며, 메모리(604)는 정적 랜덤 액세스 메모리(SRAM: Static Random Access Memory), 전기적으로 소거 가능한 프로그래밍 가능 판독 전용 메모리(EEPROM: Electrically Erasable Programmable Read-Only Memory), 소거 가능한 프로그래밍 가능 판독 전용 메모리(EPROM: Erasable Programmable Read-Only Memory), 프로그래밍 가능 판독 전용 메모리(PROM: Programmable Read-Only Memory), 판독 전용 메모리(ROM: Read-Only Memory), 자기 메모리, 플래시 메모리, 자기 디스크 또는 광 디스크일 수 있다.
전력 공급 컴포넌트(606)는 장치(600)의 상이한 컴포넌트에 전력을 공급한다. 전력 공급 컴포넌트(606)는 전력 공급 관리 시스템, 하나 이상의 전력 공급부, 및 장치(600)를 위한 전력의 발생, 관리 및 분배와 연관된 임의의 다른 컴포넌트를 포함할 수 있다.
멀티미디어 컴포넌트(608)는 장치(600)와 사용자 간의 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 예에서, 스크린은 액정 디스플레이(LCD: Liquid Crystal Display) 및 터치 패널(TP: Touch Panel)을 포함할 수 있다. 스크린이 터치 패널을 포함한다면, 스크린은 사용자로부터의 입력 신호를 수신하는 터치 스크린으로서 구현될 수 있다. 터치 패널은 터치 패널 상에서 터치, 슬라이드(slide) 및 제스처(gesture)를 감지하기 위한 하나 이상의 터치 센서를 포함할 수 있다. 터치 센서는 터치 또는 슬라이딩 동작의 경계를 감지할 뿐만 아니라, 터치 또는 슬라이딩 동작과 관련된 지속기간 및 압력을 검출할 수 있다. 일부 예에서, 멀티미디어 컴포넌트(608)는 전방 카메라 및/또는 후방 카메라를 포함할 수 있다. 장치(600)가 촬영 모드 또는 비디오 모드와 같은 동작 모드에 있을 때, 전방 카메라 및/또는 후방 카메라는 외부 멀티미디어 데이터를 수신할 수 있다.
오디오 컴포넌트(610)는 오디오 신호를 출력 및/또는 입력하도록 구성된다. 예를 들어, 오디오 컴포넌트(610)는 마이크로폰(MIC: microphone)을 포함한다. 장치(600)가 동작 모드, 이를테면 통화 모드, 레코딩 모드 및 음성 인식 모드에 있을 때, 마이크로폰은 외부 오디오 신호를 수신하도록 구성된다. 수신된 오디오 신호는 메모리(604)에 추가로 저장되거나 통신 컴포넌트(616)를 통해 송신될 수 있다. 일부 예에서, 오디오 컴포넌트(610)는 오디오 신호를 출력하기 위한 스피커를 추가로 포함한다.
I/O 인터페이스(612)는 처리 컴포넌트(602)와 주변 인터페이스 모듈 사이의 인터페이스를 제공한다. 위의 주변 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 볼륨 버튼, 시작 버튼 및 잠금 버튼을 포함할 수 있지만 그에 제한되는 것은 아니다.
센서 컴포넌트(614)는 장치(600)에 대한 다양한 양상의 상태 평가를 제공하기 위한 하나 이상의 센서를 포함한다. 예를 들어, 센서 컴포넌트(614)는 장치(600)의 온/오프 상태 및 컴포넌트의 상대적인 위치를 검출할 수 있다. 예를 들어, 컴포넌트는 장치(600)의 디스플레이 및 키패드이다. 센서 컴포넌트(614)는 또한, 장치(600) 또는 장치(600)의 컴포넌트의 포지션 변화, 장치(600) 상의 사용자의 접촉 유무, 장치(600)의 배향 또는 가속/감속, 및 장치(600)의 온도 변화를 검출할 수 있다. 센서 컴포넌트(614)는 어떠한 물리적 터치도 없이 인근 객체의 존재를 검출하도록 구성된 근접 센서를 포함할 수 있다. 센서 컴포넌트(614)는 이미징 애플리케이션에서 사용되는 CMOS 또는 CCD 이미지 센서와 같은 광 센서를 더 포함할 수 있다. 일부 예에서, 센서 컴포넌트(614)는 가속도 센서, 자이로스코프 센서, 자기 센서, 압력 센서 또는 온도 센서를 더 포함할 수 있다.
통신 컴포넌트(616)는 장치(600)와 다른 디바이스 간의 유선 또는 무선 통신을 가능하게 하도록 구성된다. 장치(600)는 WiFi, 4G 또는 이들의 조합과 같은 통신 표준을 기반으로 무선 네트워크에 액세스할 수 있다. 일례로, 통신 컴포넌트(616)는 브로드캐스트 채널을 통해 외부 브로드캐스트 관리 시스템으로부터 브로드캐스트 신호 또는 브로드캐스트 관련 정보를 수신한다. 일례로, 통신 컴포넌트(616)는 단거리 통신을 촉진하기 위한 근접장 통신(NFC: Near Field Communication) 모듈을 더 포함할 수 있다. 예를 들어, NFC 모듈은 무선 주파수 식별(RFID: Radio Frequency Identification) 기술, 적외선 데이터 협회(IrDA: infrared data association) 기술, 초광대역(UWB: Ultra-Wide Band) 기술, 블루투스(BT: Bluetooth) 기술 및 다른 기술을 기반으로 구현될 수 있다.
일례로, 장치(600)는 주문형 집적 회로(ASIC), 디지털 신호 프로세서(DSP), 디지털 신호 처리 디바이스(DSPD), 프로그래밍 가능 로직 디바이스(PLD), 필드 프로그래밍 가능 게이트 어레이(FPGA), 제어기, 마이크로컨트롤러, 마이크로프로세서 또는 다른 전자 엘리먼트 중 하나 이상에 의해 위의 방법을 수행하도록 구현될 수 있다.
비-일시적 컴퓨터 판독 가능 저장 매체는 예를 들어, 하드 디스크 드라이브(HDD: Hard Disk Drive), 솔리드 스테이트 드라이브(SSD: Solid-State Drive), 플래시 메모리, 하이브리드 드라이브 또는 솔리드 스테이트 하이브리드 드라이브(SSHD: Solid-State Hybrid Drive), 판독 전용 메모리(ROM: Read-Only Memory), 콤팩트 디스크 판독 전용 메모리(CD-ROM: Compact Disc Read-Only Memory), 자기 테이프, 플로피 디스크 등일 수 있다.
도 7은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
단계(702)에서, 프로세서(620)는 PPS에서 PPS를 참조하거나, PPS에 대응하거나, PPS에 연관된 픽처가 하나 이상의 NAL 유닛을 포함하는지 여부 및 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하는 제1 신택스 엘리먼트를 수신한다.
단계(704)에서, 프로세서(620)는 PH에서 PH를 참조하거나, PH에 대응하는, PH와 연관된 픽처가 IRAP 픽처인지 또는 GDR 픽처인지를 명시하는 제2 신택스 엘리먼트를 수신한다.
단계(706)에서, 프로세서(620)는 제2 신택스 엘리먼트의 값에 기초하여 제1 신택스 엘리먼트의 값을 결정한다.
일부 예에서, 프로세서(620)는 디코더 상에 구현된다.
일부 예에서, 1과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 포함하고 하나보다 많은 VCL NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나 이상의 VCL NAL 유닛을 포함하고 하나 이상의 VCL NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시한다.
일부 예에서, 1과 같은 제2 신택스 엘리먼트는 PH를 참조하거나, PH에 대응하거나, PH와 연관된 픽처가 IRAP 픽처 또는 GDR 픽처임을 명시하고, 0과 같은 제2 신택스 엘리먼트는 PH를 참조하거나, PH에 대응하거나, PH와 연관된 픽처가 IRAP 픽처도 GDR 픽처도 아님을 명시한다.
일부 예에서, 프로세서(620)는 픽처가 IRAP 픽처 또는 GDR 픽처인지를 결정하는 것에 대한 응답으로 제1 신택스 엘리먼트의 값이 0이 될 것을 요구하도록 제1 신택스 엘리먼트에 제약을 적용함으로써 제2 신택스 엘리먼트의 값에 기초하여 제1 신택스 엘리먼트의 값을 제한한다.
도 8은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다.
단계(802)에서, 프로세서(620)는 픽처가 하나 이상의 NAL 유닛을 포함하는지 여부 및 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하는 제1 신택스 엘리먼트를 수신한다.
단계(804)에서, 프로세서(620)는 제1 신택스 엘리먼트에 기초하여 픽처와 연관된 PH에서 제2 신택스 엘리먼트를 결정한다.
일부 예에서, 프로세서(620)는 디코더 상에 구현된다.
일부 예에서, 제2 신택스 엘리먼트는 픽처가 GDR 픽처인지 또는 IRAP 픽처인지를 명시한다.
일부 예에서, 제1 신택스 엘리먼트는 픽처와 연관된 PPS에서 시그널링된다.
일부 예에서, 제1 신택스 엘리먼트는 위에서 논의된 바와 같이 pps_mixed_nalu_types_in_pic_flag일 수 있다.
일부 예에서, 프로세서(620)는 제1 신택스 엘리먼트가 0과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트가 PH에서 시그널링된다고 결정하고; 제1 신택스 엘리먼트가 1과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트가 PH에서 시그널링되지 않는다고 결정하고 제2 신택스 엘리먼트를 0인 것으로 유추함으로써 제1 신택스 엘리먼트에 기초하여 픽처와 연관된 PH의 제2 신택스 엘리먼트를 제한하고, 1과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나보다 많은 NAL 유닛을 포함하고 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나 이상의 NAL 유닛을 포함하고 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시한다. 또한, 1과 같은 제2 신택스 엘리먼트는 픽처가 GDR 픽처 또는 IRAP 픽처임을 명시하고, 0과 같은 제2 신택스 엘리먼트는 픽처가 IRAP 픽처도 GDR 픽처도 아님을 명시한다.
일부 예에서, 프로세서(620)는 제1 신택스 엘리먼트와 제2 신택스 엘리먼트 모두를 수신하고 제1 신택스 엘리먼트가 1과 같다는 결정에 대한 응답으로 수신된 제2 신택스 엘리먼트가 0이 될 것을 요구하는 하나의 제약을 적용함으로써 제1 신택스 엘리먼트를 기초로 픽처와 연관된 PH의 제2 신택스 엘리먼트를 제한한다. 1과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나보다 많은 NAL 유닛을 포함하고 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제2 신택스 엘리먼트는 픽처가 IRAP 픽처도 GDR 픽처도 아님을 명시한다. 제1 신택스 엘리먼트는 위에서 논의된 바와 같이 pps_mixed_nalu_types_in_pic_flag일 수 있다.
일부 예에서, 제1 신택스 엘리먼트는 픽처와 연관된 PH에서 시그널링된다. 일부 예에서, 제1 신택스 엘리먼트는 위에서 논의된 바와 같이 ph_mixed_nalu_types_in_pic_flag일 수 있다.
일부 예에서, 프로세서(620)는 제1 신택스 엘리먼트가 0과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트가 PH에서 시그널링된다고 결정하고, 제1 신택스 엘리먼트가 1과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트가 PH에서 시그널링되지 않는다고 결정하고 제2 신택스 엘리먼트를 0인 것으로 유추함으로써 제1 신택스 엘리먼트에 기초하여 PH의 제2 신택스 엘리먼트를 제한한다. 1과 같은 제1 신택스 엘리먼트는 PH를 참조하거나, PH에 대응하거나, PPS와 연관된 각각의 픽처가 하나보다 많은 NAL 유닛을 포함하고 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나 이상의 NAL 유닛을 포함하고 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시한다. 1과 같은 제2 신택스 엘리먼트는 픽처가 GDR 픽처 또는 IRAP 픽처임을 명시하고, 0과 같은 제2 신택스 엘리먼트는 픽처가 IRAP 픽처도 GDR 픽처도 아님을 명시한다. 일부 예에서, 제2 신택스 엘리먼트는 위에서 논의된 바와 같이 ph_gdr_or_rap_pic_flag일 수 있다.
일부 예에서, 프로세서(620)는 제1 신택스 엘리먼트와 제2 신택스 엘리먼트 모두를 수신하고 제1 신택스 엘리먼트가 1과 같다는 결정에 대한 응답으로 수신된 제2 신택스 엘리먼트가 0이 될 것을 요구하는 하나의 제약을 적용함으로써 제1 신택스 엘리먼트를 기초로 PH의 제2 신택스 엘리먼트를 제한한다. 1과 같은 제1 신택스 엘리먼트는 PH를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나보다 많은 NAL 유닛을 포함하고 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제2 신택스 엘리먼트는 픽처가 GDR 픽처도 IRAP 픽처도 아님을 명시한다.
일부 예에서, 제2 신택스 엘리먼트는 픽처가 GDR 픽처인지 또는 PPS 픽처인지를 명시하며, 제1 신택스 엘리먼트는 픽처와 연관된 PPS에서 시그널링된다. 또한, 프로세서(620)는 제1 신택스 엘리먼트가 0과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트가 PH에서 시그널링된다고 결정하고; 제1 신택스 엘리먼트가 1과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트가 PH에서 시그널링되지 않는다고 결정하고 제2 신택스 엘리먼트의 값을 0인 것으로 유추함으로써 제1 신택스 엘리먼트에 기초하여 픽처와 연관된 PH의 제2 신택스 엘리먼트를 제한한다. 1과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나보다 많은 NAL 유닛을 포함하고 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제1 신택스 엘리먼트는 PPS를 참조하거나, PPS에 대응하거나, PPS와 연관된 각각의 픽처가 하나 이상의 NAL 유닛을 포함하고 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시한다. 0과 같은 제2 신택스 엘리먼트는 PH와 연관된 픽처가 IRAP 픽처도 GDR 픽처도 아님을 명시한다.
일부 예에서, 프로세서(620)는 제2 신택스 엘리먼트가 PH에서 시그널링되지 않는다고 결정하는 것에 대한 응답으로 제1 신택스 엘리먼트의 값을 추가로 결정하고, 제1 신택스 엘리먼트의 값이 0인 것으로 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트의 값을 0인 것으로 유추하고, 제1 신택스 엘리먼트의 값이 1이라고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트의 값을 PH에서 시그널링된 제3 신택스 엘리먼트의 값인 것으로 유추한다. 제3 신택스 엘리먼트는 픽처가 GDR 픽처인지 또는 IRAP 픽처인지를 명시한다.
일부 예에서, 프로세서(620)는 PPS에서 시그널링된 인에이블 플래그의 값에 따라 PH에서 제2 신택스 엘리먼트의 값을 추가로 결정한다. 인에이블 플래그는 픽처가 GDR 픽처가 되도록 인에이블되는지 여부를 명시하는 것이다. 더욱이, 프로세서(620)는 인에이블 플래그의 값이 0과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트의 값을 0이라고 결정한다. 일부 예에서, 인에이블 플래그는 위에서 논의된 바와 같이 sps_gdr_enabled_flag일 수 있다.
일부 예에서, 제2 신택스 엘리먼트는 픽처가 GDR 픽처인지 또는 PPS 픽처인지를 명시하며, 제1 신택스 엘리먼트는 픽처와 연관된 PPS에서 시그널링된다. 또한, 프로세서(620)는 픽처와 연관된 PH에서 시그널링되는 제1 신택스 엘리먼트 및 제3 신택스 엘리먼트에 기초하여 PH에서 시그널링되는 제2 신택스 엘리먼트를 제한함으로써 제1 신택스 엘리먼트에 기초하여 픽처와 연관된 PH에서 시그널링되는 제2 신택스 엘리먼트를 제한한다. 제3 신택스 엘리먼트는 픽처가 GDR 픽처인지 또는 IRAP 픽처인지를 명시한다. 일부 예에서, 제3 신택스 엘리먼트는 위에서 논의된 바와 같이 ph_gdr_or_irap_pic_flag일 수 있다.
일부 예에서, 프로세서(620)는 제3 신택스 엘리먼트가 1과 같고 제1 신택스 엘리먼트가 0과 같다고 결정하는 것에 대한 응답으로 제2 신택스 엘리먼트를 1이라고 추가로 결정한다. 0과 같은 제1 신택스 엘리먼트는, PPS를 참조하거나, PPS에 대응하거나, PPS에 연관된 각각의 픽처가 하나 이상의 NAL 유닛을 포함하고 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시한다. 1과 같은 제2 신택스 엘리먼트는 PH와 연관된 픽처가 GDR 픽처임을 명시하고, 1과 같은 제3 신택스 엘리먼트는 픽처가 GDR 픽처 또는 IRAP 픽처임을 명시한다.
도 9는 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다. 단계(902)에서, 프로세서(620)는 신택스 엘리먼트를 수신한다. 신택스 엘리먼트는 위에서 논의된 바와 같이 픽처와 연관된 PPS에서 시그널링되는 pps_mixed_nalu_types_in_pic_flag일 수 있다. 단계(904)에서, 프로세서(620)는 신택스 엘리먼트의 값에 기초하여 디코딩 프로세스를 수행한다.
일부 예에서, GDR 픽처에 대한 신택스 엘리먼트의 값은 0과 같으며, 픽처에 대한 신택스 엘리먼트가 0과 같고 픽처의 임의의 슬라이스가 GDR_NUT와 동일한 nal_unit_type을 가질 때, 픽처의 다른 모든 슬라이스는 nal_unit_type과 동일한 값을 갖고, 픽처는 픽처의 첫 번째 슬라이스를 수신한 이후의 GDR 픽처인 것으로 알려져 있다.
일부 예에서, 프로세서(620)는 픽처의 다른 모든 슬라이스가 동일한 NAL 유닛 타입을 포함하고 픽처는 신택스 엘리먼트의 값이 0과 같고 픽처의 슬라이스가 GDR_NUT와 같은 NAL 유닛 타입을 포함한다고 결정하는 것에 대한 응답으로 픽처의 첫 번째 슬라이스를 수신한 이후의 GDR 픽처라고 결정할 수 있다.
일부 예에서, 프로세서(620)는 디코더 상에 구현된다.
도 10은 본 개시내용의 일부 구현에 따른 예시적인 비디오 코딩 프로세스를 예시하는 흐름도이다. 단계(1002)에서, 프로세서(620)는 PPS에서, PPS에 대응하는 픽처가 하나 이상의 NAL 유닛을 포함하는지 여부 및 하나 이상의 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하는 제1 신택스 엘리먼트를 수신한다.
단계(1004)에서, 프로세서(620)는 PH에서 PH에 대응하는 픽처가 IRAP 픽처인지 또는 GDR 픽처인지를 명시하는 제2 신택스 엘리먼트를 수신한다.
단계(1006)에서, 프로세서(620)는 제1 신택스 엘리먼트의 값에 기초하여 제2 신택스 엘리먼트의 값을 결정한다.
일부 예에서, 프로세서(620)는 디코더 상에 구현될 수 있다.
일부 예에서, 1과 같은 제1 신택스 엘리먼트는 PPS에 대응하는 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 포함하고 하나보다 많은 VCL NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 0과 같은 제1 신택스 엘리먼트는 PPS에 대응하는 각각의 픽처가 하나 이상의 VCL NAL 유닛을 포함하고 하나 이상의 VCL NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시한다.
일부 예에서, 1과 같은 제2 신택스 엘리먼트는 PH에 대응하는 픽처가 IRAP 픽처 또는 GDR 픽처임을 명시하고, 0과 같은 제2 신택스 엘리먼트는 PH에 대응하는 픽처가 IRAP 픽처도 GDR 픽처도 아님을 명시한다.
일부 예에서, 프로세서(620)는 픽처의 다른 슬라이스의 NAL 타입이 슬라이스의 NAL 타입과 동일할 것을 요구하도록 다른 슬라이스의 NAL 타입에 대해 제1 제약을 그리고 제2 신택스 엘리먼트의 값이 1이 될 것을 요구하도록 제2 신택스 엘리먼트에 대해 제2 제약을 적용할 수 있다.
일부 예에서, 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체가 제공된다. 비-일시적 컴퓨터 판독 가능 저장 매체는 하나 이상의 컴퓨터 프로세서(620)에 의해 실행될 때 하나 이상의 컴퓨터 프로세서(620)로 하여금 도 7에 예시된 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장한다.
일부 예에서, 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체가 제공된다. 비-일시적 컴퓨터 판독 가능 저장 매체는 하나 이상의 컴퓨터 프로세서(620)에 의해 실행될 때 하나 이상의 컴퓨터 프로세서(620)로 하여금 도 8에 예시된 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장한다.
일부 예에서, 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체가 제공된다. 비-일시적 컴퓨터 판독 가능 저장 매체는 하나 이상의 컴퓨터 프로세서(620)에 의해 실행될 때 하나 이상의 컴퓨터 프로세서(620)로 하여금 도 9에 예시된 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장한다.
일부 예에서, 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체가 제공된다. 비-일시적 컴퓨터 판독 가능 저장 매체는 하나 이상의 컴퓨터 프로세서(620)에 의해 실행될 때 하나 이상의 컴퓨터 프로세서(620)로 하여금 도 10에 예시된 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장한다.
본 개시내용의 설명은 예시 목적으로 제시되었지만, 본 개시내용을 총망라하거나 본 개시내용으로 제한되는 것으로 의도되는 것은 아니다. 앞서 말한 설명 및 연관된 도면에 제시된 교시의 이점을 갖는 많은 수정, 변형 및 대안적인 구현이 당해 기술분야에서 통상의 지식을 가진 자에게 명백할 것이다.
이 예는 본 개시내용의 원리들을 설명하기 위해 당해 기술 분야에서 통상의 지식을 가진 다른 자가 다양한 구현에 대해 본 개시내용을 이해하고 기반이 되는 원리 및 다양한 구현을 고려되는 특정 용도에 맞춰진 다양한 수정으로 가장 잘 이용하는 것을 가능하게 하기 위해 선택되고 설명되었다. 따라서 본 개시내용의 범위는 개시된 구현의 특정 예에 제한되는 것은 아니며 수정 및 다른 구현은 본 개시내용의 범위 내에 포함되는 것으로 의도된다고 이해되어야 한다.
Claims (18)
- 비디오 코딩(video coding)을 위한 방법으로서,
인코더에 의해, 픽처 파라미터 세트(PPS: picture parameter set)에 제1 신택스(syntax) 엘리먼트를 설정하는 단계 - 상기 제1 신택스 엘리먼트는, 상기 PPS에 대응하는 픽처가 하나보다 많은 네트워크 추상화 계층(NAL: network abstraction layer) 유닛을 포함하는지 여부 및 상기 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시함 -;
상기 인코더에 의해, 픽처 헤더(PH: picture header)에 제2 신택스 엘리먼트를 설정하는 단계 - 상기 제2 신택스 엘리먼트는 상기 PH에 대응하는 픽처가 인트라 랜덤 액세스 포인트(IRAP: intra random access point) 픽처인지 또는 점진적 디코딩 리프레시(GDR: gradual decoding refresh) 픽처인지를 명시하고, 상기 제1 신택스 엘리먼트의 값은 상기 제2 신택스 엘리먼트의 값이 1인 것에 기초하여 설정됨 -; 및
상기 인코더에 의해, 상기 제1 신택스 엘리먼트와 상기 제2 신택스 엘리먼트를 갖는 비트스트림을 형성하는 단계
를 포함하는 비디오 코딩을 위한 방법. - 제1항에 있어서,
상기 제1 신택스 엘리먼트의 값이 1과 같은 것은 상기 PPS에 대응하는 각각의 픽처가 하나보다 많은 비디오 코딩 계층(VCL: video coding layer) NAL 유닛을 포함하고 상기 하나보다 많은 VCL NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 상기 제1 신택스 엘리먼트의 값이 0과 같은 것은 상기 PPS에 대응하는 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 포함하고 상기 하나보다 많은 VCL NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시하고; 그리고
상기 제2 신택스 엘리먼트의 값이 1과 같은 것은 상기 PH에 대응하는 픽처가 IRAP 픽처 또는 GDR 픽처임을 명시하고, 상기 제2 신택스 엘리먼트의 값이 0과 같은 것은 상기 PH에 대응하는 픽처가 GDR 픽처가 아님을 명시하는,
비디오 코딩을 위한 방법. - 제1항에 있어서,
상기 제1 신택스 엘리먼트의 값은 상기 제2 신택스 엘리먼트의 값이 상기 픽처가 IRAP 픽처 또는 GDR 픽처임을 명시하는 것에 기초하여 0으로 설정되는, 비디오 코딩을 위한 방법. - 제1항에 있어서,
상기 제1 신택스 엘리먼트의 값은 상기 픽처가 IRAP 픽처도 GDR 픽처도 아닌 것에 기초하여 1로 설정되는, 비디오 코딩을 위한 방법. - 비디오 코딩을 위한 방법으로서,
인코더에 의해, 픽처 파라미터 세트(PPS)에 제1 신택스 엘리먼트를 설정하는 단계 - 상기 제1 신택스 엘리먼트는, 상기 PPS에 대응하는 픽처가 하나보다 많은 네트워크 추상화 계층(NAL) 유닛을 포함하는지 여부 및 상기 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시함 -;
상기 인코더에 의해, 픽처 헤더(PH)에 제2 신택스 엘리먼트를 설정하는 단계 - 상기 제2 신택스 엘리먼트는 상기 PH에 대응하는 픽처가 인트라 랜덤 액세스 포인트(IRAP) 픽처인지 또는 점진적 디코딩 리프레시(GDR) 픽처인지를 명시하고, 상기 제2 신택스 엘리먼트의 값은 상기 제1 신택스 엘리먼트의 값에 기초하여 설정됨 -; 및
상기 인코더에 의해, 상기 제1 신택스 엘리먼트와 상기 제2 신택스 엘리먼트를 갖는 비트스트림을 형성하는 단계
를 포함하는 비디오 코딩을 위한 방법. - 제5항에 있어서,
상기 제1 신택스 엘리먼트의 값이 1과 같은 것은 상기 PPS에 대응하는 각각의 픽처가 하나보다 많은 비디오 코딩 계층(VCL) NAL 유닛을 포함하고 상기 하나보다 많은 VCL NAL 유닛이 동일한 NAL 유닛 타입을 갖지 않음을 명시하며, 상기 제1 신택스 엘리먼트의 값이 0과 같은 것은 상기 PPS에 대응하는 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 포함하고 상기 하나보다 많은 VCL NAL 유닛이 동일한 NAL 유닛 타입을 가짐을 명시하고; 그리고
상기 제2 신택스 엘리먼트의 값이 1과 같은 것은 상기 PH에 대응하는 픽처가 IRAP 픽처 또는 GDR 픽처임을 명시하고, 상기 제2 신택스 엘리먼트의 값이 0과 같은 것은 상기 PH에 대응하는 픽처가 GDR 픽처가 아님을 명시하는,
비디오 코딩을 위한 방법. - 제5항에 있어서,
상기 PPS에 대응하는 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 포함하고, 상기 하나보다 많은 VCL NAL 유닛이 상기 PPS의 제1 신택스 엘리먼트의 값에 기초하여 동일한 NAL 유닛 타입을 가지며, 상기 NAL 유닛 타입은 GDR NAL 유닛 타입 또는 특정 IRAP NAL 유닛 타입인 것에 따라, 상기 제2 신택스 엘리먼트의 값이 1로 설정되는, 비디오 코딩을 위한 방법. - 제5항에 있어서,
상기 PPS에 대응하는 각각의 픽처가 하나보다 많은 VCL NAL 유닛을 포함하고, 상기 하나보다 많은 VCL NAL 유닛이 상기 PPS의 제1 신택스 엘리먼트의 값에 기초하여 동일한 NAL 유닛 타입을 가지지 않으며, 상기 NAL 유닛 타입이 GDR NAL 유닛 타입도 IRAP NAL 유닛 타입도 아닌 것에 따라, 상기 제2 신택스 엘리먼트의 값이 0으로 설정되는, 비디오 코딩을 위한 방법. - 제7항에 있어서,
상기 특정 IRAP NAL 유닛 타입은 IDR_W_RADL 또는 CRA_NUT인, 비디오 코딩을 위한 방법. - 비디오 코딩을 위한 방법으로서,
인코더에 의해, 신택스 엘리먼트를 설정하는 단계; 및
상기 인코더에 의해, 상기 신택스 엘리먼트의 값에 기초하여 인코딩 프로세스를 수행하는 단계 - 상기 신택스 엘리먼트는 픽처의 네트워크 추상화 계층(NAL: network abstraction layer) 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시하고, 상기 픽처가 점진적 디코딩 리프레시(GDR) 픽처 또는 인트라 랜덤 액세스 포인트(IRAP) 픽처인 경우 상기 신택스 엘리먼트의 값은 0과 같음 -; 및
상기 인코더에 의해, 상기 신택스 엘리먼트를 갖는 비트스트림을 형성하는 단계
를 포함하는 비디오 코딩을 위한 방법. - 제10항에 있어서,
상기 신택스 엘리먼트는 상기 픽처와 연관된 픽처 파라미터 세트(PPS)에서 시그널링되는 신택스 엘리먼트 pps_mixed_nalu_types_in_pic_flag인,
비디오 코딩을 위한 방법. - 제10항에 있어서,
픽처에 대한 상기 신택스 엘리먼트의 값이 0과 같고 상기 픽처의 임의의 슬라이스가 GDR_NUT와 동일한 nal_unit_type을 가질 때, 상기 픽처의 다른 모든 슬라이스는 nal_unit_type과 동일한 값을 갖고, 상기 픽처는 상기 픽처의 첫 번째 슬라이스를 수신한 이후의 GDR 픽처인 것으로 알려져 있는,
비디오 코딩을 위한 방법. - 제10항에 있어서,
픽처에 대한 상기 신택스 엘리먼트의 값이 0과 같고 상기 픽처의 임의의 슬라이스가 특정 IRAP NAL 유닛 타입과 동일한 nal_unit_type을 가질 때, 상기 픽처의 다른 모든 슬라이스는 nal_unit_type과 동일한 값을 갖고, 상기 픽처는 상기 픽처의 첫 번째 슬라이스를 수신한 이후의 IRAP 픽처인 것으로 알려져 있는,
비디오 코딩을 위한 방법. - 제13항에 있어서,
상기 특정 IRAP NAL 유닛 타입은 IDR_W_RADL 또는 CRA_NUT인, 비디오 코딩을 위한 방법. - 비디오 코딩을 위한 장치로서,
하나 이상의 프로세서; 및
상기 하나 이상의 프로세서에 의해 실행 가능한 명령을 저장하도록 구성된 메모리를 포함하며;
상기 하나 이상의 프로세서는 상기 명령의 실행 시에 제1항 내지 제14항 중 어느 한 항의 방법을 수행하도록 구성되는,
비디오 코딩을 위한 장치. - 비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체로서,
하나 이상의 컴퓨터 프로세서에 의해 실행될 때, 비디오 비트스트림을 생성하고 상기 비-일시적 컴퓨터 판독 가능 저장 매체에 상기 생성된 비디오 비트스트림을 저장하기 위해 상기 하나 이상의 컴퓨터 프로세서로 하여금 제1항 내지 제14항 중 어느 한 항의 방법을 수행하게 하는 컴퓨터 실행 가능 명령을 저장하는,
비디오 코딩을 위한 비-일시적 컴퓨터 판독 가능 저장 매체. - 컴퓨터가 제1항 내지 제14항 중 어느 한 항의 방법의 단계를 구현하고 대응하는 비디오 비트스트림을 획득할 수 있게 하기 위해 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
- 비트스트림을 저장하기 위한 방법으로서,
상기 비트스트림은 비디오 코딩을 위한 방법에 의해 생성되고,
상기 비디오 코딩을 위한 방법은,
인코더에 의해, 픽처 파라미터 세트(PPS: picture parameter set)에 제1 신택스(syntax) 엘리먼트를 설정하는 단계 - 상기 제1 신택스 엘리먼트는, 상기 PPS에 대응하는 픽처가 하나보다 많은 네트워크 추상화 계층(NAL: network abstraction layer) 유닛을 포함하는지 여부 및 상기 하나보다 많은 NAL 유닛이 동일한 NAL 유닛 타입을 갖는지 여부를 명시함 -;
상기 인코더에 의해, 픽처 헤더(PH: picture header)에 제2 신택스 엘리먼트를 설정하는 단계 - 상기 제2 신택스 엘리먼트는 상기 PH에 대응하는 픽처가 인트라 랜덤 액세스 포인트(IRAP: intra random access point) 픽처인지 또는 점진적 디코딩 리프레시(GDR: gradual decoding refresh) 픽처인지를 명시하고, 상기 제1 신택스 엘리먼트의 값은 상기 제2 신택스 엘리먼트의 값이 1인 것에 기초하여 설정됨 -; 및
상기 인코더에 의해, 상기 제1 신택스 엘리먼트와 상기 제2 신택스 엘리먼트를 갖는 비트스트림을 형성하는 단계
를 포함하는 비트스트림을 저장하기 위한 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247025536A KR20240122915A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063027718P | 2020-05-20 | 2020-05-20 | |
US63/027,718 | 2020-05-20 | ||
PCT/US2021/033502 WO2021236988A1 (en) | 2020-05-20 | 2021-05-20 | Methods and apparatuses for signaling of syntax elements in video coding |
KR1020227044648A KR102687685B1 (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227044648A Division KR102687685B1 (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247025536A Division KR20240122915A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240042167A true KR20240042167A (ko) | 2024-04-01 |
Family
ID=78707695
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247009097A KR20240042167A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
KR1020227044648A KR102687685B1 (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
KR1020247025536A KR20240122915A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
KR1020247024274A KR20240113989A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227044648A KR102687685B1 (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
KR1020247025536A KR20240122915A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
KR1020247024274A KR20240113989A (ko) | 2020-05-20 | 2021-05-20 | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (1) | US12088850B2 (ko) |
EP (1) | EP4154541A4 (ko) |
JP (3) | JP7422901B2 (ko) |
KR (4) | KR20240042167A (ko) |
CN (2) | CN115516864A (ko) |
MX (1) | MX2022014528A (ko) |
WO (1) | WO2021236988A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9912966B2 (en) | 2014-01-03 | 2018-03-06 | Nokia Technologies Oy | Parameter set coding |
US9928297B2 (en) | 2015-02-11 | 2018-03-27 | Qualcomm Incorporated | Sample grouping signaling in file formats |
US20170111642A1 (en) * | 2015-10-14 | 2017-04-20 | Qualcomm Incorporated | Support of random access and switching of layers and sub-layers in multi-layer video files |
KR20210058947A (ko) * | 2018-09-20 | 2021-05-24 | 샤프 가부시키가이샤 | 비디오 코딩에서 파라미터들을 시그널링하기 위한 시스템들 및 방법들 |
WO2021236888A1 (en) * | 2020-05-20 | 2021-11-25 | Beijing Dajia Internet Information Technology Co., Ltd. | General constraint information and signaling of syntax elements in video coding |
-
2021
- 2021-05-20 KR KR1020247009097A patent/KR20240042167A/ko active Search and Examination
- 2021-05-20 KR KR1020227044648A patent/KR102687685B1/ko active IP Right Grant
- 2021-05-20 MX MX2022014528A patent/MX2022014528A/es unknown
- 2021-05-20 KR KR1020247025536A patent/KR20240122915A/ko active Application Filing
- 2021-05-20 WO PCT/US2021/033502 patent/WO2021236988A1/en unknown
- 2021-05-20 KR KR1020247024274A patent/KR20240113989A/ko active Application Filing
- 2021-05-20 JP JP2022570739A patent/JP7422901B2/ja active Active
- 2021-05-20 CN CN202180036777.1A patent/CN115516864A/zh active Pending
- 2021-05-20 CN CN202310868493.XA patent/CN117278750A/zh active Pending
- 2021-05-20 EP EP21809825.9A patent/EP4154541A4/en active Pending
-
2022
- 2022-11-18 US US17/990,654 patent/US12088850B2/en active Active
-
2023
- 2023-10-27 JP JP2023184964A patent/JP2024023200A/ja active Pending
-
2024
- 2024-03-01 JP JP2024031365A patent/JP2024059937A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4154541A1 (en) | 2023-03-29 |
US20230110988A1 (en) | 2023-04-13 |
MX2022014528A (es) | 2023-02-27 |
EP4154541A4 (en) | 2023-10-25 |
KR20240113989A (ko) | 2024-07-23 |
JP2023522482A (ja) | 2023-05-30 |
KR20240122915A (ko) | 2024-08-13 |
US12088850B2 (en) | 2024-09-10 |
KR20230004941A (ko) | 2023-01-06 |
KR102687685B1 (ko) | 2024-07-22 |
JP7422901B2 (ja) | 2024-01-26 |
JP2024059937A (ja) | 2024-05-01 |
CN115516864A (zh) | 2022-12-23 |
JP2024023200A (ja) | 2024-02-21 |
WO2021236988A1 (en) | 2021-11-25 |
CN117278750A (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230040224A1 (en) | Methods and apparatuses for signaling of syntax elements in video coding | |
US20230031699A1 (en) | Methods and apparatuses for signaling of syntax elements in video coding | |
KR102687685B1 (ko) | 비디오 코딩에서의 신택스 엘리먼트의 시그널링을 위한 방법 및 장치 | |
CN115668941A (zh) | 视频编解码中语法元素的信令 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |