KR20220158002A - 비디오 레코딩의 부호 데이터 은닉 - Google Patents

비디오 레코딩의 부호 데이터 은닉 Download PDF

Info

Publication number
KR20220158002A
KR20220158002A KR1020227036239A KR20227036239A KR20220158002A KR 20220158002 A KR20220158002 A KR 20220158002A KR 1020227036239 A KR1020227036239 A KR 1020227036239A KR 20227036239 A KR20227036239 A KR 20227036239A KR 20220158002 A KR20220158002 A KR 20220158002A
Authority
KR
South Korea
Prior art keywords
coding
video
video frame
residual
residual coding
Prior art date
Application number
KR1020227036239A
Other languages
English (en)
Inventor
모함메드 고램 사르워
얀 예
Original Assignee
알리바바 그룹 홀딩 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 알리바바 그룹 홀딩 리미티드 filed Critical 알리바바 그룹 홀딩 리미티드
Publication of KR20220158002A publication Critical patent/KR20220158002A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3053Block-companding PCM systems
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/60General implementation details not specific to a particular type of compression
    • H03M7/6011Encoder aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3059Digital compression and data reduction techniques where the original information is represented by a subset or similar information, e.g. lossy compression
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 개시는 비디오 데이터 코딩 및 디코딩을 위한 시스템 및 방법을 제공한다. 하나의 예시적인 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 제1 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 제1 코딩 모드에 따라 코딩되는지의 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.

Description

비디오 레코딩의 부호 데이터 은닉
관련 출원에 대한 상호 참조
본 개시는 2020년 3월 24일에 출원된 미국 가특허 출원 제62/994,239호를 우선권으로 주장한다. 상기 가출원은 전체가 인용에 의해 본원에 통합된다.
본 개시는 일반적으로 비디오 데이터 처리에 관한 것이며, 더 상세하게는 비디오 데이터의 잔차 코딩에 관한 것이다.
비디오는 시각적 정보를 캡처하는 정적 픽처(또는 "프레임")의 세트이다. 저장 메모리 및 송신 대역폭을 감소시키기 위해, 비디오는 저장 또는 송신 이전에 압축되고, 디스플레이 전에 압축 해제될 수 있다. 압축 프로세스는 보통 인코딩으로 지칭되고, 압축 해제 프로세스는 보통 디코딩으로 지칭된다. 가장 일반적으로 예측, 변환, 양자화, 엔트로피 코딩(entropy coding) 및 인-루프 필터링(in-loop filtering)에 기초하는, 표준화된 비디오 코딩 기술을 사용하는 다양한 비디오 코딩 포맷이 있다. 특정 비디오 코딩 포맷을 지정하는 고효율 비디오 코딩(High Efficiency Video Coding, 예컨대, HEVC/H.265) 표준, 다용도 비디오 코딩(Versatile Video Coding, 예컨대, VVC/H.266) 표준, 및 AVS 표준과 같은 비디오 코딩 표준은 표준화 기구에서 개발한다. 점점 더 많은 진보된 비디오 코딩 기술이 비디오 표준에 채택되고 있고, 새로운 비디오 코딩 표준의 코딩 효율성은 점점 더 높아지고 있다.
본 개시의 실시예는 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 블록 차동 펄스-코드 변조 코드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지를 결정하는 단계; 및 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 단계; 및 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 단계; 및 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 슬라이스 레벨에서 하나 이상의 루프 필터를 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 코딩을 위한 방법을 제공하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임에 대해 종속 양자화가 인에이블되는지를 결정하는 단계; 비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하는 것; 및 비디오 프레임이 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 것; 및 비디오 프레임이 블록 차동 펄스-코드 변조 코드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 것; 및 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지를 결정하는 것; 및 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 것; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 것; 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 것; 및 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 것; 및 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 슬라이스 레벨에서 하나 이상의 루프 필터를 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 것; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 비디오 데이터 처리를 수행하기 위한 시스템을 제공하고, 시스템은: 명령어의 세트를 저장하는 메모리; 및 프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금: 잔차 코딩을 위한 비디오 프레임을 수신하는 것; 비디오 프레임에 대해 종속 양자화가 인에이블되는지를 결정하는 것; 비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 것을 수행하게 하도록 구성된다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 블록 차동 펄스-코드 변조 코드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지를 결정하는 단계; 및 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 단계; 및 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 단계; 및 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 슬라이스 레벨에서 하나 이상의 루프 필터를 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 단계; 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
본 개시의 실시예는 추가로 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체를 제공하고, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은: 잔차 코딩을 위한 비디오 프레임을 수신하는 단계; 비디오 프레임에 대해 종속 양자화가 인에이블되는지를 결정하는 단계; 비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
본 개시의 실시예 및 다양한 양상은 다음의 상세한 설명 및 첨부 도면에 예시된다. 도면에 도시된 다양한 피처(feature)는 축척대로 도시된 것은 아니다.
도 1은 본 개시의 일부 실시예에 따른 예시적인 비디오 시퀀스의 구조를 도시한다.
도 2a는 본 개시의 일부 실시예에 따른 예시적인 인코딩 프로세스의 개략도를 도시한다.
도 2b는 본 개시의 일부 실시예에 따른 다른 예시적인 인코딩 프로세스의 개략도를 도시한다.
도 3a는 본 개시의 일부 실시예에 따른 예시적인 디코딩 프로세스의 개략도를 도시한다.
도 3b는 본 개시의 일부 실시예에 따른 다른 예시적인 디코딩 프로세스의 개략도를 도시한다.
도 4는 본 개시의 일부 실시예에 따른, 비디오를 인코딩하거나 또는 디코딩하기 위한 예시적인 장치의 블록도를 도시한다.
도 5는 본 개시의 일부 실시예에 따른, TS 및 BDPCM 블록에 대한 SDH를 허용하거나 허용하지 않는 지원 조건을 포함하는 예시적인 표를 도시한다.
도 6a는 본 개시의 일부 실시예에 따른, 조정 이전의 BDPCM 블록의 예시적인 인코더 조정을 도시한다.
도 6b는 본 개시의 일부 실시예에 따른, 조정 후의 BDPCM 블록의 예시적인 인코더 조정을 도시한다.
도 7은 본 개시의 일부 실시예에 따른, 부호 데이터 은닉을 디스에이블하는 조건을 포함하는 예시적인 표를 도시한다.
도 8은 본 개시의 일부 실시예에 따른, 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 9는 본 개시의 일부 실시예에 따른, 변환 스킵 모드 및 블록 차동 펄스 코드 변조 모드에 대한 부호 데이터 은닉을 허용하는 조건을 포함하는 예시적인 표를 도시한다.
도 10은 본 개시의 일부 실시예에 따른, 도 9에 도시된 조건에 대한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 11은 본 개시의 일부 실시예에 따른, 부호 데이터 은닉을 디스에이블하기 위한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 12는 본 개시의 일부 실시예에 따른, 슬라이스 레벨 부호 데이터 은닉 플래그의 제어를 위한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 13은 본 개시의 일부 실시예에 따른, 슬라이스 레벨 부호 데이터 은닉 플래그의 제어를 위한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 14는 본 개시의 일부 실시예에 따른, 슬라이스 레벨 부호 데이터 은닉 플래그에 대한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 15는 본 개시의 일부 실시예에 따른, 슬라이스 레벨 무손실 플래그에 대한 슬라이스 헤더 신택스의 일부를 포함하는 신택스를 도시한다.
도 16은 본 개시의 일부 실시예에 따른, 슬라이스 레벨 무손실 플래그에 대한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 17은 본 개시의 일부 실시예에 따른, 신택스 중복이 감소된 슬라이스 헤딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 18은 본 개시의 일부 실시예에 따른, 부호 데이터 은닉 및 종속 양자화의 조건에 대한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다.
도 19는 본 개시의 일부 실시예에 따른, 변환 스킵 모드 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 20은 본 개시의 일부 실시예에 따른, 블록 차동 펄스 코드 변조 모드 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 21은 본 개시의 일부 실시예에 따른, 변환 스킵 잔차 코딩 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 22는 본 개시의 일부 실시예에 따른, 픽처 레벨에서 변환 스킵 잔차 코딩 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 23은 본 개시의 일부 실시예에 따른, 픽처 레벨에서 부호 데이터 은닉, 슬라이스 레벨에서 부호 데이터 은닉, 및 슬라이스 레벨에서 변환 스킵 잔차 코딩을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 24는 본 개시의 일부 실시예에 따른, 무손실 코딩 모드 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 25는 본 개시의 일부 실시예에 따른, 픽처 레벨에서 부호 데이터 은닉 및 슬라이스 레벨에서 변환 스킵 잔차 코딩을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
도 26은 본 개시의 일부 실시예에 따른, 슬라이스 레벨에서 종속 양자화 및 변환 스킵 잔차 코딩을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다.
이제 예시적인 실시예에 대한 참조가 상세히 이루어질 것이며, 이의 예시는 첨부 도면에 예시된다. 다음 설명은 달리 표시되지 않는 한 상이한 도면에서 동일한 번호가 동일하거나 유사한 요소를 나타내는 첨부 도면을 참조한다. 예시적인 실시예의 다음 설명에서 제시된 구현은 본 발명과 일치하는 모든 구현을 나타내는 것은 아니다. 그 대신에, 이들은 첨부된 청구범위에서 인용된 본 발명에 관련된 양상과 일치하는 장치 및 방법의 예시일 뿐이다. 본 개시의 특정 양상은 아래에서 더 상세히 설명된다. 참조로 통합된 용어 및/또는 정의와 상충하는 경우, 본원에 제공된 용어 및 정의가 우선한다.
ITU-T VCEG(ITU-T Video Coding Expert Group) 및 ISO/IEC MPEG(ISO/IEC Moving Picture Expert Group)의 JVET(Joint Video Experts Team)는 현재 다용도 비디오 코딩(VVC/H.266) 표준을 개발하고 있다. VVC 표준은 그의 이전 버전인 고효율 비디오 코딩(HEVC/H.265) 표준의 압축 효율성을 두 배로 높이는 것을 목표로 한다. 다시 말해, VVC의 목표는 대역폭의 절반을 사용하여 HEVC/H.265와 동일한 주관적 품질을 달성하는 것이다.
대역폭의 절반을 사용하여 HEVC/H.265와 동일한 주관적 품질을 달성하기 위해, JVET(Joint Video Experts Team)는 공동 탐색 모델(joint exploration model; JEM) 참조 소프트웨어를 사용하여 HEVC를 넘는 기술을 개발하고 있다. 코딩 기술이 JEM에 통합됨에 따라, JEM은 HEVC보다 상당히 더 높은 코딩 성능을 달성하였다. VCEG 및 MPEG도 HEVC를 넘어선 차세대 비디오 압축 표준의 개발을 공식적으로 시작했다.
VVC 표준은 최근에 개발되었고, 더 나은 압축 성능을 제공하는 더 많은 코딩 기술을 계속 포함하고 있다. VVC는 HEVC, H.264/AVC, MPEG2, H.263 등과 같은 최신 비디오 압축 표준에서 사용된 것과 동일한 하이브리드 비디오 코딩 시스템에 기초한다.
비디오는 시각적 정보를 저장하기 위해 시간적인 시퀀스로 배열된 정적 픽처(또는 "프레임")의 세트이다. 비디오 캡처 디바이스(예컨대, 카메라)는 이 픽처를 시간적인 시퀀스로 캡처하고 저장하는데 사용될 수 있고, 비디오 재생 디바이스(예컨대, 디스플레이의 기능을 갖는 텔레비전, 컴퓨터, 스마트폰, 태블릿 컴퓨터, 비디오 플레이어 또는 임의의 최종-사용자 단말기)는 이러한 픽처를 시간적인 시퀀스로 디스플레이하기 위해 사용될 수 있다. 또한, 일부 애플리케이션에서, 비디오 캡처링 디바이스는 감시, 회의 또는 실시간 방송과 같이 캡처된 비디오를 비디오 재생 디바이스(예컨대, 모니터를 갖는 컴퓨터)에 실시간으로 송신할 수 있다.
이러한 애플리케이션에 의해 필요한 저장 공간 및 송신 대역폭을 감소시키기 위해, 비디오가 압축될 수 있다. 예컨대, 비디오는 저장 또는 송신 이전에 압축되고, 디스플레이 전에 압축 해제될 수 있다. 압축 및 압축 해제는 프로세서(예컨대, 일반 컴퓨터의 프로세서) 또는 특수 하드웨어에 의해 실행되는 소프트웨어에 의해 구현될 수 있다. 압축을 위한 모듈 또는 회로는 일반적으로 "인코더"로 지칭되고, 압축 해제를 위한 모듈 또는 회로는 일반적으로 "디코더"로 지칭된다. 인코더 및 디코더를 집합적으로 "코덱(codec)"으로 지칭될 수 있다. 인코더 및 디코더는 임의의 다양한 적합한 하드웨어, 소프트웨어, 또는 이들의 조합 중 임의의 것으로 구현될 수 있다. 예컨대, 인코더 및 디코더의 하드웨어 구현은 하나 이상의 마이크로프로세서, 디지털 신호 프로세서(DSP), 애플리케이션-특정 집적 회로(application-specific integrated circuits, ASIC), 필드 프로그래밍 가능 게이트 어레이(Field-Programmable Gate Array, FPGA), 이산 로직 또는 이의 임의의 조합과 같은 회로를 포함할 수 있다. 인코더 및 디코더의 소프트웨어 구현은 컴퓨터 판독 가능 매체에 고정된 프로그램 코드, 컴퓨터-실행가능 명령어, 펌웨어 또는 임의의 적합한 컴퓨터 구현 알고리즘 또는 프로세스를 포함할 수 있다. 비디오 압축 및 압축 해제는 MPEG-1, MPEG-2, MPEG-4, H.26x 시리즈 등과 같은 다양한 알고리즘 또는 표준에 의해 구현될 수 있다. 일부 애플리케이션에서, 코덱은 제1 코딩 표준으로부터 비디오를 압축 해제하고 제2 코딩 표준을 사용하여 압축 해제된 비디오를 재압축할 수 있으며, 이 경우 코덱은 "트랜스코더(transcoder)"로 지칭될 수 있다.
비디오 인코딩 프로세스는 픽처를 재구성하는 데 사용될 수 있는 유용한 정보를 식별하고 유지할 수 있다. 비디오 인코딩 프로세스에서 폐기된 정보가 완전히 재구성될 수 없는 경우, 인코딩 프로세스는 "손실이 있는 것(lossy)"으로 지칭될 수 있다. 그렇지 않으면, 이는 "무손실"로 지칭될 수 있다. 대부분의 인코딩 프로세스는 손실이 있고, 이는 필요한 저장 공간 및 송신 대역폭을 감소시키기 위한 트레이드오프이다.
많은 경우에서, 인코딩되는 픽처(현재 픽처로 지칭됨)의 유용한 정보는 참조 픽처(예컨대, 이전에 인코딩되거나 재구성된 픽처)에 대한 변경을 포함할 수 있다. 이러한 변경은 픽셀의 위치 변경, 광도 변경 또는 색상 변경을 포함할 수 있다. 객체를 나타내는 픽셀의 그룹의 위치 변경은 참조 픽처와 현재 픽처 사이의 객체의 움직임을 반영할 수 있다.
다른 픽처를 참조하지 않고 코딩된 픽처(즉, 자신이 그 자신의 참조 픽처인 것)는 "I-픽처"로 지칭된다. 픽처의 일부 또는 모든 블록(예컨대, 일반적으로 비디오 픽처의 일부를 나타내는 블록)이 하나의 참조 픽처를 통해 인트라 예측 또는 인터 예측을 사용하여 예측되면(예컨대, 단방향 예측), 픽처는 "P-픽처"로 지칭된다. 픽처 내의 적어도 하나의 블록이 2개의 참조 픽처를 통해 예측되면(예컨대, 양방향 예측), 픽처는 "B-픽처"로 지칭된다.
도 1은 본 개시의 일부 실시예에 따른 예시적인 비디오 시퀀스의 구조를 도시한다. 도 1에 도시된 바와 같이, 비디오 시퀀스(100)는 실시간 비디오 또는 캡처되고 보관되는 비디오일 수 있다. 비디오(100)는 실제 비디오, 컴퓨터-생성된 비디오(예컨대, 컴퓨터 게임 비디오) 또는 이들의 조합(예컨대, 증강-현실 효과를 갖는 실제 비디오)일 수 있다. 비디오 시퀀스(100)는 비디오 캡처 디바이스(예컨대, 카메라), 이전에 캡처된 비디오를 포함하는 비디오 아카이브(예컨대, 저장 디바이스에 저장된 비디오 파일), 또는 비디오 콘텐츠 제공자로부터 비디오를 수신하기 위한 비디오 피드 인터페이스(예컨대, 비디오 브로드캐스트 트랜시버)로부터 입력될 수 있다.
도 1에 도시된 바와 같이, 비디오 시퀀스(100)는 픽처(102, 104, 106 및 108)를 포함하는, 시간선을 따라 시간적으로 배열된 일련의 픽처를 포함할 수 있다. 픽처(102 내지 106)는 연속적이고, 픽처(106)와 픽처(108) 사이에 더 많은 픽처가 있다. 도 1에서, 픽처(102)는 I-픽처이고, 이의 참조 픽처는 픽처(102) 그 자체이다. 픽처(104)는 P-픽처이고, 이의 참조 픽처는 화살표로 나타난 바와 같이 픽처(102)이다. 픽처(106)는 B-픽처이고, 이의 참조 픽처는 화살표로 나타난 바와 같이 픽처(104 및 108)이다. 일부 실시예에서, 픽처(예컨대, 픽처(104))의 참조 픽처는 픽처 직전 또는 직후가 아닐 수 있다. 예컨대, 픽처(104)의 참조 픽처는 픽처(102)에 선행하는 픽처일 수 있다. 픽처(102 내지 106)의 참조 픽처는 단지 예시이며, 본 개시는 도 1에 도시된 예시로서 참조 픽처의 실시예를 제한하지 않는다는 것이 유의되어야 한다.
전형적으로, 비디오 코덱은 이러한 태스크(task)의 연산 복잡성에 기인하여 전체의 픽처를 동시에 인코딩하거나 또는 디코딩하지 않는다. 오히려, 이는 픽처를 기본 세그먼트로 분할할 수 있고, 픽처를 세그먼트별로 인코딩하거나 또는 디코딩할 수 있다. 이러한 기본 세그먼트는 본 개시에서 기본 처리 유닛(basic processing units; BPU)으로 지칭된다. 예컨대, 도 1에서의 구조(110)는 비디오 시퀀스(100)의 픽처(예컨대, 픽처(102 내지 108) 중 임의의 것)의 예시적인 구조를 도시한다. 구조(110)에서, 픽처는 4Х4 기본 처리 유닛으로 분할되고, 이의 경계는 점선으로 도시된다. 일부 실시예에서, 기본 처리 유닛은 일부 비디오 코딩 표준(예컨대, MPEG 패밀리, H.261, H.263, 또는 H.264/AVC)에서 "매크로블록"으로 지칭될 수 있거나, 일부 다른 비디오 코딩 표준(예컨대, H.265/HEVC 또는 H.266/VVC)에서 "코딩 트리 유닛"("CTU")으로 지칭될 수 있다. 기본 처리 유닛은 128×128, 64×64, 32×32, 16×16, 4×8, 16×32와 같은 픽처에서의 가변적인 크기, 또는 픽셀의 어느 임의의 형태 및 크기를 가질 수 있다. 기본 처리 유닛의 크기 및 형태는 기본 처리 유닛에서 유지될 세부사항의 레벨 및 코딩 효율의 밸런스에 기초하여 픽처에 대해 선택될 수 있다.
기본 처리 유닛은 컴퓨터 메모리에 (예컨대, 비디오 프레임 버퍼에) 저장된 상이한 타입의 비디오 데이터의 그룹을 포함할 수 있는 논리적 유닛일 수 있다. 예컨대, 색상 픽처의 기본 처리 유닛은 무색의 밝기 정보를 나타내는 루마 성분(Y), 색상 정보를 나타내는 하나 이상의 크로마 성분(예컨대, Cb 및 Cr) 및 연관된 신택스 요소를 포함할 수 있고, 여기서 루마 및 크로마 성분은 동일한 크기의 기본 처리 유닛을 가질 수 있다. 루마 및 크로마 성분은 일부 비디오 코딩 표준(예컨대, H.265/HEVC 또는 H.266/VVC)에서 "코딩 트리 블록"("CTB")으로 지칭될 수 있다. 기본 처리 유닛에 대해 수행된 임의의 동작은 그의 루마 및 크로마 성분의 각각에 대해 반복적으로 수행될 수 있다.
비디오 코딩은 다수의 동작 스테이지를 가지며, 이의 예시는 도 2a-2b 및 3a-3b에 도시된다. 각각의 스테이지에 대해, 기본 처리 유닛의 크기는 처리하기에 여전히 너무 클 수 있으며, 따라서 본 개시에서 "기본 처리 서브-유닛"으로 지칭되는 세그먼트로 더 분할될 수 있다. 일부 실시예에서, 기본 처리 서브-유닛은 일부 비디오 코딩 표준(예컨대, MPEG 패밀리, H.261, H.263, 또는 H.264/AVC)에서 "블록"으로 지칭될 수 있거나, 일부 다른 비디오 코딩 표준(예컨대, H.265/HEVC 또는 H.266/VVC)에서 "코딩 유닛"("CU")으로 지칭될 수 있다. 기본 처리 서브-유닛은 기본 처리 유닛과 동일하거나 더 작은 크기를 가질 수 있다. 기본 처리 유닛과 유사하게, 기본 처리 서브-유닛은 또한, 논리적 유닛이며, 이는 컴퓨터 메모리에 (예컨대, 비디오 프레임 버퍼에) 저장된 상이한 타입의 비디오 데이터(예컨대, Y, Cb, Cr 및 연관된 신택스 요소)의 그룹을 포함할 수 있다. 기본 처리 서브-유닛에 대해 수행된 임의의 동작은 그의 루마 및 크로마 성분의 각각에 대해 반복적으로 수행될 수 있다. 이러한 분할은 처리 요구에 의존하는 추가적인 레벨로 수행될 수 있다는 것이 유의되어야 한다. 또한, 상이한 스테이지가 상이한 체계를 사용하여 기본 처리 유닛을 분할할 수 있다는 것이 유의되어야 한다.
예컨대, 모드 결정 스테이지(그의 예시가 도 2b에 도시됨)에서, 인코더는 기본 처리 유닛에 대해 어떤 예측 모드(예컨대, 인트라-픽처 예측 또는 인터-픽처 예측)를 사용할지를 결정할 수 있으며, 이러한 기본 처리 유닛은는 이러한 결정을 하기엔 너무 클 수 있다. 인코더는 기본 처리 유닛을 다수의 기본 처리 서브-유닛(예컨대, H.265/HEVC 또는 H.266/VVC에서와 같이 CU)으로 분할할 수 있으며, 각각의 개별적인 기본 처리 서브-유닛에 대해 예측 타입을 결정할 수 있다.
다른 예시로서, 예측 스테이지(그의 예시가 도 2a-2b에 도시됨)에서, 인코더는 기본 처리 서브-유닛(예컨대, CU)의 레벨에서 예측 동작을 수행할 수 있다. 하지만, 일부 경우에서, 기본 처리 서브-유닛은 처리하기에 여전히 너무 클 수 있다. 인코더는 기본 처리 서브-유닛을 예측 동작이 수행될 수 있는 레벨의 더 작은 세그먼트(예컨대, H.265/HEVC 또는 H.266/VVC에서 "예측 블록" 또는 "PB"로 지칭됨)로 더 분할할 수 있다.
다른 예시로서, 변환 스테이지(그의 예시가 도 2a-2b에 도시됨)에서, 인코더는 잔차 기본 처리 서브-유닛(예컨대, CU)에 대한 변환 동작을 수행할 수 있다. 하지만, 일부 경우에서, 기본 처리 서브-유닛은 처리하기에 여전히 너무 클 수 있다. 인코더는 기본 처리 서브-유닛을 예측 동작이 수행될 수 있는 레벨의 더 작은 세그먼트(예컨대, H.265/HEVC 또는 H.266/VVC에서 "변환 블록" 또는 "TB"로 지칭됨)로 더 분할할 수 있다. 동일한 기본 처리 서브-유닛의 분할 체계는 예측 스테이지 및 변환 스테이지에서 상이할 수 있다는 것이 유의되어야 한다. 예컨대, H.265/HEVC 또는 H.266/VVC에서, 동일한 CU의 예측 블록 및 변환 블록은 상이한 크기 및 개수를 가질 수 있다.
도 1의 구조(110)에서, 기본 처리 유닛(112)은 그의 경계가 점선으로 도시된, 3Х3 기본 처리 서브-유닛으로 더 분할된다. 동일한 픽처의 상이한 기본 처리 유닛이 상이한 체계의 기본 처리 서브-유닛으로 분할될 수 있다.
일부 구현에서, 비디오 인코딩 및 디코딩에 대한 병렬 처리 및 오류 복원의 능력을 제공하기 위해, 픽처는 픽처의 영역에 대해, 인코딩 또는 디코딩 프로세스가 픽처의 임의의 다른 영역으로부터의 정보에 의존하지 않도록, 처리를 위한 영역으로 분할될 수 있다. 다시 말해, 픽처의 각각의 영역은 독립적으로 처리될 수 있다. 이렇게 함으로써, 코덱은 픽처의 상이한 영역을 병렬로 처리할 수 있으며, 따라서 코딩 효율을 증가시킨다. 또한, 영역의 데이터가 처리에서 훼손되거나 또는 네트워크 송신에서 분실될 때, 코덱은 훼손되거나 또는 분실된 데이터에 대한 의존(reliance) 없이, 동일한 픽처의 다른 영역을 올바르게 인코딩 또는 디코딩할 수 있으며, 따라서 오류 복원의 능력을 제공한다. 일부 비디오 코딩 표준에서, 픽처는 상이한 타입의 영역으로 분할될 수 있다. 예컨대, H.265/HEVC 및 H.266/VVC는 두 개의 타입의 영역: "슬라이스" 및 "타일"을 제공한다. 또한, 비디오 시퀀스(100)의 상이한 픽처가 픽처를 영역으로 분할하기 위한 상이한 파티션 체계를 가질 수 있다는 것이 유의되어야 한다.
예컨대, 도 1에서, 구조(110)는 그의 경계가 구조(110) 내에서 실선으로 도시된 세 개의 영역(114, 116 및 118)으로 분할된다. 영역(114)은 네 개의 기본 처리 유닛을 포함한다. 영역(116 및 118)의 각각은 여섯 개의 기본 처리 유닛을 포함한다. 도 1에서 구조(110)의 기본 처리 유닛, 기본 처리 서브-유닛 및 영역은 단지 예시이며, 본 개시는 이의 실시예를 제한하지 않는다는 것이 유의되어야 한다.
도 2a는 본 개시의 일부 실시예에 따른 예시적인 인코딩 프로세스의 개략도를 도시한다. 예컨대, 도 2a에 도시된 인코딩 프로세스(200A)는 인코더에 의해 수행될 수 있다. 도 2a에 도시된 바와 같이, 인코더는 프로세스(200A)에 따라 비디오 시퀀스(202)를 비디오 비트스트림(228)으로 인코딩할 수 있다. 도 1에서의 비디오 시퀀스(100)와 유사하게, 비디오 시퀀스(202)는 시간적인 순서로 배열된 픽처("원본 픽처"로 지칭됨)의 세트를 포함할 수 있다. 도 1에서의 구조(110)와 유사하게, 비디오 시퀀스(202)의 각각의 원본 픽처는 인코더에 의해 기본 처리 유닛, 기본 처리 서브-유닛 또는 처리를 위한 영역으로 분할될 수 있다. 일부 실시예에서, 인코더는 비디오 시퀀스(202)의 각각의 원본 픽처에 대한 기본 처리 유닛의 레벨에서 프로세스(200A)를 수행할 수 있다. 예컨대, 인코더는 프로세스(200A)를 반복 방식으로 수행할 수 있으며, 여기서 인코더는 프로세스(200A)의 하나의 반복으로 기본 처리 유닛을 인코딩할 수 있다. 일부 실시예에서, 인코더는 비디오 시퀀스(202)의 각각의 원본 픽처의 영역(예컨대, 영역(114-118))에 대해 프로세스(200A)를 병렬로 수행할 수 있다.
도 2a에서, 인코더는 예측 데이터(206) 및 예측된 BPU(208)를 생성하기 위해 비디오 시퀀스(202)의 원본 픽처의 기본 처리 유닛("원본 BPU"로 지칭됨)을 예측 스테이지(204)로 공급할 수 있다. 인코더는 잔차 BPU(210)를 생성하기 위해 원본 BPU로부터 예측된 BPU(208)를 감산할 수 있다. 인코더는 양자화된 변환 계수(216)를 생성하기 위해, 잔차 BPU(210)를 변환 스테이지(212) 및 양자화 스테이지(214)에 공급할 수 있다. 인코더는 비디오 비트스트림(228)을 생성하기 위해, 예측 데이터(206) 및 양자화된 변환 계수(216)를 이진 코딩 스테이지(226)에 공급할 수 있다. 구성요소(202, 204, 206, 208, 210, 212, 214, 216, 226 및 228)는 "순방향 경로(forward path)"로서 지칭될 수 있다. 프로세스(200A) 동안, 양자화 스테이지(214) 이후에, 인코더는 재구성된 잔차 BPU(222)를 생성하기 위해, 양자화된 변환 계수(216)를 역양자화 스테이지(218) 및 역변환 스테이지(220)에 공급할 수 있다. 인코더는 프로세스(200A)의 다음 반복을 위해 예측 스테이지(204)에서 사용되는 예측 참조(224)를 생성하기 위해, 재구성된 잔차 BPU(222)를 예측된 BPU(208)에 더할 수 있다. 프로세스(200A)의 구성요소(218, 220, 222 및 224)는 "재구성 경로"로 지칭될 수 있다. 재구성 경로는 인코더 및 디코더 둘 모두가 예측을 위해 동일한 참조 데이터를 사용하는 것을 보장하도록 사용될 수 있다.
인코더는 (순방향 경로에서) 원본 픽처의 각각의 원본 BPU를 인코딩하고, (재구성 경로에서) 원본 픽처의 다음 원본 BPU를 인코딩하기 위한 예측된 참조(224)를 생성하기 위해 프로세스(200A)를 반복적으로 수행할 수 있다. 원본 픽처의 모든 원본 BPU를 인코딩한 이후에, 인코더는 비디오 시퀀스(202)에서 다음 픽처를 인코딩하도록 진행할 수 있다.
프로세스(200A)를 참조하면, 인코더는 비디오 캡처링 디바이스(예컨대, 카메라)에 의해 생성되는 비디오 시퀀스(202)를 수신할 수 있다. 본원에서 사용된 "수신하다"라는 용어는 수신, 입력, 취득, 리트리브(retrieve), 획득, 판독, 액세스 또는 데이터를 입력하기 위한 임의의 방식에서의 임의의 동작을 지칭할 수 있다.
현재 반복에서의 예측 스테이지(204)에서, 인코더는 원본 BPU 및 예측 참조(224)를 수신할 수 있고, 예측 데이터(206) 및 예측된 BPU(208)를 생성하기 위해 예측 동작을 수행할 수 있다. 예측 참조(224)는 프로세스(200A)의 이전의 반복의 재구성 경로로부터 생성될 수 있다. 예측 스테이지(204)의 목적은 예측 데이터(206) 및 예측 참조(224)로부터 원본 BPU를 예측된 BPU(208)로서 재구성하기 위해 사용될 수 있는 예측 데이터(206)를 추출함으로써 정보 중복(information redundancy)를 감소시키는 것이다.
이상적으로, 예측된 BPU(208)는 원본 BPU와 동일할 수 있다. 하지만, 비-이상적 예측 및 재구성 동작에 기인하여, 예측된 BPU(208)는 일반적으로 원본 BPU와는 약간 상이하다. 이러한 차이를 기록하기 위해, 예측된 BPU(208)를 생성한 이후에, 인코더는 잔차 BPU(210)를 생성하기 위해, 원본 BPU로부터 이를 감산할 수 있다. 예컨대, 인코더는 원본 BPU의 대응하는 픽셀의 값으로부터 예측된 BPU(208)의 픽셀의 값(예컨대, 그레이스케일 값 또는 RGB 값)을 감산할 수 있다. 잔차 BPU(210)의 각각의 픽셀은 원본 BPU 및 예측된 BPU(208)의 대응하는 픽셀 사이에서 이러한 감산의 결과로서 잔차 값을 가질 수 있다. 원본 BPU와 비교하여, 예측 데이터(206) 및 잔차 BPU(210)는 더 적은 수의 비트를 가질 수 있지만, 이들은 현저한 품질 저하 없이 원본 BPU를 재구성하는데 사용될 수 있다. 따라서, 원본 BPU가 압축된다.
잔차 BPU(210)를 더 압축하기 위해, 변환 스테이지(212)에서, 인코더는 이를 2차원 "기본 패턴" ― 각각의 기본 패턴은 "변환 계수와 연관됨 ― 으로 분해함으로써 잔차 BPU(210)의 공간 중복을 저감할 수 있다. 기본 패턴은 동일한 크기(예컨대, 잔차 BPU(210)의 크기)를 가질 수 있다. 각각의 기본 패턴은 잔차 BPU(210)의 변동 주파수(variation frequency)(예컨대, 밝기 변동의 주파수) 성분을 나타낼 수 있다. 기본 패턴 중 어느 것도 임의의 다른 기본 패턴의 임의의 조합(예컨대, 선형 조합)으로부터 재생성될 수 없다. 다시 말해, 분해는 잔차 BPU(210)의 변동을 주파수 도메인으로 분해할 수 있다. 이러한 분해는 함수의 이산 푸리에 변환과 유사하며, 여기서 기본 패턴은 이산 푸리에 변환의 기본 함수(예컨대, 삼각 함수)와 유사하고 변환 계수는 기본 함수와 연관된 계수와 유사하다.
상이한 변환 알고리즘이 상이한 기본 패턴을 사용할 수 있다. 다양한 변환 알고리즘은 예컨대, 이산 코사인 변환, 이산 사인 변환 등과 같은 변환 스테이지(212)에서 사용될 수 있다. 변환 스테이지(212)에서의 변환은 역으로 이루어질 수 있다(invertible). 즉, 인코더는 변환의 역동작("역변환"으로 지칭됨)에 의해 잔차 BPU(210)를 복원할 수 있다. 예컨대, 잔차 BPU(210)의 픽셀을 복원하기 위해, 역변환은 기본 패턴의 대응하는 픽셀의 값을 개개의 연관된 계수를 곱하고, 그 결과 값을 더하여 가중합을 생성할 수 있다. 비디오 코딩 표준에 대해, 인코더 및 디코더 둘 모두는 동일한 변환 알고리즘(따라서, 동일한 기본 패턴)을 사용할 수 있다. 따라서, 인코더는 변환 계수만을 기록할 수 있고, 이로부터 디코더는 인코더로부터 기본 패턴을 수신하지 않으면서, 잔차 BPU(210)를 재구성할 수 있다. 잔차 BPU(210)와 비교하여, 변환 계수는 더 적은 수의 비트를 가질 수 있지만, 이들은 현저한 품질 저하 없이 잔차 BPU(210)를 재구성하는데 사용될 수 있다. 따라서, 잔차 BPU(210)가 더 압축된다.
인코더는 양자화 스테이지(214)에서 변환 계수를 더 압축할 수 있다. 변환 프로세스에서, 상이한 기본 패턴이 상이한 변동 주파수(예컨대, 밝기 변동 주파수)를 나타낼 수 있다. 인간의 눈은 일반적으로 낮은-주파수 변동을 더 잘 인식하기 때문에, 인코더는 디코딩에서 현저한 품질 저하를 초래하지 않으면서 높은-주파수 변동의 정보를 무시할 수 있다. 예컨대, 양자화 스테이지(214)에서, 인코더는 각각의 변환 계수를 정수 값("양자화 스케일 파라미터"로 지칭됨)으로 나누고, 몫을 그의 가장 가까운 정수로 반올림함으로써, 양자화된 변환 계수(216)를 생성할 수 있다. 이러한 동작 이후에, 고주파수 기본 패턴의 일부 변환 계수는 0으로 변환될 수 있고, 저주파수 기본 패턴의 변환 계수는 더 작은 정수로 변환될 수 있다. 인코더는 0-값 양자화된 변환 계수(216)를 무시할 수 있으며, 이에 의해 변환 계수는 더 압축된다. 또한, 양자화 프로세스는 역으로 이루어질 수 있고, 여기서 양자화된 변환 계수(216)는 양자화의 역동작("역양자화"로 지칭됨)에서 변환 계수로 재구성될 수 있다.
인코더가 반올림 동작에서 이러한 나눗셈의 나머지를 무시하기 때문에, 양자화 스테이지(214)는 손실이 있을 수 있다. 전형적으로, 양자화 스테이지(214)는 프로세스(200A)의 대부분의 정보 손실에 기여할 수 있다. 정보 손실이 크면 클수록, 양자화된 변환 계수(216)가 더 적은 비트를 필요로 할 수 있다. 상이한 레벨의 정보 손실을 획득하기 위해, 인코더는 양자화 스케일 팩터의 상이한 값 또는 양자화 프로세스의 임의의 다른 파라미터를 사용할 수 있다.
이진 코딩 스테이지(226)에서, 인코더는 예컨대, 엔트로피 코딩, 가변 길이 코딩, 산술 코딩, 허프만 코딩(Huffman coding), 컨텍스트-적응적 이진 산술 코딩(context-adaptive binary arithmetic coding) 또는 임의의 다른 무손실 또는 손실 압축 알고리즘과 같은 이진 코딩 기술을 사용하여 예측 데이터(206) 및 양자화된 변환 계수(216)를 인코딩할 수 있다. 일부 실시예에서, 예측 데이터(206) 및 양자화된 변환 계수(216) 이외에, 인코더는 예컨대, 예측 스테이지(204)에서 사용되는 예측 모드, 예측 동작의 파라미터, 변환 스테이지(212)에서의 변환 타입, 양자화 프로세스의 파라미터(예컨대, 양자화 스케일 팩터), 인코더 제어 파라미터(예컨대, 비트레이트 제어 파라미터) 등과 같은 다른 정보를 이진 코딩 스테이지(226)에서 인코딩할 수 있다. 인코더는 비디오 비트스트림(228)을 생성하기 위해 이진 코딩 스테이지(226)의 출력 데이터를 사용할 수 있다. 일부 실시예에서, 비디오 비트스트림(228)은 네트워크 송신을 위해 더 패킷화될 수 있다.
프로세스(200A)의 재구성 경로를 참고하면, 역양자화 스테이지(218)에서, 인코더는 재구성된 변환 계수를 생성하기 위해 양자화된 변환 계수(216)에 역양자화를 수행할 수 있다. 역변환 스테이지(220)에서, 인코더는 재구성된 변환 계수에 기초하여, 재구성된 잔차 BPU(222)를 생성할 수 있다. 인코더는 프로세스(200A)의 다음 반복에서 사용될 예측 참조(224)를 생성하기 위해, 재구성된 잔차 BPU(222)를 예측된 BPU(208)에 더할 수 있다.
프로세스(200A)의 다른 변형은 비디오 시퀀스(202)를 인코딩하기 위해 사용될 수 있다는 것이 유의되어야 한다. 일부 실시예에서, 프로세스(200A)의 스테이지는 인코더에 의해 상이한 순서로 수행될 수 있다. 일부 실시예에서, 프로세스(200A)의 하나 이상의 스테이지는 단일 스테이지로 결합될 수 있다. 일부 실시예에서, 프로세스(200A)의 단일 스테이지는 다수의 스테이지로 분할될 수 있다. 예컨대, 변환 스테이지(212) 및 양자화 스테이지(214)가 단일 스테이지로 결합될 수 있다. 일부 실시예에서, 프로세스(200A)는 추가적인 스테이지를 포함할 수 있다. 일부 실시예에서, 프로세스(200A)는 도 2a에서의 하나 이상의 스테이지를 생략할 수 있다.
도 2b는 본 개시의 일부 실시예에 따른 다른 예시적인 인코딩 프로세스(200B)의 개략도를 도시한다. 도 2b에 도시된 바와 같이, 프로세스(200B)는 프로세스(200A)로부터 수정될 수 있다. 예컨대, 프로세스(200B)는 하이브리드 비디오 인코딩 표준(예컨대, H.26x 시리즈)을 따르는 인코더에 의해 사용될 수 있다. 프로세스(200A)에 비해, 프로세스(200B)의 순방향 경로는 모드 결정 스테이지(230)를 추가적으로 포함하고, 예측 스테이지(204)를 공간 예측 스테이지(2042) 및 시간 예측 스테이지(2044)로 분할한다. 프로세스(200B)의 재구성 경로는 루프 필터 스테이지(232) 및 버퍼(234)를 추가적으로 포함한다.
일반적으로, 예측 기술은 두 개의 타입: 공간 예측 및 시간 예측으로 카테고리화될 수 있다. 공간 예측(예컨대, 인트라-픽처 예측 또는 "인트라 예측")은 현재 BPU를 예측하기 위해, 동일한 픽처에서 하나 이상의 이미 코딩된 이웃하는 BPU로부터의 픽셀을 사용할 수 있다. 즉, 공간 예측에서의 예측 참조(224)는 이웃하는 BPU를 포함할 수 있다. 공간 예측은 픽처의 내재적인 공간 중복을 감소시킬 수 있다. 시간 예측(예컨대, 인터-픽처 예측 또는 "인터 예측")은 현재 BPU를 예측하기 위해 하나 이상의 이미 코딩된 픽처로부터의 영역을 사용할 수 있다. 즉, 시간 예측에서의 예측 참조(224)는 코딩된 픽처를 포함할 수 있다. 시간 예측은 픽처의 내재적인 시간 중복을 감소시킬 수 있다.
프로세스(200B)를 참조하면, 순방향 경로에서, 인코더는 공간 예측 스테이지(2042) 및 시간 예측 스테이지(2044)에서 예측 동작을 수행한다. 예컨대, 공간 예측 스테이지(2042)에서, 인코더는 인트라 예측을 수행할 수 있다. 인코딩되는 픽처의 원본 BPU에 대해, 예측 참조(224)는 동일한 픽처에서 (순방향 경로에서) 인코딩되고 (재구성 경로에서) 재구성되는 하나 이상의 이웃하는 BPU를 포함할 수 있다. 인코더는 이웃하는 BPU를 외삽함으로써 예측된 BPU(208)를 생성할 수 있다. 외삽 기법은 예컨대, 선형 외삽(linear extrapolation) 또는 내삽(interpolation), 다항식 외삽 또는 내삽 등을 포함할 수 있다. 일부 실시예에서, 인코더는 가령, 예측된 BPU(208)의 각각의 픽셀에 대해 대응하는 픽셀의 값을 외삽함으로써, 픽셀 레벨에서 외삽을 수행할 수 있다. 외삽을 위해 사용된 이웃하는 BPU는 (예컨대, 원본 BPU의 상부에서) 수직 방향, (예컨대, 원본 BPU의 좌측에서) 수평 방향, (예컨대, 원본 BPU의 좌측-하단, 우측-하단, 좌측-상단 또는 우측-상단에서) 대각선 방향, 또는 사용된 비디오 코딩 표준에서 정의된 임의의 방향에서와 같은 다양한 방향으로부터 원본 BPU에 대해 위치될 수 있다. 인트라 예측에 대해, 예측 데이터(206)는 예컨대, 원본 BPU에 대한 사용된 이웃하는 BPU의 위치(예컨대, 좌표), 사용된 이웃하는 BPU의 크기, 외삽의 파라미터, 사용된 이웃하는 BPU의 방향 등을 포함할 수 있다.
다른 예에 대해, 시간 예측 스테이지(2044)에서, 인코더는 인터 예측을 수행할 수 있다. 현재 픽처의 원본 BPU에 대해, 예측 참조(224)는 (순방향 경로에서) 인코딩되고 (재구성된 경로에서) 재구성된 하나 이상의 픽처("참조 픽처"로 지칭됨)를 포함할 수 있다. 일부 실시예에서, 참조 픽처는 BPU별로 인코딩되고 재구성될 수 있다. 예컨대, 인코더는 재구성된 BPU를 생성하기 위해, 재구성된 잔차 BPU(222)를 예측된 BPU(208)에 더할 수 있다. 동일한 픽처의 모든 재구성된 BPU가 생성될 때, 인코더는 재구성된 픽처를 참조 픽처로서 생성할 수 있다. 인코더는 참조 픽처의 범주("검색 윈도우"로 지칭됨)에서 매칭 영역을 검색하기 위해, "움직임 추정"의 동작을 수행할 수 있다. 참조 픽처에서 검색 윈도우의 위치는 현재 픽처에서 원본 BPU의 위치에 기초하여 결정될 수 있다. 예컨대, 검색 윈도우는 현재 픽처에서 원본 BPU와 참조 픽처에서 동일한 좌표를 갖는 위치에 중심이 맞춰질 수 있고, 미리 결정된 거리에 대해 확장될 수 있다. 인코더가 검색 윈도우에서 원본 BPU와 유사한 영역을 (예컨대, 픽셀-순환 알고리즘(pel-recursive algorithm), 블록-매칭 알고리즘 등을 사용함으로써) 식별할 때, 인코더는 이러한 영역을 매칭 영역으로서 결정할 수 있다. 매칭 영역은 원본 BPU로부터 상이한 치수(예컨대, 그보다 작거나, 이와 동일하거나, 그보다 크거나 또는 상이한 형태인)를 가질 수 있다. 참조 픽처 및 현재 픽처가 (예컨대, 도 1에 도시된 바와 같이) 시간선에서 시간적으로 분리되기 때문에, 시간이 지남에 따라, 매칭 영역이 원본 BPU의 위치로 "이동하는" 것으로 여겨질 수 있다. 인코더는 "움직임 벡터"로서 이러한 움직임의 방향 및 거리를 기록할 수 있다. (예컨대, 도 1에서의 픽처(106)와 같이) 다수의 참조 픽처가 사용될 때, 인코더는 매칭 영역을 검색하고, 각각의 참조 픽처에 대해 그의 연관된 움직임 벡터를 결정할 수 있다. 일부 실시예에서, 인코더는 개개의 매칭 참조 픽처의 매칭 영역의 픽셀값에 대해 가중치를 할당할 수 있다.
움직임 추정은 예컨대, 병진(translation), 회전, 주밍(zooming) 등과 같은 다양한 타입의 움직임을 식별하기 위해 사용될 수 있다. 인터 예측에 대해, 예측 데이터(206)는 예컨대, 매칭 영역의 위치(예컨대, 좌표), 매칭 영역과 관련된 움직임 벡터, 참조 픽처의 개수, 참조 픽처와 연관된 가중치 등을 포함할 수 있다.
예측된 BPU(208)를 생성하기 위해, 인코더는 "움직임 보상"의 동작을 수행할 수 있다. 움직임 보상은 예측 데이터(206)(예컨대, 움직임 벡터) 및 예측 참조(224)에 기초하여 예측된 BPU(208)를 재구성하는데 사용될 수 있다. 예컨대, 인코더는 움직임 벡터에 따라 참조 픽처의 매칭 영역을 이동시킬 수 있으며, 여기서 인코더는 현재 픽처의 원본 BPU를 예측할 수 있다. 다수의 참조 픽처가 (예컨대, 도 1에서의 픽처로서) 사용될 때, 인코더는 매칭 영역의 각각의 움직임 벡터 및 평균 픽셀 값에 따라 참조 픽처의 매칭 영역을 이동시킬 수 있다. 일부 실시예에서, 인코더가 각각의 매칭 참조 픽처의 매칭 영역의 픽셀값에 가중치를 할당한 경우, 인코더는 이동된 매칭 영역의 픽셀값의 가중치 합을 더할 수 있다.
일부 실시예에서, 인터 예측은 단방향 또는 양방향일 수 있다. 단방향 인터 예측은 현재 픽처에 대해 동일한 시간 방향으로 하나 이상의 참조 픽처를 사용할 수 있다. 예컨대, 도 1에서의 픽처(104)는 참조 픽처(즉, 픽처(102))가 픽처(104)에 선행하는 단방향 인터-예측된 픽처이다. 양방향 인터 예측은 현재 픽처에 대해 시간 방향 둘 모두에서 하나 이상의 참조 픽처를 사용할 수 있다. 예컨대, 도 1에서의 픽처(106)는 참조 픽처(즉, 픽처(104 및 108))가 픽처(104)에 대해 시간 방향 둘 모두에 있는 양방향 인터-예측된 픽처이다.
프로세스(200B)의 순방향 경로를 계속 참조하면, 공간 예측 스테이지(2042) 및 시간 예측 스테이지(2044) 이후에, 모드 결정 스테이지(230)에서, 인코더는 프로세스(200B)의 현재 반복에 대해 예측 모드(예컨대, 인트라 예측 또는 인터 예측 중 하나)를 선택할 수 있다. 예컨대, 인코더는 레이트-왜곡 최적화 기술(rate-distortion optimization technique)을 수행할 수 있으며, 여기서 인코더는 후보 예측 모드의 비트레이트 및 후보 예측 모드 하에서 재구성된 참조 픽처의 왜곡에 의존하여, 비용 함수의 값을 최소화하기 위해 예측 모드를 선택할 수 있다. 선택된 예측 모드에 의존하여, 인코더는 대응하는 예측된 BPU(208) 및 예측된 데이터(206)를 생성할 수 있다.
프로세스(200B)의 재구성 경로에서, 순방향 경로에서 인트라 예측 모드가 선택된 경우, 예측 참조(224)(예컨대, 현재 픽처에서 인코딩되고 재구성된 현재 BPU)를 생성한 이후에, 인코더는 차후 사용을 위해(예컨대, 현재 픽처의 다음 BPU의 외삽을 위해), 예측 참조(224)를 공간 예측 스테이지(2042)로 직접적으로 공급할 수 있다. 인코더는 예측 참조(224)의 코딩 동안 도입된 왜곡(예컨대, 블로킹 아티팩트(blocking artifacts))을 감소시키거나 제거하기 위해 인코더가 예측 참조(224)에 루프 필터를 적용할 수 있는 루프 필터 스테이지(232)에 예측 참조(224)를 공급할 수 있다. 인코더는 예컨대, 디블로킹(deblocking), 샘플 적응적 오프셋, 적응적 루프 필터 등과 같은 다양한 루프 필터 기법을 루프 필터 스테이지(232)에 적용할 수 있다. 루프-필터링된 참조 픽처는 차후 사용을 위해(예컨대, 비디오 시퀀스(202)의 향후 픽처에 대한 인터-예측 참조 픽처로서 사용되기 위해) 버퍼(234)(또는 "디코딩된 픽처 버퍼")에 저장될 수 있다. 인코더는 시간 예측 스테이지(2044)에서 사용되도록 버퍼(234)에 하나 이상의 참조 픽처를 저장할 수 있다. 일부 실시예에서, 인코더는 양자화된 변환 계수(216), 예측 데이터(206) 및 다른 정보와 함께, 이진 코딩 스테이지(226)에서 루프 필터의 파라미터(예컨대, 루프 필터 강도)를 인코딩할 수 있다.
도 3a는 본 개시의 일부 실시예에 따른 예시적인 디코딩 프로세스의 개략도를 도시한다. 도 3a에 도시된 바와 같이, 프로세스(300A)는 도 2a에서의 압축 프로세스(200A)에 대응하는 압축 해제 프로세스일 수 있다. 일부 실시예에서, 프로세스(300A)는 프로세스(200A)의 재구성 경로와 유사할 수 있다. 디코더는 프로세스(300A)에 따라 비디오 비트스트림(228)을 비디오 스트림(304)으로 디코딩할 수 있다. 비디오 스트림(304)은 비디오 시퀀스(202)와 매우 유사할 수 있다. 하지만, 압축 및 압축 해제 프로세스(예컨대, 도 2a-2b에서의 양자화 스테이지(214))에서의 정보 손실에 기인하여, 일반적으로 비디오 스트림(304)은 비디오 시퀀스(202)와 동일하지 않다. 도 2a-2b에서의 프로세스(200A 및 200B)와 유사하게, 디코더는 비디오 비트스트림(228)에서 인코딩된 각각의 픽처에 대해 기본 처리 유닛(BPU)의 레벨에서 프로세스(300A)를 수행할 수 있다. 예컨대, 디코더는 반복적인 방식으로 프로세스(300A)를 수행할 수 있으며, 여기서 디코더는 프로세스(300A)의 한 번의 반복으로 기본 처리 유닛을 디코딩할 수 있다. 일부 실시예에서, 디코더는 비디오 비트스트림(228)에서 인코딩된 각각의 픽처의 영역(예컨대, 영역(114 내지 118))에 대해 병렬로 프로세스(300A)를 수행할 수 있다.
도 3a에서, 디코더는 인코딩된 픽처의 기본 처리 유닛("인코딩된 BPU"로 지칭됨)과 연관된 비디오 비트스트림(228)의 부분을 이진 디코딩 스테이지(302)로 공급할 수 있다. 이진 디코딩 스테이지(302)에서, 디코더는 그 부분을 예측 데이터(206) 및 양자화된 변환 계수(216)로 디코딩할 수 있다. 디코더는 재구성된 잔차 BPU(222)를 생성하기 위해 양자화된 변환 계수(216)를 역양자화 스테이지(218) 및 역변환 스테이지(220)에 공급할 수 있다. 디코더는 예측된 BPU(208)를 생성하기 위해 예측 데이터(206)를 예측 스테이지(204)로 공급할 수 있다. 디코더는 예측된 참조(224)를 생성하기 위해 재구성된 잔차 BPU(222)를 예측된 BPU(208)에 더할 수 있다. 일부 실시예에서, 예측된 참조(224)는 버퍼(예컨대, 컴퓨터 메모리의 디코딩된 픽처 버퍼)에 저장될 수 있다. 디코더는 프로세스(300A)의 다음 반복에서 예측 동작을 수행하기 위해, 예측된 참조(224)를 예측 스테이지(204)에 공급할 수 있다.
디코더는 인코딩된 픽처의 각각의 인코딩된 BPU를 디코딩하고, 인코딩된 픽처의 다음 인코딩된 BPU를 인코딩하기 위해 예측된 참조(224)를 생성하도록, 프로세스(300A)를 반복적으로 수행할 수 있다. 인코딩된 픽처의 모든 인코딩된 BPU를 디코딩한 이후에, 디코더는 디스플레이를 위해 픽처를 비디오 스트림(304)에 출력하고, 비디오 비트스트림(228)에서 다음 인코딩된 픽처를 디코딩하도록 진행할 수 있다.
이진 디코딩 스테이지(302)에서, 디코더는 인코더에 의해 사용된 이진 코딩 기법(예컨대, 엔트로피 코딩, 가변 길이 코딩, 산술 코딩, 허프만 코딩, 컨텍스트-적응적 이진 산술 코딩 또는 임의의 다른 무손실 압축 알고리즘)의 역동작을 수행할 수 있다. 일부 실시예에서, 예측 데이터(206) 및 양자화된 변환 계수(216) 이외에, 디코더는 예컨대, 예측 모드, 예측 동작의 파라미터, 변환 타입, 양자화 프로세스의 파라미터(예컨대, 양자화 스케일 팩터), 인코더 제어 파라미터(예컨대, 비트레이트 제어 파라미터) 등과 같은 다른 정보를 이진 디코딩 스테이지(302)에서 디코딩할 수 있다. 일부 실시예에서, 비디오 비트스트림(228)이 네트워크를 통해 패킷으로 송신되는 경우, 디코더는 이를 이진 디코딩 스테이지(302)에 공급하기 전에, 비디오 비트스트림(228)을 디패킷화(depacketize)할 수 있다.
도 3b는 본 개시의 일부 실시예에 따른 다른 예시적인 디코딩 프로세스의 개략도를 도시한다. 도 3b에 도시된 바와 같이, 프로세스(300B)는 프로세스(300A)로부터 수정될 수 있다. 예컨대, 프로세스(300B)는 하이브리드 비디오 코딩 표준(예컨대, H.26x 시리즈)에 따르는 디코더에 의해 사용될 수 있다. 프로세스(300A)와 비교하면, 프로세스(300B)는 예측 스테이지(204)를 공간 예측 스테이지(2042) 및 시간 예측 스테이지(2044)로 추가적으로 분할하고, 루프 필터 스테이지(232) 및 버퍼(234)를 추가적으로 포함한다.
프로세스(300B)에서, 디코딩되는 인코딩된 픽처("현재 픽처"로 지칭됨)의 인코딩된 기본 처리 유닛("현재 BPU"로 지칭됨)에 대해, 디코더에 의해 이진 디코딩 스테이지(302)로부터 디코딩된 예측 데이터(206)는 인코더에 의해 현재 BPU를 인코딩하는 데 어느 예측 모드가 사용되었는지에 의존하여, 다양한 타입의 데이터를 포함할 수 있다. 예컨대, 현재 BPU를 인코딩하기 위해, 인코더에 의해 인트라 예측이 사용된 경우, 예측 데이터(206)는 인트라 예측을 나타내는 예측 모드 표시자(예컨대, 플래그 값), 인트라 예측 동작의 파라미터 등을 포함할 수 있다. 인트라 예측 동작의 파라미터는 예컨대, 참조로서 사용된 하나 이상의 이웃하는 BPU의 위치(예컨대, 좌표), 이웃하는 BPU의 크기, 외삽의 파라미터, 원본 BPU에 대한 이웃하는 BPU의 방향 등을 포함할 수 있다. 다른 예에 대해, 현재 BPU를 인코딩하기 위해, 인코더에 의해 인터 예측이 사용된 경우, 예측 데이터(206)는 인터 예측을 나타내는 예측 모드 표시자(예컨대, 플래그 값), 인터 예측 동작의 파라미터 등을 포함할 수 있다. 인터 예측 동작의 파라미터는 예컨대, 현재 BPU와 연관된 참조 픽처의 개수, 참조 픽처와 각각 연관된 가중치, 각각의 참조 픽처에서의 하나 이상의 매칭 영역의 위치(예컨대, 좌표), 매칭 영역과 각각 연관된 하나 이상의 움직임 벡터 등을 포함할 수 있다.
예측 모드 표시자에 기초하여, 디코더는 공간 예측 스테이지(2042)에서 공간 예측(예컨대, 인트라 예측)을 수행할지, 또는 시간 예측 스테이지(2044)에서 시간 예측(예컨대, 인터 예측)을 수행할지를 결정할 수 있다. 이러한 공간 예측 또는 시간 예측을 수행하는 것에 대한 세부사항이 도 2b에서 설명되고, 이하에서는 반복되지 않을 것이다. 이러한 공간 예측 또는 시간 예측을 수행한 이후에, 디코더는 예측된 BPU(208)를 생성할 수 있다. 도 3a에서 설명된 바와 같이, 디코더는 예측 참조(224)를 생성하기 위해 예측된 BPU(208) 및 재구성된 잔차 BPU(222)를 더한다.
프로세스(300B)에서, 디코더는 프로세스(300B)의 다음 반복에서 예측 동작을 수행하기 위해, 예측된 참조(224)를 공간 예측 스테이지(2042) 또는 시간 예측 스테이지(2044)에 공급할 수 있다. 예컨대, 현재 BPU가 공간 예측 스테이지(2042)에서 인트라 예측을 사용하여 디코딩되는 경우, 예측 참조(224)(예컨대, 디코딩된 현재 BPU)를 생성한 이후에, 디코더는 차후 사용을 위해(예컨대, 현재 픽처의 다음 BPU의 외삽을 위해) 예측 참조(224)를 공간 예측 스테이지(2042)에 직접적으로 공급할 수 있다. 현재 BPU가 시간 예측 스테이지(2044)에서 인터 예측을 사용하여 디코딩되는 경우, 예측 참조(224)(예컨대, 모든 BPU가 디코딩된 참조 픽처)를 생성한 이후에, 디코더는 왜곡(예컨대, 블로킹 아티팩트)을 감소시키거나 제거하기 위해, 예측 참조(224)를 루프 필터 스테이지(232)에 공급할 수 있다. 도 2b에 설명된 방식으로, 디코더는 루프 필터를 예측 참조(224)에 적용할 수 있다. 루프-필터링된 참조 픽처는 차후 사용을 위해(예컨대, 비디오 비트스트림(228)의 향후 인코딩된 픽처에 대한 인터-예측 참조 픽처로서 사용되도록) 버퍼(234)(예컨대, 컴퓨터 메모리에서 디코딩된 픽처 버퍼)에 저장될 수 있다. 디코더는 시간 예측 스테이지(2044)에서 사용되도록 버퍼(234)에 하나 이상의 참조 픽처를 저장할 수 있다. 일부 실시예에서, 예측 데이터는 루프 필터의 파라미터(예컨대, 루프 필터 강도)를 더 포함할 수 있다. 일부 실시예에서, 예측 데이터는, 예측 데이터(206)의 예측 모드 표시자가 현재 BPU를 인코딩하기 위해 인터 예측이 사용되었음을 나타낼 때, 루프 필터의 파라미터를 포함한다.
4개의 유형의 루프 필터가 존재할 수 있다. 예컨대, 루프 필터는 디블로킹 필터, SAO(sample adaptive offsets) 필터, LMCS(luma mapping with chroma scaling) 필터, 및 ALF(adaptive loop filter)를 포함할 수 있다. 4개의 유형의 루프 필터를 적용하는 순서는 LMCS 필터, 디블로킹 필터, SAO 필터, ALF일 수 있다. LMCS 필터는 2개의 주요 구성요소를 포함할 수 있다. 제1 구성요소는 적응형 조각별 선형 모델(adaptive piecewise linear model)에 기초하는 루마 구성요소의 루프 내 매핑일 수 있다. 제2 구성요소는 크로마 구성요소에 대한 것일 수 있으며, 루마 종속 크로마 잔차 스케일링이 적용될 수 있다.
도 4는 본 개시의 일부 실시예에 따른, 비디오를 인코딩하거나 또는 디코딩하기 위한 예시적인 장치의 블록도를 도시한다. 도 4에 도시된 바와 같이, 장치(400)는 프로세서(402)를 포함할 수 있다. 프로세서(402)가 본원에서 설명된 명령어를 실행할 때, 장치(400)는 비디오 인코딩 또는 디코딩을 위한 특별화된 기계가 될 수 있다. 프로세서(402)는 정보를 조작하거나 또는 처리할 수 있는 임의의 타입의 회로일 수 있다. 예컨대, 프로세서(402)는 중앙 처리 유닛(또는 "CPU"), 그래픽 처리 유닛(또는 "GPU"), 신경 처리 유닛(neural processing unit, "NPU"), 마이크로제어기 유닛(microcontroller unit, "MCU"), 광학 프로세서, 프로그래머블 로직 제어기, 마이크로제어기, 마이크로프로세서, 디지털 신호 프로세서, 지적 재산권(intellectual property, IP) 코어, 프로그래머블 로직 어레이(Programmable Logic Array, PLA), 프로그래머블 어레이 로직(Programmable Array Logic, PAL), 일반 어레이 로직(Generic Array Logic, GAL), 복합 프로그래머블 논리 디바이스(Complex Programmable Logic Device, CPLD), 현장 프로그래머블 게이트 어레이(Field-Programmable Gate Array, FPGA), 시스템 온 칩(System On Chip, SoC), 애플리케이션-특정 집적 회로(Application-Specific Integrated Circuit, ASIC) 등의 임의의 개수의 임의의 조합을 포함할 수 있다. 일부 실시예에서, 프로세서(402)는 또한, 단일 로직 구성요소로서 그룹화되는 프로세서의 세트일 수 있다. 예컨대, 도 4에 도시된 바와 같이, 프로세서(402)는 프로세서(402a), 프로세서(402b) 및 프로세서(402n)를 포함하는 다수의 프로세서를 포함할 수 있다.
장치(400)는 또한, 데이터(예컨대, 명령어의 세트, 컴퓨터 코드, 중간 데이터 등)를 저장하도록 구성되는 메모리(404)를 포함할 수 있다. 예컨대, 도 4에 도시된 바와 같이, 저장된 데이터는 프로그램 명령어(예컨대, 프로세스(200A, 200B, 300A 또는 300B)에서의 스테이지를 구현하기 위한 프로그램 명령어) 및 처리를 위한 데이터(예컨대, 비디오 시퀀스(202), 비디오 비트스트림(228) 또는 비디오 스트림(304))를 포함할 수 있다. 프로세서(402)는 프로그램 명령어 및 처리를 위한 데이터에 (예컨대, 버스(410)를 통해) 액세스할 수 있고, 처리를 위한 데이터에 대해 동작 또는 조작을 수행하기 위해 프로그램 명령어를 실행할 수 있다. 메모리(404)는 고속 랜덤 액세스 저장 디바이스 또는 비-휘발성 저장 디바이스를 포함할 수 있다. 일부 실시예에서, 메모리(404)는 랜덤-액세스 메모리(random-access memory, RAM), 읽기-전용 메모리(ROM), 광학 디스크, 자기 디스크, 하드 드라이브, 솔리드-스테이트 드라이브(solid-state drive), 플래시 드라이브, 보안 디지털(SD) 카드, 메모리 스틱, 콤팩트 플래시(compact flash, CF) 카드 등의 임의의 개수의 임의의 조합을 포함할 수 있다. 메모리(404)는 또한, 단일 로직 구성요소로서 그룹화되는 메모리의 그룹(도 4에 미도시됨)일 수 있다.
버스(410)는 내부 버스(예컨대, CPU-메모리 버스), 외부 버스(예컨대, 통합 직렬 버스 포트(universal serial bus port,), 주변 구성요소 상호연결 고속 포트(peripheral component interconnect express port)) 등과 같은, 장치(400) 내의 구성요소 사이에서 데이터를 전송하는 통신 디바이스일 수 있다.
모호성을 야기하지 않으면서 설명의 용이함을 위해, 프로세서(402) 및 다른 데이터 처리 회로는 본 개시에서, 집합적으로 "데이터 처리 회로"로 지칭된다. 데이터 처리 회로는 전체적으로 하드웨어로 구현되거나, 또는 소프트웨어, 하드웨어 또는 펌웨어의 조합으로 구현될 수 있다. 덧붙여, 데이터 처리 회로는 단일 독립 모듈이거나, 또는 장치(400)의 임의의 다른 구성요소로 전체적으로 또는 부분적으로 결합될 수 있다.
장치(400)는 네트워크(예컨대, 인터넷, 인트라넷, 근거리 통신망, 모바일 통신 네트워크 등)와의 유선 통신 또는 무선 통신을 제공하기 위해 네트워크 인터페이스(406)를 더 포함할 수 있다. 일부 실시예에서, 네트워크 인터페이스(406)는 네트워크 인터페이스 제어기(network interface controller, NIC), 무선 주파수(radio frequency, RF) 모듈, 트랜스폰더(transponder), 트랜시버, 모뎀, 라우터, 게이트웨이, 유선 네트워크 어댑터, 무선 네트워크 어댑터, 블루투스 어댑터, 적외선 어댑터, 근거리 통신("NFC") 어댑터, 셀룰러 네트워크 칩 등의 임의의 개수의 임의의 조합을 포함할 수 있다.
일부 실시예에서, 장치(400)는 하나 이상의 주변 디바이스에 대한 연결을 제공하기 위한 주변 인터페이스(408)를 더 포함할 수 있다. 도 4에 도시된 바와 같이, 주변 디바이스는 커서 제어 디바이스(예컨대, 마우스, 터치패드 또는 터치스크린), 키보드, 디스플레이(예컨대, 음극선관 디스플레이, 액정 디스플레이 또는 발광 다이오드 디스플레이), 비디오 입력 디바이스(예컨대, 비디오 아카이브(video archive)에 통신 가능하게 결합된 입력 인터페이스 또는 카메라) 등을 포함할 수 있지만, 이에 제한되지 않는다.
비디오 코덱(예컨대, 프로세스(200A, 200B, 300A 또는 300B)를 수행하는 코덱)이 장치(400)에서 임의의 소프트웨어 또는 하드웨어 모듈의 임의의 조합으로 구현될 수 있다는 것이 유의되어야 한다. 예컨대, 프로세스(200A, 200B, 300A 또는 300B)의 일부 또는 모든 스테이지는 메모리(404)에 로딩될 수 있는 프로그램 명령어와 같은 장치(400)의 하나 이상의 소프트웨어 모듈로서 구현될 수 있다. 다른 예에 대해, 프로세스(200A, 200B, 300A 또는 300B)의 일부 또는 모든 스테이지는 특수화된 데이터 처리 회로(예컨대, FPGA, ASIC, NPU 등)와 같은 장치(400)의 하나 이상의 하드웨어 모듈로서 구현될 수 있다.
양자화 및 역양자화 기능 블록(예컨대, 도 2a 또는 도 2b의 양자화 스테이지(214) 및 역양자화 스테이지(218), 도 3a 또는 도 3b의 역양자화 스테이지(218))에서, 양자화 파라미터(QP)는 예측 잔차에 적용되는 양자화(및 역 양자화)의 양을 결정하기 위해 사용된다. 픽처 또는 슬라이스의 코딩을 위해 사용되는 초기 QP 값은, 예컨대, 픽처 파라미터 세트(Picture Parameter Set; PPS)에서의 init_qp_minus26 신택스 요소를 사용하고 슬라이스 헤더에서의 slice_qp_delta 신택스 요소를 사용하여 고레벨(high level)에서 시그널링될 수 있다. 또한, QP 값은 양자화 그룹의 입도(granularity)에서 전송된 델타 QP 값을 사용하여 각각의 CU에 대한 로컬 레벨에서 적응될 수 있다.
VVC 변환 스킵 모드에서, 잔차 블록(예컨대, 원본 블록과 예측 블록 사이의 차이)은 직접 양자화되고 엔트로피 코딩될 수 있다. 변환 프로세스는 TS(transform-skip) 모드에서 우회될 수 있다. 예컨대, 변수 transform_skip_flag는, TS 모드가 처리되도록 선택되는지를 나타내기 위해 변환 블록 레벨에서 시그널링될 수 있다. TS 모드는 무손실 압축에 효율적일 수 있다. 예컨대 TS 모드는 카메라 캡처 또는 스크린 콘텐츠 시퀀스에 효율적일 수 있다. 손실 압축의 경우에, TS 모드는 또한 카메라 뷰 콘텐츠와 혼합된 컴퓨터 생성 이미지 또는 그래픽(예컨대, 텍스트 스크롤링)과 같은 특정 유형의 비디오 콘텐츠에 대한 압축 프로세스를 개선할 수 있다. 변환 블록은 디코딩 프로세스의 변환으로부터 발생된 샘플들의 블록이고, 변환은 변환 계수들의 블록이 공간 도메인 값들의 블록으로 컨버팅되는 프로세스이다.
TS 모드 외에도, VVC는 또한 BDPCM(block differential pulse-code modulation) 모드를 채택한다. BDPCM 모드에서, 잔차 블록은 직접 양자화될 수 있고, 양자화된 잔차와 그의 예측자 양자화된 값 사이의 델타는 엔트로피 인코딩될 수 있다. 예측자 양자화된 값은 수평 또는 수직 방향일 수 있다. 변수 bdpcm_flag는, BDPCM이 적용되는지를 나타내기 위해 CU 레벨에서 전송될 수 있다. BDPCM이 적용되면, BDPCM 모드의 방향(예컨대, 수평 또는 수직)을 시그널링하기 위해 다른 플래그가 전송될 수 있다. 일부 예들에서, BDPCM 모드가 선택되면, transform_skip_flag의 값은 1인 것으로 추론될 수 있으며, 이는 현재 블록에 대해 변환 프로세스가 우회된다는 것을 시그널링한다.
VVC(예컨대, VVC 드래프트 8)에서, 스칼라 양자화 외에도, 종속 스칼라 양자화(dependent scalar quantization)가 또한 사용될 수 있다. 종속 스칼라 양자화에서, 변환 계수에 대한 허용 가능한 재구성 값의 세트는, 재구성 순서에서 현재 변환 계수 레벨에 선행하는 변환 계수 레벨의 값에 의존한다. SPS(sequence parameter set) 레벨 변수 sps_dep_quant_enabled_flag는 시퀀스 레벨에서 DQ(dependent quantization)를 인에이블하는 데 사용될 수 있다. 변수 sps_dep_quant_enabled_flag가 1과 같으면, 픽처에 대해 스칼라 양자화가 적용된다는 것을 나타내기 위해 다른 픽처 레벨 변수 ph_dep_quant_enabled_flag가 전송될 수 있다.
SDH(sign data hiding 은 코딩된 부호의 수를 줄이기 위한 HEVC 또는 VVC(예컨대, VVC 드래프트 8)의 메커니즘이다. 각각의 CG(coefficient group)에 대해, SDH가 인에이블된 경우, 0이 아닌 마지막 계수의 부호를 (예컨대, 역 스캔 순서로) 인코딩하는 것이 간단히 생략될 수 있다. 대신에, 미리 정의된 규칙을 사용하여 CG의 0이 아닌 계수 레벨의 합의 패리티에 부호 값이 임베딩될 수 있다. 예컨대, 짝수 합은 양의 패리티(예컨대, "+")에 대응할 수 있고, 홀수 합은 음의 패리티(예컨대, "-")에 대응할 수 있다. SDH를 사용하는 하나의 기준은 스캐닝 순서에서 CG의 0이 아닌 첫 번째 계수와 마지막 계수 사이의 거리이다. 예컨대, 이 거리가 4보다 크거나 같으면, 해당 Cg에 대해 SDH가 사용된다. VVC(예컨대, VVC 드래프트 8)에서, 현재 비디오 시퀀스에 대해 SDH가 인에이블되는지를 결정하는 SPS 레벨 게이팅 변수 sps_sign_data_hiding_enabled_flag가 있다. 변수 sps_sign_data_hiding_enabled_flag가 1과 같으면, 해당 픽처에서 SDH가 인에이블되는지를 나타내기 위해 픽처 헤더에서 다른 픽처 레벨 변수 pic_sign_data_hiding_enabled_flag가 시그널링될 수 있다.
DQ 및 SDH는 서로 충돌할 수 있다. 따라서, VVC 규격(예컨대, VVC 드래프트 8)은, 동일한 비디오 시퀀스에 대해 DQ 및 SDH 둘 모두가 인에이블되는 것(예컨대, sps_dep_quant_enabled_flag는 1과 같고 sps_sign_data_hiding_enabled_flag는 1과 같음)을 허용하지 않는다. 예컨대 sps_sign_data_hiding_enabled_flag는, sps_dep_quant_enabled_flag가 0과 같은 경우에만 시그널링될 수 있다. sps_dep_quant_enabled_flag가 1과 같은 경우, sps_sign_data_hiding_enabled_flag는 0인 것으로 추론된다.
VVC 코딩(예컨대, VVC 드래프트 8)에서, 2개의 잔차 코딩 방법, 즉, 정규 잔차 코딩 방법(예컨대, residual_coding) 및 변환 스킵 잔차 코딩 방법(residual_ts_coding)이 존재한다. 정규 잔차 코딩에서, 0이 아닌 각각의 계수의 부호는 우회 모드의 제3 스캔 패스에서 코딩된다. CG의 마지막 부호는, CG에 대해 SDH가 인에이블되는지에 의존하여 코딩되거나 은닉될 수 있다. TS 블록 및 BDPCM 블록 둘 모두는 정규 잔차 코딩 또는 TS 잔차 코딩 중 어느 하나를 선택하도록 허용된다. 슬라이스 레벨 플래그 또는 변수 slice_ts_residual_coding_disabled_flag가 0과 동일한 값을 갖는 경우, 해당 슬라이스의 TS 및 BDPCM 모드에서 코딩된 블록은 블록의 잔차 코딩 프로세스로서 residual_ts_coding을 선택한다. 슬라이스 레벨 플래그 slice_ts_residual_coding_disabled_flag의 값이 1과 같으면, 해당 슬라이스의 TS 및 BDPCM 코딩된 블록은 블록의 잔차 코딩 프로세스로서 정규 잔차 코딩(예컨대, 잔차 코딩) 방법을 선택한다.
다음 조건 둘 모두가 충족되면, 비-BDPCM을 갖는 TS 및 BDPCM 블록을 갖는 TS는 SDH를 사용하도록 허용된다. 1) 변수 slice_ts_residual_coding_disabled_flag는 1과 동일하고, 그리고 2) 변수 pic_sign_data_hiding_enabled_flag는 1과 동일하다. SDH가 인에이블될 때, 엔트로피 코딩 또는 디코딩된 블록의 각각의 CG는 다음 2개의 조건 중 적어도 하나를 충족시켜야 한다. 1) 계수의 절대값의 합이 짝수이고, 좌측 상부 계수의 부호가 양이거나, 또는 2) 계수의 절대값의 합이 홀수이고 좌측 상부 계수의 부호가 음이다. CG 중 어느 것도 위에서 언급된 조건 중 어느 하나를 충족시키지 않는 경우, 인코더는, 위에서 언급된 조건 중 하나가 충족됨을 보장하기 위해 CG의 계수 중 하나의 절대값을 조정할 수 있다.
도 5는 본 개시의 일부 실시예에 따른, TS 및 BDPCM 블록에 대한 SDH를 허용하거나 허용하지 않는 지원 조건을 포함하는 예시적인 표를 도시한다. 도 5에 도시된 바와 같이, pic_sign_data_hiding_enabled_flag가 1의 값을 갖고, slice_ts_residual_coding_disabled_flag가 0의 값을 갖는 경우, SDH가 디스에이블된다. pic_sign_data_hiding_enabled_flag가 1의 값을 갖고 slice_ts_residual_coding_disabled_flag가 1의 값을 갖는 경우, SDH가 인에이블된다.
현재 설계(예컨대, VVC 드래프트 8)에는 많은 문제가 있다. 첫째, VVC 설계는, 위에서 언급된 SDH 조건을 보장하기 위해 BDPCM 블록의 계수 값을 조정하는 효율적인 인코딩 알고리즘이 없더라도, BDPCM 블록이 SDH를 사용하는 것을 허용한다. 도 6a는 본 개시의 일부 실시예에 따른, 조정 이전의 BDPCM 블록의 예시적인 인코더 조정을 도시한다. 도 6b는 본 개시의 일부 실시예에 따른, 조정 후의 BDPCM 블록의 예시적인 인코더 조정을 도시한다. 조정 전의 계수가 도 6a에 도시된다. 도 6a에 도시된 바와 같이, 수평 BDPCM 블록의 계수들의 합은 홀수(예컨대, 211)이고, 좌측 상부 계수의 부호(예컨대, 숫자 14의 부호)는 양이다. 이것은 SDH에 대한 필요 조건을 충족시키지 않는다. 결과적으로, 인코딩에서 조정이 필요하다. 조정 후의 계수가 도 6b에 도시된다. 도 6b에 도시된 바와 같이, 절대값의 합을 짝수(예컨대, 212)로 만들기 위해 값 -21을 -22(굵게 표시)로 변경하기 위한 인코더 조정이 이루어졌다. 결과적으로, CG는 SDH에 대한 필요 조건을 충족시킬 수 있다. 그러나, 하나의 계수 값을 변경하는 것은 훨씬 더 많은 계수에 영향을 줄 수 있다. 도 6b에 도시된 바와 같이, 도 6a에 도시된 값 -12, -2, 4, -1, -1, -1이 모두 변경(굵게 표시)되었고, 오류가 전파된다. 이러한 오류 전파는 SDH를 갖는 BDPCM가 압축 성능 측면에서 효율성이 떨어지게 한다.
VVC의 현재 설계(예컨대, VVC 드래프트 8)의 또 다른 문제는 무손실 압축을 수행하는 능력이다. 무손실 압축에서, 정규 잔차 코딩(예컨대, 변수 slice_ts_residual_coding_disabled_flag가 1과 동일함)은 TS 잔차 코딩(예컨대, 변수 slice_ts_residual_coding_disabled_flag가 0과 동일함)보다 더 높은 압축 이득을 달성할 수 있다. 결과적으로, slice_ts_residual_coding_disabled_flag가 1과 동일하다는 조건의 중요한 용도 중 하나는 무손실 압축을 위한 것이다. SDH가 손실 코딩 도구이기 때문에, 이는 항상 무손실 결과를 생성할 수는 없다. 무손실 압축을 달성하기 위해, 부호 데이터 은닉이 허용되지 않을 필요가 있을 수 있다. 대안적인 접근법으로서, slice_ts_residual_coding_disabled_flag == 1 및 부호 데이터 은닉의 조합이 허용되지 않을 수 있다.
신택스 중복(syntax redundancy)은 또 다른 문제이다. VVC(예컨대, VVC 드래프트 8) 규격은 slice_ts_residual_coding_disabled_flag가 1과 동일한 조건 및 pic_sign_data_hiding_enabled_flag가 1과 동일한 조건의 조합을 지원한다. 그러나, 위에서 언급된 단점에 기초하여, 정규 잔차 코딩(예컨대, slice_ts_residual_coding_disabled_flag가 1과 동일함)과 부호 데이터 은닉(예컨대, pic_sign_data_hiding_enabled_flag가 1과 동일함)의 조합은 유용한 구성이 아니다. 결과적으로, 이러한 조합을 허용하지 않는 것은 신택스 중복을 감소시킬 수 있다.
본 개시내용의 실시예는 위에서 설명된 문제를 해결하기 위한 방법을 제공한다. 일부 실시예에서, SDH는, slice_ts_residual_coding_disabled_flag의 값에 관계없이, 비-BDPCM 블록을 갖는 TS 및 BDPCM 블록을 갖는 TS 둘 모두에 대해 디스에이블된다. 도 7은 본 개시의 일부 실시예에 따른, 부호 데이터 은닉을 디스에이블하는 조건을 포함하는 예시적인 표를 도시한다. 도 7에 도시된 바와 같이, 변수 transform_skip_flag는 변수 slice_ts_residual_coding_disabled_flag에 대한 값에 관계없이 1로 설정된다. 블록이 BDPCM 모드에서 코딩되면, 변수 transform_skip_flag가 1인 것으로 추론될 수 있다고 어서팅된다(asserted).
도 8은 본 개시의 일부 실시예에 따른, 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 8에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵은 이탤릭체로 도시되고, 제안된 삭제 신택스는 취소선으로 추가로 표시된다. 예컨대, 변수 transform_skip_flag가 1과 같으면, 부호 데이터 은닉이 디스에이블된다. 또한, 변수 ph_dep_quant_enabled_flag의 중복 조건 검사가 제거될 수 있다. VVC 규격에 따르면, 플래그 pic_sign_data_hiding_enabled_flag 및 ph_dep_quant_enabled_flag 둘 모두가 1의 값을 갖는 어떠한 유효한 경우도 없다.
일부 실시예에서, 변수 slice_ts_residual_coding_disabled_flag의 값에 관계없이, 블록이 BDPCM 모드에서 코딩되면(예컨대, 변수 BdpcmFlag는 1과 동일하면), SDH는 디스에이블된다. 그러나, 변수 slice_ts_residual_coding_disabled_flag가 1과 같으면, 비-BDPCM 모드를 갖는 TS 블록의 SDH가 허용될 수 있다. slice_ts_residual_coding_disabled_flag가 0과 같으면, (BDPCM이 있거나 없는 경우) TS 블록의 SDH가 디스에이블된다. 도 9는 본 개시의 일부 실시예에 따른, 변환 스킵 모드 및 블록 차동 펄스 코드 변조 모드에 대한 부호 데이터 은닉을 허용하는 조건을 포함하는 예시적인 표를 도시한다. 도 9에 도시된 바와 같이, 비-BDPCM 모드(예컨대, 변수 BdpcmFlag가 0과 동일함)에서, 변수 slice_ts_residual_coding_disabled_flag가 1과 같으면, SDH가 인에이블될 수 있다.
도 10은 본 개시의 일부 실시예에 따른, 도 9에 도시된 조건에 대한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 10에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵은 이탤릭체로 도시되고, 제안된 삭제 신택스는 취소선으로 추가로 표시된다. 예컨대 BdpcmFlag가 0과 같으면, SDH가 디스에이블된다(예컨대, signHidden은 0과 같다). 또한, 변수 ph_dep_quant_enabled_flag의 중복 조건 검사를 신택스로부터 제거될 수 있다.
일부 실시예에서, 변수 slice_ts_residual_coding_disabled_flag가 1과 동일한 경우, 모든 코딩된 블록(예컨대, TS 및 비-TS 블록 둘 모두)에 대해 부호 데이터 은닉이 디스에이블된다. 이것은, 변수 slice_ts_residual_coding_disabled_flag가 1과 같을 때, 슬라이스가 무손실 모드에서 코딩될 가능성이 더 높기 때문이며, 이 경우에 SDH가 적합하지 않을 수 있다. 도 11은 본 개시의 일부 실시예에 따른, 부호 데이터 은닉을 디스에이블하기 위한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 11에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵은 이탤릭체로 도시되고, 제안된 삭제 신택스는 취소선으로 추가로 표시된다. 예컨대, 변수 slice_ts_residual_coding_disabled_flag가 1과 같을 때, SDH가 디스에이블된다.
일부 실시예에서, 슬라이스의 부호 데이터 은닉을 제어하기 위해 슬라이스 레벨 부호 데이터 은닉 플래그(예컨대, 변수 slice_sign_data_hiding_enabled_flag)가 도입될 수 있다. 예컨대, 변수 slice_sign_data_hiding_enabled_flag가 0과 같으면, 현재 슬라이스에 대해 부호 비트 은닉이 디스에이블된다. 변수 slice_sign_data_hiding_enabled_flag가 1과 같으면, 현재 슬라이스에 대해 부호 비트 은닉이 인에이블된다. 일부 실시예에서, 변수 slice_sign_data_hiding_enabled_flag가 존재하지 않을 때, 변수는 0과 동일한 것으로 추론된다.
일부 실시예에서, 주어진 슬라이스에 대해, 부호 데이터 은닉 및 slice_ts_residual_coding_disabled_flag ==1 둘 모두가 디스에이블된다. 더 구체적으로 다음 조합은 허용되지 않는다.
a. slice_sign_data_hiding_enabled_flag는 1과 같고, 그리고
b. slice_ts_residual_coding_disabled_flag는 1과 같다.
일부 실시예에서, 다음 조건 둘 모두가 충족되면, 변수 slice_sign_data_hiding_enabled_flag가 시그널링된다: 1) 변수 pic_sign_data_hiding_enabled_flag는 1과 같고 ― 이는 현재 픽처가 SDH를 허용한다는 것을 의미함 ― , 그리고 2) slice_ts_residual_coding_disabled_flag는 0과 같다 ― 이는 SDH가 유용한 도구가 될 수 있는 손실 모드에서 슬라이스가 코딩될 가능성이 있음을 의미함 ― .
도 12는 본 개시의 일부 실시예에 따른, 슬라이스 레벨 부호 데이터 은닉 플래그의 제어를 위한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 10에 도시된 바와 같이, 이전 VVC로부터의 변화는 굵은 이탤릭체로 표시된다. 예컨대, 도 10에 도시된 바와 같이, 새로운 변수 slice_sign_data_hiding_enabled_flag가 추가된다.
일부 실시예에서, slice_sign_data_hiding_enabled_flag가 1과 동일하지 않은 경우, 슬라이스 레벨 slice_ts_residual_coding_disabled_flag가 시그널링된다. 이것은, 동일한 슬라이스에서 slice_ts_residual_coding_disabled_flag 및 slice_sign_data_hiding_enabled_flag 둘 모두의 조합이 인에이블되는 것을 허용하지 않는 방법 중 하나이다.
도 13은 본 개시의 일부 실시예에 따른, 슬라이스 레벨 부호 데이터 은닉 플래그의 제어를 위한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 13에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵게 표시되고, 제안된 삭제된 신택스는 취소선으로 추가로 표시된다. 예컨대, 변수 slice_sign_data_hiding_enabled_flag가 0과 같을 때, 변수 ph_dep_quant_enabled_flag 또는 pic_sign_data_hiding_enabled_flag의 값에 관계없이, SDH가 디스에이블된다.
일부 실시예에서, 변수 slice_ts_residual_coding_disabled_flag의 시그널링 이전에 변수 slice_sign_data_hiding_enabled_flag가 시그널링될 수 있고, 변수 slice_sign_data_hiding_enabled_flag가 0과 동일한 경우 변수 slice_ts_residual_coding_disabled_flag가 조건부로 시그널링될 수 있다. 도 14는 본 개시의 일부 실시예에 따른, 슬라이스 레벨 부호 데이터 은닉 플래그에 대한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 14에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵게 표시된다. 예컨대, pic_sign_data_hidnig_enabled_flag가 1과 같은 경우, slice_sign_data_hiding_enabled_flag가 설정될 수 있다. 도 14에 도시된 바와 같이, 슬라이스 레벨에서 변수 slice_sign_data_hiding_enabled_flag의 시그널링은 픽처 레벨에서 변수 pic_sign_data_hiding_enabled_flag를 조건으로 한다. 또한, 변수 slice_ts_residual_coding_disabled_flag의 시그널링은 변수 slice_sign_data_hiding_enabled_flag를 조건으로 한다.
일부 실시예에서, 변수 slice_sign_data_hiding_enabled_flag의 시그널링 및 변수 slice_ts_residual_coding_disabled_flag의 시그널링은 서로 독립적으로 처리될 수 있다. 다시 말해서, 하나의 시그널링은 남은 하나의 시그널링을 조건으로 하지 않는다. 일부 실시예에서, 이것은, 인코더가 이미 무손실 모드에 있더라도, 값 0의 변수 slice_sign_data_hiding_enabled_flag를 전송하도록 인코더에 요구할 수 있다. 결과적으로, 신택스 중복이 생성될 수 있다. 그럼에도 불구하고, 이것은 손실 코딩 효율성을 개선하기 위해 TS 및 BDPCM 블록에 대해 정규 잔차 코딩 및 SDH를 함께 사용하는 미래의 유연성을 생성할 수 있다.
일부 실시예에서, 슬라이스 레벨 변수 slice_ts_residual_coding_disabled_flag는 슬라이스 레벨 무손실 변수, 즉 slice_lossless_flag로 대체될 수 있다. 일부 실시예에서, 변수 slice_lossless_flag에 대한 1의 값은, 현재 슬라이스가 무손실 코딩되고 해당 슬라이스의 모든 잔차 블록이 잔차 샘플을 파싱하기 위해 residual_coding() 신택스를 사용한다는 것을 나타낸다. 변수 slice_lossless_flag에 대한 0의 값은, 현재 슬라이스가 무손실 코딩되지 않았음을 나타낸다. 일부 실시예에서, 변수 slice_lossless_flag가 존재하지 않을 때, 이것은 0과 동일한 것으로 추론된다.
도 15는 본 개시의 일부 실시예에 따른, 슬라이스 레벨 무손실 플래그에 대한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 15에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵은 이탤릭체로 도시되고, 제안된 삭제 신택스는 취소선으로 추가로 표시된다. 예컨대, 변수 slice_lossless_flag가 추가되어 신택스에 통합된다. 변수 slice_lossless_flag는 슬라이스 유형의 시그널링 후에 시그널링된다. 변수 slice_lossless_flag가 1과 같으면, 루프 필터(예컨대, 적응형 루프 필터, 샘플 적응형 오프셋, 디블로킹 필터 및 크로마 스케일링을 갖는 루마 매핑)의 일부 또는 전부가 무손실 슬라이스에 대해 디스에이블될 수 있다. 예컨대, 변수 slice_lossless_flag가 1과 같으면, 변수 slice_alf_enabled_flag, slice_sao_luma_flag, slice_deblocking_filter_override_flag 및 slice_lmcs_enabled_flag는 시그널링되지 않는다.
도 16은 본 개시의 일부 실시예에 따른, 슬라이스 레벨 무손실 플래그에 대한 잔차 코딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 16에 도시된 바와 같이, 이전 VVC로부터의 변화가 굵은 이탤릭체로 도시되고, 제안된 삭제 신택스는 취소선으로 추가로 표시된다. 예컨대, 변수 slice_lossless_flag가 추가되어 신택스에 통합된다. 일부 실시예에서, 도 16에 도시된 바와 같이, 변수 slice_lossless_flag는, 잔차 코딩을 위한 조건을 결정하는 데 있어서 변수 slice_ts_residual_coding_disabled_flag를 대체할 수 있다.
일부 실시예에서, 변수 pic_sign_data_hiding_enabled_flag 및 slice_ts_residual_coding_disabled_flag의 값 둘 모두는 1과 같을 수 없다. pic_sign_data_hiding_enabled_flag가 1과 같을 때, 코덱은 손실 모드에서 동작할 가능성이 가장 높으며, 0과 동일한 변수 slice_ts_residual_coding_disabled_flag를 사용할 가능성은 손실 압축에서 매우 높다. 결과적으로, 신택스 중복을 줄이기 위해, 변수 pic_sign_data_hiding_enabled_flag가 1과 같으면, 변수 slice_ts_residual_coding_disabled_flag는 0인 것으로 추론될 수 있다. 변수 pic_sign_data_hiding_enabled_flag가 0과 같은 경우에만, 변수 slice_ts_residual_coding_disabled_flag가 시그널링된다. 도 17은 본 개시의 일부 실시예에 따른, 신택스 중복이 감소된 슬라이스 헤딩 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 17에 도시된 바와 같이, 이전 VVC로부터의 변화는 굵은 이탤릭체로 표시된다. 예컨대, 변수 pic_sign_data_hiding_enabled_flag가 0과 같을 때, 변수 slice_ts_residual_coding_disabled_flag는 1과 같다.
일부 실시예에서, 주어진 픽처에 대해, 부호 데이터 은닉 및 종속 양자화는 동시에 지원될 수는 없다. 결과적으로, 변수 ph_dep_quant_enabled_flag 및 pic_sign_data_hiding_enabled_flag는 동시에 1과 동일하지 않을 수 있다. 이 조합을 피하기 위해, 변수 ph_dep_quant_enabled_flag가 1과 같으면, 변수 slice_ts_residual_coding_disabled_flag가 시그널링된다. 도 18은 본 개시의 일부 실시예에 따른, 부호 데이터 은닉 및 종속 양자화의 조건에 대한 슬라이스 헤더 신택스의 일부를 포함하는 예시적인 신택스를 도시한다. 도 18에 도시된 바와 같이, 이전 VVC로부터의 변화는 굵은 이탤릭체로 표시된다. 예컨대, 도 18에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag가 1과 같으면, 변수 slice_ts_residual_coding_disabled_flag가 시그널링된다.
일부 실시예에서, 주어진 슬라이스에 대해, 종속 양자화 및 slice_ts_residual_coding_disabled_flag == 1은 동시에 지원될 수 없다. 이 조합을 피하기 위해, 변수 ph_dep_quant_enabled_flag가 1과 같으면, 변수 slice_ts_residual_coding_disabled_flag가 시그널링되지 않는다.
일부 실시예에서, slice_sign_data_hiding_enabled_flag 및 ph_dep_quant_enabled_flag 둘 모두가 0이 아닌 값인 경우에, slice_ts_residual_coding_disabled_flag가 시그널링된다. 더 구체적으로,
if (!slice_sign_data_hiding_enabled_flag && ! ph_dep_quant_enabled_flag)
signal _residual_coding_disabled_flag
본 개시의 실시예들은 추가로 비디오 코딩을 수행하기 위한 방법들을 제공한다. 도 19는 본 개시의 일부 실시예에 따른, 변환 스킵 모드 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 19에 도시된 방법(19000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 19에 도시된 방법(19000)은 도 8에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 19에 도시된 방법(19000)은 VVC 표준에 따라 수행된다.
단계(S19010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S19020)에서, 비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지가 결정된다. 예컨대, 도 8에 도시된 바와 같이, 비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하기 위해 변수 transform_skip_flag가 사용될 수 있다.
단계(S19030)에서, 비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉이 턴 오프된다. 예컨대, 도 8에 도시된 바와 같이, 변수 transform_skip_flag가 0과 같을 때, 변수 signHidden은 0으로 설정된다. 결과적으로, 잔차 코딩에 대한 부호 데이터 은닉이 턴 오프된다. 일부 실시예에서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지에 의존하지 않는다. 예컨대, 도 8에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag는 변수 signHidden에 대한 조건으로부터 제거된다. 다시 말해서, signHidden의 값은 변수 ph_dep_quant_enabled_flag에 의존하지 않는다. 일부 실시예에서, 비-BDPCM 블록을 갖는 TS 및 BDPCM 블록을 갖는 TS 둘 모두에 대한 부호 데이터 은닉을 턴 오프하는 것은 압축 성능의 효율성을 증가시킬 수 있다. 예컨대, 도 6에 도시된 오류 전파는 부호 데이터 은닉을 턴 오프함으로써 제거될 수 있다.
도 20은 본 개시의 일부 실시예에 따른, 블록 차동 펄스 코드 변조 모드 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 20에 도시된 방법(20000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 20에 도시된 방법(20000)은 도 10에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 20에 도시된 방법(20000)은 VVC 표준에 따라 수행된다.
단계(S20010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S20020)에서, 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지가 결정된다. 일부 실시예에서, 비디오 프레임이 블록 레벨에서 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지가 결정된다. 예컨대, 도 10에 도시된 바와 같이, 변수 BdpcmFlag는, 비디오 프레임이 블록 레벨에서 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 데 사용될 수 있다.
단계(S20030)에서, 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉이 턴 오프된다. 예컨대, 도 10에 도시된 바와 같이, 변수 BdpcmFlag가 0과 같을 때, 변수 signHidden은 0으로 설정된다. 결과적으로, 잔차 코딩에 대한 부호 데이터 은닉이 턴 오프된다. 일부 실시예에서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지에 의존하지 않는다. 예컨대, 도 10에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag는 변수 signHidden에 대한 조건으로부터 제거된다. 다시 말해서, signHidden의 값은 변수 ph_dep_quant_enabled_flag에 의존하지 않는다. 일부 실시예에서, BDPCM 블록을 갖는 TS에 대한 부호 데이터 은닉을 턴 오프하는 것은 압축 성능의 효율성을 증가시킬 수 있다. 예컨대, 도 6에 도시된 오류 전파는 부호 데이터 은닉을 턴 오프함으로써 제거될 수 있다.
도 21은 본 개시의 일부 실시예에 따른, 변환 스킵 잔차 코딩 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 21에 도시된 방법(21000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 21에 도시된 방법(21000)은 도 11에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 21에 도시된 방법(21000)은 VVC 표준에 따라 수행된다.
단계(S21010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S21020)에서, 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지가 결정된다. 예컨대, 도 11에 도시된 바와 같이, 변수 slice_ts_residual_coding_disabled_flag는, 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 데 사용될 수 있다.
단계(S21030)에서, 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않았다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉이 턴 오프된다. 예컨대, 도 11에 도시된 바와 같이, 변수 slice_ts_residual_coding_disabled_flag가 1과 같을 때, 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다고 결정된다. 결과적으로, 변수 signHidden은 0으로 설정되고, 잔차 코딩에 대한 부호 데이터 은닉은 턴 오프된다. 일부 실시예에서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지에 의존하지 않는다. 예컨대, 도 11에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag는 변수 signHidden에 대한 조건으로부터 제거된다. 다시 말해서, signHidden의 값은 변수 ph_dep_quant_enabled_flag에 의존하지 않는다. 일부 실시예에서, 부호 데이터 은닉은 손실 코딩 도구이다. 정규 잔차 코딩(예컨대, slice_ts_residual_coding_disabled_flag은 1과 동일함)은 TS 잔차 코딩보다 더 많은 압축 이득을 달성할 수 있다. 따라서, 변수 slice_ts_residual_coding_disabled_flag가 1과 같을 때, 수행되는 압축은 무손실 압축일 수 있다. 결과적으로, 부호 데이터 은닉이 턴 오프될 수 있다.
도 22는 본 개시의 일부 실시예에 따른, 픽처 레벨에서 변환 스킵 잔차 코딩 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 22에 도시된 방법(22000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 22에 도시된 방법(22000)은 도 12에 도시된 신택스 또는 도 13에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 22에 도시된 방법(22000)은 VVC 표준에 따라 수행된다.
단계(S22010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S22020)에서, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지가 결정된다. 예컨대, 도 12에 도시된 바와 같이, 변수 pic_sign_data_hiding_enabled_flag는, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 데 사용될 수 있고, 변수 slice_ts_residual_coding_disabled_flag는, 비디오 프레임이 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 데 사용될 수 있다.
단계(S22030)에서, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 부호 데이터 은닉은 비디오 프레임에 대한 슬라이스 레벨에서 턴 온된다. 예컨대, 도 12에 도시된 바와 같이, 변수 pic_sign_data_hiding_enabled_flag가 1과 같을 때, 비디오 프레임에 대한 픽처 레벨에서 부호 데이터 은닉이 인에이블된다고 결정된다. 추가로, 변수 slice_ts_residual_coding_disabled_flag가 1과 같을 때, 비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않았다고 결정된다. 결과적으로, 변수 slice_sign_data_hiding_enabled_flag는 1로 설정되고, 부호 데이터 은닉은 슬라이스 레벨에서 턴 온된다. 일부 실시예에서, 부호 데이터 은닉은 손실 코딩 도구이다. 정규 잔차 코딩(예컨대, slice_ts_residual_coding_disabled_flag은 1과 동일함)은 변환 스킵 잔차 코딩보다 더 많은 압축 이득을 달성할 수 있다. 따라서, 변환 스킵 잔차 코딩은 손실 압축일 수 있다. 결과적으로, 부호 데이터 은닉이 턴 온될 수 있다.
일부 실시예에서, 방법(22000)은 단계(S22040 및 S22050)를 더 포함한다. 단계(S22040)에서, 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지가 결정된다. 예컨대, 도 13에 도시된 바와 같이, 변수 slice_sign_data_hiding_enabled_flag는, 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하기 위해 검사될 수 있다.
단계(S22050)에서, 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 잔차 코딩을 위해 부호 데이터 은닉이 턴 오프된다. 예컨대, 도 13에 도시된 바와 같이, 변수 slice_sign_data_hiding_enabled_flag가 0과 같을 때, 변수 signHidden은 0으로 설정되고, 잔차 코딩을 위해 부호 데이터 은닉이 턴 오프된다. 일부 실시예에서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지에 의존하지 않는다. 예컨대, 도 13에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag는 변수 signHidden에 대한 조건으로부터 제거된다. 다시 말해서, signHidden의 값은 변수 ph_dep_quant_enabled_flag에 의존하지 않는다.
도 23은 본 개시의 일부 실시예에 따른, 픽처 레벨에서 부호 데이터 은닉, 슬라이스 레벨에서 부호 데이터 은닉, 및 슬라이스 레벨에서 변환 스킵 잔차 코딩을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 23에 도시된 방법(23000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 23에 도시된 방법(23000)은 도 14에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 23에 도시된 방법(23000)은 VVC 표준에 따라 수행된다.
단계(S23010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S23020)에서, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지가 결정된다. 예컨대, 도 14에 도시된 바와 같이, 변수 pic_sign_data_hiding_enabled_flag는, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 데 사용될 수 있다.
단계(S23030)에서, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 부호 데이터 은닉은 비디오 프레임에 대한 슬라이스 레벨에서 턴 온된다. 예컨대, 도 14에 도시된 바와 같이, 변수 pic_sign_data_hiding_enabled_flag가 1과 같을 때, 비디오 프레임에 대한 픽처 레벨에서 부호 데이터 은닉이 인에이블된다고 결정된다. 결과적으로, 변수 slice_sign_data_hiding_enabled_flag는 1로 설정되고, 부호 데이터 은닉은 슬라이스 레벨에서 턴 온된다.
단계(S23040)에서, 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지가 결정된다. 예컨대, 도 14에 도시된 바와 같이, 변수 slice_sign_data_hiding_enabled_flag는, 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하기 위해 검사된다.
단계(S23050)에서, 부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 변환 스킵 잔차 코딩은 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다. 예컨대, 도 14에 도시된 바와 같이, 변수 slice_sign_data_hiding_enabled_flag가 0과 같으면, 변수 slice_ts_residual_coding_disabled_flag는 1로 설정되고, 변환 스킵 잔차 코딩은 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다. 일부 실시예에서, 부호 데이터 은닉은 손실 코딩 도구이다. 정규 잔차 코딩(예컨대, slice_ts_residual_coding_disabled_flag은 1과 동일함)은 변환 스킵 잔차 코딩보다 더 많은 압축 이득을 달성할 수 있다. 따라서, 변환 스킵 잔차 코딩은 손실 압축일 수 있다. 부호 데이터 은닉이 턴 오프될 때, 슬라이스 레벨에서 변환 스킵 잔차 코딩이 또한 턴 오프될 수 있다.
도 24는 본 개시의 일부 실시예에 따른, 무손실 코딩 모드 및 부호 데이터 은닉을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 24에 도시된 방법(24000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 24에 도시된 방법(24000)은 도 15에 도시된 신택스 또는 도 16에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 24에 도시된 방법(24000)은 VVC 표준에 따라 수행된다.
단계(S24010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S24020)에서, 비디오 프레임이 무손실 모드에서 코딩되는지가 결정된다. 일부 실시예에서, 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지가 결정된다. 예컨대, 도 15에 도시된 바와 같이, 변수 slice_lossless_flag는, 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 데 사용될 수 있다.
단계(S24030)에서, 비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 하나 이상의 루프 필터는 슬라이스 레벨에서 턴 오프된다. 예컨대, 도 15에 도시된 바와 같이, 변수 slice_alf_enabled_flag, slice_sao_luma_flag, slice_deblocking_filter_override_flag, 및 slice_lmcs_enabled_flag는, 변수 slice_lossless_flag가 1과 같은 경우 시그널링되지 않는다. 일부 실시예에서, 하나 이상의 루프 필터를 턴 오프하는 것은 비디오 코딩을 더 효율적으로 만들 수 있다.
도 25는 본 개시의 일부 실시예에 따른, 픽처 레벨에서 부호 데이터 은닉 및 슬라이스 레벨에서 변환 스킵 잔차 코딩을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 25에 도시된 방법(25000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 25에 도시된 방법(25000)은 도 17에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 25에 도시된 방법(25000)은 VVC 표준에 따라 수행된다.
단계(S25010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S25020)에서, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지가 결정된다. 예컨대, 도 17에 도시된 바와 같이, 변수 pic_sign_data_hiding_enabled_flag는, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 데 사용될 수 있다.
단계(S25030)에서, 부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 변환 스킵 잔차 코딩은 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다. 예컨대, 도 17에 도시된 바와 같이, 변수 pic_sign_data_hiding_enabled_flag가 검사된다. 변수 pic_sign_data_hiding_enabled_flag가 0과 같으면, 변수 slice_ts_residual_coding_disabled_flag가 시그널링된다. 결과적으로, 변환 스킵 잔차 코딩은 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다. 일부 실시예에서, 정규 잔차 코딩(예컨대, slice_ts_residual_coding_disabled_flag == 1)과 부호 데이터 은닉(예컨대, pic_sign_data_hiding_enabled_flag == 1)의 조합은 유용한 구성이 아니다. 따라서 이 조합을 허용하지 않는 것은 신택스 중복을 감소시킬 수 있다.
도 26은 본 개시의 일부 실시예에 따른, 슬라이스 레벨에서 종속 양자화 및 변환 스킵 잔차 코딩을 갖는 예시적인 비디오 코딩 방법의 흐름도를 도시한다. 일부 실시예에서, 도 26에 도시된 방법(26000)은 도 4에 도시된 장치(400)에 의해 수행될 수 있다. 일부 실시예에서, 도 26에 도시된 방법(26000)은 도 18에 도시된 신택스에 따라 실행될 수 있다. 일부 실시예에서, 도 26에 도시된 방법(26000)은 VVC 표준에 따라 수행된다.
단계(S26010)에서, 코딩을 위한 비디오 프레임이 수신된다. 일부 실시예에서, 비디오 프레임은 비트스트림에 있다. 일부 실시예에서, 비디오 프레임은 잔차 코딩을 위해 수신된다.
단계(S26020)에서, 비디오 프레임에 대해 종속 양자화가 인에이블되는지가 결정된다. 예컨대, 도 18에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag는, 종속 양자화가 비디오 프레임에 대해 인에이블되는지를 결정하는 데 사용될 수 있다.
단계(S26030)에서, 비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 변환 스킵 잔차 코딩은 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다. 예컨대, 도 18에 도시된 바와 같이, 변수 ph_dep_quant_enabled_flag가 검사된다. 변수 ph_dep_quant_enabled_flag가 1과 같으면, 변수 slice_ts_residual_coding_disabled_flag가 시그널링된다. 결과적으로, 변환 스킵 잔차 코딩은 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다. 일부 실시예에서, 정규 잔차 코딩(예컨대, slice_ts_residual_coding_disabled_flag == 1)과 부호 데이터 은닉(예컨대, pic_sign_data_hiding_enabled_flag == 1)의 조합은 유용한 구성이 아니다. 따라서 이 조합을 허용하지 않는 것은 신택스 중복을 감소시킬 수 있다.
일부 실시예에서, 명령어를 포함하는 비일시적 컴퓨터 판독 가능 저장 매체가 또한 제공되고, 명령어는 전술한 방법을 수행하게 하도록 디바이스(이를테면, 개시된 인코더 및 디코더)에 의해 실행될 수 있다. 비일시적 매체의 일반적인 형태는, 예컨대, 플로피 디스크, 플렉서블 디스크, 하드 디스크, 솔리드 스테이트 드라이브, 자기 테이프 또는 임의의 다른 자기 데이터 저장 매체, CD-ROM, 임의의 다른 광학 데이터 저장 매체, 홀의 패턴을 갖는 임의의 물리적 매체, RAM, PROM 및 EPROM, FLASH-EPROM 또는 다른 임의의 플래시 메모리, NVRAM, 캐시, 레지스터, 임의의 다른 메모리 칩 또는 카트리지, 및 이들의 네트워크 버전을 포함한다. 디바이스는 하나 이상의 프로세서(CPU), 입력/출력 인터페이스, 네트워크 인터페이스 및/또는 메모리를 포함할 수 있다.
본원에서 "제1" 및 "제2"와 같은 관계 용어는 엔티티 또는 동작을 다른 엔티티 또는 동작과 구분하기 위해서만 사용되며, 이러한 엔티티 또는 동작 간의 임의의 실제 관계 또는 시퀀스를 요구하거나 암시하지 않는다는 것이 유의되어야 한다. 더욱이, 포함하는(comprising), "갖는(having)", "포함하는(containing)" 및 "포함하는(including)"이라는 단어 및 다른 유사한 형태는 그 의미가 동등하고, 이러한 단어 중 어느 하나를 따르는 항목 또는 항목들이 이러한 항목 또는 항목들의 철저한 열거(exhaustive listing)를 의미하지 않거나 또는 열거된 항목 또는 항목만으로 제한되는 것을 의미하지 않는다는 점에서, 제약을 두지 않는 것으로(open-ended) 의도된다.
본원에서 사용된 바와 같이, 달리 구체적으로 언급되지 않는 한, "또는"이란 용어는 실행 불가능한 경우를 제외하고 모든 가능한 조합을 포함한다. 예컨대, 데이터베이스가 A 또는 B가 포함될 수 있다고 명시되어 있으면, 달리 구체적으로 명시되지 않거나 실행 불가능한 경우를 제외하고, 데이터베이스는 A 또는 B, 또는 A 및 B를 포함할 수 있다. 제2 예시로서, 데이터베이스가 A, B 또는 C를 포함할 수 있다고 명시되어 있으면, 달리 구체적으로 명시되지 않거나 실행 불가능한 경우를 제외하고, 데이터베이스는 A 또는 B 또는 C, 또는 A 및 B, 또는 A 및 C, 또는 B 및 C, 또는 A 및 B 및 C를 포함할 수 있다.
상술한 실시예는 하드웨어 또는 소프트웨어(프로그램 코드), 또는 하드웨어 및 소프트웨어의 조합에 의해 구현될 수 있다는 것이 인식된다. 소프트웨어로 구현되는 경우, 이는 상술한 컴퓨터 판독 가능 매체에 저장될 수 있다. 소프트웨어는 프로세서에 의해 실행될 때 개시된 방법을 수행할 수 있다. 본 개시에서 설명된 컴퓨팅 유닛 및 다른 기능 유닛은 하드웨어 또는 소프트웨어, 또는 하드웨어 및 소프트웨어의 조합에 의해 구현될 수 있다. 통상의 기술자는 또한 위에서 설명된 모듈/유닛 중 다수가 하나의 모듈/유닛으로 결합될 수 있고, 위에서 설명된 모듈/유닛 각각이 복수의 서브-모듈/서브-유닛으로 더 분할될 수 있음을 이해할 것이다.
전술한 명세서에서, 실시예는 구현마다 다를 수 있는 수많은 특정 세부사항을 참조로 설명되었다. 설명된 실시예의 특정 적응 및 수정이 이루어질 수 있다. 다른 실시예는 본원에 개시된 본 발명의 명세서 및 실시를 고려하여 통상의 기술자에게 명백할 수 있다. 명세서 및 예시는 단지 예시적인 것으로 간주되어야 하는 것으로 의도되며, 본 발명의 진정한 범주 및 사상은 다음 청구범위에 의해 나타난다. 또한, 도면에 도시된 단계의 시퀀스는 단지 예시의 목적이며, 단계의 임의의 특정 시퀀스로 제한되도록 의도되지 않는다. 이와 같이, 통상의 기술자는 이러한 단계가 동일한 방법을 구현하면서 상이한 순서로 수행될 수 있음을 인식할 수 있다.
실시예는 다음의 조항을 사용하여 추가로 설명될 수 있다.
1. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하는 단계; 및
비디오 프레임이 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
2. 조항 1의 비디오 코딩 방법에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계는 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
3. 조항 1의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
4. 조항 1의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
5. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계; 및
비디오 프레임이 블록 차동 펄스-코드 변조 코드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
6. 조항 5의 비디오 코딩 방법에 있어서, 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계는:
비디오 프레임이 블록 레벨에서 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계를 더 포함한다.
7. 조항 5의 비디오 코딩 방법에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계는 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
8. 조항 5의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
9. 조항 5의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
10. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및
비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
11. 조항 10의 비디오 코딩 방법에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계는 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
12. 조항 10의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
13. 조항 10의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
14. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지를 결정하는 단계; 및
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계를 포함한다.
15. 조항 14의 비디오 코딩 방법에 있어서,
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 단계; 및
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 더 포함한다.
16. 조항 14의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
17. 조항 14의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
18. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 단계; 및
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
19. 조항 18의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
20. 조항 18의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
21. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 단계; 및
비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 슬라이스 레벨에서 하나 이상의 루프 필터를 턴 오프하는 단계를 포함한다.
22. 조항 21의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
23. 조항 21의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
24. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
25. 조항 24의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
26. 조항 24의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
27. 비디오 코딩 방법으로서,
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임에 대해 종속 양자화가 인에이블되는지를 결정하는 단계;
비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
28. 조항 27의 비디오 코딩 방법에 있어서, 비디오 프레임은 비트스트림에 있다.
29. 조항 27의 비디오 코딩 방법에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
30. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하는 것; 및
비디오 프레임이 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
31. 조항 30의 시스템에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은, 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
32. 조항 30의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
33. 조항 30의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
34. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 것; 및
비디오 프레임이 블록 차동 펄스-코드 변조 코드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
35. 조항 34의 시스템에 있어서, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금 추가로:
비디오 프레임이 블록 레벨에서 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 것을 수행하게 하도록 구성된다.
36. 조항 34의 시스템에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은, 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
37. 조항 34의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
38. 조항 34의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
39. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 것; 및
비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
40. 조항 39의 시스템에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은, 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
41. 조항 39의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
42. 조항 39의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
43. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지를 결정하는 것; 및
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 것을 수행하게 하도록 구성된다.
44. 조항 43의 시스템에 있어서, 프로세서는 명령어의 세트를 실행하여 시스템을 하여금 추가로:
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 것; 및
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성된다.
45. 조항 43의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
46. 조항 43의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
47. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 것;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 것;
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 것; 및
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 것을 수행하게 하도록 구성된다.
48. 조항 47의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
49. 조항 47의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
50. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 것; 및
비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 슬라이스 레벨에서 하나 이상의 루프 필터를 턴 오프하는 것을 수행하게 하도록 구성된다.
51. 조항 50의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
52. 조항 50의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
53. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 것;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 것을 수행하게 하도록 구성된다.
54. 조항 53의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
55. 조항 54의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
56. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
명령어의 세트를 저장하는 메모리; 및
프로세서를 포함하고, 프로세서는 명령어의 세트를 실행하여 시스템으로 하여금:
잔차 코딩을 위한 비디오 프레임을 수신하는 것;
비디오 프레임에 대해 종속 양자화가 인에이블되는지를 결정하는 것;
비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 것을 수행하게 하도록 구성된다.
57. 조항 56의 시스템에 있어서, 비디오 프레임은 비트스트림에 있다.
58. 조항 56의 시스템에 있어서, 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행된다.
59. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 변환 블록 레벨에서 변환 스킵 모드에 따라 코딩되는지를 결정하는 단계; 및
비디오 프레임이 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
60. 조항 59의 비일시적 컴퓨터 판독 가능 매체에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
61. 조항 59의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
62. 조항 59의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
63. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계; 및
비디오 프레임이 블록 차동 펄스-코드 변조 코드에 따라 코딩된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
64. 조항 63의 비일시적 컴퓨터 판독 가능 매체에 있어서, 명령어의 세트는 컴퓨터 시스템의 적어도 하나의 프로세서에 의해 실행 가능하여 컴퓨터 시스템으로 하여금 추가로:
비디오 프레임이 블록 레벨에서 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 것을 수행하게 한다.
65. 조항 63의 비일시적 컴퓨터 판독 가능 매체에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
66. 조항 63의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
67. 조항 63의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
68. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및
비디오 프레임이 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함한다.
69. 조항 68의 비일시적 컴퓨터 판독 가능 매체에 있어서, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적이다.
70. 조항 68의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
71. 조항 68의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
72. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지 및 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 디스에이블되는지를 결정하는 단계; 및
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되고, 변환 스킵 잔차 코딩이 비디오 프레임에 대한 슬라이스 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계를 포함한다.
73. 조항 72의 비일시적 컴퓨터 판독 가능 매체에 있어서, 명령어의 세트는 컴퓨터 시스템의 적어도 하나의 프로세서에 의해 실행 가능하여 컴퓨터 시스템으로 하여금 추가로:
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 것; 및
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 한다.
74. 조항 72의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
75. 조항 72의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
76. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블되는지를 결정하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 부호 데이터 은닉을 턴 온하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프되는지를 결정하는 단계; 및
부호 데이터 은닉이 비디오 프레임에 대한 슬라이스 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
77. 조항 76의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
78. 조항 76의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
79. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩되는지를 결정하는 단계; 및
비디오 프레임이 슬라이스 레벨에서 무손실 모드에서 코딩된다는 결정에 응답하여, 슬라이스 레벨에서 하나 이상의 루프 필터를 턴 오프하는 단계를 포함한다.
80. 조항 79의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
81. 조항 79의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
82. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프되는지를 결정하는 단계;
부호 데이터 은닉이 비디오 프레임에 대한 픽처 레벨에서 턴 오프된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
83. 조항 82의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
84. 조항 82의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
85. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 방법은:
잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
비디오 프레임에 대해 종속 양자화가 인에이블되는지를 결정하는 단계;
비디오 프레임에 대해 종속 양자화가 인에이블된다는 결정에 응답하여, 비디오 프레임에 대한 슬라이스 레벨에서 변환 스킵 잔차 코딩을 턴 오프하는 단계를 포함한다.
86. 조항 85의 비일시적 컴퓨터 판독 가능 매체에 있어서, 비디오 프레임은 비트스트림에 있다.
87. 조항 85의 비일시적 컴퓨터 판독 가능 매체에 있어서, 방법은 다용도 비디오 코딩 표준에 따라 수행된다.
도면 및 명세서에서, 예시적인 실시예가 개시된다. 하지만, 이들 실시예에 대해 다수의 변형 및 수정이 이루어질 수 있다. 따라서, 특정한 용어가 이용되더라도, 제한의 목적이 아닌 일반적이고 설명적인 의미로 사용된다.

Claims (20)

  1. 비디오 코딩 방법으로서,
    잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
    상기 비디오 프레임이 제1 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및
    상기 비디오 프레임이 상기 제1 코딩 모드에 따라 코딩되는지의 결정에 응답하여, 상기 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함하는,
    비디오 코딩 방법.
  2. 제1 항에 있어서,
    상기 제1 코딩 모드는 변환 블록 레벨에서 변환 스킵 모드이고, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 단계는,
    상기 비디오 프레임이 상기 변환 블록 레벨에서 상기 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 단계를 포함하는,
    비디오 코딩 방법.
  3. 제1 항에 있어서,
    상기 제1 코딩 모드는 블록 차동 펄스-코드 변조 모드이고, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 단계는,
    상기 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩된다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 단계를 포함하는,
    비디오 코딩 방법.
  4. 제3 항에 있어서,
    상기 비디오 프레임이 상기 제1 코딩 모드에 따라 코딩되는지를 결정하는 단계는,
    상기 비디오 프레임이 블록 레벨에서 상기 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 단계를 더 포함하는,
    비디오 코딩 방법.
  5. 제1 항에 있어서,
    상기 제1 코딩 모드는 슬라이스 레벨에서의 변환 스킵 잔차 코딩 모드이고, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 단계는,
    상기 비디오 프레임이 상기 슬라이스 레벨에서 상기 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 단계를 포함하는,
    비디오 코딩 방법.
  6. 제1 항에 있어서,
    상기 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계는, 상기 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적인,
    비디오 코딩 방법.
  7. 제1 항에 있어서,
    상기 비디오 프레임은 비트스트림에 있는,
    비디오 코딩 방법.
  8. 제1 항에 있어서,
    상기 방법은 다용도 비디오 코딩 표준에 따라 수행되는,
    비디오 코딩 방법.
  9. 비디오 데이터 처리를 수행하기 위한 시스템으로서,
    명령어의 세트를 저장하는 메모리; 및
    프로세서를 포함하고, 상기 프로세서는 상기 명령어의 세트를 실행하여 상기 시스템으로 하여금:
    잔차 코딩을 위한 비디오 프레임을 수신하는 것;
    상기 비디오 프레임이 제1 코딩 모드에 따라 코딩되는지를 결정하는 것; 및
    상기 비디오 프레임이 상기 제1 코딩 모드에 따라 코딩되는지의 결정에 응답하여, 상기 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성되는,
    시스템.
  10. 제9 항에 있어서,
    상기 제1 코딩 모드는 변환 블록 레벨에서 변환 스킵 모드이고,
    상기 프로세서는 상기 명령어의 세트를 실행하여 상기 시스템으로 하여금,
    상기 비디오 프레임이 상기 변환 블록 레벨에서 상기 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성되는,
    시스템.
  11. 제9 항에 있어서,
    상기 제1 코딩 모드는 블록 차동 펄스-코드 변조 모드이고,
    상기 프로세서는 상기 명령어의 세트를 실행하여 상기 시스템으로 하여금,
    상기 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩된다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성되는,
    시스템.
  12. 제11 항에 있어서,
    상기 비디오 프레임이 상기 제1 코딩 모드에 따라 코딩되는지를 결정하는 것은,
    상기 비디오 프레임이 블록 레벨에서 상기 블록 차동 펄스-코드 변조 모드에 따라 코딩되는지를 결정하는 것을 더 포함하는,
    시스템.
  13. 제9 항에 있어서,
    상기 제1 코딩 모드는 슬라이스 레벨에서의 변환 스킵 잔차 코딩 모드이고,
    상기 프로세서는 상기 명령어의 세트를 실행하여 상기 시스템으로 하여금,
    상기 비디오 프레임이 상기 슬라이스 레벨에서 상기 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하도록 구성되는,
    시스템.
  14. 제9 항에 있어서,
    상기 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 것은, 상기 비디오 프레임에 대해 종속 양자화가 인에이블되는지와 독립적인,
    시스템.
  15. 제9 항에 있어서,
    상기 비디오 프레임은 비트스트림에 있는,
    시스템.
  16. 제9 항에 있어서,
    상기 잔차 코딩은 다용도 비디오 코딩 표준에 따라 수행되는,
    시스템.
  17. 명령어의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서,
    상기 명령어의 세트는 장치로 하여금 비디오 데이터 처리를 수행하기 위한 방법을 개시하게 하도록 상기 장치의 하나 이상의 프로세서에 의해 실행 가능하고, 상기 방법은:
    잔차 코딩을 위한 비디오 프레임을 수신하는 단계;
    상기 비디오 프레임이 제1 코딩 모드에 따라 코딩되는지를 결정하는 단계; 및
    상기 비디오 프레임이 상기 제1 코딩 모드에 따라 코딩되는지의 결정에 응답하여, 상기 잔차 코딩에 대한 부호 데이터 은닉을 턴 오프하는 단계를 포함하는,
    비일시적 컴퓨터 판독 가능 매체.
  18. 제17 항에 있어서,
    상기 제1 코딩 모드는 변환 블록 레벨에서 변환 스킵 모드이고,
    상기 명령어의 세트는 컴퓨터 시스템의 적어도 하나의 프로세서에 의해 실행 가능하여 상기 컴퓨터 시스템으로 하여금 추가로,
    상기 비디오 프레임이 상기 변환 블록 레벨에서 상기 변환 스킵 모드에 따라 코딩된다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하는,
    비일시적 컴퓨터 판독 가능 매체.
  19. 제17 항에 있어서,
    상기 제1 코딩 모드는 블록 차동 펄스-코드 변조 모드이고,
    상기 명령어의 세트는 상기 컴퓨터 시스템의 적어도 하나의 프로세서에 의해 실행 가능하여 상기 컴퓨터 시스템으로 하여금 추가로,
    상기 비디오 프레임이 블록 차동 펄스-코드 변조 모드에 따라 코딩된다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하는,
    비일시적 컴퓨터 판독 가능 매체.
  20. 제17 항에 있어서,
    상기 제1 코딩 모드는 슬라이스 레벨에서 변환 스킵 잔차 코딩 모드이고,
    상기 명령어의 세트는 상기 컴퓨터 시스템의 적어도 하나의 프로세서에 의해 실행 가능하여 상기 컴퓨터 시스템으로 하여금 추가로,
    상기 비디오 프레임이 상기 슬라이스 레벨에서 상기 변환 스킵 잔차 코딩 모드에 따라 코딩되지 않는다는 결정에 응답하여, 상기 잔차 코딩에 대한 상기 부호 데이터 은닉을 턴 오프하는 것을 수행하게 하는,
    비일시적 컴퓨터 판독 가능 매체.
KR1020227036239A 2020-03-24 2021-03-24 비디오 레코딩의 부호 데이터 은닉 KR20220158002A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202062994239P 2020-03-24 2020-03-24
US62/994,239 2020-03-24
PCT/US2021/023926 WO2021195240A1 (en) 2020-03-24 2021-03-24 Sign data hiding of video recording

Publications (1)

Publication Number Publication Date
KR20220158002A true KR20220158002A (ko) 2022-11-29

Family

ID=77854734

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227036239A KR20220158002A (ko) 2020-03-24 2021-03-24 비디오 레코딩의 부호 데이터 은닉

Country Status (6)

Country Link
US (1) US20210306623A1 (ko)
EP (1) EP4128541A4 (ko)
JP (1) JP2023518713A (ko)
KR (1) KR20220158002A (ko)
CN (1) CN115349228A (ko)
WO (1) WO2021195240A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2022012270A (es) 2020-03-31 2022-12-13 Lg Electronics Inc Método de decodificación de imágenes para codificación residual, y dispositivo para el mismo.
US11638036B2 (en) * 2020-04-03 2023-04-25 Qualcomm Incorporated High-level constraints for transform skip blocks in video coding

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130294524A1 (en) * 2012-05-04 2013-11-07 Qualcomm Incorporated Transform skipping and lossless coding unification
US10785494B2 (en) * 2017-10-11 2020-09-22 Qualcomm Incorporated Low-complexity design for FRUC
CN112703742B (zh) * 2018-09-14 2023-03-31 华为技术有限公司 视频译码中的分块指示
CN115486071A (zh) * 2020-04-30 2022-12-16 寰发股份有限公司 视频编解码中施加比特流约束的方法和装置

Also Published As

Publication number Publication date
JP2023518713A (ja) 2023-05-08
EP4128541A1 (en) 2023-02-08
CN115349228A (zh) 2022-11-15
US20210306623A1 (en) 2021-09-30
WO2021195240A1 (en) 2021-09-30
EP4128541A4 (en) 2024-01-03

Similar Documents

Publication Publication Date Title
KR20220044754A (ko) 비디오 코딩을 위한 블록 파티셔닝 방법
US11323711B2 (en) Method and system for signaling chroma quantization parameter offset
US11671613B2 (en) Methods for signaling virtual boundaries and wrap-around motion compensation
US11956463B2 (en) Methods for performing wrap-around motion compensation
KR20220024912A (ko) 루마 및 크로마 신호를 처리하기 위한 방법 및 시스템
US11889091B2 (en) Methods for processing chroma signals
US20210092388A1 (en) Lossless coding of video data
US20210306623A1 (en) Sign data hiding of video recording
US20240048772A1 (en) METHOD AND APPARATUS FOR PROCESSING VIDEO CONTENT WITH ALF and CCALF
KR20220160019A (ko) 루프 필터의 높은 레벨 신택스 제어
KR20230013103A (ko) 비디오 처리에서의 타일 및 슬라이스 파티셔닝
KR20220063248A (ko) 병합 후보 목록 구성 방법
KR20220115984A (ko) 팔레트 모드에서 비디오 데이터를 코딩하기 위한 방법 및 장치
US20230217026A1 (en) Fusion of video prediction modes
US20210368170A1 (en) High level control of pdpc and intra reference sample filtering of video coding
KR20220143870A (ko) 최대 변환 크기 및 잔차 코딩 방법의 시그널링
JP2023509838A (ja) サブピクチャ分割情報をシグナリングするための方法及び機器
KR20220057620A (ko) 변환-스킵 모드에서 비디오 데이터를 코딩하기 위한 방법 및 장치
US11606577B2 (en) Method for processing adaptive color transform and low-frequency non-separable transform in video coding
US20210306653A1 (en) Methods for signaling residual coding method of transform skip blocks
US12003751B2 (en) High level syntax control of loop filter
KR20240036574A (ko) 교차-성분 적응형 루프 필터를 위한 방법 및 시스템