KR20220134651A - 비디오 디코딩 방법, 비디오 인코딩 방법, 장치, 매체, 및 전자 디바이스 - Google Patents

비디오 디코딩 방법, 비디오 인코딩 방법, 장치, 매체, 및 전자 디바이스 Download PDF

Info

Publication number
KR20220134651A
KR20220134651A KR1020227031426A KR20227031426A KR20220134651A KR 20220134651 A KR20220134651 A KR 20220134651A KR 1020227031426 A KR1020227031426 A KR 1020227031426A KR 20227031426 A KR20227031426 A KR 20227031426A KR 20220134651 A KR20220134651 A KR 20220134651A
Authority
KR
South Korea
Prior art keywords
quantization
quantization coefficient
values
coefficient block
coefficients
Prior art date
Application number
KR1020227031426A
Other languages
English (en)
Inventor
리창 왕
샤오중 쉬
산 류
Original Assignee
텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 filed Critical 텐센트 테크놀로지(센젠) 컴퍼니 리미티드
Publication of KR20220134651A publication Critical patent/KR20220134651A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

비디오 디코딩 방법, 비디오 인코딩 방법, 장치, 매체, 및 전자 디바이스. 비디오 디코딩 방법은: 비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩 처리를 수행하고, 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득하는 단계; 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 통계를 컴파일링하고, 양자화 계수 통계 값을 획득하는 단계; 및 양자화 계수 통계 값에 따라, 역변환 처리 절차를 스킵할지를 결정하는 단계를 포함한다. 설명된 기술적 해결책은 비디오 인코딩 효율을 효과적으로 개선할 수 있다.

Description

비디오 디코딩 방법, 비디오 인코딩 방법, 장치, 매체, 및 전자 디바이스
본 출원은 2020년 8월 21일자로 출원된, 발명의 명칭이 "VIDEO DECODING METHOD AND APPARATUS, VIDEO CODING METHOD AND APPARATUS, MEDIUM, AND ELECTRONIC DEVICE"인 중국 특허 출원 제202010855625.1호에 대한 우선권을 주장하고, 그 전체가 참조로 본 명세서에 포함된다.
본 출원은 컴퓨터 및 통신 기술의 분야에 관한 것으로, 특히, 비디오 디코딩 방법 및 장치, 비디오 코딩 방법 및 장치, 매체, 및 전자 디바이스에 관한 것이다.
비디오 코딩 동안, 코더 단(coder end)은 보통 원래의 비디오 데이터와 예측된 비디오 데이터 사이의 잔차 데이터를 디코더 단(decoder end)에 전송하기 전에 잔차 데이터에 대해 변환, 양자화, 및 엔트로피 코딩을 수행할 필요가 있다. 다양화된 잔차 데이터로 인해, 단일 DCT(discrete cosine transform) 변환 커널은 모든 잔차 특성에 적응할 수 없다. 그러므로, 잔차 블록에 대한 변환 행렬 조합을 형성하기 위해 복수의 DCT 변환 커널이 요구된다. 약한 상관관계를 갖는 일부 잔차 블록들에 대해, 변환 프로세스를 스킵하면서 양자화 프로세스가 직접 수행되면 코딩 효율이 심지어 개선될 수 있다. 그러나, 이러한 방식은 변환 프로세스가 스킵되는지를 지시하기 위해 각각의 코딩 유닛(줄여서 CU)에 대한 변환 스킵 플래그를 코딩할 것을 요구한다. 추가로, 코딩 변환 스킵 플래그는 비디오 코딩 효율에 영향을 미친다.
본 출원의 실시예들은 비디오 코딩 효율을 적어도 어느 정도 효과적으로 개선하는, 비디오 디코딩 방법 및 장치, 비디오 코딩 방법 및 장치, 매체, 및 전자 디바이스를 제공한다.
본 출원의 다른 특징들 및 이점들은 다음의 상세한 설명을 통해 명백해지거나, 또는 본 출원의 실시를 통해 부분적으로 알 수 있다.
본 출원의 실시예들의 양태에 따르면, 비디오 디코딩 방법이 제공되고, 이 방법은: 비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하여 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득하는 단계; 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득하는 단계; 및 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하는 단계를 포함한다.
본 출원의 실시예들의 양태에 따르면, 비디오 코딩 방법이 제공되고, 이 방법은: 변환을 스킵하고 비디오 이미지 프레임의 코딩 블록을 취득하기 위해 요구된 잔차 데이터에 대해 변환을 스킵하고 양자화를 직접 수행하여, 잔차 데이터의 제1 양자화 계수 블록을 획득하는 단계; 잔차 데이터에 대해 변환 및 양자화를 연속적으로 수행하여 잔차 데이터의 제2 양자화 계수 블록을 획득하는 단계; 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득하는 단계- 제3 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 스킵하도록 지시하기 위해 사용되고, 제3 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -; 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득하는 단계- 제4 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 수행하도록 지시하기 위해 사용되고, 제4 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -; 및 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩을 수행하여, 비디오 이미지 프레임의 코딩 블록을 획득하는 단계를 포함한다.
본 출원의 실시예들의 양태에 따르면, 비디오 디코딩 장치가 제공되고, 이 장치는: 비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하여 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득하도록 구성되는 디코딩 유닛; 계산 유닛; 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득하도록 구성되는 계산 유닛; 및 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하도록 구성되는 결정 유닛을 포함한다.
본 출원의 실시예들의 양태에 따르면, 비디오 코딩 장치가 제공되고, 이 장치는:
비디오 이미지 프레임의 코딩 블록을 취득하기 위해 요구된 잔차 데이터에 대해 변환을 스킵하고 양자화를 직접 수행하여, 잔차 데이터의 제1 양자화 계수 블록을 획득하고; 잔차 데이터에 대해 변환 및 양자화를 연속적으로 수행하여 잔차 데이터의 제2 양자화 계수 블록을 획득하도록 구성되는 처리 유닛; 및 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득- 제3 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 스킵하도록 지시하기 위해 사용되고, 제3 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하고; 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득- 제4 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 수행하도록 지시하기 위해 사용되고, 제4 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하도록 구성되는 취득 회로를 포함하며; 처리 유닛은 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩을 수행하여, 비디오 이미지 프레임의 코딩 블록을 획득하도록 추가로 구성된다.
본 출원의 실시예들의 양태에 따르면, 비디오 코딩 장치 및 비디오 디코딩 장치를 포함하는 비디오 처리 시스템이 제공되고, 비디오 코딩 장치는 위의 실시예에서 설명된 비디오 코딩 방법을 수행하도록 구성되고, 비디오 디코딩 장치는 위의 실시예에서 설명된 비디오 디코딩 방법을 수행하도록 구성된다.
본 출원의 실시예들의 양태에 따르면, 컴퓨터 프로그램을 저장한 비일시적 컴퓨터 판독가능 매체가 제공되고, 컴퓨터 프로그램은 프로세서에 의해 실행되어 컴퓨터로 하여금 위의 실시예에서 설명된 비디오 디코딩 방법 또는 위의 실시예에서 설명된 비디오 코딩 방법을 구현하게 한다.
본 출원의 실시예들의 양태에 따르면, 전자 디바이스가 제공되고, 이 전자 디바이스는: 하나 이상의 프로세서; 및 하나 이상의 프로세서에 의해 실행될 때, 전자 디바이스로 하여금 위의 실시예에서 설명된 비디오 디코딩 방법 또는 위의 실시예에서 설명된 비디오 코딩 방법을 구현하게 하는 하나 이상의 프로그램을 저장하도록 구성되는 저장 장치를 포함한다.
본 출원의 이러한 실시예의 양태에 따르면, 컴퓨터 프로그램 제품 또는 컴퓨터 프로그램이 제공되고, 컴퓨터 프로그램 제품 또는 컴퓨터 프로그램은 컴퓨터 명령어들을 포함하고, 컴퓨터 명령어들은 컴퓨터 판독가능 저장 매체에 저장된다. 컴퓨터 디바이스의 프로세서는 컴퓨터 판독가능 저장 매체로부터 컴퓨터 명령어들을 판독하고, 컴퓨터 명령어들을 실행하여, 컴퓨터 디바이스로 하여금 위의 다양한 임의적 실시예들에서 제공되는 비디오 디코딩 방법 또는 위의 다양한 임의적 실시예들에서 제공되는 비디오 코딩 방법을 구현하게 한다.
본 출원의 일부 실시예들에서 제공되는 기술적 해결책들에서, 양자화 계수 블록에서 지정된 영역의 양자화 계수들이 계산되어 양자화 계수 통계 값을 획득하고, 그 후 양자화 계수 통계 값에 따라 역변환 프로세스를 스킵할지가 결정된다. 이러한 방식으로, 코더 단이 변환 프로세스를 스킵하는지는 양자화 계수 블록 내의 양자화 계수들을 사용하여 암시적으로 지시될 수 있어, 디코더 단은 역 변환 프로세스를 수행할지를 결정할 수 있고, 이는 코더 단에 의한 각각의 CU에 대한 변환 스킵 플래그의 코딩을 회피하고, 그에 의해 비디오 코딩 효율을 효과적으로 개선한다.
전술한 일반적인 설명들 및 다음의 상세한 설명들은 단지 예시 및 설명의 목적들을 위한 것이고 본 출원을 제한하는 것을 의도하지 않는다는 점이 이해되어야 한다.
도 1은 본 출원의 실시예들의 기술적 해결책들이 적용가능한 예시적인 시스템 아키텍처의 개략도이다.
도 2는 스트리밍 송신 시스템에서의 비디오 코딩 장치 및 비디오 디코딩 장치의 배치의 개략도이다.
도 3은 비디오 코더의 기본 흐름도이다.
도 4는 SRCC(scan region-based coefficient coding) 기술로 마킹된 스캐닝 영역을 도시한다.
도 5는 마킹된 스캐닝될 영역을 스캐닝하는 순서의 개략도이다.
도 6은 본 출원의 실시예에 따른 비디오 디코딩 방법의 흐름도이다.
도 7은 본 출원의 실시예에 따른 지정된 영역의 분할의 개략도이다.
도 8은 본 출원의 실시예에 따른 지정된 영역의 분할의 개략도이다.
도 9는 본 출원의 실시예에 따른 지정된 영역의 분할의 개략도이다.
도 10은 본 출원의 실시예에 따른 비디오 코딩 방법의 흐름도이다.
도 11은 본 출원의 실시예에 따른 비디오 디코딩 장치의 블록도이다.
도 12는 본 출원의 실시예에 따른 비디오 코딩 장치의 블록도이다.
도 13은 본 출원의 실시예에 따른 전자 디바이스를 구현하도록 적응된 컴퓨터 시스템의 개략적인 구조도이다.
이제, 첨부 도면들을 참조하여 예시적인 구현들이 더 포괄적으로 설명된다. 그러나, 구현들의 예들은 다양한 형태들로 구현될 수 있고, 본 명세서에 설명된 예들로 제한되는 것으로서 이해되어서는 안 되며; 반대로, 구현들은 본 출원을 더 포괄적이고 완전하게 하고, 본 기술분야의 통상의 기술자에게 구현들의 예들의 아이디어를 포괄적으로 전달하기 위해 제공된다.
또한, 설명된 특징들, 구조들, 또는 특성들은 임의의 적절한 방식으로 하나 이상의 실시예에서 조합될 수 있다. 이하의 설명들에서, 본 출원의 실시예들의 포괄적인 이해를 제공하기 위해 많은 구체적인 상세들이 제공된다. 그러나, 본 기술분야의 통상의 기술자는 본 출원에서의 기술적 해결책들이 특정한 상세들 중 하나 이상 없이 구현될 수 있거나, 다른 방법, 유닛, 장치, 또는 단계가 사용될 수 있다는 것을 알아야 한다. 다른 경우들에서, 본 출원의 양태들을 모호하게 하는 것을 회피하기 위해, 잘 알려진 방법들, 장치들, 구현들, 또는 동작들은 상세히 도시되거나 설명되지 않는다.
첨부 도면들에 도시된 블록도들은 단지 기능적 엔티티들이고 물리적으로 독립적인 엔티티들에 반드시 대응하는 것은 아니다. 즉, 이러한 기능적 엔티티들은 소프트웨어 형태로, 또는 하나 이상의 하드웨어 모듈 또는 집적 회로로, 또는 상이한 네트워크들 및/또는 프로세서 장치들 및/또는 마이크로컨트롤러 장치들로 구현될 수 있다.
첨부 도면들에 도시된 흐름도들은 단지 설명들을 위한 예들이고, 모든 내용 및 동작들/단계들을 포함할 필요는 없고, 설명된 순서들로 수행될 필요도 없다. 예를 들어, 일부 동작들/단계들은 더 분할될 수 있는 한편, 일부 동작들/단계들은 조합되거나 부분적으로 조합될 수 있다. 그러므로, 실제 실행 순서는 실제 경우에 따라 변경될 수 있다.
명세서에서 언급된 "복수(Plurality of)"는 2개 이상을 의미한다. "및/또는(and/or)"은 연관된 객체들을 설명하기 위해 연관 관계를 설명하고 3개의 관계가 존재할 수 있다는 점을 표현한다. 예를 들어, A 및/또는 B는 이하의 3개의 경우를 표현할 수 있다: A만 존재, A 및 B 둘 다 존재, 및 B만 존재. 문자 "/"는 일반적으로 연관된 객체들 사이의 "또는" 관계를 지시한다.
도 1은 본 출원의 실시예들의 기술적 해결책들이 적용가능한 예시적인 시스템 아키텍처의 개략도이다.
도 1에 도시된 바와 같이, 시스템 아키텍처(100)는, 예를 들어, 네트워크(150)를 통해 서로 통신할 수 있는 복수의 단말 디바이스들을 포함한다. 예를 들어, 시스템 아키텍처(100)는 네트워크(150)에 의해 접속된 제1 단말 디바이스(110) 및 제2 단말 디바이스(120)를 포함할 수 있다. 도 1의 실시예에서, 제1 단말 디바이스(110) 및 제2 단말 디바이스(120)는 단방향 데이터 송신을 수행한다.
예를 들어, 제1 단말 디바이스(110)는 비디오 데이터(예를 들어, 제1 단말 디바이스(110)에 의해 캡처된 비디오 픽처 스트림)를 코딩하고 비디오 데이터를 네트워크(150)를 통해 제2 단말 디바이스(120)에 송신할 수 있다. 코딩된 비디오 데이터는 하나 이상의 코딩된 비디오 비트 스트림의 형태로 송신된다. 제2 단말 디바이스(120)는 네트워크(150)를 통해 코딩된 비디오 데이터를 수신하고, 코딩된 비디오 데이터를 디코딩하여 비디오 데이터를 복원하고, 복원된 비디오 데이터에 따라 비디오 픽처를 디스플레이할 수 있다.
본 출원의 실시예에서, 시스템 아키텍처(100)는 코딩된 비디오 데이터의 양방향 송신을 수행하는 제3 단말 디바이스(130) 및 제4 단말 디바이스(140)를 포함할 수 있다. 양방향 송신은, 예를 들어, 화상 회의 동안 발생할 수 있다. 양방향 데이터 송신 동안, 제3 단말 디바이스(130) 및 제4 단말 디바이스(140) 각각은 비디오 데이터(예를 들어, 단말 디바이스에 의해 캡처된 비디오 픽처 스트림)를 코딩하고 비디오 데이터를 네트워크(150)를 통해 제3 단말 디바이스(130) 및 제4 단말 디바이스(140) 중 다른 하나에 송신할 수 있다. 제3 단말 디바이스(130) 및 제4 단말 디바이스(140) 각각은 대안적으로 제3 단말 디바이스(130) 및 제4 단말 디바이스(140) 중 다른 하나에 의해 송신된 코딩된 비디오 데이터를 수신할 수 있고, 코딩된 비디오 데이터를 디코딩하여 비디오 데이터를 복원할 수 있고, 복원된 비디오 데이터에 따라 액세스가능한 디스플레이 장치상에 비디오 픽처를 디스플레이할 수 있다.
도 1의 실시예에서, 제1 단말 디바이스(110), 제2 단말 디바이스(120), 제3 단말 디바이스(130), 및 제4 단말 디바이스(140)는 서버들, 개인용 컴퓨터들, 또는 스마트 폰들일 수 있지만, 본 출원에 개시된 원리들은 이것으로 제한되지 않을 수 있다. 본 명세서에 개시된 실시예들은 랩톱 컴퓨터들, 태블릿 컴퓨터들, 미디어 플레이어들, 및/또는 전용 영상회의 디바이스들에 적용가능하다. 네트워크(150)는, 예를 들어, 유선 및/또는 무선 통신 네트워크를 포함한, 제1 단말 디바이스(110), 제2 단말 디바이스(120), 제3 단말 디바이스(130), 및 제4 단말 디바이스(140) 사이에서 코딩된 비디오 데이터를 송신하는 임의의 타입의 네트워크이다. 통신 네트워크(150)는 회선 교환 및/또는 패킷 교환 채널들에서 데이터를 교환할 수 있다. 네트워크(150)는 전기통신 네트워크(telecommunications network), 근거리 네트워크, 광역 네트워크 및/또는 인터넷을 포함할 수 있다. 본 출원의 목적들을 위해, 아래에 설명되지 않는 한, 네트워크(150)의 아키텍처 및 토폴로지는 본 출원에 개시되는 동작들에 중요하지 않을 수 있다.
본 출원의 실시예에서, 도 2는 스트리밍 송신 환경에서의 비디오 코딩 장치 및 비디오 디코딩 장치의 배치를 도시한다. 본 출원에 개시된 주제는, 예를 들어, 영상회의, 디지털 텔레비전(TV), 및 콤팩트 디스크(CD), 디지털 비디오 디스크(DVD), 메모리 스틱 등을 포함하는 디지털 매체상의 압축된 비디오들의 저장을 포함하는, 비디오들을 지원하는 다른 애플리케이션들에 적용가능하다.
스트리밍 송신 시스템은 캡처 서브시스템(213)을 포함할 수 있다. 캡처 서브시스템(213)은 디지털 카메라와 같은 비디오 소스(201)를 포함할 수 있다. 비디오 소스(201)는 압축되지 않은 비디오 픽처 스트림(202)을 생성한다. 실시예에서, 비디오 픽처 스트림(202)은 디지털 카메라에 의해 캡처된 샘플들을 포함한다. 코딩된 비디오 데이터(204)(또는 코딩된 비디오 비트 스트림(204))와 비교하여, 비디오 픽처 스트림(202)은 비디오 픽처 스트림의 높은 데이터 볼륨을 강조하기 위해 두꺼운 선을 사용하여 묘사되어 있다. 비디오 픽처 스트림(202)은 전자 디바이스(220)에 의해 처리될 수 있다. 전자 디바이스(220)는 비디오 소스(201)에 결합된 비디오 코딩 장치(203)를 포함한다. 비디오 코딩 장치(203)는 아래에 더 상세히 설명되는 개시된 주제의 다양한 양태들을 구현 또는 실행하기 위해 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합을 포함할 수 있다. 비디오 픽처 스트림(202)과 비교하여, 코딩된 비디오 데이터(204)(또는 코딩된 비디오 비트 스트림(204))는 코딩된 비디오 데이터(204)(또는 코딩된 비디오 비트 스트림(204))의 낮은 데이터 볼륨을 강조하기 위해 얇은 선을 사용하여 묘사되어 있다. 코딩된 비디오 데이터(204)(또는 코딩된 비디오 비트 스트림(204))는 미래의 사용을 위해 스트리밍 송신 서버(205)에 저장될 수 있다.
도 2의 클라이언트 서브시스템(206) 및 클라이언트 서브시스템(208)과 같은 하나 이상의 스트림 클라이언트 서브시스템은 스트리밍 송신 서버(205)에 액세스하여 코딩된 비디오 데이터(204)의 사본(207) 및 사본(209)을 검색할 수 있다. 클라이언트 서브시스템(206)은, 예를 들어, 전자 디바이스(230) 내의 비디오 디코딩 장치(210)를 포함할 수 있다. 비디오 디코딩 장치(210)는 코딩된 비디오 데이터의 수신된 사본(207)을 디코딩하고, 디스플레이(212)(예를 들어, 디스플레이 스크린) 또는 다른 디스플레이 장치상에 제시될 수 있는 출력 비디오 픽처 스트림(211)을 생성한다. 일부 스트리밍 송신 시스템들에서, 코딩된 비디오 데이터(204), 비디오 데이터(204)의 사본(207), 및 비디오 데이터(204)의 사본(209)(예를 들어, 비디오 비트 스트림)은 일부 비디오 코딩/압축 표준들에 따라 코딩될 수 있다. 표준들의 실시예들은 ITU-T H.265를 포함한다. 실시예에서, 개발 중인 비디오 코딩 표준은 비공식적으로 VVC(Versatile Video Coding)로 지칭된다. 이 애플리케이션은 VVC 표준의 맥락에서 사용될 수 있다.
전자 디바이스(220) 및 전자 디바이스(230)는 도면들에 도시되지 않은 다른 컴포넌트들을 포함할 수 있다. 예를 들어, 전자 디바이스(220)는 비디오 디코딩 장치를 포함할 수 있고, 전자 디바이스(230)는 비디오 코딩 장치를 더 포함할 수 있다.
본 출원의 실시예에서, HEVC(High Efficiency Video Coding)와 같은 국제 비디오 코딩 표준, VVC, 및 AVS(Audio Video Coding Standard)와 같은 중국 국가 비디오 코딩 표준을 예로 들면, 비디오 이미지 프레임이 입력될 때, 비디오 이미지 프레임은 블록 크기에 따라 복수의 비-중첩 처리될 유닛으로 파티셔닝되고, 처리될 유닛에 대해 유사한 동작들이 수행된다. 처리 유닛은 코딩 트리 유닛(CTU) 또는 최대 코딩 유닛(LCU)으로 지칭된다. CTU는 하나 이상의 기본 코딩 유닛(CU)을 획득하기 위해 더 파티셔닝될 수 있다. CU는 코딩 프로세스에서 가장 기본적인 요소이다. CU의 코딩 동안의 일부 개념들이 아래에 설명된다.
예측 코딩: 예측 코딩은 인트라 예측 및 인터 예측과 같은 모드들을 포함한다. 원래의 비디오 신호가 선택된 재구성된 비디오 신호를 사용하여 예측된 후에, 잔여 비디오 신호가 획득된다. 코더 단은 현재 CU에 대한 예측 코딩 모드를 결정할 필요가 있고 디코더 단에 통지한다. 인트라 예측은, 예측된 신호가 코딩 및 재구성된 동일 이미지에서의 영역으로부터 유래하는 것을 의미한다. 인터 예측은, 예측된 신호가, 현재 이미지와는 상이한 코딩된 이미지(참조 이미지라고 지칭됨)로부터 유래하는 것을 의미한다.
변환 & 양자화: 잔여 비디오 신호는 이산 푸리에 변환(DFT) 또는 이산 코사인 변환(DCT)과 같은 변환 동작을 통해 변환 도메인으로 변환되어, 변환 계수를 생성한다. 특정 양의 정보를 잃는 손실 양자화 동작이 변환 계수에 대해 추가로 수행되어, 양자화된 신호가 압축된 표현을 용이하게 한다. 일부 비디오 코딩 표준들에서, 선택을 위한 하나보다 많은 변환 방식이 있을 수 있다. 따라서, 코더 단은 현재 CU에 대한 변환 방식을 선택할 필요가 있고 디코더 단에 통지한다. 양자화의 정밀도(fineness)는 보통 양자화 파라미터(QP)에 의존한다. QP의 더 큰 값은 더 큰 범위 내의 계수들이 동일한 출력으로서 양자화될 것임을 표현하고, 따라서, 보통 더 큰 왜곡 및 더 낮은 비트 레이트를 가져올 수 있다. 역으로, QP의 더 작은 값은 더 작은 범위 내의 계수들이 동일한 출력으로서 양자화될 것임을 표현하고, 따라서 보통 더 높은 비트 레이트에 대응하면서 더 작은 왜곡을 가져올 수 있다.
엔트로피 코딩 또는 통계적 코딩: 양자화된 변환 도메인 신호들에는 값들의 발생 빈도들에 따라 통계적 압축 코딩이 수행되고, 최종적으로, 이진화된(0 또는 1) 압축된 비트스트림이 출력된다. 또한, 비트 레이트를 감소시키기 위해, 선택된 코딩 모드 및 모션 벡터 데이터와 같은, 코딩 동안 생성된 다른 정보에 대해 엔트로피 코딩이 또한 수행되도록 요구된다. 통계적 코딩은 동일한 신호를 표현하기 위해 요구되는 비트 레이트를 효과적으로 감소시킬 수 있는 무손실 코딩 방식이다. 공통 통계 코딩 방식은 가변 길이 코딩(줄여서 VLC) 또는 컨텍스트 적응 이진 산술 코딩(줄여서 CABAC)을 포함한다.
루프 필터링: 역양자화, 역변환, 및 예측 보상과 같은 동작들이 변환되고 양자화된 신호에 대해 수행되어 재구성된 이미지를 획득한다. 재구성된 이미지는 양자화의 결과로서 원래의 이미지에서의 것과 상이한 일부 정보를 가지며, 즉, 재구성된 이미지는 왜곡을 갖는다. 따라서, 필터링 동작은 디블로킹 필터(DB), 샘플 적응 오프셋(SAO) 필터, 또는 적응 루프 필터(ALF)와 같은 필터들을 사용하여 재구성된 이미지에 대해 수행될 수 있으며, 이는 양자화에 의해 야기되는 왜곡의 정도를 효과적으로 감소시킬 수 있다. 필터링된 재구성된 이미지는 미래의 이미지 신호들을 예측하기 위해 후속 코딩 이미지들에 대한 기준으로서 사용될 것이므로, 위의 필터링 동작은 루프 필터링, 즉 코딩 루프에서의 필터링 동작으로도 지칭된다.
본 출원의 실시예에서, 도 3은 비디오 코더의 기본 흐름도이다. 이 프로세스에서, 인트라 예측이 설명을 위한 예로서 사용된다. 원래의 이미지 신호
Figure pct00001
와 예측된 이미지 신호
Figure pct00002
사이의 차이가 계산되어 잔차 신호
Figure pct00003
를 획득하고, 잔차 신호
Figure pct00004
는 변환되고 양자화되어 양자화 계수를 획득한다. 양자화 계수는 엔트로피 코딩의 대상이 되어 코딩된 비트 스트림을 획득하고, 또한 역양자화 및 역변환의 대상이 되어 재구성된 잔차 신호
Figure pct00005
를 획득한다. 예측된 이미지 신호
Figure pct00006
는 재구성된 잔차 신호
Figure pct00007
와 중첩되어 이미지 신호
Figure pct00008
를 생성한다. 이미지 신호
Figure pct00009
는 인트라 예측을 위해 인트라 모드 결정 모듈 및 인트라 예측 모듈에 입력되고, 또한 루프 필터링의 대상이 되어 재구성된 이미지 신호
Figure pct00010
를 출력한다. 재구성된 이미지 신호
Figure pct00011
는 모션 추정 및 모션 보상 예측을 위한 다음 프레임에 대한 참조 이미지로서 사용될 수 있다. 다음으로, 모션 보상 예측의 결과
Figure pct00012
및 인트라 예측의 결과
Figure pct00013
에 기초하여 다음 프레임의 예측되는 이미지 신호
Figure pct00014
가 획득된다. 위의 프로세스는 코딩이 완료될 때까지 반복된다.
또한, 잔차 신호가 변환되고 양자화된 후에 획득된 양자화 계수 블록에서, 비제로 계수들은 블록의 좌측 및 상부 영역들에 집중되는 경향이 있는 반면, 블록의 우측 및 하부 영역들은 보통 0이다. 따라서, 스캔 영역 기반 계수 코딩(SRCC) 기술이 도입된다. SRCC 기술로, 각각의 양자화 계수 블록(W×H의 크기를 가짐) 내의 비제로 계수들이 위치하는 좌측 및 상부 영역들의 크기 SRx×SRy가 마킹될 수 있다. SRx는 양자화 계수 블록 내의 최우측 비제로 계수의 가로좌표(abscissa)이고, SRy는 양자화 계수 블록 내의 최하위 비제로 계수의 세로좌표(ordinate)이며, 1≤SRx≤W이고, 1≤SRy≤H이다. 영역 외측의 계수들은 모두 0이다. SRCC 기술은 스캔될 필요가 있는 양자화 계수 블록에서 양자화 계수 영역을 결정하기 위해 (SRx, SRy)를 사용한다. 도 4에 도시된 바와 같이, (SRx, SRy)로 마킹된 스캐닝될 영역에서의 양자화 계수들만이 코딩될 필요가 있다. 예시적으로, 도 5에 도시된 바와 같이, 코딩 동안의 스캔 순서는 하부 우측 코너로부터 상부 좌측 코너를 향하는 역방향 지그재그 스캔 형태일 수 있다.
위의 코딩 프로세스에 기초하여, 디코더 단에서, 각각의 CU에 대해, 압축된 비트 스트림이 취득된 후에, 엔트로피 디코딩이 수행되어 다양한 모드 정보 및 양자화 계수들을 획득한다. 이어서, 양자화 계수들에 대해 역양자화 및 역변환을 수행하여 잔차 신호를 획득한다. 또한, CU에 대응하는 예측된 신호는 알려진 코딩 모드 정보에 따라 획득될 수 있다. 그 후 잔차 신호가 예측된 신호에 더해져서 재구성된 신호를 획득할 수 있다. 재구성된 신호는 그 후 루프 필터링과 같은 동작들의 대상이 되어 최종 출력 신호를 생성한다.
위의 코딩 및 디코딩 동안, 잔차 신호에 대해 수행되는 변환 처리는 잔차 신호의 에너지가 몇몇 저주파수 계수들에 집중되게 하는데, 즉, 대부분의 계수들은 상대적으로 작은 값들을 가진다. 후속 양자화 모듈에 의한 처리 후에, 비교적 작은 계수 값들은 0이 되고, 이는 잔차 신호를 코딩하는 비용을 크게 감소시킨다. 그러나, 다양화된 잔차 분포로 인해, DCT는 모든 잔차 특성들에 적응할 수 없다. 따라서, 이산 사인 변환 7(DST7) 및 이산 코사인 변환 8(DCT8)과 같은 변환 커널들이 변환 프로세스에 적용되고, 잔차 신호의 수평 변환 및 수직 변환은 상이한 변환 커널들을 사용하여 수행될 수 있다. 적응적 다중 코어 변환(AMT) 기술을 예로 들면, 잔차 신호의 변환 처리를 위한 가능한 변환 조합들은 다음과 같다: (DCT2, DCT2), (DCT8, DCT8), (DCT8, DST7), (DST7, DCT8), 및 (DST7, DST7).
잔차 신호에 대한 특정 변환 조합은 코더 단에서 레이트-왜곡 최적화(RDO)를 통해 결정되도록 요구된다. 약한 상관관계를 갖는 일부 잔차 블록들에 대해, 변환 프로세스를 스킵하면서 양자화 프로세스가 직접 수행되면 코딩 효율이 심지어 개선될 수 있다. 변환 프로세스를 스킵할지는 또한 코더 단에서 RDO를 통해 결정되도록 요구된다. 그러나, 이러한 방식은 변환 프로세스가 스킵되는지를 지시하기 위해 각각의 CU에 대한 변환 스킵 플래그를 코딩할 것을 요구하며, 이는 비교적 낮은 비디오 코딩 효율을 초래한다.
위의 문제점들을 고려하여, 본 출원의 실시예들은, 양자화 계수 블록 내의 양자화 계수들을 사용함으로써, 잔차 데이터의 변환 프로세스가 스킵되는지를 암시적으로 지시하는 것을 제안하므로, 변환 스킵 플래그의 코딩이 생략될 수 있고, 이는 비디오 코딩 효율을 효과적으로 개선한다.
본 출원의 이러한 실시예의 기술적 해결책의 구현 상세들은 다음과 같이 상세히 설명된다:
도 6은 본 출원의 실시예에 따른 비디오 디코딩 방법의 흐름도이다. 비디오 디코딩 방법은 전자 디바이스에 의해 수행될 수 있다. 전자 디바이스는 단말 디바이스 또는 서버와 같은 컴퓨팅 처리 기능을 갖는 디바이스이다. 도 6을 참조하면, 비디오 디코딩 방법은 적어도 단계 S610 내지 S630을 포함하며, 이들은 아래와 같이 상세히 설명된다.
단계 S610: 비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하여 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득한다.
본 출원의 실시예에서, 비디오 이미지 프레임 시퀀스는 일련의 비디오 이미지 프레임들을 포함한다. 각각의 비디오 이미지 프레임은 슬라이스들로 더 파티셔닝될 수 있다. 각각의 슬라이스는 일련의 LCU들(또는 CTU들)로 더 파티셔닝될 수 있다. 각각의 LCU는 복수의 CU를 포함한다. 비디오 이미지 프레임은 코딩 동안 블록에 의해 코딩된다. H.264 표준과 같은, 일부 새로운 비디오 코딩 표준들에서, 매크로블록(MB)이 도입된다. MB는 예측 코딩에 사용될 수 있는 복수의 예측 블록으로 더 파티셔닝될 수 있다. HEVC 표준에서, CU, 예측 유닛(PU), 및 변환 유닛(TU)과 같은 기본 개념들에 대한 설명이 제공되고, 다양한 블록 유닛들이 기능들에 따라 파티셔닝되고, 새로운 트리-기반 구조가 설명을 위해 사용된다. 예를 들어, CU는 쿼드트리에 따라 더 작은 CU들로 파티셔닝될 수 있고, 더 작은 CU들은 더 파티셔닝되어 쿼드트리 구조를 형성할 수 있다. 본 출원의 이러한 실시예에서의 코딩 블록은 CU를 코딩함으로써 획득된 블록 또는 CU보다 작은 블록을 코딩함으로써 획득된 블록(예를 들어, CU를 분할함으로써 획득된 더 작은 블록)일 수 있다.
비디오 이미지 프레임의 코딩 블록은 코딩 블록에 대응하는 잔차 데이터에 대해 비디오 코딩을 수행함으로써 획득된다. 비디오 코딩의 최종 단계는 잔차 데이터의 양자화 계수 블록에 대해 엔트로피 코딩을 수행하는 것이다. 따라서, 비디오 디코딩 동안, 먼저 비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하는 것이 필요하다. 엔트로피 디코딩 이후, 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록이 획득된다.
단계 S620: 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득한다.
본 출원의 실시예들 중 하나에서, 잔차 데이터의 양자화 계수 블록이 획득된 후에, 양자화 계수 블록에서 지정된 영역의 양자화 계수들이 직접 계산된다. 본 출원의 다른 실시예에서, 양자화 계수 블록에서 지정된 영역의 양자화 계수들은 역변환 프로세스를 스킵할지에 관한 결정이 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는 것으로 결정하는 경우에 계산된다.
본 출원의 실시예에서, 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있다는 것은 제1 코딩된 데이터의 시퀀스 헤더에 포함된 지정된 인덱스 식별자를 사용하여 지시될 수 있다. 이 실시예에서의 기술적 해결책에서, 전체 비디오 이미지 프레임 시퀀스에 대응하는 코딩 블록들 모두에 대한 지시는 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더 내의 인덱스 식별자를 통해 실현되어, 인덱스 식별자들에 의해 점유된 비트들이 효과적으로 감소될 수 있고, 그에 의해 비디오 코딩 효율을 개선한다.
본 출원의 실시예에서, 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수에 따라 이루어질 필요가 있다는 것은 제2 코딩된 데이터의 이미지 헤더에 포함된 지정된 인덱스 식별자를 사용하여 지시될 수 있다. 본 실시예의 기술적 해결책에서, 전체 비디오 이미지 프레임에 대응하는 코딩 블록들 모두에 대한 지시는 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터의 이미지 헤더 내의 인덱스 식별자를 통해 실현되어, 인덱스 식별자들에 의해 점유되는 비트들이 감소될 수 있고, 그에 의해 비디오 코딩 효율을 개선한다.
본 출원의 실시예에서, 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있다는 것은 제3 코딩된 데이터의 슬라이스 헤더에 포함된 지정된 인덱스 식별자를 사용하여 지시될 수 있다. 이 실시예의 기술적 해결책에서, 전체 슬라이스에 대응하는 코딩 블록들 모두에 대한 지시가 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더 내의 인덱스 식별자를 통해 실현되어, 인덱스 식별자들에 의해 점유된 비트들이 감소될 수 있고, 그에 의해 비디오 코딩 효율을 개선한다.
본 출원의 실시예에서, 비디오 이미지 프레임의 LCU에 대응하는 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수에 따라 이루어질 필요가 있다는 것은 제4 코딩된 데이터의 LCU 헤더에 포함된 지정된 인덱스 식별자를 사용하여 지시될 수 있다. 이 실시예의 기술적 해결책에서, 전체 LCU에 대응하는 코딩 블록들 모두에 대한 지시는 비디오 이미지 프레임에 대응하는 제4 코딩된 데이터의 LCU 헤더 내의 인덱스 식별자를 통해 실현되어, 인덱스 식별자들에 의해 점유되는 비트들이 감소될 수 있고, 그에 의해 비디오 코딩 효율을 개선한다.
본 출원의 실시예에서, 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는지는 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계에 따라 결정될 수 있다. 예시적으로, 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계가 기준 조건을 만족하는 경우, 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정은 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있다. 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계가 기준 조건을 만족시키지 않는 경우, 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정은 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없다. 기준 조건들이 충족되는지는 경험에 따라 구성되거나, 애플리케이션 시나리오에 따라 유연하게 조정된다. 이것은 본 출원의 이러한 실시예에서 제한되지 않는다.
예시적으로, 기준 조건을 만족시키는 것은 코딩 블록들의 크기들이 참조 임계 범위 내에 있음을 의미한다. 예시적으로, 참조 임계 범위는 하위 임계값 및 상위 임계값으로 구성된 범위일 수 있거나, 지정된 임계값보다 작은 범위일 수 있거나, 지정된 임계값보다 큰 범위일 수 있다. 이것은 본 출원의 이러한 실시예에서 제한되지 않는다. 예를 들어, 참조 임계 범위가 지정된 임계값보다 작은 범위인 경우에, 코딩 블록들의 크기들이 비교적 작은 경우(예를 들어, 지정된 임계값보다 작은 경우), 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는 것으로 결정될 수 있다. 반대로, 코딩 블록들의 크기들이 비교적 큰 경우(예를 들어, 지정된 임계값보다 큰 경우), 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없는 것으로 결정될 수 있다. 이러한 실시예의 기술적 해결책에서, 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는지가 추가 비트들을 사용하지 않고 코딩 블록들의 크기들에 따라 암시적으로 지시될 수 있기 때문에, 비디오 코딩 효율이 개선될 수 있다.
본 출원의 실시예에서, 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더에 포함된 인덱스 식별자가 제1 값(예를 들어, 0일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제1 코딩된 데이터 내의 모든 코딩 블록에 대해 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정된다. 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값(예를 들어, 1일 수 있음)인 경우, 비디오 이미지 프레임 시퀀스에서의 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터의 이미지 헤더에 포함된 인덱스 식별자에 따라 결정이 추가로 행해질 수 있다.
본 출원의 실시예에서, 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값(예를 들어, 1일 수 있음)이고, 이미지 헤더에 포함된 인덱스 식별자가 제1 값(예를 들어, 0일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정될 수 있다. 시퀀스 헤더에 포함된 인덱스 식별자 및 이미지 헤더에 포함된 인덱스 식별자가 둘 다 제2 값(예를 들어, 1일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정될 수 있다. 이 경우, 슬라이스 헤더, LCU 헤더, 및 코딩 블록들의 크기는 더 이상 결정에 사용되지 않을 수 있다.
물론, 본 출원의 실시예에서, 시퀀스 헤더에 포함된 인덱스 식별자와 이미지 헤더에 포함된 인덱스 식별자가 둘 다 제2 값(예를 들어, 1일 수 있음)인 경우, 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더에 포함된 인덱스 식별자에 따라 결정이 추가로 이루어질 수 있다. 예를 들어, 시퀀스 헤더에 포함된 인덱스 식별자 및 이미지 헤더에 포함된 인덱스 식별자가 둘 다 제2 값이지만, 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더에 포함된 인덱스 식별자가 제1 값(예를 들어, 0일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정될 수 있다. 시퀀스 헤더에 포함된 인덱스 식별자, 이미지 헤더에 포함된 인덱스 식별자, 및 슬라이스 헤더에 포함된 인덱스 식별자가 모두 제2 값(예를 들어, 1일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정될 수 있다. 이 경우, LCU 헤더 및 코딩 블록들의 크기는 더 이상 결정에 사용되지 않을 수 있다.
물론, 본 출원의 실시예에서, 시퀀스 헤더에 포함된 인덱스 식별자, 이미지 헤더에 포함된 인덱스 식별자, 및 슬라이스 헤더에 포함된 인덱스 식별자가 모두 제2 값(예를 들어, 1일 수 있음)인 경우, 슬라이스의 LCU에 대응하는 제4 코딩된 데이터의 LCU 헤더에 포함된 인덱스 식별자에 따라 결정이 더 이루어질 수 있다. 예를 들어, 시퀀스 헤더에 포함된 인덱스 식별자, 이미지 헤더에 포함된 인덱스 식별자, 및 슬라이스 헤더에 포함된 인덱스 식별자가 모두 제2 값이지만, LCU에 대응하는 제4 코딩된 데이터의 LCU 헤더에 포함된 인덱스 식별자가 제1 값(예를 들어, 0일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수에 따라 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정될 수 있다. 시퀀스 헤더에 포함된 인덱스 식별자, 이미지 헤더에 포함된 인덱스 식별자, 슬라이스 헤더에 포함된 인덱스 식별자, 및 LCU 헤더에 포함된 인덱스 식별자가 모두 제2 값(예를 들어, 1일 수 있음)인 경우, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정될 수 있다. 이 경우, 코딩 블록의 크기들은 더 이상 결정에 사용되지 않을 수 있다.
물론, 본 출원의 실시예에서, 시퀀스 헤더에 포함된 인덱스 식별자, 이미지 헤더에 포함된 인덱스 식별자, 슬라이스 헤더에 포함된 인덱스 식별자, 및 LCU 헤더에 포함된 인덱스 식별자가 모두 제2 값(예를 들어, 1일 수 있음)인 경우, 코딩 블록들의 크기들에 따라 결정이 추가로 이루어질 수 있다. 예를 들어, 시퀀스 헤더에 포함된 인덱스 식별자, 이미지 헤더에 포함된 인덱스 식별자, 슬라이스 헤더에 포함된 인덱스 식별자, 및 LCU 헤더에 포함된 인덱스 식별자가 모두 제2 값이지만, 코딩 블록들의 크기들이 비교적 작은 경우(예를 들어, 지정된 임계값보다 작은 경우), 엔트로피 디코딩을 통해 획득된 양자화 계수 블록에서의 양자화 계수들에 따라 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정될 수 있다. 반대로, 코딩 블록들의 크기들이 비교적 큰 경우(예를 들어, 지정된 임계값보다 큰 경우), 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정될 수 있다.
결론적으로, 역변환 프로세스를 스킵할지에 관한 결정이 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는지는 다음의 방식들로 결정될 수 있다:
1. 이미지 헤더, 슬라이스 헤더, LCU 헤더, 및 코딩 블록의 크기를 사용하여 결정하지 않고 단지 시퀀스 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 시퀀스 헤더 내의 인덱스 식별자가 1인 경우(이는 단지 예일 뿐임), 이는 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수에 따라 이루어질 필요가 있음을 지시한다.
2. 시퀀스 헤더, 슬라이스 헤더, LCU 헤더, 및 코딩 블록들의 크기들을 사용하여 결정하지 않고 단지 이미지 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 이미지 헤더 내의 인덱스 식별자가 1인 경우(단지 예일 뿐임), 이는 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다.
3. 시퀀스 헤더, 이미지 헤더, LCU 헤더, 및 코딩 블록들의 크기를 사용하여 결정하지 않고 단지 슬라이스 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 슬라이스 헤더 내의 인덱스 식별자가 1인 경우(단지 예일 뿐임), 그것은 슬라이스에 대응하는 제3 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다.
4. 시퀀스 헤더, 이미지 헤더, 슬라이스 헤더, 및 코딩 블록들의 크기들을 사용하여 결정하지 않고 단지 LCU 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, LCU 헤더 내의 인덱스 식별자가 1인 경우(단지 예일 뿐임), 이는 LCU에 대응하는 제4 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다.
5. 시퀀스 헤더, 이미지 헤더, 슬라이스 헤더, 및 LCU 헤더를 사용하여 결정하지 않고 단지 코딩 블록들의 크기들을 사용하여 암시적 지시. 예시적으로, 코딩 블록들의 크기들이 비교적 작은 경우(예를 들어, 지정된 임계값보다 작은 경우), 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는 것으로 결정될 수 있다. 반대로, 코딩 블록들의 크기들이 비교적 큰 경우(예를 들어, 지정된 임계값보다 큰 경우), 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없는 것으로 결정될 수 있다.
6. 슬라이스 헤더, LCU 헤더, 및 코딩 블록들의 크기들을 사용하여 결정하지 않고 시퀀스 헤더 내의 인덱스 식별자 및 이미지 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 시퀀스 헤더 내의 인덱스 식별자 및 이미지 헤더 내의 인덱스 식별자가 둘 다 1인 경우(이는 단지 예일 뿐임), 그것은 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 시퀀스 헤더 내의 인덱스 식별자가 1이지만, 이미지 헤더 내의 인덱스 식별자가 0인 경우(이는 단지 예일 뿐임), 이는 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터 내의 모든 코딩 블록에 대해 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수에 따라 이루어질 필요가 없음을 지시한다.
7. LCU 헤더와 코딩 블록들의 크기를 사용하여 결정하지 않고 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 및 슬라이스 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 및 슬라이스 헤더 내의 인덱스 식별자가 모두 1인 경우(단지 예일 뿐임), 그것은 슬라이스에 대응하는 제3 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 예시적으로, 시퀀스 헤더 내의 인덱스 식별자 및 이미지 헤더 내의 인덱스 식별자가 1이지만, 슬라이스 헤더 내의 인덱스 식별자가 0인 경우(단지 예일 뿐임), 그것은 슬라이스에 대응하는 제3 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없음을 지시한다.
8. 코딩 블록들의 크기들을 사용하여 결정을 하지 않고 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, 및 LCU 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, 및 LCU 헤더 내의 인덱스 식별자가 모두 1인 경우(단지 예일 뿐임), 그것은 LCU에 대응하는 제4 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 및 슬라이스 헤더 내의 인덱스 식별자가 1이지만, LCU 헤더 내의 인덱스 식별자가 0인 경우(단지 예일 뿐임), 그것은 LCU에 대응하는 제4 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없음을 지시한다.
9. 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, LCU 헤더 내의 인덱스 식별자, 및 코딩 블록들의 크기들을 사용하여 이루어진 결정. 예시적으로, 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, 및 LCU 헤더 내의 인덱스 식별자가 모두 1이고(단지 예일 뿐임), 코딩 블록들의 크기들이 지정된 임계값보다 작은 경우, 그것은 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 시퀀스 헤더 내의 인덱스 식별자, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자 및 LCU 헤더 내의 인덱스 식별자가 모두 1이지만, 코딩 블록들의 크기들이 지정된 임계값보다 큰 경우, 이는 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없음을 지시한다.
물론, 다음의 방식들이 또한 적용가능하다.
10. 시퀀스 헤더, LCU 헤더 및 코딩 블록들의 크기들을 사용하여 결정하지 않고 이미지 헤더 내의 인덱스 식별자 및 슬라이스 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 이미지 헤더 내의 인덱스 식별자 및 슬라이스 헤더 내의 인덱스 식별자가 1인 경우(단지 예일 뿐임), 그것은 슬라이스에 대응하는 제3 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 예시적으로, 이미지 헤더 내의 인덱스 식별자가 1이지만, 슬라이스 헤더 내의 인덱스 식별자가 0인 경우(단지 예일 뿐임), 그것은 슬라이스에 대응하는 제3 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없음을 지시한다.
11. 시퀀스 헤더 내의 인덱스 식별자 및 코딩 블록들의 크기들을 사용하여 결정하지 않고 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자 및 LCU 헤더 내의 인덱스 식별자를 사용하여 지시. 예시적으로, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, 및 LCU 헤더 내의 인덱스 식별자가 모두 1인 경우(단지 예일 뿐임), 그것은 LCU에 대응하는 제4 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 이미지 헤더 내의 인덱스 식별자 및 슬라이스 헤더 내의 인덱스 식별자가 1이지만, LCU 헤더 내의 인덱스 식별자가 0인 경우(단지 예일 뿐임), 그것은 LCU에 대응하는 제4 코딩된 데이터 내의 코딩 블록들 모두에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없음을 지시한다.
12. 시퀀스 헤더 내의 인덱스 식별자를 사용하지 않고, 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, LCU 헤더 내의 인덱스 식별자, 및 코딩 블록의 크기를 사용하여 이루어진 결정. 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, 및 LCU 헤더 내의 인덱스 식별자가 모두 1이고(이것은 단지 예일 뿐임), 코딩 블록들의 크기들이 지정된 임계값보다 작은 경우, 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있음을 지시한다. 이미지 헤더 내의 인덱스 식별자, 슬라이스 헤더 내의 인덱스 식별자, 및 LCU 헤더 내의 인덱스 식별자가 모두 1이지만, 코딩 블록들의 크기들이 지정된 임계값보다 큰 경우, 그것은 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 없음을 지시한다.
또한, 더 많은 지시 방식들이 본 출원의 실시예들에서 적용가능하고, 이들은 상세히 설명되지 않는다.
본 출원의 실시예에서, 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 계산 동안, 지정된 영역의 양자화 계수들은 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 계산되어 계산된 결과를 획득할 수 있고, 계산된 결과는 양자화 계수 통계 값으로서 직접 사용된다. 대안적으로, 계산된 결과가 획득된 후에, 지정된 값에 대한 계산된 결과의 나머지가 계산될 수 있고, 나머지가 양자화 계수 통계 값으로서 사용될 수 있다. 예시적으로, 지정된 값은 2, 3, 또는 4와 같은 임의의 비-제로 수일 수도 있다.
본 출원의 실시예에서, 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따른 지정된 영역의 양자화 계수들의 계산 동안, 지정된 영역의 양자화 계수들의 값들의 합이 계산될 수 있고, 획득된 합은 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 양자화 계수들의 절대 값들의 합이 계산될 수 있고, 획득된 합이 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 홀수 값의 양자화 계수들의 값들이 제1 값들로 변환될 수 있고, 지정된 영역의 짝수 값의 양자화 계수들의 값들이 제2 값들로 먼저 변환될 수 있고, 그 다음에 값들의 변환 이후 지정된 영역의 양자화 계수들의 값들의 합이 계산되고, 획득된 합이 계산된 결과로서 사용된다. 제1 값들 및 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수이다.
예를 들어, 지정된 영역의 홀수 값의 양자화 계수들의 값들은 1로 변환되고, 짝수 값의 양자화 계수들의 값들은 0으로 변환된다. 대안적으로, 지정된 영역의 홀수 값 양자화 계수들의 값들은 0으로 변환되고, 짝수 값의 양자화 계수들의 값들은 1로 변환된다. 대안적으로, 지정된 영역의 홀수 값 양자화 계수들의 값들은 3으로 변환되고, 짝수 값의 양자화 계수들의 값들은 2로 변환된다. 대안적으로, 지정된 영역의 홀수 값 양자화 계수들의 값들은 2로 변환되고, 짝수 값의 양자화 계수들의 값들은 3으로 변환된다.
본 출원의 실시예에서, 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따른 지정된 영역의 양자화 계수들의 계산 동안, 지정된 영역에서 홀수 값의 양자화 계수들의 수가 계산될 수 있고, 획득된 수는 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 홀수 값 양자화 계수들의 값들의 합이 계산되고, 획득된 합이 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 홀수 값의 양자화 계수들의 절대 값들의 합이 계산되고, 획득된 합이 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 홀수 값의 양자화 계수들의 값들은 제1 값들로 변환될 수 있고, 지정된 영역의 짝수 값의 양자화 계수들의 값들은 제2 값들로 변환될 수 있고, 그 다음에 값들의 변환 이후 지정된 영역의 양자화 계수들의 홀수 값들의 합이 계산되고, 획득된 합은 계산된 결과로서 사용된다. 제1 값들 및 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수이다.
본 출원의 실시예에서, 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따른 지정된 영역의 양자화 계수들의 계산 동안, 지정된 영역의 짝수 값의 양자화 계수들의 수가 계산될 수 있고, 획득된 수는 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 짝수 값의 양자화 계수들의 값들의 합이 계산되고, 획득된 합이 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 짝수 값의 양자화 계수들의 절대 값들의 합이 계산되고, 획득된 합이 계산된 결과로서 사용된다. 대안적으로, 지정된 영역의 홀수 값의 양자화 계수들의 값들은 제1 값들로 변환될 수 있고, 지정된 영역의 짝수 값의 양자화 계수들의 값들은 제2 값들로 변환될 수 있고, 그 다음에 값들의 변환 이후 지정된 영역의 양자화 계수들의 짝수 값들의 합이 계산되고, 획득된 합은 계산된 결과로서 사용된다. 제1 값들 및 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수이다.
결론적으로, 본 출원의 이러한 실시예에서, 지정된 영역의 양자화 계수들은 다음의 방식들로 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 계산될 수 있다:
1. 지정된 영역의 양자화 계수들의 값들의 직접 합산.
2. 지정된 영역의 양자화 계수들의 절대 값들의 합산.
3. 지정된 영역의 양자화 계수들의 패리티에 따라 홀수 값들 및 짝수 값들의 변환 후에 지정된 영역에서 모든 값들의 합산.
4. 지정된 영역에서 홀수 값 양자화 계수들의 수의 계산.
5. 지정된 영역의 홀수 값 양자화 계수들의 값들의 합산.
6. 지정된 영역에서 홀수 값 양자화 계수들의 절대 값들의 합산.
7. 지정된 영역의 양자화 계수들의 패리티에 따라 홀수 값들 및 짝수 값들의 변환 후에 지정된 영역에서 모든 값들의 홀수 값들의 합산.
8. 지정된 영역의 짝수 값의 양자화 계수들의 수의 계산.
9. 지정된 영역의 짝수 값의 양자화 계수들의 값들의 합산.
10. 지정된 영역의 짝수 값의 양자화 계수들의 절대 값들의 합산.
11. 지정된 영역의 양자화 계수들의 패리티에 따라 홀수 값들 및 짝수 값들의 변환 후에 지정된 영역에서 모든 값들의 짝수 값들의 합산.
본 출원의 실시예에서, 지정된 영역은 양자화 계수 블록 내의 모든 영역일 수 있다.
본 출원의 실시예에서, 지정된 영역은 양자화 계수 블록 내의 하나 이상의 지정된 위치일 수 있다.
본 출원의 실시예에서, 지정된 영역은 양자화 계수 블록 내의 적어도 하나의 지정된 행일 수 있다. 도 7에 도시된 바와 같이, 양자화 계수 블록이 4×4 계수 블록이고 각각의 정사각형이 양자화 계수를 표현한다고 가정하는 경우, 도 7의 (a)에 도시된 바와 같이, 그레이 영역들의 1개의 행이 지정된 영역으로서 사용될 수 있고, 또는 도 7의 (b)에 도시된 바와 같이, 그레이 영역들의 2개의 행이 지정된 영역으로서 사용될 수 있다. 선택적으로, 적어도 하나의 행은 양자화 계수 블록 내의 상위 행일 수 있다.
본 출원의 실시예에서, 지정된 영역은 양자화 계수 블록 내의 적어도 하나의 지정된 열일 수 있다. 도 7에 도시된 바와 같이, 양자화 계수 블록이 4×4 계수 블록이고 각각의 정사각형이 양자화 계수를 표현한다고 가정하는 경우, 도 7의 (c)에 도시된 바와 같이, 그레이 영역들의 1개의 열이 지정된 영역으로서 사용될 수 있고, 또는 도 7의 (d)에 도시된 바와 같이, 그레이 영역들의 2개의 열이 지정된 영역으로서 사용될 수 있다. 선택적으로, 적어도 하나의 열은 양자화 계수 블록 내의 좌측 열일 수 있다.
본 출원의 실시예에서, 지정된 영역은 양자화 계수 블록 내의 적어도 하나의 지정된 행 및 적어도 하나의 지정된 열일 수 있다. 도 8에 도시된 바와 같이, 양자화 계수 블록이 4×4 계수 블록이고, 각각의 정사각형이 양자화 계수를 표현한다고 가정하는 경우, 도 8의 (a)에 도시된 바와 같이, 1개의 하부 행과 1개의 우측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있고, 또는 도 8의 (b)에 도시된 바와 같이, 2개의 하부 행과 2개의 우측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있고, 도 8의 (c)에 도시된 바와 같이, 1개의 상부 행과 1개의 좌측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있고, 또는 도 8의 (d)에 도시된 바와 같이, 2개의 상부 행과 2개의 좌측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있다.
본 출원의 실시예에서, 지정된 영역은 적어도 하나의 대각선 상의 양자화 계수 블록 내의 위치들일 수 있다. 도 9에 도시한 바와 같이, 양자화 계수 블록이 4×4 계수 블록이며, 각각의 정사각형이 양자화 계수를 표현하는 것으로 가정하는 경우, 도 9의 (a) 및 (b)에 도시한 바와 같이, 1개의 대각선 상의 위치들이 지정된 영역으로서 사용될 수 있고, 또는 도 9의 (c) 및 (d)에 도시한 바와 같이, 2개의 대각선 상의 위치들이 지정된 영역으로서 사용될 수 있다.
본 출원의 실시예에서, 지정된 영역은 양자화 계수 블록 내의 SRCC 영역일 수 있다. SRCC 영역은 SRCC 기술을 사용하여 마킹된 스캐닝될 영역이다.
본 출원의 실시예에서, 지정된 영역은 SRCC 영역 내의 하나 이상의 지정된 위치일 수 있다. 선택적으로, SRCC 영역 내의 하나 이상의 지정된 위치는 스캔 순서에서 처음 N개의 위치를 포함할 수 있고, N은 0 이외의 자연 수이다.
본 출원의 실시예에서, 지정된 영역은 SRCC 영역 내의 적어도 하나의 지정된 행일 수 있다. 도 7에 도시한 바와 같이, SRCC 영역이 4×4 계수 블록이며, 각각의 정사각형이 양자화 계수를 표현하는 것으로 가정하는 경우, 도 7의 (a)에 도시한 바와 같이, 그레이 영역들의 1개의 행이 지정된 영역으로서 사용될 수 있고, 또는 도 7의 (b)에 도시한 바와 같이, 그레이 영역들의 2개의 행이 지정된 영역으로서 사용될 수 있다. 선택적으로, 적어도 하나의 행은 양자화 계수 블록 내의 SRCC 영역에서 상위 행일 수 있다.
본 출원의 실시예에서, 지정된 영역은 SRCC 영역 내의 적어도 하나의 지정된 열일 수 있다. 도 7에 도시한 바와 같이, SRCC 영역이 4×4 계수 블록이며, 각각의 정사각형이 양자화 계수를 표현하는 것으로 가정하는 경우, 도 7의 (c)에 도시한 바와 같이, 그레이 영역들의 1개의 열이 지정된 영역으로서 사용될 수 있고, 또는 도 7의 (d)에 도시한 바와 같이, 그레이 영역들의 2개의 열이 지정된 영역으로서 사용될 수 있다. 선택적으로, 적어도 하나의 열은 양자화 계수 블록 내의 SRCC 영역에서 좌측 열일 수 있다.
본 출원의 실시예에서, 지정된 영역은 SRCC 영역에서 적어도 하나의 지정된 행 및 적어도 하나의 지정된 열일 수 있다. 도 8에 도시한 바와 같이, SRCC 영역이 4×4 계수 블록이며, 각각의 정사각형이 양자화 계수를 표현하는 것으로 가정하는 경우, 도 8의 (a)에 도시한 바와 같이, 1개의 하부 행과 1개의 우측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있거나, 도 8의 (b)에 도시한 바와 같이, 2개의 하부 행과 2개의 우측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있거나, 도 8의 (c)에 도시한 바와 같이, 1개의 상부 행과 1개의 좌측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있거나, 도 8의 (d)에 도시한 바와 같이, 2개의 상부 행과 2개의 좌측 열(즉, 그레이 영역들)이 지정된 영역으로서 사용될 수 있다.
본 출원의 실시예에서, 지정된 영역은 적어도 하나의 대각선 상의 SRCC 영역 내의 위치들일 수 있다. 도 9에 도시된 바와 같이, SRCC 영역이 4×4 계수 블록이고 각각의 정사각형이 양자화 계수를 표현한다고 가정하는 경우, 도 9의 (a) 및 (b)에 도시된 바와 같이, 1개의 대각선 상의 위치들이 지정된 영역으로서 사용될 수 있고, 또는 도 9의 (c) 및 (d)에 도시된 바와 같이, 2개의 대각선 상의 위치들이 지정된 영역으로서 사용될 수 있다.
본 출원의 다른 실시예들에서, 위의 실시예에서의 지정된 영역 분할 방식들이 조합될 수 있고, 조합된 영역이 지정된 영역으로서 사용된다.
여전히 도 6을 참조한다. 단계 S630: 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정.
본 출원의 실시예에서, 양자화 계수 통계 값의 패리티에 따라 역변환 프로세스를 스킵할지가 결정될 수 있다. 예를 들면, 양자화 계수 통계 값이 홀수인 경우에는 역변환 프로세스를 스킵하는 것으로 결정되고, 양자화 계수 통계 값이 짝수인 경우에는 역변환 프로세스를 수행하는 것으로 결정된다. 대안적으로, 양자화 계수 통계 값이 홀수인 경우에는 역변환 프로세스를 수행하는 것으로 결정되고, 양자화 계수 통계 값이 짝수인 경우에는 역변환 프로세스를 스킵하는 것으로 결정된다.
본 출원의 실시예에서, 양자화 계수 통계 값의 규모에 따라 역변환 프로세스를 스킵할지가 결정될 수 있다. 예를 들면, 양자화 계수 통계 값이 제1 값 세트에 속하는 경우에는 역변환 프로세스를 스킵하는 것으로 결정되고, 양자화 계수 통계 값이 제1 값 세트에 속하지 않는 경우에는 역변환 프로세스를 수행하는 것으로 결정된다. 대안적으로, 양자화 계수 통계 값이 제1 값 세트에 속하는 경우에는 역변환 프로세스를 스킵하는 것으로 결정되고, 양자화 계수 통계 값이 제1 값 세트에 속하지 않는 경우에는 역변환 프로세스를 수행하는 것으로 결정된다. 제1 값 세트는 경험에 따라 설정되거나, 애플리케이션 시나리오에 따라 유연하게 조정된다. 예를 들어, 제1 값 세트는 (0, 2, 4, 6, 8, 10)이다.
본 출원의 특정 예에서, 양자화 계수 통계 값이 제1 값 세트에 속할 때 역 변환 프로세스를 스킵하는 것으로 결정되고 양자화 계수 통계 값이 제1 값 세트에 속하지 않을 때 역 변환 프로세스를 수행하는 것으로 결정되는 것으로 가정된다. 또한, 양자화 계수 통계 값은 4에 대한 양자화 계수의 계산 결과의 나머지이고(이는 단지 예일 뿐임), 제1 값 세트는 (0, 1, 2)인 것으로 가정된다. 따라서, 양자화 계수 통계 값이 2일 때, 역변환 프로세스를 스킵하는 것으로 결정된다. 양자화 계수 통계 값이 3일 때, 역변환 프로세스를 수행하는 것으로 결정된다.
유사하게, 양자화 계수 통계 값이 제1 값 세트에 속할 때 역변환 프로세스를 수행하는 것으로 결정되고 양자화 계수 통계 값이 제1 값 세트에 속하지 않을 때 역변환 프로세스를 스킵하는 것으로 결정되는 것으로 가정된다. 또한, 양자화 계수 통계 값은 4에 대한 양자화 계수의 계산 결과의 나머지이고(이는 단지 예일 뿐임), 제1 값 세트는 (0, 1, 2)인 것으로 가정된다. 따라서, 양자화 계수 통계 값이 2일 때, 역변환 프로세스를 수행하는 것으로 결정된다. 양자화 계수 통계 값이 3일 때, 역변환 프로세스를 스킵하는 것으로 결정된다.
본 출원의 실시예에서, 역변환 프로세스를 스킵하는 것으로 결정되는 경우, 양자화 계수 블록에 대해 역양자화 프로세스가 직접 수행되고, 역양자화 프로세스의 결과가 재구성된 잔차 데이터로서 사용된다. 역변환 프로세스를 수행하는 것으로 결정되는 경우, 양자화 계수 블록에 대해 역양자화가 먼저 수행되고, 다음으로 코딩 블록의 코딩 동안 사용되는 변환 행렬 조합에 기초하여 역양자화의 결과에 대해 역변환 프로세스가 수행되어, 재구성된 잔차 데이터를 획득한다. 선택적으로, 역 변환 동안 사용되는 변환 행렬 조합은 (DCT2, DCT2), (DCT8, DCT8), (DCT8, DST7), (DST7, DCT8), 또는 (DST7, DST7) 중 어느 하나일 수 있다.
본 출원의 위의 실시예에서의 기술적 해결책에서, 코더 단이 변환 프로세스를 스킵하는지는 양자화 계수 블록 내의 양자화 계수들을 사용하여 암시적으로 지시될 수 있어, 디코더 단은 역 변환 프로세스를 수행할지를 결정할 수 있고, 이는 코더 단에 의한 각각의 CU에 대한 변환 스킵 플래그의 코딩을 회피하고, 그에 의해 비디오 코딩 효율을 효과적으로 개선한다.
도 10은 본 출원의 실시예에 따른 비디오 코딩 방법의 흐름도이다. 비디오 코딩 방법은 전자 디바이스에 의해 수행된다. 전자 디바이스는 단말 디바이스 또는 서버와 같은 컴퓨팅 처리 기능을 갖는 디바이스이다. 도 10을 참조하면, 비디오 코딩 방법은 적어도 단계들 S810 내지 S830을 포함하고, 이들은 다음과 같이 상세히 설명된다:
단계 S810: 비디오 이미지 프레임의 코딩 블록을 취득하기 위해 요구된 잔차 데이터에 대한 변환을 스킵하고 양자화를 직접 수행하여, 잔차 데이터의 제1 양자화 계수 블록을 획득하고; 잔차 데이터에 대해 변환 및 양자화를 연속적으로 수행하여 잔차 데이터의 제2 양자화 계수 블록을 획득.
비디오 코딩 동안, 잔차 데이터의 양자화 계수 블록은 변환 처리를 스킵함으로써 또는 변환 처리를 스킵하지 않고 획득된다. 최종 양자화 계수 블록을 획득하기 위해 적절한 방식이 선택된다. 본 출원의 이러한 실시예에서, 잔차 데이터는 변환 프로세스를 스킵하는(즉, 변환을 스킵하고 양자화를 직접 수행하는) 방식으로 처리되어, 잔차 데이터의 제1 양자화 계수 블록을 획득하고, 잔차 데이터는 변환 프로세스를 스킵하지 않는(즉, 변환 및 양자화를 연속적으로 수행하는) 방식으로 처리되어, 잔차 데이터의 제2 양자화 계수 블록을 획득한다.
단계 S820: 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득- 제3 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 스킵하도록 지시하기 위해 사용되고, 제3 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하고; 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득- 제4 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 수행하도록 지시하기 위해 사용되고, 제4 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -.
변환 프로세스가 스킵되는지를 암시적으로 지시하기 위해 양자화 계수 블록 내의 양자화 계수들을 사용하기 위해, 변환 처리를 스킵함으로써 획득된 양자화 계수 블록 및 변환 처리를 스킵하지 않고 획득된 양자화 계수 블록에 상이한 특성들이 배정되도록 요구된다. 본 출원의 이러한 실시예에서, 변환 처리를 스킵함으로써 획득된 양자화 계수 블록에 배정된 특성은 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되는 것이다. 변환 처리를 스킵하지 않고 획득된 양자화 계수 블록에 배정된 특성은 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용된다는 것이다. 양자화 계수 블록에 대응하는 양자화 계수 통계 값을 획득하는 방식 및 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되는지를 결정하는 방식에 대해서는, 도 6에 도시된 실시예를 참조한다. 세부사항들은 본 명세서에서 반복되지 않는다.
일부 실시예들에서, 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득하는 프로세스는 다음을 포함한다: 제1 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되는 것에 응답하여 제1 양자화 계수 블록을 제3 양자화 계수 블록으로서 사용하는 단계; 및 제1 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용되는 것에 응답하여, 조정된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되도록 제1 양자화 계수 블록 내의 하나 이상의 양자화 계수를 조정하고, 조정된 양자화 계수 블록을 제3 양자화 계수 블록으로서 사용하는 단계. 조정된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되도록 제1 양자화 계수 블록 내의 하나 이상의 양자화 계수를 조정하는 방식은 경험에 따라 구성되거나, 또는 애플리케이션 시나리오에 따라 유연하게 조정된다.
예시적으로, 역변환 프로세스를 스킵하도록 지시하기 위해 사용되는 양자화 계수 통계 값은 양자화 계수 통계 값이 홀수임을 의미하는 것으로 가정된다. 제1 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 짝수인 경우, 조정된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되도록 제1 양자화 계수 블록 내의 하나 이상의 양자화 계수를 조정하는 방식은 다음과 같을 수 있다: 제1 양자화 계수 블록 내의 양자화 계수들 중 임의의 하나의 값을 1만큼 증가 또는 감소.
일부 실시예들에서, 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득하는 프로세스는 다음을 포함한다: 제2 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용되는 것에 응답하여 제2 양자화 계수 블록을 제4 양자화 계수 블록으로서 사용하는 것; 및 제2 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되는 것에 응답하여 조정된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용되도록 제2 양자화 계수 블록 내의 하나 이상의 양자화 계수를 조정하고, 조정된 양자화 계수 블록을 제4 양자화 계수 블록으로서 사용하는 것. 조정된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용되도록 제2 양자화 계수 블록 내의 하나 이상의 양자화 계수를 조정하는 방식은 경험에 따라 구성되거나, 또는 애플리케이션 시나리오에 따라 유연하게 조정된다.
예시적으로, 역변환 프로세스를 수행하도록 지시하기 위해 사용되는 양자화 계수 통계 값은 양자화 계수 통계 값이 홀수임을 의미하는 것으로 가정된다. 제2 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 홀수인 경우, 조정된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용되도록 제2 양자화 계수 블록 내의 하나 이상의 양자화 계수를 조정하는 방식은 다음과 같을 수 있다: 제2 양자화 계수 블록 내의 양자화 계수들 중 임의의 하나의 값을 1만큼 증가 또는 감소.
단계 S830: 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩을 수행하여, 비디오 이미지 프레임의 코딩 블록을 획득.
제3 양자화 계수 블록 및 제4 양자화 계수 블록이 획득된 후에, 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩이 수행된다. 예시적으로, 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 어느 것이 선택 조건을 만족하는지는 RDO를 통해 결정될 수 있다. 예시적으로, 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 상대적으로 낮은 코딩 비용을 갖는 것이 선택 조건을 만족하는 양자화 계수 블록으로서 사용된다.
선택 조건을 만족하는 양자화 계수 블록에 대해 엔트로피 코딩이 수행된 후에, 비디오 이미지 프레임의 코딩 블록이 획득된다.
예시적으로, 제3 양자화 계수 블록 및 제4 양자화 계수 블록 둘 다에서의 양자화 계수들이 역변환 프로세스를 스킵할지에 관한 결정을 위해 사용될 수 있기 때문에, 제3 양자화 계수 블록 또는 제4 양자화 계수 블록이 선택 조건을 충족하는지에 관계없이, 획득된 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는 것으로 간주된다. 예시적으로, 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는지를 결정하는 방식이 코더 단에서 생성되고, 결정 방식은 디코더 단에 동기화된다. 이러한 방식으로, 디코더 단은 엔트로피 디코딩을 통해 획득되는 양자화 계수 블록 내의 양자화 계수들에 따라 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는지를 결정할 수 있다. 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는지를 결정하는 방식에 대해서는, 도 6에 도시된 실시예를 참조하고, 세부사항들은 본 명세서에서 설명되지 않는다.
본 출원의 이러한 실시예에서 제공되는 해결책에 기초하여, 코딩 블록의 엔트로피 디코딩을 통해 획득된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 스킵하도록 지시하기 위해 사용되는 경우, 이는 제3 양자화 계수 블록이 선택 조건을 충족한다는 것을 지시한다. 제3 양자화 계수 블록이 제1 양자화 계수 블록에 기초하여 획득되고, 제1 양자화 계수 블록이 변환 프로세스를 스킵함으로써 획득되기 때문에, 양자화 계수 블록의 디코딩 동안, 역 변환 프로세스가 스킵될 필요가 있는 것으로 결정될 수 있다. 코딩 블록의 엔트로피 디코딩을 통해 획득된 양자화 계수 블록에 대응하는 양자화 계수 통계 값이 역변환 프로세스를 수행하도록 지시하기 위해 사용되는 경우, 이는 제4 양자화 계수 블록이 선택 조건을 만족시킨다는 것을 지시한다. 제4 양자화 계수 블록이 제2 양자화 계수 블록에 기초하여 획득되고, 제2 양자화 계수 블록이 변환 프로세스를 스킵하지 않고 획득되기 때문에, 양자화 계수 블록의 디코딩 동안, 역 변환 프로세스가 수행될 필요가 있는 것으로 결정될 수 있다.
본 출원의 위의 실시예에서의 기술적 해결책에서, 코더 단이 변환 프로세스를 스킵하는지는 양자화 계수 블록 내의 양자화 계수들을 사용하여 암시적으로 지시될 수 있고, 이는 코더 단에 의한 각각의 CU에 대한 변환 스킵 플래그의 코딩을 회피하고, 그에 의해 비디오 코딩 효율을 효과적으로 개선한다.
본 출원의 실시예는 비디오 처리 시스템을 제공한다. 비디오 처리 시스템은 비디오 코딩 장치 및 비디오 디코딩 장치를 포함한다. 비디오 코딩 장치는 도 10에 도시된 실시예에서의 비디오 코딩 방법을 수행하도록 구성된다. 비디오 디코딩 장치는 도 6에 도시된 실시예에서의 비디오 디코딩 방법을 수행하도록 구성된다.
본 출원의 장치 실시예들이 아래에 설명되며, 이는 본 출원의 위의 실시예들에서의 비디오 디코딩 방법 및 비디오 코딩 방법을 수행하기 위해 사용될 수 있다. 본 출원의 장치 실시예들에 개시되지 않은 세부사항들에 대해서는, 본 출원의 비디오 디코딩 방법 및 비디오 코딩 방법의 위의 실시예들을 참조한다.
도 11은 본 출원의 실시예에 따른 비디오 디코딩 장치의 블록도이다. 비디오 디코딩 장치는 컴퓨팅 및 처리 기능을 갖는 디바이스, 이를테면 단말 디바이스 또는 서버에 배열될 수 있다.
도 11을 참조하면, 본 출원의 실시예에 따른 비디오 디코딩 장치(1000)는 디코딩 유닛(1002), 계산 유닛(1004) 및 결정 유닛(1006)을 포함한다.
디코딩 유닛(1002)은 비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하여 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득하도록 구성된다. 계산 유닛(1004)은 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득하도록 구성된다. 결정 유닛(1006)은 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하도록 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 계산 유닛(1004)은 역변환 프로세스를 스킵할지에 관한 결정이 양자화 계수 블록 내의 양자화 계수들에 따라 이루어질 필요가 있는 경우에 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하도록 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 비디오 디코딩 장치(1000)는 다음을 추가로 포함한다: 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제1 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 구성된 제1 결정 유닛.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 비디오 디코딩 장치(1000)는 다음을 추가로 포함한다: 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터의 이미지 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수에 따라 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 구성된 제2 결정 유닛.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 비디오 디코딩 장치(1000)는 다음을 추가로 포함한다: 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩에 의해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 구성된 제3 결정 유닛.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 비디오 디코딩 장치(1000)는 다음을 추가로 포함한다: 비디오 이미지 프레임의 LCU에 대응하는 제4 코딩된 데이터의 LCU 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩에 의해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 구성된 제4 결정 유닛.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 비디오 디코딩 장치(1000)는 다음을 추가로 포함한다: 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계에 따라, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는지를 결정하도록 구성된 제5 결정 유닛.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 비디오 디코딩 장치(1000)는 다음을 추가로 포함한다: 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더에 포함된 인덱스 식별자가 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제1 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하도록 구성된 제6 결정 유닛.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은 비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고 비디오 이미지 프레임 시퀀스에서의 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터의 이미지 헤더에 포함된 인덱스 식별자가 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은 시퀀스 헤더에 포함되는 인덱스 식별자가 제2 값이고 이미지 헤더에 포함되는 인덱스 식별자가 제2 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고, 이미지 헤더에 포함된 인덱스 식별자가 제2 값이며, 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더에 포함된 인덱스 식별자가 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록에서의 양자화 계수들에 따라 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고, 이미지 헤더에 포함된 인덱스 식별자가 제2 값이며, 슬라이스 헤더에 포함된 인덱스 식별자가 제2 값인 경우에, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은, 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고, 이미지 헤더에 포함된 인덱스 식별자가 제2 값이고, 슬라이스 헤더에 포함된 인덱스 식별자가 제2 값이고, 슬라이스의 LCU에 대응하는 제4 코딩된 데이터의 LCU 헤더에 포함된 인덱스 식별자가 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고, 이미지 헤더에 포함된 인덱스 식별자가 제2 값이고, 슬라이스 헤더에 포함된 인덱스 식별자가 제2 값이고, LCU 헤더에 포함된 인덱스 식별자가 제2 값인 경우에, 엔트로피 디코딩에 의해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 제6 결정 유닛은, LCU 내의 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계에 따라, 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고, 이미지 헤더에 포함된 인덱스 식별자가 제2 값이고, 슬라이스 헤더에 포함된 인덱스 식별자가 제2 값이고, LCU 헤더에 포함된 인덱스 식별자가 제2 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는지를 결정하도록 추가로 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 계산 유닛(1004)은: 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 양자화 계수들을 계산하여 계산된 결과를 획득하고, 계산된 결과를 양자화 계수 통계 값으로서 사용하고; 또는
양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 양자화 계수들을 계산하여 계산된 결과를 획득하고, 지정된 값에 대해 계산된 결과의 나머지를 계산하고, 나머지를 양자화 계수 통계 값으로서 사용하도록 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 계산 유닛(1004)은: 지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하고; 또는
양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 양자화 계수들의 절대 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 홀수 값의 양자화 계수들의 값들을 제1 값들로 그리고 지정된 영역의 짝수 값의 양자화 계수들의 값들을 제2 값들로 변환하고, 값들의 변환 후에 지정된 영역의 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하도록 구성되고, 제1 값들 및 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수이다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 계산 유닛(1004)은: 지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역에서 홀수 값의 양자화 계수들의 수를 계산하고, 획득된 수를 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 홀수 값의 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 홀수 값의 양자화 계수들의 절대 값들의 합을 계산하고, 획득된 수를 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 홀수 값 양자화 계수들의 값들을 제1 값들로 변환하고 지정된 영역의 짝수 값의 양자화 계수들의 값들을 제2 값들로 변환하고, 값들의 변환 후에 지정된 영역의 양자화 계수들의 홀수 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하도록 구성되고, 제1 값들 및 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수이다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 계산 유닛(1004)은: 지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 짝수 값의 양자화 계수들의 수를 계산하고, 획득된 수를 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 짝수 값의 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라 지정된 영역의 짝수 값의 양자화 계수들의 절대 값들의 합을 계산하고, 획득된 수를 계산된 결과로서 사용하고; 또는
지정된 영역의 양자화 계수들의 값들에 따라, 지정된 영역의 홀수 값의 양자화 계수들의 값들을 제1 값들로 변환하고 지정된 영역의 짝수 값의 양자화 계수들의 값들을 제2 값들로 변환하고, 값들의 변환 후에 지정된 영역의 양자화 계수들의 짝수 값들의 합을 계산하고, 획득된 합을 계산된 결과로서 사용하도록 구성되고, 제1 값들 및 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수이다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 지정된 영역은 다음 중 어느 하나를 포함한다:
양자화 계수 블록 내의 모든 영역들;
양자화 계수 블록 내의 하나 이상의 지정된 위치;
양자화 계수 블록 내의 적어도 하나의 지정된 행;
양자화 계수 블록 내의 적어도 하나의 지정된 열;
양자화 계수 블록 내의 적어도 하나의 지정된 행 및 적어도 하나의 지정된 열; 또는
적어도 하나의 대각선 상의 상기 양자화 계수 블록 내의 위치들.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 지정된 영역은 다음 중 어느 하나를 포함한다:
양자화 계수 블록 내의 SRCC 영역;
SRCC 영역 내의 하나 이상의 지정된 위치;
SRCC 영역 내의 적어도 하나의 지정된 행;
SRCC 영역 내의 적어도 하나의 지정된 열;
SRCC 영역 내의 적어도 하나의 지정된 행 및 적어도 하나의 지정된 열; 또는
적어도 하나의 대각선 상의 SRCC 영역 내의 위치.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, SRCC 영역 내의 하나 이상의 지정된 위치는 스캔 순서에서 처음 N개의 위치를 포함하고, N은 0 이외의 자연수이다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 결정 유닛(1006)은: 양자화 계수 통계 값이 홀수인 경우에 역변환 프로세스를 스킵하는 것으로 결정하고, 양자화 계수 통계 값이 짝수인 경우에 역변환 프로세스를 수행하는 것으로 결정하고; 또는
양자화 계수 통계 값이 홀수인 경우에 역변환 프로세스를 수행하는 것으로 결정하고, 양자화 계수 통계 값이 짝수인 경우에 역변환 프로세스를 스킵하는 것으로 결정하도록 구성된다.
본 출원의 일부 실시예들에서, 위의 해결책에 기초하여, 결정 유닛(1006)은: 양자화 계수 통계 값이 제1 값 세트에 속하는 경우에 역변환 프로세스를 스킵하는 것으로 결정하고, 양자화 계수 통계 값이 제1 값 세트에 속하지 않는 경우에 역변환 프로세스를 수행하는 것으로 결정하고; 또는
양자화 계수 통계 값이 제1 값 세트에 속하는 경우에 역변환 프로세스를 수행하는 것으로 결정하고, 양자화 계수 통계 값이 제1 값 세트에 속하지 않는 경우에 역변환 프로세스를 스킵하는 것으로 결정하도록 구성된다.
도 12는 본 출원의 실시예에 따른 비디오 코딩 장치의 블록도이다. 비디오 코딩 장치는 컴퓨팅 및 처리 기능을 갖는 전자 디바이스, 이를테면 단말 디바이스 또는 서버에 배열될 수 있다.
도 12를 참조하면, 본 출원의 실시예에 따른 비디오 코딩 장치(1200)는 처리 유닛(1202) 및 취득 유닛(1204)을 포함한다.
처리 유닛(1202)은 비디오 이미지 프레임의 코딩 블록을 취득하기 위해 요구된 잔차 데이터에 대해 변환을 스킵하고 양자화를 직접 수행하여, 잔차 데이터의 제1 양자화 계수 블록을 획득하고; 잔차 데이터에 대해 변환 및 양자화를 연속적으로 수행하여 잔차 데이터의 제2 양자화 계수 블록을 획득하도록 구성된다.
취득 유닛(1204)은: 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득- 제3 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 스킵하도록 지시하기 위해 사용되고, 제3 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하고; 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득- 제4 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 수행하도록 지시하기 위해 사용되고, 제4 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하도록 구성된다.
처리 유닛(1202)은 제3 양자화 계수 블록 및 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩을 수행하여, 비디오 이미지 프레임의 코딩 블록을 획득하도록 추가로 구성된다.
도 13은 본 출원의 실시예에 따른 전자 디바이스를 구현하도록 적응된 컴퓨터 시스템의 개략적인 구조도이다.
도 13에 도시된 전자 디바이스의 컴퓨터 시스템(1100)은 단지 예이고, 본 출원의 실시예들의 기능들 및 사용 범위들에 대한 임의의 제한을 구성하지 않는다.
도 13에 도시된 바와 같이, 컴퓨터 시스템(1100)은, 판독 전용 메모리(ROM)(1102)에 저장된 프로그램 또는 저장부(1108)로부터 랜덤 액세스 메모리(RAM)(1103)에 로딩된 프로그램에 기초하여 다양한 적절한 액션 및 처리를 수행, 예를 들어, 전술된 실시예들에서 설명된 방법을 수행할 수 있는, 중앙 처리 유닛(CPU)(1101)을 포함한다. RAM(1103)은 시스템 동작들에 요구되는 다양한 프로그램들 및 데이터를 추가로 저장한다. CPU(1101), ROM(1102) 및 RAM(1103)은 버스(1104)를 사용하여 서로 접속된다. 입력/출력(I/O) 인터페이스(1105)도 버스(1104)에 접속된다.
다음의 컴포넌트들은 I/O 인터페이스(1105)에 접속된다: 키보드, 마우스 등을 포함하는 입력부(1106); 음극선관(CRT), 액정 디스플레이(LCD), 스피커 등을 포함하는 출력부(1107); 하드 디스크 등을 포함하는 저장부(1108); 및 근거리 통신 네트워크(LAN) 카드, 모뎀 등과 같은 네트워크 인터페이스 카드를 포함하는 통신부(1109). 통신부(1109)는 인터넷과 같은 네트워크를 사용하여 통신 처리를 수행한다. 드라이버(1110)는 또한 필요에 따라 I/O 인터페이스(1105)에 접속된다. 자기 디스크, 광 디스크, 광자기 디스크 또는 반도체 메모리와 같은 이동식 매체(1111)가 요구에 따라 드라이브(1110) 상에 설치되어, 이동식 매체로부터 판독된 컴퓨터 프로그램이 요구에 따라 저장부(1108)에 설치된다.
예시적으로, 본 출원의 실시예에 따르면, 흐름도들을 참조하여 위에 설명된 프로세스들은 컴퓨터 소프트웨어 프로그램들로서 구현될 수 있다. 예를 들어, 본 출원의 실시예는 컴퓨터 프로그램 제품을 포함한다. 컴퓨터 프로그램 제품은 컴퓨터-판독가능 매체에 저장되는 컴퓨터 프로그램을 포함한다. 컴퓨터 프로그램은 흐름도에 도시되는 방법을 수행하기 위해 사용되는 컴퓨터 프로그램을 포함한다. 이러한 실시예에서, 컴퓨터 프로그램은 통신 부분(1109)을 통해 네트워크로부터 다운로드되어 설치, 및/또는 이동식 매체(1111)로부터 설치될 수 있다. 컴퓨터 프로그램이 CPU(1101)에 의해 실행될 때, 본 출원의 시스템에서 정의된 다양한 기능들이 실행된다.
본 출원의 실시예들에 도시된 컴퓨터 판독가능 매체는 컴퓨터 판독가능 신호 매체 또는 컴퓨터 판독가능 저장 매체 또는 이들의 임의의 조합일 수 있다. 컴퓨터 판독가능 저장 매체는, 예를 들어, 전기, 자기, 광학, 전자기, 적외선 또는 반도체 시스템, 장치 또는 컴포넌트, 또는 이들의 임의의 조합일 수 있지만 이에 제한되지 않는다. 컴퓨터 판독가능 저장 매체의 보다 구체적인 예는: 하나 이상의 와이어, 휴대용 컴퓨터 자기 디스크, 하드 디스크, RAM(random access memory), ROM(read-only memory), EPROM(erasable programmable read-only memory), 플래시 메모리, 광섬유, CD-ROM(compact disc read-only memory), 광학 저장 디바이스, 자기 저장 디바이스, 또는 이들의 임의의 적합한 조합을 갖는 전기 커넥션을 포함할 수 있지만 이에 제한되지 않는다.
본 출원에서, 컴퓨터 판독가능 저장 매체는 프로그램을 포함하거나 저장하는 임의의 유형 매체일 수 있고, 프로그램은 명령어 실행 시스템, 장치, 또는 디바이스에 의해 사용되거나 그와 조합하여 사용될 수 있다. 그러나, 본 출원에서, 컴퓨터 판독가능 신호 매체는 컴퓨터 판독가능 컴퓨터 프로그램을 운반하는, 기저대역 내의 또는 캐리어의 일부로서 전파되는 데이터 신호를 포함할 수 있다. 본 출원에서, 컴퓨터 판독가능 저장 매체는 프로그램을 포함하거나 저장하는 임의의 유형 매체일 수 있고, 프로그램은 명령어 실행 시스템, 장치, 또는 디바이스에 의해 사용되거나 그와 조합하여 사용될 수 있다. 컴퓨터 판독가능 신호 매체는 대안적으로 컴퓨터 판독가능 저장 매체 이외의 임의의 컴퓨터 판독가능 매체일 수 있다. 컴퓨터 판독가능 매체는 명령어 실행 시스템, 장치, 또는 디바이스에 의해 또는 그와 조합하여 사용되는 프로그램을 전송, 전파, 또는 송신하도록 구성될 수 있다. 컴퓨터 판독가능 매체에 포함된 컴퓨터 프로그램은: 무선 매체, 와이어 등 또는 이들의 임의의 적합한 조합을 포함하지만 이에 제한되지 않는 임의의 적합한 매체를 사용하여 송신될 수 있다.
첨부 도면들에서의 흐름도들 및 블록도들은 본 출원의 다양한 실시예에 따른 시스템, 방법, 및 컴퓨터 프로그램 제품에 의해 구현될 수 있는 가능한 시스템 아키텍처들, 기능들, 및 동작들을 예시한다. 흐름도 또는 블록도에서의 각각의 박스는 모듈, 프로그램 세그먼트, 또는 코드의 일부를 표현할 수 있다. 모듈, 프로그램 세그먼트, 또는 코드의 일부는 지정된 논리 기능들을 구현하기 위해 사용되는 하나 이상의 실행가능 명령어를 포함한다. 대체물로서 사용되는 일부 구현들에서, 박스들에서의 주석이 달린 기능들이 대안적으로 첨부 도면들에서의 주석이 달린 것과 상이한 시퀀스로 발생할 수 있다. 예를 들어, 실제로 순차적으로 도시된 2개의 박스가 기본적으로 병렬로 수행될 수 있으며, 때로는 2개의 박스가 역시퀀스로 수행될 수 있다. 이것은 관련 기능에 의해 결정된다. 블록도 및/또는 흐름도 내의 각각의 박스 및 블록도 및/또는 흐름도 내의 박스들의 조합은 지정된 기능 또는 동작을 수행하도록 구성된 전용 하드웨어 기반 시스템을 사용하여 구현될 수 있거나, 전용 하드웨어와 컴퓨터 명령어의 조합을 사용하여 구현될 수 있다.
본 출원의 실시예들에서 설명된 관련 유닛들은 소프트웨어 방식으로 구현될 수 있거나, 하드웨어 방식으로 구현될 수 있고, 설명된 유닛은 또한 프로세서에 설정될 수 있다. 유닛들의 명칭들이 특정 경우에 유닛들에 대한 제한을 구성하지 않는다.
또 다른 양태에 따르면, 본 출원은 컴퓨터 판독가능 매체를 추가로 제공한다. 컴퓨터 판독가능 매체는 전술한 실시예들에서 설명된 전자 디바이스에 포함될 수 있거나, 또는 단독으로 존재할 수 있고 전자 디바이스에 배치되지 않는다. 컴퓨터 판독가능 매체는 하나 이상의 프로그램을 운반하며, 하나 이상의 프로그램은 전자 디바이스에 의해 실행될 때 전자 디바이스로 하여금 전술한 실시예들에서 설명된 방법을 구현하게 한다.
비록 액션들을 수행하도록 구성된 디바이스의 복수의 모듈 또는 유닛은 전술한 상세한 설명에서 논의되지만, 그러한 분할이 필수적인 것은 아니다. 실제로, 본 출원의 구현들에 따르면, 위에서 설명된 2개 이상의 모듈 또는 유닛의 특징들 및 기능들은 하나의 모듈 또는 유닛에서 구체적으로 구현될 수 있다. 반대로, 위에 설명된 하나의 모듈 또는 유닛의 특징들 및 기능들은 구현을 위해 복수의 모듈 또는 유닛으로 추가로 분할될 수 있다.
구현들에 대한 전술한 설명들에 따르면, 본 기술 분야의 통상의 기술자는 본 명세서에서 설명된 예시적인 구현들이 소프트웨어를 사용하여 구현될 수 있거나, 또는 소프트웨어와 필요한 하드웨어를 조합하여 구현될 수 있음을 쉽게 이해할 수 있다. 따라서, 본 출원의 구현들의 기술적 해결책들은 소프트웨어 제품의 형태로 구현될 수 있다. 소프트웨어 제품은 컴퓨팅 디바이스(이는 개인용 컴퓨터, 서버, 터치 단말, 네트워크 디바이스 등일 수 있음)에게 본 출원의 구현들에 따른 방법들을 수행하도록 지시하기 위한 여러 명령어들을 포함하여, 비휘발성 저장 매체(이는 CD-ROM, USB 플래시 드라이브, 이동식 하드 디스크 등일 수 있음)에 또는 네트워크 상에 저장될 수 있다.
명세서를 고려하고 개시된 구현들을 실시한 후에, 본 기술분야의 통상의 기술자는 본 출원의 다른 구현들을 쉽게 상상할 수 있다. 본 출원은 본 출원의 일반적인 원리들을 따르는 본 출원의 임의의 변형들, 사용들, 또는 적응적 변경들을 커버하도록 의도되고, 본 기술분야에서의 그리고 본 출원에 개시되지 않은 공지된 지식 및 종래의 기술적 수단을 포함한다.
본 출원은 위에서 설명되고 첨부 도면들에 도시된 바로 그 정확한 구조들로만 제한되지 않고, 본 출원의 범위를 벗어나지 않고 다양한 수정들 및 변경들이 이루어질 수 있다는 점이 이해되어야 한다.

Claims (27)

  1. 전자 디바이스에 의해 수행되는 비디오 디코딩 방법으로서,
    비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하여 상기 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득하는 단계;
    상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득하는 단계; 및
    상기 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하는 단계를 포함하는 비디오 디코딩 방법.
  2. 제1항에 있어서, 상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하는 것은:
    상기 양자화 계수 블록 내의 상기 양자화 계수들에 따라 상기 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 경우에 상기 양자화 계수 블록에서 상기 지정된 영역의 상기 양자화 계수들을 계산하는 것을 포함하는 비디오 디코딩 방법.
  3. 제2항에 있어서,
    비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제1 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계; 또는
    비디오 이미지 프레임에 대응하는 제2 코딩된 데이터의 이미지 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록의 양자화 계수들에 따라 상기 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계; 또는
    상기 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계; 또는
    비디오 이미지 프레임의 최대 코딩 유닛(LCU)에 대응하는 제4 코딩된 데이터의 LCU 헤더가 지정된 인덱스 식별자를 포함하는 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계; 또는
    상기 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계에 따라, 엔트로피 디코딩을 통해 획득된 상기 양자화 계수 블록 내의 상기 양자화 계수들에 따라 상기 코딩 블록들에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는지를 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  4. 제2항에 있어서,
    비디오 이미지 프레임 시퀀스에 대응하는 제1 코딩된 데이터의 시퀀스 헤더에 포함된 인덱스 식별자가 제1 값인 경우에, 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제1 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  5. 제2항에 있어서,
    상기 비디오 이미지 프레임 시퀀스에 대응하는 상기 제1 코딩된 데이터의 시퀀스 헤더에 포함된 인덱스 식별자가 제2 값이고 비디오 이미지 프레임 시퀀스 내의 비디오 이미지 프레임에 대응하는 제2 코딩된 데이터의 이미지 헤더에 포함된 인덱스 식별자가 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  6. 제5항에 있어서,
    상기 시퀀스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고 상기 이미지 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값인 경우에 엔트로피 디코딩을 통해 획득된 상기 양자화 계수 블록 내의 상기 양자화 계수들에 따라 상기 제2 코딩된 데이터 내의 모든 코딩 블록에 대한 상기 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  7. 제5항에 있어서,
    상기 시퀀스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 이미지 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이며, 상기 비디오 이미지 프레임의 슬라이스에 대응하는 제3 코딩된 데이터의 슬라이스 헤더에 포함된 인덱스 식별자가 상기 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  8. 제7항에 있어서,
    상기 시퀀스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 이미지 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이며, 상기 슬라이스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값인 경우에 엔트로피 디코딩을 통해 획득된 상기 양자화 계수 블록 내의 상기 양자화 계수들에 따라 상기 제3 코딩된 데이터 내의 모든 코딩 블록에 대한 상기 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  9. 제7항에 있어서,
    상기 시퀀스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 이미지 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 슬라이스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 슬라이스의 LCU에 대응하는 제4 코딩된 데이터의 LCU 헤더에 포함된 인덱스 식별자가 상기 제1 값인 경우에 엔트로피 디코딩을 통해 획득된 양자화 계수 블록 내의 양자화 계수들에 따라 상기 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 없는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  10. 제9항에 있어서,
    상기 시퀀스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 이미지 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 슬라이스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 LCU 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값인 경우에 엔트로피 디코딩을 통해 획득된 상기 양자화 계수 블록 내의 상기 양자화 계수들에 따라 상기 제4 코딩된 데이터 내의 모든 코딩 블록에 대한 상기 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는 것으로 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  11. 제9항에 있어서,
    상기 LCU 내의 코딩 블록들의 크기들과 참조 임계 범위 사이의 관계에 따라, 상기 시퀀스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 이미지 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 슬라이스 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값이고, 상기 LCU 헤더에 포함된 상기 인덱스 식별자가 상기 제2 값인 경우에 엔트로피 디코딩을 통해 획득된 상기 양자화 계수 블록 내의 상기 양자화 계수들에 따라 상기 코딩 블록들에 대한 상기 역변환 프로세스를 스킵할지에 관한 결정이 이루어질 필요가 있는지를 결정하는 단계를 추가로 포함하는 비디오 디코딩 방법.
  12. 제1항에 있어서, 상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득하는 단계는:
    상기 양자화 계수 블록에서 상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들을 계산하여 계산된 결과를 획득하고, 상기 계산된 결과를 상기 양자화 계수 통계 값으로서 사용하는 단계; 또는
    상기 양자화 계수 블록에서 상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들을 계산하여 계산된 결과를 획득하고, 지정된 값에 대해 상기 계산된 결과의 나머지를 계산하고, 상기 나머지를 상기 양자화 계수 통계 값으로서 사용하는 단계를 포함하는 비디오 디코딩 방법.
  13. 제12항에 있어서, 상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들을 계산하여 계산된 결과를 획득하는 것은:
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것; 또는
    상기 양자화 계수 블록에서 상기 지정된 영역의 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들의 절대 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 홀수 값의 양자화 계수들의 값들을 제1 값들로 변환하고 상기 지정된 영역의 짝수 값의 양자화 계수들의 값들을 제2 값들로 변환하고, 상기 값들의 변환 후에 상기 지정된 영역의 상기 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것- 상기 제1 값들 및 상기 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수임 -을 포함하는 비디오 디코딩 방법.
  14. 제12항에 있어서, 상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들을 계산하여 계산된 결과를 획득하는 것은:
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 홀수 값의 양자화 계수들의 수를 계산하고, 획득된 수를 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 홀수 값의 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 홀수 값의 양자화 계수들의 절대 값들의 합을 계산하고, 획득된 수를 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 홀수 값의 양자화 계수들의 값들을 제1 값들로 변환하고 상기 지정된 영역의 짝수 값의 양자화 계수들의 값들을 제2 값들로 변환하고, 상기 값들의 변환 후에 상기 지정된 영역의 상기 양자화 계수들의 홀수 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것- 상기 제1 값들 및 상기 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수임 -을 포함하는 비디오 디코딩 방법.
  15. 제12항에 있어서, 상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들의 값들에 따라 상기 지정된 영역의 상기 양자화 계수들을 계산하여 계산된 결과를 획득하는 것은:
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 짝수 값의 양자화 계수들의 수를 계산하고, 획득된 수를 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 짝수 값의 양자화 계수들의 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 짝수 값의 양자화 계수들의 절대 값들의 합을 계산하고, 획득된 수를 상기 계산된 결과로서 사용하는 것; 또는
    상기 지정된 영역의 상기 양자화 계수들의 값들에 따라 상기 지정된 영역의 홀수 값의 양자화 계수들의 값들을 제1 값들로 변환하고 상기 지정된 영역의 짝수 값의 양자화 계수들의 값들을 제2 값들로 변환하고, 상기 값들의 변환 후에 상기 지정된 영역의 상기 양자화 계수들의 짝수 값들의 합을 계산하고, 획득된 합을 상기 계산된 결과로서 사용하는 것- 상기 제1 값들 및 상기 제2 값들 중 하나는 홀수이고, 다른 하나는 짝수임 -을 포함하는 비디오 디코딩 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 지정된 영역은:
    상기 양자화 계수 블록 내의 모든 영역;
    상기 양자화 계수 블록 내의 하나 이상의 지정된 위치;
    상기 양자화 계수 블록 내의 적어도 하나의 지정된 행;
    상기 양자화 계수 블록 내의 적어도 하나의 지정된 열;
    상기 양자화 계수 블록 내의 적어도 하나의 지정된 행 및 적어도 하나의 지정된 열; 또는
    적어도 하나의 대각선 상의 상기 양자화 계수 블록 내의 위치들 중 어느 하나를 포함하는 비디오 디코딩 방법.
  17. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 지정된 영역은:
    상기 양자화 계수 블록 내의 스캔 영역 기반 계수 코딩(SRCC) 영역;
    상기 SRCC 영역 내의 하나 이상의 지정된 위치;
    상기 SRCC 영역 내의 적어도 하나의 지정된 행;
    상기 SRCC 영역 내의 적어도 하나의 지정된 열;
    상기 SRCC 영역 내의 적어도 하나의 지정된 행 및 적어도 하나의 지정된 열; 또는
    적어도 하나의 대각선 상의 상기 SRCC 영역 내의 위치 중 어느 하나를 포함하는 비디오 디코딩 방법.
  18. 제17항에 있어서, 상기 SRCC 영역 내의 상기 하나 이상의 지정된 위치는 스캔 순서에서 처음 N개의 위치를 포함하고, N은 0 이외의 자연수인 비디오 디코딩 방법.
  19. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하는 단계는:
    상기 양자화 계수 통계 값이 홀수인 경우에 상기 역변환 프로세스를 스킵하는 것으로 결정하고, 상기 양자화 계수 통계 값이 짝수인 경우에 상기 역변환 프로세스를 수행하는 것으로 결정하는 단계; 또는
    상기 양자화 계수 통계 값이 홀수인 경우에 상기 역변환 프로세스를 수행하는 것으로 결정하고, 상기 양자화 계수 통계 값이 짝수인 경우에 상기 역변환 프로세스를 스킵하는 것으로 결정하는 단계를 포함하는 비디오 디코딩 방법.
  20. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하는 단계는:
    상기 양자화 계수 통계 값이 제1 값 세트에 속하는 경우에 상기 역변환 프로세스를 스킵하는 것으로 결정하고, 상기 양자화 계수 통계 값이 상기 제1 값 세트에 속하지 않는 경우에 상기 역변환 프로세스를 수행하는 것으로 결정하는 단계; 또는
    상기 양자화 계수 통계 값이 상기 제1 값 세트에 속하는 경우에 상기 역변환 프로세스를 수행하는 것으로 결정하고, 상기 양자화 계수 통계 값이 상기 제1 값 세트에 속하지 않는 경우에 상기 역변환 프로세스를 스킵하는 것으로 결정하는 단계를 포함하는 비디오 디코딩 방법.
  21. 전자 디바이스에 의해 수행되는 비디오 코딩 방법으로서,
    비디오 이미지 프레임의 코딩 블록을 취득하기 위해 요구된 잔차 데이터에 대해 변환을 스킵하고 양자화를 직접 수행하여, 상기 잔차 데이터의 제1 양자화 계수 블록을 획득하고; 상기 잔차 데이터에 대해 변환 및 양자화를 연속적으로 수행하여 상기 잔차 데이터의 제2 양자화 계수 블록을 획득하는 단계;
    상기 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득하는 단계- 상기 제3 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 스킵하도록 지시하기 위해 사용되고, 상기 제3 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -;
    상기 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득하는 단계- 상기 제4 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 수행하도록 지시하기 위해 사용되고, 상기 제4 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -; 및
    상기 제3 양자화 계수 블록과 상기 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩을 수행하여, 상기 비디오 이미지 프레임의 코딩 블록을 획득하는 단계를 포함하는 비디오 코딩 방법.
  22. 비디오 디코딩 장치로서,
    비디오 이미지 프레임의 코딩 블록에 대해 엔트로피 디코딩을 수행하여 상기 코딩 블록에 대응하는 잔차 데이터의 양자화 계수 블록을 획득하도록 구성되는 디코딩 유닛;
    상기 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산하여 양자화 계수 통계 값을 획득하도록 구성되는 계산 유닛; 및
    상기 양자화 계수 통계 값에 따라, 역변환 프로세스를 스킵할지를 결정하도록 구성되는 결정 유닛을 포함하는 비디오 디코딩 장치.
  23. 비디오 코딩 장치로서,
    비디오 이미지 프레임의 코딩 블록을 취득하기 위해 요구된 잔차 데이터에 대해 변환을 스킵하고 양자화를 직접 수행하여, 상기 잔차 데이터의 제1 양자화 계수 블록을 획득하고; 상기 잔차 데이터에 대해 변환 및 양자화를 연속적으로 수행하여 상기 잔차 데이터의 제2 양자화 계수 블록을 획득하도록 구성되는 처리 유닛; 및
    상기 제1 양자화 계수 블록에 기초하여 제3 양자화 계수 블록을 취득- 상기 제3 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 스킵하도록 지시하기 위해 사용되고, 상기 제3 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하고; 상기 제2 양자화 계수 블록에 기초하여 제4 양자화 계수 블록을 취득- 상기 제4 양자화 계수 블록에 대응하는 양자화 계수 통계 값은 역변환 프로세스를 수행하도록 지시하기 위해 사용되고, 상기 제4 양자화 계수 블록에서 지정된 영역의 양자화 계수들을 계산함으로써 획득됨 -하도록 구성되는 취득 유닛을 포함하고,
    상기 처리 유닛은 상기 제3 양자화 계수 블록과 상기 제4 양자화 계수 블록 중 선택 조건을 만족하는 것에 대해 엔트로피 코딩을 수행하여, 상기 비디오 이미지 프레임의 코딩 블록을 획득하도록 추가로 구성되는 비디오 코딩 장치.
  24. 비디오 처리 시스템으로서, 비디오 코딩 장치 및 비디오 디코딩 장치를 포함하고, 상기 비디오 코딩 장치는 제21항에 따른 비디오 코딩 방법을 수행하도록 구성되고, 상기 비디오 디코딩 장치는 제1항 내지 제20항 중 어느 한 항에 따른 비디오 디코딩 방법을 수행하도록 구성되는 비디오 처리 시스템.
  25. 컴퓨터 프로그램을 저장한 비일시적 컴퓨터 판독가능 매체로서, 상기 컴퓨터 프로그램은 프로세서에 의해 실행되어 컴퓨터로 하여금 제1항 내지 제20항 중 어느 한 항에 따른 비디오 디코딩 방법 또는 제21항에 따른 비디오 코딩 방법을 구현하게 하는 비일시적 컴퓨터 판독가능 매체.
  26. 전자 디바이스로서,
    하나 이상의 프로세서; 및
    상기 하나 이상의 프로세서에 의해 실행될 때, 상기 전자 디바이스로 하여금 제1항 내지 제20항 중 어느 한 항에 따른 비디오 디코딩 방법 또는 제21항에 따른 비디오 코딩 방법을 구현하게 하는 하나 이상의 프로그램을 저장하도록 구성되는 저장 장치를 포함하는 전자 디바이스.
  27. 컴퓨터 프로그램으로서, 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 명령어들을 포함하고, 컴퓨터 디바이스의 프로세서가 상기 컴퓨터 판독가능 저장 매체로부터 상기 컴퓨터 명령어들을 판독하고, 상기 컴퓨터 명령어들을 실행하여 상기 컴퓨터 디바이스로 하여금 제1항 내지 제20항 중 어느 한 항에 따른 비디오 디코딩 방법 또는 제21항에 따른 비디오 코딩 방법을 구현하게 하는 컴퓨터 프로그램.
KR1020227031426A 2020-08-21 2021-08-12 비디오 디코딩 방법, 비디오 인코딩 방법, 장치, 매체, 및 전자 디바이스 KR20220134651A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010855625.1A CN114079773B (zh) 2020-08-21 2020-08-21 视频解码方法、装置、计算机可读介质及电子设备
CN202010855625.1 2020-08-21
PCT/CN2021/112359 WO2022037478A1 (zh) 2020-08-21 2021-08-12 视频解码方法、视频编码方法、装置、介质及电子设备

Publications (1)

Publication Number Publication Date
KR20220134651A true KR20220134651A (ko) 2022-10-05

Family

ID=80282762

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227031426A KR20220134651A (ko) 2020-08-21 2021-08-12 비디오 디코딩 방법, 비디오 인코딩 방법, 장치, 매체, 및 전자 디바이스

Country Status (6)

Country Link
US (1) US20220394265A1 (ko)
EP (1) EP4124045A4 (ko)
JP (1) JP7483029B2 (ko)
KR (1) KR20220134651A (ko)
CN (2) CN114079773B (ko)
WO (1) WO2022037478A1 (ko)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5741730B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
CN102447907A (zh) * 2012-01-31 2012-05-09 北京工业大学 一种针对hevc的视频序列的编码方法
US10257520B2 (en) * 2012-06-26 2019-04-09 Velos Media, Llc Modified coding for transform skipping
CN110800296A (zh) * 2017-06-29 2020-02-14 索尼公司 图像处理装置、图像处理方法和程序
EP3484151A1 (en) * 2017-11-13 2019-05-15 Thomson Licensing Method and apparatus for generating quantization matrices in video encoding and decoding
CN111225206B (zh) * 2018-11-23 2021-10-26 华为技术有限公司 视频解码方法和视频解码器
CN113709476B (zh) 2020-06-05 2022-12-23 杭州海康威视数字技术股份有限公司 编码方法、解码方法、装置及机器可读存储介质
CN112533000B (zh) * 2020-10-16 2022-08-05 腾讯科技(深圳)有限公司 视频解码方法、装置、计算机可读介质及电子设备

Also Published As

Publication number Publication date
CN114079773A (zh) 2022-02-22
EP4124045A1 (en) 2023-01-25
CN116112668A (zh) 2023-05-12
JP7483029B2 (ja) 2024-05-14
CN114079773B (zh) 2022-12-27
JP2023520314A (ja) 2023-05-17
WO2022037478A1 (zh) 2022-02-24
US20220394265A1 (en) 2022-12-08
EP4124045A4 (en) 2023-10-25

Similar Documents

Publication Publication Date Title
US20230024834A1 (en) Video decoding method, video encoding method, and related apparatuses
WO2022063033A1 (zh) 视频解码方法、视频编码方法、装置、计算机可读介质及电子设备
WO2022062880A1 (zh) 视频解码方法、装置、计算机可读介质及电子设备
CN112543338B (zh) 视频解码方法、装置、计算机可读介质及电子设备
WO2022174660A1 (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN113207002B (zh) 视频编解码方法、装置、计算机可读介质及电子设备
US20230053118A1 (en) Video decoding method, video coding method, and related apparatus
US20220394265A1 (en) Video decoding method and apparatus, video coding method and apparatus, storage medium, and electronic device
WO2022174701A1 (zh) 视频编解码方法、装置、计算机可读介质及电子设备
WO2022037477A1 (zh) 视频解码方法、装置、计算机可读介质及电子设备
US20230082386A1 (en) Video encoding method and apparatus, video decoding method and apparatus, computer-readable medium, and electronic device
WO2022116854A1 (zh) 视频解码方法、装置、可读介质、电子设备及程序产品
US20230061939A1 (en) Coding efficiency of boundary coordinates of srcc scan region
US20230077935A1 (en) Video Encoding Method and Apparatus, Video Decoding Method and Apparatus, Computer-Readable Medium, and Electronic Device
CN115209141A (zh) 视频编解码方法、装置、计算机可读介质及电子设备
CN116456086A (zh) 环路滤波方法、视频编解码方法、装置、介质及电子设备
CN115209146A (zh) 视频编解码方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
A201 Request for examination