KR20240056557A - 양방향 예측을 위한 로컬 조명 보상 - Google Patents

양방향 예측을 위한 로컬 조명 보상 Download PDF

Info

Publication number
KR20240056557A
KR20240056557A KR1020247010562A KR20247010562A KR20240056557A KR 20240056557 A KR20240056557 A KR 20240056557A KR 1020247010562 A KR1020247010562 A KR 1020247010562A KR 20247010562 A KR20247010562 A KR 20247010562A KR 20240056557 A KR20240056557 A KR 20240056557A
Authority
KR
South Korea
Prior art keywords
linear
samples
parameters
block
values
Prior art date
Application number
KR1020247010562A
Other languages
English (en)
Inventor
신 자오
구이춘 리
롄-페이 천
산 류
Original Assignee
텐센트 아메리카 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US18/381,538 external-priority patent/US20240236300A9/en
Application filed by 텐센트 아메리카 엘엘씨 filed Critical 텐센트 아메리카 엘엘씨
Publication of KR20240056557A publication Critical patent/KR20240056557A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

프로세싱 회로부는 제1 참조 픽처 내의 적어도 제1 참조 블록에 따라 현재 블록에 LIC를 적용하는 것을 표시하는 현재 블록의 코딩된 정보를 수신한다. 프로세싱 회로부는, 현재 블록 내의 샘플에 대해, 제1 참조 블록 내의 적어도 제1 참조 샘플을 결정하며, 제1 참조 샘플은 현재 블록 내의 샘플에 공동 위치된다. 프로세싱 회로부는 LIC에서 사용되는 복수의 파라미터들에 대한 복수의 파라미터 값들에 따라 LIC에 대한 오프셋 및 복수의 항들의 가중된 합을 계산하고, 샘플을 그에 따라 재구성한다. 복수의 파라미터 값들은 k번째 거듭제곱의 제1 참조 샘플의 비선형 항에 적용되는 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값이고 1과 동일하지 않다.

Description

양방향 예측을 위한 로컬 조명 보상
참조에 의한 포함
본 출원은 2022년 10월 20일자로 출원된 "Local illumination compensation for bi-prediction"이란 명칭의 미국 특허 가출원 제63/417,930호를 우선권 주장하는 2023년 10월 18일자로 출원된 "LOCAL ILLUMINATION COMPENSATION FOR BI-PREDICTION"이란 명칭의 미국 특허 출원 제18/381,538를 우선권 주장한다. 선출원들의 개시내용들은 그것들의 전체가 참조로 본 개시에 포함된다.
기술분야
본 개시는 일반적으로 비디오 코딩에 관련된 실시예들을 기술한다.
본 개시에서 제공되는 배경 설명은 본 개시의 맥락을 일반적으로 제시하는 목적을 위한 것이다.  본 배경기술 섹션에서 연구가 설명되는 한, 현재 거명된 발명자들의 연구뿐만 아니라, 출원 당시에 종래 기술로서 달리 자격이 주어지지 않을 수 있는 설명의 양태들은 본 개시내용에 대한 종래 기술로서 명시적으로도 암시적으로도 인정되지 않는다.
이미지/비디오 압축은 상이한 디바이스들, 저장소들 및 네트워크들에 걸쳐 이미지/비디오 데이터를 품질 저하를 최소화하면서 송신하는 것을 도울 수 있다. 일부 예들에서, 비디오 코덱 기술은 공간적 및 시간적 중복성(redundancy)에 기초하여 비디오를 압축할 수 있다. 일 예에서, 비디오 코덱은 공간적 중복성에 기초하여 이미지를 압축할 수 있는 인트라 예측이라고 지칭되는 기법들을 사용할 수 있다. 예를 들어, 인트라 예측은 샘플 예측을 위해 재구성 중인 현재 픽처로부터의 참조 데이터를 사용할 수 있다. 다른 예에서, 비디오 코덱은 시간적 중복성에 기초하여 이미지를 압축할 수 있는 인터 예측이라고 지칭되는 기법들을 사용할 수 있다. 예를 들어, 인터 예측은 모션 보상으로 이전에 재구성되는 픽처로부터 현재 픽처의 샘플들을 예측할 수 있다. 모션 보상은 모션 벡터(motion vector)(MV)에 의해 표시될 수 있다.
본 개시의 양태들은 비디오 인코딩/디코딩을 위한 방법들 및 장치들을 포함한다. 일부 예들에서, 비디오 디코딩을 위한 장치는 프로세싱 회로부를 포함한다. 프로세싱 회로부는 코딩된 비디오 비트스트림으로부터 현재 픽처 내의 현재 블록의 코딩된 정보를 수신하며, 코딩된 정보는 제1 참조 픽처 내의 적어도 제1 참조 블록에 따라 현재 블록에 로컬 조명 보상(local illumination compensation)(LIC)을 적용함을 표시한다. 프로세싱 회로부는 현재 블록 내의 샘플에 대해, 제1 참조 블록 내의 적어도 제1 참조 샘플을 결정하며, 제1 참조 샘플은 현재 블록 내의 샘플에 공동 위치된다(co-located). 프로세싱 회로부는 LIC에서 사용되는 복수의 파라미터들에 대한 복수의 파라미터 값들에 따라 LIC에 대한 오프셋 및 복수의 항들의 가중된 합을 계산한다. 복수의 파라미터 값들은 k번째 거듭제곱의 제1 참조 샘플의 비선형 항에 적용되는 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값이고 1과 동일하지 않다. 프로세싱 회로부는 가중된 합에 따라 현재 블록 내의 샘플을 재구성한다. 일부 예들에서, 거듭제곱 인덱스 값은 2이다.
일부 예들에서, 프로세싱 회로부는 현재 블록의 이웃하는 재구성되는 샘플들과 복수의 파라미터들을 이용한 LIC에 의한 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 복수의 파라미터들에 대한 복수의 파라미터 값들을 결정한다.
일부 예들에서, 프로세싱 회로부는 코딩된 비디오 비트스트림으로부터 제1 가중 값을 디코딩한다. 일부 예들에서, 프로세싱 회로부는 코딩된 비디오 비트스트림으로부터 인덱스를 디코딩하며, 인덱스는 제1 가중 값을 표시한다. 일부 예들에서, 제1 가중 값은 현재 블록의 이웃 블록으로부터 상속된다.
일부 예들에서, 복수의 파라미터들은 제1 가중, 오프셋 및 적어도 선형 항에 대한 가중을 포함한다. 프로세싱 회로부는 복수의 파라미터들의 제1 서브세트에 대한 제1 값들을 결정하고, 현재 블록의 이웃하는 재구성되는 샘플들과 복수의 파라미터들의 제1 서브세트 및 복수의 파라미터들의 제2 서브세트에 대한 제1 값들을 이용한 LIC에 의한 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 복수의 파라미터들의 제2 서브세트에 대한 제2 값들을 결정한다. 일 예에서, 프로세싱 회로부는 코딩된 비디오 비트스트림으로부터 제1 값들을 디코딩한다. 다른 예에서, 프로세싱 회로부는 코딩된 비디오 비트스트림으로부터 적어도 인덱스를 디코딩하며, 적어도 인덱스는 제1 값들을 표시한다. 다른 예에서, 복수의 파라미터들의 제1 서브세트에 대한 제1 값들은 현재 블록의 이웃 블록으로부터 상속된다.
일부 예들에서, 복수의 파라미터들의 제1 서브세트는 선형 항에 대한 적어도 선형 가중을 포함하고, 복수의 파라미터들의 제2 서브세트는 오프셋 및 비선형 항을 포함한다.
일부 예들에서, 복수의 파라미터들의 제1 서브세트는 오프셋을 포함하고, 복수의 파라미터들의 제2 서브세트는 선형 항 및 비선형 항에 대한 적어도 선형 가중을 포함한다.
일부 예들에서, 코딩된 정보는 제1 참조 픽처 내의 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 현재 블록에 양방향 예측의 LIC를 적용하는 것을 표시한다. 일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 샘플의 제1 선형 항의 제1 선형 가중에 대한 제1 선형 가중 값, 현재 블록 내의 샘플에 관해 제2 참조 블록에 공동 위치되는 제2 참조 샘플의 제2 선형 항의 제2 선형 가중에 대한 제2 선형 가중 값을 포함한다.
일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들을 포함하며, 제1 샘플들은 제1 참조 샘플과 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함한다. 제1 샘플들은 임의의 적합한 형상, 이를테면 십자 형상, 수직 막대 형상, 수평 막대 형상, 다이아몬드 형상, 직사각형 형상, 대각선 형상 등을 형성할 수 있다.
일부 예들에서, 코딩된 정보는 제1 참조 픽처 내의 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 현재 블록에 양방향 예측의 LIC를 적용하는 것을 표시하고, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들과 제2 참조 블록 내의 제2 샘플들에 대해 각각 제2 선형 항들의 제2 선형 가중들을 위한 제2 선형 가중 값들을 포함하며, 제1 샘플들은 제1 참조 샘플과 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함하며, 제2 샘플들은 제2 참조 블록 내의 제2 참조 샘플과 제2 참조 샘플의 하나 이상의 이웃 샘플을 포함한다.
본 개시의 양태들은, 컴퓨터에 의해 실행될 때, 컴퓨터로 하여금 비디오 디코딩/인코딩을 위한 방법을 수행하게 하는 명령어들을 저장하는 비일시적 컴퓨터 판독가능 매체를 또한 제공한다.
개시된 주제의 추가의 특징들, 성질, 및 다양한 장점들은 다음의 상세한 설명 및 첨부 도면들로부터 더 명확하게 될 것이며, 도면들 중:
도 1은 통신 시스템(100)의 예시적인 블록도의 개략도이다.
도 2는 디코더의 예시적인 블록도의 개략도이다.
도 3은 인코더의 예시적인 블록도의 개략도이다.
도 4는 일부 예들에서 양방향 예측의 로컬 조명 보상(LIC)을 예시하기 위한 도면을 도시한다.
도 5는 일부 예들에서 LIC 양방향 예측을 예시하기 위한 도면을 도시한다.
도 6은 일부 예들에서 LIC 양방향 예측을 예시하기 위한 도면을 도시한다.
도 7a 내지 도 7p는 일부 예들에서 LIC에 사용될 수 있는 샘플들의 일부 형상들을 도시한다.
도 8은 본 개시의 일부 실시예에 따른 다른 프로세스를 약술하는 흐름도를 도시한다.
도 9는 본 개시의 일부 실시예에 따른 프로세스를 약술하는 흐름도를 도시한다.
도 10은 일 실시예에 따른 컴퓨터 시스템의 개략도이다.
도 1은 일부 예들에서 비디오 프로세싱 시스템(100)의 블록도를 도시한다. 비디오 프로세싱 시스템(100)은 스트리밍 환경에서 개시된 주제, 비디오 인코더 및 비디오 디코더에 대한 애플리케이션의 예이다. 개시된 주제는, 예를 들어 화상 회의; 디지털 TV; 스트리밍 서비스들; CD, DVD, 메모리 스틱 등을 포함하는 디지털 미디어 상의 압축된 비디오의 저장 등을 포함하는, 다른 비디오 가능 애플리케이션들에 동일하게 적용 가능할 수 있다.
비디오 프로세싱 시스템(100)은, 예를 들어 압축되지 않은 비디오 픽처들의 스트림(102)을 생성하는 비디오 소스(101), 예를 들어 디지털 카메라를 포함할 수 있는 캡처 서브시스템(113)을 포함한다. 일 예에서, 비디오 픽처들의 스트림(102)은 디지털 카메라에 의해 촬영되는 샘플들을 포함한다. 인코딩된 비디오 데이터(104)(또는 코딩된 비디오 비트스트림들)와 비교될 때 높은 데이터 볼륨을 강조하기 위해 굵은 선으로서 묘사되는 비디오 픽처들의 스트림(102)은, 비디오 소스(101)에 결합되는 비디오 인코더(103)를 포함하는 전자 디바이스(120)에 의해 프로세싱될 수 있다. 비디오 인코더(103)는 아래에서 더 상세히 설명되는 바와 같이 개시된 주제의 양태들을 가능화 또는 구현하기 위한 하드웨어, 소프트웨어, 또는 그것들의 조합을 포함할 수 있다. 비디오 픽처들의 스트림(102)과 비교될 때 더 낮은 데이터 볼륨을 강조하기 위해 얇은 선으로서 묘사되는 인코딩된 비디오 데이터(104)(또는 인코딩된 비디오 비트스트림)는 장래의 사용을 위해 스트리밍 서버(105) 상에 저장될 수 있다. 하나 이상의 스트리밍 클라이언트 서브시스템, 이를테면 도 1의 클라이언트 서브시스템들(106 및 108)은 인코딩된 비디오 데이터(104)의 사본들(107 및 109)을 검색하기 위해 스트리밍 서버(105)에 액세스할 수 있다. 클라이언트 서브시스템(106)은, 예를 들어, 전자 디바이스(130)에 비디오 디코더(110)를 포함시킬 수 있다. 비디오 디코더(110)는 인코딩된 비디오 데이터의 착신(incoming) 사본(107)을 디코딩하고 디스플레이(112)(예컨대, 디스플레이 스크린) 또는 다른 렌더링 디바이스(도시되지 않음) 상에 렌더링될 수 있는 비디오 픽처들의 출력 스트림(111)을 생성한다. 일부 스트리밍 시스템들에서, 인코딩된 비디오 데이터(104, 107, 및 109)(예컨대, 비디오 비트스트림들)는 특정한 비디오 코딩/압축 표준들에 따라 인코딩될 수 있다. 그들 표준들의 예들은 ITU-T 권고 H.265를 포함한다. 일 예에서, 개발중인 비디오 코딩 표준이 비공식적으로 VVC(Versatile Video Coding)로서 알려져 있다. 개시된 주제는 VVC의 맥락에서 사용될 수 있다.
전자 디바이스들(120 및 130)은 다른 컴포넌트들(도시되지 않음)을 포함할 수 있다는 것에 주의한다. 예를 들어, 전자 디바이스(120)는 비디오 디코더(도시되지 않음)를 포함할 수 있고 전자 디바이스(130)는 비디오 인코더(도시되지 않음)도 포함할 수 있다.
도 2는 비디오 디코더(210)의 예시적인 블록도를 도시한다. 비디오 디코더(210)는 전자 디바이스(230)에 포함될 수 있다. 전자 디바이스(230)는 수신기(231)(예컨대, 수신 회로부)를 포함할 수 있다. 비디오 디코더(210)는 도 1의 예에서 비디오 디코더(110) 대신 사용될 수 있다.
수신기(231)는 예를 들어, 비디오 디코더(210)에 의해 디코딩될 비트스트림에 포함되는 하나 이상의 코딩된 비디오 시퀀스를 수신할 수 있다. 일 실시예에서, 하나의 코딩된 비디오 시퀀스는 한 번에 수신되며, 각각의 코딩된 비디오 시퀀스의 디코딩은 다른 코딩된 비디오 시퀀스들의 디코딩과 독립적이다. 코딩된 비디오 시퀀스는 인코딩된 비디오 데이터를 저장하는 저장 디바이스에 대한 하드웨어/소프트웨어 링크일 수 있는 채널(201)로부터 수신될 수 있다. 수신기(231)는 인코딩된 비디오 데이터를 엔티티들(도시되지 않음)을 사용하여 자신들의 각각에 포워딩될 수 있는 다른 데이터, 예를 들어, 코딩된 오디오 데이터 및/또는 보조 데이터 스트림들과 함께 수신할 수 있다. 수신기(231)는 코딩된 비디오 시퀀스를 다른 데이터로부터 분리할 수 있다. 네트워크 지터를 방지하기 위해, 버퍼 메모리(215)가 수신기(231)와 엔트로피 디코더/파서(220)(이후로 "파서(220)") 사이에 결합될 수 있다. 특정한 애플리케이션들에서, 버퍼 메모리(215)는 비디오 디코더(210)의 일부이다. 다른 애플리케이션들에서, 이는 비디오 디코더(210)(도시되지 않음) 외부에 있을 수 있다. 또 다른 애플리케이션들에서, 예를 들어 네트워크 지터를 방지하기 위해, 버퍼 메모리(도시되지 않음)가 비디오 디코더(210) 외부에 있을 수 있고, 추가적으로, 예를 들어 재생 타이밍을 처리하기 위해, 비디오 디코더(210) 내부에 다른 버퍼 메모리(215)가 있을 수 있다. 수신기(231)가 충분한 대역폭 및 제어가능성(controllability)의 저장/포워드 디바이스로부터, 또는 등시 동기식 네트워크(isosynchronous network)로부터 데이터를 수신하고 있을 때, 버퍼 메모리(215)는 필요하지 않을 수 있거나, 작을 수 있다. 인터넷과 같은 최선형(best effort) 패킷 네트워크들 상의 사용을 위해, 버퍼 메모리(215)가 요구될 수 있으며, 비교적 클 수 있고 유리하게는 적응적 크기일 수 있고, 비디오 디코더(210) 외부의 운영 체제 또는 유사한 요소들(도시되지 않음)에서 적어도 부분적으로 구현될 수 있다.
비디오 디코더(210)는 코딩된 비디오 시퀀스로부터 심볼들(221)을 재구성하기 위해 파서(220)를 포함할 수 있다. 그 심볼들의 카테고리들은 비디오 디코더(210)의 동작을 관리하는데 사용되는 정보와, 잠재적으로는, 도 2에 도시된 바와 같이, 전자 디바이스(230)의 필수 부분이 아니지만 전자 디바이스(230)에 결합될 수 있는 렌더러 디바이스(212)(예컨대, 디스플레이 스크린)와 같은 렌더링 디바이스를 제어하기 위한 정보를 포함한다. 렌더링 디바이스(들)에 대한 제어 정보는 보충적 향상 정보(Supplemental Enhancement Information)(SEI) 메시지들 또는 비디오 유용성 정보(Video Usability Information)(VUI) 파라미터 세트 단편들(도시되지 않음)의 형태일 수 있다. 파서(220)는 수신되는 코딩된 비디오 시퀀스를 파싱/엔트로피-디코딩할 수 있다. 코딩된 비디오 시퀀스의 코딩은 비디오 코딩 기술 또는 표준에 따를 수 있고, 가변 길이 코딩, 허프만 코딩, 컨텍스트 민감도가 있거나 또는 없는 산술 코딩 등을 포함한 다양한 원리들을 따를 수 있다. 파서(220)는 코딩된 비디오 시퀀스로부터, 비디오 디코더 내의 픽셀들의 서브그룹들 중 적어도 하나에 대한 서브그룹 파라미터들의 세트를, 그룹에 대응하는 적어도 하나의 파라미터에 기초하여, 추출할 수 있다. 서브그룹들은 픽처들의 그룹들(Groups of Pictures)(GOP들), 픽처들, 타일들, 슬라이스들, 매크로블록들, 코딩 유닛들(Coding Units)(CU들), 블록들, 변환 유닛들(Transform Units)(TU들), 예측 유닛들(Prediction Units)(PU들) 등을 포함할 수 있다. 파서(220)는 변환 계수들, 양자화기 파라미터 값들, 모션 벡터들 등과 같은 정보를 코딩된 비디오 시퀀스로부터 추출할 수도 있다.
파서(220)는 버퍼 메모리(215)로부터 수신된 비디오 시퀀스에 대한 엔트로피 디코딩/파싱 동작을 수행하여, 심볼들(221)을 생성할 수 있다.
심볼들(221)의 재구성은 코딩된 비디오 픽처 또는 그 부분들의 유형(이를테면, 인터 및 인트라 픽처, 인터 및 인트라 블록), 및 다른 인자들에 의존하여 다수의 상이한 유닛들을 수반할 수 있다. 어떤 유닛들이 관련되는지와, 어떻게 관련되는지는, 파서(220)에 의해 코딩된 비디오 시퀀스로부터 파싱된 서브그룹 제어 정보에 의해 제어될 수 있다. 파서(220)와 아래의 다수의 유닛들 사이의 이러한 서브그룹 제어 정보의 흐름은 명료함을 위해 묘사되어 있지 않다.
이미 언급된 기능성 블록들 외에도, 비디오 디코더(210)는 아래에서 설명되는 바와 같은 다수의 기능성 유닛들로 개념적으로 세분될 수 있다. 상업적 제약조건들 하에서 동작하는 실제 구현예에서, 다수의 이들 유닛들은 서로 밀접하게 상호작용하고, 적어도 부분적으로는 서로 통합될 수 있다. 그러나, 개시된 주제를 설명하는 목적으로, 아래의 기능성 유닛들로의 개념적 세분이 적절하다.
제1 유닛은 스케일러/역변환 유닛(251)이다. 스케일러/역변환 유닛(251)은 파서(220)로부터 어떤 변환을 사용할지, 블록 크기, 양자화 계수, 양자화 스케일링 매트릭스들 등을 포함하는 제어 정보뿐만 아니라 양자화된 변환 계수를 심볼(들)(221)로서 수신한다. 스케일러/역변환 유닛(251)은 집성기(255)에 입력될 수 있는 샘플 값들을 포함하는 블록들을 출력할 수 있다.
일부 경우들에서, 스케일러/역변환 유닛(251)의 출력 샘플들은 인트라 코딩된 블록에 관련될 수 있다. 인트라 코딩된 블록은 이전에 재구성되는 픽처들로부터의 예측 정보를 사용하지 않지만 현재 픽처의 이전에 재구성되는 부분들로부터의 예측 정보를 사용할 수 있는 블록이다. 이러한 예측 정보는 인트라 픽처 예측 유닛(252)에 의해 제공될 수 있다. 일부 경우들에서, 인트라 픽처 예측 유닛(252)은 재구성 중인 블록의 동일한 크기 및 형상의 블록을 현재 픽처 버퍼(258)로부터 페치된 주변의 이미 재구성되는 정보를 사용하여 생성한다. 현재 픽처 버퍼(258)는, 예를 들어, 부분적으로 재구성되는 현재 픽처 및/또는 완전히 재구성되는 현재 픽처를 버퍼링한다. 집성기(255)는, 일부 경우들에서, 인트라 예측 유닛(252)이 생성했던 예측 정보를 스케일러/역변환 유닛(251)에 의해 제공된 바와 같은 출력 샘플 정보에 샘플별로 추가한다.
다른 경우들에서, 스케일러/역변환 유닛(251)의 출력 샘플들은 인터 코딩되고 잠재적으로 모션 보상된 블록에 관련될 수 있다. 이러한 경우, 모션 보상 예측 유닛(253)은 예측을 위해 사용되는 샘플들을 페치하기 위해 참조 픽처 메모리(257)에 액세스할 수 있다. 블록에 관련된 심볼들(221)에 따라 페치된 샘플들을 모션 보상한 후, 이들 샘플들은 출력 샘플 정보를 생성하기 위해서 스케일러/역변환 유닛(251)의 출력(이 경우 잔차 샘플들 또는 잔차 신호라 불림)에 집성기(255)에 의해 추가될 수 있다. 모션 보상 예측 유닛(253)이 예측 샘플들을 페치하는 참조 픽처 메모리(257) 내의 어드레스들은, 예를 들어 X, Y, 및 참조 픽처 성분들을 가질 수 있는 심볼들(221)의 형태로 모션 보상 예측 유닛(253)에 이용 가능한 모션 벡터들에 의해 제어될 수 있다. 모션 보상은 또한 서브샘플의 정확한 모션 벡터들이 사용 중일 때 참조 픽처 메모리(257)로부터 페치된 바와 같은 샘플 값들의 보간, 모션 벡터 예측 메커니즘들 등을 포함할 수 있다.
집성기(255)의 출력 샘플들은 루프 필터 유닛(256)에서 다양한 루프 필터링 기법들의 대상이 될 수 있다. 비디오 압축 기술들은 코딩된 비디오 시퀀스(코딩된 비디오 비트스트림이라고도 지칭됨)에 포함되는 파라미터들에 의해 제어되는 그리고 파서(220)로부터 심볼들(221)로서 루프 필터 유닛(256)에 이용 가능하게 되는 루프 내(in-loop) 필터 기술들을 포함할 수 있다. 비디오 압축은 또한 코딩된 픽처 또는 코딩된 비디오 시퀀스의 이전의(디코딩 순서에서의) 부분들의 디코딩 동안 획득된 메타 정보에 응답할 수 있을 뿐만 아니라 이전에 재구성되고 루프 필터링된 샘플 값들에 응답할 수 있다.
루프 필터 유닛(256)의 출력은 렌더러 디바이스(212)에 출력될 수 있을 뿐만 아니라 장래의 인터 픽처 예측에서의 사용을 위해 참조 픽처 메모리(257)에 저장될 수 있는 샘플 스트림일 수 있다.
특정한 코딩된 픽처들은, 일단 완전히 재구성되면, 장래 예측을 위한 참조 픽처들로서 사용될 수 있다. 예를 들어, 일단 현재 픽처에 대응하는 코딩된 픽처이 완전히 재구성되고 코딩된 픽처이(예를 들어, 파서(220)에 의해) 참조 픽처로서 식별되었다면, 현재 픽처 버퍼(258)는 참조 픽처 메모리(257)의 일부일 수 있고, 새로운(fresh) 현재 픽처 버퍼가 다음의 코딩된 픽처의 재구성을 시작하기 전에 재할당될 수 있다.
비디오 디코더(210)는 ITU-T Rec. H.265와 같은 미리 결정된 비디오 압축 기술 또는 표준에 따라 디코딩 동작들을 수행할 수 있다. 코딩된 비디오 시퀀스는 코딩된 비디오 시퀀스가 비디오 압축 기술 또는 표준의 신택스 및 비디오 압축 기술 또는 표준에서 문서화된 바와 같은 프로파일들 양쪽 모두를 준수한다는 의미에서 사용되고 있는 비디오 압축 기술 또는 표준에 의해 특정된 신택스에 부합할 수 있다. 구체적으로는, 프로파일은 비디오 압축 기술 또는 표준에서 이용 가능한 모든 도구들로부터의 해당 프로파일 하에서 사용을 위해 이용 가능한 유일한 도구들로서 특정한 도구들을 선택할 수 있다. 또한 준수에 필요한 것은 코딩된 비디오 시퀀스의 복잡도가 비디오 압축 기술 또는 표준의 레벨에 의해 정의된 바와 같은 한계들 내에 있다는 것일 수 있다. 일부 경우들에서, 레벨들은 최대 픽처 크기, 최대 프레임 레이트, 최대 재구성 샘플 레이트(예를 들어 초당 메가샘플로 측정됨), 최대 참조 픽처 크기 등을 제한한다. 레벨들에 의해 설정되는 제한들은, 일부 경우들에서, 코딩된 비디오 시퀀스에서 시그널링된 HRD 버퍼 관리를 위한 메타데이터와 HRD(Hypothetical Reference Decoder) 사양들을 통해 추가로 제한될 수 있다.
일 실시예에서, 수신기(231)는 인코딩된 비디오와 함께 추가적인 (중복성) 데이터를 수신할 수 있다. 추가적인 데이터는 코딩된 비디오 시퀀스(들)의 일부로서 포함될 수 있다. 추가적인 데이터는 데이터를 적절히 디코딩하기 위해 그리고/또는 원래의 비디오 데이터를 더 정확하게 재구성하기 위해 비디오 디코더(210)에 의해 사용될 수 있다. 추가적인 데이터는, 예를 들어, 시간적, 공간적, 또는 신호 잡음 비(signal noise ratio)(SNR) 향상 계층들, 중복성 슬라이스들, 중복성 픽처들, 순방향 오류 정정 코드들 등의 형태일 수 있다.
도 3은 비디오 인코더(303)의 예시적인 블록도를 도시한다. 비디오 인코더(303)는 전자 디바이스(320)에 포함된다. 전자 디바이스(320)는 송신기(340)(예컨대, 송신 회로부)를 포함한다. 비디오 인코더(303)는 도 1의 예에서 비디오 인코더(103) 대신 사용될 수 있다.
비디오 인코더(303)는 비디오 인코더(303)에 의해 코딩될 비디오 이미지(들)를 캡처할 수 있는 비디오 소스(301)(이는 도 3의 예에서 전자 디바이스(320)의 일부가 아님)로부터 비디오 샘플들을 수신할 수 있다. 다른 예에서, 비디오 소스(301)는 전자 디바이스(320)의 일부이다.
비디오 소스(301)는 임의의 적합한 비트 깊이(예를 들어: 8 비트, 10 비트, 12 비트, ...), 임의의 색공간(예를 들어, BT.601 Y CrCB, RGB, ...), 및 임의의 적합한 샘플링 구조(예를 들어 Y CrCb 4:2:0, Y CrCb 4:4:4)로 될 수 있는 디지털 비디오 샘플 스트림의 형태로 비디오 인코더(303)에 의해 코딩될 소스 비디오 시퀀스를 제공할 수 있다. 미디어 서빙 시스템에서, 비디오 소스(301)는 이전에 준비된 비디오를 저장하는 저장 디바이스일 수 있다. 화상회의 시스템에서, 비디오 소스(301)는 로컬 이미지 정보를 비디오 시퀀스로서 캡처하는 카메라일 수 있다. 비디오 데이터는 시퀀스에서 볼 때 모션을 부여하는 복수의 개별 픽처들로서 제공될 수 있다. 픽처들 자체는 픽셀들의 공간적 어레이로서 편성될 수 있으며, 여기서 각각의 픽셀은 사용 시에 샘플링 구조, 색 공간 등에 따라 달라지는 하나 이상의 샘플을 포함할 수 있다. 아래의 설명은 샘플들에 중점을 둔다.
일 실시예에 따르면, 비디오 인코더(303)는 코딩된 비디오 시퀀스(343)로 실시간으로 또는 요구된 바와 같은 임의의 다른 시간 제약조건들 하에서 소스 비디오 시퀀스의 픽처들을 코딩하고 압축할 수 있다. 적절한 코딩 속도를 강제하는 것이 제어기(350)의 하나의 기능이다. 일부 실시예들에서, 제어기(350)는 아래에서 설명되는 바와 같이 다른 기능성 유닛들을 제어하고 다른 기능성 유닛들에 기능적으로 결합된다. 결합은 명료함을 위해 묘사되지 않는다. 제어기(350)에 의해 설정된 파라미터들은 레이트 제어 관련 파라미터들(픽처 스킵, 양자화기, 레이트 왜곡 최적화 기법들의 람다(lambda) 값, ...), 픽처 크기, GOP(group of pictures) 레이아웃, 최대 모션 벡터 탐색 범위 등을 포함할 수 있다. 제어기(350)는 특정한 시스템 설계에 최적화되는 비디오 인코더(303)에 관한 다른 적합한 기능들을 갖도록 구성될 수 있다.
일부 실시예들에서, 비디오 인코더(303)는 코딩 루프에서 동작하도록 구성된다. 과도하게 단순화된 설명으로서, 일 예에서, 코딩 루프는 소스 코더(330)(예컨대, 코딩될 입력 픽처, 및 참조 픽처(들)에 기초하여 심볼 스트림과 같은 심볼들을 생성하는 것을 담당함)와, 비디오 인코더(303)에 내장된(로컬) 디코더(333)를 포함할 수 있다. 디코더(333)는 (원격) 디코더가 또한 생성할 것과 유사한 방식으로 샘플 데이터를 생성하기 위해 심볼들을 재구성한다. 재구성되는 샘플 스트림(샘플 데이터)은 참조 픽처 메모리(334)에 입력된다. 심볼 스트림의 디코딩이 디코더 로케이션(로컬 또는 원격)과는 독립적으로 비트 정확한(bit-exact) 결과들로 이어지므로, 참조 픽처 메모리(334)의 콘텐츠도 또한 로컬 인코더와 원격 인코더 사이에서 비트 정확하다. 다르게 말하면, 인코더의 예측 부분은 디코딩 동안 예측을 사용할 때 디코더가 "보는(see)" 것과 정확히 동일한 샘플 값들을 참조 픽처 샘플들로서 "본다". 참조 픽처 동기성(synchronicity)의 이 근본적인 원리(및, 동기성이 예를 들어 채널 에러들 때문에 유지될 수 없는 경우, 결과적인 드리프트)는 일부 관련 기술들에서도 사용된다.
"로컬" 디코더(333)의 동작은 도 2과 연계하여 위에서 이미 상세히 설명되었던 비디오 디코더(210)와 같은 "원격" 디코더와 동일할 수 있다. 그러나, 도 2를 또한 간략히 참조하면, 심볼들이 이용 가능하고 엔트로피 코더(345) 및 파서(220)에 의한 코딩된 비디오 시퀀스에 대한 심볼들의 인코딩/디코딩이 무손실일 수 있기 때문에, 버퍼 메모리(215)와 파서(220)를 포함하는 비디오 디코더(210)의 엔트로피 디코딩 부분들은 로컬 디코더(333)에서 완전히 구현되지 못할 수 있다.
일 실시예에서, 디코더에 존재하는 파싱/엔트로피 디코딩을 제외한 디코더 기술이 대응하는 인코더에서 동일하거나 실질적으로 동일한 기능적인 형태로 존재한다. 따라서, 개시된 주제는 디코더 동작에 중점을 둔다. 인코더 기술들의 설명은 포괄적으로 설명되는 디코더 기술들의 반대이므로 생략될 수 있다. 특정한 영역들에서 더 상세한 설명이 아래에서 제공된다.
동작 동안, 일부 예들에서, 소스 코더(330)는 "참조 픽처들"로서 지정된 비디오 시퀀스로부터의 하나 이상의 이전에 코딩된 픽처를 참조하여 입력 픽처를 예측적으로 코딩하는, 모션 보상된 예측 코딩을 수행할 수 있다. 이런 방식으로, 코딩 엔진(332)은 입력 픽처의 픽셀 블록들과 입력 픽처에 대한 예측 참조(들)로서 선택될 수 있는 참조 픽처(들)의 픽셀 블록들 사이의 차이들을 코딩한다.
로컬 비디오 디코더(333)는, 소스 코더(330)에 의해 생성되는 심볼들에 기초하여, 참조 픽처로서 지정될 수 있는 픽처들의 코딩된 비디오 데이터를 디코딩할 수 있다. 코딩 엔진(332)의 동작들은 유리하게는 손실 프로세스들일 수 있다. 코딩된 비디오 데이터가 비디오 디코더(도 3에 도시되지 않음)에서 디코딩될 수 있을 때, 재구성되는 비디오 시퀀스는 전형적으로 약간의 에러들이 있는 소스 비디오 시퀀스의 복제본일 수 있다. 로컬 비디오 디코더(333)는 참조 픽처들에 대해 비디오 디코더에 의해 수행될 수 있는 디코딩 프로세스들을 복제하고 재구성되는 참조 픽처들이 참조 픽처 메모리(334)에 저장되게 할 수 있다. 이 방식에서, 비디오 인코더(303)는 원단(far-end) 비디오 디코더에 의해 획득될 재구성되는 참조 픽처들(송신 에러들이 없음)로서 공통 콘텐츠를 갖는 재구성되는 참조 픽처들의 사본들을 로컬로 저장할 수 있다.
예측기(335)는 코딩 엔진(332)을 위한 예측 탐색들을 수행할 수 있다. 다시 말하면, 코딩될 새로운 픽처에 대해, 예측기(335)는 새로운 픽처들에 대한 적절한 예측 참조로서 역할을 할 수 있는, 참조 픽처 모션 벡터들, 블록 형상들 등과 같은 특정한 메타데이터 또는 샘플 데이터(후보 참조 픽셀 블록들로서)에 대해 참조 픽처 메모리(334)를 탐색할 수 있다. 예측기(335)는 적절한 예측 참조들을 찾기 위해 샘플 블록-바이-픽셀 블록 단위 기반으로(on sample block-by-pixel block basis) 동작할 수 있다. 일부 경우들에서, 예측기(335)에 의해 획득된 탐색 결과들에 의해 결정된 바와 같이, 입력 픽처는 참조 픽처 메모리(334)에 저장되는 다수의 참조 픽처들로부터 도출되는 예측 참조들을 가질 수 있다.
제어기(350)는, 예를 들어, 비디오 데이터를 인코딩하기 위해 사용되는 파라미터들 및 서브그룹 파라미터들의 설정을 포함하는 소스 코더(330)의 코딩 동작들을 관리할 수 있다.
전술한 모든 기능성 유닛들의 출력은 엔트로피 코더(345)에서 엔트로피 코딩을 받을 수 있다. 엔트로피 코더(345)는 허프만 코딩, 가변 길이 코딩, 산술 코딩 등과 같은 기술들에 따라 심볼들에 무손실 압축을 적용함으로써, 다양한 기능성 유닛들에 의해 생성된 바와 같은 심볼들을 코딩된 비디오 시퀀스로 변환한다.
송신기(340)는 엔트로피 코더(345)에 의해 생성된 바와 같은 코딩된 비디오 시퀀스(들)를 인코딩된 비디오 데이터를 저장할 저장 디바이스에 대한 하드웨어/소프트웨어 링크일 수 있는 통신 채널(360)을 통한 송신을 준비하기 위해 버퍼링할 수 있다. 송신기(340)는 비디오 인코더(303)로부터의 코딩된 비디오 데이터를 송신될 다른 데이터, 예를 들어, 코딩된 오디오 데이터 및/또는 보조 데이터 스트림들(소스들은 도시되지 않음)과 병합할 수 있다.
제어기(350)는 비디오 인코더(303)의 동작을 관리할 수 있다. 코딩 동안, 제어기(350)는 각각의 코딩된 픽처에, 각각의 픽처에 적용될 수 있는 코딩 기법들에 영향을 미칠 수 있는 특정한 코딩된 픽처 유형을 배정할 수 있다. 예를 들어, 픽처들은 종종 다음 픽처 유형들 중 하나로서 배정될 수 있다:
인트라 픽처(I 픽처)는 시퀀스에서의 임의의 다른 픽처를 예측의 소스로서 사용하지 않고 코딩 및 디코딩될 수 있다. 일부 비디오 코덱들은, 예를 들어 독립적인 디코더 리프레시(Independent Decoder Refresh)("IDR") 픽처들을 포함하는, 상이한 유형들의 인트라 픽처들을 허용한다.
예측 픽처(P 픽처)는 각각의 블록의 샘플 값들을 예측하기 위해 모션 벡터 및 참조 인덱스를 사용하는 인트라 예측 또는 인터 예측을 사용하여 코딩 및 디코딩될 수 있다.
양방향 예측 픽처(B 픽처)는 각각의 블록의 샘플 값들을 예측하기 위해 두 개의 모션 벡터들 및 참조 인덱스들을 사용하는 인트라 예측 또는 인터 예측을 사용하여 코딩 및 디코딩될 수 있다. 마찬가지로, 다수의 예측 픽처들은 단일 블록의 재구성을 위해 두 개를 초과하는 참조 픽처들 및 연관된 메타데이터를 사용할 수 있다.
소스 픽처들은 일반적으로 복수의 샘플 블록들(예를 들어, 각각 4x4, 8x8, 4x8, 또는 16x16 개 샘플들의 블록들)로 공간적으로 세분되고 블록-바이-블록 단위 기반으로 코딩될 수 있다. 블록들은 블록들의 각각의 픽처들에 적용되는 코딩 배정에 의해 결정되는 바와 같은 다른(이미 코딩된) 블록들을 참조하여 예측적으로 코딩될 수 있다. 예를 들어, I 픽처들의 블록들은 비예측적으로 코딩될 수 있거나 또는 그것들은 동일한 픽처의 이미 코딩된 블록들을 참조하여 예측적으로 (공간적 예측 또는 인트라 예측) 코딩될 수 있다. P 픽처들의 픽셀 블록들은 하나의 이전에 코딩된 참조 픽처를 참조하여 공간적 예측을 통해 또는 시간적 예측을 통해 예측적으로 코딩될 수 있다. B 픽처들의 블록들은 하나 또는 두 개의 이전에 코딩된 참조 픽처들을 참조하여 공간적 예측을 통해 또는 시간적 예측을 통해 예측적으로 코딩될 수 있다.
비디오 인코더(303)는 ITU-T Rec. H.265와 같은 미리 결정된 비디오 코딩 기술 또는 표준에 따라 코딩 동작들을 수행할 수 있다. 그 동작에서, 비디오 인코더(303)는 입력 비디오 시퀀스에서 시간적 중복성 및 공간적 중복성을 이용하는 예측 코딩 동작들을 포함하는 다양한 압축 동작들을 수행할 수 있다. 코딩된 비디오 데이터는, 그러므로, 사용되고 있는 비디오 코딩 기술 또는 표준에 의해 특정되는 신택스에 부합할 수 있다.
일 실시예에서, 송신기(340)는 추가적인 데이터를 인코딩된 비디오와 함께 송신할 수 있다. 소스 코더(330)는 이러한 데이터를 코딩된 비디오 시퀀스의 일부로서 포함할 수 있다. 추가적인 데이터는 시간적/공간적/SNR 향상 계층들, 중복성 픽처들 및 슬라이스들과 같은 다른 형태들의 중복성 데이터, SEI 메시지들, VUI 파라미터 세트 단편들 등을 포함할 수 있다.
비디오는 시간 시퀀스에서 복수의 소스 픽처들(비디오 픽처들)로서 캡처될 수 있다. 인트라 픽처 예측(종종 인트라 예측으로 단축됨)은 주어진 픽처에서의 공간적 상관을 이용하고, 인터 픽처 예측은 픽처들 사이의 (시간적 또는 다른) 상관을 이용한다. 일 예에서, 현재 픽처라고 지칭되는 인코딩/디코딩 중인 특정 픽처가 블록들로 파티셔닝된다. 현재 픽처의 블록이 비디오에서 이전에 코딩되고 여전히 버퍼링된 참조 픽처의 참조 블록과 유사할 때, 현재 픽처의 블록은 모션 벡터라고 지칭되는 벡터에 의해 코딩될 수 있다. 모션 벡터는 참조 픽처의 참조 블록을 가리키고, 다수의 참조 픽처들이 사용중인 경우, 참조 픽처를 식별하는 3차원을 가질 수 있다.
일부 실시예들에서, 양방향 예측(bi-prediction) 기법이 인터 픽처 예측에 사용될 수 있다. 양방향 예측 기법에 따르면, 둘 다 비디오 내의 디코딩 순서에서 현재 픽처에 이전인 (하지만 디스플레이 순서에서 각각 과거 및 장래에 있을 수 있는) 두 개의 참조 픽처들, 이를테면 제1 참조 픽처와 제2 참조 픽처가 사용된다. 현재 픽처 내의 블록은 제1 참조 픽처의 제1 참조 블록을 가리키는 제1 모션 벡터 및 제2 참조 픽처의 제2 참조 블록을 가리키는 제2 모션 벡터에 의해 코딩될 수 있다. 블록은 제1 참조 블록 및 제2 참조 블록의 조합에 의해 예측될 수 있다.
게다가, 병합 모드 기법이 코딩 효율을 개선하기 위해 인터 픽처 예측에 사용될 수 있다.
본 개시의 일부 실시예들에 따르면, 예측들, 이를테면 인터 픽처 예측들 및 인트라 픽처 예측들이 블록들의 단위로 수행된다. 예를 들어, HEVC 표준에 따르면, 비디오 픽처들의 시퀀스에서의 픽처가 압축을 위해 코딩 트리 유닛(CTU)들로 파티셔닝되며, 픽처의 CTU들은 동일한 크기, 이를테면 64x64개 픽셀들, 32x32개 픽셀들, 또는 16x16개 픽셀들을 갖는다. 일반적으로, CTU가 하나의 루마 CTB와 두 개의 크로마 CTB들인 세 개의 코딩 트리 블록들(coding tree blocks)(CTB들)을 포함한다. 각각의 CTU는 하나 또는 다수의 코딩 유닛들(CU들)로 재귀적으로 쿼드트리 분할될 수 있다. 예를 들어, 64x64개 픽셀들의 CTU가 64x64개 픽셀들의 하나의 CU, 또는 32x32개 픽셀들의 4개의 CU들, 또는 16x16개 픽셀들의 16개의 CU들로 분할될 수 있다. 일 예에서, 각각의 CU는 CU에 대한 예측 유형, 이를테면 인터 예측 유형 또는 인트라 예측 유형을 결정하기 위해 분석된다. CU는 시간적 및/또는 공간적 예측가능성에 의존하여 하나 이상의 예측 유닛(PU)으로 분할된다. 일반적으로, 각각의 PU는 루마 예측 블록(prediction block)(PB)과, 두 개의 크로마 PB들을 포함한다. 일 실시예에서, 코딩(인코딩/디코딩) 시의 예측 동작이 예측 블록 단위로 수행된다. 루마 예측 블록을 예측 블록의 일 예로서 사용하면, 예측 블록은 픽셀들, 이를테면 8x8개 픽셀들, 16x16개 픽셀들, 8x16개 픽셀들, 16x8개 픽셀들 등에 대한 값들(예컨대, 루마 값들)의 행렬을 포함한다.
비디오 인코더들(103 및 303) 및 비디오 디코더들(110 및 210)은 임의의 적합한 기법을 사용하여 구현될 수 있다는 것에 주의한다. 일 실시예에서, 비디오 인코더들(103 및 303) 및 비디오 디코더들(110 및 210)은 하나 이상의 집적 회로를 사용하여 구현될 수 있다. 다른 실시예에서, 비디오 인코더들(103 및 303) 및 비디오 디코더들(110 및 210)은 소프트웨어 명령어들을 실행하는 하나 이상의 프로세서를 사용하여 구현될 수 있다.
본 개시의 양태들은 로컬 조명 보상(LIC)이라고 지칭되는 인터 예측 기법과 함께 사용될 수 있는 기법들을 제공한다. 이 기법들은 양방향 예측에서 LIC의 사용을 가능하게 할 수 있다.
다양한 인터 예측 모드들은 비디오 코딩에서 사용될 수 있다. 예를 들어, VVC에서, 인터 예측된 CU에 대해, 모션 파라미터들은 MV(들), 하나 이상의 참조 픽처 인덱스, 참조 픽처 목록 사용 인덱스, 및 인터 예측된 샘플 생성에 사용될 특정한 코딩 특징들에 대한 추가적인 정보를 포함할 수 있다. 모션 파라미터가 명시적으로 또는 암시적으로 시그널링될 수 있다. CU가 스킵 모드로 코딩될 때, CU는 PU와 연관될 수 있고 중요한 잔차 계수들, 코딩된 모션 벡터 델타 또는 MV 차이(예컨대, MVD) 또는 참조 픽처 인덱스를 가질 수 없다. 공간적 및/또는 시간적 후보들과, VVC에서 도입된 것과 같은 임의적인 추가 정보를 포함하는 이웃하는 CU(들)로부터 현재 CU에 대한 모션 파라미터들이 획득되는 병합 모드가 특정될 수 있다. 병합 모드는 스킵 모드에 대해서 뿐만 아니라 인터 예측된 CU에 적용될 수 있다. 일 예에서, 병합 모드에 대한 대안이 모션 파라미터들의 명시적 송신이며, 여기서 MV(들), 각각의 참조 픽처 목록에 대한 대응하는 참조 픽처 인덱스와 참조 픽처 목록 사용 플래그 및 기타 정보가 CU마다 명시적으로 시그널링된다.
일 실시예에서, 이를테면 VVC에서, VVC 테스트 모델(VVC Test model)(VTM) 참조 소프트웨어는 하나 이상의 리파인된(refined) 인터 예측 코딩 도구를 포함하며, 이는 확장된 병합 예측, 병합 모션 벡터 차이(merge motion vector difference)(MMVD) 모드, 대칭 MVD 시그널링이 있는 적응적 모션 벡터 예측(adaptive motion vector prediction)(AMVP) 모드, 아핀(affine) 모션 보상 예측, 서브블록 기반 시간적 모션 벡터 예측(subblock-based temporal motion vector prediction)(SbTMVP), 적응적 모션 벡터 분해능(adaptive motion vector resolution)(AMVR), 모션 필드 저장(1/16번째 루마 샘플 MV 저장 및 8x8 모션 필드 압축), CU 레벨 가중값들이 있는 양방향 예측(BCW), 양방향 광학적 흐름(bi-directional optical flow)(BDOF), 광학적 흐름을 사용한 예측 리파인먼트(prediction refinement using optical flow)(PROF), 디코더 측 모션 벡터 리파인먼트(decoder side motion vector refinement)(DMVR), 결합된 인터 및 인트라 예측(combined inter and intra prediction)(CIIP), 기하학적 파티셔닝 모드(geometric partitioning mode)(GPM) 등을 포함한다.
일부 예들에서, 로컬 조명 보상(LIC)은 선형 함수를 사용하여 현재 블록과 현재 블록의 예측 블록(참조 블록이라고도 지칭됨) 사이의 로컬 조명 변동을 모델링하는 인터 예측 기법으로서 사용된다. 예측 블록은 참조 픽처에 있고, 현재 블록의 모션 벡터(MV)에 의해 가리켜질 수 있다. 선형 함수의 파라미터들은 스케일 α와 오프셋 β를 포함할 수 있고, 선형 함수는 조명 변화들을 보상하기 위해 α× p[x, y]+s에 의해 표현될 수 있으며, 여기서 p[x, y]는 참조 블록(예측 블록이라고도 지칭됨)에서 로케이션 [x, y]에 있는 참조 샘플을 나타내며, 참조 블록은 MV에 의해 가리켜진다. 일부 예들에서, 스케일 α와 오프셋 s는 최소제곱법을 사용하여 현재 블록의 템플릿 및 참조 블록의 대응하는 참조 템플릿에 기초하여 도출될 수 있으며, 따라서 LIC 플래그가 LIC의 사용을 표시하기 위해 시그널링될 수 있다는 것을 제외하면, 시그널링 오버헤드는 요구되지 않는다. 현재 블록의 템플릿에 기초하여 도출되는 스케일 α와 오프셋 s는 템플릿 기반 파라미터 세트라고 지칭될 수 있다.
일부 예들에서, LIC는 단방향 예측 인터 CU들에 사용된다. 일부 예들에서, 현재 블록의 인트라 이웃 샘플들(인트라 예측을 사용하여 예측되는 이웃하는 샘플들)은 LIC 파라미터 도출에 사용될 수 있다. 일부 예들에서, LIC는 32개 미만의 루마 샘플들을 갖는 블록들에 대해 불능화된다. 일부 예들에서, 비 서브블록 모드들(비 아핀 모드들을 포함함)의 경우, LIC 파라미터 도출은 제1 상부-좌측 16x16 유닛에 대한 부분적 템플릿 블록 샘플들 대신에, 현재 CU의 템플릿 블록 샘플들에 기초하여 수행된다. 일부 예들에서, LIC 파라미터 도출은 제1 상부-좌측 16x16 유닛에 대한 부분적 템플릿 블록 샘플들과 같은 부분적 템플릿 블록 샘플들에 기초하여 수행된다. 일부 예들에서, 참조 블록의 템플릿 샘플들은 블록의 MV를 정수-펠 정밀도로 반올림하지 않은 모션 보상(MC)을 사용하여 결정된다.
ECM에서의 LIC의 현재 설계는 단방향 예측된 블록들에만 적용되며, 이는 LIC의 코딩 성능을 제한한다는 것에 주의한다. 본 개시의 양태들은 비선형 항을 추가하는 것, 양방향 예측에서 LIC를 가능화하는 것, 공동 위치된 샘플의 이웃하는 샘플들의 사용을 가능하게 하는 것(공동 위치된 샘플에 다수의 탭들을 갖는 필터를 적용하는 것으로도 지칭됨) 등과 같이, LIC 성능을 개선하기 위한 다양한 기법들을 제공한다. 일부 예들에서, 비선형 항을 추가하기 위해, 인코더/디코더는 LIC에 사용되는 복수의 파라미터들에 대해 각각 복수의 파라미터 값들을 결정하며, 복수의 파라미터 값들은 k번째 거듭제곱의 비선형 항의 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값이고 1과 동일하지 않다. 일부 예들에서, k는 임의의 적합한 정수 또는 부동소수점 수일 수 있다. 일부 예들에서, k는 1보다 크다. 일 예에서, k는 2보다 크거나 같은 양의 정수이다. 인코더/디코더는, 현재 블록 내의 샘플에 대해, 현재 블록 내의 샘플에 관해 제1 참조 블록에 공동 위치되는 적어도 제1 공동 위치된 샘플(제1 참조 샘플이라고도 지칭됨)을 결정할 수 있고, 제1 공동 위치된 샘플에 기초하여 복수의 항들의 가중된 합을 계산하며, 가중된 합은 제1 공동 위치된 샘플의 k번째 거듭제곱에 적용되는 제1 가중 값을 포함한다. 현재 블록 내의 샘플은 가중된 합 및 오프셋에 대한 오프셋 값에 따라 재구성될 수 있다.
본 개시의 일부 양태들은 양방향 예측을 위해 LIC를 가능화하는 기법들을 제공하며, 따라서 현재 픽처 내의 현재 블록의 LIC 기반 예측은 각각의 참조 픽처들 내의 두 개의 참조 블록들을 통합할 수 있다.
본 개시의 일 양태에 따르면, 현재 픽처의 현재 블록 내의 샘플이 오프셋과 함께 두 개의 참조 블록들로부터의 예측 샘플들의 조합으로서 예측된다.
일부 실시예들에서, 현재 블록 내의 샘플의 예측은, 수학식 (1)에 의해 표현되는 바와 같이, 두 개의 참조 블록들로부터의 공동 위치된 참조 샘플들의 선형 가중된 합 및 오프셋으로 생성되며:
수학식 (1)
여기서 α i는 목록 i로부터 예측 블록, 즉, p i(x, y)에 적용되는 가중을 의미하며, s는 오프셋 값이며, (x, y)는 예측될 샘플의 수평 및 수직 좌표 값을 표시한다. 예를 들어, 좌표들은 각각의 블록의 상부-좌측 코너에 관해 정의된다. 블록의 상부-좌측 코너가 좌표들 (0,0)로 정의될 때, p(x, y)는 현재 블록 내의 좌표들 (x, y)에 있는 샘플을 나타내며, p 0(x, y)는 참조 목록 0으로부터의 제1 참조 픽처의 제1 참조 블록 내의 공동 위치된 샘플(참조 샘플이라고도 지칭됨)을 나타내고, p 1(x, y)은 참조 목록 1로부터의 제2 참조 픽처의 제2 참조 블록 내의 공동 위치된 샘플(참조 샘플이라고도 지칭됨)을 나타낸다. 제1 참조 블록과 제2 참조 블록은 현재 블록과 연관된 MV들에 따라 결정될 수 있다.
일 실시예에서, 선형 가중 값들(선형 가중들의 값들이라고도 지칭됨)과 오프셋 값(오프셋의 값이라고도 지칭됨), 즉, α i (예컨대, α 0α 1을 포함함) 및 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들을 사용하여 도출된다. 일 예에서, 이웃하는 재구성되는 샘플(템플릿) 영역은 도출을 위해 사용될 수 있다. 도출은 이웃하는 재구성되는 샘플(템플릿) 영역에서 예측 에러를 최소화하는 α is의 값들을 찾기 위해 최소 제곱 접근법, 최소 평균 제곱 접근법 등과 같은 접근법을 사용할 수 있다. 템플릿 영역은 위에 이웃하는 재구성되는 샘플들 및/또는 좌측에 이웃하는 재구성되는 샘플들, 그리고 또는 좌측 위에 이웃하는 재구성되는 샘플들을 포함할 수 있다. 일 예에서, 템플릿 영역 내의 샘플들의 예측은 가중들의 파라미터들(변수들)과 오프셋(α 0, α 1, 및 s)을 사용하여 표현될 수 있다. 가중들 및/또는 오프셋의 변화들은 LIC를 사용하여 템플릿 영역에서 재구성되는 샘플들 및 템플릿 영역 내의 샘플들의 예측 사이의 예측 에러를 변경시킬 수 있다. 일 예에서, 도출은 예측 에러를 최소화하는 가중들 및 오프셋의 값들(α 0, α 1, 및 s)을 찾을 수 있다.
다른 실시예에서, 선형 가중 값들, 즉, α i(예컨대, LIC에서 사용되는 실제 선형 가중 값들 또는 LIC에서 사용되는 실제 선형 가중 값들을 표시하는 인덱스를 포함함)는 이웃 블록들로부터 시그널링 또는 상속되고, 오프셋 값 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들과 α i의 시그널링된 값들을 사용하여 도출된다. 일 예에서, 템플릿 영역 내의 샘플들의 예측은 선형 가중 값들과 오프셋(s)의 파라미터(변수)를 사용하여 표현될 수 있다. 오프셋의 변화들은 LIC를 사용하여 템플릿 영역에서 재구성되는 샘플들과 템플릿 영역 내의 샘플들의 예측 사이의 예측 에러를 변경시킬 수 있다. 일 예에서, 도출은 예측 에러를 최소화하는 오프셋의 값(s)을 찾을 수 있다.
다른 실시예에서, 오프셋 값 s(예컨대, 실제 오프셋 값 또는 그 오프셋 값을 표시하는 인덱스를 포함함)는 이웃 블록들로부터 시그널링 또는 상속되고, 선형 가중 값들, 즉, α i는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들 및 s의 시그널링된 값을 사용하여 도출된다. 일 예에서, 템플릿 영역 내의 샘플들의 예측은 오프셋 값 s 및 가중들의 파라미터들(변수들)(α 0, 및 α 1)을 사용하여 표현될 수 있다. 가중들의 변화들은 LIC를 사용하여 템플릿 영역에서 재구성되는 샘플들과 템플릿 영역 내의 샘플들의 예측 사이의 예측 에러를 변경시킬 수 있다. 일 예에서, 도출은 예측 에러를 최소화하는 가중들의 값들(α 0, 및 α 1)을 찾을 수 있다.
다른 실시예에서, 선형 가중 값들 및 오프셋 값, 즉, α is(실제 선형 가중 값들 및 오프셋 값 또는 선형 가중 값들 및 오프셋 값을 표시하는 하나 이상의 인덱스를 포함함)는 이웃 블록들로부터 모두 시그널링 또는 상속된다.
일부 실시예들에서, 예측은, 수학식 (2)에 의해 표현되는 바와 같이, 두 개의 참조 블록들로부터의 다수의 참조 샘플들의 선형 가중된 합 및 오프셋으로서 생성되며:
수학식 (2)
여기서 (x, y)는 예측될 샘플의 수평 및 수직 좌표 값들을 나타내며, α i (x', y')은 목록 i로부터 참조 블록 내의 (x', y')에 위치된 예측 샘플, 즉, p i (x', y')에 적용되는 가중을 의미하며, s는 오프셋 값이다.
예를 들어, 좌표들은 각각의 블록의 좌측상단 코너에 관해 정의된다. 블록의 상부-좌측 코너가 좌표들 (0,0)로 정의될 때, p(x, y)는 현재 블록 내의 좌표들 (x, y)에 있는 샘플을 나타내며, p 0(x', y')은 참조 목록 0으로부터 제1 참조 픽처의 제1 참조 블록 내의 (x', y')에 있는 샘플을 나타내고, p 1(x', y')은 참조 목록 1로부터의 제2 참조 픽처의 제2 참조 블록 내의 (x', y')에 있는 샘플을 나타내며, α 0 (x', y')은 p 0(x', y')에 적용되는 가중을 나타내고, α 1 (x', y')은 p 1(x', y')에 적용되는 가중을 나타낸다.
일 실시예에서, 0이 아닌 가중 α i(x, y)를 갖는 참조 샘플들은 예측될 현재 샘플에 공동 위치되는 샘플(x, y) 주위의 특정 형상(S(x, y)에 의해 표시됨)을 형성한다. 다수의 참조 샘플들로 형성되는 임의의 적합한 형상들이 사용될 수 있다는 것에 주의한다.
일 예에서, 특정 형상은 십자 형상이며, 이는 목록 0 및 목록 1 참조 픽처들 각각에 5개의 0이 아닌 가중 계수들을 포함한다.
도 4는 일부 예들에서 LIC 양방향 예측을 예시하기 위한 도면을 도시한다. 도 4에서, 현재 픽처가 현재 블록(410)을 포함한다. 현재 블록의 제1 모션 벡터(MV0)가 제1 참조 픽처(예컨대, 참조 픽처 0) 내의 제1 참조 블록(420)을 가리키고, 현재 블록의 제2 모션 벡터(MV1)가 제2 참조 픽처(예컨대, 참조 픽처 1) 내의 제2 참조 블록(430)을 가리킨다. 현재 블록(410) 내의 샘플(411)에 대해, 참조 블록(420)은 공동 위치된(병치된(collocated) 또는 참조라고도 지칭됨) 샘플(421)을 포함하고, 참조 블록(430)은 공동 위치된(병치된 또는 참조라고도 지칭됨) 샘플(431)을 또한 포함한다. 일 예에서, 샘플(411)에 대응하는 공동 위치된 샘플들은 제1 모션 벡터(MV0) 및 제2 모션 벡터(MV1)에 의해 식별될 수 있다. 일 예에서, 샘플(411)을 예측하기 위해, 십자 형상을 형성하는 제1 참조 블록(420) 내의 5개 샘플들(425)과, 십자 형상을 형성하는 제2 참조 블록(430) 내의 5개 샘플들(435)은, 샘플(411)에 대한 예측을 생성하기 위해, 예를 들어 수학식 (2)에 따라 사용된다.
다른 예에서, 특정 형상은 목록 0 및 목록 1 참조 픽처들 각각에서 수직 3개 탭들(예컨대, 세로 방향에서 3개의 0이 아닌 가중 계수들)을 갖는 수직 막대 형상이다.
도 5는 일부 예들에서 LIC 양방향 예측을 예시하기 위한 도면을 도시한다. 도 5에서, 현재 픽처가 현재 블록(510)을 포함한다. 현재 블록의 제1 모션 벡터(MV0)가 제1 참조 픽처(예컨대, 참조 픽처 0) 내의 제1 참조 블록(520)을 가리키고, 현재 블록의 제2 모션 벡터(MV1)가 제2 참조 픽처(예컨대, 참조 픽처 1) 내의 제2 참조 블록(530)을 가리킨다. 현재 블록(510) 내의 샘플(511)에 대해, 참조 블록(520)은 공동 위치된(병치된 또는 참조라고도 지칭됨) 샘플(521)을 포함하고, 참조 블록(530)은 공동 위치된(병치된 또는 참조라고도 지칭됨) 샘플(531)을 또한 포함한다. 일 예에서, 샘플(511)에 대응하는 공동 위치된 샘플들은 제1 모션 벡터(MV0) 및 제2 모션 벡터(MV1)에 의해 식별될 수 있다. 일 예에서, 샘플(511)을 예측하기 위해, 수직 막대를 형성하는 제1 참조 블록(520) 내의 3개의 샘플들(525)과, 수직 막대를 형성하는 제2 참조 블록(530) 내의 3개의 샘플들(535)은 샘플(511)에 대한 예측을 생성하기 위해 예를 들어 수학식 (2)에 따라 사용된다.
다른 예에서, 특정 형상은 목록 0 및 목록 1 참조 픽처들 각각에서 수평 3개 탭들(예컨대, 수평 방향에서 3개의 0이 아닌 가중 계수들)을 갖는 수평 막대 형상이다.
도 6은 일부 예들에서 LIC 양방향 예측을 예시하기 위한 도면을 도시한다. 도 6에서, 현재 픽처가 현재 블록(610)을 포함한다. 현재 블록의 제1 모션 벡터(MV0)가 제1 참조 픽처(예컨대, 참조 픽처 0) 내의 제1 참조 블록(620)을 가리키고, 현재 블록의 제2 모션 벡터(MV1)가 제2 참조 픽처(예컨대, 참조 픽처 1) 내의 제2 참조 블록(630)을 가리킨다. 현재 블록(610) 내의 샘플(611)에 대해, 참조 블록(620)은 공동 위치된(병치된 또는 참조라고도 지칭됨) 샘플(621)을 포함하고, 참조 블록(630)은 공동 위치된(병치된 또는 참조라고도 지칭됨) 샘플(631)을 또한 포함한다. 일 예에서, 샘플(611)에 대응하는 공동 위치된 샘플들은 제1 모션 벡터(MV0) 및 제2 모션 벡터(MV1)에 의해 식별될 수 있다. 일 예에서, 샘플(611)을 예측하기 위해, 수평 막대를 형성하는 제1 참조 블록(620) 내의 3개의 샘플들(625)과, 수평 막대를 형성하는 제2 참조 블록(630) 내의 3개의 샘플들(635)은 샘플(611)에 대한 예측을 생성하기 위해 예를 들어 수학식 (2)에 따라 사용된다.
참조 픽처들 내의 샘플들의 임의의 적합한 형상들이 LIC 양방향 예측에서 사용될 수 있다는 것에 주의한다.
도 7a 내지 도 7p는 LIC에서 사용될 수 있는 샘플들의 일부 형상들을 도시한다. 각각의 형상에서 회색 착색된 샘플은 현재 픽처에서 예측될 샘플에 대응하는 참조 픽처 내의 공동 위치된 (참조) 샘플을 표시한다. 도 7a 및 도 7n은 일 예에서 십자 형상이라고 지칭되는 형상들을 도시한다. 도 7b는 수직 막대 형상이라고 지칭되는 형상을 도시한다. 도 7c는 수평 막대 형상이라고 지칭되는 형상을 도시한다. 도 7d 및 도 7e는 대각선 형상들이라고 지칭되는 형상을 도시한다. 도 7f 내지 도 7i는 Z자 형상들이라고 지칭되는 형상들을 도시한다. 도 7j는 I자 형상이라고 지칭되는 형상을 도시한다. 도 7k는 H자 형상이라고 지칭되는 형상을 도시한다. 도 7l 및 도 7o는 X자 형상이라고 지칭되는 형상들을 도시한다. 도 7m은 직사각형 형상이라고 지칭되는 형상들을 도시한다. 도 7p는 다이아몬드 형상이라고 지칭되는 형상들을 도시한다.
일 실시예에서, 선형 가중의 값들 및 오프셋 값들, 즉, α i(x’, y’) 및 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들을 사용하여 도출된다. 일 예에서, 이웃하는 재구성되는 샘플(템플릿) 영역은 도출을 위해 사용될 수 있다. 도출은 이웃하는 재구성되는 샘플(템플릿) 영역에서 예측 에러를 최소화하는 α is의 값들을 찾기 위해 최소 제곱 접근법, 최소 평균 제곱 접근법 등과 같은 접근법을 사용할 수 있다. 템플릿 영역은 위에 이웃하는 재구성되는 샘플들 및/또는 좌측에 이웃하는 재구성되는 샘플들, 그리고 또는 좌측 위에 이웃하는 재구성되는 샘플들을 포함할 수 있다.
다른 실시예에서, 선형 가중의 값들(또는 값들에 대한 인덱스), 즉, α i(x', y')은 이웃 블록들로부터 시그널링 또는 상속되고, 오프셋 값 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들과 α i(x', y')의 시그널링된 값을 사용하여 도출된다.
다른 실시예에서, 오프셋 값 s(또는 오프셋 값에 대한 인덱스)는 이웃 블록들로부터 시그널링 또는 상속되고, 선형 가중의 값들, 즉, α i(x', y')은 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들과 s의 시그널링된 값을 사용하여 도출된다.
다른 실시예에서, 선형 가중의 값들(또는 값들에 대한 인덱스) 및 오프셋 값, 즉, α i(x', y') 및 s는 이웃 블록들로부터 모두 시그널링 또는 상속된다.
일부 실시예들에서, 예측은, 수학식 (3)에 의해 표현되는 바와 같이, 2개의 참조 블록들의 공동 위치된 참조 샘플들의 비선형 가중된 합 및 오프셋으로서 생성되며:
수학식 (3)
여기서 αi는 목록 i로부터 예측 블록, 즉, pi(x, y)에 적용되는 선형 가중을 의미하며, βi는 비선형 항에 적용되는 가중(비선형 가중라고도 지칭됨)를 의미하고, k는 미리-정의된 거듭제곱 인덱스 값이며, s는 오프셋 값이며, (x, y)는 예측될 샘플의 수평 및 수직 좌표 값을 표시한다. k는 2와 같거나 그 보다 큰 양의 정수이라는 것에 주의한다. 일 예에서, k는 2와 동일하다. 다른 예에서, k는 3과 동일하다.
일 실시예에서, 선형 가중 및 비선형 가중의 값들 및 오프셋 값, 즉, α i, β is는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들을 사용하여 도출된다. 도출의 일 예가 이웃하는 재구성되는 샘플(템플릿) 영역에서 예측 에러를 최소화하는 α i, β is의 값들을 찾기 위해 최소 제곱 접근법, 최소 평균 제곱 접근법 등과 같은 접근법을 사용하고 있다. 일 예에서, 이웃하는 재구성되는 샘플(템플릿) 영역은 도출을 위해 사용될 수 있다. 도출은 이웃하는 재구성되는 샘플(템플릿) 영역에서 예측 에러를 최소화하는 α i, β is의 값들을 찾기 위해 최소 제곱 접근법을 사용할 수 있다. 템플릿 영역은 위에 이웃하는 재구성되는 샘플들 및/또는 좌측에 이웃하는 재구성되는 샘플들, 그리고 또는 좌측 위에 이웃하는 재구성되는 샘플들을 포함할 수 있다. 일 예에서, 템플릿 영역 내의 샘플들의 예측은 선형 가중들, 비선형 가중들 및 오프셋의 파라미터들(변수들)(α 0, α 1, β 0, β 1s)을 사용하여 표현될 수 있다. 선형 가중들, 비선형 가중들 및/또는 오프셋의 변화들은 LIC를 사용하여 템플릿 영역에서 재구성되는 샘플들 및 템플릿 영역 내의 샘플들의 예측 사이의 예측 에러를 변경시킬 수 있다. 일 예에서, 도출은 예측 에러를 최소화하는 가중들의 값들 및 오프셋(α 0, α 1, β 0, β 1s)을 찾을 수 있다.
다른 실시예에서, 선형 가중의 값들(또는 값들에 대한 인덱스), 즉, α i는 이웃 블록들로부터 시그널링 또는 상속되고, 비선형 가중, 즉, β i 과 오프셋 값 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들과 α i의 시그널링된 값을 사용하여 도출된다. 일 예에서, 템플릿 영역 내의 샘플들의 예측은 선형 가중의 값들, 비선형 가중들의 파라미터들(변수들) 및 오프셋(β 0, β 1s)을 사용하여 표현될 수 있다. 비선형 가중들 및/또는 오프셋의 변화들은 LIC를 사용하여 템플릿 영역에서 재구성되는 샘플들 및 템플릿 영역 내의 샘플들의 예측 사이의 예측 에러를 변경시킬 수 있다. 일 예에서, 도출은 예측 에러를 최소화하는 비선형 가중들 및 오프셋의 값들(β 0, β 1s)을 찾을 수 있다.
다른 실시예에서, 오프셋 값 s(또는 오프셋 값에 대한 인덱스)는 이웃 블록들로부터 시그널링 또는 상속되고, 선형 및 비선형 가중, 즉, α iβ i는, 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들 및 s의 시그널링된 오프셋 값을 사용하여 도출된다. 일 예에서, 템플릿 영역 내의 샘플들의 예측은 오프셋 값, 선형 가중들, 비선형 가중들 및 오프셋의 파라미터들(변수들)(α 0, α 1, β 0, β 1)을 사용하여 표현될 수 있다. 선형 가중들, 및/또는 비선형 가중들의 변화들은 LIC를 사용하여 템플릿 영역에서 재구성되는 샘플들과 템플릿 영역 내의 샘플들의 예측 사이의 예측 에러를 변경시킬수 있다. 일 예에서, 도출은 예측 에러를 최소화하는 가중들의 값들(α 0, α 1, β 0, β 1)을 찾을 수 있다.
다른 실시예에서, 선형 가중의 값들(또는 값들에 대한 인덱스) 및 오프셋 값들, 즉, α i, β is는 이웃 블록들로부터 모두 시그널링 또는 상속된다.
일부 실시예들에서, 예측은, 수학식 (4)에 의해 표현되는 바와 같이, 2개의 참조 블록들로부터의 다수의 참조 샘플들의 선형 가중된 합, 2개의 참조 블록들로부터의 공동 위치된 참조 샘플들의 비선형 가중된 합 및 오프셋의 조합으로서 생성되며:
(4)
여기서 αi는 목록 i로부터 예측 블록, 즉, pi(x, y)에 적용되는 선형 가중을 의미하며, βi는 비선형 항에 적용되는 비선형 가중을 의미하고, k는 미리 정의된 거듭제곱 인덱스 값이며, s는 오프셋 값이며, (x, y)는 예측될 샘플의 수평 및 수직 좌표 값을 표시한다. k는 1보다 큰 양의 정수라는 것에 주의한다. 일 예에서, k는 2와 동일하다.
일 실시예에서, 0이 아닌 가중 α i(x, y)를 갖는 참조 샘플들은 예측될 현재 샘플에 공동 위치되는 샘플 (x, y) 주위의 특정 형상, 즉 S(x, y)를 형성한다. 예시적인 형상은 십자 형상, 다이아몬드 형상, 직사각형 형상, 수직 형상, 수평 형상을 포함하지만 그것으로 제한되지 않는다. 도 7a 내지 도 7p는 0이 아닌 가중 α i(x, y)를 갖는 참조 샘플들에 사용될 수 있는 형상들의 일부를 도시한다.
일 실시예에서, 선형 가중의 값들, 즉, α i(x', y'), 비선형 가중의 값들, 즉, β i, 및 오프셋 값 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들을 사용하여 도출된다. 도출의 일 예가 이웃하는 재구성되는 샘플(템플릿) 영역에서 예측 에러를 최소화하는 α i(x', y'), β i, 및 s의 값들을 찾기 위해 최소 평균 제곱 접근법을 사용하고 있다.
다른 실시예에서, 선형 가중의 값들(또는 값들에 대한 인덱스), 즉, α i(x', y')은 이웃 블록들로부터 시그널링 또는 상속되고, 비선형 가중의 값들, 즉, β i와 오프셋 값 s는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들과 α i(x', y')의 시그널링된 값을 사용하여 도출된다.
다른 실시예에서, 오프셋 값 s(또는 오프셋 값에 대한 인덱스)는 이웃 블록들로부터 시그널링 또는 상속되고, 선형 가중의 값들, 즉, α i(x', y'), 및 비선형 가중의 값들, 즉, β i는 참조 블록들 및 현재 블록의 이웃하는 재구성되는 샘플들 및 s의 시그널링된 값을 사용하여 도출된다.
다른 실시예에서, 선형 가중의 값들(또는 값들에 대한 인덱스), 즉, α i(x', y'), 비선형 가중의 값들, 즉, β i 및 오프셋 값 s은 이웃 블록들로부터 모두 시그널링 또는 상속된다.
도 8은 본 개시의 일 실시예에 따른 프로세스(800)를 약술하는 흐름도를 도시한다. 프로세스(800)는 비디오 디코더에서 사용될 수 있다. 다양한 실시예들에서, 프로세스(800)는 프로세싱 회로부, 이를테면 비디오 디코더(110)의 기능들을 수행하는 프로세싱 회로부, 비디오 디코더(210)의 기능들을 수행하는 프로세싱 회로부 등에 의해 실행된다. 일부 실시예들에서, 프로세스(800)는 소프트웨어 명령어들로 구현되며, 따라서 프로세싱 회로부가 소프트웨어 명령어들을 실행할 때, 프로세싱 회로부는 프로세스(800)를 수행한다. 프로세스는 S801에서 시작하고 S810으로 진행한다.
S810에서, 현재 픽처 내의 현재 블록의 코딩된 정보는 코딩된 비디오 비트스트림으로부터 수신되며, 이 코딩된 정보는 제1 참조 픽처 내의 적어도 제1 참조 블록에 따라 현재 블록에 로컬 조명 보상(LIC)을 적용하는 것을 표시한다. 제1 참조 블록은 현재 블록의 제1 모션 벡터에 의해 가리켜진다.
S820에서, LIC에서 사용할 복수의 파라미터들 대한 복수의 파라미터 값들이 각각 결정된다. 복수의 파라미터 값들은 k번째 거듭제곱을 갖는 비선형 항의 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값이고 1과 동일하지 않다. 일부 예들에서, k는 임의의 적합한 정수 또는 부동소수점 수일 수 있다. 일부 예들에서, k는 1보다 크다. 일 예에서, k는 2와 같거나 그보다 큰 양의 정수이다.
S830에서, 현재 블록 내의 샘플에 대해, 현재 블록 내의 샘플에 관해 제1 참조 블록에 공동 위치되는 적어도 제1 참조 샘플이 결정된다. 제1 참조 샘플은 일 예에서 제1 공동 위치된 샘플이라고 또한 지칭된다.
S840에서, 복수의 항들의 가중된 합 및 오프셋이 제1 참조 샘플에 기초하여 계산된다. 가중된 합은 수학식 (3)에서와 같이, 제1 참조 샘플의 k번째 거듭제곱에 적용되는 제1 가중 값을 포함한다.
S850에서, 현재 블록 내의 샘플은, 수학식 (3)에서와 같이, 가중된 합에 따라 재구성된다.
일부 예들에서, 거듭제곱 인덱스 값 k는 2 또는 3 중 하나이다.
복수의 파라미터 값들을 결정하기 위해, 일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 현재 블록의 이웃하는 재구성되는 샘플들과 복수의 파라미터들을 이용한 LIC에 의한 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 결정된다.
일 예에서, 제1 가중 값은 코딩된 비디오 비트스트림으로부터 직접 디코딩된다. 다른 예에서, 인덱스가 코딩된 비디오 비트스트림으로부터 디코딩되며, 인덱스는 복수의 가중 값 후보들로부터의 제1 가중 값을 표시한다. 다른 예에서, 제1 가중 값은 현재 블록의 이웃 블록으로부터 상속된다.
일부 예들에서, 복수의 파라미터들은 제1 가중, 오프셋 및 적어도 선형 항에 대한 가중을 포함한다. 일 예에서, 복수의 파라미터들의 제1 서브세트에 대한 제1 값들이 결정된다. 복수의 파라미터들의 제2 서브세트에 대한 제2 값들은 현재 블록의 이웃하는 재구성되는 샘플들과 복수의 파라미터들의 제1 서브세트 및 복수의 파라미터들의 제2 서브세트에 대한 제1 값들을 이용한 LIC에 의한 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 결정된다. 일 예에서, 제1 값들은 코딩된 비디오 비트스트림으로부터 직접 디코딩된다. 다른 예에서, 적어도 인덱스는 코딩된 비디오 비트스트림으로부터 디코딩되며, 적어도 인덱스는 제1 값들을 표시한다. 다른 예에서, 복수의 파라미터들의 제1 서브세트에 대한 제1 값들은 현재 블록의 이웃 블록으로부터 상속된다.
일부 예들에서, 복수의 파라미터들의 제1 서브세트는 선형 항들에 대한 선형 가중들을 포함하고, 복수의 파라미터들의 제2 서브세트는 오프셋 및 비선형 항을 포함한다.
일부 예들에서, 복수의 파라미터들의 제1 서브세트는 오프셋을 포함하고, 복수의 파라미터들의 제2 서브세트는 선형 항들 및 비선형 항에 대한 선형 가중들을 포함한다.
일부 예들에서, 코딩된 정보는 제1 참조 픽처 내의 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 현재 블록에 양방향 예측의 LIC를 적용하는 것을 표시한다.
일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 샘플의 제1 선형 항의 제1 선형 가중에 대한 제1 선형 가중 값, 현재 블록 내의 샘플에 관해 제2 참조 블록에 공동 위치되는 제2 참조 샘플의 제2 선형 항의 제2 선형 가중에 대한 제2 선형 가중 값을 포함한다.
일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들을 포함하며, 제1 샘플들은 제1 참조 샘플과 참조 샘플의 하나 이상의 이웃 샘플을 포함한다. 제1 샘플들은 임의의 적합한 형상, 이를테면 십자 형상, 수직 막대 형상, 수평 막대 형상, 다이아몬드 형상, 직사각형 형상, 및 대각선 형상을 형성한다.
일부 예들에서, 코딩된 정보는 제1 참조 픽처 내의 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 현재 블록에 양방향 예측의 LIC를 적용하는 것을 표시하고, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들과 제2 참조 블록 내의 제2 샘플들에 대해 각각 제2 선형 항들의 제2 선형 가중들을 위한 제2 선형 가중 값들을 포함하며, 제1 샘플들은 제1 참조 샘플과 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함하며, 제2 샘플들은 제2 참조 블록 내의 제2 참조 샘플과 제2 참조 샘플의 하나 이상의 이웃 샘플을 포함한다.
그 다음에, 프로세스는 S899로 진행하고 종료된다.
프로세스(800)는 적절하게 적응될 수 있다. 프로세스(800)의 단계(들)는 수정 및/또는 생략될 수 있다. 추가적인 단계(들)가 추가될 수 있다. 임의의 적합한 구현 순서가 사용될 수 있다.
도 9는 본 개시의 일 실시예에 따른 프로세스(900)를 약술하는 흐름도를 도시한다. 프로세스(900)는 비디오 인코더에서 사용될 수 있다. 다양한 실시예들에서, 프로세스(900)는 프로세싱 회로부, 이를테면 비디오 인코더(103)의 기능들을 수행하는 프로세싱 회로부, 비디오 인코더(303)의 기능들을 수행하는 프로세싱 회로부 등에 의해 실행된다. 일부 실시예들에서, 프로세스(900)는 소프트웨어 명령어들로 구현되며, 따라서 프로세싱 회로부가 소프트웨어 명령어들을 실행할 때, 프로세싱 회로부는 프로세스(900)를 수행한다. 프로세스는 S901에서 시작하고 S910으로 진행한다.
S910에서, 현재 블록의 예측을 위해 제1 참조 픽처의 적어도 제1 참조 블록에 따라 현재 픽처 내의 현재 블록에 로컬 조명 보상(LIC)을 적용하는 것이 결정된다.
S920에서, LIC에서 사용할 복수의 파라미터들에 대한 복수의 파라미터 값들이 각각 결정된다. 복수의 파라미터 값들은 k번째 거듭제곱을 갖는 비선형 항의 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값이고 1과 동일하지 않다. 일부 예들에서, k는 임의의 적합한 정수 또는 부동소수점 수일 수 있다. 일부 예들에서, k는 1보다 크다. 일 예에서, k는 2보다 크거나 같은 양의 정수이다.
S930에서, 현재 블록 내의 샘플에 대해, 현재 블록 내의 샘플에 관해 제1 참조 블록에 공동 위치되는 적어도 제1 참조 샘플이 결정된다.
S940에서, 복수의 항들의 가중된 합이 제1 참조 샘플에 기초하여 계산되고, 가중된 합은, 수학식 (3)에서와 같이, 제1 참조 샘플의 k번째 거듭제곱에 적용되는 제1 가중 값을 포함한다.
S950에서, 현재 블록 내의 샘플은, 수식 (3)에서와 같이, 가중된 합 및 오프셋에 대한 오프셋 값에 따라 재구성된다.
일부 예들에서, 거듭제곱 인덱스 값 k는 2 또는 3 중 하나이다.
복수의 파라미터 값들을 결정하기 위해, 일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 현재 블록의 이웃하는 재구성되는 샘플들과 복수의 파라미터들을 이용한 LIC에 의한 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 결정된다.
일 예에서, 제1 가중 값은 코딩된 비디오 비트스트림으로 인코딩된다. 다른 예에서, 인덱스는 코딩된 비디오 비트스트림으로 인코딩되며, 인덱스는 복수의 가중 값 후보들로부터의 제1 가중 값을 표시한다. 다른 예에서, 제1 가중 값은 현재 블록의 이웃 블록으로부터 상속된다.
일부 예들에서, 복수의 파라미터들은 제1 가중, 오프셋 및 적어도 선형 항에 대한 가중을 포함한다. 일 예에서, 복수의 파라미터들의 제1 서브세트에 대한 제1 값들이 결정된다. 복수의 파라미터들의 제2 서브세트에 대한 제2 값들은 현재 블록의 이웃하는 재구성되는 샘플들과 복수의 파라미터들의 제1 서브세트 및 복수의 파라미터들의 제2 서브세트에 대한 제1 값들을 이용한 LIC에 의한 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 결정된다. 일 예에서, 제1 값들은 코딩된 비디오 비트스트림으로 인코딩된다. 다른 예에서, 적어도 인덱스는 코딩된 비디오 비트스트림으로 인코딩되며, 적어도 인덱스는 제1 값들을 표시한다. 다른 예에서, 복수의 파라미터들의 제1 서브세트에 대한 제1 값들은 현재 블록의 이웃 블록으로부터 상속된다.
일부 예들에서, 복수의 파라미터들의 제1 서브세트는 선형 항들에 대한 선형 가중들을 포함하고, 복수의 파라미터들의 제2 서브세트는 오프셋 및 비선형 항을 포함한다.
일부 예들에서, 복수의 파라미터들의 제1 서브세트는 오프셋을 포함하고, 복수의 파라미터들의 제2 서브세트는 선형 항들 및 비선형 항에 대한 선형 가중들을 포함한다.
일부 예들에서, 제1 참조 픽처 내의 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 현재 블록에 양방향 예측의 LIC를 적용하는 것이 결정된다.
일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 샘플의 제1 선형 항의 제1 선형 가중에 대한 제1 선형 가중 값, 현재 블록 내의 샘플에 관해 제2 참조 블록에 공동 위치되는 제2 참조 샘플의 제2 선형 항의 제2 선형 가중에 대한 제2 선형 가중 값을 포함한다.
일부 예들에서, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들을 포함하며, 제1 샘플들은 제1 참조 샘플과 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함한다. 제1 샘플들은 임의의 적합한 형상, 이를테면 십자 형상, 수직 막대 형상, 수평 막대 형상, 다이아몬드 형상, 직사각형 형상, 및 대각선 형상을 형성한다.
일부 예들에서, 제1 참조 픽처 내의 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 현재 블록에 양방향 예측의 LIC를 적용하는 것이 결정되고, 복수의 파라미터들에 대한 복수의 파라미터 값들은 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들과 제2 참조 블록 내의 제2 샘플들에 대해 각각 제2 선형 항들의 제2 선형 가중들을 위한 제2 선형 가중 값들을 포함하며, 제1 샘플들은 제1 참조 샘플과 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함하며, 제2 샘플들은 제2 참조 블록 내의 제2 참조 샘플과 제2 참조 샘플의 하나 이상의 이웃 샘플을 포함한다.
그 다음에, 프로세스는 S999로 진행하고 종료된다.
프로세스(900)는 적절하게 적응될 수 있다. 프로세스(900)의 단계(들)는 수정 및/또는 생략될 수 있다. 추가적인 단계(들)가 추가될 수 있다. 임의의 적합한 구현 순서가 사용될 수 있다.
위에서 설명된 기법들은, 컴퓨터 판독가능 명령어들을 사용하는 컴퓨터 소프트웨어로서 구현되고 하나 이상의 컴퓨터 판독가능 매체에 물리적으로 저장될 수 있다. 예를 들어, 도 10은 개시된 주제의 특정한 실시예들을 구현하기에 적합한 컴퓨터 시스템(1000)을 도시한다.
컴퓨터 소프트웨어는 하나 이상의 컴퓨터 중앙 프로세싱 유닛(central processing unit)(CPU), 그래픽 프로세싱 유닛들(Graphics Processing Units)(GPU들) 등에 의해 직접, 또는 인터프리션, 마이크로코드 실행 등을 통해 실행될 수 있는 명령어들을 포함하는 코드를 생성하기 위해 어셈블, 컴파일, 링킹, 또는 유사 메커니즘들을 받을 수 있는 임의의 적합한 머신 코드 또는 컴퓨터 언어를 사용하여 코딩될 수 있다.
명령어들은 예를 들어, 개인용 컴퓨터들, 태블릿 컴퓨터들, 서버들, 스마트폰들, 게이밍 디바이스들, 사물 인터넷 디바이스들 등을 포함하여 다양한 유형들의 컴퓨터들 또는 그 컴포넌트들 상에서 실행될 수 있다.
컴퓨터 시스템(1000)에 대해 도 10에 도시된 컴포넌트들은 본질적으로 예시적이고, 본 개시의 실시예들을 구현하는 컴퓨터 소프트웨어의 사용 또는 기능성의 범위에 관한 임의의 제한을 제안하지 않는 것으로 의도된다. 컴포넌트들의 구성은 컴퓨터 시스템(1000)의 예시적인 실시예에서 도시되는 컴포넌트들 중 임의의 하나 또는 조합에 관련한 어떠한 의존성이나 요구사항도 갖지 않는 것으로서는 해석되어야 한다.
컴퓨터 시스템(1000)은 특정한 휴먼 인터페이스 입력 디바이스들을 포함할 수 있다. 이러한 휴먼 인터페이스 입력 디바이스는, 예를 들어 촉각 입력(이를테면, 키스트로크들, 스위프들, 데이터 장갑 움직임들), 오디오 입력(이를테면, 음성, 박수소리(clapping)), 시각적 입력(이를테면, 제스처들), 후각 입력(도시되지 않음)을 통한 하나 이상의 인간 사용자에 의한 입력에 응답할 수 있다. 휴먼 인터페이스 디바이스들은, 오디오(이를테면, 스피치, 음악, 주변 사운드), 이미지들(이를테면, 스캔된 이미지들, 스틸 이미지 카메라에서 획득된 사진 이미지들), 비디오(이를테면 2차원 비디오, 스테레오스코픽 비디오를 포함하는 3차원 비디오)와 같이, 사람에 의한 의식적인 입력에 반드시 직접 관련되지는 않은 특정한 미디어를 캡처하는데 또한 사용될 수 있다.
입력 휴먼 인터페이스 디바이스들은 키보드(1001), 마우스(1002), 트랙패드(1003), 터치 스크린(1010), 데이터 장갑(도시되지 않음), 조이스틱(1005), 마이크로폰(1006), 스캐너(1007), 카메라(1008) 중 하나 이상(각각의 하나만 도시됨)을 포함할 수 있다.
컴퓨터 시스템(1000)은 또한 특정한 휴먼 인터페이스 출력 디바이스들을 포함할 수 있다. 이러한 휴먼 인터페이스 출력 디바이스들은, 예를 들어, 촉각 출력, 사운드, 광, 및 냄새/맛을 통해 하나 이상의 사람 사용자의 감지를 시뮬레이션하는 것일 수 있다. 이러한 휴먼 인터페이스 출력 디바이스들은 촉각 출력 디바이스들(예를 들어 터치스크린(1010), 데이터 장갑(도시되지 않음), 또는 조이스틱(1005)에 의한 촉각 피드백이지만, 또한 입력 디바이스들로서 역할을 하지 않는 촉각 피드백 디바이스들일 수 있음), 오디오 출력 디바이스들(이를테면 스피커들(1009), 헤드폰들(도시되지 않음)), 시각적 출력 디바이스들(이를테면 CRT 스크린들, LCD 스크린들, 플라즈마 스크린들, OLED 스크린들을 포함하는 스크린들(1010)이며, 각각은 터치스크린 입력 능력이 있거나 또는 없으며, 각각은 촉각 피드백 능력이 있거나 또는 없으며 ― 그것들의 일부는 스테레오그래픽 출력과 같은 수단; 가상 현실 안경(도시되지 않음), 홀로그래픽 디스플레이들 및 스모크 탱크들(도시되지 않음)), 및 프린터들(도시되지 않음)을 통해 2차원 시각적 출력 또는 3차원 초과 차원 출력을 출력할 수 있다.
컴퓨터 시스템(1000)은 사람 액세스가능 저장 디바이스들 및 그것들의 연관된 매체 이를테면 CD/DVD가 있는 CD/DVD ROM/RW(1020) 또는 유사 미디어(1021)를 포함하는 광 매체들, 엄지 드라이브(thumb-drive)(1022), 탈착식 하드 드라이브 또는 고체 상태 드라이브(1023), 테이프와 플로피 디스크(도시되지 않음)와 같은 레거시 자기 매체들, 보안 동글들(도시되지 않음)과 같은 전문화된 ROM/ASIC/PLD 기반 디바이스들 등을 또한 포함할 수 있다.
본 기술분야의 통상의 기술자들은 또한 현재 개시된 주제에 관련하여 사용되는 바와 같은 "컴퓨터 판독가능 매체"라는 용어가 송신 매체, 반송파들, 또는 다른 일시적인 신호들을 포함하는 것은 아님을 이해해야 한다.
컴퓨터 시스템(1000)은 하나 이상의 통신 네트워크(1055)에 대한 인터페이스(1054)를 또한 포함할 수 있다. 네트워크들은 예를 들어 무선, 와이어라인, 광학적일 수 있다. 네트워크들은 추가로 로컬, 광역, 대도시, 차량 및 산업, 실시간, 지연 허용 등일 수 있다. 네트워크들의 예들은 이더넷과 같은 근거리 네트워크들, 무선 LAN들, GSM, 3G, 4G, 5G, LTE 등을 포함하는 셀룰러 네트워크들, 케이블 TV, 위성 TV, 및 지상파 브로드캐스트 TV를 포함하는 TV 와이어라인 또는 무선 광역 디지털 네트워크들, CANBus를 포함하는 차량 및 산업 등을 포함한다. 특정 네트워크들은 일반적으로 특정 범용 데이터 포트들 또는 주변 버스들(1049)(예를 들어, 컴퓨터 시스템(1000)의 USB 포트들과 같은 것)에 부착되는 외부 네트워크 인터페이스 어댑터들을 요구하고; 다른 것들은 일반적으로 후술하는 바와 같은 시스템 버스로의 부착에 의해 컴퓨터 시스템(1000)의 코어에 통합된다(예를 들어, PC 컴퓨터 시스템으로의 이더넷 인터페이스 또는 스마트폰 컴퓨터 시스템으로의 셀룰러 네트워크 인터페이스). 이들 네트워크들 중 임의의 것을 사용하여, 컴퓨터 시스템(1000)은 다른 엔티티들과 통신할 수 있다. 이러한 통신은 예를 들어 로컬 또는 광역 디지털 네트워크들을 사용하여 다른 컴퓨터 시스템들에 단방향, 수신 전용(예를 들어, 브로드캐스트 TV), 단방향 전송 전용(예를 들어 CANbus에서 특정 CANbus 디바이스들), 또는 양방향일 수 있다. 특정한 프로토콜들 및 프로토콜 스택들이 위에서 설명된 바와 같은 그들 네트워크들 및 네트워크 인터페이스들 각각에서 사용될 수 있다.
전술한 휴먼 인터페이스 디바이스들, 사람 액세스가능 저장 디바이스들, 및 네트워크 인터페이스들은 컴퓨터 시스템(1000)의 코어(1040)에 부착될 수 있다.
코어(1040)는 하나 이상의 중앙 프로세싱 유닛(CPU)(1041), 그래픽 프로세싱 유닛들(GPU)(1042), 전문화된 프로그램가능 프로세싱 유닛들을 필드 프로그램가능 게이트 영역들(Field Programmable Gate Areas)(FPGA)(1043), 특정한 태스크들을 위한 하드웨어 가속기들(1044), 그래픽 어댑터들(1050) 등의 형태로 포함할 수 있다. 이들 디바이스들은, 판독전용 메모리(Read-only memory)(ROM)(1045), 랜덤 액세스 메모리(1046), 내부 비사용자 액세스가능 하드 드라이브들, SSD들 등과 같은 내부 대용량 스토리지(1047)와 함께, 시스템 버스(1048)를 통해 연결될 수 있다. 일부 컴퓨터 시스템들에서, 시스템 버스(1048)는 추가적인 CPU들, GPU 등에 의한 확장들을 가능하게 하는 하나 이상의 물리적 플러그 형태로 액세스 가능할 수 있다. 주변 디바이스들은 코어의 시스템 버스(1048)에, 또는 주변기기 버스(1049)를 통해 직접 부착될 수 있다. 일 예에서, 스크린(1010)은 그래픽 어댑터(1050)에 연결될 수 있다. 주변기기 버스를 위한 아키텍처들은 PCI, USB 등을 포함한다.
CPU들(1041), GPU들(1042), FPGA들(1043), 및 가속기들(1044)은, 조합하여, 전술한 컴퓨터 코드를 구성할 수 있는 특정한 명령어들을 실행할 수 있다. 해당 컴퓨터 코드는 ROM(1045) 또는 RAM(1046)에 저장될 수 있다. 임시 데이터는 RAM(1046)에 또한 저장될 수 있는 반면, 영구적 데이터는 예를 들어, 내부 대용량 스토리지(1047)에 저장될 수 있다. 메모리 디바이스들 중 임의의 것에 대한 고속 저장 및 검색은 하나 이상의 CPU(1041), GPU(1042), 대용량 스토리지(1047), ROM(1045), RAM(1046) 등에 밀접하게 연관될 수 있는 캐시 메모리의 사용을 통해 가능하게 될 수 있다.
컴퓨터 판독가능 매체는 다양한 컴퓨터 구현 동작들을 수행하기 위한 컴퓨터 코드를 가질 수 있다. 매체 및 컴퓨터 코드는 본 개시의 목적들을 위해 특수하게 설계되고 구성될 수 있거나, 또는 그것들은 컴퓨터 소프트웨어 기술분야들에서 통상의 기술자들에게 널리 공지되고 그러한 기술자들이 이용 가능한 것일 수 있다.
제한이 아닌 예로서, 아키텍처를 갖는 컴퓨터 시스템(1000), 및 구체적으로 코어(1040)는 프로세서(들)(CPU들, GPU들, FPGA, 가속기들 등을 포함함)가 하나 이상의 유형의 컴퓨터 판독가능 매체에 구현된 소프트웨어를 실행하는 결과로서 기능성을 제공할 수 있다. 이러한 컴퓨터 판독가능 매체는 위에 소개된 바와 같은 사용자-액세스가능한 대용량 스토리지뿐만 아니라, 코어-내부 대용량 스토리지(1047) 또는 ROM(1045)과 같은 비일시적인 본질의 것인 코어(1040)의 특정 스토리지와 연관된 매체일 수 있습니다. 본 개시의 다양한 실시예들을 구현하는 소프트웨어는 이러한 디바이스들에 저장되고 코어(1040)에 의해 실행될 수 있다. 컴퓨터 판독가능 매체가 특정 요구에 따라 하나 이상의 메모리 디바이스 또는 칩을 포함할 수 있다. 소프트웨어는 코어(1040)와 구체적으로는 그 안의 프로세서들(CPU, GPU, FPGA 등을 포함함)이 RAM(1046)에 저장되는 데이터 구조들을 정의하는 것과 이러한 데이터 구조들을 소프트웨어에 의해 정의되는 프로세스들에 따라 수정하는 것을 포함하여, 본 개시에서 설명되는 특정 프로세스들 또는 특정 프로세스들의 특정 부분들을 실행하게 할 수 있다. 추가로 또는 대안으로서, 컴퓨터 시스템은, 본 명세서에 설명된 특정한 프로세스들 또는 특정한 프로세스들의 특정한 부분들을 실행하기 위해 소프트웨어 대신에 또는 소프트웨어와 함께 동작할 수 있는, 회로(예를 들어: 가속기(1044))에 하드와이어링되거나 기타의 방식으로 구현된 로직의 결과로서 기능성을 제공할 수 있다. 소프트웨어에 대한 언급은 로직을 포함할 수 있고, 적절한 경우, 그 반대의 경우도 성립한다. 컴퓨터 판독가능 매체에 대한 언급은, 적절한 경우, 실행을 위한 소프트웨어를 저장하는 회로(이를테면 집적 회로(IC)), 실행을 위한 로직을 구현하는 회로, 또는 둘 다를 포괄할 수 있다. 본 개시는 하드웨어 및 소프트웨어의 임의의 적합한 조합을 포함한다.
본 개시에서의 "중 적어도 하나" 또는 "중 하나"의 사용은 언급된 요소들의 임의의 하나 또는 조합을 포함하도록 의도된다. 예를 들어, A, B, 또는 C 중 적어도 하나; A, B, 및 C 중 적어도 하나; A, B, 및/또는 C 중 적어도 하나; 그리고 A 내지 C 중 적어도 하나에 대한 언급들은 A만, B만, C만 또는 그것들의 임의의 조합을 포함하도록 의도된다. A 또는 B 중 하나와 A 및 B 중 하나에 대한 언급들은 A 또는 B(또는A와 B)를 포함하도록 의도된다. "중 하나"의 사용은 적용 가능할 때, 이를테면 요소들이 상호 배타적이지 않을 때 언급된 요소들의 임의의 조합을 배제하지 않는다.
본 개시가 예시적인 여러 실시예들을 설명하였지만, 본 개시의 범위 내에 속하는 대체, 순열, 및 다양한 치환 동등물들이 있다. 따라서 본 기술분야의 통상의 기술자들은, 명시적으로 도시되거나 또는 설명되지 않았지만, 본 개시의 원리들을 구현하고 따라서 그 사상 및 범위 내에 있는 수많은 시스템들 및 방법들을 고안할 수 있다는 것이 이해될 것이다.

Claims (20)

  1. 비디오 디코딩 방법으로서,
    코딩된 비디오 비트스트림으로부터 현재 픽처 내의 현재 블록의 코딩된 정보를 수신하는 단계 ― 상기 코딩된 정보는 제1 참조 픽처 내의 적어도 제1 참조 블록에 따라 상기 현재 블록에 로컬 조명 보상(LIC)을 적용하는 것을 표시함 ―;
    상기 현재 블록 내의 샘플에 대해, 상기 제1 참조 블록 내의 적어도 제1 참조 샘플을 결정하는 단계 ― 상기 제1 참조 샘플은 상기 현재 블록 내의 상기 샘플에 공동 위치됨 ―;
    상기 LIC에서 사용되는 복수의 파라미터들에 대한 복수의 파라미터 값들에 따라 상기 LIC에 대한 오프셋 및 복수의 항들의 가중된 합(weighted sum)을 계산하는 단계 ― 상기 복수의 파라미터 값들은 k번째 거듭제곱의 상기 제1 참조 샘플의 비선형 항에 적용되는 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값을 포함하고 1과 동일하지 않음 ―; 및
    상기 가중된 합에 따라 상기 현재 블록 내의 상기 샘플을 재구성하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서, 상기 거듭제곱 인덱스 값은 2인, 방법.
  3. 제1항에 있어서,
    상기 현재 블록의 이웃하는 재구성되는 샘플들과 상기 복수의 파라미터들을 이용한 상기 LIC에 의한 상기 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 상기 복수의 파라미터들에 대한 상기 복수의 파라미터 값들을 결정하는 단계를 더 포함하는, 방법.
  4. 제1항에 있어서,
    상기 코딩된 비디오 비트스트림으로부터 상기 제1 가중 값을 디코딩하는 단계;
    상기 코딩된 비디오 비트스트림으로부터 인덱스를 디코딩하는 단계 ― 상기 인덱스는 상기 제1 가중 값을 표시함 ―; 및
    상기 현재 블록의 이웃 블록으로부터 상기 제1 가중 값을 상속하는 단계
    중 적어도 하나를 더 포함하는, 방법.
  5. 제1항에 있어서, 상기 복수의 파라미터들은 상기 제1 가중, 상기 오프셋 및 적어도 선형 항에 대한 가중을 포함하고, 상기 방법은,
    상기 복수의 파라미터들의 제1 서브세트에 대한 제1 값들을 결정하는 단계; 및
    상기 현재 블록의 이웃하는 재구성되는 샘플들과 상기 복수의 파라미터들의 제1 서브세트 및 상기 복수의 파라미터들의 제2 서브세트에 대한 상기 제1 값들을 이용한 상기 LIC에 의한 상기 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 상기 복수의 파라미터들의 제2 서브세트에 대한 제2 값들을 결정하는 단계
    를 더 포함하는, 방법.
  6. 제5항에 있어서, 상기 복수의 파라미터들의 제1 서브세트에 대한 상기 제1 값들을 결정하는 단계는,
    상기 코딩된 비디오 비트스트림으로부터 상기 제1 값들을 디코딩하는 단계;
    상기 코딩된 비디오 비트스트림으로부터 적어도 인덱스를 디코딩하는 단계 ― 적어도 상기 인덱스는 상기 제1 값들을 표시함 ―; 및
    상기 현재 블록의 이웃 블록으로부터 상기 복수의 파라미터들의 제1 서브세트에 대한 상기 제1 값들을 상속하는 단계
    중 적어도 하나를 포함하는, 방법.
  7. 제5항에 있어서, 상기 복수의 파라미터들의 제1 서브세트는 선형 항들에 대한 선형 가중들(linear weightings)을 포함하고, 상기 복수의 파라미터들의 제2 서브세트는 상기 오프셋 및 상기 비선형 항을 포함하는, 방법.
  8. 제5항에 있어서, 상기 복수의 파라미터들의 제1 서브세트는 상기 오프셋을 포함하고, 상기 복수의 파라미터들의 제2 서브세트는 선형 항들 및 상기 비선형 항에 대한 선형 가중들을 포함하는, 방법.
  9. 제1항에 있어서, 상기 코딩된 정보는 상기 제1 참조 픽처 내의 상기 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 상기 현재 블록에 대해 양방향 예측의 상기 LIC를 적용하는 것을 표시하는, 방법.
  10. 제9항에 있어서, 상기 복수의 파라미터들에 대한 상기 복수의 파라미터 값들은 상기 제1 참조 샘플의 제1 선형 항의 제1 선형 가중에 대한 제1 선형 가중 값, 상기 현재 블록 내의 상기 샘플에 관해 상기 제2 참조 블록에 공동 위치되는 제2 참조 샘플의 제2 선형 항의 제2 선형 가중에 대한 제2 선형 가중 값을 포함하는, 방법.
  11. 제1항에 있어서, 상기 복수의 파라미터들에 대한 상기 복수의 파라미터 값들은 상기 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들을 포함하며, 상기 제1 샘플들은 상기 제1 참조 샘플과 상기 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함하는, 방법.
  12. 제11항에 있어서, 상기 제1 샘플들은,
    십자 형상;
    수직 막대 형상;
    수평 막대 형상;
    다이아몬드 형상;
    직사각형 형상; 및
    대각선 형상
    중 적어도 하나를 형성하는, 방법.
  13. 제1항에 있어서, 상기 코딩된 정보는 상기 제1 참조 픽처 내의 상기 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 상기 현재 블록에 대해 양방향 예측의 상기 LIC를 적용하는 것을 표시하고, 상기 복수의 파라미터들에 대한 상기 복수의 파라미터 값들은 상기 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들과 상기 제2 참조 블록 내의 제2 샘플들에 대해 각각 제2 선형 항들의 제2 선형 가중들을 위한 제2 선형 가중 값들을 포함하며, 상기 제1 샘플들은 상기 제1 참조 샘플과 상기 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함하며, 상기 제2 샘플들은 상기 제2 참조 블록 내의 제2 참조 샘플과 상기 제2 참조 샘플의 하나 이상의 이웃 샘플을 포함하는, 방법.
  14. 비디오 디코딩을 위한 장치로서,
    프로세싱 회로부
    를 포함하며, 상기 프로세싱 회로부는,
    코딩된 비디오 비트스트림으로부터 현재 픽처 내의 현재 블록의 코딩된 정보를 수신하고 - 상기 코딩된 정보는 제1 참조 픽처 내의 적어도 제1 참조 블록에 따라 상기 현재 블록에 로컬 조명 보상(LIC)을 적용하는 것을 표시함 ―;
    상기 현재 블록 내의 샘플에 대해, 상기 제1 참조 블록 내의 적어도 제1 참조 샘플을 결정하며 - 상기 제1 참조 샘플은 상기 현재 블록 내의 상기 샘플에 공동 위치됨 ―;
    상기 LIC에서 사용되는 복수의 파라미터들에 대한 복수의 파라미터 값들에 따라 상기 LIC에 대한 오프셋 및 복수의 항들의 가중된 합을 계산하고 ― 상기 복수의 파라미터 값들은 k번째 거듭제곱의 상기 제1 참조 샘플의 비선형 항에 적용되는 제1 가중을 위한 적어도 제1 가중 값을 포함하며, k는 거듭제곱 인덱스 값을 포함하고 1과 동일하지 않음 ―;
    상기 가중된 합에 따라 상기 현재 블록 내의 상기 샘플을 재구성하도록
    구성되는, 장치.
  15. 제14항에 있어서, 상기 거듭제곱 인덱스 값은 2인, 장치.
  16. 제14항에 있어서, 상기 프로세싱 회로부는,
    상기 현재 블록의 이웃하는 재구성되는 샘플들과 상기 복수의 파라미터들을 이용한 상기 LIC에 의한 상기 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 상기 복수의 파라미터들에 대한 상기 복수의 파라미터 값들을 결정하도록 구성되는, 장치.
  17. 제14항에 있어서, 상기 프로세싱 회로부는,
    상기 코딩된 비디오 비트스트림으로부터 상기 제1 가중 값을 디코딩하는 것;
    상기 코딩된 비디오 비트스트림으로부터 인덱스를 디코딩하는 것 ― 상기 인덱스는 상기 제1 가중 값을 표시함 ―; 및
    상기 현재 블록의 이웃 블록으로부터 상기 제1 가중 값을 상속하는 것
    중 적어도 하나를 수행하도록 구성되는, 장치.
  18. 제14항에 있어서, 상기 복수의 파라미터들은 상기 제1 가중, 상기 오프셋 및 적어도 선형 항에 대한 가중을 포함하며, 상기 프로세싱 회로부는,
    상기 복수의 파라미터들의 제1 서브세트에 대한 제1 값들을 결정하고;
    상기 현재 블록의 이웃하는 재구성되는 샘플들과 상기 복수의 파라미터들의 제1 서브세트 및 상기 복수의 파라미터들의 제2 서브세트에 대한 상기 제1 값들을 이용한 상기 LIC에 의한 상기 이웃하는 재구성되는 샘플들의 예측들 사이의 예측 에러를 최소화함으로써 상기 복수의 파라미터들의 제2 서브세트에 대한 제2 값들을 결정하도록
    구성되는, 장치.
  19. 제14항에 있어서, 상기 코딩된 정보는 상기 제1 참조 픽처 내의 상기 제1 참조 블록 및 제2 참조 픽처 내의 제2 참조 블록에 따라 상기 현재 블록에 대해 양방향 예측의 상기 LIC를 적용하는 것을 표시하는, 장치.
  20. 제14항에 있어서, 상기 복수의 파라미터들에 대한 상기 복수의 파라미터 값들은 상기 제1 참조 블록 내의 제1 샘플들에 대해 각각 제1 선형 항들의 제1 선형 가중들을 위한 제1 선형 가중 값들을 포함하며, 상기 제1 샘플들은 상기 제1 참조 샘플과 상기 제1 참조 샘플의 하나 이상의 이웃 샘플을 포함하는, 장치.
KR1020247010562A 2022-10-20 2023-10-19 양방향 예측을 위한 로컬 조명 보상 KR20240056557A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202263417930P 2022-10-20 2022-10-20
US63/417,930 2022-10-20
US18/381,538 US20240236300A9 (en) 2023-10-18 Local illumination compensation for bi-prediction
US18/381,538 2023-10-18
PCT/US2023/077328 WO2024086736A1 (en) 2022-10-20 2023-10-19 Local illumination compensation for bi-prediction

Publications (1)

Publication Number Publication Date
KR20240056557A true KR20240056557A (ko) 2024-04-30

Family

ID=90790819

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247010562A KR20240056557A (ko) 2022-10-20 2023-10-19 양방향 예측을 위한 로컬 조명 보상

Country Status (2)

Country Link
KR (1) KR20240056557A (ko)
WO (1) WO2024086736A1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020056798A1 (zh) * 2018-09-21 2020-03-26 华为技术有限公司 一种视频编解码的方法与装置
US11863774B2 (en) * 2021-01-15 2024-01-02 Tencent America LLC Method and apparatus for video coding

Also Published As

Publication number Publication date
US20240137488A1 (en) 2024-04-25
WO2024086736A1 (en) 2024-04-25

Similar Documents

Publication Publication Date Title
KR102606201B1 (ko) 비디오 코딩을 위한 방법 및 장치
KR102646839B1 (ko) 비디오 코딩을 위한 방법 및 장치
KR102496457B1 (ko) 비디오 코딩에서 추가적인 중간 후보들을 갖는 병합 모드를 위한 방법 및 장치
WO2020014052A1 (en) Method and apparatus for video coding
KR20210049930A (ko) 비디오 디코딩을 위한 방법 및 장치
US11394957B2 (en) Constraints on reference sample locations in the dedicated buffer for intra picture block compensation
KR102587655B1 (ko) 비디오 코딩을 위한 방법 및 장치
KR102637503B1 (ko) 비디오 시퀀스의 디코딩 또는 인코딩을 위한 인트라-인터 예측 모드를 제어하기 위한 방법 및 장치
WO2020117905A1 (en) Simplified most probable mode list generation scheme
KR20210069720A (ko) 작은 코딩 블록들에 대한 단순화된 병합 리스트 구성
KR102603451B1 (ko) 비디오 코딩을 위한 방법 및 장치
EP3777139A1 (en) Mode list generation for multi-line intra prediction
US20190373279A1 (en) Methods and apparatus for inter prediction with a reduced above line buffer in video coding
US20240236300A9 (en) Local illumination compensation for bi-prediction
US20240137488A1 (en) Local illumination compensation for bi-prediction
KR102678765B1 (ko) 비디오 코딩을 위한 방법 및 장치
US20240022758A1 (en) Full-pixel based and group-based motion compensated picture boundary padding
US20240236350A1 (en) Amvp-merge mode with sbtmvp
US20240022738A1 (en) Template matching for multiple reference line intra prediction
US20240129479A1 (en) Motion vector derivation of subblock-based template-matching for subblock based motion vector predictor
US20240236367A1 (en) Template-matching based adaptive block vector resolution (abvr) in ibc
US20230336774A1 (en) Zero motion vector in adaptive reordering of merge candidates (armc)
KR20240108401A (ko) 크로마 및 인트라 템플릿 매칭을 위한 플립핑 모드
KR20240066262A (ko) 지오메트리 아핀 모드 및 지오메트리 서브블록 모드들
KR20240063957A (ko) GPM(Geometric Partition Mode)에 대한 템플릿-매칭 기반 병합 인덱스 재순서화