KR20210001852A - 양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치 - Google Patents

양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치 Download PDF

Info

Publication number
KR20210001852A
KR20210001852A KR1020190158986A KR20190158986A KR20210001852A KR 20210001852 A KR20210001852 A KR 20210001852A KR 1020190158986 A KR1020190158986 A KR 1020190158986A KR 20190158986 A KR20190158986 A KR 20190158986A KR 20210001852 A KR20210001852 A KR 20210001852A
Authority
KR
South Korea
Prior art keywords
motion information
current block
bcw
control points
control point
Prior art date
Application number
KR1020190158986A
Other languages
English (en)
Inventor
김재일
이선영
신재섭
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to PCT/KR2020/008386 priority Critical patent/WO2020263027A1/ko
Priority to US17/623,438 priority patent/US12063352B2/en
Priority to CN202080060741.2A priority patent/CN114342406A/zh
Publication of KR20210001852A publication Critical patent/KR20210001852A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치를 개시한다.
본 발명의 일 실시예에 의하면, 어파인(affine) 머지 후보 리스트에 포함되는 constructed 후보의 양방향 예측 가중치 인덱스를 유도하는 방법으로서, 현재블록에 설정된 컨트롤 포인트들 중에서, 복수 개의 대상 컨트롤 포인트들에 대한 사용 가능성 여부를 판단하는 단계; 상기 대상 컨트롤 포인트들이 사용 가능한 경우, 상기 대상 컨트롤 포인트들의 예측 방향과 참조 픽처를 확인하는 단계; 및 상기 대상 컨트롤 포인트들의 예측 방향이 모두 양방향이고 상기 참조 픽처가 서로 동일한 경우, 상기 대상 컨트롤 포인트들의 양방향 예측 가중치 인덱스 후보들로부터 상기 양방향 예측 가중치 인덱스를 유도하는 단계를 포함하는, 양방향 예측 가중치 인덱스를 유도하는 방법을 제공한다.

Description

양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치{METHOD AND APPARATUS FOR DERIVING BI-PREDICTION WEIGHT INDEX}
본 발명은 영상의 부호화 및 복호화에 관한 것으로서, 더욱 구체적으로는 양방향 예측 가중치 인덱스를 더욱 효율적으로 유도함으로써 부호화 및 복호화의 효율을 향상시킨 양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치에 관한 것이다.
동영상 데이터는 음성 데이터나 정지 영상 데이터 등에 비하여 많은 데이터량을 가지기 때문에, 압축을 위한 처리 없이 그 자체를 저장하거나 전송하기 위해서는 메모리를 포함하여 많은 하드웨어 자원을 필요로 한다.
따라서, 통상적으로 동영상 데이터를 저장하거나 전송할 때에는 부호화기를 사용하여 동영상 데이터를 압축하여 저장하거나 전송하며, 복호화기에서는 압축된 동영상 데이터를 수신하여 압축을 해제하고 재생한다. 이러한 동영상 압축 기술로는 H.264/AVC를 비롯하여, H.264/AVC에 비해 약 40% 정도의 부호화 효율을 향상시킨 HEVC(High Efficiency Video Coding)가 존재한다.
그러나, 영상의 크기 및 해상도, 프레임율이 점차 증가하고 있고, 이에 따라 부호화해야 하는 데이터량도 증가하고 있으므로 기존의 압축 기술보다 더 부호화 효율이 좋고 화질 개선 효과도 높은 새로운 압축 기술이 요구된다.
이러한 요구에 부응하기 위해 본 발명은 개선된 영상 부호화 및 복호화 기술을 제공하는 것을 목적으로 하며, 특히, 본 발명의 일 측면은 컨트롤 포인트들에 설정된 가중치 인덱스들이 양방향 중에서 어느 방향에 더욱 큰 가중치를 두는지 여부에 따라 현재블록의 가중치 인덱스를 유도함으로써 부호화 및 복호화의 효율을 향상시키는 기술과 관련된다.
본 발명의 일 측면은, 어파인(affine) 머지 후보 리스트에 포함되는 constructed 후보의 양방향 예측 가중치 인덱스를 유도하는 방법으로서, 현재블록에 설정된 컨트롤 포인트들 중에서, 복수 개의 대상 컨트롤 포인트들에 대한 사용 가능성 여부를 판단하는 단계; 상기 대상 컨트롤 포인트들이 사용 가능한 경우, 상기 대상 컨트롤 포인트들의 예측 방향과 참조 픽처를 확인하는 단계; 및 상기 대상 컨트롤 포인트들의 예측 방향이 모두 양방향이고 상기 참조 픽처가 서로 동일한 경우, 상기 대상 컨트롤 포인트들의 양방향 예측 가중치 인덱스 후보들로부터 상기 양방향 예측 가중치 인덱스를 유도하는 단계를 포함하는, 양방향 예측 가중치 인덱스를 유도하는 방법을 제공한다.
본 발명의 다른 일 측면은, 현재블록에 설정된 컨트롤 포인트들 중에서, 복수 개의 대상 컨트롤 포인트들에 대한 사용 가능성 여부를 판단하는 판단부; 상기 대상 컨트롤 포인트들이 사용 가능한 경우, 상기 대상 컨트롤 포인트들의 예측 방향과 참조 픽처를 확인하는 확인부; 및 상기 대상 컨트롤 포인트들의 예측 방향이 모두 양방향이고 상기 참조 픽처가 서로 동일한 경우, 상기 대상 컨트롤 포인트들의 양방향 예측 가중치 인덱스 후보들로부터 어파인(affine) 머지 후보 리스트에 포함되는 constructed 후보의 양방향 예측 가중치 인덱스를 유도하는 유도부를 포함하는, 영상 복호화 장치를 제공한다.
이상에서 설명한 바와 같이 본 발명의 일 실시예에 의하면, 어파인 예측 방법을 통해 움직임을 더욱 정확하게 표현함으로써 예측의 정확도를 높여 부호화 및 복호화의 효율을 향상시킬 수 있다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다.
도 2는 QTBTTT 구조를 이용하여 블록을 분할하는 방법을 설명하기 위한 도면이다.
도 3은 복수의 인트라 예측 모드들을 설명하기 위한 도면이다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다.
도 5는 공간적/시간적 후보블록들의 위치를 설명하기 위한 도면이다.
도 6은 어파인 모델의 종류를 설명하기 위한 도면이다.
도 7은 어파인 모드를 통해 서브블록 어레이의 움직임정보를 도출하는 방법을 설명하기 위한 도면이다.
도 8은 어파인 모드에서 이용되는 주변블록들의 위치를 설명하기 위한 도면이다.
도 9는 본 개시의 기술들을 구현할 수 있는 예측부의 예시적인 블록도이다.
도 10은 양방향 예측 가중치 인덱스를 유도하는 일 실시예를 설명하기 위한 순서도이다.
도 11 내지 도 14는 양방향 예측 가중치 인덱스를 유도하는 다양한 실시예들을 설명하기 위한 순서도이다.
이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성 요소들에 식별 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 1은 본 개시의 기술들을 구현할 수 있는 영상 부호화 장치에 대한 예시적인 블록도이다. 이하에서는 도 1을 참조하여 영상 부호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 부호화 장치는 블록 분할부(110), 예측부(120), 감산기(130), 변환부(140), 양자화부(145), 부호화부(150), 역양자화부(160), 역변환부(165), 가산기(170), 필터부(180) 및 메모리(190)를 포함하여 구성될 수 있다.
영상 부호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
하나의 영상(비디오)는 복수의 픽처들로 구성된다. 각 픽처들은 복수의 영역으로 분할되고 각 영역마다 부호화가 수행된다. 예를 들어, 하나의 픽처는 하나 이상의 타일(Tile) 또는/및 슬라이스(Slice)로 분할된다. 여기서, 하나 이상의 타일을 타일 그룹(Tile Group)으로 정의할 수 있다. 각 타일 또는/슬라이스는 하나 이상의 CTU(Coding Tree Unit)로 분할된다. 그리고 각 CTU는 트리 구조에 의해 하나 이상의 CU(Coding Unit)들로 분할된다. 각 CU에 적용되는 정보들은 CU의 신택스로서 부호화되고, 하나의 CTU에 포함된 CU들에 공통적으로 적용되는 정보는 CTU의 신택스로서 부호화된다. 또한, 하나의 타일 내의 모든 블록들에 공통적으로 적용되는 정보는 타일의 신택스로서 부호화되거나 다수 개의 타일을 모아 놓은 타일 그룹의 신택스로서 부호화되며, 하나의 픽처들을 구성하는 모든 블록들에 적용되는 정보는 픽처 파라미터 셋(PPS, Picture Parameter Set) 혹은 픽처 헤더에 부호화된다. 나아가, 복수의 픽처가 공통으로 참조하는 정보들은 시퀀스 파라미터 셋(SPS, Sequence Parameter Set)에 부호화된다. 그리고, 하나 이상의 SPS가 공통으로 참조하는 정보들은 비디오 파라미터 셋(VPS, Video Parameter Set)에 부호화된다.
블록 분할부(110)는 CTU(Coding Tree Unit)의 크기를 결정한다. CTU의 크기에 대한 정보(CTU size)는 SPS 또는 PPS의 신택스로서 부호화되어 영상 복호화 장치로 전달된다.
블록 분할부(110)는 영상을 구성하는 각 픽처(picture)를 미리 결정된 크기를 가지는 복수의 CTU(Coding Tree Unit)들로 분할한 이후에, 트리 구조(tree structure)를 이용하여 CTU를 반복적으로(recursively) 분할한다. 트리 구조에서의 리프 노드(leaf node)가 부호화의 기본 단위인 CU(coding unit)가 된다.
트리 구조로는 상위 노드(혹은 부모 노드)가 동일한 크기의 네 개의 하위 노드(혹은 자식 노드)로 분할되는 쿼드트리(QuadTree, QT), 또는 상위 노드가 두 개의 하위 노드로 분할되는 바이너리트리(BinaryTree, BT), 또는 상위 노드가 1:2:1 비율로 세 개의 하위 노드로 분할되는 터너리트리(TernaryTree, TT), 또는 이러한 QT 구조, BT 구조 및 TT 구조 중 둘 이상을 혼용한 구조일 수 있다. 예컨대, QTBT(QuadTree plus BinaryTree) 구조가 사용될 수 있고, 또는 QTBTTT(QuadTree plus BinaryTree TernaryTree) 구조가 사용될 수 있다. 여기서, BTTT를 합쳐서 MTT(Multiple-Type Tree)라 칭할 수 있다.
도 2는 QTBTTT 분할 트리 구조를 보인다. 도 2에서 보는 바와 같이, CTU는 먼저 QT 구조로 분할될 수 있다. 쿼드트리 분할은 분할 블록(splitting block)의 크기가 QT에서 허용되는 리프 노드의 최소 블록 크기(MinQTSize)에 도달할 때까지 반복될 수 있다. QT 구조의 각 노드가 하위 레이어의 4개의 노드들로 분할되는지 여부를 지시하는 제1 플래그(QT_split_flag)는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. QT의 리프 노드가 BT에서 허용되는 루트 노드의 최대 블록 크기(MaxBTSize)보다 크지 않은 경우, BT 구조 또는 TT 구조 중 어느 하나 이상으로 더 분할될 수 있다. BT 구조 및/또는 TT 구조에서는 복수의 분할 방향이 존재할 수 있다. 예컨대, 해당 노드의 블록이 가로로 분할되는 방향과 세로로 분할되는 방향 두 가지가 존재할 수 있다. 도 2와 같이, MTT 분할이 시작되면, 노드들이 분할되었는지 여부를 지시하는 제2 플래그(mtt_split_flag)와, 분할이 되었다면 추가적으로 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그 및/또는 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
트리 구조의 다른 예로서, QTBTTT 구조를 사용하여 블록을 분할하는 경우, 먼저 분할 되었음을 나타내는 CU 분할 플래그(split_cu_flag) 및 분할 타입이 QT 분할인지를 지시하는 QT 분할 플래그(split_qt_flag) 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. CU 분할 플래그(split_cu_flag) 값이 분할되지 않았음을 지시하는 경우, 해당 노드의 블록이 분할 트리 구조에서의 리프 노드(leaf node)가 되어 부호화의 기본 단위인 CU(coding unit)가 된다. CU 분할 플래그(split_cu_flag) 값이 분할되었음을 지시하는 경우, QT 분할 플래그(split_qt_flag) 값을 통해 분할 타입이 QT 혹은 MTT인지를 구분한다. 분할 타입이 QT인 경우에는 더 이상의 추가 정보가 없으며, 분할 타입이 MTT인 경우에는 추가적으로 MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
트리 구조의 다른 예시로서 QTBT가 사용되는 경우, 해당 노드의 블록을 동일 크기의 두 개 블록으로 가로로 분할하는 타입(즉, symmetric horizontal splitting)과 세로로 분할하는 타입(즉, symmetric vertical splitting) 두 가지가 존재할 수 있다. BT 구조의 각 노드가 하위 레이어의 블록으로 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할되는 타입을 지시하는 분할 타입 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다. 한편, 해당 노드의 블록을 서로 비대칭 형태의 두 개의 블록으로 분할하는 타입이 추가로 더 존재할 수도 있다. 비대칭 형태에는 해당 노드의 블록을 1:3의 크기 비율을 가지는 두 개의 직사각형 블록으로 분할하는 형태가 포함될 수 있고, 혹은 해당 노드의 블록을 대각선 방향으로 분할하는 형태가 포함될 수도 있다.
CU는 CTU로부터의 QTBT 또는 QTBTTT 분할에 따라 다양한 크기를 가질 수 있다. 이하에서는, 부호화 또는 복호화하고자 하는 CU(즉, QTBTTT의 리프 노드)에 해당하는 블록을 '현재블록'이라 칭한다.
예측부(120)는 현재블록을 예측하여 예측블록을 생성한다. 예측부(120)는 인트라 예측부(122)와 인터 예측부(124)를 포함한다.
일반적으로, 픽처 내 현재블록들은 각각 예측적으로 코딩될 수 있다. 일반적으로 현재블록의 예측은 (현재블록을 포함하는 픽처로부터의 데이터를 사용하는) 인트라 예측 기술 또는 (현재블록을 포함하는 픽처 이전에 코딩된 픽처로부터의 데이터를 사용하는) 인터 예측 기술을 사용하여 수행될 수 있다. 인터 예측은 단방향 예측과 양방향 예측 모두를 포함한다.
인트라 예측부(122)는 현재블록이 포함된 현재 픽처 내에서 현재블록의 주변에 위치한 픽셀(참조 픽셀)들을 이용하여 현재블록 내의 픽셀들을 예측한다. 예측 방향에 따라 복수의 인트라 예측모드가 존재한다. 예컨대, 도 3에서 보는 바와 같이, 복수의 인트라 예측모드는 planar 모드와 DC 모드를 포함하는 비방향성 모드와 65개의 방향성 모드를 포함할 수 있다. 각 예측모드에 따라 사용할 주변 픽셀과 연산식이 다르게 정의된다.
인트라 예측부(122)는 현재블록을 부호화하는데 사용할 인트라 예측 모드를 결정할 수 있다. 일부 예들에서, 인트라 예측부(122)는 여러 인트라 예측 모드들을 사용하여 현재블록을 인코딩하고, 테스트된 모드들로부터 사용할 적절한 인트라 예측 모드를 선택할 수도 있다. 예를 들어, 인트라 예측부(122)는 여러 테스트된 인트라 예측 모드들에 대한 레이트 왜곡(rate-distortion) 분석을 사용하여 레이트 왜곡 값들을 계산하고, 테스트된 모드들 중 최선의 레이트 왜곡 특징들을 갖는 인트라 예측 모드를 선택할 수도 있다.
인트라 예측부(122)는 복수의 인트라 예측 모드 중에서 하나의 인트라 예측 모드를 선택하고, 선택된 인트라 예측 모드에 따라 결정되는 주변 픽셀(참조 픽셀)과 연산식을 사용하여 현재블록을 예측한다. 선택된 인트라 예측 모드에 대한 정보가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.
인터 예측부(124)는 움직임 보상 과정을 통해 현재블록에 대한 예측블록을 생성한다. 현재 픽처보다 먼저 부호화 및 복호화된 참조픽처 내에서 현재블록과 가장 유사한 블록을 탐색하고, 그 탐색된 블록을 이용하여 현재블록에 대한 예측블록을 생성한다. 그리고, 현재 픽처 내의 현재블록과 참조픽처 내의 예측블록 간의 변위(displacement)에 해당하는 움직임벡터(motion vector)를 생성한다. 일반적으로, 움직임 추정은 루마(luma) 성분에 대해 수행되고, 루마 성분에 기초하여 계산된 모션 벡터는 루마 성분 및 크로마 성분 모두에 대해 사용된다. 현재블록을 예측하기 위해 사용된 참조픽처에 대한 정보 및 움직임벡터에 대한 정보를 포함하는 움직임 정보는 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 전달된다.
감산기(130)는 현재블록으로부터 인트라 예측부(122) 또는 인터 예측부(124)에 의해 생성된 예측블록을 감산하여 잔차블록을 생성한다.
변환부(140)는 공간 영역의 픽셀 값들을 가지는 잔차블록 내의 잔차 신호를 주파수 도메인의 변환 계수로 변환한다. 변환부(140)는 잔차블록의 전체 크기를 변환 단위로 사용하여 잔차블록 내의 잔차 신호들을 변환할 수 있으며, 또는 잔차블록을 변환 영역 및 비변환 영역인 두 개의 서브블록으로 구분하여, 변환 영역 서브블록만 변환 단위로 사용하여 잔차 신호들을 변환할 수 있다. 여기서, 변환 영역 서브블록은 가로축 (혹은 세로축) 기준 1:1의 크기 비율을 가지는 두 개의 직사각형 블록 중 하나일 수 있다. 이런 경우, 서브블록 만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 위치 정보(cu_sbt_pos_flag)가 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다. 또한, 변환 영역 서브블록의 크기는 가로축 (혹은 세로축) 기준 1:3의 크기 비율을 가질 수 있으며, 이런 경우 해당 분할을 구분하는 플래그(cu_sbt_quad_flag)가 추가적으로 부호화부(150)에 의해 부호화되어 영상 복호화 장치로 시그널링된다.
양자화부(145)는 변환부(140)로부터 출력되는 변환 계수들을 양자화하고, 양자화된 변환 계수들을 부호화부(150)로 출력한다.
부호화부(150)는 양자화된 변환 계수들을 CABAC(Context-based Adaptive Binary Arithmetic Code) 등의 부호화 방식을 사용하여 부호화함으로써 비트스트림을 생성한다. 부호화부(150)는 블록 분할과 관련된 CTU size, CU 분할 플래그, QT 분할 플래그, MTT 분할 방향, MTT 분할 타입 등의 정보를 부호화하여, 영상 복호화 장치가 영상 부호화 장치와 동일하게 블록을 분할할 수 있도록 한다.
또한, 부호화부(150)는 현재블록이 인트라 예측에 의해 부호화되었는지 아니면 인터 예측에 의해 부호화되었는지 여부를 지시하는 예측 타입에 대한 정보를 부호화하고, 예측 타입에 따라 인트라 예측정보(즉, 인트라 예측 모드에 대한 정보) 또는 인터 예측정보(참조픽처 및 움직임벡터에 대한 정보)를 부호화한다.
역양자화부(160)는 양자화부(145)로부터 출력되는 양자화된 변환 계수들을 역양자화하여 변환 계수들을 생성한다. 역변환부(165)는 역양자화부(160)로부터 출력되는 변환 계수들을 주파수 도메인으로부터 공간 도메인으로 변환하여 잔차블록을 복원한다.
가산부(170)는 복원된 잔차블록과 예측부(120)에 의해 생성된 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 다음 순서의 블록을 인트라 예측할 때 참조 픽셀로서 사용된다.
필터부(180)는 블록 기반의 예측 및 변환/양자화로 인해 발생하는 블록킹 아티팩트(blocking artifacts), 링잉 아티팩트(ringing artifacts), 블러링 아티팩트(blurring artifacts) 등을 줄이기 위해 복원된 픽셀들에 대한 필터링을 수행한다. 필터부(180)는 디블록킹 필터(182)와 SAO(Sample Adaptive Offset) 필터(184)를 포함할 수 있다.
디블록킹 필터(180)는 블록 단위의 부호화/복호화로 인해 발생하는 블록킹 현상(blocking artifact)을 제거하기 위해 복원된 블록 간의 경계를 필터링하고, SAO 필터(184)는 디블록킹 필터링된 영상에 대해 추가적인 필터링을 수행한다. SAO 필터(184)는 손실 부호화(lossy coding)로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해 사용되는 필터이다.
디블록킹 필터(182) 및 SAO 필터(184)를 통해 필터링된 복원블록은 메모리(190)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
도 4는 본 개시의 기술들을 구현할 수 있는 영상 복호화 장치의 예시적인 블록도이다. 이하에서는 도 4를 참조하여 영상 복호화 장치와 이 장치의 하위 구성들에 대하여 설명하도록 한다.
영상 복호화 장치는 복호화부(410), 역양자화부(420), 역변환부(430), 예측부(440), 가산기(450), 필터부(460) 및 메모리(470)를 포함하여 구성될 수 있다.
도 1의 영상 부호화 장치와 마찬가지로, 영상 복호화 장치의 각 구성요소는 하드웨어 또는 소프트웨어로 구현되거나, 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. 또한, 각 구성요소의 기능이 소프트웨어로 구현되고 마이크로프로세서가 각 구성요소에 대응하는 소프트웨어의 기능을 실행하도록 구현될 수도 있다.
복호화부(410)는 영상 부호화 장치로부터 수신한 비트스트림을 복호화하여 블록 분할과 관련된 정보를 추출함으로써 복호화하고자 하는 현재블록을 결정하고, 현재블록을 복원하기 위해 필요한 예측정보와 잔차신호에 대한 정보 등을 추출한다.
복호화부(410)는 SPS(Sequence Parameter Set) 또는 PPS(Picture Parameter Set)로부터 CTU size에 대한 정보를 추출하여 CTU의 크기를 결정하고, 픽처를 결정된 크기의 CTU로 분할한다. 그리고, CTU를 트리 구조의 최상위 레이어, 즉, 루트 노드로 결정하고, CTU에 대한 분할정보를 추출함으로써 트리 구조를 이용하여 CTU를 분할한다.
예컨대, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 MTT의 분할과 관련된 제2 플래그(MTT_split_flag) 및 분할 방향(vertical / horizontal) 및/또는 분할 타입(binary / ternary) 정보를 추출하여 해당 리프 노드를 MTT 구조로 분할한다. 이를 통해 QT의 리프 노드 이하의 각 노드들을 BT 또는 TT 구조로 반복적으로(recursively) 분할한다.
또 다른 예로서, QTBTTT 구조를 사용하여 CTU를 분할하는 경우, 먼저 CU의 분할 여부를 지시하는 CU 분할 플래그(split_cu_flag)를 추출하고, 해당 블록이 분할된 경우, QT 분할 플래그(split_qt_flag)를 추출한다. 분할 타입이 QT가 아니고 MTT인 경우, MTT 분할 방향(vertical 혹은 horizontal)을 나타내는 플래그(mtt_split_cu_vertical_flag) 및/또는 MTT 분할 타입(Binary 혹은 Ternary)을 나타내는 플래그(mtt_split_cu_binary_flag)를 추가적으로 추출한다. 분할 과정에서 각 노드는 0번 이상의 반복적인 QT 분할 후에 0번 이상의 반복적인 MTT 분할이 발생할 수 있다. 예컨대, CTU는 바로 MTT 분할이 발생하거나, 반대로 다수 번의 QT 분할만 발생할 수도 있다.
다른 예로서, QTBT 구조를 사용하여 CTU를 분할하는 경우, QT의 분할과 관련된 제1 플래그(QT_split_flag)를 추출하여 각 노드를 하위 레이어의 네 개의 노드로 분할한다. 그리고, QT의 리프 노드에 해당하는 노드에 대해서는 BT로 더 분할되는지 여부를 지시하는 분할 플래그(split_flag) 및 분할 방향 정보를 추출한다.
한편, 복호화부(410)는 트리 구조의 분할을 통해 복호화하고자 하는 현재블록을 결정하게 되면, 현재블록이 인트라 예측되었는지 아니면 인터 예측되었는지를 지시하는 예측 타입에 대한 정보를 추출한다. 예측 타입 정보가 인트라 예측을 지시하는 경우, 복호화부(410)는 현재블록의 인트라 예측정보(인트라 예측 모드)에 대한 신택스 요소를 추출한다. 예측 타입 정보가 인터 예측을 지시하는 경우, 복호화부(410)는 인터 예측정보에 대한 신택스 요소, 즉, 움직임벡터 및 그 움직임벡터가 참조하는 참조픽처를 나타내는 정보를 추출한다.
한편, 복호화부(410)는 잔차신호에 대한 정보로서 현재블록의 양자화된 변환계수들에 대한 정보를 추출한다.
역양자화부(420)는 양자화된 변환계수들을 역양자화하고, 역변환부(430)는 역양자화된 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환하여 잔차신호들을 복원함으로써 현재블록에 대한 잔차블록을 생성한다.
또한, 역변환부(430)는 변환블록의 일부 영역(서브블록)만 역변환하는 경우, 변환블록의 서브블록만을 변환하였음을 지시하는 플래그(cu_sbt_flag), 서브블록의 방향성(vertical/horizontal) 정보(cu_sbt_horizontal_flag) 및/또는 서브블록의 위치 정보(cu_sbt_pos_flag)를 추출하여, 해당 서브블록의 변환계수들을 주파수 도메인으로부터 공간 도메인으로 역변환함으로써 잔차신호들을 복원하고, 역변환되지 않은 영역에 대해서는 잔차신호로 "0" 값을 채움으로써 현재블록에 대한 최종 잔차블록을 생성한다.
예측부(440)는 인트라 예측부(442) 및 인터 예측부(444)를 포함할 수 있다. 인트라 예측부(442)는 현재블록의 예측 타입이 인트라 예측일 때 활성화되고, 인터 예측부(444)는 현재블록의 예측 타입이 인터 예측일 때 활성화된다.
인트라 예측부(442)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소로부터 복수의 인트라 예측 모드 중 현재블록의 인트라 예측 모드를 결정하고, 인트라 예측 모드에 따라 현재블록 주변의 참조 픽셀들을 이용하여 현재블록을 예측한다.
인터 예측부(444)는 복호화부(410)로부터 추출된 인트라 예측 모드에 대한 신택스 요소를 이용하여 현재블록의 움직임벡터와 그 움직임벡터가 참조하는 참조픽처를 결정하고, 움직임벡터와 참조픽처를 이용하여 현재블록을 예측한다.
가산기(450)는 역변환부로부터 출력되는 잔차블록과 인터 예측부 또는 인트라 예측부로부터 출력되는 예측블록을 가산하여 현재블록을 복원한다. 복원된 현재블록 내의 픽셀들은 이후에 복호화할 블록을 인트라 예측할 때의 참조픽셀로서 활용된다.
필터부(460)는 디블록킹 필터(462) 및 SAO 필터(464)를 포함할 수 있다. 디블록킹 필터(462)는 블록 단위의 복호화로 인해 발생하는 블록킹 현상(blocking artifact)를 제거하기 위해, 복원된 블록 간의 경계를 디블록킹 필터링한다. SAO 필터(464)는 손실 부호화(lossy coding)으로 인해 발생하는 복원된 픽셀과 원본 픽셀 간의 차이를 보상하기 위해, 디블록킹 필터링 이후의 복원된 블록에 대해 추가적인 필터링을 수행한다. 디블록킹 필터(462) 및 SAO 필터(464)를 통해 필터링된 복원블록은 메모리(470)에 저장된다. 한 픽처 내의 모든 블록들이 복원되면, 복원된 픽처는 이후에 부호화하고자 하는 픽처 내의 블록을 인터 예측하기 위한 참조 픽처로 사용된다.
인터 예측 방법은 크게 skip 모드(스킵 모드), merge 모드(머지 모드) 및 AMVP(adaptive (or advanced) motion vector predictor) 모드로 구분될 수 있다.
스킵 모드에서는 현재블록의 주변에 위치한 주변블록들의 움직임정보 후보들 중 어느 하나의 움직임정보가 영상 부호화 장치로부터 영상 복호화 장치로 시그널링된다. 머지 모드에서는 주변블록의 움직임정보 후보들 중 어느 하나의 움직임정보와 예측 후 잔차(residual)를 부호화한 정보가 시그널링된다. AMVP 모드에서는 현재블록의 움직임정보와, 예측 후 잔차를 부호화한 정보가 시그널링된다.
스킵 모드 및 머지 모드에서 시그널링되는 움직임정보는 움직임정보 후보들 중 어느 하나(후보 리스트에 포함된 움직임정보 후보들 중 어느 하나)를 지시하는 인덱스(머지 인덱스) 값으로 표현된다. AMVP 모드에서 시그널링되는 움직임정보는 주변블록의 움직임정보와 현재블록의 움직임정보 사이의 차이 값(mvd, motion vector difference)으로 표현된다.
스킵 모드와 머지 모드를 구별하는 플래그들(cu_skip_flag, merge_flag) 각각이 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되며, 이 플래그들의 값에 따라 머지 인덱스(merge_idx)가 영상 복호화 장치로 시그널링된다. 후보 리스트를 구성하는 방법이나 머지 인덱스를 시그널링하는 방법은 스킵 모드와 머지 모드에서 동일하게 수행될 수 있다. AMVP 모드의 경우, 예측 방향 정보(inter_pred_idc), 참조픽처 인덱스(ref_idx_l0, ref_idx_l1), 현재블록의 예측에 이용될 움직임정보 후보를 지시하는 정보(mvp_l0_flag, mvp_l1_flag) 및 mvd가 시그널링될 수 있다. 이 경우, 예측 방향의 개수에 따라 시그널링되는 mvd의 개수가 결정된다. 예를 들어, 단방향 예측인 경우에는 1개의 mvd가 시그널링되며, 양방향 예측인 경우에는 2개의 mvd가 시그널링된다.
스킵 모드인 경우에 현재블록의 크기는 2Nx2N인 반면, 머지 모드인 경우에 현재블록의 크기는 2Nx2N 뿐만 아니라 2NxN, Nx2N, asymmetric partition일 수 있다. 현재블록이 2Nx2N의 크기를 가지면서 all zero 변환 계수를 가지는 경우에 현재블록은 스킵 모드로 분류된다. AMVP 모드인 경우에 현재블록의 크기는 2Nx2N, 2NxN, Nx2N, asymmetric partition일 수 있다.
스킵 모드, 머지 모드 및 AMVP 모드에서, 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되는 정보들을 표현하면 표 1 내지 표 3과 같다.
Figure pat00001
Figure pat00002
Figure pat00003
스킵 모드와 머지 모드를 위한 후보 리스트에는 최대 4개의 공간적 후보들(spatial candidates), 최대 1개의 시간적 후보(temporal candidate), 조합된 양방향 후보들(combined bi-directional candidates) 및, 제로 움직임벡터 후보(zero motion vector candidate)가 포함될 수 있다. 영상 부호화/복호화 장치는 공간적 후보들 → 시간적 후보 → 조합된 양방향 후보들 → 제로 움직임벡터 후보 순으로 후보 리스트를 구성할 수 있다.
공간적 후보들과 시간적 후보를 위한 후보 블록들의 위치가 도 5에 나타나 있다. 도 5 (a)는 현재 예측블록(current PU)에 이웃하는 공간적 후보블록들의 위치를 나타내며, 도 5 (b)는 co-located 예측블록(co-located PU)을 기준으로 한 시간적 후보블록들의 위치를 나타낸다.
영상 부호화/복호화 장치는 A1 → B1 → B0 → A0 → B2 순으로 공간적 후보블록들을 탐색하여 최대 4개의 공간적 후보들을 설정할 수 있다. 또한, 영상 부호화/복호화 장치는 H → C 순으로 시간적 후보블록들을 탐색하여 최대 1개의 시간적 후보를 설정할 수 있다. 후보를 설정하는 과정 중에, 후보 리스트에 동일한 움직임정보를 가지는 후보가 이미 포함되어 있는 경우, 해당 후보의 움직임정보는 후보 리스트에 포함되지 않는다. 즉, 데이터(후보)의 중복은 허용되지 않는다.
이상에서 설명된 스킵 모드, 머지 모드 및 AMVP 모드에서는 하나의 움직임벡터만으로 현재블록의 움직임을 표현하므로, 병진(translation) 움직임만을 표현할 수 있다.  따라서, 스킵 모드, 머지 모드 및 AMVP 모드에서는 회전(rotation) 움직임, 확대/축소(scaling) 움직임 등과 같은 다양하고 복잡한 움직임을 처리할 수 없다.
이러한 한계를 극복하기 위하여, 본 발명에서는 2개 이상의 움직임벡터를 통해 현재블록의 움직임을 표현하는 어파인 예측(affine model based motion compensation) 방법 또는 어파인 모드를 제안한다.
어파인 모드는 어파인 스킵 모드(affine_skip), 어파인 머지 모드(affine_merge) 및 어파인 AMVP 모드(affine_amvp)로 구분될 수 있다. 어파인 모드에서 이용되는 움직임벡터들은 컨트롤 포인트 움직임벡터(control point mv, CPMV)로 지칭될 수 있으며, 컨트롤 포인트(CP)는 어파인 모드를 위한 현재블록의 특정 위치들을 의미할 수 있다.
어파인 모드는 CPMV의 개수에 따라 2개의 모델로 구분될 수 있다. 어파인 모델들 중 첫 번째는 2개의 CPMVs(x, y)를 이용하는 4-파라미터 모델이고(도 6 (a)), 두 번째는 3개의 CPMVs(x, y)를 이용하는 6-파라미터 모델이다(도 6 (b)). 도 6에서, CP0는 현재블록에 첫 번째로 설정된(할당된 숫자 기준으로 0-번째) CP를 나타내며, CP1은 두 번째로 설정된 (할당된 숫자 기준으로 1-번째) CP를 나타내고, CP2는 세 번째로 설정된 (할당된 숫자 기준으로 2-번째) CP를 나타낸다. vi는 i번째 CPi에 설정된 CPMVi를 나타낸다.
어파인 모드는 1) 어파인 스킵 모드/어파인 머지 모드/어파인 AMVP 모드에 따라, CPMVs를 유도하는 단계, 2) 유도된 CPMVs를 이용하여 현재블록에 포함된 서브블록들의 움직임벡터 어레이를 도출 또는 생성하는 단계 및, 3) 서브블록들의 움직임벡터 어레이를 이용하여 각 서브블록 별로 움직임 보상을 수행하는 단계로 진행될 수 있다.
1) 어파인 스킵 모드/어파인 머지 모드/어파인 AMVP 모드에 따라, CPMVs를 유도하는 단계
어파인 스킵 모드와 어파인 머지 모드에서는 어파인 머지 모드인지 여부를 나타내는 플래그(merge_subblock_flag)가 시그널링된다. merge_subblock_flag는 서브블록 기반 인터 예측 파라미터들이 주변블록들로부터 추론되는지 여부를 나타내는 플래그일 수 있다. merge_subblock_flag=1(on)인 경우에 후보 리스트(서브블록 기반 머지 후보 리스트 또는, 어파인 머지 후보 리스트)에 포함된 후보들 중에서 어느 하나를 특정하는 인덱스(merge_subblock_idx)가 시그널링된다. 인덱스에 의해 특정되는 후보의 CPMVs가 현재블록을 위한 CPMVs로 유도된다. 후보 리스트를 구성하는 방법은 후술하도록 한다.
이 과정에 대한 신택스 구조를 나타내면 표 4와 같다.
Figure pat00004
어파인 AMVP 모드에서는 어파인 AMVP 모드의 적용 여부를 나타내는 플래그(inter_affine_flag)가 시그널링되며, inter_affine_flag=1(on)인 경우에 어파인 모델(어파인 모델의 타입)을 나타내는 플래그(cu_affine_type_flag)가 추가적으로 시그널링된다. cu_affine_type_flag=1이면 6-파라미터 모델이고, cu_affine_type_flag=0이면 4-파라미터 모델일 수 있다.
또한, 어파인 AMVP 모드를 위한 움직임정보도 시그널링된다. 시그널링되는 움직임정보에는 예측 방향 정보(inter_pred_idc), 참조픽처 인덱스(ref_idx_l0, ref_idx_l1), mvp index(mvp_l0_flag, mvp_l1_flag) 및, mvd가 포함될 수 있다. 시그널링되는 mvd의 개수는 예측 방향 및 어파인 모델에 의해 결정된다. 예를 들어, 단방향 예측이면서 어파인 모델이 4-파라미터 모델인 경우에는 2개의 mvd가 시그널링되며, 단방향이면서 어파인 모델이 6-파라미터 모델인 경우에는 3개의 mvd가 시그널링된다. 다른 예로, 양방향 예측이면서 어파인 모델이 4-파라미터 모델인 경우에는 4개의 mvd가 시그널링되며, 양방향 예측이면서 어파인 모델이 6-파라미터 모델인 경우에는 6개의 mvd가 시그널링된다. mvd가 시그널링되는 방식은 AMVP 모드와 동일하다.
이 과정에 대한 신택스 구조를 나타내면 표 5와 같다.
Figure pat00005
2) 유도된 CPMVs를 이용하여 현재블록에 포함된 서브블록들의 움직임벡터 어레이를 도출 또는 생성하는 단계
어파인 모델이 4-파라미터 모델인 경우에는 2개의 CPMVs가 유도되며, 어파인 모델이 6-파라미터 모델인 경우에는 3개의 CPMVs가 유도된다.
어파인 모델이 4-파라미터 모델인 경우, 도 7에 나타낸 바와 같이, 유도된 2개의 CPMVs(v0, v-1)을 이용하여 현재블록(current CU)에 포함된 서브블록들 각각의 움직임벡터가 유도될 수 있다. 이 과정은 수학식 1을 통해 수행될 수 있다.
Figure pat00006
수학식 1에서, (mvx, mvy)는 서브블록들 각각의 움직임벡터를 나타내며, (mv0x, mv0y)은 CPMV0을 나타내고, (mv1x, mv1y)은 CPMV1을 나타내며, (x, y)는 서브블록들 각각의 최좌상측에 위치한 샘플의 위치를 나타내고, W는 현재블록의 너비를 나타내며, H는 현재블록의 높이를 나타낸다.
어파인 모델이 6-파라미터 모델인 경우, 유도된 3개의 CPMVs을 이용하여 현재블록에 포함된 서브블록들 각각의 움직임벡터가 유도될 수 있다. 이 과정은 수학식 2를 통해 수행될 수 있다.
Figure pat00007
수학식 2에서, (mv2x, mv2y)는 CPMV2을 나타낸다.
3) 서브블록들의 움직임벡터 어레이를 이용하여 각 서브블록 별로 움직임 보상을 수행하는 단계
서브블록들 각각의 움직임벡터를 이용하여 서브블록들 별로 움직임 보상을 수행함으로써, 현재블록이 예측될 수 있다. 예측 방향이 양방향인 경우에는(inter_pred_idc = bi), 양방향 예측 값들 각각을 대상으로 양방향 예측 가중치를 적용하여 최종 예측 값이 생성될 수 있다.
양방향 예측 가중치를 이용하여 최종 예측 값을 생성하는 과정은 수학식 3을 통해 수행될 수 있다.
Figure pat00008
수학식 3에서, Pbi-pred는 최종 예측 값을 나타내고, P0-는 list 0 방향의 예측 값을 나타내며, P1은 list 1 방향의 예측 값을 나타내고, w는 양방향 예측 가중치를 나타낸다.
양방향 예측 가중치는 양방향 예측 가중치 인덱스(bcw_idx)에 의해 지시되는 값으로 설정된다. bcw_idx와 그에 따른 양방향 예측 가중치가 표 6에 나타나 있다.
Figure pat00009
bcw_idx는 어파인 AMVP 모드인 경우에 영상 부호화 장치로부터 영상 복호화 장치로 시그널링되며, 어파인 머지 모드(어파인 스킵 모드 포함)인 경우에는 merge_subblock_idx가 지시하는 후보의 움직임정보로부터 유도될 수 있다.
4) 후보 리스트를 구성하는 과정
어파인 머지 모드(어파인 스킵 모드 포함)를 위한 후보 리스트(서브블록 기반 머지 후보 리스트 또는, 어파인 머지 후보 리스트)에는 ⅰ) 서브블록 시간적 후보(sub-block temporal mvp, SBTMVP), ⅱ) inherited 후보들, ⅲ) constructed 후보들 및, ⅳ) 제로 움직임 벡터 후보들이 포함될 수 있다.
후보 리스트에 현재 포함되어 있는 후보들의 개수가 후보 리스트에 포함될 수 있는 후보들의 최대 개수 미만인 경우에, inherited 후보들이 후보 리스트에 포함될 수 있다. constructed 후보들도 후보 리스트에 현재 포함되어 있는 후보들의 개수가 후보 리스트에 포함될 수 있는 후보들의 최대 개수 미만인 경우에, 후보 리스트에 포함될 수 있다.
inherited 후보들이란, 어파인 모드로 예측된 주변블록들(또는, 어파인 모드로 예측된 블록들의 움직임정보)을 의미할 수 있다. 영상 부호화/복호화 장치는 현재블록의 주변블록들 중에서 어파인 모드로 예측된 블록들을 inherited 후보로 하여 후보 리스트에 포함시킬 수 있다.
constructed 후보들이란, 일반 인터 모드로 예측된 블록들로부터 도출되는 후보를 의미할 수 있다. 영상 부호화/복호화 장치는 현재블록의 주변블록들 중에서 일반 인터 모드로 예측된 블록들로부터 어파인 모델을 생성하고, 생성된 어파인 모델을 constructed 후보로 하여 후보 리스트에 포함시킬 수 있다.
inherited 후보와 constructed 후보의 도출을 위한 주변블록들의 위치가 도 8에 나타나 있다.
영상 부호화/복호화 장치는 좌측 주변블록들(A0, A1)로부터 하나의 inherited 후보를 도출하며, 상측 주변블록들(B0, B1, B2)로부터 하나의 inherited 후보를 도출할 수 있다. 좌측 주변블록들이 A0 → A1 순으로 탐색되어 어파인 모드로 예측된 첫 번째 주변블록이 inherited 후보로 도출될 수 있다. 또한, 상측 주변블록들이 B0 → B1 → B2 순으로 탐색되어 어파인 모드로 예측된 첫 번째 주변블록이 inherited 후보로 도출될 수 있다. 이 경우, 도출된 inherited 후보의 움직임이 양방향인 경우, 해당 inherited 후보의 움직임정보에는 bcw_idx도 포함된다.
영상 부호화/복호화 장치는 1) 현재블록(current CU)에 설정된 CPs들 각각에 대한 MV(최대 4개의 MVs)를 유도하고, 2) 유도된 MVs를 대상으로 어파인 모델링을 적용하여 constructed 후보(어파인 모델)을 유도할 수 있다.
1) 현재블록에 설정된 CPs들 각각에 대한 MV 유도
영상 부호화/복호화 장치는 현재블록의 주변블록들을 미리 설정된 순서에 따라 탐색하여 일반 인터 모드로 예측된 주변블록의 움직임정보를 해당 CP의 MV(움직임정보)로 설정할 수 있다.
현재블록에 첫 번째로 설정된 CP0(top-left 컨트롤 포인트)의 움직임정보는 현재블록의 좌상단에 위치한 주변블록인 B2, B3 및 A2 중에서 어느 하나의 움직임정보로부터 설정되며, 현재블록에 두 번째로 설정된 CP1(top-right 컨트롤 포인트)의 움직임정보는 현재블록의 우상단에 위치한 주변블록인 B1 및 B0 중에서 어느 하나의 움직임정보로부터 설정될 수 있다. 또한, 현재블록에 세 번째로 설정된 CP2(bottom-left 컨트롤 포인트)의 움직임정보는 현재블록의 좌하단에 위치한 주변블록인 A1 및 A0 중에서 어느 하나의 움직임정보로부터 설정되며, 현재블록에 네 번째로 설정된 CP3(bottom-right 컨트롤 포인트)의 움직임정보는 현재블록의 우하단에 위치한 collocated 주변블록(시간적 주변블록)인 RB 블록의 움직임정보로부터 설정될 수 있다.
구체적으로, B2 → B3 → A2 순으로 탐색되어 일반 인터 모드로 예측된 첫 번째 주변블록의 움직임정보가 CP0의 MV(움직임정보)로 설정될 수 있으며, B1 → B0 순으로 탐색되어 일반 인터 모드로 예측된 첫 번째 주변블록의 움직임정보가 CP1의 MV로 설정될 수 있고, A1 → A0 순으로 탐색되어 일반 인터 모드로 예측된 첫 번째 주변블록의 움직임정보가 CP2의 MV로 설정될 수 있으며, 시간적 주변블록인 RB 블록의 움직임정보가 CP3의 MV로 설정될 수 있다.
영상 부호화/복호화 장치는 CPs 중에서 움직임정보가 설정된 CP를 사용 가능한 것으로 설정할 수 있다.
2) 최대 4개의 MVs를 대상으로 어파인 모델링을 적용하여 constructed 후보 유도
영상 부호화/복호화 장치는 설정된 CPs들로부터 최대 6개의 어파인 모델(4개의 6-파라미터 모델 + 2개의 4-파라미터 모델)을 유도할 수 있다. 최대 6개의 어파인 모델의 유도에 이용되는 CPs는 다음과 같다. {CP0, CP1, CP2}, {CP0, CP1, CP3}, {CP0, CP2, CP3}, {CP1, CP2, CP3}, {CP0, CP1}, {CP0, CP2}. 여기서, {CP0, CP1, CP2}, {CP0, CP1, CP3}, {CP0, CP2, CP3}, {CP1, CP2, CP3}, {CP0, CP1}, {CP0, CP2} 각각은 'CPs 그룹'으로 지칭될 수 있다.
CPs 그룹에 포함된 CPs이 모두 사용 가능하고(available), CPs의 예측 방향과 참조 픽처가 동일한 경우에, 해당 CPs 그룹의 어파인 모델이 유도 또는 생성될 수 있다. {CP0, CP1, CP2}의 어파인 모델(첫 번째 어파인 모델)은 {CP0, CP1, CP2}으로, {CP0, CP1, CP3}의 어파인 모델(두 번째 어파인 모델)은 {CP0, CP1, (CP3+CP0-CP1)}으로, {CP0, CP2, CP3}의 어파인 모들(세 번째 어파인 모델)은 {CP0, (CP3+CP0-CP2), CP2}으로, {CP1, CP2, CP3}의 어파인 모델(네 번째 어파인 모델)은 {(CP1+CP2-CP3), CP1, CP2}으로, {CP0, CP1}의 어파인 모델(다섯 번째 어파인 모델)은 {CP0, CP1}으로, {CP0, CP2}의 어파인 모델(여섯 번째 어파인 모델)은 {CP0, (CP2-CP0)}으로 각각 유도될 수 있다.
만약, 특정 CPs 그룹에 포함된 CPs 중에서 하나 이상이라도 non available하거나, 예측 방향과 참조 픽처가 서로 다른 경우에는 해당 CPs 그룹의 어파인 모델이 생성되지 않을 수 있다.
예를 들어, {CP0, CP1, CP2}의 모든 CPs가 available하면서, 예측 방향이 모두 양방향이고, 참조픽처가 list 0은 1-th 인덱스이며, list 1은 0-th 인덱스라면, 해당 어파인 모델은 {CP0, CP1, CP2}으로 아래와 같이 생성될 수 있다.
cu_affine_type_flag: 6-parameter, inter_pred_idc: bi, ref_idx_l0: 1-th idx, ref_idx_l1: 0-th idx, CPMV0: CP0, CPMV1: CP1, CPMV2: CP2, bcw_idx: 미정.
이 경우, CP0, CP1 및 CP2 각각의 bcw_idx는 서로 다를 수 있으므로, 해당 어파인 모델(counstructed 후보)을 위한 하나의 bcw_idx를 유도하는 과정이 필요하다.
본 발명은 후보 리스트(어파인 머지 후보 리스트)에 포함되는 counstructed 후보를 위한 bcw_idx를 유도하는 방법을 제안한다.
본 개시의 기술들을 구현할 수 있는 예측부(120, 440)의 예시적인 블록도가 도 9에 나타나 있다. 예측부(120, 440)는 설정부(905), 판단부(910), 확인부(920) 및 유도부(930)를 포함하여 구성될 수 있으며, 유도부(930)는 그룹 판단부(932) 및 인덱스 유도부(934)를 포함하여 구성될 수 있다.
설정부(905)는 현재블록의 주변블록들의 움직임정보 중에서 사용 가능한 움직임정보를 이용하여 CPs의 움직임정보를 설정할 수 있다. 또한, 설정부(905)는 움직임정보가 설정된 CPs를 사용 가능한 것으로 설정할 수 있다.
판단부(910)는 현재블록에 설정된 CPs 중에서 복수 개의 CPs(대상 컨트롤 포인트들)에 대한 사용 가능성 여부를 판단할 수 있다(S1010). 여기서, 대상 CPs는 최대 6개의 CPs 그룹들 중에서 어느 하나에 포함된 CPs에 해당할 수 있다.
확인부(920)는 대상 CPs가 모두 사용 가능한 경우에 대상 CPs들의 예측 방향과 참조픽처를 확인할 수 있다(S1020). 즉, 확인부(920)는 대상 CPs의 예측 방향이 모두 양방향이고 참조픽처가 모두 동일한지 여부를 확인 또는 판단할 수 있다.
S1010 과정과 S1020 과정은 앞서 설명된 어파인 모델의 생성 조건(모든 CPs가 사용 가능하며, 예측 방향이 동일하고, 참조픽처가 동일할 것)을 판단하는 과정으로 이해될 수 있다.
유도부(930)는 대상 CPs이 모두 사용 가능하며 예측 방향이 동일하고 참조픽처가 동일한 경우에(해당 어파인 모델이 생성되는 경우에), 대상 CPs 각각의 양방향 예측 가중치 인덱스(양방향 예측 가중치 인덱스 후보, bcw_idxX)들로부터 해당 constructed 후보의 bcw_idx(이하, 'bcw_idx')를 유도할 수 있다(S1030).
실시예 1
실시예 1은 대상 CPs이 현재블록에 설정된 순서를 기준으로, constructed 후보의 bcw_idx(bcw_idx)로 유도하는 방법이다.
bcw_idxX는 어파인 모델에 포함되는 대상 CPs 각각의 양방향 예측 가중치 인덱스 후보들을 나타낼 수 있다. 어파인 모델이 6-파라미터 모델인 {CPa, CPb, CPc}인 경우, bcw_idxX는 bcw_idxa, bcw_idxb 및 bcw_idxc일 수 있다. 어파인 모델이 4-파라미터 모델인 {CPa, CPb}인 경우, bcw_idxX는 bcw_idxa 및 bcw_idxb일 수 있다.
영상 부호화/복호화 장치는 CPs 각각이 설정된 순서에 따라 bcw_idxX를 설정할 수 있다(S1110). 도 11에는 4-파라미터 어파인 모델인 {CP0, CP1}가 나타나 있으나, 실시예 1은 다른 4-파라미터 어파인 모델인 {CP0, CP2}뿐만 아니라, 6-파라미터 어파인 모델들에 대해서도 적용될 수 있다.
영상 부호화/복호화 장치는 대상 CPs 중에서 현재블록에 첫 번째로 설정된 CP0의 양방향 예측 가중치 인덱스 후보(bcw_idx0)를 bcw_idx로 유도할 수 있다(S1130). 달리 표현하면, 영상 부호화/복호화 장치는 bcw_idxX 중에서 첫 번째 인덱스가 할당된 bcw_idx0를 bcw_idx로 유도할 수 있다.
실시형태에 따라, 유도부(930)는 bcw_idxX들의 동일 여부를 판단하는 과정(S1120)을 더 포함하여 구성될 수 있다.
bcw_idxX들이 동일하다는 것은, CPs이 list 0 방향과 list 1 방향 중에서 같은 방향에 대해 더욱 큰 가중치를 적용하는 것을 의미할 수 있다. 따라서, bcw_idxX들의 동일 여부를 판단하는 과정(S1120)은 CPs이 더욱 큰 가중치를 적용하는 예측 방향과 bcw_idx가 더욱 큰 가중치를 적용하는 예측 방향을 일치시키는 과정일 수 있다.
bcw_idxX들이 동일한 경우에(bcw_idx0 = bcw_idx1), 대상 CPs 중에서 현재블록에 첫 번째로 설정된 CP의 양방향 예측 가중치 인덱스 후보(bcw_idx0)가 bcw_idx로 유도될 수 있다(S1130). 이와 달리, bcw_idxX들이 서로 다른 경우에(bcw_idx0 ≠ bcw_idx1), 미리 설정된 인덱스(default)가 bcw_idx로 유도될 수 있다(S1140, bcw_idx = default(0)). 여기서, 미리 설정된 인덱스는 list 0 방향과 list 1 방향에 대하여 같은 크기의 가중치를 적용하는 인덱스일 수 있다.
실시예 2
실시예 2는 CPs이 list 0 방향과 list 1 방향 중에서 어느 예측 방향에 대해 더욱 큰(또는, 더욱 작은) 가중치를 적용하는지 여부에 따라 bcw_idxX들을 그룹으로 구분하는 방법이다.
그룹들은 list 0 방향과 list 1 방향에 같은 가중치를 적용하는 그룹(group 0, G0), list 1 방향에 더욱 큰 가중치를 적용하는 그룹(group 1, G1) 및, list 0 방향에 더욱 큰 가중치를 적용하는 그룹(group 2, G2)들로 구분될 수 있다. list 0 방향과 list 1 방향에 적용되는 가중치들의 크기를 기준으로, 각각의 그룹들에 별도의 인덱스(그룹 인덱스, bcw_group)가 부여 또는 할당될 수 있다.
그룹들(bcw_group)과 각 그룹으로 구분되는 bcw_idx(bcw_idxX)를 나타내면 표 7과 같다.
Figure pat00010
실시형태에 따라 그룹들은 아래와 같이 어레이(look-up table, LUT) 형태로도 표현될 수 있다.
Figure pat00011
영상 부호화/복호화 장치는 CPs 각각이 설정된 순서에 따라 bcw_idxX를 설정할 수 있다(S1210). 또한, 영상 부호화/복호화 장치는 그룹들을 설정하고(bcw_idxGLut={0, 1, 2, 1, 2}), bcw_idxX들 각각이 속하는 그룹들(bcw_idxGX)을 설정할 수 있다(bcw_idxGX=bcw_idxGLut{bcw_idxX})(S1210).
영상 부호화/복호화 장치(그룹 판단부)는 bcw_idxGX들 각각이 속하는 그룹들이 서로 동일한지 여부를 판단할 수 있다(S1220). 또한, 영상 부호화/복호화 장치(인덱스 유도부)는 bcw_idxGX들 각각이 속하는 그룹들이 서로 동일한지 여부에 따라, bcw_idxX들, bcw_idxGX들 및 미리 설정된 인덱스(default) 중에서 어느 하나로부터 bcw_idx를 유도할 수 있다(S1230). 여기서, 미리 설정된 인덱스는 실시예 1에서 설명된 default와 동일할 수 있다.
실시예 2는 4-파라미터 어파인 모델과 6-파라미터 어파인 모델들 모두에 대해 적용될 수 있다. 다만, 이하에서는 설명과 이해의 편의를 위해 6-파라미터 어파인 모델들에 적용되는 예를 중심으로 하여 실시예 2에 대해 설명한다. 나아가, 6-파라미터 어파인 모델들 중에서도 {CP0, CP1, CP2} 어파인 모델에 적용되는 예를 중심으로 하여 실시예 2에 대해 설명하도록 한다.
실시예 2-1
실시예 2-1은 그룹들(bcw_idxG0, bcw_idxG1, bcw_idxG2)이 모두 동일한지 여부를 판단하여, bcw_idx를 유도하는 방법이다.
영상 부호화/복호화 장치는 bcw_idxX(X={0, 1, 2}), bcw_idxGLut, bcw_idxGX(X={0, 1, 2})를 설정할 수 있다(S1310).
영상 부호화/복호화 장치는 bcw_idxGX들이 모두 동일한지 여부를 판단할 수 있다(S1320). 세 개의 그룹들이 모두 동일하면(bcw_idxG0 = bcw_idxG1 = bcw_idxG2), bcw_idx0, bcw_idx1 및 bcw_idx2 중에서 둘 이상이 서로 동일할 수 있다. 이 경우, 영상 부호화/복호화 장치는 bcw_idx0, bcw_idx1 및 bcw_idx2 중에서 동일한 값을 가지는 인덱스 후보들로부터 bcw_idx를 유도할 수 있다.
예를 들어, 영상 부호화/복호화 장치는 bcw_idx0, bcw_idx1 및 bcw_idx2 중에서 어느 두 개가 동일한지 여부를 판단할 수 있다(S1330 내지 S1350). bcw_idx0 = bcw_idx1인 경우(S1330), bcw_idx0가 bcw_idx로 유도될 수 있다(S1360). bcw_idx0 = bcw_idx2인 경우(S1340), bcw_idx0가 bcw_idx로 유도될 수 있다(S1360). bcw_idx1 = bcw_idx2인 경우(S1350), bcw_idx1이 bcw_idx로 유도될 수 있다(S1370). S1330 과정 내지 S1370 과정은 서로 동일한 값을 가지는 인덱스 후보들 중에서, 현재블록에 첫 번째로 설정된 CP의 인덱스 후보를 bcw_idx로 유도하는 과정일 수 있다.
S1320 과정에서, bcw_idxGX들 중 하나 이상이 다른 값을 가지는 경우, 미리 설정된 인덱스(default(0))가 bcw_idx로 유도될 수 있다(S1380).
S1320 과정 및 S1330 과정을 거쳐 bcw_idx0가 bcw_idx로 유도되는 과정은(S1360), bcw_idx0 = bcw_idx1이면서 bcw_idx_G0 = bcw_idxG2인 경우에 bcw_idx0가 bcw_idx로 유도되는 과정일 수 있다. S1320 과정 및 S1340 과정을 거쳐 bcw_idx0가 bcw_idx로 유도되는 과정은(S1360)은, bcw_idx0 = bcw_idx2이면서 bcw_idx_G0 = bcw_idxG1인 경우에 bcw_idx0이 bcw_idx로 유도되는 과정일 수 있다. S1320 과정 및 S1350 과정을 거쳐 bcw_idx1이 bcw_idx로 유도되는 과정은(S1370)은, bcw_idx1 = bcw_idx2이면서 bcw_idx_G1 = bcw_idxG0인 경우에 bcw_idx1이 bcw_idx로 유도되는 과정일 수 있다.
다양한 어파인 모델들을 대상으로 실시예 2-1을 적용하면 아래와 같다.
Figure pat00012
어파인 모델이 표 8과 같은 경우, bcw_idxG0 = bcw_idxG1 = bcw_idxG2 = 2이고, bcw_idx0 = bcw_idx1 = 4이다. 따라서, bcw_idx = bcw_idx0 = 4(L0:L1 = 10/8:-2/8)로 유도될 수 있다.
Figure pat00013
어파인 모델이 표 9와 같은 경우, bcw_idxG0 = bcw_idxG1 = bcw_idxG2 = 2이고, bcw_idx1 = bcw_idx2 = 2이다. 따라서, bcw_idx = bcw_idx0 = 2(L0:L1 = 5/8:3/8)로 유도될 수 있다.
Figure pat00014
어파인 모델이 표 10과 같은 경우, bcw_idxG0 = bcw_idxG1 ≠ bcw_idxG2이므로, bcw_idx = default = 0(L0:L1 = 4/8:4/8)으로 유도될 수 있다.
Figure pat00015
어파인 모델이 표 11과 같은 경우, bcw_idxG0 ≠ bcw_idxG1 = bcw_idxG2이므로, bcw_idx = default = 0(L0:L1 = 4/8:4/8)으로 유도될 수 있다.
실시예 2-2
실시예 2-2는 그룹들(bcw_idxG0, bcw_idxG1, bcw_idxG2) 중 어느 하나가 제로 그룹인 경우에 해당 그룹을 제외하고, 나머지 그룹들이 모두 동일한지 여부를 판단하여 bcw_idx를 유도하는 방법이다. 제로 그룹이란 양방향 예측에 대해 동일한 가중치를 적용하는 그룹일 수 있다.
영상 부호화/복호화 장치는 bcw_idxX(X={0, 1, 2}), bcw_idxGLut, bcw_idxGX(X={0, 1, 2})를 설정할 수 있다(S1410).
영상 부호화/복호화 장치는 bcw_idxGX들이 동일한지 여부와, bcw_idxGX들 중에서 어느 하나의 그룹이 제로 그룹에 해당하는지 여부를 판단할 수 있다(S1420). 영상 부호화/복호화 장치는 S1420 과정에서의 판단 결과에 따라, 동일한 bcw_idxGX들 또는 미리 설정된 인덱스로부터 bcw_idx를 유도할 수 있다.
예를 들어, S1420 과정에서, bcw_idxGX들 중에서 어느 두 개의 그룹이 동일하고(bcw_idxG0 = bcw_idxG1) 나머지 하나의 그룹이 제로 그룹인 경우(bcw_idxG2 = 0), 동일한 그룹들(bcw_idxG0 = bcw_idxG1) 각각에 부여된 그룹 인덱스들 중에서(bcw_idxG0 및 bcw_idxG1 중에서), 첫 번째 그룹 인덱스(bcw_idxG0)가 bcw_idx로 유도될 수 있다(S1450).
다른 예로, S1430 과정에서, bcw_idxG0 = bcw_idxG2이며, bcw_idxG1 = 0인 경우, 첫 번째 그룹 인덱스(bcw_idxG0)가 bcw_idx로 유도될 수 있다(S1450). 또 다른 예로, S1440 과정에서, bcw_idxG1 = bcw_idxG2이며, bcw_idxG0 = 0인 경우, 첫 번째 그룹 인덱스(bcw_idxG1)가 bcw_idx로 유도될 수 있다(S1460).
만약, bcw_idxGX들이 모두 다르거나, bcw_idxGX들 중에서 제로 그룹이 존재하지 않는 경우, 미리 설정된 인덱스(default(0))가 bcw_idx로 유도될 수 있다(S1470).
표 8 내지 표 11의 다양한 어파인 모델들을 대상으로 실시예 2-2를 적용하면, 실시예 2-1에서의 결과와 동일한 결과가 유도될 수 있다. 다만, 표 10에 나타낸 어파인 모델의 경우, bcw_idxG0 = bcw_idxG1 = 2이며, bcw_idxG2 = 0이므로, bcw_idx = bcw_idxG0 = 2(L0:L1 = 5/8:3/8)으로 유도될 수 있다.
실시예 3
실시예 3은 bcw_idxX들이 지시하는 가중치들의 중앙 값(중위수, median) 또는 bcw_idxX들이 지시하는 가중치들의 평균 값으로부터 bcw_idx를 유도하는 방법이다.
영상 부호화/복호화 장치는 bcw_idxX들이 지시하는 가중치들의 중앙 값을 판단하고, 중앙 값에 해당하는 bcw_idxX를 bcw_idx로 유도할 수 있다. 또한, 영상 부호화/복호화 장치는 bcw_idxX들이 지시하는 가중치들의 평균 값을 판단하고, 평균 값에 해당하는 bcw_idxX를 bcw_idx로 유도할 수 있다. 만약, 평균 값 가중치에 해당하는 bcw_idxX가 존재하지 않는 경우에는, 해당 평균 값과 가장 근접한 가중치를 가지는 bcw_idxX가 bcw_idx로 유도될 수 있다.
표 8 내지 표 11의 다양한 어파인 모델들을 대상으로 실시예 3(중앙 값 이용)을 적용하면 아래와 같다.
어파인 모델이 표 8과 같은 경우, bcw_idxX들이 지시하는 가중치들의 중앙 값은 10/8:-2/8이므로, 해당 중앙 값을 가지는 bcw_idxX는 bcw_idx0와 bcw_idx1이다. 따라서, bcw_idx = bcw_idx0/bcw_idx1 = 4로 유도될 수 있다.
어파인 모델이 표 9와 같은 경우, bcw_idxX들이 지시하는 가중치들의 중앙 값은 5/8:3/8이므로, 해당 중앙 값을 가지는 bcw_idxX는 bcw_idx1과 bcw_idx2이다. 따라서, bcw_idx = bcw_idx1/bcw_idx2 = 2로 유도될 수 있다.
어파인 모델이 표 10과 같은 경우, bcw_idxX들이 지시하는 가중치들의 중앙 값은 5/8:3/8이므로, 해당 중앙 값을 가지는 bcw_idxX는 bcw_idx1이다. 따라서, bcw_idx = bcw_idx1 = 2로 유도될 수 있다.
어파인 모델이 표 11과 같은 경우, bcw_idxX들이 지시하는 가중치들의 중앙 값은 5/8:3/8이므로, 해당 중앙 값을 가지는 bcw_idxX는 bcw_idx1과 bcw_idx2이다. 따라서, bcw_idx = bcw_idx1/bcw_idx2 = 2로 유도될 수 있다.
이상의 설명은 본 실시예의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 실시예들은 본 실시예의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
120, 440: 예측부 130: 감산기
170, 450: 가산기 180, 460: 필터부

Claims (12)

  1. 어파인(affine) 머지 후보 리스트에 포함되는 constructed 후보의 양방향 예측 가중치 인덱스를 유도하는 방법으로서,
    현재블록에 설정된 컨트롤 포인트들 중에서, 복수 개의 대상 컨트롤 포인트들에 대한 사용 가능성 여부를 판단하는 단계;
    상기 대상 컨트롤 포인트들이 사용 가능한 경우, 상기 대상 컨트롤 포인트들의 예측 방향과 참조 픽처를 확인하는 단계; 및
    상기 대상 컨트롤 포인트들의 예측 방향이 모두 양방향이고 상기 참조 픽처가 서로 동일한 경우, 상기 대상 컨트롤 포인트들의 양방향 예측 가중치 인덱스 후보들로부터 상기 양방향 예측 가중치 인덱스를 유도하는 단계를 포함하는, 양방향 예측 가중치 인덱스를 유도하는 방법.
  2. 제1항에 있어서,
    상기 유도하는 단계는,
    상기 대상 컨트롤 포인트들 중에서 상기 현재블록에 첫 번째로 설정된 대상 컨트롤 포인트의 인덱스 후보를 상기 양방향 예측 가중치 인덱스로 유도하는, 양방향 예측 가중치 인덱스를 유도하는 방법.
  3. 제2항에 있어서,
    상기 유도하는 단계는,
    상기 인덱스 후보들이 동일한 경우에, 상기 첫 번째로 설정된 대상 컨트롤 포인트의 인덱스 후보를 상기 양방향 예측 가중치 인덱스로 유도하는, 양방향 예측 가중치 인덱스를 유도하는 방법.
  4. 제1항에 있어서,
    상기 현재블록의 주변블록들의 움직임정보 중에서 사용 가능한 움직임정보를 이용하여 상기 현재블록에 설정된 컨트롤 포인트들의 움직임정보를 설정하는 단계; 및
    상기 움직임정보가 설정된 컨트롤 포인트들을 사용 가능한 것으로 설정하는 단계를 더 포함하는, 양방향 예측 가중치 인덱스를 유도하는 방법.
  5. 제4항에 있어서,
    상기 현재블록에 설정된 컨트롤 포인트들은,
    상기 현재블록의 좌상단에 위치한 좌상단 컨트롤 포인트, 상기 현재블록의 우상단에 위치한 우상단 컨트롤 포인트, 상기 현재블록의 좌하단에 위치한 좌하단 컨트롤 포인트 및, 상기 현재블록의 우하단에 위치한 우하단 컨트롤 포인트를 포함하는, 양방향 예측 가중치 인덱스를 유도하는 방법.
  6. 제5항에 있어서,
    상기 움직임정보를 설정하는 단계는,
    상기 현재블록의 좌상단에 위치한 주변블록들의 움직임정보 중에서 사용 가능한 첫 번째 움직임정보를 상기 좌상단 컨트롤 포인트의 움직임정보로 설정하는 단계;
    상기 현재블록의 우상단에 위치한 주변블록들의 움직임정보 중에서 사용 가능한 첫 번째 움직임정보를 상기 우상단 컨트롤 포인트의 움직임정보로 설정하는 단계;
    상기 현재블록의 좌하단에 위치한 주변블록들의 움직임정보 중에서 사용 가능한 첫 번째 움직임정보를 상기 좌하단 컨트롤 포인트의 움직임정보로 설정하는 단계; 및
    상기 현재블록의 우하단에 위치한 collocated 주변블록의 움직임정보가 사용 가능한 경우에, 해당 움직임정보를 상기 우하단 컨트롤 포인트의 움직임정보로 설정하는 단계를 포함하는, 양방향 예측 가중치 인덱스를 유도하는 방법.
  7. 현재블록에 설정된 컨트롤 포인트들 중에서, 복수 개의 대상 컨트롤 포인트들에 대한 사용 가능성 여부를 판단하는 판단부;
    상기 대상 컨트롤 포인트들이 사용 가능한 경우, 상기 대상 컨트롤 포인트들의 예측 방향과 참조 픽처를 확인하는 확인부; 및
    상기 대상 컨트롤 포인트들의 예측 방향이 모두 양방향이고 상기 참조 픽처가 서로 동일한 경우, 상기 대상 컨트롤 포인트들의 양방향 예측 가중치 인덱스 후보들로부터 어파인(affine) 머지 후보 리스트에 포함되는 constructed 후보의 양방향 예측 가중치 인덱스를 유도하는 유도부를 포함하는, 영상 복호화 장치.
  8. 제7항에 있어서,
    상기 유도부는,
    상기 대상 컨트롤 포인트들 중에서 상기 현재블록에 첫 번째로 설정된 대상 컨트롤 포인트의 인덱스 후보를 상기 양방향 예측 가중치 인덱스로 유도하는, 영상 복호화 장치.
  9. 제8항에 있어서,
    상기 유도부는,
    상기 인덱스 후보들이 동일한 경우에, 상기 첫 번째로 설정된 대상 컨트롤 포인트의 인덱스 후보를 상기 양방향 예측 가중치 인덱스로 유도하는, 영상 복호화 장치.
  10. 제7항에 있어서,
    상기 현재블록의 주변블록들의 움직임정보 중에서 사용 가능한 움직임정보를 이용하여 상기 현재블록에 설정된 컨트롤 포인트들의 움직임정보를 설정하고, 상기 움직임정보가 설정된 컨트롤 포인트들을 사용 가능한 것으로 설정하는 설정부를 더 포함하는, 영상 복호화 장치.
  11. 제10항에 있어서,
    상기 현재블록에 설정된 컨트롤 포인트들은,
    상기 현재블록의 좌상단에 위치한 좌상단 컨트롤 포인트, 상기 현재블록의 우상단에 위치한 우상단 컨트롤 포인트, 상기 현재블록의 좌하단에 위치한 좌하단 컨트롤 포인트 및, 상기 현재블록의 우하단에 위치한 우하단 컨트롤 포인트를 포함하는, 영상 복호화 장치.
  12. 제11항에 있어서,
    상기 설정부는,
    상기 현재블록의 좌상단에 위치한 주변블록들의 움직임정보 중에서 사용 가능한 첫 번째 움직임정보를 상기 좌상단 컨트롤 포인트의 움직임정보로 설정하고, 상기 현재블록의 우상단에 위치한 주변블록들의 움직임정보 중에서 사용 가능한 첫 번째 움직임정보를 상기 우상단 컨트롤 포인트의 움직임정보로 설정하며, 상기 현재블록의 좌하단에 위치한 주변블록들의 움직임정보 중에서 사용 가능한 첫 번째 움직임정보를 상기 좌하단 컨트롤 포인트의 움직임정보로 설정하고, 상기 현재블록의 우하단에 위치한 collocated 주변블록의 움직임정보가 사용 가능한 경우에, 해당 움직임정보를 상기 우하단 컨트롤 포인트의 움직임정보로 설정하는, 영상 복호화 장치.
KR1020190158986A 2019-06-28 2019-12-03 양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치 KR20210001852A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/KR2020/008386 WO2020263027A1 (ko) 2019-06-28 2020-06-26 양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치
US17/623,438 US12063352B2 (en) 2019-06-28 2020-06-26 Method for deriving bidirectional prediction weight index and video decoding apparatus
CN202080060741.2A CN114342406A (zh) 2019-06-28 2020-06-26 用于推导双向预测权重索引的方法及图像解码设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20190078381 2019-06-28
KR1020190078381 2019-06-28

Publications (1)

Publication Number Publication Date
KR20210001852A true KR20210001852A (ko) 2021-01-06

Family

ID=74128861

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190158986A KR20210001852A (ko) 2019-06-28 2019-12-03 양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치

Country Status (1)

Country Link
KR (1) KR20210001852A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024012052A1 (en) * 2022-07-15 2024-01-18 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024012052A1 (en) * 2022-07-15 2024-01-18 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Similar Documents

Publication Publication Date Title
KR101550718B1 (ko) 영상의 부호화 방법 및 장치, 및 복호화 방법 및 장치
KR101316060B1 (ko) 인터 예측 부호화된 동영상 복호화 방법
KR20210134554A (ko) 영상 부호화 또는 복호화를 위한 장치 및 방법
KR101960761B1 (ko) 모션 벡터의 예측 부호화/복호화 방법 및 장치
KR20130050403A (ko) 인터 모드에서의 복원 블록 생성 방법
KR20130050404A (ko) 인터 모드에서의 복원 블록 생성 방법
KR20210000635A (ko) 크로마블록의 블록 벡터 유도 방법 및 영상 복호화 장치
US11671584B2 (en) Inter-prediction method and video decoding apparatus using the same
KR20230133829A (ko) 현재 픽처 참조 모드를 이용한 예측 방법 및 영상 복호화 장치
US11997255B2 (en) Video encoding and decoding using intra block copy
KR20210035036A (ko) 시간적 움직임벡터 예측자 유도 방법 및 영상 복호화 장치
US20240236303A1 (en) Inter-prediction method and video decoding apparatus using the same
KR20220118351A (ko) 인트라 예측 신호와 인터 예측 신호의 가중 합을 이용한 예측 블록을 생성하는 방법 및 이를 이용한 장치
KR20210001852A (ko) 양방향 예측 가중치 인덱스를 유도하는 방법 및 영상 복호화 장치
KR20200110164A (ko) 인트라 블록 복사를 이용하는 영상 부호화 및 복호화
KR20190142717A (ko) 인터 예측 방법 및 이를 이용한 영상 복호화 장치
KR20200081207A (ko) 움직임정보 표현 방법 및 이를 이용한 영상 복호화 장치
US20220360768A1 (en) Method for deriving bidirectional prediction weight index and video decoding apparatus
KR20200081186A (ko) 시간적 후보의 움직임 벡터 유도 방법 및 이를 이용한 영상 복호화 장치
CN117461312A (zh) 一种视频编解码方法和装置
KR20210000637A (ko) 움직임정보 유도 방법 및 영상 복호화 장치
KR20200110138A (ko) 공유 후보 리스트를 이용한 움직임정보 유도 방법 및 영상 복호화 장치
KR20240084471A (ko) 기하학적 분할모드를 이용한 비디오 부호화/복호화 방법 및 장치
KR20210037506A (ko) 크로마블록의 잔차블록 복원 방법 및 영상 복호화 장치