KR20210118154A - 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측 - Google Patents

적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측 Download PDF

Info

Publication number
KR20210118154A
KR20210118154A KR1020217027064A KR20217027064A KR20210118154A KR 20210118154 A KR20210118154 A KR 20210118154A KR 1020217027064 A KR1020217027064 A KR 1020217027064A KR 20217027064 A KR20217027064 A KR 20217027064A KR 20210118154 A KR20210118154 A KR 20210118154A
Authority
KR
South Korea
Prior art keywords
region
candidate
luma
luma position
decoder
Prior art date
Application number
KR1020217027064A
Other languages
English (en)
Inventor
보리보제 퍼트
하리 칼바
벨리보르 아지치
Original Assignee
오피 솔루션즈, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오피 솔루션즈, 엘엘씨 filed Critical 오피 솔루션즈, 엘엘씨
Publication of KR20210118154A publication Critical patent/KR20210118154A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

디코더는 회로망을 포함하고, 회로망은 비트스트림을 수신하고, 기하학적 파티셔닝 모드를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하고, 제1 영역, 제2 영역 또는 제3 영역과 연관된 모션 벡터를 결정하고 - 결정하는 것은 후보 리스트를 구성하는 것을 포함함 -, 결정된 모션 벡터를 사용하여 현재 블록을 디코딩하도록 구성된다. 관련된 장치들, 시스템들, 기술들 및 물품들 또한 설명된다.

Description

적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측
관련 출원들에 대한 상호참조
본 출원은 2019년 1월 28일에 출원되고 발명의 명칭이 "INTER PREDICTION IN GEOMETRIC PARTITIONING WITH AN ADAPTIVE NUMBER OF REGIONS"인 미국 임시 특허 출원 일련 번호 제62/797,820호에 대한 우선권의 혜택을 주장하며, 이는 본원에 전체적으로 참조로 포함된다.
발명의 분야
본 발명은 일반적으로 비디오 압축 분야에 관한 것이다. 특히, 본 발명은 적응형 개수의 영역들을 갖는 기하학적 파티셔닝(geometric partitioning)에서의 인터 예측에 관한 것이다.
비디오 코덱은 디지털 비디오를 압축하거나 압축해제하는 전자 회로 또는 소프트웨어를 포함할 수 있다. 그것은 비압축된 비디오를 압축된 포맷으로 변환할 수 있거나 그 역도 또한 같다. 비디오 압축의 맥락에서, 비디오를 압축하는(및/또는 그것의 일부 기능을 수행하는) 디바이스는 전형적으로 인코더로 칭해질 수 있고, 비디오를 압축해제하는(및/또는 그것의 일부 기능을 수행하는) 디바이스는 디코더로 칭해질 수 있다.
압축된 데이터의 포맷은 표준 비디오 압축 사양에 합치할 수 있다. 압축된 비디오에는 원래 비디오 내에 존재하는 일부 정보가 결핍된다는 점에서 압축이 손실될 수 있다. 이것의 결과는 원래 비디오를 정확히 재구성하기에 불충분한 정보가 있기 때문에 압축해제된 비디오가 원래 비압축된 비디오보다 더 낮은 품질을 가질 수 있는 것을 포함할 수 있다.
비디오 품질, 비디오를 표현하기 위해 사용되는 데이터의 양(예를 들어, 비트 레이트에 의해 결정됨), 인코딩 및 디코딩 알고리즘들의 복잡성, 데이터 손실들 및 에러들에 대한 감도, 편집의 용이성, 랜덤 액세스, 엔드 투 엔드 지연(예를 들어, 레이턴시) 등 사이에 복잡한 관계들이 있을 수 있다.
양태에서, 디코더는 회로망을 포함하고, 회로망은 비트스트림을 수신하고, 기하학적 파티셔닝 모드(geometric partitioning mode)를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하고, 제1 영역, 제2 영역 및 제3 영역의 영역과 연관된 모션 벡터를 결정하고 - 결정하는 것은 후보 리스트를 구성하는 것을 추가로 포함함 -, 결정된 모션 벡터를 사용하여 현재 블록을 디코딩하도록 구성된다.
다른 양태에서, 방법은, 디코더에 의해, 비트스트림을 수신하는 단계를 포함한다. 방법은, 디코더에 의해, 기하학적 파티셔닝 모드를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하는 단계를 포함한다. 방법은, 디코더에 의해, 제1 영역, 제2 영역 및 제3 영역의 영역과 연관된 모션 벡터를 결정하는 단계 - 결정하는 단계는 후보 리스트를 구성하는 단계를 포함함 - 를 포함한다. 방법은, 디코더에 의해, 결정된 모션 벡터를 사용하여 현재 블록을 디코딩하는 단계를 포함한다.
본원에 설명되는 발명 대상의 하나 이상의 변형의 상세들은 아래의 첨부 도면들 및 설명에 제시된다. 본원에 설명되는 발명 대상의 다른 특징들 및 장점들은 설명 및 도면들로부터 분명하고, 청구항들로부터 분명할 것이다.
본 발명을 예시하기 위해, 도면들은 본 발명의 하나 이상의 실시예의 양태들을 도시한다. 그러나, 본 발명은 도면들에 도시된 정확한 배열들 및 도구들에 제한되지 않는다는 것이 이해되어야 한다.
도 1은 3개의 영역이 있는 기하학적 파티셔닝을 갖는 잔차 블록(residual block)(예를 들어, 현재 블록)의 예를 도시하는 예시이다.
도 2는 기하학적 파티셔닝에 따라 파티셔닝된 예시적인 현재 블록의 제1 영역(영역 S0)에 대한 잠재적 공간 모션 벡터 후보들의 예시적인 포지션들을 예시하는 도면이다.
도 3은 도 2가 제1 영역 S0의 상부-최좌측 루마 위치를 포함하는 루마 위치들을 나타내는 주석을 갖는 것을 예시한다.
도 4는 기하학적 파티셔닝에 따라 파티셔닝된 예시적인 현재 블록의 제2 영역 S1에 대한 잠재적 모션 벡터 후보들의 예시적인 포지션들을 예시하는 도면이다.
도 5는 도 4가 제3 영역 S2의 하부-최좌측 루마 위치 및 제2 영역 S1의 상부-최우측 루마 위치를 포함하는 루마 위치들을 나타내는 주석을 갖는 것을 예시한다.
도 6은 기하학적 파티셔닝에 따라 파티셔닝된 예시적인 현재 블록의 제3 영역(영역 S2)에 대한 잠재적 공간 모션 벡터 후보들의 예시적인 포지션들을 예시하는 도면이다.
도 7은 도 6이 제3 영역 S2의 하부-최좌측 루마 위치 및 제2 영역 S1의 상부-최우측 루마 위치를 포함하는 루마 위치들을 나타내는 주석을 갖는 것을 예시한다.
도 8은 적응형 개수의 영역들을 갖는 기하학적 파티셔닝과 함께 인터 예측을 사용하여 비디오를 인코딩할 수 있는 예시적인 비디오 인코더를 예시하는 시스템 블록도이다.
도 9는 압축 효율을 증가시키면서 인코딩 복잡성을 감소시킬 수 있는 본 발명 대상의 일부 양태들에 따라 적응형 개수의 영역들을 갖는 기하학적 파티셔닝 및 인터 예측으로 비디오를 인코딩하는 예시적인 프로세스를 예시하는 프로세스 흐름도이다.
도 10은 비디오 인코딩 및 디코딩에 대한 복잡성 및 처리 성능을 향상시킬 수 있는 적응형 개수의 영역들을 갖는 기하학적 파티셔닝 및 인터 예측을 사용하여 비트스트림을 디코딩할 수 있는 예시적인 디코더를 예시하는 시스템 블록도이다.
도 11은 비디오 인코딩 및 디코딩에 대한 복잡성 및 처리 성능을 향상시킬 수 있는 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측을 사용하여 비트스트림을 디코딩하는 예시적인 프로세스를 예시하는 프로세스 흐름도이다.
도 12는 본원에 개시된 방법론들 중 임의의 하나 이상 및 그것의 임의의 하나 이상의 부분을 구현하는 데 사용될 수 있는 컴퓨팅 시스템의 블록도이다.
도면들은 반드시 축척대로 도시된 것은 아니며, 가상 선들, 도식적 표현들 및 단편적인 뷰들에 의해 예시될 수 있다. 특정 사례들에서, 실시예들의 이해에 필요하지 않거나 다른 세부 사항들을 인지하기 어렵게 만드는 세부 사항들은 생략되었을 수 있다. 다양한 도면들에서 유사한 참조 기호들은 유사한 요소들을 나타낸다.
본 발명 대상의 일부 구현들은 적응형 개수의 영역들을 갖는 기하학적 파티셔닝 모드로 파티셔닝된 영역들에서 인터 예측을 수행하는 것을 포함하며, 여기서 직사각형 블록은 3개 이상의 비-직사각형 영역으로 분할될 수 있다. 적응형 개수의 영역들을 갖는 기하학적 파티셔닝으로 파티셔닝된 비-직사각형 블록들에서 인터 예측을 수행하면 파티셔닝이 객체 경계들을 더 밀접하게 따를 수 있게 되어, 모션 보상 예측 에러가 더 낮아지고 잔차들이 더 작아져, 압축 효율이 향상될 수 있다. 인터 예측 동안, 기하학적 파티셔닝 모드에 따라 결정된 블록들(예를 들어, 코딩 유닛들, 예측 유닛들 등)에 대해 예측된 모션 벡터들을 사용하여 모션 보상이 수행될 수 있다. 모션 벡터들은 고급 모션 벡터 예측(advanced motion vector prediction)(AMVP)을 사용하여 예측될 수도 있고/또는 병합 모드(merge mode)를 통해 예측될 수도 있으며, 여기서 모션 벡터는 모션 벡터 차이를 인코딩하지 않고 모션 벡터 후보들의 리스트로부터 선택된다.
본 발명 대상은, 예를 들어, 128x128 또는 64x64의 크기의 블록들과 같은 비교적 더 큰 블록들에 적용될 수 있다. 일부 구현들에서, 기하학적 파티셔닝은 현재 블록을 주어진 현재 블록에 대한 3개 이상의 영역과 같은 적응형 개수의 영역들로 파티셔닝하는 것을 수반할 수 있고, 각각의 영역에 대해 모션 정보가 결정될 수 있다.
모션 보상은 비디오 내의 객체들 및/또는 카메라의 모션을 설명함으로써 이전 및/또는 장래 프레임들을 고려하여 비디오 프레임 또는 그것의 일부를 예측하는 접근법을 포함할 수 있다. 모션 보상은 비디오 압축을 위한 비디오 데이터의 인코딩 및 디코딩, 예를 들어, 모션 픽처 전문가 그룹(Motion Picture Experts Group)(MPEG)-2(또한 고급 비디오 코딩(advanced video coding)(AVC)으로 지칭됨) 표준을 사용하는 인코딩 및 디코딩에 채택될 수 있다. 모션 보상은 참조 픽처를 현재 픽처로 변환하는 측면에서 픽처를 기술할 수 있다. 참조 픽처는 현재 픽처와 비교할 때 시간상 이전일 수도 있고 또는 장래로부터의 것일 수도 있다. 이미지들이 이전에 송신된 및/또는 저장된 이미지들로부터 정확히 합성될 수 있을 때, 압축 효율이 향상될 수 있다.
블록 파티셔닝은 유사한 모션의 영역들을 발견하기 위한 비디오 코딩의 방법을 지칭할 수 있다. 블록 파티셔닝의 일부 형태는 MPEG-2, H.264(또한 AVC 또는 MPEG-4 파트 10으로 지칭됨), 및 H.265(또한 고효율 비디오 코딩(High Efficiency Video Coding)(HEVC)으로 지칭됨)를 포함하는 비디오 코덱 표준들에서 발견될 수 있다. 예시적인 블록 파티셔닝 접근법들에서, 비디오 프레임의 비-중첩 블록들은 유사한 모션을 갖는 픽셀들을 포함하는 블록 파티션들을 발견하기 위해 직사각형 서브-블록들로 파티셔닝될 수 있다. 이러한 접근법은 블록 파티션의 모든 픽셀들이 유사한 모션을 가질 때 좋게 작업될 수 있다. 블록 내의 픽셀들의 모션은 이전에 코딩된 프레임들에 대해 결정될 수 있다.
모션 벡터 예측은 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서 효과적으로 구현될 수 있다. 더 상세하게는, 적응형 개수의 영역들을 갖는 기하학적 파티셔닝은 직사각형 블록이 비-직사각형일 수 있는 2개 이상의 영역으로 추가로 분할되는 비디오 인코딩 및 디코딩을 위한 기술들을 포함할 수 있다. 예를 들어, 도 1은 3개의 세그먼트 S0, S1, 및 S2가 있는 기하학적 파티셔닝을 갖는 잔차 블록(예를 들어, 현재 블록)(100)의 예를 도시하는 예시이다. 현재 블록(100)은 M개의 픽셀의 폭 및 N개의 픽셀의 높이를 가질 수 있으며, 이는 64x64 또는 128x128과 같이 MxN 픽셀들로 표시된다. 현재 블록은 2개의 라인 세그먼트(P1P2 및 P3P4)에 따라 기하학적 파티셔닝될 수 있으며, 이는 현재 블록을 3개의 영역 S0, S1 및 S2로 분할할 수 있다. S0의 픽셀들이 유사한 모션을 가질 때, 모션 벡터는 해당 영역의 모든 픽셀들의 모션을 기술할 수 있다. 아래에서 더 상세하게 설명되는 바와 같이, 각각의 모션 벡터들은 AMVP 모드 또는 병합 모드에 따라 결정될 수 있다. 모션 벡터는 영역 S0을 압축하는 데 사용될 수 있다. 유사하게, 영역 S1의 픽셀들이 유사한 모션을 가질 때, 연관된 모션 벡터는 영역 S1의 픽셀들의 모션을 기술할 수 있다. 유사하게, 영역 S2의 픽셀들이 유사한 모션을 가질 때, 연관된 모션 벡터는 영역 S2의 픽셀들의 모션을 기술할 수 있다. 이러한 기하학적 파티션은 비디오 비트스트림으로 포지션들 P1, P2, P3, P4(또는 극좌표들, 미리 정의된 템플릿들에 대한 인덱스들 또는 파티션들의 다른 특성화들을 사용하는 것과 같은 이들 포지션들의 표현들)를 인코딩함으로서 수신기(예를 들어, 디코더)에 시그널링될 수 있다.
계속해서 도 1을 참조하면, 픽셀 레벨에서의 기하학적 파티셔닝을 활용하여 비디오 데이터를 인코딩할 때, 라인 세그먼트 P1P2(또는 더 구체적으로는 지점들 P1 및 P2)가 결정될 수 있다. 픽셀 레벨에서의 기하학적 파티셔닝을 활용할 때 블록을 가장 잘 분할하는 라인 세그먼트 P1P2(또는 더 구체적으로는 지점들 P1 및 P2)를 결정하기 위해, 지점들 P1 및 P2의 가능한 조합들은 블록 폭 및 높이인 M 및 N에 따라 달라진다. 크기 MxN의 블록의 경우, (M-1)x(N-1)x3개의 가능한 파티션이 존재한다. 따라서, 올바른 파티션을 식별하는 것은 모든 가능한 파티션들에 대해 모션 추정을 평가하는 계산 비용이 많이 드는 태스크가 될 수 있으며, 이는 (예를 들어, 픽셀 레벨에서의 기하학적 파티셔닝 없이) 직사각형 파티셔닝을 사용하는 인코딩과 비교하여 비디오를 인코딩하는 데 필요한 시간 및/또는 처리 능력의 양을 증가시킬 수 있다. 가장 우수한 또는 올바른 파티션을 구성하는 것이 메트릭에 따라 결정될 수 있으며, 구현에 따라 변경될 수 있다.
일부 구현들에서, 여전히 도 1을 참조하면, 파티셔닝은 2개의 영역을 형성하는 제1 파티션이 결정될 수 있고(예를 들어, 라인 P1P2 및 연관된 영역들 결정) 그 후 해당 영역들 중 하나가 추가로 파티셔닝될 수 있다는 점에서 반복적으로 발생한다. 예를 들어, 도 1을 참조하여 설명되는 파티셔닝은 블록을 2개의 영역으로 파티셔닝하기 위해 수행될 수 있다. 해당 영역들 중 하나는 (예를 들어, 새로운 영역 S1 및 영역 S2를 형성하기 위해) 추가로 파티셔닝될 수 있다. 프로세스는 중지 기준에 도달할 때까지 블록 레벨 기하학적 파티셔닝을 계속 수행할 수 있다.
계속해서 도 1을 참조하면, 기하학적 파티셔닝된 영역들을 사용하여 인터 예측이 수행될 수 있다. 모션 보상을 위한 모션 벡터들은 AMVP 또는 병합 모드를 사용하여 도출될 수 있다. AMVP에서는, 모션 벡터 예측이 모션 벡터 후보 리스트에 대한 인덱스를 시그널링함으로써 이루어지고, 모션 벡터 차이(예를 들어, 잔차)가 인코딩되어 비트스트림에 포함된다. 병합 모드에서는, 모션 벡터 차이를 인코딩하지 않고 모션 벡터 후보들의 리스트로부터 모션 벡터가 선택됨으로써, 현재 블록이 다른 이전에 디코딩된 블록의 모션 정보를 채택할 수 있게 한다. AMVP 및 병합 모드 모두에서, 후보 리스트는 인코더 및 디코더 모두에 의해 구성될 수 있으며, 후보 리스트에 대한 인덱스는 비트스트림으로 시그널링된다.
도 2는 기하학적 파티셔닝에 따라 파티셔닝된 예시적인 현재 블록(200)의 제1 영역(영역 S0)에 대한 잠재적 공간 모션 벡터 후보들의 포지션들의 비-제한적인 예들을 예시하는 도면이다. 잠재적 공간 모션 벡터 후보들은 AMVP 모드 또는 병합 모드 동안 모션 벡터 후보 리스트를 구성하기 위해 고려될 수 있다. 현재 블록(200)은 지점들 P0, P1 사이 및 지점들 P2, P3 사이의 직선 라인들에 의해 각각 3개의 영역 S0, S1 및 S2로 파티셔닝될 수 있다. 영역 S0, 영역 S1 및 영역 S2 각각은 단방향으로 또는 양방향으로 예측될 수 있다. 예를 들어, 도 2에 예시된 제1 영역(영역 S0)에 대한 공간 후보들은 하부-좌측 후보 A0, 좌측 후보 A1, 상부-좌측 후보 B2, 상부 후보 B1 및 상부-우측 후보 B0을 포함할 수 있다.
여전히 도 2를 참조하면, 예시된 바와 같이, 일부 구현들에서, 각각의 위치 (A0, A1, B2, B1 및 B0)는 각각의 위치에서의 블록을 표현할 수 있다. 예를 들어, 상부-좌측 후보 B2는 영역 S0 바로 좌측 바로 위에 있는 위치에 상주하는 블록일 수 있으며, 예를 들어, S0의 상부-좌측 코너 루마 위치가 (0, 0)인 경우, 상부 좌측 후보 B2는 위치 (-1,-1)에 상주할 수 있다. 하부-좌측 후보 A0은 P1의 바로 좌측 위에 위치될 수 있고, 또는 예를 들어, P1의 루마 위치가 (P1x, P1y)인 경우, 하부-좌측 후보 A0은 위치 (P1x-1, P1y+1)에 상주할 수 있다. 좌측 후보 A1은 P1의 바로 좌측에 위치될 수 있으며, 예를 들어, 좌측 후보 A1은 위치 (P1x-1, P1y)에 상주할 수 있다. 상부 후보 B1은 P0 바로 위에 위치될 수 있으며, 예를 들어, P0의 루마 위치가 (P0x, P0y)인 경우, 위 후보 B1은 (P0x, P0y-1)에 위치될 수 있다. 위-우측 후보 B0은 P0의 바로 위 우측에 위치될 수 있으며, 예를 들어, 위-우측 후보 B0은 위치 (P0x+1, P0y-1)에 상주할 수 있다. 본 개시내용의 전체를 검토할 때 본 기술분야의 통상의 기술자에게 명백한 바와 같이, 다른 위치들이 가능할 수 있다. 도 3은 도 2가 제1 영역 S0의 상부-최좌측 루마 위치를 포함하는 루마 위치들을 나타내는 주석을 갖는 것을 예시한다.
일부 구현들에서, 여전히 도 3을 참조하면, 영역 S0에 대한 후보 리스트를 구성할 때, 일부 잠재적 후보들은 이용 불가능한 것으로 자동으로 마킹되고 후보 리스트로부터 제거될 수 있는데, 왜냐하면 기하학적 파티셔닝이 존재하는 경우, 이러한 파티셔닝은 상이한 모션 정보를 갖는 프레임 내의 영역들(또는 객체들)을 파티셔닝하기 위해 수행될 수 있기 때문이다. 따라서, 해당 후보들과 연관된 블록들이 상이한 모션을 갖는 다른 객체를 표현할 가능성이 있다고 추론될 수 있고, 따라서 이러한 후보들은 이용 불가능한 것으로 자동으로 마킹될 수 있다(예를 들어, 추가로 고려되지 않음, 후보 리스트로부터 제거됨 등). 상기 도 2를 참조하여 예시된 예에서, 영역 S0의 경우, 하부-좌측 후보 A0가 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S0은 하부-좌측 후보 A0에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다. 유사하게, 영역 S0의 경우, 상부-우측 후보 B0이 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S0은 상부-우측 후보 B0에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다. 일부 구현들에서는, 라인 세그먼트 P0P1(또는 지점들 P0, P1)를 평가함으로써, 예를 들어, 라인 세그먼트 P0P1의 기울기를 결정하고, 라인 세그먼트를 하부-좌측 후보 A0 블록 및/또는 상부-우측 후보 B0 블록으로 연장하고, 하부-좌측 후보 A0 및/또는 상부-우측 후보 B0가 제1 영역 S0과 동일한 연장된 라인 세그먼트 측면 상에 상주하는지를 결정함으로써, 하부-좌측 후보 A0 및/또는 상부-우측 후보 B0가 모션 정보를 공유할 가능성이 있는지 여부가 결정될 수 있다.
도 4는 기하학적 파티셔닝에 따라 파티셔닝된 예시적인 현재 블록(400)의 제2 영역(영역 S1)에 대한 잠재적 공간 모션 벡터 후보들의 비-제한적인 예시적인 포지션들을 예시하는 도면이다. 잠재적 공간 모션 벡터 후보들은 AMVP 모드 또는 병합 모드 동안 모션 벡터 후보 리스트를 구성하기 위해 고려될 수 있다. 현재 블록(400)은 지점들 P0, P1 사이 및 지점들 P2, P3 사이의 직선 라인들에 의해 각각 3개의 영역 S0, S1 및 S2로 파티셔닝되었을 수 있다. 영역 S0, 영역 S1 및 영역 S2 각각은 단방향으로 또는 양방향으로 예측될 수 있다. 제2 영역(영역 S1)에 대한 공간 후보들의 비-제한적인 예들이 도 4에 예시되어 있으며, 하부-좌측 후보 A0, 좌측 후보 A1, 상부-좌측 후보 B2, 상부 후보 B1 및 상부-우측 후보 B0을 포함한다.
예시된 바와 같이, 여전히 도 4를 참조하면, 각각의 위치 (A0, A1, B2, B1 및 B0)는 각각의 위치에서의 블록을 표현할 수 있다. 예를 들어, 상부-좌측 후보 B2는 영역 S1의 상부-최좌측 위치 바로 좌측 바로 위인 루마 위치에 상주하는 블록일 수 있으며, 예를 들어, S1의 상부-좌측 코너 루마 위치가 루마 위치 좌표 (P0x+1, P0y)로 P0에 인접한 경우, 상부 좌측 후보 B2는 위치 (P0x, P0y-1)에 상주할 수 있다. 하부-좌측 후보 A0은 제3 영역(영역 S2)의 하부-최좌측 위치 바로 아래에 위치되며, 예를 들어, 제3 영역(영역 S2)의 하부-최좌측 위치가 (0, N-1)에 위치되는 경우, 하부-좌측 후보 A0은 위치 (0, N)에 상주할 수 있다. 좌측 후보 A1은 제3 영역(영역 S2)의 하부-최좌측 위치 바로 좌측에 위치될 수 있으며, 예를 들어, 좌측 후보 A1은 위치 (0, N-1)에 상주할 수 있다. 상부 후보 B1은 영역 S1의 상부-최우측 위치 바로 위에 위치될 수 있으며, 예를 들어, 영역 S1의 상부-최우측 위치가 (M-1, 0)에 위치되는 경우, B1은 위치 (M-1, -1)에 상주할 수 있다. 상부-우측 후보 B0은 영역 S1의 상부-최우측 위치 바로 위 우측에 위치될 수 있으며, 예를 들어, 상부-우측 후보 B0은 위치 (M, -1)에 상주할 수 있다. 도 5는 도 4가 제3 영역 S2의 하부-최좌측 루마 위치 및 제2 영역 S1의 상부-최우측 루마 위치를 포함하는 루마 위치들을 나타내는 주석을 갖는 것을 예시한다.
일부 구현들에서, 여전히 도 5를 참조하면, 영역 S1에 대한 후보 리스트를 구성할 때, 일부 잠재적 후보들은 이용 불가능한 것으로 자동으로 마킹되고 후보 리스트로부터 제거될 수 있는데, 왜냐하면 기하학적 파티셔닝이 존재하는 경우, 이러한 파티셔닝은 상이한 모션 정보를 갖는 프레임 내의 영역들(또는 객체들)을 파티셔닝하기 위해 수행될 수 있기 때문이다. 따라서, 해당 후보들과 연관된 블록들이 상이한 모션을 갖는 다른 객체를 표현할 가능성이 있다고 추론될 수 있고, 따라서 이러한 후보들은 이용 불가능한 것으로 자동으로 마킹될 수 있다(예를 들어, 추가로 고려되지 않음, 후보 리스트로부터 제거됨 등). 도 4를 참조하여 위에서 예시된 비-제한적인 예에서, 영역 S1의 경우, 상부-좌측 후보 B2가 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S1은 위-좌측 후보 B2에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다. 유사하게, 일부 구현들에서, 영역 S1의 경우, 좌측 후보 A1이 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S1은 제3 영역 S2일 수 있는 좌측-후보 A1에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다. 유사하게, 일부 구현들에서, 영역 S1의 경우, 아래-좌측 후보 A0이 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S1은 제3 영역 S2 아래에 있을 수 있는 하부-좌측 후보 A0에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다.
도 6은 기하학적 파티셔닝에 따라 파티셔닝된 예시적인 현재 블록(600)의 제3 영역(영역 S2)에 대한 잠재적 공간 모션 벡터 후보들의 예시적인 포지션들을 예시하는 도면이다. 잠재적 공간 모션 벡터 후보들은 AMVP 모드 또는 병합 모드 동안 모션 벡터 후보 리스트를 구성하기 위해 고려될 수 있다. 현재 블록(600)은 지점들 P0, P1 사이 및 지점들 P2, P3 사이의 직선 라인들에 의해 각각 3개의 영역 S0, S1 및 S2로 파티셔닝될 수 있다. 영역 S0, 영역 S1 및 영역 S2 각각은 단방향으로 또는 양방향으로 예측될 수 있다. 제3 영역(영역 S2)에 대한 공간 후보들의 비-제한적인 예들이 도 6에 예시되어 있으며, 하부-좌측 후보 A0, 좌측 후보 A1, 상부-좌측 후보 B2, 상부 후보 B1 및 상부-우측 후보 B0을 포함할 수 있다.
예시된 바와 같이, 여전히 도 6을 참조하면, 각각의 위치 (A0, A1, B2, B1 및 B0)는 각각의 위치에서의 블록을 표현할 수 있다. 예를 들어, 상부-좌측 후보는 영역 S2의 위 좌측에 있는 루마 위치에 상주하는 블록일 수 있으며, 예를 들어, 상부-좌측 후보 B2는 제1 영역 S0일 수 있다. S0가 (0,0)에 위치되는 경우, 상부-좌측 후보 B2가 (0,0)에 위치될 수 있다. 하부-좌측 후보 A0은 영역 S2의 하부-최좌측 위치 바로 좌측 바로 아래에 위치될 수 있으며, 예를 들어, 영역 S2의 하부-최좌측 위치가 (0, N-1)에 위치되는 경우, 하부-좌측 후보 A0은 (-1, N)에 상주할 수 있다. 좌측 후보 A1은 영역 S2의 하부-최좌측 위치 바로 좌측에 위치될 수 있으며, 예를 들어, 좌측 후보 A1은 (-1, N-1)에 상주할 수 있다. 상부 후보 B1은 인접 지점 P1일 수 있는 영역 S2의 위 좌측에 위치될 수 있으며, 예를 들어, P1이 (P1x, P1y)에 위치되는 경우, 상부 후보 B1은 (P1x-1, P1y)에 위치될 수 있다. 상부-우측 후보 B0은 영역 S2의 위 우측에 있는 루마 위치에 상주하는 블록일 수 있으며, 예를 들어, 상부-우측 후보 B0은 제2 영역 S1일 수 있다. 예를 들어, 상부-우측 후보는 S1의 상부-최우측 위치에 위치될 수 있으며, 이는 (M-1, 0)에 상주할 수 있다. 도 7은 도 6이 제3 영역 S2의 하부-최좌측 루마 위치 및 제2 영역 S1의 상부-최우측 루마 위치를 포함하는 루마 위치들을 나타내는 주석을 갖는 것을 예시한다.
일부 구현들에서, 여전히 도 7을 참조하면, 영역 S2에 대한 후보 리스트를 구성할 때, 일부 잠재적 후보들은 이용 불가능한 것으로 자동으로 마킹되고 후보 리스트로부터 제거될 수 있는데, 왜냐하면 기하학적 파티셔닝이 존재하는 경우, 이러한 파티셔닝은 상이한 모션 정보를 갖는 프레임 내의 영역들(또는 객체들)을 파티셔닝하기 위해 수행될 수 있기 때문이다. 따라서, 해당 후보들과 연관된 블록들이 상이한 모션을 갖는 다른 객체를 표현할 가능성이 있다고 추론될 수 있고, 따라서 이러한 후보들은 이용 불가능한 것으로 자동으로 마킹될 수 있다(예를 들어, 추가로 고려되지 않음, 후보 리스트로부터 제거됨 등). 도 6에서 위에서 제공된 비-제한적인 예에서, 영역 S2의 경우, 상부-좌측 후보 B2가 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S2는 위-좌측 후보 B2(예를 들어, S0)에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다. 유사하게, 일부 구현들에서, 영역 S2의 경우, 상부-우측 후보 A0이 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S2는 제2 영역 S1일 수 있는 좌측-후보 B0에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다. 유사하게, 일부 구현들에서, 영역 S2의 경우, 위 후보 B1이 이용 불가능한 것으로 자동으로 마킹될 수 있는데, 왜냐하면 영역 S2는 제1 영역 S0 좌측에 있는 상부 후보 B1에 위치된 블록과 모션 정보를 공유하지 않을 가능성이 있기 때문이다.
도 8은 적응형 개수의 영역들을 갖는 기하학적 파티셔닝과 함께 인터 예측을 사용하여 비디오를 인코딩할 수 있는 예시적인 비디오 인코더(800)를 예시하는 시스템 블록도이다. 예시적인 비디오 인코더(800)는 입력 비디오(805)를 수신하며, 이는 트리-구조 매크로 블록 파티셔닝 스킴(tree-structured macro block partitioning scheme)(예를 들어, 쿼드 트리 + 이진 트리(quad-tree plus binary tree))과 같은 처리 스킴에 따라 초기에 세그먼트화되거나 분할될 수 있다. 트리-구조 매크로 블록 파티셔닝 스킴의 예는 픽처 프레임을 코딩 트리 유닛들(coding tree units)(CTU)로 칭해지는 큰 블록 요소들로 파티셔닝하는 것을 포함할 수 있다. 일부 구현들에서, 각각의 CTU는 코딩 유닛들(coding units)(CU)로 칭해지는 다수의 서브-블록들로 일회 이상 추가로 파티셔닝될 수 있다. 이러한 파티셔닝의 최종 결과는 예측 유닛들(predictive units)(PU)로 칭해질 수 있는 서브-블록들의 그룹을 포함할 수 있다. 변환 유닛들(transform units)(TU)이 또한 활용될 수 있다. 그러한 파티셔닝 스킴은 본 발명 대상의 일부 양태들에 따른 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 수행하는 것을 포함할 수 있다.
여전히 도 8을 참조하면, 예시적인 비디오 인코더(800)는 인트라 예측 프로세서(815), AMVP 모드 및 병합 모드를 포함하여 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 지원 가능할 수 있는 모션 추정/보상 프로세서(820)(또한 인터 예측 프로세서로 지칭됨), 변환/양자화 프로세서(825), 역 양자화/역 변환 프로세서(830), 인-루프 필터(835), 디코딩된 픽처 버퍼(840), 및 엔트로피 코딩 프로세서(845)를 포함할 수 있다. 일부 구현들에서, 모션 추정/보상 프로세서(820)는 AMVP 모드 및 병합 모드의 사용을 포함하여 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 수행할 수 있다. 기하학적 파티셔닝 모드들, AMVP 모드 및 병합 모드를 시그널링하는 비트스트림 파라미터들은 출력 비트스트림(850)에서의 포함을 위해 엔트로피 코딩 프로세서(845)에 입력될 수 있다.
동작에서, 여전히 도 8을 참조하면, 입력 비디오(805)의 프레임의 각각의 블록에 대해, 인트라 픽처 예측을 통해 블록을 처리할 것인지 또는 모션 추정/보상을 사용하여 블록을 처리할 것인지가 결정될 수 있다. 블록은 인트라 예측 프로세서(810) 또는 모션 추정/보상 프로세서(820)에 제공될 수 있다. 블록이 인트라 예측을 통해 처리되는 경우, 인트라 예측 프로세서(810)는 예측자(predictor)를 출력하기 위한 처리를 수행할 수 있다. 블록이 모션 추정/보상을 통해 처리되는 경우, 모션 추정/보상 프로세서(820)는 예측자를 출력하기 위해 AMVP 모드 및 병합 모드와 함께 기하학적 파티셔닝의 사용을 포함하는 처리를 수행할 수 있다.
계속해서 도 8을 참조하면, 입력 비디오로부터 예측자를 차감함으로써 잔차가 형성될 수 있다. 잔차는 변환/양자화 프로세서(825)에 의해 수신될 수 있으며, 이는 양자화될 수 있는 계수들을 생성하기 위해 변환 처리(예를 들어, 이산 코사인 변환(discrete cosine transform)(DCT))를 수행할 수 있다. 양자화된 계수들 및 임의의 연관된 시그널링 정보는 엔트로피 인코딩 및 출력 비트스트림(850)에서의 포함을 위해 엔트로피 코딩 프로세서(845)에 제공될 수 있다. 엔트로피 인코딩 프로세서(845)는 기하학적 파티셔닝 모드들, AMVP 모드 및 병합 모드와 관련된 시그널링 정보의 인코딩을 지원할 수 있다. 또한, 양자화된 계수들은 역 양자화/역 변환 프로세서(830)에 제공될 수 있으며, 이는 예측자와 조합되고 인 루프 필터(835)에 의해 처리될 수 있는 픽셀들을 재생할 수 있고, 그것의 출력은 기하학적 파티셔닝 모드들, AMVP 모드 및 병합 모드를 지원할 수 있는 모션 추정/보상 프로세서(820)에 의한 사용을 위해 디코딩된 픽처 버퍼(840)에 저장될 수 있다.
도 9는 압축 효율을 증가시키면서 인코딩 복잡성을 감소시킬 수 있는 본 발명 대상의 일부 양태들에 따라 기하학적 파티셔닝 및 인터 예측으로 비디오를 인코딩하는 예시적인 프로세스(300)를 예시하는 프로세스 흐름도이다. 단계(910)에서, 비디오 프레임은, 예를 들어, 픽처 프레임을 CTU들 및 CU들로 파티셔닝하는 단계를 포함할 수 있는 트리-구조 매크로 블록 파티셔닝 스킴을 사용하여 초기 블록 세그먼트화를 겪을 수 있다. 단계(920)에서, 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 위해 블록이 선택될 수 있다. 선택은 블록이 기하학적 파티셔닝 모드에 따라 처리되어야 하는 것을 메트릭 규칙에 따라 식별하는 단계를 포함할 수 있다.
단계(930)에서, 여전히 도 9를 참조하면, 3개 이상의 영역을 갖는 기하학적 파티션이 결정될 수 있다. 각각의 영역들 각각 내의 픽셀들(예를 들어, 루마 샘플들)이 다른 영역들(예를 들어, 영역 1) 내의 픽셀들의 모션과 상이할 수 있는 유사한 모션을 갖도록 블록 내에 포함된 픽셀들을 그들의 인터 프레임 모션에 따라 3개 이상의 영역(예를 들어, 영역 0, 영역 1 및 영역 2)으로 분리하는 적어도 2개의 라인 세그먼트가 결정될 수 있다.
단계(940)에서, 계속해서 도 9를 참조하면, 각각의 영역의 모션 정보가 AMVP 모드 또는 병합 모드를 사용하여 결정 및 처리될 수 있다. AMVP 모드를 사용하여 영역을 처리할 때, 후보 리스트는 위에서 설명된 공간 후보들을 포함할 수 있는 공간 및 시간 후보들 모두를 고려함으로써 구성될 수 있으며, 이는 일부 후보들을 이용 불가능한 것으로 마킹하는 것을 포함할 수 있다. 모션 벡터는 모션 벡터 예측으로서 모션 벡터 후보들의 리스트로부터 선택될 수 있고, 모션 벡터 차이(예를 들어, 잔차)가 계산될 수 있다. 후보 리스트에 대한 인덱스가 결정될 수 있다. 병합 모드에서, 후보 리스트는 위에서 설명된 공간 후보들을 포함할 수 있는 공간 및 시간 후보들 모두를 고려함으로써 구성될 수 있으며, 이는 일부 후보들을 이용 불가능한 것으로 마킹하는 것을 포함할 수 있다. 다른 블록의 모션 정보를 채택하기 위해 영역에 대한 모션 벡터 후보들의 리스트로부터 모션 벡터가 선택될 수 있다. 후보 리스트에 대한 인덱스가 결정될 수 있다.
단계(950)에서, 여전히 도 9를 참조하면, 결정된 기하학적 파티션 및 모션 정보가 비트스트림으로 시그널링될 수 있다. 비트스트림으로 기하학적 파티션들을 시그널링하는 것은, 예를 들어, P0, P1, P2, P3의 위치들, 하나 이상의 미리 결정된 템플릿에 대한 인덱스 등을 포함하는 것을 포함할 수 있다. AMVP를 사용하여 영역을 처리할 때 모션 정보의 시그널링은 모션 벡터 차이(예를 들어, 잔차) 및 모션 벡터 후보 리스트에 대한 인덱스를 비트스트림에 포함하는 것을 포함할 수 있다. 병합 모드를 사용하여 영역을 처리할 때 모션 정보의 시그널링은 모션 벡터 후보 리스트에 대한 인덱스를 비트스트림에 포함하는 것을 포함할 수 있다.
도 10은 비디오 인코딩 및 디코딩에 대한 복잡성 및 처리 성능을 향상시킬 수 있는 적응형 개수의 영역들을 갖는 기하학적 파티셔닝 및 인터 예측을 사용하여 비트스트림(1070)을 디코딩할 수 있는 예시적인 디코더(1000)를 예시하는 시스템 블록도이다. 디코더(1000)는 엔트로피 디코더 프로세서(1010), 역 양자화 및 역 변환 프로세서(1020), 블록해제 필터(1030), 프레임 버퍼(1040), 모션 보상 프로세서(1050) 및 인트라 예측 프로세서(1060)를 포함할 수 있다. 일부 구현들에서, 비트스트림(1070)은 기하학적 파티셔닝 모드, AMVP 모드 및/또는 병합 모드를 시그널링하는 파라미터들을 포함할 수 있다. 모션 보상 프로세서(1050)는 본원에 설명된 바와 같이 기하학적 파티셔닝을 사용하여 픽셀 정보를 재구성할 수 있다.
동작에서, 여전히 도 10을 참조하면, 비트스트림(1070)이 디코더(1000)에 의해 수신되며, 비트스트림을 양자화된 계수들로 엔트로피 디코딩할 수 있는 엔트로피 디코더 프로세서(1010)에 입력될 수 있다. 양자화된 계수들은 역 양자화 및 역 변환을 수행하여 잔차 신호를 생성할 수 있는 역 양자화 및 역 변환 프로세서(1020)에 제공될 수 있다. 잔차 신호는 처리 모드에 따라 모션 보상 프로세서(1050) 또는 인트라 예측 프로세서(1060)의 출력에 추가될 수 있다. 모션 보상 프로세서(1050) 및 인트라 예측 프로세서(1060)의 출력은 이전에 디코딩된 블록에 기초한 블록 예측을 포함할 수 있다. 예측 및 잔차의 합은 블록해제 필터(1030)에 의해 처리되고 프레임 버퍼(1040)에 저장될 수 있다. 주어진 블록(예를 들어, CU 또는 PU)에 대해, 비트스트림(1070)이 파티셔닝 모드가 기하학적 파티셔닝이라고 시그널링할 때, 모션 보상 프로세서(1050)는 본원에 설명되는 기하학적 파티션 접근법에 기초하여 예측을 구성할 수 있다.
도 11은 비디오 인코딩 및 디코딩에 대한 복잡성 및 처리 성능을 향상시킬 수 있는 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측을 사용하여 비트스트림을 디코딩하는 예시적인 프로세스(1100)를 예시하는 프로세스 흐름도이다. 단계(1110)에서, 현재 블록(예를 들어, CTU, CU, PU)을 포함할 수 있는 비트스트림이 수신된다. 수신하는 단계는 비트스트림으로부터 현재 블록 및 연관된 시그널링 정보를 추출 및/또는 파싱하는 단계를 포함할 수 있다. 디코더는 기하학적 파티셔닝을 특징화하는 하나 이상의 파라미터를 추출하거나 결정할 수 있다. 이러한 파라미터들은, 예를 들어, 라인 세그먼트의 시작 및 끝의 인덱스들(예를 들어, P0, P1, P2, P3)을 포함할 수 있다. 추출 또는 결정은 비트스트림으로부터 파라미터들을 식별하고 검색하는 것(예를 들어, 비트스트림을 파싱하는 것)을 포함할 수 있다.
단계(1120)에서, 여전히 도 11을 참조하면, 현재 블록의 제1 영역, 제2 영역 및 제3 영역이 기하학적 파티셔닝 모드에 따라 결정될 수 있다. 결정하는 단계는 현재 블록에 대해 기하학적 파티셔닝 모드가 인에이블되는지(예를 들어, 참) 결정하는 단계를 포함할 수 있다. 기하학적 파티셔닝 모드가 인에이블되지 않은 경우(예를 들어, 거짓), 디코더는 대체 파티셔닝 모드를 사용하여 블록을 처리할 수 있다. 기하학적 파티셔닝 모드가 인에이블되는 경우(예를 들어, 참), 3개 이상의 영역이 결정 및/또는 처리될 수 있다.
단계(1130)에서, 여전히 도 11을 참조하면, 제1 영역, 제2 영역 및 제3 영역의 영역과 연관된 모션 벡터가 결정될 수 있다. 모션 벡터를 결정하는 단계는 영역의 모션 정보가 AMVP 모드를 사용하여 결정되는지 또는 병합 모드를 사용하여 결정되는지를 결정하는 단계를 포함할 수 있다. AMVP 모드를 사용하여 영역을 처리할 때, 후보 리스트는 위에서 설명된 공간 후보들을 포함할 수 있는 공간 및 시간 후보들 모두를 고려함으로써 구성될 수 있고, 이는 일부 후보들을 이용 불가능한 것으로 마킹하는 것을 포함할 수 있다. 모션 벡터는 모션 벡터 예측으로서 모션 벡터 후보들의 리스트로부터 선택될 수 있고, 모션 벡터 차이(예를 들어, 잔차)가 계산될 수 있다. 병합 모드에서, 결정하는 단계는 각각의 영역에 대한 공간 후보들 및 시간 후보들의 후보 리스트를 구성하는 단계를 포함할 수 있다. 후보 리스트를 구성하는 단계는 후보들을 이용 불가능한 것으로 자동으로 마킹하는 단계 및 후보 리스트로부터 이용 불가능한 후보들을 제거하는 단계를 포함할 수 있다. 구성되는 후보 리스트에 대한 인덱스는 비트스트림으로부터 파싱되고 후보 리스트로부터 최종 후보를 선택하는 데 사용될 수 있다. 현재 영역에 대한 모션 정보는 최종 후보의 모션 정보와 동일하게 결정될 수 있다(예를 들어, 최종 후보로부터 영역에 대한 모션 벡터가 채택될 수 있다).
여전히 도 11을 참조하면, 단계(1140)에서, 결정된 모션 벡터를 사용하여 현재 블록이 디코딩될 수 있다.
수개의 변형들이 위에 상세히 설명되었지만, 다른 수정들 또는 추가들이 가능하다. 예를 들어, 기하학적 파티셔닝은 인코더에서의 레이트-왜곡 결정들에 기초하여 비트스트림으로 시그널링될 수 있다. 코딩은 규칙적인 미리-정의된 파티션들(예를 들어, 템플릿들), 파티셔닝의 시간 및 공간 예측, 및/또는 부가 오프셋들의 조합에 기초할 수 있다. 각각의 기하학적 파티셔닝된 영역은 모션 보상 예측 또는 인트라-예측을 활용할 수 있다. 예측된 영역들의 경계는 잔차가 추가되기 전에 평활화될 수 있다.
일부 구현들에서, 쿼드트리 + 이진 결정 트리(quadtree plus binary decision tree)(QTBT)가 구현될 수 있다. QTBT에서, 코딩 트리 유닛 레벨에서, QTBT의 파티션 파라미터들은 임의의 오버헤드를 송신하는 것 없이 국부 특성들에 적응되도록 동적으로 도출될 수 있다. 그 후에, 코딩 유닛 레벨에서, 조인트-분류기 결정 트리 구조는 불필요한 반복들을 제거하고 잘못된 예측의 위험을 제어할 수 있다. 일부 구현들에서, 적응형 개수의 영역들을 갖는 기하학적 파티셔닝은 QTBT의 모든 리프 노드(leaf node)에서 이용 가능한 부가 파티셔닝 옵션으로서 이용 가능할 수 있다.
일부 구현들에서, 디코더는 현재 블록에 대한 기하학적 파티션을 발생시키고 종속 프로세스들을 위한 모든 파티션-관련 정보를 제공하는 파티션 프로세서를 포함할 수 있다. 파티션 프로세서는 블록이 기하학적 파티셔닝되는 경우에 세그먼트 방식으로(segment-wise) 수행될 수 있으므로 모션 보상에 직접 영향을 미칠 수 있다. 게다가, 파티션 프로세서는 모양 정보를 인트라-예측 프로세서 및 변환 코딩 프로세서에 제공할 수 있다.
일부 구현들에서, 부가 신택스 요소들이 비트스트림의 상이한 계층 레벨들에서 시그널링될 수 있다. 전체 시퀀스에 대한 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 가능하게 하기 위해, 인에이블 플래그가 시퀀스 파라미터 세트(Sequence Parameter Set)(SPS)에서 코딩될 수 있다. 게다가, CTU 플래그가 임의의 코딩 유닛들(CU)이 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 사용하는지를 표시하기 위해 코딩 트리 유닛(CTU) 레벨에서 코딩될 수 있다. CU 플래그가 현재 코딩 유닛이 적응형 개수의 영역들을 갖는 기하학적 파티셔닝을 활용하는지를 표시하기 위해 코딩될 수 있다. 블록 상에 라인 세그먼트를 지정하는 파라미터들이 코딩될 수 있다. 각각의 영역에 대해, 현재 영역이 인터- 또는 인트라-예측되는지를 지정할 수 있는 플래그가 디코딩될 수 있다.
일부 구현들에서, 최소 영역 크기가 지정될 수 있다.
본원에 설명되는 발명 대상은 많은 기술적 장점들을 제공한다. 예를 들어, 본 발명 대상의 일부 구현들은 압축 효율을 증가시키면서 복잡성을 감소시키는 블록들의 파티셔닝을 제공할 수 있다. 일부 구현들에서는, 객체 경계들에서의 블로킹 아티팩트(blocking artifact)들이 감소될 수 있다.
본원에 설명되는 양태들 및 실시예들 중 임의의 하나 이상은, 컴퓨터 기술분야의 통상의 기술자에게 명백한 바와 같이, 본 명세서의 교시들에 따라 프로그램된 하나 이상의 머신(예를 들어, 전자 문서를 위한 사용자 컴퓨팅 디바이스, 문서 서버와 같은 하나 이상의 서버 디바이스 등으로서 활용되는 하나 이상의 컴퓨팅 디바이스)에서 실현 및/또는 구현되는 바와 같은 디지털 전자 회로망, 집적 회로망, 특별히 설계된 주문형 집적 회로(application specific integrated circuit)(ASIC)들, 필드 프로그램가능 게이트 어레이(field programmable gate array)(FPGA)들 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 그것의 조합들을 사용하여 편리하게 구현될 수 있다는 것에 유의해야 한다. 이러한 다양한 양태들 또는 특징들은 저장 시스템, 적어도 하나의 입력 디바이스, 및 적어도 하나의 출력 디바이스로부터 데이터 및 명령어들을 수신하고, 이들에 데이터 및 명령어들을 송신하도록 커플링되는, 특수 또는 일반 목적일 수 있는, 적어도 하나의 프로그램가능 프로세서를 포함하는 프로그램가능 시스템 상에서 실행가능하고 그리고/또는 해석가능한 하나 이상의 컴퓨터 프로그램 및/또는 소프트웨어에서의 구현을 포함할 수 있다. 소프트웨어 분야의 통상의 기술자에게 명백한 바와 같이, 적절한 소프트웨어 코딩은 본 개시내용의 교시들에 기초하여 숙련된 프로그래머들에 의해 쉽게 준비될 수 있다. 소프트웨어 및/또는 소프트웨어 모듈들을 채택하는 위에서 논의된 양태들 및 구현들은 또한 소프트웨어 및/또는 소프트웨어 모듈의 머신 실행 가능 명령어들의 구현을 지원하기 위한 적절한 하드웨어를 포함할 수 있다.
이러한 소프트웨어는 머신 판독 가능 저장 매체를 채택하는 컴퓨터 프로그램 제품일 수 있다. 머신 판독 가능 저장 매체는 머신(예를 들어, 컴퓨팅 디바이스)에 의한 실행을 위한 명령어들의 시퀀스를 저장 및/또는 인코딩할 수 있고 머신으로 하여금 본원에 설명된 방법론들 및/또는 실시예들 중 임의의 하나를 수행하게 하는 임의의 매체일 수 있다. 머신 판독 가능 저장 매체의 예들은 자기 디스크, 광 디스크(예를 들어, CD, CD-R, DVD, DVD-R 등), 광-자기 디스크, 판독 전용 메모리 "ROM" 디바이스, 랜덤 액세스 메모리 "RAM" 디바이스, 마그네틱 카드, 광학 카드, 솔리드 스테이트 메모리 디바이스, EPROM, EEPROM, 프로그램가능 로직 디바이스(Programmable Logic Device)(PLD)들 및/또는 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 본원에 사용된 머신 판독 가능 매체는 단일 매체뿐만 아니라, 예를 들어, 컴퓨터 메모리와 결합된 하나 이상의 하드 디스크 드라이브 또는 컴팩트 디스크들의 모음과 같은 물리적으로 분리된 매체의 모음을 포함하도록 의도된다. 본원에서 사용되는 바와 같이, 머신 판독 가능 저장 매체는 일시적인 형태들의 신호 송신을 포함하지 않는다.
이러한 소프트웨어는 또한 반송파와 같은 데이터 캐리어 상에서 데이터 신호로서 운반되는 정보(예를 들어, 데이터)를 포함할 수 있다. 예를 들어, 머신 실행 가능 정보는 데이터 캐리어에서 구체화되는 데이터-운반 신호로서 포함될 수 있으며, 여기서 신호는 머신(예를 들어, 컴퓨팅 디바이스)에 의한 실행을 위한 명령어의 시퀀스 또는 그 일부, 및 머신으로 하여금 본원에 설명된 방법론들 및/또는 실시예들 중 임의의 하나를 수행하게 하는 임의의 관련된 정보(예를 들어, 데이터 구조들 및 데이터)를 인코딩한다.
컴퓨팅 디바이스의 예들은 전자 책 판독 디바이스, 컴퓨터 워크스테이션, 단말기 컴퓨터, 서버 컴퓨터, 핸드헬드 디바이스(예를 들어, 태블릿 컴퓨터, 스마트폰 등), 웹 기기, 네트워크 라우터, 네트워크 스위치, 네트워크 브리지, 해당 머신에 의해 취해질 액션을 지정하는 명령어들의 시퀀스를 실행할 수 있는 임의의 머신 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 일 예에서, 컴퓨팅 디바이스는 키오스크를 포함하고/하거나 그에 포함될 수 있다.
도 12는 컴퓨팅 디바이스의 일 실시예의 도식적 표현을, 제어 시스템으로 하여금 본 개시내용의 양태들 및/또는 방법론들 중 임의의 하나 이상을 수행하게 하기 위한 명령어들의 세트가 실행될 수 있는 예시적인 형태의 컴퓨터 시스템(1200)으로 도시한다. 또한, 다수의 컴퓨팅 디바이스들이 디바이스들 중 하나 이상으로 하여금 본 개시내용의 양태들 및/또는 방법론들 중 임의의 하나 이상을 수행하게 하기 위해 특별히 구성된 명령어들의 세트를 구현하는 데 활용될 수 있다는 것이 고려된다. 컴퓨터 시스템(1200)은 버스(1212)를 통해 서로 및 다른 구성요소들과 통신하는 프로세서(1204) 및 메모리(1208)를 포함한다. 버스(1212)는 다양한 버스 아키텍처들 중 임의의 것을 사용하는 메모리 버스, 메모리 제어기, 주변 버스, 로컬 버스 및 이들의 임의의 조합들을 포함하되, 이에 제한되는 않는 수개의 타입들의 버스 구조들 중 임의의 것을 포함할 수 있다.
메모리(1208)는 랜덤 액세스 메모리 구성요소, 판독 전용 구성요소 및 이들의 임의의 조합들을 포함하되, 이에 제한되지 않는 다양한 구성요소들(예를 들어, 머신 판독 가능 매체)를 포함할 수 있다. 일 예에서, 예를 들어, 시동 동안 컴퓨터 시스템(1200) 내의 요소들 사이에서 정보를 전송하는 것을 돕는 기본 루틴들을 포함하는 기본 입/출력 시스템(1216)(BIOS)이 메모리(1208)에 저장될 수 있다. 메모리(1208)는 또한 본 개시내용의 양태들 및/또는 방법론들 중 임의의 하나 이상을 구체화하는 명령어들(예를 들어, 소프트웨어)(1220)을 포함할 수 있다(예를 들어, 하나 이상의 머신 판독 가능 매체 상에 저장할 수 있다). 다른 예에서, 메모리(1208)는 운영 체제, 하나 이상의 애플리케이션 프로그램, 다른 프로그램 모듈들, 프로그램 데이터 및 이들의 임의의 조합들을 포함하되, 이에 제한되지 않는 임의의 수의 프로그램 모듈들을 추가로 포함할 수 있다.
컴퓨터 시스템(1200)은 또한 저장 디바이스(1224)를 포함할 수 있다. 저장 디바이스(예를 들어, 저장 디바이스(1224))의 예들은 하드 디스크 드라이브, 자기 디스크 드라이브, 광학 매체와 결합된 광 디스크 드라이브, 솔리드 스테이트 메모리 디바이스 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 저장 디바이스(1224)는 적절한 인터페이스(도시 생략)에 의해 버스(1212)에 연결될 수 있다. 예시적인 인터페이스들은 SCSI, ATA(advanced technology attachment), 직렬 ATA, USB(universal serial bus), IEEE 1394(FIREWIRE) 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 일 예에서, 저장 디바이스(1224)(또는 그것의 하나 이상의 구성요소)는 (예를 들어, 외부 포트 커넥터(도시 생략)를 통해) 컴퓨터 시스템(1200)과 이동식으로 인터페이스될 수 있다. 특히, 저장 디바이스(1224) 및 연관된 머신 판독 가능 매체(1228)는 컴퓨터 시스템(1200)에 대한 머신 판독 가능 명령어들, 데이터 구조들, 프로그램 모듈들 및/또는 다른 데이터의 비휘발성 및/또는 휘발성 저장을 제공할 수 있다. 일 예에서, 소프트웨어(1220)는 머신 판독 가능 매체(1228) 내에 완전히 또는 부분적으로 상주할 수 있다. 다른 예에서, 소프트웨어(1220)는 프로세서(1204) 내에 완전히 또는 부분적으로 상주할 수 있다.
컴퓨터 시스템(1200)은 또한 입력 디바이스(1232)를 포함할 수 있다. 일 예에서, 컴퓨터 시스템(1200)의 사용자는 입력 디바이스(1232)를 통해 컴퓨터 시스템(1200)에 명령들 및/또는 다른 정보를 입력할 수 있다. 입력 디바이스(1232)의 예들은 영숫자 입력 디바이스(예를 들어, 키보드), 포인팅 디바이스, 조이스틱, 게임 패드, 오디오 입력 디바이스(예를 들어, 마이크로폰, 음성 응답 시스템 등), 커서 제어 디바이스(예를 들어, 마우스), 터치 패드, 광학 스캐너, 비디오 캡처 디바이스(예를 들어, 스틸 카메라, 비디오 카메라), 터치 스크린 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 입력 디바이스(1232)는 직렬 인터페이스, 병렬 인터페이스, 게임 포트, USB 인터페이스, FIREWIRE 인터페이스, 버스(1212)에 대한 직접 인터페이스 및 이들의 임의의 조합들을 포함하되, 이에 제한되지 않는 다양한 인터페이스들(도시 생략) 중 임의의 것을 통해 버스(1212)에 인터페이스될 수 있다. 입력 디바이스(1232)는 아래에서 추가로 논의되는 디스플레이(1236)의 일부이거나 이와 별개일 수 있는 터치 스크린 인터페이스를 포함할 수 있다. 입력 디바이스(1232)는 위에서 설명된 바와 같이 그래픽 인터페이스에서 하나 이상의 그래픽 표현을 선택하기 위한 사용자 선택 디바이스로서 활용될 수 있다.
사용자는 또한 저장 디바이스(1224)(예를 들어, 이동식 디스크 드라이브, 플래시 드라이브 등) 및/또는 네트워크 인터페이스 디바이스(1240)를 통해 컴퓨터 시스템(1200)에 명령들 및/또는 다른 정보를 입력할 수 있다. 네트워크 인터페이스 디바이스(1240)와 같은 네트워크 인터페이스 디바이스는 컴퓨터 시스템(1200)을 네트워크(1244)와 같은 다양한 네트워크들 및 그에 연결된 하나 이상의 원격 디바이스(1248) 중 하나 이상에 연결하기 위해 활용될 수 있다. 네트워크 인터페이스 디바이스의 예들은 네트워크 인터페이스 카드(예를 들어, 모바일 네트워크 인터페이스 카드, LAN 카드), 모뎀 및 이들의 임의의 조합을 포함하지만, 이에 제한되지 않는다. 네트워크의 예들은 광역 네트워크(예를 들어, 인터넷, 기업 네트워크), 근거리 네트워크(예를 들어, 사무실, 건물, 캠퍼스 또는 다른 비교적 작은 지리적 공간과 연관된 네트워크), 전화 네트워크, 전화/음성 공급자와 연관된 데이터 네트워크(예를 들어, 이동 통신 공급자 데이터 및/또는 음성 네트워크), 두 컴퓨팅 디바이스 사이의 직접 연결, 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 네트워크(1244)와 같은 네트워크는 유선 및/또는 무선 통신 모드를 채택할 수 있다. 일반적으로, 임의의 네트워크 토폴로지가 사용될 수 있다. 정보(예를 들어, 데이터, 소프트웨어(1220) 등)는 네트워크 인터페이스 디바이스(1240)를 통해 컴퓨터 시스템(1200)으로 및/또는 컴퓨터 시스템(1200)으로부터 통신될 수 있다.
컴퓨터 시스템(1200)은 디스플레이 디바이스(1236)와 같은 디스플레이 디바이스에 디스플레이 가능한 이미지를 전달하기 위한 비디오 디스플레이 어댑터(1252)를 추가로 포함할 수 있다. 디스플레이 디바이스의 예들은 액정 디스플레이(liquid crystal display)(LCD), 음극선관(cathode ray tube)(CRT), 플라즈마 디스플레이, 발광 다이오드(light emitting diode)(LED) 디스플레이 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다. 디스플레이 어댑터(1252) 및 디스플레이 디바이스(1236)는 프로세서(1204)와 결합하여 본 개시내용의 양태들의 그래픽 표현을 제공하는 데 활용될 수 있다. 디스플레이 디바이스에 추가하여, 컴퓨터 시스템(1200)은 오디오 스피커, 프린터 및 이들의 임의의 조합들을 포함하되, 이에 제한되지 않는 하나 이상의 다른 주변 출력 디바이스를 포함할 수 있다. 이러한 주변 출력 디바이스들은 주변 인터페이스(1256)를 통해 버스(1212)에 연결될 수 있다. 주변 인터페이스의 예들은 직렬 포트, USB 연결, FIREWIRE 연결, 병렬 연결 및 이들의 임의의 조합들을 포함하지만, 이에 제한되지 않는다.
전술한 내용은 본 발명의 예시적인 실시예들에 대한 상세한 설명이었다. 본 발명의 사상 및 범위를 벗어나지 않고 다양한 수정들 및 추가들이 이루어질 수 있다. 위에서 설명된 다양한 실시예들 각각의 특징들은 연관된 새로운 실시예들에서 다수의 특징 결합들을 제공하기 위해 적절한 다른 설명된 실시예들의 특징들과 결합될 수 있다. 또한, 전술한 내용은 다수의 개별적인 실시예들을 설명하지만, 본원에 설명된 것은 단지 본 발명의 원리들의 적용을 예시한 것에 불과하다. 또한, 본원의 특정 방법들이 특정 순서로 수행되는 것으로 예시 및/또는 설명될 수 있지만, 본원에 개시된 실시예들을 달성하기 위해 순서는 통상의 기술 내에서 매우 가변적이다. 따라서, 이 설명은 단지 예로서 취해지는 것을 의미하며, 본 발명의 범위를 달리 제한하지 않는다.
상기 설명들 및 청구항들에서, "중 적어도 하나" 또는 "중 하나 이상"과 같은 구들은 요소들 또는 특징들의 연결 리스트 후에 발생할 수 있다. 용어 "및/또는" 또한 2개 이상의 요소 또는 특징의 리스트에서 발생할 수 있다. 그것이 사용되는 맥락에 의해 암시적으로 또는 명시적으로 달리 모순되지 않는 한, 그러한 구는 열거된 요소들 또는 특징들 중 어느 것을 개별적으로 의미하거나 다른 열거된 요소들 또는 특징들 중 어느 것과 조합하여 열거된 요소들 또는 특징들 중 어느 것을 의미하도록 의도된다. 예를 들어, 구들 "A 및 B 중 적어도 하나"; "A 및 B 중 하나 이상"; 및 "A 및/또는 B"는 "A 단독, B 단독, 또는 A 및 B 함께"를 의미하도록 각각 의도된다. 유사한 해석은 또한 3개 이상의 아이템을 포함하는 리스트들을 위해 의도된다. 예를 들어, 구들 "A, B, 및 C 중 적어도 하나"; "A, B, 및 C 중 하나 이상"; 및 "A, B, 및/또는 C"는 "A 단독, B 단독, C 단독, A 및 B 함께, A 및 C 함께, B 및 C 함께, 또는 A 및 B 및 C 함께"를 의미하도록 각각 의도된다. 게다가, 용어 "기초하여"의 사용은 위에서 그리고 청구항들에서 "에 적어도 부분적으로 기초하여"를 의미하도록 의도되어, 비열거된 특징 또는 요소가 또한 허용가능하다.
본원에 설명되는 발명 대상은 원하는 구성에 따라 시스템들, 장치, 방법들, 및/또는 물품들로 구체화될 수 있다. 상술한 설명에 제시되는 구현들은 본원에 설명되는 발명 대상과 일치하는 모든 구현들을 표현하지는 않는다. 대신에, 그들은 설명된 발명 대상과 관련된 양태들과 일치하는 일부 예들일 뿐이다. 수개의 변형들이 위에 상세히 설명되었지만, 다른 수정들 또는 추가들이 가능하다. 특히, 추가 특징들 및/또는 변형들이 본원에 제시되는 것들에 더하여 제공될 수 있다. 예를 들어, 위에 설명된 구현들은 개시된 특징들의 다양한 조합들 및 서브조합들 및/또는 위에 개시된 수개의 추가 특징들의 조합들 및 서브조합들에 관한 것일 수 있다. 게다가, 첨부 도면들에 도시되고 그리고/또는 본원에 설명되는 논리 흐름들은 바람직한 결과들을 달성하기 위해, 도시되는 특정 순서, 또는 순차적 순서를 반드시 필요로 하는 것은 아니다. 다른 구현들은 이하의 청구항들의 범위 내에 있을 수 있다.

Claims (46)

  1. 디코더로서,
    회로망
    을 포함하고, 상기 회로망은,
    비트스트림을 수신하고,
    기하학적 파티셔닝 모드(geometric partitioning mode)를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하고,
    상기 제1 영역, 상기 제2 영역 및 상기 제3 영역의 영역과 연관된 모션 벡터를 결정하고 - 상기 결정하는 것은 후보 리스트를 구성하는 것을 추가로 포함함 -,
    상기 결정된 모션 벡터를 사용하여 상기 현재 블록을 디코딩하도록
    구성되는, 디코더.
  2. 제1항에 있어서, 상기 후보 리스트를 구성하는 것은 아래-좌측 후보, 좌측 후보, 위-좌측 후보, 위 후보 및 위-우측 후보를 평가하는 것을 포함하는, 디코더.
  3. 제2항에 있어서,
    상기 결정된 모션 벡터는 상기 제1 영역에 대한 것이고,
    상기 기하학적 파티셔닝 모드는 제1 루마 위치와 제2 루마 위치 사이의 라인 세그먼트를 포함하고,
    상기 아래-좌측 후보는 상기 제2 루마 위치의 바로 좌측 바로 아래 제3 루마 위치에 위치되고,
    상기 좌측 후보는 상기 제2 루마 위치의 바로 좌측 제4 루마 위치에 위치되고,
    상기 위-좌측 후보는 상기 제1 영역의 상부-최좌측 루마 위치의 바로 위 바로 좌측 제5 루마 위치에 위치되고,
    상기 위 후보는 상기 제1 루마 위치의 바로 위 제6 루마 위치에 위치되고,
    상기 위-우측 후보는 상기 제1 루마 위치의 바로 위 우측 제7 루마 위치에 위치되는, 디코더.
  4. 제2항에 있어서,
    상기 결정된 모션 벡터는 상기 제2 영역에 대한 것이고,
    상기 기하학적 파티셔닝 모드는 제1 루마 위치와 제2 루마 위치 사이의 라인 세그먼트를 포함하고,
    상기 아래-좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 바로 아래 제3 루마 위치에 위치되고,
    상기 좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 제4 루마 위치에 위치되고,
    상기 위-좌측 후보는 상기 제1 위치의 바로 위 제5 루마 위치에 위치되고,
    상기 위 후보는 상기 제2 영역의 상부-최우측 루마 위치의 바로 위 제6 루마 위치에 위치되고,
    상기 위-우측 후보는 상기 제2 영역의 상부-최우측 루마 위치의 바로 위 우측 제7 루마 위치에 위치되는, 디코더.
  5. 제2항에 있어서,
    상기 결정된 모션 벡터는 상기 제3 영역에 대한 것이고,
    상기 기하학적 파티셔닝 모드는 제1 루마 위치와 제2 루마 위치 사이의 라인 세그먼트를 포함하고,
    상기 아래-좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 바로 아래 제3 루마 위치에 위치되고,
    상기 좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 제4 루마 위치에 위치되고,
    상기 위-좌측 후보는 상기 제1 영역과 함께-배치된(co-located) 제5 루마 위치에 위치되고,
    상기 위 후보는 상기 제2 위치의 바로 좌측 제6 루마 위치에 위치되고,
    상기 위-우측 후보는 상기 제2 영역과 함께-배치되는 제7 루마 위치에 위치되는, 디코더.
  6. 제2항에 있어서, 상기 결정된 모션 벡터는 상기 제2 영역에 대한 것이고, 상기 디코더는 후보가 상기 제3 영역과 함께-배치된다는 결정에 응답하여 상기 후보를 이용 불가능한 것으로 마킹하도록 추가로 구성되는, 디코더.
  7. 제2항에 있어서,
    상기 결정된 모션 벡터는 상기 제2 영역에 대한 것이고,
    상기 디코더는 상기 기하학적 파티셔닝 모드가 인에이블된다는 결정에 응답하여 상기 상부-좌측 후보를 이용 불가능한 것으로 자동으로 마킹하도록 추가로 구성되는, 디코더.
  8. 제2항에 있어서,
    상기 결정된 모션 벡터는 상기 제3 영역에 대한 것이고,
    상기 디코더는 상기 기하학적 파티셔닝 모드가 인에이블된다는 결정에 응답하여 상기 상부-우측 후보를 이용 불가능한 것으로 자동으로 마킹하도록 추가로 구성되는, 디코더.
  9. 제2항에 있어서,
    상기 결정된 모션 벡터는 상기 제3 영역에 대한 것이고,
    상기 디코더는 상기 기하학적 파티셔닝 모드가 인에이블된다는 결정에 응답하여 상기 상부-좌측 후보를 이용 불가능한 것으로 자동으로 마킹하도록 추가로 구성되는, 디코더.
  10. 제1항에 있어서, 상기 제1 영역에 대해 병합 모드가 인에이블되는 것으로 결정하도록 추가로 구성되는, 디코더.
  11. 제1항에 있어서, 상기 제1 영역에 대해 고급 모션 벡터 예측 모드가 인에이블되는 것으로 결정하도록 추가로 구성되는, 디코더.
  12. 제1항에 있어서, 상기 현재 블록의 픽셀 데이터를 재구성하도록 추가로 구성되는, 디코더.
  13. 제12항에 있어서, 상기 제1 영역 및 상기 제2 영역은 비-직사각형인, 디코더.
  14. 제1항에 있어서, 상기 기하학적 파티셔닝 모드는 상기 비트스트림으로 시그널링되는, 디코더.
  15. 제1항에 있어서, 상기 기하학적 파티셔닝 모드를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하는 것은 상기 현재 블록을 제1 루마 위치 및 제2 루마 위치에 의해 특징화되는 라인 세그먼트로 파티셔닝하는 것을 포함하는, 디코더.
  16. 제1항에 있어서,
    상기 기하학적 파티셔닝 모드가 인에이블되는지를 결정하고,
    상기 현재 블록에 대한 제1 라인 세그먼트를 결정하고,
    상기 현재 블록에 대한 제2 라인 세그먼트를 결정하도록
    추가로 구성되고,
    상기 현재 블록을 디코딩하는 것은 상기 제1 라인 세그먼트 및 상기 제2 라인 세그먼트를 사용하여 픽셀 데이터를 재구성하는 것을 포함하고,
    상기 제1 라인 세그먼트 및 상기 제2 라인 세그먼트는 상기 현재 블록을 상기 제1 영역, 상기 제2 영역 및 상기 제3 영역으로 파티셔닝하는, 디코더.
  17. 제1항에 있어서, 상기 기하학적 파티셔닝 모드는 64x64 또는 128x128 루마 샘플들보다 크거나 이와 동일한 블록 크기들에 대해 이용 가능한, 디코더.
  18. 제1항에 있어서,
    상기 비트스트림을 수신하고 상기 비트스트림을 양자화된 계수들로 디코딩하도록 구성되는 엔트로피 디코더 프로세서;
    역 이산 코사인 변환을 수행하는 것을 포함하여 상기 양자화된 계수들을 처리하도록 구성되는 역 양자화 및 역 변환 프로세서;
    블록해제 필터(deblocking filter);
    프레임 버퍼; 및
    인트라 예측 프로세서
    를 추가로 포함하는, 디코더.
  19. 제1항에 있어서, 상기 비트스트림은 상기 현재 블록에 대해 상기 기하학적 파티셔닝 모드가 인에이블되는지를 표시하는 파라미터를 포함하는, 디코더.
  20. 제1항에 있어서, 상기 현재 블록은 쿼드트리 + 이진 결정 트리(quadtree plus binary decision tree)의 일부를 형성하는, 디코더.
  21. 제20항에 있어서, 상기 현재 블록은 쿼드트리 + 이진 결정 트리의 비-리프 노드(non-leaf node)인, 디코더.
  22. 제1항에 있어서, 상기 현재 블록은 코딩 트리 유닛 또는 코딩 유닛인, 디코더.
  23. 제1항에 있어서, 상기 제1 영역은 코딩 유닛 또는 예측 유닛인, 디코더.
  24. 방법으로서,
    디코더에 의해, 비트스트림을 수신하는 단계;
    상기 디코더에 의해, 기하학적 파티셔닝 모드를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하는 단계;
    상기 디코더에 의해, 상기 제1 영역, 상기 제2 영역 및 상기 제3 영역의 영역과 연관된 모션 벡터를 결정하는 단계 - 상기 결정하는 단계는 후보 리스트를 구성하는 단계를 포함함 -; 및
    상기 디코더에 의해, 상기 결정된 모션 벡터를 사용하여 상기 현재 블록을 디코딩하는 단계
    를 포함하는, 방법.
  25. 제24항에 있어서, 상기 후보 리스트를 구성하는 단계는 아래-좌측 후보, 좌측 후보, 위-좌측 후보, 위 후보 및 위-우측 후보를 평가하는 단계를 포함하는, 방법.
  26. 제25항에 있어서,
    상기 결정된 모션 벡터는 상기 제1 영역에 대한 것이고,
    상기 기하학적 파티셔닝 모드는 제1 루마 위치와 제2 루마 위치 사이의 라인 세그먼트를 포함하고,
    상기 아래-좌측 후보는 상기 제2 루마 위치의 바로 좌측 바로 아래 제3 루마 위치에 위치되고,
    상기 좌측 후보는 상기 제2 루마 위치의 바로 좌측 제4 루마 위치에 위치되고,
    상기 위-좌측 후보는 상기 제1 영역의 상부-최좌측 루마 위치의 바로 위 바로 좌측 제5 루마 위치에 위치되고,
    상기 위 후보는 상기 제1 루마 위치의 바로 위 제6 루마 위치에 위치되고,
    상기 위-우측 후보는 상기 제1 루마 위치의 바로 위 우측 제7 루마 위치에 위치되는, 방법.
  27. 제25항에 있어서,
    상기 결정된 모션 벡터는 상기 제2 영역에 대한 것이고,
    상기 기하학적 파티셔닝 모드는 제1 루마 위치와 제2 루마 위치 사이의 라인 세그먼트를 포함하고,
    상기 아래-좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 바로 아래 제3 루마 위치에 위치되고,
    상기 좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 제4 루마 위치에 위치되고,
    상기 위-좌측 후보는 상기 제1 위치의 바로 위 제5 루마 위치에 위치되고,
    상기 위 후보는 상기 제2 영역의 상부-최우측 루마 위치의 바로 위 제6 루마 위치에 위치되고,
    상기 위-우측 후보는 상기 제2 영역의 상부-최우측 루마 위치의 바로 위 우측 제7 루마 위치에 위치되는, 방법.
  28. 제25항에 있어서,
    상기 결정된 모션 벡터는 상기 제3 영역에 대한 것이고,
    상기 기하학적 파티셔닝 모드는 제1 루마 위치와 제2 루마 위치 사이의 라인 세그먼트를 포함하고,
    상기 아래-좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 바로 아래 제3 루마 위치에 위치되고,
    상기 좌측 후보는 상기 제3 영역의 하부-최좌측 루마 위치의 바로 좌측 제4 루마 위치에 위치되고,
    상기 위-좌측 후보는 상기 제1 영역과 함께-배치된 제5 루마 위치에 위치되고,
    상기 위 후보는 상기 제2 위치의 바로 좌측 제6 루마 위치에 위치되고,
    상기 위-우측 후보는 상기 제2 영역과 함께-배치되는 제7 루마 위치에 위치되는, 방법.
  29. 제25항에 있어서, 상기 결정된 모션 벡터는 상기 제2 영역에 대한 것이고, 후보가 상기 제3 영역과 함께-배치된다는 결정에 응답하여 상기 후보를 이용 불가능한 것으로 마킹하는 단계를 추가로 포함하는, 방법.
  30. 제25항에 있어서, 상기 결정된 모션 벡터는 상기 제2 영역에 대한 것이고, 상기 기하학적 파티셔닝 모드가 인에이블된다는 결정에 응답하여 상기 상부-좌측 후보를 이용 불가능한 것으로 자동으로 마킹하는 단계를 추가로 포함하는, 방법.
  31. 제25항에 있어서, 상기 결정된 모션 벡터는 상기 제3 영역에 대한 것이고, 상기 기하학적 파티셔닝 모드가 인에이블된다는 결정에 응답하여 상기 상부-우측 후보를 이용 불가능한 것으로 자동으로 마킹하는 단계를 추가로 포함하는, 방법.
  32. 제25항에 있어서, 상기 결정된 모션 벡터는 상기 제3 영역에 대한 것이고, 상기 기하학적 파티셔닝 모드가 인에이블된다는 결정에 응답하여 상기 상부-좌측 후보를 이용 불가능한 것으로 자동으로 마킹하는 단계를 추가로 포함하는, 방법.
  33. 제24항에 있어서, 상기 제1 영역에 대해 병합 모드가 인에이블되는 것으로 결정하는 단계를 추가로 포함하는, 방법.
  34. 제24항에 있어서, 상기 제1 영역에 대해 고급 모션 벡터 예측 모드가 인에이블되는 것으로 결정하는 단계를 추가로 포함하는, 방법.
  35. 제24항에 있어서, 상기 현재 블록의 픽셀 데이터를 재구성하는 단계를 추가로 포함하는, 방법.
  36. 제24항에 있어서, 상기 제1 영역 및 상기 제2 영역 각각은 비-직사각형인, 방법.
  37. 제24항에 있어서, 상기 기하학적 파티셔닝 모드는 상기 비트스트림으로 시그널링되는, 방법.
  38. 제24항에 있어서, 상기 기하학적 파티셔닝 모드를 통해 현재 블록을 제1 영역, 제2 영역 및 제3 영역으로 파티셔닝하는 것은 상기 현재 블록을 제1 루마 위치 및 제2 루마 위치에 의해 특징화되는 라인 세그먼트로 파티셔닝하는 단계를 포함하는, 방법.
  39. 제24항에 있어서,
    상기 기하학적 파티셔닝 모드가 인에이블되는지를 결정하는 단계;
    상기 현재 블록에 대한 제1 라인 세그먼트를 결정하는 단계; 및
    상기 현재 블록에 대한 제2 라인 세그먼트를 결정하는 단계
    를 추가로 포함하고,
    상기 현재 블록을 디코딩하는 단계는 상기 제1 라인 세그먼트 및 상기 제2 라인 세그먼트를 사용하여 픽셀 데이터를 재구성하는 단계를 포함하고,
    상기 제1 라인 세그먼트 및 상기 제2 라인 세그먼트는 상기 현재 블록을 상기 제1 영역, 상기 제2 영역 및 상기 제3 영역으로 파티셔닝하는, 방법.
  40. 제24항에 있어서, 상기 기하학적 파티셔닝 모드는 64x64 또는 128x128 루마 샘플들보다 크거나 이와 동일한 블록 크기들에 대해 이용 가능한, 방법.
  41. 제24항에 있어서, 상기 디코더는,
    상기 비트스트림을 수신하고 상기 비트스트림을 양자화된 계수들로 디코딩하도록 구성되는 엔트로피 디코더 프로세서;
    역 이산 코사인 변환을 수행하는 것을 포함하여 상기 양자화된 계수들을 처리하도록 구성되는 역 양자화 및 역 변환 프로세서;
    블록해제 필터;
    프레임 버퍼; 및
    인트라 예측 프로세서
    를 추가로 포함하는, 방법.
  42. 제24항에 있어서, 상기 비트스트림은 상기 현재 블록에 대해 상기 기하학적 파티셔닝 모드가 인에이블되는지를 표시하는 파라미터를 포함하는, 방법.
  43. 제24항에 있어서, 상기 현재 블록은 쿼드트리 + 이진 결정 트리의 일부를 형성하는, 방법.
  44. 제43항에 있어서, 상기 현재 블록은 쿼드트리 + 이진 결정 트리의 비-리프 노드인, 방법.
  45. 제24항에 있어서, 상기 현재 블록은 코딩 트리 유닛 또는 코딩 유닛인, 방법.
  46. 제24항에 있어서, 상기 제1 영역은 코딩 유닛 또는 예측 유닛인, 방법.
KR1020217027064A 2019-01-28 2020-01-28 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측 KR20210118154A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962797820P 2019-01-28 2019-01-28
US62/797,820 2019-01-28
PCT/US2020/015410 WO2020159989A1 (en) 2019-01-28 2020-01-28 Inter prediction in geometric partitioning with an adaptive number of regions

Publications (1)

Publication Number Publication Date
KR20210118154A true KR20210118154A (ko) 2021-09-29

Family

ID=71841935

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217027064A KR20210118154A (ko) 2019-01-28 2020-01-28 적응형 개수의 영역들을 갖는 기하학적 파티셔닝에서의 인터 예측

Country Status (9)

Country Link
US (3) US11259014B2 (ko)
EP (1) EP3918794A4 (ko)
JP (1) JP2022523697A (ko)
KR (1) KR20210118154A (ko)
CN (1) CN113647104A (ko)
BR (1) BR112021014788A2 (ko)
MX (1) MX2021009026A (ko)
SG (1) SG11202108103WA (ko)
WO (1) WO2020159989A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020159982A1 (en) * 2019-01-28 2020-08-06 Op Solutions, Llc Shape adaptive discrete cosine transform for geometric partitioning with an adaptive number of regions
KR20220113533A (ko) * 2019-12-30 2022-08-12 에프쥐 이노베이션 컴퍼니 리미티드 비디오 데이터를 코딩하기 위한 디바이스 및 방법
CN117321990A (zh) * 2021-05-17 2023-12-29 北京达佳互联信息技术有限公司 具有运动矢量细化的几何分区模式

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3277116B2 (ja) * 1996-03-18 2002-04-22 シャープ株式会社 動画像符号化装置および動画像復号化装置
AU2002310496A1 (en) 2001-06-21 2003-01-08 Walker Digital, Llc Methods and systems for documenting a player's experience in a casino environment
US6788301B2 (en) 2001-10-18 2004-09-07 Hewlett-Packard Development Company, L.P. Active pixel determination for line generation in regionalized rasterizer displays
US7742636B2 (en) 2006-01-26 2010-06-22 Nethra Imaging Inc. Method and apparatus for scaling down a bayer domain image
CN101502119B (zh) 2006-08-02 2012-05-23 汤姆逊许可公司 用于视频编码的自适应几何分割方法和设备
US8605786B2 (en) * 2007-09-04 2013-12-10 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
JP2011501508A (ja) 2007-10-12 2011-01-06 トムソン ライセンシング 幾何学分割された双方向予測モードパーティションのビデオエンコーディング及びデコーディングのための方法及び装置
BRPI0818649A2 (pt) * 2007-10-16 2015-04-07 Thomson Licensing Métodos e aparelho para codificação e decodificação de vídeo em superblocos geometricamente particionados.
CN102484706B (zh) 2009-06-26 2015-09-16 汤姆森特许公司 使用自适应几何划分进行视频编码和解码的方法及装置
WO2011001078A1 (fr) * 2009-07-03 2011-01-06 France Telecom Prédiction d'un vecteur mouvement d'une partition d'image courante de forme géometrique ou de taille différente de celle d'au moins une partition d'image de référence voisine, codage et décodage utilisant une telle prédiction
US8879632B2 (en) 2010-02-18 2014-11-04 Qualcomm Incorporated Fixed point implementation for geometric motion partitioning
JP2013524730A (ja) * 2010-04-12 2013-06-17 クゥアルコム・インコーポレイテッド 幾何学的動き区分のための固定小数点実装形態
DK2924995T3 (en) * 2010-07-09 2018-10-01 Samsung Electronics Co Ltd PROCEDURE FOR VIDEO DECODING, BY USING BLOCK COLLECTION
EP2421266A1 (en) 2010-08-19 2012-02-22 Thomson Licensing Method for reconstructing a current block of an image and corresponding encoding method, corresponding devices as well as storage medium carrying an images encoded in a bit stream
US20120147961A1 (en) 2010-12-09 2012-06-14 Qualcomm Incorporated Use of motion vectors in evaluating geometric partitioning modes
CN107071461B (zh) * 2010-12-14 2019-11-12 M&K控股株式会社 用于解码运动画面的设备
KR20120090740A (ko) * 2011-02-07 2012-08-17 (주)휴맥스 정밀한 단위의 필터 선택을 적용한 영상 부호화/복호화 장치 및 방법
GB2501835B (en) * 2011-03-09 2014-09-03 Canon Kk Video encoding and decoding
US20130107962A1 (en) 2011-10-26 2013-05-02 Intellectual Discovery Co., Ltd. Scalable video coding method and apparatus using inter prediction mode
BR112014009571A2 (pt) * 2011-10-31 2017-04-18 Mitsubishi Electric Corp dispositivos e métodos de codificação e de decodificação de vídeo
WO2013068564A1 (en) 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Effective wedgelet partition coding using spatial prediction
EP2597872A3 (en) 2011-11-23 2013-12-25 Humax Co., Ltd. Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions
US20130287109A1 (en) 2012-04-29 2013-10-31 Qualcomm Incorporated Inter-layer prediction through texture segmentation for video coding
EP2813079B1 (en) 2012-06-20 2019-08-07 HFI Innovation Inc. Method and apparatus of inter-layer prediction for scalable video coding
KR20140124920A (ko) * 2013-04-15 2014-10-28 인텔렉추얼디스커버리 주식회사 움직임 벡터 예측을 이용한 비디오 부호화/복호화 방법 및 장치
US9986236B1 (en) 2013-11-19 2018-05-29 Google Llc Method and apparatus for encoding a block using a partitioned block and weighted prediction values
US10477232B2 (en) 2014-03-21 2019-11-12 Qualcomm Incorporated Search region determination for intra block copy in video coding
US10042887B2 (en) 2014-12-05 2018-08-07 International Business Machines Corporation Query optimization with zone map selectivity modeling
WO2016090568A1 (en) 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Binary tree block partitioning structure
US10856001B2 (en) * 2015-02-24 2020-12-01 Lg Electronics Inc. Polygon unit-based image processing method, and device for same
KR20170059423A (ko) * 2015-11-20 2017-05-30 한국전자통신연구원 기하 변환 영상을 이용하는 영상의 부호화/복호화 방법 및 장치
KR20180085714A (ko) 2015-12-17 2018-07-27 삼성전자주식회사 머지 후보 리스트를 이용한 비디오 복호화 방법 및 비디오 복호화 장치
US10306258B2 (en) * 2016-01-29 2019-05-28 Google Llc Last frame motion vector partitioning
RU2706228C1 (ru) * 2016-02-12 2019-11-15 Хуавей Текнолоджиз Ко., Лтд. Способ и устройство выбора порядка сканирования
WO2018034373A1 (ko) * 2016-08-19 2018-02-22 엘지전자(주) 영상 처리 방법 및 이를 위한 장치
US10116957B2 (en) 2016-09-15 2018-10-30 Google Inc. Dual filter type for motion compensated prediction in video coding
EP3577898A4 (en) * 2017-01-31 2020-06-24 Sharp Kabushiki Kaisha SYSTEMS AND METHODS FOR PARTITIONING A VIDEO BLOCK IMAGE FOR VIDEO CODING
CA3068393A1 (en) * 2017-06-30 2019-01-03 Sharp Kabushiki Kaisha Systems and methods for geometry-adaptive block partitioning of a picture into video blocks for video coding
CN111567045A (zh) * 2017-10-10 2020-08-21 韩国电子通信研究院 使用帧间预测信息的方法和装置
CN111527752B (zh) * 2017-12-28 2024-04-12 韩国电子通信研究院 图像编码和解码的方法和装置以及存储比特流的记录介质
CN112602324A (zh) 2018-06-22 2021-04-02 Op方案有限责任公司 块水平几何划分
US11490077B2 (en) 2018-06-27 2022-11-01 Digitalinsights Inc. Image encoding/decoding method and apparatus involving merge candidate list and triangular shape partitions
WO2020072494A1 (en) 2018-10-01 2020-04-09 Op Solutions, Llc Methods and systems of exponential partitioning
WO2020088689A1 (en) * 2018-11-02 2020-05-07 Beijing Bytedance Network Technology Co., Ltd. Usage of hmvp candidates in geometry partition prediction mode
WO2020116402A1 (ja) * 2018-12-04 2020-06-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
MX2021009028A (es) 2019-01-28 2021-10-13 Op Solutions Llc Inter prediccion en particion exponencial.

Also Published As

Publication number Publication date
WO2020159989A1 (en) 2020-08-06
US20220182607A1 (en) 2022-06-09
MX2021009026A (es) 2021-10-13
BR112021014788A2 (pt) 2021-09-28
CN113647104A (zh) 2021-11-12
JP2022523697A (ja) 2022-04-26
EP3918794A1 (en) 2021-12-08
EP3918794A4 (en) 2022-04-20
US11259014B2 (en) 2022-02-22
US20230308640A1 (en) 2023-09-28
US20200396448A1 (en) 2020-12-17
SG11202108103WA (en) 2021-08-30
US11695922B2 (en) 2023-07-04

Similar Documents

Publication Publication Date Title
CN113727101A (zh) 编码器、解码器及对应帧间预测方法
JP7482536B2 (ja) 適応的な数の領域を伴う幾何学的分割のための形状適応離散コサイン変換
KR20220088680A (ko) 프레임 타입에 기반한 적응적 해상도 관리의 묵시적 시그널링
KR20210153128A (ko) 인터 예측에서의 병합 모드 후보들에 대한 글로벌 모션
US20210360271A1 (en) Inter prediction in exponential partitioning
US20230308640A1 (en) Encoder for interprediction in geometric partitioning with an adaptive number of regions
KR20220002990A (ko) 인터 예측에서의 글로벌 모션 제약 모션 벡터
KR20220088681A (ko) 적응적 해상도 관리 시그널링
KR20220016266A (ko) 글로벌 모션 벡터에 기초한 병합 후보 재정렬기
KR20220090493A (ko) 블록-기반 적응적 해상도 관리
JP7323220B2 (ja) 大域的運動を伴うフレームにおける候補
JP2023093765A (ja) 大域的運動を伴うフレームにおける選択的運動ベクトル予測候補
JP2023105073A (ja) 大域的運動を伴うフレームにおける適応型運動ベクトル予測候補
KR20210153725A (ko) 글로벌 모션 벡터들의 효율적인 코딩
KR20220002989A (ko) 픽처 헤더 내의 글로벌 모션 벡터의 시그널링
KR20220088844A (ko) 서브-프레임들을 사용한 적응적 해상도 관리
KR20220088679A (ko) 적응적 해상도 관리 예측 재스케일링
JP2023105074A (ja) 運動ベクトルインタ予測のための大域的運動モデル
KR20210094046A (ko) 명시적 및 암시적 시그널링을 사용한 이용 불가능한 참조 프레임들의 적응형 블록 업데이트
KR20210152567A (ko) 픽처 헤더 내의 글로벌 모션 벡터의 시그널링
KR20210118155A (ko) 연장된 장기 참조 픽처 보유의 명시적 시그널링