KR102638065B1 - 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치 - Google Patents

비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치 Download PDF

Info

Publication number
KR102638065B1
KR102638065B1 KR1020227038128A KR20227038128A KR102638065B1 KR 102638065 B1 KR102638065 B1 KR 102638065B1 KR 1020227038128 A KR1020227038128 A KR 1020227038128A KR 20227038128 A KR20227038128 A KR 20227038128A KR 102638065 B1 KR102638065 B1 KR 102638065B1
Authority
KR
South Korea
Prior art keywords
reference line
index
highest probability
mode
intra prediction
Prior art date
Application number
KR1020227038128A
Other languages
English (en)
Other versions
KR20220153099A (ko
Inventor
량 자오
신 자오
샹 리
산 류
Original Assignee
텐센트 아메리카 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/234,324 external-priority patent/US20200014919A1/en
Priority claimed from US16/240,388 external-priority patent/US10819977B2/en
Application filed by 텐센트 아메리카 엘엘씨 filed Critical 텐센트 아메리카 엘엘씨
Priority to KR1020247004585A priority Critical patent/KR20240024330A/ko
Publication of KR20220153099A publication Critical patent/KR20220153099A/ko
Application granted granted Critical
Publication of KR102638065B1 publication Critical patent/KR102638065B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

하드웨어 프로세서 또는 프로세서들로 하여금 복수의 참조 라인 중에서 인트라 예측을 수행하고, 비 제로 참조 라인들 중에서 인트라 예측의 현재 블록에 가장 가까운 제로 참조 라인에 대해 복수의 인트라 예측 모드를 설정하고, 및 비 제로 참조 라인들 중 하나에 대해 하나 이상의 최고 확률 모드를 설정하게 야기하도록 구성된 컴퓨터 코드를 포함하는 방법 및 장치가 포함된다.

Description

비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치 {METHODS AND APPARATUS FOR MULTIPLE LINE INTRA PREDICTION IN VIDEO COMPRESSION}
관련 출원의 상호참조
본 출원은 2019년 1월 4일에 출원된 미합중국 특허 출원 제16/240,388호(발명의 명칭: "METHODS AND APPARATUS FOR MULTIPLE LINE INTRA PREDICTION IN VIDEO COMPRESSION")의 우선권의 이익을 주장하며, 이 출원은 2018년 12월 27일에 출원된 미합중국 특허 출원 제16/234,324호의 연속 출원이고, 후자의 출원은 2018년 7월 5일자로 출원된 가출원 US 62/694,132에 대해 우선권을 주장한다. 위의 출원(들) 각각은 본 출원에 그 전체가 참조에 의해 명시적으로 이로써 통합된다.
본 개시내용은 HEVC를 뛰어넘는 차세대 비디오 코딩 기술에 관한 것으로, 더 구체적으로는, 예를 들어, 다중의 참조 라인을 사용하는 인트라 예측 스킴에 대한 개선에 관한 것이다.
2013년에 비디오 코딩 표준 HEVC(High Efficiency Video Coding) 메인 프로파일이 완성되었다. 그 이후에 곧바로, 국제 표준 기관, ITU-T VCEG(Q6/16) 및 ISO/IEC MPEG(JTC1/SC29/WG11)는, 현재의 HEVC 표준(현재의 확장을 포함함)과 비교하여 압축 능력을 현저하게 향상시킬 잠재성을 가진 미래의 비디오 코딩 표준을 개발하기 위한 필요를 탐구하기 시작하였다. 그룹들은, 이 분야에서 그들의 전문가들에 의해 제안된 압축 기술 설계들을 평가하기 위해 JVET(Joint Video Exploration Team)로서 알려진 공동 협력 작업에서 이러한 탐구 활동에 대해 함께 작업하고 있다. JEM(Joint Exploration Model)은 HEVC의 능력을 뛰어넘는 비디오 코딩 기술들을 탐색하기 위해 JVET에 의해 개발되었고, JEM의 현재의 최신 버전은 JEM-7.1이다.
ITU-T VCEG(Q6/16) 및 ISO/IEC MPEG(JTC 1/SC 29/WG 11)은 2013(버전 1) 2014(버전 2) 2015(버전 3) 및 2016(버전 4)년에 H.265/HEVC(High Efficiency Video Coding) 표준을 공개했다. 그 이후로, 이들은 HEVC 표준(그 확장들을 포함함)의 것을 현저히 초과하는 압축 능력을 가진 미래의 비디오 코딩 기술의 표준화에 대한 잠재적 필요성을 연구해 오고 있다. 2017년 10월에, 이들은 HEVC를 뛰어넘는 능력을 갖는 비디오 압축에 대한 공동 제안 요청서(CfP)를 발행했다. 2018년 2월 15일자로, 표준 동적 범위(SDR)에 대한 총 22개의 CfP 응답, 높은 동적 범위(HDR)에 대한 12개의 CfP 응답, 및 360개의 비디오 범주에 대한 12개의 CfP 응답이 제각기 제출되었다. 2018년 4월에, 모든 접수된 CfP 응답들은 122 MPEG / 10th JVET(Joint Video Exploration Team - Joint Video Expert Team) 회의에서 평가되었다. 주의 깊은 평가에 의해, JVET는 HEVC를 뛰어넘는 차세대 비디오 코딩의 표준, 예를 들어, 소위 다용도 비디오 코딩(VVC: Versatile Video Coding)을 공식적으로 론칭하였다. VTM(VVC Test Model)의 현재 버전은, 즉, VTM1이다.
다중의 라인이 이용가능하더라도, 본 기술분야의 다양한 기술적 문제가 존재한다. 예를 들어, 제1 참조 라인이 여전히 가장 많이 선택된 라인이라는 것이 발견되는 기술적 문제가 있다. 그러나, 제1 참조 라인을 갖는 각각의 블록은 현재 블록의 라인 인덱스를 표시하기 위해 하나의 빈(bin)을 항상 시그널링할 필요가 있다.
또한, 다중 라인 인트라 예측은 루마 인트라 예측(luma intra prediction)에만 적용된다. 크로마 성분(chroma component)과의 다중 라인 인트라 예측의 잠재적 코딩 이득은 활용되지 않는다.
또한, 상이한 라인 인덱스들을 갖는 참조 샘플들은 상이한 특성들을 가질 수 있는데, 그에 의해 상이한 참조 라인들에 대해 동일한 수의 인트라 예측 모드들을 설정하는 것이 최적이 아니게 된다.
또한, 다중 라인 인트라 예측에 대해, 다중의 이웃 라인들의 픽셀들이 저장되고 액세스되었다; 그러나, 현재 라인에서의 픽셀들을 평활화(smooth)하기 위해 이웃 라인들에서의 픽셀들이 활용되지 않는다.
또한, 다중 라인 인트라 예측에 대해, 인코더는 현재 블록에서 픽셀 값들을 예측하기 위해 하나의 참조 라인을 선택한다; 그러나, 현재 블록에서 샘플들을 예측하기 위해 이웃 픽셀들의 변화 추세가 활용되지 않는다.
또한, 다중 라인 인트라 예측에 대해, 수 > 1에 대한 어떤 평면 또는 DC 모드도 없다. DC 또는 평면 모드의 다른 버전들의 탐색은 완전히 활용되지 않는다.
또한, 다중 라인 참조 픽셀들이 인트라 예측에 적용된다; 그러나, 이들이 참조 픽셀들을 사용하는 다른 장소들도 존재하지만, 다중 라인 참조 픽셀들의 코딩 이득은 활용되지 않는다.
따라서, 이러한 문제에 대한 기술적 해결책이 요구된다.
컴퓨터 프로그램 코드를 저장하도록 구성된 메모리, 및 컴퓨터 프로그램 코드에 액세스하고 컴퓨터 프로그램 코드에 의해 지시되는 바와 같이 동작하도록 구성된 하드웨어 프로세서 또는 프로세서들을 포함하는 방법 및 장치가 포함된다. 컴퓨터 프로그램은, 프로세서로 하여금 비디오 시퀀스의 복수의 참조 라인 중에서 인트라 예측을 수행함으로써 비디오 시퀀스를 코딩 또는 디코딩하게 야기하도록 구성된 인트라 예측 코드, 프로세서로 하여금 복수의 비 제로(non-zero) 참조 라인 중에서 인트라 예측의 현재 블록에 가장 가까운, 제로 참조 라인, 제1 참조 라인에 대해 복수의 인트라 예측 모드들을 설정하게 야기하도록 구성된 인트라 예측 모드 코드, 및 프로세서로 하여금 비 제로 참조 라인들 중 제2 참조 라인에 대한 적어도 하나의 최고 확률 모드(most probable mode, MPM)를 설정하게 야기하도록 구성된 최고 확률 모드 코드를 포함한다. 본원에서 사용되는 "복수의"는 2개 이상을 의미한다.
예시적인 실시예들에 따르면, 프로그램 코드는, 프로세서로 하여금, 최고 확률 모드 플래그 및 인트라 모드를 시그널링하기 전에 참조 라인 인덱스를 시그널링하고, 참조 라인 인덱스가 시그널링되고 또한 시그널링된 인덱스가 제로 참조 라인을 표시한다고 결정한 것에 응답하여 최고 확률 모드 플래그를 시그널링하고, 그리고 참조 라인 인덱스가 시그널링되고 또한 시그널링된 인덱스가 비 제로 참조 라인들 중 적어도 하나를 표시하는 것으로 결정한 것에 응답하여, 최고 확률 모드 플래그를 시그널링하지 않고서, 최고 확률 모드 플래그가 참인 것을 도출하고, 및 현재 블록의 최고 확률 모드 인덱스를 시그널링하도록 야기하게 구성된 시그널링 코드를 추가로 포함한다.
예시적인 실시예들에 따르면, 최고 확률 모드 코드는 프로세서로 하여금 최고 확률 모드 리스트에 적어도 하나의 최고 확률 모드를 포함하고, 및 최고 확률 모드 리스트로부터 평면 모드 및 DC 모드를 제외하게 야기하도록 추가로 구성된다.
예시적인 실시예들에 따르면, 최고 확률 모드 코드는 프로세서로 하여금, 최고 확률 모드 리스트의 길이가 적어도 하나의 최고 확률 모드의 수를 포함하도록 참조 라인 인덱스 값에 기초하여 최고 확률 모드 리스트의 길이를 설정하게 야기하도록 추가로 구성된다.
예시적인 실시예들에 따르면, 최고 확률 모드 코드는 프로세서로 하여금, 비 제로 참조 라인을 검출한 것에 응답하여 최고 확률 모드 리스트의 길이를 1 또는 4에 설정하고, 그리고 현재 참조 라인이 제로 참조 라인인 것을 결정한 것에 응답하여, 최고 확률 모드 리스트의 길이를 3 또는 6에 설정하게 야기하도록 추가로 구성된다.
예시적인 실시예들에 따르면, 최고 확률 모드 코드는 프로세서로 하여금, 비 제로 참조 라인을 검출한 것에 응답하여, 최고 확률 모드 리스트의 길이가 5개의 최고 확률 모드로 구성되도록 설정하게 야기하도록 추가로 구성된다.
예시적인 실시예들에 따르면, 비 제로 참조 라인들 중 하나는 현재 블록에 대한 이웃 라인이고, 제로 참조 라인보다 현재 블록으로부터 더 멀리 떨어져 있다.
예시적인 실시예들에 따르면, 적어도 하나의 최고 확률 모드는 가장 낮은 레벨의 최고 확률 모드로부터 가장 높은 레벨의 최고 확률 모드까지의 임의의 레벨의 최고 확률 모드를 포함한다.
예시적인 실시예들에 따르면, 적어도 하나의 최고 확률 모드는 비 제로 참조 라인에 대해 허용되는 최고 확률 모드들의 레벨들만을 포함한다.
개시된 주제의 추가적인 특징들, 성질, 및 다양한 장점들은 다음의 상세한 설명 및 첨부 도면들로부터 더 명백해질 것이다.
도 1은 본원 개시의 실시예에 따른 통신 시스템(100)의 간략화된 블록도를 도시한다.
도 2는 개시된 청구 대상에 대한 응용예로써, 스트리밍 환경에서의 비디오 인코더 및 디코드의 배치를 도시한다.
도 3은 본원 발명의 실시예에 따른 비디오 디코더의 기능적 블록도일 수 있다.
도 4는 본원 개시의 실시예에 따른 비디오 인코더의 기능적 블록도일 수 있다.
도 5는 HEVC 및 JEM에서 사용되는 인트라 예측 모드들을 도시한다
도 6은 인트라 방향성 모드들을 위해 이용되는 N개의 참조 계층을 도시한다.
도 7은 하나의 4x4 블록 내부의 (0, 0) 및 (1, 0) 위치들에 대한 가중치들(wL, wT, wTL)이 도시된 다이어그램(700)을 도시한다.
도 8은 로컬 조명 보상(Local Illumination Compensation, LIC) 다이어그램을 도시한다.
도 9는 실시예들에 따른 흐름도를 도시한다.
도 10은 실시예들에 따른 흐름도를 도시한다.
도 11은 실시예들에 따른 흐름도를 도시한다.
도 12는 실시예들에 따른 흐름도를 도시한다.
도 13은 실시예들에 따른 흐름도를 도시한다.
도 14는 실시예들에 따른 흐름도를 도시한다.
도 15는 실시예들에 따른 다이어그램의 개략 예시이다.
도 16은 실시예들에 따른 흐름도를 도시한다.
도 17은 실시예들에 따른 흐름도를 도시한다.
도 18은 실시예들에 따른 흐름도를 도시한다.
도 19는 실시예들에 따른 흐름도를 도시한다.
도 20은 실시예들에 따른 흐름도를 도시한다.
도 21은 실시예들에 따른 흐름도를 도시한다.
도 22는 실시예들에 따른 흐름도를 도시한다.
도 23은 실시예들에 따른 흐름도를 도시한다.
도 24는 실시예에 따른 현재 블록 유닛의 모든 이웃 블록들의 개략도이다.
도 25는 실시예들에 따른 흐름도를 도시한다.
도 26은 개시된 청구 대상에 대한 소정의 실시예들을 구현하기에 적합한 컴퓨터 시스템을 도시한다.
이하에 논의되는 제안된 특징들은 개별적으로 사용되거나 임의의 순서로 조합될 수 있다. 또한, 실시예들은 처리 회로(예를 들어, 적어도 하나의 프로세서 또는 적어도 하나의 집적 회로)에 의해 구현될 수 있다. 일 예에서, 적어도 하나의 프로세서는 비일시적 컴퓨터 판독가능 매체에 저장되는 프로그램을 실행한다. 본 개시내용에서, 최고 확률 모드(MPM)는 1차 MPM, 2차 MPM, 또는 1차 및 2차 MPM 둘 다를 지칭할 수 있다.
도 1은 본 개시내용의 일 실시예에 따른 통신 시스템(100)의 간략화된 블록도를 예시한다. 통신 시스템(100)은 네트워크(105)를 통해 상호접속된 적어도 2개의 단말기(102 및 103)를 포함할 수 있다. 데이터의 단방향 송신을 위해, 제1 단말기(103)는 네트워크(105)를 통해 다른 단말기(102)로 송신하기 위해 비디오 데이터를 로컬 위치에서 코딩할 수 있다. 제2 단말기(102)는 네트워크(105)로부터 다른 단말기의 코딩된 비디오 데이터를 수신할 수 있고, 코딩된 데이터를 디코딩할 수 있고, 복구된 비디오 데이터를 디스플레이할 수 있다. 단방향 데이터 송신은 미디어 서빙 애플리케이션들 등에서 흔한 것일 수 있다.
도 1은, 예를 들어, 화상 회의 동안 발생할 수 있는 코딩된 비디오의 양방향 송신을 지원하기 위해 제공되는 제2 쌍의 단말기들(101 및 104)을 예시한다. 데이터의 양방향 송신을 위해, 각각의 단말기(101 및 104)는 네트워크(105)를 통한 다른 단말기로의 송신을 위해 로컬 위치에서 캡처된 비디오 데이터를 코딩할 수 있다. 각각의 단말기(101 및 104)는 또한 다른 단말기에 의해 송신된 코딩된 비디오 데이터를 수신할 수 있고, 코딩된 데이터를 디코딩할 수 있고, 복구된 비디오 데이터를 로컬 디스플레이 디바이스에 디스플레이할 수 있다.
도 1에서, 단말기들(101, 102, 103 및 104)은 서버들, 개인용 컴퓨터들 및 스마트폰들로서 예시될 수 있지만, 본 개시내용의 원리들은 그것들에만 제한되지는 않는다. 본 개시내용의 실시예들은 랩톱 컴퓨터들, 태블릿 컴퓨터들, 미디어 플레이어들 및/또는 전용 화상 회의 장비를 이용한 응용 분야를 갖는다. 네트워크(105)는, 예를 들어, 유선 및/또는 무선 통신 네트워크들을 포함하는, 단말기들(101, 102, 103 및 104) 사이에서 코딩된 비디오 데이터를 운반하는 임의 수의 네트워크들을 나타낸다. 통신 네트워크(105)는 회선 교환형(circuit-switched) 및/또는 패킷 교환형(packet-switched) 채널들로 데이터를 교환할 수 있다. 대표적인 네트워크들은 원거리 통신(telecommunications) 네트워크들, 로컬 영역 네트워크들, 광역 네트워크들 및/또는 인터넷을 포함한다. 본 논의의 목적을 위해, 네트워크(105)의 아키텍처 및 토폴로지는 이하의 본 명세서에서 설명되지 않는 한 본 개시내용의 동작에 중요하지 않을 수 있다.
도 2는, 개시된 주제를 위한 응용에 대한 예로서, 스트리밍 환경에서 비디오 인코더 및 디코더를 배치하는 것을 예시한다. 개시된 주제는, 예를 들어, 비디오 회의, 디지털 TV, CD, DVD, 메모리 스틱 등을 포함하는 디지털 미디어 상의 압축 비디오의 저장 등을 포함하는 다른 비디오 인에이블 응용들에 동등하게 적용가능할 수 있다.
스트리밍 시스템은, 예를 들어, 압축되지 않은 비디오 샘플 스트림(213)을 생성하는 비디오 소스(201), 예를 들어, 디지털 카메라를 포함할 수 있는 캡처 서브시스템(203)을 포함할 수 있다. 인코딩된 비디오 비트스트림들과 비교할 때 높은 데이터 볼륨을 강조하기 위해 굵은 선으로 묘사된 샘플 스트림(213)은 카메라(201)에 결합된 인코더(202)에 의해 처리될 수 있다. 인코더(202)는 이하에서 더 상세히 설명되는 바와 같이 개시된 주제의 양태들을 가능하게 하거나 구현하기 위한 하드웨어, 소프트웨어, 또는 이들의 조합을 포함할 수 있다. 샘플 스트림과 비교할 때 더 낮은 데이터 볼륨을 강조하기 위한 얇은 선으로서 묘사된 인코딩된 비디오 비트스트림(204)은 미래의 사용을 위해 스트리밍 서버(205)상에 저장될 수 있다. 적어도 하나의 스트리밍 클라이언트(212 및 207)는 스트리밍 서버(205)에 액세스하여 인코딩된 비디오 비트스트림(204)의 사본들(208 및 206)을 검색할 수 있다. 클라이언트(212)는 인코딩된 비디오 비트스트림(208)의 인커밍 사본을 디코딩하고 디스플레이(209) 또는 다른 렌더링 디바이스(묘사되지 않음)상에 렌더링될 수 있는 아웃고잉 비디오 샘플 스트림(210)을 생성하는 비디오 디코더(211)를 포함할 수 있다. 일부 스트리밍 시스템에서, 비디오 비트스트림들(204, 206 및 208)은 특정 비디오 코딩/압축 표준에 따라 인코딩될 수 있다. 이러한 표준들의 예들은 위에서 언급되었고 본 명세서에서 더 설명된다.
도 3은 본 발명의 실시예에 따른 비디오 디코더(300)의 기능 블록도이다.
수신기(302)는 디코더(300)에 의해 디코딩될 적어도 하나의 코덱 비디오 시퀀스를 수신할 수 있다; 동일한 또는 또 다른 실시예에서, 한 번에 하나의 코딩된 비디오 시퀀스이고, 여기서 각각의 코딩된 비디오 시퀀스의 디코딩은 다른 코딩된 비디오 시퀀스들과 독립적이다. 코딩된 비디오 시퀀스는 인코딩된 비디오 데이터를 저장하는 저장 디바이스에 대한 하드웨어/소프트웨어 링크일 수 있는 채널(301)로부터 수신될 수 있다. 수신기(302)는 그들의 제각기 사용 엔티티들(묘사되지 않음)에 포워딩될 수 있는 다른 데이터, 예를 들어, 코딩된 오디오 데이터 및/또는 보조 데이터 스트림들과 함께 인코딩된 비디오 데이터를 수신할 수 있다. 수신기(302)는 코딩된 비디오 시퀀스를 다른 데이터로부터 분리할 수 있다. 네트워크 지터를 방지하기 위해, 버퍼 메모리(303)가 수신기(302)와 엔트로피 디코더/파서(304)(이후로 "파서(parser)") 사이에 결합될 수 있다. 수신기(302)가 충분한 대역폭 및 제어가능성의 저장/포워드 디바이스로부터 또는 동기 네트워크(isosychronous network)로부터 데이터를 수신할 때, 버퍼(303)는 필요하지 않을 수 있거나 작을 수 있다. 인터넷과 같은 베스트 에포트 패킷 네트워크들상에서 사용하기 위해, 버퍼(303)가 요구될 수 있고, 비교적 클 수 있고, 유리하게는 적응적 크기를 가질 수 있다.
비디오 디코더(300)는 엔트로피 코딩된 비디오 시퀀스로부터 심벌들(313)을 재구성하기 위한 파서(304)를 포함할 수 있다. 이들 심벌들의 카테고리들은 디코더(300)의 동작을 관리하기 위해 사용되는 정보, 및 디코더의 일체 부분(integral part)은 아니지만 그에 결합될 수 있는 디스플레이(312)와 같은 렌더링 디바이스를 제어하기 위한 잠재적인 정보를 포함한다. 렌더링 디바이스(들)에 대한 제어 정보는 SEI 메시지들(Supplementary Enhancement Information) 또는 VUI(Video Usability Information) 파라미터 세트 프래그먼트들(묘사되지 않음)의 형태일 수 있다. 파서(304)는 수신된 코딩된 비디오 시퀀스를 파싱/엔트로피 디코딩할 수 있다. 코딩된 비디오 시퀀스의 코딩은 비디오 코딩 기술 또는 표준에 따를 수 있고, 가변 길이 코딩, 허프만 코딩, 맥락 민감성(context sensitivity)을 갖거나 갖지 않는 산술 코딩 등을 포함하는 본 기술분야의 통상의 기술자에게 잘 알려진 원리들을 따를 수 있다. 파서(304)는, 코딩된 비디오 시퀀스로부터, 그룹에 대응하는 적어도 하나의 파라미터에 기초하여, 비디오 디코더에서의 픽셀들의 서브그룹들 중 적어도 하나에 대한 서브그룹 파라미터들의 세트를 추출할 수 있다. 서브그룹들은 화상 그룹들(Groups of Pictures, GOP들), 화상들, 타일들, 슬라이스들, 매크로블록들, 코딩 유닛들(CU들), 블록들, 변환 유닛들(TU들), 예측 유닛들(PU들) 등을 포함할 수 있다. 엔트로피 디코더/파서는 또한 코딩된 비디오 시퀀스로부터 변환 계수들, 양자화기 파라미터 값들, 움직임 벡터들 등과 같은 정보를 추출할 수 있다.
파서(304)는 버퍼(303)로부터 수신된 비디오 시퀀스에 대해 엔트로피 디코딩/파싱 동작을 수행하여, 심벌들(313)을 생성할 수 있다. 파서(304)는 인코딩된 데이터를 수신하고, 특정 심벌들(313)을 선택적으로 디코딩할 수 있다. 또한, 파서(304)는 특정 심벌들(313)이 움직임 보상 예측 유닛(306), 스케일러/역변환 유닛(305), 인트라 예측 유닛(307), 또는 루프 필터(311)에 제공될 것인지를 결정할 수 있다.
심벌들(313)의 재구성은 코딩된 비디오 화상 또는 그의 부분들(예를 들어, 인터 및 인트라 화상, 인터 및 인트라 블록), 및 다른 인자들의 타입에 의존하여 다중의 상이한 유닛을 수반할 수 있다. 어느 유닛들이 수반되는지, 및 어떻게 수반되는지는 파서(304)에 의해 코딩된 비디오 시퀀스로부터 파싱된 서브그룹 제어 정보에 의해 제어될 수 있다. 파서(304)와 이하의 다중 유닛 사이의 이러한 서브그룹 제어 정보의 흐름은 명료성을 위해 묘사되지 않는다.
이미 언급된 기능 블록들 이외에, 디코더(200)는 이하에 설명되는 바와 같이 다수의 기능 유닛으로 개념적으로 세분될 수 있다. 상업적 제약 하에서 동작하는 실제 구현에서, 이러한 유닛들 중 다수는 서로 밀접하게 상호작용하고, 적어도 부분적으로 서로 통합될 수 있다. 그러나, 개시된 주제를 설명하기 위해, 이하의 기능 유닛들로의 개념적 세분이 적절하다.
제1 유닛은 스케일러/역변환 유닛(305)이다. 스케일러/역변환 유닛(305)은, 파서(304)로부터의 심벌(들)(313)로서, 어느 변환을 사용할지, 블록 크기, 양자화 인자, 양자화 스케일링 행렬들 등을 포함하여, 제어 정보뿐만 아니라 양자화된 변환 계수를 수신한다. 그것은 집계기(aggregator)(310)에 입력될 수 있는 샘플 값들을 포함하는 블록들을 출력할 수 있다.
일부 경우들에서, 스케일러/역변환(305)의 출력 샘플들은 인트라 코딩된 블록에 관한 것일 수 있다; 즉, 이전에 재구성된 화상들로부터의 예측 정보를 이용하는 것이 아니고, 현재 화상의 이전에 재구성된 부분들로부터의 예측 정보를 이용할 수 있는 블록. 이러한 예측 정보는 인트라 화상 예측 유닛(307)에 의해 제공될 수 있다. 일부 경우들에서, 인트라 화상 예측 유닛(307)은 현재 (부분적으로 재구성된) 화상(309)으로부터 페치된 주위의 이미 재구성된 정보를 이용하여, 재구성 하에 있는 블록의 동일한 크기 및 형상의 블록을 생성한다. 집계기(310)는, 일부 경우들에서, 샘플당 기준으로, 인트라 예측 유닛(307)이 생성한 예측 정보를 스케일러/역변환 유닛(305)에 의해 제공된 출력 샘플 정보에 추가한다.
다른 경우들에서, 스케일러/역변환 유닛(305)의 출력 샘플들은 인터 코딩된 및 잠재적으로 움직임 보상된 블록에 관한 것일 수 있다. 이러한 경우에, 움직임 보상 예측 유닛(306)은 참조 화상 메모리(308)에 액세스하여 예측을 위해 사용되는 샘플들을 페치할 수 있다. 블록에 관련된 심벌들(313)에 따라 페치된 샘플들을 움직임 보상한 후에, 이들 샘플은 집계기(310)에 의해 스케일러/역변환 유닛의 출력(이 경우 잔차 샘플들 또는 잔차 신호라고 불림)에 추가되어 출력 샘플 정보를 생성할 수 있다. 움직임 보상 유닛이 예측 샘플들을 페치하는 참조 화상 메모리 내의 어드레스들은, 예를 들어 X, Y, 및 참조 화상 컴포넌트들을 가질 수 있는 심벌들(313)의 형식으로 움직임 보상 예측 유닛에 이용가능한 움직임 벡터들에 의해 제어될 수 있다. 움직임 보상은 또한 서브샘플 정확한 움직임 벡터들이 사용 중일 때 참조 화상 메모리로부터 페치된 샘플 값들의 보간, 움직임 벡터 예측 메커니즘 등을 포함할 수 있다.
집계기(310)의 출력 샘플들은 루프 필터 유닛(311)에서의 다양한 루프 필터링 기법들에 종속될 수 있다. 비디오 압축 기술들은 코딩된 비디오 비트스트림에 포함된 파라미터들에 의해 제어되고 파서(304)로부터의 심벌들(313)로서 루프 필터 유닛(311)에 이용가능하게 되는 인-루프 필터(in-loop filter) 기술들을 포함할 수 있지만, 코딩된 화상 또는 코딩된 비디오 시퀀스의 이전(디코딩 순서로) 부분들의 디코딩 동안 획득된 메타-정보에 응답할 뿐만 아니라, 이전에 재구성된 및 루프-필터링된 샘플 값들에 응답할 수도 있다.
루프 필터 유닛(311)의 출력은 렌더링 디바이스(312)에 출력될 뿐만 아니라 미래의 인터-화상 예측에서 사용하기 위해 참조 화상 메모리(557)에 저장될 수도 있는 샘플 스트림일 수 있다.
특정 코딩된 화상들은, 완전히 재구성되면, 미래 예측을 위한 참조 화상들로서 사용될 수 있다. 코딩된 화상이 완전히 재구성되고 코딩된 화상이 참조 화상으로서 식별되면(예를 들어, 파서(304)에 의해), 현재 화상 버퍼(309)는 참조 화상 버퍼(308)의 일부가 될 수 있고, 다음의 코딩된 화상의 재구성을 개시하기 전에 새로운 현재 화상 버퍼가 재할당될 수 있다.
비디오 디코더(300)는 ITU-T Rec. H.265와 같은 표준에서 문서화될 수 있는 미리 결정된 비디오 압축 기술에 따라 디코딩 동작들을 수행할 수 있다. 코딩된 비디오 시퀀스는, 이것이 비디오 압축 기술 문서 또는 표준 및 구체적으로 그 가운데 프로파일 문서에 특정된 대로 비디오 압축 기술 또는 표준의 구문(syntax)을 고수한다는 점에서, 사용되는 비디오 압축 기술 또는 표준에 의해 특정된 구문을 따를 수 있다. 또한 준수를 위해 필요한 것은 코딩된 비디오 시퀀스의 복잡성이 비디오 압축 기술 또는 표준의 레벨에 의해 정의된 경계 내에 있는 것일 수 있다. 일부 경우들에서, 레벨들은 최대 화상 크기, 최대 프레임 레이트, 최대 재구성 샘플 레이트(예를 들어, 초당 메가샘플수로 측정됨), 최대 참조 화상 크기 등을 제한한다. 레벨들에 의해 설정된 한계들은, 일부 경우들에서, HRD(Hypothetical Reference Decoder) 사양들 및 코딩된 비디오 시퀀스에서 시그널링된 HRD 버퍼 관리를 위한 메타데이터를 통해 추가로 제한될 수 있다.
실시예에서, 수신기(302)는 인코딩된 비디오와 함께 추가적인(중복) 데이터를 수신할 수 있다. 추가 데이터는 코딩된 비디오 시퀀스(들)의 일부로서 포함될 수 있다. 이 추가적인 데이터는 데이터를 적절히 디코딩하고 및/또는 원래의 비디오 데이터를 더 정확하게 재구성하기 위해 비디오 디코더(300)에 의해 사용될 수 있다. 추가적인 데이터는 예를 들어, 시간, 공간, 또는 신호 잡음 비(SNR) 향상 계층들, 중복 슬라이스들, 중복 화상들, 순방향 오류 정정 코드들 등의 형식일 수 있다.
도 4는 본 개시내용의 실시예에 따른 비디오 인코더(400)의 기능 블록도이다.
인코더(400)는 인코더(400)에 의해 코딩될 비디오 이미지(들)를 캡처할 수 있는 비디오 소스(401)(인코더의 일부가 아님)로부터 비디오 샘플들을 수신할 수 있다.
비디오 소스(401)는, 임의의 적합한 비트 심도(예를 들어: 8 비트, 10 비트, 12 비트,...), 임의의 색공간(예를 들어, BT.601 Y CrCB, RGB,...), 및 임의의 적합한 샘플링 구조(예를 들어, Y CrCb 4:2:0, Y CrCb 4:4:4)일 수 있는 디지털 비디오 샘플 스트림의 형식으로 인코더(303)에 의해 코딩될 소스 비디오 시퀀스를 제공할 수 있다. 미디어 서빙 시스템에서, 비디오 소스(401)는 이전에 준비된 비디오를 저장하는 저장 디바이스일 수 있다. 영상 회의 시스템에서, 비디오 소스(401)는 비디오 시퀀스로서 로컬 이미지 정보를 캡처하는 카메라일 수 있다. 비디오 데이터는 순차적으로 볼 때 움직임을 부여하는 복수의 개별 화상들로서 제공될 수 있다. 화상들 자체는 픽셀들의 공간 어레이로서 조직될 수 있고, 여기서 각각의 픽셀은 사용 중인 샘플링 구조, 색공간 등에 의존하여 적어도 하나의 샘플을 포함할 수 있다. 본 기술분야의 통상의 기술자는 픽셀들과 샘플들 사이의 관계를 쉽게 이해할 수 있다. 이하의 설명은 샘플들에 초점을 맞춘다.
실시예에 따르면, 인코더(400)는 소스 비디오 시퀀스의 화상들을 실시간으로 또는 응용에 의해 요구되는 임의의 다른 시간 제약들 하에서 코딩된 비디오 시퀀스(410)로 코딩 및 압축할 수 있다. 적절한 코딩 속도를 시행하는 것은 컨트롤러(402)의 하나의 기능이다. 컨트롤러는 후술하는 바와 같이 다른 기능 유닛들을 제어하고, 이들 유닛들에 기능적으로 결합된다. 결합은 명료성을 위해 묘사되지 않는다. 컨트롤러에 의해 설정된 파라미터들은 레이트 제어 관련 파라미터들(화상 스킵, 양자화기, 레이트-왜곡 최적화 기법들의 람다 값들, ...), 화상 크기, 화상 그룹(GOP) 레이아웃, 최대 움직임 벡터 검색 범위 등을 포함할 수 있다. 본 기술분야의 통상의 기술자는 컨트롤러(402)의 다른 기능들을 용이하게 식별할 수 있는데, 그 이유는 이들이 특정 시스템 설계를 위해 최적화된 비디오 인코더(400)에 관련될 수 있기 때문이다.
일부 비디오 인코더들은 본 기술분야의 통상의 기술자가 "코딩 루프"로서 용이하게 인식하는 것에서 동작한다. 과도하게 단순화된 설명으로서, 코딩 루프는 인코더(402)(이후 "소스 코더")(코딩될 입력 화상, 및 참조 화상(들)에 기초하여 심벌들을 생성하는 것을 담당함)의 인코딩 부분, 및 심벌들과 코딩된 비디오 비트스트림 사이의 임의의 압축이 개시된 주제에서 고려되는 비디오 압축 기술들에서 무손실이므로) (원격) 디코더가 또한 생성할 샘플 데이터를 생성하기 위해 심벌들을 재구성하는 인코더(400)에 임베드된 (로컬) 디코더(406)로 구성될 수 있다. 재구성된 샘플 스트림은 참조 화상 메모리(405)에 입력된다. 심벌 스트림의 디코딩이 디코더 위치(로컬 또는 원격)와는 독립적으로 비트-정확한 결과들을 야기하기 때문에, 참조 화상 버퍼 콘텐츠는 또한 로컬 인코더와 원격 인코더 사이에서 비트 정확하다. 다시 말해서, 인코더의 예측 부분은 디코딩 동안 디코딩 동안 예측을 사용할 때 디코더가 "보는" 것과 정확히 동일한 샘플 값들을 참조 화상 샘플들로서 "본다". 참조 화상 동기성의 이 기본적인 원리(그리고 결과적인 드리프트, 예를 들어, 채널 오류들 때문에 동기성이 유지될 수 없는 경우)는 본 기술분야의 통상의 기술자에게 잘 알려져 있다.
"로컬" 디코더(406)의 동작은 도 3과 관련하여 위에서 이미 상세히 설명된 "원격" 디코더(300)와 동일할 수 있다. 그러나, 또한 도 4를 잠시 참조하면, 심벌들이 이용가능하고 엔트로피 코더(408) 및 파서(304)에 의한 코딩된 비디오 시퀀스로의 심벌들의 인코딩/디코딩이 무손실일 수 있기 때문에, 채널(301), 수신기(302), 버퍼(303), 및 파서(304)를 포함하는, 디코더(300)의 엔트로피 디코딩 부분들은 로컬 디코더(406)에서 완전히 구현되지 않을 수 있다.
이 시점에서 이루어질 수 있는 관찰은, 디코더에 존재하는 파싱/엔트로피 디코딩을 제외한 임의의 디코더 기술이 또한 필연적으로, 대응하는 인코더에서, 실질적으로 동일한 기능 형식으로 존재할 필요가 있다는 점이다. 인코더 기술들의 설명은 포괄적으로 설명된 디코더 기술들의 역이기 때문에 축약될 수 있다. 특정 영역들만에만 더 상세한 설명이 요구되고 아래에 제공된다.
그 동작의 일부로서, 소스 코더(403)는 "참조 프레임들"로서 지정된 비디오 시퀀스로부터의 적어도 하나의 이전에 코딩된 프레임들을 참조하여 예측적으로 입력 프레임을 코딩하는 움직임 보상 예측 코딩을 수행할 수 있다. 이러한 방식으로, 코딩 엔진(407)은 입력 프레임의 픽셀 블록들과 입력 프레임에 대한 예측 참조(들)로서 선택될 수 있는 참조 프레임(들)의 픽셀 블록들 사이의 차이들을 코딩한다.
로컬 비디오 디코더(406)는 소스 코더(403)에 의해 생성된 심벌들에 기초하여 참조 프레임들로서 지정될 수 있는 프레임들의 코딩된 비디오 데이터를 디코딩할 수 있다. 코딩 엔진(407)의 동작들은 유리하게는 손실 프로세스들일 수 있다. 코딩된 비디오 데이터가 비디오 디코더(도 4에 도시되지 않음)에서 디코딩될 수 있는 경우, 재구성된 비디오 시퀀스는 전형적으로 일부 오류들을 갖는 소스 비디오 시퀀스의 복제본일 수 있다. 로컬 비디오 디코더(406)는 참조 프레임들에 대해 비디오 디코더에 의해 수행될 수 있는 디코딩 프로세스들을 복제하고, 재구성된 참조 프레임들이 참조 화상 캐시(405)에 저장되게 할 수 있다. 이러한 방식으로, 인코더(400)는 (송신 오류들이 없이) 원단(far-end) 비디오 디코더에 의해 획득될 재구성된 참조 화상으로서 공통 콘텐츠를 갖는 재구성된 참조 화상들의 사본들을 저장할 수 있다.
예측기(404)는 코딩 엔진(407)에 대한 예측 검색들을 수행할 수 있다. 즉, 코딩될 새로운 프레임에 대해, 예측기(404)는 새로운 화상들에 대한 적절한 예측 참조로서 역할할 수 있는 참조 화상 움직임 벡터들, 블록 형상들 등과 같은 특정 메타데이터 또는 샘플 데이터(후보 참조 픽셀 블록들로서)에 대해 참조 화상 메모리(405)를 검색할 수 있다. 예측기(404)는 적절한 예측 참조들을 찾기 위해 샘플 블록 바이 픽셀 블록(sample block-by-pixel block) 기준으로 동작할 수 있다. 일부 경우들에서, 예측기(404)에 의해 획득된 검색 결과들에 의해 결정된 바와 같이, 입력 화상은 참조 화상 메모리(405)에 저장된 다중의 참조 화상으로부터 인출된 예측 참조들을 가질 수 있다.
컨트롤러(402)는, 예를 들어, 비디오 데이터를 인코딩하기 위해 사용되는 파라미터들 및 서브그룹 파라미터들의 설정을 포함하는, 비디오 코더(403)의 코딩 동작들을 관리할 수 있다.
전술한 모든 기능 유닛의 출력은 엔트로피 코더(408)에서 엔트로피 코딩을 겪을 수 있다. 엔트로피 코더는, 예를 들어, 허프만 코딩, 가변 길이 코딩, 산술 코딩 등으로서 본 기술분야의 통상의 기술자에게 공지된 기술들에 따라 심벌들을 무손실 압축함으로써 다양한 기능 유닛들에 의해 생성된 심벌들을 코딩된 비디오 시퀀스로 변환한다.
송신기(409)는, 인코딩된 비디오 데이터를 저장할 저장 디바이스에 대한 하드웨어/소프트웨어 링크일 수 있는, 통신 채널(411)을 통한 송신을 준비하기 위해 엔트로피 코더(408)에 의해 생성된 코딩된 비디오 시퀀스(들)를 버퍼링할 수 있다. 송신기(409)는 비디오 코더(403)로부터의 코딩된 비디오 데이터를 송신될 다른 데이터, 예를 들어, 코딩된 오디오 데이터 및/또는 보조 데이터 스트림(소스들이 도시되지 않음)과 병합할 수 있다.
컨트롤러(402)는 인코더(400)의 동작을 관리할 수 있다. 코딩 동안, 컨트롤러(405)는 특정 코딩된 화상 타입을 각각의 코딩된 화상에 할당할 수 있는데, 이는 제각기 화상에 적용될 수 있는 코딩 기법들에 영향을 미칠 수 있다. 예를 들어, 화상들은 종종 이하의 프레임 타입들 중 하나로서 할당될 수 있다:
인트라 화상(I 화상)은 예측 소스로서 시퀀스에서의 임의의 다른 프레임을 사용하지 않고 코딩되고 디코딩될 수 있는 것일 수 있다. 일부 비디오 코덱들은, 예를 들어, 독립적인 디코더 리프레시(Independent Decoder Refresh) 화상들을 포함하는, 상이한 타입들의 인트라 화상들을 허용한다. 본 기술분야의 통상의 기술자는 I 화상들의 이러한 변형들 및 그들 제각기 응용들 및 특징들을 인식한다.
예측 화상(P 화상)은 각각의 블록의 샘플 값들을 예측하기 위해 많아야 하나의 움직임 벡터 및 참조 인덱스를 이용하여 인트라 예측 또는 인터 예측을 이용하여 코딩되고 디코딩될 수 있는 것일 수 있다.
양방향 예측 화상(B 화상)은 각각의 블록의 샘플 값들을 예측하기 위해 많아야 2개의 움직임 벡터 및 참조 인덱스를 이용하여 인트라 예측 또는 인터 예측을 이용하여 코딩되고 디코딩될 수 있는 것일 수 있다. 유사하게, 다중-예측 화상들은 단일 블록의 재구성을 위해 2개보다 많은 참조 화상 및 연관된 메타데이터를 사용할 수 있다.
소스 화상들은 일반적으로 복수의 샘플 블록(예를 들어, 각각 4x4, 8x8, 4x8, 또는 16x16 샘플들의 블록들)으로 공간적으로 세분될 수 있고 블록 바이 블록(block-by-block) 기준으로 코딩될 수 있다. 블록들은 블록들의 제각기 화상들에 적용되는 코딩 할당에 의해 결정된 다른(이미 코딩된) 블록들을 참조하여 예측적으로 코딩될 수 있다. 예를 들어, I 화상들의 블록들은 비예측적으로 코딩될 수 있거나, 또는 이들은 동일한 화상의 이미 코딩된 블록들을 참조하여 예측적으로 코딩될 수 있다(공간 예측 또는 인트라 예측). P 화상들의 픽셀 블록들은, 하나의 이전에 코딩된 참조 화상을 참조하여, 공간 예측을 통해 또는 시간 예측을 통해 비예측적으로 코딩될 수 있다. B 화상들의 블록들은, 하나 또는 2개의 이전에 코딩된 참조 화상을 참조하여 공간 예측을 통해 또는 시간 예측을 통해, 비예측적으로 코딩될 수 있다.
비디오 코더(400)는 ITU-T Rec. H.265와 같은 미리 결정된 비디오 코딩 기술 또는 표준에 따라 코딩 동작들을 수행할 수 있다. 그 동작에서, 비디오 코더(400)는 입력 비디오 시퀀스에서 시간적 및 공간 중복성을 이용하는 예측 코딩 동작들을 포함하는, 다양한 압축 동작들을 수행할 수 있다. 따라서, 코딩된 비디오 데이터는 사용 중인 비디오 코딩 기술 또는 표준에 의해 지정된 구문을 따를 수 있다.
실시예에서, 송신기(409)는 추가 데이터를 인코딩된 비디오와 함께 송신할 수 있다. 비디오 코더(403)는 코딩된 비디오 시퀀스의 일부로서 이러한 데이터를 포함할 수 있다. 추가적인 데이터는 시간/공간/SNR 향상 계층들, 중복 화상들 및 슬라이스들과 같은 다른 형식의 중복 데이터, SEI(Supplementary Enhancement Information) 메시지들, VUI(Visual Usability Information) 파라미터 세트 프래그먼트들 등을 포함할 수 있다.
도 5는 HEVC 및 JEM에서 사용되는 인트라 예측 모드들을 예시한다. 내추럴 비디오(natural video)에서 제시된 임의의 에지 방향들을 캡처하기 위해, 방향성 인트라 모드들의 수는, HEVC에서 사용되는 바와 같이, 33에서 65로 확장된다. HEVC 위의 JEM에서의 추가적인 방향성 모드들은 도 1b에서 점선 화살표들로서 묘사되고, 평면 및 DC 모드들은 동일하게 유지된다. 이러한 더 조밀한 방향성 인트라 예측 모드들은 모든 블록 크기들에 대해 그리고 루마 및 크로마 인트라 예측들 모두에 대해 적용된다. 도 5에 도시된 바와 같이, 홀수 인트라 예측 모드 인덱스와 연관된, 점선 화살표들에 의해 식별되는 방향성 인트라 예측 모드들은 홀수 인트라 예측 모드들로 불린다. 짝수 인트라 예측 모드 인덱스와 연관된, 실선 화살표들에 의해 식별된 방향성 인트라 예측 모드들은 심지어 인트라 예측 모드들로 불린다. 본 문서에서, 도 5에서 실선 또는 점선 화살표들로 표시된 바와 같은 방향성 인트라 예측 모드들은 각도 모드들로도 지칭된다.
JEM에서, 총 67개의 인트라 예측 모드가 루마 인트라 예측에 대해 사용된다. 인트라 모드를 코딩하기 위해, 크기 6의 MPM 리스트가 인접 블록들의 인트라 모드들에 기초하여 구축된다. 인트라 모드가 MPM 리스트로부터 없는 경우, 인트라 모드가 선택된 모드들에 속하는지를 표시하기 위해 플래그가 시그널링된다. JEM-3.0에서, 16개의 선택된 모드가 존재하며, 이것들은 매 4번째 각도 모드로서 균일하게 선택된다. JVET-D0114 및 JVET-G0060에서, 16개의 2차 MPM이 균일하게 선택된 모드들을 대체하기 위해 도출된다.
도 6은 인트라 방향성 모드를 위해 이용되는 N개의 참조 계층(tier)을 나타낸다. 블록 유닛(611), 세그먼트 A(601), 세그먼트 B(602), 세그먼트 C(603), 세그먼트 D(604), 세그먼트 E(605), 세그먼트 F(606), 제1 참조 계층(610), 제2 참조 계층(209), 제3 참조 계층(608), 및 제4 참조 계층(607)이 있다.
HEVC 및 JEM 둘 다뿐만 아니라 H.264/AVC와 같은 일부 다른 표준들에서, 현재 블록을 예측하기 위해 사용되는 참조 샘플들은 가장 가까운 참조 라인(행 또는 열)으로 제한된다. 다중의 참조 라인 인트라 예측의 방법에서, 후보 참조 라인들(행 또는 열들)의 수는 인트라 방향성 모드들에 대해 하나(즉, 가장 가까운 것)로부터 N까지 증가되고, 여기서 N은 1보다 크거나 같은 정수이다. 도 2는 다중 라인 인트라 방향성 예측 방법의 개념을 보여주기 위해 예로서 4x4 예측 유닛(PU)을 취한다. 인트라 방향성 모드는 예측자들을 생성하기 위해 N개의 참조 계층 중 하나를 임의로 선택할 수 있다. 다시 말해서, 예측자 p(x, y)는 참조 샘플들 S1, S2,..., 및 SN 중 하나로부터 생성된다. 플래그는 어느 참조 계층이 인트라 방향성 모드에 대해 선택되는지를 표시하기 위해 시그널링된다. N이 1에 설정되면, 인트라 방향성 예측 방법은 JEM2.0에서의 전통적인 방법과 동일하다. 도 6에서, 참조 라인들(610, 609, 608 및 607)은 상단 좌측 참조 샘플과 함께 6개의 세그먼트(601, 602, 603, 604, 605 및 606)로 구성된다. 본 문서에서, 참조 계층은 참조 라인이라고도 불린다. 현재 블록 유닛 내의 상단 좌측 픽셀의 좌표는 (0, 0)이고, 제1 참조 라인에서의 상단 좌측 픽셀은 (-1,-1)이다.
JEM에서, 루마 성분에 대해, 인트라 예측 샘플 생성을 위해 사용되는 이웃 샘플들은 생성 프로세스 전에 필터링된다. 필터링은 주어진 인트라 예측 모드 및 변환 블록 크기에 의해 제어된다. 인트라 예측 모드가 DC이거나 또는 변환 블록 크기가 4x4와 같다면, 이웃 샘플들은 필터링되지 않는다. 주어진 인트라 예측 모드와 수직 모드(또는 수평 모드) 사이의 거리가 미리 정의된 임계값보다 큰 경우, 필터링 프로세스가 인에이블된다. 이웃 샘플 필터링에 대해, [1, 2, 1] 필터 및 이중 선형 필터들이 사용된다.
위치 종속적 인트라 예측 조합(position dependent intra prediction combination, PDPC) 방법은 필터링된 경계 참조 샘플들과의 필터링되지 않은 경계 참조 샘플들 및 HEVC 스타일 인트라 예측의 조합을 호출하는 인트라 예측 방법이다. (x, y)에 위치된 각각의 예측 샘플 pred[x][y]는 다음과 같이 계산된다:
[수학식 2-1]
여기서, Rx,-1,R-1,y은 제각기 현재 샘플 (x, y)의 상단 및 좌측에 위치되는 필터링되지 않은 참조 샘플들을 나타내고, R-1,-1는 현재 블록의 상단 좌측 코너에 위치되는 필터링되지 않은 참조 샘플을 나타낸다. 가중치들은 아래와 같이 계산된다,
[수학식 2-2]
[수학식 2-3]
[수학식 2-4]
[수학식 2-5]
도 7은 하나의 4x4 블록 내부의 (0, 0) 및 (1, 0) 위치들에 대한 가중치들(wL, wT, wTL)이 도시된 다이어그램(700)을 예시한다.
도 8은 로컬 조명 보상(Local Illumination Compensation, LIC) 다이어그램(800)을 예시하고, 스케일링 인자 a 및 오프셋 b를 사용하여 조명 변화들에 대한 선형 모델에 기초한다. 그리고, 이것은 각각의 인터 모드 코딩된 코딩 유닛(CU)에 대해 적응적으로 인에이블되거나 디스에이블된다.
LIC가 CU에 적용되는 경우, 현재 CU의 이웃 샘플들 및 그들의 대응하는 참조 샘플들을 사용하여 파라미터들 a 및 b를 도출하기 위해 최소 제곱 에러 방법(least square error method)이 이용된다. 더 구체적으로, 도 8에 예시된 바와 같이, CU의 서브샘플링된 (2:1 서브샘플링) 이웃 샘플들 및 참조 화상에서의 대응하는 샘플들(현재 CU 또는 sub-CU의 움직임 정보에 의해 식별됨)이 사용된다. IC 파라미터들은 각각의 예측 방향에 대해 개별적으로 도출되고 적용된다.
CU가 병합 모드로 코딩될 때, LIC 플래그는 병합 모드에서의 움직임 정보 복사와 유사한 방식으로 이웃 블록들로부터 복사된다; 그렇지 않으면, LIC가 적용되는지 여부를 나타내기 위해 LIC 플래그가 CU에 대해 시그널링된다.
도 9는 예시적인 실시예들에 따른 흐름도(900)를 예시한다.
S901에서, 다중 라인 인트라 예측에 대해, 모든 블록들에 대해 동일한 수의 참조 계층을 설정하는 대신에, 각각의 블록에 대한 참조 계층의 수가 적응적으로 선택될 수 있다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
S902에서, 위/좌측 블록의 블록 크기들은 현재 블록의 참조 계층들의 수를 결정하기 위해 사용될 수 있다. 예를 들어, 위 및/또는 좌측 블록들의 크기가 MxN보다 큰 경우, 현재 블록에 대한 참조 계층들의 수는 L에 제한된다. M 및 N은 4, 8, 16, 32, 64, 128, 256 및 512일 수 있다. L은 1~8일 수 있다.
일 실시예에서, M 및/또는 N이 64 이상일 때, L은 1에 설정된다.
또 다른 실시예에서, 위의 후보 참조 행들의 수 대 좌측 후보 참조 열들의 수에 대한 비율은 블록 폭 대 블록 높이의 비율과 동일하다. 예를 들어, 현재 블록 크기가 MxN인 경우, 위의 후보 참조 행들 위의 수는 m이고 좌측 후보 참조 열들의 수는 n이고, M:N=m:n이다.
대안적으로, S903에서, 좌측 및 위의 블록들의 최종 계수들의 위치는 현재 블록에 대한 참조 계층들의 수를 결정하기 위해 사용될 수 있다. 예를 들어, 최종 계수의 위치가 위의 및/또는 좌측 블록들에 대한 제1 MxN 영역 내에 있는 경우, 현재 블록에 대한 참조 계층들의 수는 L에 제한되고(예를 들어, L은 1~ 8일 수 있음), M 및 N은 1~1024일 수 있다.
일 실시예에서, 위의 및/또는 좌측 블록들에 어떤 계수들도 없을 때, 현재 블록에 대한 참조 계층의 수는 1에 제한된다.
또 다른 실시예에서, 위의 및/또는 좌측 블록들의 계수들이 2x2 상단 좌측 영역 내에 있는 경우, 현재 블록에 대한 참조 계층들의 수는 1~2에 제한된다.
대안적으로, S904에서, 위의 및/또는 좌측 블록들에서의 참조 샘플들의 픽셀 값들은 현재 블록의 참조 계층들의 수를 결정하기 위해 사용될 수 있다. 예를 들어, 인덱스 Li를 가진 참조 라인과 인덱스 Lj (Li < Lj)를 가진 참조 라인 사이의 차이가 매우 작다면, 참조 라인 Lj 는 참조 라인 리스트로부터 제거될 것이다. Li 및 Lj는 1~8일 수 있다. 일부 경우들에서, 모든 참조 라인들 사이의 차이가 매우 작기 때문에, 번호 > 1을 갖는 참조 라인들은 모두 제거된다. 2개의 참조 라인 사이의 차이를 측정하는 방법은, 이에 제한되는 것은 아니지만, 그래디언트, SATD, SAD, MSE, SNR, 및 PSNR을 포함한다.
일 실시예에서, Li and Lj의 평균 SAD가 2보다 작은 경우, 참조 라인 Lj는 참조 라인 리스트로부터 제거된다.
대안적으로, S905에서, 위의 및/또는 좌측 모드 정보의 예측 모드는 현재 블록에 대한 참조 계층들의 수를 결정하기 위해 사용될 수 있다.
일 실시예에서, 위의 및/또는 좌측 블록들의 예측 모드가 스킵 모드인 경우, 현재 블록에 대한 참조 계층들의 수는 L에 제한된다. L은 1~8일 수 있다.
도 10은 예시적인 실시예들에 따른 흐름도(1000)를 예시한다.
S1001에서, 크로마의 참조 라인 인덱스는, 별개의 트리 또는 동일한 트리 모두에 대해, 루마로부터 도출될 수 있다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
S1002에서, 동일한 트리에 대해, 공동 위치된 루마 블록에 대한 참조 라인 인덱스가 ≥ 3인 경우, 현재 크로마 블록의 참조 라인 인덱스는 2에 설정된다. 그렇지 않은 경우, 현재 크로마 블록의 참조 라인 인덱스는 1에 설정된다.
S1003에서, 별개의 트리에 대해, 크로마 블록이 루마 성분에서의 하나의 블록만을 커버하는 경우, 참조 라인 인덱스 도출 알고리즘은 2.a와 동일하다. 크로마 블록이 루마 성분에서의 다중의 블록을 커버하는 경우, 참조 라인 인덱스 도출 알고리즘은 다음 중 하나일 수 있다:
루마 성분에서의 공동 위치된 블록들에 대해, 대부분의 블록들의 참조 라인 인덱스가 3 미만인 경우, 현재 크로마 블록에 대한 참조 라인 인덱스는 1로서 도출된다. 그렇지 않은 경우, 현재 크로마 블록에 대한 참조 라인 인덱스는 2로서 도출된다. 대다수를 측정하는 방법은 블록들의 영역 크기 및 블록들의 수를 포함할 수 있지만, 이것에만 제한되지는 않는다.
또는, 루마 성분에서의 공동 위치된 블록들에 대해, 하나의 블록의 참조 라인 인덱스가 3 이상인 경우, 현재 크로마 블록에 대한 참조 라인 인덱스는 2로서 도출된다. 그렇지 않은 경우, 현재 크로마 블록에 대한 참조 라인 인덱스는 1로서 도출된다.
대안적으로, 루마 성분에서의 공동 위치된 블록들에 대해, 대다수의 블록들의 참조 라인 인덱스가 3보다 작은 경우, 현재 크로마 블록에 대한 참조 라인 인덱스는 1로서 도출된다. 그렇지 않은 경우, 현재 크로마 블록에 대한 참조 라인 인덱스는 2로서 도출된다.
대안적으로, S1004에서, 적응적 선택을 사용할지 여부가 고려되고, 만일 그렇다면, 도 9의 방법들은 또한 현재 크로마 블록에 대한 참조 계층들의 수를 제한하기 위해 사용될 수 있다. 도 9의 방법들을 적용한 후에, 참조 계층들의 수는 LC1에 설정된다. 그 후, 도 10에서의 S1002 및 S1003에서의 도출 알고리즘, 또는 S1005 및 S1006으로서 예시되어 있는 것은 또한 현재 블록 LC2에 대한 라인 인덱스를 획득하기 위해 적용된다. 그 후, min(LC1, LC2)이 현재 크로마 블록에 대한 최종 참조 라인 인덱스이다.
도 11은 예시적인 실시예에 따른 흐름도(1100)를 예시한다.
S1101에서, 상이한 참조 라인이 상이한 수의 인트라 예측 모드를 갖는 것이 고려된다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
예를 들어, 첫번째 참조 라인은 67개 모드를 갖고, 두번째 참조 라인은 35개 모드를 갖고, 세번째 참조 라인은 17개 모드를 갖고, 네번째 참조라인은 9개 모드를 갖는다.
예를 들어, 첫번째 참조 라인은 67개 모드를 갖고, 두번째 참조 라인은 33개 모드를 갖고, 세번째 참조 라인은 17개 모드를 갖고, 네번째 참조라인은 9개 모드를 갖는다.
대안적으로, S1102에서, 인덱스 > 1을 갖는 참조 라인들은 동일한 인트라 모드 번호를 공유하지만, 첫번째 참조 라인의 인트라 예측 모드들의 절반 이하와 같은 것처럼 첫번째 라인의 것보다 훨씬 적은 것을 공유한다.
S1103에서, 예를 들어, 짝수 모드 인덱스를 갖는 방향성 인트라 예측 모드들만이 1보다 큰 인덱스를 갖는 참조 라인에 대해 허용된다. 도 5에 예시된 바와 같이, 홀수 모드 인덱스를 갖는 방향성 인트라 예측 모드들은 점선 화살표로 표시되는 반면, 짝수 모드 인덱스를 갖는 방향성 인트라 예측 모드들은 실선 화살표로 표시된다.
S1104에서, 또 다른 예에서, 짝수 모드 인덱스를 갖는 방향성 인트라 예측 모드들 및 DC 및 평면 모드들만이 1보다 큰 인덱스를 갖는 참조 라인에 대해 허용된다.
S1105에서, 또 다른 예에서, 제1 레벨 MPM 및 제2 레벨 MPM 둘 다를 포함하는, MPM(most probable modes)만이 비 제로 참조 라인들에 대해 허용된다.
S1106에서, 또 다른 예에서, 1보다 큰 참조 라인 인덱스가 단지 짝수(또는 홀수 모드) 인트라 예측 모드들에 대해 인에이블되기 때문에, 인트라 예측 모드들을 코딩할 때, 1보다 큰 참조 라인 인덱스가 시그널링되는 경우, 인트라 예측 모드들, 예를 들어 평면/DC, 및 홀수(또는 짝수) 인트라 예측 모드들이 MPM 도출 및 리스트로부터 제외되고, 제2 레벨 MPM 도출 및 리스트로부터 제외되고, 나머지 비-MPM 모드 리스트로부터 제외된다.
S1107에서, 참조 라인 인덱스는 인트라 예측 모드들의 시그널링 후에 시그널링되고, 참조 라인 인덱스를 시그널링할지는 시그널링된 인트라 예측 모드에 의존한다.
예를 들어, 짝수 모드 인덱스를 갖는 방향성 인트라 예측 모드들만이 1보다 큰 인덱스를 갖는 참조 라인에 대해 허용된다. 시그널링된 인트라 예측 모드가 짝수 모드 인덱스를 갖는 방향성 예측인 경우, 선택된 참조 라인 인덱스가 시그널링된다. 그렇지 않은 경우, 단 하나의 디폴트 참조 라인, 예를 들어, 가장 가까운 참조 라인이 인트라 예측을 위해 허용되고 어떤 인덱스도 시그널링되지 않는다.
또 다른 예에서, MPM(most probable modes)만이 1보다 큰 인덱스를 갖는 참조 라인들에 대해 허용된다. 시그널링된 인트라 예측들이 MPM들로부터 온 경우, 선택된 참조 라인 인덱스가 시그널링될 필요가 있다. 그렇지 않은 경우, 단 하나의 디폴트 참조 라인, 예를 들어 가장 가까운 참조 라인이 인트라 예측에 대해 허용되고 어떤 인덱스도 시그널링되지 않는다.
또 다른 서브 실시예에서, 1보다 큰 인덱스를 갖는 참조 라인들은 모든 방향성 인트라 예측 모드들 또는 모든 인트라 예측 모드들에 대해 여전히 인에이블되고, 인트라 예측 모드 인덱스는 참조 라인 인덱스를 엔트로피 코딩하기 위한 컨텍스트로서 사용될 수 있다.
또 다른 실시예에서, MPM들(most probable modes)만이 1보다 큰 인덱스를 갖는 참조 라인들에 대해 허용된다. 하나의 접근법에서, 모든 MPM들이 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 허용된다. 또 다른 접근법에서, MPM들의 서브세트는 1보다 큰 인덱스를 갖는 다중의 참조 라인들에 대해 허용된다. MPM들이 다중 레벨로 분류될 때, 하나의 접근법에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 일부 레벨들의 MPM들만이 허용된다. 일 예에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 최저 레벨 MPM들만이 허용된다. 또 다른 예에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 최고 레벨 MPM들만이 허용된다. 또 다른 예에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 미리 정의된(또는 시그널링된/표시된) 레벨 MPM들만이 허용된다.
또 다른 실시예에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 비-MPM들만이 허용된다. 하나의 접근법에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 모든 비-MPM들이 허용된다. 또 다른 접근법에서, 비-MPM들의 서브세트가 1보다 큰 인덱스들을 갖는 다중의 참조 라인에 대해 허용된다. 일 예에서, 모든 비-MPM 인트라 모드 인덱스의 내림차순(또는 오름차순) 순서의 짝수(또는 홀수) 인덱스와 연관된 비-MPM만이 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 허용된다.
또 다른 실시예에서, 평면 및 DC 모드들에 미리 정의된 MPM 모드 리스트의 인덱스가 할당된다.
일 예에서, 미리 정의된 인덱스는 블록 폭 및 높이를 포함하지만 이에 한정되지는 않는 코딩된 정보에 추가로 의존한다.
또 다른 서브 실시예에서, 주어진 인덱스들을 갖는 MPM들이 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 허용된다. 주어진 MPM 인덱스들은, SPS(sequence parameter set), PPS(picture parameter set), 슬라이스 헤더, 또는 화상의 영역에 대한 공통 구문 요소 또는 파라미터에서와 같이 고 레벨 구문 요소로서 시그널링되거나 또는 특정될 수 있다. 현재 블록의 인트라 모드가 주어진 MPM 인덱스들 중 하나와 동일할 때에만, 참조 라인 인덱스가 시그널링된다.
예를 들어, MPM 리스트의 길이는 6이고, MPM 리스트의 인덱스는 0, 1, 2, 3, 4, 및 5이다. 현재 블록의 인트라 모드가 MPM 인덱스 0 및 5를 갖는 모드와 동일하지 않은 경우, 1보다 큰 인덱스를 갖는 참조 라인들이 허용된다.
S1108에서, 일 실시예에서, 모든 인트라 예측 모드는 현재 블록의 가장 가까운 참조 라인에 대해 허용되는 반면, 최고 확률 모드만이 1(또는 특정 인덱스 값, 예를 들어 1)보다 큰 인덱스를 갖는 참조 라인에 대해 허용된다(또는 허용되지 않는다).
S1109에서, 일 실시예에서, 최고 확률 모드는, HEVC에서의 3 MPM, JEM(또는 VTM)에서의 6 MPM과 같은, 제1 레벨 MPM만을 포함한다.
S1110에서, 또 다른 실시예에서, 최고 확률 모드들은 가장 낮은 레벨 MPM들로부터 가장 높은 레벨 MPM들까지의 임의 레벨의 MPM들일 수 있다.
S1111에서, 또 다른 실시예에서, 1보다 큰 인덱스들을 갖는 참조 라인들에 대해 MPM들의 일부 레벨들만이 허용된다.
S1112에서, 또 다른 실시예에서, 최고 확률 모드들은 가장 낮은 레벨 MPM들, 가장 높은 레벨 MPM들, 또는 미리 정의된 레벨 MPM들과 같이, MPM의 단지 하나의 레벨일 수 있다.
S1113에서, 또 다른 실시예에서, 참조 라인 인덱스는 MPM 플래그 및 인트라 모드 이전에 시그널링된다. 시그널링된 참조 라인 인덱스가 1일 때, MPM 플래그도 시그널링된다. 시그널링된 참조 라인 인덱스가 1보다 클 때, 현재 블록의 MPM 플래그가 시그널링되지 않고 현재 블록의 MPM 플래그가 1로서 도출된다. 현재 블록의 MPM 인덱스는 1보다 큰 인덱스를 갖는 참조 라인에 대해 여전히 시그널링된다.
S1114에서, 일 실시예에서, MPM 리스트 생성 프로세스는 참조 라인 인덱스 값에 의존한다.
일 예에서, 1보다 큰 인덱스를 갖는 참조 라인에 대한 MPM 리스트 생성 프로세스는 1과 동일한 인덱스를 갖는 참조 라인에 대한 것과 상이하다. 1보다 큰 인덱스를 갖는 참조 라인에 대해, 평면 및 DC 모드가 MPM 리스트로부터 제외된다. MPM 리스트의 길이는 모든 참조 라인들에 대해 동일하다.
MPM 리스트 생성 프로세스에서 사용되는 디폴트 MPM들은 참조 라인 인덱스에 의존한다. 일 예에서, 1보다 큰 인덱스를 갖는 참조 라인과 연관된 디폴트 MPM들은 1과 동일한 인덱스를 갖는 참조 라인과 연관된 것들과 상이하다.
S1115에서, 일 실시예에서, MPM 리스트의 길이, 즉, MPM들의 수는 참조 라인 인덱스 값에 의존한다.
또 다른 실시예에서, 1에서의 참조 라인 인덱스 값에 대한 MPM 리스트의 길이는 1보다 큰 참조 라인 인덱스 값에 대한 것과 상이하게 설정된다. 예를 들어, 1보다 큰 인덱스를 갖는 참조 라인에 대한 MPM 리스트의 길이는 1이거나, 또는 1의 참조 라인 인덱스에 대한 MPM 리스트의 길이보다 더 짧은 2이다.
또 다른 실시예에서, 1보다 큰 참조 라인 인덱스에 대한 MPM 리스트의 길이, 즉, MPM들의 수는 5이다. MPM 리스트 생성 프로세스에 대한 디폴트 MPM들은 65개의 각도 모드가 적용될 때 {VER, HOR, 2, 66, 34}이다. 디폴트 MPM의 순서는 이들 5개의 열거된 모드의 임의의 조합일 수 있다.
S1116에서, 참조 라인 인덱스를 도출한(시그널링하지 않은) 각도 인트라 예측 모드들에 대해, 예를 들어, 홀수 방향성 인트라 예측 모드들, 및/또는 평면/DC, 다중라인 참조 샘플들이 현재 블록에 대한 예측자들을 생성하기 위해 사용된다.
참조 라인 인덱스를 도출한(시그널링하지 않은) 각도 인트라 예측 모드들에 대해, 예측 샘플 값은 다중의 예측자의 가중 합을 사용하여 생성되는데, 다중의 예측자 각각은 다중의 참조 라인 중 하나를 사용하여 생성된 예측이다.
일 예에서, 가중 합은, 제각기, 제1 참조 라인 및 제2 참조 라인에 의해 생성된 예측자들에 적용된 {3, 1} 가중치들을 사용하고 있다.
또 다른 예에서, 가중치들은 블록 크기, 블록 폭, 블록 높이, 예측될 현재 블록 내의 샘플 위치, 및/또는 인트라 예측 모드에 의존한다.
하나의 예에서, 홀수 인덱스를 갖는 주어진 각도 예측 모드에 대해, 첫번째 참조 라인이 하나의 예측 블록 유닛 을 생성하기 위해 사용되고, 두번째 참조 라인이 또 다른 예측 블록 유닛을 생성하기 위해 사용된다. 이후, 현재 블록 단위에서의 각각의 픽셀에 대한 최종 예측 값은 이들 2개의 생성된 예측 블록 유닛의 가중 합이다. 이 프로세스는 수학식(4-1)에 의해 공식화될 수 있는데, 여기서 는 동일한 블록에서의 모든 픽셀들에 대해 동일한 값이다. 상이한 블록들에 대해, 은 인트라 예측 모드들 및 블록 크기들에 관계없이 동일하거나, 또는 인트라 예측 모드들 및 블록 크기들에 의존할 수 있다.
[수학식 4-1]
대안적으로, S1117에서, 각각의 참조 라인에 대한 인트라 예측 모드들의 수는 그 라인에서의 참조 샘플들 간의 차이에 의해 도출된다. 차이를 측정하는 방법은 그래디언트, SATD, SAD, MSE, SNR 및 PSNR을 포함하지만, 이에 제한되지는 않는다.
참조 샘플들의 위의 행 및 좌측 열 모두가 상당히 유사하면, 모드들의 수는 4, 9, 17 또는 35 모드로 감소될 수 있다. 4개의 모드는: 평면, DC, 수직, 및 수평 모드이다.
참조 샘플들의 위의 행만이 상당히 유사한 경우, 수직형 예측 모드들에서의 모드들은 다운-샘플링된다. 특별한 경우에, 모드(50)만이 유지되고, 모드 35 ~ 모드 49 및 모드 51 ~ 모드 66이 제외된다. 총 인트라 예측 모드들을 9, 17 또는 35로 만들기 위해, 수평 유사 방향에서의 인트라 예측 모드들이 그에 따라 감소된다.
그렇지 않고 참조 샘플들의 좌측 열만이 매우 유사한 경우, 수평 유사 방향으로의 모드들은 다운샘플링된다. 특별한 경우에, 모드 18만이 유지되고, 모드 2 ~ 모드 17 및 모드 19 ~ 모드 33이 제외된다. 총 인트라 예측 모드들을 9, 17 또는 35로 만들기 위해, 수직 유사 방향에서의 인트라 예측 모드들이 그에 따라 감소된다.
도 12는 예시적인 실시예들에 따른 흐름도(1200)를 예시한다.
S1201에서, 현재 라인 및 그것의 이웃하는 참조 라인(들)에서의 이웃 샘플들에 기초하여 현재 참조 라인에서의 각각의 샘플의 평활화가 존재한다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
S1202에서, 현재 라인에서의 각각의 픽셀에 대해, 참조 라인 1~ L에서의 모든 픽셀들은 현재 라인에서의 픽셀들을 평활화하기 위해 사용될 수 있다. L은 인트라 예측에 대한 최대 허용 참조 라인 번호이고, L은 1 ~ 8일 수 있다.
S1203에서, 경계 픽셀들에 대해, 이들은 필터링되거나 필터링되지 않을 수 있다. 이들이 필터링된다면, 동일한 라인에서의 각각의 경계 픽셀은 동일한 필터를 사용한다. 상이한 라인들에서의 경계 픽셀들은 상이한 필터들을 사용할 수 있다. 예를 들어, 첫번째 참조 라인에서의 경계 픽셀들은 [3, 2, 2, 1] 필터에 의해 필터링될 수 있고, 두번째 참조 라인에서의 경계 픽셀들은 [2, 3, 2, 1] 필터에 의해 필터링될 수 있고, 세번째 참조 라인에서의 경계 픽셀들은 [1, 2, 3, 2] 필터에 의해 필터링될 수 있고, 네번째 참조 라인에서의 경계 픽셀들은 [1, 2, 2, 3] 필터에 의해 필터링될 수 있다.
S1204에서, 다른 픽셀들에 대해, 각각의 라인에서의 픽셀들은 동일한 필터를 사용할 수 있고, 상이한 라인들에서의 픽셀들은 상이한 필터들을 사용할 수 있다. 대안적으로, 다른 픽셀들에 대해, 상이한 위치에서의 픽셀들은 상이한 필터들을 사용할 수 있다. 그러나, 이러한 필터들은 미리 정의되고, 인코더는 필터의 인덱스를 시그널링할 필요가 없다.
S1205에서, 대안적으로, 각각의 라인에 대한 필터링 동작은 인트라 예측 모드 및 변환 크기 의존적일 수 있다. 필터링 동작은 인트라 예측 모드 및 변환 크기가 특정 조건을 만족할 때만 인에이블된다. 예를 들어, 변환 크기가 4x4와 동일하거나 그보다 작을 때 필터링 동작이 디스에이블된다.
단계 S1206에서, 대안적으로, 직사각형 형상이 아니라, 각각의 픽셀을 평활화하기 위해 사용되는 필터는 불규칙한 필터 지지 형상을 가질 수 있다. 필터 지지 형상은 미리 정의될 수 있고, 참조 라인 인덱스, 인트라 모드, 블록 높이 및/또는 폭을 포함하지만 이에 제한되지는 않는, 인코더 및 디코더 둘 모두에 이용가능한 임의의 정보에 의존할 수 있다.
대안적으로, S1207에서, 첫번째 참조 라인에서의 각각의 픽셀에 대해, 첫번째 참조 라인 및 두번째 참조 라인에서의 픽셀들이 해당 픽셀을 평활화하기 사용될 수 있다. 두번째 참조 라인에서의 각각의 픽셀에 대해, 첫번째 참조 라인, 두번째 참조 라인 및 세번째 참조 라인에서의 픽셀들이 해당 픽셀을 평활화하기 위해 사용될 수 있다. 세번째 참조 라인에서의 각각의 픽셀에 대해, 두번째 참조 라인, 세번째 참조 라인, 및 네번째 참조 라인에서의 픽셀들이 해당 픽셀을 평활화하기 위해 사용될 수 있다. 네 번째 참조 라인의 각각의 픽셀에 대해, 세번째 참조 라인 및 네번째 참조 라인에서의 픽셀들이 해당 픽셀을 평활화하기 위해 사용될 수 있다. 다시 말해서, 첫번째 참조 라인 및 네번째 참조 라인에서의 픽셀들에 대해, 2개의 라인에서의 픽셀들이 각각의 픽셀을 필터링하기 위해 사용되고, 두번째 및 세번째 참조 라인들에서의 픽셀들에 대해, 3개의 라인에서의 픽셀들이 각각의 픽셀을 필터링하기 위해 사용된다.
예를 들어, 두번째 참조 라인 및 세번째 참조 라인에서 필터링된 픽셀들은 수학식 4-2 ~ 수학식 4-5 로부터 계산될 수 있다.
[수학식 4-2]
[수학식 4-3]
[수학식4-4]
[수학식 4-5]
첫번째 참조 라인에서의 필터링된 픽셀들은 수학식 4-6 ~ 수학식 4-10으로부터 계산될 수 있다.
[수학식 4-6]
[수학식 4-7]
[수학식 4-8]
[수학식 4-9]
[수학식 4-10]
네번째 참조 라인에서의 필터링된 픽셀들은 수학식 4-11 ~ 수학식 4-15로부터 계산될 수 있다.
[수학식 4-11]
[수학식 4-12]
[수학식 4-13]
[수학식 4-14]
[수학식 4-15]
또한, 0으로 라운딩, 포지티브 무한대 또는 네거티브 무한대로 라운딩하는 것과 같은 라운딩(rounding)이 상기 계산들에 추가될 수 있다.
도 13은 예시적인 실시예들에 따른 흐름도(1300)를 예시한다.
S1301에서, 현재 블록에서, 상이한 위치에서의 샘플들은 상이한 라인 인덱스 예측을 갖는 참조 샘플들의 상이한 조합들을 사용할 수 있다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
S1302에서, 주어진 인트라 예측 모드에 대해, 각각의 참조 라인 i는 하나의 예측 블록 을 생성할 수 있다. 각각의 위치에서의 픽셀들에 대해, 그 모드는 이들 생성된 예측 블록 의 상이한 조합을 이용하여 최종 예측 블록을 생성할 수 있다. 구체적으로, 위치(x, y)에서의 픽셀에 대해, 수학식 4-16은 예측 값을 계산하기 위해 사용될 수 있다.
[수학식 4-16]
여기서, 은 위치 의존적이다. 다시 말해서, 가중 인자들은 동일한 위치에 대해 동일하고, 가중 인자들은 상이한 위치들에 대해 상이하다.
대안적으로, 인트라 예측 모드가 주어지면, 각각의 샘플에 대해, 다중의 참조 라인으로부터의 참조 샘플들의 세트가 선택되고, 이러한 선택된 참조 샘플들의 세트의 가중 합이 최종 예측 값으로서 계산된다. 참조 샘플들의 선택은 인트라 모드 및 예측 샘플의 위치에 의존할 수 있고, 가중치들은 인트라 모드 및 예측 샘플의 위치에 의존할 수 있다.
S1303에서, 인트라 예측을 위해 참조 라인 x를 적용할 때, 각각의 샘플에 대해, 라인 0 및 라인 x의 예측 값이 비교되고, 라인 1이 매우 상이한 예측 값을 생성한다면, 라인 x로부터의 예측 값이 제외되고, 라인 0이 대신 사용될 수 있다. 현재 위치의 예측 값과 그것의 이웃 위치들의 예측 값 사이의 차이를 측정하는 방식은 그래디언트, SATD, SAD, MSE, SNR 및 PSNR을 포함하지만, 이에 제한되는 것은 아니다.
대안적으로, 2개보다 많은 예측 값이 상이한 참조 라인들로부터 생성되고, 중앙(또는 평균, 또는 가장 빈번하게 등장한) 값이 예측 샘플로서 사용된다.
S1304에서, 인트라 예측을 위해 참조 라인 x를 적용할 때, 각각의 샘플에 대해, 라인 1과 라인 x의 예측 값이 비교되고, 라인 1이 매우 상이한 예측 값을 생성한다면, 라인 x로부터의 예측 값이 제외되고, 라인 1이 대신 사용될 수 있다. 현재 위치의 예측 값과 그 이웃 위치들의 예측 값 사이의 차이를 측정하는 방식은 그래디언트, SATD, SAD, MSE, SNR 및 PSNR을 포함하지만, 이에 한정되지는 않는다.
대안적으로, 2개보다 많은 예측 값이 상이한 참조 라인들로부터 생성되고, 중앙(또는 평균, 또는 가장 빈번하게 등장한) 값이 예측 샘플로서 사용된다.
도 14는 예시적인 실시예들에 따른 흐름도(1400)를 예시한다.
S1401에서, 인트라 예측 후에, 가장 가까운 참조 라인에서의 픽셀들만을 이용하는 대신에, 다중의 라인에서의 픽셀들이 각각의 블록의 예측 값을 필터링하기 위해 사용된다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
예를 들어, S1402에서, PDPC는 다중 라인 인트라 예측을 위해 확장될 수 있다. (x, y)에 위치된 각각의 예측 샘플 pred[x][y]는 다음과 같이 계산된다:
[수학식 4-17]
Figure 112022115217678-pat00028
여기서 m은 -8 ~ -2일 수 있다.
일 예에서, 가장 가까운 2개의 라인에서의 참조 샘플들은 현재 블록에서의 샘플들을 필터링하기 위해 사용된다. 상단 좌측 픽셀에 대해, 제1 행에서의 상단 좌측 샘플만이 사용된다. 이는 수학식 4-18에 의해 공식화될 수 있다.
[수학식 4-18]
Figure 112022115217678-pat00029
대안적으로, S1403에서, 경계 필터들이 다중의 라인으로 확장될 수 있다.
DC 예측 후에, 처음 몇 개의 열들 및 처음 몇 개의 행들에서의 픽셀들이 이웃하는 참조 픽셀들에 의해 필터링된다. 제1 열에서의 픽셀들은 다음에 의해 필터링될 수 있다.
[수학식 4-19]
제1 행에서의 픽셀들에 대해, 필터링 동작은 다음과 같다.
[수학식 4-20]
일부 특별한 경우에, 제1 열에서의 픽셀들은 다음에 의해 필터링될 수 있다. [수학식 4-21]
제1 행에서의 픽셀들은 또한, 다음에 의해 필터링될 수 있다.
[수학식 4-22]
수직 예측 후에, 처음 몇 개의 열들에서의 픽셀들은 수학식 4-23에 의해 필터링될 수 있다.
[수학식 4-23]
수평 예측 후에, 처음 몇 개의 행들에서의 픽셀들은 수학식 4-24에 의해 필터링될 수 있다.
[수학식 4-24]
또 다른 실시예에서, 수직/수평 예측을 위해, 1보다 큰 인덱스를 갖는 참조 라인이 예측 샘플을 생성하기 위해 사용되는 경우, 첫번째 열/행 및 1보다 큰 라인 인덱스에서의 그의 대응하는 픽셀이 경계 필터링을 위해 사용된다. 도 15에 예시된 바와 같이, 그것의 참조 라인들(1503, 1502) 및 블록 유닛(1501)을 이용하여, 현재 블록 유닛에 대한 예측 샘플을 생성하기 위해 두번째 참조 라인(1503)이 이용되고 그리고 수직 방향을 갖는 픽셀들이 수직 예측을 위해 사용된다. 수직 예측 후에, 참조 라인 1에서의 대각선 텍스처를 갖는 픽셀들 및 참조 라인(1503)에서의 대각선 텍스처를 갖는 픽셀이 현재 블록 유닛에서의 처음 몇 개의 열들을 필터링하기 위해 사용된다. 필터링 프로세스는 수학식 4-25에 의해 공식화될 수 있는데, 여기서 m은 선택된 라인 인덱스를 나타내고, 그것은 2~ 8일 수 있다. n은 우측 시프트 비트들의 수이고, 그것은 1 ~ 8일 수 있다.
[수학식 4-25]
수평 예측을 위해, 필터링 프로세스는 수학식 4-26에 의해 공식화될 수 있다.
[수학식 4-26]
또 다른 실시예에서, 1보다 큰 인덱스를 갖는 참조 라인이 사용될 때, 도 1a에서의 모드 2 및 모드 34와 같은 대각선 예측들 후에, 첫번째 참조 라인으로부터 현재 참조 라인으로의 대각선 방향을 따른 픽셀들이 현재 블록 유닛의 처음 몇 개의 열들/행들에서의 픽셀들을 필터링하기 위해 사용된다. 구체적으로, 모드 2 예측 후에, 처음 몇 개의 행들에서의 픽셀들은 수학식 4-27에 의해 필터링될 수 있다. 모드 34 예측 후에, 처음 몇 개의 열들에서의 픽셀들이 수학식 4-28에 의해 필터링될 수 있다. m은 현재 블록에 대한 참조 라인 인덱스를 나타내고, 그것은 2~ 8일 수 있다. n은 우측 시프트 비트들의 수이고, 그것은 2 ~ 8일 수 있다. 은 가중 계수이고, 그것은 정수이다.
[수학식 4-27]
[수학식 4-28]
도 16은 예시적인 실시예들에 따른 흐름도(1600)를 예시한다.
S1601에서, 다중의 참조 라인 인트라 예측에 대해, 참조 라인 인덱스가 1보다 클 때 수정된 DC 및 평면 모드들이 추가된다. 여기서, 가장 가까운 참조 라인의 인덱스는 1로서 표시된다.
S1602에서, 평면 모드에 대해, 상이한 참조 라인이 사용될 때, 상이한 미리 정의된 상단 우측 및 하단 좌측 참조 샘플들이 예측 샘플들을 생성하기 위해 사용된다.
S1603에서, 대안적으로, 상이한 참조 라인이 사용될 때, 상이한 인트라 평활화 필터가 사용된다.
S1604에서, DC 모드에 대해, 첫번째 참조 라인에 대해, 위의 행 및 좌측 열에서의 모든 픽셀들이 DC 값을 계산하기 위해 사용되고, 참조 라인 인덱스가 1보다 클 때, 픽셀들 중 일부만이 DC 값을 계산하기 위해 사용된다.
예를 들어, 첫번째 참조 라인들에서의 위의 픽셀들은 두번째 참조 라인에 대한 DC 값들을 계산하기 위해 사용되고, 첫번째 참조 라인에서의 좌측 픽셀들은 세번째 참조 라인에 대한 DC 값들을 계산하기 위해 사용되고, 첫번째 참조 라인에서의 좌측 픽셀들의 절반 및 위의 픽셀들의 절반은 네번째 참조 라인에 대한 DC 값들을 계산하기 위해 사용된다.
S1605에서, DC 모드에 대해, 모든 이용 가능한 후보 라인들(행들 및 열들)에서의 모든 참조 픽셀들이 DC 예측자를 계산하기 위해 사용된다.
도 17은 예시적인 실시예들에 따른 흐름도(1700)를 예시한다.
S1701에서, 이것은 다중의 참조 라인을 IC 모드로 확장하도록 구현된다. S1702에서, 다중의 위의/좌측 참조 라인들이 IC 파라미터들을 계산하기 위해 사용되고, S1703에서, 어느 참조 라인이 IC 파라미터들을 계산하기 위해 사용되는지가 시그널링된다.
도 18은 예시적인 실시예들에 따른 흐름도(1800)를 예시한다.
S1801에서, 이것은 다중의 참조 라인 인덱스를 시그널링하도록 구현된다.
일 실시예에서, S1802에서, 참조 라인 인덱스는 가변 길이 코딩을 이용하여 시그널링된다. 거리에서 현재 블록에 더 가까울수록, 코드워드가 더 짧다. 예를 들어, 참조 라인 인덱스가 0, 1, 2, 3인 경우, 0은 현재 블록에 가장 가깝고 3은 가장 멀기 때문에, 이들에 대한 코드워드들은 1, 01, 001, 000이고, 여기서 0과 1은 교대될 수 있다.
또 다른 실시예에서, S1806에서, 참조 라인 인덱스는 고정 길이 코딩을 이용하여 시그널링된다. 예를 들어, 참조 라인 인덱스가 0, 1, 2, 3인 경우, 0은 현재 블록에 가장 가깝고 3은 가장 먼 것에 따라, 이들에 대한 코드워드들은 10, 01, 11, 00이고, 여기서 0과 1은 교대될 수 있고 순서는 변경될 수 있다.
S1803에서, 코드워드 테이블을 다양하게 사용할지가 고려되고, 그렇지 않은 경우, S1804에서, 또 다른 실시예에서, 참조 라인 인덱스는 가변 길이 코딩을 이용하여 시그널링되고, (최단 코드워드로부터 최장의 것으로의) 코드워드 테이블에서의 인덱스들의 순서는 다음과 같다: 0, 2, 4,… 2k, 1, 3, 5,… 2k+1(또는 2k-1). 인덱스 0은 현재 블록에 가장 가까운 참조 라인을 나타내고 2k+1은 가장 먼 것을 나타낸다.
또 다른 실시예에서, S1805에서, 참조 라인 인덱스는 가변 길이 코딩을 이용하여 시그널링되는데, 여기서 (최단 코드워드로부터 최장의 것으로의) 코드워드 테이블에서의 인덱스들의 순서는 다음과 같다: 가장 가까운 것, 가장 먼 것, 두번째 가장 가까운 것, 두번째 가장 먼 것,... 및 등등. 하나의 특정 예에서, 참조 라인 인덱스가 0, 1, 2, 3인 경우, 0은 현재 블록에 가장 가까운 것이고 3은 가장 먼 것이므로, 이들에 대한 코드워드들은 인덱스 0에 대해 0, 인덱스 3에 대해 10, 인덱스 2에 대해 110, 인덱스 1에 대해 111이다. 참조 라인 인덱스 1 및 2에 대한 코드워드들은 스위칭될 수 있다. 코드워드들에서의 0 및 1은 변경될 수 있다.
도 19는 예시적인 실시예들에 따른 흐름도(1900)를 예시한다.
S1901에서, 위의 참조 라인들(행들)의 수가 좌측 참조 라인들(열들)의 수와 상이할 때 다중의 참조 라인 인덱스를 시그널링한다.
S1902에서, 일 실시예에서, 위의 참조 라인들(행들)의 수가 M이고 좌측 참조 라인들(열들)의 수가 N이면, max(M, N)에 대한 참조 라인 인덱스들은 전술한 방법들 중 임의의 것, 또는 이들의 조합들을 사용할 수 있다. min(M, N)에 대한 참조 라인 인덱스들은 max(M, N)에 대해 참조 라인 인덱스들을 표시하기 위해 사용되는 코드워드들로부터의 코드워드들의 서브세트를 취하는데, 보통 더 짧은 것들을 취한다. 예를 들어, M=4, N=2이고, M (4) 참조 라인 인덱스들 {0, 1, 2, 3} 을 시그널링하기 위해 사용되는 코드워드들이 1, 01, 001, 000이면, 신호 N (2) 참조 라인 인덱스들 {0, 1}을 시그널링하기 위해 사용되는 코드워드들은 1, 01이다.
또 다른 실시예에서, S1903에서, 위의 참조 라인들(행들)의 수가 M이고 좌측 참조 라인들(열들)의 수가 N이고 그리고 M 및 N이 상이한 경우, 위의 참조 라인(행) 인덱스 및 좌측 참조 라인(열) 인덱스를 시그널링하기 위한 참조 라인 인덱스들은 별개일 수 있고, 상술한 임의의 방법 또는 이들의 조합들을 독립적으로 이용할 수 있다.
도 20은 예시적인 실시예들에 따른 흐름도(2000)를 예시한다.
S2000에서, 다양한 코딩 도구들에서 참조 라인들의 수를 발견하는 것이 고려되고, S2001에서, 인트라 예측에 사용될 수 있는 참조 라인들의 최대 수는, 픽셀 라인 버퍼를 잠재적으로 절약하기 위해, 디블로킹 필터 또는 템플릿 매칭 기반 인트라 예측과 같은, 다른 코딩 도구들에서 사용되는 참조 라인들의 수보다 많지 않도록 제약될 수 있다.
도 21은 예시적인 실시예들에 따른 흐름도(2100)를 예시한다.
S2100에서, 다중 라인 인트라 예측과 다른 코딩 도구들/모드들 간의 상호작용이 구현된다.
예를 들어, S2101에서, 일 실시예에서, cbf, 최종위치, 변환 스킵, 변환 타입, 2차 변환 인덱스, 1차 변환 인덱스, PDPC 인덱스를 포함하지만 이에 제한되지는 않는 다른 구문 요소들/코딩 도구들/모드들의 사용 및/또는 시그널링은 다중 라인 참조 라인 인덱스에 의존할 수 있다.
S2102에서, 일 예에서, 다중 라인 참조 인덱스가 0이 아닌 경우, 변환 스킵은 사용되지 않고, 변환 스킵 플래그는 시그널링되지 않는다.
S2103에서, 또 다른 예에서, 다른 코딩 도구들, 변환 스킵, cbf, 1차 변환 인덱스, 2차 변환 인덱스를 시그널링하기 위해 사용되는 컨텍스트는 다중 라인 참조 인덱스의 값에 의존할 수 있다.
S2104에서, 또 다른 실시예에서, 다중 라인 참조 인덱스는 cbf, 최종 위치, 변환 스킵, 변환 타입, 2차 변환 인덱스, 1차 변환 인덱스, PDPC 인덱스를 포함하지만 이에 제한되지는 않는 다른 구문 요소들 후에 시그널링될 수 있고, 다중 라인 참조 인덱스의 사용 및/또는 시그널링은 다른 구문 요소들에 의존할 수 있다.
도 22는 예시적인 실시예들에 따른 흐름도(2200)를 예시한다.
S2201에서, 참조 라인 인덱스를 획득하는 것이 고려되고, S2202에서, 참조 라인 인덱스는 인트라 예측 모드, MPM 인덱스, 1차 변환 인덱스, 2차 변환 인덱스, 변환 스킵 플래그, CBF(coding block flag) 및 변환 계수들을 포함하지만 이에 제한되지는 않는 또 다른 구문 요소를 엔트로피 코딩하기 위한 컨텍스트로서 사용될 수 있고, 또는 그 반대로도 된다.
도 23은 예시적인 실시예들에 따른 흐름도(2300)를 예시한다.
S2301에서, MPM 리스트에 참조 라인 정보를 포함하는 것이 제안된다. 즉, 현재 블록의 예측 모드가 MPM 리스트에서의 하나의 후보와 동일한 경우, 선택된 후보의 선택된 참조 라인 및 인트라 예측 둘 모두가 현재 블록에 대해 적용되고, 인트라 예측 모드 및 참조 라인 인덱스는 시그널링되지 않는다. 또한, 상이한 참조 라인 인덱스들에 대한 MPM 후보들의 수는 미리 정의된다. 여기서, 가장 가까운 참조 라인은 1로서 표시된다.
S2302에서, 일 실시예에서, 각각의 참조 라인 인덱스에 대한 MPM들의 수는 미리 정의되고, 이것은 SPS(sequence parameter set), PPS(picture parameter set), 슬라이스 헤더, 타일 헤더, CTU(coding tree unit) 헤더에서와 같은 상위 레벨 구문 요소로서, 또는 화상의 영역에 대한 공통 구문 요소 또는 파라미터로서 시그널링될 수 있다. 그 결과, MPM 리스트의 길이는 상이한 시퀀스들, 화상들, 슬라이스들, 타일들, 코딩 블록들의 그룹 또는 화상의 영역에서 상이할 수 있다.
예를 들어, 참조 라인 인덱스 1에 대한 MPM들의 수는 6 이고, 다른 참조 라인 인덱스들 각각과의 MPM들의 수는 2이다. 그 결과, 총 참조 라인 수가 4인 경우, MPM 리스트의 총 수는 12이다.
또 다른 실시예에서, S2303에서, 모든 인트라 예측 모드들은 위의, 좌측, 상단 좌측, 상단 우측, 및 하단 좌측 블록에서의 이들의 참조 라인 인덱스와 함께 MPM 리스트에 포함된다. 도 24의 예시(2400)에서와 같이, 현재 블록 유닛의 모든 이웃 블록들을 도시하는데, A는 하단 좌측 블록이고, B, C, D, 및 E는 좌측 블록들이고, F는 상단 좌측 블록이고, G 및 H는 상단 블록들이고, I는 상단 우측 블록이다. 그후 이웃 블록들의 모드들을 MPM 리스트에 추가한다. 주어진 참조 라인 번호를 갖는 MPM 후보의 수가 미리 정의된 수보다 작다면, 디폴트 모드들이 MPM 리스트를 채우기 위해 사용된다.
또 다른 실시예에서, S2304에서, 현재 블록의 모드가 MPM 리스트에서의 후보 중 하나와 동일한 경우, 참조 라인 인덱스는 시그널링되지 않는다. 현재 블록의 모드가 MPM 리스트에서의 임의의 후보와 동일하지 않은 경우, 참조 라인 인덱스가 시그널링된다.
일 예에서, 라인 1이 현재 블록에 대해 사용되는 경우, 제2 레벨 MPM 모드들은 여전히 사용되지만, 제2 레벨 MPM은 인트라 예측 모드 정보만을 포함한다.
또 다른 예에서, 다른 라인들에 대해, 제2 레벨 MPM이 사용되지 않고, 나머지 모드를 코딩하기 위해 고정 길이 코딩이 사용된다.
도 25는 예시적인 실시예에 따른 흐름도(2500)를 예시한다.
S2501에서, 현재의 VVC 테스트 모드 VTM-1.0에서, 크로마 인트라 코딩 모드들은, DM(루마 모드의 직접 사본) 및 4개의 추가의 각도 인트라 예측 모드를 포함하는 HEVC에서의 것들과 동일하고, 현재의 BMS-1.0에서, CCLM(cross component linear model) 모드가 또한 크로마 인트라 코딩에 대해 적용된다. CCLM 모드는 하나의 LM 모드, 하나의 다중 모델 LM(MMLM) 및 4개의 다중 필터 LM(MFLM) 모드를 포함하고, CCLM 모드들이 인에이블되지 않는 경우에는 DM 모드들만이 크로마 블록에 사용되는 반면, CCLM 모드들이 인에이블되는 경우에는 DM 및 CCLM 모드들만이 크로마 블록들에 대해 사용되는 것은 그런 관점에서이다.
S2502에서, 일 실시예에서, 크로마 블록들에 대해 하나의 DM 모드만이 사용되고 크로마 블록들에 대해 어떤 플래그도 시그널링되지 않으며, 크로마 모드가 DM 모드로서 도출된다.
또 다른 실시예에서, S2503에서, 하나의 DM 및 하나의 CCLM 모드만이 크로마 블록들에 대해 사용되고, 하나의 DM 플래그가 DM 또는 LM 모드가 현재 크로마 블록들에 대해 사용되는지를 시그널링하기 위해 사용된다.
하나의 서브 실시예에서, DM 플래그를 시그널링하기 위해 사용되는 3개의 컨텍스트가 존재한다. 좌측 및 위의 블록들 둘 모두가 DM 모드들을 사용하는 경우, DM 플래그를 시그널링하기 위해 컨텍스트 0이 사용된다. 좌측 및 위의 블록들 중 하나만이 DM 모드들을 사용하는 경우, DM 플래그를 시그널링하기 위해 컨텍스트 1이 사용된다. 그렇지 않고, 좌측 및 위의 블록들 둘 모두가 DM 모드들을 사용하지 않는 경우, DM 플래그를 시그널링하기 위해 컨텍스트 2가 사용된다.
또 다른 실시예에서, S2504에서 DM 및 CCLM (인에이블된 경우) 모드들만이 작은 크로마 블록들에 대해 사용된다. 크로마 블록의 폭, 또는 높이, 또는 영역 크기(폭* 높이)가 Th 이하일 때, 현재 크로마 블록은 작은 크로마 블록으로 지칭된다. Th는 2, 4, 8, 16, 32, 64, 128, 256, 512, 또는 1024일 수 있다.
예를 들어, 현재 크로마 블록의 영역 크기가 8보다 작거나 같을 때, DM 및 CCLM (인에이블된 경우) 모드들만이 현재 크로마 블록에 대해 사용된다.
또 다른 예에서, 현재 크로마 블록의 영역 크기가 16보다 작거나 같을 때, DM 및 CCLM (인에이블된 경우) 모드들만이 현재 크로마 블록에 대해 사용된다.
또 다른 예에서, 하나의 DM 및 하나의 CCLM (인에이블된 경우) 모드들만이 작은 크로마 블록에 대해 사용된다.
또 다른 실시예에서, S2505에서, 루마 성분의 인트라 모드가 MPM 모드 중 하나와 동일할 때, 크로마 블록들은 DM 모드만을 사용할 수 있고, 크로마 모드에 대해 어떠한 플래그도 시그널링되지 않으며, 그렇지 않은 경우 DM 및 CCLM 모드들 둘 모두가 크로마 블록들에 대해 허용된다.
일 예에서, MPM 모드는 단지 제1 레벨 MPM일 수 있다.
또 다른 예에서, MPM 모드는 단지 제2 레벨 MPM일 수 있다.
또 다른 예에서, MPM 모드는 제1 레벨 MPM 또는 제2 레벨 MPM 중 어느 하나일 수 있다.
또 다른 실시예에서, S2506에서, 루마 성분의 인트라 모드가 MPM 모드의 임의의 것과 동일하지 않을 때, 크로마 블록들은 DM 모드를 사용할 수 있고, 크로마 모드에 대해 어떠한 플래그도 시그널링되지 않으며, 그렇지 않은 경우 DM 및 CCLM 모드들 둘 모두가 크로마 블록들에 대해 허용된다.
따라서, 본 명세서에 설명된 예시적인 실시예들에 의해, 전술한 기술적 문제들은 이들 기술적 해결책들에 의해 유리하게 개선될 수 있다.
전술한 기술들은 컴퓨터 판독가능 명령어들을 사용하는 컴퓨터 소프트웨어로서 구현될 수 있고, 적어도 하나의 컴퓨터 판독가능 매체에 또는 구체적으로 구성된 적어도 하나의 하드웨어 프로세서에 의해 물리적으로 저장될 수 있다. 예를 들어, 도 26은 개시된 주제의 특정 실시예들을 구현하기에 적합한 컴퓨터 시스템(2600)을 도시한다.
컴퓨터 소프트웨어는, 컴퓨터 중앙 처리 유닛(CPU), 그래픽 처리 유닛(GPU) 등에 의해, 직접 실행될 수 있거나, 또는 해석, 마이크로코드 실행 등을 통한 명령어들을 포함하는 코드를 생성하기 위해, 어셈블리, 컴필레이션, 링킹, 또는 유사한 메커니즘을 겪을 수 있는 임의의 적절한 머신 코드 또는 컴퓨터 언어를 사용하여 코딩될 수 있다.
명령어들은, 예를 들어, 개인용 컴퓨터, 태블릿 컴퓨터, 서버, 스마트폰, 게이밍 디바이스, 사물 인터넷 디바이스 등을 포함하는 다양한 유형의 컴퓨터 또는 그의 컴포넌트상에서 실행될 수 있다.
컴퓨터 시스템(2600)에 대한 도 26에 도시된 컴포넌트들은 본질적으로 예시적인 것이며, 본 개시내용의 실시예들을 구현하는 컴퓨터 소프트웨어의 사용 또는 기능성의 범위에 관한 어떠한 제한도 시사하도록 의도되지 않는다. 또한 컴포넌트들의 구성이 컴퓨터 시스템(2600)의 예시적 실시예에 예시된 컴포넌트들의 임의의 하나 또는 그 조합과 관련된 임의의 종속성 또는 요건을 갖는 것으로 해석해서도 안된다.
컴퓨터 시스템(2600)은 특정한 인간 인터페이스 입력 디바이스들을 포함할 수 있다. 이러한 인간 인터페이스 입력 디바이스는, 예를 들어, 촉각 입력(예컨대, 키스트로크, 스와이프, 데이터 장갑 이동), 오디오 입력(예컨대, 음성, 클래딩), 시각적 입력(예컨대, 제스처), 후각적 입력(묘사되지 않음)을 통해 적어도 하나의 인간 사용자에 의한 입력에 응답할 수 있다. 인간 인터페이스 디바이스들은 또한 오디오(예컨대, 음성, 음악, 주변 사운드), 이미지들(예컨대, 스캐닝된 이미지들, 정지 이미지 카메라로부터 획득된 사진 이미지들), 비디오(예컨대, 2 차원 비디오, 입체 비디오를 포함하는 3차원 비디오)와 같은, 인간에 의한 의식 입력과 반드시 직접적으로 관련되지는 않은 특정 미디어를 캡처하기 위해 사용될 수 있다.
입력 인간 인터페이스 디바이스들은 키보드(2602), 마우스(2603), 트랙패드(403), 터치 스크린(2604), 조이스틱(2605), 마이크로폰(2606), 스캐너(2608), 카메라(2607)(각각의 묘사된 것 중 하나만) 중 적어도 하나를 포함할 수 있다.
컴퓨터 시스템(2600)은 또한 특정한 인간 인터페이스 출력 디바이스들을 포함할 수 있다. 이러한 인간 인터페이스 출력 디바이스들은, 예를 들어, 촉각 출력, 사운드, 광, 및 냄새/미각을 통해 적어도 하나의 인간 사용자들의 감각들을 자극하고 있을 수 있다. 그러한 인간 인터페이스 출력 디바이스들은 촉각 출력 디바이스들(예를 들어 터치-스크린(2610), 또는 조이스틱(2605)에 의한 촉각 피드백이지만, 입력 디바이스들로서 역할하지 않는 촉각 피드백 디바이스들도 있을 수 있음), 오디오 출력 디바이스들(예컨대: 스피커들(2609), 헤드폰들(묘사되지 않음)), 시각적 출력 디바이스들(예컨대 CRT 스크린들, LCD 스크린들, 플라즈마 스크린들, OLED 스크린들을 포함하는 스크린들(2610), 각각은 터치-스크린 입력 능력이 있거나 없고, 각각은 촉각 피드백 능력이 있거나 없고 - 이들 중 일부는 스테레오그래픽 출력과 같은 수단을 통해 2차원 시각적 출력 또는 3개보다 많은 차원의 출력을 출력할 수 있다; 가상 현실 안경(묘사되지 않음), 홀로그래픽 디스플레이들 및 연기 탱크들(묘사되지 않음)), 및 프린터들(묘사되지 않음)을 포함할 수 있다.
컴퓨터 시스템(2600)은 인간 액세스 가능한 저장 디바이스들 및 그것들과 연관된 매체들, 예컨대 CD/DVD 등의 매체(2611)를 갖는 CD/DVD ROM/RW(2612)를 포함하는 광학 매체, 썸-드라이브(2613), 이동식 하드 드라이브 또는 솔리드 스테이트 드라이브(2614), 테이프 및 플로피 디스크(묘사되지 않음)와 같은 레거시 자기 매체, 보안 동글(묘사되지 않음)과 같은 특수화된 ROM/ASIC/PLD 기반 디바이스들 등을 또한 포함할 수 있다.
본 기술분야의 통상의 기술자는 또한, 현재 개시된 주제와 관련하여 사용되는 용어 "컴퓨터 판독가능 매체"가 송신 매체, 반송파들 또는 다른 일시적 신호들을 포함하지 않는다는 것을 이해해야 한다.
컴퓨터 시스템(2600)은 또한 적어도 하나의 통신 네트워크(2615)에 대한 인터페이스를 포함할 수 있다. 네트워크들은 예를 들어, 무선, 유선, 광학적일 수 있다. 네트워크들은 추가로 로컬, 광역, 대도시, 차량 및 산업, 실시간, 지연 허용(delay-tolerant) 등일 수 있다. 네트워크들의 예들은 로컬 영역 네트워크들, 예컨대 이더넷, 무선 LAN들, GSM, 3G, 4G, 5G, LTE 등을 포함하는 셀룰러 네트워크들, 케이블 TV, 위성 TV 및 지상파 브로드캐스트 TV를 포함하는 TV 와이어라인 또는 무선 광역 디지털 네트워크들, CANBus를 포함하는 차량 및 산업 등을 포함한다. 특정 네트워크들은 일반적으로 특정 범용 데이터 포트들 또는 주변 버스들(2625)(예컨대, 예를 들어, 컴퓨터 시스템(2600)의 USB 포트들)에 부착된 외부 네트워크 인터페이스 어댑터들을 요구한다. 다른 것들은 일반적으로 아래에 설명되는 바와 같은 시스템 버스로의 부착에 의해 컴퓨터 시스템(2600)의 코어에 통합된다(예를 들어, PC 컴퓨터 시스템으로의 이더넷 인터페이스는 또는 스마트폰 컴퓨터 시스템으로의 셀룰러 네트워크 인터페이스). 이들 네트워크들 중 임의의 것을 사용하여, 컴퓨터 시스템(2600)은 다른 엔티티들과 통신할 수 있다. 그러한 통신은 단방향성 수신 전용(예를 들어, 브로드캐스트 TV), 단방향성 송신 전용(예를 들어, CANbus 대 특정 CANbus 디바이스들), 또는 예를 들어 로컬 또는 광역 디지털 네트워크들을 사용하는 다른 컴퓨터 시스템들과의 양방향성일 수 있다. 위에서 설명된 바와 같은 네트워크들 및 네트워크 인터페이스들 각각에 대해 특정 프로토콜들 및 프로토콜 스택들이 사용될 수 있다.
전술한 인간 인터페이스 디바이스들, 인간-액세스 가능한 저장 디바이스들, 및 네트워크 인터페이스들은 컴퓨터 시스템(2600)의 코어(2612)에 부착될 수 있다.
코어(2612)는 적어도 하나의 중앙 처리 유닛(CPU)(2612), 그래픽 처리 유닛(GPU)(2622), 필드 프로그래머블 게이트 영역(FPGA)(2624)의 형식으로 특수화된 프로그래머블 처리 유닛들, 특정 태스크들(2624)에 대한 하드웨어 가속기들 등을 포함할 수 있다. 이들 디바이스는, 판독 전용 메모리(ROM)(2619), 랜덤 액세스 메모리(2618), 내부 비-사용자 액세스 가능 하드 드라이브들, SSD들 등(447)과 같은 내부 대용량 저장소와 함께, 시스템 버스(2626)를 통해 연결될 수 있다. 일부 컴퓨터 시스템에서, 시스템 버스(2626)는 추가 CPU, GPU 등에 의한 확장을 가능하게 하기 위해 적어도 하나의 물리적 플러그의 형태로 액세스가능할 수 있다. 주변 디바이스들은 코어의 시스템 버스(2626)에 직접적으로 또는 주변 버스(2601)를 통해 부착될 수 있다. 주변 버스를 위한 아키텍처들은 PCI, USB 등을 포함한다.
CPU들(2621), GPU들(2622), FPGA들(2624), 및 가속기들(2624)은, 조합하여, 전술한 컴퓨터 코드를 구성할 수 있는 특정 명령어들을 실행할 수 있다. 해당 컴퓨터 코드는 ROM(2619) 또는 RAM(2618)에 저장될 수 있다. 과도적인 데이터가 또한 RAM(2618)에 저장될 수 있는 반면, 영구 데이터는, 예를 들어, 내부 대용량 저장소(2620)에 저장될 수 있다. 메모리 디바이스들 중 임의의 것에 대한 고속 저장 및 검색은, 적어도 하나의 CPU(2621), GPU(2622), 대용량 저장소(2620), ROM(2619), RAM(2618) 등과 밀접하게 연관될 수 있는, 캐시 메모리의 사용을 통해 가능하게 될 수 있다.
컴퓨터 판독가능 매체는 다양한 컴퓨터 구현 동작들을 수행하기 위한 컴퓨터 코드를 그 위에 가질 수 있다. 매체 및 컴퓨터 코드는 본 개시내용의 목적을 위해 특별히 설계되고 구성된 것들일 수 있거나, 또는 그것들은 컴퓨터 소프트웨어 기술분야의 기술자들에게 잘 알려져 있고 이용가능한 종류의 것일 수 있다.
제한이 아니라 예로서, 아키텍처를 갖는 컴퓨터 시스템(2600), 및 구체적으로 코어(2616)는 프로세서(들)(CPU들, GPU들, FPGA, 가속기들 등을 포함함)가 적어도 하나의 유형의(tangible) 컴퓨터 판독가능 매체에 구현된 소프트웨어를 실행하는 결과로서 기능성을 제공할 수 있다. 그러한 컴퓨터 판독가능 매체는 위에 소개된 바와 같은 사용자-액세스 가능한 대용량 저장소뿐만 아니라, 코어-내부 대용량 저장소(2620) 또는 ROM(2619)과 같은 비일시적 속성의 것인 코어(2616)의 특정 저장소와 연관된 매체일 수 있다. 본 개시내용의 다양한 실시예들을 구현하는 소프트웨어는 이러한 디바이스들에 저장되고 코어(2616)에 의해 실행될 수 있다. 컴퓨터 판독가능 매체는 특정 필요에 따라 적어도 하나의 메모리 디바이스 또는 칩을 포함할 수 있다. 소프트웨어는 코어(2616) 및 구체적으로 그 내부의 프로세서들(CPU, GPU, FPGA 등을 포함함)로 하여금, RAM(2618)에 저장된 데이터 구조들을 정의하는 것 및 소프트웨어에 의해 정의된 프로세스들에 따라 그러한 데이터 구조들을 수정하는 것을 포함하여, 본 명세서에 설명된 특정 프로세스들 또는 특정 프로세스들의 특정 부분들을 실행하게 할 수 있다. 추가로 또는 대안으로서, 컴퓨터 시스템은, 본 명세서에 설명된 특정 프로세스들 또는 특정 프로세스들의 특정 부분들을 실행하기 위해 소프트웨어 대신에 또는 그와 함께 동작할 수 있는, 회로(예를 들어: 가속기(2624))에 하드와이어링되거나 다른 방식으로 구현된 로직의 결과로서 기능성을 제공할 수 있다. 소프트웨어에 대한 참조는, 적절한 경우, 로직을 포함할 수 있고, 그 반대도 가능하다. 컴퓨터 판독가능 매체에 대한 참조는, 적절한 경우, 실행을 위한 소프트웨어를 저장하는 회로(예컨대 집적 회로(IC)), 또는 실행을 위한 로직을 구현하는 회로, 또는 둘 다를 포함할 수 있다. 본 개시내용은 하드웨어 및 소프트웨어의 임의의 적합한 조합을 포함한다.
본 개시내용이 여러 예시적인 실시예들을 설명하였지만, 본 개시내용의 범위 내에 속하는 변경들, 치환들, 및 다양한 대체 균등물들이 존재한다. 따라서, 본 기술분야의 통상의 기술자들은, 비록 본 명세서에 명시적으로 도시되거나 설명되지는 않았지만, 본 개시내용의 원리들을 구현하고 따라서 그것의 사상 및 범위 내에 있는, 다수의 시스템들 및 방법들을 고안할 수 있을 것이라는 점이 인정될 것이다.

Claims (13)

  1. 적어도 하나의 프로세서에 의해 실행되는 비디오 디코딩을 위한 방법으로서:
    비디오 시퀀스의 복수의 참조 라인 중에서의 인트라 예측에 의해 상기 비디오 시퀀스의 디코딩을 수행하는 단계;
    복수의 참조 라인 중에서의 상기 인트라 예측의 현재 블록에 가장 가까운 제로 참조 라인에 대해 복수의 인트라 예측 모드를 결정하는 단계;
    상기 복수의 참조 라인에 포함된 하나 이상의 비 제로 참조 라인들 중 하나에 대해, 최고 확률 모드 리스트 내에 포함된 적어도 하나의 최고 확률 모드를 결정하는 단계 - 평면 모드 및 DC 모드 중 적어도 하나가 상기 비 제로 참조 라인들 중 임의의 하나에 대응하는 상기 최고 확률 모드 리스트로부터 제외됨 - ; 및
    참조 라인 인덱스 값에 기초하여 최고 확률 모드 리스트의 길이를 결정하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서,
    최고 확률 모드 플래그 및 상기 인트라 예측 모드를 시그널링하기 전에 참조 라인 인덱스를 시그널링하는 단계;
    상기 참조 라인 인덱스가 시그널링되고 그리고 시그널링된 인덱스가 상기 제로 참조 라인을 표시하는 것으로 결정한 것에 응답하여 상기 최고 확률 모드 플래그를 시그널링하는 단계; 및
    상기 참조 라인 인덱스가 시그널링되고 그리고 시그널링된 인덱스가 상기 비 제로 참조 라인들 중 적어도 하나를 표시하는 것으로 결정한 것에 응답하여, 상기 최고 확률 모드 플래그를 시그널링하지 않고, 상기 최고 확률 모드 플래그가 참인 것을 도출하고, 및 상기 현재 블록의 최고 확률 모드 인덱스를 시그널링하는 단계를 추가로 포함하는 방법.
  3. 삭제
  4. 제1항에 있어서,
    1에서의 참조 라인 인덱스 값에 대한 상기 최고 확률 모드 리스트의 길이는 1보다 큰 참조 라인 인덱스 값과 다르게 설정되는, 방법.
  5. 제1항에 있어서,
    1보다 큰 인덱스를 갖는 참조 라인에 대한 상기 최고 확률 모드 리스트의 길이는 1의 참조 라인 인덱스에 대한 상기 최고 확률 모드 리스트의 길이보다 1 짧은, 방법.
  6. 제1항에 있어서,
    현재 참조 라인이 제로 참조 라인인 것으로 결정한 것에 응답하여, 상기 최고 확률 모드 리스트의 길이를 6으로 결정하는 단계를 추가로 포함하는, 방법.
  7. 제1항에 있어서,
    상기 비 제로 참조 라인을 검출한 것에 응답하여, 상기 최고 확률 모드 리스트의 길이가 5개의 최고 확률 모드로 구성되는 것으로 결정하는 단계를 추가로 포함하는, 방법.
  8. 제1항에 있어서, 상기 평면 모드는 상기 제로 참조 라인에 대응되는 상기 최고 확률 모드 리스트 내에 포함되고; 상기 평면 모드는 상기 비 제로 참조 라인들 중 하나에 대응되는 상기 최고 확률 모드 리스트로부터는 제외되는, 방법.
  9. 제1항에 있어서, 상기 최고 확률 모드 리스트는 가장 낮은 레벨로부터 가장 높은 레벨까지의 상이한 개수들의 요소를 가지는 복수의 서브셋들로 분류될 때, 상기 적어도 하나의 최고 확률 모드는 가장 낮은 레벨의 서브셋 내에 포함되는, 방법.
  10. 제1항에 있어서, 상기 비 제로 참조 라인들 중 하나에 대응되는 최고 확률 모드 리스트는 상기 제로 참조 라인의 최고 확률 모드 리스트의 서브셋인, 방법.
  11. 제1항에 있어서, 상기 적어도 하나의 최고 확률 모드는 상기 비 제로 참조 라인에 대해 허용되는 상기 최고 확률 모드들의 레벨들만을 포함하는, 방법.
  12. 장치로서:
    컴퓨터 프로그램 코드를 저장하도록 구성된 적어도 하나의 메모리;
    상기 컴퓨터 프로그램 코드에 액세스하고 상기 컴퓨터 프로그램 코드의 지시에 따라 동작하여 제1항, 제2항 및 제4항 내지 제11항 중 어느 한 항의 방법을 실행하도록 구성된 적어도 하나의 하드웨어 프로세서를 포함하는 장치.
  13. 비일시적 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램으로서, 컴퓨터로 하여금 제1항, 제2항 및 제4항 내지 제11항 중 어느 한 항의 방법을 실행하게 하는 컴퓨터 프로그램.
KR1020227038128A 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치 KR102638065B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020247004585A KR20240024330A (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201862694132P 2018-07-05 2018-07-05
US62/694,132 2018-07-05
US16/234,324 US20200014919A1 (en) 2018-07-05 2018-12-27 Methods and apparatus for multiple line intra prediction in video compression
US16/234,324 2018-12-27
US16/240,388 US10819977B2 (en) 2018-07-05 2019-01-04 Methods and apparatus for multiple line intra prediction in video compression
US16/240,388 2019-01-04
KR1020207027442A KR102462915B1 (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치
PCT/US2019/039593 WO2020009906A1 (en) 2018-07-05 2019-06-27 Methods and apparatus for multiple line intra prediction in video compression

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020207027442A Division KR102462915B1 (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020247004585A Division KR20240024330A (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20220153099A KR20220153099A (ko) 2022-11-17
KR102638065B1 true KR102638065B1 (ko) 2024-02-20

Family

ID=72970892

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020247004585A KR20240024330A (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치
KR1020207027442A KR102462915B1 (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치
KR1020227038128A KR102638065B1 (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020247004585A KR20240024330A (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치
KR1020207027442A KR102462915B1 (ko) 2018-07-05 2019-06-27 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치

Country Status (5)

Country Link
US (2) US11917137B2 (ko)
EP (1) EP3818699A4 (ko)
JP (2) JP7148637B2 (ko)
KR (3) KR20240024330A (ko)
CN (3) CN111869207B (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020072249A1 (en) * 2018-10-01 2020-04-09 Interdigital Vc Holdings, Inc. Directions for wide angle intra prediction
WO2020092535A1 (en) * 2018-10-31 2020-05-07 Interdigital Vc Holdings, Inc. Multi-reference line intra prediction and most probable mode
WO2024022146A1 (en) * 2022-07-27 2024-02-01 Mediatek Inc. Using mulitple reference lines for prediction
WO2024034861A1 (ko) * 2022-08-09 2024-02-15 현대자동차주식회사 템플릿 기반 예측을 이용하는 비디오 코딩을 위한 방법 및 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10944963B2 (en) 2016-05-25 2021-03-09 Arris Enterprises Llc Coding weighted angular prediction for intra coding
CA3025520A1 (en) 2016-05-25 2017-11-30 Arris Enterprises Llc Improved weighted angular prediction coding for intra coding
ES2699691R1 (es) 2016-06-24 2019-04-05 Kt Corp Método y aparato para procesar señales de vídeo
US20190238839A1 (en) * 2016-10-14 2019-08-01 Sony Corporation Image processing apparatus and image processing method
EP3643064A1 (en) 2017-07-24 2020-04-29 ARRIS Enterprises LLC Intra mode jvet coding
WO2019047883A1 (en) * 2017-09-08 2019-03-14 Fg Innovation Ip Company Limited DEVICE AND METHOD FOR ENCODING VIDEO DATA BASED ON MULTIPLE REFERENCE LINES

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
H-Y Jiang et al: "CE3-related: Advanced MPM based on intra reference line selection scheme", JVET-K0175, 2018-07-03.
Liang Zhao et al., "CE3-related: MPM based multi-line intra prediction scheme", version3, 2018.7.14. 공개*

Also Published As

Publication number Publication date
CN116527913A (zh) 2023-08-01
JP2021521719A (ja) 2021-08-26
EP3818699A4 (en) 2022-03-30
CN111869207B (zh) 2023-03-14
KR102462915B1 (ko) 2022-11-04
US20220224894A1 (en) 2022-07-14
CN111869207A (zh) 2020-10-30
US11917137B2 (en) 2024-02-27
KR20240024330A (ko) 2024-02-23
KR20220153099A (ko) 2022-11-17
CN116567249A (zh) 2023-08-08
EP3818699A1 (en) 2021-05-12
JP2022177219A (ja) 2022-11-30
JP7148637B2 (ja) 2022-10-05
KR20200123821A (ko) 2020-10-30
US20230403393A1 (en) 2023-12-14

Similar Documents

Publication Publication Date Title
KR102647830B1 (ko) 비디오 코딩을 위한 방법 및 장치
KR102653789B1 (ko) 멀티-라인 인트라 예측을 위한 방법 및 장치
US11356661B2 (en) Methods and apparatus for multiple line intra prediction in video compression
US11394983B2 (en) Method and apparatus for merge mode with additional middle candidates in video coding
KR102616833B1 (ko) 인트라 인터 예측 모드에 대한 개선을 위한 방법 및 장치
KR102638065B1 (ko) 비디오 압축에서의 다중 라인 인트라 예측을 위한 방법 및 장치
US10523963B1 (en) Method and apparatus for merge mode in video coding
US20200014919A1 (en) Methods and apparatus for multiple line intra prediction in video compression
JP7478835B2 (ja) 符号化ビデオストリームにおいてニューラルネットワークトポロジ及びパラメータを伝達するための技術
KR102637503B1 (ko) 비디오 시퀀스의 디코딩 또는 인코딩을 위한 인트라-인터 예측 모드를 제어하기 위한 방법 및 장치
KR102627879B1 (ko) 심층 강화 학습을 통한 종단 간 종속 양자화
KR20220155360A (ko) 비디오 스트림에서 신경망 토폴로지, 파라미터들, 및 처리 정보를 시그널링하기 위한 기법
JP7357679B2 (ja) 改善された最確モードリスト生成方法
KR102504009B1 (ko) 비디오 코딩에서 적응적 그리드 크기를 갖는 확장된 병합 모드를 위한 방법 및 장치
KR102496419B1 (ko) 비디오 코딩에서의 감소된 상위 라인 버퍼에 의한 인터 예측을 위한 방법 및 장치
KR20210154812A (ko) 비디오 코딩을 위한 방법, 장치 및 매체
KR20240063957A (ko) GPM(Geometric Partition Mode)에 대한 템플릿-매칭 기반 병합 인덱스 재순서화
KR20210134382A (ko) 참조 픽처 리샘플링을 위한 출력 픽처 크기의 시그널링

Legal Events

Date Code Title Description
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant