KR20210074280A - 아핀 모델 기반 비디오 코딩에 대한 아핀 모션 추정 - Google Patents

아핀 모델 기반 비디오 코딩에 대한 아핀 모션 추정 Download PDF

Info

Publication number
KR20210074280A
KR20210074280A KR1020217008427A KR20217008427A KR20210074280A KR 20210074280 A KR20210074280 A KR 20210074280A KR 1020217008427 A KR1020217008427 A KR 1020217008427A KR 20217008427 A KR20217008427 A KR 20217008427A KR 20210074280 A KR20210074280 A KR 20210074280A
Authority
KR
South Korea
Prior art keywords
block
mvp
list
coding block
mvs
Prior art date
Application number
KR1020217008427A
Other languages
English (en)
Inventor
유웬 헤
샤오유 시우
얀 예
지안콩 루오
Original Assignee
브이아이디 스케일, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브이아이디 스케일, 인크. filed Critical 브이아이디 스케일, 인크.
Publication of KR20210074280A publication Critical patent/KR20210074280A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • H04N19/54Motion estimation other than block-based using feature points or meshes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Golf Clubs (AREA)

Abstract

아핀 모델 기반 비디오 코딩에 대한 아핀 모션 추정을 위한 시스템들, 방법들 및 수단들이 본 명세서에 개시될 수 있다. 하나 이상의 모션 벡터(MV)를 포함하는 제1 MV 세트가 제1 코딩 블록에 대해 도출될 수 있다. MV들은 제어점 MV들(CPMV들)일 수 있고, MV들은 제1 코딩 블록과 연관된 아핀 모션 추정(ME)을 수행함으로써 도출될 수 있다. 제1 MV 세트가 최근에 추정된 MV 리스트에 추가될 수 있다. 최근에 추정된 MV 리스트의 헤드가 제1 MV 세트로 설정될 수 있다. 최근에 추정된 MV 리스트는 비어 있을 수 있거나 하나 이상의 이전에 추가된 MV 세트를 포함할 수 있다.

Description

아핀 모델 기반 비디오 코딩에 대한 아핀 모션 평가
관련 출원들에 대한 상호 참조
본 출원은 2018년 9월 21일자로 출원된 미국 가출원 제62/734,783호 및 2019년 3월 2일자로 출원된 미국 가출원 제62/812,979호의 이익을 주장하며, 그 내용들은 본 명세서에 참조로 포함된다.
비디오 코딩 시스템들은 디지털 비디오 신호들을 압축하는데, 예를 들어 이러한 신호들에 필요한 저장 및/또는 전송 대역폭을 감소시키는데 이용될 수 있다. 비디오 코딩 시스템들은 블록 기반, 웨이브릿 기반 및/또는 객체 기반 시스템들을 포함할 수 있다. 블록 기반 하이브리드 비디오 코딩 시스템이 배치될 수 있다.
비디오 코딩에 대한 모션 추정을 위한 시스템들, 방법들 및 수단들이 본 명세서에 개시될 수 있다. 모션 추정의 시작점은 최근에 추정된 MV 리스트 내의 하나 이상의 MV 세트에 적어도 부분적으로 기반하여 선택될 수 있다. 모션 추정의 시작점의 선택은 인코더 및/또는 디코더에 의해 수행될 수 있다. 인코더 및/또는 디코더는 무선 전송/수신 유닛(WTRU)일 수 있다. 예를 들어, 하나 이상의 모션 벡터(MV)를 포함하는 제1 MV 세트가 제1 코딩 블록에 대해 도출될 수 있다. MV들은 제어점 MV들(CPMV들)일 수 있고, MV들은 제1 코딩 블록과 연관된 아핀 모션 추정(ME)을 수행함으로써 도출될 수 있다. 제1 MV 세트가 최근에 추정된 MV 리스트에 추가될 수 있다. 최근에 추정된 MV 리스트의 헤드가 제1 MV 세트로 설정될 수 있다. 최근에 추정된 MV 리스트는 비어 있을 수 있거나 하나 이상의 이전에 추가된 MV 세트를 포함할 수 있다. 예를 들어, 최근에 추정된 MV 리스트는 모션 추정을 위한 하나 이상의 검색된 MV 세트를 포함할 수 있고, 최근에 추정된 MV 리스트 내의 각각의 검색된 MV 세트는 제2 코딩 블록의 이웃 블록, 제2 코딩 블록의 형제 블록, 제2 코딩 블록의 부모 블록, 또는 상이한 트리 파티션에 의한 제2 코딩 블록의 부모 블록의 자식 블록에 대해 선택된 MV 세트이다. 최근에 추정된 MV 리스트는, 예를 들어, 크기(예컨대, 4일 수 있음)를 갖는 선입선출(FIFO) 리스트일 수 있다. 최근에 추정된 MV 리스트 내의 하나 이상의 MV 세트 및 하나 이상의 MV 예측자에 적어도 부분적으로 기반하여 제2 코딩 블록에 대해 모션 추정을 위한 시작점이 선택될 수 있다. 제2 코딩 블록은 선택된 시작점에 기반하여 인코딩될 수 있다. 예를 들어, 제2 코딩 블록과 연관된 ME(예를 들어, 아핀 ME)는 선택된 시작점에 기반한다.
제1 트리 파티션은 제2 코딩 블록의 부모 블록을 제2 코딩 블록 및 적어도 하나의 형제 블록으로 분할할 수 있다. 제2 트리 파티션은 제2 코딩 블록의 부모 블록을 하나 이상의(예를 들어, 2개의) 자식 블록으로 분할할 수 있다. 제1 코딩 블록은 제2 코딩 블록의 이웃 블록, 제2 코딩 블록의 형제 블록, 제2 코딩 블록의 부모 블록, 또는 제2 트리 파티션에 의한 부모 블록의 자식 블록일 수 있다. 제2 코딩 블록이 제1 트리 파티션에서의 마지막 블록이면, MV 리스트의 헤드는 부모 블록과 연관된 MV 세트로 설정될 수 있다.
최근에 추정된 MV 리스트는 최대 크기와 연관될 수 있다. 예를 들어, 코딩 블록(예컨대, 제1 코딩 블록)에 대한 MV들을 도출한 후에, 최근에 추정된 MV 리스트의 크기가 최대 크기와 동일한지가 결정될 수 있다. 최근에 추정된 MV 리스트가 최대 크기와 동일한 경우, 코딩 블록에 대한 MV들을 추가하기 전에 최근에 추정된 MV 리스트로부터 가장 덜 최근에 추정된 MV 세트가 제거될 수 있다.
MV 세트 및/또는 MVP 세트가 결정될 수 있다. MV 세트는, 예를 들어, 하나 이상의(예컨대, 3개의) MV(예컨대, 제어점 MV)를 포함할 수 있다. 예를 들어, MV 세트는 {MV0, MV1, MV2}로 표시될 수 있다. MVP 세트는, 예를 들어, 하나 이상의(예컨대, 3개의) MVP(예컨대, 아핀 MVP)를 포함할 수 있다. 예를 들어, MV 세트는 {MVP0, MVP1, MVP2}로 표시될 수 있다. MV 세트의 제1 MV(예컨대, MV1)가 MVP 세트의 제1 MVP(예컨대, MVP1)와 동일한지가 결정될 수 있다. 제1 MV가 제1 MVP와 동일하지 않으면, MV-MVP 조합된 세트는 MV 세트 내의 제1 MV를 제1 MVP로 대체함으로써 생성될 수 있다. MV-MVP 조합된 세트의 비트 코스트(예컨대, ME 코스트)가 결정될 수 있다. 예를 들어, 비트 코스트는 MV-MVP 조합된 세트 내의 각각의 MV에 대한 각각의 비트 코스트 및/또는 예측 오차에 기반하여 결정될 수 있다. MV 세트 또는 MV-MVP 조합된 세트는 MV-MVP 조합된 세트의 비트 코스트에 기반하여 최상의 세트로서 선택될 수 있다. MV-MVP 조합된 세트의 비트 코스트는 MV 세트의 비트 코스트와 비교될 수 있다. 예를 들어, MV-MVP 조합된 세트의 비트 코스트가 MV 세트의 비트 코스트보다 낮으면, MV-MVP 조합된 세트가 선택될 수 있다. 그렇지 않으면, MV 세트가 선택될 수 있다.
MV 세트의 제2 MV(예컨대, MV2)가 MVP 세트의 제2 MVP(예컨대, MVP2)와 동일한지가 결정될 수 있다. 제2 MV가 제2 MVP와 동일하지 않으면, 제2 MV는 MV-MVP 조합된 세트 내의 제2 MVP로 대체되어 (예컨대, {MV0, MVP1, MVP2}로서 표시될 수 있는) 제2 MV-MVP 조합된 세트를 생성할 수 있다. 제2 MV-MVP 조합된 세트의 비트 코스트(예컨대, ME 코스트)가 결정될 수 있다. 제2 MV-MVP 조합된 세트의 비트 코스트가 현재 최상의 세트의 코스트와 비교될 수 있고, 업데이트된 최상의 세트가 선택될 수 있다. 예를 들어, 제2 MV-MVP 조합된 세트의 비트 코스트가 현재 최상의 세트의 비트 코스트보다 낮은 경우, 제2 MV-MVP 조합된 세트가 업데이트된 최상의 세트로서 선택될 수 있다. 그렇지 않으면, 현재 최상의 세트가 업데이트된 최상의 세트로서 선택될 수 있다.
도 1a는 예시적인 통신 시스템을 도시하는 시스템도이다.
도 1b는 도 1a에 도시된 통신 시스템 내에서 이용될 수 있는 예시적인 무선 전송/수신 유닛(WTRU)을 도시하는 시스템도이다.
도 1c는 도 1a에 도시된 통신 시스템 내에서 이용될 수 있는 예시적인 무선 액세스 네트워크(RAN) 및 예시적인 코어 네트워크(CN)를 도시하는 시스템도이다.
도 1d는 도 1a에 예시된 통신 시스템 내에서 이용될 수 있는 추가의 예시적인 RAN 및 추가의 예시적인 CN을 도시하는 시스템도이다.
도 2는 블록 기반 비디오 인코더의 예시적인 도면을 도시한다.
도 3은 비디오 디코더의 예시적인 블록도를 도시한다.
도 4는 다중 유형의 트리 구조에서의 예시적인 블록 파티션들을 도시한다.
도 5는 4-파라미터 아핀 모드의 예를 도시한다.
도 6은 6-파라미터 아핀 모드의 예를 도시한다.
도 7은 아핀 병합 후보들의 예를 도시한다.
도 8은 아핀 모션 모델에 대한 제어점들에서의 모션 벡터 도출의 예를 도시한다.
도 9는 예시적인 아핀 모션 벡터 예측자 구성을 도시한다.
도 10은 코딩 유닛에 대한 예시적인 모션 모델 선택을 도시한다.
도 11a 내지 도 11f는 리스트의 현재 헤드가 음영처리된 예시적인 아핀 MV 리스트 업데이트들을 도시한다.
도 12는 아핀 모션 추정 후의 예시적인 추가의 조합된 MV 세트 체크를 도시한다.
도 13은 8x8 코딩 유닛(CU)에 대한 예시적인 그레디언트 계산을 도시한다.
도 14는 8x8 CU에 대한 예시적인 그레디언트 계산을 도시한다.
첨부 도면들과 관련하여 예로서 주어지는 이하의 설명으로부터 더 상세한 이해가 이루어질 수 있다.
도 1a는 하나 이상의 개시된 예가 구현될 수 있는 예시적인 통신 시스템(100)을 도시하는 도면이다. 통신 시스템(100)은 음성, 데이터, 비디오, 메시징, 브로드캐스트 등과 같은 콘텐츠를 복수의 무선 사용자에게 제공하는 다중 액세스 시스템일 수 있다. 통신 시스템(100)은 복수의 무선 사용자가 무선 대역폭을 포함하는 시스템 자원들의 공유를 통해 이러한 콘텐츠에 액세스하는 것을 가능하게 할 수 있다. 예를 들어, 통신 시스템들(100)은 CDMA(code division multiple access), TDMA(time division multiple access), FDMA(frequency division multiple access), OFDMA(orthogonal FDMA), SC-FDMA(single-carrier FDMA), ZT UW DTS-s OFDM(zero-tail unique-word DFT-Spread OFDM), UW-OFDM(unique word OFDM), 자원 블록 필터링된 OFDM, FBMC(filter bank multicarrier) 등과 같은 하나 이상의 채널 액세스 방법을 이용할 수 있다.
도 1a에 도시된 바와 같이, 통신 시스템(100)은 무선 전송/수신 유닛들(WTRU들)(102a, 102b, 102c, 102d), RAN(104/113), CN(106/115), PSTN(public switched telephone network)(108), 인터넷(110), 및 다른 네트워크들(112)을 포함할 수 있지만, 개시된 예들은 임의의 수의 WTRU들, 기지국들, 네트워크들 및/또는 네트워크 요소들을 고려할 수 있다는 것이 이해될 것이다. WTRU들(102a, 102b, 102c, 102d) 각각은 무선 환경에서 동작하고/하거나 통신하도록 구성된 임의의 유형의 디바이스일 수 있다. 예로서, 임의의 것이 "스테이션" 및/또는 "STA"라고 지칭될 수 있는 WTRU들(102a, 102b, 102c, 102d)은 무선 신호들을 전송 및/또는 수신하도록 구성될 수 있고, 사용자 장비(UE), 이동국, 고정 또는 이동 가입자 유닛, 가입 기반 유닛, 페이저, 셀룰러 전화, PDA(personal digital assistant), 스마트폰, 랩톱, 넷북, 개인용 컴퓨터, 무선 센서, 핫스폿 또는 Mi-Fi 디바이스, 사물 인터넷(IoT) 디바이스, 시계 또는 다른 웨어러블, HMD(head-mounted display), 차량, 드론, 의료 디바이스 및 애플리케이션들(예컨대, 원격 진료), 산업 디바이스 및 애플리케이션들(예컨대, 산업 및/또는 자동화된 처리 체인 상황들에서 동작하는 로봇 및/또는 다른 무선 디바이스들), 소비자 전자기기 디바이스, 상업 및/또는 산업 무선 네트워크들 상에서 동작하는 디바이스 등을 포함할 수 있다. WTRU들(102a, 102b, 102c 및 102d) 중 임의의 것은 UE로 상호교환적으로 지칭될 수 있다.
통신 시스템들(100)은 또한 기지국(114a) 및/또는 기지국(114b)을 포함할 수 있다. 기지국들(114a, 114b) 각각은 CN(106/115), 인터넷(110), 및/또는 다른 네트워크들(112)과 같은 하나 이상의 통신 네트워크에 대한 액세스를 용이하게 하기 위해 WTRU들(102a, 102b, 102c, 102d) 중 적어도 하나와 무선으로 인터페이싱하도록 구성된 임의의 유형의 디바이스일 수 있다. 예로서, 기지국들(114a, 114b)은 BTS(base transceiver station), Node-B, eNode B, 홈 Node B, 홈 eNode B, gNB, NR NodeB, 사이트 제어기, 액세스 포인트(AP), 무선 라우터 등일 수 있다. 기지국들(114a, 114b)이 단일 요소로서 각각 묘사되지만, 기지국들(114a, 114b)은 임의의 수의 상호접속된 기지국들 및/또는 네트워크 요소들을 포함할 수 있다는 것을 알 것이다.
기지국(114a)은 다른 기지국들, 및/또는 기지국 제어기(BSC), 무선 네트워크 제어기(RNC), 릴레이 노드들 등과 같은 네트워크 요소들(도시되지 않음)도 포함할 수 있는 RAN(104/113)의 일부일 수 있다. 기지국(114a) 및/또는 기지국(114b)은 셀(도시되지 않음)이라고 지칭될 수 있는 하나 이상의 캐리어 주파수 상에서 무선 신호들을 전송 및/또는 수신하도록 구성될 수 있다. 이러한 주파수들은 허가 스펙트럼 및 비허가 스펙트럼 또는 허가 스펙트럼과 비허가 스펙트럼의 조합 내에 있을 수 있다. 셀은 비교적 고정될 수 있거나 시간 경과에 따라 변할 수 있는 특정 지리 영역에 대한 무선 서비스를 위한 커버리지를 제공할 수 있다. 셀은 또한 셀 섹터들로 분할될 수 있다. 예를 들어, 기지국(114a)과 연관된 셀은 3개의 섹터로 분할될 수 있다. 따라서, 예에서, 기지국(114a)은 3개의 트랜시버, 즉 셀의 섹터마다 하나의 트랜시버를 포함할 수 있다. 예에서, 기지국(114a)은 MIMO(multiple-input multiple output) 기술을 이용할 수 있고, 셀의 섹터마다 복수의 트랜시버를 이용할 수 있다. 예를 들어, 신호들을 원하는 공간 방향들로 전송 및/또는 수신하기 위해 빔포밍(beamforming)이 이용될 수 있다.
기지국들(114a, 114b)은 임의의 적절한 무선 통신 링크(예컨대, RF(radio frequency), 마이크로파, 센티미터파, 마이크로미터파, IR(infrared), UV(ultraviolet), 가시광 등)일 수 있는 에어 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c, 102d) 중 하나 이상과 통신할 수 있다. 에어 인터페이스(116)는 임의의 적절한 RAT(radio access technology)를 이용하여 확립될 수 있다.
더 구체적으로, 전술한 바와 같이, 통신 시스템(100)은 다중 액세스 시스템일 수 있고, CDMA, TDMA, FDMA, OFDMA, SC-FDMA 등과 같은 하나 이상의 채널 액세스 방식을 이용할 수 있다. 예를 들어, RAN(104/113) 내의 기지국(114a), 및 WTRU들(102a, 102b, 102c)은 WCDMA(wideband CDMA)를 이용하여 에어 인터페이스(115/116/117)를 확립할 수 있는 UTRA(Universal Mobile Telecommunications System(UMTS) Terrestrial Radio Access)와 같은 무선 기술을 구현할 수 있다. WCDMA는 HSPA(High-Speed Packet Access) 및/또는 HSPA+(Evolved HSPA)와 같은 통신 프로토콜들을 포함할 수 있다. HSPA는 고속 다운링크(DL) 패킷 액세스(HSDPA) 및/또는 고속 UL 패킷 액세스(HSUPA)를 포함할 수 있다.
예에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 LTE(Long Term Evolution) 및/또는 LTE-A(LTE-Advanced) 및/또는 LTE-A Pro(LTE-Advanced Pro)를 이용하여 에어 인터페이스(116)를 확립할 수 있는 E-UTRA(Evolved UMTS Terrestrial Radio Access)와 같은 무선 기술을 구현할 수 있다.
예에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 NR(New Radio)을 이용하여 에어 인터페이스(116)를 확립할 수 있는 NR 무선 액세스와 같은 무선 기술을 구현할 수 있다.
예에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 복수의 무선 액세스 기술을 구현할 수 있다. 예를 들어, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 예를 들어 이중 접속성(DC) 원리들을 이용하여 LTE 무선 액세스 및 NR 무선 액세스를 함께 구현할 수 있다. 따라서, WTRU들(102a, 102b, 102c)에 의해 이용되는 에어 인터페이스는 복수의 유형의 무선 액세스 기술들 및/또는 복수의 유형의 기지국들(예컨대, eNB 및 gNB)로/로부터 전송되는 전송들에 의해 특성화될 수 있다.
예들에서, 기지국(114a) 및 WTRU들(102a, 102b, 102c)은 IEEE 802.11(즉, WiFi(Wireless Fidelity)), IEEE 802.16(즉, WiMAX(Worldwide Interoperability for Microwave Access)), CDMA2000, CDMA2000 1X, CDMA2000 EV-DO, IS-2000(Interim Standard 2000), IS-95(Interim Standard 95), IS-856(Interim Standard 856), GSM(Global System for Mobile communications), EDGE(Enhanced Data rates for GSM Evolution), GERAN(GSM EDGE) 등과 같은 무선 기술들을 구현할 수 있다.
도 1a의 기지국(114b)은 예를 들어 무선 라우터, 홈 Node B, 홈 eNode B, 또는 액세스 포인트일 수 있고, 사업장, 홈, 차량, 캠퍼스, 산업 시설, (예를 들어, 드론들에 의한 이용을 위한) 공중 회랑(air corridor), 도로 등과 같은 국지화된 영역에서의 무선 접속성을 용이하게 하기 위해 임의의 적절한 RAT를 이용할 수 있다. 예에서, 기지국(114b) 및 WTRU들(102c, 102d)은 WLAN(wireless local area network)을 확립하기 위해 IEEE 802.11과 같은 무선 기술을 구현할 수 있다. 예에서, 기지국(114b) 및 WTRU들(102c, 102d)은 WPAN(wireless personal area network)을 확립하기 위해 IEEE 802.15와 같은 무선 기술을 구현할 수 있다. 예에서, 기지국(114b) 및 WTRU들(102c, 102d)은 피코셀 또는 펨토셀을 확립하기 위해 셀룰러 기반 RAT(예컨대, WCDMA, CDMA2000, GSM, LTE, LTE-A, LTE-A Pro, NR 등)를 이용할 수 있다. 도 1a에 도시된 바와 같이, 기지국(114b)은 인터넷(110)에 대한 직접 접속을 가질 수 있다. 따라서, 기지국(114b)은 CN(106/115)을 통해 인터넷(110)에 액세스하도록 요구되지 않을 수 있다.
RAN(104/113)은 음성, 데이터, 애플리케이션들, 및/또는 VoIP(voice over internet protocol) 서비스들을 WTRU들(102a, 102b, 102c, 102d) 중 하나 이상에 제공하도록 구성된 임의의 유형의 네트워크일 수 있는 CN(106/115)과 통신할 수 있다. 데이터는 상이한 처리량 요구들, 레이턴시 요구들, 오차 허용한계 요구들, 신뢰성 요구들, 데이터 처리량 요구들, 이동성 요구들 등과 같은 다양한 서비스 품질(QoS) 요구들을 가질 수 있다. CN(106/115)은 호출 제어, 과금 서비스들, 이동 위치 기반 서비스들, 선불 통화, 인터넷 접속성, 비디오 배포 등을 제공하고/하거나, 사용자 인증과 같은 하이 레벨 보안 기능들을 수행할 수 있다. 도 1a에 도시되지 않지만, RAN(104/113) 및/또는 CN(106/115)이 RAN(104/113)과 동일한 RAT 또는 상이한 RAT를 이용하는 다른 RAN들과 직접 또는 간접 통신을 할 수 있다는 것이 이해될 것이다. 예를 들어, NR 무선 기술을 이용하는 것일 수 있는 RAN(104/113)에 대한 접속에 더하여, CN(106/115)은 또한 GSM, UMTS, CDMA 2000, WiMAX, E-UTRA, 또는 WiFi 무선 기술을 이용하여 다른 RAN(도시되지 않음)과 통신할 수 있다.
CN(106/115)은 또한 WTRU들(102a, 102b, 102c, 102d)이 PSTN(108), 인터넷(110), 및/또는 다른 네트워크들(112)에 액세스하기 위한 게이트웨이로서 역할을 할 수 있다. PSTN(108)은 POTS(plain old telephone service)를 제공하는 회선 교환 전화 네트워크들을 포함할 수 있다. 인터넷(110)은 TCP/IP 인터넷 프로토콜 모음 내의 TCP(transmission control protocol), UDP(user datagram protocol) 및/또는 IP(internet protocol)와 같은 공통 통신 프로토콜들을 이용하는 상호접속된 컴퓨터 네트워크들 및 디바이스들의 글로벌 시스템을 포함할 수 있다. 네트워크들(112)은 다른 서비스 제공자들에 의해 소유되고/되거나 운영되는 유선 및/또는 무선 통신 네트워크들을 포함할 수 있다. 예를 들어, 네트워크들(112)은 RAN(104/113)과 동일한 RAT 또는 상이한 RAT를 이용할 수 있는 하나 이상의 RAN에 접속된 다른 CN을 포함할 수 있다.
통신 시스템(100) 내의 WTRU들(102a, 102b, 102c, 102d) 중 일부 또는 전부는 다중-모드 능력들을 포함할 수 있다(예컨대, WTRU들(102a, 102b, 102c, 102d)은 상이한 무선 링크들을 통해 상이한 무선 네트워크들과 통신하기 위한 복수의 트랜시버를 포함할 수 있다). 예를 들어, 도 1a에 도시된 WTRU(102c)는 셀룰러 기반 무선 기술을 이용할 수 있는 기지국(114a) 및 IEEE 802 무선 기술을 이용할 수 있는 기지국(114b)과 통신하도록 구성될 수 있다.
도 1b는 예시적인 WTRU(102)를 도시하는 시스템도이다. 도 1b에 도시된 바와 같이, WTRU(102)는 특히 프로세서(118), 트랜시버(120), 전송/수신 요소(122), 스피커/마이크로폰(124), 키패드(126), 디스플레이/터치패드(128), 비이동식 메모리(130), 이동식 메모리(132), 전원(134), GPS(global positioning system) 칩셋(136), 및/또는 다른 주변기기들(138)을 포함할 수 있다. WTRU(102)는 전술한 요소들의 임의의 하위 조합을 포함할 수 있다는 것이 이해될 것이다.
프로세서(118)는 범용 프로세서, 특수 목적 프로세서, 종래의 프로세서, DSP(digital signal processor), 복수의 마이크로프로세서, DSP 코어와 연관된 하나 이상의 마이크로프로세서, 제어기, 마이크로제어기, ASIC(Application Specific Integrated Circuit), FPGA(Field Programmable Gate Array) 회로들, 임의의 다른 유형의 IC, 상태 기계 등일 수 있다. 프로세서(118)는 WTRU(102)가 무선 환경에서 동작할 수 있게 하는 신호 코딩, 데이터 처리, 전력 제어, 입력/출력 처리, 및/또는 임의의 다른 기능을 수행할 수 있다. 프로세서(118)는 전송/수신 요소(122)에 결합될 수 있는 트랜시버(120)에 결합될 수 있다. 도 1b가 프로세서(118) 및 트랜시버(120)를 별개의 구성요소들로서 도시하지만, 프로세서(118) 및 트랜시버(120)는 전자 패키지 또는 칩 내에 함께 통합될 수 있다는 것을 알 것이다.
전송/수신 요소(122)는 에어 인터페이스(116)를 통해 기지국(예컨대, 기지국(114a))으로 신호들을 전송하거나 기지국으로부터 신호들을 수신하도록 구성될 수 있다. 예를 들어, 예에서, 전송/수신 요소(122)는 RF 신호들을 전송 및/또는 수신하도록 구성된 안테나일 수 있다. 예에서, 전송/수신 요소(122)는 예를 들어 IR, UV, 또는 가시광 신호들을 전송 및/또는 수신하도록 구성된 방출기/검출기일 수 있다. 예에서, 전송/수신 요소(122)는 RF 및 광 신호들 둘 다를 전송 및/또는 수신하도록 구성될 수 있다. 전송/수신 요소(122)가 무선 신호들의 임의의 조합을 전송 및/또는 수신하도록 구성될 수 있다는 것이 이해될 것이다.
전송/수신 요소(122)가 단일 요소로서 도 1b에 도시되지만, WTRU(102)는 임의의 수의 전송/수신 요소(122)를 포함할 수 있다. 더 구체적으로, WTRU(102)는 MIMO 기술을 이용할 수 있다. 따라서, 예에서, WTRU(102)는 에어 인터페이스(116)를 통해 무선 신호들을 전송 및 수신하기 위한 2개 이상의 전송/수신 요소(122)(예컨대, 복수의 안테나)를 포함할 수 있다.
트랜시버(120)는 전송/수신 요소(122)에 의해 전송될 신호들을 변조하고 전송/수신 요소(122)에 의해 수신되는 신호들을 복조하도록 구성될 수 있다. 전술한 바와 같이, WTRU(102)는 다중 모드 능력들을 가질 수 있다. 따라서, 트랜시버(120)는 WTRU(102)가 예를 들어 NR 및 IEEE 802.11과 같은 복수의 RAT를 통해 통신할 수 있게 하기 위한 복수의 트랜시버를 포함할 수 있다.
WTRU(102)의 프로세서(118)는 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)(예컨대, LCD 디스플레이 유닛 또는 OLED 디스플레이 유닛)에 결합될 수 있고 이로부터 사용자 입력 데이터를 수신할 수 있다. 프로세서(118)는 또한 사용자 데이터를 스피커/마이크로폰(124), 키패드(126), 및/또는 디스플레이/터치패드(128)에 출력할 수 있다. 또한, 프로세서(118)는 비이동식 메모리(130) 및/또는 이동식 메모리(132)와 같은 임의의 유형의 적절한 메모리로부터의 정보에 액세스하고 그 안에 데이터를 저장할 수 있다. 비이동식 메모리(130)는 RAM(random-access memory), ROM(read-only memory), 하드 디스크, 또는 임의의 다른 유형의 메모리 저장 디바이스를 포함할 수 있다. 이동식 메모리(132)는 SIM(subscriber identity module) 카드, 메모리 스틱, SD(secure digital) 메모리 카드 등을 포함할 수 있다. 예들에서, 프로세서(118)는 WTRU(102) 상에, 예를 들어 서버 또는 홈 컴퓨터(도시되지 않음) 상에 물리적으로 위치되지 않은 메모리로부터의 정보에 액세스하고 그 안에 데이터를 저장할 수 있다.
프로세서(118)는 전원(134)으로부터 전력을 수신할 수 있고, WTRU(102) 내의 다른 구성요소들에 전력을 분배하고/하거나 제어하도록 구성될 수 있다. 전원(134)은 WTRU(102)에 전력을 공급하기 위한 임의의 적절한 디바이스일 수 있다. 예를 들어, 전원(134)은 하나 이상의 건전지 배터리(예컨대, 니켈-카드뮴(NiCd), 니켈-아연(NiZn), 니켈 금속 수소화물(NiMH), 리튬-이온(Li-ion) 등), 태양 전지들, 연료 전지들 등을 포함할 수 있다.
프로세서(118)는 또한 WTRU(102)의 현재 위치에 관한 위치 정보(예컨대, 경도 및 위도)를 제공하도록 구성될 수 있는 GPS 칩셋(136)에 결합될 수 있다. GPS 칩셋(136)으로부터의 정보에 더하여 또는 그 대신에, WTRU(102)는 기지국(예컨대, 기지국들(114a, 114b))으로부터 에어 인터페이스(116)를 통해 위치 정보를 수신하고/하거나 2개 이상의 근처 기지국으로부터 수신되고 있는 신호들의 타이밍에 기반하여 그 위치를 결정할 수 있다. WTRU(102)가 임의의 적합한 위치 결정 방법에 의해 위치 정보를 획득할 수 있다는 것이 이해될 것이다.
프로세서(118)는 추가적인 특징들, 기능 및/또는 유선 또는 무선 접속성을 제공하는 하나 이상의 소프트웨어 및/또는 하드웨어 모듈을 포함할 수 있는 다른 주변기기들(138)에 추가로 결합될 수 있다. 예를 들어, 주변기기들(138)은 가속도계, 전자 나침반, 위성 트랜시버, (사진들 및/또는 비디오를 위한) 디지털 카메라, 범용 직렬 버스(USB) 포트, 진동 디바이스, 텔레비전 트랜시버, 핸즈프리 헤드셋, Bluetooth® 모듈, 주파수 변조(FM) 무선 유닛, 디지털 음악 플레이어, 미디어 플레이어, 비디오 게임 플레이어 모듈, 인터넷 브라우저, 가상 현실 및/또는 증강 현실(VR/AR) 디바이스, 활동 추적기 등을 포함할 수 있다. 주변기기들(138)은 하나 이상의 센서를 포함할 수 있고, 센서들은 자이로스코프, 가속도계, 홀 효과 센서, 자력계, 배향 센서, 근접 센서, 온도 센서, 시간 센서, 지리 위치 센서, 고도계, 광 센서, 터치 센서, 자력계, 기압계, 제스처 센서, 생체인식 센서, 및/또는 습도 센서 중 하나 이상일 수 있다.
WTRU(102)는 (예컨대, 전송을 위한) UL 및 (예컨대, 수신을 위한) 다운링크 둘 다에 대한 특정 서브프레임들과 연관된 것과 같은) 신호들 중 일부 또는 전부의 전송 및 수신이 병행적이고/이거나 동시적일 수 있는 전이중화 무선을 포함할 수 있다. 전이중화 무선은 하드웨어(예를 들어, 초크(choke))를 통해 또는 프로세서(예를 들어, 별개의 프로세서(도시되지 않음) 또는 프로세서(118))를 통한 신호 처리를 통해 자기-간섭을 줄이고/줄이거나 실질적으로 제거하는 간섭 관리 유닛(139)을 포함할 수 있다. 예에서, WTRU(102)는 (예컨대, 전송을 위한) UL 또는 (예컨대, 수신을 위한) 다운링크에 대한 특정 서브프레임들과 연관된 것과 같은) 신호들 중 일부 또는 전부의 전송 및 수신을 위한 반이중화 무선을 포함할 수 있다.
도 1c는 예시적인 RAN(104) 및 CN(106)을 도시하는 시스템도이다. 전술한 바와 같이, RAN(104)은 에어 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 E-UTRA 무선 기술을 이용할 수 있다. RAN(104)은 또한 CN(106)과 통신할 수 있다.
RAN(104)은 eNode-B들(160a, 160b, 160c)을 포함할 수 있지만, RAN(104)이 임의의 수의 eNode-B들을 포함할 수있다는 것이 이해될 것이다. eNode-B들(160a, 160b, 160c) 각각은 에어 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위한 하나 이상의 트랜시버를 포함할 수 있다. 예에서, eNode-B들(160a, 160b, 160c)은 MIMO 기술을 구현할 수 있다. 따라서, eNode-B(160a)는 예를 들어 WTRU(102a)에 무선 신호들을 전송하고/하거나 그로부터 무선 신호들을 수신하기 위해 복수의 안테나를 이용할 수 있다.
eNode-B들(160a, 160b, 160c) 각각은 특정 셀(도시되지 않음)과 연관될 수 있고, 무선 자원 관리 결정들, 핸드오버 결정들, UL 및/또는 DL에서의 사용자들의 스케줄링 등을 처리하도록 구성될 수 있다. 도 1c에 도시된 바와 같이, eNode-B들(160a, 160b, 160c)은 X2 인터페이스를 통해 서로 통신할 수 있다.
도 1c에 도시된 CN(106)은 이동성 관리 엔티티(MME)(162), 서빙 게이트웨이(SGW)(164), 및 패킷 데이터 네트워크(PDN) 게이트웨이(또는 PGW)(166)를 포함할 수 있다. 전술한 요소들 각각이 CN(106)의 일부로서 묘사되지만, 이들 요소들 중 임의의 것이 CN 운영자 이외의 엔티티에 의해 소유되고/되거나 운영될 수 있다는 것이 이해될 것이다.
MME(162)는 S1 인터페이스를 통해 RAN(104) 내의 eNode-B들(162a, 162b, 162c) 각각에 접속될 수 있고, 제어 노드로서 역할을 할 수 있다. 예를 들어, MME(162)는 WTRU들(102a, 102b, 102c)의 사용자들의 인증, 베어러 활성화/비활성화, WTRU들(102a, 102b, 102c)의 초기 부착 동안의 특정 서빙 게이트웨이의 선택 등을 담당할 수 있다. MME(162)는 RAN(104)과, GSM 및/또는 WCDMA와 같은 다른 무선 기술들을 이용하는 다른 RAN들(도시되지 않음) 간에 스위칭하기 위한 제어 평면 기능을 제공할 수 있다.
SGW(164)는 S1 인터페이스를 통해 RAN(104) 내의 eNode B들(160a, 160b, 160c) 각각에 접속될 수 있다. SGW(164)는 일반적으로 WTRU들(102a, 102b, 102c)로/로부터 사용자 데이터 패킷들을 라우팅하고 전달할 수 있다. SGW(164)는 eNode B간 핸드오버들 동안 사용자 평면들을 앵커링(anchoring)하는 것, WTRU들(102a, 102b, 102c)에 대해 DL 데이터가 이용가능할 때 페이징(paging)을 트리거링하는 것, WTRU들(102a, 102b, 102c)의 상황들을 관리하고 저장하는 것 등과 같은 다른 기능들을 수행할 수 있다.
SGW(164)는 WTRU들(102a, 102b, 102c)과 IP-인에이블드 디바이스들 사이의 통신들을 용이하게 하기 위해, 인터넷(110)과 같은 패킷 교환 네트워크들에 대한 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있는 PGW(166)에 접속될 수 있다.
CN(106)은 다른 네트워크들과의 통신을 용이하게 할 수 있다. 예를 들어, CN(106)은 WTRU들(102a, 102b, 102c)과 전통적인 지상선 통신 디바이스들 사이의 통신들을 용이하게 하기 위해, PSTN(108)과 같은 회선 교환 네트워크들에 대한 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다. 예를 들어, CN(106)은 CN(106)과 PSTN(108) 사이의 인터페이스로서 역할하는 IP 게이트웨이(예컨대, IMS(IP multimedia subsystem) 서버)를 포함할 수 있거나 이와 통신할 수 있다. 또한, CN(106)은 다른 서비스 제공자들에 의해 소유되고/되거나 운영되는 다른 유선 및/또는 무선 네트워크들을 포함할 수 있는 다른 네트워크들(112)에 대한 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다.
WTRU가 도 1a 내지 도 1d에서 무선 단말기로서 설명되지만, 특정 예들에서 이러한 단말기는 통신 네트워크와의 유선 통신 인터페이스들을 (예를 들어, 일시적으로 또는 영구적으로) 이용할 수 있다는 것이 고려된다.
예들에서, 다른 네트워크(112)는 WLAN일 수 있다.
인프라스트럭처 기본 서비스 세트(BSS) 모드에서의 WLAN은 BSS에 대한 액세스 포인트(AP) 및 AP와 연관된 하나 이상의 스테이션(STA)을 가질 수 있다. AP는 BSS로/로부터 트래픽을 운반하는 분배 시스템(DS) 또는 다른 유형의 유선/무선 네트워크에 대한 액세스 또는 인터페이스를 가질 수 있다. BSS 외부로부터 비롯되는 STA들에 대한 트래픽은 AP를 통해 도착할 수 있고 STA들에 전달될 수 있다. STA들로부터 BSS 외부의 목적지들로 비롯되는 트래픽은 각각의 목적지들로 전달되도록 AP에 전송될 수 있다. BSS 내의 STA들 간의 트래픽은 AP를 통해 전송될 수 있는데, 예를 들어 소스 STA는 트래픽을 AP에 전송할 수 있고, AP는 트래픽을 목적지 STA에 전달할 수 있다. BSS 내의 STA들 간의 트래픽은 피어-투-피어 트래픽으로 고려되고/되거나 지칭될 수 있다. 피어-투-피어 트래픽은 직접 링크 셋업(DLS)을 이용하여 소스 및 목적지 STA들 사이에서(예컨대, 그들 사이에서 직접) 전송될 수 있다. 예들에서, DLS는 802.11e DLS 또는 802.11z TDLS(tunneled DLS)를 이용할 수 있다. IBSS(Independent BSS) 모드를 이용하는 WLAN은 AP를 갖지 않을 수 있고, IBSS 내의 또는 IBSS를 이용하는 STA들(예를 들어, 모든 STA들)은 서로 직접 통신할 수 있다. IBSS 통신 모드는 때때로 본 명세서에서 "애드혹" 통신 모드라고 지칭될 수 있다.
802.11ac 인프라스트럭처 동작 모드 또는 유사한 동작 모드를 이용할 때, AP는 주 채널과 같은 고정 채널 상에서 비컨을 전송할 수 있다. 주 채널은 고정된 폭(예를 들어, 20MHz 폭의 대역폭) 또는 시그널링을 통한 동적 설정 폭일 수 있다. 주 채널은 BSS의 동작 채널일 수 있으며, STA들에 의해 AP와의 접속을 확립하는데 이용될 수 있다. 예들에서, CSMA/CA(Carrier Sense Multiple Access with Collision Avoidance)가 예를 들어 802.11 시스템들에서 구현될 수 있다. CSMA/CA의 경우, AP를 포함하는 STA들(예를 들어, 모든 STA)은 주 채널을 감지할 수 있다. 주 채널이 감지/검출되고/되거나 특정 STA에 의해 이용 중인 것으로 결정되면, 특정 STA는 백오프될 수 있다. 하나의 STA(예를 들어, 단지 하나의 스테이션)가 주어진 BSS에서 임의의 주어진 시간에 전송할 수 있다.
고처리량(HT) STA들은 예를 들어 인접하거나 인접하지 않은 20MHz 채널과 주 20MHz 채널의 조합을 통한 통신을 위해 40MHz 폭의 채널을 이용하여 40MHz 폭의 채널을 형성할 수 있다.
초고처리량(VHT) STA들은 20MHz, 40MHz, 80MHz 및/또는 160MHz 폭의 채널들을 지원할 수 있다. 40MHz 및/또는 80MHz 채널들은 인접한 20MHz 채널들을 조합함으로써 형성될 수 있다. 160MHz 채널은 8개의 인접한 20MHz 채널을 조합하거나 또는 80+80 구성이라고 지칭될 수 있는 2개의 비인접 80MHz 채널을 조합함으로써 형성될 수 있다. 80+80 구성의 경우, 데이터는 채널 인코딩 후에 데이터를 2개의 스트림으로 분할할 수 있는 세그먼트 파서를 통해 전달될 수 있다. IFFT(Inverse Fast Fourier Transform) 처리 및 시간 도메인 처리가 각각의 스트림에 대해 개별적으로 행해질 수 있다. 스트림들은 2개의 80MHz 채널에 매핑될 수 있고, 데이터는 전송 STA에 의해 전송될 수 있다. 수신 STA의 수신기에서, 80+80 구성에 대한 전술한 동작이 반전될 수 있고, 조합된 데이터는 매체 액세스 제어(MAC)에 전송될 수 있다.
1 GHz 미만의 동작 모드들은 802.11af 및 802.11ah에 의해 지원된다. 채널 동작 대역폭들 및 캐리어들은 802.11n 및 802.11ac에서 이용되는 것들에 비해 802.11af 및 802.11ah에서 감소된다. 802.11af는 TV 백색 공간(TVWS) 스펙트럼에서 5MHz, 10MHz 및 20MHz 대역폭들을 지원하고, 802.11ah는 비-TVWS 스펙트럼을 이용하는 1MHz, 2MHz, 4MHz, 8MHz 및 16MHz 대역폭들을 지원한다. 예에 따르면, 802.11ah는 매크로 커버리지 영역 내의 MTC 디바이스들과 같은 미터 유형 제어/기계 유형 통신들을 지원할 수 있다. MTC 디바이스들은 특정 능력들, 예를 들어 특정의 그리고/또는 제한된 대역폭들에 대한 지원(예를 들어, 이들만의 지원)을 포함하는 제한된 능력들을 가질 수 있다. MTC 디바이스들은 (예를 들어, 매우 긴 배터리 수명을 유지하기 위해) 임계치를 넘는 배터리 수명을 갖는 배터리를 포함할 수 있다.
802.11n, 802.11ac, 802.11af 및 802.11ah와 같은 복수의 채널 및 채널 대역폭을 지원할 수 있는 WLAN 시스템들은 주 채널로서 지정될 수 있는 채널을 포함한다. 주 채널은 BSS 내의 모든 STA들에 의해 지원되는 가장 큰 공통 동작 대역폭과 동일한 대역폭을 가질 수 있다. 주 채널의 대역폭은 BSS에서 동작하는 모든 STA들 중에서 가장 작은 대역폭 동작 모드를 지원하는 STA에 의해 설정 및/또는 제한될 수 있다. 802.11ah의 예에서, 주 채널은 AP 및 BSS 내의 다른 STA들이 2MHz, 4MHz, 8MHz, 16MHz 및/또는 다른 채널 대역폭 동작 모드들을 지원하더라도 1MHz 모드를 지원하는(예를 들어, 지원만 하는) STA들(예를 들어, MTC 유형 디바이스들)에 대해 1MHz 폭일 수 있다. 캐리어 감지 및/또는 네트워크 할당 벡터(NAV) 설정들은 주 채널의 상태에 의존할 수 있다. 주 채널이 예를 들어 STA(1MHz 동작 모드만을 지원함)의 AP로의 전송으로 인해 이용 중인 경우, 전체 이용가능한 주파수 대역들은 주파수 대역들의 대부분이 유휴 상태로 유지되고 이용가능할 수 있더라도 이용 중인 것으로 고려될 수 있다.
미국에서, 802.11ah에 의해 이용될 수 있는 이용가능한 주파수 대역들은 902MHz 내지 928MHz이다. 한국에서, 이용가능한 주파수 대역들은 917.5MHz 내지 923.5MHz이다. 일본에서, 이용가능한 주파수 대역들은 916.5MHz 내지 927.5MHz이다. 802.11ah에 대해 이용가능한 총 대역폭은 국가 코드에 따라 6MHz 내지 26MHz이다.
도 1d는 예시적인 RAN(113) 및 CN(115)을 도시하는 시스템도이다. 전술한 바와 같이, RAN(113)은 에어 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위해 NR 무선 기술을 이용할 수 있다. RAN(113)은 또한 CN(115)과 통신할 수 있다.
RAN(113)은 gNB들(180a, 180b, 180c)을 포함할 수 있지만, RAN(113)이 임의의 수의 gNB들을 포함할 수 있다는 것이 이해될 것이다. gNB들(180a, 180b, 180c) 각각은 에어 인터페이스(116)를 통해 WTRU들(102a, 102b, 102c)과 통신하기 위한 하나 이상의 트랜시버를 포함할 수 있다. 예에서, gNB들(180a, 180b, 180c)은 MIMO 기술을 구현할 수 있다. 예를 들어, gNB들(180a, 180b)은 gNB들(180a, 180b, 180c)에 신호들을 전송하고/하거나 이들로부터 신호들을 수신하기 위해 빔포밍을 이용할 수 있다. 따라서, gNB(180a)는 예를 들어 WTRU(102a)에 무선 신호들을 전송하고/하거나 그로부터 무선 신호들을 수신하기 위해 복수의 안테나를 이용할 수 있다. 예에서, gNB들(180a, 180b, 180c)은 캐리어 집성 기술을 구현할 수 있다. 예를 들어, gNB(180a)는 복수의 구성요소 캐리어를 WTRU(102a)에 전송할 수 있다(도시되지 않음). 이러한 구성요소 캐리어들의 서브세트는 비허가 스펙트럼 상에 있을 수 있는 반면, 나머지 구성요소 캐리어들은 허가 스펙트럼 상에 있을 수 있다. 예에서, gNB들(180a, 180b, 180c)은 CoMP(Coordinated Multi-Point) 기술을 구현할 수 있다. 예를 들어, WTRU(102a)는 gNB(180a) 및 gNB(180b)(및/또는 gNB(180c))로부터 조정된 전송들을 수신할 수 있다.
WTRU들(102a, 102b, 102c)은 확장가능한 뉴머롤로지와 연관된 전송들을 이용하여 gNB들(180a, 180b, 180c)과 통신할 수 있다. 예를 들어, OFDM 심볼 간격 및/또는 OFDM 서브캐리어 간격은 상이한 전송들, 상이한 셀들, 및/또는 무선 전송 스펙트럼의 상이한 부분들에 대해 변할 수 있다. WTRU들(102a, 102b, 102c)은 (예컨대, 가변 수의 OFDM 심볼들 및/또는 지속적인 가변 절대 시간 길이들을 포함하는) 다양한 또는 확장가능한 길이들의 서브프레임 또는 전송 시간 간격(TTI)들을 이용하여 gNB들(180a, 180b, 180c)과 통신할 수 있다.
gNB들(180a, 180b, 180c)은 독립형 구성 및/또는 비독립형 구성에서 WTRU들(102a, 102b, 102c)과 통신하도록 구성될 수 있다. 독립형 구성에서, WTRU들(102a, 102b, 102c)은 (예컨대, eNode-B들(160a, 160b, 160c)과 같은) 다른 RAN들에 또한 액세스하지 않고 gNB들(180a, 180b, 180c)과 통신할 수 있다. 독립형 구성에서, WTRU들(102a, 102b, 102c)은 이동성 앵커 포인트로서 gNB들(180a, 180b, 180c) 중 하나 이상을 이용할 수 있다. 독립형 구성에서, WTRU들(102a, 102b, 102c)은 비허가 대역 내의 신호들을 이용하여 gNB들(180a, 180b, 180c)과 통신할 수 있다. 비독립형 구성에서, WTRU들(102a, 102b, 102c)은 eNode-B들(160a, 160b, 160c)과 같은 다른 RAN과 또한 통신하면서/이에 접속하면서 gNB들(180a, 180b, 180c)과 통신/이에 접속할 수 있다. 예를 들어, WTRU들(102a, 102b, 102c)은 하나 이상의 gNB(180a, 180b, 180c) 및 하나 이상의 eNode-B(160a, 160b, 160c)와 실질적으로 동시에 통신하기 위해 DC 원리들을 구현할 수 있다. 비독립형 구성에서, eNode-B들(160a, 160b, 160c)은 WTRU들(102a, 102b, 102c)에 대한 이동성 앵커로서 역할을 할 수 있고, gNB들(180a, 180b, 180c)은 WTRU들(102a, 102b, 102c)을 서비스하기 위한 추가적인 커버리지 및/또는 처리량을 제공할 수 있다.
gNB들(180a, 180b, 180c) 각각은 특정의 셀(도시되지 않음)과 연관될 수 있고, 무선 자원 관리 결정들, 핸드오버 결정들, UL 및/또는 DL에서의 사용자들의 스케줄링, 네트워크 슬라이싱의 지원, 이중 접속성, NR과 E-UTRA 사이의 연동, 사용자 평면 데이터의 사용자 평면 기능(UPF)(184a, 184b)으로의 라우팅, 제어 평면 정보의 액세스 및 이동성 관리 기능(AMF)(182a, 182b)으로의 라우팅 등을 처리하도록 구성될 수 있다. 도 1d에 도시된 바와 같이, gNB들(180a, 180b, 180c)은 Xn 인터페이스를 통해 서로 통신할 수 있다.
도 1d에 도시된 CN(115)은 적어도 하나의 AMF(182a, 182b), 적어도 하나의 UPF(184a, 184b), 적어도 하나의 세션 관리 기능(SMF)(183a, 183b), 및 가능하게는 데이터 네트워크(DN)(185a, 185b)를 포함할 수 있다. 전술한 요소들 각각이 CN(115)의 일부로서 묘사되지만, 이들 요소들 중 임의의 것이 CN 운영자 이외의 엔티티에 의해 소유되고/되거나 운영될 수 있다는 것이 이해될 것이다.
AMF(182a, 182b)는 N2 인터페이스를 통해 RAN(113) 내의 gNB들(180a, 180b, 180c) 중 하나 이상에 접속될 수 있고, 제어 노드로서 역할을 할 수 있다. 예를 들어, AMF(182a, 182b)는 WTRU들(102a, 102b, 102c)의 사용자들의 인증, 네트워크 슬라이싱(예컨대, 상이한 요구들을 갖는 상이한 PDU 세션들의 처리)에 대한 지원, 특정의 SMF(183a, 183b)의 선택, 등록 영역의 관리, NAS 시그널링의 종료, 이동성 관리 등을 담당할 수 있다. 네트워크 슬라이싱은 WTRU들(102a, 102b, 102c)에 의해 이용되는 서비스들의 유형들에 기반하여 WTRU들(102a, 102b, 102c)에 대한 CN 지원을 맞춤화하기 위해 AMF(182a, 182b)에 의해 이용될 수 있다. 예를 들어, URLLC(ultra-reliable low latency) 액세스에 의존하는 서비스들, eMBB(enhanced massive mobile broadband) 액세스에 의존하는 서비스들, MTC(machine type communication) 액세스에 대한 서비스들 등과 같은 상이한 이용 사례들에 대해 상이한 네트워크 슬라이스들이 확립될 수 있다. AMF(162)는 RAN(113)과, LTE, LTE-A, LTE-A Pro 및/또는 WiFi와 같은 비-3GPP 액세스 기술들과 같은 다른 무선 기술들을 이용하는 다른 RAN들(도시되지 않음) 사이에서 스위칭하기 위한 제어 평면 기능을 제공할 수 있다.
SMF(183a, 183b)는 N11 인터페이스를 통해 CN(115) 내의 AMF(182a, 182b)에 접속될 수 있다. SMF(183a, 183b)는 또한 N4 인터페이스를 통해 CN(115) 내의 UPF(184a, 184b)에 접속될 수 있다. SMF(183a, 183b)는 UPF(184a, 184b)를 선택 및 제어하고, UPF(184a, 184b)를 통한 트래픽의 라우팅을 구성할 수 있다. SMF(183a, 183b)는 UE IP 어드레스를 관리하고 할당하는 것, PDU 세션들을 관리하는 것, 정책 시행 및 QoS를 제어하는 것, 다운링크 데이터 통지들을 제공하는 것 등과 같은 다른 기능들을 수행할 수 있다. PDU 세션 유형은 IP 기반, 비-IP 기반, 이더넷 기반 등일 수 있다.
UPF(184a, 184b)는 WTRU들(102a, 102b, 102c)과 IP 인에이블드 디바이스들 사이의 통신들을 용이하게 하기 위해, 인터넷(110)과 같은 패킷 교환 네트워크들에 대한 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있는 N3 인터페이스를 통해 RAN(113) 내의 gNB들(180a, 180b, 180c) 중 하나 이상에 접속될 수 있다. UPF(184, 184b)는 패킷들을 라우팅 및 전달하는 것, 사용자 평면 정책들을 시행하는 것, 멀티-홈 PDU 세션들을 지원하는 것, 사용자 평면 QoS를 처리하는 것, 다운링크 패킷들을 버퍼링하는 것, 이동성 앵커링을 제공하는 것 등과 같은 다른 기능들을 수행할 수 있다.
CN(115)은 다른 네트워크들과의 통신을 용이하게 할 수 있다. 예를 들어, CN(115)은 CN(115)과 PSTN(108) 사이의 인터페이스로서 역할하는 IP 게이트웨이(예컨대, IMS(IP multimedia subsystem) 서버)를 포함할 수 있거나 이와 통신할 수 있다. 또한, CN(115)은 다른 서비스 제공자들에 의해 소유되고/되거나 운영되는 다른 유선 및/또는 무선 네트워크들을 포함할 수 있는 다른 네트워크들(112)에 대한 액세스를 WTRU들(102a, 102b, 102c)에 제공할 수 있다. 예에서, WTRU들(102a, 102b, 102c)은 UPF(184a, 184b)에 대한 N3 인터페이스 및 UPF(184a, 184b)와 DN(185a, 185b) 사이의 N6 인터페이스를 경유하여 UPF(184a, 184b)를 통해 로컬 데이터 네트워크(DN)(185a, 185b)에 접속될 수 있다.
도 1a 내지 도 1d, 및 도 1a 내지 도 1d의 대응하는 설명을 고려할 때, WTRU(102a-d), 기지국(114a-b), eNode-B(160a-c), MME(162), SGW(164), PGW(166), gNB(180a-c), AMF(182a-ab), UPF(184a-b), SMF(183a-b), DN(185a-b) 및/또는 본 명세서에 설명된 임의의 다른 디바이스(들) 중 하나 이상과 관련하여 본 명세서에 설명된 기능들 중 하나 이상 또는 전부는 하나 이상의 에뮬레이션 디바이스(도시되지 않음)에 의해 수행될 수 있다. 에뮬레이션 디바이스들은 본 명세서에 설명된 기능들 중 하나 이상 또는 전부를 에뮬레이팅하도록 구성된 하나 이상의 디바이스일 수 있다. 예를 들어, 에뮬레이션 디바이스들은 다른 디바이스들을 테스트하고/하거나 네트워크 및/또는 WTRU 기능들을 시뮬레이팅하는데 이용될 수 있다.
에뮬레이션 디바이스들은 실험실 환경 및/또는 운영자 네트워크 환경에서 다른 디바이스들의 하나 이상의 테스트를 구현하도록 설계될 수 있다. 예를 들어, 하나 이상의 에뮬레이션 디바이스는 통신 네트워크 내의 다른 디바이스들을 테스트하기 위해 유선 및/또는 무선 통신 네트워크의 일부로서 완전히 또는 부분적으로 구현 및/또는 배치되면서 하나 이상의 또는 모든 기능을 수행할 수 있다. 하나 이상의 에뮬레이션 디바이스는 유선 및/또는 무선 통신 네트워크의 일부로서 일시적으로 구현/배치되면서 하나 이상의 또는 모든 기능을 수행할 수 있다. 에뮬레이션 디바이스는 테스트를 위해 다른 디바이스에 직접 결합될 수 있고/있거나 OTA(over-the-air) 무선 통신들을 이용하여 테스트를 수행할 수 있다.
하나 이상의 에뮬레이션 디바이스는 유선 및/또는 무선 통신 네트워크의 일부로서 구현/배치되지 않으면서 하나 이상의 또는 모든 기능을 수행할 수 있다. 예를 들어, 에뮬레이션 디바이스들은 하나 이상의 구성요소의 테스트를 구현하기 위해 테스트 실험실 및/또는 배치되지 않은(예컨대, 테스트) 유선 및/또는 무선 통신 네트워크에서의 테스트 시나리오에서 이용될 수 있다. 하나 이상의 에뮬레이션 디바이스는 테스트 장비일 수 있다. RF 회로(예를 들어, 하나 이상의 안테나를 포함할 수 있음)를 통한 직접 RF 결합 및/또는 무선 통신들이 데이터를 전송 및/또는 수신하기 위해 에뮬레이션 디바이스들에 의해 이용될 수 있다.
하나 이상의 (예를 들어, 65) 각도 내적 예측 방향, 수정된 계수 코딩, AMT(advanced multiple transform) + 4x4 비분리가능한 이차 변환(NSST), 아핀 모션 모델, GALF(generalized adaptive loop filter), ATMVP(advanced temporal motion vector prediction), 적응적 모션 벡터 정밀도, DMVR(decoder-side motion vector refinement) 및/또는 LM(linear model) 크로마 모드 중 하나 이상이 이용될 수 있다.
블록 기반 하이브리드 비디오 코딩 프레임워크가 제공될 수 있다. 도 2는 예시적인 블록 기반 하이브리드 비디오 인코더의 블록도를 제공한다. 예를 들어, 인코더는 WTRU일 수 있다. 입력 비디오 신호(2)는 블록 단위로 처리될 수 있다. 블록 크기들(예를 들어, 코딩 유닛(CU)과 같은 확장된 블록 크기들)은 고해상도(예를 들어, 1080p 이상의) 비디오 신호들을 압축할 수 있다. 예를 들어, CU는 128x128 픽셀들 또는 그 이상을 포함할 수 있다. 코딩 트리 유닛(CTU)은 (예를 들어, 사지(quad)/이지(binary)/삼지(ternary)-트리에 기반하여) 다양한 로컬 특성들에 적응하기 위해 CU들로 분할될 수 있다. CU(예를 들어, 각각의 CU)는 (예를 들어, 추가의 파티션들 없이) 예측 및/또는 변환을 위한 기본 유닛으로서 이용될 수 있다. 다중-유형 트리 구조에서, CTU는 사지-트리 구조에 의해 분할될 수 있다. 사지-트리 리프 노드(예를 들어, 각각의 사지-트리 리프 노드)는 이지 및/또는 삼지 트리 구조에 의해 분할될 수 있다. 도 4에 도시된 바와 같이, 하나 이상의(예를 들어, 5개의) 분할 유형이 있을 수 있다. 예를 들어, 분할 유형들은 사지 분할, 수평 이지 분할, 수직 이지 분할, 수평 삼지 분할, 및/또는 수직 삼지 분할을 포함할 수 있다. (예를 들어, 각각의) 입력 비디오 블록(예를 들어, MB 및/또는 CU)에 대해, 공간적 예측(60) 및/또는 시간적 예측(62)이 수행될 수 있다. 공간적 예측(예를 들어, 내적 예측)은 비디오 픽처/슬라이스 내의 코딩된 이웃 블록들의 샘플들(예를 들어, 참조 샘플들)로부터의 픽셀들을 이용하여 현재 비디오 블록을 예측할 수 있다. 공간적 예측은, 예를 들어, 비디오 신호에 내재될 수 있는 공간적 중복성을 감소시킬 수 있다. 시간적 예측(예를 들어, 상호간 예측 및/또는 모션 보상된 예측)은, 예를 들어, 현재 비디오 블록을 예측하기 위해, 코딩된 비디오 픽처들로부터의 재구성된 픽셀들을 이용할 수 있다. 시간적 예측은, 예를 들어, 비디오 신호에 내재될 수 있는 시간적 중복성을 감소시킬 수 있다. CU에 대한 시간적 예측 신호들은 하나 이상의 모션 벡터(MV)에 의해 시그널링될 수 있다. MV들은 현재 CU와 그 시간적 참조 사이의 모션의 양 및/또는 방향을 표시할 수 있다. 복수의 참조 픽처들이 (예를 들어, 각각의) CU에 대해 지원되는 경우, CU의 참조 픽처 인덱스가 전송될 수 있다. 참조 인덱스는 참조 픽처 저장소(64) 내의 어느 참조 픽처로부터 시간적 예측 신호가 도출될 수 있는지를 식별하는데 이용될 수 있다. 공간적 및/또는 시간적 예측 후에, 인코더 내의 모드 결정 블록(80)은, 예를 들어, 레이트-왜곡 최적화에 기반하여 예측 모드(예를 들어, 최상의 예측 모드)를 결정할 수 있다. 예측 블록은 현재 비디오 블록(16)으로부터 감산될 수 있고/있거나 예측 잔차는 변환 4 및/또는 양자화된 6을 이용하여 역상관될 수 있다. 양자화된 잔차 계수들은, 예를 들어, 재구성된 잔차를 형성하기 위해 역양자화(10) 및/또는 역변환(12)될 수 있고, 이는, 예를 들어, 재구성된 CU를 형성하기 위해 예측 블록(26)에 추가될 수 있다. 인루프 필터링(예를 들어, 디블로킹 필터)은 재구성된 CU가 참조 픽처 저장소(64)에 놓이고/이거나 CU들(예를 들어, 미래의 CU들)을 코딩하는데 이용될 수 있기 전에 재구성된 CU에 적용(66)될 수 있다. 출력 비디오 비트스트림(20)을 형성하기 위해, 코딩 모드(예컨대, 상호간 또는 내적), 예측 모드 정보, 모션 정보, 및/또는 양자화된 잔차 계수들이, 예를 들어, 비트스트림을 형성하기 위해 압축 및/또는 패킹되도록, 엔트로피 코딩 유닛(8)에 전송될 수 있다(예컨대, 모두가 전송될 수 있다).
도 3은 예시적인 블록 기반 비디오 디코더의 블록도를 도시한다. 예를 들어, 디코더는 WTRU일 수 있다. 비디오 비트스트림(202)은 엔트로피 디코딩 유닛(208)에서 언팩킹(예를 들어, 제1 언팩킹) 및/또는 엔트로피 디코딩될 수 있다. 코딩 모드 및 예측 정보는 예측 블록을 형성하기 위해 공간적 예측 유닛(260)(예를 들어, 내적 코딩되는 경우) 및/또는 시간적 예측 유닛(262)(예를 들어, 상호간 코딩되는 경우)으로 전송될 수 있다. 잔차 변환 계수들은, 예를 들어, 잔차 블록을 재구성하기 위해, 역양자화 유닛(210) 및/또는 역변환 유닛(212)에 전송될 수 있다. 예측 블록 및/또는 잔차 블록은 226에서 함께 추가될 수 있다. 재구성된 블록은, 예를 들어, 재구성된 블록이 참조 픽처 저장소(264)에 저장되기 전에, 인루프 필터링을 통과할 수 있다. 참조 픽처 저장소 내의 재구성된 비디오는 디스플레이 디바이스를 구동하기 위해 전송되고/되거나 비디오 블록들(예컨대, 미래의 비디오 블록들)을 예측하는데 이용될 수 있다.
(예를 들어, 시간적 예측과 연관된) 코딩 모듈들은 확장 및/또는 향상될 수 있다. 아핀 모션 보상은 상호간 코딩 툴로서 이용될 수 있다.
아핀 모드를 이용하는 구현들이 본 명세서에 설명될 수 있다. 모션-보상된 예측을 위해 병진 모션 모델이 적용될 수 있다. 하나 이상의 종류의 모션(예를 들어, 줌인 또는 줌아웃, 회전, 원근 모션들, 및/또는 다른 불규칙한 모션들)이 존재할 수 있다. 아핀 변환 모션-보상된 예측이 적용될 수 있다. 예를 들어, 병진 모션 모델 또는 아핀 모션 모델이 상호간 예측에 적용되는지를 나타내기 위해, 상호간 코딩된 CU들(예를 들어, 각각의 상호간 코딩된 CU)에 대한 플래그가 시그널링될 수 있다. 아핀 모션 모델이 적용되는 경우, 모델에서 이용된 파라미터의 수(예를 들어, 4개 또는 6개)를 나타내기 위해 플래그가 시그널링될 수 있다.
아핀 모션 모델은 4-파라미터 모델일 수 있다. 병진 이동에 하나 이상의(예를 들어, 2개의) 파라미터가 (예를 들어, 수평 및 수직 방향들 각각에 대해 하나씩) 이용될 수 있다. 하나 이상의 파라미터(예를 들어, 하나의 파라미터)가 줌 모션에 이용될 수 있다. 하나 이상의 파라미터(예를 들어, 하나의 파라미터)가 회전 모션에 이용될 수 있다. 수평 줌 파라미터는 수직 줌 파라미터와 동일할 수 있다. 수평 회전 파라미터는 수직 회전 파라미터와 동일할 수 있다. 4-파라미터 모션 모델은, 예를 들어, 현재 CU의 좌측-상단 코너 및 우측-상단 코너에 정의된 하나 이상의(예를 들어, 2개의) 제어점 위치들에서 (예를 들어, 쌍으로서) 하나 이상의(예를 들어, 2개의) 모션 벡터(MV)를 이용하여 코딩될 수 있다. 도 5에 도시된 바와 같이, 블록의 아핀 모션 필드는 2개의 제어점 모션 벡터(V0, V1)에 의해 설명될 수 있다. 제어점 모션에 기반하여, 모션 필드(vx, vy)는 다음에 따라 설명될 수 있다:
Figure pct00001
여기서, (v0x, v0y)는 도 5에 도시된 바와 같이, 좌측-상단 코너 제어점의 모션 벡터일 수 있고, (v1x, v1y)는 우측-상단 코너 제어점의 모션 벡터일 수 있고, w는 CU의 폭일 수 있다.
아핀 모션 모델은 6-파라미터 모델일 수 있다. 병진 이동에 하나 이상의(예를 들어, 2개의) 파라미터가 (예를 들어, 수평 및 수직 방향들 각각에 대해 하나씩) 이용될 수 있다. 줌 모션에 하나 이상의(예를 들어, 2개의) 파라미터가 (예를 들어, 수평 및 수직 방향들 각각에 대해 하나씩) 이용될 수 있다. 회전 모션에 하나 이상의(예를 들어, 2개의) 파라미터가 (예를 들어, 수평 및 수직 방향들 각각에 대해 하나씩) 이용될 수 있다. 6-파라미터 모션 모델은 하나 이상의(예컨대, 3개의) 제어점에서 하나 이상의(예컨대, 3개의) MV로 코딩될 수 있다. 예를 들어, 도 6에 도시된 바와 같이, 6-파라미터 아핀 코딩된 CU에 대한 제어점들은 CU의 좌측 상단, 우측 상단, 및 좌측 하단 코너들에서 정의될 수 있다. 좌측 상단 제어점에서의 모션은 병진 모션과 관련될 수 있다. 우측 상단 제어점에서의 모션은 수평 방향으로의 회전 및/또는 줌 모션과 관련될 수 있다. 좌측 하단 제어점에서의 모션은 수직 방향으로의 회전 및/또는 줌 모션과 관련될 수 있다. 수평 방향으로의 회전 및 줌 모션은 수직 방향으로의 모션과는 상이할 수 있다. 서브-블록(예를 들어, 각각의 서브-블록)(vx, vy)의 MV는 다음에 따라 제어점들에서 하나 이상의(예를 들어, 3개의) MV를 이용하여 도출될 수 있다:
Figure pct00002
Figure pct00003
여기서, (v2x, v2y)는 좌측-하단 제어점의 모션 벡터일 수 있고, (x, y)는 서브-블록의 중심 위치일 수 있고, w 및 h는 각각 CU의 폭 및 높이일 수 있다.
블록이 아핀 모션 모델로 코딩될 때, 그 모션 필드는, 예를 들어, 서브-블록의 세분성에 기반하여 도출될 수 있다. 예를 들어, 서브-블록(예를 들어, 각각의 서브-블록)의 MV를 도출하기 위해, (예를 들어, 도 5에 도시된 바와 같은) 서브-블록의 중심 샘플의 MV는 수학식 1에 따라 계산될 수 있고, 특정 정확도(예를 들어, 1/16-pel 정확도)로 라운딩될 수 있다. 도출된 MV들은 모션 보상 스테이지에서 현재 블록 내부의 서브-블록(예를 들어, 각각의 서브-블록)의 예측 신호를 생성하는데 이용될 수 있다. 아핀 모션 보상에 적용되는 서브-블록 크기는 4x4일 수 있다. 4-파라미터 아핀 모델의 하나 이상의(예를 들어, 4개의) 파라미터가 반복적으로 추정될 수 있다. 예를 들어, 단계 k에서의 하나 이상의 MV 쌍은
Figure pct00004
로 표시될 수 있다. 원래의 휘도 신호는 I(i, j)로 표시될 수 있다. 예측 휘도 신호는 I'k(i, j)로 표시될 수 있다. 공간적 그레디언트들 gx(i, j) 및 gy(i, j)는 각각 수평 방향 및 수직 방향에서 예측 신호 I'k(i, j)에 적용되는 소벨(Sobel) 필터를 이용하여 도출될 수 있다. 수학식 1의 도함수는 다음과 같이 표현될 수 있다:
Figure pct00005
여기서, (a, b)는 델타 병진 파라미터들일 수 있고, (c, d)는 단계 k에서 델타 줌 및 회전 파라미터들일 수 있다. 제어점들에서의 델타 MV는 수학식들 5 및 6에서와 같은 좌표들로 도출될 수 있다. 예를 들어, (0, 0), (w, 0)은 각각 좌측-상단 및 우측-상단 제어점들에 대한 좌표들일 수 있다.
Figure pct00006
Figure pct00007
휘도의 변화와 공간적 그레디언트 및 시간적 이동 사이의 관계는 다음에 따라 공식화될 수 있다:
Figure pct00008
Figure pct00009
Figure pct00010
는 파라미터들 (a, b, c, d)에 대한 수학식을 획득하기 위해 수학식 4에서의 그 등가 값들로 대체될 수 있다:
Figure pct00011
파라미터 세트 (a, b, c, d)는 (예를 들어, CU에서의 샘플들이 수학식 8을 충족시키므로) 최소 제곱 구현을 이용하여 도출될 수 있다. 단계 (k+1)에서의 제어점들에서의 MV들
Figure pct00012
은 수학식들 5 및 6으로 풀릴 수 있고, 이들은 특정 정밀도(예컨대, 1/4 pel)로 라운딩될 수 있다. 반복을 이용하여, 하나 이상의(예컨대, 2개의) 제어점에서의 MV들은, 예를 들어, 파라미터들 (a, b, c, d)가 모두 제로이거나 반복이 수행된 횟수가 미리 정의된 한계치에 도달할 때까지 정밀화될 수 있다.
6-파라미터 아핀 모델의 하나 이상의(예를 들어, 6개의) 파라미터가 추정될 수 있다. 수학식 4는 다음과 같이 변경될 수 있다:
Figure pct00013
여기서, 단계 k에서, (a, b)는 델타 병진 파라미터들일 수 있고, (c, d)는 제1 방향(예를 들어, 수평 방향)에 대한 델타 줌 및 회전 파라미터들일 수 있고, (e, f)는 제2 방향(예를 들어, 수직 방향)에 대한 델타 줌 및 회전 파라미터들일 수 있다. 수학식 8은 다음과 같이 변경될 수 있다:
Figure pct00014
파라미터 세트 (a, b, c, d, e, f)는 최소 제곱 구현을 이용하여, 예를 들어, CU 내의 샘플(예를 들어, 샘플들)을 고려함으로써 도출될 수 있다. 좌측 상단 제어점의 MV
Figure pct00015
는 수학식 5를 이용하여 계산될 수 있다. 우측 상단 제어점의 MV
Figure pct00016
및 좌측 하단 제어점의 MV
Figure pct00017
는 다음의 수학식들에 따라 계산될 수 있다:
Figure pct00018
Figure pct00019
아핀 병합 모드는 CU를 코딩하는데 이용될 수 있다. 아핀 모드에서 (예를 들어, 하나의) CU가 코딩되는 경우, 참조 리스트(예를 들어, 각각의 참조 리스트)의 제어점들에 대한 MV들의 하나 이상의(예를 들어, 2개 또는 3개의) 세트가 예측 코딩으로 시그널링될 수 있다. MV와 그 예측자 사이의 차이들은 무손실 코딩될 수 있다. 아핀 병합 모드는 모션 필드의 로컬 연속성을 고려함으로써 적용될 수 있다. 현재 CU의 제어점들에서의 모션 벡터들은 그 이웃 블록들로부터 선택된 그 아핀 병합 후보의 아핀 모션 모델로 도출될 수 있다. 아핀 병합 후보가 4-파라미터 아핀 모델로 코딩되는 경우, 현재 CU의 하나 이상의(예를 들어, 2개의) 제어점에서의 하나 이상의(예를 들어, 2개의) MV가 도출될 수 있다. 아핀 병합 후보가 6-파라미터 아핀 모델로 코딩되면, 현재 CU의 3개의 제어점에서의 하나 이상의(예를 들어, 3개의) MV가 도출될 수 있다.
현재 CU가 아핀 병합 모드로 코딩되는 경우, (예를 들어, 도 7에 도시된 바와 같이) 하나 이상의(예를 들어, 5개의) 이웃 블록이 존재할 수 있다. 이웃 블록들은 (예를 들어, N0에서 N4로) 순서대로 체크될 수 있다. 제1 아핀 코딩된 이웃 블록은 아핀 병합 후보로서 이용될 수 있다. 예를 들어, 도 8에 도시된 바와 같이, 현재 CU는 아핀 병합 모드로서 코딩될 수 있고, 좌측 하단 이웃 블록(N0)은 그 아핀 병합 후보로서 선택될 수 있다. 블록 N0을 포함하는 CU의 폭 및 높이는 각각 nw 및 nh로 표시될 수 있다. 현재 CU의 폭 및 높이는 각각 cw 및 ch로 표시될 수 있다. 위치 Pi에서의 MV는 (vix, viy)로 표시될 수 있다. Pi의 좌표들은 (xi, yi)로 표시될 수 있다. 블록 N0이 4-파라미터 아핀 모델로 코딩되면, 제어점들의 하나 이상의(예를 들어, 2개의) MV가 도출될 수 있다. 예를 들어, 제어점 P0에서의 MV(v0x, v0y)는 다음의 수학식들에 따라 도출될 수 있다:
Figure pct00020
Figure pct00021
제어점 P1에서의 MV(v1x, v1y)는 다음의 수학식들에 따라 도출될 수 있다:
Figure pct00022
Figure pct00023
블록 N0이 6-파라미터 아핀 모델로 코딩되면, 제어점들 {P0, P1, P2}의 하나 이상의(예를 들어, 3개의) MV는 다음의 수학식들에 따라 도출될 수 있다:
Figure pct00024
Figure pct00025
Figure pct00026
Figure pct00027
Figure pct00028
Figure pct00029
제어점들 {P0, P1} 또는 {P0, P1, P2}에서의 MV들이 도출된 후에, 현재 CU 내의 서브-블록(예를 들어, 각각의 서브-블록)의 MV는 본 명세서에 설명된 바와 같이 도출될 수 있다. 도출된 서브-블록 MV는 픽처 코딩을 위한 서브-블록 기반 모션 보상 및 시간적 모션 벡터 예측에 이용될 수 있다.
아핀 MV들은 예측 코딩될 수 있다. 예측 코딩은 (예를 들어, 시그널링 오버헤드를 감소시키기 위해) 비-병합 아핀 코딩된 CU들에 대해 이용될 수 있다. 아핀 MV 예측자는 이웃하는 코딩된 블록들의 모션으로부터 생성될 수 있다. 아핀 코딩된 CU들의 MV 예측을 위한 예측자들은 아핀 모션 모델로 코딩된 이웃 블록들로부터 도출되는 승계된 아핀 모션 예측자들; 하나 이상의 이웃 블록으로부터의 정보로부터 구성된 아핀 모션 예측자들; 및/또는 MV 예측에 이용되는 병진 모션 예측자들(예를 들어, 다른 옵션들로부터의 아핀 예측자들의 수가 임계치보다 낮은 경우)을 포함할 수 있지만, 이들로 제한되지 않는다.
계승된 아핀 모션 예측자들은 하나 이상의 이웃하는 아핀 코딩된 블록으로부터 도출될 수 있다. 이웃 블록 후보 리스트는 (예를 들어, 도 7에 도시된 바와 같이) 아핀 병합 모드에 대한 것과 동일한 방식으로 구성될 수 있다. 후보 리스트 내의 후보(예를 들어, 각각의 후보)는, 예를 들어, 후보 블록이 양방향 예측 모드에서 코딩되는 경우, 하나 이상의(예를 들어, 2개의) 리스트에 대한 그 MV들에 대해 체크될 수 있다. 이웃 블록으로부터의 하나의 리스트의 참조 픽처가 현재 참조 픽처와 동일하면, 현재 블록의 제어점들에서의 MV들은 이웃 블록의 아핀 모션을 이용하여 도출될 수 있고, (예를 들어, 고유성 체크 후에) 아핀 예측자 리스트에 추가될 수 있다.
하나 이상의(예컨대, 3개의) MV 세트가 구성된 아핀 모션 예측자들을 생성하는데 이용될 수 있다. 예를 들어, 도 9에 도시된 바와 같이, MV들의 세트들은, 코너 P0의 이웃 블록들 {A, B, C}로부터의 제1 이용가능한 MV(예를 들어, 세트 S1); 코너 P1의 이웃 블록들 {D, E}로부터의 제1 이용가능한 MV(예를 들어, 세트 S2); 및 코너 P2의 이웃 블록들 {F, G}로부터의 제1 이용가능한 MV(예를 들어, 세트 S3)일 수 있다. 이웃 블록으로부터의 MV는 이웃 블록이 현재 블록과 동일한 참조 픽처를 갖는 경우에 이용 가능한 것으로 취급될 수 있다. S1 및 S2가 비어 있지 않고, S3이 비어 있고, 현재 블록이 6-파라미터 아핀 모델인 경우, S1 및 S2 내의 MV들은 4-파라미터 아핀 모델로서 취급될 수 있고, MV는 P2에서 도출될 수 있다. S1 및 S3이 비어 있지 않고, S2가 비어 있는 경우, S1 및 S3 내의 MV들은 4-파라미터 아핀 모델로서 취급될 수 있고, MV는 P1에서 도출될 수 있다.
예를 들어, 6-파라미터 아핀 모델에 대해 본 명세서에 설명된 바와 같이 생성되는 (예컨대, 하나의) 아핀 예측자 {MVP0, MVP'1, MVP'2}가 있을 수 있다. 3개의 제어점에 대한 MV들은 {MV0, MV1, MV2}일 수 있다. 최종 예측자는 {MVP0, MVP'1 + (MV0 - MVP0), MVP'2 + (MV0 - MVP0)}로서 도출될 수 있다. "아핀 모션 예측자" 및 "최종 예측자"라는 용어들은 본 명세서에서 상호교환적으로 사용될 수 있다.
아핀 MV 코딩이 수행될 수 있다. CU가 아핀 모드로서 코딩되는 경우, 이는 아핀 병합 모드 또는 아핀 비-병합 모드일 수 있다. 본 명세서에 설명된 아핀 병합 모드의 경우, 제어점들에서의 아핀 MV들은 이웃하는 아핀 코딩된 CU의 아핀 MV들로부터 도출될 수 있다. 아핀 비-병합 모드의 경우, 제어점들에서의 MV들은 차동 코딩으로 코딩될 수 있다. MV 예측자들은 본 명세서에 설명된 바와 같이 이웃하는 MV들을 이용하여 생성될 수 있다. 현재 MV와 그 예측자 간의 차이가 코딩될 수 있다. 시그널링될 MV 차이는 MVD라고 지칭될 수 있다. 4-파라미터 아핀 모델은 하나 이상의(예를 들어, 2개의) 제어점을 가질 수 있다(예를 들어, 2개의 MVD가 단방향 예측을 위해 시그널링될 수 있고, 4개의 MVD가 양방향 예측을 위해 시그널링될 수 있다). 6-파라미터 아핀 모델은 하나 이상의(예를 들어, 3개의) 제어점을 가질 수 있다(예를 들어, 3개의 MVD가 단방향 예측을 위해 시그널링될 수 있고, 6개의 MVD가 양방향 예측을 위해 시그널링될 수 있다). MVD는 (예컨대, 수평 및 수직 성분들을 갖는) 2차원 벡터일 수 있고/있거나 무손실 코딩될 수 있다.
아핀 모션 추정이 수행될 수 있다. 도 10은 CU에 대한 모션 모델 선택의 예시적인 흐름도를 도시한다. 모션 모델은 하나 이상의 모션 모델의 비트 코스트(예를 들어, 모션 추정(ME) 코스트)에 기반하여 선택될 수 있다. ME 코스트는 수학식 23에 따라, 예를 들어, 예측 오차에 의해 측정된 왜곡 및 하나 이상의(예를 들어, 모든) MV를 코딩하는 비트 코스트를 고려함으로써 계산될 수 있다:
Figure pct00030
"o"는 원래 신호를 나타낼 수 있고, "p"는 모션 벡터들 {MV i }를 갖는 예측 신호를 나타낼 수 있다. Dist(o, p)는 신호 o와 p 사이의 왜곡일 수 있다. 왜곡은 SSE(Sum of Square Error), 또는 SAD(Sum of Absolute Differences), 및/또는 SATD(Sum of Absolute Transformed Differences)에 의해 평가될 수 있다. R(MV i )는 i번째 모션 벡터 MVi에 대한 코딩 비트들의 수일 수 있다. K는 모션 벡터들의 수일 수 있다. K는 병진 모델에 대해 1, 4-파라미터 아핀 모델에 대해 2, 그리고/또는 6-파라미터 아핀 모델에 대해 3일 수 있다.
Figure pct00031
는 왜곡과 비트 코스트 사이의 가중 인자일 수 있다.
인코더는 병진 모션 모델(예를 들어, 제1 병진 모션 모델)을 체크할 수 있고, 비트 코스트(예를 들어, ME 코스트)를 계산할 수 있다. 블록의 폭 및/또는 높이가 임계치(예를 들어, 8 픽셀)보다 크면, 4-파라미터 아핀 모델을 갖는 아핀 모션 추정이 수행될 수 있다. 4-파라미터 아핀 모델의 ME 코스트가 병진 모션 모델의 ME 코스트보다 너무 많지 않다면, 인코더는 아핀 모션 코스트를 6-파라미터 아핀 모델로 체크할 수 있다. 예를 들어, 인코더는 ME 코스트가 병진 모션 모델의 ME 코스트보다 대략 100%-110% 더 큰 경우 6-파라미터 아핀 모델로 아핀 모션 코스트를 체크할 수 있다. 인코더는 이미 평가된 이용가능한 모션 모델들로부터 최소 ME 코스트를 갖는 모션 모델을 선택할 수 있다. 6-파라미터 아핀 모션 추정 복잡도를 감소시키기 위해, 인코더는 4-파라미터 아핀 모션 추정에 의해 선택된 최상의 참조 픽처를 이용하여 아핀 모션 추정(예를 들어, 아핀 모션 추정만)을 수행할 수 있다. 아핀 모션 추정의 반복(예를 들어, 각각의 반복)에 대해, 하나 이상의(예를 들어, 4개의) 동작이 수행될 수 있다. 예를 들어, 아핀 모션 보상을 이용하여 예측이 생성될 수 있고; 공간적 그레디언트가 (예를 들어, 소벨 필터링을 이용하여) 하나 이상의(예를 들어, 2개의) 방향에서 계산될 수 있고; 상관 행렬이 샘플의 그레디언트 및 그 좌표들에 기반하여 계산될 수 있고; 아핀 모델 파라미터들이 최소 제곱 방법을 이용하여 계산될 수 있고/있거나 제어점들의 델타 MV들이 아핀 모델 파라미터들을 이용하여 계산될 수 있다. 4-파라미터 아핀 모델 모션 검색을 위한 시작점은, 예를 들어, 아핀 MV 예측자 또는 병진 모션 모델로부터의 MV로부터 선택될 수 있다. 원래 신호와 예측 신호 사이에 측정된 예측 오차가 더 작은 것이 아핀 모션 추정을 위한 시작점으로서 선택될 수 있다. 6-파라미터 아핀 모델 모션 검색의 경우, 4-파라미터 아핀 모델의 제어점 MV들이 시작점 선택을 위해 고려될 수 있다. 최대 반복 한계치가 있을 수 있다.
아핀 모션 모델 파라미터 추정은 예측 신호의 공간적 그레디언트 및 원래 신호와 예측 신호 간의 차이에 기반한 반복 검색을 포함할 수 있다. 그레디언트 정보는 잡음에 의해 영향을 받을 수 있다. 단계를 위해 파라미터 변경을 제어하는 것이 어려울 수 있다. 아핀 모션 모델 파라미터 추정은 고차원 파라미터 추정, 예를 들어, 4- 및 6-파라미터 아핀 모델들 각각에 대한 4차원 또는 6차원 파라미터 추정을 포함할 수 있다. 모션 추정은 1 이상의(예컨대, 2) 차원에서의 MV 검색을 포함할 수 있고, 검색은 모션 추정 동안 조정될 수 있다. 블록은 (예컨대, 도 4에 도시된 바와 같이) 상이한 트리 파티션들, 예컨대 사지-트리(QT), 이지 트리(BT) 및/또는 삼지 트리(TT)에 의해 분할될 수 있다. 아핀 모션은 (예를 들어, 각각의) 코딩 블록에 대해 수행될 수 있다. 코딩 블록과 트리 구조에 의해 분할된 그 서브-블록 사이에 상관(예를 들어, 강한 상관)이 존재할 수 있다. 일부 상관된 모션 정보는 아핀 모션 추정을 위해, 예를 들어 코딩 효율을 개선시키기 위해 재이용될 수 있다.
아핀 모션 추정을 위한 시작점 선택에 아핀 모션 벡터(MV) 후보들이 이용될 수 있다. 예를 들어, 반복 아핀 모션 추정 후에, 하나 이상의 아핀 모션 예측자가 체크될 수 있다. 하나 이상의 제어점 MV는, 예를 들어, 검색 방법을 이용하여 정밀화될 수 있다. 아핀 모션 추정을 위해 하나 이상의 공간적 그레디언트가 계산될 수 있다.
본 명세서에 설명된 아핀 모션 추정은 하나 이상의 유형의 픽처에 적용될 수 있다. 계층적 예측 구조가 비디오 코딩에서 이용될 수 있고, 여기서 (예를 들어, 현재 픽처가 속하는 시간적 레벨에 따라) 상이한 참조 픽처 그룹들이 현재 픽처를 예측하는데 이용될 수 있다. 계층적 예측에서, 최저 시간적 레벨에서의 현재 픽처에 대해, 그 참조 픽처들 중 하나 이상(예를 들어, 전부)은 디스플레이 순서에서 현재 픽처에 선행할 수 있다. 현재 픽처는 저지연 픽처라고 지칭될 수 있다. 디스플레이 순서에서 이에 후속하는 (예를 들어, 임의의) 참조 픽처를 갖는 현재 픽처는 비-저지연 픽처라고 지칭될 수 있다. 아핀 모션 추정 및/또는 아핀 MV 체크는 (예를 들어, 그 시간적 레벨에 따라) 현재 픽처에 적용될 수 있다. 예를 들어, 특정 상황들에서, 아핀 모션 추정 및/또는 아핀 MV 체크는 (예를 들어, TL>TL_thres인 경우) 높은 시간적 계층들에서의 픽처들에(예를 들어, 그 픽처들에만) 적용될 수 있다. 아핀 모션 추정 및/또는 아핀 MV 체크는 비-저지연 픽처들(예를 들어, TL>0)에(예를 들어, 비-저지연 픽처들에만) 적용될 수 있다.
시작점 선택에서 더 많은 MV 후보들(예컨대, 아핀 MV 후보들)을 이용하여 모션 추정(ME)(예컨대, 아핀 ME)이 수행될 수 있다. 본 명세서에 설명된 예들이 아핀 모션 추정에 관련될 수 있지만, 관련 기술분야의 통상의 기술자는 이러한 기술들이 다른 모델들에 기반한 모션 추정들에 적용될 수 있다는 것을 이해할 것이다.
하나 이상의 MV(예를 들어, 아핀 제어점 MV)를 포함하는 순환 리스트(예를 들어, 선입선출(FIFO) 리스트)가 현재 코딩 블록 ME(예를 들어, 4-파라미터 아핀 모션 추정)에 대해 유지될 수 있다. 순환 리스트는 4일 수 있는 크기(예를 들어, 최대 크기)를 가질 수 있다. 순환 리스트는 최근에 추정된 MV 리스트라고 지칭될 수 있다. 리스트에 저장된 MV들은 모션 추정에 의해 검색된 MV들(예를 들어, 병진 ME, 4-파라미터 아핀 ME, 및/또는 6-파라미터 아핀 ME)일 수 있다. 예를 들어, 제1 코딩 블록에 대해 제1 MV 세트(예를 들어, 제1 MV, 제1 CPMV 세트)가 (예를 들어, 제1 코딩 블록과 연관된 아핀 ME를 수행함으로써) 도출될 수 있다. 제1 MV 세트는 (예를 들어, 최근에 추정된 MV 리스트의 헤드에서) 최근에 추정된 MV 리스트에 추가될 수 있다. 리스트의 엔트리(예를 들어, 각각의 엔트리)는 코딩 블록 위치, 블록 폭 및 블록 높이, 및/또는 (예를 들어, 각각의) 참조 픽처에 대한 그 코딩 블록과 연관된 4-파라미터 아핀 모델의 MV들(예를 들어, 제어점 MV들)을 표시할 수 있다. 리스트는 시작점 선택에 이용될 수 있다. 예를 들어, 제2 코딩 블록의 ME에 대한 시작점은 최근에 추정된 MV 리스트 내의 MV 세트들 및/또는 하나 이상의 MV 예측자에 기반하여 선택될 수 있다. 시작점은 최근에 추정된 MV 리스트 내의 MV 세트들, MV 예측자들, 및/또는 하나 이상의 병진 모델 MV의 각각의 예측 오차들에 기반하여 선택될 수 있다.
리스트에서의 저장된 제어점 MV 세트가 주어지면, 현재 블록의 제어점 MV는 다음과 같이 도출될 수 있다. 이러한 도출은 본 명세서에 설명된 바와 같은 아핀 병합 모드에서의 MV 도출과 유사할 수 있다. MV(B)는 4-파라미터 아핀 모델에 대한 블록 B의 제어점 MV 세트를 나타낼 수 있다.
Figure pct00032
는 블록 B의 i번째 참조 픽처에 대한 제어점 MV 세트를 나타낼 수 있다. {xB, yB} 및 {xC, yC}는 각각 블록 B 및 현재 블록의 위치를 나타낼 수 있다. {wB, hB} 및 {wC, hC}는 각각 블록 B 및 현재 블록의 폭 및 높이를 나타낼 수 있다. i번째 참조 픽처에 대한 좌측 상단 제어점에서의 MV(v0x, v0y)는 다음과 같이 도출될 수 있다:
Figure pct00033
Figure pct00034
우측 상단 제어점에서의 MV(v1x, v1y)는 다음과 같이 도출될 수 있다:
Figure pct00035
Figure pct00036
현재 블록에 대해 6-파라미터 아핀 검색이 수행되면, 좌측 하단 제어점에서의 MV(v2x, v2y)는 다음과 같이 도출될 수 있다:
Figure pct00037
Figure pct00038
부모 블록은 복수의 방식으로 분할될 수 있다. 예를 들어, 제1 트리 파티션은 제2 코딩 블록의 부모 블록을 제2 코딩 블록 및 적어도 하나의 형제 블록으로 분할할 수 있다. 제2 트리 파티션은 제2 코딩 블록의 부모 블록을 적어도 2개의 자식 블록으로 분할할 수 있다. 제1 코딩 블록은 제2 코딩 블록의 이웃 블록, 제2 코딩 블록의 형제 블록, 제2 코딩 블록의 부모 블록, 또는 제2 트리 파티션에 의한 부모 블록의 자식 블록일 수 있다. 최근에 추정된 MV 리스트 내의 각각의 검색된 MV 세트는 제2 코딩 블록의 이웃 블록, 제2 코딩 블록의 형제 블록, 제2 코딩 블록의 부모 블록, 또는 상이한 트리 파티션에 의한 제2 코딩 블록의 부모 블록의 자식 블록에 대해 선택된 MV 세트일 수 있다.
도출된 MV 세트는 시작점 선택을 위한 아핀 MV 후보로서 이용될 수 있다. 시작점: (예를 들어, 본 명세서에 설명된 바와 같이 도출되는) 하나 이상의 아핀 MV 예측자; 병진 모델의 MV; 및 순환 리스트의 엔트리(예를 들어, 각각의 엔트리)로부터의 도출된 MV 세트들을 선택하기 위해 하나 이상의(예를 들어, 3개의) 아핀 MV 후보가 (예를 들어, 인코더가 4-파라미터 아핀 모델에 대한 아핀 ME를 시작하기 전에) 비교될 수 있다.
리스트는, 예를 들어, 인코더가 ME(예를 들어, 4-파라미터 아핀 ME)를 수행한 후에 업데이트될 수 있다. 검색 결과들은 본 명세서에 설명된 바와 같이 리스트(예를 들어, 최근에 추정된 MV 리스트)에 추가될 수 있다. 리스트에 추가될 후보와 동일한 블록 위치, 블록 폭 및 블록 높이를 갖는 엔트리가 리스트에 존재하는 경우, 엔트리의 제어점 MV들은 추가될 후보의 MV들로 업데이트될 수 있다. 리스트 크기 및 리스트의 헤드는 동일하게 유지될 수 있다. 리스트에 중복 블록이 없다면, 후보는 순환 리스트의 끝에 추가될 수 있다. 순환 리스트의 가장 오래된 엔트리는, 예를 들어, 그 리스트가 이미 가득 찼다면 덮어 쓰여질 수 있다. 리스트의 크기 및 리스트의 헤드가 이에 따라 변경될 수 있다.
도 11a 내지 도 11f는 예시적인 리스트 구성 및 업데이트들을 도시한다. 도 11a 내지 도 11f의 음영 블록들은 순환 리스트의 현재 헤드를 나타낼 수 있다. 코딩 블록 B0이 주어지면, 인코더는 비분할 모드, 수평 BT, 수직 BT, 수평 TT, 수직 TT 및/또는 QT를 시도할 수 있다. 리스트는 현재 크기 및/또는 최대 크기를 가질 수 있다. 예를 들어, 초기 리스트는 비어 있을 수 있고, 최대 리스트 크기는 4일 수 있다. 리스트가 최대 크기에 도달한 경우, 도출된 MV 세트가 리스트에 추가되기 전에 리스트로부터 가장 덜 최근에 추정된 MV 세트가 제거될 수 있다. 도 11a에 도시된 바와 같이, 예를 들어 인코더가 블록 B0에 대한 비분할 파티션을 체크한 후에, 블록 B0의 아핀 제어점 MV들이 리스트에 추가될 수 있다. 블록 B1 및 B2의 아핀 제어점 MV들은, 예를 들어, 인코더가 수평 BT 파티션을 체크한 후에, 도 11b에 도시된 바와 같은 순서로 리스트에 추가될 수 있다. 파티션의 부모 블록의 아핀 제어점 MV들은, 예를 들어, 인코더가 파티션의 인코딩을 완료한 후에 (예를 들어, 리스트에 있지 않은 경우) 리스트에 다시 추가될 수 있다. 예를 들어, 제2 코딩 블록이 제1 트리 파티션 내의 마지막 블록인 경우, 최근에 추정된 MV 리스트의 헤드가 부모 블록과 연관된 MV 세트로 설정될 수 있다. 부모 블록의 MV들은 다른 트리 파티션 방식의 그 서브-블록의 ME에 이용될 수 있다. 부모 블록의 MV들은 인코더가 새로운 트리 파티션을 체크하기 전에 리스트 내에 (예를 들어, 항상) 유지될 수 있다. 도 11c 내지 도 11f는 인코더가 수직 BT, 수평 TT, 수직 TT 및 QT를 체크한 후의 업데이트된 리스트를 도시한다.
본 명세서에서 설명되는 이전의 검색된 모션 모델 파라미터들을 이용하는 시작점 생성이 6-파라미터 아핀 모델에서 이용될 수 있다.
Figure pct00039
는 6-파라미터 아핀 모델에 대한 블록 B의 i번째 참조 픽처에 대한 제어점 MV 세트를 나타낼 수 있다. 시작점 선택에 이용되는 현재 블록의 i번째 참조 픽처에 대한 제어점 MV 세트는 수학식들 30 내지 35에 예시된 바와 같이 도출될 수 있다. i번째 참조 픽처에 대한 좌측 상단 제어점에서의 MV(v0x, v0y)는 다음과 같이 도출될 수 있다:
Figure pct00040
Figure pct00041
i번째 참조 픽처에 대한 우측 상단 제어점에서의 MV(v1x, v1y)는 다음과 같이 도출될 수 있다:
Figure pct00042
Figure pct00043
i번째 참조 픽처에 대한 좌측 하단 제어점에서의 MV(v2x, v2y)는 다음과 같이 도출될 수 있다:
Figure pct00044
Figure pct00045
도출된 MV 세트는 6-파라미터 아핀 검색에 대한 시작점 선택을 위한 아핀 MV 후보로서 이용될 수 있다. 현재 블록이 4-파라미터 아핀 검색을 수행하고, 순환 리스트 내의 엔트리가 6-파라미터 아핀 모델인 경우, (예를 들어, 단지) 좌측 상단 및 우측 상단 MV들만이 수학식들 30 내지 33을 이용하여 도출될 수 있다.
인코더는 아핀 병합 모드에서 아핀 MV 예측자를 고려할 수 있다. (예컨대, 하나의) 제어점에서 (예를 들어, 직접) MV 예측자를 이용하여, 그 제어점의 MV에 대한 MVD 시그널링 오버헤드가 감소될 수 있다. 하나 이상의 발견된 MV와 예측자들을 조합함으로써 추가의 MV 세트들이 생성될 수 있다. 예를 들어, 현재 블록 ME는 6-파라미터 아핀 모델에 대한 것일 수 있다. 현재 블록에 대해 MV 세트(예컨대, 제어점 MV 세트) 및/또는 MV 예측자(MVP) 세트(예컨대, 아핀 MVP 세트)가 결정될 수 있다. ME(예를 들어, 6-파라미터 아핀 ME) 후에, 제어점 MV 세트는 현재 블록에 대한 {MV0, MV1, MV2}일 수 있다. 현재 블록에 대한 아핀 MV 예측자 세트는 본 명세서에 설명된 바와 같이 생성된 하나 이상의(예컨대, 3개의) 제어점에 대한 {MVP0, MVP1, MVP2}일 수 있다. MV 세트의 제1 MV가 MVP 세트의 제1 MVP와 동일한지가 결정될 수 있다. 제1 MV가 제1 MVP와 동일하지 않으면, MV 세트 내의 제1 MV가 제1 MVP로 대체되어 MV-MVP 조합된 세트를 생성할 수 있다. 제1 MV는, 예를 들어, MV0, MV1, 또는 MV2일 수 있는 반면, 제1 MVP는 MVP0, MVP1, MVP2일 수 있다. 발견된 MV들과 예측자들을 조합함으로써 생성되는 MV-MVP 조합된 세트는 {MVP0, MV1, MV2}, {MV0, MVP1, MV2} 및/또는 {MV0, MV1, MVP2} 중 하나 이상일 수 있다. 인코더는 (예컨대, 각각의) MV-MVP 조합된 세트에 대해 본 명세서에 설명된 코스트(예컨대, ME 코스트)를 계산할 수 있고, 이를 MV 세트의 코스트와 비교할 수 있다. 예를 들어, MV 세트 및/또는 MV-MVP 조합된 세트의 코스트는 ME 코스트일 수 있고, MV 세트 또는 MV-MVP 조합된 세트 내의 각각의 MV 또는 MVP에 대한 각각의 비트 코스트 및 예측 오차에 기반하여 계산될 수 있다. 최상의 MV 세트가 그 각각의 ME 코스트들에 기반하여 MV-MVP 조합된 세트 및 MV 세트로부터 선택될 수 있다. 예를 들어, 최상의 MV 세트는 그 각각의 ME 코스트들에 기반하여 MV 세트 및 각각의 MV-MVP 조합된 세트(예컨대, {MVP0, MV1, MV2}, {MV0, MVP1, MV2} 및/또는 {MV0, MV1, MVP2}) 중에서 선택될 수 있다. 최상의 MV 세트는 최저 ME 코스트를 갖는 MV 세트 또는 MV-MVP 조합된 세트일 수 있다. 도 12는 조합된 아핀 MV들에 대한 체크를 예시하는 흐름도를 도시한다.
MV 세트의 제2 MV는 MVP 세트의 제2 MVP와 비교될 수 있다. 제2 MV가 제2 MVP와 동일하지 않으면, 제2 MV는 제2 MVP로 대체되어 {MV0, MVP1, MVP2}일 수 있는 제2 MV-MVP 조합된 세트를 생성할 수 있다. 인코더는 제2 MV-MVP 조합된 세트의 비트 코스트(예컨대, ME 코스트)를 계산할 수 있다. 제2 MV-MVP 조합된 세트의 비트 코스트가 현재 최상의 MV 세트의 비트 코스트와 비교될 수 있고, 추가의 최상의 MV 세트가 선택될 수 있다. 예를 들어, 제2 MV-MVP 조합된 세트의 비트 코스트가 현재 최상의 MV 세트의 비트 코스트보다 낮으면, 제2 MV-MVP 조합된 세트가 선택될 수 있다. 그렇지 않은 경우, 현재 최상의 세트가 선택될 수 있다.
ME는 잠재적인 MVD 시그널링 오버헤드에 부분적으로 기반하여 수행될 수 있다. 회전 및 줌 파라미터 관련 MV가 (예컨대, MVD 시그널링 오버헤드 및/또는 예측 오차를 고려하여) 도출될 수 있다. 예를 들어, 아핀 ME 후에 정밀화(예를 들어, 고속 정밀화)가 추가될 수 있다. 4-파라미터 아핀 모션 모델에 대한 줌 및 회전 파라미터들과 관련된 MV들(예컨대, 줌 및 회전 파라미터들과 관련된 MV들만)이 정밀화될 수 있다. 예를 들어, 모션 추정(예를 들어, 아핀 ME) 후에, 좌측 상단 및 우측 상단 제어점들에 대한 MV 세트 {MV0, MV1}이 있을 수 있다. 인코더는 좌측 상단 MV를 MV0으로서 고정하면서 MV1의 가장 가까운 4개의 이웃 MV들을 체크할 수 있다: (MV1x-s, MV1y), (MV1x, MV1y-s), (MV1x, MV1y+s), (MV1x+s, MV1y). 파라미터들은 스텝 크기(예를 들어, ¼)일 수 있다. 인코더는 우측 상단 제어점에서 (예컨대, 각각의) 정밀화된 MV에 대한 코스트(예컨대, ME 코스트)를 계산할 수 있고, 이를 현재의 최소 코스트와 비교할 수 있다. 이러한 정밀화에서, 인코더는 ME 코스트를 계산할 때 시그널링 오버헤드를 고려할 수 있다. 인코더는 우측 상단 MV를 고정하면서 좌측 상단 제어점에서 MV를 정밀화할 수 있다. 정밀화 프로세스는 반복적으로 수행될 수 있다.
아핀 ME에 대한 공간적 그레디언트 계산이 수행될 수 있다. 본 명세서에 설명된 바와 같이, 하나 이상의 파라미터(예를 들어, 아핀 파라미터)는, 예를 들어, 원래 신호와 예측 신호 사이의 시간적 차이 및/또는 공간적 그레디언트들을 이용하여 추정될 수 있다. 공간적 그레디언트들은 소벨 필터를 이용하여 계산될 수 있다. 소벨 필터는 3x3 2차원 필터일 수 있다. 수평 그레디언트 계산을 위한 소벨 필터는
Figure pct00046
일 수 있다. 수직 그레디언트 계산을 위한 소벨 필터는
Figure pct00047
일 수 있다. 예를 들어, 그레디언트는 CU 내의 내부 샘플들(예를 들어, 내부 샘플들만)에 대해 계산될 수 있다. CU 크기는 WxH일 수 있고, 그레디언트는 (W-2)x(H-2) 내부 샘플들(예를 들어, (W-2)x(H-2) 내부 샘플들만)에 대해 계산될 수 있다. 도 13은 8x8 코딩 유닛(CU)에 대한 예시적인 그레디언트 계산을 도시한다. 도 13에 도시된 바와 같이, 소벨 필터가 적용되어 6x6 내부 샘플들에 대한 그레디언트를 계산할 수 있고, 그레디언트는 CU의 경계들 상의 샘플들의 그레디언트들(예를 들어, 도 13에 도시된 회색/실선 원들)에 대해 확장될 수 있다. 그레디언트들이 내부 6x6 샘플들에 대해 소벨 필터로 계산된 후에, 예를 들어 6x6 내부 블록에서 가장 가까운 이웃으로부터 그레디언트를 복사함으로써, 패딩이 CU 경계들에서의 샘플들에 대해 적용될 수 있다.
그레디언트 계산에 필터가 이용될 수 있다. 수평 그레디언트 계산을 위한 필터는
Figure pct00048
일 수 있고, 수직 그레디언트 계산을 위한 필터는
Figure pct00049
일 수 있다. 그레디언트 계산 복잡도가 감소될 수 있다. CU 경계 샘플들에 대한 그레디언트 계산이 수행될 수 있다. CU 경계들에서의 그레디언트 정확도가 개선될 수 있다. CU는 CU 경계(예를 들어, 각각의 CU 경계)에서 행 및 열을 채우는 것에 의해 패딩될 수 있다. 도 14는 8x8 CU에 대한 예시적인 그레디언트 계산을 도시한다. 도 14에 도시된 바와 같이, 8x8 예측 블록이 10x10 블록에 패딩될 수 있다. 도 14에 도시된 음영 원들은 패딩된 샘플들을 나타낼 수 있다. 패딩된 샘플들을 이용하여 하나 이상의 8x8 CU 샘플(예를 들어, 모든 8x8 CU 샘플)에 대한 그레디언트를 계산하는데 3-탭 필터가 적용될 수 있다.
도 14에 도시된 바와 같이, 8x8 경계 샘플들에 대한 그레디언트는 패딩된 샘플들 및/또는 8x8 예측 샘플들을 이용하여 계산될 수 있다. 패딩된 샘플들은 본 명세서에 설명된 바와 같은 하나 이상의 방식으로 도출될 수 있다. 패딩된 샘플들은 CU의 모션 벡터를 이용하여 참조 픽처로부터 보간됨으로써 도출될 수 있다. 정수 샘플들은 참조 픽처 버퍼로부터 페치될 수 있다. 참조 픽처로부터 보간을 통해 패딩된 샘플들을 도출하는 것은 비교적 정확할 수 있다. 패딩된 샘플들은 CU의 모션 벡터에 기반하여 가장 가까운 정수 위치들에서 참조 샘플들로부터 복사함으로써 도출될 수 있다. 참조 샘플들로부터의 복사를 통해 패딩된 샘플들을 도출하는 것은 계산 복잡도를 감소시킬 수 있다.
예를 들어, 패딩될 위치는 (x, y)일 수 있다. CU MV는 (MVx, MVy)일 수 있다. RefPic는 참조 픽처 버퍼일 수 있다. RefPic(i, j)는 정수 위치 (i, j)에서의 샘플 값일 수 있다. (x, y)에 대한 패딩 샘플 값은 RefPic(round(x+MVx), round(y+MVy))일 수 있고, 여기서 round(x)는 입력 변수 x를 그 가장 가까운 정수 값으로 라운딩하는 함수일 수 있다.
특징들 및 요소들이 위에서 특정한 조합들로 설명되었지만, 관련 기술분야의 통상의 기술자는 각각의 특징 또는 요소가 단독으로, 또는 다른 특징들 및 요소들과의 임의의 조합으로 이용될 수 있다는 것을 이해할 것이다. 또한, 본 명세서에 설명된 방법들은 컴퓨터 또는 프로세서에 의해 실행하기 위한 컴퓨터 판독가능한 매체 내에 통합된 컴퓨터 프로그램, 소프트웨어, 또는 펌웨어로 구현될 수 있다. 컴퓨터 판독가능한 매체의 예들은 (유선 또는 무선 접속들을 통해 전송되는) 전자 신호들 및 컴퓨터 판독가능한 저장 매체를 포함한다. 컴퓨터 판독가능한 저장 매체의 예들은 판독 전용 메모리(ROM), 랜덤 액세스 메모리(RAM), 레지스터, 캐시 메모리, 반도체 메모리 디바이스들, 내부 하드 디스크들과 이동식 디스크들 등의 자기 매체, 광자기 매체, 및 CD-ROM 디스크들과 디지털 다목적 디스크들(DVD들) 등의 광학 매체를 포함하지만, 이에 제한되지는 않는다. 소프트웨어와 연관된 프로세서는 WTRU, UE, 단말기, 기지국, RNC, 또는 임의의 호스트 컴퓨터에서 이용하기 위한 무선 주파수 트랜시버를 구현하는데 이용될 수 있다.

Claims (26)

  1. 무선 전송/수신 유닛(WTRU)으로서,
    프로세서
    를 포함하며, 상기 프로세서는,
    제1 코딩 블록에 대해, 하나 이상의 모션 벡터(MV)를 포함하는 제1 MV 세트를 도출하고;
    상기 제1 MV 세트를 최근에 추정된 MV 리스트에 추가하고;
    제2 코딩 블록에 대해, 상기 최근에 추정된 MV 리스트 내의 하나 이상의 MV 세트 및 하나 이상의 MV 예측자에 적어도 부분적으로 기반하여 모션 추정을 위한 시작점을 선택하고;
    선택된 시작점에 기반하여 상기 제2 코딩 블록을 인코딩하도록 구성되는, 무선 전송/수신 유닛(WTRU).
  2. 제1항에 있어서,
    상기 프로세서는 상기 선택된 시작점에 기반하여 상기 제2 코딩 블록과 연관된 아핀 모션 추정을 수행하도록 구성되는, 무선 전송/수신 유닛(WTRU).
  3. 제1항에 있어서,
    상기 제1 MV 세트는 하나 이상의 제어점 MV(CPMV)를 포함하고, 상기 제1 MV 세트는 상기 제1 코딩 블록과 연관된 아핀 모션 추정을 수행함으로써 도출되는, 무선 전송/수신 유닛(WTRU).
  4. 제1항에 있어서,
    상기 최근에 추정된 MV 리스트는 선입선출(FIFO) 순환 리스트이고, 상기 최근에 추정된 MV 리스트의 크기는 4인, 무선 전송/수신 유닛(WTRU).
  5. 제1항에 있어서,
    제1 트리 파티션은 상기 제2 코딩 블록의 부모 블록을 상기 제2 코딩 블록 및 적어도 하나의 형제 블록으로 분할하고, 제2 트리 파티션은 상기 제2 코딩 블록의 부모 블록을 적어도 2개의 자식 블록으로 분할하며, 상기 제1 코딩 블록은 상기 제2 코딩 블록의 이웃 블록, 상기 제2 코딩 블록의 형제 블록, 상기 제2 코딩 블록의 부모 블록, 또는 상기 제2 트리 파티션에 의한 상기 부모 블록의 자식 블록인, 무선 전송/수신 유닛(WTRU).
  6. 제1항에 있어서,
    상기 최근에 추정된 MV 리스트는 모션 추정을 위한 하나 이상의 검색된 MV 세트를 포함하고, 상기 최근에 추정된 MV 리스트 내의 각각의 검색된 MV 세트는 상기 제2 코딩 블록의 이웃 블록, 상기 제2 코딩 블록의 형제 블록, 상기 제2 코딩 블록의 부모 블록, 또는 상이한 트리 파티션에 의한 상기 제2 코딩 블록의 상기 부모 블록의 자식 블록에 대해 선택된 MV 세트인, 무선 전송/수신 유닛(WTRU).
  7. 제1항에 있어서,
    상기 최근에 추정된 MV 리스트는 최대 크기와 연관되고,
    상기 프로세서는,
    상기 최근에 추정된 MV 리스트의 크기가 상기 최대 크기와 동일한지를 결정하고;
    상기 최근에 추정된 MV 리스트의 크기가 상기 최대 크기와 동일하다는 조건에서, 상기 최근에 추정된 MV 리스트로부터 가장 덜 최근에 추정된 MV 세트를 제거하도록 추가로 구성되는, 무선 전송/수신 유닛(WTRU).
  8. 제1항에 있어서,
    상기 프로세서는 상기 선택된 시작점에 기반하여 상기 제2 코딩 블록과 연관된 아핀 모션 추정을 수행하도록 구성되고, 상기 시작점은 상기 최근에 추정된 MV 리스트 내의 상기 하나 이상의 MV 세트, 아핀 MV 예측자들, 및 병진 모델 MV의 각각의 예측 오차들에 기반하여 선택되는, 무선 전송/수신 유닛(WTRU).
  9. 제1항에 있어서,
    제1 트리 파티션은 부모 블록을 상기 제2 코딩 블록으로 분할하고, 상기 제2 코딩 블록이 상기 제1 트리 파티션에서의 마지막 블록이라는 조건에서, 상기 프로세서는 상기 최근에 추정된 MV 리스트의 헤드를 상기 부모 블록과 연관된 MV 세트로 설정하도록 구성되는, 무선 전송/수신 유닛(WTRU).
  10. 제1항에 있어서,
    상기 프로세서는 상기 최근에 추정된 MV 리스트의 헤드에 상기 제1 MV 세트를 추가하도록 구성되는, 무선 전송/수신 유닛(WTRU).
  11. 방법으로서,
    제1 코딩 블록에 대해, 하나 이상의 모션 벡터(MV)를 포함하는 제1 MV 세트를 도출하는 단계;
    상기 제1 MV 세트를 최근에 추정된 MV 리스트에 추가하는 단계;
    제2 코딩 블록에 대해, 상기 최근에 추정된 MV 리스트 내의 하나 이상의 MV 세트 및 하나 이상의 MV 예측자에 적어도 부분적으로 기반하여 모션 추정을 위한 시작점을 선택하는 단계; 및
    선택된 시작점에 기반하여 상기 제2 코딩 블록을 인코딩하는 단계
    를 포함하는, 방법.
  12. 제11항에 있어서,
    상기 시작점에 기반하여 상기 제2 코딩 블록을 인코딩하는 단계는 상기 선택된 시작점에 기반하여 상기 제2 코딩 블록과 연관된 아핀 모션 추정을 수행하는 단계를 포함하는, 방법.
  13. 제11항에 있어서,
    상기 제1 MV 세트는 하나 이상의 제어점 MV(CPMV)를 포함하고, 상기 제1 MV 세트는 상기 제1 코딩 블록과 연관된 아핀 모션 추정을 수행함으로써 도출되는, 방법.
  14. 제11항에 있어서,
    상기 최근에 추정된 MV 리스트는 선입선출(FIFO) 순환 리스트이고, 상기 최근에 추정된 MV 리스트의 크기는 4인, 방법.
  15. 제11항에 있어서,
    제1 트리 파티션은 상기 제2 코딩 블록의 부모 블록을 상기 제2 코딩 블록 및 적어도 하나의 형제 블록으로 분할하고, 제2 트리 파티션은 상기 제2 코딩 블록의 부모 블록을 적어도 2개의 자식 블록으로 분할하며, 상기 제1 코딩 블록은 상기 제2 코딩 블록의 이웃 블록, 상기 제2 코딩 블록의 형제 블록, 상기 제2 코딩 블록의 부모 블록, 또는 상기 제2 트리 파티션에 의한 상기 부모 블록의 자식 블록인, 방법.
  16. 제11항에 있어서,
    상기 최근에 추정된 MV 리스트는 모션 추정을 위한 하나 이상의 검색된 MV 세트를 포함하고, 상기 최근에 추정된 MV 리스트 내의 각각의 검색된 MV 세트는 상기 제2 코딩 블록의 이웃 블록, 상기 제2 코딩 블록의 형제 블록, 상기 제2 코딩 블록의 부모 블록, 또는 상이한 트리 파티션에 의한 상기 제2 코딩 블록의 상기 부모 블록의 자식 블록에 대해 선택된 MV 세트인, 방법.
  17. 제11항에 있어서,
    상기 최근에 추정된 MV 리스트는 최대 크기와 연관되고,
    상기 방법은,
    상기 최근에 추정된 MV 리스트의 크기가 상기 최대 크기와 동일한지를 결정하는 단계; 및
    상기 최근에 추정된 MV 리스트의 크기가 상기 최대 크기와 동일하다는 조건에서, 상기 최근에 추정된 MV 리스트로부터 가장 덜 최근에 추정된 MV 세트를 제거하는 단계
    를 더 포함하는, 방법.
  18. 제11항에 있어서,
    상기 시작점에 기반하여 상기 제2 코딩 블록을 인코딩하는 단계는 상기 선택된 시작점에 기반하여 상기 제2 코딩 블록과 연관된 아핀 모션 추정을 수행하는 단계를 포함하고, 상기 시작점은 상기 최근에 추정된 MV 리스트 내의 상기 하나 이상의 MV 세트, 아핀 MV 예측자들, 및 병진 모델 MV의 각각의 예측 오차들에 기반하여 선택되는, 방법.
  19. 제11항에 있어서,
    제1 트리 파티션은 부모 블록을 상기 제2 코딩 블록으로 분할하고, 상기 제2 코딩 블록이 상기 제1 트리 파티션에서의 마지막 블록이라는 조건에서, 상기 방법은 상기 최근에 추정된 MV 리스트의 헤드를 상기 부모 블록과 연관된 MV 세트로 설정하는 단계를 더 포함하는, 방법.
  20. 제11항에 있어서,
    상기 제1 MV 세트는 상기 최근에 추정된 MV 리스트의 헤드에 추가되는, 방법.
  21. 방법으로서,
    하나 이상의 모션 벡터(MV)를 포함하는 MV 세트 및 하나 이상의 MV 예측자(MVP)를 포함하는 MVP 세트를 결정하는 단계;
    상기 MV 세트의 제1 MV가 상기 MVP 세트의 제1 MVP와 동일한지를 결정하는 단계;
    상기 제1 MV가 상기 제1 MVP와 동일하지 않은 조건에서, 상기 MV 세트 내의 상기 제1 MV를 상기 제1 MVP로 대체하여 제1 MV-MVP 조합된 세트를 생성하는 단계;
    상기 제1 MV-MVP 조합된 세트의 코스트를 결정하는 단계; 및
    상기 제1 MV-MVP 조합된 세트의 코스트에 기반하여 상기 MV 세트 또는 상기 제1 MV-MVP 조합된 세트 중 하나를 최상의 MV 세트인 것으로 선택하는 단계
    를 포함하는, 방법.
  22. 제21항에 있어서,
    상기 MV 세트 또는 상기 제1 MV-MVP 조합된 세트 중 하나를 상기 최상의 MV 세트인 것으로 선택하는 단계는,
    상기 제1 MV-MVP 조합된 세트의 코스트를 상기 MV 세트의 ME 코스트와 비교하는 단계;
    상기 조합된 MV 세트의 코스트가 상기 MV 세트의 코스트보다 더 낮은 조건에서, 상기 제1 MV-MVP 조합된 세트를 상기 최상의 MV 세트인 것으로 선택하는 단계; 및
    상기 제1 MV-MVP 조합된 세트의 코스트가 상기 MV 세트의 코스트보다 낮지 않은 조건에서, 상기 MV 세트를 상기 최상의 MV 세트인 것으로 선택하는 단계
    를 포함하는, 방법.
  23. 제21항에 있어서,
    상기 MV 세트는 하나 이상의 제어점 MV를 포함하고, 상기 MVP 세트는 하나 이상의 아핀 MVP를 포함하는, 방법.
  24. 제21항에 있어서,
    상기 MV 세트의 제2 MV가 상기 MVP 세트의 제2 MVP와 동일한지를 결정하는 단계;
    상기 제2 MV가 상기 제2 MVP와 동일하지 않은 조건에서, 상기 MV 세트 내의 상기 제2 MV를 상기 제2 MVP로 대체하여 제2 MV-MVP 조합된 세트를 생성하는 단계;
    상기 제2 MV-MVP 조합된 세트의 코스트를 결정하는 단계;
    상기 제2 MV-MVP 조합된 세트의 코스트에 기반하여 상기 최상의 MV 세트를 업데이트하는 단계;
    상기 MV 세트의 제3 MV가 상기 MVP 세트의 제3 MVP와 동일한지를 결정하는 단계;
    상기 제3 MV가 상기 제3 MVP와 동일하지 않은 조건에서, 상기 MV 세트 내의 상기 제3 MV를 상기 제3 MVP로 대체하여 제3 MV-MVP 조합된 세트를 생성하는 단계;
    상기 제3 MV-MVP 조합된 세트의 코스트를 결정하는 단계; 및
    상기 제3 MV-MVP 조합된 세트의 코스트에 기반하여 상기 최상의 MV 세트를 업데이트하는 단계
    를 더 포함하는, 방법.
  25. 제21항에 있어서,
    상기 MV 세트의 제2 MV가 상기 MVP 세트의 제2 MVP와 동일한지를 결정하는 단계;
    상기 제2 MV가 상기 제2 MVP와 동일하지 않은 조건에서, 상기 제1 MV-MVP 조합된 세트 내의 상기 제2 MV를 상기 제2 MVP로 대체하여 제4 MV-MVP 조합된 세트를 생성하는 단계;
    상기 제4 MV-MVP 조합된 세트의 코스트를 결정하는 단계; 및
    상기 제2 MV-MVP 조합된 세트의 코스트에 기반하여 상기 최상의 MV 세트를 업데이트하는 단계
    를 더 포함하는, 방법.
  26. 제21항에 있어서,
    상기 MV-MVP 조합된 세트의 코스트는 모션 추정(ME) 코스트이고, 상기 ME 코스트는 상기 MV-MVP 조합된 세트 내의 각각의 MV에 대한 각각의 비트 코스트 및 예측 오차에 기반하여 결정되는, 방법.
KR1020217008427A 2018-09-21 2019-09-20 아핀 모델 기반 비디오 코딩에 대한 아핀 모션 추정 KR20210074280A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862734783P 2018-09-21 2018-09-21
US62/734,783 2018-09-21
US201962812979P 2019-03-02 2019-03-02
US62/812,979 2019-03-02
PCT/US2019/052101 WO2020061423A1 (en) 2018-09-21 2019-09-20 Affine motion estimation for affine model-based video coding

Publications (1)

Publication Number Publication Date
KR20210074280A true KR20210074280A (ko) 2021-06-21

Family

ID=68136546

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217008427A KR20210074280A (ko) 2018-09-21 2019-09-20 아핀 모델 기반 비디오 코딩에 대한 아핀 모션 추정

Country Status (5)

Country Link
US (1) US11943467B2 (ko)
EP (1) EP3854096A1 (ko)
KR (1) KR20210074280A (ko)
CN (1) CN113016186A (ko)
WO (1) WO2020061423A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3895430A4 (en) * 2018-12-13 2022-10-12 Beijing Dajia Internet Information Technology Co., Ltd. METHOD FOR DRIVING CONSTRUCTED AFFINE FUSION CANDIDATES

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1404135B1 (en) * 2000-01-21 2016-12-14 Nokia Technologies Oy A motion estimation method and a system for a video coder
KR20130030181A (ko) * 2011-09-16 2013-03-26 한국전자통신연구원 움직임 벡터 예측기를 이용한 움직임 벡터 부호화/복호화 방법 및 장치
US20130177083A1 (en) * 2012-01-05 2013-07-11 Qualcomm Incorporated Motion vector candidate index signaling in video coding
JP6574976B2 (ja) * 2014-03-18 2019-09-18 パナソニックIpマネジメント株式会社 動画像符号化装置および動画像符号化方法
EP3264768A1 (en) * 2016-06-30 2018-01-03 Thomson Licensing Method and apparatus for video coding with adaptive motion information refinement
CN116708782A (zh) * 2016-07-12 2023-09-05 韩国电子通信研究院 图像编码/解码方法以及用于该方法的记录介质
US10448010B2 (en) * 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
US10681370B2 (en) * 2016-12-29 2020-06-09 Qualcomm Incorporated Motion vector generation for affine motion model for video coding
US20180192071A1 (en) * 2017-01-05 2018-07-05 Mediatek Inc. Decoder-side motion vector restoration for video coding
CN110249628B (zh) * 2017-02-06 2021-08-20 华为技术有限公司 用于预测分区的视频编码器和解码器
US10701390B2 (en) * 2017-03-14 2020-06-30 Qualcomm Incorporated Affine motion information derivation
US10602180B2 (en) * 2017-06-13 2020-03-24 Qualcomm Incorporated Motion vector prediction
US20190116374A1 (en) * 2017-10-17 2019-04-18 Qualcomm Incorporated Coding motion information of video data using coding structure-based candidate list construction

Also Published As

Publication number Publication date
CN113016186A (zh) 2021-06-22
US20230037273A2 (en) 2023-02-02
US11943467B2 (en) 2024-03-26
US20210400300A1 (en) 2021-12-23
WO2020061423A1 (en) 2020-03-26
EP3854096A1 (en) 2021-07-28

Similar Documents

Publication Publication Date Title
JP7168593B2 (ja) 双方向オプティカルフローに基づいた動き補償予測
US11553206B2 (en) Bl-prediction for video coding
US11575933B2 (en) Bi-directional optical flow method with simplified gradient derivation
EP3704856A1 (en) Sub-block motion derivation and decoder-side motion vector refinement for merge mode
KR20210113187A (ko) 대칭 모션 벡터 차이 코딩
US11991384B2 (en) Adaptive control point selection for affine motion model based video coding
US20220070441A1 (en) Combined inter and intra prediction
US11979595B2 (en) Symmetric merge mode motion vector coding
US20240089427A1 (en) History-based motion vector prediction
US11943467B2 (en) Affine motion estimation for affine model-based video coding