CN114556928A - 帧内子分区相关的帧内编码 - Google Patents

帧内子分区相关的帧内编码 Download PDF

Info

Publication number
CN114556928A
CN114556928A CN202080071165.1A CN202080071165A CN114556928A CN 114556928 A CN114556928 A CN 114556928A CN 202080071165 A CN202080071165 A CN 202080071165A CN 114556928 A CN114556928 A CN 114556928A
Authority
CN
China
Prior art keywords
intra
sub
mode
reference samples
partition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080071165.1A
Other languages
English (en)
Inventor
杨华
贺玉文
陈伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Vid Scale Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid Scale Inc filed Critical Vid Scale Inc
Publication of CN114556928A publication Critical patent/CN114556928A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供了可用于对编码单元(CU)进行解码和/或编码的系统、方法和工具。可确定用于CU的帧内预测模式。可基于该帧内预测模式来确定分割模式以在该CU中生成多个子分区。对该CU中的该多个子分区中的第一子分区的预测可基于该CU中的该多个子分区中的第二子分区中的参考样本。可例如基于所确定的分割模式对该CU进行解码和/或编码。

Description

帧内子分区相关的帧内编码
相关申请的交叉引用
本申请要求提交于2019年9月17日的美国序列号62/901,497的优先权,该文献的全部公开内容以引用方式并入本文。
背景技术
视频编码系统可用于压缩数字视频信号,例如,以减少与此类信号相关联的存储和/或传输带宽。视频编码系统可包括基于块的、基于小波的和/或基于对象的系统。可部署基于块的混合视频编码系统。
发明内容
描述了用于使用基于用于编码单元(CU)的帧内预测模式确定的分割模式对CU进行解码和/或编码的系统、方法和工具。
一个或多个处理器可被配置为确定用于CU的帧内预测模式。一个或多个处理器可被配置为基于帧内预测模式来确定分割模式以在CU中生成多个子分区,其中对CU中的多个子分区中的第一子分区的预测可基于CU中的多个子分区中的第二子分区中的参考样本。一个或多个处理器可被配置为基于所确定的分割模式对CU进行解码。
一个或多个处理器可被配置为确定用于CU的帧内预测模式。一个或多个处理器可被配置为基于帧内预测模式来确定分割模式以在CU中生成多个子分区,其中对CU中的多个子分区中的第一子分区的预测基于CU中的多个子分区中的第二子分区中的参考样本。一个或多个处理器可被配置为基于所确定的分割模式对CU进行编码。
一种设备可包括如所述的装置和以下各项中的至少一者:(i)被配置为接收信号的天线,该信号包括表示图像的数据,(ii)被配置为将所接收的信号限制到包括表示图像的数据的频带的频带限制器,或(iii)被配置为显示图像的显示器。此类设备的非限制性示例可包括TV、移动电话、平板电脑或机顶盒(STB)。一种装置可包括访问单元和发射器,访问单元被配置为访问基于根据如在上述任何组合中所述的装置确定的CU的分割模式而生成的数据(例如,包括残差),发射器被配置为发射数据(例如,包括残差)。
一种方法可包括确定用于CU的帧内预测模式。该方法可包括基于帧内预测模式来确定分割模式以在CU中生成多个子分区,其中对CU中的多个子分区中的第一子分区的预测基于CU中的多个子分区中的第二子分区中的参考样本。该方法可包括基于所确定的分割模式对CU进行解码。
一种方法可包括确定用于CU的帧内预测模式。该方法可包括基于帧内预测模式来确定分割模式以在CU中生成多个子分区,其中对CU中的多个子分区中的第一子分区的预测基于CU中的多个子分区中的第二子分区中的参考样本。该方法可包括基于所确定的分割模式对CU进行编码。
设备可采用所述的方法,并且此类设备可包括以下各项中的至少一者:(i)被配置为接收信号的天线,该信号包括表示图像的数据,(ii)被配置为将所接收的信号限制到包括表示图像的数据的频带的频带限制器,或(iii)被配置为显示该图像的显示器。此类设备的非限制性示例包括TV、移动电话、平板电脑或机顶盒(STB)。
装置可采用这些方法,并且此类装置可包括访问单元和发射器,访问单元被配置为访问基于针对CU确定的分割模式生成的数据(例如,包括残差),发射器被配置为发射数据(例如,包括残差)。
非暂态计算机可读介质可包括根据所述方法中的任一种方法生成的数据内容。非暂态计算机可读介质可使一个或多个处理器执行所述方法中的任一种方法。
计算机程序产品可包括在被一个或多个处理器执行时用于执行所述方法中的任一种方法的指令。
信号可包括基于根据所述方法中的任一种方法确定的CU的分割模式而生成的残差。
方法可包括访问包括基于根据所述方法中的任一种方法确定的CU的分割模式而生成的残差的数据,以及传输包括残差的数据。
附图说明
图1A是示出示例性通信系统的系统图。
图1B是示出可在图1A所示的通信系统内使用的示例性无线发射/接收单元(WTRU)的系统图。
图1C是示出可在图1A所示的通信系统内使用的示例性无线电接入网络(RAN)和示例性核心网络(CN)的系统图。
图1D是示出可在图1A所示的通信系统内使用的另一个示例性RAN和另一个示例性CN的系统图。
图2是示出示例性视频编码器的示意图。
图3是示出视频解码器的示例的示意图。
图4示出了可在其中实现各个方面和示例的系统的示例。
图5示出了允许4×8和8×4的CU的示例性划分。
图6示出了允许大于4×8或8×4的编码单元(CU)的示例性划分。
图7示出了帧内子分区(ISP)中的预测过程的示例:(a)CU包括四个子分区A、B、C和D;(b)可预测并重建子分区A,并且底部重建行可用于预测B;以及(c)B的重建样本的底部行可用于预测C。
图8示出了帧内预测模式的示例(例如,包括定向模式)。
图9示出了用于广角帧内预测的示例性参考样本,其具有(a)相对较大的宽度(相比于高度)或(b)相对较大的高度(相比于宽度)。
图10示出了用于帧内预测的多条参考线(MRL)的示例。
图11示出了由帧内预测模式限制的ISP分割模式的示例:(a)用于帧内模式的水平ISP分割;以及(b)用于帧内模式的垂直ISP分割。
图12示出了根据本文所述的一个或多个示例的用于使用基于帧内预测模式的分割模式对CU进行解码或编码的方法1200的示例。
具体实施方式
图1A是示出可在其中实现一个或多个所公开示例的示例性通信系统100的示意图。通信系统100可为向多个无线用户提供诸如语音、数据、视频、消息、广播等内容的多址接入系统。通信系统100可使多个无线用户能够通过系统资源(包括无线带宽)的共享来访问此类内容。例如,通信系统100可采用一个或多个信道接入方法,诸如码分多址接入(CDMA)、时分多址接入(TDMA)、频分多址接入(FDMA)、正交FDMA(OFDMA)、单载波FDMA(SC-FDMA)、零尾唯一字DFT扩展OFDM(ZT UW DTS-s OFDM)、唯一字OFDM(UW-OFDM)、资源块滤波OFDM、滤波器组多载波(FBMC)等。
如图1A所示,通信系统100可包括无线发射/接收单元(WTRU)102a、102b、102c、102d、RAN 104/113、CN 106/115、公共交换电话网络(PSTN)108、互联网110和其他网络112,但应当理解,所公开的示例设想了任何数量的WTRU、基站、网络和/或网络元件。WTRU 102a、102b、102c、102d中的每一者可以是被配置为在无线环境中操作和/或通信的任何类型的设备。作为示例,WTRU 102a、102b、102c、102d(其中任何一个均可被称为“站”和/或“STA”)可被配置为传输和/或接收无线信号,并且可包括用户设备(UE)、移动站、固定或移动用户单元、基于订阅的单元、寻呼机、蜂窝电话、个人数字助理(PDA)、智能电话、膝上型电脑、上网本、个人计算机、无线传感器、热点或Mi-Fi设备、物联网(IoT)设备、手表或其他可穿戴设备、头戴式显示器(HMD)、车辆、无人机、医疗设备和应用(例如,远程手术)、工业设备和应用(例如,在工业和/或自动处理链环境中操作的机器人和/或其他无线设备)、消费电子设备、在商业和/或工业无线网络上操作的设备等。WTRU 102a、102b、102c和102d中的任一者可互换地称为UE。
通信系统100还可包括基站114a和/或基站114b。基站114a、114b中的每一者可为任何类型的设备,其被配置为与WTRU 102a、102b、102c、102d中的至少一者无线对接以促进对一个或多个通信网络(诸如CN106/115、互联网110和/或其他网络112)的访问。作为示例,基站114a、114b可为基站收发台(BTS)、节点B、演进节点B、家庭节点B、家庭演进节点B、gNB、NR节点B、站点控制器、接入点(AP)、无线路由器等。虽然基站114a、114b各自被描绘为单个元件,但应当理解,基站114a、114b可包括任何数量的互连基站和/或网络元件。
基站114a可以是RAN 104/113的一部分,该RAN还可包括其他基站和/或网络元件(未示出),诸如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等。基站114a和/或基站114b可被配置为在一个或多个载波频率(其可被称为小区(未示出))上传输和/或接收无线信号。这些频率可在许可频谱、未许可频谱或许可和未许可频谱的组合中。小区可向特定地理区域提供无线服务的覆盖,该特定地理区域可为相对固定的或可随时间改变。小区可进一步被划分为小区扇区。例如,与基站114a相关联的小区可被划分为三个扇区。因此,在一个示例中,基站114a可包括三个收发器,即,小区的每个扇区一个收发器。在一个示例中,基站114a可采用多输入多输出(MIMO)技术并且可针对小区的每个扇区利用多个收发器。例如,可使用波束成形在所需的空间方向上传输和/或接收信号。
基站114a、114b可通过空中接口116与WTRU 102a、102b、102c、102d中的一者或多者通信,该空中接口可为任何合适的无线通信链路(例如,射频(RF)、微波、厘米波、微米波、红外(IR)、紫外(UV)、可见光等)。可使用任何合适的无线电接入技术(RAT)来建立空中接口116。
更具体地讲,如上所指出,通信系统100可为多址接入系统,并且可采用一个或多个信道接入方案,诸如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等。例如,RAN 104/113中的基站114a和WTRU 102a、102b、102c可实现诸如通用移动电信系统(UMTS)陆地无线电接入(UTRA)之类的无线电技术,其可使用宽带CDMA(WCDMA)来建立空中接口115/116/117。WCDMA可包括诸如高速分组接入(HSPA)和/或演进的HSPA(HSPA+)之类的通信协议。HSPA可包括高速下行链路(DL)分组接入(HSDPA)和/或高速UL分组接入(HSUPA)。
在一个示例中,基站114a和WTRU 102a、102b、102c可实现诸如演进的UMTS陆地无线电接入(E-UTRA)的无线电技术,其可使用长期演进(LTE)和/高级LTE(LTE-A)和/或高级LTE Pro(LTE-A Pro)来建立空中接口116。
在一个示例中,基站114a和WTRU 102a、102b、102c可实现诸如NR无线电接入的无线电技术,其可使用新无线电(NR)来建立空中接口116。
在一个示例中,基站114a和WTRU 102a、102b、102c可实现多种无线电接入技术。例如,基站114a和WTRU 102a、102b、102c可例如使用双连接(DC)原理一起实现LTE无线电接入和NR无线电接入。因此,WTRU102a、102b、102c所使用的空中接口可由多种类型的无线电接入技术和/或向/从多种类型的基站(例如,eNB和gNB)发送的传输来表征。
在示例中,基站114a和WTRU 102a、102b、102c可实现诸如IEEE802.11(即,无线保真(WiFi))、IEEE 802.16(即,全球微波接入互操作性(WiMAX))、CDMA2000、CDMA2000 1X、CDMA2000 EV-DO、暂行标准2000(IS-2000)、暂行标准95(IS-95)、暂行标准856(IS-856)、全球移动通信系统(GSM)、GSM增强数据率演进(EDGE)、GSM EDGE(GERAN)等无线电技术。
图1A中的基站114b可为例如无线路由器、家庭节点B、家庭演进节点B或接入点,并且可利用任何合适的RAT来促进诸如商业场所、家庭、车辆、校园、工业设施、空中走廊(例如,供无人机使用)、道路等局部区域中的无线连接。在一个示例中,基站114b和WTRU 102c、102d可实现诸如IEEE 802.11的无线电技术以建立无线局域网(WLAN)。在一个示例中,基站114b和WTRU 102c、102d可实现诸如IEEE 802.15的无线电技术以建立无线个域网(WPAN)。在一个示例中,基站114b和WTRU 102c、102d可利用基于蜂窝的RAT(例如,WCDMA、CDMA2000、GSM、LTE、LTE-A、LTE-A Pro、NR等)来建立微微小区或毫微微小区。如图1A所示,基站114b可具有与互联网110的直接连接。因此,基站114b可不需要经由CN 106/115访问互联网110。
RAN 104/113可与CN 106/115通信,该CN可以是被配置为向WTRU102a、102b、102c、102d中的一者或多者提供语音、数据、应用和/或互联网协议语音技术(VoIP)服务的任何类型的网络。数据可具有不同的服务质量(QoS)要求,诸如不同的吞吐量要求、延迟要求、误差容限要求、可靠性要求、数据吞吐量要求、移动性要求等。CN 106/115可提供呼叫控制、账单服务、基于移动位置的服务、预付费呼叫、互联网连接、视频分发等,和/或执行高级安全功能,诸如用户认证。尽管未在图1A中示出,但是应当理解,RAN 104/113和/或CN 106/115可与采用与RAN 104/113相同的RAT或不同RAT的其他RAN进行直接或间接通信。例如,除了连接到可利用NR无线电技术的RAN 104/113之外,CN 106/115还可与采用GSM、UMTS、CDMA2000、WiMAX、E-UTRA或WiFi无线电技术的另一RAN(未示出)通信。
CN 106/115也可充当WTRU 102a、102b、102c、102d的网关,以访问PSTN 108、互联网110和/或其他网络112。PSTN 108可包括提供普通老式电话服务(POTS)的电路交换电话网络。互联网110可包括使用常见通信协议(诸如传输控制协议(TCP)、用户数据报协议(UDP)和/或TCP/IP互联网协议组中的互联网协议(IP))的互连计算机网络和设备的全球系统。网络112可包括由其他服务提供商拥有和/或操作的有线和/或无线通信网络。例如,网络112可包括连接到一个或多个RAN的另一个CN,其可采用与RAN 104/113相同的RAT或不同的RAT。
通信系统100中的一些或所有WTRU 102a、102b、102c、102d可包括多模式能力(例如,WTRU 102a、102b、102c、102d可包括用于通过不同无线链路与不同无线网络通信的多个收发器)。例如,图1A所示的WTRU102c可被配置为与可采用基于蜂窝的无线电技术的基站114a通信,并且与可采用IEEE 802无线电技术的基站114b通信。
图1B是示出示例性WTRU 102的系统图。如图1B所示,WTRU 102可包括处理器118、收发器120、发射/接收元件122、扬声器/麦克风124、小键盘126、显示器/触摸板128、不可移动存储器130、可移动存储器132、电源134、全球定位系统(GPS)芯片组136和/或其他外围设备138等。应当理解,WTRU 102可包括前述元件的任何子组合。
处理器118可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核心相关联的一个或多个微处理器、控制器、微控制器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)电路、任何其他类型的集成电路(IC)、状态机等。处理器118可执行信号编码、数据处理、功率控制、输入/输出处理和/或任何其他功能,这些其他功能使WTRU 102能够在无线环境中工作。处理器118可耦合到收发器120,该收发器可耦合到发射/接收元件122。虽然图1B将处理器118和收发器120描绘为单独的部件,但是应当理解,处理器118和收发器120可在电子封装或芯片中集成在一起。
发射/接收元件122可被配置为通过空中接口116向基站(例如,基站114a)传输信号或从基站接收信号。例如,在一个示例中,发射/接收元件122可以是被配置为传输和/或接收RF信号的天线。在一个示例中,发射/接收元件122可以是被配置为传输和/或接收例如IR、UV或可见光信号的发射器/检测器。在一个示例中,发射/接收元件122可被配置为传输和/或接收RF信号和光信号两者。应当理解,发射/接收元件122可被配置为传输和/或接收无线信号的任何组合。
尽管发射/接收元件122在图1B中被描绘为单个元件,但是WTRU 102可包括任何数量的发射/接收元件122。更具体地讲,WTRU 102可采用MIMO技术。因此,在一个示例中,WTRU102可包括用于通过空中接口116传输和接收无线信号的两个或更多个发射/接收元件122(例如,多个天线)。
收发器120可被配置为调制将由发射/接收元件122传输的信号并且解调由发射/接收元件122接收的信号。如上所指出,WTRU 102可具有多模式能力。因此,收发器120可包括多个收发器,以便使WTRU 102能够经由多种RAT(诸如NR和IEEE 802.11)进行通信。
WTRU 102的处理器118可耦合到扬声器/麦克风124、小键盘126和/或显示器/触摸板128(例如,液晶显示器(LCD)显示单元或有机发光二极管(OLED)显示单元)并且可从其接收用户输入数据。处理器118还可将用户数据输出到扬声器/麦克风124、小键盘126和/或显示器/触摸板128。此外,处理器118可从任何类型的合适存储器(诸如不可移动存储器130和/或可移动存储器132)访问信息,并且将数据存储在任何类型的合适存储器中。不可移动存储器130可包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘或任何其他类型的存储器存储设备。可移动存储器132可包括用户身份模块(SIM)卡、记忆棒、安全数字(SD)存储卡等。在示例中,处理器118可从未物理上定位在WTRU 102上(诸如,位于服务器或家用计算机(未示出)上)的存储器访问信息,并且将数据存储在该存储器中。
处理器118可从电源134接收电力,并且可被配置为向WTRU 102中的其他部件分配和/或控制电力。电源134可以是用于为WTRU 102供电的任何合适的设备。例如,电源134可包括一个或多个干电池组(例如,镍镉(NiCd)、镍锌(NiZn)、镍金属氢化物(NiMH)、锂离子(Li-ion)等)、太阳能电池、燃料电池等。
处理器118还可耦合到GPS芯片组136,该GPS芯片组可被配置为提供关于WTRU 102的当前位置的位置信息(例如,经度和纬度)。除了来自GPS芯片组136的信息之外或代替该信息,WTRU 102可通过空中接口116从基站(例如,基站114a、114b)接收位置信息和/或基于从两个或更多个附近基站接收到信号的定时来确定其位置。应当理解,WTRU 102可通过任何合适的位置确定方法来获取位置信息。
处理器118还可耦合到其他外围设备138,该其他外围设备可包括提供附加特征、功能和/或有线或无线连接的一个或多个软件模块和/或硬件模块。例如,外围设备138可包括加速度计、电子指南针、卫星收发器、数字相机(用于照片和/或视频)、通用串行总线(USB)端口、振动设备、电视收发器、免提耳麦、
Figure BDA0003588823910000091
模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏播放器模块、互联网浏览器、虚拟现实和/或增强现实(VR/AR)设备、活动跟踪器等。外围设备138可包括一个或多个传感器,该传感器可为以下一者或多者:陀螺仪、加速度计、霍尔效应传感器、磁力计、方位传感器、接近传感器、温度传感器、时间传感器;地理位置传感器;测高计、光传感器、触摸传感器、磁力计、气压计、手势传感器、生物识别传感器和/或湿度传感器。
WTRU 102可包括全双工无线电台,对于该全双工无线电台,一些或所有信号的发射和接收(例如,与用于UL(例如,用于发射)和下行链路(例如,用于接收)的特定子帧相关联)可为并发的和/或同时的。全双工无线电台可包括干扰管理单元139,该干扰管理单元用于经由硬件(例如,扼流圈)或经由处理器(例如,单独的处理器(未示出)或经由处理器118)进行的信号处理来减少和/或基本上消除自干扰。在一个示例中,WTRU 102可包括半双工无线电台,对于该半双工无线电台,一些或所有信号的发射和接收(例如,与用于UL(例如,用于发射)或下行链路(例如,用于接收)的特定子帧相关联)可为并发的和/或同时的。
图1C是示出示例性RAN 104和CN 106的系统图。如上所述,RAN104可采用E-UTRA无线电技术通过空中接口116与WTRU 102a、102b、102c通信。RAN 104还可与CN 106通信。
RAN 104可包括演进节点B 160a、160b、160c,但应当理解,RAN 104可包括任何数量的演进节点B。演进节点B 160a、160b、160c各自可包括一个或多个收发器以便通过空中接口116与WTRU 102a、102b、102c通信。在一个示例中,演进节点B 160a、160b、160c可实现MIMO技术。因此,演进节点B 160a例如可使用多个天线来向WTRU 102a传输无线信号和/或从WTRU 102a接收无线信号。
演进节点B 160a、160b、160c中的每一者可与特定小区(未示出)相关联,并且可被配置为处理无线电资源管理决策、切换决策、UL和/或DL中的用户的调度等。如图1C所示,演进节点B 160a、160b、160c可通过X2接口彼此通信。
图1C所示的CN 106可包括移动性管理实体(MME)162、服务网关(SGW)164和分组数据网络(PDN)网关(或PGW)166。虽然前述元件中的每一者被描绘为CN 106的一部分,但应当理解,这些元件中的任一者可由除CN运营商之外的实体拥有和/或运营。
MME 162可经由S1接口连接到RAN 104中的演进节点B 162a、162b、162c中的每一者,并且可用作控制节点。例如,MME 162可负责认证WTRU 102a、102b、102c的用户、承载激活/去激活、在WTRU 102a、102b、102c的初始附加期间选择特定服务网关等。MME 162可提供用于在RAN 104和采用其他无线电技术(诸如GSM和/或WCDMA)的其他RAN(未示出)之间进行切换的控制平面功能。
SGW 164可经由S1接口连接到RAN 104中的演进节点B 160a、160b、160c中的每一者。SGW 164通常可向/从WTRU 102a、102b、102c路由和转发用户数据分组。SGW 164可执行其他功能,诸如在演进节点B间切换期间锚定用户平面、当DL数据可用于WTRU 102a、102b、102c时触发寻呼、管理和存储WTRU 102a、102b、102c的上下文等。
SGW 164可连接到PGW 166,该PGW可向WTRU 102a、102b、102c提供对分组交换网络(诸如互联网110)的访问,以促进WTRU 102a、102b、102c和启用IP的设备之间的通信。
CN 106可有利于与其他网络的通信。例如,CN 106可为WTRU 102a、102b、102c提供对电路交换网络(诸如,PSTN 108)的访问,以有利于WTRU 102a、102b、102c与传统陆线通信设备之间的通信。例如,CN 106可包括用作CN 106与PSTN 108之间的接口的IP网关(例如,IP多媒体子系统(IMS)服务器)或者可与该IP网关通信。另外,CN 106可向WTRU102a、102b、102c提供对其他网络112的访问,该其他网络可包括由其他服务提供商拥有和/或运营的其他有线和/或无线网络。
尽管WTRU在图1A至图1D中被描述为无线终端,但可以设想到在某些示例中,此类终端可(例如,临时或永久)使用与通信网络的有线通信接口。
在示例中,其他网络112可为WLAN。
处于基础结构基本服务集(BSS)模式的WLAN可具有用于BSS的接入点(AP)以及与AP相关联的一个或多个站点(STA)。AP可具有至分配系统(DS)或将流量携带至和/或携带流量离开BSS的另一种类型的有线/无线网络的接入或接口。源自BSS外部并通向STA的流量可通过AP到达并且可被传递到STA。源自STA并通向BSS外部的目的地的流量可被发送到AP以被传递到相应目的地。BSS内的STA之间的流量可通过AP发送,例如,其中源STA可向AP发送流量,并且AP可将流量传递到目的地STA。BSS内的STA之间的流量可被视为和/或称为点对点流量。可利用直接链路建立(DLS)在源和目的地STA之间(例如,直接在它们之间)发送点对点流量。在示例中,DLS可使用802.11e DLS或802.11z隧道DLS(TDLS)。使用独立BSS(IBSS)模式的WLAN可不具有AP,并且IBSS内或使用IBSS的STA(例如,所有STA)可彼此直接通信。IBSS通信模式在本文中有时可称为“ad-hoc”通信模式。
当使用802.11ac基础结构操作模式或相似操作模式时,AP可在固定信道(诸如主信道)上传输信标。主信道可为固定宽度(例如,20MHz宽带宽)或经由信令动态设置的宽度。主信道可为BSS的操作信道,并且可由STA用来建立与AP的连接。在示例中,可例如在802.11系统中实现载波侦听多路访问/冲突避免(CSMA/CA)。对于CSMA/CA,STA(例如,每个STA)(包括AP)可侦听主信道。如果主信道被特定STA侦听/检测和/或确定为繁忙,则特定STA可退避。一个STA(例如,仅一个站)可在给定BSS中在任何给定时间传输。
高吞吐量(HT)STA可使用40MHz宽的信道进行通信,例如,经由主20MHz信道与相邻或不相邻的20MHz信道的组合以形成40MHz宽的信道。
极高吞吐量(VHT)STA可支持20MHz、40MHz、80MHz和/或160MHz宽的信道。40MHz和/或80MHz信道可通过组合连续的20MHz信道来形成。可通过组合8个连续的20MHz信道,或通过组合两个非连续的80MHz信道(这可被称为80+80配置)来形成160MHz信道。对于80+80配置,在信道编码之后,数据可通过可将数据分成两个流的段解析器。可单独地对每个流进行快速傅里叶逆变换(IFFT)处理和时间域处理。可将这些流映射到两个80MHz信道,并且可通过发射STA来传输数据。在接收STA的接收器处,可颠倒上述用于80+80配置的操作,并且可将组合的数据发送到介质访问控制(MAC)。
802.11af和802.11ah支持低于1GHz的操作模式。相对于802.11n和802.11ac中使用的那些,802.11af和802.11ah中减少了信道操作带宽和载波。802.11af支持电视白空间(TVWS)频谱中的5MHz、10MHz和20MHz带宽,并且802.11ah支持使用非TVWS频谱的1MHz、2MHz、4MHz、8MHz和16MHz带宽。根据一个示例,802.11ah可支持仪表类型控制/机器类型通信,诸如宏覆盖区域中的MTC设备。MTC设备可具有某些能力,例如有限的能力,包括支持(例如,仅支持)某些带宽和/或有限的带宽。MTC设备可包括电池寿命高于阈值(例如,以保持非常长的电池寿命)的电池。
可支持多个信道的WLAN系统以及诸如802.11n、802.11ac、802.11af和802.11ah之类的信道带宽包括可被指定为主信道的信道。主信道可具有等于由BSS中的所有STA支持的最大公共操作带宽的带宽。主信道的带宽可由来自在BSS中操作的所有STA的STA(其支持最小带宽操作模式)设置和/或限制。在802.11ah的示例中,对于支持(例如,仅支持)1MHz模式的STA(例如,MTC型设备),主信道可为1MHz宽,即使AP和BSS中的其他STA支持2MHz、4MHz、8MHz、16MHz和/或其他信道带宽操作模式。载波侦听和/或网络分配向量(NAV)设置可取决于主信道的状态。如果主信道繁忙,例如,由于STA(仅支持1MHz操作模式)正在向AP传输,即使大多数频段保持空闲并且可能可用,整个可用频段也可被视为繁忙。
在美国,可供802.11ah使用的可用频段为902MHz至928MHz。在韩国,可用频段为917.5MHz至923.5MHz。在日本,可用频段为916.5MHz至927.5MHz。802.11ah可用的总带宽为6MHz至26MHz,具体取决于国家代码。
图1D是示出示例性RAN 113和CN 115的系统图。如上所指出,RAN113可采用NR无线电技术通过空中接口116与WTRU 102a、102b、102c通信。RAN 113还可与CN 115通信。
RAN 113可包括gNB 180a、180b、180c,但应当理解,RAN 113可包括任何数量的gNB。gNB 180a、180b、180c各自可包括一个或多个收发器以便通过空中接口116与WTRU102a、102b、102c通信。在一个示例中,gNB 180a、180b、180c可实现MIMO技术。例如,gNB180a、108b可利用波束成形来向gNB 180a、180b、180c传输信号和/或从gNB 180a、180b、180c接收信号。因此,gNB 180a例如可使用多个天线来向WTRU 102a传输无线信号和/或从WTRU 102a接收无线信号。在一个示例中,gNB 180a、180b、180c可实现载波聚合技术。例如,gNB 180a可向WTRU 102a(未示出)传输多个分量载波。这些分量载波的子集可在免许可频谱上,而其余分量载波可在许可频谱上。在一个示例中,gNB 180a、180b、180c可实现协作多点(CoMP)技术。例如,WTRU 102a可从gNB 180a和gNB 180b(和/或gNB 180c)接收协作传输。
WTRU 102a、102b、102c可使用与可扩展参数集相关联的传输来与gNB 180a、180b、180c通信。例如,OFDM符号间隔和/或OFDM子载波间隔可因不同传输、不同小区和/或无线传输频谱的不同部分而变化。WTRU102a、102b、102c可使用各种或可扩展长度的子帧或传输时间间隔(TTI)(例如,包含不同数量的OFDM符号和/或持续变化的绝对时间长度)来与gNB180a、180b、180c通信。
gNB 180a、180b、180c可被配置为以独立配置和/或非独立配置与WTRU 102a、102b、102c通信。在独立配置中,WTRU 102a、102b、102c可与gNB 180a、180b、180c通信,同时也不访问其他RAN(例如,诸如演进节点B 160a、160b、160c)。在独立配置中,WTRU 102a、102b、102c可将gNB180a、180b、180c中的一者或多者用作移动性锚定点。在独立配置中,WTRU 102a、102b、102c可在未许可频带中使用信号与gNB 180a、180b、180c通信。在非独立配置中,WTRU 102a、102b、102c可与gNB180a、180b、180c通信或连接,同时也与其他RAN(诸如,演进节点B160a、160b、160c)通信或连接。例如,WTRU 102a、102b、102c可实现DC原理以基本上同时与一个或多个gNB 180a、180b、180c和一个或多个演进节点B 160a、160b、160c通信。在非独立配置中,演进节点B 160a、160b、160c可用作WTRU 102a、102b、102c的移动性锚点,并且gNB180a、180b、180c可提供用于服务WTRU 102a、102b、102c的附加覆盖和/或吞吐量。
gNB 180a、180b、180c中的每一者可与特定小区(未示出)相关联,并且可被配置为处理无线电资源管理决策、切换决策、UL和/或DL中的用户的调度、网络切片的支持、双连接、NR和E-UTRA之间的互通、用户平面数据朝向用户平面功能(UPF)184a、184b的路由、控制平面信息朝向接入和移动性管理功能(AMF)182a、182b的路由等。如图1D所示,gNB180a、180b、180c可通过Xn接口彼此通信。
图1D所示的CN 115可包括至少一个AMF 182a、182b、至少一个UPF184a、184b、至少一个会话管理功能(SMF)183a、183b以及可能的数据网络(DN)185a、185b。虽然前述元件中的每一者被描绘为CN 115的一部分,但是应当理解,这些元件中的任一者可由除CN运营商之外的实体拥有和/或操作。
AMF 182a、182b可在RAN 113中经由N2接口连接到gNBs 180a、180b、180c中的一者或多者,并且可用作控制节点。例如,AMF 182a、182b可负责认证WTRU 102a、102b、102c的用户、网络切片的支持(例如,具有不同要求的不同PDU会话的处理)、选择特定SMF 183a、183b、注册区域的管理、NAS信令的终止、移动性管理等。AMF 182a、182b可使用网络切片,以便基于WTRU 102a、102b、102c所使用的服务的类型来为WTRU 102a、102b、102c定制CN支持。例如,可针对不同的用例(诸如,依赖超高可靠低延迟(URLLC)接入的服务、依赖增强型移动宽带(eMBB)接入的服务、用于机器类型通信(MTC)接入的服务等)建立不同的网络切片。AMF162可提供用于在RAN 113和采用其他无线电技术(诸如LTE、LTE-A、LTE-A Pro和/或非3GPP接入技术,诸如WiFi)的其他RAN(未示出)之间进行切换的控制平面功能。
SMF 183a、183b可经由N11接口连接到CN 115中的AMF 182a、182b。SMF 183a、183b还可经由N4接口连接到CN 115中的UPF 184a、184b。SMF 183a、183b可选择并控制UPF184a、184b,并且配置通过UPF184a、184b进行的流量路由。SMF 183a、183b可执行其他功能,诸如管理和分配UE IP地址、管理PDU会话、控制策略实施和QoS、提供下行链路数据通知等。PDU会话类型可以是基于IP的、非基于IP的、基于以太网的等。
UPF 184a、184b可经由N3接口连接到RAN 113中的gNB 180a、180b、180c中的一者或多者,这些gNB可向WTRU 102a、102b、102c提供对分组交换网络(诸如互联网110)的访问,以促进WTRU 102a、102b、102c和启用IP的设备之间的通信。UPF 184、184b可执行其他功能,诸如路由和转发分组、实施用户平面策略、支持多宿主PDU会话、处理用户平面QoS、缓冲下行链路分组、提供移动性锚定等。
CN 115可有利于与其他网络的通信。例如,CN 115可包括用作CN 115与PSTN 108之间的接口的IP网关(例如,IP多媒体子系统(IMS)服务器)或者可与该IP网关通信。另外,CN 115可向WTRU 102a、102b、102c提供对其他网络112的访问,该其他网络可包括由其他服务提供商拥有和/或运营的其他有线和/或无线网络。在一个示例中,WTRU 102a、102b、102c可通过UPF 184a、184b经由至UPF 184a、184b的N3接口以及UPF184a、184b与本地数据网络(DN)185a、185b之间的N6接口连接到DN185a、185b。
鉴于图1A至图1D以及图1A至图1D的对应描述,本文参照以下中的一者或多者描述的功能中的一个或多个功能或全部功能可由一个或多个仿真设备(未示出)执行:WTRU102a-d、基站114a-b、演进节点B 160a-c、MME 162、SGW 164、PGW 166、gNB 180a-c、AMF182a-ab、UPF 184a-b、SMF 183a-b、DN 185a-b和/或本文所述的任何其他设备。仿真设备可以是被配置为模仿本文所述的一个或多个或所有功能的一个或多个设备。例如,仿真设备可用于测试其他设备和/或模拟网络和/或WTRU功能。
仿真设备可被设计为在实验室环境和/或运营商网络环境中实现其他设备的一个或多个测试。例如,该一个或多个仿真设备可执行一个或多个或所有功能,同时被完全或部分地实现和/或部署为有线和/或无线通信网络的一部分,以便测试通信网络内的其他设备。该一个或多个仿真设备可执行一个或多个功能或所有功能,同时临时被实现/部署为有线和/或无线通信网络的一部分。仿真设备可直接耦合到另一个设备以用于测试目的和/或可使用空中无线通信来执行测试。
该一个或多个仿真设备可执行一个或多个(包括所有)功能,同时不被实现/部署为有线和/或无线通信网络的一部分。例如,仿真设备可在测试实验室和/或非部署(例如,测试)有线和/或无线通信网络中的测试场景中使用,以便实现一个或多个部件的测试。该一个或多个仿真设备可为测试设备。经由RF电路(例如,其可包括一个或多个天线)进行的直接RF耦合和/或无线通信可由仿真设备用于传输和/或接收数据。
本申请描述了多个方面,包括工具、特征、示例、模型、方法等。这些方面中的许多方面以特定的方式进行描述,并且至少为了示出个体特征,通常以听起来可能具有限制性的方式来描述。然而,这是为了描述清楚,并不限制这些方面的应用或范围。实际上,所有不同的方面可组合和互换以提供进一步的方面。此外,这些方面也可与较早提交中描述的方面组合和互换。
本申请中描述和设想的方面可以许多不同的形式实现。本文所述的图5至图12可提供一些示例,但也设想了其他示例。图5至图12的讨论并不限制具体实施的广度。这些方面中的至少一个方面通常涉及视频编码和解码,并且至少一个其他方面通常涉及发射生成或编码的比特流。这些方面和其他方面可被实现为方法、装置、其上存储有用于根据所述方法中的任一方法对视频数据进行编码或解码的指令的计算机可读存储介质,和/或其上存储有根据所述方法中的任一方法生成的比特流的计算机可读存储介质。
在本申请中,术语“重建”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。通常,但不一定,术语“重构”在编码端使用,而“解码”在解码端使用。
本文描述了各种方法,并且每种方法包括用于实现所述方法的一个或多个步骤或动作。除非正确操作方法需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或用途。另外,在各种示例中,诸如“第一”、“第二”等术语可用于修饰元素、部件、步骤、操作等,诸如“第一解码”和“第二解码”。除非特定需要,否则使用此类术语并不暗示对修改操作的排序。因此,在这个示例中,第一解码不需要在第二解码之前执行,并且可例如在第二解码之前、期间或重叠的时间段发生。
本申请中所述的各种方法和其他方面可用于修改如图2和图3所示的视频编码器200和解码器300的模块,例如解码模块。此外,本文所公开的主题可应用于例如任何类型、格式或版本的视频编码(无论是在标准中描述的还是在建议中描述的),无论是预先存在的还是未来开发的,以及任何此类标准和建议的扩展。除非另有指示或技术上排除,否则本申请中所述的方面可单独使用或组合使用。
在描述本申请的示例中使用了各种数值,诸如角度、索引等。这些和其他特定值用于描述示例的目的,并且所描述的方面不限于这些特定值。
图2是示出示例性视频编码器的示意图。设想了示例性编码器200的变型,但下文为了清楚起见描述了编码器200,而不描述所有预期的变型。
在被编码之前,视频序列可经历预编码处理(201),例如,将颜色变换应用于输入彩色图片(例如,从RGB 4:4:4到YCbCr 4:2:0的变换),或执行输入图片分量的重新映射以便获得对压缩更具弹性的信号分布(例如,使用颜色分量中的一个颜色分量的直方图均衡化)。元数据可与预处理相关联,并且附加到比特流。
在编码器200中,图片由编码器元件进行编码,如下所述。以例如编码单元(CU)为单位对待编码图片进行分区(202)和处理。例如,使用帧内模式或帧间模式对每个单元进行编码。当单元以帧内模式进行编码时,其执行帧内预测(260)。在帧间模式中,执行运动估计(275)和补偿(270)。编码器决定(205)帧内模式或帧间模式中的哪一者用于对单元进行编码,并且通过例如预测模式标志来指示帧内/帧间决策。例如通过从原始图像块减去(210)预测块来计算预测残差。
然后对预测残差进行变换(225)和量化(230)。对经量化的变换系数以及运动向量和其他语法元素进行熵编码(245),以输出比特流。编码器可跳过变换,并对未变换的残余信号直接应用量化。编码器可绕过变换和量化两者,即,在不应用变换或量化过程的情况下直接对残差进行编码。
编码器对编码块进行解码以提供用于进一步预测的参考。对经量化的变换系数进行去量化(240)和逆变换(250)以解码预测残差。组合(255)经解码的预测残差和预测块,重建图像块。向重建图片应用环路滤波器(265)以执行例如解块/SAO(样本自适应偏移)滤波,以减少编码伪影。经滤波的图像存储在参考图片缓冲器(280)中。
图3是示出视频解码器的示例的示意图。在示例性解码器300中,比特流由解码器元件解码,如下所述。视频解码器300一般执行与如图2所述的编码过程相反的解码过程。编码器200通常还可执行视频解码作为对视频数据编码的一部分。例如,编码器200可执行本文呈现的视频解码步骤中的一个或多个视频解码步骤。编码器例如重建所解码的图像,以相对于以下项中的一者或多者维持与解码器的同步:参考图片、熵编码上下文和其他解码器相关状态变量。
具体地,解码器的输入包括视频比特流,该视频比特流可由视频编码器200生成。首先对比特流进行熵解码(330)以获得变换系数、运动向量和其他经编码的信息。图片分区信息指示如何对图片进行分区。因此,解码器可根据经解码的图片分区信息划分(335)图片。对变换系数进行去量化(340)和逆变换(350)以解码预测残差。组合(355)经解码的预测残差和预测块,重建图像块。可从帧内预测(360)或运动补偿预测(即帧间预测)(375)获得(370)预测块。向重建图像应用环路滤波器(365)。经滤波的图像存储在参考图片缓冲器(380)中。
经解码的图片还可经历解码后处理(385),例如,逆颜色变换(例如,从YCbCr 4:2:0到RGB 4:4:4的变换)或执行在预编码处理(201)中执行的重新映射过程的逆重新映射。解码后处理可使用在预编码处理中导出并且在比特流中发信号通知的元数据。在一个示例中,可将经解码的图像(例如,在应用环路滤波器(365)之后和/或在解码后处理(385)之后,如果使用后解码处理的话)发送到显示装置以呈现给用户。
图4是示出可在其中实现本文所述的各个方面和示例的系统的示例的示意图。系统400可体现为一种设备,该设备包括下文所述的各种部件并且被配置为执行本文档中所述方面中的一个或多个方面。此类设备的示例包括但不限于各种电子设备,诸如个人计算机、膝上型计算机、智能电话、平板电脑、数字多媒体机顶盒、数字电视机接收器、个人视频录制系统、连接的家用电器和服务器。系统400的元件可单独地或组合地体现在单个集成电路(IC)、多个IC和/或分立部件中。例如,在至少一个示例中,系统400的处理和编码器/解码器元件分布在多个IC和/或分立部件上。在各种示例中,系统400经由例如通信总线或通过专用输入端口和/或输出端口通信地耦接到一个或多个其他系统或其他电子设备。在各种示例中,系统400被配置为实现本文档中所述的方面中的一个或多个方面。
系统400包括至少一个处理器410,该处理器被配置为执行加载到其中的指令,以用于实现例如本文档中所述的各个方面。处理器410可包括嵌入式存储器、输入输出接口和本领域已知的各种其他电路。系统400包括至少一个存储器420(例如,易失性存储器设备和/或非易失性存储器设备)。系统400包括存储设备440,该存储设备可包括非易失性存储器和/或易失性存储器,包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备440可包括内部存储设备、附接存储设备(包括可拆和不可拆的存储设备)和/或网络可访问的存储设备。
系统400包括编码器/解码器模块430,该编码器/解码器模块被配置为例如处理数据以提供编码视频或解码视频,并且编码器/解码器模块430可包括其自身的处理器和存储器。编码器/解码器模块430表示可被包括在设备中以执行编码功能和/或解码功能的模块。众所周知,设备可包括编码模块和解码模块中的一者或两者。另外,编码器/解码器模块430可被实现为系统400的独立元件,或可被结合在处理器410内作为本领域技术人员已知的硬件和软件的组合。
要加载到处理器410或编码器/解码器430上以执行本文档中所述的各个方面的程序代码可存储在存储设备440中,并且随后加载到存储器420上以供处理器410执行。根据各种示例,处理器410、存储器420、存储设备440和编码器/解码器模块430中的一者或多者可在本文档中所述的过程的执行期间存储各种项目中的一个或多个项目。此类存储项目可包括但不限于输入视频、解码的视频或部分解码的视频、比特流、矩阵、变量以及处理等式、公式、运算和运算逻辑的中间或最终结果。
在一些示例中,处理器410和/或编码器/解码器模块430内部的存储器用于存储指令并提供用于在编码或解码期间需要的处理的工作存储器。然而,在其他示例中,处理设备外部的存储器(例如,处理设备可为处理器410或编码器/解码器模块430)用于这些功能中的一个或多个功能。外部存储器可为存储器420和/或存储设备440,例如动态易失性存储器和/或非易失性闪存存储器。在若干示例中,外部非易失性闪存存储器用于存储例如电视机的操作系统。在至少一个示例中,快速外部动态易失性存储器(诸如RAM)用作用于视频编码和解码操作的工作存储器。编码和解码操作的示例包括MPEG-2(MPEG是指运动图片专家组,MPEG-2也称为ISO/IEC13818,并且13818-1也称为H.222,并且13818-2也称为H.262)、HEVC(HEVC是指高效视频编码,也称为H.265和MPEG-H部分2)或VVC(通用视频编码,由联合视频专家小组JVET开发的新标准)。
如块445所示,可通过各种输入设备提供对系统400的元件的输入。此类输入设备包括但不限于:(i)射频(RF)部分,其接收例如由广播器通过空中传输的RF信号;(ii)分量(COMP)输入端子(或一组COMP输入端子);(iii)通用串行总线(USB)输入端子;和/或(iv)高清晰度多媒体接口(HDMI)输入端子。图4中未示出的其他示例包括复合视频。
在各种示例中,块445的输入设备具有如本领域中已知的相关联的相应的输入处理元件。例如,RF部分可与适用于以下各项的元件相关联:(i)选择所需频率(也称为选择信号,或将信号频带限制为频带);(ii)下变频所选择的信号;(iii)再次频带限制为较窄频带以选择(例如)在某些示例中可称为信道的信号频带;(iv)解调经下变频的和经频带限制的信号;(v)执行纠错;以及(vi)解复用以选择所需的数据分组流。各种示例的RF部分包括用于执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可包括执行这些功能中的各种功能的调谐器,这些功能包括例如下变频接收信号至更低频率(例如,中频或近基带频率)或至基带。在一个机顶盒示例中,RF部分及其相关联的输入处理元件接收通过有线(例如,电缆)介质传输的RF信号,并且通过滤波、下变频和再次滤波到期望频带来执行频率选择。各种示例重新布置上述(和其他)元素的顺序,移除这些元素中的一些元素,和/或添加执行类似或不同功能的其他元素。添加元件可包括在现有元件之间插入元件,例如,插入放大器和模数变换器。在各种示例中,RF部分包括天线。
此外,USB和/或HDMI端子可包括用于跨USB和/或HDMI连接将系统400连接到其他电子设备的相应接口处理器。应当理解,输入处理(例如,Reed-Solomon纠错)的各个方面可根据需要在例如单独的输入处理IC内或在处理器410内实现。类似地,USB或HDMI接口处理的各方面可根据需要在单独的接口IC内或在处理器410内实现。将解调流、纠错流和解复用流提供给各种处理元件,包括例如处理器410以及编码器/解码器430,该处理元件与存储器和存储元件结合操作以根据需要处理数据流以呈现在输出设备上。
系统400的各种元件可设置在集成壳体内。在集成壳体内,各种元件可使用合适的连接布置425(例如,本领域已知的内部总线,包括芯片间(I2C)总线、布线和印刷电路板)互连并在这些元件之间传输数据。
系统400包括能够经由通信信道460与其他设备通信的通信接口450。通信接口450可包括但不限于被配置为通过通信信道460发射和接收数据的收发器。通信接口450可包括但不限于调制解调器或网卡,并且通信信道460可例如在有线和/或无线介质内实现。
在各种示例中,使用无线网络诸如Wi-Fi网络例如IEEE 802.11(IEEE是指电气和电子工程师协会)将数据流式传输或以其他方式提供给系统400。这些示例的Wi-Fi信号通过适于Wi-Fi通信的通信信道460和通信接口450来接收。这些示例的通信信道460通常连接到接入点或路由器,该接入点或路由器提供对包括互联网的外部网络的接入,以允许流式应用和其他跨顶通信。其他示例使用机顶盒向系统400提供流式数据,该机顶盒通过输入块445的HDMI连接来递送数据。再一些示例使用输入块445的RF连接来向系统400提供流式数据。如上所述,各种示例以非流式方式提供数据。另外,各种示例使用Wi-Fi之外的无线网络,例如蜂窝网络或
Figure BDA0003588823910000211
网络。
系统400可将输出信号提供到各种输出设备,包括显示器475、扬声器485和其他外围设备495。各种示例的显示器475包括例如触摸屏显示器、有机发光二极管(OLED)显示器、曲面显示器和/或可折叠显示器中的一者或多者。显示器475可用于电视机、平板电脑、膝上型电脑、移动电话(移动电话)或其他设备。显示器475还可与其他部件集成在一起(例如,如在智能电话中),或者是单独的(例如,笔记本电脑的外部监视器)。在各种示例中,其他外围设备495包括独立数字视频光盘(或数字通用光盘)(对于这两个术语都是DVD)、盘播放器、立体声系统和/或照明系统中的一者或多者。各种示例使用一个或多个外围设备495,该一个或多个外围设备提供基于系统400的输出的功能。例如,盘播放器执行播放系统400的输出的功能。
在各种示例中,使用诸如AV.Link、消费电子控制(CEC)或其他能够在有或无用户干预的情况下进行设备到设备控制的通信协议的信令在系统400与显示器475、扬声器485或其他外围设备495之间传送控制信号。输出设备可通过相应的接口470、480和490经由专用连接通信地耦接到系统400。另选地,输出设备可使用通信信道460经由通信接口450连接到系统400。显示器475和扬声器485可与电子设备(例如电视)中的系统400的其他部件集成在单个单元中。在各种示例中,显示接口470包括显示驱动器,诸如例如时序控制器(T Con)芯片。
另选地,如果输入445的RF部分是单独的机顶盒的一部分,则显示器475和扬声器485可与其他部件中的一个或多个部件分开。在显示器475和扬声器485为外部部件的各种示例中,输出信号可经由专用输出连接(包括例如HDMI端口、USB端口或COMP输出)来提供。
这些示例可通过由处理器410实现的计算机软件或通过硬件或通过硬件和软件的组合来执行。作为非限制性示例,这些示例可由一个或多个集成电路来实现。存储器420可为适合技术环境的任何类型,并且作为非限制性示例,可使用任何适当的数据存储技术来实现,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。处理器410可为适合技术环境的任何类型,并且作为非限制性示例,可涵盖微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一者或多者。
各种具体实施参与解码。如本申请中所用,“解码”可涵盖例如对所接收的编码序列执行的过程的全部或部分,以便产生适于显示的最终输出。在各种示例中,此类过程包括通常由解码器执行的过程中的一个或多个过程,例如熵解码、逆量化、逆变换和差分解码。在各种示例中,此类过程还或可另选地包括由本申请中所述的各种具体实施的解码器执行的过程,例如,基于帧内预测模式来确定分割模式以在CU中生成多个子分区,例如基于CU中的多个子分区中的第二子分区中的参考样本来预测CU中的多个子分区中的第一子分区等。
作为另外的示例,在一个示例中,“解码”仅指熵解码,在另一示例中,“解码”仅指差分解码,并且在另一示例中,“解码”指熵解码和差分解码的组合。短语“解码过程”是具体地指代操作的子集还是广义地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
各种具体实施参与编码。以与上面关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可涵盖例如对输入视频序列执行以便产生编码比特流的全部或部分过程。在各种示例中,此类过程包括通常由编码器执行的过程中的一个或多个过程,例如分区、差分编码、变换、量化和熵编码。在各种示例中,此类过程还或可另选地包括由本申请中所述的各种具体实施的编码器执行的过程,例如,基于帧内预测模式来确定分割模式以在CU中生成多个子分区,例如基于CU中的多个子分区中的第二子分区中的参考样本来预测CU中的多个子分区中的第一子分区等。
作为另外的示例,在一个示例中,“解码”仅指熵解码,在另一示例中,“解码”仅指差分解码,并且在另一示例中,“解码”指差分解码和熵解码的组合。短语“编码过程”是具体地指代操作的子集还是广义地指代更广泛的编码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
需注意,如本文所用的语法元素,例如在亮度帧内预测模式上的编码单元语法intra_subpartitions_split_flag[x0][y0]、predIntraMode、IntraSubPartitionsSplitType、intra_subpartitions_mode_flag[x0][y0]等为描述性术语。因此,它们不排除使用其他语法元素名称。
当附图呈现为流程图时,应当理解,其还提供了对应装置的框图。类似地,当附图呈现为框图时,应当理解,其还提供了对应的方法/过程的流程图。
各种示例参考解码。可应用内容自适应变换。具体地,设备可接收表示内容的视频比特流。视频比特流可包括一个或多个块的经量化的变换系数。可获得(例如,确定或发信号通知)精度因子(例如,偏移)。精度因子可具有要在编码器或解码器操作使用的一个或多个精度值,或者要在量化或去量化过程中使用的一个或多个偏移值。精度因子可与块相关联以用于对该块执行至少一个解码功能。在一个示例中,精度因子可基于块的变换系数的量值。精度因子可将最大量值变换系数减小为适应16位。
本文所述的具体实施和方面可在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单个形式的具体实施的上下文中讨论(例如,仅作为方法讨论),讨论的特征的具体实施也可以其他形式(例如,装置或程序)实现。装置可在例如适当的硬件、软件和固件中实现。这些方法可在例如处理器中实现,该处理器通常指处理设备,包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,诸如例如计算机、手机、便携式/个人数字助理(“PDA”)以及便于最终用户之间信息通信的其他设备。
对“一个示例”或“示例”或“一个具体实施”或“具体实施”以及它们的其他变型的引用意指结合该示例描述的特定特征、结构、特性等包括在至少一个示例中。因此,在整个本申请的各个地方出现的短语“在一个示例中”或“在示例中”或“在一个具体实施中”或“在具体实施中”以及任何其他变型不一定都指同一示例。
另外,本申请可涉及“确定”各种信息。确定信息可包括例如估计信息、计算信息、预测信息或从存储器检索信息中的一者或多者。获得可包括接收、检索、构造、生成和/或确定。
此外,本申请可涉及“访问”各种信息。访问信息可包括例如接收信息、检索信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一者或多者。
另外,本申请可涉及“接收”各种信息。与“访问”一样,接收旨在为广义的术语。接收信息可包括例如访问信息或检索信息(例如,从存储器)中的一者或多者。此外,在诸如例如存储信息、处理信息、发射信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,“接收”通常以一种方式或另一种方式参与。
应当理解,例如,在“A/B”、“A和/或B”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”和“至少一种”中的任一种旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”的情况下,此类短语旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一列出的选项和第二列出的选项(A和B),或仅选择第一列出的选项和第三列出的选项(A和C),或仅选择第二列出的选项和第三列出的选项(B和C),或选择所有三个选项(A和B和C)。如对于本领域和相关领域的普通技术人员显而易见的是,这可扩展到所列出的尽可能多的项目。
而且,如本文所用,词语“发信号通知”是指(除了别的以外)向对应解码器指示某物。编码器信号可包括例如帧内预测模式的指示、启用的ISP的指示等。这样,在一个示例中,在编码端和解码端均使用相同的参数。因此,例如,编码器可将特定参数发射(显式信令)到解码器,使得解码器可使用相同的特定参数。相反,如果解码器已具有特定参数以及其他参数,则可在不传输(隐式信令)的情况下使用信令,以简单地允许解码器知道和选择特定参数。通过避免传输任何实际函数,在各种示例中实现了比特节省。应当理解,信令可以多种方式实现。例如,在各种示例中,使用一个或多个语法元素、标志等向对应的解码器发信号通知信息。虽然前面涉及词语“signal(发信号通知)”的动词形式,但是词语“signal(信号)”在本文也可用作名词。
对于本领域的普通技术人员将显而易见的是,具体实施可产生格式化为携带例如可存储或可传输的信息的各种信号。信息可包括例如用于执行方法的指令或由所述具体实施中的一个具体实施产生的数据。例如,信号可格式化为携带所述示例的比特流。此类信号可格式化为例如电磁波(例如,使用频谱的射频部分)或基带信号。格式化可包括例如对数据流进行编码并且使用经编码的数据流调制载体。信号携带的信息可为例如模拟或数字信息。如已知的,信号可通过多种不同的有线或无线链路传输。信号可存储在处理器可读介质上。
本文描述了许多示例。示例的特征可跨各种权利要求类别和类型单独或以任何组合提供。此外,示例可包括在本文跨各种权利要求类别和类型单独或以任何组合描述的特征、设备或方面中的一者或多者。例如,本文所述的特征可在包括如本文所述生成的信息的比特流或信号中实现。信息可允许解码器对比特流进行解码,该编码器、比特流和/或解码器均根据所述实施方案中的任何实施方案。例如,本文所述的特征可通过创建和/或发射和/或接收和/或解码比特流或信号来实现。例如,本文所述的特征可实现方法、过程、装置、存储指令的介质、存储数据的介质或信号。例如,本文所述的特征可通过TV、机顶盒、移动电话、平板电脑或执行解码的其他电子设备来实现。TV、机顶盒、移动电话、平板电脑或其他电子设备可显示(例如,使用监视器、屏幕或其他类型的显示器)所得图像(例如,由视频比特流的残差重建所得的图像)。TV、机顶盒、移动电话、平板电脑或其他电子设备可接收包括编码图像的信号并执行解码。
可使用各种编码结构。可执行灵活的多类型树块划分(例如,四叉树、二叉树和/或三叉树划分)。可执行帧内预测。例如,可使用一个或多个(例如,65个)角度帧内预测方向,包括广角预测、色度分量线性模型(CCLM)和/或基于矩阵的帧内预测(MP)。可执行帧间预测。预测方向中的一个或多个预测方向可以是预定的。例如,可使用仿射运动模型、子块时间运动向量预测(SbTMVP)、自适应运动向量精度、解码端运动向量修正(DMVR)、三角形分区、组合帧内和帧间预测(CIIP)、具有运动向量差的合并模式(MMVD)、双向光流(BDOF)、像素细化光流(PROF)和/或双预测加权平均(BPWA)。可执行变换、量化和系数编码。例如,可使用多重主变换选区(使用DCT2、DST7和DCT8)、低频不可分割变换(LFNST)的二次变换编码、依赖性量化(使用从51增大到63的最大QP)和/或经修改的变换系数编码。可使用环路滤波器(例如,广义自适应环路滤波器(GALF))。可执行屏幕内容编码(例如,帧内块复制(IBC)和/或针对4:4:4内容的调色板模式(PLT))。可执行360度视频编码(例如,水平环绕式运动补偿)。
可使用帧内子分区(ISP)模式将CU编码(例如,分割)到多个子分区中。
ISP可以是将CU(例如,帧内模式CU)依次编码到多个子分区中的方式。可例如基于分割模式将CU划分为多个子分区。子分区可以是CU的一部分。子分区中的一些或全部子分区可共享CU的相同帧内模式(例如,整个CU)。可保存来自用于子分区的信令帧内模式变量的编码开销。
ISP可应用于亮度分量。在一个示例中,ISP不能应用于色度分量。在一个示例中,ISP可将帧内模式CU划分为多个(例如,两个或四个)子分区。(例如,每个)分区可包括多个(例如,至少16个)样本。划分或CU分割可在某些(例如,水平或垂直)方向上执行。在一个或多个示例中,分区、划分或分割可互换使用。图5示出了允许4×8和8×4的CU的示例性划分。对于相对较小的CU(例如,大小为4×8和8×4),ISP可将CU分割成两个子分区,例如如图5所示。图6示出了允许大于4×8或8×4的CU的示例性划分。相对较大的CU可被分割成四个子分区,例如如图6所示。帧内预测模式可用于一些(例如,全部)子分区。可将MPM(最可能模式)标记设置为一。例如,用于ISP的帧内模式可以是MPM列表的成员。可对ISP禁用帧内参考样本平滑滤波器。可对ISP使用参考线零。可禁用多参考线帧内预测的使用。
对于水平分割(模式),可从上到下处理子分区。对于垂直分割(模式),可从左向右处理子分区。可预测(例如,每个)子分区。可将残差添加到子分区以产生重建的子分区。来自重建的子分区的样本可用于预测下一个子分区。
图7示出了ISP中的预测过程的示例:(a)CU可包括四个子分区A、B、C和D;(b)可预测并重建子分区A(例如,第二子分区),并且子分区A的底部重建行可用于预测子分区B(例如,第一子分区);以及(c)子分区B的重建样本的底部行可用于预测子分区C(例如,第三子分区)。如图7所示,在(b)处,最顶部子分区A可首先使用上参考线和左参考线(例如,参考CU中的参考样本)进行预测,并且通过添加在熵解码、逆量化和逆变换之后获得的残差来重建。重建子分区A的底部行可用于预测子分区B,并且可随后重建子分区B。可对后续子分区重复此过程。
在一个示例中,对于预测单元(PU),不允许1×N、2×N的子分区。对于ISP的PU,可允许最小4×N的子分区,例如以增强硬件吞吐量性能。对于变换单元(TU),可允许1×N、2×N的子分区,例如以维持所得编码效率有益效果。
对帧内预测模式的扩展可包括更多角度帧内预测模式、33至65个角度的增加、广角预测模式(例如,对于非正方形块),例如如图8所示。图8示出了帧内预测模式的示例(例如,包括定向模式)。索引为0的帧内模式可为平面模式,并且索引为1的帧内模式可为DC模式。索引为2至66的帧内模式可用于正方形块的角度帧内预测模式。-1至-14和67至80的帧内模式索引可用于非正方形块的广角帧内预测模式。
例如,帧内广角模式可用于非正方形编码块。
某些角度帧内预测方向可定义为顺时针方向上从45度至-135度。对于具有相等宽度和高度的正方形编码块,可对帧内预测使用常规帧内角度模式(例如,索引为2至66,如图8所示)。广角帧内预测模式(例如,索引为-1至-14和67至80)可用于例如具有不相等宽度和高度的非正方形编码块。在一个示例中,可使用原始模式索引发信号通知被替换的模式,原始模式索引在解析后重新映射到广角模式的索引。帧内预测模式的总数可以不变(例如,67个),并且帧内模式编码可以不变。
广角模式可示于图9中,该图示出了用于广角帧内预测的示例性参考样本,其具有(a)相对较大的宽度(相比于高度)或(b)相对较大的高度(相比于宽度)。表1示出了示例性广角帧内预测模式映射过程。如表1所示,原始帧内模式索引可映射到广角模式的模式索引值。如表1所示,nW、nH可分别表示编码块的宽度和高度。表1提供了示例性广角帧内预测模式映射过程。
表1
Figure BDA0003588823910000281
Figure BDA0003588823910000291
可执行多参考线(MRL)帧内预测。
MRL帧内预测可使用更多参考线进行帧内预测。图10示出了用于帧内预测的多条参考线(MRL)的示例。图10描绘了四条参考线的示例。如图10所示,可以不从重建的相邻样本中提取片段A和F的样本。片段A和F的样本可分别用来自片段B和E的最接近样本填充。某些帧内图片预测可使用最近的参考线(例如,参考线0)。在MRL中,可使用多条附加线(例如,两条附加线,包括参考线1和参考线3)。
可发信号通知和/或使用所选参考线的索引(mrl_idx)来生成帧内预测因子。在示例中,对于大于0的参考线索引,附加参考线模式(例如,仅)可包括在MPM列表中,以及/或者mpm索引(例如,仅)可在没有剩余模式的情况下发信号通知。参考线索引可在帧内预测模式之前发信号通知,并且在发信号通知非零参考线索引的情况下,可从帧内预测模式中排除平面模式和DC模式。可对CTU内部的块的第一条线禁用MRL,例如以防止在当前CTU线之外使用扩展的参考样本。
可应用帧内参考样本平滑滤波。
平滑滤波可应用于帧内模式的参考样本,例如以改善预测性能。在某些示例中,不同的参考样本平滑滤波可应用于整数斜角(例如,参考全像素参考样本)和分数斜角(例如,参考分数像素参考样本)。在一个示例中,[1 2 1]/4 3抽头平滑滤波器可应用于索引为0(即平面模式)、-14、-12、-10、-6、2、34、66、72、76、78、80的帧内模式,编码块大小大于32。在一些示例中,如果使用MRL或ISP,则不应用其。
对于分数斜角,可使用4抽头高斯滤波器。并非所有分数斜角都可应用参考样本平滑滤波。在示例中,对于接近纯水平方向或纯竖直方向的角度,可使用4抽头插值滤波器(例如,如本文所述)。4抽头插值滤波器可能无法用于产生非常大的平滑效果。
可执行帧内角度模式插值滤波。
对于如图8所示的一个或多个角度帧内模式(例如,来自模式索引为-14至80的帧内模式),可使用参考样本的滤波来生成预测样本。对于亮度分量,可利用4抽头部件(例如,使用如表3中指定的4抽头滤波器)来执行滤波。2抽头线性插值可用于色度分量。可存在一个或多个(例如,两个)类型的4抽头滤波。例如,可使用第一(例如,三次)滤波器(例如,对于插值滤波)和/或第二(例如,高斯)滤波器(例如,对于平滑滤波)。例如,如果偏离水平方向或垂直方向的最小角度模式距离大于某个值(例如预定值,诸如阈值),则可应用4抽头高斯平滑滤波。例如,如果偏离水平方向或垂直方向的最小角度模式距离不高于阈值,则可应用4抽头三次插值滤波。
选择决策可提供变量“filterFlag”表示。可例如如表2所示导出变量“filterFlag”。
表2
Figure BDA0003588823910000301
表3提供了插值滤波器系数fC和fG的示例。
表3
Figure BDA0003588823910000302
Figure BDA0003588823910000311
表4提供了用于各种变换块大小nTbS的intraHorVerDistThres[nTbS]的示例。
表4
nTbS=2 nTbS=3 nTbS=4 nTbS=5 nTbS=6 nTbS=7
intraHorVerDistThres[nTbS] 24 14 2 0 0 0
参数refFilterFlag可指示是否已经较早地执行了帧内参考样本平滑滤波。参数refIdx可表示参考线的索引,如果不等于0,则可指示帧内模式编码的多条参考线(MRL)。参数IntraSubPartitionSplitType可指示是否使用ISP和/或如果使用ISP,则指示是使用水平分割还是垂直分割。变量minDistVerHor可表示相对于水平方向或垂直方向的最小模式角度距离,将其与块大小相关值(例如阈值)进行比较,例如以在用于插值的三次(如果filterFlag=0)和高斯(如果filterFlag=1)4抽头滤波器之间进行选择。此决策条件可被称为“MDIS”条件。
在一个示例中,对于亮度分量,所涉及的4抽头滤波器可在表3中定义。对于亮度分量,所涉及的4抽头滤波器可如表3中所示定义。在表3中,fC和fG可分别表示三次插值滤波器和高斯平滑滤波器。
对于亮度分量,可如本文所述获得(例如,导出)一个或多个角度帧内预测样本。在不丧失一般性的情况下,可假设可省略使用多条参考线,并且可使用帧内预测参考样本的单条线(例如,来自相邻编码CU或块的参考样本的顶部边界和左侧边界)。
对于大于或等于阈值(例如,34)的帧内模式索引,例如使用高于当前编码块的顶部边界参考样本,对于当前编码块内部的位置(x,y)处的预测样本,可计算x偏移(例如,水平方向偏移)。可基于帧内预测角度和/或到参考样本的顶部边界的行(例如,垂直)距离来计算x偏移。参数iIdx和iFact可如下定义:
iIdx=(((y+1)*intraPredAngle)>>5) (1)
iFact=((y+1)*intraPredAngle)&31 (2)
其中iIdx可表示x偏移的全像素部分,并且iFact可以表示x偏移的分数像素部分。
变量intraPredAngle可捕获来自对应帧内预测方向的效应。可将分数位置计算至特定精度(例如,1/32像素)。
取决于角度帧内模式方向,如果方向被认为是接近水平方向或垂直方向,可将变量/参数(例如,filterFlag)设置为一个值(例如,0),否则设置为另一个值(例如,1)。在一个示例中,变量/参数可指示是否使用滤波器。
可按如下方式确定(例如,导出)一个或多个插值滤波器系数fT[j](例如,其中j=0…3):
fT[j]=filterFlag?fG[iFact][j]:fC[iFact][j] (3)
可按如下方式确定(例如,导出)预测样本predSamples[x][y]的值:
Figure BDA0003588823910000331
其中变量ref[x]可表示位置(x,-1)处的顶部边界参考样本(例如,其中y=-1指示顶部边界)。Clip(·)可以是将某个值夹到一系列像素值(例如,有效像素值)中的函数。
对于一个或多个(例如,全部)其他帧内模式索引(例如,小于34),可例如使用当前编码块的左侧上的左边界参考样本基于帧内预测角度和到参考样本的左侧边界的列(例如,水平)距离来导出y偏移(例如,竖直方向偏移)。对应的公式可如下所示:
iIdx=(((x+1)*intraPredAngle)>>5) (5)
iFact=((x+1)*intraPredAngle)&31 (6)
可按如下方式导出一个或多个插值滤波器系数fT[j](例如,其中j=0…3):
fT[j]=filterFlag?fG[iFact][j]:fC[iFact][j] (7)
可按如下方式导出预测样本predSamples[x][y]的值:
Figure BDA0003588823910000332
对于一个或多个色度分量,可将2抽头线性滤波用于分数参考样本位置,例如按照如下方式。如果参数iFact不等于0,则可按如下方式获得(例如,导出)预测样本predSamples[x][y]的值:
predSamples[x][y]=((32–iFact)*ref[x+iIdx+1]+iFact*ref[x+iIdx+2]+16)>>5 (9)
如果参数iFact等于0,则可按如下方式获得(例如,导出)预测样本predSamples[x][y]的值:
predSamples[x][y]=ref[x+iIdx+1] (10)
在示例中,三次滤波器可以(例如,始终)用于MRL和/或ISP的插值。对于常规帧内模式,可使用MDIS条件检查在三次滤波器和高斯滤波器之间进行选择。
编码单元语法可与亮度帧内预测模式结合使用。表5提供了亮度帧内预测模式上的示例性编码单元语法。
表5
Figure BDA0003588823910000341
索引intra_luma_ref_idx可发信号通知MRL的多条参考线(例如,其中一条参考线)的索引。指示tra_subpartitions_mode_flag和intra_subpartitions_split_flag可分别发信号通知ISP模式和分割模式。标记变量的其余部分可用于MPM和帧内预测模式导出。
对于指示intra_luma_not_planar_flag的熵编码,可使用多个(例如,两个)上下文编码bin。使用哪一个可取决于指示intra_subpartitions_mode_flag(例如,指示是否使用ISP)。如果intra_subpartitions_mode_flag等于0(指示ISP未使用),则可使用索引为1的上下文编码bin(例如,第2个bin)。否则,可使用第1个上下文编码bin(例如,索引为0的那一个)。
对于某个CU,ISP分割模式可以或可以不取决于帧内预测模式。在示例中,ISP分割模式可取决于CU帧内预测模式,使得在得自ISP分割模式的子分区中,稍后编码的(例如,第一)子分区的帧内预测可参考前一个编码的(例如,第二)ISP子分区的重建样本。取决于帧内预测模式的ISP分割模式可具有优于不取决于帧内预测模式的ISP分割模式的编码有益效果或优势。
在某些示例中,如果CU在ISP模式中编码,例如由于利用了1×N、2×N、N×2TU和具有很大宽度与高度差的其他CU大小(例如,4×32、4×64等),则可禁用帧内预测参考样本滤波,并且在此示例中可能不使用基于帧内预测模式的ISP分割模式限制。
例如,对于1×N、2×N、N×2TU,如果CU帧内预测模式参考1×N、2×N TU情况下顶部边界参考样本,或其参考N×2TU情况下的左边界参考样本,则更多参考样本滤波可导致较大的预测性能波动或沿TU的较长维度劣化。
可基于帧内预测模式来确定ISP分割模式(例如,受到限制)。可基于所确定的分割模式来处理CU(例如如图12的1230所示)。在ISP分割模式中,子分区(例如,第一子分区)可参考用于帧内预测的先前重建的子分区(例如,第二)样本。在一个示例中,对于1×N、2×N、N×2TU情况,帧内预测可参考其较长维度的一侧(例如,N个样本的那侧,但不是1个或2个样本的较短侧)上的参考样本。在1×N、2×N、N×2TU内部具有太大波动或劣化的预测性能的风险可显著减小。可不使用对帧内参考滤波的限制。可执行帧内参考滤波。类似于针对非ISP模式的更多滤波可针对ISP模式产生更好的编码效率。
表6提供了某些情况下的帧内参考样本滤波的示例。
表6
Figure BDA0003588823910000361
在某些示例中,可不将参考样本平滑滤波应用于ISP或MRL。表6中可示出在ISP、MRL和常规帧内模式上的帧内参考样本滤波应用的差异。可使用适用于ISP、MRL和常规帧内模式的统一方法。该统一方法可支持ISP、MRL和常规帧内模式之间的一致性。
可使用一种或多种ISP相关的方法,包括:基于帧内预测模式和用于MRL、ISP和常规帧内模式的统一帧内参考样本滤波的ISP分割模式限制。
可基于帧内预测模式来选择ISP分割模式。可在指示分割模式具有分割方向(例如,水平或垂直)的ISP分割模式之前对帧内预测模式进行编码。
在某个示例中,给定CU的角度帧内预测模式,如果CU被编码到ISP中,则CU可被划分为可逐个被编码的多个(例如,2个或4个)子分区。在一个子分区被编码之后,下一个子分区可使用先前(例如,前一个)子分区的重建样本作为其参考样本用于帧内预测。可水平或垂直分割CU。采用某个ISP分割模式时,基于所提供的CU帧内预测角度,下一个子分区可以或可不参考先前子分区的重建样本。
在示例中,ISP分割模式可取决于CU帧内预测模式,使得对于某个CU帧内预测模式,可使用子分区帧内预测用来指先前编码的子分区的重建样本的ISP分割模式(例如,仅ISP分割模式)。
对ISP分割模式进行发信号通知的编码开销在许多情况下可减少,并且因此可改善整体编码性能。例如,图11中示出了这种情况,该图示出了受到帧内预测模式限制的ISP分割模式的示例。
用于CU的帧内预测模式(例如,定向模式)可按帧内预测模式索引标识。图8中可示出帧内预测模式中的一个或多个帧内预测模式。CU帧内预测模式索引可用名为“predIntraMode”的输入变量表示。如图12的1210中所示,可例如使用帧内预测模式索引确定用于CU的帧内预测模式。ISP分割模式可用名为intra_subpartitions_split_flag的变量指示或编码到其中。帧内预测模式可分类为多个(例如,三个)集合,即{S1|predIntraMode>predIntraMode0}、{S2|predIntraMode<predIntraMode1且predIntraMode不等于0且predIntraMode不等于1}、{S3|剩余帧内预测模式,例如,不属于S1或S2的节点}。帧内预测模式可属于一个集合(例如,S1、S2和S3中的仅一个集合)。predintramode 0和predintramode 1可为预定帧内预测模式。参数predintramode 0和predintramode 1可为取决于CU大小的。
图11的例如(a)处示出了帧内模式的指示顶部边界参考样本的水平ISP分割的示例。某个指示(例如,intra_subpartitions_split_flag)可被确定(例如,被推断)为指示水平ISP分割的值。如图12的1220中所示,可基于帧内预测模式来确定分割模式以在CU中生成多个子分区。分割模式可包括垂直分割或水平分割。如图11的(a)处所示,如果predIntraMode属于集合S1(例如,角度帧内预测可参考顶部边界参考样本),则intra_subpartitions_split_flag可被推断为等于指示水平ISP分割的0并且不在比特流中编码。在本文的一个或多个示例中,编码块和CU可互换使用。如图11的(a)和(b)所示,CU可包括具有相等宽度和高度的正方形CU,并且CU中的多个子分区可以是矩形的。
图11的例如(b)处示出了帧内模式的指示左边界参考样本的垂直ISP分割的示例。某个指示(例如,intra_subpartitions_split_flag)可被推断为指示垂直ISP分割的值。如图11的(b)处所示,如果predIntraMode属于集合S2(例如,角度帧内预测可参考左边界参考样本),则intra_subpartitions_split_flag可被推断为等于指示垂直ISP分割的1并且不在比特流中编码。
某个指示(例如,intra_subpartitions_split_flag)可被确定(例如,被推断)为指示垂直ISP分割或水平ISP分割的值。如果predIntraMode不属于集合S1或集合S2,则predIntraMode可属于S3,intra_subpartitions_split_flag可被编码为比特流中的0或1。
在一个示例中,对于第一帧内预测模式(例如,predIntraMode<=18),(例如,当前)编码块的预测样本可参考左边界参考样本。对于第二帧内预测模式(例如,predIntraMode从18至33),块的预测(例如,当前块预测)可参考左边界参考样本和顶部边界参考样本。所参考的顶部边界参考样本的部分可从块的略高于0%(例如,对于predIntraMode=19的情况)增大到略小于50%(例如,对于predIntraMode=33)。对于第三帧内预测模式(例如,predIntraMode>=50),编码块(例如,当前编码块)的预测样本可包括例如参考顶部边界参考样本。对于第四帧内预测模式(例如,predIntraMode从49至34),块的预测(例如,当前块预测)可参考左边界参考样本和顶部边界参考样本。所提及的左边界参考样本的部分可从块的略高于0%(例如,对于predIntraMode=49的情况)增大到约50%(例如,对于predIntraMode=34)。CU可被分割成多个PU(例如,PU可包括单个子分区或多个分区)。图11(a)和图11(b)示出了被分割成多个子分区的CU的示例。可基于分割模式(例如,使用基于分割模式生成的多个子分区)来处理CU。
角度帧内模式可更多地参考左边界参考样本而不是顶部边界参考样本,或反之亦然。在示例中,可将predIntraMode0设置为33,并且可将predIntraMode1设置为34。集合S1(或S2)可表示更多地参考左边界参考样本而不是顶部边界参考样本的角度帧内模式。集合S2可表示更多地参考顶部边界参考样本而不是左边界参考样本的角度帧内模式。
某个位置(例如,编码单元的边界)处的参考样本可位于该位置(例如,当前CU)上或与其相邻。左边界处的参考样本可位于CU(例如,当前CU)的左边界上或与其相邻。顶部边界处的参考样本可位于CU(例如,当前CU)的顶部边界上或与其相邻。“相邻”可包括不同类型的相邻物,诸如相邻块、相邻子块、相邻像素和/或与边界相邻的样本。例如,相邻样本是可以是空间或时间邻居的样本。边界参考样本是与边界相邻的参考样本,其中边界可以是任何类型的边界。例如,边界参考样本可与块、子块、CU和/或PU的边界相邻。
角度帧内模式可参考左边界参考样本而不是顶部边界参考样本,或反之亦然。在示例中,可将predIntraMode0设置为19,并且可将predIntraMode1设置为49。S1可表示完全参考左边界参考样本而不是顶部边界参考样本中的任一者的角度帧内模式。S2可表示完全参考顶部边界参考样本而不是左边界参考样本中的任一者的角度帧内模式。
在示例中,可将predIntraMode0设置为介于19和33之间的值,并且可将predIntraMode1设置为介于49和34之间的值。
例如,可使用如本文所述的一个或多个示例来处理广角帧内模式。
如本文所述的ISP分割模式导出和/或限制可应用于具有相等宽度和高度的正方形编码块,例如仅具有相等宽度和高度的正方形编码块。在示例中,如本文所述的ISP分割模式导出和/或限制可不适用于可能具有广角帧内预测模式的非正方形编码块。
在示例中,如本文所述的方法可应用于正方形编码块和非正方形编码块两者。可检查原始模式指示predIntraMode,并且可将其映射到(例如,如本文所述的)非正方形编码块的值。可转换模式指示predIntraMode以涵盖常规角和广角帧内模式。如本文所述的ISP分割模式的确定可基于涵盖常规角和广角帧内模式的转换模式指示predIntraMode。
编码单元的语法可支持ISP分割模式限制的应用,例如如表7或表8中所示。可使用本文的示例来解决指示inta_luma_not_planar_flag对指示intra_subpartitons_mode_flag的编码依赖性。
在一个示例中,可在一些(例如,全部)MPM变量之后发信号通知和/或接收指示intra_subpartitons_split_flag。如表7所示,intra_luma_not_planar_flag上下文编码bin选择可与表5相同(例如,取决于intra_subpartitons_mode_flag)。指示intra_subpartitons_mode_flag的位置可与表5中相同。可在全部MPM变量之后发信号通知和/或接收指示intra_subpartitons_split_flag。这可提高编码效率。表7提供了示例性编码单元语法,其中指示intra_subpartitons_split_flag位于MPM变量之后。
表7
Figure BDA0003588823910000391
Figure BDA0003588823910000401
在一个示例中,可消除intra_luma_not_planar_flag上下文编码bin对ISP模式的依赖性。可在MPM变量之后信号通知和/或接收ISP相关标记变量(例如,intra_subpartitions_mode_flag、intra_subpartitons_split_flag两者)。如表8所示,示出了示例性编码单元语法,其中指示intra_subpartitions_mode_flag和intra_subpartitons_split_flag可位于所有MPM变量之后。这可提高清晰度。
表8
Figure BDA0003588823910000402
可统一帧内参考样本滤波。
作为本文的一个或多个示例的结果,对于1×N、2×N、N×2或具有较大宽度与高度差(例如,4×32、4×64等)的其他CU大小,子分区帧内预测可参考参考样本的沿子分区的较长侧的线。子分区帧内预测可不参考参考样本的沿子分区的较短(例如,极短)侧的线。参考参考样本的沿子分区的较长侧的线可导致比使用沿子分区的极短侧的参考样本更好的预测性能。在示例中,可跳过对ISP模式应用帧内参考样本平滑滤波的一个或多个限制。可实现更好的编码效率。
在一些示例中,用于ISP和MRL的帧内参考样本滤波(例如,包括平滑滤波和插值滤波)可与常规帧内模式不同。可对ISP、MRL和常规帧内模式使用统一方法。
在一个示例中,常规帧内模式的帧内参考样本滤波可与ISP帧内模式的帧内参考样本滤波一样。对于ISP、MRL和常规帧内模式,可不将参考样本平滑滤波用于整数斜角,并且可将针对插值滤波的4抽头三次滤波器用于分数斜角。表9提供了针对ISP和MRL的帧内参考样本滤波统一的示例。
表9
ISP MRL 常规帧内模式
用于整数斜角的平滑滤波 N/A N/A N/A
用于分数斜角的插值滤波 4抽头三次滤波器 4抽头三次滤波器 4抽头三次滤波器
在一个示例中,ISP和MRL帧内模式的帧内参考样本滤波可与常规帧内模式的帧内参考样本滤波一样。对于ISP、MRL和常规帧内模式,可将3抽头参考样本平滑滤波应用于整数斜角,并且可将4抽头三次滤波器或高斯滤波器用于分数斜角的插值滤波。表10提供了针对常规帧内模式的帧内参考样本滤波统一的示例。
表10
Figure BDA0003588823910000411
可基于帧内预测模式来确定(例如,限制)子分区(ISP)分割模式。ISP分割模式可取决于CU帧内预测模式,使得在得自ISP分割模式的子分区中,稍后编码的(例如,第一)子分区的帧内预测可参考前一个编码的(例如,第二)ISP子分区的重建样本。
在示例中,如本文所述的ISP分割模式确定(例如,导出和/或限制)可能不适用于可具有广角帧内预测模式的非正方形编码块。在示例中,如本文所述的方法可应用于正方形编码块和非正方形编码块两者。如本文所述的ISP分割导出可基于涵盖常规角和广角帧内模式的转换模式指示predIntraMode。
可对ISP、MRL和常规帧内模式使用统一方法。在一个示例中,常规帧内模式的帧内参考样本滤波可与ISP帧内模式的帧内参考样本滤波一致。对于ISP、MRL和常规帧内模式,可不将参考样本平滑滤波用于整数斜角,并且可将针对插值滤波的4抽头三次滤波器用于分数斜角。在一个示例中,ISP和MRL帧内模式的帧内参考样本滤波可与常规帧内模式的帧内参考样本滤波一致。对于ISP、MRL和常规帧内模式,可将3抽头参考样本平滑滤波应用于整数斜角,并且可将4抽头三次滤波器或高斯滤波器用于分数斜角的插值滤波。
图12示出了根据本文所述的一个或多个示例的用于使用基于帧内预测模式的分割模式对CU进行解码或编码的方法1200的示例。本文所公开的示例和其他示例可根据示例性方法1200操作,例如,包括一个或多个处理器的设备可执行该方法。在1210处,例如使用输入变量“predIntraMode”确定编码单元(CU)的帧内预测模式。在1220处,确定基于帧内预测模式的分割模式以在CU中生成多个子分区(例如如图11(a)和图11(b)所示)。对CU中的多个子分区中的第一子分区的预测可基于CU中的多个子分区中的第二子分区中的参考样本,如本文所述(例如,在图7中)。在1230处,可基于所确定的分割模式对CU进行解码或编码(例如如图11(a)和图11(b)所示)。当将图12的方法应用于解码器时,可由该解码器执行1210、1220和1230。1230可能需要基于所确定的分割模式对CU进行解码。当将图12的方法应用于编码器时,可由该编码器执行1210、1220和1230。1230可能需要基于所确定的分割模式对CU进行编码。
本文描述了许多实施方案。实施方案的特征可跨各种权利要求类别和类型单独或以任何组合提供。此外,实施方案可包括在本文跨各种权利要求类别和类型(诸如例如以下项中的任一者)单独或以任何组合描述的特征、设备或方面中的一者或多者。
如图12中所述的方法可例如由解码器基于如本文所述的一个或多个示例来执行。解码器(例如,图3中的解码器300)可被配置为例如使用帧内预测模式索引来确定用于CU的帧内预测模式,如本文所述。解码器可被配置为基于帧内预测模式来确定分割模式以在CU中生成多个子分区,例如如图11(a)和图11(b)所示。对CU中的多个子分区中的第一子分区的预测可基于CU中的多个子分区中的第二子分区中的参考样本,如本文所述。解码器可被配置为基于所确定的分割模式对CU进行解码,例如如本文所述。
解码器可被配置为基于所确定的分割模式将CU划分为多个子分区并基于参考CU中的多个样本来重建包括参考样本的第二子分区,例如如图11(a)和图11(b)所示。解码器可被配置为基于帧内预测模式来确定是基于与CU的左边界相邻的第一多个参考样本、基于与CU的顶部边界相邻的第二多个参考样本还是基于第一多个参考样本中的至少一个参考样本和第二多个参考样本中的至少一个参考样本来对CU进行解码,如本文所述。
分割模式可以是水平分割模式。分割模式可以是垂直分割模式。在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本对CU进行解码的条件下,分割模式可以是垂直分割模式。在帧内预测模式指示基于与CU的顶部边界相邻的第二多个参考样本对CU进行解码的条件下,分割模式可以是水平分割模式。在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本并且基于与CU的顶部边界相邻的第二多个参考样本对CU进行解码的条件下,可基于第一多个参考样本是否多于第二多个参考样本的确定结果来确定分割模式。
可启用帧内子分区(ISP)。可在intra_subpartitions_split_flag中指示ISP的分割模式。
帧内预测模式可按帧内预测模式索引标识并可与预定预测方向相关联。用于CU的帧内预测模式可以是垂直预测模式,例如如图8所示。用于CU的帧内预测模式可以是水平预测模式,例如如图8所示。用于CU的帧内预测模式可以是角度预测模式,例如如图8所示。用于CU的帧内预测模式可以是DC预测模式,例如如图8所示。用于CU的帧内预测模式可以是平面预测模式,例如如图8所示。CU可以是具有相等宽度和高度的正方形CU,并且多个子分区可以是矩形的(例如如图11(a)和11(b)所示)。CU可以是非正方形CU,并且帧内预测模式可以是广角帧内预测模式。
可使用包括熵解码、逆量化、逆变换和差分解码中的一者或多者的解码工具和技术来在解码器中实现如图12所述的方法。这些解码工具和技术可用于实现以下各项中的一者或多者:例如使用帧内预测模式索引来确定用于CU的帧内预测模式,如本文所述;基于帧内预测模式来确定分割模式以在CU中生成多个子分区,例如如图11(a)和11(b)所示,使得CU中的多个子分区中的第一子分区的预测可基于CU中的多个子分区中的第二子分区中的参考样本,如本文所述;基于所确定的分割模式对CU进行解码,例如如本文所述;基于所确定的分割模式将CU划分为多个子分区并基于参考CU中的多个样本来重建包括参考样本的第二子分区,例如如图11(a)和图11(b)所示;基于帧内预测模式来确定是基于与CU的左边界相邻的第一多个参考样本、基于与CU的顶部边界相邻的第二多个参考样本还是基于第一多个参考样本中的至少一个参考样本和第二多个参考样本中的至少一个参考样本来对CU进行解码,如本文;在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本对CU进行解码的条件下,选择垂直分割模式;在帧内预测模式指示基于与CU的顶部边界相邻的第二多个参考样本对CU进行解码的条件下,为CU选择水平分割模式;在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本并且基于与CU的顶部边界相邻的第二多个参考样本对CU进行解码的条件下,基于第一多个参考样本是否多于第二多个参考样本的确定结果来选择分割模式;确定ISP对于CU是启用或未启用的;接收或设置用于ISP的分割模式的intra_subpartitions_split_flag;基于帧内预测模式索引标识帧内预测模式并确定与帧内预测模式相关联的预定预测方向;为非正方形CU选择广角帧内预测模式;以及与以上项中的任一者有关的其他解码器行为。
如图12中所述的方法可例如由编码器基于如本文所述的一个或多个示例来执行。编码器(例如,图2中的编码器200)可被配置为例如使用帧内预测模式索引来确定用于CU的帧内预测模式,如本文所述。编码器可被配置为基于帧内预测模式来确定分割模式以在CU中生成多个子分区,例如如图11(a)和图11(b)所示。对CU中的多个子分区中的第一子分区的预测可基于CU中的多个子分区中的第二子分区中的参考样本,如本文所述。编码器可被配置为基于所确定的分割模式对CU进行编码,例如如本文所述。
编码器可被配置为基于所确定的分割模式将CU划分为多个子分区并基于参考CU中的多个样本来重建包括参考样本的第二子分区,例如如图11(a)和图11(b)所示。编码器可被配置为基于帧内预测模式来确定是基于与CU的左边界相邻的第一多个参考样本、基于与CU的顶部边界相邻的第二多个参考样本还是基于第一多个参考样本中的至少一个和第二多个参考样本中的至少一个来对CU进行编码,如本文所述。编码器可被配置为在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本对CU进行编码的条件下,为CU选择垂直分割模式。编码器可被配置为在帧内预测模式指示基于与CU的顶部边界相邻的第二多个参考样本对CU进行编码的条件下,为CU选择水平分割模式。编码器可被配置为在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本并且基于与CU的顶部边界相邻的第二多个参考样本对CU进行编码的条件下,基于第一多个参考样本是否多于第二多个参考样本的确定结果来选择分割模式。
可使用包括量化、熵编码、逆量化、逆变换和差分编码中的一者或多者的编码工具和技术来在编码器中实现如图11所述的方法。这些编码工具和技术可用于实现:例如使用帧内预测模式索引来确定用于CU的帧内预测模式,如本文所述;基于帧内预测模式来确定分割模式以在CU中生成多个子分区,例如如图11(a)和11(b)所示,使得CU中的多个子分区中的第一子分区的预测可基于CU中的多个子分区中的第二子分区中的参考样本,如本文所述;基于所确定的分割模式对CU进行编码,例如如本文所述;基于所确定的分割模式将CU划分为多个子分区并基于参考CU中的多个样本来重建包括参考样本的第二子分区,例如如图11(a)和图11(b)所示;基于帧内预测模式来确定是基于与CU的左边界相邻的第一多个参考样本、基于与CU的顶部边界相邻的第二多个参考样本还是基于第一多个参考样本中的至少一个参考样本和第二多个参考样本中的至少一个参考样本来对CU进行编码,如本文所述;在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本对CU进行编码的条件下,选择垂直分割模式;在帧内预测模式指示基于与CU的顶部边界相邻的第二多个参考样本对CU进行编码的条件下,为CU选择水平分割模式;在帧内预测模式指示基于与CU的左边界相邻的第一多个参考样本并且基于与CU的顶部边界相邻的第二多个参考样本对CU进行编码的条件下,基于第一多个参考样本是否多于第二多个参考样本的确定结果来选择分割模式;确定ISP对于CU是启用或未启用的;接收或设置用于ISP的分割模式的intra_subpartitions_split_flag;基于帧内预测模式索引标识帧内预测模式并确定与帧内预测模式相关联的预定预测方向;为非正方形CU选择广角帧内预测模式;以及与以上项中的任一者有关的其他编码器行为。
可将语法元素插入信令中,例如,以使解码器能够标识与执行如图12所述的方法或使用的方法相关联的指示。例如,语法元素可包括ISP指示、帧内预测模式的指示、解码器用来执行本文的一个或多个示例的参数的指示等,例如,以向解码器指示它们中的一个或多个是被启用还是被禁用。
例如,可基于在解码器处应用的语法元素来选择和/或应用如图12所述的方法。例如,解码器可接收对CU启用ISP的指示。基于该指示,解码器可执行如图12所述的方法,以确定CU的分割模式。
编码器可基于本文的一个或多个示例来调整预测残差。例如,可通过从原始图像块中减去预测视频块来获得残差。例如,编码器可基于所确定的分割模式来预测视频块。编码器可获得原始图像块并且从原始图像块中减去预测视频块以生成预测残差。
比特流或信号可包括一个或多个语法元素或其变型。例如,比特流或信号可包括指示ISP、帧内预测模式、解码器用来执行本文的一个或多个示例的参数等中的任一者是启用、激活还是未启用、未激活的语法元素。
比特流或信号可包括传达根据本文的一个或多个示例生成的信息的语法。例如,可在执行如图12所示的示例中生成信息或数据。所生成的信息或数据可在比特流或信号中包括的语法中传达。
使解码器能够以对应于由编码器使用的方式的方式调适残差的语法元素可插入信号中。例如,可使用本文的一个或多个示例来生成残差。
一种方法、过程、装置、存储指令的介质、存储数据的介质或信号可用于创建和/或发射和/或接收和/或解码包括所述语法元素中的一个或多个语法元素或其变型的比特流或信号。
一种方法、过程、装置、存储指令的介质、存储数据的介质或信号可用于根据所述示例中的任一个示例来创建和/或发射和/或接收和/或解码。
TV、机顶盒、移动电话、平板电脑或其他电子设备可根据所述示例中的任一个示例基于与CU相关联的帧内预测模式来确定该CU的分割模式。
TV、机顶盒、移动电话、平板电脑或其他电子设备可根据所述示例中的任一个示例基于与CU相关联的帧内预测模式来确定该CU的分割模式,并显示(例如,使用监视器、屏幕或其他类型的显示器)所得图像。
TV、机顶盒、移动电话、平板电脑或其他电子设备可选择(例如,使用调谐器)信道以接收包括编码图像的信号,并根据所述示例中的任一个示例基于与CU相关联的帧内预测模式来确定该CU的分割模式。
TV、机顶盒、移动电话、平板电脑或其他电子设备可接收(例如,使用天线)包括编码图像的空中信号,并根据所述示例中的任一个示例基于与CU相关联的帧内预测模式来确定该CU的分割模式。
尽管上文以特定组合描述了特征和元件,但是本领域的普通技术人员将理解,每个特征或元件可单独使用或以与其他特征和元件的任何组合来使用。另外,本文所述的方法可在结合于计算机可读介质中以供计算机或处理器执行的计算机程序、软件或固件中实现。计算机可读介质的示例包括电子信号(通过有线或无线连接传输)和计算机可读存储介质。计算机可读存储介质的示例包括但不限于只读存储器(ROM)、随机存取存储器(RAM)、寄存器、高速缓存存储器、半导体存储器设备、磁介质(诸如内置硬盘和可移动磁盘)、磁光介质和光介质(诸如CD-ROM磁盘和数字通用光盘(DVD))。与软件相关联的处理器可用于实现用于WTRU、UE、终端、基站、RNC或任何主计算机的射频收发器。

Claims (28)

1.一种用于视频解码的装置,包括一个或多个处理器,其中所述一个或多个处理器被配置为:
确定用于编码单元(CU)的帧内预测模式;
基于所述帧内预测模式来确定分割模式以在所述CU中生成多个子分区,其中对所述CU中的所述多个子分区中的第一子分区的预测基于所述CU中的所述多个子分区中的第二子分区中的参考样本;以及
基于所确定的分割模式对所述CU进行解码。
2.一种用于视频编码的装置,包括一个或多个处理器,其中所述一个或多个处理器被配置为:
确定用于编码单元(CU)的帧内预测模式;
基于所述帧内预测模式来确定分割模式以在所述CU中生成多个子分区,其中对所述CU中的所述多个子分区中的第一子分区的预测基于所述CU中的所述多个子分区中的第二子分区中的参考样本;以及
基于所确定的分割模式对所述CU进行编码。
3.一种用于视频解码的方法,所述方法包括:
确定用于编码单元(CU)的帧内预测模式;
基于所述帧内预测模式来确定分割模式以在所述CU中生成多个子分区,其中对所述CU中的所述多个子分区中的第一子分区的预测基于所述CU中的所述多个子分区中的第二子分区中的参考样本;以及
基于所确定的分割模式对所述CU进行解码。
4.一种用于视频编码的方法,所述方法包括:
确定用于编码单元(CU)的帧内预测模式;
基于所述帧内预测模式来确定分割模式以在所述CU中生成多个子分区,其中对所述CU中的所述多个子分区中的第一子分区的预测基于所述CU中的所述多个子分区中的第二子分区中的参考样本;以及
基于所确定的分割模式对所述CU进行编码。
5.根据权利要求1或权利要求2所述的装置,其中所述一个或多个处理器被配置为:
基于所确定的分割模式将所述CU划分为所述多个子分区;以及
基于参考CU中的多个样本来重建包括所述参考样本的所述第二子分区。
6.根据权利要求1或权利要求5所述的装置,其中所述一个或多个处理器被配置为基于所述帧内预测模式来确定是基于与所述CU的左边界相邻的第一多个参考样本、基于与所述CU的顶部边界相邻的第二多个参考样本还是基于所述第一多个参考样本中的至少一个参考样本和所述第二多个参考样本中的至少一个参考样本来对所述CU进行解码。
7.根据权利要求2或权利要求5所述的装置,其中所述一个或多个处理器被配置为基于所述帧内预测模式来确定是基于与所述CU的左边界相邻的第一多个参考样本、基于与所述CU的顶部边界相邻的第二多个参考样本还是基于所述第一多个参考样本中的至少一个参考样本和所述第二多个参考样本中的至少一个参考样本来对所述CU进行编码。
8.根据权利要求3或权利要求4所述的方法,其中所述方法还包括:
基于所确定的分割模式将所述CU划分为所述多个子分区;以及
基于参考CU中的多个样本来重建包括所述参考样本的所述第二子分区。
9.根据权利要求3或权利要求8所述的方法,其中所述方法还包括基于所述帧内预测模式来确定是基于与所述CU的左边界相邻的第一多个参考样本、基于与所述CU的顶部边界相邻的第二多个参考样本还是基于所述第一多个参考样本中的至少一个参考样本和所述第二多个参考样本中的至少一个参考样本来对所述CU进行解码。
10.根据权利要求4或权利要求8所述的方法,其中所述方法还包括基于所述帧内预测模式来确定是基于与所述CU的左边界相邻的第一多个参考样本、基于与所述CU的顶部边界相邻的第二多个参考样本还是基于所述第一多个参考样本中的至少一个参考样本和所述第二多个参考样本中的至少一个参考样本来对所述CU进行编码。
11.根据权利要求1、2和5至7中任一项所述的装置或根据权利要求3、4和8至10中任一项所述的方法,其中所述帧内预测模式按帧内预测模式索引标识并与预定预测方向相关联。
12.根据权利要求1、2、5至7和11中任一项所述的装置或根据权利要求3、4和8至11中任一项所述的方法,其中包括所述参考样本的所述第二子分区的预测基于与所述CU的左边界相邻的第一多个参考样本,基于与所述CU的顶部边界相邻的第二多个参考样本,或基于所述第一多个参考样本中的至少一个参考样本和所述第二多个参考样本中的至少一个参考样本。
13.根据权利要求1、5至7、11和12中任一项所述的装置或根据权利要求3和8至12中任一项所述的方法,其中,在所述帧内预测模式指示基于与所述CU的左边界相邻的第一多个参考样本对所述CU进行解码的条件下,所述分割模式是垂直分割模式,并且在所述帧内预测模式指示基于与所述CU的顶部边界相邻的第二多个参考样本对所述CU进行解码的条件下,所述分割模式是水平分割模式。
14.根据权利要求1、5至7和11至13中任一项所述的装置或根据权利要求3和8至13中任一项所述的方法,其中,在所述帧内预测模式指示基于与所述CU的左边界相邻的第一多个参考样本并且基于与所述CU的顶部边界相邻的第二多个参考样本对所述CU进行编码的条件下,基于所述第一多个参考样本是否多于所述第二多个参考样本的确定结果来确定所述分割模式。
15.根据权利要求1、2、5至7和11至14中任一项所述的装置或根据权利要求3、4和8至14中任一项所述的方法,其中所述分割模式包括水平分割模式或垂直分割模式。
16.根据权利要求1、2、5至7和11至15中任一项所述的装置或根据权利要求3、4和8至15中任一项所述的方法,其中在intra_subpartitions_split_flag中指示所述分割模式。
17.根据权利要求1、2、5至7和11至16中任一项所述的装置或根据权利要求3、4和8至16中任一项所述的方法,其中帧内子分区(ISP)被启用。
18.根据权利要求1、2、5至7和11至17中任一项所述的装置或根据权利要求3、4和8至17中任一项所述的方法,其中用于所述CU的所述帧内预测模式包括垂直预测模式、水平预测模式、角度预测模式、DC预测模式或平面预测模式。
19.根据权利要求1、2、5至7和11至18中任一项所述的装置或根据权利要求3、4和8至18中任一项所述的方法,其中所述CU包括具有相等宽度和高度的正方形CU,并且所述多个子分区是矩形的。
20.根据权利要求1、2、5至7和11至18中任一项所述的装置或根据权利要求3、4和8至18中任一项所述的方法,其中所述CU包括非正方形CU,并且所述帧内预测模式包括广角帧内预测模式。
21.一种非暂态计算机可读介质,所述非暂态计算机可读介质包括根据权利要求3、4和8至20中任一项所述的方法生成的数据内容。
22.一种计算机可读介质,所述计算机可读介质包括用于使一个或多个处理器执行根据权利要求3、4和8至20中任一项所述的方法的指令。
23.一种计算机程序产品,所述计算机程序产品包括用于在被一个或多个处理器执行时执行根据权利要求3、4和8至20中任一项所述的方法的指令。
24.一种设备,所述设备包括:
根据权利要求1、2、5至7和11至20中任一项所述的装置;以及
以下各项中的至少一者:(i)天线,所述天线被配置为接收信号,所述信号包括表示图像的数据;(ii)频带限制器,所述频带限制器被配置为将所接收的信号限制为包括表示所述图像的所述数据的频带;或(iii)显示器,所述显示器被配置为显示所述图像。
25.根据权利要求1、2、5至7和11至20中任一项所述的设备,包括:
TV、移动电话、平板电脑或机顶盒(STB)。
26.一种信号,所述信号包括基于根据权利要求3、4和8至20中任一项所述的方法确定的所述CU的分割模式生成的残差。
27.一种装置,所述装置包括:
访问单元,所述访问单元被配置为访问包括基于根据权利要求1、2、5至7和11至20中任一项所述的装置确定的所述CU的分割模式而生成的残差的数据;和
发射器,所述发射器被配置为发射包括所述残差的所述数据。
28.一种方法,所述方法包括:
访问包括基于根据权利要求3、4和8至20中任一项所述的方法确定的所述CU的分割模式而生成的残差的数据;以及
发射包括所述残差的所述数据。
CN202080071165.1A 2019-09-17 2020-09-17 帧内子分区相关的帧内编码 Pending CN114556928A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962901497P 2019-09-17 2019-09-17
US62/901,497 2019-09-17
PCT/US2020/051230 WO2021055574A1 (en) 2019-09-17 2020-09-17 Intra sub-partitions related infra coding

Publications (1)

Publication Number Publication Date
CN114556928A true CN114556928A (zh) 2022-05-27

Family

ID=72659996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080071165.1A Pending CN114556928A (zh) 2019-09-17 2020-09-17 帧内子分区相关的帧内编码

Country Status (3)

Country Link
EP (1) EP4032269A1 (zh)
CN (1) CN114556928A (zh)
WO (1) WO2021055574A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449265B (zh) 2019-03-28 2023-07-07 华为技术有限公司 用于帧内平滑的方法和装置
WO2024131867A1 (en) * 2022-12-21 2024-06-27 Douyin Vision Co., Ltd. Method, apparatus, and medium for video processing

Also Published As

Publication number Publication date
US20220345701A1 (en) 2022-10-27
WO2021055574A1 (en) 2021-03-25
EP4032269A1 (en) 2022-07-27

Similar Documents

Publication Publication Date Title
US20220377344A1 (en) Systems and methods for versatile video coding
US20230046946A1 (en) Merge mode, adaptive motion vector precision, and transform skip syntax
US20230045182A1 (en) Quantization parameter coding
US20220394298A1 (en) Transform coding for inter-predicted video data
CN114556928A (zh) 帧内子分区相关的帧内编码
CN114600452A (zh) 用于运动补偿的自适应插值滤波器
JP2024513939A (ja) 重複ブロック動き補償
CN114556945A (zh) 用于双向光流的切换逻辑
US12132898B2 (en) Intra sub-partitions related intra coding
WO2023057501A1 (en) Cross-component depth-luma coding
WO2023117861A1 (en) Local illumination compensation with multiple linear models
EP4454266A1 (en) Local illumination compensation with multiple linear models
WO2023194193A1 (en) Sign and direction prediction in transform skip and bdpcm
WO2024133058A1 (en) Gradual decoding refresh padding
EP4413730A2 (en) Transform unit partitioning for cloud gaming video coding
WO2024133767A1 (en) Motion compensation for video blocks
JP2024538666A (ja) クロス成分深度-ルーマコーディング
WO2024079187A1 (en) Video coding combining intra-sub partition and template-based intra-mode derivation techniques
WO2024209023A1 (en) Usage of timd and dimd
WO2023198535A1 (en) Residual coefficient sign prediction with adaptive cost function for intra prediction modes
WO2024133579A1 (en) Gpm combination with inter tools
WO2024133880A1 (en) History-based intra prediction mode
EP4413736A1 (en) Motion vector coding with input motion vector data
WO2024209028A1 (en) Padding of non-available intra samples in block-vector-based intra prediction
WO2024208952A1 (en) Prediction and transform dependency

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240815

Address after: Delaware, USA

Applicant after: Interactive Digital VC Holdings

Country or region after: U.S.A.

Address before: Wilmington, Delaware, USA

Applicant before: VID SCALE, Inc.

Country or region before: U.S.A.