WO2024050723A1

WO2024050723A1 - 一种图像预测方法、装置及计算机可读存储介质

Info

Publication number: WO2024050723A1
Application number: PCT/CN2022/117595
Authority: WO
Inventors: 唐桐
Original assignee: Oppo广东移动通信有限公司
Priority date: 2022-09-07
Filing date: 2022-09-07
Publication date: 2024-03-14

Abstract

本申请提供一种预测方法、装置及计算机可读存储介质，本申请计算给定图像区域的空域连续性参数，确定帧内子块划分信息，用于指示编码块是否使用帧内子块划分。对当前编码块根据帧内子块划分信息的指示，选择预测代价最小的预测模式进行预测。避免在空域相关性弱的图像区域进行不必要的帧内子块划分，降低了计算复杂度，从而提高了编码效率。

Description

一种图像预测方法、装置及计算机可读存储介质

技术领域

本公开实施例涉及但不限于视频数据处理技术领域，尤其设及一种视频编解码方法、设备及存储介质。

背景技术

数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够节省不少视频数据，但目前仍然需要追求更好的数字视频压缩技术，以减少数字视频传输的带宽和流量压力，达到更高效的视频编解码和传输存储。

为了提供最优的视频数据压缩结果，往往需要在多种具体的可用配置方案下进行编码尝试并进行优选，因此，在满足视频数据播放及传输要求的前提下，在编码技术领域一方面要寻求更优的视频压缩技术方案，另一方面也需要兼顾编解码效率。

发明内容

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本公开实施例提供一种图像预测方法，包括：

获取帧内子块划分信息，当所述帧内子块划分信息指示当前块使用帧内子块划分时，

基于至少一个帧内子块划分，确定至少一个第一帧内预测模式以及所述至少一个第一帧内预测模式对应的预测代价，

确定至少一个第一其他预测模式以及所述至少一个第一其他预测模式对应的预测代价，

其中，所述帧内子块划分信息是根据计算空域连续性参数得到的，且所述帧内子块划分信息被写入码流。

本公开实施例还提供一种图像预测设备，包括处理器以及存储有可在所述处理器上运行的计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如本公开任一实施例所述的图像预测方法。

本公开实施例还提供一种非瞬态计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序时被处理器执行时实现如本公开任一实施例所述的图像预测方法。

附图说明

图1为本申请实施例涉及的一种视频编解码系统的示意性框图；

图2是本申请实施例涉及的视频编码器的示意性框图；

图3是本申请实施例涉及的视频解码器的示意性框图；

图4A是本申请一实施例提供的图像预测方法的示意性流程图；

图4B是本申请一实施例提供的计算空域连续性参数的流程图；

图5是本申请一实施例提供的图像预测方法的示意性流程图；

图6是本申请一实施例提供的图像预测方法的示意性流程图.

具体实施方式

本公开可应用于图像编解码领域、视频编解码领域、硬件视频编解码领域、专用电路视频编解码领域、实时视频编解码领域等。例如，本公开的方案可结合至音视频编码标准(audio video coding standard，简称AVS)，例如，H.264/音视频编码(audio video coding，简称AVC)标准，H.265/高效视频编码(high efficiency video coding，简称HEVC)标准以及H.266/多功能视频编码(versatile video coding，简称VVC)标准。或者，本公开的方案可结合至其它专属或行业标准而操作，所述标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual，ITU-TH.264(还称为ISO/IECMPEG-4AVC)，包含可分级视频编解码(SVC)及多视图视频编解码(MVC)扩展。应理解，本公开的技术不限于任何特定编解码标准或技术。

为了便于理解，首先结合图1对本公开的实施例涉及的视频编解码系统进行介绍。

图1为本公开的实施例涉及的一种视频编解码系统的示意性框图。需要说明的是，图1只是一种示例，本公开的实施例的视频编解码系统包括但不限于图1所示。如图1所示，该视频编解码系统100包含编码设备110和解码设备120。其中编码设备用于对视频数据进行编码(可以理解成压缩)产生码流，并将码流传输给解码设备。解码设备对编码设备编码产生的码流进行解码，得到解码后的视频数据。

本公开的实施例的编码设备110可以理解为具有视频编码功能的设备，解码设备120可以理解为具有视频解码功能的设备，即本公开的实施例对编码设备110和解码设备120包括更广泛的装置，例如包含智能手机、台式计算机、移动计算装置、笔记本(例如，膝上型)计算机、平板计算机、机顶盒、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机等。

在一些实施例中，编码设备110可以经由信道130将编码后的视频数据(如码流)传输给解码设备120。信道130可以包括能够将编码后的视频数据从编码设备110传输到解码设备120的一个或多个媒体和/或装置。

在一个实例中，信道130包括使编码设备110能够实时地将编码后的视频数据直接发射到解码设备120的一个或多个通信媒体。在此实例中，编码设备110可根据通信标准来调制编码后的视频数据，且将调制后的视频数据发射到解码设备120。其中通信媒体包含无线通信媒体，例如射频频谱，可选的，通信媒体还可以包含有线通信媒体，例如一根或多根物理传输线。

在另一实例中，信道130包括存储介质，该存储介质可以存储编码设备110编码后的视频数据。存储介质包含多种本地存取式数据存储介质，例如光盘、DVD、快闪存储器等。在该实例中，解码设备120可从该存储介质中获取编码后的视频数据。

在另一实例中，信道130可包含存储服务器，该存储服务器可以存储编码设备110编码后的视频数据。在此实例中，解码设备120可以从该存储服务器中下载存储的编码后的视频数据。可选的，该存储服务器可以存储编码后的视频数据且可以将该编码后的视频数据发射到解码设备120，例如web服务器(例如，用于网站)、文件传送协议(FTP)服务器等。

一些实施例中，编码设备110包含视频编码器112及输出接口113。其中，输出接口113可以包含调制器/解调器(调制解调器)和/或发射器。

在一些实施例中，编码设备110除了包括视频编码器112和输入接口113外，还可以包括视频源111。

视频源111可包含视频采集装置(例如，视频相机)、视频存档、视频输入接口、计算机图形系统中的至少一个，其中，视频输入接口用于从视频内容提供者处接收视频数据，计算机图形系统用于产生视频数据。

视频编码器112对来自视频源111的视频数据进行编码，产生码流。视频数据可包括一个或多个图像(picture)或图像序列(sequence of pictures)。码流以比特流的形式包含了图像或图像序列的编码信息。编码信息可以包含编码图像数据及相关联数据。相关联数据可包含序列参数集(sequence parameter set，简称SPS)、图像参数集(picture parameter set，简称PPS)及其它语法结构。SPS可含有应用于一个或多个序列的参数。PPS可含有应用于一个或多个图像的参数。语法结构是指码流中以指定次序排列的零个或多个语法元素的集合。

视频编码器112经由输出接口113将编码后的视频数据直接传输到解码设备120。编码后的视频数据还可存储于存储介质或存储服务器上，以供解码设备120后续读取。

在一些实施例中，解码设备120包含输入接口121和视频解码器122。

在一些实施例中，解码设备120除包括输入接口121和视频解码器122外，还可以包括显示装置123。

其中，输入接口121包含接收器及/或调制解调器。输入接口121可通过信道130接收编码后的视频数据。

视频解码器122用于对编码后的视频数据进行解码，得到解码后的视频数据，并将解码后的视频数据传输至显示装置123。

显示装置123显示解码后的视频数据。显示装置123可与解码设备120整合或在解码设备120外部。显示装置123可包括多种显示装置，例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或其它类型的显示装置。

此外，图1仅为实例，本公开的实施例的技术方案不限于图1，例如本公开的技术还可以应用于单侧的视频编码或单侧的视频解码。

下面对本公开的实施例涉及的视频编码框架进行介绍。

图2是本公开的实施例涉及的视频编码器的示意性框图。应理解，该视频编码器200可用于对图像进行有损压缩(lossy compression)，也可用于对图像进行无损压缩(lossless compression)。该无损压缩可以是视觉无损压缩(visually lossless compression)，也可以是数学无损压缩(mathematically lossless compression)。

该视频编码器200可应用于亮度色度(YCbCr，YUV)格式的图像数据上。例如，YUV比例可以为4:2:0、4:2:2或者4:4:4，Y表示明亮度(Luma)，Cb(U)表示蓝色色度，Cr(V)表示红色色度，U和V表示为色度(Chroma)用于描述色彩及饱和度。例如，在颜色格式上，4:2:0表示每4个像素有4个亮度分量，2个色度分量(YYYYCbCr)，4:2:2表示每4个像素有4个亮度分量，4个色度分量(YYYYCbCrCbCr)，4:4:4表示全像素显示(YYYYCbCrCbCrCbCrCbCr)。

例如，该视频编码器200读取视频数据，针对视频数据中的每帧图像，将一帧图像划分成若干个编码树单元(coding tree unit，CTU)，在一些例子中，CTB可被称作“树型块”、“最大编码单元”(Largest Coding unit，简称LCU)或“编码树型块”(coding tree block，简称CTB)。每一个CTU可以与图像内的具有相等大小的像素块相关联。每一像素可对应一个亮度(luminance或luma)采样及两个色度(chrominance或chroma)采样。因此，每一个CTU可与一个亮度采样块及两个色度采样块相关联。一个CTU大小例如为128×128、64×64、32×32等。一个CTU又可以继续被划分成若干个编码单元(Coding Unit，CU)进行编码，CU可以为矩形块也可以为方形块。CU可以进一步划分为预测单元(prediction Unit，简称PU)和变换单元(transform unit，简称TU)，进而使得编码、预测、变换分离，处理的时候更灵活。在一种示例中，CTU以四叉树方式划分为CU，CU以四叉树方式划分为TU、PU。

视频编码器及视频解码器可支持各种PU大小。假定特定CU的大小为2N×2N，视频编码器及视频解码器可支持2N×2N或N×N的PU大小以用于帧内预测，且支持2N×2N、2N×N、N×2N、N×N或类似大小的对称PU以用于帧间预测。视频编码器及视频解码器还可支持2N×nU、2N×nD、nL×2N及nR×2N的不对称PU以用于帧间预测。

在一些实施例中，如图2所示，该视频编码器200可包括：预测单元210、残差单元220、变换/量化单元230、反变换/量化单元240、重建单元250、环路滤波单元260、解码图像缓存270和熵编码单元280。需要说明的是，视频编码器200可包含更多、更少或不同的功能组件。

可选的，在本公开中，当前块(current block)可以称为当前编码单元(CU)或当前预测单元(PU)等。预测块也可称为预测图像块或图像预测块，重建图像块也可称为重建块或图像重建图像块。

在一些实施例中，预测单元210包括帧间预测单元211和帧内估计单元212。由于视频的一个帧中的相邻像素之间存在很强的相关性，在视频编解码技术中使用帧内预测的方法消除相邻像素之间的空间冗余。由于视频中的相邻帧之间存在着很强的相似性，在视频编解码技术中使用帧间预测方法消除相邻帧之间的时间冗余，从而提高编码效率。

帧间预测单元211可用于帧间预测，帧间预测可以包括运动估计(motion estimation)和运动补偿(motion compensation)，可以参考不同帧的图像信息，帧间预测使用运动信息从参考帧中找到参考块，根据参考块生成预测块，用于消除时间冗余；帧间预测所使用的帧可以为P帧和/或B帧，P帧指的是向前预测帧，B帧指的是双向预测帧。帧间预测使用运动信息从参考帧中找到参考块，根据参考块生成预测块。运动信息包括参考帧所在的参考帧列表，参考帧索引，以及运动矢量。运动矢量可以是整像素的或者是分像素的，如果运动矢量是分像素的，那么需要在参考帧中使用插值滤波做出所需的分像素的块，这里把根据运动矢量找到的参考帧中的整像素或者分像素的块叫参考块。有的技术会直接把参考块作为预测块，有的技术会在参考块的基础上再处理生成预测块。在参考块的基础上再处理生成预测块也可以理解为把参考块作为预测块然后再在预测块的基础上处理生成当前块的预测块。

帧内估计单元212只参考同一帧图像的信息，预测当前码图像块内的像素信息，用于消除空间冗余。帧内预测所使用的帧可以为I帧。

帧内预测有多种预测模式，以国际数字视频编码标准H系列为例，H.264/AVC标准有8种角度预测模式和1种非角度预测模式，H.265/HEVC扩展到33种角度预测模式和2种非角度预测模式。HEVC使用的帧内预测模式有平面模式(Planar)、DC和33种角度模式，共35种预测模式。VVC使用的帧内模式有Planar、DC和65种角度模式，共67种预测模式。

需要说明的是，随着角度模式的增加，帧内预测将会更加精确，也更加符合对高清以及超高清数字视频发展的需求。

残差单元220可基于CU的像素块及CU的PU的预测块来产生CU的残差块。举例来说，残差单元220可产生CU的残差块，使得残差块中的每一采样具有等于以下两者之间的差的值：CU的像素块中的采样，及CU的PU的预测块中的对应采样。

变换/量化单元230可量化变换系数。变换/量化单元230可基于与CU相关联的量化参数(QP)值来量化与CU的TU相关联的变换系数。视频编码器200可通过调整与CU相关联的QP值来调整应用于与CU相关联的变换系数的量化程度。

反变换/量化单元240可分别将逆量化及逆变换应用于量化后的变换系数，以从量化后的变换系数重建残差块。

重建单元250可将重建后的残差块的采样加到预测单元210产生的一个或多个预测块的对应采样，以产生与TU相关联的重建图像块。通过此方式重建CU的每一个TU的采样块，视频编码器200可重建CU的像素块。

环路滤波单元260用于对反变换与反量化后的像素进行处理，弥补失真信息，为后续编码像素提供更好的参考，例如可执行消块滤波操作以减少与CU相关联的像素块的块效应。

在一些实施例中，环路滤波单元260包括去块滤波单元和样点自适应补偿/自适应环路滤波(SAO/ALF)单元，其中去块滤波单元用于去方块效应，SAO/ALF单元用于去除振铃效应。

解码图像缓存270可存储重建后的像素块。帧间预测单元211可使用含有重建后的像素块的参考图像来对其它图像的PU执行帧间预测。另外，帧内估计单元212可使用解码图像缓存270中的重建后的像素块来对在与CU相同的图像中的其它PU执行帧内预测。

熵编码单元280可接收来自变换/量化单元230的量化后的变换系数。熵编码单元280可对量化后的变换系数执行一个或多个熵编码操作以产生熵编码后的数据。

图3是本公开的实施例涉及的视频解码器的示意性框图。

如图3所示，视频解码器300包含：熵解码单元310、预测单元320、反量化/变换单元330、重建单元340、环路滤波单元350及解码图像缓存360。需要说明的是，视频解码器300可包含更多、更少或不同的功能组件。

视频解码器300可接收码流。熵解码单元310可解析码流以从码流提取语法元素。作为解析码流的一部分，熵解码单元310可解析码流中的经熵编码后的语法元素。预测单元320、反量化/变换单元330、重建单元340及环路滤波单元350可根据从码流中提取的语法元素来解码视频数据，即产生解码后的视频数据。

在一些实施例中，预测单元320包括帧间预测单元321和帧内估计单元322。

帧内估计单元322可执行帧内预测以产生PU的预测块。帧内估计单元322可使用帧内预测模式以基于空间相邻PU的像素块来产生PU的预测块。帧内估计单元322还可根据从码流解析的一个或多个语法元素来确定PU的帧内预测模式。

帧间预测单元321可根据从码流解析的语法元素来构造第一参考图像列表(列表0)及第二参考图像列表(列表1)。此外，如果PU使用帧间预测编码，则熵解码单元310可解析PU的运动信息。帧间预测单元321可根据PU的运动信息来确定PU的一个或多个参考块。帧间预测单元321可根据PU的一个或多个参考块来产生PU的预测块。

反量化/变换单元330可逆量化(即，解量化)与TU相关联的变换系数。反量化/变换单元330可使用与TU的CU相关联的QP值来确定量化程度。

在逆量化变换系数之后，反量化/变换单元330可将一个或多个逆变换应用于逆量化变换系数，以便产生与TU相关联的残差块。

重建单元340使用与CU的TU相关联的残差块及CU的PU的预测块以重建CU的像素块。例如，重建单元340可将残差块的采样加到预测块的对应采样以重建CU的像素块，得到重建图像块。

环路滤波单元350可执行消块滤波操作以减少与CU相关联的像素块的块效应。

视频解码器300可将CU的重建图像存储于解码图像缓存360中。视频解码器300可将解码图像缓存360中的重建图像作为参考图像用于后续预测，或者，将重建图像传输给显示装置呈现。

视频编解码的基本流程如下：在编码端，将一帧图像划分成块，针对当前块，预测单元210使用帧内预测或帧间预测产生当前块的预测块。残差单元220可基于预测块与当前块的原始块计算残差块，即预测块和当前块的原始块的差值，该残差块也可称为残差信息。该残差块经由变换/量化单元230变换与量化等过程，可以去除人眼不敏感的信息，以消除视觉冗余。可选的，经过变换/量化单元230变换与量化之前的残差块可称为时域残差块，经过变换/量化单元230变换与量化之后的时域残差块可称为频率残差块或频域残差块。熵编码单元280接收到变化量化单元230输出的量化后的变化系数，可对该量化后的变化系数进行熵编码，输出码流。例如，熵编码单元280可根据目标上下文模型以及二进制码流的概率信息消除字符冗余。

在解码端，熵解码单元310可解析码流得到当前块的预测信息、量化系数矩阵等，预测单元320基于预测信息对当前块使用帧内预测或帧间预测产生当前块的预测块。反量化/变换单元330使用从码流得到的量化系数矩阵，对量化系数矩阵进行反量化、反变换得到残差块。重建单元340将预测块和残差块相加得到重建块。重建块组成重建图像，环路滤波单元350基于图像或基于块对重建图像进行环路滤波，得到解码图像。编码端同样需要和解码端类似的操作获得解码图像。该解码图像也可以称为重建图像，重建图像可以为后续的帧作为帧间预测的参考帧。

需要说明的是，编码端确定的块划分信息，以及预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息等在必要时携带在码流中。解码端通过解析码流及根据已有信息进行分析确定与编码端相同的块划分信息，预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息，从而保证编码端获得的解码图像和解码端获得的解码图像相同。

上述是基于块的混合编码框架下的视频编解码器的基本流程，随着技术的发展，该框架或流程的一些模块或步骤可能会被优化，本公开适用于该基于块的混合编码框架下的视频编解码器的基本流程，但不限于该框架及流程。

目前通用的视频编解码标准都采用基于块的混合编码框架。视频中的每一帧被分割成相同大小(如128x128，64x64等)的正方形的最大编码单元(LCU largest coding unit)或编码树单元(CTU Coding Tree Unit)。每个最大编码单元或编码树单元可根据规则划分成矩形的编码单元(CU coding unit)。

在H.264/AVC中，将输入图像划分成固定的尺寸的块作为编码的基本单元，并把它称为宏块(MB，Macro Block)，包括一个亮度块和两个色度块，亮度块大小为16×16。如果采用4:2:0采样，色度块大小为亮度块大小的一半。在预测环节，根据预测模式的不同，将宏块进一步划分为用于预测的小块。帧内预测中可以把宏块划分成16×16、8×8、4×4的小块，每个小块分别进行帧内预测。在变换、量化环节，将宏块划分为4×4或8×8的小块，将每个小块中的预测残差分别进行变换和量化，得到量化后的系数。

H.265/HEVC与H.264/AVC相比，在多个编码环节采取了改进措施。在H.265/HEVC中，一幅图像被分割成编码树单元(CTU，Coding Tree Unit)，CTU是编码的基本单元(对应于H.264/AVC中的宏块)。一个CTU包含一个亮度编码树块(CTB，Coding Tree Block)和两个色度编码树块，H.265/HEVC标准中CU的最大尺寸一般为64×64。为了适应多种多样的视频内容和视频特征，CTU采用四叉树(QT，Quadro Tree)方式迭代划分为一系列编码单元(CU，Coding Unit)，CU是帧内/帧间编码的基本单元。一个CU包含一个亮度编码块(CB，Coding Block)和两个色度编码块及相关语法结构，最大CU大小为CTU，最小CU大小为8×8。经过编码树划分得到的叶子节点CU根据预测方式的不同，可分为三种类型：帧内预测的intra CU、帧间预测的inter CU和skipped CU。skipped CU可以看作是inter CU的特例，不包含运动信息和预测残差信息。叶子节点CU包含一个或者多个预测单元(PU，Prediction Unit)，H.265/HEVC支持4×4到64×64大小的PU，一共有八种划分模式。对于帧内编码模式，可能的划分模式有两种：Part_2Nx2N和Part_NxN。对于预测残差信号，CU采用预测残差四叉树划分为变换单元(TU：Transform Unit)。一个TU包含一个亮度变换块(TB，Transform Block)和两个色度变换块。仅允许方形的划分，将一个CB划分为1个或者4个PB。同一个TU具有相同的变换和量化过程，支持的大小为4×4到32×32。与之前的编码标准不同，在帧间预测中，TB可以跨越PB的边界，以进一步最大化帧间编码的编码效率。

在H.266/VVC中，视频编码图像首先划分为跟H.265/HEVC相似的编码树单元CTU，但是最大尺寸从64×64提高到了128×128。H.266/VVC提出了四叉树和嵌套多类型树(MTT，Multi-Type Tree)划分，MTT包括二叉树(BT，Binary Tree)和三叉树(TT，Ternary Tree)，且统一了H.265/HEVC中CU、PU、TU的概念，并且支持更灵活的CU划分形状。CTU按照四叉树结构进行划分，叶子节点通过MTT进一步划分。多类型树叶子节点成为编码单元CU，当CU不大于最大变换单元(64×64)时，后续预测和变换不会再进一步划分。大部分情况下CU、PU、TU具有相同的大小。考虑到亮度和色度的不同特性和具体实现的并行度，H.266/VVC中，色度可以采用单独的划分树结构，而不必和亮度划分树保持一致。H.266/VVC中I帧的色度划分采用色度分离树，P帧和B帧色度划分则与亮度划分保持一致。

在此基础上，H.266/VVC还引入了被称为帧内子块划分的技术。帧内子块划分(intra sub-partition,ISP)是一种基于子块划分的帧内预测技术。当使用ISP模式时，一个编码块将继续被水平划分或竖直划分为多个(如2个或4个)相同大小的子块，每个子块依次解码重建。例如，对于一个16x8的当前块来说，可以水平被划分成4个16x2的子块，或者垂直划分成4个4x8子块。对于一个4x8块来说可以被划分成2个4X4块或者2个2x8的子块。可以注意到，子块的数目可以仅为2个(4x8，8x4的子块来说)。并且子块至少包含16个像素点，所以4x4块不会再被划分，也不需要在编码端和解码端进行相应的语法申明。具体划分规则如表三所示，至于是水平划分还是垂直划分，需要经过编码端RDO准则决策。为了节省编码时间，被划分的帧内子块的共享当前当前块的帧内预测模式(也即当前块划分得到的子块与当前块的帧内预测模式相同)。

示例性的，在某些实施方式中，待编码图像被划分成不重叠的多个CTU块。按照光栅扫描顺序依次处理每个CTU，将CTU按照不同方式划分成若干个CU。确定编码块划分方式的主要步骤如下：对于某一个CTU，使用常规的块划分方法(四叉树、三叉树、二叉树)进行块划分。对某种划分方式Split[i]，分别对每个CU进行不同预测模式的帧内预测，选出最优的常规帧内预测模式bestRegIntraMode[i]和预测代价bestRegIntraCost[i]。若某个CU的块尺寸满足ISP条件，继续对该CU进行ISP子划分，得到若干个子块，分别对每个子块做不同预测模式的帧内预测，选出最优预测模式bestIspIntraMode[i]和预测代价bestIspIntraCost[i]。选出当前划分方式的最优帧内预测模式bestIntraMode[i]和预测代价bestIntraCost[i]。采用其它方法(如帧间预测)进行预测，选出最优的预测模式bestOtherMode[i]和预测代价bestOtherCost[i]。比较bestRegIntraCost[i]、bestIspIntraCost[i]和bestOtherCost[i]，选出当前划分方式的最优预测模式bestMode[i]和预测代价bestCost[i]。遍历所有块划分方式，选出使当前CTU预测代价最小的块划分方式Split[opt]和相应的预测模式bestMode[opt]。最后，按照最优的块划分方式预测得到残差块，对残差块进行变换、量化、熵编码，对块划分模式、预测模式等预测信息进行编码，输出码流。

可以看到，这些可实现的H.266/VVC编解码方案中，即使只考虑四叉树划分，也有4 ⁵+4 ⁴+4 ³+4 ²+4 ¹+4 ⁰＝1365种划分模式，远远超过H.265/HEVC的341种模式。加上还有二叉树、三叉树划分方式，理论上总的划分次数则有几千种。因此，这些可实现的QTMT技术方案会导致H.266/VVC的编码复杂度远超过H.265/HEVC。如果再考虑帧内子块划分，编码复杂度将进一步提升。

下面结合图4A，对本公开的实施例提供的图像预测方法进行介绍。

步骤S401，获取帧内子块划分信息。

该帧内子块划分信息用于指示当前编码块是否使用帧内子块划分。

可以理解的是，在图像编码过程中，编码器接收视频流，该视频流由一系列图像帧组成，针对视频流中的每一帧图像进行视频编码，视频编码器对图像进行块划分，得到当前编码块。在一些实施例中，当前编码块也称为当前块、当前图像块、编码块、当前编码单元、当前待编码块、当前待编码的图像块等。对当前编码块还可以进行帧内子块划分。

进一步的，可以使用指示信息来指示是否对当前编码块进行帧内子块划分。示例性的，可以使用一个标志位来表示该帧内子块划分信息。当标志位取第一值时，表示当前块使用帧内子块划分，当标志位取第二值时，表示当前块不适用帧内子块划分。

进一步的，可以根据计算空域连续性参数得到所述帧内子块划分信息。所述空域连续性参数可以表示给定图像区域中像素点的变化连续性。

在某些实施例中，如果空域连续性参数大于或等于某阈值，则帧内子块划分信息指示当前块使用帧内子块划分。反之，如果连续性参数小于某阈值，则帧内子块划分信息指示当前块不使用帧内子块划分。

在另一些实施例中，如果空域连续性参数大于某阈值，则帧内子块划分信息指示当前块使用帧内子块划分。反之，如果连续性参数小于或等于某阈值，则帧内子块划分信息指示当前块不使用帧内子块划分。

在某些实施例中，给定图像区域可以是单幅图像、单个条带、单个编码树单元或者单个编码块。在另一些实施例中，给定图像区域可以是由多个空间相邻的条带、多个空间相邻的编码树单元、或者多个空间相邻的编码块组成的图像区域。可以理解的是，针对给定图像区域计算空域连续性参数的方法可以适用于以上各种可能的给定图像区域，本公开实施例对此不做限定。

结合图4B，本公开的实施例中，确定给定图像区域的空域连续性参数的方式包括但不限于如下方式：

通过梯度图确定图像区域的连续性参数，即上述步骤S401包括如下S401-A1和S401-A2的步骤：

S401-A1、确定给定图像区域的梯度图，以及该梯度图的梯度图；

S401-A2、根据该梯度图的梯度图，确定图像区域的连续性参数。

图像区域的梯度图可以反映出图像区域中像素点的变化趋势，图像区域的梯度图的梯度图可以反映出图像区域中像素点的变化率，即变化连续性。因此，在该方式中，通过计算图像区域的梯度图的梯度图来确定图像区域的连续性参数。

示例性的，根据如下公式(1)确定图像区域的梯度图Gmap：

Gmap(x,y)＝|I(x,y)-I(x+1,y)|+|I(x,y)-I(x,y+1)| (1)

其中，I(x，y)是图像区域I在位置(x,y)处的像素值，I(x+1，y)是图像区域I在位置(x+1,y)处的像素值，I(x，y+1)是图像区域I在位置(x,y+1)处的像素值，Gmap(x，y)为图像区域I中位置(x,y)处的像素点的梯度值。

示例性的，根据如下公式(2)确定图像区域的梯度图的梯度图GGmap：

GGmap(x,y)＝|Gmap(x,y)-Gmap(x+1,y)|+|Gmap(x,y)-Gmap(x,y+1)| (2)

其中，Gmap(x+1,y)为图像区域I中位置(x+1,y)处的像素点的梯度值，Gmap(x,y+1)为图像区域I中位置(x,y+1)处的像素点的梯度值，其中Gmap(x+1,y)和Gmap(x,y+1)可以根据上述公式(1)确定。GGmap(x，y)为图像区域I中位置(x,y)处的像素点的梯度值的梯度值。

上述公式(1)和公式(2)示出了确定图像区域I的像素点(x，y)的梯度值和梯度值的梯度值，图像区域I中的其他像素点参照像素点(x，y)的方式，确定出图像区域I中每个像素点的梯度值，得到图像区域I的梯度图Gmap。采用上述公式(2)对图像区域I的梯度图Gmap中每个像素点对应的梯度值再计算梯度值，得到图像区域I的梯度图的梯度图GGmap。

需要说明的是，上述公式(1)和公式(2)只是一种示例，本公开的实施例还可以采用其他的方式，确定图像区域的梯度图，以及梯度图的梯度图，例如对上述公式(1)和公式(2)进行变形，使用变形后的公式确定梯度图，以及梯度图的梯度图。

根据上述方式，确定出图像区域的梯度图的梯度图后，根据该梯度图的梯度图GGmap，确定图像区域的连续性参数。

本公开的实施例对上述S401-A2中根据该梯度图的梯度图，确定图像区域的连续性参数的方式不做限制。

在一种示例中，将图像区域的梯度图的梯度图中各梯度值的中值，确定为该图像区域的连续性参数。

在另一种示例中，将图像区域的梯度图的梯度图中梯度值的平均值，确定为该图像区域的连续性参数。

容易理解的是，帧内子块划分的根本原理是基于空域上的相关性，对编码块做更细的划分。由于划分得到的子块的相关性较强，可以进一步减少帧内预测的残差，从而提升压缩效率。显然，帧内子块划分在提升压缩率的同时会增加更多的块划分可能性，从而导致更多的率失真优化计算，大幅增加编码复杂度。而空域相关性较弱的视频图像，帧内子块划分带来的性能增益会很有限，但依然会大幅增加编码复杂度。

可见，根据计算空域连续性参数得到帧内子块划分信息，可以避免在空域相关性弱的图像区域进行不必要的帧内子块划分，降低了计算复杂度，从而提高了编码效率。且上述方式中，通过确定图像区域的梯度图的梯度图确定图像区域的连续性参数，计算方法简单准确，计算开销小，进一步提高了编码效率。

步骤S402，当所述帧内子块划分信息指示当前块使用帧内子块划分时，基于至少一个帧内子块划分，确定至少一个第一帧内预测模式以及所述至少一个第一帧内预测模式对应的预测代价。

对于可以进行帧内子块划分的编码块，其可以继续被划分为多个子块。应当说明的是，子块划分的方式不是唯一的，也就是说，对于当前块存在多种子块划分。为了对当前块进行预测编码，需要考虑所述多种子块划分分别的预测情况。

在某些实施例中，基于某种子块划分，分别使用不同的第一帧内预测模式对当前块进行预测。可以理解的是，对当前块的若干个子块，使用相同的第一帧内预测模式进行预测。即，基于某种第一帧内预测模式，依次对当前块的子块进行帧内预测，以得到当前块所有样本位置的预测值。

示例性的，可以采用的第一帧内预测模式包括但不限于平面模式Planar、直流模式DC、多种角度模式、矩阵加权帧内预测模式(Matrix weighted intra-frame prediction，MIP)等。

可以理解的是，通过每一种帧内预测模式对当前块进行预测，都可以计算得到该帧内预测的预测代价。预测代价通常用于表征使用预测模式完成编码时，码流开销和由于编码带来的图像失真的综合测度。常用的预测代价包括但不限于率失真代价等。

可见，基于某种子块划分，分别使用不同的第一帧内预测模式对当前块进行预测的同时，也将得到相应的多个预测代价。

步骤S403，确定至少一个第一其它预测模式以及所述至少一个第一其他预测模式对应的预测代价。

对于当前编码块，还可以分别采用多种其它预测模式进行预测。在某些实施例中，其它预测模式包括帧间预测模式，帧内帧间联合预测(Combined inter and intra prediction,CIIP)等。

可以理解的是，在采用帧间预测的帧中，帧内预测不是被禁止的。也就是说，对于P帧和B帧中的编码块，在确定其预测模式时需要同时考虑帧内和帧间预测模式。

类似的，通过每一种其它预测模式对当前块进行预测，都可以计算得到该其它预测的预测代价。预测代价通常用于表征使用预测模式完成编码时，码流开销和由于编码带来的图像失真的综合测度。常用的预测代价包括但不限于率失真代价等。

可见，分别使用不同的第一其它预测模式对当前块进行预测的同时，也将得到相应的多个预测代价。

步骤S404，确定至少一个第一帧内预测模式和至少一个第一其他预测模式中，预测代价最小的预测模式为当前块的编码预测模式，使用所述代价最小的预测模式对当前块进行预测。

不难理解，在步骤S402和步骤S403中，已经使用至少一个第一帧内预测模式和至少一个第一其它预测模式对当前块进行了预测，以得到这些预测模式分别对应的预测代价。容易想到的是，可以通过比较这些预测代价，确定在预测编码中实际使用的预测模式和预测代价，并基于该预测模式对当前块进行预测。

在某些实施例中，预测代价最小的预测模式被确定为在预测编码中使用的预测模式。

步骤S405，将所述帧内子块划分信息写入码流。

可以使用指示信息来指示是否对当前编码块进行帧内子块划分。实例性的，可以使用一个标志位来表示该帧内子块划分信息，所述标志位被写入码流。

在某些实施例中，该标志位是位于序列级的标志位，当标志位取第一值时，表示当前图像序列中，至少有一幅图像中的块使用帧内子块划分，当标志位取第二值时，表示图像序列中的所有块均不使用帧内子块划分。

在某些实施例中，该标志位是位于图像级的标志位，当标志位取第一值时，表示当前图像中，至少有一个条带中的块使用帧内子块划分，当标志位取第二值时，表示图像中的所有块均不使用帧内子块划分。

在某些实施例中，该标志位是位于条带级的标志位，当标志位取第一值时，表示当前条带中，至少有一个编码树单元中的块使用帧内子块划分，当标志位取第二值时，表示条带中的所有块均不使用帧内子块划分。

在某些实施例中，该标志位是位于编码树级的标志位，当标志位取第一值时，表示当前编码树单元中，至少有一个块使用帧内子块划分，当标志位取第二值时，表示编码树单元中的所有块均不使用帧内子块划分。

在某些实施例中，该标志位是位于块级的标志位，当标志位取第一值时，表示当前块使用帧内子块划分，当标志位取第二值时，表示当前块不使用帧内子块划分。

下面结合图5，对本公开的另一实施例提供的图像预测方法进行介绍。

步骤S501，获取帧内子块划分信息

可以理解的是，在图像编码过程中，编码器接收视频流，该视频流由一系列图像帧组成，针对视频流中的每一帧图像进行视频编码，视频编码器对图像帧进行块划分，得到当前编码块。在一些实施例中，当前编码块也称为当前块、当前图像块、编码块、当前编码单元、当前待编码块、当前待编码的图像块等。对当前编码块还可以继续进行帧内子块划分。

进一步的，可以使用指示信息来指示是否对当前编码块进行帧内子块划分。示例性的，可以使用一个标志位来表示所述帧内子块划分信息。当标志位取第一值时，表示当前块使用帧内子块划分，当标志位取第二值时，表示当前块不适用帧内子块划分。

本公开的实施例中，确定给定图像区域的空域连续性参数的方式可以使用与上述S401-A1和S401-A2相同的方式，在此不再赘述。即步骤S501包括S401-A1和S401-A2的步骤。

容易理解的是，帧内子块划分的根本原理是基于空域上的相关性，对编码块做更细粒的划分。由于划分得到的子块的相关性较强，可以进一步减少帧内预测的残差，从而提升压缩效率。显然，帧内子块划分在提升压缩率的同时会增加更多的块划分可能性，从而导致更多的率失真优化计算，大幅增加编码复杂度。而空域相关性较弱的视频图像，帧内子块划分带来的性能增益会很有限，但依然会大幅增加编码复杂度。

可见，根据计算空域连续性参数得到帧内子块划分信息，可以避免在空域相关性弱的图像区域进行不必要的帧内子块划分，降低了计算复杂度，从而提高了编码效率。且上述方式中，通过确定图像区域的梯度图的梯度图确定图像区域的连续性参数，计算方法简单准确，计算开销小，进一步提高了编码效率

步骤S502，当所述帧内子块划分信息指示当前块不使用帧内子块划分时，确定至少一个第二帧内预测模式以及所述至少一个第二帧内预测模式对应的预测代价。

对于不进行帧内子块划分的编码块，由于不再继续被划分为多个子块，该块做为一个整体进行预测编码。

在某些实施例中，分别使用不同的第二帧内预测模式对当前块进行预测。示例性的，可以采用的第二帧内预测模式包括但不限于平面模式Planar、直流模式DC、多种角度模式、矩阵加权帧内预测模式(Matrix weighted intra-frame prediction，MIP)等。

可以理解的是，通过每一种第二帧内预测模式对当前块进行预测，都可以计算得到所述第二帧内预测的预测代价。预测代价通常用于表征使用预测模式完成编码时，码流开销和由于编码带来的图像失真的综合测度。常用的预测代价包括但不限于率失真代价等。

可见，分别使用不同的第二帧内预测模式对当前块进行预测的同时，也将得到相应的多个预测代价。

步骤S503，确定至少一个第二其它预测模式以及该至少一个第二其他预测模式对应的预测代价。

对于当前编码块，还可以分别采用多种第二其它预测模式进行预测。在某些实施例中，第二其它预测模式包括帧间预测模式，帧内帧间联合预测等。

类似的，通过每一种第二其它预测模式对当前块进行预测，都可以计算得到所述第二其它预测的预测代价。预测代价通常用于表征使用预测模式完成编码时，码流开销和由于编码带来的图像失真的综合测度。常用的预测代价包括但不限于率失真代价等。

可见，分别使用不同的第二帧其它测模式对当前块进行预测的同时，也将得到相应的多个预测代价。

步骤S504，确定至少一个第二帧内预测模式和至少一个第二其他预测模式中，预测代价最小的预测模式为当前块的编码预测模式，使用所述代价最小的预测模式对当前块进行预测。

不难理解，在步骤S502和步骤S503中，已经使用至少一个第二帧内预测模式和至少一个第二其它预测模式对当前块进行了预测，以得到这些预测模式分别对应的预测代价。容易想到的是，可以通过比较这些预测代价，确定在预测编码中实际使用的预测模式和预测代价，并基于该预测模式对当前块进行预测。

步骤S505，将所述帧内子块划分信息写入码流。

下面结合图6，对本公开的再一实施例提供的图像预测方法进行介绍。

步骤S601，获取待编码图像帧，计算图像帧的空域连续性参数，所述空域连续性参数可以表示给定图像区域中像素点的变化连续性。

本公开的实施例中，确定给定图像区域的空域连续性参数的方式包括但不限于如下方式：

通过梯度图确定图像区域的连续性参数：

确定给定图像区域的梯度图，以及该梯度图的梯度图；

根据该梯度图的梯度图，确定图像区域的连续性参数。

示例性的，根据如下公式(1)确定图像区域的梯度图Gmap：

Gmap(x,y)＝|I(x,y)-I(x+1,y)|+|I(x,y)-I(x,y+1)| (1)

GGmap(x,y)＝|Gmap(x,y)-Gmap(x+1,y)|+|Gmap(x,y)-Gmap(x,y+1)| (2)

本公开的实施例对上述SZ01-A2中根据该梯度图的梯度图，确定图像区域的连续性参数的方式不做限制。

步骤S602，判断连续性参数是否大于等于预定阈值，如果是执行步骤S603，如果不是执行步骤S604

步骤S603，对于待编码图像帧内的待编码块，确定帧内子块划分信息指示待编码块使用帧内子块划分，基于对待编码块的帧内子块划分，确定预测代价最小的预测模式。

可以理解的是，基于帧内子块划分，确定预测代价最小的预测模式的方式，可以使用与上述S402-S404相同的方式，在此不再赘述。

步骤S604，对于待编码图像帧内的待编码块，确定帧内子块划分信息指示待编码块不使用帧内子块划分，所述待编码块做为一个整体进行预测编码，确定预测代价最小的预测模式。

可以理解的是，所述待编码块做为一个整体进行预测编码，确定预测代价最小的预测模式的方式，可以使用与上述S502-S504相同的方式，在此不再赘述。

步骤S605，使用预测代价最小的预测模式对待编码快进行预测，使用步骤S603或步骤S604确定的预测代价最小的预测模式对待编码快进行预测。

步骤S606，将所述帧内子块划分信息写入码流，可以使用指示信息来指示是否对当前编码块进行帧内子块划分。实例性的，可以使用一个标志位来表示该帧内子块划分信息，所述标志位被写入码流。

可以理解的是，在一些实施例中，由于空域连续性参数是针对单幅待编码图像计算的。因此该标志位是位于图像级的标志位，当标志位取第一值时，表示当前图像中，至少有一个编码树单元中的块使用帧内子块划分，当标志位取第二值时，表示图像中的所有编码树单元均不使用帧内子块划分。

在另一些实施例中，计算空域连续性参数的给定图像区域还可以是单个条带、单个编码树单元或者单个编码块。因此，用于表示帧内子块划分信息的标志位也可以位于条带级、编码树级、块级。

本公开还提供了一种视频编码设备，包括处理器以及存储有可在所述处理器上运行的计算机程序的存储器，其中，所述处理器执行所述计算机程序时实现如本公开任一实施例所述的视频编码方法。

本公开还提供了一种计算机存储介质，其上存储有计算机程序，该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说，本公开的实施例还提供一种包含指令的计算机程序产品，该指令被计算机执行时使得计算机执行上述方法实施例的方法。

当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本公开的实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，该单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。例如，在本公开的各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

以上内容，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开的揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的的保护范围之内。因此，本公开的保护范围应以该权利要求的保护范围为准。

Claims

一种图像预测方法，其特征在于，包括：

获取帧内子块划分信息，当所述帧内子块划分信息指示当前块使用帧内子块划分时，

基于至少一个帧内子块划分，确定至少一个第一帧内预测模式以及该至少一个第一帧内预测模式对应的预测代价，

确定至少一个第一其它预测模式以及该至少一个第一其它预测模式对应的预测代价，

确定至少一个第一帧内预测模式和至少一个第一其他预测模式中，预测代价最小的预测模式为当前块的编码预测模式，使用所述预测代价最小的预测模式对当前块进行预测，

其中，所述帧内子块划分信息是根据计算空域连续性参数得到的，且所述帧内子块划分信息被写入码流。
根据权利要求1所述的预测方法，其特征在于，

当所述帧内子块划分信息指示当前块不使用帧内子块划分时：

确定至少一个第二帧内预测模式以及所述至少一个第二帧内预测模式对应的预测代价，

确定至少一个第二其它预测模式以及所述至少一个第二其它预测模式对应的预测代价，

确定至少一个第二帧内预测模式和至少一个第二其它预测模式中，预测代价最小的预测模式为当前块的编码预测模式，使用所述预测代价最小的预测模式对当前块进行预测。
根据权利要求1或2所述的预测方法，其特征在于，所述计算空域连续性参数包括：

计算给定图像区域的第一梯度图，计算所述第一梯度图的梯度图，得到第二梯度图，取所述第二梯度图的平均值为所述空域连续性参数。
根据权利要求3所述的预测方法，其特征在于，所述给定图像区域为单个图像、单个条带、单个编码树块或单个编码块，所述当前块位于所述给定图像区域内。
根据权利要求1所述的预测方法，其特征在于，所述帧内子块划分信息在码流中位于序列级、图像级、条带级、编码树级或块级。
根据权利要求1或2所述的预测方法，其特征在于，所述至少一个第一其它预测模式包括帧间预测或帧内帧间联合预测。
根据权利要求1或2所述的预测方法，其特征在于，所述至少一个第二其它预测模式包括帧间预测或帧内帧间联合预测。
一种图像预测装置，其特征在于，包括处理器和存储器；

所示存储器用于存储计算机程序；

所述处理器用于调用并运行所述存储器中存储的计算机程序，以实现如上述权利要求1至7任一项所述的方法。
一种计算机可读存储介质，其特征在于，用于存储计算机程序；

所述计算机程序使得计算机执行如上述权利要求1至7任一项所述的方法。