WO2023082107A1

WO2023082107A1 - 解码方法、编码方法、解码器、编码器和编解码系统

Info

Publication number: WO2023082107A1
Application number: PCT/CN2021/129862
Authority: WO
Inventors: 徐陆航
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-11-10
Filing date: 2021-11-10
Publication date: 2023-05-19

Abstract

本申请实施例提供了一种解码方法、编码方法、解码器、编码器和编解码系统。该解码方法包括：从码流中获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；从码流中获取第一当前块的第一特征信息，所述第一特征信息的元素是根据二值化方式进行处理得到的；获取已重建像素的重建值；将所述第一特征信息和所述重建值输入自编码器的解码网络，得到所述第一当前块的第一预测值。通过采用二值化方式，对自编码器的编码网络输出的数据类型为浮点数的特征信息直接进行取整量化，可以灵活的进行帧内预测，并且有助于提高视频编解码性能，以及提升视频编解码的效率。

Description

解码方法、编码方法、解码器、编码器和编解码系统

技术领域

本申请实施例涉及视频编解码领域，并且更具体地，涉及解码方法、编码方法、解码器、编码器和编解码系统。

背景技术

数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够节省不少视频数据，但目前仍然需要追求更好的数字视频压缩技术，以减少数字视频传输的带宽和流量压力。

目前，联合视频研究组(Joint Video Exploration Team，JVET)提出了下一代视频编码标准H.266/多功能视频编码(Versatile Video Coding，VVC)。如何进一步提高视频编解码的性能是亟待解决的问题。

发明内容

本申请实施例提供了一种解码方法、编码方法、解码器、编码器和编解码系统，能够有助于提高视频编解码性能，以及提升视频编解码的效率。

第一方面，提供了一种解码方法，该方法包括：

从码流中获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

从所述码流中获取第一当前块的第一特征信息；

获取已重建像素的重建值；

将所述第一特征信息和所述重建值输入自编码器的解码网络，得到所述第一当前块的第一预测值。

可选的，所述第一特征信息的元素是根据二值化方式进行处理得到的。

第二方面，提供了一种编码方法，其特征在于，包括：

确定第一当前块的符合自编码器的编码网络输出的特征信息的元素的特征信息组合，其中，所述特征信息的元素是根据二值化取值方式确定的；

对所述特征信息组合与预先配置的帧内预测模式进行率失真代价比较，确定所述第一当前块的帧内预测模式参数；

根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值；

将所述帧内预测模式参数写入码流。

第三方面，提供了一种训练模型的方法，包括：

获取第一训练样本集，所述第一训练样本集包括第一样本图像；

将所述第一训练样本集输入自编码器，得到所述第一样本图像的当前块的预测值，其中，所述自编码器包括编码网络和解码网络，所述编码网络用于提取所述当前块的特征信息，所述解码网络用于根据已重建像素值和所述特征信息，得到所述预测值；

根据所述预测值和所述当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。

第四方面，提供了一种解码器，包括：

获取单元，用于从码流获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

所述获取单元还用于从所述码流中获取第一当前块的第一特征信息；

所述获取单元还用于获取已重建像素的重建值；

自编码器，包括解码网络，用于将所述第一特征信息和所述重建值输入所述解码网络，得到所述第一当前块的第一预测值。

第五方面，提供了一种编码器，包括：

处理单元，用于确定第一当前块的符合自编码器的编码网络输出的特征信息的元素的特征信息组合，其中，所述特征信息的元素是根据二值化取值方式确定的；

所述处理单元还用于对所述特征信息组合与预先配置的帧内预测模式进行率失真代价比较，确定所述第一当前块的帧内预测模式参数；

帧内预测单元，用于根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值；

预测模式参数编码单元，用于将所述帧内预测模式参数写入码流。

第六方面，提供了一种训练模型的装置，包括：

获取单元，用于获取第一训练样本集，所述第一训练样本集包括第一样本图像；

自编码器，用于将所述第一训练样本集输入所述自编码器，得到所述第一样本图像的当前块的预测值，其中，所述自编码器包括编码网络和解码网络，所述编码网络用于提取所述当前块的特征信息，所述解码网络用于根据已重建像素值和所述特征信息，得到所述预测值；

处理单元，用于根据所述预测值和所述当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

所述处理单元还用于根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

所述处理单元还用于根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。

第七方面，提供了一种电子设备，包括处理器和存储器。该存储器用于存储计算机程序，该处理器用于调用并运行该存储器中存储的计算机程序，执行上述第一方面或第二方面或第三方面中的方法。

第八方面，提供了一种编解码系统，其特征在于，包括第四方面的解码器和第五方面的编码器。

第九方面，提供了一种芯片，包括：处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如上述第一方面或第二方面或第三方面的方法。

第十方面，提供了一种计算机可读存储介质，用于存储计算机程序，该计算机程序使得计算机执行上述第一方面或第二方面或第三方面中的方法。

第十一方面，提供了一种计算机程序产品，包括计算机程序指令，所述计算机程序指令使得计算机执行上述第一方面或第二方面或第三方面的方法。

第十二方面，提供了一种计算机程序，当其在计算机上运行时，使得计算机执行上述第一方面或第二方面或第三方面的方法。

通过上述技术方案，在使用自编码器模式确定帧内预测值时，通过采用二值化取整方式，对自编码器的编码网络输出的数据类型为浮点数的特征信息直接进行取整量化，从而可以灵活的进行帧内预测，并且有助于提高视频编解码性能，以及提升视频编解码的效率。

附图说明

图1是本申请实施例提供的编码器的示意性框图；

图2是本申请实施例提供的解码器的示意性框图；

图3是H.266/VVC的帧内预测模式的一个示例；

图4是MIP生成预测值的过程的一个示例；

图5是根据本申请实施例的编码网络提取特征信息的一个示意图；

图6是根据本申请实施例的解码网络获取预测信号的一个示意图；

图7是一种Sigmoid激活函数的一个示意图；

图8是另一种Sigmoid激活函数的一个示意图；

图9是本申请实施例提供的一种解码方法的示意性流程图；

图10是本申请实施例提供的一种编码方法的示意性流程图；

图11是本申请实施例提供的一种训练模型的方法的示意性流程图；

图12是本申请实施例提供的一种解码器的示意性框图；

图13是本申请实施例提供的一种编码器的示意性框图；

图14是本申请实施例提供的一种训练模型的装置的示意性框图；

图15是本申请实施例提供的电子设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。针对本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

本申请适用于视频编解码领域。首先，结合图1和图2对本申请实施例的可适用的编解码框架进行说明。其中，该编解码框架为目前统一的视频编解码标准采用的基于块的混合编解码框架，例如 VTM8的通用编解码框架。

图1是本申请实施例提供的编码器100的示意性框图。如图1所示，编码器100可以包括预测单元110、变换、量化单元120、反量化、逆变换单元130、环路滤波单元140、解码图片缓存(Decoded Picture Buffer，DPB)单元150和熵编码单元160。

可选的，在编码器100中，一个视频片，一帧图片或一系列图片会被划分成以编码树单元(coding tree unit，CTU)的基本单元，以此为基础进一步被划分成以更小的编码单元(Coding Unit，CU)为单位的块。CU可能还会被划分预测单元(prediction unit，PU)等，不做限定。编码块可以被传送到预测单元110。通常，预测单元110可以包括运动估计(estimation)和补偿(compensation)单元111和帧内预测单元112组成。预测单元102可使用运动估计和补偿单元111获取当前块(例如CU)的帧间预测值。帧内预测单元112可使用获取当前块的帧内预测值，例如基于导出模式方式获取帧内预测值等。

由于视频的一个帧中的相邻像素之间存在很强的相关性，在视频编解码技术中使用帧内预测的方法能够有助于消除相邻像素之间的空间冗余。由于视频中的相邻帧之间存在着很强的相似性，在视频编解码技术中使用帧间预测方法能够有助于消除相邻帧之间的时间冗余，从而提高编码效率。

预测单元110输出当前块的预测值，之后可以使用加法器计算当前块的原始值和当前块的预测值之间的差值，即残差值。变换、量化单元120可以读取残差值并对残差值执行一个或多个变换操作以获取系数，进一步对系数进行量化并输出量化系数(即水平)。反量化、逆变换单元130对量化系数执行缩放操作以输出重构系数，进一步可以执行一个或多个逆变换并输出残差值。然后，可以使用加法器对反量化、逆变换单元130输出的残差值和来自预测单元110的当前块的预测值相加而计算出重建值。还可以将重建值输出到预测单元110以用作帧内预测参考。在图像片中的所有块被重建之后，环路滤波单元140对重建图像执行环路滤波。

环路滤波单元140的输出是解码图像，这些解码图像缓存至解码图片缓存(Decoded Picture Buffer，DPB)单元150。DPB单元150根据时序和控制信息输出解码图像。这里，存储在DPB单元150中的图片还可用作预测单元110执行帧间预测或帧内预测的参考。最后熵编码单元160将来自编码器100中解码图片所必需的参数(比如块划分信息，预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息等)写入码流中，即编码器100最终输出码流。

进一步地，编码器100可以是具有处理器和包括计算机程序的存储器。当处理器读取并运行计算机程序时，编码器100读取输入视频并生成对应的码流。另外，编码器100还可以是具有一个或多个芯片的计算设备。在芯片上实现为集成电路的这些单元具有与图1中相应单元类似的连接和数据交换功能。

图2是本申请实施例提供的一种解码器200的示意性框图。如图2所示，该解码器200可以包括：解析单元210、预测单元220、缩放、变换单元230、环路滤波单元240和解码图片缓存单元250。

其中，解码器200的输入码流可以是编码器100所输出的码流。解析单元210对输入码流进行解析，例如根据已有信息进行分析确定与编码端相同的块划分信息，预测、变换、量化、熵编码、环路滤波等模式信息或者参数信息，从而保证编码端获得的重建图像和解码端获得的解码图像相同。解析单元210将获取的信息发送到解码器200中的单元，例如预测单元220和缩放单元230。

预测单元220确定当前解码块(例如CU或PU)的预测值。这里，预测单元220可以包括运动估计和补偿单元221和帧内预测单元222。具体地，当指示帧间解码模式用于对当前解码块进行解码时，预测单元220将来自解析单元210的相关参数传递到运动估计和补偿单元221以获取帧间预测值；当指示帧内预测模式用于对当前解码块进行解码时，预测单元220将来自解析单元210的相关参数传送到帧内预测单元222以获取帧内预测值。

缩放、变换单元230对来自解析单元210的量化系数(即水平)执行缩放操作以获取重构系数，并执行一个或多个变换操作以获取残差值。可以使用加法器对来自预测单元220的预测值和来自缩放、变换单元230的残差值执行相加操作以获取当前解码块的重建值。重建值还可以发送到预测单元220以用作在帧内预测模式下编码的其它块的参考。

在图像中的所有块被重建之后，环路滤波单元240对重建图像执行环路滤波。这里，环路滤波单元240的输出是解码图像，解码图像缓存至解码图像缓存单元250。解码图像缓存单元250根据时序和控制信息输出解码图像。存储在解码图像缓存单元250中的图像还可用作通过预测单元220执行帧间预测或帧内预测的参考。

进一步地，解码器200可以是具有处理器和包括计算机程序的存储器。当处理器读取并运行计算机程序时，解码器200读取输入码流并生成对应的解码视频。另外，解码器200还可以是具有一个或多个芯片的计算设备。在芯片上实现为集成电路的这些单元具有与图2中相应单元类似的连接和数据交换功能。

需要说明的是，以上结合图1或图2描述了基于块的混合编码框架下的视频编解码器的基本流程，该编解码框架或基本流程仅用于说明本申请实施例而非限定。例如，随着技术的发展，该框架或流程的一些模块或步骤可能会被优化。在具体实施时，可以根据实际需要灵活地应用本申请实施例提供的技术方案。

在本申请实施例中，当前块(current block)即当前编码块，指的是当前编码单元CU，或预测单元PU，或者其他编码块，不做限定。

为便于更好的理解本申请实施例，对本申请实施例涉及的帧内预测模式进行说明。

在编码器100的帧内预测单元112或解码器200的帧内预测单元222中，通常借助各种角度模式与非角度模式对当前编码块进行预测得到预测值，根据预测值与原始块计算得到的率失真信息，筛选出当前编码单元的预测模式，后将该预测模式经码流传输到解码端。解码端解析出预测模式，预测得到当前解码块的预测图像并叠加经码流传输而来的残差像素，即可得到重建图像。经过历代的数字视频编解码标准发展，非角度模式保持相对稳定，有均值模式和平面(Planar)模式；角度模式则随着数字视频编解码标准的演进而不断增加，以国际数字视频编码标准H系列为例，H.264/AVC标准仅有8种角度预测模式和1种非角度预测模式；H.265/HEVC扩展到33种角度预测模式和2种非角度预测模式；在H.266/VVC中，帧内预测模式有Planar模式，DC模式和65种角度模式，图3示出了H.266/VVC的67中帧内预测模式的示意图。其中，对于亮度分量有矩阵加权帧内预测(Matrix-weighted Intra Prediction，MIP)模式，对于色度分量，有交叉分量线性模型(Cross Component Linear Model，CCLM)预测模式。

在MIP技术中，对于一个宽度为W，高度为H的矩形预测块，MIP会选取该块上方一行的W个重建像素点和左侧一列的H个重建像素点作为输入。如果这些位置的像素还未被重建，则未重建位置的像素会被置为默认值，例如对于10bit的像素，填充的默认值为512。MIP产生预测值主要基于三个步骤，如图4所示，分别是：(1)参考像素取均值，比如对当前块上方的一行像素点(表示为bdry _top)和当前块左侧的一行像素点(表示为bdry _left)取均值得到参考像素均值(表示为bdry _red)；(2)矩阵向量相乘，比如A _k·bdry _red+b _k,其中，A _k是训练好的第k个权重矩阵，b _k是训练的第k个偏置值；(3)线性插值上采样。

MIP作用于4x4至64x64大小的块。对于一个长方形的预测块，MIP模式会根据矩形边长来选择合适的预测矩阵。例如，对于短边为4的矩形，共有16套矩阵参数供选择；对于短边为8的矩形，共有8套矩阵参数供选择；其他矩形，共有6套矩阵参数供选择。MIP会利用供选择的矩阵进行预测，代价最小的一个矩阵的索引将会写入码流供解码端读取矩阵参数用于预测。

在一些实施例中，将基于自编码器的帧内预测作为帧内预测模式的一种移植进传统编解码器。针对不同大小的编码块可以分别训练出多种自编码器。

为便于更好的理解本申请实施例，下面对本申请实施例涉及的自编码器进行说明。

自编码器包括一组编码网络(g _a)和解码网络(g _s)。图5示出了利用编码网络提取特征信息的过程的一个示意图，图6示出了利用解码网络得到预测信号的过程的一个示意图。其中，图5和图6以一个4×4的块为例进行说明。

如图5所示，4×4的块X中的原始像素经过预处理(包括但不限于去均值、归一化、重排列)得到

将

输入非线性的编码网络g _a得到特征信息(feature)q，非线性编码网络g _a可以包括卷积层、全连接层和非线性激活函数等，不做限定。如图6所示，4×4的块周围已重建的像素值R经过预处理(包括但不限于去均值、归一化、重排列等)得到

和特征信息q输入非线性的解码网络g _s得到

经过后处理(包括但不限于加均值，去归一化，重排列等)得到预测信号Y。非线性解码网络g _s可以包括卷积层，全连接层和非线性激活函数等，不做限定。

在编码端，在符合解码端所描述的语法元素设计的情况下，将可能的特征信息组合与其他帧内预测模式一同进行率失真代价比较，代价最小的模式作为当前块所选中的帧内预测模式。如果代价最小的模式为自编码器模式，则需要进一步编码相关的特征信息语法元素。

在解码端，解码器解析当前块的语法元素，当解析到当前块的帧内预测模式选中自编码器帧内预测模式时，进一步从码流中解析出当前块的特征信息。在解码的预测阶段，通过当前块周围的已重建像素与解码出的feature信息对当前块使用自编码器的解码网络进行预测，得到预测信号。

在自编码器的处理过程中，特征信息的数据类型为浮点型。但是，在使用自编码器进行编解码时，由于特征信息需要存入码流，因此特征信息需要量化为整数。考虑到网络的鲁棒性，需要自编码器训练过程中的特征信息尽可能与实际使用时相近，因此在自编码器训练过程中需要将特征信息量化为整数。

作为一种可能的实现方式，可以通过激活函数限制编码网络的输出范围。一个示例，图7中的Sigmoid激活函数可以将编码网络的输出范围限制在0～1之间，其中该Sigmoid的计算公式如下：

另一个示例，图8中的Sigmoid激活函数可以将编码网络的输出范围限制在-1～1之间，其中该Sigmoid的计算公式如下：

其中，对于图8，公式(2)中的n取值为10。

以连续分布的，经过图7中的Sigmoid激活函数输出的范围为0～1的浮点数为例，取整结果可为0或1。对于这样的取整后的数，可以使用一位二元符号表示。并且，该一位二元符号可以写入码流或从码流中读取。

以连续分布的，经过图8中Sigmoid激活函数输出的范围为-1～1的浮点数为例，取整结果可为-1,0或1。对于这样的取整后的数，可以首先用一位二元符号表示取整后的数是否为0；若不是0，则再用一位二元符号表示该取整后的数的正负。并且，该一位二元符号或二位二元符号可以写入码流或从码流中读取。例如编写或读取0表示0，编写或读取10表示-1，编写或读取11表示1。

在一些实施例中，可以通过对激活函数的输出乘a和/或加b的形式，对激活函数的输出进行放大或缩小。例如可以在图7中的Sigmoid激活函数输出的结果上乘2，则可以使限制的范围从0～1变为0～2；进一步可以在该Sigmoid激活函数输出的结果上乘2后减1，则可以使限制的范围从0～1变为-1～1。这样的操作可以使激活函数的输出满足特定的编码方法。

作为一种可能的实现方式，可以对经过激活函数后的限定取值范围的输出结果通过如下两种方式取整：

1)通过加上随机分布的(-0.5,05)的噪声；

2)对浮点数进行四舍五入取整。

在上述两种取整方式的反向传播过程中，方式2)的梯度需要进行重新定义。通常，可以将方式2)的梯度定义为1。示例性的，以Sigmoid激活函数限制编码网络的输出范围为例，正向传播可以表示为如下公式：

反向传播可以表示为如下公式：

B′(x)＝S′(x) (4)

其中，B(x)表示取整数运算，S(x)表示Sigmoid函数，

表示四舍五入运算。可以看到，在公式(4)中，反向传播时B(x)的梯度为S(x)的梯度，即S′(x)·1。

可以看到，上述取整方式1)和方式2)中，需要通过激活函数对编码网络的输出的取值范围进行限定，并且只能在限定范围的输出结果上执行方式1)或方式2)的取整操作。另外，本申请实施例提供了一种编解码方案，可以采用二值化方式(也可以称为二值化取整方式)，对自编码器的编码网络输出的数据类型为浮点数的特征信息直接进行取整量化，从而可以灵活地进行帧内预测。

以下结合附图详细描述本申请实施例提供的编码方法和解码方法。

图9示出了本申请实施例提供的一种解码方法300的示意性流程图。方法300可以应用于解码器，例如图2中的解码器200。进一步的，方法300可以应用于解码器200中的帧内预测单元222。如图9所示，方法300包括步骤310至步骤340。

310，从码流中获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值。

示例性的，可以由图2中的解析单元210从码流中获取帧内预测模式参数。例如，可以获取当前块的预测模式参数，该预测模式参数用于指示使用自编码器模式确定该当前块的帧内预测值。本申请实施例中，当前块可以指当前正在进行编码的块或编码块，例如当前CU、当前PU或其他等，不做限定。当前块也可以替换为“编码块”、“块”、“当前编码块”等，均可以表示相同或相似的含义。

在一些实施例中，编码器可以确定当前块是否使用自编码器模式。可选的，编码器可以在码流中传输指示当前块是否使用自编码器模式的信息，即预测模式参数。示例性的，在符合解码端所描述的语法元素设计的情况下，将可能的特征信息组合与其他帧内预测模式一同进行率失真代价比较，代价最小的模式作为当前块所选中的帧内预测模式。如果代价最小的模式为自编码器模式，则可以确定当前块使用自编码器确定当前块的帧内预测值。可选的，编码器还需要进一步编码相关的特征信息语法元素。否则，编码器确定当前块不使用自编码器模式来预测当前块的帧内预测值。

在一些实施例中，解码器可以确定当前块是否使用自编码器模式。例如，解码器可以获取输入码流，并从该码流中获取指示当前块是否使用自编码器模式的信息，即预测模式参数。本申请书实施例中，预测模式参数用于指示当前块使用自编码器模式确定当前块的帧内预测值。在另一些实施例中，预测模式参数可以指示当前块使用其他帧内预测模式确定当前块的帧内预测值，例如上文中的MIP模式等，不做限定。

320，从所述码流中获取第一当前块的第一特征信息。可选的，所述第一特征信息的元素是根据二值化方式进行处理(即取整)得到的。

示例性的，当解码器在确定第一当前块的预测模式参数指示使用自编码器模式确定帧内预测值时，解析单元210可以进一步从码流中解析第一当前块的第一特征信息。本申请实施例中，该第一特征信息是(比如解码端)根据二值化方式对自编码器的编码网络输出的特征信息进行取整得到的。作为示例，第一当前块可以为当前CU，或当前PU，不做限定。

示例性的，解码端可以将第一当前块(即第一当前块的原始像素)输入自编码器的编码网络，通过该编码网络对第一当前块进行特征提取，得到该编码网络输出的特征信息，然后对该编码网络输出的特征使用二值化方式进行取整，得到上述第一特征信息。

作为示例，编码网络可以为非线性编码网络，例如可以包括至少一个卷积层、全连接层和非线性激活函数等，不做限定。可选的，在将第一当前块输入编码网络之前，可以对该第一当前块进行预处理(比如通过第一预处理模块进行预处理)，例如包括但不限于去均值、归一化、重排列等，不做限定。作为示例，利用编码网络得到特征信息的过程可以参见图6中的描述。

在一些可选的实施例中，在编码网络输出的特征信息小于0的情况下，使用二值化方式对该小于0的特征信息进行取整，可以得到第一特征信息为-1。

在编码网络输出的特征信息大于或等于0的情况下，使用二值化方式对该大于或等于0的特征信息进行取整，可以得到第一特征信息为1。

示例性的，该二值化方式可以为下述公式(3)：

其中，x表示输入值，例如可以为自编码器中的编码网络的输出结果，f(x)表示对x的取整结果，例如可以为上述第一特征信息。

也就是说，本申请实施例中，该第一特征信息的元素可以为-1或1，其中，该元素为-1表示编码网络输出的特征信息小于0，该元素为1表示所述编码网络输出的特征信息大于或等于0。

因此，本申请实施例中，通过采用二值化方式，对自编码器的编码网络输出的数据类型为浮点数的特征信息直接进行取整量化，而不需要使用激活函数对编码网络的输出的取值范围进行限制，从而可以灵活的进行帧内预测。

需要说明的是，本申请实施例以二值化方式中取整结果中的元素为-1或1为例进行描述，但是本申请实施例并不限于此，即该元素还可以为其他取值，例如0，或者2，-2等，这些都落入本申请实施例的保护范围。

在一些可选的实施例中，对所述第一特征信息的元素编码后得到的语法元素包括二元码0或1。也就是说，从码流中得到的第一特征信息的语法元素为二元码0或1。示例性的，第一特征信息的语法元素为0可以对应元素为-1，语法元素为1可以对应元素为1，或者反之，不做限定。

330，获取已重建像素的重建值。

示例性的，已重建像素例如包括第一当前块的上方、左侧、左上、左下、右上方的至少一行像素中的至少部分像素点。

在一些示例中，已重建像素可以包括当前块的邻近的参考行的重建像素，本申请对此不做限定。

340，将所述第一特征信息和所述重建值输入自编码器的解码网络，得到所述第一当前块的第一预测值。

示例性的，解码网络可以为非线性解码网络，例如可以包括至少一个卷积层、全连接层和非线性激活函数等，不做限定。可选的，在获取已重建像素的重建值后，可以对该重建值进行预处理(例如通过第二预处理模块进行预处理)，例如包括但不限于去均值、归一化、重排列等，不做限定。可选的，对于解码网络输出的预测信号，可以进行后处理(例如通过后处理模块进行预处理)，例如包括但不限于去均值、归一化、重排列等，不做限定。作为示例，利用解码网络得到预测值的过程可以参见图6中的描述。

因此，本申请实施例在使用自编码器模式确定帧内预测值时，通过采用二值化方式，对自编码器的编码网络输出的数据类型为浮点数的特征信息直接进行取整量化，而不需要使用激活函数对编码网络的输出的取值范围进行限制，从而可以灵活的进行帧内预测，进而可以有助于提高视频编解码性能，以及提升视频编解码的效率。

在一些可选的实施例中，在使用自编码器进行帧内预测之前，需要对解码端或编码端的自编码器进行训练。在训练自编码器的过程中，可以使用上述二值化方式，对自编码器中的编码网络输出的特征信息进行取整。

作为训练自编码器的一种可能的实现方式，可以获取第一训练样本集，该第一训练样本集包括第一样本图像；将该第一训练样本集输入自编码器中的编码网络，得到该编码网络输出的第一样本图像的第二当前块的特征信息。然后，根据二值化方式，对编码网络输出的第二当前块的特征信息进行取整，得到第二当前块的第二特征信息。之后，可以将该第二特征信息和第一样本图像的已重建像素的重建值输入自编码器中的解码网络，得到第二当前块的第二预测值。最后，可以根据第二预测值和第二当前块的原始值，对编码网络和/或解码网络的参数进行更新。作为示例，第二当前块可以为当前CU，或当前PU，不做限定。

在一些可选的实施例中，在编码网络输出的第二当前块的特征信息小于0的情况下，上述第二特征信息为-1；在上述编码网络输出的所述第二当前块的特征信息大于或等于0的情况下，所述第二特征信息为1。具体的，二值化方式可以参考步骤320中的描述，不再赘述。

在一些可选的实施例中，作为一种参数进行更新的方式，可以根据上述第二预测值和第二当前块的原始值，利用反向传播算法，对编码网络和/或解码网络的参数进行更新，其中，该二值化方式的反向传播的梯度是根据所述编码网络输出的所述第二当前块的特征信息的取值确定的。这里，该编码网络输出的第二当前块的特征信息是未进行取整的特征信息，即取整之前的特征信息。

作为一种可能的实现方式，在编码网络输出的第二当前块的取整前的特征信息大于1或小于-1的情况下，该二值化方式的反向传播的梯度定义为0；在编码网络输出的第二当前块的取整前的特征信息小于或等于1，且大于或等于-1的情况下，该二值化方式的反向传播的梯度定义为1。

示例性的，该二值化方式的反向传播的梯度可以为下述公式(4)：

其中，x表示输入值，例如可以为自编码器中的编码网络的输出结果，f′(x)表示f(x)的反向传播的梯度。

在上述公式(4)中，为了防止在x>1或x<-1时，反向传播的梯度f′(x)过大导致的一次更新的参数过多，可以通过定义f′(x)＝0来截断参数的更新，从而提高网络的鲁棒性。

因此，本申请实施例在训练自编码器的过程中，通过二值化方式，可以对自编码器的编码网络输出的数据类型为浮点数的特征信息直接进行取整量化，使得自编码器的训练过程中的特征信息与实际使用时接近，从而有助于提高自编码器的鲁棒性。

在一些实施例中，对于图像中某一个位置的编码块，如果其包含的细节没有明显的特征，那么该编码块是不易预测的。作为一种方式，编码器可以决策当前块继续划分为易于预测的编码块。但是，对于一个内容丰富的预测集，总有一些编码块是不易于帧内预测的。如果这些编码块作为训练集的一部分，往往会导致训练出的网络模型的效果不佳。因此，需要对训练集中的数据进行筛选。

现有一种训练数据筛选的方法，对于划分出的形状(例如不同尺寸)的块的训练集，可以使用HEVC编码器对数据集进行编码，对HEVC划分出的该形状的块作为候选的训练集。计算候选训练集的过程中，对HEVC选中的帧内预测模式预测出的编码块与该编码块的原始块之间的均方误差(Mean Squared Error，MSE)进行统计。在该方法中，认为MSE较大的块不易预测，从而将大于平均MSE的块从数据集中取出，将剩下的块作为训练集。该方法在一定程度上可以有效取出对于传统的帧内预测模式而言难以预测的块。但是，这些块对于包含神经网络的编解码架构而言未必难以预测。

示例性的，神经网络在训练的过程中，通常采用梯度下降法对网络权重参数进行更新。通过训练每迭代一次，网络权重也随之更新，而每一次迭代包含了神经网络当前权重在一部分训练样本上进行推断，并根据该推断结果和损失函数计算误差，进而根据误差进行反向传播来对权重更新。这里该过程中的该部分样本可以称为一个batch。其中根据网络前向传播的计算误差通常将一个batch中的每个样本的代价以同样的权重相加或求均值，从而得到一个标量代价，并根据该标量代价对神经网络进行训练/调优。

在一些可选的实施例中，可以根据一个batch中的样本的代价，对该batch中的样本进行筛选，选择其中一部分样本对自编码器的进行训练，即参数更新。

作为一种可能的实现方式，可以根据上述第二当前块的第二预测值和该第二当前块的原始值，确定第一代价向量，其中，该第一代价向量中包括N个代价值，N为大于1的正整数。然后可以根据该第一代价向量，确定第二代价向量，其中该第二代价向量包括M个代价值，该M个代价值是从上述N个代价值中获取的，M为小于N的正整数。然后，可以根据该第二代价向量，对编码网络和/或解码网络的参数进行更新。

示例性的，N可以为上述一个batch中的样本的数量，也就是说，第一代价向量中可以包括一个batch中所有样本的代价。进一步的，上述M个代价值可以对应从一个batch中的N个样本中选择的M个样本。因此，本申请实施例可以根据训练样本集中样本的代价，从N个样本中选择M个样本，并根据该M个样本对应的代价向量，对自编码器，比如解码网络或编码网络的参数进行更新。

作为一种可能的实现方式，上述M个代价值是N个代价值中代价较小的M个代价值。这里，可以认为代价大的样本不易预测，即代价大的样本不适用于当前网络结构下的样本，因此将代价较大的样本从样本集中取出，剩下的代价较小的样本作为训练集，实现对样本集中数据的筛选。

作为一种可能的实现方式，可以对该M个代价值进行求和或求平均值，得到上述第二代价向量的标量代价，然后根据该标量代价，利用反向传播算法对编码网络和/或所述解码网络的参数进行更新。

作为一个示例，在每次迭代的前向传播中计算batch中每个样本的代价，可以得到第一代价向量l _batch，可以表示为如下公式(5)：

l _batch＝[l ₁,l ₂,…,l _n] ^T (5)

其中，n为batch中样本的数量，l _i表示第i个样本的代价，1≤i≤n，i为正整数。

然后，可以将第一代价向量l _batch中的n个代价值进行排序，并舍弃该n个代价值中代价较大的一部分样本，例如代价最大的一部分样本，得到第二代价向量l′ _batch。例如，可以在该n个代价值中舍弃代价较大的前20％的样本，保留代价较小的80％的样本。此时，第二代价向量l′ _batch可以表示为如下公式(6)：

l′ _batch＝[l ₁′,l ₂′,…,l _0.8×n′] ^T (6)

此时，用于更新网络权重的标量代价l _sum可表示为如下公式(7)：

因此，本申请实施例通过在自编码器的编码网络和/或解码网络的参数进行迭代更新的过程中，根据样本的代价在训练样本集中筛选部分样本，例如选择较小代价对应的样本的代价向量，从而有助于在样本集中删除对于神经网络而言不易于帧内预测的样本，即不适用于当前神经网络的样本，从而有助于提高视频编解码网络的帧内预测的准确性，有助于提高视频编解码性能，以及提升视频编解码的效率。

图10示出了本申请实施例提供的一种编码方法400的示意性流程图。方法400可以应用于编码器，例如图1中的解码器100。进一步的，方法400可以应用于编码器100中的帧内预测单元112。如图10所示，方法400包括步骤410至步骤450。

410，确定第一当前块的符合自编码器的编码网络输出的特征信息的元素的特征信息组合，其中，所述特征信息的元素是根据二值化方式确定的。

示例性的，二值化方式可以参见上文中的描述，不再赘述。

示例性的，符合自编码器的编码网络输出的特征信息的语法元素的特征信息组合，可以指符合根据二值化方式对编码网络输出的特征信息进行取整后的各种可能的特征信息，例如可以是所有可能的特征信息的部分或全部。作为一个具体的示例，当第一当前块的特征信息包括2个元素，且根据该特征信息的语法元素，每个元素的可能取值为1或-1时，该第一当前块的特征信息组合可能包括(1，1)、(1，-1)、(-1,1)、(-1，-1)中的至少一种。

420，对所述特征信息组合与预先配置的帧内预测模式进行率失真代价比较，确定所述第一当前块的帧内预测模式参数。例如，可以根据最小率失真代价对应的帧内预测模式作为第一当前块的帧内预测模式。

在一些实施例中，当最小率失真代价对应特征信息组合时，由于特征信息组合是自编码器模式下的特征信息组合，因此此时第一当前块的帧内预测模式可以为自编码器模式，即此时上述帧内预测模式参数用于指示使用(或根据)自编码器模式确定帧内预测值。

在另一些实施例中，当最小率失真代价对应其他帧内预测模式，例如MIP模式时，此时第一当前块的帧内预测模式可以为MIP模式，即此时上述帧内预测模式参数用于指示使用(或根据)MIP模式确定帧内预测值。

430，根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值。

440，将所述帧内预测模式参数写入码流。

因此，本申请实施例可以通过差异二值化的方式，确定当前块的自编码器的编码网络输出的特征信息的语法元素，并确定当前块的特征信息组合，进而根据该特征信息组合，确定当前块的预测模式参数，例如是否使用自编码器模式进行帧内预测，从而可以灵活的进行帧内预测。

在一些可选的实施例中，在上述帧内预测模式参数指示使用自编码器模式确定帧内预测值的情况下，根据第一当前块的帧内预测模式参数，确定第一当前块的帧内预测值，可以通过以下方式实现：

获取该第一当前块的第一特征信息，该第一特征信息是根据所述二值化方式进行处理得到的；

获取已重建像素的重建值；

将所述第一特征信息和所述重建值，输入自编码器的解码网络，得到所述第一当前块的第一预测值。

在一些可选的实施例中，作为获取所述第一当前块的第一特征信息的一种实现方式，可以将该第一当前块输入所述自编码器的编码网络，得到所述编码网络输出的特征信息；然后根据二值化方式，对所述编码网络输出的特征信息进行处理得到上述第一特征信息。

在一些可选的实施例中，作为获取所述第一当前块的第一特征信息，可以将最小率失真代价对应的特征信息作为上述第一特征信息。

在一些可选的实施例中，作为将所述帧内预测模式参数写入码流的一种可能的实现方式，可以将该预测模式参数和第一特征信息写入码流。在一些可选的实施例中，对所述第一特征信息的元素编码后得到的语法元素包括二元码0或1。也就是说，写入码流中的第一特征信息的语法元素为二元码0或1。示例性的，第一特征信息的元素-1写入码流对应的语法元素为0，元素1写入码流对应的语法元素为1，或者反之，不做限定。

在一些可选的实施例中，所述根据二值化方式，对自编码器中的编码网络输出的特征信息进行处理得到所述第一当前块的第一特征信息，包括：

在自编码器中的编码网络输出的特征信息小于0的情况下，所述第一特征信息为-1；

在自编码器中的编码网络输出的特征信息大于或等于0的情况下，所述第一特征信息为1。

在一些可选的实施例中，方法400还包括：

将所述第一训练样本集输入所述编码网络，得到所述编码网络输出的第一样本图像的第二当前块的特征信息；

根据所述二值化方式，对所述编码网络输出的所述第二当前块的特征信息进行处理，得到所述第二当前块的第二特征信息；

将所述第二特征信息和所述第一样本图像的已重建像素的重建值输入所述解码网络，得到所述第二当前块的第二预测值；

根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新。

在一些可选的实施例中，所述根据所述二值化方式，对所述编码网络输出的所述第二当前块的特征信息进行处理，得到所述第二当前块的第二特征信息，包括：

在所述编码网络输出的所述第二当前块的特征信息小于0的情况下，所述第二特征信息为-1；

在所述编码网络输出的所述第二当前块的特征信息大于或等于0的情况下，所述第二特征信息为1。

在一些可选的实施例中，所述根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新，包括：

根据所述第二预测值和所述第二当前块的原始值，利用反向传播算法，对所述编码网络和/或所述解码网络的参数进行更新，其中，所述二值化方式的反向传播的梯度是根据所述编码网络输出的所述第二当前块的特征信息的取值确定的。

在一些可选的实施例中，在所述编码网络输出的所述第二当前块的特征信息大于1或小于-1的情况下，所述二值化方式的反向传播的梯度定义为0；

在所述编码网络输出的所述第二当前块的特征信息小于或等于1，且大于或等于-1的情况下，所述二值化方式的反向传播的梯度定义为1。

根据所述第二预测值和所述第二当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M 个代价值是从所述N个代价值中获取的，M为小于N的正整数；

在一些可选的实施例中，所述M个代价值是所述N个代价值中代价较小的M个代价值。

在一些可选的实施例中，所述根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新，包括：

对所述M个代价值进行求和或求平均值，得到所述第二代价向量的标量代价；

根据所述标量代价，利用反向传播算法对所述编码网络和/或所述解码网络的参数进行更新。

在一些可选的实施例中，所述已重建像素包括所述第一当前块的上方、左侧、左上、左下、右上方的至少一行像素中的至少部分像素点。

在一些可选的实施例中，所述第一当前块包括编码单元CU或预测单元PU。

需要说明的是，本申请实施例中，编码方法400的具体流程或相关术语可以参见上文中解码方法300的流程或术语，这里不再赘述。通过本申请实施例提供的编码方法在编码器能够得到一个较好的预测效果，提高编码性能，并且相应的，对应的该解码方法在解码器也能够改善视频解码恢复质量，从而提高解码性能。示例性的，编码过程和解码过程可以使用相同的预设规则或者步骤，计算出当前块的帧内预测值。

下面详细描述本申请实施例提供的编解码方法的一个具体例子。应注意，下面的例子仅仅是为了帮助本领域技术人员理解和实现本发明的实施例，而非限制本发明实施例的范围。本领域技术人员可以根据这里给出的例子进行等价变换或修改，这样的变换或修改仍然应落入本发明实施例的范围内。

示例性的，对自编码器进行训练的训练集可以包括CLIC2020数据集(包括1633张分辨率大约2K的图片)、BVI-DVI数据集(包括800个不同分辨率的视频序列)，以及COCO2017数据集(包括约11万张低分辨率的图片)。

需要说明的是，为了得到不同大小的帧内预测块的划分，本申请实施例使用VVC参考软件VTM-13.0对训练集图片采用27～47的随机量化参数进行的压缩，对划分出的{32x32,32x16,32x8,32x4,16x16,16x8,16x4,8x8,8x4,4x4}进行数据集的整理，每种块划分出的数据集随机取2000000个训练样本作为训练数据。

还需要说明的是，本申请实施例采用了对照试验的形式，对现有的自编码器的性能和本申请实施例提供的自编码器的性能进行了对比。例如，可以在现有的自编码器上实施本申请实施例提供的二值化方法，以及进一步采用本申请实施例提供的训练数据筛选的方法，以验证本申请实施例能够带来的性能提升效果。

以下结合表1、表2和表3描述该对照试验中的自编码器的网络结构。其中，表1为现有的自编码器中的编码网络结构的一个示例。

表1

隐藏层索引	隐藏层类型	输入节点数	输出节点数	激活函数
0	全连接(fully connection)	W×H	256	Leaky relu
1	全连接(fully connection)	256	256	Leaky relu
2	全连接(fully connection)	256	256	Leaky relu
3	全连接(fully connection)	256	2	Sigmoid

表2为本申请实施例提供的自编码器中的编码网络结构的一个示例。

表2

隐藏层索引	隐藏层类型	输入节点数	输出节点数	激活函数
0	全连接(fully connection)	W×H	256	Leaky relu
1	全连接(fully connection)	256	256	Leaky relu
2	全连接(fully connection)	256	256	Leaky relu
3	全连接(fully connection)	256	2	无

表3为自编码器中的解码网络结构的一个示例，其中该解码网络结构可以为现有的自编码器中的解码网络结构，还可以为本申请实施例提供的自编码器中的解码网络结构，也就是说，在该对照试验中，二种自编码器采用相同的解码网络结构。

表3

在上述表1、表2和表3中，W表示该自编码器使用的编码块的宽，H表示该自编码器使用的编码块的高，N表示该自编码器使用需要的邻近的参考行的数量，输入节点中的“×2”表示分别需要2倍的宽和高的重建像素。

需要说的是，对于表1中的现有的自编码器中编码网络结构，对其输出进行Sigmoid激活后的连续分布分的特征信息采用四舍五入进行取整，或加上随机分布的噪声进行取整，因此其编码网络结构的最后一次，即第3层激活函数为Sigmoid。而对表2中的本申请提供的自编码器中的编码网络结构的输出采用本申请实施例提供的二值化方式进行取整，因此该编码网络的最后一层，即第3层的激活函数为无。

另外，在表1和表2中，编码网络结构的最后一层的输出节点数为2，表示该编码网络提取(即输出)的特征信息为包含2个元素的向量。

以下描述该对照试验中采用的训练参数设定。

为控制变量，上述对照试验中自编码器的训练均试验上述训练数据。示例性的，可以采用如下表4中的训练参数设定。

表4

作为一个示例，公式(8)示出了训练损失函数

的一个示例：

其中，f(；θ)表示自编码器的计算输出，Y表示当前块的原始训练值，f(x；θ)表示经过自编码器预测出的当前块的预测值。这里，训练数据筛选出每个batch中的80％代价低的样本。

在自编码器训练完成之后，可以将自编码器集成到VTM参考软件。示例性的，在VTM解码端，采用本申请实施例提供的自编码器进行解码的过程与采用现有的及编码器进行解码的过程相同。例如，在解析码流阶段，解析当前块选中的帧内预测模式；当当前块选中的帧内预测模式为自编码器模式时，可以进一步解析该当前块的特征信息，比如解析该特征信息的语法元素；在预测阶段，可以将特征信息与当前块周边的重建像素(重建值)输入训练好的自编码器的解码网络得到当前块的预测值。

表5示出了特征信息中的语法元素的一个示例。在该对照试验中，可以设置本申请实施例的自编码器输出的特征信息的语法元素与现有的自编码器输出的特征信息的语法元素相同。

表5

其中，Intra_ae_flag表示当前块是否选中使用自编码器模式。若选中自编码器模式，由于本申请实施例中该特征信息包含2个元素，因此可以进一步解析2个1位二元码feature[0]和feature[1]。对于该二元码feature[0]和feature[1]的取值，当采用现有的对特征信息的取整方法，比如四舍五入取整方法，或者加随机噪声的取整方法，feature[0]或feature[1]可以取值为0或1。当采用本申请实施例提供的二值化方法，则feature[0]或feature[1]可取值为-1或1。

在另一些实施例中，若采用维度更高的特征信息，例如特征信息包含3个元素，则应编码feature[0],feature[1],feature[2]等3个二元码作为特征信息中的元素。具体的，与参考特征信息包含2个二元码的元素的类似，不再赘述。

示例性的，在VTM编码端，在符合解码端所描述的特征信息的语法元素设计的情况下，可以将各种可能的特征信息组合与其他帧内预测模式一同进行率失真代价比较，代价最小的模式可以作为当前块所选中的帧内预测模式。如果代价最小的模式为自编码器模式，则需要进一步编码相关的特征信息的语法元素，例如可以参与本申请实施例提供的自编码器，或现有的自编码器获取特征信息。

以下，结合表6至表8，描述各技术方案产生的有益效果。

表6示出了对比参考软件VTM-11.0，采用现有的自编码器(即使用Sigmoid作为编码网络输出的激活函数、网络前向传播取整为四舍五入、反向传播梯度为1)时，在通用测试条件ClassA～ClassF，Qp{22,27,32,37,42}上的性能结果：

表6

表7示出了对比参考软件VTM-11.0，采用本申请实施例提供的自编码器(即不经过使用Sigmoid激活函数、网络前向传播取整为二值化取整)时，在通用测试条件ClassA～ClassF，Qp{22,27,32,37,42}上的性能结果：

表7

表8示出了对比参考软件VTM-11.0，采用本申请实施例提供的自编码器(即不经过使用Sigmoid激活函数、网络前向传播取整为二值化取整)，以及对训练数据进行筛选(例如每个batch的大小设置为100，取80％即80个代价值较小的样本更新网络权重)，在通用测试条件ClassA～ClassF，Qp{22,27,32,37,42}上的性能结果：

表8

其中，上述ClassA至Class H代表不同分辨率的测试序列，Over all表示对其上面行的测试条件下的测试值的平均值，Y-PSNR所在列表示在Y分量上的性能提升，U-PSNR所在列表示在U分量上的性能提升，V-PSNR所在列表示在V分量上的性能提升，EncT表示编码时间变化，DecT表示解码时间变化。

对比上述表6和表7，可以看到本申请实施例提供的自编码器相对现有的自编码器，能够提高YUV各个分量上的视频编解码性能，并且有助于降低编码时间，因此本申请实施例通过采用二值化方式，对自编码器的编码网络输出的特征信息进行取整，一方面可以有助于提高视频编解码性能，另一方面还可以有助于提高视频编码效率。

进一步的，对比上述表7和表8，可以看到当采用本申请实施例提供的对训练数据进行筛选的方法，可以进一步提高YUV各个分量上的视频编解码性能，以及降低编码时间，因此本申请实施例通过根据代价较小的样本更新网络权重，能够进一步有助于提高视频编解码性能，以及视频编码效率。

图11示出了本申请实施例提供的一种训练自编码器的方法500的示意性流程图。如图11所示，方法500包括步骤510至步骤550。

510，获取第一训练样本集，所述第一训练样本集包括第一样本图像。

520，将所述第一训练样本集输入自编码器，得到所述第一样本图像的当前块的预测值，其中，所述自编码器包括编码网络和解码网络，所述编码网络用于提取所述当前块的特征信息，所述解码网络用于根据已重建像素值和所述特征信息，得到所述预测值。

530，根据所述预测值和所述当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数。

540，根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数。

550，根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。

在一些可选的实施例中，所述已重建像素包括所述当前块的上方、左侧、左上、左下、右上方的至少一行像素中的至少部分像素点。

在一些可选的实施例中，所述当前块包括编码单元CU或预测单元PU。

需要说明的是，本申请实施例中，训练模型的方法的具体流程可以参见上述编码方法300中对模型的训练过程的描述，这里不再赘述。

以上结合附图详细描述了本申请的具体实施方式，但是，本申请并不限于上述实施方式中的具体细节，在本申请的技术构思范围内，可以对本申请的技术方案进行多种简单变型，这些简单变型均属于本申请的保护范围。例如，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本申请对各种可能的组合方式不再另行说明。又例如，本申请的各种不同的实施方式之间也可以进行任意组合，只要其不违背本申请的思想，其同样应当视为本申请所公开的内容。

还应理解，在本申请的各种方法实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。应理解这些序号在适当情况下可以互换，以便描述的本申请的实施例能够以除了在图示或描述的那些以外的顺序实施。

上文结合图1至图11，详细描述了本申请的方法实施例，下文结合图12至图15，详细描述本申请的装置实施例。

图12是本申请实施例的解码器600的示意性框图。该装置600例如图2中的解码器200。如图12所示，所述装置600可包括获取单元610和自编码器620。

获取单元610，用于从码流中获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

所述获取单元610还用于从所述码流中获取第一当前块的第一特征信息；

所述获取单元610还用于获取已重建像素的重建值；

所述自编码器620，包括解码网络，用于将所述第一特征信息和所述重建值输入所述解码网络，得到所述第一当前块的第一预测值。

在一些可选的实施例中，所述第一特征信息的元素是根据二值化方式进行处理得到的。

在一些可选的实施例中，所述第一特征信息的元素为-1或1，其中，所述元素为-1表示所述编码网络输出的特征信息小于0，所述元素为1表示所述编码网络输出的特征信息大于或等于0。

在一些可选的实施例中，对所述第一特征信息的元素编码后得到的语法元素包括二元码0或1。

在一些可选的实施例中，解码器600还包括模型训练单元，用于：

在一些可选的实施例中，模型训练单元具体用于：

在一些可选的实施例中，所述第二当前块包括编码单元CU或预测单元PU。

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，在该实施例中解码器600可以对应于执行本申请实施例的方法300的相应主体，并且解码器600中的各个模块的前述和其它操作和/或功能分别为了实现图9中的各个方法中的相应流程，为了简洁，在此不再赘述。

图13是本申请实施例的编码器700的示意性框图。该装置700例如图1中的编码器100。如图13所示，所述装置700可包括处理单元710、帧内预测单元720和预测模式参数编码单元740。

处理单元710用于确定第一当前块的符合自编码器的编码网络输出的特征信息的元素的特征信息组合，其中，所述特征信息的元素是根据二值化方式确定的。

处理单元710还用于对所述特征信息组合与预先配置的帧内预测模式进行率失真代价比较，确定所述第一当前块的帧内预测模式参数；

帧内预测单元720，用于根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值；

预测模式参数编码单元730，用于将所述帧内预测模式参数写入码流。

在一些可选的实施例中，帧内预测单元720具体用于：

在所述帧内预测模式参数指示使用自编码器模式确定帧内预测值的情况下，获取所述第一当前块的第一特征信息，所述第一特征信息是根据所述二值化方式进行处理得到的；

获取已重建像素的重建值；

预测模式参数编码单元730，具体用于将所述帧内预测模式参数和所述第一特征信息写入码流。

在一些可选的实施例中，帧内预测单元720具体用于：

将所述第一当前块输入所述自编码器的编码网络，得到所述编码网络输出的特征信息；

根据所述二值化方式，对所述编码网络输出的特征信息进行处理得到所述第一特征信息。

在一些可选的实施例中，帧内预测单元720具体用于：

将最小率失真代价对应的特征信息作为所述第一特征信息。

在一些可选的实施例中，帧内预测单元720具体用于：

在所述编码网络输出的特征信息小于0的情况下，所述第一特征信息为-1；

在所述编码网络输出的特征信息大于或等于0的情况下，所述第一特征信息为1。

在一些可选的实施例中，还包括训练单元，用于：

将所述第一训练样本集输入所述自编码器的编码网络，得到所述编码网络输出的第一样本图像的第二当前块的特征信息；

将所述第二特征信息和所述第一样本图像的已重建像素的重建值输入所述自编码器的解码网络，得到所述第二当前块的第二预测值；

在一些可选的实施例中，训练单元具体用于：

在一些可选的实施例中，在所述编码网络输出的所述第二当前块的特征信息大于1或小于-1的情况下，所述二值化方式的反向传播的梯度定义为0；在所述编码网络输出的所述第二当前块的特征信息小于或等于1，且大于或等于-1的情况下，所述二值化方式的反向传播的梯度定义为1。

在一些可选的实施例中，训练单元具体用于：

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，在该实施例中编码器700可以对应于执行本申请实施例的方法400的相应主体，并且编码器700中的各个模块的前述和其它操作和/或功能分别为了实现图10中的各个方法中的相应流程，为了简洁，在此不再赘述。

图14是本申请实施例的训练模型的装置800的示意性框图。该装置800例如可以设置在图1中的编码器100，或图2中的解码器200中。如图14所示，所述装置800可包括获取单元810、自编码器820和处理单元830。

获取单元810，用于获取第一训练样本集，所述第一训练样本集包括第一样本图像；

自编码器820，用于将所述第一训练样本集输入所述自编码器，得到所述第一样本图像的当前块的预测值，其中，所述自编码器包括编码网络和解码网络，所述编码网络用于提取所述当前块的特征信息，所述解码网络用于根据已重建像素值和所述特征信息，得到所述预测值；

处理单元830，用于根据所述预测值和所述当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

所述处理单元830还用于根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

所述处理单元830还用于根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。

在一些可选的实施例中，所述处理单元830具体用于：

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，在该实施例中训练模型的装置800可以对应于执行本申请实施例的方法500的相应主体，并且训练模型的装置800中的各个模块的前述和其它操作和/或功能分别为了实现图11中的各个方法中的相应流程，为了简洁，在此不再赘述。

上文中结合附图从功能模块的角度描述了本申请实施例的装置和系统。应理解，该功能模块可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过硬件和软件模块组合实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。可选地，软件模块可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

如图15是本申请实施例提供的电子设备900的示意性框图。

如图15所示，该电子设备900可包括：

存储器910和处理器920，该存储器910用于存储计算机程序，并将该程序代码传输给该处理器920。换言之，该处理器920可以从存储器910中调用并运行计算机程序，以实现本申请实施例中的方法。

例如，该处理器920可用于根据该计算机程序中的指令执行上述方法300中的步骤，或方法400中的步骤，或方法500中的步骤。

在本申请的一些实施例中，该处理器920可以包括但不限于：

通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

在本申请的一些实施例中，该存储器910包括但不限于：

易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在本申请的一些实施例中，该计算机程序可以被分割成一个或多个模块，该一个或者多个模块被存储在该存储器910中，并由该处理器920执行，以完成本申请提供的编码或解码方法。该一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述该计算机程序在该电子设备900中的执行过程。

可选的，如图15所示，该电子设备900还可包括：

收发器930，该收发器930可连接至该处理器920或存储器910。

其中，处理器920可以控制该收发器930与其他设备进行通信，具体地，可以向其他设备发送信息或数据，或接收其他设备发送的信息或数据。收发器930可以包括发射机和接收机。收发器930还可以进一步包括天线，天线的数量可以为一个或多个。

应当理解，该电子设备900中的各个组件通过总线系统相连，其中，总线系统除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。

根据本申请的一个方面，提供了一种解码器，包括处理器和存储器，该存储器用于存储计算机程序，该处理器用于调用并运行所述存储器中存储的计算机程序，使得所述解码器执行上述方法实施例的解码方法。

根据本申请的一个方面，提供了一种编码器，包括处理器和存储器，该存储器用于存储计算机程序，该处理器用于调用并运行所述存储器中存储的计算机程序，使得所述编码器执行上述方法实施例的编码方法。

根据本申请的一个方面，提供了一种编解码系统，包括上述编码器和解码器。

根据本申请的一个方面，提供了一种计算机存储介质，其上存储有计算机程序，该计算机程序被计算机执行时使得该计算机能够执行上述方法实施例的方法。或者说，本申请实施例还提供一种包含指令的计算机程序产品，该指令被计算机执行时使得计算机执行上述方法实施例的方法。

根据本申请的另一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方法实施例的方法。

换言之，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本申请实施例该的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc，DVD))、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

应理解，在本申请实施例中，“与A对应的B”表示B与A相关联。在一种实现方式中，可以根据A确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其它信息确定B。

在本申请的描述中，除非另有说明，“至少一个”是指一个或多个，“多个”是指两个或多于两个。另外，“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a,b,或c中的至少一项(个)，可以表示：a,b,c,a-b,a-c,b-c,或a-b-c，其中a,b,c可以是单个，也可以是多个。

还应理解，本申请实施例中出现的第一、第二等描述，仅作示意与区分描述对象之用，没有次序之分，也不表示本申请实施例中对设备个数的特别限定，不能构成对本申请实施例的任何限制。

还应理解，说明书中与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，该模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。例如，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以该权利要求的保护范围为准。

Claims

一种解码方法，其特征在于，包括：

从码流中获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

从所述码流中获取第一当前块的第一特征信息；

获取已重建像素的重建值；

将所述第一特征信息和所述重建值输入自编码器的解码网络，得到所述第一当前块的第一预测值。
根据权利要求1所述的方法，其特征在于，所述第一特征信息的元素是根据二值化方式进行处理得到的。
根据权利要求1或2所述的方法，其特征在于，所述第一特征信息的元素为-1或1，其中，所述元素为-1表示自编码器的编码网络输出的特征信息小于0，所述元素为1表示自编码器的编码网络输出的特征信息大于或等于0。
根据权利要求1-3任一项所述的方法，其特征在于，对所述第一特征信息的元素编码后得到的语法元素包括二元码0或1。
根据权利要求2所述的方法，其特征在于，所述二值化方式的反向传播的梯度是根据所述自编码器的编码网络输出的当前块的特征信息的取值确定的。
根据权利要求5所述的方法，其特征在于，在所述编码网络输出的当前块的特征信息大于1或小于-1的情况下，所述二值化方式的反向传播的梯度定义为0；

在所述编码网络输出的当前块的特征信息小于或等于1，且大于或等于-1的情况下，所述二值化方式的反向传播的梯度定义为1。
根据权利要求1-6任一项所述的方法，其特征在于，还包括：

获取第一训练样本集，所述第一训练样本集包括第一样本图像；

将所述第一训练样本集输入所述自编码器的编码网络，得到所述编码网络输出的第一样本图像的第二当前块的特征信息；

根据二值化方式，对所述编码网络输出的所述第二当前块的特征信息进行处理，得到所述第二当前块的第二特征信息；

将所述第二特征信息和所述第一样本图像的已重建像素的重建值输入所述自编码器的解码网络，得到所述第二当前块的第二预测值；

根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求7所述的方法，其特征在于，所述根据二值化方式，对所述编码网络输出的所述第二当前块的特征信息进行处理，得到所述第二当前块的第二特征信息，包括：

在所述编码网络输出的所述第二当前块的特征信息小于0的情况下，所述第二特征信息的元素为-1；

在所述编码网络输出的所述第二当前块的特征信息大于或等于0的情况下，所述第二特征信息的元素为1。
根据权利要求7或8所述的方法，其特征在于，所述根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新，包括：

根据所述第二预测值和所述第二当前块的原始值，利用反向传播算法，对所述编码网络和/或所述解码网络的参数进行更新，其中，所述二值化方式的反向传播的梯度是根据所述编码网络输出的所述第二当前块的特征信息的取值确定的。
根据权利要求9所述的方法，其特征在于，在所述编码网络输出的所述第二当前块的特征信息大于1或小于-1的情况下，所述二值化方式的反向传播的梯度定义为0；

在所述编码网络输出的所述第二当前块的特征信息小于或等于1，且大于或等于-1的情况下，所述二值化方式的反向传播的梯度定义为1。
根据权利要求7-10任一项所述的方法，其特征在于，所述根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新，包括：

根据所述第二预测值和所述第二当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求11所述的方法，其特征在于，所述M个代价值是所述N个代价值中代价较小的M个代价值。
根据权利要求11或12所述的方法，其特征在于，所述根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新，包括：

对所述M个代价值进行求和或求平均值，得到所述第二代价向量的标量代价；

根据所述标量代价，利用反向传播算法对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求7-13任一项所述的方法，其特征在于，所述第二当前块包括编码单元CU或预测单元PU。
根据权利要求1-14任一项所述的方法，其特征在于，所述已重建像素包括所述第一当前块的上方、左侧、左上、左下、右上方的至少一行像素中的至少部分像素点。
根据权利要求1-15任一项所述的方法，其特征在于，所述第一当前块包括编码单元CU或预测单元PU。
一种编码方法，其特征在于，包括：

确定第一当前块的符合自编码器的编码网络输出的特征信息的元素的特征信息组合，其中，所述特征信息的元素是根据二值化方式确定的；

对所述特征信息组合与预先配置的帧内预测模式进行率失真代价比较，确定所述第一当前块的帧内预测模式参数，其中，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值；

将所述帧内预测模式参数写入码流。
根据权利要求17所述的方法，其特征在于，所述根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值，包括：

在所述帧内预测模式参数指示使用自编码器模式确定帧内预测值的情况下，获取所述第一当前块的第一特征信息，所述第一特征信息的元素是根据所述二值化方式进行处理得到的；

获取已重建像素的重建值；

将所述第一特征信息和所述重建值，输入自编码器的解码网络，得到所述第一当前块的第一预测值；

其中，所述将所述帧内预测模式参数写入码流，包括：

将所述帧内预测模式参数和所述第一特征信息写入码流。
根据权利要求18所述的方法，其特征在于，所述获取所述第一当前块的第一特征信息，包括：

将所述第一当前块输入所述自编码器的编码网络，得到所述编码网络输出的特征信息；

根据所述二值化方式，对所述编码网络输出的特征信息进行处理得到所述第一特征信息。
根据权利要求18所述的方法，其特征在于，所述获取所述第一当前块的第一特征信息，包括：

将最小率失真代价对应的特征信息作为所述第一特征信息。
根据权利要求19所述的方法，其特征在于，所述根据所述二值化方式，对所述编码网络输出的特征信息进行处理得到所述第一特征信息，包括：

在所述编码网络输出的特征信息小于0的情况下，所述第一特征信息的元素为-1；

在所述编码网络输出的特征信息大于或等于0的情况下，所述第一特征信息的元素为1。
根据权利要求21所述的方法，其特征在于，对所述第一特征信息的元素编码后得到的语法元素包括二元码0或1。
根据权利要求17-22任一项所述的方法，其特征在于，所述二值化方式的反向传播的梯度是根据所述自编码器的编码网络输出的当前块的特征信息的取值确定的。
根据权利要求23所述的方法，其特征在于，在所述编码网络输出的当前块的特征信息大于1或小于-1的情况下，所述二值化方式的反向传播的梯度定义为0；

在所述编码网络输出的当前块的特征信息小于或等于1，且大于或等于-1的情况下，所述二值化方式的反向传播的梯度定义为1。
根据权利要求18-22任一项所述的方法，其特征在于，还包括：

获取第一训练样本集，所述第一训练样本集包括第一样本图像；

将所述第一训练样本集输入所述自编码器的编码网络，得到所述编码网络输出的第一样本图像的第二当前块的特征信息；

根据所述二值化方式，对所述编码网络输出的所述第二当前块的特征信息进行处理，得到所述第二当前块的第二特征信息；

将所述第二特征信息和所述第一样本图像的已重建像素的重建值输入所述自编码器的解码网络，得到所述第二当前块的第二预测值；

根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求25所述的方法，其特征在于，所述根据所述二值化方式，对所述编码网络输出的所述第二当前块的特征信息进行处理，得到所述第二当前块的第二特征信息，包括：

在所述编码网络输出的所述第二当前块的特征信息小于0的情况下，所述第二特征信息的元素为-1；

在所述编码网络输出的所述第二当前块的特征信息大于或等于0的情况下，所述第二特征信息的元素为1。
根据权利要求25或26所述的方法，其特征在于，所述根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新，包括：

根据所述第二预测值和所述第二当前块的原始值，利用反向传播算法，对所述编码网络和/或所述解码网络的参数进行更新，其中，所述二值化方式的反向传播的梯度是根据所述编码网络输出的所述第二当前块的特征信息的取值确定的。
根据权利要求27所述的方法，其特征在于，在所述编码网络输出的所述第二当前块的特征信息大于1或小于-1的情况下，所述二值化方式的反向传播的梯度定义为0；

在所述编码网络输出的所述第二当前块的特征信息小于或等于1，且大于或等于-1的情况下，所述二值化方式的反向传播的梯度定义为1。
根据权利要求25-28任一项所述的方法，其特征在于，所述根据所述第二预测值和所述第二当前块的原始值，对所述编码网络和/或所述解码网络的参数进行更新，包括：

根据所述第二预测值和所述第二当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求29所述的方法，其特征在于，所述M个代价值是所述N个代价值中代价较小的M个代价值。
根据权利要求29或30所述的方法，其特征在于，所述根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新，包括：

对所述M个代价值进行求和或求平均值，得到所述第二代价向量的标量代价；

根据所述标量代价，利用反向传播算法对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求25-31任一项所述的方法，其特征在于，所述第二当前块包括编码单元CU或预测单元PU。
根据权利要求18所述的方法，其特征在于，所述已重建像素包括所述第一当前块的上方、左侧、左上、左下、右上方的至少一行像素中的至少部分像素点。
根据权利要求17-33任一项所述的方法，其特征在于，所述第一当前块包括编码单元CU或预测单元PU。
一种训练模型的方法，其特征在于，包括：

获取第一训练样本集，所述第一训练样本集包括第一样本图像；

将所述第一训练样本集输入自编码器，得到所述第一样本图像的当前块的预测值，其中，所述自编码器包括编码网络和解码网络，所述编码网络用于提取所述当前块的特征信息，所述解码网络用于根据已重建像素值和所述特征信息，得到所述预测值；

根据所述预测值和所述当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求35所述的方法，其特征在于，所述M个代价值是所述N个代价值中代价较小的M个代价值。
根据权利要求35或36所述的方法，其特征在于，所述根据所述第二代价向量，对所述编码 46网络和/或所述解码网络的参数进行更新，包括：

对所述M个代价值进行求和或求平均值，得到所述第二代价向量的标量代价；

根据所述标量代价，利用反向传播算法对所述编码网络和/或所述解码网络的参数进行更新。
根据权利要求35-37任一项所述的方法，其特征在于，所述已重建像素包括所述当前块的上方、左侧、左上、左下、右上方的至少一行像素中的至少部分像素点。
根据权利要求36-38任一项所述的方法，其特征在于，所述当前块包括编码单元CU或预测单元PU。
一种解码器，其特征在于，包括：

获取单元，用于从码流获取帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

所述获取单元还用于从所述码流中获取第一当前块的第一特征信息；

所述获取单元还用于获取已重建像素的重建值；

自编码器，包括解码网络，用于将所述第一特征信息和所述重建值输入所述解码网络，得到所述第一当前块的第一预测值。
一种编码器，其特征在于，包括：

处理单元，用于确定第一当前块的符合自编码器的编码网络输出的特征信息的元素的特征信息组合，其中，所述特征信息的元素是根据二值化取值方式确定的；

所述处理单元还用于对所述特征信息组合与预先配置的帧内预测模式进行率失真代价比较，确定所述第一当前块的帧内预测模式参数，所述帧内预测模式参数用于指示使用自编码器模式确定帧内预测值；

帧内预测单元，用于根据所述第一当前块的帧内预测模式参数，确定所述第一当前块的帧内预测值；

预测模式参数编码单元，用于将所述帧内预测模式参数写入码流。
一种编解码系统，其特征在于，包括如权利要求40所述的编码器和如权利要求41所示的解码器。
一种训练模型的装置，其特征在于，包括：

获取单元，用于获取第一训练样本集，所述第一训练样本集包括第一样本图像；

自编码器，用于将所述第一训练样本集输入所述自编码器，得到所述第一样本图像的当前块的预测值，其中，所述自编码器包括编码网络和解码网络，所述编码网络用于提取所述当前块的特征信息，所述解码网络用于根据已重建像素值和所述特征信息，得到所述预测值；

处理单元，用于根据所述预测值和所述当前块的原始值，确定第一代价向量，其中，所述第一代价向量中包括N个代价值，N为大于1的正整数；

所述处理单元还用于根据所述第一代价向量，确定第二代价向量，其中所述第二代价向量包括M个代价值，所述M个代价值是从所述N个代价值中获取的，M为小于N的正整数；

所述处理单元还用于根据所述第二代价向量，对所述编码网络和/或所述解码网络的参数进行更新。
一种电子设备，其特征在于，包括处理器和存储器；

所述存储器用于存储计算机程序，所述处理器用于调用并运行所述存储器中存储的计算机程序，使得所述电子设备执行如权利要求1-39任一项所述的方法。
一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1-39任一项所述的方法。
一种计算机程序产品，其特征在于，包括计算机程序代码，当所述计算机程序代码被电子设备运行时，使得所述电子设备执行权利要求1-39中任一项所述的方法。