WO2022155923A1

WO2022155923A1 - 编码方法、解码方法、编码器、解码器以及电子设备

Info

Publication number: WO2022155923A1
Application number: PCT/CN2021/073410
Authority: WO
Inventors: 戴震宇
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-01-22
Filing date: 2021-01-22
Publication date: 2022-07-28
Also published as: CN116686288A

Abstract

本申请实施例提供一种编码方法、解码方法、编码器、解码器以及电子设备。所述编码方法包括：获取目标图像序列和允许标识，所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；将所述目标图像序列中的目标图像帧划分为多个图像块，所述多个图像块包括目标图像块；基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；基于所述目标预测块，得到目标残差块；对所述允许标识以及所述目标残差块进行编码，得到码流。通过引入第一预测模式，在可使用第一预测模式对所述目标图像块进行帧内预测的情况下，可使用在所述第一预测模式和传统预测模式中选择的最优预测模式得到目标预测块，能够提升压缩性能。

Description

编码方法、解码方法、编码器、解码器以及电子设备

技术领域

本申请实施例涉及图像编解码技术领域，并且更具体地，涉及编码方法、解码方法、编码器、解码器以及电子设备。

背景技术

数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够实现视频解压缩，但目前仍然需要追求更好的数字视频压缩技术，以提升压缩性能。

发明内容

本申请实施例提供一种编码方法、解码方法、编码器、解码器以及电子设备，能够提升压缩性能。

一方面，提供了一种编码方法，包括：

获取目标图像序列和允许标识，所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

将所述目标图像序列中的目标图像帧划分为多个图像块，所述多个图像块包括目标图像块；

基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

基于所述目标预测块，得到目标残差块；

对所述允许标识以及所述目标残差块进行编码，得到码流。

另一方面，提供了一种解码方法，包括：

通过解析码流，获取允许标识以及目标图像序列中的目标图像块的目标残差块；所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

基于所述目标残差块和所述目标预测块，得到所述目标图像帧。

另一方面，本申请实施例提供了一种编码器，用于执行上述第一方面或其各实现方式中的方法。具体地，该编码器包括用于执行上述第一方面或其各实现方式中的方法的功能单元。

另一方面，本申请实施例提供了一种解码器，用于执行上述第二方面或其各实现方式中的方法。具体地，该解码器包括用于执行上述第二方面或其各实现方式中的方法的功能单元。

另一方面，本申请实施例提供了一种电子设备，包括：

处理器，适于实现计算机指令；以及，

计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令适于由处理器加载并执行执行如上述第一方面至第二方面中的任一方面或其各实现方式中的方法。

另一方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机指令，该计算机指令被计算机设备的处理器读取并执行时，使得计算机设备执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。

另一方面，本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。

本申请实施例中，通过引入第一预测模式，在可使用所述第一预测模式对所述目标图像块进行帧内预测的情况下，可在所述第一预测模式和传统预测模式中选择最优预测模式；然后基于所述最优预测模式得到目标预测块，进而，能够提升压缩性能。

附图说明

图1是本申请实施例提供的编码框架的示意性框图。

图2是本申请实施例提供的33种角度预测模式的具体方向示意图。

图3是本申请实施例提供的MIP模式的示意性流程图。

图4是本申请实施例提供的解码器侧重构过程框图的示例。

图5是本申请实施例提供的解码框架的示意性框图。

图6是本申请实施例提供的编码框架的另一示意性框图。

图7是本申请实施例提供的编码方法的示意性流程图。

图8是本申请实施例提供的用于训练网络权重的网络结构的示意性框图。

图9是本申请实施例提供的解码框架的另一示意性框图。

图10是本申请实施例提供的解码方法的示意性流程图。

图11是本申请实施例的编码器的示意性框图。

图12是本申请实施例的解码器的示意性框图。

图13是本申请实施例提供的电子设备的示意结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的方案可应用于数字视频编码技术领域，例如，图像编解码领域、视频编解码领域、硬件视频编解码领域、专用电路视频编解码领域、实时视频编解码领域。本申请实施例提供的方案可结合至音视频编码标准(Audio Video coding Standard，AVS)、第二代AVS标准(AVS2)或第三代AVS标准(AVS3)。包括但不限于H.264/音视频编码(Audio Video coding，AVC)标准、H.265/高效视频编码(High Efficiency Video Coding，HEVC)标准以及H.266/多功能视频编码(Versatile Video Coding，VVC)标准。本申请实施例提供的方案可以用于对图像进行有损压缩(lossy compression)，也可用于对图像进行无损压缩(lossless compression)。该无损压缩可以是视觉无损压缩(visually lossless compression)，也可以是数学无损压缩(mathematically lossless compression)。

在数字视频编码过程中，编码器对不同颜色格式的原始视频序列读取不相等的亮度分量的像素和色度分量的像素，即编码器读取一幅黑白图像或彩色图像，然后针对黑白图像或彩色图像进行编码。其中，黑白图像可以包括亮度分量的像素，彩色图像可以包括色度分量的像素，可选的，彩色图像还可以包括亮度分量的像素。原始视频序列的颜色格式可以是亮度色度(YCbCr，YUV)格式或红绿蓝(Red-Green-Blue，RGB)格式等。针对YUV格式，Y表示明亮度(Luma)，Cb(U)表示蓝色色差，Cr(V)表示红色色差，U和V表示为色度(Chroma)用于描述色差信息。编码器读取一幅黑白图像或彩色图像之后，将其划分成块数据，并对块数据进行编码。该块数据可以是编码树单元(Coding Tree Unit，CTU)或编码单元块(Coding Unit，CU)，一个编码树单元又可以继续被划分成若干个CU，CU可以为长方形块也可以为正方形块。即编码器可基于CTU或CU进行编码。如今编码器通常为混合框架编码模式，一般包含帧内与帧间预测、变换与量化、反变换与反量化、环路滤波及熵编码等操作。帧内预测只参考同一帧图像的信息，预测当前划分块内的像素信息，用于消除空间冗余；帧间预测可以参考不同帧的图像信息，利用运动估计搜索最匹配当前划分块的运动矢量信息，用于消除时间冗余；变换将预测后的图像块转换到频率域，能量重新分布，结合量化可以将人眼不敏感的信息去除，用于消除视觉冗余；熵编码可以根据当前上下文模型以及二进制码流的概率信息消除字符冗余。

为了便于理解，先对本申请提供的编码框架进行简单介绍。

图1是本申请实施例提供的编码框架100的示意性框图。

如图1所示，该编码框架100可包括帧内预测单元180、残差单元110、变换与量化单元120、熵编码单元130、反变换与反量化单元140、以及环路滤波单元150。可选的，该编码框架100还可包括解码图像缓冲单元160和/或帧间预测单元170。该编码框架100也可称为混合框架编码模式。

在编码框架100中，帧内预测单元180或帧间预测单元170可对待编码图像块进行预测，以输出预测块。残差单元110可基于预测块与待编码图像块计算残差块，即预测块和待编码图像块的差值。该残差块经由变换与量化单元120变换与量化等过程，可以去除人眼不敏感的信息，以消除视觉冗余。可选的，经过变换与量化单元120变换与量化之前的残差块可称为时域残差块，经过变换与量化单元120变换与量化之后的时域残差块可称为频率残差块或频域残差块。熵编码单元130接收到变换与量化单元120输出的变换量化系数后，可基于该变换量化系数输出码流。例如，熵编码单元130可根据目标上下文模型以及二进制码流的概率信息消除字符冗余。例如，熵编码单元130可以用于基于上下文的自适应二进制算术熵编码(CABAC)。熵编码单元130也可称为头信息编码单元。可选的，在本申请中，该待编码图像块也可称为原始图像块或目标图像块，预测块也可称为预测图像块或图像预测块，还可以称为预测信号或预测信息，重建块也可称为重建图像块或图像重建块，还可以称为重建信号或重建信息。此外，针对编码端，该待编码图像块也可称为编码块或编码图像块，针对解码端，该待编码图像块也可称为解码块或解码图像块。该待编码图像块可以是CTU或CU。

简言之，编码框架100将预测块与待编码图像块计算残差得到残差块经由变换与量化等过程，将残差块传输到解码端。解码端接收并解析码流后，经过反变换与反量化等步骤得到残差块，将解码端预测得到的预测块叠加残差块后得到重建块。

需要说明的是，编码框架100中的反变换与反量化单元140、环路滤波单元150以及解码图像缓冲单元160可用于形成一个解码器。相当于，帧内预测单元180或帧间预测单元170可基于已有的重建块对待编码图像块进行预测，进而能够保证编码端和解码端的对参考帧的理解一致。换言之，编码器可复制解码器的处理环路，进而可与解码端产生相同的预测。具体而言，量化的变换系数通过反变换与反量化单元140反变换与反量化来复制解码端的近似残差块。该近似残差块加上预测块后可经过环路滤波单元150，以平滑滤除由于基于块处理和量化产生的块效应等影响。环路滤波单元150输出的图像块可存储在解码图像缓存单元160中，以便用于后续图像的预测。

帧内预测单元180可用于帧内预测，帧内预测只参考同一帧图像的信息，预测待编码图像块内的像素信息，用于消除空间冗余；帧内预测所使用的帧可以为I帧。例如，可根据从左至右、从上到下的编码顺序，待编码图像块可以参考左上方图像块，上方图像块以及左侧图像块作为参考信息来预测待编码图像块，而待编码图像块又作为下一个图像块的参考信息，如此，可对整幅图像进行预测。若输入的数字视频为彩色格式，例如YUV 4:2:0格式，则该数字视频的每一图像帧的每4个像素点由4个Y分量和2个UV分量组成，编码框架100可对Y分量(即亮度块)和UV分量(即色度块)分别进行编码。类似的，解码端也可根据格式进行相应的解码。帧间预测单元170可用于帧间预测，帧间预测可以参考不同帧的图像信息，利用运动估计搜索最匹配待编码图像块的运动矢量信息，用于消除时间冗余；帧间预测所使用的帧可以为P帧和/或B帧，P帧指的是向前预测帧，B帧指的是双向预测帧。

针对帧内预测过程，帧内预测可借助角度预测模式与非角度预测模式对待编码图像块进行预测，以得到预测块，根据预测块与待编码图像块计算得到的率失真信息，筛选出待编码图像块最优的预测模式，并将该预测模式经码流传输到解码端。解码端解析出预测模式，预测得到目标解码块的预测块并叠加经码流传输而获取的时域残差块，可得到重建块。经过历代的数字视频编解码标准发展，非角度模式保持相对稳定，有均值模式和平面模式；角度模式则随着数字视频编解码标准的演进而不断增加。以国际数字视频编码标准H系列为例，H.264/AVC标准仅有8种角度预测模式和1种非角度预测模式；H.265/HEVC扩展到33种角度预测模式和2种非角度预测模式。在H.266/VVC中，帧内预测模式被进一步拓展，对于亮度块共有67种传统预测模式和非传统的预测模式。非传统的预测模式可以包括矩阵加权帧内预测(Matrix weighted intra-frame prediction，MIP)模式。传统预测模式包括：模式编号0的平面(planar)模式、模式编号1的DC模式和模式编号2到模式编号66的角度预测模式。图2为本申请实施例提供的33种角度预测模式的具体方向示意图，如图2所示，33种角度预测模式分为水平类模式和竖直类模式，水平类模式包括H+32(模式编号2)至H-32(模式编号17)，竖直类模式包括V-32(模式编号18)至V+32(模式编号34)。V0(模式编号26)和H0(模式编号10)分别表示竖直和水平方向，其余角度预测模式的预测方向都可以看作是在竖直或水平方向上做一个角度偏移。VVC的参考软件测试平台(VVC TEST MODEL，VTM)对于色度块除了planar模式、DC模式和角度模式外，还有跨分量线性色度预测(Cross component linear model prediction，CCLM)模式。MIP模式目前为VVC独有，而CCLM模式也存在于其它先进的标准里，例如AV1的来自亮度的色度(Chroma from Luma，CfL)模式和AVS3的两步跨分量预测模式(Two Step Cross-component Prediction Mode，TSCPM)。

图3是本申请实施例提供的MIP模式的示意性流程图。

如图3所示，利用待编码图像块左侧的K列，上方的K行和左上方的K列重建像素点为输入，采用全连接神经网络对待编码图像块进行预测，进而得到待编码图像块的预测像素点，即待编码图像块的预测块。重建像素点也可称为重构像素值或重构像素点，预测像素点也可称为预测像素值。换言之，在一个给定的形状为MxN的待编码图像块中，例如M≤32且N≤32，以待编码图像块周围的参考点为输入，采用全连接神经网络对待编码图像块进行预测，进而得到待编码图像块的预测块。待编码图像块周围的参考点可以由待编码图像块周围的K行宽度为N+K的上参考行和K列高度为M的左参考行构成。针对不同形状的待编码图像块，对全连接神经网络的多套参数即多套网络权重需要进行率失真筛选，选择出最优的一套网络权重进行预测，并将此套参数的索引编入码流。网络权重可包括矩阵和偏置(biases)等参数。

需要说明的是，MIP模式源于基于神经网络的预测模式，具体源于基于全连接神经网络的帧内预测模式。基于神经网络的预测模式指采用神经网络对图像块进行帧内预测。基于神经网络的预测模式可包括基于非线性神经网络的预测模式或基于线性网络的预测模式。通常基于预先准备好的训练集训练出一套或多套网络权重，在使用基于神经网络的预测模式对图像块进行帧内预测时，通过读取预先训练好的一套或多套网络权重来生成预测块，然而，训练中会因为考虑到神经网络的泛用性，往往使用通用训练集训练出大多数情况下都较为适用的网络权重，但即便如此，在实际预测中，也仍会存在待编码图像块对应的训练集没有被通用训练集包括的情况，对于这样的待编码图像块，大都会选中非神经网络的帧内预测模式。此外，MIP模式局限于其只使用在亮度块的预测。并且，MIP模式的模型种类过多，训练起来较为复杂。

MIP模式相比于基于神经网络的预测模式，经过了包括网络参数、输入点数等多方面的简化，最终采用向量乘矩阵的形式完成预测。在MIP模式中，对于一个宽度为N，高度为M的待编码图像块，MIP模式会选取该块上方一行的W个重建像素点和左侧一列的H个重建像素点作为输入。如果这些位置的像素还未被重建，可像传统预测方法一样处理。MIP模式产生预测值主要基于三个步骤，分别是参考像素取均值、矩阵向量相乘和线性插值上采样。MIP模式作用于4x4至32x32大小的块，对于一个长方形的块，若长方形短边长为4时，将会从预先训练好的16套16列4行的矩阵和偏置(即网络权重)中选取最优；若长方形短边长为8时，将会从预先训练好的8套16列8行的矩阵和偏置中选取最优；若长方形短边长为16时；将会从预先训练好的6套64列8行的矩阵和偏置中选取最优。可通过合并多个训练后的神经网络的网络权重，获取上述涉及特定尺寸的块所对应的多套的矩阵和偏置。

图4是本申请实施例提供的解码器侧重构过程框图(Block diagram of decoder-side reconstruction process)的示例。

如图4所示，解码端可先执行模式列表推导(mode list derivation)过程，具体的，先将参考点属于包括隐藏层和输出层的神经网络，并输出排序的可能模式列表(sort mode probability list)，然后基于解析码流得到的预测索引在基于可能模式列表确定的模式列表(mode list)中选择使用的预测模式，进而基于使用的预测模式进行图像块的预测。在预测过程中，可先将参考点输出包括隐藏层1至隐藏层3以及输出层的神经网络，神经网络输出预测块。当然，本申请实施例中的神经网络可由若干层全连接隐藏层和非线性激活函数组成，图4中包括的隐藏层的数量仅为示例，不应理解为对本申请的限制。当然，也可以基于卷积神经网络(CNN)的帧内预测或基于循环神经网络(RNN)的帧内预测等等，本申请实施例对此不作具体限定。

应理解，图1至图4仅为本申请的示例，不应理解为对本申请的限制。

例如，该编码框架100中的环路滤波单元150可包括去块滤波器(DBF)和样点自适应补偿滤波(SAO)。DBF的作用是去块效应，SAO的作用是去振铃效应。在本申请的其他实施例中，该编码框架100可采用基于神经网络的环路滤波算法，以提高视频的压缩效率。或者说，该编码框架100可以是基于深度学习的神经网络的视频编码混合框架。在一种实现中，可以在去块滤波器和样点自适应补偿滤波基础上，采用基于卷积神经网络的模型计算对像素滤波后的结果。环路滤波单元150在亮度分量和色度分量上的网络结构可以相同，也可以有所不同。考虑到亮度分量包含更多的视觉信息，还可以采用亮度分量指导色度分量的滤波，以提升色度分量的重建质量。

图5是本申请实施例提供的解码框架200的示意性框图。

如图5所示，该解码框架200可包括熵解码单元210、反变换反量化单元220、残差单元230、帧内预测单元240、帧间预测单元250、环路滤波单元260、解码图像缓存单元270。

熵解码单元210接收并解析码流后，以获取预测块和频域残差块，针对频域残差块，通过反变换反量化单元220进行反变换与反量化等步骤，可获取时域残差块，残差单元230将帧内预测单元240或帧间预测单元250预测得到的预测块叠加至经过通过反变换反量化单元220进行反变换与反量化之后的时域残差块，可得到重建块。例如，帧内预测单元240或帧间预测单元250可通过解码码流的头信息，获取预测块。

本申请实施例提供了一种基于在线训练神经网络的编码方法。

图6是本申请实施例提供的编码框架100-1的示意性流程图。

如图6所示，编码器可利用原始的待编码图像帧生成训练集，将训练集输入到网络结构中得到神经网络的网络权重，基于此，可使用得到的网络权重进行对待编码图像块进行预测。网络结构为预先定义好的结构，例如网络结构可根据预测亮度或色度以及待编码图像块的大小形状的变化而定义多组网络构，网络可以是非线性的网络或是线性的网络。基于此，使用第一预测模式或传统预测模式得到的预测块经过变化与量化，以及熵编码后写入码流。可选的，还需要将第一预测模式的控制标识和神经网络使用的网络权重写入码流。所述编码框架100-1可包括用于执行第一预测模式的在线神经网络单元，需要说明的是，所述编码框架100-1是编码框架100的扩展，即编码框架100-1中的其他单元可参见编码框架100中的相关描述，为避免重复，此处不再赘述。

训练神经网络时用到的参数包括但不限于批次大小(batch size)等参数以及学习率(learning rate)或优化器(Optimizer)等超参数。在机器学习中，超参数是在开始学习过程之前设置值的参数，而不是通过训练得到的参数数据。通常情况下，需要对超参数进行优化，给学习机选择一组最优超参数，以提高学习的性能和效果。批次大小用于定义一次训练所选取的样本数，或批次大小用于定义训练的每次迭代处理所选取的样本数。批次大小的取值影响模型的优化程度和速度，也直接影响到处理器内存的使用情况。可选的，处理器内存越小，批次大小的取值越小。训练神经网络时用到的损失函数包括但不限于L1函数，L2函数或离散余弦变换(DCT for Discrete Cosine Transform，DCT)变换函数等。损失函数(loss function)也可称为代价函数(cost function)，其被用于模型的参数估计(parametric estimation)。

本申请实施例中，编码端在线训练一套或多套的网络权重，所述一套或多套网络权重用于构建第一预测模式。在一种实现方式中，编码器可对所述一套或多套网络权重进行量化。在一种实现方式中，编码器从第一预测模式和传统预测模式中选择最优预测模式。在一种实现方式中，编码器将选中的模式编入码流，即新增语法元素。在一种实现方式中，编码器对在线训练得到的帧内预测网络权重进行编码。

图7是本申请实施例提供的编码方法300的示意性流程图。应理解，该编码方法300可由编码端执行。例如应用于图6所示的编码框架100-1。为便于描述，下面以编码端为例进行说明。

如图7所示，所述编码方法300可包括：

S310，获取目标图像序列和允许标识，所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

S320，将所述目标图像序列中的目标图像帧划分为多个图像块，所述多个图像块包括目标图像块；

S330，基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

S340，基于所述目标预测块，得到目标残差块；

S350，对所述允许标识以及所述目标残差块进行编码，得到码流。

在线训练可以有效提高编码性能，降低基于神经网络的帧内预测复杂度。在线训练网络的参数量远小于预先训练好的固定模型，在线训练可降低计算量复杂度。将在线预测的帧内色度预测模式集成进了VTM-10.0测试软件，得到测试结果如表1所示，下面结合表1对第一预测模式的预测性能进行说明。

表1

如表1所示，Class-B为1080p的测试视频，Class-C为480p的测试视频，Class-E为720p的测试视频。比约加德增量比特率(

delta bit rate，BD-rate)为负代表基于第一预测模式的测试结果相对于神经网络基于预先训练的网络权重的测试结果的性能提升。BD-rate代表相同峰值信噪比(Peak Signal to Noise Ratio，PSNR)下的码率差异，BD-rate越小表示编码算法的性能越好。

需要说明的是，一般来说，码率降低，PSNR增大，能够说明新方法具有较好的性能。然而，会出现这样一种情况，即码率相对于原来的方法有所降低，但是PSNR即视频的质量却降低了，在这种情况下，可以采用BD-rate衡量编码算法的性能。当然，在视频处理过程中，也可利用其他参数来衡量编码算法的性能，以表征利用新方法得到的视频相对于原来的方法得到的视频在码率和PSNR上的变化情况，本申请实施例对此不作具体限定。例如，也可采用比约加德增量信号噪音功率比(

delta peak signal-to-noise rate，BD-PSNR)来衡量编码算法的性能，BDPSNR代表相同码率下的PSNR的差异，BD-PSNR越大表示编码算法的性能越好。

此外，本申请实施例中，编码端在线训练采用的训练集可以为重建图像，此时编码端需要进行两遍帧内编码，第一遍编码得到的重建图像作为训练集，用于在线训练网络权重，第二遍编码将在线训练得到的预测模式作为备选模式的一种加入和传统帧内模式的竞争，并进行编码。此外，本申请实施例对第一预测模式使用的网络结构不作具体限定，作为示例，第一预测模式使用的网络结构可以是非线网络结构，例如非线性的RNN,LSTM,CNN等非线网络结构，也可以预测值由若干个邻近像素值通过加权的方式得到的线性网络。

下面结合表2中的语法元素对本申请的方案进行说明。

表2

如表2所示，序列参数集(seq_parameter_set_rbsp)可包括允许标识(sps_aip_enabled_flag)，允许标识为序列级控制开关，用于控制在当前序列是否开启第一预测模式，如该flag为1则代表在当前序列开启第一预测模式，为0则代表关闭第一预测模式。在具体实现中，可以通过用户设置的方式控制序列参数集是否开启允许标识，在序列参数集中开启所述允许标识的情况下，编码器可通过查询用户配置的配置文件获取所述允许标识的具体数值，即该flag为1还是为0。

在本申请的一些实施例中，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述方法330还可包括：

在所述第一预测模式和传统预测模式中选择最优预测模式，利用所述最有预测模式对所述目标残差块进行帧内预测，得到所述目标预测块。

在本申请的一些实施例中，所述在所述第一预测模式和传统预测模式中选择最优预测模式，包括：

使用所述第一预测模式对所述目标图像块进行帧内预测，得到第一预测块；

使用所述传统预测模式对所述目标图像块进行帧内预测，以得到第二预测块；

若所述第一预测块的率失真代价低于所述第二预测块的率失真代价，将所述第一预测模式确定为所述最优预测模式；若所述第一预测块的率失真代价高于所述第二预测块的率失真代价，将所述传统预测模式确定为所述最优预测模式。

换言之，基于所述第一预测模式是否被选中由编码端决定。在编码端，当筛选帧内预测模式时，基于所述第一预测模式与传统预测模式会共同进行率失真筛选。若传统模式代价低，则选中传统预测模式；若所述第一预测模式代价低，则选中所述第一预测模式。选中的模式将被编入码流供解码端读取。在解码端，当解析出的预测模式为所述第一预测模式时，采用所述第一预测模式进行预测；当解析出为传统模式时，采用对应传统模式进行预测。

例如，预测模式选择为在传统的帧内预测模式与在线训练出的帧内预测模式之中选出代价最小的预测模式，代价衡量标准可基于如下公式确定：

L＝λ×R+D；

其中，R代表当前编码方式所消耗的bit数，D代表当前编码方式造成的重建块与原始块之间的失真，λ为一个可变的系数。

在本申请的一些实施例中，所述目标图像块包括目标亮度块，所述S330可包括：

对所述允许标识、亮度控制标识以及所述目标残差块进行编码，得到所述码流；所述亮度控制标识用于标识是否使用所述第一预测模式对所述目标亮度块进行帧内预测。

当在线训练的网络可用于亮度块预测且仅有一套网络权重可供选择时，语法元素可如下表所示。

表3

如表3所示，编码端在编码过程中，码流中需要写入亮度控制标识intra_aip_flag[x0][y0]，亮度控制标识为图像块级标识，控制当前亮度块是否适用第一预测模式，如该亮度控制标识为1则代表当前亮度块适用第一预测模式，为0则代表当前亮度块不适用第一预测模式。

在一种实现方式中，所述亮度控制标识用于标识使用所述第一预测模式对所述目标亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述S330可包括：

对所述允许标识、所述亮度控制标识、亮度索引以及所述目标残差块进行编码，得到所述码流；所述亮度索引用于指示所述多个网络权重中的目标网络权重，所述目标网络权重为对所述目标亮度块进行帧内预测时所述第一预测模式使用的网络权重。

当在线训练的网络可用于亮度块预测且有多套网络权重可供选择时，语法元素可如下表所示。

表4

如表4所示，编码端在编码过程中，码流中不仅需要写入亮度控制标识intra_aip_flag[x0][y0]，还需要写入亮度索引intra_aip_mode[x0][y0]，亮度控制标识和亮度索引均为为图像块级标识，亮度控制标识控制当前亮度块是否适用第一预测模式，如该亮度控制标识为1则代表当前亮度块适用第一预测模式，为0则代表当前亮度块不适用第一预测模式。亮度索引仅在当前预测块有多套网络权重时存在，若不存在多种预测权重，则无此语法元素。

在本申请的一些实施例中，所述目标图像块包括目标色度块，所述S330可包括：

对所述允许标识、色度控制标识以及所述目标残差块进行编码，得到所述码流；所述色度控制标识用于标识是否使用所述第一预测模式对所述目标色度块进行帧内预测。

当在线训练的网络可用于色度块预测且仅有一套网络权重可供选择时，语法元素可如下表所示。

表5

如表5所示，编码端在编码过程中，码流中需要写入色度控制标识intra_chroma_aip_flag，色度控制标识为图像块级标识，控制当前色度块是否适用第一预测模式，如该色度控制标识为1则代表当前色度块适用第一预测模式，为0则代表当前色度块不适用第一预测模式。

在一种实现方式中，所述色度控制标识用于标识使用所述第一预测模式对所述色度亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述S330可包括：

对所述允许标识、所述色度控制标识、色度索引以及所述目标残差块进行编码，得到所述码流；所述色度索引用于指示所述多个网络权重中的目标网络权重，所述目标网络权重为对所述目标色度块进行帧内预测时所述第一预测模式使用的网络权重。

表6

如表6所示，编码端在编码过程中，码流中不仅需要写入色度控制标识intra_chroma_aip_flag，还需要写入色度索引intra_chroma_aip_mode，色度控制标识和色度索引均为为图像块级标识，色度控制标识控制当前色度块是否适用第一预测模式，如该色度控制标识为1则代表当前色度块适用第一预测模式，为0则代表当前色度块不适用第一预测模式。色度索引仅在当前预测块有多套网络权重时存在，若不存在多种预测权重，则无此语法元素。

在本申请的一些实施例中，所述方法300还可包括：

基于目标对象获取训练数据，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块；基于所述训练数据训练至少一套网络权重，所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重。

换言之，编码端可以基于每一个图像帧使用一套在线训练的网络权重，也可为每个序列共享一套或若干套网络权重，还可以为每个切片共享一套或若干套网络权重，还可以为每个CTU共享一套或若干套网络权重。本申请实施例对此不作具体限定。

在一种实现方式中，所述至少一套网络权重包括用于亮度块的网络权重，所述训练数据包括用于训练用于亮度块的网络权重的训练亮度块；以所述训练亮度块相邻的重建部分为输入，训练用于亮度块的网络权重。

在一种实现方式中，所述至少一套网络权重包括用于色度块的网络权重，所述训练数据包括用于训练用于色度块的网络权重的训练色度块；以所述训练色度块相邻的重建部分，所述训练色度块的重建部分和所述训练色度块相邻的重建部分为输入，训练用于色度块的网络权重。

在一种实现方式中，所述训练数据包括用于训练所述第一预测模式的网络权重的训练图像块；利用所述训练图像块的像素值减去所述训练图像块的像素值的平均值，得到训练集；基于所述训练集训练所述至少一套网络权重。

换言之，在线训练的训练集为当前图像帧的数据。可选的，根据网络结构的不同，训练数据的形状可以不同。训练数据可以选取原始像素值，也可以选取重建像素值。当训练数据选取重建像素值时，当前帧需要事先经过一次常规的帧内压缩生成重建数据。

在每个图像帧编码开始前，以YUV420格式的待压缩视频为例，获取Y分量Cb分量和Cr分量的原始像素值。将Y分量切分成若干个16x16的块，Cb和Cr分量分别切分成8x8的块，切分出的Y，Cb，Cr块通过减去当前块内均值的预处理后，按照在原图中的对应位置配对生成若干个训练集。训练集的训练数据为去均值的Y块，形状为Nx16x16x1的数组，N代表训练集中训练数据的样本数，16x16代表训练数据的块大小，1代表通道数为1，即Y分量；训练集的训练标签(label)为为去均值的Cb块和Cr块，形状为Nx8x8x2，N代表训练集中训练标签的样本数，8x8代表训练标签的块大小，2代表通道数为2，分别为Cb分量和Cr分量。需要说明的是，训练集中的训练数据可作为输入数据，训练集中的训练标签可作为输出数据。

如图8所示，网络结构为3层的卷积神经网络，第一层卷积层包括4个3x3x1的卷积核和一个非线性激活函数Relu，第二层卷积层包括4个3x3x4的卷积核和一个非线性激活函数Relu，第三层卷积层包括2个3x3x4的卷积核。网络的输入为去均值16x16的亮度块，输出为2个8x8的块分别代表去均值的Cb和Cr分量。

在一种实现方式中，基于所述训练数据训练神经网络，得到至少一个浮点数；量化所述至少一个浮点数中的每一个浮点数，以得到整数形式的所述至少一套网络权重。

本实施例中，通过量化网络权重可以降低硬件复杂度，网络权重经过量化后由32bit的浮点数变成了低比特(bit)深度的整数，通过整数计算的神经网络在硬件实现上更加友好。应当理解，本申请实施例对整数具体包括的比特位数不作限定。

需要说明的是，一套网络权重可以包括权矩阵参数和/或偏置(biases)参数，基于此，所述至少一个浮点数可以包括至少一个浮点形式的矩阵参数和/或至少一个浮点形式的偏执参数。

在一种实现方式中，基于以下公式量化所述至少一个浮点数中的每一个浮点数：

w _i＝round(w _f×2^bitdepth)；

其中，w _f表示所述至少一个浮点数中的浮点数，round()表示按照指定的小数位数进行四舍五入的运算，w _i表示整数形式的网络权重，bitdepth表示用于将浮点数量化为整数形式的量化参数。浮点数在计算机中用以近似表示任意某个实数。round()用于返回一个数值，该数值是按照指定的小数位数进行四舍五入运算的结果。可选的，bitdepth＝bitlength-1，其中，bitlength表示量化后的整数的比特长度。例如，bitlength为6，则bitdepth为5。

w _i＝round(w _f×Scale)-((2^bitlength)/2)×((W _fmax+W _fmin)/(W _fmax-W _fmin))；

Scale＝(2^bitlength)/(W _fmax-W _fmin)；

其中，w _f表示所述至少一个浮点数中的浮点数，round()表示按照指定的小数位数进行四舍五入的运算，bitlength表示量化后的整数的比特长度，Scale表示量化尺度，W _fmax和W _fmin分别为所述至少一个浮点数中的最大浮点数和最小浮点数。

换言之，可以基于以下公式量化所述至少一个浮点数中的每一个浮点数：

w _i＝round(w _f×Scale)-Offset；

Scale＝(2^bitlength)/(W _fmax-W _fmin)；

Offset＝Scale×(W _fmax+W _fmin)/2。

其中，Offset表示量化过程中用于将整数形式的网络权重移位到-2^(bitdepth)到2^(bitdepth)范围内的一个偏移量，换言之，通过Offset能够保证量化后的网络权重在-2^(bitdepth)到2^(bitdepth)范围内。

当然，上述量化方式仅为本申请的示例，也可以采用其他量化方式，本申请实施例对此不作具体限定。

在一种实现方式中，若确定使用所述第一预测模式对所述目标图像块进行帧内预测，基于所述至少一套网络权重中的整数形式的目标网络权重，使用所述第一预测模式对所述目标图像块进行帧内预测，得到量化预测块；对所述量化预测块进行反量化处理，以得到所述目标预测块。需注意，由于网络权重在量化的过程中被放大了Scale倍，即(2^bitdepth)倍，故在每层卷积结束后，卷积结果需要缩放2^bitdepth倍，这里可以通过移位操作来完成缩放。例如，基于以下公式对所述量化预测块每层的卷积结果进行反量化处理，以得到所述目标预测块：

O'＝(O+(2^bitdepth)/2)＞＞bitdepth；

其中，O'表示所述目标预测块的计算过程中的、针对所述神经网络中的每个卷积层的、且未经过反量化处理的结果，O表示所述量化预测块的计算过程中的、针对所述神经网络中的每个卷积层的、且经过反量化处理的结果，bitdepth表示用于将浮点数量化为整数形式的量化参数。经过反量化处理的结果可以理解为已完成缩放处理或位移操作的结果。

例如，假设网络权重相比浮点数放大了32倍，则在预测过程中使用整数形式的网络权重进行推理预测时，每层卷积结束需将结果缩小32倍，即为bitdepth为6。

需要说明的是，在上文中，是针对每一个卷积层的卷积结果进行反量化处理的，但本申请实施例并不限于成。例如，在本申请的其他实施例中，还可以针对神经网络的结果进行反量化处理，即所述量化预测块可以是经过反量化处理前的神经网络输出结果，相应的，所述目标预测块可以是经过反量化处理后的神经网络输出结果，此时，将所述对所述量化预测块进行反量化处理时，bitdepth与神经网络中卷积层的数量相关。神经网络中卷积层的数量越大，bitdepth的数值越大。

在本申请的一些实施例中，所述S330可包括：

对所述允许标识、所述至少一套网络权重以及所述目标残差块进行编码，得到所述码流。

在本申请的一些实施例中，所述至少一套网络权重位于所述目标对象的码流的头部。

当然，所述至少一套网络权重也可保存于码流的其他位置，本申请实施例对此不作具体限定。

在本申请的一些实施例中，所述S330可包括：

对所述允许标识、所述至少一套网络权重、权重控制标识以及所述目标残差块进行编码，得到所述码流，所述权重控制标识用于标识所述目标对象的码流中是否包括所述至少一套网络权重。

在本申请的一些实施例中，所述S330可包括：

对所述允许标识、所述至少一套网络权重、权重控制标识、网络权重符号标识以及所述目标残差块进行编码，得到所述码流，所述权重控制标识用于标识所述目标对象的码流中是否包括所述至少一套网络权重，所述网络权重符号标识用于标识所述至少一套网络权重中的网络权重为正的或负的。

下面以所述至少一套网络权重位于所述目标图像帧的码流的头部为例，语法元素可如下表所示。

表7

如表7所示，权重控制标识aip_info_ph_flag代表当前图像帧是否包括网络权重，该权重控制标识为1代表当前图像帧包括网络权重，该权重控制标识为0代表当前图像帧不包括网络权重。所述至少一套网络权重可以为参数aip_params。网络权重符号标识aip_param_sign代表网络权重的正负，网络权重符号标识为0代表正，网络权重符号标识为1代表负。

在本申请的一些实施例中，所述S330可包括：

对所述允许标识、所述至少一套网络权重的残差以及所述目标残差块进行编码，得到所述码流；所述至少一套网络权重的残差包括所述至少一套网络权重中的每一套网络权重减去预先训练的网络权重后的残差。

例如，编码端使用一套或若干套预先训练的网络作为基础网络权重，在线训练出的网络权重通过与基础网络权重相减得到网络权重的残差，通过保存网络权重的残差的方式间接保存在线训练得到的网络权重。

在本申请的一些实施例中，所述至少一套网络权重的编码方式为定长码编码方式或变长码编码方式。

当然，也可以采用其他编码方式，例如也可以采用网络权重压缩的方式将网络权重进一步压缩后保存进码流，本申请实施例对此不作具体限定。

在本申请的一些实施例中，所述方法300还可包括：

获取预先训练好的一套或多套网络权重；

基于所述一套或多套网络权重，确定用于所述第一预测模式的网络权重。

例如，编码端使用一套或若干套预先训练的网络权重作为基础网络权重，在线训练出的网络权重都为基础网络权重上通过做微调(fine-tuning)得到。

在本申请的一些实施例中，所述允许标识用于标识不允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述S330可包括：

利用传统预测模式对所述目标残差块进行帧内预测，得到所述目标预测块。

上文中从编码端的角度详细描述了根据本申请实施例的编码方法，下面将结合图10，从解码端的角度描述根据本申请实施例的解码方法。

本申请实施例还提供了一种基于在线训练神经网络的解码方法。解码端可以从码流中获取一套或多套权重，将获取的一套或多套权重载入网络结构，重建在线训练得到的第一预测模式，然后解码器从码流中获取选中第一预测模式的图像块，并采用第一预测模式对其进行预测。

图9是本申请实施例提供的解码框架200-1的示意性流程图。如图9所示，所述解码框架200-1可包括用于执行第一预测模式的在线神经网络单元，在线训练的帧内预测模式在解码部分中，包括解码端从码流中获取当前图像帧的网络权重，从码流中获取选中在线训练的帧内预测模式，基于此，确定使用在线训练的帧内预测模式对当前图像块进行帧内预测时，使用在线训练的帧内预测模式对当前图像块进行帧内预测。需要说明的是，所述解码框架200-1是解码框架200的扩展，即解码框架200-1中的其他单元可参见解码框架200中的相关描述，为避免重复，此处不再赘述。

图10示出了根据本申请实施例的解码方法400的示意性流程图。应理解，该解码方法400可由解码端执行。例如应用于图9所示的解码框架200-1。

如图10所示，所述解码方法400可包括：

S410，通过解析码流，获取允许标识以及目标图像序列中的目标图像块的目标残差块；所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

S420，基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

S430，基于所述目标残差块和所述目标预测块，得到所述目标图像帧。

在本申请的一些实施例中，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述目标图像块包括目标亮度块，所述目标预测块包括所述目标亮度块的预测块；所述S420可包括：

通过解析所述码流亮度控制标识；所述亮度控制标识用于标识是否使用所述第一预测模式对所述目标亮度块进行帧内预测；

基于所述亮度控制标识，对所述目标亮度块进行帧内预测，得到所述目标亮度块的预测块。

在本申请的一些实施例中，所述亮度控制标识用于标识使用所述第一预测模式对所述目标亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述S420可包括：

通过解析所述码流获取亮度索引；所述亮度索引用于指示所述多个网络权重中的目标网络权重；

基于所述目标网络权重，利用所述第一预测模式，对所述目标亮度块进行帧内预测，得到所述目标亮度块的预测块。

在本申请的一些实施例中，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述目标图像块包括目标色度块，所述目标预测块包括所述目标色度块的预测块；所述S420可包括：

通过解析所述码流获取色度控制标识；所述色度控制标识用于标识是否使用所述第一预测模式对所述目标色度块进行帧内预测；

基于所述色度控制标识，对所述目标色度块进行帧内预测，得到所述目标色度块的预测块。

在本申请的一些实施例中，所述色度控制标识用于标识使用所述第一预测模式对所述色度亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述S420可包括：

通过解析所述码流色度索引；所述色度索引用于指示所述多个网络权重中的目标网络权重；

基于所述目标网络权重，利用所述第一预测模式，对所述目标色度块进行帧内预测，得到所述目标色度块的预测块。

在本申请的一些实施例中，所述方法400还可包括：

通过解析所述码流，获取至少一套网络权重；所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块。

在本申请的一些实施例中，所述方法400还可包括：

通过解析所述码流，获取至少一套网络权重的残差；所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块，所述至少一套网络权重的残差包括所述至少一套网络权重中的每一套网络权重减去预先训练的网络权重后的残差。

在本申请的一些实施例中，所述方法400还可包括：

若所述允许标识用于标识不允许使用所述第一预测模式对所述目标图像序列中的图像块进行帧内预测，使用传统预测模式对所述目标图像块进行帧内预测，得到目标预测块。

应理解，解码方法400的过程为编码方法300的逆过程，即解码方法400中的步骤可以参考编码方法300中的相应步骤，为了简洁，在此不再赘述。

以上结合附图详细描述了本申请的优选实施方式，但是，本申请并不限于上述实施方式中的具体细节，在本申请的技术构思范围内，可以对本申请的技术方案进行多种简单变型，这些简单变型均属于本申请的保护范围。例如，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本申请对各种可能的组合方式不再另行说明。又例如，本申请的各种不同的实施方式之间也可以进行任意组合，只要其不违背本申请的思想，其同样应当视为本申请所公开的内容。还应理解，在本申请的各种方法实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上文从编码端的角度详细描述了根据本申请实施例的编码方法，下面结合图10，从解码端的角度描述根据本申请实施例的解码方法。

图10示出了根据本申请实施例的解码方法400的示意性流程图。所述方法400可以由包括基于在线训练神经网络的帧内预测单元的解码框架。在一种实现方式中，可将基于在线训练神经网络的帧内预测单元扩展至图4所述的解码框架中，以执行所述解码方法400。

如图10所示，所述方法400可包括：

上文详细描述了本申请的方法实施例，下文结合图11至图13，详细描述本申请的装置实施例。

图11是本申请实施例的编码器500的示意性框图。

如图11所示，所述编码器500可包括：

获取单元510，用于获取目标图像序列和允许标识，所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式

划分单元520，用于将所述目标图像序列中的目标图像帧划分为多个图像块，所述多个图像块包括目标图像块；

预测单元530，用于基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

残差单元540，用于基于所述目标图像的目标预测块得到目标残差块；

编码单元550，用于对所述允许标识以及所述目标残差块进行编码，得到码流。

在本申请的一些实施例中，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述预测单元530还用于：

在本申请的一些实施例中，所述预测单元530具体用于：

在本申请的一些实施例中，所述目标图像块包括目标亮度块，所述编码单元550具体用于：

在本申请的一些实施例中，所述亮度控制标识用于标识使用所述第一预测模式对所述目标亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述编码单元550具体用于：

在本申请的一些实施例中，所述目标图像块包括目标色度块，所述编码单元550具体用于：

在本申请的一些实施例中，所述色度控制标识用于标识使用所述第一预测模式对所述色度亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述编码单元550具体用于：

在本申请的一些实施例中，所述预测单元530还用于：

基于目标对象获取训练数据，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块；

基于所述训练数据训练至少一套网络权重，所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重。

在本申请的一些实施例中，所述至少一套网络权重包括用于亮度块的网络权重，所述训练数据包括用于训练用于亮度块的网络权重的训练亮度块；所述预测单元530具体用于：

以所述训练亮度块相邻的重建部分为输入，训练用于亮度块的网络权重。

在本申请的一些实施例中，所述至少一套网络权重包括用于色度块的网络权重，所述训练数据包括用于训练用于色度块的网络权重的训练色度块；所述预测单元530具体用于：

以所述训练色度块相邻的重建部分，所述训练色度块的重建部分和所述训练色度块相邻的重建部分为输入，训练用于色度块的网络权重。

在本申请的一些实施例中，所述训练数据包括用于训练所述第一预测模式的网络权重的训练图像块；所述预测单元530具体用于：

利用所述训练图像块的像素值减去所述训练图像块的像素值的平均值，得到训练集；

基于所述训练集训练所述至少一套网络权重。

在本申请的一些实施例中，所述预测单元530具体用于：

基于所述训练数据训练神经网络，得到至少一个浮点数；

量化所述至少一个浮点数中的每一个浮点数，以得到整数形式的所述至少一套网络权重。

在本申请的一些实施例中，所述预测单元530具体用于：

基于以下公式量化所述至少一个浮点数中的每一个浮点数：

w _i＝round(w _f×2^bitdepth)；

其中，w _f表示所述至少一个浮点数中的浮点数，round()表示按照指定的小数位数进行四舍五入的运算，w _i表示整数形式的网络权重，bitdepth表示用于将浮点数量化为整数形式的量化参数。

在本申请的一些实施例中，所述预测单元530具体用于：

基于以下公式量化所述至少一个浮点数中的每一个浮点数：

Scale＝(2^bitlepth)/(W _fmax-W _fmin)；

在本申请的一些实施例中，所述预测单元530具体用于：

若确定使用所述第一预测模式对所述目标图像块进行帧内预测，基于所述至少一套网络权重中的整数形式的目标网络权重，使用所述第一预测模式对所述目标图像块进行帧内预测，得到量化预测块；

对所述量化预测块进行反量化处理，即每层卷积结果需缩放2^bitdepth倍，以得到所述目标预测块。

在本申请的一些实施例中，所述预测单元530具体用于：

基于以下公式对所述量化预测块进行反量化处理，以得到所述目标预测块：

O'＝(O+(2^bitdepth)/2)＞＞bitdepth；

其中，O'表示所述目标预测块的计算过程中的、针对所述神经网络中的每个卷积层的、且未经过反量化处理的结果，O表示所述量化预测块的计算过程中的、针对所述神经网络中的每个卷积层的、且经过反量化处理的结果，bitdepth表示用于将浮点数量化为整数形式的量化参数。

在本申请的一些实施例中，所述编码单元550具体用于：

在本申请的一些实施例中，所述预测单元530还用于：

获取预先训练好的一套或多套网络权重；

在本申请的一些实施例中，所述允许标识用于标识不允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述预测单元530具体用于：

图12是本申请实施例的解码器600的示意性框图。

如图12所示，所述解码器600可包括：

解析单元610，用于通过解析码流，获取允许标识以及目标图像序列中的目标图像块的目标残差块；所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

预测单元620，用于基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

处理单元630，用于基于所述目标残差块和所述目标预测块，得到所述目标图像帧。

在本申请的一些实施例中，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述目标图像块包括目标亮度块，所述目标预测块包括所述目标亮度块的预测块；所述预测单元620具体用于：

在本申请的一些实施例中，所述亮度控制标识用于标识使用所述第一预测模式对所述目标亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述预测单元620具体用于：

在本申请的一些实施例中，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述目标图像块包括目标色度块，所述目标预测块包括所述目标色度块的预测块；所述预测单元620具体用于：

在本申请的一些实施例中，所述色度控制标识用于标识使用所述第一预测模式对所述色度亮度块进行帧内预测，所述第一预测模式包括多个网络权重；所述预测单元620具体用于：

在本申请的一些实施例中，所述解析单元610还用于：

在本申请的一些实施例中，所述预测单元620具体用于：

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。为避免重复，此处不再赘述。具体地，图11所示的编码器500可以对应于执行本申请实施例的方法300中的相应主体，即编码器500中的各个单元的前述和其它操作和/或功能分别为了实现方法300等各个方法中的相应流程。图12所示的解码器600可以对应于执行本申请实施例的方法400中的相应主体，并且解码器600中的各个单元的前述和其它操作和/或功能分别为了实现方法400等各个方法中的相应流程。

还应当理解，本申请实施例涉及的编码器500或解码器600中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其它实施例中，该编码器500或解码器600也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。根据本申请的另一个实施例，可以通过在包括例如中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的通用计算机的通用计算设备上运行能够执行相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造本申请实施例涉及的编码器500或解码器600，以及来实现本申请实施例的编码方法或解码方法。计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质装载于电子设备中，并在其中运行，来实现本申请实施例的相应方法。

换言之，上文涉及的单元可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过软硬件结合的形式实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件组合执行完成。可选地，软件可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图13是本申请实施例提供的电子设备700的示意结构图。

如图13所示，该电子设备700至少包括处理器710以及计算机可读存储介质720。其中，处理器710以及计算机可读存储介质720可通过总线或者其它方式连接。计算机可读存储介质720用于存储计算机程序721，计算机程序721包括计算机指令，处理器710用于执行计算机可读存储介质720存储的计算机指令。处理器710是电子设备700的计算核心以及控制核心，其适于实现一条或多条计算机指令，具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。

作为示例，处理器710也可称为中央处理器(CentralProcessingUnit，CPU)。处理器710可以包括但不限于：通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

作为示例，计算机可读存储介质720可以是高速RAM存储器，也可以是非不稳定的存储器(Non-VolatileMemory)，例如至少一个磁盘存储器；可选的，还可以是至少一个位于远离前述处理器710的计算机可读存储介质。具体而言，计算机可读存储介质720包括但不限于：易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在一种实现方式中，该电子设备700可以是本申请实施例涉及的编码端、编码器或编码框架；该计算机可读存储介质720中存储有第一计算机指令；由处理器710加载并执行计算机可读存储介质720中存放的第一计算机指令，以实现本申请实施例提供的编码方法中的相应步骤；换言之，计算机可读存储介质720中的第一计算机指令由处理器710加载并执行相应步骤，为避免重复，此处不再赘述。

在一种实现方式中，该电子设备700可以是本申请实施例涉及的解码端、解码器或解码框架；该计算机可读存储介质720中存储有第二计算机指令；由处理器710加载并执行计算机可读存储介质720中存放的第二计算机指令，以实现本申请实施例提供的解码方法中的相应步骤；换言之，计算机可读存储介质720中的第二计算机指令由处理器710加载并执行相应步骤，为避免重复，此处不再赘述。

根据本申请的另一方面，本申请实施例还提供了一种计算机可读存储介质(Memory)，计算机可读存储介质是电子设备700中的记忆设备，用于存放程序和数据。例如，计算机可读存储介质720。可以理解的是，此处的计算机可读存储介质720既可以包括电子设备700中的内置存储介质，当然也可以包括电子设备700所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了电子设备700的操作系统。并且，在该存储空间中还存放了适于被处理器710加载并执行的一条或多条的计算机指令，这些计算机指令可以是一个或多个的计算机程序721(包括程序代码)。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。例如，计算机程序721。此时，数据处理设备700可以是计算机，处理器710从计算机可读存储介质720读取该计算机指令，处理器710执行该计算机指令，使得该计算机执行上述各种可选方式中提供的编码方法或解码方法。

换言之，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地运行本申请实施例的流程或实现本申请实施例的功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质进行传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元以及流程步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

最后需要说明的是，以上内容，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种编码方法，其特征在于，包括：

获取目标图像序列和允许标识，所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

将所述目标图像序列中的目标图像帧划分为多个图像块，所述多个图像块包括目标图像块；

基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

基于所述目标预测块，得到目标残差块；

对所述允许标识以及所述目标残差块进行编码，得到码流。
根据权利要求1所述的方法，其特征在于，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；

所述基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块，包括：

在所述第一预测模式和传统预测模式中选择最优预测模式；

利用所述最优预测模式对所述目标残差块进行帧内预测，得到所述目标预测块。
根据权利要求2所述的方法，其特征在于，所述在所述第一预测模式和传统预测模式中选择最优预测模式，包括：

使用所述第一预测模式对所述目标图像块进行帧内预测，得到第一预测块；

使用所述传统预测模式对所述目标图像块进行帧内预测，得到第二预测块；

若所述第一预测块的率失真代价低于所述第二预测块的率失真代价，将所述第一预测模式确定为所述最优预测模式；若所述第一预测块的率失真代价高于所述第二预测块的率失真代价，将所述传统预测模式确定为所述最优预测模式。
根据权利要求1至3中任一项所述的方法，其特征在于，所述目标图像块包括目标亮度块，所述对所述允许标识以及所述目标残差块进行编码，得到码流，包括：

对所述允许标识、亮度控制标识以及所述目标残差块进行编码，得到所述码流；所述亮度控制标识用于标识是否使用所述第一预测模式对所述目标亮度块进行帧内预测。
根据权利要求4所述的方法，其特征在于，所述亮度控制标识用于标识使用所述第一预测模式对所述目标亮度块进行帧内预测，所述第一预测模式包括多个网络权重；

所述对所述允许标识、亮度控制标识以及所述目标残差块进行编码，得到所述码流，包括：

对所述允许标识、所述亮度控制标识、亮度索引以及所述目标残差块进行编码，得到所述码流；所述亮度索引用于指示所述多个网络权重中的目标网络权重，所述目标网络权重为对所述目标亮度块进行帧内预测时所述第一预测模式使用的网络权重。
根据权利要求1至3中任一项所述的方法，其特征在于，所述目标图像块包括目标色度块，所述对所述允许标识以及所述目标残差块进行编码，得到码流，包括：

对所述允许标识、色度控制标识以及所述目标残差块进行编码，得到所述码流；所述色度控制标识用于标识是否使用所述第一预测模式对所述目标色度块进行帧内预测。
根据权利要求6所述的方法，其特征在于，所述色度控制标识用于标识使用所述第一预测模式对所述色度亮度块进行帧内预测，所述第一预测模式包括多个网络权重；

所述对所述允许标识、色度控制标识以及所述目标残差块进行编码，得到所述码流，包括：

对所述允许标识、所述色度控制标识、色度索引以及所述目标残差块进行编码，得到所述码流；所述色度索引用于指示所述多个网络权重中的目标网络权重，所述目标网络权重为对所述目标色度块进行帧内预测时所述第一预测模式使用的网络权重。
根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：

基于目标对象获取训练数据，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块；

基于所述训练数据训练至少一套网络权重，所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重。
根据权利要求8所述的方法，其特征在于，所述至少一套网络权重包括用于亮度块的网络权重，所述训练数据包括用于训练用于亮度块的网络权重的训练亮度块；所述基于所述训练数据训练至少一套网络权重，包括：

以所述训练亮度块相邻的重建部分为输入，训练用于亮度块的网络权重。
根据权利要求8所述的方法，其特征在于，所述至少一套网络权重包括用于色度块的网络权重，所述训练数据包括用于训练用于色度块的网络权重的训练色度块；所述基于所述训练数据训练至少一套网络权重，包括：

以所述训练色度块相邻的重建部分，所述训练色度块的重建部分和所述训练色度块相邻的重建部分为输入，训练用于色度块的网络权重。
根据权利要求8所述的方法，其特征在于，所述训练数据包括用于训练所述第一预测模式的网络权重的训练图像块；所述基于所述训练数据训练至少一套网络权重，包括：

利用所述训练图像块的像素值减去所述训练图像块的像素值的平均值，得到训练集；

基于所述训练集训练所述至少一套网络权重。
根据权利要求8至11中任一项所述的方法，其特征在于，所述基于所述训练数据训练至少一套网络权重，包括：

基于所述训练数据训练神经网络，得到至少一个浮点数；

量化所述至少一个浮点数中的每一个浮点数，以得到整数形式的所述至少一套网络权重。
根据权利要求12所述的方法，其特征在于，所述量化所述至少一个浮点数中的每一个浮点数，包括：

基于以下公式量化所述至少一个浮点数中的每一个浮点数：

w _i＝round(w _f×2^bitdepth)；

其中，w _f表示所述至少一个浮点数中的浮点数，round()表示按照指定的小数位数进行四舍五入的运算，w _i表示整数形式的网络权重，bitdepth表示用于将浮点数量化为整数形式的量化参数。
根据权利要求12所述的方法，其特征在于，所述量化所述至少一个浮点数中的每一个浮点数，包括：

基于以下公式量化所述至少一个浮点数中的每一个浮点数：

w _i＝round(w _f×Scale)-((2^bitlength)/2)×((W _fmax+W _fmin)/(W _fmax-W _fmin))；

Scale＝(2^bitlength)/(W _fmax-W _fmin)；

其中，w _f表示所述至少一个浮点数中的浮点数，round()表示按照指定的小数位数进行四舍五入的运算，bitlength表示量化后的整数的比特长度，Scale表示量化尺度，W _fmax和W _fmin分别为所述至少一个浮点数中的最大浮点数和最小浮点数。
根据权利要求12所述的方法，其特征在于，所述基于对所述目标图像块预测得到的目标预测块，包括：

若确定使用所述第一预测模式对所述目标图像块进行帧内预测，基于所述至少一套网络权重中的整数形式的目标网络权重，使用所述第一预测模式对所述目标图像块进行帧内预测，得到量化预测块；

对所述量化预测块进行反量化处理，以得到所述目标预测块。
根据权利要求15所述的方法，其特征在于，所述对所述量化预测块进行反量化处理，得到所述目标预测块，包括：

基于以下公式对所述量化预测块进行反量化处理，以得到所述目标预测块：

O'＝(O+(2^bitdepth)/2)＞＞bitdepth；

其中，O'表示所述目标预测块的计算过程中的、针对所述神经网络中的每个卷积层的、且未经过反量化处理的结果，O表示所述量化预测块的计算过程中的、针对所述神经网络中的每个卷积层的、且经过反量化处理的结果，bitdepth表示用于将浮点数量化为整数形式的量化参数。
根据权利要求8至16中任一项所述的方法，其特征在于，所述对所述允许标识以及所述目标残差块进行编码，得到码流，包括：

对所述允许标识、所述至少一套网络权重以及所述目标残差块进行编码，得到所述码流。
根据权利要求17所述的方法，其特征在于，所述至少一套网络权重位于所述目标对象的码流的头部。
根据权利要求17所述的方法，其特征在于，所述对所述允许标识、所述至少一套网络权重以及所述目标残差块进行编码，得到所述码流，包括：

对所述允许标识、所述至少一套网络权重、权重控制标识以及所述目标残差块进行编码，得到所述码流，所述权重控制标识用于标识所述目标对象的码流中是否包括所述至少一套网络权重。
根据权利要求17所述的方法，其特征在于，所述对所述允许标识、所述至少一套网络权重以及所述目标残差块进行编码，得到所述码流，包括：

对所述允许标识、所述至少一套网络权重、权重控制标识、网络权重符号标识以及所述目标残差块进行编码，得到所述码流，所述权重控制标识用于标识所述目标对象的码流中是否包括所述至少一套网络权重，所述网络权重符号标识用于标识所述至少一套网络权重中的网络权重为正的或负的。
根据权利要求17所述的方法，其特征在于，所述对所述允许标识、所述至少一套网络权重以及所述目标残差块进行编码，得到所述码流，包括：

对所述允许标识、所述至少一套网络权重的残差以及所述目标残差块进行编码，得到所述码流；所述至少一套网络权重的残差包括所述至少一套网络权重中的每一套网络权重减去预先训练的网络权重后的残差。
根据权利要求17所述的方法，其特征在于，所述至少一套网络权重的编码方式为定长码编码方式或变长码编码方式。
根据权利要求1至7中任一项所述的方法，其特征在于，所述方法还包括：

获取预先训练好的一套或多套网络权重；

基于所述一套或多套网络权重，确定用于所述第一预测模式的网络权重。
根据权利要求1所述的方法，其特征在于，所述允许标识用于标识不允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块，包括：

利用传统预测模式对所述目标残差块进行帧内预测，得到所述目标预测块。
一种解码方法，其特征在于，包括：

通过解析码流，获取允许标识以及目标图像序列中的目标图像块的目标残差块；所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

基于所述目标残差块和所述目标预测块，得到所述目标图像帧。
根据权利要求25所述的方法，其特征在于，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述目标图像块包括目标亮度块，所述目标预测块包括所述目标亮度块的预测块；

所述基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块，包括：

通过解析所述码流亮度控制标识；所述亮度控制标识用于标识是否使用所述第一预测模式对所述目标亮度块进行帧内预测；

基于所述亮度控制标识，对所述目标亮度块进行帧内预测，得到所述目标亮度块的预测块。
根据权利要求26所述的方法，其特征在于，所述亮度控制标识用于标识使用所述第一预测模式对所述目标亮度块进行帧内预测，所述第一预测模式包括多个网络权重；

所述基于所述亮度控制标识，对所述目标亮度块进行帧内预测，得到所述目标亮度块的预测块，包括：

通过解析所述码流获取亮度索引；所述亮度索引用于指示所述多个网络权重中的目标网络权重；

基于所述目标网络权重，利用所述第一预测模式，对所述目标亮度块进行帧内预测，得到所述目标亮度块的预测块。
根据权利要求25所述的方法，其特征在于，所述允许标识用于标识允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测；所述目标图像块包括目标色度块，所述目标预测块包括所述目标色度块的预测块；

所述基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块，包括：

通过解析所述码流获取色度控制标识；所述色度控制标识用于标识是否使用所述第一预测模式对所述目标色度块进行帧内预测；

基于所述色度控制标识，对所述目标色度块进行帧内预测，得到所述目标色度块的预测块。
根据权利要求28所述的方法，其特征在于，所述色度控制标识用于标识使用所述第一预测模式对所述目标色度块进行帧内预测，所述第一预测模式包括多个网络权重；

所述基于所述色度控制标识，对所述目标色度块进行帧内预测，得到所述目标色度块的预测块，包括：

通过解析所述码流色度索引；所述色度索引用于指示所述多个网络权重中的目标网络权重；

基于所述目标网络权重，利用所述第一预测模式，对所述目标色度块进行帧内预测，得到所述目标色度块的预测块。
根据权利要求25至29中任一项所述的方法，其特征在于，所述方法还包括：

通过解析所述码流，获取至少一套网络权重；所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块。
根据权利要求30所述的方法，其特征在于，所述至少一套网络权重的编码方式为定长码编码方式或变长码编码方式。
根据权利要求25至29中任一项所述的方法，其特征在于，所述方法还包括：

通过解析所述码流，获取至少一套网络权重的残差；所述至少一套网络权重为使用所述第一预测模式对所述目标对象中的图像块进行帧内预测时可使用的网络权重，所述目标对象为所述目标图像序列、所述目标图像序列中的切片、所述目标图像帧或所述目标图像块，所述至少一套网络权重的残差包括所述至少一套网络权重中的每一套网络权重减去预先训练的网络权重后的残差。
根据权利要求25至32中任一项所述的方法，其特征在于，所述方法还包括：

若所述允许标识用于标识不允许使用所述第一预测模式对所述目标图像序列中的图像块进行帧内预测，使用传统预测模式对所述目标图像块进行帧内预测，得到目标预测块。
一种编码器，其特征在于，包括：

获取单元，用于获取目标图像序列和允许标识，所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式

划分单元，用于将所述目标图像序列中的目标图像帧划分为多个图像块，所述多个图像块包括目标图像块；

预测单元，用于基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

残差单元，用于基于所述目标图像的目标预测块得到目标残差块；

编码单元，用于对所述允许标识以及所述目标残差块进行编码，得到码流。
一种解码器，其特征在于，包括：

解析单元，用于通过解析码流，获取允许标识以及目标图像序列中的目标图像块的目标残差块；所述允许标识用于标识是否允许使用第一预测模式对所述目标图像序列中的图像块进行帧内预测，所述第一预测模式指基于在线训练的网络权重对图像块进行帧内预测的预测模式；

预测单元，用于基于所述允许标识，对所述目标图像块进行帧内预测，得到目标预测块；

处理单元，用于基于所述目标残差块和所述目标预测块，得到所述目标图像帧。
一种电子设备，其特征在于，包括：

处理器，适于执行计算机程序；

计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被所述处理器执行时，实现如权利要求1至24中任一项所述的编码方法，或实现如权利要求25至33中任一项所述的解码方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括计算机指令，所述计算机指令适于由所述处理器加载并执行如权利要求1至24任一项所述的编码方法或如权利要求25至33中任一项所述的解码方法。