WO2023123398A1

WO2023123398A1 - 滤波方法、滤波装置以及电子设备

Info

Publication number: WO2023123398A1
Application number: PCT/CN2021/143804
Authority: WO
Inventors: 戴震宇
Original assignee: Oppo广东移动通信有限公司
Priority date: 2021-12-31
Filing date: 2021-12-31
Publication date: 2023-07-06

Abstract

本申请实施例提供了一种滤波方法、滤波装置以及电子设备，所述滤波方法包括：解析码流得到当前重建图像块；确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。本申请提供的滤波方法能够提升解码性能。

Description

滤波方法、滤波装置以及电子设备

技术领域

本申请实施例涉及图像编解码技术领域，并且更具体地，涉及滤波方法、滤波装置以及电子设备。

背景技术

数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够实现视频解压缩，但目前仍然需要追求更好的数字视频解压缩技术，以提升解码性能。

发明内容

本申请提供了一种滤波方法、滤波装置以及电子设备，能够提升解码性能。

第一方面，本申请提供了一种滤波方法，包括：

解析码流得到当前重建图像块；

确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。

第二方面，本申请提供了一种滤波方法，包括：

获取当前重建图像块；

第三方面，本申请提供了一种滤波装置，包括：

解析单元，用于解析码流得到当前重建图像块；

预测单元，用于确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

滤波单元，用于利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。

第四方面，本申请提供了一种滤波装置，包括：

获取单元，用于获取当前重建图像块；

第五方面，本申请提供了一种电子设备，包括：

处理器，适于实现计算机指令；以及，

计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令适于由处理器加载并执行上述第一方面至第二方面中的任一方面或其各实现方式中的滤波方法。

在一种实现方式中，该处理器为一个或多个，该存储器为一个或多个。

在一种实现方式中，该计算机可读存储介质可以与该处理器集成在一起，或者该计算机可读存储介质与处理器分离设置。

第六方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机指令，该计算机指令被计算机设备的处理器读取并执行时，使得计算机设备执行上述第一方面至第二方面中的任一方面或其各实现方式中的滤波方法。

第七方面，本申请提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面至第二方面中的任一方面或其各实现方式中的方法。

基于以上技术方案，一方面，通过引入第二神经网络，并将所述第二神经网络设计为用于对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块，另一方面，通过引入第一神经网络，并将所述第一神经网络设计为基于当前重建图像块的特征图像块对所述当前重建图像块进行滤波，由此，不仅能够实现基于神经网络的滤波处理，还能够保证用于对所述当前重建图像块进行滤波的信息为尽可能贴合所述原始图像块的信息，进而，能够提升所述当前重建图像块的图像质量并提升解码性能。

此外，通过引入第二神经网络，能够保证编码端和解码端对所述当前重建图像块的特征图像块的理解保持一致，进一步提升了解码性能。

换言之，本申请考虑到滤波的目的是使当前重建图像块更加接近于原始图像块，通过引入的第一神经网络将提取的原始图像块的特征图像块作为输入，对当前重建图像块进行滤波处理，能够提升当前重建图像的质量并提高解码性能；此外，对于原始图像块的特征图像块，本申请考虑到虽然编码端可以通过分析原始图像块来获取，但是解码端却无法获取，通过引入第二神经网络作为特征提取器，能够保证解码端能够获取原始图像块的特征图像块，进一步提升解码性能。也即是说，本申请提出了一种利用原始图像的特征图像块对当前重建图像块进行滤波的神经网络或滤波方法，能够提升当前重建图像块的图像质量以及提升解码性能。

附图说明

图1是本申请实施例提供的编码框架的示意性框图。

图2是本申请实施例提供的解码框架的示意性框图。

图3是本申请实施例提供的滤波方法的示意性流程图。

图4是本申请实施例提供的第一神经网络和第二神经网络的连接关系的示意图。

图5是本申请实施例提供的包括第一神经网络和第二神经网络的滤波单元的示意图。

图6是本申请实施例提供的第二神经网络的示意性结构图。

图7是本申请实施例提供的第一神经网络的示意性结构图。

图8是本申请实施例提供的残差块的示意性结构图。

图9是本申请实施例提供的滤波方法的另一示意性流程图。

图10是本申请实施例的滤波装置的示意性框图。

图11是本申请实施例的滤波装置的另一示意性框图。

图12是本申请实施例提供的电子设备的示意结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的方案可应用于数字视频编码技术领域，例如，图像编解码领域、视频编解码领域、硬件视频编解码领域、专用电路视频编解码领域、实时视频编解码领域。本申请实施例提供的方案可结合至音视频编码标准(Audio Video coding Standard，AVS)、第二代AVS标准(AVS2)或第三代AVS标准(AVS3)。包括但不限于H.264/音视频编码(Audio Video coding，AVC)标准、H.265/高效视频编码(High Efficiency Video Coding，HEVC)标准以及H.266/多功能视频编码(Versatile Video Coding，VVC)标准。本申请实施例提供的方案可以用于对图像进行有损压缩(lossy compression)，也可用于对图像进行无损压缩(lossless compression)。该无损压缩可以是视觉无损压缩(visually lossless compression)，也可以是数学无损压缩(mathematically lossless compression)。

在数字视频编码过程中，编码器对不同颜色格式的原始视频序列读取不相等的亮度分量的像素和色度分量的像素，即编码器读取一幅黑白图像或彩色图像，然后针对图像或彩色图像分别进行编码。其中，黑白图像可以包括亮度分量的像素，彩色图像可以包括色度分量的像素，可选的，彩色图像还可以包括亮度分量的像素。原始视频序列的颜色格式可以是亮度色度(YCbCr，YUV)格式或红绿蓝(Red-Green-Blue，RGB)格式等。编码器读取一幅黑白图像或彩色图像之后，分别将其划分成块数据，并对块数据进行编码。该块数据可以是编码树单元(Coding Tree Unit，CTU)或编码单元块(Coding Unit，CU)，一个编码树单元又可以继续被划分成若干个CU，CU可以为长方形块也可以为正方形块。即编码器可基于CTU或CU进行编码。如今编码器通常为混合框架编码模式，一般包含帧内与帧间预测、变换与量化、反变换与反量化、环路滤波及熵编码等操作。帧内预测只参考同一帧图像的信息，预测当前划分块内的像素信息，用于消除空间冗余；帧间预测可以参考不同帧的图像信息，利用运动估计搜索最匹配当前划分块的运动矢量信息，用于消除时间冗余；变换将预测后的图像块转换到频率域，能量重新分布，结合量化可以将人眼不敏感的信息去除，用于消除视觉冗余；熵编码可以根据当前上下文模型以及二进制码流的概率信息消除字符冗余。环路滤波则主要对反变换与反量化后的像素进行处理，弥补失真信息，为后续编码像素提供更好的参考。

为了便于理解，先对本申请提供的编码框架进行简单介绍。

图1是本申请实施例提供的编码框架100的示意性框图。

如图1所示，该编码框架100可包括帧内预测单元180、帧间预测单元170、残差单元110、变换与量化单元120、熵编码单元130、反变换与反量化单元140、以及环路滤波单元150。可选的，该编码框架100还可包括解码图像缓冲单元160。该编码框架100也可称为混合框架编码模式。

在编码框架100中，帧内预测单元180或帧间预测单元170可对待编码图像块进行预测，以输出预测块。残差单元110可基于预测块与待编码图像块计算残差块，即预测块和待编码图像块的差值。该残差块经由变换与量化单元120变换与量化等过程，可以去除人眼不敏感的信息，以消除视觉冗余。可选的，经过变换与量化单元120变换与量化之前的残差块可称为时域残差块，经过变换与量化单元120变换与量化之后的时域残差块可称为频率残差块或频域残差块。熵编码单元130接收到变换与量化单元120输出的变换量化系数后，可基于该变换量化系数输出码流。例如，熵编码单元130可根据目标上下文模型以及二进制码流的概率信息消除字符冗余。例如，熵编码单元130可以用于基于上下文的自适应二进制算术熵编码(CABAC)。熵编码单元130也可称为头信息编码单元。可选的，在本申请中，该待编码图像块也可称为原始图像块或目标图像块，预测块也可称为预测图像块或图像预测块，还可以称为预测信号或预测信息，重建块也可称为重建图像块或图像重建块，还可以称为重建信号或重建信息。此外，针对编码端，该待编码图像块也可称为编码块或编码图像块，针对解码端，该待编码图像块也可称为解码块或解码图像块。该待编码图像块可以是CTU或CU。

简言之，编码框架100将预测块与待编码图像块计算残差得到残差块经由变换与量化等过程，将残差块传输到解码端。解码端接收并解析码流后，经过反变换与反量化等步骤得到残差块，将解码端预测得到的预测块叠加残差块后得到重建块。

需要说明的是，编码框架100中的反变换与反量化单元140、环路滤波单元150以及解码图像缓冲单元160可用于形成一个解码器。相当于，帧内预测单元180或帧间预测单元170可基于已有的重建块对待编码图像块进行预测，进而能够保证编码端和解码端的对参考帧的理解一致。换言之，编码器可复制解码器的处理环路，进而可与解码端产生相同的预测。具体而言，量化的变换系数通过反变换与反量化单元140反变换与反量化来复制解码端的近似残差块。该近似残差块加上预测块后可经过环路滤波单元150，以平滑滤除由于基于块处理和量化产生的块效应等影响。环路滤波单元150输出的图像块可存储在解码图像缓存单元160中，以便用于后续图像的预测。

帧内预测单元180可用于帧内预测，帧内预测只参考同一帧图像的信息，预测待编码图像块内的像素信息，用于消除空间冗余；帧内预测所使用的帧可以为I帧。例如，可根据从左至右、从上到下的编码顺序，待编码图像块可以参考左上方图像块，上方图像块以及左侧图像块作为参考信息来预测待编码图像块，而待编码图像块又作为下一个图像块的参考信息，如此，可对整幅图像进行预测。若输入的数字视频为彩色格式，例如YUV 4:2:0格式，则该数字视频的每一图像帧的每4个像素点由4个Y分量和2个UV分量组成，编码框架100可对Y分量(即亮度块)和UV分量(即色度块)分别进行编码。类似的，解码端也可根据格式进行相应的解码。帧间预测单元170可用于帧间预测，帧间预测可以参考不同帧的图像信息，利用运动估计搜索最匹配待编码图像块的运动矢量信息，用于消除时间冗余；帧间预测所使用的帧可以为P帧和/或B帧，P帧指的是向前预测帧，B帧指的是双向预测帧。

针对帧内预测过程，帧内预测可借助角度预测模式与非角度预测模式对待编码图像块进行预测，以得到预测块，根据预测块与待编码图像块计算得到的率失真信息，筛选出待编码图像块最优的预测模式，并将该预测模式经码流传输到解码端。解码端解析出预测模式，预测得到目标解码块的预测块并叠加经码流传输而获取的时域残差块，可得到重建块。经过历代的数字视频编解码标准发展，非角度模式保持相对稳定，有均值模式和平面模式；角度模式则随着数字视频编解码标准的演进而不断增加。以国际数字视频编码标准H系列为例，H.264/AVC标准仅有8种角度预测模式和1种非角度预测模式；H.265/HEVC扩展到33种角度预测模式和2种非角度预测模式。在H.266/VVC中，帧内预测模式被进一步拓展，对于亮度块共有67种传统预测模式和非传统的预测模式矩阵加权帧内预测(Matrix weighted intra-frame prediction，MIP)模式，传统预测模式包括：模式编号0的平面(planar)模式、模式编号1的DC模式和模式编号2到模式编号66的角度预测模式。

应理解，图1仅为本申请的示例，不应理解为对本申请的限制。

例如，该编码框架100中的环路滤波单元150可包括去块滤波器(DBF)、样点自适应补偿滤波(SAO)以及自适应修正滤波器(ALF)。DBF的作用是去块效应，SAO的作用是去振铃效应。在本申请的其他实施例中，该编码框架100可采用基于神经网络的环路滤波算法，以提高视频的压缩效率。或者说，该编码框架100可以是基于深度学习的神经网络的视频编码混合框架。在一种实现中，可以在去块滤波器和样点自适应补偿滤波基础上，采用基于神经网络计算对像素滤波后的结果。环路滤波单元150在亮度分量和色度分量上的网络结构可以相同，也可以有所不同。考虑到亮度分量包含更多的视觉信息，还可以采用亮度分量指导色度分量的滤波，以提升色度分量的重建质量。

图2是本申请实施例提供的解码框架200的示意性框图。

如图2所示，该解码框架200可包括熵解码单元210、反变换反量化单元220、残差单元230、帧内预测单元240、帧间预测单元250、环路滤波单元260、解码图像缓存单元270。

熵解码单元210接收并解析码流后，以获取预测块和频域残差块，针对频域残差块，通过反变换反量化单元220进行反变换与反量化等步骤，可获取时域残差块，残差单元230将帧内预测单元240或帧间预测单元250预测得到的预测块叠加至经过通过反变换反量化单元220进行反变换与反量化之后的时域残差块，可得到重建块。例如，帧内预测单元240或帧间预测单元250可通过解码码流的头信息，获取预测块。

数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够实现视频解压缩，但仍然需要追求更好的数字视频解压缩技术，以提升解码性能。此外，在视频编解码标准例如AVS3或VVC中，传统环路滤波模块主要包含有去块滤波器(DBF)、样值自适应补偿(SAO)和自适应修正滤波器(ALF)等工具。但是，随着深度学习技术的发展，也可以通过引入基于神经网络的滤波器的来提升解码性能。

有鉴于此，本申请提供了一种滤波方法、滤波装置以及电子设备，能够提升解码性能。

图3是本申请实施例的滤波方法300的示意性流程图。所述方法300可以由包括基于神经网络的滤波单元的解码框架实现。在一种实现方式中，可将基于神经网络的滤波单元扩展至图2所述的解码框架中，以执行所述滤波方法300。

如图3所示，所述滤波方法300可包括：

S310，解析码流得到当前重建图像块；

S320，确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

S330，利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。

本实施例中，一方面，通过引入第二神经网络，并将所述第二神经网络设计为用于对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块，另一方面，通过引入第一神经网络，并将所述第一神经网络设计为基于当前重建图像块的特征图像块对所述当前重建图像块进行滤波，由此，不仅能够实现基于神经网络的滤波处理，还能够保证用于对所述当前重建图像块进行滤波的信息为尽可能贴合所述原始图像块的信息，进而，能够提升所述当前重建图像块的图像质量并提升解码性能。

需要说明的是，本申请可以仅基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，也可以结合其他信息基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，本申请对此不作具体限定。

示例性地，可以将所述当前重建图像块的信息和所述当前重建图像块的特征图像块作为所述第一神经网络的输入，对所述当前重建图像块进行滤波，以提升解码性能。可选的，所述当前重建图像块的信息包括但不限于：颜色分量(Y/U/V)的像素值，块划分信息，预测信息，去块边界强度信息以及量化步长(QP)信息等。例如，可以引入了亮度分量作为输入来指导色度分量的滤波。需要说明的是，所述当前重建图像块的特征图像块为所述当前重建图像块的原始图像块的信息，其不用于所述当前重建图像块的信息。

此外，本申请对所述第一神经网络的网络结构也不作具体限定。

示例性地，所述第一神经网络可以是基于深度学习的环路滤波器。

示例性地，所述第一神经网络可以是基于残差神经网络的环路滤波器(CNNLF)。

示例性地，所述第一神经网络可包括用于亮度分量的网络结构和用于色度分量的网络结构。可选的，用于亮度分量的网络结构或用于色度分量的网络结构可由卷积层、激活层、残差块、跳转连接等组成；其中残差块的网络结构由卷积层、激活层和跳转连接组成；进一步的，还可以包括一条从输入到输出的全局跳转连接，使网络结构专注于学习残差，加速了网络结构的收敛过程。可选的，用于色度分量的网络结构可以引入了亮度分量作为输入来指导色度分量的滤波。

示例性地，所述第一神经网络可以是基于深度卷积神经网络的环路滤波器。

示例性地，所述第一神经网络可以包括采用多层残差网络。可选的，可引入多种模式的信息作为输入对当前重建图像块进行滤波，并通过计算各个模型的率失真代价来选择最佳模型进行滤波处理。

此外，本申请对所述第一神经网络和所述第二神经网络在编解码框架或滤波单元中的具体位置不作限定。示例性地，所述第一神经网络和所述第二神经网络形成的网络结构也可称为基于神经网络的环路滤波器(Neural Network based Loop Filter，NNLF)。

下面结合图4至图8对所述第一神经网络和所述第二神经网络的连接关系和网络结构进行示例性说明。

如图4所示，考虑到当前重建图像块的原始图像块无法在解码端获取，为了编解码相互匹配，导致在编码端理论上也不能直接使用原始图像块的特征图像块。因此，本申请先通过第二神经网络来预测原始图像块的特征图像块，然后将预测的特征图像块输入第二神经网络中对当前重建图像块进行滤波处理。也即是说，用于对所述当前重建图像块进行滤波的神经网络环路滤波器由两个神经网络组成，分别为第二神经网络和第一神经网络。

如图5所示，所述第一神经网络和所述第二神经网络形成的网络结构可位于SAO和ALF之间。可选的，所述第一神经网络和所述第二神经网络形成的网络结构的使用不依赖于DBF、SAO、ALF的开关，只是在位置上置于SAO和ALF之间。

图6是本申请实施例提供的第二神经网络的示意性结构图。

如图6所示，所述第二神经网络由k层卷积层组成，其中除了最后一层卷积层之外，每层卷积层后有非线性激活函数(PReLU)层。所述第二神经网络的输入为当前重建图像块，输出为预测的当前重建图像块的特征图像块。

图7是本申请实施例提供的第一神经网络的示意性结构图。

如图7所示，所述第一神经网络首先对第二神经网络输出的当前重建图像块的特征图像块进行卷积操作，然后与输入的当前重建图像块进行通道间合并，输入到下一层网络中。所述第一神经网络的第二层和最后一层为卷积层，并且有一条输入到输出端的跳连接线，使所述第一神经网络专注于学习残差，加速了网络结构的收敛过程。所述第一神经网络的中间位置可以级联有n个残差块。所述第一神经网络的输入为第二神经网络输出的当前重建图像块的特征图像块和当前重建图像块，所述第一神经网络的输出为滤波处理后的重建图像块。

图8是本申请实施例提供的残差块的示意性结构图。

如图8所示，一个残差块可由两层卷积层组成，其中第一层卷积层后有非线性激活函数(PReLU)层，并且也有一条输入到输出端的跳连接线。

当然，图3至图8仅为本申请的示例，不应理解为对本申请的限制。

例如，例如，本申请实施例对神经网络的结构，包括卷积层的数量、残差块的数量以及非线性激活函数等具体实现方式不作限定。

在一些实施例中，所述S320之前，所述方法300还可包括：

解析所述码流得到序列标识的取值；

其中，所述序列标识的取值为第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像序列中的重建图像块进行滤波，所述序列标识的取值为第二数值时表示不允许使用所述第一神经网络对所述当前重建图像序列中的重建图像块进行滤波；

基于所述序列标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。

示例性地，所述序列标识可携带在码流的序列头中。

示例性地，下面结合表1对序列头的格式进行说明。

表1

如表1所示，sequence_header可表示序列头，nnlf_enable_flag可用于表示所述序列标识。例如，nnlf_enable_flag的取值为1时，表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像序列中的重建图像块进行滤波；例如，nnlf_enable_flag的取值为0时，表示不允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像序列中的重建图像块进行滤波。

本实施例中，若所述序列标识的取值为所述第二数值，相当于，对于所述当前重建图像序列中的所有重建图像块，解码端可一次性确定不使用所述第一神经网络进行滤波，能够避免解码端以遍历的方式针对所述当前重建图像序列中的每一个重建图像块确定是否使用所述第一神经网络进行滤波，能够提升解码效率。

应当理解，本申请对所述第一数值和所述第二数值的具体取值不作具体限定。例如，在一种实现方式中，所述第一数值为1且所述第二数值为0，在另一种实现方式中，所述第一数值为0且所述第二数值为1。

在一些实施例中，若所述序列标识的取值为所述第一数值，则解析所述码流得到分量标识的取值；其中，所述分量标识的取值为所述第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波，所述分量标识的取值为所述第二数值时表示不允许使用所述第一神经网络对所述当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波；基于所述分量标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。

示例性地，所述分量标识可携带在图像头中。

示例性地，下面结合表2对图像头的格式进行说明。

表2

如表2所示，picture_header可用于表示图像头，nnlf_enable_flag可用于表示所述序列标识，compIdx可用于表示当前重建图像块的第x个分量。例如，compIdx为0时表示亮度分量；compIdx为1时表示Cb分量；compIdx为2时表示Cr分量。picture_nnlf_enable_flag[compIdx]表示第x个分量的分量标识。例如，picture_nnlf_enable_flag[compIdx]的取值为1时，表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的第x个分量的重建图像块进行滤波；picture_nnlf_enable_flag[compIdx]的取值为0时，表示不允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的第x个分量的重建图像块进行滤波。

本实施例中，若所述分量标识的取值为所述第二数值，相当于，对于所述当前重建图像中的与所述当前重建图像块的分量相同的重建图像块，解码端可一次性确定不使用所述第一神经网络进行滤波，能够避免解码端以遍历的方式针对所述当前重建图像序列中的每一个重建图像块的分量确定是否使用所述第一神经网络进行滤波，能够提升解码效率。

在一些实施例中，若所述分量标识的取值为所述第一数值，则通过解析所述码流得到图像块标识的取值；其中，所述图像块标识的取值为所述第一数值时表示使用所述第一神经网络对所述当前重建图像块进行滤波，若所述图像块标识的取值为所述第二数值时表示不使用所述第一神经网络对所述当前重建图像块进行滤波；基于所述图像块标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。

示例性地，所述分量标识可携带在批次(patch)中。

示例性地，下面结合表3对批次的格式进行说明。

表3

如表3所示，picture_header可用于表示图像头，nnlf_enable_flag可用于表示所述序列标识，compIdx可用于表示当前重建图像块的第x个分量。例如，compIdx为0时表示亮度分量；compIdx为1时表示Cb分量；compIdx为2时表示Cr分量。picture_nnlf_enable_flag[compIdx]表示第x个分量的分量标识。patch_nnlf_enable_flag[compIdx][LcuIdx]表示所述当前重建图像块所属的当前重建图像中的第x个分量的第x个图像块的图像块标识。例如，patch_nnlf_enable_flag[compIdx][LcuIdx]的取值为1时，表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的第x个分量的第x个图像块进行滤波；patch_nnlf_enable_flag[compIdx][LcuIdx]的取值为0时，表示不允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的第x个分量的第x个图像块进行滤波。

在一些实施例中，所述S330之前，所述方法300还可包括：

获取第一原始图像的重建图像和所述第一原始图像的特征图像；

基于所述第一原始图像的重建图像和所述第一原始图像的特征图像，得到至少一个第一训练数据对，所述至少一个第一训练数据对包括至少一个第一重建图像块和所述至少一个第一重建图像块分别对应的至少一个第一特征图像块；

利用所述第一神经网络，分别基于所述至少一个第一特征图像块对所述至少一个第一重建图像块进行滤波，得到滤波后的至少一个第二重建图像块；

基于所述至少一个第一重建图像块和所述至少一个第二重建图像块之间的差异，调整所述第一神经网络，得到训练后的所述第一神经网络。

示例性地，对于第一神经网络来说，其目标是训练一套网络参数，使得所述第一神经网络输出的图像更加接近于目标图像。例如，使用VVC视频编码探索实验小组所推荐的数据集DIV2K和BVI-DVC作为训练集，首先将PNG格式图像或MP4格式视频转换为YUV420格式的待压缩视频，获取各颜色分量的原始视频信息。然后使用VTM参考软件测试平台进行编码得到重建视频，按照亮度分量的图像块为128x128大小的图像块，色度分量的图像块为64x64大小的图像块，将重建图像块与原始图像块组成训练数据对(data-label)，作为第一神经网络的训练集。

在一些实施例中，所述第一原始图像的特征图像为利用所述第二神经网络对所述第一原始图像进行预测得到的特征图像，或所述第一原始图像的特征图像为已标注的所述第一原始图像的特征图像。

在一些实施例中，所述S320之前，所述方法300还可包括：

获取第二原始图像的重建图像和已标注的所述第二原始图像的特征图像；

基于所述第二原始图像的重建图像和所述第二原始图像的特征图像，得到至少一个第二训练数据对，所述至少一个第二训练数据对包括至少一个第三重建图像块和所述至少一个第二重建图像块对应的至少一个第二特征图像块；

利用所述第二神经网络对所述至少一个第三重建图像进行预测，得到至少一个第三特征图像块；

基于所述至少一个第二特征图像块和所述至少一个第三特征图像块之间的差异，调整所述第二神经网络，得到训练后的所述第二神经网络。

示例性地，对于第二神经网络来说，其目标是训练一套网络参数，使得所述第二神经网络输出的图像更加接近于目标图像的特征图像，因此，需要对目标图像的特征图像进行采集，以得到特征图像。一张图像具有丰富的特征信息，例如颜色特征、纹理特征、形状特征和空间关系特征等。颜色和纹理特征主要用于描述图像或图像区域所对应的景物的表面性质，形状特征主要用于描述图像的轮廓和区域特征，空间关系特征主要用于描述图像分割出来的多个目标之间的相互空间位置或相对方向关系。示例性地，所述空间特征可包括图像显著性。在机器视觉领域，图像显著性通过为图像中的每个像素分配一个标签的过程，使得相同标签的像素能够共享某些特征。图像显著性是图像中重要的视觉特征，体现出视觉对图像各区域的重视程度，图像显著性也广泛运用在压缩编码，边缘加强，显著性目标分区和特征提取等方面。

以图像显著性为例，显著性检测任务是机器视觉领域的一个热门研究方向，可通过数学方法用于检测视觉空域显著信息。例如基于最小化栅格距离(MBD)来计算图像中各个像素点和背景候选像素集合(一般选取图像的边界像素)的距离；Binary方法在MBD的基础上，根据设定的门限值得到一张二元显著图；鲁棒背景检测(RBD)方法，利用连续性来提高背景先验的鲁棒性，利用分割算法将图像划分为多个区域，分别计算各区域与边界的关联性，确定最终的显著区域；FT算法则从频域出发，设计了一个带通滤波器，通过较低的低通截止频率突出显示整个显著区域，通过较高的高通截止频率显示明确的边界处并截断掉高频噪声信息。基于深度学习的方法也被用于空时域显著性检测任务中，例如SALICON模型，通过深层神经网络学习图像中的高级语义信息来对显著性区域进行检测，其检测性能较好。

以FT算法为例，来获取图像显著性S，具体计算公式如下所示：

S(x,y)＝‖I _μ-I _ωhc(x,y)‖

其中，I _μ表示图像的算术平均像素值，I _ωhc表示图像的高斯模糊像素值，以消除细纹理、噪声及编码伪影，…‖表示计算欧氏距离。

需要说明的是，本申请提供的方案并不只局限于上述示例的特征，也可以是其他特征信息，本申请对此不作具体限定。

示例性地，可以使用VVC视频编码探索实验小组所推荐的数据集DIV2K和BVI-DVC作为训练集，以图像显著性为例，可以通过FT算法计算得到原始图像的显著特征图像，并转换为YUV420格式。然后使用VTM参考软件测试平台进行编解码得到重建视频，按照亮度分量的图像块为128x128大小的图像块，色度分量的图像块为64x64大小的图像块，将重建图像块与特征图像块组成训练数据对(data-label)，作为第二神经网络的训练集。

需要说明的是，本申请中，用于对所述当前重建图像块进行滤波的滤波器包括第一神经网络和第二神经网络。其中，第二神经网络和第一神经网络应具有不同的训练目标，否则第二神经网络的存在没有意义。因此，第二神经网络和第一神经网络的训练可以是各自独立进行的，也可以是基于训练好的第二神经网络训练所述第一神经网络，本申请对此不作具体限定。此外，本申请对训练所述第一神经网络和/或所述第二神经网络所使用的具体参数不作限定。

在一些实施例中，所述当前重建图像块的特征图像块用于表征所述当前重建图像块的原始图像块的以下特征中的至少一项：

颜色特征、纹理特征、形状特征、空间特征。

上文中结合图3至图8，从解码端的角度详细描述了根据本申请实施例的滤波方法，下面将结合图9，从编码端的角度描述根据本申请实施例的滤波方法。

图9是本申请实施例提供的滤波方法400的示意性流程图。所述方法400可以由包括基于神经网络的滤波单元的编码框架实现。在一种实现方式中，可将基于神经网络的滤波单元扩展至图1所述的编码框架中，以执行所述滤波方法400。

如图9所示，所述滤波方法400可包括：

S410，获取当前重建图像块；

S420，确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

S430，利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。

在一些实施例中，所述S420之前，所述方法400还可包括：

获取序列标识的取值；

示例性地，所述序列标识可以是序列参数集中的标识。

表4

如表4所示，序列参数集(seq_parameter_set_rbsp)可包括序列标识(sps_aip_enabled_flag)，序列标识为序列级控制开关，用于控制在当前序列是否允许开启基于第一神经网络的环路滤波，如该flag为1则代表在当前序列允许开启基于第一神经网络的环路滤波，为0则代表不允许开启基于第一神经网络的环路滤波。在具体实现中，可以通过用户设置的方式控制序列参数集是否开启序列标识，在序列参数集中开启所述序列标识的情况下，编码器可通过查询用户配置的配置文件获取所述序列标识的具体数值，即该flag为1还是为0。

在一些实施例中，若所述序列标识的取值为所述第一数值，则使用所述第一神经网络对所述当前重建图像块进行滤波，得到所述当前重建图像块滤波后的率失真代价；若所述当前重建图像块滤波后的率失真代价大于所述当前重建图像块滤波前的率失真代价，则确定使用所述第一神经网络对所述当前重建图像块进行滤波；若所述当前重建图像块滤波后的率失真代价小于或等于所述当前重建图像块滤波前的率失真代价，则确定不使用所述第一神经网络对所述当前重建图像块进行滤波。

在一些实施例中，所述方法400还可包括：

将所述序列标识的取值，写入对基于所述当前重建图像块得到的当前残差块进行编码得到的码流。

在一些实施例中，所述方法400还可包括：

若所述序列标识的取值为所述第一数值，则生成分量标识的取值；

其中，所述分量标识的取值为所述第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波，所述分量标识的取值为所述第二数值时表示不允许使用所述第一神经网络对所述当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波；

将所述分量标识的取值，写入对基于所述当前重建图像块得到的当前残差块进行编码得到的码流。

在一些实施例中，若所述当前重建图像中的与所述当前重建图像块的分量相同的每一个重建图像块滤波后的率失真代价均小于或小于所述每一个重建图像滤波前的率失真代价，则确定分量标识的取值为所述第一数值；若所述当前重建图像包括滤波后的率失真代价大于滤波前的率失真代价的重建图像块，则确定所述分量标识的取值为所述第二数值。

在一些实施例中，所述方法400还可包括：

若所述分量标识的取值为所述第一数值，则生成图像块标识的取值；

其中，所述图像块标识的取值为所述第一数值时表示使用所述第一神经网络对所述当前重建图像块进行滤波，若所述图像块标识的取值为所述第二数值时表示不使用所述第一神经网络对所述当前重建图像块进行滤波。

在一些实施例中，若所述当前重建图像块滤波后的率失真代价大于所述当前重建图像块滤波前的率失真代价，则确定所述图像块标识的取值为所述第一数值；若所述当前重建图像块滤波后的率失真代价小于或等于所述当前重建图像块滤波前的率失真代价，则确定所述图像块标识的取值为所述第二数值。

在一些实施例中，所述S430之前，所述方法400还可包括：

在一些实施例中，所述S420之前，所述方法400还可包括：

颜色特征、纹理特征、形状特征、空间特征。

应当理解，所述滤波方法400中的术语和步骤可以参考滤波方法300中描述的相应术语和相应步骤，为了简洁，在此不再赘述。

下面结合具体实施例对本申请的方案进行说明。

编码端进行环路滤波时，可按照规定的滤波器顺序进行处理，当进入神经网络环路滤波器模块(即由上述第一神经网络和第二神经网络组成的滤波器)时，可按照以下步骤进行环路滤波：

步骤a：

根据nnlf_enable_flag的取值，判断当前重建图像序列下是否可以使用神经网络环路滤波器模块。若nnlf_enable_flag为“1”，则对当前重建图像序列尝试进行神经网络环路滤波器模块处理，即跳至步骤b；若nnlf_enable_flag为“0”,则当前重建图像序列不使用神经网络环路滤波器模块，即结束基于神经网络的环路滤波处理。

步骤b：

对于当前重建图像序列的当前重建图像，遍历所有颜色分量的所有重建图像块，基于每一个重建编码块尝试神经网络环路滤波器，并与未滤波前的重建图像块相比较，计算率失真代价D，D＝D_net-D_rec，即计算神经网络滤波处理后减少的失真，其中D_net为滤波后的失真，D_rec为滤波前的失真。如果滤波后的代价小于滤波前的代价，即D<0时，则令patch_nnlf_enable_flag[compIdx][LcuIdx]的取值为1；如果滤波后的代价大于滤波前的代价，即D≥0时，则令patch_nnlf_enable_flag[compIdx][LcuIdx]为0。若当前帧内所有颜色分量的所有图像块已遍历完成，则跳至步骤c。

步骤c：

对于当前重建图像序列的当前重建图像，如果patch_nnlf_enable_flag[compIdx][LcuIdx]的值全为0，则picture_nnlf_enable_flag[compIdx]为0，如果有patch_nnlf_enable_flag[compIdx][LcuIdx]的值不为0的重建图像块，则picture_nnlf_enable_flag[compIdx]为1。若当前帧已完成神经网络环路滤波器模块的决策，则加载下一帧进行处理，并跳转至步骤b。

相应的，解码器获取并解析码流，当解析到环路滤波时，可按照规定的滤波器顺序进行处理，当进入神经网络环路滤波器模块(即由上述第一神经网络和第二神经网络组成的滤波器)时，可按照以下步骤进行环路滤波：

步骤a：

根据nnlf_enable_flag的取值，判断当前重建图像序列下是否可以使用神经网络环路滤波器模块。若nnlf_enable_flag为1，则对当前重建图像序列尝试进行神经网络环路滤波器模块处理，即跳至步骤b；若nnlf_enable_flag为0,则当前重建图像序列不使用神经网络环路滤波器模块，即结束基于神经网络的环路滤波处理。

步骤b：

对于当前重建图像序列的当前重建图像，如果picture_nnlf_enable_flag[compIdx]为1，则跳至步骤c；如果picture_nnlf_enable_flag[compIdx]为0，则跳至步骤d。

步骤c：

对于当前重建图像序列的当前重建图像的当前颜色分量，遍历所有重建图像块，针对当前重建图像块，如果patch_nnlf_enable_flag[compIdx][LcuIdx]为1，则对当前重建图像块进行神经网络环路滤波；如果patch_nnlf_enable_flag[compIdx][LcuIdx]为0，则对当前重建图像块不进行神经网络环路滤波。若当前重建图像内所有颜色分量的所有重建图像块已遍历完成，则跳至步骤c。

步骤d：

若当前重建图像已完成神经网络环路滤波模块的决策，则加载下一帧进行处理，跳转至步骤b。

需要说明的是，上述实施例仅为本申请的示例，不应理解为对本申请的限制。

以上结合附图详细描述了本申请的优选实施方式，但是，本申请并不限于上述实施方式中的具体细节，在本申请的技术构思范围内，可以对本申请的技术方案进行多种简单变型，这些简单变型均属于本申请的保护范围。例如，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本申请对各种可能的组合方式不再另行说明。又例如，本申请的各种不同的实施方式之间也可以进行任意组合，只要其不违背本申请的思想，其同样应当视为本申请所公开的内容。

还应理解，在本申请的各种方法实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

上文详细描述了本申请的方法实施例，下文结合图10至图12，详细描述本申请的装置实施例。

图10是本申请实施例的滤波装置500的示意性框图。

如图10所示，所述滤波装置500可包括：

解析单元510，用于解析码流得到当前重建图像块；

预测单元520，用于确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

滤波单元530，用于利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。

在一些实施例中，所述预测单元520利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块之前，所述预测单元520还用于：

解析所述码流得到序列标识的取值；

在一些实施例中，所述预测单元520具体用于：

若所述序列标识的取值为所述第一数值，则解析所述码流得到分量标识的取值；

基于所述分量标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。

在一些实施例中，所述预测单元520具体用于：

若所述分量标识的取值为所述第一数值，则通过解析所述码流得到图像块标识的取值；

其中，所述图像块标识的取值为所述第一数值时表示使用所述第一神经网络对所述当前重建图像块进行滤波，若所述图像块标识的取值为所述第二数值时表示不使用所述第一神经网络对所述当前重建图像块进行滤波；

基于所述图像块标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。

在一些实施例中，所述滤波单元530利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块之前，所述滤波单元530还用于：

颜色特征、纹理特征、形状特征、空间特征。

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。具体地，图10所示的滤波装置500可以对应于执行本申请实施例的方法300中的相应主体，即滤波装置500中的各个单元的前述和其它操作和/或功能分别为了实现方法300等各个方法中的相应流程，为避免重复，此处不再赘述。

图11是本申请实施例的滤波装置600的示意性框图。

如图11所示，所述滤波装置600可包括：

获取单元610，用于获取当前重建图像块；

预测单元620，用于确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

滤波单元630，用于利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。

在一些实施例中，所述预测单元620利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块之前，所述预测单元620还用于：

获取序列标识的取值；

在一些实施例中，所述预测单元620具体用于：

若所述序列标识的取值为所述第一数值，则使用所述第一神经网络对所述当前重建图像块进行滤波，得到所述当前重建图像块滤波后的率失真代价；

若所述当前重建图像块滤波后的率失真代价大于所述当前重建图像块滤波前的率失真代价，则确定使用所述第一神经网络对所述当前重建图像块进行滤波；

若所述当前重建图像块滤波后的率失真代价小于或等于所述当前重建图像块滤波前的率失真代价，则确定不使用所述第一神经网络对所述当前重建图像块进行滤波。

在一些实施例中，所述预测单元620还用于：

在一些实施例中，所述预测单元620具体用于：

若所述当前重建图像中的与所述当前重建图像块的分量相同的每一个重建图像块滤波后的率失真代价均小于或小于所述每一个重建图像滤波前的率失真代价，则确定分量标识的取值为所述第一数值；

若所述当前重建图像包括滤波后的率失真代价大于滤波前的率失真代价的重建图像块，则确定所述分量标识的取值为所述第二数值。

在一些实施例中，所述预测单元620还用于：

在一些实施例中，所述预测单元620具体用于：

若所述当前重建图像块滤波后的率失真代价大于所述当前重建图像块滤波前的率失真代价，则确定所述图像块标识的取值为所述第一数值；

若所述当前重建图像块滤波后的率失真代价小于或等于所述当前重建图像块滤波前的率失真代价，则确定所述图像块标识的取值为所述第二数值。

在一些实施例中所述滤波单元630利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块之前，所述滤波单元630还用于：

颜色特征、纹理特征、形状特征、空间特征。

应理解，装置实施例与方法实施例可以相互对应，类似的描述可以参照方法实施例。具体地，图11所示的滤波装置600可以对应于执行本申请实施例的方法400中的相应主体，即滤波装置600中的各个单元的前述和其它操作和/或功能分别为了实现方法400等各个方法中的相应流程，为避免重复，此处不再赘述。

还应当理解，本申请实施例涉及的滤波装置500或滤波装置600中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。在本申请的其它实施例中，该滤波装置500或滤波装置600也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。根据本申请的另一个实施例，可以通过在包括例如中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的通用计算机的通用计算设备上运行能够执行相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造本申请实施例涉及的滤波装置500或滤波装置600，以及来实现本申请实施例的滤波方法。计算机程序可以记载于例如计算机可读存储介质上，并通过计算机可读存储介质装载于电子设备中，并在其中运行，来实现本申请实施例的相应方法。

换言之，上文涉及的单元可以通过硬件形式实现，也可以通过软件形式的指令实现，还可以通过软硬件结合的形式实现。具体地，本申请实施例中的方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路和/或软件形式的指令完成，结合本申请实施例公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件组合执行完成。可选地，软件可以位于随机存储器，闪存、只读存储器、可编程只读存储器、电可擦写可编程存储器、寄存器等本领域的成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法实施例中的步骤。

图12是本申请实施例提供的电子设备700的示意结构图。

如图12所示，该电子设备700至少包括处理器710以及计算机可读存储介质720。其中，处理器710以及计算机可读存储介质720可通过总线或者其它方式连接。计算机可读存储介质720用于存储计算机程序721，计算机程序721包括计算机指令，处理器710用于执行计算机可读存储介质720存储的计算机指令。处理器710是电子设备700的计算核心以及控制核心，其适于实现一条或多条计算机指令，具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。

作为示例，处理器710也可称为中央处理器(CentralProcessingUnit，CPU)。处理器710可以包括但不限于：通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等等。

作为示例，计算机可读存储介质720可以是高速RAM存储器，也可以是非不稳定的存储器(Non-VolatileMemory)，例如至少一个磁盘存储器；可选的，还可以是至少一个位于远离前述处理器710的计算机可读存储介质。具体而言，计算机可读存储介质720包括但不限于：易失性存储器和/或非易失性存储器。其中，非易失性存储器可以是只读存储器(Read-Only Memory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic RAM，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(synch link DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

示例性地，该电子设备700可以是本申请实施例涉及的编码端、编码器或编码框架；该计算机可读存储介质720中存储有第一计算机指令；由处理器710加载并执行计算机可读存储介质720中存放的第一计算机指令，以实现本申请实施例提供的滤波方法中的相应步骤；换言之，计算机可读存储介质720中的第一计算机指令由处理器710加载并执行相应步骤，为避免重复，此处不再赘述。

示例性地，该电子设备700可以是本申请实施例涉及的解码端、解码器或解码框架；该计算机可读存储介质720中存储有第二计算机指令；由处理器710加载并执行计算机可读存储介质720中存放的第二计算机指令，以实现本申请实施例提供的滤波方法中的相应步骤；换言之，计算机可读存储介质720中的第二计算机指令由处理器710加载并执行相应步骤，为避免重复，此处不再赘述。

根据本申请的另一方面，本申请实施例还提供了一种计算机可读存储介质(Memory)，计算机可读存储介质是电子设备700中的记忆设备，用于存放程序和数据。例如，计算机可读存储介质720。可以理解的是，此处的计算机可读存储介质720既可以包括电子设备700中的内置存储介质，当然也可以包括电子设备700所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了电子设备700的操作系统。并且，在该存储空间中还存放了适于被处理器710加载并执行的一条或多条的计算机指令，这些计算机指令可以是一个或多个的计算机程序721(包括程序代码)。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。例如，计算机程序721。此时，数据处理设备700可以是计算机，处理器710从计算机可读存储介质720读取该计算机指令，处理器710执行该计算机指令，使得该计算机执行上述各种可选方式中提供的滤波方法。

换言之，当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地运行本申请实施例的流程或实现本申请实施例的功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质进行传输，例如，该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元以及流程步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

最后需要说明的是，以上内容，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种滤波方法，其特征在于，包括：

解析码流得到当前重建图像块；

确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。
根据权利要求1所述的方法，其特征在于，所述利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块之前，所述方法还包括：

解析所述码流得到序列标识的取值；

其中，所述序列标识的取值为第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像序列中的重建图像块进行滤波，所述序列标识的取值为第二数值时表示不允许使用所述第一神经网络对所述当前重建图像序列中的重建图像块进行滤波；

基于所述序列标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。
根据权利要求2所述的方法，其特征在于，所述基于所述序列标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波，包括：

若所述序列标识的取值为所述第一数值，则解析所述码流得到分量标识的取值；

其中，所述分量标识的取值为所述第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波，所述分量标识的取值为所述第二数值时表示不允许使用所述第一神经网络对所述当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波；

基于所述分量标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。
根据权利要求3所述的方法，其特征在于，所述基于所述分量标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波，包括：

若所述分量标识的取值为所述第一数值，则通过解析所述码流得到图像块标识的取值；

其中，所述图像块标识的取值为所述第一数值时表示使用所述第一神经网络对所述当前重建图像块进行滤波，若所述图像块标识的取值为所述第二数值时表示不使用所述第一神经网络对所述当前重建图像块进行滤波；

基于所述图像块标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。
根据权利要求1至4中任一项所述的方法，其特征在于，所述利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块之前，所述方法还包括：

获取第一原始图像的重建图像和所述第一原始图像的特征图像；

基于所述第一原始图像的重建图像和所述第一原始图像的特征图像，得到至少一个第一训练数据对，所述至少一个第一训练数据对包括至少一个第一重建图像块和所述至少一个第一重建图像块分别对应的至少一个第一特征图像块；

利用所述第一神经网络，分别基于所述至少一个第一特征图像块对所述至少一个第一重建图像块进行滤波，得到滤波后的至少一个第二重建图像块；

基于所述至少一个第一重建图像块和所述至少一个第二重建图像块之间的差异，调整所述第一神经网络，得到训练后的所述第一神经网络。
根据权利要求5所述的方法，其特征在于，所述第一原始图像的特征图像为利用所述第二神经网络对所述第一原始图像进行预测得到的特征图像，或所述第一原始图像的特征图像为已标注的所述第一原始图像的特征图像。
根据权利要求1至6中任一项所述的方法，其特征在于，所述利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块之前，所述方法还包括：

获取第二原始图像的重建图像和已标注的所述第二原始图像的特征图像；

基于所述第二原始图像的重建图像和所述第二原始图像的特征图像，得到至少一个第二训练数据对，所述至少一个第二训练数据对包括至少一个第三重建图像块和所述至少一个第二重建图像块对应的至少一个第二特征图像块；

利用所述第二神经网络对所述至少一个第三重建图像进行预测，得到至少一个第三特征图像块；

基于所述至少一个第二特征图像块和所述至少一个第三特征图像块之间的差异，调整所述第二神经网络，得到训练后的所述第二神经网络。
根据权利要求1至7中任一项所述的方法，其特征在于，所述当前重建图像块的特征图像块用于表征所述当前重建图像块的原始图像块的以下特征中的至少一项：

颜色特征、纹理特征、形状特征、空间特征。
一种滤波方法，其特征在于，包括：

获取当前重建图像块；

确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。
根据权利要求9所述的方法，其特征在于，所述利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块之前，所述方法还包括：

获取序列标识的取值；

其中，所述序列标识的取值为第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像序列中的重建图像块进行滤波，所述序列标识的取值为第二数值时表示不允许使用所述第一神经网络对所述当前重建图像序列中的重建图像块进行滤波；

基于所述序列标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波。
根据权利要求10所述的方法，其特征在于，所述基于所述序列标识的取值，确定是否使用所述第一神经网络对所述当前重建图像块进行滤波，包括：

若所述序列标识的取值为所述第一数值，则使用所述第一神经网络对所述当前重建图像块进行滤波，得到所述当前重建图像块滤波后的率失真代价；

若所述当前重建图像块滤波后的率失真代价大于所述当前重建图像块滤波前的率失真代价，则确定使用所述第一神经网络对所述当前重建图像块进行滤波；

若所述当前重建图像块滤波后的率失真代价小于或等于所述当前重建图像块滤波前的率失真代价，则确定不使用所述第一神经网络对所述当前重建图像块进行滤波。
根据权利要求10或11所述的方法，其特征在于，所述方法还包括：

将所述序列标识的取值，写入对基于所述当前重建图像块得到的当前残差块进行编码得到的码流。
根据权利要求10至12中任一项所述的方法，其特征在于，所述方法还包括：

若所述序列标识的取值为所述第一数值，则生成分量标识的取值；

其中，所述分量标识的取值为所述第一数值时表示允许使用所述第一神经网络对所述当前重建图像块所属的当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波，所述分量标识的取值为所述第二数值时表示不允许使用所述第一神经网络对所述当前重建图像中的与所述当前重建图像块的分量相同的重建图像块进行滤波；

将所述分量标识的取值，写入对基于所述当前重建图像块得到的当前残差块进行编码得到的码流。
根据权利要求13所述的方法，其特征在于，所述生成分量标识的取值，包括：

若所述当前重建图像中的与所述当前重建图像块的分量相同的每一个重建图像块滤波后的率失真代价均小于或小于所述每一个重建图像滤波前的率失真代价，则确定分量标识的取值为所述第一数值；

若所述当前重建图像包括滤波后的率失真代价大于滤波前的率失真代价的重建图像块，则确定所述分量标识的取值为所述第二数值。
根据权利要求13或14所述的方法，其特征在于，所述方法还包括：

若所述分量标识的取值为所述第一数值，则生成图像块标识的取值；

其中，所述图像块标识的取值为所述第一数值时表示使用所述第一神经网络对所述当前重建图像块进行滤波，若所述图像块标识的取值为所述第二数值时表示不使用所述第一神经网络对所述当前重建图像块进行滤波。
根据权利要求15所述的方法，其特征在于，所述生成图像块标识的取值，包括：

若所述当前重建图像块滤波后的率失真代价大于所述当前重建图像块滤波前的率失真代价，则确定所述图像块标识的取值为所述第一数值；

若所述当前重建图像块滤波后的率失真代价小于或等于所述当前重建图像块滤波前的率失真代价，则确定所述图像块标识的取值为所述第二数值。
根据权利要求9至16中任一项所述的方法，其特征在于，所述利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块之前，所述方法还包括：

获取第一原始图像的重建图像和所述第一原始图像的特征图像；

基于所述第一原始图像的重建图像和所述第一原始图像的特征图像，得到至少一个第一训练数据对，所述至少一个第一训练数据对包括至少一个第一重建图像块和所述至少一个第一重建图像块分别对应的至少一个第一特征图像块；

利用所述第一神经网络，分别基于所述至少一个第一特征图像块对所述至少一个第一重建图像块进行滤波，得到滤波后的至少一个第二重建图像块；

基于所述至少一个第一重建图像块和所述至少一个第二重建图像块之间的差异，调整所述第一神经网络，得到训练后的所述第一神经网络。
根据权利要求17所述的方法，其特征在于，所述第一原始图像的特征图像为利用所述第二神经网络对所述第一原始图像进行预测得到的特征图像，或所述第一原始图像的特征图像为已标注的所述第一原始图像的特征图像。
根据权利要求9至18中任一项所述的方法，其特征在于，所述利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块之前，所述方法还包括：

获取第二原始图像的重建图像和已标注的所述第二原始图像的特征图像；

基于所述第二原始图像的重建图像和所述第二原始图像的特征图像，得到至少一个第二训练数据对，所述至少一个第二训练数据对包括至少一个第三重建图像块和所述至少一个第二重建图像块对应的至少一个第二特征图像块；

利用所述第二神经网络对所述至少一个第三重建图像进行预测，得到至少一个第三特征图像块；

基于所述至少一个第二特征图像块和所述至少一个第三特征图像块之间的差异，调整所述第二神经网络，得到训练后的所述第二神经网络。
根据权利要求9至19中任一项所述的方法，其特征在于，所述当前重建图像块的特征图像块用于表征所述当前重建图像块的原始图像块的以下特征中的至少一项：

颜色特征、纹理特征、形状特征、空间特征。
一种滤波装置，其特征在于，包括：

解析单元，用于解析码流得到当前重建图像块；

预测单元，用于确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

滤波单元，用于利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。
一种滤波装置，其特征在于，包括：

获取单元，用于获取当前重建图像块；

预测单元，用于确定使用第一神经网络对所述当前重建图像块进行滤波时，利用第二神经网络对所述当前重建图像块的原始图像块的特征进行预测，得到所述当前重建图像块的特征图像块；

滤波单元，用于利用所述第一神经网络，基于所述当前重建图像块的特征图像块对所述当前重建图像块进行滤波，得到滤波后的重建图像块。
一种电子设备，其特征在于，包括：

处理器，适于执行计算机程序；

计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被所述处理器执行时，实现如权利要求1至8中任一项所述的方法或如权利要求9至20中任一项所述的方法。
一种计算机可读存储介质，其特征在于，用于存储计算机程序，所述计算机程序使得计算机执行如权利要求1至8中任一项所述的方法或如权利要求9至20中任一项所述的方法。
一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现如权利要求1至8中任一项所述的方法或如权利要求9至20中任一项所述的方法。
一种码流，其特征在于，所述码流如权利要求1至8中任一项所述的方法中所述的码流或如权利要求9至20中任一项所述的方法生成的码流。