WO2024077576A1

WO2024077576A1 - 基于神经网络的环路滤波、视频编解码方法、装置和系统

Info

Publication number: WO2024077576A1
Application number: PCT/CN2022/125231
Authority: WO
Inventors: 戴震宇
Original assignee: Oppo广东移动通信有限公司
Priority date: 2022-10-13
Filing date: 2022-10-13
Publication date: 2024-04-18

Abstract

一种基于神经网络的环路滤波、视频编解码方法、装置和系统，编码端对重建图像进行NNLF时，可以选择进行残差调整的NNLF模式或不进行残差调整的NNLF模式；解码端根据标志，选用其中一种模式对重建图像进行NNLF。可以提高编码性能。

Description

基于神经网络的环路滤波、视频编解码方法、装置和系统

技术领域

本公开实施例涉及但不限于视频技术，更具体地，涉及一种基于神经网络的环路滤波方法、视频编解码方法、装置和系统。

背景技术

数字视频压缩技术主要是将庞大的数字影像视频数据进行压缩，以便于传输以及存储等。原始视频序列的图像包含亮度分量和色度分量，在数字视频编码过程中，编码器读取黑白或者彩色图像，将每一帧图像分割成相同大小(如128x128，64x64等)的最大编码单元(LCU：largest coding unit)。每个最大编码单元可根据规则划分成矩形的编码单元(CU：coding unit)，还可以进一步划分成预测单元(PU：prediction unit)，变换单元(TU：transform unit)等。混合编码框架包括预测(prediction)、变换(transform)、量化(quantization)、熵编码(entropy coding)、环路滤波(in loop filter)等模块。预测模块可采用帧内预测(intra prediction)和帧间预测(inter prediction)。帧内预测基于同一图像的信息预测当前块内的像素信息，用于消除空间冗余；帧间预测可以参考不同图像的信息，利用运动估计搜索与当前块最匹配的运动矢量信息，用于消除时间冗余；变换可将预测后的残差转换到频率域，使其能量重新分布，结合量化可以将人眼不敏感的信息去除，用于消除视觉冗余；熵编码可以根据当前上下文模型以及二进制码流的概率信息消除字符冗余，生成码流。

随着互联网视频的激增以及人们对视频清晰度的要求越来越高，尽管已有的数字视频压缩标准能够节省不少视频数据，但目前仍然需要追求更好的数字视频压缩技术，以减少数字视频传输的带宽和流量压力。

发明概述

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本公开一实施例提供了一种基于神经网络的环路滤波(NNLF，Neural Network based Loop Filter)方法，应用于解码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括：

解码重建图像的残差调整使用标志roflag，所述roflag用于表示对重建图像进行NNLF时是否需要进行残差调整；

根据所述roflag确定不需要进行残差调整的情况下，采用第一模式对所述重建图像进行NNLF；根据所述roflag确定需要进行残差调整的情况下，采用第二模式对所述重建图像进行NNLF；

其中，所述第一模式是不对神经网络输出的残差图像进行残差调整的NNLF模式，所述第二模式是对所述残差图像进行残差调整的NNLF模式。

本公开一实施例还提供了一种基于神经网络的环路滤波方法，应用于解码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括，对输入神经网络的包括3分量的重建图像进行NNLF时，对每一分量分别执行以下处理：

解码重建图像的该分量的残差调整使用标志roflag，所述roflag用于表示对所述重建图像的该分量进行NNLF时是否需要进行残差调整；

根据所述roflag确定不需要进行残差调整的情况下，采用第一模式对所述重建图像的该分量进行NNLF；根据所述roflag确定需要进行残差调整的情况下，采用第二模式对所述重建图像的该分量进行NNLF；

其中，所述第一模式是不对神经网络输出的残差图像的该分量进行残差调整的NNLF模式，所述第二模式是对所述残差图像的该分量进行残差调整的NNLF模式。

本公开一实施例还提供了一种视频解码方法，应用于视频解码装置，包括：对重建图像进行基于神经网络的环路滤波NNLF时，执行以下处理：在NNLF允许残差调整的情况下，按照本公开应用于解码端NNLF滤波器的任一实施例所述的NNLF方法对所述重建图像进行NNLF。

本公开一实施例还提供了一种基于神经网络的环路滤波方法，应用于编码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括：

将重建图像输入所述神经网络，获取所述神经网络输出的残差图像；

计算采用第一模式对所述重建图像进行NNLF的率失真代价cost ₁，及采用第二模式对所述重建图像进行NNLF的率失真代价cost ₂；其中，所述第一模式是不对所述残差图像进行残差调整的NNLF模式，所述第二模式是对所述残差图像进行残差调整的NNLF模式；

在cost ₁<cost ₂的情况下，选择所述第一模式对所述重建图像进行NNLF；在cost ₂<cost ₁的情况下，选择所述第二模式对所述重建图像进行NNLF；在cost ₁＝cost ₂的情况下，选择所述第一模式或第二模式对所述重建图像进行NNLF。

将重建图像输入所述神经网络，获取所述神经网络输出的残差图像；所述重建图像和残差图像均包括3个分量；及

对所述3个分量中的每一分量分别执行以下处理：

计算采用第一模式对所述重建图像的该分量进行NNLF的率失真代价cost ₁，及采用第二模式对所述重建图像的该分量进行NNLF的率失真代价cost ₂；所述第一模式是不对所述残差图像的该分量进行残差调整的NNLF模式，所述第二模式是对所述残差图像的该分量进行残差调整的NNLF模式；

在cost ₁<cost ₂的情况下，选择所述第一模式对所述重建图像的该分量进行NNLF；在cost ₂<cost ₁的情况下，选择所述第二模式对所述重建图像的该分量进行NNLF；在cost ₁＝cost ₂的情况下，选择所述第一模式或第二模式对所述重建图像进行NNLF。

本公开一实施例还提供了一种视频编码方法，应用于视频编码装置，包括：对重建图像进行基于神经网络的环路滤波NNLF时，执行以下处理：

在NNLF允许残差调整的情况下，按照本公开应用于编码端NNLF滤波器的任一实施例所述的NNLF方法对所述重建图像进行NNLF；

编码所述重建图像的残差调整使用标志，以表示对重建图像进行NNLF时是否需要进行残差调整。

本公开一实施例还提供了一种码流，其中，所述码流通过本公开任一实施例所述的视频编码方法生成。

本公开一实施例还提供了一种基于神经网络的环路滤波器，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现本公开任一实施例所述的基于神经网络的环路滤波方法。

本公开一实施例还提供了一种视频解码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现如本公开任一实施例所述的视频解码方法。

本公开一实施例还提供了一种视频编码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现如本公开任一实施例所述的视频编码方法。

本公开一实施例还提供了一种视频编解码系统，包括本公开任一实施例所述的视频编码装置和本公开任一实施例所述的视频解码装置。

本公开一实施例还提供了一种非瞬态计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序时被处理器执行时能够实现如本公开任一实施例所述的基于神经网络的环路滤波方法，或实现如本公开任一实施例所述的视频解码方法，或实现如本公开任一实施例所述的视频编码方法。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图概述

附图用来提供对本公开实施例的理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开的技术方案，并不构成对本公开技术方案的限制。

图1A是一实施例编解码系统的示意图，图1B是图1A中编码端的框架图，图1C是图1A中解码端的框架图；

图2是一实施例的滤波器单元的模块图；

图3A是一实施例NNLF滤波器的网络结构图，图3B是图3A中残差块的结构图；图3C是图3A中NNLF滤波器的输入和输出的示意图；

图4A是另一实施例NNLF滤波器中骨干网络的结构图，图4B是图4A中残差块的结构图；图4C是图4ANNLF滤波器的输入和输出的示意图；

图5是残差网络的基本网络结构的示意图；

图6A是一实施例对NNLF模型迭代训练的示意图；图6B是对图6A中的NNLF模型进行编码测试的示意图；

图7是本公开一实施例应用于编码端的NNLF方法的流程图；

图8是本公开另一实施例应用于编码端的NNLF方法的流程图；

图9是本公开一实施例视频编码方法的流程图；

图10是本公开一实施例应用于解码端的NNLF方法的流程图；

图11是本公开一实施例可进行模式选择的NNLF的示意图；

图12是本公开另一实施例应用于解码端的NNLF方法的流程图；

图13是本公开一实施例视频解码方法的流程图；

图14是本公开一实施例滤波器单元的结构示意图；

图15是本公开一实施例NNLF滤波器的示意图；

图16是本公开一实施例残差值调整的示意图。

详述

本公开描述了多个实施例，但是该描述是示例性的，而不是限制性的，并且对于本邻域的普通技术人员来说显而易见的是，在本公开所描述的实施例包含的范围内可以有更多的实施例和实现方案。

本公开的描述中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本公开中被描述为“示例性的”或者“例如”的任何实施例不应被解释为比其他实施例更优选或更具优势。本文中的“和/或”是对关联对象的关联关系的一种描述，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。“多个”是指两个或多于两个。另外，为了便于清楚描述本公开实施例的技术方案，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本邻域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。

在描述具有代表性的示例性实施例时，说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而，在该方法或过程不依赖于本文所述步骤的特定顺序的程度上，该方法或过程不应限于所述的特定顺序的步骤。如本邻域普通技术人员将理解的，其它的步骤顺序也是可能的。因此，说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外，针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤，本邻域技术人员可以容易地理解，这些顺序可以变化，并且仍然保持在本公开实施例的精神和范围内。

本公开实施例基于神经网络的环路滤波方法、视频编解码方法可以应用于各种视频编解码标准，例如：H.264/Advanced Video Coding(高级视频编码，AVC),H.265/High Efficiency Video Coding(高效视频编码，HEVC),H.266/Versatile Video Coding(多功能视频编码，VVC)，AVS(Audio Video coding Standard，音视频编码标准)，以及MPEG(Moving Picture Experts Group，动态图像专家组)、AOM(开放媒体联盟，Alliance for Open Media)、JVET(联合视频专家组,Joint Video Experts Team)制订的其他标准以及这些标准的拓展，或任何自定义的其他标准等。

图1A是可用于本公开实施例的一种视频编解码系统的框图。如图所示，该系统分为编码端1和解码端2，编码端1产生码流。解码端2可对码流进行解码。解码端2可经由链路3从编码端1接收码流。链路3包括能够将码流从编码端1移动到解码端2的一个或多个媒体或装置。在一个示例中，链路3包括使得编码端1能够将码流直接发送到解码端2的一个或多个通信媒体。编码端1根据通信标准来调制码流，将经调制的码流发送到解码端2。所述一个或多个通信媒体可包含无线和/或有线通信媒体,可形成分组网络的一部分。在另一示例中，也可将码流从输出接口15输出到一个存储装置，解码端2可经由流式传输或下载从该存储装置读取所存储的数据。

如图所示，编码端1包含数据源11、视频编码装置13和输出接口15。数据源11包括视频捕获装置(例如摄像机)、含有先前捕获的数据的存档、用以从内容提供者接收数据的馈入接口，用于产生数据的计算机图形系统，或这些来源的组合。视频编码装置13也可称为视频编码器，用于对来自数据源11的数据进行编码后输出到输出接口15，输出接口15可包含调节器、调制解调器和发射器中的至少之一。解码端2包含输入接口21、视频解码装置23和显示装置25。输入接口21包含接收器和调制解调器中的至少之一。输入接口21可经由链路3或从存储装置接收码流。视频解码装置23也称为视频解码器，用于对接收的码流进行解码。显示装置25用于显示解码后的数据，显示装置25可以与解码端2的其他装置集成在一起或者单独设置，显示装置25对于解码端来说是可选的。在其他示例中，解码端可以包含应用解码后数据的其他装置或设备。

图1B为可用于本公开实施例的一示例性的视频编码装置的框图。如图所示，该视频编码装置10包括：

划分单元101，设置为与预测单元100配合，将接收的视频数据划分为切片(Slice)、编码树单元(CTU：Coding Tree Unit)或其它较大的单元。所述接收的视频数据可以是包括I帧、P帧或B帧等视频帧的视频序列。

预测单元100，设置为将CTU划分为编码单元(CU：Coding Unit)，对CU执行帧内预测编码或帧间预测编码。对CU做帧内预测和帧间预测时，可以将CU划分为一个或多个预测单元(PU：prediction unit)。

预测单元100包含帧间预测单元121和帧内预测单元126。

帧间预测单元121，设置为对PU执行帧间预测，产生PU的预测数据，所述预测数据包括PU的预测块、PU的运动信息和各种语法元素。帧间预测单元121可以包括运动估计(ME:motion estimation)单元和运动补偿(MC:motion compensation)单元。运动估计单元可以用于运动估计以产生运动矢量，运动补偿单元可以用于根据运动矢量获得或生成预测块。

帧内预测单元126，设置为对PU执行帧内预测，产生PU的预测数据。PU的预测数据可包含PU的预测块和各种语法元素。

残差产生单元102(图中用划分单元101后的带加号的圆圈表示)，设置为基于CU的原始块减去CU划分成的PU的预测块，产生CU的残差块。

变换处理单元104，设置为将CU划分为一个或多个变换单元(TU：Transform Unit)，预测单元和变换单元的划分可以不同。TU关联的残差块是CU的残差块划分得到的子块。通过将一种或多种变换应用于TU关联的残差块来产生TU关联的系数块。

量化单元106，设置为基于量化参数对系数块中的系数进行量化，通过调整量化参数(QP：Quantizer Parameter)可以改变系数块的量化程度。

反量化单元108和反变换单元110分别设置为将反量化和反变换应用于系数块，得到TU关联的重建残差块。

重建单元112(图中用反变换处理单元110后的带加号的圆圈表示)，设置为将重建残差块和预测单元100产生的预测块相加，产生重建图像。

滤波器单元113，设置为对重建图像执行环路滤波。

解码图像缓冲器114，设置为存储环路滤波后的重建图像。帧内预测单元126可以从解码图像缓冲器114中提取与当前块邻近的块的参考图像以执行帧内预测。帧间预测单元121可使用解码图像缓冲器114缓存的上一帧的参考图像对当前帧图像的PU执行帧间预测。

熵编码单元115，设置为对接收的数据(如语法元素、量化后的系数块、运动信息等)执行熵编码操作，生成视频码流。

在其他示例中，视频编码装置10可以包含比该示例更多、更少或不同功能组件，如可以取消变换处理单元104、反变换处理单元110等。

图1C为可用于本公开实施例的一示例性的视频解码装置的框图。如图所示，视频解码装置15包括：

熵解码单元150，设置为对接收的已编码视频码流进行熵解码，提取语法元素、量化后的系数块和PU的运动信息等。预测单元152、反量化单元154、反变换处理单元156、重建单元158以及滤波器单元159均可基于从码流提取的语法元素来执行相应的操作。

反量化单元154，设置为对量化后的TU关联的系数块进行反量化。

反变换处理单元156，设置为将一种或多种反变换应用于反量化后的系数块以便产生TU的重建残差块。

预测单元152包含帧间预测单元162和帧内预测单元164。如果当前块使用帧内预测编码，帧内预测单元164基于从码流解码出的语法元素确定PU的帧内预测模式，结合从解码图像缓冲器160获取的当前块邻近的已重建参考信息执行帧内预测。如果当前块使用帧间预测编码，帧间预测单元162基于当前块的运动信息和相应的语法元素确定当前块的参考块，从解码图像缓冲器160获取的所述参考块执行帧间预测。

重建单元158(图中用反变换处理单元155后的带加号的圆圈表示)，设置为基于TU关联的重建残差块和预测单元152执行帧内预测或帧间预测产生的当前块的预测块，得到重建图像。

滤波器单元159，设置为对重建图像执行环路滤波。

解码图像缓冲器160，设置为存储环路滤波后的重建图像，作为参考图像用于后续运动补偿、帧内预测、帧间预测等，也可将滤波后的重建图像作为已解码视频数据输出，在显示装置上的呈现。

在其它实施例中，视频解码装置15可以包含更多、更少或不同的功能组件，如在某些情况下可以取消反变换处理单元155等。

本文中，当前块(current block)可以是当前图像中的当前编码树单元(CTU)，当前编码单元(CU)、当前预测单元(PU)等块级编码单位。

基于上述视频编码装置和视频解码装置，可以执行以下基本的编解码流程，在编码端，将一帧图像划分成块，对当前块进行帧内预测或帧间预测或其他算法产生当前块的预测块，使用当前块的原始块减去预测块得到残差块，对残差块进行变换和量化得到量化系数，对量化系数进行熵编码生成码流。在解码端，对当前块进行帧内预测或帧间预测产生当前块的预测块，另一方面对解码码流得到的量化系数进行反量化、反变换得到残差块，将预测块和残差块相加得到重建块，重建块组成重建图像，基于图像或基于块对重建图像进行环路滤波得到解码图像。编码端同样通过和解码端类似的操作以获得解码图像，也可称为环路滤波后的重建图像。环路滤波后的重建图像可以作为对后续帧进行帧间预测的参考帧。编码端确定的块划分信息，预测、变换、量化、熵编码、环路滤波等模式信息和参数信息可以写入码流。解码端通过解码码流或根据设定信息进行分析，确定编码端使用的块划分信息，预测、变换、量化、熵编码、环路滤波等模式信息和参数信息，从而保证编码端获得的解码图像和解码端获得的解码图像相同。

以上虽然是以基于块的混合编码框架为示例，但本公开实施例并不局限于此，随着技术的发展，该框架中的一个或多个模块，及该流程中的一个或多个步骤可以被替换或优化。

本公开实施例涉及但不限于上述编码端和解码端中的滤波器单元(该滤波器单元也可称为环路滤波模块)及相应的环路滤波方法。

在一实施例中，编码端和解码端的滤波器单元包含去块滤波器(DBF：DeBlocking Filter)20、样值自适应补偿滤波器(SAO：Sample adaptive Offset)22和自适应修正滤波器(ALF：Adaptive loop filter)26等工具，在SAO和ALF之间，还包括基于神经网络的环路滤波器(NNLF，Neural Network based Loop Filter)26，如图2所示。滤波器单元对重建图像执行环路滤波，可以弥补失真信息，为后续编码像素提供更好的参考。

在一示例性的实施例中提供了一种基于神经网络的环路滤波NNLF方案，使用的模型采用如图3A所示的滤波网络，文中将该NNLF记为NNLF1，将执行NNLF1的滤波器称为NNLF1滤波器。如图所示，该滤波网络的骨干网络(backbone)包括采用多个依次连接的残差块(ResBlock)，还包括卷积层(图中用Conv表示)、激活函数层(如图中的ReLU)，合并(concat)层(图中用Cat表示)，及像素重组层(图中用PixelShuffle表示)。每个残差块的结构如图3B所示，包括依次连接的卷积核大小为1×1的卷积层、ReLU层、卷积核大小为1×1的卷积层和卷积核大小为3×3的卷积层。

如图3A所示，NNLF1滤波器的输入包括重建图像(rec_YUV)的亮度信息(即Y分量)和色度信息(即U分量和V分量)，以及多种辅助信息，例如预测图像(pred_YUV)的亮度信息和色度信息、QP信息、帧类型信息。QP信息包括编码配置文件中默认的基线量化参数(BaseQP：Base Quantization Parameter)和当前切片的切片量化参数(SliceQP：Slice Quantization Parameter)，帧类型信息包括切片类型(SliceType)，即当前slice所属的帧的类型。模型的输出为经NNLF1滤波后的滤波图像(output_YUV)，NNLF1滤波器输出的滤波图像也可以作为输入到后续滤波器的重建图像。

NNLF1使用一个模型对重建图像的YUV分量(rec_YUV)进行滤波，输出滤波图像的YUV分量(out_YUV)，如图3C所示，图中略去了预测图像的YUV分量等辅助输入信息。该模型的滤波网络在输入的重建图像到输出的滤波图像之间存在一条跳连接支路，如图3A所示。

另一示例性的实施例提供了另一种NNLF方案，记为NNLF2。NNLF2使用两个模型，一个模型用于对重建图像的亮度分量进行滤波，另一个模型用于对重建图像的两个色度分量进行滤波，该两个模型可以采用相同的滤波网络，输入NNLF2滤波器的重建图像到NNLF2滤波器输出的滤波图像之间也存在一条跳连接支路。如图4A所示，该滤波网络的骨干网络包括依次连接的多个带注意力机制的残差块(AttRes Block)、用于实现特征映射的卷积层(Conv 3×3)以及重组层(Shuffle)。每个带注意力机制的残差块的结构如图4B所示，包括依次连接的卷积层(Conv 3×3)、激活层(PReLU)、卷积层(Conv 3×3)和注意力层(Attintion)，M表示特征图的数量，N代表一维中的样本数。

NNLF2用于对重建图像的亮度分量滤波的模型一如图4C所示，其输入信息包括重建图像的亮度分量(rec_Y)，输出为滤波图像的亮度分量(out_Y)，图中略去了预测图像的亮度分量等辅助输入信息。NNLF2用于对重建图像的两个色度分量滤波的模型二如图4C所示，其输入信息包括重建图像的两个色度分量(rec_UV)，及作为辅助输入信息的重建图像的亮度分量(rec_Y)，模型二的输出是滤波图像的两个色度分量(out_UV)。模型一和模型二还可以包括其他的辅助输入信息，如QP信息、块划分图像、去块滤波边界强度信息等。

上述NNLF1方案和NNLF2方案在基于神经网络的视频编码(NNVC:Neural Network based Video Coding)中可以用基于神经网络的通用软件(NCS：Neural Network based Common Software)实现，作为NNVC的参考软件测试平台中的基线工具即基线NNLF。

在深度学习领域，提出了残差学习(Residual learning)的理念，通过输入端到输出端的简单跳连接(Skip Connection)结构，让网络专注于学习图像的残差信息，提升了网络的学习能力和预测性能，残差网络(ResNet)的基本结构如图5所示。NNLF1和NNLF2借鉴了残差学习的理念，参见图5，其滤波网络包括神经网络(NN)，及从输入滤波器的重建图像到滤波器输出的滤波图像的跳连接支路。NNLF1和NNLF2输出的滤波图像cnn＝rec+res，其中rec表示输入的重建图像，res表示神经网络输出的残差图像，该神经网络包括滤波网络中除了上述跳连接支路外的其他部分，该神经网络具有预测残差信息的功能。NNLF1和NNLF2通过神经网络预测输入的重建图像相对于原始图像的残差信息即残差图像，再把残差图像叠加到输入的重建图像(即与重建图像相加)，得到滤波器输出的滤波图像，可以使该滤波图像的质量更加接近于原始图像。

在视频编码中，帧间预测技术使得当前帧可以参考前序帧的图像信息，提升了编码性能，而前序帧的编码效果也会影响后续帧的编码效果。在NNLF1和NNLF2的方案中，为了能让滤波网络适应帧间预测技术的影响，其模型的训练过程包括初始训练阶段和迭代训练阶段，采用多轮训练的方式。在初始训练阶段，待训练的模型还没有部署在编码器中，通过采集的重建图像的样本数据对模型进行第一轮训练，得到第一轮训练后的模型。在迭代训练阶段，模型均部署在编码器中，先将第一轮训练后的模型部署在编码器中，重新采集重建图像的样本数据，对第一轮训练后的模型进行第二轮训练，得到第二轮训练后的模型；之后，再将第二轮训练后的模型部署在编码器中，重新采集重建图像的样本数据，对第二轮训练后的模型进行第三轮训练，得到第三轮训练后的模型，如此迭代训练；最后对每一轮训练后的模型在验证集上进行编码测试，找到编码性能最佳的模型用于实际部署。

然而，这种多轮训练的操作，训练相对编码测试仍然存在一定的滞后性。分析如下：图6A是第N+1轮训练的示意图，如图所示，进行第N+1轮训练时，是将第N次训练后的模型model_N部署在编码器中，采集多帧重建图像的训练数据，图中标记有0，1，2,…的方框表示第1帧、第2帧、第3帧、……的重建图像，训练得到第N+1轮训练后的模型model_N+1。假定经编码测试model_N+1的性能最佳，训练完成。

对model_N+1进行编码测试时，是将模型model_N+1部署到编码器或解码器中进行的，如图6B所示，使用帧间预测编码的当前帧参考的前序帧是基于model_N+1进行环路滤波而生成的，训练相对测试存在滞后性。但对于model_N+1而言，其适用环境是第N+1轮训练时的环境，其当前帧所参考的前序帧是使用model_N进行环路滤波，不同于对model_N+1进行编码测试的环境。由于model_N+1的性能优于model_N，编码测试时，当前帧所参考的前序帧使用了model_N+1进行滤波处理后，其前序帧的性能进一步提升，这使得对model_N+1进行编码测试时，输入的重建图像的质量提升(与原始图像的残差变小)，不同于训练环境下所预期的质量。而model_N+1仍旧按照其训练好的能力来预测残差，导致model_N+1中的神经网络输出的残差可能会偏大，目前还没有方案尝试对该残差进行调整。

本文中，对残差图像的残差值而言，残差调整使得残差图像的残差变小是指残差图像中的残差值更为接近于0，即残差值的绝对值变小，如3变为2，-3变为-2，而并非指-3变为-4这样的变化。且残差变小是对残差图像的整体而言，可以是部分像素的残差值的绝对值变小，部分像素的残差值不变，除了为零的残差值不变化，可以是所有非零残差值的绝对值变小，也可以是部分非零残差值的绝对值变小，例如，可以是位于取值区间[1,2]、[-1,-2]的残差值不变，而大于等于3和小于等于-3的残差值的绝对值变小。

本公开一实施例提供一种基于神经网络的环路滤波方法，应用于编码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括：

步骤S110，将重建图像输入所述神经网络，获取所述神经网络输出的残差图像；

步骤S120，计算采用第一模式对所述重建图像进行NNLF的率失真代价cost ₁，及采用第二模式对所述重建图像进行NNLF的率失真代价cost ₂；

其中，所述第一模式是不对所述残差图像进行残差调整的NNLF模式，所述第二模式是对所述残差图像进行残差调整的NNLF模式；

步骤S130，在cost ₁<cost ₂的情况下，选择所述第一模式对所述重建图像进行NNLF；在cost ₂<cost ₁的情况下，选择所述第二模式对所述重建图像进行NNLF；在cost ₁＝cost ₂的情况下，选择所述第一模式或第二模式对所述重建图像进行NNLF。

本实施例基于神经网络的环路滤波方法，编码端可以从进行残差调整的模式和不进行残差调整的模式中选择一种率失真代价较小的模式进行NNLF，在一定程度上补偿NNLF模式的训练相对编码测试的滞后性带来的性能损失，从而提高NNLF滤波的效果，提升编码性能。

如无相反限定，本文中的残差调整是指对重建图像进行基于神经网络的环路滤波时对残差图像所做的残差调整。

在本公开一示例性的实施例中，所述重建图像为当前帧或当前切片(slice)或当前块的重建图像，但也可以是其他编码单位的重建图像。本文中进行NNLF滤波器的重建图像可以是图像级(包括帧、切片)、块级等不同级别的编码单位。

在本公开一示例性的实施例中，所述残差调整使得所述残差图像中的残差变小。

在本公开一示例性的实施例中，所述计算采用第一模式对所述重建图像进行NNLF的率失真代价cost ₁，包括：将所述残差图像与所述重建图像相加得到一第一滤波图像；及，根据该第一滤波图像与相应原始图像的差异计算得到所述cost ₁；在所述重建图像和所述残差图像均包括3个分量，如Y分量、U分量和V分量的情况下。所述cost ₁可以通过计算所述第一滤波图像与所述原始图像在3个分量上的平方误差和(SSD)：及对所述3个分量上的SSD加权后相加而得到。本实施例，所述选择所述第一模式对所述重建图像进行NNLF，包括：将所述残差图像与所述重建图像相加得到的第一滤波图像，作为对所述重建图像进行NNLF后输出的滤波图像。本实施例采用第一模式对重建图像进行NNLF时，可以采用上述NNLF1或NNLF2的滤波方法，也可以采用其他不对残差图像进行残差调整的滤波方法。

在本公开一示例性的实施例中，所述计算采用第二模式对所述重建图像进行NNLF的率失真代价cost ₂，包括：

按照设定的每一种残差调整方式，对所述残差图像进行残差调整并与所述重建图像相加，得到一第二滤波图像，再根据该第二滤波图像与所述原始图像的差异计算一率失真代价；及，

将计算得到的所有率失真代价中最小的率失真代价作为cost ₂。

在本实施例的一示例中，所述设定的残差调整方式有一种，则计算得到一个率失真代价，该率失真代价即cost ₂。在本实施例的另一示例中，所述设定的残差调整方式有多种，假定有2种，则计算得到2个率失真代价，此时以该2个率失真代价中最小的率失真代价为cost ₂。

在本实施例的一示例中，对所述残差图像进行残差调整并与所述重建图像相加，可以是对所述残差图像进行残差调整后，将残差调整的结果与所述重建图像相加，残差调整的方式例如是将残差图像中正的残差值减1，负的残差值加1，即对为0的残差值不进行调整，使得残差图像中残差整体上变小。但在具体实现时，并不一定要按照该顺序计算，如先将所述残差图像与所述重建图像相加，该相加得到的图像中也包含残差图像，再对其中的残差图像进行残差调整也是可以的。以图像中的任一像素点来说，假定残差图像中该像素点的值(即残差值)为x，重建图像中该像素点的值(即重建值)为y，残差调整是将该像素点的残差值减1，则计算第二滤波图像中该像素点的值时，先将x减1再加y，还是先将x加y再减1，结果是一样的。本公开的其他实施例，包括解码端的实施例，对残差图像(或其分量)进行残差调整并与重建图像(或其分量)相加的具体实现也是如此。

本实施例的一示例中，所述重建图像和所述残差图像均包括3个分量，所述根据该第二滤波图像与所述原始图像的差异计算一率失真代价，包括：计算该第二滤波图像与所述原始图像在3个分量上的平方误差和SSD，再对所述3个分量上的SSD加权后相加，得到该率失真代价。

在本公开一示例性的实施例中，所述设定的残差调整方式包括以下一种或多种类型的残差调整方式：

将残差图像中的非零残差值加上或减去固定值，使得所述非零残差值的绝对值变小；例如，将残差图像中正的残差值减1，负的残差值加1。

将残差图像中的非零残差值按照其所在区间加上或减去该区间对应的调整值，使得所述非零残差值的绝对值变小；其中，所述区间有多个，且区间中的值越大，对应的调整值也越大。例如，将残差图像中大于等于1且小于等于5的残差值减1，大于5的残差值减2，小于等于-1且大于等于-5的残差值加1，小于-5的残差值加2。

上述本实施例通过调整滤波网络输出的残差信息来提升编码性能。如上文所述，神经网络输出的残差图像的残差可能偏大，通过残差调整将残差调小且助于提升编码性能。对于一残差图像，其中的每个像素点的残差值可能为正也可能为负，调小残差时，可以将正的残差值减去固定值(正数)，将负的残差值加上该固定值，残差值为0时不做调整，使得整体的残差值变小即更接近于0。如图16所示，假设固定值为(+1)，原始残差图像中各像素点的残差值见图左，经过残差调整后的残差图像中各像素点的残差值见图右。将经残差调整后的残差图像叠加到输入的重建图像上，得到滤波图像，也可以称为经NNLF的重建图像。可以设置多个固定值，对应多种残差调整方式，通过计算每一种残差调整方式下的率失真代价，选择率失真代价最小的一种残差调整方式所采用的固定值，并把该残差调整方式对应的索引编入码流中，供解码端读取并处理。

除了采用固定值的残差调整方式外，也可以采用其他类型的残差调整方式，例如：根据残差值的大小，将其进行分段，尝试不同精度的调整操作，例如对于绝对值较大的残差值，设置绝对值较大的调整值；对于绝对值较小的残差值，设置绝对值较小的调整值。

一个示例的伪代码如下：

假设对于当前帧的当前像素点，其对应的残差值为res，需要决策出的调整值为RO_FACTOR，具体的调整值导出的策略如下。

if(res＝0) RO_FACTOR＝0；

else if(0<res<＝x1) RO_FACTOR＝a1；

else if(x1<res<＝x2) RO_FACTOR＝a2；

else if(x2<res) RO_FACTOR＝a3；

else if(y1<＝res<0) RO_FACTOR＝b1；

else if(y2<＝res<y1) RO_FACTOR＝b2；

else if(res<y2) RO_FACTOR＝b3；

其中，{x1,x2,x3}表示正残差值，{y1,y2,y3}表示负残差值，{a1,a2,a3}和{b1,b2,b3}均为预设的候选固定值。

以上方案是对为零的残差值不做调整，对非零残差值，查找其落入的区间(共设定6个区间)，从而确定应使用的调整值。

本实施例中，设定的多种残差调整方式可以包括一种类型的残差调整方式，也可以包括多种类型的残差调整方式。

上述实施例是对残差图像中的3个分量统一进行调整，使用相同的残差调整方式。使用该残差调整方式对残差图像进行残差调整，是在3分量统一调整的前提下整体上最优的结果，但是对于残差图像中的具体分量来说，并不一定是最优的残差调整方式。对此，可以对每个分量单独进行是否进行残差调整以及残差调整方式的选择，使编码性能进一步优化。

本公开一实施例提供了一种基于神经网络的环路滤波方法，应用于编码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，如图8所示，所述方法包括：

步骤S210，将重建图像输入所述神经网络，获取所述神经网络输出的残差图像；所述重建图像和残差图像均包括3个分量，如Y分量、U分量和V分量；及

步骤S210，对所述3个分量中的每一分量分别执行以下处理，该处理可称为模式选择处理：

计算采用第一模式对所述重建图像的该分量进行NNLF的率失真代价cost ₁，及采用第二模式对所述重建图像的该分量进行NNLF的率失真代价cost ₂；第一模式是不对所述残差图像的该分量进行残差调整的NNLF模式，第二模式是对所述残差图像的该分量进行残差调整的NNLF模式；

在cost ₁<cost ₂的情况下，选择所述第一模式对所述重建图像的该分量进行NNLF；在cost ₂<cost ₁的情况下，选择所述第二模式对所述重建图像的该分量进行NNLF在cost ₁＝cost ₂的情况下，选择所述第一模式或第二模式对所述重建图像进行NNLF。

本实施例可以对每个分量单独进行模式选择处理，可以使得编码性能在对3个分量统一调整的前述实施例的基础上进一步优化，由于相关运算是NNLF滤波器的输出端进行，对于运算复杂度的影响不大。

在本公开一示例性的实施例中，所述重建图像为当前帧或当前切片或当前块的重建图像。

在本公开一示例性的实施例中，所述残差调整使得所述残差图像的分量中的残差变小。

在本公开一示例性的实施例中，所述计算采用第一模式对所述重建图像的该分量进行NNLF的率失真代价cost ₁，包括：将所述残差图像的该分量与所述重建图像的该分量相加，得到滤波后的该分量；及，根据滤波后的该分量与相应原始图像的该分量之间的差异，计算得到所述cost1；在一个示例中，所述差异用SSD表示，即将滤波后的该分量与相应原始图像的该分量之间的SSD作为所述cost1。在其他示例中，所述差异也可以用均方误差(MSE:Mean Squared Error)、平均绝对误差(MAE:Mean Absolute Error)等其他的指标来表示，本公开对此不做局限。本公开的其他实施例同此。

本实施例的一示例中，选择所述第一模式对所述重建图像的该分量进行NNLF，包括：将所述残差图像的该分量与所述重建图像的该分量相加得到的滤波后的该分量，作为对所述重建图像进行NNLF后输出的滤波图像的该分量。本实施例按照第一模式对重建图像的该分量进行NNLF得到的滤波图像的该分量，没有对残差图像的该分量进行残差调整，因此滤波图像的该分量与不进行残差调整的NNLF方案(如NNLF1、NNLF2)得到的滤波图像的该方量可以相同。

在本公开一示例性的实施例中，所述计算采用第二模式对所述重建图像的该分量进行NNLF的率失真代价cost ₂，包括：

按照为该分量设定的每一种残差调整方式，对所述残差图像的该分量进行残差调整并与所述重建图像的该分量相加，得到滤波后的该分量；再根据滤波后的该分量与相应原始图像的该分量之间的差异，计算该分量的一个率失真代价；例如，将滤波后的该分量与相应原始图像的该分量之间的SSD作为该分量的率失真代价；及

将计算得到的该分量的所有率失真代价中最小的率失真代价，作为该分量的cost ₂；其中，为该分量设定的残差调整方式有一种或多种。

在本实施例的一示例中，所述选择所述第二模式对所述重建图像的该分量进行NNLF，包括：

将按照该分量的cost ₂对应的残差调整方式，对所述残差图像的该分量进行残差调整并与所述重建图像的该分量相加得到的滤波后的该分量，作为对所述重建图像进行NNLF后输出的滤波图像的该分量。

在本实施例的一示例中，对所述残差图像的该分量进行残差调整并与所述重建图像的该分量相加，可以是对所述残差图像的该分量进行残差调整后，将残差调整的结果与所述重建图像的该分量相加，但在具体实现时，并不一定要按照该顺序计算。

在本实施例的一示例中，为所述3个分量设定的残差调整方式相同或不同；例如，对于Y分量设定的残差调整方式为：将残差图像中正的残差值减1，负的残差值加1；而为U分量和V分量设定的残差调整方式为：将残差图像中大于2的残差值减1，小于-2的残差值加1。

在本实施例的一示例中，为所述3个分量中至少一个分量设定的残差调整方式包括以下一种或多种类型的残差调整方式：

将残差图像中的非零残差值加上或减去固定值，使得所述非零残差值的绝对值变小；

将残差图像中的非零残差值按照其所在区间加上或减去该区间对应的调整值，使得所述非零残差值的绝对值变小；其中，所述区间有多个，且区间中的值越大，对应的调整值也越大。

本公开一实施例还提供了一种视频编码方法，应用于视频编码装置，包括：对重建图像进行基于神经网络的环路滤波NNLF时，如图8所示，执行以下处理：

步骤S310，在NNLF允许残差调整的情况下，按照本公开任一实施例所述的NNLF方法对所述重建图像进行NNLF；

步骤S320，编码所述重建图像的残差调整使用标志，以表示对所述重建图像进行NNLF时是否需要进行残差调整。

本公开实施例在对重建图像进行基于神经网络的环路滤波时，可以根据率失真代价选择对残差图像进行调整或者不进行调整，可以补偿NNLF模式的训练相对编码测试的滞后性带来的性能损失，提高编码性能。

在本公开一示例性的实施例中，所述残差调整使用标志为图像级语法元素或者块级语法元素。

在本公开一示例性的实施例中，在满足以下一种或多种条件的情况下，确定NNLF允许残差调整：

解码序列级的残差调整允许标志，根据该残差调整允许标志的值确定NNLF允许残差调整；

解码图像级的残差调整允许标志，根据该残差调整允许标志的值确定NNLF允许残差调整。

除上述条件外，还可以增加其他条件，例如，将输入的重建图像所在的帧为帧间编码帧作为NNLF允许残差调整的必要条件，等。

在本公开的其他实施例中，也可以一直启用NNLF的残差调整，此时不需要通过标志来判断，默认NNLF允许残差调整。

在本公开一示例性的实施例中，所述方法还包括：确定NNLF不允许残差调整的情况下，跳过对所述残差使用标志的编码，将输入所述神经网络的所述重建图像与所述神经网络输出的残差图像相加，得到对所述重建图像进行NNLF后输出的滤波图像。即此时可使用不进行残差调整的NNLF实现对重建图像的滤波。

在本公开一示例性的实施例中，所述方法是按照上述对残差图像的3个分量统一进行残差调整的任一实施例对所述重建图像进行NNLF；所述重建图像的残差调整使用标志roflag的个数为1个；在选择所述第一模式对所述重建图像进行NNLF的情况下，所述roflag被置为表示不需要进行残差调整的值如0；在选择所述第二模式对所述重建图像进行NNLF的情况下，所述roflag被置为表示需要进行残差调整的值如1。

在本实施例的一示例中，所述方法还包括：在所述roflag被置为表示需要进行残差调整的值，且所述设定的残差调整方式有多种的情况下，继续编码所述重建图像的残差调整方式索引，所述残差调整方式索引用于指示进行残差调整时所基于的残差调整方式。例如，设定的残差调整方式有3种时，残差调整方式索引可以是2bit标志，在该标志的值为0,1,2时分别表示3种残差调整方式，值与残差调整方式的对应关系在编码端和解码端事先约定好，例如在标准、协议中定义。

本实施例是采用两个标志，即残差调整使用标志和残差调整方式索引来分别表示是否需要进行残差调整，以及进行残差调整所基于的残差调整方式(设定有多种残差调整方式时)。但在本公开另一示例性的实施例中，在设定的残差调整方式有多种的情况下，所述残差调整使用标志还用于表示进行残差调整所基于的残差调整方式，即本实施例是使用残差调整使用标志同时表示是否需要进行残差调整及残差调整所基于的残差调整方式。例如，在设定的残差调整方式有3种的情况下，使用2bit的残差调整使用标志roflag，该roflag的4个值可以分别表示不需要进行残差调整，使用第1种残差调整方式进行残差调整，使用第2种残差调整方式进行残差调整，及使用第3种残差调整方式进行残差调整。

在设定的残差调整方式有3种、不需要进行残差调整的情况下，使用2个标志的实施例只需要编码1个1bit的标志即残差调整使用标志，不需要编码残差调整方式索引；而使用1个标志的实施例，需要编码1个2bit的残差调整使用标志。在设定的残差调整方式有3种、需要进行残差调整的情况下，在需要进行残差调整的情况下,使用2个标志的实施例需要编码1个1bit的残差调整使用标志和1个2bit的残差调整方式索引，使用1个标志的实施例需要编码1个2bit的残差调整使用标志.

在本公开一示例性的实施例中，所述方法是按照上述对残差图像的3个分量分别进行残差调整的任一实施例对所述重建图像进行NNLF；所述重建图像的残差调整使用标志roflag(j)的个数为3，j＝1,2,3，roflag(j)用于表示对所述重建图像的第j个分量进行NNLF时是否需要进行残差调整；在选择所述第一模式对所述重建图像的第j个分量进行NNLF的情况下，roflag(j)被置为表示不需要进行残差调整的值如0，在选择所述第二模式对所述重建图像的第j个分量进行NNLF的情况下，roflag(j)被置为表示需要进行残差调整的值如1。

在本实施例的一示例中，所述方法还包括：在所述roflag(j)被置为表示需要进行残差调整的值，且为第j个分量设定的残差调整方式有多种的情况下，继续编码所述重建图像的第j个分量的残差调整方式索引index(j)，以指示对所述残差图像的第j个分量进行残差调整时所基于的残差调整方式。

在本公开另一示例性的实施例中，在为第j个分量设定的残差调整方式有多种的情况下，所述第j个分量的残差调整使用标志还用于表示进行残差调整所基于的残差调整方式，即本实施例使用第j个分量的残差调整使用标志同时表示是否需要进行残差调整及残差调整所基于的残差调整方式。

本公开一实施例还提供了一种基于神经网络的环路滤波方法，应用于解码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，如图10所示，所述方法包括：

步骤S410，解码重建图像的残差调整使用标志roflag，所述roflag用于表示对重建图像进行NNLF时是否需要进行残差调整；

步骤S420，根据所述roflag确定不需要进行残差调整的情况下，采用第一模式对所述重建图像进行NNLF；根据所述roflag确定需要进行残差调整的情况下，采用第二模式对所述重建图像进行NNLF；

图11是本实施例解码端对重建图像进行NNLF的示意图，如图所示，NNLF存在两种路径，一条是将神经网络(NN)输出的残差图像与重建图像相加，作为NNLF输出的滤波图像；另一条需要对残差图像进行残差调整(图中的RO表示残差调整模块，用于进行残差调整)并与重建图像相加，而两条路径的选择根据解码的残差调整使用标志确定。本实施例是在NNLF输出端进行模式选择，标志解码可以在得到滤波图像之前，但不局限于此。

本实施例基于神经网络的环路滤波方法，通过解码残差调整使用标志，从进行残差调整和不进行残差调整的两种模式中选择一种较优的模式，可以增强NNLF的滤波效果，提升解码的图像的质量。

在本公开一示例性的实施例中，roflag可以采用1位的标志，则根据roflag的值就可以表示是否需要进行残差调整。例如，在roflag的值为1时，确定需要进行残差调整，而在roflag的值为0时，确定不需要进行残差调整.。本公开的其他实施例同此。

在本公开一示例性的实施例中，所述残差调整使得所述残差图像的残差变小。

在本公开一示例性的实施例中，所述采用第一模式对所述重建图像进行NNLF，包括：将所述神经网络输出的残差图像与输入所述神经网络的所述重建图像相加，得到对所述重建图像进行NNLF后输出的滤波图像。所述采用第二模式对所述重建图像进行NNLF，包括：按照设定的残差调整方式中的一种对所述残差图像进行残差调整并与所述重建图像相加，得到对所述重建图像进行NNLF后输出的滤波图像。

在本实施例的一示例中，所述设定的残差调整方式有多种，所述按照设定的残差调整方式中的一种对所述残差图像进行残差调整，包括：继续解码所述重建图像的残差调整方式索引index，所述index用于指示进行残差调整时所基于的残差调整方式；及，根据所述index指示的残差调整方式对所述残差图像进行残差调整。

本实施例是基于使用2个标志分别表示是否需要进行残差调整以及残差调整所基于的残差调整方式。在另一示例性的实施例中，在设定的残差调整方式有多种时，编码端使用1个标志即残差调整使用标志roflag同时表示是否需要进行残差调整以及残差调整所基于的残差调整方式，此时解码端继续根据所述重建图像的roflag确定进行残差调整时所基于的残差调整方式，及根据确定的残差调整方式对所述残差图像进行残差调整。

本公开一实施例还提供了一种基于神经网络的环路滤波NNLF方法，应用于解码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括，对输入神经网络的包括3分量的重建图像进行NNLF时，如图12所示，对每一分量分别执行以下处理：

步骤S510，解码重建图像的该分量的残差调整使用标志roflag，所述roflag用于表示对所述重建图像的该分量进行NNLF时是否需要进行残差调整；

步骤S520，根据所述roflag确定不需要进行残差调整的情况下，采用第一模式对所述重建图像的该分量进行NNLF；根据所述roflag确定需要进行残差调整的情况下，采用第二模式对所述重建图像的该分量进行NNLF；

本实施例基于神经网络的环路滤波方法，通过解码残差调整使用标志，对每一分量，从进行残差调整和不进行残差调整的两种NNLF模式中选择一种较优的模式对该分量进行NNLF，相对多分量统一进行模式选择，可以进一步增强NNLF的滤波效果，提升解码图像的质量。

在本公开一示例性的实施例中，所述采用第一模式对所述重建图像的该分量进行NNLF，包括：将所述残差图像的该分量与所述重建图像的该分量相加，得到对所述重建图像进行NNLF后输出的滤波图像的该分量；

所述采用第二模式对所述重建图像的该分量进行NNLF，包括：按照为该分量设定的残差调整方式中的一种，对所述残差图像的该分量进行残差调整并与所述重建图像的该分量相加，得到对所述重建图像进行NNLF后输出的滤波图像的该分量；所述为该分量设定的残差调整方式有一种或多种。

在本实施例的一示例中，所述为该分量设定的残差调整方式有多种，所述按照设定的残差调整方式中的一种对所述残差图像的该分量进行残差调整，包括：继续解码所述重建图像的该分量的残差调整方式索引index，所述index用于指示进行残差调整时所基于的残差调整方式；及，根据所述index指示的残差调整方式对所述残差图像的该分量进行残差调整。

本实施例的一示例中，图像头如下表所示：

表中，ro_enable_flag表示序列级的残差调整允许标志，ro_enable_flag为1时，再定义以下语义：

残差调整使用标志picture_ro_enable_flag(相当于其他实施例的roflag)；

当picture_ro_enable_flag为1时，定义以下语义：

残差调整方式索引picture_ro_index。

上表中的compIdx表示颜色分量的序号。对于YUV格式的图像来说，一般取0/1/2。

在其他示例，可以以块(如CTU)为单位进行NNLF，此时残差调整使用标志、残差调整方式索引定义为块级的语法元素。

本实施例是基于使用2个标志分别表示分量是否需要进行残差调整以及残差调整所基于的残差调整方式。在另一示例性的实施例中，为该分量设定的残差调整方式有多种时，编码端使用1个标志即残差调整使用标志roflag同时表示该分量是否需要进行残差调整以及残差调整所基于的残差调整方式，此时解码端根据该分量的roflag确定进行残差调整时所基于的残差调整方式，及根据确定的残差调整方式对所述残差图像的该分量进行残差调整。

在本公开一示例性的实施例中，为所述3个分量设定的残差调整方式相同或不同；为所述3个分量中至少一个分量设定的残差调整方式包括以下一种或多种类型的残差调整方式：

本公开一实施例还提供了一种视频解码方法，应用于视频解码装置，包括：对重建图像进行基于神经网络的环路滤波时，如图13所示，执行以下处理：

步骤S610，确定NNLF是否允许残差调整；

步骤S620，在NNLF允许残差调整的情况下，按照本公开应用于解码端NNLF滤波器的任一实施例所述的NNLF方法对所述重建图像进行NNLF。

本实施例视频解码方法，通过解码残差调整使用标志，对每一分量，从进行残差调整和不进行残差调整的两种NNLF模式中选择一种较优的模式对该分量进行NNLF，相对多分量统一进行模式选择，可以进一步增强NNLF的滤波效果，提升解码图像的质量。

解码序列级的残差调整允许标志，根据该残差调整允许标志确定NNLF允许残差调整；

解码图像级的残差调整允许标志，根据该残差调整允许标志确定NNLF允许残差调整。

使用序列级的残差调整允许标志的一示例中，视频序列的序列头如下表所示：

表中的ro_enable_flag即序列级的残差调整允许标志。

在本公开一示例性的实施例中，所述方法还包括：在NNLF不允许残差调整的情况下，将输入所述神经网络的所述重建图像与所述神经网络输出的所述残差图像相加，得到对所述重建图像进行NNLF后输出的滤波图像。

在本公开一示例性的实施例中，所述NNLF滤波器设置在去块滤波器或样值自适应补充偿滤波器之后，及在自适应修正滤波器之前。在本实施例的一示例中，滤波器单元(或称环路滤波模块，参见图1B和图1C)的结构如图14所示，图中的DBF表示去块滤波器，SAO表示样值自适应补充偿滤波器，ALF表示自适应修正滤波器。NN表示NNLF滤波器中用于环路滤波的神经网络，可以与NNLF1、NNLF2等不进行残差调整的NNLF滤波器的神经网络相同。NNLF滤波器还包括残差调整模块(RO：Residual Offset)和两条从NN输入分别到两条路径输出的跳连接支路，RO用于对神经网络输出的残差网络进行残差调整。这些滤波器均属于重建图像的滤波器单元的组成分部。在环路滤波时，DBF，SAO、ALF中的部分或全部可以不启用。NNLF滤波器部署的位置并不局限于本实施例所述的位置，容易理解，本公开NNLF方法的实现并不受限于其部署位置。此外滤波器单元中的滤波器也不局限于图14所示，可以有更多、更少的滤波器，或其他类型的滤波器。

本公开一实施例提供了一种基于神经网络的环路滤波方法，编码端对重建图像进行环路滤波时，按照部署的滤波器顺序进行处理，当进入NNLF时，执行以下处理：

第一步，根据序列级的残差调整允许标志ro_enable_flag判断当前序列下是否允许残差调整。若ro_enable_flag为“1”，表示允许对当前序列尝试进行残差调整，跳至第二步；若ro_enable_flag为“0”，表示当前序列不允许进行残差调整，结束(略过后续处理)；

第二步，将当前帧的重建图像输入NNLF的神经网络进行预测，从NNLF的输出得到残差图像，将残差图像叠加到输入的重建图像上，得到第一滤波图像；

第三步，对残差图像进行残差调整再叠加到输入的重建图像上，得到第二滤波图像；

第四步，将第一滤波图像与当前帧的原始图像相比较，计算率失真代价C _NNLF；将第二滤波图像与当前帧的原始图像比较，计算率失真代价C _RO。

第五步，比较两种代价，如果C _RO<C _NNLF，将第二滤波图像作为NNLF滤波器输出的滤波图像，即选择第二模式对重建图像进行NNLF；如果C _RO≥C _NNLF，将第一滤波图像作为滤波器输出的滤波图像，即选择第一模式对重建图像进行NNLF；

本实施例的率失真代价cost的计算公式为：

cost＝Wy*SSD(Y)+Wu*SSD(U)+Wv*SSD(V)

其中，SSD(*)表示对于某颜色分量求SSD；Wy,Wu,Wv分别表示Y分量、U分量和V分量的SSD的权重值，如可以取10:1:1或8:1:1等。

其中，SSD的计算公式如下：

其中，M表示当前帧重建图像的长度、N表示当前帧重建图像的宽度，rec(x,y)和org(x,y)分别表示重建图像和原始图像在像素点(x,y)处的像素值。。

第六步，将当前帧的残差调整使用标志picture_ro_enable_flag，及残差调整方式索引picture_ro_index编入码流中；

第七步，若当前帧中的块均已完成处理，则结束当前帧的处理，之后可以继续加载下一帧进行处理，若当前帧还有块没有处理，则返回第二步。

本实施例是以当前帧的重建图像为单位进行NNLF处理，在其他实施例中，也可以基于当前帧中的块(如CTU)、切片等其他编码单位进行NNLF处理。

本实施例选择NNLF1基线工具作为对比，在NNLF1的基础上，对帧间编码帧(即非I帧)进行模式选择处理，设定2种采用固定值的残差调整方式，固定值分别设置为1和2。在通用测试条件随机接入(Random Access)和低延迟(Low Delay)B配置下，对联合视频专家组(JVET：Joint Video Experts Team)规定的通用序列进行测试，对比的锚(anchor)为NNLF1，结果如表1和表2所示。

表1：Random Access配置下本实施例对比基线NNLF1的性能

表2 Low Delay B配置下本实施例对比基线NNLF1的性能

表中的参数含义如下：

EncT:Encoding Time，编码时间,10X％代表当集成了参考行排序技术后，与没集成前相比，编码时间为10X％,这意味有X％的编码时间增加。

DecT:Decoding Time，解码时间，10X％代表当集成了参考行排序技术后，与没集成前相比，解码时间为10X％,这意味有X％的解码时间增加。

ClassA1和Class A2是分辨率为3840x2160的测试视频序列，ClassB为1920x1080分辨率的测试序列，ClassC为832x480，ClassD为416x240,ClassE为1280x720；ClassF为若干个不同分辨率的屏幕内容序列(Screen content)。

Y,U,V是颜色三分量，Y,U,V所在列表示测试结果在Y,U,V上的BD-rate(

rate)指标，值越小表示编码性能越好。

分析两表的数据可以看到，通过引入残差调整的优化方法，能够在NNLF1的基础上，进一步提升编码性能，尤其是在色度分量上。本实施例的残差调整对解码复杂度影响不大。

对帧内编码帧(I帧)也可以使用本实施例方法进行NNLF模式选择。

本公开一实施例还提供了一种基于神经网络的环路滤波器，如图15所示，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现本公开任一实施例所述的基于神经网络的环路滤波方法。如图所示，处理器和存储器通过系统总线相连，该环路滤波器还可以包括内存、网络接口等其他部件。

本公开一实施例还提供了一种视频解码装置，参见图15，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能实现如本公开任一实施例所述的视频解码方法。

本公开一实施例还提供了一种视频编码装置，参见图15，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现如本公开任一实施例所述的视频编码方法。

本公开上述实施例的处理器可以是通用处理器，包括中央处理器(CPU)、网络处理器(Network Processor，简称NP)、微处理器等等，也可以是其他常规的处理器等；所述处理器还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)、离散逻辑或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，或其它等效集成或离散的逻辑电路，也可以是上述器件的组合。即上述实施例的处理器可以是实现本发明实施例中公开的各方法、步骤及逻辑框图的任何处理器件或器件组合。如果部分地以软件来实施本公开实施例，那么可将用于软件的指令存储在合适的非易失性计算机可读存储媒体中，且可使用一个或多个处理器在硬件中执行所述指令从而实施本公开实施例的方法。本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任意其它结构。

本公开一实施例还提供了一种视频编解码系统，参见图1A，包括本公开任一实施例所述的视频编码装置和本公开任一实施例所述的视频解码装置。

在以上一个或多个示例性实施例中，所描述的功能可以硬件、软件、固件或其任一组合来实施。如果以软件实施，那么功能可作为一个或多个指令或代码存储在计算机可读介质上或经由计算机可读介质传输，且由基于硬件的处理单元执行。计算机可读介质可包含对应于例如数据存储介质等有形介质的计算机可读存储介质，或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何介质的通信介质。以此方式，计算机可读介质通常可对应于非暂时性的有形计算机可读存储介质或例如信号或载波等通信介质。数据存储介质可为可由一个或多个计算机或者一个或多个处理器存取以检索用于实施本公开中描述的技术的指令、代码和/或数据结构的任何可用介质。计算机程序产品可包含计算机可读介质。

举例来说且并非限制，此类计算机可读存储介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它介质。而且，还可以将任何连接称作计算机可读介质举例来说，如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令，则同轴电缆、光纤电缆、双纹线、DSL或例如红外线、无线电及微波等无线技术包含于介质的定义中。然而应了解，计算机可读存储介质和数据存储介质不包含连接、载波、信号或其它瞬时(瞬态)介质，而是针对非瞬时有形存储介质。如本文中所使用，磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘或蓝光光盘等，其中磁盘通常以磁性方式再生数据，而光盘使用激光以光学方式再生数据。上文的组合也应包含在计算机可读介质的范围内。

Claims

一种基于神经网络的环路滤波NNLF方法，应用于解码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括：

解码重建图像的残差调整使用标志roflag，所述roflag用于表示对重建图像进行NNLF时是否需要进行残差调整；

根据所述roflag确定不需要进行残差调整的情况下，采用第一模式对所述重建图像进行NNLF；根据所述roflag确定需要进行残差调整的情况下，采用第二模式对所述重建图像进行NNLF；

其中，所述第一模式是不对所述神经网络输出的残差图像进行残差调整的NNLF模式，所述第二模式是对所述残差图像进行残差调整的NNLF模式。
如权利要求1所述的方法，其特征在于：

所述残差调整使得所述残差图像的残差变小；

所述重建图像为当前帧或当前切片或当前块的重建图像；所述残差调整使用标志为图像级语法元素或者块级语法元素。
如权利要求1所述的方法，其特征在于：

所述采用第一模式对所述重建图像进行NNLF，包括：将所述神经网络输出的残差图像与输入所述神经网络的所述重建图像相加，得到对所述重建图像进行NNLF后输出的滤波图像；

所述采用第二模式对所述重建图像进行NNLF，包括：按照设定的残差调整方式中的一种对所述残差图像进行残差调整并与所述重建图像相加，得到对所述重建图像进行NNLF后输出的滤波图像；其中，所述设定的残差调整方式有一种或多种。
如权利要求3所述的方法，其特征在于：

所述设定的残差调整方式有多种，所述按照设定的残差调整方式中的一种对所述残差图像进行残差调整，包括：继续解码所述重建图像的残差调整方式索引index，所述index用于指示进行残差调整时所基于的残差调整方式；及，根据所述index指示的残差调整方式对所述残差图像进行残差调整。
如权利要求1所述的方法，其特征在于：

所述设定的残差调整方式包括以下一种或多种类型的残差调整方式：

将残差图像中的非零残差值加上或减去固定值，使得所述非零残差值的绝对值变小；

将残差图像中的非零残差值按照其所在区间加上或减去该区间对应的调整值，使得所述非零残差值的绝对值变小；其中，所述区间有多个，且区间中的值越大，对应的调整值也越大。
一种基于神经网络的环路滤波NNLF方法，应用于解码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括，对输入神经网络的包括3分量的重建图像进行NNLF时，对每一分量分别执行以下处理：

解码重建图像的该分量的残差调整使用标志roflag，所述roflag用于表示对所述重建图像的该分量进行NNLF时是否需要进行残差调整；

根据所述roflag确定不需要进行残差调整的情况下，采用第一模式对所述重建图像的该分量进行NNLF；根据所述roflag确定需要进行残差调整的情况下，采用第二模式对所述重建图像的该分量进行NNLF；

其中，所述第一模式是不对神经网络输出的残差图像的该分量进行残差调整的NNLF模式，所述第二模式是对所述残差图像的该分量进行残差调整的NNLF模式。
如权利要求6所述的方法，其特征在于：

所述残差调整使得所述残差图像的分量中的残差变小；

所述重建图像为当前帧或当前切片或当前块的重建图像；所述残差调整使用标志为图像级语法元素或者块级语法元素。
如权利要求6所述的方法，其特征在于：

所述采用第一模式对所述重建图像的该分量进行NNLF，包括：将所述残差图像的该分量与所述重建图像的该分量相加，得到对所述重建图像进行NNLF后输出的滤波图像的该分量；

所述采用第二模式对所述重建图像的该分量进行NNLF，包括：按照为该分量设定的残差调整方式中的一种，对所述残差图像的该分量进行残差调整并与所述重建图像的该分量相加，得到对所述重建图像进行NNLF后输出的滤波图像的该分量；所述为该分量设定的残差调整方式有一种或多种。
如权利要求8所述的方法，其特征在于：

所述为该分量设定的残差调整方式有多种，所述按照设定的残差调整方式中的一种对所述残差图像的该分量进行残差调整，包括：继续解码所述重建图像的该分量的残差调整方式索引index，所述index用于指示进行残差调整时所基于的残差调整方式；及，根据所述index指示的残差调整方式对所述残差图像的该分量进行残差调整。
如权利要求6所述的方法，其特征在于：

为所述3个分量设定的残差调整方式相同或不同；

为所述3个分量中至少一个分量设定的残差调整方式包括以下一种或多种类型的残差调整方式：

将残差图像中的非零残差值加上或减去固定值，使得所述非零残差值的绝对值变小；

将残差图像中的非零残差值按照其所在区间加上或减去该区间对应的调整值，使得所述非零残差值的绝对值变小；其中，所述区间有多个，且区间中的值越大，对应的调整值也越大。
一种视频解码方法，应用于视频解码装置，包括：对重建图像进行基于神经网络的环路滤波NNLF时，执行以下处理：

在NNLF允许残差调整的情况下，按照如权利要求1至10中任一所述的方法对所述重建图像进行NNLF。
如权利要求11所述的方法，其特征在于：

在满足以下一种或多种条件的情况下，确定NNLF允许残差调整：

解码序列级的残差调整允许标志，根据该残差调整允许标志确定NNLF允许残差调整；

解码图像级的残差调整允许标志，根据该残差调整允许标志确定NNLF允许残差调整。
如权利要求11所述的方法，其特征在于：

所述方法还包括：在NNLF不允许残差调整的情况下，将输入所述神经网络的所述重建图像与所述神经网络输出的所述残差图像相加，得到对所述重建图像进行NNLF后输出的滤波图像。
如权利要求10所述的方法，其特征在于：

所述NNLF滤波器设置在去块滤波器或样值自适应补充偿滤波器之后，及在自适应修正滤波器之前。
一种基于神经网络的环路滤波NNLF方法，应用于编码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括：

将重建图像输入所述神经网络，获取所述神经网络输出的残差图像；

计算采用第一模式对所述重建图像进行NNLF的率失真代价cost ₁，及采用第二模式对所述重建图像进行NNLF的率失真代价cost ₂；其中，所述第一模式是不对所述残差图像进行残差调整的NNLF 模式，所述第二模式是对所述残差图像进行残差调整的NNLF模式；

在cost ₁<cost ₂的情况下，选择所述第一模式对所述重建图像进行NNLF；在cost ₂<cost ₁的情况下，选择所述第二模式对所述重建图像进行NNLF；在cost ₁＝cost ₂的情况下，选择所述第一模式或第二模式对所述重建图像进行NNLF。
如权利要求15所述的方法，其特征在于：

所述重建图像为当前帧或当前切片或当前块的重建图像；所述残差调整使得所述残差图像中的残差变小。
如权利要求15所述的方法，其特征在于：

所述计算采用第一模式对所述重建图像进行NNLF的率失真代价cost ₁，包括：将所述残差图像与所述重建图像相加得到一第一滤波图像；及，根据该第一滤波图像与相应原始图像的差异计算得到所述cost ₁；

所述选择所述第一模式对所述重建图像进行NNLF，包括：将所述残差图像与所述重建图像相加得到的第一滤波图像，作为对所述重建图像进行NNLF后输出的滤波图像。
如权利要求17所述的方法，其特征在于：

所述计算采用第二模式对所述重建图像进行NNLF的率失真代价cost ₂，包括：

按照设定的每一种残差调整方式，对所述残差图像进行残差调整并与所述重建图像相加，得到一第二滤波图像，再根据该第二滤波图像与所述原始图像的差异计算一率失真代价；及

将计算得到的所有率失真代价中最小的率失真代价作为cost ₂；其中，所述设定的残差调整方式有一种或多种。
如权利要求18所述的方法，其特征在于：

所述选择所述第二模式对所述重建图像进行NNLF，包括：

将按照cost ₂对应的残差调整方式对所述残差图像进行残差调整并与所述重建图像相加得到的第二滤波图像，作为对所述重建图像进行NNLF后输出的滤波图像。
如权利要求18所述的方法，其特征在于：

所述重建图像和所述残差图像均包括3个分量；

所述cost ₁是通过计算所述第一滤波图像与所述原始图像在3个分量上的平方误差和SSD，及对所述3个分量上的SSD加权后相加而得到；

所述根据该第二滤波图像与所述原始图像的差异计算一率失真代价，包括：计算该第二滤波图像与所述原始图像在3个分量上的平方误差和SSD，再对所述3个分量上的SSD加权后相加，得到该率失真代价。
如权利要求18所述的方法，其特征在于：

所述设定的残差调整方式包括以下一种或多种类型的残差调整方式：

将残差图像中的非零残差值加上或减去固定值，使得所述非零残差值的绝对值变小；

将残差图像中的非零残差值按照其所在区间加上或减去该区间对应的调整值，使得所述非零残差值的绝对值变小；其中，所述区间有多个，且区间中的值越大，对应的调整值也越大。
一种基于神经网络的环路滤波NNLF方法，应用于编码端的NNLF滤波器，所述NNLF滤波器包括神经网络，以及一条从NNLF滤波器的输入到输出的跳连接支路，所述方法包括：

将重建图像输入所述神经网络，获取所述神经网络输出的残差图像；所述重建图像和残差图像均包括3个分量；及

对所述3个分量中的每一分量分别执行以下处理：

计算采用第一模式对所述重建图像的该分量进行NNLF的率失真代价cost ₁，及采用第二模式对所述重建图像的该分量进行NNLF的率失真代价cost ₂；所述第一模式是不对所述残差图像的该分量进行残差调整的NNLF模式，所述第二模式是对所述残差图像的该分量进行残差调整的NNLF模式；

在cost ₁<cost ₂的情况下，选择所述第一模式对所述重建图像的该分量进行NNLF；在cost ₂<cost ₁的情况下，选择所述第二模式对所述重建图像的该分量进行NNLF；在cost ₁＝cost ₂的情况下，选择所述第一模式或第二模式对所述重建图像进行NNLF。
如权利要求22所述的方法，其特征在于：

所述重建图像为当前帧或当前切片或当前块的重建图像；所述残差调整使得所述残差图像的分量中的残差变小。
如权利要求24所述的方法，其特征在于：

所述计算采用第一模式对所述重建图像的该分量进行NNLF的率失真代价cost ₁，包括：将所述残差图像的该分量与所述重建图像的该分量相加，得到滤波后的该分量；及，根据滤波后的该分量与相应原始图像的该分量之间的差异，计算得到所述cost ₁；

所述选择所述第一模式对所述重建图像的该分量进行NNLF，包括：将所述残差图像的该分量与所述重建图像的该分量相加得到的滤波后的该分量，作为对所述重建图像进行NNLF后输出的滤波图像的该分量。
如权利要求22所述的方法，其特征在于：

所述计算采用第二模式对所述重建图像的该分量进行NNLF的率失真代价cost ₂，包括：

按照为该分量设定的每一种残差调整方式，对所述残差图像的该分量进行残差调整并与所述重建图像的该分量相加，得到滤波后的该分量；再根据滤波后的该分量与相应原始图像的该分量之间的差异，计算该分量的一个率失真代价；

将计算得到的该分量的所有率失真代价中最小的率失真代价，作为该分量的cost ₂；其中，为该分量设定的残差调整方式有一种或多种。
如权利要求25所述的方法，其特征在于：

所述选择所述第二模式对所述重建图像的该分量进行NNLF，包括：

将按照该分量的cost ₂对应的残差调整方式对所述残差图像的该分量进行残差调整，并与所述重建图像的该分量相加得到的滤波后的该分量，作为对所述重建图像进行NNLF后输出的滤波图像的该分量。
如权利要求25所述的方法，其特征在于：

为所述3个分量设定的残差调整方式相同或不同；

为所述3个分量中至少一个分量设定的残差调整方式包括以下一种或多种类型的残差调整方式：

将残差图像中的非零残差值加上或减去固定值，使得所述非零残差值的绝对值变小；

将残差图像中的非零残差值按照其所在区间加上或减去该区间对应的调整值，使得所述非零残差值的绝对值变小；其中，所述区间有多个，且区间中的值越大，对应的调整值也越大。
一种视频编码方法，应用于视频编码装置，包括：对重建图像进行基于神经网络的环路滤波NNLF时，执行以下处理：

在NNLF允许残差调整的情况下，按照如权利要求15至27中任一所述的方法对所述重建图像进行NNLF；

编码所述重建图像的残差调整使用标志，以表示对重建图像进行NNLF时是否需要进行残差调整。
如权利要求28所述的方法，其特征在于：

所述残差调整使用标志为图像级语法元素或者块级语法元素。
如权利要求28所述的方法，其特征在于：

在满足以下一种或多种条件的情况下，确定NNLF允许残差调整：

解码序列级的残差调整允许标志，根据该残差调整允许标志确定NNLF允许残差调整；

解码图像级的残差调整允许标志，根据该残差调整允许标志确定NNLF允许残差调整。
如权利要求28所述的方法，其特征在于：

所述方法还包括：确定NNLF不允许残差调整的情况下，跳过对所述残差使用标志的编码，将输入所述神经网络的所述重建图像与所述神经网络输出的残差图像相加，得到对所述重建图像进行NNLF后输出的滤波图像。
如权利要求28所述的方法，其特征在于：

所述方法是按照如权利要求15至21所述的方法对所述重建图像进行NNLF；

所述重建图像的残差调整使用标志roflag的个数为1个；在选择所述第一模式对所述重建图像进行NNLF的情况下，所述roflag被置为表示不需要进行残差调整的值；在选择所述第二模式对所述重建图像进行NNLF的情况下，所述roflag被置为表示需要进行残差调整的值。
如权利要求32所述的方法，其特征在于：

所述方法是按照如权利要求18至21所述的方法对所述重建图像进行NNLF；

所述方法还包括：在所述roflag被置为表示需要进行残差调整的值，且所述设定的残差调整方式有多种的情况下，继续编码所述重建图像的残差调整方式索引，以指示进行残差调整时所基于的残差调整方式。
如权利要求28所述的方法，其特征在于：

所述方法是按照如权利要求22至27所述的方法对所述重建图像进行NNLF；

所述重建图像的残差调整使用标志roflag(j)的个数为3，j＝1,2,3，roflag(j)用于表示对所述重建图像的第j个分量进行NNLF时是否需要进行残差调整；在选择所述第一模式对所述重建图像的第j个分量进行NNLF的情况下，roflag(j)被置为表示不需要进行残差调整的值，在选择所述第二模式对所述重建图像的第j个分量进行NNLF的情况下，roflag(j)被置为表示需要进行残差调整的值。
如权利要求34所述的方法，其特征在于：

所述方法是按照如权利要求25至27所述的方法对所述重建图像进行NNLF；

所述方法还包括：在所述roflag(j)被置为表示需要进行残差调整的值，且为第j个分量设定的残差调整方式有多种的情况下，继续编码所述重建图像的第j个分量的残差调整方式索引index(j)，以指示对所述残差图像的第j个分量进行残差调整时所基于的残差调整方式。
一种码流，其中，所述码流通过如权利要求28至35中任一所述的视频编码方法生成。
一种基于神经网络的环路滤波器，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现如权利要求1至10、15至27中任一所述的基于神经网络的环路滤波方法。
一种视频解码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现如权利要求11至14中任一所述的视频解码方法。
一种视频编码装置，包括处理器以及存储有计算机程序的存储器，其中，所述处理器执行所述计算机程序时能够实现如权利要求28至35中任一所述的视频编码方法。
一种视频编解码系统，其中，包括如权利要求39所述的视频编码装置和如权利要求38所述的视频解码装置。
一种非瞬态计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序时被处理器执行时能够实现如权利要求1至10、15至22中任一所述的基于神经网络的环路滤波方法，或实现如权利要求11至14中任一所述的视频解码方法，或实现如权利要求28至35中任一所述的视频编码方法。