CN113766249B - 视频编解码中的环路滤波方法、装置、设备及存储介质 - Google Patents

视频编解码中的环路滤波方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113766249B
CN113766249B CN202010486518.6A CN202010486518A CN113766249B CN 113766249 B CN113766249 B CN 113766249B CN 202010486518 A CN202010486518 A CN 202010486518A CN 113766249 B CN113766249 B CN 113766249B
Authority
CN
China
Prior art keywords
quantization parameter
target image
image
reconstructed
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010486518.6A
Other languages
English (en)
Other versions
CN113766249A (zh
Inventor
朱晗
许晓中
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010486518.6A priority Critical patent/CN113766249B/zh
Publication of CN113766249A publication Critical patent/CN113766249A/zh
Application granted granted Critical
Publication of CN113766249B publication Critical patent/CN113766249B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供了一种视频编解码中的环路滤波方法、装置、设备及存储介质,涉及视频编解码技术领域。所述方法包括:获取视频中当前帧对应的重建帧以及生成该重建帧所使用的量化参数;对量化参数进行变换处理,得到变换后的量化参数;基于目标图像和变换后的量化参数,生成融合量化参数的目标图像;其中,目标图像包括重建帧或者当前帧对应的残差图像;基于重建帧和融合量化参数的目标图像,生成环路滤波模型的输入数据;通过环路滤波模型对输入数据进行滤波处理,得到滤波后的重建帧。本申请能够提升环路滤波模型在量化参数上的泛化能力,且有助于减轻编解码器的存储压力。

Description

视频编解码中的环路滤波方法、装置、设备及存储介质
技术领域
本申请实施例涉及视频编解码技术领域,特别涉及一种视频编解码中的环路滤波方法、装置、设备及存储介质。
背景技术
近年来,随着深度学习技术的发展,已经有不少研究尝试采用深度学习模型替代传统视频编码框架中的部分模块或提出基于深度学习的端到端编码框架,尤其是在环路滤波工具上,相比于传统滤波工具能明显提升编码性能。基于深度学习的环路滤波工具主要思路是通过神经网络学习重建图像到原始图像的映射关系,通常用来替换或帮助传统滤波工具修复有损编码带来的信息损失、抑制编码噪声,从而提升重建帧质量。
编解码器通常能支持较大跨度的量化参数(Quantization Parameter,简称QP),如AVS3(Audio Video coding Standard,音视频编码标准3)中,对于10比特(bit)的内部编码精度支持的QP范围为-16~63,量化的精细程度通常由QP来决定,QP值相差越大带来的图像损失程度也可能越大,相应的重建帧质量差距也就越大。为了能使环路滤波模型能用于恢复大范围内不同大小的QP值带来的不同程度的信息损失,相关技术采用的方案是训练多个环路滤波模型。例如,根据帧类型和QP值划分数据集,训练多个环路滤波模型,测试时根据当前帧的类型和QP值选择相应的模型进行滤波。又例如,将滤波器支持的QP值划分成LowQP、Mid QP和High QP三个QP段分别训练模型。
由于基于深度学习的环路滤波工具由多个模型组成,且深度学习的方法通常参数量巨大,会明显增加编解码器的存储压力。而且,单个模型有效覆盖的QP范围有限,滤波效果依赖于训练数据与实际测试数据的相似性。
发明内容
本申请实施例提供了一种视频编解码中的环路滤波方法、装置、设备及存储介质,能够提升环路滤波模型在量化参数上的泛化能力,且有助于减轻编解码器的存储压力。所述技术方案如下:
一方面,本申请实施例提供了一种视频编解码中的环路滤波方法,所述方法包括:
获取视频中当前帧对应的重建帧以及生成所述重建帧所使用的量化参数;
对所述量化参数进行变换处理,得到变换后的量化参数;
基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建帧或者所述当前帧对应的量化后残差图像;
基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据;
通过所述环路滤波模型对所述输入数据进行滤波处理,得到滤波后的重建帧。
另一方面,本申请实施例提供了一种环路滤波模型的训练方法,所述方法包括:
获取训练样本,所述训练样本的样本数据包括样本图像对应的重建图像以及生成所述重建图像所使用的量化参数,所述训练样本的标签数据包括所述样本图像;
对所述量化参数进行变换处理,得到变换后的量化参数;
基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建图像或者所述样本图像对应的量化后残差图像;
基于所述重建图像和所述融合量化参数的目标图像,生成所述训练样本对应的模型输入数据;
采用所述训练样本对环路滤波模型进行训练。
另一方面,本申请实施例提供了一种视频编解码中的环路滤波装置,所述装置包括:
数据获取模块,用于获取视频中当前帧对应的重建帧以及生成所述重建帧所使用的量化参数;
变换处理模块,用于对所述量化参数进行变换处理,得到变换后的量化参数;
第一融合处理模块,用于基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建帧或者所述当前帧对应的量化后残差图像;
第二融合处理模块,用于基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据;
滤波处理模块,用于通过所述环路滤波模型对所述输入数据进行滤波处理,得到滤波后的重建帧。
另一方面,本申请实施例提供了一种环路滤波模型的训练装置,所述装置包括:
样本获取模块,用于获取训练样本,所述训练样本的样本数据包括样本图像对应的重建图像以及生成所述重建图像所使用的量化参数,所述训练样本的标签数据包括所述样本图像;
变换处理模块,用于对所述量化参数进行变换处理,得到变换后的量化参数;
第一融合处理模块,用于基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建图像或者所述样本图像对应的量化后残差图像;
第二融合处理模块,用于基于所述重建图像和所述融合量化参数的目标图像,生成所述训练样本对应的模型输入数据;
滤波模型训练模块,用于采用所述训练样本对环路滤波模型进行训练。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述视频编解码中的环路滤波方法。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述环路滤波模型的训练方法。
再一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述视频编解码中的环路滤波方法。
再一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述环路滤波模型的训练方法。
还一方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品被处理器执行时,用于实现上述视频编解码中的环路滤波方法。
还一方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品被处理器执行时,用于实现上述环路滤波模型的训练方法。
本申请实施例提供的技术方案可以包括如下有益效果:
通过获取视频中当前帧对应的重建帧以及生成该重建帧所使用的量化参数,量化参数经过变换处理之后,与目标图像进行一次融合处理生成重合量化参数的目标图像,之后再将该融合量化参数的目标图像与重建帧进行二次融合处理,生成环路滤波模型的输入数据,最后通过环路滤波模型对输入数据进行滤波处理,得到滤波后的重建帧;实现了在输入的重建帧中加入QP信息,来增强损失程度与量化参数之间的关系在输入像素值上的区分度,从而使得模型在训练过程中能更好的学习量化参数与损失程度之间的关系,提升环路滤波模型在量化参数上的泛化能力。这样,就可以不用对整个QP段进行划分来训练多个模型,由于模型在量化参数上的泛化能力得到提升,因此通过单个模型即可在整个QP段上具有较好的滤波性能,且有助于减轻编解码器的存储压力。
附图说明
图1是本申请示例性示出的一种视频编码过程的基本流程图;
图2是本申请一个实施例提供的通信系统的简化框图;
图3是本申请示例性示出的视频编码器和视频解码器在流式传输环境中的放置方式的示意图;
图4是本申请一个实施例提供的视频编解码中的环路滤波方法的流程图;
图5是本申请一个实施例提供的量化参数图像的示意图;
图6至9是本申请实施例提供的几种融合处理方式的示意图;
图10是本申请另一个实施例提供的视频编解码中的环路滤波方法的流程图;
图11是本申请另一个实施例提供的视频编解码中的环路滤波方法的流程图;
图12是本申请另一个实施例提供的视频编解码中的环路滤波方法的流程图;
图13是图12实施例涉及的一种融合处理方式的示意图;
图14是本申请一个实施例提供的环路滤波模型的训练方法的流程图;
图15是本申请另一个实施例提供的环路滤波模型的训练方法的流程图;
图16是本申请一个实施例提供的视频编解码中的环路滤波装置的框图;
图17是本申请一个实施例提供的环路滤波模型的训练装置的框图;
图18是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例进行介绍说明之前,首先结合图1对视频编码技术进行简单介绍。图1示例性示出了一种视频编码过程的基本流程图。
视频信号是指包括多个帧的图像序列。帧(frame)是视频信号空间信息的表示。以YUV模式为例,一个帧包括一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和Cr)。从视频信号的获取方式来看,可以分为摄像机拍摄到的以及计算机生成的两种方式。由于统计特性的不同,其对应的压缩编码方式也可能有所区别。
在一些主流的视频编码技术中,如H.265/HEVC(High Efficient Video Coding,高效率视频压缩编码)、H.266/VCC(Versatile Video Coding,通用视频编码)标准、AVS(Audio Video coding Standard,音视频编码标准)(如AVS3)中,采用了混合编码框架,对输入的原始视频信号进行如下一系列的操作和处理:
1、块划分结构(block partition structure):输入图像划分成若干个不重叠的处理单元,每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU(Coding TreeUnit,编码树单元),或者LCU(Large Coding Unit,最大编码单元)。CTU再往下,可以继续进行更加精细的划分,得到一个或多个基本编码的单元,称之为CU(Coding Unit,编码单元)。每个CU是一个编码环节中最基本的元素。以下描述的是对每一个CU可能采用的各种编码方式。
2、预测编码(Predictive Coding):包括了帧内预测和帧间预测等方式,原始视频信号经过选定的已重建视频信号的预测后,得到残差视频信号。编码端需要为当前CU决定在众多可能的预测编码模式中,选择最适合的一种,并告知解码端。其中,帧内预测是指预测的信号来自于同一图像内已经编码重建过的区域。帧间预测是指预测的信号来自已经编码过的,不同于当前图像的其他图像(称之为参考图像)。
3、变换编码及量化(Transform&Quantization):残差视频信号经过DFT(DiscreteFourier Transform,离散傅里叶变换)、DCT(Discrete Cosine Transform,离散余弦变换)等变换操作,将信号转换到变换域中,称之为变换系数。在变换域中的信号,进一步进行有损的量化操作,丢失掉一定的信息,使得量化后的信号有利于压缩表达。在一些视频编码标准中,可能有多于一种变换方式可以选择,因此,编码端也需要为当前CU选择其中的一种变换,并告知解码端。量化的精细程度通常由量化参数来决定。QP取值较大,表示更大取值范围的系数将被量化为同一个输出,因此通常会带来更大的失真,及较低的码率;相反,QP取值较小,表示较小取值范围的系数将被量化为同一个输出,因此通常会带来较小的失真,同时对应较高的码率。
4、熵编码(Entropy Coding)或统计编码:量化后的变换域信号,将根据各个值出现的频率,进行统计压缩编码,最后输出二值化(0或者1)的压缩码流。同时,编码产生其他信息,例如选择的模式、运动矢量等,也需要进行熵编码以降低码率。统计编码是一种无损编码方式,可以有效的降低表达同样的信号所需要的码率。常见的统计编码方式有变长编码(Variable Length Coding,简称VLC)或者基于上下文的二值化算术编码(ContentAdaptive Binary Arithmetic Coding,简称CABAC)。
5、环路滤波(Loop Filtering):已经编码过的图像,经过反量化、反变换及预测补偿的操作(上述2~4的反向操作),可获得重建的解码图像。重建图像与原始图像相比,由于存在量化的影响,部分信息与原始图像有所不同,产生失真(distortion)。对重建图像进行滤波操作,例如去块效应滤波(deblocking),SAO(Sample Adaptive Offset,样本自适应偏移量)或者ALF(Adaptive Lattice Filter,自适应格型滤波器)等滤波器,可以有效的降低量化所产生的失真程度。由于这些经过滤波后的重建图像,将作为后续编码图像的参考,用于对将来的信号进行预测,所以上述的滤波操作也被称为环路滤波,及在编码环路内的滤波操作。
根据上述编码过程可以看出,在解码端,对于每一个CU,解码器获得压缩码流后,先进行熵解码,获得各种模式信息及量化后的变换系数。各个系数经过反量化及反变换,得到残差信号。另一方面,根据已知的编码模式信息,可获得该CU对应的预测信号,两者相加之后,即可得到重建信号。最后,解码图像的重建值,需要经过环路滤波的操作,产生最终的输出信号。
本申请提出了一种深度学习环路滤波工具有关量化参数的泛化能力增强方法,在输入的重建帧中加入QP信息,即QP值在通过一定变换(可为线性变换或非线性变换)后,与模型输入(重建帧或其他编码信息,如编码残差等)做融合处理,来增强信息损失程度与QP值之间的关系在输入像素值上的区分度,从而使得网络在训练过程中能更好的学习量化参数与损失程度之间的关系,提升滤波工具的泛化能力。该方法能减少滤波性能对训练数据集的依赖,即无需要求测试中取到的QP必须用来生成训练集,充分提升了滤波工具实际应用能力。除此以外,该方法同样可用于分组训练滤波器的方案中,能提升分组滤波器的泛化能力从而提升滤波性能。另外,该方法由于仅改变环路滤波模型的输入,不改变网络结构,因此适用于于不同的滤波网络,可以应用到使用了基于深度学习的环路滤波模型的视频编解码器或视频压缩的后处理产品中。
如图2所示,其示出了本申请一个实施例提供的通信系统的简化框图。通信系统200包括多个设备,所述设备可通过例如网络250彼此通信。举例来说,通信系统200包括通过网络250互连的第一设备210和第二设备220。在图2的实施例中,第一设备210和第二设备220执行单向数据传输。举例来说,第一设备210可对视频数据例如由第一设备210采集的视频图片流进行编码以通过网络250传输到第二设备220。已编码的视频数据以一个或多个已编码视频码流形式传输。第二设备220可从网络250接收已编码视频数据,对已编码视频数据进行解码以恢复视频数据,并根据恢复的视频数据显示视频图片。单向数据传输在媒体服务等应用中是较常见的。
在另一实施例中,通信系统200包括执行已编码视频数据的双向传输的第三设备230和第四设备240,所述双向传输可例如在视频会议期间发生。对于双向数据传输,第三设备230和第四设备240中的每个设备可对视频数据(例如由设备采集的视频图片流)进行编码,以通过网络250传输到第三设备230和第四设备240中的另一设备。第三设备230和第四设备240中的每个设备还可接收由第三设备230和第四设备240中的另一设备传输的已编码视频数据,且可对所述已编码视频数据进行解码以恢复视频数据,且可根据恢复的视频数据在可访问的显示装置上显示视频图片。
在图2的实施例中,第一设备210、第二设备220、第三设备230和第四设备240可为服务器、个人计算机和智能电话等计算机设备,但本申请公开的原理可不限于此。本申请实施例适用于PC(Personal Computer,个人计算机)、手机、平板电脑、媒体播放器和/或专用视频会议设备。网络250表示在第一设备210、第二设备220、第三设备230和第四设备240之间传送已编码视频数据的任何数目的网络,包括例如有线连线的和/或无线通信网络。通信网络250可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请的目的,除非在下文中有所解释,否则网络250的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。
作为实施例,图3示出视频编码器和视频解码器在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV(电视)、在包括CD(Compact Disc,光盘)、DVD(Digital Versatile Disc,数字通用光盘)、存储棒等的数字介质上存储压缩视频等等。
流式传输系统可包括采集子系统313,所述采集子系统可包括数码相机等视频源301,所述视频源创建未压缩的视频图片流302。在实施例中,视频图片流302包括由数码相机拍摄的样本。相较于已编码的视频数据304(或已编码的视频码流),视频图片流302被描绘为粗线以强调高数据量的视频图片流,视频图片流302可由电子装置320处理,所述电子装置320包括耦接到视频源301的视频编码器303。视频编码器303可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流302,已编码的视频数据304(或已编码的视频码流304)被描绘为细线以强调较低数据量的已编码的视频数据304(或已编码的视频码流304),其可存储在流式传输服务器305上以供将来使用。一个或多个流式传输客户端子系统,例如图3中的客户端子系统306和客户端子系统308,可访问流式传输服务器305以检索已编码的视频数据304的副本307和副本309。客户端子系统306可包括例如电子装置330中的视频解码器310。视频解码器310对已编码的视频数据的传入副本307进行解码,且产生可在显示器312(例如显示屏)或另一呈现装置(未描绘)上呈现的输出视频图片流311。在一些流式传输系统中,可根据某些视频编码/压缩标准对已编码的视频数据304、视频数据307和视频数据309(例如视频码流)进行编码。
应注意,电子装置320和电子装置330可包括其它组件(未示出)。举例来说,电子装置320可包括视频解码器(未示出),且电子装置330还可包括视频编码器(未示出)。其中,视频解码器用于对接收到的已编码视频数据进行解码;视频编码器用于对视频数据进行编码。
需要说明的一点是,本申请实施例提供的技术方案可以应用于H.266/VCC标准、H.265/HEVC标准、AVS(如AVS3)或者下一代视频编解码标准中,本申请实施例对此不作限定。
还需要说明的一点是,本申请实施例提供的视频编解码中的环路滤波方法,各步骤的执行主体可以是解码端设备,也可以是编码端设备。在视频解码和视频编码的过程中,都可以采用本申请实施例提供的技术方案,对视频中的重建帧进行环路滤波处理。解码端设备和编码端设备均可以是计算机设备,该计算机设备是指具备数据计算、处理和存储能力的电子设备,如PC、手机、平板电脑、媒体播放器、专用视频会议设备、服务器等等。
另外,本申请所提供的方法可以单独使用或以任意顺序与其他方法合并使用。基于本申请所提供方法的编码器和解码器,可以由1个或多个处理器或是1个或多个集成电路来实现。下面,通过几个实施例对本申请技术方案进行介绍说明。
请参考图4,其示出了本申请一个实施例提供的视频编解码中的环路滤波方法的流程图。为了便于说明,仅以各步骤执行主体为计算机设备进行介绍说明。该方法可以包括如下几个步骤(401~405):
步骤401,获取视频中当前帧对应的重建帧以及生成该重建帧所使用的量化参数。
视频中包括多个连续的图像帧,当前帧是指当前正在处理的图像帧,该当前帧可以是视频中的任意一个图像帧。
当前帧对应的重建帧是指对当前帧进行压缩重建后生成的图像帧。例如,可以对当前帧进行压缩处理(也即编码处理,包括帧内或帧间预测、残差计算、变换、量化等处理),得到压缩处理后的当前帧;然后对该压缩处理后的当前帧进行重建(也即解码处理,包括反量化、反变换、重构残差、重构图像等处理),得到当前帧对应的重建帧。
上述量化参数是指在生成重建帧的过程中所采用的量化参数。量化参数可以构成一个量化参数图像(QP map),该量化参数图像的长可以等于重建帧的长,该量化参数图像的宽可以等于重建帧的宽。可选地,上述当前帧对应的重建帧、残差图像和量化参数的长相等且宽也相等。例如,重建帧、残差图像和量化参数的长均与当前帧的长相同,重建帧、残差图像和量化参数的宽均与当前帧的宽相同。
可选地,在获取量化参数之后,根据该量化参数生成与重建帧的长和宽均相等的量化参数图像。其中,量化参数图像中与重建帧中的目标像素对应位置处的像素值,等于目标像素量化所采用的QP值。例如,量化参数图像中坐标为(x,y)的像素值,等于重建帧中坐标为(x,y)的像素量化所采用的QP值。另外,量化参数图像用于进行下面步骤中的变换处理。
如图5所示,其示例性示出了两个QP map(即量化参数图像)的示意图。如图5中的(a)部分所示,如果在生成重建帧时未采用Delta QP(也称为“差分QP”),则QP map中各个像素对应的QP值相同;如图5中的(b)部分所示,如果在生成重建帧时采用了Delta QP,则QPmap中各个像素对应的QP值可以以CTU为单位进行灵活设定,例如QP map中各CTU对应的QP值可以相同,也可以不同。
步骤402,对量化参数进行变换处理,得到变换后的量化参数。
此处的变换处理可以是线性变换处理或者非线性变换处理。通过对量化参数进行变换处理,可以将QP值变换到一个适当的取值范围,采用变换后的量化参数在后续步骤中与重建帧和残差图像进行融合处理,相比于直接采用原始的量化参数与重建帧和残差图像进行融合处理,可以通过变换处理调节不同类型的数据(即重建帧像素值、残差值和QP值)在进行数据融合时的影响比重,提升数据融合处理时的灵活性和准确性。
在一个示例中,对量化参数进行线性变换处理,得到变换后的量化参数。
示例性地,线性变换处理可以表示为f(x)=ax+b,其中,x表示原始的量化参数,f(x)表示变换后的量化参数,a、b为预设常数。
在另一个示例中,对量化参数进行非线性变换处理,得到变换后的量化参数。
示例性地,非线性变换处理可以表示为f(x)=(ax+b)2,其中,x表示原始的量化参数,f(x)表示变换后的量化参数,a、b为预设常数。示例性地,非线性变换处理还可以表示为f(x)=axn+b,其中,x表示原始的量化参数,f(x)表示变换后的量化参数,a、b、n为预设常数。
上述线性变换处理和非线性变换处理中涉及的参数,如a、b、n等参数,均可以根据实验或者经验进行设置和调整,通过选取合适的取值有助于提升最终的滤波效果。
步骤403,基于目标图像和变换后的量化参数,生成融合量化参数的目标图像;其中,目标图像包括重建帧或者当前帧对应的残差图像。
可选地,将目标图像和变换后的量化参数的对应位置处的像素值进行乘法运算,生成融合量化参数的目标图像。即,将目标图像中坐标为(x,y)的像素点的值和变换后的量化参数中坐标为(x,y)的像素点的变换后的QP值相乘,得到的乘积作为融合量化参数的目标图像中坐标为(x,y)的像素点的值。当然,除了乘法运算之外,还可以采用其他方式(如除法运算等)生成融合量化参数的目标图像,本申请实施例对此不作限定。
在一个示例中,目标图像为当前帧对应的量化后残差图像,基于量化后残差图像和变换后的量化参数,生成融合量化参数的残差图像。在本申请实施例中,残差图像是基于当前帧和当前帧对应的预测图像生成的,如计算当前帧与其预测图像中对应位置的像素值的差值,得到残差图像(该残差图像也可以称为量化前残差图像)。量化后残差图像是对上述残差图像(也即量化前残差图像)进行量化和反量化处理后得到的图像。
示例性地,如图6所示,假设重建帧为Irec、量化后残差图像为Ires且量化参数为IQP,对量化参数IQP进行线性变换处理f(x),得到变换后的量化参数IQP′,然后基于量化后残差图像Ires和变换后的量化参数IQP′,生成融合量化参数的残差图像Ires′。其中,融合量化参数的残差图像Ires′的长与量化后残差图像为Ires的长相等,融合量化参数的残差图像Ires′的宽与量化后残差图像为Ires的宽相等。
可选地,将量化后残差图像Ires和变换后的量化参数IQP′的对应位置处的像素值进行乘法运算,生成融合量化参数的残差图像Ires′。即,将Ires中坐标为(x,y)的像素点的残差值和IQP′中坐标为(x,y)的像素点的变换后的QP值相乘,得到的乘积作为Ires′中坐标为(x,y)的像素点的值。当然,除了乘法运算之外,还可以采用其他方式(如除法运算等)生成融合量化参数的残差图像,本申请实施例对此不作限定。
在另一个示例中,目标图像为重建帧,基于重建帧和变换后的量化参数,生成融合量化参数的重建帧。
示例性地,如图8所示,假设重建帧为Irec且量化参数为IQP,对量化参数IQP进行线性变换处理f(x),得到变换后的量化参数IQP′,然后基于重建帧Irec和变换后的量化参数IQP′,生成融合量化参数的重建帧Irec′。其中,融合量化参数的重建帧Irec′的长与重建帧为Irec的长相等,融合量化参数的重建帧Irec′的宽与重建帧为Irec的宽相等。
可选地,将重建帧Irec和变换后的量化参数IQP′的对应位置处的像素值进行乘法运算,得到融合量化参数的重建帧Irec′。即,将Irec中坐标为(x,y)的像素点的重建值和IQP′中坐标为(x,y)的像素点的变换后的QP值相乘,得到的乘积作为Irec′中坐标为(x,y)的像素点的值。当然,除了乘法运算之外,还可以采用其他方式(如除法运算等)生成融合量化参数的重建帧,本申请实施例对此不作限定。
步骤404,基于重建帧和融合量化参数的目标图像,生成环路滤波模型的输入数据。
在生成融合量化参数的目标图像之后,将其与重建帧做进一步的融合处理,生成环路滤波模型的输入数据。对重建帧和融合量化参数的目标图像进行融合处理,是指采用数学运算或者其他数据处理方式,对上述两方面数据进行融合处理。
在一种可能的实施方式中,如图10所示,步骤404可以由如下步骤404a替换实现:
步骤404a,对重建帧和融合量化参数的目标图像进行通道融合处理,生成环路滤波模型的输入数据。
可选地,上述通道融合处理为通道级联(concatenate)处理。当然,在一些其他实施例中,还可以是逐像素相加等其他融合处理方式,本申请实施例对此不作限定。
如图6所示,在生成融合量化参数的残差图像Ires′之后,对重建帧Irec和融合量化参数的残差图像Ires′进行通道级联处理,生成环路滤波模型的输入数据。
如图8所示,在生成融合量化参数的重建帧Irec′之后,对重建帧Irec和融合量化参数的重建帧Irec′进行通道级联处理,生成环路滤波模型的输入数据。
在另一种可能的实施方式中,如图11所示,步骤404可以由如下步骤404b~404d替换实现:
步骤404b,提取重建帧对应的第一特征图;
步骤404c,提取融合量化参数的目标图像对应的第二特征图;
步骤404d,对第一特征图和第二特征图进行通道融合处理,生成环路滤波模型的输入数据。
在进行特征图提取时,可以采用神经网络来实现。例如,通过卷积神经网络对重建帧进行卷积处理,得到对应的第一特征图;又例如,通过卷积神经网络对融合量化参数的目标图像进行卷积处理,得到对应的第二特征图。用于对重建帧进行特征提取处理和用于对融合量化参数的目标图像进行特征提取处理的两个神经网络,其结构可以相同也可以不同,网络参数可以各自独立设定。另外,上述步骤404b和步骤404c可以同时执行,也可以先后执行,本申请实施例对此不作限定。
可选地,上述通道融合处理为通道级联处理。当然,在一些其他实施例中,还可以是逐像素相加等其他融合处理方式,本申请实施例对此不作限定。
如图7所示,提取重建帧Irec对应的第一特征图Frec,以及提取融合量化参数的残差图像Ires′对应的第二特征图Fres′,对第一特征图Frec和第二特征图Fres′进行通道级联处理,生成环路滤波模型的输入数据。
如图9所示,提取重建帧Irec对应的第一特征图Frec,以及提取融合量化参数的重建帧Irec′对应的第二特征图Frec′,对第一特征图Frec和第二特征图Frec′进行通道级联处理,生成环路滤波模型的输入数据。
步骤405,通过环路滤波模型对输入数据进行滤波处理,得到滤波后的重建帧。
在得到环路滤波模型的输入数据之后,将该输入数据输入至环路滤波模型,由该环路滤波模型进行滤波处理,输出滤波后的重建帧。环路滤波模型是用于进行环路滤波处理的机器学习模型,在本申请实施例中,对环路滤波模型的网络结构不作限定,例如可以是CNN(Convolutional Neural Network,卷积神经网络)或者其他神经网络结构。
在示例性实施例中,在基于目标图像和变换后的量化参数,生成融合量化参数的目标图像之前,还可以先对该目标图像进行映射处理,该目标图像经过映射处理之后再与变换后的量化参数进行融合处理。可选地,对目标图像进行映射处理,得到处理后的目标图像。该映射处理用于将目标图像中的像素值映射至设定取值范围之内。处理后的目标图像用于与变换后的量化参数生成融合量化参数的目标图像。上述映射处理包括但不限于归一化处理、标准化处理、正则化处理中的至少一项,本申请实施例对此不作限定。通过对目标图像进行映射处理,使得目标图像中的像素值集中在某一个合适的取值范围之内,从而调节不同类型的数据在进行数据融合时的影响比重,提升数据融合处理时的灵活性和准确性。并且,在训练过程中有助于提升模型的收敛速度,缩短模型的训练耗时。
综上所述,本申请实施例提供的技术方案,通过获取视频中当前帧对应的重建帧以及生成该重建帧所使用的量化参数,量化参数经过变换处理之后,与目标图像进行一次融合处理生成重合量化参数的目标图像,之后再将该融合量化参数的目标图像与重建帧进行二次融合处理,生成环路滤波模型的输入数据,最后通过环路滤波模型对输入数据进行滤波处理,得到滤波后的重建帧;实现了在输入的重建帧中加入QP信息,来增强损失程度与量化参数之间的关系在输入像素值上的区分度,从而使得模型在训练过程中能更好的学习量化参数与损失程度之间的关系,提升环路滤波模型在量化参数上的泛化能力。这样,就可以不用对整个QP段进行划分来训练多个模型,由于模型在量化参数上的泛化能力得到提升,因此通过单个模型即可在整个QP段上具有较好的滤波性能,且有助于减轻编解码器的存储压力。
以应用到AVS3参考软件HPM5.2上为例,在几乎不影响通测结果的前提下,相关技术在4个QP段下Y、U、V三个分量共需使用12个模型,本申请能够减少为3三个模型,即Y、U、V三个分量分别对应一个模型(单个模型大小几乎不变),充分减轻了编解码器的存储负担。经实验发现,对于通测以外的QP值,尤其是偏离较多的QP值,滤波效果有所提升。
另外,在本申请实施例中,通过对量化参数进行变换处理,可以将QP值变换到一个适当的取值范围,采用变换后的量化参数在后续步骤中与重建帧和残差图像进行融合处理,相比于直接采用原始的量化参数与重建帧和残差图像进行融合处理,可以通过变换处理调节不同类型的数据(即重建帧像素值、残差值和QP值)在进行数据融合时的影响比重,提升数据融合处理时的灵活性和准确性。
请参考图12,其示出了本申请另一个实施例提供的视频编解码中的环路滤波方法的流程图。为了便于说明,仅以各步骤执行主体为计算机设备进行介绍说明。该方法可以包括如下几个步骤(1201~1204):
步骤1201,获取视频中当前帧对应的重建帧以及生成该重建帧所使用的量化参数。
步骤1202,对量化参数进行变换处理,得到变换后的量化参数。
此处的变换处理可以是线性变换处理或者非线性变换处理,具体可参见上文实施例中的介绍说明,此处不再赘述。
步骤1203,对重建帧和变换后的量化参数进行融合处理,得到环路滤波模型的输入数据。
在一个示例中,如图13所示,假设重建帧为Irec且量化参数为IQP,对量化参数IQP进行线性变换处理f(x),得到变换后的量化参数IQP′,然后对重建帧Irec和变换后的量化参数IQP′的对应位置处的像素值进行乘法运算,得到环路滤波模型的输入数据。
当然,在一些其他实施例中,还可以采用其他方式对重建帧和变换后的量化参数进行融合处理,本申请实施例对此不作限定。例如,可以对重建帧和变换后的量化参数进行通道级联处理,得到环路滤波模型的输入数据。又例如,还可以分别提取重建帧和变换后的量化参数的特征图,然后对上述两部分特征图进行通道级联处理,得到环路滤波模型的输入数据。
步骤1204,通过环路滤波模型对输入数据进行滤波处理,得到滤波后的重建帧。
在本实施例中,环路滤波模型的输入数据考虑了重建帧和量化参数两方面信息,而没有考虑残差图像,且只需对重建帧和变换后的量化参数进行一步融合处理,这有助于减少运算量。但是,上述图4实施例综合考虑了重建帧、残差图像和量化参数三方面信息,使得模型在滤波时考虑了更多维度的信息,有助于提升模型的滤波性能。
在上文介绍的实施例中,主要对环路滤波模型在视频编解码过程中的使用过程进行了介绍说明,下面,将通过几个实施例,对环路滤波模型的训练过程进行介绍说明。
请参考图14,其示出了本申请一个实施例提供的环路滤波模型的训练方法的流程图。该方法各步骤的执行主体可以是计算机设备,如PC、服务器或者其它具备计算处理能力的电子设备。该方法可以包括如下几个步骤(1401~1405):
步骤1401,获取训练样本,训练样本的样本数据包括样本图像对应的重建图像以及生成该重建图像所使用的量化参数,训练样本的标签数据包括上述样本图像。
训练样本的数量可以是多个。每个训练样本包括样本数据和标签数据。其中,样本数据包括样本图像对应的重建图像以及生成该重建图像所使用的量化参数,标签数据则是样本图像本身。在一些实施例中,样本数据还包括样本图像对应的量化后残差图像。有关重建图像(也即重建帧)、量化后残差图像和量化参数的介绍说明可参见上文实施例,此处不再赘述。
步骤1402,对量化参数进行变换处理,得到变换后的量化参数。
此处的变换处理可以是线性变换处理或者非线性变换处理,具体可参见上文实施例中的介绍说明,此处不再赘述。具体可参见图4实施例中对于步骤402的介绍说明,此处不再赘述。
步骤1403,基于目标图像和变换后的量化参数,生成融合量化参数的目标图像;其中,目标图像包括重建图像或者样本图像对应的量化后残差图像。
步骤1404,基于重建图像和融合量化参数的目标图像,生成训练样本对应的模型输入数据。
有关融合处理的过程可参见图4实施例中对于步骤403-404的介绍说明,此处不再赘述。
步骤1405,采用训练样本对环路滤波模型进行训练。
在对环路滤波模型进行训练的过程中,将训练样本的输入数据输入至环路滤波模型,由该环路滤波模型输出滤波后的重建帧,然后基于该滤波后的重建帧与训练样本的标签数据之间的差异,构建环路滤波模型的损失函数,通过不断调整环路滤波模型的参数,以最小化该损失函数的值,从而得到完成训练的环路滤波模型。
另外,损失函数可以基于样本图像与模型输出的滤波后的重建帧之间的距离损失进行构建,该距离可以是SSIM(Structural Similarity,结构相似性)、欧式距离等,本申请实施例对此不作限定。
需要说明的是,在对重建图像和融合量化参数的目标图像进行融合处理时,如果采用上文介绍的特征图提取的方式,那么在训练过程中还需要对用于提取特征图的神经网络(如卷积神经网络)进行训练。
请参考图15,其示出了本申请另一个实施例提供的环路滤波模型的训练方法的流程图。该方法各步骤的执行主体可以是计算机设备,如PC、服务器或者其它具备计算处理能力的电子设备。该方法可以包括如下几个步骤(1501~1504):
步骤1501,获取训练样本,训练样本的样本数据包括样本图像对应的重建图像以及生成该重建图像所使用的量化参数,训练样本的标签数据包括上述样本图像。
步骤1502,对量化参数进行变换处理,得到变换后的量化参数。
步骤1503,对重建帧和变换后的量化参数进行融合处理,得到训练样本对应的模型输入数据。
步骤1504,采用训练样本对环路滤波模型进行训练。
本实施例提供的训练过程是与上述图12实施例提供的环路滤波方法相对应的,环路滤波模型的输入数据考虑了重建帧和量化参数两方面信息,而没有考虑残差图像,且只需对重建帧和变换后的量化参数进行一步融合处理,这有助于减少运算量。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图16,其示出了本申请一个实施例提供的视频编解码中的环路滤波装置的框图。该装置具有实现上述视频编解码中的环路滤波方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,也可以设置在计算机设备上。该装置1600可以包括:数据获取模块1610、变换处理模块1620、第一融合处理模块1630、第二融合处理模块1640和滤波处理模块1650。
数据获取模块1610,用于获取视频中当前帧对应的重建帧以及生成所述重建帧所使用的量化参数。
变换处理模块1620,用于对所述量化参数进行变换处理,得到变换后的量化参数。
第一融合处理模块1630,用于基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建帧或者所述当前帧对应的量化后残差图像。
第二融合处理模块1640,用于基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据。
滤波处理模块1650,用于通过所述环路滤波模型对所述输入数据进行滤波处理,得到滤波后的重建帧。
在示例性实施例中,所述变换处理模块1620,用于对所述量化参数进行线性变换处理,得到所述变换后的量化参数;或者,对所述量化参数进行非线性变换处理,得到所述变换后的量化参数。
在示例性实施例中,所述装置1600还包括:量化图像生成模块,用于根据所述量化参数生成与所述重建帧的长和宽均相等的量化参数图像。其中,所述量化参数图像中与所述重建帧中的目标像素对应位置处的像素值,等于所述目标像素量化所采用的QP值,所述量化参数图像用于进行所述变换处理。
在示例性实施例中,所述第二融合处理模块1640,用于对所述重建帧和所述融合量化参数的目标图像进行通道融合处理,生成所述环路滤波模型的输入数据。
在示例性实施例中,所述第二融合处理模块1640,用于提取所述重建帧对应的第一特征图;提取所述融合量化参数的目标图像对应的第二特征图;对所述第一特征图和所述第二特征图进行通道融合处理,生成所述环路滤波模型的输入数据。
在示例性实施例中,所述第一融合处理模块1630,用于将所述目标图像和所述变换后的量化参数的对应位置处的像素值进行乘法运算,生成所述融合量化参数的目标图像。
在示例性实施例中,所述装置1600还包括:映射处理模块,用于对所述目标图像进行映射处理,得到处理后的目标图像。其中,所述映射处理用于将所述目标图像中的像素值映射至设定取值范围之内,所述处理后的目标图像用于与所述变换后的量化参数生成所述融合量化参数的目标图像。
综上所述,本申请实施例提供的技术方案,通过获取视频中当前帧对应的重建帧以及生成该重建帧所使用的量化参数,量化参数经过变换处理之后,与目标图像进行一次融合处理生成重合量化参数的目标图像,之后再将该融合量化参数的目标图像与重建帧进行二次融合处理,生成环路滤波模型的输入数据,最后通过环路滤波模型对输入数据进行滤波处理,得到滤波后的重建帧;实现了在输入的重建帧中加入QP信息,来增强损失程度与量化参数之间的关系在输入像素值上的区分度,从而使得模型在训练过程中能更好的学习量化参数与损失程度之间的关系,提升环路滤波模型在量化参数上的泛化能力。这样,就可以不用对整个QP段进行划分来训练多个模型,由于模型在量化参数上的泛化能力得到提升,因此通过单个模型即可在整个QP段上具有较好的滤波性能,且有助于减轻编解码器的存储压力。
请参考图17,其示出了本申请一个实施例提供的环路滤波模型的训练装置的框图。该装置具有实现上述环路滤波模型的训练方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,也可以设置在计算机设备上。该装置1700可以包括:样本获取模块1710、变换处理模块1720、第一融合处理模块1730、第二融合处理模块1740和滤波模型训练模块1750。
样本获取模块1710,用于获取训练样本,所述训练样本的样本数据包括样本图像对应的重建图像以及生成所述重建图像所使用的量化参数,所述训练样本的标签数据包括所述样本图像。
变换处理模块1720,用于对所述量化参数进行变换处理,得到变换后的量化参数。
第一融合处理模块1730,用于基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建图像或者所述样本图像对应的量化后残差图像。
第二融合处理模块1740,用于基于所述重建图像和所述融合量化参数的目标图像,生成所述训练样本对应的模型输入数据。
滤波模型训练模块1750,用于采用所述训练样本对环路滤波模型进行训练。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图18,其示出了本申请一个实施例提供的计算机设备的结构框图。该计算机设备可以是上文介绍的编码端设备,也可以是上文介绍的解码端设备,还可以是上文介绍的用于训练环路滤波模型的设备。该计算机设备150可以包括:处理器151、存储器152、通信接口153、编码器/解码器154和总线155。
处理器151包括一个或者一个以上处理核心,处理器151通过运行软件程序以及模块,从而执行各种功能应用以及信息处理。
存储器152可用于存储计算机程序,处理器151用于执行该计算机程序,以实现上述视频编解码中的环路滤波方法,或者实现上述环路滤波模型的训练方法。
通信接口153可用于与其它设备进行通信,如收发音视频数据。
编码器/解码器154可用于实现编码和解码功能,如对音视频数据进行编码和解码。
存储器152通过总线155与处理器151相连。
此外,存储器152可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,易失性或非易失性存储设备包括但不限于:磁盘或光盘,EEPROM(ElectricallyErasable Programmable Read-Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable Read-Only Memory,可擦除可编程只读存储器),SRAM(StaticRandom-Access Memory,静态随时存取存储器),ROM(Read-Only Memory,只读存储器),磁存储器,快闪存储器,PROM(Programmable read-only memory,可编程只读存储器)。
本领域技术人员可以理解,图18中示出的结构并不构成对计算机设备150的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被处理器执行时实现上述视频编解码中的环路滤波方法。
在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述环路滤波模型的训练方法。
在示例性实施例中,还提供了一种计算机程序产品,所述计算机程序产品被处理器执行时,用于实现上述视频编解码中的环路滤波方法。
在示例性实施例中,还提供了一种计算机程序产品,所述计算机程序产品被处理器执行时,用于实现上述环路滤波模型的训练方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (12)

1.一种视频编解码中的环路滤波方法,其特征在于,所述方法包括:
获取视频中当前帧对应的重建帧以及生成所述重建帧所使用的量化参数;
对所述量化参数进行变换处理,得到变换后的量化参数;
基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建帧或者所述当前帧对应的量化后残差图像;
基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据;
通过所述环路滤波模型对所述输入数据进行滤波处理,得到滤波后的重建帧。
2.根据权利要求1所述的方法,其特征在于,所述对所述量化参数进行变换处理,得到变换后的量化参数,包括:
对所述量化参数进行线性变换处理,得到所述变换后的量化参数;
或者,
对所述量化参数进行非线性变换处理,得到所述变换后的量化参数。
3.根据权利要求1所述的方法,其特征在于,所述获取视频中当前帧对应的重建帧以及生成所述重建帧所使用的量化参数之后,还包括:
根据所述量化参数生成与所述重建帧的长和宽均相等的量化参数图像;
其中,所述量化参数图像中与所述重建帧中的目标像素对应位置处的像素值,等于所述目标像素量化所采用的QP值,所述量化参数图像用于进行所述变换处理。
4.根据权利要求1所述的方法,其特征在于,所述基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据,包括:
对所述重建帧和所述融合量化参数的目标图像进行通道融合处理,生成所述环路滤波模型的输入数据。
5.根据权利要求1所述的方法,其特征在于,所述基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据,包括:
提取所述重建帧对应的第一特征图;
提取所述融合量化参数的目标图像对应的第二特征图;
对所述第一特征图和所述第二特征图进行通道融合处理,生成所述环路滤波模型的输入数据。
6.根据权利要求1所述的方法,其特征在于,所述基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像,包括:
将所述目标图像和所述变换后的量化参数的对应位置处的像素值进行乘法运算,生成所述融合量化参数的目标图像。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像之前,还包括:
对所述目标图像进行映射处理,得到处理后的目标图像;
其中,所述映射处理用于将所述目标图像中的像素值映射至设定取值范围之内,所述处理后的目标图像用于与所述变换后的量化参数生成所述融合量化参数的目标图像。
8.一种环路滤波模型的训练方法,其特征在于,所述方法包括:
获取训练样本,所述训练样本的样本数据包括样本图像对应的重建图像以及生成所述重建图像所使用的量化参数,所述训练样本的标签数据包括所述样本图像;
对所述量化参数进行变换处理,得到变换后的量化参数;
基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建图像或者所述样本图像对应的量化后残差图像;
基于所述重建图像和所述融合量化参数的目标图像,生成所述训练样本对应的模型输入数据;
采用所述训练样本对环路滤波模型进行训练。
9.一种视频编解码中的环路滤波装置,其特征在于,所述装置包括:
数据获取模块,用于获取视频中当前帧对应的重建帧以及生成所述重建帧所使用的量化参数;
变换处理模块,用于对所述量化参数进行变换处理,得到变换后的量化参数;
第一融合处理模块,用于基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建帧或者所述当前帧对应的量化后残差图像;
第二融合处理模块,用于基于所述重建帧和所述融合量化参数的目标图像,生成环路滤波模型的输入数据;
滤波处理模块,用于通过所述环路滤波模型对所述输入数据进行滤波处理,得到滤波后的重建帧。
10.一种环路滤波模型的训练装置,其特征在于,所述装置包括:
样本获取模块,用于获取训练样本,所述训练样本的样本数据包括样本图像对应的重建图像以及生成所述重建图像所使用的量化参数,所述训练样本的标签数据包括所述样本图像;
变换处理模块,用于对所述量化参数进行变换处理,得到变换后的量化参数;
第一融合处理模块,用于基于目标图像和所述变换后的量化参数,生成融合量化参数的目标图像;其中,所述目标图像包括所述重建图像或者所述样本图像对应的量化后残差图像;
第二融合处理模块,用于基于所述重建图像和所述融合量化参数的目标图像,生成所述训练样本对应的模型输入数据;
滤波模型训练模块,用于采用所述训练样本对环路滤波模型进行训练。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一项所述的方法,或者实现如权利要求8所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一项所述的方法,或者实现如权利要求8所述的方法。
CN202010486518.6A 2020-06-01 2020-06-01 视频编解码中的环路滤波方法、装置、设备及存储介质 Active CN113766249B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010486518.6A CN113766249B (zh) 2020-06-01 2020-06-01 视频编解码中的环路滤波方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010486518.6A CN113766249B (zh) 2020-06-01 2020-06-01 视频编解码中的环路滤波方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113766249A CN113766249A (zh) 2021-12-07
CN113766249B true CN113766249B (zh) 2022-05-13

Family

ID=78782785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010486518.6A Active CN113766249B (zh) 2020-06-01 2020-06-01 视频编解码中的环路滤波方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113766249B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114501012B (zh) * 2021-12-31 2024-06-11 浙江大华技术股份有限公司 图像滤波、编解码方法以及相关设备
CN114745556B (zh) * 2022-02-07 2024-04-02 浙江智慧视频安防创新中心有限公司 编码方法、装置、数字视网膜系统、电子设备及存储介质
CN116630171A (zh) * 2022-02-10 2023-08-22 腾讯科技(深圳)有限公司 图像滤波方法、装置、设备及存储介质
WO2023220969A1 (zh) * 2022-05-18 2023-11-23 Oppo广东移动通信有限公司 视频编解码方法、装置、设备、系统及存储介质
CN117201782A (zh) * 2022-05-31 2023-12-08 华为技术有限公司 滤波方法、滤波模型训练方法及相关装置
CN115209147B (zh) * 2022-09-15 2022-12-27 深圳沛喆微电子有限公司 摄像头视频传输带宽优化方法、装置、设备及存储介质
WO2024149325A1 (en) * 2023-01-12 2024-07-18 Douyin Vision Co., Ltd. Side information preparation for adaptive loop filter in video coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018097299A1 (ja) * 2016-11-28 2018-05-31 日本放送協会 符号化装置、復号装置、符号化方法、及び復号方法
CN109644268A (zh) * 2016-06-24 2019-04-16 韩国科学技术院 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置
CN109792521A (zh) * 2016-10-04 2019-05-21 韩国电子通信研究院 用于对图像进行编码/解码的方法和设备以及存储比特流的记录介质
CN111133756A (zh) * 2017-10-12 2020-05-08 联发科技股份有限公司 用于视频编码的神经网络方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190327476A1 (en) * 2016-06-24 2019-10-24 Industry Academy Cooperation Foundation Of Sejong University Video signal processing method and device
US10999606B2 (en) * 2019-01-08 2021-05-04 Intel Corporation Method and system of neural network loop filtering for video coding

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109644268A (zh) * 2016-06-24 2019-04-16 韩国科学技术院 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置
CN109792521A (zh) * 2016-10-04 2019-05-21 韩国电子通信研究院 用于对图像进行编码/解码的方法和设备以及存储比特流的记录介质
WO2018097299A1 (ja) * 2016-11-28 2018-05-31 日本放送協会 符号化装置、復号装置、符号化方法、及び復号方法
CN110024387A (zh) * 2016-11-28 2019-07-16 日本放送协会 编码装置、解码装置、编码方法和解码方法
CN111133756A (zh) * 2017-10-12 2020-05-08 联发科技股份有限公司 用于视频编码的神经网络方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多特征增量学习的视频重建图像质量增强算法;丁丹丹;《华南理工大学学报(自然科学版)》;20181215;全文 *

Also Published As

Publication number Publication date
CN113766249A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN111711824B (zh) 视频编解码中的环路滤波方法、装置、设备及存储介质
CN113766249B (zh) 视频编解码中的环路滤波方法、装置、设备及存储介质
CN111866512B (zh) 视频解码方法、视频编码方法、装置、设备及存储介质
US9414086B2 (en) Partial frame utilization in video codecs
CN104581177B (zh) 一种结合块匹配和串匹配的图像压缩方法和装置
TWI834087B (zh) 用於從位元流重建圖像及用於將圖像編碼到位元流中的方法及裝置、電腦程式產品
CN111741299B (zh) 帧内预测模式的选择方法、装置、设备及存储介质
CN111770345B (zh) 编码单元的运动估计方法、装置、设备及存储介质
CN118020297A (zh) 基于混合神经网络的端到端图像和视频编码方法
CN115668915A (zh) 图像编码方法、图像解码方法及相关装置
CN114257810B (zh) 上下文模型的选择方法、装置、设备及存储介质
CN113259671B (zh) 视频编解码中的环路滤波方法、装置、设备及存储介质
CN114615504A (zh) 视频解码方法、视频编码方法、装置及设备
WO2021135856A1 (zh) 视频编解码方法、装置、设备及存储介质
CN112001854A (zh) 一种编码图像的修复方法及相关系统和装置
CN115866297A (zh) 视频处理方法、装置、设备及存储介质
KR20230129068A (ko) 확장 가능한 인코딩 및 디코딩 방법 및 장치
CN111212288B (zh) 视频数据的编解码方法、装置、计算机设备和存储介质
WO2021263251A1 (en) State transition for dependent quantization in video coding
CN111953972A (zh) IBC模式下的Hash表构建方法、装置、设备
US20240015336A1 (en) Filtering method and apparatus, computer-readable medium, and electronic device
CN111770338B (zh) 编码单元的索引值确定方法、装置、设备及存储介质
US20240144439A1 (en) Filtering method and apparatus, computer-readable medium
CN114071148A (zh) 视频编码方法、装置、设备及产品
TW202416712A (zh) 使用神經網路進行圖像區域的並行處理-解碼、後濾波和rdoq

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant