CN111741300B - 一种视频处理方法 - Google Patents

一种视频处理方法 Download PDF

Info

Publication number
CN111741300B
CN111741300B CN202010468952.1A CN202010468952A CN111741300B CN 111741300 B CN111741300 B CN 111741300B CN 202010468952 A CN202010468952 A CN 202010468952A CN 111741300 B CN111741300 B CN 111741300B
Authority
CN
China
Prior art keywords
image
neural network
quality
corr
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010468952.1A
Other languages
English (en)
Other versions
CN111741300A (zh
Inventor
丁丹丹
孔令一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Normal University
Original Assignee
Hangzhou Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Normal University filed Critical Hangzhou Normal University
Priority to CN202010468952.1A priority Critical patent/CN111741300B/zh
Publication of CN111741300A publication Critical patent/CN111741300A/zh
Application granted granted Critical
Publication of CN111741300B publication Critical patent/CN111741300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种视频处理方法,属于视频数据处理技术领域。首先将低质量图像划分为图像块,每个图像块被输入到神经网络中,得到该质量图像块的M个投影图像。根据输入残差与投影图像确定权重系数值,从而将该M个投影图像组合为最终输出的高质量图像。最终,通过在帧级比较神经网络滤波与原传统滤波算法的代价,确定最终选择使用神经网络还是传统算法进行滤波。本发明能够从不同编码内容中获得不同的权重系数,从而引导参数固定的神经网络来适应不同的编码内容。

Description

一种视频处理方法
技术领域
本发明涉及视频数据处理技术领域,具体地说,涉及一种视频处理方法。
背景技术
所谓视频编码是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。视频流传输中最为重要的编解码标准有国际电联的H.261、H.263、H.264,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的RealVideo、微软公司的WMV、Google公司的AV1,以及Apple公司的QuickTime等。
有损视频编码会给图像带来块效应、振铃效应等,大大降低了重建图像的质量。视频编码标准采用环路滤波来消除上述效应,在提高视频图像的主观质量的同时,也提高了客观质量。传统环路滤波是从信号处理的角度出发,人工设计了各种算法,如H.265/HEVC中的Deblocking、SAO。利用神经网络也可以设计环路滤波算法,甚至达到比传统算法更高的压缩效率。
目前基于神经网络的环路滤波方法一般都设计一个直接神经网络结构,该结构输入一个低质量图像,经过神经网络的映射后,输出一个通道,该通道就是得到的对应的高质量图像。有一些网络会采用残差结构,即输入一个低质量图像,经过神经网络的映射后,输出一个通道,该通道是残差图像,该残差图像与输入的低质量图像相加后,得到对应的高质量图像。这种直接神经网络结构经过训练后,所得到的网络模型将被用于处理不同图像内容,即使这些图像内容具有不同的特性。当然,也可以通过训练多个模型的方法来处理不同的视频内容。
但是,所能够训练的模型数目总是有限的,而视频内容则是千变万化。而以往方法往往使用有限的网络模型处理千变万化的视频内容,在某些序列上性能较差,甚至出现性能倒挂。
发明内容
本发明的目的是提供一种视频处理方法,可以根据不同视频编码内容映射出不同的结果,使用一个固定权重系数的神经网络配合若干编码系数以达到适应编码内容的目的。
为了实现上述目的,第一方面,本发明提供的视频处理方法,包括以下编码步骤:
a)将输入的低质量图像划分成尺寸为P×Q的图像块;
b)将图像块输入基于多通道神经网络的环路滤波模型,得到M个投影图像R={r0,r1,…,r(M-1)};
c)计算输入的图像块与其对应的原始图像的残差:r=s-x,x表示输入的图像块,s表示与x对应的原始图像块的像素;
d)根据图像块对应的投影图像R和残差r,得到M个权重系数A={a0,a1,…,a(M-1)};
e)根据权重系数A和投影图像R,计算得到输出图像xcorr=(a0 r0+a1 r1+…+a(M-1)r(M-1))+x;
f)重复步骤b)至步骤e),直至整张低质量图像处理完毕;
g)使用视频编码中传统环路滤波方法对上述低质量图像进行滤波,得到重建图像xanchor
h)计算整帧图像的xcorr与s之间的损失Jcorr,以及整帧图像的xanchor与s之间的损失Janchor;比较Jcorr与Janchor,如果Janchor小,则选择xanchor为最终输出的高质量图像,设置环路滤波模式CNN_FLAG=0;如果Jcorr小,则选择xcorr为最终输出的高质量图像,设置环路滤波模式CNN_FLAG=1;
i)对CNN_FLAG进行熵编码,如果CNN_FLAG=1,则进一步对权重系数A进行熵编码,所得到的比特写入编码码流中。
第二方面,本发明提供的视频处理方法,包括以下解码步骤:
j)对编码码流进行熵解码,得到环路滤波模式CNN_FLAG的值,并得到低质量重建图像,若CNN_FLAG=0,则进入步骤n);如果CNN_FLAG=1,则进入步骤j)至步骤m);
k)进一步对编码码流进行熵解码,得到与每个低质量重建图像的P×Q尺寸的图像块对应的M个权重系数A={a0,a1,…,aM-1};
l)将低质量重建图像的图像块输入基于多通道神经网络的环路滤波模型,得到M个投影图像R={r0,r1,…,r(M-1)};
m)根据所得到的权重系数A与投影图像R,计算得到输出图像xcorr=(a0 r0+a1 r1+…+a(M-1)r(M-1))+x,x为图像块的像素;
n)重复步骤l到步骤m,直到整张低质量重建图像处理完毕,所得到的xcorr为最终输出的高质量图像;
o)使用传统环路滤波方法对整张低质量重建图像进行滤波,所得到的xanchor为最终输出的高质量图像。
与现有技术相比,本发明的有益之处在于:
本发明利用多通道神经网络进行环路滤波的编码,对于每个低质量的编码块,所提出的方法会根据视频内容生成加权系数,该加权系数会引导神经网络映射得到不同的结果。同时,采用在帧级决策是否使用神经网络进行环路滤波的机制,以保证在神经网络不适用的场景中仍然能够使用传统环路滤波方法进行滤波。
本发明能够引导神经网络根据不同视频编码内容映射出不同的结果,使用一个固定权重系数的神经网络配合若干编码系数就可以达到适应编码内容的目的。该方法可用于任意结构的神经网络来完成环路滤波功能。
附图说明
图1为本发明实施例中所使用的神经网络的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下结合实施例及其附图对本发明作进一步说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外定义,本发明使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
实施例
本实施例使用AV1标准的参考编码器libaom对视频序列进行编码。libaom包括三个传统滤波算法,分别是Deblocking,CDEF与LR。利用基于神经网络的环路滤波方法替换原编码器中的CDEF与LR算法。
首先,训练神经网络。构建一个神经网络,设计一种卷积神经网络结构,如图1所示,包括10层卷积,每层的卷积核尺寸都是3×3。除第10层外,其余每层的输出通道数都是64。第10层的输出通道数目M=2。
针对上述神经网络,进行以下步骤的模型训练:
S101,制作训练集。选用1000张原始图像,使用libaom帧内编码配置,将量化参数QP分别设置为7、8、9、10、……、63,关掉其CDEF与LR滤波算法,在各个QP下对该1000张原始图像进行编码,得到未经滤波的重建图像。将7~16的QP的重建图像作为一个训练样本集,同样地,17~26、27~36、37~46、47~56、57~63的重建图像被分别作为训练样本集。该1000张原始图像作为训练标签。将训练样本与标签一一对应,形成训练集。最终,每个QP范围对应一个训练集,共得到6个训练集。
S102,从输入的训练样本集中随机取64个尺寸为35×35、被称为patch的图像块,这一组图像块被称为batch。将每个patch输入神经网络,得到2个投影图像R={r0,r1}。
S103,根据所输入的patch(即xp)和该patch所对应的原始图像sp,计算得到输入残差rp,其中rp=sp-xp
S104,根据步骤S102所得到的2个投影图像R和步骤S103所得到的残差rp,得到每个patch的损失代码Lp。对于一个包括了i组patch的batch,其损失函数的计算方式如下:
L=-∑i{ri TRi(Ri TRi)-1Ri Tri}
S105,利用上述损失函数,使用训练集对神经网络进行训练,对应每个QP范围都生成一系列对应的模型。
S106,选择20帧未滤波图像组成验证集,这些图像与训练集中图像完全不重合。将每个QP对应的一系列模型作用于验证集,获得每个模型在验证集上的平均性能,选择性能最佳的作为每个QP范围对应的最终模型。一旦最终模型被确定,将在编码端和解码端作为环路滤波模型被共同使用。
对于训练好的环路滤波模型,在编码端采用以下方式展开应用。设编码器当前QP值为53,则选取47~56QP范围对应的神经网络模型CNN53
S201,将输入的低质量图像划分成尺寸为256×256的图像块,将每个低质量图像块x送入训练完毕的神经网络CNN53,得到2个投影图像R={r0,r1}。
S202,根据所输入的低质量图像块x和图像块x所对应的原始图像s,计算得到输入残差r,其中r=s-x。
S203,根据步骤S201所得到的2个投影图像R和步骤S202所得到的残差r,估计得到2个权重系数A={a0,a1}。其中,估计公式如下:
[a0a1...aM-1]T=(RTR)-1RTr
对上述权重系数A还要进行进一步处理,首先将A放大28倍,然后经过四舍五入取整与Clip操作得到
Figure GDA0003864622500000051
最后对
Figure GDA0003864622500000052
进行熵编码,并将得到的比特写入码流中。
Figure GDA0003864622500000053
Figure GDA0003864622500000054
Figure GDA0003864622500000055
Figure GDA0003864622500000056
其中,Round表示四舍五入取整,clip表示
Figure GDA0003864622500000057
Figure GDA0003864622500000058
表示
Figure GDA0003864622500000059
的最大值;在本实施例中设为7;
Figure GDA00038646225000000510
表示
Figure GDA00038646225000000511
的最小值,在本实施例中设置为-8;
Figure GDA00038646225000000512
表示
Figure GDA00038646225000000513
的最大值;在本实施例中设为15;
Figure GDA00038646225000000514
表示
Figure GDA00038646225000000515
的最小值,在本实施例中设置为0。
S204,根据步骤S203得到的权重系数
Figure GDA00038646225000000516
与投影图像R,计算得到输出图像xcorr=(a0r0+a1r1)+x。
S205,重复上述步骤S201到步骤S204,直到整张低质量图像被处理完毕。
S206,使用libaom中的原环路滤波方法(包括Deblocking、CDEF和LR)对整帧低质量图像进行滤波,得到重建图像xanchor
S207,计算整帧图像的xcorr与s之间的损失Jcorr,计算整帧图像的xanchor与s之间的损失Janchor。比较Jcorr与Janchor,如果Janchor小,则选择xanchor为最终输出的高质量图像,设置环路滤波模式CNN_FLAG=0;如果Jcorr小,则选择xcorr为最终输出的高质量图像,设置环路滤波模式CNN_FLAG=1。其中,损失函数Jcorr与Janchor的计算方法是:
Figure GDA0003864622500000061
Figure GDA0003864622500000062
其中,W表示该图像的像素宽,H表示该图像的像素高。
S208,对CNN_FLAG进行熵编码。如果CNN_FLAG=1,则进一步对权重系数
Figure GDA0003864622500000063
的两个系数分别进行熵编码,所得到的比特被写入码流中。
对于训练好的神经网络模型,在libaom解码端采用以下方式展开应用。设解码得到当前QP值为53,则选取47~56QP范围对应的神经网络模型CNN53
S301,对码流进行熵解码,得到环路滤波模式CNN_FLAG的值,得到低质量重建图像。如果CNN_FLAG=0,则直接使用原环路滤波算法对图像进行滤波,所得到的xanchor为最终输出的高质量图像;如果CNN_FLAG=1,则进入步骤S302~步骤S305。
S302,对编码码流进行熵解码,得到与每个256×256尺寸的低质量重建图像块x对应的2个权重系数
Figure GDA0003864622500000064
S303,将x送入训练完毕的神经网络,得到2个投影图像R={r0,r1}。
S304,根据所得到的权重系数A与投影图像R,计算得到输出图像
Figure GDA0003864622500000065
S305,重复上述步骤S302到步骤S304,直到整张低质量图像被处理完毕,所得到的xcorr为最终输出的高质量图像。
本实施例是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (7)

1.一种视频处理方法,其特征在于,包括以下编码步骤:
a)将输入的低质量图像划分成尺寸为P×Q的图像块;
b)将图像块输入基于多通道神经网络的环路滤波模型,得到M个投影图像R={r0,r1,…,r(M-1)};
c)计算输入的图像块与其对应的原始图像的残差:r=s-x,x表示输入的图像块,s表示与x对应的原始图像块的像素;
d)根据图像块对应的投影图像R和残差r,得到M个权重系数A={a0,a1,…,a(M-1)};
e)根据权重系数A和投影图像R,计算得到输出图像xcorr=(a0r0+a1r1+…+a(M-1)r(M-1))+x;
f)重复步骤b)至步骤e),直至整张低质量图像处理完毕;
g)使用视频编码中传统环路滤波方法对上述低质量图像进行滤波,得到重建图像xanchor
h)计算整帧图像的xcorr与s之间的损失Jcorr,以及整帧图像的xanchor与s之间的损失Janchor;比较Jcorr与Janchor,如果Janchor小,则选择xanchor为最终输出的高质量图像,设置环路滤波模式CNN_FLAG=0;如果Jcorr小,则选择xcorr为最终输出的高质量图像,设置环路滤波模式CNN_FLAG=1;
i)对CNN_FLAG进行熵编码,如果CNN_FLAG=1,则进一步对权重系数A进行熵编码,所得到的比特写入编码码流中。
2.一种视频处理方法,其特征在于,包括以下解码步骤:
j)对编码码流进行熵解码,得到环路滤波模式CNN_FLAG的值,并得到低质量重建图像,若CNN_FLAG=0,则进入步骤o);如果CNN_FLAG=1,则进入步骤k)至步骤n);
k)进一步对编码码流进行熵解码,得到与每个低质量重建图像的P×Q尺寸的图像块对应的M个权重系数A={a0,a1,…,aM-1};
l)将低质量重建图像的图像块输入基于多通道神经网络的环路滤波模型,得到M个投影图像R={r0,r1,…,r(M-1)};
m)根据所得到的权重系数A与投影图像R,计算得到输出图像xcorr=(a0r0+a1r1+…+a(M-1)r(M-1))+x,x为图像块的像素;
n)重复步骤l到步骤m,直到整张低质量重建图像处理完毕,所得到的xcorr为最终输出的高质量图像;
o)使用传统环路滤波方法对整张低质量重建图像进行滤波,所得到的xanchor为最终输出的高质量图像。
3.根据权利要求1或2所述的视频处理方法,其特征在于,所述的基于多通道神经网络的环路滤波模型在训练时,选用的神经网络的最后一层输出M个通道。
4.根据权利要求3所述的视频处理方法,其特征在于,M≥2。
5.根据权利要求1或2所述的视频处理方法,其特征在于,所述的基于多通道神经网络的环路滤波模型在训练时,通过以下方式求解权重系数A并设置损失函数:
1)通过最小二乘法估计得到权重系数A:
[a0 a1...aM-1]T=(RTR)-1RTr
2)将所估计的权重系数A代入网络损失函数中,神经网络的目标函数为:
e=|r|2-rTR(RTR)-1RTr
其中,r为残差,是常数,将神经网络的目标函数简化为:
L=-∑i{ri TRi(Ri TRi)-1Ri Tri}
其中,i表示第i个训练样本。
6.根据权利要求1所述的视频处理方法,其特征在于,对权重系数A进行熵编码前,首先将A放大2scale倍,然后经过四舍五入取整与Clip操作得到
Figure FDA0003864622490000031
最后对
Figure FDA0003864622490000032
进行熵编码,并将得到的比特写入码流中;
Figure FDA0003864622490000033
Figure FDA0003864622490000034
其中,clip表示
Figure FDA0003864622490000035
Figure FDA0003864622490000036
表示
Figure FDA0003864622490000037
的最大值,
Figure FDA0003864622490000038
表示
Figure FDA0003864622490000039
的最小值。
7.根据权利要求6所述的视频处理方法,其特征在于,经过scale运算后,取
Figure FDA0003864622490000041
CN202010468952.1A 2020-05-28 2020-05-28 一种视频处理方法 Active CN111741300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010468952.1A CN111741300B (zh) 2020-05-28 2020-05-28 一种视频处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010468952.1A CN111741300B (zh) 2020-05-28 2020-05-28 一种视频处理方法

Publications (2)

Publication Number Publication Date
CN111741300A CN111741300A (zh) 2020-10-02
CN111741300B true CN111741300B (zh) 2023-03-07

Family

ID=72646482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010468952.1A Active CN111741300B (zh) 2020-05-28 2020-05-28 一种视频处理方法

Country Status (1)

Country Link
CN (1) CN111741300B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114449296B (zh) * 2020-11-06 2023-07-18 北京大学 基于卷积神经网络的环路滤波方法和装置
CN112422989B (zh) * 2020-11-17 2023-06-09 杭州师范大学 一种视频编码方法
WO2023167514A1 (en) * 2022-03-03 2023-09-07 Samsung Electronics Co., Ltd. System and method for training artificial intelligence models for in-loop filters
CN117151986A (zh) * 2022-05-18 2023-12-01 腾讯科技(深圳)有限公司 图像滤波方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102196270A (zh) * 2010-03-12 2011-09-21 华为技术有限公司 帧内预测方法及装置、编解码方法及装置
US8819525B1 (en) * 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
CN109644268A (zh) * 2016-06-24 2019-04-16 韩国科学技术院 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018199051A1 (ja) * 2017-04-25 2018-11-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法および復号方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102196270A (zh) * 2010-03-12 2011-09-21 华为技术有限公司 帧内预测方法及装置、编解码方法及装置
US8819525B1 (en) * 2012-06-14 2014-08-26 Google Inc. Error concealment guided robustness
CN109644268A (zh) * 2016-06-24 2019-04-16 韩国科学技术院 包括基于cnn的环路滤波器的编码方法与装置及解码方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多特征增量学习的视频重建图像质量增强算法;丁丹丹等;《华南理工大学学报(自然科学版)》;20181231;42-50 *

Also Published As

Publication number Publication date
CN111741300A (zh) 2020-10-02

Similar Documents

Publication Publication Date Title
CN111741300B (zh) 一种视频处理方法
CN109862359B (zh) 基于分层b帧的码率控制方法、装置和电子设备
TWI382763B (zh) 影像序列之寫碼方法及裝置
KR20210050186A (ko) 영상의 ai 부호화 및 ai 복호화 방법, 및 장치
CN107222748B (zh) 图像数据码率的处理方法和装置
WO2021134706A1 (zh) 环路滤波的方法与装置
CN108076342A (zh) 用于编码视频的方法和编码器系统
CN107820084B (zh) 一种视频感知编码方法及装置
WO2018109455A1 (en) Motion compensation techniques for video
CN111083498A (zh) 一种用于视频编码帧间环路滤波的模型训练方法和使用方法
JPH07203430A (ja) 画像符号化装置
CN112468826B (zh) 一种基于多层gan的vvc环路滤波方法及系统
CN109788288B (zh) 码率控制中i帧量化步长的估算方法及装置
CN109618155B (zh) 压缩编码方法
CN116982262A (zh) 视频编码中依赖性量化的状态转换
US8971393B2 (en) Encoder
KR101737006B1 (ko) 인지 품질 기반의 변환 부호화 고속화 방법 및 장치
CN112218088A (zh) 一种图像与视频压缩方法
CN110708548A (zh) 一种全景视频帧内比特分配的方法
CN115988201B (zh) 一种编码胶片颗粒的方法、装置、电子设备和存储介质
CN103596012A (zh) 一种实时的基于avs的视频帧率转码中帧间宏块类型选择方法
KR20060103409A (ko) 슬라이스 구조를 갖는 관심 영역 부호화 및 복호화를 위한방법 및 장치
CN102271247B (zh) 一种编码码率调整方法和装置
CN110572661B (zh) 一种面向4k/8k超高清视频编码的低延时码率控制方法
WO2023082520A1 (zh) 图像处理方法及装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant