CN101883280A - 一种恢复噪声的视频编解码方法和系统 - Google Patents

一种恢复噪声的视频编解码方法和系统 Download PDF

Info

Publication number
CN101883280A
CN101883280A CN2010101683924A CN201010168392A CN101883280A CN 101883280 A CN101883280 A CN 101883280A CN 2010101683924 A CN2010101683924 A CN 2010101683924A CN 201010168392 A CN201010168392 A CN 201010168392A CN 101883280 A CN101883280 A CN 101883280A
Authority
CN
China
Prior art keywords
residual signals
noise
frame
divergent
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010101683924A
Other languages
English (en)
Other versions
CN101883280B (zh
Inventor
区子廉
代晶静
庞超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hong Kong University of Science and Technology HKUST
Original Assignee
Hong Kong University of Science and Technology HKUST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hong Kong University of Science and Technology HKUST filed Critical Hong Kong University of Science and Technology HKUST
Publication of CN101883280A publication Critical patent/CN101883280A/zh
Application granted granted Critical
Publication of CN101883280B publication Critical patent/CN101883280B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种恢复噪声的视频编解码方法,包括:在编码端执行去除噪声的视频编码方法;在解码端执行恢复噪声的视频解码方法。在去噪处理中,对有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,然后对该残差信号进行变换、量化和熵编码,组成压缩码流以供输出。在恢复噪声处理中,对重构的残差信号进行反缩放与反平移,以得到恢复的有噪残差信号,并将得到的有噪残差信号与当前帧的参考帧相加得到噪声恢复的视频信号。相应地,提供一种恢复噪声的视频编解码系统。本发明可恢复原始的真实噪声,引入的额外负担小,去噪处理和噪声恢复处理可容易地集成到标准视频编解码系统中。

Description

一种恢复噪声的视频编解码方法和系统
技术领域
本发明涉及视频编码技术领域,尤其涉及一种恢复噪声的视频编解码方法和系统。
背景技术
目前,视频技术广泛应用于视频电话、视频会议、视频聊天、可视电子商务、数字电视和数字电影等领域。在这些领域中,数字视频序列的主观质量往往会直接影响到用户/观众的感观体验,而噪声是影响主观视频质量的一个重要因素。
具体地讲,数字视频序列在获取、录制、处理和传输的过程中通常会受到噪声的污染,这些噪声往往会导致视频编码中运动估计的准确度和编码效率的降低。因此,通常会考虑采用去噪技术来去除视频序列中的噪声分量。但是,在大多数情况下,去噪操作也会去除视频序列中的细小细节,从而造成失真,影响主观视频质量。因此,在某些对主观视频质量要求非常高的情况下,往往需要在解码端恢复或添加一些类型的有用噪声来帮助改善主观视频质量。
目前,需要在解码端恢复或添加的有用噪声主要包括:(1)胶片颗粒噪声,这种噪声是由分散在感光乳剂中的卤化银晶体的曝光和显影而引起的,对于HD DVD和数字化影院这样对视频质量要求非常高的应用,很可能希望保留胶片颗粒噪声来增强数字胶片的真实性,去掉了这些噪声,反倒会使观众感受到不自然;(2)用于掩饰伪像的随机噪声,比如,抖动信号,通过添加这些随机噪声可使由于使用基于块的压缩方法而导致的方块效应和其它结构化的噪声图案变得不那么明显。
对于胶片颗粒噪声的恢复,比较常见的方法通常包括编码端的预处理步骤和解码端的后处理步骤,其中,预处理步骤通常涉及噪声去除、提取、建模或编码等,后处理步骤通常涉及噪声模拟和合成等。
比如,在C.Gomila和A.Kobilansky的“SEI message for filmgrain noise”(JVT 8th meeting,Doc.JVT-H022,Geneva,2003)中,提出了一种通过建立胶片颗粒的参数化模型来模拟胶片颗粒噪声的方法。具体地讲,在编码端,首先从输入的视频数据中去除胶片颗粒,并将去除了胶片颗粒的视频序列发送给编码器按照标准视频编码技术进行编码,同时在已知所使用的胶片类型的情况下将标识胶片类型的标识符作为参数发送给编码器,或者在不知道所使用的胶片类型或者由于拷贝、处理、颜色空间转换等原因而导致颗粒图案失真的情况下基于预定的胶片颗粒统计模型提取表示胶片颗粒信息的参数,并将这些参数发送给编码器。编码器利用SEI(SupplementalEnhancement Information,附加增强信息)将标识符参数或者模型参数发送给解码器。解码器按照相应的标准视频解码技术对编码的视频数据进行解码,并根据接收的参数模拟胶片颗粒噪声,最后将模拟的胶片颗粒噪声与解码的视频数据合成,从而得到胶片噪声恢复的视频序列。其中,在建模步骤中,建立了自动回归模型和相应的卷积模型来表达胶片噪声的空域相关性、颜色相关性和时域相关性。
在B.T.Oh等人的“Film grain noise modeling in advancedvideo coding”(Proceedings of SPIE,Visual Communications andImage Processing,2007)中,提出了另外一种提出通过建模模拟胶片颗粒噪声的方法。该方法也是首先在编码端从输入的视频数据中去除胶片颗粒,并将去除了胶片颗粒的视频序列发送给编码器按照标准视频编码技术进行编码,同时基于预定的模型提取表示胶片颗粒噪声的参数,然后在解码端根据通过SEI消息传送过来的参数生成噪声,并将生成的噪声与解码的视频数据合成。其中,在噪声提取和去除步骤中,利用多层方法检测边缘区域,并通过仅对非边缘的均匀区域进行选择性滤波来提取和去除噪声;在噪声建模步骤中,根据空间功率谱密度、噪声概率密度和颜色相关性等方面建立了3D AR模型来表达胶片颗粒的空间相关性和功率谱相关性;在噪声合成步骤中,考虑到胶片颗粒噪声依赖于解码信号,通过对白噪声进行缩放来合成噪声。
对于这些基于模型的胶片颗粒噪声恢复方法,由于模型本身的局限性,这些方法通常仅适用于符合该模型的胶片颗粒,也就是说,往往只有符合该模型的胶片颗粒才能被适当地编码和恢复。针对这样的问题,在申请号为03019872.5的欧洲专利申请“Film grainencoding”中,提出了一种改进方法。该方法不是对提取的胶片颗粒信息进行建模,而是按照标准化视频编码技术对提取的至少一个代表性胶片颗粒信息块进行编码,从而使得不限于特定类型的胶片噪声的合成。同时,为了增强适应性,通过镜像、旋转、循环移位、改变胶片颗粒块的强度、对编码的视频信号的统计属性进行监控等操作对胶片颗粒信息进行修改,从而实现各种不同的胶片颗粒的自适应编码。
但是,虽然这种方法消除了建模方法的局限性,但是与建模方法一样,都在编码端的编码之前增加了噪声去除、提取、建模或编码等预处理,在解码端的解码之后增加了模拟和合成等后处理,而这些增加的预处理和后处理通常涉及复杂的计算或处理,相应地增加了编解码器的复杂性,从而给标准视频编码系统引入了一定的额外负担,影响整个系统的处理效率和传输效率。另外一个关键的问题是这些方法都是利用各种模拟手段来模拟胶片颗粒噪声,虽然模拟的噪声整体上可具有与原始胶片颗粒噪声类似的主观质量,但是却不能实现像素对像素的模拟。也就是说,这些方法只能是模拟胶片颗粒噪声,并不能恢复原始的真实的胶片颗粒噪声,在某些要求高主观视频质量的应用中,最终模拟合成的噪声很可能不被接受。
对于用于掩饰伪像的随机噪声的添加,比较常见的方法是在解码器端通过各种模拟手段来生成噪声。比如,在申请号为10/572,690的美国专利申请“Video Comfort Noise Addition Technique”中,提出了一种根据噪声的空域相关性和时域相关性以及噪声与解码图像的亮度之间的关系生成噪声的方法;在申请号为11/059,175的美国专利“Method and Apparatus for Masking of Video Artifactsand/or Insertion of Film Grain in a Video Decoder”中,提出了一种利用线性反馈移位寄存器(LFSR)伪随机噪声(PRN)生成器来生成噪声和合成噪声的方法。这些方法的缺点也是在于在视频解码之后需要通过一些后处理来生成噪声和合成噪声,而这些后处理往往涉及到较为复杂的运算或处理,给整个系统带来了一定的负担。而且,所模拟的噪声只能保证基本类似,却不能保证其真实性。
发明内容
为了解决以上问题,本发明提供一种恢复噪声的视频编码方法和系统,以在给标准视频编码系统引入尽可能小的额外负担的情况下恢复真实的噪声。
为了实现以上目的,本发明提供的恢复噪声的视频编解码方法包括以下步骤:在编码端执行去除噪声的视频编码方法;在解码端执行恢复噪声的视频解码方法。
其中,所述去除噪声的视频编码方法包括以下步骤:计算作为输入信号的当前帧与其参考帧之间的有噪残差信号;对有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号;对经过缩放与平移得到的残差信号进行变换、量化和熵编码或者对经过缩放与平移得到的变换系数进行量化和熵编码,组成压缩码流以供输出,同时对量化后的变换系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧相加得到重构帧,作为下一帧的参考帧。
所述恢复噪声的视频解码方法包括以下步骤:对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号;对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号;将得到的有噪残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
相应地,本发明提供一种恢复噪声的视频编解码系统,包括编码器和解码器,编码器包括输入单元、残差计算单元、预测单元、参考帧缓存单元、变换单元、量化单元、熵编码单元、重构单元、编码输出单元和去噪滤波器,解码器包括熵解码单元、反量化单元、反变换单元、参考帧缓存单元、解码输出单元和噪声恢复处理器。
其中,去噪滤波器对作为输入信号的当前帧与其参考帧之间的有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,并将经过缩放与平移得到的残差信号发送给变换单元或者将经过缩放与平移得到的变换系数发送给量化单元;噪声恢复处理器对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号,并将该残差信号发送给输出单元,输出单元将该残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
本发明通过执行互逆的去除噪声过程与恢复噪声过程,能够恢复原始的真实噪声。而且,仅仅是简单地对残差信号进行缩放和平移,仅需要计算少数几个参数和传输一个参数,引入的额外负担小。此外,去噪滤波器和噪声恢复处理器或者其去噪处理和噪声恢复处理可容易地集成到标准视频编解码系统中。
附图说明
图1是显示根据本发明的恢复噪声的视频编解码方法的示意性框图;
图2和图3是显示根据本发明的编码端的示意性框图;
图4是显示根据本发明的解码端的示意性框图;
图5和图6是显示根据本发明的恢复噪声的视频编解码系统的示意性框图;
图7a和图7b是标准H.264编解码器和嵌入本发明的去噪滤波器和噪声恢复处理器的标准H.264编解码器对不同视频序列进行编码的性能比较曲线图;
图8a-8c分别是含有胶片颗粒噪声的原始视频帧、利用嵌入去噪滤波器的编码器编码的重构视频帧和利用嵌入噪声恢复处理器的解码器恢复的重构视频帧。
具体实施方式
以下,将结合附图和实施例对本发明进行进一步的说明。
在对本发明方法和系统进行详细描述之前,首先对本发明中所涉及到的数学模型进行简要说明。
在本发明中,假定视频序列中的噪声分量为加性高斯噪声,观察到的有噪的视频当前帧及其参考帧分别表示为Yk和Yk-1,其相应的真实视频信号分别表示为Xk和Xk-1,则下面的等式成立:
Yk=Xk+Nk               (1)
Yk-1=Xk-1+Nk-1         (2)
其中,Nk和Nk-1分别表示第k帧和第k-1帧中的噪声分量。假设Nk的均值和方差分别为0和σk 2
另外,由于无法得知视频信号的真实值,因此,在本发明中,将其建模为均值为
Figure GSA00000096171500061
方差为
Figure GSA00000096171500062
的随机变量。第k帧和第k-1帧中的真实视频信号的关系为:
Xk=Xk-1+rk             (3)
其中,rk是残差信号。这里,假定rk与Nk和Xk-1无关,它的均值为
Figure GSA00000096171500063
方差为
Figure GSA00000096171500064
图1是显示根据本发明的恢复噪声的视频编解码方法的示意性框图。从图1中可看出,本发明对现有的标准视频编码方法的改进之处在于在编码端通过对残差信号进行缩放和平移来去除噪声,同时在解码端通过对残差信号进行反缩放和反平移来恢复噪声,从而通过简单的互逆的去噪和加噪操作来恢复原始的真实噪声,并且仅引入非常少的负担。
具体地讲,如图1所示,编码端的输入视频信号为第k帧Yk,经过预测之后获得其预测信号为
Figure GSA00000096171500065
两者之间的差值即为有噪残差信号rn,k。根据缩放因子μ和平移因子v对有噪残差信号rn,k进行缩放与平移操作之后,得到新的残差信号r′n,k=μrn,k+v。这里,使得残差信号r′n,k为当前帧Yk的真实视频信号的最优估计信号与其预测信号
Figure GSA00000096171500066
之间的残差信号,从而实现良好的去噪效果,提高编码效率。
接着,对新的残差信号r′n,k进行变换、量化和熵编码,组成压缩码流以供输出,同时对量化后的变换系数进行反量化和反变换,以得到重构的残差信号r″n,k,并将残差信号r″n,k与预测帧
Figure GSA00000096171500067
相加得到重构的帧
Figure GSA00000096171500069
即为Yk的去噪视频信号。将重构的帧
Figure GSA000000961715000610
缓存,作为下一帧Yk+1的预测帧。
在解码端,对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号rd,k。接着,根据反缩放因子λ和反平移因子θ对残差信号rd,k进行反缩放与反平移,得到新的残差信号r′d,k。这里,为了可恢复原始的真实噪声,新的残差信号r′d,k应该等于全部或部分恢复的有噪残差信号rn,k,因此,在编码端应将确定反缩放因子λ和反平移因子θ所需的参数发送给解码端,解码端根据这些参数确定反缩放因子λ和反平移因子θ,以使得编码端的去噪操作与解码端的加噪操作是互逆的。最后,将得到的残差信号r′d,k与当前帧的预测帧相加,从而得到全部或部分恢复原始噪声的视频信号。
这里,指出,在本说明书中,参考帧即为预测帧,参考信号即为预测信号。编码端的输入信号可以是一帧视频信号,还可以是一场或一块视频信号。而外,除了视频信号之外,编码端的输入信号也可以是音频或声音信号,并且一个信号片段可以是较长的一帧或较短的一帧,帧与帧间可以是相互重叠或者不重叠。在编码端输入这些信号的情况下,仅需根据实际应用在相应部分作简单修改即可。
以下,将参照图2至图4以帧间预测方法作为示例对本发明的具体实现进行详细描述。
在该示例中,利用线性最小均值平方误差估计方法来估计输入的当前帧Yk的去噪视频信号
Figure GSA00000096171500071
Figure GSA00000096171500072
其中,ω1和ω2分别为输入信号
Figure GSA00000096171500073
和Yk的权重值,d为用来保证无偏差估计的常数。
根据正交原则,最优的滤波器系数为:
ω 1 = σ k 2 σ r k 2 + σ k 2 - - - ( 5 )
ω 2 = σ r k 2 σ r k 2 + σ k 2 - - - ( 6 )
d = ω 1 r ‾ k - - - ( 7 )
其中,σk 2为第k帧的噪声分量Nk的方差,
Figure GSA00000096171500077
Figure GSA00000096171500078
分别为残差信号rk的均值和方差,此时,
Figure GSA00000096171500079
即为当前帧Yk的真实视频信号的最优估计信号。
利用ω12=1,并将公式(7)代入公式(4),公式(4)可改写为:
X ~ k = X ~ k - 1 + ω 2 ( Y k - X ~ k - 1 ) + d = X ~ k - 1 + ω 2 r n , k + ω 1 r ‾ k - - - ( 8 )
其中,rn,k是有噪残差信号,rn,k=rk+Nk,因此,其均值为
Figure GSA00000096171500082
方差为
Figure GSA00000096171500083
从公式(8)可得到新的残差信号r′n,k
r n , k ′ = X ~ k - X ~ k - 1 = ω 2 r n , k + ω 1 r ‾ k - - - ( 9 )
这里,缩放因子μ和平移因子v分别为:
μ=ω2                  (10)
v = ω 1 r ‾ k
从公式(5)、(6)和(7)可看出,缩放因子μ和平移因子v均与噪声分量σk 2、残差信号的均值
Figure GSA00000096171500086
和方差
Figure GSA00000096171500087
这三个参数有关,因此,为了确定缩放因子μ和平移因子v,必须首先确定这三个参数。可根据以下方法对这三个参数进行估计:
1.噪声分量σk 2
视频序列中平滑区域的像素值的抖动基本都是由噪声的存在而造成的,所以噪声的方差可以根据平滑区域的样本方差来估计。
2.残差信号的均值
Figure GSA00000096171500088
和方差
Figure GSA00000096171500089
由于残差信号的均值和方差
Figure GSA000000961715000811
不能直接估计得到,所以可根据其与有噪残差信号rn,k之间的关系rn,k=rk+Nk间接得到。
具体地讲,如图2所示,在运动估计和运动补偿预测获得Yk的预测值
Figure GSA000000961715000812
之后,可得到有噪残差信号rn,k。rn,k是随机变量,相邻的残差信号通常具有相似的特征,因此,可利用空间统计特性来估计或近似集合统计特性。比如,可将当前视频帧划分为M×M个块,对于被编码的当前块,计算该块的有噪残差的样本均值和样本方差,并将其作为有噪残差信号rn,k的均值和方差的估计。在获得有噪残差信号rn,k的均值和方差之后,由于噪声分量的均值和方差分别为0和σk 2,而rn,k=rk+Nk,所以,可得到残差信号的均值
Figure GSA000000961715000813
即为有噪残差信号rn,k的均值,残差信号的方差
Figure GSA000000961715000814
即为有噪残差信号rn,k的方差减去噪声分量的方差σk 2
图2为实现上述去噪编码方法的示意性框图。其中,参数估计模块用于根据当前帧Yk、参考帧
Figure GSA00000096171500091
和有噪残差rn,k来估计噪声分量σk 2、残差信号的均值
Figure GSA00000096171500092
和方差这三个参数。估计出这三个参数之后,根据公式(5)和(6)计算权重值ω1和ω2。然后,通过将有噪残差rn,k与权重值ω2相乘对有噪残差rn,k进行缩放,再通过将其与
Figure GSA00000096171500094
相加对其进行平移,从而得到新的残差信号
Figure GSA00000096171500095
接着,对新的残差信号r′n,k进行变换、量化、熵编码,从而获得压缩码流。这里,所述变换可以是离散余弦变换、离散正弦变换、哈德曼变换和KL变换等已知变换中的任何一种,所述量化可以是矢量量化、标量量化和包含死区的变量均匀量化中的任何一种。
此外,由于该示例中的缩放与平移为线性操作,因此,还可在对残差信号进行变换得到变换系数之后对变换系数执行缩放与平移操作。如图3所示,在这种实现中,首先对有噪残差信号进行变换,得到变换系数,然后再对变换系数进行缩放与平移,以得到与当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号相对应的新的变换系数。在该示例中,缩放与平移操作具体为将直流系数减去
Figure GSA00000096171500096
并将所有系数乘以,其中,如上所述,有噪残差信号rn,k的均值
Figure GSA00000096171500097
即为残差信号的均值
Figure GSA00000096171500098
接着,对新的变换系数进行量化和熵编码,组成压缩码流以供输出,同时,对量化后的变换系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧相加得到重构帧,作为下一帧的参考帧。
在解码端获得压缩码流之后,如图4所示,对其进行熵解码、反量化和反变换,得到重构的残差信号rd,k,该残差信号即为已去噪的第k帧视频
Figure GSA00000096171500099
与已去噪的第k-1帧视频
Figure GSA000000961715000910
之间的残差信号。为了恢复原始噪声,应该将该残差信号反缩放和反平移成原始的有噪残差信号rn,k 。因此,根据公式(8)或(9)可知:
r d , k = ω 2 r n , k + ω 1 r ‾ k - - - ( 12 )
那么,从公式(12)可得到原始的有噪残差信号rn,k
r n , k = r d , k - ω 1 r ‾ k ω 2 - - - ( 13 )
得到原始的有噪残差信号rn,k之后,即可得到恢复了原始噪声的视频信号:
Y k = X ~ k - 1 + r n , k - - - ( 14 )
从公式(13)可看出,为了得到有噪残差信号rn,k,必须知道ω1、ω2
Figure GSA00000096171500102
的值。根据公式(5)和(6)可知,ω1和ω2又与和σk 2相关,因此,必须知道噪声分量的方差σk 2、残差信号的均值
Figure GSA00000096171500104
和方差
Figure GSA00000096171500105
因此,编码器端需要将噪声分量的方差σk 2传送给解码端,而另外两个参数则需要重新进行估计。比如,可按照公式(12)中rd,k和rn,k的关系进行估计:
1.残差信号的均值
根据公式(12),可得到:
r ‾ d , k = ω 2 r ‾ n , k + ω 1 r ‾ k = ω 2 r ‾ k + ω 1 r ‾ k = r ‾ k - - - ( 15 )
因此,即等于
Figure GSA00000096171500109
也就是当前M×M块的rd,k的样本均值。
2.残差信号的方差
Figure GSA000000961715001010
同样根据公式(12),可得到:
σ r d , k 2 = ω 2 2 σ r n , k 2 = ω 2 2 ( σ r k 2 + σ k 2 ) = ( σ r k 2 σ r k 2 + σ k 2 ) 2 ( σ r k 2 + σ k 2 ) = σ r k 4 σ r k 2 + σ k 2 - - - ( 16 )
对方程(16)进行求解,即可得到
Figure GSA000000961715001012
的值。
图3为实现以上解码方法的示意性框图。在图3中,经过反缩放和反平移后,可得到新的残差信号
Figure GSA000000961715001013
根据公式(13),令α和β的值分别为ω1
Figure GSA000000961715001014
即,反缩放因子反平移因子则输出即为恢复原始噪声的有噪视频序列。当调整α和β的值时,还可获得噪声部分恢复的视频序列。
以上对采用帧间预测方法的视频编解码方法进行了描述。从中可看出,本发明通过简单的残差或其变换系数的缩放和平移操作就可实现真实噪声的恢复,从而改进主观视频质量。而且在编码端和解码端仅需计算少数几个参数,并且编码端只需将噪声方差σk 2传送到解码端,因此,与视频编解码系统的其余操作相比,其所需的额外开销非常小。此外,去噪处理和噪声恢复处理可被容易地集成到已有的标准视频编解码系统中。
需要指出的是,以上示例仅用作示例性目的,而不用作限制性目的。还可在此基础上根据实际应用进行各种变型。
比如,除了帧间预测之外,还可利用帧内预测或者和帧间预测和帧内预测的组合来得到预测帧;除了上述线性操作之外,还可利用非线性操作来实现缩放与平移,例如,可通过查找表的方式来实现非线性操作;除了标量操作之外,例如在矢量量化的特殊情况下还可实现缩放与平移的矢量操作。
以下,将参照图5和图6对根据本发明的视频编解码系统进行说明。
参照图5,根据本发明的视频编解码系统包括编码器510和解码器520,其中,编码器510包括输入单元511、残差计算单元512、预测单元513、参考帧缓存单元514、变换单元515、量化单元516、熵编码单元517、重构单元518、编码输出单元519和去噪滤波器530;解码器520包括熵解码单元521、反量化单元522、反变换单元523、参考帧缓存单元524、解码输出单元525和噪声恢复处理器526。
在编码器510中,残差计算单元512计算从输入单元511输入的当前帧与其通过预测单元513预测的参考帧之间的有噪残差信号。去噪滤波器530对残差计算单元512计算的有噪残差信号进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,并将该残差信号发送给变换单元515。变换单元515、量化单元516和熵编码单元517分别对从去噪滤波器530接收的残差信号进行变换、量化和熵编码。编码输出单元519将从熵编码单元517接收的变换系数与解码所需信息一起组成压缩码流以供输出,其中,解码所需信息包括,例如上述示例中的噪声分量的方差σk 2。同时,重构单元518对量化后的变化系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧存储单元514中存储的当前帧的参考帧相加得到重构的视频帧,作为下一帧的参考帧。具体操作与图2所示编码方法中的相应步骤相同,因此省略其描述。
在解码器520中,熵解码单元521、反量化单元522和反变换单元523分别对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号。噪声恢复处理器526对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号,并将该残差信号发送给解码输出单元525。解码输出单元525将该残差信号与当前帧的参考帧相加得到噪声恢复的视频信号。具体操作与图4所示解码方法中的相应步骤相同,因此省略其描述。
参照图6,根据本发明的另一视频编解码系统与图5所示系统的不同之处在于,去噪滤波器530位于变化单元515和量化单元516之间。此时,首先由变换单元515对残差计算单元512计算的残差进行变换,得到变换系数,然后,去噪滤波器530对变换系数进行缩放与平移,得到新的变换系数,量化单元对这些新的变换系数进行量化。具体操作与图3所示编码方法中的相应步骤相同,因此省略其描述。
从图5和图6可看出,编码器510中的输入单元511、残差计算单元512、预测单元513、参考帧存储单元514、变换单元515、量化单元516、熵编码单元517、重构单元518和编码输出单元519是公知的标准视频编码系统的一种示意性实现,解码器520中的熵解码单元521、反量化单元522、反变换单元523、参考帧缓存单元524和解码输出单元525是公知的标准视频解码系统的一种示意性实现。根据本发明方法构造的去噪滤波器530可集成到标准视频编码系统或者其类似系统中,噪声恢复处理器526可集成到标准视频解码系统或者其类似系统中,并且去噪滤波器530和噪声恢复处理器526所引入的额外负担非常小。
同样,如上所述,编码器510的输入信号可以是一帧视频信号,还可以是一场或一块视频信号。而外,除了视频信号之外,编码端的输入信号也可以是音频或声音信号,并且一个信号片段可以是较长的一帧或较短的一帧,帧与帧间可以是相互重叠或者不重叠。在编码器输入这些信号的情况下,仅需根据实际应用在相应部分作简单修改即可。这里所述变换可以是离散余弦变换、离散正弦变换、哈德曼变换和KL变换等已知变换中的任何一种,所述量化可以是矢量量化、标量量化和包含死区的变量均匀量化中的任何一种。
以下将通过实验来说明本发明的技术效果。在该实验中,分别利用H.264编解码器和嵌入本发明的去噪滤波器和噪声恢复处理器的H.264编解码器对视频序列cyclist和rolling_Tomatoes进行编码,并对它们的RD性能进行比较。从图7a和图7b中的曲线图可看出,本发明的RD性能优于标准H.264编解码器,BDBitrate降低了10%-20%。
此外,图8a-8c分别是含有胶片颗粒噪声的视频序列rolling_tomatoes中的原始视频帧、利用嵌入去噪滤波器的编码器编码的重构视频帧和利用嵌入噪声恢复处理器的解码器恢复的重构视频帧。从图8b可看出,利用本发明的去噪滤波器,有效地去除了胶片颗粒噪声,从而提高了编码效率。从图8c可看出,本发明有效地恢复了图8a中所含有的原始胶片颗粒噪声。
从以上描述可看出,本发明的主要技术效果在于:
1.编码端通过去噪处理,有效地去除了噪声,从而提高了编码效率;
2.由于去除噪声过程与恢复噪声过程可逆,因此,可恢复原始的真实噪声,从而改进了主观视频质量;
3.仅涉及简单的残差或其变换系数的缩放与平移操作,其中仅需要计算少数几个参数和传输一个参数,引入的额外负担小;
4.去噪滤波器和噪声恢复处理器或者其去噪处理和噪声恢复处理可容易地集成到标准视频编解码系统中。
以上已参照实施例对本发明进行了详细描述,但是,应该理解,本发明并不限于以上所公开的特定实施例,任何本领域的技术人员在此基础之上容易想到的修改和变型都应包括在本发明的保护范围内。

Claims (18)

1.一种恢复噪声的视频编解码方法,包括:
在编码端执行去除噪声的视频编码方法;
在解码端执行恢复噪声的视频解码方法;
其中,所述去除噪声的视频编码方法包括以下步骤:
计算作为输入信号的当前帧与其参考帧之间的有噪残差信号;
对有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号;
对经过缩放与平移得到的残差信号进行变换、量化和熵编码或者对经过缩放与平移得到的变换系数进行量化和熵编码,组成压缩码流以供输出,同时对量化后的变换系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧相加得到重构帧,作为下一帧的参考帧;
其中,所述恢复噪声的视频解码方法包括以下步骤:
对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号;
对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号;
将得到的有噪残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
2.根据权利要求1所述的视频编解码方法,其特征在于,根据以下公式得到所述最优估计信号:
X ~ k = ω 1 X ~ k - 1 + ω 2 Y k + d
其中,k为帧号,
Figure FSA00000096171400012
为去噪的第k帧,即为第k帧的真实视频信号的最优估计信号,
Figure FSA00000096171400013
为第k帧的参考帧,Yk为观察到的第k帧,ω1和ω2分别为权重值,d为用来保证无偏差估计的常数。
3.根据权利要求2所述的视频编解码方法,其特征在于,根据正交原则,ω1、ω2和d的最优值分别为:
ω 1 = σ k 2 σ r k 2 + σ k 2
ω 2 = σ r k 2 σ r k 2 + σ k 2
d = ω 1 r ‾ k
其中,σk 2为第k帧的噪声分量的方差,
Figure FSA00000096171400024
Figure FSA00000096171400025
分别为第k帧与其参考帧的真实视频信号之间的残差信号的均值和方差。
4.根据权利要求3所述的视频编解码方法,其特征在于,根据以下公式对有噪残差信号进行缩放和平移:
r′n,k=μrn,k+v
μ=ω2
v = ω 1 r ‾ k
其中,rn,k为有噪残差信号,r′n,k为rn,k经过缩放和平移后得到的新的残差信号,μ为缩放因子,v为平移因子。
5.根据权利要求3所述的视频编解码方法,其特征在于,通过以下方式对变换系数进行缩放与平移,即,将变换系数中的直流系数减去
Figure FSA00000096171400027
并将所有变换系数乘以ω2
6.根据权利要求4或5所述的视频编解码方法,其特征在于,根据以下公式对重构的残差信号进行反缩放和反平移:
r′d,k=λrd,k
λ = 1 ω 2
θ = - ω 1 r ‾ k ω 2
其中,rd,k为解码端重构的残差信号,r′d,k为rd,k经过反缩放和反平移后得到的新的残差信号,λ为反缩放因子,θ为反平移因子。
7.根据权利要求1所述的视频编解码方法,其特征在于,所述缩放与平移操作、反缩放与反平移操作为非线性操作。
8.根据权利要求1所述的视频编解码方法,其特征在于,所述缩放与平移操作、反缩放与反平移操作为标量或矢量操作。
9.根据权利要求1所述的视频编解码方法,其特征在于,所述输入信号为一场或一块视频信号或者音频或声音信号,并且一个信号片段的帧长度不限,帧与帧间相互重叠或者不重叠。
10.一种恢复噪声的视频编解码系统,包括编码器和解码器,编码器包括输入单元、残差计算单元、预测单元、参考帧缓存单元、变换单元、量化单元、熵编码单元、重构单元、编码输出单元,解码器包括熵解码单元、反量化单元、反变换单元、参考帧缓存单元和解码输出单元,其特征在于,
所述编码器还包括去噪滤波器,其用于对作为输入信号的当前帧与其参考帧之间的有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,并将经过缩放与平移得到的残差信号发送给变换单元或者将经过缩放与平移得到的变换系数发送给量化单元;
所述解码器还包括噪声恢复处理器,其用于对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号,并将该残差信号发送给输出单元,输出单元将该残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
11.根据权利要求10所述的视频编解码系统,其特征在于,根据以下公式得到所述最优估计信号:
X ~ k = ω 1 X ~ k - 1 + ω 2 Y k + d
其中,k为帧号,为去噪的第k帧,即为第k帧的真实视频信号的最优估计信号,
Figure FSA00000096171400033
为第k帧的参考帧,Yk为观察到的第k帧,ω1和ω2分别为权重值,d为用来保证无偏差估计的常数。
12.根据权利要求11所述的视频编解码系统,其特征在于,根据正交原则,ω1、ω2和d的最优值分别为:
ω 1 = σ k 2 σ r k 2 + σ k 2
ω 2 = σ r k 2 σ r k 2 + σ k 2
d = ω 1 r ‾ k
其中,σk 2为第k帧的噪声分量的方差,
Figure FSA00000096171400045
分别为第k帧与其参考帧的真实视频信号之间的残差信号的均值和方差。
13.根据权利要求12所述的视频编解码系统,其特征在于,根据以下公式对有噪残差信号进行缩放和平移:
r′n,k=μrn,k+v
μ=ω2
v = ω 1 r ‾ k
其中,rn,k为有噪残差信号,r′n,k为rn,k经过缩放和平移后得到的新的残差信号,μ为缩放因子,v为平移因子。
14.根据权利要求12所述的视频编解码系统,其特征在于,通过以下方式对变换系数进行缩放与平移,即,将变换系数中的直流系数减去
Figure FSA00000096171400047
并将所有变换系数乘以ω2
15.根据权利要求13或14所述的视频编解码系统,其特征在于,根据以下公式对重构的残差信号进行反缩放和反平移:
r′d,k=λrd,k
λ = 1 ω 2
θ = - ω 1 r ‾ k ω 2
其中,rd,k为解码端重构的残差信号,r′d,k为rd,k经过反缩放和反平移后得到的新的残差信号,λ为反缩放因子,θ为反平移因子。
16.根据权利要求10所述的视频编解码系统,其特征在于,所述缩放与平移操作、反缩放与反平移操作为非线性操作。
17.根据权利要求10所述的视频编解码系统,其特征在于,所述缩放与平移操作、反缩放与反平移操作为标量或矢量操作。
18.根据权利要求10所述的视频编解码系统,其特征在于,所述输入单元输入的信号为一场或一块视频信号或者音频或声音信号,并且一个信号片段的帧长度不限,帧与帧间相互重叠或者不重叠。
CN201010168392.4A 2009-05-07 2010-05-07 一种恢复噪声的视频编解码方法和系统 Active CN101883280B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US21310409P 2009-05-07 2009-05-07
US61/213,104 2009-05-07

Publications (2)

Publication Number Publication Date
CN101883280A true CN101883280A (zh) 2010-11-10
CN101883280B CN101883280B (zh) 2014-08-27

Family

ID=43055153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010168392.4A Active CN101883280B (zh) 2009-05-07 2010-05-07 一种恢复噪声的视频编解码方法和系统

Country Status (1)

Country Link
CN (1) CN101883280B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049846A (zh) * 2015-08-14 2015-11-11 广东中星电子有限公司 图像和视频编解码的方法和设备
CN105472205A (zh) * 2015-11-18 2016-04-06 腾讯科技(深圳)有限公司 编码过程中的实时视频降噪方法和装置
CN107302364A (zh) * 2012-01-20 2017-10-27 Ge视频压缩有限责任公司 从数据流解码具有变换系数级别的多个变换系数的装置
CN108353175A (zh) * 2015-09-21 2018-07-31 Lg 电子株式会社 使用系数引起的预测处理视频信号的方法和装置
CN108886621A (zh) * 2016-04-14 2018-11-23 联发科技股份有限公司 非本地自适应环路滤波器
CN114742727A (zh) * 2022-03-31 2022-07-12 南通电博士自动化设备有限公司 一种基于图像平滑的噪声处理方法及系统
CN115988201A (zh) * 2023-03-14 2023-04-18 杭州微帧信息科技有限公司 一种编码胶片颗粒的方法、装置、电子设备和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL412832A1 (pl) * 2015-06-24 2017-01-02 Politechnika Poznańska Sposób renderowania w oparciu o obraz głębi i system do renderowania w oparciu o obraz głębi

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6810086B1 (en) * 2001-06-05 2004-10-26 At&T Corp. System and method of filtering noise
CN1836448A (zh) * 2003-08-20 2006-09-20 汤姆森许可贸易公司 视频舒适噪声添加技术

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6810086B1 (en) * 2001-06-05 2004-10-26 At&T Corp. System and method of filtering noise
CN1836448A (zh) * 2003-08-20 2006-09-20 汤姆森许可贸易公司 视频舒适噪声添加技术

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈业仙: "基于统计信息的数字图像恢复及噪声滤波方法", 《计算机应用与软件》, 31 August 2003 (2003-08-31), pages 59 - 60 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10757447B2 (en) 2012-01-20 2020-08-25 Ge Video Compression, Llc Transform coefficient coding
US11968395B2 (en) 2012-01-20 2024-04-23 Ge Video Compression, Llc Transform coefficient coding
US11616982B2 (en) 2012-01-20 2023-03-28 Ge Video Compression, Llc Transform coefficient coding
CN107302364A (zh) * 2012-01-20 2017-10-27 Ge视频压缩有限责任公司 从数据流解码具有变换系数级别的多个变换系数的装置
CN107302364B (zh) * 2012-01-20 2021-01-19 Ge视频压缩有限责任公司 从数据流解码具有变换系数级别的多个变换系数的装置
CN105049846A (zh) * 2015-08-14 2015-11-11 广东中星电子有限公司 图像和视频编解码的方法和设备
CN108353175B (zh) * 2015-09-21 2021-03-12 Lg 电子株式会社 使用系数引起的预测处理视频信号的方法和装置
CN108353175A (zh) * 2015-09-21 2018-07-31 Lg 电子株式会社 使用系数引起的预测处理视频信号的方法和装置
US10587874B2 (en) 2015-11-18 2020-03-10 Tencent Technology (Shenzhen) Limited Real-time video denoising method and terminal during coding, and non-volatile computer readable storage medium
WO2017084258A1 (zh) * 2015-11-18 2017-05-26 腾讯科技(深圳)有限公司 编码过程中的实时视频降噪方法、终端和非易失性计算机可读存储介质
CN105472205A (zh) * 2015-11-18 2016-04-06 腾讯科技(深圳)有限公司 编码过程中的实时视频降噪方法和装置
CN108886621A (zh) * 2016-04-14 2018-11-23 联发科技股份有限公司 非本地自适应环路滤波器
CN114742727A (zh) * 2022-03-31 2022-07-12 南通电博士自动化设备有限公司 一种基于图像平滑的噪声处理方法及系统
CN115988201A (zh) * 2023-03-14 2023-04-18 杭州微帧信息科技有限公司 一种编码胶片颗粒的方法、装置、电子设备和存储介质
CN115988201B (zh) * 2023-03-14 2023-05-30 杭州微帧信息科技有限公司 一种编码胶片颗粒的方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN101883280B (zh) 2014-08-27

Similar Documents

Publication Publication Date Title
CN101883280B (zh) 一种恢复噪声的视频编解码方法和系统
KR100716998B1 (ko) 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체
CN103501441B (zh) 一种基于人类视觉系统的多描述视频编码方法
KR20090095014A (ko) 필터링된 예측 블록을 이용한 영상 부호화, 복호화 방법 및장치
US7634148B2 (en) Image signal transforming and inverse-transforming method and computer program product with pre-encoding filtering features
JP4949836B2 (ja) 記述的モデルパラメータを用いたエンハンスメントレイヤデータを符号化及び復号化するシステム及び方法
JP2008527932A5 (zh)
US8285064B2 (en) Method for processing images and the corresponding electronic device
MX2011001627A (es) Metodo y aparato de cuantificacion inversa de imagen y metodo y aparato de decodificacion de imagen.
KR20210017185A (ko) 심층 신경망을 기반으로 영상의 압축 포아송 잡음을 제거하는 방법 및 장치
JP2004215257A (ja) Dct基盤の改善された動映像符号化方法及びその装置
Akbari et al. Sparse recovery-based error concealment
EP1499114A2 (en) Noise reduction apparatus
KR102245682B1 (ko) 영상 압축 장치, 이의 학습 장치 및 방법
CA2684110A1 (en) Spatially enhanced transform coding
Zong et al. JND-based multiple description image coding
CN110619607B (zh) 图像去噪和包含图像去噪的图像编解码方法及装置
CN117750020A (zh) 可学习视频编码方法、系统、设备及存储介质
JPH0374968A (ja) 画像データの符号化装置
Menon et al. Gain of Grain: A Film Grain Handling Toolchain for VVC-based Open Implementations
CN106658002A (zh) 噪声消除方法及噪声消除装置
US8761527B2 (en) Image coding method
US20240054607A1 (en) Reducing the complexity of video quality metric calculations
Jayanthi et al. Multi Wavelet Based Image Compression for Tele-Medical Applications
Tiwari et al. A comparative study on image and video compression techniques

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant