CN101883280A - 一种恢复噪声的视频编解码方法和系统 - Google Patents
一种恢复噪声的视频编解码方法和系统 Download PDFInfo
- Publication number
- CN101883280A CN101883280A CN2010101683924A CN201010168392A CN101883280A CN 101883280 A CN101883280 A CN 101883280A CN 2010101683924 A CN2010101683924 A CN 2010101683924A CN 201010168392 A CN201010168392 A CN 201010168392A CN 101883280 A CN101883280 A CN 101883280A
- Authority
- CN
- China
- Prior art keywords
- residual signals
- noise
- frame
- divergent
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000013519 translation Methods 0.000 claims abstract description 54
- 238000006243 chemical reaction Methods 0.000 claims abstract description 48
- 238000011084 recovery Methods 0.000 claims abstract description 23
- 238000011002 quantification Methods 0.000 claims abstract description 9
- 238000013139 quantization Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 17
- 230000009466 transformation Effects 0.000 claims description 15
- 238000004088 simulation Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012958 reprocessing Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- -1 silver halide Chemical class 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种恢复噪声的视频编解码方法,包括:在编码端执行去除噪声的视频编码方法;在解码端执行恢复噪声的视频解码方法。在去噪处理中,对有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,然后对该残差信号进行变换、量化和熵编码,组成压缩码流以供输出。在恢复噪声处理中,对重构的残差信号进行反缩放与反平移,以得到恢复的有噪残差信号,并将得到的有噪残差信号与当前帧的参考帧相加得到噪声恢复的视频信号。相应地,提供一种恢复噪声的视频编解码系统。本发明可恢复原始的真实噪声,引入的额外负担小,去噪处理和噪声恢复处理可容易地集成到标准视频编解码系统中。
Description
技术领域
本发明涉及视频编码技术领域,尤其涉及一种恢复噪声的视频编解码方法和系统。
背景技术
目前,视频技术广泛应用于视频电话、视频会议、视频聊天、可视电子商务、数字电视和数字电影等领域。在这些领域中,数字视频序列的主观质量往往会直接影响到用户/观众的感观体验,而噪声是影响主观视频质量的一个重要因素。
具体地讲,数字视频序列在获取、录制、处理和传输的过程中通常会受到噪声的污染,这些噪声往往会导致视频编码中运动估计的准确度和编码效率的降低。因此,通常会考虑采用去噪技术来去除视频序列中的噪声分量。但是,在大多数情况下,去噪操作也会去除视频序列中的细小细节,从而造成失真,影响主观视频质量。因此,在某些对主观视频质量要求非常高的情况下,往往需要在解码端恢复或添加一些类型的有用噪声来帮助改善主观视频质量。
目前,需要在解码端恢复或添加的有用噪声主要包括:(1)胶片颗粒噪声,这种噪声是由分散在感光乳剂中的卤化银晶体的曝光和显影而引起的,对于HD DVD和数字化影院这样对视频质量要求非常高的应用,很可能希望保留胶片颗粒噪声来增强数字胶片的真实性,去掉了这些噪声,反倒会使观众感受到不自然;(2)用于掩饰伪像的随机噪声,比如,抖动信号,通过添加这些随机噪声可使由于使用基于块的压缩方法而导致的方块效应和其它结构化的噪声图案变得不那么明显。
对于胶片颗粒噪声的恢复,比较常见的方法通常包括编码端的预处理步骤和解码端的后处理步骤,其中,预处理步骤通常涉及噪声去除、提取、建模或编码等,后处理步骤通常涉及噪声模拟和合成等。
比如,在C.Gomila和A.Kobilansky的“SEI message for filmgrain noise”(JVT 8th meeting,Doc.JVT-H022,Geneva,2003)中,提出了一种通过建立胶片颗粒的参数化模型来模拟胶片颗粒噪声的方法。具体地讲,在编码端,首先从输入的视频数据中去除胶片颗粒,并将去除了胶片颗粒的视频序列发送给编码器按照标准视频编码技术进行编码,同时在已知所使用的胶片类型的情况下将标识胶片类型的标识符作为参数发送给编码器,或者在不知道所使用的胶片类型或者由于拷贝、处理、颜色空间转换等原因而导致颗粒图案失真的情况下基于预定的胶片颗粒统计模型提取表示胶片颗粒信息的参数,并将这些参数发送给编码器。编码器利用SEI(SupplementalEnhancement Information,附加增强信息)将标识符参数或者模型参数发送给解码器。解码器按照相应的标准视频解码技术对编码的视频数据进行解码,并根据接收的参数模拟胶片颗粒噪声,最后将模拟的胶片颗粒噪声与解码的视频数据合成,从而得到胶片噪声恢复的视频序列。其中,在建模步骤中,建立了自动回归模型和相应的卷积模型来表达胶片噪声的空域相关性、颜色相关性和时域相关性。
在B.T.Oh等人的“Film grain noise modeling in advancedvideo coding”(Proceedings of SPIE,Visual Communications andImage Processing,2007)中,提出了另外一种提出通过建模模拟胶片颗粒噪声的方法。该方法也是首先在编码端从输入的视频数据中去除胶片颗粒,并将去除了胶片颗粒的视频序列发送给编码器按照标准视频编码技术进行编码,同时基于预定的模型提取表示胶片颗粒噪声的参数,然后在解码端根据通过SEI消息传送过来的参数生成噪声,并将生成的噪声与解码的视频数据合成。其中,在噪声提取和去除步骤中,利用多层方法检测边缘区域,并通过仅对非边缘的均匀区域进行选择性滤波来提取和去除噪声;在噪声建模步骤中,根据空间功率谱密度、噪声概率密度和颜色相关性等方面建立了3D AR模型来表达胶片颗粒的空间相关性和功率谱相关性;在噪声合成步骤中,考虑到胶片颗粒噪声依赖于解码信号,通过对白噪声进行缩放来合成噪声。
对于这些基于模型的胶片颗粒噪声恢复方法,由于模型本身的局限性,这些方法通常仅适用于符合该模型的胶片颗粒,也就是说,往往只有符合该模型的胶片颗粒才能被适当地编码和恢复。针对这样的问题,在申请号为03019872.5的欧洲专利申请“Film grainencoding”中,提出了一种改进方法。该方法不是对提取的胶片颗粒信息进行建模,而是按照标准化视频编码技术对提取的至少一个代表性胶片颗粒信息块进行编码,从而使得不限于特定类型的胶片噪声的合成。同时,为了增强适应性,通过镜像、旋转、循环移位、改变胶片颗粒块的强度、对编码的视频信号的统计属性进行监控等操作对胶片颗粒信息进行修改,从而实现各种不同的胶片颗粒的自适应编码。
但是,虽然这种方法消除了建模方法的局限性,但是与建模方法一样,都在编码端的编码之前增加了噪声去除、提取、建模或编码等预处理,在解码端的解码之后增加了模拟和合成等后处理,而这些增加的预处理和后处理通常涉及复杂的计算或处理,相应地增加了编解码器的复杂性,从而给标准视频编码系统引入了一定的额外负担,影响整个系统的处理效率和传输效率。另外一个关键的问题是这些方法都是利用各种模拟手段来模拟胶片颗粒噪声,虽然模拟的噪声整体上可具有与原始胶片颗粒噪声类似的主观质量,但是却不能实现像素对像素的模拟。也就是说,这些方法只能是模拟胶片颗粒噪声,并不能恢复原始的真实的胶片颗粒噪声,在某些要求高主观视频质量的应用中,最终模拟合成的噪声很可能不被接受。
对于用于掩饰伪像的随机噪声的添加,比较常见的方法是在解码器端通过各种模拟手段来生成噪声。比如,在申请号为10/572,690的美国专利申请“Video Comfort Noise Addition Technique”中,提出了一种根据噪声的空域相关性和时域相关性以及噪声与解码图像的亮度之间的关系生成噪声的方法;在申请号为11/059,175的美国专利“Method and Apparatus for Masking of Video Artifactsand/or Insertion of Film Grain in a Video Decoder”中,提出了一种利用线性反馈移位寄存器(LFSR)伪随机噪声(PRN)生成器来生成噪声和合成噪声的方法。这些方法的缺点也是在于在视频解码之后需要通过一些后处理来生成噪声和合成噪声,而这些后处理往往涉及到较为复杂的运算或处理,给整个系统带来了一定的负担。而且,所模拟的噪声只能保证基本类似,却不能保证其真实性。
发明内容
为了解决以上问题,本发明提供一种恢复噪声的视频编码方法和系统,以在给标准视频编码系统引入尽可能小的额外负担的情况下恢复真实的噪声。
为了实现以上目的,本发明提供的恢复噪声的视频编解码方法包括以下步骤:在编码端执行去除噪声的视频编码方法;在解码端执行恢复噪声的视频解码方法。
其中,所述去除噪声的视频编码方法包括以下步骤:计算作为输入信号的当前帧与其参考帧之间的有噪残差信号;对有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号;对经过缩放与平移得到的残差信号进行变换、量化和熵编码或者对经过缩放与平移得到的变换系数进行量化和熵编码,组成压缩码流以供输出,同时对量化后的变换系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧相加得到重构帧,作为下一帧的参考帧。
所述恢复噪声的视频解码方法包括以下步骤:对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号;对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号;将得到的有噪残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
相应地,本发明提供一种恢复噪声的视频编解码系统,包括编码器和解码器,编码器包括输入单元、残差计算单元、预测单元、参考帧缓存单元、变换单元、量化单元、熵编码单元、重构单元、编码输出单元和去噪滤波器,解码器包括熵解码单元、反量化单元、反变换单元、参考帧缓存单元、解码输出单元和噪声恢复处理器。
其中,去噪滤波器对作为输入信号的当前帧与其参考帧之间的有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,并将经过缩放与平移得到的残差信号发送给变换单元或者将经过缩放与平移得到的变换系数发送给量化单元;噪声恢复处理器对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号,并将该残差信号发送给输出单元,输出单元将该残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
本发明通过执行互逆的去除噪声过程与恢复噪声过程,能够恢复原始的真实噪声。而且,仅仅是简单地对残差信号进行缩放和平移,仅需要计算少数几个参数和传输一个参数,引入的额外负担小。此外,去噪滤波器和噪声恢复处理器或者其去噪处理和噪声恢复处理可容易地集成到标准视频编解码系统中。
附图说明
图1是显示根据本发明的恢复噪声的视频编解码方法的示意性框图;
图2和图3是显示根据本发明的编码端的示意性框图;
图4是显示根据本发明的解码端的示意性框图;
图5和图6是显示根据本发明的恢复噪声的视频编解码系统的示意性框图;
图7a和图7b是标准H.264编解码器和嵌入本发明的去噪滤波器和噪声恢复处理器的标准H.264编解码器对不同视频序列进行编码的性能比较曲线图;
图8a-8c分别是含有胶片颗粒噪声的原始视频帧、利用嵌入去噪滤波器的编码器编码的重构视频帧和利用嵌入噪声恢复处理器的解码器恢复的重构视频帧。
具体实施方式
以下,将结合附图和实施例对本发明进行进一步的说明。
在对本发明方法和系统进行详细描述之前,首先对本发明中所涉及到的数学模型进行简要说明。
在本发明中,假定视频序列中的噪声分量为加性高斯噪声,观察到的有噪的视频当前帧及其参考帧分别表示为Yk和Yk-1,其相应的真实视频信号分别表示为Xk和Xk-1,则下面的等式成立:
Yk=Xk+Nk (1)
Yk-1=Xk-1+Nk-1 (2)
其中,Nk和Nk-1分别表示第k帧和第k-1帧中的噪声分量。假设Nk的均值和方差分别为0和σk 2。
Xk=Xk-1+rk (3)
图1是显示根据本发明的恢复噪声的视频编解码方法的示意性框图。从图1中可看出,本发明对现有的标准视频编码方法的改进之处在于在编码端通过对残差信号进行缩放和平移来去除噪声,同时在解码端通过对残差信号进行反缩放和反平移来恢复噪声,从而通过简单的互逆的去噪和加噪操作来恢复原始的真实噪声,并且仅引入非常少的负担。
具体地讲,如图1所示,编码端的输入视频信号为第k帧Yk,经过预测之后获得其预测信号为两者之间的差值即为有噪残差信号rn,k。根据缩放因子μ和平移因子v对有噪残差信号rn,k进行缩放与平移操作之后,得到新的残差信号r′n,k=μrn,k+v。这里,使得残差信号r′n,k为当前帧Yk的真实视频信号的最优估计信号与其预测信号之间的残差信号,从而实现良好的去噪效果,提高编码效率。
接着,对新的残差信号r′n,k进行变换、量化和熵编码,组成压缩码流以供输出,同时对量化后的变换系数进行反量化和反变换,以得到重构的残差信号r″n,k,并将残差信号r″n,k与预测帧相加得到重构的帧帧即为Yk的去噪视频信号。将重构的帧缓存,作为下一帧Yk+1的预测帧。
在解码端,对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号rd,k。接着,根据反缩放因子λ和反平移因子θ对残差信号rd,k进行反缩放与反平移,得到新的残差信号r′d,k。这里,为了可恢复原始的真实噪声,新的残差信号r′d,k应该等于全部或部分恢复的有噪残差信号rn,k,因此,在编码端应将确定反缩放因子λ和反平移因子θ所需的参数发送给解码端,解码端根据这些参数确定反缩放因子λ和反平移因子θ,以使得编码端的去噪操作与解码端的加噪操作是互逆的。最后,将得到的残差信号r′d,k与当前帧的预测帧相加,从而得到全部或部分恢复原始噪声的视频信号。
这里,指出,在本说明书中,参考帧即为预测帧,参考信号即为预测信号。编码端的输入信号可以是一帧视频信号,还可以是一场或一块视频信号。而外,除了视频信号之外,编码端的输入信号也可以是音频或声音信号,并且一个信号片段可以是较长的一帧或较短的一帧,帧与帧间可以是相互重叠或者不重叠。在编码端输入这些信号的情况下,仅需根据实际应用在相应部分作简单修改即可。
以下,将参照图2至图4以帧间预测方法作为示例对本发明的具体实现进行详细描述。
根据正交原则,最优的滤波器系数为:
利用ω1+ω2=1,并将公式(7)代入公式(4),公式(4)可改写为:
从公式(8)可得到新的残差信号r′n,k:
这里,缩放因子μ和平移因子v分别为:
μ=ω2 (10)
从公式(5)、(6)和(7)可看出,缩放因子μ和平移因子v均与噪声分量σk 2、残差信号的均值和方差这三个参数有关,因此,为了确定缩放因子μ和平移因子v,必须首先确定这三个参数。可根据以下方法对这三个参数进行估计:
1.噪声分量σk 2
视频序列中平滑区域的像素值的抖动基本都是由噪声的存在而造成的,所以噪声的方差可以根据平滑区域的样本方差来估计。
具体地讲,如图2所示,在运动估计和运动补偿预测获得Yk的预测值之后,可得到有噪残差信号rn,k。rn,k是随机变量,相邻的残差信号通常具有相似的特征,因此,可利用空间统计特性来估计或近似集合统计特性。比如,可将当前视频帧划分为M×M个块,对于被编码的当前块,计算该块的有噪残差的样本均值和样本方差,并将其作为有噪残差信号rn,k的均值和方差的估计。在获得有噪残差信号rn,k的均值和方差之后,由于噪声分量的均值和方差分别为0和σk 2,而rn,k=rk+Nk,所以,可得到残差信号的均值即为有噪残差信号rn,k的均值,残差信号的方差即为有噪残差信号rn,k的方差减去噪声分量的方差σk 2。
图2为实现上述去噪编码方法的示意性框图。其中,参数估计模块用于根据当前帧Yk、参考帧和有噪残差rn,k来估计噪声分量σk 2、残差信号的均值和方差这三个参数。估计出这三个参数之后,根据公式(5)和(6)计算权重值ω1和ω2。然后,通过将有噪残差rn,k与权重值ω2相乘对有噪残差rn,k进行缩放,再通过将其与相加对其进行平移,从而得到新的残差信号接着,对新的残差信号r′n,k进行变换、量化、熵编码,从而获得压缩码流。这里,所述变换可以是离散余弦变换、离散正弦变换、哈德曼变换和KL变换等已知变换中的任何一种,所述量化可以是矢量量化、标量量化和包含死区的变量均匀量化中的任何一种。
此外,由于该示例中的缩放与平移为线性操作,因此,还可在对残差信号进行变换得到变换系数之后对变换系数执行缩放与平移操作。如图3所示,在这种实现中,首先对有噪残差信号进行变换,得到变换系数,然后再对变换系数进行缩放与平移,以得到与当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号相对应的新的变换系数。在该示例中,缩放与平移操作具体为将直流系数减去并将所有系数乘以,其中,如上所述,有噪残差信号rn,k的均值即为残差信号的均值接着,对新的变换系数进行量化和熵编码,组成压缩码流以供输出,同时,对量化后的变换系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧相加得到重构帧,作为下一帧的参考帧。
在解码端获得压缩码流之后,如图4所示,对其进行熵解码、反量化和反变换,得到重构的残差信号rd,k,该残差信号即为已去噪的第k帧视频与已去噪的第k-1帧视频之间的残差信号。为了恢复原始噪声,应该将该残差信号反缩放和反平移成原始的有噪残差信号rn,k 。因此,根据公式(8)或(9)可知:
那么,从公式(12)可得到原始的有噪残差信号rn,k:
得到原始的有噪残差信号rn,k之后,即可得到恢复了原始噪声的视频信号:
从公式(13)可看出,为了得到有噪残差信号rn,k,必须知道ω1、ω2和的值。根据公式(5)和(6)可知,ω1和ω2又与和σk 2相关,因此,必须知道噪声分量的方差σk 2、残差信号的均值和方差因此,编码器端需要将噪声分量的方差σk 2传送给解码端,而另外两个参数则需要重新进行估计。比如,可按照公式(12)中rd,k和rn,k的关系进行估计:
1.残差信号的均值
根据公式(12),可得到:
同样根据公式(12),可得到:
图3为实现以上解码方法的示意性框图。在图3中,经过反缩放和反平移后,可得到新的残差信号根据公式(13),令α和β的值分别为ω1和即,反缩放因子反平移因子则输出即为恢复原始噪声的有噪视频序列。当调整α和β的值时,还可获得噪声部分恢复的视频序列。
以上对采用帧间预测方法的视频编解码方法进行了描述。从中可看出,本发明通过简单的残差或其变换系数的缩放和平移操作就可实现真实噪声的恢复,从而改进主观视频质量。而且在编码端和解码端仅需计算少数几个参数,并且编码端只需将噪声方差σk 2传送到解码端,因此,与视频编解码系统的其余操作相比,其所需的额外开销非常小。此外,去噪处理和噪声恢复处理可被容易地集成到已有的标准视频编解码系统中。
需要指出的是,以上示例仅用作示例性目的,而不用作限制性目的。还可在此基础上根据实际应用进行各种变型。
比如,除了帧间预测之外,还可利用帧内预测或者和帧间预测和帧内预测的组合来得到预测帧;除了上述线性操作之外,还可利用非线性操作来实现缩放与平移,例如,可通过查找表的方式来实现非线性操作;除了标量操作之外,例如在矢量量化的特殊情况下还可实现缩放与平移的矢量操作。
以下,将参照图5和图6对根据本发明的视频编解码系统进行说明。
参照图5,根据本发明的视频编解码系统包括编码器510和解码器520,其中,编码器510包括输入单元511、残差计算单元512、预测单元513、参考帧缓存单元514、变换单元515、量化单元516、熵编码单元517、重构单元518、编码输出单元519和去噪滤波器530;解码器520包括熵解码单元521、反量化单元522、反变换单元523、参考帧缓存单元524、解码输出单元525和噪声恢复处理器526。
在编码器510中,残差计算单元512计算从输入单元511输入的当前帧与其通过预测单元513预测的参考帧之间的有噪残差信号。去噪滤波器530对残差计算单元512计算的有噪残差信号进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,并将该残差信号发送给变换单元515。变换单元515、量化单元516和熵编码单元517分别对从去噪滤波器530接收的残差信号进行变换、量化和熵编码。编码输出单元519将从熵编码单元517接收的变换系数与解码所需信息一起组成压缩码流以供输出,其中,解码所需信息包括,例如上述示例中的噪声分量的方差σk 2。同时,重构单元518对量化后的变化系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧存储单元514中存储的当前帧的参考帧相加得到重构的视频帧,作为下一帧的参考帧。具体操作与图2所示编码方法中的相应步骤相同,因此省略其描述。
在解码器520中,熵解码单元521、反量化单元522和反变换单元523分别对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号。噪声恢复处理器526对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号,并将该残差信号发送给解码输出单元525。解码输出单元525将该残差信号与当前帧的参考帧相加得到噪声恢复的视频信号。具体操作与图4所示解码方法中的相应步骤相同,因此省略其描述。
参照图6,根据本发明的另一视频编解码系统与图5所示系统的不同之处在于,去噪滤波器530位于变化单元515和量化单元516之间。此时,首先由变换单元515对残差计算单元512计算的残差进行变换,得到变换系数,然后,去噪滤波器530对变换系数进行缩放与平移,得到新的变换系数,量化单元对这些新的变换系数进行量化。具体操作与图3所示编码方法中的相应步骤相同,因此省略其描述。
从图5和图6可看出,编码器510中的输入单元511、残差计算单元512、预测单元513、参考帧存储单元514、变换单元515、量化单元516、熵编码单元517、重构单元518和编码输出单元519是公知的标准视频编码系统的一种示意性实现,解码器520中的熵解码单元521、反量化单元522、反变换单元523、参考帧缓存单元524和解码输出单元525是公知的标准视频解码系统的一种示意性实现。根据本发明方法构造的去噪滤波器530可集成到标准视频编码系统或者其类似系统中,噪声恢复处理器526可集成到标准视频解码系统或者其类似系统中,并且去噪滤波器530和噪声恢复处理器526所引入的额外负担非常小。
同样,如上所述,编码器510的输入信号可以是一帧视频信号,还可以是一场或一块视频信号。而外,除了视频信号之外,编码端的输入信号也可以是音频或声音信号,并且一个信号片段可以是较长的一帧或较短的一帧,帧与帧间可以是相互重叠或者不重叠。在编码器输入这些信号的情况下,仅需根据实际应用在相应部分作简单修改即可。这里所述变换可以是离散余弦变换、离散正弦变换、哈德曼变换和KL变换等已知变换中的任何一种,所述量化可以是矢量量化、标量量化和包含死区的变量均匀量化中的任何一种。
以下将通过实验来说明本发明的技术效果。在该实验中,分别利用H.264编解码器和嵌入本发明的去噪滤波器和噪声恢复处理器的H.264编解码器对视频序列cyclist和rolling_Tomatoes进行编码,并对它们的RD性能进行比较。从图7a和图7b中的曲线图可看出,本发明的RD性能优于标准H.264编解码器,BDBitrate降低了10%-20%。
此外,图8a-8c分别是含有胶片颗粒噪声的视频序列rolling_tomatoes中的原始视频帧、利用嵌入去噪滤波器的编码器编码的重构视频帧和利用嵌入噪声恢复处理器的解码器恢复的重构视频帧。从图8b可看出,利用本发明的去噪滤波器,有效地去除了胶片颗粒噪声,从而提高了编码效率。从图8c可看出,本发明有效地恢复了图8a中所含有的原始胶片颗粒噪声。
从以上描述可看出,本发明的主要技术效果在于:
1.编码端通过去噪处理,有效地去除了噪声,从而提高了编码效率;
2.由于去除噪声过程与恢复噪声过程可逆,因此,可恢复原始的真实噪声,从而改进了主观视频质量;
3.仅涉及简单的残差或其变换系数的缩放与平移操作,其中仅需要计算少数几个参数和传输一个参数,引入的额外负担小;
4.去噪滤波器和噪声恢复处理器或者其去噪处理和噪声恢复处理可容易地集成到标准视频编解码系统中。
以上已参照实施例对本发明进行了详细描述,但是,应该理解,本发明并不限于以上所公开的特定实施例,任何本领域的技术人员在此基础之上容易想到的修改和变型都应包括在本发明的保护范围内。
Claims (18)
1.一种恢复噪声的视频编解码方法,包括:
在编码端执行去除噪声的视频编码方法;
在解码端执行恢复噪声的视频解码方法;
其中,所述去除噪声的视频编码方法包括以下步骤:
计算作为输入信号的当前帧与其参考帧之间的有噪残差信号;
对有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号;
对经过缩放与平移得到的残差信号进行变换、量化和熵编码或者对经过缩放与平移得到的变换系数进行量化和熵编码,组成压缩码流以供输出,同时对量化后的变换系数进行反量化和反变换,以得到重构的残差信号,并将该残差信号与参考帧相加得到重构帧,作为下一帧的参考帧;
其中,所述恢复噪声的视频解码方法包括以下步骤:
对编码端输出的压缩码流进行熵解码、反量化和反变换,得到重构的残差信号;
对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号;
将得到的有噪残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
4.根据权利要求3所述的视频编解码方法,其特征在于,根据以下公式对有噪残差信号进行缩放和平移:
r′n,k=μrn,k+v
μ=ω2
其中,rn,k为有噪残差信号,r′n,k为rn,k经过缩放和平移后得到的新的残差信号,μ为缩放因子,v为平移因子。
6.根据权利要求4或5所述的视频编解码方法,其特征在于,根据以下公式对重构的残差信号进行反缩放和反平移:
r′d,k=λrd,k+θ
其中,rd,k为解码端重构的残差信号,r′d,k为rd,k经过反缩放和反平移后得到的新的残差信号,λ为反缩放因子,θ为反平移因子。
7.根据权利要求1所述的视频编解码方法,其特征在于,所述缩放与平移操作、反缩放与反平移操作为非线性操作。
8.根据权利要求1所述的视频编解码方法,其特征在于,所述缩放与平移操作、反缩放与反平移操作为标量或矢量操作。
9.根据权利要求1所述的视频编解码方法,其特征在于,所述输入信号为一场或一块视频信号或者音频或声音信号,并且一个信号片段的帧长度不限,帧与帧间相互重叠或者不重叠。
10.一种恢复噪声的视频编解码系统,包括编码器和解码器,编码器包括输入单元、残差计算单元、预测单元、参考帧缓存单元、变换单元、量化单元、熵编码单元、重构单元、编码输出单元,解码器包括熵解码单元、反量化单元、反变换单元、参考帧缓存单元和解码输出单元,其特征在于,
所述编码器还包括去噪滤波器,其用于对作为输入信号的当前帧与其参考帧之间的有噪残差信号或者其变换系数进行缩放与平移,以得到当前帧的真实视频信号的最优估计信号与其参考帧之间的残差信号,并将经过缩放与平移得到的残差信号发送给变换单元或者将经过缩放与平移得到的变换系数发送给量化单元;
所述解码器还包括噪声恢复处理器,其用于对重构的残差信号进行反缩放与反平移,以得到全部或部分恢复的有噪残差信号,并将该残差信号发送给输出单元,输出单元将该残差信号与当前帧的参考帧相加得到噪声全部或部分恢复的视频信号。
13.根据权利要求12所述的视频编解码系统,其特征在于,根据以下公式对有噪残差信号进行缩放和平移:
r′n,k=μrn,k+v
μ=ω2
其中,rn,k为有噪残差信号,r′n,k为rn,k经过缩放和平移后得到的新的残差信号,μ为缩放因子,v为平移因子。
15.根据权利要求13或14所述的视频编解码系统,其特征在于,根据以下公式对重构的残差信号进行反缩放和反平移:
r′d,k=λrd,k+θ
其中,rd,k为解码端重构的残差信号,r′d,k为rd,k经过反缩放和反平移后得到的新的残差信号,λ为反缩放因子,θ为反平移因子。
16.根据权利要求10所述的视频编解码系统,其特征在于,所述缩放与平移操作、反缩放与反平移操作为非线性操作。
17.根据权利要求10所述的视频编解码系统,其特征在于,所述缩放与平移操作、反缩放与反平移操作为标量或矢量操作。
18.根据权利要求10所述的视频编解码系统,其特征在于,所述输入单元输入的信号为一场或一块视频信号或者音频或声音信号,并且一个信号片段的帧长度不限,帧与帧间相互重叠或者不重叠。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US21310409P | 2009-05-07 | 2009-05-07 | |
US61/213,104 | 2009-05-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101883280A true CN101883280A (zh) | 2010-11-10 |
CN101883280B CN101883280B (zh) | 2014-08-27 |
Family
ID=43055153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010168392.4A Active CN101883280B (zh) | 2009-05-07 | 2010-05-07 | 一种恢复噪声的视频编解码方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101883280B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105049846A (zh) * | 2015-08-14 | 2015-11-11 | 广东中星电子有限公司 | 图像和视频编解码的方法和设备 |
CN105472205A (zh) * | 2015-11-18 | 2016-04-06 | 腾讯科技(深圳)有限公司 | 编码过程中的实时视频降噪方法和装置 |
CN107302364A (zh) * | 2012-01-20 | 2017-10-27 | Ge视频压缩有限责任公司 | 从数据流解码具有变换系数级别的多个变换系数的装置 |
CN108353175A (zh) * | 2015-09-21 | 2018-07-31 | Lg 电子株式会社 | 使用系数引起的预测处理视频信号的方法和装置 |
CN108886621A (zh) * | 2016-04-14 | 2018-11-23 | 联发科技股份有限公司 | 非本地自适应环路滤波器 |
CN114742727A (zh) * | 2022-03-31 | 2022-07-12 | 南通电博士自动化设备有限公司 | 一种基于图像平滑的噪声处理方法及系统 |
CN115988201A (zh) * | 2023-03-14 | 2023-04-18 | 杭州微帧信息科技有限公司 | 一种编码胶片颗粒的方法、装置、电子设备和存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL412832A1 (pl) * | 2015-06-24 | 2017-01-02 | Politechnika Poznańska | Sposób renderowania w oparciu o obraz głębi i system do renderowania w oparciu o obraz głębi |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6810086B1 (en) * | 2001-06-05 | 2004-10-26 | At&T Corp. | System and method of filtering noise |
CN1836448A (zh) * | 2003-08-20 | 2006-09-20 | 汤姆森许可贸易公司 | 视频舒适噪声添加技术 |
-
2010
- 2010-05-07 CN CN201010168392.4A patent/CN101883280B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6810086B1 (en) * | 2001-06-05 | 2004-10-26 | At&T Corp. | System and method of filtering noise |
CN1836448A (zh) * | 2003-08-20 | 2006-09-20 | 汤姆森许可贸易公司 | 视频舒适噪声添加技术 |
Non-Patent Citations (1)
Title |
---|
陈业仙: "基于统计信息的数字图像恢复及噪声滤波方法", 《计算机应用与软件》, 31 August 2003 (2003-08-31), pages 59 - 60 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10757447B2 (en) | 2012-01-20 | 2020-08-25 | Ge Video Compression, Llc | Transform coefficient coding |
US11968395B2 (en) | 2012-01-20 | 2024-04-23 | Ge Video Compression, Llc | Transform coefficient coding |
US11616982B2 (en) | 2012-01-20 | 2023-03-28 | Ge Video Compression, Llc | Transform coefficient coding |
CN107302364A (zh) * | 2012-01-20 | 2017-10-27 | Ge视频压缩有限责任公司 | 从数据流解码具有变换系数级别的多个变换系数的装置 |
CN107302364B (zh) * | 2012-01-20 | 2021-01-19 | Ge视频压缩有限责任公司 | 从数据流解码具有变换系数级别的多个变换系数的装置 |
CN105049846A (zh) * | 2015-08-14 | 2015-11-11 | 广东中星电子有限公司 | 图像和视频编解码的方法和设备 |
CN108353175B (zh) * | 2015-09-21 | 2021-03-12 | Lg 电子株式会社 | 使用系数引起的预测处理视频信号的方法和装置 |
CN108353175A (zh) * | 2015-09-21 | 2018-07-31 | Lg 电子株式会社 | 使用系数引起的预测处理视频信号的方法和装置 |
US10587874B2 (en) | 2015-11-18 | 2020-03-10 | Tencent Technology (Shenzhen) Limited | Real-time video denoising method and terminal during coding, and non-volatile computer readable storage medium |
WO2017084258A1 (zh) * | 2015-11-18 | 2017-05-26 | 腾讯科技(深圳)有限公司 | 编码过程中的实时视频降噪方法、终端和非易失性计算机可读存储介质 |
CN105472205A (zh) * | 2015-11-18 | 2016-04-06 | 腾讯科技(深圳)有限公司 | 编码过程中的实时视频降噪方法和装置 |
CN108886621A (zh) * | 2016-04-14 | 2018-11-23 | 联发科技股份有限公司 | 非本地自适应环路滤波器 |
CN114742727A (zh) * | 2022-03-31 | 2022-07-12 | 南通电博士自动化设备有限公司 | 一种基于图像平滑的噪声处理方法及系统 |
CN115988201A (zh) * | 2023-03-14 | 2023-04-18 | 杭州微帧信息科技有限公司 | 一种编码胶片颗粒的方法、装置、电子设备和存储介质 |
CN115988201B (zh) * | 2023-03-14 | 2023-05-30 | 杭州微帧信息科技有限公司 | 一种编码胶片颗粒的方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN101883280B (zh) | 2014-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101883280B (zh) | 一种恢复噪声的视频编解码方法和系统 | |
KR100716998B1 (ko) | 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체 | |
CN103501441B (zh) | 一种基于人类视觉系统的多描述视频编码方法 | |
KR20090095014A (ko) | 필터링된 예측 블록을 이용한 영상 부호화, 복호화 방법 및장치 | |
US7634148B2 (en) | Image signal transforming and inverse-transforming method and computer program product with pre-encoding filtering features | |
JP4949836B2 (ja) | 記述的モデルパラメータを用いたエンハンスメントレイヤデータを符号化及び復号化するシステム及び方法 | |
JP2008527932A5 (zh) | ||
US8285064B2 (en) | Method for processing images and the corresponding electronic device | |
MX2011001627A (es) | Metodo y aparato de cuantificacion inversa de imagen y metodo y aparato de decodificacion de imagen. | |
KR20210017185A (ko) | 심층 신경망을 기반으로 영상의 압축 포아송 잡음을 제거하는 방법 및 장치 | |
JP2004215257A (ja) | Dct基盤の改善された動映像符号化方法及びその装置 | |
Akbari et al. | Sparse recovery-based error concealment | |
EP1499114A2 (en) | Noise reduction apparatus | |
KR102245682B1 (ko) | 영상 압축 장치, 이의 학습 장치 및 방법 | |
CA2684110A1 (en) | Spatially enhanced transform coding | |
Zong et al. | JND-based multiple description image coding | |
CN110619607B (zh) | 图像去噪和包含图像去噪的图像编解码方法及装置 | |
CN117750020A (zh) | 可学习视频编码方法、系统、设备及存储介质 | |
JPH0374968A (ja) | 画像データの符号化装置 | |
Menon et al. | Gain of Grain: A Film Grain Handling Toolchain for VVC-based Open Implementations | |
CN106658002A (zh) | 噪声消除方法及噪声消除装置 | |
US8761527B2 (en) | Image coding method | |
US20240054607A1 (en) | Reducing the complexity of video quality metric calculations | |
Jayanthi et al. | Multi Wavelet Based Image Compression for Tele-Medical Applications | |
Tiwari et al. | A comparative study on image and video compression techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |