CN101674478B - 基于压缩域的视频超分辨率方法 - Google Patents
基于压缩域的视频超分辨率方法 Download PDFInfo
- Publication number
- CN101674478B CN101674478B CN 200910153544 CN200910153544A CN101674478B CN 101674478 B CN101674478 B CN 101674478B CN 200910153544 CN200910153544 CN 200910153544 CN 200910153544 A CN200910153544 A CN 200910153544A CN 101674478 B CN101674478 B CN 101674478B
- Authority
- CN
- China
- Prior art keywords
- super
- resolution image
- resolution
- image
- definition picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims description 36
- 238000007906 compression Methods 0.000 claims description 20
- 230000006835 compression Effects 0.000 claims description 16
- 230000033001 locomotion Effects 0.000 claims description 16
- 238000006073 displacement reaction Methods 0.000 claims description 14
- 230000001052 transient effect Effects 0.000 claims description 10
- 238000013139 quantization Methods 0.000 claims description 9
- 238000011478 gradient descent method Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 230000000903 blocking effect Effects 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 4
- 230000006837 decompression Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 7
- 230000002401 inhibitory effect Effects 0.000 abstract 1
- 230000003313 weakening effect Effects 0.000 abstract 1
- 238000003384 imaging method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012958 reprocessing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011480 coordinate descent method Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种适用于压缩域的视频超分辨率方法,充分利用前后多帧的信息来超分辨率重建目标帧,主要包括以下步骤:首先,解压缩低分辨视频,得到各种信息;然后,利用得到的信息,使用贝叶斯框架,来分别得到当前窗口内的各单幅超分辨率图像;最后,利用当前窗口内的各单幅超分辨率图像来重建目标帧的最终的超分辨率图像。在此过程中,提出了超分辨率图像的梯度分布尽可能接近解压缩后的低分辨率图像的梯度分布,作为先验概率;使用了IRLS来构建目标函数,从而削弱离群点和噪声的影响,使得到的超分辨率图像具有较高的PSNR,较少引入新的噪声,且抑制编码噪声和“振铃”效应。利用依次滑动移动窗口,就得到超分辨率的视频。
Description
技术领域:
本发明涉及一种适用压缩域的视频超分辨率方法,得到的超分辨率图像保持边界清晰,同时抑制编码噪声和“振铃”效应。这种方法充分利用了压缩码流中的信息,且同时解决校准、插值、复原和后处理等问题。可以应用于各种MPEG4格式的压缩视频。
背景技术:
由于成像设备自身限制、数据压缩算法和传输错误等方面的原因,实际应用中能够得到的视频图像分辨率常常满足不了高清晰度的要求。为了解决这一问题,人们提出了序列图像的超分辨率算法,从多幅质量较差、分辨率较低的图像重构出单幅质量更好、分辨率更高的图像。
目前国内外解视频超分辨率的方法主要可以分为空间域和变换域两大类。空间域方法是先将压缩视频解压缩,再使用空间域的传统超分辨方法。其缺点是量化误差信息被丢失,效果不好,尤其压缩比较高时。基于压缩域重建的方法主要是对成像模型和空域噪声/压缩噪声进行建模,需要完整地考虑成像过程,压缩过程,运动估计以及块效应、振铃效应等多个方面的影响。当活动窗口内帧间的运动较简单时,尤其是全局运动,现有的一些超分辨率方法效果挺好的。但是,当活动窗口内帧间的运动较复杂时,这些方法会引入新的噪声,尤其是运动物体部分,且“振铃效应”明显。分析其原因,是由于活动窗口内的所有帧所有像素点都参加了超分辨率运算。但事实上,有些窗口内的低分辨率图像像素点并不能通过目标帧的运动补偿被观察或预测到。
发明内容:
本发明要解决的是现有技术中存在的上述问题,旨在提供种新颖的基于压缩域的视频超分辨率方法。
解决上述问题采用的技术方案是:基于压缩域的视频超分辨率方法,其特征在于包括如下具体步骤:
1)对输入的压缩视频进行解压缩,得到低分辨率的视频图像、量化矩阵、量化后的变换域系数、运动补偿后的预测视频图像、以及运动矢量信息;
2)对从自然场景到压缩视频的过程进行建模,建立低分辨率图像和相应高分辨率图像之间的关系:高分辨率图像通过模糊、下采样、压缩和解压缩得到低分辨率图像;建立运动补偿后的预测视频图像与对应高分辨率图像间的关系;
3)由上面建立的低分辨率图像和相应高分辨率图像之间的关系可以建模条件概率:在高分辨率图像已知的情况下,得到低分辨率图像的概率使用量化噪声的分布来建模,所述化噪声的分布符合高斯分布;
4)对上面量化噪声的协方差矩阵进行建模:先求解变换域的协方差矩阵:由量化矩阵可以得到,再将变换域的协方差矩阵转换成空间域的协方差矩阵;
5)对在高分辨率图像已知的情况下,得到预测视频图像的概率使用运动估计引入量化噪声的分布来建模,所述运动估计引入噪声的分布符合高斯分布。
6)对上面运动估计引入量化噪声的协方差矩阵进行建模,先求解变换域的协方差矩阵:由量化矩阵和变换域系数可以得到,再将变换域的协方差矩阵转换成空间域的协方差矩阵;
7)建模高分辨率图像的先验概率:对图像的梯度分布用广义拉普拉斯分布来拟合,使超分辨率图像的梯度分布尽可能接近解压缩后的低分辨率图像的梯度分布,而且超分辨率图像应该是平滑的,没有“块效应”;
8)使用贝叶斯模型MAP框架估计暂时的单幅超分辨率图像;
9)使用梯度下降来求解得到暂时的单幅超分辨率图像,超分辨率图像的初始值为双线性插值放大后的图像;
10)使用鲁棒性强的光流法来估计各单幅超分辨率图像和待处理单幅超分辨率图像之间的运动位移,作为各高分辨率图像和目标高分辨率图像之间的位移初始值;
11)建立当前窗口内的各低分辨率图像与目标高分辨率帧之间的关系:目标高分辨率图像通过运动位移/模糊/下采样/压缩/解压缩来得到当前窗口内的各低分辨率图像;
12)由当前窗口内的多帧暂时的单幅超分辨率图像,结合7)中的先验概率,使用IRLS(迭代重加权最小二乘法)来构建目标函数,从而削弱离群点和噪声的影响;
13)使用循环坐标下降来得到最终的超分辨率图像:先假设超分辨率图像已知,使用梯度下降法分别更新各运动位移;然后在求得的位移基础上,用梯度下降法重新求超分辨率图像,如此循环迭代,直至收敛;
本方法只超分辨率亮度分量,色度和色差分量只是双线性插值所得。
本发明涉及一种适用压缩域的视频超分辨率方法,这种方法充分利用了压缩码流中的信息,且同时解决校准、插值、复原和后处理等问题。通过对从自然场景到压缩视频的过程进行建模,使用IRLS(迭代重加权最小二乘法)来构建目标函数,从而削弱离群点和噪声的影响,使得到的超分辨率图像较少引入新的噪声,且抑制编码噪声和“振铃”效应。因此本方法不仅适用于帧间运动较简单的情况,也适用于运动较复杂的情况。
附图说明:
下面结合附图和实施例对本发明作进一步说明。
图1是本发明压缩域的视频超分辨率方法的流程图。
图2是图1中活动容器内各单副超分辨率图像的流程图。
具体实施方式:
参照附图,本发明的基于压缩域的视频超分辨率方法,按以下步骤进行:
1.解压缩
先将输入的低分辨率压缩视频解压缩,得到低分辨率的视频图像,量化矩阵,量化后的变换域系数,运动补偿后的预测视频图像,以及运动矢量等信息。
2.对从自然场景到压缩视频的过程进行建模
建立低分辨率图像和相应高分辨率图像之间的关系:高分辨率图像通过模糊/下采样/压缩/解压缩得到低分辨率图像。记解压后的第l帧低分辨率图像图像为yl,相应高分辨率图像为fl,模糊函数为H,下采样矩阵为A,在此过程中的量化噪声记为εQ,l,则yl=AHfl+εQ,l。
3.建模量化噪声
在高分辨率图像已知的情况下,得到低分辨率图像的概率使用量化噪声的分布来建模:符合高斯分布εQ,l~N(0,KQ,l)。记空间域量化噪声的协方差为KQ,l,则
4.步骤3建模中空间域量化噪声的协方差矩阵
空间域量化噪声的协方差矩阵与变换域量化噪声的协方差矩阵之间的关系可以表示成:式中T表示DCT变化,KTransform,l表示变换域协方差矩阵。KTransform,l为对角矩阵,每个对角元素为方差 其中ql为量化步长。
5.建模运动估计引入的噪声
在高分辨率图像已知的情况下,得到预测视频图像的概率使用运动估计引入噪声的分布来建模:符合高斯分布ηMV,l~N(0,KMV,l)。记空间域运动估计引入噪声的协方差为KMV,l,则
6.建模空间域运动估计噪声的协方差矩阵
空间域运动估计噪声的协方差矩阵与变换域运动估计噪声的协方差矩阵之间的关系可以表示成: KTransform,MVl表示变换域协方差矩阵。KTransform,MVl为对角矩阵,每个对角元素为方差 其中cl为量化后的变换域系数。
7.建模高分辨率图像的先验概率
使用非线性最小二乘拟合法来求出相应的系数c,α和s,使得得到的拉普拉斯分布尽可能和低分辨图像的梯度分布一致。
使超分辨率图像的梯度分布尽可能接近解压缩后的低分辨率图像的梯度分布,而且超分辨率图像应该是平滑的,没有“块效应”。因此有
其中,Q1为线性高通滤波算子(通常取离散二维拉普拉斯算子),来惩罚不光滑的超分辨图像估计,Q2是线性高通滤波算子(通常取边界差值),来惩罚块边界的超分辨图像估计,λ1,λ2,λ3控制上述各项各自的重要程度。
8.使用贝叶斯模型MAP(最大后验概率)框架估计暂时的单幅超分辨率图像
使用贝叶斯模型MAP(最大后验概率)框架来从压缩视频中估计暂时的单幅超分辨率图像,即
9.使用梯度下降来求解得到暂时的单幅超分辨率图像
超分辨率图像的初始值为双线性插值放大后的图像,使用梯度下降来求解得到暂时的单幅超分辨率图像。
10.使用光流法得到各单幅超分辨率图像和待处理单幅超分辨率图像之间的运动位移
使用鲁棒性强的光流法来估计当前窗口内各单幅超分辨率图像和待处理单幅超分辨率图像之间的运动位移,作为各高分辨率图像和目标高分辨率图像之间的位移初始值。
11.建立目标窗口内的各帧低分辨率图像与目标高分辨率帧之间的关系
从目标帧第k帧高分辨率图像与第l帧高分辨率图像的运动矢量矩阵记为C(dl,k),可建立目标窗口内的各帧低分辨率图像与目标高分辨率帧之间的关系如下:
yl=AHC(dl,k)fk+nl,k
12.使用IRLS(迭代重加权最小二乘法)来构建鲁棒性强的目标函数第l帧的残差记为rl,不相关权重记为vl,l=k-TB,...,k+TF,其中TB,TF分别表示用于重建目标帧的时间轴上向前向后的帧数(相对目标帧)。
τ为阈值,用于排除离群点,参数ε与窗口内各帧的相似度有关,通常相似度越高,ε越小。当活动窗口内所有帧的不相关权重都为0时,将目标帧对应的不相关权重置为1。而相关有关矩阵记为Wl,
因此,再结合8)中的先验概率,最后得到如下目标函数:
13.使用循环坐标下降来得到最终的超分辨率图像。
最后,通过循环坐标下降法来求得最优解。先假设超分辨率图像fk已知,使用梯度下降法分别更新各位移dl,k;然后在求得的dl,k的基础上,用梯度下降法重新求fk,如此循环迭代,直至收敛。
应该理解到的是:上述实施例只是对本发明的说明,而不是对本发明的限制,任何不超出本发明实质精神范围内的发明创造,均落入本发明的保护范围之内。
Claims (1)
1.一种适用于压缩域的视频超分辨率方法,其特征在于包括如下具体步骤:
1)对输入的压缩视频进行解压缩,得到低分辨率的视频图像、量化矩阵、量化后的变换域系数、运动补偿后的预测视频图像、以及运动矢量信息;
2)对从自然场景到压缩视频的过程进行建模,建立低分辨率图像和相应高分辨率图像之间的关系:高分辨率图像通过模糊、下采样、压缩和解压缩得到低分辨率图像;建立运动补偿后的预测视频图像与对应高分辨率图像间的关系;
3)由上面建立的低分辨率图像和相应高分辨率图像之间的关系可以建模条件概率:在高分辨率图像已知的情况下,得到低分辨率图像的概率使用量化噪声的分布来建模,所述量化噪声的分布符合高斯分布;
4)对上面量化噪声的协方差矩阵进行建模:先求解变换域的协方差矩阵:由量化矩阵可以得到,再将变换域的协方差矩阵转换成空间域的协方差矩阵;
5)对在高分辨率图像已知的情况下,得到预测视频图像的概率使用运动估计引入量化噪声的分布来建模,所述运动估计引入噪声的分布符合高斯分布;
6)对上面运动估计引入量化噪声的协方差矩阵进行建模,先求解变换域的协方差矩阵:由量化矩阵和变换域系数可以得到,再将变换域的协方差矩阵转换成空间域的协方差矩阵;
7)建模高分辨率图像的先验概率:对图像的梯度分布用广义拉普拉斯分布来拟合,使超分辨率图像的梯度分布尽可能接近解压缩后的低分辨率图像的梯度分布,而且超分辨率图像应该是平滑的,没有“块效应”;
8)使用贝叶斯模型MAP框架估计暂时的单幅超分辨率图像;
9)使用梯度下降来求解得到暂时的单幅超分辨率图像,超分辨率图像的初始值为双线性插值放大后的图像;
10)使用鲁棒性强的光流法来估计各单幅超分辨率图像和待处理单幅超分辨率图像之间的运动位移,作为各高分辨率图像和目标高分辨率图像之间的位移初始值;
11)建立当前窗口内的各低分辨率图像与目标高分辨率帧之间的关系:目标高分辨率图像通过运动位移/模糊/下采样/压缩/解压缩来得到当前窗口内的各低分辨率图像;
12)由当前窗口内的多帧暂时的单幅超分辨率图像,结合7)中的先验概率,使用IRLS(迭代重加权最小二乘法)来构建目标函数,从而削弱离群点和噪声的影响;
13)使用循环坐标下降来得到最终的超分辨率图像:先假设超分辨率图像已知,使用梯度下降法分别更新各运动位移;然后在求得的位移基础上,用梯度下降法重新求超分辨率图像,如此循环迭代,直至收敛;
本方法只超分辨率亮度分量,色度和色差分量只是双线性插值所得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910153544 CN101674478B (zh) | 2009-10-19 | 2009-10-19 | 基于压缩域的视频超分辨率方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910153544 CN101674478B (zh) | 2009-10-19 | 2009-10-19 | 基于压缩域的视频超分辨率方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101674478A CN101674478A (zh) | 2010-03-17 |
CN101674478B true CN101674478B (zh) | 2012-09-19 |
Family
ID=42021430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200910153544 Expired - Fee Related CN101674478B (zh) | 2009-10-19 | 2009-10-19 | 基于压缩域的视频超分辨率方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101674478B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101917624B (zh) * | 2010-07-26 | 2013-04-03 | 清华大学 | 一种高分辨率视频图像重建方法 |
CN101916448A (zh) * | 2010-08-09 | 2010-12-15 | 云南清眸科技有限公司 | 一种基于贝叶斯框架及lbp的运动目标检测方法 |
CN102479380B (zh) * | 2010-11-25 | 2014-01-15 | 北京大学 | 一种提高图像分辨率的图像插值方法及装置 |
CN102013094B (zh) * | 2010-11-25 | 2013-01-02 | 上海合合信息科技发展有限公司 | 提高文本图像清晰度的方法及系统 |
CN102779335B (zh) * | 2011-05-13 | 2015-07-08 | 华晶科技股份有限公司 | 数字图像处理装置及其处理方法 |
JP2012244395A (ja) * | 2011-05-19 | 2012-12-10 | Sony Corp | 学習装置および方法、画像処理装置および方法、プログラム、並びに記録媒体 |
KR102094557B1 (ko) * | 2011-12-19 | 2020-03-27 | 소니 주식회사 | 화상 처리 장치 및 방법 |
CN105931189B (zh) * | 2016-05-10 | 2020-09-11 | 浙江大学 | 一种基于改进超分辨率参数化模型的视频超分辨率方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1578449A (zh) * | 2003-06-27 | 2005-02-09 | 成津C&C株式会社 | 从低分辨率压缩图像恢复并重构超分辨率图像的方法 |
CN101383898A (zh) * | 2007-09-07 | 2009-03-11 | 索尼株式会社 | 图像处理设备、图像处理方法和计算机程序 |
-
2009
- 2009-10-19 CN CN 200910153544 patent/CN101674478B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1578449A (zh) * | 2003-06-27 | 2005-02-09 | 成津C&C株式会社 | 从低分辨率压缩图像恢复并重构超分辨率图像的方法 |
CN101383898A (zh) * | 2007-09-07 | 2009-03-11 | 索尼株式会社 | 图像处理设备、图像处理方法和计算机程序 |
Non-Patent Citations (1)
Title |
---|
JP特开2005-150808A 2005.06.09 |
Also Published As
Publication number | Publication date |
---|---|
CN101674478A (zh) | 2010-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101674478B (zh) | 基于压缩域的视频超分辨率方法 | |
Jin et al. | A flexible deep CNN framework for image restoration | |
JP6905093B2 (ja) | 映像コーディングにおける動き補償予測のオプティカルフロー推定 | |
US20240195979A1 (en) | BLOCK-BASED Optical Flow Estimation FOR MOTION COMPENSATED PREDICTION IN VIDEO CODING | |
US11284107B2 (en) | Co-located reference frame interpolation using optical flow estimation | |
JP5727873B2 (ja) | 動きベクトル検出装置、符号化装置、及びこれらのプログラム | |
CN103250182A (zh) | 高动态范围视频色调映射 | |
US9641795B2 (en) | Method and apparatus for reframing and encoding a video signal | |
DE19825042A1 (de) | Verfahren zur Bewegungsvektorcodierung bei MPEG-4 | |
Gunturk et al. | Multiframe resolution-enhancement methods for compressed video | |
CN101247489A (zh) | 一种用于数字电视细节实时重现的方法 | |
WO2019056898A1 (zh) | 一种编码、解码方法及装置 | |
CN107155112A (zh) | 一种多假设预测的压缩感知视频处理方法 | |
Agustsson et al. | Extreme learned image compression with gans | |
CN116437102B (zh) | 可学习通用视频编码方法、系统、设备及存储介质 | |
CN108289224A (zh) | 一种视频帧预测方法、装置及自动补偿神经网络 | |
US20110090963A1 (en) | Method and apparatus for zoom motion estimation | |
CN114202463A (zh) | 面向云端融合的视频超分辨率方法及系统 | |
CN117750020A (zh) | 可学习视频编码方法、系统、设备及存储介质 | |
CN101783956B (zh) | 基于时空邻居信息的后向预测方法 | |
Dolly et al. | Performance enhanced spatial video compression using global affine frame reconstruction | |
US11917128B2 (en) | Motion field estimation based on motion trajectory derivation | |
US20200314451A1 (en) | A New Pyramid Algorithm For Video Compression And Video Analysis | |
Rüfenacht et al. | Hierarchical anchoring of motion fields for fully scalable video coding | |
Bosch et al. | Video coding using motion classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120919 |