CN103813149A - 一种编解码系统的图像与视频重构方法 - Google Patents

一种编解码系统的图像与视频重构方法 Download PDF

Info

Publication number
CN103813149A
CN103813149A CN201210460004.9A CN201210460004A CN103813149A CN 103813149 A CN103813149 A CN 103813149A CN 201210460004 A CN201210460004 A CN 201210460004A CN 103813149 A CN103813149 A CN 103813149A
Authority
CN
China
Prior art keywords
visual point
virtual visual
point image
filter coefficient
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210460004.9A
Other languages
English (en)
Other versions
CN103813149B (zh
Inventor
张云
朱林卫
陈前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201210460004.9A priority Critical patent/CN103813149B/zh
Publication of CN103813149A publication Critical patent/CN103813149A/zh
Application granted granted Critical
Publication of CN103813149B publication Critical patent/CN103813149B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种编解码系统的图像与视频重构方法,主要包括以下步骤:S1、利用采集的原始深度图像和原始彩色图像生成参考虚拟视点图像序列;S2、对原始深度图像和原始彩色图像进行编码形成压缩视频流;S3、对压缩视频流进行解码,得到失真图像,并采用失真图像绘制生成第一失真虚拟视点图像序列。本发明不仅能够有效克服传统方案所存在的全局深度值失真,满足人们的现实需求,而且与现有技术相比,其PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)可提高约为0.3dB~1.2dB,BDPSNR可提高约为0.4dB~1.0dB。

Description

一种编解码系统的图像与视频重构方法
技术领域
本发明涉及一种图形处理方法,具体是指一种编解码系统的图像与视频重构方法。
背景技术
三维视频(3 Dimensional Video,3DV)是一种新兴的媒体,同时也是当今媒体发展的必然趋势,它能够使观众自由的选择观看的视角,真切的感受三维(3D)立体世界。在三维视频技术中,基于深度的虚拟视点绘制技术已被动态图片专家组组织确认为三维视频系统中虚拟视点绘制的候选方案。该基于深度的虚拟视点绘制技术核心思想为:(1)利用深度信息,将参考图像上所有的像素点重新映射到它们对应的3维空间中;(2)这些3维空间点再被映射到目标图像(虚拟视点图像)平面。这个从2维到3维的重新映射以及从3维再到2维的映射称为三维图像变换(3D Image Warping)。
深度信息在此项技术中是非常关键的,它的准确性与否决定了绘制过程中映射坐标位置是否准确。但是,为了能够减少信道传输过程中的数据量,对于深度信息,也是需要经过编码。尽管研究人员采用各种对于深度的编码方式,如对深度视频信息编码过程中采用加权模式的滤波、利用相关的彩色视频编码过程中的信息来对深度视频进行编码以提高率失真性能,用来降低深度信息在编码过程中造成的失真,可是编码失真问题仍是不可避免的。这种失真对于基于深度的虚拟视点绘制技术而言是较为敏感的,深度值的失真会引起绘制过程中映射坐标位置的错误,造成虚拟视点图像的几何失真,最终影响虚拟视点图像的主客观质量。
针对深度图编码失真问题,国内外已有学者对此进行了研究。Oh等人提出了对于编码失真的深度对象边缘区域进行重建滤波,以恢复这一区域内失真的深度值。该方法考虑了局部邻域区域内的直方图信息、距离相关性信息及深度值差异信息,以优化调整深度图中对象边界区域内失真的深度值,这种方法在一定程度上提高了虚拟视点绘制图像的质量,但是该方法只调整边界区域的深度值失真,随着编码量化参数(QP)的增大,编码失真区域也随之扩散,所以该方法不能够有效的恢复全局的深度值失真。Yuan等人提出了在发送端传输滤波器系数,在客户端利用维纳滤波器(wiener filter)对编码失真图像进行滤波,以得到与参考图像接近的虚拟视点图像的框架,该方法有效的提高了虚拟视点图像的质量。但是,维纳滤波器只利用了前向的信号信息来预测当前的信息,没有考虑二维图像中周围邻域内的空域相关信息;同时在计算所需传输的滤波器系数时,每一帧图像都需要有相关的滤波器系数,在一定程度上增加了传输的数据量。
因此,目前所采用的两种方法均不能从根本上解决深度图编码失真的问题,不能满足人们的使用需求。
发明内容
本发明的目的在于克服目前针对编码后的深度图像序列中深度值的失真在绘制过程造成的映射错误,对绘制得到的虚拟视点图像序列质量产生不良影响的缺陷,提供一种能有效解决该问题的编码系统的图像与视频重构方法。
本发明通过以下技术方案来实现:一种编解码系统的图像与视频重构方法,其特征在于,主要包括以下步骤:
S1、利用采集的原始深度图像和原始彩色图像生成参考虚拟视点图像序列;
S2、对原始深度图像和原始彩色图像进行编码形成压缩视频流;
S3、对形成的压缩视频流进行解码,得到失真图像,并采用失真图像绘制生成第一失真虚拟视点图像序列;
S4、将参考虚拟视点图像序列和第一失真虚拟视点图像序列按照时间方向的顺序对应进行组层划分;
S5、设置滤波器,并带入组层进行计算以得到滤波器系数;
S6、发送端传输滤波器系数与压缩视频流至客户端;
S7、客户端对压缩视频流进行解码再次得到失真图像,并采用失真图像绘制生成第二失真虚拟视点图像序列,利用滤波器系数对第二失真虚拟视点图像序列滤波,重构得到第三失真虚拟视点图像。
进一步地,步骤S4中所述的“进行组层划分”是指系统将参考虚拟视点图像序列和第一失真虚拟视点图像序列分解为组层、帧层及块层;其中,帧层是指在同一时刻由一帧参考虚拟视点图像序列与一帧第一失真虚拟视点图像序列组成,组层则是由连续的两个以上的帧层组成,而一帧图像则由若干Wb×Hb尺寸的块层组成。
为了较好的实现本发明,步骤S5所述的“设置滤波器,并带入组层进行计算以得到滤波器系数”具体包括以下步骤:
S51、设计线性加权滤波器;
S52、以参考虚拟视点图像序列与第一失真虚拟视点图像序列差异度最小为代价函数,计算出滤波器系数矩阵;
S53、进行滤波器系数最优矩阵估计;
S54、滤波器系数矩阵更新。
进一步地,步骤S53所述的进行滤波器系数最优矩阵估计包括以下步骤:
a1、假设设计的滤波器的窗口大小为M×N,M,N为奇数,其滤波系数矩阵表示为
C = c ( 0,0 ) c ( 0,1 ) . . . c ( 0 , N - 1 ) c ( 1,0 ) c ( 1,1 ) . . . c ( 1 , N - 1 ) . . . . . . . . . . . . c ( M - 1,0 ) c ( M - 1,1 ) . . . c ( M - 1 , N - 1 ) ;
其中c(i,j)为滤波器系数矩阵(i,j)位置的元素,i∈[0,M-1],j∈[0,N-1];
a2、假设在参考虚拟视点图像序列中第k帧参考虚拟视点图像记为Dk,第一失真虚拟视点图像序列中第k帧失真虚拟视点图像记为
Figure BSA00000806068500032
第一失真虚拟视点图像序列经过滤波重建后的第k帧重建虚拟视点图像记为
Figure BSA00000806068500033
图像尺寸大小为W×H,W为水平分辨率,H为竖直分辨率;
a3、分别将参考虚拟视点图像Dk和失真虚拟视点图像
Figure BSA00000806068500041
划分为尺寸为Wb×Hb的Bn个块,从左到右,从上到下,依次对这些块进行标号,则每个块可以用(i1,i2)索引,参考虚拟视点图像Dk,失真虚拟视点图像
Figure BSA00000806068500042
和重建虚拟视点图像
Figure BSA00000806068500043
在(i1,i2)位置的块分别记为Bk(i1,i2),
Figure BSA00000806068500045
i1和i2分别为水平方向和竖直方向的块索引号,K1和K2为一帧图像中水平和垂直方向的分块个数,K1=W/Wb,K2=H/Hb,0≤i1≤K1-1,0≤i2≤K2-1,K1×K2=Bn
a4、以Dk(i,j)表示参考虚拟视点图像序列中第k帧图像Dk的Bk(i1,i2)块中像素位置(i,j)的亮度Y分量像素值,即Dk(j,j)∈Bk(i1,i2),
Figure BSA00000806068500046
表示失真虚拟视点图像序列中第k帧图像
Figure BSA00000806068500047
Figure BSA00000806068500048
中像素位置(i,j)的亮度Y分量像素值,即
Figure BSA00000806068500049
Figure BSA000008060685000410
表示第一失真虚拟视点图像序列经过滤波重建后的第k帧图像的
Figure BSA000008060685000411
块中像素位置(i,j)的亮度Y分量像素值,即
Figure BSA000008060685000412
由此,
Figure BSA000008060685000413
可以表示为滤波器系数矩阵C(i1,i2)与第一失真虚拟视点图像序列的像素
Figure BSA000008060685000414
的函数关系式,即
D ~ k ( i , j ) = f 1 ( C ( i 1 , i 2 ) , D k d ( i , j ) )
其中(i,j)是块(i1,i2)中的一个像素位置,Ck(i1,i2)表示第k帧图像中第(i1,i2)块的滤波器系数矩阵;
a5、记Φ(i,j)表示Dk(i,j)与
Figure BSA000008060685000416
的差异度,
Figure BSA000008060685000417
a6、求取当前块Bk(i1,i2)中差异值的和,以ΦB(i1,i2)表示,即:
Φ B ( i 1 , i 2 ) = Σ i = 0 W b Σ j = 0 H b Φ ( i , j ) ;
a7、采用最优化方法求解出第k帧图像中第(i1,i2)的滤波器系数矩阵Ck(i1,i2)最优解C*k(i1,i2),即当满足ΦB(i1,j2)最小时的滤波器系数最优解C*k(i1,i2)可以表示为
C * k ( i 1 , i 2 ) = arg min C k ( i 1 , i 2 ) Φ B ( i 1 , i 2 ) ,
a8、之后回到a4,计算出第k帧中其他块的滤波器系数最优矩阵,直到完成第k帧中所有块的滤波器系数矩阵的计算。
进一步地,步骤a4滤波器系数矩阵C(i1,i2)与第一失真虚拟视点图像序列的像素的函数关系式为
D ~ k ( i , j ) = Σ l = - w / 2 l = w / 2 Σ m = - w / 2 m = w / 2 c ( l , m ) k ( i 1 , i 2 ) × D k d ( i + l , j + m ) ,
其中(i,j)是块(i1,i2)中的一个像素位置,
Figure BSA00000806068500053
表示第k帧图像中第(i1,i2)块的滤波器系数矩阵Ck(i1,i2)中相应位置(l,m)的系数值。
进一步地,步骤a5所述函数关系f2表示为
Φ ( i , j ) = w ij | D k ( i , j ) - D ~ k ( i , j ) | β
其中wij为加权系数,一般为[0,1]范围,β为指数。
进一步地,步骤S54所述的滤波器系数矩阵更新包括以下步骤:
b1、假设参考虚拟视点图像序列为{Dk},失真虚拟视点图像序列为
Figure BSA00000806068500055
将参考图像序列{Dk}和失真图像序列
Figure BSA00000806068500056
按照时间方向的顺序排列,k为索引序号,每个序列共Nf帧,1≤k≤Nf
b2、按照步骤(S53)计算得到所有{Dk}对应滤波器系数矩阵,即每个块Bk(i1,i2)对应一个最优滤波器系数矩阵C(i1,i2),共Nf×Bn个;
b3、将k×Bn个滤波器系数矩阵划分为Gn个单元,1≤Gn≤Nf×Bn,每个单元有g(i)个滤波系数矩阵融合为新滤波器系数矩阵
Figure BSA00000806068500057
共Gn个,
Figure BSA00000806068500058
从而完成Nf帧的滤波器系数矩阵更新。
进一步地,b3中所述单元的划分为组、帧或块所组成的任意一种组合方式,且其所述的滤波器系数矩阵融合是指:新滤波器系数矩阵
Figure BSA00000806068500059
中的(l,m)位置的系数值采用滤波器系数矩阵C(i1,i2)中的(l,m)位置的系数值加权平均计算得到
c ‾ ( l , m ) ( i 1 , i 2 ) = Σ n = 1 g ( i ) ω n × c ( l , m ) ( i 1 , i 2 ) Σ n = 1 g ( i ) ω n
其中ωn为加权系数。
进一步地,所述失真图像为失真深度图与失真彩色图、或失真深度图和原始彩色图、或者原始深度图与失真彩色图。
本发明与现有技术相比,具有以下优点及有益效果:
1、本发明能够有效克服传统方案所存在的全局深度值失真,满足人们的现实需求。
2、本发明与现有技术相比,其PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)可提高约为0.3dB~1.2dB,BDPSNR可提高约为0.4dB~1.0dB。
附图说明
图1为本发明的整体流程结构示意图。
图2为本发明的组层划分结构示意图。
图3为本发明对“Ballet”序列,量化参数QP=24的实验对比结果。
图4为本发明对“Bookarrival”序列,量化参数QP=24的实验对比结果。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
本实施例选取微软研究院(MSR)提供的视频测试序列“Ballet”和“Breakdancers”,德国HHI提供的视频测试序列“Bookarrival”和“Alt-Moabit”,日本Nagoya大学提供的视频测试序列“Balloons”和“Kendo”,韩国ETRI提供的视频测试序列“Lovebirdl”,其图像尺寸都为1024×768。
如图1所示,本发明在运行时,发送端系统进行步骤S1,即利用采集的原始深度图像和原始彩色图像生成参考虚拟视点图像序列。
步骤S2,对原始深度图像和原始彩色图像进行编码形成压缩视频流。
步骤S3,对压缩视频流进行解码,得到失真图像,并采用失真图像绘制生成第一失真虚拟视点图像序列。所述失真图像为失真深度图与失真彩色图、或失真深度图和原始彩色图、或者原始深度图与失真彩色图。
步骤S4,将参考虚拟视点图像序列和第一失真虚拟视点图像序列按照时间方向的顺序对应进行组层划分。所谓的“进行组层划分”是指系统将参考虚拟视点图像序列和第一失真虚拟视点图像序列分解为组层、帧层及块层;其中,帧层是指在同一时刻由一帧参考虚拟视点图像序列与一帧第一失真虚拟视点图像序列组成,组层则是由连续的两个以上的帧层组成,而一帧图像则由若干Wb×Hb尺寸的块层组成。其结构如图2所示。
步骤S5,设置滤波器,并带入组层进行计算以得到滤波器系数;其具体包括以下步骤:S51、设计线性加权滤波器;S52、以参考虚拟视点图像序列与第一失真虚拟视点图像序列差异度最小为代价函数,计算出滤波器系数矩阵;S53、进行滤波器系数最优矩阵估计;S54、滤波器系数矩阵更新。
其中,所谓的进行滤波器系数最优矩阵估计包括以下步骤:
a1、假设设计的滤波器的窗口大小为M×N,M,N为奇数,其滤波系数矩阵表示为
C = c ( 0,0 ) c ( 0,1 ) . . . c ( 0 , N - 1 ) c ( 1,0 ) c ( 1,1 ) . . . c ( 1 , N - 1 ) . . . . . . . . . . . . c ( M - 1,0 ) c ( M - 1,1 ) . . . c ( M - 1 , N - 1 ) ;
其中c(i,j)为滤波器系数矩阵(i,j)位置的元素,i∈[0,M-1],j∈[0,N-1];
a2、假设在参考虚拟视点图像序列中第k帧参考虚拟视点图像记为Dk,第一失真虚拟视点图像序列中第k帧失真虚拟视点图像记为
Figure BSA00000806068500072
第一失真虚拟视点图像序列经过滤波重建后的第k帧重建虚拟视点图像记为
Figure BSA00000806068500073
图像尺寸大小为W×H,W为水平分辨率,H为竖直分辨率;
a3、分别将参考虚拟视点图像Dk和失真虚拟视点图像
Figure BSA00000806068500074
划分为尺寸为Wb×Hb的Bn个块,从左到右,从上到下,依次对这些块进行标号,则每个块可以用(i1,i2)索引,参考虚拟视点图像Dk,失真虚拟视点图像
Figure BSA00000806068500081
和重建虚拟视点图像
Figure BSA00000806068500082
在(i1,i2)位置的块分别记为Bk(i1,i2),
Figure BSA00000806068500083
i1和i2分别为水平方向和竖直方向的块索引号,K1和K2为一帧图像中水平和垂直方向的分块个数,K1=W/Wb,K2=H/Hb,0≤i1≤K1-1,0≤i2≤K2-1,K1×K2=Bn
a4、以Dk(i,j)表示参考虚拟视点图像序列中第k帧图像Dk的Bk(i1,i2)块中像素位置(i,j)的亮度Y分量像素值,即Dk(i,j)∈Bk(i1,i2),表示失真虚拟视点图像序列中第k帧图像
Figure BSA00000806068500087
中像素位置(i,j)的亮度Y分量像素值,即
Figure BSA00000806068500088
Figure BSA00000806068500089
表示第一失真虚拟视点图像序列经过滤波重建后的第k帧图像的
Figure BSA000008060685000810
块中像素位置(i,j)的亮度Y分量像素值,即
Figure BSA000008060685000811
由此,可以表示为滤波器系数矩阵C(i1,i2)与第一失真虚拟视点图像序列的像素
Figure BSA000008060685000813
的函数关系式,即
D ~ k ( i , j ) = f 1 ( C ( i 1 , i 2 ) , D k d ( i , j ) )
其中(i,j)是块(i1,i2)中的一个像素位置,Ck(i1,i2)表示第k帧图像中第(i1,i2)块的滤波器系数矩阵;
a5、记Φ(i,j)表示Dk(i,j)与
Figure BSA000008060685000815
的差异度,
a6、求取当前块Bk(i1,i2)中差异值的和,以ΦB(i1,i2)表示,即:
Φ B ( i 1 , i 2 ) = Σ i = 0 W b Σ j = 0 H b Φ ( i , j ) ;
a7、采用最优化方法求解出第k帧图像中第(i1,i2)的滤波器系数矩阵Ck(i1,i2)最优解C*k(i1,i2),即当满足ΦB(i1,i2)最小时的滤波器系数最优解C*k(i1,i2)可以表示为
C * k ( i 1 , i 2 ) = arg min C k ( i 1 , i 2 ) Φ B ( i 1 , i 2 ) ,
a8、之后回到a4,计算出第k帧中其他块的滤波器系数最优矩阵,直到完成第k帧中所有块的滤波器系数矩阵的计算。
所述的滤波器系数矩阵更新则包括以下步骤:
b1、假设参考虚拟视点图像序列为{Dk},失真虚拟视点图像序列为
Figure BSA00000806068500091
将参考图像序列{Dk}和失真图像序列
Figure BSA00000806068500092
按照时间方向的顺序排列,k为索引序号,每个序列共Nf帧,1≤k≤Nf
b2、按照步骤(S53)计算得到所有{Dk}对应滤波器系数矩阵,即每个块Bk(i1,i2)对应一个最优滤波器系数矩阵C(i1,i2),共Nf×Bn个;
b3、将k×Bn个滤波器系数矩阵划分为Gn个单元,1≤Gn≤Nf×Bn,每个单元有g(i)个滤波系数矩阵融合为新滤波器系数矩阵
Figure BSA00000806068500093
共Gn个,
Figure BSA00000806068500094
从而完成Nf帧的滤波器系数矩阵更新。所述单元的划分为组、帧或块所组成的任意一种组合方式。
步骤S6,发送端传输滤波器系数与压缩视频流至客户端。
步骤S7,客户端对压缩视频流进行解码再次得到失真图像,并采用失真图像绘制生成第二失真虚拟视点图像序列,利用滤波器系数对第二失真虚拟视点图像序列滤波,重构得到第三失真虚拟视点图像。
为了确保实际的运行效果,本实施例中步骤a4所述的滤波器系数矩阵C(i1,i2)与第一失真虚拟视点图像序列的像素
Figure BSA00000806068500095
的函数关系式可以表示为
D ~ k ( i , j ) = Σ l = - w / 2 l = w / 2 Σ m = - w / 2 m = w / 2 c ( l , m ) k ( i 1 , i 2 ) × D k d ( i + l , j + m ) .
其中(i,j)是块(i1,i2)中的一个像素位置,
Figure BSA00000806068500097
表示第k帧图像中第(i1,i2)块的滤波器系数矩阵Ck(i1,i2)中相应位置(l,m)的系数值。
而步骤a5中的函数关系f2表示为
Φ ( i , j ) = w ij | D k ( i , j ) - D ~ k ( i , j ) | β
其中wij为加权系数,一般为[0,1]范围,β为指数,本实施例中的wij=1,β=1。
步骤b3中所述的滤波器系数矩阵融合是指:新滤波器系数矩阵
Figure BSA00000806068500101
中的(l,m)位置的系数值
Figure BSA00000806068500102
采用滤波器系数矩阵C(i1,i2)中的(l,m)位置的系数值加权平均计算得到
c ‾ ( l , m ) ( i 1 , i 2 ) = Σ n = 1 g ( i ) ω n × c ( l , m ) ( i 1 , i 2 ) Σ n = 1 g ( i ) ω n
其中ωn为加权系数。
以选取的“Ballet”、“Breakdancers”、“Bookarrival”、“Alt-Moabit”、“Balloons”、“Kendo”及“Lovebirdl”作为视频测试序列进行数据测试,其结果如图3、4所示。其中深度图像序列编码时的量化参数(QP)分别选取24、28、32和36,其具体数据见表1~表7所示。
表1
Figure BSA00000806068500104
表2
Figure BSA00000806068500105
表3
Figure BSA00000806068500106
Figure BSA00000806068500111
表4
Figure BSA00000806068500112
表5
Figure BSA00000806068500113
表6
Figure BSA00000806068500114
表7
Figure BSA00000806068500115
从测试数据可以得出:以与参考图像序列的峰值信噪比和各量化参数下的两条率失真曲线间的平均峰值信噪比作为客观评价值,与失真序列相比,本发明的PSNR可提高约为0.3dB~1.2dB,BDPSNR可提高约为0.4dB~1.0dB;与Yuan的方法的对比,本发明的PSNR可提高约为0.1dB~1.0dB,BDPSNR可提高约为0.14dB~0.6dB。
如上所述,便可较好的实现本发明。

Claims (10)

1.一种编解码系统的图像与视频重构方法,其特征在于:主要包括以下步骤:
S1、利用采集的原始深度图像和原始彩色图像生成参考虚拟视点图像序列;
S2、对原始深度图像和原始彩色图像进行编码形成压缩视频流;
S3、对压缩视频流进行解码,得到失真图像,并采用失真图像绘制生成第一失真虚拟视点图像序列;
S4、将参考虚拟视点图像序列和第一失真虚拟视点图像序列按照时间方向的顺序对应进行组层划分;
S5、设置滤波器,并带入组层进行计算以得到滤波器系数;
S6、发送端传输滤波器系数与压缩视频流至客户端;
S7、客户端对压缩视频流进行解码再次得到失真图像,并采用失真图像绘制生成第二失真虚拟视点图像序列,利用滤波器系数对第二失真虚拟视点图像序列滤波,重构得到第三失真虚拟视点图像。
2.根据权利要求1所述的一种编码系统的图像与视频重构方法,其特征在于:步骤S4中所述的“进行组层划分”是指系统将参考虚拟视点图像序列和第一失真虚拟视点图像序列分解为组层、帧层及块层;其中,帧层是指在同一时刻由一帧参考虚拟视点图像序列与一帧第一失真虚拟视点图像序列组成,组层则是由连续的两个以上的帧层组成,而一帧图像则由若干Wb×Hb尺寸的块层组成。
3.根据权利要求2所述的一种编码系统的图像与视频重构方法,其特征在于,步骤S5所述的“设置滤波器,并带入组层进行计算以得到滤波器系数”具体包括以下步骤:
S51、设计线性加权滤波器;
S52、以参考虚拟视点图像序列与第一失真虚拟视点图像序列差异度最小为代价函数,计算出滤波器系数矩阵;
S53、进行滤波器系数最优矩阵估计;
S54、滤波器系数矩阵更新。
4.根据权利要求3所述的一种编码系统的图像与视频重构方法,其特征在于,步骤S53所述的进行滤波器系数最优矩阵估计包括以下步骤:
a1、假设设计的滤波器的窗口大小为M×N,M,N为奇数,其滤波系数矩阵表示为
C = c ( 0,0 ) c ( 0,1 ) . . . c ( 0 , N - 1 ) c ( 1,0 ) c ( 1,1 ) . . . c ( 1 , N - 1 ) . . . . . . . . . . . . c ( M - 1,0 ) c ( M - 1,1 ) . . . c ( M - 1 , N - 1 ) ;
其中c(i,j)为滤波器系数矩阵(i,j)位置的元素,i∈[0,M-1],j∈[0,N-1];
a2、假设在参考虚拟视点图像序列中第k帧参考虚拟视点图像记为Dk,第一失真虚拟视点图像序列中第k帧失真虚拟视点图像记为
Figure FSA00000806068400022
第一失真虚拟视点图像序列经过滤波重建后的第k帧重建虚拟视点图像记为
Figure FSA00000806068400023
图像尺寸大小为W×H,W为水平分辨率,H为竖直分辨率;
a3、分别将参考虚拟视点图像Dk和失真虚拟视点图像划分为尺寸为Wb×Hb的Bn个块,从左到右,从上到下,依次对这些块进行标号,则每个块可以用(i1,i2)索引,参考虚拟视点图像Dk,失真虚拟视点图像
Figure FSA00000806068400025
和重建虚拟视点图像
Figure FSA00000806068400026
在(i1,i2)位置的块分别记为Bk(i1,i2),
Figure FSA00000806068400027
Figure FSA00000806068400028
i1和i2分别为水平方向和竖直方向的块索引号,K1和K2为一帧图像中水平和垂直方向的分块个数,K1=W/Wb,K2=H/Hb,0≤i1≤K1-1,0≤i2≤K2-1,K1×K2=Bn
a4、以Dk(i,j)表示参考虚拟视点图像序列中第k帧图像Dk的Bk(i1,i2)块中像素位置(i,j)的亮度Y分量像素值,即Dk(i,j)∈Bk(i1,i2),
Figure FSA00000806068400029
表示失真虚拟视点图像序列中第k帧图像
Figure FSA000008060684000210
Figure FSA000008060684000211
中像素位置(i,j)的亮度Y分量像素值,即
Figure FSA000008060684000212
Figure FSA000008060684000213
表示第一失真虚拟视点图像序列经过滤波重建后的第k帧图像的块中像素位置(i,j)的亮度Y分量像素值,即
Figure FSA000008060684000215
由此,可以表示为滤波器系数矩阵C(i1,i2)与第一失真虚拟视点图像序列的像素的函数关系式,即
D ~ k ( i , j ) = f 1 ( C ( i 1 , i 2 ) , D k d ( i , j ) )
其中(i,j)是块(i1,i2)中的一个像素位置,Ck(i1,i2)表示第k帧图像中第(i1,i2)块的滤波器系数矩阵;
a5、记Φ(i,j)表示Dk(i,j)与的差异度,
Figure FSA00000806068400033
a6、求取当前块Bk(i1,i2)中差异值的和,以ΦB(i1,i2)表示,即:
Φ B ( i 1 , i 2 ) = Σ i = 0 W b Σ j = 0 H b Φ ( i , j ) ;
a7、采用最优化方法求解出第k帧图像中第(i1,i2)的滤波器系数矩阵Ck(i1,i2)最优解C*k(i1,i2),即当满足ΦB(i1,i2)最小时的滤波器系数最优解C*k(i1,i2)可以表示为
C * k ( i 1 , i 2 ) = arg min C k ( i 1 , i 2 ) Φ B ( i 1 , i 2 ) ,
a8、之后回到a4,计算出第k帧中其他块的滤波器系数最优矩阵,直到完成第k帧中所有块的滤波器系数矩阵的计算。
5.根据权利要求4所述的一种编码系统的图像与视频重构方法,其特征在于,步骤a4滤波器系数矩阵C(i1,i2)与第一失真虚拟视点图像序列的像素
Figure FSA00000806068400036
的函数关系式为
D ~ k ( i , j ) = Σ l = - w / 2 l = w / 2 Σ m = - w / 2 m = w / 2 c ( l , m ) k ( i 1 , i 2 ) × D k d ( i + l , j + m ) ,
其中(i,j)是块(i1,i2)中的一个像素位置,
Figure FSA00000806068400038
表示第k帧图像中第(i1,i2)块的滤波器系数矩阵Ck(i1,i2)中相应位置(l,m)的系数值。
6.根据权利要求4所述的一种编码系统的图像与视频重构方法,其特征在于,步骤a5所述函数关系f2表示为
Φ ( i , j ) = w ij | D k ( i , j ) - D ~ k ( i , j ) | β
其中wij为加权系数,一般为[0,1]范围,β为指数。
7.根据权利要求4所述的一种编码系统的图像与视频重构方法,其特征在于,步骤S54所述的滤波器系数矩阵更新包括以下步骤:
b1、假设参考虚拟视点图像序列为{Dk},失真虚拟视点图像序列为
Figure FSA00000806068400041
将参考图像序列{Dk}和失真图像序列
Figure FSA00000806068400042
按照时间方向的顺序排列,k为索引序号,每个序列共Nf帧,1≤k≤Nf
b2、按照步骤(S53)计算得到所有{Dk}对应滤波器系数矩阵,即每个块Bk(i1,i2)对应一个最优滤波器系数矩阵C(i1,i2),共Nf×Bn个;
b3、将k×Bn个滤波器系数矩阵划分为Gn个单元,1≤Gn≤Nf×Bn,每个单元有g(i)个滤波系数矩阵融合为新滤波器系数矩阵
Figure FSA00000806068400043
共Gn个,
Figure FSA00000806068400044
从而完成Nf帧的滤波器系数矩阵更新。
8.根据权利要求7所述的一种编码系统的图像与视频重构方法,其特征在于,步骤b3中所述单元的划分为组、帧或块所组成的任意一种组合方式。
9.根据权利要求8所述的一种编码系统的图像与视频重构方法,其特征在于,步骤b3中所述的滤波器系数矩阵融合是指:新滤波器系数矩阵
Figure FSA00000806068400045
中的(l,m)位置的系数值
Figure FSA00000806068400046
采用滤波器系数矩阵C(i1,i2)中的(l,m)位置的系数值加权平均计算得到
c ‾ ( l , m ) ( i 1 , i 2 ) = Σ n = 1 g ( i ) ω n × c ( l , m ) ( i 1 , i 2 ) Σ n = 1 g ( i ) ω n
其中ωn为加权系数。
10.根据权利要求1所述的一种编码系统的图像与视频重构方法,其特征在于:所述失真图像为失真深度图与失真彩色图、或失真深度图和原始彩色图、或者原始深度图与失真彩色图。
CN201210460004.9A 2012-11-15 2012-11-15 一种编解码系统的图像与视频重构方法 Expired - Fee Related CN103813149B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210460004.9A CN103813149B (zh) 2012-11-15 2012-11-15 一种编解码系统的图像与视频重构方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210460004.9A CN103813149B (zh) 2012-11-15 2012-11-15 一种编解码系统的图像与视频重构方法

Publications (2)

Publication Number Publication Date
CN103813149A true CN103813149A (zh) 2014-05-21
CN103813149B CN103813149B (zh) 2016-04-13

Family

ID=50709287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210460004.9A Expired - Fee Related CN103813149B (zh) 2012-11-15 2012-11-15 一种编解码系统的图像与视频重构方法

Country Status (1)

Country Link
CN (1) CN103813149B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109246407A (zh) * 2017-04-28 2019-01-18 微软技术许可有限责任公司 图像编码
CN117541908A (zh) * 2024-01-10 2024-02-09 华芯程(杭州)科技有限公司 光学检测图像预测模型的训练方法、装置及预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102271254A (zh) * 2011-07-22 2011-12-07 宁波大学 一种深度图像的预处理方法
WO2012131895A1 (ja) * 2011-03-29 2012-10-04 株式会社東芝 画像符号化装置、方法及びプログラム、画像復号化装置、方法及びプログラム
CN102769746A (zh) * 2012-06-27 2012-11-07 宁波大学 一种多视点深度视频处理方法
CN102769749A (zh) * 2012-06-29 2012-11-07 宁波大学 一种深度图像的后处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012131895A1 (ja) * 2011-03-29 2012-10-04 株式会社東芝 画像符号化装置、方法及びプログラム、画像復号化装置、方法及びプログラム
CN102271254A (zh) * 2011-07-22 2011-12-07 宁波大学 一种深度图像的预处理方法
CN102769746A (zh) * 2012-06-27 2012-11-07 宁波大学 一种多视点深度视频处理方法
CN102769749A (zh) * 2012-06-29 2012-11-07 宁波大学 一种深度图像的后处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DE SILVA: "Display Dependent Preprocessing of Depth Maps Based on Just Noticeable Depth Difference Modeling", 《SELECTED TOPICS IN SIGNALS PROCESSING. IEEE JOURNAL OF》, vol. 5, no. 2, 24 January 2011 (2011-01-24) *
王路: "三维电视中虚拟视点合成的技术研究", 《山东大学硕士学位论文》, 20 March 2012 (2012-03-20) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109246407A (zh) * 2017-04-28 2019-01-18 微软技术许可有限责任公司 图像编码
CN109246407B (zh) * 2017-04-28 2020-09-25 微软技术许可有限责任公司 图像编码
CN117541908A (zh) * 2024-01-10 2024-02-09 华芯程(杭州)科技有限公司 光学检测图像预测模型的训练方法、装置及预测方法
CN117541908B (zh) * 2024-01-10 2024-04-05 华芯程(杭州)科技有限公司 光学检测图像预测模型的训练方法、装置及预测方法

Also Published As

Publication number Publication date
CN103813149B (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN100576934C (zh) 基于深度和遮挡信息的虚拟视点合成方法
CN102055982B (zh) 三维视频编解码方法及装置
CN101986716B (zh) 一种快速深度视频编码方法
CN103402097B (zh) 一种自由视点视频深度图编码方法及其失真预测方法
CN102438167B (zh) 一种基于深度图像绘制的立体视频编码方法
CN103002306B (zh) 一种深度图像编码方法
CN101729892B (zh) 一种非对称立体视频编码方法
CN108712648B (zh) 一种深度视频快速帧内编码方法
CN101980538B (zh) 一种基于分形的双目立体视频压缩编解码方法
CN101404766B (zh) 一种多视点视频信号的编码方法
CN102685532A (zh) 自由视点四维空间视频编码系统的编码方法
Li et al. A novel upsampling scheme for depth map compression in 3DTV system
CN102413332B (zh) 基于时域增强的视点合成预测多视点视频编码方法
CN103108187A (zh) 一种三维视频的编码方法、解码方法、编码器和解码器
CN101969564A (zh) 一种用于三维立体电视的深度视频压缩的上采样方法
CN106791768A (zh) 一种基于图割优化的深度图帧率提升方法
CN104768019A (zh) 一种面向多纹理多深度视频的相邻视差矢量获取方法
CN103873867A (zh) 自由视点视频深度图失真预测方法和编码方法
CN102790895B (zh) 一种基于最小二乘的多视点视频编码视点合成预测方法
CN103024381A (zh) 一种基于恰可察觉失真的宏块模式快速选择方法
CN102316323B (zh) 一种快速的双目立体视频分形压缩与解压缩方法
CN104159095A (zh) 一种多视点纹理视频和深度图编码的码率控制方法
CN103813149B (zh) 一种编解码系统的图像与视频重构方法
CN105007494B (zh) 一种3d视频深度图像的帧内楔形分割模式选择方法
CN102523468B (zh) 一种三维立体视频编码的最佳码率比重确立方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160413

Termination date: 20171115