发明内容
本发明所要解决的技术问题是提供一种能够有效地提高虚拟视点图像质量的三维立体视频编码的率失真模型优化方法。
本发明解决上述技术问题所采用的技术方案为:一种三维立体视频编码的率失真模型优化方法,其特征在于包括以下步骤:
①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的彩色立体视频及其对应的深度立体视频定义为原始三维立体视频,在空域上该原始三维立体视频包括原始左视点三维视频和原始右视点三维视频,原始左视点三维视频包括原始左视点彩色视频和原始左视点深度视频,原始左视点彩色视频主要由若干个帧组的原始左视点彩色图像组成,原始左视点深度视频主要由若干个帧组的原始左视点深度图像组成,原始右视点三维视频包括原始右视点彩色视频和原始右视点深度视频,原始右视点彩色视频主要由若干个帧组的原始右视点彩色图像组成,原始右视点深度视频主要由若干个帧组的原始右视点深度图像组成,其中,YUV颜色空间的三个颜色分量的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V;
将介于左视点与右视点之间的视点作为虚拟视点;
②建立对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的率失真模型,记为以保证获得最优的编码性能和绘制质量,其中,min[ ]为取最小值函数,Rc表示预先设定的对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的总码率,Rt表示对原始左视点彩色视频、原始右视点彩色视频进行编码的码率,Rd表示对原始左视点深度视频、原始右视点深度视频进行编码的码率,Dv(Rt,Rd)表示对以码率Rt分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和以码率Rd分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真;
③将Dv(Rt,Rd)近似表示为: 其中,Dt(Rt)表示对以码率Rt分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,Dd(Rd)表示对原始左视点彩色视频、原始右视点彩色视频和以码率Rd分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真;
④通过二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与Dt(Rt)的关系模型,记为 通过二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与Dd(Rd)的关系模型,记为 其中,αt、βt和γt均为 中的模型参数,αd、βd和γd均为 中的模型参数;
⑤通过二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与Rt的关系模型,记为 通过二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与Rd的关系模型,记为 其中,at、bt和ct均为 中的模型参数,ad、bd和cd均为 中的模型参数;
⑥根据TQ
step与D
t(R
t)的关系模型、DQ
step与D
d(R
d)的关系模型、TQ
step与R
t的关系模型及DQ
step与R
d的关系模型,对率失真模型
进行优化,将优化后的率失真模型表示为:
⑦根据优化后的率失真模型
通过全搜索方法获取对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化步长,将对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化步长记为
将对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长记为
⑧根据对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化步长
计算对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化参数,记为
根据设定的立体视频编码预测结构,采用最佳初始编码量化参数
分别对原始左视点彩色视频的各个帧组中的各个原始左视点彩色图像及原始右视点彩色视频的各个帧组中的各个原始右视点彩色图像的亮度分量Y、第一色度分量U和第二色度分量V进行编码,得到左视点彩色视频的编码码流和右视点彩色视频的编码码流,然后服务端通过网络将左视点彩色视频的编码码流和右视点彩色视频的编码码流传输给用户端;
⑨根据对原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化步长
计算对原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化参数,记为
根据设定的立体视频编码预测结构,采用最佳初始编码量化参数
分别对原始左视点深度视频的各个帧组中的各个原始左视点深度图像及原始右视点深度视频的各个帧组中的各个原始右视点深度图像进行编码,得到左视点深度视频的编码码流和右视点深度视频的编码码流,然后服务端通过网络将左视点深度视频的编码码流和右视点深度视频的编码码流传输给用户端;
⑩用户端分别对服务端发送来的左视点彩色视频的编码码流、右视点彩色视频的编码码流、左视点深度视频的编码码流和右视点深度视频的编码码流进行解码,得到左视点的彩色视频数据、右视点的彩色视频数据、左视点的深度视频数据和右视点的深度视频数据信息,然后采用基于深度图像的绘制得到各个时刻的虚拟视点视频。
所述的步骤③的具体过程为:
③-1、假定S
v表示由原始左视点彩色图像、原始右视点彩色图像和对应的原始左视点深度图像、原始右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,
表示由以码率R
t分别对原始左视点彩色图像、原始右视点彩色图像进行编码得到的解码左视点彩色图像、解码右视点彩色图像和以码率R
d分别对对应的原始左视点深度图像、原始右视点深度图像进行编码得到的解码左视点深度图像、解码右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,
表示由以码率R
t分别对原始左视点彩色图像、原始右视点彩色图像进行编码得到的解码左视点彩色图像、解码右视点彩色图像和对应的原始左视点深度图像、原始右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,
表示由原始左视点彩色图像、原始右视点彩色图像和以码率R
d分别对对应的原始左视点深度图像、原始右视点深度图像进行编码得到的解码左视点深度图像、解码右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,则将D
v(R
t,R
d)表示为:
其中,
表示求
的数学期望值;
③-2通过多项式分解将
表示为:
其中,
表示求
的数学期望值,
表示求
的数学期望值,
表示求
的数学期望值;
③-3、根据
且
将D
v(R
t,R
d)近似表示为:
其中,
表示求
的数学期望值;
③-4、将
表示为对以码率R
t分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
t(R
t),将
表示为对原始左视点彩色视频、原始右视点彩色视频和以码率R
d分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
d(R
d),根据
和
将D
v(R
t,R
d)近似表示为:
所述的步骤④的具体过程为:
④-1、任取一个不大于44的编码量化参数作为原始左视点彩色视频、原始右视点彩色视频的编码量化参数,记为QP
t0,得到以该编码量化参数QP
t0对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率,记为R
t0,将由原始左视点彩色视频、原始右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制得到的虚拟视点视频记为
将由以编码量化参数QP
t0分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制得到的虚拟视点视频记为I
v(QP
t0),计算
与I
v(QP
t0)的均方差,作为对以编码量化参数QP
t0分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
t0;
④-2、选取N个大于QPt0且各不相同的编码量化参数,分别记为QPt1,…,QPti,…,QPtN,采用该N个不同的编码量化参数QPt1,…,QPti,…,QPtN分别对原始左视点彩色视频、原始右视点彩色视频进行编码,分别得到以该N个不同的编码量化参数对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率,对应的分别记为Rt1,…,Rti,…,RtN,计算得到由以该N个不同的编码量化参数分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,对应的分别记为Dt1,…,Dti,…,DtN,其中,1≤i≤N,QPti=QPt0+i;
④-3、将由Rt0和Rt1,…,Rti,…,RtN组成的对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率集合记为{Rtj|0≤j≤N},根据由QPt0和QPt1,…,QPti,…,QPtN组成的对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化参数集合{QPtj|0≤j≤N}及由Dt0和Dt1,…,Dti,…,DtN组成的绘制失真集合{Dtj|0≤j≤N},通过二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与对以采用{QPtj|0≤j≤N}中的各个编码量化参数分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频与对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真集合{Dtj|0≤j≤N}中的任意一个绘制失真Dt的关系模型,记为 其中, Rt表示{Rtj|0≤j≤N}中的任意一个平均码率,QPt表示{QPtj|0≤j≤N}中的任意一个编码量化参数,αt、βt和γt均为模型参数;
④-4、任取一个不大于44的编码量化参数作为原始左视点深度视频、原始右视点深度视频的编码量化参数,记为QP
d0,得到以该编码量化参数QP
t0对原始左视点深度视频、原始右视点深度视频进行编码的平均码率,记为R
d0,将由原始左视点彩色视频、原始右视点彩色视频和以编码量化参数QP
d0分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制得到的虚拟视点视频记为I
v(QP
d0),计算
与I
v(QP
d0)的均方差,作为对原始左视点彩色视频、原始右视点彩色视频和以编码量化参数QP
d0分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
d0;
④-5、选取N个大于QPd0且各不相同的编码量化参数,分别记为QPd1,…,QPdi,…,QPdN,采用该N个不同的编码量化参数QPd1,…,QPdi,…,QPdN分别对原始左视点深度视频、原始右视点深度视频进行编码,分别得到以该N个不同的编码量化参数对原始左视点深度视频、原始右视点深度视频进行编码的平均码率,对应的分别记为Rd1,…,Rdi,…,RdN,计算得到由原始左视点彩色视频、原始右视点彩色视频和以该N个不同的编码量化参数分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,对应的分别记为Dd1,…,Ddi,…,DdN,其中,1≤i≤N,QPdi=QPd0+i;
④-6、将由Rd0和Rd1,…,Rdi,…,RdN组成的对原始左视点深度视频、原始右视点深度视频进行编码的平均码率集合记为{Rdj|0≤j≤N},根据由QPd0和QPd1,…,QPdi,…,QPdN组成的对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合{QPdi|0≤j≤N}及由Dd0和Dd1,…,Ddi,…,DdN组成的绘制失真集合{Ddj|0≤j≤N},通过二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与对原始左视点彩色视频、原始右视点彩色视频与以采用{QPdj|0≤j≤N}中的各个编码量化参数分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真集合{Ddj|0≤j≤N}中的任意一个绘制失真Dd的关系模型,记为 其中, Rd表示{Rdj|0≤j≤N}中的任意一个平均码率,QPd表示{QPdj|0≤j≤N}中的任意一个编码量化参数,αd、βd和γd均为模型参数。
所述的步骤⑤的具体过程为:
⑤-1、根据对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率集合{Rtj|0≤j≤N}和对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化参数集合{QPtj|0≤j≤N},采用二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率集合{Rtj|0≤j≤N}中的任意一个码率Rt的关系模型,记为 其中, QPt表示{QPtj|0≤j≤N}中的任意一个编码量化参数,at、bt和ct均为模型参数;
⑤-2、根据对原始左视点深度视频、原始右视点深度视频进行编码的平均码率集合{Rdj|0≤j≤N}和对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合{QPdj|0≤j≤N},采用二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与对原始左视点深度视频、原始右视点深度视频进行编码的平均码率集合{Rdj|0≤j≤N}中的任意一个码率Rd的关系模型,记为 其中, QPd表示{QPdj|0≤j≤N}中的任意一个编码量化参数,ad、bd和cd均为模型参数。
所述的步骤⑦的具体过程为:
⑦-1、假定对原始左视点彩色视频、原始右视点彩色视频进行编码的码率占总码率Rc的最小比重为0.2,假定对原始左视点深度视频、原始右视点深度视频进行编码的码率占总码率Rc的最大比重为0.8,则根据对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的总码率Rc,计算对原始左视点深度视频、原始右视点深度视频进行编码的最小编码量化参数和最大编码量化参数,分别记为QPd min和QPd max,
其中,ad、bd和cd均为
中的模型参数;
⑦-2、将对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合记为Ω,Ω={QPd|QPd min≤QPd≤QPd max},QPd∈Ω,然后从对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合Ω中任取一个编码量化参数,记为QPd′,QPd′∈Ω;
⑦-3、根据任取的编码量化参数QPd′计算对原始左视点深度视频、原始右视点深度视频进行编码的平均码率,记为Rd′,Rd′=ad×(1/DQstep′)2+bd×(1/DQstep′)+cd,
⑦-4、根据对原始左视点深度视频、原始右视点深度视频进行编码的平均码率Rd′,计算对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长,记为TQstep′,
⑦-5、计算对以编码量化步长TQstep′分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和以编码量化步长DQstep′分别对原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,记为COST′,COST′=αt×(TQstep′)2+βt×(TQstep′)+γt+αd×(DQstep′)2+βd×(DQstep′)+γd,其中,αt、βt和γt均为 中的模型参数,αd、βd和γd均为 中的模型参数;
⑦-6、从对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合Ω中任取n个值不等于QPd′且各不相同的编码量化参数,分别记任取的n个编码量化参数为QP″d1,…,QP″di,…,QP″dn;然后从任取的n个编码量化参数中的第1个编码量化参数QP″d1开始,重复采用与步骤⑦-3至⑦-5相同的操作处理,直至获得任取的n个编码量化参数对应的绘制失真,分别记为COST″1,…,COST″i,…,COST″n,其中,2≤n≤QPd max-QPd min-1,1≤i≤n,QP″d1表示任取的n个编码量化参数中的第1个编码量化参数,QP″di表示任取的n个编码量化参数中的第i个编码量化参数,QP″dn表示任取的n个编码量化参数中的第n个编码量化参数,COST″1表示QP″d1对应的绘制失真,COST″i表示QP″di对应的绘制失真,COST″n表示QP″dn对应的绘制失真;
⑦-7、从COST′和{COST″
1,…,COST″
i,…,COST″
n}中找出值最小的绘制失真,记为COST
min,再将COST
min对应的对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长作为对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化步长,记为
将COST
min对应的对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长作为对原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化步长,记为
与现有技术相比,本发明的优点在于:
1)本发明方法根据彩色视频的编码失真和深度视频的编码失真对虚拟视点图像绘制的影响,建立对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的率失真模型,并对率失真模型进行了优化,避免了在编码过程中进行复杂的虚拟视点绘制操作,大大提高了率失真模型的有效性。
2)本发明方法通过建立对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的率失真模型,分别获得在一定码率下对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的初始编码量化参数,这一编码流程有别于传统的立体视频编码方法,在保证立体视频的整体质量的前提下,大大提高了虚拟视点图像的质量。
附图说明
图1为典型的三维视频系统的组成示意图;
图2a为“Altmoabit”三维视频测试序列的第8个参考视点的一幅彩色图像;
图2b为“Altmoabit”三维视频测试序列的第10个参考视点的一幅彩色图像;
图2c为图2a所示的彩色图像对应的深度图像;
图2d为图2b所示的彩色图像对应的深度图像;
图3a为“Bookarrival”三维视频测试序列的第9个参考视点的一幅彩色图像;
图3b为“Bookarrival”三维视频测试序列的第11个参考视点的一幅彩色图像;
图3c为图3a所示的彩色图像对应的深度图像;
图3d为图3b所示的彩色图像对应的深度图像;
图4a为“Doorflowers”三维视频测试序列的第8个参考视点的一幅彩色图像;
图4b为“Doorflowers”三维视频测试序列的第10个参考视点的一幅彩色图像;
图4c为图4a所示的彩色图像对应的深度图像;
图4d为图4b所示的彩色图像对应的深度图像;
图5a为“Leavelaptop”三维视频测试序列的第9个参考视点的一幅彩色图像;
图5b为“Leavelaptop”三维视频测试序列的第11个参考视点的一幅彩色图像;
图5c为图5a所示的彩色图像对应的深度图像;
图5d为图5b所示的彩色图像对应的深度图像;
图6为对原始左右视点彩色视频的编码量化步长与绘制失真的关系模型进行二次拟合的曲线示意图;
图7为对原始左右视点深度视频的编码量化步长与绘制失真的关系模型进行二次拟合的曲线示意图;
图8为对原始左右视点彩色视频的编码量化步长与码率的关系模型进行二次拟合的曲线示意图;
图9为对原始左右视点深度视频的编码量化步长与码率的关系模型进行二次拟合的曲线示意图;
图10为“Altmoabit”三维视频测试序列采用本发明方法与采用原始固定码率比重方法得到的虚拟视点彩色图像的亮度分量Y的率失真性能曲线比较示意图;
图11为“Bookarrival”三维视频测试序列采用本发明方法与采用原始固定码率比重方法得到的虚拟视点彩色图像的亮度分量Y的率失真性能曲线比较示意图;
图12为“Doorflowers”三维视频测试序列采用本发明方法与采用原始固定码率比重方法得到的虚拟视点彩色图像的亮度分量Y的率失真性能曲线比较示意图;
图13为“Leavelaptop”三维视频测试序列采用本发明方法与采用原始固定码率比重方法得到的虚拟视点彩色图像的亮度分量Y的率失真性能曲线比较示意图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种三维立体视频编码的率失真模型优化方法,其主要包括以下步骤:
①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的彩色立体视频及其对应的深度立体视频定义为原始三维立体视频,在空域上该原始三维立体视频包括原始左视点三维视频和原始右视点三维视频,原始左视点三维视频包括原始左视点彩色视频和原始左视点深度视频,原始左视点彩色视频主要由若干个帧组的原始左视点彩色图像组成,原始左视点深度视频主要由若干个帧组的原始左视点深度图像组成,原始右视点三维视频包括原始右视点彩色视频和原始右视点深度视频,原始右视点彩色视频主要由若干个帧组的原始右视点彩色图像组成,原始右视点深度视频主要由若干个帧组的原始右视点深度图像组成,其中,YUV颜色空间的三个颜色分量的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V;将介于左视点与右视点之间的视点作为虚拟视点。
在本实施中,采用德国HHI实验室提供的三维视频测试序列“Altmoabit”、“Bookarrival”、“Doorflowers”和“Leavelaptop”作为原始三维立体视频,这四个三维视频测试序列的各幅彩色图像和各幅深度图像的分辨率均为1024×768。对于“Altmoabit”和“Doorflowers”三维立体视频,将第8个参考视点作为原始三维立体视频的左视点,将第10个参考视点作为原始三维立体视频的右视点,将第9个视点作为原始三维立体视频的虚拟视点;对于“Bookarrival”和“Leavelaptop”原始三维立体视频,将第9个参考视点作为原始三维立体视频的左视点,将第11个参考视点作为原始三维立体视频的右视点,将第10个视点作为原始三维立体视频的虚拟视点。图2a和图2b分别给出了“Altmoabit”的第8个和第10个参考视点的彩色图像;图2c和图2d分别给出了“Altmoabit”的第8个和第10个参考视点的深度图像;图3a和图3b分别给出了“Bookarrival”的第9个和第11个参考视点的彩色图像;图3c和图3d分别给出了“Bookarrival”的第9个和第11个参考视点的深度图像;图4a和图4b分别给出了“Doorflowers”的第8个和第10个参考视点的彩色图像;图4c和图4d分别给出了“Doorflowers”的第8个和第10个参考视点的深度图像;图5a和图5b分别给出了“Leavelaptop”的第9个和第11个参考视点的彩色图像;图5c和图5d分别给出了“Leavelaptop”的第9个和第11个参考视点的深度图像。
②由于深度是用来表征场景几何的负载信息,因此深度信息的编码质量会对后期虚拟视点图像的绘制产生影响,并且由于人眼感知是对彩色视频图像进行的,因此彩色视频图像的编码质量也会直接对后期虚拟视点图像的绘制质量产生影响。由于原始左右视点彩色视频的编码失真和原始左右视点深度视频的编码失真都会对虚拟视点图像绘制产生影响,因此本发明建立对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的率失真模型,记为以保证获得最优的编码性能和绘制质量,其中,min[]为取最小值函数,Rc表示预先设定的对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的总码率,Rt表示对原始左视点彩色视频、原始右视点彩色视频进行编码的码率,Rd表示对原始左视点深度视频、原始右视点深度视频进行编码的码率,Dv(Rt,Rd)表示对以码率Rt分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和以码率Rd分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真。
③由于原始左视点彩色视频、原始右视点彩色视频的编码失真和原始左视点深度视频、原始右视点深度视频的编码失真对虚拟视点图像绘制的影响既是相互独立又是相互影响的,为简单起见,本发明忽略彩色视频和深度视频之间的相互影响,于是将Dv(Rt,Rd)近似表示为: 其中,Dt(Rt)表示对以码率Rt分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,Dd(Rd)表示对原始左视点彩色视频、原始右视点彩色视频和以码率Rd分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真。
在此具体实施例中,步骤③的具体过程为:
③-1、假定S
v表示由原始左视点彩色图像、原始右视点彩色图像和对应的原始左视点深度图像、原始右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,
表示由以码率R
t分别对原始左视点彩色图像、原始右视点彩色图像进行编码得到的解码左视点彩色图像、解码右视点彩色图像和以码率R
d分别对对应的原始左视点深度图像、原始右视点深度图像进行编码得到的解码左视点深度图像、解码右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,
表示由以码率R
t分别对原始左视点彩色图像、原始右视点彩色图像进行编码得到的解码左视点彩色图像、解码右视点彩色图像和对应的原始左视点深度图像、原始右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,
表示由原始左视点彩色图像、原始右视点彩色图像和以码率R
d分别对对应的原始左视点深度图像、原始右视点深度图像进行编码得到的解码左视点深度图像、解码右视点深度图像进行虚拟视点图像绘制得到的虚拟视点图像,则将D
v(R
t,R
d)表示为:
其中,
表示求
的数学期望值。
③-2通过多项式分解将
表示为:
其中,
表示求
的数学期望值,
表示求
的数学期望值,
表示求
的数学期望值。
③-3、经大量实验结果表明
近似等于0,
近似等于
因此本发明根据
且
将D
v(R
t,R
d)近似表示为:
其中,
表示求
的数学期望值。
③-4、将
表示为对以码率R
t分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
t(R
t),将
表示为对原始左视点彩色视频、原始右视点彩色视频和以码率R
d分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
d(R
d),根据
和
将D
v(R
t,R
d)近似表示为:
④由于原始左右视点彩色视频和原始左右视点深度视频的编码失真的大小直接影响绘制失真的大小,而编码失真又与编码量化步长有关,因此本发明通过二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与Dt(Rt)的关系模型,记为 通过二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与Dd(Rd)的关系模型,记为 其中,αt、βt和γt均为 中的模型参数,αd、βd和γd均为 中的模型参数。
在此具体实施例中,步骤④的具体过程为:
④-1、任取一个不大于44的编码量化参数作为原始左视点彩色视频、原始右视点彩色视频的编码量化参数,记为QP
t0,得到以该编码量化参数QP
t0对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率,记为R
t0,将由原始左视点彩色视频、原始右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制得到的虚拟视点视频记为
将由以编码量化参数QP
t0分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制得到的虚拟视点视频记为I
v(QP
t0),计算
与I
v(QP
t0)的均方差,作为对以编码量化参数QP
t0分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
t0。
④-2、选取N个大于QPt0且各不相同的编码量化参数,分别记为QPt1,…,QPti,…,QPtN,采用该N个不同的编码量化参数QPt1,…,QPti,…,QPtN分别对原始左视点彩色视频、原始右视点彩色视频进行编码,分别得到以该N个不同的编码量化参数对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率,对应的分别记为Rt1,…,Rti,…,RtN,计算得到由以该N个不同的编码量化参数分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真,对应的分别记为Dt1,…,Dti,…,DtN,其中,1≤i≤N,QPti=QPt0+i。在本实施例中,取N=12。
④-3、将由Rt0和Rt1,…,Rti,…,RtN组成的对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率集合记为{Rtj|0≤j≤N},根据由QPt0和QPt1,…,QPti,…,QPtN组成的对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化参数集合{QPtj|0≤j≤N}及由Dt0和Dt1,…,Dti,…,DtN组成的绘制失真集合{Dtj|0≤j≤N},通过二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与对以采用{QPtj|0≤j≤N}中的各个编码量化参数分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频与对应的原始左视点深度视频、原始右视点深度视频进行虚拟视点图像绘制的绘制失真集合{Dtj|0≤j≤N}中的任意一个绘制失真Dt的关系模型,记为 其中, Rt表示{Rtj|0≤j≤N}中的任意一个平均码率,QPt表示{QPtj|0≤j≤N}中的任意一个编码量化参数,αt、βt和γt均为模型参数。
④-4、任取一个不大于44的编码量化参数作为原始左视点深度视频、原始右视点深度视频的编码量化参数,记为QP
d0,得到以该编码量化参数QP
t0对原始左视点深度视频、原始右视点深度视频进行编码的平均码率,记为R
d0,将由原始左视点彩色视频、原始右视点彩色视频和以编码量化参数QP
d0分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制得到的虚拟视点视频记为I
v(QP
d0),计算
与I
v(QP
d0)的均方差,作为对原始左视点彩色视频、原始右视点彩色视频和以编码量化参数QP
d0分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,记为D
d0。
④-5、选取N个大于QPd0且各不相同的编码量化参数,分别记为QPd1,…,QPdi,…,QPdN,采用该N个不同的编码量化参数QPd1,…,QPdi,…,QPdN分别对原始左视点深度视频、原始右视点深度视频进行编码,分别得到以该N个不同的编码量化参数对原始左视点深度视频、原始右视点深度视频进行编码的平均码率,对应的分别记为Rd1,…,Rdi,…,RdN,计算得到由原始左视点彩色视频、原始右视点彩色视频和以该N个不同的编码量化参数分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,对应的分别记为Dd1,…,Ddi,…,DdN,其中,1≤i≤N,QPdi=QPd0+i。在本实施例中,取N=12。
④-6、将由Rd0和Rd1,…,Rdi,…,RdN组成的对原始左视点深度视频、原始右视点深度视频进行编码的平均码率集合记为{Rdj|0≤j≤N},根据由QPd0和QPd1,…,QPdi,…,QPdN组成的对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合{QPdj|0≤j≤N}及由Dd0和Dd1,…,Ddi,…,DdN组成的绘制失真集合{Ddj|0≤j≤N},通过二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与对原始左视点彩色视频、原始右视点彩色视频与以采用{QPdj|0≤j≤N}中的各个编码量化参数分别对对应的原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真集合{Ddj|0≤j≤N}中的任意一个绘制失真Dd的关系模型,记为 其中, Rd表示{Rdj|0≤j≤N}中的任意一个平均码率,QPd表示{QPdj|0≤j≤N}中的任意一个编码量化参数,αd、βd和γd均为模型参数。
图6给出了对“Altmoabit”、“Bookarrival”、“Doorflowers”和“Leavelaptop”的原始左右视点彩色视频的编码量化步长TQstep与绘制失真Dt(Rt)的关系模型进行二次拟合的曲线示意图,图7给出了对“Altmoabit”、“Bookarrival”、“Doorflowers”和“Leavelaptop”的原始左右视点深度视频的编码量化步长DQstep与绘制失真Dd(Rd)的关系模型进行二次拟合的曲线示意图,从图6和图7中可以看出二次拟合能很好地反映编码量化步长与绘制失真之间的关系。
⑤在总码率限制下,需要合理地控制对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长,使得彩色视频和深度视频输出的码率满足目标总码率要求,因此本发明通过二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与Rt的关系模型,记为 通过二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与Rd的关系模型,记为 其中,at、bt和ct均为 中的模型参数,ad、bd和cd均为 中的模型参数。
在此具体实施例中,步骤⑤的具体过程为:
⑤-1、根据对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率集合{Rtj|0≤j≤N}和对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化参数集合{QPtj|0≤j≤N},采用二次拟合方法建立对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长TQstep与对原始左视点彩色视频、原始右视点彩色视频进行编码的平均码率集合{Rtj|0≤j≤N}中的任意一个码率Rt的关系模型,记为 其中, QPt表示{QPtj|0≤j≤N}中的任意一个编码量化参数,at、bt和ct均为模型参数。
⑤-2、根据对原始左视点深度视频、原始右视点深度视频进行编码的平均码率集合{Rdj|0≤j≤N}和对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合{QPdj|0≤j≤N},采用二次拟合方法建立对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长DQstep与对原始左视点深度视频、原始右视点深度视频进行编码的平均码率集合{Rdj|0≤j≤N}中的任意一个码率Rd的关系模型,记为 其中, QPd表示{QPdj|0≤j≤N}中的任意一个编码量化参数,ad、bd和cd均为模型参数。
图8给出了对“Altmoabit”、“Bookarrival”、“Doorflowers”和“Leavelaptop”的原始左右视点彩色视频的编码量化步长TQstep与码率Rt的关系模型进行二次拟合的曲线示意图,图9给出了对“Altmoabit”、“Bookarrival”、“Doorflowers”和“Leavelaptop”的原始左右视点深度视频的编码量化步长TQstep与码率Rt的关系模型进行二次拟合的曲线示意图,从图8和图9中可以看出二次拟合能很好地反映编码量化步长与码率之间的关系。
⑥根据TQstep与Dt(Rt)的关系模型、DQstep与Dd(Rd)的关系模型、TQstep与Rt的关系模型及DQstep与Rd的关系模型,对率失真模型进行优化,将优化后的率失真模型表示为:
⑦根据优化后的率失真模型
通过全搜索方法获取对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化步长,将对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化步长记为
将对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长记为
在此具体实施例中,步骤⑦的具体过程为:
⑦-1、假定对原始左视点彩色视频、原始右视点彩色视频进行编码的码率占总码率Rc的最小比重为0.2,假定对原始左视点深度视频、原始右视点深度视频进行编码的码率占总码率Rc的最大比重为0.8,则根据对原始左视点彩色视频、原始右视点彩色视频与原始左视点深度视频、原始右视点深度视频进行编码的总码率Rc,计算对原始左视点深度视频、原始右视点深度视频进行编码的最小编码量化参数和最大编码量化参数,分别记为QPd min和QPd max, 其中,ad、bd和cd均为 中的模型参数。
⑦-2、将对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合记为Ω,Ω={QPd|QPd min≤QPd≤QPd max},QPd∈Ω,然后从对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合Ω中任取一个编码量化参数,记为QPd′,QPd′∈Ω。
⑦-3、根据任取的编码量化参数QPd′计算对原始左视点深度视频、原始右视点深度视频进行编码的平均码率,记为Rd′,Rd′=ad×(1/DQstep′)2+bd×(1/DQstep′)+cd,
⑦-4、根据对原始左视点深度视频、原始右视点深度视频进行编码的平均码率Rd′,计算对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长,记为TQstep′,
⑦-5、计算对以编码量化步长TQstep′分别对原始左视点彩色视频、原始右视点彩色视频进行编码得到的解码左视点彩色视频、解码右视点彩色视频和以编码量化步长DQstep′分别对原始左视点深度视频、原始右视点深度视频进行编码得到的解码左视点深度视频、解码右视点深度视频进行虚拟视点图像绘制的绘制失真,记为COST′,COST′=αt×(TQstep′)2+βt×(TQstep′)+γt+αd×(DQstep′)2+βd×(DQstep′)+γd,其中,αt、βt和γt均为 中的模型参数,αd、βd和γd均为 中的模型参数。
⑦-6、从对原始左视点深度视频、原始右视点深度视频进行编码的编码量化参数集合Ω中任取n个值不等于QPd′且各不相同的编码量化参数,分别记任取的n个编码量化参数为QP″d1,…,QP″di,…,QP″dn;然后从任取的n个编码量化参数中的第1个编码量化参数QP″d1开始,重复采用与步骤⑦-3至⑦-5相同的操作处理,直至获得任取的n个编码量化参数对应的绘制失真,分别记为COST″1,…,COST″i,…,COST″n,其中,2≤n≤QPd max-QPd min-1,1≤i≤n,QP″d1表示任取的n个编码量化参数中的第1个编码量化参数,QP″di表示任取的n个编码量化参数中的第i个编码量化参数,QP″dn表示任取的n个编码量化参数中的第n个编码量化参数,COST″1表示QP″d1对应的绘制失真,COST″i表示QP″di对应的绘制失真,COST″n表示QP″dn对应的绘制失真。
⑦-7、从COST′和{COST″
1,…,COST″
i,…,COST″
n}中找出值最小的绘制失真,记为COST
min,再将COST
min对应的对原始左视点彩色视频、原始右视点彩色视频进行编码的编码量化步长作为对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化步长,记为
将COST
min对应的对原始左视点深度视频、原始右视点深度视频进行编码的编码量化步长作为对原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化步长,记为
⑧根据对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化步长
计算对原始左视点彩色视频、原始右视点彩色视频进行编码的最佳初始编码量化参数,记为
根据设定的立体视频编码预测结构,采用最佳初始编码量化参数
分别对原始左视点彩色视频的各个帧组中的各个原始左视点彩色图像及原始右视点彩色视频的各个帧组中的各个原始右视点彩色图像的亮度分量Y、第一色度分量U和第二色度分量V进行编码,得到左视点彩色视频的编码码流和右视点彩色视频的编码码流,然后服务端通过网络将左视点彩色视频的编码码流和右视点彩色视频的编码码流传输给用户端。
⑨根据对原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化步长
计算对原始左视点深度视频、原始右视点深度视频进行编码的最佳初始编码量化参数,记为
根据设定的立体视频编码预测结构,采用最佳初始编码量化参数
分别对原始左视点深度视频的各个帧组中的各个原始左视点深度图像及原始右视点深度视频的各个帧组中的各个原始右视点深度图像进行编码,得到左视点深度视频的编码码流和右视点深度视频的编码码流,然后服务端通过网络将左视点深度视频的编码码流和右视点深度视频的编码码流传输给用户端。
⑩用户端分别对服务端发送来的左视点彩色视频的编码码流、右视点彩色视频的编码码流、左视点深度视频的编码码流和右视点深度视频的编码码流进行解码,得到左视点的彩色视频数据、右视点的彩色视频数据、左视点的深度视频数据和右视点的深度视频数据信息,然后采用基于深度图像的绘制得到各个时刻的虚拟视点视频。
在本实施例中,立体视频编码预测结构采用公知的HBP编码预测结构。
以下就利用本发明方法对“Altmoabit”、“Bookarrival”、“Doorflowers”和“Leavelaptop”三维立体视频测试序列的编码性能进行比较。
表1给出了本发明方法采用二次拟合得到的彩色视频与深度视频的编码量化步长与绘制失真的关系模型的模型参数,表2给出了本发明方法采用二次拟合得到的彩色视频与深度视频的编码量化步长与码率的关系模型的模型参数,从表1和表2中可以看出,采用本发明方法拟合得到的曲线与真实曲线的相关系数(Correlation Coefficient,CC)基本能达到0.99,说明本发明方法提出的率失真模型具有较高的精度。
采用本发明方法来确立对彩色视频和深度视频编码的最佳初始编码量化参数,采用四组不同的总码率Rc进行编码实验,Rc∈{10000kbps,5000kbps,2000kbps,500kbps},结果如表3所示。采用本发明方法确立的最佳初始编码量化参数与采用穷尽搜索方法确立的最佳初始编码量化参数非常相近,但计算复杂度却远远小于全搜索方法,足以说明本发明方法提出的率失真模型是有效的。
将采用本发明方法的虚拟视点绘制性能,与采用原始固定码率比重方法的虚拟视点绘制性能进行比较,图10给出了“Altmoabit”经本发明方法绘制与经原始固定码率比重方法绘制的虚拟视点彩色视频图像的亮度分量Y的率失真性能曲线比较示意图,图11给出了“Bookarrival”经本发明方法绘制与经原始固定码率比重方法绘制的虚拟视点彩色视频图像的亮度分量Y的率失真性能曲线比较示意图,图12给出了“Doorflowers”经本发明方法绘制与经原始固定码率比重方法绘制的虚拟视点彩色视频图像的亮度分量Y的率失真性能曲线比较示意图,图13给出了“Leavelaptop”经本发明方法绘制与经原始固定码率比重方法绘制的虚拟视点彩色视频图像的亮度分量Y的率失真性能曲线比较示意图,从图10至图13可以看出,采用本发明方法处理后,大大提高了虚拟视点图像的绘制性能,说明本发明方法中建立的率失真模型是有效的。
表1 彩色视频与深度视频的编码量化步长与绘制失真的关系模型的模型参数
表2 彩色视频与深度视频的编码量化步长与码率的关系模型的模型参数
表3 本发明方法确立的对彩色视频和深度视频进行编码的最佳初始编码量化参数