CN103391436A - 一种基于双目视觉特性的立体视频码率控制方法 - Google Patents

一种基于双目视觉特性的立体视频码率控制方法 Download PDF

Info

Publication number
CN103391436A
CN103391436A CN2013102946757A CN201310294675A CN103391436A CN 103391436 A CN103391436 A CN 103391436A CN 2013102946757 A CN2013102946757 A CN 2013102946757A CN 201310294675 A CN201310294675 A CN 201310294675A CN 103391436 A CN103391436 A CN 103391436A
Authority
CN
China
Prior art keywords
stereo
image
picture
quantization parameter
picture group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013102946757A
Other languages
English (en)
Other versions
CN103391436B (zh
Inventor
蒋刚毅
廖义
郁梅
彭宗举
邵枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo University
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN201310294675.7A priority Critical patent/CN103391436B/zh
Publication of CN103391436A publication Critical patent/CN103391436A/zh
Application granted granted Critical
Publication of CN103391436B publication Critical patent/CN103391436B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明公开了一种基于双目视觉感知的立体视频码率控制方法,特点是过对立体图像组层、立体图像对层、帧层这三个层次分别进行码率控制,在立体图像组层,计算每个立体图像组的目标比特数并计算关键帧的量化参数;在立体图像对层,根据剩余比特数和缓冲区饱和度来计算每个立体图像对的目标比特数;在帧层,根据人眼双目视觉掩蔽效应,建立了立体指数码率与量化参数模型来优化立体率失真模型,使左图像分配较多的目标比特数,而右图像相对分配较少的目标比特数,最终确定非关键帧的量化参数。优点是通过本发明的码率控制方法后有效地提高了立体视频客观质量和率失真性能。

Description

一种基于双目视觉特性的立体视频码率控制方法
技术领域:
本发明涉及一种多视点视频码率控制技术,尤其涉及一种基于双目视觉特性的立体视频码率控制方法。 
背景技术:
随着多媒体通信技术的快速发展和人们对视觉需求的不断提高,立体视频正在逐步走入人们的生活之中。与传统的二维视频技术相比,立体视频技术能够利用人眼的双目视觉原理,给人带来强烈的深度感和交互性,满足人们对视频的真实感的要求。随着立体视频技术的进步,其研究范围已经覆盖了从宽屏的娱乐应用、远程立体视频会议到精密仪器检测等各种应用,但是,与传统的单通道视频相比,立体视频一般有两个视频通道,数据量要远远大于单通道视频,所以在立体视频的发展过程中,高效的编码和码率控制技术显得尤为重要。 
在当前视频编码标准的码率控制提案中,MPEG-2的TM5方法采用线性RQ模型,而MPEG-4的VM8方法和H.264的G012方法采用二次模型。但是,这些模型只能描述单个通道中的码率与量化参数之间的关系,并没有确定左右通道之间的码率分配方案。 
现有立体视频码率控制技术很少考虑双目视觉冗余,视觉心理学研究表明人眼双目视觉中存在掩蔽效应,立体视频的质量取决于质量较高通道的质量,即较差质量的通道在人眼观看时被质量较高的通道所掩盖,因此,在总比特数限制的条件下,可以充分利用双目掩蔽效应,给左图像分配较多的比特,同时给右图像相对分配较少的比特,从而提高立体视频的客观质量。 
发明内容:
本发明所要解决的技术问题是提供一种在双目掩蔽效应的条件下合理分配立体视频中左右图像的比特,能够有效地提供立体视频客观质量的立体视频码率控制方法。 
本发明解决上述技术问题所采用的技术方案为:一种基于双目视觉特性的立体视频 码率控制方法,通过对立体图像组层、立体图像对层、帧层这三个层次分别进行码率控制,在立体图像组层,计算每个立体图像组的目标比特数并计算关键帧的量化参数;在立体图像对层,根据剩余比特数和缓冲区饱和度来计算每个立体图像对的目标比特数;在帧层,根据人眼双目视觉掩蔽效应,建立了立体指数码率与量化参数模型来优化立体率失真模型,使左图像分配较多的目标比特数,而右图像相对分配较少的目标比特数,最终确定非关键帧的量化参数,其具体包括以下步骤: 
①.以双目相机拍摄得到的颜色空间为YUV的立体视频定义为原始立体视频,该立体视频包括左视点视频和右视点视频,YUV序列由3个颜色分量组成,其中Y表示亮度值,U和V分别表示第一色度和第二色度,用来描述色彩及饱和度,将利用原始左视点YUV序列和解码后得到的左视点YUV序列求取左视点YUV序列的编码峰值信噪比,将利用原始右视点YUV序列和解码后得到的右视点YUV序列求取右视点YUV序列的编码峰值信噪比; 
②.根据立体视频编码结构,将同一时刻的左右图像构成一个立体图像对,所述左右视点中的图像帧分为关键帧与非关键帧,由左右视点的关键帧和到下一个关键帧之间所有的立体图像对组成一个立体图像组,根据设定的总目标比特数和初始量化参数,对每个立体图像组的目标比特数和每个立体图像组中第一个立体图像对的量化参数进行计算,对于第一个立体图像组(i=1),目标比特数
Figure BDA00003501471700021
第一个立体图像组中第一个立体图像对中左图像的量化参数QPL(1,0)和右图像的量化参数QPR(1,0)直接采用设定的初始量化参数,对于其他立体图像组(i>1),记Tr(i,0)表示开始编码第i个立体图像组的目标比特数,则 T r ( i , 0 ) = u ( i , 0 ) F r × N s - ( B s 8 - B C ( i , 0 ) ) , 第i个立体图像组中第一个立体图像对中左图像的量化参数计算为 QP L ( i , 0 ) = S LQP N s - 1 - 8 T r ( i - 1 , N s ) T r ( i , 0 ) - N s 15 - 1 , 第i个立体图像组中第一个立体图像对中右图像的量化参数计算为  QP R ( i , 0 ) = min { S RQP N s - 1 - 8 T r ( i - 1 , N s ) T r ( i , 0 ) - N s 15 - 1 , QP L ( i , 0 ) + VT QP ( i , 0 ) } , 其中,u(i,0)表示编码第i个立体图像组时可用的信道带宽,Fr表示视频帧率,Ns表示每一个立体图像组中的 立体图像对数,Bs表示缓冲区的容量大小,Bc(i,0)表示编码完第i个立体图像组之前的缓冲区饱和度,SLQP、SRQP分别表示前一个立体图像组中左、右图像的非关键帧量化参数的总和,VTQP(i,0)表示在双目掩蔽效应下左右图像之间可允许的量化参数差值,VTQP(i,0)=p1×QPL(i,0)+p2,其中p1、p2分别为常量-0.3265和17.35; 
③.对当前第i个立体图像组的剩余立体图像对的目标比特数进行预算,记在编码第i个立体图像组中第j个立体图像对前,所有未编码的立体图像对的目标比特数为Tr(i,j), T r ( i , j ) = T r ( i , j - 1 ) + u ( i , j ) - u ( i , j - 1 ) F r × ( N s - j ) - A ( i , j - 1 ) , 其中j≥1,u(i,j)表示编码第i个立体图像组中第j个立体图像对时的带宽,Fr表示视频帧率,Ns表示每一个立体图像组中的立体图像对数,A(i,j-1)表示编码第i个立体图像组中第j-1个立体图像对消耗的比特数; 
④.根据第i个立体图像组中剩余比特数和缓冲区饱和度来计算第i个立体图像组中第j个立体图像对的目标比特数,根据第i个立体图像组中剩余比特数Tr(i,j),计算第j个立体图像对的第一候选目标比特数为
Figure BDA00003501471700032
其中Ns表示每一个立体图像组中的立体图像对数,为了防止缓冲区的上溢和下溢,根据缓冲区的占用情况,计算第j个立体图像对的第二候选目标比特数为 T ~ ( i , j ) = u ( i , j ) F r + γ × ( TB ( i , j ) - CB ( i , j ) ) , 其中u(i,j)表示编码第i个立体图像组中第j个立体图像对时的带宽,Fr表示视频帧率,TB(i,j)和CB(i,j)分别表示目标缓冲区大小和实际缓冲区大小,γ为常量0.75,将第一候选目标比特数和第二候选目标比特数进行加权,获取第i个立体图像组中第j个立体图像对的目标比特数 T ( i , j ) = β × T ^ ( i , j ) + ( 1 - β ) × T ~ ( i , j ) , 其中β为常量0.5; 
⑤.通过对立体图像对中左右图像的码率与量化参数之间的统计分析,以Ratio表示立体图像对中左图像与右图像的码率比例,以△QP表示立体图像对中左图像与右图像的量化参数差值,以QPL、QPR分别表示立体图像对中左图像与右图像的量化参数,建立立体图像对中左右图像之间的码率比例与量化参数差值之间的模型; 
⑥.根据第i个立体图像组中第j个立体图像对的目标比特数T(i,j),以QPL(i,j)表示第i个立体图像组中第j个立体图像对中左图像的量化参数,以△QP(i,j)表示第i个立体图像组中第j个立体图像对中左图像与右图像的量化参数差值,以Ratio(i,j)表示第i个立体图像组中第j个立体图像对中左图像与右图像的码率比例,以VTQP(i,j)表示在双目掩蔽效应下第i个立体图像组中第j个立体图像对中左右图像之间可允许的量化参数差值,获取第i个立体图像组中第j个立体图像对中左图像和右图像的目标比特数,分别记为TL(i,j)、TR(i,j); 
⑦.根据第i个立体图像组中第j个立体图像对中左图像和右图像的目标比特数TL(i,j)和TR(i,j),分别计算第i个立体图像组中第j个立体图像对中左图像和右图像的量化参数,分别记为QPL(i,j)、QPR(i,j),QPL(i,j)=6log2(QL,step(i,j))+4,QPR(i,j)=6log2(QR,step(i,j))+4,其中QL,step(i,j)和QR,step(i,j)分别表示第i个立体图像组中第j个立体图像对中左图像和右图像的量化步长,QL,step(i,j)和QR,step(i,j)通过二次码率与量化参数模型得到, T L ( i , j ) = a 1 ( i , j ) × MAD L ( i , j ) Q L , step ( i , j ) + a 2 ( i , j ) × MAD L ( i , j ) Q L , step 2 ( i , j ) + H L ( i , j ) , T R ( i , j ) = a 3 ( i , j ) × MAD R ( i , j ) Q R , step ( i , j ) + a 4 ( i , j ) × MAD R ( i , j ) Q R , step 2 ( i , j ) + H R ( i , j ) , 其中MADL(i,j)、MADR(i,j)分别为左图像和右图像在编码前与编码后亮度值Y的平均绝对差值,HL(i,j)、HR(i,j)分别为左图像和右图像的头比特数,a1(i,j)、a2(i,j)、a3(i,j)和a4(i,j)为模型参数,采用线性回归模型进行逐帧更新; 
⑧.对当前立体图像组的下一个立体图像对重复执行步骤②至⑦,直至所有立体图像对完成编码; 
⑨.返回步骤②继续执行,直至当前视频中所有立体图像组完成编码。 
所述的步骤⑤的具体过程为: 
⑤-1.任取N个各不相同的编码量化参数作为左图像的编码量化参数值,分别记为 QP′L1,QP′L2,…,QP′Li,…,QP′LN,对每一个左图像的编码量化参数值,又分别取M个各不相同的左右图像的编码量化参数差值,分别记为△QP1',△QP2',…,△QPj',…,△QP'M,得到对应的右图像的编码量化参数值,分别记为QP′R1,QP′R2,…,QP′Rk,…,QP′R(M×N); 
⑤-2.采用左图像的编码量化参数QP′L1,QP′L2,…,QP′Li,…,QP′LN和对应的右图像的编码量化参数QP′R1,QP′R2,…,QP′Rk,…,QP′R(M×N),分别对左图像和右图像进行编码,分别得到以该M×N个不同的编码量化参数对左图像和右图像进行编码的码率,分别记为R'L1,R'L2,…,R'Lk,…,R'L(M×N)和R'R1,R'R2,…,R'Rk,…,R'R(M×N),对应的左图像与右图像的码率比例记为Ratio1',Ratio'2,…,Ratio'k,…,Ratio'(M×N); 
⑤-3.将左图像的编码量化参数、左图像与右图像的编码量化参数差值和左图像与右图像的码率比例进行拟合,得到指数模型Ratio=AeB×△QP,其中参数A和B分别表示指数模型的幅度和频率,与左图像的编码量化参数有关; 
⑤-4.将参数A与左图像的编码量化参数拟合成线性关系,通过线性关系计算参数A,将参数B与左图像的编码量化参数拟合成线性关系,通过线性关系计算参数B。 
所述的步骤⑥的具体过程为: 
⑥-1.对左图像的编码量化参数的取值范围进行约束,QPL'(i,j)的取值范围为QPL'(i,j-1)-△QPTH≤QPL'(i,j)≤QPL'(i,j-1)+△QPTH,其中△QPTH表示固定阈值,并且根据△QP'(i,j)≤VTQP'(i,j),确定Ratio'(i,j)的取值范围,  Ratio ′ ( i , j ) = arg max Q [ A ′ ( i , j ) × e B ′ ( i , j ) × ΔQP ′ ( i , j ) ] , 其中arg max[]表示最大化概率密度函数,Q表示左图像的编码量化参数和左图像与右图像的编码量化参数差值的所有的量化参数组合的集合,(QPL'(i,j),△QP'(i,j))∈Q,参数A'(i,j)和B'(i,j)分别表示编码第i个立体图像组中第j个立体图像对中指数模型的幅度和频率; 
⑥-2.对第i个立体图像组中第j个立体图像对中左图像分配的目标比特数为 
Figure BDA00003501471700052
对第i个立体图像组中第j个立体图像对中右图像分配 的目标比特数为 T R ( i , j ) = 1 Ratio ( i , j ) + 1 × T ( i , j ) ·
与现有技术相比,本发明的优点在于:通过统计分析左右视点图像之间码率比例与量化参数差值之间的关系,建立了码率与量化参数的立体指数模型,在此立体指数模型和双目掩蔽阈值的约束下,求取最佳的码率分配比例,使视觉权重较高的左视点图像分配较多的比特,使视觉权重较低的右视点图像分配较少的比特,从而提高立体视频客观质量。 
附图说明:
图1为本发明方法的流程框图; 
图2a为“Crowd”视频序列的左视点图像; 
图2b为“Crowd”视频序列的右视点图像; 
图3a为“Booksale”视频序列的左视点图像; 
图3b为“Booksale”视频序列的右视点图像; 
图4a为“Ballroom”视频序列的左视点图像; 
图4b为“Ballroom”视频序列的右视点图像; 
图5a为“Akko”视频序列的左视点图像; 
图5b为“Akko”视频序列的右视点图像; 
图6a为“Booksale”视频序列的码率比例与量化参数差值的关系曲线图; 
图6b为“Akko”视频序列的码率比例与量化参数差值的关系曲线图; 
图7a为参数A与左图像量化参数之间的关系曲线; 
图7b为参数B与左图像量化参数之间的关系曲线; 
图8a为“Crowd”视频序列的本发明方法与对称控制方法的率失真曲线; 
图8b为“Booksale”视频序列的本发明方法与对称控制方法的率失真曲线; 
图8c为“Ballroom”视频序列的本发明方法与对称控制方法的率失真曲线; 
图8d为“Akko”视频序列的本发明方法与对称控制方法的率失真曲线; 
具体实施方式:
以下结合附图与具体实施方式对本发明做进一步描述,但是本发明不仅限于以下具体实施方式。 
本发明提出的一种基于双目视觉特性的立体视频码率控制方法,其总体实现框图如图1所示,该方法通过对立体图像组层、立体图像对层、帧层这三个层次分别进行码率控制,在立体图像组层,计算每个立体图像组的目标比特数并计算关键帧的量化参数;在立体图像对层,根据剩余比特数和缓冲区饱和度来计算每个立体图像对的目标比特数;在帧层,根据人眼双目视觉掩蔽效应,建立了立体指数码率与量化参数模型来优化立体率失真模型,使左图像分配较多的目标比特数,而右图像相对分配较少的目标比特数,最终确定非关键帧的量化参数,其具体包括以下步骤: 
①.以双目相机拍摄得到的颜色空间为YUV的立体视频定义为原始立体视频,该立体视频包括左视点视频和右视点视频,YUV序列由3个颜色分量组成,其中Y表示亮度值,U和V分别表示第一色度和第二色度,用来描述色彩及饱和度,将利用原始左视点YUV序列和解码后得到的左视点YUV序列求取左视点YUV序列的编码峰值信噪比,将利用原始右视点YUV序列和解码后得到的右视点YUV序列求取右视点YUV序列的编码峰值信噪比。 
在本实施中,采用标准立体视频YUV测试序列“Crowd”、“Booksale”、“Ballroom”和“Akko”序列进行编码测试,其中“Crowd”和“Booksale”序列分辨率为320×240,“Ballroom”和“Akko”序列分辨率为640×480,图2a和图2b分别给出了“Crowd”的左视点图像和右视点图像,图3a和图3b分别给出了“Booksale”的左视点图像和右视点图像,图4a和图4b分别给出了“Ballroom”的左视点图像和右视点图像,图5a和图5b分别给出了“Akko”的左视点图像和右视点图像。 
②.根据立体视频编码结构,将同一时刻的左右图像构成一个立体图像对,所述左右视点中的图像帧分为关键帧与非关键帧,由左右视点的关键帧和到下一个关键帧之间所有的立体图像对组成一个立体图像组,根据设定的总目标比特数和初始量化参数,对每个立体图像组的目标比特数和每个立体图像组中第一个立体图像对的量化参数进行 计算,对于第一个立体图像组(i=1),目标比特数第一个立体图像组中第一个立体图像对中左图像的量化参数QPL(1,0)和右图像的量化参数QPR(1,0)直接采用设定的初始量化参数,对于其他立体图像组(i>1),记Tr(i,0)表示开始编码第i个立体图像组的目标比特数,则 T r ( i , 0 ) = u ( i , 0 ) F r × N s - ( B s 8 - B C ( i , 0 ) ) , 第i个立体图像组中第一个立体图像对中左图像的量化参数计算为 QP L ( i , 0 ) = S LQP N s - 1 - 8 T r ( i - 1 , N s ) T r ( i , 0 ) - N s 15 - 1 , 第i个立体图像组中第一个立体图像对中右图像的量化参数计算为  QP R ( i , 0 ) = min { S RQP N s - 1 - 8 T r ( i - 1 , N s ) T r ( i , 0 ) - N s 15 - 1 , QP L ( i , 0 ) + VT QP ( i , 0 ) } , 其中,u(i,0)表示编码第i个立体图像组时可用的信道带宽,Fr表示视频帧率,Ns表示每一个立体图像组中的立体图像对数,Bs表示缓冲区的容量大小,Bc(i,0)表示编码完第i个立体图像组之前的缓冲区饱和度,SLQP、SRQP分别表示前一个立体图像组中左、右图像的非关键帧量化参数的总和,VTQP(i,0)表示在双目掩蔽效应下左右图像之间可允许的量化参数差值,VTQP(i,0)=p1×QPL(i,0)+p2,其中p1、p2分别为常量-0.3265和17.35,在本实施例中,Fr=30,Ns=15。 
③.对当前第i个立体图像组的剩余立体图像对的目标比特数进行预算,记在编码第i个立体图像组中第j个立体图像对前,所有未编码的立体图像对的目标比特数为Tr(i,j), T r ( i , j ) = T r ( i , j - 1 ) + u ( i , j ) - u ( i , j - 1 ) F r × ( N s - j ) - A ( i , j - 1 ) , 其中j≥1,u(i,j)表示编码第i个立体图像组中第j个立体图像对时的带宽,Fr表示视频帧率,Ns表示每一个立体图像组中的立体图像对数,A(i,j-1)表示编码第i个立体图像组中第j-1个立体图像对消耗的比特数; 
④.根据第i个立体图像组中剩余比特数和缓冲区饱和度来计算第i个立体图像组中第j个立体图像对的目标比特数,根据第i个立体图像组中剩余比特数Tr(i,j),计算第j 个立体图像对的第一候选目标比特数为其中Ns表示每一个立体图像组中的立体图像对数,为了防止缓冲区的上溢和下溢,根据缓冲区的占用情况,计算第j个立体图像对的第二候选目标比特数为 T ~ ( i , j ) = u ( i , j ) F r + γ × ( TB ( i , j ) - CB ( i , j ) ) , 其中u(i,j)表示编码第i个立体图像组中第j个立体图像对时的带宽,Fr表示视频帧率,TB(i,j)和CB(i,j)分别表示目标缓冲区大小和实际缓冲区大小,γ为常量0.75,将第一候选目标比特数和第二候选目标比特数进行加权,获取第i个立体图像组中第j个立体图像对的目标比特数 T ( i , j ) = β × T ^ ( i , j ) + ( 1 - β ) × T ~ ( i , j ) , 其中β为常量0.5; 
⑤.通过对立体图像对中左右图像的码率与量化参数之间的统计分析,以Ratio表示立体图像对中左图像与右图像的码率比例,以△QP表示立体图像对中左图像与右图像的量化参数差值,以QPL、QPR分别表示立体图像对中左图像与右图像的量化参数,建立立体图像对中左右图像之间的码率比例与量化参数差值之间的模型,具体过程为: 
⑤-1.任取N个各不相同的编码量化参数作为左图像的编码量化参数值,分别记为QP′L1,QP′L2,…,QP′Li,…,QP′LN,对每一个左图像的编码量化参数值,又分别取M个各不相同的左右图像的编码量化参数差值,分别记为△QP1',△QP2',…,△QPj',…,△QP'M,得到对应的右图像的编码量化参数值,分别记为QP′R1,QP′R2,…,QP′Rk,…,QP′R(M×N),在本实施例中,N=4,M=11; 
⑤-2.采用左图像的编码量化参数QP′L1,QP′L2,…,QP′Li,…,QP′LN和对应的右图像的编码量化参数QP′R1,QP′R2,…,QP′Rk,…,QP′R(M×N),分别对左图像和右图像进行编码,分别得到以该M×N个不同的编码量化参数对左图像和右图像进行编码的码率,分别记为R'L1,R'L2,…,R'Lk,…,R'L(M×N)和R'R1,R'R2,…,R'Rk,…,R'R(M×N),对应的左图像与右图像的码率比例记为Ratio1',Ratio'2,…,Ratio'k,…,Ratio'(M×N); 
⑤-3.将左图像的编码量化参数、左图像与右图像的编码量化参数差值和左图像与右图像的码率比例进行拟合,得到指数模型Ratio=AeB×△QP,其中参数A和B分别表示 指数模型的幅度和频率,与左图像的编码量化参数有关; 
⑤-4.将参数A与左图像的编码量化参数拟合成线性关系,通过线性关系计算参数A,将参数B与左图像的编码量化参数拟合成线性关系,通过线性关系计算参数B。 
在本实施中,图6a和图6b分别给出了“Booksale”和“Akko”的左右图像码率比例、左图像的编码量化参数值和左图像与右图像的量化参数差值的关系曲线,可以看出,该关系曲线基本呈指数关系。图7a和图7b分别给出了参数A与左图像量化参数之间的关系曲线、参数B与左图像量化参数之间的关系曲线,可以看出,参数A基本为固定值1.1,参数B与左图像量化参数呈近似线性关系B=b1×QPL+b2,其中QPL为左图像的量化参数,b1、b2为模型参数。 
⑥.根据第i个立体图像组中第j个立体图像对的目标比特数T(i,j),以QPL(i,j)表示第i个立体图像组中第j个立体图像对中左图像的量化参数,以△QP(i,j)表示第i个立体图像组中第j个立体图像对中左图像与右图像的量化参数差值,以Ratio(i,j)表示第i个立体图像组中第j个立体图像对中左图像与右图像的码率比例,以VTQP(i,j)表示在双目掩蔽效应下第i个立体图像组中第j个立体图像对中左右图像之间可允许的量化参数差值,获取第i个立体图像组中第j个立体图像对中左图像和右图像的目标比特数,分别记为TL(i,j)、TR(i,j),具体过程为: 
⑥-1.对左图像的编码量化参数的取值范围进行约束,QPL'(i,j)的取值范围为QPL'(i,j-1)-△QPTH≤QPL'(i,j)≤QPL'(i,j-1)+△QPTH,其中△QPTH表示固定阈值,并且根据△QP'(i,j)≤VTQP'(i,j),确定Ratio'(i,j)的取值范围,  Ratio ′ ( i , j ) = arg max Q [ A ′ ( i , j ) × e B ′ ( i , j ) × ΔQP ′ ( i , j ) ] ,其中argmax[]表示最大化概率密度函数,Q表示左图像的编码量化参数和左图像与右图像的编码量化参数差值的所有的量化参数组合的集合,(QPL'(i,j),△QP'(i,j))∈Q,参数A'(i,j)和B'(i,j)分别表示编码第i个立体图像组中第j个立体图像对中指数模型的幅度和频率,在本实施例中,△QPTH=2; 
⑥-2.对第i个立体图像组中第j个立体图像对中左图像分配的目标比特数为 
Figure BDA00003501471700111
对第i个立体图像组中第j个立体图像对中右图像分配的目标比特数为 T R ( i , j ) = 1 Ratio ( i , j ) + 1 × T ( i , j ) ·
⑦.根据第i个立体图像组中第j个立体图像对中左图像和右图像的目标比特数TL(i,j)和TR(i,j),分别计算第i个立体图像组中第j个立体图像对中左图像和右图像的量化参数,分别记为QPL(i,j)、QPR(i,j),QPL(i,j)=6log2(QL,step(i,j))+4,QPR(i,j)=6log2(QR,step(i,j))+4,其中QL,step(i,j)和QR,step(i,j)分别表示第i个立体图像组中第j个立体图像对中左图像和右图像的量化步长,QL,step(i,j)和QR,step(i,j)通过二次码率与量化参数模型得到, T L ( i , j ) = a 1 ( i , j ) × MAD L ( i , j ) Q L , step ( i , j ) + a 2 ( i , j ) × MAD L ( i , j ) Q L , step 2 ( i , j ) + H L ( i , j ) , T R ( i , j ) = a 3 ( i , j ) MAD R ( i , j ) Q R , step ( i , j ) + a 4 ( i , j ) × MAD R ( i , j ) Q R , step 2 ( i , j ) + H R ( i , j ) , 其中MADL(i,j)、MADR(i,j)分别为左图像和右图像在编码前与编码后亮度值Y的平均绝对差值,HL(i,j)、HR(i,j)分别为左图像和右图像的头比特数,a1(i,j)、a2(i,j)、a3(i,j)和a4(i,j)为模型参数,采用线性回归模型进行逐帧更新。 
⑧.对当前立体图像组的下一个立体图像对重复执行步骤②至⑦,直至所有立体图像对完成编码。 
⑨.返回步骤②继续执行,直至当前视频中所有立体图像组完成编码。 
以下就利用本发明方法对“Crowd”、“Booksale”、“Ballroom”和“Akko”序列的控制性能进行比较。 
将采用本发明方法的性能与对称控制方法的性能进行比较,对称控制方法是对左右视点图像进行等比例的比特分配。实验中目标码率分别设置为300kbps、600kbps、1000kbps和2000kbps,左右视点各编码150帧,立体图像组长度设置为15,实验结果如表1所示,其中码率控制精度即实际码率相对于目标码率的偏差,记为RCE, 
Figure BDA00003501471700121
其中Rtarget和Ractual分别表示目标码率和实际码率,立体视频客观质量的计算为
Figure BDA00003501471700122
其中PSNRL和PSNRR分别表示左、右视点YUV序列的编码峰值信噪比。从表1可以看出,本发明方法与对称控制方法都能提供较小的码率控制偏差,而本发明方法比对称控制方法能够提供更好的立体视频客观质量,从图8a、图8b、图8c和图8d中的率失真性能对比可以看出,本发明方法的率失真性能明显优于对称控制方法的率失真性能。 
表1本发明方法与对称控制方法码率控制精度和立体视频客观质量比较 
Figure BDA00003501471700123

Claims (3)

1.一种基于双目视觉特性的立体视频码率控制方法,其特征在于通过对立体图像组层、立体图像对层、帧层这三个层次分别进行码率控制,在立体图像组层,计算每个立体图像组的目标比特数并计算关键帧的量化参数;在立体图像对层,根据剩余比特数和缓冲区饱和度来计算每个立体图像对的目标比特数;在帧层,根据人眼双目视觉掩蔽效应,建立了立体指数码率与量化参数模型来优化立体率失真模型,使左图像分配较多的目标比特数,而右图像相对分配较少的目标比特数,最终确定非关键帧的量化参数,其具体包括以下步骤:
①.以双目相机拍摄得到的颜色空间为YUV的立体视频定义为原始立体视频,该立体视频包括左视点视频和右视点视频,YUV序列由3个颜色分量组成,其中Y表示亮度值,U和V分别表示第一色度和第二色度,用来描述色彩及饱和度;
②.根据立体视频编码结构,将同一时刻的左右图像构成一个立体图像对,所述左右视点中的图像帧分为关键帧与非关键帧,由左右视点的关键帧和到下一个关键帧之间所有的立体图像对组成一个立体图像组,根据设定的总目标比特数和初始量化参数,对每个立体图像组的目标比特数和每个立体图像组中第一个立体图像对的量化参数进行计算,对于第一个立体图像组(i=1),目标比特数第一个立体图像组中第一个立体图像对中左图像的量化参数QPL(1,0)和右图像的量化参数QPR(1,0)直接采用设定的初始量化参数,对于其他立体图像组(i>1),记Tr(i,0)表示开始编码第i个立体图像组的目标比特数,则 T r ( i , 0 ) = u ( i , 0 ) F r × N s - ( B s 8 - B C ( i , 0 ) ) , 第i个立体图像组中第一个立体图像对中左图像的量化参数计算为 QP L ( i , 0 ) = S LQP N s - 1 - 8 T r ( i - 1 , N s ) T r ( i , 0 ) - N s 15 - 1 , 第i个立体图像组中第一个立体图像对中右图像的量化参数计算为 QP R ( i , 0 ) = min { S RQP N s - 1 - 8 T r ( i - 1 , N s ) T r ( i , 0 ) - N s 15 - 1 , QP L ( i , 0 ) + VT QP ( i , 0 ) } , 其中,u(i,0)表示编码第i个立体图像组时可用的信道带宽,Fr表示视频帧率,Ns表示每一个立体图像组中的立体图像对数,Bs表示缓冲区的容量大小,Bc(i,0)表示编码完第i个立体图像组之前的缓冲区饱和度,SLQP、SRQP分别表示前一个立体图像组中左、右图像的非关键帧量化参数的总和,VTQP(i,0)表示在双目掩蔽效应下左右图像之间可允许的量化参数差值,VTQP(i,0)=p1×QPL(i,0)+p2,其中p1、p2分别为常量-0.3265和17.35;
③.对当前第i个立体图像组的剩余立体图像对的目标比特数进行预算,记在编码第i个立体图像组中第j个立体图像对前,所有未编码的立体图像对的目标比特数为Tr(i,j), T r ( i , j ) = T r ( i , j - 1 ) + u ( i , j ) - u ( i , j - 1 ) F r × ( N - j ) - A ( i , j - 1 ) , 其中j≥1,u(i,j)表示编码第i个立体图像组中第j个立体图像对时的带宽,Fr表示视频帧率,N表示每一个立体图像组中的立体图像对数,A(i,j-1)表示编码第i个立体图像组中第j-1个立体图像对消耗的比特数;
④.根据第i个立体图像组中剩余比特数和缓冲区饱和度来计算第i个立体图像组中第j个立体图像对的目标比特数,根据第i个立体图像组中剩余比特数Tr(i,j),计算第j个立体图像对的第一候选目标比特数为
Figure FDA00003501471600022
其中N表示每一个立体图像组中的立体图像对数,为了防止缓冲区的上溢和下溢,根据缓冲区的占用情况,计算第j个立体图像对的第二候选目标比特数为其中u(i,j)表示编码第i个立体图像组中第j个立体图像对时的带宽,Fr表示视频帧率,TB(i,j)和CB(i,j)分别表示目标缓冲区大小和实际缓冲区大小,γ为常量0.75,将第一候选目标比特数和第二候选目标比特数进行加权,获取第i个立体图像组中第j个立体图像对的目标比特数 T ( i , j ) = β × T ^ ( i , j ) + ( 1 - β ) × T ~ ( i , j ) , 其中β为常量0.5;
⑤.通过对立体图像对中左右图像的码率与量化参数之间的统计分析,以Ratio表示立体图像对中左图像与右图像的码率比例,以△QP表示立体图像对中左图像与右图像的量化参数差值,以QPL、QPR分别表示立体图像对中左图像与右图像的量化参数,建立立体图像对中左右图像之间的码率比例与量化参数差值之间的模型;
⑥.根据第i个立体图像组中第j个立体图像对的目标比特数T(i,j),以QPL(i,j)表示第i个立体图像组中第j个立体图像对中左图像的量化参数,以△QP(i,j)表示第i个立体图像组中第j个立体图像对中左图像与右图像的量化参数差值,以Ratio(i,j)表示第i个立体图像组中第j个立体图像对中左图像与右图像的码率比例,以VTQP(i,j)表示在双目掩蔽效应下第i个立体图像组中第j个立体图像对中左右图像之间可允许的量化参数差值,获取第i个立体图像组中第j个立体图像对中左图像和右图像的目标比特数,分别记为TL(i,j)、TR(i,j);
⑦.根据第i个立体图像组中第j个立体图像对中左图像和右图像的目标比特数TL(i,j)和TR(i,j),分别计算第i个立体图像组中第j个立体图像对中左图像和右图像的量化参数,分别记为QPL(i,j)、QPR(i,j),QPL(i,j)=6log2(QL,step(i,j))+4,QPR(i,j)=6log2(QR,step(i,j))+4,其中QL,step(i,j)和QR,step(i,j)分别表示第i个立体图像组中第j个立体图像对中左图像和右图像的量化步长,QL,step(i,j)和QR,step(i,j)通过二次码率与量化参数模型得到, T L ( i , j ) = a 1 ( i , j ) × MAD L ( i , j ) Q L , step ( i , j ) + a 2 ( i , j ) × MAD L ( i , j ) Q L , step 2 ( i , j ) + H L ( i , j ) , T R ( i , j ) = a 3 ( i , j ) × MAD R ( i , j ) Q R , step ( i , j ) + a 4 ( i , j ) × MAD R ( i , j ) Q R , step 2 ( i , j ) + H R ( i , j ) , 其中MADL(i,j)、MADR(i,j)分别为左图像和右图像在编码前与编码后亮度值Y的平均绝对差值,HL(i,j)、HR(i,j)分别为左图像和右图像的头比特数,a1(i,j)、a2(i,j)、a3(i,j)和a4(i,j)为模型参数,采用线性回归模型进行逐帧更新;
⑧.对当前立体图像组的下一个立体图像对重复执行步骤②至⑦,直至所有立体图像对完成编码;
⑨.返回步骤②继续执行,直至当前视频中所有立体图像组完成编码。
2.根据权利要求1所述的一种基于双目视觉特性的立体视频码率控制方法,其特征在于所述的步骤⑤的具体过程为:
⑤-1.任取N个各不相同的编码量化参数作为左图像的编码量化参数值,分别记为QP′L1,QP′L2,…,QP′Li,…,QP′LN,对每一个左图像的编码量化参数值,又分别取M个各不相同的左右图像的编码量化参数差值,分别记为△QP1',△QP2',…,△QPj',…,△QP'M,得到对应的右图像的编码量化参数值,分别记为QP′R1,QP′R2,…,QP′Rk,…,QP′R(M×N)
⑤-2.采用左图像的编码量化参数QP′L1,QP′L2,…,QP′Li,…,QP′LN和对应的右图像的编码量化参数QP′R1,QP′R2,…,QP′Rk,…,QP′R(M×N),分别对左图像和右图像进行编码,分别得到以该M×N个不同的编码量化参数对左图像和右图像进行编码的码率,分别记为R'L1,R'L2,…,R'Lk,…,R'L(M×N)和R'R1,R'R2,…,R'Rk,…,R'R(M×N),对应的左图像与右图像的码率比例记为Ratio1',Ratio'2,…,Ratio'k,…,Ratio'(M×N)
⑤-3.将左图像的编码量化参数、左图像与右图像的编码量化参数差值和左图像与右图像的码率比例进行拟合,得到指数模型Ratio=AeB×△QP,其中参数A和B分别表示指数模型的幅度和频率,与左图像的编码量化参数有关;
⑤-4.将参数A与左图像的编码量化参数拟合成线性关系,通过线性关系计算参数A,将参数B与左图像的编码量化参数拟合成线性关系,通过线性关系计算参数B。
3.根据权利要求1所述的一种基于双目视觉特性的立体视频码率控制方法,其特征在于所述的步骤⑥的具体过程为:
⑥-1.对左图像的编码量化参数的取值范围进行约束,QPL'(i,j)的取值范围为QPL'(i,j-1)-△QPTH≤QPL'(i,j)≤QPL'(i,j-1)+△QPTH,其中△QPTH表示固定阈值,并且根据△QP'(i,j)≤VTQP'(i,j),确定Ratio'(i,j)的取值范围, Ratio ′ ( i , j ) = arg max Q [ A ′ ( i , j ) × e B ′ ( i , j ) × ΔQP ′ ( i , j ) ] , 其中argmax[]表示最大化概率密度函数,Q表示左图像的编码量化参数和左图像与右图像的编码量化参数差值的所有的量化参数组合的集合,(QPL'(i,j),△QP'(i,j))∈Q,参数A'(i,j)和B'(i,j)分别表示编码第i个立体图像组中第j个立体图像对中指数模型的幅度和频率;
⑥-2.对第i个立体图像组中第j个立体图像对中左图像分配的目标比特数为
Figure FDA00003501471600051
对第i个立体图像组中第j个立体图像对中右图像分配的目标比特数为 T R ( i , j ) = 1 Ratio ( i , j ) + 1 × T ( i , j ) ·
CN201310294675.7A 2013-07-12 2013-07-12 一种基于双目视觉特性的立体视频码率控制方法 Expired - Fee Related CN103391436B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310294675.7A CN103391436B (zh) 2013-07-12 2013-07-12 一种基于双目视觉特性的立体视频码率控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310294675.7A CN103391436B (zh) 2013-07-12 2013-07-12 一种基于双目视觉特性的立体视频码率控制方法

Publications (2)

Publication Number Publication Date
CN103391436A true CN103391436A (zh) 2013-11-13
CN103391436B CN103391436B (zh) 2016-06-29

Family

ID=49535580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310294675.7A Expired - Fee Related CN103391436B (zh) 2013-07-12 2013-07-12 一种基于双目视觉特性的立体视频码率控制方法

Country Status (1)

Country Link
CN (1) CN103391436B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111711810A (zh) * 2020-06-30 2020-09-25 福州大学 基于非对称码率分配的立体视频传输方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102137258A (zh) * 2011-03-22 2011-07-27 宁波大学 一种立体视频码率控制方法
KR20120096911A (ko) * 2011-02-23 2012-08-31 한국항공대학교산학협력단 비디오 비트율 제어 방법 및 그 장치
CN102724524A (zh) * 2012-06-01 2012-10-10 宁波大学 一种基于h.264 的立体视频码率控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120096911A (ko) * 2011-02-23 2012-08-31 한국항공대학교산학협력단 비디오 비트율 제어 방법 및 그 장치
CN102137258A (zh) * 2011-03-22 2011-07-27 宁波大学 一种立体视频码率控制方法
CN102724524A (zh) * 2012-06-01 2012-10-10 宁波大学 一种基于h.264 的立体视频码率控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨文成: "立体视频编码中的码率控制算法研究", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *
柯仲华: "立体视频编码优化方法", 《中国优秀硕士学位论文全文数据库(电子期刊)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111711810A (zh) * 2020-06-30 2020-09-25 福州大学 基于非对称码率分配的立体视频传输方法
CN111711810B (zh) * 2020-06-30 2021-06-22 福州大学 基于非对称码率分配的立体视频传输方法

Also Published As

Publication number Publication date
CN103391436B (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
CN103179405B (zh) 一种基于多级感兴趣区域的多视点视频编码方法
CN101547349B (zh) 一种对视频信号的二次avs编码码率控制的方法
CN101835056B (zh) 基于模型的纹理视频与深度图的最优码率分配方法
CN101888566B (zh) 立体视频编码率失真性能估计方法
CN103024387B (zh) 一种基于感知的多视点视频码率控制方法
CN101466035B (zh) 一种基于h.264的视频图像组比特分配方法
CN102137258B (zh) 一种立体视频码率控制方法
CN102630013B (zh) 基于场景切换的码率控制视频压缩方法和装置
CN100562116C (zh) 一种面向多视点视频的码率控制方法
CN104079933B (zh) 适用于hevc的低延时码率控制方法及比特数分配方法
CN103281530B (zh) 基于率失真优化的hevc码率控制方法
CN105049850A (zh) 基于感兴趣区域的hevc码率控制方法
CN101572806B (zh) 一种基于h.264的i帧码率控制方法
CN102938840A (zh) 应用于多视点视频编码系统的关键帧量化参数选择方法
CN101621683A (zh) 一种基于avs的快速立体视频编码方法
CN111447446B (zh) 一种基于人眼视觉区域重要性分析的hevc码率控制方法
CN102164281B (zh) 一种基于视觉显著度模型的视频编码码率控制方法
CN103414889B (zh) 一种基于双目恰可察觉失真的立体视频码率控制方法
CN102420987A (zh) 基于分层b帧结构的码率控制的自适应比特分配方法
CN106888374B (zh) 一种三维视频编码方法、装置及视频处理设备
CN103391436A (zh) 一种基于双目视觉特性的立体视频码率控制方法
CN101511026A (zh) 一种基于场景的avs二次编码码率控制方法
CN102724524B (zh) 一种基于h.264 的立体视频码率控制方法
CN109618156A (zh) 一种视频编码码率调整方法
Shao et al. A novel rate control technique for asymmetric-quality stereoscopic video

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160629

CF01 Termination of patent right due to non-payment of annual fee