CN103546758A - 一种快速深度图序列帧间模式选择分形编码方法 - Google Patents

一种快速深度图序列帧间模式选择分形编码方法 Download PDF

Info

Publication number
CN103546758A
CN103546758A CN201310453269.0A CN201310453269A CN103546758A CN 103546758 A CN103546758 A CN 103546758A CN 201310453269 A CN201310453269 A CN 201310453269A CN 103546758 A CN103546758 A CN 103546758A
Authority
CN
China
Prior art keywords
frame
coding
depth map
mode
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310453269.0A
Other languages
English (en)
Other versions
CN103546758B (zh
Inventor
祝世平
赵冬玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FENGXIAN XINZHONGMU FEED CO.,LTD.
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201310453269.0A priority Critical patent/CN103546758B/zh
Publication of CN103546758A publication Critical patent/CN103546758A/zh
Application granted granted Critical
Publication of CN103546758B publication Critical patent/CN103546758B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提出了一种快速深度图序列帧间模式选择分形编码方法。首先使用分形视频压缩方法编码彩色视频,然后用分形视频解压缩方法解码彩色视频,以获得彩色视频各宏块编码模式,利用深度图序列帧宏块与相应彩色视频宏块编码的相关性,设计了深度图序列帧宏块编码模式复杂度计算公式。深度图序列的I帧编码采用H.264帧内预测编码方法;深度图序列的P帧编码,首先使用Roberts算子检测对象边界,如果当前深度图序列帧宏块包含对象边界,则使用传统的全搜索编码方法,遍历所有模式,根据拉格朗日率失真优化模型获得最佳编码模式;否则计算当前深度图序列帧宏块的编码模式复杂度,针对复杂度大于阈值T与小于等于阈值T两种情况,分别在不同的有效模式中选择最佳编码模式,然后用分形法编码深度图序列帧宏块。

Description

一种快速深度图序列帧间模式选择分形编码方法
技术领域:
本发明属于三维视频压缩编码领域,涉及深度图序列的压缩编码,为三维立体视频编码的实时性应用奠定了基础,进一步提高了基于深度图的立体视频压缩编码的性能。
背景技术:
深度图所代表的是场景到摄像机成像平面的距离信息,它将实际深度值量化到[0,255],以获得代表深度信息的灰度图(参见Tanimoto M,Fujii T,Suzuki K,et al.Multi-view depth mapof Rena and Akko&Kayo[C],ISO/IEC JTC1/SC29/WG11,MPEG-M14888,China:Shenzhen,2007.)。
深度图压缩是三维视频系统中的核心技术。目前,对深度图序列压缩的方法,主要是基于H.264/AVC标准。如杨旭等针对三维视频编码复杂度较高的问题,提出一种快速深度图像帧内编码方法,该方法基于视频图像与深度图像的相关性,利用视频图像的最优帧内预测模式信息,优化深度图像帧内编码预测模式的选择范围,减少率失真代价函数的计算量,从而降低深度图像帧内编码复杂度(参见杨旭,常义,林霍等.一种三维视频深度图像快速帧内编码方法[J].西安电子科技大学学报(自然科学版),2012,39(3):7-13.)。Byung Tae Oh等定义了一个深度失真函数(参见Byung Tae Oh,Jaejoon Lee,Du-sik Park.Depth map coding based onsynthesized view distortion function[J].IEEE Journal of Selected Topics in Signal Processing.2011,5(7):1344-1352.)。D.V.S.X.De Silva等提出了新的模式选择方法(参见D.V.S.X.De Silva,W.A.C.Fernando,S.T.Worrall.Intra mode selection method for depth maps of3D video based onrendering distortion modeling.IEEE Transactions on Consumer Electronics,2010,56(4):2735-2740.)。
近年来分形理论也被应用到视频序列的压缩上,其基本思想是在视频编码过程中将每视频帧(首帧除外)上的子块从前一帧而不是同一帧找相匹配的父块。其中最为经典和影响较大的参见(C.S.Kim,R.C.Kim,S.U.Lee.Fractal coding of video sequence using circularprediction mapping and noncontractive inter frame mapping[J].IEEE Transactions on ImageProcessing,1998,7(4):601-605.)。该方法采用类似于标准视频编码方法所采用的运动估计/补偿技术,利用了相邻帧之间的时间强相关性,对视频序列压缩取得了较好的效果。KojiOhse与Masahiro Nakagawa提出将视频序列变换到频率域,再应用分形视频压缩方法将不同分量的序列压缩编码(参见Koji Ohse,Masahiro Nakagawa.Fractal video coding withthe orthogonal transformation[J],Electronics and Communications in Japan,2007,90(3):36-47),此方法提供了在确定压缩比的情况下,实现对视频较好的压缩。张喻平与丰洪才提出了一种利用遗传算法提高视频分形压缩编码搜索速度的算法。(参见张喻平,丰洪才.利用遗传算法提高视频分形压缩编码搜索速度[J].计算机与数字工程,2007,35(1):28-30.)这种基于遗传算法的视频分形压缩编码改进了遗传算法中搜索空间的构造机理,结合运用合适的迭代函数系统和仿射变换,从而缩短了压缩编码时间,并且视频的恢复质量略优于全搜索算法和传统的分形压缩算法。
为了解决目前基于深度图的三维视频编码复杂度高的问题,本发明方法实现了一种利用深度图序列帧宏块与相应彩色视频宏块编码模式相关性,预先计算深度图序列帧宏块的编码模式复杂度,以达到深度图序列分形编码时快速帧间模式选择的目的。实验证明,该方法实现了深度图序列压缩编码,并且编码时间及编码码率明显减少。
发明内容:
本发明提出了一种快速深度图序列帧间模式选择分形编码方法。首先使用分形视频压缩方法编码彩色视频,然后用分形视频解压缩方法解码彩色视频,以获得彩色视频各宏块编码模式,利用深度图序列帧宏块与相应彩色视频宏块编码的相关性,设计了深度图序列帧宏块编码模式复杂度计算公式。深度图序列的I帧编码采用H.264帧内预测编码方法;深度图序列的P帧编码,首先使用Roberts算子检测对象边界,如果当前深度图序列帧宏块包含对象边界,则使用传统的全搜索编码方法,遍历所有模式,根据拉格朗日率失真优化准则获得最佳编码模式;否则计算当前深度图序列帧宏块的编码模式复杂度,并设定阈值T,对于编码模式复杂度大于阈值T的深度图序列帧宏块,在16×8、8×16、8×8、8×4、4×8、4×4六种模式中用拉格朗日率失真优化算法选择最佳编码模式,对于编码模式复杂度小于等于阈值T的深度图序列帧宏块则在SKIP、16×16两种编码模式中选择最佳编码模式,然后用分形法编码深度图序列帧宏块。
一种快速深度图序列帧间模式选择分形编码方法,其特征在于实现步骤如下:
步骤一:使用基于分形的视频压缩方法编码彩色视频;
步骤二:使用基于分形的视频解压缩方法解码彩色视频,以获得彩色视频各宏块编码模式;
步骤三:若为深度图序列的I帧(第一帧必须为I帧,其它帧可以设置是否为I帧),使用H.264帧内预测编码方法编码I帧,转到步骤八;若为深度图序列的P帧,转到步骤四;
步骤四:对深度图序列的P帧,使用Roberts算子检测对象边界;
步骤五:依次对当前深度图序列帧的所有宏块进行编码。如果当前深度图序列帧宏块包含对象边界,则使用传统的全搜索编码方法,遍历所有模式,根据拉格朗日率失真优化准则获得最佳编码模式,转到步骤七;否则,转到步骤六;
步骤六:由编码模式复杂度计算公式计算当前深度图序列帧宏块的编码模式复杂度,设定阈值T,若当前深度图序列帧宏块的编码模式复杂度大于阈值T(当前深度图序列帧宏块属于复杂模式区域),则在16×8、8×16、8×8、8×4、4×8、4×4六种模式中用拉格朗日率失真优化算法选择最佳编码模式;否则(当前深度图序列帧宏块属于简单模式区域)在SKIP、16×16两种编码模式中选择最佳编码模式;
步骤七:用步骤一的分形编码方法使用最佳编码模式编码当前深度图序列帧宏块。判断当前宏块是否为当前深度图序列帧的最后一个宏块,若是最后一个宏块,则转到步骤三编码下一帧;否则转到步骤五编码下一宏块;
步骤八:判断当前帧是否为深度图序列最后一帧,如果是最后一帧结束编码;否则,返回步骤三继续处理下一帧深度图像。
所述一种快速深度图序列帧间模式选择分形编码方法,处理的彩色视频与深度图序列均为YUV格式。
所述步骤一中基于分形的视频压缩方法包括以下四个步骤:
1)如果是I帧(第一帧必须为I帧,其它帧可以设置是否为I帧),采用H.264帧内预测编码方式,对于每个当前块在各种可能的预测方式中选择具有最小代价的预测模式,完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧。转入步骤3)编码残差;如果是P帧,转到步骤2);
2)如果是P帧。依次对当前帧的所有宏块进行编码。在参考帧中的搜索窗内对当前宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;对每个宏块进行树状结构分块,即分块从大到小可分为16×16、16×8、8×16、8×8,8×8往下(亚宏块分割)可以分为8×4、4×8、4×4。帧间编码时,首先对编码宏块的各种块划分尺寸的帧间预测模式进行运动估计,确定迭代函数系统系数即IFS系数;然后比较所有模式的率失真代价;最后将率失真代价最小的模式作为最优帧间预测模式。
IFS系数由如下的率失真优化函数确定:
JMOTION=MSE(s,o,x,y,ref)+λMOTION*R(s,o,x,y,ref)     (1)
其中IFS系数包括父块位置(x,y)和比例因子s、偏移因子o,s和o的计算公式如下:
s = [ N Σ i = 1 N r i d i - Σ i = 1 N r i Σ i = 1 N d i ] [ N Σ i = 1 N d i 2 - ( Σ i = 1 N d i ) 2 ] - - - ( 2 )
o = 1 N [ Σ i = 1 N r i - s Σ i = 1 N d i ] - - - ( 3 )
式中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值。
最优帧间预测模式由如下率失真优化函数确定:
J(s,c,MODE|QP,λMODE)=SSD(s,c,MODE|QP)+λMODE*R(s,c,MODE|QP)   (4)
对宏块的最佳分块模式,保存相应IFS系数,转入步骤4)得到本块的重建块。
如果当前帧所有的宏块都已编码完毕,所有的重建块组成重建图像(即下一帧的参考帧)。原始图像与重建图像之差得到残差图像,转到步骤3)编码残差;
3)残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描,然后用熵编码CABAC进行编码写入码流;另一方面经过反量化、反变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行有符号指数哥伦布编码。判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤1)继续处理下一帧图像;
4)通过保存的迭代函数系统系数代入解码方程式
ri=s·di+o        (5)
计算得到预测值,由原始块和预测块之差得到编码端残差块,再由预测块和解码端残差块之和得到重建块。
其中,解码端残差块是由编码端残差块经过DCT变换、量化、反量化和反DCT变换得到的。转入步骤2)编码P帧下一宏块。
所述步骤二中基于分形的视频解压缩方法包括以下五个步骤:
1)解码端获得压缩的码流。码流中数据元素首先进行熵解码和重排序,获得一系列量化系数,这些系数经过反量化和反变换得到残差数据;
2)判断解码帧是否为I帧,若是I帧转入步骤3),否则转入步骤4);
3)对于I帧,首先由H.264帧内预测方式得到预测帧,预测帧与残差帧进行相加之后得到重建帧,帧数加1转入步骤5);
4)对于P帧,首先从码流中读入该帧所有宏块的划分方式、每一个小块的迭代函数系统系数与运动矢量,由各迭代函数系统系数和运动矢量分别计算出解码端的预测块形成解码端的预测帧,预测帧与残差帧相加得到重建帧。帧数加1转到步骤5);
5)判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤2)。
所述步骤六中当前深度图序列帧宏块编码模式复杂度计算公式为:
EMC = 0.5 w C cor + 0.1 ( w C left + w C up + w D left + w D up ) + 0.05 ( w C upleft + w D upleft ) - - - ( 6 )
其中Dleft、Dup、Dupleft分别代表当前深度图序列帧宏块的左、上、左上邻居宏块,Ccor代表与当前深度图序列帧宏块相对应的彩色视频宏块,Cleft、Cup、Cupleft分别代表Ccor的左、上、左上邻居彩色宏块,
Figure BDA0000389626000000052
分别代表相应宏块的编码模式影响因子,数值越大表明其对应的宏块编码模式越复杂,具体数值如表1所示。
模式 SKIP 16×16 16×8 8×16 8×8(含8×4、4×8、4×4)
影响因子w 1 1 2 2 4
表1编码模式影响因子表
式(6)中的0.5、0.1、0.05表示各宏块加权系数,其取值原则是所有加权系数之和为1,且对当前深度图序列帧宏块预测编码模式影响越大的宏块加权系数越大。
本发明所提出的一种快速深度图序列帧间模式选择分形编码方法的优点在于:
(1)本方法中彩色视频与深度序列的分形I帧编码结合了H.264帧内预测多种预测方向预测I帧,改进了分形视频编码I帧的质量;
(2)本方法针对深度序列的P帧编码,利用了深度图序列帧宏块与相应彩色视频宏块编码模式的相关性。并针对深度图序列帧宏块包含对象边界与不包含对象边界两种情况,分别采用不同的搜索策略,以减少宏块编码模式搜索时间;
(3)本方法针对深度图序列帧宏块不包含对象边界情况,首先计算深度图序列帧宏块编码模式复杂度,并设定阈值T,若当前深度图序列帧宏块的编码模式复杂度大于阈值T(当前深度图序列帧宏块属于复杂模式区域),则在16×8、8×16、8×8、8×4、4×8、4×4六种模式中用拉格朗日率失真优化算法选择最佳编码模式;否则(当前深度图序列帧宏块属于简单模式区域)在SKIP、16×16两种编码模式中选择最佳编码模式。编码模式复杂度计算公式的设计依据彩色视频宏块与相应深度图序列帧宏块编码模式的相关性。
附图说明:
图1为本发明一种快速深度图序列帧间模式选择分形编码方法流程图;
图2(a)为微软研究院交互视觉媒体组提供的测试序列“Ballet”的彩色视频第3帧;
图2(b)为微软研究院交互视觉媒体组提供的测试序列“Ballet”的深度图序列第3帧;
图3(a)为本发明一种快速深度图序列帧间模式选择分形编码方法步骤一中帧内预测模式选择流程图;
图3(b)为本发明一种快速深度图序列帧间模式选择分形编码方法步骤一中帧间编码模式选择流程图;
图4为本发明一种快速深度图序列帧间模式选择分形编码方法步骤二中解码经本发明方法压缩编码以后的测试序列“Ballet”的彩色视频第3帧宏块编码模式示意图;
图5为使用Roberts算子对测试序列“Ballet”的深度图序列第3帧对象边界检测结果图;
图6为Dleft、Dup、Dupleft、Cleft、Cup、Cupleft、Ccor与当前深度图序列帧宏块之间的位置关系图;
图7为本发明一种快速深度图序列帧间模式选择分形编码方法解码经本发明方法压缩编码以后的测试序列“Ballet”的深度图序列第3帧结果图像;
图8(a)为本发明一种快速深度图序列帧间模式选择分形编码方法与传统的国际视频编码标准H.264标准测试模型JM18.1方法对“Ballet”深度图序列的2~9帧进行压缩编码的峰值信噪比的对比图;
图8(b)为本发明一种快速深度图序列帧间模式选择分形编码方法与传统的国际视频编码标准H.264标准测试模型JM18.1方法对“Ballet”深度图序列的前2~9帧进行编码的比特数的对比图;
图8(c)为本发明一种快速深度图序列帧间模式选择分形编码方法与传统的国际视频编码标准H.264标准测试模型JM18.1方法对“Ballet”深度图序列的前2~9帧进行压缩的时间的对比图。
具体实施方式:
下面将结合附图对本发明方法作进一步的详细说明,仅以亮度分量Y为例,色度分量U和V的压缩步骤与亮度分量基本相同。
本发明提出了一种快速深度图序列帧间模式选择分形编码方法。首先使用分形视频压缩方法编码彩色视频,然后用分形视频解压缩方法解码彩色视频,以获得彩色视频各宏块编码模式,利用深度图序列帧宏块与相应彩色视频宏块编码的相关性,设计了深度图序列帧宏块编码模式复杂度计算公式。深度图序列的I帧编码采用H.264帧内预测编码方法;深度图序列的P帧编码,首先使用Roberts算子检测对象边界,如果当前深度图序列帧宏块包含对象边界,则使用传统的全搜索编码方法,遍历所有模式,根据拉格朗日率失真优化准则获得最佳编码模式;否则计算当前深度图序列帧宏块的编码模式复杂度,并设定阈值T,对于编码模式复杂度大于阈值T的深度图序列帧宏块,在16×8、8×16、8×8、8×4、4×8、4×4六种模式中用拉格朗日率失真优化算法选择最佳编码模式,对于编码模式复杂度小于等于阈值T的深度图序列帧宏块则在SKIP、16×16两种编码模式中选择最佳编码模式,然后用分形法编码深度图序列帧宏块。
如附图1所示,一种快速深度图序列帧间模式选择分形编码方法流程图。以微软研究院交互视觉媒体组提供的测试序列“Ballet”的前10帧为例,编码图像组结构设置为IPPP…,即仅第1帧编码为I帧,其余帧编码为P帧。附图2(a)是测试序列“Ballet”彩色视频的第3帧,附图2(b)是其相应的深度图。
步骤一:使用基于分形的视频压缩方法编码彩色视频。具体步骤如下:
第1步、彩色视频的I帧编码,采用H.264帧内预测方式,其中4×4亮度块有9种预测方式,16×16亮度块和8×8色度块有四种预测方式。附图3(a)为帧内预测模式选择流程图。每个宏块的预测要对各种可能的宏块预测模式进行搜索,采用基于拉格朗日率失真优化的模式判决方法,编码器对每个宏块所有可能的模式分别计算率失真代价,然后对它们进行比较。选择率失真代价最小的模式为最佳模式。率失真代价函数J定义如下:
J(s,c,MODE|QP,λMODE)=SSD(s,c,MODE|QP)+λMODE*R(s,c,MODE|QP)    (7)
通过原始帧和预测帧之差得到编码端残差帧,转入第3步编码残差;
第2步、彩色视频P帧编码。依次对当前P帧的所有宏块进行编码。附图3(b)为帧间编码模式选择流程图。在参考帧中的搜索窗内对当前宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;对每个宏块进行树状结构分块,即分块从大到小可分为16×16、16×8、8×16、8×8,8×8往下(亚宏块分割)可以分为8×4、4×8、4×4。帧间编码时,首先对编码宏块的各种块划分尺寸的帧间预测模式进行运动估计,确定迭代函数系统系数即IFS系数;然后比较所有模式的率失真代价;最后将率失真代价最小的模式作为最优帧间预测模式。
IFS系数由如下的率失真优化函数确定:
JMOTION=MSE(s,o,x,y,ref)+λMOTION*R(s,o,x,y,ref)   (8)
其中IFS系数包括父块位置(x,y)和比例因子s、偏移因子o,s和o的计算公式如下:
s = [ N Σ i = 1 N r i d i - Σ i = 1 N r i Σ i = 1 N d i ] [ N Σ i = 1 N d i 2 - ( Σ i = 1 N d i ) 2 ] - - - ( 9 )
o = 1 N [ Σ i = 1 N r i - s Σ i = 1 N d i ] - - - ( 10 )
式中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值。
最优帧间预测模式由如下率失真优化函数确定:
J(s,c,MODE|QP,λMODE)=SSD(s,c,MODE|QP)+λMODE*R(s,c,MODE|QP)   (11)
对宏块的最佳分块模式,保存相应IFS系数,转入第4步得到本块的重建块。
如果当前帧所有的宏块都已编码完毕,所有的重建块组成重建图像(即下一帧的参考帧)。原始图像与重建图像之差得到残差图像,转到第3步编码残差;
第3步、残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描,然后用熵编码CABAC进行编码写入码流;另一方面经过反量化、反变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行有符号指数哥伦布编码。判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回第1步继续处理下一帧图像;
第4步、通过保存的迭代函数系统系数代入解码方程式
ri=s·di+o     (12)
计算得到预测值,由原始块和预测块之差得到编码端残差块,再由预测块和解码端残差块之和得到重建块。转入第2步编码P帧下一宏块。
步骤二:使用基于分形的视频解压缩方法解码彩色视频,以获得彩色视频各宏块编码模式。测试序列“Ballet”彩色视频第3帧解码结果图及各宏块编码模式见附图4。具体步骤如下:
第1步、解码端获得压缩的码流。码流中数据元素首先进行熵解码和重排序,获得一系列量化系数,这些系数经过反量化和反变换得到残差数据;
第2步、判断解码帧是否为I帧,若是I帧转入第3步,否则转到第4步;
第3步、对于I帧,首先由H.264帧内预测方式得到预测帧,预测帧与残差帧进行相加之后得到重建帧,帧数加1转到第5步;
第4步、对于P帧,首先从码流中读入该帧所有宏块的划分方式、每一个小块的迭代函数系统系数与运动矢量,由各迭代函数系统系数和运动矢量分别计算出解码端的预测块形成解码端的预测帧,预测帧与残差帧相加得到重建帧。帧数加1转到第5步;
第5步、判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入第2步。
步骤三:采用H.264帧内预测编码方式编码深度图序列的第一帧(I帧),具体步骤参见步骤一中的第1步,不再赘述。
步骤四:对深度图序列的P帧(第2—10帧设为P帧),使用Roberts算子检测对象边界。附图5为测试序列“Ballet”深度图序列第3帧使用Roberts算子进行对象边界检测的结果图。
边缘检测算子种类很多,这里选择Roberts边缘检测算子对深度图序列的P帧进行对象边界提取。
令f(x,y)为输入图像,fr(x,y)为输出图像,则Roberts边缘梯度可以由下式求出:
fr(x,y)={[f(x,y)×Rx]2+[f(x,y)×Ry]2}1/2       (13)
其中: R x = 1 0 0 - 1 R y = 0 1 - 1 0
步骤五:依次对当前深度图序列帧的所有宏块进行编码。如果当前深度图序列帧宏块包含对象边界,则使用传统的全搜索编码方法,遍历所有模式,根据拉格朗日率失真优化准则获得最佳编码模式,转到步骤七;否则,转到步骤六。
步骤六:由编码模式复杂度计算公式计算当前深度图序列帧宏块的编码模式复杂度,设定阈值T(经验值为1.1),若当前深度图序列帧宏块的编码模式复杂度大于阈值T(当前深度图序列帧宏块属于复杂模式区域),则在16×8、8×16、8×8、8×4、4×8、4×4六种模式中用拉格朗日率失真优化算法选择最佳编码模式;否则(当前深度图序列帧宏块属于简单模式区域)在SKIP、16×16两种编码模式中选择最佳编码模式。
深度图序列帧宏块编码模式复杂度计算公式为:
EMC = 0.5 w C cor + 0.1 ( w C left + w C up + w D left + w D up ) + 0.05 ( w C upleft + w D upleft ) - - - ( 14 )
其中Dleft、Dup、Dupleft分别代表当前深度图序列帧宏块的左、上、左上邻居宏块,Ccor代表与当前深度图序列帧宏块相对应的彩色视频宏块,Cleft、Cup、Cupleft分别代表Ccor的左、上、左上邻居彩色宏块,它们之间的位置关系如附图6所示。
Figure BDA0000389626000000104
Figure BDA0000389626000000105
分别代表相应宏块的编码模式影响因子,数值越大表明其对应的宏块编码模式越复杂,具体数值如表1所示。
式(14)中的0.5、0.1、0.05表示各宏块加权系数,其取值原则是所有加权系数之和为1,且对当前深度图序列帧宏块预测编码模式影响越大的宏块加权系数越大。
步骤七:用步骤一的分形编码方法使用最佳编码模式编码当前深度图序列帧宏块。判断当前宏块是否为当前深度图序列帧的最后一个宏块,若是最后一个宏块,则转到步骤三编码下一帧;否则转到步骤四编码深度图序列P帧下一宏块。
步骤八:判断当前帧是否为深度图序列最后一帧,如果是最后一帧结束编码;否则,返回步骤四继续处理下一帧深度图像。
本方法处理的彩色视频与深度图序列均为YUV格式,本方法选择Visual C++6.0作为所述方法的实现平台,CPU为Intel CoreTM2Duo T8300,2.4GHz主频,内存大小为2G,对测试序列“Ballet”进行了快速深度图序列帧间模式选择分形编码实验,配置参数如下:总帧数为10帧,只有首帧为I帧,搜索范围为±7,量化参数QP为24。附图7为经本发明一种快速深度图序列帧间模式选择分形编码方法压缩再重建后的“Ballet”深度图序列第3帧结果图。
分别采用传统的国际视频编码标准H.264标准测试模型JM18.1和本发明方法对“Ballet”深度图序列的2~9帧进行压缩编码的峰值信噪比的对比图如附图8(a)所示;分别采用JM18.1和本发明方法对“Ballet”深度图序列的前2~9帧进行编码的比特数的对比图如附图8(b)所示;分别采用H.264标准测试模型JM18.1和本发明方法对“Ballet”深度图序列的前2~9帧进行压缩的时间的对比图如附图8(c)所示。
分别采用传统的国际视频编码标准H.264标准测试模型JM18.1和本发明方法对“Ballet”深度图序列的前2~9帧压缩性能均值对比结果如表2所示。其中△PSNR、△比特率、△压缩时间的定义如下:
△PSNR=PSNROURS-PSNRH.264      (15)
△比特率=(比特率OURS-比特率H.264)/比特率H.264     (16)
△压缩时间=(压缩时间OURS-压缩时间H.264)/压缩时间H.264    (17)
深度图序列 △PSNR/dB △比特率 △压缩时间
Ballet -0.92 -37.62% -51.64%
表2H.264测试标准模型JM18.1和本发明方法对“Ballet”深度图序列前2~9帧压缩性能均值对比
从附图8和表2可以看出,本发明方法与传统的国际视频编码标准H.264标准测试模型JM18.1方法相比,在峰值信噪比PSNR平均降低0.92dB的情况下,压缩时间减少了51.64%,编码码流比特率降低了37.62%。这是因为本发明方法在深度图序列P帧编码上,利用深度图序列帧宏块与相应彩色宏块编码模式的相关性,由编码模式复杂度计算公式计算深度图序列帧宏块的编码模式复杂度,将深度图序列帧宏块划分为复杂编码模式区域与简单编码模式区域,不同区域的宏块在不同的候选模式中搜索最佳编码模式,从而降低了编码复杂度。

Claims (5)

1.一种快速深度图序列帧间模式选择分形编码方法,其特征在于如下步骤:
步骤一:使用基于分形的视频压缩方法编码彩色视频;
步骤二:使用基于分形的视频解压缩方法解码彩色视频,以获得彩色视频各宏块编码模式;
步骤三:若为深度图序列的I帧(第一帧必须为I帧,其它帧可以设置是否为I帧),使用H.264帧内预测编码方法编码I帧,转到步骤八;若为深度图序列的P帧,转到步骤四;
步骤四:对深度图序列的P帧,使用Roberts算子检测对象边界;
步骤五:依次对当前深度图序列帧的所有宏块进行编码。如果当前深度图序列帧宏块包含对象边界,则使用传统的全搜索编码方法,遍历所有模式,根据拉格朗日率失真优化准则获得最佳编码模式,转到步骤七;否则,转到步骤六;
步骤六:由编码模式复杂度计算公式计算当前深度图序列帧宏块的编码模式复杂度,设定阈值T,若当前深度图序列帧宏块的编码模式复杂度大于阈值T(当前深度图序列帧宏块属于复杂模式区域),则在16×8、8×16、8×8、8×4、4×8、4×4六种模式中用拉格朗日率失真优化算法选择最佳编码模式;否则(当前深度图序列帧宏块属于简单模式区域)在SKIP、16×16两种编码模式中选择最佳编码模式;
步骤七:用步骤一的分形编码方法使用最佳编码模式编码当前深度图序列帧宏块。判断当前宏块是否为当前深度图序列帧的最后一个宏块,若是最后一个宏块,则转到步骤三编码下一帧;否则转到步骤五编码下一宏块;
步骤八:判断当前帧是否为深度图序列最后一帧,如果是最后一帧结束编码;否则,返回步骤三继续处理下一帧深度图像。
2.根据权利要求1所述一种快速深度图序列帧间模式选择分形编码方法,其特征在于:处理的彩色视频与深度图序列均为YUV格式。
3.根据权利要求1所述一种快速深度图序列帧间模式选择分形编码方法,其特征在于:所述步骤一中基于分形的视频压缩方法包括以下四个步骤:
1)如果是I帧(第一帧必须为I帧,其它帧可以设置是否为I帧),采用H.264帧内预测编码方式,对于每个当前块在各种可能的预测方式中选择具有最小代价的预测模式,完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧。转入步骤3)编码残差;如果是P帧,转到步骤2);
2)如果是P帧。依次对当前帧的所有宏块进行编码。在参考帧中的搜索窗内对当前宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;对每个宏块进行树状结构分块,即分块从大到小可分为16×16、16×8、8×16、8×8,8×8往下(亚宏块分割)可以分为8×4、4×8、4×4。帧间编码时,首先对编码宏块的各种块划分尺寸的帧间预测模式进行运动估计,确定迭代函数系统系数即IFS系数;然后比较所有模式的率失真代价;最后将率失真代价最小的模式作为最优帧间预测模式。
IFS系数由如下的率失真优化函数确定:
JMOTION=MSE(s,o,x,y,ref)+λMOTION*R(s,o,x,y,ref)       (1)
其中IFS系数包括父块位置(x,y)和比例因子s、偏移因子o,s和o的计算公式如下:
s = [ N Σ i = 1 N r i d i - Σ i = 1 N r i Σ i = 1 N d i ] [ N Σ i = 1 N d i 2 - ( Σ i = 1 N d i ) 2 ] - - - ( 2 )
o = 1 N [ Σ i = 1 N r i - s Σ i = 1 N d i ] - - - ( 3 )
式中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值。
最优帧间预测模式由如下率失真优化函数确定:
J(s,c,MODE|QP,λMODE)=SSD(s,c,MODE|QP)+λMODE*R(s,c,MODE|QP)   (4)
对宏块的最佳分块模式,保存相应IFS系数,转入步骤4)得到本块的重建块。
如果当前帧所有的宏块都已编码完毕,所有的重建块组成重建图像(即下一帧的参考帧)。原始图像与重建图像之差得到残差图像,转到步骤3)编码残差;
3)残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描,然后用熵编码CABAC进行编码写入码流;另一方面经过反量化、反变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行有符号指数哥伦布编码。判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤1)继续处理下一帧图像;
4)通过保存的迭代函数系统系数代入解码方程式
ri=s·di+o       (5)
计算得到预测值,由原始块和预测块之差得到编码端残差块,再由预测块和解码端残差块之和得到重建块。
其中,解码端残差块是由编码端残差块经过DCT变换、量化、反量化和反DCT变换得到的。转入步骤2)编码P帧下一宏块。
4.根据权利要求1所述一种快速深度图序列帧间模式选择分形编码方法,其特征在于:所述步骤二中基于分形的视频解压缩方法包括以下五个步骤:
1)解码端获得压缩的码流。码流中数据元素首先进行熵解码和重排序,获得一系列量化系数,这些系数经过反量化和反变换得到残差数据;
2)判断解码帧是否为I帧,若是I帧转入步骤3),否则转入步骤4);
3)对于I帧,首先由H.264帧内预测方式得到预测帧,预测帧与残差帧进行相加之后得到重建帧,帧数加1转入步骤5);
4)对于P帧,首先从码流中读入该帧所有宏块的划分方式、每一个小块的迭代函数系统系数与运动矢量,由各迭代函数系统系数和运动矢量分别计算出解码端的预测块形成解码端的预测帧,预测帧与残差帧相加得到重建帧。帧数加1转到步骤5);
5)判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤2)。
5.根据权利要求1所述一种快速深度图序列帧间模式选择分形编码方法,其特征在于:所述步骤六中当前深度图序列帧宏块编码模式复杂度计算公式为:
EMC = 0.5 w C cor + 0.1 ( w C left + w C up + w D left + w D up ) + 0.05 ( w C upleft + w D upleft ) - - - ( 6 )
其中Dleft、Dup、Dupleft分别代表当前深度图序列帧宏块的左、上、左上邻居宏块,Ccor代表与当前深度图序列帧宏块相对应的彩色视频宏块,Cleft、Cup、Cupleft分别代表Ccor的左、上、左上邻居彩色宏块,
Figure FDA0000389625990000032
分别代表相应宏块的编码模式影响因子,数值越大表明其对应的宏块编码模式越复杂,具体数值如下:
(1)若编码模式为SKIP或16×16,则相应影响因子w=1;
(2)若编码模式为16×8或8×16,则相应影响因子w=2;
(3)若编码模式为8×8(含8×4、4×8、4×4),则相应影响因子w=4;
式(6)中的0.5、0.1、0.05表示各宏块加权系数,其取值原则是所有加权系数之和为1,且对当前深度图序列帧宏块预测编码模式影响越大的宏块加权系数越大。
CN201310453269.0A 2013-09-29 2013-09-29 一种快速深度图序列帧间模式选择分形编码方法 Active CN103546758B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310453269.0A CN103546758B (zh) 2013-09-29 2013-09-29 一种快速深度图序列帧间模式选择分形编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310453269.0A CN103546758B (zh) 2013-09-29 2013-09-29 一种快速深度图序列帧间模式选择分形编码方法

Publications (2)

Publication Number Publication Date
CN103546758A true CN103546758A (zh) 2014-01-29
CN103546758B CN103546758B (zh) 2016-09-14

Family

ID=49969751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310453269.0A Active CN103546758B (zh) 2013-09-29 2013-09-29 一种快速深度图序列帧间模式选择分形编码方法

Country Status (1)

Country Link
CN (1) CN103546758B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105208402A (zh) * 2015-08-31 2015-12-30 电子科技大学 一种基于运动对象与图像分析的视频帧复杂度测度方法
CN105472384A (zh) * 2014-07-29 2016-04-06 浙江大华技术股份有限公司 一种视频图像编码方法和装置
CN105959699A (zh) * 2016-05-06 2016-09-21 西安电子科技大学 一种基于运动估计和时空域相关性的快速帧间预测方法
CN106331727A (zh) * 2016-08-26 2017-01-11 天津大学 一种深度建模模式简化搜索方法
CN106464266A (zh) * 2014-06-09 2017-02-22 索尼公司 具有编码机制的通信系统及其操作方法
CN106534870A (zh) * 2016-12-19 2017-03-22 国网新疆电力公司电力科学研究院 一种基于rgb源视频的率失真优化编码方法
CN106686383A (zh) * 2017-01-17 2017-05-17 湖南优象科技有限公司 一种保留深度图边缘的深度图帧内编码方法
CN104125473B (zh) * 2014-07-31 2017-11-14 南京理工大学 一种3d视频深度图像帧内预测模式选择方法及系统
CN110473281A (zh) * 2018-05-09 2019-11-19 网易(杭州)网络有限公司 三维模型的描边处理方法、装置、处理器及终端
CN110832863A (zh) * 2017-06-30 2020-02-21 华为技术有限公司 用于处理视频序列帧的编码器、解码器、计算机程序和计算机程序产品
WO2021047287A1 (zh) * 2019-09-11 2021-03-18 北京达佳互联信息技术有限公司 视频上传方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640802A (zh) * 2009-08-28 2010-02-03 北京工业大学 基于宏块特征和统计特性的视频帧间压缩编码方法
CN102984513A (zh) * 2012-09-29 2013-03-20 天津大学 一种深度视频编码方法
CN103037218A (zh) * 2012-10-22 2013-04-10 北京航空航天大学 一种基于分形和h.264的多目立体视频压缩与解压缩方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640802A (zh) * 2009-08-28 2010-02-03 北京工业大学 基于宏块特征和统计特性的视频帧间压缩编码方法
CN102984513A (zh) * 2012-09-29 2013-03-20 天津大学 一种深度视频编码方法
CN103037218A (zh) * 2012-10-22 2013-04-10 北京航空航天大学 一种基于分形和h.264的多目立体视频压缩与解压缩方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
田涛: "基于区域划分的深度视频快速编码算法", 《计算机应用》 *
邬芙琼: "实时3DV系统中面向虚拟视绘制的快速深度编码", 《信号处理》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106464266B (zh) * 2014-06-09 2019-11-15 索尼公司 具有编码机制的通信系统及其操作方法
CN106464266A (zh) * 2014-06-09 2017-02-22 索尼公司 具有编码机制的通信系统及其操作方法
CN105472384B (zh) * 2014-07-29 2018-12-07 浙江大华技术股份有限公司 一种视频图像编码方法和装置
CN105472384A (zh) * 2014-07-29 2016-04-06 浙江大华技术股份有限公司 一种视频图像编码方法和装置
CN104125473B (zh) * 2014-07-31 2017-11-14 南京理工大学 一种3d视频深度图像帧内预测模式选择方法及系统
CN105208402B (zh) * 2015-08-31 2017-12-15 电子科技大学 一种基于运动对象与图像分析的视频帧复杂度测度方法
CN105208402A (zh) * 2015-08-31 2015-12-30 电子科技大学 一种基于运动对象与图像分析的视频帧复杂度测度方法
CN105959699B (zh) * 2016-05-06 2019-02-26 西安电子科技大学 一种基于运动估计和时空域相关性的快速帧间预测方法
CN105959699A (zh) * 2016-05-06 2016-09-21 西安电子科技大学 一种基于运动估计和时空域相关性的快速帧间预测方法
CN106331727B (zh) * 2016-08-26 2019-03-08 天津大学 一种深度建模模式简化搜索方法
CN106331727A (zh) * 2016-08-26 2017-01-11 天津大学 一种深度建模模式简化搜索方法
CN106534870A (zh) * 2016-12-19 2017-03-22 国网新疆电力公司电力科学研究院 一种基于rgb源视频的率失真优化编码方法
CN106534870B (zh) * 2016-12-19 2019-12-03 国网新疆电力公司电力科学研究院 一种基于rgb源视频的率失真优化编码方法
CN106686383A (zh) * 2017-01-17 2017-05-17 湖南优象科技有限公司 一种保留深度图边缘的深度图帧内编码方法
CN110832863B (zh) * 2017-06-30 2023-01-06 华为技术有限公司 用于处理视频序列帧的编码器、解码器、计算机程序和计算机程序产品
CN110832863A (zh) * 2017-06-30 2020-02-21 华为技术有限公司 用于处理视频序列帧的编码器、解码器、计算机程序和计算机程序产品
CN110473281A (zh) * 2018-05-09 2019-11-19 网易(杭州)网络有限公司 三维模型的描边处理方法、装置、处理器及终端
WO2021047287A1 (zh) * 2019-09-11 2021-03-18 北京达佳互联信息技术有限公司 视频上传方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN103546758B (zh) 2016-09-14

Similar Documents

Publication Publication Date Title
CN103546758B (zh) 一种快速深度图序列帧间模式选择分形编码方法
CN103581647B (zh) 一种基于彩色视频运动矢量的深度图序列分形编码方法
CN101385356B (zh) 采用帧内预测模式的图像编码方法
CN103004197B (zh) 用于对图像编码的设备和方法
CN103501437B (zh) 一种基于分形和h.264的高光谱图像压缩方法
CN107087200B (zh) 针对高效率视频编码标准的跳过编码模式提前判决方法
CN101159875B (zh) 二重预测视频编解码方法和装置
CN103546749B (zh) 利用残差系数分布特征和贝叶斯定理优化hevc残差编码的方法
CN103248895B (zh) 一种用于hevc帧内编码的快速模式估计方法
CN102970529B (zh) 一种基于对象的多视点视频分形编码压缩与解压缩方法
CN103037219B (zh) 一种基于分形和h.264的视频压缩与解压缩方法
CN102905150B (zh) 一种新的多视点视频分形编码压缩与解压缩方法
CN101729891B (zh) 一种多视点深度视频的编码方法
CN103873861A (zh) 一种用于hevc的编码模式选择方法
CN101990100A (zh) 一种解码方法以及编码方法
CN102187668B (zh) 编码图像或图像序列的方法和装置及其解码方法和装置
US9883200B2 (en) Method of acquiring neighboring disparity vectors for multi-texture and multi-depth video
CN102209243A (zh) 基于线性模型的深度图帧内预测方法
CN103338370B (zh) 一种多视点深度视频快速编码方法
CN103327327B (zh) 用于高性能视频编码hevc的帧间预测编码单元选择方法
CN103051894B (zh) 一种基于分形和h.264的双目立体视频压缩与解压缩方法
CN105898332B (zh) 针对3d-hevc编码标准的快速深度图帧内模式判决方法
CN110446052A (zh) 一种3d-hevc帧内深度图快速cu深度选择方法
CN103546747B (zh) 一种基于彩色视频编码模式的深度图序列分形编码方法
CN102316323B (zh) 一种快速的双目立体视频分形压缩与解压缩方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191106

Address after: Room 1609, Jian'an building, No. 3, Section 1, Wanjiali Middle Road, Martian street, Furong district, Changsha City, Hunan Province

Patentee after: Changsha liuteng Technology Co., Ltd

Address before: 100191 Haidian District, Xueyuan Road, No. 37,

Patentee before: Beijing University of Aeronautics and Astronautics

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191122

Address after: 221700 Dashahe town forest farm, Fengxian County, Xuzhou City, Jiangsu Province

Patentee after: Xuzhou Zhonghui Fuyingjie Feed Co., Ltd.

Address before: Room 1609, Jian'an building, No. 3, Section 1, Wanjiali Middle Road, Martian street, Furong district, Changsha City, Hunan Province

Patentee before: Changsha liuteng Technology Co., Ltd

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220324

Address after: 221700 south of cuihuayuan village, West Third Ring Road, Fengxian Economic Development Zone, Xuzhou City, Jiangsu Province

Patentee after: FENGXIAN XINZHONGMU FEED CO.,LTD.

Address before: 221700 Dashahe town forest farm, Feng County, Xuzhou City, Jiangsu Province

Patentee before: XUZHOU ZHONGHUIFU YINGJIE FEED Co.,Ltd.