CN101980539A - 一种基于分形的多目立体视频压缩编解码方法 - Google Patents
一种基于分形的多目立体视频压缩编解码方法 Download PDFInfo
- Publication number
- CN101980539A CN101980539A CN 201010522165 CN201010522165A CN101980539A CN 101980539 A CN101980539 A CN 101980539A CN 201010522165 CN201010522165 CN 201010522165 CN 201010522165 A CN201010522165 A CN 201010522165A CN 101980539 A CN101980539 A CN 101980539A
- Authority
- CN
- China
- Prior art keywords
- piece
- frame
- order
- pixel
- father
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明提出了一种基于分形的多目立体视频压缩与解压缩方法,在多目立体视频编码中,选取中间目作为参考目,使用MCP原理压缩,其它目都使用基于DCP+MCP的原理压缩。以三目视频为例,中间目作为参考目,采用单独的运动补偿预测方式(MCP)进行编码,首先对起始帧采用块DCT变换编码,对非I帧进行块运动估计/补偿编码,然后在前一帧即中间目视频的参考帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数。左目和右目分别采用MCP加视差补偿预测方式(DCP)进行编码,在进行DCP编码方式时,充分利用立体平行摄像结构中的偏振性和方向性。对应的解压缩过程为:首先对I帧采用反DCT变换的方式解码,对非I帧进行Huffman解码获得迭代函数系统系数,然后进行基于宏块的解码,对于中间目,计算前一帧中的父块域相关子块的像素和与像素平方和;对于左目和右目,分别计算其前一帧和中间目对应帧的父块域相关子块的像素和与像素平方和。
Description
技术领域:
本发明属于视频压缩编码领域,涉及多目立体视频的压缩编码,为立体视频编码的实时性应用奠定了基础,进一步提高了分形多目立体视频压缩编码的性能,使其更加具有实用性和推广性。
背景技术:
分形理论最初由Mandelbrot于上世纪70年代提出(参见B.Mandelbrot.TheFractal Geometry ofNature[M].New York:W.H.Freeman and Company,1982.)。分形编码的数学基础是迭代函数系统(IFS)理论。Barnsley首先将分形编码用于交互式图像压缩(参见Michael F.Barnsley,AlanD.Sloan.A better way to compress image[J].ByteMagazine,1988,13(1):215-233.)。Jacqain提出了全自动的分形图像压缩方法(参见Arnaud E.Jacquin.A novel fractal blocking-coding technique for digital image[C].IEEEInternational Conference on Acoustics,Speech and Signal Processing,1990,4:2225-2228.),(参见Arnaud E.Jacquin.Fractal image coding:a review[J].Proceeding of the IEEE,1993,81(10):1451-1465.),该方法采用基于图像分块的方式以局部的仿射变换代替全局的仿射变换。之后,Fisher利用四叉树改进了这一方法(参见Y.Fisher.Fractal ImageCompression[J].Fractals,1994,2(3):347-361.),(参见Y.Fisher,E.W.Jacobs.Imagecompression:A study the iterated transform method[J].Signal Processing,1992,29(3),251-263.),(参见Y.Fisher.Fractal Image Compression:Theory and application to digitalimages[M].New York:Spring-Verlag,1995,55-77.),大大提高了编码效率,并成为目前分形图像编码中的主流方法。
在此基础之上,一些学者和研究人员把分形图像压缩的方法应用到视频序列的压缩上。Meiqing Wang等提出了综合基于数据立方体和基于帧的分形视频压缩方法(参见Meiqing Wang,Choi-Hong Lai.A hybrid fractal video compression method[J].Computers &Mathematics with Applications,2005,50(3-4):611-621.),(参见Meiqing Wang,ZhehuangHuang,Choi-Hong Lai.Matching search in fractal video compression and its parallelimplementation in distributed computing environments[J].Applied Mathematical Modeling,2006,30(8):677-687.),(参见Meiqing Wang,Rong Liu,Choi-Hong Lai.Adaptive partitionand hybrid method in fractal video compression[J].Computers & Mathematics withApplications,2006,51(11):1715-1726.)。其中最为经典和影响较大的参见(C.S.Kim,R.C.Kim,S.U.Lee.Fractal coding of video sequence using circular prediction mapping andnoncontractive interframe mapping[J].IEEE Transactions on ImageProcessing,1998,7(4):601-605.)。该方法采用类似于标准视频编码方法所采用的运动估计/补偿技术,该方法利用了相邻帧之间的时间强相关性,对视频序列压缩取得了较好的效果。在CPM和NCIM中,子块域中的每个图像块都由来自相邻帧相同大小的父块域通过运动补偿得到。CPM和NCIM两者间最大的不同在于CPM在解码的过程中需要具备收敛性,而NCIM不需要。但是在循环预测编码(CPM)方法中,为了保证起始帧经过自身的循环解码能够近似收敛到原来的图像,压缩过程需要经过复杂变换、搜索和迭代等,压缩时间和图像质量难以达到要求。目前典型的分形图像和视频压缩方法的运算量很大,编码速度较慢,并且解码的质量有待提高,使得分形图像和视频压缩方法还需要进一步的改进和提高。
多视点视频(Multi-view Video)是一种新型的具有立体感和交互操作功能的视频,通过在场景中放置多台摄像机,记录下多个视点数据,提供给用户以视点选择和场景漫游的交互能力。多视点视频将在自由视点视频、立体电视、立体视频会议、多视点视频点播等数字娱乐领域有着非常广泛的应用前景。随着相机数目的增加,多视点视频的数据量也成倍增加(参见Chun Li,Lini MA.A Study of Multi-view Video Coding Technology[J].Computers & Moderns,2009,1:104-108.)。拍摄场景不同角度的视频信息,利用其中的一个或多个视点信息可以合成任意视点的信息,达到自由视点显示和自由切换任意视点的目的(参见ISO/IEC JTC 1/SC29/WG 111Call for Evidence on Multi-View Video Coding.DOC.N6720,Palma de Mallorca,Spain,2004.),(参见ISO IEC JTC 1/SC29/WG111 Surveyof Algorithms used for Multi-view Video Coding(MVC).DOC 1.N6909,Hong Kong,China,2005.),(参见ISO/IEC JTC1/SC29/WG111 Requirements on Multi-view Video Coding 4.DOC.N7282,Poznan,Poland,2005.)。
发明内容:
本发明提出了一种基于分形的多目立体视频压缩与解压缩方法,在多目立体视频编码中,选取中间目作为参考目,使用MCP原理压缩,其它目使用基于DCP+MCP的原理压缩。以三目视频为例,中间目作为参考目,采用单独的运动补偿预测方式(MCP)进行编码,首先对起始帧采用块DCT变换编码,对非I帧进行块运动估计/补偿编码,然后在前一帧即中间目视频的参考帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数。左目和右目分别采用MCP加视差补偿预测方式(DCP)进行编码,在进行DCP编码方式时,充分利用立体平行摄像结构中的偏振性和方向性。对应的解压缩过程为:首先对I帧采用反DCT变换的方式解码,对非I帧进行Huffman解码获得迭代函数系统系数,然后进行基于宏块的解码,对于中间目,计算前一帧中的父块域相关子块的像素和与像素平方和;对于左目和右目,分别计算其前一帧和中间目对应帧的父块域相关子块的像素和与像素平方和。
一种基于分形的多目立体视频压缩编码方法,包括以下步骤:
步骤一:对于中间目,首先判断是否为I帧,若是I帧,则对该帧进行互不重叠的固定大小的块划分,对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩方法,对图像进行单独编码和解码,转到步骤九;所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧;所述将当前帧划分为固定大小的互不重叠的图像块称为宏块;所述将当前宏块进行树状划分得到的块称为小块;所述当前帧为正在进行压缩的帧,所述参考帧为当前帧的已经编码并重建的前一帧;所述当前帧所有块的集合称为子块域;所述前一帧的所有块的集合称为父块域;所述块DCT变换中的块采用固定大小模式;对于左目转到步骤四;对于右目转到步骤八;
步骤二:若中间目为非I帧,用常规单目的运动补偿预测(MCP)编码,对该帧进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及中间目前一帧重建图像即参考帧中,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤三:依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;如果匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤三编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤三编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,记录IFS系数;转入步骤三编码下一宏块;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,且是中间目,则转到步骤九;若是左目或右目,则转到步骤五;
步骤四:对左目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及左目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤三;
步骤五:计算中间目中对应帧图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤六;
步骤六:首先对与当前子块位置相同的父块进行块匹配,得到RMS,并保存迭代函数系统系数,该系数包括父块与子块的相对位移矢量(x,y),比例因子s和偏移因子o;依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同并转入步骤七;如果所得的匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤六编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别转入步骤七计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤六编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,转入步骤七计算RMS,记录IFS系数,转入步骤六编码下一宏块;最后与步骤三所得结果比较,选择误差最小的作为预测结果;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,则转到步骤九;
步骤七:利用DCP快速方法,得到匹配误差RMS,继续执行步骤六;
步骤八:对于右目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及右目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤三;
步骤九:对所有IFS系数进行Huffman编码,降低IFS系数数据的统计冗余;判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤一继续处理下一帧图像。
对于中间目,设多目立体视频总目数为N,这里N为奇数,则中间目指第(N+1)/2目,它左边的所有目都称为左目,右边的所有目都称为右目。例如,第1目、N目和(N+1)/2目构成三目,同样第2目、N-1目和(N+1)/2目构成三目,依次类推,分别进行三目的相应处理,并且每个处理中彼此独立,左目内部或右目内部之间都没有对应联系。
所述一种基于分形的多目立体视频压缩编码方法,处理的视频序列为YUV格式,分别对3个分量中的每个采用上述九个步骤进行处理。
所述步骤三和步骤六中对宏块采用树状划分,块匹配采用匹配误差准则;子块与父块的匹配误差RMS为:
其中参数s和o分别为:
其中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值;
计算当前宏块在参考帧中的块匹配误差RMS,其中ri是子块的像素值,di是父块的像素值;如果RMS小于预先设定的阈值γ,记录IFS系数,IFS系数包括匹配块的位移矢量(x,y)和公式2,3中的s和o,处理下一宏块;否则,对当前宏块进行树状划分,计算划分后小块的RMS,如果小于阈值γ,则停止划分,否则继续划分,直到子块达到预先设定的最小块为止。
一种基于分形的多目立体视频解压缩方法,其特征在于包含以下步骤:
步骤I:首先读入中间目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;
步骤II:判断解码帧是否为I帧,若是I帧转入步骤III,否则转入步骤IV;
步骤III:对于I帧,从压缩文件中读入码流,进行类似于JPEG的解压缩方式进行解码,帧数加一转入步骤VII;
步骤IV:对于非I帧,计算中间目前一帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤V:读入左目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算左目前一帧和中间目对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤VI:读入右目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算右目前一帧和中间目对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤VII:从对应的压缩文件中读入块的划分信息和Huffman码流,并根据以上的信息得到该帧所有宏块的划分方式和每一个小块的迭代函数系统系数,按照每一宏块进行解码;转入步骤VIII;
步骤VIII:判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤II。
对于每一个宏块进行解压缩时,首先判断该宏块在编码时的划分方式,对于每一个子块,首先在父块域找到与该子块相对应的区域,然后利用下面的公式获得该子块的像素值:
ri=s·di+o (4)
其中ri为待解码子块的像素值,di为父块域中的像素值,s为比例因子,o为偏移因子。
在基于分形的多目立体视频解码过程中,中间目用常规单目的运动补偿预测(MCP)编码,左目和右目的每个图像块通过运动补偿预测(MCP)和视差补偿预测(DCP)两种方式进行预测,从中选择误差较小的一种作为预测结果。
处理的视频序列为YUV格式,分别对3个分量中的每个采用上述八个步骤进行处理。
本发明所提出的分形多目立体视频压缩方法的优点在于:
(1)本方法中对起始帧采用帧内块DCT变换编码,相对于CPM/NCIM编码方案,不但大幅度减少了压缩时间和块效应,而且提高了峰值信噪比。
(2)本方法先将一帧图像划分为互不重叠的、由若干固定大小尺寸的宏块组成的棋盘格式;然后根据匹配准则与设定阈值的关系,对宏块进行树状结构划分;相对于四叉树划分准则,大大降低了计算复杂度,提高了编码速度。
(3)本方法在进行子块的块匹配之前,计算当前帧互不重叠的宏块及其经树状划分之后得到的小块的像素和与像素平方和;在参考帧中,按照匹配步长分别计算各宏块以及经树状划分以后得到的小块的像素和与像素平方和;避免了在块匹配过程中出现重复计算的弊端,大大节约了子块的匹配时间。
(4)本方法中,中间目的编码方式与单目分形编码相同;左目和右目中,除了采用前一帧作为参考帧外,加入了中间目对应的帧共同作为参考帧,选取误差最小的块作为父块,使得面向的范围更广,实现更好的效果。
(5)本方法中,在进行DCP编码方式时,充分利用平行摄像结构中的偏振性和方向性,对DCP搜索方式进行了简化运算,提出了一种新型快速搜索算法。
附图说明:
图1a为本发明一种基于分形的多目立体视频压缩与解压缩方法的左目压缩流程图;
图1b为本发明一种基于分形的多目立体视频压缩与解压缩方法的中间目压缩流程图;
图1c为本发明一种基于分形的多目立体视频压缩与解压缩方法的右目压缩流程图;
图1d为本发明一种基于分形的多目立体视频压缩与解压缩方法的左目解压缩流程图;
图1e为本发明一种基于分形的多目立体视频压缩与解压缩方法的中间目解压缩流程图;
图1f为本发明一种基于分形的多目立体视频压缩与解压缩方法的右目解压缩流程图;
图1g为本发明一种基于分形的多目立体视频压缩与解压缩方法的DCP快速算法流程图;
图2a为本发明一种基于分形的多目立体视频压缩与解压缩方法对宏块的四种划分模式图;
图2b为本发明一种基于分形的多目立体视频压缩与解压缩方法对宏块的划分模式四进一步进行划分的四种划分模式图;
图3为本发明一种基于分形的多目立体视频压缩与解压缩方法的MCP和DCP结构示意图;
图4a为本发明一种基于分形的多目立体视频压缩与解压缩方法“anne.cif”多目立体视频序列的中间目第一帧图像;
图4b为本发明一种基于分形的多目立体视频压缩与解压缩方法“anne.cif”多目立体视频序列的左目第一帧图像;
图4c为本发明一种基于分形的多目立体视频压缩与解压缩方法“anne.cif”多目立体视频序列的右目第一帧图像;
图5a为本发明一种基于分形的多目立体视频压缩与解压缩方法的DCP快速算法与传统的全搜索方法分别对“anne.cif”多目立体视频序列的前5帧进行压缩的压缩比的对比图。
图5b为本发明一种基于分形的多目立体视频压缩与解压缩方法的DCP快速算法与传统的全搜索方法分别对“anne.cif”多目立体视频序列的前5帧进行压缩的PSNR的对比图。
图5c本发明一种基于分形的多目立体视频压缩与解压缩方法的DCP快速算法与传统的全搜索方法分别对“anne.cif”多目视频序列的前5帧进行压缩的压缩时间的对比图。
具体实施方式:
下面将结合附图对本发明方法作进一步的详细说明,仅以亮度分量Y为例,色差分量U和V的压缩步骤与亮度分量相同。
本发明提出了一种基于分形的多目立体视频压缩与解压缩方法,在多目立体视频编码中,选取中间目作为参考目,使用MCP原理压缩,其他目使用基于DCP+MCP的原理压缩。以三目视频为例,中间目作为参考目,采用单独的运动补偿预测方式(MCP)进行编码,首先对起始帧采用块DCT变换编码,对非I帧进行块运动估计/补偿编码,然后在前一帧即中间目视频的参考帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数。左目和右目分别采用MCP加视差补偿预测方式(DCP)进行编码,在进行DCP编码方式时,充分利用立体平行摄像结构中的偏振性和方向性。对应的解压缩过程为:首先对I帧采用反DCT变换的方式解码,对非I帧进行Huffman解码获得迭代函数系统系数,然后进行基于宏块的解码,对于中间目,计算前一帧中的父块域相关子块的像素和与像素平方和;对于左目和右目,分别计算其前一帧和中间目对应帧的父块域相关子块的像素和与像素平方和。
如附图1a、图1b和图1c所示,一种基于分形的多目立体视频压缩编码方法,包括以下步骤:
步骤一:以多目立体视频序列“anne.cif”的前5帧为例。所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧;所述将当前帧划分为固定大小的互不重叠的图像块称为宏块;所述将当前宏块进行树状划分得到的块称为小块;所述当前帧为正在进行压缩的帧,所述参考帧为当前帧的已经编码并重建的前一帧;所述当前帧所有块的集合称为子块域;所述前一帧的所有块的集合称为父块域;所述块DCT变换中的块采用固定大小模式。对于左目转到步骤四;对于右目转到步骤八。
对视频序列“anne.cif”中间目的起始帧,设多目立体视频总目数为N,这里N为奇数,则中间目指第(N+1)/2目,它左边的所有目都称为左目,右边的所有目都称为右目。例如,第1目、N目和(N+1)/2目构成三目,同样第2目、N-1目和(N+1)/2目构成三目,依次类推,分别进行三目的相应处理,并且每个处理中彼此独立,左目内部或右目内部之间都没有对应联系。对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩方法,将起始帧划分为8×8的互不重叠的子块,对每一子块分别进行DCT变换。离散余弦变换将8×8的图像样本X,变换成8×8的系数矩阵Y。变换过程(包括反变换)可以用变换矩阵A来表示。
8×8样本块的正向DCT(FDCT)变换如下:
Y=AXAT (5)
反向DCT(IDCT)如下:
X=ATYA (6)
其中A是8×8的变换矩阵。A中的各个元素如下:
其中
i,j分别为矩阵A的行和列。
对变换系数进行量化和编码,转入步骤九。
步骤二:若中间目为非I帧,用常规单目的运动补偿预测(MCP)编码,对图像进行互不重叠的16×16宏块划分,分别计算当前帧互不重叠的16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和。然后分别计算参考帧也就是前一帧的解压缩图像中以1为步长的大小分别为16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和。从第一个宏块开始处理,依次对当前帧的所有16×16宏块进行编码;
步骤三:依次对当前帧的所有16×16宏块进行编码,在父块域中的搜索窗内对整个宏块进行块运动估计/补偿。匹配的依据是分形迭代函数系统原理,简要介绍一下分形图像压缩的数学基础-迭代函数系统(IFS:Iterative Function System)理论。设D是Rn欧氏空间的子集,ω为D→D的映射,如果存在一个实数C,0≤C<1,使得对于Rn上的度量d,满足对任意x,y∈D,有d(ω(x),ω(y))≤C(d(x,y)),则称ω为压缩映射,实数C称为ω的压缩因子。完备的度量空间(X,d)以及n个压缩映射ωi:X→X(其压缩因子分别为C1,C2,...Cn)一起,就组成一个迭代函数系统(Iterated Function System),简称IFS,记作{X:ω1,ω2,...,ωn}。C=max(C1,C2,...,Cn)称为IFS的压缩因子。因此{R2:ω1,ω2,ω3}就是一个IFS。
分形图像压缩中,一般的匹配准则是RMS,即:
其中s,o分别为:
其中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值。
首先设定子块的匹配误差阈值γ=tol×tol×no,其中tol根据不同的子块大小而改变,大的子块tol就越大,小的子块tol就小。在本例中,我们取16×16宏块的tol为10.0,8×8子块的tol为8.0,4×4子块的tol为6.0,no为当前子块属于该视频对象区域的像素个数。
首先设定16×16宏块的匹配误差阈值γ16=10.0×10.0×no,在参考帧的父块域中以当前子块的位置开始在15×15的搜索窗内对整个宏块进行块匹配,如果匹配误差RMS小于开始设定的阈值γ16,保存当前的IFS系数包括比例因子s,偏移o,父块相对于当前子块的坐标偏移x,y,返回步骤三,继续下一宏块的匹配。
否则,按照树状结构对该宏块进行划分,对宏块的划分有四种模式,如附图2a,模式一为一个16×16小块,模式二为两个8×16的小块,模式三为两个16×8的小块,模式四为四个8×8的小块。
1、首先按模式二的划分计算,若模式二中两个小块都满足RMS<γ16,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
2、否则按模式三划分,若模式三中两个小块都满足RMS<γ16,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
3、否则按照模式四对当前宏块进行划分,此时匹配误差阈值设置为γ8=8.0×8.0×no,如果模式四中的4个小块都满足RMS<γ8,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
4、否则对模式四中的每一个小块按照附图2b中的模式划分顺序进行划分,可依次划分为1个8×8的小块,2个4×8的小块,2个8×4的小块,4个4×4的小块。这里只对第一个8×8小块的匹配过程进行阐述,其它3个8×8小块的匹配过程与第一个相同,不再赘述。首先按照2个4×8的小块划分,进行块匹配,如果两个子块的匹配误差RMS全部小于γ8时,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分。否则,按照2个8×4的划分方式进行块的划分,对这两个子块进行块匹配,如果两个子块的匹配误差RMS全部小于γ8时,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分。否则,对该子块划分为4个4×4的小块,同时匹配误差阈值设为γ4=6.0×6.0×no,对四个小块分别进行块匹配,并分别记录每个子块的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
5、返回步骤三,继续下一宏块的编码。
如果当前帧所有的宏块都已编码完毕,且是中间目,则转到步骤九;若是左目或右目,则转到步骤五;
步骤四:对于左目,首先进行互不重叠的16×16宏块划分,分别计算当前帧互不重叠的16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和。然后计算参考帧也就是前一帧的解压缩图像中以1为步长的大小分别为16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和,以减少块匹配过程中的重复计算。附图3为多目立体视频编码的MCP和DCP结构示意图,左目和右目中,每个宏块使用DCP从中间目中预测,使用MCP从左目和右目的前一帧预测。编码器首先在左目和右目的前一帧中搜索,选择最匹配的D块;从第一个宏块开始处理,依次对当前帧的所有16×16宏块进行编码,转入步骤三;
步骤五:然后计算中间目中对应帧的解压缩图像中以1为步长的大小分别为16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和,进行搜索选择最匹配的D块。从第一个宏块开始处理,依次对当前帧的所有16×16宏块进行编码,转入步骤六;附图4(a)为三目立体视频序列“anne.cif”中间目第1帧图像,附图4(b)为三目立体视频序列“anne.cif”左目第1帧图像,附图4(c)为三目立体视频序列“anne.cif”右目第1帧图像。
步骤六:对与当前子块位置相同的父块进行块匹配,得到RMS,并保存迭代函数系统系数,该系数包括父块与子块的相对位移矢量(x,y),比例因子s和偏移因子o;依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同并转入步骤七;如果所得的匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤六编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别转入步骤七计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤六编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,转入步骤七计算RMS,记录IFS系数,转入步骤六编码下一宏块;最后与步骤三所得结果比较,选择误差最小的作为预测结果;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,则转到步骤九;
步骤七:利用DCP快速方法,得到匹配误差RMS,继续执行步骤六;
步骤八:对于右目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及右目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤三;
步骤九:对所有IFS系数进行Huffman编码,Huffman编码是根据出现的概率将每个符号映射到一个变长码字的集合(VLC)上,降低IFS系数数据的统计冗余。判断当前帧是否为最后一帧,如果是最后一帧结束编码,否则,返回步骤一继续处理下一帧图像。
如附图1d、图1e和图1f所示,一种基于分形的多目立体视频解压缩方法,包括以下步骤:
步骤I:首先读入中间目压缩信息,包括压缩帧数,每帧的宽和高,I帧重建质量,插入I帧的间隔;
步骤II:判断解码帧是否为I帧,若是I帧转入步骤III,否则转入步骤IV;
步骤III:对于I帧,从压缩文件中读入码流,进行类似于JPEG的解压缩方式进行解码,进行反DCT变换,得到每一个8×8的块的像素值,帧数加一转入步骤VII;
步骤IV:对于非I帧,计算中间目前一帧即参考帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤V:读入左目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算左目前一帧和中间目对应帧即参考帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤VI:读入右目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算右目前一帧和中间目对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,转入步骤VII;
步骤VII:从压缩文件中读入块的划分信息和Huffman码流,并根据以上的信息得到该帧所有宏块的划分方式和每一个小块的迭代函数系统系数,按照每一宏块进行解码,对于每一个宏块进行解压缩时,首先判断该宏块在编码时的划分方式,对于每一个子块,首先在父块域找到与该子块相对应的区域,然后利用下面的公式获得该子块的像素值,
ri=s·di+o
其中ri为待解码子块的像素值,di为父块域中的像素值,s为比例因子,o为偏移因子。
步骤VIII:判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤II。
处理的立体视频序列为YUV格式,分别对3个分量中的每个采用上述八个步骤进行处理。
本方法选择Visual C++6.0作为所述方法的实现语言,CPU为CoreTM 2DuoT8300,2.4GHz主频,内存大小为2G,对标准测试视频序列“anne.cif”进行了基于分形的多目立体视频编码实验。
表1为在同等条件下,利用本发明方法与CPM/NCIM方法对标准测试序列“anne.cif”中间目起始帧的对比实验结果。
表1CPM/NCIM方法和本发明方法的起始帧压缩结果对比
表2为视频中的三目视频的平均性能参数结果;表3为CPM/NCIM方法和本发明方法的前5帧时间对比。
表2视频序列压缩性能均值对比
表3CPM/NCIM方法和本发明方法的前5帧时间对比
表3中第一帧时间是处理完三目的总时间,其它帧类似。对“anne.cif”三目立体视频序列1至5帧采用全搜索算法和本文所提出的快速搜索算法对增强目进行编码结果的平均值如表2所示。从图5、表2和表3可以看到,对“anne.cif”三目立体视频序列,采用快速搜索算法的压缩时间为全搜索算法的一半,中间目的压缩质量保持不变,而左目和右目的PSNR值提高了0.01dB,同时压缩比增加了0.2。
将分形视频编码方法应用到多目立体视频编码领域,并根据立体平行摄像结构的几何约束,提出了一种新的视差估计算法,通过实验可以得到,该算法在保证压缩比和PSNR保持不变的前提下,极大地降低了运算复杂度,为多目立体视频编码的实时性应用奠定了基础。
本方法充分利用多目立体视频的结构特性,在搜索方法上提出了新的改进,使得压缩时间大大减少,从而运算的复杂度和时间都降低了。在分形编码中,算法复杂度和编码时间一直都是最为关注的问题,也是比较难解决的方面。本方法针对这方面,进行了深入的挖掘和思考,同时也取得了很好的效果,为以后的研究打下了良好的基础。
Claims (8)
1.一种基于分形的多目立体视频压缩编码方法,其特征在于具体步骤如下:
步骤一:对于中间目,首先判断是否为I帧,若是I帧,则对该帧进行互不重叠的固定大小的块划分,对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩方法,对图像进行单独编码和解码,转到步骤九;所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧;所述将当前帧划分为固定大小的互不重叠的图像块称为宏块;所述将当前宏块进行树状划分得到的块称为小块;所述当前帧为正在进行压缩的帧,所述参考帧为当前帧的已经编码并重建的前一帧;所述当前帧所有块的集合称为子块域;所述前一帧的所有块的集合称为父块域;所述块DCT变换中的块采用固定大小模式;对于左目转到步骤四;对于右目转到步骤八;
步骤二:若中间目为非I帧,用常规单目的运动补偿预测(MCP)编码,对该帧进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及中间目前一帧重建图像即参考帧中,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤三:依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;如果匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤三编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤三编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,记录IFS系数;转入步骤三编码下一宏块;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,且是中间目,则转到步骤九;若是左目或右目,则转到步骤五;
步骤四:对左目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及左目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤三;
步骤五:计算中间目中对应帧图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤六;
步骤六:首先对与当前子块位置相同的父块进行块匹配,得到RMS,并保存迭代函数系统系数,该系数包括父块与子块的相对位移矢量(x,y),比例因子s和偏移因子o;依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同并转入步骤七;如果所得的匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤六编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别转入步骤七计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤六编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,转入步骤七计算RMS,记录IFS系数,转入步骤六编码下一宏块;最后与步骤三所得结果比较,选择误差最小的作为预测结果;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,则转到步骤九;
步骤七:利用DCP快速方法,得到匹配误差RMS,继续执行步骤六;
步骤八:对于右目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及右目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤三;
步骤九:对所有IFS系数进行Huffman编码,降低IFS系数数据的统计冗余;判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤一继续处理下一帧图像。
2.根据权利要求1所述一种基于分形的多目立体视频压缩编码方法,其特征在于:对于中间目,设多目立体视频总目数为N,这里N为奇数,则中间目指第(N+1)/2目,它左边的所有目都称为左目,右边的所有目都称为右目。和中间目等距的左右目构成三目,进行相应的MCP+DCP处理,并且每个处理中彼此独立,左目内部或右目内部之间都没有对应联系。
3.根据权利要求1所述一种基于分形的多目立体视频压缩编码方法,其特征在于:处理的视频序列为YUV格式,分别对3个分量中的每个采用上述九个步骤进行处理。
4.根据权利要求1所述一种基于分形的多目立体视频压缩编码方法,其特征在于:所述步骤三和步骤六中对宏块采用树状划分,块匹配采用匹配误差准则;子块与父块的匹配误差RMS为:
其中参数s和o分别为:
其中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值;
计算当前宏块在参考帧中的块匹配误差RMS,其中ri是子块的像素值,di是父块的像素值;如果RMS小于预先设定的阈值γ,记录IFS系数,IFS系数包括匹配块的位移矢量(x,y)和公式2,3中的s和o,处理下一宏块;否则,对当前宏块进行树状划分,计算划分后小块的RMS,如果小于阈值γ,则停止划分,否则继续划分,直到子块达到预先设定的最小块为止。
5.一种基于分形的多目立体视频解压缩方法,包含以下步骤:
步骤I:首先读入中间目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;
步骤II:判断解码帧是否为I帧,若是I帧转入步骤III,否则转入步骤IV;
步骤III:对于I帧,从压缩文件中读入码流,进行类似于JPEG的解压缩方式进行解码,帧数加一转入步骤VII;
步骤IV:对于非I帧,计算中间目前一帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤V:读入左目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算左目前一帧和中间目对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤VI:读入右目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算右目前一帧和中间目对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤VII:从对应的压缩文件中读入块的划分信息和Huffman码流,并根据以上的信息得到该帧所有宏块的划分方式和每一个小块的迭代函数系统系数,按照每一宏块进行解码;转入步骤VIII;
步骤VIII:判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤II。
6.根据权利要求5所述一种基于分形的多目立体视频解压缩方法,其特征在于:对于每一个宏块进行解压缩时,首先判断该宏块在编码时的划分方式,对于每一个子块,首先在父块域找到与该子块相对应的区域,然后利用下面的公式获得该子块的像素值,
ri=s·di+o (4)
其中ri为待解码子块的像素值,di为父块域中的像素值,s为比例因子,o为偏移因子。
7.根据权利要求5所述一种基于分形的多目立体视频解压缩方法,其特征在于:在基于分形的立体视频解码过程中,中间目用常规单目的运动补偿预测(MCP)编码,左目和右目的每个图像块通过运动补偿预测(MCP)和视差补偿预测(DCP)两种方式进行预测,从中选择误差较小的一种作为预测结果。
8.根据权利要求5所述一种基于分形的多目立体视频解压缩方法,其特征在于:处理的视频序列为YUV格式,分别对3个分量中的每个采用上述八个步骤进行处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010522165 CN101980539B (zh) | 2010-10-21 | 2010-10-21 | 一种基于分形的多目立体视频压缩编解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201010522165 CN101980539B (zh) | 2010-10-21 | 2010-10-21 | 一种基于分形的多目立体视频压缩编解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101980539A true CN101980539A (zh) | 2011-02-23 |
CN101980539B CN101980539B (zh) | 2012-07-25 |
Family
ID=43601018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201010522165 Expired - Fee Related CN101980539B (zh) | 2010-10-21 | 2010-10-21 | 一种基于分形的多目立体视频压缩编解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101980539B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102291579A (zh) * | 2011-07-06 | 2011-12-21 | 北京航空航天大学 | 一种快速的多目立体视频分形压缩与解压缩方法 |
CN103037218A (zh) * | 2012-10-22 | 2013-04-10 | 北京航空航天大学 | 一种基于分形和h.264的多目立体视频压缩与解压缩方法 |
CN103581647A (zh) * | 2013-09-29 | 2014-02-12 | 北京航空航天大学 | 一种基于彩色视频运动矢量的深度图序列分形编码方法 |
CN105637873A (zh) * | 2013-10-18 | 2016-06-01 | Lg电子株式会社 | 编译/解码包括多视图的视频的方法和设备 |
CN107071385A (zh) * | 2017-04-18 | 2017-08-18 | 杭州派尼澳电子科技有限公司 | 一种基于h265引入视差补偿的立体视频编码方法 |
-
2010
- 2010-10-21 CN CN 201010522165 patent/CN101980539B/zh not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
20100314 Shiping Zhu A Hybrid Video Coding Scheme Joint Fractal and Object-based Function 全文 1-8 , 2 * |
20100317 Shiping Zhu A Novel Fractal Monocular and Stereo Video Codec based on MCP and DCP 参见第I-III部分 1-8 , 2 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102291579A (zh) * | 2011-07-06 | 2011-12-21 | 北京航空航天大学 | 一种快速的多目立体视频分形压缩与解压缩方法 |
CN103037218A (zh) * | 2012-10-22 | 2013-04-10 | 北京航空航天大学 | 一种基于分形和h.264的多目立体视频压缩与解压缩方法 |
CN103037218B (zh) * | 2012-10-22 | 2015-05-13 | 北京航空航天大学 | 一种基于分形和h.264的多目立体视频压缩与解压缩方法 |
CN103581647A (zh) * | 2013-09-29 | 2014-02-12 | 北京航空航天大学 | 一种基于彩色视频运动矢量的深度图序列分形编码方法 |
CN103581647B (zh) * | 2013-09-29 | 2017-01-04 | 北京航空航天大学 | 一种基于彩色视频运动矢量的深度图序列分形编码方法 |
CN105637873A (zh) * | 2013-10-18 | 2016-06-01 | Lg电子株式会社 | 编译/解码包括多视图的视频的方法和设备 |
CN107071385A (zh) * | 2017-04-18 | 2017-08-18 | 杭州派尼澳电子科技有限公司 | 一种基于h265引入视差补偿的立体视频编码方法 |
CN107071385B (zh) * | 2017-04-18 | 2019-01-25 | 杭州派尼澳电子科技有限公司 | 一种基于h265引入视差补偿的立体视频编码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101980539B (zh) | 2012-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101980537B (zh) | 一种基于对象和分形的双目立体视频压缩编解码方法 | |
CN102291579B (zh) | 一种快速的多目立体视频分形压缩与解压缩方法 | |
CN101980538B (zh) | 一种基于分形的双目立体视频压缩编解码方法 | |
CN103037218B (zh) | 一种基于分形和h.264的多目立体视频压缩与解压缩方法 | |
CN102905150B (zh) | 一种新的多视点视频分形编码压缩与解压缩方法 | |
CN102970529B (zh) | 一种基于对象的多视点视频分形编码压缩与解压缩方法 | |
CN103051894B (zh) | 一种基于分形和h.264的双目立体视频压缩与解压缩方法 | |
CN102263951B (zh) | 一种快速的分形视频压缩与解压缩方法 | |
CN102685532B (zh) | 自由视点四维空间视频编码系统的编码方法 | |
CN103618907B (zh) | 基于压缩感知多视点分布式视频编码及帧排列装置及方法 | |
CN103037219B (zh) | 一种基于分形和h.264的视频压缩与解压缩方法 | |
CN101980536B (zh) | 一种基于对象和分形的多目立体视频压缩编解码方法 | |
CN101990103B (zh) | 用于多视点视频编码的方法和装置 | |
CN101496412A (zh) | 具有域变换的基于网络的视频压缩 | |
CN101980539B (zh) | 一种基于分形的多目立体视频压缩编解码方法 | |
CN102316323B (zh) | 一种快速的双目立体视频分形压缩与解压缩方法 | |
CN101860753B (zh) | 一种基于分形的视频压缩与解压缩方法 | |
CN101827268B (zh) | 一种基于对象的分形视频压缩与解压缩方法 | |
CN102263953B (zh) | 一种基于对象的快速多目立体视频分形压缩与解压缩方法 | |
CN103647969B (zh) | 一种基于对象的快速分形视频压缩与解压缩方法 | |
CN102263952B (zh) | 一种基于对象的快速双目立体视频分形压缩与解压缩方法 | |
CN102263954B (zh) | 一种基于对象的快速分形视频压缩与解压缩方法 | |
Liu et al. | Reconstruction of compressed-sensed multiview video with disparity-and motion-compensated total variation minimization | |
CN106954070B (zh) | 一种滑动像素块整数dct核心矩阵变换运动补偿器及方法 | |
Li et al. | Multiview video compression with 3D-DCT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120725 Termination date: 20141021 |
|
EXPY | Termination of patent right or utility model |