CN102905150B

CN102905150B - 一种新的多视点视频分形编码压缩与解压缩方法

Info

Publication number: CN102905150B
Application number: CN201210402903.3A
Authority: CN
Inventors: 祝世平; 李丽芸; 张玲
Original assignee: Beihang University
Current assignee: Haining Economic Development Industrial Park Development and Construction Co., Ltd
Priority date: 2012-10-22
Filing date: 2012-10-22
Publication date: 2015-04-08
Anticipated expiration: 2032-10-22
Also published as: CN102905150A

Abstract

本发明在三维视频编码技术领域提出了一种新的多视点视频分形编码压缩与解压缩方法。该方法对多视点三维视频的大量数据进行了高效地压缩以便存储和传输。在编码过程中，实现了时间空间联合预测，并提出快速视差估计和基于中心偏置的五边形运动估计预测结合分形编码的视频压缩方法，有效减少数据冗余。以五个视点视频为例，K、L、C、R和S依次代表一个视点视频，提出K←L←C→R→S的预测结构，即视点R和L均用视点C来预测，视点S和K分别用视点R和L来预测，5个视点的起始帧都用I帧。解码视点顺序相同，采用环路滤波去除块效应。该方法在获得较好的视频解码质量条件下，极大地提高了编码速度和压缩比，降低了运算复杂度，为多视点视频编码的实时性应用奠定了基础。

Description

一种新的多视点视频分形编码压缩与解压缩方法

技术领域：

本发明属于三维视频压缩编码领域，涉及多视点视频的压缩编码，为三维立体视频编码的实时性应用奠定了基础，进一步提高了基于分形的多视点立体视频压缩编码的性能。

背景技术：

分形理论最初应用于图像压缩，采用仿射变换进行压缩编码，大大提高了编码效率，并成为目前分形图像编码中的主流方法。近年来，一些学者和研究人员把分形图像压缩的方法应用到视频序列的压缩上。其中最为经典和影响较大的参见(C.S.Kim,R.C.Kim,S.U.Lee.Fractal coding of video sequence using circular prediction mapping andnoncontractive interframe mapping[J].IEEE Transactions on Image Processing,1998,7(4):601-605.)。该方法采用类似于标准视频编码方法所采用的运动估计/补偿技术，该方法利用了相邻帧之间的时间强相关性，对视频序列压缩取得了较好的效果。在CPM和NCIM中，子块域中的每个图像块都由来自相邻帧相同大小的父块域通过运动补偿得到。CPM和NCIM两者间最大的不同在于CPM在解码的过程中需要具备收敛性，而NCIM不需要。但是在循环预测编码(CPM)方法中，为了保证起始帧经过自身的循环解码能够近似收敛到原来的图像，压缩过程需要经过复杂变换、搜索和迭代等，压缩时间和图像质量难以达到要求。Chou-Chen Wang等人提出利用空间方向或空间和时间方向上子块附近的四个父块作为最佳的搜索区域，搜素出最佳匹配块的方法，(参见Chou-Chen Wang,Chaur-Heh Hsieh.Efficient fractal video coding algorithm using intercube correlationsearch[J].Society of Photo-Optical Instrumentation Engineers,2000,39(8):2058-2064.)减少了搜索时间，提高了编码效率。Meiqing Wang等提出了综合基于数据立方体和基于帧的分形视频压缩方法(参见Meiqing Wang,Choi-Hong Lai.A hybrid fractal videocompression method[J].Computers&Mathematics with Applications,2005,50(3-4):611-621.)，(参见Meiqing Wang,Zhehuang Huang,Choi-Hong Lai.Matching search infractal video compression and its parallel implementation in distributed computingenvironments[J].Applied Mathematical Modeling,2006,30(8):677-687.)，(参见MeiqingWang,Rong Liu,Choi-Hong Lai.Adaptive partition and hybrid method in fractal videocompression[J].Computers&Mathematics with Applications,2006,51(11):1715-1726.)，在一定程度上提高了压缩比和解压图像的质量，但压缩时间较长；Koji Ohse与MasahiroNakagawa提出将视频序列变换到频率域，在应用分形视频压缩方法将不同分量的序列压缩编码(参见Koji Ohse,Masahiro Nakagawa.Fractal video coding with the orthogonaltransformation[J],Electronics and Communications in Japan,2007,90(3):36-47)，此方法提供了在确定压缩比的情况下，实现对视频较好的压缩。目前典型的分形图像和视频压缩方法的运算量大，编码速度较慢，并且解码的质量有待提高，使得分形图像和视频压缩方法还需要进一步的改进和提高。

多视点视频(Multi-view Video)是一种新型的具有立体感和交互操作功能的视频，通过在场景中放置多台摄像机，记录下多个视点数据，提供给用户以视点选择和场景漫游的交互能力。多视点视频将在自由视点视频、立体电视、立体视频会议、多视点视频点播等数字娱乐领域有着非常广泛的应用前景。随着相机数视点视频的增加，多视点视频的数据量也成倍增加，巨大的数据量已成为制约其广泛应用的瓶颈(参见MatthiasZwicker,Sehoon Yea.Multi-view Video Compression for 3D Displays[J].IEEE ComputerSociety,2010)。拍摄场景不同角度的视频信息，利用其中的一个或多个视点信息可以合成任意视点的信息，达到自由视点显示和自由切换任意视点的视点视频的(参见ISO/IECJTC1/SC29/WG111 Call for Evidence on Multi-View Video Coding.DOC.N6720,Palma deMallorca,Spain,2004.)，(参见ISO IEC JTC1/SC29/WG111 Survey of Algorithms used forMulti-view Video Coding(MVC).DOC1.N6909,Hong Kong,China,2005.)，(参见ISO/IEC JTC1/SC29/WG111 Requirements on Multi-view Video Coding 4.DOC.N7282,Poznan,Poland,2005.)。

发明内容：

本发明提出了一种新的多视点视频分形编码压缩与解压缩方法，选取中间视点作为参考视点，使用基于中心偏置的五边形运动估计预测结合分形编码的视频压缩方法，其它视点压缩时加入了快速视差估计；采用预匹配条件，得到满足条件的块匹配，不满足条件的块提高到半像素搜索块匹配，不仅提高视频压缩比与编码效率，也改善了视频解码质量；以五个视点视频为例，K、L、C、R和S依次代表一个视点视频，编码过程中，采用了本发明提出的K←L←C→R→S的预测结构，即视点R和L均用视点C来预测，视点S和K分别用视点R和L来预测，5个视点的起始帧都用I帧。解码视点顺序相同，采用环路滤波去除块效应，提高解码视频视觉质量。

一种新的多视点视频分形编码压缩与解压缩方法，其特征在于实现步骤如下：

步骤一：输入视频，若当前帧是P帧，则判断视点，若为中间视点C的图像转到步骤二；若为左视点L或右视点R的图像，转到步骤七；若为左视点K的图像，转到步骤九；若为右视点S的图像，转到步骤十一。若当前帧为起始帧或需要帧内编码的I帧，对于每个当前块在各种可能的预测方式中选择具有最小代价的预测模式存储，完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧，对残差图像的数据经过DCT、量化之后得到DCT变换系数；转入步骤六；

步骤二：对P帧划分得到子块，与前一帧图像中划分得到的父块进行块匹配。在进行子块与父块的匹配过程中，父块的大小与子块的大小相同，子块的位置作为父块的起始搜索点，搜索窗为矩形，采用基于中心偏置的五边形运动估计方法和半像素块匹配，得到最小匹配误差RMS，搜索出最佳的匹配块。转到步骤三；

步骤三：判断步骤二中搜索出的最佳匹配块是否满足预匹配条件：0<a<u，u可以根据需要进行设置后，进行接下来的预匹配条件判断。若与父块对应匹配误差RMS满足预匹配条件，并且大于预先设定的阈值γ，则转到步骤四；否则直接保存当前的迭代函数系统系数即IFS系数，转入步骤五；

步骤四：依次按照树状划分结构的四种模式对该子块进行划分，利用基于中心偏置的五边形运动估计方法和半像素块匹配计算匹配误差RMS，如果RMS小于设定阈值γ，停止划分并记录该小块IFS系数，包括父块位置(x,y)和比例因子s、偏移因子o，转入步骤五；否则继续划分，直到将当前块划分为预先设定的最小块，记录IFS系数；转入步骤五；

步骤五：将保存的IFS系数代入解码方程计算得到预测块的值，由原始块和预测块之差得到残差块，对其进行DCT变换和量化处理后，得到DCT系数，转到步骤六；再将DCT系数经反量化、反DCT变换的得到残差块的值与预测块的值求和得到重建块(所有的重建块可得到重建帧，作为下一帧的参考帧)；

步骤六：对步骤一和步骤五中得到的DCT系数、步骤三和四中得到的IFS系数进行Huffman编码，降低数据的统计冗余。如果当前帧所有的宏块都已编码完毕，则转到步骤一；否则，转到步骤二编码下一宏块；

步骤七：若P帧为左视点L或右视点R中的图像，将参考视点C中对应帧的解码图像P帧图像与P帧前一帧图像分别进行宏块和小块划分，宏块是将当前帧划分为固定大小的互不重叠的图像块，小块是宏块经过树状划分得到的块，各宏块之间、小块之间互不交迭但又恰好接触。计算各宏块与小块的像素和、像素平方和，同时计算半像素内插值对应块的像素和、像素平方和，以减少块匹配过程中的重复计算；转到步骤八；

步骤八：参考视点C中的对应帧重建图像中矩形搜索窗内对所有子块进行块匹配，充分利用分数像素块匹配和快速视差估计方法：将上一个视差估计矢量作为为当前帧的搜索中心，在水平方向沿初始点的右侧进行搜索，在搜索过程中进行跳跃式搜索；点匹配完之后，向右间隔三个点进行搜索，进行比较，直到找到最小的RMS；然后对分数像素位置进行相同的操作，比较得到更小的RMS1，结束DCP搜索过程。在当前P帧的前一帧矩形搜索窗内利用分数像素和基于五边形的运动估计对子块和父块进行匹配，得到最小匹配误差RMS2，将RMS2与RMS1比较，选择误差最小的作为预测结果，记录该块的IFS系数；转到步骤十三；

步骤九：若P帧为左视点K中的图像，将左视点L中对应帧的解码图像、当前P帧与前一帧图像分别进行宏块和小块划分，计算各宏块与小块的像素和、像素平方和；转到步骤十；

步骤十：在左视点L中的对应帧重建图像中矩形搜索窗内首先对所有子块进行块匹配，即利用快速视差估计方法得到父块与子块的最小匹配误差：在进行子块与父块的匹配过程中，父块的大小与子块的大小相同，子块的位置作为父块的起始搜索点，得到最小匹配误差RMS3，搜索出最佳的匹配块。在左视点K中P帧的前一帧矩形搜索窗内利用分数像素和基于中心偏置的五边形运动估计方法对子块和父块进行匹配，得到最小匹配误差RMS4；将RMS3与RMS4比较，选择误差最小的作为预测结果，记录该块的IFS系数；转到步骤十三；

步骤十一：若P帧为右视点S中的图像，将当前P帧与前一帧图像以及右视点R中对应帧的解码图像分别进行宏块和小块划分，计算各宏块与小块的像素和、像素平方和；转到步骤十二；

步骤十二：在右视点R中的对应帧重建图像中矩形搜索窗内利用快速视差估计方法对所有子块进行块匹配，得到最小匹配误差RMS5；在右视点S中P帧的前一帧矩形搜索窗内利用分数像素和基于中心偏置的五边形运动估计方法对子块和父块进行匹配，得到最小匹配误差RMS6；将RMS5与RMS6比较，选择误差最小的作为预测结果，记录该块的IFS系数；转到步骤十三；

步骤十三：对得到的IFS系数进行Huffman编码，判断是否为最后一帧，若不是，返回到步骤一编码下一帧；否则结束编码。

一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：提出新的时间-空间相结合的预测结构：K←L←C→R→S，对视频序列中间视点C，以及和中间视点分别等距的左视点K、L和右视点R、S的五个视点视频，分别进行时间空间联合预测MCP+DCP处理，每个处理彼此独立，K、L视点视频内部或R、S视点视频内部之间没有对应联系。

一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：多视点视频分形编码中采用多参考I帧，即每个视点的起始帧都采用I帧压缩方法，可以在取得一定压缩比的同时，获得较好质量的重建图像，为后面其它帧的压缩构建高质量的参考帧。

根据权利要求1所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：所述步骤二中半像素块匹配包括：利用整数像素内插得到半像素区域；使用半像素块与当前块计算得到相对最小的误差RMS，得到最佳匹配块。

根据权利要求1所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：所述步骤二中基于中心偏置的五边形运动估计方法，充分利用时间相关性、视频的运动特征和分形编码的特点，主要表现为以下几点：

A、提前搜索终止技术：由于大量最低运动视频序列有很多接近(0，0)的运动矢量，这些不运动宏块的发现可以仅仅通过计算其在(0，0)点的RMS值来实现。搜索中，如果在中心点(0，0)所得到的RMS值小于某一阈值，则针对此宏块的搜索立即停止。

B、运动矢量的中心偏置性：在视频序列中背景和物体的运动大多是缓慢而平滑的，对于运动细微的视频场景，其运动矢量往往极好地符合了运动矢量的中心偏置分布模型。在这样的小运动序列中，大多数运动矢量都偏向于搜索中心而相互之间非常接近。此只需在搜索中心及其附近的小范围区域内进行搜索。本发明选择五边形的搜索模式，与其它模板(如十字形、六边形、菱形等)相比，具有较好的中心偏置性。

C、相邻运动矢量之间的相关性：对于运动剧烈的图像序列，同一运动物体所覆盖的几个块的运动往往具有很强的相关性，利用它们之间运动的相关性通过预测来进行搜索，可以大大提高搜索速度，并可有效地避免搜索进入局部最小点。本发明选择上一个宏块的最佳矢量作为新的起始点搜索，能较好的减少匹配时间。

具体步骤如下：

步骤Ⅰ：由相邻块预测当前块的分数像素运动矢量，获得FMVP，即(Pred_x,Pred_y)。直接以FMVP作为搜索起始点(0，0)；

步骤Ⅱ：比较搜索起始点(0，0)周围的5个五边形搜索点(-2，0)，(-1，-1)，(1，-1)，(2，0)，(0，1)和(0，0)的匹配误差，；如果最小匹配误差小于某一阈值，最佳匹配矢量作为最终分数像素运动矢量；如果最小匹配误差RMS位于(0，0)，转到步骤Ⅳ；否则进行第Ⅲ步搜索；

步骤Ⅲ：如果最佳匹配点为(0，1)，则选择此最佳匹配点为步骤Ⅳ的搜索起始点，转到步骤Ⅳ；否则以上一步得到的最佳匹配点为中心，比较周围4个小菱形点的匹配误差，得到最佳匹配点为下一步的搜索中心点，转到步骤Ⅳ；

步骤Ⅳ：比较中心点周围4个偏置菱形搜索点(-2，0)，(-1，-1)，(1，-1)，(2，0)的匹配误差，如果最小匹配误差小于某一阈值，RMS最小的点作为最终分数像素运动矢量；否则转到步骤Ⅴ。

步骤Ⅴ：按照四种划分模式划分宏块，按照上述步骤重新进行匹配，直到得到最小的RMS的匹配块，RMS最小的点作为最终分数像素运动矢量。

根据权利要求1所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：步骤三中为降低计算量加入了预匹配条件，即将匹配误差可以进行以下变形，

取

a = {(Σ_{i = 1}^{n} \frac{(y_{i} - \overset{&OverBar;}{y}) (x_{i} - \overset{&OverBar;}{x})}{| | y_{i} - \overset{&OverBar;}{y} | | | | x_{i} - \overset{&OverBar;}{x} | |})}^{2}, a &Element; (0,1),

RMS = \frac{1}{n} {| | y_{i} - \overset{&OverBar;}{y} | |}^{2} (1 - a) - - - (2)

其中对于每个需编码子块来说，为常数，因此为了得到最小匹配误差RMS，b＝(1-a)的取值要求越小越好，即a取值应尽量大，经过实验证明，预匹配限制条件为0<a<0.1时，提高编码效率和解码图像质量。

根据权利要求1所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：步骤三中误差阈值的确定规则如下：

设定子块的匹配误差阈值γ＝tol×tol×no，其中tol根据不同的子块大小而改变，大的子块tol就越大，小的子块tol就小。在本发明中，我们取16×16宏块的tol为10.0，8×8子块的tol为8.0，4×4子块的tol为6.0，no为当前子块属于该视频对象区域的像素个数。

根据权利要求1所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：步骤四中对宏块采用树状划分，块匹配采用匹配误差准则，通过设定合适的比例因子s和偏移因子o，可以使得仿射变换后的y_i值有来自x_i值的最小平方距离，即当RMS关于s和o的偏微分为0时，得公式(4)(5)，可以得到RMS的最小值。其中y_i为子块的像素值，x_i为父块的像素值，子块与父块的匹配误差RMS为

RMS = \frac{1}{N} Σ_{i = 1}^{N} {(s \cdot x_{i} + o - y_{i})}^{2} - - - (3)

s = \frac{[N Σ_{i = 1}^{N} y_{i} x_{i} - Σ_{i = 1}^{N} y_{i} Σ_{i = 1}^{N} x_{i}]}{[N Σ_{i = 1}^{N} x_{i}^{2} - {(Σ_{i = 1}^{N} x_{i})}^{2}]} - - - (4)

o = \frac{1}{N} [Σ_{i = 1}^{N} y_{i} - s Σ_{i = 1}^{N} x_{i}] - - - (5)

如果RMS小于预先设定的阈值γ，记录IFS系数，IFS系数包括匹配块的位移矢量(x,y)和公式(4)，(5)中的s和o，处理下一宏块；

根据权利要求1所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：所述步骤八使用的快速视差估计方法为：

利用视差分布约束条件：外极线约束、方向性约束、空域相关性与时域相关性，将上一宏块视差估计矢量作为当前块的搜索中心，沿初始点水平方向进行搜索，方向根据视点位置确定，在搜索过程中进行跳跃式搜索；点匹配完之后，向水平方向隔三个点进行搜索，进行比较，直到找到最小的RMS；以此宏块视差估计矢量作为搜索中心，再对半像素位置进行相同的操作，比较得到更小的RMS。

一种新的多视点视频分形编码压缩与解压缩方法，其特征在于解压缩方法包含以下步骤：

步骤Ⅰ：首先读入五个视点图像序列压缩信息：压缩帧数，帧率，每帧图像的宽和高，I帧压缩质量和插入I帧的间隔；从压缩文件中读入码流直接对各视点的起始帧进行解码；

步骤Ⅱ：判断需解码帧是否为I帧，若是I帧转入步骤Ⅲ，否则转入步骤Ⅳ；

步骤Ⅲ：解码帧为I帧，从压缩文件中读入码流直接进行解码，帧数加一转入步骤Ⅸ；

步骤Ⅳ：对于非I帧，若为C视点需解码P帧，计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和，转到步骤Ⅴ；若为左视点L或右视点R中图像，转到步骤Ⅵ；若为左视点K中图像，转到步骤Ⅶ；若为右视点S中图像，转到步骤Ⅷ；

步骤Ⅴ：从码流中读入P帧所有宏块的划分信息、每一个小块的迭代函数系统系数和残差帧数据，其中由各迭代函数系统系数分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧。将解码端残差帧与预测帧求和，再采用去方块环路滤波提高解码视频视觉效果：首先对边界的类型进行判断，定义参数块边缘强度，针对不同强度的块边缘，选择的滤波器和所需要滤波的像素点数也不一样，如果为帧内编码且为宏块边界，则采用强滤波；若不是帧内编码且不是宏块边界，仿射块边界采用一级滤波，非仿射块边界不需要滤波；其它情况采用二级滤波；最后按照每一宏块进行解码；转到步骤Ⅸ；

步骤Ⅵ：从码流中读入左视点L或右视点R中P帧的编码信息，确定参考帧的类型，若参考帧为前一帧，则计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和；若参考帧为P帧在C视点中的对应帧，则计算C视点中对应帧的解码图像按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；再由各迭代函数系统系数分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧。解码端残差帧与预测帧之和经过滤波后得到解码后的图像；转到步骤Ⅸ；

步骤Ⅶ：从码流中读入左视点K的编码信息，若采用运动估计方法编码，则计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和；若参考帧为P帧在L视点中的对应帧，则计算L视点中对应帧的解码图像按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；再由各迭代函数系统系数与参考块分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧。解码端残差帧与预测帧之和经过滤波后得到解码后的图像；转到步骤Ⅸ；

步骤Ⅷ：从码流中读入右视点S的编码信息，若采用快速视差估计方法编码，即参考帧为P帧在R视点中的对应帧，则计算R视点中对应帧的解码图像按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；否则计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和；再由各迭代函数系统系数与参考块分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧。解码端残差帧与预测帧之和经过滤波后得到解码后的图像；转到步骤Ⅸ；

步骤Ⅸ：判断此时五个视点所有帧是否都已解码，若都解码完毕，结束解码过程，否则转入步骤Ⅱ。

根据权利要求10所述，一种新的多视点视频分形编码压缩与解压缩方法其特征在于：对于每一个宏块进行解压缩时，首先判断该宏块在编码时的划分方式，若非C视点视频，则先确定父块域是在前一帧或是参考视点当前帧对应帧中；对于每一个子块，首先在父块域找到与该子块相对应的区域，然后利用下面的公式获得该子块的像素值，

r_i＝s·d_i+o (6)

其中r_i为待解码子块的像素值，d_i为父块域中的像素值，s为比例因子，o为偏移因子。

根据权利要求10所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：对五个视点视频解码是同时的，先解码各个视点的起始帧与C视点视频的第二帧，将L视点起始帧或C视点视频的第二帧作为L视点第二帧解码的参考帧，将R视点起始帧或C视点视频的第二帧作为R视点第二帧解码的参考帧，将K视点起始帧或L视点视频的第二帧作为K视点第二帧解码的参考帧，将S视点起始帧或R视点视频的第二帧作为S视点第二帧解码的参考帧，依此类推解码五个视点视频的所有帧。

根据权利要求10所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：所述步骤Ⅴ中的块边缘强度用BS表示；其中，P₀',Q₀',P₁',Q₁'表示滤波后的像素值，P₀,P₁,Q₀,Q₁表示原始的像素值，不同的BS和对应的滤波器如下：

若为帧内编码且边界是宏块边界时，BS＝3，需要进行强滤波，滤波器表示为：

P₀'＝(P₁+P₀+Q₀)/3

Q₀'＝(P₀+Q₀+Q₁)/3

(7)

P₁'＝(2·P₁+P₀')/3

Q₁'＝(2·Q₁+Q₀')/3

若为帧内编码且边界不是宏块边界，或者是边界但不是帧内编码时，BS＝2，对应二级滤波器表示为：

P₀'＝(P₁+2·P₀+Q₀)/4

(8)

Q₀'＝(P₀+2·Q₀+Q₁)/4

若不是帧内编码和边界，是仿射块边界时，BS＝1，对应的一级滤波器表示为：

P₀'＝(P₁+3·P₀+Q₀)/5

(9)

Q₀'＝(P₀+3·Q₀+Q₁)/5

若不是帧内编码和边界，也不是仿射块边界时，当BS＝0，不进行滤波。

根据权利要求10所述一种新的多视点视频分形编码压缩与解压缩方法，其特征在于：输入的视频序列为YUV格式，分别对3个分量Y、U、V每个都采用上述十三个步骤进行处理。

本发明所提出的多视点视频分形压缩方法的优点在于：

(1)本方法在编码上采用多参考I帧，对每一个视点的起始帧都采用DCT变换来处理，可以在取得一定压缩比的同时，获得较好质量的重建图像，为后面其它帧的压缩构建高质量的参考帧；

(2)运动估计是分形中搜索最关键的一个环节，也是造成编码时间过多的重要来源。本方法采用一种基于中心偏置的五边形运动估计方法，结合了视频实际的运动特性，采用提前搜索终止技术、运动矢量的中心偏置性、相邻运动矢量之间的相关性，提高了编码效率。

(3)本方法在编码过程中，提出了一种新的预测结构K←L←C→R→S，充分利用时间和空间相关性，有效地消除各视点间冗余数据，使得多视点视频编码达到实时性要求，并且使其面向的范围更广，实现更好的效果。

(4)本方法在进行块划分匹配之前，利用块匹配误差与上述提到参数b成正比，得到预匹配条件，提前获得一些子块的最佳匹配父块，未得到最佳匹配父块的子块则继续划分进行块匹配，提高了编码性能和速度。

(5)本方法在搜索块匹配时，通过双线性插值得到整像素之间的像素值，将匹配精度提高到半像素，可以获得更精确的运动向量和更高的压缩比。

(6)本方法合理安排各视点数据存储结构，将多个视点编码后结果写入码流中，实现结果的有效存储和利用，在解码中用作输入，来实现图像的复原。

附图说明：

图1(a)为本发明一种新的多视点视频分形编码压缩与解压缩方法的整体压缩流程图；

图1(b)为本发明一种新的多视点视频分形编码压缩与解压缩方法的中间C视点视频MCP压缩流程图；

图1(c)为本发明一种新的多视点视频分形编码压缩与解压缩方法的L视点视频MCP+DCP压缩流程图；

图1(d)为本发明一种新的多视点视频分形编码压缩与解压缩方法的K视点视频MCP+DCP压缩流程图；

图1(e)为本发明一种新的多视点视频分形编码压缩与解压缩方法的R视点视频MCP+DCP压缩流程图；

图1(f)为本发明一种新的多视点视频分形编码压缩与解压缩方法的S视点视频MCP+DCP压缩流程图；

图1(g)为本发明一种新的多视点视频分形编码压缩与解压缩方法的中间C视点视频MCP解压缩流程图；

图1(h)为本发明一种新的多视点视频分形编码压缩与解压缩方法的L视点视频MCP+DCP解压缩流程图；

图1(i)为本发明一种新的多视点视频分形编码压缩与解压缩方法的K视点视频MCP+DCP解压缩流程图；

图1(j)为本发明一种新的多视点视频分形编码压缩与解压缩方法的R视点视频MCP+DCP解压缩流程图；

图1(k)为本发明一种新的多视点视频分形编码压缩与解压缩方法的S视点视频MCP+DCP解压缩流程图；

图1(l)为本发明一种新的多视点视频分形编码压缩与解压缩方法的中心偏置的五边形运动估计方法流程图；

图1(m)为本发明一种新的多视点视频分形编码压缩与解压缩方法中的视差补偿预测DCP快速方法流程图；

图2(a)为左视点K视频序列“exit”的起始帧原始图像；

图2(b)为左视点L视频序列“exit”的起始帧原始图像；

图2(c)为中间视点C视频序列“exit”的起始帧原始图像；

图2(d)为右视点R视频序列“exit”的起始帧原始图像；

图2(e)为右视点S视频序列“exit”的起始帧原始图像；

图3(a)为本发明一种新的多视点视频分形编码压缩与解压缩方法中基于中心偏置的五边形的两种搜索模板；

图3(b)为本发明一种新的多视点视频分形编码压缩与解压缩方法的半像素块匹配方法示意图；

图4为本发明一种新的多视点视频分形编码压缩与解压缩方法对宏块的四种划分模式图，以及对宏块的划分模式四进一步进行划分的四种划分模式图；

图5为本发明一种新的多视点视频分形编码压缩与解压缩方法的MCP和DCP结构示意图；

图6为双目立体平行摄像系统示意图；

图7(a)为本发明一种新的多视点视频分形编码压缩与解压缩方法中的去方块环路滤波的垂直和水平边界临域的采样示意图；

图7(b)为本发明一种新的多视点视频分形编码压缩与解压缩方法中环路滤波的块边缘强度判决树示意图；

图8(a)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u＝0.1时进行压缩的压缩比的对比图；

图8(b)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u＝0.2进行压缩的压缩比的对比图；

图8(c)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u＝0.3进行压缩的压缩比的对比图；

图9(a)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u＝0.1进行压缩的PSNR的对比图；

图9(b)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u＝0.2进行压缩的PSNR的对比图；

图9(c)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u＝0.3进行压缩的PSNR的对比图；

图10为本发明一种新的多视点视频分形编码压缩与解压缩方法的中实现的本文提出预测结构与实现的其它5种预测结构方法对“exit”多视点视频序列的参数u在不同取值下进行压缩的压缩时间的对比图。

图11(a)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的使用结构A的方法对“exit”多视点视频序列的参数u＝0.1进行压缩的视点1到视点5的第2帧解码图像；

图11(b)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的使用结构B的方法对“exit”多视点视频序列的参数u＝0.1进行压缩的视点1到视点5的第2帧解码图像；

图11(c)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的使用结构C的方法对“exit”多视点视频序列的参数u＝0.1进行压缩的视点1到视点5的第2帧解码图像；

图11(d)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的使用结构D的方法对“exit”多视点视频序列的参数u＝0.1进行压缩的视点1到视点5的第2帧解码图像；

图11(e)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的使用结构E的方法对“exit”多视点视频序列的参数u＝0.1进行压缩的视点1到视点5的第2帧解码图像；

图11(f)为本发明一种新的多视点视频分形编码压缩与解压缩方法中实现的使用结构F的方法对“exit”多视点视频序列的参数u＝0.1进行压缩的视点1到视点5的第2帧解码图像。

具体实施方式：

下面将结合附图对本发明方法作进一步的详细说明，仅以亮度分量Y为例，色差分量U和V的压缩步骤与亮度分量相同。

本发明提出了一种新的多视点视频分形编码压缩与解压缩方法，选取中间视点作为参考视点，使用基于中心偏置的五边形运动估计预测结合分形编码的视频压缩方法，其它视点压缩时加入了快速视差估计；采用预匹配条件，得到满足条件的块匹配，并且将块匹配的精度提高到半像，提高视频压缩比与编码效率；以五视点视频为例，K、L、C、R和S依次代表一个视点视频，提出K←L←C→R→S的预测结构，即视点R和L均用视点C来预测，视点S和K分别用视点R和L来预测，5个视点的起始帧都用I帧。解码视点顺序相同，采用环路滤波去除块效应，提高解码视频视觉质量。

如附图1(b)、图1(c)、图1(d)、图1(e)和图1(f)所示，一种新的多视点视频分形压缩编码方法，包括以下步骤：

步骤一：以标准测试5个视频序列“exit.yuv”的前5帧为例。附图2(a)是标准测试多视点视频序列“exit.yuv”K视点视频第1帧图像，附图2(b)是标准测试多视点视频序列“exit.yuv”L视点视频第1帧图像，附图2(c)是标准测试多视点视频序列“exit.yuv”C视点视频第1帧图像，附图2(d)是标准测试多视点视频序列“exit.yuv”R视点视频第1帧图像，附图2(e)是标准测试多视点视频序列“exit.yuv”S视点视频第1帧图像。

所述把正在进行压缩的帧称为当前帧，所述把前一帧的解压缩图像称为参考帧。所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧；所述块DCT变换中的块采用固定大小模式。对于L视点视频转到步骤八；对于R视点视频转到步骤十二；对于K视点视频转到步骤八，与L视点视频具有相似的编码过程；对于S视点视频转到步骤十二，与R视点视频具有相似的编码过程，参考帧根据预测结构而改变。

步骤二：对视频序列“exit.yuv”C视点视频。首先判断是否为I帧，若是I帧，对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩：将起始帧划分为8×8的子块，各子块互不交迭但又恰好接触，对每一子块分别进行DCT变换。对变换系数进行量化和编码，转入步骤十三；否则，转到步骤三；

离散余弦变换中X_i,j代表8×8的图像像素值，变换成8×8的系数矩阵Y_x,y。

8×8样本块的正向DCT(FDCT)变换如下：

Y_{x, y} = \frac{1}{4} C_{x} C_{y} Σ_{i = 0}^{N - 1} Σ_{j = 0}^{N - 1} X_{i, j} \cos \frac{(2 j + 1) yπ}{2 N} \cos \frac{(2 i + 1) xπ}{2 N} - - - (10)

反向DCT(IDCT)如下：

X_{i, j} = \frac{1}{4} Σ_{x = 0}^{N - 1} Σ_{y = 0}^{N - 1} C_{x} C_{y} Y_{x, y} \cos \frac{(2 i + 1) xπ}{2 N} \cos \frac{(2 j + 1) yπ}{2 N} - - - (11)

其中

C_{x} = \{\begin{matrix} \frac{1}{\sqrt{2}}, & for & x = 0 \\ 1, & for & x > 0 \end{matrix}

C_{y} = \{\begin{matrix} \frac{1}{\sqrt{2}}, & for & y = 0 \\ 1, & for & y > 0 \end{matrix}

步骤三：若C视点为非I帧，对图像进行宏块和小块划分，各宏块之间、小块之间互不交迭但又恰好接触。分别计算当前帧互不重叠的块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和与像素的平方和。然后分别计算参考帧中以1个像素为步长的块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和与像素平方和，同时计算参考帧中内插得到半像素对应块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和、像素平方和。从第一个宏块开始处理，依次对当前帧的所有16×16宏块进行编码，转到步骤四；所述将当前帧划分为固定大小的互不重叠的图像块称为宏块；所述将当前宏块进行树状划分得到的块称为小块；所述当前帧所有块的集合称为子块域；所述前一帧的所有块的集合称为父块域；

步骤四：首先对该宏块在父块域中的±7个像素的矩形搜索窗内进行块匹配：在进行子块与父块的匹配过程中，父块的大小与子块的大小相同，子块的位置作为父块的起始搜索点，利用半像素块匹配和基于中心偏置的五边形运动估计方法进行块匹配。基于中心偏置的五边形运动估计方法中两种搜索模板如图3(a)，流程图如图1(l)所示，得到最小匹配误差RMS，搜索出最佳的匹配块。

然后搜索半像素内插值对应小块处的RMS点，如图3(b)所示，步骤如下：

1)首先对参考帧中搜索区域内的像素进行内插得到半像素值，形成一个更高分辨率的区域；

2)在内插区域进行整数像素和半像素位置搜索找到最佳匹配块；

3)用匹配块的仿射变换来替代当前块。

图3(b)中，a代表原来的整数像素，b和c代表通过一对整数像素a线性插值后的像素值，d代表通过周围四个整数像素a线性插值后的像素值，箭头表示内插方向。假设A点为整数像素搜索最优点，P₀'为最佳匹配块，在其周围进行半像素的运动搜索，如点1、2、3、4、5、6、7、8，直到找到最小的RMS点，P₀″为半像素搜索的最佳块，转到步骤五。虽然计算量有所增加，但是半像素运动估计和运动补偿的性能明显好于整数像素的运动估计和运动补偿；

步骤五：判断步骤四中搜索出的最佳匹配块是否满足预匹配条件：0<a<u，u可以根据需要进行设置后，进行接下来的预匹配条件判断。若与父块对应值满足预匹配条件，则转到步骤六；否则直接保存当前的迭代函数系统系数即IFS系数，转入步骤八；

步骤六：判断满足步骤五的最佳匹配块的匹配误差RMS是否小于预先设定的阈值γ，若小于，直接保存当前的迭代函数系统系数即IFS系数，转入步骤八；否则，转入步骤七；

步骤七：依次按照树状划分结构的四种模式对该宏块进行划分，利用半像素块匹配和基于中心偏置的五边形运动估计方法，直到得到最小匹配误差满足RMS<γ，搜索出最佳的匹配块，记录该小块IFS系数；具体步骤如下：

首先设定子块的匹配误差阈值γ＝tol×tol×no，其中tol根据不同的子块大小而改变，大的子块tol就越大，小的子块tol就小。在本例中，我们取16×16宏块的tol为10.0，8×8子块的tol为8.0，4×4子块的tol为6.0，no为当前子块属于该视频对象区域的像素个数。

首先设定16×16宏块的匹配误差阈值γ₁₆＝10.0×10.0×no，在参考帧的父块域中以当前子块的位置开始在15×15的搜索窗内对整个宏块进行块匹配，如果匹配误差RMS小于开始设定的阈值γ₁₆，则保存当前的IFS系数包括比例因子s，偏移o，父块相对于当前子块的坐标偏移x，y，返回步骤三，继续下一宏块的匹配。

否则，按照树状划分结构对该宏块进行划分，对宏块的划分有四种模式，如附图4，模式一为一个16×16小块，模式二为两个8×16的小块，模式三为两个16×8的小块，模式四为四个8×8的小块。

1、首先按模式二的划分计算，利用半像素块匹配和基于中心偏置的五边形运动估计方法，若模式二中两个小块都满足RMS<γ₁₆,则保存当前的IFS系数包括比例因子s，偏移o，以及父块相对于当前子块的坐标偏移x，y，并停止块的划分，转到5；

2、否则按模式三划分，利用半像素块匹配和基于中心偏置的五边形运动估计方法，若模式三中两个小块都满足RMS<γ₁₆，则保存当前的IFS系数包括比例因子s，偏移o，以及父块相对于当前子块的坐标偏移x，y，并停止块的划分，转到5；

3、否则按照模式四对当前宏块进行划分，利用半像素块匹配和基于中心偏置的五边形运动估计方法，此时匹配误差阈值设置为γ₈＝8.0×8.0×no，如果模式四中的4个小块都满足RMS<γ₈,则保存当前的IFS系数包括比例因子s，偏移o，以及父块相对于当前子块的坐标偏移x，y，并停止块的划分，转到5；

4、否则对模式四中的每一个小块按照附图4中的顺序继续进行划分，可依次划分为1个8×8的小块，2个4×8的小块，2个8×4的小块，4个4×4的小块。这里只对第一个8×8小块的匹配过程进行阐述，其它3个8×8小块的匹配过程与第一个相同，不再赘述。首先按照2个4×8的小块划分，进行块匹配，如果两个子块的匹配误差RMS全部小于γ₈时，则保存当前的IFS系数包括比例因子s，偏移o，以及父块相对于当前子块的坐标偏移x，y，并停止块的划分。否则，按照2个8×4的划分方式进行块的划分，对这两个子块进行块匹配，如果两个子块的匹配误差RMS全部小于γ₈时，则保存当前的IFS系数包括比例因子s，偏移o，以及父块相对于当前子块的坐标偏移x，y，并停止块的划分。否则，对该子块划分为4个4×4的小块，同时匹配误差阈值设为γ₄＝6.0×6.0×no，对四个小块分别进行块匹配，并分别记录每个子块的IFS系数包括比例因子s，偏移o，以及父块相对于当前子块的坐标偏移x，y，并停止块的划分，转到5；

5、返回步骤三，继续下一宏块的编码。

如果当前帧所有的宏块都已编码完毕，且是C视点，则转到步骤十三；若是其它视点视频，则转到步骤九；

步骤八：对于L视点或R视点，若是I帧，对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩，转到步骤十三；否则首先对图像进行宏块和小块划分，各宏块之间、小块之间互不交迭但又恰好接触。分别计算当前帧互不重叠的块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和与像素的平方和。然后计算参考帧中以1个像素为步长的块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和与像素的平方和，同时计算由整数像素内插得到半像素对应块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和、像素平方和，以减少块匹配过程中的重复计算。

附图5为多视点立体视频编码的MCP和DCP结构示意图，L视点和R视点中，每个宏块使用DCP从C视点中预测，使用MCP从L视点或R视点的前一帧预测。转入步骤三开始在L视点或R视点的前一帧中搜索，选择最匹配的D块；

步骤九：计算参考视点中对应帧的解压缩图像中以1个像素为步长的大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的小块的像素和与像素的平方和，同时计算整数像素内插得到的半像素对应块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和、像素平方和，进行搜索选择最匹配的D块。从第一个宏块开始处理，依次对当前帧的所有16×16宏块进行编码，转入步骤十；

步骤十：首先对与当前子块位置相同的父块进行块匹配，得到RMS，并保存迭代函数系统系数，该系数包括父块与子块的相对位移矢量(x,y)，比例因子s和偏移因子o；依次对当前帧的所有宏块进行编码，在父块域中的搜索窗内首先对该宏块进行块匹配；在进行子块与父块的匹配过程中，子块的位置作为父块的起始搜索点，父块的大小与子块的大小相同并转入步骤十一，执行完步骤十一返回之后，如果所得的匹配误差RMS小于开始设定的阈值γ，则保存当前的迭代函数系统系数即IFS系数，转入步骤十编码下一宏块；否则，依次按照树状划分结构对该块进行划分，并对各个划分得到的小块分别转入步骤十一，执行完步骤十一返回之后计算匹配误差RMS，如果RMS小于设定阈值γ，则停止划分并记录该小块IFS系数，转入步骤十编码下一宏块；否则继续划分，直到将当前块划分为预先设定的最小块，转入步骤十一计算RMS，执行完步骤十一返回之后记录IFS系数，转入步骤十编码下一宏块；最后与步骤七所得结果比较，选择误差最小的作为预测结果；所述搜索窗为在参考帧中的矩形搜索区域；所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o；如果当前帧所有的宏块都已编码完毕，则转到步骤十三；

步骤十一：充分利用半像素块匹配和视差分布约束条件：将上一个视差估计矢量作为当前帧的搜索中心，沿初始点水平方向进行搜索，方向根据视点位置确定，在搜索过程中进行跳跃式搜索；点匹配完之后，向水平方向隔三个点进行搜索，进行比较，直到找到最小的RMS；以此宏块视差估计矢量作为搜索中心，再对半像素位置进行相同的操作，比较得到更小的RMS。图1(m)为视差补偿预测DCP快速方法流程图，具体实现如下：

视差分布约束条件包括：

1)外极线约束；对于左视点中的图像上的一点，通过相对定向参数找出右视点中的图像上与其对应的极线，其对应点在上述极线上搜索；对于平行系统的视差搜索，沿扫描线，进行x方向的搜索；最佳匹配点位于偏振线上即水平线上；在立体平行摄像系统中，沿水平方向进行DCP搜索；

如图6，两摄像机在同一时刻观看空间同一特征点P(x_c,y_c,z_c)，在左视点中的图像和右视点中的图像的坐标分别为p_left＝(X_left,Y_left)，p_right＝(X_right,Y_right)；其中点P(x_c,y_c,z_c)与两个光心所确定的平面称为偏振平面，偏振平面与左右图像的交线称为偏振线；由几何关系得到，其中：f表示摄像机的焦距，B为两摄像机的投影中心连线的距离，即基线距，z_c为世界坐标系下特征点P的z坐标：

\{\begin{matrix} X_{left} = f \frac{x_{c}}{z_{c}} \\ X_{right} = f \frac{(x_{c} - B)}{z_{c}} \\ Y = f \frac{y_{c}}{z_{c}} \end{matrix} - - - (12)

2)方向性约束；对于同一个景物，其透视投影左视点中的图像相对于右视点中的图像局部地向左移动；同一空间点在两图像平面中的投影位置差矢量即视差视差D表示相对深度，对于同一特征点，其透视投影左视点中的图像是右视点中的图像沿水平负向的局部平移；同一空间点在右视点中的图像上的图像坐标比在左视点中的图像上的图像坐标偏右，在搜索时沿一个方向进行；

3)空域相关性与时域相关性：连续变化视差场中的视差矢量有相关性，即同一帧内视差矢量之间存在相关性；对于相邻两帧图像，仅有少数像素发生了运动，多数像素的位置并没有变化；对于位置不变的像素来说，其视差基本不变；在进行视差估计时，用前一帧图像的对应视差矢量作为搜索起始点进行小范围内的搜索，从而快速找到实际视差矢量；

结束DCP搜索过程；

步骤十二：对于R视点或S视点图像，首先对图像进行宏块和小块划分，各宏块之间、小块之间互不交迭但又恰好接触。分别计算当前帧互不重叠的块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和与像素的平方和。然后计算参考帧也就是前一帧的解压缩图像中1个像素为步长的块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和与像素的平方和，同时计算由整数像素内插得到半像素对应块大小分别为16×16，16×8，8×16，8×8，8×4，4×8，4×4的像素和、像素平方和，以减少块匹配过程中的重复计算，转到步骤三；

步骤十三：对所有IFS系数进行Huffman编码，Huffman编码是根据出现的概率将每个符号映射到一个变长码字的集合(VLC)上，降低IFS系数数据的统计冗余。判断当前帧是否为最后一帧，如果是最后一帧结束编码，否则，返回步骤二继续处理下一帧图像。

如附图1(g)、图1(h)、图1(i)、图1(j)和图1(k)所示，一种新的三维视频分形解压缩方法，包括以下步骤：

步骤Ⅰ：首先读入C视点图像序列压缩信息：压缩帧数，每帧图像的宽和高，I帧压缩质量和插入I帧的间隔；

步骤Ⅱ：判断解码帧是否为I帧，若是I帧转入步骤Ⅲ，否则转入步骤Ⅳ；

步骤Ⅳ：对于非I帧，计算C视点需解码帧的前一帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；

步骤Ⅴ：读入L、R视点视频的压缩信息，包括压缩帧数，每帧图像的宽和高，I帧压缩质量和插入I帧的间隔；计算L、R视点中需解码帧的前一帧和C视点的对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；

步骤Ⅵ：读入K、S视点视频压缩信息，包括压缩帧数，每帧图像的宽和高，I帧压缩质量和插入I帧的间隔；计算K、S视点中需解码帧的前一帧和对应参考视点L、R视点对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；

步骤Ⅶ：从压缩文件中读入块的划分信息和Huffman码流，从而得到该帧所有宏块的划分方式和每一个小块的迭代函数系统系数，转入步骤Ⅷ；

步骤Ⅷ：先解码C视点视频当前帧，采用去方块环路滤波提高解码视频视觉效果：首先对边界的类型进行判断，定义参数块边缘强度，针对不同强度的块边缘，选择的滤波器和所需要滤波的像素点数也不一样，如图7(a)所示，垂直和水平边界临域的采样示意图，如果为帧内编码且为宏块边界，则采用强滤波；若不是帧内编码且不是宏块边界，仿射块边界采用一级滤波，非仿射块边界不需要滤波；其它情况采用二级滤波；最后按照每一宏块进行解码；具体选择如图7(b)所示，块边缘强度用BS表示；其中，P₀',Q₀',P₁',Q₁'表示滤波后的像素值，P₀,P₁,Q₀,Q₁表示原始的像素值，不同的BS和对应的滤波器如下；

P₀'＝(P₁+P₀+Q₀)/3

Q₀'＝(P₀+Q₀+Q₁)/3

(13)

P₁'＝(2·P₁+P₀')/3

Q₁'＝(2·Q₁+Q₀')/3

P₀'＝(P₁+2·P₀+Q₀)/4

(14)

Q₀'＝(P₀+2·Q₀+Q₁)/4

P₀′＝(P₁+3·P₀+Q₀)/5

(15)

Q₀'＝(P₀+3·Q₀+Q₁)/5

对于每一个宏块进行解压缩时，首先判断该宏块在编码时的划分方式，若非C视点视频，则先确定父块域是在前一帧或是参考视点当前帧对应帧中；对于每一个子块，首先在父块域找到与该子块相对应的区域，然后利用迭代系统系数和下面的公式获得该子块的像素值，

r_i＝s·d_i+o (16)

步骤Ⅸ：C视点视频的解码图像或L、R视点视频图像的前一帧解码图像作为需解码图像的参考图像，分别解码L、R视点的当前帧图像；同理解码K、S视点当前帧图像，参考帧随预测结构而变化；

步骤Ⅹ：判断此时五个视点所有帧是否都已解码，若都解码完毕，结束解码过程，否则转入步骤Ⅱ。

本方法选择Visual C++6.0作为所述方法的实现语言，CPU为Core^TM 2 DuoT8300，2.4GHz主频，内存大小为2G，对标准YUV 4:2:0格式5视点视频序列“exit.yuv”(分辨率：640×480像素)的前5帧进行仿真实验。仿真实验的实验参数配置如下：运动估计宏块大小为16×16像素；搜索窗口大小为15×15像素，即±7像素；采用RMS匹配准则。本发明提出的结构：K←L←C→R→S，即视点R用视点C来预测，视点L用视点C来预测，视点S用视点R来预测，视点K用视点L来预测，5个视点的起始帧都用I帧，与其它5种不同的预测结构进行对比：

A、顺序预测结构，K→L→C→R→S，视点L用视点K来预测，视点C用视点L来预测，视点R用视点C来预测，视点S用视点R来预测，5个视点的起始帧都用I帧。

B、与结构A相类似，C视点以外的其它视点的起始帧不用I帧。

C、视点R、L、S、K都用视点C来预测，5个视点的起始帧都用I帧。

D、偶数视点用前面的偶数视点作为独立视点，奇数视点用前面的和后面的偶数视点作为独立视点。视点L用视点K和视点C来预测，视点C用视点K来预测，视点R用视点C和视点S来预测，视点S用视点C来预测，5个视点的起始帧都用I帧。

E、多描述编码结构，奇数帧时，与结构A相同的预测K→L→C→R→S；偶数帧时，相逆的预测结构S→R→C→L→K，5个视点的起始帧都用I帧。

编码性能对比图如图8-10所示，图11为6种不同结构的视点1到视点5的第2帧解码图像。

表格1～表格6给出了本发明提出的结构与结构A～结构E的5视点平均压缩比对比表，其中预搜索阈值u分别取0.1、0.2和0.3；同时，图8(a)～(c)显示了不同情况下的压缩比。可以很清楚地看到，随着阈值u的增加，压缩比减小。与其它结构相比，结构B所得到的编码性能最差。表格7～表格12给出了结构A～结构F的5视点平均PSNR对比表，其中预搜索阈值分别取0.1、0.2和0.3；同时，图9(a)～(c)显示了不同情况下的PSNR。同时很清楚地看到，随着阈值u的增加，PSNR减小。除了结构B，其它结构都能得到较好的编码性能。表格13给出了结构A～结构F的5视点平均压缩时间对比表，其中预搜索阈值分别取0.1、0.2和0.3；同时，图10显示了不同情况下的压缩时间。可以看出，对于不同的阈值u和相同的结构，压缩时间几乎保持不变；结构E需要相对长的压缩时间。

因此，在保持可接受的解码质量，本发明提出的结构F获得好的压缩比和压缩时间，具有相对折中的效果。

表1结构A的5个视点压缩比对比

表2结构B的5个视点压缩比对比

表3结构C的5个视点压缩比对比

表4结构D的5个视点压缩比对比

表5结构E的5视点压缩比对比

表6结构F的5个视点压缩比对比

表7结构A的5视点PSNR对比

表8结构B的5个视点PSNR对比

表9结构C的5个视点PSNR对比

表10结构D的5个视点PSNR对比

表11结构E的5个视点PSNR对比

表12结构F的5个视点PSNR对比

表13不同结构的平均压缩时间对比

根据5个视点的平均数据结构，从表14中可以看出，结构E的平均压缩比最大为121.18，结构B的平均压缩比最小为107.76，其它结构的平均压缩比在117～118之间；结构E的平均PSNR最大为35.19dB，结构B的平均PSNR最小为29.88dB；结构F的平均压缩时间最少为2.95s，结构E的平均压缩时间最大为3.65s。因此，结构E与其它结构相比，具有更好的编码性能，但是编码时间过长；同时，除了结构B外，其它几种结构都能取得相对不错的结果，可见起始帧的解码质量对后面的预测有着很大的影响作用。本发明提出的结构F具有相对折中的编码效果。

表14平均性能对比

分形视频编码方法具有高压缩比，解码速度快和解码分辨率无关性的特性，被公认为视点前最有发展前景的三种编码方式之一，本发明对传统的分形编码方式进行了部分改进，使其编码结构更加合理，提高了视频编码速度和压缩比。多视点视频具有单视点视频无法比拟的优越性，因此越来越多的受到人们的关注，并被广泛应用于诸多领域，但是其庞大的数据量严重阻碍了它的发展，本发明尝试将分形视频编码方法应用到多视点立体视频编码领域，并根据立体平行摄像结构的几何约束和视频本身的特征，实现了6种简单的5个视点编码结构，通过实验可以得到，该方法保证PSNR在可接受范围的前提下，极大地提高了编码速度和压缩比，降低了运算复杂度，为多视点立体视频编码的实时性应用奠定了基础。

Claims

1.一种新的多视点视频分形编码压缩方法，其特征在于实现步骤如下：

步骤一：输入视频，若当前帧是P帧，则判断视点，若为中间视点C的图像转到步骤二；若为左视点L或右视点R的图像，转到步骤七；若为左视点K的图像，转到步骤九；若为右视点S的图像，转到步骤十一；若当前帧为起始帧或需要帧内编码的I帧，对于每个当前块在各种可能的预测方式中选择具有最小代价的预测模式存储，完成所有块的预测后可以得到I帧的预测帧；通过原始帧和预测帧之差得到编码端残差帧，对残差图像的数据经过DCT、量化之后得到DCT变换系数；转入步骤六；

步骤二：对P帧划分得到子块，与前一帧图像中划分得到的父块进行块匹配；在进行子块与父块的匹配过程中，父块的大小与子块的大小相同，子块的位置作为父块的起始搜索点，搜索窗为矩形，采用基于中心偏置的五边形运动估计方法和半像素块匹配，得到最小匹配误差RMS，搜索出最佳的匹配块；转到步骤三；

步骤三：判断步骤二中搜索出的最佳匹配块是否满足预匹配条件：0<a<u，u是预搜索阈值，可以根据需要进行设置后，进行接下来的预匹配条件判断；若与父块对应匹配误差RMS满足预匹配条件，并且大于预先设定的阈值γ，则转到步骤四；否则直接保存当前的迭代函数系统系数即IFS系数，转入步骤五；

步骤四：依次按照树状划分结构的四种模式对该子块进行划分，利用基于中心偏置的五边形运动估计方法和半像素块匹配计算匹配误差RMS，如果RMS小于设定阈值γ，停止划分并记录小块IFS系数，其中小块是子块经过树状划分得到的块，IFS系数包括父块位置(x,y)和比例因子s、偏移因子o，转入步骤五；否则继续划分，直到将当前块划分为预先设定的最小块，记录IFS系数；转入步骤五；

步骤五：将保存的IFS系数代入解码方程计算得到预测块的值，由原始块和预测块之差得到残差块，对其进行DCT变换和量化处理后，得到DCT系数，转到步骤六；再将DCT系数经反量化、反DCT变换的得到残差块的值与预测块的值求和得到重建块，所有的重建块可得到重建帧，作为下一帧的参考帧；

步骤六：对步骤一和步骤五中得到的DCT系数、步骤三和四中得到的IFS系数进行Huffman编码，降低数据的统计冗余；如果当前帧所有的宏块都已编码完毕，则转到步骤一；否则，转到步骤二编码下一宏块；

步骤七：若P帧为左视点L或右视点S中的图像，计算参考视点C中对应帧的解码图像P帧图像与P帧前一帧图像分别进行宏块和小块划分，宏块是将当前帧划分为固定大小的互不重叠的图像块，小块是宏块经过树状划分得到的块，各宏块之间、小块之间互不交迭但又恰好接触；计算各宏块与小块的像素和、像素平方和，同时计算半像素内插值对应块的像素和、像素平方和，以减少块匹配过程中的重复计算；转到步骤八；

步骤八：参考视点C中的对应帧重建图像中矩形搜索窗内对所有子块进行块匹配，充分利用分数像素块匹配和快速视差估计方法：将上一个视差估计矢量作为为当前帧的搜索中心，在水平方向沿初始点的右侧进行搜索，在搜索过程中进行跳跃式搜索；点匹配完之后，向右间隔三个点进行搜索，进行比较，直到找到最小的RMS；然后对分数像素位置进行相同的操作，比较得到更小的RMS1，结束DCP搜索过程；在当前P帧的前一帧矩形搜索窗内利用分数像素和基于五边形的运动估计对子块和父块进行匹配，得到最小匹配误差RMS2，将RMS2与RMS1比较，选择误差最小的作为预测结果，记录该块的IFS系数；转到步骤十三；

步骤九：若P帧为左视点K中的图像，计算左视点L中对应帧的解码图像，将当前P帧与前一帧图像以及左视点L中对应帧的解码图像分别进行宏块和小块划分，计算各宏块与小块的像素和、像素平方和；转到步骤十；

步骤十：在左视点L中的对应帧重建图像中矩形搜索窗内首先对所有子块进行块匹配，即利用快速视差估计方法得到父块与子块的最小匹配误差：在进行子块与父块的匹配过程中，父块的大小与子块的大小相同，子块的位置作为父块的起始搜索点，得到最小匹配误差RMS3，搜索出最佳的匹配块；在左视点K中P帧的前一帧矩形搜索窗内利用分数像素和基于中心偏置的五边形运动估计方法对子块和父块进行匹配，得到最小匹配误差RMS4；将RMS3与RMS4比较，选择误差最小的作为预测结果，记录该块的IFS系数；转到步骤十三；

步骤十一：若P帧为右视点S中的图像，计算右视点R中对应帧的解码图像，将当前P帧与前一帧图像以及右视点R中对应帧的解码图像分别进行宏块和小块划分，计算各宏块与小块的像素和、像素平方和；转到步骤十二；

2.根据权利要求1所述一种新的多视点视频分形编码压缩方法，其特征在于：所述步骤二中半像素块匹配包括：利用整数像素内插得到半像素区域；使用半像素块与当前块计算得到相对最小的误差RMS，得到最佳匹配块；

具体步骤如下：

步骤Ⅰ：由相邻块预测当前块的分数像素运动矢量，获得FMVP，即(Pred_x,Pred_y)；直接以FMVP作为搜索起始点(0，0)；

步骤Ⅱ：比较搜索起始点(0，0)周围的5个五边形搜索点(-2，0)，(-1，-1)，(1，-1)，(2，0)，(0，1)和(0，0)的匹配误差；如果最小匹配误差小于某一阈值，最佳匹配矢量作为最终分数像素运动矢量；如果最小匹配误差RMS位于(0，0)，转到步骤Ⅳ；否则进行第Ⅲ步搜索；

步骤Ⅳ：比较中心点周围4个偏置菱形搜索点(-2，0)，(-1，-1)，(1，-1)，(2，0)的匹配误差，如果最小匹配误差小于某一阈值，RMS最小的点作为最终分数像素运动矢量；否则转到步骤Ⅴ；

3.根据权利要求1所述一种新的多视点视频分形编码压缩方法，其特征在于：步骤三中为降低计算量加入了预匹配条件，即将匹配误差可以进行以下变形，

\begin{matrix} RMS = \frac{1}{n} Σ_{i = 1}^{n} {(s \cdot x_{i} + o - y_{i})}^{2} \\ = \frac{1}{n} Σ_{i = 1}^{n} {(s \cdot x_{i} + \frac{1}{n} [Σ_{i = 1}^{n} y_{i} - s Σ_{i = 1}^{n} x_{i}] - y_{i})}^{2} \\ = \frac{1}{n} Σ_{i = 1}^{n} {((x_{i} - \frac{Σ_{i = 1}^{n} x_{i}}{n}) \cdot \frac{[n Σ_{i = 1}^{n} x_{i} y_{i} - Σ_{i = 1}^{n} x_{i} Σ_{i = 1}^{n} y_{i}]}{[n Σ_{i = 1}^{n} x_{i}^{2} - {(Σ_{i = 1}^{n} x_{i})}^{2}]} + \frac{Σ_{i = 1}^{n} y_{i}}{n} - y_{i})}^{2} \\ = \frac{1}{n} Σ_{i = 1}^{n} {((x_{i} - \overset{&OverBar;}{x}) \cdot \frac{[Σ_{i = 1}^{n} x_{i} y_{i} - n \overset{&OverBar;}{xy}}{[Σ_{i = 1}^{n} x_{i}^{2} - n {\overset{&OverBar;}{x}}^{2}]} + \overset{&OverBar;}{y} - y_{i})}^{2} \end{matrix}

\begin{matrix} = \frac{1}{n} Σ_{i = 1}^{n} {((x_{i} - \overset{&OverBar;}{x}) \cdot \frac{Σ_{i = 1}^{n} (y_{i} - \overset{&OverBar;}{y}) (x_{i} - \overset{&OverBar;}{x})}{{| | x_{i} - \overset{&OverBar;}{x} | |}^{2}} + \overset{&OverBar;}{y} - y_{i})}^{2} \\ = \frac{1}{n} {| | y_{i} - \overset{&OverBar;}{y} | |}^{2} Σ_{i = 1}^{n} {(\frac{(x_{i} - \overset{&OverBar;}{x})}{| | x_{i} - \overset{&OverBar;}{x | |}} \cdot \frac{Σ_{i = 1}^{n} (y_{i} - \overset{&OverBar;}{y}) (x_{i} - \overset{&OverBar;}{x})}{| | y_{i} - \overset{&OverBar;}{y} | | | | x_{i} - \overset{&OverBar;}{x} | |} - \frac{y_{i} - \overset{&OverBar;}{y}}{| | y_{i} - \overset{&OverBar;}{y} | |})}^{2} \\ = \frac{1}{n} {| | y_{i} - \overset{&OverBar;}{y} | |}^{2} (1 - {(Σ_{i = 1}^{n} \frac{(y_{i} - \overset{&OverBar;}{y}) (x_{i} - \overset{&OverBar;}{x})}{| | y_{i} - \overset{&OverBar;}{y} | | | | x_{i} - \overset{&OverBar;}{x} | |})}^{2}) \end{matrix} - - - (1)

取

a = {(Σ_{i = 1}^{n} \frac{(y_{i} - \overset{&OverBar;}{y}) (x_{i} - \overset{&OverBar;}{x})}{| | y_{i} - \overset{&OverBar;}{y} | | | | x_{i} - \overset{&OverBar;}{x} | |})}^{2},

a∈(0,1)，

RMS = \frac{1}{n} {| | y_{i} - \overset{&OverBar;}{y} | |}^{2} (1 - a) - - - (2)

其中对于每个需编码子块来说，为常数，因此为了得到最小匹配误差RMS，b＝(1-a)的取值要求越小越好，即a取值应尽量大，经过实验证明，预匹配限制条件为0<a<0.1时，提高编码效率和解码图像质量；

步骤三中误差阈值的确定规则如下：

设定子块的匹配误差阈值γ＝tol×tol×no，其中tol根据不同的子块大小而改变，大的子块tol就越大，小的子块tol就小；取16×16宏块的tol为10.0，8×8子块的tol为8.0，4×4子块的tol为6.0，no为当前子块属于该视频对象区域的像素个数。

4.根据权利要求1所述一种新的多视点视频分形编码压缩方法，其特征在于：步骤四中对宏块采用树状划分，块匹配采用匹配误差准则，通过设定合适的比例因子s和偏移因子o，可以使得仿射变换后的y_i值有来自x_i值的最小平方距离，即当RMS关于s和o的偏微分为0时，得到公式(4)和(5)，可以得到RMS的最小值，其中y_i为子块的像素值，x_i为父块的像素值，子块与父块的匹配误差RMS为

RMS = \frac{1}{N} Σ_{i = 1}^{N} {(s \cdot x_{i} + o - y_{i})}^{2} - - - (3)

s = \frac{[N Σ_{i = 1}^{N} y_{i} x_{i} - Σ_{i = 1}^{N} y_{i} Σ_{i = 1}^{N} x_{i}]}{[N Σ_{i = 1}^{N} x_{i}^{2} - {(Σ_{i = 1}^{N} x_{i})}^{2}]} - - - (4)

o = \frac{1}{N} [Σ_{i = 1}^{N} y_{i} - s Σ_{i = 1}^{N} x_{i}] - - - (5)

如果RMS小于预先设定的阈值γ，记录IFS系数，IFS系数包括匹配块的位移矢量(x,y)和公式(4)、(5)中的s和o，处理下一宏块。

5.根据权利要求1所述一种新的多视点视频分形编码压缩方法，其特征在于：所述步骤八使用的快速视差估计方法为：

6.一种新的多视点视频分形编码压缩方法，其特征在于：输入的视频序列为YUV格式，分别对3个分量Y,U,V每个都采用如权利要求1所述的十三个步骤进行处理；提出新的时间-空间相结合的预测结构：K←L←C→R→S，对视频序列中间视点C，以及和中间视点分别等距的左视点K、L和右视点R、S的五个视点视频，分别进行时间空间联合预测MCP+DCP处理，每个处理彼此独立，K、L视点视频内部或R、S视点视频内部之间没有对应联系；每个视点的起始帧都采用I帧压缩方法，可以在取得一定压缩比的同时，获得较好质量的重建图像，为后面其它帧的压缩构建高质量的参考帧。

7.一种新的多视点视频分形编码解压缩方法，其特征在于解压缩方法包含以下步骤：

步骤Ⅴ：从码流中读入P帧所有宏块的划分信息、每一个小块的迭代函数系统系数和残差帧数据，其中由各迭代函数系统系数分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧；将解码端残差帧与预测帧求和，再采用去方块环路滤波提高解码视频视觉效果：首先对边界的类型进行判断，定义参数块边缘强度，针对不同强度的块边缘，选择的滤波器和所需要滤波的像素点数也不一样，如果为帧内编码且为宏块边界，则采用强滤波；若不是帧内编码且不是宏块边界，仿射块边界采用一级滤波，非仿射块边界不需要滤波；其它情况采用二级滤波；最后按照每一宏块进行解码；转到步骤Ⅸ；

步骤Ⅵ：从码流中读入左视点L或右视点R中P帧的编码信息，确定参考帧的类型，若参考帧为前一帧，则计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和；若参考帧为P帧在C视点中的对应帧，则计算C视点中对应帧的解码图像按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；再由各迭代函数系统系数分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧；解码端残差帧与预测帧之和经过滤波后得到解码后的图像；转到步骤Ⅸ；

步骤Ⅶ：从码流中读入左视点K的编码信息，若采用运动估计方法编码，则计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和；若参考帧为P帧在L视点中的对应帧，则计算L视点中对应帧的解码图像按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；再由各迭代函数系统系数与参考块分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧；解码端残差帧与预测帧之和经过滤波后得到解码后的图像；转到步骤Ⅸ；

步骤Ⅷ：从码流中读入右视点S的编码信息，若采用快速视差估计方法编码，即参考帧为P帧在R视点中的对应帧，则计算R视点中对应帧的解码图像按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和；否则计算P帧的前一帧中按照设定步长划分的所有子块以及经树状划分得到的小块的像素和、像素平方和；再由各迭代函数系统系数与参考块分别计算出解码端的预测块形成解码端的预测帧，残差帧数据经过反量化和反变换得到解码端残差帧；解码端残差帧与预测帧之和经过滤波后得到解码后的图像；转到步骤Ⅸ；

8.根据权利要求7所述一种新的多视点视频分形编码解压缩方法，其特征在于：对于每一个宏块进行解压缩时，首先判断该宏块在编码时的划分方式，若非C视点视频，则先确定父块域是在前一帧或是参考视点当前帧对应帧中；对于每一个子块，首先在父块域找到与该子块相对应的区域，然后利用下面的公式获得该子块的像素值，

r_i＝s·d_i+o (6)

9.根据权利要求7所述一种新的多视点视频分形编码解压缩方法，其特征在于：对五个视点视频解码是同时的，先解码各个视点的起始帧与C视点视频的第二帧，将L视点起始帧或C视点视频的第二帧作为L视点第二帧解码的参考帧，将R视点起始帧或C视点视频的第二帧作为R视点第二帧解码的参考帧，将K视点起始帧或L视点视频的第二帧作为K视点第二帧解码的参考帧，将S视点起始帧或R视点视频的第二帧作为S视点第二帧解码的参考帧，依此类推解码五个视点视频的所有帧。

10.根据权利要求7所述一种新的多视点视频分形编码解压缩方法，其特征在于：所述步骤Ⅴ中的块边缘强度用BS表示；其中，P₀',Q₀',P₁',Q₁'表示滤波后的像素值，P₀,P₁,Q₀,Q₁表示原始的像素值，不同的BS和对应的滤波器如下：

P₀'＝(P₁+P₀+Q₀)/3

Q₀'＝(P₀+Q₀+Q₁)/3 (7)

P₁'＝(2·P₁+P₀')/3

Q₁'＝(2·Q₁+Q₀')/3

P₀'＝(P₁+2·P₀+Q₀)/4 (8)

Q₀'＝(P₀+2·Q₀+Q₁)/4

P₀'＝(P₁+3·P₀+Q₀)/5 (9)

Q₀'＝(P₀+3·Q₀+Q₁)/5