CN100512443C - 基于自适应哈什和格型矢量量化的分布式视频编码方法 - Google Patents
基于自适应哈什和格型矢量量化的分布式视频编码方法 Download PDFInfo
- Publication number
- CN100512443C CN100512443C CN 200710062615 CN200710062615A CN100512443C CN 100512443 C CN100512443 C CN 100512443C CN 200710062615 CN200710062615 CN 200710062615 CN 200710062615 A CN200710062615 A CN 200710062615A CN 100512443 C CN100512443 C CN 100512443C
- Authority
- CN
- China
- Prior art keywords
- frame
- side information
- decoding
- piece
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明是一种基于自适应“哈什”和格型矢量量化的分布式视频编码方法。一是在编码端产生“哈什”比特流,利用“哈什”在解码端产生运动补偿的边信息帧;二是对Wyner-Ziv帧进行Wyner-Ziv帧内编码,以产生Wyner-Ziv比特流,并利用产生的边信息帧对Wyner-Ziv比特流进行解码。这两个过程中都利用了带有反馈的LDPCA(累积低密度奇偶校验码)编码器,但在第一环节中利用反馈来生成码率自适应的“哈什”,压缩“哈什”比特流,第二环节中利用反馈来适应主、边信息的相关性变化,以压缩格型矢量量化的比特流。
Description
技术领域
本发明属于视频编解码技术领域,具体地说是基于自适应“哈什”和格型矢量量化的分布式视频编码方法。
技术背景
分布式视频编码(DVC)是近几年内刚刚发展起来的一种思路新颖的视频编码框架,与其它成熟的压缩技术相比(如MPEG系列,H.26*系列等),具有“编码简单”、一定程度的鲁棒性等优点,适用于正在新兴的要求“友好上传”的多媒体通信(如移动照相,大规模传感器网络、网络视频监控等)。它利用了70年代信息论中的Slepian-Wolf和Wyner-Ziv边信息信源编码理论,试图实现一种相关信源“独立编码联合解码”的分布式信源编码框架,将运算量庞大的运动搜索从编码端部分或全部移动到解码端,从而实现“简单编码”,这与以往MPEG“联合编码联合解码”框架中的“复杂编码”有着本质区别;在解码时,利用与主信息相关的解码端边信息,恢复编码图像。尽管Wyner-Ziv在70年代提出分布式信源编码的思想,但仅在近几年随着高性能的信道码,如Turbo码,LDPC码的出现,才出现了一些实用的分布式视频编码框架,自此引发了人们对这一研究领域的兴趣和广泛的关注。
在分布式视频编码中,关键帧采用传统的帧内编码方式,而其余帧采用Wyner-Ziv编码模式,即一种“帧内编码,帧间解码”的编码模式。Wyner-Ziv编码由量化器和基于信道码的无失真Slepian-Wolf编码器组成。在Wyner-Ziv编码端,量化后的主序列用信道码编码生成系统位和校验位,抛弃系统位而只传送校验位;在解码端,用收到的校验位和边信息来恢复主序列,由于主序列和边序列的相关性,利用部分的或者全部的校验位就可以无失真地恢复主序列,又因为发送的校验位的比特数少于主序列位比特,从而取得压缩。这一过程类似于下列过程,对主序列经系统的信道码编码并传送,其中的信息位经过一个二进制对称信道传送,而校验位没有受到信道噪声干扰,在解码端由信道解码恢复主序列;其中的二进制对称信道的噪声是由主序列和边信息的相关性造成的,所以主序列与边序列越相关,即信道的噪声越小,则无失真恢复主序列需要的信道码的校验位就越少,得到的压缩就越大,所以Wyner-Ziv中要求与主信息尽可能相似的边信息,如何得到尽可能相似的边信息是分布式编码中一项关键技术,而边信息本质上是对主信息的一种预测估计信息,但这种预测估计在解码端进行。
迄今为止,涌现了一些较为实用的DVC编码方法,较早的有PRISM方案,Anne和Griod的DVC框架,Qian,Xu和Zixiang,Xiong的分级视频编码框架,AnshulSehgal提出的基于Wyner-Ziv的、与状态无关的视频预测技术,等等,以及一些改进算法,如小波域的PRISM,欧洲DISCOVER基于Griod框架所提出的IST-DVC算法,我们在Griod框架上提出像素域和小波域的格型矢量量化的DVC框架,等等。目前DVC研究大都致力于将计算量膨大的运动搜索从编码端转移到解码端从而实现简单编码,但距离理想性能较远,就其主要原因,是解码端的运动补偿不能很好地发挥功效,使得运动补偿产生的边信息不是很相关,另外对变换系数所采用的简单的标量量化技术在一定程度上也影响其性能,下面是DVC中常用的边信息的产生方法和量化技术:
(1)边信息的产生方法
◆在解码端利用恢复的相邻帧运动补偿内插生成边信息,如Anne和DISCOVER的方案。方法如图1中所示,在解码端用恢复的前一帧和后一帧来内插生成一个内插帧,生成的内插帧作为当前编码帧的边信息帧。一般地,在解码端得到的当前帧的信息越多,则内插或外插出来的帧和当前帧越相似。
◆利用部分经Wyner-Ziv解码的当前帧来更新边信息,如Discover在编码端抽取像素的位平面,逐个位平面用Wyner-Ziv方式编解码,并利用首先解码的位平面来更新边信息用于后面编码的位平面,而我们以前的方案中用首先解码的低频系数来更新边信息用于后面的频带解码,但这种方案中由于不同位平面或频带之间的相关性不是很大,利用前面位平面更新边信息对后面位平面码率的节省仍然很有限,在高码率时性能并不明显;
◆从编码端发送“哈什”的方法。“哈什”是指当前编码帧的一些表示信息,发送到解码端以帮助解码端的运动补偿以生成更好的边信息。在DVC中,为减少编码端的计算量,将运算量庞大的运动搜索转移到解码端,但解码端不知道当前编码帧的信息,因此有必要发送少量的编码块信息到解码端以帮助运动补偿,这就是“哈什”的作用,如PRISM中的循环冗余检测(CRC)位,他用量化后的DCT系数码流的CRC位发送到解码端,在解码端的参考块中,寻找和CRC位一致的块作为运动补偿的块,另外如Griod方案中的对当前编码块“欠采样粗量化”形成的比特、量化的高频离散余弦转换(DCT)系数比特位等,这些信息都作为编码块的一种表示信息发送到解码端以寻找最佳匹配块的。因为“哈什”包含了大量的当前编码块的信息,所以被传送到解码端可以产生好的运动补偿效果。
基于“哈什”的DVC解码端运动搜索过程是,利用“哈什”在解码端寻找和“哈什”最接近的二进制边序列,将此边序列对应的边块作为运动补偿块。一般地说,由像素域产生的“哈什”是一种更加普遍的方法,它所产生的运动补偿后的边信息可运用于其它任何转换域,而由转换域的“哈什”产生的运动补偿的效果都可以恢复到像素域来评价。
对“哈什”的要求有两方面,一是它能携带尽可能多的当前编码块的信息,一是相对于Wyner-Ziv码流,“哈什”的比特率要尽量低,这里涉及到两个问题:一是如何提高“哈什”对原编码块的表示能力,二是如何对“哈什”进行压缩以取得最低码率,方法一用像素域的“欠采样粗量化”信息表示编码块,对“欠采样粗量化”的“哈什”没有进行压缩直接发送;方法二用DCT高频系数表示编码块信息,对量化的DCT高频系数分别用熵编码和游程编码,但这些对“哈什”的处理都采用类似帧内编码的方法,以接近“哈什”自身熵的方式压缩,而且“哈什”的码率是固定的。
(2)DVC中的量化技术
量化也是DVC中一项重要的技术,对量化器的要求是,既要有好的压缩性能,又要便于利用边信息进行量化重构,
◆标量量化:标量量化是对每个输入值逐个进行量化的简单量化方法,目前的DVC框架几乎都采用简单的均匀标量量化,具体方法是编码端对量化的序列进行Slepian-Wolf编码,在解码端利用边信息对量化序列进行量化恢复(即在由恢复的主量化序列表示的区间中,寻找与边信息最接近的值作为量化重构值);
◆格型矢量量化(LVQ):矢量量化利用输入值之间的相关性,对一组输入信号联合量化,一般地,矢量量化能得到比标量量化更好的压缩性能。格型矢量量化的优点是形状规则,可以在线计算而不用存储码书。对DSC而言,格型矢量量化是最优的量化方法;Sergio.D.Servett和Zhixin Liu提出的基于边信息的格型矢量量化思想,具体方法如图2所示,对输入矢量x,用一对相同维数的格型矢量量化产生格点Q(x)(细量化)和子格点Q(x)(粗量化),在编码端发送两量化器的差值,在解码端寻找与边信息最接近的差值矢量,从而无失真地恢复Q(x)。但这种简单方案在实际的视频信号处理中存在以下明显的限制:一是要无失真恢复Q(x)则要求x和y在一个子格点的范围内(如图中阴影区域)。对实际的视频信号,为达到这一要求,在差值矢量数N一定时,可以调整qstep(见图3,类似于标量量化的量化步长)来调整量化格点的精细;另一方面,Q(x)只是x的量化估计值,太大的qstep又会使得格型量化Q(x)的恢复误差增大;我们在以前的方案中提出运用边信息来对Q(x)进行重构来进一步提高性能,并给出小波域的基于LVQ的量化方案,但对DCT域的基于LVQ的量化方法未做过研究,而且,DCT是仅次于KLT变换的最好的去相关方法,寻找与DCT结合的LVQ方案是更有意义的。
研究表明,边信息和主信息的相关性的强弱,在很大程度上决定了Wyner-Ziv编解码器的码率和恢复图象的质量;实验结果表明基于“哈什”的DVC能取得最好的编码性能。然而,目前对“哈什”信息的性能并没有作深入研究,而且“哈什”信息的码率都是固定的,没有自适应码率的“哈什”提出。一般来讲,能更好的传递当前编码帧信息、又能随着主信息和边信息的不同的相关性而自适应调整自身码率的“哈什”应该是最好的。另外,对DCT域的DVC中使用的格型量化方案仍需要进一步完善。
发明内容
为了克服现有技术中的不足,本发明的目的在于提供基于自适应“哈什”和格型矢量量化的分布式视频编码方法,增强边信息和主信息的相关性,以提高恢复图象的质量。
为完成上述发明目的,本发明提供基于自适应“哈什”和格型矢量量化的分布式视频编码方法,该方法包括以下步骤:
1)设定每个GOP(图像组)中的帧数,发送“哈什”的Hamming(汉明)距离域值θ,存储优化的格型矢量量化组合量化表;
2)对每个GOP的关键帧,用传统的帧内编码方案编解码,发送其帧内编码的比特流,并把解码的关键帧作为下一Wyner-Ziv帧(关键帧之外的帧)的初始边信息帧;
3)对关键帧进行“欠采样”及“粗量化”,并且按块存储其粗量化比特;
4)将Wyner-Ziv分为16×16的块,对当前的16×16块进行1/2“欠采样”,每像素3比特“粗量化”得到序列q,并求q与上一帧相同位置块的粗量化序列的Hamming距离Dist;
5)如果Dist>θ,则发送块标志flag=1到解码端,跳到步骤12,否则,继续进行;
6)发送块标志flag=0,并令q2=q,对q2进行LDPCA编码;
7)存储q2的LDPCA(累积低密度奇偶校验码)的所有校验位在“缓存”;
8)解码端将“初始边信息帧”内所有搜索像素块进行与编码端相同的“欠采样粗量化”,得到边序列集合q′2s;
9)发送q2的部分校验位;
10)解码端根据收到的校验位在q′2s集合中搜索,寻找能使LDPCA正确解码q2的边序列q′2,如果这样的边序列存在,继续进行下列的步骤11,否则返回步骤9,增加一部分校验位,直至找到能利用最少的校验位解码q2的边序列q′2;
11)由q′2对应的块作为最佳匹配块,并用解码的q2对匹配块内的相对应象素点进行量化重构,得到当前编码块的补偿块;
12)如果当前块不是当前Wyner-Ziv帧的最后一块,返回步骤4,继续下一块的判断与处理,否则继续步骤13;
13)解码端根据flag组织生成最终的边信息帧:flag=0,利用补偿块替换初始边信息帧的同位置块,flag=1,初始边信息帧的块不变,即用初始边信息块作最终的边信息块;
14)保存当前Wyner-Ziv帧的“欠采样粗量化”序列;
15)编码端对当前Wyner-Ziv帧做4×4块的DCT(离散余弦变换)变换,按照“Z”扫描顺序将每块生成的16个系数组成16个主系数带;对边信息帧做4×4块的DCT变换,按照“Z”扫描,顺序将每块生成的16个系数组成16个边系数带;在主系数带内,顺序选择两个系数组成2维矢量进行基于边信息的LVQ(格型矢量量化)编码,形成差值主序列q1;在边系数带内,顺序选择两个系数组成2维矢量进行上述基于边信息的LVQ编码,形成差值边序列q1′;
16)对q1进行LDPCA编码,将生成的全部校验位存储在“缓存”中;
17)发送q1的部分校验位到解码端;
18)解码端用收到的校验位和q1′进行LDPCA解码,如果q1解码不成功,返回步骤17,增加校验位的发送,直到解码成功,恢复差值主系数带q1;
19)用恢复的主序列q1和边信息帧的DCT系数进行基于边信息的LVQ解码和重构得到恢复的DCT系数,然后进行逆Z扫描,逆DCT变换,得到当前Wyner-Ziv帧的恢复帧;
20)如果当前的Wyner-Ziv不是当前GOP的最后一帧,用当前恢复的Wyner-Ziv帧更新初始边信息帧,返回步骤4,否则进行下列的步骤21;
21)如果当前的GOP不是最后GOP,返回步骤2,否则结束。
本发明具有明显的优点和积极效果。本发明的基于自适应“哈什”和格型矢量量化的分布式视频编码方法——无论是在压缩性能的客观量度上,还是恢复图像质量的主观评价上,都有了相当程度的提高。1、采用“欠采样粗量化”方式,位率自适应“哈什”能根据相关性调整码率,从而得到更少的“哈什”比特码流,更高压缩性能的量化器减少了“Wyner-Ziv”码流,带来了更高的压缩比(低比特率);2、采用LVQ的快速算法,使我们的系统没有比SQ增加太多编码端计算量,保持了“简单编码”,而且采用的“欠采样粗量化”方式使得编码端仅存储很少的量化比特,存储量很小;3、采用的基于纠错码的解码方式,使得方案具有一定程度的鲁棒性。
附图说明
图1为一般的运动补偿的内插边信息帧生成示意图;
图2为本发明基于边信息的LVQ编解码方案;
图3为根据本发明的Q(x)的LVQ量化重构方案;
图4为根据本发明的基于自适应“哈什”和格型量化的分布式视频编解码系统原理框架图;
图5为根据本发明的对16×16像素块的“欠采样粗量化”方案;
图6为根据本发明的不同欠采样粗量化方式所产生的运动补偿效果图;
图7为根据本发明的4×4块DCT系数所采用的LVQ量化组合表;
图8为根据本发明的系统率失真性能比较;
图9为根据本发明的原始的和恢复的图像对比;
图10为根据本发明的基于自适应“哈什”和格型量化的分布式视频编解码方法流程图。
具体实施方式
下面结合说明书附图来说明本发明的具体实施方式。
图4为根据本发明的基于自适应“哈什”和格型量化的分布式视频编解码系统原理框架图,参考图4,本发明的基于自适应“哈什”和格型矢量量化的分布式视频编解码系统包括:欠采样粗量化模块、基于LDPCA的可变码率“哈什”生成模块、基于可变码率“哈什”的解码端运动搜索与补偿模块、基于边信息的LVQ编码和解码模块、基于边信息的LVQ重构模块、对DCT系数的LVQ量化组合模块、qstep选择模块。
欠采样粗量化模块,对当前编码块进行“欠采样粗量化”,得到q,并和存储的前一帧相同位置块的“欠采样粗量化”信息比较,求其Hamming距离,如果Hamming距离大于域值,则将q将作为生成“哈什”信息的主序列q2进行LDPCA编码。不同于Anne所用8×8像素块的1/4采样、5位量化、每块80比特的“哈什”,通过大量试验我们发现用16×16像素块1/2采样3位量化,每块384比特的方法在性能上大为提高,原因是小的采样间隔对编码块有更大的覆盖范围,将携带更多的运动和细节信息,因而表示能力更强,但对欠采样后的量化信息,为节约比特,我们采用更粗的每采样点3位量化,另外我们也试验了8×8块DCT系数的后54个高频系数“哈什”的运动补偿性能,但发现在较高的运动场合,其性能并不如我们的“欠采样粗量化”方式,原因是“欠采样粗量化”的像素值能比量化的DCT的高频系数包含更多的细节信息。
基于LDPCA的可变码率“哈什”生成模块和基于可变码率“哈什”的解码端运动搜索与补偿模块,用一种基于LDPCA的方法对“欠采样粗量化”信息进行压缩。理论根据类似于基于LDPCA的Slepian-Wolf压缩原理(即对相关的二进制信源,在解码端只利用主信息LDPCA码的部分校验位和边信息可以无失真恢复出主信息),这是一种类似于帧间编码的方法,从理论上讲,我们的方法可以接近“哈什”的条件熵,因而可以得到更小的“哈什”码率,而且我们利用一种位率兼容的LDPCA[19]码,利用主、边信息的相关性由反馈信道来自适应地调整“哈什”位率。具体做法如下:
(1)对“欠采样粗量化”后的主二进制序列q2用LDPCA编码,存储其校验位;
(2)发送部分校验位;
(3)解码端将参考帧内所有搜索像素块进行与编码端相同的“欠采样粗量化”,得到边序列集合,q′2s。
(4)解码端根据收到的校验位在q’2s集合中搜索能使LDPCA正确解码q2的边序列q’2,由此边序列对应的块找到运动矢量。
(5)如果在步骤(4)中不能正确解码,要求发送更多的校验位,返回步骤(2),直至找到能利用最少的校验位解码q2的边序列q’2,从而得到相应的边信息块。
(6)用找到的边信息块对主二进制序列进行量化恢复作为最终的运动补偿块。
上述过程中,根据主序列q2和各个边序列的相关性,采用反馈来自适应地决定是否发送更多的LDPCA的校验位,并对每块发送了最小码率的“哈什”,因而能使得“哈什”码率最小,而且自适应。
基于边信息的LVQ编码和解码模块,将由“哈什”运动补偿产生的边信息用作LVQ解码和对DCT系数的Wyner-Ziv解码的边信息。我们的方案中采用六边形的A2格,实现基于边信息的LVQ的方法如下(见图2),我们在此提出对DCT系数的LVQ,并找到了DCT系数的优化的LVQ的量化组合,并对DCT系数量化重构时的qstep进行研究:
(1)编码端,对2维的DCT系数矢量x,由快速算法计算得到Q(x)和Q1(x)以及差值T(x),T(x)=Q(x)-Q1(x).发送T(x)到解码端。
(2)解码端,计算边矢量y的格点Q(y)并以Q(y)为子格点,找到Q(y)周围的所有格点,即{Q(y1),Q(y2),…,Q(yN-1)},如图2所示,其中N是子格点内包含的格点的个数。
(3)计算Si=T(x)+Q(yi)(i=1,..N),其中,Q(yN)=Q(y).
(4)在Si(i=1,..N)中寻找一个子格点,很明显,只有Q1(x)是一个子格点,因此我们得到Q1(x)。
(5)计算得Q(x),即,Q(x)=T(x)+Q1(x)。.
很明显,T(x)代表了一类格点,因此,如果只发送T(x)到解码端,我们可以取得压缩,压缩率由N决定。N是指子格点内所包含的小格点数。
基于边信息的LVQ重构模块,在Q(x)的Voronoi胞腔中,搜索与边信息最接近的矢量作为最后的量化重建值。为避免在整个胞腔中搜索带来的大的计算量将Q(x)表示的区域划分成四个子小区域R1,R2,R3,,R4(见图3),判断点各区域的中心点P1,P2,P3,P4,那个最接近y,于是找到Q(x)中最接近y的小区域,然后在这个小区域中寻找和y最接近的矢量为最后的重构矢量。因为主信息和边信息的相关性,这种基于边信息的LVQ量化重构使得系统性能得到很大提高,这里使用没有量化的边信息。
对DCT系数的LVQ量化组合模块,要得到好的量化效果,对DCT系数的不同频带要进行不同位数的量化,就像MPEG中的量化表一样,对4×4的DCT系数块,我们所提出的三个优化组合表如图6所示,其中的数字指平均每一系数采用的LVQ的量化位数,例如,第一个表左上角的数字3对应每块的DC系数进行3位量化,而所采用的2维的LVQ的码率是6,对应我们采用N=61的子格点。第二个表中,4对应N=217子格,3.5对应127子格,3对应6l的子格,第三个表中2.5对应31子格,2对应13子格,1.5对应7的子格,等等。各表格的0表示此位置系数不进行LVQ量化,而在解码端用其边信息块的对应的DCT系数代替。
qstep的选择模块,在DCT系数的LVQ量化中,参数qstep虽然不决定LVQ的码率,但会影响后面LDPCA的压缩码率,因此要适当选取,对不同码率的LVQ也要有不同qstep,一般地,高码率N的LVQ有较小的qstep,低码率LVQ要用较大的qstep,以保证主信息x和边信息y能处在相同的子格点范围内。对DCT系数,我们通过试验选择的不同码率LVQ的qstep如下:
◆子格数为7:qstep选70;
◆子格数为13:qstep选66
◆子格数为31:qstep选64;
◆子格数为61:qstep选62;
◆子格数为127:qstep选56;
◆子格数为217:qstep选30。
图5为根据本发明的对16×16像素块的欠采样粗量化方案,参考图5,用16×16像素块1/2采样3位量化,每块384比特的方法(见图5)在性能上大为提高,原因是小的采样间隔对编码块有更大的覆盖范围,将携带更多的运动和细节信息,因而表示能力更强。
图6为根据本发明的不同欠采样粗量化方式所产生的运动补偿效果图,试验基于30Hz的QCIF的序列,假设初始解码帧是完全重构的上一帧图像。其中salesman序列平均每帧的“哈什”大约是2k比特,foreman是13k比特,grandma是2.2k比特。试验表明“欠采样粗量化”方式能取得最好的运动补偿效果。
图7为根据本发明的4×4块DCT系数所采用的LVQ量化组合表,参考图7,“0”表示用编码端不发送信息,用边信息对应位置的系数作为恢复值,其余数字表示对应位置的系数所用的量化比特数。
图8为根据本发明的系统率失真性能比较,参考图8,(GOP=8)salesman(左),grandma(右),最粗线:本发明DVC系统的性能;最上线:H.263+帧间编码的性能,但不能实现“简单编码”;最下线:SPIHT帧内编码性能;其余一条为用标量量化器的性能。
图9为根据本发明的原始的和恢复的图像对比,参考图9,(a)原始的,(b)由平均4k比特的“哈什”运动补偿产生的恢复图像,(c)用Anne的“欠采样粗量化”产生的4k比特“哈什”运动补偿产生的恢复帧,(d)用我们的Wyner-Ziv方案在8k比特的恢复帧,(e)用SPIHT在10k比特的恢复帧,显而易见,在相同的码率下,我们的方案比Anne的方案在边信息质量上提高2-3分贝,而且最终的恢复图像较传统的帧内编码方式提高6-7分贝,而且解码图像清晰。同时,本系统保持了“编码简单”的特点。
图10为根据本发明的基于自适应“哈什”和格型量化的分布式视频编码方法流程图,下文将参考图10对本发明的基于自适应“哈什”和格型矢量量化的分布式视频编码方法进行详细描述。
步骤1:设定每个GOP中的帧数,发送“哈什”的Hamming距离域值θ,LVQ组合量化表;
步骤2:对每个GOP的关键帧,用传统的帧内编码方案编解码,发送其帧内编码的比特流,并把解码的关键帧作为下一Wyner-Ziv帧的初始边信息帧;
步骤3:对关键帧每个16×16块,进行1/2“欠采样”,每像素3比特“粗量化”,并且按块存储其粗量化比特;
步骤4:将Wyner-Ziv帧分为16×16的块,对当前的16×16块进行1/2“欠采样”,每像素3比特“粗量化”得到序列q,并求q与上一帧相同位置块的粗量化序列的Hamming距离Dist;
步骤5:如果Dist>θ,则发送块标志flag=1到解码端,跳到步骤12,否则,继续进行;
步骤6:发送块标志flag=0,并令q2=q,对q2进行LDPCA编码;
步骤7:存储q2的LDPCA的所有校验位在“缓存”;
步骤8:解码端将“初始边信息帧”内所有搜索像素块进行与编码端相同的“欠采样粗量化”,得到边序列集合,q′2s;
步骤9:发送q2的部分校验位;
步骤10:解码端根据收到的校验位在q′2s集合中搜索,寻找能使LDPCA正确解码q2的边序列q′2,如果这样的边序列存在,继续进行下列的步骤11,否则返回步骤9,增加一部分校验位,直至找到能利用最少的校验位解码q2的边序列q′2;
步骤11:由q′2对应的块作为最佳匹配块,并用解码的q2对匹配块内的相对应象素点进行量化重构(即在q2表示的区域内寻找与边信息像素最接近的值为量化重构值),得到当前编码块的补偿块;
步骤12:如果当前块不是当前Wyner-Ziv帧的最后一块,返回步骤4,继续下一块的判断与处理。否则继续步骤13;
步骤13:解码端根据flag组织生成最终的边信息帧:flag=0,利用补偿块替换初始边信息帧的同位置块,flag=1,初始边信息帧的块不变,即用初始边信息块作最终的边信息块;
步骤14:保存当前Wyner-Ziv帧的“欠采样粗量化”序列;
步骤15:编码端对当前Wyner-Ziv帧做4*4块的DCT变换按照“Z”扫描,顺序将每块生成的16个系数组成16个主系数带;对边信息帧做4*4块的DCT变换,按照“Z”扫描,顺序将每块生成的16个系数组成16个边系数带;在主系数带内,顺序选择两个系数组成2维矢量进行上述的基于边信息的LVQ编码,形成差值主序列q1;在边系数带内,顺序选择两个系数组成2维矢量进行上述基于边信息LVQ编码,形成差值边序列q1′;
步骤16:对q1进行LDPCA编码,将生成的全部校验位存储在“缓存”中;
步骤17:发送q1的部分校验位到解码端;
步骤18:解码端用收到的校验位和q1′进行LDPCA解码,如果q1解码不成功,返回步骤17,增加校验位的发送,直到解码成功,恢复差值主系数带q1;
步骤19:用恢复的主序列q1和边信息帧的DCT系数进行上述的LVQ解码和重构得到恢复的DCT系数,然后进行逆Z扫描,逆DCT变换,得到当前Wyner-Ziv帧的恢复帧;
步骤20:如果当前的Wyner-Ziv不是当前GOP的最后一帧,用当前恢复的Wyner-Ziv帧更新初始边信息帧,返回步骤4,否则进行下列的步骤21;
步骤21:如果当前的GOP不是最后GOP,返回步骤2,否则结束。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (5)
1.基于自适应“哈什”和格型矢量量化的分布式视频编码方法,其特征在于:该方法包括以下步骤:
1)设定每个图像组GOP中的帧数,发送“哈什”的Hamming距离域值θ,存储优化的格型矢量量化组合量化表;
2)对每个GOP的关键帧,用传统的帧内编码方案编解码,发送其帧内编码的比特流,并把解码的关键帧作为下一Wyner-Ziv帧的初始边信息帧;
3)对关键帧进行“欠采样”及“粗量化”,并且按块存储其粗量化比特;
4)将Wyner-Ziv帧分为16×16的块,对当前的16×16块进行1/2“欠采样”,每像素3比特“粗量化”得到序列q,并求q与上一帧相同位置块的粗量化序列的Hamming距离Dist;
5)如果Dist>θ,则发送块标志flag=1到解码端,跳到步骤12,否则,继续进行;
6)发送块标志flag=0,并令q2=q,对q2进行LDPCA累积低密度奇偶校验码编码;
7)在“缓存”中存储q2的LDPCA的所有校验位;
8)解码端将“初始边信息帧”内所有搜索像素块进行与编码端相同的“欠采样粗量化”,得到边序列集合q′2s;
9)发送q2的部分校验位;
10)解码端根据收到的校验位在q′2s集合中搜索,寻找能使LDPCA正确解码q2的边序列q′2,如果这样的边序列存在,继续进行下列的步骤11,否则返回步骤9,增加一部分校验位,直至找到能利用最少的校验位解码q2的边序列q′2;
11)由q′2对应的块作为最佳匹配块,并用解码的q2对匹配块内的相对应像素点进行量化重构,得到当前编码块的补偿块;
12)如果当前块不是当前Wyner-Ziv帧的最后一块,返回步骤4,继续下一块的判断与处理,否则继续步骤13;
13)解码端根据flag组织生成最终的边信息帧:flag=0,利用补偿块替换初始边信息帧的同位置块,flag=1,初始边信息帧的块不变,即用初始边信息块作最终的边信息块;
14)保存当前Wyner-Ziv帧的“欠采样粗量化”序列;
15)编码端对当前Wyner-Ziv帧做4×4块的DCT变换,按照“Z”扫描顺序将每块生成的16个系数组成16个主系数带;对边信息帧做4×4块的DCT变换,按照“Z”扫描顺序将每块生成的16个系数组成16个边系数带;在主系数带内,顺序选择两个系数组成2维矢量进行基于边信息的LVQ格型矢量量化编码,形成差值主序列q1;在边系数带内,顺序选择两个系数组成2维矢量进行上述基于边信息的LVQ编码,形成差值边序列q1′;
16)对q1进行LDPCA编码,将生成的全部校验位存储在“缓存”中;
17)发送q1的部分校验位到解码端;
18)解码端用收到的校验位和q1′进行LDPCA解码,如果q1解码不成功,返回步骤17,增加校验位的发送,直到解码成功,恢复差值主序列q1;
19)用恢复的主序列q1和边信息帧的DCT系数进行基于边信息的LVQ解码和重构得到恢复的DCT系数,然后进行逆Z扫描,逆DCT变换,得到当前Wyner-Ziv帧的恢复帧;
20)如果当前的Wyner-Ziv帧不是当前GOP的最后一帧,用当前恢复的Wyner-Ziv帧更新初始边信息帧,返回步骤4,否则进行下列的步骤21;
21)如果当前的GOP不是最后GOP,返回步骤2,否则结束。
2.根据权利要求1所述的一种基于自适应“哈什”和格型量化的视频编解码方法,其特征在于:所述步骤3或4或8中的“欠采样”是对编码的每个16×16块,进行1/2“欠采样”的方式。
3.根据权利要求1所述的基于自适应“哈什”和格型矢量量化的分布式视频编码方法,其特征在于:所述步骤3或4或8中的“粗量化”是对16×16编码块“欠采样”像素中每像素3比特“粗量化”,每块384比特。
4.根据权利要求1所述的基于自适应“哈什”和格型矢量量化的分布式视频编码方法,其特征在于:所述步骤11中,补偿块的选取根据是:所选边块的“欠采样粗量化”序列应使得LDPCA采用最少码率的“哈什”,并且补偿块的量化重构为在“欠采样粗量化”序列表示的区域内寻找与边信息像素最接近的值为量化重构值。
5.根据权利要求1所述的基于自适应“哈什”和格型矢量量化的分布式视频编码方法,其特征在于:步骤19中对格型矢量量化后DCT系数的重构为在格型的六边形范围内寻找与边信息最接近的矢量值作为格型矢量量化重构值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710062615 CN100512443C (zh) | 2007-01-11 | 2007-01-11 | 基于自适应哈什和格型矢量量化的分布式视频编码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200710062615 CN100512443C (zh) | 2007-01-11 | 2007-01-11 | 基于自适应哈什和格型矢量量化的分布式视频编码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101005621A CN101005621A (zh) | 2007-07-25 |
CN100512443C true CN100512443C (zh) | 2009-07-08 |
Family
ID=38704439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200710062615 Expired - Fee Related CN100512443C (zh) | 2007-01-11 | 2007-01-11 | 基于自适应哈什和格型矢量量化的分布式视频编码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100512443C (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101860748B (zh) * | 2010-04-02 | 2012-02-08 | 西安电子科技大学 | 基于分布式视频编码的边信息生成系统及方法 |
CN101854548B (zh) * | 2010-05-25 | 2011-09-07 | 南京邮电大学 | 一种面向无线多媒体传感器网络的视频压缩方法 |
CN102026000B (zh) * | 2011-01-06 | 2012-07-04 | 西安电子科技大学 | 像素域-变换域联合的分布式视频编码系统 |
CN102088612B (zh) * | 2011-03-11 | 2012-07-25 | 西安电子科技大学 | 具有鲁棒性的无反馈Wyner-Ziv视频解码器 |
CN102333218A (zh) * | 2011-09-23 | 2012-01-25 | 清华大学深圳研究生院 | 基于odwt子带分类的dvc解码端边信息帧生成方法 |
CN102595132A (zh) * | 2012-02-17 | 2012-07-18 | 南京邮电大学 | 一种应用于无线传感器网络的分布式视频编解码方法 |
CA2841112C (en) | 2012-05-25 | 2019-09-17 | Panasonic Corporation | Moving picture coding and decoding using context adaptive binary arithmetic coding with fixed probability for some sample adaptive offset parameters |
WO2013183232A1 (ja) * | 2012-06-04 | 2013-12-12 | パナソニック株式会社 | 動画像符号化方法、動画像符号化装置、動画像復号方法、および、動画像復号装置 |
CN103888226B (zh) * | 2014-04-17 | 2017-06-16 | 哈尔滨工业大学 | 非对称结构分布式信源编码系统中ldpca码设计方法 |
CN105513048A (zh) * | 2015-11-24 | 2016-04-20 | 西安电子科技大学昆山创新研究院 | 基于子带信息熵度量的图像质量评价方法 |
CN105872536B (zh) * | 2016-04-25 | 2018-05-18 | 电子科技大学 | 一种基于双编码模式的图像压缩方法 |
CN111052614B (zh) * | 2017-09-01 | 2024-03-08 | 上海诺基亚贝尔股份有限公司 | 消息处理和对应装置 |
-
2007
- 2007-01-11 CN CN 200710062615 patent/CN100512443C/zh not_active Expired - Fee Related
Non-Patent Citations (4)
Title |
---|
Systematic lossy error protection based onH.264/AVC redundant slices and flexible macroblock ordering. BACCICHET Pierpaolo et al.Journal of Zhejiang University SCIENCE A,Vol.7 No.5. 2006 |
Systematic lossy error protection based onH.264/AVC redundant slices and flexible macroblock ordering. BACCICHET Pierpaolo et al.Journal of Zhejiang University SCIENCE A,Vol.7 No.5. 2006 * |
分布式视频编解码技术的研究进展. 房胜等.计算机工程与应用,第21期. 2005 |
分布式视频编解码技术的研究进展. 房胜等.计算机工程与应用,第21期. 2005 * |
Also Published As
Publication number | Publication date |
---|---|
CN101005621A (zh) | 2007-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100512443C (zh) | 基于自适应哈什和格型矢量量化的分布式视频编码方法 | |
Do et al. | Distributed compressed video sensing | |
CN101272494B (zh) | 利用合成参考帧的视频编解码方法及装置 | |
CN101835044B (zh) | 一种频率域分布式视频编码中的分类组合方法 | |
KR20130070574A (ko) | 메모리 요건을 완화한 영상 전송 시스템 | |
CN104301730A (zh) | 基于视频移动设备的双向视频编解码系统及其方法 | |
CN103596010B (zh) | 基于字典学习的压缩感知视频编解码系统 | |
CN102572428B (zh) | 面向多媒体传感网分布式编解码的边信息估计方法 | |
CN103002283A (zh) | 多视角分布式视频压缩的边信息生成方法 | |
CN103155560A (zh) | 对差分运动矢量编码/解码的设备和方法以及利用该设备和方法对视频编码/解码的设备和方法 | |
Zhou et al. | Distributed video coding using interval overlapped arithmetic coding | |
Huang et al. | Improved side information generation for distributed video coding | |
CN100493194C (zh) | 用于视频感兴趣区域编解码的泄漏运动补偿方法 | |
CN104581173A (zh) | 软解码验证模型平台 | |
US20140269896A1 (en) | Multi-Frame Compression | |
Kodavalla et al. | Distributed video coding: codec architecture and implementation | |
JP2005252609A (ja) | データ処理装置およびその方法と符号化装置 | |
CN102695053B (zh) | 一种基于图像平滑度的自适应视频无损压缩方法 | |
Lei et al. | New distributed video coding paradigm with partial boundary matching algorithm, Spatio-temporal texture synthesis and image Inpainting | |
Fei et al. | Review of distributed video coding | |
KR100627494B1 (ko) | 동영상 부호화기 및 이를 이용한 부호화 방법 | |
Wu et al. | Syndrome-based light-weight video coding for mobile wireless application | |
Huchet et al. | Adaptive source representation for distributed video coding | |
Li et al. | Distributed video coding based on conditional entropy hash | |
Chien et al. | Distributed video coding with lossy side information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090708 Termination date: 20120111 |