CN103096085B - 一种基于odwt子带实时生成高质量dvc解码端边信息的方法 - Google Patents
一种基于odwt子带实时生成高质量dvc解码端边信息的方法 Download PDFInfo
- Publication number
- CN103096085B CN103096085B CN201310042020.0A CN201310042020A CN103096085B CN 103096085 B CN103096085 B CN 103096085B CN 201310042020 A CN201310042020 A CN 201310042020A CN 103096085 B CN103096085 B CN 103096085B
- Authority
- CN
- China
- Prior art keywords
- odwt
- side information
- subband
- frame
- spatial domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种基于ODWT子带实时生成高质量DVC解码端边信息的方法,包括步骤:a在当前WZ帧前后相邻的两帧之间进行空域运动补偿时域插值,获得当前WZ帧的边信息SIs,以及对应的空域运动矢量MVs;b计算空域运动矢量的绝对值|MVs|的均值Ave(|MVs|)和方差Var(|MVs|);c根据Ave(|MVs|)和Var(|MVs|)判定是否需要对边信息SIs进行增强;如果需要,进入步骤d;如不需要,则令S=SIs,并进入步骤e;d首先对相邻帧进行2级ODWT变换,分解为7个子带Sk,然后使用MVs作为运动矢量的初始值在各子带Sk间进行运动估计,重新计算各个子带对应的预测信息Pk,最后将{Pk}进行ODWT逆变换生成增强后的边信息SIODWT,并令S=SIODWT;e输出边信息S。本发明以较低的计算复杂度增长为代价,实现提升空域MCTI生成的边信息质量。
Description
技术领域
本发明属于图像处理技术、视频编码技术。具体讲本发明涉及一种分布式视频编码技术DVC(DistributedVideoCoding)解码端边信息SI(SideInformation)的质量提升方法。
背景技术
分布式视频编码技术DVC是在Slepian-Wolf编码,又称为分布式信源编码(DSC:DistributedSourceCoding)的基础上实现的。DVC编码主要面向资源有限的移动设备的低复杂度视频编码场景,由于采用独立编码联合解码的策略,具有高计算复杂度的运动估计ME(MotionEstimation)被移到了解码端进行,从而极大的改善了编码端对于计算资源的需求。
DVC解码端在工作的过程中需要首先生成边信息SI用于解码。SI的质量对于DVC编解码技术的率失真性能具有决定性的影响。生成边信息SI有多种方法,目前使用频繁的方法是在StanfordDVC系统中提出的,该方法把视频帧分为两类:一类以Intra编码模式进行编码,称为关键帧,其余的帧则进行WZ编码称为WZ帧。在解码端使用与当前编码的WZ帧相邻的已解码的前后两帧作为预测的信息源,基于运动估计运动补偿MEMC(MotionEstimationandMotionCompensation)的原理生成的,称为运动补偿时域插值方法MCTI(MotionCompensatedTemporalInterpolation)。
在最近几年中很多研究者对如何提高边信息的质量进行了研究,并提出了很多方法。但这些方法都存在模型复杂、适用性不广等问题。大部分DVC边信息都是在空域中生成的。
除上述基于空域MCTI的方法外,还有一种在ODWT域的各级子带进行MCTI生成边信息的方法。其采用如下方法生成DVC边信息。首先在解码端对当前WZ帧的前后相邻两帧进行ODWT变换,获得多级子带。然后计算相邻关键帧的差值的绝对值的方差。将这个方差与预先设定的阈值进行比较来决定哪几个子带需要进行MCTI,哪些子带不需要MCTI,而是直接使用平均值来作为预测。假设ODWT变换级数是2,那么需要两个阈值来决定ODWT变换获得的1级、2级子带中哪些需要进行MCTI变换。与基于空域MCTI的方法相比,该方法通过将MCTI从空域迁移到ODWT变换域显著地提升了边信息的质量,但是该方法在实时编码中存在一些问题如下:首先该方法显著的增加了解码端的计算量。如果采用与空域MCTI相同的搜索块大小和搜索范围,ODWT变换为2级的换,那么最坏情况下的计算量将是空域MCTI的7倍。其次,更为重要的是如果要获得较好的结果,就必须恰当的设置用来进行子带分类的阈值。对于非实时编码来说,可以通过统计等方法获得较好的分类阈值。但在实时编码中由于不知道将来的视频信息,就难以生成最佳阈值,严重降低生成的边信息质量。而且该方法中的阈值并不具有普遍性,即在一个视频序列中设定的阈值迁移到另一个视频序列中都会失效。
发明内容
为了克服现有技术的不足,本发明的任务在于提供一种基于ODWT子带实时生成高质量DVC解码端边信息的方法;本发明以较低的计算复杂度增长为代价,实现在实时DVC编码中提升空域MCTI生成边信息质量。
其技术解决方案是:
一种基于ODWT子带实时生成高质量DVC解码端边信息的方法,包括下列步骤:
a在当前WZ帧前后相邻的两帧之间进行空域运动补偿时域插值,获得当前WZ帧的边信息SIs,以及对应的空域运动矢量MVs,SIs可以视为是DVC解码端形成的对当前WZ帧的预测帧;然后进入步骤b,
b计算空域运动矢量的绝对值|MVs|的均值Ave(|MVs|)和方差Var(|MVs|);然后进入步骤c,
c根据Ave(|MVs|)和Var(|MVs|)判定是否需要对边信息SIs进行增强;如果需要,进入步骤d;如不需要,则令S=SIs,并进入步骤e;
d首先对相邻帧进行2级ODWT变换,分解为7个子带Sk,k∈[1,7],然后使用MVs作为运动矢量的初始值在各子带Sk间进行运动估计,重新计算各个子带对应的预测信息Pk,最后将{Pk}进行ODWT逆变换生成增强后的边信息SIODWT,并令S=SIODWT;
e输出边信息S。
上述步骤c中,首先计算Ave(|MVs|)和Var(|MVs|),Ave和Var分别代表求均值和方差的函数,然后计算二者之间的一个比值关系,并与某个预先设定的阈值th1比较,当大于th1时进入步骤d对边信息SIs进行增强;当小于th1时则把Var(|MVs|)与另一个预先设定的阈值th2进行比较,当大于th2时也进入步骤d对边信息SIs进行增强,当小于th2时则进入步骤e。
上述步骤d中,首先对与当前WZ帧相邻的两个重构帧按下式进行2级ODWT变换
k∈[1,7]
其中公式左侧Sk表示某个子带,{}表示各级子带的集合,右侧ODWT表示冗余离散小波变换,t表示时间;其次在Sk(t-1)和Sk(t+1)之间按下式进行各级子带的预测,
Pk=MEMC(Sk(t-1),Sk(t+1),MVs)
其中MVs为空域运动矢量,作为MEMC的初始值;当对所有子带都进行了MEMC操作生成了Pk后,按下式进行ODWT逆变换生成SIODWT,
SODWT=ODWT-1({Pk})k∈[1,7]
上述步骤d中,在各个ODWT子带中进行运动估计时采用不同的搜索策略,在第一级分级高频子带、第二级高频子带以及第二级低频子带设置不同的搜索块尺寸和搜索范围,用以降低计算复杂度的同时提升边信息质量。
本发明可以产生如下有益的技术效果:
从本质上看,本发明把在ODWT域进行MCTI看作是对空域MCTI生成的边信息的一种修正和增强。首先,本发明是在空域MCTI的基础上进行的,把空域运动估计获得的运动矢量作为ODWT域运动估计的初始矢量,由于空域和各子带之间存在的强相关性,该设置大大降低了运动搜索的计算量;其次,在各个ODWT子带中进行运动估计时可以采用不同的搜索策略,比如在第一级分级高频子带、第二级高频子带以及第二级低频子带设置不同的搜索块尺寸和搜索范围来进一步降低计算复杂度的同时提升边信息质量;最后,本发明所使用的两个阈值均可以直接根据先验值设置,而不需要统计全部视频序列才能正确设置,可以非常方便的用于实时编码系统。
附图说明
下面结合附图与具体实施方式对本发明作更进一步的说明:
图1为本发明一种实施方式的流程示意框图。
图2为在stanford-DVC框架中本发明的位置。
图3为本发明中使用的基于前向和后向两次运动估计的MCTI方法示意图。
图4为本发明中使用的基于ODWT的边信息增强流程示意图。
图5示出的是本发明生成的边信息质量,视频序列:Foreman。
图6示出的是本发明生成的边信息质量,视频序列:Soccer。
具体实施方式
参看图1,一种基于ODWT子带实时生成高质量DVC解码端边信息的方法,包括下列步骤:a在当前WZ帧前后相邻的两帧之间进行空域运动补偿时域插值,获得当前WZ帧的边信息SIs(SIs可以视为是DVC解码端形成的对当前WZ帧的预测帧),以及对应的空域运动矢量MVs;b计算空域运动矢量的绝对值|MVs|的均值Ave(|MVs|)和方差Var(|MVs|);c根据Ave(|MVs|)和Var(|MVs|)来判定是否需要对边信息SIs进行增强;如果需要,则跳转至步骤d;如不需要,则令S=SIs,并跳转至步骤e;d首先对相邻帧进行2级ODWT变换,分解为7个子带Sk,k∈[1,7],然后使用MVs作为运动矢量的初始值在各子带Sk间进行运动估计,重新计算各个子带对应的预测信息Pk,最后将{Pk}进行ODWT逆变换生成增强后的边信息SIODWT,并令S=SIODWT;e输出边信息S。
下面进一步详细说明本发明的技术方案
本发明基于ODWT提升边信息质量方法可以与各种不同的DVC实现机制相结合。图2给出了在stanford-DVC框架下本发明的使用情况,其中黑色虚线方框所示的“基于ODWT的边信息质量提升”模块即为本发明所设计的边信息生成方法。
下面在stanford-DVC框架下对本发明方法进一步说明。
a在当前WZ帧前后相邻的两帧之间进行空域运动补偿时域插值,获得对当前WZ帧的空域预测边信息SIs,以及对应的空域运动矢量MVs;
当前WZ帧前后相邻的两帧是两个已经解码重构的关键帧或者WZ帧,记为和其中Λ=[x,y]表示位置,t表示时间。运动补偿时域插值如图3所示,包括一次前向运动估计和一次后向运动估计。空域运动补偿时域插值生成的空域边信息是两次运动估计生成的预测的均值,如下式:
SIs=(SIF+SIB)/2
其中MVs包括MVF和MVB,MV=[dxdy]表示在x和y两个方向上的偏移量。该过程假设视频中的运动是对称的、匀速的。此过程中搜索块大小为8x8,搜索范围为[-1616]。另外考虑到位置的偏移,SIF和SIB并不一定能覆盖SIs所有的位置,SIs会出现孔洞现象(即某些位置上无预测值),该孔洞问题可通过赋予SIs一个初值的方式来解决。一个较好的初值选择是f(t+1)和f(t-1)的平均值。
b计算空域运动矢量的绝对值|MVs|的均值Ave(|MVs|)和方差Var(|MVs|);
c根据Ave(|MVs|)和Var(|MVs|)来判定是否需要对边信息SIs进行增强;如果需要,则跳转至步骤d;如不需要,则令S=SIs,并跳转至步骤e;
判断是否需要进行边信息增强处理,流程如图4所示。首先计算|MVs|的方差与均值的比值,如下式所示
将该比值与一个阈值Th1相比来判断是否需要进行边信息SIs的增强,当r大于Th1时跳转至(进入)步骤d对边信息SIs进行增强;当r小于Th1但Var(|MVs|)大于Th2时也跳转至(进入)步骤d对边信息SIs进行增强;其他情况下,不需要边信息SIs进行增强则跳转至(进入)步骤e。此处Th1和Th2是预先设置的阈值,其中第一个阈值反映的是当前帧中运动变化的相对情况,第二个反映的是当前帧中运动变化的绝对情况。两个阈值的设定不要对全部视频帧进行统计后计算,可以根据先验值设定。
d首先对相邻帧进行2级ODWT变换,分解为7个子带Sk,k∈[1,7],然后使用MVs作为运动矢量的初始值在各子带Sk间进行运动估计,重新计算各个子带对应的预测信息Pk,最后将{Pk}进行ODWT逆变换生成增强后的边信息SIODWT,并令S=SIODWT;
边信息增强处理的流程如图4所示。首先对与当前WZ帧相邻的两个重构帧按下式进行2级ODWT变换
k∈[1,7]
其中公式左侧表示各级子带的集合,右侧ODWT表示冗余离散小波变换,该变换采用多孔算法实现。
其次在Sk(t-1)和Sk(t+1)之间按下式进行各级子带的预测,
Pk=MEMC(Sk(t-1),Sk(t+1),MVs)(4)
其中MVs为空域运动矢量,作为MEMC的初始值。每个子带生成Pk采用的MCMC方法类似于图2所示的MCTI方法。每个子带在进行MEMC时可以采用不同的搜索策略,典型的如当k∈[1,3]时MEMC搜索块的大小为8x8,搜索范围为[-22],当k∈[4,7]时MEMC搜索块的大小为4x4,搜索范围为[-66],这种设置充分考虑了不同级不同子带的特点。当对所有的子带k都进行了MEMC操作并生成了Pk后,按下式进行ODWT逆变换求的SIODWT,
SODWT=ODWT-1({Pk})k∈[1,7]
并令S=SIODWT;
e输出边信息S。
图5和图6是本发明与传统空域MCTI生成边信息方法的对比结果。测试序列为具有中等运动和强烈运动的Foreman和Soccer序列,序列格式为QCIF,帧率为30fps.其中Intra编码的量化步长为32。二者采用的是相同的阈值Th1和Th2,可以看到实验结果中部分WZ帧不符合增强条件所以仍然采用的是空域MCTI生成的边信息,大部分WZ帧进行了增强,其中极少部分帧的边信息质量略有下降,大部分边信息质量都有所提升。
在图5和图6所示的实验中,所涉及的方法采用的是相同的阈值Th1和Th2。图5和图6实验结果的一致性充分表明了本发明可以有效性的应用于DVC实时编码系统中,其阈值的设置具有较好的适应性。
根据实验结果统计,在上述实验条件下,本发明与空域MCTI方法相比,在第1至50WZ帧上,在Foreman序列上平均质量提升了0.32dBs,在Soccer序列上平均质量提升了0.29dBs。上述实验结果充分表明了,本发明可以较好的应用于DVC实时编码系统中,并且能够提升边信息质量,有助于提高DVC系统的率失真性能。
特别说明的是,本发明工作受国家自然科学基金项目(61170253,61201431)、山东科技大学信息学院科研创新团队计划支持。
上述方式中未述及的有关技术内容采取或借鉴已有技术即可实现。
需要说明的是,在本说明书的教导下本领域技术人员还可以作出这样或那样的容易变化方式,诸如等同方式,或明显变形方式。上述的变化方式均应在本发明的保护范围之内。
Claims (3)
1.一种基于ODWT子带实时生成高质量DVC解码端边信息的方法,其特征在于包括下列步骤:
a在当前WZ帧前后相邻的两帧之间进行空域运动补偿时域插值,获得当前WZ帧的边信息SIs,以及对应的空域运动矢量MVs,SIs可以视为是DVC解码端形成的对当前WZ帧的预测帧;然后进入步骤b,
b计算空域运动矢量的绝对值|MVs|的均值Ave(|MVs|)和方差Var(|MVs|);然后进入步骤c,
c根据Ave(|MVs|)和Var(|MVs|)判定是否需要对边信息SIs进行增强;如果需要,进入步骤d;如不需要,则令S=SIs,并进入步骤e;
d首先对相邻帧进行2级ODWT变换,分解为7个子带Sk,k∈[1,7],然后使用MVs作为运动矢量的初始值在各子带Sk间进行运动估计,重新计算各个子带对应的预测信息Pk,最后将{Pk}进行ODWT逆变换生成增强后的边信息SIODWT,并令S=SIODWT;
e输出边信息S;
上述步骤c中,首先计算Ave(|MVs|)和Var(|MVs|),Ave和Var分别代表求均值和方差的函数,然后计算二者之间的一个比值关系,并与某个预先设定的阈值th1比较,当大于th1时进入步骤d对边信息SIs进行增强;当小于th1时则把Var(|MVs|)与另一个预先设定的阈值th2进行比较,当大于th2时也进入步骤d对边信息SIs进行增强,当小于th2时则进入步骤e。
2.根据权利要求1所述的一种基于ODWT子带实时生成高质量DVC解码端边信息的方法,其特征在于上述步骤d中,首先对与当前WZ帧相邻的两个重构帧按下式进行2级ODWT变换
k∈[1,7]
其中公式左侧Sk表示某个子带,{}表示各级子带的集合,右侧ODWT表示冗余离散小波变换,t表示时间;其次在Sk(t-1)和Sk(t+1)之间按下式进行各级子带的预测,
Pk=MEMC(Sk(t-1),Sk(t+1),MVs)
其中MVs为空域运动矢量,作为MEMC的初始值;当对所有子带都进行了MEMC操作生成了Pk后,按下式进行ODWT逆变换生成SIODWT。
SODWT=ODWT-1({Pk})k∈[1,7]
3.根据权利要求2所述的一种基于ODWT子带实时生成高质量DVC解码端边信息的方法,其特征在于上述步骤d中,在各个ODWT子带中进行运动估计时采用不同的搜索策略,在第一级分级高频子带、第二级高频子带以及第二级低频子带设置不同的搜索块尺寸和搜索范围,用以降低计算复杂度的同时提升边信息质量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310042020.0A CN103096085B (zh) | 2013-02-04 | 2013-02-04 | 一种基于odwt子带实时生成高质量dvc解码端边信息的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310042020.0A CN103096085B (zh) | 2013-02-04 | 2013-02-04 | 一种基于odwt子带实时生成高质量dvc解码端边信息的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103096085A CN103096085A (zh) | 2013-05-08 |
CN103096085B true CN103096085B (zh) | 2016-04-06 |
Family
ID=48208148
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310042020.0A Expired - Fee Related CN103096085B (zh) | 2013-02-04 | 2013-02-04 | 一种基于odwt子带实时生成高质量dvc解码端边信息的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103096085B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI642287B (zh) * | 2016-09-06 | 2018-11-21 | 聯發科技股份有限公司 | 無線通訊系統中有效編碼切換方法及通訊設備 |
CN107071447B (zh) * | 2017-04-06 | 2020-06-19 | 华南理工大学 | 一种dvc中基于二次边信息的相关噪声建模方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102333218A (zh) * | 2011-09-23 | 2012-01-25 | 清华大学深圳研究生院 | 基于odwt子带分类的dvc解码端边信息帧生成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090003452A1 (en) * | 2007-06-29 | 2009-01-01 | The Hong Kong University Of Science And Technology | Wyner-ziv successive refinement video compression |
-
2013
- 2013-02-04 CN CN201310042020.0A patent/CN103096085B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102333218A (zh) * | 2011-09-23 | 2012-01-25 | 清华大学深圳研究生院 | 基于odwt子带分类的dvc解码端边信息帧生成方法 |
Non-Patent Citations (2)
Title |
---|
Reducing the Motion-Compensated Temporal Interpolation Noise of DVC Side Information by ODWT;Sheng Fang等;《Computer Science》;20091215;第5879/2009卷;第1068-1079页 * |
REFINING SIDE INFORMATION BY ODWT MCTI FOR WYNER-ZIV VIDEO CODING;Sheng Fang等;《2010 International Symposium on Intelligent Signal Processing and Communication Systems》;20101208;同上 * |
Also Published As
Publication number | Publication date |
---|---|
CN103096085A (zh) | 2013-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102137263B (zh) | 基于cnm关键帧分类的分布式视频编码及解码方法 | |
CN101835044B (zh) | 一种频率域分布式视频编码中的分类组合方法 | |
CN101267556B (zh) | 快速运动估计方法及视频编解码方法 | |
CN101127912B (zh) | 利用动态背景帧的视频编码方法 | |
CN101860748A (zh) | 基于分布式视频编码的边信息生成系统及方法 | |
CN102595140B (zh) | 基于图像修复和矢量预测算子的帧内预测视频编码方法 | |
CN104113754A (zh) | 基于时域相关性的高性能视频帧间编码方法及其转码器 | |
CN103475879B (zh) | 一种分布式视频编码中边信息生成方法 | |
CN102256133B (zh) | 一种基于边信息精化的分布式视频编码及解码方法 | |
CN103327325A (zh) | 基于hevc标准的帧内预测模式快速自适应选择方法 | |
KR20070026317A (ko) | 비디오 코딩에 사용되는 코딩단/디코딩단의 양방향예측방법 | |
CN102291582B (zh) | 一种基于运动补偿精化的分布式视频编码方法 | |
CN103327327B (zh) | 用于高性能视频编码hevc的帧间预测编码单元选择方法 | |
Kim et al. | A selective block encoding scheme based on motion information feedback in distributed video coding | |
CN100591136C (zh) | 一种基于空域分解的视频帧内编码方法 | |
CN105898300A (zh) | 一种基于恢复变换系数的改进变换系数符号位隐藏方法 | |
CN103024392A (zh) | 基于二维哈达玛变换的帧内模式预测方法及装置 | |
CN108574844A (zh) | 一种时空显著感知的多策略视频帧率提升方法 | |
CN103096085B (zh) | 一种基于odwt子带实时生成高质量dvc解码端边信息的方法 | |
CN102857760B (zh) | 一种无反馈的优化码率的分布式视频编解码方法及其系统 | |
CN115278262A (zh) | 一种端到端智能视频编码方法及装置 | |
CN104702959A (zh) | 一种视频编码的帧内预测方法及系统 | |
CN106534855A (zh) | 一种面向satd的拉格朗日因子计算方法 | |
CN109151467A (zh) | 基于图像块活动性的屏幕内容编码帧间模式快速选择方法 | |
CN104243991B (zh) | 一种边信息生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160406 Termination date: 20190204 |
|
CF01 | Termination of patent right due to non-payment of annual fee |