CN106210744A - 基于宏块分类的分布式残差视频编译码方法 - Google Patents

基于宏块分类的分布式残差视频编译码方法 Download PDF

Info

Publication number
CN106210744A
CN106210744A CN201610574662.9A CN201610574662A CN106210744A CN 106210744 A CN106210744 A CN 106210744A CN 201610574662 A CN201610574662 A CN 201610574662A CN 106210744 A CN106210744 A CN 106210744A
Authority
CN
China
Prior art keywords
block
coding
frame
decoding
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610574662.9A
Other languages
English (en)
Other versions
CN106210744B (zh
Inventor
胡春筠
俞龙�
蔡坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Agricultural University
Original Assignee
South China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Agricultural University filed Critical South China Agricultural University
Priority to CN201610574662.9A priority Critical patent/CN106210744B/zh
Publication of CN106210744A publication Critical patent/CN106210744A/zh
Application granted granted Critical
Publication of CN106210744B publication Critical patent/CN106210744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于宏块分类的分布式残差视频编译码方法,包括:将整个视频划分为KEY帧和WZ帧;编码端用WZ帧减去参考帧,得到残差视频帧,对其用所提的宏块分类方案分出Intra块、Skip块和WZ块;对Intra块进行Intra编码,对WZ块进行非均匀量化和低密度奇偶校验码编码;同时采用变长码编码将宏块分类信息传送到译码端;译码端通过变长码译码得到分类信息,根据分类信息对三种宏块进行相应的处理并拼成残差帧,然后加上参考帧得到WZ帧的译码图像;最后将KEY帧译码图像和WZ帧译码图像合并成译码后的视频。本发明方法简单有效,在编码端进行宏块分类时不仅计算量小,阀值设置简单,而且还不需要产生边信息,保证了分布式视频编码在编码端具有低复杂度的特性。

Description

基于宏块分类的分布式残差视频编译码方法
技术领域
本发明涉及一种分布式残差视频编译码方法,尤其是一种基于宏块分类的分布式残差视频编译码方法,属于视频编译码技术领域。
背景技术
分布式残差视频编码(Distributed Residual Video Coding,DRVC)是继像素域编码(pixel-domain distributed video coding,PDDVC)、变换域编码(transform-domaindistributed video coding TDDVC)后的一种分布式视频编码方案。为了提高系统的RD特性,在编码端对宏块进行分类(block mode decision,BMD)是一种有效的办法;当前对BMD的研究多集中在PDDVC和TDDVC框架内,以TDDVC系统为主,对DRVC系统研究很少。在PDDVC和TDDVC系统中,宏块分类算法都涉及比较复杂的计算,比如需要计算当前宏块和前、后帧对应宏块之间的“绝对差和”(sum of absolute differences,SAD);计算当前宏块内像素的方差;计算由发送码率和失真函数组成的代价函数等……。这些计算都不简单,当把它们放在编码端进行时,无疑会增加编码端的计算负担。而且在进行宏块分类时,还要预先设置阀值,但是怎样设置这些阀值在论文中都没有提及。另外如果想要进行更加准确的宏块分类,编码端通常要产生一个边信息(side information)SI’。由于编码端资源有限,不能使用运动补偿内插(motion compensated frame interpolation,MCFI)这样复杂度高的算法来产生SI’,只能用平均内插(Average Interpolation,AI)或者快速运动补偿(Fast MotionCompensation Interpolation,FMCI)这样复杂度低的算法来产生简单SI’,尽管如此,还是不可避免的增加了编码端的复杂度。
上述这些缺点使得BMD在实际应用的时候受到了限制,而目前国内专利申请的内容主要是TDDVC系统中的宏块分类技术,如下:
中国专利申请号为CN103347188A的发明专利文献,公开了一种分布式视频编码非关键帧压缩感知编解码方法,该方法根据需要的测量数目将图像块划分为不同的类型,依据图像块的类型选择不同编码方式。
中国专利申请号为CN102137263A的发明专利文献,公开了一种基于相关性模型(correlation noise model,CNM)关键帧分类的分布式视频编码及解码方法,该方法将编码序列分为高速运动序列块、中速运动序列块和低速运动序列块并分别采用帧内模式编码、反向运动矢量估计模式编码和跳帧模式编码。
发明内容
本发明的目的是为了解决上述现有技术的缺陷,提供了一种基于宏块分类的分布式残差视频编译码方法,该方法简单有效,在编码端对残差帧进行宏块分类时不仅计算量小,阀值设计简单方便,而且还不需要产生边信息,保证了分布式视频编码在编码端具有低复杂度的特性。
本发明的目的可以通过采取如下技术方案达到:
基于宏块分类的分布式残差视频编译码方法,包括以下步骤:
S1、将整个视频按照GOP=2划分为KEY帧和WZ帧;
S2、编码端将WZ帧减去参考帧,得到编码端残差帧,将编码端残差帧按照4×4的大小分块,根据宏块分类方案分出Intra块、Skip块和WZ块;
S3、编码端对Intra块进行编码,包括DCT变换、均匀量化和熵编码;Skip块不进行传输;而WZ块按照非均匀量化方案进行量化,得到量化序号,然后进行低密度奇偶校验码编码;
S4、编码端采用变长码编码将Intra块、Skip块、WZ块的分类信息传送到译码端;
S5、译码端通过变长码译码得到分类信息,根据分类信息对Intra块、WZ块、Skip块进行相应的处理;
S6、译码端将Intra块、WZ块、Skip块的处理结果拼成残差帧,将该残差帧加上参考帧得到WZ帧的译码图像;
S7、将KEY帧译码图像和WZ帧译码图像合并成译码后的视频。
作为一种实施方案,步骤S2中,所述根据宏块分类方案分出Intra块和Skip块,剩下的为WZ块,具体为:
1)Intra块:是指Rblock和R′block之间相关性差的块,定义至少有6个pi满足|pi|>30的Rblock;其中,Rblock是指编码端宏块,R′block是指译码端宏块,pi是指编码端宏块Rblock中的残差像素;
2)Skip块:是指Rblock和R′block之间相关性好的块,定义全部pi满足|pi|≤10的Rblock
3)WZ块:既不属于Intra块也不属于Skip块的宏块。
作为一种实施方案,步骤S3中,所述WZ块按照死区量化方案进行量化,得到量化序号,具体为:
1)残差信号的量化范围为[-255,-31]时,量化序号为-1;
2)残差信号的量化范围为[-30,30]时,量化序号为0;
3)残差信号的量化范围为[31,255]时,量化序号为1。
作为一种实施方案,步骤S5中,根据分类信息对Intra块进行相应的处理,具体为:
根据Intra块的分类信息对Intra块进行Intra译码,得到译码结果,该译码即为Intra块的处理结果
作为一种实施方案,步骤S5中,根据分类信息对WZ块进行相应的处理,具体为:
通过运动补偿办法得到WZ帧的边信息,则译码端残差帧为WZ帧的边信息减去参考帧,根据分类信息得到WZ块在译码端残差帧中的对应块,并按照步骤S3中的非均匀量化方案进行量化,然后结合编码端传过来的校验位进行信道译码,当译码不成功时,通过反馈信道向编码端申请更多的校验位,译码成功后经过反量化得到WZ块的处理结果
作为一种实施方案,步骤S5中,根据分类信息对Skip块进行相应的处理,具体为:
根据分类信息得到Skip块在译码端残差帧中的对应块,并采用下面公式对其进行改善:
p i &prime; = 10 p i &prime; > 10 - 10 p i &prime; < - 10 p i &prime; | p i &prime; | &le; 10 , p i &prime; &Element; R b l o c k &prime;
其中,p′i是指译码端宏块R′block中的残差像素,改进后的边信息块中所有残差像素的取值都满足|p′i|≤10;
采用改善后的边信息块代替Skip块得到Skip块的处理结果
作为一种实施方案,所述参考帧采用以下公式计算:
其中,分别是前、后KEY帧Intra译码的结果。
作为一种实施方案,所述KEY帧采用H.264/AVC Intra编码传输和译码。
本发明相对于现有技术具有如下的有益效果:
1、本发明方法在宏块分类时的阀值为30,阀值设置简单且固定;分类方案仅仅根据编码端残差像素的取值来决定宏块的类型,计算量非常小,没有增加编码端的计算负担,而且无需产生边信息,减轻了编码端的复杂度,从而维持了编码端的低复杂度,具有良好的实用性。
2、本发明方法的仿真结果表明,宏块分类准确,简单有效,与其它方案(如DISCOVER方案、解码端宏块分类方案(DBMD)、编码端帧分类方案(EFMD)等)相比较,具有良好的RD性能。
附图说明
图1为本发明实施例1的基于宏块分类的分布式残差视频编译码方法原理框图。
图2为本发明实施例2的宏块比例示意图。
图3为本发明实施例2的宏块峰值信噪比平均值示意图。
图4为本发明实施例2的Skip边信息块改善前后峰值信噪比对比图。
图5a~5d为按照本发明方案(BMD-DRVC)、DISCOVER、解码端宏块分类(DBMD)和编码端帧分类方案(EFMD)方案得到的RD特性对比图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。本领域技术人员应当理解,这些描述仅仅列举了本发明的一些具体实施例,对本发明及其保护范围无任何限制。
实施例1:
在分布式视频编码系统中,编码端宏块分类是一种能提高系统率失真性能的有效方法。现有的编码端宏块分类方案中,分类算法通常要预先设置阀值,但是怎样设置阀值并没有给出明确的说明;同时还要进行较复杂的计算,这增加了编码端的计算负担;为了更加准确得对宏块进行分类,编码端需要产生一个边信息,这增加了编码端的复杂度;以上这些缺点限制了分类方案的实用性。
本实施例的基于宏块分类的分布式残差视频编译码方法先给出一些基本定义:
A、视频序列按照GOP=2的大小分成WZ帧和KEY帧,其中X2k为WZ帧,X2k-1、X2k+1分别为前、后KEY帧。
B、参考帧为其中是前、后KEY帧Intra译码的结果。
C、编码端(又称发端)残差帧为R=X2k-Xre;译码端(又称编码端、收端)残差帧为R′=Y2k-Xre,其中Y2k是译码端获得的X2k的边信息。
D、设宏块的大小为4×4,编码端、译码端的宏块分别表示为Rblock和R′block,PSNR(Rblock,R′block)是宏块的峰值信噪比。
E、编码端、译码端的Rblock和R′block中残差像素分别表示为pi和p′i,pi,p′i∈[-255,255],i=1,2,3,...,16.。
如图1所示,本实施例的基于宏块分类的分布式残差视频编译码方法,包括以下步骤:
S1、将整个视频按照GOP(Group of Pictures,画面组)=2划分为KEY帧X2k-1、X2k+1和WZ帧X2k;其中,所述KEY帧X2k-1、X2k+1采用H.264/AVC Intra编码传输和译码,WZ帧X2k按照步骤S2~S6进行处理;
S2、编码端将WZ帧X2k减去参考帧Xre,得到编码端残差帧R(如定义C),将编码端残差帧R按照4×4的大小分块,根据宏块分类方案分出Intra块、Skip块和WZ块,具体为:
1)Intra块:是指Rblock和R′block之间相关性差的块,对这种宏块用Intra编码要比用Wyner-Ziv编码更有效,定义至少有6个pi满足|pi|>30的Rblock;其中,Rblock是指编码端宏块,R′block是指译码端宏块,pi是指编码端宏块Rblock中的残差像素;
2)Skip块:是指Rblock和R′block之间相关性好的块,为了获得更高的PSNR(Rblock,R′block),定义全部pi满足|pi|≤10的Rblock
3)WZ块:既不属于Intra块也不属于Skip块的宏块。
S3、编码端对Intra块进行Intra编码,包括DCT变换、均匀量化和熵编码;Skip块不进行传输;而WZ块按照下表1的非均匀量化方案进行量化,得到量化序号Rq,然后进行低密度奇偶校验码(Low Density Parity Check Code,LDPC)编码;
表1非均匀量化方案
S4、设Intra块、Skip块、WZ块的分类信息分别为10、00、01,编码端采用变长码编码将Intra块、Skip块、WZ块的分类信息传送到译码端;
S5、译码端通过变长码译码得到分类信息,根据分类信息对Intra块、WZ块、Skip块进行相应的处理,具体为:
1)Intra块的译码
根据Intra块的分类信息对Intra块进行Intra译码,得到译码结果,该译码即为Intra块的处理结果
2)WZ块的译码
通过运动补偿办法得到WZ帧X2k的边信息Y2k,则译码端残差帧为WZ帧的边信息减去参考帧,即R′=Y2k-Xre;根据分类信息得到WZ块在译码端残差帧中的对应块,并按照上述步骤S3中的非均匀量化方案进行量化,然后结合编码端传过来的校验位进行信道译码,当译码不成功时,通过反馈信道向编码端申请更多的校验位,译码成功后经过反量化得到WZ块的处理结果
3)Skip块的改善
根据分类信息得到Skip块在译码端残差帧中的对应块,并采用下面公式对其进行改善:
p i &prime; = 10 p i &prime; > 10 - 10 p i &prime; < - 10 p i &prime; | p i &prime; | &le; 10 , p i &prime; &Element; R b l o c k &prime;
其中,p′i是指译码端宏块R′block中的残差像素。改进后的边信息块中所有残差像素的取值都满足|p′i|≤10。
采用改善后的边信息块代替Skip块得到Skip块的处理结果
S6、译码端将上述拼成加上参考帧Xre得到WZ帧X2k的译码图像;
S7、将KEY帧译码图像和WZ帧译码图像合并成译码后的视频。
本发明将以上编码端的处理部分称为基于宏块分类的分布式残差视频编码算法(Block Mode Decision of The Distributed Residual Video Coding,BMD-DRVC),它简单有效,在编码端不仅计算量小,阀值设置简单固定,而且还不需要产生边信息,要点包括:
1、对译码端残差视频信号R′的统计特性进行分析和总结,得到一个有用的假设:R′的量化序号R′q=0占100%。因为:
R′=Y2k-Xre
其中,是前、后KEY帧Intra译码的结果,mv=(mvx,mvy)是对进行双向运动估计得到的运动矢量。R′=Y2k-Xre可以看成是运动补偿误差。在视频序列中,前后相邻帧之间大部分背景和前景改变不大,因此R′=Y2k-Xre≈0占绝大多数。针对R′的这种概率统计特性,对它们进行步骤S3中的非均匀量化,由于R′=Y2k-Xre≈0占绝大多数,因此残差像素落在R′q=0的比例都在97%以上,最高达到99%。在此,我们可以假设R′q=0占100%。
2、在R′q=0占100%的假设下提出了基于宏块分类的分布式残差视频编码算法(Block Mode Decision of The Distributed Residual Video Coding,BMD-DRVC),它仅依靠残差像素的取值将宏块分成Intra块、Skip块和WZ块。Intra块是指Rblock和R′block之间相关性差的块,在R′q=0的条件下,|Rq|=1认为两者相关性差别大。Skip块是指Rblock和R′block之间相关性好的块。在R′q=0的条件下,Rq=0才有可能成为Skip块。所以Intra块和Skip块的判决规则如前面步骤S2所述。
3、译码端对Skip块对应的边信息块进行检查和改进。由于Intra块和Skip块的判决是在假设R′q=0占100%的条件下提出来的。实际中,会出现R′q≠0的情况,只是这种情况占绝少数。当R′q≠0时按照步骤S2对宏块进行判决时,有些块会判错。当被错判为Intra块时,宏块经过Intra编译码后还能进行正确重建。当错判为Skip块时,这时Rq=0,但R′q≠0,因此不能直接用边信息代替。为了解决这个问题,可以利用步骤S5中的公式对Skip块的边信息块进行检查和改进,改进后的边信息块中所有残差像素的取值都满足|pi|≤10。
综上所述,本发明方法的阀值设置简单且固定,计算量非常小,没有增加编码端的计算负担,而且无需产生边信息,减轻了编码端的复杂度,从而维持了编码端的低复杂度,具有良好的实用性。
实施例2:
本实施例是具体的实验方案,采用QCIF格式且帧率为15帧/秒的Hall Monitor,Foreman Coastguard,Soccer四个运动性逐渐增强的测试视频。GOP为2,奇数帧为KEY帧,采用H.264/AVC Intra编码,QP分别设为14、16、18、20、24、27、30、32;偶数帧为WZ帧,LDPCA码长为396。
一、宏块分类效果及Skip块边信息改善结果
图2给出了四个视频序列所有R帧按照BMD-DRVC分类后每种宏块所占的比例。图3是对图2的四个视频序列的每种宏块分别计算PSNR(Rblock,R′block)并求其平均值(APSNR),从图3中可以看出Intra块的APSNR多在14dB~17dB左右,这说明Intra块与对应边信息块之间的差别大,对这种宏块用Intra编码要比用Wyner-Ziv编码更有效;Skip块的APSNR最高能达到43.26,通常都在39以上,这说明Skip块的边信息块平均质量都很高,可以用来代替原来Skip块;WZ块的APSNR通常在29db左右,这说明WZ块对应的边信息块质量尚可,适合用Wyner-Ziv编码;图3的仿真结果表明EBMD-RVF能适应运动程度不同的视频序列,并且效果良好。
图4给出了对质量不高的Skip边信息块进行改善前后的对比图,从图中可以看出,运动变化不大的Hall、Foreman视频改善后APSNR大约提高2dB左右,运动变化大的Coastguard和Soccer改善后APSNR分别提高1.2db和1.4dB。
二、RD性能比较
图5a~5d给出了四个视频序列只取灰度分量按照本发明方案(BMD-DRVC)、DISCOVER、解码端宏块分类(DBMD)[1],编码端帧分类方案(EFMD)[2]方案得到的RD特性对比图。其中DISCOVER是目前RD性能较好的分布式视频系统,它经常作为衡量其它分布式视频系统RD性能的标杆。文中DISCOVER的仿真结果来自于[3]。DBMD[1]属于解码端宏块分类方案,EFMD[2]属于编码端帧分类方案。DBMD[1]、EFMD[2]与BMD-DRVC的区别在于:前两种方案处理的对象是WZ帧,而BMD-DRVC处理的对象是残差帧,三者的分类算法不同。除此之外,其它的仿真条件一样。
与DISCOVER比:DISCOVER是目前RD性能较好的TDDVC系统,它在码率控制、相关噪声模型、边信息等方面作了优化改进,因此系统也相对复杂[3]。BMD-DRVC在系统上要比DISCOVER简单的多,它没有做任何上述优化。它在编码端只是增加了一个宏块分类模块,而且分类算法简单,计算量小。从图5a~5d中可以看出:Hall视频的RD曲线在DISCOVER曲线之上(平均高出约1.4dB左右);Coastguard视频和DISCOVER曲线几乎重合;Foreman和Soccer视频与DISCOVER曲线之间差大约0.4~1dB。仿真结果表明:和对于Hall这样运动程度不剧烈的视频,BMD-DRVC的效果要优于DISCOVER;其它视频中,DISCOVER性能略胜。BMD-DRVC以简单的系统结构获得了较好的RD特性,有较强的实用性。
与EFMD[2]比:在EFMD[2]中,编码端通过计算当前块与前后块之间的SAD值和当前块与周围块SAD值分别得到宏块被判为WZ块和Intra块的概率,然后把WZ帧所有块的这两种概率分别相加,哪种概率大,就用哪种编码模式对整个WZ帧进行处理。仿真结果表明:四个视频RD曲线都在BMD-DRVC之下。其中Hall视频两者之间差3~5dB;Foreman视频两者之间差1dB~2.5dB;Coastguard视频两者之间差1~2dB;Soccer视频两者之间差1.5~2dB。BMD-DRVC效果好的原因有两个:一是BMD-DRVC中定义了Skip块,它无需传送,节省了传送的数据量;同时收端对Skip块边信息进行检查和改善,这保证了Skip块的重建质量,提高系统的RD特性。二是BMD-DRVC算法中宏块分类准确,简单有效。EFMD[2]与BMD-DRVC都是在编码端进行编码模式分类的算法,但EFMD[2]涉及较复杂的概率计算,而BMD-DRVC的计算量很小。
与DBMD[1]比:在DBMD[1]中,译码端通过计算前后运动补偿块之间的SAD(绝对差和)和边信息中当前像素块的方差把宏块分成两类:Intra块和WZ块。仿真结果表明:四个视频RD曲线都在BMD-DRVC之下。DBMD[1]虽然没有增加编码端的复杂度,但需要将宏块分类信息从译码端传送到编码端,增加了系统的延迟,而BMD-DRVC没有这个延迟。
上述RD特性比较时所用参考文献如下:
[1]Tagliasacchi M.,Trapanese A.,Tubaro S.,et al.Intra mode decisionbased on spatio-temporal cues in pixel domain Wyner-Ziv video coding[A].TomasN.IEEE International Conference on Acoustics,Speech,and Signal Processing[C].Toulouse,France:IEEE,2006:57-60
[2]Xiem HoangVan,Byeungwoo Jeon.Flexible Complexity Control Solutionfor Transform Domain Wyner-Ziv Video Coding(J).Broadcasting,IEEE Transactionson 2012,58(2):209–220.
[3]http://www.img.lx.it.pt/~discover/rd_qcif_15_gop2.html
以上所述,仅为本发明专利较佳的实施例,但本发明专利的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明专利的技术方案及其发明构思加以等同替换或改变,都属于本发明专利的保护范围。

Claims (8)

1.基于宏块分类的分布式残差视频编译码方法,其特征在于:包括以下步骤:
S1、将整个视频按照GOP=2划分为KEY帧和WZ帧;
S2、编码端将WZ帧减去参考帧,得到编码端残差帧,将编码端残差帧按照4×4的大小分块,根据宏块分类方案分出Intra块、Skip块和WZ块;
S3、编码端对Intra块进行Intra编码,包括DCT变换、均匀量化和熵编码;Skip块不进行传输;而WZ块按照非均匀量化方案进行量化,得到量化序号,然后进行低密度奇偶校验码编码;
S4、编码端采用变长码编码将Intra块、Skip块、WZ块的分类信息传送到译码端;
S5、译码端通过变长码译码得到分类信息,根据分类信息对Intra块、WZ块、Skip块进行相应的处理;
S6、译码端将Intra块、WZ块、Skip块的处理结果拼成残差帧,将该残差帧加上参考帧得到WZ帧的译码图像;
S7、将KEY帧译码图像和WZ帧译码图像合并成译码后的视频。
2.根据权利要求1所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:步骤S2中,根据宏块分类方案分出Intra块、Skip块和WZ块,具体为:
1)Intra块:是指Rblock和R′block之间相关性差的块,定义至少有6个pi满足|pi|>30的Rblock;其中,Rblock是指编码端宏块,R′block是指译码端宏块,pi是指编码端宏块Rblock中的残差像素;
2)Skip块:是指Rblock和R′block之间相关性好的块,定义全部pi满足|pi|≤10的Rblock
3)WZ块:既不属于Intra块也不属于Skip块的宏块。
3.根据权利要求1所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:步骤S3中,所述WZ块按照非均匀量化方案进行量化,得到量化序号,具体为:
1)残差信号的量化范围为[-255,-31]时,量化序号为-1;
2)残差信号的量化范围为[-30,30]时,量化序号为0;
3)残差信号的量化范围为[31,255]时,量化序号为1。
4.根据权利要求1所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:步骤S5中,根据分类信息对Intra块进行相应的处理,具体为:
根据Intra块的分类信息对Intra块进行Intra译码,得到译码结果,该译码即为Intra块的处理结果
5.根据权利要求1所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:步骤S5中,根据分类信息对WZ块进行相应的处理,具体为:
通过运动补偿办法得到WZ帧的边信息,则译码端残差帧为WZ帧的边信息减去参考帧,根据分类信息得到WZ块在译码端残差帧中的对应块,并按照步骤S3中的非均匀量化方案进行量化,然后结合编码端传过来的校验位进行信道译码,当译码不成功时,通过反馈信道向编码端申请更多的校验位,译码成功后经过反量化得到WZ块的处理结果
6.根据权利要求5所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:步骤S5中,根据分类信息对Skip块进行相应的处理,具体为:
根据分类信息得到Skip块在译码端残差帧中的对应块,并采用下面公式对其进行改善:
p i &prime; = 10 p i &prime; > 10 - 10 p i &prime; < - 10 p i &prime; | p i &prime; | &le; 10 , p i &prime; &Element; R b l o c k &prime;
其中,p′i是指译码端宏块R′block中的残差像素,改进后的边信息块中所有残差像素的取值都满足|p′i|≤10;
采用改善后的边信息块代替Skip块得到Skip块的处理结果
7.根据权利要求1-6任一项所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:所述参考帧采用以下公式计算:
其中,分别是前、后KEY帧Intra译码的结果。
8.根据权利要求1-6任一项所述的基于宏块分类的分布式残差视频编译码方法,其特征在于:所述KEY帧采用H.264/AVC Intra编码传输和译码。
CN201610574662.9A 2016-07-19 2016-07-19 基于宏块分类的分布式残差视频编译码方法 Active CN106210744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610574662.9A CN106210744B (zh) 2016-07-19 2016-07-19 基于宏块分类的分布式残差视频编译码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610574662.9A CN106210744B (zh) 2016-07-19 2016-07-19 基于宏块分类的分布式残差视频编译码方法

Publications (2)

Publication Number Publication Date
CN106210744A true CN106210744A (zh) 2016-12-07
CN106210744B CN106210744B (zh) 2019-01-08

Family

ID=57490922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610574662.9A Active CN106210744B (zh) 2016-07-19 2016-07-19 基于宏块分类的分布式残差视频编译码方法

Country Status (1)

Country Link
CN (1) CN106210744B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100208797A1 (en) * 2009-02-17 2010-08-19 Electronics And Telecommunications Research Institute Distributed video encoder and decoder, and distributed video encoding and decoding method
CN102088612A (zh) * 2011-03-11 2011-06-08 西安电子科技大学 具有鲁棒性的无反馈Wyner-Ziv视频解码器
CN102137263A (zh) * 2011-05-09 2011-07-27 松日数码发展(深圳)有限公司 基于cnm关键帧分类的分布式视频编码及解码方法
CN102256133A (zh) * 2011-08-26 2011-11-23 北京邮电大学 一种基于边信息精化的分布式视频编码及解码方法
CN102271256A (zh) * 2011-09-16 2011-12-07 河海大学常州校区 基于模式决策的自适应帧组分布式视频编码和解码方法
CN102595132A (zh) * 2012-02-17 2012-07-18 南京邮电大学 一种应用于无线传感器网络的分布式视频编解码方法
KR20120126505A (ko) * 2011-05-12 2012-11-21 한밭대학교 산학협력단 화면내 부호화 모드의 결정 방법 및 이를 활용한 분산 비디오 부호화 기법 코덱
CN103888769A (zh) * 2014-03-11 2014-06-25 河海大学常州校区 分布式视频编码中基于时空相关性的不等差错保护方法
CN104301730A (zh) * 2014-10-14 2015-01-21 河海大学常州校区 基于视频移动设备的双向视频编解码系统及其方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100208797A1 (en) * 2009-02-17 2010-08-19 Electronics And Telecommunications Research Institute Distributed video encoder and decoder, and distributed video encoding and decoding method
CN102088612A (zh) * 2011-03-11 2011-06-08 西安电子科技大学 具有鲁棒性的无反馈Wyner-Ziv视频解码器
CN102137263A (zh) * 2011-05-09 2011-07-27 松日数码发展(深圳)有限公司 基于cnm关键帧分类的分布式视频编码及解码方法
KR20120126505A (ko) * 2011-05-12 2012-11-21 한밭대학교 산학협력단 화면내 부호화 모드의 결정 방법 및 이를 활용한 분산 비디오 부호화 기법 코덱
CN102256133A (zh) * 2011-08-26 2011-11-23 北京邮电大学 一种基于边信息精化的分布式视频编码及解码方法
CN102271256A (zh) * 2011-09-16 2011-12-07 河海大学常州校区 基于模式决策的自适应帧组分布式视频编码和解码方法
CN102595132A (zh) * 2012-02-17 2012-07-18 南京邮电大学 一种应用于无线传感器网络的分布式视频编解码方法
CN103888769A (zh) * 2014-03-11 2014-06-25 河海大学常州校区 分布式视频编码中基于时空相关性的不等差错保护方法
CN104301730A (zh) * 2014-10-14 2015-01-21 河海大学常州校区 基于视频移动设备的双向视频编解码系统及其方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HU CHEN,ECKEHARD STEINBACH: "Fast Motion Estimation-Based Reference Frame Generation in Wyner-Ziv Residual Video Coding", 《2007 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO》 *
JUI-CHIU CHIANG ET AL.: "Block-based distributed video coding with variable block modes", 《PROCEEDINGS OF 2010 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS》 *
M.TAGLIASACCHI ET AL.: "intra mode decision based on spatio-temporal cues in pixel domain wyner-ziv video coding", 《2006 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS SPEECH AND SIGNAL PROCESSING PROCEEDINGS》 *
XIEM HOANGVAN ET AL.: "flexible complexity control solution for transform domain wyner-ziv video coding", 《IEEE TRANSACTIONS ON BROADCASTING》 *

Also Published As

Publication number Publication date
CN106210744B (zh) 2019-01-08

Similar Documents

Publication Publication Date Title
CN112715027B (zh) 神经网络驱动型编解码器
Pan et al. A low-complexity screen compression scheme for interactive screen sharing
US9143776B2 (en) No-reference video/image quality measurement with compressed domain features
US20190045195A1 (en) Reduced Partitioning and Mode Decisions Based on Content Analysis and Learning
CN102137263B (zh) 基于cnm关键帧分类的分布式视频编码及解码方法
CN109862356B (zh) 一种基于感兴趣区域的视频编码方法及系统
US20100166073A1 (en) Multiple-Candidate Motion Estimation With Advanced Spatial Filtering of Differential Motion Vectors
US8630341B2 (en) Method for training and utilizing separable transforms for video coding
CN105791877A (zh) 视频编解码中自适应环路滤波的方法
CN103002283A (zh) 多视角分布式视频压缩的边信息生成方法
CN102572428B (zh) 面向多媒体传感网分布式编解码的边信息估计方法
CN100502507C (zh) 视频数据压缩编码方法
CN107343202B (zh) 基于附加码率的无反馈分布式视频编解码方法
US20050232354A1 (en) Rate controlling method and apparatus for use in a transcoder
CN114793282B (zh) 带有比特分配的基于神经网络的视频压缩
CN116349225A (zh) 用于逐块图像压缩中的去块的内容自适应在线训练方法和装置
Alexandre et al. Deep video compression for interframe coding
García-Lucas et al. A fast full partitioning algorithm for HEVC-to-VVC video transcoding using Bayesian classifiers
CN106210744A (zh) 基于宏块分类的分布式残差视频编译码方法
CN116114248A (zh) 神经图像压缩中具有特征替换的内容自适应在线训练
Zhang et al. Enhanced video compression with region-based texture models
CN113822801A (zh) 基于多分支卷积神经网络的压缩视频超分辨率重建方法
US8971393B2 (en) Encoder
Zhang et al. Region-based texture modelling for next generation video codecs
CN105681784B (zh) 一种基于h264/avc视频的psnr盲估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant