CN101841712A - 面向全景视频编码的b帧扩展直接模式 - Google Patents

面向全景视频编码的b帧扩展直接模式 Download PDF

Info

Publication number
CN101841712A
CN101841712A CN 201010158471 CN201010158471A CN101841712A CN 101841712 A CN101841712 A CN 101841712A CN 201010158471 CN201010158471 CN 201010158471 CN 201010158471 A CN201010158471 A CN 201010158471A CN 101841712 A CN101841712 A CN 101841712A
Authority
CN
China
Prior art keywords
motion vector
frame
reference frame
backward
corresponding blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010158471
Other languages
English (en)
Inventor
覃团发
郑嘉利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CN 201010158471 priority Critical patent/CN101841712A/zh
Publication of CN101841712A publication Critical patent/CN101841712A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了面向全景视频编码的B帧扩展直接模式。该模式包含三种扩展直接模式:(1)A模式,使用前向参考帧中对应块的后向运动矢量进行时域缩放得到当前块的前向和后向运动矢量;(2)B模式,使用后向参考帧中对应块的后向运动矢量的反向映射生成前向运动矢量,利用这一映射出来的前向运动矢量进行缩放,得到当前块的前向和后向运动矢量;(3)C模式,使用后向参考帧中对应块的前向运动矢量进行时域缩放得到当前块的前向和后向运动矢量。本发明的优点是:本发明有效弥补现有技术的不足,可减少预测残差,使得直接模式被选中的概率增大,从而大大节省编码运动矢量的比特数,使得全景视频序的编码性能得到提高。

Description

面向全景视频编码的B帧扩展直接模式
技术领域
本发明涉及一种图象视频编码压缩技术,具体地说是一种面向全景视频编码的B帧直接模式方法。
背景技术
全景视频是基于图像渲染的一种全方位视频,也称为沉浸式视频,目的是给用户提供虚拟现实体验,让用户可以观察到周围用照片图像拼接起来的场景。一幅全景图像是由一个六面或者八面的鱼眼摄像机绕着固定的轴做旋转或者缩放运动,对摄像机周围的场景同一时刻拍摄不同方位的照片,把这些照片用一些“缝合”技术无缝拼接,再根据柱面或者球面映射算法映射成柱面图或者球面图而成。因此,全景图像的分辨率一般来说比较高(因为是多幅常规图像拼接而成),运动细节更丰富(因为拼接的多幅图像之间有很强的空域相关性,全景视频序列相邻帧之间有很强的时域相关性)。
为了提高全景视频的编码效率,目前全景视频所采用的编码方案是可分级B帧编码。分级B帧编码实际上是一个完全符合H.264/AVC标准的编码结构,只是在这个方法中使用了金字塔式的编码顺序。图1描述了一个总共有4级时域分解的分级B帧编码结构。在H.264/AVC标准中,B帧的概念得到加强。最大的特点是重建后的B帧可以作为其他图像的参考帧。B帧的这个特点大大增加编码的灵活性。H.264/AVC的这些技术特点使得分级B帧编码结构在H.264/AVC标准内不需要任何修改就可以实现。
直接模式是一种高效节省编码运动矢量比特数的双向预测方法。直接模式的主要思路是使用后向参考帧中相应位置上的块的前向运动矢量做时域上的缩放得到当前块的前向运动矢量和后向运动矢量,因此,只需要在解码端根据当前B帧和前后参考帧之间的时域间隔计算出当前块的前向和后向运动矢量即可,无需在码流中传送任何运动信息,大大节省了编码运动矢量的比特数。如图2所示,MVc是后向参考帧里对应块的前向运动矢量,TRb是当前块到前向参考帧的时域间隔,TRd是前向参考帧和后向参考帧之间的时域间隔。当前块的前向运动矢量MV0和后向运动矢量MV1可以通过以下公式获得:
MV 0 = TR b TR d × MV C , - - - ( 1 )
MV 1 = TR b - TR d TR d × MV C - - - ( 2 )
从上式可以看出,直接模式充分利用了视频序列相邻帧之间的时域相关性很强,物体运动的连贯性比较明显这个特点,巧妙的通过时域间隔缩放得到当前块的前向和后向运动矢量,不仅节省编码运动矢量的开销,而且大量实验证明,直接模式下,运动预测的精确性也非常接近传统的双向预测模式。
然而,由于在以往的标准(H.263和MPEG-2)里,只有I帧和P帧可以做为预测帧的参考帧,I帧使用的是与JPEG2000类似的帧内预测模式,不产生运动矢量;而P帧使用的是前向预测模式,只产生一个前向运动矢量。因此,在现有的B帧直接模式里,包括在最新标准H.264/AVC里,如果后向参考帧是P帧,则只能使用后向参考帧上对应块的前向运动矢量来做时域上的缩放来达到获取当前块前后向运动矢量的目的,在某些场景后向渐进的视频编码中会获得比较理想的编码效果,但在一些场景前向时域相关性比较强的视频编码里,如全景视频编码,则会因为缺失后向运动信息而导致直接模式不可用。再者,如果后向参考帧被编码为I帧,则当前需编码的块所使用的直接模式中的前后运动矢量都被置为零,显然,这也将大大降低直接模式的运动预测精确度。尤其在全景视频B帧编码里,直接模式中的前后运动矢量被置为零的概率更大。这是由于存在这么一种情况,全景视频编码采用的是可分级B帧编码框架。在可分级B帧编码框架中,后向参考帧有可能是B帧,如图1中的B2帧以B1帧为后向参考帧,如果B2帧上对应块使用的是后向预测模式,只产生后向运动矢量,则当前块无法利用对应块有效的前向运动矢量来进行时域缩放。
针对传统的B帧直接模式所存在的问题以及全景视频编码框架的特点,我们有必要对传统的直接模式进行扩展,充分挖掘帧间的时域相关性,利用B帧作为参考帧时候的前后向运动矢量,精细当前块在直接模式下得到的运动矢量。
发明内容
本发明的目的是提供一种提升B帧直接模式预测结果精细度的面向全景视频编码的B帧直接模式。
本发明解决上述技术问题的技术方案是:
面向全景视频编码的B帧扩展直接模式,该模式包含A、B、C三种扩展直接模式:
1.A模式,是在编码块的后向参考帧上的对应块无前向运动矢量可利用的情况下,将向前搜索当前编码块的前向参考帧,如果前向参考帧也是B帧,且在前向参考帧上的对应块有后向运动矢量,则可利用这一后向运动矢量进行直接模式缩放得到当前块的前向和后向运动矢量。
2.B模式,是对A模式的扩展,在A模式下,如果前向参考帧里的对应块也没有后向运动矢量可利用,则向后搜索后向参考帧是否为B帧,如果是B帧,且帧内的对应块有后向运动矢量,则可利用这一后向运动矢量作反向映射,生成前向运动矢量,运用这一映射出来的前向运动矢量进行缩放,得到当前块的前向和后向运动矢量。
3.C模式,是当编码帧最邻近的前后向参考帧里的对应块都没有可利用来进行时域缩放的运动矢量,则向后搜索次后向参考帧中的对应块,如果次后向参考帧中的对应块有前向运动矢量,且这一前向运动矢量指向前向参考帧,则可以通过对这一前向运动矢量进行直接模式的时域缩放,得到当前块的前后向运动矢量。
本发明与现有技术比较的优点是:
目前全景视频编码采用的是可分级B帧编码框架,往往会因为缺失后向运动信息而导致B帧编码里的直接模式不可用。本发明通过利用当前帧的前后参考帧(B帧)里的对应块的后向运动矢量进行时域缩放来得到当前块的前向和后向运动矢量,有效弥补现有技术的不足,可减少预测残差,使得直接模式被选中的概率增大,从而大大节省编码运动矢量的比特数,使得全景视频序的编码性能得到提高。
附图说明
图1是图像组大小为8的分级B帧编码结构示意图。
图2是传统B帧直接模式示意图。
图3是本发明B帧扩展直接A模式示意图。
图4是本发明B帧扩展直接B模式示意图。
图5是本发明B帧扩展直接C模式示意图。
具体实施方式
下面结合具体实施方式对本发明作进一步描述:
针对传统的B帧直接模式所存在的问题以及全景视频编码框架的特点,我们有必要对传统的直接模式进行扩展,充分挖掘帧间的时域相关性,利用B帧做为参考帧时候的前后向运动矢量,精细当前块在直接模式下得到的运动矢量。本发明提出三种B帧扩展直接模式:
A模式:正如前面所提到的,考虑要编码块的后向参考帧上的对应块无前向运动矢量可利用的情况:(1)如果当前块在后向参考帧上的对应块采用的是帧内预测模式(intra);(2)如果当前块的对应块所在的后向参考帧是B帧,且对应块采用单向运动预测模式,只有后向运动矢量。在这两种情况下,将向前搜索当前编码块的前向参考帧,如果前向参考帧也是B帧(如图1所示,在全景视频编码方式下,这种情况的概率是非常大的),且在前向参考帧上的对应块有后向运动矢量,则可利用这一后向运动矢量进行直接模式缩放得到当前块的前向和后向运动矢量,如图3所示。当前块的前向运动矢量MV0和后向运动矢量MV1可通过以下公式得到:
MV 0 = TR c - TR d TR d × MV C - - - ( 3 )
MV 1 = TR c TR d × MV C - - - ( 4 )
这里,MVc是编码块在前向参考帧中的对应块(co-located block)的后向运动矢量,TRd是前后向参考帧之间的时域距离,TRc是当前帧和后向参考帧之间的时域距离。
这一算法思想由于充分考虑和利用了相邻B帧之间的时域相关性(即物体运动连续性),特别是利用了B帧双向预测的特点,使得当前块在分级B帧结构下可利用到的进行直接模式缩放的运动矢量更有可能,从而使得当前块被选为直接模式编码的概率大大增加。
B模式:是对A模式的扩展。在A模式下,如果前向参考帧里的对应块也没有后向运动矢量可利用,则向后搜索后向参考帧是否为B帧,如果是B帧,且帧内的对应块有后向运动矢量(因为前向运动矢量在A模式里已经讨论过,是没有的),则可利用这一后向运动矢量作反向映射,生成前向运动矢量,运用这一映射出来的前向运动矢量进行缩放,得到当前块的前向和后向运动矢量,如图4所示。对应块的映射前向运动矢量MVC可通过以下公式得到:
MV C = TR d TR d ′ × MV C ′ - - - ( 5 )
这里,TRd是前后向参考帧的时域距离,TRd′后向参考帧与次后向参考帧的时域距离。MVC′是对应块的后向运动矢量。
得到了对应块的映射前向运动矢量以后,就可以按传统的直接模式那样参照公式1、公式2对对应块的前向运动矢量进行缩放,得到当前块的前向和后向运动矢量。同理,如果前向参考帧里的对应块只有前向运动矢量的时候,也可以运用这一算法映射出对应块的后向运动矢量,再利用这一后向运动矢量按照模式A里提出的方法进行时域缩放得到当前块的前向和后向运动矢量。
C模式:为了扩大搜索范围,找到更精确的运动匹配,H.264/AVC中引入了多参考帧的概念,就是一幅帧间预测模式的图像可以参考前向(P帧模式下)或者前后向(B帧模式下)若干个参考帧。在全景视频编码的分级B帧结构下,解码后的B帧会有选择的被存储在解码器的缓存中和解码后的I帧、P帧一起作为相邻B帧的参考帧,因此解码器的帧缓存区通常存储不止一帧的重构帧,从而无需对解码器进行任何修改就可以实现多参考帧。在C模式下,当编码帧最邻近的前后向参考帧里的对应块都没有可利用来进行时域缩放的运动矢量,也就是,前后向参考帧中的对应块都是帧内预测模式。则向后搜索次后向参考帧中的对应块,如果次后向参考帧中的对应块有前向运动矢量,且这一前向运动矢量指向前向参考帧,则可以通过对这一前向运动矢量进行直接模式的时域缩放,得到当前块的前后向运动矢量,如图5所示。当前块的前向运动矢量MV0和后向运动矢量MV1可通过以下公式得到:
MV 0 = TR b TR d ′ × MV C - - - ( 6 )
MV 1 = TR b - TR d TR d ′ × MV C - - - ( 7 )
这里,TRb是当前帧与前向参考帧的时域距离;TRd是前后向参考帧之间的时域距离;TRd′是前向参考帧与次后向参考帧之间的时域距离;MVC是次后向参考帧上的对应块指向前向参考帧的前向运动矢量。必须指出的是,这一方法,同样适用于对前向参考帧中的对应块指向次后向参考帧的后向运动矢量进行直接模式的时域缩放,只是前后向运动矢量所缩放的时域距离不同而已。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求内。

Claims (1)

1.面向全景视频编码的B帧扩展直接模式,其特征在于,该模式包含A、B、C三种扩展直接模式:
1)A模式,是在编码块的后向参考帧上的对应块无前向运动矢量可利用的情况下,将向前搜索当前编码块的前向参考帧,如果前向参考帧也是B帧,且在前向参考帧上的对应块有后向运动矢量,则可利用这一后向运动矢量进行直接模式缩放得到当前块的前向和后向运动矢量;
2)B模式,是对A模式的扩展,在A模式下,如果前向参考帧里的对应块也没有后向运动矢量可利用,则向后搜索后向参考帧是否为B帧,如果是B帧,且帧内的对应块有后向运动矢量,则可利用这一后向运动矢量作反向映射,生成前向运动矢量,运用这一映射出来的前向运动矢量进行缩放,得到当前块的前向和后向运动矢量;
3)C模式,是当编码帧最邻近的前后向参考帧里的对应块都没有可利用来进行时域缩放的运动矢量,则向后搜索次后向参考帧中的对应块,如果次后向参考帧中的对应块有前向运动矢量,且这一前向运动矢量指向前向参考帧,则可以通过对这一前向运动矢量进行直接模式的时域缩放,得到当前块的前后向运动矢量。
CN 201010158471 2010-04-28 2010-04-28 面向全景视频编码的b帧扩展直接模式 Pending CN101841712A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010158471 CN101841712A (zh) 2010-04-28 2010-04-28 面向全景视频编码的b帧扩展直接模式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010158471 CN101841712A (zh) 2010-04-28 2010-04-28 面向全景视频编码的b帧扩展直接模式

Publications (1)

Publication Number Publication Date
CN101841712A true CN101841712A (zh) 2010-09-22

Family

ID=42744783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010158471 Pending CN101841712A (zh) 2010-04-28 2010-04-28 面向全景视频编码的b帧扩展直接模式

Country Status (1)

Country Link
CN (1) CN101841712A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595125A (zh) * 2011-01-17 2012-07-18 深圳市融创天下科技股份有限公司 一种p帧双向预测方法
CN102595110A (zh) * 2011-01-10 2012-07-18 华为技术有限公司 视频编码方法、解码方法及终端
CN103024397A (zh) * 2013-01-07 2013-04-03 华为技术有限公司 确定时域运动矢量预测值的方法和装置
CN103583044A (zh) * 2011-01-31 2014-02-12 韩国电子通信研究院 用于使用运动向量来编码/解码图像的方法和设备
WO2017166714A1 (zh) * 2016-03-30 2017-10-05 乐视控股(北京)有限公司 全景图像的拍摄方法、装置及系统
WO2020140243A1 (zh) * 2019-01-03 2020-07-09 北京大学 视频图像处理方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《Proceedings of IEEE International》 20050228 Zheng J L et al. Extended direct mode for hierarchical B picture coding 265-268 1 , 2 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102595110A (zh) * 2011-01-10 2012-07-18 华为技术有限公司 视频编码方法、解码方法及终端
WO2012094944A1 (zh) * 2011-01-10 2012-07-19 华为技术有限公司 视频编码方法、解码方法及终端
CN102595110B (zh) * 2011-01-10 2015-04-29 华为技术有限公司 视频编码方法、解码方法及终端
CN102595125B (zh) * 2011-01-17 2016-04-06 深圳市云宙多媒体技术有限公司 一种p帧双向预测方法及装置
WO2012097552A1 (zh) * 2011-01-17 2012-07-26 深圳市融创天下科技股份有限公司 一种p帧双向预测方法及装置
CN102595125A (zh) * 2011-01-17 2012-07-18 深圳市融创天下科技股份有限公司 一种p帧双向预测方法
CN103583044A (zh) * 2011-01-31 2014-02-12 韩国电子通信研究院 用于使用运动向量来编码/解码图像的方法和设备
US10244252B2 (en) 2011-01-31 2019-03-26 Electronics And Telecommunications Research Institute Method and apparatus for encoding/decoding images using a motion vector
CN103583044B (zh) * 2011-01-31 2018-01-26 韩国电子通信研究院 用于使用运动向量来编码/解码图像的方法和设备
CN103024397A (zh) * 2013-01-07 2013-04-03 华为技术有限公司 确定时域运动矢量预测值的方法和装置
CN103024397B (zh) * 2013-01-07 2015-07-08 华为技术有限公司 确定时域运动矢量预测值的方法和装置
WO2014106388A1 (zh) * 2013-01-07 2014-07-10 华为技术有限公司 确定时域运动矢量预测值的方法和装置
WO2017166714A1 (zh) * 2016-03-30 2017-10-05 乐视控股(北京)有限公司 全景图像的拍摄方法、装置及系统
WO2020140243A1 (zh) * 2019-01-03 2020-07-09 北京大学 视频图像处理方法与装置
US11178420B2 (en) 2019-01-03 2021-11-16 SZ DJI Technology Co., Ltd. Video image processing method and device
US11206422B2 (en) 2019-01-03 2021-12-21 SZ DJI Technology Co., Ltd. Video image processing method and device
US11689736B2 (en) 2019-01-03 2023-06-27 SZ DJI Technology Co., Ltd. Video image processing method and device
US11743482B2 (en) 2019-01-03 2023-08-29 SZ DJI Technology Co., Ltd. Video image processing method and device

Similar Documents

Publication Publication Date Title
CN102934434B (zh) 时间运动矢量预测的方法与装置
US9402087B2 (en) Picture encoding method, picture decoding method, picture encoding apparatus, picture decoding apparatus, picture encoding program, and picture decoding program
KR100725407B1 (ko) 방향적 인트라 잔차 예측에 따라 비디오 신호를 인코딩하고디코딩하는 방법 및 장치
WO2020134969A1 (zh) 一种编解码方法及其设备
CN103188496B (zh) 基于运动矢量分布预测的快速运动估计视频编码方法
CN101841712A (zh) 面向全景视频编码的b帧扩展直接模式
TWI571108B (zh) 動畫像編碼裝置、動畫像解碼裝置、動畫像編碼方法及動畫像解碼方法
CN103297770B (zh) 使用基于深度信息的视差估计的多视点视频编码
TWI739509B (zh) 動態影像預測解碼裝置及動態影像預測解碼方法
CN101867813B (zh) 面向交互式应用的多视点视频编码方法
WO2015010317A1 (zh) 一种基于p帧的多假设运动补偿方法
WO2015010319A1 (zh) 一种基于p帧的多假设运动补偿编码方法
WO2009052697A1 (en) A dual prediction video encoding and decoding method and a device
KR20120080122A (ko) 경쟁 기반의 다시점 비디오 부호화/복호화 장치 및 방법
BRPI0616805A2 (pt) método de codificar um vìdeo multivisual, equipamento para codificar um vìdeo multivisual, meio de gravação legìvel por computador que possui armazenado por sobre ele um programa de computador, método de codificar uma imagem, equipamento que codifica uma imagem
CN102340664B (zh) 用于运动估计的技术
BRPI0904534A2 (pt) método para decodificar vìdeos
CN101562745A (zh) 一种多视点视频图像编码和解码的方法及装置
TWI489876B (zh) A Multi - view Video Coding Method That Can Save Decoding Picture Memory Space
JP2004032355A (ja) 動画像符号化方法,動画像復号方法,動画像符号化装置および動画像復号装置
CN101783956A (zh) 基于时空邻居信息的后向预测方法
CN101511016B (zh) 基于hhi分层b帧预测结构的多视点视频编码的改进方法
CN101262607A (zh) 二重预测视频编解码方法和装置
WO2012090425A1 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム、並びに動画像復号装置、動画像復号方法及び動画像復号プログラム
CN102638685A (zh) 预测运动和纹理数据的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20100922