CN110062243B - 一种基于近邻优化的光场视频运动估计方法 - Google Patents

一种基于近邻优化的光场视频运动估计方法 Download PDF

Info

Publication number
CN110062243B
CN110062243B CN201910330519.9A CN201910330519A CN110062243B CN 110062243 B CN110062243 B CN 110062243B CN 201910330519 A CN201910330519 A CN 201910330519A CN 110062243 B CN110062243 B CN 110062243B
Authority
CN
China
Prior art keywords
neighbor
block
pixel
light field
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910330519.9A
Other languages
English (en)
Other versions
CN110062243A (zh
Inventor
金欣
李羚俊
戴琼海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201910330519.9A priority Critical patent/CN110062243B/zh
Publication of CN110062243A publication Critical patent/CN110062243A/zh
Application granted granted Critical
Publication of CN110062243B publication Critical patent/CN110062243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于近邻优化的光场视频运动估计方法,包括S1、分别计算K1个空域和K2个时域相对于宏像素的当前预测块的近邻同位块;S2、分别对K1个空域近邻同位块和K2个时域近邻同位块按照预定义的优先级进行可用性判断,并选出M个可用的近邻同位块作为参考块;S3、分别对M个参考块的运动向量进行基于近邻宏像素位置约束下的校正,得到M个候选运动向量预测量;S4、采用代价模型分别计算M个候选运动向量预测量导出的候选参考块与当前编码块的代价,将代价最小的候选运动向量预测量作为最终的运动向量预测量进行运动搜索,完成运动估计。本发明可以为整个压缩过程节省更多的码流,提高了光场视频的压缩率。

Description

一种基于近邻优化的光场视频运动估计方法
技术领域
本发明涉及计算机视觉与数字图像处理领域,具体涉及一种基于近邻优化的光场视频运动估计方法。
背景技术
近年来,光场相机所捕获的光场视频在VR/AR内容生成、6-DoF视频、三维重建等计算机视觉领域展现出了极大的应用前景,引发了人们的广泛关注。 MPEG为此开展了光场视频压缩标准的创立工作。光场视频,其每一帧都是一副光场图像,在记录了光线角度和位置信息的同时还记录了这些信息随时间的变化,具有超高分辨率和特殊的像素分布,这使得相对于传统设备采集的视频,光场视频数据量急剧增大。数据量的激增给光场视频的存储和传输带来了巨大压力,对现有解码算法和编解码软硬件架构提出了巨大挑战,也制约了光场相机的发展和应用。因此,研究针对光场视频数据的编码技术,寻找针对光场视频数据高效的压缩方法成为由平面多媒体迈向立体影像时代急需且必须的核心技术。
目前,针对光场视频利用帧间预测技术的直接压缩方法还十分稀少,压缩效率还不够高;而用传统的视频压缩方法也能对光场视频进行压缩,但压缩率十分有限;如HEVC(High Efficiency Video Coding)自身的帧间预测方法能够处理光场视频,达到一定的压缩效果。但是由于光场视频的数据量较普通视频急剧上升,将光场视频作为传统视频进行压缩,将带来巨大计算复杂度。虽然使用HEVC的全搜索算法能提供较高的压缩效率,但其计算复杂度是难以接受的;而其中的快速搜索方法虽然能够大幅降低计算复杂度,但是压缩效率还有一定提升空间。目前利用帧间预测对光场视频进行直接压缩的方法中,统一存在的缺陷是:由于图像中宏像素结构和编码器架构不匹配导致宏像素间的相关性未能充分利用,进而影响了编码效率。
以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日前已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
为提升光场视频的编码压缩效率,同时降低编解码两端的计算复杂度,本发明提出了一种基于近邻优化的光场视频运动估计方法,基于光场数据中宏像素之间的运动相关性的统计和分析,选取具有较高运动相关性的块作为参考块进行运动预测,从而提高了运动预测和运动估计的准确度,节省了运动信息的码率,有效降低计算复杂度,实现编码效率的有效提升。
本发明为达上述目的所提供的技术方案如下:
一种基于近邻优化的光场视频运动估计方法,包括以下步骤S1至S4:
S1、分别计算K1个空域和K2个时域相对于宏像素的当前预测块的近邻同位块;
S2、分别对K1个空域近邻同位块和K2个时域近邻同位块按照预定义的优先级进行可用性判断,并选出M个可用的近邻同位块作为参考块;
S3、分别对M个参考块的运动向量进行基于近邻宏像素位置约束下的校正,得到M个候选运动向量预测量;
S4、采用代价模型分别计算M个候选运动向量预测量导出的候选参考块与当前编码块的代价,将代价最小的候选运动向量预测量作为最终的运动向量预测量进行运动搜索,完成运动估计。
本发明提供的上述技术方案与现有技术相比,至少具有以下有益效果:
1)基于相邻宏像素之间具有运动相关性的特征,选取相关性较高的近邻同位块作为运动预测的参考块,以使当前编码块与参考块之间的宏像素相互匹配,从而确定较为准确的运动搜索范围,提高预测的准确性;
2)对参考块的运动向量进行基于宏像素约束下的位置校正,使得每个候选运动向量预测量导出的候选参考块与当前编码块之间的宏像素相互匹配,提高候选参考块与当前编码块的相关性,有效降低了运动信息的码率开销;
3)采用代价模型从多个候选运动向量预测量选取代价最小的候选运动向量预测量最为最终运动向量预测量,最后用该运动向量预测量进行运动搜索完成整个运动估计过程。在此基础上,最终可以根据HEVC自身的框架完成整个光场视频的压缩过程。
总之,采用本发明提供的上述运动估计方法,可以为整个压缩过程节省更多的码流,提高了光场视频的压缩率。
附图说明
图1是本发明提出的基于近邻优化的光场视频运动估计方法流程图;
图2-1是一种示例性块尺寸下的空域近邻同位块位置选取示意图;
图2-2是一种示例性块尺寸下的时域近邻同位块位置选取示意图;
图3是其中一种示例性块尺寸下的基于宏像素的位置校正示意图。
具体实施方式
下面结合附图和具体的实施方式对本发明作进一步说明。
本发明的具体实施方式提供了一种基于近邻优化的光场视频运动估计方法,用于在对光场视频进行压缩编码的过程中进行运动估计。本发明的方法适用于大多数视频编码软件,在后述的说明中以应用于HM16.15软件中为例。应当理解的是,编码软件的类型和版本不对本发明的保护范围构成限制。
参考图1,本发明的光场视频运动估计方法包括步骤S1至S4:
步骤S1、分别计算K1个空域和K2个时域相对于宏像素的当前预测块的近邻同位块。块的左上角像素坐标就代表块的坐标,因此,计算出空域、时域近邻同位块的左上角像素的坐标,即得到了空域、时域近邻同位块的坐标(位置)。
具体的计算过程如下:
(xR1,yR1)=(xP+p·w+offset,yP+q·h) (1)
(xR2,yR2)=(xP,yP)+v (2)
其中,(xR1,yR1)为空域近邻同位块的左上角像素的坐标,代表了空域近邻同位块的位置;(xR2,yR2)为时域近邻同位块的左上角像素的坐标,代表了时域近邻同位块的位置;(xP,yP)是当前编码块的参考像素坐标;h是水平相邻宏像素间的水平中心点距离,w是竖直相邻宏像素间的竖直中心点距离;offset是竖直相邻的宏像素间的水平中心点距离;p、q为整数,分别表示相对于当前编码块的基于宏像素间距的近邻同位块的水平偏移量和竖直偏移量;v是当前帧与参考帧之间的近邻宏像素间中心点偏移量。
下面通过具体的例子来说明步骤S1。如图2-1所示为一种示例性块尺寸下的五个空域近邻同位块位置选取示意图,图2-2为一种示例性块尺寸下的两个时域近邻同位块选取示意;五个空域相对于宏像素的当前预测单元的近邻同位块为A0、A1、B0、B1、B2,两个时域相对于宏像素的当前预测单元的近邻同位块为C1、H0
如图2-1所示,以P0左上角的像素坐标
Figure BDA0002037544500000041
为参考像素坐标,可以计算得到A0、A1左上角像素坐标,公式如下:
Figure BDA0002037544500000042
Figure BDA0002037544500000043
Figure BDA0002037544500000044
为A0左上角像素坐标,即代表了空域近邻同位块A0的位置;
Figure BDA0002037544500000045
为 A1左上角像素坐标,即代表了空域近邻同位块A1的位置。
继续参考图2-1,同理,以P1和P2左上角的像素为参考可计算得到B0、 B1、B2左上角的像素坐标,公式如下:
Figure BDA0002037544500000046
Figure BDA0002037544500000047
Figure BDA0002037544500000048
Figure BDA0002037544500000049
为B0左上角像素坐标,即代表了空域近邻同位块B0的位置;
Figure BDA00020375445000000410
为 B1左上角像素坐标,即代表了空域近邻同位块B1的位置;
Figure BDA00020375445000000411
为B2左上角像素坐标,即代表了空域近邻同位块B2的位置。
如图2-2所示,以P0'和P1'左上角的像素为参考可计算得到H0、C1左上角的像素位置,公式如下:
Figure BDA00020375445000000412
Figure BDA00020375445000000413
Figure BDA00020375445000000414
为H0左上角像素坐标,即代表了时域近邻同位块H0的位置;
Figure BDA00020375445000000415
为C1左上角像素坐标,即代表了时域近邻同位块C1的位置。
步骤S2、分别对K1个空域近邻同位块和K2个时域近邻同位块按照预定义的优先级进行可用性判断,并从可用的空域近邻同位块和时域近邻同位块中选出M个近邻同位块作为参考块,即得到M个参考块。
在一种具体的实施例中,可用性判断,是判断空域、时域近邻同位块是否同时满足下述三个条件:
条件1、该近邻同位块在图像边界以内;根据坐标即可判断是否在图像边界内;
条件2、该近邻同位块已经重建;
条件3、该近邻同位块在编码时使用了帧间预测模式。满足这三个条件的近邻同位块则为可用的近邻同位块,然后可以根据一定的优先级,从可用的近邻同位块中选出M个同位块作为参考块,记从可用的空域和时域近邻同位块中选出的参考块为Mi,i=1,2,…,M。优先级可以自定义,本发明对此不做限制。
比如,在前述的示例性方案中,按照A0,A1的优先级,判断可用性并从中选出一个可用同位块M1;按照B0,B1,B2的优先级,判断可用性并从中选出一个可用同位块M2;若M1或M2不存在,则按照H0,C1的优先级,判断可用性,从中选出一个可用同位块M3
步骤S3、分别对M个参考块的运动向量进行基于近邻宏像素位置约束下的校正,得到M个候选运动向量预测量。如图3所示,MVP表示参考块的运动向量,rMVP表示候选运动向量预测量。所述校正使得参考块左上角的像素与当前编码块在参考帧的近邻同位块左上角像素的位置相对于宏像素一致。校正的公式如下:
Figure BDA0002037544500000051
其中,(x,y)和(x',y')分别表示校正后和校正前的运动向量预测量;(xi,yi)表示(x',y')近邻的第i个宏像素同位块的坐标。
步骤S4、采用代价模型分别计算M个候选运动向量预测量导出的候选参考块与当前编码块的代价,将代价最小的候选运动向量预测量作为最终的运动向量预测量进行运动搜索,完成运动估计。其中,采用代价模型分别计算M个候选运动向量预测量导出的候选参考块与当前编码块的代价的具体过程属于公知技术,在此不再赘述。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定
本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (5)

1.一种基于近邻优化的光场视频运动估计方法,其特征在于,包括以下步骤S1至S4:
S1、分别计算K1个空域和K2个时域相对于宏像素的当前预测块的近邻同位块;
S2、分别对K1个空域近邻同位块和K2个时域近邻同位块按照预定义的优先级进行可用性判断,并选出M个可用的近邻同位块作为参考块;其中,所述可用性判断的标准是判断近邻同位块是否同时满足如下三个条件,若满足则为可用:条件1、该近邻同位块在图像边界以内;条件2、该近邻同位块已经重建;条件3、该近邻同位块在编码时使用了帧间预测模式;
S3、分别对M个参考块的运动向量进行基于近邻宏像素位置约束下的校正,得到M个候选运动向量预测量;所述校正使得参考块左上角的像素与当前编码块在参考帧的近邻同位块左上角像素的位置相对于宏像素一致,校正的公式如下:
Figure FDA0002638982620000011
其中,(x,y)和(x',y')分别表示校正后和校正前的运动向量预测量;(xi,yi)表示(x',y')近邻的第i个宏像素同位块的坐标;
S4、采用代价模型分别计算M个候选运动向量预测量导出的候选参考块与当前编码块的代价,将代价最小的候选运动向量预测量作为最终的运动向量预测量进行运动搜索,完成运动估计。
2.如权利要求1所述的基于近邻优化的光场视频运动估计方法,其特征在于,步骤S1中通过计算近邻同位块左上角像素坐标而得到近邻同位块的坐标。
3.如权利要求2所述的基于近邻优化的光场视频运动估计方法,其特征在于,采用如下公式计算空域近邻同位块左上角像素坐标(xR1,yR1):
(xR1,yR1)=(xP+p·w+offset,yP+q·h)
其中,(xP,yP)是当前编码块的参考像素坐标;h是水平相邻宏像素间的水平中心点距离,w是竖直相邻宏像素间的竖直中心点距离;offset是竖直相邻的宏像素间的水平中心点距离;p、q为整数,分别表示相对于当前编码块的基于宏像素间距的近邻同位块的水平偏移量和竖直偏移量。
4.如权利要求2所述的基于近邻优化的光场视频运动估计方法,其特征在于,采用如下公式计算时域近邻同位块左上角像素坐标(xR2,yR2):
(xR2,yR2)=(xP,yP)+v
其中,(xP,yP)是当前编码块的参考像素坐标,v是当前帧与参考帧之间的近邻宏像素间中心点偏移量。
5.如权利要求2所述的基于近邻优化的光场视频运动估计方法,其特征在于,根据步骤S1计算出的近邻同位块坐标判断近邻同位块是否在图像边界以内。
CN201910330519.9A 2019-04-23 2019-04-23 一种基于近邻优化的光场视频运动估计方法 Active CN110062243B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910330519.9A CN110062243B (zh) 2019-04-23 2019-04-23 一种基于近邻优化的光场视频运动估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910330519.9A CN110062243B (zh) 2019-04-23 2019-04-23 一种基于近邻优化的光场视频运动估计方法

Publications (2)

Publication Number Publication Date
CN110062243A CN110062243A (zh) 2019-07-26
CN110062243B true CN110062243B (zh) 2020-12-11

Family

ID=67320330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910330519.9A Active CN110062243B (zh) 2019-04-23 2019-04-23 一种基于近邻优化的光场视频运动估计方法

Country Status (1)

Country Link
CN (1) CN110062243B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8254439B2 (en) * 2009-05-08 2012-08-28 Mediatek Inc. Apparatus and methods for motion vector correction
GB2525851B (en) * 2014-04-30 2017-03-29 Canon Kk Method and device for encoding a sub-aperture image of a set of sub-aperture images obtained from a plenoptic image
CN107483936B (zh) * 2017-08-01 2019-09-06 清华大学深圳研究生院 一种基于宏像素的光场视频帧间预测方法

Also Published As

Publication number Publication date
CN110062243A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
US20200244986A1 (en) Picture prediction method and related apparatus
TWI729422B (zh) 色彩分量間的子區塊移動向量繼承
WO2017005146A1 (zh) 视频编码和解码方法、视频编码和解码装置
JP6490203B2 (ja) 画像予測方法および関連装置
EP3197165B1 (en) Image prediction method and relevant device
CN103891290B (zh) 运动矢量处理
TW201931854A (zh) 統一合併候選列表運用
US9736498B2 (en) Method and apparatus of disparity vector derivation and inter-view motion vector prediction for 3D video coding
CN107852500B (zh) 运动矢量场编码方法和解码方法、编码和解码装置
CN101610417B (zh) 一种图像填充方法、装置及设备
CN106105191A (zh) 用于处理多视图视频信号的方法和装置
US9883200B2 (en) Method of acquiring neighboring disparity vectors for multi-texture and multi-depth video
CN104412597A (zh) 用于3d视频编码的统一视差矢量推导的方法及装置
CN102291581B (zh) 支持帧场自适应运动估计的实现方法
CN108419082B (zh) 一种运动估计方法及装置
WO2012043541A1 (ja) 予測ベクトル生成方法、画像符号化方法、画像復号方法、予測ベクトル生成装置、画像符号化装置、画像復号装置、予測ベクトル生成プログラム、画像符号化プログラムおよび画像復号プログラム
JP2010504010A (ja) ビデオシーケンスにおけるデータ圧縮方法
CN111448800A (zh) 在图像编码系统中使用仿射mvp候选列表的基于仿射运动预测的图像解码方法及设备
TW201230820A (en) Predictive image coding device, predictive image coding method, predictive image coding program, predictive image decoding device, predictive image decoding method, and predictive image decoding program
WO2021232979A1 (zh) 视频编解码中的位移矢量预测方法、装置及设备
CN108449599B (zh) 一种基于面透射变换的视频编码与解码方法
US20240137553A1 (en) Temporal motion vector predictor candidate-based image or video coding of subblock unit
JP4669517B2 (ja) 動き推定の実現方法
CN110062243B (zh) 一种基于近邻优化的光场视频运动估计方法
WO2021031225A1 (zh) 一种运动矢量导出方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant