CN109640097B - 自适应因子的视频仿射运动估计方法 - Google Patents
自适应因子的视频仿射运动估计方法 Download PDFInfo
- Publication number
- CN109640097B CN109640097B CN201811494317.XA CN201811494317A CN109640097B CN 109640097 B CN109640097 B CN 109640097B CN 201811494317 A CN201811494317 A CN 201811494317A CN 109640097 B CN109640097 B CN 109640097B
- Authority
- CN
- China
- Prior art keywords
- formula
- calculating
- prediction error
- motion vector
- definition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/523—Motion estimation or motion compensation with sub-pixel accuracy
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种自适应因子的视频仿射运动估计方法,采用平移运动矢量所对应的线性加权预测误差和参考帧的2D加权自相关来判别当前待预测宏块的缩放因子;其次,保持缩放因子不变,将仿射运动补偿误差表示为关于旋转角度的二次函数,通过Vieta定理计算出仿射运动下的自适应旋转角度,进而获得当前待预测宏块的仿射运动向量。本发明避免了传统仿射运动估计方法的“暴力”参数搜索或迭代求解,可直接计算得到最优缩放因子和旋转角度,显著减少了仿射运动估计/补偿过程的亚像素插值操作次数,从而在保证实时性的同时,提高传统块匹配运动估计方法的补偿质量。
Description
技术领域
本发明涉及视频编码压缩领域,尤其是一种运算速度快、运动补偿质量高且能有效预测视频中存在的仿射运动的自适应因子的视频仿射运动估计方法。
背景技术
运动估计是一种有效的时间维预测技术,而且多年来视频编码效率的大部分提升均是由于其采用了更为优秀的运动估计算法。然而,运动估计环节所消耗的计算资源往往占编码器全部资源的50%以上,甚至可达80%。为了在复杂度和预测精度之间达到较好的折中,现有视频编码标准普遍采用基于平移模型的块匹配运动估计算法,并陆续提出了多种快速块匹配策略,如基于候选向量下采样的策略、基于像素下采样的策略、基于低复杂度匹配函数的策略、基于低比特深度像素的策略等。但是,平移模型无法有效预测由物体的旋转、缩放、变形和摄像机运动产生的非刚性复合运动。同时,基于块平移模型的运动估计通常不能获得平滑、连续的运动场,往往出现块效应,尤其是在低码率下,影响解码视频的主观质量。在这种情况下,一些研究人员多年来尝试将高阶运动模型引入到运动估计/补偿中来弥补平移运动模型的不足,出现了基于网格模型的运动估计、基于仿射模型的运动估计(如4-参数缩放模型、4-参数混合缩放和旋转模型、6-参数仿射模型、8-参数透视或双线性模型、12-参数投影变换模型)和基于弹性模型的运动估计等。
基于4-参数混合缩放和旋转模型的运动估计是Li等人在2018年提出的一种视频运动估计方法,它将缩放因子与旋转因子统一表示为一个混合因子,可预测由于摄像机与前景物体的相对平移运动和摄像机的推摄、拉摄、摇摄所产生的视频缩放、旋转运动。由平面仿射变换的性质可知,平移、缩放和刚性旋转是平面仿射坐标系下的基本运动形式,并且通过三者的组合可以表示任意的复杂仿射运动。与6-参数仿射模型相比,该4-参数模型的同步信息量减少了33%,收敛性更稳定,计算复杂度也更低。同时,通过在30个标准测试视频序列上进行实验统计,发现有60%以上的宏块能够利用亚像素精度的混合缩放和旋转模型取得较之块平移模型更高的运动补偿质量;高清视频发生缩放运动的平均比例高于标清视频,屏幕内容视频发生旋转运动的平均比例高于自然视频。可见,缩放运动和旋转运动是视频中普遍存在的一种运动形式,而且无法利用基于平移模型的传统块匹配实现准确预测和补偿。故此,若在视频运动估计中引入混合缩放和旋转模型,则可望有效提高其预测精度。
为了获得每个宏块的仿射运动参数,典型方法是在一定尺寸的搜索窗口内以“暴力”搜索的方式计算出2个控制点的最优运动矢量组合,再将所得结果与宏块中各像素的坐标一起,代入4-参数混合缩放和旋转模型即可得到任意像素的预测,但是其运算复杂度是搜索窗口尺寸的4次幂。为此,Huang等人借鉴贪心算法思路,在固定第1个控制点的同时,优化求解第2个控制点的运动矢量,再在固定第2个控制点的情况下计算第1个控制点的运动矢量,如此交替迭代下去,就能以平方阶的计算复杂度得到近似最优解。为进一步降低运动估计的计算量,Li等人提出一种基于梯度的快速仿射运动估计方法,其基本思路是采用Sobel算子计算参考帧的像素梯度,再迭代求解一个以像素坐标和匹配误差为自变量的线性方程组。若运动矢量的增量在某次迭代后小于某预设阈值,即可停止迭代,将结果作为当前宏块的仿射运动矢量。实验表明,该方法一般只需6~8次迭代就能收敛到局部最优解。然而,上述三种方法的求解过程均涉及大量亚像素精度的插值运算,其计算复杂度甚至远高于块平移模型的全搜索,无法实现实时的运动估计/补偿,在很大程度上限制了其实用性。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种运算速度快、运动补偿质量高的自适应因子的视频仿射运动估计方法。
本发明的技术解决方案是:一种自适应因子的视频仿射运动估计方法,其特征在于按照如下步骤进行:
与现有的技术相比,本发明从三个方面提高了运动估计的效率:首先,采用平移运动矢量所对应的线性加权预测误差,以及参考帧的2D加权自相关来判别待预测的当前宏块的缩放因子,进而将预测误差建模为关于旋转角度的一元2次函数,并通过Vieta定理计算出仿射运动下的自适应旋转角度,避免了传统仿射运动估计方法的“暴力”搜索或迭代求解;其次,传统“暴力”搜索或迭代求解过程中需要大量亚像素精度的插值操作,以6~8次迭代为例,就需要6~8轮亚像素插值,而本发明可直接计算得到最优缩放比例和旋转角度,其参数预测过程不需要亚像素插值操作,从而可显著加快运动估计速度,降低计算复杂度;最后,与目前视频编码器广泛采用的基于块平移模型的快速运动估计方法相比,本发明通过引进自适应的缩放因子和旋转因子,可预测由物体旋转、缩放、变形和摄像机运动产生的非刚性仿射运动,有效提高视频运动补偿的质量。因此,本发明具有运算速度快、运动补偿质量高、仿射因子自适应等优点。
具体实施方式
本发明的自适应因子的视频仿射运动估计方法,其特征在于按照如下步骤进行:
不同视频测试序列采用本发明及不同运动估计方法得到的运动补偿峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)结果如表1。
表1 不同运动估计方法的运动补偿PSNR比较(单位:dB)
不同视频测试序列采用本发明及典型运动估计方法所需的计算时间如表2(本实施例的硬件环境为CPU为Intel (R) Core (TM) i7-4790 @3.60GHz双核,内存为16GB,软件环境为Window 10操作系统、Visual C++ 6.0集成开发环境)。
表2 不同运动估计方法的计算时间比较(单位:秒/帧)
实验结果表明,本发明比块匹配全搜索的峰值信噪比平均提高了0.18dB,比块匹配菱形搜索的峰值信噪比平均提高了0.76dB,比快速缩放运动估计方法3D-ZPDS的峰值信噪比平均提高了0.31dB;同时,本发明所需的计算量仅为块匹配全搜索的6.19%,为基于缩放模型的全搜索的0.17%,为基于缩放模型的快速搜索3D-ZPDS的6.12%。
Claims (1)
1.一种自适应因子的视频仿射运动估计方法,其特征在于按如下步骤进行:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811494317.XA CN109640097B (zh) | 2018-12-07 | 2018-12-07 | 自适应因子的视频仿射运动估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811494317.XA CN109640097B (zh) | 2018-12-07 | 2018-12-07 | 自适应因子的视频仿射运动估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109640097A CN109640097A (zh) | 2019-04-16 |
CN109640097B true CN109640097B (zh) | 2021-08-03 |
Family
ID=66071872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811494317.XA Active CN109640097B (zh) | 2018-12-07 | 2018-12-07 | 自适应因子的视频仿射运动估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109640097B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110740331B (zh) * | 2019-08-05 | 2023-01-31 | 辽宁师范大学 | 基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法 |
CN112468815B (zh) * | 2021-01-28 | 2021-06-15 | 浙江智慧视频安防创新中心有限公司 | 视频编解码的方法、装置、电子设备及存储介质 |
CN112449197A (zh) * | 2021-01-28 | 2021-03-05 | 浙江智慧视频安防创新中心有限公司 | 视频编解码的方法、装置、电子设备及存储介质 |
CN113630601B (zh) * | 2021-06-29 | 2024-04-02 | 杭州未名信科科技有限公司 | 一种仿射运动估计方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9438910B1 (en) * | 2014-03-11 | 2016-09-06 | Google Inc. | Affine motion prediction in video coding |
CN108111861A (zh) * | 2017-12-25 | 2018-06-01 | 辽宁师范大学 | 基于2bit深度像素的视频弹性运动估计方法 |
CN108605137A (zh) * | 2016-03-01 | 2018-09-28 | 联发科技股份有限公司 | 利用仿射运动补偿的视频编码方法与装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8170110B2 (en) * | 2009-10-16 | 2012-05-01 | Hong Kong Applied Science and Technology Research Institute Company Limited | Method and apparatus for zoom motion estimation |
-
2018
- 2018-12-07 CN CN201811494317.XA patent/CN109640097B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9438910B1 (en) * | 2014-03-11 | 2016-09-06 | Google Inc. | Affine motion prediction in video coding |
CN108605137A (zh) * | 2016-03-01 | 2018-09-28 | 联发科技股份有限公司 | 利用仿射运动补偿的视频编码方法与装置 |
CN108111861A (zh) * | 2017-12-25 | 2018-06-01 | 辽宁师范大学 | 基于2bit深度像素的视频弹性运动估计方法 |
Non-Patent Citations (3)
Title |
---|
Zoom Motion Estimation Using Block-Based Fast;Hyo-Sung Kim等;《IEEE Transactions on Circuits and Systems for Video Technology》;20120930;第22卷(第9期);全文 * |
基于仿射变换的快速全局运动估计算法;王思珺等;《液晶与显示》;20120430;第27卷(第2期);全文 * |
基于最优位置计算的快速亚像素运动估计;张荩尹等;《计算机学报》;20050930;第28卷(第9期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109640097A (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109640097B (zh) | 自适应因子的视频仿射运动估计方法 | |
CN103503457B (zh) | 图像编码装置、图像解码装置、图像编码方法以及图像解码方法 | |
US8705611B2 (en) | Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program | |
TWI572196B (zh) | 用於次世代視訊編碼之投射式內插預測產生之技術 | |
US9451255B2 (en) | Image encoding apparatus, image encoding method, image decoding apparatus, and image decoding method | |
JP5281891B2 (ja) | 適応的な動き検索範囲 | |
CN103119945B (zh) | 通过帧内预测来对图像进行编码和解码的方法和设备 | |
US9319708B2 (en) | Systems and methods of improved motion estimation using a graphics processing unit | |
US11336915B2 (en) | Global motion vector video encoding systems and methods | |
US20080031325A1 (en) | Mesh-based video compression with domain transformation | |
CN105847791A (zh) | 图像编码装置及其方法和图像解码装置及其方法 | |
CN109120940B (zh) | 自适应因子的视频缩放运动估计方法 | |
WO2012086829A1 (ja) | 動き推定装置、動き推定方法、動き推定プログラム、および動画像符号化装置 | |
CN103957420B (zh) | 一种h.264运动估计编码的全面运动估计改进算法 | |
US11006143B2 (en) | Motion vector candidate pruning systems and methods | |
CN113994692A (zh) | 用于利用光流的预测细化的方法和装置 | |
Fan et al. | Multidirectional parabolic prediction-based interpolation-free sub-pixel motion estimation | |
CN105812818B (zh) | 基于改进列文伯格麦夸特优化的弹性运动估计方法 | |
JP3670566B2 (ja) | 処理時間適応画像符号化方法およびそのプログラムの記録媒体 | |
CN114979631A (zh) | 用于利用光流的预测细化、双向光流和解码器侧运动矢量细化的方法和装置 | |
CN112385232B (zh) | 用于双向帧内预测的参考像素插值方法和装置 | |
Song et al. | Fast CU Partition for VVC Intra-Frame Coding via Texture Complexity | |
CN108111861B (zh) | 基于2bit深度像素的视频弹性运动估计方法 | |
CN105611299A (zh) | 一种基于hevc的运动估计方法 | |
Toivonen et al. | Efficient method for half-pixel block motion estimation using block differentials |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |