CN110740331A - 基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法 - Google Patents

基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法 Download PDF

Info

Publication number
CN110740331A
CN110740331A CN201911068591.5A CN201911068591A CN110740331A CN 110740331 A CN110740331 A CN 110740331A CN 201911068591 A CN201911068591 A CN 201911068591A CN 110740331 A CN110740331 A CN 110740331A
Authority
CN
China
Prior art keywords
formula
calculating
pixel
definition
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911068591.5A
Other languages
English (en)
Other versions
CN110740331B (zh
Inventor
宋传鸣
闵新�
何熠辉
王相海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Normal University
Original Assignee
Liaoning Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Normal University filed Critical Liaoning Normal University
Publication of CN110740331A publication Critical patent/CN110740331A/zh
Application granted granted Critical
Publication of CN110740331B publication Critical patent/CN110740331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开一种基于自适应步长和Levenberg‑Marquardt优化的视频弹性运动估计方法,采用Levenberg‑Marquardt优化方法替代Guass‑Newton法来求解弹性运动估计模型,从而避免Guass‑Newton黑塞矩阵出现负定或者病态的情况,保证了迭代优化沿着正确的梯度下降方向进行;为Levenberg‑Marquardt对角矩阵引进了一个自适应加权系数,并提出一种自适应加权系数的正负交替更新策略,进而在保证黑塞矩阵正定的前提下,有效扩大了参数搜索的空间;最后,采用Guass‑Newton法在前两次迭代时的步长因子和预测误差,计算自适应加权系数的上界,并以此上界为约束。

Description

基于自适应步长和Levenberg-Marquardt优化的视频弹性运 动估计方法
技术领域
本发明涉及视频编码压缩领域,尤其是一种运算速度快、运动补偿质量高、搜索空间广、自适应能力强、基于自适应步长和Levenberg-Marquardt优化的弹性运动估计方法。
背景技术
自第一代视频编码标准发展至今,虽然压缩效率不断提高,可是视频编码技术的基本框架至今未发生本质改变,始终是以分块为单位的差分预测+变换的闭环混合结构。在这个框架下,运动估计是一种有效的时间维差分预测技术,被广泛应用于H.261/2/3、MPEG-1/2/4、H.264/AVC和AVS等视频编码标准中,而且多年来视频编码效率的大部分提升均是由于其采用了更为优秀的运动估计算法。然而,运动估计环节所消耗的计算资源往往占编码器全部资源的50%以上,甚至可达80%。因此,运动估计算法的效率是影响视频编码性能的关键技术之一。
虽然平移运动模型在视频编码标准中获得了广泛应用,有助于降低运动估计/补偿的计算复杂度,但是平移模型无法有效预测由物体的旋转、缩放、变形和摄像机运动产生的非刚性复合运动。于是,2010年以来有研究人员提出了一种弹性运动估计模型(ElasticMotion Estimation Model),它可有效克服块平移模型的不足,最初主要广泛用于医学图像配准、物体追踪、图像稳定和运动分析等领域。
目前,关于视频弹性运动估计的研究和技术改进主要集中在以下两个方面:
首先,弹性运动模型与视频编码标准的结合方式。Muhit等人将弹性运动估计引进H.264,依据图像的几何特征,采用不同斜率的线段划分待预测块,获得其三角形或四边形网格表示,从而使弹性模型能更准确地描述复杂形状的运动区域、更好地适应多样的局部运动。Ahmmed等人将弹性运动估计作为HEVC的一种可选模式,通过已解码帧计算弹性运动场,再利用该运动场重建弹性变形后的参考帧,进而根据率失真准则在平移模型和弹性模型之间进行自适应地选择。但是,上述两项技术均简单地使用传统的Guass-Newton法求解弹性运动向量,既未能避免弹性运动估计的高计算量,又无法避免搜索陷入局部最优,这会从根本上影响弹性运动估计的有效性和实用性。
其次,弹性运动向量的优化求解。Haque等人提出了基于1bit深度像素的Guass-Newton迭代法,并进一步将其推广到了2bit深度像素的情况下。尽管这两种算法通过避免黑塞矩阵及其逆矩阵的计算、固定迭代步长的方式实现了较快的运动估计速度,可是由于只采用了2个梯度下降方向,并且低位深像素的梯度往往不同于8bit深度像素,其预测质量与基于8bit深度像素的弹性运动估计尚存在较大差距。Song等人则通过大量实验发现,弹性运动模型的Guass-Newton解法对初始迭代点和迭代步长较为敏感,即固定的初始迭代点和迭代步长无法求解出全局最优解,进而采用2bit深度像素和均匀搜索模板将初始迭代点置于全局最优解的单调区间内,再利用离散余弦变换的低频能量比率和黄金分割法调整迭代步长使之适应目标函数的线性程度,明显提升了弹性运动估计的计算效率和补偿质量。然而,作为一类Newton型优化求解方法,上述技术在本质上仍不可避免Newton型方法存在的不足,也就是说,目标函数偏离线性的程度越大,初始迭代点距离全局最优点越远,Guass-Newton法的收敛速度就越慢,甚至出现远离最优点或不收敛的现象。事实上,视频数据以及运动补偿误差的复杂性,匹配误差曲面往往不会呈现我们期望的理想线性。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种运算速度快、运动补偿质量高、搜索空间广、自适应能力强、基于自适应步长和Levenberg-Marquardt优化的弹性运动估计方法。
本发明的技术解决方案是:一种基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法,其特征在于按照如下步骤进行:
步骤1.输入最大迭代次数Tmax和最小增量阈值Tm,并令λmin←2,λmax←10,δ←1,λ*←λmin,所述λmin表示自适应步长的下界,λmax表示自适应步长的上界,δ表示Levenberg-Marquardt对角矩阵的加权系数,λ*表示自适应步长;
步骤2.若当前图像组(Group of Pictures,GOP)的所有宏块都已处理完毕,则算法结束;否则,从当前图像组中选取一个未处理过的、大小为M×N像素的宏块作为当前宏块I,并令xi、yi分别表示当前宏块中某个像素的横、纵坐标且0≤xi≤M-1,0≤yi≤N-1,其像素值为I(xi,yi);
步骤2.1根据公式⑴的定义,初始化当前宏块的弹性运动模型:
Figure BDA0002260210410000031
所述m表示坐标(xi,yi)处的弹性运动向量,p表示预设的运动向量的分量个数,mk表示m的第k个分量,
Figure BDA00022602104100000314
表示弹性运动的基函数,其定义由公式⑵给出:
且k=su+v+1,u,v=0,1,…,s-1,
Figure BDA0002260210410000033
步骤2.2将弹性运动向量m的所有分量mk置0,所述1≤k≤p;
步骤2.3利用整像素精度的菱形搜索方法,计算当前宏块的平移运动向量m1和mp/2+1,并计算该运动向量的模长的平方||Δm0||2=(m1)2+(mp/2+1)2
步骤2.4令迭代计数器t←1;
步骤3.对于当前宏块中的每个像素(xi,yi),根据弹性运动向量m、公式⑴和公式⑵,在参考帧R中计算与其相匹配的像素坐标g(xi,yi;m),并利用双线性插值方法,计算该匹配像素的值R(g(xi,yi;m)),再将所有匹配像素组成一个与当前宏块相匹配的参考宏块,所述R(·)表示参考帧中位于坐标“·”处的像素值;
步骤4.根据公式⑶的定义,计算弹性运动向量m所对应的初始运动补偿误差e0
步骤5.采用前向差分法,计算参考宏块的像素梯度
Figure BDA0002260210410000035
其中,
Figure BDA0002260210410000036
Figure BDA0002260210410000037
分别表示参考宏块沿着水平方向、竖直方向的偏导数;
步骤6.计算雅克比矩阵
Figure BDA0002260210410000038
其中
Figure BDA0002260210410000039
所述
Figure BDA00022602104100000310
分别表示
Figure BDA00022602104100000311
的第k个分量和第(p/2+k)个分量;
步骤7.计算最速下降方向其中所述
Figure BDA0002260210410000041
表示
Figure BDA0002260210410000042
的第k个分量;
步骤8.计算Guass-Newton黑塞矩阵H,其中
Figure BDA0002260210410000043
a,b∈[1,p],所述T表示向量转置,Ha,b表示矩阵H中第a行、第b列的元素,
Figure BDA0002260210410000044
表示
Figure BDA0002260210410000045
的第a个分量,
Figure BDA0002260210410000046
表示的第b个分量;
步骤9.计算方向向量b,其中
Figure BDA0002260210410000048
所述bk表示b的第k个分量;
步骤10.若t>1,则转入步骤11;否则,计算自适应步长的上界λmax
步骤10.1保留Guass-Newton黑塞矩阵H的对角线元素,而将其余元素清零,得到一个对角矩阵H′,并根据公式⑷的定义,计算其对角元素的绝对值之和S:
Figure BDA0002260210410000049
所述H′i,i表示对角矩阵H′中第i行、第i列的元素;
步骤10.2计算对角矩阵H′的逆矩阵(H′)-1
步骤10.3计算对角矩阵所产生的弹性运动向量的增量Δm=(H′)-1b及其模长的平方||Δm||2
步骤10.4令m′←m+Δm,并将m′代入公式⑴和公式⑵,计算在参考帧中,与当前宏块的每个像素(xi,yi)相匹配的像素坐标,并利用双线性插值方法,计算每个匹配像素的值R(g(xi,yi;m′));
步骤10.5根据公式⑸的定义,计算弹性运动向量m′的运动补偿误差e;
Figure BDA00022602104100000410
步骤10.6根据公式⑹的定义,计算Levenberg-Marquardt对角矩阵的加权系数的上界δmax
Figure BDA0002260210410000051
步骤10.7根据公式⑺的定义,计算自适应步长的上界λmax
Figure BDA0002260210410000052
步骤11.根据公式⑻的定义,计算Levenberg-Marquardt黑塞矩阵HLM
Figure BDA0002260210410000053
步骤12.根据公式⑼的定义,计算第t次迭代后的弹性运动向量的增量Δmt
Figure BDA0002260210410000054
所述
Figure BDA0002260210410000055
表示HLM的逆矩阵;
步骤13.根据公式⑽的定义,更新弹性运动向量m,并将其代入公式⑴和公式⑵,进而计算在参考帧中,与当前宏块的每个像素(xi,yi)相匹配的像素坐标,再利用双线性插值方法,计算每个匹配像素的值R(g(xi,yi;m));
m←m+Δmt
步骤14.根据公式⑾的定义,计算第t次迭代后的运动补偿误差et
步骤15.根据公式⑿的定义,更新自适应步长λ*:
Figure BDA0002260210410000057
所述||Δmt||和||Δmt-1||分别表示第t次迭代和第(t-1)次迭代后,弹性运动向量的增量的模长;
步骤16.若et>et-1,则令δ←-δ×λ*,并转入步骤11;否则,令δ←δ/λ*,t←t+1;
步骤17.若t>Tmax或||Δmt||<Tm,则输出当前宏块的运动向量m,转入步骤2;否则,转入步骤5。
与现有技术相比,本发明的技术特点在于:第一,采用Levenberg-Marquardt优化方法替代Guass-Newton法来求解弹性运动估计模型,能够避免Guass-Newton黑塞矩阵出现负定或者病态的现象及其所导致的求解过程不收敛的问题,从而有利于保证迭代优化沿着正确的梯度下降方向进行;第二,为Levenberg-Marquardt对角矩阵引进了一个自适应加权系数,使得Levenberg-Marquardt优化方法在初始迭代点距离局部极小点较近时,能够表现出类似于Newton法和Guass-Newton法的快速收敛速度,而当初始迭代点距离局部极小点较远时,又能表现出近似于最速下降法和对角线法的优良收敛效率;第三,为自适应加权系数设计了一种基于上、下界的正负交替更新策略,在保证黑塞矩阵正定的前提下,可有效扩大传统Levenberg-Marquardt优化方法的参数搜索空间,进而有利于获得更加准确的弹性运动向量,更有效地逼近全局最优点;第四,自适应加权系数使Levenberg-Marquardt优化方法能够根据运动补偿误差曲面的情况,自适应地计算出恰当的迭代步长,一般只需1~2次迭代就能取得高于块平移全搜索和基于Guass-Newton法的传统弹性运动估计的峰值信噪比。因此,本发明具有运算速度快、运动补偿质量高、搜索空间广、自适应能力强等优点。
具体实施方式
一种供基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法,其特征在于按照如下步骤进行:
步骤1.输入最大迭代次数Tmax和最小增量阈值Tm,并令λmin←2,λmax←10,δ←1,λ*←λmin,所述λmin表示自适应步长的下界,λmax表示自适应步长的上界,δ表示Levenberg-Marquardt对角矩阵的加权系数,λ*表示自适应步长,本实施例中,令Tmax=15,Tm=0.0001;
步骤2.若当前图像组(Group of Pictures,GOP)的所有宏块都已处理完毕,则算法结束;否则,从当前图像组中选取一个未处理过的、大小为M×N像素的宏块作为当前宏块I,并令xi、yi分别表示当前宏块中某个像素的横、纵坐标且0≤xi≤M-1,0≤yi≤N-1,其像素值为I(xi,yi);
步骤2.1根据公式⑴的定义,初始化当前宏块的弹性运动模型:
Figure BDA0002260210410000071
所述m表示坐标(xi,yi)处的弹性运动向量,p表示预设的运动向量的分量个数,mk表示m的第k个分量,
Figure BDA00022602104100000714
表示弹性运动的基函数,其定义由公式⑵给出:
Figure BDA0002260210410000072
且k=su+v+1,u,v=0,1,…,s-1,
Figure BDA0002260210410000073
本实施例中,令p=8;
步骤2.2将弹性运动向量m的所有分量mk置0,所述1≤k≤p;
步骤2.3利用整像素精度的菱形搜索方法,计算当前宏块的平移运动向量m1和mp/2+1,并计算该运动向量的模长的平方||Δm0||2=(m1)2+(mp/2+1)2
步骤2.4令迭代计数器t←1;
步骤3.对于当前宏块中的每个像素(xi,yi),根据弹性运动向量m、公式⑴和公式⑵,在参考帧R中计算与其相匹配的像素坐标g(xi,yi;m),并利用双线性插值方法,计算该匹配像素的值R(g(xi,yi;m)),再将所有匹配像素组成一个与当前宏块相匹配的参考宏块,所述R(·)表示参考帧中位于坐标“·”处的像素值;
步骤4.根据公式⑶的定义,计算弹性运动向量m所对应的初始运动补偿误差e0
Figure BDA0002260210410000074
步骤5.采用前向差分法,计算参考宏块的像素梯度
Figure BDA0002260210410000075
其中,
Figure BDA0002260210410000076
Figure BDA0002260210410000077
分别表示参考宏块沿着水平方向、竖直方向的偏导数;
步骤6.计算雅克比矩阵
Figure BDA0002260210410000078
其中
Figure BDA0002260210410000079
所述
Figure BDA00022602104100000710
分别表示
Figure BDA00022602104100000711
的第k个分量和第(p/2+k)个分量;
步骤7.计算最速下降方向其中
Figure BDA00022602104100000713
所述
Figure BDA0002260210410000081
表示
Figure BDA0002260210410000082
的第k个分量;
步骤8.计算Guass-Newton黑塞矩阵H,其中
Figure BDA0002260210410000083
a,b∈[1,p],所述T表示向量转置,Ha,b表示矩阵H中第a行、第b列的元素,
Figure BDA0002260210410000084
表示
Figure BDA0002260210410000085
的第a个分量,
Figure BDA0002260210410000086
表示
Figure BDA0002260210410000087
的第b个分量;
步骤9.计算方向向量b,其中
Figure BDA0002260210410000088
所述bk表示b的第k个分量;
步骤10.若t>1,则转入步骤11;否则,计算自适应步长的上界λmax
步骤10.1保留Guass-Newton黑塞矩阵H的对角线元素,而将其余元素清零,得到一个对角矩阵H′,并根据公式⑷的定义,计算其对角元素的绝对值之和S:
Figure BDA0002260210410000089
所述H′i,i表示对角矩阵H′中第i行、第i列的元素;
步骤10.2计算对角矩阵H′的逆矩阵(H′)-1
步骤10.3计算对角矩阵所产生的弹性运动向量的增量Δm=(H′)-1b及其模长的平方||Δm||2
步骤10.4令m′←m+Δm,并将m′代入公式⑴和公式⑵,计算在参考帧中,与当前宏块的每个像素(xi,yi)相匹配的像素坐标,并利用双线性插值方法,计算每个匹配像素的值R(g(xi,yi;m′));
步骤10.5根据公式⑸的定义,计算弹性运动向量m′的运动补偿误差e;
Figure BDA00022602104100000810
步骤10.6根据公式⑹的定义,计算Levenberg-Marquardt对角矩阵的加权系数的上界δmax
步骤10.7根据公式⑺的定义,计算自适应步长的上界λmax
Figure BDA0002260210410000092
步骤11.根据公式⑻的定义,计算Levenberg-Marquardt黑塞矩阵HLM
Figure BDA0002260210410000093
步骤12.根据公式⑼的定义,计算第t次迭代后的弹性运动向量的增量Δmt
Figure BDA0002260210410000094
所述
Figure BDA0002260210410000095
表示HLM的逆矩阵;
步骤13.根据公式⑽的定义,更新弹性运动向量m,并将其代入公式⑴和公式⑵,进而计算在参考帧中,与当前宏块的每个像素(xi,yi)相匹配的像素坐标,再利用双线性插值方法,计算每个匹配像素的值R(g(xi,yi;m));
m←m+Δmt
步骤14.根据公式⑾的定义,计算第t次迭代后的运动补偿误差et
Figure BDA0002260210410000096
步骤15.根据公式⑿的定义,更新自适应步长λ*
Figure BDA0002260210410000097
所述||Δmt||和||Δmt-1||分别表示第t次迭代和第(t-1)次迭代后,弹性运动向量的增量的模长;
步骤16.若et>et-1,则令δ←-δ×λ*,并转入步骤11;否则,令δ←δ/λ*,t←t+1;
步骤17.若t>Tmax或||Δmt||<Tm,则输出当前宏块的运动向量m,转入步骤2;否则,转入步骤5。
不同视频测试序列采用本发明实施例、基于块平移模型的全搜索、基于改进Guass-Newton法的弹性运动估计方法得到的平均运动补偿峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)结果如表1。
表1不同运动估计方法的运动补偿PSNR比较
Figure BDA0002260210410000101
从表1可见,对于具有不同空间分辨率、不同纹理复杂度和不同运动量的各个视频序列,本发明的运动补偿质量均优于高于基于块平移模型的全搜索和基于改进Guass-Newton法的弹性运动估计,其平均峰值信噪比分别比二者提高了2.74dB、1.70dB。

Claims (1)

1.一种基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法,其特征在于按如下步骤进行:
步骤1.输入最大迭代次数Tmax和最小增量阈值Tm,并令λmin←2,λmax←10,δ←1,λ*←λmin,所述λmin表示自适应步长的下界,λmax表示自适应步长的上界,δ表示Levenberg-Marquardt对角矩阵的加权系数,λ*表示自适应步长;
步骤2.若当前图像组的所有宏块都已处理完毕,则算法结束;否则,从当前图像组中选取一个未处理过的、大小为M×N像素的宏块作为当前宏块I,并令xi、yi分别表示当前宏块中某个像素的横、纵坐标且0≤xi≤M-1,0≤yi≤N-1,其像素值为I(xi,yi);
步骤2.1根据公式⑴的定义,初始化当前宏块的弹性运动模型:
Figure FDA0002260210400000011
所述m表示坐标(xi,yi)处的弹性运动向量,p表示预设的运动向量的分量个数,mk表示m的第k个分量,
Figure FDA0002260210400000012
表示弹性运动的基函数,其定义由公式⑵给出:
Figure FDA0002260210400000013
且k=su+v+1,u,v=0,1,…,s-1,
Figure FDA0002260210400000014
步骤2.2将弹性运动向量m的所有分量mk置0,所述1≤k≤p;
步骤2.3利用整像素精度的菱形搜索方法,计算当前宏块的平移运动向量m1和mp/2+1,并计算该运动向量的模长的平方||Δm0||2=(m1)2+(mp/2+1)2
步骤2.4令迭代计数器t←1;
步骤3.对于当前宏块中的每个像素(xi,yi),根据弹性运动向量m、公式⑴和公式⑵,在参考帧R中计算与其相匹配的像素坐标g(xi,yi;m),并利用双线性插值方法,计算该匹配像素的值R(g(xi,yi;m)),再将所有匹配像素组成一个与当前宏块相匹配的参考宏块,所述R(·)表示参考帧中位于坐标“·”处的像素值;
步骤4.根据公式⑶的定义,计算弹性运动向量m所对应的初始运动补偿误差e0
Figure FDA0002260210400000021
步骤5.采用前向差分法,计算参考宏块的像素梯度其中,
Figure FDA0002260210400000023
Figure FDA0002260210400000024
分别表示参考宏块沿着水平方向、竖直方向的偏导数;
步骤6.计算雅克比矩阵
Figure FDA0002260210400000025
其中
Figure FDA0002260210400000026
所述
Figure FDA0002260210400000027
分别表示的第k个分量和第(p/2+k)个分量;
步骤7.计算最速下降方向
Figure FDA0002260210400000029
其中
Figure FDA00022602104000000210
所述
Figure FDA00022602104000000211
表示的第k个分量;
步骤8.计算Guass-Newton黑塞矩阵H,其中
Figure FDA00022602104000000213
a,b∈[1,p],所述T表示向量转置,Ha,b表示矩阵H中第a行、第b列的元素,
Figure FDA00022602104000000214
表示
Figure FDA00022602104000000215
的第a个分量,表示
Figure FDA00022602104000000217
的第b个分量;
步骤9.计算方向向量b,其中
Figure FDA00022602104000000218
所述bk表示b的第k个分量;
步骤10.若t>1,则转入步骤11;否则,计算自适应步长的上界λmax
步骤10.1保留Guass-Newton黑塞矩阵H的对角线元素,而将其余元素清零,得到一个对角矩阵H′,并根据公式⑷的定义,计算其对角元素的绝对值之和S:
Figure FDA00022602104000000219
所述H′i,i表示对角矩阵H′中第i行、第i列的元素;
步骤10.2计算对角矩阵H′的逆矩阵(H′)-1
步骤10.3计算对角矩阵所产生的弹性运动向量的增量Δm=(H′)-1b及其模长的平方||Δm||2
步骤10.4令m′←m+Δm,并将m′代入公式⑴和公式⑵,计算在参考帧中,与当前宏块的每个像素(xi,yi)相匹配的像素坐标,并利用双线性插值方法,计算每个匹配像素的值R(g(xi,yi;m′));
步骤10.5根据公式⑸的定义,计算弹性运动向量m′的运动补偿误差e;
步骤10.6根据公式⑹的定义,计算Levenberg-Marquardt对角矩阵的加权系数的上界δmax
Figure FDA0002260210400000032
步骤10.7根据公式⑺的定义,计算自适应步长的上界λmax
Figure FDA0002260210400000033
步骤11.根据公式⑻的定义,计算Levenberg-Marquardt黑塞矩阵HLM
Figure FDA0002260210400000034
步骤12.根据公式⑼的定义,计算第t次迭代后的弹性运动向量的增量Δmt
Figure FDA0002260210400000035
所述
Figure FDA0002260210400000036
表示HLM的逆矩阵;
步骤13.根据公式⑽的定义,更新弹性运动向量m,并将其代入公式⑴和公式⑵,进而计算在参考帧中,与当前宏块的每个像素(xi,yi)相匹配的像素坐标,再利用双线性插值方法,计算每个匹配像素的值R(g(xi,yi;m));
m←m+Δmt
步骤14.根据公式⑾的定义,计算第t次迭代后的运动补偿误差et
步骤15.根据公式⑿的定义,更新自适应步长λ*
所述||Δmt||和||Δmt-1||分别表示第t次迭代和第(t-1)次迭代后,弹性运动向量的增量的模长;
步骤16.若et>et-1,则令δ←-δ×λ*,并转入步骤11;否则,令δ←δ/λ*,t←t+1;
步骤17.若t>Tmax或||Δmt||<Tm,则输出当前宏块的运动向量m,转入步骤2;否则,转入步骤5。
CN201911068591.5A 2019-08-05 2019-11-05 基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法 Active CN110740331B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2019107157020 2019-08-05
CN201910715702 2019-08-05

Publications (2)

Publication Number Publication Date
CN110740331A true CN110740331A (zh) 2020-01-31
CN110740331B CN110740331B (zh) 2023-01-31

Family

ID=69272198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911068591.5A Active CN110740331B (zh) 2019-08-05 2019-11-05 基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法

Country Status (1)

Country Link
CN (1) CN110740331B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598954A (zh) * 2020-04-21 2020-08-28 哈尔滨拓博科技有限公司 一种快速高精度摄像头参数计算方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014181A (en) * 1997-10-13 2000-01-11 Sharp Laboratories Of America, Inc. Adaptive step-size motion estimation based on statistical sum of absolute differences
US20030099295A1 (en) * 2001-10-31 2003-05-29 Infowrap Inc. Method for fast motion estimation using bi-directional and symmetrical gradient schemes
WO2007084475A2 (en) * 2006-01-17 2007-07-26 Thomson Licensing Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
CN102592287A (zh) * 2011-12-31 2012-07-18 浙江大学 基于3d视频的时空域运动分割与估计模型的凸优化方法
CN103957420A (zh) * 2014-04-30 2014-07-30 华南理工大学 一种h.264运动估计编码的全面运动估计改进算法
US20150130953A1 (en) * 2013-11-13 2015-05-14 Mitsubishi Electric Research Laboratories, Inc. Method for Video Background Subtraction Using Factorized Matrix Completion
CN105812818A (zh) * 2016-03-22 2016-07-27 辽宁师范大学 基于改进列文伯格麦夸特优化的弹性运动估计方法
CN105825526A (zh) * 2016-03-22 2016-08-03 辽宁师范大学 基于视频数据3d自相关性的视频多尺度几何分析方法
US20170019653A1 (en) * 2014-04-08 2017-01-19 Sun Yat-Sen University Non-feature extraction-based dense sfm three-dimensional reconstruction method
CN109640097A (zh) * 2018-12-07 2019-04-16 辽宁师范大学 自适应因子的视频仿射运动估计方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6014181A (en) * 1997-10-13 2000-01-11 Sharp Laboratories Of America, Inc. Adaptive step-size motion estimation based on statistical sum of absolute differences
US20030099295A1 (en) * 2001-10-31 2003-05-29 Infowrap Inc. Method for fast motion estimation using bi-directional and symmetrical gradient schemes
WO2007084475A2 (en) * 2006-01-17 2007-07-26 Thomson Licensing Methods and apparatus for low complexity error resilient motion estimation and coding mode selection
CN102592287A (zh) * 2011-12-31 2012-07-18 浙江大学 基于3d视频的时空域运动分割与估计模型的凸优化方法
US20150130953A1 (en) * 2013-11-13 2015-05-14 Mitsubishi Electric Research Laboratories, Inc. Method for Video Background Subtraction Using Factorized Matrix Completion
US20170019653A1 (en) * 2014-04-08 2017-01-19 Sun Yat-Sen University Non-feature extraction-based dense sfm three-dimensional reconstruction method
CN103957420A (zh) * 2014-04-30 2014-07-30 华南理工大学 一种h.264运动估计编码的全面运动估计改进算法
CN105812818A (zh) * 2016-03-22 2016-07-27 辽宁师范大学 基于改进列文伯格麦夸特优化的弹性运动估计方法
CN105825526A (zh) * 2016-03-22 2016-08-03 辽宁师范大学 基于视频数据3d自相关性的视频多尺度几何分析方法
CN109640097A (zh) * 2018-12-07 2019-04-16 辽宁师范大学 自适应因子的视频仿射运动估计方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ABDULLAH A. MUHIT ET AL: "Video Coding Using Elastic Motion Model and Larger Blocks", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 *
COSMIN BERCEA;ANDREAS MAIER;THOMAS KÖHLER: "Confidence-aware Levenberg-Marquardt optimization for joint motion estimation and super-resolution", 《2016 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)》 *
宋传鸣等: "采用改进高斯-牛顿法的视频弹性运动估计", 《软件学报》 *
赵臣臣: "一种基于二维离散余弦模型的运动估计算法研究", 《现代计算机(专业版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598954A (zh) * 2020-04-21 2020-08-28 哈尔滨拓博科技有限公司 一种快速高精度摄像头参数计算方法

Also Published As

Publication number Publication date
CN110740331B (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
JP5674972B2 (ja) 画像符号化装置及び画像復号装置
US8040948B2 (en) Method and system for coding moving image signals, corresponding computer program product
CN1159276A (zh) 用于在一个视频序列中估计运动的方法和系统
CN111918068A (zh) 基于视频序列特征和QP-λ修正的时域率失真优化方法
EP2005759A2 (en) Dynamic selection of motion estimation search ranges and extended motion vector ranges
CN1774070A (zh) 使用自适应模式决策的运动估测方法
US8532409B2 (en) Adaptive motion search range determining apparatus and method
Kim et al. Zoom motion estimation using block-based fast local area scaling
CN109640097B (zh) 自适应因子的视频仿射运动估计方法
Chang et al. A novel approach to fast multi-block motion estimation for H. 264 video coding
US7711049B2 (en) Method for fast macroblock mode decision based on motion cost of variable block size
CN110740331A (zh) 基于自适应步长和Levenberg-Marquardt优化的视频弹性运动估计方法
CN105812818B (zh) 基于改进列文伯格麦夸特优化的弹性运动估计方法
Chang et al. Fast multi-block selection for H. 264 video coding
CN109120940A (zh) 自适应因子的视频缩放运动估计方法
CN108111861B (zh) 基于2bit深度像素的视频弹性运动估计方法
JP2001526850A (ja) 画像符号化器における量子化値の最適化方法及び装置
Zhenyu et al. A new full-pixel and sub-pixel motion vector search algorithm for fast block-matching motion estimation in H. 264
KR100814731B1 (ko) H.264 부호화를 위한 고속 모드 결정 방법
CN113518225B (zh) 6次多项式拟合匹配误差曲面的快速缩放运动估计方法
CN113518224A (zh) 基于双向迭代优化及自适应融合的弹性运动估计方法
CN105611299A (zh) 一种基于hevc的运动估计方法
Wong et al. Fast sub-pixel inter-prediction-based on texture direction analysis (FSIP-BTDA)[video coding applications]
US7684628B2 (en) System and method for non-iterative global motion estimation
CN115190299B (zh) Vvc仿射运动估计快速计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant