CN103559722A - 基于灰度线性建模的序列图像抖动量计算方法 - Google Patents

基于灰度线性建模的序列图像抖动量计算方法 Download PDF

Info

Publication number
CN103559722A
CN103559722A CN201310601345.8A CN201310601345A CN103559722A CN 103559722 A CN103559722 A CN 103559722A CN 201310601345 A CN201310601345 A CN 201310601345A CN 103559722 A CN103559722 A CN 103559722A
Authority
CN
China
Prior art keywords
mrow
msub
mover
msubsup
munder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310601345.8A
Other languages
English (en)
Other versions
CN103559722B (zh
Inventor
侯晴宇
张慧莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hit Robot Group Co ltd
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201310601345.8A priority Critical patent/CN103559722B/zh
Publication of CN103559722A publication Critical patent/CN103559722A/zh
Application granted granted Critical
Publication of CN103559722B publication Critical patent/CN103559722B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Abstract

基于灰度线性建模的序列图像抖动量计算方法,属于图像处理技术领域。所述方法为:步骤1:对输入序列图像进行参考帧和待配准帧选定;步骤2:在参考帧内搜索梯度最大块;步骤3:对步骤2中梯度最大块的像素灰度进行线性建模;步骤4:根据待配准帧各像素点灰度值以及所建线性模型计算待配准帧相对参考帧的抖动量。本发明利用自然场景所具备的灰度值相关的特性,提出了一种基于灰度线性建模的序列图像抖动量计算方法。通过对背景进行线性建模,再利用待配准帧中各像素的灰度值,可以直接计算得到待配准帧相对参考帧的抖动量,抖动量的估计精度可达到0.1个像素。

Description

基于灰度线性建模的序列图像抖动量计算方法
技术领域
本发明属于图像处理技术领域,涉及一种序列图像抖动量计算方法,具体涉及一种基于灰度线性建模的序列图像抖动量计算方法,适用于监视图像的抖动量计算以及动平台下序列图像的配准量计算。
背景技术
图像配准作为图像分析中一项重要的预处理技术,广泛地应用于图像融合、高分辨率重建、计算机视觉以及目标识别等领域。
目前图像配准的算法有很多,主要有基于灰度相关的配准算法和基于特征相关的配准算法,可分别在频域或空域进行。对于红外遥感云图,在空间分布上具有一定的相关性,这将导致基于特征的配准算法配准效果不佳,因此考虑利用灰度信息对图像进行配准。
现有的基于灰度的配准算法一般流程是预先给出搜索空间,确定搜索策略,再利用某种相似性度量函数来确定抖动量,各种算法的区别主要表现在不同的搜索策略和相似性度函数上,然而搜索空间的大小通常制约着最大抖动量的幅值和计算复杂度,而且抖动量的计算结果为像素大小的整数倍,无法实现更精确的抖动量估计。
发明内容
本发明的目的在于针对现有序列图像抖动量计算算法的不足,提出一种基于灰度线性建模的序列图像抖动量计算方法,通过对背景灰度线性建模,可以实现抖动量的直接计算,并且可以实现亚像素级的抖动估计。
本发明的基于灰度线性建模的序列图像抖动量计算方法,包括以下步骤:
步骤1:对输入序列图像进行参考帧和待配准帧选定;
步骤2:在参考帧内搜索梯度最大块;
步骤3:对步骤2中梯度最大块的像素灰度进行线性建模;
步骤4:根据待配准帧各像素点灰度值以及所建线性模型计算待配准帧相对参考帧的抖动量。
所述步骤1中,可认为存在抖动的序列图像中的第1帧图像为参考帧,其余帧相对参考帧存在抖动,为待配准帧。
所述步骤2中,梯度最大块的定义为:计算参考帧图像的梯度图像,将大于图像梯度最大值4/5的梯度对应的像素逻辑值标记为1,否则标记为0,形成的图像称为逻辑值图像。然后选择适当大小的窗口在逻辑值图像滑动,含1最多的窗口对应的块称为梯度最大块。
通过比较滑动窗口中的最大值来确定梯度最大块的位置。
所述步骤3中,对步骤2中梯度最大块对应的参考帧图像块B0进行灰度线性建模的过程如下:
步骤3-1,对于(i,j)位置的像素(1≤i≤p,1≤j≤q),利用下式对该像素的灰度值建模:
B ~ 0 ( i + k , j + m ) = a ij + g ij · m + h ij · k ;
其中,{(k,m)=(0,0),(0,-1),(0,+1),(-1,0),(+1,0)},(aij,gij,hij)为对每个像素建立的模型的三个参数。
步骤3-2,通过下式利用最小二乘法计算每个像素模型的三个参数aij,gij,hij的估计值
Figure BDA0000421107790000022
( a ^ ij , g ^ ij , h ^ ij ) = arg min a ij , g ij , h ij Σ k , m [ B 0 ( i + k , j + m ) - B ~ 0 ( i + k , j + m ) ] 2 = arg min a ij , g ij , h ij Σ k , m [ B 0 ( i + k , j + m ) - ( a ij + g ij · m + h ij · k ) ] 2 ;
其中B0(i+k,j+m)表示(i+k,j+m)位置处的像素灰度值。
所述步骤4中,根据待配准帧各像素灰度值以及所建线性模型计算抖动量的过程为:
步骤4-1,B0在参考帧图像中的位置由步骤2已知,将在其余序列帧图像中同样位置处的图像块记为Bn(n为帧序数,n=1,2,...N)。
步骤4-2,假设Bn相对于B0在x,y方向的抖动量分别为
Figure BDA0000421107790000031
那么
Figure BDA0000421107790000032
的估计值由下式计算得到:
( δ ^ x n , δ ^ y n ) = arg min ( δ x n , δ y n ) Σ i = 1 p Σ j = 1 q [ B n ( i , j ) - ( a ^ ij + g ^ ij δ y n + h ^ ij δ x n ) ] ; 2
Bn(i,j)-Bn中位于(i,j)位置的像素灰度值。
本发明对比已有配准算法,具有以下创新点:
利用自然场景所具备的灰度值相关的特性,提出了一种基于灰度线性建模的序列图像抖动量计算方法。通过对背景进行线性建模,再利用待配准帧中各像素的灰度值,可以直接计算得到待配准帧相对参考帧的抖动量,抖动量的估计精度可达到0.1个像素。
附图说明
图1为抖动量计算方法的整体框架;
图2为参考帧图像;
图3为梯度最大块图像;
图4为对于某两个像素的线性建模结果;
图5为序列图像亚像素抖动估计之x方向真实抖动量与计算抖动量对比图;
图6为序列图像亚像素抖动估计之y方向真实抖动量与计算抖动量对比图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围中。
如图1所示,本发明提出一种基于灰度线性建模的序列图像抖动量计算方法,适用于多帧图像的配准,其具体实施步骤如下:
步骤一:对输入序列图像进行参考帧和待配准帧选定。
针对凝视探测器拍摄的512×512大小的50帧图像序列,选择第1帧为参考帧(如图2所示),其余帧为待配准帧。
步骤二:在参考帧内搜索梯度最大块。
计算参考帧图像的梯度图像,将大于图像梯度最大值4/5的梯度对应的像素逻辑值标记为1,否则标记为0。然后选择100×100(p=100,q=100)大小的窗口在逻辑值图像滑动,含1最多的窗口对应的块确定为梯度最大块,搜索结果如图3所示。记录梯度最大块的左上角坐标。
步骤三:对步骤二中梯度最大块的像素灰度进行线性建模(图4)。
梯度最大块对应的参考帧图像块为B0,对于该图像中(i,j)位置的像素(1≤i≤100,1≤j≤100),利用下式对该像素的灰度值建模:
B ~ 0 ( i + k , j + m ) = a ij + g ij · m + h ij · k ;
其中,{(k,m)=(0,0),(0,-1),(0,+1),(-1,0),(+1,0)},为对每个像素建立的模型的三个参数。
通过下式计算每个像素模型的三个参数aijxgij,hij的估计值
a ^ ij , g ^ ij , h ^ ij : ( a ^ ij , g ^ ij , h ^ ij ) = arg min a ij , g ij , h ij Σ k , m [ B 0 ( i + k , j + m ) - B ~ 0 ( i + k , j + m ) ] 2 = arg min a ij , g ij , h ij Σ k , m [ B 0 ( i + k , j + m ) - ( a ij + g ij · m + h ij · k ) ] 2 ;
其中B0(i+k,j+m)表示(i+k,j+m)位置处的像素灰度值。
这个问题可以利用最小二乘法计算,计算过程如下:
f = Σ k , m [ B 0 ( i + k , j + m ) - ( a ij + g ij · m + h ij · k ) ] 2 ,
求解f最小时的aij,gij,hij,分别对aij,gij,hij求偏导,并令之为零,得:
∂ f ∂ a ij = Σ k , m 2 · [ B 0 ( i + k , j + m ) - ( a ij + g ij m + h ij k ) ] · ( - 1 ) = 0 ∂ f ∂ g ij = Σ k , m 2 · [ B 0 ( i + k , j + m ) - ( a ij + g ij m + h ij k ) ] · ( - m ) = 0 ∂ f ∂ h ij = Σ k , m 2 · [ B 0 ( i + k , j + m ) - ( a ij + g ij m + h ij k ) ] · ( - k ) = 0 ,
整理可以得:
Σ k , m B 0 ( i + k , j + m ) Σ k , m m · B 0 ( i + k , j + m ) Σ k , m k · B 0 ( i + k , j + m ) = Σ K , M 1 Σ K , M m Σ k , m k Σ k , m m Σ k , m m 2 Σ k , m k · m Σ k , m k Σ k , m k · m Σ k , m k 2 a ij g ij h ij = A · a ij h ij h ij ,
其中, A = 5 0 0 0 2 0 0 2 0 ,
a ij g ij h ij = A - 1 · Σ k , m B 0 ( i + k , j + m ) Σ k , m m · B 0 ( i + k , j + m ) Σ k , m k · B 0 ( i + k , j + m ) .
图4给出了梯度最大块中的两个像素(20,60)及(70,25)的灰度线性建模结果,其中像素灰度最小值为0,最大值为1。
步骤四:根据待配准帧中各像素点灰度值以及所建背景模型计算抖动量(图5-6)。
B0在参考帧图像中的位置由步骤2已知,将在其余序列帧图像中同样位置处的图像块记为Bn(n=1,2,...49)。假设Bn相对于B0在x,y方向的抖动量分别为
Figure BDA0000421107790000054
那么
Figure BDA0000421107790000055
的估计值由下式计算得到:
( δ ^ x n , δ ^ y n ) = arg min ( δ x n , δ y n ) Σ i = 1 p Σ j = 1 q [ B n ( i , j ) - ( a ^ ij + g ^ ij δ y n + h ^ ij δ x n ) ] 2
Bn(i,j)-Bn中位于(i,j)位置的像素灰度值;
利用最小二乘法来计算
Figure BDA0000421107790000057
得到整帧图像的最佳抖动量,具体过程为:
I n = Σ i = 1 p Σ j = 1 q [ B 0 ( i , j ) - ( a ^ ij + g ^ ij δ y n + h ^ ij δ x n ) ] 2 , 求使In最小的δx,δy
∂ I n ∂ δ y n = 2 Σ i = 1 p Σ j = 1 q [ B 0 ( i , j ) - ( a ^ ij + g ^ ij δ y n + h ^ ij δ x n ) ] · g ^ ij = 0 ∂ I n ∂ δ x n = 2 Σ i = 1 q Σ j = 1 p [ B 0 ( i , j ) - ( a ^ ij + g ^ ij δ y n + h ^ ij δ x n ) ] · h ^ ij = 0 .
整理得到:
Σ i = 1 q Σ j = 1 p [ B n ( i , j ) · g ^ ij - a ^ ij · g ^ ij ] Σ i = 1 p Σ j = 1 q [ B n ( i , j ) · h ^ ij - s ^ ij · h ^ ij = Σ i = 1 p Σ j = 1 q g ^ ij 2 Σ i = 1 p Σ j = 1 q g ^ ij h ^ ij Σ i = 1 p Σ j = 1 q g ^ ij h ^ ij Σ i = 1 p Σ j = 1 q h ^ ij 2 δ y n δ x n .
通过求解方程,得到:
δ y n δ x n = Σ i = 1 p Σ j = 1 q g ^ ij 2 Σ i = 1 p Σ j = 1 q g ^ ij h ^ ij Σ i = 1 p Σ j = 1 q g ^ ij h ^ ij Σ i = 1 p Σ j = 1 q h ^ ij 2 - 1 · Σ i = 1 p Σ j = 1 q [ B n ( i , j ) · g ^ ij - a ^ ij · g ^ ij ] Σ i = 1 p Σ j = 1 q [ B n ( i , j ) · h ^ ij - a ^ ij · h ^ ij ] .

Claims (6)

1.基于灰度线性建模的序列图像抖动量计算方法,其特征在于所述方法为:
步骤1:对输入序列图像进行参考帧和待配准帧选定;
步骤2:在参考帧内搜索梯度最大块;
步骤3:对步骤2中梯度最大块的像素灰度进行线性建模;
步骤4:根据待配准帧各像素点灰度值以及所建线性模型计算待配准帧相对参考帧的抖动量。
2.根据权利要求1所述的基于灰度线性建模的序列图像抖动量计算方法,其特征在于所述步骤1中,存在抖动的序列图像中的第1帧图像为参考帧,其余帧相对参考帧存在抖动,为待配准帧。
3.根据权利要求1所述的基于灰度线性建模的序列图像抖动量计算方法,其特征在于所述步骤2中,梯度最大块的定义为:计算参考帧图像的梯度图像,将大于图像梯度最大值4/5的梯度对应的像素逻辑值标记为1,否则标记为0,形成的图像称为逻辑值图像,然后选择适当大小的窗口在逻辑值图像滑动,含1最多的窗口对应的块称为梯度最大块。
4.根据权利要求1所述的基于灰度线性建模的序列图像抖动量计算方法,其特征在于所述步骤2中,通过比较滑动窗口中的最大值来确定梯度最大块的位置。
5.根据权利要求1所述的基于灰度线性建模的序列图像抖动量计算方法,其特征在于所述步骤3中,对步骤2中梯度最大块对应的参考帧图像块B0进行灰度线性建模的过程如下:
步骤3-1,对于(i,j)位置的像素1≤i≤p,1≤j≤q),利用下式对该像素的灰度值建模:
B ~ 0 ( i + k , j + m ) = a ij + g ij · m + h ij · k ;
其中,{(k,m)=(0,0),(0,-1),(0,+1),(-1,0),(+1,0)},(aij,gij,hij)为对每个像素建立的模型的三个参数;
步骤3-2,通过下式利用最小二乘法计算每个像素模型的三个参数aij,gij,hij的估计值
( a ^ ij , g ^ ij , h ^ ij ) = arg min a ij , g ij , h ij Σ k , m [ B 0 ( i + k , j + m ) - B ~ 0 ( i + k , j + m ) ] 2 = arg min a ij , g ij , h ij Σ k , m [ B 0 ( i + k , j + m ) - ( a ij + g ij · m + h ij · k ) ] 2 ;
其中B0(i+k,j+m)表示(i+k,j+m)位置处的像素灰度值。
6.根据权利要求1所述的基于灰度线性建模的序列图像抖动量计算方法,其特征在于所述步骤4中,根据待配准帧各像素灰度值以及所建线性模型计算抖动量的过程为:
步骤4-1,B0在参考帧图像中的位置由步骤2已知,将在其余序列帧图像中同样位置处的图像块记为Bn(n为帧序数,n=1,2,...N);
步骤4-2,假设Bn相对于B0在x,y方向的抖动量分别为
Figure FDA0000421107780000023
那么
Figure FDA0000421107780000024
的估计值由下式计算得到:
( δ ^ x n , δ ^ y n ) = arg min ( δ x n , δ y n ) Σ i = 1 p Σ j = 1 q [ B n ( i , j ) - ( a ^ ij + g ^ ij δ y n + h ^ ij δ x n ) ] ; 2
Bn(i,j)-Bn中位于(i,j)位置的像素灰度值。
CN201310601345.8A 2013-11-25 2013-11-25 基于灰度线性建模的序列图像抖动量计算方法 Active CN103559722B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310601345.8A CN103559722B (zh) 2013-11-25 2013-11-25 基于灰度线性建模的序列图像抖动量计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310601345.8A CN103559722B (zh) 2013-11-25 2013-11-25 基于灰度线性建模的序列图像抖动量计算方法

Publications (2)

Publication Number Publication Date
CN103559722A true CN103559722A (zh) 2014-02-05
CN103559722B CN103559722B (zh) 2016-03-02

Family

ID=50013961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310601345.8A Active CN103559722B (zh) 2013-11-25 2013-11-25 基于灰度线性建模的序列图像抖动量计算方法

Country Status (1)

Country Link
CN (1) CN103559722B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010124A (zh) * 2017-12-27 2018-05-08 哈尔滨工业大学 基于辐射传递的大视场红外探测图像仿真方法
CN110750757A (zh) * 2019-10-29 2020-02-04 哈尔滨工业大学 一种基于灰度线性建模及金字塔分解的图像抖动量计算方法
WO2021237732A1 (zh) * 2020-05-29 2021-12-02 北京小米移动软件有限公司南京分公司 图像对齐方法及装置、电子设备、存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102202164A (zh) * 2011-05-20 2011-09-28 长安大学 基于运动估计的道路视频稳定方法
US20120176415A1 (en) * 2011-01-06 2012-07-12 Telenav, Inc. Graphical display system with adaptive keystone mechanism and method of operation thereof
CN102903075A (zh) * 2012-10-15 2013-01-30 西安电子科技大学 基于图像特征点全局校正的鲁棒水印方法
CN103267969A (zh) * 2013-04-25 2013-08-28 中国科学院安徽光学精密机械研究所 基于激光光柱的成像激光雷达测量大气光学湍流廓线的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120176415A1 (en) * 2011-01-06 2012-07-12 Telenav, Inc. Graphical display system with adaptive keystone mechanism and method of operation thereof
CN102202164A (zh) * 2011-05-20 2011-09-28 长安大学 基于运动估计的道路视频稳定方法
CN102903075A (zh) * 2012-10-15 2013-01-30 西安电子科技大学 基于图像特征点全局校正的鲁棒水印方法
CN103267969A (zh) * 2013-04-25 2013-08-28 中国科学院安徽光学精密机械研究所 基于激光光柱的成像激光雷达测量大气光学湍流廓线的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张来线 等: "基于图像灰度梯度最大值累加的自动调焦算法", 《光子学报》, vol. 42, no. 5, 20 March 2013 (2013-03-20), pages 605 - 610 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010124A (zh) * 2017-12-27 2018-05-08 哈尔滨工业大学 基于辐射传递的大视场红外探测图像仿真方法
CN108010124B (zh) * 2017-12-27 2021-03-30 哈尔滨工业大学 基于辐射传递的大视场红外探测图像仿真方法
CN110750757A (zh) * 2019-10-29 2020-02-04 哈尔滨工业大学 一种基于灰度线性建模及金字塔分解的图像抖动量计算方法
CN110750757B (zh) * 2019-10-29 2023-04-07 哈尔滨工业大学 一种基于灰度线性建模及金字塔分解的图像抖动量计算方法
WO2021237732A1 (zh) * 2020-05-29 2021-12-02 北京小米移动软件有限公司南京分公司 图像对齐方法及装置、电子设备、存储介质
US11763470B2 (en) 2020-05-29 2023-09-19 Beijing Xiaomi Mobile Software Co., Ltd., Nanjing Branch Method and apparatus for aligning image frames, electronic device and storage medium

Also Published As

Publication number Publication date
CN103559722B (zh) 2016-03-02

Similar Documents

Publication Publication Date Title
CN111311666B (zh) 一种融合边缘特征和深度学习的单目视觉里程计方法
CN107369166B (zh) 一种基于多分辨率神经网络的目标跟踪方法及系统
JP5952001B2 (ja) 深さ情報を用いたカメラモーションの推定方法および装置、拡張現実システム
CN103310453B (zh) 一种基于子图像角点特征的快速图像配准方法
CN106504276A (zh) 非局部立体匹配算法的组合匹配代价算法和视差联合填充算法
CN108198201A (zh) 一种多目标跟踪方法、终端设备及存储介质
CN103942768B (zh) 图像融合的方法和装置
CN104599286B (zh) 一种基于光流的特征跟踪方法及装置
CN104869387A (zh) 基于光流法的双目图像最大视差获取方法
CN101017572A (zh) 用于在帧序列中跟踪物体的计算机化的方法
CN104751111B (zh) 识别视频中人体行为的方法和系统
CN107016649A (zh) 一种基于局部低秩张量估计的视觉数据补全方法
CN107229920A (zh) 基于整合深度典型时间规整及相关修正的行为识别方法
CN106257497B (zh) 一种图像同名点的匹配方法及装置
CN107507188B (zh) 一种基于机器学习提取图像信息的方法及装置
Pickering A new similarity measure for multi-modal image registration
CN102663351A (zh) 基于条件外观模型的人脸特征点自动标定方法
CN107451595A (zh) 基于混合算法的红外图像显著性区域检测方法
CN103268482A (zh) 一种低复杂度的手势提取和手势深度获取方法
CN108961385A (zh) 一种slam构图方法及装置
CN103559722B (zh) 基于灰度线性建模的序列图像抖动量计算方法
CN104408694B (zh) 基于软阈值的非局域平均图像去噪方法
Zhang et al. Deep-learning-empowered 3D reconstruction for dehazed images in IoT-Enhanced smart cities
CN111160362A (zh) 一种fast特征均匀化提取与基于imu的帧间特征误匹配去除方法
Zhu et al. PCTNet: Depth estimation from single structured light image with a parallel CNN-transformer network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190618

Address after: 150000 Heilongjiang Harbin Dalian economic and Trade Zone, the North Road and Xingkai Road intersection

Patentee after: HIT ROBOT GROUP Co.,Ltd.

Address before: 150000 No. 92, West Da Zhi street, Nangang District, Harbin, Heilongjiang.

Patentee before: Harbin Institute of Technology

TR01 Transfer of patent right
PP01 Preservation of patent right

Effective date of registration: 20240626

Granted publication date: 20160302

PP01 Preservation of patent right