CN106537453A - 快速图像配准 - Google Patents
快速图像配准 Download PDFInfo
- Publication number
- CN106537453A CN106537453A CN201480080762.5A CN201480080762A CN106537453A CN 106537453 A CN106537453 A CN 106537453A CN 201480080762 A CN201480080762 A CN 201480080762A CN 106537453 A CN106537453 A CN 106537453A
- Authority
- CN
- China
- Prior art keywords
- image
- capture images
- filtered
- affine
- reference picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/37—Determination of transform parameters for the alignment of images, i.e. image registration using transform domain methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0051—Embedding of the watermark in the spatial domain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20048—Transform domain processing
- G06T2207/20056—Discrete and fast Fourier transform, [DFT, FFT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/405—Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels
- H04N1/4055—Halftoning, i.e. converting the picture signal of a continuous-tone original into a corresponding signal showing only two levels producing a clustered dots or a size modulated halftone pattern
Abstract
快速图像配准的示例方法包括基于捕获图像中的离散傅里叶变换(DFT)的峰值位置来恢复准周期性对象的仿射变换。示例方法还包括对捕获图像的区域进行滤波以匹配包括准周期性对象的参考图像的经滤波的版本。示例方法还包括针对经滤波的图像的图像位置的子集而恢复平移参数以减少参考图像和捕获图像之间的图像差,以及输出包括平移的近似变换。
Description
背景技术
成像模块不再限于台式扫描仪或高端相机。质量成像模块现在可用于各种各样的独立和手持或移动设备(例如,具有高分辨率相机模块的移动电话)中。随着这些成像模块的质量和分辨率继续改善,捕获图像包括更清楚地描绘的打印半色调图像或其他图案的各个点。照此,移动设备中的成像模块可以足以通过调制各个半色调点的位置来恢复图像中所表示的信息。然而,用户常常将移动设备(并且因此相机模块)保持在相对于正被捕获的图像的非正平面(non-frontoplanar)取向中,这可能导致失真的图像。
附图说明
图1是可以被实现以用于快速图像配准的示例系统的高级框图。
图2示出可以被执行以用于快速图像配准的机器可读指令的示例架构。
图3a示出半色调屏幕的示例。
图3b是图3a中所示的示例半色调屏幕的傅里叶变换(被示出为反向对数图以图示较弱的较高频率分量)的示例幅度图。
图4a-b示出(a)Stegatone(隐写色调)的示例数字位图图像,以及(b)将基本元素突显为点的图4a中的图像的傅立叶变换的对应示例幅度图。
图4c-d示出(c)利用透视失真所捕获的图4a中的数字位图图像的目标图像的示例区域,以及(d)将基本元素突显为点的图4c中的图像的傅立叶变换的对应示例幅度图。
图5a-c示出(a)示例捕获图像,(b)图示仿射失真的傅立叶变换的对应示例幅度图,以及(c)示例滤波图像。
图6和7是图示可以被实现以恢复平面投影和校正图像中的透视失真的示例操作的流程图。
具体实施方式
能够从捕获图像自动恢复信息或嵌入数据之前的初始处理步骤是要配准捕获图像。在配准捕获图像之后,可以从各个打印半色调点的位置的调制恢复在图像的结构中所表示的嵌入数据(例如,Stegatone)。
公开了快速图像配准的系统和方法。在示例中,计算机实现的过程从频域中的特征峰值的偏移位置恢复初始仿射近似,以直接从图像的结构恢复变换的参数。通过仿射变换而恢复的示例参数可以包括比例、纵横比、旋转和偏斜的组合中的一个或多个,但是不解释由于平面投影所导致的所有失真。然后,计算机实现的过程可以固定参数以基于骡图像的粗略表示(例如,使用低通滤波)发起梯度下降。平移参数的优化的局部最小值接近于全局最小值(例如,成本函数是捕获图像和骡的低通滤波版本的差)。计算机实现的过程然后可以放宽平面投影的参数以配准和纠正图像。
在示例中,该过程的第一和第二阶段可以由计算机实现的过程基于捕获图像的中心(例如,256×256像素)区域来实现,以实现快速性能(在每秒12帧和15帧之间,使用连接到PC的2MP网络相机)。然后,计算机实现的处理可以对由要处理的整个准周期性图案所覆盖的(现在已知的)区域的子区域进行操作。
所描述的计算机实现的技术基于周期性图案的离散傅里叶变换(DFT)的结构,其可以被用于恢复至少一些失真参数,并且然后继续进行以恢复使这些保持固定的剩余平移。在示例中,除了处理的最终阶段之外的所有阶段都基于对相同子窗口的分析,这导致高效且有效的方法。
本文所公开的系统和方法可以通过计算机实现的过程来实现,以直接、鲁棒且迅速地计算一个(或多个)仿射近似,因而简化捕获图像中的图像配准。捕获图像不必是矩形的。
在继续之前,应当注意,如本文所使用的,术语“包括”和“包括着”意指但不限于“包括”或“包括着”和“至少包括”或“至少包括着”。术语“基于”意指“基于”和“至少部分地基于”。
图1是可以被实现以用于快速图像配准的示例系统100的高级框图。在示例中,系统100可以与用于捕获纸102的视频或静止图像的移动设备101相关联。图像可以包括准周期性二维对象105。准周期性二维对象105可以是嵌入数据承载对象,诸如数据承载半色调结构(例如,Stegatone)。
使用手持移动设备101从纸102捕获图像可能导致失真,如图1中所图示。由于移动设备101中的相机相对于要在图像中捕获的对象105的取向(例如,由将移动设备101保持邻近纸102的用户引起的),捕获图像常常遭受透视失真。该结果常常是这种情况,即使纸102是足够平的,这是因为用户难以将具有相机的移动设备101保持得完美地平行于纸102。任何平面外旋转可能导致失真的捕获图像。
移动设备101可以例如在从捕获图像恢复嵌入数据之前执行包括快速图像配准程序代码110的计算机实现的过程。在示例中,程序代码可以被执行以估计将由移动设备101捕获的图像与原始对象105的坐标框架相关的平面投影矩阵(或单应性)的参数,并且因此恢复捕获图像的变换。然后可以输入恢复的变换以重构和输出没有透视失真(例如,合适取向)的经纠正的图像,同时维持捕获图像的正确比例(例如,纵横比)。具有经纠正的图像简化了恢复可以由捕获图像所表示的数据的任务。
系统100可以包括机器可读存储介质和(例如,移动设备101上的)处理器,能够存储和执行快速图像配准程序代码110以实现本文所述的计算机实现的过程。处理器可以是中央处理单元(CPU)、基于半导体的微处理器或适于检索和执行指令的任何其他设备。作为取出、解码和执行指令的替代或补充,处理器可以包括一个或多个集成电路(IC)或其他电子电路,其包括用于执行下面描述的功能的多个电子组件。该功能可以由多个处理器执行。
处理器可以与机器可读存储介质通信。机器可读存储介质可以是任何合适的机器可读介质,诸如存储可执行指令或其他数据的电子、磁性、光学或其他物理存储设备(例如,硬盘驱动器、随机存取存储器、闪速存储器等等)。机器可读存储介质可以是例如被配置为存储快速图像配准程序代码110的计算机可读非暂时性介质。
可以参考图2和快速图像配准程序代码110的各种示例功能的以下讨论来更好地理解快速图像配准程序代码110的指令实现系统的计算机实现的过程。
图2示出可以被执行以用于快速图像配准的机器可读指令200的示例架构。在示例中,上面参照图1讨论的快速图像配准程序代码110可以被实现为机器可读指令200(诸如但不限于软件或固件)。然而,注意,图2中所示的架构仅为了说明示例操作环境的目的而提供,并且不意图限制程序代码的实现。
在操作期间,处理器执行作为自包含模块的机器可读指令200的功能,以执行计算机实现的过程。这些模块可以集成在自立工具内,或者可以被实现为在现有应用上运行的代理。在示例中,机器可读指令的架构可以包括离散傅里叶变换(DFT)峰值点确定指令(或“DFT指令”)210、梯度下降指令220和变换参数指令230。
DFT指令210可以包括用于确定图像(诸如由相机或扫描仪所捕获的图像)的DFT的幅度中的峰值点的指令,其中与周围区域相比频率值与峰值相关联。峰值点可以相对于特定区域。例如,可以存在所标识的两个峰值点,其中峰值点中的一个具有比另一个更大的值。在一个实现中,针对峰值点分析DFT的半平面,并且基于所分析的半平面内的峰值点来假设第二半平面上的对应频率范围中的峰值点。
在示例中,从频域中的特征峰值的偏移位置恢复初始仿射近似,以直接从图像的结构恢复变换的参数(例如,比例、纵横比、偏斜和旋转的组合)。
梯度下降指令220可以包括用于固定这些参数并且基于骡图像的粗略表示(例如,使用低通滤波)来发起梯度下降的指令。平移参数的优化的局部最小值接近于全局最小值(例如,成本函数与骡和捕获图像的低通滤波版本的差相关)。
然后放宽平面投影的参数以配准和纠正图像。变换参数指令230可以包括用于生成和输出关于图像的信息的指令,诸如传输、存储或显示关于准周期性二维对象的取向的信息。在示例中,处理器可以被执行以输出经纠正的图像。
在示例中,如果指示准周期性二维对象的存在,则机器可读存储介质可以包括附加指令,诸如用于确定准周期性二维对象的图像的特性的指令。例如,处理器可以确定对象比例、相机距离、相机焦点、对象取向或其他信息。在示例中,处理器可以基于DFT来确定准周期性对象的特性。
注意,除了DFT之外,还可以分析捕获图像的附加属性,以确定捕获图像的进一步的特性。在示例中,分析捕获图像以确定针对与要分析的对象相关联的基础或嵌入数据是否由准周期性二维对象提供足够的信息。例如,如果图像的质量低于阈值,则处理器可以确定不分析准周期性二维对象以对其进行解码。可以向用户显示或以其他方式提供与对象的存在和捕获的质量相关的信息。用户然后可以重新捕获图像以供处理器分析以确定重新捕获图像的图像是否具有足够的质量。
在继续之前,应当注意,上述系统为了说明的目的而提供,并且不意图进行限制。可以利用其他设备和/或设备配置以及一个(或多个)程序代码架构来执行本文所述的操作。
可以参考以下示例函数来更好地理解计算机实现的过程。
计算机实现的过程可以恢复将经纠正的图像坐标与失真的配对物相关的投影变换或单应性,以从平面的透视图像去除投影失真。在齐次坐标中,该变换可以表示为3×3矩阵H,如下:
变换也可以更简单地表示为x’=Hx,其中最终,变换的图像位置由x”=x’/w’和y”=y’/w’给出。注意,平面单应性是该变换的最一般形式,并且当v的元素为零时,单应性可以表示为由仿射A(2x)和平移(t)构成。
为了说明的目的,考虑在二维周期性结构上具有符号阵列(通常为简单点)的数据承载图像。可以通过周期性结构中的元素上的扰动来嵌入数据。在Stegatone的情况下,周期性结构描绘图像,并且符号是半色调点。对于其他应用(例如,网格代码),不存在由结构所描绘的图像。
在Stegatone的情况下,例如,由计算机实现的过程使用以构造半色调图案的图像可以在解码时间或者有利地对于一些应用是已知的,数据可以嵌入在未知图像中(这称为无骡Stegatone)。二维结构可以是足够小的固定大小以总是适合在相机的视场内,或者可以在具有可以从捕获窗口大小的感兴趣区域恢复的重复代码的较大区域之上延伸。在示例中,在骡图像(例如,默认半色调)对于恢复过程是已知的情况下(这是常有的情况),计算机实现的处理是适用的。
图3a示出半色调屏幕300的示例。图3b示出图3a中所示的半色调屏幕的傅立叶变换(被示出为反向对数以图示较弱的较高频率分量)的示例幅度图350。为了说明的目的,当在45度屏幕方向上测量间隔时,考虑在水平和垂直方向中的每一个上具有150单元每英寸的单元周期(当以600点每英寸打印时;dpi)的单色45度集群点半色调屏幕(称为106.1线每英寸(或“lpi”))屏幕。在图3a中针对12.5%均匀灰度级(例如范围0到255之中的值224)示出该屏幕300的规则结构的示例。
示例屏幕300是单色集群点半色调屏幕,并且是在数据承载半色调或者Stegatone上使用的相同结构。虽然为了说明的目的而描述,但应注意,本文所述的技术适用于其他屏幕。
图3b示出图3a中所示的45度半色调屏幕300的傅里叶变换(被示出为反向对数图以图示较弱的较高频率分量)的示例幅度图350。计算图3a中所示的12.5%灰度半色调图案的补片的离散傅里叶变换(DFT)并检查其幅度(如图3b中的图350所示),揭示了沿着45度方向的半色调图案的基频作为围绕DC(在DFT的中心处)的一组4个峰值而强烈可见。同样明显的是朝向基带的边界重复的数个谐波。当半色调描绘图像内容时DFT的该结构被强烈保留,甚至在半色调的结构已经被“干扰”例如以创建Stegatone的情况下。
图4a-b示出(a)Stegatone的示例数字位图400(例如,400×400像素正方形),以及(b)使用点突显基本元素412a-d的傅里叶变换的对应示例幅度图410。原始数字半色调中的每个单元是4×4像素,其中许多单元偏移以表示信息。图4c-d示出(c)使用2兆像素相机所捕获的图像420的示例区域(例如,600×600像素正方形),以及(d)使用点突显基本元素432a-d的捕获图像的中心256×256区域的傅立叶变换的对应示例幅度图430。
参考图4a和4c,Stegatone是集群点半色调图像,其中数据通过逻辑地包含在单元中的那些点集群的小偏移而嵌入在各个点集群中。应当注意,虽然描述为应用于Stegatone图像,但是本文所述的计算机实现的过程适用于其他示例。在示例中,该技术被应用于将被分析以用于识别任务的图像。该技术还可以应用于增强图像以用于更容易解释。
如图4b和4d中所示,应用于捕获图像420的离散傅里叶变换(DFT)的振幅表现出与基础周期性结构对应的强尖峰(412a-d和432a-d)。这些尖峰是扰动明显小于周期的结果。
用于Stegatone的半色调阈值阵列是45度屏幕。结果是以棋盘图案布置的点图案。如果在没有失真的情况下捕获这样的半色调,则基频尖峰以具有垂直于空间频率轴的边的矩形(实际上,正方形)布置,并且DC项处于其中心,如图4b中所示。
然而,在实践中,所捕获的Stegatone可能由于用手保持移动捕获设备的不准确性而失真。再次,图1示出捕获打印的Stegatone的移动相机的示例。通过将(图4a中所示的原始数字位图的)图4b中的图410与(图4c中所示的捕获图像的)图4d中的图430进行比较可以看出效果。
用于从捕获图像420恢复经纠正的图像(例如,对应于数字位图400)的计算机实现的过程中的第一步骤是要标识捕获图像中的这些尖峰432a-d的存在。捕获图像420中的这些尖峰432a-d指示标记的存在,并且指示近似投影的所估计的仿射变换。
在示例中,尖峰432a-d通过忽视支配DFT的DC(和)项附近的区域而在图430中更容易标识。例如,可以将掩模415、435应用于该图。DC项表示整个图像的平均值,并且其旁边的值表示图像的最大比例特征。因此,应当小心掩蔽DC区域。掩模415、435不应太小,因为这可能允许大的DC相关值的泄漏。掩模415、435不应太大,因为这可能隐藏所寻求的基频。
在该示例中,计算机实现的过程可以利用“加号”形状的掩模来阻挡DC区域。然而,其他形状(例如,盘形掩模)也可以用于该目的。在掩蔽之后,最大的剩余值是与Stegatone中的半色调屏幕对应的四个尖峰412a-d和432a-d。在图4b中所示的示例中,这些尖峰412a-d形成完美的正方形。在图4d中所示的示例中,由于捕获图像的失真,这些尖峰432a-d仿射失真。在其他示例中,掩模可以表现得更像滤波器,其由使频率分量衰减与它们到DC的距离相关的量的值构成。
空间域和频域中的仿射变换是相关的。因此,对图像变换的仿射近似可以直接从捕获图像中的基本峰值相对于它们的原始预期位置的重新定位来恢复。为了说明的目的,使用所恢复的仿射变换来变换在Stegatone 450的中心处的45度屏幕方向。
计算机实现的过程然后可以从基本元素的相对位移恢复变换的仿射分量。DFT中所测量的仿射变换与图像空间中的仿射变换相关为:
Al=(AFT -1)T
在上述等式中,Al和AFT分别是图像和傅立叶域中的2×2仿射变换。AFT可以通过标识目标图像(图4a)和捕获图像(图4c)之间的一对基本元素的对应位置来求解。
傅立叶变换的幅度相对于DC的位置是对称的,并且因此适当的基本元素对描述所有四个位置,其估计在本文中称为AffineDFT方法。另外,在其中实际变换包括平面透视分量的那些情况下,AffineDFT方法提供对由DFT所覆盖的区域的中心处的局部平面单应性的合理近似,如下:
有可能改变在其上计算DFT的捕获图像的中心区域的大小。在每种情况下,所恢复的仿射变换是对变换区域上的实际平面投影的近似。较大的区域提供对仿射变换的更准确近似,因为可以更准确地确定DFT中的峰值的位置。然而,计算成本也随着区域的大小而增加。在示例中,256×256区域提供了计算效率和局部近似仿射变换的准确度之间的良好的折衷。
捕获图像的相同的256×256中心区域被用于恢复已知骡图像的近似平移。由于初始近似(例如,在骡和捕获图像的中心重合的情况下)可能与实际平移有一些相当大的距离(例如骡图像的大小的大部分),所以骡和捕获图像的粗略(例如,低通滤波版本)表示可以被用于恢复近似平移。该目标可以使用高斯平滑或者有利地使用块平均或积分图像来实现,因为这些可以快速地被计算并且与低通滤波器的大小无关。
图5a-c示出(a)利用两兆像素(MP)相机所捕获的示例图像500,(b)示出了示出仿射失真的DFT的对应输出的示例图540,以及(c)利用31×31像素块平均滤波器而滤波的示例低通滤波骡图像550。为了说明的目的,由计算机实现的过程所分析的图像510是标识照片,其可以包括嵌入数据(例如为了安全目的)。然而,注意,本文所述的技术不限于与任何类型的图像捕获操作一起使用。
由计算机实现的过程从仿射变换所恢复的比例S被输入以确定应用于捕获图像的中心区域520的低通滤波器(如图中所示)。也就是说,当骡图像利用31×31块滤波器滤波时,使用相等的31S×31S块滤波器对中心区域进行滤波。梯度下降计算然后继续进行以优化变换的平移参数,以最小化捕获图像和骡图像之间的和平方强度差。在该图示中,在要分析的图像510的中心区域520上定义x、y位置的10×10网格。仿射参数是固定的,并且在每个步骤处仅更新平移以改善鲁棒性并且使得能够近实时地恢复近似平移。
所恢复的变换(例如,仿射+平移)由图5a中的轮廓线530图示。虽然该图仅示出530的旋转和缩放,但是它常常也被偏斜以更好地近似真实的平面投影变换。剩余的轻微差异是由于(在步骤3中恢复的)未建模的平面投影所导致的。
可以通过以下说明来更好地理解变换。对于每循环具有M(例如,8个像素)点/像素的水平和垂直周期(或M/2的单元尺寸)的对称45度半色调图案,水平和垂直频率是P/M循环每英寸。P是以点/像素每英寸(例如,400或600dpi)的打印分辨率,并且线频率是
如果N×N是表示图像的频率内容的DFT的大小,那么对于未失真半色调,四个基本元素在水平和垂直方向二者上从DC位移d=N/M。
仅考虑DFT(-d,d)和(d,d)的上半部分中的两个基本元素以及它们在捕获图像(u1,v1)和(u2,v2)的上半部分中的配对物。将未失真半色调的DFT中的位置取为捕获图像的DFT中的位置(具有虚线的坐标)的变换的仿射参数可以表示如下:
针对DFT中的两个基本元素的变换进行求解得到:
a1=(u1+u2)/2d
a2=(u2-u1)/2d
a3=(v1+v2)/2d
a4=(v2-v1)/2d
计算机实现的过程可以使用这些等式来获得图像空间中的仿射参数(其是逆的转置),如下:
给出四个仿射参数(a1,a2,a3,a4),x和y方向上的比例通过以下来表达:
和
计算机实现的过程可以将组合比例近似为这两个等式的均值或RMS。
可以通过计算机实现的过程来数学地导出梯度下降(例如,高斯-牛顿或准高斯-牛顿非线性最小二乘迭代最小化)图像配准更新平移。计算机实现的过程找到针对关于参考图像所定义的一组图像位置而最小化参考图像和目标图像之间的和平方差(SSD)的变换。该关系可以表达为:
∑i[T(i:p)-R(i)]2
在上面的等式中,R(i)是第i个位置处的参考图像的值,并且T(i:p)是使用变换参数p的变换位置处的目标图像的对应值。和可以被线性化为T(i:p+Δp),其中目的是找到改善修正SSD的Δp的值,并且迭代如下:
在上述等式中,是在变换位置处的目标图像中所测量的梯度,并且是扭曲(warp)参数(变换)相对于x和y坐标的雅可比,如下:
总变换(包括仿射和平移参数)可以表示为:
上述等式得到六个参数。在示例中,仅更新这些参数中的两个(t1,t2):
p=[a1 a2 t1 a3 a4 t2]
因此,关于参数的x和y中的仿射变换A的雅可比可以表达为:
上述等式在图像上是恒定的。因此,针对每个测量位置的雅可比可以表达为:
总的最陡下降方向可以表达为:
[0 0 ∑T′x(T′-R)0 0 ∑T′y(T′-R)
在上述等式中,T′是针对仿射变换位置T(i:p)处的捕获图像值的简写,并且T′x和T′y是对应位置处的x和y图像梯度高斯-牛顿解可以表达为:
Δp=H-1[0 0 ∑T′x(T′-R)0 0 ∑T′y(T′-R)
在上述等式中,H-1是对海赛的高斯-牛顿近似,其也可以表达为:
在示例中,对于计算机实现的过程使用准高斯-牛顿方法可以更快且更鲁棒,其中使用Broyden-Fletcher-Goldfarb-Shanno(BFGS)方法近似海赛。BFGS方法在每个步骤上确定矩阵,梯度向量乘以所述矩阵以进入“更好的”方向。该方法可以与线搜索算法组合以找到以下迭代参数更新等式中的α的“最佳”值:
pi+d=pi+αΔp
计算机实现的过程使得能够实现捕获图像的快速配准。另外,计算机实现的过程可以分析所配准图像以恢复数据,在示例中,仅在已经恢复最终准确平面投影之后。当期望时,可以使用基于平面投影的方法来实现准确图像配准的最终阶段。使用与本文概述的梯度下降方法类似的梯度下降方法实现令人满意的结果,除了平面投影的所有参数(而不仅仅是平移)可以在每次迭代处更新之外。使用高斯带通滤波器(例如,其中针对骡图像的3和6像素标准偏差的高斯滤波器和针对目标捕获图像的缩放滤波器)的差来对图像进行预先滤波是适当的。仅目标图像的区域(包括骡图像的先前估计的位置(根据先前计算的仿射变换))以及围绕它的小边界以该方式被处理。
上述方法的示例实现由图6和7中的流程图图示。图6和7是图示可以被实现以恢复平面投影和校正图像中的透视失真的示例操作的流程图。操作可以体现为一个或多个计算机可读介质上的逻辑指令。当在处理器上执行时,逻辑指令使通用计算设备被编程为实现所描述的操作的专用机器。在示例中,可以使用图中所描绘的组件和连接。
在图6中,操作600图示了快速图像配准的方法。操作610包括基于捕获图像中的离散傅里叶变换(DFT)的峰值位置来恢复准周期性对象的仿射变换。
操作620包括对捕获图像的区域进行滤波以匹配包括准周期性对象的参考图像的经滤波的版本。在示例中,仅对捕获图像的固定子集进行滤波。在示例中,滤波是通过低通滤波器或带通滤波器。在示例中,滤波基于从仿射变换恢复的比例。
操作630包括针对经滤波的图像的图像位置的子集而恢复平移参数以减少参考图像和捕获图像之间的图像差,以输出配准图像。在示例中,恢复平移参数使用仿射变换。在示例中,恢复平移参数使用仿射变换的逆。
在示例中,进一步的操作可以包括将仿射变换应用于参考图像以给出捕获图像的比例值、旋转值和偏斜值。进一步的操作还可以包括将图像位置的子集变换到经滤波的捕获图像,以及更新图像位置的子集来找到平移参数,以最小化参考图像和捕获图像之间的图像差。
提供本文所示和所述的操作以说明示例实现。注意,操作不限于所示的排序。也可以实现又其他的操作。
在图7中通过示例的方式图示了操作700。在702处对参考图像701进行滤波(例如,通过低通滤波器)。在操作710中,捕获目标图像。在示例中,在操作720处,上述的AffineDFT方法首先被应用于捕获图像(例如,被应用于捕获图像的中心或区域),并且在操作730中恢复仿射变换。在操作740中,捕获图像可以使用根据从仿射变换恢复的比例参数所确定的滤波器来直接滤波。在操作750中,找到最小化图像差的平移。在760处输出近似仿射变换。
在示例中,近似仿射变换可以被输入作为用于改进变换的基础,并且最终作为经纠正图像的输出。变换还可以被用在其他应用中,包括例如实时追踪stegatone的位置作为用户界面的一部分、或用于扩充用户界面。
注意,所示和所述的示例为了说明的目的而提供,并且不意图进行限制。也设想又其他的示例。
Claims (15)
1.一种快速图像配准的方法,包括:
基于捕获图像中的离散傅里叶变换(DFT)的峰值位置来恢复准周期性对象的仿射变换;
对捕获图像的区域进行滤波以匹配包括准周期性对象的参考图像的经滤波的版本;
针对经滤波的图像的图像位置的子集而恢复平移参数以减少参考图像和捕获图像之间的图像差;以及
输出包括平移的近似变换。
2.根据权利要求1所述的方法,其中,输入包括平移的近似变换,以用于确定用于纠正图像的最终准确平面投影。
3.根据权利要求1所述的方法,其中,恢复平移参数是使用仿射变换和仿射变换的逆中的一个。
4.根据权利要求1所述的方法,还包括将仿射变换或逆变换应用于捕获图像,以及恢复剩余的平移。
5.根据权利要求1所述的方法,还包括将图像位置的子集变换到经滤波的捕获图像,以及更新图像位置的子集来找到平移参数以最小化参考图像和捕获图像之间的图像差。
6.根据权利要求5所述的方法,其中,应用逆变换。
7.根据权利要求1所述的方法,还包括标识准周期性对象的存在。
8.根据权利要求7所述的方法,其中,滤波通过低通滤波器和带通滤波器中的一个。
9.根据权利要求8所述的方法,其中,滤波基于从仿射变换恢复的比例。
10.一种机器可读非暂时性存储介质,包括可由处理器执行以进行如下操作的指令:
标识捕获图像中的准周期性对象的离散傅里叶变换(DFT)的峰值位置以获得仿射变换;
对捕获图像的至少一部分进行滤波以匹配参考图像的经滤波的版本;
针对经滤波的图像的图像位置的子集而减少参考图像和捕获图像之间的图像差;以及
输出包括平移的近似变换。
11.根据权利要求10所述的机器可读非暂时性存储介质,其中,DFT直接从准周期性对象的图案恢复仿射。
12.根据权利要求10所述的机器可读非暂时性存储介质,其中所述指令还可由处理器执行以在使所有其他参数保持固定的同时使用梯度下降来近似平移。
13.根据权利要求10所述的机器可读非暂时性存储介质,其中所述指令还可由处理器执行以恢复捕获图像的最终高准确度变换。
14.一种具有处理器的系统,所述处理器可执行以:
标识捕获图像中的准周期性对象的离散傅里叶变换(DFT)的峰值位置以获得仿射变换;
对捕获图像的至少一部分进行滤波以匹配参考图像的经滤波的版本;
减少参考图像和捕获图像之间的图像差;以及
输出包括平移的近似变换。
15.根据权利要求14所述的系统,其中处理器还可执行以:
将图像位置的子集变换到经滤波的捕获图像,以及
更新图像位置的子集来找到平移参数以最小化参考图像和捕获图像之间的图像差。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2014/047681 WO2016014041A1 (en) | 2014-07-22 | 2014-07-22 | Rapid image registration |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106537453A true CN106537453A (zh) | 2017-03-22 |
Family
ID=55163428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480080762.5A Pending CN106537453A (zh) | 2014-07-22 | 2014-07-22 | 快速图像配准 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10002438B2 (zh) |
EP (1) | EP3172717A4 (zh) |
CN (1) | CN106537453A (zh) |
WO (1) | WO2016014041A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107113380B (zh) | 2014-12-19 | 2020-03-06 | 惠普发展公司,有限责任合伙企业 | 一种计算系统、方法和机器可读非暂时性存储介质 |
AU2015202937A1 (en) * | 2015-05-29 | 2016-12-15 | Canon Kabushiki Kaisha | Systems and methods for registration of images |
US9998666B2 (en) * | 2015-08-26 | 2018-06-12 | Duke University | Systems and methods for burst image deblurring |
TR201917869A2 (zh) | 2019-11-15 | 2021-05-21 | Commencis Teknoloji A S |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW529256B (en) * | 2000-01-21 | 2003-04-21 | Signafy Inc | Rotation, scale, and translation resilient public watermarking for images |
US20030133589A1 (en) * | 2002-01-17 | 2003-07-17 | Frederic Deguillaume | Method for the estimation and recovering of general affine transform |
CN1799068A (zh) * | 2003-07-08 | 2006-07-05 | 佳能株式会社 | 图像配准方法改进 |
US20130044948A1 (en) * | 2011-08-18 | 2013-02-21 | Matthew D. Gaubatz | Method of robust alignment and payload recovery for data-bearing images |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6614914B1 (en) | 1995-05-08 | 2003-09-02 | Digimarc Corporation | Watermark embedder and reader |
US6408082B1 (en) | 1996-04-25 | 2002-06-18 | Digimarc Corporation | Watermark detection using a fourier mellin transform |
US6865273B2 (en) | 2002-06-05 | 2005-03-08 | Sony Corporation | Method and apparatus to detect watermark that are resistant to resizing, rotation and translation |
CN100461864C (zh) | 2005-06-25 | 2009-02-11 | 华为技术有限公司 | 基于数字水印的多媒体视频通信客观质量评价方法 |
KR100753490B1 (ko) | 2006-01-04 | 2007-08-31 | 한국과학기술원 | 크기불변특징변환(sift)를 이용한 디지털 워터마킹방법 |
US9514550B2 (en) * | 2007-06-15 | 2016-12-06 | The Johns Hopkins University | Methods for motion compensated image reconstruction and system related thereto |
AU2011253779A1 (en) | 2011-12-01 | 2013-06-20 | Canon Kabushiki Kaisha | Estimation of shift and small image distortion |
US8942512B2 (en) | 2011-12-24 | 2015-01-27 | Ecole De Technologie Superieure | Methods and systems for processing a first image with reference to a second image |
GB2525228B (en) * | 2014-04-16 | 2020-05-06 | Smiths Heimann Sas | Identification or determination of a load based on texture |
-
2014
- 2014-07-22 WO PCT/US2014/047681 patent/WO2016014041A1/en active Application Filing
- 2014-07-22 EP EP14897910.7A patent/EP3172717A4/en not_active Withdrawn
- 2014-07-22 CN CN201480080762.5A patent/CN106537453A/zh active Pending
- 2014-07-22 US US15/327,959 patent/US10002438B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW529256B (en) * | 2000-01-21 | 2003-04-21 | Signafy Inc | Rotation, scale, and translation resilient public watermarking for images |
US20030133589A1 (en) * | 2002-01-17 | 2003-07-17 | Frederic Deguillaume | Method for the estimation and recovering of general affine transform |
CN1799068A (zh) * | 2003-07-08 | 2006-07-05 | 佳能株式会社 | 图像配准方法改进 |
US20130044948A1 (en) * | 2011-08-18 | 2013-02-21 | Matthew D. Gaubatz | Method of robust alignment and payload recovery for data-bearing images |
Non-Patent Citations (3)
Title |
---|
左华川 等: "一种基于模版的抗仿射变换数字水印算法", 《信息安全与通信保密》 * |
曲巨宝: "基于特征点密度的DCT域盲检测数字水印算法", 《计算机应用》 * |
苗立刚 等: "基于2D格状图的显微图像拼接", 《计算机工程》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2016014041A1 (en) | 2016-01-28 |
EP3172717A1 (en) | 2017-05-31 |
US20170206671A1 (en) | 2017-07-20 |
US10002438B2 (en) | 2018-06-19 |
EP3172717A4 (en) | 2018-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7780084B2 (en) | 2-D barcode recognition | |
JP5505007B2 (ja) | 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム | |
JP5294343B2 (ja) | 画像位置合わせ処理装置、領域拡張処理装置及び画質改善処理装置 | |
Liang et al. | Repairing sparse low-rank texture | |
CN108921158A (zh) | 图像校正方法、装置及计算机可读存储介质 | |
US7103234B2 (en) | Method for blind cross-spectral image registration | |
Zhang et al. | A coarse-to-fine framework for cloud removal in remote sensing image sequence | |
Agarwal et al. | A diverse large-scale dataset for evaluating rebroadcast attacks | |
CN112200710A (zh) | 一种基于深度学习的自适应隐形水印同步检测方法 | |
WO2015096462A1 (zh) | 一种二维码聚焦显示方法及系统 | |
Chu et al. | Stabilization and extraction of 2D barcodes for camera phones | |
CN106537453A (zh) | 快速图像配准 | |
US10002413B2 (en) | Recovering planar projections | |
Chen et al. | Screen-cam robust and blind watermarking for tile satellite images | |
Kanter | Color Crack: Identifying Cracks in Glass | |
JP6797046B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2013037539A (ja) | 画像特徴量抽出装置およびそのプログラム | |
Wu et al. | A self-adaptive correction method for perspective distortions of image | |
US8339677B2 (en) | Image processing system, image processing apparatus, and image processing method | |
CN109871744A (zh) | 一种增值税发票图像配准方法及系统 | |
WO2019229855A1 (ja) | 物体検出装置、物体検出システム、物体検出方法、およびプログラムを記録する記録媒体 | |
KR102135961B1 (ko) | 영상 처리 장치 및 영상 처리 방법 | |
Ulichney et al. | Fast mobile stegatone detection using the frequency domain | |
Dai et al. | The realization of identification method for datamatrix code | |
JP2015135701A (ja) | 2次元コード、画像読取装置、画像読取方法、プログラム及び記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170322 |
|
WD01 | Invention patent application deemed withdrawn after publication |