WO2016033967A1

WO2016033967A1 - 对齐图像的方法和装置

Info

Publication number: WO2016033967A1
Application number: PCT/CN2015/075823
Authority: WO
Inventors: 沈小勇; 贾佳亚; 洪国伟
Original assignee: 华为技术有限公司
Priority date: 2014-09-05
Filing date: 2015-04-03
Publication date: 2016-03-10
Also published as: CN105389774B; US20170178348A1; US10127679B2; CN105389774A

Abstract

本发明实施例公开了一种对齐图像的方法和装置，该方法包括：获取待对齐的两个图像的图像信息；根据该两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，该第一坐标偏移量用于指示该两个图像间待对齐的像素点在该坐标系中的位置偏差；根据该第一图像中像素点在该坐标系中的坐标和该第一坐标偏移量，对齐该两个图像。本发明实施例中引入了互相关度量模型，由于互相关度量模型同时考虑图像间颜色的互相关和梯度的互相关，与现有的基于SIFT特征点的图像对齐技术，更适合多模态多光谱图像间的对齐，提高了图像对齐的准确性。

Description

对齐图像的方法和装置

本申请要求于2014年09月05日提交中国专利局、申请号为201410452309.4、发明名称为“对齐图像的方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及图像处理领域，并且更具体地，涉及一种对齐图像的方法和装置。

背景技术

图像对齐技术是图像处理领域的基础技术。随着数字图像的快速发展，出现了一系列基于图像对齐技术的应用。这些应用包括全景图的生成，高动态图的生成，两张图像的信息融合等，例如，用红外图像修复彩色图像、用带噪声的图像去除另一张彩色图的模糊等。

随着各种图像采集设备的蓬勃发展，多模态多光谱图像的对齐成为了一个新的问题，这些多模态多光谱图像包括近红外图像、彩图图像、深度图像、核磁共振图像以及超声图像等。采集设备的不同以及采集场景的动态性会导致采集到的图像存在很大差异。图1示出了4组常见的多模态多光谱图像，从左到右：第1组为不同曝光度的图像，第2组为彩色和深度图像，第3组为彩色和近红外图像，第4组为开闪光灯和不开闪光灯的图像。从图1中可以看出，多模态多光谱图像间主要存在以下的差别：

·图像间颜色反差大；

·图像间梯度大小和方向的反差大。

传统的基于SIFT(尺度不变特征变换，Scale-invariant Feature Transform)特征点的对齐技术在图像对齐领域具有广泛的应用。具体而言，该技术通过找SIFT特征点对需要对齐的图像进行匹配。以两张图像为例，基于SIFT特征点的图像对齐方法首先提取两张图像的SIFT特征点向量，通过向量的欧式距离来寻找最近邻，从而得到两张图像间的对应关系。但是，SIFT特征点与图像的梯度大小方向有很大关系，也就是说，基于SIFT特征点的图像对齐技术很大程度上依赖图像结构相似区域在梯度大小方向的一致性。但是，从图1可以看出，多模态多光谱图像在结构相似区域的梯度方向，是存在较大反差的，因此，基于SIFT特征点的图像对齐技术不适用于多模态多光谱图像的对齐。

发明内容

本发明实施例提供了一种对齐图像的方法和装置，能够提高图像对齐的准确性。

第一方面，提供一种对齐图像的方法，包括：获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括所述第一图像中像素点在选取的坐标系中的坐标，所述第一图像中像素点的像素值，以及所述第一图像中像素点的像素值梯度，第二图像的图像信息包括：所述第二图像中像素点的像素值，以及所述第二图像中像素点的像素值梯度，其中，所述两个图像均位于所述坐标系中；根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，所述第一坐标偏移量用于指示所述两个图像间待对齐的像素点在所述坐标系中的位置偏差；根据所述第一图像中像素点在所述坐标系中的坐标和所述第一坐标偏移量，对齐所述两个图像。

结合第一方面，在第一方面的一种实现方式中，在根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量之前，所述方法还包括：获取第三图像的图像信息，所述第三图像的图像信息包括：所述第三图像中像素点的像素值，以及所述第三图像中像素点的像素值梯度，其中，所述第三图像位于所述坐标系中，且所述第一图像和所述第三图像为待对齐的初始图像；根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，所述坐标变换矩阵用于指示所述初始图像间待对齐的像素点在所述坐标系中的空间位置关系；根据所述坐标变换矩阵，确定第二坐标偏移量，所述第二坐标偏移量用于指示所述初始图像间的待对齐的像素点在所述坐标系中的位置偏差；根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，包括：通过计算

的最小值，确定所述坐标变换矩阵，其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，H表示所述坐标变换矩阵，且H满足[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，I表示单位矩阵，p表示所述第一图像中像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示所述第二坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，

表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_3,p表示所述第三图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I′_3,p表示所述以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，

表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β和τ为常数，β用于控制函数ρ(x)的形状，τ为E₂(p,w_p)中

项的权重。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据所述坐标变换矩阵，确定第二坐标偏移量，包括：根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定所述第二坐标偏移量。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像，包括：根据公式I₂(p)＝I₃(p+w_p)，得到所述第二图像，其中，I₂(p)表示所述第二图像在p的像素值，I₃(p+w_p)表示所述第三图像在p+w_p的像素值。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，包括：根据公式

确定所述第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，

p表示所述第一图像的像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w'_p表示所述第一坐标偏移量，u'_p表示w'_p的横坐标，v'_p表示w'_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示所述第二图像的以p+w'_p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示所述以p+w'_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示所述以p+w'_p为中心的图像块内，各像素点的像素均值组成的一维列向量，

表示所述以p+w'_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，λ₁、β、λ₂和τ为常数，λ₁和λ₂为E₃(w'_p)中第二项和第三项的权重，β用于控制函数ρ(x)的形状，τ为E₂(p,w'_p)中

项的权重，N(p)表示所述第一图像中像素点p的相邻像素点组成的集合，q表示所述集合中的任意像素点，w_q表示q与q在所述第二图像中的待对齐像素点之间的坐标偏移量，ε为常数。

结合第一方面或其上述实现方式的任一种，在第一方面的另一种实现方式中，所述互相关度量模型为：

其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，

p表示所述第一图像的像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示所述第一坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，

所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，

表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示所述第二图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示所述以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，

表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β为权重，用于控制函数ρ(x)的形状。

第二方面，提供一种对齐图像的装置，包括：第一获取单元，用于获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括所述第一图像中像素点在选取的坐标系中的坐标，所述第一图像中像素点的像素值，以及所述第一图像中像素点的像素值梯度，第二图像的图像信息包括：所述第二图像中像素点的像素值，以及所述第二图像中像素点的像素值梯度，其中，所述两个图像均位于所述坐标系中；第一确定单元，用于根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，所述第一坐标偏移量用于指示所述两个图像间待对齐的像素点在所述坐标系中的位置偏差；对齐单元，用于根据所述第一图像中像素点在所述坐标系中的坐标和所述第一坐标偏移量，对齐所述两个图像。

结合第二方面，在第二方面的一种实现方式中，所述装置还包括：第二获取单元，用于获取第三图像的图像信息，所述第三图像的图像信息包括：所述第三图像中像素点的像素值，以及所述第三图像中像素点的像素值梯度，其中，所述第三图像位于所述坐标系中，且所述第一图像和所述第三图像为待对齐的初始图像；第二确定单元，用于根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，所述坐标变换矩阵用于指示所述初始图像间待对齐的像素点在所述坐标系中的空间位置关系；第三确定单元，用于根据所述坐标变换矩阵，确定第二坐标偏移量，所述第二坐标偏移量用于指示所述初始图像间的待对齐的像素点在所述坐标系中的位置偏差；第四确定单元，用于根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像。

结合第二方面或其上述实现方式的任一种，在第二方面的另一种实现方式中，所述第二确定单元具体用于通过计算

的最小值，确定所述坐标变换矩阵，其中，

项的权重。

结合第二方面或其上述实现方式的任一种，在第二方面的另一种实现方式中，所述第三确定单元具体用于根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定所述第二坐标偏移量。

结合第二方面或其上述实现方式的任一种，在第二方面的另一种实现方式中，所述第四确定单元具体用于根据公式I₂(p)＝I₃(p+w_p)，得到所述第二图像，其中，I₂(p)表示所述第二图像在p的像素值，I₃(p+w_p)表示所述第三图像在p+w_p的像素值。

结合第二方面或其上述实现方式的任一种，在第二方面的另一种实现方式中，所述第一确定单元具体用于根据公式

确定所述第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，

结合第二方面或其上述实现方式的任一种，在第二方面的另一种实现方式中，所述互相关度量模型为：

其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，

本发明实施例中引入了互相关度量模型，由于互相关度量模型同时考虑图像间颜色的互相关和梯度的互相关，与现有的基于SIFT特征点的图像对齐技术，更适合多模态多光谱图像间的对齐，提高了图像对齐的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是多模态多光谱图像的示例图。

图2是鲁棒函数的函数曲线图。

图3是本发明实施例的对齐图像的方法的示意性流程图。

图4是本发明实施例的对齐图像的装置的示意性框图。

图5是本发明实施例的对齐图像的装置的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

图像对齐领域，图像间的结构相似性度量的选取直接关系到最终图像对齐的效果。现有技术中，结构相似性度量包括：颜色、梯度、SIFT特征点、互信息等。但是，由于多模态多光谱图像在颜色和梯度方向上具有较大反差，以上任意一种结构相似性度量都很难准确描述多模态多光谱图像之间的结构相似性。

本发明实施例中引入互相关度量(也可以称为鲁棒选择性标准化互相关度量)模型来描述图像间的结构相似性，该互相关度量模型是基于图像间颜色的互相关和梯度的互相关建立的，或者说，互相关度量模型用于指示图像间颜色的互相关和梯度的互相关。假设待对齐的图像为第一图像和第二图像，第一图像用I₁表示，第二图像用I₂表示，互相关度量模型可以表示为公式：

其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，

p表示第一图像的像素点的坐标，该坐标可以是预先选取的任意坐标，只要将待对齐的图像均放置在该坐标系中即可，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示第一坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，

图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示图像块内，各像素点的像素均值组成的一维列向量，

表示图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示第二图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，

表示以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β为权重，用于控制函数ρ(x)的形状。

在上述公式中，Φ_Ι(p,w_p)是标准化互相关函数，定义在第一图像I₁中以p为中心的图像块(patch)和第二图像I₂中以p+w_p为中心的图像块的颜色空间上。同理，

也是标准化互相关函数，定义在第一图像I₁中以p为中心的图像块(patch)和第二图像I₂中以p+w_p为中心的图像块的梯度空间上。

此外，互相关模型中引入鲁棒函数

该鲁棒函数是连续可导函数，其函数图像可参见图2。图2中的左侧为鲁棒函数的函数曲线，右侧为鲁棒函数的导函数的函数曲线。从图2可以看出，该鲁棒函数是关于x的增函数，但随着x的增大，该鲁棒函数的增长速度越来越慢，起到了很好的鲁棒效果。

下面结合图3，详细描述本发明实施例的对齐图像的方法。

图3是本发明实施例的对齐图像的方法的示意性流程图。图3的方法包括：

310、获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括第一图像中像素点在选取的坐标系中的坐标，第一图像中像素点的像素值，以及第一图像中像素点的像素值梯度，第二图像的图像信息包括：第二图像中像素点的像素值，以及第二图像中像素点的像素值梯度，其中，两个图像均位于坐标系中。

320、根据两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，第一坐标偏移量用于指示两个图像间待对齐的像素点在坐标系中的位置偏差。

需要说明的是，假设第一图像和第二图像均具有N个像素点，上述第一图像中的像素点可指第一图像中的N个像素点，上述第二图像中的像素点可指第二图像中的N个像素点。上述第一坐标偏移值可以是集合的概念，具体地，第一图像中的N个像素点中各像素点可对应N个第一坐标偏移值。

330、根据第一图像中像素点在坐标系中的坐标和第一坐标偏移量，对齐两个图像。

例如，第一图像中的像素点的坐标为p，p点对应的第一坐标偏移量为w_p，步骤330可包括：先找到第二图像的像素点p+w_p的像素值x，然后将第二图像的像素点p的像素值y更新为像素值x。

由上可知，多模态多光谱的图像具有颜色反差大和梯度大小和方向反差大的特点，本发明实施例中引入了互相关度量模型，由于互相关度量模型同时考虑图像间颜色的互相关和梯度的互相关，与现有的基于SIFT特征点的图像对齐技术，更适合多模态多光谱图像间的对齐，提高了图像对齐的准确性。

可选地，作为一个实施例，在步骤320之前，图3的方法还可包括：获取第三图像的图像信息，第三图像的图像信息包括：第三图像中像素点的像素值，以及第三图像中像素点的像素值梯度，其中，第三图像位于坐标系中，且第一图像和第三图像为待对齐的初始图像；根据初始图像的图像信息，通过互相关度量模型，确定坐标变换矩阵，坐标变换矩阵用于指示初始图像间待对齐的像素点在坐标系中的空间位置关系；根据坐标变换矩阵，确定第二坐标偏移量，第二坐标偏移量用于指示初始图像间的待对齐的像素点在坐标系中的位置偏差；根据第二坐标偏移量和第三图像中像素点的像素值，得到第二图像。

可以这样理解，第一图像和第三图像是待对齐的初始图像，本实施例将第一图像和第三图像的对齐分解成两次对齐，先进行一次全局对齐，再进行一次像素级对齐，其中，经过全局对齐，第三图像会被更新成为第二图像。也就是说，第二图像是第一图像和第三图像对齐过程中生成的中间图像。

需要说明的是，上述图像的全局对齐是通过求解坐标变换矩阵来实现的，上述坐标变换矩阵可以是一个单应性(Homography)矩阵，该坐标变换矩阵可用来描述第三图像经过全局平移、旋转和缩放与第一图像进行大体对齐。

下面给出坐标变换矩阵的求解过程的实施例。

该坐标变换矩阵可通过计算能量函数

的最小值求解，其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，H表示坐标变换矩阵，且H满足[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，I表示单位矩阵，p表示第一图像中像素点在坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示第二坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示图像块内，各像素点的像素均值组成的一维列向量，

表示图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_3,p表示第三图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I′_3,p表示以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，

表示以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β和τ为常数，β用于控制函数ρ(x)的形状，τ为E₂(p,w_p)中

项的权重。

需要说明的是，

中，由于H满足[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，先将w_p替换为H，然后可以采用最速下降法求解该方程的最小值。为了进一步提高算法的效率，可以采用图像金字塔法逐步优化H。具体而言，先从图像金字塔的底层(底层具有最低分辨率)快速求解，然后将结果传回上层继续优化，最后在分辨率最高的金字塔顶层进行优化。这种优化策略能够显著提高算法的运行速度。

得到坐标变化矩阵之后，上述根据坐标变换矩阵，确定第二坐标偏移量可包括：根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定第二坐标偏移量。

具体地，当确定了H之后，通过将第一图像中各像素点的坐标(x_p,y_p)代入上式，计算出该像素点对应的第二坐标偏移值(u_p,v_p)。

得到第二坐标偏移值之后，根据公式I₂(p)＝I₃(p+w_p)，得到第二图像，其中，I₂(p)表示第二图像在p的像素值，I₃(p+w_p)表示第三图像在p+w_p的像素值。此时，就得到了上述第二图像。

完成图像的全局对齐后，接下来可以进行像素级的对齐。具体而言，可根据公式

确定第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，

p表示第一图像的像素点在坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w'_p表示第一坐标偏移量，u'_p表示w'_p的横坐标，v'_p表示w'_p的纵坐标，I_1,p表示第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示第二图像的以p+w'_p为中心的图像块内，各像素点的像素值组成的一维列向量，

表示以p+w'_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示以p+w'_p为中心的图像块内，各像素点的像素均值组成的一维列向量，

表示以p+w'_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，λ₁、β、λ₂和τ为常数，λ₁和λ₂为E₃(w'_p)中第二项和第三项的权重，β用于控制函数ρ(x)的形状，τ为E₂(p,w'_p)中

项的权重，N(p)表示第一图像中像素点p的相邻像素点组成的集合，q表示集合中的任意像素点，w_q表示q与q在第二图像中的待对齐像素点之间的坐标偏移量，ε为常数。

具体地，

中的第一项

可以让第一图像和第二图像的对齐是在互相关度量模型的约束下进行，第二项

和第三项

是正则项，可以约束像素间的偏移量w'_p是平滑的。第二项可以保证像素间的偏移量w'_p是分片平滑的，其中，

是鲁棒函数，ε是较小的常数，可以去1E-4。第三项是中值滤波项，用于提高w'_p的平滑性，同时使得求解w'_p的精确性提高。

此外，该能量函数的求解是一个变分问题，可以采用欧拉-拉格朗日方程求解。为了加速求解，可以采用从粗糙到精细的求解过程。具体而言，可以先建立第一图像和第二图像的高斯金字塔，从高斯金字塔的最粗糙层开始求解，接下来将粗糙层的结果传递至精细层，作为精细层的初值继续求解，知道传递至最精层(即原图)。该求解策略可以显著提高算法的运行速度，同时能够精确求解w'_p较大的情况。

应理解，在本发明的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

上文中结合图1至图3，详细描述了根据本发明实施例的对齐图像的方法，下面将结合图4至图5，描述根据本发明实施例的对齐图像的装置。

应理解，图4和图5中的装置能够实现图3中的各个步骤，为避免重复，此处不再详述。

图4是本发明实施例的对齐图像的装置的示意性框图。图4的装置400包括：

第一获取单元410，用于获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括所述第一图像中像素点在选取的坐标系中的坐标，所述第一图像中像素点的像素值，以及所述第一图像中像素点的像素值梯度，第二图像的图像信息包括：所述第二图像中像素点的像素值，以及所述第二图像中像素点的像素值梯度，其中，所述两个图像均位于所述坐标系中；

第一确定单元420，用于根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，所述第一坐标偏移量用于指示所述两个图像间待对齐的像素点在所述坐标系中的位置偏差；

对齐单元430，用于根据所述第一图像中像素点在所述坐标系中的坐标和所述第一坐标偏移量，对齐所述两个图像。

可选地，作为一个实施例，所述装置400还可包括：第二获取单元，用于获取第三图像的图像信息，所述第三图像的图像信息包括：所述第三图像中像素点的像素值，以及所述第三图像中像素点的像素值梯度，其中，所述第三图像位于所述坐标系中，且所述第一图像和所述第三图像为待对齐的初始图像；第二确定单元，用于根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，所述坐标变换矩阵用于指示所述初始图像间待对齐的像素点在所述坐标系中的空间位置关系；第三确定单元，用于根据所述坐标变换矩阵，确定第二坐标偏移量，所述第二坐标偏移量用于指示所述初始图像间的待对齐的像素点在所述坐标系中的位置偏差；第四确定单元，用于根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像。

可选地，作为一个实施例，所述第二确定单元具体用于通过计算

的最小值，确定所述坐标变换矩阵，其中，

项的权重。

可选地，作为一个实施例，所述第三确定单元具体用于根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定所述第二坐标偏移量。

可选地，作为一个实施例，所述第四确定单元具体用于根据公式I₂(p)＝I₃(p+w_p)，得到所述第二图像，其中，I₂(p)表示所述第二图像在p的像素值，I₃(p+w_p)表示所述第三图像在p+w_p的像素值。

可选地，作为一个实施例，所述第一确定单元420具体用于根据公式

确定所述第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，

可选地，作为一个实施例，所述互相关度量模型为：

其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，

图5是本发明实施例的对齐图像的装置的示意性框图。图5的装置500包括：

存储器510，用于存储程序；

处理器520，用于执行程序，当所述程序被执行时，所述处理器520用于获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括所述第一图像中像素点在选取的坐标系中的坐标，所述第一图像中像素点的像素值，以及所述第一图像中像素点的像素值梯度，第二图像的图像信息包括：所述第二图像中像素点的像素值，以及所述第二图像中像素点的像素值梯度，其中，所述两个图像均位于所述坐标系中；根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，所述第一坐标偏移量用于指示所述两个图像间待对齐的像素点在所述坐标系中的位置偏差；根据所述第一图像中像素点在所述坐标系中的坐标和所述第一坐标偏移量，对齐所述两个图像。

可选地，作为一个实施例，所述处理器520还可用于获取第三图像的图像信息，所述第三图像的图像信息包括：所述第三图像中像素点的像素值，以及所述第三图像中像素点的像素值梯度，其中，所述第三图像位于所述坐标系中，且所述第一图像和所述第三图像为待对齐的初始图像；根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，所述坐标变换矩阵用于指示所述初始图像间待对齐的像素点在所述坐标系中的空间位置关系；根据所述坐标变换矩阵，确定第二坐标偏移量，所述第二坐标偏移量用于指示所述初始图像间的待对齐的像素点在所述坐标系中的位置偏差；根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像。

可选地，作为一个实施例，所述处理器520具体用于通过计算

的最小值，确定所述坐标变换矩阵，其中，

项的权重。

可选地，作为一个实施例，所述处理器520具体用于根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定所述第二坐标偏移量。

可选地，作为一个实施例，所述处理器520具体用于根据公式I₂(p)＝I₃(p+w_p)，得到所述第二图像，其中，I₂(p)表示所述第二图像在p的像素值，I₃(p+w_p)表示所述第三图像在p+w_p的像素值。

可选地，作为一个实施例，所述处理器520具体用于根据公式

确定所述第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，

可选地，作为一个实施例，其特征在于，所述互相关度量模型为：

其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，

应理解，在本发明实施例中，术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系。例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种对齐图像的方法，其特征在于，包括：

获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括所述第一图像中像素点在选取的坐标系中的坐标，所述第一图像中像素点的像素值，以及所述第一图像中像素点的像素值梯度，第二图像的图像信息包括：所述第二图像中像素点的像素值，以及所述第二图像中像素点的像素值梯度，其中，所述两个图像均位于所述坐标系中；

根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，所述第一坐标偏移量用于指示所述两个图像间待对齐的像素点在所述坐标系中的位置偏差；

根据所述第一图像中像素点在所述坐标系中的坐标和所述第一坐标偏移量，对齐所述两个图像。
如权利要求1所述的方法，其特征在于，

在根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量之前，所述方法还包括：

获取第三图像的图像信息，所述第三图像的图像信息包括：所述第三图像中像素点的像素值，以及所述第三图像中像素点的像素值梯度，其中，所述第三图像位于所述坐标系中，且所述第一图像和所述第三图像为待对齐的初始图像；

根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，所述坐标变换矩阵用于指示所述初始图像间待对齐的像素点在所述坐标系中的空间位置关系；

根据所述坐标变换矩阵，确定第二坐标偏移量，所述第二坐标偏移量用于指示所述初始图像间的待对齐的像素点在所述坐标系中的位置偏差；

根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像。
如权利要求2所述的方法，其特征在于，所述根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，包括：

通过计算
的最小值，确定所述坐标变换矩阵，其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，H表示所述坐标变换矩阵，且H满足[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，I表示单位矩阵，p表示所述第一图像中像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示所述第二坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_3,p表示所述第三图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I′_3,p表示所述以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β和τ为常数，β用于控制函数ρ(x)的形状，τ为E₂(p,w_p)中
项的权重。
如权利要求3所述的方法，其特征在于，所述根据所述坐标变换矩阵，确定第二坐标偏移量，包括：

根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定所述第二坐标偏移量。
如权利要求4所述的方法，其特征在于，所述根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像，包括：

根据公式I₂(p)＝I₃(p+w_p)，得到所述第二图像，其中，I₂(p)表示所述第二图像在p的像素值，I₃(p+w_p)表示所述第三图像中在p+w_p的像素值。
如权利要求1-5中任一项所述的方法，其特征在于，所述根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，包括：

根据公式
确定所述第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，
p表示所述第一图像的像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w'_p表示所述第一坐标偏移量，u'_p表示w'_p的横坐标，v'_p表示w'_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示所述第二图像的以p+w'_p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述以p+w'_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I′_2,p表示所述以p+w'_p为中心的图像块内，各像素点的像素均值组成的一维列向量，
表示所述以p+w'_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，λ₁、β、λ₂和τ为常数，λ₁和λ₂为E₃(w'_p)中第二项和第三项的权重，β用于控制函数ρ(x)的形状，τ为E₂(p,w'_p)中
项的权重，N(p)表示所述第一图像中像素点p的相邻像素点组成的集合，q表示所述集合中的任意像素点，w_q表示q与 q在所述第二图像中的待对齐像素点之间的坐标偏移量，ε为常数。
如权利要求1-6中任一项所述的方法，其特征在于，所述互相关度量模型为：

其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，
p表示所述第一图像的像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示所述第一坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，
所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示所述第二图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示所述以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β为权重，用于控制函数ρ(x)的形状。
一种对齐图像的装置，其特征在于，包括：

第一获取单元，用于获取待对齐的两个图像的图像信息，其中，第一图像的图像信息包括所述第一图像中像素点在选取的坐标系中的坐标，所述第一图像中像素点的像素值，以及所述第一图像中像素点的像素值梯度，第二图像的图像信息包括：所述第二图像中像素点的像素值，以及所述第二图像中像素点的像素值梯度，其中，所述两个图像均位于所述坐标系中；

第一确定单元，用于根据所述两个图像的图像信息，通过互相关度量模型，确定第一坐标偏移量，所述第一坐标偏移量用于指示所述两个图像间待对齐的像素点在所述坐标系中的位置偏差；

对齐单元，用于根据所述第一图像中像素点在所述坐标系中的坐标和所述第一坐标偏移量，对齐所述两个图像。
如权利要求8所述的装置，其特征在于，所述装置还包括：

第二获取单元，用于获取第三图像的图像信息，所述第三图像的图像信息包括：所述第三图像中像素点的像素值，以及所述第三图像中像素点的像素值梯度，其中，所述第三图像位于所述坐标系中，且所述第一图像和所述第三图像为待对齐的初始图像；

第二确定单元，用于根据所述初始图像的图像信息，通过所述互相关度量模型，确定坐标变换矩阵，所述坐标变换矩阵用于指示所述初始图像间待对齐的像素点在所述坐标系中的空间位置关系；

第三确定单元，用于根据所述坐标变换矩阵，确定第二坐标偏移量，所述第二坐标偏移量用于指示所述初始图像间的待对齐的像素点在所述坐标系中的位置偏差；

第四确定单元，用于根据所述第二坐标偏移量和所述第三图像中像素点的像素值，得到所述第二图像。
如权利要求9所述的装置，其特征在于，所述第二确定单元具体用于通过计算
的最小值，确定所述坐标变换矩阵，其中，

p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，H表示所述坐标变换矩阵，且H满足[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，I表示单位矩阵，p表示所述第一图像中像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示所述第二坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_3,p表示所述第三图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I′_3,p表示所述以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β和τ为常数，β用于控制函数ρ(x)的形状，τ为E₂(p,w_p)中
项的权重。
如权利要求10所述的装置，其特征在于，所述第三确定单元具体用于根据公式[u_p,v_p,1]^T＝[x_p,y_p,1]^T(H-I)，确定所述第二坐标偏移量。
如权利要求11所述的装置，其特征在于，所述第四确定单元具体用于根据公式I₂(p)＝I₃(p+w_p)，得到所述第二图像，其中，I₂(p)表示所述第二图像在p的像素值，I₃(p+w_p)表示所述第三图像在p+w_p的像素值。
如权利要求8-12中任一项所述的装置，其特征在于，所述第一确定单元具体用于根据公式
确定所述第一坐标偏移量，其中，

p＝(x_p,y_p)^T，w'_p＝(u'_p,v'_p)^T，
p表示所述第一图像的像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w'_p表示所述第一坐标偏移量，u'_p表示w'_p的横坐标，v'_p表示w'_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p表示所述图像块内，各像素点的像素均值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示所述第二图像的以p+w'_p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述以p+w'_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示所述以p+w'_p为中心的图像块内，各像素点的像素均值组成的一维列向量，
表示所述以p+w'_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，λ₁、β、λ₂和τ为常数，λ₁和λ₂为E₃(w'_p)中第二项和第三项的权重，β用于控制函数ρ(x)的形状，τ为E₂(p,w'_p)中
项的权重，N(p)表示所述第一图像中像素点p的相邻像素点组成的集合，q表示所述集合中的任意像素点，w_q表示q与q在所述第二图像中的待对齐像素点之间的坐标偏移量，ε为常数。
如权利要求8-13中任一项所述的装置，其特征在于，所述互相关度量模型为：
其中，
p＝(x_p,y_p)^T，w_p＝(u_p,v_p)^T，
p表示所述第一图像的像素点在所述坐标系中的坐标，x_p表示p的横坐标，y_p表示p的纵坐标，w_p表示所述第一坐标偏移量，u_p表示w_p的横坐标，v_p表示w_p的纵坐标，I_1,p表示所述第一图像的以p为中心的图像块内，各像素点的像素值组成的一维列向量，
所述图像块内，各像素点的像素值梯度组成的一维列向量，I′_1,p 表示所述图像块内，各像素点的像素均值组成的一维列向量，
表示所述图像块内，各像素点的像素值梯度的均值组成的一维列向量，I_2,p表示所述第二图像的以p+w_p为中心的图像块内，各像素点的像素值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度组成的一维列向量，I'_2,p表示所述以p+w_p为中心的图像块内，各像素点的像素均值组成的一维列向量，
表示所述以p+w_p为中心的图像块内，各像素点的像素值梯度的均值组成的一维列向量，β为权重，用于控制函数ρ(x)的形状。