CN107862707A

CN107862707A - 一种基于卢卡斯‑卡纳德图像对齐的图像配准方法

Info

Publication number: CN107862707A
Application number: CN201711075930.3A
Authority: CN
Inventors: 夏春秋
Original assignee: Shenzhen Vision Technology Co Ltd
Current assignee: Shenzhen Vision Technology Co Ltd
Priority date: 2017-11-06
Filing date: 2017-11-06
Publication date: 2018-03-30

Abstract

本发明中提出的一种基于卢卡斯‑卡纳德图像对齐的图像配准方法，其主要内容包括：直接每像素损失函数，卢卡斯‑卡纳德算法，粗略对齐，用卷积神经网络特征图替换金字塔，球型拼接，其过程为，先通过迭代找到参数集使图像变形成对应模型，在每次迭代中使用损失函数相对于变形参数向量的梯度，确定使更接近函数最小值的参数更新，接着使用高斯模糊平滑原始图像去除图像中的细节来简化损失，然后用卷积神经网络特征图替换金字塔，最后实时球型拼接系统跟踪旋转相机运动，并产生关键帧图，渲染成球形全景图。本发明采用卢卡斯‑卡纳德算法，减少了配准技术对于照明、表明反射率和其他成像因素的依赖，使配准时更加快速精准，计算效率也大大提高。

Description

一种基于卢卡斯-卡纳德图像对齐的图像配准方法

技术领域

本发明涉及图像配准领域，尤其是涉及了一种基于卢卡斯-卡纳德图像对齐的图像配准方法。

背景技术

图像配准是图像处理研究领域中的一个典型问题和技术难点，其目的在于比较或融合针对同一对象在不同条件下获取的图像，例如图像会来自不同的采集设备，取自不同的时间、不同的拍摄视角等等，有时也需要用到针对不同对象的图像配准问题。图像配准技术在计算机视觉、医学图像处理以及材料力学等领域都具有广泛的应用。根据具体应用的不同，有的侧重于通过变换结果融合两幅图像，有的侧重于研究变换本身以获得对象的一些力学属性。将各种图像结合起来，在同一图像上显示各自的信息，为临床医学诊断提供多数据多信息的图像，这成为极具应用价值的技术，而准确高效的图像配准则是关键和难点。因而图像配准技术无论是在计算机视觉方面，还是在临床医学诊断都具有极重要的意义。然而，现有的配准技术对照明、表明反射率和其他成像因素具有强烈依赖性，导致图像模型配准失败。

本发明提出了一种基于卢卡斯-卡纳德图像对齐的图像配准方法，先通过迭代找到参数集使图像变形成对应模型，在每次迭代中使用损失函数相对于变形参数向量的梯度，确定使更接近函数最小值的参数更新，接着使用高斯模糊平滑原始图像去除图像中的细节来简化损失，然后用卷积神经网络特征图替换金字塔，最后实时球型拼接系统跟踪旋转相机运动，并产生关键帧图，渲染成球形全景图。本发明采用卢卡斯-卡纳德算法，减少了配准技术对于照明、表明反射率和其他成像因素的依赖，使配准时更加快速精准，计算效率也大大提高。

发明内容

针对现有的配准技术对照明、表明反射率和其他成像因素具有强烈依赖性的问题，本发明的目的在于提供一种基于卢卡斯-卡纳德图像对齐的图像配准方法，先通过迭代找到参数集使图像变形成对应模型，在每次迭代中使用损失函数相对于变形参数向量的梯度，确定使更接近函数最小值的参数更新，接着使用高斯模糊平滑原始图像去除图像中的细节来简化损失，然后用卷积神经网络特征图替换金字塔，最后实时球型拼接系统跟踪旋转相机运动，并产生关键帧图，渲染成球形全景图。

为解决上述问题，本发明提供一种基于卢卡斯-卡纳德图像对齐的图像配准方法，其主要内容包括：

(一)直接每像素损失函数；

(二)卢卡斯-卡纳德算法；

(三)粗略对齐；

(四)用卷积神经网络(CNN)特征图替换金字塔；

(五)球型拼接。

其中，所述的直接每像素损失函数，图像对齐(配准)需要移动和变形常量模板图像以找到与参考图像的最佳匹配；图像配准的核心是生成的变形模型，其被参数化以表示相对相机场景运动的自由度；通过迭代地找到更好的参数集来使图像变形成对应的模型，进行对齐；

为了评估一致性，必须定义图像相似度的度量；在卢卡斯-卡纳德(LK)的标准形式中，使用平方差(SSD)的和；这给出了以下目标函数：

其中，I_r是参考图像，I_t是模板图像，x是图像像素位置，是生成的变形模型，旨在解决的变形参数向量为p。

其中，所述的卢卡斯-卡纳德算法，在LK对齐中，在每次迭代中，使用公式(1)中的损失函数相对于变形参数向量p的梯度，并确定使更接近函数最小值的参数更新Δp；

以下更新法则：

W(x；p)←W(x；p)οW(x；p)^-1 (3)

线性化公式(2)导致一个封闭形式的解决方案：

其中，

r＝I_r(W(x；p))-I_t(x) (6)

会聚处的形状在很大程度上取决于图像内容，即图像中存在的纹理和模糊度的数量和类型；由于损失格局通常在实际转化附近局部凸起，因此优化需要良好的初始化才能成功地收敛于正确的解决方案。

进一步地，所述的LK对齐，使用一个简单的卢卡斯-卡纳德图像对齐方式，其中有一个迭代次数超过了一个金字塔的粗糙度水平，并且通过预先训练的CNN的卷积特征图的层次简单地替换了图像金字塔。

其中，所述的粗略对齐，为了增加收敛处的大小，可以使用高斯模糊平滑原始图像，通过去除图像中的细节来简化损失；高斯平滑图像通常被下采样，因为它不会导致信息丢失并会减少要处理的像素数量；由于下采样图像中的像素对应于原始图像中的多重像素，所以两者之间的距离缩短，从而增加了收敛处的大小；出于同样的原因，在较小版本的图像上执行的对准的精度也降低；

常见的方法是使用高度低采样和模糊图像来开始优化，以获得初始估计，使用更详细的图像版本进行细化，这可以被认为是图像的退化版本的金字塔。

其中，所述的用卷积神经网络(CNN)特征图替换金字塔，标准分类中的卷积输出CNN形成与基于RGB的LK图像对齐中使用的金字塔相似的金字塔；这种金字塔的连续层编码越来越多的语义信息，从第一层中的简单几何滤波器开始；

金字塔的每个级别采用多通道图像(张量)的形式，其中每个通道包含对某个学习卷积滤波器的响应；从粗略到精细的方式对齐，从最高的低分辨率层开始，并向下进行到较低的几何层，以细化对齐；这个过程包括特征提取和体积对齐。

进一步地，所述的特征提取，金字塔是通过应用连续的卷积，随后是非线性激活函数创建的，偶尔下采样，非常类似于标准CNN；对于卷积的权重进行图像分类任务的训练；网络由13层卷积组成。

进一步地，所述的体积对齐，对于对齐体积，使用逆组合损失函数公式：

与普通图像类似，将深度N的体积定义为一个函数为了解决参数更新Δp，首先需要计算这个非线性最小二乘系统的雅可比矩阵和黑塞矩阵：

更新使用正常方程计算：

Δp＝H^-1b (11)

为了实现大容量的实时对齐；每个计算线程计算每像素值，使用公式(9)和(10)将其简化为单个矩阵。

其中，所述的球型拼接，为了使用测试跟踪，开发一个实时球型拼接系统；它跟踪旋转相机运动，并产生一个关键帧图，渲染成一个球形全景图；对于纯旋转相机运动，由矩阵R描述的由旋转分隔的具有本征矩阵K的两个相机帧之间的单应性由下式给出：KRK^-1；因此，生成变形函数的形式如下：

其中，是均匀化像素位置x，π是投影函数；用ω∈R³参数化增量旋转R(ω)；矢量ω描述的增量旋转映射到组元素：

R(ω)＝exp(ω^×) (13)

要优化的最终损失函数的形式如下：

关键帧图像投影到最终组合曲面上，使用球形投影，其将每个关键帧投影到单位球体上，随后将其展开到2D表面以供查看；使用大小为224×224的图像来提取特征并对齐所有级别。

进一步地，所述的实时球型拼接系统，该系统使用整个金字塔实时运行15-20帧/秒；提取13层卷积特征每帧需要大约1ms；从GPU复制数据需要10ms，这可以通过进一步修改软件来避免；执行对齐所花费的时间取决于在不同级别执行的迭代次数，通常在40-60ms左右。

附图说明

图1是本发明一种基于卢卡斯-卡纳德图像对齐的图像配准方法的系统框架图。

图2是本发明一种基于卢卡斯-卡纳德图像对齐的图像配准方法的直接每像素损失函数。

图3是本发明一种基于卢卡斯-卡纳德图像对齐的用卷积神经网络特征图替换金字塔。

图4是本发明一种基于卢卡斯-卡纳德图像对齐的图像配准方法的球型拼接。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互结合，下面结合附图和具体实施例对本发明作进一步详细说明。

图1是本发明一种基于卢卡斯-卡纳德图像对齐的图像配准方法的系统框架图。主要包括直接每像素损失函数，卢卡斯-卡纳德算法，粗略对齐，用卷积神经网络(CNN)特征图替换金字塔，球型拼接。

卢卡斯-卡纳德算法，在LK对齐中，在每次迭代中，使用公式(6)中的损失函数相对于变形参数向量p的梯度，并确定使更接近函数最小值的参数更新Δp；

以下更新法则：

W(x；p)←W(x；p)οW(x；p)^-1 (2)

线性化公式(1)导致一个封闭形式的解决方案：

其中，

r＝I_r(W(x；p))-I_t(x) (5)

使用一个简单的卢卡斯-卡纳德图像对齐方式，其中有一个迭代次数超过了一个金字塔的粗糙度水平，并且通过预先训练的CNN的卷积特征图的层次简单地替换了图像金字塔。

粗略对齐，为了增加收敛处的大小，可以使用高斯模糊平滑原始图像，通过去除图像中的细节来简化损失；高斯平滑图像通常被下采样，因为它不会导致信息丢失并会减少要处理的像素数量；由于下采样图像中的像素对应于原始图像中的多重像素，所以两者之间的距离缩短，从而增加了收敛处的大小；出于同样的原因，在较小版本的图像上执行的对准的精度也降低；

图2是本发明一种基于卢卡斯-卡纳德图像对齐的图像配准方法的直接每像素损失函数。图像对齐(配准)需要移动和变形常量模板图像以找到与参考图像的最佳匹配；图像配准的核心是生成的变形模型，其被参数化以表示相对相机场景运动的自由度；通过迭代地找到更好的参数集来使图像变形成对应的模型，进行对齐；

图3是本发明一种基于卢卡斯-卡纳德图像对齐的用卷积神经网络特征图替换金字塔。标准分类中的卷积输出CNN形成与基于RGB的LK图像对齐中使用的金字塔相似的金字塔；这种金字塔的连续层编码越来越多的语义信息，从第一层中的简单几何滤波器开始；

金字塔是通过应用连续的卷积，随后是非线性激活函数创建的，偶尔下采样，非常类似于标准CNN；对于卷积的权重进行图像分类任务的训练；网络由13层卷积组成。

对于对齐体积，使用逆组合损失函数公式：

更新使用正常方程计算：

Δp＝H^-1b (11)

图4是本发明一种基于卢卡斯-卡纳德图像对齐的图像配准方法的球型拼接。为了使用测试跟踪，开发一个实时球型拼接系统；它跟踪旋转相机运动，并产生一个关键帧图，渲染成一个球形全景图；对于纯旋转相机运动，由矩阵R描述的由旋转分隔的具有本征矩阵K的两个相机帧之间的单应性由下式给出：KRK^-1；因此，生成变形函数的形式如下：

R(ω)＝exp(ω^×) (13)

要优化的最终损失函数的形式如下：

实时球型拼接系统使用整个金字塔实时运行15-20帧/秒；提取13层卷积特征每帧需要大约1ms；从GPU复制数据需要10ms，这可以通过进一步修改软件来避免；执行对齐所花费的时间取决于在不同级别执行的迭代次数，通常在40-60ms左右。

对于本领域技术人员，本发明不限制于上述实施例的细节，在不背离本发明的精神和范围的情况下，能够以其他具体形式实现本发明。此外，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围，这些改进和变型也应视为本发明的保护范围。因此，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims

1.一种基于卢卡斯-卡纳德图像对齐的图像配准方法，其特征在于，主要包括直接每像素损失函数(一)；卢卡斯-卡纳德算法(二)；粗略对齐(三)；用卷积神经网络(CNN)特征图替换金字塔(四)；球型拼接(五)。

2.基于权利要求书1所述的直接每像素损失函数(一)，其特征在于，图像对齐(配准)需要移动和变形常量模板图像以找到与参考图像的最佳匹配；图像配准的核心是生成的变形模型，其被参数化以表示相对相机场景运动的自由度；通过迭代地找到更好的参数集来使图像变形成对应的模型，进行对齐；

<mrow> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mi>P</mi> </munder> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>I</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <mi>p</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>I</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

3.基于权利要求书1所述的卢卡斯-卡纳德算法(二)，其特征在于，在LK对齐中，在每次迭代中，使用公式(1)中的损失函数相对于变形参数向量p的梯度，并确定使更接近函数最小值的参数更新Δp；

<mrow> <mi>&Delta;</mi> <mi>p</mi> <mo>=</mo> <mi>arg</mi> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mi>P</mi> </munder> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>I</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <mi>p</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>I</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <mi>p</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

以下更新法则：

线性化公式(2)导致一个封闭形式的解决方案：

<mrow> <mi>&Delta;</mi> <mi>p</mi> <mo>=</mo> <msup> <mrow> <mo>(</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <msup> <mi>J</mi> <mi>T</mi> </msup> <mi>J</mi> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <msup> <mi>J</mi> <mi>T</mi> </msup> <mi>r</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

其中，

r＝I_r(W(x；p))-I_t(x) (6)

4.基于权利要求书3所述的LK对齐，其特征在于，使用一个简单的卢卡斯-卡纳德图像对齐方式，其中有一个迭代次数超过了一个金字塔的粗糙度水平，并且通过预先训练的CNN的卷积特征图的层次简单地替换了图像金字塔。

5.基于权利要求书1所述的粗略对齐(三)，其特征在于，为了增加收敛处的大小，可以使用高斯模糊平滑原始图像，通过去除图像中的细节来简化损失；高斯平滑图像通常被下采样，因为它不会导致信息丢失并会减少要处理的像素数量；由于下采样图像中的像素对应于原始图像中的多重像素，所以两者之间的距离缩短，从而增加了收敛处的大小；出于同样的原因，在较小版本的图像上执行的对准的精度也降低；

6.基于权利要求书1所述的用卷积神经网络(CNN)特征图替换金字塔(四)，其特征在于，标准分类中的卷积输出CNN形成与基于RGB的LK图像对齐中使用的金字塔相似的金字塔；这种金字塔的连续层编码越来越多的语义信息，从第一层中的简单几何滤波器开始；

7.基于权利要求书6所述的特征提取，其特征在于，金字塔是通过应用连续的卷积，随后是非线性激活函数创建的，偶尔下采样，非常类似于标准CNN；对于卷积的权重进行图像分类任务的训练；网络由13层卷积组成。

8.基于权利要求书6所述的体积对齐，其特征在于，对于对齐体积，使用逆组合损失函数公式：

<mrow> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>e</mi> <mi>x</mi> </msub> <mrow> <mo>(</mo> <mi>&Delta;</mi> <mi>p</mi> <mo>;</mo> <mi>p</mi> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>V</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <mi>p</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>V</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <mi>W</mi> <mo>(</mo> <mrow> <mi>x</mi> <mo>;</mo> <mi>p</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>J</mi> <mi>x</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mo>&part;</mo> <msub> <mi>e</mi> <mi>x</mi> </msub> </mrow> <mrow> <mo>&part;</mo> <mi>&Delta;</mi> <mi>p</mi> </mrow> </mfrac> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mfrac> <mrow> <mo>&part;</mo> <msub> <mi>e</mi> <mrow> <mi>x</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mrow> <mrow> <mo>&part;</mo> <mi>&Delta;</mi> <mi>p</mi> </mrow> </mfrac> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mfrac> <mrow> <mo>&part;</mo> <msub> <mi>e</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>N</mi> </mrow> </msub> </mrow> <mrow> <mo>&part;</mo> <mi>&Delta;</mi> <mi>p</mi> </mrow> </mfrac> </mtd> </mtr> </mtable> </mfenced> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>N</mi> </mrow> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>H</mi> <mo>:</mo> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <msubsup> <mi>J</mi> <mi>x</mi> <mi>T</mi> </msubsup> <msub> <mi>J</mi> <mi>x</mi> </msub> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>&lsqb;</mo> <msubsup> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mn>1</mn> </mrow> <mi>T</mi> </msubsup> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msubsup> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>N</mi> </mrow> <mi>T</mi> </msubsup> <mo>&rsqb;</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>N</mi> </mrow> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <munderover> <mo>&Sigma;</mo> <mrow> <mi>c</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>c</mi> </mrow> <mi>T</mi> </msubsup> <msub> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>c</mi> </mrow> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>b</mi> <mo>:</mo> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <msubsup> <mi>J</mi> <mi>x</mi> <mi>T</mi> </msubsup> <msub> <mi>e</mi> <mi>x</mi> </msub> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>&lsqb;</mo> <msubsup> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mn>1</mn> </mrow> <mi>T</mi> </msubsup> <mo>,</mo> <mn>...</mn> <mo>,</mo> <msubsup> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>N</mi> </mrow> <mi>T</mi> </msubsup> <mo>&rsqb;</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>e</mi> <mrow> <mi>x</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <msub> <mi>e</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>N</mi> </mrow> </msub> </mtd> </mtr> </mtable> </mfenced> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <munderover> <mo>&Sigma;</mo> <mrow> <mi>c</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msubsup> <mi>J</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>c</mi> </mrow> <mi>T</mi> </msubsup> <msub> <mi>e</mi> <mrow> <mi>x</mi> <mo>,</mo> <mi>c</mi> </mrow> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>10</mn> <mo>)</mo> </mrow> </mrow>

更新使用正常方程计算：

Δp＝H^-1b (11)

9.基于权利要求书1所述的球型拼接(五)，其特征在于，为了使用测试跟踪，开发一个实时球型拼接系统；它跟踪旋转相机运动，并产生一个关键帧图，渲染成一个球形全景图；对于纯旋转相机运动，由矩阵R描述的由旋转分隔的具有本征矩阵K的两个相机帧之间的单应性由下式给出：KRK^-1；因此，生成变形函数的形式如下：

<mrow> <mi>W</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>;</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>&pi;</mi> <mrow> <mo>(</mo> <mi>K</mi> <mi>R</mi> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> <msup> <mi>K</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mover> <mi>x</mi> <mo>&CenterDot;</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>12</mn> <mo>)</mo> </mrow> </mrow>

R(ω)＝exp(ω^×) (13)

要优化的最终损失函数的形式如下：

<mrow> <munder> <mo>&Sigma;</mo> <mi>x</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>V</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>&pi;</mi> <mo>(</mo> <mrow> <mi>K</mi> <mi>R</mi> <mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> <msup> <mi>K</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mover> <mi>x</mi> <mo>&CenterDot;</mo> </mover> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>V</mi> <mi>r</mi> </msub> <mrow> <mo>(</mo> <msup> <mi>KRK</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>14</mn> <mo>)</mo> </mrow> </mrow>

10.基于权利要求书9所述的实时球型拼接系统，其特征在于，该系统使用整个金字塔实时运行15-20帧/秒；提取13层卷积特征每帧需要大约1ms；从GPU复制数据需要10ms，这可以通过进一步修改软件来避免；执行对齐所花费的时间取决于在不同级别执行的迭代次数，通常在40-60ms左右。