CN102682478A

CN102682478A - 一种基于支持向量数据描述的三维目标多视点视图建模方法

Info

Publication number: CN102682478A
Application number: CN2012101508854A
Authority: CN
Inventors: 赵慧洁; 李旭东; 丁昊
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2012-05-15
Filing date: 2012-05-15
Publication date: 2012-09-19

Abstract

一种基于支持向量数据描述的三维目标多视点视图建模方法，它有三大步骤：一：获取测试目标的全姿态图像。二：从获取的全姿态图像集中提取目标特征向量集合{x_i|i＝1，2，...N}。三：使用支持向量数据描述（SVDD）方法表征从图像中提取的特征向量在特征空间中的分布，将得到的少量且具有充分代表性的特征向量作为目标的多视点视图建模结果。本发明针对不同视点下目标图像差异导致的单一目标视图描述不能识别目标的问题，提出了一种冗余信息少、能较好描述目标全姿态特征向量集的三维目标多视点视图建模方法。它在模式识别领域里具有较好的实用价值和广阔的应用前景。

Description

一种基于支持向量数据描述的三维目标多视点视图建模方法

技术领域

本发明涉及一种基于支持向量数据描述的三维目标多视点视图建模方法，属于模式识别领域，具体涉及到目标识别、目标建模和数据约简等领域。用于三维目标多视点建模，适用于不同视点下目标图像差异导致的单一目标视图描述不能识别目标的问题。

背景技术

三维目标识别是计算机视觉领域内一个重要的研究方向。目前在实际应用中获取目标的三维信息往往十分困难，识别三维目标仍然主要通过识别目标二维投影形成的图像完成。目标二维成像（投影）过程导致了部分信息丢失，且在不同视点下，复杂目标的外形差异明显，使得快速稳定的三维目标识别难度很大。

通过对三维目标进行建模以形成对目标外形的全面描述，是解决该问题的手段之一。这就需要研究三维目标的多视点视图建模方法。直观的想法是将多个视点下对目标图像的描述综合起来作为目标的描述。然而对于同一目标，其姿态数目无法穷举，不同描述间也包含了很多冗余信息。因此，需要在约简冗余描述的同时尽可能保留重要的描述。

三维目标多视点视图建模方法一般分为两类：

第一类方法是基于目标几何结构和可见关系的视点球面分割算法，主要基于目标图像的几何拓扑特征，最终得到的建模结果是关于目标的多姿态特征视图集。但这类方法对目标特征视图集的构建依赖于目标的几何结构和特征，一般只能针对一定复杂程度的某一类特定物体，如回转体、二次曲面体等，实际中难以应用。

第二类方法是基于目标特征相似度的聚类算法，将在视点球面上均匀采样得到的目标图像用特征向量描述，并对特征向量集进行聚类，将最终得到的少量目标特征向量作为建模结果。但这类算法存在一些明显的缺点：一是需要知道聚类的类别数，这一般难以事先确定；二是得到的特征视图在进行最近邻分类时无阈值，只能强制划分到某一类中，不能拒绝数据。

发明内容

本发明的目的在于：提供一种基于支持向量数据描述的三维目标多视点视图建模方法，它针对不同视点下目标图像差异导致的单一目标视图描述不能识别目标的缺点，构建了一种描述数量小、冗余信息少、能较好描述目标全姿态特征向量集的三维目标多视点视图建模方法。

其技术方案如下：

本发明一种基于支持向量数据描述的三维目标多视点视图建模方法，它包括以下步骤：

步骤一：获取测试目标的全姿态图像。将目标置于视点球中心，目标姿态变化等效于摄像机在视点球面上的不同点观察目标。在视点球面上均匀采样，获取数量为N的三维目标的全姿态图像集。

步骤二：从获取的全姿态图像集中提取目标特征向量集合{x_i|i＝1，2，…N}。

步骤三：求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数，得到的数量较少的支持向量将作为目标多视点视图的最佳建模结果。

其中，步骤一所述的获取测试目标的全姿态图像，具体实现过程如下：

首先创建需要进行多视点视图建模的目标三维模型。然后将目标模型置于假想视点球的球心，由于目标姿态变化等效于摄像机在视点球面上的不同点观察目标，因此获取摄像机观察视点的过程即为划分视点球面的过程。采用类似划分地球经纬度的方式，以相同间隔均匀划分视点球面，并在对应的划分点处对目标成像，即可获取目标全姿态图像集。

其中，步骤三所述的求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数，得到目标多视点视图的最佳建模结果，具体实现过程如下：

在特征空间中，定义一个包含目标全姿态特征向量集合且封闭的超球体。该超球体由球心a和半径R表征。SVDD算法通过最小化R²来求取包含尽可能多数据点的最小超球体，以对含有目标全姿态外形信息的特征向量集进行描述。考虑到可能在特征向量集中出现的异常点，数据点到球心的距离可能不严格小于半径，求取最小超球体的过程可表述为以下优化问题：

\min (F (R, a) = R^{2} + C \underset{i}{Σ} ξ_{i}) - - - (1)

约束条件为：

{| | x_{i} - a | |}^{2} \leq R^{2} + ξ_{i}, &ForAll; i - - - (2)

ξ_{i} &GreaterEqual; 0, &ForAll; i - - - (3)

使用拉格朗日乘子法求解得到

L (R, a, α_{i}, γ_{i}, ξ_{i}) = R^{2} + C \underset{i}{Σ} ξ_{i} - \underset{i}{Σ} α_{i} {R^{2} + ξ_{i} - ({| | x_{i} | |}^{2} - 2 a \cdot x_{i} + {| | a | |}^{2})} - \underset{i}{Σ} γ_{i} ξ_{i} - - - (4)

令该泛函对R，a，ξ_i偏导数为0，可得

\frac{&PartialD; L}{&PartialD; R} = 0 : \underset{i}{Σ} α_{i} = 1 - - - (5)

\frac{&PartialD; L}{&PartialD; a} = 0 : a = \underset{i}{Σ} α_{i} x_{i} - - - (6)

\frac{&PartialD; L}{&PartialD; ξ_{i}} = 0 : C - α_{i} - γ_{i} = 0 - - - (7)

求解(4)的对偶最大化问题，可有

L = \underset{i}{Σ} α_{i} (x_{i} \cdot x_{i}) - \underset{i, j}{Σ} α_{i} α_{j} (x_{i} \cdot x_{j}) - - - (8)

约束条件为：

\underset{i}{Σ} α_{i} = 1,0 \leq α_{i} \leq C - - - (9)

当α_i>0时对应的特征向量将位于超球体边界附近，成为描述特征向量集合的必要成分，即为目标多视点视图的最佳建模结果。其中，采用核函数K(x_i,x_j)代替内积可以得到更加灵活的柔性数据描述。

本发明具有的优点是：通过求解在特征空间包含大多数目标全姿态图像集特征向量的最优柔性超球体边界来描述目标，方法通用性强，不需要事先知道聚类的类别数，并且优化后得到的超球体参数R可以作为最近邻分类器阈值，克服了一般情况下最近邻分类无法得到合理的分类阈值，不能拒绝待分类目标特征向量的问题。

附图说明

图1为本发明的处理流程图；

图2为本发明中涉及的视点球划分示意图；

图3为本发明的建模结果示意图；

具体实施方式

本发明针对三维目标多视点视图建模问题，提出了一种基于支持向量数据描述的三维目标多视点视图建模方法。

见图1，本发明一种基于支持向量数据描述的三维目标多视点视图建模方法，它包括以下步骤：

首先，获取目标全姿态图像需要创建待建模的目标三维模型。见图2，将目标模型置于视点球的球心。视点球是定义在三维欧氏空间中的假想单位球，不同视点下目标的成像过程可看作目标以球心为起点向不同方向投影的过程，视点球面上每一点P对应一个投影方向向量P，沿投影方向P的正交投影对应于从视点球面上P点看目标。因此获取摄像机观察视点的过程即为划分视点球面的过程。采用类似划分地球经纬度的方式，以相同间隔均匀划分视点球面，并在对应的划分点处对目标成像，即可获取元素个数为N的目标全姿态图像集。

采用合适的特征描述图像中的目标，进一步得到描述该目标全姿态外形信息的特征向量集合{x_i|i＝1，2，…N}。在特征空间中，定义一个包含该集合且封闭的超球体。该超球体由球心a和半径R表征。SVDD算法通过最小化R²来求取包含尽可能多数据点的最小超球体，以对含有目标全姿态外形信息的特征向量集进行描述。对于相同目标不同姿态下对应的特征向量而言，它们将包含于超球体的内部。求取最小超球体的过程可表述为以下优化问题：

min(F(R,a)=R²) (10)

约束条件为：

{| | x_{i} - a | |}^{2} \leq R^{2}, &ForAll; i - - - (11)

考虑到可能在特征向量集T中出现异常点，数据点到球心的距离可能不严格小于半径，引入松弛变量ξ_i≥0，上述问题变为：

\min (F (R, a) = R^{2} + C \underset{i}{Σ} ξ_{i})

约束条件为：

{| | x_{i} - a | |}^{2} \leq R^{2} + ξ_{i}, &ForAll; i

ξ_{i} &GreaterEqual; 0, &ForAll; i

其中参数C控制球体体积和误差间的折衷。

使用拉格朗日乘子法得到

L (R, a, α_{i}, γ_{i}, ξ_{i}) = R^{2} + C \underset{i}{Σ} ξ_{i} - \underset{i}{Σ} α_{i} {R^{2} + ξ_{i} - ({| | x_{i} | |}^{2} - 2 a \cdot x_{i} + {| | a | |}^{2})} - \underset{i}{Σ} γ_{i} ξ_{i}

其中α_i≥0，γ_i≥0为拉格朗日乘子。

令该泛函对R，a，ξ_i偏导数为0，可得

\frac{&PartialD; L}{&PartialD; R} = 0 : \underset{i}{Σ} α_{i} = 1

\frac{&PartialD; L}{&PartialD; a} = 0 : a = \underset{i}{Σ} α_{i} x_{i}

\frac{&PartialD; L}{&PartialD; ξ_{i}} = 0 : C - α_{i} - γ_{i} = 0

代入(4)式。求解(4)式相对于R，a，ξ_i的最小化问题可以转化为求解其对偶最大化问题，因此有

L = \underset{i}{Σ} α_{i} (x_{i} \cdot x_{i}) - \underset{i, j}{Σ} α_{i} α_{j} (x_{i} \cdot x_{j})

约束条件为：

\underset{i}{Σ} α_{i} = 1,0 \leq α_{i} \leq C

根据KKT（Karush-Kuhn-Tucker）条件，当α_i>0时对应的特征向量将位于超球体边界附近，成为描述特征向量集合的必要成分，即为目标多视点视图的最佳建模结果，见图3。

采用核函数K(x_i,x_j)代替(8)中的内积可以得到更加灵活的柔性数据描述：

L = \underset{i}{Σ} α_{i} K (x_{i} \cdot x_{i}) - \underset{i, j}{Σ} α_{i} α_{j} K (x_{i} \cdot x_{j}) - - - (12)

判断新特征向量z是否被接受时，判断其是否满足：

K (z \cdot z) - 2 \underset{i}{Σ} α_{i} K (z \cdot x_{i}) + \underset{i, j}{Σ} α_{i} α_{j} K (x_{i} \cdot x_{j}) \leq R^{2} - - - (13)

若满足则接受，反之则拒绝。

当特征空间中分布有多个目标的特征向量时，不同目标的超球体间可能会发生交叠。在这种情况下，可将某一类目标的特征向量当作正例，将其他类目标的特征向量当作反例，用正反例联合优化前述问题，以获得最优的超球体。最终求解得到的少量且具有充分代表性的支持向量，将作为三维目标多视点视图建模结果。

Claims

1.一种基于支持向量数据描述的三维目标多视点视图建模方法，其特征在于：它包括以下步骤：

步骤一：获取测试目标的全姿态图像；将目标置于视点球中心，目标姿态变化等效于摄像机在视点球面上的不同点观察目标，在视点球面上均匀采样，获取数量为N的三维目标的全姿态图像集；

步骤二：从获取的全姿态图像集中提取目标特征向量集合{x_i|i＝1，2，...N}；

2.根据权利要求1所述的一种基于支持向量数据描述的三维目标多视点视图建模方法，其特征在于：步骤一所述的获取测试目标的全姿态图像，具体实现过程如下：首先创建需要进行多视点视图建模的目标三维模型，然后将目标模型置于假想视点球的球心，由于目标姿态变化等效于摄像机在视点球面上的不同点观察目标，因此获取摄像机观察视点的过程即为划分视点球面的过程；采用类似划分地球经纬度的方式，以相同间隔均匀划分视点球面，并在对应的划分点处对目标成像，即获取目标全姿态图像集。

3.根据权利要求1所述的一种基于支持向量数据描述的三维目标多视点视图建模方法，其特征在于：步骤三所述的求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数，得到目标多视点视图的最佳建模结果，具体实现过程如下：

在特征空间中，定义一个包含目标全姿态特征向量集合且封闭的超球体，该超球体由球心a和半径R表征，SVDD算法通过最小化R²来求取包含尽可能多数据点的最小超球体，以对含有目标全姿态外形信息的特征向量集进行描述；考虑到可能在特征向量集中出现的异常点，数据点到球心的距离可能不严格小于半径，求取最小超球体的过程表述为以下优化问题：

\min (F (R, a) = R^{2} + C \underset{i}{Σ} ξ_{i}) - - - (1)

约束条件为：

{| | x_{i} - a | |}^{2} \leq R^{2} + ξ_{i}, &ForAll; i - - - (2)

ξ_{i} &GreaterEqual; 0, &ForAll; i - - - (3)

使用拉格朗日乘子法求解得到

L (R, a, α_{i}, γ_{i}, ξ_{i}) = R^{2} + C \underset{i}{Σ} ξ_{i} - \underset{i}{Σ} α_{i} {R^{2} + ξ_{i} - ({| | x_{i} | |}^{2} - 2 a \cdot x_{i} + {| | a | |}^{2})} - \underset{i}{Σ} γ_{i} ξ_{i} - - - (4)

令该泛函对R，a，ξ_i偏导数为0，得

\frac{&PartialD; L}{&PartialD; R} = 0 : \underset{i}{Σ} α_{i} = 1 - - - (5)

\frac{&PartialD; L}{&PartialD; a} = 0 : a = \underset{i}{Σ} α_{i} x_{i} - - - (6)

\frac{&PartialD; L}{&PartialD; ξ_{i}} = 0 : C - α_{i} - γ_{i} = 0 - - - (7)

求解(4)的对偶最大化问题，有

L = \underset{i}{Σ} α_{i} (x_{i} \cdot x_{i}) - \underset{i, j}{Σ} α_{i} α_{j} (x_{i} \cdot x_{j}) - - - (8)

约束条件为：

\underset{i}{Σ} α_{i} = 1,0 \leq α_{i} \leq C - - - (9)

当α_i>0时对应的特征向量将位于超球体边界附近，成为描述特征向量集合的必要成分，即为目标多视点视图的最佳建模结果；其中，采用核函数K(x_i,x_j)代替内积得到更加灵活的柔性数据描述。