CN102682478A - 一种基于支持向量数据描述的三维目标多视点视图建模方法 - Google Patents

一种基于支持向量数据描述的三维目标多视点视图建模方法 Download PDF

Info

Publication number
CN102682478A
CN102682478A CN2012101508854A CN201210150885A CN102682478A CN 102682478 A CN102682478 A CN 102682478A CN 2012101508854 A CN2012101508854 A CN 2012101508854A CN 201210150885 A CN201210150885 A CN 201210150885A CN 102682478 A CN102682478 A CN 102682478A
Authority
CN
China
Prior art keywords
target
alpha
sigma
viewpoint
suprasphere
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101508854A
Other languages
English (en)
Inventor
赵慧洁
李旭东
丁昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN2012101508854A priority Critical patent/CN102682478A/zh
Publication of CN102682478A publication Critical patent/CN102682478A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于支持向量数据描述的三维目标多视点视图建模方法,它有三大步骤:一:获取测试目标的全姿态图像。二:从获取的全姿态图像集中提取目标特征向量集合{xi|i=1,2,...N}。三:使用支持向量数据描述(SVDD)方法表征从图像中提取的特征向量在特征空间中的分布,将得到的少量且具有充分代表性的特征向量作为目标的多视点视图建模结果。本发明针对不同视点下目标图像差异导致的单一目标视图描述不能识别目标的问题,提出了一种冗余信息少、能较好描述目标全姿态特征向量集的三维目标多视点视图建模方法。它在模式识别领域里具有较好的实用价值和广阔的应用前景。

Description

一种基于支持向量数据描述的三维目标多视点视图建模方法
技术领域
本发明涉及一种基于支持向量数据描述的三维目标多视点视图建模方法,属于模式识别领域,具体涉及到目标识别、目标建模和数据约简等领域。用于三维目标多视点建模,适用于不同视点下目标图像差异导致的单一目标视图描述不能识别目标的问题。
背景技术
三维目标识别是计算机视觉领域内一个重要的研究方向。目前在实际应用中获取目标的三维信息往往十分困难,识别三维目标仍然主要通过识别目标二维投影形成的图像完成。目标二维成像(投影)过程导致了部分信息丢失,且在不同视点下,复杂目标的外形差异明显,使得快速稳定的三维目标识别难度很大。
通过对三维目标进行建模以形成对目标外形的全面描述,是解决该问题的手段之一。这就需要研究三维目标的多视点视图建模方法。直观的想法是将多个视点下对目标图像的描述综合起来作为目标的描述。然而对于同一目标,其姿态数目无法穷举,不同描述间也包含了很多冗余信息。因此,需要在约简冗余描述的同时尽可能保留重要的描述。
三维目标多视点视图建模方法一般分为两类:
第一类方法是基于目标几何结构和可见关系的视点球面分割算法,主要基于目标图像的几何拓扑特征,最终得到的建模结果是关于目标的多姿态特征视图集。但这类方法对目标特征视图集的构建依赖于目标的几何结构和特征,一般只能针对一定复杂程度的某一类特定物体,如回转体、二次曲面体等,实际中难以应用。
第二类方法是基于目标特征相似度的聚类算法,将在视点球面上均匀采样得到的目标图像用特征向量描述,并对特征向量集进行聚类,将最终得到的少量目标特征向量作为建模结果。但这类算法存在一些明显的缺点:一是需要知道聚类的类别数,这一般难以事先确定;二是得到的特征视图在进行最近邻分类时无阈值,只能强制划分到某一类中,不能拒绝数据。
发明内容
本发明的目的在于:提供一种基于支持向量数据描述的三维目标多视点视图建模方法,它针对不同视点下目标图像差异导致的单一目标视图描述不能识别目标的缺点,构建了一种描述数量小、冗余信息少、能较好描述目标全姿态特征向量集的三维目标多视点视图建模方法。
其技术方案如下:
本发明一种基于支持向量数据描述的三维目标多视点视图建模方法,它包括以下步骤:
步骤一:获取测试目标的全姿态图像。将目标置于视点球中心,目标姿态变化等效于摄像机在视点球面上的不同点观察目标。在视点球面上均匀采样,获取数量为N的三维目标的全姿态图像集。
步骤二:从获取的全姿态图像集中提取目标特征向量集合{xi|i=1,2,…N}。
步骤三:求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数,得到的数量较少的支持向量将作为目标多视点视图的最佳建模结果。
其中,步骤一所述的获取测试目标的全姿态图像,具体实现过程如下:
首先创建需要进行多视点视图建模的目标三维模型。然后将目标模型置于假想视点球的球心,由于目标姿态变化等效于摄像机在视点球面上的不同点观察目标,因此获取摄像机观察视点的过程即为划分视点球面的过程。采用类似划分地球经纬度的方式,以相同间隔均匀划分视点球面,并在对应的划分点处对目标成像,即可获取目标全姿态图像集。
其中,步骤三所述的求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数,得到目标多视点视图的最佳建模结果,具体实现过程如下:
在特征空间中,定义一个包含目标全姿态特征向量集合且封闭的超球体。该超球体由球心a和半径R表征。SVDD算法通过最小化R2来求取包含尽可能多数据点的最小超球体,以对含有目标全姿态外形信息的特征向量集进行描述。考虑到可能在特征向量集中出现的异常点,数据点到球心的距离可能不严格小于半径,求取最小超球体的过程可表述为以下优化问题:
min ( F ( R , a ) = R 2 + C Σ i ξ i ) - - - ( 1 )
约束条件为:
| | x i - a | | 2 ≤ R 2 + ξ i , ∀ i - - - ( 2 )
ξ i ≥ 0 , ∀ i - - - ( 3 )
使用拉格朗日乘子法求解得到
L ( R , a , α i , γ i , ξ i ) = R 2 + C Σ i ξ i - Σ i α i { R 2 + ξ i - ( | | x i | | 2 - 2 a · x i + | | a | | 2 ) } - Σ i γ i ξ i - - - ( 4 )
令该泛函对R,a,ξi偏导数为0,可得
∂ L ∂ R = 0 : Σ i α i = 1 - - - ( 5 )
∂ L ∂ a = 0 : a = Σ i α i x i - - - ( 6 )
∂ L ∂ ξ i = 0 : C - α i - γ i = 0 - - - ( 7 )
求解(4)的对偶最大化问题,可有
L = Σ i α i ( x i · x i ) - Σ i , j α i α j ( x i · x j ) - - - ( 8 )
约束条件为:
Σ i α i = 1,0 ≤ α i ≤ C - - - ( 9 )
当αi>0时对应的特征向量将位于超球体边界附近,成为描述特征向量集合的必要成分,即为目标多视点视图的最佳建模结果。其中,采用核函数K(xi,xj)代替内积可以得到更加灵活的柔性数据描述。
本发明具有的优点是:通过求解在特征空间包含大多数目标全姿态图像集特征向量的最优柔性超球体边界来描述目标,方法通用性强,不需要事先知道聚类的类别数,并且优化后得到的超球体参数R可以作为最近邻分类器阈值,克服了一般情况下最近邻分类无法得到合理的分类阈值,不能拒绝待分类目标特征向量的问题。
附图说明
图1为本发明的处理流程图;
图2为本发明中涉及的视点球划分示意图;
图3为本发明的建模结果示意图;
具体实施方式
本发明针对三维目标多视点视图建模问题,提出了一种基于支持向量数据描述的三维目标多视点视图建模方法。
见图1,本发明一种基于支持向量数据描述的三维目标多视点视图建模方法,它包括以下步骤:
步骤一:获取测试目标的全姿态图像。将目标置于视点球中心,目标姿态变化等效于摄像机在视点球面上的不同点观察目标。在视点球面上均匀采样,获取数量为N的三维目标的全姿态图像集。
步骤二:从获取的全姿态图像集中提取目标特征向量集合{xi|i=1,2,…N}。
步骤三:求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数,得到的数量较少的支持向量将作为目标多视点视图的最佳建模结果。
首先,获取目标全姿态图像需要创建待建模的目标三维模型。见图2,将目标模型置于视点球的球心。视点球是定义在三维欧氏空间中的假想单位球,不同视点下目标的成像过程可看作目标以球心为起点向不同方向投影的过程,视点球面上每一点P对应一个投影方向向量P,沿投影方向P的正交投影对应于从视点球面上P点看目标。因此获取摄像机观察视点的过程即为划分视点球面的过程。采用类似划分地球经纬度的方式,以相同间隔均匀划分视点球面,并在对应的划分点处对目标成像,即可获取元素个数为N的目标全姿态图像集。
采用合适的特征描述图像中的目标,进一步得到描述该目标全姿态外形信息的特征向量集合{xi|i=1,2,…N}。在特征空间中,定义一个包含该集合且封闭的超球体。该超球体由球心a和半径R表征。SVDD算法通过最小化R2来求取包含尽可能多数据点的最小超球体,以对含有目标全姿态外形信息的特征向量集进行描述。对于相同目标不同姿态下对应的特征向量而言,它们将包含于超球体的内部。求取最小超球体的过程可表述为以下优化问题:
min(F(R,a)=R2)                            (10)
约束条件为:
| | x i - a | | 2 ≤ R 2 , ∀ i - - - ( 11 )
考虑到可能在特征向量集T中出现异常点,数据点到球心的距离可能不严格小于半径,引入松弛变量ξi≥0,上述问题变为:
min ( F ( R , a ) = R 2 + C Σ i ξ i )
约束条件为:
| | x i - a | | 2 ≤ R 2 + ξ i , ∀ i
ξ i ≥ 0 , ∀ i
其中参数C控制球体体积和误差间的折衷。
使用拉格朗日乘子法得到
L ( R , a , α i , γ i , ξ i ) = R 2 + C Σ i ξ i - Σ i α i { R 2 + ξ i - ( | | x i | | 2 - 2 a · x i + | | a | | 2 ) } - Σ i γ i ξ i
其中αi≥0,γi≥0为拉格朗日乘子。
令该泛函对R,a,ξi偏导数为0,可得
∂ L ∂ R = 0 : Σ i α i = 1
∂ L ∂ a = 0 : a = Σ i α i x i
∂ L ∂ ξ i = 0 : C - α i - γ i = 0
代入(4)式。求解(4)式相对于R,a,ξi的最小化问题可以转化为求解其对偶最大化问题,因此有
L = Σ i α i ( x i · x i ) - Σ i , j α i α j ( x i · x j )
约束条件为:
Σ i α i = 1,0 ≤ α i ≤ C
根据KKT(Karush-Kuhn-Tucker)条件,当αi>0时对应的特征向量将位于超球体边界附近,成为描述特征向量集合的必要成分,即为目标多视点视图的最佳建模结果,见图3。
采用核函数K(xi,xj)代替(8)中的内积可以得到更加灵活的柔性数据描述:
L = Σ i α i K ( x i · x i ) - Σ i , j α i α j K ( x i · x j ) - - - ( 12 )
判断新特征向量z是否被接受时,判断其是否满足:
K ( z · z ) - 2 Σ i α i K ( z · x i ) + Σ i , j α i α j K ( x i · x j ) ≤ R 2 - - - ( 13 )
若满足则接受,反之则拒绝。
当特征空间中分布有多个目标的特征向量时,不同目标的超球体间可能会发生交叠。在这种情况下,可将某一类目标的特征向量当作正例,将其他类目标的特征向量当作反例,用正反例联合优化前述问题,以获得最优的超球体。最终求解得到的少量且具有充分代表性的支持向量,将作为三维目标多视点视图建模结果。

Claims (3)

1.一种基于支持向量数据描述的三维目标多视点视图建模方法,其特征在于:它包括以下步骤:
步骤一:获取测试目标的全姿态图像;将目标置于视点球中心,目标姿态变化等效于摄像机在视点球面上的不同点观察目标,在视点球面上均匀采样,获取数量为N的三维目标的全姿态图像集;
步骤二:从获取的全姿态图像集中提取目标特征向量集合{xi|i=1,2,...N};
步骤三:求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数,得到的数量较少的支持向量将作为目标多视点视图的最佳建模结果。
2.根据权利要求1所述的一种基于支持向量数据描述的三维目标多视点视图建模方法,其特征在于:步骤一所述的获取测试目标的全姿态图像,具体实现过程如下:首先创建需要进行多视点视图建模的目标三维模型,然后将目标模型置于假想视点球的球心,由于目标姿态变化等效于摄像机在视点球面上的不同点观察目标,因此获取摄像机观察视点的过程即为划分视点球面的过程;采用类似划分地球经纬度的方式,以相同间隔均匀划分视点球面,并在对应的划分点处对目标成像,即获取目标全姿态图像集。
3.根据权利要求1所述的一种基于支持向量数据描述的三维目标多视点视图建模方法,其特征在于:步骤三所述的求取在高维空间内包含尽可能多目标特征向量的最小超球体相关参数,得到目标多视点视图的最佳建模结果,具体实现过程如下:
在特征空间中,定义一个包含目标全姿态特征向量集合且封闭的超球体,该超球体由球心a和半径R表征,SVDD算法通过最小化R2来求取包含尽可能多数据点的最小超球体,以对含有目标全姿态外形信息的特征向量集进行描述;考虑到可能在特征向量集中出现的异常点,数据点到球心的距离可能不严格小于半径,求取最小超球体的过程表述为以下优化问题:
min ( F ( R , a ) = R 2 + C Σ i ξ i ) - - - ( 1 )
约束条件为:
| | x i - a | | 2 ≤ R 2 + ξ i , ∀ i - - - ( 2 )
ξ i ≥ 0 , ∀ i - - - ( 3 )
使用拉格朗日乘子法求解得到
L ( R , a , α i , γ i , ξ i ) = R 2 + C Σ i ξ i - Σ i α i { R 2 + ξ i - ( | | x i | | 2 - 2 a · x i + | | a | | 2 ) } - Σ i γ i ξ i - - - ( 4 )
令该泛函对R,a,ξi偏导数为0,得
∂ L ∂ R = 0 : Σ i α i = 1 - - - ( 5 )
∂ L ∂ a = 0 : a = Σ i α i x i - - - ( 6 )
∂ L ∂ ξ i = 0 : C - α i - γ i = 0 - - - ( 7 )
求解(4)的对偶最大化问题,有
L = Σ i α i ( x i · x i ) - Σ i , j α i α j ( x i · x j ) - - - ( 8 )
约束条件为:
Σ i α i = 1,0 ≤ α i ≤ C - - - ( 9 )
当αi>0时对应的特征向量将位于超球体边界附近,成为描述特征向量集合的必要成分,即为目标多视点视图的最佳建模结果;其中,采用核函数K(xi,xj)代替内积得到更加灵活的柔性数据描述。
CN2012101508854A 2012-05-15 2012-05-15 一种基于支持向量数据描述的三维目标多视点视图建模方法 Pending CN102682478A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101508854A CN102682478A (zh) 2012-05-15 2012-05-15 一种基于支持向量数据描述的三维目标多视点视图建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101508854A CN102682478A (zh) 2012-05-15 2012-05-15 一种基于支持向量数据描述的三维目标多视点视图建模方法

Publications (1)

Publication Number Publication Date
CN102682478A true CN102682478A (zh) 2012-09-19

Family

ID=46814341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101508854A Pending CN102682478A (zh) 2012-05-15 2012-05-15 一种基于支持向量数据描述的三维目标多视点视图建模方法

Country Status (1)

Country Link
CN (1) CN102682478A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544633A (zh) * 2013-10-09 2014-01-29 五邑大学 一种基于svdd算法的用户兴趣识别方法
CN106770939A (zh) * 2016-12-08 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法
CN112966585A (zh) * 2021-03-01 2021-06-15 淮阴师范学院 缓解信息孤岛影响的人脸图像亲属关系验证方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236912A (zh) * 2011-07-08 2011-11-09 清华大学 变光照条件下运动目标的三维重建方法及三维重建装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236912A (zh) * 2011-07-08 2011-11-09 清华大学 变光照条件下运动目标的三维重建方法及三维重建装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DAVID M.J.TAX ET AL: "《Support Vector Data Description》", 《MACHINE LEARNING》 *
刘贝家等: "《基于SVDD的多示例学习算法》", 《科技通报》 *
彭辉等: "《基于Zernike矩的三维目标多视点特性视图建模》", 《红外与激光工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544633A (zh) * 2013-10-09 2014-01-29 五邑大学 一种基于svdd算法的用户兴趣识别方法
CN106770939A (zh) * 2016-12-08 2017-05-31 贵州电网有限责任公司电力科学研究院 一种基于支持向量描述和k近质心近邻的变压器故障诊断方法
CN112966585A (zh) * 2021-03-01 2021-06-15 淮阴师范学院 缓解信息孤岛影响的人脸图像亲属关系验证方法

Similar Documents

Publication Publication Date Title
Wu et al. ORSIm detector: A novel object detection framework in optical remote sensing imagery using spatial-frequency channel features
CN106716450B (zh) 利用边缘向量的基于图像的特征检测
Huang et al. A coarse-to-fine algorithm for matching and registration in 3D cross-source point clouds
CN110135455A (zh) 影像匹配方法、装置及计算机可读存储介质
CN106446936B (zh) 基于卷积神经网络的空谱联合数据转波形图的高光谱数据分类方法
US8983141B2 (en) Geophysical data texture segmentation using double-windowed clustering analysis
CA3174351A1 (en) Feature extraction from mobile lidar and imagery data
Shrivastava et al. Building part-based object detectors via 3d geometry
Ding et al. Vehicle pose and shape estimation through multiple monocular vision
Wu et al. Active recognition and pose estimation of household objects in clutter
CN103514432A (zh) 人脸特征提取方法、设备和计算机程序产品
CN103942535B (zh) 多目标跟踪方法及装置
CN103295025A (zh) 一种三维模型最优视图的自动选择方法
CN109766866B (zh) 一种基于三维重建的人脸特征点实时检测方法和检测系统
CN102708589B (zh) 一种基于特征聚类的三维目标多视点视图建模方法
CN103824093A (zh) 一种基于kfda及svm的sar图像目标特征提取与识别方法
Beksi et al. Object classification using dictionary learning and rgb-d covariance descriptors
Ma et al. An intelligent object detection and measurement system based on trinocular vision
CN103761523A (zh) 一种机载遥感视频特定人造区域自动识别跟踪方法
CN104573722A (zh) 基于三维点云的三维人脸种族分类装置和方法
Stucker et al. Supervised outlier detection in large-scale MVS point clouds for 3D city modeling applications
Yan et al. Sparse semantic map building and relocalization for UGV using 3D point clouds in outdoor environments
Samat et al. Jointly informative and manifold structure representative sampling based active learning for remote sensing image classification
CN102682478A (zh) 一种基于支持向量数据描述的三维目标多视点视图建模方法
CN104331711B (zh) 基于多尺度模糊测度与半监督学习的sar图像识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120919