CN101599077B

CN101599077B - 一种三维对象检索的方法

Info

Publication number: CN101599077B
Application number: CN2009100884162A
Authority: CN
Inventors: 戴琼海; 路瑶; 尔桂花
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2009-06-29
Filing date: 2009-06-29
Publication date: 2011-01-05
Anticipated expiration: 2029-06-29
Also published as: CN101599077A

Abstract

本发明公开了一种三维对象检索的方法，所述方法包括：将三维检索对象视图集与数据库中的视图集进行二分图最大匹配，滤除数据库中不满足预设匹配条件的视图集，得到剩余视图集；将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配，获取所述三维检索对象视图集与每个所述剩余视图集之间的距离；对每个所述剩余视图集进行排序，将排序后的每个所述剩余视图集作为检索结果输出。本发明实施例采用统计聚类的预处理，结合二分图最大匹配和最优匹配，获取三维检索对象视图集与数据库中的视图集之间的距离，提高了三维对象检索的正确率，同时使得三维对象的检索可以不依赖采集环境的信息，使三维对象检索的方法能够更广泛地应用。

Description

一种三维对象检索的方法

技术领域

本发明涉及图像检索领域，特别涉及一种三维对象检索的方法。

背景技术

三维对象由于其真实、立体的特点，正在成为重要的计算机多媒体数据类型，其数量在互联网和个人电脑上迅速增长。因此使用者会有对三维对象数据信息进行检索的需求，即从海量的三维对象数据中获取所需的信息。

三维对象检索方法有基于模型的统计信息、基于几何结构和基于模型视图这三种方式。这些方法都是依赖于现有的模型信息，通过构建好的几何模型，计算出需要的信息，即便是基于视图的检索方式，也是根据模型信息，进而得到各个角度的视图。由于模型的复杂度直接与实际物体或者场景的复杂度相关，完全依赖于模型会造成计算复杂度的增加，对于复杂场景，建模十分困难甚至无法实现。

目前基于图像的三维对象表示和渲染技术都有了重要发展，特别是密集多视图采样技术，是一种快速发展并颇具前景的立体描述技术，三维对象的多视图采集一般用如下方法：将三维对象置于一个摄像机阵列中进行拍摄，得到描述该对象的二维图像集合，基于多视图的三维对象检索也成为了一个很有前景的研究方向。

现有的三维对象检索的方法中，大多需要获得采集环境的信息，如摄像机阵列分布方式等信息，并且采集环境大多是固定单一的，如等间隔环形分布的摄像机阵列等。在三维对象的检索过程中，由于依赖采集环境信息的获取，使得三维对象检索方法的应用具有一定的局限性。

发明内容

本发明实施例提供了一种三维对象检索的方法，所述方法包括：

获取用户输入的三维检索对象的视图集；

将所述三维检索对象视图集与数据库中的视图集进行二分图最大匹配，滤除数据库中不满足预设匹配条件的视图集，得到剩余视图集；

对所述三维检索对象的视图集进行统计聚类，得到所述三维检索对象视图集的统计聚类结果；

对每个所述剩余视图集进行统计聚类，得到每个所述剩余视图集的统计聚类结果；

根据所述三维检索对象视图集的统计聚类结果与每个所述剩余视图集的统计聚类结果，将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配，获取所述三维检索对象视图集与每个所述剩余视图集之间的距离；

根据所述三维检索对象视图集与每个所述剩余视图集之间的距离，对每个所述剩余视图集进行排序，将排序后的每个所述剩余视图集作为检索结果输出。

本发明实施例在三维对象检索的过程中，通过采用统计聚类的预处理，结合二分图最大匹配和最优匹配，获取三维检索对象视图集与数据库中的视图集之间的距离，提高了三维对象检索的正确率，同时使得三维对象的检索可以不依赖采集环境的信息，使三维对象检索的方法能够更广泛地应用。

附图说明

图1是本发明实施例1中提供的三维对象检索的方法流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

实施例1

本发明实施例提供了一种三维对象检索的方法，参见图1，该方法包括：

101：获取用户输入的三维检索对象的视图集。

具体的，用户输入的需要检索的三维对象的视图集，是表示该三维对象的一组二维视图。

102：对该三维检索对象的视图集进行统计聚类，得到三维检索对象视图集的统计聚类结果。

具体的，在对视图集进行统计聚类时，需要先对视图集进行特征的提取，通常提取的是视图的底层视觉特征，然后利用无监督或半监督的学习方法将该视图集合划分为若干个视图子集，每个视图子集里面包括一组视觉上相似的图像。如一个视图集X＝{x₁，x₂，...，x_n}，其中x_i为X中的一幅二维视图，在进行聚类时，即将与x_i视觉上相似的图像的图像x_p，x_q，...，x_t划分为一个视图子集X₁＝{x_i，x_p，x_q...，x_t}，由此视图集X＝{x₁，x₂，...，x_n}进行统计聚类后，得到k个视图子集，即X＝{X₁，X₂，...，X_K}，且每个视图子集中的视图都是视觉上相似的视图。优选的，k的取值为3-6之间。

103：将该三维检索对象视图集与数据库中的视图集进行二分图最大匹配，滤除数据库中不满足预设匹配条件的视图集，得到剩余视图集。

具体的，进行二分图的最大匹配的方法如下：设X＝{x₁，x₂，...，x_n}时三维检索对象的视图集，Y_k＝{y₁，y₂，...，y_m}是数据库中的一个三维对象的视图集合。依次对X和Y_k中的视图使用二分图最大匹配，滤除数据库中不满足预设匹配条件的视图集，得到数据库中满足预设条件的每个剩余视图集，其中，该预设条件为：与该三维检索对象视图集的相似度大于预设的阈值。

优选的，可以使用Hungarian算法。如果X中的视图x_i和Y_k中的视图y_j的相似度大于阈值T，则认为这两幅图相关，用一条边线连接这两幅视图。其中，阈值T的值可以根据匹配视图的个数进行调整。在视图一对一匹配的约束下，可以求出最大匹配子图M，如果最大匹配子图M中边线的总个数l大于预设的匹配阈值(如n/2)时，则认为Y_k和X相似。否则最大匹配子图M中边线的总个数l小于预设的匹配阈值，则认为Y_k和X不相似，滤除Y_k，继续比较数据库中其他视图集。

由上述方法可知，二分图的最大匹配的计算复杂度是O((n+m)*l)，其中l是最大匹配子图M中的边线的个数。通过步骤103，就滤除了和用户输入的三维检索对象不相关的视图集合，得到的剩余视图集也就与该三维检索对象相关。

104：对上述的每个剩余视图集进行统计聚类，得到每个剩余视图集的统计聚类结果。

对数据库中的每个剩余视图集进行统计聚类的方法与102中的方法相同，不再赘述，对数据库中的视图集进行统计聚类可以预先进行，由此在检索时可以直接从数据库中提取每个剩余视图集的统计聚类结果。

105：根据该三维检索对象视图集的统计聚类结果和每个剩余视图集的统计聚类结果，对该三维检索对象视图集与该每个剩余视图集进行二分图最优匹配，得到该三维检索对象视图集与每个该剩余视图集之间的距离。

具体的，进行二分图的最优匹配的方法如下：

1)求出视图子集的聚类中心，用属于该子集的视图的特征向量平均值作为该子集中心，对于划分为K个子集的X和Y_k，求出其子集中心记为{x₁，x₂，...，x_K}，{y₁，y₂，...，y_K}，步骤1)的计算复杂度为O((n+m)*K)。

2)对聚类中心X_c＝{x_c1，x_c2，...，x_cK}和Y_kc＝{y_c1，y_c2，...，y_cK}两个集合，构成二分图G_c＝{X_c，Y_kc，E_c}，用Kuhn-Munkres算法，在一对一匹配的约束下，可以求出最优匹配子图M_c，从而得到X_c＝{x_c1，x_c2，...，x_cK}和Y_kc＝{y_c1，y_c2，...，y_cK}里各个视图的对应关系，也就是视图集合X和Y_k里各个子集的对应关系，将Y_k按照和X的对应关系重新排序，得到X＝{X₁，X₂，...，X_K}，Y_k＝{Y_k ¹，Y_k ²，...，Y_k ^Ｋ}，其中X_i和y_k ⁱ相对应。步骤2)的计算复杂度为O(K⁴)。

3)根据每一对对应子集X_i和Y_k ⁱ构成一个二分图G_i＝{X_i，Y_k ⁱ，E_i}，使用最优匹配的算法，如Kuhn-Munkres算法，对各个边进行权值的设定，具体的，在本发明实施例中，两幅视图特征向量的欧氏距离被设定为边的权值。在一对一匹配的约束下，求得权值最小的子图，作为该二分图的最优匹配，并对权值求和得到子集X_i和Y_k ⁱ的距离：

{Dis}_{i} (X_{i}, {Y_{k}}^{i}) = \frac{ΣDis ({x_{i}}^{i}, {y_{i}}^{j})}{n_{i}}

其中，

X_{i} = {{x_{i}}^{1}, {x_{i}}^{2}, . . ., {x_{i}}^{n_{i}}},

{Y_{k}}^{i} = {{y_{i}}^{1}, {y_{i}}^{2}, . . ., {y_{i}}^{m_{i}}},

n_i，m_i分别是X_i和Y_k ⁱ的视图个数。

进一步，将对应子集距离进行求和，得到视图集合X和Y_k的距离：

Dis (X, Y_{k}) = \frac{Σ {Dis}_{i} (X_{i}, {Y_{k}}^{i})}{K},

步骤3)的计算复杂度为为

在上述计算两个视图集的距离的步骤中，可知由于在密集采样中视图的个数n和m远大于k，统计聚类和视图匹配过程中的计算复杂度相对很小，可以忽略，由此降低了最优匹配的复杂度，因此，本发明采用聚类预处理提高了系统的效率。

106：根据该三维检索对象视图集与每个该剩余视图集之间的距离，对每个该剩余视图集进行排序，将排序后的每个该剩余视图集作为检索结果输出。

有上述描述可知，本发明通过统计聚类，先采用二分图最大匹配，滤除数据库中与检索对象相关度不高的视图集，然后再采用二分图最优匹配，从数据库中视图集进一步的检索和匹配。本发明实施例通过采用统计聚类以及二分图的最大匹配和最优匹配，使得基于多视图集的三维对象检索可以不依赖采集环境的信息，同时三维对象检索的正确率也得到了提高。

本发明实施例可以利用软件实现，相应的软件程序可以存储在可读取的存储介质中，例如，路由器的硬盘、缓存或光盘中。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种三维对象检索的方法，其特征在于，所述方法包括：

获取用户输入的三维检索对象的视图集；

2.根据权利要求1所述的三维对象检索的方法，其特征在于，所述将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配之前，还包括：

对所述三维检索对象的视图集进行底层视觉特征的提取；并根据提取的特征对所述三维检索对象的视图集进行统计聚类，得到所述三维检索对象视图集的统计聚类结果；

对每个所述剩余视图集进行底层视觉特征的提取；并根据提取的特征对每个所述剩余视图集进行统计聚类，得到每个所述剩余视图集的统计聚类结果。

3.根据权利要求1所述的三维对象检索的方法，其特征在于，所述预设匹配条件为：与所述三维检索对象视图集的相似度大于预设的阈值。

4.根据权利要求1所述的三维对象检索的方法，其特征在于，所述将所述三维检索对象视图集与每个所述剩余视图集进行二分图最优匹配，获取所述三维检索对象视图集与每个所述剩余视图集之间的距离，包括：

获取所述三维检索对象的视图子集的第一聚类中心，并获取所述剩余视图子集的第二聚类中心；

计算得到所述第一聚类中心与所述第二聚类中心的对应关系，根据所述对应关系，将所述三维检索对象的视图子集与所述剩余视图子集进行对应；

根据相互对应的所述三维检索对象的视图子集与所述剩余视图子集，计算所述三维检索对象视图集与所述剩余视图集之间的距离。