CN103946891B - 局部特征量提取装置和局部特征量提取方法 - Google Patents
局部特征量提取装置和局部特征量提取方法 Download PDFInfo
- Publication number
- CN103946891B CN103946891B CN201280056804.2A CN201280056804A CN103946891B CN 103946891 B CN103946891 B CN 103946891B CN 201280056804 A CN201280056804 A CN 201280056804A CN 103946891 B CN103946891 B CN 103946891B
- Authority
- CN
- China
- Prior art keywords
- characteristic point
- characteristic
- dimension
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明的目的是减小特征量的大小,同时保持被写体识别的精度。一种局部特征量提取装置包括:特征点检测单元,检测图像中的多个特征点,以及输出作为与每个特征点有关的信息的特征点信息;特征点选择单元,基于特征点信息,从多个所检测的特征点,按重要性的顺序,选择预定多个特征点;局部区域获取单元,获得对应于每个所选择的特征点的局部区域;子区域分割单元,将每个局部区域分割成多个子区域;子区域特征向量生成单元,对每个局部区域中的每个子区域,生成多个维度的特征向量;以及维度选择单元,基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得相邻子区域之间的相关性被降低,以及将所选择的维度的元素输出为局部区域的特征量。
Description
技术领域
本发明涉及局部特征量提取装置、局部特征量提取方法和程序。
背景技术
为相对于拍摄大小或角度的变化或遮挡,实现图像中的被写体(object)的鲁棒识别,提出了检测图像中的多个兴趣点(特征点)和提取每一个特征点周围的局部区域的特征量(局部特征量)的系统。作为代表性的系统,专利文献1和非专利文献1公开了使用SIFT(规模不变特征变换)特征量的局部特征量提取装置。
图23是示出使用SIFT特征量的局部特征量提取装置的一般配置的例子的图。此外,图24是示出通过图23中所示的局部特征量提取装置,SIFT特征量提取的概念图像的图。
如图23所示,局部特征量提取装置包括特征点检测单元200、局部区域获取单元210、子区域分割单元220和子区域特征向量生成单元230。特征点检测单元200从图像检测多个兴趣点(特征点)以及输出每个特征点的坐标位置、规模(大小)和定向。局部区域获取单元210从每个所检测的特征点的坐标位置、规模和定向,获取将进行提取特征量的局部区域。子区域分割单元220将局部区域分割成子区域。在图24所示的例子中,子区域分割单元220将局部区域分割成16个块(4×4个块)。子区域特征向量生成单元230对局部区域的每个子区域,生成梯度定向直方图。具体地,子区域特征向量生成单元230对每个子区域中的每个像素,计算梯度定向以及将梯度定向量化成8个方向。此外,此时计算的梯度定向是相对于由特征点检测单元200输出的每个特征点的定向的相对方向。换句话说,梯度定向是相对于由特征点检测单元200输出的定向规范化的方向。此外,子区域特征向量生成单元230合计用于每个子区域的8个量化方向的频率,以及生成梯度定向直方图。用这种方式,相对于每个特征点生成的16个块×8个方向的梯度定向直方图被输出为128维度的局部特征量。
此外,专利文献2公开了即使当使图像经受旋转、放大、缩小等等时,也能使局部特征量的计算对象缩小到具有高提取再现性的特征点,以便当使用局部特征量时,提高搜索精度和识别精度的方法。
专利文献1:U.S.专利No.6711293
专利文献2:专利公开号No.JP-A-2010-79545
非专利文献1:David G.Lowe,"Distinctive image features from scale-invariant keypoints",(USA),International Journal of Computer Vision,60(2),2004,91-110页
发明内容
上述的局部特征量具有其大小增加的问题。例如,在SIFT特征量的情况下,当用1字节表示每个维度的直方图值时,SIFT特征量要求128维度×1字节的大小。此外,通过在专利文献1和非专利文献1中公开的方法,相对于从输入图像提取的所有特征点,生成局部特征量。因此,当所检测的特征点的数目增加时,所生成的局部特征量的大小也增加。
当如上所述,局部特征量的大小增加时,当使用局部特征量来核对(匹配)图像时,问题可能发生。例如,当用户终端(例如配备有照相机的移动终端)从图像提取局部特征量并且将局部特征量传送到服务器以便搜索与该图像类似的图像时,如果局部特征量的大小是大的,则加长了通信时间。因此,在获得图像搜索结果之前,要求更长的时间段。此外,当局部特征量的大小是大的时,用于核对图像的局部特征量的处理时间增加。此外,在使用局部特征量的图像搜索的情况下,将图像的局部特征量存储在存储器中。然而,当局部特征量的大小是大的时,能在存储器上存储其局部特征量的图像的数目减小。因此,局部特征量不适合于针对大量图像的大规模搜索。
此外,关于在专利文献2中公开的方法,尽管能将局部特征量的计算对象缩小到具有高再现性的特征点,但当多个特征点具有高再现性时,出现与通过在专利文献1和非专利文献1中公开的方法出现的问题类似的问题。
鉴于此,本发明的目的是减小特征量的大小,同时保持被写体识别的精度。
根据本发明的各方面的局部特征量提取装置包括:特征点检测单元,被配置成检测图像中的多个特征点,以及输出作为与每个特征点有关的信息的特征点信息;特征点选择单元,被配置成基于特征点信息,从多个所检测的特征点,按重要性顺序,选择预定多个特征点;局部区域获取单元,被配置成获得对应于每个所选择的特征点的局部区域;子区域分割单元,被配置成将每个局部区域分割成多个子区域;子区域特征向量生成单元,被配置成对每个局部区域中的每个子区域,生成多个维度的特征向量;以及维度选择单元,被配置成基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得降低相邻子区域之间的相关性,以及将所选择的维度的元素输出为局部区域的特征量。
此外,在根据本发明的各方面的局部特征量提取方法中,使计算机:检测图像中的多个特征点,以及输出作为与每个特征点有关的信息的特征点信息;基于特征点信息,从多个所检测的特征点,按重要性顺序,选择预定多个特征点;获得对应于每个所选择的特征点的局部区域;将每个局部区域分割成多个子区域;对每个局部区域中的每个子区域,生成多个维度的特征向量;以及基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得降低相邻子区域之间的相关性,以及将所选择的维度的元素输出为局部区域的特征量。
此外,根据本发明的各方面的程序使计算机实现下述功能:检测图像中的多个特征点,以及输出作为与每个特征点有关的信息的特征点信息;基于特征点信息,从多个所检测的特征点,按重要性顺序,选择预定多个特征点;获得对应于每个所选择的特征点的局部区域;将每个局部区域分割成多个子区域;对每个局部区域中的每个子区域,生成多个维度的特征向量;以及基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得降低相邻子区域之间的相关性,以及将所选择的维度的元素输出为局部区域的特征量。
此外,如在本发明中所使用的,术语“单元”不仅表示物理装置,而且包括由软件实现“单元”的功能的情形。此外,一个“单元”或设备的功能可以由两个或以上物理装置或设备实现,以及两个或以上“单元”或设备的功能可以由一个物理装置或设备实现。
根据本发明,能减小特征量的大小,同时保持被写体识别的精度。
附图说明
图1是示出作为本发明的第一实施例的局部特征量提取装置的配置的图;
图2是示出特征点选择单元的配置例子的图;
图3是示出特征点选择单元的配置例子的图;
图4是示出特征点选择单元的配置例子的图;
图5是示出特征点选择单元的配置例子的图;
图6是示出从128维度特征向量选择维度的情形的例子的图;
图7是示出维度选择的另一例子的图;
图8是示出当选择维度时,优先次序的例子的图;
图9是示出梯度定向直方图的维度的优先次序的例子的图;
图10是示出根据优先次序输出的局部特征量的配置例子的图;
图11是示出当选择维度时,优先次序的例子的图;
图12是示出维度选择的另一例子的图;
图13是示出圆形局部区域的例子的图;
图14是示出圆形局部区域中的维度选择的例子的图;
图15是示出通过局部特征量提取装置的处理的例子的流程图;
图16是示出根据本发明的第二实施例的局部特征量提取装置的配置的图;
图17是示出根据本发明的第三实施例的局部特征量提取装置的配置的图;
图18是示出指定特征量大小和维度数目之间的对应关系的例子的图;
图19是示出根据本发明的第四实施例的局部特征量提取装置的配置的图;
图20是示出根据本发明的第五实施例的局部特征量提取装置的配置的图;
图21是示出应用局部特征量提取装置的匹配系统的例子的图;
图22是示出通过匹配装置,使用局部特征量的匹配的例子的图;
图23是示出使用SIFT特征量的局部特征量提取装置的一般配置的例子的图;以及
图24是示出通过局部特征量提取装置,SIFT特征量的提取的概念图像的图。
具体实施方式
在下文中,将参考附图,描述本发明的实施例。
第一实施例
图1是示出作为本发明的第一实施例的局部特征量提取装置的配置的图。局部特征量提取装置1A被配置成包括特征点检测单元10、特征点选择单元12和局部特征量生成单元14。例如,能使用信息处理装置,诸如个人计算机或移动信息终端构成局部特征量提取装置1A。此外,例如,能使用存储区,诸如存储器或通过使处理器执行在存储区中存储的程序,实现构成局部特征量提取装置1A的各个单元。此外,能以类似的方式实现用在稍后所述的其他实施例中的组件。
特征点检测单元10从图像检测多个兴趣点(特征点)以及输出作为与每个特征点有关的信息的特征点信息。在这种情况下,特征点信息是指所检测的特征点的坐标位置或规模、特征点的方向、作为指定给特征点的唯一ID(标识)的“特征点编号”等等。
此外,特征点检测单元10可以将特征点信息输出为用于每个特征点的每个定向方向的单独特征点信息。例如,特征点检测单元10可以被配置成仅相对于每个特征点的主定向方向输出特征点信息或还输出相对于第二和后续定向方向的特征点信息。此外,当特征点检测单元10被配置成还输出相对于第二和后续定向方向的特征点信息时,特征点检测单元10能将不同特征点编号附加到每个特征点的每个定向方向上。
用作特征点的检测的对象的图像可以是静态图像和运动图像(包括短片)的任何一个。图像的例子包括由成像设备,诸如数码相机、数码摄像机、移动电话拍摄的图像以及通过扫描仪捕捉的图像等等。
此外,图像可以是压缩图像,诸如JPEG(联合图像专家组)图像或未压缩图像,诸如TIFF(标签图像文件格式)图像。
此外,图像可以是压缩运动图像或解码的压缩运动图像。此外,当图像是运动图像时,特征点检测单元10能对构成运动图像的每个帧图像检测特征点。此外,当图像是压缩运动图像时,压缩格式可以是任何可解码的格式,诸如MPEG(运动图像专家组)、MOTION JPEG和WINDOWS Media Video(WINDOWS和WINDOWS Media是注册商标)。
例如,特征点检测单元10当从图像检测特征点和提取特征点信息时,能使用DoG(高斯差分)处理。具体地,特征点检测单元10能通过使用DoG处理确定特征点的位置和规模以便在规模空间中执行极值搜索。此外,特征点检测单元10能使用所确定的特征点的位置和规模以及周围区域的梯度信息,计算每个特征点的定向。此外,特征点检测单元10可以使用其他方法,诸如快速Hessian检测器,代替DoG来从图像检测特征点和提取特征点信息。
基于从特征点检测单元10输出的特征点信息,特征点选择单元12从所检测的特征点,按重要性的顺序选择指定数目(预定数目)的特征点。此外,特征点选择单元12将表示特征点编号或所选择的特征点的重要性的顺序的信息输出为特征点的选择结果。
例如,特征点选择单元12能保持表示待选择的特征点的“指定数目”的指定数目信息。例如,指定数目信息可以在程序中定义或存储在由程序引用的表等等中。此外,指定数目信息可以是表示指定数目本身的信息或表示图像中的局部特征量的总大小(例如字节数)的信息。当指定数目信息是表示图像中的局部特征量的总大小的信息时,例如,特征点选择单元12能通过将总大小除以一个特征点的局部特征量的大小,计算指定数目。
现在,将参考图2至5,描述特征点选择单元12的配置例子。如图2所示,特征点选择单元12可以被配置成包括规模降序(descending-scale-order)特征点选择单元20。规模降序特征点选择单元20能基于从特征点检测单元10输出的特征点信息,按规模的降序选择指定多个特征点。
具体地,基于特征点信息,规模降序特征点选择单元20按所有特征点的规模的顺序,排序特征点以及从具有最大规模的特征点开始指定重要性。随后,规模降序特征点选择单元20按重要性的降序选择特征点,以及只要已经选择指定多个特征点,将与所选择的特征点有关的信息输出为选择结果。例如,规模降序特征点选择单元20将对每个特征点唯一指定的特征点编号输出为选择结果。
通常,小规模大量地分布从图像检测的特征点,以及规模越大,所检测的特征点的数目越少。因此,通过按规模的降序选择特征点,规模降序特征点选择单元20能在宽规模范围上最终选择特征点。由于在宽规模范围上的特征点的这种选择,完全能适应在图像中捕捉的被写体的大小的变动。因此,能减少作为特征点描述的对象的特征点的数目,同时几乎不降低图像搜索、对象检测等等的应用的精度。
如图3所示,特征点选择单元12可以被配置成包括特征点分类单元22和代表特征点选择单元24。基于特征点信息,特征点分类单元能将多个所检测的特征点分类成多个组。此外,代表特征点选择单元24能通过从每个组选择至少一个特征点,选择指定多个特征点。
具体地,例如,特征点分类单元22使用与包括在特征点信息中的特征点的坐标位置有关的信息来计算空间方向中的特征点的密度。此外,通过分组坐标位置近的特征点和对每个组分配唯一标识符,特征点分类单元22能将表示每个特征点属于哪一组的标识符的信息输出为空间方向特征点密度信息。
通过基于空间方向特征点密度信息选择指定多个特征点,代表特征点选择单元24能将有关所选择的特征点的信息输出为选择结果。例如,当将表示每个特征点属于哪一组的标识符的信息接收为空间方向特征点密度信息时,代表特征点选择单元24可以在每个组中,选择具有最大规模的特征点或在每个组内选择最孤立的特征点(例如,具有与属于该组的所有特征点最大距离和的特征点。
此外,代表特征点选择单元24可以确定从具有少数特征点的组选择的特征点具有高重要性以及从具有大量特征点的组选择的特征点具有低重要性。
此外,当从每个组选择的特征点的数目大于指定数目时,例如,代表特征点选择单元24可以基于重要性,将特征点减少到指定数目,以及将与所选择的特征点有关的信息输出为搜索结果。此时,代表特征点选择单元24可以按重要性的降序选择特征点。
另一方面,当从每个组选择的特征点的数目小于指定数目时,代表特征点选择单元24可以从具有最少特征点的组开始,从每个组进一步顺序地选择一个特征点。
通常,从图像检测的特征点倾向于集中在图像中的特定区域。由这些特征点保持的信息可以包含冗余度。通过图3所示的配置,通过考虑空间方向中的特征点的密度,代表特征点选择单元24从图像均匀地选择特征点。因此,能减少作为特征点描述的对象的特征点的数目,同时几乎不降低图像搜索、对象检测等等的应用的精度。
此外,分类特征点的方法不限于根据空间方向中的特征点的密度的方法。例如,除空间方向中的特征点的密度外,特征点分类单元22可以基于组中的特征点的定向的相似度,进一步分类特征点。例如,特征点分类单元22可以观察在根据空间方向的特征点的密度分类的组中的特征点中,最相邻特征点(具有最近距离的特征点)的定向,如果定向极其相似,则将特征点分为同一组,以及如果定向不相似,则将特征点分为不同组。
此外,代表基于空间方向中的特征点的密度,分类特征点后,基于其定向分类特征点的两阶段处理,特征点分类单元22可以通过同时考虑空间方向中的特征点的密度和特征点的定向的相似度,分类特征点。
如图4所示,特征点选择单元12可以被配置成包括特征点随机选择单元26。特征点随机选择单元26能对特征点随机地分配重要性以及按重要性的降序选择特征点。此外,只要选择了指定多个特征点,特征点随机选择单元26能将有关所选择的特征点的信息输出为选择结果。
通常,小规模大量地分布从图像检测的特征点,规模越大,所检测的特征点的数目越小。由此,由于特征点随机选择单元26对所有特征点随机地分配重要性以及按重要性的降序选择特征点,理想地,能选择特征点,同时保持前述的分布的形状。因此,选择在宽范围规模上的特征点以及完全能适应图像中捕捉的被写体的大小的波动。因此,能减少作为特征点描述的对象的特征点的数目,同时几乎不降低用于图像搜索、对象检测等等精度。
如图5所示,特征点选择单元12可以被配置成包括特定规模区域特征点选择单元28。基于特征点信息,特定规模区域特征点选择单元28能仅选择包括在所有特征点的规模之中的特定规模区域中的特征点。
此外,当所选择的特征点的数目大于指定数目时,例如,特定规模区域特征点选择单元28可以基于重要性,将特征点减少到指定数目,以及将与所选择的特征点有关的信息输出为选择结果。此时,特定规模区域特征点选择单元28可以按重要性的降序,选择特征点。
例如,特定规模区域特征点选择单元28可以确定具有越接近作为选择对象的规模区域的中心的规模的特征点具有更高重要性,以及按重要性的顺序选择特征点。或者,特定规模区域特征点选择单元28可以确定在作为选择对象的规模区域中,具有较大规模的特征点具有较高重要性以及按重要性的顺序选择特征点。
另一方面,当包括在特定规模区域中的特征点的数目小于指定数目时,例如,特定规模区域特征点选择单元28可以确定更接近规模区域的特征点具有更高重要性,以及从该规模区域前后的规模区域,顺序地重新选择特征点。
关于图像搜索、对象检测等等的应用,可能存在数据库中记录的图像中的对象大小已知以及能设定查询侧图像和数据库侧图像之间的捕捉对象的大小比的情形。在这种情况下,如果能已知在数据库侧特征点中,具有高重要性的特征点,关于这些特征点的规模,能从经受对应于查询侧图像和数据库侧图像之间的对象大小比的校正的规模区域,集中地选择特征点。此外,用于在数据库侧特征点中,发现具有高重要性的特征点的方法是任意的。例如,可以使用显著图,预先指定数据库侧图像中的关注区域,以及可以定义从该区域检测的特征点,使得具有高重要性。或者,例如,可以将具有大规模的特征点定义为重要。
现在返回到图1,局部特征量生成单元14接收从特征点检测单元输出的特征点信息以及从特征点选择单元12输出的选择结果。另外,局部特征量生成单元14生成(描述)作为对应于每个所选择的特征点的局部区域的特征量的局部特征量。此外,局部特征量生成单元14可以以无损压缩格式,诸如ZIP和LZH输出局部特征量。
局部特征量生成单元14能按特征点的重要性的顺序,生成和输出局部特征量。或者,局部特征量生成单元14可以按特征点的坐标位置的顺序生成和输出局部特征量。此外,由于按特征点的重要性的顺序生成局部特征量,仅使用特征点的一部分的局部特征量,而不是所有所选择的特征点的局部特征量,执行匹配处理。
例如,当将表示所选择的特征点的重要性的顺序及其特征点编号的信息接收为搜索结果时,局部特征量生成单元14能将对应于特征点编号的特征点设定为特征点生成的对象。
如图1所示,能将局部特征量生成单元14配置成包括局部区域获取单元40、子区域分割单元42、子区域特征向量生成单元44和维度选择单元46。
基于特征量信息,局部区域获取单元40从每个所检测的特征点的坐标位置、规模和定向,获取经受特征量提取的局部区域。此外,当对一个特征点,存在具有不同定向的多个特征点信息时,局部区域获取单元40能相对于每个特征点信息,获取局部区域。
子区域分割单元42通过根据特征点的定向方向,旋转局部区域,规范化局部区域,接着将局部区域分割成子区域。例如,如图24所示,子区域分割单元42能将局部区域分割成16块(4×4块)。或者,例如,子区域分割单元42能将局部区域分割成25块(5×5块)。
子区域特征向量生成单元44对局部区域的每个子区域,生成特征向量。例如,能将梯度定向直方图用作子区域的特征向量。具体地,子区域特征向量生成单元44对每个子区域中的每个像素,计算梯度定向,以及将梯度定向量化成8个方向。此时计算的梯度定向是相对于由特征点检测单元10输出的每个特征点的定向的相对方向。换句话说,梯度定向是相对于由特征点检测单元10输出的定向规范化的方向。此外,子区域特征向量生成单元44合计用于每个子区域的8个量化方向的频率,并且生成梯度定向直方图。在这种情况下,子区域特征向量生成单元44输出由相对于每个特征点生成的16块×8方向=128维度的梯度定向直方图构成的特征向量。或者,除量化8个方向中的梯度定向外,可以以任何量化数目,诸如4个方向、6个方向和10个方向执行量化。当将梯度定向量化成D个方向时,如果量化前的梯度定向由G(0至2π弧度)表示,那么,使用例如等式(1)或等式(2),能计算梯度定向的量化值i(i=0,…,D-1)。然而,这些等式不是限制性的,以及可以使用其他等式。
[等式1]
[等式2]
在上述等式中,floor()表示舍去小数点后的数字的函数,round()表示用于圆整(round-off)的函数,并且mod表示用于确定余数的计算。此外,当生成梯度定向直方图时,代替简单合计频率,可以相加梯度的大小来计算总和。或者,当合计梯度定向直方图时,由子区域之间的距离而定,加权值不仅可以与像素所属的子区域相加,而且可以与邻近子区域(诸如相邻块)相加。或者,可以在量化梯度定向前后的梯度定向中,增加加权值。此外,子区域中的特征向量不限于梯度定向直方图,而是可以是具有多个维度(元素)的任何信息,诸如颜色信息。将假定将梯度定向直方图用作子区域的特征向量来描述本实施例。
此外,子区域特征向量生成单元44能输出局部特征量,使得包括特征点的坐标位置信息。此外,子区域特征向量生成单元44能输出局部特征量,使得包括所选择的特征点的规模信息。
关于图像搜索、对象检测等等的应用,当在查询(搜索请求)侧图像和数据库侧图像中捕捉到同一对象时,图像之间的相应特征点的规模比几乎是恒定的。由此,通过将规模信息包括在局部特征量中,能提高特征量的匹配精度。
基于子区域之间的位置关系,维度选择单元46选择(减薄)将输出为局部特征量的维度(元素),使得降低相邻子区域的特征向量之间的相关性。更具体地说,例如,维度选择单元46选择维度,使得在相邻子区域之间,至少一个梯度定向不同。此外,当在本实施例中,相邻子区域主要用作邻近子区域时,邻近子区域不限于相邻子区域,而是例如,可以将在与对象子区域预定距离内的子区域看作邻近子区域。
此外,除简单地选择维度外,维度选择单元46能确定选择的优先次序。换句话说,例如,维度选择单元46能通过应用优先次序选择维度,使得不在相邻子区域之间选择具有同一梯度定向的维度。此外,维度选择单元46将由所选择的维度构成的特征向量输出为局部特征量。此外,维度选择单元46能在基于优先次序排序维度的情况下,输出局部特征量。
现在,将参考图6至10,描述维度选择单元46的维度选择的具体例子。图6是示出将局部区域分割成4×4块的子区域以及从通过在8个方向中量化梯度定向生成的128维度梯度定向直方图的特征向量选择维度的例子的图。在图6所示的例子中,从与SIFT特征量类似的128维度(4×4=16块×8方向)特征向量,选择维度。
如图6所示,当从128维度选择作为一半维度的64维度时,维度选择单元46能选择维度,使得不在彼此相邻的上下块(子区域)或左右块(子区域)选择具有同一梯度定向的维度。图6示出当由i(i=0,1,2,3,4,5,6,7)表示梯度定向直方图的量化梯度定向时,交替地排列选择i=0,2,4,6的元素的块和选择i=1,3,5,7的元素的块的例子。此外,作为另一例子,图6示出交替地排列选择i=0,3,4,7的元素的块和选择i=1,2,5,6的元素的块的例子。此外,在图6所示的例子中,相邻块之间所选择的的梯度定向(维度)总计为总共8个方向。换句话说,存在在相邻块之间,互补特征量的关系。
此外,如图6所示,当选择32维度时,维度选择单元46能选择维度,使得不在位于倾斜45度的块之间选择具有同一梯度定向的维度。此外,如图6所示的例子中,在2×2相邻块之中选择的梯度定向(维度)合计总共8个方向。换句话说,即使在这种情况下,存在相邻块之间互补特征量的关系。
如上所述,期望选择维度使得在相邻块之间,梯度定向彼此不重叠,以及均匀地选择所有梯度定向。此外,同时,期望从整个局部区域均匀地选择维度,如图6所示。此外,图6所示的维度选择方法仅是示例以及选择方法不限于此。
图7是示出维度选择的另一例子的图。在图7所示的例子中,子区域分割单元42将局部区域分割成5×5=25个块的子区域,以及子区域特征向量生成单元44由每个子区域生成6个方向的梯度定向直方图。换句话说,如图7所示,由子区域特征向量生成单元44生成的特征向量具有150维度。
如图7所示,当从150维度选择作为一半维度的75维度时,维度选择单元46能选择维度使得不在彼此相邻的上下块或左右块选择同一梯度定向。在该例子中,当由i(i=0,1,2,3,4,5)表示梯度定向直方图的量化梯度定向时,交替地排列选择i=0,2,4的元素的块和选择i=1,3,5的元素的块的例子。此外,如图7所示的例子中,相邻块之间选择的梯度定向合计总共6个方向。
此外,当从75维度选择50维度时,维度选择单元46能选择维度,使得在位于倾斜45度的块之间,仅一个方向是相同的(剩余一个方向不同)。此外,当从50维度选择25维度时,维度选择单元46能选择维度,使得在位于倾斜45度的块之间,所选择的梯度定向不一致。在图7所示的例子中,维度选择单元46在1至25维度中,从每个子区域选择一个梯度定向,在26至50中选择两个梯度定向,以及在51至75维度中选择三个梯度定向。
此外,例如,维度选择单元46可以在1至25维度、26至50维度以及51至75维度中选择维度,使得按如图8所示的块的顺序相加维度。当使用图8所示的优先次序时,维度选择单元46能通过使接近中心的块赋予高优先次序来选择梯度定向。图9是示出150维度特征向量的元素的编号的例子。在该例子中,如果用编号b(b=0,1,…,25),按光栅扫描顺序表示5×5=25块,以及用i(i=0,1,2,3,4,5)表示量化梯度定向,那么将特征向量的元素的编号表示为6×b+i。
此外,图10是示出根据图8所示的优先次序,通过选择图9所示的元素获得的局部特征量的配置例子的图。例如,维度选择单元46能按图10所示的顺序输出维度(元素)。具体地,例如,当输出150维度的局部特征量时,维度选择单元46能按图10所示的顺序输出所有150维度的元素。此外,例如,当输出25维度局部特征量时,维度选择单元46能按图10所示的顺序(从左到右),输出图10中所示的第一行的元素(第76,第45,第83,…,第120元素)。此外,例如,当输出50维度局部特征量时,按图10所示的顺序(从左到右),除图10所示的第一行外,维度选择单元46还能输出图10中所示的第二行的元素。
在图10所示的例子中,局部特征量具有层次配置。换句话说,例如,在25维度局部特征量和150维度局部特征量之间,对应于前25维度的局部特征量的元素的排列是相同的。如所示,通过分层(逐行)地选择维度,维度选择单元46能提取和输出任意多个维度的局部特征量,或换句话说,根据应用、通信容量、终端规格等等,任意大小的局部特征量。此外,由于维度选择单元46基于优先次序,分层地选择维度并且在排列维度后输出维度,能使用具有不同多个维度的局部特征量执行图像匹配。例如,当使用75维度局部特征量和50维度局部特征量执行图像匹配时,能仅使用前50维度执行局部特征量之间的距离的计算。
此外,图8至10所示的优先次序仅是示例,以及当选择维度时应用的次序不限于此。例如,关于块的顺序,代替图8所示的例子,可以应用图11A和11B所示的顺序。此外,例如,可以设定优先次序,使得从所有子区域均匀地选择维度。或者,假定局部区域的中心附近很重要,可以设定优先次序,使得中心附近的子区域中,选择频率高。此外,例如,表示维度的选择顺序的信息可以在程序中定义或存储在执行程序时所引用的表等等(选择顺序存储单元)中。
或者,维度选择单元46可以执行选择,诸如图12A和图12B所示的那些。在这种情况下,在指定子区域中选择6个维度以及在与指定子区域相邻的另一子区域中选择0维度。即使在这种情况下,可以有把握地说,对每个子区域选择维度,使得降低邻近子区域之间的相关性。
此外,局部区域和子区域的形状不限于诸如图6和7所示的方形,而是可以是任意形状。例如,如图13所示,局部区域获取单元40可以被配置成获得圆形局部区域。在这种情况下,如图13所示,例如,子区域分割单元42能将圆形局部区域分割成9个子区域或17个子区域。即使在这种情况下,例如,维度选择单元46能在每个子区域中选择维度,如图14所示。此外,在图14所示的例子中,当从72维度选择40维度时,在中心子区域中不执行维度的变薄。
图15是示出通过局部特征量提取装置1A的处理的例子的流程图。首先,特征点检测单元10接收作为局部特征量生成的对象的图像(S1501)。特征点检测单元10从所接收的图像检测特征点以及输出特征点信息,包括特征点的坐标位置和规模、特征点的定向和特征点编号(S1502)。此外,基于特征点信息,特征点选择单元12按重要性的顺序,从所检测的特征点选择指定多个特征点并且输出其选择结果(S1503)。
接着,基于每个所选择的特征点的坐标值、规模和定向,局部区域获取单元40获得将经受特征量提取的局部区域(S1504)。此外,子区域分割单元42将局部区域分割成子区域(S1502)。子区域特征向量生成单元44对局部区域的每个子区域生成梯度定向直方图(S1506)。最后,维度选择单元46根据所设定的选择顺序,选择将输出为局部特征量的维度(元素)(S1507)。
如上所述,通过根据第一实施例的局部特征量提取装置1A,基于子区域之中的位置关系,维度选择单元46选择将输出为局部特征量的维度(元素),使得降低邻近子区域之间的相关性。换句话说,由于邻近子区域通常具有高相关性,维度选择单元46能选择维度,使得不从邻近子区域选择同一特征向量的维度(元素)。相应地,能降低特征量的大小,同时保持被写体识别的精度。
此外,维度选择单元46能分层(逐行)地输出局部特征量,如图10所示。相应地,即使在具有不同所选择的维度数目(特征量的大小)的局部特征量之间,也能执行匹配(距离计算)。
此外,由于维度选择单元46基于子区域之间的位置关系执行维度选择,当选择维度时,不需要执行学习。换句话说,能不依赖于数据(图像),执行通用局部特征量提取。
此外,通过局部特征量提取装置1A,基于特征点信息,特征点选择单元12按重要性的顺序,从多个所检测的特征点选择预定多个特征点。此外,局部特征量生成单元14相对于每个所选择的特征点生成局部特征量。相应地,与对所有所检测的特征点生成局部特征量相比,能减小局部特征量的大小。换句话说,能将局部特征量的大小控制到对应于指定数目的大小。此外,由于按重要性的顺序选择作为局部特征量生成的对象的特征点,能保持被写体识别的精度。此外,由于减小局部特征量大小,当使用局部特征量执行图像搜索时,能缩短通信时间和处理时间。
此外,在局部特征量提取装置1A中,可以交换由子区域特征向量生成单元44和维度选择单元46执行的处理的顺序。换句话说,通过局部特征量提取装置1A,在维度选择单元46选择维度后,可以通过子区域特征向量生成单元44,相对于所选择的维度,生成特征向量。
第二实施例
接着,将描述第二实施例。图16是示出根据本发明的第二实施例的局部特征量提取装置的配置的图。如图16所示,局部特征量提取装置1B被配置成包括特征点检测单元10、选择数目确定单元50、特征点选择单元52和局部特征量生成单元54。此外,局部特征量生成单元54被配置成包括局部区域获取单元40、子区域分割单元42、子区域特征向量生成单元44和维度选择单元56。如所示,通过局部特征量提取装置1B,选择数目确定单元50已经增加到根据第一实施例的局部特征量提取装置1A上。此外,通过局部特征量提取装置1B,由特征点选择单元52和维度选择单元56替换根据第一实施例的局部特征量提取装置1A的特征点选择单元12和维度选择单元46。此外,与第一实施例相同的部件指定相同的参考符号并且将省略其描述。
选择数目确定单元50能确定将由特征点选择单元52选择的特征点的数目(所选择的特征点的数目)以及将由维度选择单元56选择的维度数目(所选择的维度数目)。例如,通过从用户接收表示特征点的数目和维度数目的信息,选择数目确定单元50能确定特征点的数目和维度数目。此外,表示特征点的数目和维度数目的信息不一定需要表示特征点的数目和维度数目本身,而是可以是例如表示搜索精度和搜索速度的信息。具体地,例如,当接收请求搜索精度增加的输入时,选择数目确定单元50可以被配置成确定特征点的数目和维度数目,使得增加特征点的数目和维度数目的至少一个。此外,例如,当接收请求搜索速度增加的输入时,选择数目确定单元50可以被配置成减少特征点的数目和维度数目的至少一个。
此外,例如,选择数目确定单元50可以被配置成基于使用局部特征量提取装置1B的应用、局部特征量提取装置1B的通信容量、终端的处理规格等等,确定特征点的数目和维度数目。具体地,例如,当通信容量小(通信速度低)时,选择数目确定单元50可以被配置成确定特征点的数目和维度数目,使得与通信容量大(通信速度高)的情形相比,减少特征点的数目和维度数目的至少一个。或者,例如,当终端的处理规格低时,选择数目确定单元50可以被配置成确定特征点的数目和维度数目,使得与处理规格高的情形相比,减少特征点的数目和维度数目的至少一个。或者,例如,选择数目确定单元50可以被配置成根据终端的处理负担,动态地确定特征点的数目和维度数目。
基于由选择数目确定单元50确定的特征点的数目,特征点选择单元52能以与根据第一实施例的特征点选择单元12类似的方式,选择特征点。
基于由选择数目确定单元50确定的维度数目,维度选择单元56能以与根据第一实施例的维度选择单元46类似的方式,选择特征向量的维度,并且将该维度输出为局部特征量。
如上所述,通过根据第二实施例的局部特征量提取装置1B,选择数目确定单元50能确定将由特征点选择单元52选择的特征点的数目以及将由维度选择单元56选择的维度数目。相应地,能基于用户输入、通信容量、终端的处理规格等等,确定适当的特征点的数目和适当的维度数目。因此,能将特征量的大小控制到所需大小,同时保持被写体识别的精度。
第三实施例
接着,描述第三实施例。图17是示出根据本发明的第三实施例的局部特征量提取装置的配置的图。如图17所示,局部特征量提取装置1C被配置成包括特征点检测单元10、选择数目确定单元60、特征点选择单元52和局部特征量生成单元54。此外,局部特征量生成单元54被配置成包括局部区域获取单元40、子区域分割单元42、子区域特征向量生成单元44和维度选择单元56。如所示,通过局部特征量提取装置1C,已经由选择数目确定单元60代替根据第二实施例的局部特征量提取装置1B的选择数目确定单元50。此外,与第二实施例相同的部件指定相同的参考符号并且将省略其描述。
基于作为用于指定整个图像的特征量的大小(总大小)的信息的指定特征量大小信息,选择数目确定单元60能确定特征点的数目和维度数目,使得整个图像的特征量的大小等于指定特征量大小。
首先,将描述首先确定维度数目的模式。例如,选择数目确定单元60能基于定义指定特征量大小和维度数目之间的对应关系的信息,确定维度数目。图18示出定义指定特征量大小和维度数目之间的对应关系的信息的例子。通过参考诸如图18所示的信息,选择数目确定单元60能确定对应于指定特征量大小的维度数目。此外,在图18所示的对应关系中,当指定特征量大小增加时,所选择的维度数目增加,对应关系不限于此。例如,可以采用与指定特征量大小无关,关联固定维度数目的对应关系。此外,例如,定义对应关系的信息可以在程序中定义或存储在由程序引用的表等等中。
此外,基于指定特征量大小和所确定的维度数目,选择数目确定单元60能确定所选择的特征点的数目,使得特征量大小等于指定特征量大小。此外,当局部特征量生成单元54输出特征量,使得包括诸如特征点的坐标位置的附加信息时,选择数目确定单元60能确定特征点的数目,使得包括附加信息的描述大小的特征量大小等于指定特征量大小。
此外,选择数目确定单元60还能基于特征点选择单元52的选择结果,再次确定维度数目。例如,当输入图像是仅具有少量特征量的图像时,可以仅存在少量可检测特征点。因此,可能存在由特征点选择单元52选择的特征点的数目低于由选择数目确定单元60确定的特征点的数目的情形。在这种情况下,选择数目确定单元60能从特征点选择单元52接收有关由特征点选择单元52选择的特征点的数目的信息,以及再次确定维度数目,以致指定特征量大小减小所选择的特征点的数目。这还可应用于稍后所述的第三实施例的另一模式。
接着,将描述首先确定特征点的数目的模式。例如,选择数目确定单元60能基于定义指定特征量大小和特征点的数目之间的对应关系的信息,确定特征点的数目。能以与图18所示的定义指定特征量大小和维度数目之间的对应关系的信息的类似的方式,限定定义该对应关系的信息。例如,能定义对应关系,使得指定特征量大小越大,将选择的特征点的数目越大。此外,对应关系不限于此,例如,可以采用与指定特征量大小无关,关联固定特征点的数目的对应关系。
此外,基于指定特征量大小和所确定的特征点的数目,选择数目确定单元60能确定所选择的维度数目,使得特征量大小等于指定特征量大小。此外,当局部特征量生成单元54输出特征量,使得包括诸如特征点的坐标位置的附加信息时,选择数目确定单元60能确定维度数目,使得包括附加信息的描述大小的特征量大小等于指定特征量大小。
接着,将描述同时确定特征点的数目和维度数目的模式。例如,选择数目确定单元60能基于定义指定特征量大小以及特征点的数目和维度数目之间的对应关系的信息,确定特征点的数目和维度数目。能以与图18中所示的定义指定特征量大小和维度数目之间的对应关系的信息类似的方式,定义限定该对应关系的信息。例如,能定义对应关系,使得指定特征量大小越大,待选择的特征点的数目和维度数目越大。此外,对应关系不限于此,例如,可以采用与指定特征量大小无关,关联固定特征点的数目或固定维度数目的对应关系。
此外,当局部特征量生成单元54输出特征量,使得包括诸如特征点的坐标位置的附加信息时,选择数目确定单元60能确定特征点的数目和维度数目,使得包括附加信息的描述大小的特征量大小等于指定特征量大小。
如上所述,通过根据第三实施例的局部特征量提取装置1C,选择数目确定单元60能基于指定特征量大小信息,确定将由特征点选择单元52选择的特征点的数目和将由维度选择单元56选择的维度数目。因此,能将特征量的大小控制到所需大小并且保持被写体识别的精度。
第四实施例
接着,将描述第四实施例。图19是示出根据本发明的第四实施例的局部特征量提取装置的配置的图。如图19所示,局部特征量提取装置1D被配置成包括特征点检测单元10、选择数目确定单元70、特征点选择单元72和局部特征量生成单元54。此外,局部特征量生成单元54被配置成包括局部区域获取单元40、子区域分割单元42、子区域特征向量生成单元44和维度选择单元56。如所示,通过局部特征量提取装置1D,已经由选择数目确定单元70和特征点选择单元72代替根据第三实施例的局部特征量提取装置1C的选择数目确定单元60和特征点选择单元52。此外,与第三实施例相同的部件指定相同的参考符号并且将省略其描述。
以与根据第一实施例的特征点选择单元12类似的方式,特征点选择单元72基于从特征点检测单元10输出的特征点信息,执行特征点选择。此外,特征点选择单元72将表示所选择的特征点的数目的信息输出到选择数目确定单元70。
选择数目确定单元70以与根据第三实施例的选择数目确定单元60类似的方式,接收指定特征量大小信息。此外,基于指定特征量大小信息和由特征点选择单元72选择的特征点的数目,选择数目确定单元70能确定维度数目,使得整个图像的特征量大小等于指定特征量大小。
此外,当局部特征量生成单元54输出特征量,使得包括诸如特征点的坐标位置的附加信息时,选择数目确定单元70能确定维度数目,使得包括附加信息的描述大小的特征量大小等于指定特征量大小。
如上所述,通过根据第四实施例的局部特征量提取装置1D,选择数目确定单元70能基于指定特征量大小信息和由特征点选择单元72选择的特征点的数目,确定将由维度选择单元56选择的维度数目。因此,能将特征量的大小控制到所需大小,同时保持被写体识别的精度。
第五实施例
接着,将描述第五实施例。图20是示出根据本发明的第五实施例的局部特征量提取装置的配置的图。如图20所示,局部特征量提取装置1E被配置成包括特征点检测单元10、选择数目确定单元80、特征点选择单元82和局部特征量生成单元54。此外,局部特征量生成单元54被配置成包括局部区域获取单元40、子区域分割单元42、子区域特征向量生成单元44和维度选择单元56。如所示,通过局部特征量提取装置1E,已经由选择数目确定单元80和特征点选择单元82代替根据第二实施例的局部特征量提取装置1B的选择数目确定单元50和特征点选择单元52。此外,与第二实施例相同的部件指定相同的参考符号并且将省略其描述。
以与根据第一实施例的特征点选择单元12类似的方式,特征点选择单元82基于从特征点检测单元10输出的特征点信息,执行特征点选择。此外,特征点选择单元82将表示每个所选择的特征点的重要性的信息输出到选择数目确定单元80。
基于从特征点选择单元82输出的重要性信息,选择数目确定单元80能对每个特征点,确定将由维度选择单元56选择的维度数目。例如,选择数目确定单元80能确定维度数目,使得特征点的重要性越高,将选择的维度数目越大。
或者,选择数目确定单元80可以被配置成以与根据第四实施例的选择数目确定单元70类似的方式,接收指定特征量大小信息和确定维度数目,使得整个图像的特征量大小等于指定特征量大小。具体地,例如,选择数目确定单元80可以确定维度数目,使得特征点的重要性越高,所选择的维度数越大,以及整个图像的特征量大小等于指定特征量大小。
此外,当局部特征量生成单元54输出特征量,使得包括诸如特征点的坐标位置的附加信息时,选择数目确定单元80能确定维度数目,使得包括附加信息的描述大小的特征量大小等于指定特征量大小。
如上所述,通过根据第五实施例的局部特征量提取装置1E,选择数目确定单元80能基于由特征点选择单元82选择的每个特征点的重要性,对每个特征点,确定将由维度选择单元56选择的维度数目。因此,能将特征量大小控制到所需大小,同时保持被写体识别的精度。
应用
图21是示出能应用在第一至第五实施例中所呈现的局部特征量提取装置的匹配系统的例子的图。如图21所示,匹配系统被配置成包括匹配装置100、特征量数据库(DB)110和局部特征量提取装置120。
通过核对包括在从局部特征量提取装置120传送的搜索请求中的局部特征量和在特征量DB 110中存储的局部特征量,匹配装置100能搜索包含与输入到局部特征量提取装置120的图像中的被写体类似的被写体的图像。
特征量DB 110与已作为提取源的图像关联,存储从多个图像提取的局部特征量。在特征量DB 110中存储的局部特征量可以是例如按图10所示的顺序输出的150维度的特征向量。
局部特征量提取装置120可以使用在第一至第五实施例的任何一个中所呈现的局部特征量提取装置。
局部特征量提取装置120生成包含在输入图像中检测到的特征点的局部特征量的搜索请求,以及将搜索请求传送到匹配装置100。通过核对所接收的局部特征量和特征量DB110中存储的局部特征量,匹配装置100确定与所输入的图像类似的图像。然后,匹配装置100将表示确定为与输入图像类似的图像的信息作为搜索结果输出到局部特征量提取装置120。
在该匹配系统中,通过局部特征量提取装置120,基于子区域之间的位置关系,选择将输出为局部特征量的维度(元素),使得减小邻近子区域之间的相关性,如在第一至第五实施例中所述。由此,能减小局部特征量的大小,同时保持由匹配装置100的匹配精度。
因此,能缩短将局部特征量从局部特征量提取装置120传送到匹配装置100所需的通信时间的缩减。此外,由于局部特征量的大小小,能减轻匹配装置100的匹配的处理负担。此外,由于局部特征量具有如图10所示的层次(逐行)配置,即使由局部特征量提取装置120提取的局部特征量的维度数目与特征量DB 110和存储器中存储的局部特征量的维度数目彼此不同时,匹配装置100也能使用多至相互共享维度数目的局部特征量执行匹配处理。
例如,如图22所示,假定在特征量DB 110中存储的局部特征量具有150维度,而由局部特征量提取装置120提取的局部特征量具有50维度的情形。在这种情况下,匹配装置100能使用多至50维度的两个局部特征量执行匹配。换句话说,例如,即使根据局部特征量提取装置120的处理能力,改变局部特征量的维度数目,使用具有所改变的维度数目的局部特征量,通过匹配装置100,能执行匹配处理。
应注意到,本实施例是为了便于理解本发明,以及不用于限定本发明的解释。在不背离其精神和范围的情况下,能对本发明做出各种改进和改变,以及其等效包括在本发明中。
本申请要求基于2011年11月18日提交的日本专利申请No.2011-253223的优先权,其全部内容在此引入以供参考。
尽管已经参考实施例描述了本发明,但本发明不打算限于上述实施例。在不背离本发明的范围的情况下,本领域的技术人员能想到对本发明的配置和细节的各种改进。
本实施例的一部分或全部也可以描述为,但不限于下述附录。
(附录1)一种局部特征量提取装置包括:特征点检测单元,检测图像中的多个特征点,以及输出作为与每个特征点有关的信息的特征点信息;特征点选择单元,基于特征点信息,从多个所检测的特征点,按重要性的顺序,选择预定多个特征点;局部区域获取单元,获得对应于每个所选择的特征点的局部区域;子区域分割单元,将每个局部区域分割成多个子区域;子区域特征向量生成单元,对每个局部区域中的每个子区域,生成多个维度的特征向量;以及维度选择单元,基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得相邻子区域之间的相关性被降低,以及将所选择的维度的元素输出为局部区域的特征量。
(附录2)根据附录1所述的局部特征量提取装置,进一步包括选择数目确定单元,确定将由特征点选择单元选择的特征点的数目和将由维度选择单元选择的维度数目。
(附录3)根据附录2所述的局部特征量提取装置,其中,选择数目确定单元接收作为指定所选择的特征点的特征量的总大小的信息的指定特征量大小信息以及基于指定特征量大小信息,确定特征点的数目和维度数目。
(附录4)根据附录3所述的局部特征量提取装置,其中,选择数目确定单元基于表示总大小和维度数目之间的对应关系的信息和指定特征量大小信息,确定特征点的数目和维度数目。
(附录5)根据附录3所述的局部特征量提取装置,其中,选择数目确定单元基于表示总大小和特征点的数目之间的对应关系的信息和指定特征量大小信息,确定特征点的数目和维度数目。
(附录6)根据附录3所述的局部特征量提取装置,其中,选择数目确定单元基于表示总大小、特征点的数目和维度数目之间的对应关系的信息和指定特征量大小信息,确定特征点的数目和维度数目。
(附录7)根据附录1所述的局部特征量提取装置,进一步包括:选择数目确定单元,接收表示特征点选择单元的特征点的选择结果的选择结果信息,以及基于选择结果信息,确定维度数目。
(附录8)根据附录7所述的局部特征量提取装置,其中,选择结果信息包括表示每个所选择的特征点的重要性的重要性信息,以及选择数目确定单元基于重要性信息,确定用于每个所选择的特征点的维度数目。
(附录9)根据附录7或8所述的局部特征量提取装置,其中,选择数目确定单元进一步接收作为用于指定所选择的特征点的特征量的总大小的信息的指定特征量大小信息,以及基于选择结果信息和指定特征量大小信息,确定维度数目。
(附录10)根据附录1至9的任何一个所述的局部特征量提取装置,其中,维度选择单元从特征向量选择维度,使得在相邻子区域之间,所选择的维度的至少一个不同。
(附录11)根据附录1至10的任何一个所述的局部特征量提取装置,其中,维度选择单元用于在局部区域中的多个子区域的特征向量中选择维度的选择顺序,从特征向量选择维度。
(附录12)根据附录11所述的局部特征量提取装置,其中,维度选择单元按根据选择顺序选择的维度的顺序,将所选择的维度的元素输出为局部区域的特征量。
(附录13)根据附录1至12的任何一个所述的局部特征量提取装置,其中,特征点信息包括表示每个特征点的规模的规模信息,以及特征点选择单元基于按根据规模的重要性的顺序的规模信息,从多个所检测的特征点选择预定多个特征点。
(附录14)根据附录1至12的任何一个所述的局部特征量提取装置,其中,特征点选择单元包括基于特征点信息,将多个所检测的特征点分类成多个组的特征点分类单元,以及通过从每个组选择至少一个特征点,选择预定多个特征点的代表特征点选择单元。
(附录15)一种局部特征量提取方法,用于使计算机:检测图像中的多个特征点,以及输出作为有关每个特征点的信息的特征点信息;基于特征点信息,从多个所检测的特征点,按重要性的顺序,选择预定多个特征点;获得对应于每个所选择的特征点的局部区域;将每个局部区域分割成多个子区域;对每个局部区域中的每个子区域,生成多个维度的特征向量;以及基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得邻近子区域之间的相关性被降低,以及将所选择的维度的元素输出为局部区域的特征量。
(附录16)一种程序,使计算机实现下述功能:检测图像中的多个特征点,以及输出作为有关每个特征点的信息的特征点信息;基于特征点信息,从多个所检测的特征点,按重要性的顺序,选择预定多个特征点;获得对应于每个所选择的特征点的局部区域;将每个局部区域分割成多个子区域;对每个局部区域中的每个子区域,生成多个维度的特征向量;以及基于每个局部区域中的子区域之间的位置关系,从用于每个子区域的特征向量选择维度,使得邻近子区域之间的相关性被降低,以及将所选择的维度的元素输出为局部区域的特征量。
1A至1E 局部特征量提取装置
10 特征点检测单元
12 特征点选择单元
14 局部特征量生成单元
40 局部区域获取单元
42 子区域分割单元
44 子区域特征向量生成单元
46 维度选择单元
Claims (7)
1.一种局部特征量提取装置,包括:
特征点检测单元,所述特征点检测单元被配置成检测图像中的多个特征点,并且输出特征点信息,所述特征点信息是有关每个特征点的信息;
特征点选择单元,所述特征点选择单元被配置成基于所述特征点信息来从检测的所述多个特征点中按重要性的顺序选择规定数目的特征点;
局部区域获取单元,所述局部区域获取单元被配置成获取对应于各个所选择的特征点的局部区域;
子区域分割单元,所述子区域分割单元被配置成将每个局部区域分割成多个子区域;
子区域特征向量生成单元,所述子区域特征向量生成单元被配置成针对每个局部区域中的每个子区域生成多个维度的特征向量;
维度选择单元,所述维度选择单元被配置成基于每个局部区域中的子区域之间的位置关系来从每个子区域的所述特征向量选择使得邻近子区域之间的相关性被降低的维度,并且将所选择的维度的元素作为局部区域的特征量进行输出;以及
选择数目确定单元,所述选择数目确定单元被配置成确定将由所述特征点选择单元选择的特征点的数目和将由所述维度选择单元选择的维度数目,
其中,所述选择数目确定单元被配置成接收指定的特征量大小信息,并且基于所述指定的特征量大小信息来确定所述特征点的数目和所述维度数目,所述指定的特征量大小信息是用于指定所选择的特征点的特征量的总大小的信息。
2.根据权利要求1所述的局部特征量提取装置,其中,
所述选择数目确定单元被配置成基于指示所述总大小和所述维度数目之间的对应关系的信息和所述指定的特征量大小信息,来确定所述特征点的数目和所述维度数目。
3.根据权利要求1所述的局部特征量提取装置,其中,
所述选择数目确定单元被配置成基于指示所述总大小和所述特征点的数目之间的对应关系的信息和所述指定的特征量大小信息,来确定所述特征点的数目和所述维度数目。
4.根据权利要求1所述的局部特征量提取装置,其中,
所述选择数目确定单元被配置成基于指示所述总大小、所述特征点的数目和所述维度数目之间的对应关系的信息和所述指定的特征量大小信息,来确定所述特征点的数目和所述维度数目。
5.根据权利要求1所述的局部特征量提取装置,进一步包括:
选择数目确定单元,所述选择数目确定单元被配置成接收指示所述特征点选择单元对特征点的选择结果的选择结果信息,并且基于所述选择结果信息来确定所述维度数目。
6.根据权利要求5所述的局部特征量提取装置,其中,
所述选择结果信息包括指示每个所选择的特征点的重要性的重要性信息,并且
所述选择数目确定单元被配置成基于所述重要性信息来确定每个所选择的特征点的所述维度数目。
7.一种局部特征量提取方法,所述方法用于使得计算机:
检测图像中的多个特征点,并且输出特征点信息,所述特征点信息是有关每个特征点的信息;
基于所述特征点信息来从检测的所述多个特征点中按重要性的顺序选择规定数目的特征点;
获取对应于各个所选择的特征点的局部区域;
将每个局部区域分割成多个子区域;
针对每个局部区域中的每个子区域生成多个维度的特征向量;
基于每个局部区域中的子区域之间的位置关系来从每个子区域的所述特征向量选择使得邻近子区域之间的相关性被降低的维度,并且将所选择的维度的元素作为局部区域的特征量进行输出;
确定将选择的特征点的数目和将选择的维度数目,
其中,确定将选择的特征点的数目和将选择的维度数目的步骤包括接收指定的特征量大小信息,并且基于所述指定的特征量大小信息来确定所述特征点的数目和所述维度数目,所述指定的特征量大小信息是用于指定所选择的特征点的特征量的总大小的信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011253223 | 2011-11-18 | ||
JP2011-253223 | 2011-11-18 | ||
PCT/JP2012/079673 WO2013073622A1 (ja) | 2011-11-18 | 2012-11-15 | 局所特徴量抽出装置、局所特徴量抽出方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103946891A CN103946891A (zh) | 2014-07-23 |
CN103946891B true CN103946891B (zh) | 2017-02-22 |
Family
ID=48429676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280056804.2A Active CN103946891B (zh) | 2011-11-18 | 2012-11-15 | 局部特征量提取装置和局部特征量提取方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9697435B2 (zh) |
EP (1) | EP2782067B1 (zh) |
JP (1) | JP6044548B2 (zh) |
KR (1) | KR101612212B1 (zh) |
CN (1) | CN103946891B (zh) |
WO (1) | WO2013073622A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6168303B2 (ja) * | 2012-01-30 | 2017-07-26 | 日本電気株式会社 | 情報処理システム、情報処理方法、情報処理装置およびその制御方法と制御プログラム、通信端末およびその制御方法と制御プログラム |
JP6225460B2 (ja) * | 2013-04-08 | 2017-11-08 | オムロン株式会社 | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 |
FR3009635B1 (fr) * | 2013-08-08 | 2016-08-19 | St Microelectronics Sa | Procede de recherche d'une image similaire dans une banque d'images a partir d'une image de reference |
WO2015099016A1 (ja) * | 2013-12-26 | 2015-07-02 | 日本電気株式会社 | 画像処理装置、被写体識別方法及びプログラム |
KR101533925B1 (ko) * | 2014-05-20 | 2015-07-03 | 한양대학교 에리카산학협력단 | 적외선 영상에서 소형 표적 검출 방법 및 그 장치 |
CN105989367B (zh) | 2015-02-04 | 2019-06-28 | 阿里巴巴集团控股有限公司 | 目标获取方法及设备 |
EP3113077B1 (en) * | 2015-06-30 | 2018-08-29 | Lingaro Sp. z o.o. | Method for image feature point description |
CN105243661A (zh) * | 2015-09-21 | 2016-01-13 | 成都融创智谷科技有限公司 | 一种基于susan算子的角点检测方法 |
US10339411B1 (en) | 2015-09-28 | 2019-07-02 | Amazon Technologies, Inc. | System to represent three-dimensional objects |
US9830528B2 (en) | 2015-12-09 | 2017-11-28 | Axis Ab | Rotation invariant object feature recognition |
CN110895699B (zh) * | 2018-09-12 | 2022-09-13 | 北京字节跳动网络技术有限公司 | 用于处理图像的特征点的方法和装置 |
CN111325215B (zh) * | 2018-12-14 | 2024-03-19 | 中国移动通信集团安徽有限公司 | 图像局部特征描述方法、装置、设备及介质 |
CN111127385B (zh) * | 2019-06-06 | 2023-01-13 | 昆明理工大学 | 基于生成式对抗网络的医学信息跨模态哈希编码学习方法 |
CN110889904B (zh) * | 2019-11-20 | 2024-01-19 | 广州智能装备研究院有限公司 | 一种图像特征精简方法 |
CN111160363B (zh) * | 2019-12-02 | 2024-04-02 | 深圳市优必选科技股份有限公司 | 特征描述子生成方法、装置、可读存储介质及终端设备 |
CN113127663B (zh) * | 2021-04-01 | 2024-02-27 | 深圳力维智联技术有限公司 | 目标图像搜索方法、装置、设备及计算机可读存储介质 |
CN117058723B (zh) * | 2023-10-11 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 掌纹识别方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101714254A (zh) * | 2009-11-16 | 2010-05-26 | 哈尔滨工业大学 | 联合多尺度sift和区域不变矩特征的配准控制点提取方法 |
CN101859326A (zh) * | 2010-06-09 | 2010-10-13 | 南京大学 | 一种图像检索方法 |
CN102004916A (zh) * | 2010-11-15 | 2011-04-06 | 无锡中星微电子有限公司 | 图像特征提取系统及其方法 |
CN102169581A (zh) * | 2011-04-18 | 2011-08-31 | 北京航空航天大学 | 一种基于特征向量的快速高精度鲁棒性匹配方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6711293B1 (en) | 1999-03-08 | 2004-03-23 | The University Of British Columbia | Method and apparatus for identifying scale invariant features in an image and use of same for locating an object in an image |
JP5183392B2 (ja) | 2008-09-25 | 2013-04-17 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
WO2010087125A1 (ja) * | 2009-01-29 | 2010-08-05 | 日本電気株式会社 | 時間区間代表特徴ベクトル生成装置 |
US20100246969A1 (en) | 2009-03-25 | 2010-09-30 | Microsoft Corporation | Computationally efficient local image descriptors |
JP6044547B2 (ja) | 2011-11-18 | 2016-12-14 | 日本電気株式会社 | 局所特徴量抽出装置、局所特徴量抽出方法、及びプログラム |
-
2012
- 2012-11-15 US US14/359,063 patent/US9697435B2/en active Active
- 2012-11-15 WO PCT/JP2012/079673 patent/WO2013073622A1/ja active Application Filing
- 2012-11-15 CN CN201280056804.2A patent/CN103946891B/zh active Active
- 2012-11-15 KR KR1020147016332A patent/KR101612212B1/ko active IP Right Grant
- 2012-11-15 JP JP2013544319A patent/JP6044548B2/ja active Active
- 2012-11-15 EP EP12849587.6A patent/EP2782067B1/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101714254A (zh) * | 2009-11-16 | 2010-05-26 | 哈尔滨工业大学 | 联合多尺度sift和区域不变矩特征的配准控制点提取方法 |
CN101859326A (zh) * | 2010-06-09 | 2010-10-13 | 南京大学 | 一种图像检索方法 |
CN102004916A (zh) * | 2010-11-15 | 2011-04-06 | 无锡中星微电子有限公司 | 图像特征提取系统及其方法 |
CN102169581A (zh) * | 2011-04-18 | 2011-08-31 | 北京航空航天大学 | 一种基于特征向量的快速高精度鲁棒性匹配方法 |
Non-Patent Citations (1)
Title |
---|
基于SIFT和角点检测的自动图像匹配方法研究;王静;《万方数据库》;20110920;第12-25页 * |
Also Published As
Publication number | Publication date |
---|---|
US20140328543A1 (en) | 2014-11-06 |
CN103946891A (zh) | 2014-07-23 |
KR20140091067A (ko) | 2014-07-18 |
EP2782067A1 (en) | 2014-09-24 |
JP6044548B2 (ja) | 2016-12-14 |
EP2782067A4 (en) | 2016-08-17 |
KR101612212B1 (ko) | 2016-04-15 |
US9697435B2 (en) | 2017-07-04 |
JPWO2013073622A1 (ja) | 2015-04-02 |
EP2782067B1 (en) | 2019-09-18 |
WO2013073622A1 (ja) | 2013-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103946891B (zh) | 局部特征量提取装置和局部特征量提取方法 | |
US10922526B2 (en) | Method for 3D object recognition based on 3D primitives | |
JP5134664B2 (ja) | アノテーション装置 | |
US7873208B2 (en) | Image matching system using three-dimensional object model, image matching method, and image matching program | |
US7653249B2 (en) | Variance-based event clustering for automatically classifying images | |
RU2533441C2 (ru) | Способ и устройство для обеспечения поиска изображения по содержимому | |
CN108875542B (zh) | 一种人脸识别方法、装置、系统及计算机存储介质 | |
CN106575365A (zh) | 对象识别特点分析系统和方法 | |
JP5963609B2 (ja) | 画像処理装置、画像処理方法 | |
US9418314B2 (en) | Information processing apparatus and control method and control program thereof, and communication terminal and control method and control program thereof | |
CN113362441B (zh) | 三维重建方法、装置、计算机设备和存储介质 | |
CN106817677A (zh) | 一种基于多传感器的室内目标信息识别方法、装置及系统 | |
CN111323024A (zh) | 定位方法及装置、设备、存储介质 | |
JP5248236B2 (ja) | 画像処理装置および画像処理方法 | |
CN109086350A (zh) | 一种基于WiFi的混合图像检索方法 | |
CN109961103B (zh) | 特征提取模型的训练方法、图像特征的提取方法及装置 | |
KR20190124436A (ko) | 영상 기반 건물 검색 방법 및 장치 | |
CN109657083B (zh) | 纺织品图片特征库的建立方法和装置 | |
JP2011118790A (ja) | 類似画像検索装置,類似画像検索方法および類似画像検索プログラム | |
CN110059212A (zh) | 图像检索方法、装置、设备及计算机可读存储介质 | |
US20150254527A1 (en) | Methods for 3d object recognition and registration | |
JP2006221525A (ja) | オブジェクト検索システムおよび方法 | |
CN110472085A (zh) | 三维图像搜索方法、系统、计算机设备和存储介质 | |
KR20130036839A (ko) | 증강현실 서비스를 지원하는 시스템에서 영상 정합을 위한 장치 및 방법 | |
JP6717769B2 (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |