CN102508917B - 部分特征图像的多维度目标快速鲁棒检索定位方法 - Google Patents
部分特征图像的多维度目标快速鲁棒检索定位方法 Download PDFInfo
- Publication number
- CN102508917B CN102508917B CN2011103700793A CN201110370079A CN102508917B CN 102508917 B CN102508917 B CN 102508917B CN 2011103700793 A CN2011103700793 A CN 2011103700793A CN 201110370079 A CN201110370079 A CN 201110370079A CN 102508917 B CN102508917 B CN 102508917B
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- retrieval
- descriptor
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种部分特征图像的多维度目标快速鲁棒检索定位方法,通过预处理、特征点处理、图像的鲁棒快速准确匹配和图像的匹配检索定位,较全面的解决了在图像目标检索定位中由于图像的大小,旋转,视角变换,部分遮挡和紧密耦合等因素造成图像检索定位系统不稳定、准确率和速度间的关系对应率低、定位精度度差等问题;在部分特征图像的检索定位技术领域实现了较好的灵活性,易于实现性、稳定性、准确度、高速度和高精准度的效果。
Description
技术领域
本发明属于一种图像特征目标检索领域,提出了一种部分内容图像特征目标检索方法,尤其是涉及一种部分特征图像的多维度目标快速鲁棒检索定位方法。
背景技术
在当今的信息社会中,尽管CAD技术在工业设计领域得到了广泛的应用,但仍有大量的图纸信息以纸质、图片的形式保存、管理和使用着。这些工程图纸往往使一个系统或者行业长时间积累下来的,完整的保存了以往的宝贵经验,对以后的设计有很好的借鉴作用。其中相当一部分还会在以后的设计和制造中被修改和重复使用。为了复用这些图纸,将这些图纸图像的信息用计算机进行管理,并建立相应的数据库,以大大减少图纸的更新和维护耗费的人力资源,更加便于存储、修改、查询、交流,是必然的发展趋势,具有重要的社会现实意义。工程图矢量化是将工程图的扫描位图表达转化为CAD系统使用的图形描述矢量实体,如直线、圆、圆弧、曲线以及字符等,可大大提高图纸的复用能力。
完整的矢量化过程大体分为两类,一种是包括有图像的预处理、图像二值化以及二值图的矢量化识别过程,即直接在光栅图上进行图形识别的矢量化系统;一种是包括光栅图初步矢量化和图形类型检测/识别的两步操作的二维矢量化系统。其中应用较为理想的是第二种方法,即先通过矢量化预处理方法,然后利用预处理过程的输出数据进行基于图形类型的检测和识别过程,该过程可以得到较为理想的CAD文件。图像初步矢量化过程同样包括有图像的预处理过程、图像的二值化等过程。本发明涉及包括图像初步矢量化和基于矢量化的图形检测识别的整个过程,称为工程CAD图纸的矢量化图形识别系统。
国内外研究人员针对图像矢量化处理过程提出了一些比较有效的算法,主要集中于初步矢量化/识别的思路。不同的初步矢量化算法往往对应于不同的图形识别算法。这里根据初步矢量化算法分类有:基于细化的方法、基于轮廓线的方法、基于图形结构的方法、离散象素跟踪的方法以及正交之字型(简称为OZZ)方法。目前针对矢量化的研究基本上都是在这些方法的框架下进行的,但对于图像具有噪声干扰,仅有离散图像跟踪的方法能够取得比较好的效果,但离散图像跟踪的方法为了避免在初步矢量化过程中全图搜索的过程而采用了位置索引算法,该算法得到的覆盖域不能完全与原图匹配,会造成一些误矢量化的结果。另外,由于对工程CAD图纸的矢量化在理论方面还有很多不完善的地方,因此大都仍然处于研究阶段,没有形成完整的系统。
现有专利(基于二值区域的逐步迭代矢量化预处理系统)和专利(一种工程CAD图纸的矢量化识别方法)分别提出了一种二值区域的逐步迭代矢量化处理方法和一种矢量化识别方法。其中第一项专利的矢量化预处理方法主要进行了基于斜框覆盖域的初步矢量化过程,但该覆盖域方法并不能有效覆盖已矢量化部分,而且很可能覆盖多余的未矢量化区域;第二项专利的识别过程是在前一个专利的基础上进行的,矢量化数据通过位置索引方法提高识别的效率,识别方法采用了基于假设/检验的方法进行。由于存在交错线后位置索引方法带来的误差,使得识别结果获得了很多不完整的图形。
随着数字采集设备成本的降低和存储设备容积的几何级数的增大,如何从海量图像数据库中能够快速准确鲁棒的检索出所需要寻找的图片并对图片中相应的感兴趣目标进行定位,例如:肇事车辆,犯罪嫌疑人,目标建筑等是一个具有广阔的应用前景和发展潜力的方法。目标图片检索是人工智能领域和数据挖据领域的一个研究的重要问题,在解决自动化生产和检测,智能信息提取,医学影像检索等生产生活问题的重要方法。
现阶段,图片检索是智能信息信息处理的一项关键且非常具有挑战性的技术,如何在复杂背景,例如光照变换,背景噪声,视角变换,遮蔽,目标耦合粘连等情况下对图片目标进行准确的检索和定位。尤其是当目标部分被遮蔽或者与其他目标紧密耦合的情况下,将目标准确的从图片数据库中检索出来并进行准确定位会遇到更大的问题。
经典的信息搜索方法主要是通过启发式的人工文字标注来检索图像和视频,每个图像是通过多个关键字来描述的。经典的信息检索技术在检索网页和自然语言文字信息等领域取得了很大的成功。采用此种方法,随着数据库技术的发展和数字设备价格的不断下降,这种劳动密集型技术变得越来越困难。传统方法在检索图像和视频存在两个主要问题。第一个问题是,传统的检索方法在检索图像和视频时完全依赖于用于描述图像信息的文本或行标签等关键字。但是,通过文字来准确描述图像有时是非常困难的。通过Google搜索“Car”会返回期望的结果,而通过Google搜索“McDonalds”返回的结果则是杂乱无章的。另一个问题是,现在的检索定位需要人工为数据集图像添加文本标注。现在需要的最实用和高效的检索工具应当是能够处理显著增长的大且相对无组织结构的图像数据库。通过模板图像来搜索图像是一种更智能的方法,也就是说,当我们需要检索图像时,不是通过输入“关键字”,而是通过输入“模板图像”实现搜索,其搜索结果将是与“模板图像”相关的图像信息。这是一种可替代的输入方法。
新检索方法主要有两个主要优势,一个是用图像表示所需要搜索的内容比用文字表示更准确;另外一个是避免了人工给图像添加文本标注的繁琐工作。
在采用模版对图像进行快速检索定位的技术之中,采用目标的颜色图像统计信息是一种重要的方法。MJ Swain,D H Ballard.等提出根据图片的颜色直方图信息来检索图片,RSchettini,GCiocca,等在‘A Survey of Methods for Colour Image Indexing and Retrievalin Image Databases’等提出可在不同的颜色空间,例如RGB,CIE,HSI,HSV空间等,主要的量化方法有最重要信息位、颜色空间划分、颜色空间聚类、参考颜色、图像分割等,文献中讨论了对这些方法进行了讨论和总结。由于颜色直方图缺乏颜色的空间分布信息,且基于颜色的统计信息的方法过于关注于色彩,当光照等变化时,颜色信息会产生变换,系统的鲁棒性比较差。
纹理是图像的重要特征之一,通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量,其本质是刻画像素的邻域灰度空间分布规律。纹理特征描述方法大致可以分为四类:统计法、结构法、模型法、频谱法。Tamura等人基于人类视觉的心理学研究后提出了一些不同的方法来描述纹理特征,给出了几个不同的描述纹理特征的术语:粗糙度(Coarseness)、对比度(Contrast)、方向(Directionality)、线性度(Linelikeness)、规则度(Regularity)、粗略度(Roughness)等。当目标图片不具有纹理信息时,此方法不适用。
SBres,R Schettini等在‘.Detection of Interest Points for Image Indexation’提出将图像边缘上的角点作为特征点,然后使用Delaunay三角形进行划分,记录三角形的形状特征来描述图像的形状特征。这种方法由于是基于边缘上的一些特殊点,因此对噪声和点位置的变化较为敏感。A KJain,A Vailaya.等在‘Image Retrieval Using Color and Shape’文献采用边缘方向直方图来刻画形状特征,具有简单、平移不变性等优点,但也存在不具备尺度、旋转不变性等缺点。
目标图片的检索定位技术的核心是使用图像的可视特征对图像进行检索。本质上讲,它是一种近似匹配技术,融合了计算机视觉、图像处理、图像理解和数据库等多个领域的技术成果,其中的特征提取和索引的建立可由计算机自动完成,避免了人工描述的主观性。用户检索的过程一般是提供一个样例图像(Queryby Example)或描绘一幅草图(Queryby Sketch),系统抽取该查询图像的特征,然后与数据库中的特征进行比较,并将与查询特征相似的图像返回给用户。由于所要识别的图像目标可能存在大小、方向、光照、形变等变化,特别是当图像目标部分遮挡或紧密耦合的情况下,图像目标检索定位是一个非常复杂的问题。总的来说,图像目标检索定位问题的复杂性,现有的方法并没有能够在检索定位的准确性和速度方面解决很好,还存在诸多问题,特别在如何选取合适的具有尺度,旋转,视角等变换不变性的鲁棒特征表征图像目标;以及如何能够在合理的时间范围内利用所提取的特征快速检索匹配定位目标。
针对目前识别方法的不足或缺陷,本发明提出了一种全新的具有层级结构的多尺度高校目标识别方法:主要包括以下几层:首先,采用Multi-resolution的分析工具(比如GaborWavelets等)对图像进行滤波处理并在此分解图中提取基于部分内容的具有尺度,旋转,视角等等变换不变性的鲁棒特的局部特征来表征图像,然后采用在频率域的基于Manhattan距离的最近邻优先匹配算法对所提取的特征进行匹配并采用分类器进行分类,最后采用基于几何不变性的Random Sampling算法对目标进行快速准确检索定位。
发明内容
本发明要解决的技术问题是克服现有技术中在目标图像内容不完整的情况下的不能精确或者不能图像目标检索和定位系统的不足和缺陷;本发明的目的是实现了当图像目标部分内容遮挡或紧密耦合的情况下,提供了一种有效快速有效的图像目标检索识别方法,具体是一种部分特征图像的多维度目标快速鲁棒检索定位方法。该部分特征图像的多维度目标快速鲁棒检索定位方法通过预处理、特征点处理、图像的鲁棒快速准确匹配和图像的匹配检索定位,较全面的解决了在图像目标检索定位中由于图像的大小,旋转,视角变换,部分遮挡和紧密耦合等因素造成图像检索定位系统不稳定、准确率和速度间的关系对应率低、定位精度度差等问题;在部分特征图像的检索定位技术领域实现了较好的灵活性,易于实现性、稳定性、准确度、高速度和高精准度的效果。
为有效解决上述技术问题并且实现其上述目的达到较好的技术效果,本发明是通过以下技术方案实现的:
本发明提供的一种部分特征图像的多维度目标快速鲁棒检索定位方法,该方法依次包括以下具体的步骤:
步骤(1)、预处理:首先,将数据库中存储的多个不同图像通过加博滤波器进行滤波分解得到频率域不同的4个带,每个带分成12个不同子带,每个子带的尺度大小之比依次为1∶2,且每个子带间的角度相差为30度,然后在Ycbcr图像色域内进行噪声消除和图像的清晰度增强的预处理;其中,在所述噪声消除的过程中,采用所述每个子带的尺度的大小梯度模型对图像边沿进行粗处理,以梯度均值作为其控制阀值;在进行图像增强处理中,将每个带中的12个子带在Ycbcr图像色空间中分别进行图像增强处理;
步骤(2)、特征点处理:对步骤(1)中预处理后的每个带,计算每个带中的各子带的能量值,并将每个带中的所有子带的能量值进行累加处理得到每个带的能量值,然后将得到的4个带的能量值进行累加处理得到完整的在加博滤波器中小波域内的累加能量图;其中,所述累加能量图为不同维度图像的叠加图;然后在所述累加能量图中通过9cm×9cm大小的窗口选取大小尺度和旋转度的局部能量最大值的特征点,然后将小于所述局部能量最大值的特征点的能量值的65%的伪特征点去除;再通过一个具有局部特征的窗口进行筛选图像的局部能量最大值的特征点;
步骤(3)、图像的鲁棒快速准确匹配:在步骤(2)的特征点处理后,提取上述步骤(2)中累加能量图中具有旋转与尺度变换不变性的鲁棒特征;然后对其中任意的两个带及其子带方向不同方向的亮度信息的所有特征点进行建立图像特征点的描述子,所述描述子是一个7×12维度的特征矩阵;将所述特征矩阵进行按行方向的快速傅立叶变换,同时在变换的过程中进行插值,通过插值可以得到48个维度的方向描述,然后在上述不同的4个带的频率域内对特征描述子进行归一化处理,得到特征描述子A,再对特征描述子A进行乘积处理,选取最大的值为可得到匹配的特征子;然后对匹配的特征子进行逆快速傅立叶变换得到原始的空间域的描述子;
步骤(4)、图像的匹配检索定位:通过分类器对上述步骤(3)的匹配的特征子进行分类从而得到图片目标;其中,在进行匹配目标的分类之前,对每对7×12维度的特征矩阵中的特征对进行索引,形成匹配特征对的索引数据库;然后从索引数据库中抽取2000~3000组特征进行样本的训练,然后通过几何不变性的自由采样算法在所述索引数据库中对目标进行快速准确检索定位。
作为优选的技术方案:
上述步骤(3)中:在对描述子的匹配过程之中,采用Manhattan距离的最近邻优先匹配算法对描述子进行匹配。
上述步骤(4)中:从索引数据库中抽取2400组特征进行样本的训练。
上述步骤(4)中:从索引数据库中抽取2600组特征进行样本的训练。
上述步骤(4)中:从索引数据库中抽取2800组特征进行样本的训练。
此外,本发明的部分特征图像的多维度目标快速鲁棒检索定位方法还可依次通过以下步骤来实现:
步骤一、从图片中提取基于部分内容的具有变换不变性的鲁棒特征来表征图片;
首先,对图片采用Gabor Wavelets进行滤波分解得到4个band,得到每个层级之间大小相差为1∶2不同的12个不同子带,每个子带间的角度相差为30度,12个子带可以覆盖整个圆周,并在Ycbcr域内做噪声消除和图像增强的预处理,以增加图片的清晰度,减少不必要的干扰。在做噪声消除的过程中,设置阀值为局部最大能量的75%。进行图像增强处理时,对12个子带在Ycbcr空间分别进行操作。然后计算12个不同子带的RMS(Root Mean Square)能量并将所有子带的能量进行乘积累加处理得到每个band的能量,最终将得到的4个band进行累加处理得到完整的在Gabor小波域内的累加能量图。此累加能量图是基于各个不同multi-resolution图像的叠加图,然后在得到的乘积累加能量图中采用9x9大小的窗口选取具有大小,旋转和视角等变换不变性的局部最大值,同时为了对得到的不必要的伪变换不变性特征进行消除,采用所得到的特征和最大特征值相比的办法进行最大值抑制,如果所得到的特征能量,少于最大特征点能量的65%,则认为此能量点是伪特征点。所挑选的特征是基于所有resolution和所有方向子带所选取的,因而具有大小,旋转等变换不变性特征。同时,我们采用的一个具有局部特征的窗口来筛选图像的局部最大值特征,这样所选取的特征是基于图像的部分内容,因而当图像被遮挡或紧密耦合时,所选取的特征不受影响。为了提高所得到的特征点的空间位置准确度,在能量累积图中,采用4x4的Hessian矩阵对图像进行平滑处理,并基于所的到的平滑图像得到特征点的精确位置。通过选取基于Gabor Wavelets分解得到的多尺度,多方向的局部内容特征最大值的合适特征,可以得到具有尺度,旋转,视角等变换不变性的鲁棒特征表征图像目标,来描述整个图像数据库中的图像目标。此选取的具有具有尺度,旋转,视角等变换不变性的变换不变性的鲁棒特征很适合来表征图像目标,特别是当目标图片部分遮挡和紧密耦合的情况下,解决了传统的采用颜色,纹理或形状等方法来进行目标检索定位时遇到的问题,提高了目标图像检索的准确度。
步骤二:对所得到的变换不变性的鲁棒特征进行快速准确匹配;
在提取了基于Gabor Wavelets分解变换能量累积图得到的具有变换不变性的鲁棒特征来标准整个图片后,下一步是如何快速准确的对这些得到的特征进行准确的匹配,从而得到最相似的特征群组。在此,采用如下步骤,首先统计所选取的特征点在一定范围内,比如16x16,在不同band(2个)和子带方向(12)不同方向的亮度信息的统计特征,然后基于此统计特征建立图像特征点的描述子,此描述子是一个7x12维度的特征矩阵。为了对此特征矩阵进行快速匹配,首先将此特征矩阵进行按行方向的快速傅立叶变换(FFT),同时在变换的过程中在接近中心频率的范围内进行4倍插值,通过插值,可以进一步提高特征描述子的选择不变性。以前的特诊描述子具有12个方向维度的描述,通过插值可以得到48个维度的方向描述,这样对方向的选择不变性从30度提高到了7.5度。然后在频率域内对特征描述子进行归一化处理,得到标准化的特征描述子。对标准化后的特征描述子进行乘积处理然后选取最大的值即可得到匹配的特征子。对匹配的特征子进行逆快速傅立叶变换即可得到原先的空间域的描述子。在对描述子的匹配过程之中,采用基于Manhattan距离的最近邻优先匹配算法对描述子进行匹配,从而提高了匹配的速度。通过在频率域的匹配避免了通常所需的卷积或内积操作,从而提高执行速度。通过采用以上步骤,对所得到的具有变换不变性的特征进行快速准确匹配。
步骤三,采用分类器对所得到的匹配特征进行分类从而得到图片目标;
在得到变换不变性的鲁棒特征的匹配对后,下一步的工作是对匹配对特征进行分类。从而基于匹配特征对,检索到所需要的图片目标。在进行匹配目标对的分类之前,对每对7x12维度的特征对进行索引,形成匹配特征对的索引数据库。然后从索引数据库中抽取一定数量的,比如2000组特征进行样本的训练。在训练的过程中,采用Gaussian Kernel对样本特征进行变换,映射到Gassian空间中,然后采用支持向量机(SVM)对特征进行分类,从而得到特征的分类的超平面。在对测试序列进行分类时,需要从每组图片中提取一定数量的特征匹配对(比如10-200对),然后将得到的测试序列对输入分类器,对图片进行分类检索。通过对比实验发现,支持向量机分类的方法具有分类准确率高,速度快的特点,同时可以避免过渡拟合的问题,具有很好的通用性。
步骤四:最后采用基于几何不变性的自由采样算法对目标进行快速准确检索定位;
在采用分类器对得到的变换不变性匹配特征对进行分类后,可以检索到所需的目标图片。接下的问题是如何在特征图片中对目标进行定位。在此,采用最后采用基于几何小变性的Random Sampling算法对目标进行快速准确检索定位.在基于几何不变性的模型之中,采用平面变换不变性模型来建立目标的几何特征模型。此模型有6个参数,因此仅需3对匹配对即可对模型进行建模,可以容忍目标图像的大小,旋转等变换,而且对视角的变换具有一定的鲁棒性。在选取匹配特征对的过程中,采用自由采样算法(Random Sampling)算法来选取所需的特征对。自由采样算法可以很好的剔除当图像中的不正确匹配对造成的定位误差。在描述误差的过程中,采用误差的累积平均值来描述。采用求解伪逆矩阵的方法来得到6个参数的拟合解。为了得到更好的定位精度,在求解参数的过程中,对自由采样算法重复一定的次数,选取具有最小定位误差的一组参数作为最后的定位参数,从而得到最终的定位模型。通过采用此种基于几何不变性的自由采样算法对目标进行快速准确检索定位,同时此方法具有所需匹配对少的有点,最少仅需要3对。
本发明的技术方案带来的有益效果有:具有以上通过采用从图片中提取基于部分内容的具有变换不变性的鲁棒特征来表征图片以提高其高准确率,避免了传统的采用颜色和纹理等方法来检索图像时的鲁棒性和准确率不够的问题,特别是针对当图片部分遮挡或紧密耦合的情况,具有很好的高精确度效果。同时通过在频率域采用基于Manhattan距离的最近邻优先匹配算法对描述子进行匹配,从而提高了匹配的速度。采用分类器对所得到的匹配特征进行分类从而得到图片目标,采用基于几何不变性的自由采样算法对目标进行快速准确检索定位,减少了定位误差。较全面的解决了在图片目标检索定位领域中存在的算法的鲁棒性和算法时间复杂度之间的矛盾的问题,实验结果表明该方法具有很好的识别准确率同时具有较高的识别速度,同时具有很好的定位精度。
具体实施方式
下面结合具体实施方式,进一步阐述本发明。
实施例1:
一种部分特征图像的多维度目标快速鲁棒检索定位方法,该方法依次包括以下具体的步骤:
步骤(1)、预处理:首先,将数据库中存储的多个不同图像通过加博滤波器进行滤波分解得到频率域不同的4个带,每个带分成12个不同子带,每个子带的尺度大小之比依次为1∶2,且每个子带间的角度相差为30度,然后在Ycbcr图像色域内进行噪声消除和图像的清晰度增强的预处理;其中,在所述噪声消除的过程中,采用所述每个子带的尺度的大小梯度模型对图像边沿进行粗处理,以梯度均值作为其控制阀值;在进行图像增强处理中,将每个带中的12个子带在Ycbcr图像色空间中分别进行图像增强处理;
步骤(2)、特征点处理:对步骤(1)中预处理后的每个带,计算每个带中的各子带的能量值,并将每个带中的所有子带的能量值进行累加处理得到每个带的能量值,然后将得到的4个带的能量值进行累加处理得到完整的在加博滤波器中小波域内的累加能量图;其中,所述累加能量图为不同维度图像的叠加图;然后在所述累加能量图中通过9cm×9cm大小的窗口选取大小尺度和旋转度的局部能量最大值的特征点,然后将小于所述局部能量最大值的特征点的能量值的65%的伪特征点去除;再通过一个具有局部特征的窗口进行筛选图像的局部能量最大值的特征点;
步骤(3)、图像的鲁棒快速准确匹配:在步骤(2)的特征点处理后,提取上述步骤(2)中累加能量图中具有旋转与尺度变换不变性的鲁棒特征;然后对其中任意的两个带及其子带方向不同方向的亮度信息的所有特征点进行建立图像特征点的描述子,所述描述子是一个7×12维度的特征矩阵;将所述特征矩阵进行按行方向的快速傅立叶变换,同时在变换的过程中进行插值,通过插值可以得到48个维度的方向描述,然后在上述不同的4个带的频率域内对特征描述子进行归一化处理,得到特征描述子A,再对特征描述子A进行乘积处理,选取最大的值为可得到匹配的特征子;然后对匹配的特征子进行逆快速傅立叶变换得到原始的空间域的描述子,在对描述子的匹配过程之中,采用Manhattan距离的最近邻优先匹配算法对描述子进行匹配;
步骤(4)、图像的匹配检索定位:通过分类器对上述步骤(3)的匹配的特征子进行分类从而得到图片目标;其中,在进行匹配目标的分类之前,对每对7×12维度的特征矩阵中的特征对进行索引,形成匹配特征对的索引数据库;然后从索引数据库中抽取2000~3000组特征进行样本的训练,然后通过几何不变性的自由采样算法在所述索引数据库中对目标进行快速准确检索定位。
实施例2:
一种部分特征图像的多维度目标快速鲁棒检索定位方法,该方法依次包括以下具体的步骤:
步骤(1)、预处理:首先,将数据库中存储的多个不同图像通过加博滤波器进行滤波分解得到频率域不同的4个带,每个带分成12个不同子带,每个子带的尺度大小之比依次为1∶2,且每个子带间的角度相差为30度,然后在Ycbcr图像色域内进行噪声消除和图像的清晰度增强的预处理;其中,在所述噪声消除的过程中,采用所述每个子带的尺度的大小梯度模型对图像边沿进行粗处理,以梯度均值作为其控制阀值;在进行图像增强处理中,将每个带中的12个子带在Ycbcr图像色空间中分别进行图像增强处理;
步骤(2)、特征点处理:对步骤(1)中预处理后的每个带,计算每个带中的各子带的能量值,并将每个带中的所有子带的能量值进行累加处理得到每个带的能量值,然后将得到的4个带的能量值进行累加处理得到完整的在加博滤波器中小波域内的累加能量图;其中,所述累加能量图为不同维度图像的叠加图;然后在所述累加能量图中通过9cm×9cm大小的窗口选取大小尺度和旋转度的局部能量最大值的特征点,然后将小于所述局部能量最大值的特征点的能量值的65%的伪特征点去除;再通过一个具有局部特征的窗口进行筛选图像的局部能量最大值的特征点;
步骤(3)、图像的鲁棒快速准确匹配:在步骤(2)的特征点处理后,提取上述步骤(2)中累加能量图中具有旋转与尺度变换不变性的鲁棒特征;然后对其中任意的两个带及其子带方向不同方向的亮度信息的所有特征点进行建立图像特征点的描述子,所述描述子是一个7×12维度的特征矩阵;将所述特征矩阵进行按行方向的快速傅立叶变换,同时在变换的过程中进行插值,通过插值可以得到48个维度的方向描述,然后在上述不同的4个带的频率域内对特征描述子进行归一化处理,得到特征描述子A,再对特征描述子A进行乘积处理,选取最大的值为可得到匹配的特征子;然后对匹配的特征子进行逆快速傅立叶变换得到原始的空间域的描述子;
步骤(4)、图像的匹配检索定位:通过分类器对上述步骤(3)的匹配的特征子进行分类从而得到图片目标;其中,在进行匹配目标的分类之前,对每对7×12维度的特征矩阵中的特征对进行索引,形成匹配特征对的索引数据库;然后从索引数据库中抽取2400组特征进行样本的训练,然后通过几何不变性的自由采样算法在所述索引数据库中对目标进行快速准确检索定位。
实施例3:
一种部分特征图像的多维度目标快速鲁棒检索定位方法,该方法依次包括以下具体的步骤:
步骤(1)、预处理:首先,将数据库中存储的多个不同图像通过加博滤波器进行滤波分解得到频率域不同的4个带,每个带分成12个不同子带,每个子带的尺度大小之比依次为1∶2,且每个子带间的角度相差为30度,然后在Ycbcr图像色域内进行噪声消除和图像的清晰度增强的预处理;其中,在所述噪声消除的过程中,采用所述每个子带的尺度的大小梯度模型对图像边沿进行粗处理,以梯度均值作为其控制阀值;在进行图像增强处理中,将每个带中的12个子带在Ycbcr图像色空间中分别进行图像增强处理;
步骤(2)、特征点处理:对步骤(1)中预处理后的每个带,计算每个带中的各子带的能量值,并将每个带中的所有子带的能量值进行累加处理得到每个带的能量值,然后将得到的4个带的能量值进行累加处理得到完整的在加博滤波器中小波域内的累加能量图;其中,所述累加能量图为不同维度图像的叠加图;然后在所述累加能量图中通过9cm×9cm大小的窗口选取大小尺度和旋转度的局部能量最大值的特征点,然后将小于所述局部能量最大值的特征点的能量值的65%的伪特征点去除;再通过一个具有局部特征的窗口进行筛选图像的局部能量最大值的特征点;
步骤(3)、图像的鲁棒快速准确匹配:在步骤(2)的特征点处理后,提取上述步骤(2)中累加能量图中具有旋转与尺度变换不变性的鲁棒特征;然后对其中任意的两个带及其子带方向不同方向的亮度信息的所有特征点进行建立图像特征点的描述子,所述描述子是一个7×12维度的特征矩阵;将所述特征矩阵进行按行方向的快速傅立叶变换,同时在变换的过程中进行插值,通过插值可以得到48个维度的方向描述,然后在上述不同的4个带的频率域内对特征描述子进行归一化处理,得到特征描述子A,再对特征描述子A进行乘积处理,选取最大的值为可得到匹配的特征子;然后对匹配的特征子进行逆快速傅立叶变换得到原始的空间域的描述子;
步骤(4)、图像的匹配检索定位:通过分类器对上述步骤(3)的匹配的特征子进行分类从而得到图片目标;其中,在进行匹配目标的分类之前,对每对7×12维度的特征矩阵中的特征对进行索引,形成匹配特征对的索引数据库;然后从索引数据库中抽取2600组特征进行样本的训练,然后通过几何不变性的自由采样算法在所述索引数据库中对目标进行快速准确检索定位。
实施例4:
一种部分特征图像的多维度目标快速鲁棒检索定位方法,该方法依次包括以下具体的步骤:
步骤(1)、预处理:首先,将数据库中存储的多个不同图像通过加博滤波器进行滤波分解得到频率域不同的4个带,每个带分成12个不同子带,每个子带的尺度大小之比依次为1∶2,且每个子带间的角度相差为30度,然后在Ycbcr图像色域内进行噪声消除和图像的清晰度增强的预处理;其中,在所述噪声消除的过程中,采用所述每个子带的尺度的大小梯度模型对图像边沿进行粗处理,以梯度均值作为其控制阀值;在进行图像增强处理中,将每个带中的12个子带在Ycbcr图像色空间中分别进行图像增强处理;
步骤(2)、特征点处理:对步骤(1)中预处理后的每个带,计算每个带中的各子带的能量值,并将每个带中的所有子带的能量值进行累加处理得到每个带的能量值,然后将得到的4个带的能量值进行累加处理得到完整的在加博滤波器中小波域内的累加能量图;其中,所述累加能量图为不同维度图像的叠加图;然后在所述累加能量图中通过9cm×9cm大小的窗口选取大小尺度和旋转度的局部能量最大值的特征点,然后将小于所述局部能量最大值的特征点的能量值的65%的伪特征点去除;再通过一个具有局部特征的窗口进行筛选图像的局部能量最大值的特征点;
步骤(3)、图像的鲁棒快速准确匹配:在步骤(2)的特征点处理后,提取上述步骤(2)中累加能量图中具有旋转与尺度变换不变性的鲁棒特征;然后对其中任意的两个带及其子带方向不同方向的亮度信息的所有特征点进行建立图像特征点的描述子,所述描述子是一个7×12维度的特征矩阵;将所述特征矩阵进行按行方向的快速傅立叶变换,同时在变换的过程中进行插值,通过插值可以得到48个维度的方向描述,然后在上述不同的4个带的频率域内对特征描述子进行归一化处理,得到特征描述子A,再对特征描述子A进行乘积处理,选取最大的值为可得到匹配的特征子;然后对匹配的特征子进行逆快速傅立叶变换得到原始的空间域的描述子;
步骤(4)、图像的匹配检索定位:通过分类器对上述步骤(3)的匹配的特征子进行分类从而得到图片目标;其中,在进行匹配目标的分类之前,对每对7×12维度的特征矩阵中的特征对进行索引,形成匹配特征对的索引数据库;然后从索引数据库中抽取2800组特征进行样本的训练,然后通过几何不变性的自由采样算法在所述索引数据库中对目标进行快速准确检索定位。
实施例5:
一种部分特征图像的多维度目标快速鲁棒检索定位方法,该方法依次包括以下具体的步骤:
步骤一、采集目标图像;所述目标图像的采集方法如下:
首先,对图片采用数字信号处理芯片(DSP)对目标图片进行滤波分解,得到每个层级之间大小相差为1∶2的4个band,同时得到不同的12个不同子带,其中子带间角度相差30度。通过在Ycbcr域内的噪声消除和图像增强的预处理,使得目标图片的性噪比提高10倍以上。在选取DSP期间的过程中,采用德州仪器公司所推出的面向图像视频处理专用的64系列高性能处理器,此处理器在体系结构和指令集等各个层级基础上,对图像视频处理做了加速运算。通过分立器件所构成的乘法器和累加运放器等,在选取乘法器和累加运放器的过程中,采用具有高容积率的电容电阻和运放器件,具有很高的抗电磁干扰特性对图像进行快速的累加,从而得到具有不同维度的图像的叠加能量图。在累加能量图中采用9x9大小的窗口选取具有大小,旋转和视角等变换不变性的局部最大值,同时为了对得到的不必要的伪变换小变性特征进行消除,采用所得到的特征和最大特征值相比的办法进行最大值抑制,如果所得到的特征能量,少于最大特征点能量的65%,则认为此能量点是伪特征点。在实验中,通过控制目标阀值的大小,可以精确的控制所得到的特征点的个数,在实验中,对每张图片得到大约4000个特征点。为了提高所得到的特征点的空间位置准确度,在能量累积图中,采用4x4的Hessian矩阵对图像进行平滑处理。这样,通过对每张图片选取大约4000个基于部分内容的特征点,此选取的具有具有尺度,旋转,视角等变换不变性的变换不变性的鲁棒特征很适合来表征图像目标,特别是当目标图片部分遮挡和紧密耦合的情况下,解决了传统的采用颜色,纹理或形状等方法来进行目标检索定位时遇到的问题,提高了目标图像检索的准确度。
步骤二:对所得到的变换不变性的鲁棒特征进行快速准确匹配;
首先采用基于Xilinx的现场可编程门阵列器件(FPGA)对所获得的特征建立图像特征点的描述子,此描述子是一个7x12维度的特征矩阵。为了对此特征矩阵进行快速匹配,采用FPGA作为协处理器,将此特征矩阵进行按行方向的快速傅立叶变换(FFT),同时在变换的过程中在接近中心频率的范围内进行4倍插值,对匹配的特征子进行逆快速傅立叶变换即可得到原先的空间域的描述子。在对描述子的匹配过程之中,采用基于Manhattan距离的最近邻优先匹配算法对描述子进行匹配,从而提高了匹配的速度。再采用FPGA进行逆快速傅立叶变换(IFFT)。通过实验发现大概每张图片可以得到1000对特征匹配对。
步骤三,采用分类器对所得到的匹配特征进行分类从而得到图片目标;
在所采用的64系列DSP处理器上,在进行匹配目标对的分类之前,对每对7x12维度的特征对进行索引,形成匹配特征对的索引数据库。然后从索引数据库中抽取2000组特征进行样本的训练。在训练的过程中,采用Gaussian Kernel对样本特征进行变换,映射到Gassian空间中,然后采用支持向量机(SVM)对特征进行分类,从而得到特征的分类的超平面。在对测试序列进行分类时,需要从每组图片中提取50对的特征匹配对,然后将得到的测试序列对输入分类器,对图片进行分类检索。通过对比实验发现,支持向量机分类的方法具有分类准确率高,速度快的特点,同时可以避免过渡拟合的问题,具有很好的通用性,可以在图像数据库中快速检索所需图片目标。
步骤四:最后采用基于几何不变性的自由采样算法对目标进行快速准确检索定位;
由于基于64系列DSP的图像处理平台对基于几何不变性的Random Sampling算法对目标进行快速准确检索定位算法具有很好的支持特性,此步骤也采用此平台进行处理。在基于几何不变性的模型之中,采用具有6个参数的平面变换不变性模型来建立目标的几何特征模型。为了提高定位的准确度,我们采用50组特征匹配对来对模型参数进行求解,每组重复10次操作。选取具有最小定位误差的一组参数作为最后的定位参数,从而得到最终的定位模型。
实施例6:
一种部分特征图像的多维度目标快速鲁棒检索定位方法,为了对方法进行客观的评价,采用了标准数据库对方法进行测试,数据库包括256类不同的图像和一个背景类图像,每类图像包含大约500张在不同的光照,大学,旋转和视角变换下的图片,相邻两周图片图像大小的差距为0.1。相邻图片间的选择角度变换为5度。每张图片提取2000个具有变换不变性的特征表征图片,采用线性支持向量机进行分类在进行分类时,进行分类时,我们选取一半的图像作为训练集,另外一半的作为测试集,然后寻找RoC曲线上的平衡点作为测试准确性的标准。采用选取50组匹配的特征对输入基于几何不变性的自由采样算法对目标进行快速准确检索定位,算法的检索准确度达到90%以上,同时处理时间少于2秒钟,平均定位误差少于0.6像素。
本发明的保护范围不局限于上述说明解释和实施例。相反,旨在本发明在所有所述的权利要求所确定的界限内均广泛适用。
Claims (5)
1.一种部分特征图像的多维度目标快速鲁棒检索定位方法,其特征在于,该方法依次包括以下具体的步骤:
步骤(1)、预处理;
首先,将数据库中存储的多个不同图像通过加博滤波器进行滤波分解得到频率域不同的4个带,每个带分成12个不同子带,每个子带的尺度大小之比依次为1∶2,且每个子带间的角度相差为30度,然后在Ycbcr图像色域内进行噪声消除和图像的清晰度增强的预处理;其中,在所述噪声消除的过程中,采用所述每个子带的尺度的大小梯度模型对图像边沿进行粗处理,以梯度均值作为其控制阀值;在进行图像增强处理中,将每个带中的12个子带在Ycbcr图像色空间中分别进行图像增强处理;
步骤(2)、特征点处理;
对步骤(1)中预处理后的每个带,计算每个带中的各子带的能量值,并将每个带中的所有子带的能量值进行累加处理得到每个带的能量值,然后将得到的4个带的能量值进行累加处理得到完整的在加博滤波器中小波域内的累加能量图;其中,所述累加能量图为不同维度图像的叠加图;然后在所述累加能量图中通过9cm×9cm大小的窗口选取大小尺度和旋转度的局部能量最大值的特征点,然后将小于所述局部能量最大值的特征点的能量值的65%的伪特征点去除;再通过一个具有局部特征的窗口进行筛选图像的局部能量最大值的特征点;
步骤(3)、图像的鲁棒快速准确匹配;
在步骤(2)的特征点处理后,提取上述步骤(2)中累加能量图中具有旋转与尺度变换不变性的鲁棒特征;然后对其中任意的两个带及其子带方向不同方向的亮度信息的所有特征点进行建立图像特征点的描述子,所述描述子是一个7×12维度的特征矩阵;将所述特征矩阵进行按行方向的快速傅立叶变换,同时在变换的过程中进行插值,通过插值可以得到48个维度的方向描述,然后在上述不同的4个带的频率域内对特征描述子进行归一化处理,得到特征描述子A,再对特征描述子A进行乘积处理,选取最大的值为可得到匹配的特征子;然后对匹配的特征子进行逆快速傅立叶变换得到原始的空间域的描述子;
步骤(4)、图像的匹配检索定位;
通过分类器对上述步骤(3)的匹配的特征子进行分类从而得到图片目标;其中,在进行匹配目标的分类之前,对每对7×12维度的特征矩阵中的特征对进行索引,形成匹配特征对的索引数据库;然后从索引数据库中抽取2000~3000组特征进行样本的训练,然后通过几何不变性的自由采样算法在所述索引数据库中对目标进行快速准确检索定位。
2.根据权利要求1所述的部分特征图像的多维度目标快速鲁棒检索定位方法,其特征在于:上述步骤(3)中:在对描述子的匹配过程之中,采用Manhattan距离的最近邻优先匹配算法对描述子进行匹配。
3.根据权利要求1所述的部分特征图像的多维度目标快速鲁棒检索定位方法,其特征在于:上述步骤(4)中:从索引数据库中抽取2400组特征进行样本的训练。
4.根据权利要求1所述的部分特征图像的多维度目标快速鲁棒检索定位方法,其特征在于:上述步骤(4)中:从索引数据库中抽取2600组特征进行样本的训练。
5.根据权利要求1所述的部分特征图像的多维度目标快速鲁棒检索定位方法,其特征在于:上述步骤(4)中:从索引数据库中抽取2800组特征进行样本的训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103700793A CN102508917B (zh) | 2011-11-21 | 2011-11-21 | 部分特征图像的多维度目标快速鲁棒检索定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011103700793A CN102508917B (zh) | 2011-11-21 | 2011-11-21 | 部分特征图像的多维度目标快速鲁棒检索定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102508917A CN102508917A (zh) | 2012-06-20 |
CN102508917B true CN102508917B (zh) | 2013-12-04 |
Family
ID=46221003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011103700793A Expired - Fee Related CN102508917B (zh) | 2011-11-21 | 2011-11-21 | 部分特征图像的多维度目标快速鲁棒检索定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102508917B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335524B (zh) * | 2015-11-27 | 2019-09-24 | 中国科学院自动化研究所 | 一种应用于大规模非规则结构数据的图搜索方法 |
CN107341829A (zh) * | 2017-06-27 | 2017-11-10 | 歌尔科技有限公司 | 虚拟现实交互部件的定位方法和装置 |
CN107248166B (zh) * | 2017-06-29 | 2020-05-15 | 武汉工程大学 | 动态环境下的目标状态预估方法 |
CN108520533B (zh) * | 2018-03-28 | 2021-08-03 | 武汉大学 | 一种面向工件定位的多维度特征配准方法 |
US11036682B2 (en) * | 2018-05-31 | 2021-06-15 | Oracle International Corporation | Flexible energy information aggregation |
CN109033308A (zh) * | 2018-07-16 | 2018-12-18 | 安徽江淮汽车集团股份有限公司 | 一种图像检索方法及装置 |
CN109584250B (zh) * | 2018-11-28 | 2022-09-20 | 哈工大机器人(合肥)国际创新研究院 | 一种鲁棒的视觉区域自动划分标注的方法 |
CN109948653B (zh) * | 2019-02-15 | 2023-08-25 | 广东智媒云图科技股份有限公司 | 一种图像相似度判断方法、电子设备及存储介质 |
CN110347861A (zh) * | 2019-07-12 | 2019-10-18 | 北京邮电大学 | 一种基于掩膜的累加显著特征的无监督图像检索系统 |
CN113378787B (zh) * | 2021-07-07 | 2022-05-24 | 山东建筑大学 | 一种基于多特征视觉的智能交通电子提示装置检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1581159A (zh) * | 2003-08-04 | 2005-02-16 | 中国科学院自动化研究所 | 商标检索方法 |
CN101916379A (zh) * | 2010-09-03 | 2010-12-15 | 华中科技大学 | 一种基于对象积累视觉注意机制的目标搜索和识别方法 |
JP2011039974A (ja) * | 2009-08-18 | 2011-02-24 | Kddi Corp | 画像検索方法およびシステム |
-
2011
- 2011-11-21 CN CN2011103700793A patent/CN102508917B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1581159A (zh) * | 2003-08-04 | 2005-02-16 | 中国科学院自动化研究所 | 商标检索方法 |
JP2011039974A (ja) * | 2009-08-18 | 2011-02-24 | Kddi Corp | 画像検索方法およびシステム |
CN101916379A (zh) * | 2010-09-03 | 2010-12-15 | 华中科技大学 | 一种基于对象积累视觉注意机制的目标搜索和识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102508917A (zh) | 2012-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102508917B (zh) | 部分特征图像的多维度目标快速鲁棒检索定位方法 | |
CN101996245B (zh) | 一种图形对象的形状特征描述与检索方法 | |
Davarzani et al. | Scale-and rotation-invariant texture description with improved local binary pattern features | |
Dickscheid et al. | Coding images with local features | |
CN109409384A (zh) | 基于细粒度图像的图像识别方法、装置、介质及设备 | |
Wang et al. | Recognition and localization of occluded apples using K-means clustering algorithm and convex hull theory: a comparison | |
Ahmed et al. | Deep image sensing and retrieval using suppression, scale spacing and division, interpolation and spatial color coordinates with bag of words for large and complex datasets | |
Varish | A modified similarity measurement for image retrieval scheme using fusion of color, texture and shape moments | |
CN114863189B (zh) | 一种基于大数据的图像智能识别方法 | |
Obulesu et al. | Content based image retrieval using multi motif co-occurrence matrix | |
Singh et al. | Performance analysis of various local and global shape descriptors for image retrieval | |
Ganapathi et al. | Graph based texture pattern classification | |
Aljahdali et al. | Classification of image database using SVM with Gabor Magnitude | |
Mosleh et al. | Texture image retrieval using contourlet transform | |
Zhong et al. | Copy-move forgery detection using adaptive keypoint filtering and iterative region merging | |
Janu et al. | Query-based image retrieval using SVM | |
Selvarajah et al. | Combined feature descriptor for content based image retrieval | |
Hameed et al. | An efficient multistage CBIR based on Squared Krawtchouk-Tchebichef polynomials | |
CN105844299A (zh) | 一种基于词袋模型的图像分类方法 | |
Winter et al. | Differential feature distribution maps for image segmentation and region queries in image databases | |
Boudani et al. | Content-Based Image Retrieval for Surface Defects of Hot Rolled Steel Strip Using Wavelet-Based LBP | |
Chitaliya et al. | Comparative analysis using fast discrete Curvelet transform via wrapping and discrete Contourlet transform for feature extraction and recognition | |
Devesh et al. | Retrieval of monuments images through ACO optimization approach | |
Gupta et al. | Comparative study of different low level feature extraction techniques for content based image retrieval | |
CN108460393B (zh) | 基于多分辨率Trace变换的图像不变特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
DD01 | Delivery of document by public notice |
Addressee: Hong Tao Document name: Notification that Application Deemed not to be Proposed |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
DD01 | Delivery of document by public notice |
Addressee: Hong Tao Document name: Notification to Pay the Fees |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131204 Termination date: 20141121 |
|
EXPY | Termination of patent right or utility model |