CN101996245A - 一种图形对象的形状特征描述与检索方法 - Google Patents
一种图形对象的形状特征描述与检索方法 Download PDFInfo
- Publication number
- CN101996245A CN101996245A CN201010536182.6A CN201010536182A CN101996245A CN 101996245 A CN101996245 A CN 101996245A CN 201010536182 A CN201010536182 A CN 201010536182A CN 101996245 A CN101996245 A CN 101996245A
- Authority
- CN
- China
- Prior art keywords
- mrow
- pixel
- msubsup
- msub
- graphic object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 239000013598 vector Substances 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000009466 transformation Effects 0.000 claims description 10
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 9
- 238000012512 characterization method Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 11
- 238000004422 calculation algorithm Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种图形对象的形状特征描述与检索方法,包括以下步骤:输入二值图像形式的待检索的图形对象P;对待检索的图形对象P进行形状特征抽取;基于图形对象的各层次表示的形状特征描述,计算待检索的图形对象P与系统实例库中待比对图形对象Q的相似度;从系统实例库中选择与待检索的图形对象P相似度最高的一个或一组实例作为检索结果输出。本发明所提出的形状特征描述综合了图形对象多层次的形状特征,具有较好的刻画与检索性能,在检索精度和算法复杂度上具有灵活可调的特点,可以适应较大范围对象类型的处理需要,并可有效处理图形检索中噪声、局部形变等干扰情况的影响。本发明可适用于各种涉及图形检索与识别处理的软件系统中。
Description
技术领域
本发明涉及一种计算机软件技术领域的图形对象处理方法,特别是应用于涉及图形数据的检索与识别处理的系统中的一种图形对象的形状特征描述与检索方法。
背景技术
图形是人们日常接触的视觉信息中的一个重要类型,被广泛用来传达文字不易表达的信息。图形的实例包括小到各种图形符号、文字、标记,大到地图、草图、工程图等各种类型。随着科学技术的发展,特别是计算和交互、显示技术的发展,图形被应用在越来越广泛的领域之中,与之同时也产生了大量的、不断增长的图形数据。为了使人们能高效、方便地使用图形数据及其中蕴含的信息,需要开发有效的算法和系统对其进行特征抽取、表示、变换、检索、识别等一系列相关处理或运算,针对这些方面的研究对图形数据的高效、智能、自动化地使用具有重要的意义和应用价值。其中,图形检索作为基于内容的图像与多媒体检索的一种具体形式,在研究领域和实际应用领域受到了普遍重视。
与一般的模式识别任务相类似,图形检索识别的核心技术之一是从图形数据中抽取、生成具有良好的刻画、区分能力和抗噪声、干扰能力的特征描述或表示。特征描述提取算法及其基础上的检索匹配算法的有效性对整体检索系统的可用性和可靠性具有至关重要的作用。对图形检索而言,特征提取主要完成从给定的图形对象中,通过变换获得用以表征其某方面特性的参数数据,而检索匹配算法则对不同图形对象的特征描述数据进行比较,获得任意两者之间相似性的度量,进一步选择与查询对象最相似的对象实例作为检索输出的结果。
对图形对象或数据而言,一个本质性的特性是对象的形状。现有针对图形形状的特征描述技术可分为基于边界和基于区域两类,前者针对图形对象的边界(即轮廓)表示进行建模,后者则对整个对象区域进行建模。比较起来,相对于对象的边界表示,对象的区域表示包含了更多对象内部像素的空间分布信息,因而对于噪声干扰具有更高的稳定性,同时也带来更高的计算复杂性。在建模方法上,现有技术又分为基于图形对象整体与组成部分之间的语法/语义结构关系、基于对象像素表示的统计特征两大类方法,前者如各种基于语法、属性关系图、邻接图等结构描述方法,主要思想是首先将图形对象表示为组成该对象的更小尺度上的图形元素或成员对象的集合,并进一步用元素或子对象存在与否和它们之间的相互关系作为图形对象的形状特征描述。后者主要包含像素空间坐标的各阶不变矩表示、基于傅立叶、小波等变换参数的方法等,主要思想是计算并统计图形对象的各像素点之间的某种形式的空间约束关系的数值或分布,并用这些统计参数作为图形对象的形状特征描述。基于结构关系的方法能较好适应对象的各种变换和反映对象组成的变化,但依赖于对对象成员的准确识别,影响了其在处理质量较差、退化较严重的图形数据时的可靠性。与之相反,基于统计特征的方法通常具有较好的抗干扰性能,但对对象内在结构的刻画能力相对不足。
中国发明专利ZL200610033615.X公开了一种基于图形轮廓的方向距离直方图的图形检索方法。在该专利中,首先计算不同方向上的轮廓像素与形状重心之间的距离直方图,进而检测直方图中的尖峰即局部极大值,由于其与图形轮廓上的尖峰存在对应关系,该专利将轮廓尖峰的数量和方向距离直方图作为图形的特征描述,并基于它实现图形对象的匹配与检索。该方法属于一种基于对象轮廓的统计特征的图形形状描述方法。
中国发明专利申请200710178822.9提出了一种基于图形傅立叶变换和径向基函数RBF神经网络的图形检索方法。该专利采用了相对简单的傅立叶变换参数作为图形的特征描述,依靠RBF神经网络的训练和学习来提高对图形对象的分类识别能力。中国发明专利申请200910214068.9提出了一种基于对象三维模型的图形检索方法。该专利要求预先建立所有模型对象的三维网格模型库,通过与二维查询图形的轮廓匹配,将基于二维表示的检索转化为三维网格模型的匹配问题,实现了一种支持多模态检索的技术方案。然而,对于常规的图形检索需求而言,三维模型的建立具有较高的难度和复杂度。
综合上述对图形特征描述方法的分类,依赖单一特征描述的检索或识别方法在体现出针对具体一类问题的有效性的同时,也存在一定的局限性,主要表现为相对于复杂、多变的图形对象,单一的特征表示或建模方法无法涵盖足够的刻画与区分信息,从而影响到基于这些特征建模方法的图形识别、检索系统在处理一般类型图形对象和应对噪声等干扰因素时的性能表现。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种图形对象的形状特征描述与检索方法。
为了解决上述技术问题,本发明公开了一种图形对象的形状特征描述与检索方法,包括以下步骤:
步骤一,输入二值图像形式的待检索的图形对象P,以例图、草图等形式提供给检索系统;
步骤二,对待检索的图形对象P进行形状特征抽取,包括:
步骤(21),计算待检索的图形对象P的各层次表示,对于一个输入的以像素集合形式表示的图形对象,其中包含轮廓、骨架和区域等多方面的形状信息。
步骤(22),抽取待检索的图形对象P的各层次表示的局部形状特征,计算其整体统计分布作为图形对象的形状特征描述;
步骤三,基于图形对象的各层次表示的形状特征描述,计算待检索的图形对象P与系统实例库中待比对图形对象Q的相似度;其中被检索的图形实例/模型库中所有图形对象的形状特征描述为预先计算,计算方法为上述步骤中的计算方法,并将其集中保存于对应的特征库中。
步骤四,从系统实例库中选择与待检索的图形对象P相似度最高的一个或一组实例作为检索结果输出。
本发明中,所述步骤(21)计算待检索的图形对象P的各层次表示包括以下步骤:
步骤(211),对待检索的图形对象P的像素集合进行距离变换,并将其中所有像素与距其最近的轮廓边界像素之间的距离值以最大距离值为比例统一缩放到距离值区间[0,1];
步骤(212),选择对象表示层次数L,将距离值区间[0,1]划分为L个子区间[0,D1][D1,D2]...[DL-1,DL=1];对每一个距离值Di(i=1..L),通过距离变换(Distance Transform)和距离值的切分,将所有距离值大于等于该距离值Di的像素组成一个像素子集合,称为第i层的对象区域表示Mi,所有{Mi}(i=1..L)构成对象的多层次区域表示,其中L是表示的层次数,取值范围为自然数,可根据所需处理精度加以指定,L数值越大精度越高。
步骤(213),对每一层对象区域表示Mi,计算每一层对象区域表示Mi的轮廓像素集合Ci和骨架像素集合Si,从而将图形对象P表示为多层次的轮廓和骨架像素集合{Ci,Si}以及对应的距离值{Di}(i=1..L),即获得图形对象P的各层次表示。对象的区域表示包含有大量的像素,其中多数对区分不同类型对象的作用相对较小。为减少数据量和计算复杂度,本发明进一步从对象的区域表示中抽取轮廓像素集合Ci和骨架像素集合Si作为对象的紧凑表示。
本发明中,所述步骤(22)包括以下步骤:
步骤(221),对每一层次表示的轮廓和骨架像素集合{Ci,Si}进行筛选和精简;本步处理的主要目的是以可调节的方式适当精简图形对象多层次表示中包含的像素点的数量,以降低后续特征提取处理的计算量。采用间隔采样的方式,在每一层次的像素集合中,从空间上连续的多个轮廓或骨架像素点中选取一个保留在表示中,而去除其余像素点。
步骤(222),从筛选和精简后的轮廓和骨架像素集合{Ci,Si}中抽取所有由3个像素组合构成的有序像素三元组{Pj,Pk,Pr}作为结构基元,其中像素Pj、像素Pk称为形状点,像素Pr称为参考点;一般情况下,选择轮廓像素作为形状点具有更高的形状表示精度和更大的计算复杂度,选择骨架像素作为形状点具有较小的计算复杂度且抗边界噪声性能较好。参考点的选择具有类似的结果。
步骤(223),计算每个结构基元对应的二维形状特征向量(LR,A),从而得到各层次表示的局部形状特征;特征参数LR和A对图形对象的平移、旋转、缩放变换具有不变性,本发明使用二者组成的二维形状特征向量(LR,A)作为局部形状特征,其中LR是结构基元{Pj,Pk,Pr}中从像素Pr到像素Pj的向量<PrPj>和从像素Pr到像素Pk的向量<PrPk>之间的长度比:LR=min(|<PrPj>|/|<PrPk>|,|<PrPk>|/|<PrPj>|),||代表求向量的长度,min()代表两者取小,A是向量<PrPj>与<PrPk>之间的夹角度数。
步骤(224),使用直方图统计各层对象表示中的所有二维形状特征向量(LR,A)的取值分布,并对所得分布基于参考点进行第二次直方图统计,结果表示为三维形状特征直方图矩阵{ISHi(m,n,v)},其中i代表第i层,m代表长度比特征LR的第m个取值,n代表夹角特征A的第n个取值,v代表第二次直方图统计的第v个取值,计算对应的二维权值参数矩阵{WSi(m,n)},并和各层表示的距离值{Di}一起构成图形对象的形状特征描述。权值参数用来区分不同细节精度上和从不同位置结构基元抽取的形状特征在对象相似度比较中的相对重要性。
本发明步骤(222)中,作为结构基元的像素Pj和像素Pk以及像素Pr要符合以下四个条件中的任意一种:
(A)像素Pj和像素Pk以及像素Pr由轮廓像素集合Ci中的任意三个像素组成;
(B)像素Pj和像素Pk以及像素Pr由骨架像素集合Si中的任意三个像素组成;
(C)像素Pj和像素Pk由轮廓像素集合Ci中的任意两个像素构成,像素Pr为骨架像素集合Si中的任意一个像素;
(D)像素Pj和像素Pk由骨架像素集合Si中的任意两个像素构成,像素Pr为轮廓像素集合Ci中的任意一个像素。
本发明步骤(224)中,三维形状特征直方图矩阵{ISHi(m,n,v)}的计算方法是:
针对第i层中的每一参考像素点所对应的所有结构基元子集合,计算并统计其形状特征向量(LR,A)的取值分布,表示为一个二维特征直方图矩阵H(m,n),其中m∈[1,M],n∈[1,N],M为长度比特征LR的直方图取值格数,N为夹角特征A的直方图取值格数;
将所有像素参考点对应的二维特征直方图矩阵H(m,n)沿第三维堆叠起来构成三维基本形状特征分布矩阵SH(m,n,r),r代表第r个像素参考点;
对三维基本形状特征分布矩阵SH(m,n,r)沿第三维进行第二次直方图统计,从而得到{ISHi(m,n,v)},其中v∈[1,V],v代表该第二次直方图统计的第v个取值,V为取值格数。
本发明步骤(224)中,当作为结构基元的像素Pj和像素Pk以及像素Pr符合条件(B)或者条件(C)时,权值参数{WSi(m,n)}按如下公式从所有骨架像素的距离值{DSi(r)}及其三维基本形状特征分布矩阵{SHi(m,n,r)}中计算得到:
其中,i代表第i层表示,r代表第i层骨架像素集合Si中的第r个骨架像素,r∈[1,NSi],NSi是Si中的骨架像素个数;骨架像素的距离值{DSi(r)}从对第i层对象区域表示Mi进行距离变换的结果中获得;当作为结构基元的像素Pj和像素Pk以及像素Pr符合条件(A)或者条件(D)时,权值参数{WSi(m,n)}设置为1.0。
本发明步骤三中,包括以下步骤:
计算待检索图形对象P和待比对图形对象Q的各层次表示的形状特征描述,分别记为{ISHP i(m,n,v),DP i,WSP i(m,n)}和{ISHQ i(m,n,v),DQi,WSQ i(m,n)},i=1..L;
计算待检索图形对象P和待比对图形对象Q在每一层表示上的差异度SDi(P,Q),i代表第i层;
计算待检索图形对象P和待比对图形对象Q的整体差异度SD(P,Q);
待检索图形对象P和待比对图形对象Q的整体差异度数值越大,两者的相似性越小。
本发明步骤三中,待检索图形对象P和待比对图形对象Q在每一层表示上的差异度SDi(P,Q)的计算公式为:
其中,{ISHP i(m,n,v),DP i,WSP i(m,n)}和{ISHQ i(m,n,v),DQ i,WSQ i(m,n)}分别是待检索图形对象P和待比对图形对象Q的第i层表示的形状特征描述。
本发明步骤三中,待检索图形对象P和待比对图形对象Q的整体差异度SD(P,Q)的另一种计算方法为:其中使用每层表示对应的距离值Di对该层的差异度进行加权。
有益效果:本发明具有以下优点:(1)本发明提出的形状特征描述综合了图形的区域与轮廓、结构与统计等多方面的特征,具有较好的刻画与分类性能。(2)通过在本发明的方法框架中选择合适的对象表示形式、结构基元组成和相似度计算准则,本发明能够适应较大范围对象类型的处理需要,同时可有效处理噪声、局部形变等干扰情况。(3)本发明在特征描述和检索精度、算法与数据复杂度等多方面具有灵活可调的特点,有利于在其基础上实现或集成新的特征描述类型并在针对图形数据的不同应用中加以使用。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明图形对象检索方法结构图。
图2为本发明图形对象表示与特征抽取方法流程图。
图3为本发明图形对象多层次表示流程图。
图4为本发明图形对象形状特征抽取流程图。
图5为图形对象的多层次表示示例图。
图6a、图6b、图6c以及图6d为结构基元与形状特征示例图。
图7为图形对象检索示例图。
具体实施方式:
本发明从图形对象的轮廓和骨架多方面表示形式中抽取结构和统计特征信息,构造一种复合的、与现有方法相比具有更广适应性和刻画能力的图形形状特征描述方法,并在此基础上提出与之相适应的检索匹配方法。
如图1所示,其中是本发明图形对象检索方法的总体实施流程图。结合图7中给出的一个具体的检索实例,具体包括以下处理步骤:
初始时:系统对将被检索的图形实例/模型库(如图7中间所示)中包含的所有图形对象进行批量地形状特征描述抽取(所用方法同下面的步骤2),并将得到的对应于每个对象的形状特征描述保存于图形实例/模型特征库中。
步骤1,用户通过例图、草图等查询方式将检索要求输入到检索系统中。其中,检索要求是二值图像形式的图形对象,例图方式指用户从已有的样本图形(例如来自互联网)中指定一个要求查询,草图方式指用户使用绘制软件工具画出一个对象的草图要求查询。这里,假设检索要求是如图7左边的树形对象。
步骤2对输入图形对象进行形状特征描述的抽取。具体又分为如图2所示的2个步骤:
步骤21,从输入的图形对象生成反映其不同细节程度的多层次表示,其中包括对象轮廓和骨架两方面的形状信息,输出结果如图5所示。该步骤进一步细分为如图3所示的几个步骤:
步骤211,对图形对象的像素集合进行距离变换(Distance Transform),获得该对象所包含的每个像素与距其最近的轮廓边界像素之间的距离值。假设最大的距离值为Dmax,将所有距离值以Dmax为比例统一缩放到距离值区间[0,1]。
步骤212,按照预先指定的表示层次数L,L一般可取[5,30]中的自然数,将[0,1]距离值区间划分为L个子区间[0,D1][D1,D2]...[DL-1,DL=1],划分可以是均匀的也可以是不均匀的(例如,在较小距离值的范围内采用较小的划分区间,可以在表示中包含更多对象边界轮廓信息)。接下来,对每一个Di(i=1..L),将所有距离值大于等于Di的对象像素组成一个像素子集合,称为第i层的对象区域表示Mi,所有{Mi}(i=1..L)构成了对象的多层次区域表示,每个区域可看作一个子对象。图5的第1行给出了采用L=5层表示时的对象区域示例。
步骤213,对每一层次的对象区域表示Mi,使用图像轮廓跟踪方法(参考中国专利CN1187092或其它公开图像轮廓跟踪方法)获得Mi的轮廓像素集合Ci,同时使用图像细化方法(参考中国专利CN101266644或其它公开图像细化方法)获得Mi的骨架像素集合Si。图5的第2、3行分别给出了不同层次的对象轮廓和骨架表示示例。
经过上述步骤,输入的图形对象被变换表示为多层次的轮廓和骨架像素集合{Ci,Si}(i=1..L)以及每层次表示对应的距离值{Di}(i=1..L)。
步骤22,对每一层次的对象表示,抽取其统计形式表示的形状特征描述。该步骤进一步细分为如图4所示的几个步骤:
步骤221,对每一层次表示的轮廓和骨架像素集合{Ci,Si}进行精简和筛选,以降低后续特征提取处理的计算量。可采用间隔采样的方式,即从空间上连续的每T个轮廓像素点或骨架像素点中选取一个保留在表示中作为保留点,而去除其余像素点。保留点的选取采用均匀选取、选取拟合线段顶点(参考中国专利CN1189056)和选取曲率最大点(参考中国专利CN1131875)方式中的任意一种。T的大小可视精度要求调整,T的值越大则精简后的像素点数越少,同时越多形状细节信息被丢弃,不同层次的表示可选择不同的T值。在图7的检索示例中采用T=2时的均匀选取方法。
步骤222,从精简后的轮廓和骨架像素集合{Ci,Si}中抽取反映对象局部形状的结构基元。本发明使用特定像素集合中由任意3个像素组合构成的有序像素三元组{Pj,Pk,Pr}作为一个结构基元,其中前两个像素成员Pj和Pk称为形状点,第三个像素成员Pr称为参考点。如图6a、图6b、图6c以及图6d所示,基于轮廓和骨架像素集合{Ci,Si},存在四种类型的结构基元:(A)形状点Pj和Pk以及参考点Pr由轮廓像素集合Ci中的任意三个像素组成,如图6a;(B)形状点Pj和Pk以及参考点Pr由骨架像素集合Si中的任意三个像素组成,如图6b;(C)形状点Pj和Pk由轮廓像素集合Ci中的任意两个像素构成,参考点Pr是来自骨架像素集合Si中的任意一个像素,如图6c;(D)形状点Pj和Pk由骨架像素集合Si中的任意两个像素构成,参考点Pr是来自轮廓像素集合Ci中的任意一个像素,如图6d。可从中选择一种或一组作为结构基元。在图7的检索示例中采用(A)类型的结构基元。
步骤223,从每个结构基元中抽取局部形状特征。对每个结构基元{Pj,Pk,Pr},如图6所示,将其中像素组成从Pr到Pj的向量<PrPj>和从Pr到Pk的向量<PrPk>。计算两个向量之间的长度比特征参数LR=min(|<PrPj>|/|<PrPk>|,|<PrPk>|/|<PrPj>|),||代表求向量的长度,min()代表两者取小,以及两个向量<PrPj>与<PrPk>之间的夹角特征参数A。将LR和A特征参数组成二维形状特征向量(LR,A)作为局部形状特征。
步骤224,计算每层对象轮廓和骨架像素集合{Ci,Si}中的形状特征向量(LR,A)的所有取值的统计分布,构造对象的形状特征描述。
首先,按照所采用的结构基元类型,对{Ci,Si}中每一参考像素点,将所有形状像素点两两组合构成的结构基元所对应的形状特征向量(LR,A)取值使用直方图统计其分布,得到一个二维特征直方图矩阵H(m,n),m∈[1,M],n∈[1,N],m代表长度比特征LR的第m个取值,n代表夹角特征A的第n个取值,M和N分别是特征LR和A的直方图取值格数。在图7的检索示例中M设置为100,N设置为90。
然后,将所有参考像素点对应的H(m,n)沿三维基本形状特征分布矩阵SH(m,n,r)的第三维堆叠起来(r代表第r个参考像素),并进一步在SH(m,n,r)的第三维上针对其取值进行第二次直方图统计以去除参考像素点顺序的相关性,所得三维形状特征直方图矩阵记为ISH(m,n,v),v∈[1,V],v代表第二次直方图统计的第v个取值,V为直方图取值格数。在图7的检索示例中V设置为100。
三维形状特征直方图矩阵ISH(m,n,v)被用作图形对象对应于第i层表示的形状特征描述。所有L层表示的{ISHi(m,n,v)}和各层表示对应的距离值{Di}(i=1..L)构成了图形对象的形状特征描述。
对象形状特征描述中还包含对应于每层表示的权值参数{WSi(m,n)},i、m、n的含义与取值与{ISHi(m,n,v)}中的相同。当作为结构基元的像素Pj和像素Pk以及像素Pr符合条件(B)或者条件(C)时,权值参数{WSi(m,n)}按如下公式从所有骨架像素的距离值{DSi(r)}及其三维基本形状特征分布矩阵{SHi(m,n,r)}中计算得到:
其中,i代表第i层表示,r∈[1,NSi]代表第i层骨架像素集合Si中的第r个骨架像素,NSi是Si中的骨架像素个数。骨架像素的距离值{DSi(r)}从对第i层对象区域表示Mi进行距离变换的结果中获得。当作为结构基元的像素Pj和像素Pk以及像素Pr符合条件(A)或者条件(D)时,权值参数{WSi(m,n)}设置为1.0。
步骤3,基于前步计算获得的查询图形对象的形状特征描述,计算其与保存在特征库中的各个图形实例/模型间的相似度,选择与查询对象相似度最高的实例/模型作为检索的结果。
对查询图形对象P和库中某一实例/模型Q,相似度计算又分为如下几个具体步骤:
第一步,分别计算待检索图形对象P和待比对图形对象Q的形状特征描述,分别记为{ISHP i(m,n,v),DP i,WSP i(m,n)}和{ISHQ i(m,n,v),DQi,WSQ i(m,n)},i=1..L;
第二步,分别计算待检索图形对象P和待比对图形对象Q在每一层表示(假设第i层)上的差异度SDi(P,Q),按以下公式计算:
第三步,计算对象P和Q整体的差异度,可选择下面两个公式之一进行计算,其中后者使用每层表示对应的距离值对该层的差异度进行加权:
或者,
最后,选择库中所有的Q中具有最小差异度SD(P,Q)(即最大相似度)的实例/模型作为针对查询对象P的检索结果。在图7所示的检索示例中,左侧的树形查询对象与系统实例库中各对象(以先上而下再自左向右顺序)的归一化差异度分别为:0.571,0.226,1.00,0.196,0.291,0.546,0.169,0.107,0.147,0.257,0.507,0.228,0.152,0.223,0.206,其中与查询对象最相似的是两个树形对象实例(差异度分别为0.107和0.147)。
步骤4以图示或列表的形式向用户输出检索结果,并允许用户选择以相似度或其他准则对检索结果进行排序。如图7最右边显示了按照差异度由小到大(即相似度由大到小)顺序排列的前5个检索结果。
本发明通过结合图形对象的结构和统计特征,在具有良好的抗噪声和局部形变能力的同时,可方便、灵活地通过选择参数和子算法组成以获得所需要的算法性能和复杂度,易于在针对图形数据的检索与识别软件系统中加以实现与应用。
本发明提供了一种图形对象的形状特征描述与检索方法的思路及方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (10)
1.一种图形对象的形状特征描述与检索方法,其特征在于,包括以下步骤:
步骤一,输入二值图像形式的待检索的图形对象P;
步骤二,对待检索的图形对象P进行形状特征抽取,包括:
步骤(21),计算待检索的图形对象P的各层次表示;
步骤(22),抽取待检索的图形对象P的各层次表示的局部形状特征,计算其整体统计分布作为图形对象的形状特征描述;
步骤三,基于图形对象的各层次表示的形状特征描述,计算待检索的图形对象P与系统实例库中待比对图形对象Q的相似度;
步骤四,从系统实例库中选择与待检索的图形对象P相似度最高的一个或一组实例作为检索结果输出。
2.根据权利要求1所述的一种图形对象的形状特征描述与检索方法,其特征在于,所述步骤(21),计算待检索的图形对象P的各层次表示包括以下步骤:
步骤(211),对待检索的图形对象P的像素集合进行距离变换,并将其中所有像素与距其最近的轮廓边界像素之间的距离值以最大距离值为比例统一缩放到距离值区间[0,1];
步骤(212),选择对象表示层次数L,将距离值区间[0,1]划分为L个子区间[0,D1][D1,D2]...[DL-1,DL=1];对每一个距离值Di(i=1..L),将所有距离值大于等于该距离值Di的像素组成一个像素子集合,称为第i层的对象区域表示Mi,所有{Mi}(i=1..L)构成对象的多层次区域表示;
步骤(213),对每一层对象区域表示Mi,计算每一层对象区域表示Mi的轮廓像素集合Ci和骨架像素集合Si,从而将图形对象P表示为多层次的轮廓和骨架像素集合{Ci,Si}以及对应的距离值{Di}(i=1..L),即获得图形对象P的各层次表示。
3.根据权利要求1所述的一种图形对象的形状特征描述与检索方法,其特征在于,所述步骤(22)包括以下步骤:
步骤(221),对每一层次表示的轮廓和骨架像素集合{Ci,Si}进行筛选和精简;
步骤(222),从筛选和精简后的轮廓和骨架像素集合{Ci,Si}中抽取所有由3个像素组合构成的有序像素三元组{Pj,Pk,Pr}作为结构基元,其中像素Pj、像素Pk称为形状点,像素Pr称为参考点;
步骤(223),计算每个结构基元对应的二维形状特征向量(LR,A),从而得到各层次表示的局部形状特征;其中LR是结构基元{Pj,Pk,Pr}中从像素Pr到像素Pj的向量<PrPj>和从像素Pr到像素Pk的向量<PrPk>之间的长度比:LR=min(|<PrPj>|/|<PrPk>|,|<PrPk>|/|<PrPj>|),||代表求向量的长度,min()代表两者取小,A是向量<PrPj>与<PrPk>之间的夹角度数;
步骤(224),使用直方图统计各层对象表示中的所有二维形状特征向量(LR,A)的取值分布,并对所得分布基于参考点进行第二次直方图统计,结果表示为三维形状特征直方图矩阵{ISHi(m,n,v)},其中i代表第i层,m代表长度比特征LR的第m个取值,n代表夹角特征A的第n个取值,v代表第二次直方图统计的第v个取值,计算对应的二维权值参数矩阵{WSi(m,n)},并和各层表示的距离值{Di}一起构成图形对象的形状特征描述。
4.根据权利要求3所述的一种图形对象的形状特征描述与检索方法,其特征在于,步骤(222)中,作为结构基元的像素Pj和像素Pk以及像素Pr要符合以下四个条件中的任意一种:
(A)像素Pj和像素Pk以及像素Pr由轮廓像素集合Ci中的任意三个像素组成;
(B)像素Pj和像素Pk以及像素Pr由骨架像素集合Si中的任意三个像素组成;
(C)像素Pj和像素Pk由轮廓像素集合Ci中的任意两个像素构成,像素Pr为骨架像素集合Si中的任意一个像素;
(D)像素Pj和像素Pk由骨架像素集合Si中的任意两个像素构成,像素Pr为轮廓像素集合Ci中的任意一个像素。
5.根据权利要求4所述的一种图形对象的形状特征描述与检索方法,其特征在于,步骤(224)中,三维形状特征直方图矩阵{ISHi(m,n,v)}的计算方法是:
针对第i层中的每一参考像素点所对应的所有结构基元子集合,计算并统计其形状特征向量(LR,A)的取值分布,表示为一个二维特征直方图矩阵H(m,n),其中m∈[1,M],n∈[1,N],M为长度比特征LR的直方图取值格数,N为夹角特征A的直方图取值格数;
将所有像素参考点对应的二维特征直方图矩阵H(m,n)沿第三维堆叠起来构成三维基本形状特征分布矩阵SH(m,n,r),r代表第r个像素参考点;
对三维基本形状特征分布矩阵SH(m,n,r)沿第三维进行第二次直方图统计,从而得到{ISHi(m,n,v)},其中v∈[1,V],v代表该第二次直方图统计的第v个取值,V为取值格数。
6.根据权利要求5所述的一种图形对象的形状特征描述与检索方法,其特征在于,步骤(224)中,当作为结构基元的像素Pj和像素Pk以及像素Pr符合条件(B)或者条件(C)时,权值参数{WSi(m,n)}按如下公式从所有骨架像素的距离值{DSi(r)}及其三维基本形状特征分布矩阵{SHi(m,n,r)}中计算得到:
其中,i代表第i层,r代表第i层骨架像素集合Si中的第r个骨架像素,r∈[1,NSi],NSi是Si中的骨架像素个数;骨架像素的距离值{DSi(r)}从对第i层对象区域表示Mi进行距离变换的结果中获得;当作为结构基元的像素Pj和像素Pk以及像素Pr符合条件(A)或者条件(D)时,权值参数{WSi(m,n)}设置为1.0。
7.根据权利要求6所述的一种图形对象的形状特征描述与检索方法,其特征在于,步骤三中,包括以下步骤:
计算待检索图形对象P和待比对图形对象Q的各层次表示的形状特征描述,分别记为{ISHP i(m,n,v),DP i,WSP i(m,n)}和{ISHQ i(m,n,v),DQ i,WSQ i(m,n)},i=1..L;
计算待检索图形对象P和待比对图形对象Q在每一层表示上的差异度SDi(P,Q),i代表第i层;
计算待检索图形对象P和待比对图形对象Q的整体差异度SD(P,Q);
待检索图形对象P和待比对图形对象Q的整体差异度数值越大,两者的相似性越小。
8.根据权利要求7所述的一种图形对象的形状特征描述与检索方法,其特征在于,步骤三中,待检索图形对象P和待比对图形对象Q在每一层表示上的差异度SDi(P,Q)的计算公式为:
其中,{ISHP i(m,n,v),DP i,WSP i(m,n)}和{ISHQ i(m,n,v),DQ i,WSQ i(m,n)}分别是待检索图形对象P和待比对图形对象Q的第i层表示的形状特征描述。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105361826A CN101996245B (zh) | 2010-11-09 | 2010-11-09 | 一种图形对象的形状特征描述与检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105361826A CN101996245B (zh) | 2010-11-09 | 2010-11-09 | 一种图形对象的形状特征描述与检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101996245A true CN101996245A (zh) | 2011-03-30 |
CN101996245B CN101996245B (zh) | 2012-08-15 |
Family
ID=43786399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105361826A Expired - Fee Related CN101996245B (zh) | 2010-11-09 | 2010-11-09 | 一种图形对象的形状特征描述与检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101996245B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402575A (zh) * | 2011-09-14 | 2012-04-04 | 北京理工大学 | 一种基于形状的海量图像数据快速检索方法 |
CN103489212A (zh) * | 2013-09-16 | 2014-01-01 | 浙江工商大学 | 基于用户启发的二维形状对应方法 |
CN104272324A (zh) * | 2012-05-22 | 2015-01-07 | 汤姆逊许可公司 | 用于产生模型的形状描述符的方法和装置 |
CN105574535A (zh) * | 2015-12-19 | 2016-05-11 | 华北电力大学(保定) | 基于间接距离角直方图空间关系表示模型的图形符号识别方法 |
CN105956005A (zh) * | 2016-04-20 | 2016-09-21 | 曹屹 | 一种数据处理方法和设备 |
CN106951906A (zh) * | 2017-03-22 | 2017-07-14 | 重庆市公安局刑事警察总队 | 鞋底花纹多维度分类与识别的综合分析方法 |
CN107316053A (zh) * | 2017-05-25 | 2017-11-03 | 华东理工大学 | 一种布料图像快速匹配检索方法 |
CN108364000A (zh) * | 2018-03-26 | 2018-08-03 | 南京大学 | 一种基于神经网络人脸特征提取的相似度获得方法 |
WO2019213857A1 (en) * | 2018-05-09 | 2019-11-14 | Hewlett-Packard Development Company, L.P. | 3-dimensional model identification |
CN111192271A (zh) * | 2018-11-14 | 2020-05-22 | 银河水滴科技(北京)有限公司 | 一种图像分割方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1881211A (zh) * | 2006-02-10 | 2006-12-20 | 华为技术有限公司 | 图形检索的方法 |
-
2010
- 2010-11-09 CN CN2010105361826A patent/CN101996245B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1881211A (zh) * | 2006-02-10 | 2006-12-20 | 华为技术有限公司 | 图形检索的方法 |
Non-Patent Citations (2)
Title |
---|
《徐州师范大学学报(自然科学版)》 20091231 焦丽莉等 一种新的基于形状特征的图像检索方法 全文 1-10 第27卷, 第4期 * |
《河南科技学院学报(自然科学版)》 20100331 郭晓娟等 基于形状特征的图像检索方法的研究与实现 全文 1-10 第38卷, 第1期 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402575A (zh) * | 2011-09-14 | 2012-04-04 | 北京理工大学 | 一种基于形状的海量图像数据快速检索方法 |
CN104272324A (zh) * | 2012-05-22 | 2015-01-07 | 汤姆逊许可公司 | 用于产生模型的形状描述符的方法和装置 |
CN103489212A (zh) * | 2013-09-16 | 2014-01-01 | 浙江工商大学 | 基于用户启发的二维形状对应方法 |
CN103489212B (zh) * | 2013-09-16 | 2016-09-28 | 浙江工商大学 | 基于用户启发的二维形状对应方法 |
CN105574535B (zh) * | 2015-12-19 | 2019-06-25 | 华北电力大学(保定) | 基于间接距离角直方图空间关系模型的图形符号识别方法 |
CN105574535A (zh) * | 2015-12-19 | 2016-05-11 | 华北电力大学(保定) | 基于间接距离角直方图空间关系表示模型的图形符号识别方法 |
CN105956005A (zh) * | 2016-04-20 | 2016-09-21 | 曹屹 | 一种数据处理方法和设备 |
CN105956005B (zh) * | 2016-04-20 | 2019-06-07 | 曹屹 | 一种数据处理方法和设备 |
CN106951906A (zh) * | 2017-03-22 | 2017-07-14 | 重庆市公安局刑事警察总队 | 鞋底花纹多维度分类与识别的综合分析方法 |
CN107316053A (zh) * | 2017-05-25 | 2017-11-03 | 华东理工大学 | 一种布料图像快速匹配检索方法 |
CN108364000A (zh) * | 2018-03-26 | 2018-08-03 | 南京大学 | 一种基于神经网络人脸特征提取的相似度获得方法 |
CN108364000B (zh) * | 2018-03-26 | 2019-08-23 | 南京大学 | 一种基于神经网络人脸特征提取的相似度获得方法 |
WO2019213857A1 (en) * | 2018-05-09 | 2019-11-14 | Hewlett-Packard Development Company, L.P. | 3-dimensional model identification |
US20210117648A1 (en) * | 2018-05-09 | 2021-04-22 | Hewlett-Packard Development Company, L.P. | 3-dimensional model identification |
CN111192271A (zh) * | 2018-11-14 | 2020-05-22 | 银河水滴科技(北京)有限公司 | 一种图像分割方法及装置 |
CN111192271B (zh) * | 2018-11-14 | 2023-08-22 | 银河水滴科技(北京)有限公司 | 一种图像分割方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101996245B (zh) | 2012-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101996245B (zh) | 一种图形对象的形状特征描述与检索方法 | |
Ali et al. | Image retrieval by addition of spatial information based on histograms of triangular regions | |
Li et al. | Multi-scale neighborhood feature extraction and aggregation for point cloud segmentation | |
CN108595636A (zh) | 基于深度跨模态相关性学习的手绘草图的图像检索方法 | |
CN102508917B (zh) | 部分特征图像的多维度目标快速鲁棒检索定位方法 | |
Hor et al. | Image retrieval approach based on local texture information derived from predefined patterns and spatial domain information | |
Seidl et al. | Automated classification of petroglyphs | |
Kpalma et al. | An overview of advances of pattern recognition systems in computer vision | |
Mishra et al. | Medical image retrieval using self-organising map on texture features | |
Bengamra et al. | A comprehensive survey on object detection in Visual Art: taxonomy and challenge | |
Prasomphan | Toward Fine-grained Image Retrieval with Adaptive Deep Learning for Cultural Heritage Image. | |
Gao et al. | Spatial-structure Siamese network for plant identification | |
Shanmugavadivu et al. | FOSIR: fuzzy-object-shape for image retrieval applications | |
Adnan et al. | Automated image annotation with novel features based on deep ResNet50-SLT | |
Wu et al. | Deep texture exemplar extraction based on trimmed T-CNN | |
Visalatchi et al. | Intelligent Vision with TensorFlow using Neural Network Algorithms | |
Liu et al. | 3D point cloud of single tree branches and leaves semantic segmentation based on modified PointNet network | |
CN111339332A (zh) | 一种基于树形结构拓扑图的三维体数据检索方法 | |
Sharath Kumar et al. | KD-tree approach in sketch based image retrieval | |
Devesh et al. | Retrieval of monuments images through ACO optimization approach | |
Mumtaz et al. | A novel texture image retrieval system based on dual tree complex wavelet transform and support vector machines | |
MAHURKAR et al. | Novel Outline Tracing Techniques for Leaf Species Identification from Shrouded Leaves | |
Mhamdi et al. | A local approach for 3D object recognition through a set of size functions | |
Shelare et al. | StrideNET: Swin Transformer for Terrain Recognition with Dynamic Roughness Extraction | |
Kekre et al. | Performance comparison of image classifier using discrete cosine transform and walsh transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120815 Termination date: 20141109 |
|
EXPY | Termination of patent right or utility model |