CN101223539A - 用于自动形状分类的方法 - Google Patents

用于自动形状分类的方法 Download PDF

Info

Publication number
CN101223539A
CN101223539A CNA2005800401970A CN200580040197A CN101223539A CN 101223539 A CN101223539 A CN 101223539A CN A2005800401970 A CNA2005800401970 A CN A2005800401970A CN 200580040197 A CN200580040197 A CN 200580040197A CN 101223539 A CN101223539 A CN 101223539A
Authority
CN
China
Prior art keywords
shape
average
group
similar
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800401970A
Other languages
English (en)
Inventor
H·罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of CN101223539A publication Critical patent/CN101223539A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

一种对2D形状进行分类的方法,包括:为所研究的形状创建具有相似形状组和相异形状组的训练数据集;从相似形状组中计算平均形状;将数据库中的所有形状对准平均形状;基于它们的距离将形状分类至两个分组中。

Description

用于自动形状分类的方法
技术领域
本发明通常涉及形状分析技术,尤其涉及对图像中的2 D形状进行自动分类的技术。
背景技术
不考虑其位置、尺寸和方向的二维(2D)形状的分类在计算机视觉和图案识别中是重要的问题。其应用正扩展至许多领域,诸如血细胞、癌和染色体的分类、工业检查、目标识别、医学图像识别、景象分析以及生物系统建模。通常,形状分类是通过分析形状的边界信息来比较和识别形状的过程。这对人类看起来是一项容易的任务,但是对于计算机却相当困难,尤其在对象被缩放、旋转和/或平移以后。因此,为了一般对象分类、识别或者检索目的的形状研究是当前研究的活跃领域。
近来的一些文献已经着手处理该论题,并且已经应用了各种图像处理方法。这些方法基本上可以划分为两种技术。
第一种技术需要投影形状实例至公共空间,然后在投影空间上执行分类。例如:傅立叶描述符(E.Persoon等人的″使用傅立叶描述符的形状鉴别(shape discrimination using Fourierdescriptors)″IEEE Trans.Syst.Man.Cybern,vol.7,p170-179,1977)、不变矩(F.Zakaria等人的″矩不变量的快速计算算法(Fast algorithm for computation of moment invariants″),图像识别(Pattern Recognition),vol.20,p639-643,1987)、自回归模型(S.R.Dubois等人的″二维形状分类的自回归模型方法(Anautoregressive model approach to two-dimensional shapeclassification)″,IEEE Trans.Pattern Analysis and MachineIntelligence,vol.8 p55-66,1986)和主成分分析(美国专利号No.2002/0164060A1,标题为“表征医学图像形状的方法”(METHOD FORCHARACTERISING SHAPES IN MEDICAL IMAGES))。
这些基于投影的方法的优点在于它们与平移和旋转无关。然而,缺点在于,由于投影变换不是一一对应的因此它们显示出固有的信息丢失。即,投影空间中的一个点可以对应于视觉外观非常不同的几种形状。因此,基于这种技术的形状分类可能会得出错误结果。
第二种技术包括:沿着形状边界定位一组界标点;规定相应界标之间的距离度量;和执行基于距离的分组。这样,形状分类就简化为已经提出许多解决方案的一般的分组问题。例如:M.Duta等人提出了一种使用平均对准误差(MAE)作为距离来度量形状差别并基于MAE对形状进行分类的方法(M.Duta等人″2D形状模型的自动构建(Automatic Construction of 2D Shape Models)″,IEEE Trans.on Pattern Analysis and Machine Intelligence,vol 23,no.5,p433-446,2001)。标题为“用于自动形状表征的方法和设备”(METHODAND APPARATUS FOR AUTOMATIC SHAPE CHARACTERIZATION)的美国专利No.6,611,630和标题为“用于图象配准的方法和设备”(METHODAND APPARATUS FOR IMAGE REGISTRATION)的美国专利No.6,009,212提出了一种基于与特征人群的平均形状的最佳匹配概率对形状进行分类的方法。该技术的局限性在于,在实践中由于个体中的噪声和偏差使得形状界标之间的成对对应难以实现。
由于现有技术的缺陷和局限性,因此需要一种方法以找到简单、有效且高度准确的形状分类方法。
发明内容
本发明的目标是提供一种用于2D形状分类的自动方法。
根据本发明的一个方面,通过提供一种用于分类2D形状的自动方法来实现该目标。所述方法包括若干步骤。为所研究的形状创建训练数据集。所述训练数据集包括两个数据组:相似形状组和相异形状组。产生训练数据集中每个形状的多边形近似,从相似形状组中计算平均形状。将数据库中形状对准所述平均形状,并输出它们的相似性距离。得到相似性距离的分布,并基于它们的距离将所述形状分类成两个分组(cluster)。
本发明具有一些优势。例如,所述方法通过平均形状和与相似性距离相关的阈值表征研究的形状。所述形状分类是有效的,这是因为其计算复杂度被控制在0(mnlog(mn))以下,其中m是平均形状上的界标数目,n是形状实例上的界标数目。由于在形状对准期间不需要界标的成对对应,并且甚至界标的数目可以不同,因此该形状分类是鲁棒的。另外,由于可以在形状对准之后提供形状实例相对于平均形状的旋转角度,因此方向校正变得更加容易。
附图说明
从下面附图所示的本发明实施例的更加具体的描述中,本发明的前述和其它目标、特征和优点将显而易见。附图的元素并不一定相对于彼此成比例。
图1A和1B示出了形状分类的自动方法的流程图;
图2A至2U示出了从池(cistern)形状训练数据库中提取的示例形状的示意图。图2A至2K描述了属于相似形状组的形状,图2L至2U描述了来自相异形状组的形状;
图3A和图3B示出了形状边界的多边形近似的图解视图。图3A描述了通过等角采样产生的多边形近似。图3B示出了通过填入许多等距离点产生的多边形近似;
图4A至4F示出了通过使用转折函数(turning function)的形状对准的图解视图。图4A和图4B示出了模板形状的转折函数。图4C和4D示出了形状实例的转折函数。图4E和4F示出了这两个形状的对准结果以及它们的最佳匹配转折函数。
图5示出了从相似形状组中计算平均形状的方法的流程图;
图6A至6C示出了从被对准的转折函数的每段中得到平均值点的方法。图6A是示出了被对准的转折函数的图解视图。图6B示出了从一段中计算平均值点的实例。图6C是从相似形状组中计算得到的平均形状。
图7示出了研究形状的训练数据集的距离分布并示出了查找阈值的方法的图解视图。
具体实施方式
下面是参考附图对本发明的优选实施例的详细描述,其中在几幅附图的每幅中,相同附图标记标识了相同的结构元件。
本发明公开了一种对图像中的二维(2D)形状进行自动分类的方法。在图1A中概括地示出了根据本发明的方法的流程图。如图1A所示,所述方法包括四个步骤。首先,创建研究形状的训练数据集/数据库,所述训练数据集/数据库包括两组数据:相似形状组和相异形状组(步骤10)。然后,计算表征相似形状组(步骤11)的平均形状。接着,将数据库中的形状对准平均形状,并计算出它们的相似性距离(步骤12)。最后,得到相似性距离的分布并用于将形状分成两个分组:相似和相异(步骤13)。
在图1B流程图中示出的另一实施例中,在计算平均形状(步骤11)之前可以应用附加的步骤。所述附加步骤(步骤14)是产生训练数据集中每个形状的多边形近似,该步骤将在下面更加具体地描述。
图2示出了示例训练数据集,其中研究形状(即,目标形状)是从脑部图像中提取的池形状。通过人工选择两种类型的形状(相似形状和相异形状)创建训练数据集。相似形状代表相同对象类型,因此它们看起来具有高相似性程度。在该实例中,来自相似组的所有形状都是从脑部图像的池中提取的,如图2A至2K所示。然而,由于噪声、姿势和分割误差以及个体之间的自然差异,它们之间可能存在形状变化。与相似形状相比,不相似形状提取自完全不同的对象类型,例如心室、足部、头骨、手部等,如图2L和2U所示。因此,它们显示出形状的巨大变化。在训练集中具有两个形状组的动机是为了通过集中在所研究形状的特性以及与其它形状的差别上来简化分类问题。为了促进鲁棒的形状分类,数据集中的形状可以呈现出方向、位置和尺度的改变。
在步骤14,产生边界的多边形近似来代表形状。通过多边形说明形状的优点在于,在信息丢失减小的情况下提供了简单的形状描述。根据本发明的一个实施例,多边形近似可以通过连接从形状中提取的一组特征点(signature point)和采样点来产生。特征点是代表形状突出特征的点,诸如具有高曲率或者位于特定位置的点。采样点是基于某一标准位于特征点之间的点。
一个标准是找到形状的重心,从重心至形状边界画出任意的径向射线,然后通过以360/n度的规律间隔顺时针移动径向射线来沿着边界放置一组采样点。结果的形状可以表示为:
S=(rθ1,rθ2,rθ3,p1,p2,......rθi,rθi+1,...pj,rθn,)θi=(360/n)*I
其中,rθi是通过在第i条径向射线和形状边界之间交叉得到的采样点,1<i<n。pj是特征点。图3A描述了通过该标准产生的多边形近似。
另一标准是通过在特征点之间填入多个等距离点(Vdi)来选择采样点。所述形状可以通过下式给出:
S=(vd1,vd2,vd3,p1,p2,......vdi,vdi+1,...vdn,)
图3B示出了结果的多边形近似。
注意,本发明并不限于使用上述方法来产生形状边界的多边形近似。也可使用其中结果得到的多边形正确地逼进形状而未丢失突出信息的其它公知算法。
为了度量形状的相似性,尽可能接近地对准两个形状。根据本发明的实施例,提供了一种使用转折函数作为形状相似性度量的基础的方法。给定两个形状的多边形近似,从两个多边形的转折函数θ(s)中计算它们的距离。转折函数或者累积角函数(cumulative anglefunction)通过将反时针方向的正切角度量为距离形状近似上参考点0的弧长度s的函数来表示多边形。转折函数或者累积角函数跟随转折,所述转折例如左向旋转时产生上升,在右向旋转时产生下降。为确保普遍性,每个多边形的周边长度可以重新定标为1。因此,对于简单的封闭周线,θ(s)从θ(0)(假定参考点0沿着周线放置在不同点处)开始并增加至θ(1)=θ(0)+2π。
存在几个使得转折函数特别适合于形状相似性度量的性质。首先,是多边形的分段恒定使得计算特别容易和迅速。其次,根据定义,函数θ(s)在多边形的平移和缩放时不变。第三,多边形以角度θ旋转对应于量为θ的函数的垂直移动,而沿着多边形周边以量t∈[0,1]改变参考点0的位置导致函数θ(s)的循环位移(circular shift)。
设Tp和Sp为模板形状T和形状实例S的多边形近似。图4B和4D分别示出了图4A和图4C中示出的两个形状的转折函数。X轴对应于形状的周边,Y轴对应于转折角。Tp和Sp相似的程度可以通过取转折函数θTp(s)和θSp(s)之间的最小距离L2来度量,如下面所定义的:
Figure A20058004019700071
其中t代表参考点沿着多边形的位置,θ对应于多边形的旋转。如Arkin等人所示(E.M.Arkin,L.P.Chew,D.P.Huttenlocher,K.Kedem,和J.S.Mitcheel,“用于比较多边形形状的有效可计算度量(An efficiently computable Metric for ComparingPolygonal shapes)”.IEEE Trans.On Pattern Analysis andMachine Intelligence.Vol.13No.3 1991 pp 209-215),该问题可以通过下式解出:
D 2 T p , S p ( t , θ ) = { min t ∈ [ 0,1 ] [ ∫ 0 1 ( θ T p ( s + t ) - θ S p ( s ) ) 2 ds - ( θ * ( t ) ) 2 ] } 1 2 - - - ( 2 )
其中θ*是对于任意固定t的最优方向,并可以由下式给出:
θ * = ∫ 0 1 θ S p ( s ) ds - ∫ 0 1 θ T p ( s ) ds - 2 πt - - - ( 3 )
从这两个等式中,可以得到两个矩阵。一个是从等式2中得到的矩阵D2,另一个是从等式3中得到的矩阵θ。可以通过查找D2矩阵中的最小距离L2以及θc矩阵中与其对应的元素来确定形状实例的正确(即最佳匹配)方向。图4E和图4F示出了这两个形状的对准结果以及它们的最佳匹配转折函数。
使用转折函数存在一些优势。例如,最佳匹配转折函数中的旋转角度θ*代表两个形状之间的方向差,如果需要可以用于方向校正。另外,对准两个转折函数的计算复杂度为0(mnlog(mn)),其中m是模板形状上的界标数目,n是形状实例上的界标数目。这也是整个形状分类过程的计算复杂度,这是因为与多边形近似的生成和将在下面描述的距离分类相比,形状对准占据了形状分类需要的大部分时间。因此,通过选择适当的界标数量,可以使得形状分类更为有效。使用转折函数(例如,而不是对应界标点之间的距离)的另一优势在于不再需要一一对应,并且甚至界标的数目可以不同。这可以促进形状分类的鲁棒性。
相似形状组中的每个形状都对表征所研究形状特征的平均形状有贡献。图5示出了实现这一点的适当方法。所述方法首先通过从相似形状组中随机选择形状来创建模板形状(步骤50)。然后,将相似形状组中的形状对准具有最佳匹配转折函数的模板形状(步骤51)。图6A提供了示例。
接着,沿着X轴将对准的转折函数划分成n个等距离段,所述X轴对应于形状的周边长度。在每个段中,从转折函数上的第一点中确定平均值点。在图6B中示出了这一点。通过将平均值点连接在一起,可以构建出平均形状(步骤52)。然而,该平均形状可能并不能最好地代表相似形状组的形状特征,这是因为它很大程度上取决于模板形状的选择。为了降低这种依赖性并确保平均形状捕获到相似形状组中最多公共信息,于是将平均形状设置为模板形状,并重复上述过程直到平均形状接近组中与所有形状交叉的最小距离(步骤53),如下式所示:
D Total = min ( Σ i n D 2 T , S 1 )
使得平均形状收敛,可能需要几个这样的过程循环。然后,将最终的平均形状作为表征相似形状组的平均形状输出(步骤54)。图6C示出了从图6A和图6B的相似形状组计算得到的平均形状。
当得到平均形状时(步骤54/步骤11),将训练数据集中的形状对准所述平均形状,并计算它们的相似距离D2(步骤12)。所述距离结合在一起形成训练数据集的相似性距离分布,如图7所示。图7中的X轴代表距离值,Y轴对应于距离的频率。坐标的原点与平均形状相关。对分布的观察说明了相似形状组和相异形状组之间的差别。对于相似形状组中的形状,它们的距离(85)通常非常小且彼此接近,由于它们代表相同类型对象并看起来与平均形状比较相似,所以这将是期望的。相反,相异形状组中形状的距离(84)呈现出较大变化。一些甚至因与平均形状差异显著而远离原点。
在步骤13,基于所述形状的距离将它们分成两组。由于距离分布是一维的,因此分类问题可以简化为确定一个适当的阈值以得到一个“良好的”距离鉴别。可以使用已知的基于图像直方图形状分析的阈值方法,其中所述阈值可以使分类误差最小化。可以假定相似形状组的距离分布为正态分布。分布的平均值设置为零,其对应于平均形状。分布的方差σ解释了相似形状组内的形状变化。在一个具体应用中,申请人将初始阈值(81)设置为3*σ,如图7所示。然后在邻域(83)内执行搜索直到发现使得分类误差最小化的最佳拟合阈值(82)。
根据本发明,研究形状的分类取决于从训练数据集中提取的平均形状及其分类阈值。当输入新形状时,将其与研究形状的平均形状进行比较。如果发现匹配且其距离小于阈值,则将新形状作为相似形状组的成员进行分类。为了促进分类的准确性和一致性,精选特征平均形状和分类阈值以反映新元素的加入,这可以通过在新形状累积至一定数量时更新平均形状和分类阈值(例如每次)来完成。
注意,所公开的方法集中在一种形状类型,分类结果为是或否(例如,1或0)。如果需要更加复杂的系统对数据库中几种不同的形状类型进行分类,那么可以通过这样的步骤扩展所公开的方法,即为每种形状类型创建训练数据集,然后研究每种类型的平均形状和分类阈值,最后通过查找具有最小相似距离的形状类型来行来执行分类。
本发明可以例如以计算机程序产品的形式实施。计算机程序产品可以包括一个或更多存储介质,例如:磁性存储介质,诸如磁盘(诸如软盘)或者磁带;光学存储介质,诸如光盘、光带或者机器可读条形码;固态电子存储装置,诸如随机存取存储器(RAM)或者只读存储器(ROM);或者用于存储计算机程序的任何其它物理装置或者介质,所述计算机程序具有用于控制一个或更多计算机实施根据本发明的方法的指令。
本发明的系统可以包括具有微处理器、计算机存储器以及计算机程序的可编程计算机,所述计算机程序存储在所述计算机存储器中用于执行所述方法的步骤。所述计算机具有可操作地连接至微处理器的存储器接口。所述接口可以是用于接收可移动存储器的驱动器上的端口,诸如USB端口,或者允许存取照相机存储器的其它设备。该系统包括数码相机,所述数码相机具有与存储器接口兼容的存储器。根据需要,可以使用照相胶片照相机和扫描仪来代替数码相机。可以提供图形用户接口(GUI)和诸如鼠标和键盘的用户输入单元作为计算机的一部分。
已经特别参考目前优选的实施例对本发明进行了详细描述,但是应当理解,在本发明的精神和范围内,各种改变和变型也是有效的。因此应当认为目前公开的实施例其所有方面都是示例性的而不是限制性的。本发明的范围由所附的权利要求书限定,其等效范围或者等效意义上的所有改变均包含在其中。

Claims (6)

1.一种对二维形状进行分类的方法,包括步骤:
创建由相似形状组和相异形状组构成的训练形状数据集;
根据相似形状组计算平均形状;
将训练形状数据集中的每个形状对准平均形状;
产生训练形状数据集中每个形状的相似性距离;和
根据它们的相似性距离将训练形状数据集中的每个形状分类至相似形状组或者相异形状组。
2.根据权利要求1所述的方法,其中所述计算平均形状的步骤包括步骤:
从相似形状组中识别出一个形状作为模板形状;
将相似形状组中的形状对准模板形状;
产生平均形状;
确定所述平均形状和所述相似形状组中的形状之间的总距离;和
当所述总距离最小时输出平均形状。
3.根据权利要求2所述的方法,其中所述输出的步骤通过以下步骤完成:
将平均形状识别为模板形状;和
重复对准、产生和确定步骤直到总距离最小。
4.根据权利要求1所述的方法,其中所述将训练形状数据集中的每个形状对准平均形状的步骤包括步骤:
产生每个形状的多边形近似;以及
使用转折函数以将多边形近似对准平均形状。
5.根据权利要求1所述的方法,其中所述对训练形状数据集中的每个形状进行分类的步骤包括步骤:
使用训练数据集中形状的相似性距离产生距离分布;和
从距离分布中识别出用于对形状进行分类的分类阈值。
6.根据权利要求5所述的方法,进一步包括步骤:
得到新的形状;
对新的形状进行分类;和
使用所述新的形状更新平均形状和分类阈值。
CNA2005800401970A 2004-11-23 2005-11-22 用于自动形状分类的方法 Pending CN101223539A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US63027004P 2004-11-23 2004-11-23
US60/630,270 2004-11-23

Publications (1)

Publication Number Publication Date
CN101223539A true CN101223539A (zh) 2008-07-16

Family

ID=38226739

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800401970A Pending CN101223539A (zh) 2004-11-23 2005-11-22 用于自动形状分类的方法

Country Status (2)

Country Link
EP (1) EP1815401A1 (zh)
CN (1) CN101223539A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300150A (zh) * 2018-10-16 2019-02-01 杭州电子科技大学 一种用于骨龄评估的手骨x光图像纹理特征提取方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109300150A (zh) * 2018-10-16 2019-02-01 杭州电子科技大学 一种用于骨龄评估的手骨x光图像纹理特征提取方法
CN109300150B (zh) * 2018-10-16 2021-10-29 杭州电子科技大学 一种用于骨龄评估的手骨x光图像纹理特征提取方法

Also Published As

Publication number Publication date
EP1815401A1 (en) 2007-08-08

Similar Documents

Publication Publication Date Title
Guo et al. 3D object recognition in cluttered scenes with local surface features: A survey
JP4605445B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
Aldoma et al. Tutorial: Point cloud library: Three-dimensional object recognition and 6 dof pose estimation
Creusot et al. A machine-learning approach to keypoint detection and landmarking on 3D meshes
Kim et al. Boundary preserving dense local regions
Das et al. Use of salient features for the design of a multistage framework to extract roads from high-resolution multispectral satellite images
US7706612B2 (en) Method for automatic shape classification
Bariya et al. Scale-hierarchical 3d object recognition in cluttered scenes
Cheng et al. Outdoor scene image segmentation based on background recognition and perceptual organization
Sie Ho Lee et al. Detecting curved symmetric parts using a deformable disc model
Nguyen et al. An improved ridge features extraction algorithm for distorted fingerprints matching
Efraty et al. Facial component-landmark detection
Liu et al. A novel rock-mass point cloud registration method based on feature line extraction and feature point matching
Liu et al. Radon representation-based feature descriptor for texture classification
Sun et al. Graph-matching-based character recognition for Chinese seal images
CN117928385A (zh) 一种基于远程无人机和传感器的工程施工智能测量方法
Liu et al. Shape detection from line drawings with local neighborhood structure
CN111680571A (zh) 基于lda降维的多特征融合的植物叶片识别方法
CN101223539A (zh) 用于自动形状分类的方法
Takaishi et al. Free-form feature classification for finite element meshing based on shape descriptors and machine learning
CN115375891A (zh) 基于机器学习的文物碎片相似性识别及变换匹配方法
Sahbi et al. Robust matching by dynamic space warping for accurate face recognition
Lavva et al. Robust methods for geometric primitive recovery and estimation from range images
Ozcanlı et al. Generic object recognition via shock patch fragments
Ahmadyfard et al. Using relaxation technique for region-based object recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080716