CN101042742A - 模式识别方法 - Google Patents

模式识别方法 Download PDF

Info

Publication number
CN101042742A
CN101042742A CNA2007100893393A CN200710089339A CN101042742A CN 101042742 A CN101042742 A CN 101042742A CN A2007100893393 A CNA2007100893393 A CN A2007100893393A CN 200710089339 A CN200710089339 A CN 200710089339A CN 101042742 A CN101042742 A CN 101042742A
Authority
CN
China
Prior art keywords
basis function
vector
distribution
similar
base vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100893393A
Other languages
English (en)
Other versions
CN101042742B (zh
Inventor
名取直毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of CN101042742A publication Critical patent/CN101042742A/zh
Application granted granted Critical
Publication of CN101042742B publication Critical patent/CN101042742B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

根据本发明的一个实施例,提出了一种用于根据基函数来对向量空间中的向量集合的分布以及类界限进行近似的模式识别方法。该方法包括:在两个基向量之间定义有方向的基函数(ST1至ST6),并且利用有方向的基函数的线性组合来执行近似(ST7至ST8)。

Description

模式识别方法
技术领域
本发明涉及这样一种模式识别方法,该模式识别方法用于根据基函数来对向量空间中的向量集合的分布以及两个或多个向量集合(类)的界限进行近似。
背景技术
使用被称为径向基函数(在下文中被称为球形基函数)的基函数的方法是已知的。数个研究组已经独立地提出了球形基函数。作为这种提议的一个示例,在这里引用了J.E.Moody和C.Darken所著的“Fast Learning in Networks of Locally-Tuned Processing Units”(Neural Computation 1,第281-294页,1989年)。球形基函数在中心上具有峰值并且在各个方向上都对称。对于球形基函数,所谓的高斯型球形基函数是最通行的,并且通过下述公式来表示:
       oi(x)=exp[-‖x-ξi2/2σi 2],
其中,x是与输入模式相对应的向量,并且ξi是第i个基向量(用于表示在高斯分布中的位置的参数),而σi是第i个标准偏差(用于表示高斯分布的扩展的参数)。第i个高斯型基函数的值是oi(x),当x接近于ξi时,该第i个高斯型基函数的值是非负的且很大,并且当x=ξi时,该第i个高斯型基函数的值采用最大值1。通过提供充够数目的基函数并且使用由下述公式所表示的加权线性组合,可将任何任意选择的向量集合的分布近似为期望的精度级,所述公式为:
y 1 ( x ) = Σ i = 1 H ′ w 1 i o i ( x ) ,
其中,1是向量集合的类编号,并且w1i是第i个基函数相对于类1而言的分布率(加权参数),而H′是基函数的数目。上述公式表示未知的输入模式相似于特定类的程度(相似度),因此它可用于对类进行分类。例如,如果:
              C(x)=arg max1(y1(x)],
那么可根据基函数所定义的类界限来确定输入模式的类。在上述公式3中,argmax1[·]是提供相似度的最大值的类的编号。
使用球形基函数的模式识别方法提供了这样的优点,其中包括:与基于一般的S形函数的前馈神经网络一样,通过学习可使参数最优化;但是,与一般神经网络不同,独立的基函数的分布率在直觉上是易于了解的。
然而,与从现实世界中所观测到的模式相对应的向量的分布通常很复杂,并且因此必须准备很大数目的基函数以便对这种分布进行精确地近似。相反,当所获得的抽样数目小时,近似会产生相对于适当分布(群体分布)而言也很复杂这样的状态(过度学习)。
发明内容
因此,本发明的目的就是提供这样一种模式识别方法,该模式识别方法适于根据与已知的可比性方法相比数目更少的基向量来对可能很复杂的向量集合的分布以及类的界限进行近似。
根据本发明的一个实施例,提供了一种用于根据基函数来对向量空间中的向量集合的分布以及类界限进行近似的方法。该方法包括:在两个基向量之间定义有方向的基函数,并且利用有方向的基函数的线性组合来执行近似。
在下面的描述中对本发明的另外的目的和优点进行阐述,并且这些目的和优点在某种程度上是可从该描述中显而易见地得知的,或者可从本发明的实践中获悉。借助于尤其是在下文中所指出的手段及组合可实现并获得本发明的目的和优点。
附图说明
包含在说明书中并构成了说明书一部分的附图对本发明的实施例进行了说明,并且与以上给出的一般描述以及以下给出的对实施例的详细说明一起用于说明本发明的原理。
图1是作为示例而示出的本发明的实施例的处理操作的流程图;
图2是作为示例而示出的与输入模式相对应的向量、基函数、以及向量集合的分布的图示;
图3是作为示例而示出的基函数的图示;
图4是作为示例而示出的对模式分布进行近似的示意性说明;
图5是使用传统的球形基函数、对与图4相同的模式分布进行近似的示意性说明;
图6是作为示例而示出的当所获得的抽样数目小时的基函数的示意性图示;
图7是作为示例而示出的当所获得的抽样数目小时对模式分布进行近似的示意性说明;
图8是作为示例而示出的、使用传统的球形基函数对与图7相同的模式分布进行近似的示意性说明;
图9是示出了通过学习抽样来定义参数的方法的流程图;以及
图10是给出了作为示例的硬件结构的硬件的示意性方框图。
具体实施方式
下面参考附图对本发明的实施例进行描述。
<第一实施例>
图1是该实施例的处理操作的流程图。图2是与输入模式相对应的向量、基函数、以及向量集合的分布的示意性图示。
首先,输入一个模式(ST1)。在这里所使用的表述“模式”是指诸如数字图像的像素值或一行特征量这样的计算机可处理的数字值串。模式可以被认为是具有这种数字值作为分量(ST2,ST3)的向量。通过下述公式来表示与输入模式相对应的向量:
                 x=[x1,x2,…,xM]T
其中,x1、x2、…、xM表示模式的数字值串(每个向量的单元),并且M表示单元的数目。
此后,通过计算确定基函数的值(ST4至ST6)。根据这个实施例,在两个基向量之间定义基函数,以便如果基向量的数目是H,那么基函数的数目是H2。该实施例提出了通过下述公式所表示的基函数oij(x),所述公式在两个基向量的位置上具有峰值,并且具有集中在用于连接两个峰值的线段上的增强了的特征。该公式是:
       oij(x)=exp[-‖x-ξi2‖x-ξj2/2σij 2],
其中,x表示与输入模式相对应的向量,并且ξi表示第i个基向量,同时ξj表示第j个基向量,并且σij表示在第i个和第j个基向量之间定义的基函数的标准偏差。
基函数实质上与传统的球形基函数的不同之处在于,当将基向量作为中心进行查看时它不是在所有方向上都对称的(并且具有取决于其它某个基向量的方向的增强了的特征)。图3是作为示例而示出的基函数的图示。本发明基于“线性插值的假定”或者“当两个基向量之间的距离短时这两个基向量之间的线性内插强这样的假定”。图3给出了当两个向量之间的距离为长、中等、以及短时的三个不同基函数的轮廓图。
与球形基函数一样,oij(x)的值是非负的,并且当x接近ξi或ξj时变大,以便当x=ξi或x=ξj时采用最大值1。另外,或类似地,可通过由下面的公式所表示的加权线性组合(ST7,ST8)来对向量集合的分布y1(x)进行近似:
y 1 ( x ) = &Sigma; i = 1 H &Sigma; i = 1 H w 1 ij o ij ( x ) ,
其中,1表示向量集合的类编号,并且w1ij表示在第i个基向量与第j个基向量之间定义的基函数的类1的分布率,而H表示基函数的数目。
最后,借助于如下所示的公式来通过计算确定输入模式相似于该类的程度(相似度)或C(x):
                 C(x)=arg max1[y1(x)],
其中,argmax1[·]是提供相似度的最大值的类的编号。
该实施例中的基函数的优点在于,可学习参数,并且与传统的球形基函数一样分布率在直觉上是易于了解的,并且另外可克服传统方法的问题。更具体地说,可通过比以往更少的基向量对向量的复杂分布进行近似。图4是借助于该实施例对模式分布进行近似的示意性说明。因为该实施例中的基函数具有示出了由实线所表示的椭圆形或圆柱形扩展(不对称)这样的特征,因此,与仅示出了圆形扩展的传统基函数相比,它是具有高度表现性的。
图5是使用传统的球形基函数来对与图4相同的模式分布进行近似的示意性说明。图5示意性地示出了传统的基函数需要比该实施例(仅需要三个基向量)更多的基向量。
通常,当模式分布很复杂但是在从本地观察的情况下该模式分布是本地连续的(尤其是线性的)时,由于本发明的基函数的插值可能性,可降低基向量的数目。在插值不能有助于对模式分布进行近似的最坏情况下,根据该实施例的基函数等效于传统的球形基函数。
另外,如果所获得的抽样少,那么使用基函数的近似不会变得比群体分布更复杂,但是非常接近于后者。图6是当所获得的抽样数目小时该实施例中的基函数的示意性说明,并且图7是当所获得的抽样数目小时对模式分布进行近似的示意性说明。该实施例中的基函数具有这样的意义,即,根据用于基向量的插值的数学模型来预测输入模式的本地波动。
图8是使用传统的球形基函数来对与图7相同的模式分布进行近似的示意性说明。图8示意性地说明了传统的球形基函数仅位于所获得的小数目的抽样周围以便产生与群体分布显著不同的近似。
通常,从现实世界所观测到的模式的波动在本地是连续的,由于本发明的基函数的插值可能性,可以根据较少抽样来对群体分布进行更精确的近似。
<第二实施例>
本发明并不局限于上述的第一实施例,并且可以按照与上述第一实施例相独立的各种方式实现,只要在两个基向量之间定义了有方向的(不是在所有方面上都对称)基函数即可。例如,第二实施例提出了由下面的公式所定义的基函数:
      o′ij(x)=exp[-‖x-hij2‖ξij2/2σij 2],
其中,x表示与输入模式相对应的向量,并且hij表示与用于连接第i个和第j个基向量的线段相垂直的垂线距x的英尺,而ξi和ξj分别表示第i个和第j个基向量,并且oij表示在第i个和第j个基向量之间定义的基函数的标准偏差。
基向量的特征在于下述的圆柱形轮廓图,所述圆柱形轮廓图具有作为核心的用于连接两个基向量的线段,并且在与其相垂直的方向上延伸。在上述公式中,hij实际上是通过使用x、ξi、以及ξj的公式来表示的,因此参数的数目与第一实施例中的参数数目相同。与第一实施例不同的是,第二实施例的特征在于,两个基向量通过与它们之间的距离相对应的恒定值相连。
<第三实施例>
第三实施例涉及对参数的学习。本发明中的基函数具有包括w1ij、ξi、ξj、以及oij在内的四个参数。如果要处理的模式的分布是已知的,那么可以根据该分布来定义参数。然而,从现实世界中所获得的模式的分布通常是未知的。
因此,该实施例提出了一种通过对抽样进行学习来定义参数的技术。图9是通过对抽样进行学习来定义参数的方法的流程图。参考图9,首先,通过使用适当值来对该参数进行初始化(ST11)。此后,根据下述公式来为所获得的抽样更新参数(ST12至ST14):
               w′1ij=w1ij-α[ε(x,y)/w1ij]
               ξ′i=ξi-α[ε(x,y)/ξi]
               ξ′j=ξj-α[ε(x,y)/ξj]
               σ′ij=σij-α[ε(x,y)/σij]
其中,ε(x,y)是学习误差,并且使用yc作为教导信号(所期望的值)通过下述公式来表示:
                ε(x,y)=(yc-y(x))2/2,
其中,α是学习恒量,并且为正值。按照这种方式顺序地对参数进行更新,并且当ε(x,y)显示出足够小的值时(或者当学习会话的数目超过预定数目时),结束学习会话。可与第一和第二实施例中的模式识别处理相独立地实现对参数的学习。
如上面所指出的,利用适于根据基函数来对向量空间中的向量集合的分布和类界限进行近似的模式识别方法,通过在两个基向量之间定义有方向的基函数(不是在所有方向都对称)并且根据其线性组合来执行近似,可以用较少的基向量来对向量集合的分布以及类界限进行近似。另外,如果所获得的抽样数目小,那么使用基函数的近似不会变得比群体分布更复杂,但是与传统基函数不同的是它非常接近于后者。
尤其是,使用下述基函数,通过对强插值与短距离的关系进行建模,可以对向量集合和类界限进行近似,其中所述基函数在两个基向量的位置上具有峰值,并且示出了通过其尺寸与它们之间的距离相对应的非线性曲面来连接两个峰值这样的特征。
使用下述基函数,通过对强插值与短距离的关系进行建模,还可以对向量集合和类界限进行近似,所述基函数在两个基向量的位置上具有峰值,并且其特征在于圆柱形轮廓图,该圆柱形轮廓图具有作为核心的用于连接两个基向量的线段并且在与其相垂直的方向上延伸。
此外,即使当要处理的模式的分布是未知的时,也可通过在输入抽样的同时根据误差最低标准顺序地对参数进行更新来定义参数。
该实施例的上述处理序列可被编写为计算机程序(代码)并且被存储在计算机可读存储介质(例如,磁盘、光盘、或者半导体存储器)中,并且必要时可以借助于计算机(处理器)来读取并执行任何计算机程序。通过经由传输介质将任何这种计算机程序从计算机传送到另一计算机,来分发该计算机程序。
包含有该处理序列的任何计算机程序可通过具有如图10所示的硬件资源的信息处理装置(计算机)11来执行。图10所示的处理器(CPU等)10可以执行从存储设备(硬盘等)12中加载到易失性存储器(RAM等)13中的计算机程序,根据输入设备(鼠标、键盘等)14的操作来在显示器15上显示各种信息(处理操作的结果),和/或将其存储在存储设备12中。
对于本领域普通技术人员来说很容易想到其他优点和修改。因此,本发明的很宽方面并不局限于在这里所给出和描述的具体细节和典型实施例。因此,在不脱离由随后权利要求和其等效内容所定义的一般发明概念的精神或范围的情况下,可以做出各种修改。

Claims (4)

1、一种用于根据基函数来对向量空间中的向量集合的分布以及类界限进行近似的模式识别方法,其特征在于包括:
在两个基向量之间定义有方向的基函数(ST1~ST6);以及
利用有方向的基函数的线性组合来执行近似(ST7~ST8)。
2、根据权利要求1的方法,其特征在于,使用下述基函数来执行近似,所述基函数在两个基向量的位置上具有峰值,并且通过其尺寸与两个峰值之间的距离相对应的非线性曲面来连接两个峰值。
3、根据权利要求1的方法,其特征在于,使用下述基函数来执行近似,所述基函数在用于连接两个基向量的线段上具有峰值,并且具有通过使用峰值作为核心所形成的、在与其相垂直的方向上延伸、并且尺寸与它们之间的距离相对应的圆柱形轮廓图。
4、根据权利要求1的方法,其特征在于,在输入抽样的同时,根据误差最低标准来顺序地对基函数的参数进行更新(ST12~ST14)。
CN2007100893393A 2006-03-23 2007-03-23 模式识别方法 Expired - Fee Related CN101042742B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006-080837 2006-03-23
JP2006080837 2006-03-23
JP2006080837A JP2007257295A (ja) 2006-03-23 2006-03-23 パターン認識方法

Publications (2)

Publication Number Publication Date
CN101042742A true CN101042742A (zh) 2007-09-26
CN101042742B CN101042742B (zh) 2010-08-18

Family

ID=38197867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100893393A Expired - Fee Related CN101042742B (zh) 2006-03-23 2007-03-23 模式识别方法

Country Status (4)

Country Link
US (1) US7933449B2 (zh)
EP (1) EP1837807A1 (zh)
JP (1) JP2007257295A (zh)
CN (1) CN101042742B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520847B (zh) * 2008-02-29 2012-06-13 富士通株式会社 模式识别装置和方法
CN104700121A (zh) * 2015-01-28 2015-06-10 桂林电子科技大学 基于均值/方差分类的三维som初始化模式库生成方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8369460B1 (en) * 2009-05-18 2013-02-05 The United States Of America As Represented By The Secretary Of The Army Reduced complexity constellation pattern recognition and classification method
US9953394B2 (en) 2015-02-26 2018-04-24 Tata Consultancy Services Limited Methods and systems for designing correlation filter

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0219992A (ja) 1988-07-08 1990-01-23 Nec Corp 汚損紙幣検出装置
US7720651B2 (en) * 2000-09-29 2010-05-18 Canning Francis X Compression of interaction data using directional sources and/or testers
EP1573657A2 (en) * 2002-12-11 2005-09-14 Koninklijke Philips Electronics N.V. Computer vision system and method employing illumination invariant neural networks
US7091719B2 (en) * 2004-04-30 2006-08-15 Schlumberger Technology Corporation Method for determining properties of formation fluids
DE102004030782A1 (de) * 2004-06-25 2006-01-19 Fev Motorentechnik Gmbh Fahrzeug-Steuergerät mit einem neuronalen Netz

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101520847B (zh) * 2008-02-29 2012-06-13 富士通株式会社 模式识别装置和方法
CN104700121A (zh) * 2015-01-28 2015-06-10 桂林电子科技大学 基于均值/方差分类的三维som初始化模式库生成方法

Also Published As

Publication number Publication date
JP2007257295A (ja) 2007-10-04
US20070223821A1 (en) 2007-09-27
US7933449B2 (en) 2011-04-26
EP1837807A1 (en) 2007-09-26
CN101042742B (zh) 2010-08-18

Similar Documents

Publication Publication Date Title
CN111797893B (zh) 一种神经网络的训练方法、图像分类系统及相关设备
US20200265301A1 (en) Incremental training of machine learning tools
WO2022068623A1 (zh) 一种模型训练方法及相关设备
KR20200086581A (ko) 뉴럴 네트워크 양자화를 위한 방법 및 장치
WO2023134063A1 (zh) 基于对比学习的药物分子性质预测方法、装置及设备
CN113610232B (zh) 网络模型量化方法、装置、计算机设备以及存储介质
US11769481B2 (en) Unsupervised alignment for text to speech synthesis using neural networks
CN101042742A (zh) 模式识别方法
US20230004816A1 (en) Method of optimizing neural network model and neural network model processing system performing the same
WO2021062219A1 (en) Clustering data using neural networks based on normalized cuts
US20220335293A1 (en) Method of optimizing neural network model that is pre-trained, method of providing a graphical user interface related to optimizing neural network model, and neural network model processing system performing the same
WO2022100607A1 (zh) 一种神经网络结构确定方法及其装置
CN113449840A (zh) 神经网络训练方法及装置、图像分类的方法及装置
WO2024114659A1 (zh) 一种摘要生成方法及其相关设备
WO2021012691A1 (zh) 用于检索图像的方法和装置
WO2023185541A1 (zh) 一种模型训练方法及其相关设备
WO2023174189A1 (zh) 图网络模型节点分类方法、装置、设备及存储介质
US20220375205A1 (en) Aggregating Nested Vision Transformers
CN115188055A (zh) 一种针对nnie神经网络加速器的轻量级表情识别方法
WO2022251265A1 (en) Dynamic activation sparsity in neural networks
Yang et al. An improved yolov3 algorithm for pedestrian detection on uav imagery
Glavan et al. Cloud environment assessment using clustering techniques on microservices dataset
US20240177034A1 (en) Simulating quantum computing circuits using kronecker factorization
WO2023236900A1 (zh) 一种项目推荐方法及其相关设备
WO2023231796A1 (zh) 一种视觉任务处理方法及其相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100818

Termination date: 20120323