CN103793714A

CN103793714A - 多分类识别器、数据识别装置、多分类识别方法及数据识别方法

Info

Publication number: CN103793714A
Application number: CN201310491528.9A
Authority: CN
Inventors: 松永和久; 中込浩一; 二瓶道大; 广浜雅行
Original assignee: Casio Computer Co Ltd
Current assignee: Casio Computer Co Ltd
Priority date: 2012-10-26
Filing date: 2013-10-18
Publication date: 2014-05-14
Anticipated expiration: 2033-10-18
Also published as: US9076081B2; JP2014085996A; JP5765583B2; US20140119646A1; CN103793714B

Abstract

多分类识别器识别数据所表征的特征是属于多个分类中的哪个分类，具备：第1阶层识别器生成单元，其生成进行1对N的识别的多个第1阶层识别器；和第2阶层识别器生成单元，其通过将多个第1阶层识别器分别输出的各计分值进行连结来生成第2阶层特征向量，输入该第2阶层特征向量来生成进行1对N的识别的多个第2阶层识别器，多分类识别器将通过使数据输入到多个第1阶层识别器而由该多个第1阶层识别器输出的各计分值进行连结来生成第2阶层特征向量，将与通过使该第2阶层特征向量输入到多个第2阶层识别器而输出了最大的计分值的第2阶层识别器相对应的分类，识别为所输入的数据所表征的特征所属的分类。

Description

多分类识别器、数据识别装置、多分类识别方法及数据识别方法

本申请主张以2012年10月26日提出申请的日本国专利申请第2012－236440号为基础申请的优先权，将该基础申请的内容全部引入到本申请中。

技术领域

本发明涉及多分类识别器、数据识别装置、多分类识别方法以及数据识别方法。

背景技术

有想要知道在山野或路边发现的花的名称的情况。为此，提出如下技术（例如，参照特开2002－203242号公报）：通过以摄影等而得到的花和叶的数字图像，使用聚类法大量提取作为对象物的花和叶的局部特征，进而求取以将该提取特征群进行直方图化的信息为特征量的单个或多个特征量，使用统计手法来解析该求得的特征量、和预先登录于数据库的各种植物的特征量来判别野花草的种类。

在此，在对输入的花等的图像数据进行图像分类时，在机器学习中，能容易地实现所谓的2分类识别器，其进行是某种类的图像自身还是此外图像这2种图像分类。另一方面，在进行从多个种类的图像中识别各种类的图像的多分类的图像分类时，一般组合2分类识别器来构成所谓的多分类识别器。例如，在将花的图像分类为6种类的情况下，生成6个2分类识别器。各识别器按照在分别输入了所分配的种类的图像时分别输出最大的识别计分值的方式进行生成。然后，在将图像输入到各识别器时，将与输出最高识别计分值的识别器对应的种类设为识别结果。

但是，例如在花的种类的分类中，在组合2分类识别器来构成多分类识别器的情况下，存在各2分类识别器输出的计分值未被归一化的问题点。具体地，2分类识别器以计分值零为边界，用正负号来判定是否属于与该2分类识别器对应的分类。表示此时的识别的似然的计分值的绝对值将根据生成该2分类识别器的学习用数据与其他分类的学习用数据分离何种程度（分离度）而改变。若组合这样的2分类识别器来构成多分类识别器，根据对识别的难易度为各种各样的多分类的数据进行识别的各计分值的绝对值而决定的识别性能，将对应于赋予各2分类识别器的学习用数据的质量而改变。如此，在组合2分类识别器来构成多分类识别器的情况下，存在各分类的识别性能变得不均匀，即未归一化这样的问题点。

进而，在组合2分类识别器来构成多分类识别器的情况下，若未对各2分类识别器赋予充分数量的学习用数据，则各分类的识别性能会变得不均匀。但是，例如在花的种类的分类中，存在难以对全部分类赋予充分数量的学习用数据这样的问题点。

发明内容

本发明目的在于，能通过总括评价各2分类识别器输出的计分值来抑制识别率的降低，实现能使各2分类识别器的计分值归一化的多分类识别器。

本发明的多分类识别器识别数据所表征的特征是属于多个分类中的哪个分类，所述多分类识别器的特征在于，具备：第1阶层识别器生成单元，其生成进行1对N的识别的多个第1阶层识别器；和第2阶层识别器生成单元，其通过将所述多个第1阶层识别器分别输出的各计分值进行连结来生成第2阶层特征向量，输入该第2阶层特征向量来生成进行1对N的识别的多个第2阶层识别器，所述多分类识别器将通过使数据输入到所述多个第1阶层识别器而由该多个第1阶层识别器输出的所述各计分值进行连结来生成所述第2阶层特征向量，将与通过使该第2阶层特征向量输入到所述多个第2阶层识别器而输出了最大的计分值的所述第2阶层识别器相对应的分类，识别为所输入的所述数据所表征的特征所属的分类。

附图说明

图1是表示本发明的一个实施方式所涉及的多分类识别器的硬件构成例的框图。

图2是表示本实施方式的多分类识别器生成处理的整体动作的流程图。

图3是2阶层多分类识别器的构成图。

图4是表示第1阶层特征向量在特征空间上的分布例的示意图。

图5是表示第1阶层识别器输出的计分值的示例的图。

图6是表示第2阶层特征向量的数据构成例的图。

图7是表示图2的第1阶层识别器生成处理的详细的流程图。

图8是表示图7的特征提取处理的流程图。

图9是表示图7的向量量化处理的流程图。

图10是表示图7的第1阶层特征向量生成处理（直方图生成处理）的流程图。

图11是表示图7或图12的识别器生成处理的流程图。

图12是表示图2的第2阶层识别器生成处理的详细的流程图。

具体实施方式

下面，参照附图来详细说明用于实施本发明的形态。

图1是表示本发明的一个实施方式所涉及的多分类识别器101的硬件构成例的框图。

该多分类识别器101例如在检索系统的计算机上实现，该检索系统从所谓的智能手机等的便携式信息终端接收花等的摄影图像数据，并通过识别器检索该花等的种类来进行识别，并将该识别结果返回便携式信息终端。

多分类识别器101具备：CPU（Central Processing Unit：中央运算处理装置）102、ROM（Read Only Memory：只读存储器）103、和RAM（Random Access Memory：随机存取存储器）104。另外，多分类识别器101具备：硬盘存储装置或固态驱动器存储装置等的外部存储装置105、通信接口106、键盘装置或鼠标装置等的输入装置107、和显示器装置等的输出装置108。进而，多分类识别器101具备能设置SD存储卡、USB（Universal SerialBus，通用串行总线）存储卡、CD（Compact Disk：光盘）、DVD（Digital Versatile Disk，数字通用光盘）等的可移动存储介质110的可移动存储介质驱动装置109。上述各设备102～109通过总线111而相互连接。

在ROM103中存储有后述的图2以及图7到图12的流程图表示的多分类识别器生成处理的控制程序。CPU102从ROM103读出该控制程序，以RAM104为工作内存来执行。基于该硬件构成而进行动作的多分类识别器例如是软件，存储在ROM103、RAM104、或外部存储装置105。另外，在多分类识别器生成处理中输入的学习用数据例如从外部存储装置105、或能设置在可移动存储介质驱动装置109的可移动存储介质110所提供。

在生成多分类识别器后，CPU102通过读出并执行被存储在ROM103、RAM104、或外部存储装置105的多分类识别器的软件，从而作为多分类识别器进行动作。或者，多分类识别器也可以由其它的计算机系统执行。该多分类识别器例如经由因特网用通信接口106从所谓的智能手机等的便携式信息终端中接收花的摄影图像数据。然后，多分类识别器检索该花的种类来识别，将该识别结果从通信接口106介由因特网返回便携式信息终端。另外，多分类识别器例如也可以作为智能手机的搭载应用而直接提供给智能手机。

图2是表示由图1的硬件构成所示的多分类识别器101执行的本实施方式的多分类识别器生成处理的整体动作的流程图。

在该流程图所示的处理与表示其详细的图7到图12的流程图所示的处理一起，作为图1中CPU102执行存储在ROM103的控制程序的处理来实现。

首先，执行学习用数据收集用处理（图2的步骤S201）。在此，例如在图1的外部存储装置105中准备学习用数据。学习用数据按每个进行识别的分类，例如若是花的图像则按每种花的类别而准备。然后，对各学习用数据赋予表示该学习用数据所表征的特征的分类（例如花的图像的类别）的标签。作为整体，准备多个分类×多张学习用数据。更具体地，例如，对牵牛花、旋花、鸭跖草、向日葵这4种花图像分别收集各50张图像数据作为学习用数据。分别对收集到的图像数据制作与花的名称建立关联的标签数据库。

接下来，执行第1阶层识别器生成处理（实现第1阶层识别器生成单元的功能）（图2的步骤S202）。在该步骤S202中，按多个分类执行用于生成第1阶层识别器的处理，该第1阶层识别器输入从多个学习用数据分别提取的各第1阶层特征向量来识别该各学习用数据所表征的特征是否属于多个分类中的1个分类。其结果，生成了个别识别各学习用数据所表征的特征是否分别属于多个分类的多个第1阶层识别器。

接下来，执行第2阶层识别器生成处理（实现第2阶层识别器生成单元的功能）（图2的步骤S203）。在该步骤S203中，按每多个学习用数据，将学习用数据输入到在步骤S202生成的各分类的第1阶层识别器。其结果，通过将各分类的第1阶层识别器输出的各计分值连结起来，生成与输入的学习用数据对应的第2阶层特征向量。每当输入学习用数据就生成第2阶层特征向量。接着，按多个分类执行用于生成第2阶层识别器的处理，该第2阶层识别器输入各第2阶层特征向量来识别与该各第2阶层特征向量对应的各学习用数据所表征的特征是否属于多个分类中的1个分类。其结果，生成个别识别各学习用数据所表征的特征是否分别属于多个分类的多个第2阶层识别器。

图3是通过图2的流程图的控制处理所生成的2阶层多分类识别器的构成图。

在图2的步骤S202，例如分别形成用于识别“旋花vs其余”的＃1的第1阶层识别器302、识别“牵牛花vs其余”的＃2的第1阶层识别器302、识别“鸭跖草vs其余”的＃3的第1阶层识别器302、以及识别“向日葵vs其余”的＃4的第1阶层识别器302。这些第1阶层识别器302，输入基于图像性的特征信息（颜色、纹理等）从赋予了与旋花、牵牛花、鸭跖草、或向日葵的任意种类对应的分类的标签的多个学习用数据中分别提取出的各第1阶层特征向量301而进行生成。

这种情况下，＃1到＃4的各第1阶层识别器302输出的计分值将根据生成各分类的第1阶层识别器302的学习用数据与其它分类的学习用数据分离何种程度（分离度）而改变。由此，＃1到＃4的各第1阶层识别器302的识别性能变得不均匀，未归一化。

使用图4所示的表示第1阶层特征向量在特征空间上的分布例的示意图来说明该问题。图4是为了使说明易于理解而假定第1阶层特征向量301为（x1，x2）这样的由2个要素值构成的二维向量的说明图。另外，省略了向日葵的分布。

在图4所示的第1阶层特征向量301在特征空间上的分布例中，例如，牵牛花的分布401与旋花的分布402在特征空间上的两分布间的距离小，这2种花的图像性的特征非常相似。因此，预想基于第1阶层特征向量301生成的识别“旋花vs其余”的＃1的第1阶层识别器302以及识别“牵牛花vs其余”的＃2的第1阶层识别器302都输出接近的计分值。

图5是表示图3的＃1到＃4的各第1阶层识别器302所输出的计分值的示例的图。在该示例中，示出了输入牵牛花样本（学习用数据）时的各第1阶层识别器302所输出的计分值的示例、和输入旋花样本（学习用数据）时的各第1阶层识别器302所输出的计分值的示例。在该示例的情况下，输入牵牛花样本时图3的识别“旋花vs其余”的＃1的第1阶层识别器302以及识别“牵牛花vs其余”的＃2的第1阶层识别器302的各计分值如“0.8±0.5”以及“0.9±0.5”那样，是非常接近的值。另外，输入旋花样本时图3的识别“旋花vs其余”的＃1的第1阶层识别器302以及识别“牵牛花vs其余”的＃2的第1阶层识别器302的各计分值也如“0.9±0.5”以及“0.8±0.5”那样，是非常接近的值。

因此，在输入旋花的图像数据或牵牛花的图像数据作为输入数据时，预想易于相互出现识别错误。

另一方面，在图4所示的第1阶层特征向量301的特征空间上的分布例中，例如，旋花的分布402与鸭跖草的分布403在特征空间上的两分布间的距离大，这2种花的图像性的特征不相似。因此，基于第1阶层特征向量301生成的识别“旋花vs其余”的＃1的第1阶层识别器302以及识别“鸭跖草vs其余”的＃3的第1阶层识别器302预想输出相互不接近的计分值。

在图5的示例中，输入旋花样本时图3的识别“旋花vs其余”的＃1的第1阶层识别器302以及识别“鸭跖草vs其余”的＃3的第1阶层识别器302的各计分值如“0.9±0.5”以及“－0.5±0.5”那样，是不接近的值。

因此，在输入旋花的图像数据和鸭跖草的图像数据作为输入数据时，识别“旋花vs其余”的＃1的第1阶层识别器302以及识别“鸭跖草vs其余”的＃3的第1阶层识别器302预想难以相互出现识别错误。

另外，在图4所示的第1阶层特征向量301的特征空间上的分布例中，例如，牵牛花的分布401与鸭跖草的分布403在特征空间上的两分布间的距离为中等程度，这种花的图像性的特征既不能说相似，也不能说不相似。这种情况下，在图5的示例中，输入牵牛花样本时，图3的识别“牵牛花vs其余”的＃2的第1阶层识别器302以及识别“鸭跖草vs其余”的＃3的第1阶层识别器302的各计分值如“0.9±0.5”以及“0.5±0.5”那样，成为稍微接近的值。

如此，若各第1阶层识别器302的性能不成为均匀，则因输入的花的图像的种类不同，会发生易于出现识别错误或难以出现识别错误的状況，识别的可靠性降低。

另外，生成＃1到＃4的各第1阶层识别器302而使用的学习用数据的数量并不限于相同，由于也有不能给予充分的样本数的情况，因此＃1到＃4的各第1阶层识别器302的识别性能不均匀而终究无法归一化，从而识别的可靠性降低。

为此，在本实施方式中，进一步地，在图2的步骤S203中，通过针对输入的学习用数据将＃1到＃4的各第1阶层识别器302所输出的各计分值连结起来，来生成与该学习用数据对应的第2阶层特征向量303。图6是表示第2阶层特征向量的数据构成例的图。将＃1到＃4的各第1阶层识别器302所输出的各计分值设为X₁、X₂、X₃以及X₄。在本实施方式中，作为第2阶层特征向量303，生成将这4个计分值作为各要素值的四维的特征向量（X₁、X₂、X₃、X₄）。

然后，在本实施方式中，以具有上述构成的第2阶层特征向量303为输入，分别生成用于识别“旋花vs其余”的＃1的第2阶层识别器304、识别“牵牛花vs其余”的＃2的第2阶层识别器304、识别“鸭跖草vs其余”的＃3的第2阶层识别器304、以及识别“向日葵vs其余”的＃4的第2阶层识别器304。

这种情况下，例如在生成＃1的第2阶层识别器304的情况下，评价＃1到＃4的各第1阶层识别器302所输出的各计分值。由此，例如，在输入的第2阶层特征向量303中，在识别“旋花vs其余”的＃1的第1阶层识别器302所输出的计分值X₁大、识别“鸭跖草vs其余”的＃3的第1阶层识别器302所输出的计分值X₃小的情况下，能在最大计分判定305中生成给出最大的计分值的识别“旋花vs其余”的＃1的第2阶层识别器304。另外，在输入的第2阶层特征向量303中，在识别“牵牛花vs其余”的＃2的第1阶层识别器302所输出的计分值X₂大、识别“鸭跖草vs其余”的＃3的第1阶层识别器302所输出的计分值X₃也稍大的情况下，能在最大计分判定305生成给出最大的计分值的识别“牵牛花vs其余”的＃2的第2阶层识别器304。

在这样的第2阶层识别器304中，例如，在输入与牵牛花样本对应的第2阶层特征向量303时，由于该向量内的计分值X₃比较大，因此识别“旋花vs其余”的＃1的第2阶层识别器304所输出的计分值不会变大。另外例如，在输入与旋花样本对应的第2阶层特征向量303时，由于该向量内的计分值X₃小，因此识别“牵牛花vs其余”的＃2的第2阶层识别器304所输出的计分值不会变大。

如此地，在本实施方式中，通过图3所示的＃1到＃4的第1阶层识别器302和＃1到＃4的第2阶层识别器304的2个阶层构成的多分类识别器，能使＃1到＃4的各分类的识别性能均等，从而能归一化。

图7是表示图2的第1阶层识别器生成处理的详细的流程图。该流程图中，输入的数据中的特征是图像的特征，例如示出制作进行牵牛花、旋花、鸭跖草、向日葵这4分类的花图像的特征的识别的第1阶层识别器的处理。另外，在图像的特征提取中，通过在被称作BOF（Bag Of Features，特征袋）的图像分类中执行一般的方式，从各图像进行特征提取。

首先，执行特征提取处理（图7的步骤S701）。在该处理中，在各个学习用数据中，与学习用数据所示的图像内的各网格对应来执行提取特征信息的处理，将该特征信息存储在图1的RAM104中。作为特征信息，例如与图像内的网格对应来提取颜色以及纹理。

接下来，执行聚类（clustering）处理（图7的步骤S702）。在该处理中，在步骤S701中提取的、全部的学习用数据所示的与例如4种花的各50张的图像内的全部的网格对应的全部的颜色的特征信息被聚类成多个（例如500个）群集。作为聚类算法，例如使用k－means法。关于纹理的特征信息也相同地被聚类成多个（例如500个）群集。

接下来，执行向量量化处理（图7的步骤S703）。在该处理中，在各个学习用数据中，执行接下来的处理。按每个在步骤S701中与学习用数据所示的图像内的各网格对应而提取并保存在图1的RAM104中的特征信息，分别算出该特征信息与步骤S702中算出的各群集的重心的RGB数据之间的距离。然后，将该算出的距离中的与最小的距离对应的群集作为最附近群集来提取，将该提取的最附近群集的重心数据设为该特征信息的向量量化值。该向量量化处理例如按每个颜色以及纹理的特征信息来执行，使用分别通过步骤S702中的聚类而得到的颜色的群集以及纹理的群集来个别提取向量量化值。将按每个学习用数据内的各网格的颜色以及纹理的特征信息而提取出的颜色以及纹理的各向量量化值存储在图1的RAM10中。

接下来，执行第1阶层特征向量生成处理（直方图生成处理）（图7的步骤S704）。在该处理中，在各个多个学习用数据中，按每个与学习用数据所示的图像内的各网格对应而在步骤S703中在RAM104得到的向量量化值，反复执行将与该向量量化值对应的最附近群集的直方图频数（frequency polygon）进行累积的处理。由此，生成与该学习用数据对应的直方图，生成将直方图的每个单元条（bin）的各频数值作为各要素值的第1阶层特征向量（与图3的301对应），并与表示对该学习用数据赋予的分类的标签一起存储在图1的RAM104中。在直方图的生成中，例如使用按每个颜色以及纹理在步骤S703中提取出的向量量化值来个别生成颜色的直方图以及纹理的直方图。然后，将颜色的直方图的每个单元条的各频数值和纹理的直方图的每个单元条的各频数值连结起来作为各要素值，来生成第1阶层特征向量。

最后，执行识别器生成处理（图7的步骤S705）。在此，对多个分类的每个执行以下的处理。首先，从RAM104读出在步骤S704中在RAM104得到的第1阶层特征向量中的赋予了表示1个分类的标签的第一第1阶层特征向量的分组。另外，从RAM104读出赋予了表示该1个分类以外的分类的标签的第二第1阶层特征向量的分组。然后，基于这些第1阶层特征向量的2个分组来生成与在输入属于该1个分类的数据时输出最大的计分值的该1个分类对应的第1阶层识别器。通过按多个分类执行该处理，生成个别识别各学习用数据所表征的特征是否分别属于所述多个分类的多个第1阶层识别器（与图3的302（＃1）～302（＃4）对应）。

在以上的识别器的生成处理中，图7的步骤S701到S704的一系列处理，对各学习用数据仅执行1次，将其结果保持在图1的RAM104中即可。然后，在步骤S705的识别器生成处理中，通过反复读取保持在RAM104的步骤S701到S704的执行结果并予以执行，能高速地执行处理。

图8是表示图7的步骤S701的特征提取处理的流程图。

在该流程图中，在步骤S801中，一边1张份1张份地从图1的RAM104输入学习用数据，一边执行步骤S802和S803的一系列处理步骤，直到在S804判定为没有了要处理的下一学习用数据为止。

首先，在步骤S801输入了1张份的学习用数据后，提取该学习用数据所示的图像内的与最初的网格对应的颜色以及纹理的特征信息，并存储在RAM104中（图8的步骤S802）。

接下来，直到在步骤S803判定为没有了未处理的下一网格为止，都从学习用数据按每个网格执行步骤S802的特征信息的提取处理（图8的步骤S802→S803→S802的反复处理）。

在完成了学习用数据上的每个网格的全部的特征信息的提取处理时，判定是否有下一学习用数据（图8的步骤S804）。

若步骤S804的判定为“是”，则返回步骤S801的处理，并反复步骤S801到S804的一系列处理。

在完成对全部的学习用数据的处理而步骤S804的判定成为“否”时，结束图8的流程图所示的图7的步骤S701的特征提取处理。

图9是表示图7的步骤S703的向量量化处理的流程图。

在该流程图中，在步骤S901中，一边在图1的RAM104上1张份1张份地指定学习用数据，一边执行步骤S902到S904的一系列处理，直到在步骤S905中判定为没有了要指定的下一学习用数据。

在步骤S901中指定了RAM104上的学习用数据后，反复执行步骤S902和S903的处理步骤，直到在S904中判定为不再从RAM104取得与该学习用数据对应的特征信息为止。

首先，从RAM104读出与当前的学习用数据对应的每个网格的颜色以及纹理的特征信息（图9的步骤S902）。

接下来，分别算出在步骤S902读出的颜色的特征信息与在图7的步骤S702算出的颜色的各群集的重心的RGB数据之间的距离。然后，将该算出的距离中的与最小的距离对应的颜色的群集作为最附近群集进行提取，将该提取的最附近群集的重心数据设为该色的特征信息的向量量化值。关于纹理也相同地分别算出在步骤S902中读出的纹理的特征信息与在图7的步骤S702算出的纹理的各群集的重心的RGB数据之间的距离。然后，将该算出的距离中的与最小的距离对应的纹理的群集作为最附近群集来提取，将该提取的最附近群集的重心数据设为该纹理的特征信息的向量量化值。如此，将关于一组颜色以及纹理的各特征信息而提取的各向量量化值存储在RAM104（以上的图9的步骤S903）。

接下来，判定RAM104上是否还有与当前的学习用数据对应的每个网格的下一特征信息（图9的步骤S904）。

若步骤S904的判定为“是”，则返回步骤S902的处理，对下一特征信息执行步骤S902和S903的处理。

在完成对全部特征信息的向量量化、步骤S904的判定成为“否”时，判定是否有下一学习用数据（图9的步骤S905）。

若步骤S905的判定成为“是”，则返回步骤S901的处理，反复步骤S901到S904的一系列处理。

在完成对全部学习用数据的向量量化处理而步骤S905的判定成为“否”时，结束图9的流程图所示的图7的步骤S703的向量量化处理。

图10是表示图7的步骤S704的第1阶层特征向量生成处理（直方图生成处理）的流程图。

在该流程图中，在步骤S1001中，一边在图1的RAM104上1张份1张份地指定学习用数据，一边执行步骤S1002到S1005的一系列处理，直到步骤S1006中判定为没有了要指定的下一学习用数据为止。

在步骤S1001指定了RAM104上的学习用数据后，反复执行步骤S1002和S1003的处理，直到在步骤S1004判定为不再从RAM104取得与该学习用数据对应的向量量化值为止。

首先，从RAM104读出与当前的学习用数据对应的每个网格的向量量化值，更具体是颜色以及纹理的各向量量化值（图10的步骤S1002）。

接下来，使与该读出的该向量量化值对应的最附近群集的存储在RAM104上的直方图频数加1。更具体地，使与颜色的向量量化值对应的颜色的最附近群集的存储在RAM104上的颜色的直方图频数加1。同样地，使与纹理的向量量化值对应的纹理的最附近群集的存储在RAM104上的纹理的直方图频数加1（以上、图10的步骤S1003）。

接着，判定在RAM104上是否还有与当前的学习用数据对应的每个网格的向量量化值（图10的步骤S1004）。

若步骤S1004的判定为“是”，则返回步骤S1002的处理，对下一向量量化值反复执行步骤S1002和S1003的处理。

在完成对全部的向量量化值的直方图计数、步骤S1004的判定成为“否”时，执行下一处理。算出存储在RAM104中的将全部群集的直方图频数值作为要素值的第1阶层特征向量。更具体地，将颜色的直方图的每个单元条（颜色的全部群集）的各频数值和纹理的直方图的每个单元条（纹理的全部群集）的各频数值连结起来作为各要素值，来生成第1阶层特征向量。将如此生成的与当前的学习用数据对应的第1阶层特征向量存储在RAM104中（以上为图10的步骤S1005）。

之后，判定是否有下一学习用数据（图10的步骤S1006）。

若步骤S1006的判定成为“是”，则返回步骤S1001的处理，并反复步骤S1001到S1005的一系列处理。

在完成对全部学习用数据的直方图生成处理而步骤S1006的判定成为“否”时，结束图10的流程图所示的图7的步骤S704的第1阶层特征向量生成处理（直方图生成处理）。

图11是表示图7的步骤S705的识别器生成处理的流程图。

首先，指定表示多个分类中的要识别的1个分类的范畴（图11的步骤S1101）。

接下来，输入与当前的范畴对应的“1vs其余”识别用的正数据（positive data）和负数据（negative data）。例如，在范畴为花的种类的情况下，将与该种类对应而赋予了步骤S1101指定的1个分类的标签的学习用数据设为正数据。另外，将赋予了该1个分类以外的分类的标签的学习用数据设为负数据。然后，从图1的RAM104读入与设为正数据的各学习用数据对应的各第1阶层特征向量，并将它们设为第1分组。另外，从RAM104读入与设为负数据的各学习用数据对应的各第1阶层特征向量，并将它们设为第2分组（以上为图11的步骤S1102）。

然后，基于在步骤S1102得到的第1阶层特征向量的第1以及第2分组，对步骤S1101中指定的要识别的范畴的1个分类，运算第1阶层识别器中的“1vs其余”识别用参数，以使得与输入属于上述1个分类的数据时输出最大的所述计分值的所述1个分类对应（以上为图11的步骤S1103）。

具体地，例如在这样的第1阶层识别器中，例如输入下述（1）式所示那样的第1阶层特征向量。在此，N是第1阶层特征向量的要素数，例如是颜色的直方图的单元条数与纹理的直方图的单元条数之和的数。另外，x_i（1≦i≦N）例如是依次排列颜色的直方图的单元条编号和纹理的直方图的单元条编号时的第i个单元条编号的直方图频数。

第1阶层特征向量＝（x₁、x₂、x₃、…、x_N）…（1）

如下述（2）式那样，将（1）式的向量的各要素x₁、x₂、x₃、…、x_N分别与个别的权重值c₁、c₂、c₃、…、c_N相乘，输出与该第1阶层识别器对应的计分值f（x），作为该各相乘结果的总和。

f（x）＝c₁x₁＋c₂x₂＋c₃x₃＋…＋c_Nx_N…（2）

这种情况下，在步骤S1103中，算出上述各权重值c₁、c₂、c₃、…、c_N，以使得在将上述第1分组的第1阶层特征向量输入到上述第1阶层识别器时输出最大的计分值，在将上述第2分组的第1阶层特征向量输入到上述第1阶层识别器时输出尽可能小的计分值。

作为该权重值c₁、c₂、c₃、…、c_N的算出方法，例如能采用在机器学习中的线性分类器中使用的被称作线性判别分析的公知的手法。

第1阶层识别器通过使用如此决定的权重值c₁、c₂、c₃、…、c_N来计算上述（2）式，输出计分值。

之后，判定是否指定了与下一分类对应的范畴（图11的步骤S1104）。

若步骤S1104的判定为“是”，则返回步骤S1101的处理，并执行与新的分类的范畴对应的第1阶层识别器的生成处理。

在没有了与未处理的分类对应的范畴而步骤S1104的判定成为“否”时，结束在图11的流程图所示的图7的步骤S705的识别器生成处理。

图12是表示图2的步骤S203的第2阶层识别器生成处理的详细的流程图。

在该流程图中，首先，在图12的步骤S1201中，一边在图1的RAM104上1张份1张份地指定学习用数据，一边执行步骤S1202的处理，直到步骤S1203中判定为没有了要指定的下一学习用数据为止。

在图12的步骤S1202中，将指定的学习用数据输入到在图2的步骤S202生成的各分类的第1阶层识别器。然后，生成将从各第1阶层识别器输出的各计分值设为各要素的第2阶层特征向量（与图3的303对应），并与在步骤S1201指定的学习用数据对应地存储在RAM104中。

通过以上的步骤S1201到S1203的反复处理，对于存储在RAM104的多个学习用数据的每个，在RAM104得到各第2阶层特征向量。之后，在图12的步骤S1204中，从RAM104读出在RAM104得到的第2阶层特征向量中的与赋予了表示1个分类的标签的学习用数据对应的第1的第2阶层特征向量的分组。另外，从RAM104读出与赋予了表示该1个分类以外的分类的标签的学习用数据对应的第2的第2阶层特征向量的分组。然后，基于这些第2阶层特征向量的2个分组来生成与输入属于该1个分类的数据时输出最大的计分值的该1个分类对应的第2阶层识别器。通过按多个分类执行该处理，生成了个别识别各学习用数据所表征的特征是否分别属于所述多个分类的多个第2阶层识别器（与图3的304（＃1）到304（＃4）对应）。

上述步骤S1204的识别器生成处理的详细与表示前述的图7的步骤S705的识别器生成处理的详细的图11相同。这种情况下，在前述的图11的说明中，将第2阶层特征向量替换读作第1阶层特征向量，将第2阶层识别器替换读作第1阶层识别器即可。

即，指定表示多个分类中的要识别的1个分类的范畴（图11的步骤S1101）。

接下来，输入与当前的范畴对应的“1vs其余”识别用的正数据和负数据。例如，在范畴为花的种类的情况下，将赋予了与该种类对应而在步骤S1101指定的1个分类的标签的学习用数据设为正数据。另外，将赋予了该1个分类以外的分类的标签的学习用数据设为负数据。然后，从图1的RAM104读入与设为正数据的各学习用数据对应而在图12的步骤S1201～S1203得到的各第2阶层特征向量，将它们设为第1分组。另外，从RAM104读入与设为负数据的各学习用数据对应而在图12的步骤S1201～S1203得到的各第2阶层特征向量，并将它们设为第2分组（以上为图11的步骤S1102）。

然后，基于在步骤S1102得到的第2阶层特征向量的第1以及第2分组，对在步骤S1101指定的要识别的范畴的1个分类，运算第2阶层识别器中的“1vs其余”识别用参数，以使得与在属于上述1个分类的数据被输入时输出了最大的所述计分值的所述1个分类对应（以上为图11的步骤S1103）。

具体地，例如，在这样的第2阶层识别器中，例如输入下述（3）式所示那样的第2阶层特征向量。在此，X₁、X₂、X₃以及X₄分别是＃1到＃4的各第1阶层识别器（与图3的＃1到＃4的302对应）所输出的各计分值。

第2阶层特征向量＝（X₁，X₂，X₃，X₄）…（3）

如下述（4）式所示那样，将（3）式的向量的各要素X₁、X₂、X₃、X₄分别与个别的权重值C₁、C₂、C₃、C₄相乘，输出与该第1阶层识别器对应的计分值F（x），作为该各相乘结果的总和。

F（x）＝C₁X₁＋C₂X₂＋C₃X₃＋C₄X₄…（4）

这种情况下，在步骤S1103中，算出上述各权重值C₁、C₂、C₃、C₄，以使得在将上述第1分组的第2阶层特征向量输入到上述第2阶层识别器时输出最大的计分值，将上述第2分组的第2阶层特征向量输入到上述第2阶层识别器时输出尽可能小的计分值。

作为该权重值C₁、C₂、C₃、C₄的算出方法，例如能采用在机器学习中的线性分类器中使用的被称作线性判别分析的公知的手法。

第2阶层识别器通过使用如此决定的权重值C₁、C₂、C₃、C₄来计算上述（4）式，来输出计分值。

若步骤S1104的判定成为“是”，则返回步骤S1101的处理，执行与新的分类的范畴对应的第2阶层识别器的生成处理。

在没有了与未处理的分类对应的范畴而步骤S1104的判定成为“否”时，结束图11的流程图所示的图7的步骤S705的识别器生成处理。

下述（5）式表示例如前述的图5所示的、针对图3的＃1到＃4的各第1阶层识别器302所输出的计分值的示例，基于前述的（4）式而生成的识别“牵牛花vs其余”的＃2的第2阶层识别器304（参照图3）的示例。

F（x）＝0.8X₁＋0.9X₂＋0.5X₃－0.5X₄…（5）

另外，下述（6）式表示相对于相同的图5的示例，基于前述的（4）式而生成的识别“旋花vs其余”的＃1的第2阶层识别器304（图3参照）的示例。

F（x）＝0.9X₁＋0.8X₂－0.5X₃－0.5X₄…（6）

如根据上述（5）式以及（6）式所理解那样，在通过识别“旋花vs其余”的＃1的第2阶层识别器304和识别“牵牛花vs其余”的＃2的第2阶层识别器304来构成识别器的成本函数F（X）中，能使与识别“鸭跖草vs其余”的＃3的第1阶层识别器302所输出的计分值X3相乘的权重值C3（参照（4）式）较大地不同。由此，能使用用于识别“鸭跖草vs其余”的＃3的第1阶层识别器302所输出的计分值，在识别“旋花vs其余”的＃1的第2阶层识别器304和识别“牵牛花vs其余”的＃2的第2阶层识别器304之间使识别精度均匀化。

如以上说明那样，根据本实施方式，如图3所示那样，使多分类识别器为2阶层构成，并在第2阶层识别器304中将第1阶层识别器302的全计分值输出作为第2阶层特征向量303进行参照，由此进行识别。由此，即使第1阶层识别器302的一部分的识别器的质量低，也能参照其它的第1阶层识别器302所输出的计分值，由第2阶层识别器304补正误差。由此，即使各分类的学习用数据数少，也能通过总括评价各个分类的第1阶层识别器302所输出的计分值来抑制识别率的降低，在第2阶层识别器304中，各分类的识别率的值能归一化。

在以上说明的实施方式中，将识别的对象作为花的图像来进行了说明，但本发明并不限于此。另外，从图像数据中提取特征信息的处理除了BOF（Bag Of Features，特征袋）的手法以外，例如也可以是通过图割（Graph Cuts）法切出花的区域后再提取特征信息的方式。此外，还能应用各种特征信息提取方式。

进而，在本实施方式中，用以花为代表的图像的识别为例进行了说明，但并不限定于图像，还能应用在音声数据、表征规定特征的数据群的识别中。即，在机器学习中要进行多分类分类的情况下，能应对使分类间的识别性能归一化这样的要求。

Claims

1.一种多分类识别器，识别数据所表征的特征是属于多个分类中的哪个分类，所述多分类识别器的特征在于，具备：

第1阶层识别器生成单元，其生成进行1对N的识别的多个第1阶层识别器；和

第2阶层识别器生成单元，其通过将所述多个第1阶层识别器分别输出的各计分值进行连结来生成第2阶层特征向量，输入该第2阶层特征向量来生成进行1对N的识别的多个第2阶层识别器，

其中，将通过使数据输入到所述多个第1阶层识别器而由该多个第1阶层识别器输出的所述各计分值进行连结来生成所述第2阶层特征向量，将与通过使该第2阶层特征向量输入到所述多个第2阶层识别器而输出了最大的计分值的所述第2阶层识别器相对应的分类，识别为所输入的所述数据所表征的特征所属的分类。

2.根据权利要求1所述的多分类识别器，其特征在于，

所述第1阶层识别器生成单元按所述多个分类的每一个来执行输入从多个学习用数据中分别提取出的各第1阶层特征向量来生成用于识别该各学习用数据所表征的特征是否属于多个分类中的1个分类的第1阶层识别器的处理，由此生成用于个别识别所述各学习用数据所表征的特征是否分别属于所述多个分类的多个第1阶层识别器，

所述第2阶层识别器生成单元按每个所述学习用数据，将通过使所述多个学习用数据输入到所述各分类的第1阶层识别器而由所述各分类的第1阶层识别器输出的各计分值进行连结来生成第2阶层特征向量，按所述多个分类的每一个，来执行输入该各第2阶层特征向量来生成用于识别与该各第2阶层特征向量对应的所述各学习用数据所表征的特征是否属于所述多个分类中的1个分类的第2阶层识别器的处理，由此，生成用于个别识别所述各学习用数据所表征的特征是否分别属于所述多个分类的多个第2阶层识别器。

3.根据权利要求2所述的多分类识别器，其特征在于，

所述特征是图像的特征，

所述第1阶层识别器生成单元执行如下处理：

特征提取处理，对所述多个学习用数据的每一个，执行与所述学习用数据所示的图像内的各网格对应来提取特征信息的处理；

聚类处理，将与全部的所述学习用数据所示的图像内的全部的所述网格对应而提取出的全部的所述特征信息聚类成多个群集；

向量量化处理，对所述多个学习用数据的每一个，按与该学习用数据所示的图像内的所述各网格对应而提取出的所述特征信息来分别算出该特征信息与所述各群集的重心数据的距离，将与该算出的距离中的最小的距离对应的群集作为最附近群集进行提取，将该提取的最附近群集的重心数据设为该特征信息的向量量化值；

第1阶层特征向量生成处理，对所述多个学习用数据的每一个，通过按与该学习用数据所示的图像内的所述各网格对应而提取出的所述向量量化值来反复执行将与该向量量化值对应的所述最附近群集的直方图频数进行累计的处理，来生成与该学习用数据对应的直方图，生成将该直方图的每个单元条的各频数值作为各要素值的所述第1阶层特征向量，并将其与对该学习用数据赋予的表示该学习用数据所表征的特征的分类的标签一起存储；

识别器生成处理，基于所述第1阶层特征向量中的赋予了表示所述1个分类的标签的第一第1阶层特征向量的分组、和赋予了表示所述1个分类以外的分类的标签的第二第1阶层特征向量的分组，通过按所述多个分类的每一个，执行用于生成与在输入了属于所述1个分类的数据时输出最大的所述计分值的所述1个分类对应的第1阶层识别器的处理，由此来生成用于个别识别所述各学习用数据所表征的特征是否分别属于所述多个分类的多个第1阶层识别器。

4.根据权利要求3所述的多分类识别器，其特征在于，

所述特征信息是颜色以及纹理，

在所述聚类处理中，按每个所述颜色以及所述纹理进行个别聚类，

在所述向量量化处理中，按每个所述颜色以及所述纹理，使用分别通过所述聚类而得到的颜色的群集以及纹理的群集来个别提取向量量化值；

在所述第1阶层特征向量生成处理中，按每个所述颜色以及所述纹理，使用分别按每个所述颜色以及所述纹理而提取出的所述向量量化值，个别生成每个所述学习用数据的颜色的直方图以及纹理的直方图，将该颜色的直方图的每个单元条的各频数值与该纹理的直方图的每个单元条的各频数值连结起来作为各要素值，由此生成所述第1阶层特征向量。

5.根据权利要求2所述的多分类识别器，其特征在于，

所述第2阶层识别器生成单元在生成与所述1个分类对应的第2阶层识别器的处理中，基于从赋予了表示所述1个分类的标签的学习用数据中提取出的第一所述第2阶层特征向量的分组、和从赋予了表示所述1个分类以外的分类的标签的学习用数据中提取出的第二所述第2阶层特征向量的分组，生成与在输入了属于所述1个分类的数据时输出最大的所述计分值的所述1个分类对应的第2阶层识别器。

6.一种数据识别装置，识别数据所表征的特征是属于多个分类中的哪个分类，所述数据识别装置的特征在于，具备：

进行1对N的识别的多个第1阶层识别器；

通过将所述多个第1阶层识别器分别输出的各计分值进行连结来生成第2阶层特征向量的第2阶层特征向量生成单元；和

输入所述第2阶层特征向量来进行1对N的识别的多个第2阶层识别器，

其中，由所述第2阶层特征向量生成单元将通过使数据输入到所述多个第1阶层识别器而由该多个第1阶层识别器输出的所述各计分值进行连结，来生成所述第2阶层特征向量，将与通过使该第2阶层特征向量输入到所述多个第2阶层识别器而输出了最大的计分值的所述第2阶层识别器对应的分类，识别为所输入的所述数据所表征的特征所属的分类。

7.一种多分类识别方法，识别数据所表征的特征是属于多个分类中的哪个分类，所述多分类识别方法的特征在于，具备：

第1阶层识别器生成步骤，生成进行1对N的识别的多个第1阶层识别器；和

第2阶层识别器生成步骤，通过将所述多个第1阶层识别器分别输出的各计分值进行连结来生成第2阶层特征向量，输入该第2阶层特征向量来生成进行1对N的识别的多个第2阶层识别器，

将通过使数据输入到所述多个第1阶层识别器而由该多个第1阶层识别器输出的所述各计分值进行连结来生成所述第2阶层特征向量，将与通过使该第2阶层特征向量输入到所述多个第2阶层识别器而输出了最大的计分值的所述第2阶层识别器对应的分类，识别为所输入的所述数据所表征的特征所属的分类。

8.一种数据识别方法，识别数据所表征的特征是属于多个分类中的哪个分类，所述数据识别方法的特征在于，具备：

多个第1阶层识别步骤，进行1对N的识别；

第2阶层特征向量生成步骤，通过将所述多个第1阶层识别步骤分别输出的各计分值进行连结来生成第2阶层特征向量；和

多个第2阶层识别步骤，输入所述第2阶层特征向量来进行1对N的识别，

由所述第2阶层特征向量生成步骤将通过使数据输入到所述多个第1阶层识别步骤而由该多个第1阶层识别步骤输出的所述各计分值进行连结来生成所述第2阶层特征向量，将与通过使该第2阶层特征向量输入到所述多个第2阶层识别步骤而输出了最大的计分值的所述第2阶层识别步骤对应的分类，识别为所输入的所述数据所表征的特征所属的分类。