CN107403186B - 类估计设备和类估计方法 - Google Patents

类估计设备和类估计方法 Download PDF

Info

Publication number
CN107403186B
CN107403186B CN201611128941.9A CN201611128941A CN107403186B CN 107403186 B CN107403186 B CN 107403186B CN 201611128941 A CN201611128941 A CN 201611128941A CN 107403186 B CN107403186 B CN 107403186B
Authority
CN
China
Prior art keywords
class
probability table
data
image data
tree structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611128941.9A
Other languages
English (en)
Other versions
CN107403186A (zh
Inventor
尾崎良太
坪下幸宽
加藤典司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Publication of CN107403186A publication Critical patent/CN107403186A/zh
Application granted granted Critical
Publication of CN107403186B publication Critical patent/CN107403186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种类估计设备。数据接收单元接收数据的特征量的输入。识别器接收单元接收具有树结构的识别器的输入。表存储单元将概率表和特征量表存储在树结构的叶节点中。概率表校正单元校正概率表。类估计单元估计数据的类。

Description

类估计设备和类估计方法
技术领域
本发明涉及一种类估计(class estimation)设备和一种类估
计方法。
背景技术
非专利文件1公开了以下方法作为用于重建树结构识别器的方法:更新叶统计(ULS),其为仅更新叶节点的概率表的方法;递增生长树(IGT),其为将叶节点视为父节点并且添加新的分支条件的方法;重新训练子树(RTST),其为新创建一部分叶节点的父节点的分支条件、随后将叶节点视为父节点并且添加新的分支条件的方法;以及重新使用子树(RUST),其为向一部分叶节点的父节点的分支条件中添加条件、随后将叶节点视为父节点并且添加新的分支条件的方法。
专利文件1公布了一种图像识别信息分配设备,其包括:计算单元,其用于计算关于从目标图像中选择的部分区域的第一特征向量;以及分配单元,其为基于针对学习图像的部分区域计算出的第二特征向量和针对所有学习图像分配的第二识别信息、使用决策树组来将表示目标图像的内容的第一识别信息分配给该目标图像的单元,所述分配单元通过将这样的比率乘以第二识别信息的先验概率来确定和分配第一识别信息,所述比率为:根据似然函数相乘获得的结果与根据第一特征向量的先验概率相乘获得的结果之比,其中根据在第二特征向量组和第二识别信息组被发送至决策树组时到达决策树组的各个叶的第二识别信息的条数与总数目之比来计算所述似然函数。
专利文件1:JP-A-2012-042990
非专利文件1:M.Ristin,M.Guillaumin,J.Gall和L.V.Gool,“用于大规模图像分类的NCM森林的递增学习(Incremental Learning of NCM Forests for Large-ScaleImage Classification)”,CVPR,2014
在使用具有树结构的识别器对所属类(belonging class)未知的数据的所属类进行估计的处理中,在由于类的添加等而使目标类改变的情况下,为了处理改变的类,需要通过再次执行学习来重建识别器。当致力于简单地重建识别器时,可以想到重新重建树结构;然而,在这种情况下需要重新创建所有的分支条件,因此花费较长时间。
关于能够通过仅更新概率表而不重建树结构来减少重建识别器所需的时间的ULS,提出了估计精确度有所改善的IGT、RTST和RUST;然而,在所有这些方法中,由于重新创建分支条件以将叶节点视为父节点,因此需要创建树结构的分支条件的时间。
发明内容
本发明的目的在于当重建识别器时在没有重新创建树结构的分支条件的情况下将估计精确度提高至大于在使用ULS的情况下的精确度。
根据第一方面,提供了一种类估计设备,其包括:数据接收单元,其接收数据的特征量的输入;识别器接收单元,其接收具有树结构的识别器的输入;表存储单元,其将概率表和特征量表存储在树结构的叶节点中;概率表校正单元,其校正概率表;以及类估计单元,其估计数据的类。
第二方面是根据第一方面的类估计设备,其中校正单元可使用特征量表的值来校正概率表。
第三方面是根据第二方面的类估计设备,其中校正单元可使用根据概率表的值计算出的似然度和根据输入数据的特征量和特征量表的值计算出的距离来校正概率表。
第四方面是根据第二方面的类估计设备,其中校正单元可使用根据输入数据的特征量和特征量表的值计算出的概率密度来校正概率表。
第五方面是根据第一至第四方面中任一方面的类估计设备,并且还包括在树结构的叶节点中存储重要度的重要度存储单元。
根据第六方面,提供了一种程序,其使得计算机执行:数据接收步骤,其接收数据的特征量的输入;识别器接收步骤,其接收具有树结构的识别器的输入;表存储步骤,其将概率表和特征量表存储在树结构的叶节点中;以及概率表校正步骤,其校正概率表;以及类估计步骤,其估计数据的类。
根据第一方面,能够在重建识别器时在没有新创建树结构的分支条件的情况下提高估计的精确度,使其大于在使用ULS的情况下的精确度。
根据第二方面,能够在重建识别器时在没有新创建树结构的分支条件的情况下提高估计的精确度,使其大于在使用ULS的情况下的精确度。
根据第三方面,能够在重建识别器时在没有新创建树结构的分支条件的情况下提高估计的精确度,使其大于在使用ULS的情况下的精确度。
根据第四方面,能够在重建识别器时在没有新创建树结构的分支条件的情况下提高估计的精确度,使其大于在使用ULS的情况下的精确度。
根据第五方面,能够在校正概率表的时候提高具有高重要度的叶节点的影响。
根据第六方面,能够在重建识别器时在没有新创建树结构的分支条件的情况下提高估计的精确度,使其大于在使用ULS的情况下的精确度。
附图说明
基于以下附图将详细描述本发明的示例性实施例,其中:
图1是示出根据示例性实施例的类估计设备中的处理的基本配置的概念图;
图2是示出根据示例性实施例的类估计设备中的处理的示例的流程图;
图3是示出作为先前学习数据的树结构识别器的概念图;
图4是示出使用现有技术的方法重建的树结构识别器的概念图;以及
图5是示出由根据示例性实施例示出的类估计设备创建的树结构识别器的概念图。
具体实施方式
在下文中,将详细描述用于实现本发明的示例性实施例。然而,将要在下文中描述的示例性实施例表示用于实施本发明的技术构思的类估计设备的示例,但是本发明不旨在限制示例性实施例,并且本发明等同地适用于在不脱离权利要求中公开的技术构思的情况下而进行各种修改的示例性实施例。
根据示例性实施例的类估计设备设置有:向其输入数据的特征量的数据接收单元;向其输入具有树结构的识别器的识别器接收单元;将概率表和特征量表存储在树结构的叶节点中的表存储单元;对概率表进行校正的概率表校正单元;以及将所属类未知的数据的所属类的估计结果输出的类估计单元。在一些示例性实施例中,采用分类器作为识别器的具体示例。
将参照图1和图2描述示例性实施例的处理的流程。图1示出了根据示例性实施例的类估计设备中的基本处理的流程,并且图2示出了在使用图像数据作为学习数据的情况下的更详细的处理的示例。
【先前学习数据存储步骤】
在先前学习数据存储步骤S1中,将预先创建的树结构识别器输入至识别器接收单元,并且将创建树结构识别器时的学习数据和每个数据项所属的类输入至数据接收单元。它们被存储为先前学习数据。
可以使用任何类型的数据作为学习数据,但是使用了M维向量数据。例如,如果存在图像数据,那么将从每个图像中提取的颜色的特征量、边缘信息等设置为学习数据,并且将预先分配给每个图像的标签设置为学习数据所属的类。此时,可以从一个图像中提取多个特征量。这里,可使用通过采取深度学习方法预先从大量图像进行学习而创建的特征提取器来提取所述特征量。
另外,如果存在声音数据,那么将从每个声音中提取的音素的频率分量信息的特征量等设置为学习数据,并且将预先分配给每个声音的标签(说话的人、话语等)设置为学习数据所属的类。
此外,如果存在文本数据,那么将从每个文本中提取的以单词作为向量的特征向量等设置为学习数据,并且将预先分配给每个文本的标签(文件的类型、极性等)设置为学习数据所属的类。
先前学习数据内存储的树结构识别器配置有根节点、内部节点和叶节点,所述树结构识别器是这样一种识别器,在其中根节点和内部节点成为分支条件,并且叶节点具有概率表(属于叶节点的类与数据项数量的对(pair)),并且存在由一个决策树、随机森林(RandomForest)、AdaBoost、梯度提升决策树等构成的装置作为该识别器。此外,关于分支条件,在随机森林的情况下,根据学习过程中的熵和Gini系数来确定为每个内部节点选择的向量的维度和阈值。在值是阈值或者低于阈值的情况下,树结构识别器追踪至右节点,并且,在值大于阈值的情况下,树结构识别器追踪至左节点。另外,还可将稍后描述的特征量表包括在叶节点中。
【用于重建的数据的存储步骤】
在用于重建的数据的存储步骤S2中,将先前学习数据存储步骤中存储的先前学习数据和执行添加和修改的学习数据和每个数据项所属的类输入至数据接收单元,并存储用于重建的数据。
作为用于重建的数据,存在学习数据项的总数目、每个类的学习数据项的数目、用于重建的学习数据及其类、用于更新的识别器等。作为用于重建的学习数据,全部学习数据可以是目标,并且在添加类或者数据的情况以及先前学习数据内的识别器是包括概率表和特征量表的识别器的情况下,只有要添加的学习数据可以是目标。
在用于更新的识别器中,在更新时使用全部数据的情况下,针对先前学习数据内预先创建的树结构识别器,重置概率表。此外,在添加类或者数据的情况下,并且在先前学习数据内的识别器是包括概率表和特征量表的识别器的情况下,概率表或者特征量表可保持原样。
在识别器是随机森林等的情况下,用于重建的学习数据可执行随机抽样,并且在预先创建的树结构识别器是多个的情况下,可创建直到相同数目为止的用于重建的学习数据和用于更新的识别器。
【识别器重建步骤】
在识别器重建步骤S3中,在输入用于重建的数据后,使用用于重建的学习数据和每个数据项所属的类来更新用于更新的识别器的叶节点,并且当通过表存储单元将概率表和特征量表保存在叶节点中时,可重建更新后的树结构识别器,其中概率表和特征量表被包括在叶节点中。
特征量表成为属于叶节点的类与特征量信息的对。例如,特征量信息是属于叶节点的学习数据的每一类的平均值、方差值、中间值、标准偏差值、最小值和最大值等。此外,只使用学习数据的一部分维度(比如,只使用被用作叶节点的父节点的分支条件的维度,只使用被用作从根节点至叶节点的内部节点的分支条件的维度,以及只使用被随机选择的维度),计算每个类中的平均值、方差值、中间值、标准偏差值、最小值和最大值等,并且这些可成为特征量信息。并且,由于概率表和特征量表是同样的数目,所以可将这些表总结为一张表。表1是正常的概率表的示例,并且在表2中示出了特征量表与所述概率表被总结为一张表的示例。
【表1】
类名 数据的数目
类1 8
类2 3
【表2】
类名 数据的数目 平均值 方差值
类1 8 0.5 0.05
类2 3 0.2 0.01
【所属叶节点数据的获取步骤】
在所属叶节点数据的获取步骤S4中,输入作为类估计的目标且所属类未知的数据以及更新后的树结构识别器,搜索该所属类未知的数据所属的叶节点,并且获得以下作为叶节点数据:所述数据在到达叶节点之前穿过的内部节点、分支条件、叶节点的概率表和特征量表。并且,在根据示例性实施例的分数估计装置中,还可提供用于存储叶节点的重要度的重要度存储单元,并且在这种情况下,如有需要,重要度可以包括在叶节点数据中。
可使用重要度以便进一步提高估计分数的精确度,可使用用于设置所述数据在到达叶节点之前穿过的内部节点的各个分支条件的熵和Gini系数的减少值的平均值、中间值等,并且可使用从叶节点到回溯的任意内部节点的减少值。
【概率表校正步骤】
在概率表校正步骤S5中,在概率表校正单元中,输入所属类未知的数据、所属叶节点数据和用于重建的数据,并且利用所属类未知的数据、在到达叶节点之前穿过的内部节点、分支条件和特征量表来校正概率表。
例如,在将识别器用作随机森林,并且将用作叶节点的父节点的分支条件的维度的平均值和方差值设置为特征量信息的情况下,当将用于重建的学习数据的项数设置为N时,将类设置为(C1,...,和Cc),将每一类用于重建的学习数据的项数设置为(N1,...,和Nc),将类未知的数据设置为X(X1,...,和XM),将用于父节点的分支条件的维度设置为D,将叶节点内的类设置为(C1,C3和Cc),将其数目设置为(P1,P3和Pc),将其平均值设置为(M1,M3和Mc),将其方差值设置为(V1,V3和Vc),并且将概率表和特征量表结合的表设置为{(C1,P1,M1和V1),(C3,P3,M3和V3)和(Cc,Pc,Mc和Vc)},可执行校正如下。另外,在没有通过校正模式1执行校正的情况下,应用校正模式2,因此可通过彼此组合来使用校正模式1和校正模式2。
(校正模式1):当似然函数P(X|C)最大的类与包括从类未知的数据的距离dc最短的平均值的类相同时,将除该类之外的类的数据的项数设置为0。
【表达式1】
Figure BDA0001175735680000081
Figure BDA0001175735680000082
例如,在argmaxn∈{1,2,c}(P(X|Cn))=argminn∈{1,2,c}(dn)={1}的情况下,p1'为P1,P2'为0,并且Pc'为0。
(校正模式2):计算每个类的概率密度fn,基于计算的密度校正叶内的每个类的数据的项数,从而校正概率表。
【表达式2】
Figure BDA0001175735680000083
Figure BDA0001175735680000084
Figure BDA0001175735680000085
Figure BDA0001175735680000086
或者,P1'可为f1P1,P2'可为f2P2,并且Pc'可为fcPc
在校正概率表时,例如,可为叶节点的重要度的值设置任意阈值,并且将重要度用于诸如选择要校正的概率表或者将概率表乘以重要度的值,从而能够进一步提高估计分数的精确度。
【估计分数计算步骤】
在估计分数计算步骤S6中,输入类未知的数据、经校正的概率表和用于重建的学习数据,并且根据每个类的后验概率计算每个类的估计分数。
例如,当将全部学习数据项的总数设置为A,将类C的学习数据的项数设置为Ac,将用于重建的学习数据的总数设置为N,将类C的用于重建的学习数据的项数设置为Nc,将概率表内的数据的总数设置为P,并且将概率表内的对应于类C的值设置为Pc时,能够利用似然函数对类C相对于类未知的数据X的后验概率进行如下定义。
【表达式3】
Figure BDA0001175735680000091
Figure BDA0001175735680000092
估计分数SC可使用这样的后验概率P(C|X),并且可被定义为以下所述的表达式。
【表达式4】
Figure BDA0001175735680000093
另外,可为P(C|X)和
Figure BDA0001175735680000094
的值设置下限值。
在识别器是随机森林并且由T个树结构识别器构成的情况下,根据各个树结构识别器的概率表的平均值按照以下表达式计算似然函数。
【表达式5】
Figure BDA0001175735680000101
Figure BDA0001175735680000102
Figure BDA0001175735680000103
在从图像中提取数据的特征量等中,在从一个目标中提取M个数据项的情况下,将类未知的数据设置为(X1,...,和XM),并且可通过如下表达式定义关于类未知的数据Xi的类C的后验概率。
【表达式6】
Figure BDA0001175735680000104
Figure BDA0001175735680000105
可按照与从一个目标中提取一个数据项的情况下的方式相同的方式获得P(Xi)、P(Xi|C)和
Figure BDA0001175735680000107
作为估计分数SC,可使用这样的后验概率P(C|X1,...,和XM),并且可通过以下表达式进行定义。
【表达式7】
Figure BDA0001175735680000106
【估计结果输出步骤】
在估计结果输出步骤S7中,在类估计单元中,输入所属类未知的数据和各个类的估计分数,输出类未知的数据的类作为估计结果。关于类估计,例如,估计分数为最高的类可为估计结果,估计分数等于或者高于预设阈值的类可为估计结果,并且如果所有的分数等于或者低于阈值,那么可输出不存在类的结果。
然后,关于概率表的校正,将使用图3中示出的20个类1的数据、10个类2的数据和树结构识别器的情况的具体示例作为先前学习数据,并且将描述向其添加的10个类3的数据。
首先,在使用现有技术的方法的IGT的情况下,在通过添加类3而重建之后的树结构识别器成为例如图4所示的那样。这里,在先前学习数据的树结构识别器中的叶节点1和叶节点4中,新添加分支条件从而形成内部节点,并且重建为包括全部六个叶节点的识别器。
然后,在图5中示出了通过示例性实施例重建之后的树结构识别器。并且,图5示出了结合概率表和特征量表的示例。在示例性实施例中,特征量表存储在每个叶节点中,但是不向叶节点新添加分支条件,因此树结构识别器的结构与图3中的一样,即为先前学习数据的树结构识别器的结构。
这里,将如下描述对作为所属类未知的数据的五维向量X(0.5,0.7,0.4,0.5和0.3)数据执行类估计的情况。
(使用现有技术的方法中的IGT的情况)
树结构识别器(图4中示出的识别器)从根节点处开始,并且追踪至右子节点,因为在根节点的分支中特征维度的第二维度是0.7(即,大于阈值0.6)。在下一个分支中,由于特征维度的第五维度是0.3(>0.2)并且穿过所谓右子节点的根,并且特征维度的第一维度是0.5(>0.4),因此最终,确定其属于包括所谓{(类3和6)}的概率表的叶节点6。
(使用根据示例性实施例的类估计设备的情况)
在图5中示出所述树结构识别器,其从根节点处开始,由于特征维度的第二维度是0.7(>0.6),并且通过右子节点,并且特征维度的第五维度是0.3(>0.2),因此首先,确定其属于叶节点4。
叶节点4包括所谓{(类1和9),(类3和6)}的概率表,并且随后校正概率表。
这里,由于似然函数是P(X|类1)=9/20,P(X|类3)=6/10,因此似然函数最大的类为“类3”。
此外,由于被选择为父节点中的分支条件的特征维度是第五维度,所以当计算数据X的第五维度与叶节点的特征量表的平均值之间的距离时候,类1的d=(0.3-0.8)2的平方根是0.5,并且类3的d=(0.3-0.4)2的平方根是0.1。因此,距离最短的类成为“类3”。
由于通过应用校正模型1将类1的数据的项数校正为0,所以校正之后的叶节点4的概率表变为{(类1和0),(类3和6)},移除数据的项数变为0的类1,并且叶节点4的概率表最终校正为{(类3和6)}。如上所述,在当前数据X中,使用根据示例性实施例的方法,在不添加树结构的分支条件的情况下,使用与现有技术的方法的IGT类似的概率表来执行估计。
【示例】
【重建识别器所需的时间的比较】
通过对识别器的时间和估计精确度与现有技术的方法的时间和估计精确度进行比较来进行评估。利用在图像识别的标准检查程序(benchmark)中大量使用的VOC 2007,对于10个类的数据(用于学习的图像:5011张)和根据数据创建的随机森林,通过添加10个类(用于评估的图像:4952张),测量重建识别器所需的时间并且评估估计精确度,从而计算出在使用所获得的识别器的情况下的平均精度均值(MAP:Mean Average Precision)(各个召回率等级(recalling ratio levels)(0.1至1.0的范围内的每0.1等级)处的各精度的平均在所有类中的平均值)。
作为示例,当使用这样的在10个类中创建的随机森林并且更新全部学习数据中的概率表和特征量表的时候,将重建识别器和将随机森林新重建为20个标签相比较作为比较示例1。关于MAP值,在根据示例性实施例的分数估计装置中,将不校正概率表的情况(对应于现有技术的方法的ULS)设置为比较示例2。表3中示出了MAP值的比较,并且表4中示出了识别器的重建时间。
【表3】
Figure BDA0001175735680000131
【表4】
重建时间(秒)
示例 51
比较示例1 73,348
在示例性实施例的类估计设备中,如表3所见,可将估计精确度提高至大于ULS中的估计精确度。
此外,如表4中所示,将重建识别器所需的时间与新创建识别器的情况相比,可知时间大幅地缩短了。由于在示例性实施例的类估计设备中没有创建新的分支条件,所以重建识别器所需的时间与现有技术的方法中的ULS的时间基本相同。
为了示出和描述的目的提供了本发明的示例性实施例的前述描述。其非意在穷举或者将本发明限制为所公开的精确形式。显然,很多修改和变型对于本领域技术人员而言将是显而易见的。选择并描述实施例是为了最好地解释本发明的原理及其实际应用,从而使得本领域的其他技术人员能够针对各种实施例及适用于预期的特定用途的各种修改来理解本发明。意在通过所附的权利要求及其等同物限定本发明的范围。

Claims (4)

1.一种类估计设备,包括:
数据接收单元,其接收包括特征量的图像数据的输入;
识别器接收单元,其接收具有树结构的识别器的输入;
表存储单元,其将概率表和特征量表存储在所述树结构的叶节点中;
概率表校正单元,其校正所述概率表;
其中,输入作为类估计的目标且所属类别未知的图像数据,搜索所述输入的图像数据所属的叶节点,所述概率表校正单元还包括校正所述输入的图像数据所属的叶节点的概率表,其中,
当根据概率表的值计算的似然函数最大的类和根据所述输入的图像数据的特征量与所述特征量表的值计算出的距离最短的类相同时,将除所述似然函数最大且所述距离最短的类之外的类的图像数据的项数设置为零;以及
类估计单元,其通过概率表校正单元校正的概率表估计所述图像数据的类。
2.根据权利要求1所述的类估计设备,其中,所述校正单元使用根据输入图像数据的特征量和所述特征量表的值计算出的概率密度来校正所述概率表。
3.根据权利要求1或2所述的类估计设备,还包括:重要度存储单元,其在所述树结构的叶节点中存储重要度。
4.一种类估计方法,包括步骤:
接收包括特征量的图像数据的输入;
接收具有树结构的识别器的输入;
将概率表和特征量表存储在所述树结构的叶节点中;
校正所述概率表;
其中,输入作为类估计的目标且所属类别未知的图像数据,搜索所述输入的图像数据所属的叶节点,校正所述概率表还包括校正所述输入的图像数据所属的叶节点的概率表,其中,
当根据概率表的值计算的似然函数最大的类和根据所述输入的图像数据的特征量与所述特征量表的值计算出的距离最短的类相同时,将除所述似然函数最大且所述距离最短的类之外的类的图像数据的项数设置为零;以及
使用所述校正的概率表估计所述图像数据的类。
CN201611128941.9A 2016-05-20 2016-12-09 类估计设备和类估计方法 Active CN107403186B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016101232A JP6687894B2 (ja) 2016-05-20 2016-05-20 クラス推定装置及びプログラム
JP2016-101232 2016-05-20

Publications (2)

Publication Number Publication Date
CN107403186A CN107403186A (zh) 2017-11-28
CN107403186B true CN107403186B (zh) 2022-02-01

Family

ID=57396250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611128941.9A Active CN107403186B (zh) 2016-05-20 2016-12-09 类估计设备和类估计方法

Country Status (4)

Country Link
US (1) US10303985B2 (zh)
EP (1) EP3246853A1 (zh)
JP (1) JP6687894B2 (zh)
CN (1) CN107403186B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11017324B2 (en) * 2017-05-17 2021-05-25 Microsoft Technology Licensing, Llc Tree ensemble explainability system
EP3709229A1 (en) * 2019-03-13 2020-09-16 Ricoh Company, Ltd. Learning device and learning method
US11734259B2 (en) 2019-05-31 2023-08-22 International Business Machines Corporation Anonymous database rating update
US11569996B2 (en) * 2019-05-31 2023-01-31 International Business Machines Corporation Anonymous rating structure for database
JP6795240B1 (ja) * 2020-06-17 2020-12-02 株式会社エイシング 制御装置、方法及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7464068B2 (en) * 2004-06-30 2008-12-09 International Business Machines Corporation System and method for continuous diagnosis of data streams
CN101615789A (zh) * 2008-06-23 2009-12-30 上海申瑞电力科技股份有限公司 广域量测系统追踪状态估计方法
US20110235901A1 (en) * 2010-03-23 2011-09-29 Yi Hu Method, apparatus, and program for generating classifiers
US20120039541A1 (en) * 2010-08-12 2012-02-16 Fuji Xerox Co., Ltd. Computer readable medium storing program, image identification information adding apparatus, and image identification information adding method
US20120072469A1 (en) * 2010-09-22 2012-03-22 Perez Albert R Methods and apparatus to analyze and adjust demographic information
US8819016B2 (en) * 2009-01-30 2014-08-26 Fujitsu Limited Apparatus, method, and program for structuring visualization object data; and apparatus, method, and program for visualizing visualization object data

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930392A (en) * 1996-07-12 1999-07-27 Lucent Technologies Inc. Classification technique using random decision forests
US6058205A (en) * 1997-01-09 2000-05-02 International Business Machines Corporation System and method for partitioning the feature space of a classifier in a pattern classification system
US6353814B1 (en) * 1997-10-08 2002-03-05 Michigan State University Developmental learning machine and method
US6532305B1 (en) * 1998-08-04 2003-03-11 Lincom Corporation Machine learning method
US6519580B1 (en) * 2000-06-08 2003-02-11 International Business Machines Corporation Decision-tree-based symbolic rule induction system for text categorization
US6718315B1 (en) * 2000-12-18 2004-04-06 Microsoft Corporation System and method for approximating probabilities using a decision tree
JP3896868B2 (ja) * 2002-02-27 2007-03-22 日本電気株式会社 パターンの特徴選択方法及び分類方法及び判定方法及びプログラム並びに装置
US7941462B2 (en) * 2008-09-24 2011-05-10 Toshiba Medical Visualization Systems Europe, Limited Method and apparatus for classification of coronary artery image data
KR101068465B1 (ko) * 2009-11-09 2011-09-28 한국과학기술원 삼차원 물체 인식 시스템 및 방법
JP5675214B2 (ja) * 2010-08-18 2015-02-25 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US9077958B2 (en) * 2010-08-30 2015-07-07 Honda Motor Co., Ltd. Road departure warning system
US8860715B2 (en) * 2010-09-22 2014-10-14 Siemens Corporation Method and system for evaluation using probabilistic boosting trees
US8953888B2 (en) * 2011-02-10 2015-02-10 Microsoft Corporation Detecting and localizing multiple objects in images using probabilistic inference
US8744172B2 (en) * 2011-06-15 2014-06-03 Siemens Aktiengesellschaft Image processing using random forest classifiers
US8712931B1 (en) * 2011-06-29 2014-04-29 Amazon Technologies, Inc. Adaptive input interface
US8954365B2 (en) * 2012-06-21 2015-02-10 Microsoft Corporation Density estimation and/or manifold learning
US9218524B2 (en) * 2012-12-06 2015-12-22 Siemens Product Lifecycle Management Software Inc. Automatic spatial context based multi-object segmentation in 3D images
US10235605B2 (en) * 2013-04-10 2019-03-19 Microsoft Technology Licensing, Llc Image labeling using geodesic features
EP2849099B1 (en) * 2013-09-11 2021-07-28 Dassault Systèmes A computer-implemented method for designing an industrial product modeled with a binary tree.
US9558396B2 (en) * 2013-10-22 2017-01-31 Samsung Electronics Co., Ltd. Apparatuses and methods for face tracking based on calculated occlusion probabilities
JP6226701B2 (ja) * 2013-11-05 2017-11-08 キヤノン株式会社 データ処理方法及び装置、データ識別方法及び装置、プログラム
CN104809325B (zh) * 2014-01-26 2018-06-01 国际商业机器公司 用于检测事件日志和过程模型之间的区别的方法和装置
US10347042B2 (en) * 2014-03-13 2019-07-09 Pixar Importance sampling of sparse voxel octrees
US9916356B2 (en) * 2014-03-31 2018-03-13 Sandisk Technologies Llc Methods and systems for insert optimization of tiered data structures
US9805248B2 (en) * 2014-08-29 2017-10-31 Definiens Ag Applying pixelwise descriptors to a target image that are generated by segmenting objects in other images
EP3035235B1 (en) * 2014-12-17 2023-07-19 Exipple Studio, Inc. Method for setting a tridimensional shape detection classifier and method for tridimensional shape detection using said shape detection classifier
EP3136293A1 (en) * 2015-08-28 2017-03-01 Thomson Licensing Method and device for processing an image of pixels, corresponding computer program product and computer readable medium
US20170083920A1 (en) * 2015-09-21 2017-03-23 Fair Isaac Corporation Hybrid method of decision tree and clustering technology

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7464068B2 (en) * 2004-06-30 2008-12-09 International Business Machines Corporation System and method for continuous diagnosis of data streams
CN101615789A (zh) * 2008-06-23 2009-12-30 上海申瑞电力科技股份有限公司 广域量测系统追踪状态估计方法
US8819016B2 (en) * 2009-01-30 2014-08-26 Fujitsu Limited Apparatus, method, and program for structuring visualization object data; and apparatus, method, and program for visualizing visualization object data
US20110235901A1 (en) * 2010-03-23 2011-09-29 Yi Hu Method, apparatus, and program for generating classifiers
US20120039541A1 (en) * 2010-08-12 2012-02-16 Fuji Xerox Co., Ltd. Computer readable medium storing program, image identification information adding apparatus, and image identification information adding method
US20120072469A1 (en) * 2010-09-22 2012-03-22 Perez Albert R Methods and apparatus to analyze and adjust demographic information

Also Published As

Publication number Publication date
US20170337450A1 (en) 2017-11-23
US10303985B2 (en) 2019-05-28
CN107403186A (zh) 2017-11-28
JP2017208004A (ja) 2017-11-24
EP3246853A1 (en) 2017-11-22
JP6687894B2 (ja) 2020-04-28

Similar Documents

Publication Publication Date Title
CN107403186B (zh) 类估计设备和类估计方法
JP4618098B2 (ja) 画像処理システム
CN108268539A (zh) 基于文本分析的视频匹配系统
US9842279B2 (en) Data processing method for learning discriminator, and data processing apparatus therefor
CN112784929B (zh) 一种基于双元组扩充的小样本图像分类方法及装置
CN110019779B (zh) 一种文本分类方法、模型训练方法及装置
US11462210B2 (en) Data collecting method and system
CN106897265B (zh) 词向量训练方法及装置
JP5523543B2 (ja) 共学習に基づく概念認識方法および概念認識装置
CN107180084A (zh) 词库更新方法及装置
Lin et al. Fairgrape: Fairness-aware gradient pruning method for face attribute classification
JP2014228995A (ja) 画像特徴学習装置、画像特徴学習方法及びプログラム
CN109902167B (zh) 嵌入结果的解释方法和装置
Feng et al. Learning an invariant and equivariant network for weakly supervised object detection
US20170039484A1 (en) Generating negative classifier data based on positive classifier data
CN111950579A (zh) 分类模型的训练方法和训练装置
WO2016181474A1 (ja) パターン認識装置、パターン認識方法およびプログラム
JP6375706B2 (ja) 属性推定プログラム及び情報処理装置
KR102123973B1 (ko) 학습 안정화를 위한 생성적 적대 신경망 방법 및 장치
US20210365719A1 (en) System and method for few-shot learning
JP6601965B2 (ja) 探索木を用いて量子化するプログラム、装置及び方法
CN114004233A (zh) 一种基于半训练和句子选择的远程监督命名实体识别方法
CN107977360B (zh) 一种影视剧本中人物阵营的识别和划分方法
CN110162629B (zh) 一种基于多基模型框架的文本分类方法
CN112463964A (zh) 文本分类及模型训练方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Tokyo, Japan

Applicant after: Fuji film business innovation Co.,Ltd.

Address before: Tokyo, Japan

Applicant before: Fuji Xerox Co.,Ltd.

GR01 Patent grant
GR01 Patent grant