CN104281569A - 构建装置和方法、分类装置和方法以及电子设备 - Google Patents

构建装置和方法、分类装置和方法以及电子设备 Download PDF

Info

Publication number
CN104281569A
CN104281569A CN201310270851.3A CN201310270851A CN104281569A CN 104281569 A CN104281569 A CN 104281569A CN 201310270851 A CN201310270851 A CN 201310270851A CN 104281569 A CN104281569 A CN 104281569A
Authority
CN
China
Prior art keywords
mrow
features
classifier
msup
msubsup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310270851.3A
Other languages
English (en)
Other versions
CN104281569B (zh
Inventor
李斐
刘汝杰
石原正树
马场孝之
上原祐介
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201310270851.3A priority Critical patent/CN104281569B/zh
Publication of CN104281569A publication Critical patent/CN104281569A/zh
Application granted granted Critical
Publication of CN104281569B publication Critical patent/CN104281569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了构建装置和方法、分类装置和方法以及电子设备,以克服传统的分类技术由于没有利用样本的多种特征之间的联系而导致最终的分类性能较差的问题。上述构建装置包括:提取训练样本的多种特征的第一提取单元;以及基于提取的多种特征来训练分类器的构建单元。构建单元在训练时考虑如下第一约束:在与多种特征中的一种特征有关的分类器对训练样本的分类结果的可信度高于第一预定程度的情况下,若与多种特征中的其他一种或其他多种特征有关的分类器对训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与上述其他一种或其他多种特征有关的分类器对训练样本的分类结果的惩罚。本发明的上述技术能够应用于信息处理领域。

Description

构建装置和方法、分类装置和方法以及电子设备
技术领域
本发明涉及信息处理领域,尤其涉及构建装置和方法、分类装置和方法以及电子设备。
背景技术
随着信息技术的发展,信息处理逐渐成为人们工作、生活中一个热门的研究领域。在信息处理技术中,需要处理的样本往往可以采用多种特征进行描述。例如,网络上的图像可以使用颜色/纹理特征来描述,也可以使用文本标注进行描述;视频片段可以使用视觉、听觉以及字幕信息进行描述;植物可以使用花瓣和叶片的特征进行描述。
在传统的分类技术(诸如模式识别)等处理中,可以分别基于样本的各种特征构建多个基本分类器,然后对多个基本分类器的输出往往采用一种线性组合的方式来得到最终的分类结果。在以上处理过程中,传统的分类技术没有考虑各种特征之间的联系而得到最终的分类结果,也就是说,当基于某一种特征构建分类器的时候,没有利用基于其它特征构建的分类器提供的任何信息。因此,传统的分类技术由于在构建分类器(或者利用构建的分类器进行分类)的过程中没有利用样本的多种特征之间的联系而导致最终的分类性能较差。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于此,本发明提供了构建装置和方法、分类装置和方法以及电子设备,以至少解决传统的分类技术由于没有利用样本的多种特征之间的联系而导致最终的分类性能较差的问题。
根据本发明的一个方面,提供了一种用于构建分类器的构建装置,该构建装置包括:第一提取单元,其被配置用于提取多个训练样本中的每一个的多种特征;以及构建单元,其被配置用于基于多个训练样本的每一个的多种特征,对与多种特征中的每一种分别对应的分类器进行训练,以构建包括与多种特征对应的多个分类器的目标分类器;其中,构建单元在训练的过程中考虑了如下的第一约束:对于多个训练样本中的每一个,在与多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
根据本发明的另一个方面,还提供了一种分类装置,该分类装置包括:第二提取单元,其被配置用于提取待测样本的多种特征;以及分类单元,其被配置用于基于待测样本的多种特征,获得与多种特征有关的多个预定分类器分别对待测样本的分类结果,以确定待测样本的最终分类结果;其中,多个预定分类器通过如上所述的构建装置而获得。
根据本发明的另一个方面,还提供了一种用于构建分类器的构建方法,该构建方法包括:提取多个训练样本中的每一个的多种特征;以及基于多个训练样本的每一个的多种特征,对与多种特征中的每一种分别对应的分类器进行训练,以构建包括与多种特征对应的多个分类器的目标分类器;其中,在训练的过程中考虑了如下的第一约束:对于多个训练样本中的每一个,在与多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
根据本发明的另一个方面,还提供了一种分类方法,该分类方法包括:提取待测样本的多种特征;以及基于待测样本的多种特征,获得与多种特征有关的多个预定分类器分别对待测样本的分类结果,以确定待测样本的最终分类结果;其中,多个预定分类器通过如上所述的构建方法而获得。
根据本发明的另一个方面,还提供了一种电子设备,该电子设备包括如上所述的构建装置或如上所述的分类装置。
根据本发明的又一个方面,还提供了一种存储有机器可读取的指令代码的程序产品,上述程序产品在执行时能够使上述机器执行如上所述的构建方法或如上所述的分类方法。
此外,根据本发明的其他方面,还提供了一种计算机可读存储介质,其上存储有如上所述的程序产品。
上述根据本发明实施例的构建装置和方法、分类装置和方法以及电子设备,其在构建分类器的过程中或者在利用上述分类器进行分类的过程中,由于考虑了样本的多种特征之间的关系,能够有效地克服传统方法的不足,使得利用该构建装置所构建的分类器进行分类的结果较为准确、精度较高,分类性能较好。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中:
图1是示意性地示出根据本发明的实施例的用于构建分类器的构建装置的一种示例结构的框图;
图2是示出传统的标准SVM分类器的原理的示意图;
图3是示意性地示出根据本发明的实施例的分类装置的一种示例结构的框图;
图4是示意性地示出根据本发明的实施例的用于构建分类器的构建方法的一种示例性处理的流程图;
图5是示意性地示出根据本发明的实施例的分类方法的一种示例性处理的流程图;以及
图6是示出了可用来实现根据本发明的实施例的用于构建分类器的构建装置和构建方法、或者根据本发明的实施例的分类装置和分类方法的一种可能的信息处理设备的硬件配置的结构简图。
本领域技术人员应当理解,附图中的元件仅仅是为了简单和清楚起见而示出的,而且不一定是按比例绘制的。例如,附图中某些元件的尺寸可能相对于其他元件放大了,以便有助于提高对本发明实施例的理解。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
本发明的实施例提供了一种用于构建分类器的构建装置,该构建装置包括:第一提取单元,其被配置用于提取多个训练样本中的每一个的多种特征;以及构建单元,其被配置用于基于多个训练样本的每一个的多种特征,对与多种特征中的每一种分别对应的分类器进行训练,以构建包括与多种特征对应的多个分类器的目标分类器;其中,构建单元在训练的过程中考虑了如下的第一约束:对于多个训练样本中的每一个,在与多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
下面结合图1来详细描述根据本发明的实施例的用于构建分类器的构建装置的一个示例。
如图1所示,根据本发明的实施例的用于构建分类器的构建装置100包括第一提取单元110以及构建单元120。
第一提取单元110用于提取多个训练样本中的每一个的多种特征。
在根据本发明的实施例的用于构建分类器的构建装置的一种实现方式中,训练样本例如可以是包括数字图像、音频和视频等多媒体数据中的至少一种的样本,也可以是实际应用中能够利用根据本发明的实施例的上述构建装置100进行处理(例如第一提取单元110和构建单元120的处理)的其他类型样本(例如植物样本)等。
此外,在根据本发明的实施例的用于构建分类器的构建装置的一种实现方式中,对多个训练样本中的每个训练样本所提取的多种特征可以是至少两种预定特征。其中,在实际处理中,对于不同类型的训练样本(以及后面将要提到的待测样本)来说,可以选择对应的预定特征来作为其多种特征。例如,在训练样本(以及后面将要提到的待测样本)为上文所述的任意一种多媒体数据的情况下,对训练样本(以及后面将要提到的待测样本)所提取的多种特征中的每一种例如可以是视觉特征(例如颜色特征、和/或纹理特征、和/或文本描述特征(比如字幕信息)等)、音频特征(例如声音的频率特征、和/或振幅特征、和/或波形特征)等特征中的任意一种。又如,在训练样本(以及后面将要提到的待测样本)为上文所述的植物样本的情况下,对训练样本(以及后面将要提到的待测样本)所提取的多种特征例如可以是花瓣的颜色特征、花瓣的纹理特征、花瓣的数量特征、花瓣的形状特征、叶片的颜色特征、叶片的纹理特征、叶片的数量特征和叶片的形状特征等中的至少两种。
其中,需要说明的是,上述多种特征中的“多种”所对应的数量可以根据预先设定,例如两种、三种或更多种。在一个例子中,假设训练样本(以及后面将要提到的待测样本)为某个预定类型的多媒体数据,则可以对每个训练样本分别提取颜色特征、纹理特征和声音的频率特征这三种特征作为每个训练样本的多种特征。
此外,需要说明的是,上述多个训练样本中的每一个均是带类别标签的训练样本。也就是说,上述多个训练样本中可以包括正例样本和负例样本,其中,正例样本是类别标签的值为正数的训练样本,而负例样本则是类别标签的值为负数的训练样本。
在一个例子中,假设上述多个训练样本所组成的集合可以用{I1,I2,…,IN}来表示,其中,N为上述多个训练样本中所包括的训练样本总数,每个训练样本Ii(i=1,2,…,N)对应的类别标签为yi,其中,N为正整数。上述多个训练样本中的每个训练样本Ii的类别标签yi例如可以为1或者-1,即yi∈{-1,1}。也就是说,当训练样本Ii的类别标签yi=1时,表示该训练样本Ii是正例样本;而当训练样本Ii的类别标签yi=-1时,表示该训练样本Ii是负例样本。
这样,通过第一提取单元110的处理可以得到上述多个训练样本中每一个训练样本的多种特征。然后,构建单元120基于上述多个训练样本的每一个训练样本的多种特征,对与多种特征中的每一种特征分别对应的分类器进行训练,以构建包括与上述多种特征对应的多个分类器的目标分类器。
在构建单元120进行训练的过程中,其考虑了如下的第一约束:对于多个训练样本中的每个训练样本,在与上述多种特征中的其中一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度(例如70%等)的情况下,若与上述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度(例如30%,或者70%等)的话,则增加对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。需要说明的是,第二预定程度小于或等于第一预定程度。
其中,上述第一预定程度和第二预定程度例如可以根据经验来设定,或者也可以通过试验的方法来确定,这里不再赘述。
例如,假设训练样本为视频样本,并且对视频样本提取的特征为字幕特征和音频特征。若对于某个训练样本来说,通过与字幕特征有关的分类器对之进行分类的结果的可信度高于第一预定程度(例如70%),而此时通过与音频特征有关的分类器对之进行分类的结果的可信度却低于第二预定程度(例如70%),则可以增加与音频特征有关的分类器对该训练样本的分类结果的惩罚。
在根据本发明的实施例的构建装置的具体实现方式中,“与上述多种特征对应的多个分类器”例如可以是SVM(support vector machine,支持向量机)分类器、基于图的学习的分类器等各种分类器中的任意一种。
在根据本发明的实施例的构建装置的一种实现方式中,以“与上述多种特征对应的多个分类器”为SVM分类器的情况为例,构建单元120在训练中考虑上述第一约束的过程中,对于多个训练样本中的每个训练样本来说,在与上述多种特征中的其中一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下、若与上述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度的话,则可以增大与上述多种特征中的上述其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量,由此实现了“增加对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚”。
此外,在根据本发明的实施例的构建装置的一种实现方式中,构建单元120在训练的过程中所考虑的第一约束中还可以包括:对于上述多个训练样本中的每个训练样本,在增加对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚的过程中,当与上述多种特征中的上述其中一种特征有关的分类器对该训练样本的分类结果的可信度越高时,对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚越严厉。这样,在该实现方式中,对于训练样本来说,当与一种特征有关的分类器对其分类结果可信度越高时,相当于要求与其他一种或其他几种特征有关的另外一个或另外几个分类器对该训练样本的分类结果的可信度也相对较高。
例如,假设训练样本为视频样本,并且对视频样本提取的特征为字幕特征和音频特征。若对于某个训练样本Ia和另一个训练样本Ib来说,通过与音频特征有关的分类器对训练样本Ia进行分类的结果的可信度、以及通过与音频特征有关的分类器对训练样本Ib进行分类的结果的可信度均低于第二预定程度(例如70%)。在这种情况下,假设第一预定程度也为70%,若通过与字幕特征有关的分类器对训练样本Ia进行分类的结果的可信度例如为80%(高于上述第一预定程度),而通过与字幕特征有关的分类器对训练样本Ib进行分类的结果的可信度例如为90%(高于上述第一预定程度),则可以使得对与音频特征有关的分类器对训练样本Ib的分类结果的惩罚比对与音频特征有关的分类器对训练样本Ia的分类结果的惩罚更严厉。
此外,在根据本发明的实施例的构建装置的一种实现方式中,以“与上述多种特征对应的多个分类器”为SVM分类器的情况为例,构建单元120在训练的过程中、在考虑第一约束时,针对上述多种特征中的每种特征,可以用上述多个训练样本中的每个训练样本到表示与该种特征有关的分类器的超平面的函数间隔来反映与该种特征有关的分类器对上述每个训练样本的分类结果的可信度,其中,值越高的函数间隔对应的可信度越高。
其中,针对与上述多种特征中的每种特征,对于上述多个训练样本中的每个训练样本,若该训练样本到表示与该种特征有关的分类器的超平面的函数间隔的值大于对应的第一预定阈值的话,则可以判定与该种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度。
此外,针对与所述多种特征中的每种特征,对于上述多个训练样本中的每个训练样本,若该训练样本到表示与该种特征有关的分类器的超平面的函数间隔的值小于第二预定阈值的话,则可以判定与该种特征有关的分类器对该训练样本的分类结果的可信度低于第二预定程度。
其中,上述第一预定阈值和第二预定阈值例如可以根据经验来设定,或者也可以通过试验的方法来确定,这里不再赘述。
为清楚起见,下面结合图2来介绍标准SVM分类器的相关概念。图2示意性地示出了传统的标准SVM分类器的原理图。如图2所示,图中的方形样本和圆形样本可以是待区分的两个类别(例如,方形样本和圆形样本中的一种可以是上文所述的正例图像,而另一种是负例图像),H为表示SVM分类器的超平面,可以用分类函数f(x)=w·x+b表示上述SVM分类器,并可以用w·x+b=0来表示上述超平面H。其中,w和b为待求解的SVM参数,而x则为待分类的样本(训练样本或下文中所说的待测样本)的特征向量。w和x之间的“·”表示w和x这两个向量的内积。以图2中的圆形样本P1为例,P1到超平面H的函数间隔如图2中的l1所示(即P1在图中纵向上到H的距离),而P1到超平面H的几何间隔如图2中的d1所示(即P1到H的最短距离,相当于P1到P1在H上的投影之间的距离)。这样,在数学上,可以用表示x对应的待分类的样本到超平面H的函数间隔,以及可以用表示x对应的待分类的样本到超平面H的几何间隔。需要注意的是,当yi与(w·x+b)的符号相同时,函数间隔为正数(在这种情况下,几何间隔γi也为正数);当yi与(w·x+b)的符号相异时,为负数(在这种情况下,几何间隔γi也为负数)。换句话说,图2中的l1、d1等是有正负之分的。
在一个例子中,假设上述多种特征包括A1、A2和A3三个特征种类,并假设图2中的圆形样本P1为上述多个训练样本中的任一个训练样本。其中,第一提取单元110对训练样本P1所提取的与上述A1、A2和A3三个特征种类对应的特征分别可以用表示。此外,假设图2中所示的超平面H是与特征有关(或者可以说与特征类别A1有关)的分类器的超平面,则可以用训练样本P1到超平面H的函数间隔来反映与特征有关(或者可以说与特征类别A1有关)的分类器(即f(x(1))=w·x(1)+b)对训练样本P1的分类结果的可信度。当越大时,表示分类器f(x(1))=w·x(1)+b对训练样本P1的分类结果的可信度越高;而当越小时,表示分类器f(x(1))=w·x(1)+b对训练样本P1的分类结果的可信度越低。显然,为负数时对应的可信度小于为正数时所对应的可信度。
这样,在上面的例子中,仍以训练样本P1为例,若大于对应的第一预定阈值(例如1)的话,则可以判定分类器f(x(1))=w·x(1)+b对训练样本P1的分类结果的可信度高于第一预定程度;而若小于对应的第二预定阈值(例如1)的话,则可以判定与该种特征有关的分类器对该训练样本的分类结果的可信度低于第二预定程度。
其中,在根据本发明的实施例的构建装置的具体实现方式中,对于与上述多种特征中的每一种特征对应的分类器来说,其对应的第一预定阈值大于或等于其对应的第二预定阈值。此外,对于不同的分类器来说,不同分类器所分别对应的第一预定阈值可以相同,也可以不同;类似地,不同分类器所分别对应的第二预定阈值可以相同,也可以不同。在一个例子中,可以令与上述多种特征中的每一种特征对应的分类器所对应的第一预定阈值和第二预定阈值均为1。这样,在该例子中,当训练样本到表示任一分类器的超平面的函数间隔的值大于1(作为第一预定阈值的示例)时判定该分类器对该训练样本的分类结果的可信度高于70%(作为第一预定程度的示例);而当训练样本到表示任一分类器的超平面的函数间隔的值小于1(作为第二预定阈值的示例)时判定该分类器对该训练样本的分类结果的可信度低于70%(作为第二预定程度的示例)。
另外,在根据本发明的实施例的构建装置的一种实现方式中,构建单元120在训练的过程中,其可以在同时考虑第一约束(如上文所述的任一种第一约束)、第二约束以及第三约束的情况下构建以与上述多种特征对应的多个分类器的参数为未知量的代价函数,并通过求解该代价函数的最优问题来获得与上述多种特征对应的多个分类器的参数的最优值。
其中,上述第二约束可以包括:针对与上述多种特征中的每一种对应的分类器,使得到表示该分类器的超平面的函数间隔为对应的预定间隔(预定间隔例如等于1)的训练样本到表示该分类器的超平面的几何间隔尽量大。需要说明的是,上述预定间隔例如可以根据经验来设定,这里不再赘述。
需要说明的是,在第二约束中,对于某种分类器来说,到表示该分类器的超平面的函数间隔为对应的预定间隔的训练样本到表示该分类器的超平面的几何间隔可以用来表示,其中w为该分类器对应的参数,c0是该分类器对应的预定间隔。这样,对于某种分类器来说,相当于令尽量地大。
例如,对于某种分类器来说,在其对应的预定间隔c0=1的情况下,上述“到表示该分类器的超平面的函数间隔为对应的预定间隔的训练样本到表示该分类器的超平面的几何间隔”简化为相当于在第二约束中令尽量地大。
此外,上述第三约束可以包括:针对与上述多种特征中的每一种特征对应的分类器,使得上述多个训练样本中的、到表示该分类器的超平面的函数间隔小于对应间隔的训练样本所对应的松弛变量的加权和尽量小。在一个例子中,针对与上述多种特征中的每一种特征对应的分类器、以及每个训练样本来说,该训练样本的“对应间隔”例如可以为该训练样本到表示其他分类器(即,与上述多种特征对应的多个分类器中的、除该分类器之外的其他分类器)的超平面的函数间隔中的最大函数间隔与上文所述的预定间隔(例如1)二者之中的较大值。
在根据本发明的实施例的构建装置的又一种实现方式中,在构建单元120在训练中考虑第一约束的过程中,对于上述多个训练样本中的每一个训练样本来说,在与上述多种特征中的其中一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度、而与上述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度的情况下,当与上述多种特征中的上述其中一种特征有关的分类器对该训练样本的分类结果的可信度越高时,可以令与上述多种特征中的上述其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量越大。
下面,根据上文所描述的各个实现方式来详细描述根据本发明的实施例的构建装置的一个应用示例。其中,在该应用示例中所构建的目标分类器中所包括的多个分类器分别为SVM分类器。
在该应用示例(以下称为应用示例一)中,假设训练样本为图像,并假设对每个训练样本提取两种特征(作为多种特征的示例),这两种特征的类型例如分别为A1(比如颜色特征)和A2(比如文本描述特征)。
这样,构建单元120要建立的目标分类器共包括两个分类器,即,与A1对应的SVM分类器(以下简称“第一SVM分类器”)和与A2对应的SVM分类器(以下简称“第二SVM分类器”)。
假设上述多个训练样本共有N个,这N个训练样本所组成的集合例如为{I1,I2,…,IN}。对于{I1,I2,…,IN}中的第i个训练样本Ii(i为1,2,3,……,N中的任一个)来说,第一提取单元110对训练样本Ii所提取的两种特征A1和A2的特征向量分别为训练样本Ii的类别标签表示为yi∈{-1,1}。
假设第一SVM分类器对应的分类函数可以表示为f(x(1))=w(1)·x(1)+b(1),其中的w(1)和b(1)为待求解的参数,x(1)为分类函数f(x(1))=w(1)·x(1)+b(1)的自变量(用于代入等特征向量)。另外,假设第二SVM分类器对应的分类函数可以表示为f(x(2))=w(2)·x(2)+b(2),其中的w(2)和b(2)为待求解的参数,x(2)为分类函数f(x(2))=w(2)·x(2)+b(2)的自变量(用于代入等特征向量)。
于是,构建单元120所构建的代价函数例如可以为:
1 2 | | w ( 1 ) | | 2 + C ( 1 ) Σ i = 1 N ξ i ( 1 ) + 1 2 | | w ( 2 ) | | 2 + C ( 2 ) Σ i = 1 N ξ i ( 2 )
以上代价函数的优化问题例如可以如表达式一所示。
表达式一: min w ( 1 ) , b ( 1 ) , ξ ( 1 ) , w ( 2 ) , b ( 2 ) , ξ ( 2 ) ( 1 2 | | w ( 1 ) | | 2 + C ( 1 ) Σ i = 1 N ξ i ( 1 ) + 1 2 | | w ( 2 ) | | 2 + C ( 2 ) Σ i = 1 N ξ i ( 2 ) )
其中,在优化表达式一中的代价函数的过程中满足如表达式二和表达式三所示的约束条件:
表达式二: y i ( w ( 1 ) · x i ( 1 ) + b ( 1 ) ) ≥ max { y i ( w ( 2 ) · x i ( 2 ) + b ( 2 ) ) , 1 } - ξ i ( 1 )
表达式三: y i ( w ( 2 ) · x i ( 2 ) + b ( 2 ) ) ≥ max { y i ( w ( 1 ) · x i ( 1 ) + b ( 1 ) ) , 1 } - ξ i ( 2 )
其中,为第i个训练样本Ii对应于第一SVM分类器的第一松弛变量,而第i个训练样本Ii对应于第二SVM分类器的第二松弛变量。此外,C(1)>0为第一SVM分类器的惩罚参数,而C(2)>0为第二SVM分类器的惩罚参数。其中,C(1)和C(2)是预先设定的,例如可以根据经验值来设定,或者也可以通过试验的方式来确定,这里不再赘述。
需要说明的是,例如对于第一SVM分类器来说,假设第一SVM分类器对应的预定间隔为1,则在第二约束中令尽量地大在数学上相当于令尽量地小。类似地,对于第二SVM分类器来说,假设第二SVM分类器对应的预定间隔为1,则在第二约束中令尽量地大在数学上相当于令尽量地小。这样,第二约束对应于表达式一中的、令这两项尽量地小。
此外,第三约束对应于表达式一中的、令这两项尽量地小。需要注意的是,这里对中的每个松弛变量以及中的每个松弛变量的权重均取值为1。
需要说明的是,在其他例子中,表达式一中的也可以分别替换为其中,的权重,而的权重,例如可以根据实际需要或经验值而预先设定,或者也可以通过试验的方法来确定。当的值均为1时,便与表达式所示的相同。
如表达式二所示,对于第i个训练样本Ii来说,若(假设第一预定阈值为1),则表示第二SVM分类器对第i个训练样本Ii的分类结果的可信度高于第一预定程度。在这种情况下,表达式二可以简化为 y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) &GreaterEqual; y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) - &xi; i ( 1 ) . 若此时 y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) < 1 (假设第二预定阈值为1),则表示第一SVM分类器对第i个训练样本Ii的分类结果的可信度低于第二预定程度。于是,可以通过增加第i个训练样本Ii对应于第一SVM分类器的松弛变量来增加对第一SVM分类器对第i个训练样本Ii的分类结果的惩罚。换句话说,与标准SVM分类器的约束条件(以第i个训练样本Ii为例,对应的约束条件为相比来说,在 y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) &GreaterEqual; y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) - &xi; i ( 1 ) 中,因为 y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) > 1 , 因此需取得更大的值才能使得 y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) &GreaterEqual; y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) - &xi; i ( 1 ) 等价于标准SVM分类器中的上述约束条件,即对第i个训练样本Ii进行了更加严厉的惩罚。
如表达式二所示,对于第i个训练样本Ii来说,若(假设第一预定阈值为1),则表示第二SVM分类器对第i个训练样本Ii的分类结果的可信度低于第一预定程度。在这种情况下,表达式二可以简化为,此时的算法则与标准SVM分类器的算法相同,这里不再赘述。
该应用示例中,上述代价函数的优化问题可以综合表示成如表达式四所示。
min w ( 1 ) , b ( 1 ) , &xi; ( 1 ) , w ( 2 ) , b ( 2 ) , &xi; ( 2 ) ( 1 2 | | w ( 1 ) | | 2 + C ( 1 ) &Sigma; i = 1 N &xi; i ( 1 ) + 1 2 | | w ( 2 ) | | 2 + C ( 2 ) &Sigma; i = 1 N &xi; i ( 2 ) )
表达式四: s . t . y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) &GreaterEqual; max { y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , 1 } - &xi; i ( 1 ) , ( i = 1,2 , &CenterDot; &CenterDot; &CenterDot; , N ) ;
y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) &GreaterEqual; max { y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , 1 } - &xi; i ( 2 ) , ( i = 1,2 , &CenterDot; &CenterDot; &CenterDot; , N ) ;
&xi; i ( 1 ) &GreaterEqual; 0 , &xi; i ( 2 ) &GreaterEqual; 0 , ( i = 1,2 , &CenterDot; &CenterDot; &CenterDot; , N ) .
这样,通过求解表达四所示的优化问题,即可得到参数w(1)、b(1)w(2)、b(2)的最优值,从而能够利用w(1)、b(1)构建第一SVM分类器、以及利用w(2)和b(2)构建第二SVM分类器,最终得到目标分类器。需要说明的是,在实际处理中,例如可以通过将表达四所示的优化问题转化成可以通过迭代求解的方式来解得以上参数,或者也可以通过本领域的技术人员结合公知常识和/或公开资料所能够获知的其他方法来求解以上优化问题,等等。这样,得到的目标分类器例如可以表示为h(x(1),x(2))=α(w(1)·x(1)+b(1))+(1-α)(w(2)·x(2)+b(2)),即,可以表示为第一SVM分类器w(1)·x(1)+b(1)和第二SVM分类器w(2)·x(2)+b(2)的线性组合,α为第一组合系数(可以根据经验值或者通过试验的方式预先设定,例如α可以在0-1之间取值)。其中,目标分类器h(x(1),x(2))=α(w(1)·x(1)+b(1))+(1-α)(w(2)·x(2)+b(2))中的x(1)为待分类的某个样本的、与特征A1对应的特征向量,而x(2)为待分类的某个样本的、与特征A2对应的特征向量。
此外,在另一个应用示例(以下称为应用示例二)中,构建单元120所构建的代价函数例如可以为:
[ 1 2 | | w ( 1 ) | | 2 + C ( 1 ) &Sigma; i = 1 N &xi; i ( 1 ) + 1 2 | | w ( 2 ) | | 2 + C ( 2 ) &Sigma; i = 1 N &xi; i ( 2 )
+ &gamma; &Sigma; i = 1 N L ( y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , max { y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , 1 } - &xi; i ( 1 ) )
+ &gamma; &Sigma; i = 1 N L ( y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , max { y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , 1 } - &xi; i ( 2 ) ) ]
该代价函数的优化问题例如可以如表达式五所示。
min w ( 1 ) , b ( 1 ) , &xi; ( 1 ) , w ( 2 ) , b ( 2 ) , &xi; ( 2 ) [ 1 2 | | w ( 1 ) | | 2 + C ( 1 ) &Sigma; i = 1 N &xi; i ( 1 ) + 1 2 | | w ( 2 ) | | 2 + C ( 2 ) &Sigma; i = 1 N &xi; i ( 2 )
表达式五: + &gamma; &Sigma; i = 1 N L ( y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , max { y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , 1 } - &xi; i ( 1 ) )
+ &gamma; &Sigma; i = 1 N L ( y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , max { y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , 1 } - &xi; i ( 2 ) ) ]
s . t . &xi; i ( 1 ) &GreaterEqual; 0 , &xi; i ( 2 ) &GreaterEqual; 0 , ( i = 1,2 , &CenterDot; &CenterDot; &CenterDot; , N ) .
其中,L(输入量一,输入量二)为惩罚函数,可以定义为L(输入量一,输入量二)=(max{输入量二-输入量一,0})2
此外,γ为 &Sigma; i = 1 N L ( y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , max { y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , 1 } - &xi; i ( 1 ) ) &Sigma; i = 1 N L ( y i ( w ( 2 ) &CenterDot; x i ( 2 ) + b ( 2 ) ) , max { y i ( w ( 1 ) &CenterDot; x i ( 1 ) + b ( 1 ) ) , 1 } - &xi; i ( 2 ) ) 这两项对应的加权系数,在实际求解的过程中,例如可以将γ设置为一个较大的值(例如100、1000等)。需要注意的是,当γ→+∞时,表达式五所示的优化问题与表达式四的所示的优化问题等价。
例如,可以通过迭代求解表达式五中的中的参数w(1)、b(1)w(2)、b(2)直到整个过程收敛,从而得到w(1)、b(1)w(2)、b(2)的最优值,以利用w(1)、b(1)构建第一SVM分类器、以及利用w(2)和b(2)构建第二SVM分类器,最终得到目标分类器。其中,在每一次迭代的过程中,表达式五中的优化问题都可以简化为二次规划问题,能够有效地进行求解。这样,得到的目标分类器例如可以表示为h(x(1),x(2))=α(w(1)·x(1)+b(1))+(1-α)(w(2)·x(2)+b(2)),即,可以表示为第一SVM分类器w(1)·x(1)+b(1)和第二SVM分类器w(2)·x(2)+b(2)的线性组合,其中各个参数的含义与在应用示例一中所描述的相同,这里不再赘述。
相比于应用示例一中的表达式四来说,表达式五所示的优化问题相对更容易求解。
需要说明的是,虽然上文的描述的第一和第二SVM分类器等只涉及线性SVM算法,但根据SVM算法中的常用手段,可以引入核技巧(kerneltrick)将上述实施例中的SVM算法推广至非线性SVM算法,这里不再详述。
下面,以基于图的学习的分类器作为“与上述多种特征对应的多个分类器”的示例来描述根据本发明的实施例的构建装置的另一个应用示例(应用示例三)。
在应用示例三中,针对上述多种特征中的每一种、利用多个训练样本的该种特征分别构建一张带权图。假设第一提取单元110对多个训练样本中的每一个分别提取了两种特征(例如特征类别分别为A1和A2),则构建2张带权图。对于每张带权图来说,其中的所有节点对应于所有训练样本,而连接两个节点的边的权值表示这两个节点对应的两个训练样本之间根据对应特征所计算出的相似度。
假设在特征A1对应的带权图中训练样本Ii(i=1,2,…,N)和训练样本Ij(j=1,2,…,N)之间的边所对应的权值可以用表示,而在特征A2对应的带权图中训练样本Ii和训练样本Ij之间的边所对应的权值可以用表示。此外,假设训练样本Ii基于特征A1的软标签为训练样本Ii基于特征A2的软标签为另外,假设训练样本Ij基于特征A1的软标签为训练样本Ij基于特征A2的软标签为此外,各个训练样本基于特征A1的软标签所组成的向量例如可以用软标签向量f(1)表示,以及各个训练样本基于特征A2的软标签所组成的向量例如可以用软标签向量f(2)表示。
对于标准的基于图的学习方法,使用第一种特征A1,定义关于的代价函数时需要考虑两个方面的信息。一方面,基于带权图的结构信息引入平滑性约束,该约束要求对于特征相似的样本,其对应的软标签也不会相差太大。令为权值矩阵w(1)中第i行的元素之和,则平滑性约束可以表示为另一方面,考虑到训练样本的类别标签,要求正例样本的软标签尽量接近1,而负例样本的软标签尽量接近-1。于是,代价函数中对应的代价项可以分别表示为其中X+和X-分别表示正例样本集合和负例样本集合,H1(·,·)和H2(·,·)为度量软标签和样本类别信息之间不一致性的函数,可以采用的一种示例形式例如可以为:
H1(输入量一,输入量二)=(max(输入量二-输入量一,0))2
H2(输入量一,输入量二)=(max(输入量一-输入量二,0))2
也就是说,只惩罚软标签小于1的正例样本和软标签大于-1的负例样本。
基于第二种特征A2,可以类似地定义关于的代价函数,其中的代价项分别为 1 2 &Sigma; i , j W ij ( 2 ) ( f i ( 2 ) / d i ( 2 ) - f j ( 2 ) / d j ( 2 ) ) 2 , &Sigma; x i &Element; X + H 1 ( f i ( 2 ) , 1 ) , &Sigma; x i &Element; X - H 2 ( f i ( 2 ) , - 1 ) .
同时考虑两种特征A1和A2时,考虑“在增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚的过程中,当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚越严厉”,可以将基于训练样本类别标签的约束项分别调整为:
&Sigma; x i &Element; X + H 1 ( f i ( 1 ) , 1 ) 调整为 &Sigma; x i &Element; X + max { f i ( 2 ) , 1 } H 1 ( f i ( 1 ) , 1 ) ,
&Sigma; x i &Element; X - H 2 ( f i ( 1 ) , - 1 ) 调整为 &Sigma; x i &Element; X - max { - f i ( 2 ) , 1 } H 2 ( f i ( 1 ) , - 1 ) ,
&Sigma; x i &Element; X + H 1 ( f i ( 2 ) , 1 ) 调整为 &Sigma; x i &Element; X + max { f i ( 1 ) , 1 } H 1 ( f i ( 2 ) , 1 ) , 以及
&Sigma; x i &Element; X - H 2 ( f i ( 2 ) , - 1 ) 调整为 &Sigma; x i &Element; X - max { - f i ( 1 ) , 1 } H 2 ( f i ( 2 ) , - 1 ) .
也就是说,如果某个正例样本基于一种特征计算出的软标签大于1而基于另一种特征计算出的软标签小于1,则增加对该样本的惩罚;同样的,如果某个负例样本基于一种特征计算出的软标签小于-1而基于另一种特征计算出的软标签大于-1,也增加对该样本的惩罚。
将上述两种不同类型的约束进行组合,最终设计的代价函数如下:
Q ( f ( 1 ) , f ( 2 ) )
= 1 2 &Sigma; i , j W ij ( 1 ) ( f i ( 1 ) / d i ( 1 ) - f j ( 1 ) / d j ( 1 ) ) 2 + &mu; G ( 2 ) 2 &Sigma; i , j W ij ( 2 ) ( f i ( 2 ) / d i ( 2 ) - f j ( 2 ) / d j ( 2 ) ) 2
+ &mu; + ( 1 ) &Sigma; x i &Element; X + max { f i ( 2 ) , 1 } H 1 ( f i ( 1 ) , 1 ) + &mu; - ( 1 ) &Sigma; x i &Element; X - max { - f i ( 2 ) , 1 } H 2 ( f i ( 1 ) , - 1 )
+ &mu; + ( 2 ) &Sigma; x i &Element; X + max { f i ( 1 ) , 1 } H 1 ( f i ( 2 ) , 1 ) + &mu; - ( 2 ) &Sigma; x i &Element; X - max { - f i ( 1 ) , 1 } H 2 ( f i ( 2 ) , - 1 )
其中 1 2 &Sigma; i , j W ij ( 2 ) ( f i ( 2 ) / d i ( 2 ) - f j ( 2 ) / d j ( 2 ) ) 2 对应的加权系数, &Sigma; x i &Element; X + max { f i ( 2 ) , 1 } H 1 ( f i ( 1 ) , 1 ) 对应的加权系数, &Sigma; x i &Element; X - max { - f i ( 2 ) , 1 } H 2 ( f i ( 1 ) , - 1 ) 对应的加权系数,对应的加权系数,对应的加权系数。优化问题minQ(f(1),f(2))可以通过迭代的方法分别求得软标签向量f(1)和f(2)的具体取值。在一个例子中,所构建的关于特征A1的分类器可以表示成如表达式六所示,而构建的关于特征A2的分类器可以表示成如表达式七所示。
表达式六: &Sigma; i f i ( 1 ) W ( 1 ) ( x ( 1 ) , x i ( 1 ) ) / d i ( 1 ) &Sigma; i W ( 1 ) ( x ( 1 ) , x i ( 1 ) ) / d ( 1 ) = d ( 1 ) &Sigma; i f i ( 1 ) W ( 1 ) ( x ( 1 ) , x i ( 1 ) ) / d i ( 1 ) &Sigma; i W ( 1 ) ( x ( 1 ) , x i ( 1 ) )
表达式七: &Sigma; i f i ( 2 ) W ( 2 ) ( x ( 2 ) , x i ( 2 ) ) / d i ( 2 ) &Sigma; i W ( 2 ) ( x ( 2 ) , x i ( 2 ) ) / d ( 2 ) = d ( 2 ) &Sigma; i f i ( 2 ) W ( 2 ) ( x ( 2 ) , x i ( 2 ) ) / d i ( 2 ) &Sigma; i W ( 2 ) ( x ( 2 ) , x i ( 2 ) )
其中,x(1)为待分类的样本关于特征A1的特征向量,而为训练样本Ii关于特征A1的特征向量;x(2)为待分类的样本关于特征A2的特征向量,而为训练样本Ii关于特征A2的特征向量。为待分类的样本与训练样本Ii基于特征A1的相似度,为待分类的样本与训练样本Ii基于特征A2的相似度。d(1)为待分类的样本与所有训练样本在关于特征A1的带权图中的所有相似度之和,而d(2)为待分类的样本与所有训练样本在关于特征A2的带权图中的所有相似度之和。
于是,目标分类器例如可以如表达式八所示。
表达式八:
&beta; d ( 1 ) &Sigma; i f i ( 1 ) W ( 1 ) ( x ( 1 ) , x i ( 1 ) ) / d i ( 1 ) &Sigma; i W ( 1 ) ( x ( 1 ) , x i ( 1 ) ) + ( 1 - &beta; ) d ( 2 ) &Sigma; i f i ( 2 ) W ( 2 ) ( x ( 2 ) , x i ( 2 ) ) / d i ( 2 ) &Sigma; i W ( 2 ) ( x ( 2 ) , x i ( 2 ) )
其中,β为第二组合系数,其可以根据经验值或者通过试验的方式预先设定,β例如可以在0-1之间取值。
通过以上描述可知,上述根据本发明的实施例的构建装置基于训练样本的多种特征之间的关系来训练与多种特征对应的多个分类器,以构建得到包括上述多个分类器的目标分类器。上述根据本发明的实施例的构建装置由于考虑了训练样本的多种特征之间的关系,因此能够有效地克服传统方法的不足,使得利用该构建装置所构建的分类器进行分类的结果较为准确、精度较高,分类性能较好。
此外,本发明的实施例还提供了一种分类装置,该分类装置包括:第二提取单元,其被配置用于提取待测样本的多种特征;以及分类单元,其被配置用于基于待测样本的多种特征,获得与多种特征有关的多个预定分类器分别对待测样本的分类结果,以确定待测样本的最终分类结果;其中,多个预定分类器通过如上所述的构建装置而获得。
图3示意性地示出了上述根据本发明的实施例的分类装置的一个示例。如图3所示,根据本发明的实施例的分类装置300包括第二提取单元310以及分类单元320。
第二提取单元310用于提取待测样本的多种特征。其中,第二提取单元310例如可以采用与上文中第一提取单元110提取每个训练图像的多种特征相类似的方法来提取待测图像的多种特征,并能够达到相类似的技术效果,这里不再赘述。
分类单元320用于基于待测样本的多种特征,获得与多种特征有关的多个预定分类器分别对待测样本的分类结果,以确定待测样本的最终分类结果。其中,这里所说的多个预定分类器是根据上文所述的构建装置100构建而得的,即,将通过构建装置100构建得到的目标分类器中所包括的与多种特征对应的多个分类器来作为上述多个预定分类器。在一个例子中,分类单元320可以与多种特征有关的多个预定分类器分别对待测样本的分类结果的加权和作为待测样本的最终分类结果。
在一个例子中,假设通过构建装置100构建得到的目标分类器中所包括的、与两种特征A1和A2(作为多种特征的示例)对应的两个SVM分类器(作为多个分类器的示例)为第一SVM分类器w(1)·x(1)+b(1)和第二SVM分类器w(2)·x(2)+b(2)。假设第二提取单元310所提取的待测样本It的两种特征A1和A2的特征向量分别为则分类单元320可以获得第一SVM分类器w(1)·x(1)+b(1)对待测样本It的分类结果为以及可以获得第二SVM分类器w(2)·x(2)+b(2)对待测样本It的分类结果为于是,分类单元320可以将 &alpha; ( w ( 1 ) &CenterDot; x t ( 1 ) + b ( 1 ) ) + ( 1 - &alpha; ) ( w ( 2 ) &CenterDot; x t ( 2 ) + b ( 2 ) ) 的值作为待测样本的最终分类结果。其中,α为上文所说的第一组合系数(例如可以为0.5)。例如,若 &alpha; ( w ( 1 ) &CenterDot; x t ( 1 ) + b ( 1 ) ) + ( 1 - &alpha; ) ( w ( 2 ) &CenterDot; x t ( 2 ) + b ( 2 ) ) 为正,则判定待测样本与训练样本中的正例样本所对应的类别一致,否则判定待测样本与训练样本中的正例样本所对应的类别不一致(或者判定待测样本与训练样本中的负例样本所对应的类别一致)。
在另一个例子中,假设通过构建装置100构建得到的目标分类器中所包括的、与两种特征A1和A2(作为多种特征的示例)对应的两个分类器(作为多个分类器的示例)为第一分类器和第二分类器假设第二提取单元310所提取的待测样本It的两种特征A1和A2的特征向量分别为则分类单元320可以获得第一分类器对待测样本It的分类结果为以及获得第二分类器对待测样本It的分类结果为其中,为待测样本It与所有训练样本在关于特征A1的带权图中的所有相似度之和,而为待测样本It与所有训练样本在关于特征A2的带权图中的所有相似度之和。这样,分类单元320可以将 &beta; d t ( 1 ) &Sigma; i f i ( 1 ) W ( 1 ) ( x t ( 1 ) , x i ( 1 ) ) / d i ( 1 ) &Sigma; i W ( 1 ) ( x t ( 1 ) , x i ( 1 ) ) + ( 1 - &beta; ) d t ( 2 ) &Sigma; i f i ( 2 ) W ( 2 ) ( x t ( 1 ) , x i ( 1 ) ) / d i ( 2 ) &Sigma; i W ( 2 ) ( x t ( 1 ) , x i ( 1 ) ) 的值作为待测样本的最终分类结果。其中,β为上文所说的第二组合系数(例如可以为0.5)。例如,若 &beta; d t ( 1 ) &Sigma; i f i ( 1 ) W ( 1 ) ( x t ( 1 ) , x i ( 1 ) ) / d i ( 1 ) &Sigma; i W ( 1 ) ( x t ( 1 ) , x i ( 1 ) ) + ( 1 - &beta; ) d t ( 2 ) &Sigma; i f i ( 2 ) W ( 2 ) ( x t ( 1 ) , x i ( 1 ) ) / d i ( 2 ) &Sigma; i W ( 2 ) ( x t ( 1 ) , x i ( 1 ) ) 为正,则判定待测样本与训练样本中的正例样本所对应的类别一致,否则判定待测样本与训练样本中的正例样本所对应的类别不一致(或者判定待测样本与训练样本中的负例样本所对应的类别一致)。
通过以上描述可知,上述根据本发明的实施例的分类装置基于利用上文所述的构建装置所构建得到的包括与多种特征对应的多个分类器的分类器来对待测样本进行分类,并利用多个分类器对待测样本的分类结果来确定最终的分类结果。由于根据本发明的实施例的上述分类装置在分类的过程中考虑了待测样本的多种特征之间的关系而使得分类的精度较高、结果较为准确,该分类装置的分类性能也较好。
此外,本发明的实施例还提供了一种用于构建分类器的构建方法,该构建方法包括:提取多个训练样本中的每一个的多种特征;以及基于多个训练样本的每一个的多种特征,对与多种特征中的每一种分别对应的分类器进行训练,以构建包括与多种特征对应的多个分类器的目标分类器;其中,在训练的过程中考虑了如下的第一约束:对于多个训练样本中的每一个,在与多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
下面结合图4来描述上述用于构建分类器的构建方法的一种示例性处理。
如图4所示,根据本发明的实施例的用于构建分类器的构建方法的处理流程400开始于步骤S410,然后执行步骤S420。
在步骤S420中,提取多个训练样本中的每一个的多种特征。然后执行步骤S430。其中,步骤S420中所执行的处理例如可以与上文中结合图1所描述的第一提取单元110的处理相同,并能够达到类似的技术效果,在此不再赘述。
在步骤S430中,基于上述多个训练样本的每一个的多种特征,对与上述多种特征中的每一种分别对应的分类器进行训练,以构建包括与上述多种特征对应的多个分类器的目标分类器。然后执行步骤S440。
其中,在步骤S430中的训练过程中,考虑了如下的第一约束:对于上述多个训练样本中的每一个,在与上述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与上述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
在根据本发明的实施例的构建方法的一种实现方式中,第一约束还可以包括:对于上述多个训练样本中的每一个,在增加对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚的过程中,当与上述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚越严厉。
在根据本发明的实施例的构建方法的一种实现方式中,上述多个分类器中的每个均为SVM分类器。此外,在根据本发明的实施例的构建方法的另一种实现方式中,上述多个分类器中的每个也可以均为基于图的学习的分类器。
在根据本发明的实施例的构建方法的一种实现方式中,在上述多个分类器中的每个均为SVM分类器的情况下,第一约束可以包括:针对上述多种特征中的每种特征,用上述多个训练样本中的每个训练样本到表示与该种特征有关的分类器的超平面的函数间隔来反映与该种特征有关的分类器对上述每个训练样本的分类结果的可信度,其中,值越高的函数间隔对应的可信度越高。
在根据本发明的实施例的构建方法的一种实现方式中,在上述多个分类器中的每个均为SVM分类器的情况下,在训练的过程中,可以在考虑第一约束、第二约束以及第三约束的情况下来构建以与上述多种特征对应的多个分类器的参数为未知量的代价函数,并通过求解该代价函数的最优问题来获得与上述多种特征对应的多个分类器的参数的最优值。其中,在该实现方式中所述的第二约束和第三约束例如可以与上文所述的第二约束和第三约束分别相同,这里不再赘述。
在根据本发明的实施例的构建方法的另一种实现方式中,在上述多个分类器中的每个均为SVM分类器的情况下,在第一约束中,对于上述多个训练样本中的每一个,在与上述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度、而与上述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度的情况下,当与上述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,令与上述多种特征中的其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量越大。
在根据本发明的实施例的构建方法的另一种实现方式中,在上述多个分类器中的每个均为SVM分类器的情况下,在第一约束中,上述增加对与上述多种特征中的上述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚可以包括:增大与上述多种特征中的上述其他一种或其他多种特征有关的分类器的松弛变量。
其中,步骤S430中所执行的处理例如可以与上文中结合图1所描述的构建单元120的处理相同,并能够达到类似的技术效果,在此不再赘述。
处理流程400结束于步骤S440。
通过以上描述可知,上述根据本发明的实施例的构建方法基于训练样本的多种特征之间的关系来训练与多种特征对应的多个分类器,以构建得到包括上述多个分类器的目标分类器。上述根据本发明的实施例的构建方法由于考虑了训练样本的多种特征之间的关系,因此能够有效地克服传统方法的不足,使得利用该构建装置所构建的分类器进行分类的结果较为准确、精度较高,分类性能较好。
需要说明的是,在上述根据本发明实施例的构建方法的具体处理中,其各个步骤、子步骤可以分别采用与上文中结合图1所描述的构建装置中的对应的单元、子单元或者模块的处理相同的处理,并能够达到相类似的功能和效果,这里不再一一赘述。
此外,本发明的实施例还提供了一种分类方法,该分类方法包括:提取待测样本的多种特征;以及基于待测样本的多种特征,获得与多种特征有关的多个预定分类器分别对待测样本的分类结果,以确定待测样本的最终分类结果;其中,多个预定分类器通过如上所述的构建方法而获得。
下面结合图5来描述上述分类方法的一种示例性处理。
如图5所示,根据本发明的实施例的分类方法的处理流程500开始于步骤S510,然后执行步骤S520。
在步骤S520中,提取待测样本的多种特征。然后执行步骤S530。其中,步骤S520中所执行的处理例如可以与上文中结合图2所描述的第二提取单元310的处理相同,并能够达到类似的技术效果,在此不再赘述。
在步骤S530中,基于上述待测样本的上述多种特征,获得与上述多种特征有关的多个预定分类器分别对上述待测样本的分类结果,以确定上述待测样本的最终分类结果。然后执行步骤S540。其中,步骤S530中所执行的处理例如可以与上文中结合图3所描述的分类单元320的处理相同,并能够达到类似的技术效果,在此不再赘述。
其中,步骤S530中所述的多个预定分类器是根据上文所述的构建方法而构建获得的,即,将通过构建方法构建得到的目标分类器中所包括的与上述多种特征对应的多个分类器来作为上述多个预定分类器。在一个例子中,在步骤S530中,例如可以与上述多种特征有关的多个预定分类器分别对上述待测样本的分类结果的加权和作为上述待测样本的最终分类结果。
处理流程500结束于步骤S540。
通过以上描述可知,上述根据本发明的实施例的分类方法基于利用上文所述的构建方法所构建得到的包括与多种特征对应的多个分类器的分类器来对待测样本进行分类,并利用多个分类器对待测样本的分类结果来确定最终的分类结果。由于根据本发明的实施例的上述分类方法在分类的过程中考虑了待测样本的多种特征之间的关系而使得分类的精度较高、结果较为准确,该分类方法的分类性能也较好。
需要说明的是,在上述根据本发明实施例的分类方法的具体处理中,其各个步骤、子步骤可以分别采用与上文中结合图3所描述的分类装置中的对应的单元、子单元或者模块的处理相同的处理,并能够达到相类似的功能和效果,这里不再一一赘述。
此外,本发明的实施例还提供了一种电子设备,该电子设备包括如上所述的构建装置或者如上所述的分类装置。在根据本发明的实施例的上述电子设备的具体实现方式中,上述电子设备可以是以下设备中的任意一种设备:计算机;平板电脑;个人数字助理;多媒体播放设备;手机以及电纸书等等。其中,该电子设备具有上述构建装置或分类装置的各种功能和技术效果,这里不再赘述。
上述根据本发明的实施例的构建装置或分类装置中的各个组成单元、子单元、模块等可以通过软件、固件、硬件或其任意组合的方式进行配置。在通过软件或固件实现的情况下,可从存储介质或网络向具有专用硬件结构的机器(例如图6所示的通用机器600)安装构成该软件或固件的程序,该机器在安装有各种程序时,能够执行上述各组成单元、子单元的各种功能。
图6是示出了可用来实现根据本发明的实施例的构建装置和构建方法、或者根据本发明的实施例的分类装置和分类方法的一种可能的信息处理设备的硬件配置的结构简图。
在图6中,中央处理单元(CPU)601根据只读存储器(ROM)602中存储的程序或从存储部分608加载到随机存取存储器(RAM)603的程序执行各种处理。在RAM603中,还根据需要存储当CPU601执行各种处理等等时所需的数据。CPU601、ROM602和RAM603经由总线604彼此连接。输入/输出接口605也连接到总线604。
下述部件也连接到输入/输出接口605:输入部分606(包括键盘、鼠标等等)、输出部分607(包括显示器,例如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分608(包括硬盘等)、通信部分609(包括网络接口卡例如LAN卡、调制解调器等)。通信部分609经由网络例如因特网执行通信处理。根据需要,驱动器610也可连接到输入/输出接口605。可拆卸介质611例如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器610上,使得从中读出的计算机程序可根据需要被安装到存储部分608中。
在通过软件实现上述系列处理的情况下,可以从网络例如因特网或从存储介质例如可拆卸介质611安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图6所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质611。可拆卸介质611的例子包含磁盘(包含软盘)、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM602、存储部分608中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
此外,本发明还提出了一种存储有机器可读取的指令代码的程序产品。上述指令代码由机器读取并执行时,可执行上述根据本发明的实施例的构建方法或分类方法。相应地,用于承载这种程序产品的例如磁盘、光盘、磁光盘、半导体存储器等的各种存储介质也包括在本发明的公开中。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
此外,本发明的各实施例的方法不限于按照说明书中描述的或者附图中示出的时间顺序来执行,也可以按照其他的时间顺序、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
此外,显然,根据本发明的上述方法的各个操作过程也可以以存储在各种机器可读的存储介质中的计算机可执行程序的方式实现。
而且,本发明的目的也可以通过下述方式实现:将存储有上述可执行程序代码的存储介质直接或者间接地提供给系统或设备,并且该系统或设备中的计算机或者中央处理单元(CPU)读出并执行上述程序代码。
此时,只要该系统或者设备具有执行程序的功能,则本发明的实施方式不局限于程序,并且该程序也可以是任意的形式,例如,目标程序、解释器执行的程序或者提供给操作系统的脚本程序等。
上述这些机器可读存储介质包括但不限于:各种存储器和存储单元,半导体设备,磁盘单元例如光、磁和磁光盘,以及其它适于存储信息的介质等。
另外,客户计算机通过连接到因特网上的相应网站,并且将依据本发明的计算机程序代码下载和安装到计算机中然后执行该程序,也可以实现本发明。
最后,还需要说明的是,在本文中,诸如左和右、第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
综上,在根据本发明的实施例中,本发明提供了如下方案但不限于此:
附记1.一种用于构建分类器的构建装置,包括:
第一提取单元,其被配置用于提取多个训练样本中的每一个的多种特征;以及
构建单元,其被配置用于基于所述多个训练样本的每一个的多种特征,对与所述多种特征中的每一种分别对应的分类器进行训练,以构建包括与所述多种特征对应的多个分类器的目标分类器;
其中,所述构建单元在所述训练的过程中考虑了如下的第一约束:对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
附记2.根据附记1所述的构建装置,其中,所述构建单元在所述训练的过程中所考虑的所述第一约束还包括:
对于所述多个训练样本中的每一个,在增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚的过程中,当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚越严厉。
附记3.根据附记1或2所述的构建装置,其中,所述多个分类器中的每个均为SVM分类器。
附记4.根据附记3所述的构建装置,其中,所述构建单元在所述训练的过程中考虑所述第一约束时,
针对所述多种特征中的每种特征,
用所述多个训练样本中的每个训练样本到表示与该种特征有关的分类器的超平面的函数间隔来反映与该种特征有关的分类器对所述每个训练样本的分类结果的可信度,其中,值越高的函数间隔对应的可信度越高。
附记5.根据附记3或4所述的构建装置,其中,所述构建单元在所述训练的过程中,在考虑所述第一约束、第二约束以及第三约束的情况下构建以与所述多种特征对应的多个分类器的参数为未知量的代价函数,以及通过求解所述代价函数的最优问题来获得与所述多种特征对应的多个分类器的参数的最优值;
其中,所述第二约束包括:针对与所述多种特征中的每一种对应的分类器,使得到表示该分类器的超平面的函数间隔为对应的预定间隔的训练样本到表示该分类器的超平面的几何间隔尽量大;以及
所述第三约束包括:针对与所述多种特征中的每一种对应的分类器,使得所述多个训练样本中的、到表示该分类器的超平面的函数间隔小于对应间隔的训练样本所对应的松弛变量的加权和尽量小。
附记6.根据附记3-5中任一项所述的构建装置,其中,所述构建单元在所述训练中考虑所述第一约束的过程中,对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增大与所述多种特征中的所述其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量,来实现增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
附记7.根据附记3-6中任一项所述的构建装置,其中,所述构建单元在所述训练中考虑所述第一约束的过程中,
对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度、而与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度的情况下,
当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,令与所述多种特征中的其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量越大。
附记8.一种分类装置,包括:
第二提取单元,其被配置用于提取待测样本的多种特征;以及
分类单元,其被配置用于基于所述待测样本的所述多种特征,获得与所述多种特征有关的多个预定分类器分别对所述待测样本的分类结果,以确定所述待测样本的最终分类结果;
其中,所述多个预定分类器通过如附记1-7中任一项所述的构建装置而获得。
附记9.一种用于构建分类器的构建方法,包括:
提取多个训练样本中的每一个的多种特征;以及
基于所述多个训练样本的每一个的多种特征,对与所述多种特征中的每一种分别对应的分类器进行训练,以构建包括与所述多种特征对应的多个分类器的目标分类器;
其中,在所述训练的过程中考虑了如下的第一约束:
对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
附记10.根据附记9所述的构建方法,其中,所述第一约束还包括:
对于所述多个训练样本中的每一个,在增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚的过程中,当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚越严厉。
附记11.根据附记9或10所述的构建方法,其中,所述多个分类器中的每个均为SVM分类器。
附记12.根据附记11所述的构建方法,其中,在所述第一约束中:
针对所述多种特征中的每种特征,
用所述多个训练样本中的每个训练样本到表示与该种特征有关的分类器的超平面的函数间隔来反映与该种特征有关的分类器对所述每个训练样本的分类结果的可信度,其中,值越高的函数间隔对应的可信度越高。
附记13.根据附记11或12所述的构建方法,其中,在所述训练的过程中,在考虑所述第一约束、第二约束以及第三约束的情况下构建以与所述多种特征对应的多个分类器的参数为未知量的代价函数,以及通过求解所述代价函数的最优问题来获得与所述多种特征对应的多个分类器的参数的最优值;
其中,所述第二约束包括:针对与所述多种特征中的每一种对应的分类器,使得到表示该分类器的超平面的函数间隔为对应的预定间隔的训练样本到表示该分类器的超平面的几何间隔尽量大;以及
所述第三约束包括:针对与所述多种特征中的每一种对应的分类器,使得所述多个训练样本中的、到表示该分类器的超平面的函数间隔小于对应间隔的训练样本所对应的松弛变量的加权和尽量小。
附记14.根据附记11-13中任一项所述的构建方法,其中,在所述第一约束中,所述增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚包括:
增大与所述多种特征中的所述其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量。
附记15.根据附记11-14中任一项所述的构建方法,其中,在所述第一约束中,对于所述多个训练样本中的每一个,
在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度、而与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度的情况下,当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,令与所述多种特征中的其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量越大。
附记16.一种分类方法,包括:
提取待测样本的多种特征;以及
基于所述待测样本的所述多种特征,获得与所述多种特征有关的多个预定分类器分别对所述待测样本的分类结果,以确定所述待测样本的最终分类结果;
其中,所述多个预定分类器通过如附记9-15中任一项所述的构建方法而获得。
附记17.一种电子设备,包括如附记1-7中任一项所述的构建装置或如附记8所述的分类装置。
附记18.根据附记17所述的电子设备,其中,所述电子设备是以下设备中的任意一种:
计算机;平板电脑;个人数字助理;多媒体播放设备;手机以及电纸书。
附记19.一种存储有机器可读取的指令代码的程序产品,所述程序产品在执行时能够使所述机器执行如附记9-15中任一项所述的构建方法或如附记16所述的分类方法。
附记20.一种计算机可读存储介质,其上存储有根据附记19所述的程序产品。

Claims (10)

1.一种用于构建分类器的构建装置,包括:
第一提取单元,其被配置用于提取多个训练样本中的每一个的多种特征;以及
构建单元,其被配置用于基于所述多个训练样本的每一个的多种特征,对与所述多种特征中的每一种分别对应的分类器进行训练,以构建包括与所述多种特征对应的多个分类器的目标分类器;
其中,所述构建单元在所述训练的过程中考虑了如下的第一约束:对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
2.根据权利要求1所述的构建装置,其中,所述构建单元在所述训练的过程中所考虑的所述第一约束还包括:
对于所述多个训练样本中的每一个,在增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚的过程中,当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚越严厉。
3.根据权利要求1或2所述的构建装置,其中,所述多个分类器中的每个均为支持向量机分类器。
4.根据权利要求3所述的构建装置,其中,所述构建单元在所述训练中考虑所述第一约束的过程中,
针对所述多种特征中的每种特征,
用所述多个训练样本中的每个训练样本到表示与该种特征有关的分类器的超平面的函数间隔来反映与该种特征有关的分类器对所述每个训练样本的分类结果的可信度,其中,值越高的函数间隔对应的可信度越高。
5.根据权利要求3或4所述的构建装置,其中,所述构建单元在所述训练中考虑所述第一约束的过程中,对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增大与所述多种特征中的所述其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量来实现增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
6.根据权利要求3-5中任一项所述的构建装置,其中,所述构建单元在所述训练中考虑所述第一约束的过程中,
对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度、而与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度的情况下,当与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度越高时,令与所述多种特征中的其他一种或其他多种特征有关的分类器对应于该训练样本的松弛变量越大。
7.一种分类装置,包括:
第二提取单元,其被配置用于提取待测样本的多种特征;以及
分类单元,其被配置用于基于所述待测样本的所述多种特征,获得与所述多种特征有关的多个预定分类器分别对所述待测样本的分类结果,以确定所述待测样本的最终分类结果;
其中,所述多个预定分类器通过如权利要求1-6中任一项所述的构建装置而获得。
8.一种用于构建分类器的构建方法,包括:
提取多个训练样本中的每一个的多种特征;以及
基于所述多个训练样本的每一个的多种特征,对与所述多种特征中的每一种分别对应的分类器进行训练,以构建包括与所述多种特征对应的多个分类器的目标分类器;
其中,在所述训练的过程中考虑了如下的第一约束:
对于所述多个训练样本中的每一个,在与所述多种特征中的一种特征有关的分类器对该训练样本的分类结果的可信度高于第一预定程度的情况下,若与所述多种特征中的其他一种或其他多种特征有关的分类器对该训练样本的分类结果的可信度低于对应的第二预定程度,则增加对与所述多种特征中的所述其他一种或其他多种特征有关的分类器对该训练样本的分类结果的惩罚。
9.一种分类方法,包括:
提取待测样本的多种特征;以及
基于所述待测样本的所述多种特征,获得与所述多种特征有关的多个预定分类器分别对所述待测样本的分类结果,以确定所述待测样本的最终分类结果;
其中,所述多个预定分类器通过如权利要求8所述的构建方法而获得。
10.一种电子设备,包括如权利要求1-6中任一项所述的构建装置或如权利要求7所述的分类装置。
CN201310270851.3A 2013-07-01 2013-07-01 构建装置和方法、分类装置和方法以及电子设备 Active CN104281569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310270851.3A CN104281569B (zh) 2013-07-01 2013-07-01 构建装置和方法、分类装置和方法以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310270851.3A CN104281569B (zh) 2013-07-01 2013-07-01 构建装置和方法、分类装置和方法以及电子设备

Publications (2)

Publication Number Publication Date
CN104281569A true CN104281569A (zh) 2015-01-14
CN104281569B CN104281569B (zh) 2017-08-01

Family

ID=52256454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310270851.3A Active CN104281569B (zh) 2013-07-01 2013-07-01 构建装置和方法、分类装置和方法以及电子设备

Country Status (1)

Country Link
CN (1) CN104281569B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354589A (zh) * 2015-10-08 2016-02-24 成都唐源电气有限责任公司 一种在接触网图像中智能识别绝缘子裂损的方法及系统
CN106127257A (zh) * 2016-06-30 2016-11-16 联想(北京)有限公司 一种数据分类方法及电子设备
CN106940803A (zh) * 2017-02-17 2017-07-11 平安科技(深圳)有限公司 相关变量识别方法和装置
WO2018014717A1 (zh) * 2016-07-22 2018-01-25 北京市商汤科技开发有限公司 聚类方法、装置及电子设备
CN110288007A (zh) * 2019-06-05 2019-09-27 北京三快在线科技有限公司 数据标注的方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324671B2 (en) * 2001-12-08 2008-01-29 Microsoft Corp. System and method for multi-view face detection
CN101271515A (zh) * 2007-03-21 2008-09-24 株式会社理光 能识别多角度目标的图像检测装置
CN101464954A (zh) * 2007-12-21 2009-06-24 三星电子株式会社 训练多类Boosting分类器的方法
CN102208009A (zh) * 2010-03-31 2011-10-05 索尼公司 分类器及分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7324671B2 (en) * 2001-12-08 2008-01-29 Microsoft Corp. System and method for multi-view face detection
CN101271515A (zh) * 2007-03-21 2008-09-24 株式会社理光 能识别多角度目标的图像检测装置
CN101464954A (zh) * 2007-12-21 2009-06-24 三星电子株式会社 训练多类Boosting分类器的方法
CN102208009A (zh) * 2010-03-31 2011-10-05 索尼公司 分类器及分类方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105354589A (zh) * 2015-10-08 2016-02-24 成都唐源电气有限责任公司 一种在接触网图像中智能识别绝缘子裂损的方法及系统
CN106127257A (zh) * 2016-06-30 2016-11-16 联想(北京)有限公司 一种数据分类方法及电子设备
WO2018014717A1 (zh) * 2016-07-22 2018-01-25 北京市商汤科技开发有限公司 聚类方法、装置及电子设备
US11080306B2 (en) 2016-07-22 2021-08-03 Beijing Sensetime Technology Development Co., Ltd. Method and apparatus and electronic device for clustering
CN106940803A (zh) * 2017-02-17 2017-07-11 平安科技(深圳)有限公司 相关变量识别方法和装置
CN106940803B (zh) * 2017-02-17 2018-04-17 平安科技(深圳)有限公司 相关变量识别方法和装置
CN110288007A (zh) * 2019-06-05 2019-09-27 北京三快在线科技有限公司 数据标注的方法、装置及电子设备
CN110288007B (zh) * 2019-06-05 2021-02-02 北京三快在线科技有限公司 数据标注的方法、装置及电子设备

Also Published As

Publication number Publication date
CN104281569B (zh) 2017-08-01

Similar Documents

Publication Publication Date Title
RU2678716C1 (ru) Использование автоэнкодеров для обучения классификаторов текстов на естественном языке
US9704102B2 (en) Sparse factor analysis for analysis of user content preferences
CN104281569B (zh) 构建装置和方法、分类装置和方法以及电子设备
CN105279495A (zh) 一种基于深度学习和文本总结的视频描述方法
CN108898181B (zh) 一种图像分类模型的处理方法、装置及存储介质
CN105335756A (zh) 一种鲁棒学习模型与图像分类系统
CN102402569A (zh) 评价预测装置、评价预测方法以及程序
Mellor et al. Application of data mining to “big data” acquired in audiology: Principles and potential
CN113448843B (zh) 基于缺陷分析的图像识别软件测试数据增强方法及装置
WO2020234984A1 (ja) 学習装置、学習方法、コンピュータプログラム及び記録媒体
WO2023280229A1 (zh) 图像处理方法、电子设备及存储介质
Rosli et al. Development of CNN transfer learning for dyslexia handwriting recognition
Rohit et al. Machine intelligence based personality prediction using social profile data
CN110796260B (zh) 一种基于类扩张学习的神经网络模型优化方法
CN116385791A (zh) 基于伪标签的重加权半监督图像分类方法
Kariluoto et al. Quality of data in machine learning
CN1952919A (zh) 考虑全局数据结构的学习机
US10546246B2 (en) Enhanced kernel representation for processing multimodal data
CN103310221B (zh) 图像处理装置、图像处理方法以及设备
JP2010272004A (ja) 判別装置及び判別方法、並びにコンピューター・プログラム
CN112784635A (zh) 信息处理装置和方法以及利用模型分类的装置
CN114708127B (zh) 一种学生积分制综合考核方法及系统
CN103312938B (zh) 视频处理装置、视频处理方法以及设备
CN111837185A (zh) 基于约束半非负矩阵分解的声音分类方法、装置及介质
CN109284376A (zh) 基于领域自适应的跨领域新闻数据情感分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant