CN109919165A - 一种基于相似度的多示例字典学习分类方法及装置 - Google Patents
一种基于相似度的多示例字典学习分类方法及装置 Download PDFInfo
- Publication number
- CN109919165A CN109919165A CN201910204869.0A CN201910204869A CN109919165A CN 109919165 A CN109919165 A CN 109919165A CN 201910204869 A CN201910204869 A CN 201910204869A CN 109919165 A CN109919165 A CN 109919165A
- Authority
- CN
- China
- Prior art keywords
- positive
- negative
- similarity
- class
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000013016 learning Effects 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 120
- 238000012706 support-vector machine Methods 0.000 claims description 20
- 238000013499 data model Methods 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 5
- 241000282376 Panthera tigris Species 0.000 description 7
- 241001269238 Data Species 0.000 description 6
- 241000406668 Loxodonta cyclotis Species 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 241000283073 Equus caballus Species 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 241000282817 Bovidae Species 0.000 description 2
- 241000282461 Canis lupus Species 0.000 description 2
- 241000402754 Erythranthe moschata Species 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000282320 Panthera leo Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 241000282374 Puma concolor Species 0.000 description 2
- 241000270295 Serpentes Species 0.000 description 2
- 241000282458 Ursus sp. Species 0.000 description 2
- 241000282485 Vulpes vulpes Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000283070 Equus zebra Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于相似度的多示例字典学习分类方法,包括:获得训练集;针对从正包集合中选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练分类器,直至满足预设的迭代停止条件:分别计算训练集中每个示例对于正类和负类的相似性权重;将训练集中每个示例经过字典学习,获得每个示例的稀疏编码;学习一个投影字典,将每个示例的稀疏编码重新表示;基于投影重新表示的每个示例及每个示例的相似性权重,训练分类器;基于训练后的分类器,获得目标包所属类别。应用本发明实施例所提供的技术方案,可以对目标包进行类别的准确确定,提高了分类器的分类效果。本发明还公开了一种基于相似度的多示例字典学习分类装置,具有相应技术效果。
Description
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种基于相似度的多示例字典学习分类方法及装置。
背景技术
随着计算机技术的快速发展,多示例学习的受关注程度越来越高。多示例学习被提出是用来解决包的分类问题的,包中由许多示例所构成。对于一个正包,它至少包含一个正示例,相反的,对于负包,它仅仅由负示例所构成。
如今,多示例学习已经广泛地应用于多种现实领域,例如:对于药物分子活性预测、数据挖掘、图像分类、文本分类、恶意软件分类等等。以图像分类为例,大多数情况下,是将整副图像进行标记,而不是将图像中的每个区域进行标记。如图1所示,在这副被标记为“马”的图像中,除了包含与标记为“马”对应的区域外,还包含其他与标记无关的区域,如“草地”、“树木”,这些无关的区域往往会成为“噪声”,影响分类器的分类效果。有人提出对图像的每个区域进行精确标记来排除掉这些噪声区域对分类器分类效果的影响,但是这样做需要花费很大的人力、物力。但是,如果把图像分割成许多区域,每个区域看作是一个示例,图像看作是包,则图像分类问题就可以在多示例学习的框架下得以解决。此外,如果图像中至少有一个区域包含所指示的对象,则此图像就被称为正包,否则,这张图像就叫做负包。利用多示例学习可以提高图像分类的效率。
目前,关于多示例学习已经做了很多工作。常见的如Diverse Density(DD)方法,旨在找到一个数据点(目标概念),该数据点与正包中的示例最接近,与负包的示例最远。如果所选数据点与其任何示例之间的距离均小于阈值,则测试包被分类为正。
而在实际应用中,训练集正包中的模糊示例对分类器的训练的影响较大,现有技术中的方法并未考虑到这种影响,导致分类器的分类效果不是很理想,准确率不高。
发明内容
本发明的目的是提供一种基于相似度的多示例字典学习分类方法及装置,以准确确定包的类别,提高分类器的分类效果。
为解决上述技术问题,本发明提供如下技术方案:
一种基于相似度的多示例字典学习分类方法,包括:
获得训练集,所述训练集包含正包集合和负包集合,所述正包集合和所述负包集合中的每个示例均由基于相似性的数据模型表示;
依次从所述正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练基于支持向量机的分类器,直至满足预设的迭代停止条件:
分别计算所述训练集中每个示例对于正类和负类的相似性权重,其中,所述正候选示例与正类和负类的相似性权重分别为1和0,所述负包集合中的每个示例与正类和负类的相似性权重分别为0和1;
将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码;
学习一个投影字典,将每个示例的稀疏编码重新表示;
基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器;
基于训练后的所述分类器,获得待进行类别确定的目标包所属类别。
在本发明的一种具体实施方式中,所述基于相似性的数据模型中的元素包括示例、示例对于正类的相似性权重和示例对于负类的相似性权重。
在本发明的一种具体实施方式中,所述依次从所述正包集合中选择一个正候选示例,包括:
按照所述正包集合中每个示例与所述正包集合的相似度从大到小的顺序,依次将所述正包集合中的每个示例作为正候选示例。
在本发明的一种具体实施方式中,所述分别计算所述训练集中每个示例对于正类和负类的相似性权重,包括:
针对所述训练集中除所述正候选示例和所述负包集合外的每个示例,根据该示例与所述正候选示例的相似度,及该示例与所述负包集合的负相似度,计算该示例对于正类的相似性权重;
根据该示例与所述负包集合的相似度,及该示例与所述正候选示例的负相似度,计算该示例对于负类的相似性权重。
在本发明的一种具体实施方式中,所述将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码,包括:
根据以下公式将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码:
其中,λ和ρ均为大于0的标量常数,是一个合成字典,通过最小化重构误差项获得,是合成字典A的惩罚项,||E||2,1是稀疏编码E=[e1,e2,…,ei,…,el]的惩罚项,用于保持所学习到的特征是稀疏性的,训练集X={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},i=1,2,…,l,l为所述训练集中示例总数,xi表示示例,yi表示标签。
在本发明的一种具体实施方式中,所述学习一个投影字典,将每个示例的稀疏编码重新表示,包括:
通过以下公式学习一个投影字典,将每个示例的稀疏编码重新表示:
其中,表示投影字典,是投影字典P的惩罚项,能够保持投影字典P每一项最小。
在本发明的一种具体实施方式中,所述基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器,包括:
通过以下目标函数,基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器:
其中,xi∈Sq表示从正包集合中被挑选的正候选示例,示例xi拥有一个正标签yi=+1;xj∈Sa和xk∈Sa表示正包集合中未被挑选为正候选示例的模糊示例,对于示例xj它被期望有一个正标签yj=+1,对于示例xk它被期待拥有一个负标签yk=-1;xg∈S-表示负示例,m+(xj)ξj和m-(xk)ξk是误差项,拥有不同的权重,c1、c2、c3、c4是正则化参数,控制超平面余量和误差之间的权衡,W是支持向量机中的超平面;子集Sq中的示例xi对于正类的权重误差为对于负类的权重误差为0;子集Sa中的模糊示例在目标函数中的权重误差为为未被挑选的模糊示例xj对于正类的权重误差,为未被挑选的模糊示例xk对于负类的权重误差;子集S-中的示例xg对于正类的权重误差为0,对于负类的权重误差为
一种基于相似度的多示例字典学习分类装置,包括:
训练集获得模块,用于获得训练集,所述训练集包含正包集合和负包集合,所述正包集合和所述负包集合中的每个示例均由基于相似性的数据模型表示;
分类器训练模块,用于依次从所述正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练基于支持向量机的分类器,直至满足预设的迭代停止条件:
分别计算所述训练集中每个示例对于正类和负类的相似性权重,其中,所述正候选示例与正类和负类的相似性权重分别为1和0,所述负包集合中的每个示例与正类和负类的相似性权重分别为0和1;
将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码;
学习一个投影字典,将每个示例的稀疏编码重新表示;
基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器;
类别确定模块,用于基于训练后的所述分类器,获得待进行类别确定的目标包所属类别。
在本发明的一种具体实施方式中,所述分类器训练模块,具体用于:
按照所述正包集合中每个示例与所述正包集合的相似度从大到小的顺序,依次将所述正包集合中的每个示例作为正候选示例。
在本发明的一种具体实施方式中,所述分类器训练模块,具体用于:
针对所述训练集中除所述正候选示例和所述负包集合外的每个示例,根据该示例与所述正候选示例的相似度,及该示例与所述负包集合的负相似度,计算该示例对于正类的相似性权重;
根据该示例与所述负包集合的相似度,及该示例与所述正候选示例的负相似度,计算该示例对于负类的相似性权重。
应用本发明实施例所提供的技术方案,将字典学习与多示例学习相结合构建一个统一的模型,从训练集的正包集合中挑选正候选示例,将训练集中的正包集合中的未被挑选的模糊示例对于正类和负类分别产生两个相似性权重,基于多示例数据经过字典学习后重新表示的稀疏编码数据和未被挑选的模糊示例的相似性权重构建基于支持向量机(SVM)的分类器,利用训练后获得的分类器可以对目标包进行类别的准确确定,提高了分类器的分类效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种图像的示意图;
图2为本发明实施例中一种基于相似度的多示例字典学习分类方法的实施流程图;
图3为本发明实施例中字典学习示意图;
图4为本发明实施例中一种基于相似度的多示例字典学习分类装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图2所示,为本发明实施例所提供的一种基于相似度的多示例字典学习分类方法的实施流程图,该方法可以包括以下步骤:
S210:获得训练集。
训练集包含正包集合和负包集合,正包集合和负包集合中的每个示例均由基于相似性的数据模型表示。
在实际应用中,可以根据待进行类别确定的包的类型选取相应的训练集。如要进行图像分类,可以选取Tiger数据集作为训练集,Tiger数据集的正包是由100个老虎图像组成,而负包是通过从其他动物中选择100个图像而形成的,例如熊、猫、狼、绵羊、狮子、鹰、斑马、蛇、美洲狮、羚羊等。
训练集中的正包构成的集合为正包集合,训练集中的负包构成的集合为负包集合。正包集合和负包集合中均有多个示例。
可以先将训练集中所有包中的示例重新排列为:
X={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},i=1,2,…,l。
X表示训练集,xi表示示例,具体可以是示例的特征向量,yi表示标签,l为训练集中示例总数。
然后,将每个示例转换为基于相似性的数据模型,即每个示例均由基于相似性的数据模型表示。基于相似性的数据模型中的元素包括示例、示例对于正类的相似性权重和示例对于负类的相似性权重。如下式(1)所示:
{x,m+(x),m-(x)} (1)
其中,x可以表示任意一个示例,m+(x)表示该示例x对于正类的相似性权重,m-(x)表示该示例x对于负类的相似性权重。并且,0≤m+(x)≤1,0≤m-(x)≤1。
S220:依次从正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行步骤S221至步骤S224,循环迭代,训练基于支持向量机的分类器,直至训练后的分类器满足预设条件。
在本发明实施例中,给定一个示例x和一个子集S,示例x和子集S的相似度可以基于以下公式(2)获得:
其中,R(x,S)表示示例x与子集S的相似度,|S|表示子集S的大小。利用指数函数可以使得R(x,S)的取值范围在0和1之间。当示例x与子集S的相似度很大时,R(x,S)就越接近于1。当示例x与子集S的相似度很小时,R(x,S)就越接近于0。
给定一个示例x,子集S+和S-,示例x和子集S+的相似度可以基于以下公式(3)获得:
其中,子集S+表示训练集的正包集合,子集S-表示训练集的负包集合,R(x,S+)表示示例x和子集S+的相似度,当R(x,S+)的值越大,示例x和子集S+就越相似。R(x,S-)表示示例x和子集S-的相似度,1-R(x,S-)表示示例x和子集S-的负相似度。当示例x越接近于子集S+和远离子集S-,G(x∈S+|S+∪S-)的值就越大。也就是说,示例x更类似于一个正示例而不太可能是一个负示例。
对于正包如果其中的示例x满足以下条件,则可以将其挑选为正候选示例:
可以按照正包集合中每个示例与正包集合的相似度从大到小的顺序,依次将正包集合中的每个示例作为正候选示例。即将G(x∈S+|S+∪S-)最大值对应的示例作为正候选示例。可以将正候选示例放到子集Sq中,对于正包集合中未被挑选的模糊示例可以将其放在子集Sa中。
S221:分别计算训练集中每个示例对于正类和负类的相似性权重。
其中,正候选示例与正类和负类的相似性权重分别为1和0,负包集合中的每个示例与正类和负类的相似性权重分别为0和1。
基于相似性数据模型,训练集可以转换为一个伪数据集,伪数据集由三部分组成:子集Sq、子集S-和子集Sa。其中,子集Sq中包含正候选示例,{x,1,0};子集S-中包含负包集合中的所有负示例,{x,0,1};子集Sa包含正包集合中未被挑选为正候选示例的模糊示例,{x,m+(x),m-(x)}。可以看出,子集Sq中的正候选示例与正类和负类的相似性权重分别为1和0,子集S-中的每个示例与正类和负类的相似性权重分别为0和1,对于子集Sa中未被挑选为正候选示例的模糊示例,其与正类和负类的相似性权重m+(x)和m-(x)是未知的。
在本发明实施例中,计算相似性权重m+(x)的基本思想是:通过考虑示例与正类的相似度和示例与负类的负相似度来计算,同样,m-(x)是通过考虑示例与正类的负相似度以及示例与负类的相似度来计算。
即针对训练集中除正候选示例和负包集合外的每个示例,根据该示例与正候选示例的相似度,及该示例与负包集合的负相似度,计算该示例对于正类的相似性权重;
根据该示例与负包集合的相似度,及该示例与正候选示例的负相似度,计算该示例对于负类的相似性权重。
具体的,子集Sa中的未被挑选为正候选示例的模糊示例x与正类和负类对应的相似性权重可以通过以下公式(5)、(6)计算得到:
在步骤S220中,根据可以从训练集的正包集合中挑选正候选示例放到子集Sq中,而子集S-是训练集中所有负包集合中的示例,所以,子集Sq和子集S-是可以被确定的。
当给定子集Sq和子集S-,可以计算出示例x对于正类的相似性权重m+(x)和对于负类的相似性权重m-(x)。
S222:将训练集中每个示例经过字典学习,获得每个示例的稀疏编码。
字典学习,是通过使用合成字典的线性组合来表示输入数据,如图3所示,字典学习得到的稀疏编码E通常可以减少数据X的冗余信息并提高分类器的判别力,已成功应用于计算机视觉和图像分析领域的各种实际问题中。
这里X表示输入数据,D表示字典学习的字典构造原子,E表示重构得到的稀疏编码系数。重构得到的稀疏编码系数E用于分类将变得非常有效,它不仅能够减少数据的冗余信息,降低训练集中噪声对分类效果的影响,还能够提高分类器的判别能力。
在本发明实施例中,可以根据以下公式将训练集中每个示例经过字典学习,获得每个示例的稀疏编码,示例重新表示的稀疏系数:
其中,λ和ρ均为大于0的标量常数,是一个合成字典,通过最小化重构误差项获得,是合成字典A的惩罚项,||E||2,1是稀疏编码E=[e1,e2,…,ei,…,el]的惩罚项,用于保持所学习到的特征是稀疏性的,训练集X={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},i=1,2,…,l,l为训练集中示例总数,xi表示示例,yi表示标签。
在实际应用中,可以通过计算具有K个原子的合成字典A来获得训练集X中每个示例的稀疏表示。目前,大多数字典学习模型对于规则化稀疏编码系数项采用的是l0范数或者是l1范数,但是在计算时会非常耗时。值得一提的是,l2,1范数规则化项能够保证稀疏编码系数行稀疏,最重要的是优化解决l2,1范数规则化项是非常有效的。所以,本发明实施例通过上述公式(7)将训练集中每个示例经过字典学习,获得每个示例的稀疏编码。
S223:学习一个投影字典,将每个示例的稀疏编码重新表示。
传统的字典学习模型旨在学习合成字典A和稀疏编码E以稀疏地表示数据X,可以学习一个投影字典去分析获得稀疏编码系数E,这样稀疏编码系数可以近似为E≈PX,之后重新表示的数据将变得非常有效。这里的投影字典能够通过从给定的数据中计算特征来桥接具有近似编码系数的数据。
具体的,可以通过以下公式(8)学习一个投影字典,将每个示例的稀疏编码重新表示:
其中,表示投影字典,是投影字典P的惩罚项,能够保持投影字典P每一项最小。
S224:基于投影重新表示的每个示例及每个示例的相似性权重,训练分类器。
将投影重新表示的示例加上示例的相似性权重一同训练基于支持向量机(SVM)的分类器。
目前,大多数存在的字典学习模型只是学习一个合成字典,之后将学习得到的输入数据的稀疏编码直接作为特征用于分类。本发明实施例是学习一个合成字典A和一个投影字典P,之后将学习得到的稀疏编码E近似为E≈PX,也就是说,单个示例的每一项对应于学习得到的稀疏编码系数的每一项,ei≈Pxi,这样输入数据的稀疏编码E可以被分析获得,使得被重新表示的多示例数据变得非常有效。之后将Pxi作为特征用于分类。
对于子集Sa中的未被挑选为正候选示例的模糊示例,其与两个相似性权重相关联,这两个相似性权重分别表示其与正类和负类相对应的相似性。然后,基于所选择的正示例、负示例、未选择的示例及其相似度权重,建立基于相似度的多示例字典学习模型。目标函数f如以下公式(9)所示:
其中,xi∈Sq表示从正包集合中被挑选的正候选示例,示例xi拥有一个正标签yi=+1;xj∈Sa和xk∈Sa表示正包集合中未被挑选为正候选示例的模糊示例,对于示例xj它被期望有一个正标签yj=+1,对于示例xk它被期待拥有一个负标签yk=-1;xg∈S-表示负示例,m+(xj)ξj和m-(xk)ξk是误差项,拥有不同的权重,c1、c2、c3、c4是正则化参数,控制超平面余量和误差之间的权衡,W是支持向量机中的超平面;子集Sq中的示例xi对于正类的权重误差为对于负类的权重误差为0;子集Sa中的模糊示例在目标函数中的权重误差为为未被挑选的模糊示例xj对于正类的权重误差,为未被挑选的模糊示例xk对于负类的权重误差;子集S-中的示例xg对于正类的权重误差为0,对于负类的权重误差为
针对选择出的每个正候选示例,重复执行上述步骤S221至步骤S224的操作,循环迭代可以计算出合成字典、稀疏编码、投影字典和分类器。直至满足预设的迭代停止条件,获得训练后的分类器。
迭代停止条件为:f(t)-f(t+1)≤ωf(t),其中,f(t)和f(t+1)分别为f在迭代第t次和第t+1次的值,ω是一个阈值,可以根据实际情况进行设定和调整,如设置为0.01。
在实际应用中,可以通过一个交互式迭代框架固定其他变量来更新每个变量,来求解模型,得到分类器。
S230:基于训练后的分类器,获得待进行类别确定的目标包所属类别。
目标包为待进行类别确定的包,基于训练后的分类器,可以获得目标包所属类别。
本发明实施例将字典学习、投影字典学习结合到多示例学习中以获得一个统一的模型。对于在正包中难以获得的示例标签,首先通过基于相似性的数据模型从正包中挑选初始化的正候选示例。对于正包中剩余的未被选择的模糊示例,并未被忽略,分别将其生成两个相似性权重来表示对正类和负类的相似性。然后,通过字典学习和投影表示对多示例数据进行重新表示,将重新表示的多示例数据和模糊示例的相似性权重结合到学习阶段,构造基于支持向量机(SVM)的分类器。通过最小化重构误差来获得投影字典,并且所学习的投影字典能够将输入示例数据与稀疏码桥接,从而能够分析获得稀疏编码,也就是说,通过学习投影字典,多示例数据经过合成字典学习后的稀疏编码可以被分析获得,且将字典学习和分类器训练结合在一个框架下共同学习,将更有利于分类。最后,利用交互式框架对模型进行求解,得到分类器。基于训练获得的分类器,对目标包进行类别的确定。
应用本发明实施例所提供的方法,将字典学习与多示例学习相结合构建一个统一的模型,从训练集的正包集合中挑选正候选示例,将训练集中的正包集合中的未被挑选的模糊示例对于正类和负类分别产生两个相似性权重,基于多示例数据经过字典学习后重新表示的稀疏编码数据和未被挑选的模糊示例的相似性权重构建基于支持向量机(SVM)的分类器,利用训练后获得的分类器可以对目标包进行类别的准确确定,提高了分类器的分类效果。
在实际应用中,训练集所基于的数据集有很多,如Musk、Fox、tiger、Elephant数据集。Musk数据集是公开可用的数据集,由Dietterich等人在药物分子活性问题中引入。Musk数据集由Musk1和Musk2数据集组成,Musk1数据集包含47个正包和45个负包,总共有476个示例。Musk2数据集有39个正包和63个负包,总共有6598个示例。在这个数据集中,药物分子被看作是一个包,每个分子形状都被看作一个示例,每个示例由一个166维的特征向量表示。Stuart Andrews提出了用于图像注释的Fox、Tiger和Elephant数据集。Fox、Tiger和Elephant的每个数据集都有100个正包和100个负包。在Tiger数据集中,正包是由100个老虎图像组成,而负包是通过从其他动物中选择100个图像而形成的,例如熊、猫、狼、绵羊、狮子、鹰、斑马、蛇、美洲狮、羚羊等。每个图像都被视为一个包,每个区域都被当作一个示例。大象和狐狸数据集的形成方式与老虎数据集相似。表1为根据正负包的数量、示例和特征总结的上述这些数据集。
数据集 | 正包数量 | 负包数量 | 特征维度 | 示例总数 |
Musk1 | 47 | 45 | 166 | 476 |
Musk2 | 39 | 63 | 166 | 6598 |
Fox | 100 | 100 | 230 | 1220 |
Tiger | 100 | 100 | 100 | 1320 |
Elephant | 100 | 100 | 230 | 1391 |
表1
为了充分说明本发明实施例的优越性,对本发明实施例的技术方案(Our method)与其它多示例学习方案和多示例字典学习方案进行性能对比。以分类准确率为标准,具体实验结果可参见下表2。
表2
本发明实施例所提供的技术方案,其分类准确率在Musk1、Musk2、Fox、Tiger和Elephant数据集比其他多示例学习方法(mi-SVM、MI-SVM、EM-DD、SMILE)和多示例字典学习方法(DMIL)的分类准确度都高,而且在整体性能上优于APR方案的。
相应于上面的方法实施例,本发明实施例还提供了一种基于相似度的多示例字典学习分类确定装置,下文描述的基于相似度的多示例字典学习分类装置与上文描述的基于相似度的多示例字典学习分类方法可相互对应参照。
参见图4所示,该装置可以包括以下模块:
训练集获得模块410,用于获得训练集,训练集包含正包集合和负包集合,正包集合和负包集合中的每个示例均由基于相似性的数据模型表示;
分类器训练模块420,用于依次从正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练基于支持向量机的分类器,直至满足预设的迭代停止条件:
分别计算训练集中每个示例对于正类和负类的相似性权重,其中,正候选示例与正类和负类的相似性权重分别为1和0,负包集合中的每个示例与正类和负类的相似性权重分别为0和1;
将训练集中每个示例经过字典学习,获得每个示例的稀疏编码;
学习一个投影字典,将每个示例的稀疏编码重新表示;
基于投影重新表示的每个示例及每个示例的相似性权重,训练分类器;
类别确定模块430,用于基于训练后的分类器,获得待进行类别确定的目标包所属类别。
应用本发明实施例所提供的装置,将字典学习与多示例学习相结合构建一个统一的模型,从训练集的正包集合中挑选正候选示例,将训练集中的正包集合中的未被挑选的模糊示例对于正类和负类分别产生两个相似性权重,基于多示例数据经过字典学习后重新表示的稀疏编码数据和未被挑选的模糊示例的相似性权重构建基于支持向量机(SVM)的分类器,利用训练后获得的分类器可以对目标包进行类别的准确确定,提高了分类器的分类效果。
在本发明的一种具体实施方式中,基于相似性的数据模型中的元素包括示例、示例对于正类的相似性权重和示例对于负类的相似性权重。
在本发明的一种具体实施方式中,分类器训练模块420,具体用于:
按照正包集合中每个示例与正包集合的相似度从大到小的顺序,依次将正包集合中的每个示例作为正候选示例。
在本发明的一种具体实施方式中,分类器训练模块420,具体用于:
针对训练集中除正候选示例和负包集合外的每个示例,根据该示例与正候选示例的相似度,及该示例与负包集合的负相似度,计算该示例对于正类的相似性权重;
根据该示例与负包集合的相似度,及该示例与正候选示例的负相似度,计算该示例对于负类的相似性权重。
在本发明的一种具体实施方式中,分类器训练模块420,具体用于:
根据以下公式将训练集中每个示例经过字典学习,获得每个示例的稀疏编码:
其中,λ和ρ均为大于0的标量常数,是一个合成字典,通过最小化重构误差项获得,是合成字典A的惩罚项,||E||2,1是稀疏编码E=[e1,e2,…,ei,…,el]的惩罚项,用于保持所学习到的特征是稀疏性的,训练集X={(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl)},i=1,2,…,l,l为训练集中示例总数,xi表示示例,yi表示标签。
在本发明的一种具体实施方式中,分类器训练模块420,具体用于:
通过以下公式学习一个投影字典,将每个示例的稀疏编码重新表示:
其中,表示投影字典,是投影字典P的惩罚项,能够保持投影字典P每一项最小。
在本发明的一种具体实施方式中,分类器训练模块420,具体用于:
通过以下目标函数,基于投影重新表示的每个示例及每个示例的相似性权重,训练分类器:
其中,xi∈Sq表示从正包集合中被挑选的正候选示例,示例xi拥有一个正标签yi=+1;xj∈Sa和xk∈Sa表示正包集合中未被挑选为正候选示例的模糊示例,对于示例xj它被期望有一个正标签yj=+1,对于示例xk它被期待拥有一个负标签yk=-1;xg∈S-表示负示例,m+(xj)ξj和m-(xk)ξk是误差项,拥有不同的权重,c1、c2、c3、c4是正则化参数,控制超平面余量和误差之间的权衡,W是支持向量机中的超平面;子集Sq中的示例xi对于正类的权重误差为对于负类的权重误差为0;子集Sa中的模糊示例在目标函数中的权重误差为为未被挑选的模糊示例xj对于正类的权重误差,为未被挑选的模糊示例xk对于负类的权重误差;子集S-中的示例xg对于正类的权重误差为0,对于负类的权重误差为
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (10)
1.一种基于相似度的多示例字典学习分类方法,其特征在于,包括:
获得训练集,所述训练集包含正包集合和负包集合,所述正包集合和所述负包集合中的每个示例均由基于相似性的数据模型表示;
依次从所述正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练基于支持向量机的分类器,直至满足预设的迭代停止条件:
分别计算所述训练集中每个示例对于正类和负类的相似性权重,其中,所述正候选示例与正类和负类的相似性权重分别为1和0,所述负包集合中的每个示例与正类和负类的相似性权重分别为0和1;
将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码;
学习一个投影字典,将每个示例的稀疏编码重新表示;
基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器;
基于训练后的所述分类器,获得待进行类别确定的目标包所属类别。
2.根据权利要求1所述的方法,其特征在于,所述基于相似性的数据模型中的元素包括示例、示例对于正类的相似性权重和示例对于负类的相似性权重。
3.根据权利要求1所述的方法,其特征在于,所述依次从所述正包集合中选择一个正候选示例,包括:
按照所述正包集合中每个示例与所述正包集合的相似度从大到小的顺序,依次将所述正包集合中的每个示例作为正候选示例。
4.根据权利要求1所述的方法,其特征在于,所述分别计算所述训练集中每个示例对于正类和负类的相似性权重,包括:
针对所述训练集中除所述正候选示例和所述负包集合外的每个示例,根据该示例与所述正候选示例的相似度,及该示例与所述负包集合的负相似度,计算该示例对于正类的相似性权重;
根据该示例与所述负包集合的相似度,及该示例与所述正候选示例的负相似度,计算该示例对于负类的相似性权重。
5.根据权利要求1至4之中任一项所述的方法,其特征在于,所述将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码,包括:
根据以下公式将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码:
其中,λ和ρ均为大于0的标量常数,是一个合成字典,通过最小化重构误差项获得,是合成字典A的惩罚项,||E||2,1是稀疏编码E=[e1,e2,…,ei,…,el]的惩罚项,用于保持所学习到的特征是稀疏性的,训练集X={(x1,y1),(x2,y2),…(x1,y1),…,(x1,y1)},i=1,2,…,l,l为所述训练集中示例总数,xi表示示例,yi表示标签。
6.根据权利要求5所述的方法,其特征在于,所述学习一个投影字典,将每个示例的稀疏编码重新表示,包括:
通过以下公式学习一个投影字典,将每个示例的稀疏编码重新表示:
其中,表示投影字典,是投影字典P的惩罚项,能够保持投影字典P每一项最小。
7.根据权利要求6所述的方法,其特征在于,所述基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器,包括:
通过以下目标函数,基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器:
其中,xi∈Sq表示从正包集合中被挑选的正候选示例,示例xi拥有一个正标签yi=+1;xj∈Sa和xk∈Sa表示正包集合中未被挑选为正候选示例的模糊示例,对于示例xj它被期望有一个正标签yj=+1,对于示例xk它被期待拥有一个负标签yk=-1;xg∈S-表示负示例,m+(xj)ξj和m-(xk)ξk是误差项,拥有不同的权重,c1、c2、c3、c4是正则化参数,控制超平面余量和误差之间的权衡,W是支持向量机中的超平面;子集Sq中的示例xi对于正类的权重误差为对于负类的权重误差为0;子集Sa中的模糊示例在目标函数中的权重误差为 为未被挑选的模糊示例xj对于正类的权重误差,为未被挑选的模糊示例xk对于负类的权重误差;子集S-中的示例xg对于正类的权重误差为0,对于负类的权重误差为
8.一种基于相似度的多示例字典学习分类装置,其特征在于,包括:
训练集获得模块,用于获得训练集,所述训练集包含正包集合和负包集合,所述正包集合和所述负包集合中的每个示例均由基于相似性的数据模型表示;
分类器训练模块,用于依次从所述正包集合中选择一个正候选示例,针对选择出的每个正候选示例,重复执行以下步骤,循环迭代,训练基于支持向量机的分类器,直至满足预设的迭代停止条件:
分别计算所述训练集中每个示例对于正类和负类的相似性权重,其中,所述正候选示例与正类和负类的相似性权重分别为1和0,所述负包集合中的每个示例与正类和负类的相似性权重分别为0和1;
将所述训练集中每个示例经过字典学习,获得每个示例的稀疏编码;
学习一个投影字典,将每个示例的稀疏编码重新表示;
基于投影重新表示的每个示例及每个示例的相似性权重,训练所述分类器;
类别确定模块,用于基于训练后的所述分类器,获得待进行类别确定的目标包所属类别。
9.根据权利要求8所述的装置,其特征在于,所述分类器训练模块,具体用于:
按照所述正包集合中每个示例与所述正包集合的相似度从大到小的顺序,依次将所述正包集合中的每个示例作为正候选示例。
10.根据权利要求8或9所述的装置,其特征在于,所述分类器训练模块,具体用于:
针对所述训练集中除所述正候选示例和所述负包集合外的每个示例,根据该示例与所述正候选示例的相似度,及该示例与所述负包集合的负相似度,计算该示例对于正类的相似性权重;
根据该示例与所述负包集合的相似度,及该示例与所述正候选示例的负相似度,计算该示例对于负类的相似性权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910204869.0A CN109919165B (zh) | 2019-03-18 | 2019-03-18 | 一种基于相似度的多示例字典学习分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910204869.0A CN109919165B (zh) | 2019-03-18 | 2019-03-18 | 一种基于相似度的多示例字典学习分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109919165A true CN109919165A (zh) | 2019-06-21 |
CN109919165B CN109919165B (zh) | 2021-07-06 |
Family
ID=66965385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910204869.0A Expired - Fee Related CN109919165B (zh) | 2019-03-18 | 2019-03-18 | 一种基于相似度的多示例字典学习分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109919165B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368917A (zh) * | 2020-03-04 | 2020-07-03 | 西安邮电大学 | 一种用于刑侦图像分类的多示例集成学习方法 |
CN112598622A (zh) * | 2020-12-03 | 2021-04-02 | 天津理工大学 | 一种融合深度多示例学习和包间相似性的乳腺癌检测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140010415A1 (en) * | 2012-07-09 | 2014-01-09 | Canon Kabushiki Kaisha | Image processing apparatus, method thereof, and computer-readable storage medium |
CN105930792A (zh) * | 2016-04-19 | 2016-09-07 | 武汉大学 | 一种基于视频局部特征字典的人体动作分类方法 |
CN106127247A (zh) * | 2016-06-21 | 2016-11-16 | 广东工业大学 | 基于多任务多示例支持向量机的图像分类方法 |
CN106815599A (zh) * | 2016-12-16 | 2017-06-09 | 合肥工业大学 | 一种图像分类中通用的判别性稀疏编码字典学习方法 |
CN109034200A (zh) * | 2018-06-22 | 2018-12-18 | 广东工业大学 | 一种基于联合稀疏表示和多视图字典学习的学习方法 |
CN109165673A (zh) * | 2018-07-18 | 2019-01-08 | 广东工业大学 | 基于度量学习和多示例支持向量机的图像分类方法 |
-
2019
- 2019-03-18 CN CN201910204869.0A patent/CN109919165B/zh not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140010415A1 (en) * | 2012-07-09 | 2014-01-09 | Canon Kabushiki Kaisha | Image processing apparatus, method thereof, and computer-readable storage medium |
CN105930792A (zh) * | 2016-04-19 | 2016-09-07 | 武汉大学 | 一种基于视频局部特征字典的人体动作分类方法 |
CN106127247A (zh) * | 2016-06-21 | 2016-11-16 | 广东工业大学 | 基于多任务多示例支持向量机的图像分类方法 |
CN106815599A (zh) * | 2016-12-16 | 2017-06-09 | 合肥工业大学 | 一种图像分类中通用的判别性稀疏编码字典学习方法 |
CN109034200A (zh) * | 2018-06-22 | 2018-12-18 | 广东工业大学 | 一种基于联合稀疏表示和多视图字典学习的学习方法 |
CN109165673A (zh) * | 2018-07-18 | 2019-01-08 | 广东工业大学 | 基于度量学习和多示例支持向量机的图像分类方法 |
Non-Patent Citations (2)
Title |
---|
ZHI-HUA ZHOU ET AL;: "《Multi-Instance Learning by Treating Instances As Non-I.I.D. Samples 》", 《ARXIV:0807.1997V4》 * |
杨红红 等;: "《基于包级空间多示例稀疏表示的图像分类算法》", 《西北工业大学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111368917A (zh) * | 2020-03-04 | 2020-07-03 | 西安邮电大学 | 一种用于刑侦图像分类的多示例集成学习方法 |
CN112598622A (zh) * | 2020-12-03 | 2021-04-02 | 天津理工大学 | 一种融合深度多示例学习和包间相似性的乳腺癌检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109919165B (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Varma et al. | Snuba: Automating weak supervision to label training data | |
Jia | Learning semantic image representations at a large scale | |
Bifet et al. | New ensemble methods for evolving data streams | |
CN111814854A (zh) | 一种无监督域适应的目标重识别方法 | |
Vijayanarasimhan et al. | Multi-level active prediction of useful image annotations for recognition | |
Mumtaz et al. | Clustering dynamic textures with the hierarchical em algorithm for modeling video | |
Vijayanarasimhan et al. | Cost-sensitive active visual category learning | |
US20110052063A1 (en) | Consistent hierarchical labeling of image and image regions | |
Song et al. | Localized multiple kernel learning for realistic human action recognition in videos | |
CN109063743B (zh) | 基于半监督多任务学习的医疗数据分类模型的构建方法 | |
CN109948735A (zh) | 一种多标签分类方法、系统、装置及存储介质 | |
KR20200082490A (ko) | 기계 학습 데이터 선택 방법 및 장치 | |
CN110008365A (zh) | 一种图像处理方法、装置、设备及可读存储介质 | |
CN109919165A (zh) | 一种基于相似度的多示例字典学习分类方法及装置 | |
Li et al. | Hierarchical face aging through disentangled latent characteristics | |
CN110175657A (zh) | 一种图像多标签标记方法、装置、设备及可读存储介质 | |
CN110442736B (zh) | 一种基于二次判别分析的语义增强子空间跨媒体检索方法 | |
CN110222737A (zh) | 一种基于长短时记忆网络的搜索引擎用户满意度评估方法 | |
Cheung et al. | A survey of automated data augmentation for image classification: Learning to compose, mix, and generate | |
CN115861902B (zh) | 无监督的动作迁移和发现方法、系统、设备和介质 | |
Jia et al. | Latent task adaptation with large-scale hierarchies | |
CN110738270B (zh) | 基于均值迭代的多任务学习模型训练以及预测方法 | |
Zhang et al. | Sequential labeling with structural SVM under nondecomposable losses | |
US20230267175A1 (en) | Systems and methods for sample efficient training of machine learning models | |
JP5633424B2 (ja) | プログラム及び情報処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210706 |