CN108647711B - 基于引力模型的图像的多标签分类方法 - Google Patents

基于引力模型的图像的多标签分类方法 Download PDF

Info

Publication number
CN108647711B
CN108647711B CN201810433859.XA CN201810433859A CN108647711B CN 108647711 B CN108647711 B CN 108647711B CN 201810433859 A CN201810433859 A CN 201810433859A CN 108647711 B CN108647711 B CN 108647711B
Authority
CN
China
Prior art keywords
label
data
picture sample
detected
positive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810433859.XA
Other languages
English (en)
Other versions
CN108647711A (zh
Inventor
李兆玉
王纪超
陈翔
朱红梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201810433859.XA priority Critical patent/CN108647711B/zh
Publication of CN108647711A publication Critical patent/CN108647711A/zh
Application granted granted Critical
Publication of CN108647711B publication Critical patent/CN108647711B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本发明涉及机器学习领域,特别涉及一种基于引力模型的多标签分类方法,包括:获取有标签的样本集作为训练样本集;计算训练样本与其他训练样本的距离并排序,得到该训练样本的近邻集合;在近邻集合中,以标签之间的正相关性构建正相关矩阵,标签之间的负相关性构建负相关矩阵;计算出待测样本的近邻集合,并根据近邻集合构建待测正相关矩阵和待测负相关矩阵;将待测正相关矩阵和待测负相关矩阵得到正相关数据粒和负相关数据粒;构建引力模型,并通过待测样本与正相关数据粒和负相关数据粒之间的引力关系进行分类;本发明引入对标签间负相关关系的考虑,充分利用了标签间的相关性,并且在近邻集合中发掘相关关系,避免了全局计算,降低了复杂度。

Description

基于引力模型的图像的多标签分类方法
技术领域
本发明涉及机器学习领域,特别涉及一种基于引力模型的图像的多标签分类方法。
背景技术
在机器学习领域,分类问题占有很大比例。传统机器学习以二类分类或者多类分类为主,其目的是将每个待分类数据准确地划分到某一类别当中。这样的单分类问题和多分类问题可以统称为单标签分类(single-label classification)。在实际应用中,多数分类任务需要面对的是多标签分类(multi-label classificaiton)问题。例如一张图片,画面内容可能包含多种元素,如沙滩、大海、高楼、人物等。对这样的图片进行类别划分即属于多标签分类任务。
现有图像的多标签分类方法主要采用两种思路,一种是问题转化法,将多标签问题转化成多个单标签问题,用单标签分类方法进行分类;另一种是算法适应法,对单标签方法进行改进来使其能够处理多标签分类问题。现有的算法适应法主要从利用标签相关性出发来进行分类方法的设计或改进。多标签数据具有丰富的标签信息,标签与标签之间也具有一定的相关性,对标签相关性的发掘能够有效提升图像的多标签分类方法的分类效果。而现有方法不能很好的利用标签相关性或者在对标签相关性的发掘中导致了分类方法的复杂度急剧上升。因此采用合适的方式对多标签数据的标签相关性进行利用并保证分类方法不会过于复杂能够有效提升图像的多标签分类方法的分类效果。
发明内容
为了避免了全局计算,降低了复杂度,本发明提出一种基于引力模型的图像的多标签分类方法,包括:
S1、获取有标签的图片样本集作为训练图片样本集,其中每一个训练图片样本包括特征部分和标签部分,且标签部分包括多个类别的标签;
S2、计算一个训练图片样本与其他训练图片样本的距离并排序,得到该训练图片样本的近邻集合;
S3、在近邻集合中,以标签之间的正相关性构建正相关矩阵,标签之间的负相关性构建负相关矩阵;
S4、计算出待测图片样本的近邻集合,并根据近邻集合构建待测正相关矩阵和待测负相关矩阵,其中待检测图片样本包括特征部分和标签部分,且标签部分为空;
S5、将待测正相关矩阵的每一列粒化,得到正相关数据粒;将待测负相关矩阵的每一列粒化,得到负相关数据粒;
S6、构建引力模型,并通过待测图片样本与正相关数据粒和负相关数据粒之间的引力关系进行分类。
优选的,步骤S2包括:
S21、对于任一训练图片样本xt,其特征部分为Xi、标签部分为Yi,训练图片样本xt表示为xt={(Xi,Yj)|1≤i≤d,Xi∈F;1≤j≤q,Yj∈L},1≤t≤m;
S22、计算训练图片样本xt与训练图片样本集中其他训练图片样本的距离,并将该距离按照升序排序,其中两个训练图片样本之间的距离表示为
Figure GDA0002841660770000021
S23、选取排序结果中前k个,作为训练图片样本xt的近邻集合;
其中,F为特征空间,L为标签空间,m为训练图片样本集中训练图片样本的数量,d为特征的维度,q表示标签的维度;d(xa,xb)表示图片样本xa与图片样本xb之间的距离,Xa,i为训练图片样本xa的第i个特征,Xb,i为训练图片样本xb的第i个特征;1≤a≤m,1≤b≤m。。
优选的,步骤S3包括:
S31、在训练图片样本xt的近邻集合中,用
Figure GDA0002841660770000031
表示第s个标签与第l个标签的正相关性,
Figure GDA0002841660770000032
表示第s个标签与第l个标签的负相关性;
S32、第s个标签与其他所有标签的正相关性的值构成长度为q的正相关性向量CP(xt)s,第s个标签与其他所有标签的负相关性的值构成长度为q的负相关性向量CN(xt)s
S33、由CP(xt)s构成正相关矩阵的每一行,得到正相关矩阵P,CN(xt)s构成负相关矩阵的每一行,得到负相关矩阵N。
优选的,当训练图片样本xt的近邻集合中的图片样本的第s个标签的值为1,第l个标签的值同为1时,第s个标签与第l个标签正相关性
Figure GDA0002841660770000033
加1;当训练图片样本xt的近邻集合中训练图片样本的第s个标签为1,第l个标签为0时,第s个标签与第l个标签负相关性
Figure GDA0002841660770000034
加1。
优选的,步骤S4包括:根据待测图片样本与训练图片样本特征部分间的欧氏距离,筛选出距离待测图片样本最近的k个训练图片样本作为待测图片样本的近邻集合,从正相关矩阵P和负相关矩阵N中筛选出待测图片样本的近邻集合所包含标签对应的正相关性向量和负相关性向量,以待测项目xt'近邻集合中标签的正相关性向量构建待测正相关矩阵P(xt'),负相关性向量为行构建待测负相关矩阵N(xt')n
优选的,步骤S5包括:
S51、计算待测正相关矩阵P(xt')第n列的平均值
Figure GDA0002841660770000035
待测负相关矩阵N(xt')n的第n列的平均值
Figure GDA0002841660770000036
S52、对比第n列中的数据,将P(xt')中第n列中大于平均值
Figure GDA0002841660770000037
的数据集合记为正对比数据I+(xt')n,N(xt')n中第n列中大于平均值
Figure GDA0002841660770000038
的数据集合记为负对比数据I(xt')n
S53、分别计算I+(xt')n的数据质心
Figure GDA0002841660770000041
I-(xt')n的数据质心
Figure GDA0002841660770000042
完成数据粒化,计算包括:
当计算I+(xt')n的数据质心
Figure GDA0002841660770000043
时,
Figure GDA0002841660770000044
W+为I+(xt')n中元素个数,则:
正相关数据粒表示为:
Figure GDA0002841660770000045
当计算I(xt')n的数据质心
Figure GDA0002841660770000046
时,
Figure GDA0002841660770000047
W为I(xt')n中元素个数,则:
负相关数据粒表示为:
Figure GDA0002841660770000048
其中,n={1,2,...,q},q表示标签的维度。
优选的,步骤S6包括:
S61、分别计算正相关数据粒与待测图片样本之间的正数据引力、负相关数据粒与待测图片样本之间的负数据引力;
S62、计算正数据引力与负数据引力的合力;
S63、判断合力方向,若合力方向与正数据引力的方向一致,则待测图片样本拥有此正数据粒对应的标签;否则待测图片样本没有此正数据粒对应的标签。
优选的,步骤S61包括:
S621、根据欧氏距离公式分别计算待测图片样本xt与正数据粒
Figure GDA0002841660770000049
间的距离r+、与负数据粒
Figure GDA00028416607700000410
间的距离r
S622、根据引力计算公式分别计算正数据引力F+、负数据引力F
当计算正数据引力时,则:
Figure GDA00028416607700000411
当计算负数据引力时,则:
Figure GDA00028416607700000412
其中,W+为I+(xt')n中元素个数,W为I-(xt')n中元素个数;g表示重力系数;M表示待测图片样本的质量,为大于零的常数。
本发明引入对标签间负相关关系的考虑,充分利用了标签间的相关性,并且在近邻集合中发掘相关关系,避免了全局计算,降低了复杂度;结合引力模型构造的多标签分类器能够很好的处理分类问题,能够实现较好的分类效果以及合理的复杂度。
附图说明
图1为本发明一种基于引力模型的图像的多标签分类方法的流程图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将结合附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在不付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种基于引力模型的图像的多标签分类方法,如图1,包括:
S1、获取有标签的图片样本集作为训练图片样本集,其中每一个训练图片样本包括特征部分和标签部分,且标签部分包括多个类别的标签;
S2、计算一个训练图片样本与其他训练图片样本的距离并排序,得到该训练图片样本的近邻集合;
S3、在近邻集合中,以标签之间的正相关性构建正相关矩阵,标签之间的负相关性构建负相关矩阵;
S4、计算出待测图片样本的近邻集合,并根据近邻集合构建待测正相关矩阵和待测负相关矩阵,其中待检测图片样本包括特征部分和标签部分,且标签部分为空;
S5、将待测正相关矩阵的每一列粒化,得到正相关数据粒;将待测负相关矩阵的每一列粒化,得到负相关数据粒;
S6、构建引力模型,并通过待测图片样本与正相关数据粒和负相关数据粒之间的引力关系进行分类。
本发明中以图片样本的特征部分计算图片样本之间的距离,以一个标签为一个类别进行分类。
本发明获取的训练图片样本是被标注过的有标签图片样本集,其中每一个图片样本由特征部分和标签部分组成,且标签部分由多个类别标签组成;图片样本的标签(Label)部分是用来对图片样本进行分类的工具,例如一幅图像包括多种元素,比如沙滩、大海和任务等,利用标签可以根据图像包含的元素对图像进行分类;多标签(Multi-Label)和传统的分类问题的区别主要在于多标签下,输出空间呈现指数级增长,那么目前对于Multi-Label的这类特性,学界一般是集中在更好的分析Label之间的相关性,就可以避免这种指数增长。
获取本发明训练图片样本{x1,x2,...,xt,...,xm}且xt∈F中每一个训练图片样本的近邻集时,首先计算一个训练图片样本xt与其他图片样本之间的欧式距离,两个图片样本之间的距离由两个图片样本的特征值决定。
训练图片样本xt包括特征部分Xi和标签部分Yi,训练图片样本xt表示为:
xt={(Xi,Yj)|1≤i≤d,Xi∈F;1≤i≤q,Yj∈L},1≤t≤m;
其中,F为特征空间,L为标签空间,m为训练图片样本集中训练图片样本的数量,d为特征的维度,q表示标签的维度,Xa,i为训练图片样本a的第i个特征,Xb,i为训练图片样本b的第i个特征
图片样本xa与图片样本xb之间的距离,可以表示:
Figure GDA0002841660770000061
1≤a≤m,1≤b≤m
特别地,当图片样本包含这个特征时,特征值为1,否则为0。
其中,将训练图片样本xi与其他样本之间的欧式距离按照升序排序,并将排序的前k个样本作为训练样本xi的近邻集合,其中10%m≤k≤25%m。
对于训练样本xt的近邻集合,标签s的与其他标签的相关性构成长度为q的正相关性向量CP(xt)s,CP(xt)s中的第l个元素为训练图片样本xt的第s个标签与第l个标签相关性的值
Figure GDA0002841660770000071
其中,s、l∈L;由CP(xt)s组成正相关矩阵的每一行,构成正相关矩阵P;同理可以得到负相关性向量CN(xt)s和负相关矩阵N,在此不在赘述。
其中,正相关性向量CP(xt)s、负相关性向量CN(xt)s为长度为q的行向量,初始化元素全为0;当训练图片样本xt的近邻集合中的图片样本的第s个标签的值为1,第l个标签的值同为1时,第s个标签与第l个标签正相关性
Figure GDA0002841660770000072
加1;当训练图片样本xt的近邻集合中训练图片样本的第s个标签为1,第l个标签为0时,第s个标签与第l个标签负相关性
Figure GDA0002841660770000073
加1。
对于待测图片样本xt',根据待测图片样本与训练图片样本特征部分间的欧氏距离,筛选出距离待测图片样本最近的k个训练图片样本作为待测图片样本的近邻集合,从正相关矩阵P和负相关矩阵N中筛选出待测图片样本的近邻集合所包含标签对应的正相关性向量和负相关性向量,以待测项目xt'近邻集合中标签的正相关性向量构建待测正相关矩阵P(xt'),负相关性向量为行构建待测负相关矩阵N(xt')n
在利用引力模型分类的过程中,是利用待测图片样本近邻集合中训练图片样本的正相关性和负相关性进行数据粒化,得到正相关数据粒和负相关数据粒,利用正相关数据粒和负相关数据粒求取与待测图片样本之间的引力的合力方向,来决定待测图片样本是否有某一类的标签。
其中,数据质心的计算包括:
S51、计算待测正相关矩阵P(xt')第n列的平均值
Figure GDA0002841660770000074
待测负相关矩阵N(xt')n的第n列的平均值
Figure GDA0002841660770000075
S52、对比第n列中的数据,将P(xt')中第n列中大于平均值
Figure GDA0002841660770000076
的数据集合记为正对比数据I+(xt')n,N(xt')n中第n列中大于平均值
Figure GDA0002841660770000077
的数据集合记为负对比数据I(xt')n
S53、分别计算I+(xt')n的数据质心
Figure GDA0002841660770000078
I-(xt')n的数据质心
Figure GDA0002841660770000079
完成数据粒化,计算包括:
当计算I+(xt')n的数据质心
Figure GDA0002841660770000081
时,
Figure GDA0002841660770000082
W+为I+(xt')n中元素个数,则:
正相关数据粒表示为:
Figure GDA0002841660770000083
当计算I(xt')n的数据质心
Figure GDA0002841660770000084
时,
Figure GDA0002841660770000085
W为I(xt')n中元素个数,则:
负相关数据粒表示为:
Figure GDA0002841660770000086
其中,n={1,2,...,q},q表示标签的维度。
对于待测正相关矩阵P(xt'),每一行表示待测图片样本的近邻集合中某一个标签与标签空间中的其他标签的正相关性,每一列表示标签空间中某一个标签与待测集合中所有标签的正相关性;待测负相关矩阵N(xt')n同理,此处不再赘述。
引力模型(Gravity Model)是应用广泛的空间相互作用能力模型,即用来分析和预测空间相互作用能力的数学模型;本发明利用引力模型来计算待预测的图片样本与其正相关数据质心和负相关数据质心之间的相关程度定义为“引力”。
本发明基于引力模型的分类包括:
S61、分别计算正相关数据粒与待测图片样本之间的正数据引力、负相关数据粒与待测图片样本之间的负数据引力;
S62、计算正数据引力与负数据引力的合力;
S63、判断合力方向,若合力方向与正数据引力的方向一致,则待测图片样本拥有此正数据粒对应的标签;否则待测图片样本没有此正数据粒对应的标签。
根据欧式距离的计算公式,可以求出待测图片样本xt与数据质心的距离|r|,本发明叙述的距离均是图片样本特征部分的距离,在本发明中以数据粒中包含的图片样本数量作为数据粒的质量;数据粒与待测图片样本之间的引力的计算包括以下步骤:
S621、根据欧氏距离公式分别计算待测图片样本xt与正数据粒
Figure GDA0002841660770000087
间的距离r+、与负数据粒
Figure GDA0002841660770000091
间的距离r
S622、根据引力计算公式分别计算正数据引力F+、负数据引力F
当计算正数据引力时,则:
Figure GDA0002841660770000092
当计算负数据引力时,则:
Figure GDA0002841660770000093
其中,W+为I+(xt')n中元素个数,W为I-(xt')n中元素个数;g表示重力系数;M表示待测图片样本的质量,为大于零的常数。
在实际操作中,可以令待测图片样本的质量为1、重力系数为1来降低计算量。
进一步地,正相关数据粒与待测图片样本之间的引力方向为正方向,负相关数据粒与待测图片样本之间的引力方向为负方向。
根据正相关数据粒与待测图片样本之间的引力和负相关数据粒与待测图片样本之间的引力之和作为合力;若待测图片样本的合力方向为规定的正方向,则该待测图片样本拥有该数据粒对应的标签,否则该待测图片样本没有该数据粒对应的标签。
上述的标签指的是待测图片样本的标签部分中的一个标签,例如标签A,标签A属于标签空间L,是一个0/1的值;本发明所述方法的可以理解为分析待测图片样本的近邻集合中标签的分布情况,得到标签A的预测值,然后通过对待测图片样本完整地运用本文方法,能够为待测图片样本预测出其整个标签部分,即一系列的多个标签。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于引力模型的图像的多标签分类方法,其特征在于,包括:
S1、获取有标签的图片样本集作为训练图片样本集,其中每一个训练图片样本包括特征部分和标签部分,且标签部分包括多个类别的标签,当图片样本包含一个特征时,该特征的特征值为1,否则为0;
S2、计算一个训练图片样本与其他训练图片样本的距离并排序,且两个图片样本之间的距离由两个图片样本的特征值决定,得到该训练图片样本的近邻集合;
S3、在近邻集合中,以标签之间的正相关性构建正相关矩阵,标签之间的负相关性构建负相关矩阵;
S4、计算出待测图片样本的近邻集合,并根据近邻集合构建待测正相关矩阵和待测负相关矩阵,其中待检测图片样本包括特征部分和标签部分,且标签部分为空;
S5、将待测正相关矩阵的每一列粒化,得到正相关数据粒;将待测负相关矩阵的每一列粒化,得到负相关数据粒;
S6、构建引力模型,并通过待测图片样本与正相关数据粒和负相关数据粒之间的引力关系进行分类。
2.根据权利要求1所述的基于引力模型的图像的多标签分类方法,其特征在于,步骤S2包括:
S21、对于任一训练图片样本xt,其特征部分为Xi、标签部分为Yj,训练图片样本xt表示为xt={(Xi,Yj)|1≤i≤d,Xi∈F;1≤j≤q,Yj∈L},1≤t≤m;
S22、计算训练图片样本xt与训练样本集中其他训练图片样本的距离,并将该距离按照升序排序,其中两个训练图片样本之间的距离表示为
Figure FDA0002931281640000011
S23、选取排序结果中前k个,作为训练图片样本xt的近邻集合;
其中,F为特征空间,L为标签空间,m为训练图片样本集中训练样本的数量,d为特征的维度,q表示标签的维度;d(xa,xb)表示图片样本xa与图片样本xb之间的距离,Xa,i为训练图片样本xa的第i个特征,Xb,i为训练图片样本xb的第i个特征;1≤a≤m,1≤b≤m。
3.根据权利要求1所述的基于引力模型的图像的多标签分类方法,其特征在于,步骤S3包括:
S31、在训练图片样本xt的近邻集合中,用
Figure FDA0002931281640000021
表示第s个标签与第l个标签的正相关性,
Figure FDA0002931281640000022
表示第s个标签与第l个标签的负相关性;
S32、第s个标签与其他所有标签的正相关性的值构成长度为q的正相关性向量CP(xt)s,第s个标签与其他所有标签的负相关性的值构成长度为q的负相关性向量CN(xt)s
S33、由CP(xt)s构成正相关矩阵的每一行,得到正相关矩阵P,CN(xt)s构成负相关矩阵的每一行,得到负相关矩阵N。
4.根据权利要求3所述的基于引力模型的图像的多标签分类方法,其特征在于,当训练图片样本xt的近邻集合中的图片样本的第s个标签的值为1,第l个标签的值同为1时,第s个标签与第l个标签正相关性
Figure FDA0002931281640000023
加1;当训练图片样本xt的近邻集合中训练图片样本的第s个标签为1,第l个标签为0时,第s个标签与第l个标签负相关性
Figure FDA0002931281640000024
加1。
5.根据权利要求1所述的基于引力模型的图像的多标签分类方法,其特征在于,步骤S4包括:根据待测图片样本与训练图片样本特征部分间的欧氏距离,筛选出距离待测图片样本最近的k个训练图片样本作为待测图片样本的近邻集合,从正相关矩阵P和负相关矩阵N中筛选出待测图片样本的近邻集合所包含标签对应的正相关性向量和负相关性向量,以待测项目xt'近邻集合中标签的正相关性向量构建待测正相关矩阵P(xt'),负相关性向量为行构建待测负相关矩阵N(xt')n
6.根据权利要求1所述的基于引力模型的图像的多标签分类方法,其特征在于,步骤S5包括:
S51、计算待测正相关矩阵P(xt')第n列的平均值
Figure FDA0002931281640000031
待测负相关矩阵N(xt')n的第n列的平均值
Figure FDA0002931281640000032
S52、对比第n列中的数据,将P(xt')中第n列中大于平均值
Figure FDA0002931281640000033
的数据集合记为正对比数据I+(xt')n,N(xt')n中第n列中大于平均值
Figure FDA0002931281640000034
的数据集合记为负对比数据I(xt')n
S53、分别计算I+(xt')n的数据质心
Figure FDA0002931281640000035
I-(xt')n的数据质心
Figure FDA0002931281640000036
完成数据粒化,计算包括:
当计算I+(xt')n的数据质心
Figure FDA0002931281640000037
时,
Figure FDA0002931281640000038
W+为I+(xt')n中元素个数,则:
正相关数据粒表示为:
Figure FDA0002931281640000039
当计算I(xt')n的数据质心
Figure FDA00029312816400000310
时,
Figure FDA00029312816400000311
W为I(xt')n中元素个数,则:
负相关数据粒表示为:
Figure FDA00029312816400000312
其中,n={1,2,...,q},q表示标签的维度。
7.根据权利要求1所述的基于引力模型的图像的多标签分类方法,其特征在于,所述步骤S6包括:
S61、分别计算正相关数据粒与待测图片样本之间的正数据引力、负相关数据粒与待测图片样本之间的负数据引力;
S62、计算正数据引力与负数据引力的合力;
S63、判断合力方向,若合力方向与正数据引力的方向一致,则待测图片样本拥有此正数据粒对应的标签;否则待测图片样本没有此正数据粒对应的标签。
8.根据权利要求7所述的基于引力模型的图像的多标签分类方法,其特征在于,步骤S61包括:
S621、根据欧氏距离公式分别计算待测图片样本xt与正数据粒
Figure FDA00029312816400000313
间的距离r+、与负数据粒
Figure FDA00029312816400000314
间的距离r
S622、根据引力计算公式分别计算正数据引力F+、负数据引力F
当计算正数据引力时,则:
Figure FDA0002931281640000041
当计算负数据引力时,则:
Figure FDA0002931281640000042
其中,W+为正对比数据I+(xt')n中元素个数,W为负对比数据I-(xt')n中元素个数;g表示重力系数;M表示待测图片样本的质量,为大于零的常数。
CN201810433859.XA 2018-05-08 2018-05-08 基于引力模型的图像的多标签分类方法 Active CN108647711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810433859.XA CN108647711B (zh) 2018-05-08 2018-05-08 基于引力模型的图像的多标签分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810433859.XA CN108647711B (zh) 2018-05-08 2018-05-08 基于引力模型的图像的多标签分类方法

Publications (2)

Publication Number Publication Date
CN108647711A CN108647711A (zh) 2018-10-12
CN108647711B true CN108647711B (zh) 2021-04-20

Family

ID=63749458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810433859.XA Active CN108647711B (zh) 2018-05-08 2018-05-08 基于引力模型的图像的多标签分类方法

Country Status (1)

Country Link
CN (1) CN108647711B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816023B (zh) * 2019-01-29 2022-01-04 北京字节跳动网络技术有限公司 用于生成图片标签模型的方法和装置
CN112132147B (zh) * 2020-08-14 2022-04-19 浙江大学 一种基于质量节点模型的学习方法
CN113722417B (zh) * 2020-08-20 2023-06-16 广东电网有限责任公司清远供电局 电力系统违章管理方法、装置及电力设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102364498A (zh) * 2011-10-17 2012-02-29 江苏大学 一种基于多标签的图像识别方法
CN104915436A (zh) * 2015-06-24 2015-09-16 合肥工业大学 自适应多标签预测方法
US9704054B1 (en) * 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8379994B2 (en) * 2010-10-13 2013-02-19 Sony Corporation Digital image analysis utilizing multiple human labels

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102364498A (zh) * 2011-10-17 2012-02-29 江苏大学 一种基于多标签的图像识别方法
CN104915436A (zh) * 2015-06-24 2015-09-16 合肥工业大学 自适应多标签预测方法
US9704054B1 (en) * 2015-09-30 2017-07-11 Amazon Technologies, Inc. Cluster-trained machine learning for image processing

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《Effective lazy learning algorithm based on a data gravitation model for multi-label learning》;REYES O,et al;《Information Sciences》;20161231(第340期);第159-174页 *
《基于引力场模型的文本分类方法》;李静;《中国优秀硕士学位论文全文数据库 信息科技辑》;20130315(第3期);第I138-1761页 *
《多标签类重力密度和距离的图像注释方法》;胡学钢,等;《小型微型计算机系统》;20170731;第38卷(第7期);第1619-1624页 *

Also Published As

Publication number Publication date
CN108647711A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN112396002B (zh) 一种基于SE-YOLOv3的轻量级遥感目标检测方法
CN108416394B (zh) 基于卷积神经网络的多目标检测模型构建方法
CN101937513B (zh) 信息处理设备、信息处理方法
Hidaka et al. Consecutive dimensionality reduction by canonical correlation analysis for visualization of convolutional neural networks
CN108647736B (zh) 一种基于感知损失和匹配注意力机制的图像分类方法
CN108647711B (zh) 基于引力模型的图像的多标签分类方法
CN105488809A (zh) 基于rgbd描述符的室内场景语义分割方法
CN107402993A (zh) 基于判别性关联最大化哈希的跨模态检索方法
CN112036447B (zh) 零样本目标检测系统及可学习语义和固定语义融合方法
CN107943856A (zh) 一种基于扩充标记样本的文本分类方法及系统
CN107526805B (zh) 一种基于权重的ML-kNN多标签中文文本分类方法
CN110728307A (zh) 自生成数据集与标签实现x光影像图小样本字符识别方法
Bouguila et al. Mml-based approach for finite dirichlet mixture estimation and selection
CN108133224B (zh) 用于评估分类任务复杂度的方法
CN114821022A (zh) 融合主观逻辑和不确定性分布建模的可信目标检测方法
CN113705570A (zh) 一种基于深度学习的少样本目标检测方法
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
CN111882000A (zh) 一种应用于小样本细粒度学习的网络结构及方法
JPWO2020095357A1 (ja) 検索ニーズ評価装置、検索ニーズ評価システム、及び検索ニーズ評価方法
CN107480718A (zh) 一种基于视觉词袋模型的高分辨率遥感图像分类方法
CN110378384A (zh) 一种结合特权信息和排序支持向量机的图像分类方法
CN115861239A (zh) 一种基于元学习的小样本工业零件表面缺陷检测方法
CN114241380A (zh) 一种基于类别标签和属性注释的多任务属性场景识别方法
Xiong et al. One-stage open set object detection with prototype learning
CN111783788B (zh) 一种面向标记噪声的多标记分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant