CN105608468B - 一种基于流型矩阵补全的多标签分类方法 - Google Patents

一种基于流型矩阵补全的多标签分类方法 Download PDF

Info

Publication number
CN105608468B
CN105608468B CN201510953772.1A CN201510953772A CN105608468B CN 105608468 B CN105608468 B CN 105608468B CN 201510953772 A CN201510953772 A CN 201510953772A CN 105608468 B CN105608468 B CN 105608468B
Authority
CN
China
Prior art keywords
matrix
vector
label
flow pattern
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510953772.1A
Other languages
English (en)
Other versions
CN105608468A (zh
Inventor
徐增林
刘斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201510953772.1A priority Critical patent/CN105608468B/zh
Publication of CN105608468A publication Critical patent/CN105608468A/zh
Application granted granted Critical
Publication of CN105608468B publication Critical patent/CN105608468B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于流型矩阵补全的多标签分类方法,通过在利用矩阵补全进行的多标签学习的过程中增加对特征间流型性假设的考虑,可以较为明显地提高多标签分类算法识别的效率。本发明提供的多标签分类方法从海明损失、平均精度以及覆盖率三个多标签学习的指标上来看,与现有技术相比都有较大的提升。

Description

一种基于流型矩阵补全的多标签分类方法
技术领域
本发明属于标签分类技术领域,具体涉及一种基于流型矩阵补全的多标签分类方法的设计。
背景技术
多标签分类问题普遍存在,它较之普通的二类分类问题在实际应用中更为实用。比如,对internet上的图片进行分类标注时,由于图片上的目标往往有多个(同一张图片可能会同时属于多个类别),很难用普通的二类分类方法将其归类成两类,而归类成多标签更为合适,比如图片集合中的目标共有5类,那么某一张有3个目标的图片的标注可能是(0,1,0,1,1),表示这张图片属于第二、四和五类。
矩阵补全是一种有效的多标签学习的技术,它利用样本和标签之间的线性相关性,对无标记的样本的标签进行预测。其主要原理是构造一个“特征+标签”的组合向量作为矩阵的行矩阵或者列矩阵,其中将要预测的特征的标签置为0,以此利用矩阵补全运算来计算出要预测特征的真实标签(+1和-1)。这种多标签学习方案合理地利用了特征之间的线性相关性来进行未知标签的预测,但是忽略了特征之间的平滑性假设的性质(特征的流型假设),即相似的特征应对应同样的分类标签,而差异较大的特征应赋予不同的标签。而这种性质在标签预测中具有重要的作用。
发明内容
本发明的目的是为了解决现有技术中矩阵补全技术忽略了特征之间的平滑性假设的性质的问题,提出了一种基于流型矩阵补全的多标签分类方法。
本发明的技术方案为:一种基于流型矩阵补全的多标签分类方法,包括以下步骤:
S1、初始化多标签学习矩阵M;
S2、初始化矩阵Z,使得Z与M的秩为1近似;
S3、对Z进行梯度下降更新,得到矩阵
S4、对进行SVD分解操作,得到矩阵Z′;
S5、判断Z′是否满足设定的收敛条件,若是则分类计算结束,否则返回S3。
进一步地,S1中其中XL为被标记的特征矩阵,YL为被标记的特征对 应的标签矩阵,XU为未被标记的特征矩阵,YU为待求的未被标记的特征对应的标签矩阵。
进一步地,YU的初始值为0。
进一步地,S2具体为:
构造与M同阶的矩阵其中ZyL与YL同阶,ZyU与YU同阶Zx与Mx=[XL, XU]同阶;同时满足:ZyL与YL之间的损失以及Zx与Mx之间的损失最小,ZyU与Mx流型相似,即:
其中μ依次取μ12,...,μk中的一个值,k为常数,且μ1>μ2>...>μk,||Z||*为Z的核范数,γ为正则惩罚因子,zm为矩阵Z的最后一行,t为M中标签向量的维度,d为M中特征向量的维度;
Loss(Z)为Z的损失且其中i=1,2,…N,j=1, 2,…N,N为常数,cx和cy分别为针对特征矩阵X和标签矩阵Y的两种不同的损失函数,ΩX为M 中各特征向量对应的下标集合,ΩY为M中各标签向量对应的下标集合,x为M中的特征向量, y为M中的标签向量,z为Z中的向量,λ为常数参数;
R(Zy)为Zy的流型正则化且其中Tr(·)为求矩阵的迹的运算,L为关于特征矩阵X的拉普拉斯矩阵,Zy=[ZyL,ZyU]。
进一步地,矩阵Z的最后一行设置为全1向量。
进一步地,S3中其中:
τ为梯度下降速率,分别为的模,为未被标记的特征对应的标签矩阵YU的下标集合,l为L的列向量,λ、α为常数参数。
进一步地,S4具体为:
联立以下两个公式得到矩阵Z′:
Z′=USρ(Σ)VT
其中Σ为奇异值矩阵,U、V为已知的非奇异矩阵,Sρ(Σ)=Diag[max(σΣ-ρ,0)],Diag(·)是对向量进行对角化矩阵操作,σΣ是Diag(·)反操作,即将Σ的对角元素进行向量化,ρ为阈值且ρ=τμ。
本发明的有益效果是:本发明通过在利用矩阵补全进行的多标签学习的过程中增加对特征间流型性假设的考虑,可以较为明显地提高多标签分类算法识别的效率。从海明损失(Hamming loss),平均精度(Average precision)以及覆盖率(Coverage)三个多标签学习的指标上来看,本发明提供的算法(MCLA)较改进前都有了较大的提升。
附图说明
图1为本发明提供的一种基于流型矩阵补全的多标签分类方法流程图。
图2为MIML数据集上海明损失的测试结果。
图3为MIML数据集上平均精度的测试结果。
图4为MIML数据集上覆盖率的测试结果。
图5为Bird数据集上海明损失的测试结果。
图6为Bird数据集上平均精度的测试结果。
图7为Bird数据集上覆盖率的测试结果。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
本发明提供了一种基于流型矩阵补全的多标签分类方法,如图1所示,包括以下步骤:
S1、初始化多标签学习矩阵M。
其中XL为被标记的特征矩阵,YL为被标记的特征对应的标签矩 阵,XU为未被标记的特征矩阵。
YU为未被标记的特征对应的标签矩阵,YU是未知待求解的变量,假设其初始值为0,即YU=0。
S2、初始化矩阵Z,使得Z与M的秩为1近似。
根据数据本身的特性,我们知道M矩阵是一个低秩矩阵(low rank)。为了求解YU, 我们同样构造一个低秩矩阵其中ZyL与YL同阶,ZyU与YU同阶Zx与Mx=[XL,XU] 同阶。同时满足:ZyL与YL之间的损失以及Zx与Mx之间的损失最小,ZyU与Mx流型相似,即:
其中μ依次取μ12,...,μk中的一个值,k为常数,且μ1>μ2>...>μk,||Z||*为Z的核范数,γ为正则惩罚因子,zm为矩阵Z的最后一行,t为M中标签向量的维度,d为M中特征向量的维度。
Loss(Z)为Z的损失且其中i=1,2,…N,j=1, 2,…N,N为常数,cx和cy分别为针对特征矩阵X和标签矩阵Y的两种不同的损失函数,其中特 征矩阵X包括XL和XU,标签矩阵Y包括YL和YU。ΩX为M中各特征向量对应的下标集合,ΩY为M中 各标签向量对应的下标集合,x为M中的特征向量,y为M中的标签向量,z为Z中的向量,λ为常 数参数。
R(Zy)为Zy的流型正则化且其中Tr(·)为求矩阵的迹的运算,L为关于特征矩阵X的拉普拉斯矩阵,Zy=[ZyL,ZyU]。
为了更好的体现低秩性,矩阵Z的最后一行强制设置为全1向量。
S3、对Z进行梯度下降更新,得到矩阵
其中:
τ为梯度下降速率,分别为的模,为未被标记的特征对应的标签矩阵YU的下标集合,l为L的列向量,λ、α为常数参数。
求解矩阵Z是通过梯度下降迭代更新进行。由于矩阵Z由数据矩阵和标签矩阵组成,所以对Z的更新是分块采用不同的梯度下降策略。
S4、对进行SVD分解操作,得到矩阵Z′。
经过梯度下降更新之后的矩阵将进行一次截断的SVD分解。截断操作将进行SVD分解后得到的奇异值矩阵按照设定的阀值进行截断,其中大于或等于阀值的奇异值保留,小于阀值的奇异值置为0。然后用截断后的奇异值矩阵与SVD分解得到的矩阵还原得到更细的矩阵Z′,即联立以下两个公式得到矩阵Z′:
Z′=USρ(Σ)VT
其中Σ为奇异值矩阵,U、V为已知的非奇异矩阵,Sρ(Σ)=Diag[max(σΣ-ρ,0)],Diag(·)是对向量进行对角化矩阵操作,σΣ是Diag(·)反操作,即将Σ的对角元素进行向量化,ρ为阈值且ρ=τμ。
S5、判断Z′是否满足设定的收敛条件,若是则分类计算结束,否则返回S3。
本发明实施例中,收敛条件为判定Z-Z′的F范数是否小于设定的阈值η,若是则判定为收敛,否则判定为不收敛。
如图2-图7所示,无论是在MIML图像多标签数据集还是在Bird声音多标签数据集上进行测试,本发明提供的MCLA算法与现有技术中的各算法相比,海明损失(Hammingloss)更小,平均精度(Average precision)更高,覆盖率(Coverage)更大,较之现有技术都有较大的提升。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (4)

1.一种基于流型矩阵补全的多标签分类方法,其特征在于,包括以下步骤:
S1、初始化多标签学习矩阵M;S1中其中XL为被标记的特征矩阵,YL为被标记的特征对应的标签矩阵,XU为未被标记的特征矩阵,YU为待求的未被标记的特征对应的标签矩阵;
S2、初始化矩阵Z,使得Z与M的秩为1;S2具体为:
构造与M同阶的矩阵其中ZyL与YL同阶,ZyU与YU同阶Zx与Mx=[XL,XU]同阶;同时满足:ZyL与YL之间的损失以及Zx与Mx之间的损失最小,ZyU与Mx流型相似,即:
其中μ依次取μ12,...,μk中的一个值,k为常数,且μ1>μ2>...>μk,||Z||*为Z的核范数,γ为正则惩罚因子,zm为矩阵Z的最后一行,t为M中标签向量的维度,d为M中特征向量的维度;
Loss(Z)为Z的损失且其中i=1,2,…N,j=1,2,…N,N为常数,cx和cy分别为针对特征矩阵X和标签矩阵Y的两种不同的损失函数,特征矩阵X包括XL和XU,标签矩阵Y包括YL和YU,ΩX为M中各特征向量对应的下标集合,ΩY为M中各标签向量对应的下标集合,x为M中的特征向量,y为M中的标签向量,z为Z中的向量,λ为常数参数;
R(Zy)为Zy的流型正则化且其中Tr(·)为求矩阵的迹的运算,L为关于特征矩阵X的拉普拉斯矩阵,Zy=[ZyL,ZyU];
S3、对Z进行梯度下降更新,得到矩阵所述S3中其中:
τ为梯度下降速率,Y|、X|分别为ΩYΩX的模,为未被标记的特征对应的标签矩阵YU的下标集合,l为L的列向量,λ、α为常数参数;
S4、对进行SVD分解操作,得到矩阵Z′;
S5、判断Z′是否满足设定的收敛条件,若是则分类计算结束,否则返回S3。
2.根据权利要求1所述的基于流型矩阵补全的多标签分类方法,其特征在于,所述YU的初始值为0。
3.根据权利要求1所述的基于流型矩阵补全的多标签分类方法,其特征在于,所述矩阵Z的最后一行设置为全1向量。
4.根据权利要求1所述的基于流型矩阵补全的多标签分类方法,其特征在于,所述S4具体为:
联立以下两个公式得到矩阵Z′:
Z′=USρ(Σ)VT
其中Σ为奇异值矩阵,U、V为已知的非奇异矩阵,Sρ(Σ)=Diag[max(σΣ-ρ,0)],Diag(·)是对向量进行对角化矩阵操作,σΣ是Diag(·)反操作,即将Σ的对角元素进行向量化,ρ为阈值且ρ=τμ。
CN201510953772.1A 2015-12-18 2015-12-18 一种基于流型矩阵补全的多标签分类方法 Expired - Fee Related CN105608468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510953772.1A CN105608468B (zh) 2015-12-18 2015-12-18 一种基于流型矩阵补全的多标签分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510953772.1A CN105608468B (zh) 2015-12-18 2015-12-18 一种基于流型矩阵补全的多标签分类方法

Publications (2)

Publication Number Publication Date
CN105608468A CN105608468A (zh) 2016-05-25
CN105608468B true CN105608468B (zh) 2019-03-26

Family

ID=55988392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510953772.1A Expired - Fee Related CN105608468B (zh) 2015-12-18 2015-12-18 一种基于流型矩阵补全的多标签分类方法

Country Status (1)

Country Link
CN (1) CN105608468B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110210515B (zh) * 2019-04-25 2021-04-20 浙江大学 一种图像数据多标签分类方法
CN110428007B (zh) * 2019-08-01 2020-11-24 科大讯飞(苏州)科技有限公司 X光图像目标检测方法、装置及设备
CN112926675B (zh) * 2021-03-22 2023-08-18 哈尔滨工业大学(深圳) 视角和标签双重缺失下的深度不完整多视角多标签分类方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281855A (zh) * 2014-09-30 2015-01-14 西安电子科技大学 基于多任务低秩的高光谱图像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7996343B2 (en) * 2008-09-30 2011-08-09 Microsoft Corporation Classification via semi-riemannian spaces

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104281855A (zh) * 2014-09-30 2015-01-14 西安电子科技大学 基于多任务低秩的高光谱图像分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Matrix Completion for Multi-label Image Classification;Ricardo S. Cabral et al;《Neural Information Processing Systems》;20111231;第3页、第5页第6-16行 *
Semi-supervised Low-Rank Mapping Learning for Multi-label Classification;Liping Jing et al;《Computer Vision and Pattern Recognition (CVPR), 2015 IEEE Conference on》;20151015;第1484页第一栏24-30行、2.2部分,第1485页2.5部分 *

Also Published As

Publication number Publication date
CN105608468A (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
Lin et al. Consistent-aware deep learning for person re-identification in a camera network
CN106951911B (zh) 一种快速的多标签图片检索系统及实现方法
CN110287942B (zh) 年龄估计模型的训练方法、年龄估计方法以及对应的装置
CN112183153A (zh) 一种基于视频分析的对象行为检测方法及装置
CN109784182A (zh) 行人重识别方法和装置
CN107680116B (zh) 一种监测视频图像中运动目标的方法
CN108710948B (zh) 一种基于聚类均衡和权重矩阵优化的迁移学习方法
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN105740790B (zh) 基于多核字典学习的彩色人脸识别方法
CN110738146A (zh) 一种目标重识别神经网络及其构建方法和应用
CN109858476B (zh) 标签的扩充方法和电子设备
CN105608468B (zh) 一种基于流型矩阵补全的多标签分类方法
CN110598603A (zh) 人脸识别模型获取方法、装置、设备和介质
CN111126134A (zh) 基于非指纹信号消除器的雷达辐射源深度学习识别方法
CN105095494A (zh) 一种对分类数据集进行测试的方法
CN110298394A (zh) 一种图像识别方法和相关装置
CN108985161B (zh) 一种基于拉普拉斯正则化的低秩稀疏表征图像特征学习方法
CN110765882A (zh) 一种视频标签确定方法、装置、服务器及存储介质
CN103177265A (zh) 基于核函数与稀疏编码的高清图像分类方法
CN113011243A (zh) 基于胶囊网络的面部表情分析方法
CN110197213A (zh) 基于神经网络的图像匹配方法、装置和设备
CN109271833A (zh) 基于栈式稀疏自编码器的目标识别方法、装置及电子设备
CN109886160A (zh) 一种非限定条件下的人脸识别方法
CN107657223B (zh) 一种基于快速处理多距离度量学习的人脸认证方法
CN116311504A (zh) 一种小样本行为识别方法、系统及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190326

Termination date: 20211218