CN105608468B - 一种基于流型矩阵补全的多标签分类方法 - Google Patents
一种基于流型矩阵补全的多标签分类方法 Download PDFInfo
- Publication number
- CN105608468B CN105608468B CN201510953772.1A CN201510953772A CN105608468B CN 105608468 B CN105608468 B CN 105608468B CN 201510953772 A CN201510953772 A CN 201510953772A CN 105608468 B CN105608468 B CN 105608468B
- Authority
- CN
- China
- Prior art keywords
- matrix
- vector
- label
- flow pattern
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于流型矩阵补全的多标签分类方法,通过在利用矩阵补全进行的多标签学习的过程中增加对特征间流型性假设的考虑,可以较为明显地提高多标签分类算法识别的效率。本发明提供的多标签分类方法从海明损失、平均精度以及覆盖率三个多标签学习的指标上来看,与现有技术相比都有较大的提升。
Description
技术领域
本发明属于标签分类技术领域,具体涉及一种基于流型矩阵补全的多标签分类方法的设计。
背景技术
多标签分类问题普遍存在,它较之普通的二类分类问题在实际应用中更为实用。比如,对internet上的图片进行分类标注时,由于图片上的目标往往有多个(同一张图片可能会同时属于多个类别),很难用普通的二类分类方法将其归类成两类,而归类成多标签更为合适,比如图片集合中的目标共有5类,那么某一张有3个目标的图片的标注可能是(0,1,0,1,1),表示这张图片属于第二、四和五类。
矩阵补全是一种有效的多标签学习的技术,它利用样本和标签之间的线性相关性,对无标记的样本的标签进行预测。其主要原理是构造一个“特征+标签”的组合向量作为矩阵的行矩阵或者列矩阵,其中将要预测的特征的标签置为0,以此利用矩阵补全运算来计算出要预测特征的真实标签(+1和-1)。这种多标签学习方案合理地利用了特征之间的线性相关性来进行未知标签的预测,但是忽略了特征之间的平滑性假设的性质(特征的流型假设),即相似的特征应对应同样的分类标签,而差异较大的特征应赋予不同的标签。而这种性质在标签预测中具有重要的作用。
发明内容
本发明的目的是为了解决现有技术中矩阵补全技术忽略了特征之间的平滑性假设的性质的问题,提出了一种基于流型矩阵补全的多标签分类方法。
本发明的技术方案为:一种基于流型矩阵补全的多标签分类方法,包括以下步骤:
S1、初始化多标签学习矩阵M;
S2、初始化矩阵Z,使得Z与M的秩为1近似;
S3、对Z进行梯度下降更新,得到矩阵
S4、对进行SVD分解操作,得到矩阵Z′;
S5、判断Z′是否满足设定的收敛条件,若是则分类计算结束,否则返回S3。
进一步地,S1中其中XL为被标记的特征矩阵,YL为被标记的特征对
应的标签矩阵,XU为未被标记的特征矩阵,YU为待求的未被标记的特征对应的标签矩阵。
进一步地,YU的初始值为0。
进一步地,S2具体为:
构造与M同阶的矩阵其中ZyL与YL同阶,ZyU与YU同阶Zx与Mx=[XL,
XU]同阶;同时满足:ZyL与YL之间的损失以及Zx与Mx之间的损失最小,ZyU与Mx流型相似,即:
其中μ依次取μ1,μ2,...,μk中的一个值,k为常数,且μ1>μ2>...>μk,||Z||*为Z的核范数,γ为正则惩罚因子,zm为矩阵Z的最后一行,t为M中标签向量的维度,d为M中特征向量的维度;
Loss(Z)为Z的损失且其中i=1,2,…N,j=1,
2,…N,N为常数,cx和cy分别为针对特征矩阵X和标签矩阵Y的两种不同的损失函数,ΩX为M
中各特征向量对应的下标集合,ΩY为M中各标签向量对应的下标集合,x为M中的特征向量,
y为M中的标签向量,z为Z中的向量,λ为常数参数;
R(Zy)为Zy的流型正则化且其中Tr(·)为求矩阵的迹的运算,L为关于特征矩阵X的拉普拉斯矩阵,Zy=[ZyL,ZyU]。
进一步地,矩阵Z的最后一行设置为全1向量。
进一步地,S3中其中:
τ为梯度下降速率,分别为的模,为未被标记的特征对应的标签矩阵YU的下标集合,l为L的列向量,λ、α为常数参数。
进一步地,S4具体为:
联立以下两个公式得到矩阵Z′:
Z′=USρ(Σ)VT;
其中Σ为奇异值矩阵,U、V为已知的非奇异矩阵,Sρ(Σ)=Diag[max(σΣ-ρ,0)],Diag(·)是对向量进行对角化矩阵操作,σΣ是Diag(·)反操作,即将Σ的对角元素进行向量化,ρ为阈值且ρ=τμ。
本发明的有益效果是:本发明通过在利用矩阵补全进行的多标签学习的过程中增加对特征间流型性假设的考虑,可以较为明显地提高多标签分类算法识别的效率。从海明损失(Hamming loss),平均精度(Average precision)以及覆盖率(Coverage)三个多标签学习的指标上来看,本发明提供的算法(MCLA)较改进前都有了较大的提升。
附图说明
图1为本发明提供的一种基于流型矩阵补全的多标签分类方法流程图。
图2为MIML数据集上海明损失的测试结果。
图3为MIML数据集上平均精度的测试结果。
图4为MIML数据集上覆盖率的测试结果。
图5为Bird数据集上海明损失的测试结果。
图6为Bird数据集上平均精度的测试结果。
图7为Bird数据集上覆盖率的测试结果。
具体实施方式
下面结合附图对本发明的实施例作进一步的说明。
本发明提供了一种基于流型矩阵补全的多标签分类方法,如图1所示,包括以下步骤:
S1、初始化多标签学习矩阵M。
其中XL为被标记的特征矩阵,YL为被标记的特征对应的标签矩
阵,XU为未被标记的特征矩阵。
YU为未被标记的特征对应的标签矩阵,YU是未知待求解的变量,假设其初始值为0,即YU=0。
S2、初始化矩阵Z,使得Z与M的秩为1近似。
根据数据本身的特性,我们知道M矩阵是一个低秩矩阵(low rank)。为了求解YU,
我们同样构造一个低秩矩阵其中ZyL与YL同阶,ZyU与YU同阶Zx与Mx=[XL,XU]
同阶。同时满足:ZyL与YL之间的损失以及Zx与Mx之间的损失最小,ZyU与Mx流型相似,即:
其中μ依次取μ1,μ2,...,μk中的一个值,k为常数,且μ1>μ2>...>μk,||Z||*为Z的核范数,γ为正则惩罚因子,zm为矩阵Z的最后一行,t为M中标签向量的维度,d为M中特征向量的维度。
Loss(Z)为Z的损失且其中i=1,2,…N,j=1,
2,…N,N为常数,cx和cy分别为针对特征矩阵X和标签矩阵Y的两种不同的损失函数,其中特
征矩阵X包括XL和XU,标签矩阵Y包括YL和YU。ΩX为M中各特征向量对应的下标集合,ΩY为M中
各标签向量对应的下标集合,x为M中的特征向量,y为M中的标签向量,z为Z中的向量,λ为常
数参数。
R(Zy)为Zy的流型正则化且其中Tr(·)为求矩阵的迹的运算,L为关于特征矩阵X的拉普拉斯矩阵,Zy=[ZyL,ZyU]。
为了更好的体现低秩性,矩阵Z的最后一行强制设置为全1向量。
S3、对Z进行梯度下降更新,得到矩阵
其中:
τ为梯度下降速率,分别为的模,为未被标记的特征对应的标签矩阵YU的下标集合,l为L的列向量,λ、α为常数参数。
求解矩阵Z是通过梯度下降迭代更新进行。由于矩阵Z由数据矩阵和标签矩阵组成,所以对Z的更新是分块采用不同的梯度下降策略。
S4、对进行SVD分解操作,得到矩阵Z′。
经过梯度下降更新之后的矩阵将进行一次截断的SVD分解。截断操作将进行SVD分解后得到的奇异值矩阵按照设定的阀值进行截断,其中大于或等于阀值的奇异值保留,小于阀值的奇异值置为0。然后用截断后的奇异值矩阵与SVD分解得到的矩阵还原得到更细的矩阵Z′,即联立以下两个公式得到矩阵Z′:
Z′=USρ(Σ)VT;
其中Σ为奇异值矩阵,U、V为已知的非奇异矩阵,Sρ(Σ)=Diag[max(σΣ-ρ,0)],Diag(·)是对向量进行对角化矩阵操作,σΣ是Diag(·)反操作,即将Σ的对角元素进行向量化,ρ为阈值且ρ=τμ。
S5、判断Z′是否满足设定的收敛条件,若是则分类计算结束,否则返回S3。
本发明实施例中,收敛条件为判定Z-Z′的F范数是否小于设定的阈值η,若是则判定为收敛,否则判定为不收敛。
如图2-图7所示,无论是在MIML图像多标签数据集还是在Bird声音多标签数据集上进行测试,本发明提供的MCLA算法与现有技术中的各算法相比,海明损失(Hammingloss)更小,平均精度(Average precision)更高,覆盖率(Coverage)更大,较之现有技术都有较大的提升。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (4)
1.一种基于流型矩阵补全的多标签分类方法,其特征在于,包括以下步骤:
S1、初始化多标签学习矩阵M;S1中其中XL为被标记的特征矩阵,YL为被标记的特征对应的标签矩阵,XU为未被标记的特征矩阵,YU为待求的未被标记的特征对应的标签矩阵;
S2、初始化矩阵Z,使得Z与M的秩为1;S2具体为:
构造与M同阶的矩阵其中ZyL与YL同阶,ZyU与YU同阶Zx与Mx=[XL,XU]同阶;同时满足:ZyL与YL之间的损失以及Zx与Mx之间的损失最小,ZyU与Mx流型相似,即:
其中μ依次取μ1,μ2,...,μk中的一个值,k为常数,且μ1>μ2>...>μk,||Z||*为Z的核范数,γ为正则惩罚因子,zm为矩阵Z的最后一行,t为M中标签向量的维度,d为M中特征向量的维度;
Loss(Z)为Z的损失且其中i=1,2,…N,j=1,2,…N,N为常数,cx和cy分别为针对特征矩阵X和标签矩阵Y的两种不同的损失函数,特征矩阵X包括XL和XU,标签矩阵Y包括YL和YU,ΩX为M中各特征向量对应的下标集合,ΩY为M中各标签向量对应的下标集合,x为M中的特征向量,y为M中的标签向量,z为Z中的向量,λ为常数参数;
R(Zy)为Zy的流型正则化且其中Tr(·)为求矩阵的迹的运算,L为关于特征矩阵X的拉普拉斯矩阵,Zy=[ZyL,ZyU];
S3、对Z进行梯度下降更新,得到矩阵所述S3中其中:
τ为梯度下降速率,|ΩY|、|ΩX|分别为ΩY、ΩX的模,为未被标记的特征对应的标签矩阵YU的下标集合,l为L的列向量,λ、α为常数参数;
S4、对进行SVD分解操作,得到矩阵Z′;
S5、判断Z′是否满足设定的收敛条件,若是则分类计算结束,否则返回S3。
2.根据权利要求1所述的基于流型矩阵补全的多标签分类方法,其特征在于,所述YU的初始值为0。
3.根据权利要求1所述的基于流型矩阵补全的多标签分类方法,其特征在于,所述矩阵Z的最后一行设置为全1向量。
4.根据权利要求1所述的基于流型矩阵补全的多标签分类方法,其特征在于,所述S4具体为:
联立以下两个公式得到矩阵Z′:
Z′=USρ(Σ)VT;
其中Σ为奇异值矩阵,U、V为已知的非奇异矩阵,Sρ(Σ)=Diag[max(σΣ-ρ,0)],Diag(·)是对向量进行对角化矩阵操作,σΣ是Diag(·)反操作,即将Σ的对角元素进行向量化,ρ为阈值且ρ=τμ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510953772.1A CN105608468B (zh) | 2015-12-18 | 2015-12-18 | 一种基于流型矩阵补全的多标签分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510953772.1A CN105608468B (zh) | 2015-12-18 | 2015-12-18 | 一种基于流型矩阵补全的多标签分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105608468A CN105608468A (zh) | 2016-05-25 |
CN105608468B true CN105608468B (zh) | 2019-03-26 |
Family
ID=55988392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510953772.1A Expired - Fee Related CN105608468B (zh) | 2015-12-18 | 2015-12-18 | 一种基于流型矩阵补全的多标签分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105608468B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210515B (zh) * | 2019-04-25 | 2021-04-20 | 浙江大学 | 一种图像数据多标签分类方法 |
CN110428007B (zh) * | 2019-08-01 | 2020-11-24 | 科大讯飞(苏州)科技有限公司 | X光图像目标检测方法、装置及设备 |
CN112926675B (zh) * | 2021-03-22 | 2023-08-18 | 哈尔滨工业大学(深圳) | 视角和标签双重缺失下的深度不完整多视角多标签分类方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281855A (zh) * | 2014-09-30 | 2015-01-14 | 西安电子科技大学 | 基于多任务低秩的高光谱图像分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7996343B2 (en) * | 2008-09-30 | 2011-08-09 | Microsoft Corporation | Classification via semi-riemannian spaces |
-
2015
- 2015-12-18 CN CN201510953772.1A patent/CN105608468B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281855A (zh) * | 2014-09-30 | 2015-01-14 | 西安电子科技大学 | 基于多任务低秩的高光谱图像分类方法 |
Non-Patent Citations (2)
Title |
---|
Matrix Completion for Multi-label Image Classification;Ricardo S. Cabral et al;《Neural Information Processing Systems》;20111231;第3页、第5页第6-16行 * |
Semi-supervised Low-Rank Mapping Learning for Multi-label Classification;Liping Jing et al;《Computer Vision and Pattern Recognition (CVPR), 2015 IEEE Conference on》;20151015;第1484页第一栏24-30行、2.2部分,第1485页2.5部分 * |
Also Published As
Publication number | Publication date |
---|---|
CN105608468A (zh) | 2016-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ge et al. | Subset feature learning for fine-grained category classification | |
CN110287942B (zh) | 年龄估计模型的训练方法、年龄估计方法以及对应的装置 | |
CN112183153A (zh) | 一种基于视频分析的对象行为检测方法及装置 | |
CN109118564A (zh) | 一种基于融合体素的三维点云标记方法和装置 | |
CN109784182A (zh) | 行人重识别方法和装置 | |
CN107680116B (zh) | 一种监测视频图像中运动目标的方法 | |
CN103544499B (zh) | 一种基于机器视觉的表面瑕疵检测的纹理特征降维方法 | |
CN110837870A (zh) | 基于主动学习的声呐图像目标识别方法 | |
CN105740790B (zh) | 基于多核字典学习的彩色人脸识别方法 | |
CN111126134B (zh) | 基于非指纹信号消除器的雷达辐射源深度学习识别方法 | |
CN110738146A (zh) | 一种目标重识别神经网络及其构建方法和应用 | |
CN109858476B (zh) | 标签的扩充方法和电子设备 | |
CN105608468B (zh) | 一种基于流型矩阵补全的多标签分类方法 | |
CN110598603A (zh) | 人脸识别模型获取方法、装置、设备和介质 | |
CN105095494A (zh) | 一种对分类数据集进行测试的方法 | |
JP6107531B2 (ja) | 特徴抽出プログラム及び情報処理装置 | |
CN110298394A (zh) | 一种图像识别方法和相关装置 | |
CN108985161B (zh) | 一种基于拉普拉斯正则化的低秩稀疏表征图像特征学习方法 | |
CN110766084A (zh) | 基于cae与hl-cnn的小样本sar目标识别方法 | |
CN103177265A (zh) | 基于核函数与稀疏编码的高清图像分类方法 | |
CN113011243A (zh) | 基于胶囊网络的面部表情分析方法 | |
CN110378245A (zh) | 基于深度学习的足球比赛行为识别方法、装置及终端设备 | |
CN109271833A (zh) | 基于栈式稀疏自编码器的目标识别方法、装置及电子设备 | |
CN109886160A (zh) | 一种非限定条件下的人脸识别方法 | |
CN106250818B (zh) | 一种全序保持投影的人脸年龄估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190326 Termination date: 20211218 |