CN105975978A - 一种结合标记相关性的半监督多标记特征选择及分类方法 - Google Patents
一种结合标记相关性的半监督多标记特征选择及分类方法 Download PDFInfo
- Publication number
- CN105975978A CN105975978A CN201610256462.9A CN201610256462A CN105975978A CN 105975978 A CN105975978 A CN 105975978A CN 201610256462 A CN201610256462 A CN 201610256462A CN 105975978 A CN105975978 A CN 105975978A
- Authority
- CN
- China
- Prior art keywords
- omega
- matrix
- lambda
- tag
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 88
- 238000005065 mining Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 10
- 239000003550 marker Substances 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 5
- 238000007635 classification algorithm Methods 0.000 abstract description 2
- 238000011160 research Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种结合标记相关性的半监督多标记特征选择及分类方法;属于多标记学习领域。该方法包含如下步骤:多标记分类;多标记特征选择;标记相关性的挖掘与利用。本发明通过构建标记协方差矩阵自动学习了成对且对称的标记相关性,并有效利用了未知标记数据的信息以帮助标记协方差的估计,从而将标记相关性的自动学习与利用,多标记特征选择和多标记分类统一在同一个模型框架中,有效提高了半监督多标记特征选择及分类算法的效果;此外,结合标记相关性的半监督多标记特征选择及分类方法能够在一定时间内快速收敛,因此具有较高的使用价值。
Description
技术领域
本发明属于多标记学习领域,特别涉及一种结合标记相关性的半监督多标记特征选择及分类方法。
背景技术
在机器学习研究中,监督学习(Supervised Learning)是一种最常见且最重要的学习框架。在传统的监督学习框架中,我们所面对的主要问题为单标记学习问题,即每个学习对象有且仅有一个类别标记,标记之间是相互独立、互斥的。单标记学习的主要任务是通过学习已知的训练样本,来预测未知样本所属的类别标记。然而对于很多实际应用中的对象来说,单独的一个标记无法对这些复杂对象进行准确的描述,因为学习对象同时与多个类别标记相关,且标记之间是交叉、有关联的。例如,在文本分类中,一则新闻报道中可能同时与“胜利日”,“阅兵”和“天安门广场”等多个类别标记相关;在图像分类中,一幅关于海滨的图像可能同时与“沙滩”、“海水”、“人群”、“蓝天”和“白云”等多个语义概念标记有关;在视频自动标注中,一段视频可能同时具有“魔术”、“舞蹈”、“杂技”等多个类别标记;在生物信息学中,一段基因序列可能同时具有“新陈代谢”、“转录”和“蛋白质合成”等多种功能标记;在音乐分类中,一段音乐可能同时包含“寂寞的”和“悲伤的”等情感标记。然而,在快速渗透到各个领域的同时,多标记学习也面临着多种挑战,其中之一便是“维数灾难”,与传统的单标记学习一样,多标记数据中也存在着大量冗余特征、不相关特征,从而导致了分类器性能的降低。
大多数的多标记学习研究工作都是在监督学习的框架下开展的,即最重要的基本假设是所有样本所对应的标记集都是给定的。然而在实际应用中,随着社交网络的快速发展,样本数据的数量也在急剧增长,因而获取样本的多个标记往往需要很大的人力和时间开销,很多数据集中多数样本是未经人工标记的。因此,对非监督多标记学习问题的研究同样具有十分重要的意义。众所周知,如何有效利用标记之间的相关性是多标记学习研究工作中的一个重要内容。目前,大多数对标记相关性进行利用的多标记学习算法均假设标记相关性是事先获得的,也有一些学习算法利用标记之间的层次关系来给出标记相关性。但是,这些事先获得的信息并不能对标记相关性进行准确定义,因此,有学者提出通过学习来自动发现和利用标记之间的相关性。
然而,现有的一些用于半监督的多标记学习方法大多是针对多标记分类问题的研究工作,能够同时考虑半监督多标记特征选择及分类的研究工作却少之又少,也没有有效地挖掘并利用标记之间的相关性。
发明内容
本发明为了解决半监督学习框架下多标记特征选择及分类问题,提出了一种结合标记相关性的多标记特征选择及分类方法,从而有效利用标记之间的相关性来提高多标记特征选择并且辅助多标记分类效果。
本发明公开了一种结合标记相关性的半监督多标记特征选择及分类方法,包含如下步骤:
步骤1,半监督多标记数据分类:利用最小二乘回归作为损失函数对多标记数据进行分类;
步骤2,半监督多标记特征选择:采用L2,1范数作为正则化项对半监督多标记学习问题进行稀疏化特征选择;
步骤3,标记相关性的挖掘与利用:通过构建标记协方差矩阵自动学习了成对且对称的标记相关性,利用未知标记数据的信息帮助标记协方差矩阵的估计;
步骤4,模型预测:综合步骤1至3,将多标记特征选择和多标记分类统一到同一模型框架中学习预测。
所述步骤3具体包括以下步骤:
①定义协方差矩阵Ω用于表示成对标记之间的相关性,加入标记相关性后基本模型可表示为:
s.t. 0≤fi≤1
Ω>0
tr(Ω)=1
式中前两项分别为最小二乘损失项和辅助特征选择的正则化项,第三项用于度量基于权重矩阵W和协方差矩阵Ω的所有标记之间的相关性并惩罚权重矩阵W的复杂度;其中xi∈Rd表示d维样本数据,R为实数集,Yl为已知标记空间;标记矩阵为对于所有已知标记样本Fl=Yl;Fl为已知标记的训练样本的预测标记矩阵,Fu为未知标记的训练样本的预测标记矩阵;b为偏移向量,μ和λ1均为正则化项参数,si表示事先定义的训练数据的置信度分数,fi为第i个样本的函数值;
②为了更好地利用未标记的数据来帮助协方差矩阵Ω的估计,加入未知标记信息项:
s.t. 0≤fi≤1
Ω>0
tr(Ω)=1
其中,λ2为正则化项参数。
③定义对角矩阵S来为置信度分数矩阵,对角矩阵S中,Sii=si;将目标函数转化为如下形式,其中1为全1列向量,X=[x1,x2,…,xn]∈Rn×d表示由n个样本构成的样本空间:
④固定权重矩阵W和协方差矩阵Ω,根据下式求解偏移向量b:
其中,m=1TS1;
⑤求出偏移向量b的解后代入步骤③的公式并转换可得:
其中,I为单位矩阵;
⑥求解权重矩阵W可得:
XHSHXTW+μDW+λ1WΩ-1=XHSHF
其中,D为随机初始化权重矩阵W的对角矩阵,定义为:
可以得到:
(XHSHXT+μD)W+Wλ1Ω-1=XHSHF
令A=XHSHXT+μD,B=λ1Ω-1,C=XHSHF,则上式变换为AW+WB=C的形式对权重矩阵W进行求解;
⑦固定权重矩阵W和偏移向量b,求解协方差矩阵Ω;此时,目标函数可看作如下形式:
s.t. Ω>0
tr(Ω)=1
⑧已知:
令A=λ1WTW+λ2FTF,则可求得协方差矩阵Ω为:
⑨每次迭代过程中由计算出预测标记矩阵F的结果并加以调整。
本发明是专门针对标记相关性的挖掘与利用提出的半监督多标记特征选择及分类的方法。通过构建标记协方差矩阵自动学习了成对且对称的标记相关性,并有效利用了未知标记数据的信息以帮助标记协方差的估计,从而将标记相关性的自动学习与利用,多标记特征选择和多标记分类统一在同一个模型框架中,有效提高了半监督多标记特征选择及分类算法的效果。与现有技术相比,本发明具有以下特征:
首先,本发明有自动学习了成对且对称的标记相关性,提高了半监督多标记特征选择及分类器的性能;
然后,本发明有效利用了未标记数据的信息,有效帮助了标记相关性的学习;
再者,本发明能够在有效时间内快速收敛,更接近实际应用环境,具有更高的使用价值。
附图说明
图1为本发明整体流程图。
图2为本发明多标记特征选择及分类的模型求解步骤流程图。
具体实施方式
以下结合附图说明本发明的具体实施方式。
如图1所示,本发明公开了一种用于结合标记相关性的半监督多标记特征选择及分类方法,需要说明的是,本发明的核心步骤是在半监督多标记特征选择及分类中利用标记相关性,具体实施方式的描述主要侧重于步骤3,步骤1以及步骤2未提及的内容可采用现有技术实现。
1.多标记特征选择及分类:
半监督学习中,大量的冗余特征和无关特征也时刻影响着分类器的学习效果,已有的半监督特征选择算法大多针对于单标记学习问题而设计,在多标记学习中,半监督特征选择问题同样值得深入研究。
①选择简便有效的最小二乘回归为损失函数,并以L2,1范数作为正则化项对半监督多标记学习问题进行稀疏化特征选择,则目标函数表示为:
s.t. 0≤fi≤1
其中,xi∈Rd表示d维样本数据,Yl为已知标记空间,μ为正则化项参数,si表示事先定义的训练数据的置信度分数,W为权重矩阵,fi为第i个样本的函数值。在半监督学习中,已知标记数据所提供的信息比未知标记数据更加准确,则已知标记数据相对的置信度分数高于未知标记数据的分数;
②求解过程中,通过定义对角矩阵S(Sii=si)来表示置信度分数矩阵,将目标函数转化为如下形式,其中1为全1列向量:
其中,为标记矩阵,对于所有已知标记样本Fl=Yl。Fl为已知标记的训练样本的预测标记矩阵,Fu为未知标记的训练样本的预测标记矩阵。
③采用交替迭代的方法求解权重矩阵W和偏移向量b,并根据下式对每次迭代中由计算出的结果进行调整。
2.标记相关性的挖掘与利用:
①设置概率模型其中表示以为均值,以为行协方差,为列协方差的矩阵正态分布。W=[w1,…,wL]为权重矩阵,0d×L表示d×L的零矩阵,行协方差矩阵Id用于刻画特征之间的关系,列协方差矩阵Ω则用于刻画标记之间的关系,当Ω∝IL时,该模型则可退化为L个独立的二类SVM模型;
②概率模型可进一步得到
③基于此,模型框架可表示为:
s.t. yil(wl Txi+bl)≥1-ξil
ξil≥0,i=1,...,n;l=1,...L
其中,第一项为损失项,第二项用于度量基于权重矩阵W和协方差矩阵Ω的所有标记之间的相关性并惩罚权重矩阵W的复杂度,第三项则为协方差矩阵Ω的复杂度的惩罚项。b=[b1,...,bL]为偏差向量,tr(·)表示矩阵的迹,半正定协方差矩阵Ω用于度量标记之间的相关性;
④由于ln|Ω|≤tr(Ω)-L,可进一步表示为:
s.t. yil(wl Txi+bl)≥1-ξil
ξil≥0,i=1,...,n;l=1,...L
⑤进一步化简后可等价优化为:
s.t. yil(wl Txi+bl)≥1-ξil
ξil≥0,i=1,...,n;l=1,...L
Ω>0
tr(Ω)=1
其中,λ为正则化参数,最后的约束项则用于控制协方差矩阵Ω的复杂度。
3.模型求解及预测:
本发明通过利用标记相关性以提高半监督多标记特征选择及分类效果,且能够在有效时间内快速收敛,有实用价值。本发明的模型求解及预测过程如下:
①定义协方差矩阵Ω用于表示成对标记之间的相关性。加入标记相关性后基本模型可表示为:
s.t. 0≤fi≤1
Ω>0
tr(Ω)=1
其中前两项分别为最小二乘损失项和辅助特征选择的正则化项,第三项用于度量基于权重矩阵W和协方差矩阵Ω的所有标记之间的相关性并惩罚权重矩阵W的复杂度;
②为了更好地利用未标记的数据来帮助协方差矩阵Ω的估计,加入未知标记信息项:
s.t. 0≤fi≤1
Ω>0
tr(Ω)=1
③定义对角矩阵S(Sii=si)来为置信度分数矩阵,将目标函数转化为如下形式,其中1为全1列向量:
④固定权重矩阵W和协方差矩阵Ω,求解偏移向量b:
其中,m=1TS1;
⑤求出偏移向量b的解后代入并转换可得:
其中,I为单位矩阵;
⑥求解权重矩阵W可得:
XHSHXTW+μDW+λ1WΩ-1=XHSHF
其中,D为随机初始化权重矩阵W的对角矩阵,定义为:
可以得到:
(XHSHXT+μD)W+Wλ1Ω-1=XHSHF
令A=XHSHXT+μD,B=λ1Ω-1,C=XHSHF,则上式变换为AW+WB=C的形式对权重矩阵W进行求解;
⑦固定权重矩阵W和偏移向量b,求解协方差矩阵Ω。此时,目标函数可看作如下形式:
s.t. Ω>0
tr(Ω)=1
⑧已知:
令A=λ1WTW+λ2FTF,则可求得协方差矩阵Ω为:
⑨每次迭代过程中由计算出预测标记矩阵F的结果并加以调整。
Claims (2)
1.一种结合标记相关性的半监督多标记特征选择及分类方法,其特征在于,包含如下步骤:
步骤1,半监督多标记数据分类:利用最小二乘回归作为损失函数对多标记数据进行分类;
步骤2,半监督多标记特征选择:采用L2,1范数作为正则化项对半监督多标记学习问题进行稀疏化特征选择;
步骤3,标记相关性的挖掘与利用:通过构建标记协方差矩阵自动学习了成对且对称的标记相关性,利用未知标记数据的信息帮助标记协方差矩阵的估计;
步骤4,模型预测:综合步骤1至3,将多标记特征选择和多标记分类统一到同一模型框架中学习预测。
2.如权利要求1所述的一种结合标记相关性的半监督多标记特征选择及分类方法,其特征在于,所述步骤3具体包括以下步骤:
①定义协方差矩阵Ω用于表示成对标记之间的相关性,加入标记相关性后基本模型可表示为:
s.t. 0≤fi≤1
Ω>0
tr(Ω)=1
式中前两项分别为最小二乘损失项和辅助特征选择的正则化项,第三项用于度量基于权重矩阵W和协方差矩阵Ω的所有标记之间的相关性并惩罚权重矩阵W的复杂度;其中xi∈Rd表示d维样本数据,R为实数集,Yl为已知标记空间;标记矩阵为对于所有已知标记样本Fl=Yl;Fl为已知标记的训练样本的预测标记矩阵,Fu为未知标记的训练样本的预测标记矩阵;b为偏移向量,μ和λ1均为正则化项参数,si表示事先定义的训练数据的置信度分数,fi为第i个样本的函数值;
②为了更好地利用未标记的数据来帮助协方差矩阵Ω的估计,加入未知标记信息项:
s.t. 0≤fi≤1
Ω>0
tr(Ω)=1
其中,λ2为正则化项参数。
③定义对角矩阵S来为置信度分数矩阵,对角矩阵S中,Sii=si;将目标函数转化为如下形式,其中1为全1列向量,X=[x1,x2,…,xn]∈Rn×d表示由n个样本构成的样本空间:
④固定权重矩阵W和协方差矩阵Ω,根据下式求解偏移向量b:
其中,m=1TS1;
⑤求出偏移向量b的解后代入步骤③的公式并转换可得:
其中,I为单位矩阵;
⑥求解权重矩阵W可得:
XHSHXTW+μDW+λ1WΩ-1=XHSHF
其中,D为随机初始化权重矩阵W的对角矩阵,定义为:
可以得到:
(XHSHXT+μD)W+Wλ1Ω-1=XHSHF
令A=XHSHXT+μD,B=λ1Ω-1,C=XHSHF,则上式变换为AW+WB=C的形式对权重矩阵W进行求解;
⑦固定权重矩阵W和偏移向量b,求解协方差矩阵Ω;此时,目标函数可看作如下形式:
s.t. Ω>0
tr(Ω)=1
⑧已知:
令A=λ1WTW+λ2FTF,则可求得协方差矩阵Ω为:
⑨每次迭代过程中由计算出预测标记矩阵F的结果并加以调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610256462.9A CN105975978A (zh) | 2016-04-22 | 2016-04-22 | 一种结合标记相关性的半监督多标记特征选择及分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610256462.9A CN105975978A (zh) | 2016-04-22 | 2016-04-22 | 一种结合标记相关性的半监督多标记特征选择及分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105975978A true CN105975978A (zh) | 2016-09-28 |
Family
ID=56993089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610256462.9A Pending CN105975978A (zh) | 2016-04-22 | 2016-04-22 | 一种结合标记相关性的半监督多标记特征选择及分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105975978A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106601235A (zh) * | 2016-12-02 | 2017-04-26 | 厦门理工学院 | 一种半监督多任务特征选择的语音识别方法 |
CN110537184A (zh) * | 2017-05-19 | 2019-12-03 | 华为技术有限公司 | 利用生成式对抗网络的半监督回归 |
CN110555467A (zh) * | 2019-08-13 | 2019-12-10 | 深圳创新奇智科技有限公司 | 一种基于模型迁移的工业数据分类方法 |
CN117454154A (zh) * | 2023-12-22 | 2024-01-26 | 江西农业大学 | 一种面向偏标记数据的鲁棒特征选择方法 |
-
2016
- 2016-04-22 CN CN201610256462.9A patent/CN105975978A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106601235A (zh) * | 2016-12-02 | 2017-04-26 | 厦门理工学院 | 一种半监督多任务特征选择的语音识别方法 |
CN110537184A (zh) * | 2017-05-19 | 2019-12-03 | 华为技术有限公司 | 利用生成式对抗网络的半监督回归 |
CN110555467A (zh) * | 2019-08-13 | 2019-12-10 | 深圳创新奇智科技有限公司 | 一种基于模型迁移的工业数据分类方法 |
CN110555467B (zh) * | 2019-08-13 | 2020-10-23 | 深圳创新奇智科技有限公司 | 一种基于模型迁移的工业数据分类方法 |
CN117454154A (zh) * | 2023-12-22 | 2024-01-26 | 江西农业大学 | 一种面向偏标记数据的鲁棒特征选择方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106469560B (zh) | 一种基于无监督域适应的语音情感识别方法 | |
Yu et al. | Exploiting click constraints and multi-view features for image re-ranking | |
CN105808752B (zh) | 一种基于cca和2pknn的自动图像标注方法 | |
CN102314614B (zh) | 一种基于类共享多核学习的图像语义分类方法 | |
CN107992890B (zh) | 一种基于局部特征的多视角分类器及设计方法 | |
CN102750347B (zh) | 一种用于图像或视频搜索重排序的方法 | |
CN105975978A (zh) | 一种结合标记相关性的半监督多标记特征选择及分类方法 | |
CN110009017A (zh) | 一种基于视角类属特征学习的多视角多标记分类方法 | |
CN107330448A (zh) | 一种基于标记协方差和多标记分类的联合学习方法 | |
CN106203483A (zh) | 一种基于语义相关多模态映射方法的零样本图像分类方法 | |
Gomez et al. | Self-supervised learning from web data for multimodal retrieval | |
CN114239585A (zh) | 一种生物医学嵌套命名实体识别方法 | |
CN106485272A (zh) | 基于流形约束的跨模态嵌入的零样本分类方法 | |
CN105809119A (zh) | 一种基于稀疏低秩结构多任务学习的行为识别方法 | |
CN117516937A (zh) | 基于多模态特征融合增强的滚动轴承未知故障检测方法 | |
Vezhnevets et al. | Associative embeddings for large-scale knowledge transfer with self-assessment | |
CN115827954A (zh) | 动态加权的跨模态融合网络检索方法、系统、电子设备 | |
CN112749738A (zh) | 一种融合上下文进行超类推理的零样本对象检测方法 | |
CN116958677A (zh) | 一种基于多模态大数据的互联网短视频分类方法 | |
CN102831161A (zh) | 用于图像检索的基于流形正则化的半监督排序学习方法 | |
CN110705384A (zh) | 一种基于跨域迁移增强表示的车辆再识别方法 | |
CN114201583A (zh) | 一种基于图注意力网络的中文金融事件自动抽取方法及系统 | |
CN113779249A (zh) | 跨领域文本情感分类方法、装置、存储介质以及电子设备 | |
Higuchi et al. | Patent image retrieval using transformer-based deep metric learning | |
Chen et al. | Few-shot person re-identification based on Feature Set Augmentation and Metric Fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160928 |
|
RJ01 | Rejection of invention patent application after publication |