CN110781972A - 一种增量无监督多模态相关特征学习模型 - Google Patents
一种增量无监督多模态相关特征学习模型 Download PDFInfo
- Publication number
- CN110781972A CN110781972A CN201911048971.2A CN201911048971A CN110781972A CN 110781972 A CN110781972 A CN 110781972A CN 201911048971 A CN201911048971 A CN 201911048971A CN 110781972 A CN110781972 A CN 110781972A
- Authority
- CN
- China
- Prior art keywords
- matrix
- model
- data
- modal
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 121
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000010606 normalization Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 2
- 239000002131 composite material Substances 0.000 claims description 2
- 238000011425 standardization method Methods 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 abstract description 4
- 238000007781 pre-processing Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 9
- 230000004927 fusion Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
提供一种增量无监督多模态相关特征学习模型,属于计算机技术领域。首先,获取已完成特征学习实例的相关数据,对新到来的多模态数据实例进行归一化和特殊值预处理。其次,构建基于非负矩阵分解的增量无监督多模态相关特征学习模型。再次,根据模型推导出模型中模态投影矩阵和新实例模态私有特征和共享特征的更新公式,对其进行联合优化。最后,计算模型值,判断本次模型值与上次模型值的变化幅度是否满足收敛条件,若满足,则计算得到的新实例的低维共享特征为模型的执行结果;否则重复第三步直至收敛。本发明构建一种行之有效的模型来解决增量多模态数据特征学习的问题,通过大量实验验证,本发明所学习到的特征表示性能要优于现阶段相关模型。
Description
技术领域
本发明属于计算机技术领域,具体涉及多模态数据融合中的一种增量无监督多模态相关特征学习模型。
背景技术
在现实世界中,数据可以由不同的数据源采集而来,形成多个模态或视图来共同描述同一物体在不同方面的特征。比如说一张图片,可以由颜色矩、小波纹理、边界直方图等可视特征来表示;一个文档可以被翻译成多种不同的语言。这种多个模态表示同一物品的特征相互兼容和互补,使得同时对这多个模态进行特征学习将更加全面有效。
为了处理大量无标记多模态数据,许多学习算法被提出来。其中非常重要的一类算法为基于非负矩阵分解的算法,其核心是期望找到两个低维矩阵的乘积逼近原高维数据矩阵,从而得到原数据的低维空间表示。例如,传统的非负矩阵分解(Non-negative MatrixFactorization,NMF)能够通过梯度下降的方法寻找融合矩阵的局部最优解;另外,在NMF的基础上,图正则化非负矩阵分解(Graph Regularized Non-negative MatrixFactorization,GNMF),融合原始数据空间最近邻图的信息,能够得到更优的融合效果。基于此,融合多模态数据和非负矩阵分解模型,多模态非负矩阵分解利用联合非负矩阵分解学习得到多模态数据的共享特征,进而完成多模态数据的分析、挖掘。然而,在现有的多模态非负矩阵分解模型中,直接将模态原始特征进行转化,忽略了模态私有特征对融合结果的影响。为了解决此问题,无监督多模态非负相关特征融合学习模型(UnsupervisedMultimodal Non-Negative Correlated Feature Learning,UMCFL)被提出来,在利用最近邻图信息的基础上通过模态私有特征和公有特征的共学习,得到更好的特征融合效果。
在实际应用当中存在这样的情况,所有数据并不是一次收集完成而是一个长时间的过程。比如网站的用户注册,用户不会是一天全部注册完毕,所以每一天都会有新的用户信息。图片网站也是每一天都有新的图片上传。如果每次变动都重新使用上述非增量算法重新计算聚类会有较大的时间开销。为解决这样的问题,各种增量算法被提出。其中,增量非负矩阵分解(Incremental Non-negative Matrix Factorization,INMF),增量图正则化非负矩阵分解(Incremental graph regulated non-negative matrix factorization,IGNMF)是分别基于NMF,GNMF的增量模型,它们通过只利用新到来的数据更新其对应的低维特征而不是所有低维特征来降低计算开销。虽然上述增量特征学习算法已经取得了良好的效果,但在学习过程中,没有考虑数据中的特征不相关信息,致使学习效果较差。因此,在增量算法的启发下,本发明将基于UMCFL模型提出其对应的增量模型:增量无监督多模态非负相关特征学习模型(Incremental Unsupervised Multimodal Non-Negative CorrelatedFeature Learning,IUMCFL),通过增量的方式牺牲一定聚类性能来降低计算开销。
发明内容
针对现有技术存在的问题,本发明提供一种基于非负矩阵分解的增量无监督多模态相关特征学习模型。基于图正则化和增量的思想,增量构建数据空间的几何结构。同时,增量构建多模态非相关和相关子空间,实现增量模态非相关和相关特征的共学习。
为了达到上述目的,本发明采用的技术方案为:
一种增量无监督多模态相关特征学习模型,包括以下步骤:
第一步,获取已完成特征学习实例的相关数据,对新到来的多模态数据实例进行归一化和特殊值预处理。
在增量的初始阶段,获取已经完成特征学习实例的相关数据,包括其多模态数据集,跨模态共享特征和模态私有特征,私有特征投影矩阵,共享特征投影矩阵,模态私有投影矩阵,模态实例图结构矩阵、模态实例对角矩阵、模态实例图的拉普拉斯矩阵。对于新到来实例的多模态数据集进行预处理,对所有数据属性值设置为一种线性转换的非负属性值。
第二步,构建基于非负矩阵分解的增量无监督多模态相关特征学习模型,包括:
增量扩展非负矩阵分解(NMF,Nonnegative Matrix Factorization)模型,将每个模态新数据特征矩阵分解成每个模态独有的低维不相关特征矩阵,即模态私有特征,和跨模态共享相关特征矩阵,即跨模态共享特征,与第一步获取的已完成特征学习实例的跨模态共享相关特征和模态私有特征矩阵进行拼接。同时运用图正则化的思想,对每个模态新实例的数据在所有数据,即新实例的数据加上给定的已完成计算的实例数据,集合空间上的分布特点进行拟合,保证每个模态新实例和所有实例间的分布结构,与新实例和所有实例间的跨模态共享特征的分布结构相似。最后,用l2,1范数来约束所有投影矩阵的稀疏性。这样结合起来就构建了增量多模态数据相关特征学习模型。
第三步,根据模型,推导出模型中模态投影矩阵和新实例模态私有特征和共享特征的更新公式,对其进行联合优化。其中,为保证新实例与其他数据实例低维特征映射在相近的子空间,使用原有投影矩阵作为新投影矩阵的初始值。
第四步,计算模型值,判断本次模型值(既目标损失函数值)与上次模型值的变化幅度是否满足收敛条件。如果满足,那么计算得到的新实例的低维共享特征为模型的执行结果;否则重复第三步直至目标函数收敛。
本发明的有益效果为:本发明依照上述步骤构建了一种行之有效的模型来解决增量多模态数据特征学习的问题。通过大量实验验证,本发明所学习到的特征表示性能要优于现阶段相关模型。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实例中的一种增量无监督多模态相关特征学习模型的整体结构示意图;
图2是本发明模型流程图。
图3为时间开销图(在Multilpe Features上的结果分析);
图4为时间开销图(无MultiNMF模型)(在Multilpe Features上的结果分析);
图5为聚类准确度图(在Multilpe Features上的结果分析);
图6为聚类互信息量图(在Multilpe Features上的结果分析);
图7为聚类纯度图(在Multilpe Features上的结果分析);
图8为时间开销图(在数据集Aloi上的结果分析);
图9为时间开销图(无MultiNMF模型)(在数据集Aloi上的结果分析);
图10为聚类准确度图(在数据集Aloi上的结果分析);
图11为聚类互信息量图(在数据集Aloi上的结果分析);
图12为聚类纯度图(在数据集Aloi上的结果分析);
图13为时间开销图(在数据集YouTube上的结果分析);
图14为时间开销图(无MultiNMF模型)(在数据集YouTube上的结果分析);
图15为聚类准确度图(在数据集YouTube上的结果分析);
图16为聚类互信息量图(在数据集YouTube上的结果分析);
图17为聚类纯度图(在数据集YouTube上的结果分析)。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例中的一种增量无监督多模态相关特征学习模型,具体包括如下步骤:
第一步,在增量的初始阶段,获取已完成计算实例的相关数据,对新到来的多模态数据实例进行归一化和特殊值预处理。
在增量的初始阶段,给定已完成特征学习的多模态数据实例的相关数据,包括其数据集k为实例数,Mv为模态属性维数,V为总模态数,为第v个模态的包含k个数据实例的Mv维数据矩阵,为具有非负约束的实数数据矩阵;以及对应的已经完成计算的相关矩阵共享特征投影矩阵Mc为共享特征维度,为第v个模态的共享特征投影矩阵;模态私有特征投影矩阵集MI为私有特征维度,为第v个模态的私有特征投影矩阵;模态私有特征矩阵k为实例数,为第v个模态包含k个数据实例的私有特征矩阵;包含k个实例的模态实例图结构矩阵模态实例对角矩阵模态实例图的拉普拉斯矩阵 为第v个模态下包含k个实例的对应的矩阵;包含k个数据实例的Mc维跨模态共享特征矩阵用于第二步模型构建使用。
对于新到来的多模态数据进行预处理,对所有数据属性值设置为一种线性转换的非负属性值。
对于新到来实例的多模态数据集的每一个属性,利用min-max标准化方法将对应的所有对象的属性值映射到[0-1]区间,对于每个对象包含的所有缺失属性值,利用1数值对其进行初始化填补,其中,表示新实例具有Mv维属性的第v个模态的数据矩阵,l为新到来实例数。
第二步,构建基于非负矩阵分解的增量无监督多模态相关特征学习模型,包含以下子步骤:
2.1)首先,增量扩展非负矩阵分解(NMF,Nonnegative Matrix Factorization)模型,将每个模态新实例特征矩阵分成模态私有特征矩阵和跨模态共享特征矩阵,并与第一步获取的已完成特征学习的多模态数据实例的跨模态共享特征矩阵和模态私有特征矩阵进行拼接。这样新实例多模态数据通过模态映射矩阵可以得到新实例低维共享空间中的多模态特征表示。基本模型如下:
其中,
[Vck,vc]=Vck+l (3)
其中,为全局数据集,表示包含已完成特征学习的前k个数据实例和新到来的l个数据实例,也就是总共k+l个实例,在第v个模态的数据矩阵,在中的第k+i列数据表示新实例中的第i个数据实例在第v个模态中的数据。同理,为这k+l个实例,在第v个模态的Mc维跨模态共享特征矩阵。为这k+l个实例,在第v个模态的MI维私有特征矩阵。和分别为新实例在共享空间中的模态共享特征和私有特征,即相关和不相关特征。和为各模态对于这k+l个实例的对应的投影矩阵,||·||F表示Frobenius范数,表示当前Frobenius范数的平方,s.t.表示约束条件。Vck和见第一步。
2.2)在基本模型的基础上运用图正则化思想,采用热核加权方案构造p-最近邻图,对每个模态新实例在所有实例集合空间上的分布特点进行拟合,保证新实例和所有实例间的分布结构,与新实例和所有实例间的跨模态共享特征的分布结构相似。
利用热核加权方案构造p-最近邻图,其顶点对应于数据空间中的每个数据。在本发明步骤2.1)的基本模型中,沿用已完成特征学习数据的最近邻图而不重新计算,只计算新实例与所有实例那部分的最近邻图,如此实现增量的p-最近邻图构建,得到图结构矩阵。图结构矩阵表示包含这k+l个实例在第v个模态的图结构矩阵,其中的值我们这样计算:
其中,为图结构矩阵的第i行第j列的数值。是数据实例和之间的欧氏距离。表示的p个最近邻居实例的集合,表示的p个最近邻居实例的集合。为第v个模态的第i个数据实例。为第v个模态的第j个数据实例。σ为新实例与所有实例欧式距离的均值。为图结构矩阵的第i行第j列的数值。
这样就得到了增量的p-最近邻图。相似地,在共享特征中也可以利用欧氏距离度量两个数据实例共享特征和的相似性。接着通过最小化图正则化项辅助新实例的低维共享特征学习,这使得新实例学习到的低维共享特征向着与它们在所有实例空间中相近的实例的低维共享特征的方向进行调整。
在基本模型上增加图正则化项后,模型可以进一步写为:
2.3)在步骤2.2)的基础上,对投影矩阵的稀疏性作出限制,采用l2,1范数来约束所有投影矩阵的稀疏性:
其中,Uij为矩阵U上第i行第j列的值。
步骤2.2)的基础上,加上对所有投影矩阵的稀疏性的约束,最终得到增量无监督多模态相关特征学习模型:
其中,β为参数,表示投影矩阵稀疏性控制因子。
第三步,根据第二步得到的增量无监督多模态相关特征学习模型,通过梯度下降原理推导出模型中模态投影矩阵和新数据模态私有特征和共有特征的更新公式,联合优化更新各矩阵变量使得模型值最小,学习到新实例的低维共享特征矩阵。其中在更新之前,各变量初始化过程中,为保证新实例与其他数据实例低维特征映射在相近的子空间,使用作为的初始值。更新公式推导包括以下步骤:
当变量vc,耦合在一起时,增量无监督多模态相关特征学习模型(8)的最小优化是一个非凸问题,寻找全局最优解十分困难。因此,采取更新某一变量时固定无关变量这一策略来寻求增量无监督多模态相关特征学习模型的局部最优解,计算过程如下:
那么最小化增量无监督多模态相关特征学习模型(8)可以简化为:
利用拉格朗日优化函数对公式(10)进行优化表示得到:
利用拉格朗日优化函数对公式(14)进行优化表示得到:
同理,与(1)(2)中求解过程类似,利用拉格朗日优化函数对公式(18)进行优化表示,求导后利用KKT条件得到更新公式:
第四步,计算模型值,判断本次模型值与上次模型值的变化幅度是否满足收敛条件。
在完成一次第三步,即对所有变量进行一次更新过程得到它们的新值。将新值代回模型计算得到当前模型的值。将当前模型的值与上一次更新得到的模型的值进行差值计算,计算差值的绝对值占上一次模型值的百分比得到变化幅度。如果变化幅度小于10-1,那么判断为模型收敛,计算得到的新数据的低维特征矩阵为模型的执行最终结果;否则,将模型各变量矩阵更新为新值,重新执行第三步直至判断模型值收敛。
结合本发明的方案,进行实验分析如下:
为了验证本发明提出模型的有效性,将其与目前较有代表性的非增量多模态特征学习模型UMCFL,MultiGNMF,MultiNMF和增量多模态特征学习模型MultiIGNMF,MultiINMF进行比较分析。最终学习到的低维特征均通过Kmeans聚类,在精度、标准化互信息和纯度三个指标上来验证各模型的学习效果。通过计算时间来比较各模型的时间开销。实验数据集如表1所示。
表1数据集描述
关于实验模型参数的设定,对于不同的数据集设定其低维共享特征的维度统一为数据集的类数,其余参数均按照其原始文中最好的参数设定。本发明提出的模型取值为具有最优性能时的取值。
实验当中,每次我们非重复地取1/10数据集的实例作为新到来的实例运行模型学习其低维共享特征,那么运行10次之后,就完成了对整个数据集的特征学习。对于增量算法,每次学习新实例的低维共享特征后,记录学习时间,与已经完成特征学习的实例的低维共享特征一起进行聚类分析验证学习效果,新实例归入已完成学习的实例集合中,保存所有相关数据;对于非增量算法,新实例和已完成特征学习的实例一起进行特征学习,记录学习时间,将学习到的所有实例的低维共享特征进行聚类分析验证学习效果,新实例归入已完成学习的实例集合中,只保存多模态数据集。这样对于每次模型运行,我们都能得到其时间开销,聚类精度、标准化互信息和纯度,我们重复运行20次取它们的均值作图。
图3至图17给出了本发明模型与其他比较模型在三个数据集上的时间开销以及聚类精度、标准化互信息量和纯度的比较结果。
接下来以图5为例子,进一步解释说明图的内容。
图5表示的是上述6种模型在数据集Multilpe Features上聚类准确度的比较。数据集Multilpe Features上有2000个实例,每次我们非重复地取1/10数据集的实例,也就是200个实例作为新到来的实例。图中横坐标表示的就是已完成特征学习的实例数,纵坐标表示的就是聚类的准确度。折线A上的点(x,y)意思是对于模型A,在完成x-200个实例的学习后,对于新到来的200个新实例进行特征学习。对于增量算法,学习到的新实例低维共享特征和已完成特征学习实例的低维共享特征进行聚类,重复运行模型20次得到的平均聚类准确度为y。对于非增量算法,完成学习后得到的所有实例低维共享特征进行聚类,重复运行模型20次得到的平均聚类准确度为y。折线A表示的就是模型A在处理数据集MultilpeFeatures上随着新实例的不断到来,学习到其低维共享特征聚类准确度的变化。
上述实验表明本发明模型在时间开销上均明显优于非增量算法,在前两个数据集特征学习效果上优于其他增量算法。第三个数据集特征学习效果虽然在数据量较少时稍微差于MultiIGNMF算法,但是随着新样本的不断到来,本发明算法学习效果相比于MultiIGNMF算法不断变好,最终优于该算法。说明了本发明模型通过增量共学习模态间的私有和跨模态共享特征能够排除掉新实例模态中的不相关信息达到更好的增量学习效果。
以上对本发明实施所提供的一种增量无监督多模态相关特征学习模型进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (2)
1.一种增量无监督多模态相关特征学习模型,其特征在于,包括以下步骤:
第一步,在增量的初始阶段,获取已完成计算实例的相关数据,对新到来的多模态数据实例进行归一化和特殊值预处理;
在增量的初始阶段,给定已完成特征学习的多模态数据实例的相关数据,包括其数据集其中,k为实例数,Mv为模态属性维数,V为总模态数,为第v个模态的包含k个数据实例的Mv维数据矩阵,为具有非负约束的实数数据矩阵;以及对应的已经完成计算的相关矩阵共享特征投影矩阵其中,Mc为共享特征维度,为第v个模态的共享特征投影矩阵;模态私有特征投影矩阵集其中,MI为私有特征维度,为第v个模态的私有特征投影矩阵;模态私有特征矩阵 其中,为第v个模态包含k个数据实例的私有特征矩阵;包含k个实例的模态实例图结构矩阵模态实例对角矩阵模态实例图的拉普拉斯矩阵 为第v个模态下包含k个实例的对应的矩阵;包含k个数据实例的Mc维跨模态共享特征矩阵用于第二步模型构建使用;
对于新到来实例的多模态数据集的每一个属性,利用min-max标准化方法将对应的所有对象的属性值映射到[0-1]区间,对于每个对象包含的所有缺失属性值,利用1数值对其进行初始化填补,其中,表示新实例具有Mv维属性的第v个模态的数据矩阵,l为新到来实例数;
第二步,构建基于非负矩阵分解的增量无监督多模态相关特征学习模型,包含以下步骤:
2.1)首先,增量扩展非负矩阵分解NMF模型,将每个模态新实例特征矩阵分成模态私有特征矩阵和跨模态共享特征矩阵,并与第一步获取的已完成特征学习的多模态数据实例的跨模态共享特征矩阵和模态私有特征矩阵进行拼接;新实例多模态数据通过模态映射矩阵可以得到新实例低维共享空间中的多模态特征表示;基本模型如下:
其中,
[Vck,vc]=Vck+l (3)
其中,为全局数据集,表示包含已完成特征学习的前k个数据实例和新到来的l个数据实例,也就是总共k+l个实例,在第v个模态的数据矩阵,在中的第k+i列数据表示新实例中的第i个数据实例在第v个模态中的数据;同理,为这k+l个实例,在第v个模态的Mc维跨模态共享特征矩阵;为这k+l个实例,在第v个模态的MI维私有特征矩阵;和分别为新实例在共享空间中的模态共享特征和私有特征,即相关和不相关特征;和为各模态对于这k+l个实例的对应的投影矩阵;
2.2)在基本模型的基础上运用图正则化思想,采用热核加权方案构造p-最近邻图,对每个模态新实例在所有实例集合空间上的分布特点进行拟合,保证新实例和所有实例间的分布结构,与新实例和所有实例间的跨模态共享特征的分布结构相似;
利用热核加权方案构造p-最近邻图,其顶点对应于数据空间中的每个数据;在步骤2.1)的基本模型中,沿用已完成特征学习数据的最近邻图而不重新计算,只计算新实例与所有实例那部分的最近邻图,实现增量的p-最近邻图构建,得到图结构矩阵表示包含这k+l个实例在第v个模态的图结构矩阵,其计算:
其中,为图结构矩阵的第i行第j列的数值;是数据实例和之间的欧氏距离;表示的p个最近邻居实例的集合,表示的p个最近邻居实例的集合;为第v个模态的第i个数据实例;为第v个模态的第j个数据实例;σ为新实例与所有实例欧式距离的均值;为图结构矩阵的第i行第j列的数值;
得到增量的p-最近邻图;相似地,在共享特征中也可以利用欧氏距离度量两个数据实例共享特征和的相似性;通过最小化图正则化项辅助新实例的低维共享特征学习,使新实例学习到的低维共享特征向着与它们在所有实例空间中相近的实例的低维共享特征的方向进行调整;
在基本模型上增加图正则化项后,模型进一步写为:
2.3)在步骤2.2)的基础上,对投影矩阵的稀疏性作出限制,采用l2,1范数约束所有投影矩阵的稀疏性:
其中,Uij为矩阵U上第i行第j列的值;
步骤2.2)的基础上,加上对所有投影矩阵的稀疏性的约束,最终得到增量无监督多模态相关特征学习模型:
其中,β为参数,表示投影矩阵稀疏性控制因子;
第三步,根据第二步得到的增量无监督多模态相关特征学习模型,通过梯度下降原理推导出模型中模态投影矩阵和新数据模态私有特征和共有特征的更新公式,联合优化更新各矩阵变量使得模型值最小,学习到新实例的低维共享特征矩阵;其中在更新之前,各变量初始化过程中,为保证新实例与其他数据实例低维特征映射在相近的子空间,使用作为的初始值;
第四步,计算模型值,判断本次模型值与上次模型值的变化幅度是否满足收敛条件;
在完成一次第三步的步骤后,对所有变量进行一次更新过程得到它们的新值;将新值代回模型计算得到当前模型的值;将当前模型的值与上一次更新得到的模型的值进行差值计算,计算差值的绝对值占上一次模型值的百分比得到变化幅度;如果变化幅度小于10-1,那么判断为模型收敛,计算得到的新数据的低维特征矩阵为模型的执行最终结果;否则,将模型各变量矩阵更新为新值,重新执行第三步直至判断模型值收敛。
2.根据权利要求1所述的一种增量无监督多模态相关特征学习模型,其特征在于,所述的第三步中,当变量vc,耦合在一起时,采取更新某一变量时固定无关变量这一策略来寻求增量无监督多模态相关特征学习模型的局部最优解,计算过程如下:
最小化增量无监督多模态相关特征学习模型(8)简化为:
利用拉格朗日优化函数对公式(10)进行优化,并对vc求偏导后,得到vc的更新规则为:
(3)给定vc更新
同理,与(1)(2)中求解过程类似,利用拉格朗日优化函数对公式(18)进行优化表示,求导后利用KKT条件得到更新公式:
同(3)中计算过程类似,得到的更新公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911048971.2A CN110781972A (zh) | 2019-10-31 | 2019-10-31 | 一种增量无监督多模态相关特征学习模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911048971.2A CN110781972A (zh) | 2019-10-31 | 2019-10-31 | 一种增量无监督多模态相关特征学习模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110781972A true CN110781972A (zh) | 2020-02-11 |
Family
ID=69387957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911048971.2A Pending CN110781972A (zh) | 2019-10-31 | 2019-10-31 | 一种增量无监督多模态相关特征学习模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110781972A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326289A (zh) * | 2021-08-02 | 2021-08-31 | 山东大学 | 面向携带新类别的增量数据的快速跨模态检索方法及系统 |
CN117576568A (zh) * | 2023-12-08 | 2024-02-20 | 成都理工大学 | 一种基于增量学习的深度鲁棒非负矩阵分解方法 |
-
2019
- 2019-10-31 CN CN201911048971.2A patent/CN110781972A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326289A (zh) * | 2021-08-02 | 2021-08-31 | 山东大学 | 面向携带新类别的增量数据的快速跨模态检索方法及系统 |
CN117576568A (zh) * | 2023-12-08 | 2024-02-20 | 成都理工大学 | 一种基于增量学习的深度鲁棒非负矩阵分解方法 |
CN117576568B (zh) * | 2023-12-08 | 2024-07-05 | 成都理工大学 | 一种基于增量学习的深度鲁棒非负矩阵分解方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112836672B (zh) | 一种基于自适应近邻图嵌入的无监督数据降维方法 | |
CN110516095B (zh) | 基于语义迁移的弱监督深度哈希社交图像检索方法和系统 | |
CN108171279B (zh) | 一种多视角视频自适应乘积Grassmann流形子空间聚类方法 | |
CN111191719B (zh) | 一种基于自表示和图谱约束的非负矩阵分解的图像聚类方法 | |
CN108776812A (zh) | 基于非负矩阵分解和多样-一致性的多视图聚类方法 | |
CN115494865B (zh) | 基于时空图卷积网络的无人机集群态势分析方法及介质 | |
CN110378423A (zh) | 特征提取方法、装置、计算机设备及存储介质 | |
CN109670418B (zh) | 结合多源特征学习和组稀疏约束的无监督物体识别方法 | |
CN110516533B (zh) | 一种基于深度度量的行人再辨识方法 | |
CN109063725B (zh) | 面向多视图聚类的多图正则化深度矩阵分解方法 | |
CN110781972A (zh) | 一种增量无监督多模态相关特征学习模型 | |
CN103927554A (zh) | 一种基于拓扑结构的图像稀疏表征面部表情特征提取系统和方法 | |
CN111027582A (zh) | 基于低秩图学习的半监督特征子空间学习方法及装置 | |
You et al. | Robust structure low-rank representation in latent space | |
CN110276049A (zh) | 一种半监督自适应图正则化判别非负矩阵分解方法 | |
CN117671666A (zh) | 一种基于自适应图卷积神经网络的目标识别方法 | |
CN113920210A (zh) | 基于自适应图学习主成分分析方法的图像低秩重构方法 | |
CN108009570A (zh) | 一种基于核正负标签传播的数据分类方法及系统 | |
CN109614581B (zh) | 基于对偶局部学习的非负矩阵分解聚类方法 | |
CN111488900A (zh) | 一种基于非负矩阵分解的多视图相关特征学习模型 | |
Jiang et al. | A massive multi-modal perception data classification method using deep learning based on internet of things | |
CN113139556B (zh) | 基于自适应构图的流形多视图图像聚类方法及系统 | |
CN116383441A (zh) | 社群检测方法、装置、计算机设备和存储介质 | |
CN115631361A (zh) | 一种融合低秩核学习和自适应超图的图像聚类方法 | |
CN115169436A (zh) | 一种基于模糊局部判别分析的数据降维方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200211 |