CN106022351A - 一种基于非负字典对学习的鲁棒多视角聚类方法 - Google Patents

一种基于非负字典对学习的鲁棒多视角聚类方法 Download PDF

Info

Publication number
CN106022351A
CN106022351A CN201610270303.4A CN201610270303A CN106022351A CN 106022351 A CN106022351 A CN 106022351A CN 201610270303 A CN201610270303 A CN 201610270303A CN 106022351 A CN106022351 A CN 106022351A
Authority
CN
China
Prior art keywords
matrix
mode
projection
object function
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610270303.4A
Other languages
English (en)
Other versions
CN106022351B (zh
Inventor
谭铁牛
曹冬
赫然
孙哲南
李志航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Intelligent Identification Co ltd
Original Assignee
Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd filed Critical Tianjin Zhongke Intelligent Identification Industry Technology Research Institute Co Ltd
Priority to CN201610270303.4A priority Critical patent/CN106022351B/zh
Publication of CN106022351A publication Critical patent/CN106022351A/zh
Application granted granted Critical
Publication of CN106022351B publication Critical patent/CN106022351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开一种基于非负字典对学习的鲁棒多视角聚类方法,通过提取包含若干子空间的数据集不同视角下的特征;然后将特征学习嵌入字典学习,联合学习语义投影矩阵和非负特征投影;加入一致性约束和局部几何保持约束学习多视角所共享的公共聚类标签,在多个约束下学习各视角的语义投影矩阵、参数表示矩阵及多视角共享的语义投影矩阵,完成多视角聚类。该方法可以挖掘出多视角所共享的公共语义标签,并且加入一致性约束,减少单独的聚类标签与公共语义标签之间的差异性,同时加入局部几何保持约束,使得具有相似结构的数据更大概率分到相同的类。

Description

一种基于非负字典对学习的鲁棒多视角聚类方法
技术领域
本发明涉及模式识别技术领域,尤其是一种基于非负字典对学习的鲁棒多视角聚类方法。
背景技术
在现实中,很多数据都有多个模态,例如,文章可以被翻译成多种语言、新闻可以从多个视角报道、图片可以由多种描述子描述。一般而言,多视角数据可以提供互补和兼容的信息。多视角聚类是一种无监督的多视角学习方法,已经引起了人们的关注。过去的工作主要分为两类:基于回归的方法和基于子空间的方法。虽然这些方法都取得了显著的提高,但是它们是有局限性的。因为这些方法都假设所给的特征是无噪声的,这些数据可以揭示潜在的聚类结构。但不幸的是,现实生活中的特征常常是冗余的且含有噪声,这极大地降低了上述方法的性能。因此亟需一种高效鲁棒的多视角聚类方法。
发明内容
鉴于以往方法不能有效的满足鲁棒多视角聚类的需要,本发明提出了一种基于非负字典对学习的鲁棒多视角聚类方法。该方法用特征投影学习聚类标签,使用语义投影探索潜在语义信息,同时加入一致性约束和局部几何保持约束以生成一个多视角共享的公共聚类标签,从而实现多视角聚类。
本发明是这样实现的,一种基于非负字典对学习的鲁棒多视角聚类方法,包括以下步骤:
S1,提取多模态数据库中的多模态特征;
S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;
S3,向所述多模态数据库嵌入非负特征投影以处理噪声特征;
S4,根据所述参数表示矩阵,创建一致性约束,用于描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性;
S5,根据所述多模态数据库中各个模态的特征,创建局部几何保持约束,用于描述每个视角下样本间结构的相似性;
S6,根据所述语义投影矩阵、非负特征投影、一致性约束和局部几何保持约束,得到统一的目标函数;
S7,求解所述目标函数得到公共语义标签,根据所述公共语义标签,得到公共的聚类结果,完成多视角聚类。
本发明方法假设数据是冗余的且有噪声,通过学习非负特征投影处理噪声特征,利用一致性约束最小化单独聚类标签与共享标签之间的差异,利用局部几何保持约束保持数据的局部一致性,使得相似数据具有较大概率,具有相同的语义标签;同时考虑特征投影、一致性约束和局部几何保持约束,将其纳入到统一的子空间聚类框架,采用近端交替线性最小化算法优化目标函数,得到公共语义标签,完成多视角聚类。
根据本发明的方法,可挖掘出多视角所共享的公共语义标签,并且加入一致性约束,减少单独的聚类标签与公共语义标签之间的差异性,同时加入局部几何保持约束,使得具有相似结构的数据更大概率分到相同的类。
附图说明
图1是基于非负字典对学习的鲁棒多视角聚类方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
如图1所示,本发明的基于非负字典对学习的鲁棒多视角聚类方法包括以下步骤:
步骤S1,提取包含若干子空间的多模态数据库中的多模态特征;
多模态数据即同一数据有不同的表现形式,如视频数据可由音频和图像流组成,图片数据可由图像本身视觉信息和标记单词信息组成。对不同模态的数据分别提取特征,如提取图片视觉信息的GIST特征,标记单词的词频特征等。
多模态特征是包括含有图片和标记单词一一对应的图像标记对。
步骤S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;
在该步骤中,采用字典学习方法来学习多模态数据库中的特征向量的语义投影矩阵和参数表示矩阵。语义投影矩阵是探索模态特征的语义信息,在字典学习中是字典;参数表示矩阵是模态特征在所学字典上的表达。
所述字典学习的目标函数为:
min U , V || X - U V || F 2 + Ω { U , V } ,
其中,为d维的非负训练数据,n为样本数目,为语义投影矩阵,r为聚类标签个数,为参数表示矩阵,||·||F为求取F-范数操作,Ω{U,V}代表约束项。
步骤S3,向所述多模态数据库嵌入非负特征投影;
所述的非负特征投影是原始噪声数据到所述参数表达的线性投影V=WTX,W为线性投影矩阵,WT为矩阵W的转置,可有效处理含有噪声的数据。
步骤S4,根据所述参数表示矩阵,创建一致性约束,用于描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性;
该步骤中,一致性约束是描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性,因为多个视角隐含地表达相同的对象。所述一致性约束公式如下:
D ( W c T X c , V * ) = || W c T X c - V * || F 2
其中,c为模态序号,Wc为第c个模态的特征投影矩阵,Wc T为矩阵Wc的转置,Xc为第c个模态的特征,V*为公共语义标签。
步骤S5,根据所述多模态数据库中各个模态的特征,创建局部几何保持约束,用于描述每个视角下样本间结构的相似性。
在该步骤中,局部几何保持约束描述每个视角下样本间结构的相似性,假设具有相似结构的样本具有相似的语义,因此,具有相似结构的样本更大概率属于同一聚类标签。
Σ c = 1 m Σ i , j = 1 n λ c S c ( i , j ) ( V * ( : , i ) - V * ( : , j ) ) 2 = Σ c = 1 m λ c V * L c V * T
其中m是模态数目,i,j为样本序号,n为样本数目,λc为第c个模态的权重系数,V*(:,i)表示矩阵V*的第i列,V*T是矩阵V*的转置,Lc=Dc-Sc是亲和矩阵Sc的拉普拉斯矩阵,Dc为第c个模态的对角矩阵,Dc(i,i)=∑jSc(i,j),第c个模态的亲和矩阵Sc如下定义:
S c ( i , j ) = exp ( - || x i - x j || 2 σ 2 ) x i ∈ N k ( x j ) o r x j ∈ N k ( x i ) 0 o t h e r w i s e ,
其中,Nk(x)为样本x的k近邻。
步骤S6,根据所述语义投影矩阵、非负特征投影、一致性约束和局部几何保持约束,得到统一的目标函数。
所述目标函数为:
min U c , W c , V * Σ c = 1 m || X c - U c W c T X c || F 2 + α || W c T X c - V * || F 2 + β || W c || 2 , 1 + t r ( V * LV * T ) s . t . U c , W c T X c , V * ≥ 0 , V * T V * = I , L = Σ c = 1 m λ c L c ,
其中,Uc为第c个模态的语义投影矩阵,Wc是第c个模态特征的线性投影矩阵,α,β为权重参数,α,β∈[10-4,104],Xc为第c个模态的特征,V*为公共语义标签,||·||2,1为求取矩阵的2,1范数操作,L是每个模态拉普拉斯矩阵的加权和,I为单位矩阵。
所述统一的目标函数放缩处理后如下:
min U c , V c , W c , V * J = Σ c = 1 m || X c - U c V c || F 2 + α || W c T X c - V c || F 2 + β || W c || 2 , 1 + γ || V c - V * || F 2 + t r ( V * LV * T ) s . t . V c , V * ≥ 0 , V * V * T = I , L = Σ c = 1 m λ c L c ; ,
其中,J为目标函数,Vc为第c个模态的辅助变量。
步骤S7,求解所述目标函数得到公共语义标签,根据所述公共语义标签,得到公共的聚类结果,完成多视角聚类。
该步骤中,求解所述统一的目标函数方法可以是采用近端交替线性最小化算法,具体步骤如下:
S71,初始化和迭代次数N,上标0表示第0次迭代;
S72,求解第t+1次迭代第c个模态的投影矩阵
U c t + 1 = U c t - 1 α u L u c ▿ u c J ,
其中,αu>1是常数,是目标函数J关于Uc的偏导数,是矩阵的转置,为第t次迭代的第c个模态的投影矩阵,是第t次迭代的第c个模态的辅助变量,利普席茨模量
S73,求解
W c t + 1 = W c t - 1 α w L w c ▿ w c J ,
其中,为第t+1次迭代的第c个模态的投影矩阵,αw是常数,取值范围是αw>1,目标函数J关于Wc的偏导数J和利普席茨模量计算如下:
▿ w c J = αX c ( W c t T X c - V c t ) T + βD c t W c t
L w c = αX c X c T + βD c t ,
其中,α,β为权重参数,Xc为第c个模态的特征向量,为对角矩阵其中为矩阵的第j行,||·||2为求取矩阵的2范数,为第t次迭代的第c个模态的投影矩阵。
S74,求解
V ~ c t + 1 = V c t - 1 α v L V c ▿ V c J
V c t + 1 = 0 i f V ~ c t + 1 < 0 V ~ c t + 1 o t h e r w i s e ,
其中,αv>1是常数,是Vc的利普席茨模量,J是目标函数相对于Vc的偏导数,是第t+1次迭代的第c个模态的中间变量,是第t+1次迭代的第c个模态的辅助变量。
S75,求解(V*)t+1
( V * ) &OverBar; t + 1 = ( V * ) t - 1 &alpha; v * L ( v * ) &dtri; v * J
( V * ) t + 1 = 0 i f ( V * ) &OverBar; t + 1 < 0 ( V * ) &OverBar; t + 1 o t h e n v i s e ,
其中,(V*)t+1是第t+1次迭代的公共语义标签,是常数,取值范围 是公共语义标签V*的利普席茨模量,J是目标函数J相对于公共语义标签V*的偏导数。
S76,转S72,直至t=N,N为迭代次数,N=30。
通过以上目标函数的求解得到公共语义标签后,根据所述公共语义标签,得到公共的聚类结果,即可完成多视角聚类。
为了验证本发明的实施效果,接下来以Pascal VOC2007数据库为例说明。该数据库包含9963个图像-文本对,共计20类,即对应20个语义标签。具体步骤如下:
S1,将训练集中多类别的图片以及没有标记词对应的图片去除,得到5649图像和标记词对。提取图片的GIST特征以及标记词的词频特征。
S2,给定参数α,β,γ,λc以及聚类数目m,(c=1,...,m)。
S3,初始化和迭代次数N=30。
S4,迭代执行步骤S72-S75,得出公共语义标签。
S5,根据公共语义标签完成多视角聚类。
以上所述的具体实施例,对本发明的目的、技术方案和效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于非负字典对学习的鲁棒多视角聚类方法,包括步骤:
S1,提取多模态数据库中的多模态特征;
S2,基于所述多模态数据库中的特征向量,通过字典学习得到语义投影矩阵和参数表示矩阵;
S3,向所述多模态数据库嵌入非负特征投影以处理噪声特征;
S4,根据所述参数表示矩阵,创建一致性约束,用于描述多视角下各个样本聚类标签与多视角所共享的公共标签之间的一致性;
S5,根据所述多模态数据库中各个模态的特征,创建局部几何保持约束,用于描述每个视角下样本间结构的相似性;
S6,根据所述语义投影矩阵、非负特征投影、一致性约束和局部几何保持约束,得到统一的目标函数;
S7,采用近端交替线性最小化算法求解优化所述目标函数,得到公共语义标签,根据所述公共语义标签,得到公共的聚类结果,完成多视角聚类。
2.根据权利要求1所述方法,其特征在于,所述字典学习的目标函数为:
min U , V | | X - U V | | F 2 + &Omega; { U , V } ,
其中,为d维的非负训练数据,n为样本数目,为语义投影矩阵,r为聚类标签个数,为参数表示矩阵,||·||F为求取F-范数操作,Ω{U,V}代表约束项。
3.根据权利要求2所述的方法,其特征在于,步骤S3中所述非负特征投影是非负线性投影V=WTX,W为线性投影矩阵,WT为矩阵W的转置。
4.根据权利要求3所述的方法,其特征在于,步骤S4中,所述一致性约束公式如下:
D ( W c T X c , V * ) = | | W c T X c - V * | | F 2 ,
其中,c为模态序号,Wc为第c个模态的特征投影矩阵,Wc T为矩阵Wc的转置,Xc为第c个模态的特征,V*为公共语义标签。
5.根据权利要求4所述方法,其特征在于,步骤S5中所述局部几何保持约束如下:
&Sigma; c = 1 m &Sigma; i , j = 1 n &lambda; c S c ( i , j ) ( V * ( : , i ) - V * ( : , j ) ) 2 = &Sigma; c = 1 m &lambda; c V * L c V * T ,
其中m是模态数目,i,j为样本序号,n为样本数目,λc为第c个模态的权重系数,V*(:,i)表示矩阵V*的第i列,V*T是矩阵V*的转置,Lc=Dc-Sc是亲和矩阵Sc的拉普拉斯矩阵,Dc为第c个模态的对角矩阵,Dc(i,i)=∑jSc(i,j),第c个模态的亲和矩阵Sc如下定义:
S c ( i , j ) = exp ( - || x i - x j || 2 &sigma; 2 ) x i &Element; N k ( x j ) o r x j &Element; N k ( x i ) 0 o t h e r w i s e ,
其中,Nk(x)为样本x的k近邻。
6.根据权利要求5所述方法,其特征在于,步骤S6中,所述统一的目标函数如下表示:
min U c , W c , V * &Sigma; c = 1 m || X c - U c W c T X c || F 2 + &alpha; || W c T X c - V * || F 2 + &beta; || W c || 2 , 1 + t r ( V * LV * T ) s . t . U c , W c T X c , V * &GreaterEqual; 0 , V * T V * = I , L = &Sigma; c = 1 m &lambda; c L c ,
其中,Uc为第c个模态的语义投影矩阵,Wc是第c个模态特征的线性投影矩阵,α,β为权重参数,α,β∈[10-4,104],Xc为第c个模态的特征,V*为公共语义标签,||·||2,1为求取矩阵的2,1范数操作,L是每个模态拉普拉斯矩阵的加权和,I为单位矩阵;
所述统一的目标函数放缩处理后如下:
min U c , V c , W c , V * J = &Sigma; c = 1 m || X c - U c V c || F 2 + &alpha; || W c T X c - V c || F 2 + &beta; || W c || 2 , 1 + &gamma; || V c - V * || F 2 + t r ( V * LV * T ) s . t . V c , V * &GreaterEqual; 0 , V * V * T = I , L = &Sigma; c = 1 m &lambda; c L c ; ,
其中,J为目标函数,Vc为第c个模态的辅助变量。
7.根据权利要求6所述方法,其特征在于,所述近端交替线性最小化算法采用如下求解:
S71,初始化c=1,...,m,和迭代次数N,上标0表示第0次迭代;
S72,求解第t+1次迭代第c个模态的投影矩阵
U c t + 1 = U c t - 1 &alpha; u L u c &dtri; u c J ,
其中,αu>1是常数,是目标函数J关于Uc的偏导数,是矩阵的转置,为第t次迭代的第c个模态的投影矩阵,是第t次迭代的第c个模态的辅助变量,利普席茨模量
S73,求解
W c t + 1 = W c t - 1 &alpha; w L w c &dtri; w c J ,
其中,为第t+1次迭代的第c个模态的投影矩阵,αw是常数,取值范围是αw>1,目标函数J关于Wc的偏导数和利普席茨模量计算如下:
&dtri; w c J = &alpha;X c ( W c t T X c - V c t ) T + &beta;D c t W c t L w c = &alpha;X c X c T + &beta;D c t ,
其中,α,β为权重参数,Xc为第c个模态的特征向量,为对角矩阵其中为矩阵的第j行,||·||2为求取矩阵的2范数,为第t次迭代的第c个模态的投影矩阵;
S74,求解
V ~ c t + 1 = V c t - 1 &alpha; v L V c &dtri; V c J V c t + 1 = 0 i f V ~ c t + 1 < 0 V ~ c t + 1 o t h e r w i s e ,
其中,αv>1是常数,是Vc的利普席茨模量,是目标函数相对于Vc的偏导数,是第t+1次迭代的第c个模态的中间变量,是第t+1次迭代的第c个模态的辅助变量;
S75,求解(V*)t+1
( V * ) &OverBar; t + 1 = ( V * ) t - 1 &alpha; v * L ( v * ) &dtri; v * J ( V * ) t + 1 = 0 i f ( V * ) &OverBar; t + 1 < 0 ( V * ) &OverBar; t + 1 o t h e r w i s e ,
其中,(V*)t+1是第t+1次迭代的公共语义标签,是常数,取值范围 是公共语义标签V*的利普席茨模量,是目标函数J相对于语义标签V*的偏导数。
S76,转S72,直至t=N,N为迭代次数,N=30。
CN201610270303.4A 2016-04-27 2016-04-27 一种基于非负字典对学习的鲁棒多视角聚类方法 Active CN106022351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610270303.4A CN106022351B (zh) 2016-04-27 2016-04-27 一种基于非负字典对学习的鲁棒多视角聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610270303.4A CN106022351B (zh) 2016-04-27 2016-04-27 一种基于非负字典对学习的鲁棒多视角聚类方法

Publications (2)

Publication Number Publication Date
CN106022351A true CN106022351A (zh) 2016-10-12
CN106022351B CN106022351B (zh) 2019-04-16

Family

ID=57081045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610270303.4A Active CN106022351B (zh) 2016-04-27 2016-04-27 一种基于非负字典对学习的鲁棒多视角聚类方法

Country Status (1)

Country Link
CN (1) CN106022351B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971197A (zh) * 2017-03-02 2017-07-21 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN110096596A (zh) * 2019-05-08 2019-08-06 广东工业大学 一种基于概念分解的多视图文本聚类方法、装置及设备
CN110148428A (zh) * 2019-05-27 2019-08-20 哈尔滨工业大学 一种基于子空间表示学习的声学事件识别方法
CN110533078A (zh) * 2019-08-02 2019-12-03 西安电子科技大学 基于字典对的多视角识别方法
CN110728327A (zh) * 2019-10-18 2020-01-24 中国科学技术大学 一种具有可解释性的直推学习方法及系统
CN110807462A (zh) * 2019-09-11 2020-02-18 浙江大学 一种针对语义分割模型的上下文不敏感的训练方法
CN111310807A (zh) * 2020-01-27 2020-06-19 哈尔滨理工大学 一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400143A (zh) * 2013-07-12 2013-11-20 中国科学院自动化研究所 一种基于多视角的数据子空间聚类方法
CN103617292A (zh) * 2013-12-16 2014-03-05 中国科学院自动化研究所 一种基于互正则化约束子空间表达的多视角数据聚类方法
CN104063684A (zh) * 2014-06-17 2014-09-24 南京信息工程大学 基于跨域字典学习的人体动作识别方法
CN104505100A (zh) * 2015-01-06 2015-04-08 中国人民解放军理工大学 一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法
CN105160357A (zh) * 2015-08-31 2015-12-16 中国科学院自动化研究所 基于全局一致性和局部拓扑的多模态数据子空间聚类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103400143A (zh) * 2013-07-12 2013-11-20 中国科学院自动化研究所 一种基于多视角的数据子空间聚类方法
CN103617292A (zh) * 2013-12-16 2014-03-05 中国科学院自动化研究所 一种基于互正则化约束子空间表达的多视角数据聚类方法
CN104063684A (zh) * 2014-06-17 2014-09-24 南京信息工程大学 基于跨域字典学习的人体动作识别方法
CN104505100A (zh) * 2015-01-06 2015-04-08 中国人民解放军理工大学 一种基于鲁棒非负矩阵分解和数据融合的无监督语音增强方法
CN105160357A (zh) * 2015-08-31 2015-12-16 中国科学院自动化研究所 基于全局一致性和局部拓扑的多模态数据子空间聚类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEI WANG ETC.: "Attribute Guided Dictionary Learning", 《ICMR‘15 PROCEEDINGS OF THE 5TH ACM ON INTERNATIONAL CONFERENCE ON MULTIMEDIA RETRIEVAL》 *
翟德明: "多视度量和回归学习方法及应用研究", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971197B (zh) * 2017-03-02 2019-12-13 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN106971197A (zh) * 2017-03-02 2017-07-21 北京工业大学 基于差异性与一致性约束的多视数据的子空间聚类方法
CN110096596A (zh) * 2019-05-08 2019-08-06 广东工业大学 一种基于概念分解的多视图文本聚类方法、装置及设备
CN110096596B (zh) * 2019-05-08 2023-05-05 广东工业大学 一种基于概念分解的多视图文本聚类方法、装置及设备
CN110148428B (zh) * 2019-05-27 2021-04-02 哈尔滨工业大学 一种基于子空间表示学习的声学事件识别方法
CN110148428A (zh) * 2019-05-27 2019-08-20 哈尔滨工业大学 一种基于子空间表示学习的声学事件识别方法
CN110533078A (zh) * 2019-08-02 2019-12-03 西安电子科技大学 基于字典对的多视角识别方法
CN110533078B (zh) * 2019-08-02 2022-03-22 西安电子科技大学 基于字典对的多视角识别方法
CN110807462A (zh) * 2019-09-11 2020-02-18 浙江大学 一种针对语义分割模型的上下文不敏感的训练方法
CN110807462B (zh) * 2019-09-11 2022-08-30 浙江大学 一种针对语义分割模型的上下文不敏感的训练方法
CN110728327B (zh) * 2019-10-18 2021-11-23 中国科学技术大学 一种具有可解释性的直推学习方法及系统
CN110728327A (zh) * 2019-10-18 2020-01-24 中国科学技术大学 一种具有可解释性的直推学习方法及系统
CN111310807A (zh) * 2020-01-27 2020-06-19 哈尔滨理工大学 一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法
CN111310807B (zh) * 2020-01-27 2022-08-19 哈尔滨理工大学 一种基于异质特征联合自表示的特征子空间与亲和矩阵联合学习方法

Also Published As

Publication number Publication date
CN106022351B (zh) 2019-04-16

Similar Documents

Publication Publication Date Title
CN106022351A (zh) 一种基于非负字典对学习的鲁棒多视角聚类方法
Xiao et al. Unsupervised point cloud representation learning with deep neural networks: A survey
Zhang et al. Constructing deep sparse coding network for image classification
CN111488726B (zh) 基于指针网络的非结构文本抽取多任务联合训练方法
CN108197294B (zh) 一种基于深度学习的文本自动生成方法
Zhu et al. TA-CNN: Two-way attention models in deep convolutional neural network for plant recognition
Zhao et al. Image parsing with stochastic scene grammar
CN110633683B (zh) 结合DenseNet和resBi-LSTM的中文句子级唇语识别方法
CN112256888A (zh) 地理知识获取方法
CN111291556B (zh) 基于实体义项的字和词特征融合的中文实体关系抽取方法
CN111782768B (zh) 基于双曲空间表示和标签文本互动的细粒度实体识别方法
CN111985520B (zh) 一种基于图卷积神经网络的多模态分类方法
CN102968635B (zh) 一种基于稀疏编码的图像视觉特征提取方法
CN114067385B (zh) 基于度量学习的跨模态人脸检索哈希方法
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
CN112966525B (zh) 一种基于预训练模型和卷积神经网络算法的法律领域事件抽取方法
Bae et al. Densely distilled flow-based knowledge transfer in teacher-student framework for image classification
CN112001437B (zh) 面向模态非完全对齐的数据聚类方法
CN110263855B (zh) 一种利用共基胶囊投影进行图像分类的方法
CN113052017B (zh) 一种基于多粒度特征表示和域自适应学习的无监督行人重识别方法
CN106503659A (zh) 基于稀疏编码张量分解的动作识别方法
Kihl et al. A unified framework for local visual descriptors evaluation
Sicre et al. Discriminative part model for visual recognition
CN106157254A (zh) 基于非局部自相似性的稀疏表示遥感图像去噪方法
Pei et al. Unsupervised multimodal feature learning for semantic image segmentation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 300457 unit 1001, block 1, msd-g1, TEDA, No.57, 2nd Street, Binhai New Area Economic and Technological Development Zone, Tianjin

Patentee after: Tianjin Zhongke intelligent identification Co.,Ltd.

Address before: Unit 300465 TEDA MSD-G1-1001, 57 Second Avenue, Tianjin Economic and Technological Development Zone, Binhai New Area, Tianjin

Patentee before: TIANJIN ZHONGKE INTELLIGENT IDENTIFICATION INDUSTRY TECHNOLOGY RESEARCH INSTITUTE Co.,Ltd.