CN113569973B - 多视图聚类方法、装置、电子设备及计算机可读存储介质 - Google Patents
多视图聚类方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113569973B CN113569973B CN202110890093.XA CN202110890093A CN113569973B CN 113569973 B CN113569973 B CN 113569973B CN 202110890093 A CN202110890093 A CN 202110890093A CN 113569973 B CN113569973 B CN 113569973B
- Authority
- CN
- China
- Prior art keywords
- matrix
- potential
- target image
- similarity
- indication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000011159 matrix material Substances 0.000 claims abstract description 436
- 238000013507 mapping Methods 0.000 claims abstract description 74
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000004891 communication Methods 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000004364 calculation method Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000004138 cluster model Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例涉及人工智能技术领域,公开了一种多视图聚类方法、装置、电子设备及计算机可读存储介质。该方法包括:生成目标图像在原始空间多个视图下对应的多视图特征矩阵;将多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;根据潜在映射矩阵确定潜在相似矩阵,潜在相似矩阵用于表征潜在空间中数据之间的相似性;根据潜在相似矩阵确定连续指示矩阵,连续指示矩阵为间接反映目标图像的聚类结构的矩阵;根据连续指示矩阵确定离散指示矩阵,离散相似矩阵为直接反映目标图像的聚类结构的矩阵;根据离散指示矩阵确定目标图像的聚类标签。通过上述方式,本发明实施例实提高了多视图聚类的准确度。
Description
技术领域
本发明实施例涉及人工智能技术领域,具体涉及一种多视图聚类方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人工智能技术的不断发展,聚类算法得到广泛应用。多视图聚类算法是对通过多视图特征描述的图像数据进行聚类的算法。
相关技术中,对多视图描述的图像数据进行聚类时,先根据图像数据的不同视图特征构造相似性矩阵,然后根据相似性矩阵构建谱矩阵,对谱矩阵进行特征分解后可以得到特征向量,根据特征向量可以完成聚类任务。然而,发明人在实现本发明实施例的过程中发现:相关技术进行聚类时,忽视了视图特征之间的互补特征,构造的相似性矩阵无法充分反映原始的图像信息,使得多视图聚类的准确度较低。
发明内容
鉴于上述问题,本发明实施例提供了一种多视图聚类方法、装置、电子设备及计算机可读存储介质,用于解决现有技术中存在的多视图聚类准确度较低的问题。
根据本发明实施例的一个方面,提供了一种多视图聚类方法,所述方法包括:
生成目标图像在原始空间多个视图下对应的多视图特征矩阵;
将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;
根据所述潜在映射矩阵确定潜在相似矩阵,其中,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性;
根据所述潜在相似矩阵确定连续指示矩阵,其中,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵;
根据所述连续指示矩阵确定离散指示矩阵,其中,所述离散相似矩阵为直接反映所述目标图像的聚类结构的矩阵;
根据所述离散指示矩阵确定所述目标图像的聚类标签。
在一种可选的方式中,所述生成目标图像在原始空间多个视图下对应的多视图特征矩阵包括:
获取目标图像在原始空间多个视图下对应的多个单视图特征矩阵;
对所述多个单视图特征矩阵进行特征维度相加,以构造多维度特征矩阵;
将所述多维度特征矩阵进行正则化处理,以生成所述目标图像在原始空间多个视图下对应的多视图特征矩阵。
在一种可选的方式中,所述将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵包括:
构造第一迭代表达式,其中,所述第一迭代表达式包含所述多视图特征矩阵、潜在映射矩阵以及所述多个视图下对应的重构模型矩阵;
使所述潜在映射矩阵保持不变,将所述第一迭代表达式迭代计算至收敛,以学习出所述重构模型矩阵;
根据学习出的重构模型矩阵,将所述第一迭代表达式迭代计算至收敛,以学习出所述潜在映射矩阵。
在一种可选的方式中,所述根据所述潜在映射矩阵确定潜在相似矩阵包括:
构造第二迭代表达式,其中,所述第二迭代表达式包含所述潜在映射矩阵以及潜在相似矩阵;
根据学习出的潜在映射矩阵,将所述第二迭代表达式迭代计算至收敛,以学习出所述潜在相似矩阵。
在一种可选的方式中,所述根据所述潜在相似矩阵确定连续指示矩阵包括:
根据学习出的潜在相似矩阵生成拉普拉斯矩阵;
构造第三迭代表达式,其中,所述第三迭代表达式包含连续指示矩阵以及所述拉普拉斯矩阵;
根据学习出的拉普拉斯矩阵,将所述第三迭代表达式迭代计算至收敛,以学习出所述连续指示矩阵。
在一种可选的方式中,所述根据所述连续指示矩阵确定离散指示矩阵包括:
构造第四迭代表达式,其中,所述第四迭代表达式包含转换矩阵、所述连续指示矩阵和离散指示矩阵;
使所述离散指示矩阵保持不变,根据学习出的连续指示矩阵将所述第四迭代表达式迭代计算至收敛,以学习出所述转换矩阵;
根据学习出的转换矩阵,将所述第四迭代表达式迭代计算至收敛,以学习出离散指示矩阵。
在一种可选的方式中,所述第四迭代表达式中包含约束条件,所述约束条件用于使学习出的离散指示矩阵中每一行只有一个元素为1,其余元素均为0。
根据本发明实施例的另一方面,提供了一种多视图聚类装置,所述装置包括:
第一生成模块,用于生成目标图像在原始空间多个视图下对应的多视图特征矩阵;
第二生成模块,用于将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;
第一确定模块,用于根据所述潜在映射矩阵确定潜在相似矩阵,其中,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性;
第二确定模块,用于根据所述潜在相似矩阵确定连续指示矩阵,其中,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵;
第三确定模块,用于根据所述连续指示矩阵确定离散指示矩阵,其中,所述离散相似矩阵为直接反映所述目标图像的聚类结构的矩阵;
第四确定模块,用于根据所述离散指示矩阵确定所述目标图像的聚类标签。
根据本发明实施例的另一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的多视图聚类方法的操作。
根据本发明实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行上述的多视图聚类方法的操作。
本发明实施例中,将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,可以生成潜在映射矩阵;根据潜在映射矩阵可以分别确定潜在相似矩阵、连续指示矩阵和离散指示矩阵,潜在相似矩阵用于表征潜在空间中数据之间的相似性,连续指示矩阵为间接反映目标图像的聚类结构的矩阵,离散相似矩阵为直接反映目标图像的聚类结构的矩阵;根据离散指示矩阵可以确定目标图像的聚类标签。可以看出,本发明实施例通过将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,根据离散指示矩阵可以直接确定目标图像的聚类标签,避免了通过谱矩阵进行聚类导致的聚类准确度较低的问题。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
附图仅用于示出实施方式,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的多视图聚类方法的流程示意图;
图2示出了本发明实施例提供的多视图聚类装置的结构示意图;
图3示出了本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。
图1示出了本发明实施例多视图聚类方法的流程图,该方法由电子设备执行。电子设备的存储器用于存放至少一可执行指令,该可执行指令使电子设备的处理器执行上述的多视图聚类方法的操作。
如图1所示,该方法包括以下步骤:
步骤110:生成目标图像在原始空间多个视图下对应的多视图特征矩阵。
其中,目标图像是用于聚类的图像,例如可以为人脸图像或其它图像。目标图像可以通过Gabor、LBP、Intensity、HOG和SIFT等图像特征进行描述,以分别生成目标图像在原始空间多个视图下对应的多个单视图特征矩阵。根据目标图像在原始空间多个视图下对应的多个单视图特征矩阵,可以生成目标图像在原始空间多个视图下对应的多视图特征矩阵。
在一种可选的方式中,在生成目标图像在原始空间多个视图下对应的多视图特征矩阵时,可以先获取目标图像在原始空间多个视图下对应的多个单视图特征矩阵,再对多个单视图特征矩阵进行特征维度相加,以构造多维度特征矩阵,最后将多维度特征矩阵进行正则化处理,以生成目标图像在原始空间多个视图下对应的多视图特征矩阵。进一步的,目标图像在原始空间V个视图下对应的多个单视图特征矩阵可以分别表示为X(1),X(2),...,X(V),目标图像在原始空间多个视图下对应的多视图特征矩阵可以表示为X。
步骤120:将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵。
其中,在原始空间中,目标图像在多个视图下对应的多个单视图特征矩阵对目标图像的特征表示较为单一,不同单视图特征矩阵之间的特征表示没有交叉,无法对多个单视图特征矩阵进行综合考虑,使得通过多个单视图特征矩阵对目标图像进行重构的图像与目标图像之间存在较大的偏差。通过将多视图特征矩阵映射至潜在空间中,生成潜在空间中对应的潜在映射矩阵,可以使得目标图像被较好的重构。
其中,目标图像的不同视图对应不同的重构模型。V个视图对应的重构模型例如可以分别表示为P(1),P(2),...,P(V),根据V个视图对应的重构模型可以构造出多个视图下对应的重构模型矩阵P。在生成潜在映射矩阵时,可以先构造第一迭代表达式,第一迭代表达式包含多视图特征矩阵、潜在映射矩阵以及多个视图下对应的重构模型矩阵;然后,在第一迭代表达式中,使潜在映射矩阵保持不变,将第一迭代表达式迭代计算至收敛,以学习出重构模型矩阵;最后,根据学习出的重构模型矩阵,将第一迭代表达式迭代计算至收敛,以学习出潜在映射矩阵。迭代计算过程中,可以通过random函数生成变量初始值,通过无监督的机器学习得出表达式收敛时对应的潜在映射矩阵。第一迭代表达式例如可以为如下表达式:
在第一迭代表达式中,X为多视图特征矩阵,X=[X(1);X(2);...;X(V)];P为重构模型矩阵,P=[P(1);P(2);...;P(V)];H为潜在映射矩阵,E矩阵为目标图像在潜在空间的表示误差,F为离散指示矩阵;λ为常量,表示矩阵X-PH-E的F范数的平方,||E||1表示矩阵E的1范数。
需要说明的是,通过第一迭代表达式可以得到目标图像在潜在空间的潜在映射矩阵H,潜在映射矩阵H即目标图像在潜在空间的表示。在潜在映射矩阵H中,每一列对应一张原始的人脸图像数据。在多视图图像聚类领域,通常根据目标图像在多个视图下对应的多个单视图特征矩阵构造相似矩阵,然后利用谱聚类方法对相似矩阵进行聚类得到聚类结果。在利用谱聚类时,会遇到NP-Hard问题,而且需要用到k-means方法,k-means方法对初始化中心比较敏感,会使得聚类结果出现偏差。本发明利用目标图像在潜在空间的潜在映射矩阵H,分别得到潜在相似矩阵、连续指示矩阵和离散指示矩阵,可以避免聚类结果出现偏差,提高聚类结果的准确度。
步骤130:根据所述潜在映射矩阵确定潜在相似矩阵,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性。
其中,通常通过欧几里得范数表示数据间的相似性,即通过如下的表达式进行表示:
其中,hi和hj表示潜在映射矩阵H中的不同列向量,si是一个列向量,“1”表示一个所有元素都为1的列向量,sij表示列向量si中的元素,β为权重系数,表示hi-hj的2范数的平方。上述表达式中,数据点之间的距离越小,则数据点有较大概率位于同一集群中。为了避免仅将距离最近的数据点概率分配为1,距离较远的数据点概率分配为0,即避免潜在相似矩阵S为单位矩阵,通常加入潜在相似矩阵S的约束,得到如下的表达式:
其中,表示潜在相似矩阵S的F范数的平方。在根据潜在映射矩阵确定潜在相似矩阵时,可以构造第二迭代表达式,第二迭代表达式包含潜在映射矩阵以及潜在相似矩阵,根据学习出的潜在映射矩阵,将第二迭代表达式迭代计算至收敛,以学习出潜在相似矩阵。迭代计算过程中,可以通过random函数生成变量初始值,通过无监督的机器学习得出表达式收敛时对应的潜在相似矩阵。为了增加迭代计算的鲁棒性,本发明实施例对上述表达式进行改进构造第二迭代表达式,将上述表达式中的2范数改为1范数来计算潜在相似矩阵,使得到的潜在相似矩阵表示更加稀疏,更加充分反映目标图像的图像信息,在计算过程中,仅考虑最接近hi的k个数据点,而无需考虑全部数据点,第二迭代表达式可以表示如下:
其中,||hi-hj||1表示hi-hj的1范数。
步骤140:根据所述潜在相似矩阵确定连续指示矩阵,其中,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵。
其中,在根据潜在相似矩阵确定连续指示矩阵时,可以先生成拉普拉斯矩阵,根据拉普拉斯矩阵确定连续指示矩阵。进一步的,可以根据学习出的潜在相似矩阵生成拉普拉斯矩阵,然后构造第三迭代表达式,第三迭代表达式包含连续指示矩阵以及拉普拉斯矩阵;最后根据学习出的拉普拉斯矩阵,将第三迭代表达式迭代计算至收敛,以学习出连续指示矩阵。迭代计算过程中,可以通过random函数生成变量初始值,通过无监督的机器学习得出表达式收敛时对应的连续指示矩阵。迭代计算过程可以为无监督的机器学习,第三迭代表达式例如可以通过下式进行表示:
上述表达式中,L表示拉普拉斯矩阵,U表示连续指示矩阵,UTU=I为连续指示矩阵的正交约束,L=(S+ST)/2。
步骤150:根据所述连续指示矩阵确定离散指示矩阵,其中,所述离散相似矩阵为直接反映所述目标图像的聚类结构的矩阵。
其中,在根据连续指示矩阵确定离散指示矩阵时,可以构造连续指示矩阵与离散指示矩阵之间的转换矩阵,该转换矩阵为连续指示矩阵和离散指示矩阵联系的桥梁。进一步的,可以先构造第四迭代表达式,第四迭代表达式包含转换矩阵、连续指示矩阵和离散指示矩阵;在迭代时,使离散指示矩阵保持不变,根据学习出的连续指示矩阵将第四迭代表达式迭代计算至收敛,以学习出转换矩阵;最后,根据学习出的转换矩阵,将第四迭代表达式迭代计算至收敛,以学习出离散指示矩阵。迭代计算过程可以通过random函数生成变量初始值,通过无监督的机器学习得出表达式收敛时对应的离散指示矩阵。第四迭代表达式例如可以通过下式进行表示:
F∈Idx为约束条件,用于使学习出的离散指示矩阵中每一行只有一个元素为1,其余元素均为0,Q是转换矩阵,是连续指示矩阵和离散指示矩阵联系的桥梁,表示矩阵F-UQ的F范数的平方。
步骤160:根据所述离散指示矩阵确定所述目标图像的聚类标签。
其中,学习出的离散指示矩阵F∈Rn×c,即离散指示矩阵为n行c列的矩阵,行数n可以表示目标图像总量,列数c可以表示类比数。由于学习出的离散指示矩阵中,每行只有一个元素为1,其余元素为0,因此每行中元素1所在的列数即可表示对应目标图像的类别。离散指示矩阵F例如为:
进一步的,根据本发明实施例中的多视图聚类方法可以生成多视图聚类模型,多视图聚类模型例如可以表示如下。
其中,X表示多视图特征矩阵,P表示重构模型矩阵,H表示潜在映射矩阵,E表示在潜在空间中重构数据的误差或噪声;S表示在潜在相似矩阵;U表示连续指示矩阵;L表示拉普拉斯矩阵,拉普拉斯矩阵可由潜在相似矩阵计算得到;F表示离散指示矩阵,通过离散指示矩阵可直接得到目标图像的聚类结构;λ、β、ε、γ和α分别表示对应项的权重系数。PPT=I、UTU=I和QTQ=I分别为重构模型矩阵P、连续指示矩阵U和转换矩阵Q的正交约束,可以防止出现平凡解;约束F∈Idx含义是矩阵F的每一行只有一个元素为1,其余元素均为0。
其中,多视图聚类模型的第一项表示在潜在空间中对目标图像进行重构,第二项λ||E||1表示对噪声或误差进行1范数约束,因为噪声或者误差不是很多,所以用1范数保证离散指示矩阵F的稀疏性;第三项/>表示目标图像在潜在空间中获取潜在相似性,用1范数可以保证与当前数据联系最近的是k个近邻,而不是所有数据,同时增强模型的鲁棒性;第四项/>表示对潜在相似矩阵进行约束,防止出现平凡解;第五项γTr(UTLU)表示在潜在空间中对连续指示矩阵进行学习,通过拉普拉斯矩阵建立连续指示矩阵与潜在相似矩阵之间的联系;第六项/>表示在潜在空间进行离散指示矩阵学习,通过转换矩阵建立离散指示矩阵与连续指示矩阵之间的联系,将模型迭代计算至收敛后,离散指示矩阵即对应目标图像的聚类结构。
本发明实施例中,将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,可以生成潜在映射矩阵;根据潜在映射矩阵可以分别确定潜在相似矩阵、连续指示矩阵和离散指示矩阵,潜在相似矩阵用于表征潜在空间中数据之间的相似性,连续指示矩阵为间接反映目标图像的聚类结构的矩阵,离散相似矩阵为直接反映目标图像的聚类结构的矩阵;根据离散指示矩阵可以确定目标图像的聚类标签。可以看出,本发明实施例通过将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,根据离散指示矩阵可以直接确定目标图像的聚类标签,避免了通过谱矩阵进行聚类导致的聚类准确度较低的问题。
图2示出了本发明实施例多视图聚类装置的结构示意图。如图2所示,该装置300包括:第一生成模块310、第二生成模块320、第一确定模块330、第二确定模块340、第三确定模块350和第四确定模块360。
其中,第一生成模块310用于生成目标图像在原始空间多个视图下对应的多视图特征矩阵;第二生成模块320用于将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;第一确定模块330用于根据所述潜在映射矩阵确定潜在相似矩阵,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性;第二确定模块340用于根据所述潜在相似矩阵确定连续指示矩阵,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵;第三确定模块350用于根据所述连续指示矩阵确定离散指示矩阵,所述离散相似矩阵为直接反映所述目标图像的聚类结构的矩阵;第四确定模块360用于根据所述离散指示矩阵确定所述目标图像的聚类标签。
在一种可选的方式中,第一生成模块310用于:
获取目标图像在原始空间多个视图下对应的多个单视图特征矩阵;
对所述多个单视图特征矩阵进行特征维度相加,以构造多维度特征矩阵;
将所述多维度特征矩阵进行正则化处理,以生成所述目标图像在原始空间多个视图下对应的多视图特征矩阵。
在一种可选的方式中,第二生成模块320用于:
构造第一迭代表达式,其中,所述第一迭代表达式包含所述多视图特征矩阵、潜在映射矩阵以及所述多个视图下对应的重构模型矩阵;
使所述潜在映射矩阵保持不变,将所述第一迭代表达式迭代计算至收敛,以学习出所述重构模型矩阵;
根据学习出的重构模型矩阵,将所述第一迭代表达式迭代计算至收敛,以学习出所述潜在映射矩阵。
在一种可选的方式中,第一确定模块330用于:
构造第二迭代表达式,其中,所述第二迭代表达式包含所述潜在映射矩阵以及潜在相似矩阵;
根据学习出的潜在映射矩阵,将所述第二迭代表达式迭代计算至收敛,以学习出所述潜在相似矩阵。
在一种可选的方式中,第二确定模块340用于:
根据学习出的潜在相似矩阵生成拉普拉斯矩阵;
构造第三迭代表达式,其中,所述第三迭代表达式包含连续指示矩阵以及所述拉普拉斯矩阵;
根据学习出的拉普拉斯矩阵,将所述第三迭代表达式迭代计算至收敛,以学习出所述连续指示矩阵。
在一种可选的方式中,第三确定模块350用于:
构造第四迭代表达式,其中,所述第四迭代表达式包含转换矩阵、所述连续指示矩阵和离散指示矩阵;
使所述离散指示矩阵保持不变,根据学习出的连续指示矩阵将所述第四迭代表达式迭代计算至收敛,以学习出所述转换矩阵;
根据学习出的转换矩阵,将所述第四迭代表达式迭代计算至收敛,以学习出离散指示矩阵。
在一种可选的方式中,第四迭代表达式中包含约束条件,所述约束条件用于使学习出的离散指示矩阵中每一行只有一个元素为1,其余元素均为0。
本发明实施例中,将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,可以生成潜在映射矩阵;根据潜在映射矩阵可以分别确定潜在相似矩阵、连续指示矩阵和离散指示矩阵,潜在相似矩阵用于表征潜在空间中数据之间的相似性,连续指示矩阵为间接反映目标图像的聚类结构的矩阵,离散相似矩阵为直接反映目标图像的聚类结构的矩阵;根据离散指示矩阵可以确定目标图像的聚类标签。可以看出,本发明实施例通过将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,根据离散指示矩阵可以直接确定目标图像的聚类标签,避免了通过谱矩阵进行聚类导致的聚类准确度较低的问题。
图3示出了本发明实施例电子设备结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图3所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。处理器402,用于执行程序410,具体可以执行上述用于多视图聚类方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机可执行指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以被处理器402调用使电子设备执行以下操作:
生成目标图像在原始空间多个视图下对应的多视图特征矩阵;
将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;
根据所述潜在映射矩阵确定潜在相似矩阵,其中,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性;
根据所述潜在相似矩阵确定连续指示矩阵,其中,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵;
根据所述连续指示矩阵确定离散指示矩阵,其中,所述离散相似矩阵为直接反映所述目标图像的聚类结构的矩阵;
根据所述离散指示矩阵确定所述目标图像的聚类标签。
在一种可选的方式中,所述程序410被处理器402调用使电子设备执行以下操作:
获取目标图像在原始空间多个视图下对应的多个单视图特征矩阵;
对所述多个单视图特征矩阵进行特征维度相加,以构造多维度特征矩阵;
将所述多维度特征矩阵进行正则化处理,以生成所述目标图像在原始空间多个视图下对应的多视图特征矩阵。
在一种可选的方式中,所述程序410被处理器402调用使电子设备执行以下操作:
构造第一迭代表达式,其中,所述第一迭代表达式包含所述多视图特征矩阵、潜在映射矩阵以及所述多个视图下对应的重构模型矩阵;
使所述潜在映射矩阵保持不变,将所述第一迭代表达式迭代计算至收敛,以学习出所述重构模型矩阵;
根据学习出的重构模型矩阵,将所述第一迭代表达式迭代计算至收敛,以学习出所述潜在映射矩阵。
在一种可选的方式中,所述程序410被处理器402调用使电子设备执行以下操作:
构造第二迭代表达式,其中,所述第二迭代表达式包含所述潜在映射矩阵以及潜在相似矩阵;
根据学习出的潜在映射矩阵,将所述第二迭代表达式迭代计算至收敛,以学习出所述潜在相似矩阵。
在一种可选的方式中,所述程序410被处理器402调用使电子设备执行以下操作:
根据学习出的潜在相似矩阵生成拉普拉斯矩阵;
构造第三迭代表达式,其中,所述第三迭代表达式包含连续指示矩阵以及所述拉普拉斯矩阵;
根据学习出的拉普拉斯矩阵,将所述第三迭代表达式迭代计算至收敛,以学习出所述连续指示矩阵。
在一种可选的方式中,所述程序410被处理器402调用使电子设备执行以下操作:
构造第四迭代表达式,其中,所述第四迭代表达式包含转换矩阵、所述连续指示矩阵和离散指示矩阵;
使所述离散指示矩阵保持不变,根据学习出的连续指示矩阵将所述第四迭代表达式迭代计算至收敛,以学习出所述转换矩阵;
根据学习出的转换矩阵,将所述第四迭代表达式迭代计算至收敛,以学习出离散指示矩阵。
在一种可选的方式中,所述第四迭代表达式中包含约束条件,所述约束条件用于使学习出的离散指示矩阵中每一行只有一个元素为1,其余元素均为0。
本发明实施例中,将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,可以生成潜在映射矩阵;根据潜在映射矩阵可以分别确定潜在相似矩阵、连续指示矩阵和离散指示矩阵,潜在相似矩阵用于表征潜在空间中数据之间的相似性,连续指示矩阵为间接反映目标图像的聚类结构的矩阵,离散相似矩阵为直接反映目标图像的聚类结构的矩阵;根据离散指示矩阵可以确定目标图像的聚类标签。可以看出,本发明实施例通过将目标图像在原始空间多个视图下对应的多视图特征矩阵映射至潜在空间中,根据离散指示矩阵可以直接确定目标图像的聚类标签,避免了通过谱矩阵进行聚类导致的聚类准确度较低的问题。
本发明实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一可执行指令,该可执行指令在电子设备上运行时,使得所述电子设备执行上述任意方法实施例中的多视图聚类方法。
本发明实施例提供一种多视图聚类装置,用于执行上述多视图聚类方法。
本发明实施例提供了一种计算机程序,所述计算机程序可被处理器调用使电子设备执行上述任意方法实施例中的多视图聚类方法。
本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令在计算机上运行时,使得所述计算机执行上述任意方法实施例中的多视图聚类方法。
在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。
本领域技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
Claims (9)
1.一种多视图聚类方法,其特征在于,所述方法包括:
生成目标图像在原始空间多个视图下对应的多视图特征矩阵;
将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;
根据所述潜在映射矩阵确定潜在相似矩阵,包括:构造第二迭代表达式,其中,所述第二迭代表达式包含所述潜在映射矩阵以及潜在相似矩阵;根据学习出的潜在映射矩阵,将所述第二迭代表达式迭代计算至收敛,以学习出所述潜在相似矩阵;其中,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性;所述第二迭代表达式表示如下:
其中,hi和hj表示潜在映射矩阵中的不同列向量,si是一个列向量,sij表示列向量si中的元素,β为权重系数,表示潜在相似矩阵S的F范数的平方,||hi-hj||1表示hi-hj的1范数;
根据所述潜在相似矩阵确定连续指示矩阵,其中,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵;
根据所述连续指示矩阵确定离散指示矩阵,其中,所述离散指示矩阵为直接反映所述目标图像的聚类结构的矩阵;
根据所述离散指示矩阵直接确定所述目标图像的聚类标签。
2.根据权利要求1所述的方法,其特征在于,所述生成目标图像在原始空间多个视图下对应的多视图特征矩阵包括:
获取目标图像在原始空间多个视图下对应的多个单视图特征矩阵;
对所述多个单视图特征矩阵进行特征维度相加,以构造多维度特征矩阵;
将所述多维度特征矩阵进行正则化处理,以生成所述目标图像在原始空间多个视图下对应的多视图特征矩阵。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵包括:
构造第一迭代表达式,其中,所述第一迭代表达式包含所述多视图特征矩阵、潜在映射矩阵以及所述多个视图下对应的重构模型矩阵;
使所述潜在映射矩阵保持不变,将所述第一迭代表达式迭代计算至收敛,以学习出所述重构模型矩阵;
根据学习出的重构模型矩阵,将所述第一迭代表达式迭代计算至收敛,以学习出所述潜在映射矩阵。
4.根据权利要求1所述的方法,其特征在于,所述根据所述潜在相似矩阵确定连续指示矩阵包括:
根据学习出的潜在相似矩阵生成拉普拉斯矩阵;
构造第三迭代表达式,其中,所述第三迭代表达式包含连续指示矩阵以及所述拉普拉斯矩阵;
根据学习出的拉普拉斯矩阵,将所述第三迭代表达式迭代计算至收敛,以学习出所述连续指示矩阵。
5.根据权利要求4所述的方法,其特征在于,所述根据所述连续指示矩阵确定离散指示矩阵包括:
构造第四迭代表达式,其中,所述第四迭代表达式包含转换矩阵、所述连续指示矩阵和离散指示矩阵;
使所述离散指示矩阵保持不变,根据学习出的连续指示矩阵将所述第四迭代表达式迭代计算至收敛,以学习出所述转换矩阵;
根据学习出的转换矩阵,将所述第四迭代表达式迭代计算至收敛,以学习出离散指示矩阵。
6.根据权利要求5所述的方法,其特征在于,所述第四迭代表达式中包含约束条件,所述约束条件用于使学习出的离散指示矩阵中每一行只有一个元素为1,其余元素均为0。
7.一种多视图聚类装置,其特征在于,所述装置包括:
第一生成模块,用于生成目标图像在原始空间多个视图下对应的多视图特征矩阵;
第二生成模块,用于将所述多视图特征矩阵映射至潜在空间中,以生成潜在映射矩阵;
第一确定模块,用于根据所述潜在映射矩阵确定潜在相似矩阵,包括:构造第二迭代表达式,其中,所述第二迭代表达式包含所述潜在映射矩阵以及潜在相似矩阵;根据学习出的潜在映射矩阵,将所述第二迭代表达式迭代计算至收敛,以学习出所述潜在相似矩阵;其中,所述潜在相似矩阵用于表征所述潜在空间中数据之间的相似性;所述第二迭代表达式表示如下:
其中,hi和hj表示潜在映射矩阵中的不同列向量,si是一个列向量,sij表示列向量si中的元素,β为权重系数,表示潜在相似矩阵S的F范数的平方,||hi-hj||1表示hi-hj的1范数;
第二确定模块,用于根据所述潜在相似矩阵确定连续指示矩阵,其中,所述连续指示矩阵为间接反映所述目标图像的聚类结构的矩阵;
第三确定模块,用于根据所述连续指示矩阵确定离散指示矩阵,其中,所述离散指示矩阵为直接反映所述目标图像的聚类结构的矩阵;
第四确定模块,用于根据所述离散指示矩阵直接确定所述目标图像的聚类标签。
8.一种电子设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-6任意一项所述的多视图聚类方法的操作。
9.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行如权利要求1-6任意一项所述的多视图聚类方法的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110890093.XA CN113569973B (zh) | 2021-08-04 | 2021-08-04 | 多视图聚类方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110890093.XA CN113569973B (zh) | 2021-08-04 | 2021-08-04 | 多视图聚类方法、装置、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113569973A CN113569973A (zh) | 2021-10-29 |
CN113569973B true CN113569973B (zh) | 2024-04-19 |
Family
ID=78170317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110890093.XA Active CN113569973B (zh) | 2021-08-04 | 2021-08-04 | 多视图聚类方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569973B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002854A (zh) * | 2018-07-20 | 2018-12-14 | 西安电子科技大学 | 基于隐表示和自适应的多视图子空间聚类方法 |
CN110175631A (zh) * | 2019-04-28 | 2019-08-27 | 南京邮电大学 | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10885379B2 (en) * | 2018-09-04 | 2021-01-05 | Inception Institute of Artificial Intelligence, Ltd. | Multi-view image clustering techniques using binary compression |
-
2021
- 2021-08-04 CN CN202110890093.XA patent/CN113569973B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002854A (zh) * | 2018-07-20 | 2018-12-14 | 西安电子科技大学 | 基于隐表示和自适应的多视图子空间聚类方法 |
CN110175631A (zh) * | 2019-04-28 | 2019-08-27 | 南京邮电大学 | 一种基于共同学习子空间结构和聚类指示矩阵的多视图聚类方法 |
Non-Patent Citations (2)
Title |
---|
基于子空间学习的多视图聚类算法研究;卢志强;《中国优秀硕士学位论文全文数据库 信息科技辑》;正文第36-40页 * |
基于离散指示矩阵优化的多视图子空间聚类算法;卢志强;莫晓晖;吴松松;;金陵科技学院学报(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113569973A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11875268B2 (en) | Object recognition with reduced neural network weight precision | |
CN107292352B (zh) | 基于卷积神经网络的图像分类方法和装置 | |
US10885379B2 (en) | Multi-view image clustering techniques using binary compression | |
CN108764195B (zh) | 手写模型训练方法、手写字识别方法、装置、设备及介质 | |
US20190340533A1 (en) | Systems and methods for preparing data for use by machine learning algorithms | |
WO2022105108A1 (zh) | 一种网络数据分类方法、装置、设备及可读存储介质 | |
CN111898703B (zh) | 多标签视频分类方法、模型训练方法、装置及介质 | |
CN110659667A (zh) | 图片分类模型训练方法、系统和计算机设备 | |
CN108121962B (zh) | 基于非负自适应特征提取的人脸识别方法、装置及设备 | |
CN115841596B (zh) | 多标签图像分类方法及其模型的训练方法、装置 | |
CN113326851A (zh) | 图像特征提取方法、装置、电子设备及存储介质 | |
US20230185998A1 (en) | System and method for ai-assisted system design | |
CN118451423A (zh) | 最优知识蒸馏方案 | |
CN115080749A (zh) | 一种基于自监督训练的弱监督文本分类方法、系统和装置 | |
JP7150651B2 (ja) | ニューラルネットワークのモデル縮約装置 | |
CN116882469B (zh) | 用于情感识别的脉冲神经网络部署方法、装置及设备 | |
CN113569973B (zh) | 多视图聚类方法、装置、电子设备及计算机可读存储介质 | |
CN109614581B (zh) | 基于对偶局部学习的非负矩阵分解聚类方法 | |
CN112926658B (zh) | 基于二维数据嵌入与邻接拓扑图的图像聚类方法及设备 | |
CN113505838A (zh) | 一种图像聚类方法、装置、电子设备及存储介质 | |
CN111860818B (zh) | 基于智能芯片的som神经网络算法处理方法 | |
CN111507387A (zh) | 基于半监督学习的成对向量投影数据分类方法及系统 | |
Snášel et al. | Bars problem solving-new neural network method and comparison | |
CN113159328B (zh) | 基于自适应图结构约束子空间学习的特征选择方法及设备 | |
CN113673591B (zh) | 一种自调整采样优化的图像分类方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |