CN115063621B - 多视图聚类方法、装置、计算机设备及存储介质 - Google Patents
多视图聚类方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN115063621B CN115063621B CN202210657934.7A CN202210657934A CN115063621B CN 115063621 B CN115063621 B CN 115063621B CN 202210657934 A CN202210657934 A CN 202210657934A CN 115063621 B CN115063621 B CN 115063621B
- Authority
- CN
- China
- Prior art keywords
- information
- clustering
- view data
- data
- view
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000003860 storage Methods 0.000 title claims description 15
- 238000013507 mapping Methods 0.000 claims abstract description 109
- 238000009826 distribution Methods 0.000 claims abstract description 79
- 238000000605 extraction Methods 0.000 claims abstract description 44
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 22
- 238000004590 computer program Methods 0.000 claims description 18
- 238000005457 optimization Methods 0.000 claims description 12
- 125000004122 cyclic group Chemical group 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种多视图聚类方法,应用于图像处理技术领域,用于提高多视图聚类的聚类效果。本申请提供的方法包括:获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种多视图聚类方法、装置、计算机设备及存储介质。
背景技术
实际应用中,由于设备或者环境等因素影响,数据丢失造成数据不完备的现象时常发生。通过从不同来源、不同方位收集数据形成多视图数据,通过多视图数据进行聚类,以此从多个角度获取对同一物体的表示。
为了更深层次地探索同一物体的全面信息,挖掘视图与视图之间的互补性与一致性关系,现有方法通过多视图聚类方法,获得多视图之间的关联信息。
但是,传统的多视图聚类方法在基于数据集是完整的前提下进行多视图聚类,无法直接处理缺失信息,无法根据缺失信息获取关联信息,因此聚类效果不够理想,降低了多视图聚类的准确性。
发明内容
本申请提供一种多视图聚类方法、装置、计算机设备及存储介质,以提高多视图聚类的聚类效果。
一种多视图聚类方法,包括:
获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;
通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;
根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;
基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。
一种多视图聚类装置,包括:
映射信息提取模块,用于获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息;
描述信息获取模块,用于通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;
聚类模块,用于根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;
优化模块,用于基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述多视图聚类方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述多视图聚类方法的步骤。
本申请提供的多视图聚类方法、装置、计算机设备及存储介质,获取目标多视图数据,将多视图数据输入到预设的映射关系提取网络中,得到目标多视图数据的非线性映射信息,通过张量分解方式,对非线性映射信息进行分解,得到多视图数据的共享描述信息;对共享描述信息进行聚类,得到初始聚类结果;对初始聚类结果计算聚类结果分布信息,并根据聚类结果分布信息对初始聚类结果进行优化,非线性映射信息能够提取出多视图数据的映射关系,能够表示多视图数据中的缺失信息,根据张量分解,得到各个视图数据之间的高阶信息,对共享描述信息进行聚类,得到初始聚类结果,根据初始聚类结果计算聚类结果分布信息,根据聚类结果分布信息优化初始聚类结果,得到目标聚类结果,提取多视图数据之间的映射关系,并根据非线性映射信息提取多视图数据的缺失信息,针对不完备的多视图数据能够提高多视图聚类的聚类效果。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例中多视图聚类方法的一应用环境示意图;
图2是本申请一实施例中多视图聚类方法的一流程图;
图3是本申请一实施例中多视图聚类装置的结构示意图;
图4是本申请一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供的多视图聚类方法,可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。其中,计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
系统框架100可以包括终端设备、网络和服务器。网络用以在终端设备和服务器之间提供通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备通过网络与服务器交互,以接收或者发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture EpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureEperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的多视图聚类方法由服务器执行,相应地,多视图聚类装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的,根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备具体可以对应的是实际生产中的应用系统。
在一实施例中,如图2所示,提供一种多视图聚类方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10,获取目标多视图数据,将目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息。
具体的,多视图数据是指通过多组特征对具体事物进行描述的数据,每一组特征称为一个视图。目标多视图数据指的是用于进行聚类的数据,有多组特征视图构成。
目标多视图数据属于不完备的多视图数据,不完备指的是每个视图数据中存在缺失特征。
需要说明的是,本实施例针对不完备的多视图数据进行聚类,在对目标多视图数据的处理过程中,能够提取出目标多视图数据中的缺失信息。
具体步骤是:获取目标多视图数据,将目标多视图数据输入到预设的映射关系提取网络中,通过预设的映射关系提取网络的生成器,提取出目标多视图数据的非线性映射信息。
目标多视图数据中包括多个视图数据,预设的映射关系提取网络需要针对每个视图数据,进行特征提取,得到非线性映射信息。
非线性映射信息表示了同一数据点在各个视图数据之间的对应关系。
预设的映射关系提取网络能够针对各个视图数据之间的映射关系,生成目标多视图数据的缺失信息,并且能够保留各个视图数据之间的多样性。
S20,通过预设的张量分解方式,基于非线性映射信息,生成目标多视图数据的共享描述信息。
具体的,预设的张量分解方式为基于加权张量奇异值分解。对非线性映射信息进行张量分解,生成目标多视图数据的共享描述信息。
共享描述信息能够统一表述目标多视图数据中各个数据对象的表达。
各个视图数据输入到预设的映射关系提取网络中得到的特征数据,根据特征数据提取出非线性映射信息。再根据特征数据构建张量,张量可根据如下公式表达:
Z′∈RN*V*N
其中,Z′表示张量,R表示特征数据,N表示样本个数,V表示视图个数。
通过预设的张量分解方式,对构建的张量进行分解,生成共享描述信息,共享描述信息可根据如下公式表示:
C′∈RN*V*N
其中,C′表示目标多视图数据的共享描述信息。
通过张量分解,提取隐藏在目标多视图数据中的互补信息和高阶信息,作为共享描述信息。
S30,根据预设聚类方法,对共享描述信息进行聚类,得到初始聚类结果。
具体是,获取聚类时的类别数信息,通过预设的聚类方法对共享描述信息和类别数信息进行聚类,得到初始聚类结果。
初始聚类结果指的是根据类别数信息进行聚类之后的聚类簇。在聚类过程中,按照相似度规则划分聚类簇,得到初始聚类结果。
S40,基于初始聚类结果计算聚类结果分布信息,并通过聚类结果分布信息,对初始聚类结果进行优化,得到目标聚类结果。
具体的,根据聚类得到的初始聚类结果,计算聚类结果分布信息,根据聚类结果分布信息对初始聚类结果进行优化,得到目标聚类结果。
聚类结果分布信息用于表示初始聚类结果的分布情况,具体是计算初始聚类结果的正态分布情况。
在本实施例中,采用t分布方式计算得到初始聚类结果的聚类结果分布信息,t分布又称student’s distribution,用于根据小样本来估计呈正态分布且方差未知的总体的均值。
根据聚类结果分布信息对初始聚类结果进行优化的步骤是:根据聚类结果分布信息,构建深度对抗约束,利用反向传播交替策略优化预设的映射关系提取网络的参数,以优化初始聚类结果的分布情况,得到目标聚类结果。
本申请实施例提供的多视图聚类方法,通过获取不完备的目标多视图数据,将多视图数据输入到预设的映射关系提取网络中,得到目标多视图数据的非线性映射信息,通过张量分解方式,对非线性映射信息进行分解,得到多视图数据的共享描述信息。对共享描述信息进行聚类,得到初始聚类结果。对初始聚类结果计算聚类结果分布信息,并根据聚类结果分布信息对初始聚类结果进行优化,非线性映射信息能够提取出多视图数据的映射关系,能够表示多视图数据中的缺失信息,根据张量分解,得到各个视图数据之间的高阶信息,对共享描述信息进行聚类,得到初始聚类结果,根据初始聚类结果计算聚类结果分布信息,根据聚类结果分布信息优化初始聚类结果,得到目标聚类结果,提取多视图数据之间的映射关系,并根据非线性映射信息提取多视图数据的缺失信息,针对不完备的多视图数据能够提高多视图聚类的聚类效果。
作为一种可选的实施方式,S10,获取目标多视图数据,将目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息包括:
S101,通过自编码网络和循环一致网络构建预设的映射关系提取网络。
S102,通过预设的映射关系提取网络的编码器提取目标多视图数据中每个视图数据的特征数据。
S103,根据循环一致网络对每个视图数据的特征数据进行映射关系提取,得到非线性映射信息。
具体的,通过自编码网络和循环一致网络构建预设的映射关系提取网络。目标多视图数据中每个视图数据对应一个编码器,根据编码器提取出每个视图数据的特征矩阵,作为每个视图数据的特征数据。各个视图数据的特征矩阵经过生成器,得到生成数据,循环一致网络根据生成数据学习各个视图数据之间的映射关系,得到非线性映射信息。
在本实施例中,通过自编码网络和循环一致网络构建预设的映射关系提取网络,能够提取出目标多视图数据之间的映射关系,得到非线性映射信息,对于不完备的目标多视图数据,在视图数据存在缺失信息,根据非线性映射信息能够得出各个视图数据之间的互补信息和对应关系,进而对不完备的目标多视图数据进行处理,提高针对目标多视图数据进行聚类的聚类效果。
作为一种可选的实施方式,在S102之后,还包括:
S121,通过预设的映射关系提取网络的生成器,基于特征数据,得到每个视图数据的生成数据。
S122,通过判别器判断每个视图数据和生成数据的缺失信息。
S123,根据缺失信息,调整生成器的参数。
具体的,将特征数据通过预设的映射关系提取网络的生成器,得到生成数据,判别器和生成器根据生成数据和视图数据进行对抗,能够得到视图数据中的缺失信息,缺失信息用于调整生成器的参数。
在本实施例中,通过生成器和判别器进行对抗,得到各个视图数据的缺失信息,进一步提高对视图数据的特征表述,在数据缺失的情况下提高后续进行聚类时的稳健性。
作为一种可选的实施方式,S20,通过预设的张量分解方式,基于非线性映射信息,生成目标多视图数据的共享描述信息包括:
S201,获取非线性映射信息中每个视图数据的特征数据。
S202,将所有视图数据的特征数据构建得到张量信息。
S203,通过T-SVD对张量信息进行分解,得到共享描述信息。
具体的,通过各个视图数据的特征数据构建张量信息,根据张量信息构建各个视图数据的空间映射关系。
目标多视图数据是从不同角度对同一事物的多样化描述,每个视图数据分别从不同角度描述事物的不同方面,但是所有视图数据都具有相同的底层结构,为了得到数据对象完整统一的表述,通过T-SVD对张量进行分解,得到对各个视图数据更为稳健的共享描述信息。
T-SVD(Tensor Singular Value Decomposition)指的是张量奇异值分解框架,通过T-SVD对张量信息进行分解,得到共享描述信息,共享描述信息具体是根据张量信息分解之后得到的描述矩阵,用于对各个视图数据的描述信息进行统一表达。
在本实施例中,通过各个视图数据的特征数据构建张量信息,并对张量信息进行张量分解,得到共享描述信息,能够统一表达各个视图数据的描述特征,并且能够保留各个视图数据的特征多样性。
作为一种可选的实施方式,S203之后,还包括:
S231,通过低秩张量约束方法提取共享描述信息中的高阶结构信息。
具体的,在对张量信息进行张量分解之后,T-SVD分解得到的张量核,用于在低秩张量约束时提取出共享描述信息中的高阶结构信息,能够表达出目标多视图数据的空间映射关系。
作为一种可选的实施方式,S30,根据预设聚类方法,对共享描述信息进行聚类,得到初始聚类结果包括:
S301,获取共享描述信息中的聚类类别数。
S302,通过K-means算法,基于聚类类别数,对共享描述信息进行聚类,得到初始聚类结果。
具体的,预先设置共享描述信息的聚类类别数k,根据K-means算法基于聚类类别数对共享描述信息进行聚类,按照样本之间的相似度,得到k个聚类簇,同个聚类簇之间的数据相似度较大,不同聚类簇之间的数据相似度较小,将k个聚类簇作为初始聚类结果。
作为可选实施方式,可采用谱聚类方法对共享描述信息进行聚类。
在本实施例中,通过对共享描述信息进行聚类,以将共享聚类信息按照相似度规则划分成k个聚类簇,以达到对目标多视图数据进行聚类的目的。
作为一种可选的实施方式,S40,基于初始聚类结果计算聚类结果分布信息,并通过聚类结果分布信息,对初始聚类结果进行优化,得到目标聚类结果包括:
S401,根据初始聚类结果计算实际分布信息和目标分布信息,并将实际分布信息和目标分布信息作为聚类结果分布信息。
S402,根据反向传播策略,通过聚类结果分布信息,对预设的映射关系提取网络进行反向传播,得到参数优化信息。
S403,通过参数优化信息,调整实际分布信息,以得到目标聚类结果。
具体的,基于初始聚类结果,通过学生分布计算实际分布信息,在根据平方频率归一化函数,通过实际分布信息计算得到目标分布信息。
将实际分布信息和目标分布信息作为聚类结果分布信息。
通过聚类结果分布信息,借助反向传播交替策略优化预设的映射关系提取网络的参数,从而从实际分布信息更加接近目标分布信息,最终得到相较于初始聚类结果更为准确的目标聚类结果。
实际分布信息根据如下公式表示:
目标分布信息根据公式表示:
其中,zi表示聚类后的聚类簇样本点,μj表示类中心,α是学生分布的自由度,fj=∑iqij表示软聚类频率。
作为可选的实施方式,构建深度对抗K-means约束结构,根据深度对抗K-means约束结构以及反向传播策略优化预设的映射关系提取网络的参数,提高目标聚类结果的准确性。
深度对抗K-means约束结构包括K-means聚类、计算实际分布信息和目标分布信息、目标分布信息与实际分布信息对抗损失的判别过程。
在本实施例中,通过计算聚类结果分布信息,从而对预设的映射关系提取网络进行参数优化,提高聚类的准确性,同时,能够针对不完备的目标多视图数据进行聚类,在存在缺失信息的前提下,提高聚类的稳健性,提高了目标多视图聚类的性能。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
在一实施例中,提供一种多视图聚类装置,该多视图聚类装置与上述实施例中多视图聚类方法一一对应。如图3所示,该多视图聚类装置包括映射信息提取模块31、描述信息获取模块32、聚类模块33和优化模块34。
映射信息提取模块31,用于获取目标多视图数据,将目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息。
描述信息获取模块32,用于通过预设的张量分解方式,基于非线性映射信息,生成目标多视图数据的共享描述信息。
聚类模块33,用于根据预设聚类方法,对共享描述信息进行聚类,得到初始聚类结果。
优化模块34,用于基于初始聚类结果计算聚类结果分布信息,并通过聚类结果分布信息,对初始聚类结果进行优化,得到目标聚类结果。
作为一种可选的实施方式,映射信息提取模块31包括:
网络构建单元,用于通过自编码网络和循环一致网络构建预设的映射关系提取网络。
特征提取单元,用于通过预设的映射关系提取网络的编码器提取目标多视图数据中每个视图数据的特征数据。
映射信息提取单元,用于根据循环一致网络对每个视图数据的特征数据进行映射关系提取,得到非线性映射信息。
作为一种可选的实施方式,还包括:
生成数据模块,用于通过预设的映射关系提取网络的生成器,基于特征数据,得到每个视图数据的生成数据。
缺失信息生成单元,用于通过判别器判断每个视图数据和生成数据的缺失信息。
参数调整单元,用于根据缺失信息,调整生成器的参数。
作为一种可选的实施方式,描述信息获取模块32包括:
视图特征获取单元,用于获取非线性映射信息中每个视图数据的特征数据。
张量信息构建单元,用于将所有视图数据的特征数据构建得到张量信息。
描述信息生成单元,用于通过T-SVD对张量信息进行分解,得到共享描述信息。
作为一种可选的实施方式,还包括:
高阶结构模块,用于通过低秩张量约束方法提取共享描述信息中的高阶结构信息。
作为一种可选的实施方式,聚类模块33包括:
类别数获取单元,用于获取共享描述信息中的聚类类别数。
聚类单元,用于通过K-means算法,基于聚类类别数,对共享描述信息进行聚类,得到初始聚类结果。
作为一种可选的实施方式,优化模块34包括:
分布信息计算单元,用于根据初始聚类结果计算实际分布信息和目标分布信息,并将实际分布信息和目标分布信息作为聚类结果分布信息。
参数优化单元,用于根据反向传播策略,通过聚类结果分布信息,对预设的映射关系提取网络进行反向传播,得到参数优化信息。
目标聚类单元,用于通过参数优化信息,调整实际分布信息,以得到目标聚类结果。
其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分,并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式。
关于多视图聚类装置的具体限定可以参见上文中对于多视图聚类方法的限定,在此不再赘述。上述多视图聚类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储多视图聚类方法中涉及到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种多视图聚类方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中多视图聚类方法的步骤,例如图2所示的步骤S10至步骤S40及该方法的其它扩展和相关步骤的延伸。或者,处理器执行计算机程序时实现上述实施例中多视图聚类装置的各模块/单元的功能,例如图3所示模块31至模块34的功能。为避免重复,这里不再赘述。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中多视图聚类方法的步骤,例如图2所示的步骤S10至步骤S40及该方法的其它扩展和相关步骤的延伸。或者,计算机程序被处理器执行时实现上述实施例中多视图聚类装置的各模块/单元的功能,例如图3所示模块31至模块34的功能。为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (8)
1.一种多视图聚类方法,其特征在于,包括:
获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,通过预设的映射关系提取网络的生成器,得到目标多视图数据的非线性映射信息,其中,目标多视图数据中包括多个视图数据,预设的映射关系提取网络需要针对每个视图数据,进行特征提取,得到非线性映射信息,非线性映射信息表示了同一数据点在各个视图数据之间的对应关系;
通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;
根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;
基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果;
其中,所述获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,得到非线性映射信息包括:
通过自编码网络和循环一致网络构建预设的映射关系提取网络;
通过所述预设的映射关系提取网络的编码器提取所述目标多视图数据中每个视图数据的特征数据;
根据所述循环一致网络对每个视图数据的所述特征数据进行映射关系提取,得到非线性映射信息;
其中,在通过所述预设的映射关系提取网络的编码器提取所述目标多视图数据中每个视图数据的特征数据之后,所述方法还包括:
通过所述预设的映射关系提取网络的生成器,基于所述特征数据,得到每个视图数据的生成数据;
通过判别器判断所述每个视图数据和所述生成数据的缺失信息;
根据所述缺失信息,调整所述生成器的参数。
2.根据权利要求1所述的多视图聚类方法,其特征在于,所述通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息包括:
获取所述非线性映射信息中每个视图数据的特征数据;
将所有视图数据的所述特征数据构建得到张量信息;
通过T-SVD对所述张量信息进行分解,得到所述共享描述信息。
3.根据权利要求2所述的多视图聚类方法,其特征在于,在通过T-SVD对所述张量信息进行分解,得到所述共享描述信息之后,所述方法还包括:
通过低秩张量约束方法提取所述共享描述信息中的高阶结构信息。
4.根据权利要求1所述的多视图聚类方法,其特征在于,所述根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果包括:
获取所述共享描述信息中的聚类类别数;
通过K-means算法,基于所述聚类类别数,对所述共享描述信息进行聚类,得到所述初始聚类结果。
5.根据权利要求1所述的多视图聚类方法,其特征在于,所述基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果包括:
根据所述初始聚类结果计算实际分布信息和目标分布信息,并将所述实际分布信息和所述目标分布信息作为聚类结果分布信息;
根据反向传播策略,通过所述聚类结果分布信息,对所述预设的映射关系提取网络进行反向传播,得到参数优化信息;
通过所述参数优化信息,调整所述实际分布信息,以得到目标聚类结果。
6.一种多视图聚类装置,其特征在于,包括:
映射信息提取模块,用于获取目标多视图数据,将所述目标多视图数据输入到预设的映射关系提取网络,通过预设的映射关系提取网络的生成器,得到目标多视图数据的非线性映射信息,其中,目标多视图数据中包括多个视图数据,预设的映射关系提取网络需要针对每个视图数据,进行特征提取,得到非线性映射信息,非线性映射信息表示了同一数据点在各个视图数据之间的对应关系;
描述信息获取模块,用于通过预设的张量分解方式,基于所述非线性映射信息,生成所述目标多视图数据的共享描述信息;
聚类模块,用于根据预设聚类方法,对所述共享描述信息进行聚类,得到初始聚类结果;
优化模块,用于基于所述初始聚类结果计算聚类结果分布信息,并通过所述聚类结果分布信息,对所述初始聚类结果进行优化,得到目标聚类结果;
其中,映射信息提取模块包括:
网络构建单元,用于通过自编码网络和循环一致网络构建预设的映射关系提取网络;
特征提取单元, 用于通过预设的映射关系提取网络的编码器提取目标多视图数据中每个视图数据的特征数据;
映射信息提取单元,用于根据循环一致网络对每个视图数据的特征数据进行映射关系提取,得到非线性映射信息;
所述多视图聚类装置,还包括:
生成数据模块,用于通过预设的映射关系提取网络的生成器,基于特征数据,得到每个视图数据的生成数据;缺失信息生成单元,用于通过判别器判断每个视图数据和生成数据的缺失信息;
参数调整单元,用于根据缺失信息,调整生成器的参数。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述多视图聚类方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述多视图聚类方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210657934.7A CN115063621B (zh) | 2022-06-10 | 2022-06-10 | 多视图聚类方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210657934.7A CN115063621B (zh) | 2022-06-10 | 2022-06-10 | 多视图聚类方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115063621A CN115063621A (zh) | 2022-09-16 |
CN115063621B true CN115063621B (zh) | 2023-12-19 |
Family
ID=83201334
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210657934.7A Active CN115063621B (zh) | 2022-06-10 | 2022-06-10 | 多视图聚类方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115063621B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685155A (zh) * | 2018-12-29 | 2019-04-26 | 广东工业大学 | 基于多视图的子空间聚类方法、装置、设备及存储介质 |
CN111461257A (zh) * | 2020-04-24 | 2020-07-28 | 北京工业大学 | 一种流形空间中多视点视频的共享-差异表示及聚类方法 |
CN113239983A (zh) * | 2021-04-25 | 2021-08-10 | 浙江师范大学 | 基于高阶关联保持的缺失多视图子空间聚类方法及系统 |
CN114565783A (zh) * | 2022-03-03 | 2022-05-31 | 天津大学 | 一种基于集成异构图注意力网络的缺失多视图聚类方法 |
-
2022
- 2022-06-10 CN CN202210657934.7A patent/CN115063621B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109685155A (zh) * | 2018-12-29 | 2019-04-26 | 广东工业大学 | 基于多视图的子空间聚类方法、装置、设备及存储介质 |
CN111461257A (zh) * | 2020-04-24 | 2020-07-28 | 北京工业大学 | 一种流形空间中多视点视频的共享-差异表示及聚类方法 |
CN113239983A (zh) * | 2021-04-25 | 2021-08-10 | 浙江师范大学 | 基于高阶关联保持的缺失多视图子空间聚类方法及系统 |
CN114565783A (zh) * | 2022-03-03 | 2022-05-31 | 天津大学 | 一种基于集成异构图注意力网络的缺失多视图聚类方法 |
Non-Patent Citations (1)
Title |
---|
无监督学习中的多视角张量分析和深度聚类分析;刘金艳;中国优秀硕士论文全文数据库(07);正文第28-48页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115063621A (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110889433A (zh) | 人脸聚类方法、装置、计算机设备及存储介质 | |
CN112528025A (zh) | 基于密度的文本聚类方法、装置、设备及存储介质 | |
CN110399487B (zh) | 一种文本分类方法、装置、电子设备及存储介质 | |
CN114550241B (zh) | 人脸识别方法、装置、计算机设备及存储介质 | |
CN111835561B (zh) | 基于用户行为数据的异常用户群体检测方法、装置、设备 | |
CN110188825B (zh) | 基于离散多视图聚类的图像聚类方法、系统、设备及介质 | |
CN113204660B (zh) | 多媒体数据处理方法、标签识别方法、装置及电子设备 | |
CN113987182A (zh) | 基于安全情报的欺诈实体识别方法、装置及相关设备 | |
CN110956195A (zh) | 图像匹配方法、装置、计算机设备及存储介质 | |
CN113239697B (zh) | 实体识别模型训练方法、装置、计算机设备及存储介质 | |
CN112561644B (zh) | 基于链接预测的商品推荐方法、装置及相关设备 | |
CN115063621B (zh) | 多视图聚类方法、装置、计算机设备及存储介质 | |
CN117422182A (zh) | 数据预测方法、装置及存储介质 | |
CN114266324B (zh) | 模型可视化建模方法、装置、计算机设备及存储介质 | |
CN114741499B (zh) | 一种基于句子语义模型的文本摘要生成方法和系统 | |
CN114331388B (zh) | 基于联邦学习的薪资计算方法、装置、设备及存储介质 | |
CN116662876A (zh) | 多模态认知决策方法、系统、装置、设备及存储介质 | |
CN113268563B (zh) | 基于图神经网络的语义召回方法、装置、设备及介质 | |
CN111062995B (zh) | 生成人脸图像的方法、装置、电子设备和计算机可读介质 | |
CN114417982A (zh) | 一种模型训练方法、终端设备及计算机可读存储介质 | |
CN114255354B (zh) | 人脸识别模型训练方法、人脸识别方法、装置及相关设备 | |
de Boer et al. | SurvivalLVQ: Interpretable supervised clustering and prediction in survival analysis via Learning Vector Quantization | |
CN116910566B (zh) | 一种目标识别模型训练方法和装置 | |
WO2021151326A1 (zh) | 基于对抗网络的电子病历筛查方法、装置、设备及介质 | |
CN113507447B (zh) | 网络流量数据的自适应增强方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |