CN116758319A - 一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法 - Google Patents
一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法 Download PDFInfo
- Publication number
- CN116758319A CN116758319A CN202310715369.XA CN202310715369A CN116758319A CN 116758319 A CN116758319 A CN 116758319A CN 202310715369 A CN202310715369 A CN 202310715369A CN 116758319 A CN116758319 A CN 116758319A
- Authority
- CN
- China
- Prior art keywords
- view
- encoder
- remote sensing
- matrix
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims abstract description 75
- 238000009826 distribution Methods 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims abstract description 15
- 238000003064 k means clustering Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 2
- 230000037430 deletion Effects 0.000 claims description 2
- 238000012549 training Methods 0.000 abstract description 5
- 230000010365 information processing Effects 0.000 abstract description 3
- 101100477520 Homo sapiens SHOX gene Proteins 0.000 description 3
- 102000048489 Short Stature Homeobox Human genes 0.000 description 3
- 108700025071 Short Stature Homeobox Proteins 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- ZQSTWOIIMKNFPE-DSPGLSBSSA-N (2r,3r,4s,5r)-2-[5-chloro-7-(cyclopentylamino)imidazo[4,5-b]pyridin-3-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC(Cl)=CC(NC3CCCC3)=C2N=C1 ZQSTWOIIMKNFPE-DSPGLSBSSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,属于遥感信息处理中的多视角遥感图像聚类领域,本发明首先从非完备多视角遥感图像数据中提取每个视角的存在特征及其邻接矩阵和原始概率分布矩阵,以便更好的利用数据的图信息和流形信息。然后,构建一个基于图卷积的多视角自编码器网络,将全部视角的存在特征及其邻接矩阵和原始概率分布矩阵输入网络以进行公共表示学习和缺失特征补全,并用基于流形正则化的重建损失函数训练网络直至收敛。最后,从收敛后网络的编码器获取公共潜在特征,并对潜在特征实施K均值聚类以得到聚类结果,以此促进模型对非完备多视角遥感图像数据的自适应性和鲁棒性;与其他方法相比,本发明的聚类准确率更高,性能更加稳健。
Description
技术领域
本发明属于遥感信息处理中的多视角遥感图像聚类,具体涉及一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法。
背景技术
在遥感信息处理领域,遥感图像是一种可广泛获取的数据。通过获取遥感图像的多个视角特征,可以对其进行更全面和有效的分析。对多视角遥感图像进行聚类分析,可以在没有人工标注的情况下,对遥感图像按照其内容进行较为准确的划分。然而,在多视角遥感图像的采集、加工和传输的过程中,容易发生个别视角特征丢失的情况。现有的多视角遥感图像聚类方法无法处理含有缺失视角的遥感数据,只能丢弃带有缺失视角的图像,导致这些图像无法被聚类。由此,需要新颖的技术方法对非完备多视角遥感图像进行有效的聚类。
发明内容
为了解决上述问题,本发明提供了一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,所述方法包括步骤:
对非完备多视角遥感图像数据集的提取每个视角的存在特征。
对每个视角的存在特征,分别构建高斯核矩阵。
对每个视角的高斯核矩阵,分别构建邻接矩阵和原始概率分布矩阵。
将每个视角的存在特征及其邻接矩阵和原始概率分布矩阵送入基于图卷积的多视角自编码器网络,进行公共表示学习和缺失特征补全,并用基于流形正则化的重建目标函数训练该网络,直至网络收敛。
从收敛后的多视角自编码器网络的编码器获取该非完备多视角遥感图像数据集的公共潜在表示。对该公共潜在表示进行K均值聚类,得出聚类结果。
根据所得聚类结果,计算所述遥感图像数据的聚类准确率。
进一步地,用于从所述非完备多视角遥感图像数据中获取每个视角存在特征的存在指示矩阵定义为:
其中,表示视角v的存在指示矩阵,n和nv分别表示数据集的样本数量和视角v的存在特征向量的数量,/>表示视角v的第i个存在特征,/>表示视角v的第j个原始特征。
进一步地,从每一个视角v的原始特征中提取其存在特征:
其中,分别是视角v的存在指示矩阵、原始特征矩阵和存在特征矩阵。
进一步地,对视角v的存在特征构建高斯核矩阵:
其中,Sv是视角v的高斯核矩阵,是分别是视角v的第i,j,k个存在特征,是视角v的第i个存在特征向量的邻域宽度,其取值由困惑度参数ppl决定。
所述视角v的邻接矩阵的表达公式为:
其中,Av表示视角v的邻接矩阵,表示阶数为nv的单位矩阵,Sv表示视角v的高斯核矩阵,Dv表示邻接矩阵的归一化矩阵,其表达公式为:
所述视角v的原始概率分布矩阵的表达公式为:
Pv=(Sv+(Sv)T)/2
进一步地,将所有视角的存在特征及其邻接矩阵送入所述基于图卷积的多视角自编码器网络。其中,编码器部分的表达公式为:
其中,表示视角v的的存在特征对应的潜在表示,/>是视角v的编码器的可学习参数,/>表示编码器的非线性变换。
进一步地,将所有视角的潜在表示进行融合以获取公共潜在表示的表达公式为:
进一步地,解码器部分的表达公式为:
其中,表示重建的视角v的原始特征,其中既包括存在特征的重建/>也包括缺失特征的补全/>是视角v的解码器的可学习参数,/>表示视角v的解码器的非线性变换。
进一步地,视角v的潜在概率分布的表示公式为:
其中表示第i个存在特征向量的融合潜在表示,其表示公式为/>
进一步地,所述多视角自编码器的用于缺失特征补全的重建损失函数的表示公式为:
其中,m表示视角数量,nv表示视角v的存在特征数量,Gv,Xv,分别是视角v的存在指示矩阵、原始特征矩阵和重建的原始特征矩阵,||·||表示矩阵的L2范数。
进一步地,所述多视角自编码器的用于公共表示学习的流形正则化项的表示公式为:
其中,KL(·||·)表示两个分布之间的Kullback-Leibler散度,Qv表示视角v的潜在概率分布。
进一步地,所述基于流形正则化的重建目标函数的表示公式为:
其中,λ是一个权衡参数,其取值大于零,是重建损失函数,/>是流形正则化项。
以所述基于流形正则化的重建损失函数,将所述基于图卷积的多视角自编码器训练至网络收敛。然后,从收敛后网络的编码器获得公共潜在表示H。最后,对H进行K均值聚类,得到最终聚类结果。
进一步地,根据所述聚类结果,计算出聚类准确率。
本发明提供了一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,具有以下优势:
(1)所述方法采用了多视角自编码器网络架构,融合每个视角的潜在特征以进行公共表示学习,同时补全了缺失特征,有效降低了数据非完备性的不利影响。
(2)所述方法采用了基于高斯核的邻接矩阵和图卷积神经网络,建立并利用了各个特征之间的联系,充分利用了各个视角的图信息,提升了对非完备数据的鲁棒性。
(3)所述方法采用了流形正则化技术,以各个视角的原始概率分布约束对应视角的潜在概率分布,充分整合了各个视角的流形信息,提升了聚类性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法的流程图;
图2是一个多视角遥感图像数据集LandUse的示例图像;
图3是所述基于图卷积的多视角自编码器的网络结构示意图;
图4是具体实施方式结果在LandUse数据集的视角2上随机抽取8个缺失特征向量的真实值和补全值的对比图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
示例性方法
如图1,本发明提供了一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,所述方法步骤为:
步骤S110:提取每个视角的存在特征。首先,输入非完备多视角遥感图像数据的样本特征矩阵。然后,按照存在指示矩阵Gv从原始特征矩阵Xv中去除缺失样本,组成存在特征矩阵最后,将每个特征归一化到实数区间[0,1]。
步骤S120:构建每个视角的高斯核矩阵。首先,按照困惑度参数ppl进行二分搜索,求出每个视角的每个存在特征向量的邻域宽度然后,构建每个视角的高斯核矩阵为:
步骤S130:构建每个视角的邻接矩阵和原始概率分布矩阵,其表达公式为:
Pv=(Sv+(Sv)T)/2 (3)
其中,Av和Pv分别是视角v的邻接矩阵和原始概率分布矩阵,Sv表示视角v的高斯核矩阵。
步骤S140:训练基于图卷积的多视角自编码器直至网络收敛。首先,初始化网络的可学习参数。然后,将送入网络中进行公共表示学习和缺失特征补全。最后,用基于流形正则化的重建损失函数对网络进行训练,直至网络收敛。所述损失函数的表达公式为:
其中,m表示视角数量,Gv,Xv,分别是视角v的存在指示矩阵、原始特征矩阵和重建的原始特征矩阵,Qv表示视角v的潜在概率分布,Pv表示视角v的原始概率分布矩阵。
步骤S150:获取公共潜在表示并对其进行K均值聚类。首先,将送入已收敛的网络,从网络的编码器获取公共潜在表示H。然后,对H进行K均值聚类,获得最终聚类结果。
步骤S160:根据所得的聚类结果,计算所述的非完备多视角遥感图像数据集上的聚类准确率。
通过本实施方式,首先,从非完备多视角遥感图像数据中提取每个视角的存在特征及其邻接矩阵和原始概率分布矩阵。然后,构建一个基于图卷积的多视角自编码器网络,用于公共表示学习和缺失特征补全。以基于流形正则化的重建损失函数将该网络训练至收敛。最后,从该网络的编码器获取公共潜在特征,并对潜在特征实施K均值聚类以得到聚类结果。得到聚类结果后,再计算所述数据集上的聚类准确率。
进一步说明,假设将一个非完备多视角遥感图像数据集根据本实施方式进行聚类,将得到一个准确率高于大多数方法的聚类结果。
具体实施方式结果
本具体实施方式采用已公开的多视角遥感图像数据集,并通过随机删除视角特征模拟出非完备多视角遥感图像数据集。数据集的细节描述为:
LandUse遥感图像数据集是从美国地质调查局全国地图城市区域影像中提取的,针对美国各地的不同城市区域,对应21个土地使用类型,包括:农田、飞机、棒球场、海滩、建筑物、矮树灌丛地带、高密度居住区、森林、高速公路、高尔夫球场等。每张图的尺寸为256×256像素。从该数据集提取PHOG和LBP特征作为两个视角,简述如下:
视角1是PHOG特征,即金字塔梯度直方图特征(Pyramid of HistogramsofOriented Gradients,PHOG),PHOG特征对尺度和方向变化具有鲁棒性,同时捕获了图像的整体形状和局部纹理信息。
视角2是LBP特征,即局部二值模式特征(Local Binary Pattern,LBP),LBP是一种用于图像纹理分析和分类的描述符,能够有效地捕捉图像的局部特征。
为了模拟非完备多视角数据,从LandUse数据集中随机选取50%的样本作为非完备样本,并随机删除非完备样本其中一个视角的特征向量,得到一个非完备多视角遥感图像数据集。
为了验证本实施方式(OURS)的优越性,将本实施方式与几种现有的非完备多视角遥感图像数据聚类方法进行比较,包括IMG、UEAF、DAIMC、DCCAE、PVC、DCCA等方法,将比较这些方法在上述公开数据集上的聚类准确率(ACC),归一化互信息(NMI)和调整兰德指数(ARI)。具体的数据对比如表一所示,最优的指标值以加粗字体显示。
表一 LandUse数据集上的聚类性能指标比较(%)
方法 | ACC | NMI | ARI |
IMG | 15.52 | 22.54 | 3.73 |
UEAF | 16.38 | 18.42 | 3.8 |
DAIMC | 19.3 | 19.45 | 5.8 |
DCCAE | 14.94 | 20.94 | 3.67 |
PVC | 21.33 | 23.14 | 8.1 |
DCCA | 14.08 | 20.02 | 3.38 |
OURS | 30.86 | 36.52 | 16.07 |
通过上表数据对比,可以清楚的看到,OURS达到了最好的聚类性能,显著提高了在非完备遥感图像数据集LandUse上的各项聚类指标。定量结果充分说明了OURS的优越性,因为OURS能同时进行公共表示学习和缺失特征补全,更好的捕获非完备多视角遥感图像数据中的视角互补信息、图信息、流形信息。OURS使用了基于图卷积的多视角自编码器,并在其损失函数中施加了流形正则化项,从而提高了对非完备多视角遥感图像数据的鲁棒性。大量实验表明,该方法优于现有方法。关于本实施方式参数的设置,在所有实验中,权衡参数λ设为0.1,困惑度参数ppl设为10。
本实施方式提出了一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,用于对非完备多视角遥感图像数据进行聚类分析,通过提取每个视角的存在特征并构建相应的邻接矩阵和原始概率分布矩阵,送入一个基于图卷积的多视角自编码器中,以基于流形正则化的重建损失函数训练网络,进行公共表示学习和缺失特征补全,直至网络收敛,然后从编码器中获取数据的公共潜在表示,最后通过K均值聚类得到最终聚类结果。在公开数据集LandUse上的实验结果表明,本实施方式相对于其他方法有着更高的聚类准确率以及其它指标,有着更好的优越性。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (15)
1.一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,所述方法包括步骤:
对非完备多视角遥感图像数据集的每个视角提取其存在特征。
对提取的每个视角的存在特征,分别构建高斯核矩阵。
对构建的每个视角的高斯核矩阵,分别构建邻接矩阵和原始概率分布矩阵。
将每个视角的存在特征及其邻接矩阵和原始概率分布矩阵送入基于图卷积的多视角自编码器网络以进行公共表示学习和缺失特征补全,用基于流形正则化的重建目标函数训练该网络至收敛。
从收敛后网络的编码器获取该非完备多视角遥感图像数据集的公共潜在表示。
对该公共潜在表示进行K均值聚类,得到出聚类结果。
根据所得聚类结果,计算所述遥感图像数据的聚类准确率。
2.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,用于从所述非完备多视角遥感图像数据中获取每个视角存在特征的存在指示矩阵定义为:
其中,表示视角v的存在指示矩阵,n和nv分别表示数据集的样本数量和视角v的存在特征向量的数量,/>表示视角v的第i个存在特征,/>表示视角v的第j个原始特征。
3.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,提取视角v的存在特征的表达公式为:
其中,Gv,Xv,分别是视角v的存在指示矩阵、原始特征矩阵和存在特征矩阵。
4.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,所述视角v的高斯核矩阵的表达公式为:
其中,Sv是视角v的高斯核矩阵,是分别是视角v的第i,j,k个存在特征,/>是视角v的第i个存在特征向量的邻域宽度,其取值根据困惑度参数ppl决定。
5.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,视角v的邻接矩阵的表达公式为:
其中,Av表示视角v的邻接矩阵,表示阶数为nv的单位矩阵,Dv表示邻接矩阵的归一化矩阵,其表达公式为/>
6.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,视角v的原始概率分布矩阵的表达公式为:
Pv=(Sv+(Sv)T)/2。
7.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,编码器部分的表达公式为:
其中,表示视角v的的存在特征对应的潜在表示,/>是视角v的编码器的可学习参数,/>表示视角v的编码器的非线性变换。
8.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,将所有视角的潜在表示进行融合以获取公共潜在表示的表达公式为:
9.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,解码器部分的表达公式为:
其中,表示视角v的原始特征重建矩阵,其中既包括存在特征的重建/>也包括缺失特征的补全/> 是视角v的解码器的可学习参数,/>表示视角v的解码器的非线性变换。
10.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,视角v的潜在概率分布的表示公式为:
其中表示第i个存在特征向量的融合潜在表示,其表达公式为/>
11.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,所述用于缺失特征补全的重建损失函数的表示公式为:
其中,m表示视角数量,Gv,Xv,分别表示视角v的存在指示矩阵、原始特征矩阵和原始特征重建矩阵,||·||表示矩阵的L2范数。
12.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,所述用于公共表示学习的流形正则化项的表示公式为:
其中,KL(·||·)表示两个分布之间的Kullback-Leibler散度,Qv表示视角v的潜在概率分布矩阵,Pv表示视角v的原始概率分布矩阵。
13.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,所述基于流形正则化的重建目标函数的表示公式为:
其中,λ是一个权衡参数,其取值大于零。
14.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,以所述基于流形正则化的重建损失函数,将所述基于图卷积的多视角自编码器网络训练至网络收敛。然后,从收敛后网络的编码器获取公共潜在表示H。最后,对H进行K均值聚类,得到最终聚类结果。
15.根据权利要求1所述的基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法,其特征在于,根据所述聚类结果,计算出聚类准确率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310715369.XA CN116758319A (zh) | 2023-06-15 | 2023-06-15 | 一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310715369.XA CN116758319A (zh) | 2023-06-15 | 2023-06-15 | 一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116758319A true CN116758319A (zh) | 2023-09-15 |
Family
ID=87952749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310715369.XA Withdrawn CN116758319A (zh) | 2023-06-15 | 2023-06-15 | 一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116758319A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117765292A (zh) * | 2023-12-26 | 2024-03-26 | 哈尔滨理工大学 | 一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法 |
CN117994550A (zh) * | 2024-03-05 | 2024-05-07 | 哈尔滨理工大学 | 一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法 |
CN118135279A (zh) * | 2024-01-22 | 2024-06-04 | 哈尔滨工业大学(威海) | 一种不完整视图的聚类方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112464004A (zh) * | 2020-11-26 | 2021-03-09 | 大连理工大学 | 一种多视角深度生成图像聚类方法 |
CN113128600A (zh) * | 2021-04-23 | 2021-07-16 | 湖北珞珈环创科技有限公司 | 一种结构化深度非完整多视角聚类方法 |
US20210279881A1 (en) * | 2018-06-04 | 2021-09-09 | University Of Central Florida Research Foundation, Inc. | Deformable capsules for object detection |
CN115527053A (zh) * | 2022-10-09 | 2022-12-27 | 广东工业大学 | 一种基于矩阵分解使用完整图正则化的不完备多视角聚类方法 |
CN116108363A (zh) * | 2022-12-16 | 2023-05-12 | 哈尔滨工业大学(深圳) | 基于标签引导的不完备多视图多标签分类方法和系统 |
-
2023
- 2023-06-15 CN CN202310715369.XA patent/CN116758319A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210279881A1 (en) * | 2018-06-04 | 2021-09-09 | University Of Central Florida Research Foundation, Inc. | Deformable capsules for object detection |
CN112464004A (zh) * | 2020-11-26 | 2021-03-09 | 大连理工大学 | 一种多视角深度生成图像聚类方法 |
CN113128600A (zh) * | 2021-04-23 | 2021-07-16 | 湖北珞珈环创科技有限公司 | 一种结构化深度非完整多视角聚类方法 |
CN115527053A (zh) * | 2022-10-09 | 2022-12-27 | 广东工业大学 | 一种基于矩阵分解使用完整图正则化的不完备多视角聚类方法 |
CN116108363A (zh) * | 2022-12-16 | 2023-05-12 | 哈尔滨工业大学(深圳) | 基于标签引导的不完备多视图多标签分类方法和系统 |
Non-Patent Citations (4)
Title |
---|
AO LI ET.AL: "Graph t-SNEmulti-view autoencoder for joint clustering and completion of incompletemulti-view data", 《KNOWLEDGE-BASED SYSTEMS》, pages 1 - 17 * |
CONG FENG: "Graph t-SNE Multi-view Autoencoder (GTSNE-MvAE)", pages 3 - 37, Retrieved from the Internet <URL:https://github.com/cgsdfc/GTSNE-MvAE> * |
YIMING WANG ET.AL: "Incomplete Multiview Clustering via Cross-View Relation Transfer", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》, vol. 33, no. 1, pages 367 - 378 * |
李勇振 等: "基于图卷积神经网络的多视角聚类", 《计算机工程与应用》, vol. 57, no. 5, pages 115 - 122 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117765292A (zh) * | 2023-12-26 | 2024-03-26 | 哈尔滨理工大学 | 一种基于图卷积流形正则化伪标签引导的非完备多视角遥感数据聚类方法 |
CN118135279A (zh) * | 2024-01-22 | 2024-06-04 | 哈尔滨工业大学(威海) | 一种不完整视图的聚类方法及系统 |
CN117994550A (zh) * | 2024-03-05 | 2024-05-07 | 哈尔滨理工大学 | 一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法 |
CN117994550B (zh) * | 2024-03-05 | 2024-10-18 | 哈尔滨理工大学 | 一种基于深度在线锚点子空间学习的非完备多视角大规模动物图像聚类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110135366B (zh) | 基于多尺度生成对抗网络的遮挡行人重识别方法 | |
Sankaranarayanan et al. | Learning from synthetic data: Addressing domain shift for semantic segmentation | |
CN116758319A (zh) | 一种基于图卷积流形正则化自编码器的非完备多视角遥感图像聚类方法 | |
CN109190561B (zh) | 一种视频播放中的人脸识别方法及系统 | |
CN109063649B (zh) | 基于孪生行人对齐残差网络的行人重识别方法 | |
CN105469111B (zh) | 基于改进的mfa和迁移学习的小样本集的物体分类方法 | |
CN104881671B (zh) | 一种基于2D‑Gabor的高分遥感影像局部特征提取方法 | |
CN105654054B (zh) | 基于半监督近邻传播学习和多视觉词典模型的智能视频分析方法 | |
CN104036296B (zh) | 一种图像的表示和处理方法及装置 | |
CN109635726B (zh) | 一种基于对称式深度网络结合多尺度池化的滑坡识别方法 | |
CN118230175B (zh) | 基于人工智能的不动产测绘数据处理方法及系统 | |
CN106203448A (zh) | 一种基于非线性尺度空间的场景分类方法 | |
CN116563205A (zh) | 基于小目标检测和改进YOLOv5的麦穗计数检测方法 | |
CN108830222A (zh) | 一种基于信息性和代表性主动学习的微表情识别方法 | |
CN113408651B (zh) | 基于局部判别性增强的无监督三维物体分类方法 | |
CN114202694A (zh) | 基于流形混合插值和对比学习的小样本遥感场景图像分类方法 | |
CN113343765A (zh) | 一种基于点云刚性配准的场景检索方法及系统 | |
CN116704497B (zh) | 一种基于三维点云的油菜表型参数提取方法及系统 | |
CN112418262A (zh) | 车辆再识别的方法、客户端及系统 | |
CN112232403A (zh) | 一种红外图像与可见光图像的融合方法 | |
CN109784291B (zh) | 基于多尺度的卷积特征的行人检测方法 | |
Li et al. | A new algorithm of vehicle license plate location based on convolutional neural network | |
Zhu et al. | Tell the truth from the front: Anti-disguise vehicle re-identification | |
CN102609732A (zh) | 基于泛化视觉词典图的物体识别方法 | |
CN107506400B (zh) | 一种基于认知特征和流形排序的图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230915 |