WO2022156333A1

WO2022156333A1 - 基于自编码器的多模态自适应融合深度聚类模型及方法

Info

Publication number: WO2022156333A1
Application number: PCT/CN2021/131248
Authority: WO
Inventors: 朱信忠; 徐慧英; 董仕豪; 郭西风; 王霞; 靳林通; 赵建民
Original assignee: 浙江师范大学
Priority date: 2021-01-25
Filing date: 2021-11-17
Publication date: 2022-07-28
Also published as: US20240095501A1; ZA202207739B; LU502834B1; CN112884010A

Abstract

本申请公开了基于自编码器的多模态自适应融合深度聚类模型，包括编码器结构、多模态自适应融合层、解码器结构、深度嵌入式聚类层；编码器，用于使数据集（I）分别通过自编码器、卷积自编码器、卷积变分自编码器三种非线性映射h(X；θ_m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z_m；多模态自适应特征融合层，用于将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z_m通过自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；解码器，用于使用与编码器对称的结构对融合特征Z进行解码，得到解码后的重构数据集（I）；深度嵌入式聚类层，用于对融合特征Z进行聚类，通过对比聚类结果与真实标签得到最终准确率ACC。

Description

基于自编码器的多模态自适应融合深度聚类模型及方法

技术领域

本申请涉及聚类分析技术领域，尤其涉及基于自编码器的多模态自适应融合深度聚类模型及方法。

背景技术

聚类分析是许多领域的基本问题，例如机器学习，数据挖掘，模式识别，图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集，这样让在同一个子集中的成员对象都有相似的一些属性，一般把数据聚类归纳为一种非监督式学习。现有技术中也有一些常见的聚类方法，但是由于传统的聚类方法所使用的相似性度量方法效率低下，因此它们在高维数据上的性能通常较差。此外，这些方法通常在大规模数据集上具有较高的计算复杂性。因此，人们广泛研究了降维和特征转换方法，以将原始数据映射到一个新的特征空间中，在该特征空间中，生成的数据更容易被现有的分类器分离。一般而言，现有的数据转换方法包括线性变换(例如主成分分析)和非线性变换(例如核方法和光谱方法)。尽管如此，数据的高度复杂的潜在结构仍在挑战现有聚类方法的有效性。

由于深度学习的发展，由于深度神经网络的高度非线性转换的内在特性，可将其用于将数据转换为更易于聚类的表示形式。近年来，聚类方法还涉及到深度嵌入聚类以及其他新颖的方法，使深度聚类成为流行的研究领域。例如堆叠式自动编码器，可变自动编码器和卷积自动编码器，这是为无监督学习而提出的。基于神经网络的聚类方法在一定程度上击败了传统方法，方法是学习复杂的非线性变换以获得强大的特征的有效的方法。但是通过神经网络获取特征的单一模态方法，即，首先提取模态特征，然后采用传统的聚类，例如K均值或频谱聚类，并没有充分提取数据的全部特征，没有很好地利用多模态特征学习和聚类之间的关系，因此这种单独的学习策略可能会带来不令人满意的聚类结果甚至由于无监督学习的弊端导致结果变化很大。为了解决这个问题，本申请提出了基于自编码器的多模态自适应特征融合深度聚类模型及聚类方法。

发明内容

本申请的目的是针对现有技术的缺陷，提供了基于自编码器的多模态自适应融合深度聚类模型及方法。使用多种不同的深度自编码器来学习原始数据的潜在表示，并约束它们学习不同的特征，对几个自然图像数据集的实验评估表明，与现有方法相比，该方法有显著改进。

为了实现以上目的，本申请采用以下技术方案：

基于自编码器的多模态自适应融合深度聚类模型，包括编码器、多模态自适应融合层、解码器、深度嵌入式聚类层；所述编码器包括自编码器、卷积自编码器、卷积变分自编码器；

编码器，用于使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器非线性的映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m；

多模态自适应融合层，与所述编码器连接，用于将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m通过自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；

解码器，与所述多模态自适应融合层连接，用于使用与编码器对称的结构对融合后的特征Z进行解码，得到解码后的重构数据集

深度嵌入式聚类层，与所述多模态自适应融合层连接，用于对融合特征Z进行聚类，通过对比聚类结果与真实标签得到最终准确率ACC。

进一步的，所述编码器中分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m，表示为：

Z _m＝h(X；θ _m)

其中，θ _m表示编码器模型参数；m表示编码器序列。

进一步的，所述多模态自适应融合层中得到融合特征Z，表示为：

Z＝ω ₁·Z ₁+ω ₂·Z ₂+ω ₃·Z ₃

其中，ω _m表示第m个模态的特征的重要性权重，由网络自适应的学习，得到自适应特征融合参数；

限制

并定义：

其中，ω _m分别通过使用β _m作为控制参数的softmax函数定义；在不同模态特征上分别使用1×1卷积计算权重标量β _m，通过标准反向传播来学习。

进一步的，所述解码器中得到解码后的重构数据集

表示为：

其中，

表示解码器模型参数。

进一步的，所述深度嵌入式聚类层中对融合特征Z进行聚类具体为：

将n个点

分成k个类，每个类的中心用μ _j，j＝1，...，k，初始化聚类中心

并计算特征点与聚类中心的软分配q _ij和辅助分布p _i，最终用软分配q _ij和辅助分布p _i的KL散度来定义聚类损失函数，并更新聚类中心μ _j、编码器、解码器参数θ和自适应特征融合参数β。

进一步的，所述编码器中还包括利用重构损失来更新自编码器、卷积自编码器、卷积变分自编码器的网络参数；具体为将编码器输入原始数据x _i和解码器输出重构数据

的平方差函数作为重构损失，预训练编码器，得到初始化模型，表示为：

其中，L _R表示重构损失函数。

进一步的，所述深度嵌入式聚类层中还包括利用聚类损失KL散度来更新聚类结果、编码器参数和融合参数；具体为：

使用学生t分布作为核函数计算特征点Z _i和聚类中心μ _j相似度，表示为：

其中，Z _i＝∫(h(x _i))∈Z；α表示学生t分布的自由度；q _ij表示将样本i分配给聚类中心μ _j的概率；μ _j′表示每一个中心点；

通过在辅助目标分布的帮助下从聚类的高可信度分配中学习来迭代地优化聚类，即通过将软分配与目标分布匹配来训练模型；将目标损失函数定义为软分配概率q _i和辅助分布p _i之间的KL散度，表示为：

f _j＝∑ _iq _ij

其中，L _C表示聚类损失函数；f _j＝∑ _iq _ij表示软聚类频率。

进一步的，所述深度嵌入式聚类层还包括：

通过带动量的随机梯度下降算法联合优化聚类中心μ _j，网络参数θ和自适应特征融合参数β，关于每个数据点Z _i和每个聚类中心μ _j的特征空间嵌入的L梯度计算如下：

其中，梯度

通过反向传播来计算网络参数梯度

当连续两次迭代之间更改聚类分配的点数小于总点数的预设比例时，则停止聚类。

相应的，还提供基于自编码器的多模态自适应融合深度聚类方法，包括：

S1.使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器非线性的映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m；

S2.将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m以自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；

S3.使用与编码器对称的结构对聚类后的融合特征Z进行解码，得到解码后的数据集

S4.对自适应融合特征Z进行聚类，通过对比聚类结果与真实标签得到最终准确率ACC。

进一步的，所述步骤S2中得到融合特征Z，表示为：

Z＝ω ₁·Z ₁+ω ₂·Z ₂+ω ₃·Z ₃

限制

并定义：

与现有技术相比，本申请提出了一种新颖的多模态自适应特征融合深度聚类框架，该框架包括多模态编码器，自适应融合网络和深度聚类层。通过多模态编码器和多模态自适应特征融合层，模型通过非线性映射提取原始数据特征，实现高维数据降维，优化数据特征公共子空间，最后用KL散度约束子空间聚类。在三个公共数据集上的实验结果证明了我们的模型优于几种最新的模型。

附图说明

图1是实施例一提供的基于自编码器的多模态自适应融合深度聚类模型结构图；

图2是实施例一提供的基于自动编码器的多模态深度聚类(MDEC)结构示意图；

图3是实施例二提供的数据集具体信息和样本信息示意图；

图4是实施例三提供的基于自编码器的多模态自适应融合深度聚类方法示意图。

具体实施方式

以下通过特定的具体实例说明本申请的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本申请的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

本申请的目的是针对现有技术的缺陷，提供了基于自编码器的多模态自适应融合深度聚类模型及方法。

实施例一

本实施例提供基于自编码器的多模态自适应融合深度聚类模型，如图1所示，包括编码器11、多模态自适应融合层12、解码器13、深度嵌入式聚类层14；编码器11包括自编码器、卷积自编码器、卷积变分自编码器；

编码器11，用于使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器非线性的映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m；

多模态自适应融合层12，与编码器11连接，用于将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m通过自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；

解码器13，与多模态自适应特征融合12连接，用于使用与编码器对称的结构对聚类后的融合特征Z进行解码，得到解码后的重构数据集

深度嵌入式聚类层14，与多模态自适应融合层12连接，用于对融合特征Z进行聚类，得到聚类后的融合特征Z；

如图2所示为基于自动编码器的多模态自适应特征融合深度聚类(MDEC)结构示意图，该结构由四部分组成：自编码器、卷积自编码器、卷积变分自编码器组成的编码器11；多模态自适应融合层12；深度嵌入式聚类层13；解码器14。

在编码器11中，使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器非线性的映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m。

具体为：在模型中，使用X表示数据集，分别通过自编码器，卷积自编码器，变分自编码器的非线性的映射h(X；θ _m)获得潜在的特征Z _m。通过编码器可以将高维的数据转换成低维特征，表达式如下：

Z _m＝h(X；θ _m)

其中，θ _m表示编码器模型参数；m表示编码器序列。

在多模态自适应融合层12中，将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m通过自适应空间特征融合方式融合到公共子空间中，得到融合特征Z。

具体为：通过编码器层的映射后，得到了三个潜在特征空间Z _m，为了获取原始数据更全面的信息，我们将不同自编码器获取的不同特征Z _m融合到公共子空间Z，公式如下：

Z＝ω ₁·Z ₁+ω ₂·Z ₂+ω ₃·Z ₃

限制

并定义：

在解码器13中，使用与编码器对称的结构对聚类后的融合特征Z进行解码，得到解码后的数据集。

具体为：为了能更好的学习到原始数据X的特征Z，我们使用与编码器对称的结构解码：

其中，

表示数据集X的重建；

表示解码器模型参数。

在深度嵌入式聚类层14中，对融合特征Z进行聚类，通过对比聚类结果与真实标签得到最终准确率ACC。

具体为：在聚类层借鉴了DEC“J.Xie,R.Girshick,and A.Farhadi,“Unsupervised deep embedding for clustering analysis,”in Proc.Int.Conf.Mach.Learn.,2016,pp.478–487”的思想，将

分成k个类，每个类的中心用μ _j，j＝1，...，k表示表示。对融合特征Z进行聚类，首先初始化聚类中心

之后计算特征点与聚类中心的软分配，计算软分配和辅助分布的KL散度来更新聚类中心μ _j、参数θ和β。

在本实施例中，还包括损失函数。

损失函数由两部分组成：(1)重构损失L _R用来更新编码器，卷积自编码器，卷积变分自编码器网络参数。(2)聚类损失L _C用来更新聚类结果和自编码器参数和自适应融合参数。

重构损失

模型将编码器输入和解码器输出的平方差函数作为重构损失，预训练自编码器，得到一个好的初始化模型：

其中，L _R表示重构损失函数。

聚类损失

根据文献“van der Maaten,Laurens and Hinton,Geoffrey.Visualizing data using t-SNE.JMLR,2008”，我们使用学生t分布作为核函数计算特征点Z _i和聚类中心μ _j：

其中Z _i＝∫(h(x _i))；α表示学生t分布的自由度；q _ij可以解释为将样本i分配给聚类中心j的概率；μ _j′表示每一个中心点；我们通过在辅助目标分布的帮助下从聚类的高可信度分配中学习来迭代地优化聚类，即通过将软分配与目标分布匹配来训练我们的模型。将目标损失函数定义为软分配概率q _ij和辅助分布p _ij之间的KL散度，表示为：

其中，L _C表示聚类损失函数；q _ij表示样本i属于j类的概率；p _ij表示样本i属于j类的目标概率；

通过首先将q _i提高到第二次幂，然后通过每个聚类的频率归一化来计算p _i，表示为：

f _j＝∑ _iq _ij

把训练分为两个阶段，分别是预训练初始化阶段和聚类优化阶段。在预训练初始化阶段，使用下面的损失函数训练模型：

L ₁＝L _R

在聚类优化阶段使用损失函数，表示为：

L ₂＝L _R+L _C

进行聚类时还包括对函数进行优化，具体为：

通过带动量的随机梯度下降算法联合优化聚类中心{μ _j}和网络参数θ，关于每个数据点Z _i和每个类质心μ _j的特征空间嵌入的L梯度计算如下：

梯度

通过反向传播来计算网络参数梯度

为了发现聚类分配，当连续两次迭代之间更改聚类分配的点数小于总点数的一定比例时，则停止聚类。

本实施例通过不同的编码器提取不同的潜在特征，并将特征融合到公共子空间中。经过预训练后，我们得到初始化的自适应特征融合参数β和模型参数θ _m，然后对融合后的公共子空间Z执行K均值聚类初始化聚类中心μ _j。

实施例二

本实施提供的基于自编码器的多模态自适应融合深度聚类模型与实施例一的不同之处在于：

以多个数据集上验证了本实施例提出的模型，并与多个优秀的方法进行比较。

数据集：

MNIST：MNIST数据集由70000个手写数字组成，大小为28x 28像素。这些数字已经居中并进行尺寸规格化，如文献“LeCun,Yann,Bottou,Le′on, Bengio,Yoshua,and Haffner,Patrick.Gradient-based learning applied to document recognition.Proceedings of the IEEE,86(11):2278–2324,1998”。

FASHION-MNIST：包含来自20个类别的7万个时尚产品图片，并且图片大小与MNIST相同，如文献“Xiao,H.；Rasul,K.；and Vollgraf,R.2017.Fashion-mnist:a novel image dataset for benchmarking machine learning algo-rithms.arXiv preprint arXiv:1708.07747”。

COIL-20：收集从不同角度观看的20种类别的1440 128×128灰度对象图像，如文献“Li,F.；Qiao,H.；and Zhang,B.2018.Discriminatively boosted image clustering with fully convolutional auto-encoders.PR 83:161–173”。

数据集具体信息和样本查看表1和图3。

数据集	数量	类别	图像尺寸
MNIST	70000	10	(28,28,1)
FASHION-MNIST	70000	10	(28,28,1)
USPS	9298	10	(16,16,1)
COIL20	1440	20	(128,128,1)

表1数据集信息

评估指标

使用标准的无监督评估指标和协议对其他算法进行评估和比较。对于所有算法，将聚类的数量设置为真实类别的数量，并使用无监督的聚类精度(ACC)评估性能：

其中，l _i是真实标签，C _i是算法产生的聚类分配，m涵盖了聚类和标签之间所有可能的一对一映射。

该指标直观地从无监督算法和基本事实分配中获取聚类分配，然后找到它们之间的最佳匹配。“Kuhn,Harold W.The hungarian method for the assignment problem.Naval research logistics quarterly,2(1-2):83–97,1955”可以有效地计算出最佳映射。

网络配置

采用自编码器，卷积自编码器和卷积变分自动编码器作为用于原始图像的三个单模态深层网络分支，具体网络配置见表2。

表2网络分支结构

算法比较(纵向)

表3三种数据集上不同算法的聚类性能纵向比较算法比较(横向)

表4三种数据集上不同算法的聚类性能横向比较

选择两种单模态聚类方法：K-means，如“J.A.HartiganandM.A.Wong,“AlgorithmAS136:Ak-meansclustering algorithm,”J.Roy.Stat.Soc.C,Appl.Stat.,vol.28,no.1,pp.100–108,1979”，深度嵌入聚类(DEC)，如“J.Xie,R.Girshick,and A.Farhadi,“Unsupervised deep embedding for clustering analysis,”in Proc.Int.Conf.Mach.Learn.,2016,pp.478–487”；传统的大型多模态聚类方法：稳健的多模态K均值聚类(RMKMC)，如“Cai,X.；Nie,F.；and Huang,H.2013.Multi-view k-means clustering on big data.In IJCAI”；两种深层的两模式聚类方法：深度规范相关分析(DCCA)，如“Andrew,G.；Arora,R.；Bilmes,J.；and Livescu,K.2013.Deep canonical correlation analysis.In ICML,1247–1255”，深度规范相关自动编码器(DCCAE)，如“Wang,W.；Arora,R.；Livescu,K.；and Bilmes,J.2016.On deep multi-view representation learning:objectives and opti-mization.arXiv preprint arXiv:1602.01024”；两种深度多模态聚类方法：深度广义典范相关分析(DGCCA)，如“Benton,A.；Khayrallah,H.；Gujral,B.；Reisinger,D.A.；Zhang,S.；and Arora,R.2017.Deep generalized canonical correlation analysis.arXiv preprint arXiv:1702.02519”，深度多模态聚类(DMJC)的联合框架；Deep multimodal sub-space clustering networks.IEEE Journal of Selected Topics in Signal Processing 12(6):1601–1614。作为与本实施例提出的算法比较见表3，本实施例提出的方法也与论文Multi-View Deep Clustering based on AutoEncoder(MDEC)提出的方法做了比较，MDEC使用多视图的线性融合方法对三种视图融合，线性融合方法简单有效，但是无法有效约束三种不同视图特征的权重；而本实施提出的多模态自适应融合通过卷积和softmax函数获得融合参数，并且能通过反向传播来调整每个模态特征的权重，有效的提高了分类准确率。

本实施提出了一种新颖的多模态自适应特征融合深度聚类框架，该框架包括多模态编码器，自适应特征融合网络和深度聚类层。通过多模态编码器和和自适应特征融合层，模型通过非线性映射提取原始数据特征，高维数据降维，优化数据特征公共子空间，最后用KL散度约束子空间聚类。在三个公共数据集上的实验结果证明了本实施例的模型优于几种最新的模型。

实施例三

本实施例提供基于自编码器的多模态自适应融合深度聚类方法，如图4所示，包括：

S11.使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器非线性的映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m；

S12.将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m通过自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；

S13.使用与编码器对称的结构对聚类后的融合特征Z进行解码，得到解码后的重构数据集

S14.对融合特征Z进行聚类，对聚类结果与标签结果对比得到最终准确率ACC。

需要说明的是，本实施例提供的一种基于自动编码器的多模态自适应特征融合深度聚类方法与实施例一类似，在此不多做赘述。

与现有技术相比，本实施例提出了一种新颖的多模态自适应融合深度聚类框架，该框架包括多模态编码器，多模态自适应特征融合网络和深度聚类层。通过多模态编码器和和融合层，模型通过非线性映射提取原始数据特征，高维数据降维，优化数据特征公共子空间，最后用KL散度约束子空间聚类。在三个公共数据集上的实验结果证明了本实施例的模型优于几种最新的模型。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

基于自编码器的多模态自适应融合深度聚类模型，其特征在于，包括编码器、多模态自适应融合层、解码器、深度嵌入式聚类层；所述编码器包括自编码器、卷积自编码器、卷积变分自编码器；

编码器，用于使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器三种非线性映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m；

多模态自适应融合层，与所述编码器连接，用于将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m通过自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；

解码器，与所述多模态自适应融合层连接，用于使用与编码器对称的结构对融合后的特征Z进行解码，得到解码后的重构数据集

深度嵌入式聚类层，与所述多模态自适应融合层连接，用于对融合特征Z进行聚类，通过对比聚类结果与真实标签得到最终准确率ACC。
根据权利要求1所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述编码器中分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m，表示为：

Z _m＝h(X；θ _m)

其中，θ _m表示编码器模型参数；m表示编码器序列，取值范围为{1，2，3}。
根据权利要求2所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述多模态自适应融合层中得到的融合特征Z，表示为：

Z＝ω ₁·Z ₁+ω ₂·Z ₂+ω ₃·Z ₃

其中，ω _m表示第m个模态的特征的重要性权重，由网络自适应的学习，得到自适应特征融合参数；

限制
并定义：

其中，ω _m分别通过使用β _m作为控制参数的softmax函数定义；在不同模态特征上分别使用1×1卷积计算权重标量β _m，通过标准反向传播来学习。
根据权利要求3所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述解码器中得到解码后的重构数据集
表示为：

其中，
表示解码器模型参数。
根据权利要求4所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述深度嵌入式聚类层中对融合特征Z进行聚类具体为：

将n个点
分成k个类，每个类的中心用μ _j，j＝1，...，k，初始化聚类中心
并计算特征点与聚类中心的软分配q _ij和辅助分布p _i，最终用软分配q _ij和辅助分布p _i的KL散度来定义聚类损失函数，并更新聚类中心μ _j、编码器、解码器参数θ和自适应特征融合参数β。
根据权利要求5所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述编码器中还包括利用重构损失来更新自编码器、卷积自编码器、卷积变分自编码器的网络参数；具体为将编码器输入原始数据x _i和解码器输出重构数据
的平方差函数作为重构损失，预训练编码器，得到初始化模型，表示为：

其中，L _R表示重构损失函数。
根据权利要求6所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述深度嵌入式聚类层中还包括利用聚类损失KL散度来更新聚类结果、编码器参数和融合参数；具体为：

使用学生t分布作为核函数计算特征点Z _i和聚类中心μ _j相似度，表示为：

其中，Z _i＝∫(h(x _i))∈Z；α表示学生t分布的自由度；q _ij表示将样本i分配给聚类中心μ _j的概率；μ _j′表示每一个中心点；

通过在辅助目标分布的帮助下从聚类的高可信度分配中学习来迭代地优化聚类，即通过将软分配与目标分布匹配来训练模型；将目标损失函数定义为软分配概率q _i和辅助分布p _i之间的KL散度，表示为：

f _j＝∑ _iq _ij

其中，L _C表示聚类损失函；f _j＝∑ _iq _ij表示软聚类频率。
根据权利要求7所述的基于自编码器的多模态自适应融合深度聚类模型，其特征在于，所述深度嵌入式聚类层还包括：

通过带动量的随机梯度下降算法联合优化聚类中心μ _j，网络参数θ和自适应特征融合参数β，关于每个数据点Z _i和每个聚类中心μ _j的特征空间嵌入的L梯度计算如下：

其中，梯度
通过反向传播来计算网络参数梯度
当连续两次迭代之间更改聚类分配的点数小于总点数的预设比例时，则停止聚类。
基于自编码器的多模态自适应融合深度聚类方法，其特征在于，包括：

S1.使数据集X分别通过自编码器、卷积自编码器、卷积变分自编码器非线性的映射h(X；θ _m)，分别得到自编码器、卷积自编码器、卷积变分自编码器的潜在特征Z _m；

S2.将自编码器、卷积自编码器、卷积变分自编码器分别得到的潜在特征Z _m以自适应空间特征融合方式融合到公共子空间中，得到融合特征Z；

S3.使用与编码器对称的结构对聚类后的融合特征Z进行解码，得到解码后的数据集

S4.对自适应融合特征Z进行聚类，通过对比聚类结果与真实标签得到最终准确率ACC。
根据权利要求9所述的基于自编码器的多模态自适应融合深度聚类方法，其特征在于，所述步骤S2中得到融合特征Z，表示为：

Z＝ω ₁·Z ₁+ω ₂·Z ₂+ω ₃·Z ₃

其中，ω _m表示第m个模态的特征的重要性权重，由网络自适应的学习，得到自适应特征融合参数；

限制
并定义：

其中，ω _m分别通过使用β _m作为控制参数的softmax函数定义；在不同模态特征上分别使用1×1卷积计算权重标量β _m，通过标准反向传播来学习。