CN114882288B

CN114882288B - 基于分层图增强堆叠自编码器的多视图图像分类方法

Info

Publication number: CN114882288B
Application number: CN202210578371.2A
Authority: CN
Inventors: 苟建平; 谢楠楠; 刘金华; 王智; 欧卫华; 陈雯柏
Original assignee: Jiangsu University
Current assignee: Jiangsu University
Priority date: 2022-05-25
Filing date: 2022-05-25
Publication date: 2023-06-06
Anticipated expiration: 2042-05-25
Also published as: CN114882288A

Abstract

本发明公开了一种基于分层图增强堆叠自编码器的多视图图像分类方法，涉及基于图增强的多视图图像分类方法及系统，其目的在于解决上述现有技术存在的无法提取多视图图像的各个视图的特征并将学习到的特征进行融合的技术问题。本发明提出一种基于分层图增强堆叠自编码器的多视图图像分类方法及系统，考虑到多视图数据的几何结构以及不同视图之间的互补性和一致性；一个分层的图结构被引入到自编码器中去学习特定视图的表示，保持了多视图数据的局部和非局部的几何结构；在学习到具有几何结构特性的各个视图的特征表示后，通过使用全连接神经网络重构出每个单一视图，公共表示能够被学习；还能自动平衡多个视图之间的互补性和一致性。

Description

基于分层图增强堆叠自编码器的多视图图像分类方法

技术领域

本发明属于图像分类技术领域，尤其涉及多视图图像分类技术领域，更具体的是涉及一种基于图增强的多视图图像分类方法。

背景技术

随着深度学习的快速发展，各种各样的深度模型被提出。自编码器(AE)作为最具代表性的深度学习算法之一，已成功应用于计算机视觉、语音识别和自然语言处理等诸多领域。自编码器是一种无监督学习的方法，其目的是最小化输入和相应的重构输出之间的重构误差。基于原始数据的几何结构在特征表示中的重要作用，一些流形学习算法被引入到自编码器中。例如，NLSP-SAE考虑到数据的非局部和局部的几何结构，确保了在原始空间中相邻的样本在重构空间中离得更近，不相邻的样本离得更远。然而，在视觉任务中，有时仅使用单个视图是不能满足需求的。因此，多视图的概念被引出，即对于同一事物可以从不同的途径或不同的角度对其进行描述。例如，同一个物体从不同角度拍摄的图片；同一语义的不同语言的表达；即使是对于同一张图片，也可以采取不同的特征提取方式构成多个视图。近年来，随着多视图数据在实际中的广泛应用，多视图表示学习受到了广泛的关注。与单视图表示学习不同，多视图表示学习的关键是从不同的视图中学习一个公共表示。其中，自编码器也被引入到多视图表示学习中。AE²-Nets考虑多视图表示学习过程中多视图数据的相关性和互补性，通过使用嵌套的自编码器框架将来自异构数据源的信息集成到完整的表示中，并且自动地平衡了不同视图之间的一致性和互补性。

随着科技的不断进步，图像分类在很多领域有广泛应用。包括安防领域的人脸识别和智能视频分析，以及医学领域的图像识别等。图像分类是计算机视觉中重要的基本问题，也是图像检测、图像分割、物体跟踪、行为识别等其他高层视觉任务的基础。然而，传统的单一视图的数据已经不能满足当前图像分类的需求，需要一种适用于多视图图像分类的方法。所谓的多视图图像，是指由同一目标对象的不同视角图像构成的，其对目标对象的表述比传统的单视图图像更加形象。多视图图像分类是从多个视角对整个图像进行描述，然后使用分类器判别物体类别。因此如何提取各个视图的特征以及将学习到的各个视图的特征加以融合是至关重要的。

发明内容

本发明的目的在于：为了解决上述现有技术存在的无法提取多视图图像的各个视图的特征并将学习到的特征进行融合的技术问题，本发明提供一种基于分层图增强堆叠自编码器的多视图图像分类方法。

本发明为了实现上述目的具体采用以下技术方案：

一种基于分层图增强堆叠自编码器的多视图图像分类方法，包括如下步骤：

步骤S1，样本采集

采集多视图样本χ＝{X⁽¹⁾，X⁽²⁾，...，X^(V)}，并进行归一化处理；

其中

N为样本个数，d_v为第v个视图的维度，V表示视图个数；

步骤S2，构建模型

构建用于自编码器网络模型，自编码器网络模型包括自编码器和全连接神经网络；令第v个视图在自编码器的参数为

在全连接神经网络中的参数为/>

初始化所有视图在自编码器中的参数

以及在全连接神经网络中的参数/>

和公共表示H；

其中l表示自编码器的第l层，L表示自编码器的总层数；m表示全连接神经网络的第m层，M表示全连接神经网络的总层数；v表示第v个视图，V表示视图个数；

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第I层解码部分的权重和偏置；/>

表示第v个视图在全连接神经网络第m层中的权重和偏置；

步骤S3，模型训练

将步骤S1归一化处理后的样本数据输入到自编码器网络模型中，样本数据输入自编码器并获取到每个视图的表示Z，全连接神经网络从初始化的公共表示H中重构出每个视图的表示C，全连接神经网络计算表示Z和表示C之间的损失，并优化、更新全连接神经网络的参数以及公共表示H，直至自编码器网络模型收敛；

步骤S4，实时分类

将实时多视图数据输入经步骤S3训练后的自编码器网络模型中，得到实时的公共表示H，将公共表示H输入到分类器中，对实时多视图数据进行分类，得到分类结果。

作为优选，步骤S3包括：

步骤S3.1，自编码器网络模型中的编码器为图增强堆叠自编码器，图增强堆叠自编码器包括多个图增强编码-解码结构并以分层的方式堆叠而成，将步骤S1归一化处理后的样本数据输入到图增强堆叠自编码器中进行训练，获取到每个视图的表示Z^(L，v)；

步骤S3.2，随机初始化公共表示H，令全连接神经网络的输入为C^(0，v)＝H，从公共表示H中重构出每个单一视图的表示C^(M，v)，再根据图增强堆叠自编码器网络中学习到的表示Z^(L，v)、和表示C^(M，v)，通过最小化目标函数J_c，分别对全连接神经网络的参数

公共表示H进行更新；

其中最小化目标函数J_c为：

步骤S3.3，重复步骤S3.1-S3.2，直至图增强堆叠自编码器网络收敛。

作为优选，步骤S3.1中，具体步骤为：

步骤S3.1.1，将步骤S1归一化处理后的样本数据输入到图增强堆叠自编码器进行分层预训练，直到最后一层预训练完成；

步骤S3.1.2，基于步骤S3.1.1预训练获得的参数，通过最小化微调目标函数，微调图增强堆叠自编码器的参数。

作为优选，步骤S3.1.1中，步骤S3.1.1中，对于第v个视图来说，第l一1层学习到的表示Z^(l-1，v)作为第l层的输入；第一层的输入为原始数据，即Z^(0，v)＝X^(v)；记第v个视图的第l层参数为Θ_ae ^(l，v)＝{W_* ^(l，v)，b_* ^(l，v)}*∈{e，d}，其中

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第I层解码部分的权重和偏置；；通过最小化目标函数，每个视图的第l层被预训练，直到最后一层预训练完成；

最小化目标函数为：

其中，第一项为重构损失，第二项为局部图正则化项，第三步为非局部图正则化项；Θ_ae ^(l，v)为第v个视图在自编码器第l层的参数，λ_L和λ_N分别是局部和非局部正则化项的调节参数；tr()为矩阵的迹；Z^(l-1，v)、Z^(l，v)分别为第l-1、l层学习到的表示，Z^(l-1，v)作为第l层的输入，

为第l层输入Z^(l-1，v)的重构，^L+(l，v)＝D^+(l，v)-W^+(l，v)是第v个视图第l层的局部结构拉普拉斯矩阵，D^+(l，v)是第v个视图第l层的局部结构对角矩阵，该对角矩阵中的每个元素可表示为/>

W^+(l，v)是第v个视图第l层的局部结构权重矩阵，该权重矩阵中的每个元素可以表示为/>

L^-(l，v)＝D^-(l，v)-W^-(l，v)是第v个视图第l层的非局部结构拉普拉斯矩阵，D^-(l，v)是第v个视图第l层的非局部结构对角矩阵，该对角矩阵中的每个元素可以表示为/>

W^-(l，v)是第v个视图第l层的非局部结构权重矩阵，该权重矩阵中的每个元素可以表示为/>

给定第v个视图的第l层的输入Z^(l-1，v)，对于每个视图来说，我们使用K近邻方法构造样本表示点的局部邻接图；也就是说，对于每个表示点，通过计算欧氏距离来选择最近的K个表示点作为它的邻居点去构造邻接图。

5.如权利要求4所述的一种基于分层图增强堆叠自编码器的多视图图像分类方法，其特征在于，第v个视图的第l层输入的第i个表示点z_i ^(l-1，v)(i＝1，...N，N为总样本数)和它的邻居点z_j ^(l-1，v)之间的权重

通过热核函数计算：/>

其中，

是输入的第i个表示点z_i ^(l-1，v)的K个近邻点的集合，t是调节参数；

同样地，在选取了K个邻居点后，剩下的点作为z_i ^(l-1，v)的非邻居点去构造非邻接图；z_i ^(l-1，v)和它的非邻居点z_j ^(l-1，v)之间的权重

通过热核函数计算：

关于邻居点与非邻居点都采用了Z_j ^(l-1，v)进行表示，在Z_j ^(l-1，v)中j的范围为1-N，N为总样本数，当分别表示邻居点和非邻居点时，j的取值是不同的；当j的值为1-k(k为邻居节点的个数)时，表示的是邻居节点；当j的值为k+1-N时，表示的是非邻居节点。

作为优选，步骤S3.1.2中，最小化微调目标函数为：

其中，λ是平衡参数，X^(v)是输入的第v个视图，

是第v个视图原始输入数据的重构，V表示视图个数，Z^(L，v)是学习到的每个视图的最终表示，C^(M，v)是从公共表示中重构出来的视图表示；第一项为原始输入和重构输出的重构损失，第二项为最深层的表示和从公共表示中重构出来的表示之间的重构损失；值得注意的是，最深层的表示和从公共表示中重构出来的表示之间的重构损失也被用于去约束图增强堆叠自编码器的微调过程；当全连接神经网络的参数和公共表示被训练后，也被反过来去约束图增强堆叠自编码器的参数的优化。

一种基于分层图增强堆叠自编码器的多视图图像分类系统，包括：

样本采集模块，用于采集多视图样本χ＝{X⁽¹⁾，X⁽²⁾，...，X^(V)}，并进行归一化处理；

其中

N为样本个数，d_v为第v个视图的维度，V表示视图个数；

构建模型模块，用于构建自编码器网络模型，自编码器网络模型包括自编码器和全连接神经网络；令第v个视图在自编码器的参数为

在全连接神经网络中的参数为/>

初始化所有视图在自编码器中的参数/>

以及在全连接神经网络中的参数/>

和公共表示H；

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第I层解码部分的权重和偏置；/>

表示第v个视图在全连接神经网络第m层中的权重和偏置；

模型训练模块，用于将样本采集模块归一化处理后的样本数据输入到自编码器网络模型中，样本数据输入自编码器并获取到每个视图的表示Z，全连接神经网络从初始化的公共表示H中重构出每个视图的表示C，全连接神经网络计算表示Z和表示C之间的损失，并优化、更新全连接神经网络的参数以及公共表示H，直至自编码器网络模型收敛；

实时分类模块，用于将实时多视图数据输入经模型训练模块训练后的自编码器网络模型中，得到实时的公共表示H，将公共表示H输入到分类器中，对实时多视图数据进行分类，得到分类结果。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行上述基于分层图增强堆叠自编码器的多视图图像分类方法的步骤。

一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行上述基于分层图增强堆叠自编码器的多视图图像分类方法的步骤。

本发明的有益效果如下：

本发明提出了一种基于分层图增强堆叠自编码器的多视图图像分类方法，考虑到多视图数据的几何结构以及不同视图之间的互补性和一致性；一个分层的图结构被引入到自编码器中去学习特定视图的表示，保持了多视图数据的局部和非局部的几何结构；在学习到具有几何结构特性的各个视图的特征表示后，通过使用全连接神经网络重构出每个单一视图，公共表示能够被学习；因此，针对多视图图像分类问题发明的分层图增强堆叠自编码器不仅能够保持多视图数据的几何结构，还能自动平衡多个视图之间的互补性和一致性。

附图说明

图1是本发明的流程示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1所示，本实施例提供了一种基于分层图增强堆叠自编码器的多视图图像分类方法，包括如下步骤：

步骤S1，样本采集

其中

N为样本个数，d_v为第v个视图的维度，V表示视图个数；

步骤S2，构建模型

构建自编码器网络模型，自编码器网络模型包括自编码器和全连接神经网络；令第v个视图在自编码器的参数为

在全连接神经网络中的参数为/>

初始化所有视图在自编码器中的参数

以及在全连接神经网络中的参数/>

和公共表示H：

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第I层解码部分的权重和偏置；/>

表示第v个视图在全连接神经网络第m层中的权重和偏置；

步骤S3，模型训练

该模型训练分为图增强特定视图的表示学习和公共表示学习两个步骤，具体如下：

步骤S3.1，为了能够在保持数据的局部和非局部几何结构的同时，获取多视图数据深层结构的特性，本实施例设计了图增强堆叠自编码器。即该自编码器网络模型中的编码器为图增强堆叠自编码器，图增强堆叠自编码器包括多个图增强编码-解码结构并以分层的方式堆叠而成，将步骤S1归一化处理后的样本数据输入到图增强堆叠自编码器中进行训练，获取到每个视图的表示Z^(L，v)；

图增强特定视图的表示学习包括层层预训练阶段和微调阶段，具体如下：

步骤S3.1.1中，预训练阶段，将给定的多视图数据输入到图增强堆叠自编码器中进行分层预训练。对于第v个视图来说，第l-1层学习到的表示Z^(l-1，v)作为第l层的输入；第一层的输入为原始数据，即Z^(0，v)＝X^(v)；记第v个视图的第l层参数为Θ_ae ^(l，v)＝{W_* ^(l，v)，b_* ^(l，v)}，^*∈{e，d}，其中

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

最小化目标函数为：

为第l层输入Z^(l-1，v)的重构，L^+(l，v)＝D^+(l，v)-W^+(l，v)是第v个视图第l层的局部结构拉普拉斯矩阵，D^+(l，v)是第v个视图第l层的局部结构对角矩阵，该对角矩阵中的每个元素可表示为/>

第v个视图的第l层输入的第i个表示点z_i ^(l-1，v)(i＝1，…N，N为总样本数)和它的邻居点z_j ^(l-1，v)之间的权重

通过热核函数计算：/>

其中，

通过热核函数计算：

步骤S3.1.2，微调阶段，基于步骤S3.1.1预训练获得的参数被用作微调阶段的初始权重，使用最深层的表示Z^(L，v)去重构原始的输入；通过最小化微调目标函数，微调图增强堆叠自编码器的参数。

步骤S3.1.2中，最小化微调目标函数为：

其中，λ是平衡参数，X^(v)是输入的第v个视图，

步骤S3.2，公共表示学习，基于在图增强堆叠自编码器中学习到的特定视图的表示，我们旨在于将他们编码成一个公共的表示

d_H是H的维度。假设通过使用具有M层的全连接神经网络，每个单一视图都能够从公共表示中重构出来，记全连接神经网络中所有的参数为/>

步骤S3.2，随机初始化公共表示H，令全连接神经网络的输入为C^(0，v)＝H，从公共表示H中重构出每个单一视图的表示C^(M，v)，再根据图增强堆叠自编码器网络中学习到的表示Z^(L，v)、和表示C^(M，v)，通过最小化目标函数J_c，分别对全连接神经网络的参数/>

公共表示H进行更新‘

其中最小化目标函数J_c为：

训练数据集为100Leaves图像数据集，该数据集包含100中不同的树叶图像，每类树叶的图像数量为16张，共计1600张树叶图像，形状描述和纹理直方图特征被选为两个视图作为输入数据。随机选取数据集的80％作为训练集，20％作为测试集，使用KNN作为分类器。基于图自编码器的单视图方法在100Leaves数据集的两个视图上的精度分别为85.62％和86.87％；基于自编码器的多视图方法在该数据集上的精度为94.16％。而本实施例中的分层图增强堆叠自编码器在100Leaves数据集上的精度为96.23％，相比基于图自编码器的单视图方法和基于自编码器的多视图方法，本申请的方法有了明显的提升，验证了所提方法的有效性。

步骤S4，实时分类

实施例2

本实施例还提供一种基于分层图增强堆叠自编码器的多视图图像分类系统，包括样本采集模块、构建模型模型、模型训练模块、实时分类模块，具体为：

其中

N为样本个数，d_v为第v个视图的维度，V表示视图个数；

构建模型模型，用于构建自编码器网络模型，自编码器网络模型包括自编码器和全连接神经网络；令第v个视图在自编码器的参数为

在全连接神经网络中的参数为

初始化所有视图在自编码器中的参数/>

以及在全连接神经网络中的参数/>

和公共表示H；

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第I层解码部分的权重和偏置；/>

表示第v个视图在全连接神经网络第m层中的权重和偏置；/>

模型训练模块，用于将步骤S1归一化处理后的样本数据输入到自编码器网络模型中，样本数据输入自编码器并获取到每个视图的表示Z，全连接神经网络从初始化的公共表示H中重构出每个视图的表示C，全连接神经网络计算表示Z和表示C之间的损失，并优化、更新全连接神经网络的参数以及公共表示H，直至自编码器网络模型收敛；

为了能够在保持数据的局部和非局部几何结构的同时，获取多视图数据深层结构的特性，本实施例设计了图增强堆叠自编码器。即该自编码器网络模型中的编码器为图增强堆叠自编码器，图增强堆叠自编码器包括多个图增强编码-解码结构并以分层的方式堆叠而成，将步骤S1归一化处理后的样本数据输入到图增强堆叠自编码器中进行训练，获取到每个视图的表示Z^(L，v)；

将样本采集模块归一化处理后的样本数据输入到图增强堆叠自编码器进行分层预训练，直到最后一层预训练完成；

预训练阶段，将给定的多视图数据输入到图增强堆叠自编码器中进行分层预训练。对于第v个视图来说，第l-1层学习到的表示Z^(l-1，v)作为第l层的输入；第一层的输入为原始数据，即Z^(0，v)＝X^(v)；记第v个视图的第l层参数为Θ_ae ^(l，v)＝{W_* ^(l，v)，b_* ^(l，v)}，*∈{e，d}，其中

表示第v个视图在自编码器的第I层编码部分的权重和偏置，/>

最小化目标函数为：

其中，第一项为重构损失，第二项为局部图正则化项，第三步为非局部图正则化项；Θ_ae ^(l，v)为第v个视图在自编码器第l层的参数，λ_L和λ_N分别是局部和非局部正则化项的调节参数；tr()为矩阵的迹；Z^(l-1，v)、Z^(l，v)分别为第l一1、l层学习到的表示，Z^(l-1，v)作为第l层的输入，

通过热核函数计算：

其中，

通过热核函数计算：

微调阶段，基于步骤S3.1.1预训练获得的参数被用作微调阶段的初始权重，使用最深层的表示Z^(L，v)去重构原始的输入；通过最小化微调目标函数，微调图增强堆叠自编码器的参数。

最小化微调目标函数为：

其中，λ是平衡参数，X^(v)是输入的第v个视图，

公共表示学习，基于在图增强堆叠自编码器中学习到的特定视图的表示，我们旨在于将他们编码成一个公共的表示

随机初始化公共表示H，令全连接神经网络的输入为C^(0，v)＝H，从公共表示H中重构出每个单一视图的表示C^(M，v)，再根据图增强堆叠自编码器网络中学习到的表示Z^(L，v)、和表示C^(M，v)，通过最小化目标函数J_c，分别对全连接神经网络的参数/>

公共表示H进行更新；

其中最小化目标函数J_c为：

重复训练，直至图增强堆叠自编码器网络收敛。

实时分类模块，用于将实时多视图数据输入经步骤S3训练后的自编码器网络模型中，得到实时的公共表示H，将公共表示H输入到分类器中，对实时多视图数据进行分类，得到分类结果。

实施例3

本实施例还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述基于分层图增强堆叠自编码器的多视图图像分类方法的步骤。

其中，所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器可以是所述计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，所述存储器也可以是所述计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。当然，所述存储器还可以既包括所述计算机设备的内部存储单元也包括其外部存储设备。本实施例中，所述存储器常用于存储安装于所述计算机设备的操作系统和各类应用软件，例如运行所述基于分层图增强堆叠自编码器的多视图图像分类方法的程序代码等。此外，所述存储器还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器通常用于控制所述计算机设备的总体操作。本实施例中，所述处理器用于运行所述存储器中存储的程序代码或者处理数据，例如运行所述基于分层图增强堆叠自编码器的多视图图像分类方法的程序代码。

实施例4

本实施例还提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述基于分层图增强堆叠自编码器的多视图图像分类方法的步骤。

其中，所述计算机可读存储介质存储有界面显示程序，所述界面显示程序可被至少一个处理器执行，以使所述至少一个处理器执行基于分层图增强堆叠自编码器的多视图图像分类方法的步骤。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器或者网络设备等)执行本申请各个实施例所述的方法。

Claims

1.一种基于分层图增强堆叠自编码器的多视图图像分类方法，其特征在于，包括如下步骤：

步骤S1，样本采集；

采集多视图样本

，并进行归一化处理；

其中

，N为样本个数，/>

为第v个视图的维度，V表示视图个数；

步骤S2，构建模型；

，在全连接神经网络中的参数为/>

，初始化所有视图在自编码器中的参数/>

、以及在全连接神经网络中的参数/>

和公共表示H；

其中

表示自编码器的第/>

层，L表示自编码器的总层数；m表示全连接神经网络的第m层，M表示全连接神经网络的总层数；v表示第v个视图，V表示视图个数；/>

表示第v个视图在自编码器的第l层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第l层解码部分的权重和偏置；/>

表示第v个视图在全连接神经网络第m层中的权重和偏置；

步骤S3，模型训练；

步骤S4，实时分类；

将实时多视图数据输入经步骤S3训练后的自编码器网络模型中，得到实时的公共表示H，将公共表示H输入到分类器中，对实时多视图数据进行分类，得到分类结果；

步骤S3包括：

步骤S3.1，自编码器网络模型中的编码器为图增强堆叠自编码器，图增强堆叠自编码器包括多个图增强编码-解码结构并以分层的方式堆叠而成，将步骤S1归一化处理后的样本数据输入到图增强堆叠自编码器中进行训练，获取到每个视图的表示

；

步骤S3.2，随机初始化公共表示H，令全连接神经网络的输入为

，从公共表示H中重构出每个单一视图的表示/>

，再根据图增强堆叠自编码器网络中学习到的表示

、和表示/>

，通过最小化目标函数/>

，分别对全连接神经网络的参数

、公共表示H进行更新；/>

其中最小化目标函数

为：

；

步骤S3.3，重复步骤S3.1-S3.2,直至图增强堆叠自编码器网络收敛；

步骤S3.1中，具体步骤为：

步骤S3.1.2，基于步骤S3.1.1预训练获得的参数，通过最小化微调目标函数，微调图增强堆叠自编码器的参数；

步骤S3.1.1中，对于第

个视图来说，第/>

层学习到的表示/>

作为第/>

层的输入；第一层的输入为原始数据，即/>

；记第/>

个视图的第/>

层参数为

，/>

，其中/>

表示第v个视图在自编码器的第l层编码部分的权重和偏置，/>

表示第v个视图在自编码器的第l层解码部分的权重和偏置；通过最小化目标函数，每个视图的第/>

层被预训练，直到最后一层预训练完成;

最小化目标函数为：

其中，第一项为重构损失，第二项为局部图正则化项，第三步为非局部图正则化项；

为第/>

个视图在自编码器第/>

层的参数，/>

和/>

分别是局部和非局部正则化项的调节参数；tr( )为矩阵的迹；/>

、/>

分别为第/>

、/>

层学习到的表示，/>

作为第/>

层的输入，/>

为第/>

层输入/>

的重构，/>

是第v个视图第/>

层的局部结构拉普拉斯矩阵， />

是第v个视图第/>

层的局部结构对角矩阵，该对角矩阵中的每个元素可表示为

;/>

是第v个视图第/>

层的局部结构权重矩阵，该权重矩阵中的每个元素可以表示为/>

；/>

是第v个视图第/>

层的非局部结构拉普拉斯矩阵， />

是第v个视图第/>

层的非局部结构对角矩阵，该对角矩阵中的每个元素可以表示为/>

，/>

是第v个视图第/>

层的非局部结构权重矩阵，该权重矩阵中的每个元素可以表示为/>

；给定第v个视图的第/>

层的输入/>

，对于每个视图来说，使用K 近邻方法构造样本表示点的局部邻接图;也就是说，对于每个表示点，通过计算欧氏距离来选择最近的K个表示点作为它的邻居点去构造邻接图。

2.如权利要求1所述的一种基于分层图增强堆叠自编码器的多视图图像分类方法，其特征在于，第v个视图的第

层输入的第i个表示点/>

（i=1,…N,N为总样本数）和它的邻居点/>

之间的权重/>

通过热核函数计算：

其中，

是输入的第i个表示点/>

的K个近邻点的集合，/>

是调节参数；

同样地，在选取了K个邻居点后，剩下的点作为

的非邻居点去构造非邻接图；

和它的非邻居点/>

之间的权重/>

通过热核函数计算：

。

3.如权利要求1所述的一种基于分层图增强堆叠自编码器的多视图图像分类方法，其特征在于，步骤S3.1.2中，最小化微调目标函数为：

其中，

是平衡参数，/>

是输入的第v个视图，/>

是第v个视图原始输入数据的重构，V表示视图个数，/>

是学习到的每个视图的最终表示，/>

是从公共表示中重构出来的视图表示；第一项为原始输入和重构输出的重构损失，第二项为最深层的表示和从公共表示中重构出来的表示之间的重构损失；值得注意的是，最深层的表示和从公共表示中重构出来的表示之间的重构损失也被用于去约束图增强堆叠自编码器的微调过程；当全连接神经网络的参数和公共表示被训练后，也被反过来去约束图增强堆叠自编码器的参数的优化。

4.一种基于分层图增强堆叠自编码器的多视图图像分类系统，其特征在于，包括：

样本采集模块，用于采集多视图样本