CN117542057B

CN117542057B - 一种基于模块化网络建模视角间关系的多视角聚类方法

Info

Publication number: CN117542057B
Application number: CN202410029931.8A
Authority: CN
Inventors: 刘如一; 孙玉宝
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2024-01-09
Filing date: 2024-01-09
Publication date: 2024-04-05
Anticipated expiration: 2044-01-09
Also published as: CN117542057A

Abstract

本发明公开了一种基于模块化网络建模视角间关系的多视角聚类方法，该方法包括以下步骤：通过提取数据不同视角的特征，构建多视角数据库；构建基于模块化的编码器‑解码器神经网络提取并训练得到多视角数据的统一表达；将统一表达进行转换并构造辅助优化目标函数；基于上述目标函数对模块化的编码器‑解码器中的编码器进行再优化获得优化的多视角数据统一表达；对多视角数据统一表达进行聚类得到多视角聚类结果。本发明利用模块化的编码器‑解码器神经网络进行多视角数据的统一表达获取，可以灵活且有效地建模多视角数据之间的关系，通过辅助优化目标函数进行编码器的优化，将进一步提升多视角聚类的性能。

Description

一种基于模块化网络建模视角间关系的多视角聚类方法

技术领域

本发明涉及模式识别技术领域，具体涉及一种基于模块化网络建模视角间关系的多视角聚类方法。

背景技术

现实世界的数据往往呈现出多视角的特性，例如对事件的描述可以通过文本以及图像进行刻画，图像数据往往可以通过不同的视觉描述算子如SIFT、GIST进行表示，文本可以通过各种词袋特征如BoW、TF-IDF进行表示。对多视角数据分析往往可以利用多视角数据表现出来的互补与一致特性提升性能，因此多视角数据分析受到研究者的广泛关注。多视角聚类，作为一种典型的无监督学习任务，通过将不同数据聚集到不同类别中，在现实世界巨大的无标注数据处理中具有重要的作用。为进行有效的多视角聚类，一般需要对多视角数据之间的互补与一致特性进行建模，但是现有的方法往往基于特定假设进行多视角统一表达的学习，难以应对各种数据表现特性的多视角聚类任务，不能有效地实现多视角数据间关系灵活的建模，需要提出更有效且灵活的多视角关系建模算法。

发明内容

发明目的：为了克服现有技术中存在的不足，本发明提供一种基于模块化网络建模视角间关系的多视角聚类方法。该方法利用模块化的编码器-解码器神经网络进行多视角数据的统一表达获取，可以灵活且有效地建模多视角数据之间的关系，通过辅助优化目标函数进行编码器的优化，将进一步提升多视角聚类的性能。

为实现上述目的，本发明采用的技术方案为：一种基于模块化网络建模视角间关系的多视角聚类方法，包括以下步骤：

步骤S1，对于给定的数据样本，根据样本的类型提取数据的多个视角的特征，构成多视角数据集；

步骤S2，构建基于模块化的编码器-解码器神经网络进行多视角数据的统一表达建模，通过最小化多个视角的编解码误差训练得到多视角数据的统一表达；

步骤S3，根据所述步骤S2中的多视角统一表达进行辅助优化目标函数的构建；

步骤S4，基于所述步骤S3中的辅助优化目标函数通过最小化该目标函数优化多视角的编码器，进而获得优化的多视角数据统一表达；

步骤S5，对所述多视角数据统一表达进行聚类获得多视角数据的聚类结果。

作为本发明的一种优选实施方式：所述样本的类型包括图像数据、文本数据和图像文本数据；

对于图像数据，采用提取图像的不同视觉描述子构成多视角数据；

对于文本数据，采用提取文本的不同词袋模型特征构成多视角数据；

对于图像文本数据，则分别提取图像的视角描述子与文本的词袋模型特征构成多视角数据。

作为本发明的一种优选实施方式：所述步骤S2中的模块化的编码器-解码器神经网络包括多视角编码器模块与多视角解码器模块，其中，多视角编码器模块由视角独立编码模块与模块化编码模块组成，多视角解码器模块与编码器模块对称设计，由视角独立解码模块与模块化解码模块组成。

作为本发明的一种优选实施方式：所述步骤S2具体包括以下步骤：

步骤S2.1，将多视角数据送入视角独立编码模块后得到模块化编码模块的输入，各视角独立编码后各个视角特征维度相同；

步骤S2.2，求各个视角经过模块化编码模块后的表达，其中模块化编码模块由层组成，每层包含个模块，第视角下第层第模块计算为：

其中，为第视角下第层模块与第层模块之间的权重系数，为层模块的计算权重，所有视角共享, 为第视角下第层模块的输入，ReLu为激活函数。上述计算权重为待学习参数，权重系数计算方式为：

其中为层与层的权重矩阵，为层的计算权重，所有视角共享，为待学习参数，第层输出即为各个视角经过模块化编码模块后的表达：

步骤S2.3多视角统一表达为各个视角表达加权平均：

其中，为总的视角个数。

步骤S2.4 以与多视角编码器对称的方式构造多视角解码器，各个视角输入经过编码器-编解码神经网络获得解码输出，通过最小化目标函数获得，进而获得：

作为本发明的一种优选实施方式：所述步骤S2中, 计算为：

其中为视角独立编码后的输出。

作为本发明的一种优选实施方式：所述步骤S3具体包括以下步骤：步骤S3.1 将多视角统一表达送K均值聚类算法获得个聚类中心以及每个样本属于各个聚类的概率，样本属于聚类的概率为：

步骤S3.2 依据构造辅助变量：

步骤S3.3 构造辅助优化目标函数:

作为本发明的一种优选实施方式：步骤S4中辅助优化目标函数最小化时仅优化编码器权重参数，优化完成计算获得多视角统一表达。

作为本发明的一种优选实施方式：所述步骤S5中的聚类为标准的谱聚类算法完成最终的聚类。

本发明相比现有技术，具有以下有益效果：

该方法利用模块化的编码器-解码器神经网络进行多视角数据的统一表达获取，可以灵活且有效地建模多视角数据之间的关系，通过辅助优化目标函数进行编码器的优化，将进一步提升多视角聚类的性能。

附图说明

图1为模块化网络建模视角间关系的多视角聚类方法的编码器-解码器神经网络结构示意图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

图1是本发明本发明基于模块化网络建模视角间关系的多视角聚类方法的编码器-解码器神经网络结构示意图，参考此图，该方法包括以下步骤：

步骤S1，对于给定的数据样本，根据样本的类型提取数据的多个视角的特征，构成多视角数据集。

所述样本的类型一般为图像数据、文本数据或者图像文本数据，对于图像提取图像的不同视觉描述子如SIFT、GIST构成多视角数据，对于文本提取文本的不同词袋模型特征如BoW、TF-IDF构成多视角数据集，对于图像文本则分别提取图像的视角描述子与文本的词袋模型特征构成多视角数据。

步骤S2，构建基于模块化的编码器-解码器神经网络进行多视角数据的统一表达建模，通过最小化多个视角的编解码误差训练得到多视角数据的统一表达。

该步骤包含以下子步骤：

步骤S2.1，将多视角数据送入视角独立编码模块后得到模块化编码模块的输入，各视角独立编码后各个视角特征维度相同。其中视角独立编码模块每个视角均为全连接网络，输出维度如256.

步骤S2.3，多视角统一表达为各个视角表达加权平均：

其中，为总的视角个数。

步骤S2.4 以对称多视角编码器的方式构造多视角解码器，各个视角输入经过编码器-编解码神经网络获得解码输出，通过最小化目标函数获得，进而获得：

在上述计算中，, 计算为：

其中，为视角独立编码后的输出。

步骤S3，根据所述步骤S2中的多视角统一表达进行辅助优化目标函数的构建。

该步骤包含以下子步骤：

步骤S3.1 将多视角统一表达送K均值聚类算法获得个聚类中心以及每个样本属于各个聚类的概率，样本属于聚类的概率：

步骤S3.2 依据构造辅助变量：

步骤S3.3 构造辅助优化目标函数:

步骤S4，基于所述步骤S3中的辅助优化目标函数，通过最小化该目标函数优化多视角的编码器，进而获得优化的多视角数据统一表达。

该步骤中，最小化时仅优化编码器权重参数，优化完成计算获得多视角统一表达。

步骤S5，对所述多视角数据统一表达进行聚类获得多视角数据的聚类结果；该步骤中，采用标准的谱聚类算法完成最终的聚类。

本申请利用模块化的编码器-解码器神经网络进行多视角数据的统一表达获取，可以灵活且有效地建模多视角数据之间的关系，通过辅助优化目标函数进行编码器的优化，将进一步提升多视角聚类的性能。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于模块化网络建模视角间关系的多视角聚类方法，其特征在于，包括以下步骤：

步骤S1，对于给定的图像数据、文本数据和图像文本数据样本，根据样本的类型提取数据的多个视角的特征，构成多视角数据集,对于图像数据，采用提取图像的不同视觉描述子构成多视角数据；对于文本数据，采用提取文本的不同词袋模型特征构成多视角数据；对于图像文本数据，则分别提取图像的视角描述子与文本的词袋模型特征构成多视角数据；

步骤S2，构建基于模块化的编码器-解码器神经网络进行多视角数据的统一表达建模，通过最小化多个视角的编解码误差训练得到多视角数据的统一表达；其中，模块化的编码器-解码器神经网络包括多视角编码器模块与多视角解码器模块，所述多视角编码器模块由视角独立编码模块与模块化编码模块组成，多视角解码器模块与编码器模块对称设计，由视角独立解码模块与模块化解码模块组成；具体包括以下步骤：

步骤S2.2，求各个视角经过模块化编码模块后的表达，其中模块化编码模块由层组成，每层包含/>个模块，第/>视角下第/>层第/>模块计算为：

；

其中，为第/>视角下第/>层模块/>与第/>层模块/>之间的权重系数，/>为/>层模块/>的计算权重，所有视角共享, />为第/>视角下第/>层模块/>的输入，ReLu为激活函数；上述计算权重为待学习参数，权重系数/>计算方式为：

；

其中为/>层与/>层的权重矩阵，/>为/>层的计算权重，所有视角共享，为待学习参数，第/>层输出即为各个视角经过模块化编码模块后的表达/>：

；

步骤S2.3多视角统一表达为各个视角表达加权平均：

；

其中，为总的视角个数；

步骤S2.4 以与多视角编码器对称的方式构造多视角解码器，各个视角输入经过编码器-编解码神经网络获得解码输出/>，通过最小化目标函数/>获得/>，进而获得/>：

；

2.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法，其特征在于，所述步骤S2中, />计算为：/>；/>；其中/>为视角/>独立编码后的输出。

3.根据权利要求1所述一种基于模块化网络建模视角间关系的多视角聚类方法，其特征在于，所述步骤S3具体包括以下步骤：步骤S3.1 将多视角统一表达送K均值聚类算法获得/>个聚类中心/>以及每个样本属于各个聚类的概率/>，样本/>属于聚类/>的概率为：；步骤S3.2 依据/>构造辅助变量/>：/>；；步骤S3.3 构造辅助优化目标函数:/>。

4.根据权利要求1所述的方法，其特征在于，步骤S4中辅助优化目标函数最小化时仅优化编码器权重参数，优化完成计算获得多视角统一表达/>。

5.根据权利要求1所述的方法，其特征在于，所述步骤S5中的聚类为标准的谱聚类算法完成最终的聚类。