WO2022227956A1

WO2022227956A1 - 一种基于局部核的最优邻居多核聚类方法及系统

Info

Publication number: WO2022227956A1
Application number: PCT/CN2022/082643
Authority: WO
Inventors: 朱信忠; 徐慧英; 刘吉元; 赵建民
Original assignee: 浙江师范大学
Priority date: 2021-04-25
Filing date: 2022-03-24
Publication date: 2022-11-03
Also published as: LU503092B1; ZA202207734B; CN113269231A

Abstract

本申请公开了一种基于局部核的最优邻居多核聚类方法及系统，其中涉及的一种基于局部核的最优邻居多核聚类方法，包括：S11.获取聚类任务和目标数据样本；S12.计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵；S13.根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数；S14.采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵；S15.对得到的划分矩阵进行k均值聚类，得到聚类结果。

Description

一种基于局部核的最优邻居多核聚类方法及系统

技术领域

本申请涉及数据分析技术领域，尤其涉及一种基于局部核的最优邻居多核聚类方法及系统。

背景技术

核聚类方法已经广泛地应用于机器学习和数据挖掘领域。它隐式地将原始的不可分离数据映射到高维希尔伯特空间。在此空间中，对应的样本点具有明显的决策边界。然后，采用经典的聚类算法将未标记的数据划分为簇，包括k均值聚类，模糊c均值聚类，谱聚类和高斯混合模型(GMM)等。尽管核聚类方法在大量实际应用中都取得了巨大的成功，但它们只能使用单个核来处理数据。同时，核函数可分为不同类型，例如多项式核函数，高斯核函数，线性核函数等，并且需要手动进行参数选择。由于聚类任务没有标签信息，如何选择正确的核函数及其参数仍然是一个悬而未决的问题。与此同时，在实际的应用中，样本的特征还可能收集于不同的数据源。例如，人物画像可以通过人物的外貌特征、社交网络、处事习惯等多个方面进行描述。最常见的方法是将所有特征拼接到一个向量中，但是此种方法忽略了不同类型特征的不可比性。

多核聚类(MKC)算法通过融合不同核矩阵的互补信息来解决上述问题，其大致可以分为三类。第一类中的方法是通过使用低秩优化方法来构造聚类一致核。例如，首先从多核的转移概率矩阵中恢复一个共享的低秩矩阵，然后将其作为标准马尔可夫链方法的输入进行聚类。第二类技术使用从每个核生成的划分矩阵来计算它们的聚类结果。首先对每个不完全视图进行核k均值聚类得到多个划分矩阵，然后融合不同划分矩阵之间的互补信息，得到最终解。第三类算法在聚类过程中建立了一致核。大多数算法的基本假设是，最优核可以表示为预先指定的核的加权组合。除此之外，还提出了各种正则化方法来约束核权重。

核对齐是多核k-均值算法中一种有效的正则化方法，核对齐迫使所有样本对以相同的理想相似性相等地对齐。然而，这与公认的概念相冲突，即，在高维空间中以低相似性对齐两个更远的样本不可靠。局部核技巧可以解决这一问题。它能更好地捕捉数据中样本的固有特征，利用每个样本的邻域构造局部核，并最大化它们与理想相似矩阵的对齐和。此外，局部核能够帮助聚类算法更好地利用更接近的样本对提供的信息。

上述MKC算法存在两个问题：没有充分考虑单个数据样本周围的局部密度和过度限制学习最优核的表示能力。具体来说，局部核将每个样本的邻域数设置为一个全局常数，这不能保证局部核中的所有样本对相互靠近。众所周知，与较远的样本对进行比对不太可靠。因此，由于忽略了单个数据样本周围的局部密度，这种局部核不能将不可靠性降到最低。同时，大多数多核聚类算法假设最优核是预先指定的核的加权组合，而忽略了一些更健壮的核。

发明内容

本申请的目的是针对现有技术的缺陷，提供了一种基于局部核的最优邻居多核聚类方法及系统。

为了实现以上目的，本申请采用以下技术方案：

一种基于局部核的最优邻居多核聚类方法，包括：

S1.获取聚类任务和目标数据样本；

S2.计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵；

S3.根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数；

S4.采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵；

S5.对得到的划分矩阵进行k均值聚类，得到聚类结果。

进一步的，所述步骤S2计算与目标数据样本相对应的各个视图的核矩阵具体为：对目标数据样本

中的第p个视图进行核函数映射，得到第p个视图的核矩阵，表示为：

其中，

和

表示第i,j个样本，σ表示所有目标数据样本之间距离的平均值；e表示自然常数；K _p(i,j)表示第p个视图的核矩阵中第i行j列的值； m表示视图的个数。

进一步的，所述步骤S3中建立基于局部核的最优邻居多核聚类目标函数，表示为：

s.t.H∈R ^n×k,H ^TH＝I _k,β ^T1 _m＝1,β _p≥0,

其中，H表示划分矩阵；β表示组合系数；J表示最优邻居核；n表示所有样本数；μ表示自适应核相似度阈值；M表示核关系矩阵；H ⁽ⁱ⁾表示第i个样本对应的划分矩阵；H ^(i)T表示H ⁽ⁱ⁾的转置；β ^T表示组合系数向量；M ⁽ⁱ⁾表示第i个样本的最优邻居核矩阵的关系矩阵；ρ表示超参数，需要提前设定；K _β表示核矩阵按照β系数组合后得到的矩阵，

H ^T表示划分矩阵的转置；I _k表示k阶单位矩阵；β _p表示β向量位置p的值；

表示对于所有p；J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，

表示第i个样本的μ ⁽ⁱ⁾最近邻域，S ^(i)T表示S ⁽ⁱ⁾的转置；

表示μ ⁽ⁱ⁾的单位矩阵。

进一步的，所述步骤S4具体为：

S41.固定J和β，优化H；

将目标函数转化为：

s.t. H∈R ^n×k,H ^TH＝I _k

其中，A ⁽ⁱ⁾＝S ⁽ⁱ⁾S ^(i)T；A ⁽ⁱ⁾表示中间变量，A ⁽ⁱ⁾＝S ⁽ⁱ⁾S ^(i)T；I _n表示n阶单位矩阵；

通过对

进行特征值分解得到问题的解；

S42.固定H和β，优化J；

将目标函数转化为：

其中，B表示中间变量；

矩阵J通过将矩阵B中的负数特征值去除得到问题的解；

S43.固定H和J，优化β；

将目标函数转化为：

α＝[α ₁,…,α _m],α _p＝-ρTr(JK _p)

其中，α ^T表示α的转置；

表示第i的样本的局部核矩阵p和q之间的关系；

表示第p个核矩阵中第i个样本的局部核；

表示第q个核矩阵中第i个样本的局部核；M _pq表示核矩阵p和q之间的关系；K _p、K _q、α均表示中间变量；α _p表示α向量中位置p的值。

进一步的，所述步骤S41、S42、S43中的终止条件表示为：

(obj ^t+1-boj ^t)/obj ^t≤ε

其中，obj ^t+1和obj ^t分别表示第t+1和第t轮迭代的目标函数的值；ε表示设定精度。

相应的，还提供一种基于局部核的最优邻居多核聚类系统，包括：

获取模块，用于获取聚类任务和目标数据样本；

计算模块，用于计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵；

建立模块，用于根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数；

求解模块，用于采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵；

聚类模块，用于对得到的划分矩阵进行k均值聚类，得到聚类结果。

进一步的，所述计算模块中计算与目标数据样本相对应的各个视图的核矩阵具体为：对目标数据样本

其中，

和

进一步的，所述建立模块中建立基于局部核的最优邻居多核聚类目标函数，表示为：

s.t.H∈R ^n×k,H ^TH＝I _k,β ^T1 _m＝1,β _p≥0,

表示对于所有p；J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，

表示μ ⁽ⁱ⁾的单位矩阵。

进一步的，所述求解模块具体为：

第一固定模块，用于固定J和β，优化H；

将目标函数转化为：

s.t. H∈R ^n×k,H ^TH＝I _k

通过对

进行特征值分解得到问题的解；

第二固定模块，用于固定H和β，优化J；

将目标函数转化为：

其中，B表示中间变量；

矩阵J通过将矩阵B中的负数特征值去除得到问题的解；

第三固定模块，用于固定H和J，优化β；

将目标函数转化为：

α＝[α ₁,…,α _m],α _p＝-ρTr(JK _p)

其中，α ^T表示α的转置；

表示第i的样本的局部核矩阵p和q之间的关系；

表示第p个核矩阵中第i个样本的局部核；

进一步的，所述第一固定模块、第二固定模块、第三固定模块中的终止条件表示为：

(obj ^t+1-obj ^t)/obj ^t≤ε

与现有技术相比，本申请提出了一种新颖的基于局部核的最优邻居多核聚类方法及系统，其包括构建自适应局部核矩阵、寻找构建最优邻居核矩阵和融合自适应局部核矩阵的构建、最优邻居核矩阵的寻找及聚类三个部分，并将之融合在同一个目标式中求解。该方法大幅提高了多核聚类算法的性能，且在四个公共数据集上的实验结果证明了本申请的性能优于现有算法。

附图说明

图1是实施例一提供的一种基于局部核的最优邻居多核聚类方法流程图；

图2是实施例一、二提供的局部核比较示意图。

具体实施方式

以下通过特定的具体实例说明本申请的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本申请的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

本申请针对现有缺陷，提供了一种基于局部核的最优邻居多核聚类方法及系统。

实施例一

本实施例提供的一种基于局部核的最优邻居多核聚类方法，如图1所示，包括：

S11.获取聚类任务和目标数据样本；

S12.计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵；

S13.根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数；

S14.采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵；

S15.对得到的划分矩阵进行k均值聚类，得到聚类结果。

本实施例提出的一种通过基于局部核的最优邻居多核聚类的新方法，相比现有方法，其包括构建自适应局部核矩阵、寻找构建最优邻居核矩阵和融合自适应局部核矩阵的构建、最优邻居核矩阵的寻找及聚类三个部分，并将之融合在同一个目标式中求解，大幅提高了聚类性能。

在步骤S12中，计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵。

对目标数据样本

中的第v个视图进行核函数映射(常用的核函数有高斯核函数，线性核函数等)，本实施例以高斯核函数为例，最终得到第v个视图的核矩阵，表示为：

其中，

和

表示第i,j个样本，σ表示所有目标数据样本之间距离的平均值；e表示自然常数；K _p(i,j)表示第p个视图的核矩阵中第i行j列的值；m表示视图的个数。

由此，可得到v个视图的核矩阵

接着，将各个核矩阵进行中心化和归一化，即平均值为0，方差为1。

在步骤S13中，根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数。

在本实施例中，采用基于自适应的自适应局部核矩阵。自适应局部核矩阵构建如下：对于核矩阵J，第i个样本对应的局部核矩阵由与该样本相似度大于ζ的样本组成，可形式化表达为

表示第i个样本的μ ⁽ⁱ⁾最近邻域，S ^(i)T表示S ⁽ⁱ⁾的转置。图2是其可视化。图2(a)为核矩阵J，样本间相似度越大，灰度值越高，依次标记为1、0.75、0.5和0.25。当将ζ设置为0.75，可得到子图2(b.1)、图2(c.2)。其中，图2(b.1)为第1个样本对应的自适应局部核，图2(c.2)为第3个样本对应的自适应局部核。

本实施例建立基于局部核的最优邻居多核聚类目标函数，表示为：

s.t.H∈R ^n×k,H ^TH＝I _k,β ^T1 _m＝1,β _p≥0,

表示对于所有p；J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，

表示μ ⁽ⁱ⁾的单位矩阵。

在步骤S14中，采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵。具体为：

S141.固定J和β，优化H；

将目标函数转化为：

s.t. H∈R ^n×k,H ^TH＝I _k

通过对

进行特征值分解得到问题的解；

S142.固定H和β，优化J；

将目标函数转化为：

其中，B表示中间变量；

矩阵J通过将矩阵B中的负数特征值去除得到问题的解；

S143.固定H和J，优化β；

将目标函数转化为：

α＝[α ₁,…,α _m],α _p＝-ρTr(JK _p)

其中，α ^T表示α的转置；

表示第i的样本的局部核矩阵p和q之间的关系；

表示第p个核矩阵中第i个样本的局部核；

这是一个标准的QP问题，可以通过现有算法包进行求解。

现有技术算法可用拉格朗日乘子法进行求解，Matlab中直接调用算法求解。

在本实施例中，需要对步骤S141、S142、S143通过交替法进行交替执行，直至收敛，其中终止条件(即收敛条件)表示为：

(obj ^t+1-obj ^t)/obj ^t≤ε

在步骤S15中，对得到的划分矩阵进行k均值聚类，得到聚类结果。

对得到的划分矩阵进行k均值聚类，得到聚类结果，即对矩阵H进行标准的k均值聚类即可得到最终的聚类结果。

采用本实施例的自适应的自适应局部核矩阵与采用整个核矩阵ONKC相比，所采用的的方法取得的聚类性能不同。本实施例能得到更好的性能(使用聚类精度ACC来表示)，如下表1：

ONKC	本方法
41.56	45.44
91.00	96.30
35.91	38.04
39.19	40.63

表1

传统的多核聚类算法没有充分的考虑样本间的局部密度，且严重限制了用于最终聚类的最优核的取值范围，导致所取得的性能不高。本实施例的目的在于提供一种基于局部核的最优邻居多核聚类方法。该方法通过构建自适应的局部核矩阵，并在多个预先定义核的线性组合周围寻找一个最优的邻居核，且利用此邻居核进行聚类。同时，这三个过程被放在同一个目标式中进行轮替优化，当损失的变化趋于稳定时，得到最终的聚类结果。

相应的，本实施例还提供一种基于局部核的最优邻居多核聚类系统，包括：

获取模块，用于获取聚类任务和目标数据样本；

其中，

和

s.t.H∈R ^n×k,H ^TH＝I _k,β ^T1 _m＝1,β _p≥0,

表示对于所有p；J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，

表示μ ⁽ⁱ⁾的单位矩阵。

进一步的，所述求解模块具体为：

第一固定模块，用于固定J和β，优化H；

将目标函数转化为：

s.t. H∈R ^n×k,H ^TH＝I _k

通过对

进行特征值分解得到问题的解；

第二固定模块，用于固定H和β，优化J；

将目标函数转化为：

其中，B表示中间变量；

矩阵J通过将矩阵B中的负数特征值去除得到问题的解；

第三固定模块，用于固定H和J，优化β；

将目标函数转化为：

α＝[α ₁,…,α _m],α _p＝-ρTr(JK _p)

其中，α ^T表示α的转置；

表示第i的样本的局部核矩阵p和q之间的关系；

表示第p个核矩阵中第i个样本的局部核；

(obj ^t+1-obj ^t)/obj ^t≤ε

与现有技术相比，本申请提出了一种新颖的基于局部核的最优邻居多核聚类系统，其包括构建自适应局部核矩阵、寻找构建最优邻居核矩阵和融合自适应局部核矩阵的构建、最优邻居核矩阵的寻找及聚类三个部分，并将之融合在同一个目标式中求解。该方法大幅提高了多核聚类算法的性能。

实施例二

本实施例提供的一种基于局部核的最优邻居多核聚类方法与实施例一的不同之处在于：

本实施例主要内容包括针对目前多核聚类算法中没有充分考虑单个数据样本的局部密度和过度限制学习到的最优核的表示能力这两个问题，设计了自适应局部核，并从预先指定的核的线性组合的邻域中定位出最优核；将这两种技术利用到单个多内核集群框架中；研究了基于自适应局部核的最优邻域多核聚类算法的推广范围。

上述的自适应局部核是核函数的一个子矩阵，主要功能是反映了样本与其邻域之间的关系。首先，定义阈值ζ，并且第i个样本的对应指标集合Ω ⁽ⁱ⁾可以写为Ω ⁽ⁱ⁾＝{j|K(i,j)≥ζ}然后，相应的指标矩阵

被定义为：

矩阵K的第i个自适应局部核可以表示为：

换言之，上述等式选择与第i个样本对应的核值大于ζ的μ ⁽ⁱ⁾个相邻样本，并去掉其他样本。在多核k-均值中使用构造的局部核，并将矩阵诱导正则化λ的权重设置为1，可以重写为以下形式

其中

H ⁽ⁱ⁾＝S ^(i)TH,

是大小为μ ⁽ⁱ⁾且μ ⁽ⁱ⁾的单位矩阵随样本周围的密度而变化。

本实施例提出的自适应局部核是从[M.Li,X.Liu,W.Lei,D.Yong,J.Yin,and E.Zhu,“Multiple kernel clustering with local kernel alignment maximization,”in International Joint conference on Artificial Intelligence,2016]中的局部核扩展而来的，直接将局部核的大小为常数。然而，这样不能保证所有样本对都在一个高相似度的局部核中。相反，本实施例通过选择与样本i的相似度高于阈值ζ的样本来构造第i个自适应局部核。图2全面比较了这两种类型的局部核。可以看出，[M.Li,X.Liu,W.Lei,D.Yong,J.Yin,and E.Zhu,“Multiple kernel clustering with local kernel alignment maximization,”in International Joint conference on Artificial Intelligence,2016]中生成的局部核具有相同的大小，而所提出的自适应局部核是由样本对的相似性所决定的。比较图2中的b.1、b.2和c.1、c.2，可以注意到，所提出的自适应局部核通常比[M.Li,X.Liu,W.Lei,D.Yong,J.Yin,and E.Zhu,“Multiple kernel clustering with local kernel alignment maximization,”in International Joint conference on Artificial Intelligence,2016]]中的局部核小，从而保证了所有邻居具有相对较高的相似性，并减少了进一步比对样本对带来的不可靠性。

如图2所示的局部核比较：方框的暗度表示样本对之间的相似程度。方框越暗，对应的样本对越相似。a是原始核矩阵，b.1和b.2是在[M.Li,X.Liu,W.Lei,D.Yong,J.Yin,and E.Zhu,“Multiple kernel clustering with local kernel alignment maximization,”in International Joint conference on Artificial Intelligence,2016]中生成的对应于1/3样本的局部核。其大小μ固定为3；c.1和c.2是对应于1/3样本的自适应局部核。与它的邻居的相似性比ζ更高。

假设最优核(称为J)驻留在核组合的邻域中，表示为：

这一假设在方程中得到了目标式，如下：

上述目标式中的目标由于对J的约束，J很难优化。观察到K _β为聚类提供了先验知识，J更有可能在K _β之间的差距较小的情况下达到最优值。本实施例没有显式地设置最大差距η，而是在聚类过程中学习实际差距，这就形成了最终目标式

s.t.H∈R ^n×k,H ^TH＝I _k,β ^T1 _m＝1,β _p≥0,

其中，

K ⁽ⁱ⁾＝S ^(i)TKS ⁽ⁱ⁾，J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，

表示第i个样本的μ ⁽ⁱ⁾最近邻域，其中n是所有样本数，

是大小为μ ⁽ⁱ⁾的单位矩阵。最优核J用作连接聚类过程与知识获取过程。在这种情况下，它利用预先指定的核中的互补信息来帮助聚类过程，并利用来自聚类的信息来帮助预先指定的核的权重分配作为反馈。

实施例三

本实施例在多个数据集上与现有方法进行对比以验证本申请的有效性。

数据集：

Flower102：该数据集包含8189个样本，均匀分布在102个类别中，拥有 4个核矩阵。

Digital：该数据集包括2000个样本，均匀分布在10个类别中，拥有3个核矩阵。

Caltech101：该数据集包含1530个样本，均匀分布在102个类别中，拥有25个核矩阵。

Protein Fold：该数据集包括694个样本，均匀分布在27个类别中，拥有12个核矩阵。

以上数据集的统计信息如表2所示。

表2

数据准备与参数设置：

在初始化阶段，按照[C.Cortes,M.Mohri,and A.Rostamizadeh,“Algorithms for learning kernels based on centered alignment,”Journal of Machine Learning Research,vol.13,no.2,pp.795–828,2012.]中所述的方法将核矩阵进行中心化。接着对其进行归一化，以便更好地将样本对之间的相似度值范围指定在-1到1之间。

该方法有两个超参数，分别为ρ和ξ。ρ代表自适应局部核矩阵的构建与最优邻居核矩阵两个过程的相对重要程度。ξ代表邻居样本之间的相似度阈值。采用网格搜索技术用于选择这两个参数，其中，ρ在2 ^-15到2 ¹⁵之间变化，ξ在-0.5到0.5之间变化。

评价指标：

采用聚类算法通用准确率(ACC)评价指标进行评价。

本实施例在四个数据集上与文献中的三个多视图聚类方法进行对比，分别为RMKC[P.Zhou,L.Du,L.Shi,H.Wang,and Y.-D.Shen,“Recovery of corrupted multiple kernels for clustering,”in Twenty-Fourth International Joint Conference on Artificial Intelligence,2015.]、RMKKM[L.Du,P.Zhou,L.Shi,H.Wang,M.Fan,W.Wang,and Y.-D.Shen,“Robust multiple kernel k-means using l21-norm,”in Twenty-Fourth International Joint Conference on Artificial Intelligence,2015.]和MKCMR[X.Liu,Y.Dou,J.Yin,L.Wang,and E.Zhu,“Multiple kernel k-means clustering with matrix-induced regularization,”in Thirtieth AAAI Conference on Artificial Intelligence,2016.]的对比结果如表3所示，本实施例的性能明显优于对比方法。

表3

本实施例在四个公共数据集上的实验结果证明了本方法的性能优于现有算法。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

一种基于局部核的最优邻居多核聚类方法，其特征在于，包括：

S1.获取聚类任务和目标数据样本；

S2.计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵；

S3.根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数；

S4.采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵；

S5.对得到的划分矩阵进行k均值聚类，得到聚类结果。
根据权利要求1所述的一种基于局部核的最优邻居多核聚类方法，其特征在于，所述步骤S2计算与目标数据样本相对应的各个视图的核矩阵具体为：对目标数据样本
中的第p个视图进行核函数映射，得到第p个视图的核矩阵，表示为：

其中，
和
表示第i,j个样本，σ表示所有目标数据样本之间距离的平均值；e表示自然常数；K _p(i,j)表示第p个视图的核矩阵中第i行j列的值；m表示视图的个数。
根据权利要求2所述的一种基于局部核的最优邻居多核聚类方法，其特征在于，所述步骤S3中建立基于局部核的最优邻居多核聚类目标函数，表示为：

其中，H表示划分矩阵；β表示组合系数；J表示最优邻居核；n表示所有样本数；μ表示自适应核相似度阈值；M表示核关系矩阵；H ⁽ⁱ⁾表示第i个样本对应的划分矩阵；H ^(i)T表示H ⁽ⁱ⁾的转置；β ^T表示组合系数向量；M ⁽ⁱ⁾表示第i个样本的最优邻居核矩阵的关系矩阵；ρ表示超参数，需要提前设定；K _β表示核矩阵按照β系数组合后得到的矩阵，
H ^T表示划分矩阵的转置；I _k表示k阶单位矩阵；β _p表示β向量位置p的值；
表示对于所有p；J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，
表示第i个样本的μ ⁽ⁱ⁾最近邻域，S ^(i)T表示S ⁽ⁱ⁾的转置；
表示μ ⁽ⁱ⁾的单位矩阵。
根据权利要求3所述的一种基于局部核的最优邻居多核聚类方法，其特征在于，所述步骤S4具体为：

S41.固定J和β，优化H；

将目标函数转化为：

s.t.H∈R ^n×k,H ^TH＝I _k

其中，A ⁽ⁱ⁾＝S ⁽ⁱ⁾S ^(i)T；A ⁽ⁱ⁾表示中间变量，A ⁽ⁱ⁾＝S ⁽ⁱ⁾S ^(i)T；I _n表示n阶单位矩阵；

通过对
进行特征值分解得到问题的解；

S42.固定H和β，优化J；

将目标函数转化为：

其中，B表示中间变量；

矩阵J通过将矩阵B中的负数特征值去除得到问题的解；

S43.固定H和J，优化β；

将目标函数转化为：

α＝[α ₁,…,α _m],α _p＝-ρTr(JK _p)

其中，α ^T表示α的转置；
表示第i的样本的局部核矩阵p和q之间的关系；
表示第p个核矩阵中第i个样本的局部核；
表示第q个核矩阵中第i个样本的局部核；M _pq表示核矩阵p和q之间的关系；K _p、K _q、α均表示中间变量；α _p表示α向量中位置p的值。
根据权利要求4所述的一种基于局部核的最优邻居多核聚类方法，其特征在于，所述步骤S41、S42、S43中的终止条件表示为：

(obj ^t+1-obj ^t)/obj ^t≤ε

其中，obj ^t+1和obj ^t分别表示第t+1和第t轮迭代的目标函数的值；ε表示设定精度。
一种基于局部核的最优邻居多核聚类系统，其特征在于，包括：

获取模块，用于获取聚类任务和目标数据样本；

计算模块，用于计算与目标数据样本相对应的各个视图的核矩阵，并对核矩阵进行中心化和归一化处理，得到处理后的核矩阵；

建立模块，用于根据得到的处理后的核矩阵，建立基于局部核的最优邻居多核聚类目标函数；

求解模块，用于采用循环方式求解建立的目标函数，得到视图融合后的划分矩阵；

聚类模块，用于对得到的划分矩阵进行k均值聚类，得到聚类结果。
根据权利要求6所述的一种基于局部核的最优邻居多核聚类系统，其特征在于，所述计算模块中计算与目标数据样本相对应的各个视图的核矩阵具体为：对目标数据样本
中的第p个视图进行核函数映射，得到第p个视图的核矩阵，表示为：

其中，
和
表示第i,j个样本，σ表示所有目标数据样本之间距离的平均值；e表示自然常数；K _p(i,j)表示第p个视图的核矩阵中第i行j列的值；m表示视图的个数。
根据权利要求7所述的一种基于局部核的最优邻居多核聚类系统，其特征在于，所述建立模块中建立基于局部核的最优邻居多核聚类目标函数，表示为：

其中，H表示划分矩阵；β表示组合系数；J表示最优邻居核；n表示所有样本数；μ表示自适应核相似度阈值；M表示核关系矩阵；H ⁽ⁱ⁾表示第i个样本对应的划分矩阵；H ^(i)T表示H ⁽ⁱ⁾的转置；β ^T表示组合系数向量；M ⁽ⁱ⁾表示第i个样本的最优邻居核矩阵的关系矩阵；ρ表示超参数，需要提前设定；K _β表示核矩阵按照β系数组合后得到的矩阵，
H ^T表示划分矩阵的转置；I _k表示k阶单位矩阵；β _p表示β向量位置p的值；
表示对于所有p；J ⁽ⁱ⁾＝S ^(i)TJS ⁽ⁱ⁾，
表示第i个样本的μ ⁽ⁱ⁾最近邻域，S ^(i)T表示S ⁽ⁱ⁾的转置；
表示μ ⁽ⁱ⁾的单位矩阵。
根据权利要求8所述的一种基于局部核的最优邻居多核聚类系统，其特征在于，所述求解模块具体为：

第一固定模块，用于固定J和β，优化H；

将目标函数转化为：

s.t.H∈R ^n×k,H ^TH＝I _k

其中，A ⁽ⁱ⁾＝S ⁽ⁱ⁾S ^(i)T；A ⁽ⁱ⁾表示中间变量，A ⁽ⁱ⁾＝S ⁽ⁱ⁾S ^(i)T；I _n表示n阶单位矩阵；

通过对
进行特征值分解得到问题的解；

第二固定模块，用于固定H和β，优化J；

将目标函数转化为：

其中，B表示中间变量；

矩阵J通过将矩阵B中的负数特征值去除得到问题的解；

第三固定模块，用于固定H和J，优化β；

将目标函数转化为：

α＝[α ₁,…,α _m],α _p＝-ρTr(JK _p)

其中，α ^T表示α的转置；
表示第i的样本的局部核矩阵p和q之间的关系；
表示第p个核矩阵中第i个样本的局部核；
表示第q个核矩阵中第i个样本的局部核；M _pq表示核矩阵p和q之间的关系；K _p、K _q、α均表示中间变量；α _p表示α向量中位置p的值。
根据权利要求9所述的一种基于局部核的最优邻居多核聚类系统，其特征在于，所述第一固定模块、第二固定模块、第三固定模块中的终止条件表示为：

(obj ^t+1-obj ^t)/obj ^t≤ε

其中，obj ^t+1和obj ^t分别表示第t+1和第t轮迭代的目标函数的值；ε表示设定精度。