CN110942108B

CN110942108B - 人脸图像聚类方法、装置及计算机可读存储介质

Info

Publication number: CN110942108B
Application number: CN201911289139.1A
Authority: CN
Inventors: 陈文胜; 曾倩文
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2019-12-13
Filing date: 2019-12-13
Publication date: 2023-04-25
Anticipated expiration: 2039-12-13
Also published as: CN110942108A

Abstract

本发明公开了一种人脸图像聚类方法，该人脸图像聚类方法包括以下步骤：获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集；将所述训练样本数据和所述最高特征量输入至BP‑Deep NMF模型中，训练所述BP‑Deep NMF模型，以获得所述待聚类人脸图像的基图像量；基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果。本发明还公开了一种人脸图像聚类装置及计算机可读存储介质。本发明提出了一种新的BP‑Deep NMF模型，解决了Deep NMF在人脸数据聚类任务中性能较差的问题。

Description

人脸图像聚类方法、装置及计算机可读存储介质

技术领域

本发明涉及人脸识别技术领域，尤其涉及一种人脸图像聚类方法、装置及计算机可读存储介质。

背景技术

随着人脸识别和检索系统应用的推广，系统中人脸图像数据急剧地增长，人脸聚类技术已经成为提高系统检索效率的重要基础。人脸聚类通常是将数据库中的人脸图片信息聚成一些不同的子类，使得子类之间的相似性尽量小，子类内的相似性尽量大，这样在检索时，只需在与被检索目标相似度较高的子类内逐个识别，检索出与之相似性最大的若干记录。

特征提取这一步骤无论在人脸识别还是人脸聚类技术上都占有重要地位。主成分分析与奇异值分解都是较为经典的特征提取方法，但是这两种方法提出的特征向量通常含有负元素，因此在原始样本为非负数据下，这些方法不具有合理性与可解释性。NMF(Non-negative Matrix Factorization，非负矩阵分解)是一种处理非负数据的特征提取方法，它的应用非常广泛，比如高光谱数据处理、人脸图像识别等。NMF算法在原始样本非负数据矩阵分解过程中，对提取的特征具有非负性限制，即分解后的所有分量都是非负的，因而可以提取非负的稀疏特征。NMF算法的实质也就是将非负矩阵X近似分解为基图像矩阵W和系数矩阵H的乘积，即X≈WH，且W和H都是非负矩阵。这样矩阵X的每一列就可以表示成矩阵W列向量的非负线性组合，这也符合NMF算法的构造依据——对整体的感知是由对组成整体的部分的感知构成的(纯加性)。近年来，学者们提出了许多对NMF变形的算法，例如，加强局部限制的局部NMF算法、整合判别信息的判别NMF算法、针对对称矩阵提出的对称NMF算法。尽管NMF算法及其变体取得了一定的成效，但该方法只考虑了数据浅层信息，对于含有丰富特征的数据，一次分解而成的单层结构却无法从多角度学习特征的表示。

目前，DL(Deep Learning，深度学习)已成为当前的研究热潮，深度学习通过建立了具有阶层结构的深度神经网络，为解决深层结构相关的优化难题带来希望。受深度学习技术成功的启发，一些研究者在单层NMF算法的基础上提出了Deep NMF(Deep Non-negative Matrix Factorization，深度非负矩阵分解)模型。Deep NMF可以看作是通过将一个复杂的任务分解成几个简单的任务，然后在多层结构中一个接一个地处理它们。与此同时，这种深度分解方法可以探索复杂数据中的底层特征表示，从而提取到比单层学习更完整、更有辨别力的特征。

目前已有的Deep NMF模型虽然具有深度分层结构，但这种结构一般是简单重复使用单层NMF算法来构建的，其性能达不到理想的要求，而且Deep NMF的计算方法的计算效率不高，在人脸数据聚类任务中性能较差。特别地，这些方法均不是利用深度神经网络来产生的，因而不能利用深度神经网络强大的特征表达能力和聚类能力。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种人脸图像聚类方法、装置及计算机可读存储介质，旨在解决Deep NMF的特征表达能力和聚类能力较差的技术问题。

为实现上述目的，本发明提供一种人脸图像聚类方法，所述人脸图像聚类方法包括以下步骤：

获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集；

将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-Deep NMF模型，以获得所述待聚类人脸图像的基图像量；

基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果。

可选地，所述将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-Deep NMF模型，以获得所述待聚类人脸图像的基图像量的步骤包括：

获取所述BP-Deep NMF模型中的激活函数对应的第一线性参数以及所述BP-DeepNMF模型中各个神经元的第一权重；

基于所述第一线性参数、所述训练样本数据和所述第一权重，确定所述BP-DeepNMF模型中输出层神经元的第一输出误差；

基于所述第一输出误差、所述第一线性参数和所述第一权重，确定所述BP-DeepNMF模型中输入层神经元和隐含层神经元的第二输出误差；

基于所述第一输出误差和所述第二输出误差，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量。

可选地，所述基于所述第一输出误差和所述第二输出误差，确定在所述BP-DeepNMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量的步骤包括：

基于所述第一输出误差和所述第二输出误差，确定所述BP-Deep NMF模型中各个神经元的权重偏置量；

基于所述权重偏置量，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量。

可选地，所述基于所述权重偏置量，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量的步骤包括：

获取所述BP-Deep NMF模型的学习率；

基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-DeepNMF模型中各个神经元的非负权重；

基于所述非负权重，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量。

可选地，所述基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-Deep NMF模型中各个神经元的非负权重的步骤之后，还包括：

基于所述训练样本数据和所述非负权重，确定所述BP-Deep NMF模型中的激活函数对应的第二线性参数，并将所述第二线性参数作为所述第一线性参数，执行所述基于所述第一线性参数、所述训练样本数据和所述第一权重，确定所述BP-Deep NMF模型中输出层神经元的第一输出误差，以及基于所述第一输出误差、所述第一线性参数和所述第一权重，确定所述BP-Deep NMF模型中输入层神经元和隐含层神经元的第二输出误差的步骤。

可选地，所述基于所述非负权重，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量的步骤包括：

获取所述BP-Deep NMF模型的训练次数以及所述BP-Deep NMF模型的损失函数值；

若所述训练次数达到最大训练次数或者所述损失函数值小于或等于模型误差阈值，则停止训练所述BP-Deep NMF模型，将所述非负权重作为所述第二权重，以确定所述BP-Deep NMF模型训练完成后的所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量。

可选地，所述获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集的步骤包括：

获取所述人脸图像，并将所述人脸图像转化为训练样本数据；

获取所述待聚类人脸图像，并将所述待聚类人脸图像转化为待聚类数据集；

基于所述训练样本数据，通过预设计算方法，确定所述训练样本数据对应的最高特征量。

可选地，所述基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果的步骤包括：

基于所述基图像量和所述待聚类数据集，提取所述待聚类数据集中各层特征的隐藏特征量；

基于所述隐藏特征量，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到人脸图像的聚类结果。

此外，为实现上述目的，本发明还提供一种人脸图像聚类装置，其特征在于，所述人脸图像聚类装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人脸图像聚类程序，所述人脸图像聚类程序被所述处理器执行时实现如上述的人脸图像聚类方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有人脸图像聚类程序，所述人脸图像聚类程序被处理器执行时实现如上述的人脸图像聚类方法的步骤。

本发明通过获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集；将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-Deep NMF模型，以获得所述待聚类人脸图像的基图像量；基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果，提出了一种基于BP神经网络的高性能深度非负矩阵分解(BP-Deep NMF)模型，BP-Deep NMF模型使用径向基函数(RBF)构造神经网络的输入信号，该输入等同于深度非负矩阵分解中的最高层特征，并以原始训练数据作为网络的期望输出，模型的优化则采用BP神经网络算法对网络权重矩阵更新的法则。最终训练出的BP-Deep NMF模型能直接得到数据的深度非负矩阵分解，而不需要对分解进行微调，并且在人脸数据聚类任务中显示出了优越的性能。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的人脸图像聚类装置结构示意图；

图2为本发明人脸图像聚类方法第一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的人脸图像聚类装置结构示意图。

如图1所示，该人脸图像聚类装置可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的人脸图像聚类装置结构并不构成对人脸图像聚类装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及人脸图像聚类程序。

在图1所示的人脸图像聚类装置中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的人脸图像聚类程序。

在本实施例中，人脸图像聚类装置包括：存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的人脸图像聚类程序，其中，处理器1001调用存储器1005中存储的人脸图像聚类程序时，并执行以下操作：

进一步地，处理器1001可以调用存储器1005中存储的人脸图像聚类程序，还执行以下操作：

获取所述BP-Deep NMF模型的学习率；

本发明还提供一种人脸图像聚类方法，参照图2，图2为本发明方法第一实施例的流程示意图，该人脸图像聚类方法包括以下步骤：

本发明实施例所适用的一种系统架构，包括但不限于一个服务器或者多个服务器，服务器可以是计算机等网络设备。服务器可以是一个独立的设备，也可以是多个服务器所形成的服务器集群。优选地，服务器可以采用云计算技术进行信息处理。

目前已有的Deep NMF模型虽然具有深度分层结构，但这种结构一般是简单重复使用单层NMF算法来构建的，其性能达不到理想的要求，而且这些方法的计算效率不高。特别地，这些方法均不是利用深度神经网络来产生的，因而不能利用深度神经网络强大的特征表达能力和聚类能力。鉴于此，本专利将神经网络算法引入到Deep NMF领域，提出了一种新的基于BP神经网络的高性能深度非负矩阵分解(BP-Deep NMF)聚类模型，首先构建深度非负矩阵分解(BP-Deep NMF)模型，再利用该BP-Deep NMF模型对待聚类数据进行聚类，也就是将待聚类人脸图像进行聚类。BP-Deep NMF方法使用径向基函数(RBF)构造神经网络的输入信号，该输入等同于深度非负矩阵分解中的最高层特征，并以原始训练数据作为网络的期望输出。模型的优化则采用BP神经网络算法对网络权重矩阵更新的法则。最终训练出的神经网络模型能直接得到数据的深度非负矩阵分解，而不需要对分解进行微调。本申请提出的BP-Deep NMF模型在人脸数据聚类任务中显示出了优越的性能。

为了便于理解，下面对本发明实施例中可能涉及的名词进行定义和解释。

深度非负矩阵分解(Deep NMF)：传统NMF仅是一个单层分解的学习过程，它通过分解数据矩阵X来学习基矩阵W和特征矩阵H。而深度非负矩阵分解(Deep NMF)能进一步捕捉数据集中隐藏的直观层次特征信息。其基本思想是：矩阵X在经过第一次浅层分解上得到的矩阵H₁可以再次分解为矩阵W₂和H₂，从而将原来的单层结构扩展为一个两层结构。以此类推，最终即可将浅层结构模型增广为多层(深度)结构模型。具体来说，Deep NMF模型将非负数据矩阵X分解为L+1个非负因子矩阵，即：

X≈W₁W₂…W_LH_L

其中

由上式知，Deep NMF模型学习得到的数据的隐藏属性H₁，…，H_L可表示为H₁≈W₂…W_LH_L,H₂≈W₃…W_LH_L,…，H_L-1≈W_LH_L，称H₁，…，H_L是在非负约束下的特征矩阵。为降低整个模型的总重构误差，Deep NMF算法一般在逐层分解全部完成后，再对整个网络模型进行微调，即对以下基于F-范数的损失函数进行极小化：

BP神经网络(Back-Propagation Algorithm of Neural Network，反向传播神经网络)：神经网络通过样本信号不断改变网络的权值，调整网络的误差值，最后输出误差达到预期的误差范围。其中，BP神经网络是一种基于误差反向传播的多层前馈网络，而标准的BP神经网络则包含有输入层、隐含层、输出层，其中层与层间通过神经元相互连接，而同一层网络的神经元之间互不相连。

步骤S10，获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集；

在本实施例中，在构建BP-Deep NMF模型之前，首先将用于训练BP-Deep NMF模型的人脸图像转换成训练样本数据，以及使用径向基函数(RBF)将训练样本数据转换成最高特征量，径向基函数(RBF)构造神经网络的输入信号即最高特征量，该输入等同于深度非负矩阵分解中的最高层特征，其中，人脸图像为用于训练BP-Deep NMF模型的人脸图像信息，包括不同表情、不同身份或者不同面部特征的人脸图像信息。将人脸图像转换成训练样本数据以及将训练样本数据转换成最高特征量后，获取转换完成后的训练样本数据和最高特征量，以进行对BP-Deep NMF模型的构建。

具体地，假设训练样本数目为n和训练样本数据矩阵即训练样本数据为X＝(x₁,x₂,…,x_n)。利用径向基函数(RBF)

(其中为空间x,y中两个数据点，t≥0)生成算法最高层特征矩阵即最高特征量H＝(H_ij)_n×n，其中，最高特征量

当x_i与x_j属于同一个人的不同脸部特征或者不同表情的人脸图像时，x_i与x_j属于同一类，则H_ij＝k(x_i,x_j)；当x_i与x_j属于不同人的脸部特征或者表情的人脸图像时，x_i与x_j属于不同类，则H_ij＝0。因此，显然，最高特征量H是对角分块矩阵，这种结构本身具有很好的聚类性质。

构建BP-Deep NMF模型完成后，首先获取待聚类人脸图像的待聚类数据集，以供将待聚类人脸图像进行聚类。

步骤S20，将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-Deep NMF模型，以获得所述待聚类人脸图像的基图像量；

在本实施例中，在获取人脸图像的训练样本数据和训练样本数据对应的最高特征量后，开始构建BP-Deep NMF模型即训练BP-Deep NMF模型，首先将训练样本数据X和最高特征量H输入至BP-Deep NMF模型中，具体地，将训练样本数据X作为BP神经网络的期望输出，即把原始的训练样本数据X输入进BP-Deep NMF模型的输出层，将最高特征量H作为BP-DeepNMF模型的输入信号，即把最高特征量H输入至BP-Deep NMF模型的输入层。之后，基于训练样本数据和最高特征量，通过训练BP-Deep NMF模型，确定在BP-Deep NMF模型训练完成后待聚类人脸图像的基图像量W，具体地，输入最高特征量H以求BP神经网络的正向输出，求得BP神经网络的正向输出后，输入最高特征量至BP神经网络的输出层，结合BP神经网络的正向输出求BP神经网络的反向输出，以更新BP-Deep NMF模型的模型参数即BP-Deep NMF模型中每个神经元的权重。

构建BP-Deep NMF模型期间，不断迭代该BP-Deep NMF模型，直至训练次数达到最大训练次数或者损失函数值小于或等于一阈值，否则继续对BP-Deep NMF模型进行迭代。当训练次数达到最大训练次数或者损失函数值小于或等于一阈值，说明BP-Deep NMF模型构建完成。BP-Deep NMF模型构建完成后，输出BP-Deep NMF模型的待聚类人脸图像的基图像量W。

步骤S30，基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果。

在本实施例中，在BP-Deep NMF模型构建完成后，输出BP-Deep NMF模型的待聚类人脸图像的基图像量W，基于基图像量W和待聚类数据集Y＝(y₁,y₂,…,y_m)，计算待聚类数据集中的每个样本y_k(k＝1,…,m)的第i层特征向量即隐藏特征量

运用预设聚类规则即k均值聚类法分别对样本第i层特征向量集

进行聚类确定待聚类数据集的聚类结果，最终输出聚类结果得到待聚类人脸图像的分类结果，隐藏特征量可以体现在人脸图像信息的身份或者表情或者姿势特征等。例如，基于姿势特征的一级隐藏特征，可以将待聚类人脸图像分类成不同姿势特征的聚类结果，例如头部朝向角度分别为0度、30度或者-30度等等角度的聚类结果；基于表情特征的二级隐藏特征，可以将待聚类人脸图像分类成不同表情特征的聚类结果，例如表情开心、愤怒或者疑惑等不同表情特征的聚类结果；基于身份特征的三级隐藏特征，可以将待聚类人脸图像分类成不同人的聚类结果，也就是说以人为分类依据将待聚类人脸图像分类。

本实施例提出的人脸图像聚类方法，通过获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集，然后将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-Deep NMF模型，以获得所述待聚类人脸图像的基图像量，最后基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果，提出了一种基于BP神经网络的高性能深度非负矩阵分解(BP-DeepNMF)聚类模型，BP-Deep NMF模型使用径向基函数(RBF)构造神经网络的输入信号，该输入等同于深度非负矩阵分解中的最高层特征，并以原始训练数据作为网络的期望输出，模型的优化则采用BP神经网络算法对网络权重矩阵更新的法则。最终训练出的BP-Deep NMF模型能直接得到数据的深度非负矩阵分解，而不需要对分解进行微调，并且在人脸数据聚类任务中显示出了优越的性能。

基于第一实施例，提出本发明人脸图像聚类方法的第二实施例，在本实施例中，步骤S20包括：

步骤a，获取所述BP-Deep NMF模型中的激活函数对应的第一线性参数以及所述BP-Deep NMF模型中各个神经元的第一权重；

在本实施例中，先设定BP神经网络的层数L，即BP神经网络一共具有L层神经元，取f(x)＝p^1/L·x(p>0)为构建BP神经网络的激活函数，第一线性参数即为激活函数f(x)＝p¹ ^/L·x中的线性参数p，第一线性参数p作用于将BP-Deep NMF模型中每个神经元的输入信号转换成一个输出信号，神经元的输入和输入对应的权重的乘积之和，并将激活函数f(x)应用于其获取该层神经元的输出并将其作为输入馈送到神经网络的下一个层。

步骤b，基于所述第一线性参数、所述训练样本数据和所述第一权重，确定所述BP-Deep NMF模型中输出层神经元的第一输出误差；

在本实施例中，取f(x)＝p^1/L·x(参数p>0)为BP神经网络的激活函数，设定偏置向量b＝0，BP神经网络的损失函数可定义为：

构建BP-Deep NMF模型开始，将最高特征量H输入至BP-Deep NMF模型的输入层，则BP神经网络输入层的输入为a₀＝H，BP神经网络的层数为L，BP神经网络第l层加权重后的值为Z_l＝W_la_l-1，BP神经网络第l层的输出为a_l＝p^1/L·Z_l，其中，l＝1,...,L。基于训练样本数据X、第一线性参数p和BP神经网络的第一权重W，输出BP神经网络输出层神经元的第一输出误差δ_L＝p^1/L·(X-p·W_L·W_L-1·...·W₁·H)。

步骤c，基于所述第一输出误差、所述第一线性参数和所述第一权重，确定所述BP-Deep NMF模型中输入层神经元和隐含层神经元的第二输出误差；

在本实施例中，输出BP神经网络输出层神经元的第一输出误差后，基于所求得的第一输出误差、第一线性参数p和第一权重W，输出BP-Deep NMF模型中第l层输入层神经元或隐含层神经元的第二输出误差，第二输出误差δ_l的计算公式如下：

其中，l＝L-1,L-2,...,1，W为BP神经网络的权重。

步骤d，基于所述第一输出误差和所述第二输出误差，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量。

在本实施例中，基于第一输出误差和第二输出误差，通过迭代BP-Deep NMF模型，确定在BP-Deep NMF模型训练完成后各个神经元的第二权重，输出该第二权重，并将BP-Deep NMF模型训练完成后的第二权重作为待聚类人脸图像的基图像量，以确定待聚类人脸图像的基图像量W，具体地，输入最高特征量H以求BP神经网络的正向输出，求得BP神经网络的正向输出后，基于正向输出确定第一输出误差和第二输出误差，以求BP神经网络的反向输出，以更新BP-Deep NMF模型的模型参数即BP-Deep NMF模型中每个神经元的权重，以供后续输出BP-Deep NMF模型训练完成后的第二权重作为待聚类人脸图像的基图像量，以便于进一步基于该基图像量将待聚类人脸图像进行聚类。

进一步地，一实施例中，所述基于所述第一输出误差和所述第二输出误差，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量的步骤包括：

步骤e，基于所述第一输出误差和所述第二输出误差，确定所述BP-Deep NMF模型中各个神经元的权重偏置量；

在本实施例中，在确定第一输出误差δ_L和第二输出误差δ_l后，BP神经网络的每个神经元根据所输出的第一输出误差δ_L和第二输出误差δ_l，计算BP-Deep NMF模型中各个神经元的权重偏置量，权重偏置量

的计算公式如下：

其中，

为第l-1层神经元的输出a_l-1的转置，δ_l为第二输出误差，以及参数l为l＝L,...,1。

步骤f，基于所述权重偏置量，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量。

在本实施例中，基于权重偏置量，通过迭代BP-Deep NMF模型，确定在BP-Deep NMF模型训练完成后各个神经元的第二权重，输出该第二权重，并将BP-Deep NMF模型训练完成后的第二权重作为待聚类人脸图像的基图像量，以确定待聚类人脸图像的基图像量W，具体地，输入最高特征量H以求BP神经网络的正向输出，求得BP神经网络的正向输出后，基于正向输出确定第一输出误差和第二输出误差，以求BP神经网络的反向输出，以更新BP-DeepNMF模型的模型参数即BP-Deep NMF模型中每个神经元的权重，以供后续输出BP-Deep NMF模型训练完成后的第二权重作为待聚类人脸图像的基图像量，以便于进一步地基于该基图像量将待聚类人脸图像进行聚类。

进一步地，一实施例中，其特征在于，所述基于所述权重偏置量，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量的步骤包括：

步骤g，获取所述BP-Deep NMF模型的学习率；

步骤h，基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-Deep NMF模型中各个神经元的非负权重；

在本实施例中，在确定BP-Deep NMF模型权重偏置量后，获取BP-Deep NMF模型的学习率r，以供更新BP神经网络的权重参数，基于权重偏置量和学习率更新BP神经网络的权重参数的计算公式如下：

其中，l＝L,...,1。

更新BP神经网络的权重参数后，通过投影梯度法将所更新的BP神经网络的权重参数进行投影，以投影成非负的权重参数，投影权重参数确定BP-Deep NMF模型中各个神经元的非负权重。

步骤i，基于所述非负权重，确定在所述BP-Deep NMF模型训练完成后所述BP-DeepNMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量。

在本实施例中，基于所投影的非负权重，通过迭代BP-Deep NMF模型，确定在BP-Deep NMF模型训练完成后各个神经元的第二权重，输出该第二权重，并将BP-Deep NMF模型训练完成后的第二权重作为待聚类人脸图像的基图像量，以确定待聚类人脸图像的基图像量W，具体地，输入最高特征量H以求BP神经网络的正向输出，求得BP神经网络的正向输出后，基于正向输出确定第一输出误差和第二输出误差，以求BP神经网络的反向输出，以更新BP-Deep NMF模型的模型参数即BP-Deep NMF模型中每个神经元的权重，以供后续输出BP-Deep NMF模型训练完成后的第二权重作为待聚类人脸图像的基图像量，以便于进一步地基于该基图像量将待聚类人脸图像进行聚类。

进一步地，一实施例中，所述基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-Deep NMF模型中各个神经元的非负权重的步骤之后，还包括：

步骤j，基于所述训练样本数据和所述非负权重，确定所述BP-Deep NMF模型中的激活函数对应的第二线性参数，并将所述第二线性参数作为所述第一线性参数，执行所述基于所述第一线性参数、所述训练样本数据和所述第一权重，确定所述BP-Deep NMF模型中输出层神经元的第一输出误差，以及基于所述第一输出误差、所述第一线性参数和所述第一权重，确定所述BP-Deep NMF模型中输入层神经元和隐含层神经元的第二输出误差的步骤。

在本实施例中，在所述基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-Deep NMF模型中各个神经元的非负权重的步骤之后，即在求得BP-Deep NMF模型中各个神经元的非负权重的步骤之后，更新BP-Deep NMF模型中的激活函数的线性参数，也就是确定BP-Deep NMF模型中的激活函数对应的第二线性参数，将第二线性参数作为第一线性参数，激活函数的线性参数的更新公式如下：

可以理解的是，为了确定最优参数p，需要求解如下问题的子优化：

采用梯度下降法对参数p进行求解，有：

其中ρ(p^(t))是关于p的步长向量，

是C_deep关于p^(t)的导数，可以计算得：

为了保证p^(t+1)的非负性，令：

结合以上公式，即可得到激活函数的线性参数的更新公式。

进一步地，一实施例中，所述基于所述非负权重，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量的步骤包括：

步骤k，获取所述BP-Deep NMF模型的训练次数以及所述BP-Deep NMF模型的损失函数值；

步骤l，若所述训练次数达到最大训练次数或者所述损失函数值小于或等于模型误差阈值，则停止训练所述BP-Deep NMF模型，将所述非负权重作为所述第二权重，以确定所述BP-Deep NMF模型训练完成后的所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量。

在本实施例中，获取BP-Deep NMF模型的训练次数以及BP-Deep NMF模型的损失函数值，以检测BP-Deep NMF模型迭代是否完成。检测训练次数达到最大训练次数以及损失函数值小于或等于模型误差阈值，若损失函数值小于或等于模型误差阈值即C_deep≤ε或迭代次数即训练次数达到最大训练次数I_max，说明BP-Deep NMF模型迭代完成，则停止迭代BP-Deep NMF模型，输出BP-Deep NMF模型的权重参数矩阵W_i(i＝1,…,L)。

否则，若训练次数未达最大训练次数，继续获取人脸图像的训练样本数据和训练样本数据对应的最高特征量，将训练样本数据和最高特征量输入至BP-Deep NMF模型中，并基于训练样本数据和最高特征量，通过训练BP-Deep NMF模型，确定在BP-Deep NMF模型训练完成后待聚类人脸图像的基图像量。

或者，损失函数值大于模型误差阈值，继续获取人脸图像的训练样本数据和训练样本数据对应的最高特征量，将训练样本数据和最高特征量输入至BP-Deep NMF模型中，并基于训练样本数据和最高特征量，通过训练BP-Deep NMF模型，确定在BP-Deep NMF模型训练完成后待聚类人脸图像的基图像量。

由此可见，一旦BP神经网络训练完成，可自动得到如下深度非负矩阵分解：X≈W_LW_L-1…W₁HW_i≥0,i＝1,2,…,L.H≥0。

本实施例提出的人脸图像聚类方法，通过获取所述BP-Deep NMF模型中的激活函数对应的第一线性参数以及所述BP-Deep NMF模型中各个神经元的第一权重，基于所述第一线性参数、所述训练样本数据和所述第一权重，确定所述BP-Deep NMF模型中输出层神经元的第一输出误差，基于所述第一输出误差、所述第一线性参数和所述第一权重，确定所述BP-Deep NMF模型中输入层神经元和隐含层神经元的第二输出误差，基于所述第一输出误差和所述第二输出误差，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量，提出了一种基于BP神经网络的高性能深度非负矩阵分解(BP-Deep NMF)聚类模型，BP-Deep NMF方法使用径向基函数(RBF)构造神经网络的输入信号，该输入等同于深度非负矩阵分解中的最高层特征，并以原始训练数据作为网络的期望输出，模型的优化则采用BP神经网络算法对网络权重矩阵更新的法则。最终训练出的BP-Deep NMF模型能直接得到数据的深度非负矩阵分解，而不需要对分解进行微调，并且在人脸数据聚类任务中显示出了优越的性能。

基于第一实施例，提出本发明人脸图像聚类方法的第三实施例，在本实施例中，步骤S10包括：

步骤m，获取所述人脸图像，并将所述人脸图像转化为训练样本数据；

在本实施例中，人脸图像为用于训练BP-Deep NMF模型的人脸图像信息，包括不同表情、不同身份或者不同面部特征的人脸图像信息，在构建BP-Deep NMF模型之前的准备工作，将用于训练BP-Deep NMF模型的人脸图像转换成训练样本数据，以供后续进行对BP-Deep NMF模型的构建，训练样本数据带有数据标签，数据标签一般为不同的人，即人脸图像包括不同人的人脸图像信息。

步骤n，获取所述待聚类人脸图像，并将所述待聚类人脸图像转化为待聚类数据集；

在本实施例中，构建BP-Deep NMF模型完成后，获取待聚类人脸图像，并将待聚类人脸图像转化为待聚类数据集，以供后续将待聚类人脸图像进行聚类。

步骤o，基于所述训练样本数据，通过预设计算方法，确定所述训练样本数据对应的最高特征量。

在本实施例中，在构建BP-Deep NMF模型之前，使用径向基函数(RBF)将训练样本数据转换成最高特征量，以供后续进行对BP-Deep NMF模型的构建，径向基函数(RBF)构造神经网络的输入信号即最高特征量，该输入等同于深度非负矩阵分解中的最高层特征。假设训练样本数目为n和训练样本数据矩阵即训练样本数据为X＝(x₁,x₂,…,x_n)。利用径向基函数(RBF)

进一步地，一实施例中，所述基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果的步骤包括：

步骤p，基于所述基图像量和所述待聚类数据集，提取所述待聚类数据集中各层特征的隐藏特征量；

隐藏特征量

的计算公式如下：

h_L-i+1＝(W_L…W_i)⁺yi＝1,…,L.

步骤q，基于所述隐藏特征量，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到人脸图像的聚类结果。

在本实施例中，基于隐藏特征量，运用预设聚类规则即k均值聚类法分别对样本第i层特征向量集

本实施例提出的人脸图像聚类方法，通过获取所述人脸图像，并将所述人脸图像转化为训练样本数据，然后获取所述待聚类人脸图像，并将所述待聚类人脸图像转化为待聚类数据集，最后基于所述训练样本数据，通过预设计算方法，确定所述训练样本数据对应的最高特征量，提出了一种基于BP神经网络的高性能深度非负矩阵分解(BP Deep NMF)聚类模型，BP Deep NMF方法使用径向基函数(RBF)构造神经网络的输入信号，该输入等同于深度非负矩阵分解中的最高层特征，并以原始训练数据作为网络的期望输出。模型的优化则采用BP神经网络算法对网络权重矩阵更新的法则。最终训练出的BP-Deep NMF模型能直接得到数据的深度非负矩阵分解，而不需要对分解进行微调，并且在人脸数据聚类任务中显示出了优越的性能。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机存储介质存储有人脸图像聚类程序，所述人脸图像聚类程序还可被处理器执行以用于实现上述人脸图像聚类方法各实施例的步骤。

本发明计算机存储介质的具体实施方式的拓展内容与上述人脸图像聚类方法各实施例基本相同，在此不做赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种人脸图像聚类方法，其特征在于，所述人脸图像聚类方法包括以下步骤：

将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-DeepNMF模型，以获得所述待聚类人脸图像的基图像量；

基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果；

所述将所述训练样本数据和所述最高特征量输入至BP-Deep NMF模型中，训练所述BP-Deep NMF模型，以获得所述待聚类人脸图像的基图像量的步骤包括：

获取所述BP-Deep NMF模型中的激活函数对应的第一线性参数以及所述BP-Deep NMF模型中各个神经元的第一权重；

基于所述第一线性参数、所述训练样本数据和所述第一权重，确定所述BP-Deep NMF模型中输出层神经元的第一输出误差；

基于所述第一输出误差、所述第一线性参数和所述第一权重，确定所述BP-Deep NMF模型中输入层神经元和隐含层神经元的第二输出误差；

基于所述第一输出误差和所述第二输出误差，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量；

所述基于所述第一输出误差和所述第二输出误差，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量的步骤包括：

基于所述权重偏置量，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量；

所述基于所述权重偏置量，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各个神经元的第二权重，并将所述第二权重作为所述待聚类人脸图像的基图像量的步骤包括：

获取所述BP-Deep NMF模型的学习率；

基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-Deep NMF模型中各个神经元的非负权重；

基于所述非负权重，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量；

所述基于所述权重偏置量和所述学习率，通过投影梯度法的投影确定所述BP-DeepNMF模型中各个神经元的非负权重的步骤之后，还包括：

2.如权利要求1所述的人脸图像聚类方法，其特征在于，所述基于所述非负权重，确定在所述BP-Deep NMF模型训练完成后所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量的步骤包括：

若所述训练次数达到最大训练次数或者所述损失函数值小于或等于模型误差阈值，则停止训练所述BP-Deep NMF模型，将所述非负权重作为所述第二权重，以确定所述BP-DeepNMF模型训练完成后的所述BP-Deep NMF模型中各层神经元的第二权重，并将所述第二权重作为所述人脸图像的基图像量。

3.如权利要求1所述的人脸图像聚类方法，其特征在于，所述获取人脸图像的训练样本数据、所述训练样本数据对应的最高特征量和待聚类人脸图像的待聚类数据集的步骤包括：

4.如权利要求1至3任一项所述的人脸图像聚类方法，其特征在于，所述基于所述基图像量和所述待聚类数据集，通过预设聚类规则将所述待聚类人脸图像进行分类，确定所述待聚类数据集的聚类结果，以得到待聚类人脸图像的分类结果的步骤包括：

5.一种人脸图像聚类装置，其特征在于，所述人脸图像聚类装置包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的人脸图像聚类程序，所述人脸图像聚类程序被所述处理器执行时实现如权利要求1至4中任一项所述的人脸图像聚类方法的步骤。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有人脸图像聚类程序，所述人脸图像聚类程序被处理器执行时实现如权利要求1至4中任一项所述的人脸图像聚类方法的步骤。