WO2017088470A1

WO2017088470A1 - 图像分类方法及装置

Info

Publication number: WO2017088470A1
Application number: PCT/CN2016/087562
Authority: WO
Inventors: 张涛; 龙飞; 陈志军
Original assignee: 小米科技有限责任公司
Priority date: 2015-11-27
Filing date: 2016-06-29
Publication date: 2017-06-01
Also published as: CN105488527B; CN105488527A; US20170154208A1; EP3176727A1; US10282597B2

Abstract

一种图像分类方法及装置，应用于终端，其方法包括：当获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息（S110）；根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值（S120）；利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类（S130）。通过确定将人脸姿态信息，可以更准确地确定两个待分类图像是否属于同一类图像，进而提高图像分类效率。

Description

图像分类方法及装置

本申请基于申请号为CN201510846109.1、申请日为2015年11月27日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及图像识别技术领域，尤其涉及一种图像分类方法及装置。

背景技术

随着科技的不断发展，以智能手机为代表的智能终端可以实现越来越多的功能。以智能手机为例，根据需要用户可以利用智能手机进行自拍或给其他人拍照，也可以将自己或他人空间中的照片下载到本地进行存储。

然而，随着智能手机的存储空间的增大，用户在智能手机存储的照片也越来越多，对这些照片的管理也变得十分繁琐，很多情况下用户希望可以将同一个人的照片聚集在一起进行显示，以方便用户浏览。

发明内容

为克服相关技术中存在的问题，本公开提供一种图像分类方法及装置。

根据本公开实施例的第一方面，提供一种图像分类方法，包括：

当获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息；

根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值；

利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类。

在对两个待分类图像进行分类时，根据预先建立的任亮姿态分类器模型，分别确定出这两个待分类图像中的人脸姿态信息，进而确定出这两个待分类图像之间的目标聚类合并阈值，然后根据该目标聚类合并阈值对这两个待分类图像进行分类。通过确定将人脸姿态信息，可以更准确地确定两个待分类图像是否属于同一类图像，进而提高图像分类效率。

可选地，还包括：

计算所述两个待分类图像之间的相似度；

判断所述相似度是否大于预设阈值；

当所述相似度大于预设阈值时，执行所述分别确定所述两个待分类图像中的人脸姿态信息的步骤。

针对两个具有一定相似度的图像进行分类，即在无法单单通过相似度区分二者是否为同一类图像时，借助本公开提供的实施例可以进一步提高两个待分类图像的准确度。如果两个待分类图像小于某相似度，即在从确定两个待分类已经明显不属于同一类图像时，也就无需采用本公开提供的方法。因此，待分类的两个图像之间至少要满足具有一定的相似度才可以。

可选地，所述确定所述两个待分类图像之间的目标聚类合并阈值，包括：

获取预设聚类合并阈值；

判断所述两个待分类图像中的人脸姿态信息是否都是大角度姿态信息；

当所述两个待分类图像中的人脸姿态信息都是大角度姿态信息时，按预设方式增大所述预设聚类合并阈值，将所述增大后的所述预设聚类合并阈值作为目标聚类合并阈值。

如果两个待分类图像中的人脸姿态信息都是大角度姿态信息，说明这两个待分类图像中人脸特征含量丰富，需要调高二者之间的聚类合并阈值，以提高分类的准确度。

获取预设聚类合并阈值；

判断所述两个待分类图像中的人脸姿态信息是否分别为不同角度姿态信息；

当所述两个待分类图像中的人脸姿态信息分别为不同角度姿态信息，按照预设方式减小所述预设聚类合并阈值，将减小后的所述预设聚类合并阈值作为目标聚类合并阈值。

如果两个待分类图像中的人脸姿态信息都是不同角度姿态信息，说明这两个待分类图像中人脸特征含量不太丰富，需要调低二者之间的聚类合并阈值，以提高分类的准确度。

获取预设聚类合并阈值；

判断所述两个待分类图像中的人脸姿态信息是否都为正面姿态信息；

当所述两个待分类图像中的人脸姿态信息都为正面姿态信息时，将所述预设聚类合并阈值作为目标聚类合并阈值。

如果两个待分类图像中的人脸姿态信息都是正面姿态信息，说明这两个待分类图像中包含全部人脸特征，这是可以直接将预设聚类合并阈值作为目标聚类合并阈值。

可选地，所述利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类，包括：

计算所述两个待分类图像的聚类合并值；

判断所述聚类合并值是否大于所述目标聚类合并阈值；

当所述聚类合并值大于所述目标聚类合并阈值时，将所述两个待分类图像作为同一类图像；

当所述聚类合并值不大于所述目标聚类合并阈值时，将所述两个待分类图像作为不同类图像。

通过将两个待分类图像的聚类合并值与目标聚类合并阈值进行比较，可以很方便准确的判断出这两个待分类图像是否属于同一类图像。

根据本公开实施例的第二方面，提供一种图像分类装置，包括：

人脸姿态信息确定模块，用于在获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息；

目标聚类合并阈值确定模块，用于根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值；

图像分类模块，用于利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类。

可选地，还包括：

相似度计算模块，用于计算所述两个待分类图像之间的相似度；

阈值判断模块，用于判断所述相似度是否大于预设阈值。

可选地，所述目标聚类合并阈值确定模块，包括：

第一聚类合并阈值获取子模块，用于获取预设聚类合并阈值；

大角度姿态信息判断子模块，用于判断所述两个待分类图像中的人脸姿态信息是否都是大角度姿态信息；

第一目标聚类合并阈值子模块，用于当所述两个待分类图像中的人脸姿态信息都是大角度姿态信息时，按预设方式增大所述预设聚类合并阈值，将所述增大后的所述预设聚类合并阈值作为目标聚类合并阈值。

可选地，所述目标聚类合并阈值确定模块，包括：

第二聚类合并阈值获取子模块，用于获取预设聚类合并阈值；

不同角度姿态信息判断子模块，用于判断所述两个待分类图像中的人脸姿态信息是否分别为不同角度姿态信息；

第二目标聚类合并阈值子模块，用于在所述两个待分类图像中的人脸姿态信息分别为不同角度姿态信息，按照预设方式减小所述预设聚类合并阈值，将减小后的所述预设聚类合并阈值作为目标聚类合并阈值。

可选地，所述目标聚类合并阈值确定模块，包括：

第三聚类合并阈值获取子模块，用于获取预设聚类合并阈值；

正面姿态信息判断子模块，用于判断所述两个待分类图像中的人脸姿态信息是否都为正面姿态信息；

第三目标聚类合并阈值子模块，用于在所述两个待分类图像中的人脸姿态信息都为正面姿态信息时，将所述预设聚类合并阈值作为目标聚类合并阈值。

可选地，所述图像分类模块，包括：

聚类合并值计算子模块，用于计算所述两个待分类图像的聚类合并值；

聚类合并值判断子模块，用于判断所述聚类合并值是否大于所述目标聚类合并阈值；

同一类图像确定子模块，用于在所述聚类合并值大于所述目标聚类合并阈值时，将所述两个待分类图像作为同一类图像；

不同类图像确定子模块，用于在所述聚类合并值不大于所述目标聚类合并阈值时，将所述两个待分类图像作为不同类图像。

根据本公开实施例的第三方面，提供一种终端，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

本公开的实施例提供的技术方案可以包括以下有益效果：

本公开实施例中提供的图像分类方法及装置，在对两个待分类图像进行分类时，根据预先建立的任亮姿态分类器模型，分别确定出这两个待分类图像中的人脸姿态信息，进而确定出这两个待分类图像之间的目标聚类合并阈值，然后根据该目标聚类合并阈值对这两个待分类图像进行分类。通过确定将人脸姿态信息，可以更准确地确定两个待分类图像是否属于同一类图像，进而提高图像分类效率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种图像分类方法的流程图；

图2是根据另一示例性实施例示出的一种图像分类方法的流程图；

图3是图1中步骤S120的流程图；

图4是图1中步骤S120的另一流程图；

图5是图1中步骤S120的又一流程图；

图6是图1中步骤S130的流程图；

图7是根据一示例性实施例示出的一种图像分类装置的示意图；

图8是根据又一示例性实施例示出的一种图像分类装置的示意图；

图9是图7中目标聚类合并阈值确定模块的示意图；

图10是图7中目标聚类合并阈值确定模块的另一示意图；

图11是图7中目标聚类合并阈值确定模块的又一示意图；

图12是图7中图像分类模块的示意图；

图13是根据一示例性实施例示出的一种终端的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为了解决相关技术问题。本公开实施例首先提供了一种图像分类方法，如图1所示，可以包括如下步骤：

在步骤S110中，当获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定两个待分类图像中的人脸姿态信息。

在本公开实施例中，可以通过预先建立的人脸姿态分类器模型，确定出两个待分类图像中的人脸姿态信息。如：正脸、侧脸，左脸、有脸，或者两个正脸图像等。

在步骤S120中，根据两个待分类图像中的人脸姿态信息，确定两个待分类图像之间的目标聚类合并阈值。

本公开实施例中，在根据通过预先建立的人脸姿态分类器模型，分别确定出两个待分类图像的人脸姿态信息之后，还需要根据该人脸姿态信息，获取与其相对应的聚类合并阈值。另外，在对包括多张人脸图像照片进行分类时，首先可以对其中的任两个图像照片进行识别，判定是否为同一个人的照片，然后得到多张人脸图像照片的最终分类结果。还可以首先任取一张图像照片，分别对其他图像照片进行逐一对比，得到这一张图像照片对其他图像照片的分类结果，然后用同样的方式确定出剩下的其他图像照片的分类结果。

一张图像照片可以是，正面人脸姿态信息或其他角度的侧面人脸姿态信息。例如，两张图像照片可以是，两张正面人脸图像照片、一张正面人脸和一张侧面人脸、两张侧面人脸等情况，每种情况都会对应一个聚类合并阈值，其中侧面人脸姿态信息可以包括不同角度的侧面人脸姿态信息。根据两个待分类图像中的人脸姿态信息，可以通过查表或自动生成等方式确定出两个待分类图像之间的聚类合并阈值作为目标聚类合并阈值。

在步骤S130中，利用确定得到的目标聚类合并阈值对两个待分类图像进行分类。

由于本公开实施例是对两个相似度大于设定阈值的待分类图像进行再次的判别，进一步提高了分类的准确性，所以两个待分类图像的聚类合值大于目标聚类合并阈值时，说明这两个待分类图像属于一类，否则不属于一类。

本公开实施例中提供的图像分类方法，在对两个待分类图像进行分类时，根据预先建立的任亮姿态分类器模型，分别确定出这两个待分类图像中的人脸姿态信息，进而确定出这两个待分类图像之间的目标聚类合并阈值，然后根据该目标聚类合并阈值对这两个待分类图像进行分类。通过确定将人脸姿态信息，可以更准确地确定两个待分类图像是否属于同一类图像，进而提高图像分类效率。

作为对图1方法的细化，在另一实施例中，如图2所示，该方法还可以包括以下步骤：

在步骤S140中，计算两个待分类图像之间的相似度。

在步骤S150中，判断相似度是否大于预设阈值。

当相似度大于预设阈值时，执行步骤S110。

当相似度不大于预设阈值时，结束本次流程。

本公开实施例主要是对两个具有一定相似度的图像进行分类，即在无法单单通过相似度区分二者是否为同一类图像时，借助本公开提供的实施例可以进一步提高两个待分类图像的准确度。如果两个待分类图像小于某相似度，即在从确定两个待分类已经明显不属于同一类图像时，也就无需采用本公开提供的方法。因此，待分类的两个图像之间至少要满足具有一定的相似度才可以。

为了确定两个待分类图像中的人脸姿态信息都是大角度姿态信息时的聚类合并阈值，进而根据该聚类合并阈值进行分类，作为对图1方法的细化，在另一实施例中，如图3所示，步骤S120还可以包括以下步骤：

在步骤S121中，获取预设聚类合并阈值。

在步骤S122中，判断两个待分类图像中的人脸姿态信息是否都是大角度姿态信息。

当两个待分类图像中的人脸姿态信息都是大角度姿态信息时，在步骤S123中，按预设方式增大预设聚类合并阈值，将增大后的预设聚类合并阈值作为目标聚类合并阈值。

为了确定两个待分类图像中的人脸姿态信息分别为不同角度姿态信息时的聚类合并阈值，进而根据该聚类合并阈值进行分类，作为对图1方法的细化，在另一实施例中，如图4所示，步骤S120还可以包括以下步骤：

在步骤S124中，获取预设聚类合并阈值。

在步骤S125中，判断两个待分类图像中的人脸姿态信息是否分别为不同角度姿态信息。

当两个待分类图像中的人脸姿态信息分别为不同角度姿态信息，在步骤S126中，按照预设方式减小预设聚类合并阈值，将减小后的预设聚类合并阈值作为目标聚类合并阈值。

为了确定两个待分类图像中的人脸姿态信息都为正面姿态信息时的聚类合并阈值，进而根据该聚类合并阈值进行分类，作为对图1方法的细化，在另一实施例中，如图5所示，步骤S120还可以包括以下步骤：

在步骤S127中，获取预设聚类合并阈值。

在步骤S128中，判断两个待分类图像中的人脸姿态信息是否都为正面姿态信息。

当两个待分类图像中的人脸姿态信息都为正面姿态信息时，在步骤S129中，将预设聚类合并阈值作为目标聚类合并阈值。

下面着重对上述三种人脸姿态信息进行详细说明，即：都是大角度姿态信息、不同角度姿态信息和都为正面姿态信息。

为了判别待分类图像中的人脸姿态信息，如待分类图像中的人脸是正面的、还是侧面的以一定角度呈现出来的，需要提取出待分类图像中的人脸特征信息，通过该人脸特征信息进行判别该待分类图像中的人脸姿态信息。例如，可以对正面人脸建立水平、竖直和垂直方向上的三维坐标系，提取图像中的人眼、鼻子、耳朵等方位等特征信息来判断该待分类图像的人脸姿态。

提取待分类图像中的人脸特征信息，通过预先建立的人脸姿态分类器模型，判断出该待分类图像中的人脸姿态信息，如该图像中的人脸是朝某个位的偏移量，如该待分类图像中的人脸姿态信息为左偏20度。

具体可以通过采集多种人脸姿态样本图像照片，建立人脸姿态样本库。其中，该人脸姿态样本库可以包括多张多种人脸姿态的照片图像。如：该人脸姿态样本库包括：正面人脸姿态照片图像1000张、10度人脸姿态照片图像1000张、20度人脸姿态照片图像1000张等等。示例性的，10度人脸姿态照片可以是拍摄时，人脸正面与镜头之间的夹角。其中，不同角度和照片的数量可以根据实际的需要进行设定，为了提高人脸姿态分类器模型对人脸姿态判别的准确性，人脸姿态样本库中包含的人脸照片应当包括男人和女人的照片图像，又如可以包括老人和孩子的照片图像等等。

在上述人脸姿态样本库建好之后，可以通过现有的分类器对建立的人脸姿态样本库中的照片图像进行训练，得到人脸姿态分类器模型。例如，可以采用非线性分类器对人脸姿态样本库中的图像照片进行训练人脸姿态分类器模型。示例性的，可以采用SVM(Support Vector Machine，支持向量机)或CNN(convolutional neural networks，卷积神经网络)对人脸姿态样本库中的照片图像进行训练，得到人脸姿态分类器模型。

作为对图1方法的细化，在另一实施例中，如图6所示，步骤S130还可以包括以下步骤：

在步骤S131中，计算两个待分类图像的聚类合并值。

在步骤S132中，判断聚类合并值是否大于目标聚类合并阈值。

当聚类合并值大于目标聚类合并阈值时，在步骤S133中，将两个待分类图像作为同一类图像。

当聚类合并值不大于目标聚类合并阈值时，在步骤S134中，将两个待分类图像作为不同类图像。

通过以上的方法实施例的描述，所属领域的技术人员可以清楚地了解到本公开可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

另外，作为对上述各实施例的实现，本公开实施例还提供了一种图像分类装置，该装置位于终端中，如图7所示，该装置包括：人脸姿态信息确定模块10、目标聚类合并阈值确定模块20和图像分类模块30，其中，

人脸姿态信息确定模块10被配置为在获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息；

目标聚类合并阈值确定模块20被配置为根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值；

图像分类模块30被配置为利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类。

本公开实施例中提供的图像分类装置，在对两个待分类图像进行分类时，根据预先建立的任亮姿态分类器模型，分别确定出这两个待分类图像中的人脸姿态信息，进而确定出这两个待分类图像之间的目标聚类合并阈值，然后根据该目标聚类合并阈值对这两个待分类图像进行分类。通过确定将人脸姿态信息，可以更准确地确定两个待分类图像是否属于同一类图像，进而提高图像分类效率。

在本公开提供的又一实施例中，基于图7，如图8所示，该装置还包括：相似度计算模块40和阈值判断模块50，其中，

相似度计算模块40被配置为计算所述两个待分类图像之间的相似度；

阈值判断模块50被配置为判断所述相似度是否大于预设阈值。

在本公开提供的又一实施例中，基于图7，如图9所示，目标聚类合并阈值确定模块20，包括：第一聚类合并阈值获取子模块21、大角度姿态信息判断子模块22和第一目标聚类合并阈值子模块23，其中，

第一聚类合并阈值获取子模块21被配置为获取预设聚类合并阈值；

大角度姿态信息判断子模块22被配置为判断所述两个待分类图像中的人脸姿态信息是否都是大角度姿态信息；

第一目标聚类合并阈值子模块23被配置为当所述两个待分类图像中的人脸姿态信息都是大角度姿态信息时，按预设方式增大所述预设聚类合并阈值，将所述增大后的所述预设聚类合并阈值作为目标聚类合并阈值。

在本公开提供的又一实施例中，基于图7，如图10所示，所述目标聚类合并阈值确定模块20，包括：第二聚类合并阈值获取子模块24、不同角度姿态信息判断子模块25和第二目标聚类合并阈值子模块26，其中，

第二聚类合并阈值获取子模块24被配置为获取预设聚类合并阈值；

不同角度姿态信息判断子模块25被配置为判断所述两个待分类图像中的人脸姿态信息是否分别为不同角度姿态信息；

第二目标聚类合并阈值子模块26被配置为在所述两个待分类图像中的人脸姿态信息分别为不同角度姿态信息，按照预设方式减小所述预设聚类合并阈值，将减小后的所述预设聚类合并阈值作为目标聚类合并阈值。

在本公开提供的又一实施例中，基于图7，如图11所示，所述目标聚类合并阈值确定模块20，包括：第三聚类合并阈值获取子模块27、正面姿态信息判断子模块28和第三目标聚类合并阈值子模块29，其中，

第三聚类合并阈值获取子模块27被配置为获取预设聚类合并阈值；

正面姿态信息判断子模块28被配置为判断所述两个待分类图像中的人脸姿态信息是否都为正面姿态信息；

第三目标聚类合并阈值子模块29被配置为在所述两个待分类图像中的人脸姿态信息都为正面姿态信息时，将所述预设聚类合并阈值作为目标聚类合并阈值。

在本公开提供的又一实施例中，基于图7，如图12所示，所述图像分类模块30，包括：聚类合并值计算子模块31、聚类合并值判断子模块32、同一类图像确定子模块33和不同类图像确定子模块34，其中，

聚类合并值计算子模块31被配置为计算所述两个待分类图像的聚类合并值；

聚类合并值判断子模块32被配置为判断所述聚类合并值是否大于所述目标聚类合并阈值；

同一类图像确定子模块33被配置为在所述聚类合并值大于所述目标聚类合并阈值时，将所述两个待分类图像作为同一类图像；

不同类图像确定子模块34被配置为在所述聚类合并值不大于所述目标聚类合并阈值时，将所述两个待分类图像作为不同类图像。

本公开实施例中提供的图像分类装置，在对两个相似度较大的待分类图像进行分类时，获得这两个待分类图像人脸的姿态信息，通过判断这两个相似度较大的待分类图像的姿态信息，确定出与这两个待分类图像的姿态信息相对应的聚类合并阈值。当这两个待分类图像相似度大于该聚类合并阈值时，将这两个待分类图像分为一类。可以有效避免只通过图像中的相似度直接判断两个待分类图像是否为一类图像，进而造成对图像分类的错误率较高的问题。

另外，根据当两个待分类图像中包含的人脸姿态信息不同，两个待分类图像的姿态信息相对应的聚类合并阈值是可变的。如果这两个待分类图像的姿态信息比较接近，例如都是大角度姿态时，可以将聚类合并阈值调的高一点；如果这两个待分类图像的姿态信息差异较大，如一个是左侧人脸姿态信息，另一个是右侧人脸姿态信息，这时可以将二者之间的聚类合并阈值调的低一点；如果这两个待分类图像的姿态信息都属于正面人脸姿态信息，可以不对二者之间的聚类合并阈值调进行调整。即可以使两个待分类图像的姿态信息相对应的聚类合并阈值具有自适应性，可以准确的对两个待分类图像进行准确判定是否为同一个人的照片图像。

图13是根据一示例性实施例示出的一种用于图像分类的装置1300的结构示意图。例如，装置1300可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图13，装置1300可以包括以下一个或多个组件：处理组件1302，存储器1304，电源组件1306，多媒体组件1313，音频组件1310，输入/输出(I/O)的接口1312，传感器组件1314，以及通信组件1316。

处理组件1302通常控制装置1300的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件1302可以包括一个或多个处理器1320来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1302可以包括一个或多个模块，便于处理组件1302和其他组件之间的交互。例如，处理组件1302可以包括多媒体模块，以方便多媒体组件1313和处理组件1302之间的交互。

存储器1304被配置为存储各种类型的数据以支持在装置1300的操作。这些数据的示例包括用于在装置1300上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1306为装置1300的各种组件提供电力。电源组件1306可以包括电源管理系统，一个或多个电源，及其他与为装置1300生成、管理和分配电力相关联的组件。

多媒体组件1313包括在所述装置1300和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1313包括一个前置摄像头和/或后置摄像头。当装置1300处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1310被配置为输出和/或输入音频信号。例如，音频组件1310包括一个麦克风(MIC)，当装置1300处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1304或经由通信组件1316发送。在一些实施例中，音频组件1310还包括一个扬声器，用于输出音频信号。

I/O接口1312为处理组件1302和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1314包括一个或多个传感器，用于为装置1300提供各个方面的状态评估。例如，传感器组件1314可以检测到装置1300的打开/关闭状态，组件的相对定位，例如所述组件为装置1300的显示器和小键盘，传感器组件1314还可以检测装置1300或装置1300一个组件的位置改变，用户与装置1300接触的存在或不存在，装置1300方位或加速/减速和装置1300的温度变化。传感器组件1314可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1314还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1314还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1316被配置为便于装置1300和其他设备之间有线或无线方式的通信。装置1300可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件1316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件1316还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置1300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1304，上述指令可由装置1300的处理器1320执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种图像分类方法，所述方法包括：

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

一种图像分类方法，其特征在于，包括：

当获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息；

根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值；

利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类。
根据权利要求1所述的方法，其特征在于，还包括：

计算所述两个待分类图像之间的相似度；

判断所述相似度是否大于预设阈值；

当所述相似度大于预设阈值时，执行所述分别确定所述两个待分类图像中的人脸姿态信息的步骤。
根据权利要求1或2所述的方法，其特征在于，所述确定所述两个待分类图像之间的目标聚类合并阈值，包括：

获取预设聚类合并阈值；

判断所述两个待分类图像中的人脸姿态信息是否都是大角度姿态信息；

当所述两个待分类图像中的人脸姿态信息都是大角度姿态信息时，按预设方式增大所述预设聚类合并阈值，将所述增大后的所述预设聚类合并阈值作为目标聚类合并阈值。
根据权利要求1或2所述的方法，其特征在于，所述确定所述两个待分类图像之间的目标聚类合并阈值，包括：

获取预设聚类合并阈值；

判断所述两个待分类图像中的人脸姿态信息是否分别为不同角度姿态信息；

当所述两个待分类图像中的人脸姿态信息分别为不同角度姿态信息，按照预设方式减小所述预设聚类合并阈值，将减小后的所述预设聚类合并阈值作为目标聚类合并阈值。
根据权利要求1或2所述的方法，其特征在于，所述确定所述两个待分类图像之间的目标聚类合并阈值，包括：

获取预设聚类合并阈值；

判断所述两个待分类图像中的人脸姿态信息是否都为正面姿态信息；

当所述两个待分类图像中的人脸姿态信息都为正面姿态信息时，将所述预设聚类合并阈值作为目标聚类合并阈值。
根据权利要求1所述的方法，其特征在于，所述利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类，包括：

计算所述两个待分类图像的聚类合并值；

判断所述聚类合并值是否大于所述目标聚类合并阈值；

当所述聚类合并值大于所述目标聚类合并阈值时，将所述两个待分类图像作为同一类图像；

当所述聚类合并值不大于所述目标聚类合并阈值时，将所述两个待分类图像作为不同类图像。
一种图像分类装置，其特征在于，包括：

人脸姿态信息确定模块，用于在获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息；

目标聚类合并阈值确定模块，用于根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值；

图像分类模块，用于利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类。
根据权利要求7所述的装置，其特征在于，还包括：

相似度计算模块，用于计算所述两个待分类图像之间的相似度；

阈值判断模块，用于判断所述相似度是否大于预设阈值。
根据权利要求7或8所述的装置，其特征在于，所述目标聚类合并阈值确定模块，包括：

第一聚类合并阈值获取子模块，用于获取预设聚类合并阈值；

大角度姿态信息判断子模块，用于判断所述两个待分类图像中的人脸姿态信息是否都是大角度姿态信息；

第一目标聚类合并阈值子模块，用于当所述两个待分类图像中的人脸姿态信息都是大角度姿态信息时，按预设方式增大所述预设聚类合并阈值，将所述增大后的所述预设聚类合并阈值作为目标聚类合并阈值。
根据权利要求7或8所述的装置，其特征在于，所述目标聚类合并阈值确定模块，包括：

第二聚类合并阈值获取子模块，用于获取预设聚类合并阈值；

不同角度姿态信息判断子模块，用于判断所述两个待分类图像中的人脸姿态信息是否分别为不同角度姿态信息；

第二目标聚类合并阈值子模块，用于在所述两个待分类图像中的人脸姿态信息分别为不同角度姿态信息，按照预设方式减小所述预设聚类合并阈值，将减小后的所述预设聚类合并阈值作为目标聚类合并阈值。
根据权利要求7或8所述的装置，其特征在于，所述目标聚类合并阈值确定模块，包括：

第三聚类合并阈值获取子模块，用于获取预设聚类合并阈值；

正面姿态信息判断子模块，用于判断所述两个待分类图像中的人脸姿态信息是否都为正面姿态信息；

第三目标聚类合并阈值子模块，用于在所述两个待分类图像中的人脸姿态信息都为正面姿态信息时，将所述预设聚类合并阈值作为目标聚类合并阈值。
根据权利要求7所述的装置，其特征在于，所述图像分类模块，包括：

聚类合并值计算子模块，用于计算所述两个待分类图像的聚类合并值；

聚类合并值判断子模块，用于判断所述聚类合并值是否大于所述目标聚类合并阈值；

同一类图像确定子模块，用于在所述聚类合并值大于所述目标聚类合并阈值时，将所述两个待分类图像作为同一类图像；

不同类图像确定子模块，用于在所述聚类合并值不大于所述目标聚类合并阈值时，将所述两个待分类图像作为不同类图像。
一种终端，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

当获取到都包含人脸特征信息的两个待分类图像时，根据预先建立的人脸姿态分类器模型，分别确定所述两个待分类图像中的人脸姿态信息；

根据所述两个待分类图像中的人脸姿态信息，确定所述两个待分类图像之间的目标聚类合并阈值；

利用确定得到的所述目标聚类合并阈值对所述两个待分类图像进行分类。