CN105654039B

CN105654039B - 图像处理的方法和装置

Info

Publication number: CN105654039B
Application number: CN201510983113.2A
Authority: CN
Inventors: 陈志军; 李明浩; 侯文迪
Original assignee: Xiaomi Inc
Current assignee: Xiaomi Inc
Priority date: 2015-12-24
Filing date: 2015-12-24
Publication date: 2019-09-17
Anticipated expiration: 2035-12-24
Also published as: CN105654039A

Abstract

本公开是关于一种图像处理的方法和装置，属于图像处理领域。所述方法包括：获取至少两个聚类集合，所述至少两个聚类集合包括第一聚类集合和第二聚类集合，所述第一聚类集合为具有标识信息的所述聚类集合，所述第二聚类集合为不具有所述标识信息的所述聚类集合，每个所述聚类集合均包括至少一幅人脸图像，且同一个所述聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值；确定所述第二聚类集合与所述第一聚类集合之间的距离；将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并，所述第二设定阈值大于所述第一设定阈值。本公开提高了聚类的召回率和压缩率。

Description

图像处理的方法和装置

技术领域

本公开涉及图像处理领域，尤其涉及一种图像处理的方法和装置。

背景技术

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。利用人脸识别技术，能够识别照片中的人物身份，并根据照片中的人物身份将属于同一个人的照片归类到一个簇中。

在人脸识别的过程中，可以采用层次聚类算法判断两个人脸是否属于同一个人：计算两个人脸图像对应的人脸特征向量之间的距离；比较计算出的距离与距离阈值的大小；若计算出的阈值不大于距离阈值，则判定两个人脸图像属于同一个人；若计算出的阈值大于距离阈值，则判定两个人脸图像不属于同一个人。

但是，当出现照片中的人脸姿态、表情、光照等条件不同的情况时，同一个人的人脸特征向量之间相似度较低(即距离较远)，层次聚类算法很容易判定两个人脸不属于同一个人，从而将属于同一个人的两张照片归类到不同的簇中，导致聚类的召回率(归类到一个簇中的照片数量/属于同一个人的照片数量)和压缩率(1/属于同一个人的照片归类到的簇数)较低。

发明内容

为克服相关技术中存在聚类的召回率和压缩率较低的问题，本公开提供一种图像处理的方法和装置。

根据本公开实施例的第一方面，提供一种图像处理的方法，包括：

获取至少两个聚类集合，所述至少两个聚类集合包括第一聚类集合和第二聚类集合，所述第一聚类集合为具有标识信息的所述聚类集合，所述第二聚类集合为不具有所述标识信息的所述聚类集合，每个所述聚类集合均包括至少一幅人脸图像，且同一个所述聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值；

确定所述第二聚类集合与所述第一聚类集合之间的距离；

将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并，所述第二设定阈值大于所述第一设定阈值。

通过将具有标识信息的聚类集合中的各幅人脸图像之间的距离从第一设定阈值增大到第二设定阈值，利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点，使用户关注的人的聚类集合具有标识信息，在对聚类的准确率影响较小的情况下，增大归类为具有标识信息的聚类集合的概率，避免由于人脸姿态、表情、光照等条件不同造成将属于同一个人的两张照片归类到不同的簇中，提高了聚类的召回率(归类到一个簇中的照片数量/属于同一个人的照片数量)和压缩率(1/属于同一个人的照片归类到的簇数)。

在第一方面一种可能的实现方式中，所述确定所述第二聚类集合与所述第一聚类集合之间的距离，包括：

计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离；

根据计算出的所有距离，确定所述第一聚类集合与所述第二聚类集合之间的距离。

通过计算第一聚类集合中的各幅人脸图像与第二聚类集合中的各幅人脸图像之间的距离，实现确定第一聚类集合与第二聚类集合之间的距离。

可选地，所述计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离，包括：

分别提取所述第一聚类集合中的一幅人脸图像的纹理特征值、以及所述第二聚类集合中的一幅人脸图像的纹理特征值；

根据提取的所述纹理特征值，计算所述第一聚类集合中的一幅人脸图像与所述第二聚类集合中的一幅人脸图像之间的距离。

通过目前常用的纹理特征值确定人脸图像之间的距离，实现算法成熟，准确率高。

可选地，所述根据计算出的所有距离，确定所述第一聚类集合与所述第二聚类集合之间的距离，包括：

选择计算出的所有距离中的最小值，作为所述第一聚类集合与所述第二聚类集合之间的距离；

或者，

选择计算出的所有距离的平均值，作为所述第一聚类集合与所述第二聚类集合之间的距离；

或者，

选择计算出的所有距离中的最大值，作为所述第一聚类集合与所述第二聚类集合之间的距离。

根据实际情况，选择不同的距离作为第一聚类集合与第二聚类集合之间的距离。

在第一方面另一种可能的实现方式中，当所述至少两个聚类集合包括至少两个所述第一聚类集合时，所述将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并，包括：

当所述第二聚类集合与第三聚类集合之间的距离不大于所述第二设定阈值，且所述第二聚类集合与第四聚类集合之间的距离大于所述第二设定阈值时，将所述第二聚类集合与所述第三聚类集合合并，所述第三聚类集合为所述至少两个所述第一聚类集合中的任意一个，所述第四聚类集合包括所述至少两个所述第一聚类集合中，除所述第三聚类集合之外的所有所述聚类集合。

将判断两个聚类集合是否合并的标准从第一设定阈值增加到第二设定阈值，可能会造成将不是同一个人的两个聚类集合合并为一个聚类集合的问题，虽然利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点，使用户关注的人的聚类集合成为第一聚类集合(具有标识信息)，仅对第一聚类集合将合并标准增加到第二设定阈值，可以降低将不是同一个人的两个聚类集合合并为一个聚类集合的可能性，但还是可能会造成聚类的准确性降低。上述实现方式通过进一步将条件限定为一个所述第二聚类集合与一个所述第一聚类集合之间的距离不大于所述第二设定阈值，且与其它所述第一聚类集合之间的距离大于所述第二设定阈值，可以进一步降低将不是同一个人的两个聚类集合合并为一个聚类集合的可能性。而且一个第二聚类集合只与一个第一聚类集合之间的距离不大于第二设定阈值，说明这个第一聚类集合跟其中一个第一聚类集合的相似度是比较高的，很可能是由于人脸姿态、表情、光照等条件不同造成两者的距离大于第一设定阈值，此时将两者合并，既提高了聚类的召回率和压缩率，还可以将降低聚类的准确率的可能性降到最低。

在第一方面又一种可能的实现方式中，所述方法还包括：

输出若干所述聚类集合；

接收对应所述聚类集合输入的所述标识信息，输入所述标识信息的所述聚类集合成为所述第一聚类集合。

通过输出聚类集合供用户选择，并接收用户对应聚类集合输入的标识信息，使用户关注的人的聚类集合具有标识信息，即成为第一聚类集合。

可选地，所述输出若干所述聚类集合，包括：

获取至少两个所述聚类集合；

计算各个所述聚类集合之间的距离；

当两个所述聚类集合之间的距离不大于所述第一设定阈值时，将两个所述聚类集合合并，并判断合并后的所述聚类集合是否需要再次合并；

当各个所述聚类集合两两之间的距离均大于所述第一设定阈值时，将当前的若干所述聚类集合输出。

先对人脸图像以第一设定阈值为判断标准进行聚类，提高聚类的准确性。

根据本公开实施例的第二方面，提供一种图像处理的装置，包括：

获取模块，用于获取至少两个聚类集合，所述至少两个聚类集合包括第一聚类集合和第二聚类集合，所述第一聚类集合为具有标识信息的所述聚类集合，所述第二聚类集合为不具有所述标识信息的所述聚类集合，每个所述聚类集合均包括至少一幅人脸图像，且同一个所述聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值；

确定模块，用于确定所述第二聚类集合与所述第一聚类集合之间的距离；

合并模块，用于将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并，所述第二设定阈值大于所述第一设定阈值。

在第二方面一种可能的实现方式中，所述确定模块包括：

第一计算子模块，用于计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离；

确定子模块，用于根据计算出的所有距离，确定所述第一聚类集合与所述第二聚类集合之间的距离。

可选地，所述第一计算子模块用于，

可选地，所述确定子模块用于，

或者，

在第二方面另一种可能的实现方式中，所述合并模块用于，

当所述至少两个聚类集合包括至少两个所述第一聚类集合时，若所述第二聚类集合与第三聚类集合之间的距离不大于所述第二设定阈值，且所述第二聚类集合与第四聚类集合之间的距离大于所述第二设定阈值，则将所述第二聚类集合与所述第三聚类集合合并，所述第三聚类集合为所述至少两个所述第一聚类集合中的任意一个，所述第四聚类集合包括所述至少两个所述第一聚类集合中，除所述第三聚类集合之外的所有所述聚类集合。

在第二方面又一种可能的实现方式中，所述装置还包括：

输出模块，用于输出若干所述聚类集合；

接收模块，用于接收对应所述聚类集合输入的所述标识信息，输入所述标识信息的所述聚类集合成为所述第一聚类集合。

可选地，所述输出模块包括：

获取子模块，用于获取至少两个所述聚类集合；

第二计算子模块，用于计算各个所述聚类集合之间的距离；

合并子模块，用于当两个所述聚类集合之间的距离不大于所述第一设定阈值时，将两个所述聚类集合合并，并判断合并后的所述聚类集合是否需要再次合并；

输出子模块，用于当各个所述聚类集合两两之间的距离均大于所述第一设定阈值时，将当前的若干所述聚类集合输出。

根据本公开实施例的第三方面，提供一种图像处理的装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

确定所述第二聚类集合与所述第一聚类集合之间的距离；

本公开的实施例提供的技术方案可以包括以下有益效果：通过将具有标识信息的聚类集合中的各幅人脸图像之间的距离从第一设定阈值增大到第二设定阈值，利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点，使用户关注的人的聚类集合具有标识信息，在对聚类的准确率影响较小的情况下，增大归类为具有标识信息的聚类集合的概率，避免由于人脸姿态、表情、光照等条件不同造成将属于同一个人的两张照片归类到不同的聚类集合中，提高了聚类的召回率(归类到一个聚类集合中的照片数量/属于同一个人的照片数量)和压缩率(1/属于同一个人的照片归类到的聚类集合的数量)。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1a-图1d是根据一示例性实施例示出的一种图像处理的方法的应用场景图；

图2是根据一示例性实施例示出的一种图像处理的方法的流程图；

图3是根据一示例性实施例示出的一种图像处理的方法的流程图；

图4是根据一示例性实施例示出的一种人脸检测结果的示意图；

图5是根据一示例性实施例示出的一种图像处理的方法实现过程中的终端界面图；

图6是根据一示例性实施例示出的一种图像处理的装置的框图；

图7是根据一示例性实施例示出的一种图像处理的装置的框图；

图8是根据一示例性实施例示出的一种图像处理的装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

下面先结合图1a-图1d简单介绍一下本公开实施例提供的图像处理的方法的应用场景。

随着智能手机、平板电脑等移动终端的普及，越来越多的用户选择使用移动终端拍摄照片，移动终端本端或者移动终端通过网络连接的云端存储有大量照片，如图1a所示。这些照片中，有些拍摄的是用户关注的人，如自己、亲人、朋友、同事等；也有些拍摄的是用户不关注的人，如路人、拍摄到的非相关人物等；还有些拍摄的是没有人物的，如风景、名胜古迹等。

为了方便用户查找和使用，移动终端自身或通过服务器将存储的照片按照拍摄的人物归类形成相册，每个相册包括一个人物的所有照片，各个相册包括的照片所属的人物不同，如图1b所示的小米“面孔相册”。

其中，各个相册中可以展示一个人物的所有照片，如图1c所示；也可以展示一个人物在所有照片中的人脸图像，如图1d所示的，增加照片的趣味性，提升用户体验。

图2是根据一示例性实施例示出的一种图像处理的方法的流程图，如图2所示，该图像处理的方法用于移动终端中，包括以下步骤。

在步骤S101中，获取至少两个聚类集合。

在本实施例中，至少两个聚类集合包括第一聚类集合和第二聚类集合。第一聚类集合为具有标识信息的聚类集合，第二聚类集合为不具有标识信息的聚类集合。每个聚类集合均包括至少一幅人脸图像，且同一个聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值。其中各幅人脸图像之间的距离可以为欧式距离、余弦距离等，本公开对此不作限制。

结合本公开的应用场景，获取的至少两个聚类集合来自于移动终端存储的照片归类形成的相册，标识信息用于指示其中属于用户关注的人的相册，如用户自己的相册、用户孩子的相册、用户父母的相册、用户死党的相册等。

在步骤S102中，确定第二聚类集合与第一聚类集合之间的距离。

需要说明的是，若移动终端的运算能力强大，则步骤S102可以由移动终端独立完成，实现简单方便；若移动终端的运算能力不够，则步骤S102可以由移动终端通过服务器完成，即移动终端向服务器上传第二聚类集合和第一聚类集合并接收服务器确定的第二聚类集合与第一聚类集合之间的距离，降低对移动终端的要求，降低实现成本。

在步骤S103中，将距离不大于第二设定阈值的第二聚类集合和第一聚类集合合并。

在本实施例中，第二设定阈值大于第一设定阈值。

本公开实施例通过将具有标识信息的聚类集合中的各幅人脸图像之间的距离从第一设定阈值增大到第二设定阈值，利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点，使用户关注的人的聚类集合具有标识信息，在对聚类的准确率影响较小的情况下，增大归类为具有标识信息的聚类集合的概率，避免由于人脸姿态、表情、光照等条件不同造成将属于同一个人的两张照片归类到不同的聚类集合中，提高了聚类的召回率(归类到一个聚类集合中的照片数量/属于同一个人的照片数量)和压缩率(1/属于同一个人的照片归类到的聚类集合的数量)。

图3是根据一示例性实施例示出的一种图像处理的方法的流程图，如图3所示，该图像处理的方法用于移动终端中，包括以下步骤。

在步骤S201中，获取若干张照片。

由本公开应用场景部分可知，移动终端将存储的照片按照拍摄的人物聚类形成相册，每个相册包括一个人物的所有照片，即移动终端会在初始阶段对所有照片进行全量聚类，并在后续阶段对新增照片进行增量聚类。步骤S201中获取的照片为初始阶段中聚类前的所有照片，也可以为后续阶段中聚类前的新增照片。

在实际应用中，移动终端通常通过名称为“照片”的应用程序(application，简称app)负责管理移动终端中的所有照片及照片的聚类情况，因此可以直接从“照片”app中获取照片。

在步骤S202中，采用人脸检测算法，从各张照片中获取人脸图像。

在本实施例中，人脸图像为照片中包括整个人脸的最小图像，如图4所示的矩形框内的图像。

在本实施例的一种实现方式中，该步骤S202可以包括：

提取一张照片的haar特征值；

根据提取的haar特征值，从该照片中确定出人脸图像。

容易知道，脸部的一些特征可以由矩形特征简单的描述，如眼睛比脸颊的颜色深，鼻梁两侧比鼻梁颜色深，嘴巴比嘴巴周围颜色深等。haar特征值通过取值为特征模板内白色矩形像素和减去黑色矩形像素和，反映了图像的灰度变化情况，从而可以根据haar特征值确定是否为人脸图像。其中，特征模板可以为左侧白色矩形和右侧白色矩形的组合，上侧白色矩形与下侧黑色矩形的组合，两侧白色矩形与中间黑色矩形的组合，左上侧和右下侧白色矩形与右上侧和左下侧黑色矩形的组合等。

在实际应用中，也可以采用其它人脸检测算法从一张照片中获取人脸图像，如Adaboost算法，在此不再一一列举。

需要说明的是，若一张照片为至少两个人的合影，则在步骤S202中会从该照片中会相应确定出至少两幅人脸图像。

在步骤S203中，将获取的各幅人脸图像单独归类为一个聚类集合，得到若干聚类集合。

需要说明的是，当获取的照片为初始阶段中聚类前的照片时，步骤S203得到的若干聚类集合就是所有单独归类的聚类集合，以进行全量聚类。例如，步骤S202中获取到N幅人脸图像，则步骤S203中得到N个聚类集合。

当获取的照片为后续阶段中聚类前的新增照片时，该步骤S203可以包括：

将获取的各幅人脸图像单独归类为一个聚类集合；

将单独归类的聚类集合与已进行聚类的聚类集合一起，作为得到的若干聚类集合。

即步骤S203得到的若干聚类集合除了包括所有单独归类的聚类集合之外，还包括已进行聚类的聚类集合，以进行增量聚类。例如，步骤S202中获取到M幅人脸图像，加上之前聚类得到的L个聚类集合，则步骤S203中得到(M+L)个聚类集合。

可以理解地，通过步骤S201-步骤S203，可以对移动终端存储的照片进行初始化，使后续聚类时可以获取各个聚类集合进行聚类，详见步骤S204-步骤S207。

在步骤S204中，获取至少两个聚类集合。

需要说明的是，该步骤S204中获取的聚类集合来自于步骤S203中得到的若干聚类集合。

步骤S205中，计算各个聚类集合之间的距离。当两个聚类集合之间的距离不大于第一设定阈值时，执行步骤S206；当所有聚类集合两两之间的距离均大于第一设定阈值时，执行步骤S207。

在本实施例的一种实现方式中，该步骤S205可以包括：

分别提取两个聚类集合中的各幅人脸图像的纹理特征值；

根据提取的纹理特征值，计算两个聚类集合中的各幅人脸图像之间的距离；

选择计算出的所有距离中的最小值、平均值或最大值，作为两个聚类集合之间的距离。

在上述实现方式中，两个聚类集合中的各幅人脸图像之间的距离是指，两个聚类集合中一个聚类集合中的各幅人脸图像，与两个聚类集合中另一个聚类集合的各幅人脸图像之间的距离。例如，一个聚类集合包括人脸图像A和人脸图像B，另一个聚类集合包括人脸图像C和人脸图像D，则计算人脸图像A与人脸图像C之间的距离、人脸图像A与人脸图像D之间的距离、人脸图像B与人脸图像C之间的距离、以及人脸图像B与人脸图像D之间的距离。

可以理解地，分别按照上述方式计算各个聚类集合两两之间的距离，即可完成步骤S205。

可选地，分别提取两个聚类集合中的各幅人脸图像的纹理特征值，可以包括：

对一幅人脸图像采用Gabor小波变换进行特征提取，并将计算得到的Gabor特征向量作为该幅人脸图像的纹理特征值。

对一幅人脸图像采用局部二值模式(Local Binary Patterns，简称LBP)算子计算各像素与其周围像素的关系，并将形成的特征向量作为该幅人脸图像的纹理特征值。

需要说明的是，分别对两个聚类集合中的各幅人脸图像按照上述两种方式中的任意一种提取纹理特征值，即可提取两个聚类集合中的所有人脸图像的纹理特征值。在实际应用中，也可以采用其它特征提取算法分别提取各幅人脸图像的纹理特征值，在此不再一一列举。

可选地，根据提取的纹理特征值，计算两个聚类集合中的各幅人脸图像之间的距离，可以包括：

将提取的纹理特征值带入欧式距离公式中，计算一个聚类集合中的一幅人脸图像与另一个聚类集合中的一幅人脸图像之间的距离。

将提取的纹理特征值带入余弦相似度公式中，将1-余弦相似度的值作为一个聚类集合中的一幅人脸图像与另一个聚类集合中的一幅人脸图像之间的距离。

需要说明的是，分别对两个聚类集合中的各幅人脸图像按照上述两种方式中的任意一种计算距离，即可计算出一个聚类集合中的各幅人脸图像与另一个聚类集合中的各幅人脸图像之间的距离。在实际应用中，也可以采用其它距离计算方式计算两幅人脸图像之间的距离，在此不再一一列举。

在步骤S206中，将两个聚类集合合并为一个聚类集合，并对合并后的聚类集合再次执行步骤S205。

例如，执行步骤S206之前，一个聚类集合包括人脸图像A和人脸图像B，另一个聚类集合包括人脸图像C和人脸图像D，又一个聚类集合包括人脸图像E和人脸图像F。执行步骤S206之后，一个聚类集合包括人脸图像A、人脸图像B、人脸图像C和人脸图像D，另一个聚类集合包括人脸图像E和人脸图像F。此时再执行步骤S205，确定是否将人脸图像A、人脸图像B、人脸图像C、人脸图像D，与人脸图像E、人脸图像F合并为一个聚类集合。

在步骤S207中，将当前的若干聚类集合输出。

例如，如图1b所示，移动终端可以以相册的形式将若干聚类集合输出。

在本实施例中，各个聚类集合包括至少一幅人脸图像，且同一个聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值。

可选地，该步骤S207可以包括：

从当前的若干聚类集合中确定人脸图像的数量不小于设定数量的聚类集合；

输出确定的聚类集合。

在实际应用中，用户关注的人的人脸图像的数量通常较多，利用该特点从若干聚类集合中选出不小于设定数量(如3幅)的聚类集合输出，可以减少用户标记聚类集合时查看的聚类集合的数量。

需要说明的是，上述步骤S204-步骤S207只是根据人脸图像的距离对人脸图像进行聚类，在实际应用中，还可以根据人脸图像的性别、年龄、种族、衣服、眼镜信息、人脸图像在照片中的位置、照片的拍摄时间等信息辅助实现对人脸图像进行聚类。

在步骤S208中，接收对应聚类集合输入的标识信息，使若干聚类集合中的至少一个聚类集合具有标识信息。

在本实施例中，标识信息用于指示用于关注的人的聚类集合，如用户自己的聚类集合、用户孩子的聚类集合、用户父母的聚类集合、用户死党的聚类集合等。本实施例将具有标识信息的聚类集合称为第一聚类集合，不具有标识信息的聚类集合称为第二聚类集合，因此步骤S208中输入标识信息的聚类集合成为第一聚类集合。

在实际应用中，移动终端可以设置接口接收用户对应聚类集合所作的标识信息，如用户点击图5所示的相册，即可在相册上显示星星，以表示该相册具有标识信息。

移动终端还可以根据用户输入的聚类集合的名称，通过对比聚类集合的名称是否包括设定名称，确定聚类集合是否属于用户关注的人，如图5中名称中出现“爸”、“妈”、“宝贝”等。

在步骤S209中，获取至少两个聚类集合。

在本实施例中，至少两个聚类集合包括第一聚类集合和第二聚类集合。如前所述，第一聚类集合为具有标识信息的聚类集合，第二聚类集合为不具有标识信息的聚类集合。容易知道，该步骤S209中获取的至少两个聚类集合来自于步骤S208执行之后的若干聚类集合。

在步骤S210中，确定各个第二聚类集合与各个第一聚类集合之间的距离。

在本实施例中，该步骤S210可以包括：

计算一个第一聚类集合中的各幅人脸图像与一个第二聚类集合中的各幅人脸图像之间的距离；

根据计算出的所有距离，确定第一聚类集合与第二聚类集合之间的距离。

容易知道，分别按照上述方式计算各个第二聚类集合与各个第一聚类集合之间的距离，即可完成步骤S208。

可选地，计算一个第一聚类集合中的各幅人脸图像与一个第二聚类集合中的各幅人脸图像之间的距离，包括：

分别提取一个第一聚类集合中的一幅人脸图像的纹理特征值、以及一个第二聚类集合中的一幅人脸图像的纹理特征值；

根据提取的纹理特征值，计算第一聚类集合中的一幅人脸图像与第二聚类集合中的一幅人脸图像之间的距离。

在具体实现中，提取纹理特征值可以采用如步骤S205中的Gabor小波变换、LBP算子实现，计算图像距离可以采用如步骤S205中的欧式距离、余弦相似度实现，在此不再详述。

可选地，根据计算出的所有距离，确定第一聚类集合与第二聚类集合之间的距离，可以包括：

选择计算出的所有距离中的最小值，作为第一聚类集合与第二聚类集合之间的距离。

例如，一个聚类集合包括人脸图像A和人脸图像B，另一个聚类集合包括人脸图像C和人脸图像D，计算出人脸图像A与人脸图像C之间的距离为0.3，人脸图像A与人脸图像D之间的距离为0.7，人脸图像B与人脸图像C之间的距离为0.5，人脸图像B与人脸图像D之间的距离为0.1，则将0.1作为第一聚类集合与第二聚类集合之间的距离。

选择计算出的所有距离的平均值，作为第一聚类集合与第二聚类集合之间的距离。

还是以上例为例，此时将(0.3+0.7+0.5+0.1)/4＝0.4作为第一聚类集合与第二聚类集合之间的距离。

选择计算出的所有距离中的最大值，作为第一聚类集合与第二聚类集合之间的距离。

还是以上例为例，此时将0.7作为第一聚类集合与第二聚类集合之间的距离。

在步骤S211中，将距离不大于第二设定阈值的第二聚类集合和第一聚类集合合并为一个聚类集合。

在本实施例中，第二设定阈值大于第一设定阈值。例如，第一设定阈值为θ，第二设定阈值为(θ+α)，θ＞0、α＞0

优选地，以一个第二聚类集合为例，当至少两个聚类集合包括至少两个第一聚类集合时，该步骤S211可以包括：

当第二聚类集合与第三聚类集合之间的距离不大于第二设定阈值，且第二聚类集合与第四聚类集合之间的距离大于第二设定阈值时，将第二聚类集合与第三聚类集合合并，第三聚类集合为至少两个第一聚类集合中的任意一个，第四聚类集合包括至少两个第一聚类集合中，除第三聚类集合之外的所有聚类集合。

容易知道，将判断两个聚类集合是否合并的标准从第一设定阈值增加到第二设定阈值，可能会造成将不是同一个人的两个聚类集合合并为一个聚类集合的问题，虽然利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点，使用户关注的人的聚类集合具有标识信息，仅对具有标识信息的聚类集合(即第一聚类集合)将合并标准增加到第二设定阈值，可以降低将不是同一个人的两个聚类集合合并为一个聚类集合的可能性，但还是可能会造成聚类的准确性降低。上述实现方式通过进一步将条件限定为一个不具有标识信息的聚类集合(即第二聚类集合)与一个具有标识信息的聚类集合(即第一聚类集合)之间的距离不大于第二设定阈值，且与其它具有标识信息的聚类集合之间的距离大于第二设定阈值，可以进一步降低将不是同一个人的两个聚类集合合并为一个聚类集合的可能性。而且一个不具有标识信息的聚类集合只与一个具有标识信息的聚类集合之间的距离不大于第二设定阈值，说明这个不具有标识信息的聚类集合跟其中一个具有标识信息的聚类集合的相似度是比较高的，很可能是由于人脸姿态、表情、光照等条件不同造成两者的距离大于第一设定阈值，此时将两者合并，既提高了聚类的召回率和压缩率，还可以将降低聚类的准确率的可能性降到最低。

需要说明的是，本实施例仅对人脸图像的聚类进行了介绍，在实际应用中，移动终端在聚类之后，会将同一个聚类集合的所有人脸图像归类到一个相册中，同时由于人脸图像来自于照片，因此将同一个聚类集合中的所有人脸图像所在的照片也归类到该相册中，为用户提供人脸图像和照片两种显示方式，其中人脸图像的显示方式可以如图1d所示，照片的显示方式可以如图1c所示。

图6是根据一示例性实施例示出的一种图像处理的装置的框图，参照图6，该装置包括获取模块301、确定模块302和合并模块303。

该获取模块301被配置为获取至少两个聚类集合，至少两个聚类集合包括第一聚类集合和第二聚类集合，第一聚类集合为具有标识信息的聚类集合，第二聚类集合为不具有标识信息的聚类集合，每个聚类集合均包括至少一幅人脸图像，且同一个聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值。

该确定模块302被配置为确定第二聚类集合与第一聚类集合之间的距离。

该合并模块303被配置为将距离不大于第二设定阈值的第二聚类集合和第一聚类集合合并，第二设定阈值大于第一设定阈值。

本公开实施例将具有标识信息的聚类集合中的各幅人脸图像之间的距离从第一设定阈值增大到第二设定阈值，利用用户关注的人的人脸图像在所有人脸图像中所占比例高的特点，使用户关注的人的聚类集合具有标识信息，在对聚类的准确率影响较小的情况下，增大归类为具有标识信息的聚类集合的概率，避免由于人脸姿态、表情、光照等条件不同造成将属于同一个人的两张照片归类到不同的聚类集合中，提高了聚类的召回率(归类到一个聚类集合中的照片数量/属于同一个人的照片数量)和压缩率(1/属于同一个人的照片归类到的聚类集合的数量)。

图7是根据一示例性实施例示出的一种图像处理的装置的框图，参照图7，该装置包括获取模块401、确定模块402和合并模块403。

该获取模块401被配置为获取至少两个聚类集合，至少两个聚类集合包括第一聚类集合和第二聚类集合，第一聚类集合为具有标识信息的聚类集合，第二聚类集合为不具有标识信息的聚类集合，每个聚类集合均包括至少一幅人脸图像，且同一个聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值。

该确定模块402被配置为确定第二聚类集合与第一聚类集合之间的距离。

该合并模块403被配置为将距离不大于第二设定阈值的第二聚类集合和第一聚类集合合并，第二设定阈值大于第一设定阈值。

在本实施例的一种实现方式中，该确定模块402可以包括第一计算子模块402a和确定子模块402b。

该第一计算子模块402a被配置为计算第一聚类集合中的各幅人脸图像与第二聚类集合中的各幅人脸图像之间的距离。

该确定子模块402b被配置为根据计算出的所有距离，确定第一聚类集合与第二聚类集合之间的距离。

可选地，该第一计算子模块402a可以被配置为分别提取第一聚类集合中的一幅人脸图像的纹理特征值、以及第二聚类集合中的一幅人脸图像的纹理特征值；根据提取的纹理特征值，计算第一聚类集合中的一幅人脸图像与第二聚类集合中的一幅人脸图像之间的距离。

可选地，该确定子模块402b可以被配置为选择计算出的所有距离中的最小值，作为第一聚类集合与第二聚类集合之间的距离；或者，选择计算出的所有距离的平均值，作为第一聚类集合与第二聚类集合之间的距离；或者，选择计算出的所有距离中的最大值，作为第一聚类集合与第二聚类集合之间的距离。

在本实施例的另一种实现方式中，该合并模块403可以被配置为当至少两个聚类集合包括至少两个第一聚类集合时，若第二聚类集合与第三聚类集合之间的距离不大于第二设定阈值，且第二聚类集合与第四聚类集合之间的距离大于第二设定阈值，则将第二聚类集合与第三聚类集合合并，第三聚类集合为至少两个第一聚类集合中的任意一个，第四聚类集合包括至少两个第一聚类集合中，除第三聚类集合之外的所有聚类集合。

在本实施例的又一种实现方式中，该装置还可以包括输出模块404和接收模块405。

该输出模块404被配置为输出若干聚类集合。

该接收模块405被配置为接收对应聚类集合输入的标识信息，输入标识信息的聚类集合成为第一聚类集合。

可选地，该输出模块404可以包括获取子模块404a、第二计算子模块404b、合并子模块404c和输出子模块404d。

该获取子模块404a被配置为获取至少两个聚类集合。

该第二计算子模块404b被配置为计算各个聚类集合之间的距离。

该合并子模块404c被配置为当两个聚类集合之间的距离不大于第一设定阈值时，将两个聚类集合合并，并判断合并后的聚类集合是否需要再次合并。

该输出子模块404d被配置为当各个聚类集合两两之间的距离均大于第一设定阈值时，将当前的若干聚类集合输出。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图8是根据一示例性实施例示出的一种图像处理的装置800的框图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图8，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电力组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种图像处理的方法，所述方法包括：

确定所述第二聚类集合与所述第一聚类集合之间的距离；

在本实施例的一种实现方式中，所述确定所述第二聚类集合与所述第一聚类集合之间的距离，包括：

或者，

在本实施例的另一种实现方式中，当所述至少两个聚类集合包括至少两个所述第一聚类集合时，所述将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并，包括：

在本实施例的又一种实现方式中，所述方法还包括：

输出若干所述聚类集合；

可选地，所述输出若干所述聚类集合，包括：

获取至少两个所述聚类集合；

计算各个所述聚类集合之间的距离；

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种图像处理的方法，其特征在于，包括：

从若干聚类集合中确定人脸图像的数量不小于设定数量的所述聚类集合；

输出确定的所述聚类集合；

接收对应所述聚类集合输入的标识信息，所述标识信息用于指示属于用户关注的人的聚类集合；

获取至少两个聚类集合，所述至少两个聚类集合包括第一聚类集合和第二聚类集合，所述第一聚类集合为具有所述标识信息的所述聚类集合，所述第二聚类集合为不具有所述标识信息的所述聚类集合，每个所述聚类集合均包括至少一幅人脸图像，且同一个所述聚类集合中的各幅人脸图像之间的距离不大于第一设定阈值；

确定所述第二聚类集合与所述第一聚类集合之间的距离；

2.根据权利要求1所述的方法，其特征在于，所述确定所述第二聚类集合与所述第一聚类集合之间的距离，包括：

3.根据权利要求2所述的方法，其特征在于，所述计算所述第一聚类集合中的各幅人脸图像与所述第二聚类集合中的各幅人脸图像之间的距离，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据计算出的所有距离，确定所述第一聚类集合与所述第二聚类集合之间的距离，包括：

或者，

5.根据权利要求1-4任一项所述的方法，其特征在于，当所述至少两个聚类集合包括至少两个所述第一聚类集合时，所述将距离不大于第二设定阈值的所述第二聚类集合和所述第一聚类集合合并，包括：

6.根据权利要求1所述的方法，其特征在于，所述输出若干所述聚类集合，包括：

获取至少两个所述聚类集合；

计算各个所述聚类集合之间的距离；

7.一种图像处理的装置，其特征在于，包括：

输出模块，用于从若干聚类集合中确定人脸图像的数量不小于设定数量的所述聚类集合，输出确定的所述聚类集合；

接收模块，用于接收对应所述聚类集合输入的标识信息，输入所述标识信息的所述聚类集合成为第一聚类集合；

8.根据权利要求7所述的装置，其特征在于，所述确定模块包括：

9.根据权利要求8所述的装置，其特征在于，所述第一计算子模块用于，

10.根据权利要求8所述的装置，其特征在于，所述确定子模块用于，

或者，

11.根据权利要求7-10任一项所述的装置，其特征在于，所述合并模块用于，

12.根据权利要求11所述的装置，其特征在于，所述输出模块包括：

获取子模块，用于获取至少两个所述聚类集合；

第二计算子模块，用于计算各个所述聚类集合之间的距离；

13.一种图像处理的装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

输出确定的所述聚类集合；

确定所述第二聚类集合与所述第一聚类集合之间的距离；

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括至少一条指令，所述至少一条指令被处理器执行时，执行权利要求1-6任一项所述的图像处理方法。