CN116737974A

CN116737974A - 用于人脸图像比对的阈值的确定方法、装置及电子设备

Info

Publication number: CN116737974A
Application number: CN202311030707.2A
Authority: CN
Inventors: 王英; 安佳宇
Original assignee: 4u Beijing Technology Co ltd
Current assignee: 4u Beijing Technology Co ltd
Priority date: 2023-08-16
Filing date: 2023-08-16
Publication date: 2023-09-12
Anticipated expiration: 2043-08-16
Also published as: CN116737974B

Abstract

本申请提供了一种用于人脸图像比对的阈值的确定方法、装置及电子设备，其中，该方法包括：获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值；分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。本申请解决了目前现有的用于人脸图像比对的距离阈值选取不适合的技术问题。

Description

用于人脸图像比对的阈值的确定方法、装置及电子设备

技术领域

本申请涉及计算机领域，具体而言，涉及一种用于人脸图像比对的阈值的确定方法、装置及电子设备。

背景技术

随着人的社交活动增多，智能手机中个人相册的照片数量不断增加，其中包含的人物也日益增多。然而，每张照片中的人脸尺寸、角度和光照等方面变化非常大，这给从大量相片中找到某个人的所有照片带来了挑战。为了方便用户管理相册，智能手机需要提供相片分拣功能，能够自动将相册中的照片按照人脸进行分堆。

分堆是人脸比对的一种延伸，而人脸比对是指对给定的两张人脸判断它们是否相似，并用一个数值来衡量相似程度。一般的人脸比对流程包括人脸检测、人脸关键点检测、人脸对齐、人脸特征提取以及计算比对人脸特征向量的余弦距离。通常，设定一个阈值，当相似度值小于该阈值时，判断为相似；相似度值大于该阈值时，判断为不相似。

然而，现有的方法在处理人脸图像时存在阈值选取不适合的问题，尤其是在人脸尺寸、角度和光照等方面变化非常大的情况下。由于阈值选取不适合，导致相似度计算不准确，进而影响了分堆的准确性。在这种情况下，分堆的结果可能不够稳定和可靠，对于大规模人脸图像的分类和识别任务可能会产生误判或漏判。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种用于人脸图像比对的阈值的确定方法、装置及电子设备，以至少解决目前现有的用于人脸图像比对的距离阈值选取不适合的技术问题。

根据本申请实施例的一个方面，提供了一种用于人脸图像比对的阈值的确定方法，包括：获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值；分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。

根据本申请实施例的另一方面，还提供了一种用于人脸图像比对的阈值的确定装置，包括：阈值计算模块，被配置为获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值；特征获取模块，被配置为分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；阈值调整模块，被配置为基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。

在本申请实施例中，分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值，从而解决了目前现有的用于人脸图像比对的距离阈值选取不适合的技术问题。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种用于人脸图像比对的阈值的确定方法的流程图；

图2是根据本申请实施例的一种基于距离阈值来判断人脸图像的相似度的方法的流程图；

图3是根据本申请实施例的一种特征向量的获取方法的流程图；

图4是根据本申请实施例的一种相似度的判断方法的流程图；

图5是根据本申请实施例的另一种基于距离阈值来判断人脸图像的相似度的方法的流程图；

图6是根据本申请实施例的一种用于人脸图像比对的阈值的确定装置的结构示意图；

图7示出了适于用来实现本公开实施例的电子设备的结构示意图。

其中，上述附图包括以下附图标记：

1001、CPU；1002、ROM；1003、RAM；1004、总线；1005、I/O接口；1006、输入部分；1007、输出部分；1008、存储部分；1009、通信部分；1010、驱动器；1011、可拆卸介质；62、阈值计算模块；64、特征获取模块；66、阈值调整模块。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论。在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

实施例1

本申请实施例提供了一种用于人脸图像比对的阈值的确定方法，如图1所示，该方法包括：

步骤S102，获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值。

例如，计算所述多个人脸样本图像中每两个人脸样本图像的相似度；基于所述每两个人脸样本图像的相似度预测所述每两个人脸样本图像为相似对或不相似对；在预设的阈值范围内遍历阈值，计算每个阈值对应的所述相似对的精度值和召回值、以及所述不相似对的精度值和召回值；根据所有阈值对应的所述相似对的精度值和召回值，得到所述相似对的精度召回曲线，根据所有阈值对应的所述不相似对的精度值和召回值，得到所述不相似对的精度召回曲线；基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述距离阈值。例如，基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述相似对的精度召回曲线和所述不相似对的精度召回曲线的变化趋势；基于所述变化趋势，找到精度和召回率在所述相似对的精度召回曲线上尽可能接近最大值而在所述不相似对的精度召回曲线上尽可能接近最小值的值，作为所述距离阈值。

本实施例通过统计和分析相似对和不相似对的精度和召回率，得到初步的距离阈值，从而可以提高人脸图像比对的效果和可靠性。

步骤S104，分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息。

步骤S106，基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。

1）确定属性特征对相似度的影响度。

在一些实施例中，比较所述多个人脸样本图像的创建时间，计算所述多个人脸样本图像的创建时间之间的平均时间间隔；基于所述平均时间间隔来调整所述影响度对应的权重，并基于所述权重来调整所述影响度，其中，所述平均时间间隔越大所述权重越小。

通过比较人脸样本图像的创建时间，可以了解这些图像之间的时间差异，即在拍摄时间上的间隔。计算平均时间间隔可以提供一个衡量人脸样本图像拍摄时间分布的指标。如果平均时间间隔较小，说明这些图像在时间上比较接近，可能来自同一场景或同一次拍摄，可能更相似；而如果平均时间间隔较大，说明这些图像在时间上较为分散，可能来自不同场景或不同时间，可能不太相似。

此外，通过对平均时间间隔的分析，可以得出人脸样本图像创建时间对相似度判断的影响程度。根据平均时间间隔的大小，调整影响度对应的权重，使得在相似度判断中更加合理地考虑时间因素的影响。例如，如果平均时间间隔较小，可能意味着时间因素对相似度有较大影响，可以增加时间因素的权重；而如果平均时间间隔较大，可能意味着时间因素对相似度影响较小，可以减小时间因素的权重。

在另外一些实施例中，比较所述多个人脸样本图像的地理位置信息，计算所述多个人脸样本图像的地理位置之间的平均地理距离；基于所述平均地理距离，调整所述影响度对应的权重，并基于所述权重来调整所述影响度，其中，所述平均地理距离越大所述权重越小。例如，利用所述地理位置信息，生成所述多个人脸样本图像的热力图，其中，所述热力图用于表征地理位置的密集程度；基于所述热力图来计算所述多个人脸样本图像的地理位置之间的平均地理距离。

通过比较人脸样本图像的地理位置信息，可以了解这些图像之间的地理距离。计算平均地理距离可以提供一个衡量人脸样本图像地理位置分布的指标。如果平均地理距离较小，说明这些图像在地理位置上比较接近，可能来自相近的地点，可能更相似；而如果平均地理距离较大，说明这些图像在地理位置上较为分散，可能来自不同地点，可能不太相似。

此外，通过对平均地理距离的分析，可以得出人脸样本图像地理位置对相似度判断的影响程度。根据平均地理距离的大小，调整影响度对应的权重，使得在相似度判断中更加合理地考虑地理位置因素的影响。例如，如果平均地理距离较小，可能意味着地理位置因素对相似度有较大影响，可以增加地理位置因素的权重；而如果平均地理距离较大，可能意味着地理位置因素对相似度影响较小，可以减小地理位置因素的权重。

2）基于影响度来调整距离阈值。

所述影响度包括具有正面影响的正影响度和具有负面影响的负影响度。在所述影响度为所述正影响度的情况下，动态将所述距离阈值调高至少一个步进，在所述影响度为所述负影响度的情况下，动态将所述距离阈值调低至少一个步进。

如果某属性特征具有正面影响，即正影响度较大，则将距离阈值调高至少一个步进，以放宽相似度判断的条件。反之，如果某属性特征具有负面影响，即负影响度较大，则将距离阈值调低至少一个步进，以加强相似度判断的条件。这样的动态调整可以让系统更加灵活和智能，适应不同情况下的人脸图像比对需求。

实施例2

本申请实施例提供了一种基于距离阈值来判断人脸图像的相似度的方法，如图2所示，该方法包括：

步骤S202，将所有的人脸图像进行聚类，得到分堆集合。

可以采用以下方法进行聚类：

1）获取图像集中每个图像对应的人脸特征以及所述每个图像的属性特征。

首先，提取人脸特征。针对图像集中的每个图像，使用人脸识别技术或相关的深度学习算法来提取对应的人脸特征。这些人脸特征可以是高维度的向量表示，其中每个维度表示图像中的特定人脸属性。

接下来，提取属性特征。所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息。具体地，从每个图像的元数据中提取创建时间信息。图像文件通常包含时间戳信息，可以直接获取图像的创建时间，也可以通过其他方式关联到图像创建时间的数据（如数据库记录等）进行获取。此外，许多现代相机和智能手机会在图像的EXIF元数据中记录GPS信息，包括经度和纬度，可以直接提取这些信息。或者，还可以利用第三方地理信息数据库，根据图像的拍摄时间和可能的地点进行位置信息匹配，以获取拍摄地点相关的信息。

2）以所述创建时间为特征对所述图像集中的各个图像进行第一次聚类处理，得到多个第一图像分堆。

首先。计算所述图像集中的当前图像与前一张图像的创建时间之间的时间间隔。通过计算图像之间的时间间隔，可以得到图像在时间上的连续性信息。这有助于确定图像之间的时间关联性，从而更好地理解图像的时间序列特征。

接下来，在所述时间间隔小于等于预设的时间阈值的情况下，计算所述当前图像与所述当前图像之前连续未被聚类且与所述当前图像具有相同创建时间范围的图像的创建时间的平均绝对偏差。通过计算平均绝对偏差，有效地考虑了图像的时间特征相似性，使得时间相似的图像能够被聚类在一起。

例如，从所述当前图像开始，向前遍历所述图像集中的各个图像直到遍历到所述图像集的第一个图像为止，找到未被聚类且与所述当前图像具有相同创建时间范围的图像；计算每个所述未被聚类且与所述当前图像具有相同创建时间范围的图像的创建时间与所述当前图像的创建时间的偏差，并将所述偏差添加到时间偏差列表中；计算所述时间偏差列表中的所有偏差的平均值向量，得到所述平均绝对偏差。本申请实施例对未被聚类且与当前图像具有相同创建时间范围的图像进行遍历和计算，确保了每个图像都能在适当的时间范围内得到聚类，避免了遗漏和重复聚类的情况。

最后，在所述平均绝对偏差小于等于预设的时间相似性阈值的情况下，将所述当前图像和所述前一张图像聚类在一个图像分堆中，其中，所述时间相似性阈值是用来衡量图像时间特征相似性的阈值。通过设定预设的时间相似性阈值，可以灵活地控制图像的聚类程度。当平均绝对偏差小于等于时间相似性阈值时，将当前图像与前一张图像聚类在一个图像分堆中。这样的设计保证了图像的时间特征相似性达到一定程度时才进行聚类，避免了过于松散或过于紧密的聚类结果。

3）以所述地理位置为特征对所述多个第一图像分堆进行合并处理，得到多个第二图像分堆。

首先，针对所述多个第一图像分堆中相邻的两个第一图像分堆，计算所述两个第一图像分堆中前一个第一图像分堆的最后一张图像与后一个第一图像分堆的第一张图像的地理相似度。针对相邻的两个第一图像分堆计算它们的地理相似度，这有助于判断两个分堆之间的地理拍摄位置是否相近，从而为后续合并提供依据。

接着，在所述地理相似度小于等于预设的地理距离阈值的情况下，计算所述前一个第一图像分堆的最后一张图像与所述后一个第一图像分堆中所有图像的地理位置的离均差平方和；例如，对于所述后一个第一图像分堆中的所有图像，计算地理位置的经度和纬度坐标的平均值向量，得到所述后一个第一图像分堆的地理位置平均值向量；对于所述前一个第一图像分堆的最后一张图像，计算所述最后一张图像的地理位置与所述后一个第一图像分堆的地理位置平均值向量之间的距离；将所述最后一张图像的地理位置与所述后一个第一图像分堆的地理位置平均值向量之间的距离进行平方，得到所述离均差平方和。本实施例通过计算前一个第一图像分堆的最后一张图像与后一个第一图像分堆中所有图像的地理位置的离均差平方和，有效地测量了两个分堆之间的地理位置差异，从而为判断是否合并提供了具体的数值依据。

最后，在所述离均差平方和小于等于预设的地理相似性阈值的情况下，将所述两个第一图像分堆合并为一个分堆，其中，所述地理相似性阈值是用来衡量图像的地理拍摄位置的相似性的阈值。这样，可以减少图像分堆的数量，提高图像组织的效率，并且确保合并的图像分堆在地理位置上较为相似，有助于提高后续图像检索和浏览的准确性和用户体验。

4）基于所述人脸特征，对每个第二图像分堆中的各个图像进行第二次聚类处理，得到第三图像分堆。

首先，基于所述第二图像分堆中的每个图像对应的人脸特征，确定所述第二图像分堆的相似度矩阵，其中，所述相似度矩阵表示所述第二图像分堆中的各个图像之间的相似度。例如，使用相似度度量方法，计算所述第二图像分堆中每两个图像之间的相似度值。基于所述相似度值，得到相似度矩阵，其中，所述相似度矩阵是对称矩阵，对角线上的元素表示所述每个图像与自身的相似度，非对角线上的元素表示不同图像之间的相似度。接着，基于所述相似度矩阵，对所述第二图像分堆中的各个图像进行子聚类。

通过这种方式，实现了对图像的智能分类和组织，提高了图像集的可管理性和可理解性。同时，基于人脸特征的相似度计算和子聚类还能为后续的图像分析和检索任务提供更准确和有意义的数据支持。最终，能够为用户提供更好的图像浏览和检索体验，减少用户在大量图像中查找目标图像的时间和精力成本，提高用户满意度。

步骤S204，提取特征得到特征向量。

首先，通过对待处理的人脸图像进行傅里叶变换，将图像从时域转换到频域，得到频谱图。这种变换使能够捕捉图像在不同频率上的信息，例如纹理和周期性等。接下来，使用二维卷积层从频谱图中提取全局特征。通过卷积操作，可以在频域图像上滑动并提取局部特征，得到不同特征通道的全局特征表示。

然后，将提取得到的全局特征和残差块连接。残差块通过跳跃连接的方式将输入特征与输出特征相加，使得网络可以直接学习残差信息，从而减轻了网络的训练难度。接着，对连接后的残差块和全局特征进行卷积操作和激活函数处理，得到频域特征。这样，进一步增强了特征的表征能力，并引入了非线性变换，使得网络可以学习更复杂的特征表示。

在本实施例中，还引入了注意力机制来进一步提升特征表示的质量。通过在残差块中引入注意力机制，网络可以自适应地学习全局特征的权重，从而更加关注重要的特征信息。基于学习到的权重，将全局特征添加到残差块中，形成跳跃连接。在对跳跃连接进行卷积操作和激活函数处理后，得到的频域特征具有更强的非线性表达能力，可以捕捉到更复杂和抽象的特征信息，从而提高了图像分类、目标检测或人脸识别等任务的性能。

最后，将得到的频域特征进行逆傅里叶变换，将其转换回时域特征序列，并将时域特征序列作为特征向量。逆傅里叶变换将频域特征还原为原始图像的表示，得到更全局和综合的特征向量。通过这个步骤，得到了更加综合和具有表征性的特征向量，有助于提高特征的稳健性和鲁棒性，进而提升整个人脸识别系统的性能和准确性。因此，引入注意力机制并结合跳跃连接和非线性处理，能够有效地增强特征提取的效果，提高网络的性能和准确性。

下面将详细描述特征向量的获取方法，如图3所示，该方法包括以下步骤：

步骤S2040，计算注意力查询向量。

注意力查询向量（attention query vector）用于查询注意力信息。通常情况下，注意力查询向量可以通过下式得到：

v_a = ft * Wa + ht * Ua

其中，ft 是全局特征；Wa 是注意力机制的权重矩阵，Ua 是注意力机制的参数矩阵；ht 表示LSTM隐藏状态。

本申请实施例引入了两个新参数，分别是注意力机制的权重矩阵 Wa 和参数矩阵Ua。这些参数在计算注意力查询向量时起到了关键作用。通过引入权重矩阵 Wa，聚类结果评估模型可以自动学习并调整全局特征 ft 的权重，从而使得注意力机制能够更加关注不同频率上的重要信息。而参数矩阵 Ua 则用于调整LSTM隐藏状态 ht 对于注意力查询向量的贡献，从而在计算注意力时考虑到当前频率的状态信息。通过学习这些参数，模型可以更好地适应不同的任务需求和数据分布，从而提高模型的灵活性和准确性。注意力机制可以使模型更加关注任务相关的特征，减少无关信息的影响，从而提高模型在处理复杂任务和大规模数据集时的性能。通过自动学习权重和参数，模型可以在不同场景下自适应地调整注意力查询向量的权重，从而提升特征表示的质量和可解释性。

步骤S2042，计算全局特征的权重。

将注意力查询向量添加到每个全局特征中，并进行非线性变换，可以获取每个全局特征对应的全局特征的权重。在一些实施例中，全局特征的权重可以通过以下公式得到：

其中，v_a 是注意力机制的查询向量，a_t是权重，表示全局特征对当前任务的重要程度；q_k表示注意力查询向量和键向量之间的相似度得分； d 是一个常数，用于缩放相似度得分的参数；b是偏置项，用于进一步调整全局特征的权重的偏移。

本实施例通过引入偏置项b，可以使得全局特征的权重计算更加灵活，使模型能够进一步调整注意力的关注程度，从而有助于模型更好地适应不同任务和数据分布，提高模型的性能和泛化能力。同时，通过训练偏置项b，模型能够更精确地调整全局特征的权重，使得对任务相关信息的关注更加准确和敏感。这种注意力机制的引入有助于提高模型在语音处理等任务中的性能，更好地捕捉任务关键信息并提高预测准确性。

步骤S2044，形成跳跃连接。

在一些实施例中，跳跃连接可以通过以下公式得到：

其中，xt 是残差块；ft是全局特征；a_t是全局特征的权重，表示全局特征对当前任务的重要程度；T 是全局特征的个数。跳跃连接的输出yt 是残差块xt和全局特征ft 加权求和后的结果。通过全局特征的权重at 对全局特征进行加权，实现了对于全局特征的自适应调节，使得网络能够更加关注重要的全局特征。将全局特征的信息传递到残差块中，从而加强了网络的表示能力和表达能力。跳跃连接的引入有助于提高网络的性能和泛化能力，使得网络能够更好地适应不同任务和数据分布，提高模型的准确性。

步骤S2046，对所述跳跃连接进行卷积操作，并利用所述激活函数对卷积操作后的所述跳跃连接进行非线性处理，得到所述频域特征。

在跳跃连接后，可以对跳跃连接进行卷积操作，进一步提取更丰富的局部特征信息。卷积操作在频域特征上滑动并提取局部特征，通过多个卷积核对跳跃连接进行卷积运算，可以得到不同特征通道的频域特征表示。这样的卷积操作有助于增强网络对于局部特征的感知能力，并捕捉更具体和细粒度的特征信息。

接下来，在卷积操作后，使用激活函数对卷积后的跳跃连接进行非线性处理。激活函数的引入能够引入非线性变换，使得网络可以学习更复杂的特征表示。常用的激活函数包括ReLU（Rectified Linear Unit）、Sigmoid、Tanh等。激活函数在频域特征中引入了非线性变换，从而允许网络学习非线性关系，增强了网络的表示能力。

通过对跳跃连接进行卷积操作和激活函数处理，得到了频域特征。这些频域特征具有更强的非线性表达能力，因为它们通过卷积和激活函数的处理，捕捉到了更复杂和抽象的特征信息。频域特征可以表示信号在不同频率上的成分和能量分布，以及局部特征之间的相互关系，有助于更全面地描述信号的频域特性。

最终，通过上述步骤，成功地将跳跃连接后的频域特征提取出来。这些频域特征可以用于进一步的信号处理、特征表示、分类、目标检测或人脸识别等任务。通过引入卷积操作和激活函数处理，增强了网络的特征提取能力和表达能力，提高了模型在频域特征表示任务中的性能和准确性。频域特征的提取对于许多信号处理和机器学习任务都具有重要的意义，它能够帮助更好地理解信号的频域特性，从而实现更加准确和高效的信号处理和分析。

步骤S2048，将得到的频域特征进行逆傅里叶变换，将其转换回时域特征序列，并将时域特征序列作为特征向量。

步骤S206，使用距离度量法来计算所述特征向量与分堆集合中的每一个分堆的相似度。

如图4所示，相似度的判断方法包括以下步骤：

步骤S2062，确定距离阈值。

采用实施例1中的方法来确定距离阈值，此处不再赘述。通过上述步骤，可以自动找到最佳的距离阈值，优化人脸相似度匹配算法的性能。这样的优化将使得系统在实际应用中更可靠和准确，提高了人脸识别系统的效能。

步骤S2064，基于距离阈值来判定特征向量与每一个分堆的聚类中心之间的相似度。

接着，在确定了距离阈值后，可以基于该距离阈值来判定特征向量与每一个分堆的聚类中心之间的相似度。对于每个特征向量，计算其与所属分堆的聚类中心的距离，并将这个距离与选择的距离阈值进行比较。如果特征向量与分堆的聚类中心的距离大于等于选择的聚类阈值，则判定为不相似；如果距离小于所选的聚类阈值，则判定为相似。

通过这种方式，可以将待处理的人脸图像分堆，将相似的人脸图像归为同一分堆，而不相似的人脸图像则建立新的分堆。这样的分堆策略能够动态适应不同的数据集和应用场景，为人脸相似度匹配任务提供更好的适应性和泛化能力。同时，该方案也能够在不同任务需求下自动找到最佳的阈值，使得人脸识别系统能够在实际应用中取得较好的效果。

步骤S208，对聚类结果进行评估。

使用卷积神经网络对图像分堆中的每个图像进行特征提取，从而得到每个图像的特征图。接着，对每个图像的特征图进行降维操作，将降维后的特征图转换为预设特征维度的特征向量，并据此构建特征矩阵。

接着，确定均值向量。对于特征矩阵中的每个特征维度，计算在该特征维度上的特征向量的均值向量。通过计算特征矩阵中每个特征维度上特征向量的均值向量，可以获得整体平均特征值，从而了解图像分堆的整体特征趋势。这个过程有助于了解图像分堆中的特征表现，以及对图像特征的整体把握。

然后，计算相关矩阵。在此过程中，基于均值向量以及特征向量生成了中心化矩阵，并利用中心化矩阵及其转置矩阵来计算相关矩阵。所谓中心化矩阵，是将特征矩阵在每个特征维度上进行均值归零化处理得到的，这样做是为了去除特征矩阵中的均值影响，以便更好地描述图像之间的相似性。

相关矩阵的作用在于描述图像分堆中各个图像之间的相似性，即图像之间特征的相关关系。通过相关矩阵，能够量化图像之间的相似程度，进而发现图像分堆中可能存在的聚类错误或者误分类情况。它能够帮助及时发现并修正错误的图像聚类结果，从而提高图像聚类的准确性和可靠性。

具体地，假设特征矩阵X，其中每一列代表一个特征维度，每一行代表一个图像。对特征矩阵X 进行中心化处理，即将每个特征维度的特征值都减去该维度上的均值，得到中心化矩阵C。假设X 中第j 列的均值为μ_j，则中心化矩阵C 中的元素 c_ij 计算公式为：c_ij=x_ij-μ_ij，其中x_ij表示X 中第i 行第j 列的元素，即第i 个样本在第j 个特征维度上的特征向量，μ_ij表示第i 行第j 列的特征向量的均值向量。

接下来，计算中心化矩阵C 的协方差矩阵Cov。协方差矩阵Cov 的元素Cov_jk 计算公式为：

其中，n 为图像的数量，c_ik表示特征矩阵中第i个特征维度和第k 个特征维度之间的协方差。

最后，通过协方差矩阵Cov 可以得到相关矩阵Corr。相关矩阵Corr 的元素 corr_jk计算公式为：

cov_jj表示协方差矩阵Cov 中的第j 个特征维度与其自身的协方差，即该特征维度在自身上的方差。cov_kk 表示协方差矩阵Cov 中的第k个特征维度与其自身的协方差，也即第 k 个特征维度在自身上的方差。

本实施例在计算相关矩阵的元素时，引入了新的参数协方差矩阵Cov 中的方差项cov_jj和 cov_kk，以及它们的乘积的平方根。这些方差项提供了特征维度本身的分布信息，用于了解每个特征维度的数据变化情况，有助于对数据的特征进行刻画。二者乘积的平方根反映了第 j 个特征维度和第 k 个特征维度各自的方差的乘积，它在相关矩阵计算中作为分母，用于归一化协方差项 cov。这样的归一化操作可以使得相关矩阵的元素范围在 -1到 1 之间，使得相关矩阵中的元素更容易进行比较。

总之，通过引入这些参数，相关矩阵能够更全面地描述特征矩阵中各个特征维度之间的相似性和相关关系。相关矩阵的计算结果可以帮助理解图像分堆中图像之间的群组结构和关联模式，从而更好地分析图像数据的内在特点，并在图像聚类等任务中对聚类结果进行评估和优化。同时，相关矩阵中的元素范围在 -1 到 1 之间，使得相关矩阵的解释更直观，方便了深度学习模型的训练和评估过程。

最后，将相关矩阵输入到深度学习模型中，利用训练好的深度学习模型来评估聚类结果，得到所述图像分堆的聚类结果的评估信息。

实施例3

本申请实施例提供了另一种基于距离阈值来判断人脸图像的相似度的方法，如图5所示，该方法包括：

步骤S502，获取待处理的人脸图像，利用深度学习方法从所述待处理的人脸图像中提取特征，得到特征向量。

首先，通过对待处理的人脸图像进行傅里叶变换，得到频谱图。傅里叶变换将图像从时域转换到频域，将图像表示为频谱图有助于捕捉图像在不同频率上的信息，例如纹理、周期性等。

接下来，使用二维卷积层从频谱图中提取全局特征。卷积层在频域图像上滑动并提取局部特征，通过多个卷积核对频谱图进行卷积运算，可以得到不同特征通道的全局特征表示。

然后，将提取得到的全局特征连接到残差块中。残差块通过跳跃连接的方式将输入特征与输出特征相加，允许网络直接学习残差信息，从而减轻了网络的训练难度，使得网络更易于训练。接着，对连接了残差块的全局特征进行卷积操作和激活函数处理，得到频域特征。卷积操作可以进一步提取图像的局部特征，增强特征的表征能力。激活函数的引入可以引入非线性变换，使得网络可以学习更复杂的特征表示。

例如，在所述残差块中引入注意力机制，利用所述注意力机制自适应地学习所述全局特征的权重；基于所述权重，将所述全局特征添加到所述残差块中，形成所述跳跃连接；对所述跳跃连接进行卷积操作，并利用所述激活函数对卷积操作后的所述跳跃连接进行非线性处理，得到所述频域特征。

本实施例通过利用注意力机制，网络可以自适应地学习全局特征的权重，使得在特征提取过程中更加关注重要的特征信息，从而提高特征表示的质量。在形成跳跃连接时，根据学习到的权重，将全局特征添加到残差块中，使得网络可以充分利用全局特征的信息，进一步增强了特征表示的能力。对跳跃连接进行卷积操作和激活函数处理后，得到的频域特征具有更强的非线性表达能力，使得网络可以捕捉到更复杂和抽象的特征信息，有助于提高图像分类、目标检测或人脸识别等任务的性能。因此，引入注意力机制并结合跳跃连接和非线性处理，能够有效地增强特征提取的效果，提升网络的性能和准确性。

最后，将得到的频域特征进行逆傅里叶变换，得到时域特征序列，并将时域特征序列作为特征向量。逆傅里叶变换将频域特征还原为原始图像的表示，将频域特征转换回时域，得到更全局和综合的特征向量。

步骤S504，使用距离度量法来计算所述特征向量与分堆集合中的每一个分堆的相似度，并基于所述相似度判断所述分堆集合中是否存在一个分堆与所述待处理的人脸图像相似，其中，所述每一个分堆包括至少一张人脸图像。

首先，确定距离阈值。具体地，获取多个人脸样本图像，计算所述多个人脸样本图像中每两个人脸样本图像的相似度；基于所述相似度预测所述每两个人脸样本图像为相似对或不相似对；在预设的阈值范围内遍历阈值，计算每个阈值对应的所述相似对的精度值和召回值、所述不相似对的精度值和召回值；根据所有阈值对应的相似对的精度值和召回值，得到相似对的精度召回曲线，根据所有阈值对应的不相似对的精度值和召回值，得到不相似对的精度召回曲线；基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述距离阈值。

通过以上步骤，可以得到相似对的精度召回率曲线和不相似对的精度召回率曲线。这些曲线将提供关于不同阈值下算法性能的详细信息，有助于选择最适合任务需求的阈值。最终，通过综合考虑相似对和不相似对的精度召回率曲线，能够确定较佳的距离阈值，从而使得人脸相似度匹配任务能够在实际应用中取得较好的效果。

例如，基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述相似对的精度召回曲线和所述不相似对的精度召回曲线的变化趋势；基于所述变化趋势，找到精度和召回率在所述相似对的精度召回曲线上尽可能接近最大值而在所述不相似对的精度召回曲线上尽可能接近最小值的值，作为所述距离阈值。

在确定了初步的距离阈值之后，分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。通过这种方式，能够自动找到最佳的阈值，从而优化人脸相似度匹配算法的性能。最终的结果将使系统在实际应用中表现更加可靠和准确，提升了人脸识别系统的效能。

接着，基于阈值确定相似度。分别确定所述特征向量到所述每一个分堆的聚类中心的距离；在所述距离皆大于等于距离阈值的情况下，判定所述特征向量与相应的分堆不相似；在所述距离小于所述距离阈值的情况下，判定所述特征向量与相应的分堆相似。

步骤S506，在存在一个分堆与所述待处理的人脸图像相似的情况下，将所述待处理的人脸图像归类于相应的分堆，否则，建立一个新的分堆，将所述待处理的人脸图像归类于所述新的分堆。

通过这种归类方式，可以根据相似度将人脸图像动态地组织为不同的堆，并适应数据集的变化。这样的分堆策略能够为人脸识别和相关任务提供更好的适应性和泛化能力，使得系统在处理多样化和复杂化数据时表现更加鲁棒和准确。

步骤S508，对聚类结果进行评估。

1）对聚类得到的图像分堆中的每个图像进行特征提取，并基于所提取的特征生成特征矩阵。

例如，采用卷积神经网络对所述图像分堆中的每个图像进行特征提取，得到所述每个图像的特征图；对所述每个图像的特征图进行降维操作，并将降维后的所述每个图像的特征图转换为预设特征维度的所述特征向量，然后基于所述特征向量构建所述特征矩阵。

2）计算所述特征矩阵中的特征向量的均值向量，并基于所述均值向量以及所述特征向量计算与所述图像分堆对应的相关矩阵，其中，所述相关矩阵用于描述所述图像分堆中的各个图像的相似性。

首先，确定均值向量。例如，针对所述特征矩阵中的每个特征维度，计算在该特征维度上的所述特征向量的所述均值向量。通过计算特征矩阵中每个特征维度上特征向量的均值向量，可以获得图像分堆中特征向量的整体平均特征值，有助于了解图像分堆的整体特征趋势。

接下来，计算相关矩阵。基于所述均值向量以及所述特征向量生成中心化矩阵，并基于所述中心化矩阵和所述中心化矩阵的转置矩阵来计算所述相关矩阵，其中，所述中心化矩阵用于表征进行均值归零化处理后的所述特征矩阵。具体地，针对所述特征矩阵中的每个特征维度，计算在该特征维度上的所述特征向量的所述均值向量；基于所述均值向量，将所述特征矩阵在所述每个特征维度上进行均值归零化处理，得到所述中心化矩阵；将所述中心化矩阵进行转置，得到所述中心化矩阵的转置矩阵，基于所述中心化矩阵和所述转置矩阵来计算所述相关矩阵。相关矩阵能够描述图像分堆中各个图像之间的相似性，即图像之间特征的相关关系。

本实施例通过计算相关矩阵，可以更好地了解图像分堆中图像之间的相似性和相关性。而这种相似性信息对于聚类结果的评估至关重要，可以用来发现聚类中可能出现的误分类情况，及时修正错误的图像聚类结果。此外，基于相关矩阵，还可以探索图像分堆中图像之间的群组结构和关联模式，从而更好地理解图像数据的内在特点。

3）基于所述相关矩阵对所述图像分堆的聚类结果进行评估。

首先，训练深度学习模型。从样本图像分堆中的样本图像中提取样本图像特征，并基于所述样本图像特征生成所述样本图像分堆的样本特征相关矩阵；将所述样本特征相关矩阵作为所述深度学习模型的输入，基于所述样本图像分堆的标记信息和所述样本特征相关矩阵确定所述深度学习模型的损失函数，并基于所述损失函数更新所述深度学习模型的网络参数，以训练所述深度学习模型。其中，损失函数是通过以下方法得到的：所述深度学习模型基于所述样本特征相关矩阵输出所述样本图像分堆的聚类结果的评估信息；基于所述聚类结果的评估信息和所述样本图像分堆的标记信息之间的差异，确定所述损失函数。

接下来，利用训练好的深度学习模型来评估。将所述相关矩阵输入到预先构建的深度学习模型中，利用所述深度学习模型来对所述图像分堆的聚类结果进行评估，得到所述图像分堆的聚类结果的评估信息。

本实施例通过基于相关矩阵对图像分堆的聚类结果进行评估，可以得到聚类结果的评估信息。这些评估信息可以用来衡量聚类算法的性能，评估聚类结果的准确性和质量。聚类过程中可能会出现误差，导致错误的图像被错误地归为同一个图像簇。通过聚类结果的评估，可以发现这些错误的聚类结果，并及时进行修正，以提高聚类结果的准确性和可靠性。最后，聚类结果的评估信息可以帮助用户更好地理解图像分堆的聚类结果，辅助决策和应用。例如，在图像分割、目标跟踪等领域中，聚类结果的准确性对于后续的图像处理和分析任务非常重要，通过评估聚类结果，可以选择合适的图像簇进行后续处理。

总之，本实施能够评估聚类结果的准确性，发现和修正错误的聚类结果，提供反馈改进聚类算法，并辅助决策和应用。通过这些有益效果，可以提高图像聚类方案的性能和可用性，从而更好地应用于图像处理和分析等领域。

实施例4

本申请实施例还提供了一种用于人脸图像比对的阈值的确定装置，如图6所示，包括：阈值计算模块62、特征获取模块64、和阈值调整模块66。

阈值计算模块62被配置为获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值；特征获取模块64被配置为分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；阈值调整模块66被配置为基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。

需要说明的是：上述实施例提供的用于人脸图像比对的阈值的确定装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的用于人脸图像比对的阈值的确定装置与用于人脸图像比对的阈值的确定方法实施例属于同一构思，其具体实现过程详见方法实施例，此处不再赘述。

实施例5

图7示出了适于用来实现本公开实施例的电子设备的结构示意图。需要说明的是，图7示出的电子设备仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图7所示，该电子设备包括中央处理单元(CPU)1001，其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中，还存储有系统操作所需的各种程序和数据。CPU1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

以下部件连接至I/O接口1005：包括键盘、鼠标等的输入部分1006；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007；包括硬盘等的存储部分1008；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1010上，以便于从其上读出的计算机程序根据需要被安装入存储部分1008。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1009从网络上被下载和安装，和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时，执行本申请的方法和装置中限定的各种功能。在一些实施例中，电子设备还可以包括AI( ArtificialIntelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

需要说明的是，本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现如下述实施例中所述的方法。例如，所述的电子设备可以实现上述方法实施例的各个步骤等。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种用于人脸图像比对的阈值的确定方法，其特征在于，包括：

获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值；

分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；

基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。

2.根据权利要求1所述的方法，其特征在于，基于所述属性特征来动态调整所述距离阈值，包括：

确定所述属性特征对所述多个人脸样本图像的相似度的影响度，其中，所述影响度包括具有正面影响的正影响度和具有负面影响的负影响度；

在所述影响度为所述正影响度的情况下，动态将所述距离阈值调高至少一个步进，在所述影响度为所述负影响度的情况下，动态将所述距离阈值调低至少一个步进。

3.根据权利要求2所述的方法，其特征在于，确定所述属性特征对所述多个人脸样本图像的相似度的影响度，包括：

比较所述多个人脸样本图像的创建时间，计算所述多个人脸样本图像的创建时间之间的平均时间间隔；

基于所述平均时间间隔来调整所述影响度对应的权重，并基于所述权重来调整所述影响度，其中，所述平均时间间隔越大所述权重越小。

4.根据权利要求2所述的方法，其特征在于，确定所述属性特征对所述多个人脸样本图像的相似度的影响度，包括：

比较所述多个人脸样本图像的地理位置信息，计算所述多个人脸样本图像的地理位置之间的平均地理距离；

基于所述平均地理距离，调整所述影响度对应的权重，并基于所述权重来调整所述影响度，其中，所述平均地理距离越大所述权重越小。

5.根据权利要求4所述的方法，其特征在于，计算所述多个人脸样本图像的地理位置之间的平均地理距离包括：

利用所述多个人脸样本图像的地理位置信息，生成所述多个人脸样本图像的热力图，其中，所述热力图用于表征地理位置的密集程度；

基于所述热力图来计算所述多个人脸样本图像的地理位置之间的平均地理距离。

6.根据权利要求1所述的方法，其特征在于，计算用于衡量所述多个人脸样本图像相似度的距离阈值，包括：

计算所述多个人脸样本图像中每两个人脸样本图像的相似度；

基于所述每两个人脸样本图像的相似度预测所述每两个人脸样本图像为相似对或不相似对；

在预设的阈值范围内遍历阈值，计算每个阈值对应的所述相似对的精度值和召回值、以及所述不相似对的精度值和召回值；

根据所有阈值对应的所述相似对的精度值和召回值，得到所述相似对的精度召回曲线，根据所有阈值对应的所述不相似对的精度值和召回值，得到所述不相似对的精度召回曲线；

基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述距离阈值。

7.根据权利要求6所述的方法，其特征在于，基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述距离阈值，包括：

基于所述相似对的精度召回曲线和所述不相似对的精度召回曲线，确定所述相似对的精度召回曲线和所述不相似对的精度召回曲线的变化趋势；

基于所述变化趋势，找到精度和召回率在所述相似对的精度召回曲线上尽可能接近最大值而在所述不相似对的精度召回曲线上尽可能接近最小值的值，作为所述距离阈值。

8.一种用于人脸图像比对的阈值的确定装置，其特征在于，包括：

阈值计算模块，被配置为获取多个人脸样本图像，计算用于衡量所述多个人脸样本图像相似度的距离阈值；

特征获取模块，被配置为分别获取所述多个人脸样本图像的属性特征，其中，所述属性特征包括创建时间和地理位置信息，所述地理位置信息是拍摄图像时的地点的相关信息；

阈值调整模块，被配置为基于所述属性特征来动态调整所述距离阈值，得到调整后的所述距离阈值。

9.一种电子设备，其特征在于，包括：

存储器，被配置为存储计算机程序；

处理器，被配置为在所述程序运行时，使得计算机执行如权利要求1至7中任一项所述的方法。

10.一种计算机可读存储介质，其上存储有程序，其特征在于，在所述程序运行时，使得计算机执行如权利要求1至7中任一项所述的方法。