CN114639143B

CN114639143B - 基于人工智能的人像归档方法、设备及存储介质

Info

Publication number: CN114639143B
Application number: CN202210224677.8A
Authority: CN
Inventors: 许顺楠; 甘露; 付琰; 陈亮辉; 彭玉龙
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-03-07
Filing date: 2022-03-07
Publication date: 2024-04-16
Anticipated expiration: 2042-03-07
Also published as: JP2022162154A; JP7330338B2; KR20220123352A; CN114639143A

Abstract

本公开提供了基于人工智能的人像归档方法、设备及存储介质，涉及计算机视觉和人脸识别领域，具体可应用在智能云、云计算、智慧城市、安防和城市治理场景下。具体实现方案为：将档案中的低质图片从所在档案移至低质图片库，低质图片为档案中满足低质条件的人脸图片；根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片；根据每一人脸图片的多维度特征信息，将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，多维度特征信息至少包括人像特征、人脸质量信息和采集时空信息，能将尽可能多的低质图片精准地归入正确的档案中，从而尽可能减少散档的情况，提高人脸图片档案的召回率。

Description

基于人工智能的人像归档方法、设备及存储介质

技术领域

本公开涉及计算机视觉和人脸识别领域，具体可应用在智能云、云计算、智慧城市、安防和城市治理场景下，尤其涉及一种基于人工智能的人像归档方法、设备及存储介质。

背景技术

智慧城市的建设是现代城市治理的新理念。在大数据背景下，为城市中的每个人员构建一个人脸图片档案用于安防场景，是建设智慧安防系统的一种方法。

目前，在智慧城市的建设中，通过获取城市中的各路摄像头的抓拍图片，检测抓拍图片中每一人脸区域的人脸小图，提取人脸小图的人脸向量特征，基于人脸向量特征的相似度将所有人脸图片聚成多个类，每一个类建立一个档案，包括该类中的所有人脸图片。在实际应用中，很大部分抓拍图片中存在人脸被不同程度地遮挡、人脸模糊不清、图片亮度不够、大角度侧脸等不是清晰正脸的情况，抓拍图片的人脸图片质量较差，人脸图片档案中同一人的人脸图片被聚类到多个不同类中而散入多个不同档案中，存在严重的散档问题，导致人脸图片档案的召回率低。

发明内容

本公开提供了一种基于人工智能的人像归档方法、设备及存储介质。

根据本公开的第一方面，提供了一种基于人工智能的人像归档方法，包括：

确定所述档案中的低质图片，将所述低质图片从所在档案中移至低质图片库，所述低质图片为所述档案中满足低质条件的人脸图片；

根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的召回图片；

根据每一所述人脸图片的多维度特征信息，将与所述人脸图片属于同一人的召回图片合并入所述人脸图片所在档案中，所述多维度特征信息至少包括所述人像特征、人脸质量信息和采集时空信息。

根据本公开的第二方面，提供了一种基于人工智能的人像归档装置，包括：

低质图片库建立模块，用于确定所述档案中的低质图片，将所述低质图片从所在档案中移至低质图片库，所述低质图片为所述档案中满足低质条件的人脸图片；

低质图片召回模块，用于根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的召回图片；

判别模块，用于根据每一所述人脸图片的多维度特征信息，将与所述人脸图片属于同一人的召回图片合并入所述人脸图片所在档案中，所述多维度特征信息至少包括所述人像特征、人脸质量信息和采集时空信息。

根据本公开的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面所述的方法。

根据本公开的第五方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。

根据本公开的技术提高了人脸图片档案的召回率。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开第一实施例的一示例性基于人工智能的人像归档方法流程图；

图2是根据本公开第二实施例的一示例性基于人工智能的人像归档方法流程图；

图3是根据本公开第二实施例的基于人工智能的人像归档方法的一种示例流程框架图；

图4是根据本公开第三实施例的基于人工智能的人像归档装置的结构示意图；

图5是根据本公开第三实施例的基于人工智能的人像归档装置的结构示意图；

图6是用来实现本公开实施例的基于人工智能的人像归档方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开提供一种基于人工智能的人像归档方法、设备及存储介质，涉及计算机视觉和人脸识别领域，具体可应用在智能云、云计算、智慧城市、安防和城市治理场景下，以减少人脸图片档案中的散档问题，提高人脸图片档案的召回率。

本公开提供的基于人工智能的人像归档方法可以应用于智慧城市、安防场景等需要构建每一人的人脸图片档案的场景中，至少可以应用于如下具体场景：基于指定人员的任意一张抓拍图片或日常拍摄的照片等，通过提取图片中的人脸区域得到指定人员的人脸图片，根据指定人员的人脸图片在人脸图片档案中进行人脸向量特征的匹配，召回指定人员的档案，从而确定指定人员的身份；或者，基于指定人员的档案中所有人脸图片的采集时间地点等时空信息确定指定人员的行为轨迹；或者，基于指定人员的档案进行其他处理。

本公开提供的基于人工智能的人像归档方法用于对人脸图片档案进行如下优化处理：识别人脸图片档案中的所有低质图片，将低质图片从人脸图片档案移出至低质图片库中；在基于档案中保留的人脸图片的人脸向量特征、人体向量特征等人像特征，从低质图片库中召回人脸相似度或人体相似度较高的人脸图片作为召回图片，对于召回图片，基于更多维度的特征信息，更精准地判断档案中保留的人脸图片与召回图片是否属于同一人，将与人脸图片属于同一人的召回图片合并入人脸图片所在的档案中，从而能够尽可能地将同一人的人脸图片归入同一档案中，改善人脸图片档案中散档的问题，提高人脸图片档案的召回率。

下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本公开的实施例进行描述。

图1是根据本公开第一实施例的一示例性基于人工智能的人像归档方法流程图。本实施例提供的基于人工智能的人像归档方法具体可以应用于构建人脸图片档案、或者利用人脸图片档案进行人物检索等应用人脸图片档案的电子设备，例如，智能安防系统的服务器等，本实施例此处不做具体限定。

如图1所示，该方法具体步骤如下：

步骤S101、确定档案中的低质图片，将低质图片从所在档案中移至低质图片库，低质图片为档案中满足低质条件的人脸图片。

在实际应用中，很大部分抓拍图片中存在人脸被不同程度地遮挡、人脸模糊不清、图片亮度不够、大角度侧脸等不是清晰正脸的情况，使得基于抓拍图片提取到的人脸图片中有很多低质量的图片。基于这些低质量的人脸图片进行聚类时，由于低质量人脸图片与其他人脸图片的人脸相似度都比较低，会产生较多的包含少量低质质量人脸图片的小档案，同一人的人脸图片分散到多个档案中，导致严重的散档问题。

本实施例中，设置低质条件，将档案中所有满足低质条件的人脸图片作为低质图片。

其中，低质条件可以根据实际应用场景中低质量的人脸图片的特点、档案中低质量的人脸图片的分布情况等进行设置和调整，本实施例此处不做具体限定。

可选地，低质条件可以是：所在档案中人脸图片的数量小于或等于第一阈值。其中，第一阈值可以根据实际应用场景的需要进行设置和调整，此处不做具体限定。

例如，第一阈值可以是5，将档案中包含的人脸图片的总数小于或等于5的档案中所有的人脸图片作为低质图片。

可选地，低质条件可以是：根据人脸图片的人脸质量信息确定的质量参数小于或等于第二阈值。

示例性地，人脸图片的人脸质量信息可以包括以下至少一项：人脸旋转角度、人脸模糊度、人脸遮挡程度、图片亮度、人脸俯仰角、图片灰度。

基于预先设定的质量衡量规则，综合人脸图片的一项或多项人脸质量信息，计算得到人脸图片的质量参数，质量参数越大表示人脸质量越差。

其中，质量衡量规则可以根据实际应用场景进行设置和条件，第二阈值可以根据实际应用场景中的质量衡量规则进行设置和调整，此处不做具体限定。

可选地，低质条件可以是：至少一项人脸质量信息在对应的阈值范围内。通过设置一项或多项人脸质量信息对应的阈值范围，当人脸图片的至少一项人脸质量信息在对应的阈值范围内时，确定该人脸图片为低质图片。

另外，低质条件还可以由上述任意一种可选地低质条件进行任意组合确定，组合的多个条件可以是并且/或者的关系。

该步骤中，基于设置低质条件，识别档案中所有的低质图片，并将所有的低质图片从所在的档案移出，将所有低质图片添加到低质图片库中。

经过步骤S101的处理后，档案中不包含已识别出的低质图片，仅保留了高质量的人脸图片。对于同一人的高质量的人脸图片，通常在基于人脸向量特征相似度进行聚类时能够被聚到同一类中，也即对于多数人的档案，同一人的人脸图片已经准确地归入到同一档案中，不存在或存在极少散档的情况。

步骤S102、根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片。

对于低质图片库中的低质图片，为将低质图片较准确地归入正确的档案中，基于当前档案中保留的人脸图片的人像特征，将保留的人脸图片的人像特征与低质图片库中低质图片的人像特征进行相似度匹配，召回与保留的人脸图片相似度较高的低质图片，作为人脸图片对应的召回图片。

需要说明的是，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片时，对人脸图片与低质图片的相似度要求较低，能够召回较多的与人脸图片具有一定相似度的低质图片，以召回更多的低质图片。在后续步骤S103中，再基于多维度特征信息，对人脸图片与对应的召回图片是否属于同一人进行更加精准地判断。

其中，人脸图片的人像特征可以包括以下至少一项：人脸向量特征、人脸图片对应人体图片的人体向量特征。其中，人体向量特征可以体现人脸图片对应人体图片中的人体姿态等等特点。

步骤S103、根据每一人脸图片的多维度特征信息，将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，多维度特征信息至少包括人像特征、人脸质量信息和采集时空信息。

其中，人脸图片的人脸质量信息可以包括以下至少一项：人脸旋转角度、人脸模糊度、人脸遮挡程度、图片亮度、人脸俯仰角、图片灰度。

人脸图片的采集时空信息可以包括人脸图片对应原始图片的采集时间、采集位置等信息。

另外，人脸图片的多维度特征信息还可以包括人脸图片对应原始图片中人的属性信息、车的属性信息等等，此处不做具体限定。其中，人的属性信息如年龄类别、性别、衣服颜色、是否戴帽子、帽子颜色等等。车的属性信息如车牌信息、车型等信息。

本实施例中，对于召回图片，根据多维度特征信息，能够更加精准地判断人脸图片与对应的召回图片是否属于同一人，并将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，能够将尽可能多的低质图片精准地归入正确的档案中，从而尽可能减少散档的情况。

通过步骤S103之后，在档案中保留的人脸图片中匹配到与召回图片属于同一人的人脸图片后，该召回图片会移动到对应档案中。

最后低质图片库中剩余的图片，是较少的质量很差以至于基于多维度特征信息仍然无法归入任意现有档案的低质图片，可以直接丢弃，或者对当前低质图片库中的低质图片进行聚类，根据聚类结果生成新的档案。

本实施例通过基于设置低质条件，识别档案中所有的低质图片，并将所有的低质图片从所在的档案移出，将所有低质图片添加到低质图片库中；根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片，能够召回较多的与人脸图片具有一定相似度的低质图片；对于召回图片，根据多维度特征信息，能够更加精准地判断人脸图片与对应的召回图片是否属于同一人，并将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，能够将尽可能多的低质图片精准地归入正确的档案中，从而尽可能减少散档的情况，提高人脸图片档案的召回率。

图2是根据本公开第二实施例的一示例性基于人工智能的人像归档方法流程图。在上述图1对应实施例的基础上，本实施例中，根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片时，可以基于人脸向量特征和人体向量特征中的至少一种人像特征召回每一人脸图片对应的召回图片。

如图2所示，该方法的具体步骤如下：

步骤S201、获取档案中人脸图片的多维度特征信息。

本实施例中，可以预先获取档案中人脸图片的多维度特征信息。

其中，多维度特征信息至少包括：人脸向量特征、人脸质量信息、对应的人体图片的人体向量特征、采集时空信息，通过多维度特征信息对人脸图片档案进行优化调整，以弥补人脸信息在一些场景中失效的不足，能够降准地识别同一人的人脸图片，从而大大提高人员图片档案的质量。

示例性地，根据构建人脸图片档案时的原始图片(如抓拍图片)，提取出原始图片包含的人体图片(或称人体小图)，对人体图片进行人脸检测提取人体图片中的人脸图片(或称人脸小图)。对人体图片进行特征提取，得到人体向量特征。通过人脸检测模型对人脸图片进行处理，得到人脸向量特征以及人脸质量信息。

人脸图片的人脸质量信息可以包括以下至少一项：人脸旋转角度、人脸模糊度、人脸遮挡程度、图片亮度、人脸俯仰角、图片灰度。

步骤S202、确定档案中的低质图片，将低质图片从所在档案中移至低质图片库，低质图片为档案中满足低质条件的人脸图片。

其中，低质条件包括以下至少一项：

所在档案中人脸图片的数量小于或等于第一阈值；根据人脸图片的人脸质量信息确定的质量参数小于或等于第二阈值；至少一项人脸质量信息在对应的阈值范围内。

低质条件可以根据实际应用场景中低质量的人脸图片的特点、档案中低质量的人脸图片的分布情况等进行设置和调整，本实施例此处不做具体限定。

本实施例中，根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片，包括以下至少一项：

根据当前档案中每一人脸图片的人脸向量特征，基于人脸向量特征的相似度，从低质图片库中召回每一人脸图片对应的第一召回图片；根据当前档案中每一人脸图片的人体向量特征，基于人体向量特征的相似度，从低质图片库中召回每一人脸图片对应的第二召回图片，其中，人脸图片的人体向量特征是从人脸图片对应的人体图片中提取的。

图2中以同时包括基于人脸向量特征的相似度召回每一人脸图片对应的第一召回图片(步骤S203)，和基于人体向量特征的相似度召回每一人脸图片对应的第二召回图片(步骤S204)为例，进行示例性地说明。在本实施例的其他实施方式中，还可以只通过步骤S203确定召回图片，或者只通过S204确定召回图片，此处不做具体限定。

步骤S203、根据当前档案中每一人脸图片的人脸向量特征，基于人脸向量特征的相似度，从低质图片库中召回每一人脸图片对应的第一召回图片。

该步骤中，对于当前档案中保留的每一人脸图片，根据人脸图片的人脸向量特征，基于低质图片与人脸图片的人脸向量特征的相似度，从低质图片库中召回与人脸图片具有一定相似度的低质图片，作为人脸图片对应的第一召回图片。

示例性地，可以召回与人脸图片的人脸向量特征的相似度大于或等于第一相似度阈值的低质图片。其中，第一相似度阈值较低，以便于召回较多的与人脸图片具有一定相似度的低质图片。第一相似度阈值可以根据实际应用场景进行设置，例如可以为0.5等，此处不做具体限定。

通过基于人脸向量特征的相似度的召回每一人脸图片对应的第一召回图片，对于人脸质量稍好的人脸图片，通过召回与人脸图片具有一定人脸相似度的低质图片，能够尽可能地召回可能与人脸图片属于同一人的低质图片。

示例性地，对于低质图片库，可以建立对应的数据检索库，如ElasticSearch、或Faiss(Facebook AI Similarity Search)等，用于实现类似检索功能。

步骤S204、根据当前档案中每一人脸图片的人体向量特征，基于人体向量特征的相似度，从低质图片库中召回每一人脸图片对应的第二召回图片。

其中，人脸图片的人体向量特征是从人脸图片对应的人体图片中提取的。

该步骤中，对于当前档案中保留的每一人脸图片，根据人脸图片的人体向量特征，基于低质图片与人脸图片的人体向量特征的相似度，从低质图片库中召回与人脸图片具有一定相似度的低质图片，作为人脸图片对应的第二召回图片。

示例性地，可以召回与人脸图片的人体向量特征的相似度大于或等于第二相似度阈值的低质图片。其中，第二相似度阈值较低，以便于召回较多的与人脸图片具有一定相似度的低质图片。第二相似度阈值可以根据实际应用场景进行设置，但考虑到人体相似相较于人脸相似的图片属于同一人的概率相对更小，第二相似度阈值相较于第一相似度阈值可以大一些，例如可以为0.8等，此处不做具体限定。

通过基于人体向量特征的相似度的召回每一人脸图片对应的第二召回图片，对于人脸质量较差的人脸图片，通过召回与人脸图片具有一定人体相似度的低质图片，能够尽可能地召回可能与人脸图片属于同一人的低质图片。

该步骤S204与步骤S203中可以采用相同或者不同的检索方式进行低质图片的召回，此处不做具体限定。

通过同时基于人脸向量特征的相似度召回每一人脸图片对应的第一召回图片(步骤S203)，和基于人体向量特征的相似度召回每一人脸图片对应的第二召回图片(步骤S204)，能够尽可能多地召回与人脸图片具有一定相似度的低质图片，从而使得后续步骤中再基于多维度特征信息，对人脸图片与对应的召回图片是否属于同一人进行更加精准地判断，能够将尽可能多的低质图片精准地归入正确的档案中，从而尽可能减少散档的情况。

进一步地，在召回每一人脸图片对应的召回图片之后，根据每一人脸图片的多维度特征信息，通过判别模型判断每一人脸图片对应的召回图片与人脸图片是否属于同一人，将与每一人脸图片属于同一人的召回图片移动至人脸图片所在档案的待合入图片集中。

一种可选地实施方式中，在召回每一人脸图片对应的召回图片之后，对于通过步骤S203基于人脸向量特征相似度召回的每一人脸图片的第一召回图片，通过步骤S205-S206，根据每一人脸图片的多维度特征信息，使用第一判别模型，将与每一人脸图片属于同一人的第一召回图片移动至人脸图片所在档案的待合入图片集中。

对于通过步骤S204基于人体向量特征相似度召回的每一人脸图片的第二召回图片，通过步骤S207-S208，根据每一人脸图片的多维度特征信息，使用第一判别模型，将与每一人脸图片属于同一人的第二召回图片移动至人脸图片所在档案的待合入图片集中。

通过这种实施方式，能够将与每一人脸图片属于同一人的所有召回图片移动至人脸图片所在档案的待合入图片集中，能够将同一人的低质图片尽可能多地聚集到一个待合入图片集中，从而能够将同一人的人脸图片尽可能地合并入同一档案中。

步骤S205、对于每一人脸图片对应的第一召回图片，通过第一判别模型，根据人脸图片的多维度的第一特征信息和第一召回图片的第一特征信息，判断人脸图片与第一召回图片是否属于同一人。

其中，第一特征信息至少包括：人脸向量特征、人脸质量信息、采集时空信息。

另外，第一特征信息还可以包括：人体向量特征、人脸图片对应原始图片中人的属性信息、车的属性信息等等。

示例性地，第一判别模型以两个图片的人脸向量特征的相似度作为判别的主要特征，结合人脸质量信息和两个图片间的时空特征等多维度的特征，调整人脸向量特征的相似度的权重，最终以人脸向量特征的相似度及其权重确定判别结果，使档案内尽可能包含一位人员在一段时空内的所有人脸图片。

例如，两个图片间的时空特征可以根据两个图片采集时间的间隔时间长短，和两个图片采集位置的间隔距离的长短确定，可以分为如下几项时空特征信息：是否间隔时间短且间隔距离长、是否间隔时间长且间隔距离短、是否同天内且间隔距离短。

可选地，第一判别模型可以是基于大量历史数据训练好的模型，能够基于多个维度的特征，更关注体现人脸相似性的特征，判断两个人脸图片是否属于同一人。

第一判别模型可以采用深度学习模型或者xgboost等。

步骤S206、将与每一人脸图片属于同一人的第一召回图片移动至人脸图片所在档案的待合入图片集中。

在识别出与每一人脸图片属于同一人的第一召回图片之后，将与每一人脸图片属于同一人的第一召回图片移动至人脸图片所在档案的待合入图片集中。

步骤S207、对于每一人脸图片对应的第二召回图片，通过第二判别模型，根据人脸图片的多维度的第二特征信息和第二召回图片的第二特征信息，判断人脸图片与第二召回图片是否属于同一人。

其中，第二特征信息至少包括：人体向量特征、采集时空信息。

另外，第二特征信息还可以包括：人脸向量特征、人脸图片对应原始图片中人的属性信息、车的属性信息等等。

示例性地，第二判别模型以两个图片的人体向量特征的相似度作为判别的主要特征，结合两个图片间的时空特征等多维度的特征，调整人体向量特征的相似度的权重，最终以人体向量特征的相似度及其权重确定判别结果，使档案内尽可能包含一位人员在一段时空内的所有人脸图片。

可选地，第二判别模型可以是基于大量历史数据训练好的模型，能够基于多个维度的特征，更关注体现人体相似性的特征，判断两个人脸图片是否属于同一人。

第二判别模型可以采用深度学习模型或者xgboost等。

步骤S208、将与每一人脸图片属于同一人的第二召回图片移动至人脸图片所在档案的待合入图片集中。

在识别出与每一人脸图片属于同一人的第二召回图片之后，将与每一人脸图片属于同一人的第二召回图片移动至人脸图片所在档案的待合入图片集中。

通过上述步骤S205-S208，能够将与每一人脸图片属于同一人的所有召回图片移动至人脸图片所在档案的待合入图片集中，能够将同一人的低质图片尽可能多地聚集到一个待合入图片集中，从而能够将同一人的人脸图片尽可能地合并入同一档案中。

本公开的另一可选地实施方式中，在召回每一人脸图片对应的召回图片之后，对每一人脸图片的召回图片，无论召回图片是基于何种方式召回的，可以都进行相同的判别处理：使用第一判别模型和第二判别模型中的至少一个对召回图片与对应的人脸图片是否属于同一人进行判别。

如果同时使用两个判别模型进行判别，则任一判别模型判别结果为召回图片与人脸图片属于同一人时，即可确定召回图片与人脸图片属于同一人，将该召回图片移动至人脸图片所在档案的待合入图片集中。

进一步地，在将与每一人脸图片属于同一人的所有召回图片移动至人脸图片所在档案的待合入图片集中之后，通过步骤S209-S210，能够将同一人的低质图片尽可能多地合并到这个人的人脸图片档案中，从而尽可能地减少人脸图片档案的散档情况。

步骤S209、对每一档案的待合入图片集进行去重处理。

在确定每一档案的待合入图片集之后，通过对待合入图片集中的召回图片进行去重处理，来去除掉待合入图片集中冗余(重复)的召回图片，保证将待合入图片集中的召回图片合并入档案中之后，档案不存在冗余的人脸图片，提高档案的可用性，减少不必要的数据存储。

步骤S210、将每一档案去重处理后的待合入图片集中的召回图片合并入档案中。

将每一档案去重处理后的待合入图片集中的召回图片合并入档案中，从而将属于同一人的人脸图片合并至同一档案中，减少散档的情况。

步骤S211、若当前低质图片库中存在至少一个低质图片，根据当前低质图片库中的低质图片的多维度特征信息，对当前低质图片库中的低质图片进行聚类，得到多个低质图片集；将每一低质图片集中的低质图片归入一个新的档案。

通过将每一档案的待合入图片集中的召回图片合并入档案中，将与档案中保留的人脸图片属于同一人的召回图片移动到对应档案中。

最后低质图片库中剩余的图片，是较少的质量很差以至于基于多维度特征信息仍然无法归入任意现有档案的低质图片。

本实施例中，若当前低质图片库中存在至少一个低质图片，对于当前低质图片库中剩余的低质图片，重新进行聚类，根据聚类结果生成至少一个新的档案，将新的档案加入到档案库中。

具体地，该步骤中，根据低质图片的多维度特征信息，对当前低质图片库中的低质图片进行聚类，得到多个低质图片集；将每一低质图片集中的低质图片归入一个新的档案，能够在一定程度上提升聚类效果，减少散档的情况。

本公开的其他实施例中，对于最后低质图片库中剩余的图片，也可以丢弃或不做处理，对于最终人脸图片档案的召回率几乎没有影响。

示例性地，图3示出了图2所示的基于人工智能的人像归档方法的一种示例流程框架图，档案库可以包括多个档案(如图3所示的p1，p2，p3，…)，图3中以对任意一个档案p1的处理为例，进行示例性地说明：对于低质图片库中的低质图片，可以分别基于档案p1中保留的人脸图片的人脸向量特征、人体向量特征进行两种低质图片的召回处理：

一种是，基于人脸图片的人脸向量特征进行人脸召回，形成第一召回图片构成的一个候选图片集合1；通过第一判别模型进行是否属于同一的第一判别处理，将与p1的人脸图片属于同一人的第一召回图片加入待合入图片集1。

另一种是，基于人脸图片的人体向量特征进行人体召回，形成第二召回图片构成的一个候选图片集合2；通过第二判别模型进行是否属于同一的第二判别处理，将与p1的人脸图片属于同一人的第二召回图片加入待合入图片集2。

将待合入图片集1和待合入图片集2都是档案p1对应的待合入图片集，将待合入图片集1和待合入图片集2中的人脸图片去重后合并入档案p1。

本实施例通过基于设置低质条件，识别档案中所有的低质图片，并将所有的低质图片从所在的档案移出，将所有低质图片添加到低质图片库中；通过基于人脸向量特征的相似度的召回每一人脸图片对应的第一召回图片，对于人脸质量稍好的人脸图片，通过召回与人脸图片具有一定人脸相似度的低质图片，能够尽可能地召回可能与人脸图片属于同一人的低质图片；通过基于人体向量特征的相似度的召回每一人脸图片对应的第二召回图片，对于人脸质量较差的人脸图片，通过召回与人脸图片具有一定人体相似度的低质图片，能够尽可能地召回可能与人脸图片属于同一人的低质图片。进一步地，通过更关注人脸相似性的第一判别模型，判断第一召回图片与对应人脸图片是否属于同一人；通过更关注人体相似性的第二判别模型，判断第二召回图片与对应人脸图片是否属于同一人分别，能够根据多维度特征信息，能够更加精准地判断人脸图片与对应的召回图片是否属于同一人，并将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，能够将尽可能多的低质图片精准地归入正确的档案中，从而尽可能减少散档的情况，提高人脸图片档案的召回率。

图4是根据本公开第三实施例的基于人工智能的人像归档装置的结构示意图。本公开实施例提供的基于人工智能的人像归档装置可以执行基于人工智能的人像归档方法实施例提供的处理流程。如图4所示，该基于人工智能的人像归档装置40包括：低质图片库建立模块41，低质图片召回模块42和判别模块43。

具体地，低质图片库建立模块41，用于确定档案中的低质图片，将低质图片从所在档案中移至低质图片库，低质图片为档案中满足低质条件的人脸图片。

低质图片召回模块42，用于根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片。

判别模块43，用于根据每一人脸图片的多维度特征信息，将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，多维度特征信息至少包括人像特征、人脸质量信息和采集时空信息。

本公开实施例提供的装置可以具体用于执行上述第一实施例提供的方法实施例，所实现具体功能和技术效果此处不再赘述。

图5是根据本公开第四实施例的基于人工智能的人像归档装置的结构示意图。本公开实施例提供的基于人工智能的人像归档装置可以执行基于人工智能的人像归档方法实施例提供的处理流程。如图5所示，该基于人工智能的人像归档装置50包括：低质图片库建立模块51，低质图片召回模块52和判别模块53。

具体地，低质图片库建立模块51，用于确定档案中的低质图片，将低质图片从所在档案中移至低质图片库，低质图片为档案中满足低质条件的人脸图片。

低质图片召回模块52，用于根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从低质图片库中召回每一人脸图片对应的召回图片。

判别模块53，用于根据每一人脸图片的多维度特征信息，将与人脸图片属于同一人的召回图片合并入人脸图片所在档案中，多维度特征信息至少包括人像特征、人脸质量信息和采集时空信息。

可选地，低质条件包括以下至少一项：

所在档案中人脸图片的数量小于或等于第一阈值；

根据人脸图片的人脸质量信息确定的质量参数小于或等于第二阈值；

至少一项人脸质量信息在对应的阈值范围内。

可选地，如图5所示，低质图片召回模块52包括以下至少一项：

人脸召回单元521，用于根据当前档案中每一人脸图片的人脸向量特征，基于人脸向量特征的相似度，从低质图片库中召回每一人脸图片对应的第一召回图片。

人体召回单元522，用于根据当前档案中每一人脸图片的人体向量特征，基于人体向量特征的相似度，从低质图片库中召回每一人脸图片对应的第二召回图片，其中，人脸图片的人体向量特征是从人脸图片对应的人体图片中提取的。

可选地，如图5所示，判别模块53包括：

判别单元531，用于根据每一人脸图片的多维度特征信息，通过判别模型判断每一人脸图片对应的召回图片与人脸图片是否属于同一人，将与每一人脸图片属于同一人的召回图片移动至人脸图片所在档案的待合入图片集中。

去重单元532，用于对每一档案的待合入图片集进行去重处理。

合并单元533，用于将每一档案去重处理后的待合入图片集中的召回图片合并入档案中。

可选地，判别单元包括：

第一判别子单元，用于对于每一人脸图片对应的第一召回图片，通过第一判别模型，根据人脸图片的多维度的第一特征信息和第一召回图片的第一特征信息，判断人脸图片与第一召回图片是否属于同一人；其中，第一特征信息至少包括：人脸向量特征、人脸质量信息、采集时空信息。

第二判别子单元，用于对于每一人脸图片对应的第二召回图片，通过第二判别模型，根据人脸图片的多维度的第二特征信息和第二召回图片的第二特征信息，判断人脸图片与第二召回图片是否属于同一人；其中，第二特征信息至少包括：人体向量特征、采集时空信息。

可选地，如图5所示，基于人工智能的人像归档装置50还包括：

重聚类模块54，用于：

若当前低质图片库中存在至少一个低质图片，根据当前低质图片库中的低质图片的多维度特征信息，对当前低质图片库中的低质图片进行聚类，得到多个低质图片集；将每一低质图片集中的低质图片归入一个新的档案。

多维度特征获取模块55，用于获取档案中人脸图片的多维度特征信息，多维度特征信息至少包括：人脸向量特征、人脸质量信息、对应的人体图片的人体向量特征、采集时空信息。

本公开实施例提供的装置可以具体用于执行上述第二实施例提供的方法实施例，所实现具体功能和技术效果此处不再赘述。

需要说明的是，本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例，本公开还提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。

图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的或者要求的本公开的实现。

如图6所示，设备600包括计算单元601，其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序，来执行各种适当的动作和处理。在RAM 603中，还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和各种电信网络中的至少一项与其他设备交换信息/数据。

计算单元601可以是各种具有处理和计算能力的以下至少一项：通用处理组件、专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理，例如基于人工智能的人像归档方法。例如，在一些实施例中，基于人工智能的人像归档方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM 602和通信单元609中至少一项而被载入或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时，可以执行上文描述的基于人工智能的人像归档方法的一个或多个步骤。备选地，在其他实施例中，计算单元601可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行基于人工智能的人像归档方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件中一种或多种的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上进行执行和解释中至少一项处理，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种基于人工智能的人像归档方法，包括：

确定档案中的低质图片，将所述低质图片从所在档案中移至低质图片库，所述低质图片为所述档案中满足低质条件的人脸图片；

根据每一所述人脸图片的多维度特征信息，将与所述人脸图片属于同一人的召回图片合并入所述人脸图片所在档案中，所述多维度特征信息至少包括所述人像特征、人脸质量信息和采集时空信息；

其中，所述根据当前档案中人脸图片的人像特征，基于人像特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的召回图片，包括以下至少一项：

根据当前档案中每一人脸图片的人脸向量特征，基于人脸向量特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的第一召回图片；

根据当前档案中每一人脸图片的人体向量特征，基于人体向量特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的第二召回图片，其中，所述人脸图片的人体向量特征是从所述人脸图片对应的人体图片中提取的。

2.根据权利要求1所述的方法，其中，所述低质条件包括以下至少一项：

所在档案中人脸图片的数量小于或等于第一阈值；

至少一项人脸质量信息在对应的阈值范围内。

3.根据权利要求1或2所述的方法，其中，所述根据每一所述人脸图片的多维度特征信息，将与所述人脸图片属于同一人的召回图片合并入所述人脸图片所在档案中，包括：

根据每一所述人脸图片的多维度特征信息，通过判别模型判断每一所述人脸图片对应的召回图片与所述人脸图片是否属于同一人，将与每一所述人脸图片属于同一人的召回图片移动至所述人脸图片所在档案的待合入图片集中；

对每一档案的所述待合入图片集进行去重处理；

将每一档案去重处理后的所述待合入图片集中的召回图片合并入所述档案中。

4.根据权利要求3所述的方法，其中，所述根据每一所述人脸图片的多维度特征信息，通过判别模型判断每一所述人脸图片对应的召回图片与所述人脸图片是否属于同一人，包括：

对于每一所述人脸图片对应的第一召回图片，通过第一判别模型，根据所述人脸图片的多维度的第一特征信息和所述第一召回图片的第一特征信息，判断所述人脸图片与所述第一召回图片是否属于同一人；其中，所述第一特征信息至少包括：人脸向量特征、人脸质量信息、采集时空信息；

对于每一所述人脸图片对应的第二召回图片，通过第二判别模型，根据所述人脸图片的多维度的第二特征信息和所述第二召回图片的第二特征信息，判断所述人脸图片与所述第二召回图片是否属于同一人；其中，所述第二特征信息至少包括：人体向量特征、采集时空信息。

5.根据权利要求1、2或4所述的方法，其中，所述根据每一所述人脸图片的多维度特征信息，将与所述人脸图片属于同一人的召回图片合并入所述人脸图片所在档案中之后，还包括：

若当前低质图片库中存在至少一个低质图片，根据当前低质图片库中的低质图片的多维度特征信息，对当前低质图片库中的低质图片进行聚类，得到多个低质图片集；

将每一所述低质图片集中的低质图片归入一个新的档案。

6.根据权利要求1、2或4所述的方法，还包括：

获取档案中人脸图片的多维度特征信息，所述多维度特征信息至少包括：人脸向量特征、人脸质量信息、对应的人体图片的人体向量特征、采集时空信息。

7.一种基于人工智能的人像归档装置，包括：

低质图片库建立模块，用于确定档案中的低质图片，将所述低质图片从所在档案中移至低质图片库，所述低质图片为所述档案中满足低质条件的人脸图片；

判别模块，用于根据每一所述人脸图片的多维度特征信息，将与所述人脸图片属于同一人的召回图片合并入所述人脸图片所在档案中，所述多维度特征信息至少包括所述人像特征、人脸质量信息和采集时空信息；

其中，所述低质图片召回模块包括以下至少一项：

人脸召回单元，用于根据当前档案中每一人脸图片的人脸向量特征，基于人脸向量特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的第一召回图片；

人体召回单元，用于根据当前档案中每一人脸图片的人体向量特征，基于人体向量特征的相似度，从所述低质图片库中召回每一所述人脸图片对应的第二召回图片，其中，所述人脸图片的人体向量特征是从所述人脸图片对应的人体图片中提取的。

8.根据权利要求7所述的装置，其中，所述低质条件包括以下至少一项：

所在档案中人脸图片的数量小于或等于第一阈值；

至少一项人脸质量信息在对应的阈值范围内。

9.根据权利要求7或8所述的装置，其中，所述判别模块包括：

判别单元，用于根据每一所述人脸图片的多维度特征信息，通过判别模型判断每一所述人脸图片对应的召回图片与所述人脸图片是否属于同一人，将与每一所述人脸图片属于同一人的召回图片移动至所述人脸图片所在档案的待合入图片集中；

去重单元，用于对每一档案的所述待合入图片集进行去重处理；

合并单元，用于将每一档案去重处理后的所述待合入图片集中的召回图片合并入所述档案中。

10.根据权利要求9所述的装置，其中，所述判别单元包括：

第一判别子单元，用于对于每一所述人脸图片对应的第一召回图片，通过第一判别模型，根据所述人脸图片的多维度的第一特征信息和所述第一召回图片的第一特征信息，判断所述人脸图片与所述第一召回图片是否属于同一人；其中，所述第一特征信息至少包括：人脸向量特征、人脸质量信息、采集时空信息；

第二判别子单元，用于对于每一所述人脸图片对应的第二召回图片，通过第二判别模型，根据所述人脸图片的多维度的第二特征信息和所述第二召回图片的第二特征信息，判断所述人脸图片与所述第二召回图片是否属于同一人；其中，所述第二特征信息至少包括：人体向量特征、采集时空信息。

11.根据权利要求7、8或10所述的装置，还包括：

重聚类模块，用于：

若当前低质图片库中存在至少一个低质图片，根据当前低质图片库中的低质图片的多维度特征信息，对当前低质图片库中的低质图片进行聚类，得到多个低质图片集；将每一所述低质图片集中的低质图片归入一个新的档案。

12.根据权利要求7、8或10所述的装置，还包括：

多维度特征获取模块，用于获取档案中人脸图片的多维度特征信息，所述多维度特征信息至少包括：人脸向量特征、人脸质量信息、对应的人体图片的人体向量特征、采集时空信息。

13. 一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。