CN111598132B

CN111598132B - 一种人像识别算法性能评测方法和装置

Info

Publication number: CN111598132B
Application number: CN202010315113.6A
Authority: CN
Inventors: 李永刘; 朱铭皓; 李帆
Original assignee: Fiberhome Telecommunication Technologies Co Ltd
Current assignee: Fiberhome Telecommunication Technologies Co Ltd
Priority date: 2020-04-21
Filing date: 2020-04-21
Publication date: 2023-06-09
Anticipated expiration: 2040-04-21
Also published as: WO2021212725A1; CN111598132A

Abstract

本发明涉及人像识别技术领域，提供了一种人像识别算法性能评测方法和装置。方法包括根据各人像识别算法所适用的真实使用场景的数据特性，生成一组或者多组待测影响因子；根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片；计算各人像识别算法在各簇待测图片中的测试结果，建立所述测试结果与相应影响因子的关联关系；根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分。本发明能够良好的反映不同算法在不同场景下的表现，为算法研发、采购提供了标准化且有一定参考价值的指标。

Description

一种人像识别算法性能评测方法和装置

【技术领域】

本发明涉及人像识别技术领域，特别是涉及一种人像识别算法性能评测方法和装置。

【背景技术】

近年来，随着深度学习等技术的突破，人工智能领域迅速发展。其中人像识别技术也得到了广泛应用，尤其在金融、安防、自助服务等领域在近几年内均出现了大量的应用。其中也蕴含了大量的商业机会、因此许多个人、公司、研究机构都参与到人像识别算法的研发中来了。因此采购、研发算法中对于算法的评测也成为了很大的需求。过去对于人像算法普遍采用总的识别率、漏报率等作为指标、然而随着算法本身的发展，这样单一的指标值越来越接近，已经不能充分体现算法的差异。

因此，克服该现有技术所存在的缺陷是本技术领域亟待解决的问题。

【发明内容】

本发明要解决的技术问题是现有技术中的对于人像算法普遍采用总的识别率、漏报率等作为指标、然而随着算法本身的发展，这样单一的指标值越来越接近，已经不能充分体现算法的差异。

本发明采用如下技术方案：

第一方面，本发明提供了一种人像识别算法性能评测方法，预先收集用于评测各人像识别算法的图片底库，所述评测方法包括：

根据各人像识别算法所适用的真实使用场景的数据特性，生成一组或者多组待测影响因子；

根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片；其中，所述一簇或者多簇待测图片的数据特性与所述一组或者多组待测影响因子所代表的数据特性相符；

计算各人像识别算法在各簇待测图片中的测试结果，建立所述测试结果与相应影响因子的关联关系；

根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分。

优选的，所述预先收集用于评测各人像识别算法的图片底库，具体包括：

通过网络爬虫手段从互联网网站抓取包含人像信息的图片或从视频中截取包含人像信息的图片填充图片底库；和/或，

从学术研究网站下载图片包，将所述图片包中的图片填充图片底库，其中，所述图片包中包含人像信息；和/或，

从实时的视频监控系统中获取人像信息的图片填充图片底库；和/或，

通过将现有的图片进行缩放、旋转和/或遮挡变换后产生新的图片填充图片底库；和/或，

通过建立3D人脸模型，并在人脸模型设定渲染参数方式得到的图片填充图片底库。

优选的，对于各种途径所获取的图片在填充到图片底库之前，方法还包括：

根据人脸正面无遮挡，并且人脸分辨率达到指定参数作为第一过滤条件，过滤掉不满足所述第一过滤条件的图片。

优选的，所述根据各人像识别算法所适用的真实使用场景的数据特性，生成一组或者多组待测影响因子，具体包括：

根据真实使用场景的数据特性，统计各影响因子的概率分布，并生成适用于真实使用场景的一组或者多组影响因子组合；

其中，所述一组或者多组影响因子组合对应于真实使用场景下的一种或者多种状态。

优选的，所述的统计各影响因子的概率分布具体为在相应历史采集的图片中，各影响因子的分布情况，包括：一张图中分布的影响因子组合情况，以及影响因子在各个图片中的出现情况，并将上述组合情况和出现情况进行整合，得到所述概率分布。

优选的，将影响到识别正确率的因素定义为影响因子；所述影响因子包括拍摄设备影响因子、人脸影响因子、环境影响因子、底库影响因子、算法影响因子中的一类或者多类，其中，所述待测影响因子是通过所述影响因子中指定类构成，具体的：

所述拍摄设备影响因子，包括拍摄原始图片分辨率、人脸图片两眼间距、镜头焦距、镜头光圈、快门、感光度和光照强度中的一项或者多项；

所述人脸影响因子，包括人脸遮挡程度、人脸三维俯仰角、人脸三维左右旋转角、人脸平面内旋转角、人脸表情扭曲程度和人脸化妆程度中的一项或者多项；

所述环境影响因子，包括图片中环境相比较人像的像素占比、环境中可识别对象的数量和环境的可变化幅度中的一项或者多项；

所述底库影响因子，包括从收集的底库图片中筛选出的一簇或者多簇图片与所述一组或者多组待测影响因子的相似性程度；

所述算法影响因子，包括算法中各参数的配置区间。

优选的，预先收集用于评测各人像识别算法的图片底库的同时，分析所收集的图片自身固有的拍摄设备影响因子、人脸影响因子和环境影响因子，则所述根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片，具体包括：

根据所述底库影响因子中设定的相似性参数，进行包括所述设备影响因子、人脸影响因子和环境影响因子中一类或者多类的相似性计算；

相似性计算结果满足所述设定的相似性参数的图片，与对应的影响因子组合关联生成所述一簇或者多簇待测图片；

其中，所述一组或者多组待测影响因子，具体由所述设备影响因子、人脸影响因子、环境影响因子和底库影响因子中的一类或者多类构成。

优选的，所述计算各人像识别算法在各簇待测图片中的测试结果，建立所述测试结果与相应影响因子的关联关系，具体包括：

根据算法影响因子中各参数配置组合，进行所述一簇或者多簇图片的人像识别；

将所述识别结果与相应影响因子建立的关联关系；

其中，影响因子包括由所述设备影响因子、人脸影响因子、环境影响因子和底库影响因子中的一类或者多类构成的待测影响因子，以及所述算法影响因子。

优选的，根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分，具体包括：

对识别结果进行统计，根据对应所述各簇图片的人像识别准确率，以及相应簇图片关联的待测影响因子加权得到性能评测打分。

第二方面，本发明还提供了一种人像识别算法性能评测装置，用于实现第一方面所述的人像识别算法性能评测方法，所述装置包括：

至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述处理器执行，用于完成第一方面所述的人像识别算法性能评测方法。

第三方面，本发明还提供了一种非易失性计算机存储介质，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行，用于完成第一方面所述的人像识别算法性能评测方法。

本发明提出了使用场景与影响因子的定义、通过相关性分析可得出测试结果与影响因子之间的多元关系模型，并最终得出某一算法在某一场景下的评测结果。本发明能够良好的反映不同算法在不同场景下的表现，为算法研发、采购提供了标准化且有一定参考价值的指标。

本发明利用对于场景的概率建模，对新的场景进行评估时，可以不经过对该场景进行实际的识别测试就可以预测出各算法在该场景下的指标，减少算法评估的工作量。

【附图说明】

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种人像识别算法性能评测方法流程示意图；

图2是本发明实施例提供的一种待测图片簇获取方法流程示意图；

图3是本发明实施例提供的一种人像识别算法性能评测方法流程示意图；

图4是本发明实施例提供的一种人像识别算法性能评测方法流程示意图；

图5是本发明实施例提供的一种人像识别算法性能评测方法中影响因子举例；

图6是本发明实施例提供的场景1与场景2的影响因子示例；

图7是本发明实施例提供的场景1部分影响因子概率分布；

图8是本发明实施例提供的场景2部分影响因子概率分布；

图9是本发明实施例提供的影响因子与正确率列表；

图10是本发明实施例提供的算法1两眼宽度与识别结果关系曲线示意图；

图11是本发明实施例提供的算法1与算法2影响因子与结果相关性表；

图12是本发明实施例提供的算法1与算法2多元线性回归得到的系数表；

图13是本发明实施例提供的综合评测结果示例；

图14是本发明实施例提供的一种人像识别算法性能评测装置结构示意图。

【具体实施方式】

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在本发明的描述中，术语“内”、“外”、“纵向”、“横向”、“上”、“下”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作，因此不应当理解为对本发明的限制。

此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例1:

本发明实施例1提供了一种人像识别算法性能评测方法，预先收集用于评测各人像识别算法的图片底库，如图1所示，所述评测方法包括：

在步骤201中，根据各人像识别算法所适用的真实使用场景的数据特性，生成一组或者多组待测影响因子。

在本发明实施例中，将影响到识别正确率的因素定义为影响因子；其中，所述影响因子包括拍摄设备影响因子、人脸影响因子、环境影响因子、底库影响因子、算法影响因子中的一类或者多类，具体的：

所述拍摄设备影响因子，包括拍摄原始图片分辨率、人脸图片两眼间距、镜头焦距、镜头光圈、快门、感光度和光照强度中的一项或者多项；所述人脸影响因子，包括人脸遮挡程度、人脸三维俯仰角、人脸三维左右旋转角、人脸平面内旋转角、人脸表情扭曲程度和人脸化妆程度中的一项或者多项；所述环境影响因子，包括图片中环境相比较人像的像素占比、环境中可识别对象的数量和环境的可变化幅度中的一项或者多项；所述底库影响因子，包括从收集的底库图片中筛选出的一簇或者多簇图片与所述一组或者多组待测影响因子的相似性程度；所述算法影响因子，包括算法中各参数的配置区间。

在本发明实施例中，所述待测影响因子通常是由上述影响因子中的拍摄设备影响因子、人脸影响因子和环境影响因子中的各参数项构成，而另外的底库影响因子和算法影响因子在本发明实施例中，则更多的是在步骤203中计算测试结果过程中，作为测试影响因子存在。即所述待测影响因子反映的是真实使用场景下所采集到图片中的相关特性，而所述测试影响因子则是对于测试准确度和测试维度所做出的相关限定。

在步骤202中，根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片；其中，所述一簇或者多簇待测图片的数据特性与所述一组或者多组待测影响因子所代表的数据特性相符。

在步骤203中，计算各人像识别算法在各簇待测图片中的测试结果，建立所述测试结果与相应影响因子的关联关系。

在步骤204中，根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分。

本发明实施例提出了使用场景与影响因子的定义、通过相关性分析可得出测试结果与影响因子之间的多元关系模型，并最终得出某一算法在某一场景下的评测结果。本发明能够良好的反映不同算法在不同场景下的表现，为算法研发、采购提供了标准化且有一定参考价值的指标。

本发明实施例利用对于场景的概率建模，对新的场景进行评估时，可以不经过对该场景进行实际的识别测试就可以预测出各算法在该场景下的指标，减少算法评估的工作量。

在本发明实施例中，对于所述预先收集用于评测各人像识别算法的图片底库，至少包括以下几种途径。而在具体实现过程中，采用以下途径中的一种或者几种则根据实际情况来定。

途径1：通过网络爬虫手段从互联网网站抓取包含人像信息的图片或从视频中截取包含人像信息的图片填充图片底库。

可以说途径1在本发明中是普遍适用的一种途径，在进行任何的真实使用场景下人像识别算法性能评测是均可采用通过途径1所填充得到的图片底库。所述途径1中的图片获取范围广，可以包含各种形式生成的图片，但是，途径1的劣势在于其过于发散，对于爬虫手段获取到的图片填充到图片底库前的分析过程会占用较多的计算资源。其中，分析过程将在本发明实施例后续扩展方案中具体阐述。

途径2：从学术研究网站下载图片包，将所述图片包中的图片填充图片底库，其中，所述图片包中包含人像信息。

所述途径2的适用场景尤其是证件照验证的场合，例如：人像识别算法所适用的场景是车站安检，此时人脸信息的采集与学术研究网站下载的人像图片包之间的特征一致性(在本发明实施例中也被描述为影响因子)会非常高。因此，在真实使用场景为类似所述证件照验证的场合时，将所述途径2所收集的图片以更高的比重填充到图片底库中。

途径3：从实时的视频监控系统中获取人像信息的图片填充图片底库。

这种途径具有一定的权限难度，即需要获取到现实中视频监控视频获取权限，然而这种方式获取到的图片中的人像信息是最新的，由此进行的步骤204中的各人像识别算法适用于所述真实使用场景下的性能评测打分的可信度更高。

途径4：通过将现有的图片进行缩放、旋转和/或遮挡变换后产生新的图片填充图片底库。

所述途径4是一种二次加工的技术手段，因此，在具体实现方式中，可以与上述的途径1、途径2和途径3所获取到的包含人像信息的图片作为原始图片，并通过上述的缩放、旋转和/或遮挡变换后产生新的图片填充图片底库。需要指出的是，途径4毕竟是二次加工得到的图片，一般是底库中的图片无法充分满足待测影响因子的技术需求时，才会进一步通过所述途径4增加底库中的图片量。例如：待测影响因中包含了人脸影响因子中的半脸遮挡项，而实际通过上述途径1、途径2和/或途径3获取到的都是全脸，则为了符合所述待测影响因子，则可以通过所述途径4进行底库图片素材的补充操作。

途径5：通过建立3D人脸模型，并在人脸模型设定渲染参数方式得到的图片填充图片底库。

所述途径5和途径4是相似的，属于二次加工的技术手段，而其适用的场景更为特别一些。途径5的处理更适用于一些由多摄像头构成的立体人脸信息分析的场景。随着3D视觉技术越来越成熟，并被普及到日常生活中的各个应用方面，因此，在本发明实施例中考虑到可能设定的待测影响因子会包含3D人脸模型，才进一步提出了上述的途径5来填充图片底库。

对于本发明实施例而言，存在一种应用场景，例如各种场合下的安检，其对于人脸无遮挡是有着严格要求的，包括：不能佩戴墨镜，不能佩戴帽子，不能适用围巾围住面部等等，并且，由于相应安检场景下，摄像头和人脸都是近距离进行的，因此，在分析和确认在相应真实使用场景下的数据特性时，通常还会把包括对人脸正面无遮挡，并且人脸分辨率达标的要求(即待测影响因子的具体表现形式之一)。因此，在本发明实施例中，专门为相应的应用场景设定图片底库时，表现为在相应的方法过程中，对于各种途径所获取的图片在填充到图片底库之前，方法还包括：

根据人脸正面无遮挡，并且人脸分辨率达到指定参数作为第一过滤条件，过滤掉不满足所述第一过滤条件的图片。所述第一过滤条件即具体的分辨率参数值，而其参数值则是根据真实使用场景的数据特性完成设置的(例如：真实使用场景下所配置的摄像头的分辨率)。

在本发明实施例中，对于步骤201中涉及的，所述根据各人像识别算法所适用的真实使用场景的数据特性，生成一组或者多组待测影响因子，还提供了一种具体实现方式，如下：

根据真实使用场景的数据特性，统计各影响因子的概率分布，并生成适用于真实使用场景的一组或者多组影响因子组合；其中，所述一组或者多组影响因子组合对应于真实使用场景下的一种或者多种状态。

在本发明实施例中，所述真实使用场景的数据特性的表现形式，对于具有实体应用场景下的图片采集时，则相应的数据特性可以表现为与当前拟定的真实使用场景相似或者一致的历史采集的图片，进一步，所述的统计各影响因子的概率分布则可以理解为在相应历史采集的图片中，各影响因子的分布情况，包括：一张图中分布的影响因子组合情况，以及影响因子在各个图片中的出现情况，并将上述组合情况和出现情况进行整合，得到所述概率分布(例如可以得到特定影响因子组合下，在各个图片中出现的概率，概率达到预设阈值时，即可将相应的影响因子组合导出，得到所述待测影响因子)。

另一方面，在本发明实施例中，所述真实使用场景的数据特性的表现形式，还可以是通过虚拟建模完成，这种方式尤其适用于原创性应用场景(即历史上对于使用本发明实施例所提出的评测方法对象而言，其历史上没有一致的或者相似的应用场景存在)。而所述的虚拟建模便是将诸多有经验人员所能构想到的真实使用场景中包含的内容按照其运行规律建模，并通过模型的运行来分析出上述的影响因子概率分布。类似的，将各种内容按照时间线和位置(即上述的运行规律)进行虚拟运行，而各自内容之间产生的交集和/或组合状态，便是用于分析出所述概率分布的依据。

在本发明实施例的步骤202中，之所以需要根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片，是为了能够提高不同真实使用场景下，对人像识别算法的评测的准确性，例如：在真实使用场景是社区监控时，此时图片的分辨率通常不会太高，因此，在选择待测图片的时候，相应的拍摄设备影响因子中的图片分辨率就不宜选择底库中分辨率较高的图片作为待测图片，这样会影响最终的评测的准确性，而本发明的优势正是在于发现了这一点特质，并为此制定了行之有效的解决手段。

因此，对于步骤202的实现过程中，存在一种更为有效的方式，预先收集用于评测各人像识别算法的图片底库的同时，分析所收集的图片自身固有的拍摄设备影响因子、人脸影响因子和环境影响因子，则所述根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片，如图2所示，具体包括：

在步骤2021中，根据所述底库影响因子中设定的相似性参数，进行包括所述设备影响因子、人脸影响因子和环境影响因子中一类或者多类的相似性计算。

在步骤2022中，相似性计算结果满足所述设定的相似性参数的图片，与对应的影响因子组合关联生成所述一簇或者多簇待测图片。

由于在本发明的优选实现方案中，通常会设定及多组待测影响因子，这是考虑到一款产品在适用到真实使用场景时，因为研发成本的进一步考虑，会将其所能够适用的真实使用场景进行多种可能行的覆盖(也可以理解为一类真实使用场景的不同版本，例如：小区的安全监控，学校的安全监控和商铺的安全监控，使用同一款监控系统的话，那么在针对相应监控系统中所配套使用的人像是被算法的评测过程中，就需要分别针对所述小区的真实使用场景、学校的真实使用场景和商铺的真实使用场景设定各自的一组待测影响因子)，而对应不同的，所述计算各人像识别算法在各簇待测图片中的测试结果，建立所述测试结果与相应影响因子的关联关系，如图3所示，具体包括：

在步骤301中，根据算法影响因子中各参数配置组合，进行所述一簇或者多簇图片的人像识别。

在步骤302中，将所述识别结果与相应影响因子建立的关联关系。

在本发明实施例中，针对步骤204中所涉及的过程，根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分，具体包括：

对识别结果进行统计，根据对应所述各簇图片的人像识别准确率，以及相应簇图片关联的待测影响因子加权得到性能评测打分。由此，可以看到本发明所提出的评测方法，是围绕着待测影响因子和识别准确率进行的，其中，识别准确率可理解为，以一簇图片(也可以理解为对一个一组待测影响因子的图片)为单位，在相应一簇图片中完成准确人像识别结果，占所述一簇图片中图片总数量的比重。这里所描述的相应簇图片关联的待测影响因子加权，可以理解为在存在多组待测影响因子时，人像识别算法在对应各组待测影响因子所筛选出的对应簇待测图片识别的准确率，通常不适合直接求平均值得到最后的性能评测打分的(但是有不排除这么去操作)，因为，不同组待测影响因子，其测试的难度是有差异的，因此，作为本发明的最优实现方案，提出了在根据各组待测影响因子(即各簇图片)计算得到准确率后，还需将各准确率进行加权后得到最后的性能评测打分。其中，具体的加权参数值，可以根据实际情况中，不同组待测影响因子对于产品市场、目标真实使用场景关联性高低进行设定，本领域技术人员在此技术公开基础上，可以根据具体测试情况进行设定和调整，在此不做过多赘述。

实施例2：

本发明实施例提供了一种影响因子的相关性分析，这个分析过程可以是在实施例1中步骤201之间执行完成，即对于待测影响因子生成的一个判定维度。

通过在对真实环境下随机采样数据进行相关性分析的方法,来确定影响因子x与测试结果y之间的是否存在相关性、以及判断影响因子x之间是否存在(线性)相关性。

接下来我们通过相关性分析，来确定哪些影响因子与测试结果y是存在相关性的。

罗列涉及的几个关键函数式如下:

其中，r_xy即为某一影响因子x与识别正确率y之间的相关性，取值范围为[-1,1]，1表示两个变量完成线性相关，-1表示两个变量完全负相关，0表示两个变量完全不相关，显然如果相关系数趋近于0时，相关关系就越弱。s_x表示样本中x因子标准差,s_y表示结果标准差，s_xy表示二者协方差；

是样本中x因子的平均值，/>

是识别正确率的平均值，n表示样本个数，i表示第几个样本。

同理通过上述的分析可求出不同的因子之间的相关性关系，后续建立影响因子与结果模型时，需选择一组与y有相关性个因子之间无相关性的因子构成模型。

根据经验值划分0.6-0.8为较强相关区间，0.8-1为强相关区间。建议考虑关联程度大于0.6以上的影响因子来构建关联关系，也可以根据实际实验结果调整该阈值。

本发明实施例除了提出上述的影响因子与测试结果相似性来确定有效影响因子方式以外，还提出了通过多元多次多项式模型来近似各有效影响因子与测试结果y之间的关系的方法，所述多元多次多项式模型展示如下:

其中，上述多元多次多项式中n为影响因子的个数(此处与上面函数式中n表示样本个数是相同字符，不同的使用概念)，m为多项式的最高阶数，ε是误差项(回归得到的模型与真实值仍是有一定误差的后续在假设模型中将会忽略此项)。将上述多项式看成是多元线性模型其中自变量共m*n个。

y＝α₀+α₁x₁+…+α_i x_i+…+α_(m*n)x_(m*n)

求解

(即所有α)即可得到近似的模型。可采用线性回归(最小二乘法)的方法求得/>

公式为：/>

其中X为对应于影响因子参数值构成的矩阵，Y为相应测试结果构成的向量。/>

通过多元积分得到最终评测结果，可通过带入使用场景的固定影响因子值，然后对变化的影响因子进行多元积分得到该算法在某一场景下的平均测试结果(正确率)以下表示为Y注意与上面公式的含义不同。

上述x₁x₂x₃为某一场景下的三个变化的因子；y(x₁,x₂,x₃)代表了测试结果与x₁x₂x₃之间的关系。f(x₁)则代表该因子在当前场景下的概率分布(概率密度函数)，其中，f(x)的关系式为

Y值的范围同样为0-1，认为应采用该场景下平均正确率较高的算法。

实施例3：

本发明实施例，在于通过融入示例性参数举例，并将本发明实施例1中描述的影响因子做适当的配组，从而更具体的阐述本发明实施例1实现过程中的几个主要节点的示例性实现细节。如图4所示，本发明实施例方法包括：

在步骤401中，通过如下几种途径收集了约500万张测试用图片，包含约10万个个体人员的人像信息。

1.通过网络爬虫从互联网网站抓取图片、或视频从中截取；

2.从一些学术研究网站下载图片包；

3.在专门场所使用专门设备进行拍摄；

4.从真实使用场景比如视频监控系统中获取抓拍图片或从视频中提取；

5.从现有的图片通过2D图像处理技术进行变换后产生新的测试图片(缩放、旋转、遮挡等)；

6.使用3D建模技术，通过建立3D人脸模型，再通过人脸模型设定各种不同参数渲染得到测试图片。

在步骤402中，选取部分图片提取特征建立底库；按照常识原则，选择正面无遮挡，人脸分辨率较高的图片，针对每个人员目前选择一张图片作为底库。

在具体实现中，可以分别建立1千人、2千人、5千人、1万人、2万人、5万人、10万人的底库。其中，底库人员数量少于测试数据集个体数量时,采用随机抽取的方式，多次建立不同的底库进行测试。

底库人员数量是指的是实际应用系统特征库内的人员数量，这会对识别的性能有一定的影响，因此进行性能评测时我们会人为改变此数量。而测试数据集个体(人员)数量是指收集的大量数据集中包含的人员数量(仅和收集渠道手段有关，可认为固有不变的)也并不会作为评测的影响因子。通常来说随着底库人员数量的增加、误报率会增大、硬件不变的情况下、随着底库人员数量增加识别速率会下降。

如图5所示，其中罗列了较为常规的一些影响因子，但是，在实际操作中不排除部分影响因子是无法通过底库中测试图片确认出的(即测试图片中与影响因子关联的信息可能是缺失的)。在实际操作过程中，若较大比例的测试图片中均缺失某一影响因子的参数信息(即在实施例1中筛选出的一簇图片数量小于测试所需图片数量)，则优先的是相应的影响因子会从待测影响因子中去除掉。

在步骤403中，从真实使用场景的数据中统计变化的影响因子的概率分布。如图7和图8所示，其中，图7代表如图6中所限定的通道抓拍场景1的部分影响因子概率分布图；图8代表如图6中所限定的闸机刷脸场景2的部分影响因子概率分布图。其中，具体的概率分布算法可参考实施例1和实施例2所阐述的内容来实现，本发明实施例中不对此做赘述。

对影响因子之间进行相关性分析，以便选取相对线性独立的影响因子。请见图7目前将这几个影响因子均按照等距分为10个取值点。故测试结果应有10*10*10*10种取值组合。

在步骤404中，从总的测试图片筛选图片,为保证在各种不同的影响因素值的情况下，均能获得其识别正确率，需要每个影响因素值组合均有足量的数据。对于步骤403中的10000种取值组合，均应有超过100张图片进行测试(即总数超过100万张)对于数据量不足的影响因子组合，需要剔除或补充数据。

在步骤406中，进行识别测试，统计每一种影响因子组合的测试结果(识别率)请见图9，我们单独拿出两眼像素间距与识别结果绘图来观察起关系见图10

在步骤407中，分别对几个影响因子与测试结果进行相关性分析。相关性结果见图11，发现算法1的识别结果与旋转角(roll)俯仰角(pitch)无关；算法2的识别结果与旋转角有关。

在步骤408中，进行线性假设:

算法1采用3个自变量：1.两眼间距(eyeD)，标识为：x1；2.偏转角(yaw)，标识为：x2；3.俯仰角(pitch)，标识为：x3；三个参数，采用三次多项式假设:

也可以写作如下形式:

y＝α₀+α₁x₁+α₂x₂+α₃x₃+α₄x₄+····+α₈x₈+α₉x₉；

其中，α₁为原α₍₁₎₍₁₎依次类推；

而算法2采用四个自变量:1.两眼间距(eyeD)，标识为：x1；2.偏转角(yaw)，标识为：x2；3.俯仰角(pitch)，标识为：x3；4.旋转角(roll)，标识为：x4；采用三次多项式假设公式为:

也可写作:

y＝α₀+α₁x₁+α₂x₂+α₃x₃+α₄x₄+···+α₁₂x₁₂；

在步骤409中，采用最小二乘法对上述两个算法的假设模型进行回归。得到两个算法的所有系数见图12。

在步骤410中，算法1与算法2分别带入场景1与场景2的概率分布进行积分求解分分别得到结果见图13得出结论:场景1和场景2下均应选择算法2。

相对于实施例1而言，本发明实施例利用了实施例2所提出的相似性算法和模型，将实施例1中的步骤204进行了进一步的实例化实现，具有较高的可参考价值。

实施例4：

如图14所示，是本发明实施例的基于人体状态的内容推荐装置的架构示意图。本实施例的基于人体状态的内容推荐装置包括一个或多个处理器21以及存储器22。其中，图14中以一个处理器21为例。

处理器21和存储器22可以通过总线或者其他方式连接，图14中以通过总线连接为例。

存储器22作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序和非易失性计算机可执行程序，如实施例1中的人像识别算法性能评测方法。处理器21通过运行存储在存储器22中的非易失性软件程序和指令，从而执行人像识别算法性能评测方法。

存储器22可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器22可选包括相对于处理器21远程设置的存储器，这些远程存储器可以通过网络连接至处理器21。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述程序指令/模块存储在所述存储器22中，当被所述一个或者多个处理器21执行时，执行上述实施例1和实施例3中的人像识别算法性能评测方法，例如，执行以上描述的图1-4所示的各个步骤。

值得说明的是，上述装置和系统内的模块、单元之间的信息交互、执行过程等内容，由于与本发明的处理方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

本领域普通技术人员可以理解实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random AccessMemory)、磁盘或光盘等。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人像识别算法性能评测方法，其特征在于，预先收集用于评测各人像识别算法的图片底库，所述评测方法包括：

根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分；

所述根据各人像识别算法所适用的真实使用场景的数据特性，生成一组或者多组待测影响因子，具体包括：

2.根据权利要求1所述的人像识别算法性能评测方法，其特征在于，所述预先收集用于评测各人像识别算法的图片底库，具体包括：

3.根据权利要求2所述的人像识别算法性能评测方法，其特征在于，对于各种途径所获取的图片在填充到图片底库之前，方法还包括：

4.根据权利要求1所述的人像识别算法性能评测方法，其特征在于，所述的统计各影响因子的概率分布具体为在相应历史采集的图片中，各影响因子的分布情况，包括：一张图中分布的影响因子组合情况，以及影响因子在各个图片中的出现情况，并将上述组合情况和出现情况进行整合，得到所述概率分布。

5.根据权利要求1所述的人像识别算法性能评测方法，其特征在于，将影响到识别正确率的因素定义为影响因子；所述影响因子包括拍摄设备影响因子、人脸影响因子、环境影响因子、底库影响因子、算法影响因子中的一类或者多类，其中，所述待测影响因子由所述影响因子中指定类构成，具体的：

所述算法影响因子，包括算法中各参数的配置区间。

6.根据权利要求5所述的人像识别算法性能评测方法，其特征在于，预先收集用于评测各人像识别算法的图片底库的同时，分析所收集的图片自身固有的拍摄设备影响因子、人脸影响因子和环境影响因子，则所述根据所述一组或者多组待测影响因子筛选所述图片底库，得到一簇或者多簇待测图片，具体包括：

7.根据权利要求6所述的人像识别算法性能评测方法，其特征在于，所述计算各人像识别算法在各簇待测图片中的测试结果，建立所述测试结果与相应影响因子的关联关系，具体包括：

建立识别结果与相应影响因子的关联关系；

其中，影响影子包括由所述设备影响因子、人脸影响因子、环境影响因子和底库影响因子中的一类或者多类构成的待测影响因子，以及所述算法影响因子。

8.根据权利要求7所述的人像识别算法性能评测方法，其特征在于，根据所述一簇或者多簇待测图片的测试结果和相应的影响因子，完成各人像识别算法适用于所述真实使用场景下的性能评测打分，具体包括：

9.一种人像识别算法性能评测装置，其特征在于，所述装置包括：

至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述处理器执行，用于完成权利要求1-8任一所述的人像识别算法性能评测方法。