CN112036370A

CN112036370A - 一种人脸特征比对方法、系统、设备及计算机存储介质

Info

Publication number: CN112036370A
Application number: CN202011002864.9A
Authority: CN
Inventors: 王清晨; 谢会斌; 李聪廷
Original assignee: Jinan Boguan Intelligent Technology Co Ltd
Current assignee: Jinan Boguan Intelligent Technology Co Ltd
Priority date: 2020-09-22
Filing date: 2020-09-22
Publication date: 2020-12-04
Anticipated expiration: 2040-09-22
Also published as: CN112036370B

Abstract

本申请公开了一种人脸特征比对方法、系统、设备及计算机介质，应用于图形处理器，包括：获取待比对的人脸特征集；获取保存已知人脸特征的人脸特征库；批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集；对相似度值集进行选取，得到目标相似度值；传输目标相似度值至图形处理器连接的CPU。本申请中，由图形处理器来对人脸特征进行比对，由于图形处理器的计算能力强，所以可以提高人脸特征比对的效率，且由图形处理器选取目标相似度值，并只将目标相似度值传输至CPU，减少了图形处理器传输至CPU的数据量，可以提高人脸特征比对结果由图形处理器传输至CPU的传输效率。

Description

一种人脸特征比对方法、系统、设备及计算机存储介质

技术领域

本申请涉及特征比对技术领域，更具体地说，涉及一种人脸特征比对方法、系统、设备及计算机存储介质。

背景技术

在人脸识别技术中，需要在大量人脸的特征库中快速识别出与输入人脸相似度最高的库人脸，比如通过CPU(central processing unit，中央处理器)来进行人脸特征比对等。

然而，由于人脸特征库中保存着大量的人脸特征，且人脸特征库可能有多个，使得人脸特征比对的计算量较大；此外，人脸特征的维度可能较高，会进一步增大人脸特征比对的计算量，也即人脸特征比对对CPU的计算能力要求较大，而CPU虽然可以借助多核来提高计算能力，但可能仍无法满足人脸特征比对的计算需求，导致人脸特征比对的效率较低。

综上所述，如何提高人脸特征比对的效率是目前本领域技术人员亟待解决的问题。

发明内容

本申请的目的是提供一种人脸特征比对方法，其能在一定程度上解决如何提高人脸特征比对的效率的技术问题。本申请还提供了一种人脸特征比对系统、设备及计算机可读存储介质。

为了实现上述目的，本申请提供如下技术方案：

一种人脸特征比对方法，应用于图形处理器，包括：

获取待比对的人脸特征集；

获取保存已知人脸特征的人脸特征库；

批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值，得到相似度值集；

对所述相似度值集进行选取，得到目标相似度值；

传输所述目标相似度值至所述图形处理器连接的CPU。

优选的，所述批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值，得到相似度值集，包括：

创建共享矩阵；

基于所述共享矩阵，批量计算所述人脸特征集中每个所述待比对人脸特征与每个所述已知人脸特征的所述相似度值，得到所述相似度值集。

优选的，所述创建共享矩阵，包括：

创建第一共享矩阵和第二共享矩阵；

所述基于所述共享矩阵，批量计算所述人脸特征集中每个所述待比对人脸特征与每个所述已知人脸特征的所述相似度值，得到所述相似度值集，包括：

在所述人脸特征集中，选取未参与计算的所述待比对人脸特征对所述第一共享矩阵进行填充，得到第一填充矩阵；

在所述人脸特征库中，选取未参与计算的所述已知人脸特征对所述第二共享矩阵进行填充，得到第二填充矩阵；

确定对所述第一填充矩阵和所述第二填充矩阵进行运算的计算线程；

基于所述计算线程，计算所述第一填充矩阵内每个所述待比对人脸特征和所述第二填充矩阵内每个所述已知人脸特征的所述相似度值；

判断所述人脸特征库中是否有未与所述第一填充矩阵运算的所述已知人脸特征；若所述人脸特征库中有未与所述第一填充矩阵运算的所述已知人脸特征，则返回执行所述在所述人脸特征库中，选取未参与计算的所述已知人脸特征对所述第二共享矩阵进行填充的步骤；

若所述人脸特征库中没有未与所述第一填充矩阵运算的所述已知人脸特征，则判断所述人脸特征集中是否存在未参与计算的所述待比对人脸特征；

若所述人脸特征集中存在未参与计算的所述待比对人脸特征，则返回执行所述在所述人脸特征集中，选取未参与的计算的所述待比对人脸特征对所述第一共享矩阵进行填充的步骤，若所述人脸特征集中不存在未参与计算的所述待比对人脸特征，则将所有的所述相似度值作为所述相似度值集。

优选的，所述确定对所述第一填充矩阵和所述第二填充矩阵进行运算的计算线程，包括：

确定计算块和计算网；

确定每个线程在所述计算块和所述计算网中的索引信息；

基于所述索引信息确定所述计算线程；

所述基于所述计算线程，计算所述第一填充矩阵内每个所述待比对人脸特征和所述第二填充矩阵内每个所述已知人脸特征的所述相似度值之后，还包括：

基于所述计算线程的所述索引信息、所述共享矩阵的大小，确定所述计算线程运算得到的所述相似度值的存储信息；

按照所述存储信息存储对应的所述相似度值。

优选的，所述在所述人脸特征集中，选取未参与计算的所述待比对人脸特征对所述第一共享矩阵进行填充，得到第一填充矩阵的过程中，包括：

判断所述第一共享矩阵的数据量是否超出选取的所述待比对人脸特征的数据量，若是，则将所述第一共享矩阵中超出选取的所述人脸特征的数据的值置为0。

优选的，所述批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值，包括：

基于cuda技术批量计算所述人脸特征集中每个所述待比对人脸特征与每个所述已知人脸特征的所述相似度值。

优选的，所述批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值之前，还包括：

确定并划分存储所述人脸特征集的显存空间；

确定并划分存储所述人脸特征库的显存空间；

确定并划分存储所述相似度集的显存空间；

确定并划分存储所述目标相似度值的显存空间。

优选的，所述对所述相似度值集进行选取，得到目标相似度值，包括：

通过句柄对所述相似度值集进行选取，得到所述目标相似度值；

所述传输所述目标相似度值至所述图形处理器连接的CPU，包括：

通过句柄传输所述目标相似度值至所述图形处理器连接的所述CPU。

一种人脸特征比对系统，应用于图形处理器，包括：

第一获取模块，用于获取待比对的人脸特征集；

第二获取模块，用于获取保存已知人脸特征的人脸特征库；

第一计算模块，用于批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值，得到相似度值集；

第一选取模块，用于对所述相似度值集进行选取，得到目标相似度值；

第一传输模块，用于传输所述目标相似度值至所述图形处理器连接的CPU。

一种人脸特征比对设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一所述人脸特征比对方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述人脸特征比对方法的步骤。

本申请提供的一种人脸特征比对方法，应用于图形处理器，包括：获取待比对的人脸特征集；获取保存已知人脸特征的人脸特征库；批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集；对相似度值集进行选取，得到目标相似度值；传输目标相似度值至图形处理器连接的CPU。本申请中，由图形处理器来对人脸特征进行比对，由于图形处理器的计算能力强，所以可以提高人脸特征比对的效率，且由图形处理器选取目标相似度值，并只将目标相似度值传输至CPU，减少了图形处理器传输至CPU的数据量，可以提高人脸特征比对结果由图形处理器传输至CPU的传输效率。本申请提供的一种人脸特征比对系统、设备及计算机可读存储介质也解决了相应技术问题。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种人脸特征比对方法的流程图；

图2为本申请实施例提供的一种人脸特征比对方法的第二流程图；

图3为本方法512维度25万库容不同batch比对平均单batch耗时结果图；

图4为本申请实施例提供的一种人脸特征比对系统的结构示意图；

图5为本申请实施例提供的一种人脸特征比对设备的结构示意图；

图6为本申请实施例提供的一种人脸特征比对设备的另一结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1为本申请实施例提供的一种人脸特征比对方法的流程图。

本申请实施例提供的一种人脸特征比对方法，应用于图形处理器，可以包括以下步骤：

步骤S101：获取待比对的人脸特征集。

实际应用中，图形处理器(Graphics Processing Unit，GPU)可以先获取待比对的人脸特征集，待比对人脸特征集中人脸特征的数量及来源等均可以根据实际需要确定，比如人脸特征可以为神经网络模型对所要识别的人脸图像进行识别后得到的人脸特征等。

步骤S102：获取保存已知人脸特征的人脸特征库。

实际应用中，获取的人脸特征集中的人脸特征属于未知的人脸特征，为了获知人脸特征集中的人脸特征信息，需要借助已知的人脸特征来对人脸特征集中的人脸特征进行比对识别，而已知的人脸特征多保存在特征库中，所以图形处理器在获取待比对的人脸特征集之后，还可以获取保存已知人脸特征的人脸特征库，以便后续借助人脸特征库对人脸特征集进行人脸特征比对。

步骤S103：批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集。

实际应用中，图形处理器在获取保存已知人脸特征的人脸特征库之后，便可以批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集。

应当指出，GPU与CPU相比的话，GPU采用了数量众多的计算单元和超长的流水线，但只有非常简单的控制逻辑并省去了存储单元；而CPU不仅被存储单元占用了大量空间，还有复杂的控制逻辑和诸多优化电路，所以GPU中计算单元的占比多与CPU，也即意味着GPU的计算能力强于CPU，所以CPU批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值的话，可以提高相似度值的计算效率。此外，计算相似度值的方法可以为欧式距离计算方法、余弦距离计算方法等，本申请在此不做具体限定。

步骤S104：对相似度值集进行选取，得到目标相似度值。

步骤S105：传输目标相似度值至图形处理器连接的CPU。

实际应用中，可能存在相似度值集中的数据量较大的情况，此时图形处理器传输全部的相似度值集给CPU的话，会导致传输速率较慢，影响CPU获取人脸特征比对结果的效率，为了保证CPU获取人脸特征比对结果的效率，图形处理器在批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集之后，可以对相似度值集进行选取，得到目标相似度值，并且图形处理器只需将选取的目标相似度值传输给CPU即可。

应当指出，图形处理器在对相似度值集进行选取的过程中，对于每个待比对人脸特征，可以只选取该待比对人脸特征对应的最大相似度值作为目标相似度值，也可以选取该待比对人脸特征对应的一定数量的相似度值作为目标相似度值等，本申请在此不做具体限定。

本申请提供的一种人脸特征比对方法，应用于图形处理器，包括：获取待比对的人脸特征集；获取保存已知人脸特征的人脸特征库；批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集；对相似度值集进行选取，得到目标相似度值；传输目标相似度值至图形处理器连接的CPU。本申请中，由图形处理器来对人脸特征进行比对，由于图形处理器的计算能力强，所以可以提高人脸特征比对的效率，且由图形处理器选取目标相似度值，并只将目标相似度值传输至CPU，减少了图形处理器传输至CPU的数据量，可以提高人脸特征比对结果由图形处理器传输至CPU的传输效率。

本申请实施例提供的一种人脸特征比对方法中，图形处理器在批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值的过程中，为了便于计算相似度值，可以基于cuda(Compute Unified Device Architecture，统一计算设备架构)技术批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值。

实际应用中，为了避免图形处理器每次计算相似度值的过程中均需要执行显存空间分配的步骤，图形处理器在批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值之前，还可以确定并划分存储人脸特征集的显存空间；确定并划分存储人脸特征库的显存空间；确定并划分存储相似度集的显存空间；确定并划分存储目标相似度值的显存空间。各类显存空间的大小可以根据所存储的数据量的大小来确定。

具体应用场景中，还可以借助cuda技术来分配显存空间，比如可以使用cudaMalloc函数cudaError_t cudaMalloc(void**devPtr,size_t size)来分配显存空间，该函数一共需2个参数：第一个参数传递的是存储在CPU内存中的指针变量的地址，cudaMalloc在执行完成后，向这个地址中写入了一个地址值，此地址值便是分配的GPU显存空间的地址；第二个参数表示需要分配的显存空间的大小。

应当指出，具体应用场景中，图形处理器在分配显存空间之后，还需要将相应数据存储至显存空间中，比如将待比对人脸特征集存储至对应的显存空间中等，在此过程中，图形处理器可以借助cuda内部函数cudaMemcpy(void*dst,const void*src,size_t count,enum cudaMemcpyKind kind)来将CPU中的数据拷贝至显存空间内容，该函数一共需4个参数：第一个参数表示GPU中的地址，由内存分配函数获取；第二个参数表示CPU中的地址，为定义的数组首地址；第三个参数表示数据的byte大小；第四个参数为cudaMemcpyHostToDevice，表示由内存拷贝到显存。

此外，在将目标相似度值传输给CPU后，可能需要释放显存空间，此时可以使用函数cudaFree(void*devPtr)来释放显存空间，该函数中的参数为设备的端指针，也即初始分配显存空间时所使用的指针。

本申请实施例提供的一种人脸特征比对方法中，图形处理器在对相似度值集进行选取，得到目标相似度值的过程中，可以通过句柄对相似度值集进行选取，得到目标相似度值；相应的，图形处理器在传输目标相似度值至图形处理器连接的CPU的过程中，可以通过句柄传输目标相似度值至图形处理器连接的CPU。也即图形处理器可以通过句柄来快速选取得到目标相识度值及快速将目标相似度值传输至CPU。

具体应用场景中，图形处理器可以使用cublasIsamax()函数来选取目标相似度值，该函数类型可以如下：cublasIsamax(cublasHandle_t handle,int n,const float*x,int incx,int*result)，其中第一个参数为句柄；第二参数n表示相似度值集的元素个数；第三参数为数组的首地址，要求为GPU端的首地址；第四参数为元素间的间隔；第五参数表示结果，为目标相似度值所在的位置。

此外，图形处理器可以使用cublasGetVector()函数来将目标相似度值传输给CPU，该函数类型可以如下：cublasGetVector(int n,int elemSize,const void*x,intincx,void*y,int incy)；其中第一个参数表示要传输的目标相似度值的数量；第二参数为byte大小，一般为4byte；第三参数为要传输的目标相似度值的起始地址；第四参数为GPU中的数据间隔；第五参数为存储的地址，也即为CPU中的内存地址；第六参数为CPU中数据的间隔。应当指出，当需要传输多个目标相似度值时，可以通过循环的方式来实现。

应当指出，图形处理器在不需要应用句柄后，可以通过cublasDestroy(handle)函数来释放之前创建的句柄。

本申请实施例提供的一种人脸特征比对方法中，图形处理器批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集的过程中，可以创建共享矩阵；基于共享矩阵，批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集。由于图形处理器在计算相似度值的过程中依据了共享矩阵，共享矩阵可以降低从全局闪存拷贝人脸特征的次数，从而可以降低人脸特征多次访问造成的耗时增加，进一步提高人脸特征比对效率。

请参阅图2，图2为本申请实施例提供的一种人脸特征比对方法的第二流程图。

步骤S201：获取待比对的人脸特征集。

步骤S202：获取保存已知人脸特征的人脸特征库。

步骤S203：创建第一共享矩阵和第二共享矩阵。

实际应用中，图形处理器在计算相似度值的过程中，需要使用待比对人脸特征及已知人脸特征，所以可以创建两个共享矩阵来分别保存待比对人脸特征和已知人脸特征。

步骤S204：在人脸特征集中，选取未参与计算的待比对人脸特征对第一共享矩阵进行填充，得到第一填充矩阵。

实际应用中，图形处理器可以在人脸特征集中，选取未参与计算的待比对人脸特征对第一共享矩阵进行填充，得到第一填充矩阵，以得到当前轮批量计算过程中所需的待比对人脸特征。

步骤S205：在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充，得到第二填充矩阵。

实际应用中，图形处理器可以在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充，得到第二填充矩阵，以得到当前轮批量计算过程中所需的已知人脸特征。

步骤S206：确定对第一填充矩阵和第二填充矩阵进行运算的计算线程。

实际应用中，图形处理器中存在多个线程，每个线程可以负责一个待比对人脸特征与已知人脸特征的相似度计算过程，所以图形处理器可以确定对第一填充矩阵和第二填充矩阵进行运算的计算线程，以便批量计算相似度值。

具体应用场景中，图形处理器中存在多个具有计算能力的计算块和计算网，且计算网由计算块组成，所以图形处理器在确定对第一填充矩阵和第二填充矩阵进行运算的计算线程的过程中，可以确定计算块和计算网；确定每个线程在计算块和计算网中的索引信息；基于索引信息确定计算线程。应当指出，线程的索引信息可以包括线程在计算块中的X维度索引、线程在计算块中的Y维度索引、线程在计算网中的X维度索引、线程在计算网中的Y维度索引等。

具体应用场景中，图形处理器在基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值之后，还可以基于计算线程的索引信息、共享矩阵的大小，确定计算线程运算得到的相似度值的存储信息；按照存储信息存储对应的相似度值，以便快速存储相似度值，且后续可以根据存储信息快速查找相似度值。相似度值的存储信息可以相似度值在存储矩阵中的行信息和列信息等，行信息和列信息的计算方式可以如下：

int Row＝by*TILE_WIDTH+ty；

int Col＝bx*TILE_WIDTH+tx；

其中，Row表示相似度值在存储矩阵中的行信息，Col表示相似度值在存储矩阵中的列信息，bx表示线程在计算网中的X维度索引，by表示线程在计算网中的Y维度索引，tx表示线程在计算块中的X维度索引，ty表示线程在计算块中的Y维度索引；TILE_WIDTH表示共享矩阵的大小，其一般可以根据图形处理器的显卡大小来确定，比如图形处理器的显卡大小为1060，则TILE_WIDTH的大小可以为16等，当然也可以有其他确定TILE_WIDTH的方式，本申请在此不做具体限定。

步骤S207：基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值。

实际应用中，图形处理器在得到第一共享矩阵、第二共享矩阵和计算线程之后，便可以基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值，以批量得到相似度值。

应当指出，具体应用场景中，可以通过cuda内部同步方法__syncthreads()来控制计算线程加载数据和执行计算等。

步骤S208：判断人脸特征库中是否有未与第一填充矩阵运算的已知人脸特征；若人脸特征库中有未与第一填充矩阵运算的已知人脸特征，则返回执行步骤S205；若人脸特征库中没有未与第一填充矩阵运算的已知人脸特征，则执行步骤S209。

实际应用中，因为对于每个待比对人脸特征，图形处理器需要计算该待比对人脸特征与人脸特征库中每一个已知人脸特征的相似度值，所以图形处理器还需判断人脸特征库中是否有未与第一填充矩阵运算的已知人脸特征；若人脸特征库中有未与第一填充矩阵运算的已知人脸特征，则返回执行步骤S205。

步骤S209：判断人脸特征集中是否存在未参与计算的待比对人脸特征；若人脸特征集中存在未参与计算的待比对人脸特征，则返回执行步骤S204；若人脸特征集中不存在未参与计算的待比对人脸特征，则执行步骤S210。

实际应用中，若人脸特征库中没有未与第一填充矩阵运算的已知人脸特征，则表明已计算出当前轮选取的待比对人脸特征与每个已知人脸特征的相似度值，但此时并不意味着待比对人脸特征集中每个待比对人脸特征均参与了计算，所以图形处理器还需判断人脸特征集中是否存在未参与计算的待比对人脸特征；若人脸特征集中存在未参与计算的待比对人脸特征，则返回执行步骤S204；若人脸特征集中不存在未参与计算的待比对人脸特征，则可以将所有的相似度值作为相似度值集。

步骤S210：将所有的相似度值作为相似度值集。

步骤S211：对相似度值集进行选取，得到目标相似度值。

步骤S212：传输目标相似度值至图形处理器连接的CPU。

实际应用中，图形处理器在在人脸特征集中，选取未参与计算的待比对人脸特征对第一共享矩阵进行填充，得到第一填充矩阵的过程中，可以对填充数据进行越界保护，比如可以判断第一共享矩阵的数据量是否超出选取的待比对人脸特征的数据量，若是，则将第一共享矩阵中超出选取的人脸特征的数据的值置为0。

具体应用场景中，可以通过公式来判断第一共享矩阵的数据量是否超出选取的待比对人脸特征的数据量，比如可以判断Row<m和t*TILE_WIDTH+tx<n这两个条件是否同时成立，若同时成立，则表示第一共享矩阵的数据量未超出选取的待比对人脸特征的数据量，此时ds_A[ty][tx]＝A[Row*n+t*TILE_WIDTH+tx]，若不同时成立，则第一共享矩阵的数据量超出选取的待比对人脸特征的数据量，此时ds_A[ty][tx]＝0.0；其中m代表一次参与比对的人数，n表示一个人的特征维度，t为由人脸特征库填充得到的第二共享矩阵的数量；A表示第一共享矩阵。相应的，在生成相似度值集的过程中，也可以进行越界保护，比如可以判断Row<m和Col<k是否同时成立，若同时成立，则C[Row*k+Col]＝Cvalue；其中，C表示目标相似度值的存储矩阵，Cvalue表示临时存储的相似度值，k表示人脸特征库中已知人脸特征的数量。

为了便于理解，现假设待比对人脸特征为128维及512维，人脸特征库中已知人脸特征的数量为25万，对本申请提供的人脸特征比对方法及现有CPU进行人脸特征比对的方法进行比较，其中，单特征25万库容CPU与GPU特征比对耗时对比结果可以参阅表1，本方法512维度25万库容不同batch比对平均单batch耗时结果可以如图3所示，由表1可知，本申请提供的人脸特征比对方法的计算效率较高；由图3可知，本申请单次送入的比对特征数目越多，比对效率越高。

表1单特征25W库容cpu与GPU特征比对耗时对比

特征维度	CPU(SSE)	GPU(本文方法)
			128	12.03ms	2.12ms
512	20.44ms	4.68ms

请参阅图4，图4为本申请实施例提供的一种人脸特征比对系统的结构示意图。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，可以包括：

第一获取模块101，用于获取待比对的人脸特征集；

第二获取模块102，用于获取保存已知人脸特征的人脸特征库；

第一计算模块103，用于批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集；

第一选取模块104，用于对相似度值集进行选取，得到目标相似度值；

第一传输模块105，用于传输目标相似度值至图形处理器连接的CPU。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，第一计算模块可以包括：

第一创建子模块，用于创建共享矩阵；

第一计算子模块，用于基于共享矩阵，批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，第一创建子模块可以包括：

第一创建单元，用于创建第一共享矩阵和第二共享矩阵；

第一计算子模块可以包括：

第一选取单元，用于在人脸特征集中，选取未参与计算的待比对人脸特征对第一共享矩阵进行填充，得到第一填充矩阵；

第二选取单元，用于在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充，得到第二填充矩阵；

第一确定单元，用于确定对第一填充矩阵和第二填充矩阵进行运算的计算线程；

第一计算单元，用于基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值；

第一判断单元，用于判断人脸特征库中是否有未与第一填充矩阵运算的已知人脸特征；若人脸特征库中有未与第一填充矩阵运算的已知人脸特征，则返回执行在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充的步骤；若人脸特征库中没有未与第一填充矩阵运算的已知人脸特征，则判断人脸特征集中是否存在未参与计算的待比对人脸特征；若人脸特征集中存在未参与计算的待比对人脸特征，则返回执行在人脸特征集中，选取未参与的计算的待比对人脸特征对第一共享矩阵进行填充的步骤，若人脸特征集中不存在未参与计算的待比对人脸特征，则将所有的相似度值作为相似度值集。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，第一确定单元具体可以用于：确定计算块和计算网；确定每个线程在计算块和计算网中的索引信息；基于索引信息确定计算线程；

相应的，还可以包括：

第二确定单元，用于第一计算单元基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值之后，基于计算线程的索引信息、共享矩阵的大小，确定计算线程运算得到的相似度值的存储信息；

第一存储单元，用于按照存储信息存储对应的相似度值。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，第一选取单元具体可以用于：判断第一共享矩阵的数据量是否超出选取的待比对人脸特征的数据量，若是，则将第一共享矩阵中超出选取的人脸特征的数据的值置为0。

第二计算单元，用于基于cuda技术批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，还可以包括：

第三确定单元，用于第一计算模块批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值之前，确定并划分存储人脸特征集的显存空间；

第四确定单元，用于确定并划分存储人脸特征库的显存空间；

第五确定单元，用于确定并划分存储相似度集的显存空间；

第六确定单元，用于确定并划分存储目标相似度值的显存空间。

本申请实施例提供的一种人脸特征比对系统，应用于图形处理器，第一选取模块可以包括：

第三选取单元，用于通过句柄对相似度值集进行选取，得到目标相似度值；

第一传输模块可以包括：

第一传输单元，用于通过句柄传输目标相似度值至图形处理器连接的CPU。

本申请还提供了一种人脸特征比对设备及计算机可读存储介质，其均具有本申请实施例提供的一种人脸特征比对方法具有的对应效果。请参阅图5，图5为本申请实施例提供的一种人脸特征比对设备的结构示意图。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：

获取待比对的人脸特征集；

获取保存已知人脸特征的人脸特征库；

批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集；

对相似度值集进行选取，得到目标相似度值；

传输目标相似度值至图形处理器连接的CPU。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：创建共享矩阵；基于共享矩阵，批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：创建第一共享矩阵和第二共享矩阵；在人脸特征集中，选取未参与计算的待比对人脸特征对第一共享矩阵进行填充，得到第一填充矩阵；在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充，得到第二填充矩阵；确定对第一填充矩阵和第二填充矩阵进行运算的计算线程；基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值；判断人脸特征库中是否有未与第一填充矩阵运算的已知人脸特征；若人脸特征库中有未与第一填充矩阵运算的已知人脸特征，则返回执行在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充的步骤；若人脸特征库中没有未与第一填充矩阵运算的已知人脸特征，则判断人脸特征集中是否存在未参与计算的待比对人脸特征；若人脸特征集中存在未参与计算的待比对人脸特征，则返回执行在人脸特征集中，选取未参与的计算的待比对人脸特征对第一共享矩阵进行填充的步骤，若人脸特征集中不存在未参与计算的待比对人脸特征，则将所有的相似度值作为相似度值集。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：确定计算块和计算网；确定每个线程在计算块和计算网中的索引信息；基于索引信息确定计算线程；基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值之后，基于计算线程的索引信息、共享矩阵的大小，确定计算线程运算得到的相似度值的存储信息；按照存储信息存储对应的相似度值。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：判断第一共享矩阵的数据量是否超出选取的待比对人脸特征的数据量，若是，则将第一共享矩阵中超出选取的人脸特征的数据的值置为0。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：基于cuda技术批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值之前，确定并划分存储人脸特征集的显存空间；确定并划分存储人脸特征库的显存空间；确定并划分存储相似度集的显存空间；确定并划分存储目标相似度值的显存空间。

本申请实施例提供的一种人脸特征比对设备，包括存储器201和处理器202，存储器201中存储有计算机程序，处理器202执行计算机程序时实现如下步骤：通过句柄对相似度值集进行选取，得到目标相似度值；通过句柄传输目标相似度值至图形处理器连接的CPU。

请参阅图6，本申请实施例提供的另一种人脸特征比对设备中还可以包括：与处理器202连接的输入端口203，用于传输外界输入的命令至处理器202；与处理器202连接的显示单元204，用于显示处理器202的处理结果至外界；与处理器202连接的通信模块205，用于实现人脸特征比对设备与外界的通信。显示单元204可以为显示面板、激光扫描使显示器等；通信模块205所采用的通信方式包括但不局限于移动高清链接技术(HML)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线连接：无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：

获取待比对的人脸特征集；

获取保存已知人脸特征的人脸特征库；

对相似度值集进行选取，得到目标相似度值；

传输目标相似度值至图形处理器连接的CPU。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：创建共享矩阵；基于共享矩阵，批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值，得到相似度值集。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：创建第一共享矩阵和第二共享矩阵；在人脸特征集中，选取未参与计算的待比对人脸特征对第一共享矩阵进行填充，得到第一填充矩阵；在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充，得到第二填充矩阵；确定对第一填充矩阵和第二填充矩阵进行运算的计算线程；基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值；判断人脸特征库中是否有未与第一填充矩阵运算的已知人脸特征；若人脸特征库中有未与第一填充矩阵运算的已知人脸特征，则返回执行在人脸特征库中，选取未参与计算的已知人脸特征对第二共享矩阵进行填充的步骤；若人脸特征库中没有未与第一填充矩阵运算的已知人脸特征，则判断人脸特征集中是否存在未参与计算的待比对人脸特征；若人脸特征集中存在未参与计算的待比对人脸特征，则返回执行在人脸特征集中，选取未参与的计算的待比对人脸特征对第一共享矩阵进行填充的步骤，若人脸特征集中不存在未参与计算的待比对人脸特征，则将所有的相似度值作为相似度值集。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：确定计算块和计算网；确定每个线程在计算块和计算网中的索引信息；基于索引信息确定计算线程；基于计算线程，计算第一填充矩阵内每个待比对人脸特征和第二填充矩阵内每个已知人脸特征的相似度值之后，基于计算线程的索引信息、共享矩阵的大小，确定计算线程运算得到的相似度值的存储信息；按照存储信息存储对应的相似度值。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：判断第一共享矩阵的数据量是否超出选取的待比对人脸特征的数据量，若是，则将第一共享矩阵中超出选取的人脸特征的数据的值置为0。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：基于cuda技术批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：批量计算人脸特征集中每个待比对人脸特征与每个已知人脸特征的相似度值之前，确定并划分存储人脸特征集的显存空间；确定并划分存储人脸特征库的显存空间；确定并划分存储相似度集的显存空间；确定并划分存储目标相似度值的显存空间。

本申请实施例提供的一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时实现如下步骤：通过句柄对相似度值集进行选取，得到目标相似度值；通过句柄传输目标相似度值至图形处理器连接的CPU。

本申请所涉及的计算机可读存储介质包括随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质。

本申请实施例提供的人脸特征比对系统、设备及计算机可读存储介质中相关部分的说明请参见本申请实施例提供的人脸特征比对方法中对应部分的详细说明，在此不再赘述。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人脸特征比对方法，其特征在于，应用于图形处理器，包括：

获取待比对的人脸特征集；

获取保存已知人脸特征的人脸特征库；

对所述相似度值集进行选取，得到目标相似度值；

传输所述目标相似度值至所述图形处理器连接的CPU。

2.根据权利要求1所述的方法，其特征在于，所述批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值，得到相似度值集，包括：

创建共享矩阵；

3.根据权利要求2所述的方法，其特征在于，所述创建共享矩阵，包括：

创建第一共享矩阵和第二共享矩阵；

4.根据权利要求3所述的方法，其特征在于，所述确定对所述第一填充矩阵和所述第二填充矩阵进行运算的计算线程，包括：

确定计算块和计算网；

确定每个线程在所述计算块和所述计算网中的索引信息；

基于所述索引信息确定所述计算线程；

按照所述存储信息存储对应的所述相似度值。

5.根据权利要求3所述的方法，其特征在于，所述在所述人脸特征集中，选取未参与计算的所述待比对人脸特征对所述第一共享矩阵进行填充，得到第一填充矩阵的过程中，包括：

6.根据权利要求1至5任一项所述的方法，其特征在于，所述批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值，包括：

7.根据权利要求6所述的方法，其特征在于，所述批量计算所述人脸特征集中每个待比对人脸特征与每个所述已知人脸特征的相似度值之前，还包括：

确定并划分存储所述人脸特征集的显存空间；

确定并划分存储所述人脸特征库的显存空间；

确定并划分存储所述相似度集的显存空间；

确定并划分存储所述目标相似度值的显存空间。

8.一种人脸特征比对系统，其特征在于，应用于图形处理器，包括：

第一获取模块，用于获取待比对的人脸特征集；

第二获取模块，用于获取保存已知人脸特征的人脸特征库；

9.一种人脸特征比对设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述人脸特征比对方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述人脸特征比对方法的步骤。