CN116030524A - 一种人脸识别方法及装置、电子设备和存储介质 - Google Patents
一种人脸识别方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116030524A CN116030524A CN202310146568.3A CN202310146568A CN116030524A CN 116030524 A CN116030524 A CN 116030524A CN 202310146568 A CN202310146568 A CN 202310146568A CN 116030524 A CN116030524 A CN 116030524A
- Authority
- CN
- China
- Prior art keywords
- face
- frame
- target video
- result
- face detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000001514 detection method Methods 0.000 claims abstract description 154
- 238000012545 processing Methods 0.000 claims description 82
- 238000000605 extraction Methods 0.000 claims description 80
- 238000007781 pre-processing Methods 0.000 claims description 50
- 238000012805 post-processing Methods 0.000 claims description 17
- 230000001815 facial effect Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000000875 corresponding effect Effects 0.000 claims description 13
- 230000002596 correlated effect Effects 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 16
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 5
- 238000010295 mobile communication Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000010365 information processing Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000000554 iris Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本公开涉及计算机技术领域,公开了一种人脸识别方法及装置、电子设备和存储介质,所述方法包括:对待识别视频中的目标视频帧逐帧进行解码操作;在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。本公开实施例可提高人脸识别效率。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种人脸识别方法及装置、电子设备和存储介质。
背景技术
人脸识别是一种生物特征识别技术,属于模式识别和计算机视觉领域。相对于指纹、虹膜等其它生物识别技术,具有诸多优点,应用前景十分广泛。随着人脸识别技术的日益成熟,人脸识别技术已经广泛地应用于安防、银行、医疗、智慧交通等多个领域中。
基于视频的人脸识别,能够利用视频中的视频帧进行人脸识别,利用视频帧中人脸图像中的特征信息,进行人脸识别。然而,由于视频中往往会包含多帧视频帧,因此,在对视频进行人脸识别时,往往会耗费较多的时间,效率较低。
发明内容
本公开提出了一种人脸识别技术方案。
根据本公开的一方面,提供了一种人脸识别方法,包括:对待识别视频中的目标视频帧逐帧进行解码操作;在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。
在一种可能的实现方式中,所述对待识别视频中的目标视频帧逐帧进行解码操作,包括:逐帧获取第i帧视频帧,其中,i为正整数,i小于N,N为所述待识别视频的总帧数;根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,所述解码概率与所述待识别视频的识别精度需求正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在一种可能的实现方式中,所述根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,包括:生成随机数,所述随机数的取值区间为[0,1];基于所述随机数与所述解码概率的比较结果,确定是否对所述第i帧视频帧进行解码。
在一种可能的实现方式中,在对待识别视频中的目标视频帧逐帧进行解码操作后,所述方法还包括:将逐帧解码出的目标视频帧放入第一集合中;在所述第一集合中目标视频帧的数量达到数量阈值的情况下,确定第一集合中的第一帧和最后一帧的相似度;在所述相似度大于等于相似度阈值的情况下,解码所述第一帧或所述最后一帧作为人脸检测操作需处理的目标视频帧。
在一种可能的实现方式中,所述方法还包括:在所述相似度小于相似度阈值的情况下,将所述第一集合拆分为两个子集合,针对所述子集合,迭代地执行对所述第一集合执行的操作,得到人脸检测操作需处理的目标视频帧,直至迭代后拆分得到的所有子集合的第一帧和最后一帧的相似度大于等于相似度阈值。
在一种可能的实现方式中,所述方法还包括:根据历史处理的目标视频帧之间的相似度,确定所述数量阈值,所述数量阈值与目标视频帧之间的相似度正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在一种可能的实现方式中,在对已解码出的目标视频帧执行人脸检测操作前,所述方法还包括:在所述解码操作解码出至少一帧目标视频帧的情况下,对所述目标视频帧进行预处理操作,所述预处理操作与所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行;所述预处理操作包括以下至少一项:将目标视频帧中各通道的像素值减去对应通道均值;将目标视频帧中的像素值除以预定数值;将目标视频帧中像素值的数据格式转变为人脸识别操作所需的格式。
在一种可能的实现方式中,所述人脸检测操作需处理的目标视频帧放置于预处理结果队列中;所述对已解码出的目标视频帧执行人脸检测操作,包括:在所述预处理结果队列中存在至少一帧目标视频帧的情况下,从所述预处理结果队列中无放回地提取至少一帧目标视频帧;对提取的至少一帧目标视频帧进行人脸检测操作;将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中。
在一种可能的实现方式中,在将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中后,所述方法还包括:在所述人脸检测结果队列中存在至少一个人脸检测结果的情况下,从所述人脸检测结果队列中无放回地提取至少一个人脸检测结果;对提取的至少一个人脸检测结果进行后处理操作,得到人脸图像;对所述人脸图像进行人脸图像调整操作;将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中;所述人脸图像调整操作包括下述至少一项:对所述人脸图像进行归一化操作;对图像尺寸进行调整操作;将人脸图像中像素值的数据格式转变为人脸识别操作所需的格式。
在一种可能的实现方式中,在将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中后,所述方法还包括:在所述人脸图像调整结果队列中存在至少一个调整结果的情况下,从所述人脸图像调整结果队列中无放回地提取至少一个调整结果;对提取的至少一个调整结果进行特征提取操作;将所述特征提取操作得到的人脸特征提取结果存入人脸特征提取结果队列中。
在一种可能的实现方式中,所述对已检测出的人脸执行人脸识别操作,包括:在所述人脸特征提取结果队列中存在至少一个人脸特征提取结果的情况下,从所述人脸特征提取结果队列中无放回地提取至少一个人脸特征提取结果;对提取的至少一个人脸特征提取结果与目标人脸特征进行相似度计算;根据所述相似度计算的结果,得到人脸识别结果。
根据本公开的一方面,提供了一种人脸识别装置,包括:解码单元,用于对待识别视频中的目标视频帧逐帧进行解码操作;检测单元,用于在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;识别单元,用于在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。
在一种可能的实现方式中,所述解码单元,用于:逐帧获取第i帧视频帧,其中,i为正整数,i小于N,N为所述待识别视频的总帧数;根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,所述解码概率与所述待识别视频的识别精度需求正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在一种可能的实现方式中,所述解码单元,用于:生成随机数,所述随机数的取值区间为[0,1];基于所述随机数与所述解码概率的比较结果,确定是否对所述第i帧视频帧进行解码。
在一种可能的实现方式中,所述装置还包括:选帧单元,用于:将逐帧解码出的目标视频帧放入第一集合中;在所述第一集合中目标视频帧的数量达到数量阈值的情况下,确定第一集合中的第一帧和最后一帧的相似度;在所述相似度大于等于相似度阈值的情况下,解码所述第一帧或所述最后一帧作为人脸检测操作需处理的目标视频帧。
在一种可能的实现方式中,所述选帧单元用于:在所述相似度小于相似度阈值的情况下,将所述第一集合拆分为两个子集合,针对所述子集合,迭代地执行对所述第一集合执行的操作,得到人脸检测操作需处理的目标视频帧,直至迭代后拆分得到的所有子集合的第一帧和最后一帧的相似度大于等于相似度阈值。
在一种可能的实现方式中,所述装置还包括:数量阈值确定单元,用于根据历史处理的目标视频帧之间的相似度,确定所述数量阈值,所述数量阈值与目标视频帧之间的相似度正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在一种可能的实现方式中,所述装置还包括:预处理单元,用于在所述解码操作解码出至少一帧目标视频帧的情况下,对所述目标视频帧进行预处理操作,所述预处理操作与所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行;所述预处理操作包括以下至少一项:将目标视频帧中各通道的像素值减去对应通道均值;将目标视频帧中的像素值除以预定数值;将目标视频帧中像素值的数据格式转变为人脸识别操作所需的格式。
在一种可能的实现方式中,所述人脸检测操作需处理的目标视频帧放置于预处理结果队列中;所述检测单元,用于:在所述预处理结果队列中存在至少一帧目标视频帧的情况下,从所述预处理结果队列中无放回地提取至少一帧目标视频帧;对提取的至少一帧目标视频帧进行人脸检测操作;将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中。
在一种可能的实现方式中,所述装置还包括:后处理单元,用于在所述人脸检测结果队列中存在至少一个人脸检测结果的情况下,从所述人脸检测结果队列中无放回地提取至少一个人脸检测结果;对提取的至少一个人脸检测结果进行后处理操作,得到人脸图像;调整单元,用于对所述人脸图像进行人脸图像调整操作;将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中;所述人脸图像调整操作包括下述至少一项:对所述人脸图像进行归一化操作;对图像尺寸进行调整操作;将人脸图像中像素值的数据格式转变为人脸识别操作所需的格式。
在一种可能的实现方式中,所述装置还包括:特征提取单元,用于:在所述人脸图像调整结果队列中存在至少一个调整结果的情况下,从所述人脸图像调整结果队列中无放回地提取至少一个调整结果;对提取的至少一个调整结果进行特征提取操作;将所述特征提取操作得到的人脸特征提取结果存入人脸特征提取结果队列中。
在一种可能的实现方式中,所述识别单元,用于:在所述人脸特征提取结果队列中存在至少一个人脸特征提取结果的情况下,从所述人脸特征提取结果队列中无放回地提取至少一个人脸特征提取结果;对提取的至少一个人脸特征提取结果与目标人脸特征进行相似度计算;根据所述相似度计算的结果,得到人脸识别结果。
根据本公开的一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
在本公开实施例中,通过对待识别视频中的目标视频帧逐帧进行解码操作;在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。由此,通过逐帧进行视频解码操作,可以在解码出一帧目标视频帧后,即对目标视频帧执行后续的操作,此时,可以并行地去执行下一目标视频帧的解码操作,以提高对待识别视频的人脸识别效率;并且在通过解码操作得到目标视频帧后,即可先对已解码出的目标视频帧执行人脸检测操作,在检测出一个人脸的情况下,即启动对该人脸的人脸识别操作,此时,也会并行地执行人脸检测操作,以及对待识别视频中的后续目标视频帧的解码操作,即解码操作、人脸检测操作和人脸识别操作并行执行,以提高对待识别视频的人脸识别效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出本公开实施例的人脸识别方法的流程图。
图2示出本公开实施例提供的视频解码操作的流程图。
图3示出本公开实施例提供的视频抽针后的筛查和预处理操作的流程图。
图4示出本公开实施例提供的人脸检测操作的流程图。
图5示出本公开实施例提供的后处理操作的流程图。
图6示出本公开实施例提供的人脸特征提取操作的流程图。
图7示出本公开实施例提供的人脸识别操作的流程图。
图8示出本公开实施例提供的人脸识别方法的流程图。
图9示出本公开实施例的一种人脸识别装置的框图。
图10示出本公开实施例的一种电子设备的框图。
图11示出本公开实施例的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开实施例的人脸识别方法的流程图,如图1所示,所述人脸识别方法包括以下步骤。
在步骤S11中,对待识别视频中的目标视频帧逐帧进行解码操作。
待识别视频,为待进行人脸识别操作的视频。在一个示例中,该视频可以是离线视频文件,例如,存储在计算机本地磁盘中的视频文件,或者也可以是远程的云端视频文件;在另一个示例中,该视频也可以是实时传输的视频流,例如,图像采集设备实时采集的视频流。
这里的目标视频帧可以是待识别视频中的部分或全部视频帧,在一个示例中,可以逐帧地将待识别视频中全部视频进行解码操作;在另一个示例中,可以按照一定的概率来确定是否提取待识别视频中的视频帧,具体可参见本公开提供的可能的实现方式,此处暂不做赘述。
这里的解码操作,即为从视频中提取视频帧的操作。这里的逐帧进行解码操作,能够逐帧地得到解码后的目标视频帧,而非执行一次解码操作,一次性得到全部目标视频帧。逐帧进行解码操作,可以在解码出一帧目标视频帧后,即对目标视频帧执行后续的操作,此时,可以并行地去执行下一目标视频帧的解码操作,以提高对待识别视频的人脸识别效率。
而一次性解码全部目标视频帧的过程往往需要较长时间,在这个过程中,无法对目标视频帧并行执行其它操作,效率较低。
在步骤S12中,在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作。
人脸检测操作,能够检测出目标视频帧中人脸所在的位置,即人脸在目标视频帧中具体位于哪一区域,具体位置往往通过矩形框来表示。在一个示例中,可以通过轻量级人脸检测算法来进行人脸检测操作,该算法例如可以是超光速通用人脸检测器(Ultra-Light-Fast-Generic-Face-Detector-1MB),或者也可以是适用于边缘设备的轻便快速人脸检测器(A Light and Fast Face Detector for Edge Devices),对于具体使用的人脸检测算法,本公开对此不做限定。
在通过解码操作得到目标视频帧后,即可先对已解码出的目标视频帧执行人脸检测操作,此时,也会并行地执行对待识别视频中的后续目标视频帧的解码操作,即人脸检测操作和目标视频帧的解码操作同时进行。
在一个示例中,在解码出一帧目标视频帧的情况下,即可对该目标视频帧执行人脸检测操作;同时,并行地执行对待识别视频中下一目标视频帧的解码操作。
在步骤S13中,在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果。
人脸识别操作通过对检测出的人脸所在区域的图像特征进行识别,得到人脸识别结果。人脸识别可以通过已知身份信息的人脸特征库,将检测出的人脸的图像特征与人脸特征库中的人脸特征进行匹配,匹配成功的情况下,即识别出了人脸的身份信息。具体识别过程可参见本公开提供的可能的实现方式,此处不做赘述。
针对一个目标视频帧,可能会检测出一个人脸,也可能会检测出多个人脸,当然也可能没有检测出人脸。而人脸识别操作可以是在检测出一个人脸的情况下,即启动对该人脸的人脸识别操作。此时,也会并行地执行人脸检测操作,以及对待识别视频中的后续目标视频帧的解码操作,即解码操作、人脸检测操作和人脸识别操作并行执行。
需要说明的是,在解码操作、人脸检测操作和人脸识别操作以外,还可以同时并行执行其它操作,对目标视频帧的预处理等等,具体可参见本公开提供的可能的实现方式,此处不做赘述。
在本公开实施例中,通过对待识别视频中的目标视频帧逐帧进行解码操作;在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。由此,通过逐帧进行视频解码操作,可以在解码出一帧目标视频帧后,即对目标视频帧执行后续的操作,此时,可以并行地去执行下一目标视频帧的解码操作,以提高对待识别视频的人脸识别效率;并且在通过解码操作得到目标视频帧后,即可先对已解码出的目标视频帧执行人脸检测操作,在检测出一个人脸的情况下,即启动对该人脸的人脸识别操作,此时,也会并行地执行人脸检测操作,以及对待识别视频中的后续目标视频帧的解码操作,即解码操作、人脸检测操作和人脸识别操作并行执行,以提高对待识别视频的人脸识别效率。
在一种可能的实现方式中,所述对待识别视频中的目标视频帧逐帧进行解码操作,包括:逐帧获取第i帧视频帧,其中,i为正整数,i小于N,N为所述待识别视频的总帧数;根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,所述解码概率与所述待识别视频的识别精度需求正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在对待识别视频中目标视频帧进行逐帧解码时,为提高解码的效率,考虑到视频中往往会存在一些重复的画面,或者是没有人脸的画面,因此,可以不必将待识别视频中的全部视频都解码,而是按照一个预设的解码概率,来进行目标视频帧的解码。
解码概率为预先设置的,该概率为将视频帧保存提取出来的概率,概率越大,则待识别视频帧中提取出来的目标视频帧的数量也越多,对应的识别精度也越高;概率越小则待识别视频帧中提取出来的目标视频帧的数量也越少,对应的识别精度也越低。该概率可以根据实际精度需求设置,本公开对此不做具体限定。通过调整设置的解码概率,可以自由的调整识别精度和识别效率,以便在精度和效率之间取得平衡。
在逐帧解码时,针对每一帧视频帧,都可以通过解码概率来确定是否提取该帧。
在一种可能的实现方式中,所述根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,包括:生成随机数,所述随机数的取值区间为[0,1];基于所述随机数与所述解码概率的比较结果,确定是否对所述第i帧视频帧进行解码。
随机数落在取值范围[0,1]之间的概率是随机的,在随机数小于等于解码概率的情况下,解码第i帧视频帧,得到目标视频帧,而在随机数大于解码概率的情况下,则不对第i帧视频帧进行解码。这样,第i帧视频帧是否被解码的概率即为预设的解码概率。
请参阅图2,为本公开实施例提供的视频解码操作的流程图。预先设置待识别视频路径和视频帧的解码概率,初始化解码结果队列和i的值。读取视频的第i帧,判断随机数是否小于等于解码概率,若是,则进一步判断是否需要对视频帧进行尺寸调整。如果需要进行尺寸调整,则对提取出的目标视频帧进行尺寸调整。并将调整后的目标视频帧放入解码结果队列,并将i加1,进行下一视频帧的解码操作。若随机数大于解码概率,表明不提取当前视频帧,并将i加1,进行下一视频帧的解码操作,直至i的值为N+1。
在一种可能的实现方式中,在对待识别视频中的目标视频帧逐帧进行解码操作后,所述方法还包括:将逐帧解码出的目标视频帧放入第一集合中;在所述第一集合中目标视频帧的数量达到数量阈值的情况下,确定第一集合中的第一帧和最后一帧的相似度;在所述相似度大于等于相似度阈值的情况下,解码所述第一帧或所述最后一帧作为人脸检测操作需处理的目标视频帧。
考虑到视频中的连续的多帧视频帧可能是相同的画面,针对相同的画面,如果仅针对其中一帧进行人脸识别,显然会大大节省处理资源,减少处理时间,因此,可以将逐帧解码出的目标视频帧放到第一集合中,当这个集合中目标视频帧的数量达到数量阈值的情况下,去确定第一集合中的第一帧和最后一帧的相似度,在所述相似度大于等于相似度阈值的情况下,可以认为第一集合中的目标视频帧的画面都是相同或相似的,只需对其中一帧进行识别即可,可以只对第一帧或者最后一帧进行后续的处理,以节省处理资源,减少处理时间。
在一种可能的实现方式中,所述方法还包括:在所述相似度小于相似度阈值的情况下,将所述第一集合拆分为两个子集合,针对所述子集合,迭代地执行对所述第一集合执行的操作,得到人脸检测操作需处理的目标视频帧,直至迭代后拆分得到的所有子集合的第一帧和最后一帧的相似度大于等于相似度阈值。
在相似度小于相似度阈值的情况下,可以认为第一集合中的视频画面发生了变化,此时,可以通过二分法,将第一集合从中间拆分为两个子集合,针对各子集合,再去迭代地执行对第一集合执行的操作,即确定第一帧和最后一帧的相似度,在所述相似度大于等于相似度阈值的情况下,解码第一帧或最后一帧作为人脸检测操作需处理的目标视频帧,在相似度小于相似度阈值的情况下,继续通过二分法将子集合从中间拆分为两个子集合……直至迭代后拆分得到的所有子集合的第一帧和最后一帧的相似度大于等于相似度阈值。
这样,通过二分法,整个第一集合中的目标视频帧即被遍历完毕,得到的子集合中,第一帧和最后一帧的相似度大于等于相似度阈值的目标视频帧可以认为是相同的或是相似的画面,可以只对第一帧或者最后一帧进行后续的处理,以节省处理资源,减少对整个第一集合中的目标视频帧的处理时间。
在一种可能的实现方式中,其特征在于,所述方法还包括:根据历史处理的目标视频帧之间的相似度,确定所述数量阈值,所述数量阈值与目标视频帧之间的相似度正相关,与执行所述人脸识别方法的设备的处理性能正相关。
这里的数量阈值可以是根据历史处理的目标视频帧之间的相似度动态设置的,通过该设置,能够实现在视频画面变化剧烈的情况下,将数量阈值设置的小一些,以提高人脸识别的精度;而在视频画面变化程度较小的情况下,则可以将该数量阈值设置的大一些,以节约处理资源。
在一种可能的实现方式中,在对已解码出的目标视频帧执行人脸检测操作前,所述方法还包括:在所述解码操作解码出至少一帧目标视频帧的情况下,对所述目标视频帧进行预处理操作,所述预处理操作与所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行;所述预处理操作包括以下至少一项:将目标视频帧中各通道的像素值减去对应通道均值;将目标视频帧中的像素值除以预定数值;将目标视频帧中像素值的数据格式转变为人脸识别操作所需的格式。
通过预处理操作,能够将目标视频帧的格式调整统一,方便进行后续的人脸识别操作。在一个示例中,通道均值具体可以是[127,127,127],那么,将目标视频帧中各通道的像素值
X减去对应通道均值,可以表示为
X=
X– [127,127,127];图像像素除以的预定数值可以是128,那么将目标视频帧中的像素值除以预定数值可以表示为
X=
X/128;将目标视频帧中像素值的数据格式转变为人脸识别操作所需的格式,可以是对通道值进行调整,例如,将
X的数据格式由 (480, 640, 3) 变为 (3, 480, 640)。
请参阅图3,为本公开实施例提供的视频抽针后的筛查和预处理操作的流程图。在初始化时,取帧计数器j=0,批处理包(batch)的大小的初始值为1,此时批处理包容器batch_frames中没有模板视频帧,第一集合win_frames中也没有视频帧。
从解码结果队列中取帧win_frame_j,取帧成功后将win_frame_j放入第一集合win_frames中,然后令j=j+1,进行下一帧的提取,直至第一集合已满,即第一集合中的视频帧的数量达到了数量阈值,然后,判断第一集合中第一帧和最后一帧的相似度,若相似度高于相似度阈值,则只取一帧图像进行后续处理,否则将第一集合中的视频帧二分为两个子集合,再迭代地执行对第一集合执行的步骤,直至得到要处理的目标视频帧。
然后对要处理的目标视频帧进行预处理操作,预处理后的目标视频帧放入批处理包容器中,当批处理包容器中的视频帧的数量达到一个批处理包大小时,则将批处理包容器中的视频帧作为一个批处理包放入预处理结果队列中。然后令k=1并清空批处理包容器,执行下一个目标视频帧的处理,直至处理完所有的目标视频帧。
在一种可能的实现方式中,所述人脸检测操作需处理的目标视频帧放置于预处理结果队列中;所述对已解码出的目标视频帧执行人脸检测操作,包括:在所述预处理结果队列中存在至少一帧目标视频帧的情况下,从所述预处理结果队列中无放回地提取至少一帧目标视频帧;对提取的至少一帧目标视频帧进行人脸检测操作;将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中。
在预处理结果队列中存在至少一帧目标视频帧的情况下,即可提取预处理结果队列中的目标视频帧进行人脸检测操作,以实现人脸检测操作和其它操作的并行处理,提高处理效率。示例性的,预处理结果队列中目标视频帧可以是以批处理包batch的形式存在,一个批处理包中有多个目标视频帧,那么,可以在预处理结果队列中存在一个批处理包的情况下,就提取该批处理包,进行人脸检测存在;或者在视频帧处理的最后阶段,可能剩余的目标视频帧的数量不够一个批处理包的,此时也会将剩余目标视频帧作为一个批处理包放入预处理结果队列中,然后提取后进行人脸检测操作。
请参阅图4,为本公开实施例提供的人脸检测操作的流程图。人脸检测操作时会对一个batch的数据进行处理,一个batch中包含多个目标视频帧,初始时批处理包计数器b1=0,从预处理结果队列中无放回取出一个batch的数据,取出成功后对该batch数据进行人脸检测,得到检测结果,然后将检测结果放入检测结果队列中,并进行下一batch数据的处理,直至所有数据处理完毕。
在一种可能的实现方式中,在将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中后,所述方法还包括:在所述人脸检测结果队列中存在至少一个人脸检测结果的情况下,从所述人脸检测结果队列中无放回地提取至少一个人脸检测结果;对提取的至少一个人脸检测结果进行后处理操作,得到人脸图像;对所述人脸图像进行人脸图像调整操作;将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中;所述人脸图像调整操作包括下述至少一项:对所述人脸图像进行归一化操作;对图像尺寸进行调整操作;将人脸图像中像素值的数据格式转变为人脸识别操作所需的格式。
这里的后处理操作,是对人脸检测结果进行后处理,人脸检测结果具体可以是目标视频帧中用于表示人脸所在位置的人脸框,由于同一人脸可能会有多个人脸框,这里可以通过后处理操作消除多余的人脸框,使得同一人脸只对应一个人脸框。作为一个示例,这里可以通过非极大值抑制(Non Maximum Suppression,NMS)操作来消除多余的人脸框。
多余人脸框消除后,即可将各人脸框中的图像提取出来,即得到了一个个人脸图像,由于人脸在画面中的尺寸、亮度等信息是不一样的,因此得到的人脸图像的尺寸、亮度往往也是不一样的,为便于后续的人脸识别操作,可以对人脸图像进行调整操作。
通过对人脸图像进行归一化操作,将人脸图像中的像素统一至同一尺度下,例如,将图像的像素值统一至[0,255]的区间范围;通过将人脸图像的尺寸调整至同一大小,便于后续的人脸识别操作,例如,将人脸图像的尺寸同一调整到(160,160);通过对图像数据格式转换,将图像数据格式调整为适合后续人脸识别操作的格式,例如,将图像格式(160,160,3)调整为(3,160,160)。
调整完毕后,将人脸图像调整操作的调整结果存入人脸图像调整结果队列中,具体可以是将多个人脸图像作为一个批处理包,放到人脸图像调整结果队列中,每个批处理包的大小是预先设置的。
在本公开实施例中,人脸检测后处理操作与人脸图像调整操作(人脸识别预处理)共用同一个队列(读取时共用人脸检测结果队列,存储时共用人脸图像调整结果队列),即共用输入输出I/O,流程简洁。由于两个模块在进行交互的时候,是需要带宽的,如果模块很多,I/O会成为瓶颈。而人脸检测后处理操作与人脸图像调整操作均耗费时间较少,将二者放在一起共用同一个队列I/O并不会成为限制整体流程的瓶颈,反而能够减少I/O,提高人脸识别的效率。
请参阅图5,为本公开实施例提供的后处理操作的流程图。后处理操作时会对一个batch的数据进行处理,一个batch中包含多个目标视频帧,初始时批处理包计数器b2=0,从人脸检测结果队列中无放回取出一个batch的数据,取出成功后对该batch数据进行后处理,得到人脸图像,然后对人脸图像进行调整,得到调整结果,然后将多个调整后的人脸图像按照预设批次大小,作为一个batch放入人脸图像调整结果队列中,并进行下一batch数据的处理,直至所有数据处理完毕。
在一种可能的实现方式中,在将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中后,所述方法还包括:在所述人脸图像调整结果队列中存在至少一个调整结果的情况下,从所述人脸图像调整结果队列中无放回地提取至少一个调整结果;对提取的至少一个调整结果进行特征提取操作;将所述特征提取操作得到的人脸特征提取结果存入人脸特征提取结果队列中。
在人脸图像调整结果队列中存在至少一个调整结果的情况下,即可从所述人脸图像调整结果队列中无放回地提取至少一个调整结果进行特征提取操作,以实现特征提取操作和其它操作的并行处理,提高处理效率。示例性的,人脸图像调整结果队列中的多个调整结果可以是以批处理包batch的形式存在,一个批处理包中有多个调整结果,那么,可以在人脸图像调整结果队列中存在一个批处理包的情况下,就提取该批处理包,进行人脸特征提取操作;或者在视频帧处理的最后阶段,可能剩余的调整结果的数量不够一个批处理包的,此时也会将剩余调整结果作为一个批处理包放入人脸图像调整结果队列中,然后提取后进行特征提取操作。
请参阅图6,为本公开实施例提供的人脸特征提取操作的流程图。人脸特征提取操作时会对一个batch的数据进行处理,一个batch中包含多个调整结果,初始时批处理包计数器b3=0,从人脸图像调整结果队列中无放回取出一个batch的数据,取出成功后对该batch数据进行人脸特征提取,得到人脸特征提取结果,然后将人脸特征提取结果放入人脸特征提取结果队列中,并进行下一batch数据的处理,直至所有数据处理完毕。
在一种可能的实现方式中,所述对已检测出的人脸执行人脸识别操作,包括:在所述人脸特征提取结果队列中存在至少一个人脸特征提取结果的情况下,从所述人脸特征提取结果队列中无放回地提取至少一个人脸特征提取结果;对提取的至少一个人脸特征提取结果与目标人脸特征进行相似度计算;根据所述相似度计算的结果,得到人脸识别结果。
在人脸特征提取结果队列中存在至少一个人脸特征提取结果的情况下,即可从人脸特征提取结果队列中无放回地提取至少一个人脸特征提取结果进行人脸识别操作,以实现人脸识别操作和其它操作的并行处理,提高处理效率。示例性的,人脸特征提取结果队列中的多个人脸特征提取结果可以是以批处理包batch的形式存在,一个批处理包中有多个人脸特征提取结果,那么,可以在人脸特征提取结果队列中存在一个批处理包的情况下,就提取该批处理包,进行人脸识别操作;或者在视频帧处理的最后阶段,可能剩余的人脸特征提取结果的数量不够一个批处理包的,此时也会将剩余人脸特征提取结果作为一个批处理包放入人脸特征提取结果队列中,然后提取后进行人脸识别操作。
在人脸识别操作的过程中,可以从一个批处理包batch_frames_b4 中取出一个人脸特征向量face_vec_l,将face_vec_l与人脸特征库Faces_Vec_Database中每一个人脸特征向量进行相似性计算,对所有相似性计算结果进行排序,取相似性最大的结果vec_sim_max,若vec_sim_max ≥ 相似度阈值,则认为人脸比对成功,找到了对应人脸,将结果进行保持。
请参阅图7,为本公开实施例提供的人脸识别操作的流程图。人脸识别操作时,初始化计数器I=0,从人脸特征提取结果队列中无放回取出一个batch的数据 batch_frames_b4,若取数据成功,则令I=0,从batch_frames_b4中取出一个人脸特征向量face_vec_I,将face_vec_I与人脸特征库Faces_Vec_Database中的每一个人脸特征向量进行相似性计算,假定Faces_Vec_Database = [Vec_1, Vec_2, ...,Vec_q, ..., Vec_Q],即共有Q个人脸需要识别,第q个人脸的特征向量为Vec_q。则具体人脸识别过程包括:将face_vec_I与Vec_q计算余弦相似性vec_sim_q = consine(face_vec_I, Vec_q),计算相似性的最大值,vec_sim_max = max(vec_sim_q), q∈(1, Q),其中 max()表示计算最大值;判断vec_sim_max是否大于等于 相似度阈值,即vec_sim_max≥0.9是否成立,若成立,则说明离线视频中出现过 vec_sim_max对应的人脸,将vec_sim_max≥0.9 的人脸保存到结果文件中,然后令I= I+1,判断I与batch尺寸是否相等,若相等,则对下一个batch进行处理,否则继续对当前batch包中的人脸图像进行处理;判断主流程是否中断,若是则结束人脸识别过程。
下面结合一个具体实施例对本公开实施例的整体流程进行说明。请参阅图8,为本公开实施例提供的人脸识别方法的流程图。在该应用场景中,会对离线视频进行人脸识别。在识别时,会并行启动各个子模块,由离线视频解码模块对离线视频进行逐帧解码,并将解码出的目标视频帧放入解码结果队列中;然后预处理模块提取解码结果队列中的目标视频帧进行预处理操作,将预处理结果放入预处理结果队列中;人脸检测推理模块获取预处理结果进行人脸检测操作,将人脸检测操作检测出的人脸检测结果推入人脸检测结果队列中;人脸检测后处理+人脸图像调整模块获取人脸检测结果队列中的人脸检测结果,对人脸检测结果进行后处理操作得到人脸图像,并对人脸图像进行调整,得到调整结果,将调整结果存入人脸图像调整结果队列中;人脸特征提取结果模块从人脸图像调整结果队列中获取调整结果进行特征提取操作,将提取到的人脸特征提取结果存入人脸特征提取结果队列中;人脸匹配识别模块从人脸特征提取结果队列中获取人脸特征提取结果,进行人脸匹配识别,并将识别结果保存到数据库或者保存到文档。当所有子流程全部完成,即可结束对离线视频的人脸识别。
在一种可能的实现方式中,所述人脸识别方法可以由终端设备或服务器等电子设备执行,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(PersonalDigital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等,所述方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可通过服务器执行所述方法。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了人脸识别装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种人脸识别方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图9示出根据本公开实施例的人脸识别装置的框图,如图9所示,所述装置90包括:解码单元91,用于对待识别视频中的目标视频帧逐帧进行解码操作;检测单元92,用于在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;识别单元93,用于在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。
在一种可能的实现方式中,所述解码单元,用于:逐帧获取第i帧视频帧,其中,i为正整数,i小于N,N为所述待识别视频的总帧数;根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,所述解码概率与所述待识别视频的识别精度需求正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在一种可能的实现方式中,所述解码单元,用于:生成随机数,所述随机数的取值区间为[0,1];基于所述随机数与所述解码概率的比较结果,确定是否对所述第i帧视频帧进行解码。
在一种可能的实现方式中,所述装置还包括:选帧单元,用于:将逐帧解码出的目标视频帧放入第一集合中;在所述第一集合中目标视频帧的数量达到数量阈值的情况下,确定第一集合中的第一帧和最后一帧的相似度;在所述相似度大于等于相似度阈值的情况下,解码所述第一帧或所述最后一帧作为人脸检测操作需处理的目标视频帧。
在一种可能的实现方式中,所述选帧单元用于:在所述相似度小于相似度阈值的情况下,将所述第一集合拆分为两个子集合,针对所述子集合,迭代地执行对所述第一集合执行的操作,得到人脸检测操作需处理的目标视频帧,直至迭代后拆分得到的所有子集合的第一帧和最后一帧的相似度大于等于相似度阈值。
在一种可能的实现方式中,所述装置还包括:数量阈值确定单元,用于根据历史处理的目标视频帧之间的相似度,确定所述数量阈值,所述数量阈值与目标视频帧之间的相似度正相关,与执行所述人脸识别方法的设备的处理性能正相关。
在一种可能的实现方式中,所述装置还包括:预处理单元,用于在所述解码操作解码出至少一帧目标视频帧的情况下,对所述目标视频帧进行预处理操作,所述预处理操作与所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行;所述预处理操作包括以下至少一项:将目标视频帧中各通道的像素值减去对应通道均值;将目标视频帧中的像素值除以预定数值;将目标视频帧中像素值的数据格式转变为人脸识别操作所需的格式。
在一种可能的实现方式中,所述人脸检测操作需处理的目标视频帧放置于预处理结果队列中;所述检测单元,用于:在所述预处理结果队列中存在至少一帧目标视频帧的情况下,从所述预处理结果队列中无放回地提取至少一帧目标视频帧;对提取的至少一帧目标视频帧进行人脸检测操作;将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中。
在一种可能的实现方式中,所述装置还包括:后处理单元,用于在所述人脸检测结果队列中存在至少一个人脸检测结果的情况下,从所述人脸检测结果队列中无放回地提取至少一个人脸检测结果;对提取的至少一个人脸检测结果进行后处理操作,得到人脸图像;调整单元,用于对所述人脸图像进行人脸图像调整操作;将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中;所述人脸图像调整操作包括下述至少一项:对所述人脸图像进行归一化操作;对图像尺寸进行调整操作;将人脸图像中像素值的数据格式转变为人脸识别操作所需的格式。
在一种可能的实现方式中,所述装置还包括:特征提取单元,用于:在所述人脸图像调整结果队列中存在至少一个调整结果的情况下,从所述人脸图像调整结果队列中无放回地提取至少一个调整结果;对提取的至少一个调整结果进行特征提取操作;将所述特征提取操作得到的人脸特征提取结果存入人脸特征提取结果队列中。
在一种可能的实现方式中,所述识别单元,用于:在所述人脸特征提取结果队列中存在至少一个人脸特征提取结果的情况下,从所述人脸特征提取结果队列中无放回地提取至少一个人脸特征提取结果;对提取的至少一个人脸特征提取结果与目标人脸特征进行相似度计算;根据所述相似度计算的结果,得到人脸识别结果。
该方法与计算机系统的内部结构存在特定技术关联,且能够解决如何提升硬件运算效率或执行效果的技术问题(包括减少数据存储量、减少数据传输量、提高硬件处理速度等),从而获得符合自然规律的计算机系统内部性能改进的技术效果。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图10示出根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等终端设备。
参照图10,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
输入/输出接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如互补金属氧化物半导体(CMOS)或电荷耦合装置(CCD)图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如无线网络(Wi-Fi)、第二代移动通信技术(2G)、第三代移动通信技术(3G)、第四代移动通信技术(4G)、通用移动通信技术的长期演进(LTE)、第五代移动通信技术(5G)或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图11示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器或终端设备。参照图11,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如微软服务器操作系统(Windows ServerTM),苹果公司推出的基于图形用户界面操作系统(Mac OS XTM),多用户多进程的计算机操作系统(UnixTM), 自由和开放原代码的类Unix操作系统(LinuxTM),开放原代码的类Unix操作系统(FreeBSDTM)或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是(但不限于)电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (14)
1.一种人脸识别方法,其特征在于,包括:
对待识别视频中的目标视频帧逐帧进行解码操作;
在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;
在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;
其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。
2.根据权利要求1所述的方法,其特征在于,所述对待识别视频中的目标视频帧逐帧进行解码操作,包括:
逐帧获取第i帧视频帧,其中,i为正整数,i小于N,N为所述待识别视频的总帧数;
根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,所述解码概率与所述待识别视频的识别精度需求正相关,与执行所述人脸识别方法的设备的处理性能正相关。
3.根据权利要求2所述的方法,其特征在于,所述根据预先设置的所述第i帧视频帧的解码概率,确定是否对所述第i帧视频帧进行解码,包括:
生成随机数,所述随机数的取值区间为[0,1];
基于所述随机数与所述解码概率的比较结果,确定是否对所述第i帧视频帧进行解码。
4.根据权利要求1所述的方法,其特征在于,在对待识别视频中的目标视频帧逐帧进行解码操作后,所述方法还包括:
将逐帧解码出的目标视频帧放入第一集合中;
在所述第一集合中目标视频帧的数量达到数量阈值的情况下,确定第一集合中的第一帧和最后一帧的相似度;
在所述相似度大于等于相似度阈值的情况下,解码所述第一帧或所述最后一帧作为人脸检测操作需处理的目标视频帧。
5.根据权利要求4所述方法,其特征在于,所述方法还包括:在所述相似度小于相似度阈值的情况下,将所述第一集合拆分为两个子集合,针对所述子集合,迭代地执行对所述第一集合执行的操作,得到人脸检测操作需处理的目标视频帧,直至迭代后拆分得到的所有子集合的第一帧和最后一帧的相似度大于等于相似度阈值。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
根据历史处理的目标视频帧之间的相似度,确定所述数量阈值,所述数量阈值与目标视频帧之间的相似度正相关,与执行所述人脸识别方法的设备的处理性能正相关。
7.根据权利要求1-6中任意一项所述的方法,其特征在于,在对已解码出的目标视频帧执行人脸检测操作前,所述方法还包括:
在所述解码操作解码出至少一帧目标视频帧的情况下,对所述目标视频帧进行预处理操作,所述预处理操作与所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行;
所述预处理操作包括以下至少一项:
将目标视频帧中各通道的像素值减去对应通道均值;
将目标视频帧中的像素值除以预定数值;
将目标视频帧中像素值的数据格式转变为人脸识别操作所需的格式。
8.根据权利要求1所述的方法,其特征在于,所述人脸检测操作需处理的目标视频帧放置于预处理结果队列中;
所述对已解码出的目标视频帧执行人脸检测操作,包括:
在所述预处理结果队列中存在至少一帧目标视频帧的情况下,从所述预处理结果队列中无放回地提取至少一帧目标视频帧;
对提取的至少一帧目标视频帧进行人脸检测操作;
将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中。
9.根据权利要求8所述的方法,其特征在于,在将人脸检测操作检测出的人脸检测结果,放入人脸检测结果队列中后,所述方法还包括:
在所述人脸检测结果队列中存在至少一个人脸检测结果的情况下,从所述人脸检测结果队列中无放回地提取至少一个人脸检测结果;
对提取的至少一个人脸检测结果进行后处理操作,得到人脸图像;
对所述人脸图像进行人脸图像调整操作;
将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中;
所述人脸图像调整操作包括下述至少一项:
对所述人脸图像进行归一化操作;
对图像尺寸进行调整操作;
将人脸图像中像素值的数据格式转变为人脸识别操作所需的格式。
10.根据权利要求9所述的方法,其特征在于,在将所述人脸图像调整操作的调整结果存入人脸图像调整结果队列中后,所述方法还包括:
在所述人脸图像调整结果队列中存在至少一个调整结果的情况下,从所述人脸图像调整结果队列中无放回地提取至少一个调整结果;
对提取的至少一个调整结果进行特征提取操作;
将所述特征提取操作得到的人脸特征提取结果存入人脸特征提取结果队列中。
11.根据权利要求10所述的方法,其特征在于,所述对已检测出的人脸执行人脸识别操作,包括:
在所述人脸特征提取结果队列中存在至少一个人脸特征提取结果的情况下,从所述人脸特征提取结果队列中无放回地提取至少一个人脸特征提取结果;
对提取的至少一个人脸特征提取结果与目标人脸特征进行相似度计算;
根据所述相似度计算的结果,得到人脸识别结果。
12.一种人脸识别装置,其特征在于,包括:
解码单元,用于对待识别视频中的目标视频帧逐帧进行解码操作;
检测单元,用于在所述解码操作解码出至少一帧目标视频帧的情况下,对已解码出的目标视频帧执行人脸检测操作;
识别单元,用于在所述人脸检测操作检测出至少一个人脸的情况下,对已检测出的人脸执行人脸识别操作,得到人脸识别结果;
其中,所述解码操作、所述人脸检测操作和所述人脸识别操作并行执行。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至11中任意一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至11中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310146568.3A CN116030524B (zh) | 2023-02-09 | 2023-02-09 | 一种人脸识别方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310146568.3A CN116030524B (zh) | 2023-02-09 | 2023-02-09 | 一种人脸识别方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116030524A true CN116030524A (zh) | 2023-04-28 |
CN116030524B CN116030524B (zh) | 2023-06-23 |
Family
ID=86076080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310146568.3A Active CN116030524B (zh) | 2023-02-09 | 2023-02-09 | 一种人脸识别方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116030524B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018133666A1 (zh) * | 2017-01-17 | 2018-07-26 | 腾讯科技(深圳)有限公司 | 视频目标跟踪方法和装置 |
CN108710856A (zh) * | 2018-05-22 | 2018-10-26 | 河南亚视软件技术有限公司 | 一种基于视频流的人脸识别方法 |
CN109086670A (zh) * | 2018-07-03 | 2018-12-25 | 百度在线网络技术(北京)有限公司 | 人脸识别方法、装置及设备 |
CN110443114A (zh) * | 2019-06-19 | 2019-11-12 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及可读存储介质 |
CN111191532A (zh) * | 2019-12-18 | 2020-05-22 | 深圳供电局有限公司 | 基于施工区域的人脸识别方法、装置、计算机设备 |
CN111675059A (zh) * | 2020-06-11 | 2020-09-18 | 深圳威富智慧家居科技有限公司 | 基于人脸识别的电梯控制方法、装置和计算机设备 |
CN111914601A (zh) * | 2019-05-10 | 2020-11-10 | 南京视能智能科技有限公司 | 一种基于深度学习的高效批量人脸识别和抠图系统 |
-
2023
- 2023-02-09 CN CN202310146568.3A patent/CN116030524B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018133666A1 (zh) * | 2017-01-17 | 2018-07-26 | 腾讯科技(深圳)有限公司 | 视频目标跟踪方法和装置 |
CN108710856A (zh) * | 2018-05-22 | 2018-10-26 | 河南亚视软件技术有限公司 | 一种基于视频流的人脸识别方法 |
CN109086670A (zh) * | 2018-07-03 | 2018-12-25 | 百度在线网络技术(北京)有限公司 | 人脸识别方法、装置及设备 |
CN111914601A (zh) * | 2019-05-10 | 2020-11-10 | 南京视能智能科技有限公司 | 一种基于深度学习的高效批量人脸识别和抠图系统 |
CN110443114A (zh) * | 2019-06-19 | 2019-11-12 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及可读存储介质 |
CN111191532A (zh) * | 2019-12-18 | 2020-05-22 | 深圳供电局有限公司 | 基于施工区域的人脸识别方法、装置、计算机设备 |
CN111675059A (zh) * | 2020-06-11 | 2020-09-18 | 深圳威富智慧家居科技有限公司 | 基于人脸识别的电梯控制方法、装置和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116030524B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12014275B2 (en) | Method for text recognition, electronic device and storage medium | |
CN110889469B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112001321B (zh) | 网络训练、行人重识别方法及装置、电子设备和存储介质 | |
JP7110412B2 (ja) | 生体検出方法及び装置、電子機器並びに記憶媒体 | |
CN110781957B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110472091B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109934275B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109615006B (zh) | 文字识别方法及装置、电子设备和存储介质 | |
CN110458218B (zh) | 图像分类方法及装置、分类网络训练方法及装置 | |
CN110532956B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111259967B (zh) | 图像分类及神经网络训练方法、装置、设备及存储介质 | |
CN111435432B (zh) | 网络优化方法及装置、图像处理方法及装置、存储介质 | |
US20210326649A1 (en) | Configuration method and apparatus for detector, storage medium | |
CN110781813A (zh) | 图像识别方法及装置、电子设备和存储介质 | |
CN109344703B (zh) | 对象检测方法及装置、电子设备和存储介质 | |
CN109101542B (zh) | 图像识别结果输出方法及装置、电子设备和存储介质 | |
CN114332503A (zh) | 对象重识别方法及装置、电子设备和存储介质 | |
CN112085097A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110633715B (zh) | 图像处理方法、网络训练方法及装置、和电子设备 | |
CN111192218B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113538310A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN110929545A (zh) | 人脸图像的整理方法及装置 | |
CN110781975B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN111783752A (zh) | 人脸识别方法及装置、电子设备和存储介质 | |
CN111507131B (zh) | 活体检测方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |