CN109598211A - 一种实时动态人脸识别方法及系统 - Google Patents

一种实时动态人脸识别方法及系统 Download PDF

Info

Publication number
CN109598211A
CN109598211A CN201811365990.3A CN201811365990A CN109598211A CN 109598211 A CN109598211 A CN 109598211A CN 201811365990 A CN201811365990 A CN 201811365990A CN 109598211 A CN109598211 A CN 109598211A
Authority
CN
China
Prior art keywords
face
layer
size
length
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811365990.3A
Other languages
English (en)
Inventor
左乾坤
李玉惠
金红
杨满智
刘长永
陈晓光
蔡琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NATIONAL COMPUTER VIRUS EMERGENCY RESPONSE CENTER
Heng Jia Jia (beijing) Technology Co Ltd
Eversec Beijing Technology Co Ltd
Original Assignee
NATIONAL COMPUTER VIRUS EMERGENCY RESPONSE CENTER
Heng Jia Jia (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NATIONAL COMPUTER VIRUS EMERGENCY RESPONSE CENTER, Heng Jia Jia (beijing) Technology Co Ltd filed Critical NATIONAL COMPUTER VIRUS EMERGENCY RESPONSE CENTER
Priority to CN201811365990.3A priority Critical patent/CN109598211A/zh
Publication of CN109598211A publication Critical patent/CN109598211A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种实时动态人脸识别方法及系统,该方法包括:对视频流中的图像进行人脸实时检测,如果存在人脸则对人脸进行对齐和识别,如果不存在则重新开始检测;完成人脸识别后,若存在已知人脸,则对视频流中的人脸进行追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测;在人脸追踪过程中,每间隔M帧,对视频流进行二次检测,对于位移大于设定阈值的或者新出现的人脸进行重识别,对于位移小于设定阈值的人脸继续进行追踪,对于减少的人脸停止追踪和识别;在人脸重识别时,若模板库存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。本发明的方法在保证人脸识别准确性的同时,也提升了识别效率。

Description

一种实时动态人脸识别方法及系统
技术领域
本发明涉及图形图形处理与机器深度学习的技术领域,特别涉及一种实时动态人脸识别方法。
背景技术
人脸识别技术是基于人的脸部特征,对输入的人脸视频流进行检测和分类。首先在视频中找到人脸,然后根据人脸所在的位置信息进一步提取出人脸的特征信息,最后将其与已知的人脸库特征信息进行对比,识别出这个人脸的身份信息。
人脸识别技术研究始于20世纪60年代,主要提出的理论是基于人脸几何结构特征的方法,并且没有得到实际应用,随着计算机技术和光学成像技术的进步得到快速发展,延伸出了很多较为有效的深度学习模型,并逐渐进入商业性的应用市场。在互联网高速发展的今天,信息安全收到越来越多的关注,尤其在视频监控、智能交通、智慧医疗、移动支付等应用领域,许多学者和工程师在这些领域中做出了很多有效的研究成果,在各个领域中解决了很多的实际人脸识别问题和难题。但是,现有的人脸识别存在如下技术问题:
1、人脸检测问题,检测准确率高的深度学习算法需要大量的计算时间,这在低配置CPU上不能达到实时性。
2、识别耗时问题,对视频流的每一帧都做检测和识别,不仅计算量大,而且容易出现丢帧或者卡顿的现象,特别是视频中人脸移动速度太快,影响实际监测人脸的效果。
3、识别错误问题,对于人脸特征很相似的人,容易把人脸识别错误,严重影响相关产品的应用效果。
4、识别遗漏问题,通常情况下,人脸识别都是针对正脸或者有很小角度的侧脸,当人脸偏离角度很大时,就不能被识别出,而这个人是已知人脸库的,导致漏掉这样的人脸。
另外,他们都对人脸实时识别的单个模块进行研究,而没能给出一套完整的方案。
综上可知,目前人脸识别技术偏重于提升准确度而忽略了实时性,同时也没有提出一套完整的实时动态人脸识别系统或方法。
发明内容
本发明的目的是,提供一种实时动态人脸识别方法及系统,在保证准确性的同时,也提升了执行效率,可以达到产品落地的目的。
本发明的第一方面,提供了一种实时动态人脸识别方法,所述方法包括:
对视频流中的图像进行人脸实时检测,如果存在人脸则对人脸进行对齐和识别,如果不存在则重新开始检测;
完成人脸识别后,若存在已知人脸,则对视频流中的人脸进行追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测;
在人脸追踪过程中,每间隔M帧,对视频流进行二次检测,对于位移大于设定阈值的或者新出现的人脸进行重识别,对于位移小于设定阈值的人脸继续进行追踪,对于减少的人脸停止追踪和识别;;
在人脸重识别时,若存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。
进一步地,对人脸的检测采用端对端的卷积神经网络架构模型,将每一帧的图片做预处理后输入到该网络中,输入图片像素为
288*288,经过四次降采样和五次降采样,每次降采样步长为2,分别从深层网络和浅层网络两个尺度进行特征提取和检测,输出两个特征图,分别对应于9*9网格及18*18个网格,每个网格含三个边界框,并计算每个边界框的位置信息、该框位于人脸区域的概率以及该人脸存在的概率,最后通过人脸概率来对这些边框进行归类,得到最终的人脸框的数目和它们的位置信息。
进一步地,对人脸的识别过程包括:将经深层网络和浅层网络检测出的人脸,先通过使用多个人脸面部特征点进行对齐处理,再通过残差网络模型提取人脸的特征向量,然后计算该特征向量与模板库中的特征向量的相似度,若相似度大于设定的第一阈值thresh,则判定为未知人员,若相似度小于设定的第一阈值thresh,则对这样的N个相似度进行最近邻域选择出现频率最高的标签作为最终的识别人员的属性。
进一步地,所述相似度计算的步骤具体包括:
定义相似度计算公式:
其中,Sj表示第j个相似度,j的取值范围是模板库中所有特征向量的数量,假设模板库中所有特征向量的数量是T,;Mj表示模板库中第j个特征向量,由128个数表示的一个向量;表示Mj的平均值;Mji表示模板库中的第j个特征向量的第i个数值,i的取值范围是1~128;F表示预测的特征向量,也是由128个数表示的一个向量;表示F的平均值;Fi表示预测的特征向量的第i个数值,i的取值范围也是1~128,Sj的取值范围是0~1,取值越小,表示相似性越好;
利用KNN算法,选出相似度小于第一阈值thresh的人名标签,总计K个;
确定这K个值所在人名标签出现的频率,输出频率最高的人名标签。
进一步地,所述人脸追踪具体包括:
第一次CNN检测识别,进行人脸位置和属性跟踪;
判断是否为连续的第M帧追踪,如果是,则进行CNN第二次人脸识别;
计算当前帧的人脸框与上一帧的人脸框的中心像素距离,
dist=sqrt(dx^2+dy^2),dx=(x2-x1)/2-(x4-x3)/2,dy=(y2-y1)/2-(y4-y3)/2,其中,x1,x2,y1,y2为当前帧的人脸框的像素坐标点,x3,x4,y3,y4为上一帧人脸框的像素坐标点;
若dist大于设定的第二阈值d,则对这个人的人脸进行识别和对齐,若dist小于或等于设定的第二阈值d,则对这个人的人脸进行属性跟踪。
本发明的第二方面,提供了一种实时动态人脸识别系统,所述系统包括:人脸检测模块、人脸识别模块及人脸追踪模块,其中,
所述人脸检测模块,连接所述人脸识别模块,所述人脸检测模块实时检测视频流中是否存在人脸图像,如存在,则对齐该人脸并将图像发给人脸识别模块,若不存在,则截取人脸图像保存;
所述人脸识别模块,分别连接所述人脸检测模块及人脸追踪模块,所述人脸识别模块调取模板库中的图像特征与获取的人脸图像进行比较并计算相似度,若相似度大于设定的第一阈值thresh,则判定为未知人员,反之判定为已知人员;
所述人脸追踪模块,连接所述人脸识别模块,在识别出人脸图像后,实时追踪该人脸的位置及属性。
进一步地,所述系统还包括重识别模块,连接所述人脸追踪模块,所述重识别模每间隔M帧对视频流进行二次检测,对于位移大于设定阈值的或者新出现的人脸进行重识别,对于位移小于设定二阈值的人脸继续进行追踪,对于减少的人脸停止追踪和识别;在重识别时,若模板库存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。
与现有技术相比,本发明所公开的一种实时动态人脸识别方法达到了如下技术效果:
1、使用CNN检测模型实现了CPU的快速人脸检测;
2、使用人脸识别模块解决了人脸识别准确性的问题;
3、使用人脸追踪模块进行实时追踪人脸位置和属性;
4、使用每隔M帧进行二次检测识别,解决了识别错误和遗漏的问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的实时动态人脸识别方法的流程图。
图2是本发明实施例中的人脸检测的网络结构图。
图3是本发明实施例中的人脸识别的流程图。
图4是本发明实施例中的人脸追踪的流程图。
具体实施方式
下面将结合附图,对本发明实施例中的技术方案进行清楚、完整地描述,但不作为对本发明的限定。
本发明实施例所公开的一种实时动态人脸识别方法,包括如下过程:
第一步、对视频流中的图像进行人脸实时检测,提取用户面部的图像数据,如果检测存在人脸,则对人脸进行识别和对齐,如果不存在则重新开始检测,直至检测到出现人脸图像;
第二步,完成人脸识别后,若模板库存在已知人脸,则对视频流中的人脸进行追踪,追踪是为了替换人脸检测和人脸识别,加快实时速度,若不存在已知人脸,则截取人脸图像进行保存保存到未知人脸数据库,并重新对视频流下一帧全部出现的人脸开始检测;
其中,在人脸追踪过程中,每间隔M帧,对视频流进行二次检测,对于位移大于设定阈值的或者新出现的人脸进行重识别,对于位移小于设定阈值的人脸继续进行追踪,对于减少的人脸停止追踪和识别;
最后,在人脸重识别时,若模板库存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。
参照图1所示,一个完整的步骤如下:
1)参数初始化,追踪帧设为0,然后进入2);
2)摄像头读取图像数据,帧数加1,进入3)。
3)读取成功,进入4);否则退出程序。
4)判断是否初始化,若参数已经初始化,则进入5);否则跳至9)。
5)人脸检测,若存在人脸,进入6);否则跳至1)。
6)人脸对齐,提取人脸特征向量,计算与模板特征库的相似度,进入7)。
7)若相似度小于设定的第一阈值,比如为设定thresh值为0.03,判定为已知人员;否则判定为未知人员,进入8)。
8)若不存在已知人员,则保存未知人员的人脸数据,跳至1);若存在已知人员,标注人脸属性,比如姓名、年龄、性别、出生日期等,跳至2)。
9)若前一帧的参数已经初始化,也即重置累计帧数为0,则跳至5);否则进入10)。
10)人脸二次检测,若未检测到人脸,跳至1);若检测到人脸,进入11)。
11)判断追踪帧数的统计,若追踪到第M帧,可设定M=5,则跳至12);否则跳至13)。
12)判断与前一帧的人脸中心像素距离,对于距离小于设定的第二阈值d的人脸,比如设定第二阈值d为30,则追踪前一帧人脸(包含该人脸的属性);否则作二次人脸识别人脸属性,并跳至8)。
13)追踪前一帧人脸(名字及其属性),并跳至2)。
下面来对本发明中的人脸的检测、识别和追踪做详细说明。
人脸的检测,检测使用现有的端对端卷积神经网络(CNN)框架模型,如图2所示,将每一帧的图片输入到该网络框架模型中,输入图片像素为288*288,经过四次降采样和五次降采样,一次降采样尺寸减半,每次降采样步长为2,分别从深层网络和浅层网络两个尺度进行人脸特征提取和检测,这样可以让网络同时学习深层和浅层特征,人脸检测效果更好。输出两个特征图,分别对应于9*9网格及18*18个网格。
深层网络的结构为:
第1层:输入尺寸288×288×3(分别代表长宽高,下同),卷积核大小:3x3,卷积核数量:8,步长:2;
第2层:特征尺寸144×144×8,卷积核大小:3x3,卷积核数量:16,步长:2;
第3层:特征尺寸72×72×16,卷积核大小:3x3,卷积核数量:32,步长:1;
第4层:特征尺寸72×72×32,最大池化核大小:2x2,步长:2;
第5层:特征尺寸36×36×32,卷积核大小:3x3,卷积核数量:64,步长:2;
第6层:特征尺寸18×18×64,卷积核大小:3x3,卷积核数量:128,步长:1;
第7层:特征尺寸18×18×128,最大池化核大小:2x2,步长:2;
第8层:特征尺寸9×9×128,卷积核大小:1x1,卷积核数量:64,步长:1;
第9层:特征尺寸9×9×64,卷积核大小:3x3,卷积核数量:64,步长:1;
第10层:特征尺寸9×9×64,卷积核大小:3x3,卷积核数量:18,步长:1;
输出尺寸:9×9×18;
浅层网络的结构为:
第1层:输入尺寸288×288×3,卷积核大小:3x3,卷积核数量:8,步长:2;
第2层:特征尺寸144×144×8,卷积核大小:3x3,卷积核数量:16,步长:2;
第3层:特征尺寸72×72×16,卷积核大小:3x3,卷积核数量:32,步长:1;
第4层:特征尺寸72×72×32,最大池化核大小:2x2,步长:2;
第5层:特征尺寸36×36×32,卷积核大小:3x3,卷积核数量:64,步长:2;
第6层:特征尺寸18×18×64,卷积核大小:3x3,卷积核数量:128,步长:1;
第7层:特征尺寸18×18×128,最大池化核大小:2x2,步长:2;
第8层:特征尺寸9×9×128,卷积核大小:1x1,卷积核数量:64,步长:1;
第9层:特征尺寸9×9×64,卷积核大小:1x1,卷积核数量:32,步长:1;
第10层:特征尺寸9×9×32,上采样x2;
第11层:特征尺寸18×18×32,与第6层连接起来;
第12层:特征尺寸18×18×160,卷积核大小:3x3,卷积核数量:64,步长:1;
第13层:特征尺寸18×18×64,卷积核大小:1x1,卷积核数量:18,步长:1;
输出特征尺寸:18×18×18。
需要说明的是,图2中的层数是按照矩形框数量-1来定义的。
该网络的输出为两个特征图,分别对应于9×9个网格和18×18个网格,每一个网格都会预测3个边界框,每个边界框都会预测三种数据:每个框的位置(框的4个边界点的坐标值,中心坐标,框的高度和宽度),该框位于人脸区域的概率以及该人脸存在的概率。在实时检测时,对每一帧图片输入网络,得到(9×9+18×18)×3=1215个框,然后通过人脸概率来对这些框进行归类,得到最终的人脸框的数目和位置。
本发明采用基于CPU实时检测的新网络结构,相比比已有的网络,本网络的设计特点体现在网络的层数少(仅为10层浅层网络和13层深层网络)、卷积核的数量少、占用内存大小为1.7M,不仅可以大幅度减少计算量,而且减少存储空间,在保证准确率的同时提高检测效率。
经过前述CNN网络检测出的人脸,先通过使用68个人脸面部特征点进行对齐处理将歪的人脸头像通过仿射变换校正为正的人脸头像,对齐之后进入匹配过程,再使用了残差网络模型提取人脸特征向量(128维),然后计算该特征向量与模板库特征向量的相似度,若相似度大于设定的第一阈值(thresh),则判断为未知人员;若相似度小于设定的第一阈值,则对这样的N个相似度进行最近邻域选择出现频率最高的标签作为最终的识别人员属性。其详细的判定步骤如下:
1)给定相似度计算公式为:
其中,Sj表示第j个相似度,j的取值范围是模板库中所有特征向量的数量,假设模板库中所有特征向量的数量是T,;Mj表示模板库中第j个特征向量,由128个数表示的一个向量;表示Mj的平均值;Mji表示模板库中的第j个特征向量的第i个数值,i的取值范围是1~128;F表示预测的特征向量,也是由128个数表示的一个向量;表示F的平均值;Fi表示预测的特征向量的第i个数值,i的取值范围也是1~128,Sj的取值范围是0~1,取值越小,表示相似性越好;
2)通过上述公式计算出T个相似度,从小到大排序;
3)利用KNN算法,选出相似度小于第一阈值的人名标签,假设总计有K个,K个值中有重复的,也有不相同的。
4)确定这K个值所在人名标签出现的频率,并输出出现频率最高的人名标签。
人脸追踪过程中,具体包括:
第一次CNN检测识别过后,进行人脸位置和属性跟踪;
判断是否为连续的第M帧追踪,比如设定M=5,如果是,则进行CNN第二次人脸识别;
计算当前帧的人脸框与上一帧的人脸框的中心像素距离,dist=sqrt(dx^2+dy^2),dx=(x2-x1)/2-(x4-x3)/2,dy=(y2-y1)/2-(y4-y3)/2,其中,x1,x2,y1,y2为当前帧的人脸框的四个框顶点的坐标点,x3,x4,y3,y4为上一帧人脸框的四个框顶点的坐标点;
若dist大于设定的第二阈值d,本实施例中,设定第二阈值d为30,则对这个人的人脸进行识别和对齐,若dist小于或等于设定的第二阈值d为30,则对这个人的人脸进行属性跟踪。
基于本发明的另一方面,还提供了一种实时动态人脸识别系统,所述系统包括:人脸检测模块、人脸识别模块及人脸追踪模块。
所述人脸检测模块,连接所述人脸识别模块,所述人脸检测模块实时检测视频流中是否存在人脸图像,如存在,则对齐该人脸并将图像发给人脸识别模块,若不存在,则截取人脸图像保存;人脸检测模块,使用现有的端对端框架模型,提出一种基于CPU实时检测的新网络结构,相比比已有的网络,本网络的设计特点体现在网络的层数少、卷积核的数量少、输入图片的尺寸小,不仅可以大幅度减少计算量,而且减少存储空间,在保证准确率的同时提高效率。如图2所示,输入图片像素大小为288x288,经过4次降采样和5次降采样,每次降采样的步长为2,分别提取出两个尺度的信息来对人脸进行检测,这样可以让网络同时学习深层和浅层特征,人脸检测效果更好。该网络结构可以分为两个部分:深层网络和浅层网络。
所述人脸识别模块,分别连接所述人脸检测模块及人脸追踪模块,所述人脸识别模块对检测出的人脸,调取模板库中的图像特征进行比较,计算其相似度,若相似度大于设定的第一阈值thresh,则判定为未知人员,反之,判定为已知人员;经过CNN检测出来的人脸,先通过使用68个人脸面部特征点进行对齐处理,再使用了残差网络模型提取人脸特征向量(128维),然后计算该特征向量与模板库特征向量的相似度,若相似度大于第一阈值thresh,则判断为未知人员;若相似度小于第一阈值thresh,则对这样的N个相似度进行最近邻域选择出现频率最高的标签作为最终的识别人员属性。
所述人脸追踪模块,连接所述人脸识别模块,根据接收的人脸图像,实时追踪人脸位置和属性。人脸追踪模块,把获取的图像离散化,利用当前帧检测到的人脸去匹配前一帧或者前前一帧的人脸属性(包括但不限制于姓名、年龄、性别等),追踪可以有效减少人脸检测和识别的耗时,还可以对增加或减少的人脸进行二次识别,不仅提高实时监测的效率,还能提高准确性。
所述系统还包括重识别模块,连接所述人脸识别模块,所述重识别模块每间隔M帧对视频流进行二次检测,对于位移大于第二阈值d的或者新出现的人脸进行重识别,对于位移小于第二阈值d的人脸继续进行追踪,对于减少的人脸停止追踪和识别;在重识别时,若模板库存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。
本发明实施例的系统用以执行上一实施例中的方法,未详尽之处,请参阅上一实施例中的方法所述。
本发明设计并实现出端对端人脸检测CNN模型,让网络同时学习深层和浅层特征,实现了CPU的快速人脸检测;将相似度与KNN算法结合来识别人脸,提高了人脸识别的准确性;将相邻帧的同一人脸框中心点像素距离应用到人脸属性追踪,可实时追踪人脸位置和属性;使用每隔N帧进行二次检测和识别,解决了识别错误和遗漏的问题;将人脸检测、识别、追踪模块结合起来实现了实时动态人脸识别。
虽然以上结合优选实施例对本发明进行了描述,但本领域的技术人员应该理解,本发明所述的方法和系统并不限于具体实施方式中所述的实施例,在不背离由所附权利要求书限定的本发明精神和范围的情况下,可对本发明作出各种修改、增加、以及替换。

Claims (10)

1.一种实时动态人脸识别方法,其特征在于,所述方法包括:
对视频流中的图像进行人脸实时检测,如果存在人脸则对人脸进行对齐和识别,如果不存在则重新开始检测;
完成人脸识别后,若存在已知人脸,则对视频流中的人脸进行追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测;
在人脸追踪过程中,每间隔M帧,对视频流进行二次检测,对于位移大于设定阈值的或者新出现的人脸进行重识别,对于位移小于设定阈值的人脸继续进行追踪,对于减少的人脸停止追踪和识别;
在人脸重识别时,若存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。
2.根据权利要求1所述的方法,其特征在于,对人脸的检测采用端对端的卷积神经网络架构模型,将每一帧的图片做预处理后输入到该网络中,输入图片像素为288*288,经过四次降采样和五次降采样,每次降采样步长为2,分别从深层网络和浅层网络两个尺度进行特征提取和检测,输出两个特征图,分别对应于9*9网格及18*18个网格,每个网格含三个边界框,并计算每个边界框的位置信息、该框位于人脸区域的概率以及该人脸类别的概率,最后通过人脸概率来对这些边框进行归类,得到最终的人脸框的数目和它们的位置信息。
3.根据权利要求2所述的方法,其特征在于,对人脸的识别过程包括:将经深层网络和浅层网络检测出的人脸,先通过使用多个人脸面部特征点进行对齐处理,再通过残差网络模型提取人脸的特征向量,然后计算该特征向量与模板库中的特征向量的相似度,若相似度大于设定的第一阈值,则判定为未知人员,若相似度小于设定的第一阈值,则对这样的N个相似度进行最近邻域选择出现频率最高的标签作为最终的识别人员的属性。
4.根据权利要求3所述的方法,其特征在于,所述相似度计算的步骤具体包括:
定义相似度计算公式:
其中,Sj表示第j个相似度,j的取值范围是模板库中所有特征向量的个数T,j的取值范围是1~T;Mj表示模板库中第j个特征向量,由128个数表示的一个向量;表示Mj的平均值;Mji表示模板库中的第j个特征向量的第i个数值,i的取值范围是1~128;F表示预测的特征向量,也是由128个数表示的一个向量;表示F的平均值;Fi表示预测的特征向量的第i个数值,i的取值范围也是1~128,Sj的取值范围是0~1,取值越小,表示相似性越好;
根据上述公式,针对模板库中每一个模板库的特征向量M,计算与待识别的特征向量F的相似度,总共形成T个相似度,并从小到大排列;
利用KNN算法,选出相似度小于第一阈值的人名标签,总计K个;
确定这K个值所在人名标签出现的频率,输出频率最高的人名标签。
5.根据权利要求3或4任一权利要求所述的方法,其特征在于,所述人脸追踪具体包括:
第一次CNN检测识别,进行人脸位置和属性跟踪;
判断是否为连续的第M帧追踪,如果是,则进行CNN第二次人脸识别;
计算当前帧的人脸框与上一帧的人脸框的中心像素距离,dist=sqrt(dx^2+dy^2),dx=(x2-x1)/2-(x4-x3)/2,dy=(y2-y1)/2-(y4-y3)/2,其中,x1,x2,y1,y2为当前帧的人脸框的像素坐标点,x3,x4,y3,y4为上一帧人脸框的像素坐标点;
若dist大于设定的第二阈值,则对这个人的人脸进行对齐和识别,若dist小于或等于设定的第二阈值,则对这个人的人脸进行属性跟踪。
6.根据权利要求2所述的方法,其特征在于,所述深层网络的结构为:
第1层:输入尺寸288×288×3,卷积核大小:3x3,卷积核数量:8,步长:2;
第2层:特征尺寸144×144×8,卷积核大小:3x3,卷积核数量:16,步长:2;
第3层:特征尺寸72×72×16,卷积核大小:3x3,卷积核数量:32,步长:1;
第4层:特征尺寸72×72×32,最大池化核大小:2x2,步长:2;
第5层:特征尺寸36×36×32,卷积核大小:3x3,卷积核数量:64,步长:2;
第6层:特征尺寸18×18×64,卷积核大小:3x3,卷积核数量:128,步长:1;
第7层:特征尺寸18×18×128,最大池化核大小:2x2,步长:2;
第8层:特征尺寸9×9×128,卷积核大小:1x1,卷积核数量:64,步长:1;
第9层:特征尺寸9×9×64,卷积核大小:3x3,卷积核数量:64,步长:1;
第10层:特征尺寸9×9×64,卷积核大小:3x3,卷积核数量:18,步长:1;
输出尺寸:9×9×18;
所述浅层网络的结构为:
第1层:输入尺寸288×288×3,卷积核大小:3x3,卷积核数量:8,步长:2;
第2层:特征尺寸144×144×8,卷积核大小:3x3,卷积核数量:16,步长:2;
第3层:特征尺寸72×72×16,卷积核大小:3x3,卷积核数量:32,步长:1;
第4层:特征尺寸72×72×32,最大池化核大小:2x2,步长:2;
第5层:特征尺寸36×36×32,卷积核大小:3x3,卷积核数量:64,步长:2;
第6层:特征尺寸18×18×64,卷积核大小:3x3,卷积核数量:128,步长:1;
第7层:特征尺寸18×18×128,最大池化核大小:2x2,步长:2;
第8层:特征尺寸9×9×128,卷积核大小:1x1,卷积核数量:64,步长:1;
第9层:特征尺寸9×9×64,卷积核大小:1x1,卷积核数量:32,步长:1;
第10层:特征尺寸9×9×32,上采样x2;
第11层:特征尺寸18×18×32,与第6层连接起来;
第12层:特征尺寸18×18×160,卷积核大小:3x3,卷积核数量:64,步长:1;
第13层:特征尺寸18×18×64,卷积核大小:1x1,卷积核数量:18,步长:1;
输出特征尺寸:18×18×18。
7.根据权利要求5所述的方法,其特征在于,设定的所述第一阈值为0.03,第二阈值为30,设定的每次间隔的帧数M为5。
8.一种实时动态人脸识别系统,其特征在于,所述系统包括:人脸检测模块、人脸识别模块及人脸追踪模块,其中,
所述人脸检测模块,连接所述人脸识别模块,所述人脸检测模块实时检测视频流中是否存在人脸图像,如存在,则对齐该人脸并将图像发给人脸识别模块,若不存在,则截取人脸图像保存;
所述人脸识别模块,分别连接所述人脸检测模块及人脸追踪模块,所述人脸识别模块调取模板库中的图像特征与获取的人脸图像进行比较并计算相似度,若相似度大于设定的第一阈值,则判定为未知人员,反之判定为已知人员;
所述人脸追踪模块,连接所述人脸识别模块,在识别出人脸图像后,实时追踪该人脸的位置及属性。
9.根据权利要求8所述的方法,其特征在于,所述系统还包括重识别模块,连接所述人脸追踪模块,所述重识别模块每间隔M帧对视频流进行二次检测,对于位移大于设定阈值的或者新出现的人脸进行重识别,对于位移小于设定阈值的人脸继续进行追踪,对于减少的人脸停止追踪和识别;在重识别时,若模板库存在已知人脸,则继续追踪,若不存在已知人脸,则截取人脸图像进行保存并重新开始检测。
10.根据权利要求8所述的方法,其特征在于,所述相似度计算的步骤具体包括:设定公式为:其中,Sj表示第j个相似度,j的取值范围是模板库中所有特征向量的数量,假设模板库中所有特征向量的数量是T,;Mj表示模板库中第j个特征向量,由128个数表示的一个向量;表示Mj的平均值;Mji表示模板库中的第j个特征向量的第i个数值,i的取值范围是1~128;F表示预测的特征向量,也是由128个数表示的一个向量;表示F的平均值;Fi表示预测的特征向量的第i个数值,i的取值范围也是1~128,Sj的取值范围是0~1,取值越小,表示相似性越好;
利用KNN算法,选出相似度小于第一阈值的人名标签,总计K个;
确定这K个值所在人名标签出现的频率,输出频率最高的人名标签。
CN201811365990.3A 2018-11-16 2018-11-16 一种实时动态人脸识别方法及系统 Pending CN109598211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811365990.3A CN109598211A (zh) 2018-11-16 2018-11-16 一种实时动态人脸识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811365990.3A CN109598211A (zh) 2018-11-16 2018-11-16 一种实时动态人脸识别方法及系统

Publications (1)

Publication Number Publication Date
CN109598211A true CN109598211A (zh) 2019-04-09

Family

ID=65957752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811365990.3A Pending CN109598211A (zh) 2018-11-16 2018-11-16 一种实时动态人脸识别方法及系统

Country Status (1)

Country Link
CN (1) CN109598211A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348362A (zh) * 2019-07-05 2019-10-18 北京达佳互联信息技术有限公司 标签生成、视频处理方法、装置、电子设备及存储介质
CN110969110A (zh) * 2019-11-28 2020-04-07 杭州趣维科技有限公司 一种基于深度学习的人脸跟踪方法及系统
CN111178261A (zh) * 2019-12-30 2020-05-19 武汉恩智电子科技有限公司 一种基于视频编码技术的人脸检测加速方法
CN111178129A (zh) * 2019-11-25 2020-05-19 浙江工商大学 一种基于人脸和姿态的多模态人员识别方法
CN111738120A (zh) * 2020-06-12 2020-10-02 北京奇艺世纪科技有限公司 人物识别方法、装置、电子设备及存储介质
CN111770299A (zh) * 2020-04-20 2020-10-13 厦门亿联网络技术股份有限公司 一种智能视频会议终端的实时人脸摘要服务的方法及系统
CN111931592A (zh) * 2020-07-16 2020-11-13 苏州科达科技股份有限公司 对象识别方法、装置及存储介质
CN112562159A (zh) * 2020-11-24 2021-03-26 恒安嘉新(北京)科技股份公司 一种门禁控制方法、装置、计算机设备和存储介质
CN112825116A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 监控视频图像人脸检测和追踪方法、装置、介质及设备
CN113242428A (zh) * 2021-04-15 2021-08-10 中南大学 视频会议场景下基于roi区域的后处理加速方法
CN113792633A (zh) * 2021-09-06 2021-12-14 北京工商大学 一种基于神经网络和光流法的人脸追踪系统和追踪方法
TWI764425B (zh) * 2020-12-10 2022-05-11 鴻海精密工業股份有限公司 基於人臉識別的即時行人統計方法以及裝置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101231703A (zh) * 2008-02-28 2008-07-30 上海交通大学 基于相关向量机和提升学习的多人脸跟踪方法
US20100202703A1 (en) * 2009-02-09 2010-08-12 Sungkyungwan University Foundation For Corporate Collaboration Real-time face detection apparatus
CN106778867A (zh) * 2016-12-15 2017-05-31 北京旷视科技有限公司 目标检测方法和装置、神经网络训练方法和装置
CN106845385A (zh) * 2017-01-17 2017-06-13 腾讯科技(上海)有限公司 视频目标跟踪的方法和装置
CN106980872A (zh) * 2017-02-17 2017-07-25 北京维弦科技有限责任公司 基于投票委员会的k最近邻分类方法
CN107527029A (zh) * 2017-08-18 2017-12-29 卫晨 一种改进的Faster R‑CNN人脸检测方法
CN107609497A (zh) * 2017-08-31 2018-01-19 武汉世纪金桥安全技术有限公司 基于视觉跟踪技术的实时视频人脸识别方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101231703A (zh) * 2008-02-28 2008-07-30 上海交通大学 基于相关向量机和提升学习的多人脸跟踪方法
US20100202703A1 (en) * 2009-02-09 2010-08-12 Sungkyungwan University Foundation For Corporate Collaboration Real-time face detection apparatus
CN106778867A (zh) * 2016-12-15 2017-05-31 北京旷视科技有限公司 目标检测方法和装置、神经网络训练方法和装置
CN106845385A (zh) * 2017-01-17 2017-06-13 腾讯科技(上海)有限公司 视频目标跟踪的方法和装置
CN106980872A (zh) * 2017-02-17 2017-07-25 北京维弦科技有限责任公司 基于投票委员会的k最近邻分类方法
CN107527029A (zh) * 2017-08-18 2017-12-29 卫晨 一种改进的Faster R‑CNN人脸检测方法
CN107609497A (zh) * 2017-08-31 2018-01-19 武汉世纪金桥安全技术有限公司 基于视觉跟踪技术的实时视频人脸识别方法及系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110348362A (zh) * 2019-07-05 2019-10-18 北京达佳互联信息技术有限公司 标签生成、视频处理方法、装置、电子设备及存储介质
CN112825116A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 监控视频图像人脸检测和追踪方法、装置、介质及设备
CN112825116B (zh) * 2019-11-20 2024-04-09 北京眼神智能科技有限公司 监控视频图像人脸检测和追踪方法、装置、介质及设备
CN111178129A (zh) * 2019-11-25 2020-05-19 浙江工商大学 一种基于人脸和姿态的多模态人员识别方法
CN110969110A (zh) * 2019-11-28 2020-04-07 杭州趣维科技有限公司 一种基于深度学习的人脸跟踪方法及系统
CN110969110B (zh) * 2019-11-28 2023-05-02 杭州小影创新科技股份有限公司 一种基于深度学习的人脸跟踪方法及系统
CN111178261A (zh) * 2019-12-30 2020-05-19 武汉恩智电子科技有限公司 一种基于视频编码技术的人脸检测加速方法
CN111770299A (zh) * 2020-04-20 2020-10-13 厦门亿联网络技术股份有限公司 一种智能视频会议终端的实时人脸摘要服务的方法及系统
CN111738120A (zh) * 2020-06-12 2020-10-02 北京奇艺世纪科技有限公司 人物识别方法、装置、电子设备及存储介质
CN111738120B (zh) * 2020-06-12 2023-12-05 北京奇艺世纪科技有限公司 人物识别方法、装置、电子设备及存储介质
CN111931592B (zh) * 2020-07-16 2022-06-28 苏州科达科技股份有限公司 对象识别方法、装置及存储介质
CN111931592A (zh) * 2020-07-16 2020-11-13 苏州科达科技股份有限公司 对象识别方法、装置及存储介质
CN112562159B (zh) * 2020-11-24 2022-10-14 恒安嘉新(北京)科技股份公司 一种门禁控制方法、装置、计算机设备和存储介质
CN112562159A (zh) * 2020-11-24 2021-03-26 恒安嘉新(北京)科技股份公司 一种门禁控制方法、装置、计算机设备和存储介质
TWI764425B (zh) * 2020-12-10 2022-05-11 鴻海精密工業股份有限公司 基於人臉識別的即時行人統計方法以及裝置
CN113242428A (zh) * 2021-04-15 2021-08-10 中南大学 视频会议场景下基于roi区域的后处理加速方法
CN113242428B (zh) * 2021-04-15 2024-03-15 中南大学 视频会议场景下基于roi区域的后处理加速方法
CN113792633A (zh) * 2021-09-06 2021-12-14 北京工商大学 一种基于神经网络和光流法的人脸追踪系统和追踪方法
CN113792633B (zh) * 2021-09-06 2023-12-22 北京工商大学 一种基于神经网络和光流法的人脸追踪系统和追踪方法

Similar Documents

Publication Publication Date Title
CN109598211A (zh) 一种实时动态人脸识别方法及系统
Garg et al. A deep learning approach for face detection using YOLO
EP4002198A1 (en) Posture acquisition method and device, and key point coordinate positioning model training method and device
CN101236608B (zh) 基于图片几何结构的人脸检测方法
WO2018107760A1 (zh) 一种用于行人检测的协同式深度网络模型方法
CN110097568A (zh) 一种基于时空双分支网络的视频对象检测与分割方法
CN107748858A (zh) 一种基于级联卷积神经网络的多姿态眼睛定位方法
CN103605972A (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN104504394A (zh) 一种基于多特征融合的密集人数估计方法和系统
CN104166841A (zh) 一种视频监控网络中指定行人或车辆的快速检测识别方法
CN107133569A (zh) 基于泛化多标记学习的监控视频多粒度标注方法
CN107301376B (zh) 一种基于深度学习多层刺激的行人检测方法
CN109886159B (zh) 一种非限定条件下的人脸检测方法
CN103440667A (zh) 一种遮挡状态下运动目标稳定追踪的自动装置
CN106874913A (zh) 一种菜品检测方法
CN106909883A (zh) 一种基于ros的模块化手部区域检测方法和装置
Pastor-López et al. Quality assessment methodology based on machine learning with small datasets: Industrial castings defects
CN115240119A (zh) 一种基于深度学习的视频监控中行人小目标检测方法
CN114758382A (zh) 基于自适应补丁学习的面部au检测模型建立方法及应用
CN114764941A (zh) 一种表情识别方法、装置以及电子设备
CN104463091A (zh) 一种基于图像lgbp特征子向量的人脸图像识别方法
CN113177439A (zh) 一种行人翻越马路护栏检测方法
Zhang et al. Joint stacked hourglass network and salient region attention refinement for robust face alignment
CN117079095A (zh) 基于深度学习的高空抛物检测方法、系统、介质和设备
Sun et al. An object detection network for embedded system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190409

RJ01 Rejection of invention patent application after publication