CN110458113A - 一种人脸非配合场景下的小人脸识别方法 - Google Patents
一种人脸非配合场景下的小人脸识别方法 Download PDFInfo
- Publication number
- CN110458113A CN110458113A CN201910748495.9A CN201910748495A CN110458113A CN 110458113 A CN110458113 A CN 110458113A CN 201910748495 A CN201910748495 A CN 201910748495A CN 110458113 A CN110458113 A CN 110458113A
- Authority
- CN
- China
- Prior art keywords
- face
- small
- image
- trained
- faster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明属于图像识别技术领域,尤其为一种人脸非配合场景下的小人脸识别方法,包括以下步骤:视频流解析:获取监控摄像头等拍下的视频,将视频流解析多幅视频帧,并且转化为RGB格式:该步骤整体分为两个模块:与现有技术相比,其显著的效果在于,提高了模型的泛化能力,有效增加识别率并且缩短了学习时间,通过解析视频流,利用小目标检测迁移学习初步检测人脸,利用人脸检测模型对初步检测的人脸模型再次训练,实现人脸的精确检测与对齐,通过face net网络将图像矩阵转化为向量列表,最后将人脸与库中的进行比对,返回识别结果,本发明将迁移学习与人脸检测,识别相结合,在非配合场景下,快速,有效的得到最终检测结果。
Description
技术领域
本发明属于图像识别技术领域,具体涉及一种人脸非配合场景下的小人脸识别方法。
背景技术
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,它由计算机分析人脸图像,从图像中提取有效信息并自动鉴别,人脸识别技术广泛应用于安全系统及人机交互等方面,已成为计算机视觉和模式识别领域中重要的研究课题之一。
对于人脸识别技术来说,如果人脸图像是在正面采集到的,具有较高的分辨率,通常识别精度比较高,但是当人脸姿态发生改变,尤其是监控等摄像头拍摄到的大量人脸图片时,即使采用很好的模型,由于训练的数据有限,识别效果也会大打折后。
发明内容
本发明的目的在于提供一种人脸非配合场景下的小人脸识别方法,通过迁移学习将其他小目标检测的模型参数用于小人脸检测,并利用mtcnn与face_net网络模型进一步检测与识别人脸。
为实现上述目的,本发明提供如下技术方案:一种人脸非配合场景下的小人脸识别方法,包括以下步骤:
S1、视频流解析:获取监控摄像头等拍下的视频,将视频流解析多幅视频帧,并且转化为RGB格式;
S2、图像获取与小目标检测:该步骤整体分为两个模块,首先采集一些不同类别的小目标图像,通过faster_rcnn模型检测小目标,利用训练好的模型接着检测视频帧中的人脸,若有人脸,返回检测框,若无人脸,舍弃当前视频帧;
S3、人脸检测:通过专有的人脸检测模型,进一步检测视频帧中的人脸,返回人脸特征图;
S4、人脸识别:采用face_net网络以及相应的比对算法,对人脸进行识别,返回检测结果。
优选的,所述S2中的小目标图像为水龙头、开关中的任意一项。
优选的,小目标检测迁移学习步骤:
S5、通过faster_rcnn训练“水龙头”数据集,将处理过的视频帧带入训练好的网络接着学习;
S6、通过faster_rcnn训练“开关”数据集,将处理过的视频帧带入训练好的网络接着学习;
S7、通过faster_rcnn训练不同类型的小目标数据集,比较不同数据集下的迁移学习效果。
优选地,所述图像获取与小目标检测步骤包括:
S2.1、faster_rcnn目标检测步骤:利用卷积提取“水龙头”,“开关”图像特征,采用VGG-16模型,将P*Q的原始图片,裁剪为M*N的图片,经过13个conv_relu层,穿插四个max_pooling层;
S2.2、经过RPN网路生成候选框和ROI池化,使proposal大小变为一致,带入全连接层,利用boundingbox回归,得到检测框的粗略位置。
优选地,在S3中人脸检测步骤包括:
S3.1、迁移学习步骤:将上述faster_rcnn训练好的模型接着用于检测视频帧中的人脸。
S3.2、人脸检测步骤:使用mtcnn模型精确检测人脸,并进行对齐,返回人脸图像矩阵。
S3.3、人脸识别步骤:利用face_net网络将人脸图像矩阵转化为512维向量,返回向量列表,输入一张代识别图像,经过上述处理,与人脸库进行比对,返回检测结果。
与现有技术相比,本发明的有益效果是:
该种人脸非配合场景下的小人脸识别方法,与现有技术相比,其显著的效果在于,提高了模型的泛化能力,有效增加识别率并且缩短了学习时间,通过解析视频流,利用小目标检测迁移学习初步检测人脸,利用人脸检测模型对初步检测的人脸模型再次训练,实现人脸的精确检测与对齐,通过facenet网络将图像矩阵转化为向量列表,最后将人脸与库中的进行比对,返回识别结果,本发明将迁移学习与人脸检测,识别相结合,在非配合场景下,快速,有效的得到最终检测结果。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明的小人脸识别方法的流程图结构示意图;
图2为本发明的小脸识别效果对比结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供以下技术方案:一种人脸非配合场景下的小人脸识别方法,包括以下步骤:
S1、视频流解析:获取监控摄像头等拍下的视频,将视频流解析多幅视频帧,并且转化为RGB格式;
S2、图像获取与小目标检测:该步骤整体分为两个模块,首先采集一些不同类别的小目标图像,通过faster_rcnn模型检测小目标,利用训练好的模型接着检测视频帧中的人脸,若有人脸,返回检测框,若无人脸,舍弃当前视频帧;
S3、人脸检测:通过专有的人脸检测模型,进一步检测视频帧中的人脸,返回人脸特征图;
S4、人脸识别:采用face_net网络以及相应的比对算法,对人脸进行识别,返回检测结果。
具体的,S2中的小目标图像为水龙头、开关中的任意一项。
具体的,图像获取与小目标检测步骤包括:
faster_rcnn目标检测步骤:
1.1利用卷积提取“水龙头”,“开关”图像特征,采用VGG-16模型,将P*Q的原始图片,裁剪为M*N的图片,经过13个conv_relu层,穿插四个max_pooling层;
1.2.RPN网路生成候选框;
1.3.ROI池化,使proposal大小变为一致,带入全连接层,利用boundingbox回归,得到检测框的粗略位置。
迁移学习步骤:
1.1.通过faster_rcnn训练“水龙头”数据集,将处理过的视频帧带入训练好的网络接着学习;
1.2.通过faster_rcnn训练“开关”数据集,将处理过的视频帧带入训练好的网络接着学习;
1.3.通过faster_rcnn训练不同类型的小目标数据集,比较不同数据集下的迁移学习效果。
1.4.将上述faster_rcnn训练好的模型接着用于检测视频帧中的人脸。
人脸检测步骤:
使用mtcnn模型精确检测人脸,并进行对齐,返回人脸图像矩阵。
人脸识别步骤:
利用face_net网络将人脸图像矩阵转化为512维向量,返回向量列表;输入一张代识别图像,经过上述处理,与人脸库进行比对,返回检测结果。
下面以其中一段代码对该过程做阐述:
(1)首先利用mtcnn模型检测人脸并预处理;
defload_and_align_data(image_paths,image_size,margin,gpu);
返回images:字典(键:人名;值:人脸矩阵列表)。
(2)利用face_net模型将人脸矩阵列表转化为人脸向量列表,根据图像列表生成注册人脸库保存在json中;
defgenerate_facalib(image_files,save_file);
(3)识别人脸是否为库中人员,是则返回名称,不是则返回不匹配信息;
defface_recognize(file_name,lib_file);
输入一张待识别人脸,调用(1)中所述函数,利用(2)中的face_net模型将待识别图像转化为向量;
将待识别人脸与人脸库中进行比对;
forkeyinface_lib.keys();
distance=0;
foriinrange(len(face_lib[key][‘image’][i]));
distance+=np.linalg.norm(embnp.array(face_lib[key][‘image’][i]));
distance/=float(len(face_lib[key][‘image’]));
ifkey==list(images.keys())[0];
print(list(image.keys())[0],‘:’,distance);
ifdistance<threshold;
name=key;
threshold=distance。
本发明的工作原理及使用流程:首先获取监控摄像头等拍下的视频,将视频流解析多幅视频帧,并且转化为RGB格式,再利用卷积提取“水龙头”,“开关”图像特征,采用VGG-16模型,将P*Q的原始图片,裁剪为M*N的图片,经过13个conv_relu层,穿插四个max_pooling层,经过RPN网路生成候选框和ROI池化,使proposal大小变为一致,带入全连接层,利用boundingbox回归,得到检测框的粗略位置,通过faster_rcnn训练“水龙头”数据集,将处理过的视频帧带入训练好的网络接着学习,通过faster_rcnn训练“开关”数据集,将处理过的视频帧带入训练好的网络接着学习,通过faster_rcnn训练不同类型的小目标数据集,比较不同数据集下的迁移学习效果,利用训练好的模型接着检测视频帧中的人脸,若有人脸,返回检测框,使用mtcnn模型精确检测人脸,并进行对齐,返回人脸图像矩阵,利用face_net网络将人脸图像矩阵转化为512维向量,返回向量列表,输入一张代识别图像,经过上述处理,与人脸库进行比对,返回检测结果,若无人脸,舍弃当前视频帧。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种人脸非配合场景下的小人脸识别方法,其特征在于:包括以下步骤:
S1、视频流解析:获取监控摄像头等拍下的视频,将视频流解析多幅视频帧,并且转化为RGB格式;
S2、图像获取与小目标检测:该步骤整体分为两个模块,首先采集一些不同类别的小目标图像,通过faster_rcnn模型检测小目标,利用训练好的模型接着检测视频帧中的人脸,若有人脸,返回检测框,若无人脸,舍弃当前视频帧;
S3、人脸检测:通过专有的人脸检测模型,进一步检测视频帧中的人脸,返回人脸特征图;
S4、人脸识别:采用face_net网络以及相应的比对算法,对人脸进行识别,返回检测结果。
2.根据权利要求1所述的一种人脸非配合场景下的小人脸识别方法,其特征在于:所述S2中的小目标图像为水龙头、开关中的任意一项。
3.根据权利要求2所述的一种人脸非配合场景下的小人脸识别方法,其特征在于:包括小目标检测迁移学习步骤:
S5、通过faster_rcnn训练“水龙头”数据集,将处理过的视频帧带入训练好的网络接着学习;
S6、通过faster_rcnn训练“开关”数据集,将处理过的视频帧带入训练好的网络接着学习;
S7、通过faster_rcnn训练不同类型的小目标数据集,比较不同数据集下的迁移学习效果。
4.根据权利要求1所述的一种人脸非配合场景下的小人脸识别方法,其特征在于:所述图像获取与小目标检测步骤包括:
S2.1、faster_rcnn目标检测步骤:利用卷积提取“水龙头”,“开关”图像特征,采用VGG-16模型,将P*Q的原始图片,裁剪为M*N的图片,经过13个conv_relu层,穿插四个max_pooling层;
S2.2、经过RPN网路生成候选框和ROI池化,使proposal大小变为一致,带入全连接层,利用boundingbox回归,得到检测框的粗略位置。
5.根据权利要求1所述的一种人脸非配合场景下的小人脸识别方法,其特征在于:所述人脸检测步骤包括:
S3.1、迁移学习步骤:将上述faster_rcnn训练好的模型接着用于检测视频帧中的人脸。
S3.2、人脸检测步骤:使用mtcnn模型精确检测人脸,并进行对齐,返回人脸图像矩阵。
S3.3、人脸识别步骤:利用face_net网络将人脸图像矩阵转化为512维向量,返回向量列表,输入一张代识别图像,经过上述处理,与人脸库进行比对,返回检测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910748495.9A CN110458113A (zh) | 2019-08-14 | 2019-08-14 | 一种人脸非配合场景下的小人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910748495.9A CN110458113A (zh) | 2019-08-14 | 2019-08-14 | 一种人脸非配合场景下的小人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110458113A true CN110458113A (zh) | 2019-11-15 |
Family
ID=68486518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910748495.9A Pending CN110458113A (zh) | 2019-08-14 | 2019-08-14 | 一种人脸非配合场景下的小人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110458113A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022134766A1 (zh) * | 2020-12-24 | 2022-06-30 | 华为技术有限公司 | 场景迁移方法、装置及电子设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778514A (zh) * | 2016-11-24 | 2017-05-31 | 努比亚技术有限公司 | 一种标识物体的方法及装置 |
CN107516090A (zh) * | 2017-09-11 | 2017-12-26 | 北京百度网讯科技有限公司 | 一体化人脸识别方法和系统 |
CN108009509A (zh) * | 2017-12-12 | 2018-05-08 | 河南工业大学 | 车辆目标检测方法 |
CN108875548A (zh) * | 2018-04-18 | 2018-11-23 | 科大讯飞股份有限公司 | 人物轨迹生成方法及装置、存储介质、电子设备 |
CN108921038A (zh) * | 2018-06-07 | 2018-11-30 | 河海大学 | 一种基于深度学习人脸识别技术的课堂快速点名签到方法 |
CN109241822A (zh) * | 2018-07-13 | 2019-01-18 | 上海斐讯数据通信技术有限公司 | 一种基于mtcnn的多方位人脸检测方法及系统 |
US20190022863A1 (en) * | 2017-07-20 | 2019-01-24 | Tata Consultancy Services Limited | Systems and methods for detecting grasp poses for handling target objects |
CN109376637A (zh) * | 2018-10-15 | 2019-02-22 | 齐鲁工业大学 | 基于视频监控图像处理的人数统计系统 |
CN109522815A (zh) * | 2018-10-26 | 2019-03-26 | 深圳博为教育科技有限公司 | 一种专注度评估方法、装置及电子设备 |
CN109544859A (zh) * | 2018-12-12 | 2019-03-29 | 焦点科技股份有限公司 | 一种主动安全家用摄像头智能实现方法 |
CN109543979A (zh) * | 2018-11-14 | 2019-03-29 | 广州慧睿思通信息科技有限公司 | 一种环境监控管理方法、系统、服务平台及介质 |
CN109740466A (zh) * | 2018-12-24 | 2019-05-10 | 中国科学院苏州纳米技术与纳米仿生研究所 | 广告投放策略的获取方法、计算机可读存储介质 |
CN109784150A (zh) * | 2018-12-06 | 2019-05-21 | 东南大学 | 基于多任务时空卷积神经网络的视频驾驶员行为识别方法 |
-
2019
- 2019-08-14 CN CN201910748495.9A patent/CN110458113A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778514A (zh) * | 2016-11-24 | 2017-05-31 | 努比亚技术有限公司 | 一种标识物体的方法及装置 |
US20190022863A1 (en) * | 2017-07-20 | 2019-01-24 | Tata Consultancy Services Limited | Systems and methods for detecting grasp poses for handling target objects |
CN107516090A (zh) * | 2017-09-11 | 2017-12-26 | 北京百度网讯科技有限公司 | 一体化人脸识别方法和系统 |
CN108009509A (zh) * | 2017-12-12 | 2018-05-08 | 河南工业大学 | 车辆目标检测方法 |
CN108875548A (zh) * | 2018-04-18 | 2018-11-23 | 科大讯飞股份有限公司 | 人物轨迹生成方法及装置、存储介质、电子设备 |
CN108921038A (zh) * | 2018-06-07 | 2018-11-30 | 河海大学 | 一种基于深度学习人脸识别技术的课堂快速点名签到方法 |
CN109241822A (zh) * | 2018-07-13 | 2019-01-18 | 上海斐讯数据通信技术有限公司 | 一种基于mtcnn的多方位人脸检测方法及系统 |
CN109376637A (zh) * | 2018-10-15 | 2019-02-22 | 齐鲁工业大学 | 基于视频监控图像处理的人数统计系统 |
CN109522815A (zh) * | 2018-10-26 | 2019-03-26 | 深圳博为教育科技有限公司 | 一种专注度评估方法、装置及电子设备 |
CN109543979A (zh) * | 2018-11-14 | 2019-03-29 | 广州慧睿思通信息科技有限公司 | 一种环境监控管理方法、系统、服务平台及介质 |
CN109784150A (zh) * | 2018-12-06 | 2019-05-21 | 东南大学 | 基于多任务时空卷积神经网络的视频驾驶员行为识别方法 |
CN109544859A (zh) * | 2018-12-12 | 2019-03-29 | 焦点科技股份有限公司 | 一种主动安全家用摄像头智能实现方法 |
CN109740466A (zh) * | 2018-12-24 | 2019-05-10 | 中国科学院苏州纳米技术与纳米仿生研究所 | 广告投放策略的获取方法、计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
赵贵祥: "面向机器人个性化服务的人穿携物品归属关系研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022134766A1 (zh) * | 2020-12-24 | 2022-06-30 | 华为技术有限公司 | 场景迁移方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
He et al. | Foreground-aware pyramid reconstruction for alignment-free occluded person re-identification | |
CN107832672B (zh) | 一种利用姿态信息设计多损失函数的行人重识别方法 | |
Zhang et al. | Ppr-fcn: Weakly supervised visual relation detection via parallel pairwise r-fcn | |
CN111563452B (zh) | 一种基于实例分割的多人体姿态检测及状态判别方法 | |
CN106503687A (zh) | 融合人脸多角度特征的监控视频人物身份识别系统及其方法 | |
CN106570464A (zh) | 一种快速处理人脸遮挡的人脸识别方法及装置 | |
CN104992223A (zh) | 基于深度学习的密集人数估计方法 | |
CN106845513B (zh) | 基于条件随机森林的人手检测器及方法 | |
CN112818951A (zh) | 一种票证识别的方法 | |
CN114155527A (zh) | 一种场景文本识别方法和装置 | |
CN111914761A (zh) | 一种热红外人脸识别的方法及系统 | |
CN106548194B (zh) | 二维图像人体关节点定位模型的构建方法及定位方法 | |
CN113963032A (zh) | 一种融合目标重识别的孪生网络结构目标跟踪方法 | |
CN112487981A (zh) | 基于双路分割的ma-yolo动态手势快速识别方法 | |
CN109360179A (zh) | 一种图像融合方法、装置及可读存储介质 | |
Uehara et al. | Visual question generation for class acquisition of unknown objects | |
CN109800756A (zh) | 一种用于中文历史文献密集文本的文字检测识别方法 | |
CN110827265A (zh) | 基于深度学习的图片异常检测方法 | |
CN111898566B (zh) | 姿态估计方法、装置、电子设备和存储介质 | |
CN108345900A (zh) | 基于颜色纹理分布特征的行人重识别方法及其系统 | |
CN113312973A (zh) | 一种手势识别关键点特征提取方法及系统 | |
CN116385873A (zh) | 基于坐标感知注意力和空间语义上下文的sar小目标检测 | |
CN109766918A (zh) | 基于多层次上下文信息融合的显著性物体检测方法 | |
Engoor et al. | Occlusion-aware dynamic human emotion recognition using landmark detection | |
CN117333908A (zh) | 基于姿态特征对齐的跨模态行人重识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191115 |