CN113052087A - 基于yolov5模型的人脸识别方法 - Google Patents
基于yolov5模型的人脸识别方法 Download PDFInfo
- Publication number
- CN113052087A CN113052087A CN202110333265.3A CN202110333265A CN113052087A CN 113052087 A CN113052087 A CN 113052087A CN 202110333265 A CN202110333265 A CN 202110333265A CN 113052087 A CN113052087 A CN 113052087A
- Authority
- CN
- China
- Prior art keywords
- image
- model
- layer
- face
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000013598 vector Substances 0.000 claims abstract description 32
- 238000007781 pre-processing Methods 0.000 claims description 4
- 210000001508 eye Anatomy 0.000 claims description 3
- 230000001815 facial effect Effects 0.000 abstract description 9
- 238000001514 detection method Methods 0.000 description 11
- 210000000887 face Anatomy 0.000 description 3
- 210000001331 nose Anatomy 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明公开了一种基于YOLOV5模型的人脸识别方法,包含:通过标定好的第一训练图像对YOLOV5模型进行训练;通过标定好的第二训练图像对FaceNet模型进行训练;通过图像采集设备采集若干注册用户的人脸图像输入至训练好的YOLOV5模型和FaceNet模型得到若干注册用户的第一人脸特征向量并保存至数据库;通过图像采集设备采集待识别用户的人脸图像并输入至训练好的YOLOV5模型和FaceNet模型得到该待识别用户的第二人脸特征向量;将第二人脸特征向量和数据库中的保存的第一人脸特征向量进行相似度匹配进行判断。本发明的基于YOLOV5模型的人脸识别方法,在识别小目标时能够兼顾性能和目标识别有效性。
Description
技术领域
本发明涉及一种基于YOLOV5模型的人脸识别方法。
背景技术
人脸识别技术是提取人的脸部特征信息进行身份识别的一种生物识别技术。现有人脸识别一般分为人脸检测、人脸识别、活体检测三个步骤,当输入一帧图像后,人脸检测模块检测出人脸在图像中的坐标位置,接着人脸识别模块提出人脸的特征向量,一般为256维、512维或者1024维,根据这个特征向量与人脸底库存储的人脸特征向量进行对比,判断是否为某一个人。最后通过活体检测模块判断是否为真人或者是使用了图片、视频的人脸。
现有的人脸检测算法模型往往无法兼顾性能和小目标人脸检测,当能够识别到人脸像素小于30x30时,算法性能下降比较快,而当提高算法性能时,小目标人脸往往又检测不到。
同时,在人脸识别模块,当获取一帧图像后,通过深度网络模型提取人脸的特征向量,然后与人脸底库中的特征向量进行比对,判断是否为同一个人,接着再运行活体检测网络判断输入图像是真人还是图像、视频攻击的人脸。这需要运行两个模型,极大的影响系统性能。
发明内容
本发明提供了一种基于YOLOV5模型的人脸识别方法,采用如下的技术方案:
一种基于YOLOV5模型的人脸识别方法,包含以下步骤:
获取若干第一训练图像;
对第一训练图像进行标定;
通过标定好的第一训练图像对YOLOV5模型进行训练;
通过图像采集设备采集若干第二训练图像;
对第二训练图像进行标定;
通过标定好的第二训练图像对FaceNet模型进行训练;
通过图像采集设备采集若干注册用户的人脸图像输入至训练好的YOLOV5模型和FaceNet模型得到若干注册用户的第一人脸特征向量并保存至数据库;
通过图像采集设备采集待识别用户的人脸图像并输入至训练好的YOLOV5模型和FaceNet模型得到该待识别用户的第二人脸特征向量;
将第二人脸特征向量和数据库中的保存的第一人脸特征向量进行相似度匹配,当相似度大于预设阈值时表明该待识别用户是注册用户。
进一步地,在通过标定好的第一训练图像对YOLOV5模型进行训练之前,基于YOLOV5模型的人脸识别方法还包括:
对标定后的第一训练图像进行预处理;
对预处理后的第一训练图像进行Mosaic图像增强操作;
将图像增强后的第一训练图像缩放为统一尺寸。
进一步地,Mosaic图像增强操作包括图像随机缩放、图像随机裁剪和图像随机排布。
进一步地,YOLOV5模型包含依次连接的Focus层、第一Conv层、第一CSP层、第二Conv层、第二CSP层、第三Conv层、第三CSP层、第四Conv层、SPP层和第一CSP层。
进一步地,Focus层的卷积核的数量为1;
第一Conv层的卷积核的数量为1;
第一CSP层的卷积核的数量为3;
第二Conv层的卷积核的数量为1;
第二CSP层的卷积核的数量为9;
第三Conv层的卷积核的数量为1;
第三CSP层的卷积核的数量为9;
第四Conv层的卷积核的数量为1;
SPP层的卷积核的数量为1;
第一CSP层的卷积核的数量为3。
进一步地,YOLOV5模型回归损失采用CIOU计算。
进一步地,图像采集设备为双目摄像头。
进一步地,图像采集设备包含红外摄像头数据和CMOS摄像头。
进一步地,对第一训练图像进行标定的具体方法为:
标定第一训练图像中的人脸坐标和属性信息。
进一步地,属性信息包含用于标示人眼、嘴巴、鼻子和人脸的81个点的坐标。
本发明的有益之处在于所提供的基于YOLOV5模型的人脸识别方法,在识别小目标时能够兼顾性能和目标识别有效性。
本发明的有益之处还在于所提供的基于YOLOV5模型的人脸识别方法,人脸识别和活体检测通过一个模型即可实现,减小了网络的复杂性。
附图说明
图1是本发明的基于YOLOV5模型的人脸识别方法的流程图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
如图1所示为本发明的一种基于YOLOV5模型的人脸识别方法,包含以下步骤:S1:获取若干第一训练图像。S2:对第一训练图像进行标定。S3:通过标定好的第一训练图像对YOLOV5模型进行训练。S4:通过图像采集设备采集若干第二训练图像。S5:对第二训练图像进行标定。S6:通过标定好的第二训练图像对FaceNet模型进行训练。S7:通过图像采集设备采集若干注册用户的人脸图像输入至训练好的YOLOV5模型和FaceNet模型得到若干注册用户的第一人脸特征向量并保存至数据库。S8:通过图像采集设备采集待识别用户的人脸图像并输入至训练好的YOLOV5模型和FaceNet模型得到该待识别用户的第二人脸特征向量。S9:将第二人脸特征向量和数据库中的保存的第一人脸特征向量进行相似度匹配,当相似度大于预设阈值时表明该待识别用户是注册用户。通过以上步骤,简化了识别流程,提高了人脸识别效率。以下对上述步骤进行具体描述。
对于步骤S1:获取若干第一训练图像。
收集开源人脸数据库以及监控视频的数据,找到视频中包含人脸的图像,并保存每一帧包含人脸的图像作为第一训练图像。
对于步骤S2:对第一训练图像进行标定。
对第一训练图像进行标定的具体方法为:
通过人工标定第一训练图像中的人脸矩形框坐标和属性信息,其中,属性信息包含用于标示人眼、嘴巴、鼻子和人脸的81个点的坐标。
对于步骤S3:通过标定好的第一训练图像对YOLOV5模型进行训练。
在本发明中,对搭建的YOLOV5模型进行了优化。具体的,YOLOV5模型包含依次连接的Focus层、第一Conv层、第一CSP层、第二Conv层、第二CSP层、第三Conv层、第三CSP层、第四Conv层、SPP层和第一CSP层。其中,Focus层的卷积核的数量为1。第一Conv层的卷积核的数量为1。第一CSP层的卷积核的数量为3。第二Conv层的卷积核的数量为1。第二CSP层的卷积核的数量为9。第三Conv层的卷积核的数量为1。第三CSP层的卷积核的数量为9。第四Conv层的卷积核的数量为1。SPP层的卷积核的数量为1。第一CSP层的卷积核的数量为3。同时,优选的是,本发明的YOLOV5模型的回归损失采用CIOU计算。
作为一种优选的实施方式,在执行步骤S3之前,基于YOLOV5模型的人脸识别方法还包括:对标定后的第一训练图像进行预处理。对预处理后的第一训练图像进行Mosaic图像增强操作。将图像增强后的第一训练图像缩放为统一尺寸。其中,Mosaic图像增强操作包括图像随机缩放、图像随机裁剪和图像随机排布。
通过本发明的YOLOV5模型,在识别小目标时能够兼顾性能和目标识别有效性。
对于步骤S4:通过图像采集设备采集若干第二训练图像。
本发明中,图像采集设备双目摄像头。具体的,图像采集设备包含红外摄像头数据和CMOS摄像头。其中,CMOS摄像头优选为广角CMOS摄像头。红外摄像头可以获取灰度图像,包含一个图像通道,CMOS摄像头可以获取YUV图像,包含Y、U、V三个通道,每秒可以获取30帧图像。CMOS摄像头采集的数据用来做人脸检测和人脸识别,红外摄像头获取的图像用来做人脸识别和人脸活体检测。
对于步骤S5:对第二训练图像进行标定。
即标定图像是活体还是非活体。
对于步骤S6:通过标定好的第二训练图像对FaceNet模型进行训练。
将双目摄像头采集到的红外摄像头数据和CMOS摄像头采集到的YUV数据作为数据的输入源。并且将采集到的数据做预处理,把活体人脸图像和非活体人脸图像(包括图像攻击照片、视频攻击图像、3D模型攻击图像等)作为训练数据集,对FaceNet模型进行训练,非活体人脸图像作为攻击样本,最终输出人脸特征向量。
在本发明中,FaceNet模型能够同时进行人脸识别和活体检测,减小了网络的复杂性。
对于步骤S7:通过图像采集设备采集若干注册用户的人脸图像输入至训练好的YOLOV5模型和FaceNet模型得到若干注册用户的第一人脸特征向量并保存至数据库。
将注册用户的人脸特征保存在数据库中。
对于步骤S8:通过图像采集设备采集待识别用户的人脸图像并输入至训练好的YOLOV5模型和FaceNet模型得到该待识别用户的第二人脸特征向量。
将待识别的用户的人脸特征提取出来。
对于步骤S9:将第二人脸特征向量和数据库中的保存的第一人脸特征向量进行相似度匹配,当相似度大于预设阈值时表明该待识别用户是注册用户。
将提取出的人脸特征和数据库中保存的人脸特征进行相似度匹配,若从数据库中匹配到大于预设阈值的对应的人脸,表明该待识别用户是注册用户。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (10)
1.一种基于YOLOV5模型的人脸识别方法,其特征在于,包含以下步骤:
获取若干第一训练图像;
对所述第一训练图像进行标定;
通过标定好的所述第一训练图像对YOLOV5模型进行训练;
通过图像采集设备采集若干第二训练图像;
对所述第二训练图像进行标定;
通过标定好的所述第二训练图像对FaceNet模型进行训练;
通过所述图像采集设备采集若干注册用户的人脸图像输入至训练好的所述YOLOV5模型和所述FaceNet模型得到若干注册用户的第一人脸特征向量并保存至数据库;
通过所述图像采集设备采集待识别用户的人脸图像并输入至训练好的所述YOLOV5模型和所述FaceNet模型得到该待识别用户的第二人脸特征向量;
将所述第二人脸特征向量和数据库中的保存的所述第一人脸特征向量进行相似度匹配,当相似度大于预设阈值时表明该待识别用户是注册用户。
2.根据权利要求1所述的基于YOLOV5模型的人脸识别方法,其特征在于,
在所述通过标定好的所述第一训练图像对YOLOV5模型进行训练之前,所述基于YOLOV5模型的人脸识别方法还包括:
对标定后的所述第一训练图像进行预处理;
对预处理后的所述第一训练图像进行Mosaic图像增强操作;
将图像增强后的所述第一训练图像缩放为统一尺寸。
3.根据权利要求2所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述Mosaic图像增强操作包括图像随机缩放、图像随机裁剪和图像随机排布。
4.根据权利要求1所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述YOLOV5模型包含依次连接的Focus层、第一Conv层、第一CSP层、第二Conv层、第二CSP层、第三Conv层、第三CSP层、第四Conv层、SPP层和第一CSP层。
5.根据权利要求4所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述Focus层的卷积核的数量为1;
所述第一Conv层的卷积核的数量为1;
所述第一CSP层的卷积核的数量为3;
所述第二Conv层的卷积核的数量为1;
所述第二CSP层的卷积核的数量为9;
所述第三Conv层的卷积核的数量为1;
所述第三CSP层的卷积核的数量为9;
所述第四Conv层的卷积核的数量为1;
所述SPP层的卷积核的数量为1;
所述第一CSP层的卷积核的数量为3。
6.根据权利要求5所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述YOLOV5模型回归损失采用CIOU计算。
7.根据权利要求1所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述图像采集设备为双目摄像头。
8.根据权利要求7所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述图像采集设备包含红外摄像头数据和CMOS摄像头。
9.根据权利要求1所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述对所述第一训练图像进行标定的具体方法为:
标定所述第一训练图像中的人脸坐标和属性信息。
10.根据权利要求9所述的基于YOLOV5模型的人脸识别方法,其特征在于,
所述属性信息包含用于标示人眼、嘴巴、鼻子和人脸的81个点的坐标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110333265.3A CN113052087A (zh) | 2021-03-29 | 2021-03-29 | 基于yolov5模型的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110333265.3A CN113052087A (zh) | 2021-03-29 | 2021-03-29 | 基于yolov5模型的人脸识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113052087A true CN113052087A (zh) | 2021-06-29 |
Family
ID=76515981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110333265.3A Pending CN113052087A (zh) | 2021-03-29 | 2021-03-29 | 基于yolov5模型的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113052087A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115035644A (zh) * | 2022-05-24 | 2022-09-09 | 淮阴工学院 | 基于树莓派与rfid的多模态识别门禁系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022317A (zh) * | 2016-06-27 | 2016-10-12 | 北京小米移动软件有限公司 | 人脸识别方法及装置 |
CN109543645A (zh) * | 2018-11-30 | 2019-03-29 | 北京小马智行科技有限公司 | 一种人脸识别方法及装置 |
CN110516576A (zh) * | 2019-08-20 | 2019-11-29 | 西安电子科技大学 | 基于深度神经网络的近红外活体人脸识别方法 |
CN110705454A (zh) * | 2019-09-29 | 2020-01-17 | 东华大学 | 一种具有活体检测功能的人脸识别方法 |
CN112288398A (zh) * | 2020-10-29 | 2021-01-29 | 平安信托有限责任公司 | 面签验证方法、装置、计算机设备及存储介质 |
-
2021
- 2021-03-29 CN CN202110333265.3A patent/CN113052087A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022317A (zh) * | 2016-06-27 | 2016-10-12 | 北京小米移动软件有限公司 | 人脸识别方法及装置 |
CN109543645A (zh) * | 2018-11-30 | 2019-03-29 | 北京小马智行科技有限公司 | 一种人脸识别方法及装置 |
CN110516576A (zh) * | 2019-08-20 | 2019-11-29 | 西安电子科技大学 | 基于深度神经网络的近红外活体人脸识别方法 |
CN110705454A (zh) * | 2019-09-29 | 2020-01-17 | 东华大学 | 一种具有活体检测功能的人脸识别方法 |
CN112288398A (zh) * | 2020-10-29 | 2021-01-29 | 平安信托有限责任公司 | 面签验证方法、装置、计算机设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
张麒麟 等;: "《改进YOLOv5 的航拍图像识别算法》", 《长江信息通信》 * |
梁利亭: "《基于人脸识别技术的"智慧宿舍"管理平台设计》", 《石家庄职业技术学院学报》 * |
陈斐凡 等: "《基于FaceNet 算法的公交车人脸识别系统设计与实现》", 《信息与电脑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115035644A (zh) * | 2022-05-24 | 2022-09-09 | 淮阴工学院 | 基于树莓派与rfid的多模态识别门禁系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229362B (zh) | 一种基于门禁系统的双目人脸识别活体检测方法 | |
CN109598242B (zh) | 一种活体检测方法 | |
JP5629803B2 (ja) | 画像処理装置、撮像装置、画像処理方法 | |
JP4743823B2 (ja) | 画像処理装置、撮像装置、画像処理方法 | |
CN107370942B (zh) | 拍照方法、装置、存储介质及终端 | |
CN111241975B (zh) | 一种基于移动端边缘计算的人脸识别检测方法及系统 | |
CN111563417B (zh) | 一种基于金字塔结构卷积神经网络的人脸表情识别方法 | |
CN112818722B (zh) | 模块化动态可配置的活体人脸识别系统 | |
CN107346414B (zh) | 行人属性识别方法和装置 | |
KR20170006355A (ko) | 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치 | |
US11176679B2 (en) | Person segmentations for background replacements | |
CN114783003A (zh) | 一种基于局部特征注意力的行人重识别方法和装置 | |
CN113191216B (zh) | 基于姿态识别和c3d网络的多人实时动作识别方法和系统 | |
CN111639580A (zh) | 一种结合特征分离模型和视角转换模型的步态识别方法 | |
CN106529441A (zh) | 基于模糊边界分片的深度动作图人体行为识别方法 | |
US20240161461A1 (en) | Object detection method, object detection apparatus, and object detection system | |
CN113076860B (zh) | 一种野外场景下的鸟类检测系统 | |
KR101344851B1 (ko) | 영상처리장치 및 영상처리방법 | |
CN113052087A (zh) | 基于yolov5模型的人脸识别方法 | |
CN112149517A (zh) | 一种人脸考勤方法、系统、计算机设备及存储介质 | |
CN108197593B (zh) | 基于三点定位方法的多尺寸人脸表情识别方法及装置 | |
CN114387670A (zh) | 基于时空特征融合的步态识别方法、装置及存储介质 | |
CN210442821U (zh) | 一种人脸识别装置 | |
CN113887373A (zh) | 基于城市智慧体育的并行融合网络的姿态识别方法和系统 | |
CN114022905A (zh) | 一种属性感知的域拓展行人重识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210629 |
|
RJ01 | Rejection of invention patent application after publication |