CN110458097A - 一种人脸图片识别方法、装置、电子设备及存储介质 - Google Patents
一种人脸图片识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110458097A CN110458097A CN201910736332.9A CN201910736332A CN110458097A CN 110458097 A CN110458097 A CN 110458097A CN 201910736332 A CN201910736332 A CN 201910736332A CN 110458097 A CN110458097 A CN 110458097A
- Authority
- CN
- China
- Prior art keywords
- face
- picture
- feature vector
- layers
- face picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Abstract
本发明实施例公开了一种人脸图片识别方法、装置、电子设备及存储介质。其中方法包括:获取待识别的人脸图片,将人脸图片进行预处理,得到预处理图片;将预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;基于预设特征向量库,对人脸特征向量进行识别。通过将人脸图片进行预处理,可以提高人脸图片的识别准确率;通过预先训练的特征向量提取模块,可以得到预处理图片对应的高准确率的人脸特征向量;通过预设特征向量库,可以对人脸特征向量对应的人脸进行识别,从而提高了分辨率较低的人脸图片的识别准确率。
Description
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种人脸图片识别方法、装置、电子设备及存储介质。
背景技术
随着大数据和AI人工智能算法的发展,人脸识别已成为当前一个热门的研究方向,广泛应用于上班签到打卡、安防监控系统等领域。在安防监控系统中,现有的对犯人进行辨识的方法大多采用人员观察,或者人物图片分析,但是监控视频中的图片信息分辨率较低,很难对人物头像特征进行提取,不便于对人脸的数据进行查询,增加了识别人脸的难度。因此,亟需一种针对分辨率较低的人脸图片的识别方法。
发明内容
本发明实施例提供一种人脸图片识别方法、装置、电子设备及存储介质,提高了分辨率较低的人脸图片的识别准确率。
第一方面,本发明实施例提供了一种人脸图片识别方法,包括:
获取待识别的人脸图片,将所述人脸图片进行预处理,得到预处理图片;
将所述预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;
基于预设特征向量库,对所述人脸特征向量进行识别。
可选的,所述获取待识别的人脸图片,包括:通过预设接口获取网络摄像机采集的视频流,将所述视频流转化为矩阵格式的图片,将转化完成的图片作为待识别的人脸图片。
可选的,所述将所述人脸图片进行预处理,包括:基于多任务卷积神经网络算法,确定所述人脸图片中的人脸关键点和人脸范围;根据所述人脸范围对所述人脸图片进行切割,并将切割后的人脸图片进行归一化;基于普鲁克分析方法,将所述归一化后人脸图片中的人脸关键点与预设关键点对齐。
可选的,所述特征向量提取模型,包括:依序连接的第一卷积层、第一池化层、预设数量个第一残差单元和第一输出层;其中,所述第一残差单元包括:依序连接的第一BN层、第二卷积层、第一ReLU层、第三卷积层和第二BN层,且第一BN层的输入端与第二BN层的输出端连接;其中,所述第一输出层包括:依序连接的第三BN层、第一Dropout层、第一全连接层和第四BN层。
可选的,所述特征向量提取模型在预先训练过程中,在所述第一输出层之后还连接有AM-Softmax层。
可选的,所述基于预设特征向量库对所述人脸特征向量进行识别,包括:
遍历所述预设特征向量库中的预设特征向量;计算当前遍历的预设特征向量与所述人脸特征向量之间的向量距离;于遍历结束时,根据各向量距离对所述人脸特征向量进行识别。
第二方面,本发明实施例还提供了一种人脸图片识别装置,该装置包括:
预处理模块,用于获取待识别的人脸图片,将所述人脸图片进行预处理,得到预处理图片;
特征向量确定模块,用于将所述预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;
识别模块,用于基于预设特征向量库对所述人脸特征向量进行识别。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请任意实施例提供的人脸图片识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任意实施例提供的人脸图片识别方法。
本发明实施例提供的一种人脸图片识别方法、装置、电子设备及存储介质,通过,通过将人脸图片进行预处理,可以提高人脸图片的识别准确率;通过预先训练的特征向量提取模块,可以得到预处理图片对应的高准确率的人脸特征向量;通过预设特征向量库,可以对人脸特征向量对应的人脸进行识别,从而提高了分辨率较低的人脸图片的识别准确率。
附图说明
图1是本发明实施例一提供的一种人脸图片识别方法的流程示意图;
图2是本发明实施例二提供的一种人脸图片识别装置的结构示意图;
图3是本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种人脸图片识别方法的流程示意图,本实施例可适用于分辨率较低的人脸图片识别的情况,例如可以是对监控视频中分辨率较低的人脸图片识别的情况。该方法可以由本发明实施例提供的人脸图片识别装置来执行,且人脸图片识别装置可配置于本发明实施例提供的电子设备中。参见图1,该方法具体包括如下步骤:
S110、获取待识别的人脸图片,将人脸图片进行预处理,得到预处理图片。
其中,电子设备获取的待识别的人脸图片,可以是电子设备本地存储的人脸图片,还可以是与电子设备进行通讯的图像采集模块实时采集的人脸图片。其中,电子设备对人脸图片进行预处理,可以包括但不限于切割、压缩、仿射变换和像素归一化等。其中,电子设备可以包括但不限于手机、平板电脑、计算机、智能摄像机和服务器等。
可选的,获取待识别的人脸图片,包括:通过预设接口获取网络摄像机采集的视频流,将视频流转化为矩阵格式的图片,将转化完成的图片作为待识别的人脸图片。
其中,网络摄像机(IP Camera,IPC)是一种由传统摄像机与网络技术结合所产生的新一代摄像机。IPC可用于对监控区域进行抓拍,生成包含人脸的数字视频流(例如动态图像专家组(Moving Picture Experts Group,MPEG)格式的视频流),并将包含人脸的视频流通过预设有线网络接口或无线网络接口传输至电子设备。其中,电子设备获取包含人脸的数字视频流之后,可通过调用python内置的urllib库中的request模块,将IPC发送的流格式的数据转化为opencv可支持的图片矩阵格式的数据,从而实现了待识别的人脸图片的获取。
可选的,将人脸图片进行预处理,包括:
基于多任务卷积神经网络算法,确定人脸图片中的人脸关键点和人脸范围;根据人脸范围对人脸图片进行切割,并将切割后的人脸图片进行归一化;基于普鲁克分析方法,将归一化后人脸图片中的人脸关键点与预设关键点对齐。
其中,多任务卷积神经网络算法(Multi-task Convolutional neural Networks,MTCNN)可分为P-Net、R-Net、和O-Net三层网络结构。其中,P-Net全称为Proposal Network,其基本的构造是一个全连接网络,主要用于快速生成可能存在人脸的人脸区域;R-Net,全称为Refine Network,其基本的构造是一个卷积神经网络,相对于第一层的P-Net来说,增加了一个全连接层,因此对于输入数据的筛选会更加严格,主要用于进行高精度人脸区域过滤选择;O-Net全称为Output Network,基本结构是一个较为复杂的卷积神经网络,相对于R-Net来说多了一个卷积层。O-Net的效果与R-Net的区别在于这一层结构会通过更多的监督来识别面部的区域,而且会对人的面部特征点进行回归,主要用于输出五个人脸面部特征点(左眼中心点,右眼中心点,鼻尖点,嘴巴左角和右角两点)和人脸范围边界框。
其中,由于IPC对监控区域抓拍的人脸的大小满足一定尺寸范围,因此可以预先根据历史抓拍的人脸尺寸范围设置切割尺寸,例如可以将历史抓拍的人脸的最大尺寸设置为切割尺寸。其中,切割尺寸例如可以是112*112像素。其中,根据人脸范围对人脸图片进行切割,可以理解为将人脸图片切割为切割尺寸大小的图片,且切割后的图片包含人脸范围。其中,将切割后的人脸图片进行归一化,可以是将切割后的人脸图片中每个像素点的三通道RGB值进行中心归一化处理,例如可以是将RGB值减去第一数值之后除以第二数值,且第一数值可以是127.5,第二数值可以是128。通过切割可以使待提取特征的图片大小一致,通过归一化可以使所提取的特征更加准确。
其中,普鲁克分析方法(Procrustes analysis)是一种用于分析形状分布的统计方法,其利用最小二乘法寻找形状A与形状B之间的仿射变换,并通过旋转、平移和缩放使得图像A的向量与图像B的向量点尽可能的对齐。此外,通过最小二乘法,使得变化后所有点与目标点距离和最小,判断对齐的效果。其中,通过Procrustes analysis统计方法可以将任意一个人脸图片中人脸关键点与预设关键点对齐,以使对齐后的人脸图片所提取的特征向量具备一致性,可以理解为将各人脸图片的相同局部进行特征比对,从而提高了识别准确率。
通过对获取的人脸图片进行预处理,可以使各人脸图片具备统一的特征向量提取条件,从而提高了人脸图片的识别准确率。
S120、将预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量。
其中,预先训练的特征向量提取模型可以为基于深度残差学习的卷积神经网络。在卷积神经网络构建时,可以添加多层批量归一化(Batch Normalization,BN)层,以对神经网络中传递的特征进行归一化。利用BN层对特征进行归一化后,原来范数比较小的特征会获取更大的范数,从而降低了梯度爆炸的风险,同时保证了深度神经网络随着网络深度加深的收敛速度,加快了特征向量提取模型的学习速率。其中,人脸特征向量的维度与卷积神经模型中各卷积层的卷积核数量相关,卷积核数量越多,所得到的人脸特征向量的维度越高,其中人脸特征向量例如可以为512维的特征向量。
可选的,特征向量提取模型,包括:依序连接的第一卷积层、第一池化层、预设数量个第一残差单元和第一输出层;其中,第一残差单元包括:依序连接的第一BN层、第二卷积层、第一ReLU层、第三卷积层和第二BN层,且第一BN层的输入端与第二BN层的输出端连接;其中,第一输出层包括:依序连接的第三BN层、第一Dropout层、第一全连接层和第四BN层。
其中,第一卷积层的卷积核大小可以设置较小值,例如可以设置为3*3的卷积核,且步长可以设置为1,从而可以输出较大的特征图,以提高识别精确度。其中,第一池化层可以是最大池化层,最大池化层相对于均值池化层来说,可以保留更多的特征信息。其中,第一残差单元的数量越多,卷积神经网络的层数越多,特殊的残差单元结构设计可以使卷积神经网络在深度增加的情况下维持强劲的准确率增长,其中残差单元的数量例如可以为15个。其中,第一ReLU层为激励函数,采用ReLU层作为激励函数可以给神经网络引入非线性因素,也可缓解神经网络梯度消失的问题,使特征向量提取更加准确。其中,第一BN层的输入端与第二BN层的输出端连接,即残差单元的输入端与输出端直连,这样的网络结构能够比简单叠加层生产的深度网络更容易优化。其中,第一Dropout层降低了网络复杂度,有效避免了深度神经网络随着网络深度加深导致的过拟合现象。
通过在特征向量提取模型中采用上述结构的第一残差单元以及第一输出层,实现了对特征向量模型的结构优化。基于上述特征向量模型进行人脸特征向量的提取,可以在保证提取速度的同时大大提高准确率。
可选的,特征向量提取模型在预先训练过程中,在第一输出层之后还连接有AM-Softmax层。
其中,在特征向量提取模型训练过程中,在第一输出层之后还可以连接有损失函数层,用于计算损失函数。相应的,当特征向量提取模型训练完成后,取消损失函数层。其中,损失函数层可以是AM-Softmax层,AM-Softmax函数与将ASoftmax函数中cos(mθ)修改为了ψ(θ)=cosθ-m,即利用预先距离取代了角度距离,从而便于特征向量提取模型训练过程中进行反向传播,以修改各层网络的权重,使特征向量提取模型可提取出高区分度的特征向量。
S130、基于预设特征向量库,对人脸特征向量进行识别。
其中,特征向量库中存储有与人脸特征向量维度相同的预设特征向量,且预设特征向量与用户身份相对应。其中,预设特征向量的预先求取过程同样可以是,将IPC采集的人脸图像进行上述预处理,并将预处理图片输入至上述特征向量提取模型。其中,可以将预设特征向量与人脸特征向量进行比对,从而识别人脸特征向量对应的用户身份。
可选的,基于预设特征向量库,对人脸特征向量进行识别,包括:
遍历预设特征向量库中的预设特征向量;计算当前遍历的预设特征向量与人脸特征向量之间的向量距离;于遍历结束时,根据各向量距离对人脸特征向量进行识别。
其中,求取当前遍历的预设特征向量与人脸特征向量之间的向量距离,即求取预设特征向量与人脸特征向量之间的相似度量。例如,可以求取预设特征向量与人脸特征向量之间的欧氏距离,夹角余弦,相关信息与相关距离等,作为预设特征向量与人脸特征向量之间的向量距离。其中,根据各向量距离对人脸特征向量进行识别,可以是将与人脸特征向量向量距离最小的预设特征向量,作为与人脸特征向量匹配的特征向量,并将匹配的特征向量对应的用户身份作为人脸特征向量对应的用户身份,以实现人脸图片的用户身份识别。
本实施例提供的人脸图片识别方法,服务器获取待识别的人脸图片,将人脸图片进行预处理,得到预处理图片;将预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;基于预设特征向量库,对人脸特征向量进行识别。通过将人脸图片进行预处理,可以提高人脸图片的识别准确率;通过预先训练的特征向量提取模块,可以得到预处理图片对应的高准确率的人脸特征向量;通过预设特征向量库,可以对人脸特征向量对应的人脸进行识别,从而提高了分辨率较低的人脸图片的识别准确率。
实施例二
图2是本发明实施例二提供的一种人脸图片识别装置的结构示意图。参见图2,该装置包括:
预处理模块210,用于获取待识别的人脸图片,将人脸图片进行预处理,得到预处理图片;
特征向量确定模块220,用于将预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;
识别模块230,用于基于预设特征向量库,对人脸特征向量进行识别。
可选的,特征向量提取模型,包括:依序连接的第一卷积层、第一池化层、预设数量个第一残差单元和第一输出层;其中,第一残差单元包括:依序连接的第一BN层、第二卷积层第一ReLU层、第三卷积层和第二BN层,且第一BN层的输入端与第二BN层的输出端连接;其中,第一输出层包括:依序连接的第三BN层、第一Dropout层、第一全连接层和第四BN层。
可选的,特征向量提取模型在预先训练过程中,在第一输出层之后还连接有AM-Softmax层。
可选的,预处理模块,包括:
图片获取单元,用于通过预设接口获取网络摄像机采集的视频流,将视频流转化为矩阵格式的图片,将转化完成的图片作为待识别的人脸图片。
可选的,预处理模块,还包括:
预处理单元,用于基于多任务卷积神经网络算法,确定人脸图片中的人脸关键点和人脸范围;根据人脸范围对人脸图片进行切割,并将切割后的人脸图片进行归一化;基于普鲁克分析方法,将归一化后人脸图片中的人脸关键点与预设关键点对齐。
可选的,识别模块,具体用于遍历预设特征向量库中的预设特征向量;计算当前遍历的预设特征向量与人脸特征向量之间的向量距离;于遍历结束时,根据各向量距离对人脸特征向量进行识别。
本发明实施例所提供的人脸图片识别装置可执行本发明任一实施例所提供的人脸图片识别方法,具备执行方法相应的功能模块和有益效果。未详尽描述的技术细节,可参见本发明任一实施例所提供的人脸图片识别方法。
实施例三
图3为本发明实施例三提供的一种电子设备的结构示意图。图3示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图3显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是承担人脸图片识别功能的电子设备。
如图3所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图3未显示,通常称为“硬盘驱动器”)。尽管图3中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储装置28可以包括至少一个程序产品,该程序产品具有一组程序模块42,这些程序模块被配置以执行本发明各实施例的功能。
具有一组程序模块42的程序/实用工具40,可以存储在例如存储装置28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、摄像头、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器16通过运行存储在存储装置28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的人脸图片识别方法,该方法包括:
获取待识别的人脸图片,将人脸图片进行预处理,得到预处理图片;将预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;基于预设特征向量库,对人脸特征向量进行识别。
当然,本领域技术人员可以理解,处理器还可以实现本发明任一实施例所提供的人脸图片识别方法的技术方案。
实施例四
本发明实施例四还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的人脸图片识别方法,该方法包括:
获取待识别的人脸图片,将人脸图片进行预处理,得到预处理图片;将预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;基于预设特征向量库,对人脸特征向量进行识别。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法操作,还可以执行本发明任一实施例所提供的人脸图片识别方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种人脸图片识别方法,其特征在于,包括:
获取待识别的人脸图片,将所述人脸图片进行预处理,得到预处理图片;
将所述预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;
基于预设特征向量库,对所述人脸特征向量进行识别。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别的人脸图片,包括:
通过预设接口获取网络摄像机采集的视频流,将所述视频流转化为矩阵格式的图片,将转化完成的图片作为待识别的人脸图片。
3.根据权利要求1所述的方法,其特征在于,所述将所述人脸图片进行预处理,包括:
基于多任务卷积神经网络算法,确定所述人脸图片中的人脸关键点和人脸范围;
根据所述人脸范围对所述人脸图片进行切割,并将切割后的人脸图片进行归一化;
基于普鲁克分析方法,将所述归一化后人脸图片中的人脸关键点与预设关键点对齐。
4.根据权利要求1所述的方法,其特征在于,所述特征向量提取模型,包括:依序连接的第一卷积层、第一池化层、预设数量个第一残差单元和第一输出层;
其中,所述第一残差单元包括:依序连接的第一BN层、第二卷积层、第一ReLU层、第三卷积层和第二BN层,且第一BN层的输入端与第二BN层的输出端连接;
其中,所述第一输出层包括:依序连接的第三BN层、第一Dropout层、第一全连接层和第四BN层。
5.根据权利要求4所述的方法,其特征在于,所述特征向量提取模型在预先训练过程中,在所述第一输出层之后还连接有AM-Softmax层。
6.根据权利要求1-5任一所述的方法,其特征在于,所述基于预设特征向量库对所述人脸特征向量进行识别,包括:
遍历所述预设特征向量库中的预设特征向量;
计算当前遍历的预设特征向量与所述人脸特征向量之间的向量距离;
于遍历结束时,根据各向量距离对所述人脸特征向量进行识别。
7.一种人脸图片识别装置,其特征在于,包括:
预处理模块,用于获取待识别的人脸图片,将所述人脸图片进行预处理,得到预处理图片;
特征向量确定模块,用于将所述预处理图片输入至预先训练的特征向量提取模型中,得到人脸特征向量;
识别模块,用于基于预设特征向量库对所述人脸特征向量进行识别。
8.根据权利要求7所述的装置,其特征在于,所述特征向量提取模型,包括:依序连接的第一卷积层、第一池化层、预设数量个第一残差单元和第一输出层;
其中,所述第一残差单元包括:依序连接的第一BN层、第二卷积层第一ReLU层、第三卷积层和第二BN层,且第一BN层的输入端与第二BN层的输出端连接;
其中,所述第一输出层包括:依序连接的第三BN层、第一Dropout层、第一全连接层和第四BN层。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的人脸图片识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的人脸图片识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910736332.9A CN110458097A (zh) | 2019-08-09 | 2019-08-09 | 一种人脸图片识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910736332.9A CN110458097A (zh) | 2019-08-09 | 2019-08-09 | 一种人脸图片识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110458097A true CN110458097A (zh) | 2019-11-15 |
Family
ID=68485787
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910736332.9A Pending CN110458097A (zh) | 2019-08-09 | 2019-08-09 | 一种人脸图片识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110458097A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160094A (zh) * | 2019-11-26 | 2020-05-15 | 苏州方正璞华信息技术有限公司 | 一种跑步抓拍照片中选手识别方法及装置 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106226212A (zh) * | 2016-08-30 | 2016-12-14 | 上海交通大学 | 基于深度残差网络的高光谱霾监测方法 |
CN107784324A (zh) * | 2017-10-17 | 2018-03-09 | 杭州电子科技大学 | 基于深度残差网络的白血细胞多分类识别方法 |
CN108446689A (zh) * | 2018-05-30 | 2018-08-24 | 南京开为网络科技有限公司 | 一种人脸识别方法 |
CN108648172A (zh) * | 2018-03-30 | 2018-10-12 | 四川元匠科技有限公司 | 一种基于3D-Unet的CT图肺结节检测系统 |
CN109063666A (zh) * | 2018-08-14 | 2018-12-21 | 电子科技大学 | 基于深度可分离卷积的轻量化人脸识别方法及系统 |
CN109376717A (zh) * | 2018-12-14 | 2019-02-22 | 中科软科技股份有限公司 | 人脸对比的身份识别方法、装置、电子设备及存储介质 |
CN109766814A (zh) * | 2018-12-29 | 2019-05-17 | 上海汇付数据服务有限公司 | 人脸验证方法以及系统 |
CN109948573A (zh) * | 2019-03-27 | 2019-06-28 | 厦门大学 | 一种基于级联深度卷积神经网络的噪声鲁棒人脸识别方法 |
CN109993089A (zh) * | 2019-03-22 | 2019-07-09 | 浙江工商大学 | 一种基于深度学习的视频目标去除及背景恢复方法 |
-
2019
- 2019-08-09 CN CN201910736332.9A patent/CN110458097A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106226212A (zh) * | 2016-08-30 | 2016-12-14 | 上海交通大学 | 基于深度残差网络的高光谱霾监测方法 |
CN107784324A (zh) * | 2017-10-17 | 2018-03-09 | 杭州电子科技大学 | 基于深度残差网络的白血细胞多分类识别方法 |
CN108648172A (zh) * | 2018-03-30 | 2018-10-12 | 四川元匠科技有限公司 | 一种基于3D-Unet的CT图肺结节检测系统 |
CN108446689A (zh) * | 2018-05-30 | 2018-08-24 | 南京开为网络科技有限公司 | 一种人脸识别方法 |
CN109063666A (zh) * | 2018-08-14 | 2018-12-21 | 电子科技大学 | 基于深度可分离卷积的轻量化人脸识别方法及系统 |
CN109376717A (zh) * | 2018-12-14 | 2019-02-22 | 中科软科技股份有限公司 | 人脸对比的身份识别方法、装置、电子设备及存储介质 |
CN109766814A (zh) * | 2018-12-29 | 2019-05-17 | 上海汇付数据服务有限公司 | 人脸验证方法以及系统 |
CN109993089A (zh) * | 2019-03-22 | 2019-07-09 | 浙江工商大学 | 一种基于深度学习的视频目标去除及背景恢复方法 |
CN109948573A (zh) * | 2019-03-27 | 2019-06-28 | 厦门大学 | 一种基于级联深度卷积神经网络的噪声鲁棒人脸识别方法 |
Non-Patent Citations (4)
Title |
---|
HE, KAIMING 等: "Deep Residual Learning for Image Recognition", 《CVPR》 * |
SERGEY IOFFE 等: "Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift", 《ARXIV:1502.03167V3》 * |
孙惠斌编著: "《高品质切削过程的智能感知与预测技术》", 28 February 2019, 西北工业大学出版社 * |
许庆勇著: "《基于深度学习理论的纹身图像识别与检测研究》", 31 December 2018, 华中科技大学出版社 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111160094A (zh) * | 2019-11-26 | 2020-05-15 | 苏州方正璞华信息技术有限公司 | 一种跑步抓拍照片中选手识别方法及装置 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108197587B (zh) | 一种通过人脸深度预测进行多模态人脸识别的方法 | |
WO2020108362A1 (zh) | 人体姿态检测方法、装置、设备及存储介质 | |
WO2021052375A1 (zh) | 目标图像生成方法、装置、服务器及存储介质 | |
WO2020103700A1 (zh) | 一种基于微表情的图像识别方法、装置以及相关设备 | |
CN111274916B (zh) | 人脸识别方法和人脸识别装置 | |
CN110046551A (zh) | 一种人脸识别模型的生成方法及设备 | |
WO2021196389A1 (zh) | 面部动作单元识别方法、装置、电子设备及存储介质 | |
CN108895981A (zh) | 一种三维测量方法、装置、服务器和存储介质 | |
WO2020134818A1 (zh) | 图像处理方法及相关产品 | |
TW202026948A (zh) | 活體檢測方法、裝置以及儲存介質 | |
CN111414858B (zh) | 人脸识别方法、目标图像的确定方法、装置和电子系统 | |
WO2021218238A1 (zh) | 图像处理方法和图像处理装置 | |
WO2022227765A1 (zh) | 生成图像修复模型的方法、设备、介质及程序产品 | |
WO2022188697A1 (zh) | 提取生物特征的方法、装置、设备、介质及程序产品 | |
CN112329525A (zh) | 一种基于时空图卷积神经网络的手势识别方法和装置 | |
CN110458097A (zh) | 一种人脸图片识别方法、装置、电子设备及存储介质 | |
CN114119489A (zh) | 一种电连接器多余物及缩针倒针缺陷自动化检测方法 | |
CN113850231A (zh) | 一种红外图像的转换训练方法、装置、设备及存储介质 | |
CN112052730B (zh) | 一种3d动态人像识别监控设备及方法 | |
Deng et al. | Attention-aware dual-stream network for multimodal face anti-spoofing | |
CN112906520A (zh) | 一种基于姿态编码的动作识别方法及装置 | |
CN111460416B (zh) | 一种基于微信小程序平台的人脸特征与动态属性的认证方法 | |
Chi et al. | Handwriting Recognition Based on Resnet-18 | |
CN113591692A (zh) | 一种多视图身份识别方法 | |
CN106407884A (zh) | 一种快速协同匹配的有遮挡人脸识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191115 |
|
RJ01 | Rejection of invention patent application after publication |