CN108229257A - 一种基于深度学习和Spark的人脸识别特征并行训练方法 - Google Patents

一种基于深度学习和Spark的人脸识别特征并行训练方法 Download PDF

Info

Publication number
CN108229257A
CN108229257A CN201611194178.XA CN201611194178A CN108229257A CN 108229257 A CN108229257 A CN 108229257A CN 201611194178 A CN201611194178 A CN 201611194178A CN 108229257 A CN108229257 A CN 108229257A
Authority
CN
China
Prior art keywords
face
layer
spark
deep learning
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611194178.XA
Other languages
English (en)
Inventor
田文洪
任小芹
刘弘
刘弘一
黄文强
黄超杰
何马均
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201611194178.XA priority Critical patent/CN108229257A/zh
Publication of CN108229257A publication Critical patent/CN108229257A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种将深度学习的特征提取算法在Spark平台上进行实施的方法,首先对图片集中的图片进行人脸检测,然后对人脸图片集进行特征提取,特征提取是在Spark平台上,经过一些处理之后形成RDD,接下来就运用深度学习的方法—卷积神经网络训练特征,最终得到描述的是整个人脸的全局特征。本发明加快了深度学习训练特征的过程,同时提取出的特征应用到后续的人脸识别上很大程度的减少了测试误差,达到了速度快,效果好的目的。

Description

一种基于深度学习和Spark的人脸识别特征并行训练方法
技术领域
本发明涉及计算机视觉领域,具体涉及人脸识别技术环节中的特征提取模块。
背景技术
特征提取主要是从人脸图像中提取具有判别性的特征,它是人脸识别的核心部分。特征提取的优劣会在很大程度上影响人脸识别效果,现有的方法主要包括如下四个方面:
1. 几何特征:以面部特征点之间的距离和比率作为特征,其识别速度快,对内存要求较小,对光照不太敏感。
2. 基于模型的特征提取方法:隐马尔科夫模型是一种常用的模型,根据不同特征状态所具有的概率不同而提取人脸图像特征。
3. 基于统计的特征提取方法:将人脸图像视为随机向量,并用统计方法辨别不同人脸特征模式,比较典型的有特征脸、独立成分分析、奇异值分解等。
4. 基于神经网络的特征提取方法:利用大量神经单元对人脸图像特征进行联想存储和记忆,根据不同神经单元状态的概率实现对人脸图像准确识别。
特征提取的优劣会在很大程度上影响人脸识别效果,而提取更优的特征很多时候会伴随着付出更多的时间代价,而且存在人脸图像受到光照、表情、遮挡、姿态等多种因素的影响,因此如何更快地提取出更好的特征是我们研究的核心。
发明内容
针对当前大多人脸识别算法实时性差、识别率低的问题,首先分析原因大致有以下两点:1.人脸识别过程中的特征提取模块由于计算量很大导致耗时过长;2.选取哪种特征来表征人脸以及如何提取特征对人脸识别的识别效果有很大的影响。深度学习可以针对人脸图像的分层特征表达进行:最底层从原始像素开始学习滤波器,刻画局部的边缘和纹理特征;中层滤波器通过将各种边缘滤波器进行组合,描述不同类型的人脸器官;最高层描述的是整个人脸的全局特征。深度模型的表达能力更强,效率更高。
基于上述分析,本发明实例提供了一种将深度学习的特征提取算法在Spark平台上进行实施的方法,所述方法包括以下步骤:
步骤1:首先将大量的人脸图像文件合并成少量的文件块(因为单张人脸图像太小,远小于Block的大小),然后把图片文件通过基于Spark Streaming的程序读取成数据流,重新将数据流写成图片文件并存储在HDFS(Hadoop Distribute File System)文件系统上,输入到Spark,转换为Block;
步骤2::在Spark数据输入形成RDD(Resilient Distributed Datasets)后,将原来RDD中的每个数据项使用TensorFlow框架,用于训练特征,得到一个新的RDD。框架中的神经网络结构为:输入层、2层卷积层、2层全连接层和输出层,每层卷积层后跟着一个最大池化层;
步骤3:作业开始执行,Driver接收Spark作业和数据,Master节点向Worker发送命令,最终分配Task在集群中的各节点上的Executor上执行;
步骤4:将最终结果数据输出存到HDFS,完成整个特征提取,供后续人脸识别使用。
进一步地,所述步骤1中所述的输入人脸图片部分作为输入的人脸图片应是一张大部分区域都是人脸的灰度图片,因此对于任意一张包含人脸的图片,首先需要进行人脸检测,将图片中的人脸提取出来(人脸检测的方法不是本发明重点,在此不再赘述),本发明能保证准确提取出任意图片中的人脸,并会对人脸进行对齐,使各张人脸的眼睛、嘴巴等位于图片的相同位置。
进一步地,所述步骤2中,所述的卷积神经网络详细情况是:第一层输入层就是输入Spark数据,第二层卷积层Conv1:实现卷积以及Rectified Linear Activation(需要设定),第三层池化层Pool1:Max Pooling(这里是2*2的Max_Pool),第四层归一层Norm1:局部相映归一化,第五层卷积层Conv2:实现卷积以及Rectified Linear Activation,第六层归一层Norm2:局部相映归一化,第七层池化层Pool2:Max Pooling,第八层全连接层Local3:基于修正线性激活的全连接层,第九层全连接层Local4:基于修正线性激活的全连接层,第10层输出层Softmax_Linear:进行线性变换以输出Logits,激活函数用Relu。
本发明的有益效果是:本发明提取的特征应用到之后的人脸识别上,相较提取HOG(Histogram of Oriented Gradient)特征并应用于相同分类器的人脸识别,在LFW数据库上很大程度上减少了测试误差,提高了整体速度。本发明的创新点是提出了一种新的结合Spark和深度学习的特征提取方法,深度学习方法学习得到的特征表示具有非常强的泛化能力,可以成功应用到其他数据集和任务中,例如物体的检测、跟踪和检索等。并针对当前业界缺少并行化和深度学习相结合的算法现状,本发明的核心是结合深度学习与分布式计算,最终得到表达能力更强,效率更高的人脸特征。
附图说明
图1是本发明基于深度学习和Spark的人脸识别特征并行训练方法的流程图;
图2是本发明核心步骤示意图;
图3本发明中使用到的卷积神经网络结构图;
图4本发明使用的LFW人脸库的图像示意图。
具体实施方式
下面所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替代、改进等,均应包含在本发明的保护范围之内。
本发明实例提供了一种将深度学习的特征提取算法在Spark平台上进行实施的方法,所述方法包括以下步骤:
步骤1:首先将大量的人脸图像文件合并成少量的文件块(因为单张人脸图像太小,远小于Block的大小),然后把图片文件通过基于Spark Streaming的程序读取成数据流,重新将数据流写成图片文件并存储在HDFS文件系统上,输入到Spark,转换为Block;
步骤2:: 在Spark数据输入形成RDD后,将原来RDD中的每个数据项使用TensorFlow框架,用于训练特征,得到一个新的RDD。框架中的神经网络结构为:输入层、3层卷积层、2层全连接层和输出层,每层卷积层后跟着一个最大池化层;
步骤3:作业开始执行,Driver接收Spark作业和数据,Master节点向Worker发送命令,最终分配Task在集群中的各节点上的Executor上执行;
步骤4:将最终结果数据输出存到HDFS,完成整个特征提取,供后续人脸识别使用。
进一步地,所述步骤1中所述的输入人脸图片部分作为输入的人脸图片应是一张大部分区域都是人脸的灰度图片,因此对于任意一张包含人脸的图片,首先需要进行人脸检测,将图片中的人脸提取出来(人脸检测的方法不是本发明重点,在此就不再赘述),本发明能保证准确提取出任意图片中的人脸,并会对人脸进行对齐,使各张人脸的眼睛、嘴巴等位于图片的相同位置。
进一步地,所述步骤3中,所述的卷积神经网络详细情况是:第一层输入层就是输入Spark数据,第二层卷积层Conv1:实现卷积以及Rectified Linear Activation(需要设定),第三层池化层Pool1:Max Pooling(这里是2*2的Max_Pool),第四层归一层Norm1:局部相映归一化,第五层卷积层Conv2:实现卷积以及Rectified Linear Activation,第六层归一层Norm2:局部相映归一化,第七层池化层Pool2:Max Pooling,第八层全连接层Local3:基于修正线性激活的全连接层,第九层全连接层Local4:基于修正线性激活的全连接层,第10层输出层Softmax_Linear:进行线性变换以输出Logits,激活函数用Relu。

Claims (5)

1.一种基于深度学习和Spark的人脸识别特征并行训练方法,其特征是结合Spark和深度学习的特征提取方法,深度学习方法学习得到的特征表示具有非常强的泛化能力,可以成功应用到其他数据集和任务中。
2.根据权利要求1所述的方法,其特征是本发明能保证准确提取出任意图片中的人脸,并会对人脸进行对齐,使各张人脸的眼睛、嘴巴等位于图片的相同位置。
3.根据权利要求1所述的方法,其特征是利用大量神经单元对人脸图像特征进行联想存储和记忆,根据不同神经单元状态的概率实现对人脸图像准确识别。
4.根据权利要求1所述的方法,其特征是框架中的神经网络结构为:输入层、3层卷积层、2层全连接层和输出层,每层卷积层后跟着一个最大池化层。
5.根据权利要求1所述的方法,其特征是在Spark数据输入形成RDD后,将原来RDD中的每个数据项使用TensorFlow框架,用于训练特征,最后将最终结果数据输出存到HDFS,完成整个特征提取,供后续人脸识别使用。
CN201611194178.XA 2016-12-21 2016-12-21 一种基于深度学习和Spark的人脸识别特征并行训练方法 Pending CN108229257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611194178.XA CN108229257A (zh) 2016-12-21 2016-12-21 一种基于深度学习和Spark的人脸识别特征并行训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611194178.XA CN108229257A (zh) 2016-12-21 2016-12-21 一种基于深度学习和Spark的人脸识别特征并行训练方法

Publications (1)

Publication Number Publication Date
CN108229257A true CN108229257A (zh) 2018-06-29

Family

ID=62655854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611194178.XA Pending CN108229257A (zh) 2016-12-21 2016-12-21 一种基于深度学习和Spark的人脸识别特征并行训练方法

Country Status (1)

Country Link
CN (1) CN108229257A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647545A (zh) * 2019-09-11 2020-01-03 旭辉卓越健康信息科技有限公司 一种基于Spark流式处理的人脸实时抓拍反馈系统
CN110888972A (zh) * 2019-10-27 2020-03-17 北京明朝万达科技股份有限公司 一种基于Spark Streaming的敏感内容识别方法及装置
CN111401193A (zh) * 2020-03-10 2020-07-10 海尔优家智能科技(北京)有限公司 获取表情识别模型的方法及装置、表情识别方法及装置
CN112837078A (zh) * 2021-03-03 2021-05-25 万商云集(成都)科技股份有限公司 一种基于集群的用户异常行为检测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647545A (zh) * 2019-09-11 2020-01-03 旭辉卓越健康信息科技有限公司 一种基于Spark流式处理的人脸实时抓拍反馈系统
CN110888972A (zh) * 2019-10-27 2020-03-17 北京明朝万达科技股份有限公司 一种基于Spark Streaming的敏感内容识别方法及装置
CN111401193A (zh) * 2020-03-10 2020-07-10 海尔优家智能科技(北京)有限公司 获取表情识别模型的方法及装置、表情识别方法及装置
CN111401193B (zh) * 2020-03-10 2023-11-28 海尔优家智能科技(北京)有限公司 获取表情识别模型的方法及装置、表情识别方法及装置
CN112837078A (zh) * 2021-03-03 2021-05-25 万商云集(成都)科技股份有限公司 一种基于集群的用户异常行为检测方法
CN112837078B (zh) * 2021-03-03 2023-11-03 万商云集(成都)科技股份有限公司 一种基于集群的用户异常行为检测方法

Similar Documents

Publication Publication Date Title
CN105981008B (zh) 学习深度人脸表示
Chen et al. An end-to-end system for unconstrained face verification with deep convolutional neural networks
CN105678250B (zh) 视频中的人脸识别方法和装置
US20170124409A1 (en) Cascaded neural network with scale dependent pooling for object detection
CN109359526B (zh) 一种人脸姿态估计方法、装置和设备
JP6159489B2 (ja) 顔認証方法およびシステム
CN111860171B (zh) 一种大规模遥感图像中不规则形状目标的检测方法及系统
CN108108751B (zh) 一种基于卷积多特征和深度随机森林的场景识别方法
CN110889672B (zh) 一种基于深度学习的学生打卡及上课状态的检测系统
CN102938065B (zh) 基于大规模图像数据的人脸特征提取方法及人脸识别方法
CN107871101A (zh) 一种人脸检测方法及装置
CN111046821B (zh) 一种视频行为识别方法、系统及电子设备
CN110728209A (zh) 一种姿态识别方法、装置、电子设备及存储介质
WO2016138838A1 (zh) 基于投影极速学习机的唇语识别方法和装置
CN103605972A (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN106529578A (zh) 一种基于深度学习的车辆品牌型号精细识别方法与系统
CN108229257A (zh) 一种基于深度学习和Spark的人脸识别特征并行训练方法
CN113592007B (zh) 一种基于知识蒸馏的不良图片识别系统、方法、计算机及存储介质
CN113205002B (zh) 非受限视频监控的低清人脸识别方法、装置、设备及介质
CN113011253B (zh) 基于ResNeXt网络的人脸表情识别方法、装置、设备及存储介质
CN104050460B (zh) 多特征融合的行人检测方法
CN108961358A (zh) 一种获得样本图片的方法、装置及电子设备
An Pedestrian re-recognition algorithm based on optimization deep learning-sequence memory model
CN114155572A (zh) 一种面部表情识别方法和系统
CN111881803B (zh) 一种基于改进YOLOv3的畜脸识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180629

WD01 Invention patent application deemed withdrawn after publication