CN107808120A - 眼镜定位方法、装置及存储介质 - Google Patents

眼镜定位方法、装置及存储介质 Download PDF

Info

Publication number
CN107808120A
CN107808120A CN201710915085.XA CN201710915085A CN107808120A CN 107808120 A CN107808120 A CN 107808120A CN 201710915085 A CN201710915085 A CN 201710915085A CN 107808120 A CN107808120 A CN 107808120A
Authority
CN
China
Prior art keywords
glasses
samples pictures
grader
training
eye positions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710915085.XA
Other languages
English (en)
Other versions
CN107808120B (zh
Inventor
戴磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201710915085.XA priority Critical patent/CN107808120B/zh
Priority to PCT/CN2017/108756 priority patent/WO2019061658A1/zh
Priority to US16/337,938 priority patent/US10635946B2/en
Publication of CN107808120A publication Critical patent/CN107808120A/zh
Application granted granted Critical
Publication of CN107808120B publication Critical patent/CN107808120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种眼镜定位方法,该方法包括:获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及,当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。本发明采用两个分类器对人脸图像中的眼镜区域图像进行检测,提高眼镜检测的精度和准确度。本发明还提供一种电子装置及一种计算机可读存储介质。

Description

眼镜定位方法、装置及存储介质
技术领域
本发明涉及计算机视觉处理技术领域,尤其涉及一种眼镜定位方法、电子装置及计算机可读存储介质。
背景技术
在人脸识别领域,由于很多人戴眼镜,尤其是戴深框眼镜,导致在人脸识别时,带深框眼镜的人脸图像相似度较高,无法进行准确的人脸识别。目前业内采用的方法,是先去除人脸图像中的眼镜区域之后,再对去除眼镜区域之后的人脸图像进行识别。然而,这种方法的关键在于如何准确的确定人脸图像中的眼镜区域。
由于受眼镜形状的多样性及图像质量等因素的影响,眼镜检测存在许多难点。例如,早期的眼镜检测主要采用图像处理和模板匹配的方法,根据像素灰度值的不连续变化来检测眼镜的下边框和眼镜鼻梁,然后通过两眼之间区域的边缘信息来检测眼镜;后期的眼镜检测主要使用三维霍夫(Hough)变换方法检测眼镜。但是,由于不同光线的影响,成像后通过图像处理和Hough方法得到的图像过度依赖于图像边缘,故存在噪声,且噪声干扰会导致经常无法获得特征点或准确的特征点,因此检测的准确率比较低。
发明内容
本发明提供一种眼镜定位方法、电子装置及计算机可读存储介质,其主要目的在于提高人脸图像中眼镜定位的准确度。
为实现上述目的,本发明提供一种电子装置,该装置包括:存储器、处理器及摄像装置,所述存储器中包括眼镜定位程序,所述眼镜定位程序被所述处理器执行时实现如下步骤:
获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
此外,为实现上述目的,本发明还提供一种眼镜定位方法,该方法包括:
获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中包括眼镜定位程序,所述眼镜定位程序被处理器执行时,实现如上所述的眼镜定位方法中的任意步骤。
本发明提出的眼镜定位方法、电子装置及计算机可读存储介质,首先通过第一分类器判断人脸图像中是否包含眼镜,然后,将包含眼镜的人脸图像输入第二分类器,以确定人脸图像中的眼镜位置。本发明采用两个分类器对人脸图像中的眼镜区域图像进行检测,不依赖于图像边缘,从而提高眼镜检测的精度和准确度。
附图说明
图1为本发明电子装置较佳实施例的硬件示意图;
图2为图1中眼镜定位程序较佳实施例的模块示意图;
图3为本发明眼镜定位方法较佳实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种电子装置1。参照图1所示,为本发明电子装置较佳实施例的硬件示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。
在本实施例中,电子装置1可以是安装有眼镜定位程序的服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备,所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器。
该电子装置1包括:存储器11、处理器12、摄像装置13、网络接口14及通信总线15。
其中,存储器11至少包括一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,存储器11可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。在另一些实施例中,存储器11也可以是所述电子装置1的外部存储设备,例如所述电子装置1上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
在本实施例中,所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的眼镜定位程序10、预先确定的第一分类器、第二分类器的模型文件及各类数据等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行眼镜定位程序10等。
摄像装置13既可以是所述电子装置1的一部分,也可以独立于电子装置1。在一些实施例中,所述电子装置1为智能手机、平板电脑、便携计算机等具有摄像头的终端设备,则所述摄像装置13即为所述电子装置1的摄像头。在其他实施例中,所述电子装置1可以为服务器,所述摄像装置13独立于该电子装置1、与该电子装置1通过网络连接,例如,该摄像装置13安装于特定场所,如办公场所、监控区域,对进入该特定场所的目标实时拍摄得到实时图像,通过网络将拍摄得到的实时图像传输至处理器12。
网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备之间建立通信连接。
通信总线15用于实现这些组件之间的连接通信。
图1仅示出了具有组件11-15的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括输入单元比如键盘(Keyboard)等,可选地用户接口还可以包括标准的有线接口、无线接口。
可选地,该电子装置1还可以包括显示器,显示器也可以适当的称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
可选地,该电子装置1还可以包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外,这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且,所述触摸传感器不仅包括接触式的触摸传感器,也可包括接近式的触摸传感器等。此外,所述触摸传感器可以为单个传感器,也可以为例如阵列布置的多个传感器。
此外,该电子装置1的显示器的面积可以与所述触摸传感器的面积相同,也可以不同。可选地,将显示器与所述触摸传感器层叠设置,以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。
可选地,该电子装置1还可以包括RF(Radio Frequency,射频)电路,传感器、音频电路等等,在此不再赘述。
在图1所示的装置实施例中,作为一种计算机存储介质的存储器11中存储有眼镜定位程序10,处理器12执行存储器11中存储的眼镜定位程序10时实现如下步骤:
获取摄像装置13拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
当摄像装置13拍摄到一张实时图像,摄像装置13将这张实时图像发送到处理器12,处理器12接收到该实时图像并获取实时图像的大小,建立一个相同大小的灰度图像,将获取的彩色图像,转换成灰度图像,同时创建一个内存空间;将灰度图像直方图均衡化,使灰度图像信息量减少,加快检测速度,然后加载训练库,检测图片中的人脸,并返回一个包含人脸信息的对象,获得人脸所在位置的数据,并记录个数;最终获取脸部的区域且保存下来,这样就完成了一次脸部图像提取的过程。具体地,从该实时图像中提取脸部图像的人脸识别算法可以为基于几何特征的方法、局部特征分析方法、特征脸方法、基于弹性模型的方法、神经网络方法,等等。
接下来,将利用人脸识别算法提取的脸部图像输入预先确定的第一分类器,判断该脸部图像中是否包含眼镜,其中,所述预先确定的第一分类器的训练步骤包括:
分别准备一定数量的包含眼镜和不包含眼镜的人脸图片作为样本图片并形成第一样本集,并根据样本图片中是否包含眼镜,为每张样本图片进行分类标记,包含眼镜的样本图片标注“有眼镜”或“1”,不包含眼镜的样本图片标注“没有眼镜”或“0”;从进行样本分类标记后的第一样本集中随机抽取第一比例(例如,50%)的样本图片作为训练集,从剩下的第一样本集中随机抽取第二比例的样本图片作为验证集,例如50%,即第一样本集中的25%的样本图片作为验证集,利用所述训练集训练卷积神经网络,得到所述第一分类器;为了保证第一分类器的准确率,需对第一分类器的准确率进行验证,利用所述验证集验证训练的所述第一分类器的准确率,若准确率大于或者等于预设准确率,则训练结束,或者,若准确率小于预设准确率,则增加样本集中的样本图片数量并重新执行上述步骤。
需要说明的是,所述预先确定的第一分类器的训练步骤还包括:对第一样本集中的样本图片进行预处理如缩放、裁剪、翻转及/或扭曲等操作,利用经过预处理后的样本图片对卷积神经网络进行训练,有效提高模型训练的真实性及准确率。
例如在一种实施方式中,对每张样本图片进行图片预处理可以包括:
将每张样本图片的较短边长缩放到第一预设大小(例如,640像素)以获得对应的第一图片,在各张第一图片上随机裁剪出一个第二预设大小的第二图片,例如256*256像素的第二图片;
根据各个预先确定的预设类型参数,例如颜色、亮度及/或对比度等对应的标准参数值,例如,颜色对应的标准参数值为a1,亮度对应的标准参数值为a2,对比度对应的标准参数值为a3,将各张第二图片的各个预先确定的预设类型参数值调整为对应的标准参数值,获得对应的第三图片,以消除样本图片在拍摄时外界条件导致的图片不清晰,提高模型训练的有效性;
对各张第三图片进行预设方向(例如,水平和垂直方向)的翻转,及按照预设的扭曲角度(例如,30度)对各张第三图片进行扭曲操作,获得各张第三图片对应的第四图片,各张第四图片即为对应的样本图片的训练图片。其中,翻转和扭曲操作的作用是模拟实际业务场景下各种形式的图片,通过这些翻转和扭曲操作可以增大数据集的规模,从而提高模型训练的真实性和实用性。
假设通过以上步骤训练得到的第一分类器判断人脸图像中包含眼镜,则将该人脸图像输入预先确定的第二分类器中,对该人脸图像中的眼镜区域进行定位,并输出该人脸图像中的眼镜定位结果。可以理解的是,若第一分类器输出的判断结果中,该人脸图像中不包含眼镜区域,则重新获取摄像装置13拍摄到的实时图像,并进行后续步骤。
需要说明的是,所述预先确定的第二分类器的获取过程如下:准备预设数量张“有眼镜”的样本图片形成第二样本集,在其他实施例中,也可以利用第一样本集中标注有“有眼镜”或“1”的样本图片。为了简化后续计算,对每张样本图片进行图片预处理,具体地,所述预处理步骤包括:将第二样本集中的样本图片从彩色图像转为灰度图像,再将灰度图像中像素点的像素值分别除以255,将各像素点的像素值的范围从0-255规范到0-1之间;在经过上述预处理后的样本图片中的眼镜位置标记预设数量的标记点,例如,在每张样本图片中的眼镜镜框上标记8个特征点:上、下框沿分别均匀标记3个特征点,左、右框沿分别标记1个特征点。
假设第二样本集中有m张样本图片,分别将每张样本图片中代表眼镜位置的预设数量的标记点组合成一个向量,以其中一张样本图片的向量为基准向量,将其余的m-1张样本图片的向量与该基准向量对齐,得到关于眼镜位置的第一平均模型;对关于眼镜位置的第一平均模型通过主成分分析法(Principal Components Analysis,简称PCA)进行降维处理,得到关于眼镜位置的第二平均模型,上述对齐和降维为本领域人员习知技术,这里不进行说明。
利用特征提取算法从第二平均模型中提取每个标记点的局部特征,例如,HOG特征,将关于眼镜位置的第二平均模型及其每个标记点的局部特征作为第二分类器。在本实施例中,所述特征提取算法为SIFT(scale-invariant feature transform)算法,SIFT算法从第二平均模型中提取每个特征点的局部特征,选择一个特征点为参考特征点,并查找与该参考特征点的局部特征相同或相似的特征点(例如,两个特征点的局部特征的差值在预设范围内),依此原理直到查找出所有嘴唇特征点。在其他实施例中,该特征提取算法还可以为SURF(Speeded Up Robust Features)算法,LBP(Local Binary Patterns)算法,HOG(Histogram of Oriented Gridients)算法等。
本实施例提出的电子装置1,首先通过第一分类器判断人脸图像中是否包含眼镜,然后,将包含眼镜的人脸图像输入第二分类器,以确定人脸图像中的眼镜位置。本发明采用两个分类器对人脸图像中的眼镜区域图像进行检测,从而提高眼镜检测的精度和准确度。
在其他实施例中,眼镜定位程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由处理器12执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图2所示,为图1中眼镜定位程序10的模块示意图。所述眼镜定位程序10可以被分割为:获取模块110、判断模块120及定位模块130,所述模块110-130所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
获取模块110,用于获取摄像装置13拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
判断模块120,用于利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
定位模块130,用于当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
此外,本发明还提供一种眼镜定位方法。参照图3所示,为本发明眼镜定位方法第一实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,眼镜定位方法包括步骤S10-S30:
步骤S10,获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
步骤S20,利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
步骤S30,当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
当摄像装置拍摄到一张实时图像,摄像装置将这张实时图像发送到处理器,处理器接收到该实时图像并获取实时图像的大小,建立一个相同大小的灰度图像,将获取的彩色图像,转换成灰度图像,同时创建一个内存空间;将灰度图像直方图均衡化,使灰度图像信息量减少,加快检测速度,然后加载训练库,检测图片中的人脸,并返回一个包含人脸信息的对象,获得人脸所在位置的数据,并记录个数;最终获取脸部的区域且保存下来,这样就完成了一次脸部图像提取的过程。具体地,从该实时图像中提取脸部图像的人脸识别算法可以为基于几何特征的方法、局部特征分析方法、特征脸方法、基于弹性模型的方法、神经网络方法,等等。
接下来,将利用人脸识别算法提取的脸部图像输入预先确定的第一分类器,判断该脸部图像中是否包含眼镜,其中,所述预先确定的第一分类器的训练步骤包括:
分别准备一定数量的包含眼镜和不包含眼镜的人脸图片作为样本图片并形成第一样本集,并根据样本图片中是否包含眼镜,为每张样本图片进行分类标记,包含眼镜的样本图片标注“有眼镜”或“1”,不包含眼镜的样本图片标注“没有眼镜”或“0”;从进行样本分类标记后的第一样本集中随机抽取第一比例(例如,50%)的样本图片作为训练集,从剩下的第一样本集中随机抽取第二比例的样本图片作为验证集,例如50%,即第一样本集中的25%的样本图片作为验证集,利用所述训练集训练卷积神经网络,得到所述第一分类器;为了保证第一分类器的准确率,需对第一分类器的准确率进行验证,利用所述验证集验证训练的所述第一分类器的准确率,若准确率大于或者等于预设准确率,则训练结束,或者,若准确率小于预设准确率,则增加样本集中的样本图片数量并重新执行上述步骤。
需要说明的是,所述预先确定的第一分类器的训练步骤还包括:对第一样本集中的样本图片进行预处理如缩放、裁剪、翻转及/或扭曲等操作,利用经过预处理后的样本图片对卷积神经网络进行训练,有效提高模型训练的真实性及准确率。
例如在一种实施方式中,对每张样本图片进行图片预处理可以包括:
将每张样本图片的较短边长缩放到第一预设大小(例如,640像素)以获得对应的第一图片,在各张第一图片上随机裁剪出一个第二预设大小的第二图片,例如256*256像素的第二图片;
根据各个预先确定的预设类型参数,例如颜色、亮度及/或对比度等对应的标准参数值,例如,颜色对应的标准参数值为a1,亮度对应的标准参数值为a2,对比度对应的标准参数值为a3,将各张第二图片的各个预先确定的预设类型参数值调整为对应的标准参数值,获得对应的第三图片,以消除样本图片在拍摄时外界条件导致的图片不清晰,提高模型训练的有效性;
对各张第三图片进行预设方向(例如,水平和垂直方向)的翻转,及按照预设的扭曲角度(例如,30度)对各张第三图片进行扭曲操作,获得各张第三图片对应的第四图片,各张第四图片即为对应的样本图片的训练图片。其中,翻转和扭曲操作的作用是模拟实际业务场景下各种形式的图片,通过这些翻转和扭曲操作可以增大数据集的规模,从而提高模型训练的真实性和实用性。
假设通过以上步骤训练得到的第一分类器判断人脸图像中包含眼镜,则将该人脸图像输入预先确定的第二分类器中,对该人脸图像中的眼镜区域进行定位,并输出该人脸图像中的眼镜定位结果。可以理解的是,若第一分类器输出的判断结果中,该人脸图像中不包含眼镜区域,则重新获取摄像装置13拍摄到的实时图像,并进行后续步骤。
需要说明的是,所述预先确定的第二分类器的获取过程如下:准备预设数量张“有眼镜”的样本图片形成第二样本集,在其他实施例中,也可以利用第一样本集中标注有“有眼镜”或“1”的样本图片。为了简化后续计算,对每张样本图片进行图片预处理,具体地,所述预处理步骤包括:将第二样本集中的样本图片从彩色图像转为灰度图像,再将灰度图像中像素点的像素值分别除以255,将各像素点的像素值的范围从0-255规范到0-1之间;在经过上述预处理后的样本图片中的眼镜位置标记预设数量的标记点,例如,在每张样本图片中的眼镜镜框上标记8个特征点:上、下框沿分别均匀标记3个特征点,左、右框沿分别标记1个特征点。
假设第二样本集中有m张样本图片,分别将每张样本图片中代表眼镜位置的预设数量的标记点组合成一个向量,以其中一张样本图片的向量为基准向量,将其余的m-1张样本图片的向量与该基准向量对齐,得到关于眼镜位置的第一平均模型;对关于眼镜位置的第一平均模型进行PCA降维处理,得到关于眼镜位置的第二平均模型。
利用特征提取算法从第二平均模型中提取每个标记点的局部特征,例如,HOG特征,将关于眼镜位置的第二平均型及其每个标记点的局部特征作为第二分类器。所述特征提取算法为SIFT算法,SIFT算法从第二平均模型中提取每个特征点的局部特征,选择一个特征点为参考特征点,并查找与该参考特征点的局部特征相同或相似的特征点(例如,两个特征点的局部特征的差值在预设范围内),依此原理直到查找出所有嘴唇特征点。在其他实施例中,该特征提取算法还可以为SURF算法,LBP算法,HOG算法等。
本实施例提出的眼镜定位方法,首先,利用第一分类器判断人脸图像中是否包含眼镜,然后,将包含眼镜的人脸图像输入第二分类器,以确定人脸图像中的眼镜位置。本发明采用两个分类器对人脸图像中的眼镜区域图像进行检测,不依赖于图像边缘,从而提高眼镜检测的精度和准确度。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质中包括眼镜定位程序,所述眼镜定位程序被处理器执行时实现如下操作:
获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
优选地,所述预先确定的第一分类器的训练过程如下:
分别准备包含眼镜和不包含眼镜的样本图片,根据样本图片中是否包含眼镜,对每个样本图片进行分类标记;
将分类标记后的样本图片分为第一比例的训练集和第二比例的验证集;
利用所述训练集训练卷积神经网络,得到所述第一分类器;及
利用所述验证集验证训练的所述第一分类器的准确率,若准确率大于或者等于预设准确率,则训练结束,或者,若准确率小于预设准确率,则增加样本图片数量并重新执行训练步骤。
优选地,所述预先确定的第二分类器的获取过程如下:
对包含眼镜的样本图片进行预处理,在预处理后的样本图片中的眼镜位置标记预设数量的标记点;
将每张样本图片中代表眼镜位置的预设数量的标记点组合成一个向量,以其中一张样本图片的向量为基准向量,将其它所有样本图片的向量与该基准向量对齐,得到关于眼镜位置的第一平均模型;
对关于眼镜位置的第一平均模型进行降维处理得到关于眼镜位置的第二平均模型;及
从第二平均模型中提取每个标记点的局部特征,将关于眼镜位置的第二平均模型及其每个标记点的局部特征作为第二分类器。
本发明之计算机可读存储介质的具体实施方式与上述眼镜定位方法的具体实施方式大致相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种眼镜定位方法,应用于一种电子装置,其特征在于,该方法包括:
获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
2.如权利要求1所述的眼镜定位方法,其特征在于,所述预先确定的第一分类器的训练过程如下:
分别准备包含眼镜和不包含眼镜的样本图片,根据样本图片中是否包含眼镜,对每个样本图片进行分类标记;
将分类标记后的样本图片分为第一比例的训练集和第二比例的验证集;
利用所述训练集训练卷积神经网络,得到所述第一分类器;及
利用所述验证集验证训练的所述第一分类器的准确率,若准确率大于或者等于预设准确率,则训练结束,或者,若准确率小于预设准确率,则增加样本图片数量并重新执行训练步骤。
3.如权利要求1或2所述的眼镜定位方法,其特征在于,所述预先确定的第二分类器的获取过程如下:
对包含眼镜的样本图片进行预处理,在预处理后的样本图片中的眼镜位置标记预设数量的标记点;
将每张样本图片中代表眼镜位置的预设数量的标记点组合成一个向量,以其中一张样本图片的向量为基准向量,将其它所有样本图片的向量与该基准向量对齐,得到关于眼镜位置的第一平均模型;
对关于眼镜位置的第一平均模型进行降维处理得到关于眼镜位置的第二平均模型;及
从第二平均模型中提取每个标记点的局部特征,将关于眼镜位置的第二平均模型及其每个标记点的局部特征作为第二分类器。
4.如权利要求3所述的眼镜定位方法,其特征在于,所述对每张样本图片进行预处理的步骤包括:
将每张样本图片转为灰度图像,读取灰度图像中各像素点的像素值,分别除以255,将灰度图像中各像素点的像素值规范化。
5.如权利要求1所述的眼镜定位方法,其特征在于,所述人脸识别算法可以为基于几何特征的方法、局部特征分析方法、特征脸方法、基于弹性模型的方法及神经网络方法。
6.一种电子装置,其特征在于,该电子装置包括:存储器、处理器,所述存储器上存储有眼镜定位程序,所述眼镜定位程序被所述处理器执行时实现如下步骤:
获取摄像装置拍摄到的一张实时图像,利用人脸识别算法从该实时图像中提取一张实时脸部图像;
利用预先确定的第一分类器识别该实时脸部图像中是否包含眼镜,并输出识别结果;及
当识别结果为该实时脸部图像中包含眼镜时,利用预先确定的第二分类器对该实时脸部图像中的眼镜位置进行定位,并输出定位结果。
7.如权利要求6所述的电子装置,其特征在于,所述预先确定的第一分类器的训练过程如下:
分别准备包含眼镜和不包含眼镜的样本图片,根据样本图片中是否包含眼镜,对每个样本图片进行分类标记;
将分类标记后的样本图片分为第一比例的训练集和第二比例的验证集;
利用所述训练集训练卷积神经网络,得到所述第一分类器;及
利用所述验证集验证训练的所述第一分类器的准确率,若准确率大于或者等于预设准确率,则训练结束,或者,若准确率小于预设准确率,则增加样本图片数量并重新执行训练步骤。
8.如权利要求6或7所述的电子装置,其特征在于,所述预先确定的第二分类器的获取过程如下:
对包含眼镜的样本图片进行预处理,在预处理后的样本图片中的眼镜位置标记预设数量的标记点;
将每张样本图片中代表眼镜位置的预设数量的标记点组合成一个向量,以其中一张样本图片的向量为基准向量,将其它所有样本图片的向量与该基准向量对齐,得到关于眼镜位置的第一平均模型;
对关于眼镜位置的第一平均模型进行降维处理得到关于眼镜位置的第二平均模型;及
从第二平均模型中提取每个标记点的局部特征,将关于眼镜位置的第二平均模型及其每个标记点的局部特征作为第二分类器。
9.如权利要求8所述的电子装置,其特征在于,所述对每张样本图片进行图片预处理的步骤包括:
将每张样本图片转为灰度图像,读取灰度图像中各像素点的像素值,分别除以255,将灰度图像中各像素点的像素值规范化。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括眼镜定位程序,所述眼镜定位程序被处理器执行时,实现如权利要求1至5中任一项所述的眼镜定位方法的步骤。
CN201710915085.XA 2017-09-30 2017-09-30 眼镜定位方法、装置及存储介质 Active CN107808120B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201710915085.XA CN107808120B (zh) 2017-09-30 2017-09-30 眼镜定位方法、装置及存储介质
PCT/CN2017/108756 WO2019061658A1 (zh) 2017-09-30 2017-10-31 眼镜定位方法、装置及存储介质
US16/337,938 US10635946B2 (en) 2017-09-30 2017-10-31 Eyeglass positioning method, apparatus and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710915085.XA CN107808120B (zh) 2017-09-30 2017-09-30 眼镜定位方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN107808120A true CN107808120A (zh) 2018-03-16
CN107808120B CN107808120B (zh) 2018-08-31

Family

ID=61592052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710915085.XA Active CN107808120B (zh) 2017-09-30 2017-09-30 眼镜定位方法、装置及存储介质

Country Status (3)

Country Link
US (1) US10635946B2 (zh)
CN (1) CN107808120B (zh)
WO (1) WO2019061658A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830062A (zh) * 2018-05-29 2018-11-16 努比亚技术有限公司 人脸识别方法、移动终端及计算机可读存储介质
CN109345553A (zh) * 2018-08-31 2019-02-15 厦门中控智慧信息技术有限公司 一种手掌及其关键点检测方法、装置和终端设备
CN110334698A (zh) * 2019-08-30 2019-10-15 上海聚虹光电科技有限公司 眼镜检测系统及方法
WO2020015477A1 (zh) * 2018-07-16 2020-01-23 阿里巴巴集团控股有限公司 一种人脸识别方法及终端设备
CN111008569A (zh) * 2019-11-08 2020-04-14 浙江工业大学 一种基于人脸语义特征约束卷积网络的眼镜检测方法
CN111382651A (zh) * 2018-12-29 2020-07-07 杭州光启人工智能研究院 数据打标方法、计算机装置及计算机可读存储介质
CN111474901A (zh) * 2019-12-18 2020-07-31 李峻 自动化电子设备联动系统及方法
CN111814815A (zh) * 2019-04-11 2020-10-23 苏州工其器智能科技有限公司 一种基于轻量级神经网络的眼镜放置状态的智能判别方法
CN111881770A (zh) * 2020-07-06 2020-11-03 上海序言泽网络科技有限公司 一种人脸识别方法及系统
CN112101261A (zh) * 2020-09-22 2020-12-18 北京百度网讯科技有限公司 人脸识别方法、装置、设备及存储介质
CN112418138A (zh) * 2020-12-04 2021-02-26 兰州大学 一种眼镜试戴系统及程序
CN112825115A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 基于单目图像的眼镜检测方法、装置、存储介质及设备
CN113449740A (zh) * 2021-06-30 2021-09-28 上海宇仓智能仓储设备有限公司 移动货架的通道视觉检测方法、系统、设备和存储介质
CN111881770B (zh) * 2020-07-06 2024-05-31 上海序言泽网络科技有限公司 一种人脸识别方法及系统

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564035B (zh) * 2018-04-13 2020-09-25 杭州睿琪软件有限公司 识别单据上记载的信息的方法及系统
CN111429409A (zh) * 2020-03-13 2020-07-17 深圳市雄帝科技股份有限公司 对图像中人物佩戴眼镜的识别方法、系统及其存储介质
CN112926439A (zh) * 2021-02-22 2021-06-08 深圳中科飞测科技股份有限公司 检测方法及装置、检测设备和存储介质
US20220343690A1 (en) * 2021-04-21 2022-10-27 Tascent, Inc. Thermal based presentation attack detection for biometric systems
EP4224432A1 (en) * 2022-02-04 2023-08-09 Carl Zeiss Vision International GmbH Device, system and method for spectacle frame identification

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163288A (zh) * 2011-04-06 2011-08-24 北京中星微电子有限公司 眼镜检测方法和装置
CN103093210A (zh) * 2013-01-24 2013-05-08 北京天诚盛业科技有限公司 人脸识别中眼镜的鉴别方法及装置
US20150186426A1 (en) * 2013-12-30 2015-07-02 Kt Corporation Searching information using smart glasses
CN105205482A (zh) * 2015-11-03 2015-12-30 北京英梅吉科技有限公司 快速人脸特征识别及姿态估算方法
US9230180B2 (en) * 2013-01-18 2016-01-05 GM Global Technology Operations LLC Eyes-off-the-road classification with glasses classifier
US20160055371A1 (en) * 2014-08-21 2016-02-25 Coretronic Corporation Smart glasses and method for recognizing and prompting face using smart glasses
CN105426963A (zh) * 2015-12-01 2016-03-23 北京天诚盛业科技有限公司 用于人脸识别的卷积神经网络的训练方法、装置及应用
CN106778451A (zh) * 2015-11-20 2017-05-31 懒虫(天津)科技有限公司 一种面部识别的眼镜检测方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6714665B1 (en) * 1994-09-02 2004-03-30 Sarnoff Corporation Fully automated iris recognition system utilizing wide and narrow fields of view
US9129505B2 (en) * 1995-06-07 2015-09-08 American Vehicular Sciences Llc Driver fatigue monitoring system and method
RU2007102021A (ru) * 2007-01-19 2008-07-27 Корпораци "Самсунг Электроникс Ко., Лтд." (KR) Способ и система распознавания личности
US9111147B2 (en) * 2011-11-14 2015-08-18 Massachusetts Institute Of Technology Assisted video surveillance of persons-of-interest
CN103093215B (zh) * 2013-02-01 2016-12-28 北京天诚盛业科技有限公司 人眼定位方法及装置
CN105095841A (zh) * 2014-05-22 2015-11-25 小米科技有限责任公司 生成眼镜的方法及装置
CN104408426B (zh) * 2014-11-27 2018-07-24 小米科技有限责任公司 人脸图像眼镜去除方法及装置
WO2016109884A1 (en) * 2015-01-05 2016-07-14 Valorbec Limited Partnership Automated recommendation and virtualization systems and methods for e-commerce
KR102492318B1 (ko) * 2015-09-18 2023-01-26 삼성전자주식회사 모델 학습 방법 및 장치, 및 데이터 인식 방법
CN106778453B (zh) * 2015-11-25 2020-05-12 腾讯科技(深圳)有限公司 人脸图像中检测眼镜佩戴的方法及装置
US9779492B1 (en) * 2016-03-15 2017-10-03 International Business Machines Corporation Retinal image quality assessment, error identification and automatic quality correction
FR3053509B1 (fr) * 2016-06-30 2019-08-16 Fittingbox Procede d’occultation d’un objet dans une image ou une video et procede de realite augmentee associe
CN106407911A (zh) * 2016-08-31 2017-02-15 乐视控股(北京)有限公司 基于图像的眼镜识别方法及装置
CN110678875B (zh) * 2017-05-31 2023-07-11 宝洁公司 用于引导用户拍摄自拍照的系统和方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163288A (zh) * 2011-04-06 2011-08-24 北京中星微电子有限公司 眼镜检测方法和装置
US9230180B2 (en) * 2013-01-18 2016-01-05 GM Global Technology Operations LLC Eyes-off-the-road classification with glasses classifier
CN103093210A (zh) * 2013-01-24 2013-05-08 北京天诚盛业科技有限公司 人脸识别中眼镜的鉴别方法及装置
US20150186426A1 (en) * 2013-12-30 2015-07-02 Kt Corporation Searching information using smart glasses
US20160055371A1 (en) * 2014-08-21 2016-02-25 Coretronic Corporation Smart glasses and method for recognizing and prompting face using smart glasses
CN105205482A (zh) * 2015-11-03 2015-12-30 北京英梅吉科技有限公司 快速人脸特征识别及姿态估算方法
CN106778451A (zh) * 2015-11-20 2017-05-31 懒虫(天津)科技有限公司 一种面部识别的眼镜检测方法
CN105426963A (zh) * 2015-12-01 2016-03-23 北京天诚盛业科技有限公司 用于人脸识别的卷积神经网络的训练方法、装置及应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
栾悉道等: "《多媒体情报处理技术》", 31 May 2016 *
田捷等: "《生物特征识别理论与应用》", 31 March 2009 *
邱建华等: "《生物特征识别 身份认证的革命》", 31 January 2016 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830062A (zh) * 2018-05-29 2018-11-16 努比亚技术有限公司 人脸识别方法、移动终端及计算机可读存储介质
WO2020015477A1 (zh) * 2018-07-16 2020-01-23 阿里巴巴集团控股有限公司 一种人脸识别方法及终端设备
CN109345553A (zh) * 2018-08-31 2019-02-15 厦门中控智慧信息技术有限公司 一种手掌及其关键点检测方法、装置和终端设备
CN111382651A (zh) * 2018-12-29 2020-07-07 杭州光启人工智能研究院 数据打标方法、计算机装置及计算机可读存储介质
CN111814815A (zh) * 2019-04-11 2020-10-23 苏州工其器智能科技有限公司 一种基于轻量级神经网络的眼镜放置状态的智能判别方法
CN111814815B (zh) * 2019-04-11 2023-08-22 浙江快奇控股有限公司 一种基于轻量级神经网络的眼镜放置状态的智能判别方法
CN110334698A (zh) * 2019-08-30 2019-10-15 上海聚虹光电科技有限公司 眼镜检测系统及方法
CN111008569A (zh) * 2019-11-08 2020-04-14 浙江工业大学 一种基于人脸语义特征约束卷积网络的眼镜检测方法
CN112825115A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 基于单目图像的眼镜检测方法、装置、存储介质及设备
CN111474901A (zh) * 2019-12-18 2020-07-31 李峻 自动化电子设备联动系统及方法
CN111881770A (zh) * 2020-07-06 2020-11-03 上海序言泽网络科技有限公司 一种人脸识别方法及系统
CN111881770B (zh) * 2020-07-06 2024-05-31 上海序言泽网络科技有限公司 一种人脸识别方法及系统
CN112101261A (zh) * 2020-09-22 2020-12-18 北京百度网讯科技有限公司 人脸识别方法、装置、设备及存储介质
CN112101261B (zh) * 2020-09-22 2023-12-26 北京百度网讯科技有限公司 人脸识别方法、装置、设备及存储介质
CN112418138A (zh) * 2020-12-04 2021-02-26 兰州大学 一种眼镜试戴系统及程序
CN112418138B (zh) * 2020-12-04 2022-08-19 兰州大学 一种眼镜试戴系统
CN113449740A (zh) * 2021-06-30 2021-09-28 上海宇仓智能仓储设备有限公司 移动货架的通道视觉检测方法、系统、设备和存储介质

Also Published As

Publication number Publication date
US10635946B2 (en) 2020-04-28
US20190362193A1 (en) 2019-11-28
CN107808120B (zh) 2018-08-31
WO2019061658A1 (zh) 2019-04-04

Similar Documents

Publication Publication Date Title
CN107808120B (zh) 眼镜定位方法、装置及存储介质
CN107679448B (zh) 眼球动作分析方法、装置及存储介质
CN110738101B (zh) 行为识别方法、装置及计算机可读存储介质
Kim et al. Salient region detection via high-dimensional color transform
CN107358149B (zh) 一种人体姿态检测方法和装置
CN107977633A (zh) 人脸图像的年龄识别方法、装置及存储介质
US10445569B1 (en) Combination of heterogeneous recognizer for image-based character recognition
US8792722B2 (en) Hand gesture detection
CN107633205B (zh) 嘴唇动作分析方法、装置及存储介质
CN108549870A (zh) 一种对物品陈列进行鉴别的方法及装置
US9575566B2 (en) Technologies for robust two-dimensional gesture recognition
CN107679447A (zh) 面部特征点检测方法、装置及存储介质
CN107679449B (zh) 嘴唇动作捕捉方法、装置及存储介质
CN107633206B (zh) 眼球动作捕捉方法、装置及存储介质
CN109670383B (zh) 视频遮蔽区域选取方法、装置、电子设备及系统
CN111626163B (zh) 一种人脸活体检测方法、装置及计算机设备
CN110222582B (zh) 一种图像处理方法和相机
CN103996052A (zh) 基于三维点云的三维人脸性别分类装置及方法
CN111445459A (zh) 一种基于深度孪生网络的图像缺陷检测方法及系统
CN109376717A (zh) 人脸对比的身份识别方法、装置、电子设备及存储介质
CN107918767A (zh) 目标检测方法、装置、电子设备及计算机可读介质
CN113449704B (zh) 人脸识别模型训练方法、装置、电子设备及存储介质
CN111784675A (zh) 物品纹理信息处理的方法、装置、存储介质及电子设备
CN110175500B (zh) 指静脉比对方法、装置、计算机设备及存储介质
de Santos-Sierra et al. Low computational cost multilayer graph-based segmentation algorithms for hand recognition on mobile phones

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1247372

Country of ref document: HK