CN112329546A - 一种基于深度学习的眼睛高度测量方法 - Google Patents

一种基于深度学习的眼睛高度测量方法 Download PDF

Info

Publication number
CN112329546A
CN112329546A CN202011102430.6A CN202011102430A CN112329546A CN 112329546 A CN112329546 A CN 112329546A CN 202011102430 A CN202011102430 A CN 202011102430A CN 112329546 A CN112329546 A CN 112329546A
Authority
CN
China
Prior art keywords
eye
neural network
image
network model
contour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011102430.6A
Other languages
English (en)
Inventor
岳雪颖
田泽坤
孙玲玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202011102430.6A priority Critical patent/CN112329546A/zh
Publication of CN112329546A publication Critical patent/CN112329546A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/19Sensors therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/193Preprocessing; Feature extraction

Abstract

本发明公开了一种基于深度学习的眼睛高度测量方法,具体包括数据预处理,根据不同的神经网络重设数据集中图片的像素;图像分割,将图片输入神经网络中,分割得到仅包括眼睛部分的图像;眼部图像处理,检测提取眼部图像中的眼部轮廓线,分别通过作最小外接矩形与中垂线交点距离的方法,得到眼睛高度;最后输出结果,求取两个网络得到眼睛高度的平均值,作为最后的结果。与现有技术相比,本发明具有操作方便、过程简单、结果准确的优点,可以广泛应用于需要进行眼部外观整形手术的术前资料采集中,并且经过神经网络分割后的图像数据仅包含用户眼睛部分的图像,去除了其他面部特征,具有一定的安全性,可以保障用户隐私。

Description

一种基于深度学习的眼睛高度测量方法
技术领域
本发明属于人工智能领域,具体涉及一种基于深度学习的眼睛高度测量方法。
背景技术
眼睛高度是指人在身体直立、眼睛向前平视时,上、下眼皮之间的距离。先天性的眼睑下垂以及眼肌无力引起的眼睑下垂都会使人的眼睛高度变小。眼睛高度不仅影响一个人的精神与外貌,还会影响视线。据统计,全国每年进行眼睛外观修正手术的人数达到数万人。而在资料收集的过程中,需要用户提供眼睛的高度、宽度等数据。
现有技术中,通常需要用户到达指定地点后,由专业人员使用尺子等测量工具对用户的眼部数据进行测量。然而在测量过程中,要求被测量人员长时间静止端坐,被测人员的轻微动作都会严重影响测量结果的准确性,对年龄较小的被测量人员来说,测量条件比较苛刻。同时,对测量人员的技术以及测量工具的精度,也有很高的要求。
发明内容
针对现有技术的不足,本发明提出了一种基于深度学习的眼睛高度测量方法,利用两个神经网络分别分割拍摄的用户照片后,对用户的眼睛高度进行测量,对两个网络分割后的测量结果取平均值,作为最终测得的用户眼睛高度。提高测量结果的准确度的同时,减少了测量过程花费的时间。
一种基于深度学习的眼睛高度测量方法,具体包括以下步骤:
步骤一、数据预处理
将原始图片的像素重设为320*480与224*224两种像素尺寸,分别得到测试集1与测试集2。
步骤二、图像分割
将测试集1输入训练好的FPN神经网络模型,将测试集2输入训练好的UNET神经网络模型中,两个网络的输出掩模只包含分割后得到的眼部图像。
步骤三、眼部图像处理
检测FPN神经网络模型输出的眼部图像中的眼部轮廓,根据轮廓线绘制最小外接矩形,将矩形的宽度作为FPN神经网络模型得到的眼睛高度。检测UNET神经网络模型输出的眼部图像中的眼部轮廓,提取眼部轮廓后找出轮廓的最左与最右像素点,作最左与最右像素点连线的中垂线,求出该中垂线与轮廓两个交点间的距离作为UNET神经网络模型得到的眼睛高度。
步骤四、输出结果
将步骤三中两个网络模型得到的眼睛高度相加后取平均值,作为最终测量得到的眼睛高度。
本发明具有以下有益效果:
1、将拍摄的用户图片输入神经网络进行分割后,再计算得出眼睛高度,过程简单、结果准确,改进了手工测量耗时长、对被测量者要求高以及测量结果精度低的缺点。
2、通过分别对两个网络的切割得到的眼部图像作最小外接矩形和作内外眼角中垂线的方法,间接计算得到眼睛高度,有效避免了拍摄角度不水平或照片旋转导致的测量误差。
3、神经网络分割后的图片仅包含用户的眼部部分,而不包含其他面部特征,不会造成用户隐私的泄露。
附图说明
图1为基于深度学习的眼睛高度测量方法流程图;
图2为实施例中深度学习模型详细结构图。
具体实施方式
以下结合附图对本发明作进一步的解释说明;
本实施例中的硬件环境为:8vCPU/64G内存,GPU为V100,软件运行环境为:CUDA:9.2.148、python3.7、pytorch 1.0.1.post2。
如图1所示,具体包括以下步骤:
步骤一、数据集划分
将拍摄的用户原始图片划分为训练集、验证集以及测试集;
步骤二、数据预处理
将原始数据集中的图片像素重设为320*480与224*224两种像素尺寸,分别得到训练集1、验证集1、测试集1与训练集2、验证集2、测试集2。
步骤三、神经网络训练
将训练集1输入预训练好的FPN神经网络,将训练集2输入预训练好的UNET神经网络中,两个网络的预训练权重均来自于ImageNet,以迁移学习的方式对两个神经网络带标签数据的监督学习训练。所述带标签数据为医生标记的数据。所述监督学习训练为将两个网络输出的数据放大到原尺寸后与医生标记的数据进行比较,分别得到两个网络各自的损失值、语义分割值、计算精确度等指标。
对两个神经网络进行100次的监督训练,然后分别将验证集1和验证集2输入训练后的FPN神经网络和UNET神经网络,验证训练效果,最终得到FPN网络的损失值loss1=0.04017、语义分割值iou_score1=0.9456,UNET网络的损失值loss2=0.03751、语义分割值iou_score2=0.09323,保存参数,作为求取测试集眼睛高度的神经网络模型。
步骤四、图像分割
将测试集1与测试集2分别输入步骤三训练后保存的FPN神经网络模型与UNET神经网络模型中,网络输出为分割后的眼部图像。
步骤五、眼部图像处理
(1)如图2所示,使用OpenCV检测FPN神经网络输出的眼部轮廓,画出轮廓的最小外接矩形,返回矩形的框,作为FPN网络测得的眼睛高度。
(2)使用OpenCV提取UNET神经网络输出的眼部轮廓,找出轮廓的最左与最右的像素点,做两点连线的中垂线,求取中垂线与轮廓的交点直接的距离,作为UNET网络测得的眼睛高度。
步骤六、输出结果
将步骤六中两个网络得到的眼睛高度相加后取平均值,作为最终的输出结果。

Claims (3)

1.一种基于深度学习的眼睛高度测量方法,其特征在于:具体包括以下步骤:
步骤一、数据预处理
将原始图片的像素重设为320*480与224*224两种像素尺寸,分别得到测试集1与测试集2;
步骤二、图像分割
将测试集1输入训练好的FPN神经网络模型,将测试集2输入训练好的UNET神经网络模型中,两个网络的输出掩模为分割后的只包含眼部的图像;
步骤三、眼部图像处理
检测FPN神经网络模型输出的眼部图像中的眼部轮廓,根据轮廓线绘制最小外接矩形,将矩形的宽度作为FPN神经网络模型得到的眼睛高度;检测UNET神经网络模型输出的眼部图像中的眼部轮廓,提取眼部轮廓后找出轮廓的最左与最右像素点,作最左与最右像素点连线的中垂线,求出该中垂线与轮廓两个交点间的距离作为UNET神经网络模型得到的眼睛高度;
步骤四、输出结果
将步骤三中两个网络模型得到的眼睛高度相加后取平均值,作为最终测量得到眼睛高度。
2.如权利要求1所述一种基于深度学习的眼睛高度测量方法,其特征在于:步骤二中所述训练好的FPN神经网络模型的损失值loss1=0.04017、语义分割值iou_score2=0.9456,UNET神经网络模型损失值loss2=0.03751、语义分割值iou_score2=0.09323。
3.如权利要求1所述一种基于深度学习的眼睛高度测量方法,其特征在于:步骤三中通过OpenCV检测眼部图像轮廓与绘制最小外接矩形。
CN202011102430.6A 2020-10-15 2020-10-15 一种基于深度学习的眼睛高度测量方法 Pending CN112329546A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011102430.6A CN112329546A (zh) 2020-10-15 2020-10-15 一种基于深度学习的眼睛高度测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011102430.6A CN112329546A (zh) 2020-10-15 2020-10-15 一种基于深度学习的眼睛高度测量方法

Publications (1)

Publication Number Publication Date
CN112329546A true CN112329546A (zh) 2021-02-05

Family

ID=74313757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011102430.6A Pending CN112329546A (zh) 2020-10-15 2020-10-15 一种基于深度学习的眼睛高度测量方法

Country Status (1)

Country Link
CN (1) CN112329546A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977605A (zh) * 2017-11-08 2018-05-01 清华大学 基于深度学习的眼部区域边界特征提取方法及装置
CN109344742A (zh) * 2018-09-14 2019-02-15 腾讯科技(深圳)有限公司 特征点定位方法、装置、存储介质和计算机设备
AU2019100354A4 (en) * 2019-04-04 2019-05-16 Chen, Mingjie Mr An animal image search system based on convolutional neural network
CN111563435A (zh) * 2020-04-28 2020-08-21 深圳市优必选科技股份有限公司 用户的睡眠状态检测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977605A (zh) * 2017-11-08 2018-05-01 清华大学 基于深度学习的眼部区域边界特征提取方法及装置
CN109344742A (zh) * 2018-09-14 2019-02-15 腾讯科技(深圳)有限公司 特征点定位方法、装置、存储介质和计算机设备
AU2019100354A4 (en) * 2019-04-04 2019-05-16 Chen, Mingjie Mr An animal image search system based on convolutional neural network
CN111563435A (zh) * 2020-04-28 2020-08-21 深圳市优必选科技股份有限公司 用户的睡眠状态检测方法及装置

Similar Documents

Publication Publication Date Title
US10068128B2 (en) Face key point positioning method and terminal
CN108108684B (zh) 一种融合视线检测的注意力检测方法
CN111882579A (zh) 基于深度学习和目标跟踪的大输液异物检测方法、系统、介质及设备
CN109815826B (zh) 人脸属性模型的生成方法及装置
CN107895160A (zh) 人脸检测与识别装置及方法
CN110728225B (zh) 一种用于考勤的高速人脸搜索方法
CN106991390A (zh) 一种基于深度学习的手持人证比对系统及方法
Cai et al. A pointer meter recognition method based on virtual sample generation technology
CN105913487A (zh) 一种基于人眼图像中虹膜轮廓分析匹配的视线方向计算方法
CN108615256B (zh) 一种人脸三维重建方法及装置
CN105740779A (zh) 人脸活体检测的方法和装置
CN106650574A (zh) 基于PCANet的人脸识别方法
CN109409298A (zh) 一种基于视频处理的视线追踪方法
CN108256481A (zh) 一种利用身体上下文的行人头部检测方法
CN113139439B (zh) 一种基于人脸识别的在线学习专注度评价方法及装置
CN112883867A (zh) 一种基于图像情感分析的学生在线学习评估方法及系统
CN110472582A (zh) 基于眼部识别的3d人脸识别方法、装置和终端
CN110956071A (zh) 眼部关键点的标注及其检测模型的训练方法和装置
CN112507963A (zh) 一种批量口罩人脸样本自动生成以及口罩人脸识别方法
CN110472546B (zh) 一种婴幼儿非接触式眼动特征提取装置及方法
CN111680577A (zh) 人脸检测方法和装置
CN110378315A (zh) 一种基于脸部图像的视线角度估计方法
CN106446805A (zh) 一种眼底照中视杯的分割方法及系统
CN106980845B (zh) 基于结构化建模的人脸关键点定位方法
CN110135391A (zh) 使用计算机选配眼镜框的程序和眼镜框选配系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination