CN111191605A

CN111191605A - 一种基于级联神经网络的多任务虹膜快速定位方法

Info

Publication number: CN111191605A
Application number: CN201911415847.5A
Authority: CN
Inventors: 沈文忠; 滕童; 毛云丰
Original assignee: Shanghai University of Electric Power
Current assignee: Shanghai University of Electric Power
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-05-22

Abstract

本发明涉及一种基于级联神经网络的多任务虹膜快速定位方法，该方法包括如下步骤：(1)选取虹膜区域并且标记关键特征点作为Ground Truth数据集；(2)制作训练样本集，包括正样本、中间样本和负样本；(3)制作训练样本集的标签；(4)建立级联神经网络，第一级神经网络用于虹膜区域候选框分类，第二级神经网络用于对虹膜候选框区域进行分类与区域坐标回归，第三级神经网络用于精确输出虹膜区域和关键特征点的位置信息；(5)采用有标签的训练样本对级联神经网络进行训练；(6)将待定位图像输入至训练好的级联神经网络，输出虹膜区域和关键特征点的位置信息。与现有技术相比，本发明方法定位准确可靠，泛化能力强。

Description

一种基于级联神经网络的多任务虹膜快速定位方法

技术领域

本发明涉及生物特征识别技术领域，尤其是涉及一种基于级联神经网络的多任务虹膜快速定位方法。

背景技术

在人类身份识别认证的问题上，传统的身份验证方法不方便、不安全，而基于生物学特征的生物识别技术具有普遍性、稳定性、安全性的特点，这让生物识别技术成为了该领域内近年来研究的热点。

其中虹膜识别被认为是最具开发前景的生物特征识别方法，与其他生物识别技术相比虹膜识别有着唯一性、稳定性、防伪性和非接触性的优点。

一个完整的虹膜识别系统由图像的获取，虹膜定位，特征提取和识别验证四个部分组成，其中虹膜定位是非常重要的环节。虹膜区域定位的不准确会造成干扰信息的引入，像眼睑、光斑、睫毛等，还会造成虹膜纹理信息的缺失，因此虹膜区域定位是否准确对后续的虹膜特征提取和虹膜识别的准确率有很大的影响。目前的虹膜定位算法大多基于虹膜图像的某一或者某些不变特征计算得到虹膜区域的内外边界，泛化能力低，以及在处理眼睛区域以外的脸部信息时表现得并不是很稳健。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于级联神经网络的多任务虹膜快速定位方法。

本发明的目的可以通过以下技术方案来实现：

一种基于级联神经网络的多任务虹膜快速定位方法，该方法包括如下步骤：

(1)在原始图像中选取虹膜区域并且标记关键特征点作为Ground Truth数据集；

(2)基于Ground Truth数据集制作训练样本集，包括正样本、中间样本和负样本；

(3)制作训练样本集的标签；

(4)建立级联神经网络，包括依次级联的三个神经网络，第一级神经网络用于虹膜区域候选框分类，第二级神经网络用于对虹膜候选框区域进行分类与区域坐标回归，第三级神经网络用于精确输出虹膜区域和关键特征点的位置信息；

(5)采用有标签的训练样本对级联神经网络进行训练；

(6)将待定位图像输入至训练好的级联神经网络，输出虹膜区域和关键特征点的位置信息。

步骤(1)具体为：

首先，采用矩形框人工标记虹膜区域，得到虹膜区域的位置信息(x,y,width,height)，x,y表示矩形框左上角的横纵坐标，width,height表示矩形框的宽度和高度；

然后，在虹膜区域标记5个关键特征点(x_i,y_i)，i∈{1,2,3,4,5}，包括虹膜左右边缘点、瞳孔左右边缘点和瞳孔圆心，x_i和y_i表示第i个关键特征点的横坐标和纵坐标。

步骤(2)具体为：

在原始图像中随机裁剪图像块得到3个类别的样本集：

正样本：与Ground Truth的交并比大于等于0.65的图像块；

中间样本：与Ground Truth的交并比介于0.4和0.65之间的图像块；

负样本：与Ground Truth的交并比小于等于0.3的图像块。

所述的交并比通过如下方式获得：

IOU＝S_(A∩B)/S_(A∪B)，

其中，A表示随机裁剪的图像块，B表示Ground Truth区域，即矩形框标记的虹膜区域，S_(A∩B)表示A和B相交区域的面积，S_(A∪B)表示A和B相并区域的面积。

步骤(3)具体为：

采用式1归一化虹膜区域左上角坐标，采用式2归一化5个关键特征点坐标；

将正样本的标签记为1，带有归一化后的虹膜区域左上角坐标和关键特征点坐标信息；

中间样本的标签记为-1，带有归一化后的虹膜区域左上角坐标和关键特征点坐标信息；

负样本的标签记为0；

其中，

式1：

其中，offsetx、offsety为归一化得到的虹膜区域左上角横纵坐标，bx、by表示裁剪的图像块的左上角横纵坐标，boxwidth、boxheight表示裁剪的图像块的宽度和高度；

式2：

其中，offsetx_i、offsety_i为归一化得到的第i个关键特征点的横纵坐标。

所述的第一级神经网络为全卷积网络，其输入数据大小为12*12*1，输出两个1x1卷积层。

所述的第二级神经网络包括依次连接的卷积层和全连接层，所述的卷积层设置多个，第二级神经网络的输入数据大小为24*24*1，输出6x1全连接层。

所述的第三级神经网络包括依次连接的卷积层和全连接层，所述的卷积层设置多层，第三级神经网络的输入数据大小为48*48*1，输出16x1全连接层。

步骤(5)训练过程中采用Softmax函数对虹膜区域进行二分类，通过欧式距离虹膜区域和关键特征点坐标偏置进行回归。

与现有技术相比，本发明具有如下优点：

(1)本发明在不受限的实际应用环境下提供一种能够快速排除干扰信息准确定位的基于卷积神经网络的区域和关键特征点回归多任务虹膜快速定位方法，用矩形框框住虹膜目标区域，在矩形框中用5个关键特征点定位虹膜区域特征点，为下一步虹膜精确分割奠定基础。

(2)本发明方法采用多个级联的神经网络能够得到精确的定位结果，且泛化能力强。

附图说明

图1为本发明基于级联神经网络的多任务虹膜快速定位方法的流程框图；

图2为交并比计算的原理示意图；

图3为本发明级联神经网络的结构示意图；

图4为本发明实施例中虹膜和关键特征点定位结果图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。注意，以下的实施方式的说明只是实质上的例示，本发明并不意在对其适用物或其用途进行限定，且本发明并不限定于以下的实施方式。

实施例

如图1所示，一种基于级联神经网络的多任务虹膜快速定位方法，该方法包括如下步骤：

(3)制作训练样本集的标签；

(5)采用有标签的训练样本对级联神经网络进行训练；

步骤(1)具体为：

首先，人工标记虹膜区域，得到虹膜区域的位置信息(x,y,width,height)，x,y表示矩形框左上角的横纵坐标，width,height表示矩形框的宽度和高度；

步骤(2)具体为：

在原始图像中随机裁剪图像块得到3个类别的样本集：

正样本：与Ground Truth的交并比大于等于0.65的图像块；

中间样本：与Ground Truth的交并比介于0.4和0.65之间的图像块；

负样本：与Ground Truth的交并比小于等于0.3的图像块。

其中，交并比通过如下方式获得：

IOU＝S(_A∩B)/S_(A∪B)，

其中，A表示随机裁剪的图像块，B表示Ground Truth区域，即矩形框标记的虹膜区域，S_(A∩B)表示A和B相交区域的面积，S_(A∪B)表示A和B相并区域的面积。具体如图2所示，斜线部分为A和B相交区域的。

步骤(3)具体为：

负样本的标签记为0；

其中，

式1：

式2：

第一级神经网络为全卷积网络，其输入数据大小为12*12*1，输出两个1x1卷积层，目的是为了输出检测目标的候选区域，网络结构图如图3的(a)所示。

第二级神经网络包括依次连接的卷积层和全连接层，卷积层设置多个，第二级神经网络的输入数据大小为24*24*1，输出6x1全连接层。第二级神经网络的目的是为了进一步去除类别得分概率低和重叠较多的目标候选框，结构如图3的(b)所示。

第三级神经网络包括依次连接的卷积层和全连接层，卷积层设置多层，第三级神经网络的输入数据大小为48*48*1，输出16x1全连接层。第三级神经网络的目的是完成对目标的精确定位和5个关键特征点的检测，网络结构图如图3的(c)所示。

步骤(5)训练过程中具体为：

将输入数据大小设置成12*12*1送入第一级网络进行训练，生成虹膜区域候选框；将输入数据大小设置成24*24*1送入第二级网络进行训练，进一步对虹膜候选框区域进行分类与区域坐标回归；将输入数据大小设置成48*48*1送入第三级网络进行训练，精确输出虹膜区域和关键特征点的位置信息；网络采用Softmax函数对虹膜区域进行二分类，通过欧式距离虹膜区域和关键特征点坐标偏置进行回归。

本实施例步骤(6)测试时在单张图像的几个缩放尺度上运行级联神经网络，最终通过不同尺度在该图像上进行预测得到虹膜区域的边界框和虹膜区域的5个特征点，定位结果如图4所示。

上述实施方式仅为例举，不表示对本发明范围的限定。这些实施方式还能以其它各种方式来实施，且能在不脱离本发明技术思想的范围内作各种省略、置换、变更。

Claims

1.一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，该方法包括如下步骤：

(3)制作训练样本集的标签；

(5)采用有标签的训练样本对级联神经网络进行训练；

2.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，步骤(1)具体为：

3.根据权利要求2所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，步骤(2)具体为：

在原始图像中随机裁剪图像块得到3个类别的样本集：

正样本：与Ground Truth的交并比大于等于0.65的图像块；

中间样本：与Ground Truth的交并比介于0.4和0.65之间的图像块；

负样本：与Ground Truth的交并比小于等于0.3的图像块。

4.根据权利要求3所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，所述的交并比通过如下方式获得：

IOU＝S_(A∩B)/S_(A∪B)，

5.根据权利要求3所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，步骤(3)具体为：

负样本的标签记为0；

其中，

式1：

式2：

6.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，所述的第一级神经网络为全卷积网络，其输入数据大小为12*12*1，输出两个1x1卷积层。

7.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，所述的第二级神经网络包括依次连接的卷积层和全连接层，所述的卷积层设置多个，第二级神经网络的输入数据大小为24*24*1，输出6x1全连接层。

8.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，所述的第三级神经网络包括依次连接的卷积层和全连接层，所述的卷积层设置多层，第三级神经网络的输入数据大小为48*48*1，输出16x1全连接层。

9.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法，其特征在于，步骤(5)训练过程中采用Softmax函数对虹膜区域进行二分类，通过欧式距离虹膜区域和关键特征点坐标偏置进行回归。