CN116645719A - 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质 - Google Patents

一种瞳孔和虹膜定位方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116645719A
CN116645719A CN202310521284.8A CN202310521284A CN116645719A CN 116645719 A CN116645719 A CN 116645719A CN 202310521284 A CN202310521284 A CN 202310521284A CN 116645719 A CN116645719 A CN 116645719A
Authority
CN
China
Prior art keywords
iris
pupil
target
region
areas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310521284.8A
Other languages
English (en)
Inventor
杨航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Ezviz Software Co Ltd
Original Assignee
Hangzhou Ezviz Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Ezviz Software Co Ltd filed Critical Hangzhou Ezviz Software Co Ltd
Priority to CN202310521284.8A priority Critical patent/CN116645719A/zh
Publication of CN116645719A publication Critical patent/CN116645719A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/18Eye characteristics, e.g. of the iris
    • G06V40/197Matching; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Abstract

本申请实施例提供了一种瞳孔和虹膜定位方法、装置、电子设备及存储介质。其中,所述方法包括:获取目标眼部图像;将目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各候选虹膜区域对应的候选瞳孔区域,其中,目标检测网络模型为预先基于样本数据训练得到的,样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,并将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域。应用该实施例,可以提高确定目标眼部图像中瞳孔和虹膜所处区域的效率和准确度。

Description

一种瞳孔和虹膜定位方法、装置、电子设备及存储介质
技术领域
本申请涉及智能算法技术领域,特别是涉及一种瞳孔和虹膜定位方法、装置、电子设备及存储介质。
背景技术
在确定图像中的虹膜位置时,可以基于深度学习的分割算法,采用像素分割确定虹膜的区域,但是基于深度学习的分割算法模型通常较大,复杂度较高,对于算法运行环境资源消耗大,因此,使得通过分割算法模型确定虹膜所处区域的效率较低。
发明内容
本申请实施例的目的在于提供一种瞳孔和虹膜定位方法、装置、电子设备及存储介质,以实现提高确定瞳孔和虹膜所处区域的效率。具体技术方案如下:
在本申请的第一方面,提供了一种瞳孔和虹膜定位方法,所述方法包括:
获取目标眼部图像;
将所述目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各所述候选虹膜区域对应的候选瞳孔区域,其中,所述目标检测网络模型为预先基于样本数据训练得到的,所述样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;
从各所述候选虹膜区域确定与对应的所述候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;
将所述目标虹膜区域确定为所述目标眼部图像中虹膜所处的区域,并将所述目标虹膜区域对应的所述候选瞳孔区域确定为所述目标眼部图像中瞳孔所处的区域。
在一种可能的实施例中,所述将所述目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各所述候选虹膜区域对应的候选瞳孔区域,包括:
将所述目标眼部图像输入预先训练的目标检测网络模型,得到所述目标检测网络模型输出的多个检测虹膜区域以及各所述检测虹膜区域对应的检测瞳孔区域;
对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域。
在一种可能的实施例中,所述对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域,包括:
从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域,其中,所述虹膜区域集合初始时包括各所述检测虹膜区域;
在所述虹膜区域集合中确定与所述目标检测虹膜区域重叠程度大于预设重叠阈值的重复虹膜区域;
若不满足预设循环条件,则将去除所述重复虹膜区域和所述目标检测虹膜区域的虹膜区域集合作为新的虹膜区域集合,返回执行所述从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;
若满足预设循环条件,则将未被确定为所述重复虹膜区域的所述检测虹膜区域确定为候选虹膜区域,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域;
和/或
从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域,其中,所述瞳孔区域集合初始时包括各所述检测瞳孔区域;
在所述瞳孔区域集合中确定与所述目标检测瞳孔区域重叠程度大于预设重叠阈值的重复瞳孔区域;
若不满足预设循环条件,则将去除所述重复瞳孔区域和所述目标检测瞳孔区域的瞳孔区域集合作为新的瞳孔区域集合,返回执行所述从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;
若满足预设循环条件,则将未被确定为所述重复瞳孔区域的所述检测瞳孔区域确定为候选瞳孔区域,得到多个候选瞳孔区域以及各所述候选瞳孔区域对应的候选虹膜区域。
在一种可能的实施例中,预先采用如下步骤基于样本数据训练得到所述目标检测网络模型,包括:
将所述样本数据输入待训练检测网络模型,得到多个回归区域以及各所述回归区域对应的分类结果,所述分类结果用于表示虹膜或者瞳孔;
确定各所述回归区域与所述样本数据标注的区域之间的区域重叠程度,以及各所述回归区域对应的分类结果所表示的类别与所述样本数据中所述回归区域标注的类别之间的类别差异;
根据所述重叠程度和所述类别差异确定模型损失,所述模型损失与所述重叠程度负相关,且与所述类别差异正相关;
基于所述模型损失调整所述待训练检测网络模型的网络参数,得到目标检测网络模型。
在一种可能的实施例中,所述方法还包括:
确定所述目标虹膜区域的长度和宽度中的较大值,作为第一最大尺寸;
根据所述目标虹膜区域的位置、所述第一最大尺寸,确定所述目标眼部图像中虹膜的圆心和/或半径;
确定所述目标瞳孔区域的长度和宽度中的较大值,作为第二最大尺寸,所述目标瞳孔区域为所述目标虹膜区域对应的所述候选瞳孔区域;
根据所述目标瞳孔区域的位置、所述第二最大尺寸,确定所述目标眼部图像中瞳孔的圆心和/或半径。
在本申请的第二方面,提供了一种瞳孔和虹膜定位装置,所述装置包括:
图像获取模块,用于获取目标眼部图像;
目标检测模块,用于将所述目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各所述候选虹膜区域对应的候选瞳孔区域,其中,所述目标检测网络模型为预先基于样本数据训练得到的,所述样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;
目标虹膜区域确定模块,用于从各所述候选虹膜区域确定与对应的所述候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;
虹膜瞳孔区域确定模块,用于将所述目标虹膜区域确定为所述目标眼部图像中虹膜所处的区域,并将所述目标虹膜区域对应的所述候选瞳孔区域确定为所述目标眼部图像中瞳孔所处的区域。
在一种可能的实施例中,所述目标检测模块,包括:
检测区域输出单元,用于将所述目标眼部图像输入预先训练的目标检测网络模型,得到所述目标检测网络模型输出的多个检测虹膜区域以及各所述检测虹膜区域对应的检测瞳孔区域;
检测区域去重单元,用于对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域。
在一种可能的实施例中,所述检测区域去重单元,对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域,包括:
从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域,其中,所述虹膜区域集合初始时包括各所述检测虹膜区域;
在所述虹膜区域集合中确定与所述目标检测虹膜区域重叠程度大于预设重叠阈值的重复虹膜区域;
若不满足预设循环条件,则将去除所述重复虹膜区域和所述目标检测虹膜区域的虹膜区域集合作为新的虹膜区域集合,返回执行所述从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;
若满足预设循环条件,则将未被确定为所述重复虹膜区域的所述检测虹膜区域确定为候选虹膜区域,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域;
和/或
从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域,其中,所述瞳孔区域集合初始时包括各所述检测瞳孔区域;
在所述瞳孔区域集合中确定与所述目标检测瞳孔区域重叠程度大于预设重叠阈值的重复瞳孔区域;
若不满足预设循环条件,则将去除所述重复瞳孔区域和所述目标检测瞳孔区域的瞳孔区域集合作为新的瞳孔区域集合,返回执行所述从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;
若满足预设循环条件,则将未被确定为所述重复瞳孔区域的所述检测瞳孔区域确定为候选瞳孔区域,得到多个候选瞳孔区域以及各所述候选瞳孔区域对应的候选虹膜区域。
在一种可能的实施例中,所述装置还包括:
模型训练模块,用于预先采用如下步骤基于样本数据训练得到所述目标检测网络模型:
将所述样本数据输入待训练检测网络模型,得到多个回归区域以及各所述回归区域对应的分类结果,所述分类结果用于表示虹膜或者瞳孔;
确定各所述回归区域与所述样本数据标注的区域之间的区域重叠程度,以及各所述回归区域对应的分类结果所表示的类别与所述样本数据中所述回归区域标注的类别之间的类别差异;
根据所述重叠程度和所述类别差异确定模型损失,所述模型损失与所述重叠程度负相关,且与所述类别差异正相关;
基于所述模型损失调整所述待训练检测网络模型的网络参数,得到目标检测网络模型。
在一种可能的实施例中,所述装置还包括:
第一最大尺寸确定模块,用于确定所述目标虹膜区域的长度和宽度中的较大值,作为第一最大尺寸;
虹膜圆心和/或半径确定模块,用于根据所述目标虹膜区域的位置、所述第一最大尺寸,确定所述目标眼部图像中虹膜的圆心和/或半径;
第二最大尺寸确定模块,用于确定所述目标瞳孔区域的长度和宽度中的较大值,作为第二最大尺寸,所述目标瞳孔区域为所述目标虹膜区域对应的所述候选瞳孔区域;
瞳孔圆心和/或半径确定模块,用于根据所述目标瞳孔区域的位置、所述第二最大尺寸,确定所述目标眼部图像中瞳孔的圆心和/或半径。
在本申请的第三方面,提供了一种电子设备,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的瞳孔和虹膜定位方法。
在本申请的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的瞳孔和虹膜定位方法。
本申请实施例有益效果:
本申请实施例提供的瞳孔和虹膜定位方法、装置、电子设备及存储介质,通过目标检测网络模型对目标眼部图像进行检测,目标检测网络模型是预先基于标注有瞳孔和虹膜所处区域的样本眼部图像训练得到的,从而同时得到目标眼部图像的多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域,并从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域,从而将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域,得到目标眼部图像中瞳孔和虹膜所处的区域。由于目标检测网络模型的复杂度低于像素分割算法模型,因此,相比于像素分割算法模型,目标检测网络模型复杂度更低,大小可控,运行速度更快,从而提高了确定目标眼部图像中瞳孔和虹膜所处区域的效率。并且,充分考虑到了虹膜区域与瞳孔区域的尺寸比例关系,从而对各候选虹膜区域以及候选虹膜区域对应的候选瞳孔区域进行筛选,使得到的目标眼部图像中瞳孔和虹膜所处的区域更加准确。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的实施例。
图1为本申请提供的瞳孔和虹膜定位方法的第一种流程示意图;
图2为本申请提供的目标检测网络模型训练方法的一种流程示意图;
图3a为本申请提供的训练目标检测网络模型时采用的样本眼部图像的示意图;
图3b为本申请提供的重叠程度计算参数的示意图;
图3c为本申请提供的目标检测网络模型输出结果的一种示意图;
图3d为本申请提供的目标检测网络模型输出结果的另一种示意图;
图4为本申请提供的瞳孔和虹膜定位方法的第二种流程示意图;
图5为本申请提供的瞳孔和虹膜定位方法的第三种流程示意图;
图6为本申请提供的瞳孔和虹膜定位方法的一种应用流程示意图;
图7为本申请提供的瞳孔和虹膜定位装置的一种结构示意图;
图8为本申请提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本申请保护的范围。
为了提高确定瞳孔和虹膜所处区域的效率,本申请实施例提供了一种瞳孔和虹膜定位方法、装置、电子设备及存储介质,下面分别进行详细说明。
本申请提供了一种瞳孔和虹膜定位方法,如图1所示,方法包括:
S101,获取目标眼部图像。
S102,将目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各候选虹膜区域对应的候选瞳孔区域。
其中,目标检测网络模型为预先基于样本数据训练得到的,样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像。
S103,从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域。
S104,将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,并将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域。
选用该实施例,通过目标检测网络模型对目标眼部图像进行检测,目标检测网络模型是预先基于标注有瞳孔和虹膜所处区域的样本眼部图像训练得到的,从而同时得到目标眼部图像的多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域,并从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域,从而将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域,得到目标眼部图像中瞳孔和虹膜所处的区域。由于目标检测网络模型的复杂度低于像素分割算法模型,因此,相比于像素分割算法模型,目标检测网络模型复杂度更低,大小可控,运行速度更快,从而提高了确定目标眼部图像中瞳孔和虹膜所处区域的效率。并且,充分考虑到了虹膜区域与瞳孔区域的尺寸比例关系,从而对各候选虹膜区域以及候选虹膜区域对应的候选瞳孔区域进行筛选,使得到的目标眼部图像中瞳孔和虹膜所处的区域更加准确。
下面将分别对前述S101-S104进行说明,其中:
在S101中,可以获取原始眼部图像,将原始眼部图像作为目标眼部图像。也可以在获取原始眼部图像后,对原始眼部图像进行预处理,得到目标眼部图像。
对原始眼部图像进行预处理可以包括:采用letter_box函数(自适应图片缩放函数),将原始眼部图像缩放至指定尺寸,可以对原始眼部图像自适应的添加尽可能少的黑边,较好地保留原始眼部图像的信息的同时将原始眼部图像缩放至目标检测网络模型能够处理的尺寸。
在S102中,候选虹膜区域以及候选瞳孔区域用于表示目标眼部图像中虹膜以及瞳孔所处的位置,区域可以有多种表现形式,例如:根据虹膜或者瞳孔的形状描绘出的圆形框,虹膜和瞳孔的外切正方形框,等等,本申请对此不作限定。
由于样本数据中的样本眼部图像中同时标注了瞳孔和虹膜所处的区域,且瞳孔和虹膜是属于一一对应的关系的,因此在使用样本数据训练得到目标检测模型的过程中,目标检测模型能够学习到如何确定瞳孔和虹膜所处的区域以及瞳孔和虹膜所处区域之间的对应关系,因此将目标眼部图像输入目标检测网络模型,可以得到多个候选虹膜区域和多个候选瞳孔区域,且每个候选虹膜区域都有对应的一个候选瞳孔区域。
在S103中,可以理解的是,由于人体的构造,虹膜的大小与瞳孔的大小往往正相关,且存在一定比例关系,因此虹膜区域与对应的瞳孔区域之间的尺寸比例存在一定的范围,可以将得到的候选虹膜区域与对应的候选瞳孔区域的尺寸比例不在此范围内的视为不太准确的结果,因此,可以通过预设的虹膜区域与瞳孔区域的尺寸比例范围,对得到的多个候选虹膜区域和各候选虹膜区域对应的候选瞳孔区域进行筛选,得到更加准确的目标虹膜区域,以及目标虹膜区域对应的候选瞳孔区域。
预设的虹膜区域与瞳孔区域的尺寸比例范围可以根据过往经验进行设置,例如,预设范围可以为瞳孔区域:虹膜区域的比值的范围,该范围可以设置为0.2-0.9,也可以设置为0.3-0.8,本申请对此不作任何限制。
在S104中,由于筛选得到的目标虹膜区域是较为准确的,该目标虹膜区域对应的候选瞳孔区域也是较为准确的,因此可以将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,并将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域。
下面将对如何预先基于样本数据训练得到目标检测网络模型进行示例性说明,在一种可能的实施例中,可以基于样本数据,对待训练检测网络模型进行预设次数的训练;针对每次训练后的待训练检测网络模型,使用测试集计算该待训练检测网络模型的准确率,每次训练后的待训练检测网络模型对应一个准确率;选取最大的准确率对应的训练后的待训练检测网络模型,作为训练得到的目标检测网络模型。
在另一种可能的实施例中,也可以如图2所示,预先采用以下步骤基于样本数据训练得到目标检测网络模型,包括:
S201,将样本数据输入待训练检测网络模型,得到多个回归区域以及各回归区域对应的分类结果。
其中,分类结果用于表示虹膜或者瞳孔。
S202,确定各回归区域与样本数据标注的区域之间的区域重叠程度,以及各回归区域对应的分类结果所表示的类别与样本数据中回归区域标注的类别之间的类别差异。
S203,根据重叠程度和类别差异确定模型损失,模型损失与重叠程度负相关,且与类别差异正相关。
S204,基于模型损失调整待训练检测网络模型的网络参数,得到目标检测网络模型。
选用该实施例,可以通过训练输出的多个回归区域以及各回归区域对应的分类结果与样本数据计算出重叠程度以及类别差异,并根据重叠程度与模型损失的负相关关系,以及类别差异与模型损失的正相关关系确定模型损失,使得可以根据模型损失对待训练检测网络模型的网络参数进行调整,从而使得到的目标检测网络模型更加准确。
下面将分别对前述S201-S204进行说明,其中:
在S201中,样本数据是从原始样本库中制作得到的,由于虹膜和瞳孔本身可以近似认为是正圆形的形状,因此可以将虹膜和瞳孔标记框的形状设置为与虹膜和瞳孔外切的正方形,标记框的正确有助于提升模型训练的效果,该标记框即为样本眼部图像中对于虹膜和瞳孔所处区域的标注。标注的信息为虹膜外圆的检测框I_rect(Iris_rectangle,虹膜矩形框),以及瞳孔内圆的检测框P_rect(Pupil_rectangle,瞳孔矩形框)。将制作的标注有瞳孔和虹膜所处区域的样本眼部图像输入待训练检测网络模型中进行训练。标注有瞳孔和虹膜所处区域的样本眼部图像可以如图3a所示。图3a中的大圆为虹膜外圆,小圆为瞳孔内圆,大矩形框为虹膜外圆的检测框,小矩形框为瞳孔内圆的检测框。
在将样本数据输入待训练检测网络模型之前,可以对样本数据进行预处理。可以采用Mosaic数据增强(马赛克数据增强)方式对样本眼部图像进行增强处理,通过随机缩放、随机裁剪、随机排布三种方式中的至少一种方式对4张样本眼部图像进行处理并拼接在一张mosaic画布上,得到新的样本眼部图像,从而丰富检测的背景,变相地提高了batch_size。具体的,随机缩放是指对4张样本眼部图像分别随机缩放至任意尺寸,随机裁剪是指对4张样本眼部图像分别随机裁剪后保留裁剪出的部分,随机排布是指将4张样本眼部图像在一张mosaic画布上随机排列布局。对4张样本眼部图像处理后在一张mosaic画布上拼接,得到拼接后的图片,若拼接后的图片有超出mosaic画布的区域,则对拼接后的图片进行裁剪,仅保留拼接后的图片中不超出mosaic画布的部分作为新的样本眼部图像。
示例性的,假设通过随机缩放、随机裁剪这两种方式对4张样本眼部图像进行处理拼接得到新的样本眼部图像,则需要分别对4张样本眼部图像进行随机缩放以及随机裁剪的处理,将处理好之后的4张样本眼部图像按照预设的排列布局拼接在一张mosaic画布上,得到拼接后的图片,仅保留拼接后的图片中不超出mosaic画布的部分作为新的样本眼部图像。
假设通过随机缩放、随机排布这两种方式对4张样本眼部图像进行处理拼接得到新的样本眼部图像,则需要分别对4张样本眼部图像进行随机缩放的处理,将处理好之后的4张样本眼部图像在一张mosaic画布上随机的排列布局后进行拼接,得到拼接后的图片,仅保留拼接后的图片中不超出mosaic画布的部分作为新的样本眼部图像。
并且采用letter_box函数对样本眼部图像进行指定尺寸的缩放,从而可以通过letter_box函数对样本眼部图像自适应的添加尽可能少的黑边,减少信息冗余,提升模型训练速度。在对样本眼部图像进行上述预处理操作时,样本眼部图像中的标记框信息也随之进行上述预处理操作。
待检测网络模型可以是yolov5模型,在通过yolov5模型进行模型训练之前,可以通过k-means聚类算法(k均值聚类算法)根据检测框的尺度对样本眼部图像集进行聚类,得到N个不同尺度的初始锚框信息,N的取值根据应用场景的不同可以不同,示例性的,N可以为3,也可以为4,还可以为其他整数,下文中为描述方便仅以N为3的情况进行示例性说明,对于N为其他取值的情况原理是相同的,在此不再赘述。在待检测网络模型训练过程中,待检测网络模型可以在初始锚框的基础上输出检测框,进而和真实框进行比对,计算两者差距,再反向更新,迭代网络参数,因此,可以通过设置初始锚框信息,加快模型收敛速度。
将当前3个尺度的所有输出的检测框与初始锚框信息计算宽高比,并与预先设置的比例阈值进行比较,如果检测框与初始锚框的宽高比中较大的值小于预先设置的比例阈值,则认为该检测框是正样本,否则认为该检测框是负样本,即当检测框与初始锚框的宽高比中较大的值大于等于预先设置的比例阈值,认为该检测框是负样本。由于正样本选取时,会将检测框放置在与样本眼部图像同等尺寸的S×S的网格中,因此可以把与正样本检测框中间点所在网格距离最近的两个网格中的中间点对应的检测框也当作正样本,那么,每个真实框在每个尺度上至少有3个检测框来训练,3个尺度上最少分配9个检测框。比例阈值可以根据过往经验或者实际需求进行设置,在具体应用中,可以将比例阈值设置为2。
将预处理后的样本数据输入根据上述操作配置后的待检测网络模型进行训练,得到输出结果,即多个回归区域以及各回归区域对应的该区域为虹膜或者瞳孔的分类结果,输出结果可以如图3c和图3d所示。图3c中的大圆为样本眼部图像中虹膜所处的区域,小圆为样本眼部图像中瞳孔所处的区域。图3d中的大圆为样本眼部图像中虹膜所处的区域,小圆为样本眼部图像中瞳孔所处的区域。
在S202中,在计算各回归区域与样本数据标注的区域之间的区域重叠程度时,以区域为矩形检测框为例,将回归区域记为检测框A,将样本数据标注的区域记为检测框B,那么,计算各回归区域与样本数据标注的区域之间的区域重叠程度就相当于计算检测框A与检测框B之间的重叠程度。
在一种可能的实施方式中,检测框A与检测框B之间的重叠程度可以采用IOU计算方法计算得到,即按照公式(1)计算得到:
其中,SA∩B表示检测框A和检测框B相交的面积,SA∪B表示检测框A和检测框B合并的面积。
在一种可能的实施方式中,检测框A与检测框B之间的重叠程度还可以采用CIOU计算方法计算得到,即按照公式(2)计算得到:
其中,IOU可以通过前述公式(1)计算得到,b表示检测框A的中心点,bgt表示检测框B的中心点,ρ(b,bgt)表示检测框A的中心点与检测框B的中心点之间的欧氏距离,c表示检测框A和检测框B的最小外接矩形的对角线的长度,α用于平衡检测框A和检测框B之间的比例一致性,v表示权重系数。
如图3b所示,图3b中两个实线的框分别为检测框A以及检测框B,虚线的框为检测框A和检测框B的最小外接矩形,图3b中的d表示检测框A的中心点与检测框B的中心点之间的欧氏距离ρ(b,bgt),图3b中的c表示检测框A和检测框B的最小外接矩形的对角线的长度。
v可以通过公式(3)计算得到:
其中,wgt表示检测框B的宽,hgt表示检测框B的高,w表示检测框A的宽,h表示检测框A的高。
α可以通过公式(4)计算得到:
其中,IOU可以通过前述公式(1)计算得到,v可以通过前述公式(3)计算得到。
选用该实施方式,通过CIOU计算检测框A与检测框B之间的重叠程度,相较于IOU,增加了中心点距离与检测框长宽比信息,对于虹膜以及瞳孔的检测训练效果更好,可以提高模型的收敛速度与精度。
在计算各回归区域对应的分类结果所表示的类别与样本数据中回归区域标注的类别之间的类别差异时,可以采用BCE loss(二分类交叉熵损失)进行计算。
示例性的,可以通过公式(5)计算得到某一回归区域对应的分类结果所表示的类别与样本数据中该回归区域标注的类别之间的类别差异:
loss p,y=-y×log(p)-(1-y)log(1-p)…(5)
其中,p表示某一回归区域对应的分类结果所表示的类别,y表示样本数据中该回归区域标注的类别,loss(p,y)表示某一回归区域对应的分类结果所表示的类别与样本数据中该回归区域标注的类别之间的类别差异。
在S203中,可以理解的是,当各回归区域与样本数据标注的区域之间的区域重叠程度越高,说明回归区域与样本数据标注的区域越相似,模型输出的回归区域越准确,即模型损失越小。当各回归区域对应的分类结果所表示的类别与样本数据中回归区域标注的类别之间的类别差异越小时,说明回归区域对应的分类结果所表示的类别越准确,模型输出的回归区域对应的分类结果越准确,即模型损失越小。因此,模型损失与重叠程度负相关,且与类别差异正相关。
在S204中,根据模型损失对待训练检测网络模型的网络参数进行调整,可以在调整次数达到预设次数时,认为当前经过调整的待训练检测网络模型为目标检测网络模型。在调整次数未达到预设次数时,执行将样本数据输入网络参数调整后的待训练检测网络模型,得到多个回归区域以及各回归区域对应的分类结果的步骤。也可以根据模型损失判断是否得到目标检测网络模型,当模型损失不再随着参数的调整而下降时,认为当前经过调整的待训练检测网络模型为得到目标检测网络模型,当模型损失还在下降时,执行将样本数据输入网络参数调整后的待训练检测网络模型,得到多个回归区域以及各回归区域对应的分类结果的步骤。
在一种可能的实施例中,如图4所示,前述步骤S102,包括:
S1021,将目标眼部图像输入预先训练的目标检测网络模型,得到目标检测网络模型输出的多个检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域。
S1022,对各检测虹膜区域和/或各检测瞳孔区域进行去重,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域。
选用该实施例,可以对目标检测网络模型的输出结果进行去重,从而去除输出结果中重复的检测虹膜区域和检测瞳孔区域,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域,从而减少候选虹膜区域以及候选瞳孔区域的数量,便于后续根据预设的虹膜区域与瞳孔区域的尺寸比例范围对候选虹膜区域以及候选瞳孔区域进行筛选,从而提高了确定目标眼部图像中虹膜和瞳孔所处区域的效率。
下面将分别对前述S1021-S1022进行说明,其中:
在S1021中,将目标眼部图像输入预先训练的目标检测网络模型,得到目标检测网络模型的输出结果,该输出结果为多个检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域。目标检测网络模型的输出结果可以如图3c和图3d所示。
在S1022中,根据前述目标检测网络模型的训练过程,目标检测网络模型是基于yolov5模型训练得到的,因此,目标检测网络模型输出的检测区域会有三种不同尺度的检测区域,且每个尺度上至少有3个检测区域,因此,目标检测网络模型输出的多个检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域中很有可能会存在重复性的输出结果,需要对检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域进行去重,从而减少候选虹膜区域以及候选瞳孔区域的数量,便于后续对目标虹膜区域以及目标瞳孔区域的确定。
下面将对S1022可能的实施方式进行示例性说明,参见下文中的方式1-方式3。
方式1:从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域,其中,虹膜区域集合初始时包括各检测虹膜区域。
具体的,根据各检测虹膜区域的置信度,将满足预设置信度条件的检测虹膜区域作为目标检测虹膜区域。预设置信度条件可以是置信度大于等于预设置信度阈值,即当检测虹膜区域的置信度大于等于预设置信度阈值时,将该检测虹膜区域作为目标检测虹膜区域。预设置信度阈值可以根据过往经验或者实际需求进行设置,在具体应用中,可以将置信度阈值设置为0.5。
在虹膜区域集合中确定与目标检测虹膜区域重叠程度大于预设重叠阈值的重复虹膜区域。
其中,在计算虹膜区域集合中的检测虹膜区域与目标检测虹膜区域之间的重叠程度时,以区域为矩形检测框为例,将虹膜区域集合中的检测虹膜区域记为检测框A,将目标检测虹膜区域记为检测框B,那么,计算虹膜区域集合中的检测虹膜区域与目标检测虹膜区域之间的重叠程度就相当于计算检测框A与检测框B之间的重叠程度。
检测框A与检测框B之间的重叠程度可以参照前述公式(1)或者公式(2)-公式(4)计算得到,在此不再赘述。
可以理解的是,检测虹膜区域与目标检测虹膜区域之间的重叠程度越大,说明该检测虹膜区域与目标检测虹膜区域越相似,即可以认为该检测虹膜区域与目标检测虹膜区域是重复的,因此可以将与目标检测虹膜区域重叠程度大于预设重叠阈值的检测虹膜区域作为重复虹膜区域。预设重叠阈值可以根据过往经验或者实际需求进行设置,在具体应用中,可以将预设重叠阈值设置为0.5。
若不满足预设循环条件,则将去除重复虹膜区域和目标检测虹膜区域的虹膜区域集合作为新的虹膜区域集合,返回执行从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;若满足预设循环条件,则将未被确定为重复虹膜区域的检测虹膜区域确定为候选虹膜区域,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域。
其中,预设循环条件可以指的是预设循环次数,当循环次数未达到预设循环次数,即不满足预设循环条件时,在虹膜区域集合中去除重复虹膜区域,得到新的虹膜区域集合,返回执行从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;当循环次数达到预设循环次数,即满足预设循环条件时,将未被确定为重复虹膜区域的检测虹膜区域确定为候选虹膜区域,也就是去除了重复的检测虹膜区域,实现了对检测虹膜区域进行去重,未被确定为重复虹膜区域的检测虹膜区域对应的检测瞳孔区域确定为候选瞳孔区域。
预设循环条件也可以指的是确定出的重复虹膜区域的数量大于等于预设重复虹膜区域数量,当确定出的重复虹膜区域的数量小于预设重复虹膜区域数量,即不满足预设循环条件时,在虹膜区域集合中去除重复虹膜区域,得到新的虹膜区域集合,返回执行从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;当确定出的重复虹膜区域的数量大于等于预设重复虹膜区域数量,即满足预设循环条件时,将未被确定为重复虹膜区域的检测虹膜区域确定为候选虹膜区域,也就是去除了重复的检测虹膜区域,实现了对检测虹膜区域进行去重,将未被确定为重复虹膜区域的检测虹膜区域对应的检测瞳孔区域确定为候选瞳孔区域。
选用该实施方式,可以根据各检测虹膜区域的置信度,确定出可信度更高的目标检测虹膜区域,并根据虹膜区域集合中的检测虹膜区域与目标检测虹膜区域之间的重叠程度对检测虹膜区域不断地进行筛选,直至满足预设循环条件为止,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域。通过置信度以及重叠程度对多个检测虹膜区域进行筛选,从而去除重复的检测虹膜区域,减少候选虹膜区域的数量,同时也减少了候选瞳孔区域的数量,便于后续对目标虹膜区域以及目标瞳孔区域的确定,提高了确定目标眼部图像中虹膜和瞳孔所处区域的效率。
方式2:从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域,其中,瞳孔区域集合初始时包括各检测瞳孔区域。
具体的,根据各检测瞳孔区域的置信度,将满足预设置信度条件的检测瞳孔区域作为目标检测瞳孔区域。预设置信度条件可以是置信度大于等于预设置信度阈值,即当检测瞳孔区域的置信度大于等于预设置信度阈值时,将该检测瞳孔区域作为目标检测瞳孔区域。预设置信度阈值可以根据过往经验或者实际需求进行设置,在具体应用中,可以将置信度阈值设置为0.5。
在瞳孔区域集合中确定与目标检测瞳孔区域重叠程度大于预设重叠阈值的重复瞳孔区域。
其中,在计算瞳孔区域集合中的检测瞳孔区域与目标检测瞳孔区域之间的重叠程度时,以区域为矩形检测框为例,将瞳孔区域集合中的检测瞳孔区域记为检测框A,将目标检测瞳孔区域记为检测框B,那么,计算瞳孔区域集合中的检测瞳孔区域与目标检测瞳孔区域之间的重叠程度就相当于计算检测框A与检测框B之间的重叠程度。
检测框A与检测框B之间的重叠程度可以参照前述公式(1)或者公式(2)-公式(4)计算得到,在此不再赘述。
可以理解的是,检测瞳孔区域与目标检测瞳孔区域之间的重叠程度越大,说明该检测瞳孔区域与目标检测瞳孔区域越相似,即可以认为该检测瞳孔区域与目标检测瞳孔区域是重复的,因此可以将与目标检测瞳孔区域重叠程度大于预设重叠阈值的检测瞳孔区域作为重复瞳孔区域。预设重叠阈值可以根据过往经验或者实际需求进行设置,在具体应用中,可以将预设重叠阈值设置为0.5。
若不满足预设循环条件,则将去除重复瞳孔区域和目标检测瞳孔区域的瞳孔区域集合作为新的瞳孔区域集合,返回执行从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;若满足预设循环条件,则将未被确定为重复瞳孔区域的检测瞳孔区域确定为候选瞳孔区域,得到多个候选瞳孔区域以及各候选瞳孔区域对应的候选虹膜区域。
其中,预设循环条件可以指的是预设循环次数,当循环次数未达到预设循环次数,即不满足预设循环条件时,在瞳孔区域集合中去除重复瞳孔区域,得到新的瞳孔区域集合,返回执行从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;当循环次数达到预设循环次数,即满足预设循环条件时,将未被确定为重复瞳孔区域的检测瞳孔区域确定为候选瞳孔区域,也就是去除了重复的检测瞳孔区域,实现了对检测瞳孔区域进行去重,未被确定为重复瞳孔区域的检测瞳孔区域对应的检测虹膜区域确定为候选虹膜区域。
预设循环条件也可以指的是确定出的重复瞳孔区域的数量大于等于预设重复瞳孔区域数量,当确定出的重复瞳孔区域的数量小于预设重复瞳孔区域数量,即不满足预设循环条件时,在瞳孔区域集合中去除重复瞳孔区域,得到新的瞳孔区域集合,返回执行从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;当确定出的重复瞳孔区域的数量大于等于预设重复瞳孔区域数量,即满足预设循环条件时,将未被确定为重复瞳孔区域的检测瞳孔区域确定为候选瞳孔区域,也就是去除了重复的检测瞳孔区域,实现了对检测瞳孔区域进行去重,将未被确定为重复瞳孔区域的检测瞳孔区域对应的检测虹膜区域确定为候选虹膜区域。
选用该实施方式,可以根据各检测瞳孔区域的置信度,确定出可信度更高的目标检测瞳孔区域,并根据瞳孔区域集合中的检测瞳孔区域与目标检测瞳孔区域之间的重叠程度对检测瞳孔区域不断地进行筛选,直至满足预设循环条件为止,得到多个候选瞳孔区域以及各候选瞳孔区域对应的候选虹膜区域。通过置信度以及重叠程度对多个检测瞳孔区域进行筛选,从而去除重复的检测瞳孔区域,减少候选瞳孔区域的数量,同时也减少了候选虹膜区域的数量,便于后续对目标虹膜区域以及目标瞳孔区域的确定,提高了确定目标眼部图像中虹膜和瞳孔所处区域的效率。
方式3:按照前述方式1和方式2的实施方式,同时对各检测虹膜区域以及各检测瞳孔区域进行去重,得到多个候选虹膜区域以及多个候选瞳孔区域。若出现某一候选虹膜区域无对应的候选瞳孔区域,或某一候选瞳孔区域无对应的候选虹膜区域的情况,则将该候选虹膜区域或该候选瞳孔区域去除,使得到的多个候选虹膜区域与多个候选瞳孔区域之间一一对应。
选用该实施方式,可以同时对各检测虹膜区域以及各检测瞳孔区域进行去重,能够更好的去除重复的检测虹膜区域以及重复的检测瞳孔区域,确保得到的各候选虹膜区域以及各候选瞳孔区域之间没有重复的区域,从而减少了候选瞳孔区域以及候选虹膜区域的数量,便于后续对目标虹膜区域以及目标瞳孔区域的确定,提高了确定目标眼部图像中虹膜和瞳孔所处区域的效率。
具体的,在步骤S1022实施过程中,可以按照方式1、方式2中的任意一种方式对各检测虹膜区域或各检测瞳孔区域进行去重,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域。也可以按照方式3的方案实施,即同时实施方式1和方式2的方案,从而对各检测虹膜区域和各检测瞳孔区域进行去重,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域。
在一种可能的实施例中,前述样本数据还可以包括:虹膜的圆心和/或半径以及瞳孔的圆心和/或半径。在样本数据制作过程中,除标注瞳孔和虹膜所处区域外,还可以对各样本眼部图像添加标签,标签的内容为虹膜的圆心和/或半径以及瞳孔的圆心和/或半径。瞳孔和虹膜的圆心可以通过瞳孔标记框以及虹膜标记框各自的对角线交点得到,可以将虹膜标记框的边长的一半作为虹膜的半径,将瞳孔标记框的边长的一半作为瞳孔的半径。并且,在对样本眼部图像进行预处理的过程中,对标签进行平滑处理,以减少模型过拟合。从而使得将目标眼部图像输入训练得到的目标检测网络模型后,还可以得到目标眼部图像中虹膜的圆心和/或半径以及瞳孔的圆心和/或半径。
但是当出现瞳孔或者虹膜的位置位于目标眼部图像边缘处的情况时,目标眼部图像中的瞳孔或者虹膜是不完整的,且瞳孔或者虹膜的圆心可能并不在目标眼部图像中,将目标眼部图像输入目标检测网络模型后,得到的候选虹膜区域以及候选瞳孔区域可能是矩形检测框的形式,此时,如果将矩形检测框的对角线交点作为瞳孔或者虹膜的圆心,也就使得瞳孔或者虹膜的圆心落在了目标眼部图像中,从而导致检测得到的瞳孔或者虹膜的圆心并不准确。并且,在瞳孔或者虹膜的位置位于目标眼部图像边缘处的情况下,目标眼部图像中瞳孔或者虹膜可能小于完整的瞳孔或者虹膜,此时,如果将矩形检测框任意边长度的一半作为瞳孔或者虹膜的半径,就会使检测得到的瞳孔或者虹膜的半径可能小于瞳孔或者虹膜的实际半径,从而导致检测得到的瞳孔或者虹膜的半径并不准确。因此,在瞳孔或者虹膜的位置位于眼部图像边缘处的情况下,按照上述方法得到的瞳孔以及虹膜的圆心和/或半径不够准确。基于此,在一种可能的实施例中,如图5所示,瞳孔和虹膜定位方法还包括:
S501,确定目标虹膜区域的长度和宽度中的较大值,作为第一最大尺寸。
S502,根据目标虹膜区域的位置、第一最大尺寸,确定目标眼部图像中虹膜的圆心和/或半径。
在一种可能的实施方式中,可以将第一最大尺寸的一半作为目标眼部图像中虹膜的半径,根据目标虹膜区域的位置,以第一最大尺寸的一半为半径做圆,使得目标眼部图像中虹膜的圆心位于目标虹膜区域的最长边的垂线上,且垂线与目标虹膜区域的最长边的相交点为目标虹膜区域的最长边的中点,从而得到目标眼部图像中虹膜的圆心。
在另一种可能的实施方式中,可以确定目标虹膜区域的长度和宽度中的较小值,作为第一最小尺寸,将第一最大尺寸的一半与第一最小尺寸之和作为目标眼部图像中虹膜的半径,根据目标虹膜区域的位置,以第一最大尺寸的一半与第一最小尺寸之和为半径做圆,使得目标眼部图像中虹膜的圆心位于目标虹膜区域的最长边的垂线上,且垂线与目标虹膜区域的最长边的相交点为目标虹膜区域的最长边的中点,从而得到目标眼部图像中虹膜的圆心。
S503,确定目标瞳孔区域的长度和宽度中的较大值,作为第二最大尺寸。
其中,目标瞳孔区域为目标虹膜区域对应的候选瞳孔区域。
S504,根据目标瞳孔区域的位置、第二最大尺寸,确定目标眼部图像中瞳孔的圆心和/或半径。
在一种可能的实施方式中,可以将第二最大尺寸的一半作为目标眼部图像中瞳孔的半径,根据目标瞳孔区域的位置,以第二最大尺寸的一半为半径做圆,使得目标眼部图像中瞳孔的圆心位于目标瞳孔区域的最长边的垂线上,且垂线与目标瞳孔区域的最长边的相交点为目标瞳孔区域的最长边的中点,从而得到目标眼部图像中瞳孔的圆心。
在另一种可能的实施方式中,可以确定目标瞳孔区域的长度和宽度中的较小值,作为第二最小尺寸,将第二最大尺寸的一半与第二最小尺寸之和作为目标眼部图像中瞳孔的半径,根据目标瞳孔区域的位置,以第二最大尺寸的一半与第二最小尺寸之和为半径做圆,使得目标眼部图像中瞳孔的圆心位于目标瞳孔区域的最长边的垂线上,且垂线与目标瞳孔区域的最长边的相交点为目标瞳孔区域的最长边的中点,从而得到目标眼部图像中瞳孔的圆心。
选用该实施例,可以分别根据目标虹膜区域以及目标瞳孔区域的位置、长度和宽度中的最大值,确定出目标眼部图像中虹膜的圆心和/或半径以及瞳孔的圆心和/或半径,从而能够更准确的计算出目标眼部图像中瞳孔以及虹膜的圆心和/或半径,使得到的目标眼部图像中虹膜以及瞳孔的位置信息更加丰富,更加准确。
在实际应用中,如图6所示,图6为本申请提供的瞳孔和虹膜定位方法的一种应用流程示意图,分为训练过程和推理过程两部分,训练过程用于训练得到目标检测网络模型,推理过程用于使用目标检测网络模型对输入的虹膜图像进行检测,得到输出结果,并对输出结果进行去重与校正,得到更为准确的检测结果。
具体的训练过程为:输入虹膜图像,该虹膜图像对应于前述样本眼部图像。
图像预处理,对输入的虹膜图像进行预处理,即对样本眼部图像进行预处理,具体的,可以按照前述S201中的预处理方法进行图像预处理。
将预处理后的样本眼部图像输入待训练的目标检测网络模型,进行前向推理,得到模型前向推理后输出的前向结果。具体的,可以将预处理后的样本眼部图像输入待训练的yolov5模型中,得到模型训练输出的前向结果,该前向结果包括分类结果和回归结果。回归结果用于表示样本眼部图像中瞳孔和虹膜所处的区域,分类结果用于表示某一检测框中为瞳孔还是虹膜。
对前向结果计算Loss(损失),并对当前模型在测试集上进行验证。具体的,可以按照前述S202中的方法对前向结果计算损失,并将当前模型在测试集上进行测试,得到测试结果,即得到当前模型在验证集上的精度。
判断当前模型是否在验证集上精度满足或者Loss不再下降,若是,即当前模型在验证集上精度满足或者Loss不再下降,则停止训练,保存模型权重,并将当前模型作为目标检测网络模型;若否,即当前模型在验证集上精度不满足或者Loss在下降,则返回执行输入模型前向,输出前向结果的步骤,继续对模型进行训练。
具体的推理过程为:输入虹膜图像,该虹膜图像对应于前述S101中的原始眼部图像。
图像预处理,对原始眼部图像进行图像预处理,得到目标眼部图像,具体的,可以根据前述S101中的预处理方法对原始眼部图像进行预处理,得到目标眼部图像。
将目标眼部图像输入目标检测网络模型,进行前向推理,得到目标检测网络模型前向推理后输出的前向结果。具体的,将目标眼部图像输入目标检测网络模型,得到前向结果,前向结果即为目标检测模型输出的多个检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域。
对推理结果进行后处理,包括NMS(非极大值抑制算法),虹膜、瞳孔圆心半径的计算修正。具体的,推理结果即为目标检测模型输出的多个检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域,可以按照前述S1022中的方法对各检测虹膜区域以及各检测瞳孔区域进行去重,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域;并按照前述S103-S104中的方法从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域,从而得到目标眼部图像中瞳孔以及虹膜所处的区域;按照前述S501-S504中的方法对目标眼部图像中虹膜、瞳孔圆心和半径的进行计算修正,从而得到目标眼部图像中虹膜、瞳孔圆心和半径,并输出虹膜和瞳孔的圆心和半径。
该实施例中,通过将目标眼部图像输入目标检测网络模型,得到推理结果,并对推理结果进行后处理,可以快速准确的从目标眼部图像中获取到虹膜与瞳孔的位置信息,即虹膜与瞳孔所处的区域以及虹膜与瞳孔的圆心和半径,且受睫毛,眼镜,眼睑等噪声影响较小。并且,由于虹膜与瞳孔的位置信息中包括对于虹膜与瞳孔所处区域的标注,因此得到的虹膜与瞳孔的位置信息可以直接作为用于虹膜归一化,眼球定位,视线追踪等算法的输出,不需要再进行其他的算法处理,相较于其他的虹膜定位方案来时,本实施例的方案效率更快。
对应于前述瞳孔和虹膜定位方法,本申请还提供了一种瞳孔和虹膜定位装置,如图7所示,包括:
图像获取模块701,用于获取目标眼部图像;
目标检测模块702,用于将目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各候选虹膜区域对应的候选瞳孔区域,其中,目标检测网络模型为预先基于样本数据训练得到的,样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;
目标虹膜区域确定模块703,用于从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;
虹膜瞳孔区域确定模块704,用于将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,并将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域。
在一种可能的实施例中,目标检测模块,包括:
检测区域输出单元,用于将目标眼部图像输入预先训练的目标检测网络模型,得到目标检测网络模型输出的多个检测虹膜区域以及各检测虹膜区域对应的检测瞳孔区域;
检测区域去重单元,用于对各检测虹膜区域和/或各检测瞳孔区域进行去重,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域。
在一种可能的实施例中,检测区域去重单元,对各检测虹膜区域和/或各检测瞳孔区域进行去重,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域,包括:
从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域,其中,虹膜区域集合初始时包括各检测虹膜区域;
在虹膜区域集合中确定与目标检测虹膜区域重叠程度大于预设重叠阈值的重复虹膜区域;
若不满足预设循环条件,则将去除重复虹膜区域和目标检测虹膜区域的虹膜区域集合作为新的虹膜区域集合,返回执行从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;
若满足预设循环条件,则将未被确定为重复虹膜区域的检测虹膜区域确定为候选虹膜区域,得到多个候选虹膜区域以及各候选虹膜区域对应的候选瞳孔区域;
和/或
从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域,其中,瞳孔区域集合初始时包括各检测瞳孔区域;
在瞳孔区域集合中确定与目标检测瞳孔区域重叠程度大于预设重叠阈值的重复瞳孔区域;
若不满足预设循环条件,则将去除重复瞳孔区域和目标检测瞳孔区域的瞳孔区域集合作为新的瞳孔区域集合,返回执行从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;
若满足预设循环条件,则将未被确定为重复瞳孔区域的检测瞳孔区域确定为候选瞳孔区域,得到多个候选瞳孔区域以及各候选瞳孔区域对应的候选虹膜区域。
在一种可能的实施例中,装置还包括:
模型训练模块,用于预先采用如下步骤基于样本数据训练得到目标检测网络模型:
将样本数据输入待训练检测网络模型,得到多个回归区域以及各回归区域对应的分类结果,分类结果用于表示虹膜或者瞳孔;
确定各回归区域与样本数据标注的区域之间的区域重叠程度,以及各回归区域对应的分类结果所表示的类别与样本数据中回归区域标注的类别之间的类别差异;
根据重叠程度和类别差异确定模型损失,模型损失与重叠程度负相关,且与类别差异正相关;
基于模型损失调整待训练检测网络模型的网络参数,得到目标检测网络模型。
在一种可能的实施例中,装置还包括:
第一最大尺寸确定模块,用于确定目标虹膜区域的长度和宽度中的较大值,作为第一最大尺寸;
虹膜圆心和/或半径确定模块,用于根据目标虹膜区域的位置、第一最大尺寸,确定目标眼部图像中虹膜的圆心和/或半径;
第二最大尺寸确定模块,用于确定目标瞳孔区域的长度和宽度中的较大值,作为第二最大尺寸,目标瞳孔区域为目标虹膜区域对应的候选瞳孔区域;
瞳孔圆心和/或半径确定模块,用于根据目标瞳孔区域的位置、第二最大尺寸,确定目标眼部图像中瞳孔的圆心和/或半径。
本申请实施例还提供了一种电子设备,如图8所示,包括:
存储器801,用于存放计算机程序;
处理器802,用于执行存储器801上所存放的程序时,实现如下步骤:
获取目标眼部图像;
将目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各候选虹膜区域对应的候选瞳孔区域,其中,目标检测网络模型为预先基于样本数据训练得到的,样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;
从各候选虹膜区域确定与对应的候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;
将目标虹膜区域确定为目标眼部图像中虹膜所处的区域,并将目标虹膜区域对应的候选瞳孔区域确定为目标眼部图像中瞳孔所处的区域。
并且上述电子设备还可以包括通信总线和/或通信接口,处理器802、通信接口、存储器801通过通信总线完成相互间的通信。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一瞳孔和虹膜定位方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一瞳孔和虹膜定位方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者固态硬盘Solid StateDisk(SSD)等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备以及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的较佳实施例,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

Claims (12)

1.一种瞳孔和虹膜定位方法,其特征在于,所述方法包括:
获取目标眼部图像;
将所述目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各所述候选虹膜区域对应的候选瞳孔区域,其中,所述目标检测网络模型为预先基于样本数据训练得到的,所述样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;
从各所述候选虹膜区域确定与对应的所述候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;
将所述目标虹膜区域确定为所述目标眼部图像中虹膜所处的区域,并将所述目标虹膜区域对应的所述候选瞳孔区域确定为所述目标眼部图像中瞳孔所处的区域。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各所述候选虹膜区域对应的候选瞳孔区域,包括:
将所述目标眼部图像输入预先训练的目标检测网络模型,得到所述目标检测网络模型输出的多个检测虹膜区域以及各所述检测虹膜区域对应的检测瞳孔区域;
对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域。
3.根据权利要求2所述的方法,其特征在于,所述对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域,包括:
从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域,其中,所述虹膜区域集合初始时包括各所述检测虹膜区域;
在所述虹膜区域集合中确定与所述目标检测虹膜区域重叠程度大于预设重叠阈值的重复虹膜区域;
若不满足预设循环条件,则将去除所述重复虹膜区域和所述目标检测虹膜区域的虹膜区域集合作为新的虹膜区域集合,返回执行所述从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;
若满足预设循环条件,则将未被确定为所述重复虹膜区域的所述检测虹膜区域确定为候选虹膜区域,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域;
和/或
从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域,其中,所述瞳孔区域集合初始时包括各所述检测瞳孔区域;
在所述瞳孔区域集合中确定与所述目标检测瞳孔区域重叠程度大于预设重叠阈值的重复瞳孔区域;
若不满足预设循环条件,则将去除所述重复瞳孔区域和所述目标检测瞳孔区域的瞳孔区域集合作为新的瞳孔区域集合,返回执行所述从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;
若满足预设循环条件,则将未被确定为所述重复瞳孔区域的所述检测瞳孔区域确定为候选瞳孔区域,得到多个候选瞳孔区域以及各所述候选瞳孔区域对应的候选虹膜区域。
4.根据权利要求1所述的方法,其特征在于,预先采用如下步骤基于样本数据训练得到所述目标检测网络模型,包括:
将所述样本数据输入待训练检测网络模型,得到多个回归区域以及各所述回归区域对应的分类结果,所述分类结果用于表示虹膜或者瞳孔;
确定各所述回归区域与所述样本数据标注的区域之间的区域重叠程度,以及各所述回归区域对应的分类结果所表示的类别与所述样本数据中所述回归区域标注的类别之间的类别差异;
根据所述重叠程度和所述类别差异确定模型损失,所述模型损失与所述重叠程度负相关,且与所述类别差异正相关;
基于所述模型损失调整所述待训练检测网络模型的网络参数,得到目标检测网络模型。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述目标虹膜区域的长度和宽度中的较大值,作为第一最大尺寸;
根据所述目标虹膜区域的位置、所述第一最大尺寸,确定所述目标眼部图像中虹膜的圆心和/或半径;
确定所述目标瞳孔区域的长度和宽度中的较大值,作为第二最大尺寸,所述目标瞳孔区域为所述目标虹膜区域对应的所述候选瞳孔区域;
根据所述目标瞳孔区域的位置、所述第二最大尺寸,确定所述目标眼部图像中瞳孔的圆心和/或半径。
6.一种瞳孔和虹膜定位装置,其特征在于,所述装置包括:
图像获取模块,用于获取目标眼部图像;
目标检测模块,用于将所述目标眼部图像输入预先训练的目标检测网络模型,得到多个候选虹膜区域和各所述候选虹膜区域对应的候选瞳孔区域,其中,所述目标检测网络模型为预先基于样本数据训练得到的,所述样本数据包括:标注有瞳孔和虹膜所处区域的样本眼部图像;
目标虹膜区域确定模块,用于从各所述候选虹膜区域确定与对应的所述候选瞳孔区域的尺寸比例在预设范围内的目标虹膜区域;
虹膜瞳孔区域确定模块,用于将所述目标虹膜区域确定为所述目标眼部图像中虹膜所处的区域,并将所述目标虹膜区域对应的所述候选瞳孔区域确定为所述目标眼部图像中瞳孔所处的区域。
7.根据权利要求6所述的装置,其特征在于,所述目标检测模块,包括:
检测区域输出单元,用于将所述目标眼部图像输入预先训练的目标检测网络模型,得到所述目标检测网络模型输出的多个检测虹膜区域以及各所述检测虹膜区域对应的检测瞳孔区域;
检测区域去重单元,用于对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域。
8.根据权利要求7所述的装置,其特征在于,所述检测区域去重单元,对各所述检测虹膜区域和/或各所述检测瞳孔区域进行去重,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域,包括:
从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域,其中,所述虹膜区域集合初始时包括各所述检测虹膜区域;
在所述虹膜区域集合中确定与所述目标检测虹膜区域重叠程度大于预设重叠阈值的重复虹膜区域;
若不满足预设循环条件,则将去除所述重复虹膜区域和所述目标检测虹膜区域的虹膜区域集合作为新的虹膜区域集合,返回执行所述从虹膜区域集合中确定置信度满足预设置信度条件的目标检测虹膜区域的步骤;
若满足预设循环条件,则将未被确定为所述重复虹膜区域的所述检测虹膜区域确定为候选虹膜区域,得到多个候选虹膜区域以及各所述候选虹膜区域对应的候选瞳孔区域;
和/或
从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域,其中,所述瞳孔区域集合初始时包括各所述检测瞳孔区域;
在所述瞳孔区域集合中确定与所述目标检测瞳孔区域重叠程度大于预设重叠阈值的重复瞳孔区域;
若不满足预设循环条件,则将去除所述重复瞳孔区域和所述目标检测瞳孔区域的瞳孔区域集合作为新的瞳孔区域集合,返回执行所述从瞳孔区域集合中确定置信度满足预设置信度条件的目标检测瞳孔区域的步骤;
若满足预设循环条件,则将未被确定为所述重复瞳孔区域的所述检测瞳孔区域确定为候选瞳孔区域,得到多个候选瞳孔区域以及各所述候选瞳孔区域对应的候选虹膜区域。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
模型训练模块,用于预先采用如下步骤基于样本数据训练得到所述目标检测网络模型:
将所述样本数据输入待训练检测网络模型,得到多个回归区域以及各所述回归区域对应的分类结果,所述分类结果用于表示虹膜或者瞳孔;
确定各所述回归区域与所述样本数据标注的区域之间的区域重叠程度,以及各所述回归区域对应的分类结果所表示的类别与所述样本数据中所述回归区域标注的类别之间的类别差异;
根据所述重叠程度和所述类别差异确定模型损失,所述模型损失与所述重叠程度负相关,且与所述类别差异正相关;
基于所述模型损失调整所述待训练检测网络模型的网络参数,得到目标检测网络模型。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第一最大尺寸确定模块,用于确定所述目标虹膜区域的长度和宽度中的较大值,作为第一最大尺寸;
虹膜圆心和/或半径确定模块,用于根据所述目标虹膜区域的位置、所述第一最大尺寸,确定所述目标眼部图像中虹膜的圆心和/或半径;
第二最大尺寸确定模块,用于确定所述目标瞳孔区域的长度和宽度中的较大值,作为第二最大尺寸,所述目标瞳孔区域为所述目标虹膜区域对应的所述候选瞳孔区域;
瞳孔圆心和/或半径确定模块,用于根据所述目标瞳孔区域的位置、所述第二最大尺寸,确定所述目标眼部图像中瞳孔的圆心和/或半径。
11.一种电子设备,其特征在于,包括:
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法。
CN202310521284.8A 2023-05-06 2023-05-06 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质 Pending CN116645719A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310521284.8A CN116645719A (zh) 2023-05-06 2023-05-06 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310521284.8A CN116645719A (zh) 2023-05-06 2023-05-06 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116645719A true CN116645719A (zh) 2023-08-25

Family

ID=87642610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310521284.8A Pending CN116645719A (zh) 2023-05-06 2023-05-06 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116645719A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117079058A (zh) * 2023-10-11 2023-11-17 腾讯科技(深圳)有限公司 图像处理方法和装置、存储介质及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117079058A (zh) * 2023-10-11 2023-11-17 腾讯科技(深圳)有限公司 图像处理方法和装置、存储介质及电子设备
CN117079058B (zh) * 2023-10-11 2024-01-09 腾讯科技(深圳)有限公司 图像处理方法和装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN110163300B (zh) 一种图像分类方法、装置、电子设备及存储介质
CN110795976B (zh) 一种训练物体检测模型的方法、装置以及设备
CN110647829A (zh) 一种票据的文本识别方法及系统
WO2020024585A1 (zh) 一种训练物体检测模型的方法、装置以及设备
CN111985458B (zh) 一种检测多目标的方法、电子设备及存储介质
EP4036796A1 (en) Automatic modeling method and apparatus for object detection model
CN111814905A (zh) 目标检测方法、装置、计算机设备和存储介质
CN112819821B (zh) 一种细胞核图像检测方法
CN113657202B (zh) 构件识别方法、构建训练集方法、装置、设备及存储介质
CN110969200A (zh) 基于一致性负样本的图像目标检测模型训练方法及装置
CN112001406A (zh) 一种文本区域检测方法及装置
CN111768405B (zh) 处理标注图像的方法、装置、设备和存储介质
CN116645719A (zh) 一种瞳孔和虹膜定位方法、装置、电子设备及存储介质
CN113065525A (zh) 年龄识别模型训练方法、人脸年龄识别方法及相关装置
CN110390261A (zh) 目标检测方法、装置、计算机可读存储介质及电子设备
CN110991220A (zh) 禽蛋检测、图像处理方法,装置、电子设备及存储介质
Wang et al. Detection of glands and villi by collaboration of domain knowledge and deep learning
CN111435445A (zh) 字符识别模型的训练方法及装置、字符识别方法及装置
EP4174769A1 (en) Method and apparatus for marking object outline in target image, and storage medium and electronic apparatus
CN113870254A (zh) 目标对象的检测方法、装置、电子设备及存储介质
CN106407991B (zh) 图像属性识别方法和系统以及相关网络训练方法和系统
CN115410250A (zh) 阵列式人脸美丽预测方法、设备及存储介质
CN112966757A (zh) 训练样本的扩展方法、装置、存储介质及设备
CN109299652B (zh) 一种用于图像定位的模型训练方法、图像定位方法及装置
CN112508130A (zh) 聚类方法及装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination