CN110378227A - 修正样本标注数据的方法、装置、设备及存储介质 - Google Patents
修正样本标注数据的方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110378227A CN110378227A CN201910520668.1A CN201910520668A CN110378227A CN 110378227 A CN110378227 A CN 110378227A CN 201910520668 A CN201910520668 A CN 201910520668A CN 110378227 A CN110378227 A CN 110378227A
- Authority
- CN
- China
- Prior art keywords
- initial
- center
- edge
- labeled data
- circular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/245—Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/193—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
- G06V40/197—Matching; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Ophthalmology & Optometry (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本公开关于修正样本标注数据的方法、装置、设备及存储介质,该方法包括:获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;计算每个搜索中心点与每个边缘像素点的距离值,确定该距离值次数中的最大次数;比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。本公开采用非人工审核校对方式修正样本标注数据,提高了标注数据的修正效率和准确率。
Description
技术领域
本公开涉及数据分类技术领域,尤其涉及修正样本标注数据的方法、装置、设备及存储介质。
背景技术
目前神经网络的应用越来越广泛,例如在图像识别领域基于神经网络的自学习功能,能够对图像进行目标识别并对识别的图像进行分类。利用神经网络模型解决图像识别分类的问题,首先需要利用大量的样本数据对神经网络模型进行训练,并且,需要对样本进行目标标注作为样本标注数据,利用样本数据以及样本标注数据对神经网络模型进行训练。
基于深度学习的神经网络模型的神经网络结构通常比较复杂,往往需要大量的训练样本对神经网络模型进行训练,训练过程一般为:向神经网络模型输入训练样本以及训练样本标注数据,依据对神经网络模型输出的训练样本标注数据与输入的训练样本标注数据进行匹配,根据匹配结果不断对神经网络模型中的各个参数进行调整,直到匹配结果满足用户需求,便完成对该神经网络模型的训练。
因此,在基于深度学习的神经网络模型训练中,训练样本目标标注数据是非常重要的一环,决定了利用训练样本训练完成后的神经网络模型的性能,如果训练样本目标标注数据不准确,则会降低神经网络模型的性能。现有技术中通常对人工标注的样本数据进行反复人工审核校正,逐个检查标注的样本数据,不仅获得的样本目标标注数据不够准确而且需耗费大量人力。
例如,通过基于深度学习的神经网络模型定位虹膜图像中的虹膜中心和预测虹膜半径时,需要大量的虹膜样本数据,以及虹膜样本标注数据对神经网络模型进行训练,从而利用训练好的神经网络模型来预测虹膜中心位置和虹膜半径,现有技术方案通常基于人工标注的虹膜中心坐标和虹膜边缘点坐标,进行反复人工审核校正,由于需要人工逐个检查并校正每一个标注数据,在训练样本量很大的情况下,需要耗费大量的人力和时间,并且,人工检查并校正后仍可能存在一定的误差,将存在误差的虹膜标注数据对神经网络模型进行训练,会导致神经网络模型输出的预测结果不够准确,降低神经网络模型的性能。
发明内容
本公开提供了一种修正样本标注数据的方法,基于预先标注的目标的初始中心坐标和初始边缘坐标,结合图像边缘特征,采用统计待测估计中心及对应的搜索半径的方法对预先标注的目标的初始中心坐标和初始边缘坐标进行修正,以获得更准确的标注数据。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种修正样本标注数据的方法,包括:
获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
根据本公开实施例的第二方面,一种修正样本标注数据的装置,包括:初始标注单元、待测单元、边缘检测单元、统计单元、修正单元,其中:
初始标注单元,被配置为执行获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
待测单元,被配置为执行根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
边缘检测单元,被配置为执行对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
统计单元,被配置为执行计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
修正单元,被配置为执行比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,用于实现如下步骤:
获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
第四方面,本发明提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面所述方法的步骤。
本发明提供的一种修正样本标注数据方法及设备,具有以下有益效果:
基于预先标注的目标的初始中心坐标和初始边缘坐标,结合图像边缘特征,采用统计待测估计中心及对应的搜索半径的方法对预先标注的目标的初始中心坐标和初始边缘坐标进行修正,以获得更准确的标注数据,从而利用更准确的标注数据对神经网络进行训练,一方面,能够提高神经网络模型预测的准确率,从而提高目标的中心坐标和边缘坐标预测的准确率;另一方面,采用非人工审核校对的方式修正标注数据,省去人工反复核对校正的过程,降低了人力成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种修正样本标注数据方法的流程图;
图2是根据一示例性实施例示出的一种虹膜样本数据生成方法的流程图;
图3是根据一示例性实施例示出的一种目标图像识别方法的流程图;
图4是根据一示例性实施例示出的一种修正样本标注数据设备的框图;
图5是根据一示例性实施例示出的一种修正样本标注数据装置的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
实施例1
本发明实施例能够修正圆形目标的标注数据,该圆形目标可以是代表待识别对象身份的圆形目标,尤其应用于对圆形目标边缘像素点的精准度要求较高的目标对象,可以但不限于是虹膜、人眼,当然还可以是其他类型的与待识别对象相关的圆形目标,例如可以为烟雾警报器、消防警铃、摄像头等各类待识别的圆形目标。
在应用于虹膜的标注数据时,基于预先标注的虹膜的初始边缘位置及初始中心位置,基于图像的边缘特征,采用边缘检测确定虹膜的边缘像素点,从而利用统计的方法从所述边缘像素点中确定出最为适合的边缘像素点对预先标注的标注数据进行修正。
图1是根据一示例性实施例示出的一种修正样本标注数据方法的流程图,如图1所示,包括以下步骤:
在步骤100中,获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置。
本实施例中所述包括圆形目标的图像样本,可以为上述任一类型的圆形目标,具体选取何种目标进行图像标注可由用户决定,不同类型的圆形目标的标注方式也可不同,可根据该圆形目标的特征决定标注方式,如根据圆形目标的大小来决定标注数据的多少,本实施例中所述图像样本包括但不限于包括人眼的图像样本。
其中,标注数据的标注方式包括但不限于通过人工标注的方法,预先标注所述图像样本中圆形目标的初始边缘位置及初始中心位置,其中若所述图像样本为包括虹膜的人眼图像样本时,预先标注的初始中心位置为虹膜的初始中心位置,预先标注的初始边缘位置为虹膜的初始边缘位置,其中,由于虹膜属于眼睛内的部分,一般图像中虹膜是位于眼睛内的,因此预先标注的虹膜的初始边缘位置可以为黑眼球与眼白交界的边缘位置,例如可以选取黑眼球与眼白交界处多个不同方向上的边缘位置坐标。本实施例对如何预先标注所述图像样本中圆形目标的初始边缘位置及初始中心位置不作过多限定。
在步骤101中,根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点。
本实施例中拟合得到的初始半径可以根据不同的圆形目标采用不同的拟合方式,如果所述圆形目标外围没有多余的物体,例如消防警铃、摄像头,可以根据预先标注的初始边缘位置,按预设规则选取多个初始边缘位置直接根据标注的位置进行拟合,从而确定初始半径;如果所述圆形目标外围存在多余的部分导致预先标注的初始边缘位置不够准确,例如虹膜外围由上眼皮和下眼皮组成,无法标注虹膜准确的初始边缘位置,因此预先标注的初始边缘位置并不是虹膜的实际边缘位置,需要利用曲线拟合的方法确定拟合的初始半径。
本实施例提供一种利用最小二乘法拟合初始边缘位置坐标,通过拟合得到的曲线方程确定拟合的初始半径的方法,可选的,根据所述初始边缘位置的坐标,利用最小二乘法拟合表达圆形的方程,根据所述表达圆形的方程确定所述初始半径。由于利用最小二乘法对预先标注的虹膜的边缘位置进行拟合,得到拟合的曲线方程,该曲线方程为圆的方程,从而确定拟合的初始半径,即虹膜的初始半径。
本实施例中的初始中心位置作为一个参考初始中心位置,按照预设方式生成与初始中心位置之间的距离在预设值范围内的多个待测中心位置,同时,将初始半径也作为一个参考初始半径,按照预设方式生成与初始半径差值在预设值范围内的多个半径;
在生成的上述多个半径和多个中心位置的基础上,按照相应的方式得到多组待测中心位置和对应的搜索半径,具体可以是随机生成,或者其他的选择方式生成,或者任意两两组合形成,本实施例不作过多限定。
本实施例基于初始中心位置,以及根据初始边缘位置拟合的初始半径,得到多组待测中心位置和对应的搜索半径,从而可以通过统计方法,从多组基于初始标注的数据(包括初始中心位置、初始边缘位置)中确定出质量最好的一组标注数据,从而利用该组标注数据修正初始标注数据。
作为一种可选的实施方式,通过如下方法确定多组待测数据(包括待测中心位置和对应的搜索半径):
1)以所述初始中心位置为中心,在预设半径范围内进行浮动,得到多个搜索中心点。
以所述初始中心位置为中心,在预设半径范围内进行浮动,得到多个搜索中心点。根据以初始中心位置为中心,根据预设半径形成的圆内所有像素点位置,随机或按距离初始中心位置较近的规则选取多个搜索中心点,例如,可以选取以初始虹膜中心位置为中心,根据若干个像素作为预设半径形成的圆内所有像素点位置,随机选取多个搜索中心点作为虹膜中心的待测范围;
2)将所述初始半径上下浮动设定幅度得到多个搜索半径。
将所述初始半径上下浮动设定幅度得到多个搜索半径,例如,可以将初始半径上下浮动若干个像素作为虹膜半径的搜索范围;
分别将其中任一待测中心位置及任一搜索半径进行组合,得到多组待测中心位置和对应的搜索半径。
在步骤102中,对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点。
本实施例中的边缘像素点可以是像素值不为零的像素点,也可以是其他具有边缘特征的像素值的像素点,具体可根据得到的目标边缘图像中表示边缘特征的像素点来确定,本实施例不作过多限定。
本实施例中对所述圆形目标进行边缘检测时,可以先确定包围所述圆形目标所在的最小区域,可以是基于预先标注的圆形目标所在区域的边缘坐标,确定包含该圆形目标的最小区域,其中预先标注的圆形目标所在的区域可以是与预先标注的圆形目标的初始边缘位置不同的边缘坐标,能够保证最大程度包含完整的圆形目标且不包含出目标外的多余部分,也可以是基于初始边缘位置及初始中心位置确定的最大初始半径,以初始中心及最大初始半径限定的圆形区域为圆形目标所在区域;或者,可以是初始边缘位置坐标中横纵轴最大的坐标值确定的最小包围区域,该最小包围区域的形状可以是矩形、梯形或其他多边形等;或者,可以是圆形目标所在的最小包围区域以预设放大因子外扩得到的,其中,该外扩得到的包围区域可以是矩形或其他形状。
作为一种可选的实施方式,对所述圆形目标进行边缘检测,包括:
确定包围所述圆形目标的最小矩形区域,将所述最小矩形区域向周边扩大设定比例;在扩大后的区域内对所述圆形目标进行边缘检测。
本实施例中,当所述圆形目标为虹膜时,包围所述圆形目标的最小矩形区域可以为根据预先标注的该虹膜图像中上眼皮所在的位置坐标,以及下眼皮所在的位置坐标确定的矩形区域,也可以通过预先标注的该虹膜图像中眼睛左上角的位置坐标,以及眼睛右下角的位置坐标确定的矩形区域。其中,所述确定的矩形区域可以是根据预先标注的虹膜图像中的位置坐标确定的最小矩形区域,也可以是所述最小矩形区域乘以预设放大因子的乘积向周边扩大设定比例所得到的区域。
例如,人工预先标注的虹膜图像中上眼皮上200个位置坐标,下眼皮上200个位置坐标,选择其中上眼皮和下眼皮中的横坐标最小的值和最大的值之间的距离,作为虹膜所在的最小矩形区域的长度,选择其中上眼皮和下眼皮中的纵坐标最小的值和最大的值之间的距离,作为虹膜所在的最小矩形区域的宽度,将该长度和宽度分别乘以1.3倍的放大因子,得到所述虹膜所在的矩形区域。本实施例中将确定的最小矩形区域以预设放大因子进行外扩,能够一定程度上避免由于人工标注的位置误差导致确定的最小区域不准确的技术问题。
确定目标所在区域后,对目标所在区域利用边缘检测算法进行目标边缘检测,其中,本实施例中可以利用多种边缘检测算子进行边缘检测算法,具体包括如下任一或任多种:一阶边缘检测算子,如Roberts Cross算子,Prewitt算子,Sobel算子,Kirsch算子,罗盘算子等;二阶边缘检测算子,如Marr-Hildreth算子,Canny算子,Laplacian算子等。本实施例中对选用何种边缘检测算法不作过多限定。
本实施例中可采用Canny算子对目标所在区域进行目标边缘检测,一般的,采用Canny算子进行目标边缘检测时,首先需要将目标所在区域的图像转换为灰度图,本实施例中获取的图像样本为RGB图像,确定目标所在区域后,将目标所在的区域裁剪出来,并将目标所在区域的RGB图转换为灰度图,以便于进行目标边缘检测。
边缘检测的目的是为了获得包括边缘像素点的目标边缘图像。基于统计方法从所述边缘像素点中选择最适合的边缘像素点对初始边缘位置进行修正。
在步骤103中,计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数。
作为一种可选的实施方式,本实施例中遍历的过程是按预设顺序遍历每组边缘像素点,其中,一组边缘像素点是由一个待测中心,及对应的一个搜索半径组成的圆内的所有边缘像素点。
在步骤104中,比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
每组边缘像素点进行搜索时,判断多个边缘像素点是否位于同一半径上的数量,该数量越多,说明越逼近圆形,也说明该最多数量对应的同一半径可作为本实施例中修正的半径,该最多数量对应的中心点位置可作为本实施例中修正的中心点位置,该最多数量对应的边缘像素点位置可作为本实施例中修正的边缘像素点位置。
作为一种可选的实施方式,遍历每组待测中心位置和对应的搜索半径内的所有边缘像素点,确定每组边缘像素点中相同距离值出现的最大次数,根据预设条件从每组边缘像素点集合中选择最大次数的边缘像素点,并从每组数量最大次数的边缘像素点中选择次数最大的边缘像素点作为修正的边缘位置,该组边缘像素点对应的待测中心位置作为修正的中心位置。
作为一种可选的实施方式,可采用如下方式比较各搜索中心点对应的最大次数中的最大值:
确定以待测中心为圆心,位于同一半径上且数量最多的边缘像素点集合。
可选的,对各组待测中心位置和对应的搜索半径内的所有边缘像素点按如下方式确定各搜索中心点对应的最大次数中的最大值:
以每个待测中心位置为中心,以对应的搜索半径搜索边缘像素点,根据每个边缘像素点与该待测中心的距离,确定位于同一半径上且数量最多的一个边缘像素点集合;从确定的所有的边缘像素点集合中,确定一个位于同一半径上且数量最多的边缘像素点集合。
例如,遍历每组待测中心位置和对应的搜索半径确定的圆内的边缘像素点,其中,一组待测中心位置和对应的搜索半径确定的圆内的边缘像素点,包括一个待测中心位置和对应的一个搜索半径确定的圆内的所有边缘像素点,以一组待测中心位置和对应的搜索半径为例,计算搜索到的每个边缘像素点与该待测中心的距离,并统计该距离出现的频数,选择频数最大的距离,以及该距离对应的边缘像素点和待测中心位置,即选择了位于同一半径上且数量最多的一个边缘像素点集合;
按该方式计算每组中每个边缘像素点与该组待测中心的距离,并统计该距离出现的频数,选择每组中频数最大的距离,按各组中频数进行排序,最后选择各组中频数最大的距离,以及该距离对应的边缘像素点和待测中心位置,即从确定的所有的边缘像素点集合中,确定一个位于同一半径上且数量最多的边缘像素点集合。
确定得到最大值对应的搜索中心点和距离值时,可以通过如下方式得到修正中心位置和修正边缘位置:
利用该待测中心点的位置作为修正中心位置,对应的边缘像素点位置作为修正边缘位置。同时,还可以根据最大值对应的距离值作为修正初始半径。
本实施例可以利用修正后得到的图像样本对神经网络模型进行训练,具体的训练过程如下:
1)向神经网络模型输入带标注数据的图像样本,其中标注数据包括圆形目标的修正边缘位置及修正中心位置;
2)依据对神经网络模型输出的标注数据与输入的标注数据进行匹配;
3)根据匹配结果不断对神经网络模型中的各个参数进行调整,直到匹配结果满足用户需求,便完成对该神经网络模型的训练。
本实施例中可以应用的神经网络模型可以是基于深度学习的神经网络模型,包括但不限于:R-CNN模型、Faster R-CNN模型、R-FCN模型、YOLO模型、SSD模型等。
实施例2
图2是根据一示例性实施例示出的一种虹膜样本数据生成方法的流程图,如图2所示,以虹膜标注为例,对本实施例提供的一种修正样本标注数据方法进行具体说明:
步骤200、获取带标注数据的图像样本,所述标注数据包括虹膜的初始边缘位置及初始中心位置;
具体的,可以获得人工标注的虹膜的初始边缘点坐标及初始中心坐标。
步骤201、确定包围虹膜的最小矩形区域;
具体的,将人工标注的虹膜的初始边缘点坐标中,最小的横坐标和纵坐标,最大的横坐标和纵坐标,分别以1.3倍的放大因子外扩,得到的矩形即为虹膜所在的最小矩形区域,主要目的是在包含完整眼睛的基础上尽量不包含人眼图像的其他部分。
步骤202、从人眼图像中将所述虹膜所在的最小矩形区域裁剪出来,并将裁剪出的图像转换为灰度图;
步骤203:对裁剪出的图像的灰度图进行目标边缘检测,得到包括边缘像素点的目标边缘图像;
步骤204、根据虹膜初始边缘位置确定拟合的虹膜初始半径;
具体的,通过最小二乘法对虹膜初始边缘坐标进行曲线拟合得到圆的方程,根据得到的圆的方程,获得拟合的虹膜初始半径。
步骤205、基于虹膜初始中心位置,以及根据虹膜初始边缘位置拟合的虹膜初始半径,得到多个待测中心位置和多个搜索半径。
步骤206、计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数。
按预设顺序依次从多个待测中心位置和多个搜索半径中选取一个待测中心位置及一个搜索半径作为一组,在该组中以选取的一个待测中心位置为圆心,一个搜索半径为半径画圆,确定该圆内的每个边缘像素点到该待测中心之间的直线距离,并统计该直线距离出现的次数,从该组中选取最大次数对应的距离,以及该距离对应的待测中心位置;
按上述方法从多个待测中心位置和多个搜索半径中确定多组,其中每组可以包含一个待测中心位置和一个搜索半径,从而得到每组待测中心位置和边缘像素点之间出现次数最多的直线距离。
步骤207、比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
按上述方法从确定的多组待测中心位置和搜索半径中,计算每组中的出现次数最多的直线距离,比较各组中出现次数最多的直线距离中的最大次数,从而将最大值对应的搜索中心点作为修正中心位置,将最大值对应的距离值作为修正半径,将最大值对应的边缘像素点位置作为修正边缘位置。
实施例3
图3是根据一示例性实施例示出的一种目标图像识别方法的流程图。参照图3,本发明还提供一种目标图像识别方法,如图3所示,该方法包括:
步骤300、获取目标图像;
步骤301、利用基于实施例1提供的修正样本标注数据的方法生成的样本数据训练的神经网络模型,对所述目标图像中的圆形目标进行识别,得到所述圆形目标的中心及边缘位置。
对所述目标图像中的圆形目标进行识别的过程为:
将待识别的目标图像输入所述神经网络模型中,神经网络模型对所述目标图像中的圆形目标进行识别,输出所述圆形目标的中心及边缘位置。
作为一种可选的实施方式,所述目标图像包括但不限于虹膜图像(人眼图像),利用所述神经网络模型对输入的虹膜图像进行识别,确定所述虹膜图像中虹膜的中心位置及边缘位置。
本实施例提供的目标图像识别方法,可以识别多类物体,包括但不限于人眼识别、虹膜识别、镜头识别、警铃识别、烟雾报警器识别等各类包含圆形目标的识别对象。
实施例4
基于相同的发明构思,本发明实施例二还提供一种电子设备,由于该设备即是本发明实施例中的方法中的设备,并且该设备解决问题的原理与该方法相似,因此该设备的实施可以参见方法的实施,重复之处不再赘述。
图4是根据一示例性实施例示出的一种电子设备的框图。参照图4,该设备包括:处理器400;用于存储所述处理器400可执行指令的存储器401;
其中,所述处理器400被配置为执行所述指令,用于实现如下步骤:
获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
作为一种可选的实施方式,所述处理器400具体用于:
将所述初始半径上下浮动设定幅度得到多个搜索半径;
以所述初始中心位置为中心,在预设半径范围内进行浮动,得到多个搜索中心点。
作为一种可选的实施方式,所述处理器400具体用于:
根据所述初始边缘位置的坐标,利用最小二乘法拟合表达圆形的方程,根据所述表达圆形的方程确定所述初始半径。
作为一种可选的实施方式,所述圆形目标为虹膜,所述图像样本为包括人眼的图像样本。
作为一种可选的实施方式,所述处理器400具体用于:
确定包围所述圆形目标的最小矩形区域,将所述最小矩形区域向周边扩大设定比例;
在扩大后的区域内对所述圆形目标进行边缘检测。
实施例5
图5是根据一示例性实施例示出的一种修正样本标注数据装置的框图。参照图5,该装置包括初始标注单元500、待测单元501、边缘检测单元502、统计单元503、修正单元504,其中:
该初始标注单元500被配置为执行获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
该待测单元501被配置为执行根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
该边缘检测单元502被配置为执行对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
该统计单元503被配置为执行计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
该修正单元504被配置为执行比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
作为一种可选的实施方式,所述待测单元501具体被配置为执行:
将所述初始半径上下浮动设定幅度得到多个搜索半径;
以所述初始中心位置为中心,在预设半径范围内进行浮动,得到多个搜索中心点。
作为一种可选的实施方式,所述待测单元501具体被配置为执行:
根据所述初始边缘位置的坐标,利用最小二乘法拟合表达圆形的方程,根据所述表达圆形的方程确定所述初始半径。
作为一种可选的实施方式,所述圆形目标为虹膜,所述图像样本为包括人眼的图像样本。
作为一种可选的实施方式,所述边缘检测单元502具体被配置为执行:
确定包围所述圆形目标的最小矩形区域,将所述最小矩形区域向周边扩大设定比例;
在扩大后的区域内对所述圆形目标进行边缘检测。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例6
本发明提供一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如下步骤:
获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种修正样本标注数据的方法,其特征在于,包括:
获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
2.根据权利要求1所述的方法,其特征在于,所述将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点步骤包括:
将所述初始半径上下浮动设定幅度得到多个搜索半径;
以所述初始中心位置为中心,在预设半径范围内进行浮动,得到多个搜索中心点。
3.根据权利要求1所述的方法,其特征在于,所述根据所述初始边缘位置进行圆形拟合得到初始半径步骤包括:
根据所述初始边缘位置的坐标,利用最小二乘法拟合表达圆形的方程,根据所述表达圆形的方程确定所述初始半径。
4.根据权利要求1所述的方法,其特征在于,所述圆形目标为虹膜,所述图像样本为包括人眼的图像样本。
5.根据权利要求1所述的方法,其特征在于,对所述圆形目标进行边缘检测,包括:
确定包围所述圆形目标的最小矩形区域,将所述最小矩形区域向周边扩大设定比例;
在扩大后的区域内对所述圆形目标进行边缘检测。
6.一种修正样本标注数据的装置,其特征在于,包括:
初始标注单元,被配置为执行获取带标注数据的图像样本,所述标注数据包括圆形目标的初始边缘位置及初始中心位置;
待测单元,被配置为执行根据所述初始边缘位置进行圆形拟合得到初始半径,将所述初始半径浮动得到多个搜索半径,将所述初始中心位置浮动得到多个搜索中心点;
边缘检测单元,被配置为执行对所述圆形目标进行边缘检测,得到所述圆形目标的边缘像素点;
统计单元,被配置为执行计算每个搜索中心点与每个边缘像素点连线得到的距离值,统计不大于各搜索半径的相同距离值出现的次数,从统计的次数中确定最大次数;
修正单元,被配置为执行比较各搜索中心点对应的最大次数中的最大值,根据最大值对应的搜索中心点和距离值,得到修正中心位置和修正边缘位置。
7.根据权利要求6所述的装置,其特征在于,所述待测单元具体被配置为执行:
将所述初始半径上下浮动设定幅度得到多个搜索半径;
以所述初始中心位置为中心,在预设半径范围内进行浮动,得到多个搜索中心点。
8.根据权利要求6所述的装置,其特征在于,所述圆形目标为虹膜,所述图像样本为包括人眼的图像样本。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项所述的一种修正样本标注数据的方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~5任一所述的一种修正样本标注数据的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910520668.1A CN110378227B (zh) | 2019-06-17 | 2019-06-17 | 修正样本标注数据的方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910520668.1A CN110378227B (zh) | 2019-06-17 | 2019-06-17 | 修正样本标注数据的方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110378227A true CN110378227A (zh) | 2019-10-25 |
CN110378227B CN110378227B (zh) | 2021-04-13 |
Family
ID=68248899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910520668.1A Active CN110378227B (zh) | 2019-06-17 | 2019-06-17 | 修正样本标注数据的方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110378227B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866930A (zh) * | 2019-11-18 | 2020-03-06 | 北京云聚智慧科技有限公司 | 语义分割辅助标注方法与装置 |
CN112948513A (zh) * | 2019-12-11 | 2021-06-11 | 中国石油天然气股份有限公司 | 能源分布趋势图的生成方法、装置及存储介质 |
CN113591965A (zh) * | 2021-07-26 | 2021-11-02 | 格力电器(南京)有限公司 | 一种aoi检测图像处理方法、装置、存储介质及计算机设备 |
CN115146622A (zh) * | 2022-07-21 | 2022-10-04 | 平安科技(深圳)有限公司 | 数据标注纠错方法、装置、电子设备及存储介质 |
WO2022247628A1 (zh) * | 2021-05-24 | 2022-12-01 | 华为技术有限公司 | 一种数据标注方法及相关产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070098234A1 (en) * | 2005-10-31 | 2007-05-03 | Mark Fiala | Marker and method for detecting said marker |
US8396284B2 (en) * | 2007-10-23 | 2013-03-12 | Leica Geosystems Ag | Smart picking in 3D point clouds |
CN105404868A (zh) * | 2015-11-19 | 2016-03-16 | 电子科技大学 | 一种基于交互平台的复杂背景中文本的快速检测方法 |
CN107895173A (zh) * | 2017-11-06 | 2018-04-10 | 国网重庆市电力公司电力科学研究院 | 标注图像目标的方法、装置、设备及可读存储介质 |
CN108875504A (zh) * | 2017-11-10 | 2018-11-23 | 北京旷视科技有限公司 | 基于神经网络的图像检测方法和图像检测装置 |
CN109614871A (zh) * | 2018-11-13 | 2019-04-12 | 远景能源(南京)软件技术有限公司 | 一种光伏屋顶及光伏障碍物自动识别算法 |
CN109886982A (zh) * | 2019-04-24 | 2019-06-14 | 数坤(北京)网络科技有限公司 | 一种血管图像分割方法、装置及计算机存储设备 |
-
2019
- 2019-06-17 CN CN201910520668.1A patent/CN110378227B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070098234A1 (en) * | 2005-10-31 | 2007-05-03 | Mark Fiala | Marker and method for detecting said marker |
US8396284B2 (en) * | 2007-10-23 | 2013-03-12 | Leica Geosystems Ag | Smart picking in 3D point clouds |
CN105404868A (zh) * | 2015-11-19 | 2016-03-16 | 电子科技大学 | 一种基于交互平台的复杂背景中文本的快速检测方法 |
CN107895173A (zh) * | 2017-11-06 | 2018-04-10 | 国网重庆市电力公司电力科学研究院 | 标注图像目标的方法、装置、设备及可读存储介质 |
CN108875504A (zh) * | 2017-11-10 | 2018-11-23 | 北京旷视科技有限公司 | 基于神经网络的图像检测方法和图像检测装置 |
CN109614871A (zh) * | 2018-11-13 | 2019-04-12 | 远景能源(南京)软件技术有限公司 | 一种光伏屋顶及光伏障碍物自动识别算法 |
CN109886982A (zh) * | 2019-04-24 | 2019-06-14 | 数坤(北京)网络科技有限公司 | 一种血管图像分割方法、装置及计算机存储设备 |
Non-Patent Citations (2)
Title |
---|
LIU C , SU T , YU L: "Self-Correction Method for Automatic Data Annotation", 《IAPR ASIAN CONFERENCE ON PATTERN RECOGNITION》 * |
卫保国 等: "Object tracking based on label correction and sample updating", 《计算机应用研究》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866930A (zh) * | 2019-11-18 | 2020-03-06 | 北京云聚智慧科技有限公司 | 语义分割辅助标注方法与装置 |
CN110866930B (zh) * | 2019-11-18 | 2022-04-12 | 北京云聚智慧科技有限公司 | 语义分割辅助标注方法与装置 |
CN112948513A (zh) * | 2019-12-11 | 2021-06-11 | 中国石油天然气股份有限公司 | 能源分布趋势图的生成方法、装置及存储介质 |
CN112948513B (zh) * | 2019-12-11 | 2024-03-26 | 中国石油天然气股份有限公司 | 能源分布趋势图的生成方法、装置及存储介质 |
WO2022247628A1 (zh) * | 2021-05-24 | 2022-12-01 | 华为技术有限公司 | 一种数据标注方法及相关产品 |
CN113591965A (zh) * | 2021-07-26 | 2021-11-02 | 格力电器(南京)有限公司 | 一种aoi检测图像处理方法、装置、存储介质及计算机设备 |
CN115146622A (zh) * | 2022-07-21 | 2022-10-04 | 平安科技(深圳)有限公司 | 数据标注纠错方法、装置、电子设备及存储介质 |
CN115146622B (zh) * | 2022-07-21 | 2023-05-05 | 平安科技(深圳)有限公司 | 数据标注纠错方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110378227B (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110378227A (zh) | 修正样本标注数据的方法、装置、设备及存储介质 | |
CN108764257B (zh) | 一种多视角的指针式仪表识别方法 | |
CN109662686B (zh) | 一种眼底黄斑定位方法、装置、系统及存储介质 | |
US8081818B2 (en) | Locating a feature in a digital image | |
CN103632136B (zh) | 人眼定位方法和装置 | |
US10964057B2 (en) | Information processing apparatus, method for controlling information processing apparatus, and storage medium | |
CN110148162A (zh) | 一种基于复合算子的异源图像匹配方法 | |
CN109840889A (zh) | 基于仿生算法的高精度视觉测量方法、装置和系统 | |
CN108765489A (zh) | 一种基于组合靶标的位姿计算方法、系统、介质及设备 | |
CN109086676A (zh) | 一种学生注意力分析系统及其判定方法 | |
CN110123257A (zh) | 一种视力检测方法、装置、视力检测仪及计算机存储介质 | |
CN104143185A (zh) | 一种污点区域检测方法 | |
CN109543665A (zh) | 图像定位方法及装置 | |
CN110189322A (zh) | 平整度检测方法、装置、设备、存储介质及系统 | |
CN108961184A (zh) | 一种深度图像的校正方法、装置及设备 | |
CN106501917A (zh) | 一种镜头辅助调焦方法和装置 | |
CN110008947A (zh) | 一种基于卷积神经网络的粮仓粮食数量监测方法及装置 | |
CN110910445B (zh) | 一种物件尺寸检测方法、装置、检测设备及存储介质 | |
CN109697441A (zh) | 一种目标检测方法、装置及计算机设备 | |
CN110261069B (zh) | 一种用于光学镜头的检测方法 | |
CN107590512A (zh) | 一种模板匹配中参数的自适应方法和系统 | |
CN106031148A (zh) | 成像设备,成像设备中自动对焦的方法以及对应计算机程序 | |
CN111192324B (zh) | 线段交点位置的确定方法、装置及可读存储介质 | |
US7416302B2 (en) | Ring location | |
CN105678763A (zh) | 一种稳定的直线/圆特征检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |