CN110782439B - 一种辅助检测图像标注质量的方法及装置 - Google Patents

一种辅助检测图像标注质量的方法及装置 Download PDF

Info

Publication number
CN110782439B
CN110782439B CN201910999898.0A CN201910999898A CN110782439B CN 110782439 B CN110782439 B CN 110782439B CN 201910999898 A CN201910999898 A CN 201910999898A CN 110782439 B CN110782439 B CN 110782439B
Authority
CN
China
Prior art keywords
images
image
edge
line
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910999898.0A
Other languages
English (en)
Other versions
CN110782439A (zh
Inventor
谢春鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunce Data Technology Co.,Ltd.
Original Assignee
Beijing Yunju Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunju Intelligent Technology Co ltd filed Critical Beijing Yunju Intelligent Technology Co ltd
Priority to CN201910999898.0A priority Critical patent/CN110782439B/zh
Publication of CN110782439A publication Critical patent/CN110782439A/zh
Application granted granted Critical
Publication of CN110782439B publication Critical patent/CN110782439B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Abstract

本申请公开了一种辅助检测图像标注质量的方法及装置,所述方法包括:获取待抽检的多个图像;对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;获取所述多个图像的边缘标注数据;基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。所述方法及装置,可以在降低抽样数量以降低检测工作量的同时,获得更好、更稳定的检测效果。

Description

一种辅助检测图像标注质量的方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种辅助检测图像标注质量的方法及装置。
背景技术
机器学习结果的优劣,深受训练数据(如样本图像)的标注质量的影响。为了保证训练数据的标注质量,需要对训练数据的标注结果进行质检。
目前,通过随机抽样的方式对训练数据的标注质量进行检测。随机抽样的检测效果取决于抽样比例,如果抽样比例较小可能会导致检测效果不稳定,例如,出现同一批数据第一次随机抽样检测不合格,第二次抽样检测却为合格的相反结果。抽样比例越高,检测效果越好,但抽样比例提高时,需要抽检的数据变多,导致检测工作量增大。
发明内容
本申请实施例提供一种辅助检测图像标注质量的方法及装置,以实现通过较少的检测工作量获得较好的检测效果的目的。
第一方面,本申请实施例提供一种辅助检测图像标注质量的方法,所述方法包括:
获取待抽检的多个图像;
对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;
获取所述多个图像的边缘标注数据;
基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;
基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。
第二方面,本申请实施例还提供一种辅助检测图像标注质量的装置,所述装置包括:
图像获取模块,用于获取待抽检的多个图像;
边缘检测模块,用于对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;
标注数据获取模块,用于获取所述多个图像的边缘标注数据;
标注质量评估模块,用于基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;
待检图像抽取模块,用于基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。
第三方面,本申请实施例还提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法的步骤。
本申请实施例采用的上述至少一个技术方案,由于可以先基于在待抽检的多个图像中检测出的边缘线和这多个图像的边缘标注数据,确定出这多个图像的标注质量评估参数,然后基于这多个图像的标注质量评估参数,从这多个图像中抽取待检图像,而不是随机的从这多个图像中抽取待检图像。因此,可以在降低抽样数量以降低检测工作量的同时,获得更好、更稳定的检测效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例提供的辅助检测图像标注质量的方法的流程示意图。
图2是图1所示方法中的步骤104的详细流程示意图之一。
图3是实现图2所示步骤202的原理示意图。
图4是实现图2所示步骤202的详细原理示意图。
图5是图1所示方法中的步骤104的详细流程示意图之二。
图6是实现图5所示步骤502的详细原理示意图。
图7是本申请实施例提供的辅助检测图像标注质量的装置的结构示意图。
图8是图7所述装置中标注质量评估模块704详细结构示意图之一。
图9是图7所述装置中标注质量评估模块704详细结构示意图之二。
图10为本申请实施例提供的一种电子设备1000的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了解决现有的图像标注质量检测方法不能以较少的检测工作量获得较好的检测效果的问题,本申请实施例提供了一种辅助检测图像标注质量的方法和装置,该方法的执行主体,可以包括但不限于个人电脑(Personal Computer,PC)、手机、IPAD、平板电脑、可穿戴设备等能够被配置为执行本申请实施例提供的方法的终端的至少一种,或者,该方法的执行主体,还可以是能够执行该方法的客户端本身。
下面先对本申请实施例提供的一种辅助检测图像标注质量的方法进行说明。
如图1所示,本申请实施例提供的一种辅助检测图像标注质量的方法,该方法可以包括如下步骤:
步骤101、获取待抽检的多个图像。
待抽检的多个图像可以是已完成标注且需要质检的一批图像。在一个例子中,这多个图像具体可以是已完成物体边缘标注且需要质检的图像,这多个图像的边缘标注工作可以是人工完成的,也可以是借助一定的自动化手段自动完成的。这多个图像可以存储在指定的存储位置,步骤101可以从该存储位置读取这些图像。
步骤102、对所述多个图像进行边缘检测,确定所述多个图像中的边缘线。
在实际应用中,可以采用相关技术已有的边缘检测算法,如Sobel算法、Laplacian算法、Canny算法等算法中的任意一种;或者,可以采用未来出现的新的边缘检测算法,确定或提取所述多个图像中的边缘线。
其中,应用边缘检测算法对这多个图像进行边缘提取时所采用的阈值可以根据经验设定,也可以根据一定的规则不断优化得到。本说明书会在下文中对该阈值以及本说明书中述及的其他阈值的优化方式进行统一说明,此处暂不赘述。并且,为方便与本说明书中述及的其他阈值区分,可将边缘检测算法采用的阈值称为第一阈值。
可选地,在对步骤101中获取的多个图像执行步骤102之前,图1所示的辅助检测图像标注质量的方法,还可以包括:对这多个图像进行高斯模糊处理,以减少图像中的噪点对检测结果的不良影响。
具体可以应用相关技术已有的或未来出现的新的高斯模糊算法,对这多个图像进行高斯模糊处理。其中,应用高斯模糊算法对这多个图像进行模糊处理时所采用的阈值可以根据经验设定,也可以根据一定的规则不断优化得到(具体优化方式参见下文)。并且,为方便与本说明书中述及的其他阈值区分,可将高斯模糊算法采用的阈值称为第二阈值。
步骤103、获取所述多个图像的边缘标注数据。
顾名思义,图像的边缘标注数据即为标注该图像中的物体边缘的数据。
作为一个例子,一个图像的边缘标注数据,可以是用于勾勒该图像中的物体边缘的散点。具体的,可以是这些散点在该图像中的坐标。
作为另一个例子,一个图像的边缘标注数据,可以是用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。具体的,可以是这些多边形的顶点的坐标集合。
步骤104、基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数。
示例性地,图像的标注质量评估参数可以是图像中标注的边缘与步骤102中检测出的边缘线的边缘不贴合程度评分或边缘贴合程度评分。可以理解,图像的边缘不贴合程度评分越高,说明图像中标注的边缘与步骤102中检测出的边缘线的贴合程度越低,标注质量越差;反之,图像的边缘不贴合程度评分越低,说明图像中标注的边缘与步骤102中检测出的边缘线的贴合程度越高,标注质量越好。同理,图像的边缘贴合程度评分越高,说明图像中标注的边缘与步骤102中检测出的边缘线的贴合程度越高,标注质量越好;反之,图像的边缘贴合程度评分越低,说明图像中标注的边缘与步骤102中检测出的边缘线的贴合程度越低,标注质量越差。
相应的,步骤104的目的在于,通过分别比对多个图像的边缘标注数据与步骤102中检测出的边缘线,得到在这多个图像中标注出的边缘与步骤102中检测出的边缘线的边缘不贴合程度评分或边缘贴合程度评分。下面通过两种实施方式对步骤104进行详细地说明。
第一种实施方式
假如一个图像的边缘标注数据,是用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。则,如图2所示,步骤104具体可以包括:
步骤201、对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段。
可以理解,当一个图像中包含多个物体时,可在该图像中标注出多个顶点集合,为了使确定出的该图像的标注质量评估参数更准确,具体实现时,可以基于该图像中的全部或大部分顶点集合,在该图像中绘制得到多个线段。
如图3所示,假如一个图像中包含云朵这样一个物体,其中,粗实线表示的是步骤102通过边缘检测算法检测到的云朵边缘线31,13个黑点是标注得到的用于表示云朵边缘的一个多边形的顶点集合32,则将这13个黑点进行连接之后即可得到多个线段33(用虚线表示)。
需要说明的是,下述步骤202和步骤203也是针对于所述多个图像中的每一图像而言的。
步骤202、基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,其中,所述第一点为所述线段上的点,所述第二点为目标垂线与该图像中的所述边缘线的交点,所述目标垂线以所述第一点为中心且垂直于所述线段,以及所述目标垂线的长度为预设长度。
图4示出了确定一条线段33的标注质量评估参数的原理示意图。如图4所示,基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,具体可以包括如下子步骤:
子步骤1、在线段33上按预设步长确定多个第一点,如在线段33上确定出均匀分布的a1、a2、a3、···、a10共10个第一点,其中,预设步长可以根据需要进行设定。当然,也可以不按预设步长在线段33上确定出多个第一点,也即可以在线段33上确定出非均匀分布的多个第一点。
子步骤2、以每一第一点为中心绘制与线段33垂直的多条垂线,得到多条所述目标垂线,如得到分别以a1、a2、a3、···、a10为中心的目标垂线:l1、l2、l3、···、l10。
子步骤3、确定每一目标垂线与该图像中的边缘线的交点,如分别确定l1、l2、l3、···、l10与第一边缘线311的交点,得到交点:b1、b2、b6、b7、b8、b9和b10,以及分别确定l1、l2、l3、···、l10与第二边缘线312的交点,得到交点:c1、c5、c6和c7。
可选地,如果目标垂线与该图像中的边缘线不存在交点,如图4中的l3和l4与第一边缘线311和第二边缘线312均没有交点,则忽略引出这两条垂线的第一点,如忽略a3和a4。原因是:如果交点不存在,有可能是步骤102中采用的边缘检测算法的检测能力有限没有检测出相应的边缘线,也有可能是线段33存在严重的边缘不贴合问题,如果线段33存在严重的边缘不贴合问题,则线段33上的其余第一点也能检测出该线段的边缘不贴合问题,所以可以将这样的第一点忽略。
子步骤4、将每一所述目标垂线上距离所述线段最近的交点确定为所述第二点,如将b1、b2、c5、b6(b6距a6比c6距a6更近)、c7(c7距a7比b7距a7更近)、b8、b9和b10确定为所述第二点。
子步骤5、基于每一所述第一点与指定第二点之间的距离,确定所述第一点的标注质量评估参数,所述指定第二点与所述第一点位于同一所述目标垂线上。
其中,第一点的标注质量评估参数可以为第一点与步骤102中检测出的边缘线的边缘不贴合程度评分或边缘贴合程度评分。
如果第一点的标注质量评估参数为边缘不贴合程度评分,则:可以基于b1与a1之间的距离确定a1的边缘不贴合程度评分,基于b2与a2之间的距离确定a2的边缘不贴合程度评分,基于c5与a5之间的距离确定a5的边缘不贴合程度评分,基于b6与a6之间的距离确定a6的边缘不贴合程度评分,基于c7与a7之间的距离确定a7的边缘不贴合程度评分,基于b8与a8之间的距离确定a8的边缘不贴合程度评分,基于b9与a9之间的距离确定a9的边缘不贴合程度评分,以及基于b10与a10之间的距离确定a10的边缘不贴合程度评分。
作为一个例子,可以直接将第一点与指定第二点之间距离确定为第一点的边缘不贴合程度评分,也可以将第一点与指定第二点之间距离进行转化得到第一点的边缘不贴合程度评分。
子步骤6、基于所述多个第一点的标注质量评估参数,确定所述线段的标注质量评估参数。
作为一个例子,可以先基于多个所述第一点的标注质量评估参数,确定所述多个第一点中不满足第一预设要求的目标点数;然后基于所述目标点数与所述第一点的总数之比,确定所述线段的标注质量评估参数。
其中,线段的标注质量评估参数可以为该线段与步骤102中检测出的边缘线的边缘不贴合程度评分或边缘贴合程度评分。
如果第一点的标注质量评估参数为第一点与步骤102中检测出的边缘线的边缘不贴合程度评分,第一预设要求可以是第一点的标注质量评估参数小于或等于第三阈值。具体的,如果第一点的标注质量评估参数用所述第一点与指定第二点之间的距离表征,则第一预设要求可以标注质量评估参数小于或等于第一预设距离(如图4中的L),如果第一点与指定第二点之间的距离大于L,则确定该第一点不满足第一预设要求,该第一点属于目标点,或者说该第一点为边缘不贴合的点,其中,第一预设距离L即为上述第三阈值。
由于a5、a7和a8与相应的指定第二点之间的距离大于L,因此可以将a5、a7和a8确定为目标点。
由此,可以确定出a1-a10这10个第一点中,目标点包括a5、a7和a8共3个,相应的,图4中的线段33的标注质量评估参数(边缘不贴合程度评分)可以为:3/10=0.3。可以理解,基于这种方法确定出的所述线段的标注质量评估参数的取值在0到1之间。
步骤203、基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数。
作为一个例子,步骤203可以包括:基于所述多个线段的标注质量评估参数,确定所述多个线段中不满足第二预设要求的目标线段的数量;基于所述目标线段的数量与该图像中所述线段的总数之比,确定该图像的标注质量评估参数。
参考上述步骤202中所举的例子可知,作为一个例子,线段的标注质量评估参数可以为边缘不贴合程度评分,用0到1之间的数值表示。因此,第二预设要求可以是线段的标注质量评估参数小于或等于第四阈值,例如,第四阈值可以取0.3。
假如,图像的标注质量评估参数也用边缘不贴合程度评分表示,且一个图像中共绘制出了100条线段,其中30条线段的标注质量评估参数不满足第二预设要求,则该图像的标注质量评估参数可以表示为:30/100=0.3。
第二种实施方式
如果一个图像的边缘标注数据,是用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。则,如图5所示,步骤104具体可以包括:
步骤501、对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段。
此步骤的具体实现过程与上文中的步骤201类似,请参考上文。
步骤502、基于所述线段上的多个点与该图像中的所述边缘线之间的最短距离,确定所述线段的标注质量评估参数。
例如,如图6所示,可以均匀地(按预设步长)在线段33上取a1、a2、a3、…、a10共10个第一点,然后确定这10个第一点与第一边缘线311的最短距离,再依据每一第一点对应的该最短距离,确定每一第一点的标注质量评估参数;最后依据这10第一点的标注质量评估参数,确定线段33的标注质量评估参数。
其中,第一点的标注质量评估参数可以为第一点与第一边缘线311的边缘不贴合程度评分或边缘贴合程度评分,线段33的标注质量评估参数也可以是线段33与第一边缘线311的边缘不贴合程度评分或边缘贴合程度评分。
作为一个例子,可以直接将第一点与第一边缘线311之间的最短距离确定为第一点的边缘不贴合程度评分,也可以将第一点与指定第二点之间距离进行转化得到第一点的边缘不贴合程度评分。
作为一个例子,可以先基于多个第一点的标注质量评估参数,确定所述多个第一点中不满足第三预设要求的目标点数;然后基于所述目标点数与第一点的总数之比,确定所述线段的标注质量评估参数。
如果第一点的标注质量评估参数为第一点与第一边缘线311的边缘不贴合程度评分,第三预设要求可以是第一点的标注质量评估参数小于或等于第五阈值。具体的,如果第一点的标注质量评估参数用所述第一点与第一边缘线311之间的最短距离表征,则第三预设要求可以标注质量评估参数小于或等于第二预设距离,如果第一点与指定第二点之间的距离大于第二预设距离,则确定该第一点不满足第三预设要求,该第一点属于目标点,或者说该第一点为边缘不贴合的点,其中,第二预设距离即为上述第五阈值。
步骤503、基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数。
此步骤的具体实现过程与上文中的步骤203类似,请参考上文。
可以理解,通过上述两种实施方式,可以确定出所述多个图像中每一图像的标注质量评估参数。
可选地,在上述两种实施方式中的任一实施方式的基础上,本申请实施例提供的一种辅助检测图像标注质量的方法,还可以包括:
对所述多个图像中的所述目标线段进行标记;
其中,所述目标线段的标注质量越差标记越明显。
在实际应用中,可以用同一颜色的不同深浅程度对不同标注质量的目标线段进行标记,目标线段的标注质量越差颜色越深,目标线段的标注质量越好颜色越浅;或者,可以用不同颜色对不同标注质量的目标线段进行标记,目标线段的标注质量越差颜色越醒目。
可以理解,对目标线段进行标记之后,可以帮助质检人员或质检软件更快速地定位出标注质量不满足要求的标注位置。
步骤105、基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。
在一个例子中,步骤105可以包括:
基于所述多个图像的标注质量评估参数,确定所述多个图像中标注质量不满足第四预设要求的多个目标图像;
按照预设抽样比例,从所述多个目标图像中抽取待检图像。
具体的,如果图像的标注质量评估参数为边缘不贴合程度评分,第四预设要求可以是边缘不贴合程度评分小于或等于第六阈值。例如,假设待抽检的图像共有1000张,其中有300张的边缘不贴合程度评分大于所述第六阈值,则可以从这300张中抽取待检图像。不难理解,相比于相关技术中从1000张中随机抽取待检图像,本申请实施例提供的辅助检测图像标注质量的方法,不仅可以缩小待检图像抽取范围,从而减少质检工作量,而且是在标注质量不满足第四预设要求的目标图像中抽取待检图像,因此还能够帮助质检人员更好、更快的定位问题,从而取得稳定的质检效果。
总之,本申请实施例提供的一种辅助检测图像标注质量的方法,由于可以先基于待抽检的多个图像(一批图像)中检测出的边缘线和这多个图像的边缘标注数据,确定出这多个图像的标注质量评估参数,然后基于这多个图像的标注质量评估参数,从这多个图像中抽取待检图像,而不是随机的从这多个图像中抽取待检图像。因此,可以在降低抽样数量从而降低检测工作量的同时,获得更好、更稳定的检测效果。
可选地,在另一实施例中,本申请实施例提供的一种辅助检测图像标注质量的方法,在步骤102之前,还可以包括:
对目标参数进行优化,其中,所述目标参数包括:第一阈值、第二阈值、第三阈值、第四阈值、第五阈值和第六阈值,目标垂线的预设长度,以及可被忽略的第一点的类型等参数中的至少一种。
其中,第一阈值为上文中述及的边缘检测算法采用的阈值,第二阈值为上文中述及的高斯模糊算法采用的阈值,第三阈值为上文述及的第一预设距离L,第四阈值上文所述的第二预设要求中规定的阈值,第五阈值为上文所述的第二预设距离,第六阈值为上文所述的第四预设要求中规定的阈值,可被忽略的第一点类型可以是从该第一点引出的目标垂线与检测出的边缘线没有交点的第一点(当然也可以是其他类型)。
具体的,所述对目标参数进行优化包括:
从待抽检的所述多个图像中随机抽取预设数量的一小批图像;
对这一小批图像执行上述步骤102至步骤105,以实现对这一小批图像的标注质量的辅助检测;
获取针对这一小批图像的标注质量检测结果;
根据这一小批图像的标注质量检测结果,调整上述目标参数,并返回对这一小批图像再次执行上述步骤102至步骤105,直到这一小批图像的标注质量检测结果达到第五预设要求;其中,第五预设要求可以包括:能准确定位出边缘不贴合的标注线段,同时不存在或存在很少的误检情况。
可以理解,当采用优化后的目标参数能很好地辅助检测上述一小批图像的标注质量时,即可以采用这样的目标参数辅助检测大批量图像的标注质量。此外,对一小批图像标注质量的辅助检测来说,计算工作量小,计算速度快,因此可以很快完成目标参数的优化。
以上对本申请实施例提供的辅助检测图像标注质量的方法进行了说明,下面结合附图对相应于上述辅助检测图像标注质量的方法的辅助检测图像标注质量的装置进行介绍。
如图7所示,本申请实施例提供的辅助检测图像标注质量的装置700,可以包括:图像获取模块701、边缘检测模块702、标注数据获取模块703、标注质量评估模块704和待检图像抽取模块。
图像获取模块701,用于获取待抽检的多个图像;
边缘检测模块702,用于对所述多个图像进行边缘检测,确定所述多个图像中的边缘线。
可选地,图7所示的辅助检测图像标注质量的装置700,还可以包括:预处理模块,用于在对所述多个图像进行边缘检测,确定所述多个图像中的边缘线之前,对所述多个图像进行高斯模糊处理,以减少图像中的噪点对检测结果的不良影响。
标注数据获取模块703,用于获取所述多个图像的边缘标注数据。
标注质量评估模块704,用于基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数。
示例性地,图像的标注质量评估参数可以是图像中标注的边缘与步骤102中检测出的边缘线的边缘不贴合程度评分或边缘贴合程度评分。
相应的,标注质量评估模块704具体用于:通过分别比对多个图像的边缘标注数据与边缘检测模块702检测出的边缘线,得到在这多个图像中标注出的边缘与边缘检测模块702检测出的边缘线的边缘不贴合程度评分或边缘贴合程度评分。下面通过两种实施方式对标注质量评估模块704进行详细地说明。
第一种实施方式
假如一个图像的边缘标注数据,是用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。则,如图8所示,标注质量评估模块704具体可以包括:第一线段绘制子模块801、第一线段评估子模块802和第一图像评估子模块803。
第一线段绘制子模块801,用于对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段。
第一线段评估子模块802,用于基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,其中,所述第一点为所述线段上的点,所述第二点为目标垂线与该图像中的所述边缘线的交点,所述目标垂线以所述第一点为中心且垂直于所述线段,以及所述目标垂线的长度为预设长度。
具体的,第一线段评估子模块802可用于:
在所述线段上按预设步长确定多个所述第一点;
以每一所述第一点为中心绘制与所述线段垂直的多条垂线,得到多条所述目标垂线;
确定每一所述目标垂线与该图像中的所述边缘线的交点;
将每一所述目标垂线上距离所述线段最近的交点确定为所述第二点;
基于每一所述第一点与指定第二点之间的距离,确定所述第一点的标注质量评估参数,所述指定第二点与所述第一点位于同一所述目标垂线上;
基于所述多个第一点的标注质量评估参数,确定所述线段的标注质量评估参数,例如,基于多个所述第一点的标注质量评估参数,确定所述多个第一点中不满足第一预设要求的目标点数;基于所述目标点数与所述第一点的总数之比,确定所述线段的标注质量评估参数。
第一图像评估子模块803,用于基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数。
具体的,第一图像评估子模块803可用于:
基于所述多个线段的标注质量评估参数,确定所述多个线段中不满足第二预设要求的目标线段的数量;
基于所述目标线段的数量与该图像中所述线段的总数之比,确定该图像的标注质量评估参数。
第二种实施方式
假如一个图像的边缘标注数据,是用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形。则,如图9所示,标注质量评估模块704具体可以包括:第二线段绘制子模块901、第二线段评估子模块902和第二图像评估子模块903。
第二线段绘制子模块901,用于对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段。
此模块执行的功能与上文中的第一线段绘制子模块801执行的功能类似,请参考上文。
第二线段评估子模块902,用于基于所述线段上的多个点与该图像中的所述边缘线之间的最短距离,确定所述线段的标注质量评估参数。
作为一个例子,第二线段评估子模块902,具体可用于:
基于多个第一点的标注质量评估参数,确定所述多个第一点中不满足第三预设要求的目标点数。
基于所述目标点数与第一点的总数之比,确定所述线段的标注质量评估参数。
第二图像评估子模块903,用于基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数。
此模块执行的功能与上文中的第一图像评估子模块803执行的功能类似,请参考上文。
可以理解,通过上述两种实施方式,可以确定出所述多个图像中每一图像的标注质量评估参数。
可选地,在上述两种实施方式中的任一实施方式的基础上,本申请实施例提供的一种辅助检测图像标注质量的装置700,还可以包括:
标记模块,用于对所述多个图像中的所述目标线段进行标记;
其中,所述目标线段的标注质量越差标记越明显。
可以理解,对目标线段进行标记之后,可以帮助质检人员或质检软件更快速地定位出标注质量不满足要求的标注位置。
待检图像抽取模块705,用于基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像。
在一个例子中,待检图像抽取模块705具体可用于:
基于所述多个图像的标注质量评估参数,确定所述多个图像中标注质量不满足第四预设要求的多个目标图像;
按照预设抽样比例,从所述多个目标图像中抽取待检图像。
本申请实施例提供的一种辅助检测图像标注质量的装置700,由于可以先基于待抽检的多个图像(一批图像)中检测出的边缘线和这多个图像的边缘标注数据,确定出这多个图像的标注质量评估参数,然后基于这多个图像的标注质量评估参数,从这多个图像中抽取待检图像,而不是随机的从这多个图像中抽取待检图像。因此,可以在降低抽样数量从而降低检测工作量的同时,获得更好、更稳定的检测效果。
可选地,在另一实施例中,本申请实施例提供的一种辅助检测图像标注质量的方法,在步骤102之前,还可以包括:
参数优化模块,用于对目标参数进行优化,其中,所述目标参数包括:第一阈值、第二阈值、第三阈值、第四阈值、第五阈值和第六阈值,目标垂线的预设长度,以及可被忽略的第一点的类型等参数中的至少一种。
具体的,参数优化模块可用于:
从待抽检的所述多个图像中随机抽取预设数量的一小批图像;
对这一小批图像依次触发上述边缘检测模块702至待检图像抽取模块705,以实现对这一小批图像的标注质量的辅助检测;
获取针对这一小批图像的标注质量检测结果;
根据这一小批图像的标注质量检测结果,调整上述目标参数,并对这一小批图像再次触发上述边缘检测模块702至待检图像抽取模块705,直到这一小批图像的标注质量检测结果达到第五预设要求;其中,第五预设要求可以包括:能准确定位出边缘不贴合的标注线段,同时不存在或存在很少的误检情况。
可以理解,当采用优化后的目标参数能很好地辅助检测上述一小批图像的标注质量时,即可以采用这样的目标参数辅助检测大批量图像的标注质量。此外,对一小批图像标注质量的辅助检测来说,计算工作量小,计算速度快,因此可以很快完成目标参数的优化。
需要说明的是,由于装置实施例执行的内容与方法实施例类似,因此,本文对装置实施例部分描述的较为简略,相关之处请参见方法实施例部分。
图10示出了是本申请实施例提供的一种电子设备的结构示意图。请参考图10,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成辅助检测图像标注质量的装置。处理器,执行存储器所存放的程序,并具体用于执行本申请实施例提供的辅助检测图像标注质量的方法。
上述如本申请图10所示实施例揭示的辅助检测图像标注质量的装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图10所示实施例中辅助检测图像标注质量的装置执行的方法,并具体用于执行本申请实施例提供的辅助检测图像标注质量的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是,本申请中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (7)

1.一种辅助检测图像标注质量的方法,其特征在于,所述方法包括:
获取待抽检的多个图像;
对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;
获取所述多个图像的边缘标注数据;
基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;
基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像;
其中,所述图像的边缘标注数据包括:用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形;
所述基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数,包括:
对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段;
基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,其中,所述第一点为所述线段上的点,所述第二点为目标垂线与该图像中的所述边缘线的交点,所述目标垂线以所述第一点为中心且垂直于所述线段,以及所述目标垂线的长度为预设长度;
基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数;
所述基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,包括:
在所述线段上按预设步长确定多个所述第一点;
以每一所述第一点为中心绘制与所述线段垂直的多条垂线,得到多条所述目标垂线;
确定每一所述目标垂线与该图像中的所述边缘线的交点;
将每一所述目标垂线上距离所述线段最近的交点确定为所述第二点;
基于每一所述第一点与指定第二点之间的距离,确定所述第一点的标注质量评估参数,所述指定第二点与所述第一点位于同一所述目标垂线上;
基于所述多个第一点的标注质量评估参数,确定所述线段的标注质量评估参数。
2.根据权利要求1所述的方法,其特征在于,在所述对所述多个图像进行边缘检测,确定所述多个图像中的边缘线之前,所述方法还包括:
对所述多个图像进行高斯模糊处理。
3.根据权利要求1所述的方法,其特征在于,所述基于所述多个第一点的标注质量评估参数,确定所述线段的标注质量评估参数,包括:
基于多个所述第一点的标注质量评估参数,确定所述多个第一点中不满足第一预设要求的目标点数;
基于所述目标点数与所述第一点的总数之比,确定所述线段的标注质量评估参数。
4.根据权利要求1所述的方法,其特征在于,所述基于所述多个线段的标注质量评估参数确定该图像的边缘标注质量评估参数,包括:
基于所述多个线段的标注质量评估参数,确定所述多个线段中不满足第二预设要求的目标线段的数量;
基于所述目标线段的数量与该图像中所述线段的总数之比,确定该图像的标注质量评估参数。
5.根据权利要求4所述的方法,其特征在于,还包括:
对所述多个图像中的所述目标线段进行标记;
其中,所述目标线段的标注质量越差标记越明显。
6.根据权利要求1-4任一项所述的方法,其特征在于,
所述图像的标注质量评估参数为边缘不贴合程度评分;
其中,所述基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像,包括:
基于所述多个图像的标注质量评估参数,确定所述多个图像中标注质量不满足第四预设要求的多个目标图像;
按照预设抽样比例,从所述多个目标图像中抽取待检图像。
7.一种辅助检测图像标注质量的装置,其特征在于,所述装置包括:
图像获取模块,用于获取待抽检的多个图像;
边缘检测模块,用于对所述多个图像进行边缘检测,确定所述多个图像中的边缘线;
标注数据获取模块,用于获取所述多个图像的边缘标注数据;
标注质量评估模块,用于基于所述多个图像中的边缘线和所述多个图像的边缘标注数据,确定所述多个图像的标注质量评估参数;
待检图像抽取模块,用于基于所述多个图像的标注质量评估参数,从所述多个图像中抽取待检图像;
其中,所述图像的边缘标注数据包括:用于表示所述图像中的物体边缘的多边形的顶点集合,其中,一个顶点集合对应一个多边形;
标注质量评估模块具体包括:第一线段绘制子模块、第一线段评估子模块和第一图像评估子模块;
第一线段绘制子模块,用于对所述多个图像中的每一图像基于该图像的至少一个所述顶点集合,在该图像中绘制得到多个线段;
第一线段评估子模块,用于基于多个第一点与多个第二点之间的多个距离,确定所述线段的标注质量评估参数,其中,所述第一点为所述线段上的点,所述第二点为目标垂线与该图像中的所述边缘线的交点,所述目标垂线以所述第一点为中心且垂直于所述线段,以及所述目标垂线的长度为预设长度;
第一图像评估子模块,用于基于所述多个线段的标注质量评估参数确定该图像的标注质量评估参数;
第一线段评估子模块具体用于:
在所述线段上按预设步长确定多个所述第一点;
以每一所述第一点为中心绘制与所述线段垂直的多条垂线,得到多条所述目标垂线;
确定每一所述目标垂线与该图像中的所述边缘线的交点;
将每一所述目标垂线上距离所述线段最近的交点确定为所述第二点;
基于每一所述第一点与指定第二点之间的距离,确定所述第一点的标注质量评估参数,所述指定第二点与所述第一点位于同一所述目标垂线上;
基于所述多个第一点的标注质量评估参数,确定所述线段的标注质量评估参数。
CN201910999898.0A 2019-10-21 2019-10-21 一种辅助检测图像标注质量的方法及装置 Active CN110782439B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910999898.0A CN110782439B (zh) 2019-10-21 2019-10-21 一种辅助检测图像标注质量的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910999898.0A CN110782439B (zh) 2019-10-21 2019-10-21 一种辅助检测图像标注质量的方法及装置

Publications (2)

Publication Number Publication Date
CN110782439A CN110782439A (zh) 2020-02-11
CN110782439B true CN110782439B (zh) 2022-02-15

Family

ID=69386037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910999898.0A Active CN110782439B (zh) 2019-10-21 2019-10-21 一种辅助检测图像标注质量的方法及装置

Country Status (1)

Country Link
CN (1) CN110782439B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592761A (zh) * 2020-04-30 2021-11-02 京东方科技集团股份有限公司 存储介质、走线检测装置、走线检测模型训练装置及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480274A (zh) * 2017-08-21 2017-12-15 北京小度信息科技有限公司 区域边界信息处理方法和装置
CN109034131A (zh) * 2018-09-03 2018-12-18 福州海景科技开发有限公司 一种半自动人脸关键点标注方法及存储介质
CN109378052A (zh) * 2018-08-31 2019-02-22 透彻影像(北京)科技有限公司 图像标注的预处理方法及系统
CN109409248A (zh) * 2018-09-30 2019-03-01 上海交通大学 基于深度语义网络的语义标注方法、装置及系统
CN110287904A (zh) * 2019-06-27 2019-09-27 武汉中海庭数据技术有限公司 一种基于众包数据的车道线提取方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060200759A1 (en) * 2005-03-04 2006-09-07 Microsoft Corporation Techniques for generating the layout of visual content

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107480274A (zh) * 2017-08-21 2017-12-15 北京小度信息科技有限公司 区域边界信息处理方法和装置
CN109378052A (zh) * 2018-08-31 2019-02-22 透彻影像(北京)科技有限公司 图像标注的预处理方法及系统
CN109034131A (zh) * 2018-09-03 2018-12-18 福州海景科技开发有限公司 一种半自动人脸关键点标注方法及存储介质
CN109409248A (zh) * 2018-09-30 2019-03-01 上海交通大学 基于深度语义网络的语义标注方法、装置及系统
CN110287904A (zh) * 2019-06-27 2019-09-27 武汉中海庭数据技术有限公司 一种基于众包数据的车道线提取方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Quality Assessment for Crowdsourced Object Annotations;Sirion Vittayakorn et al.;《BMVC 2011》;20111231;第1-11页 *

Also Published As

Publication number Publication date
CN110782439A (zh) 2020-02-11

Similar Documents

Publication Publication Date Title
US20200160040A1 (en) Three-dimensional living-body face detection method, face authentication recognition method, and apparatuses
US11182592B2 (en) Target object recognition method and apparatus, storage medium, and electronic device
CN111667520B (zh) 红外图像和可见光图像的配准方法、装置及可读存储介质
WO2018010657A1 (zh) 结构化文本检测方法和系统、计算设备
CN108875731B (zh) 目标识别方法、装置、系统及存储介质
CN108875534B (zh) 人脸识别的方法、装置、系统及计算机存储介质
CN109086734B (zh) 一种对人眼图像中瞳孔图像进行定位的方法及装置
WO2020097909A1 (zh) 文本检测方法、装置及存储介质
CN109840883B (zh) 一种训练物体识别神经网络的方法、装置及计算设备
CN112396050B (zh) 图像的处理方法、设备以及存储介质
CN111985458A (zh) 一种检测多目标的方法、电子设备及存储介质
CN109102026B (zh) 一种车辆图像检测方法、装置及系统
CN110570442A (zh) 一种复杂背景下轮廓检测方法、终端设备及存储介质
CN111898610B (zh) 卡片缺角检测方法、装置、计算机设备及存储介质
CN110782439B (zh) 一种辅助检测图像标注质量的方法及装置
WO2018027527A1 (zh) 一种光学系统成像质量的检测方法和装置
CN113129298A (zh) 文本图像的清晰度识别方法
WO2023160061A1 (zh) 图像中运动对象的确定方法、装置、电子设备和存储介质
CN112308836B (zh) 角点检测方法、装置、电子设备及可读存储介质
CN111935480B (zh) 一种用于图像获取装置的检测方法及相关装置
CN112101139B (zh) 人形检测方法、装置、设备及存储介质
KR20210087494A (ko) 인체 방향 검출 방법, 장치, 전자 기기 및 컴퓨터 저장 매체
CN111259703B (zh) 人脸倾斜角度检测方法和装置
CN107977644B (zh) 基于图像采集设备的图像数据处理方法及装置、计算设备
CN113591066A (zh) 设备身份识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240415

Address after: No. 4302, Courtyard 52, Jiuxianqiao, Chaoyang District, Beijing, 100016

Patentee after: Beijing Yunce Data Technology Co.,Ltd.

Country or region after: China

Address before: 102425 building 31, 69 Yanfu Road, Fangshan District, Beijing

Patentee before: Beijing Yunju Intelligent Technology Co.,Ltd.

Country or region before: China