CN109190631A - 图片的目标对象标注方法及装置 - Google Patents

图片的目标对象标注方法及装置 Download PDF

Info

Publication number
CN109190631A
CN109190631A CN201811014320.7A CN201811014320A CN109190631A CN 109190631 A CN109190631 A CN 109190631A CN 201811014320 A CN201811014320 A CN 201811014320A CN 109190631 A CN109190631 A CN 109190631A
Authority
CN
China
Prior art keywords
picture
segmentation
result
target object
marked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811014320.7A
Other languages
English (en)
Inventor
张伟
程远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811014320.7A priority Critical patent/CN109190631A/zh
Publication of CN109190631A publication Critical patent/CN109190631A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供一种图片的目标对象标注方法和装置,根据该方法的一个实施方式,通过获取多个已标注图片,用来训练目标分割模型,然后通过目标分割模型对多个未标注图片进行目标分割,以产生各个分割结果,并进一步利用预先训练的分类模型对各个分割结果进行校验,从而筛选出分割结果不满足分割条件的第二类结果,并获取对不满足分割条件的第二类结果的修正结果,确定第二类结果对应图片的目标对象标注结果。该实施方式可以提升标注效率。

Description

图片的目标对象标注方法及装置
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及通过计算机对图片中的目标对象进行标注的方法和装置。
背景技术
图像识别技术是人工智能的一个重要领域,它是指对图像进行对象识别,以识别各种不同模式的目标和对象的技术。在一个事物包括多个部件的情况下,还可以包括对该事物中各个部件的识别。例如,对人脸图片中的五官的识别、车辆图片中各个车辆部件的识别等等。
对于彼此之间相接的目标对象(例如车辆),需要对各个目标对象的边缘准确定位、分割。在识别一个事物中的部件情况下,图片中的目标对象并不是各个完整目标对象的组合。例如对于车辆损伤位置的放大图,可能涉及不完整展示的多个部件(此时,每个部件是一个目标对象)。这种情况下,需要区分部件的边缘,利用常规识别技术可能无法准确划分不同的部件。同时,这种图像分割往往需要像素级的标注。常规标注技术中,通常采用人工的方式进行标注。然而,人工标注速度较慢,从而标注周期长,同时,用于识别标注部件的模型的训练周期也会比较长。
发明内容
本说明书一个或多个实施例描述了一种图片的目标对象标注方法和装置,采用少量标注图片来训练目标分割模型,针对目标分割模型对未标注图片的目标对象分割结果自动校验,并对不满足分割条件的分割结果进行修正,从而可以加快标注速度,提升标注效率。
根据第一方面,提供了一种图片的目标对象标注方法,所述方法包括:获取多个已标注图片,其中,所述已标注图片是已经标注出图片中各个目标对象的图片;将所述多个已标注图片作为训练样本,训练得到目标分割模型;通过所述目标分割模型对多个未标注图片进行目标分割,以产生各个未标注图片所对应的分割结果,其中,所述未标注图片是未被标注目标对象的图片;用预先训练的分类模型对各个分割结果进行校验,根据校验结果将所述分割结果分为第一类结果和第二类结果,其中,所述第一类结果是满足分割条件的分割结果,所述第二类结果是不满足分割条件的分割结果;获取对所述第二类结果的修正结果,从而确定修正图片,其中,所述修正图片是在所述第二类结果对应的各个图片中包括所述修正结果作为目标对象标注结果的图片。
在一些实施例中,所述分割结果包括:与对应的未标注图片大小一致的分割图片,其中,所述分割图片的各个像素对应的值表示所属目标对象类别。
在一些实施例中,所述用预先训练的分类模型对各个分割结果进行校验包括:针对第一分割图片,提取至少一个连通区域的边缘特征和纹理特征,其中,在所述连通区域内,各个像素对应的值相同;将所述边缘特征和所述纹理特征输入所述分类模型,并基于所述分类模型的输出确定所述第一分割图片的校验结果,其中,所述校验结果包括,所述分割结果满足所述分割条件,或所述分割结果不满足所述分割条件。
在一些实施例中,所述方法还包括:针对所述第二类结果中的第一分割结果,确定至少一个连通区域,其中,所述连通区域内的各个像素对应的值相同;根据所述至少一个连通区域的边缘像素确定各个连通区域的边缘多边形;基于所述边缘多边形生成所述第一分割结果对应的第一图片上的可修正曲线,以便基于所述可修正曲线对所述第一分割结果进行修正。
在一些实施例中,所述分类模型的输出为所述目标分割模型对所述未标注图片的分割准确率;以及,所述分割条件包括,分割准确率大于预设准确率阈值。
在一些实施例中,所述方法还包括:将所述第一类结果中的各个分割结果分别确定为所对应图片的目标对象标注结果。
在一些实施例中,所述方法还包括:将所述修正图片作为所述已标注图片,以用于后续图片的目标对象标注。
根据第二方面,提供一种图片的目标对象标注装置,所述装置包括:获取单元,配置为获取多个已标注图片,其中,所述已标注图片是已经标注出图片中各个目标对象的图片;训练单元,配置为将所述多个已标注图片作为训练样本,训练得到目标分割模型;分割单元,配置为通过所述目标分割模型对多个未标注图片进行目标分割,以产生各个未标注图片所对应的分割结果,其中,所述未标注图片是未被标注目标对象的图片;校验单元,配置为用预先训练的分类模型对各个分割结果进行校验,根据校验结果将所述分割结果分为第一类结果和第二类结果,其中,所述第一类结果是满足分割条件的分割结果,所述第二类结果是不满足分割条件的分割结果;确定单元,配置为获取对所述第二类结果的修正结果,从而确定修正图片,其中,所述修正图片是在所述第二类结果对应的各个图片中包括所述修正结果作为目标对象标注结果的图片。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法和装置,通过获取多个已标注图片,用来训练目标分割模型,然后通过训练得到的目标分割模型对多个未标注图片进行目标分割,以产生各个分割结果,并进一步利用预先训练的分类模型对各个分割结果进行校验,从而筛选出分割结果中不满足分割条件的第二类结果,并获取对不满足分割条件的第二类结果的修正结果,确定在所述第二类结果对应的各个图片中包括所述修正结果作为目标对象标注结果的修正图片。由于初始时只使用一小部分标注图片来训练目标分割模型,对目标分割模型的分割效果由分类模型来检验,且对于分割不好的图片,用当前目标分割模型的分割结果作为修正的依据,来确定目标对象标注结果,从而可以加快标注速度,提升标注效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的图片的目标对象标注方法流程图;
图3示出对目标图片进行分割的一个具体例子;
图4示出分割图片的一个具体例子;
图5示出从图4示出的分割图片中提取的一个连通区域的具体例子;
图6示出根据一个实施例的图片的目标对象标注装置的示意性框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。在图1示出的场景中,包括标注平台和计算平台两部分。其中,标注平台可用于人工标注图片中目标对象的各个部件,计算平台用于训练目标分割模型、通过目标分割模型对图片进行部件分割产生分割结果、通过预先训练的分类模型筛选出分割结果不合格的图片发送回标注平台。标注平台可以通过人工对分割结果不合格的图片,修正其分割结果。其中,标注平台和计算平台可以设置在同一台设备,也可以设置在不同的设备上,本说明书实施例对此不作限定。
具体地,对于标注平台上一定数量(如1千万张)的需要标注出目标对象(如小汽车,或小汽车中的某个部件)的图片,先通过人工对这批图片中的一小部分(例如万分之一,或者固定数量,如500张)图片标注目标对象,确定目标对象标注结果。然后,计算平台可以先获取这些人工标注的图片,并用这些图片的标注结果,训练对图片中的各个目标对象进行分割的目标分割模型。接着,通过目标分割模型,对未进行人工标注的图片,即未标注图片,进行目标分割产生各个分割结果。然后,通过预先训练的分类模型(分类器)对上述各个分割结果进行校验,并将分割结果分为两部分:一部分分割结果满足分割条件,作为第一类结果;另一部分分割结果不满足分割条件,作为第二类结果。相应的图片也分为两部分。第二类结果由于不满足分割条件,因此需要和其对应的图片一起发回标注平台,通过人工对分割结果进行修正。进一步地,计算平台可以获得第二类结果的修正结果,从而确定修正图片。其中,修正图片是在第二类结果对应的各个图片中包括修正结果作为目标对象标注结果的图片。在一个实施例中,由于第一类结果对应的图片的分割结果已经满足分割条件,根据第一类结果可以直接确定这些图片的目标对象标注结果。
如此,可以仅通过少量标注出目标对象的图片来训练目标分割模型,同时,通过预先训练好的分类模型对部件分割模型的目标分割结果进行检查,分出合格的和不合格的分割结果,并对不合格的分割结果进一步进行修正,大大减少了人工标注周期,提高标注效率。
在进一步的实施例中,计算平台还可以根据修正图片的目标对象标注结果,进一步优化上述目标分割模型。如此,通过进一步对目标分割模型优化,使优化后的目标分割模型用于后续目标图片的自动标注,进一步提升标注效率。可选地,当优化后的目标分割模型针对测试集的分割结果能够满足实际需求(如准确率大于预定阈值)时,目标分割模型可用于实际场景,不再需要预先标注数据训练目标分割模型。计算平台可以直接获取待标注的图片,通过目标分割模型获取各个图片的分割结果,然后,仅需对少部分分割不好的结果,即第二类结果进行修正,从而确定各个图片的目标对象标注结果。
可以理解,图1中的计算平台可以是具有一定运算能力的各种装置、设备,例如台式计算机、服务器等等。该计算平台还可以是上述装置、设备组成的设备集群。下面描述图片的目标对象标注具体执行过程。
图2示出了本说明书一个实施例的图片的目标对象标注方法流程图。该方法的执行主体例如是图1的计算平台。如图2所示,该方法包括以下步骤:步骤21,获取多个已标注图片,其中,已标注图片是已经标注出图片中各个目标对象的图片;步骤22,将多个已标注图片作为训练样本,训练得到目标分割模型;步骤23,通过目标分割模型对多个未标注图片进行目标分割,以产生各个未标注图片对应的分割结果,其中,未标注图片是未被标注目标对象的图片;步骤24,通过预先训练的分类模型对各个分割结果进行校验,根据校验结果将分割结果分为第一类结果和第二类结果,其中,第一类结果是满足分割条件的分割结果,第二类结果是不满足分割条件的分割结果;步骤25,获取对第二类结果的修正结果,从而确定修正图片,其中,修正图片是在第二类结果对应的各个图片中包括修正结果作为目标对象标注结果的图片。
首先,在步骤21,获取多个已标注图片。可以理解,对于标注过程而言,往往是标注出具体的目标对象或者对某个事物划分出各个部件。根据应用场景的不同,这里的目标对象也可以有不同层次的含义。例如在无人驾驶场景下,图片中的目标对象可以是车辆、天空、人物、障碍物等等。再如在车辆定损场景下,一个目标对象可能是车辆的不同部件,如车轮、车灯、保险杠、车门等等。已标注图片可以是标注出图片中的各个目标对象的图片。
实践中,可以针对图片中的一部分图片,先进行目标对象标注,形成已标注图片。该标注过程往往由人工进行。可以按照预先设定的标注比例(如万分之一)或标注数量(如500张),对部分图片进行标注。已标注图片中的目标对象划分结果可以为其他图片的目标对象划分提供依据。
在一些实施例中,已标注图片可以是前一次图片的目标对象标注流程中的修正图片。
步骤22,将多个已标注图片作为训练样本,训练得到目标分割模型。可以理解,目标分割模型可以用于自动对图片中目标对象的各个目标对象进行分割。
对于模型训练而言,往往需要先选定一个初始模型。该初始模型可以是初步选定的一个分割模型,例如deeplab(深度卷积网)、FCN(Fully connected networks,全卷积网络)、PSP NET(Pyramid Scene Parsing Network,金字塔场景解析网络)等等。初始模型可以是对模型参数随机赋值以初始化后的模型,也可以是经过一定样本训练后的分割模型。总之,初始模型往往是未经训练或者未训练成功的分割模型,因此,可以将已标注图片作为训练样本对其进行训练,得到目标分割模型,以更好地用于图片中的目标对象分割。
在一个实施例中,可以对已标注图片,提取颜色的一致性特征、代表缝隙的线条特征等,作为初始模型的输入,并根据已知的标注结果对初始模型的各个参数进行调整。容易理解,由代表缝隙的线条隔开的两侧区域属于不同目标对象的可能性较大,颜色截然不同的相邻区域属于不同目标对象的可能性较大,等等。
在另一个实施例中,可以对已标注图片,从各个像素提取特征,例如RGB值、纹理特征等,作为初始模型的输入。另外,由于对于已标注图片,其各个像素的实际所属目标对象是已知的,可以用各个像素对应的值来表示实际所属目标对象类别。如图3所示,车辆图片被标注目标对象轮廓后,将各个像素对应不同的值来表示所属的不同目标对象。根据各个像素对应的值,可以调整初始模型中的各个模型参数。
在另一个实施例中,在所选择的模型是深度神经网络模型的情况下,可以将已标注图片和原始图片,作为深度神经网络模型的训练数据,由深度神经网络模型自动学习从原始图片中提取特征,根据已标注图片的标注结果调整模型参数,训练得到目标分割模型。
如此,通过以上过程,对初始模型进行了初步训练或者加强训练,从而可以使目标分割模型更好地用于对图片中的目标对象分割。
然后,在步骤23,通过目标分割模型对多个未标注图片进行目标分割,以分割产生各个未标注图片对应的分割结果。其中,未标注图片是未被划分出各个目标对象的图片,或者说,已标注图片以外的图片。
在一个实施方式中,针对某一个未标注图片,可以提取颜色的一致性特征、代表缝隙的线条特征等特征,输入目标分割模型,根据目标分割模型的输出确定未标注图片的分割结果,将该未标注图片划分出不同的部分。每个部分可以代表一个部件。
在另一个实施方式中,目标分割模型是深度神经网络模型,可以直接将未标注图片输入目标分割模型,由深度神经网络模型自动从未标注图片中提取特征,并输出对图片中的目标对象的分割结果。
根据一个实施例,针对某一个未标注图片的分割结果,可以是与该未标注图片一样大小(例如1024×1024像素)的分割图片,分割图片中每个像素对应的值代表着该未标注图片中相应位置所属目标对象类别。如图4所示的分割图片,可以是对一个车辆图片进行部件分割得到的分割结果。
通过目标分割模型对未标注图片的目标分割,与通过已标注图片训练目标分割模型的过程相对应。模型训练和使用可以按照各种当前已有的,或者未来出现的方式进行,本说明书实施例对此不作限定。在此不再赘述。
接着,在步骤24,通过预先训练的分类模型对各个分割结果进行校验,根据校验结果将分割结果分为第一类结果和第二类结果。可以理解,对分割结果的校验,实质上就是判断分割结果是否合格,即,是否满足分割条件,满足分割条件为合格,不满足分割条件为不合格。这里,第一类结果对应满足分割条件(合格)的分割结果,第二类结果对应不满足分割条件(不合格)的分割结果。“第一”、“第二”仅仅为了区分不同类别,不对名称或顺序构成限定。
分割条件是用于判断目标分割模型对未标注图片中目标对象的分割结果好坏的依据。分割条件可以是预先设定的。例如,在分类模型的输出为分割结果的分割准确率的情况下,该分割条件例如可以是,分割准确率大于预定准确率阈值。
分类模型可以是利用诸如SVM(Support Vector Machine,支持向量机)、CNN(Convolutional Neural Network,卷积神经网络)等等之类的算法训练的模型。分类模型训练时,可以通过人工标注目标对象的图片作为样本,来训练分类模型。训练该分类模型所需的样本图片不仅包含目标对象的分割结果,还包括对分割结果正确与否、分割准确度等分割效果进行标注的标签。在训练该分类模型过程中,从样本图片中提取出所划分的各个目标对象的边缘特征(如边缘线、边缘形状等)和纹理特征(如条纹、波浪等),并利用所标注的表示分割效果的标签,来训练分类模型。值得说明的是,分类模型的输出结果可以是分别对应合格和不合格的两个值,也可以是一个分值,该分值可以用于表示目标分割模型的分割结果合格的概率,例如是前述的分割准确率,本说明书实施例对此不作限定。
针对一个分割结果,可以首先提取分割结果中各个部分的边缘特征和纹理特征,将各个边缘特征和纹理特征输入上述训练好的分类模型,以得到分类模型的输出结果。根据该输出结果可以确定校验结果。在输出结果对应合格和不合格的两个类别的值(如0或1)时,根据输出值可以直接确定校验结果。在输出结果是一个分值的情况下,还可以根据预先设置合格阈值(如80%)确定校验结果,例如,表示分割结果是合格的概率大于该合格阈值时表示分割结果合格。
由于在步骤23中,对未标注图片的分割结果可以是与相对应的未标注图片大小一致的分割图片,分割图片中各个像素包含对应所属目标对象类别的值。这种情况下,在一个实施例中,可以从分割图片中获取至少一个连通区域。其中,在一个连通区域内,各个像素对应相同的值,亦即,对应着相同的目标对象类别。如图5所示,是图4的分割图片中值为4的像素点构成的连通区域。每个连通区域,就可以对应目标分割模型所分割出来的一个目标对象。提取连通区域的边缘特征和纹理特征,相当于是获取所分割出来的目标对象的边缘特征和纹理特征。针对一个未标注图片,在将所提取的各个连通区域的边缘特征和纹理特征输入预先训练的分类模型之后,可以得到分类模型的输出。接着可以根据分类器的输出确定校验结果。其中,这里的校验结果可以包括,分割结果满足分割条件,或分割结果不满足分割条件。
进一步地,根据校验结果,可以将满足分割条件的分割结果划分到第一类结果,将不满足分割条件的分割结果划分到第二类结果。可以理解,对于第一类结果对应的图片而言,通过目标分割模型获取的分割结果已经满足分割条件,因此,在一个实施例中,可以根据第一类结果确定第一类结果所对应的各个图片的目标对象标注结果。实践中,可以将第一类结果直接作为第一类结果所对应的各个图片的目标对象标注结果,也可以根据分割图片提取连通区域,将连通区域的边缘作为第一类结果所对应的各个图片的目标对象标注结果。
然后,根据步骤25,获取对第二类结果的修正结果,从而确定修正图片。其中,修正图片是在第二类结果对应的各个图片中包括修正结果作为目标对象标注结果的图片。可以理解,由于通过目标对象分割模型得到的第二类结果不满足分割条件,因此需要对其进行调整,以修正到符合分割条件的结果,从而确定出对应图片的目标对象标注结果。
对于分割结果不符合分割条件的图片,通常存在诸如目标对象部分边缘没有划分到正确的位置、不同的目标对象没有区分开、边缘错位之类的问题。分割结果的修正可以通过图1中的标注平台,由人工进行。该修正可以包括但不限于:重新划分目标对象、将没有划分到正确位置的边缘线纠正到正确位置等等。
根据一个实施方式,在分割结果是前述分割图片的情况下,针对第二类结果中的第一分割结果,可以确定其中的至少一个连通区域,然后根据该至少一个连通区域的边缘像素确定各个连通区域的边缘多边形。这里,“第一”用于表示某一、任一,而不限定顺序。其中,边缘多边形可以是边缘像素中心点的连线,也可以是由边缘像素中与连通区域内其他像素没有相接的边形成的连线(如图5中的最外侧黑线),本说明书实施例对此不作限定。然后,可以将边缘多边形生成第一分割结果对应的第一图片上的可修正曲线,以便基于可修正曲线对第一分割结果进行修正形成修正结果。其中,可修正曲线可以是独立于第一图片附加在第一图片上的曲线,该曲线具有可以被整体拖动、伸缩、分段拖动等等中的至少一项特性。可选地,可修正曲线可以与第一图片位于不同的图层上。
如此,针对第二类结果中的每一个分割结果都可以生成相应图片上的可修正曲线,进一步地,可以通过人工操作可修正曲线,完成对第二类结果的修正。然后,通过获取对第二类结果的修正结果,可以得到修正图片。修正图片中所包括的目标对象标注结果可以包括分割出的目标对象的轮廓、形状、位置等等。
至此,前述的图片被标注完毕。
在一个可选的实现方式中,在步骤25之后,还可以将修正图片作为下一个图片的目标对象标注流程中的已标注图片。换句话说,用修正图片来进一步训练目标分割模型。在一个实施例中,可以在下一个图片的目标对象标注流程中的步骤22中,将上述的修正图片添加到训练样本集中,得到更新的训练样本集;然后利用更新的训练样本集,再训练目标分割模型。
如此,一方面,可以丰富分割模型的样本量,对目标分割模型进一步优化,以对更多图片进行更准确的目标对象分割。另一方面,在初始的图片的目标对象标注流程中,需要预先标注一部分图片用于训练目标分割模型,而在后续的图片的目标对象标注流程中,仅需要使用前一次分割不好的图片及其修正后的标注结果作为样本来更新目标分割模型,大大减少人工标注图片数量。同时,本次流程中的已标注图片是前一次流程的修正图片,即目标分割模型前一次分割不合格的图片。这样,可以大大加快目标分割模型的训练速度。
在一个实施例中,还可以用测试样本集对目标分割模型进行测试,在目标分割模型对测试样本进行目标对象分割的分割结果满足测试条件(如准确率达到预设阈值)的情况下,表明目标分割模型对图片进行目标对象划分的结果已经可以满足实际需要了,在以后的使用中,可以不再更新目标分割模型。换句话说,随着实际应用次数的增多,目标分割模型的准确率越来越高,根据分割结果确定的第二类结果越来越少。在目标分割模型满足测试条件后,可以直接用目标分割模型对图片进行目标分割(无需训练目标分割模型),再根据分类模型的分类结果,由人工修正第二类结果对应的图片即可。此时,这些需要修正的图片比例已经很少了。
另一方面,在目标分割模型对测试样本进行目标对象分割的分割结果不满足测试条件的情况下,可以将目标分割模型作为后续图片的目标对象标注流程中用已标注样本训练目标分割模型时的初始模型。亦即,当有下一批图片需要进行目标对象标注时,用已标注图片,进一步训练该更新后的分割模型(重新确定的初始模型),生成目标分割模型,并继续后续流程。直至目标分割模型满足测试条件。由于是在前一次训练的目标分割模型基础上进一步训练的模型,通过累加样本的方式,可以减少初始样本量。
回顾以上过程,只需一部分已标注图片来训练目标分割模型,未标注图片则根据目标分割模型的分割结果进行自动筛选,仅对不满足分割条件的第二类结果进行人工修正,并根据修正结果来确定第二类结果对应的各个图片的目标对象标注结果。从而,图2示出的流程可以加快标注速度,提升标注效率。
根据另一方面的实施例,还提供一种图片的目标对象标注装置。图6示出根据一个实施例的图片的目标对象标注装置的示意性框图。如图6所示,图片的目标对象标注装置600包括:获取单元61,配置为获取多个已标注图片,其中,已标注图片是已经标注出图片中各个目标对象的图片;训练单元62,配置为将多个已标注图片作为训练样本,训练得到目标分割模型;分割单元63,配置为通过目标分割模型对多个未标注图片进行目标分割,以产生各个未标注图片所对应的分割结果,其中,未标注图片是未被标注目标对象的图片;校验单元64,配置为用预先训练的分类模型对各个分割结果进行校验,根据校验结果将分割结果分为第一类结果和第二类结果,其中,第一类结果是满足分割条件的分割结果,第二类结果是不满足分割条件的分割结果;确定单元65,配置为获取对第二类结果的修正结果,从而确定修正图片,其中,修正图片是在第二类结果对应的各个图片中包括修正结果作为目标对象标注结果的图片。
根据一种实施方式,分割单元63对未标注图片进行目标分割的分割结果可以包括:与相对应的未标注图片大小一致的分割图片,其中,分割图片的各个像素对应的值表示所属目标对象类别。在一个实施例中,校验单元64还可以配置为:针对分割图片提取至少一个连通区域的边缘特征和纹理特征,其中,在连通区域内,各个像素对应的值相同;将边缘特征和纹理特征输入分类模型,并基于分类模型的输出确定第一分割图片的校验结果。其中,校验结果可以包括,分割结果满足分割条件,或分割结果不满足分割条件。
在一个实施例中,装置600还可以包括修正数据生成单元(未示出),配置为:针对第二类结果中的第一分割结果,确定至少一个连通区域,其中,连通区域内的各个像素对应的值相同;根据至少一个连通区域的边缘像素确定各个连通区域的边缘多边形;基于边缘多边形生成第一分割结果对应的第一图片上的可修正曲线,以便基于可修正曲线对第一分割结果进行修正。
在一个可能的实施例中,分类模型的输出为目标分割模型对未标注图片的分割准确率。此时,分割条件可以包括,分割准确率大于预设准确率阈值。
在一个实施例中,确定单元65还可以配置为:将第一类结果中的各个分割结果分别确定为,所对应图片的目标对象标注结果。
根据一种可能的设计,装置600还可以包括优化单元(未示出),配置为:将修正图片作为已标注图片,以用于后续图片的目标对象标注。
进一步地,在一个实施例中,600装置还可以包括测试模块(未示出),配置为:用测试样本集检测目标分割模型;在目标分割模型满足测试条件的情况下,用满足测试条件的目标分割模型进行后续图片的目标对象标注。另一方面,在目标分割模型不满足测试条件的情况下,当有下一批图片需要进行目标对象标注时,训练单元62可以获取已标注图片,进一步训练该目标分割模型(重新确定的初始模型),生成目标分割模型,并通过后续单元执行继续后续流程。直至目标分割模型满足测试条件。可选地,此时的已标注图片是前一次的修正图片,即目标分割模型前一次分割不合格的图片。如此,可以大大加快目标分割模型的训练速度。
通过以上装置,只需人工标注图片中的一部分来训练目标分割模型,未标注图片则根据目标分割模型的分割结果进行自动筛选,对人工标注之外的图片而言,仅对不满足分割条件的第二类结果进行人工修正,并根据修正结果来确定第二类结果对应图片的目标对象标注结果。从而,图6示出的装置600可以加快标注速度,提升标注效率。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (16)

1.一种图片的目标对象标注方法,所述方法包括:
获取多个已标注图片,其中,所述已标注图片是已经标注出图片中各个目标对象的图片;
将所述多个已标注图片作为训练样本,训练得到目标分割模型;
通过所述目标分割模型对多个未标注图片进行目标分割,以产生各个未标注图片所对应的分割结果,其中,所述未标注图片是未被标注目标对象的图片;
用预先训练的分类模型对各个分割结果进行校验,根据校验结果将所述分割结果分为第一类结果和第二类结果,其中,所述第一类结果是满足分割条件的分割结果,所述第二类结果是不满足分割条件的分割结果;
获取对所述第二类结果的修正结果,从而确定修正图片,其中,所述修正图片是在所述第二类结果对应的各个图片中包括所述修正结果作为目标对象标注结果的图片。
2.根据权利要求1所述的方法,其中,所述分割结果包括:
与对应的未标注图片大小一致的分割图片,其中,所述分割图片的各个像素对应的值表示所属目标对象类别。
3.根据权利要求2所述的方法,其中,所述用预先训练的分类模型对各个分割结果进行校验包括:
针对第一分割图片,提取至少一个连通区域的边缘特征和纹理特征,其中,在所述连通区域内,各个像素对应的值相同;
将所述边缘特征和所述纹理特征输入所述分类模型,并基于所述分类模型的输出确定所述第一分割图片的校验结果,其中,所述校验结果包括,所述分割结果满足所述分割条件,或所述分割结果不满足所述分割条件。
4.根据权利要求2所述的方法,其中,所述方法还包括:
针对所述第二类结果中的第一分割结果,确定至少一个连通区域,其中,所述连通区域内的各个像素对应的值相同;
根据所述至少一个连通区域的边缘像素确定各个连通区域的边缘多边形;
基于所述边缘多边形生成所述第一分割结果对应的第一图片上的可修正曲线,以便基于所述可修正曲线对所述第一分割结果进行修正。
5.根据权利要求1所述的方法,其中,所述分类模型的输出为所述目标分割模型对所述未标注图片的分割准确率;以及
所述分割条件包括,分割准确率大于预设准确率阈值。
6.根据权利要求1所述的方法,其中,所述方法还包括:将所述第一类结果中的各个分割结果分别确定为所对应图片的目标对象标注结果。
7.根据权利要求1所述的方法,其中,所述方法还包括:
将所述修正图片作为所述已标注图片,以用于后续图片的目标对象标注。
8.一种图片的目标对象标注装置,其中,所述装置包括:
获取单元,配置为获取多个已标注图片,其中,所述已标注图片是已经标注出图片中各个目标对象的图片;
训练单元,配置为将所述多个已标注图片作为训练样本,训练得到目标分割模型;
分割单元,配置为通过所述目标分割模型对多个未标注图片进行目标分割,以产生各个未标注图片所对应的分割结果,其中,所述未标注图片是未被标注目标对象的图片;
校验单元,配置为用预先训练的分类模型对各个分割结果进行校验,根据校验结果将所述分割结果分为第一类结果和第二类结果,其中,所述第一类结果是满足分割条件的分割结果,所述第二类结果是不满足分割条件的分割结果;
确定单元,配置为获取对所述第二类结果的修正结果,从而确定修正图片,其中,所述修正图片是在所述第二类结果对应的各个图片中包括所述修正结果作为目标对象标注结果的图片。
9.根据权利要求8所述的装置,其中,所述分割结果包括:
与相对应的未标注图片大小一致的分割图片,其中,所述分割图片的各个像素对应的值表示所属目标对象类别。
10.根据权利要求9所述的装置,其中,所述校验单元还配置为:
针对第一分割图片,提取至少一个连通区域的边缘特征和纹理特征,其中,在所述连通区域内,各个像素对应的值相同;
将所述边缘特征和所述纹理特征输入所述分类模型,并基于所述分类模型的输出确定所述第一分割图片的校验结果,其中,所述校验结果包括,所述分割结果满足所述分割条件,或所述分割结果不满足所述分割条件。
11.根据权利要求9所述的装置,其中,所述装置还包括修正数据生成单元,配置为:
针对所述第二类结果中的第一分割结果,确定至少一个连通区域,其中,所述连通区域内的各个像素对应的值相同;
根据所述至少一个连通区域的边缘像素确定各个连通区域的边缘多边形;
基于所述边缘多边形生成所述第一分割结果对应的第一图片上的可修正曲线,以便基于所述可修正曲线对所述第一分割结果进行修正。
12.根据权利要求8所述的装置,其中,所述分类模型的输出为所述目标分割模型对所述未标注图片的分割准确率;以及
所述分割条件包括,分割准确率大于预设准确率阈值。
13.根据权利要求8所述的装置,其中,所述确定单元还配置为:将所述第一类结果中的各个分割结果分别确定为,所对应图片的目标对象标注结果。
14.根据权利要求8所述的装置,其中,所述装置还包括优化单元,配置为:
将所述修正图片作为所述已标注图片,以用于后续图片的目标对象标注。
15.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-7中任一项的所述的方法。
16.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。
CN201811014320.7A 2018-08-31 2018-08-31 图片的目标对象标注方法及装置 Pending CN109190631A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811014320.7A CN109190631A (zh) 2018-08-31 2018-08-31 图片的目标对象标注方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811014320.7A CN109190631A (zh) 2018-08-31 2018-08-31 图片的目标对象标注方法及装置

Publications (1)

Publication Number Publication Date
CN109190631A true CN109190631A (zh) 2019-01-11

Family

ID=64917254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811014320.7A Pending CN109190631A (zh) 2018-08-31 2018-08-31 图片的目标对象标注方法及装置

Country Status (1)

Country Link
CN (1) CN109190631A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919149A (zh) * 2019-01-18 2019-06-21 平安科技(深圳)有限公司 基于物体检测模型的物体标注方法及相关设备
CN110287934A (zh) * 2019-07-02 2019-09-27 北京搜狐互联网信息服务有限公司 一种对象检测方法、装置、客户端及服务器
CN110569703A (zh) * 2019-05-10 2019-12-13 阿里巴巴集团控股有限公司 计算机执行的从图片中识别损伤的方法及装置
CN110598711A (zh) * 2019-08-31 2019-12-20 华南理工大学 一种结合分类任务的目标分割方法
CN111178442A (zh) * 2019-12-31 2020-05-19 北京容联易通信息技术有限公司 一种提高算法精度的业务实现方法
CN111428749A (zh) * 2020-02-21 2020-07-17 平安科技(深圳)有限公司 一种图像标注任务的预校验方法、装置、设备及存储介质
CN111553894A (zh) * 2020-04-24 2020-08-18 上海杏脉信息科技有限公司 一种医学图像分割模型训练方法、介质及电子设备
CN111882544A (zh) * 2020-07-30 2020-11-03 平安国际智慧城市科技股份有限公司 基于人工智能的医学影像显示方法及相关装置
US10885625B2 (en) 2019-05-10 2021-01-05 Advanced New Technologies Co., Ltd. Recognizing damage through image analysis
CN112527909A (zh) * 2020-12-24 2021-03-19 东软睿驰汽车技术(沈阳)有限公司 一种数据切片的处理方法、装置及相关产品
CN112989934A (zh) * 2021-02-05 2021-06-18 方战领 视频分析方法、装置及系统
CN116309963A (zh) * 2023-05-18 2023-06-23 太初(无锡)电子科技有限公司 一种图像的批量标注方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809187A (zh) * 2015-04-20 2015-07-29 南京邮电大学 一种基于rgb-d数据的室内场景语义标注方法
CN107153822A (zh) * 2017-05-19 2017-09-12 北京航空航天大学 一种基于深度学习的半自动图像精标注方法
CN107851174A (zh) * 2015-07-08 2018-03-27 北京市商汤科技开发有限公司 图像语义标注的设备和方法
CN108229478A (zh) * 2017-06-30 2018-06-29 深圳市商汤科技有限公司 图像语义分割及训练方法和装置、电子设备、存储介质和程序
CN108229479A (zh) * 2017-08-01 2018-06-29 北京市商汤科技开发有限公司 语义分割模型的训练方法和装置、电子设备、存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104809187A (zh) * 2015-04-20 2015-07-29 南京邮电大学 一种基于rgb-d数据的室内场景语义标注方法
CN107851174A (zh) * 2015-07-08 2018-03-27 北京市商汤科技开发有限公司 图像语义标注的设备和方法
CN107153822A (zh) * 2017-05-19 2017-09-12 北京航空航天大学 一种基于深度学习的半自动图像精标注方法
CN108229478A (zh) * 2017-06-30 2018-06-29 深圳市商汤科技有限公司 图像语义分割及训练方法和装置、电子设备、存储介质和程序
CN108229479A (zh) * 2017-08-01 2018-06-29 北京市商汤科技开发有限公司 语义分割模型的训练方法和装置、电子设备、存储介质

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919149A (zh) * 2019-01-18 2019-06-21 平安科技(深圳)有限公司 基于物体检测模型的物体标注方法及相关设备
US10885625B2 (en) 2019-05-10 2021-01-05 Advanced New Technologies Co., Ltd. Recognizing damage through image analysis
CN110569703A (zh) * 2019-05-10 2019-12-13 阿里巴巴集团控股有限公司 计算机执行的从图片中识别损伤的方法及装置
CN110287934A (zh) * 2019-07-02 2019-09-27 北京搜狐互联网信息服务有限公司 一种对象检测方法、装置、客户端及服务器
CN110287934B (zh) * 2019-07-02 2022-12-02 北京搜狐互联网信息服务有限公司 一种对象检测方法、装置、客户端及服务器
CN110598711A (zh) * 2019-08-31 2019-12-20 华南理工大学 一种结合分类任务的目标分割方法
CN111178442A (zh) * 2019-12-31 2020-05-19 北京容联易通信息技术有限公司 一种提高算法精度的业务实现方法
CN111178442B (zh) * 2019-12-31 2023-05-12 北京容联易通信息技术有限公司 一种提高算法精度的业务实现方法
CN111428749A (zh) * 2020-02-21 2020-07-17 平安科技(深圳)有限公司 一种图像标注任务的预校验方法、装置、设备及存储介质
CN111553894A (zh) * 2020-04-24 2020-08-18 上海杏脉信息科技有限公司 一种医学图像分割模型训练方法、介质及电子设备
CN111882544A (zh) * 2020-07-30 2020-11-03 平安国际智慧城市科技股份有限公司 基于人工智能的医学影像显示方法及相关装置
CN111882544B (zh) * 2020-07-30 2024-05-14 深圳平安智慧医健科技有限公司 基于人工智能的医学影像显示方法及相关装置
CN112527909A (zh) * 2020-12-24 2021-03-19 东软睿驰汽车技术(沈阳)有限公司 一种数据切片的处理方法、装置及相关产品
CN112989934A (zh) * 2021-02-05 2021-06-18 方战领 视频分析方法、装置及系统
CN112989934B (zh) * 2021-02-05 2024-05-24 方战领 视频分析方法、装置及系统
CN116309963A (zh) * 2023-05-18 2023-06-23 太初(无锡)电子科技有限公司 一种图像的批量标注方法、装置、电子设备及存储介质
CN116309963B (zh) * 2023-05-18 2023-08-18 太初(无锡)电子科技有限公司 一种图像的批量标注方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109190631A (zh) 图片的目标对象标注方法及装置
US10803352B2 (en) Image processing apparatus, image processing method, and image processing program
CN109255356B (zh) 一种文字识别方法、装置及计算机可读存储介质
CN109614921B (zh) 一种基于对抗生成网络的半监督学习的细胞分割方法
CN107423700A (zh) 人证核实的方法及装置
CN107368787A (zh) 一种面向深度智驾应用的交通标志识别算法
CN110136154A (zh) 基于全卷积网络与形态学处理的遥感图像语义分割方法
CN106909886B (zh) 一种基于深度学习的高精度交通标志检测方法及系统
CN113469953B (zh) 一种基于改进YOLOv4算法的输电线路绝缘子缺陷检测方法
CN111461212A (zh) 一种用于点云目标检测模型的压缩方法
CN111612891B (zh) 模型生成方法、点云数据处理方法、装置、设备及介质
CN111767927A (zh) 一种基于全卷积网络的轻量级车牌识别方法及系统
US20190228273A1 (en) Identifying parameter image adjustments using image variation and sequential processing
CN109472193A (zh) 人脸检测方法及装置
CN111597861A (zh) 遥感影像地物自动解译系统及方法
WO2023221608A1 (zh) 口罩识别模型的训练方法、装置、设备及存储介质
CN109919252A (zh) 利用少数标注图像生成分类器的方法
CN112508814B (zh) 一种基于无人机低空视角下的图像色调修复型去雾增强方法
CN110135413B (zh) 一种字符识别图像的生成方法、电子设备和可读存储介质
CN110570435A (zh) 用于对车辆损伤图像进行损伤分割的方法及装置
CN111709966A (zh) 眼底图像分割模型训练方法及设备
CN110689000A (zh) 一种基于生成复杂环境下车牌样本的车辆车牌识别方法
CN112101320A (zh) 模型训练方法、图像生成方法、装置、设备及存储介质
CN116188402A (zh) 一种基于改进ssd算法的绝缘子缺陷识别方法
CN113420871B (zh) 图像质量的评估方法、装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40002639

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20201009

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201009

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190111

RJ01 Rejection of invention patent application after publication