CN109858476A - 标签的扩充方法和电子设备 - Google Patents
标签的扩充方法和电子设备 Download PDFInfo
- Publication number
- CN109858476A CN109858476A CN201910090574.5A CN201910090574A CN109858476A CN 109858476 A CN109858476 A CN 109858476A CN 201910090574 A CN201910090574 A CN 201910090574A CN 109858476 A CN109858476 A CN 109858476A
- Authority
- CN
- China
- Prior art keywords
- result
- marked
- target
- image
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明实施例涉及计算机视觉领域,公开了一种标签的扩充方法和电子设备。本发明中,标签的扩充方法,包括:利用N个检测模型分别对待标注的图像进行检测;其中,所述N为大于1的自然数;获取所述N个检测模型的N个检测结果;其中,一个检测模型对应一个检测结果;根据获取的所述N个检测结果对所述待标注的图像进行标注;将标注好的图像作为标签添加到标签数据集中,使得可以避免漏标的问题,提高标注出的目标位置的准确性,有利于扩充高质量的标签数据集。
Description
技术领域
本发明实施例涉及计算机视觉领域,特别涉及一种标签的扩充方法和电子设备。
背景技术
目标检测是计算机视觉领域中应用深度学习技术最为广泛的一项任务,它是指从图像中识别出多个预定义类别的物体,并确定它们的位置。近十年来深度学习技术在目标检测方面的应用取得了巨大成功。深度学习中很多神经网络都需要大量的高质量标签数据集。
然而,发明人发现现有技术中至少存在如下问题:在实际应用中,为了达到快速扩充检测标签的目的,人们期望用自动标注工具去代替人工进行数据的标注,目前自动标注技术的实现方式主要是利用高精度模型对数据进行预标注,然后再利用人工进行校正。现有的样本标注方法包括目标检测,类别判定,人工校正数据和模型更新四个步骤。但是发明人发现通过上述方式容易造成漏标问题,且标注出来的目标位置不准确,导致扩充的标签不准确,影响了高质量标签数据集的形成。
发明内容
本发明实施方式的目的在于提供一种标签的扩充方法和电子设备,使得可以避免漏标的问题,提高标注出的目标位置的准确性,有利于扩充高质量的标签数据集。
为解决上述技术问题,本发明的实施方式提供了一种标签的扩充方法,包括以下步骤:利用N个检测模型分别对待标注的图像进行检测;其中,所述N为大于1的自然数;获取所述N个检测模型的N个检测结果;其中,一个检测模型对应一个检测结果;根据获取的所述N个检测结果对所述待标注的图像进行标注;将标注好的图像作为标签添加到标签数据集中。
本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的标签的扩充方法。
本发明实施方式相对于现有技术而言,利用多个不同的检测模型分别对待标注的图像进行检测,从而可以获取由多个检测模型得到的多个检测结果,一个检测模型对应一个检测结果;根据获取的多个检测结果对待标注的图像进行标注,将标注好的图像作为标签添加到标签数据集中。由于多个检测模型是不同的,检测结果会存在差异,有利于避免因为检测结果的单一性而造成的漏标问题。根据多个检测结果对图像进行标注,有利于多个检测结果可以通过相互印证来提高标注的准确性,将标注好的图像添加到标签数据集中,从而有利于扩充高质量的标签数据集,一定数量和一定质量的标签数据集有利于进一步提高目标检测的准确性。
另外,根据获取的N个检测结果对待标注的图像进行标注,具体包括:对N个检测结果进行整合,获取整合后的有效结果;根据有效结果对所述待标注的图像进行标注。通过对N个检测结果进行整合,有利于得到整合后的有效结果,根据有效结果进行标注,有利于提高标注的准确性。
另外,所述检测结果包括检测到的物体的检测类别和检测坐标;所述对所述N个检测结果进行整合,获取整合后的有效结果,具体包括:从N个检测结果中的任意一个检测结果中任选一个物体作为待标注的图像中的待标注的目标;在剩余的N-1个检测结果中提取满足预设要求的检测结果;其中,所述预设要求为检测到的物体的检测类别与所述目标的检测类别相同,且检测到的物体与所述目标的交并比大于预设阈值,所述交并比通过所述检测坐标获取;将提取出的检测结果作为获取的所述有效结果。也就是说,通过交并比的判断过滤剔除重复率较高的检测结果,避免之后对同一目标进行重复标注,有利于提高标注的有效性。
另外,根据所述有效结果对所述待标注的图像进行标注,具体包括:根据所述有效结果判断所述待标注的图像中是否存在所述目标;若所述待标注的图像中存在所述目标,则获取所述目标的标注坐标;根据所述标注坐标和所述目标所属的类别对所述待标注的图像中的目标进行标注。通过进一步确定待标注图像中确实存在目标之后再对目标的类别和坐标进行标注,有利于进一步提高标注的准确性和有效性,从而有利于得到高质量的标签数据集。
另外,所述有效结果的数量为M个,所述M为大于或等于2的自然数,所述根据所述有效结果判断所述待标注的图像中是否存在所述目标,具体包括:利用分类模型获取每一个有效结果中的物体所属的分类类别;若存在满足预设条件的有效结果,则判定所述待标注的图像中存在所述目标;其中,所述预设条件包括:所述有效结果中的物体的分类类别与检测类别相同。提供了一种判断待标注的图像中是否存在目标的判断方法,也就是说,如果通过检测模型得到的检测类别与通过分类模型获取的分类类别相同,可判定待标注的图像中存在目标,通过检测模型和分类模型的双重结果有利于提高判定的准确性。
另外,所述利用分类模型获取每一个有效结果中的物体的分类类别,具体包括:通过所述分类模型获取所述有效结果中的物体被判断为不同类别的分类概率;将所述不同类别的分类概率中,概率值最大的类别作为获取的所述分类类别。概率值最大的类别最接近物体的真实类别,因此将概率值最大的类别作为最终确定的物体的分类类别,有利于得到物体所属的真实的分类类别。
另外,所述预设条件还包括:所述有效结果中的物体的分类类别的分类概率大于预设门限。在分类类别与检测类别相同的基础上,预设条件再加上分类类别的分类概率大于预设门限,即目标实际属于分类类别的可能性极大,有利于更加准确的确定待标注图像中确实存在目标。
另外,满足预设条件的有效结果的数量为m个,所述m为大于或等于2的自然数,所述获取所述目标的标注坐标,具体包括:对m个有效结果中的m个检测坐标进行加权计算,得到所述目标的标注坐标。通过对m个有效结果中的m个检测坐标进行加权计算,有利于得到准确的标注坐标。
另外,对m个有效结果中的m个检测坐标进行加权计算,具体包括:分别获取m个有效结果中的物体的m个分类概率;其中,每个有效结果对应一个分类概率;将所述m个检测坐标按照所述m个分类概率进行加权计算。提供了一种具体的加权计算的方式,有利于通过m个检测坐标计算得到一个更加精确的目标的坐标,有利于对待标注图像中的目标进行准确的标注,将标准好的图像添加到标签数据集中,使得可以扩充高质量的标签数据集。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1是根据本发明第一实施方式的标签的扩充方法的流程图;
图2是根据本发明第一实施方式的步骤103的子步骤的流程图;
图3是根据本发明第三实施方式的步骤203的子步骤的流程图;
图4是根据本发明第三实施方式的实现标签的扩充方法的模块图;
图5是根据本发明第四实施方式的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
本发明的第一实施方式涉及一种标签的扩充方法。本实施方式的核心在于利用多个检测模型对待标注的图像进行检测得到多个检测结果,根据多个检测结果对待标注的图像进行标注,将标注好的图像作为标签添加到标签数据集中,以达到扩充高质量标签数据集的作用。下面对本实施方式的标签的扩充方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式中的标签的扩充方法如图1所示,具体包括:
步骤101:利用N个不同的检测模型分别对待标注的图像进行检测。
具体的说,N为大于1的自然数,N个不同的检测模型可以是基于不同数据集或使用不同网络训练得到的,比如说,检测模型可以是由卷积神经网络训练得到的模型。检测模型可以理解为包含目标的图像,目标可以根据实际需要进行设定,比如说,目标可以为图像中的某个人、某种动物或是某种植物等。利用检测模型可以检测出待标注的图像中存在的物体的检测类别和检测坐标。
步骤102:获取N个不同的检测模型的N个检测结果。
具体的说,由于N个检测模型并不相同,因此N个检测模型对于同一张待标注的图像进行检测时得到的检测结果可能存在差异。比如说,对于一张画有猫的待标注图像,通过检测模型A得到的检测结果为:待标注图像中的物体所属的类别为猫,通过检测模型B得到的检测结果为:待标注图像中的物体所属的类别为狗。检测结果中除了待标注图像中的物体的检测类别外还包括待标注图像中的物体的检测坐标。也就是说,不同的检测模型得到的检测结果中包括:检测到的物体的检测类别和检测坐标,在实际应用中N个检测结果可能相同也可能不同。
步骤103:根据获取的N个检测结果对待标注的图像进行标注。
具体的说,可以对获取的N个检测结果进行整合,获取整合后的有效结果,根据整合后的有效结果对待标注的图像进行标注,对待标注的图像进行标注可以为对待标注的图像中的目标标注上所属类别和坐标。比如说,待标注的图像中的目标为狗,则可以将狗用矩形框标记出来,标注出“狗”这一类别,并标注出“狗”在图像中的具体坐标。
为方便理解,下面对步骤103的实现过程进行具体描述,步骤103的子步骤可以如图2所示,包括:
步骤201:从N个检测结果中的任意一个检测结果中任选一个物体作为目标。
具体的说,N个检测结果中检测到的物体可能并不相同,在任意一个检测结果中任选一个物体作为目标。比如说,有3个检测结果,3个检测结果中检测到的物体依次为狗、猫、猫,即有两个检测结果中检测到的物体所属类别是相同的,任意选择的目标可以为第二个检测结果中检测到的猫。需要说明的是,本实施方式中只是以3个检测结果为例,在实际应用中并不以此为限。
步骤202:在剩余的N-1个检测结果中提取满足预设要求的检测结果,将提取出的检测结果作为获取的所述有效结果。
具体的说,剩余的N-1个检测结果为N个检测结果中除去步骤201中任选的目标所在的检测结果。预设要求可以为检测到的物体的检测类别与目标的检测类别相同,且检测到的物体与目标的交并比大于预设阈值。其中,预设阈值可以由本领域技术人员根据实际需要进行设置,对此本实施方式不做具体限定。交并比的大小可以用来表征两个检测结果中检测到的物体在图像中所占区域的重叠率。也就是说,将N-1个检测结果中与目标类别相同且交并比大于预设阈值的检测结果提取出来。继续以步骤201中的示例进行说明,一共有3个检测结果,任选的目标为检测结果2中的,因此在剩余的两个检测结果中提取出满足预设要求的检测结果,由于目标所属的检测类别为猫,因此首先可能被提取出的是检测到的物体同属于猫的检测结果3,如果确实要提取出检测结果3,还应该考虑到检测结果3中的猫所占的区域与作为目标的检测结果2中的猫所占的区域的交并比,如果交并比大于预设阈值,说明检测结果3与检测结果2重叠率很高,可以将检测结果3提取出来,然后将重叠率很高的检测结果2和检测结果3作为获取的有效结果。
进一步的,交并比的比值可以通过如下方式计算:假设N个检测结果记为di(i=1,2,…,n)从任意di中选定一个检测到的目标,不妨记为o1,再从dj(j=1,2,…,n且j≠i)中筛选出与o1类别一致的目标,根据坐标分别计算这些目标与o1的交并比值,将其中交并比值大于预设阈值t1的所有目标提取出来,连同o1一起记为oi(i=1,2,…,m),其中,o1与某个目标ok的交并比值计算过程为:假设o1的面积为s1,ok的面积为sk,o1与ok的重叠面积为则交并比IOU可以表示为:
上述步骤201至步骤202可以看作是对获取的N个检测结果进行整合,获取整合后的有效结果的实现过程。
步骤203:若根据有效结果判定待标注的图像中存在目标,则获取目标的标注坐标。
具体的说,本实施方式中有效结果的数量大于或等于2,可以先根据有效结果判断待标注的图像中是否存在步骤201中任选的目标。判断的方式可以如下:利用分类模型获取每一个有效结果中的物体所属的分类类别;若存在满足预设条件的有效结果,则判定待标注的图像中存在所述目标;预设条件可以包括:有效结果中的物体的分类类别与检测类别相同,也就是说,通过检测模型得到的检测类别与通过分类模型得到的分类类别相同。其中,分类模型可以为由卷积神经网络训练得到的分类模型,利用分类模型对待标注图像中的目标进行类别判定。
进一步的,利用分类模型获取每一个有效结果中的物体所属的分类类别的方法可以为:通过分类模型获取有效结果中的物体被判断为不同类别的分类概率;将不同类别的分类概率中,概率值最大的类别作为获取的分类类别。比如说,通过分类模型得到的有效结果A中的物体被判定为猫的概率为90%,判定为狗的概率为30%,则将猫作为有效结果A中的物体的分类类别。也就是说,通过分类模型得到的分类类别为猫,如果之前通过检测模型得到的检测类别也为猫,则可以判定待标注的图像中确实存在目标,此时的目标就为概率最高的猫。需要说明的是,在所有有效结果中,只要有一个有效结果中的目标物体的分类类别与检测类别是相同的即可以认为待标注的图像中目标确实存在。
再进一步的,在判定待标注的图像中确实存在目标时,获取目标的标注坐标。比如说,如果有m个有效结果满足预设条件,即m个有效结果中分类类别和检测类别相同,m个有效结果会对应m个检测坐标,可以对m个检测坐标进行加权处理,计算得到一个目标的标注坐标。
步骤204:根据标注坐标和目标所属的类别对待标注的图像中的目标进行标注。
也就是说,在得到目标的标注坐标和所属的真实类别后,将标注坐标和目标所属的真实类别标注在待标注的图像中。目标所属的真实类别可以理解为该目标的检测类别和分类类别相同时,将检测类别作为真实类别。
需要说明的是,本实施方式中只是以对待标注图像中的一个目标进行标注为例,在实际应用中待标注的图像中可能不止存在一个目标,因此可以按照上方法对待标注图像中的多个目标依次进行标注,直到待标注图像中的所有目标都被标注完。比如说,待标注图像中的待标注的目标既有狗也有猫,用5个检测模型进行检测时都检测到了猫和狗,可以先将猫作为待标注的目标,通过交并比提取,先取到5个猫的检测结果,然后根据5个猫的检测结果对图像中的猫进行标注。对猫标注完之后,再按照类似的步骤对图像中的狗进行标注。
步骤104:将标注好的图像制作成标签添加到标签数据集中。
具体的说,制作成的标签可以为图像及其对应的一个文件,这个文件内储存着图像中目标的标注坐标与所属种类,制作成的标签也可以为携带有标注信息的图像,标注信息包括了目标的标注坐标和所属种类。将制作好的标签添加到标签数据集中,完成对标签的扩充,利用扩充后的数据集还可以进行模型的训练得到精度更高的检测模型和分类模型,可以继续用于标签的扩充。
与现有技术相比,本实施方式中利用多个不同的检测模型分别对待标注的图像进行检测,从而可以获取由多个检测模型得到的多个检测结果,一个检测模型对应一个检测结果;根据获取的多个检测结果对待标注的图像进行标注,将标注好的图像作为标签添加到标签数据集中。由于多个检测模型是不同的,检测结果会存在差异,有利于避免因为检测结果的单一性而造成的漏标问题。根据多个检测结果对图像进行标注,有利于多个检测结果可以通过相互印证来提高标注的准确性,将标注好的图像添加到标签数据集中,从而有利于扩充高质量的标签数据集,一定数量和一定质量的标签数据集有利于进一步提高目标检测的准确性。
本发明的第二实施方式涉及一种标签的扩充方法。第二实施方式是第一实施方式的进一步改进,主要改进之处在于:在第二实施方式中,预设条件还包括:有效结果中的物体的分类类别的分类概率大于预设门限。
具体的说,第一实施方式中预设条件包括分类类别与检测类别相同,本实施方式中的预设条件在分类类别与检测类别相同的基础上,再加上分类类别的分类概率大于预设门限,预设门限可以由本领域技术人员根据实际需要进行设置。可以参考步骤203中的示例,通过分类模型得到的有效结果A中的物体被判定为猫的概率为90%,判定为狗的概率为30%,则将猫作为有效结果A中的物体的分类类别。此时,可以认为有效结果中的物体的分类类别的分类概率为90%,如果预设门限设置为80%,则可以看出有效结果中的物体的分类类别的分类概率大于预设门限。本实施方式中,如果有效结果中的物体的检测类别与分类类别相同且分类类别的分类概率大于预设门限,则可以判定待标注的图像中确实存在目标。
与现有技术相比,本实施方式中,在分类类别与检测类别相同的基础上,预设条件再加上分类类别的分类概率大于预设门限,说明目标实际属于分类类别的可能性极大,有利于更加准确的确定待标注图像中确实存在目标。
本发明的第三实施方式涉及一种标签的扩充方法。第三实施方式是第一实施方式的进一步改进,主要改进之处在于:在第三实施方式中,提供了一种具体如何加权计算得到标注坐标的实现方式,也就是说,本实施方式具体介绍步骤203中获取目标的标注坐标的一种实现方式,具体可以如图3所示,包括:
步骤301:分别获取m个有效结果中的物体的m个分类概率。
具体的说,m个有效结果为检测类别和分类类别相同的检测结果,一个有效结果对应一个分类概率。由于通过分类模型可以获取有效结果中的物体被判断为不同类别的分类概率,不同类别的分类概率中概率值最大的作为该有效结果中的物体的分类概率。比如说,通过检测模型A得到的有效结果A中的物体的检测类别为狗,通过分类模型得到该物体被判定为狗的概率值最大,该概率值为为80%,那么可以得到有效结果A中的物体的分类概率为80%。按照上述方法可以依次得到m个有效结果中的物体的m个分类概率。
步骤302:将m个检测坐标按照m个分类概率进行加权计算。
具体的说,可以用oi表示m个有效结果,i的取值为1到m,设oi的分类概率为ci,ci即为步骤301中获取的分类概率,oi左上角坐标为(xi1,yi1),右下角坐标为(xi2,yi2),目标o的左上角标注坐标为(x1,y1),右下角标注坐标为(x2,y2),则
比如说,两个有效结果中的目标可能位置坐标存在差异,有效结果中的目标即为通过检测模型检测到的待标注图像中的物体。有效结果A对应的分类概率很大,有效结果A中的目标的位置在左边,有效结果B对应的分类概率很小,有效结果B中的目标的位置在右边,那通过加权后最后确定的目标的坐标应该在中间但是偏左一点的位置。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
在实际应用中,本实施方式中的标签的扩充方法可以通过图4中的模块互相配合来实现,具体可以包括:检测模块401、交并比提取模块402、分类判定模块403、位置校正模块404、模型更新模块405。
检测模块401,是用多个由卷积神经网络训练得到的模型Di(i=1,2,…n)来对输入的待标注的图像进行检测,生成检测的结果,检测模型检测后的结果可以记为di(i=1,2,…,n),检测结果中包含目标物体的种类以及位置坐标。
交并比提取模块402,通过比较多个检测模型生成的检测结果,从di中任选一个检测到的目标,记为o1,再从dj(j=1,2,…,n且j≠i)中筛选出与o1类别一致的目标,根据坐标分别计算这些目标与o1的交并比值,将其中交并比值大于预设阈值的所有目标提取出来,连同o1一起记为oi(i=1,2,…,m)。由于多个检测结果很可能包含相同的目标,如果根据多个检测结果对图片进行标注,很可能出现一个目标被标注多次的情况,交并比提取模块402的作用就是提取出重复的目标。
分类判定模块403,利用一个(但不限于一个)由卷积神经网络训练得到的分类模型对交并比过滤模块过滤整合得到的目标物体进行类别的判定,如果分类类别和检测类别一致并且此类类别判定概率大于预设门限,则认为此目标确实存在。
位置校正模块404,在确定目标物体存在后,利用多个检测结果中此物体的坐标信息和相应的类别判定概率计算出一个更加精确的目标位置坐标,至此就将图片的多个检测结果整合为一个结果,其中包含目标物体的类别与位置坐标,并且此时的类别与坐标的准确程度要远高于单一模型的检测结果,将标注后的目标制作为标签文件。
在实际应用中,如果di中还有未被标注的目标,可以继续返回到交并比过滤模块402,提取出还未进行标注的目标,对未标注的目标进行标注。如果还有未标注的图像,可以将未标注的图像先输入到检测模块401,再按照上述步骤完成对图像的标注。当需要标注的图像被标注完成后,可以进一步人工审核并校准制作的标签文件,进一步保证制作的标注的准确性。
模型更新模块405,将人工校正后的标签加入到标签数据集中,完成对标签的扩充,利用扩充后的数据进行模型的训练得到精度更高的检测模型和分类模型,可以继续用于标签的扩充。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
与现有技术相比,本实施方式利用多个检测模型对于待标注图像进行检测,这样有效解决了用单一检测模型标注时出现的漏标问题;用分类模型进行判定,如果检测类别与分类类别不一致,即认为目标物体不存在,这样有效解决了误标的问题;结合多个检测结果的坐标信息加权得到准确的目标物体的实际坐标,极大地提高了得到目标位置坐标的准确程度。本实施方式中得到的标签无论是目标类别的准确性还是目标位置的准确性都有了极大提高,能够极大地减少人工标注和校正工作,提高作业速度。
本发明第四实施方式涉及一种电子设备,如图5所示,包括至少一个处理器501;以及,与所述至少一个处理器501通信连接的存储器502;其中,所述存储器502存储有可被所述至少一个处理器501执行的指令,所述指令被所述至少一个处理器501执行,以使所述至少一个处理器501能够执行上述的标签的扩充方法。
其中,存储器502和处理器501采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器501和存储器502的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器。
处理器501负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器502可以被用于存储处理器501在执行操作时所使用的数据。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
Claims (10)
1.一种标签的扩充方法,其特征在于,包括:
利用N个不同的检测模型分别对待标注的图像进行检测;其中,所述N为大于1的自然数;
获取所述N个不同的检测模型的N个检测结果;其中,一个检测模型对应一个检测结果;
根据获取的所述N个检测结果对所述待标注的图像进行标注;
将标注好的图像制作成标签添加到标签数据集中。
2.根据权利要求1所述的标签的扩充方法,其特征在于,所述根据获取的所述N个检测结果对所述待标注的图像进行标注,具体包括:
对所述N个检测结果进行整合,获取整合后的有效结果;
根据所述有效结果对所述待标注的图像进行标注。
3.根据权利要求2所述的标签的扩充方法,其特征在于,所述检测结果包括检测到的物体的检测类别和检测坐标;所述对所述N个检测结果进行整合,获取整合后的有效结果,具体包括:
从N个检测结果中的任意一个检测结果中任选一个物体作为待标注的图像中的待标注的目标;
在剩余的N-1个检测结果中提取满足预设要求的检测结果;其中,所述预设要求为检测到的物体的检测类别与所述目标的检测类别相同,且检测到的物体与所述目标的交并比大于预设阈值,所述交并比通过所述检测坐标获取;
将提取出的检测结果作为获取的所述有效结果。
4.根据权利要求3所述的标签的扩充方法,其特征在于,所述根据所述有效结果对所述待标注的图像进行标注,具体包括:
根据所述有效结果判断所述待标注的图像中是否存在所述目标;
若所述待标注的图像中存在所述目标,则获取所述目标的标注坐标;
根据所述标注坐标和所述目标所属的类别对所述待标注的图像中的目标进行标注。
5.根据权利要求4所述的标签的扩充方法,其特征在于,所述有效结果的数量为M个,所述M为大于或等于2的自然数,所述根据所述有效结果判断所述待标注的图像中是否存在所述目标,具体包括:
利用分类模型获取每一个有效结果中的物体所属的分类类别;
若存在满足预设条件的有效结果,则判定所述待标注的图像中存在所述目标;其中,所述预设条件包括:所述有效结果中的物体的分类类别与检测类别相同。
6.根据权利要求5所述的标签的扩充方法,其特征在于,所述利用分类模型获取每一个有效结果中的物体的分类类别,具体包括:
通过所述分类模型获取所述有效结果中的物体被判断为不同类别的分类概率;
将所述不同类别的分类概率中,概率值最大的类别作为获取的所述分类类别。
7.根据权利要求6所述的标签的扩充方法,其特征在于,所述预设条件还包括:所述有效结果中的物体的分类类别的分类概率大于预设门限。
8.根据权利要求5所述的标签的扩充方法,其特征在于,满足所述预设条件的有效结果的数量为m个,所述m为大于或等于2的自然数,所述获取所述目标的标注坐标,具体包括:
对m个有效结果中的m个检测坐标进行加权计算,得到所述目标的标注坐标。
9.根据权利要求8所述的标签的扩充方法,其特征在于,所述对m个有效结果中的m个检测坐标进行加权计算,具体包括:
分别获取m个有效结果中的物体的m个分类概率;其中,每个有效结果对应一个分类概率;
将所述m个检测坐标按照所述m个概率进行加权计算。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至9中任一所述的标签的扩充方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910090574.5A CN109858476B (zh) | 2019-01-30 | 2019-01-30 | 标签的扩充方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910090574.5A CN109858476B (zh) | 2019-01-30 | 2019-01-30 | 标签的扩充方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109858476A true CN109858476A (zh) | 2019-06-07 |
CN109858476B CN109858476B (zh) | 2021-01-22 |
Family
ID=66896849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910090574.5A Active CN109858476B (zh) | 2019-01-30 | 2019-01-30 | 标签的扩充方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109858476B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159150A (zh) * | 2019-12-19 | 2020-05-15 | 北京文安智能技术股份有限公司 | 一种数据扩充方法及装置 |
CN111428806A (zh) * | 2020-04-03 | 2020-07-17 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置、电子设备及存储介质 |
CN111783584A (zh) * | 2020-06-22 | 2020-10-16 | 杭州飞步科技有限公司 | 图像目标检测方法、装置、电子设备及可读存储介质 |
CN112132115A (zh) * | 2020-10-26 | 2020-12-25 | 北京罗克维尔斯科技有限公司 | 一种图像筛选方法及装置 |
CN112654999A (zh) * | 2020-07-21 | 2021-04-13 | 华为技术有限公司 | 标注信息的确定方法及装置 |
CN113378871A (zh) * | 2020-03-10 | 2021-09-10 | 中国移动通信集团辽宁有限公司 | 数据标注方法、装置及计算设备 |
WO2022247573A1 (zh) * | 2021-05-26 | 2022-12-01 | 腾讯科技(深圳)有限公司 | 模型训练方法、图像处理方法、装置、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722719A (zh) * | 2012-05-25 | 2012-10-10 | 西安电子科技大学 | 基于观察学习的入侵检测方法 |
CN104484681A (zh) * | 2014-10-24 | 2015-04-01 | 西安电子科技大学 | 基于空间信息和集成学习的高光谱遥感影像分类方法 |
US20170147905A1 (en) * | 2015-11-25 | 2017-05-25 | Baidu Usa Llc | Systems and methods for end-to-end object detection |
CN107169974A (zh) * | 2017-05-26 | 2017-09-15 | 中国科学技术大学 | 一种基于多监督全卷积神经网络的图像分割方法 |
CN108038516A (zh) * | 2017-12-27 | 2018-05-15 | 中山大学 | 基于低维图像编码与集成学习的白胚布平整度分级方法 |
CN108052955A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种高精度盲文识别方法及系统 |
CN108416394A (zh) * | 2018-03-22 | 2018-08-17 | 河南工业大学 | 基于卷积神经网络的多目标检测模型构建方法 |
CN109241871A (zh) * | 2018-08-16 | 2019-01-18 | 北京此时此地信息科技有限公司 | 一种基于视频数据的公共区域人流跟踪方法 |
-
2019
- 2019-01-30 CN CN201910090574.5A patent/CN109858476B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722719A (zh) * | 2012-05-25 | 2012-10-10 | 西安电子科技大学 | 基于观察学习的入侵检测方法 |
CN104484681A (zh) * | 2014-10-24 | 2015-04-01 | 西安电子科技大学 | 基于空间信息和集成学习的高光谱遥感影像分类方法 |
US20170147905A1 (en) * | 2015-11-25 | 2017-05-25 | Baidu Usa Llc | Systems and methods for end-to-end object detection |
CN107169974A (zh) * | 2017-05-26 | 2017-09-15 | 中国科学技术大学 | 一种基于多监督全卷积神经网络的图像分割方法 |
CN108052955A (zh) * | 2017-11-03 | 2018-05-18 | 中国科学院计算技术研究所 | 一种高精度盲文识别方法及系统 |
CN108038516A (zh) * | 2017-12-27 | 2018-05-15 | 中山大学 | 基于低维图像编码与集成学习的白胚布平整度分级方法 |
CN108416394A (zh) * | 2018-03-22 | 2018-08-17 | 河南工业大学 | 基于卷积神经网络的多目标检测模型构建方法 |
CN109241871A (zh) * | 2018-08-16 | 2019-01-18 | 北京此时此地信息科技有限公司 | 一种基于视频数据的公共区域人流跟踪方法 |
Non-Patent Citations (1)
Title |
---|
耿慧强: "基于深度学习的图像语义分割算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111159150A (zh) * | 2019-12-19 | 2020-05-15 | 北京文安智能技术股份有限公司 | 一种数据扩充方法及装置 |
CN113378871A (zh) * | 2020-03-10 | 2021-09-10 | 中国移动通信集团辽宁有限公司 | 数据标注方法、装置及计算设备 |
CN111428806A (zh) * | 2020-04-03 | 2020-07-17 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置、电子设备及存储介质 |
CN111428806B (zh) * | 2020-04-03 | 2023-10-10 | 北京达佳互联信息技术有限公司 | 图像标签确定方法、装置、电子设备及存储介质 |
CN111783584A (zh) * | 2020-06-22 | 2020-10-16 | 杭州飞步科技有限公司 | 图像目标检测方法、装置、电子设备及可读存储介质 |
CN111783584B (zh) * | 2020-06-22 | 2023-08-08 | 杭州飞步科技有限公司 | 图像目标检测方法、装置、电子设备及可读存储介质 |
CN112654999A (zh) * | 2020-07-21 | 2021-04-13 | 华为技术有限公司 | 标注信息的确定方法及装置 |
CN112132115A (zh) * | 2020-10-26 | 2020-12-25 | 北京罗克维尔斯科技有限公司 | 一种图像筛选方法及装置 |
CN112132115B (zh) * | 2020-10-26 | 2023-11-28 | 北京罗克维尔斯科技有限公司 | 一种图像筛选方法及装置 |
WO2022247573A1 (zh) * | 2021-05-26 | 2022-12-01 | 腾讯科技(深圳)有限公司 | 模型训练方法、图像处理方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109858476B (zh) | 2021-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858476A (zh) | 标签的扩充方法和电子设备 | |
CN108898047B (zh) | 基于分块遮挡感知的行人检测方法及系统 | |
CN104867137B (zh) | 一种基于改进ransac算法的图像配准方法 | |
CN111161311A (zh) | 一种基于深度学习的视觉多目标跟踪方法及装置 | |
CN110532894A (zh) | 基于边界约束CenterNet的遥感目标检测方法 | |
CN110738101A (zh) | 行为识别方法、装置及计算机可读存储介质 | |
CN110287873A (zh) | 基于深度神经网络的非合作目标位姿测量方法、系统及终端设备 | |
CN106709936A (zh) | 一种基于卷积神经网络的单目标跟踪方法 | |
CN105574550A (zh) | 一种车辆识别方法及装置 | |
CN109271990A (zh) | 一种针对rgb-d图像的语义分割方法及装置 | |
CN109176512A (zh) | 一种体感控制机器人的方法、机器人及控制装置 | |
CN107690660A (zh) | 图像识别方法及装置 | |
CN107730507A (zh) | 一种基于深度学习的病变区域自动分割方法 | |
CN109558902A (zh) | 一种快速目标检测方法 | |
CN106934795A (zh) | 一种混凝土桥梁裂缝的自动检测方法和预测方法 | |
CN108304820A (zh) | 一种人脸检测方法、装置及终端设备 | |
CN110276264A (zh) | 一种基于前景分割图的人群密度估计方法 | |
CN105243139A (zh) | 一种基于深度学习的三维模型检索方法及其检索装置 | |
CN108647732A (zh) | 一种基于深度神经网络的病理图像分类方法及装置 | |
CN106570516A (zh) | 一种利用卷积神经网络cnn的障碍物识别方法 | |
CN109697441A (zh) | 一种目标检测方法、装置及计算机设备 | |
CN106874913A (zh) | 一种菜品检测方法 | |
CN110175615A (zh) | 模型训练方法、域自适应的视觉位置识别方法及装置 | |
US11694428B1 (en) | Method for detecting Ophiocephalus argus cantor under intra-class occulusion based on cross-scale layered feature fusion | |
CN110796135A (zh) | 目标的定位方法及装置、计算机设备、计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |