CN115880338B - 标注方法、标注装置及计算机可读存储介质 - Google Patents

标注方法、标注装置及计算机可读存储介质 Download PDF

Info

Publication number
CN115880338B
CN115880338B CN202310192643.XA CN202310192643A CN115880338B CN 115880338 B CN115880338 B CN 115880338B CN 202310192643 A CN202310192643 A CN 202310192643A CN 115880338 B CN115880338 B CN 115880338B
Authority
CN
China
Prior art keywords
image
target
track
sub
target object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310192643.XA
Other languages
English (en)
Other versions
CN115880338A (zh
Inventor
周道利
马东星
李伟
敬太洋
陈涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202310192643.XA priority Critical patent/CN115880338B/zh
Publication of CN115880338A publication Critical patent/CN115880338A/zh
Application granted granted Critical
Publication of CN115880338B publication Critical patent/CN115880338B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本申请公开了一种标注方法、标注装置及计算机可读存储介质,该标注方法包括:获取目标图像组,目标图像组包括按照拍摄时间从前到后依次排列的多张图像,多张图像包括多张第一图像以及多张第二图像,其中,预先标注目标对象在每张第一图像上的第一标注框;根据每张第一图像中的第一标注框,生成目标对象的位姿变化轨迹;根据位姿变化轨迹,预测目标对象在每张第二图像上所处的第一目标区域;分别根据每张第二图像上的第一目标区域,确定目标对象在每张第二图像上的第二标注框。本申请所提供的标注方法能够提高标注的速度和准确率。

Description

标注方法、标注装置及计算机可读存储介质
技术领域
本申请涉及图像技术领域,特别是涉及一种标注方法、标注装置及计算机可读存储介质。
背景技术
随着机器人学习技术在计算机视觉领域的不断应用,对训练素材标注的要求越来越高,其中对训练素材进行标注的要求不仅体现在标注的准确率上,还体现在标注的速度上,但是目前在对训练素材进行标注时,主要还是依赖于人工标注的方式,标注准确率和速度均有待进一步提升。
发明内容
本申请提供一种标注方法、标注装置及计算机可读存储介质,能够提高标注的速度和准确率。
本申请实施例第一方面提供标注方法,所述标注方法包括:获取目标图像组,所述目标图像组包括按照拍摄时间从前到后依次排列的多张图像,所述多张图像包括多张第一图像以及多张第二图像,其中,预先标注目标对象在每张所述第一图像上的第一标注框;根据每张所述第一图像中的所述第一标注框,生成所述目标对象的位姿变化轨迹;根据所述位姿变化轨迹,预测所述目标对象在每张所述第二图像上所处的第一目标区域;分别根据每张所述第二图像上的所述第一目标区域,确定所述目标对象在每张所述第二图像上的第二标注框。
本申请实施例第二方面提供一种标注装置,所述标注装置包括处理器、存储器以及通信电路,所述处理器分别耦接所述存储器、所述通信电路,所述存储器中存储有程序数据,所述处理器通过执行所述存储器内的所述程序数据以实现上述方法中的步骤。
本申请实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现上述方法中的步骤。
有益效果是:本申请的方法根据预先标注的第一标注框,生成目标对象的位姿变化轨迹,从而利用位姿变化轨迹预测目标对象在每张第二图像上所处的第一目标区域,最终根据第二图像上的第一目标区域,确定目标对象在第二图像上的第二标注框,通过该方法,只需要用户对目标图像组中的部分图像进行标注,无需对目标图像组中的每张图像都进行标注,既能提高标注的速度,也能减少人工标注时的失误,从而能够提高标注的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图,其中:
图1是本申请标注方法一实施方式的流程示意图;
图2是一张第一图像的结构示意图;
图3是另一张第一图像的结构示意图;
图4是又一张第一图像的结构示意图;
图5是图1中步骤S140的流程示意图;
图6是图1中步骤S120的部分流程示意图;
图7是图1中步骤S130的部分流程示意图;
图8是图1实施方式的另一部分流程示意图;
图9是对第一目标区域进行放大的结构示意图;
图10是本申请标注装置一实施方式的结构示意图;
图11是本申请标注装置另一实施方式的结构示意图;
图12是本申请计算机可读存储介质一实施方式的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
需要说明的是,本申请中的术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
参阅图1,图1是本申请标注方法一实施方式的流程示意图,该方法包括:
S110:获取目标图像组,目标图像组包括按照拍摄时间从前到后依次排列的多张图像,多张图像包括多张第一图像以及多张第二图像,其中,预先标注目标对象在每张第一图像上的第一标注框。
具体地,目标图像组中的多张图像按照拍摄时间从前到后的顺序依次排列,且目标图像组中的图像可以是拍摄时间连续的多张图像,例如,目标图像组中的第一张图像是视频中的第一帧图像,第二张图像是视频中的第二帧图像,第三张图像是视频中的第三帧图像,以此类推。
其中,预先提示用户对目标图像组中的部分图像进行标注,且在用户完成部分图像的标注后,将用户标注过的图像定义为第一图像,将待标注的图像定义为第二图像,且将第一图像中用户对目标对象标注的标注框定义为第一标注框。本申请的整体标注过程可以大致总结为,根据用户已经标注的目标对象A的第一标注框,生成每张第二图像上目标对象A的标注框,从而只需要用户手动对部分图像进行标注,无需对目标图像组中的每张图像都进行标注,既能提高标注的速度,也能减少人工标注时的失误,从而能够提高标注的准确率。
需要说明的是,目标图像组中的每张图像均有可能包括多个对象,当包括多个对象时,可以针对每个对象都执行步骤S110-S140,从而最终完成对目标图像组中每张图像每个对象的标注。为了便于理解,在此结合实例进行说明:用户预先对每张第一图像上的每个对象都进行标注,从而在后续的步骤中,根据用户已经标注的目标对象A的第一标注框,生成每张第二图像上目标对象A的标注框;根据用户已经标注的目标对象B的第一标注框,生成每张第二图像上目标对象B的标注框;根据用户已经标注的目标对象C的第一标注框,生成每张第二图像上目标对象C的标注框,以此类推。其中,为了便于说明,在接下来的步骤中,仅针对一个目标对象的标注过程进行说明。
其中,本申请所说的目标对象可以是一个单独的对象,也可以是一个群体,该群体包括多个对象,该多个对象距离较近,因此可以作为一个整体进行分析。
其中,在提示用户对进行人工标注时,可以让用户在目标图像组的多张图像中按照预设的间隔进行标注,例如,用户在图像1进行标注后,点击“下一帧”,然后进入对图像2的标注,其中,图像1和图像2在目标图像组中间隔n帧。当然用户在人工标注时,也可以对连续的多张图像进行标注,从而多张第一图像是连续的多张图像。
其中,在提示用户对目标图像组中的图像进行标注时,可以根据图像中目标对象所包括对象的个数和目标对象中各个对象进行的事件,给出一个标注数据建议量(目标对象所包括对象的个数越多、目标对象中各个对象进行的事件越复杂,标注数据建议量越多),即建议用户对多少张图像中的目标对象进行标注,或者具体标注多少张图像也可以由用户自己进行配置。
S120:根据每张第一图像中的第一标注框,生成目标对象的位姿变化轨迹。
具体地,不同第一图像中的第一标注框的位置、大小可能均不同,结合图2-图4,当目标对象在运动时,不同时刻目标对象呈现不同的姿态,从而第一标注框(图2-图4中的虚线框为第一标注框)的大小不同。因此每张第一图像中的第一标注框都能够展现目标对象在该第一图像对应的拍摄时刻的位置和姿态,因此根据多个第一标注框,能够生成目标对象随时间变化的位姿变化轨迹。
S130:根据位姿变化轨迹,预测目标对象在每张第二图像上所处的第一目标区域。
具体地,步骤S120得到的位姿变化轨迹展示了目标对象随时间的运动情况,而目标对象的运动情况通常是连贯的,因此可以根据位姿变化轨迹,预测目标对象在每张第二图像上所处的第一目标区域。
S140:分别根据每张第二图像上的第一目标区域,确定目标对象在每张第二图像上的第二标注框。
具体地,针对每张第二图像,在确定目标对象在第二图像上所处的第一目标区域后,能够确定目标对象在该第二图像上的第二标注框。
在一应用场景中,针对每张第二图像,在确定目标对象在第二图像上所处的第一目标区域后,可以直接将第一目标区域的轮廓边框,确定为目标对象在该第二图像上的第二标注框。
在另一应用场景中,参阅图5,步骤S140具体包括:
S141:分别从每个第一目标区域中提取目标轮廓。
具体地,针对每个第一目标区域,利用第一目标区域内灰度或结构等信息的突变处提取出边缘,从而得到目标轮廓。其中,具体可以利用例如Roberts算子、Sobel算子或者Prewitt算子等边缘检测方法在第一目标区域内进行边缘检测,从而得到目标轮廓。其中,关于提取目标轮廓的具体过程,本申请不做具体限制。
S142:确定每个目标轮廓的最小外接矩形框,得到每张第二图像上的第二标注框。
具体地,针对每张第二图像,在得到第二图像上的目标轮廓后,直接将目标轮廓的最小外接矩形,确定为该第二图像上的第二标注框。
从上述内容可以看出,本申请的方法根据预先标注的第一标注框,生成目标对象的位姿变化轨迹,从而利用位姿变化轨迹预测目标对象在每张第二图像上所处的第一目标区域,最终根据第二图像上的第一目标区域,确定目标对象在第二图像上的第二标注框,通过该方法,只需要用户对目标图像组中的部分图像进行标注,无需对目标图像组中的每张图像都进行标注,既能提高标注的速度,也能减少人工标注时的失误,从而能够提高标注的准确率。
其中在得到每张第二图像上的第二标注框之后,还可以将每张第二图像上的第二标注框推送至用户,由用户确认标注信息,其中用户在确认是可以对不正确的标注框进行修改,最后在用户确认完成后,可以将所有的标注数据进行下发,利用目标图像组中的图像去训练相应的模型。
在本实施方式中,步骤S120具体包括:
S121:确定每个第一位置对应的第一子轨迹,其中,根据每个第一标注框所占区域中第一位置的第一像素点,确定第一位置对应的第一子轨迹。
此时,步骤S130具体包括:
S131:分别预测每张第二图像中每个第一位置对应的第二像素点,其中,根据第一位置对应的第一子轨迹,预测每张第二图像中第一位置对应的第二像素点。
S132:针对每张第二图像,根据第二图像中的各个第二像素点,确定第二图像上的第一目标区域。
在本实施方式中,第一位置的数量为四个,四个第一位置分别是第一标注框所占区域的左上角位置、右上角位置、左下角位置以及右下角位置。
具体地,根据每个第一标注框左上角位置的像素点,确定左上角位置对应的第一子轨迹;根据每个第一标注框右上角位置的像素点,确定右上角位置对应的第一子轨迹;根据每个第一标注框左下角位置的像素点,确定左下角位置对应的第一子轨迹;根据每个第一标注框右下角位置的像素点,确定右下角位置对应的第一子轨迹。
接着,根据左上角位置对应的第一子轨迹,预测每张第二图像中左上角位置对应的第二像素点;根据右上角位置对应的第一子轨迹,预测每张第二图像中右上角位置对应的第二像素点;根据左下角位置对应的第一子轨迹,预测每张第二图像中左下角位置对应的第二像素点;根据右下角位置对应的第一子轨迹,预测每张第二图像中右下角位置对应的第二像素点。
从而对于每张第二图像而言,均可以得到4个第二像素点,从而将该4个第二像素点均作为第一目标区域的顶点,从而得到第一目标区域。
为了便于理解,在此结合图2至图5进行说明:
在图2-图5中,将每个第一标注框左上角的像素点记为像素点A,将每个第一标注框右上角的像素点记为像素点B,将每个第一标注框左下角的像素点记为像素点C,将每个第一标注框右下角的像素点记为像素点D,从而根据每个第一图像上的像素点A,确定第一子轨迹1;根据每个第一图像上的像素点B,确定第一子轨迹2;根据每个第一图像上的像素点C,确定第一子轨迹3;根据每个第一图像上的像素点D,确定第一子轨迹4。
从而利用第一子轨迹1预测每个第二图像中第一目标区域的左上顶点,利用第一子轨迹2预测每个第二图像中第一目标区域的右上顶点,利用第一子轨迹3预测每个第二图像中第一目标区域的左下顶点,利用第一子轨迹4预测每个第二图像中第一目标区域的右下顶点。
从而针对每张第二图像而言,连接第二图像上的4个顶点,得到第二图像上的第一目标区域。
需要说明的是,在其他实施方式中,第一位置的数量也可以是一个,例如,第一位置是第一标注框所占区域的中心位置,此时在得到每张第二图像中的第二像素点后,将第二像素点作为第一目标区域的中心点,此时需要进一步结合第一目标区域的预设尺寸,最终得到每张第二图像中的第一目标区域。
或者,在其他实施方式中,第一位置的数量也可以是两个,例如,两个第一位置分别是第一标注框所占区域的左上角位置以及右下角位置,此时在得到每张第二图像中的两个第二像素点后,将左上角位置对应的第二像素点作为第一目标区域的左上顶点,右下角位置对应的第二像素点作为第一目标区域的右下顶点,并可以进一步结合第一目标区域的预设形状,得到每张第二图像中的第一目标区域,其中,第一目标区域的预设形状可以是矩形。
在本实施方式中,参阅图6,针对每个第一位置,按照以下方式确定第一位置对应的第一子轨迹:
S11:根据每个第一标注框所占区域中第一位置的第一像素点的横坐标,确定第一位置对应的第一分量子轨迹。
S12:根据每个第一标注框所占区域中第一位置的第一像素点的纵坐标,确定第一位置对应的第二分量子轨迹。
同时参阅图7,按照以下方式确定每张第二图像中第一位置对应的第二像素点:
S21:根据第一位置对应的第一分量子轨迹,预测每张第二图像中第一位置对应的第二像素点的横坐标。
S22:根据第一位置对应的第二分量子轨迹,预测每张第二图像中第一位置对应的第二像素点的纵坐标。
具体地,为了更好地理解上述方案,结合图2至图4,以第一位置为第一标注框的左上角位置进行说明,同时将每个第一目标区域位于左上角位置的像素点记为像素点A’:
首先根据每个第一标注框上的第一像素点A的横坐标(在X方向上的分量),确定第一时间运动轨迹;根据每个第一标注框上的第一像素点A的纵坐标(在Y方向上的分量),确定第二时间运动轨迹。
然后利用第一时间运动轨迹,预测每个像素点A’的横坐标(在X方向上的分量);利用第二时间运动轨迹,预测每个像素点A’的纵坐标(在Y方向上的分量),最后可以确定每个像素点A’。
在本实施方式中,步骤S11具体包括:根据每个第一标注框所占区域中第一位置的第一像素点的横坐标对预设的第一目标拟合函数进行拟合,得到第一位置对应的第一分量子轨迹。
步骤S12具体包括:根据每个第一标注框所占区域中第一位置的第一像素点的纵坐标对预设的第二目标拟合函数进行拟合,得到第一位置对应的第二分量子轨迹。
其中,第一目标拟合函数和第二目标拟合函数可以相同,也可以不同,在此不做限制,下面以第一目标拟合函数进行介绍:
预设的第一目标拟合函数可以由用户根据目标对象的运动情况进行设置,例如,当目标对象的运动复杂度为简单时,将第一目标拟合函数设置为:y=ax+b;当目标对象的运动复杂度为一般时,将第一目标拟合函数设置为y=ax2+bx+c;将目标对象的运动复杂度为复杂时,将第一目标拟合函数设置为y=ax3+bx2+cx+d。
其中,对第一目标拟合函数进行拟合后,得到第一目标拟合函数中的各个系数,从而得到。
其中,当目标对象为匀速行走的人或者车辆时,确定目标对象的运动复杂度为简单;当目标对象为高空抛物或者变速行驶的车辆时,确定目标对象的运动复杂度为一般;当目标对象为风力作用下的水面漂浮物或者空中漂浮物时,确定目标对象的运动复杂度为复杂。
参阅图8,在本实施方式中,在步骤S130之前,还包括:
S150:根据位姿变化轨迹,预测目标对象在每张第一图像上所处的第二目标区域。
S160:根据每张第一图像上的第一标注框以及第二目标区域,确定轨迹误差。
S170:若轨迹误差处于预设范围内,则执行步骤S130。
具体地,在得到的位姿变化轨迹不准确的情况下,如果还利用该位姿变化轨迹预测目标对象在第二图像上所处的第一目标区域,则会造成最终得到的第二标注框不准确,因此在步骤S130之前,需要验证位姿变化轨迹是否准确,验证的过程包括:
首先利用步骤S120得到的位姿变化轨迹预测目标对象在每张第一图像上所处的区域,将该区域定义为第二目标区域。可以理解的是,在第一图像中,如果第一标注框所处的区域和第二目标区域重合度高,则说明利用该位姿变化轨迹预测第一目标区域的准确率高,否则准确率低。
因此可以利用所有第一图像上的第一标注框以及第二目标区域,确定轨迹误差。如果轨迹误差处于预设范围内,则说明利用位姿变化轨迹预测的准确率高,则执行步骤S130,即利用位姿变化轨迹去预测目标对象在第二图像上所处的第一目标区域。
在本实施方式的一应用场景中,当第一位置的数量为四个,四个第一位置分别是第一标注框所占区域的左上角位置、右上角位置、左下角位置以及右下角位置时,按照以下方式确定轨迹误差:
假设第一图像的数量为m个,将第一图像i上第一标注框的左上顶点坐标记为(
Figure SMS_1
Figure SMS_2
),将第一图像i上第二目标区域的左上顶点坐标记为(/>
Figure SMS_3
,/>
Figure SMS_4
)。/>
按照以下方式确定左上顶点X分量的误差
Figure SMS_5
Figure SMS_6
Figure SMS_7
Figure SMS_8
Figure SMS_9
其中,
Figure SMS_10
为左顶点X分量的误差平方和,/>
Figure SMS_11
为左顶点X分量的回归平方和;
同样地,按照以下方式确定左上顶点Y分量的误差
Figure SMS_12
Figure SMS_13
Figure SMS_14
Figure SMS_15
Figure SMS_16
参照以上方法,可以确定右上顶点、左下顶点以及右下顶点的
Figure SMS_17
和/>
Figure SMS_18
,其中,如果每个顶点的/>
Figure SMS_19
和/>
Figure SMS_20
都在相应的预设范围内,则确定轨迹误差处于预设范围内,否则确定轨迹误差不处于预设范围内。
在本实施方式的另一应用场景中,确定轨迹误差的过程还可以包括:
首先分别确定每张第一图像上第一标注框所占区域与第二目标区域的交并比,然后确定交并比的平均值,然后大于预设的阈值,则确定轨迹误差处于预设范围内,否则确定轨迹误差不处于预设范围内。
同时在本实施方式的第一应用场景中,目标图像组中相邻两个第一图像之间分布有第二图像,例如用户预先按照预设间隔对目标图像组中的图像进行标注,此时如果步骤S160中确定的轨迹误差不在预设范围内,则执行以下步骤:
S41:若轨迹误差不处于预设范围内,则将目标图像组依次划分为至少两个子图像组,每个子图像组均包括多张第一图像以及多张第二图像。
具体地,将目标图像组依次划分的意思是,将目标图像组中连续的多张图像划分到一个子图像组中去。例如,假设目标图像组包括30张图像,则可以利用前10张目标图像组成子图像组1,利用中间10张目标图像组成子图像组2,利用最后10张目标图像组成子图像组3。
其中,子图像组的数量可以两个、三个,甚至更多个,在此不做限制。为了便于说明,以子图像组的数量为两个进行说明。
S42:针对每个子图像组,根据子图像组中每张第一图像的第一标注框,生成目标对象与子图像组对应的位姿变化子轨迹,根据位姿变化子轨迹,预测目标对象在子图像组中的每张第二图像上所处的第一目标区域。
具体地,对于每个子图像组而言,执行上述步骤,从而得到每个子图像组中,每个第二图像上目标对象所处的第一目标区域。也就是说,将子图像组作为上述的目标图像组,执行上述步骤。为了更好地理解,在此结合实例进行说明:
在将目标图像组划分为子图像组1和子图像组2后,根据子图像组1中每张第一图像中的第一标注框,生成目标对象的子位姿变化轨迹1,然后根据子位姿变化轨迹1,预测目标对象在子图像组1中的每张第二图像上的第一目标区域;同样地,根据子图像组2中每张第一图像中的第一标注框,生成目标对象的子位姿变化轨迹2,然后根据子位姿变化轨迹2,预测目标对象在子图像组2中的每张第二图像上的第一目标区域,从而可以得到目标图像组中每张第二图像上的第一目标区域,最终根据每张第二图像上的第一目标区域,确定目标对象在每张第二图像上的第二标注框。
其中,生成子位姿变化轨迹1、子位姿变化轨迹2的过程与上述生成位姿变化轨迹的过程相同,具体可参见上述相关内容,在此不再赘述。
S43:分别根据每张第二图像上的第一目标区域,确定目标对象在每张第二图像上的第二标注框。
具体地,步骤S43与步骤S140相同,具体可参见上述相关内容,在此不再赘述。
在上述第一应用场景中,当判定轨迹误差不在预设范围内时,将目标图像组进行划分,相当于对位姿变化轨迹进行切分,可以提高得到的位姿变化子轨迹的准确率,保证最终预测结果的准确率。
需要说明的是,在上述第一应用场景中,在根据位姿变化子轨迹,预测目标对象在子图像组中的每张第二图像上所处的第一目标区域之前,还可以判断位姿变化子轨迹的预测准确率是否满足要求,如果满足,则执行后续步骤,如果不满足,则可以对子图像组进行进一步的划分,不断重复上述过程,直至最终得到的轨迹预测准确率符合要求。
在本实施方式的第二应用场景中,此时如果步骤S160中确定的轨迹误差不在预设范围内,则执行以下步骤:
S51:若轨迹误差不处于预设范围内,则提醒用户在部分第二图像上标注目标对象的标注框。
S52:在用户完成标注后,返回执行步骤S120至步骤S140。
具体地,在第二应用场景中,如果轨迹误差不处于预设范围内,则认为位姿变化轨迹不准确的原因在于,用户预先标注的数据量太少,则增加标注数据,即让用户标注部分第二图像上目标对象的标注框,从而基于更新后的目标图像组,再执行步骤S110-S140。
在其他应用场景中,可以将第一应用场景的方案和第二应用场景的方案进行结合:
具体地,在采用第一应用场景中的方案时,在根据位姿变化子轨迹,预测目标对象在子图像组中的每张第二图像上所处的第一目标区域之前,判断位姿变化子轨迹的预测准确率是否满足要求,如果满足要求,则执行后续步骤,如果不满足要求,则执行第二应用场景中的方案,即提醒用户增加标注数据。
在本实施方式中,在步骤S140之前,还可以根据目标对象的形状变化情况,对每个目标区域进行放大或者缩小。
在一应用场景中,对每个目标区域进行放大或者缩小的倍数,均由用户预先设置,具体地,此时用户预先根据目标对象的运动情况,决定对目标区域进行放大或者缩小的倍数。例如,当目标对象为在镜头前徘徊的人员时,目标对象在画面中的大小基本保持不变,则用户可以设置不对目标区域进行放大或者缩小,当目标对象由近及远运动时,用户可以预先设置对目标区域进行缩小,并预先设置好缩小的倍数,当目标对象由远及近运动时,用户可以预先设置对目标区域进行放大,并预先设置好放大的倍数。
在另一应用场景中,当用户没有预先设置对目标区域进行放大或者缩小的倍数时,可以按照以下方式对目标区域进行放大或者缩小:
S61:确定相邻的两张第一图像中第一标注框的大小关系。
S62:根据大小关系,对处于相邻的两张第一图像之间的第二图像上的第一目标区域进行放大或者缩小。
具体地,在相邻的两张第一图像中,如果拍摄时间晚的第一图像上的第一标注框大于拍摄时间早的第一图像上的第一标注框,则对位于该相邻的两张第一图像之间的第二图像上的第一目标区域进行放大处理,如果拍摄时间晚的第一图像上的第一标注框小于拍摄时间早的第一图像上的第一标注框,则对位于该相邻的两张第一图像之间的第二图像上的第一目标区域进行缩小处理,如果拍摄时间晚的第一图像上的第一标注框与拍摄时间早的第一图像上的第一标注框大小大致相等,则对位于该相邻的两张第一图像之间的第二图像上的第一目标区域不做任何处理。
其中,放大或者缩小的比例可以根据相邻两张第一图像上第一标注框的大小比例进行确定,在此结合实例进行说明:
假设在目标图像组中,用户预先标注了目标对象在第一张图像和第六张图像上的标注框,未标注目标对象在第二张图像至第五张图像上的标注框。此时假设确定出第六张图像上第一标注框是第一张图像上第一标注框的6倍,则将第二张图像上的第一目标区域放大2倍,将第三张图像上的第一目标区域放大3倍,将第四张图像上的第一目标区域放大4倍,将第五张图像上的第一目标区域放大5倍。
其中,结合图9,下面以对区域ABCD放大2倍为例,介绍对目标区域进行放大的过程:
(1)首先连接区域ABCD的对角线,获得对角线的相交点O;
(2)基于O点延长OA至OA1,使得OA1的长度是OA的两倍,其余的点同A点,最后区域A1B1C1D1为放大后的目标区域。
对目标区域进行缩小的方法可以参照上述放大的过程进行处理,在此不做具体介绍。
参阅图10,图10是本申请标注装置一实施方式的结构示意图。该标注装置200包括处理器210、存储器220以及通信电路230,处理器210分别耦接存储器220、通信电路230,存储器220中存储有程序数据,处理器210通过执行存储器220内的程序数据以实现上述任一项实施方式方法中的步骤,其中详细的步骤可参见上述实施方式,在此不再赘述。
其中,标注装置200可以是电脑、手机等任一项具有图像处理能力的装置,在此不做限制。
参阅图11,图11是本申请标注装置另一实施方式的结构示意图。该标注装置300包括依次连接的获取模块310、生成模块320、预测模块330以及确定模块340。
获取模块310用于获取目标图像组,目标图像组包括按照拍摄时间从前到后依次排列的多张图像,多张图像包括多张第一图像以及多张第二图像,其中,预先标注目标对象在每张第一图像上的第一标注框。
生成模块320用于根据每张第一图像中的第一标注框,生成目标对象的位姿变化轨迹。
预测模块330用于根据位姿变化轨迹,预测目标对象在每张第二图像上所处的第一目标区域。
确定模块340用于分别根据每张第二图像上的第一目标区域,确定目标对象在每张第二图像上的第二标注框。
其中,标注装置300可以是电脑、手机等任一项具有图像处理能力的装置,在此不做限制。
其中,标注装置300在工作时执行上述任一项实施方式中的方法步骤,详细的方法步骤可参见上述相关内容,在此不再赘述。
参阅图12,图12是本申请计算机可读存储介质一实施方式的结构示意图。该计算机可读存储介质400存储有计算机程序410,计算机程序410能够被处理器执行以实现上述任一项方法中的步骤。
其中,计算机可读存储介质400具体可以为U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储计算机程序410的装置,或者也可以为存储有该计算机程序410的服务器,该服务器可将存储的计算机程序410发送给其他设备运行,或者也可以自运行该存储的计算机程序410。
以上所述仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (12)

1.一种标注方法,其特征在于,所述方法包括:
获取目标图像组,所述目标图像组包括按照拍摄时间从前到后依次排列的多张图像,所述多张图像包括多张第一图像以及多张第二图像,其中,预先标注目标对象在每张所述第一图像上的第一标注框;
根据每张所述第一图像中的所述第一标注框,生成所述目标对象的位姿变化轨迹;
根据所述位姿变化轨迹,预测所述目标对象在每张所述第二图像上所处的第一目标区域;
分别根据每张所述第二图像上的所述第一目标区域,确定所述目标对象在每张所述第二图像上的第二标注框;
其中,所述根据每张所述第一图像中的所述第一标注框,生成所述目标对象的位姿变化轨迹的步骤,包括:确定每个第一位置对应的第一子轨迹,其中,根据每个所述第一标注框所占区域中所述第一位置的第一像素点,确定所述第一位置对应的所述第一子轨迹;
所述根据所述位姿变化轨迹,预测所述目标对象在每张所述第二图像上所处的第一目标区域的步骤,包括:分别预测每张所述第二图像中每个所述第一位置对应的第二像素点,其中,根据所述第一位置对应的所述第一子轨迹,预测每张所述第二图像中所述第一位置对应的所述第二像素点;针对每张所述第二图像,根据所述第二图像中的各个所述第二像素点,确定所述第二图像上的所述第一目标区域。
2.根据权利要求1所述的方法,其特征在于,所述第一位置的数量为四个,四个所述第一位置分别是所述第一标注框所占区域的左上角位置、右上角位置、左下角位置以及右下角位置;
所述根据所述第二图像中的各个所述第二像素点,确定所述第二图像上的所述第一目标区域的步骤,包括:
将所述第二图像中的各个所述第二像素点作为所述第一目标区域的顶点,得到所述第一目标区域。
3.根据权利要求1所述的方法,其特征在于,所述根据每个所述第一标注框所占区域中所述第一位置的第一像素点,确定所述第一位置对应的所述第一子轨迹的步骤,包括:
根据每个所述第一标注框所占区域中所述第一位置的所述第一像素点的横坐标,确定所述第一位置对应的第一分量子轨迹;
根据每个所述第一标注框所占区域中所述第一位置的所述第一像素点的纵坐标,确定所述第一位置对应的第二分量子轨迹;
所述根据所述第一位置对应的所述第一子轨迹,预测每张所述第二图像中所述第一位置对应的所述第二像素点的步骤,包括:
根据所述第一位置对应的第一分量子轨迹,预测每张所述第二图像中所述第一位置对应的所述第二像素点的横坐标;
根据所述第一位置对应的第二分量子轨迹,预测每张所述第二图像中所述第一位置对应的所述第二像素点的纵坐标。
4.根据权利要求3所述的方法,其特征在于,所述根据每个所述第一标注框所占区域中所述第一位置的所述第一像素点的横坐标,确定所述第一位置对应的第一分量子轨迹的步骤,包括:
根据每个所述第一标注框所占区域中所述第一位置的所述第一像素点的横坐标对预设的第一目标拟合函数进行拟合,得到所述第一位置对应的所述第一分量子轨迹;和/或,
所述根据每个所述第一标注框所占区域中所述第一位置的所述第一像素点的纵坐标,确定所述第一位置对应的第二分量子轨迹的步骤,包括:
根据每个所述第一标注框所占区域中所述第一位置的所述第一像素点的纵坐标对预设的第二目标拟合函数进行拟合,得到所述第一位置对应的所述第二分量子轨迹。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述位姿变化轨迹,预测所述目标对象在每张所述第二图像上所处的第一目标区域之前,还包括:
根据所述位姿变化轨迹,预测所述目标对象在每张所述第一图像上所处的第二目标区域;
根据每张所述第一图像上的所述第一标注框以及所述第二目标区域,确定轨迹误差;
若所述轨迹误差处于预设范围内,则执行所述根据所述位姿变化轨迹,预测所述目标对象在每张所述第二图像上所处的第一目标区域的步骤。
6.根据权利要求5所述的方法,其特征在于,相邻两个所述第一图像之间分布有所述第二图像,所述方法还包括:
若所述轨迹误差不处于所述预设范围内,则将所述目标图像组依次划分为至少两个子图像组,每个所述子图像组均包括多张所述第一图像以及多张所述第二图像;
针对每个所述子图像组,根据所述子图像组中每张所述第一图像的所述第一标注框,生成所述目标对象与所述子图像组对应的位姿变化子轨迹,根据所述位姿变化子轨迹,预测所述目标对象在所述子图像组中的每张所述第二图像上所处的第一目标区域;
分别根据每张所述第二图像上的所述第一目标区域,确定所述目标对象在每张所述第二图像上的第二标注框。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述轨迹误差不处于所述预设范围内,则提醒用户在部分所述第二图像上标注所述目标对象的标注框;
在用户完成标注后,返回执行所述根据每张所述第一图像中的所述第一标注框,生成所述目标对象的位姿变化轨迹的步骤至所述分别根据每张所述第二图像上的所述第一目标区域,确定所述目标对象在每张所述第二图像上的第二标注框的步骤。
8.根据权利要求1所述的方法,其特征在于,在所述分别根据每张所述第二图像上的所述第一目标区域,确定所述目标对象在每张所述第二图像上的第二标注框之前,所述方法还包括:
对每个所述第一目标区域进行放大或者缩小。
9.根据权利要求8所述的方法,其特征在于,所述对每个所述第一目标区域进行放大或者缩小的步骤,包括:
确定相邻的两张所述第一图像中所述第一标注框的大小关系;
根据所述大小关系,对处于所述相邻的两张所述第一图像之间的所述第二图像上的所述第一目标区域进行放大或者缩小。
10.根据权利要求1所述的方法,其特征在于,所述分别根据每张所述第二图像上的所述第一目标区域,确定所述目标对象在每张所述第二图像上的第二标注框的步骤,包括:
分别从每个所述第一目标区域中提取目标轮廓;
确定每个所述目标轮廓的最小外接矩形框,得到每张所述第二图像上的所述第二标注框。
11.一种标注装置,其特征在于,所述标注装置包括处理器、存储器以及通信电路,所述处理器分别耦接所述存储器、所述通信电路,所述存储器中存储有程序数据,所述处理器通过执行所述存储器内的所述程序数据以实现如权利要求1-10任一项所述方法中的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序能够被处理器执行以实现如权利要求1-10任一项所述方法中的步骤。
CN202310192643.XA 2023-03-02 2023-03-02 标注方法、标注装置及计算机可读存储介质 Active CN115880338B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310192643.XA CN115880338B (zh) 2023-03-02 2023-03-02 标注方法、标注装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310192643.XA CN115880338B (zh) 2023-03-02 2023-03-02 标注方法、标注装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN115880338A CN115880338A (zh) 2023-03-31
CN115880338B true CN115880338B (zh) 2023-06-02

Family

ID=85761820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310192643.XA Active CN115880338B (zh) 2023-03-02 2023-03-02 标注方法、标注装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN115880338B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114549582A (zh) * 2021-12-27 2022-05-27 浙江大华技术股份有限公司 一种轨迹地图生成方法、装置及计算机可读存储介质
CN114821037A (zh) * 2022-04-15 2022-07-29 北京爱笔科技有限公司 评估目标检测模型的方法、获取测试集的方法和装置
CN114998999A (zh) * 2022-07-21 2022-09-02 之江实验室 一种基于多帧输入与轨迹平滑的多目标跟踪方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10192314B2 (en) * 2016-12-14 2019-01-29 Canon Kabushiki Kaisha Method, system and apparatus for determining a lowest point of a target object in an image
WO2021201774A1 (en) * 2020-03-31 2021-10-07 Agency For Science, Technology And Research Method and system for determining a trajectory of a target object
CN115482426A (zh) * 2021-06-16 2022-12-16 华为云计算技术有限公司 视频标注方法、装置、计算设备和计算机可读存储介质
CN113435355A (zh) * 2021-06-30 2021-09-24 中国农业大学 多目标奶牛身份识别方法及系统
CN114782769A (zh) * 2022-03-10 2022-07-22 阿里巴巴(中国)有限公司 训练样本的生成方法、装置、系统及目标对象的检测方法
CN115409997A (zh) * 2022-08-03 2022-11-29 浙江大华技术股份有限公司 一种数据标注方法、装置、设备及介质
CN115690263A (zh) * 2022-10-18 2023-02-03 浙江大华技术股份有限公司 一种图像标注方法、装置、设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114549582A (zh) * 2021-12-27 2022-05-27 浙江大华技术股份有限公司 一种轨迹地图生成方法、装置及计算机可读存储介质
CN114821037A (zh) * 2022-04-15 2022-07-29 北京爱笔科技有限公司 评估目标检测模型的方法、获取测试集的方法和装置
CN114998999A (zh) * 2022-07-21 2022-09-02 之江实验室 一种基于多帧输入与轨迹平滑的多目标跟踪方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Updating a dataset of labelled objects on raw video sequences with unique object IDs;Takehiro Tanaka et al;《Data in Brief》;全文 *

Also Published As

Publication number Publication date
CN115880338A (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
CN108848304B (zh) 一种全景视频的目标跟踪方法、装置和全景相机
CN109584156B (zh) 显微序列图像拼接方法及装置
US8368766B2 (en) Video stabilizing method and system using dual-camera system
JP5487298B2 (ja) 3次元画像生成
KR100793838B1 (ko) 카메라 모션 추출장치, 이를 이용한 해상장면의 증강현실 제공 시스템 및 방법
CN110111388B (zh) 三维物体位姿参数估计方法及视觉设备
CN108875730B (zh) 一种深度学习样本收集方法、装置、设备及存储介质
CN109472820B (zh) 单目rgb-d相机实时人脸重建方法及装置
US20180253861A1 (en) Information processing apparatus, method and non-transitory computer-readable storage medium
TW201216707A (en) Tracking system and method for regions of interest and computer program product thereof
US9183634B2 (en) Image processing apparatus and image processing method
CN113029128B (zh) 视觉导航方法及相关装置、移动终端、存储介质
US20210192251A1 (en) Method and system for selecting image region that facilitates blur kernel estimation
CN111144213A (zh) 一种对象检测方法和相关设备
US20170178347A1 (en) Dynamic particle filter parameterization
CN108961182B (zh) 针对视频图像的竖直方向灭点检测方法及视频扭正方法
CN115880338B (zh) 标注方法、标注装置及计算机可读存储介质
CN113034582A (zh) 位姿优化装置及方法、电子设备及计算机可读存储介质
JP2008217330A (ja) 速度推定方法および速度推定プログラム
JP2005141655A (ja) 3次元モデリング装置及び3次元モデリング方法
CN112085842A (zh) 深度值确定方法及装置、电子设备和存储介质
CN111780744B (zh) 移动机器人混合导航方法、设备及存储装置
EP2639767A1 (en) A method of interrelating shared object information in multiple images, an image processing system and a computer program product
TWI804083B (zh) 物體偵測系統
CN116051630B (zh) 高频率6DoF姿态估计方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant