CN113033426A - 动态对象标注方法、装置、设备和存储介质 - Google Patents
动态对象标注方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN113033426A CN113033426A CN202110338104.3A CN202110338104A CN113033426A CN 113033426 A CN113033426 A CN 113033426A CN 202110338104 A CN202110338104 A CN 202110338104A CN 113033426 A CN113033426 A CN 113033426A
- Authority
- CN
- China
- Prior art keywords
- labeling
- dynamic object
- information
- dimensional image
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 291
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000006243 chemical reaction Methods 0.000 claims abstract description 16
- 238000001514 detection method Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/80—Analysis of captured images to determine intrinsic or extrinsic camera parameters, i.e. camera calibration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30244—Camera pose
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
- G06T2207/30261—Obstacle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Abstract
本申请提供一种动态对象标注方法、装置、设备和存储介质,涉及图像处理技术领域。其中,一种动态对象标注方法,包括:确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列;通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息;基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。上述方法能够实现二维图像序列的每幅二维图像中动态对象的自动标注,相较于现有技术中需对每张二维图像都分别人工标注的方式,可以有效提高二维图像中动态对象的标注效率。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种动态对象标注方法、装置、设备和存储介质。
背景技术
在无人驾驶技术领域中,通常会基于无人驾驶设备采集的图像序列,采用机器学习的方式进行定位和障碍物的识别等。在机器学习的训练过程中,需要对训练样本数据所对应的图像序列中的目标物体进行标注。
其中,对于动态物体的标注,由于动态物体时刻在运动,位置和朝向一直会发生变化,因此,需要对于每张图像都完全重新标注,效率比较低。
鉴于上述问题,需要提供一种能够提高动态障碍物标注效率的方案。
发明内容
本申请实施例的目的是提供一种动态对象标注方法、装置、设备和存储介质,以至少解决如何提高二维图像中动态对象的标注效率的问题。
为解决上述技术问题,本申请实施例提供如下技术方案:
本申请第一方面提供一种动态对象标注方法,所述方法包括:
确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列;
通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息;
基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
本申请第二方面提供一种动态对象标注装置,所述装置包括:
第一标注信息确定模块,用于确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列;
第二标注信息确定模块,用于通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息;
反向标注模块,用于基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。
本申请第一方面提供的一种动态对象标注方法,通过将二维图像中的第一标注信息映射到世界坐标系中,然后再反向标注到二维图像序列中的每幅二维图像中,从而可以实现二维图像序列的每幅二维图像中动态对象的自动标注,相较于现有技术中需对每张二维图像都分别人工标注的方式,可以有效提高二维图像中动态对象的标注效率。
本申请第二方面提供的动态对象标注装置、第三方面提供的一种电子设备和第四方面提供的计算机可读存储介质,与本申请第一方面提供的动态对象标注方法出于相同的发明构思,与其具有相同的有益效果。
附图说明
通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,相同或对应的标号表示相同或对应的部分,其中:
图1示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第一种流程图;
图2示意性地示出了本申请的一些实施方式所提供的一种朝向角的示意图;
图3示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第二种流程图;
图4示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第三种流程图;
图5示意性地示出了本申请的一些实施方式所提供的一种基于凭空标注方式的动态对象标注方法的流程图;
图6示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第四种流程图;
图7示意性地示出了本申请的一些实施方式所提供的一种基于预标注方式的动态对象标注方法的流程图;
图8示意性地示出了本申请的一些实施方式所提供的一种动态对象标注装置的示意图;
图9示意性地示出了本申请的一些实施方式所提供的一种电子设备的示意图;
图10示意性地示出了本申请的一些实施方式所提供的一种计算机可读存储介质的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本申请所属领域技术人员所理解的通常意义。
下面,对本申请实施例用到的部分术语进行解释如下:
四维(4D)标注:区别于传统的二维(2D)标注,4D标注会把二维图像中标注的对象映射到真实世界坐标系中,形成对于真实世界中真实物体的标注,之后,可以将这些真实物体在世界坐标系中的标注,根据世界坐标系与各个二维图像的像素坐标系之间的对应关系反向投影到各个二维图像中,从而自动化地、批量化地对各个二维图像中的对象进行标注。这样仅需标注一次,对于包含已标注对象的其他二维图像都可以自动、快速地添加标注。
像素坐标系:图像都是由像素组成的,像素坐标是像素在图像中的位置,像素坐标系即是用来衡量像素在图像中位置的坐标系,二维图像对应的像素坐标系为二维直角坐标系,只包含x轴和y轴,其原点位于二维图像的左上角。
相机坐标系:是以相机的聚焦中心为原点,以光轴为z轴建立的三维直角坐标系,相机坐标系的原点为相机的光心,相机坐标系x轴、y轴分别与图像坐标系的x轴、y轴平行,z轴为相机光轴,它与图像平面垂直。
世界坐标系:就是客观三维世界的绝对坐标系,也称为客观坐标系,为三维直角坐标系,包含x轴、y轴和z轴。
预标注结果:使用3D检测模型对图片预测出的结果,可以作为预标注结果给予标注人员一定的参考,但是预标注结果可能不精准。
头部/尾部接地棱:车辆头/尾向地面做垂面而与地面得到的交线。
侧面接地棱:车辆侧面向地面做垂面而与地面得到的交线。
头框:从车辆头部接地棱向上作垂线,直到达到车辆的最大高度,进而形成的矩形框。
尾框:从车辆尾部接地棱向上作垂线,直到达到车辆的最大高度,进而形成的矩形框。
朝向角:参考图2,若AB为车辆的侧面,则其与相机平面形成的夹角即为朝向角。
另外,术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例提供了一种动态对象标注方法、装置、设备和存储介质,以至少解决如何提高二维图像中动态对象的标注效率的问题。下面结合附图进行示例性说明。
请参考图1,其示意性地示出了本申请的一些实施方式所提供的动态对象标注方法的第一种流程图,如图1所示,一种动态对象标注方法,可以包括以下步骤:
步骤S101:确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列。
其中,上述动态对象可以是车辆等动态障碍物,上述二维图像序列可以是视频帧序列,上述二维图像可以是视频帧,该视频帧序列可以取自车辆相机在行驶过程中拍摄的视频,相应的,本申请实施例提供的动态对象标注方法可以对视频中的车辆进行标注。
需要说明的是,本申请实施例中的动态对象并不限于车辆,也可以是其他动态障碍物,例如在海河中运动的船只、天空中飞行的飞行器等,本申请实施例不作具体限定。
步骤S102:通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息。
一般而言,传统的相机只能获取到2D图像,而无法获取到深度图像。由于2D图像缺少深度信息,计算2D图像中的障碍物在3D世界里的真实位置时,需要用到障碍物所在位置的地面方程,地面方程也可以称为平面方程,指的是空间中所有处于同一平面的点所对应的方程,其一般表达式形如Ax+By+Cz+D=0。对于地面存在坡度、地面为曲面等情况,可以采用类似微分的方式,每隔一段距离重新确定地面方程。利用上述地面方程,可以将上述障碍物在像素坐标系下的像素坐标转换成在上述相机坐标系下的相机坐标。具体可以利用相机的内参将像素坐标转换成相机坐标,相机的内参通常是与相机自身特性相关的参数,比如相机的焦距、像素大小等,由于从像素坐标转换到相机坐标缺少深度信息,将像素坐标系中的某一点转换到相机坐标系下是一条射线,所以需要地平面。将这条射线与利用上述地面方程所表征的地面的交点作为这一点对应的地平面,通过这种方式可以实现坐标转换。需要说明的是,从像素坐标转换成相机坐标的转换方法是目前广泛研究和应用的公知技术,在此不再赘述。
在确定了地面方程的情况下,通过将第一标注信息由像素坐标系转换为相机坐标系,再转换到世界坐标系,即可得到采用世界坐标系度量的第二标注信息,从而将二维图像中的动态对象转换到世界坐标系中,该第二标注信息也可以理解为对真实世界中真实物体的标注。
步骤S103:基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
在得到第二标注信息后,即可将世界坐标系表征的第二标注信息反向投射到二维图像序列中的每幅二维图像中,得到每幅二维图像中针对所述动态对象的标注信息,实现反向标注。
本申请前述至少一个实施例提供的动态对象标注方法,能够通过将二维图像中的第一标注信息映射到世界坐标系中,然后再反向标注到二维图像序列中的每幅二维图像中,从而可以实现二维图像序列的每幅二维图像中动态对象的自动标注,相较于现有技术中需对每张二维图像都分别人工标注的方式,可以有效提高二维图像中动态对象的标注效率。
本申请实施例提供的上述动态对象标注方法可以采用专用的标注工具实现,该标注工具可以是软件,也可以是基于软件实现的硬件设备,本申请实施例不做限定。利用该标注工具,标注人员即用户可以至少采用以下两种方式实现标注,根据上述步骤S101中第一标注信息的标注方式,本申请实施例将其分别命名为凭空标注和预标注,下面结合附图分别进行说明。
第一种标注方式:凭空标注。
凭空标注是指没有任何预标注结果,完全地新标注一个动态对象,由用户对二维图像进行手动标注以得到上述第一标注信息的标注方式。
在凭空标注的一些实施方式中,请参考图3进行理解,图3示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第二种流程图,上述步骤S101确定二维图像中包含的动态对象的第一标注信息,可以包括以下子步骤S1011-S1013:
步骤S1011:通过用户交互界面显示待标注的二维图像;
步骤S1012:检测用户通过所述用户交互界面输入的针对所述二维图像中动态对象的标注操作;
步骤S1013:若检测到符合预设标注规则的标注操作,则根据所述标注操作生成针对所述动态对象的第一标注信息。
通过这种方式,可以由标注人员实现最初的标注操作,即由标注人员采用人工方式在二维图像中标注出第一标注信息,这种人工标注方式可以得到较为精准的第一标注信息,在得到较为精准的第一标注信息后,自动执行后续S102、S103等步骤,由于第一标注信息精准度较高,可以确保后续第二标注信息以及反向标注得到标注信息也具备较高的精准度。
其中,上述符合预设标注规则的标注操作包括按照预设顺序的多点选择操作,例如,按照顺时针顺序依次点击二维图像中动态对象的顶点,或者按照逆时针顺序依次点击二维图像中动态对象的顶点,或者按照其他预设的顺序依次点击二维图像中动态对象的顶点,本申请实施例对其具体顺序不做限定,通过设置多点选择操作的顺序,可以确保标注操作的一致性,便于采用统一的算法针对上述标注操作生成第一标注信息,提高生成上述第一标注信息的精准度和效率。相应的,所述第一标注信息包括所述多点选择操作选择的多个标注点在像素坐标系下的第一坐标信息。
通过上述实施方式采用预设标注规则对二维图像中的动态对象进行标注操作,可以确保标注操作的一致性,便于采用统一的算法针对上述标注操作生成第一标注信息,提高生成上述第一标注信息的精准度和效率,从而可以保证更容易标注准确,减少后续对标注信息的调整。
在上述凭空标注的实施方式的基础上,在一些变更实施方式中,上述第一标注信息包括多个标注点在像素坐标系下的第一坐标信息,所述标注点是所述动态对象的外接轮廓的顶点;请继续参考图3进行理解,上述步骤S102通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息,可以包括以下子步骤S1021-S1024:
步骤S1021:根据预先确定的地面方程,确定所述多个标注点的第一坐标信息对应于世界坐标系的第二坐标信息;
步骤S1022:在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
步骤S1023:根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框;
步骤S1024:根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息。
其中,请参考图4进行理解,图4示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第三种流程图,上述步骤S1021根据预先确定的地面方程,确定所述多个标注点的第一坐标信息对应于世界坐标系的第二坐标信息的示例性步骤如下S10211、S10212所示:
S10211,将像素坐标系下的第一坐标信息通过预先确定的地面方程转换为相机坐标系下的第三坐标信息。
在本实施例中,在无法借助其它设备提供深度信息的情况下,可利用地面方程提供深度信息,就可以完成从2D像素坐标到3D像素坐标的转换,再通过相机的内参,完成像素坐标到相机坐标的转换,像素坐标到相机坐标的转换是现有技术,因此不再赘述。
S10212,将相机坐标系下的第三坐标信息通过相机的外参转换为世界坐标系下的第二坐标信息。
在本实施例中,相机的外参包括旋转矩阵和平移矩阵。旋转矩阵和平移矩阵共同描述了如何把点从世界坐标系转换到相机坐标系。
下式为世界坐标Pw转相机坐标Pc的过程,R为旋转矩阵,T为平移矩阵,R和T为事先离线标定好的相机外参。
相机坐标系转世界坐标系为上式的逆过程:
根据上述公式,即可将相机坐标系下的第三坐标信息通过相机的外参转换为世界坐标系下的第二坐标信息。
通过上述步骤S10211和S10212,即可准确地将多个标注点的第一坐标信息转换为对应于世界坐标系的第二坐标信息。
另外,由于在二维图像中一般看不到动态对象外接轮廓的全部顶点,因此,需要在世界坐标系中补足缺失点即未标注点,从而得到所述动态对象的外接轮廓的全部顶点,然后基于该全部顶点形成包围所述动态对象的三维标注框,三维标注框确定后即可得到第二标注信息,第二标注信息可以包括该三维标注框的属性信息(例如长宽高、位置、朝向角等)和标注字符(例如文字、数字、代码等)等信息。
具体的,请继续参考图4进行理解,在一些实施方式中,上述步骤S1022在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点,可以包括以下步骤S10221-S10223:
步骤S10221:根据所述动态对象的形状信息,确定所述动态对象的外接轮廓的全部顶点之间的约束关系;
步骤S10222:根据所述多个标注点的第二坐标信息和所述约束关系,确定未标注点的第二坐标信息,其中,所述未标注点是所述外接轮廓的全部顶点中除所述标注点以外的其他顶点;
步骤S10223:根据所述多个标注点的第二坐标信息和所述未标注点的第二坐标信息确定所述动态对象的外接轮廓的全部顶点。
例如,若动态对象的形状信息为长方体,那么,其外接轮廓的全部顶点之间的约束关系为,任意一个外接面上的四个顶点构成为长方形的四个顶点,沿垂直方向的两个顶点的x、y坐标相同,仅z坐标不同等,根据上述约束关系,只需要知道长方体8个顶点中3个顶点的坐标信息,即可计算出其他5个顶点的坐标信息,从而得到全部8个顶点的坐标信息。
在另一些实施方式中,若所述多个标注点的数量为2个,所述动态对象的外接轮廓为长方体,那么,上述步骤S1022在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点之前,还可以包括:
按照预先确定的地面方程,确定所述2个标注点的第一坐标信息对应于相机坐标系的第三坐标信息;
根据所述2个标注点的第三坐标信息确定所述动态对象相对于相机平面的朝向角;
上述步骤S1022在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点,可以包括:
在世界坐标系中,根据所述2个标注点的第二坐标信息、所述朝向角和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点。
其中,按照预先确定的地面方程,确定所述2个标注点的第一坐标信息对应于相机坐标系的第三坐标信息的方法,可以参照前述步骤S10211的示例性说明实施,此处不再赘述。
容易理解的是,在外接轮廓为长方体,得知2个顶点和朝向角的情况下,也可以计算出该长方体各个顶点的坐标信息,进而确定所述动态对象的外接轮廓的全部顶点,其具体过程不再赘述。
通过上述实施方式,标注人员只需要标注2个点,标注工具即可自动转换、补充得到动态对象在世界坐标系中的外接轮廓的全部顶点,可以有效减少标注人员的人工作业,提高标注效率。
在得到第二标注信息后,即可进行反向标注,在一些示例中,请参考图4进行理解,上述步骤S103基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注,可以包括步骤S1031:
步骤S1031:根据世界坐标系与所述二维图像序列中的每幅二维图像的像素坐标系的坐标转换关系,将所述第二标注信息对应的三维标注框投射到所述每幅二维图像中的所述动态对象处,并根据投射的所述三维标注框确定所述动态对象在所述每幅二维图像中的标注信息。
以上对凭空标注方式下各个步骤进行了较为细化的说明,为了便于理解,下面结合具体示例对凭空标注方式进一步说明,请参考图5,其示意性地示出了本申请的一些实施方式所提供的一种基于凭空标注方式的动态对象标注方法的流程图,如图5所示,以动态对象为车辆为例,相关的标注信息包括头部接地棱、尾部接地棱、侧面接地棱、长度、宽度、高度和朝向角中的至少一项,从标注人员的角度,需要执行以下步骤S201:
步骤S201:在二维图像中进行标注,得到多个标注点。具体的,对于需要标注的车辆,若从二维图像中只能看到该车辆的尾部/头部,则对应的预设标注规则为:先标注车辆尾部/头部左点,再标注尾部/头部右点,进而根据该左点和右点连接得到头部/尾部接地棱。若从二维图像中可以看到车辆的侧面,则对应的预设标注规则为:先标注较近侧面的头部点,再标注较近侧面的尾部点,进而根据该头部点和尾部点连接得到侧面接地棱。为了便于后续步骤说明,上述左点和右点、头部点和尾部点可以按照标注顺序分别记为A点和B点。
经过上述步骤S201,在标注人员标注出A点、B点后,标注工具可自动运行以实现第二标注信息的转换和反向标注,具体包括以下步骤S202-S204:
步骤S202:根据预先确定的地面方程,确定所述多个标注点的第一坐标信息对应于世界坐标系的第二坐标信息。
具体的,4D标注工具中预先标定有地面方程,利用该地面方程可把上述标注点(A点和B点)通过上述步骤S10211和S10212,先将其在像素坐标系下的第一坐标信息通过该地面方程转换为相机坐标系下的第三坐标信息,再将相机坐标系下的第三坐标信息通过相机的外参转换为世界坐标系下的第二坐标信息,然后存储上述标注点(A点和B点)的世界坐标(即第二坐标信息,包括x、z值,由于有地面方程,所以y是不需要存储的)。
其中,地面方程可以是预先配置的。例如,在某个道路、驾驶场景下设置图像采集装置,用于采集车辆的图像。可以预先对图像采集装置的视野范围内的地面信息进行测量,得到地面方程。
步骤S203:在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点,然后根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框,即可根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息,具体包括以下步骤S2031-S2033:
步骤S2031:对于侧面标注的情况(A点和B点分别对应头部点和尾部点的情况),根据A、B点的相机坐标系中的x、z值,可以算出车辆与相机平面的夹角,即朝向角yaw,存储该朝向角。请参考图2进行理解,该朝向角即A、B点形成的车面与相机平面的平行面的角度。对于按照头部/尾部标注的情况(A点和B点分别对应左点和右点的情况),A、B点形成的车面与相机平面的平行面的角度的互余角则是朝向角。
步骤S2032:将A、B点转换为世界坐标后,在世界坐标系中连接A、B点,然后以该A、B点为顶点在地面上做矩形,即可形成车辆的接地平面。
步骤S2033:通过世界坐标系中的A点,做一个与地面垂直的法向量,即可以得到车辆的高度,根据车辆外接轮廓(长方体)的各个顶点之间的约束关系,即可确定外接轮廓全部8个顶点的坐标信息。
步骤S204:基于所述第二标注信息为所述动态对象分配对象标识,根据所述对象标识对所述动态对象进行反向标注。具体的,由于同一车辆的长宽高是一致的,所以可以为世界坐标系中的车辆分配一个对应的id。那么,在不同的图片中,同一车辆都保持相同的长宽高,也可以减少标注员的标注工作量。
具体来说,步骤S201和S2032可以得到车长和车宽方向的法向量,步骤S2033可以得到车高方向的法向量,进而生成对应方向的、长度复用之前长宽高的三个线段,其组成的长方体则为车辆的3D框(即三维标注框),只对这个3D框调整朝向和位置(即微调)就可以完美贴合车辆。
以上阐释了凭空标注的做法,但是由于动态障碍物的数量过于多,若所有的动态障碍物都如此标注,工作量极大,所以可以利用模型的预测结果为这些动态障碍物添加预标注。
第二种标注方式:预标注。
预标注是指利用图像检测模型对二维图像进行自动检测以得到第一标注信息的标注方式。该方式首先要生成预标注结果,进而通过模型预测的预标注结果生成为标注工具可用的格式。
在预标注的一些实施方式中,请参考图6进行理解,图6示意性地示出了本申请的一些实施方式所提供的一种动态对象标注方法的第四种流程图,上述步骤S101确定二维图像中包含的动态对象的第一标注信息,可以包括步骤S1014-步骤S1015:
步骤S1014:采用目标检测算法识别二维图像中包含的动态对象;
步骤S1015:根据所述动态对象的像素尺寸信息,生成所述动态对象的初始标注框,并根据所述初始标注框生成所述动态对象的第一标注信息。
其中,上述目标检测算法可以采用现有技术提供的任意目标检测算法直接或变更实现,本申请实施例不做限定,在检测到动态对象后,即可自动确定该动态对象对应的像素尺寸信息,并自动生成初始标注框,第一标注信息即包括该初始标注框的信息。
为了提高预标注的准确性,上述像素尺寸信息可以采用以下方式获得,在上述步骤S1015根据所述动态对象的像素尺寸信息,生成所述动态对象的初始标注框之前,还包括:
步骤S1016:采用目标跟踪算法在所述二维图像序列中跟踪所述动态对象,并确定所述动态对象在所述二维图像序列中的每幅二维图像中的像素尺寸;
步骤S1017:根据所述动态对象在每幅二维图像中的像素尺寸,确定所述动态对象的像素尺寸信息。
其中,可以将所述动态对象在每幅二维图像中的像素尺寸的平均值、中位数、或者最相近的两个像素尺寸的平均值等确定为所述动态对象的像素尺寸信息,本领域技术人员可以根据实际需求灵活变更实施,此处不做限定。通过上述实施方式,可以有效提高您是像素尺寸信息的准确性,进而有助于提高预标注结果的准确性,减少后续人为调整的操作,进而提高整体标注效率。
在上述实施方式的基础上,在预标注方式的一些变更实施方式中,请继续参考图6进行理解,上述步骤S102通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息,可以包括以下步骤S1025-S1029:
步骤S1025:确定所述初始标注框中的多个可靠接地点;
步骤S1026:根据预先确定的地面方程,确定所述多个可靠接地点的第一坐标信息对应于世界坐标系的第二坐标信息;
步骤S1027:在所述世界坐标系中,根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
步骤S1028:根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框;
步骤S1029:根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息。
另外,在一些变更实施方式中,在上述步骤S1027在所述世界坐标系中,根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点之前,还可以包括:
根据所述多个可靠接地点的第二坐标信息,确定所述动态对象与拍摄所述二维图像的相机之间的距离;
若所述距离小于预设距离阈值,则触发上述步骤S1027在所述世界坐标系中,根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
若所述距离大于预设距离阈值,则根据所述动态对象的形状信息对应的默认外接轮廓,确定所述动态对象的外接轮廓的全部顶点。
通过上述实施方式,可以借助模型(即算法)的预标注结果,可靠的(小于预设距离阈值)置成可用状态,不可靠的(大于预设距离阈值)直接舍弃,之后进行人工微调,最大程度上利用了模型预测的结果来提升整体标注效率。
对于预标注结果的应用,在一些实施方式中,请继续参考图6进行理解,上述步骤S103基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注,可以包括以下步骤S1032-S1033:
步骤S1032:根据用户针对所述第二标注信息输入的调整操作,确定调整后的第二标注信息;
步骤S1033:根据所述调整后的第二标注信息,对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
为了方便与前述凭空标注方式进行对比和理解,仍以动态对象为车辆为例,在一些具体的示例中,采用预标注方式进行动态对象标注,请参考图7,其示意性地示出了本申请的一些实施方式所提供的一种基于预标注方式的动态对象标注方法的流程图,如图7所示,基于与标注方式,标注工具可自动执行以下步骤S301-S303以实现动态对象的标准:
步骤S301:预标注生成二维图像中包含的动态对象的第一标注信息,即确定二维图像中包含的动态对象的第一标注信息,具体包括以下步骤S3011-S3015:
步骤S3011:采用目标检测算法识别二维图像中包含的动态对象,例如使用3D目标检测模型,检测出车辆的头框和尾框。
步骤S3012:采用目标跟踪算法在所述二维图像序列中跟踪所述动态对象,并确定所述动态对象在所述二维图像序列中的每幅二维图像中的像素尺寸,例如使用目标跟踪(tracking)模型对车辆进行追踪,进而可以得到相同的车在不同帧图片中的长宽高。
步骤S3013:根据所述动态对象在每幅二维图像中的像素尺寸,确定所述动态对象的像素尺寸信息,并根据所述动态对象的像素尺寸信息,生成所述动态对象的初始标注框,例如取检测结果较近的两个点通过地面方程和法向量生成矩形框。
步骤S3014:根据所述多个可靠接地点的第二坐标信息,确定所述目标对象动态对象与拍摄所述二维图像的相机之间的距离;若所述距离小于预设距离阈值,则触发根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;若所述距离大于预设距离阈值,则根据所述动态对象的形状信息对应的默认外接轮廓,确定所述动态对象的外接轮廓的全部顶点。例如:对于深度(相机坐标系z方向,即动态对象与拍摄所述二维图像的相机之间的距离)在80m(预设距离阈值的示例值)内的车,使用tracking结果的此车平均长宽高赋初值。对于80m外的车,使用默认长宽高赋初值。进而生成完成的立方体。
步骤S3015:对于预标注还会有对应的tracking id,但是由于预测结果的准确性问题,会把所有的tracking id置成一个不可用的状态。
步骤S302:通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息,转换预标注到可使用的状态,具体包括以下步骤S3021-S3023:
步骤S3021:确定所述初始标注框中的多个可靠接地点:从预标注结果中得到较近框的两个接地点和较远框的一个接地,则可以得到动态障碍物的接地面。(可以得到左侧点的x,y,朝向角yaw,长宽)
步骤S3022:在所述世界坐标系中,根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点:使用世界坐标系中的较近框的左点做一个地面方程的法向量,把法向量映射回相机坐标系再映射回像素坐标系,与模型预测的输入点会有一个交点。这个交点从像素坐标系转成相机坐标系再转成世界坐标系,计算其到地面方程的距离,即是车的高,存储该车高值。
步骤S3023:对深度小于80m的车辆采用上述的长宽高,而大于80m的车辆,由于模型性能受限,上述长宽高很可能是不准确的,则可以使用默认的长宽高(对于不同类型的车有不同的长宽高)。
步骤S303:基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
其中,关于标注人员在上述过程中在标注工具中的标注操作说明如下:
1、进行标注的时候,首先找到所有二维图像中某一辆车最近的位置,把他的tracking id置成一个可用的,且曾经未使用过的状态(比如0,1,2……)。
2、之后对其进行精调。若预标注结果的长宽高基本可靠,则微调长宽高;若很离谱,则按键置成对应类别(小轿车,SUV,公交车,卡车……)的初始化长宽高。之后精调朝向,方位等,直至此帧的标注极其准确。
3、在其他帧图像,对于相同车辆,复用刚才的长宽高。之后只需要微调朝向和方位即可。
通过本申请实施例提供上述动态对象标注方法,应用于车辆的标注,至少可以取得以下有益效果:能够高效且准确的动态障碍物标注方式,大多步骤都是程序自动生成的,标注人员只需要标注较近框的左右点,后续调整长、宽、高、朝向角等都很简单直观。借助模型的预标注结果,可靠的置成可用状态,不可靠的直接舍弃,之后进行人工微调。最大程度上利用了模型预测的结果来提升效率。整体上,可以得到准确的标注结果,使用预标注的效率大大提高,不会对标注人员造成不良影响,且不需要标注员太大的工作量。对于动态障碍物,可以快速高效地得到大量标注数据。
在上述的实施例中,提供了一种动态对象标注方法,与之相对应的,本申请还提供一种动态对象标注装置。本申请实施例提供的动态对象标注装置可以实施上述动态对象标注方法,该动态对象标注装置可以通过软件、硬件或软硬结合的方式来实现。例如,该动态对象标注装置可以包括集成的或分开的功能模块或单元来执行上述各方法中的对应步骤。请参考图8,其示意性地示出了本申请的一些实施方式所提供的一种动态对象标注装置的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
如图8所示,本申请实施例提供一种动态对象标注装置10,可以包括:
第一标注信息确定模块101,用于确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列;
第二标注信息确定模块102,用于通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息;
反向标注模块103,用于基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
在本申请实施例的一些变更实施方式中,所述第一标注信息确定模块101,包括:
二维图像显示单元,用于通过用户交互界面显示待标注的二维图像;
标注操作检测单元,用于检测用户通过所述用户交互界面输入的针对所述二维图像中动态对象的标注操作;
第一标注信息生成单元,用于若检测到符合预设标注规则的标注操作,则根据所述标注操作生成针对所述动态对象的第一标注信息。
在本申请实施例的一些变更实施方式中,所述符合预设标注规则的标注操作包括按照预设顺序的多点选择操作,所述第一标注信息包括所述多点选择操作选择的多个标注点在像素坐标系下的第一坐标信息。
在本申请实施例的一些变更实施方式中,所述第一标注信息包括多个标注点在像素坐标系下的第一坐标信息,所述标注点是所述动态对象的外接轮廓的顶点;
所述第二标注信息确定模块102,包括:
第二坐标信息确定单元,用于根据预先确定的地面方程,确定所述多个标注点的第一坐标信息对应于世界坐标系的第二坐标信息;
全部顶点确定单元,用于在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
三维标注框生成单元,用于根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框;
第二标注信息确定单元,用于根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息。
在本申请实施例的一些变更实施方式中,所述全部顶点确定单元,包括:
约束关系确定子单元,用于根据所述动态对象的形状信息,确定所述动态对象的外接轮廓的全部顶点之间的约束关系;
未标注点确定子单元,用于根据所述多个标注点的第二坐标信息和所述约束关系,确定未标注点的第二坐标信息,其中,所述未标注点是所述外接轮廓的全部顶点中除所述标注点以外的其他顶点;
全部顶点补足子单元,用于根据所述多个标注点的第二坐标信息和所述未标注点的第二坐标信息确定所述动态对象的外接轮廓的全部顶点。
在本申请实施例的一些变更实施方式中,所述多个标注点的数量为2个,所述动态对象的外接轮廓为长方体;
所述第二标注信息确定模块102,还包括:
第三坐标信息确定单元,用于按照预先确定的地面方程,确定所述2个标注点的第一坐标信息对应于相机坐标系的第三坐标信息;
朝向角确定单元,用于根据所述2个标注点的第三坐标信息确定所述动态对象相对于相机平面的朝向角;
所述全部顶点确定单元,包括:
全部顶点确定子单元,用于在世界坐标系中,根据所述2个标注点的第二坐标信息、所述朝向角和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点。
在本申请实施例的一些变更实施方式中,所述反向标注模块103,包括:
第一反向标注单元,用于根据世界坐标系与所述二维图像序列中的每幅二维图像的像素坐标系的坐标转换关系,将所述第二标注信息对应的三维标注框投射到所述每幅二维图像中的所述动态对象处,并根据投射的所述三维标注框确定所述动态对象在所述每幅二维图像中的标注信息。
在本申请实施例的一些变更实施方式中,所述第一标注信息确定模块101,包括:
自动识别单元,用于采用目标检测算法识别二维图像中包含的动态对象;
初始标注框生成单元,用于根据所述动态对象的像素尺寸信息,生成所述动态对象的初始标注框,并根据所述初始标注框生成所述动态对象的第一标注信息。
在本申请实施例的一些变更实施方式中,所述第一标注信息确定模块101,还包括:
目标跟踪单元,用于采用目标跟踪算法在所述二维图像序列中跟踪所述动态对象,并确定所述动态对象在所述二维图像序列中的每幅二维图像中的像素尺寸;
像素尺寸信息确定单元,用于根据所述动态对象在每幅二维图像中的像素尺寸,确定所述动态对象的像素尺寸信息。
在本申请实施例的一些变更实施方式中,所述第二标注信息确定模块102,还包括:
可靠接地点确定单元,用于确定所述初始标注框中的多个可靠接地点;
可靠接地点第二坐标信息确定单元,用于根据预先确定的地面方程,确定所述多个可靠接地点的第一坐标信息对应于世界坐标系的第二坐标信息;
轮廓顶点确定单元,用于在所述世界坐标系中,根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
三维标注框形成单元,用于根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框;
第二标注信息生成单元,用于根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息。
在本申请实施例的一些变更实施方式中,所述第二标注信息确定模块102,还包括:
距离确定单元,用于根据所述多个可靠接地点的第二坐标信息,确定所述动态对象与拍摄所述二维图像的相机之间的距离;
距离小于阈值处理单元,用于若所述距离小于预设距离阈值,则触发所述轮廓顶点确定单元;
距离大于阈值处理单元,用于若所述距离大于预设距离阈值,则根据所述动态对象的形状信息对应的默认外接轮廓,确定所述动态对象的外接轮廓的全部顶点。
在本申请实施例的一些变更实施方式中,所述反向标注模块103,包括:
用户调整单元,用于根据用户针对所述第二标注信息输入的调整操作,确定调整后的第二标注信息;
第二反向标注单元,用于根据所述调整后的第二标注信息,对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
本申请实施例提供的动态对象标注装置10,与本申请前述实施例提供的动态对象标注方法出于相同的发明构思,具有相同的有益效果,此处不再赘述。
本申请实施方式还提供一种与前述实施方式所提供的动态对象标注方法对应的电子设备,以执行上述动态对象标注方法。
请参考图9,其示意性地示出了本申请的一些实施方式所提供的一种电子设备的示意图。如图9所示,所述电子设备20包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本申请前述任一实施方式所提供的动态对象标注方法。
其中,存储器201可能包含高速随机存取存储器(Random Access Memory,RAM),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
总线202可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本申请实施例任一实施方式揭示的所述动态对象标注方法可以应用于处理器200中,或者由处理器200实现。
处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器200可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
本申请实施例提供的电子设备与本申请前述实施例提供的动态对象标注方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
本申请实施方式还提供一种与前述实施方式所提供的动态对象标注方法对应的计算机可读介质,请参考图10,其示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的动态对象标注方法。
需要说明的是,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
本申请的上述实施例提供的计算机可读存储介质与本申请前述实施例提供的动态对象标注方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
需要说明的是,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM,)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,其均应涵盖在本申请的权利要求和说明书的范围当中。
Claims (15)
1.一种动态对象标注方法,其特征在于,包括:
确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列;
通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息;
基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
2.根据权利要求1所述的方法,其特征在于,所述第一标注信息包括多个标注点在像素坐标系下的第一坐标信息,所述标注点是所述动态对象的外接轮廓的顶点;
所述通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息,包括:
根据预先确定的地面方程,确定所述多个标注点的第一坐标信息对应于世界坐标系的第二坐标信息;
在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框;
根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点,包括:
根据所述动态对象的形状信息,确定所述动态对象的外接轮廓的全部顶点之间的约束关系;
根据所述多个标注点的第二坐标信息和所述约束关系,确定未标注点的第二坐标信息,其中,所述未标注点是所述外接轮廓的全部顶点中除所述标注点以外的其他顶点;
根据所述多个标注点的第二坐标信息和所述未标注点的第二坐标信息确定所述动态对象的外接轮廓的全部顶点。
4.根据权利要求2所述的方法,其特征在于,所述多个标注点的数量为2个,所述动态对象的外接轮廓为长方体;
所述在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点之前,还包括:
按照预先确定的地面方程,确定所述2个标注点的第一坐标信息对应于相机坐标系的第三坐标信息;
根据所述2个标注点的第三坐标信息确定所述动态对象相对于相机平面的朝向角;
所述在世界坐标系中,根据所述多个标注点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点,包括:
在世界坐标系中,根据所述2个标注点的第二坐标信息、所述朝向角和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点。
5.根据权利要求1所述的方法,其特征在于,所述确定二维图像中包含的动态对象的第一标注信息,包括:
通过用户交互界面显示待标注的二维图像;
检测用户通过所述用户交互界面输入的针对所述二维图像中动态对象的标注操作;
若检测到符合预设标注规则的标注操作,则根据所述标注操作生成针对所述动态对象的第一标注信息。
6.根据权利要求5所述的方法,其特征在于,所述符合预设标注规则的标注操作包括按照预设顺序的多点选择操作,所述第一标注信息包括所述多点选择操作选择的多个标注点在像素坐标系下的第一坐标信息。
7.根据权利要求1所述的方法,其特征在于,所述确定二维图像中包含的动态对象的第一标注信息,包括:
采用目标检测算法识别二维图像中包含的动态对象;
根据所述动态对象的像素尺寸信息,生成所述动态对象的初始标注框,并根据所述初始标注框生成所述动态对象的第一标注信息。
8.根据权利要求7所述的方法,其特征在于,在所述根据所述动态对象的像素尺寸信息,生成所述动态对象的初始标注框之前,还包括:
采用目标跟踪算法在所述二维图像序列中跟踪所述动态对象,并确定所述动态对象在所述二维图像序列中的每幅二维图像中的像素尺寸;
根据所述动态对象在每幅二维图像中的像素尺寸,确定所述动态对象的像素尺寸信息。
9.根据权利要求7所述的方法,其特征在于,所述通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息,包括:
确定所述初始标注框中的多个可靠接地点;
根据预先确定的地面方程,确定所述多个可靠接地点的第一坐标信息对应于世界坐标系的第二坐标信息;
在所述世界坐标系中,根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
根据所述外接轮廓的全部顶点形成包围所述动态对象的三维标注框;
根据所述三维标注框生成所述动态对象在所述世界坐标系的第二标注信息。
10.根据权利要求9所述的方法,其特征在于,在所述根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点之前,还包括:
根据所述多个可靠接地点的第二坐标信息,确定所述动态对象与拍摄所述二维图像的相机之间的距离;
若所述距离小于预设距离阈值,则触发根据所述多个可靠接地点的第二坐标信息和所述动态对象的形状信息确定所述动态对象的外接轮廓的全部顶点;
若所述距离大于预设距离阈值,则根据所述动态对象的形状信息对应的默认外接轮廓,确定所述动态对象的外接轮廓的全部顶点。
11.根据权利要求1所述的方法,其特征在于,所述基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注,包括:
根据世界坐标系与所述二维图像序列中的每幅二维图像的像素坐标系的坐标转换关系,将所述第二标注信息对应的三维标注框投射到所述每幅二维图像中的所述动态对象处,并根据投射的所述三维标注框确定所述动态对象在所述每幅二维图像中的标注信息。
12.根据权利要求1所述的方法,其特征在于,所述基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注,包括:
根据用户针对所述第二标注信息输入的调整操作,确定调整后的第二标注信息;
根据所述调整后的第二标注信息,对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
13.一种动态对象标注装置,其特征在于,包括:
第一标注信息确定模块,用于确定二维图像中包含的动态对象的第一标注信息,所述第一标注信息采用所述二维图像对应的像素坐标系表征,所述二维图像取自二维图像序列;
第二标注信息确定模块,用于通过坐标系转换,确定所述第一标注信息对应于世界坐标系的第二标注信息;
反向标注模块,用于基于所述第二标注信息对所述二维图像序列中的每幅二维图像中的所述动态对象进行反向标注。
14.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器运行所述计算机程序时执行以实现如权利要求1至12任一项所述的方法。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现如权利要求1至12任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110338104.3A CN113033426B (zh) | 2021-03-30 | 2021-03-30 | 动态对象标注方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110338104.3A CN113033426B (zh) | 2021-03-30 | 2021-03-30 | 动态对象标注方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113033426A true CN113033426A (zh) | 2021-06-25 |
CN113033426B CN113033426B (zh) | 2024-03-01 |
Family
ID=76452814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110338104.3A Active CN113033426B (zh) | 2021-03-30 | 2021-03-30 | 动态对象标注方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033426B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113436262A (zh) * | 2021-07-08 | 2021-09-24 | 北京理工大学 | 一种基于视觉的车辆目标位置和姿态角度的检测方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102011108367A1 (de) * | 2011-07-22 | 2013-01-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zur Videobildvermassung |
US9589388B1 (en) * | 2013-07-10 | 2017-03-07 | Thinci, Inc. | Mechanism for minimal computation and power consumption for rendering synthetic 3D images, containing pixel overdraw and dynamically generated intermediate images |
CN107484428A (zh) * | 2015-03-25 | 2017-12-15 | “实验室24”股份有限公司 | 用于显示对象的方法 |
JP2018195309A (ja) * | 2017-05-17 | 2018-12-06 | 富士通株式会社 | 顔認識のための画像処理装置の訓練方法及び訓練装置 |
CN109584295A (zh) * | 2017-09-29 | 2019-04-05 | 阿里巴巴集团控股有限公司 | 对图像内目标物体进行自动标注的方法、装置及系统 |
JP2019133214A (ja) * | 2018-01-29 | 2019-08-08 | 電駆ビジョン株式会社 | 画像表示装置、該装置を含む映像表示システム、画像表示方法および画像表示用プログラム |
CN110210328A (zh) * | 2019-05-13 | 2019-09-06 | 北京三快在线科技有限公司 | 在图像序列中标注物体的方法、装置及电子设备 |
US20190289273A1 (en) * | 2018-03-13 | 2019-09-19 | Toyota Research Institute, Inc. | Systems and methods for reducing data storage in machine learning |
CN110390258A (zh) * | 2019-06-05 | 2019-10-29 | 东南大学 | 图像目标三维信息标注方法 |
CN110874865A (zh) * | 2019-11-14 | 2020-03-10 | 腾讯科技(深圳)有限公司 | 三维骨架生成方法和计算机设备 |
CN111127422A (zh) * | 2019-12-19 | 2020-05-08 | 北京旷视科技有限公司 | 图像标注方法、装置、系统及主机 |
CN111461994A (zh) * | 2020-03-30 | 2020-07-28 | 苏州科达科技股份有限公司 | 一种坐标转换矩阵的获取及监控画面中目标定位方法 |
CN112184914A (zh) * | 2020-10-27 | 2021-01-05 | 北京百度网讯科技有限公司 | 目标对象三维位置的确定方法、装置和路侧设备 |
-
2021
- 2021-03-30 CN CN202110338104.3A patent/CN113033426B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102011108367A1 (de) * | 2011-07-22 | 2013-01-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zur Videobildvermassung |
US9589388B1 (en) * | 2013-07-10 | 2017-03-07 | Thinci, Inc. | Mechanism for minimal computation and power consumption for rendering synthetic 3D images, containing pixel overdraw and dynamically generated intermediate images |
CN107484428A (zh) * | 2015-03-25 | 2017-12-15 | “实验室24”股份有限公司 | 用于显示对象的方法 |
JP2018195309A (ja) * | 2017-05-17 | 2018-12-06 | 富士通株式会社 | 顔認識のための画像処理装置の訓練方法及び訓練装置 |
CN109584295A (zh) * | 2017-09-29 | 2019-04-05 | 阿里巴巴集团控股有限公司 | 对图像内目标物体进行自动标注的方法、装置及系统 |
JP2019133214A (ja) * | 2018-01-29 | 2019-08-08 | 電駆ビジョン株式会社 | 画像表示装置、該装置を含む映像表示システム、画像表示方法および画像表示用プログラム |
US20190289273A1 (en) * | 2018-03-13 | 2019-09-19 | Toyota Research Institute, Inc. | Systems and methods for reducing data storage in machine learning |
CN110210328A (zh) * | 2019-05-13 | 2019-09-06 | 北京三快在线科技有限公司 | 在图像序列中标注物体的方法、装置及电子设备 |
WO2020228296A1 (zh) * | 2019-05-13 | 2020-11-19 | 北京三快在线科技有限公司 | 在图像序列中标注物体 |
CN110390258A (zh) * | 2019-06-05 | 2019-10-29 | 东南大学 | 图像目标三维信息标注方法 |
CN110874865A (zh) * | 2019-11-14 | 2020-03-10 | 腾讯科技(深圳)有限公司 | 三维骨架生成方法和计算机设备 |
CN111127422A (zh) * | 2019-12-19 | 2020-05-08 | 北京旷视科技有限公司 | 图像标注方法、装置、系统及主机 |
CN111461994A (zh) * | 2020-03-30 | 2020-07-28 | 苏州科达科技股份有限公司 | 一种坐标转换矩阵的获取及监控画面中目标定位方法 |
CN112184914A (zh) * | 2020-10-27 | 2021-01-05 | 北京百度网讯科技有限公司 | 目标对象三维位置的确定方法、装置和路侧设备 |
Non-Patent Citations (6)
Title |
---|
BAPST, B 等: "Post-contrast 3D T1-weighted TSE MR sequences (SPACE, CUBE, VISTA/BRAINVIEW, isoFSE, 3D MVOX): Technical aspects and clinical applications", 《JOURNAL OF NEURORADIOLOGY》, vol. 47, no. 5, 1 September 2020 (2020-09-01), pages 360 - 370 * |
YUAN HUI JUAN 等: "Study on 3D measurement and merge technology based on color stripes permutation encoding", 《 PROCEEDINGS OF 2011 6TH INTERNATIONAL FORUM ON STRATEGIC TECHNOLOGY》, 31 August 2011 (2011-08-31), pages 1082 - 1085 * |
余章蓉 等: "基于Auto CAD平台的图件动态坐标标注系统设计与实现", 《城市勘测》, no. 04, 31 August 2019 (2019-08-31), pages 37 - 40 * |
孙士杰;宋焕生;张朝阳;张文涛;王璇;: "点云下地平面检测的RGB-D相机外参自动标定", 中国图象图形学报, no. 06, 16 June 2018 (2018-06-16), pages 866 - 873 * |
李大成 等: "基于增强现实摄像机虚拟标签的设计与管理", 《现代计算机(专业版)》, no. 25, 30 September 2018 (2018-09-30), pages 89 - 92 * |
袁杲;叶峰;杨玲;谢明元;: "基于VTK的医学图像交互式三维测量技术研究", 计算机工程与设计, no. 13, 16 July 2008 (2008-07-16), pages 3549 - 3551 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113436262A (zh) * | 2021-07-08 | 2021-09-24 | 北京理工大学 | 一种基于视觉的车辆目标位置和姿态角度的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113033426B (zh) | 2024-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109242903B (zh) | 三维数据的生成方法、装置、设备及存储介质 | |
CN111783820B (zh) | 图像标注方法和装置 | |
US11842438B2 (en) | Method and terminal device for determining occluded area of virtual object | |
US10964049B2 (en) | Method and device for determining pose of camera | |
EP3620966A1 (en) | Object detection method and apparatus for object detection | |
US9892516B2 (en) | Three-dimensional coordinate computing apparatus, three-dimensional coordinate computing method, and non-transitory computer readable recording medium having therein program for three-dimensional coordinate computing | |
US10580148B2 (en) | Graphical coordinate system transform for video frames | |
JP6417702B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
US10726580B2 (en) | Method and device for calibration | |
US10769811B2 (en) | Space coordinate converting server and method thereof | |
JP2007256029A (ja) | ステレオ画像処理装置 | |
CN104156998A (zh) | 一种基于图片虚拟内容融合真实场景的实现方法及系统 | |
CN111161398B (zh) | 一种图像生成方法、装置、设备及存储介质 | |
CN112258574A (zh) | 标注位姿信息的方法、装置及计算机可读存储介质 | |
CN109934873B (zh) | 标注图像获取方法、装置及设备 | |
CN113160349A (zh) | 点云标注方法、装置、存储介质及电子设备 | |
CN110348351B (zh) | 一种图像语义分割的方法、终端和可读存储介质 | |
CN110310325B (zh) | 一种虚拟测量方法、电子设备及计算机可读存储介质 | |
CN113033426A (zh) | 动态对象标注方法、装置、设备和存储介质 | |
CN113763478A (zh) | 无人车相机标定方法、装置、设备、存储介质及系统 | |
TWI658431B (zh) | 影像處理方法、影像處理裝置及電腦可讀取記錄媒體 | |
KR20200057929A (ko) | 캘리브레이트된 카메라들에 의해 캡쳐된 스테레오 영상들의 렉티피케이션 방법과 컴퓨터 프로그램 | |
CN112634439A (zh) | 一种3d信息展示方法及装置 | |
CN112652056A (zh) | 一种3d信息展示方法及装置 | |
WO2022016368A1 (zh) | 3d框标注方法、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |