CN113051986A - 基于2d图像标记信息的3d图像标记方法及3d图像标记装置 - Google Patents

基于2d图像标记信息的3d图像标记方法及3d图像标记装置 Download PDF

Info

Publication number
CN113051986A
CN113051986A CN202010101417.2A CN202010101417A CN113051986A CN 113051986 A CN113051986 A CN 113051986A CN 202010101417 A CN202010101417 A CN 202010101417A CN 113051986 A CN113051986 A CN 113051986A
Authority
CN
China
Prior art keywords
image
module
point
marked
generate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010101417.2A
Other languages
English (en)
Inventor
杨宗贤
许博钧
郑致灏
黄柏胜
詹智翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/728,358 external-priority patent/US11100702B2/en
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Publication of CN113051986A publication Critical patent/CN113051986A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/06Topological mapping of higher dimensional structures onto lower dimensional surfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/08Projecting images onto non-planar surfaces, e.g. geodetic screens

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种三维(3D)图像标记装置及标记法。3D图像标记装置包括点云分群模块、投影模块、整合模块及点云还原模块。点云分群模块用以根据3D未标记图像及分群算法将3D未标记图像的多个点进行分群,以产生具有一个或多个第一点群的3D分群图像。投影模块用以根据3D分群图像产生具有一个或多个第一对象的第一二维(2D)图像,其中每个第一点群对应于第一对象的其中之一。整合模块用以根据一个或多个2D已标记图像的一个或多个对象框标记第一2D图像的第一对象,以产生第二2D图像。点云还原模块用以根据第二2D图像产生3D已标记图像。

Description

基于2D图像标记信息的3D图像标记方法及3D图像标记装置
技术领域
本发明是有关于一种基于2D图像标记信息的3D图像标记方法及3D图像标记装置。
背景技术
随着自动驾驶车辆产业的蓬勃发展,对于3D图像的标记技术受到重视。现有技术中,针对三维(3D)图像的标记普遍仍停留在手动标记的阶段,难以半自动化。然而,相较于二维(2D)图像而言,3D图像的人为手动标记的成本远高于2D图像。因此,如何以低成本进行3D图像的标记是业界努力的目标之一。
发明内容
本发明的一方面公开一种三维(3D)图像标记装置。3D图像标记装置包括点云分群模块、投影模块、整合模块及点云还原模块。点云分群模块用以根据3D未标记图像及分群算法将3D未标记图像的多个点进行分群,以产生具有一个或多个第一点群的3D分群图像。投影模块用以根据3D分群图像产生具有一个或多个第一对象的第一二维(2D)图像,其中每个第一点群对应于第一对象的其中之一。整合模块用以根据一个或多个2D已标记图像的一个或多个对象框标记第一2D图像的第一对象,以产生第二2D图像。点云还原模块用以根据第二2D图像产生3D已标记图像。
本发明的另一方面公开一种三维(3D)图像标记方法。3D图像标记方法由处理器执行时,致使处理器:执行点云分群模块,以根据3D未标记图像及分群算法将该3D未标记图像的多个点进行分群,以产生具有一个或多个第一点群的3D分群图像;执行投影模块,以根据3D分群图像产生具有一个或多个第一对象的第一二维(2D)图像,其中每个第一点群对应于第一对象的其中之一;执行整合模块,以根据一个或多个2D已标记图像的一个或多个对象框标记第一2D图像的第一对象,以产生第二2D图像;以及执行点云还原模块,以根据第二2D图像产生3D已标记图像。
为了对本发明的上述及其他方面有更佳的了解,下文特举实施例,并配合附图详细说明如下:
附图说明
图1示出根据本发明一实施例的基于2D图像标记信息的3D图像标记装置的方块图。
图2示出根据本发明一实施例的基于2D图像标记信息的3D图像标记方法的流程图。
具体实施方式
为了叙述的简洁,在本文的描述中,“三维”将会被简称为“3D”,而“二维”将会被简称为“2D”。
现有技术中,3D图像通过投影转换成的2D图像无法直接使用现有的标记软件或人工智能来进行自动化或半自动化标记。另一方面,3D图像中两个对象的前后关系会因转换至2D图像而遗失(例如前方对象覆盖到后方对象)。若将一张以原始2D图像进行标记的2D图像的对象框直接套用来标记3D图像所转换的2D图像,之后再将其转换回3D图像会造成前方对象与后方对象所对应到的点云无法分辨而标记混乱。本发明提出的3D图像标记装置及标记方法可解决上述问题。
请参照图1,图1示出根据本发明一实施例的基于2D图像标记信息的3D图像标记装置的方块图。3D图像标记装置10包括点云分群模块102、投影模块104、整合模块106及点云还原模块108。
在一实施例中,点云分群模块102、投影模块104、整合模块106及点云还原模块108可藉由计算器可读指令的组合实现,并储存于3D图像标记装置10的非暂时性存储器(未示出)中。当用以实现点云分群模块102、投影模块104、整合模块106及点云还原模块108的计算器指令的组合由处理单元(未示出)执行时,可致使处理单元执行用以实现点云分群模块102、投影模块104、整合模块106及点云还原模块108的功能的操作。
点云分群模块102用以接收3D未标记图像3D-IMG-unlab,并根据分群算法将3D未标记图像3D-IMG-unlab的多个点分群为一个或多个第一点群,以产生3D分群图像3D-IMG-clus。
投影模块104用以将3D分群图像3D-IMG-clus中的第一点群投影至二维平面,以产生第一2D图像2D-IMG1。
整合模块106用以接收第一2D图像2D-IMG1及一个或多个2D已标记图像2D-IMG-lab,并根据第一2D图像2D-IMG1及2D已标记图像2D-IMG-lab产生第二2D图像2D-IMG2。
点云还原模块108用以根据第二2D图像2D-IMG2产生3D已标记图像3D-IMG-lab。
为了更清楚理解本发明,以下请参照图2示出的根据本发明一实施例的3D图像标记方法的流程图。3D图像标记方法可应用于3D图像标记装置10,并由处理单元执行。
S201中,执行点云分群模块,接收3D未标记图像,并根据分群算法将3D未标记图像3D-IMG-unlab的多个点分群为一个或多个第一点群,以产生3D分群图像3D-IMG-clus。在一实施例中,3D未标记图像3D-IMG-unlab可以来自3D原始图像数据库。在另一实施例中,3D未标记图像3D-IMG-unlab可以来自一个或多个3D摄影机,例如光达(LiDAR)或雷达等。当3D未标记图像3D-IMG-unlab来自多个3D摄影机时,这些3D摄影机拍摄的多个3D原始图像在经过时间及空间对齐之后产生对应于特定时间及特定空间的3D未标记图像3D-IMG-unlab,并将3D未标记图像3D-IMG-unlab提供给点云分群模块102。在一实施例中,每一个点可包括空间信息(例如三维坐标)。在另一个实施例中,每一个点可包括空间信息及色彩信息(例如RGB值)。在一实施例中,分群算法可采用本领域常用的算法,例如是基于点与点之间的距离的分群算法。在另一实施例中,分群算法是基于点的密度的分群算法。藉由基于点的密度的分群算法可以将一个聚集在一起的多个点中属于前方对象(距离摄影机较近的对象)的点与属于后方对象(距离摄影机较远的对象)的点有效地分开并分配到不同的第一点群。每个第一点群可包括一个或多个点。在一实施例中,每个第一点群可代表一个对象。在另一实施例中,每个第一点群可代表一个实际对象的多个碎片(piece)的其中之一,例如三个第一点群可分别代表一个人(实际对象)的头、上半身及下半身(三个碎片),当三个第一点群组合在一起时可代表为一个“人”的实际对象。
S203中,执行投影模块,将3D分群图像3D-IMG-clus中的第一点群投影至二维平面,以产生第一2D图像2D-IMG1。在一实施例中,投影模块104可使用近点球面投影法来产生第一2D图像2D-IMG1。在另一实施例中,投影模块104可使用本领域中常用的投影方法来产生第一2D图像2D-IMG1。第一2D图像2D-IMG1包括由3D分群图像3D-IMG-clus中的第一点群投影所形成的一个或多个第一对象。也就是说,经过投影模块所产生的第一2D图像2D-IMG1是具有3D信息的2D图像。
S205中,执行整合模块,根据第一2D图像2D-IMG1及一个或多个2D已标记图像2D-IMG-lab产生第二2D图像2D-IMG2。2D已标记图像2D-IMG-lab与3D未标记图像3D-IMG-unlab是对应于相同的特定时间及特定空间。在一实施例中,2D已标记图像2D-IMG-lab是来自2D已标记图像数据库。在另一实施例中,2D已标记图像2D-IMG-lab是来自一个或多个2D摄影机。当2D已标记图像2D-IMG-lab来自多个2D摄影机时,2D摄影机例如以不同角度(例如30度、60度及120度)拍摄的2D图像经过校正及标记后产生2D已标记图像2D-IMG-lab,并提供给整合模块106。每个2D已标记图像2D-IMG-lab可包括一个或多个对象框。每个对象框具有对象类别,例如“人”、“汽车”或“机车”等。整合模块106会根据2D已标记图像2D-IMG-lab的对象框来标记第一2D图像2D-IMG1以产生第二2D图像2D-IMG2。在一实施例中,对于第一2D图像2D-IMG1中的每一个第一对象,整合模块106会判断该第一对象是否落于已标记图像2D-IMG-lab的其中一个对象框对应到的范围。若是,以对应的对象框的对象类别标记该第一对象;若否,则不标记。藉由上述方式可以为第一2D图像2D-IMG1中对应到已标记图像2D-IMG-lab的对象框的每一个第一对象决定一个对象类别。也就是说,在第二2D图像2D-IMG2中,对应到已标记图像2D-IMG-lab的对象框的每一个第一对象会具有与对应的已标记图像2D-IMG-lab的对象框相同的对象类别,而未对应到已标记图像2D-IMG-lab的对象框的第一对象则保持不具有对象类别的状态。
S207中,执行点云还原模块,根据第二2D图像2D-IMG2产生3D已标记图像3D-IMG-lab。在一实施例中,对于第二2D图像2D-IMG2中的每一个第一对象,点云还原模块108可根据该第一对象的对象类别(如果存在)来标记对应于该第一对象的3D分群图像3D-IMG-clus的第一点群中所包含的所有点,以产生3D已标记图像3D-IMG-lab。
在一实施例中,于步骤S205与S207之间,还可包括手动辅助标记的步骤。藉由手动辅助标记的步骤可对第一2D图像2D-IMG1中未对应到已标记图像2D-IMG-lab的对象框的第一对象进行标记,来降低第二2D图像2D-IMG中未标记的第一对象的数量。
本发明提出的3D图像标记装置及3D图像标记方法,可以在将3D未标记图像通过投影转换为第一2D图像之前,藉由点云分群模块将3D未标记图像中的点进行分群,以产生3D分群图像,3D分群图像中每一个第一点群对应到第一2D图像中的一个第一对象,藉由第一点群与第一对象之间的对应关系保留住第一点群之间的位置关系。接着以2D已标记图像的对象框来对第一2D图像的第一对象进行标记以产生第二2D图像。此第二2D图像中的第一对象因经过标记而具有对象类别。之后再将第二2D图像中的第一对象的对象类别套用到3D分群图像中对应的第一点群中的所有点。如此一来,所产生的已标记3D图像就不会受到3D点因经过投影后对象前后关系遗失的影响。
在一个实际应用中,本发明提出的3D图像标记装置及3D图像标记方法可以用来根据2D已标记图像数据库及3D未标记图像数据库建立一个3D已标记图像数据库。在另一个实际应用中,本发明提出的3D图像标记装置及3D图像标记方法可以配置于自动驾驶车辆上,并根据经过实时标记的2D摄影机提供的2D图像来实时标记3D摄影机提供的3D图像。
综上所述,虽然本发明已以实施例公开如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视后附的权利要求书所界定者为准。
【符号说明】
10:3D图像标记装置
102:点云分群模块
104:投影模块
106:整合模块
108:点云还原模块
3D-IMG-unlab:3D未标记图像
3D-IMG-clus:3D分群图像
3D-IMG-lab:3D已标记图像
2D-IMG-lab:2D已标记图像
2D-IMG1:第一2D图像
2D-IMG2:第二2D图像
S201~S207:步骤

Claims (10)

1.一种三维(3D)图像标记装置,包括:
点云分群模块,用以根据3D未标记图像及分群算法将该3D未标记图像的多个点进行分群,以产生具有一个或多个第一点群的3D分群图像;
投影模块,用以根据该3D分群图像产生具有一个或多个第一对象的第一二维(2D)图像,其中每个第一点群对应于该一个或多个第一对象的其中之一;
整合模块,用以根据一个或多个2D已标记图像的一个或多个对象框标记该第一2D图像的该一个或多个第一对象,以产生第二2D图像;以及
点云还原模块,用以根据该第二2D图像产生3D已标记图像。
2.如权利要求1所述的3D图像标记装置,其中该分群算法是基于3D图像的点密度的分群算法。
3.如权利要求1所述的3D图像标记装置,其中对于该第一2D图像中的每个第一对象,该整合模块判断该第一对象是否落于该一个或多个已标记图像的该一个或多个对象框的其中之一对应到的范围,若是,以对应的该对象框的该类别标记该第一对象,若否,则不标记该第一对象,藉以产生该第二2D图像。
4.如权利要求3所述的3D图像标记装置,其中对于该第二2D图像中具有该对象类别的每个第一对象,该点云还原模块根据该第一对象的该对象类别标记该3D分群图像中对应于该第一对象的该第一点群中所包含的所有点。
5.如权利要求1所述的3D图像标记装置,其中每个第一点群对应于实际对象的碎片。
6.一种三维(3D)图像标记方法,由处理器执行时,致使该处理器:
执行点云分群模块,以根据3D未标记图像及分群算法将该3D未标记图像的多个点进行分群,以产生具有一个或多个第一点群的3D分群图像;
执行投影模块,以根据该3D分群图像产生具有一个或多个第一对象的第一二维(2D)图像,其中每个第一点群对应于该一个或多个第一对象的其中之一;
执行整合模块,以根据一个或多个2D已标记图像的一个或多个对象框标记该第一2D图像的该一个或多个第一对象,以产生第二2D图像;以及
执行点云还原模块,以根据该第二2D图像产生3D已标记图像。
7.如权利要求6所述的3D图像标记方法,其中该分群算法是基于3D图像的点密度的分群算法。
8.如权利要求1所述的3D图像标记方法,其中对于该第一2D图像中的每个第一对象,该整合模块判断该第一对象是否落于该一个或多个已标记图像的该一个或多个对象框的其中之一对应到的范围,若是,以对应的该对象框的该类别标记该第一对象,若否,则不标记该第一对象,藉以产生该第二2D图像。
9.如权利要求8所述的3D图像标记方法,其中对于该第二2D图像中具有该对象类别的每个第一对象,该点云还原模块根据该第一对象的该对象类别标记该3D分群图像中对应于该第一对象的该第一点群中所包含的所有点。
10.如权利要求6所述的3D图像标记方法,其中每个第一点群对应于实际对象的碎片。
CN202010101417.2A 2019-12-27 2020-02-19 基于2d图像标记信息的3d图像标记方法及3d图像标记装置 Pending CN113051986A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US16/728,358 2019-12-27
US16/728,358 US11100702B2 (en) 2019-12-27 2019-12-27 3D image labeling method based on labeling information of 2D image and 3D image labeling device
TW109100525A TWI739268B (zh) 2019-12-27 2020-01-08 基於2d影像標記資訊的3d影像標記方法及3d影像標記裝置
TW109100525 2020-01-08

Publications (1)

Publication Number Publication Date
CN113051986A true CN113051986A (zh) 2021-06-29

Family

ID=76507519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010101417.2A Pending CN113051986A (zh) 2019-12-27 2020-02-19 基于2d图像标记信息的3d图像标记方法及3d图像标记装置

Country Status (1)

Country Link
CN (1) CN113051986A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135417A (zh) * 2010-12-26 2011-07-27 北京航空航天大学 一种全自动三维特征提取方法
US20130051658A1 (en) * 2011-08-22 2013-02-28 Samsung Electronics Co., Ltd. Method of separating object in three dimension point cloud
CN106709481A (zh) * 2017-03-03 2017-05-24 深圳市唯特视科技有限公司 一种基于二维‑三维语义数据集的室内场景理解方法
CN106776996A (zh) * 2016-12-02 2017-05-31 百度在线网络技术(北京)有限公司 用于测试高精度地图的准确性的方法和装置
CN108876906A (zh) * 2018-06-06 2018-11-23 链家网(北京)科技有限公司 基于点云的全局平面优化建立虚拟三维模型的方法及装置
CN109034077A (zh) * 2018-08-01 2018-12-18 湖南拓视觉信息技术有限公司 一种基于多尺度特征学习的三维点云标记方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135417A (zh) * 2010-12-26 2011-07-27 北京航空航天大学 一种全自动三维特征提取方法
US20130051658A1 (en) * 2011-08-22 2013-02-28 Samsung Electronics Co., Ltd. Method of separating object in three dimension point cloud
CN106776996A (zh) * 2016-12-02 2017-05-31 百度在线网络技术(北京)有限公司 用于测试高精度地图的准确性的方法和装置
CN106709481A (zh) * 2017-03-03 2017-05-24 深圳市唯特视科技有限公司 一种基于二维‑三维语义数据集的室内场景理解方法
CN108876906A (zh) * 2018-06-06 2018-11-23 链家网(北京)科技有限公司 基于点云的全局平面优化建立虚拟三维模型的方法及装置
CN109034077A (zh) * 2018-08-01 2018-12-18 湖南拓视觉信息技术有限公司 一种基于多尺度特征学习的三维点云标记方法和装置

Similar Documents

Publication Publication Date Title
Bruls et al. The right (angled) perspective: Improving the understanding of road scenes using boosted inverse perspective mapping
Mohd Ali et al. Performance comparison between RGB and HSV color segmentations for road signs detection
US11830103B2 (en) Method, apparatus, and computer program product for training a signature encoding module and a query processing module using augmented data
WO2023185069A1 (zh) 物体检测方法及装置、计算机可读存储介质及无人车
US20220139094A1 (en) Image processing device, image processing method, and recording medium
CN114413881B (zh) 高精矢量地图的构建方法、装置及存储介质
CN114724120B (zh) 基于雷视语义分割自适应融合的车辆目标检测方法及系统
CN112651881B (zh) 图像合成方法、装置、设备、存储介质以及程序产品
TW201937405A (zh) 物件標示系統及方法
US20210209385A1 (en) Method and apparatus for recognizing wearing state of safety belt
WO2020237516A1 (zh) 点云的处理方法、设备和计算机可读存储介质
CN112052855A (zh) 一种基于深度学习的车牌识别方法及装置
CN113111751A (zh) 一种自适应融合可见光与点云数据的三维目标检测方法
CN112258610A (zh) 图像标注方法、装置、存储介质及电子设备
CN115861733A (zh) 点云数据标注方法、模型训练方法、电子设备及存储介质
TWI739268B (zh) 基於2d影像標記資訊的3d影像標記方法及3d影像標記裝置
US10832469B2 (en) Optimizing images for three-dimensional model construction
CN113051986A (zh) 基于2d图像标记信息的3d图像标记方法及3d图像标记装置
CN114648639B (zh) 一种目标车辆的检测方法、系统及装置
CN110827340A (zh) 地图的更新方法、装置及存储介质
CN112364693B (zh) 基于双目视觉的障碍识别方法、装置、设备及存储介质
US11657506B2 (en) Systems and methods for autonomous robot navigation
CN115393379A (zh) 一种数据标注方法及相关产品
Nayak et al. BEV Detection and Localisation using Semantic Segmentation in Autonomous Car Driving Systems
CN113196746A (zh) 在摄像机系统之间转移附加信息

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination