CN114119780A - 一种图像标注方法、装置及电子设备 - Google Patents
一种图像标注方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114119780A CN114119780A CN202111401273.3A CN202111401273A CN114119780A CN 114119780 A CN114119780 A CN 114119780A CN 202111401273 A CN202111401273 A CN 202111401273A CN 114119780 A CN114119780 A CN 114119780A
- Authority
- CN
- China
- Prior art keywords
- image
- annotation
- color image
- depth image
- depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及深度学习技术领域,提供了一种图像标注方法、装置及电子设备,该方法包括:获取对齐的彩色图像和深度图像;利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息,其中,所述标签信息为所述目标的类别信息;根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;将所述深度图像转换为伪彩色图像,并基于所述深度图像的伪彩色图像对所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。本实施例提高了图像标注效率。
Description
技术领域
本申请涉及深度学习技术领域,尤其涉及一种图像标注方法、装置及电子设备。
背景技术
在深度学习中,需要利用大量的具有图像标注信息的图像作为数据集进行深度学习和训练,但是数据标注是一件非常繁琐和耗时的工作。
目前大多数研究机构或公司会采用购买现有的数据集,或者使用现有公开数据集的方式获得数据集,但是这种方式不利于特定场景或特定目标检测的研究。除此之外,他们也会采用外包给标注公司进行数据标注以获得数据集的方式,这种方式使得进行深度学习研究的成本非常高。
目前,数据标注大多采用人工标注的方式,标注人员需要进行大量的重复性的判断和操作来对图像进行标注,这样不可避免地需要投入大量的人力成本和时间成本,降低了数据集优化和模型建立的效率。
发明内容
有鉴于此,本申请实施例提供了一种图像标注方法、装置及电子设备,能够解决相关技术中的一个或多个技术问题。
第一方面,本申请一实施例提供了一种图像标注方法,包括:
获取对齐的彩色图像和深度图像;
利用预设的经训练的目标检测模型对彩色图像进行检测,获得彩色图像对应的标签信息和关键点坐标信息,其中,所述标签信息为所述目标的类别信息;
根据彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成深度图像对应的标注文件;
将所述深度图像转换为伪彩色图像,并基于所述深度图像的伪彩色图像对同组所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
本实施例,一方面,使用经训练的公开模型对彩色图像进行推理检测,根据检测结果生成标注文件,减少人工标注,大大提高了数据集的标注效率。另一方面,将深度图像转换为伪彩色图像方便用户对标注文件进行复检,提高了复检效率,也提高了标注的准确度,获得了置信度更高的数据集。再一方面,将标注文件应用于深度图像中,实现了快速标注深度图像的标注方法,进而进行训练学习,能够快速开展对深度图像的研究,促进3D相关技术的开发。
作为第一方面的一实现方式,所述将所述深度图像转换为伪彩色图像,包括:
获取色度图,所述色度图包括颜色值与像素值的映射关系;
对深度图像进行归一化,得到深度图像对应的归一化图像;
根据色度图将归一化图像映射成伪彩色图像。
作为第一方面的一实现方式,所述获取对齐的彩色图像和深度图像,包括:
将所述彩色图像的像素所述深度图像的像素进行一一对齐。
作为第一方面的一实现方式,所述根据彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成深度图像对应的标注文件,包括:
基于所述彩色图像与深度图像的对齐关系,将所述彩色图像对应的标签信息和关键点坐标信息转换为深度图像的标注信息,并写入预设格式的标注文件得到所述深度图像对应的标注文件。
作为第一方面的一实现方式,所述标注文件还包括所述深度图像中图像信息,其中,所述图像信息包括图像的长、宽、通道、路径和图像名称。
作为第一方面的一实现方式,所述修正后的标注数据集包括:利用所述伪彩色图像对所述标注文件中包括的所述标签信息和所述坐标信息进行一一校对,获得修正后的标注数据集。
作为第一方面的一实现方式,所述利用所述伪彩色图像对所述标注文件中包括的所述标签信息和所述坐标信息进行一一校对,包括:
利用标注工具对所述标注文件进行修正,获取修正后的标注数据集,其中,所述标注工具通过判断在所述伪彩色图像上显示的所述标注文件中包括的标签信息与坐标信息是否正确对所述标注文件进行修正。
第二方面,本申请一实施例提供了一种图像标注装置,包括:
采集模块,用于采集彩色图像和深度图像;
对齐模块,用于对齐所述彩色图像与所述深度图像;
检测模块,用于利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息,其中,所述标签信息为所述目标的类别信息;
文件生成模块,用于根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;
转换模块,用于将所述深度图像转换为伪彩色图像;
标注模块,用于基于所述深度图像的伪彩色图像对所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
第三方面,本申请一实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面任一实现方式所述图像标注方法的步骤。
第四方面,本申请一实施例提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面任一实现方式所述图像标注方法的步骤。
第五方面,本申请一实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备可实现上述第一方面或第一方面任一实现方式所述图像标注方法的步骤。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种电子设备的结构示意图;
图2是本申请一实施例提供的一种图像标注方法的实现流程示意图;
图3是本申请一实施例提供的一种图像标注方法中步骤S140的具体实现流程示意图;
图4是本申请一实施例提供的另一种图像标注方法的实现流程示意图;
图5是本申请一实施例提供的一种图像标注装置的结构示意图;
图6是本申请一实施例提供的另一种图像标注装置的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本申请说明书中描述的“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
此外,在本申请的描述中,“多个”的含义是两个或两个以上。
还应当理解,除非另有明确的规定或限定,术语“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是直接相连,也可以是通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
目前人工进行数据标注的方法耗时耗力,成本高,效率低。另外,市面上多数数据标注方法适用于彩色图像,很少考虑到深度图像的数据标注。
因此,本申请实施例提供一种图像标注方法,可实现图像的快速标注,进而可实现快速标注深度图像以获得具有图像标注信息的深度图像数据集,从而便于开展对深度图像的研究,促进三维(3D)相关技术的开发。
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
图1为本申请一实施例提供的一种电子设备的结构示意图。电子设备包括但不限于计算机、平板、笔记本电脑、上网本等电子设备,本申请实施例对电子设备的具体类型不作任何限制。
在本申请一些实施例中,如图1所示,电子设备可以包括一个或多个处理器10(图1中仅示出一个),存储器11以及存储在存储器11中并可在一个或多个处理器10上运行的计算机程序12,例如,进行图像标注的程序。一个或多个处理器10执行计算机程序12时可以实现后述图像标注方法实施例中的各个步骤。或者,一个或多个处理器10执行计算机程序12时可以实现后述各图像标注装置实施例中各模块/单元的功能。
示例性的,计算机程序12可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器11中,并由处理器10执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序12在处理单元中的执行过程。例如,计算机程序12可以被分割成如下几个模块。各模块具体功能如下:
获取模块,用于获取彩色图像和深度图像;
对齐模块,用于对齐彩色图像和深度图像;
检测模块,用于利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息;
文件生成模块,用于根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;
转换模块,用于将所述深度图像转换为伪彩色图像;
标注模块,用于基于所述深度图像的伪彩色图像对同组所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
本领域技术人员可以理解,图1仅仅是电子设备的示例,并不构成对电子设备的限定。电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器10可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器11可以是处理单元的内部存储单元,例如处理单元的硬盘或内存。存储器11也可以是处理单元的外部存储设备,例如处理单元上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,存储器11还可以既包括处理单元的内部存储单元也包括外部存储设备。存储器11用于存储计算机程序以及处理单元所需的其他程序和数据。存储器11还可以用于暂时地存储已经输出或者将要输出的数据。
本申请一实施例还提供了电子设备的另一种优选的实施例,在本实施例中,电子设备包括一个或多个处理器,该一个或多个处理器用于执行存在存储器的以下程序模块:
获取模块,用于获取彩色图像和深度图像;
对齐模块,用于对齐彩色图像和深度图像;
检测模块,用于利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息;
文件生成模块,用于根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;
转换模块,用于将所述深度图像转换为伪彩色图像;
标注模块,用于基于所述深度图像的伪彩色图像对同组所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
图2是本申请一实施例提供的一种图像标注方法的实现流程示意图。本实施例中的图像标注方法适用于需要对深度图像进行标注的情形。本实施例中的图像标注方法可由电子设备执行。作为示例而非限定,图像标注方法可由图1所示实施例中的电子设备执行。
如图2所示,图像标注方法可以包括:步骤S110至步骤S150。
S110,获取对齐的彩色图像和深度图像。
其中,彩色图像和深度图像为同一拍摄角度下的同一场景的图像。针对同一场景,可以拍摄至少一组相同拍摄角度下的彩色图像和深度图像。通过改变拍摄场景,可以获得大量的图像数据。不同组的图像有些包括目标对象(例如人体),有些不包括目标对象。
在一些实现方式中,通过相机采集彩色图像和深度图像。采集彩色图像和深度图像的相机可以为同一个相机,也可以为不同相机。
作为一非限制性示例,电子设备启动相机,通过相机拍摄多个场景下的多组彩色图像和深度图像。
进一步地,将每组彩色图像和深度图像进行对齐,获得对齐后的深度图像或对齐后的彩色图像。
在一些实现方式中,可以以同组的彩色图像为基准,将深度图像与彩色图像的每个像素进行对齐,获得对齐后的深度图像。
在本申请一些实施例中,在获取深度图像对应的标注文件之前,需要将获取的深度图像和彩色图像的每个对应像素进行对齐操作。更具体地,可以通过一个彩色相机获取某一场景的彩色图像,而通过另一个深度相机获取同一场景的深度图像。因此彩色图像与深度图像的视角不同,为了提高人工复检的准确性从而提高数据集的置信度,在这些实施例中可以进一步将深度图像和彩色图像进行对齐操作,获得对应像素的变换矩阵,进而获取对齐的深度图像与彩色图像。在这些实施例中,优选地,彩色相机和深度相机相邻设置,两者位置越近,两者的接收端或成像端拍摄的视场越接近,这样在对齐过程中彩色图像和深度图像具备更多的对应像素点,从而可以进一步增加数据集的准确度。
在本申请其他一些实施例中,彩色图像和深度图像通过同一个相机不同采集模块拍摄,彩色图像和深度图像亦可以进行图像对齐,此处不作限制。
S120,利用预设的经训练的目标检测模型对彩色图像进行检测,获得彩色图像对应的标签信息(label)和关键点坐标信息;其中,所述标签信息为目标的类别信息。
其中,预设的经训练的目标检测模型可以是公开模型,这些模型是基于公开的彩色图像数据集进行深度学习训练得到的模型。预设的经训练的人体检测模型事先部署在电子设备的存储器中,使用时调用即可。需要说明的是,预设的经训练的目标检测模型可以包括但不限于yolov5、faster RCNN、SSD、yolov4等模型,本申请实施例对目标检测模型不予限制。
作为一非限制性示例,目标检测模型为人体检测模型,人体检测模型可为二分类模型,标签信息可以包括人体(例如“person”)或非人体。应理解,若某一彩色图像对应的标签信息是人体,则该彩色图像对应的关键点坐标信息为具体的关节点坐标信息;若某一彩色图像对应的标签信息是非人体,则该彩色图像对应的关键点坐标信息为空,或不存在。
作为另一非限制性示例,目标检测模型是三分类以上的模型,标签信息可以包括人体、动物、物体等。应理解,若某一彩色图像对应的标签信息是人体,则该彩色图像对应的关键点坐标信息为具体的关节点坐标信息;若某一彩色图像对应的标签信息是动物或物体等,则该彩色图像对应的关键点坐标信息为空,或不存在。
需要说明的是,在三分类以上的模型中,可以对目标的类别信息作进一步细分,本申请实施例对此不予限制。
还需要说明的是,此处为了便于描述本实施例,以人体作为候选对象,即目标的示例进行说明。应理解,在其他实施例中,目标可以包括物体或动物等。
更一般地,采用目标检测模型对彩色图像进行检测,获得彩色图像对应的标签信息和关键点坐标信息。也就是说,通过目标检测模型一方面获取标签信息,另一方面获取框的坐标信息。
S130,根据彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成深度图像对应的标注文件。
在一个实施例中,获取摄像头拍摄的深度图像时,深度图像可自带图像信息,图像信息包括但不限于图像的长、宽、通道、路径和图像名称等中的一种或多种的组合。根据步骤S120获得的彩色图像对应的标签信息和关键点坐标信息,基于深度图像与彩色图像的对齐关系生成深度图像的标注信息,并结合深度图像的图像信息,生成深度图像对应的标注文件。
在一些实施例中,将深度图像对应的标签信息、关键点坐标信息及其它对应的图像信息写入预设格式标注文件,得到标注文件。
在一些实现方式中,预设格式标注文件可以包括VOC的xml标注文件、yolo的txt标注文件、或coco的json标注文件。本申请实施例对标注文件的格式不予具体限制。
S140,将深度图像转换为伪彩色图像。
对于原始深度图像,人眼很难识别出其中的目标,也很难感知到深度的变化。因此将深度图像转换为伪彩色图像,实现较好的可视化效果,便于后续人工复检。
在一些实施例中,如图3所示,将深度图像转换为伪彩色图像,包括步骤S141至步骤S143。
S141,获取色度图(colormap),色度图包括颜色值与像素值的映射关系。
在本申请实施例中,色度图有很多种,选择适合应用场景的色度图即可。在本申请实施例中,色度图选择能够较大程度的区分目标对象与背景的色度图。
在一些实现方式中,选择适合目标对象检测场景的色度图,色度图可以选择如colormap_jet。
在一些实现方式中,颜色值可以为RGB值。
S142,对深度图像进行归一化,得到深度图像对应的归一化图像;
将深度图像中像素值归一化至0至255范围,0至255范围可以为闭区间[0,8000]。即,原来深度图中各像素值的范围为0至8000范围,通过归一化操作,将这些像素值范围归一化至0至255范围。
作为一非限制性示例,若某一深度图像中像素值最大为a,该深度图像中某一像素点j的深度值为z,则该像素点j进行归一化至[0,225]之间,则:
其中,G(j)表示像素点j归一化后的值。
S143,根据色度图将归一化图像映射成伪彩色图像。
由于色度图包括颜色值和像素值的对应关系,因此,根据色图度可以确定归一化图像中各像素的像素值(即对深度值进行归一化后的值)对应的颜色值,从而将归一化图像映射成伪彩色图像。
在另一个实施例中,如图4所示,获取伪彩色图像后,还包括步骤S160:将深度图像对应的标注文件与深度图像的伪彩色图像一一对应,便于后续对标注文本进行修订,此处不作限制。
S150,利用深度图像的伪彩色图像对深度图像对应的标注文件进行修正,得到修正后的标注数据集。
更具体地,利用伪彩色图像对所述标注文件中包括的所述标签信息和所述坐标信息进行一一校对,获得修正后的标注数据集得到修正后的标注数据集,即修正后的标注深度图像数据集。
在其他一些实施例中,步骤S150还包括:利用标注工具对所述标注文件进行修正,获取修正后的标注数据集,其中,所述标注工具通过判断在所述伪彩色图像上显示的所述标注文件中包括的标签信息与坐标信息是否正确对所述标注文件进行修正。
通过对彩色图像自动标注完成后,可能会存在框的位置(即关键点坐标信息)不够准确、漏标、或误标等情况,进而导致深度图像对应的标注文件亦会出现类似问题,因此在一些实施例中,可通过标注工具对标注框进行修正,提高标注框的准确度。对于与彩色图像对齐后的深度图像,由于深度图像可视化效果差,因此利用可视化效果好的与各深度图像对应的伪彩色图像进行人工复检,可以让用户快速友好的感知目标,方便用户进行人工复检,提高复检的效率与准确性,得到标注准确率高的深度图像数据集。
在一个实施例中,标注工具通过在伪彩色图像上显示的所述标注文件中包括的标签信息与坐标信息,进而判断标注文件中的信息是否正确,以方便用户(即标注人员)进行复检,用户可以检查标签信息和人体坐标信息,当发现错误时,用户可以通过外接设备的诸如麦克风、鼠标、键盘等输入设备输入人工复检数据,标注工具根据用户输入的人工复检数据对标注文件中的标签信息和最小外接矩形的坐标信息进行修正,从而得到经修正的标注文件。进一步地,在人工复检后将获得准确的标注好的数据集,即将标注深度图像转换为标注伪彩色图像,生成包含标注深度图像与标注伪彩色图像的数据集,此处不作限制。
需要说明的是,若经用户人工复检,发现标注文件对应的标注信息不需要修改,则保留原标注信息。
在一些实施例中,可以同屏显示一对或多对一一对应的标注文件中的标注信息和伪彩色图像。
作为一非限制性示例,标注工具为labelimg软件,利用labelimg软件通过对每帧与标注文件一一对应的伪彩色图像进行批量标注修正。
具体地,用户打开标注工具labelimg软件之后,需要检查的主要是标注文件中的标签信息和人体坐标信息,对于图像信息,LabelImg软件会自动读取标注文件与伪彩色图像的图像信息,如果与标注文件的图像信息存在出入,会对伪彩色图像自动修改并写入。
在本申请实施例,一方面,使用经训练的公开模型对彩色图像进行推理检测,根据检测结果生成标注文件,减少人工标注,大大提高了数据集的标注效率。另一方面,将深度图像转换为伪彩色图像方便用户对标注文件进行复检,提高了复检效率,也提高了标注的准确度,获得了置信度更高的数据集。再一方面,将标注文件应用于深度图像中,实现了快速标注深度图像的标注方法,便于在深度图像上标注进而进行训练学习,能够快速开展对深度图像的研究,促进3D相关技术的开发。
需要说明的是,图2所示实施例的步骤编号,不能解释为各步骤的时间顺序的限制。应理解,在其他一些实施例中,步骤之间的前后顺序可以根据步骤间的逻辑关系进行调换,而不影响本方案的实施。作为一非限制性示例,步骤S140在步骤S110之后,在步骤S150之前的任一时间执行。
对应于上文的图像标注方法,本申请一实施例还提供一种图像标注装置。该图像标注装置中未详细描述之处请详见前述方法的描述。
图5是本申请一实施例提供的一种图像标注装置的结构示意图。作为一个示例,所述图像标注装置可以配置于图1所示的电子设备。所述图像标注装置包括:采集模块61、对齐模块62、检测模块63、文件生成模块64、转换模块65和标注模块66,其中:
采集模块61,用于采集彩色图像和深度图像;
对齐模块62,用于对齐彩色图像和深度图像;
检测模块63,用于利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息;
文件生成模块64,用于根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;
转换模块65,用于将所述深度图像转换为伪彩色图像;
标注模块66,用于基于所述深度图像的伪彩色图像对同组所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
在一个实施例中,采集模块61可用于采集多个场景的深度图像和彩色图像。更具体地,采集模块61包括两个相机,一个彩色相机,一个深度相机。彩色相机用于拍摄某一场景的彩色图像,深度相机用于拍摄同一场景的深度图像。彩色图像可以是例如RGB图像等。深度相机包括但不限于基于诸如间接飞行时间(indirect time-of-flight,iToF)或直接飞行时间(direct time-of-flight,dToF)等光飞行时间法(time-of-flight,TOF)、基于双目视觉、或基于结构光等的相机。彩色相机和深度相机尽可能靠近,减少两者之间的视差,提高结果的准确性。
在其他一些实施例中,采集模块61仅包括一个相机,采集模块61包括深度采集单元和彩色采集单元,深度采集单元和彩色采集单元分别用于拍摄每个场景的深度图像和彩色图像,此处不作限制。
为采集足够数量的图像数据用于深度学习,可多次改变场景,并针对每个场景,至少获取一组深度图像和彩色图像,就可以获得多个不同场景下的样本图像数据。
在一些实施例中,所述转换模块65,具体用于:
获取色度图,色度图包括颜色值与像素值的映射关系;
对深度图像进行归一化,得到深度图像对应的归一化图像;
根据色度图将每个归一化图像映射成伪彩色图像。
在一些实施例中,所述获取色度图包括:获取目标检测场景的色度图。
在一些实施例中,所述文件生成模块64,具体用于:
将深度图像对应的标签信息和关键点坐标信息,以及该深度图像的图像信息写入预设格式的标注文件,得到深度图像对应的标注文件。
在一些实施例中,所述标注数据集包括:将所述标注深度图像转换为标注伪彩色图像,得到标注深度图像数据集。
在一些实施例中,所述预设的经训练的目标检测模型为公开的经训练的目标检测模型。
参见图6,图6是本申请一实施例提供的另一种图像标注装置的结构示意图。图像标注装置包括:采集模块61、对齐模块62,检测模块63、文件生成模块64、转换模块65、对应模块67及标注模块66。其中,与图5所示装置相同的模块,此处不再赘述。
对应模块67,用于将所述每个深度图像对应的标注文件与同组深度图像的伪彩色图像一一对应。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种电子设备,该电子设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意图像标注方法实施例中的步骤。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个图像标注方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备可实现上述各个图像标注方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种图像标注方法,其特征在于,包括:
获取对齐的彩色图像和深度图像;
利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息,其中,所述标签信息为所述目标的类别信息;
根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;
将所述深度图像转换为伪彩色图像,并基于所述深度图像的伪彩色图像对所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
2.如权利要求1所述的图像标注方法,其特征在于,所述将所述深度图像转换为伪彩色图像,包括:
获取色度图,所述色度图包括颜色值与像素值的映射关系;
对所述深度图像进行归一化,得到所述深度图像对应的归一化图像;
根据所述色度图将归一化图像映射成伪彩色图像。
3.如权利要求1所述的图像标注方法,其特征在于,所述获取对齐的彩色图像和深度图像,包括:
将所述彩色图像的像素所述深度图像的像素进行一一对齐。
4.如权利要求3所述的图像标注方法,其特征在于,所述根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件,包括:
基于所述彩色图像与深度图像的对齐关系,将所述彩色图像对应的标签信息和关键点坐标信息转换为深度图像的标注信息,并写入预设格式的标注文件得到所述深度图像对应的标注文件。
5.如权利要求4所述的图像标注方法,其特征在于,所述标注文件还包括深度图像的图像信息,其中,所述图像信息包括图像的长、宽、通道、路径和图像名称。
6.如权利要求1所述的图像标注方法,其特征在于,所述修正后的标注数据集包括:
利用所述伪彩色图像对所述标注文件中包括的所述标签信息和所述坐标信息进行一一校对,获得修正后的标注数据集。
7.如权利要求6所述的图像标注方法,其特征在于,所述利用所述伪彩色图像对所述标注文件中包括的所述标签信息和所述坐标信息进行一一校对,包括:
利用标注工具对所述标注文件进行修正,获取修正后的标注数据集,其中,所述标注工具通过判断在所述伪彩色图像上显示的所述标注文件中包括的标签信息与坐标信息是否正确对所述标注文件进行修正。
8.一种图像标注装置,其特征在于,包括:
采集模块,用于采集彩色图像和深度图像;
对齐模块,用于将对齐所述彩色图像和所述深度图像;
检测模块,用于利用预设的经训练的目标检测模型对彩色图像进行检测,获得所述彩色图像对应的标签信息和关键点坐标信息,其中,所述标签信息为所述目标的类别信息;
文件生成模块,用于根据所述彩色图像对应的标签信息和关键点坐标信息并基于对齐关系生成所述深度图像对应的标注文件;
转换模块,用于将所述深度图像转换为伪彩色图像;
标注模块,用于基于所述深度图像的伪彩色图像对所述深度图像对应的标注文件进行修正,得到修正后的标注数据集。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的图像标注方法。
10.一种计算机存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的图像标注方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111401273.3A CN114119780A (zh) | 2021-11-24 | 2021-11-24 | 一种图像标注方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111401273.3A CN114119780A (zh) | 2021-11-24 | 2021-11-24 | 一种图像标注方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114119780A true CN114119780A (zh) | 2022-03-01 |
Family
ID=80440852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111401273.3A Pending CN114119780A (zh) | 2021-11-24 | 2021-11-24 | 一种图像标注方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114119780A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612357A (zh) * | 2023-07-11 | 2023-08-18 | 睿尔曼智能科技(北京)有限公司 | 一种无监督rgbd多模态数据集的构建方法、系统和存储介质 |
-
2021
- 2021-11-24 CN CN202111401273.3A patent/CN114119780A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116612357A (zh) * | 2023-07-11 | 2023-08-18 | 睿尔曼智能科技(北京)有限公司 | 一种无监督rgbd多模态数据集的构建方法、系统和存储介质 |
CN116612357B (zh) * | 2023-07-11 | 2023-11-24 | 睿尔曼智能科技(北京)有限公司 | 一种无监督rgbd多模态数据集的构建方法、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340797B (zh) | 一种激光雷达与双目相机数据融合检测方法及系统 | |
Zhang et al. | Content-aware unsupervised deep homography estimation | |
US11929048B2 (en) | Method and device for marking target cells, storage medium and terminal device | |
US10726580B2 (en) | Method and device for calibration | |
CN109685078B (zh) | 基于自动标注的红外图像识别方法 | |
US11455831B2 (en) | Method and apparatus for face classification | |
CN102509304A (zh) | 基于智能优化的摄像机标定方法 | |
Bazin et al. | Globally optimal inlier set maximization with unknown rotation and focal length | |
CN109522807B (zh) | 基于自生成特征的卫星影像识别系统、方法及电子设备 | |
Liang et al. | Image registration using two-layer cascade reciprocal pipeline and context-aware dissimilarity measure | |
CN114119780A (zh) | 一种图像标注方法、装置及电子设备 | |
CN114119695A (zh) | 一种图像标注方法、装置及电子设备 | |
CN112950528A (zh) | 证件姿态确定方法、模型训练方法、装置、服务器及介质 | |
Li et al. | Guided neighborhood affine subspace embedding for feature matching | |
Żak et al. | Local image features matching for real-time seabed tracking applications | |
CN111325106B (zh) | 生成训练数据的方法及装置 | |
CN115019297B (zh) | 一种基于颜色增广的实时车牌检测识别方法和装置 | |
CN116597246A (zh) | 模型训练方法、目标检测方法、电子设备及存储介质 | |
CN106651950B (zh) | 一种基于二次曲线透视投影不变性的单相机位姿估计方法 | |
CN115424254A (zh) | 车牌识别方法、系统、设备及存储介质 | |
CN113034449B (zh) | 目标检测模型训练方法、装置及通信设备 | |
CN114373078A (zh) | 目标检测方法、装置、终端设备及存储介质 | |
CN114140429A (zh) | 一种车端实时停车位检测方法和装置 | |
CN116266402A (zh) | 对象自动标注方法、装置、电子设备及存储介质 | |
Yang et al. | CA-YOLOv5: A YOLO model for apple detection in the natural environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |