CN111429512A - 图像处理方法和装置、存储介质及处理器 - Google Patents
图像处理方法和装置、存储介质及处理器 Download PDFInfo
- Publication number
- CN111429512A CN111429512A CN202010324173.4A CN202010324173A CN111429512A CN 111429512 A CN111429512 A CN 111429512A CN 202010324173 A CN202010324173 A CN 202010324173A CN 111429512 A CN111429512 A CN 111429512A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- result
- labeling result
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/285—Analysis of motion using a sequence of stereo image pairs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像处理方法和装置、存储介质及处理器。其中,该方法包括:获取待处理图像,其中,待处理图像中包含多个对象的三维点云数据;利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,其中,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;获取接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;输出待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。本发明解决了相关技术中通过识别模型对待处理图像进行识别,存在漏标注情况的技术问题。
Description
技术领域
本发明涉及图像处理领域,具体而言,涉及一种图像处理方法和装置、存储介质及处理器。
背景技术
无人驾驶汽车通过车载传感器感知道路环境,包括道路中行驶的其他车辆、行人、障碍物等,车载传感器可以采集到道路中不同对象的三维点云数据。为了能够准确感知到道路环境,可以通过识别模型对三维点云数据构成的三维图像进行识别,确定对象的具体类型,实现三维点云数据的标注。
但是,通过识别模型对三维点云数据进行标注,当三维点云数据的数据量较少时,三维点云数据稀疏度较高,无法准确识别出对象的具体类型,因此存在漏标的问题,从而导致无人驾驶汽车安全性较低。
针对相关技术中通过识别模型对待处理图像进行识别,存在漏标注情况的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种图像处理方法和装置、存储介质及处理器,以至少解决相关技术中通过识别模型对待处理图像进行识别,存在漏标注情况的技术问题。
根据本发明实施例的一个方面,提供了一种图像处理方法,包括:获取待处理图像,其中,待处理图像中包含多个对象的三维点云数据;利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,其中,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;获取接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;输出待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
可选地,获取接收到的待处理图像中包含的第二对象的目标标注结果包括:获取接收到的目标区域,目标区域中包含有第二对象;在目标区域被拖动的过程中,利用训练好的识别模型对目标区域中的第二对象进行识别,得到第二对象的标注结果;基于第二对象的标注结果,得到第二对象的置信值;基于第二对象的置信值,确定第二对象的目标标注结果。
可选地,在获取接收到的待处理图像中包含的第二对象的目标标注结果之前,该方法还包括:获取第二对象的子图像;基于第一对象的标注结果和第二对象的子图像,生成目标输出信息;输出目标输出信息。
可选地,输出目标输出信息,包括:基于第一对象的标注结果,确定第一对象的显示方式;按照第一对象的显示方式,显示第一对象的标注结果,并显示第二对象的子图像。
可选地,基于第一对象的标注结果,确定第一对象的显示方式,包括:基于第一对象的标注结果,得到第一对象的置信值;基于第一对象的置信值,确定第一对象的显示方式。
可选地,在待处理图像包括多帧图像的情况下,利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,包括:利用训练好的识别模型对每帧图像进行识别,得到每帧图像的识别结果;基于每帧图像的识别结果,确定第三对象在多帧图像中的移动路径,其中,第三对象为多个对象中的任意一个对象;基于移动路径调整每帧图像中包含的第三对象的标注结果。
可选地,基于每帧图像的识别结果,确定第三对象在多帧图像中的移动路径,包括:判断每帧图像的识别结果中是否包含第三对象的标注结果;如果第一图像的识别结果中包含第三对象的标注结果,则基于第三对象在第一图像中的位置,确定第三对象的移动路径,其中,第一图像为多帧图像中的至少一帧图像。
可选地,如果多帧图像的识别结果中均未包含第三对象的标注结果,该方法还包括:获取多帧图像中的第一帧图像和最后一帧图像,得到第一图像;获取接收到的第一图像中第三对象的标注结果;基于第三对象在第一图像中的位置,确定移动路径。
可选地,基于移动路径调整每帧图像中包含的第三对象的标注结果包括:基于第三对象的标注结果,确定第二图像中包含的第三对象的标注结果,其中,第二图像为多帧图像中除第一图像之外的图像。
可选地,在利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果之前,该方法还包括:获取多个训练数据,其中,每个训练数据包括:包含有一个对象的图像,以及对象的标注结果;利用训练数据对识别模型进行训练,得到训练好的识别模型。
可选地,在获取接收到的待处理图像中包含的第二对象的目标标注结果之后,该方法还包括:基于第二对象的目标标注结果,生成新的训练数据;利用新的训练数据对训练好的识别模型进行训练。
根据本发明实施例的另一方面,还提供了一种图像处理方法,包括:在交互界面上显示待处理图像,其中,待处理图像中包含多个对象的三维点云数据;在交互界面上显示待处理图像中包含的第一对象的标注结果,其中,利用训练好的识别模型对待处理图像进行图像识别,得到第一对象的标注结果,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;在交互界面上显示接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;在交互界面上展示待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
根据本发明实施例的另一方面,还提供了一种图像处理装置,包括:第一获取模块,用于获取待处理图像,其中,待处理图像中包含多个对象的三维点云数据;识别模块,用于利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,其中,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;第二获取模块,用于获取接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;输出模块,用于输出待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
可选地,第二获取模块包括:获取单元,用于获取接收到的目标区域,目标区域中包含有第二对象;第一识别单元,用于在目标区域被拖动的过程中,利用训练好的识别模型对目标区域中的第二对象进行识别,得到第二对象的标注结果;处理单元,用于基于第二对象的标注结果,得到第二对象的置信值;第一确定单元,用于基于第二对象的置信值,确定第二对象的目标标注结果。
可选地,该装置还包括:第三获取模块,用于获取第二对象的子图像;生成模块,用于基于第一对象的标注结果和第二对象的子图像,生成目标输出信息;输出模块,用于输出目标输出信息。
可选地,在待处理图像包括多帧图像的情况下,识别模块包括:第二识别单元,用于利用训练好的识别模型对每帧图像进行识别,得到每帧图像的识别结果;第二确定单元,用于基于每帧图像的识别结果,确定第三对象在多帧图像中的移动路径,其中,第三对象为多个对象中的任意一个对象;调整单元,用于基于移动路径调整每帧图像中包含的第三对象的标注结果。
根据本发明实施例的另一方面,还提供了一种图像处理装置,包括:第一显示模块,用于在交互界面上显示待处理图像,其中,待处理图像中包含多个对象的三维点云数据;第二显示模块,用于在交互界面上显示待处理图像中包含的第一对象的标注结果,其中,利用训练好的识别模型对待处理图像进行图像识别,得到第一对象的标注结果,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;第三显示模块,用于在交互界面上显示接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;第四显示模块,用于在交互界面上展示待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的图像处理方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的图像处理方法。
在本发明实施例中,在获取到待处理图像之后,首先利用训练好的识别模型对待处理图像进行图像识别,得到大部分对象的标注结果,然后通过人工标注的方式确定剩余部分对象的标注结果,最后输出待处理图像的识别结果,从而实现对三维点云数据进行标注的目的。与相关技术相比,可以利用训练好的识别模型对待处理图像中的大部分对象进行识别,达到降低标注员的工作量,提高处理效率并降低人工成本的技术效果。另外,通过获取人工标注方式确定的标注结果,达到减少处理时间,提高处理准确度的技术效果,进而解决了相关技术中通过识别模型对待处理图像进行识别,存在漏标注情况技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种图像处理方法的流程图;
图2是根据本发明实施例的另一种图像处理方法的流程图;
图3是根据本发明实施例的一种图像处理装置的示意图;以及
图4是根据本发明实施例的另一种图像处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种图像处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种图像处理方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待处理图像,其中,待处理图像中包含多个对象的三维点云数据。
上述步骤中的对象可以是道路环境中的车辆、行人、障碍物、指示牌等,但不仅限于此。三维点云数据可以是通过车载传感器采集到的对象的轮廓数据,不同对象的轮廓数据不同,通过将三维点云数据进行绘制,可以得到上述步骤中的待处理图像,即得到不同对象的三维图像,该图像中的每个对象由三维点云数据构成。
步骤S104,利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,其中,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象。
上述步骤中的训练好的识别模型可以是传统三维点云数据的标注方式中使用的识别模型,具体模型结构在此不作具体限定。识别模型可以利用训练集训练得到,训练过程在本发明实施例中不作限定。为了确保能够对三维图像中包含的对象进行识别,可以预先获取大量不同对象的三维图像,并设置每个三维图像对应的对象类型的标签,得到训练集。
对于不同对象,车载传感器采集到的三维点云数据的数据量不同,由于三维点云数据的数据量影响识别模型的标注结果,采用同一个识别模型对三维图像进行识别,可以识别出数据量较多的大部分对象,而对于数据量较少的部分对象,无法进行标注。
步骤S106,获取接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象。
在本发明实施例中,基于标注策略可知,可以对不同的对象进行多次标注,但是不同漏标,在此基础上,对于识别模型未识别出的对象,可以通过人工标注的方式对其进行标注,得到相应的目标标注结果。具体由标注员将三维图像中未标注的同一个对象的三维点云数据进行框选,并给出方框中对象的类型。
步骤S108,输出待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
在一种可选的实施例中,通过将识别模型标注出的标注结果和人工标注的标注结果进行组合,可以得到该三维图像的最终的识别结果,该识别结果中包含有每个对象的标注结果。
在本发明实施例中,可以通过方框将同一个对象的三维点云数据进行框选,并在每个方框上显示框中对象的具体类型。但不仅限于此,还可以通过其他方式将识别结果进行输出,本发明对此不作具体限定。
通过本发明实施例,在获取到待处理图像之后,首先利用训练好的识别模型对待处理图像进行图像识别,得到大部分对象的标注结果,然后通过人工标注的方式确定剩余部分对象的标注结果,最后输出待处理图像的识别结果,从而实现对三维点云数据进行标注的目的。与相关技术相比,可以利用训练好的识别模型对待处理图像中的大部分对象进行识别,达到降低标注员的工作量,提高处理效率并降低人工成本的技术效果。另外,通过获取人工标注方式确定的标注结果,达到减少处理时间,提高处理准确度的技术效果,进而解决了相关技术中通过识别模型对待处理图像进行识别,存在漏标注情况技术问题。
可选地,获取接收到的待处理图像中包含的第二对象的目标标注结果包括:获取接收到的目标区域,目标区域中包含有第二对象;在目标区域被拖动的过程中,利用训练好的识别模型对目标区域中的第二对象进行识别,得到第二对象的标注结果;基于第二对象的标注结果,得到第二对象的置信值;基于第二对象的置信值,确定第二对象的目标标注结果。
上述步骤中的目标区域可以是标注员感兴趣的区域,例如,目标区域可以是标注员绘制的方框所在区域,但不仅限于此,还可以是圆形框、椭圆形框等。置信值可以是识别模型输出的标注结果的概率值。
在一种可选的实施例中,对于未标注的对象,可以给标注员没标注的原始三维图像,标注员在三维图像中绘制一个方框,该方框中的三维点云数据为未标注的对象的三维点云数据。在拖动方框的过程中,可以计算不同方框中内容的置信值,进一步基于置信值确定最终方框的标注结果。
可选地,在获取接收到的待处理图像中包含的第二对象的目标标注结果之前,该方法还包括:获取第二对象的子图像;基于第一对象的标注结果和第二对象的子图像,生成目标输出信息;输出目标输出信息。
上述步骤中的目标输出信息可以是输出给标注员的标注结果以及标注员需要进行人工标注的内容。为了确保标注员能够准确对未标注的对象进行标注,提高标注准确度,可以获取未标注对象的原始三维图像,并将该图像输出给标注员。
需要说明的是,基于标注策略,可以将识别模型输出的标注结果同样输出给标注员,由标注员确定是否标注正确,对于标注不正确的对象,同样可以由标注员人工进行标注。
可选地,输出目标输出信息,包括:基于第一对象的标注结果,确定第一对象的显示方式;按照第一对象的显示方式,显示第一对象的标注结果,并显示第二对象的子图像。
上述步骤中的显示方式可以是指显示标注结果的显示颜色、字体、大小等,本发明对此不作具体限定,在本发明实施例中,以显示颜色为例进行说明。不同的标注结果显示不同的颜色,并且颜色可以与标注结果的准确度挂钩,从而标注可以根据颜色不同,针对准确度较低的标注结果进行再次标注,在降低标注员工作量的同时,进一步提升裱糊结果的准确性。
需要说明的是,如果一个对象的标注结果准确度太低,该对象需要由标注员重新进行标注,为了避免标注结果对标注员的影响,可以不显示该对象的标注结果,仅仅由标注员进行人工标注。
可选地,基于第一对象的标注结果,确定第一对象的显示方式,包括:基于第一对象的标注结果,得到第一对象的置信值;基于第一对象的置信值,确定第一对象的显示方式。
上述步骤中的置信值可以是识别模型输出的标注结果的概率值,用于表明标注结果的准确度,概率值越高,表明标注结果越准确。
在一种可选的方案中,可以预先针对置信值设置一个连续变化的颜色,在得到标注结果的置信值之后,可以直接确定相应的显示颜色。在另一种可选的方案中,可以预先针对不同的置信值,设置不同置信值区间对应的概率值,从而避免输出的标注结果中显示颜色太多,影响标注员观感体验。
可选地,在待处理图像包括多帧图像的情况下,利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,包括:利用训练好的识别模型对每帧图像进行识别,得到每帧图像的识别结果;基于每帧图像的识别结果,确定第三对象在多帧图像中的移动路径,其中,第三对象为多个对象中的任意一个对象;基于移动路径调整每帧图像中包含的第三对象的标注结果。
在无人驾驶汽车运动过程中,车载传感器采集到的三维点云数据是一个动态变化的过程,仅仅通过单帧图像进行标注,标注结果的准确度不高,例如,其他车辆可能会被标注为固定物体,或固定物体被标注为车辆。为了提升标注结果的准确度,可以获取连续多帧图像,并利用识别模型对每帧图像进行处理,最终基于多帧图像的标注结果确定最终显示给标记员的标注结果。例如,可以采集连续100帧图像并进行一次标注任务,针对单帧图像进行物体识别,得到每个图像的标注结果。
在获取到每帧图像的标注结果之后,由于一个对象在每帧图像中可能存在未知变化,因此可以利用追踪算法对同一个对象进行跟踪,确定该对象的移动路径,并根据移动路径确定每帧图像中该对象的标注结果。
在一种可选的方案中,基于该对象的移动路径可以确定该对象在每帧图像中的位置是否发生变化,进而确定标注结果是否正确,如果标注结果错误,则对标注结果进行调整。例如,该对象的位置未发生变化,可以确定该对象为固定不动的物体,如果其标注结果为车辆,则确定标注结果错误,调整其标注结果为固定物体。
在另一种可选的方案中,由于单帧图像的标注结果仅能标注部分对象,为了进一步降低标注员的工作量,可以通过该对象的移动路径,确定该对象在每帧图像中的位置,如果在某帧图像中未标注该对象,可以结合其他帧图像中的标注结果,得到该镇图像中的标注结果。
可选地,基于每帧图像的识别结果,确定第三对象在多帧图像中的移动路径,包括:判断每帧图像的识别结果中是否包含第三对象的标注结果;如果第一图像的识别结果中包含第三对象的标注结果,则基于第三对象在第一图像中的位置,确定第三对象的移动路径,其中,第一图像为多帧图像中的至少一帧图像。
由于标注结果中含有对象在图像中的位置,因此,可以基于已经标注出的对象的位置,对该对象进行追踪,确定该对象在连续多帧图像中位置变化情况,从而得到该对象的移动路径。
可选地,如果多帧图像的识别结果中均未包含第三对象的标注结果,该方法还包括:获取多帧图像中的第一帧图像和最后一帧图像,得到第一图像;获取接收到的第一图像中第三对象的标注结果;基于第三对象在第一图像中的位置,确定移动路径。
如果某个对象的三维点云数据较少,则可能会出现多帧图像中均未进行标注的情况。在上述情况下,为了提升移动路径确定的准确度,进一步提升标注结果的准确度,在一种可选的方案中,如果识别模型未标注某个对象,则可以由标注员对第一帧图像和最终一帧图像中的同一个对象进行标注,进一步根据人工标注结果确定该物体的移动路径。
可选地,基于移动路径调整每帧图像中包含的第三对象的标注结果包括:基于第三对象的标注结果,确定第二图像中包含的第三对象的标注结果,其中,第二图像为多帧图像中除第一图像之外的图像。
在一种可选的方案中,如果识别模型未标注某个对象,在标注员人工标注该对象,并确定该对象的移动路径之后,可以采用插值方式对其他帧图像中,该路径上的同一个对象进行自动标注。
可选地,在利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果之前,该方法还包括:获取多个训练数据,其中,每个训练数据包括:包含有一个对象的图像,以及对象的标注结果;利用训练数据对识别模型进行训练,得到训练好的识别模型。
为了提升标注结果的准确度,可以采集一个对象的三维点云数据并生成相应的三维图像,得到单个样本,同时根据该对象的对象信息(包括对象名称和类型),得到该对象的标注结果,作为样本的交钱,从而得到最终的训练集。使用该训练集训练模型,使得训练好的识别模型能够对单帧图像进行图像识别,标注出检测到的对象以及对象的具体类型。
在一种可选的方案中,训练数据的数量可以是100w,避免数量过多影响模型训练速度,以及数量过少影响模型标注的准确度。
可选地,在获取接收到的待处理图像中包含的第二对象的目标标注结果之后,该方法还包括:基于第二对象的目标标注结果,生成新的训练数据;利用新的训练数据对训练好的识别模型进行训练。
对于人工标注的对象,为了避免下一次仍然需要人工标注,降低标注员的工作量,可以将人工标注的对象作为一个样本,并根据更新后的训练接对模型进行再次训练,从而再次训练好的识别模型可以自动标注该对象。
实施例2
根据本发明实施例,还提供了一种图像处理方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本发明实施例的另一种图像处理方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,在交互界面上显示待处理图像,其中,待处理图像中包含多个对象的三维点云数据。
上述步骤中的交互界面可以是无人驾驶车辆的中控显示屏中的人机交互界面,也可以是远程控制中心中的人机交互界面。
在一种可选的方案中,在通过车载传感器实时采集到三维点云数据之后,可以基于三维点云数据生成相应的三维图像,并将三维图像显示在交互界面上,从而标注员以及其他用户可以查看到无人驾驶车辆实时采集到的三维图像。
步骤S204,在交互界面上显示待处理图像中包含的第一对象的标注结果,其中,利用训练好的识别模型对待处理图像进行图像识别,得到第一对象的标注结果,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象。
步骤S206,在交互界面上显示接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象。
步骤S208,在交互界面上展示待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
通过本发明实施例,可以利用训练好的识别模型对待处理图像中的大部分对象进行识别,达到降低标注员的工作量,提高处理效率并降低人工成本的技术效果。另外,通过获取人工标注方式确定的标注结果,达到减少处理时间,提高处理准确度的技术效果,进而解决了相关技术中通过识别模型对待处理图像进行识别,存在漏标注情况技术问题。进一步地,通过人机交互界面显示待处理图像、第一对象的标注结果、第二对象的目标标注结果以及最终的识别结果,可以达到提升标注结果的可视化,方便标注员快速获知每个标注结果的效果。
需要说明的是,本实施例中的优选的实施方案和实施场景与上述实施例1中的实施方案和实施场景相同或类似,在此不做赘述。
实施例3
根据本发明实施例,提供了一种图像处理装置。该装置可以执行上述实施例1中提供的图像处理方法,在此不作赘述。
图3是根据本发明实施例的一种图像处理装置的示意图,如图3所示,该装置包括:
第一获取模块32,用于获取待处理图像,其中,待处理图像中包含多个对象的三维点云数据;
识别模块34,用于利用训练好的识别模型对待处理图像进行图像识别,得到待处理图像中包含的第一对象的标注结果,其中,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;
第二获取模块36,用于获取接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;
输出模块38,用于输出待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
可选地,第二获取模块包括:获取单元,用于获取接收到的目标区域,目标区域中包含有第二对象;第一识别单元,用于在目标区域被拖动的过程中,利用训练好的识别模型对目标区域中的第二对象进行识别,得到第二对象的标注结果;处理单元,用于基于第二对象的标注结果,得到第二对象的置信值;第一确定单元,用于基于第二对象的置信值,确定第二对象的目标标注结果。
可选地,该装置还包括:第三获取模块,用于获取第二对象的子图像;生成模块,用于基于第一对象的标注结果和第二对象的子图像,生成目标输出信息;输出模块,用于输出目标输出信息。
可选地,输出模块包括:确定单元,用于基于第一对象的标注结果,确定第一对象的显示方式;显示单元,用于按照第一对象的显示方式,显示第一对象的标注结果,并显示第二对象的子图像。
可选地,确定单元还用于基于第一对象的标注结果,得到第一对象的置信值,并基于第一对象的置信值,确定第一对象的显示方式。
可选地,在待处理图像包括多帧图像的情况下,识别模块包括:第二识别单元,用于利用训练好的识别模型对每帧图像进行识别,得到每帧图像的识别结果;第二确定单元,用于基于每帧图像的识别结果,确定第三对象在多帧图像中的移动路径,其中,第三对象为多个对象中的任意一个对象;调整单元,用于基于移动路径调整每帧图像中包含的第三对象的标注结果。
可选地,第二确定单元还用于判断每帧图像的识别结果中是否包含第三对象的标注结果,如果第一图像的识别结果中包含第三对象的标注结果,则基于第三对象在第一图像中的位置,确定第三对象的移动路径,其中,第一图像为多帧图像中的至少一帧图像。
可选地,识别模块还包括:第一获取单元,用于如果多帧图像的识别结果中均未包含第三对象的标注结果,则获取多帧图像中的第一帧图像和最后一帧图像,得到第一图像;第二获取单元,用于获取接收到的第一图像中第三对象的标注结果;第三确定单元,用于基于第三对象在第一图像中的位置,确定移动路径。
可选地,调整单元还用于基于第三对象的标注结果,确定第二图像中包含的第三对象的标注结果,其中,第二图像为多帧图像中除第一图像之外的图像。
可选地,该装置还包括:第四获取模块,用于获取多个训练数据,其中,每个训练数据包括:包含有一个对象的图像,以及对象的标注结果;训练模块,用于利用训练数据对识别模型进行训练,得到训练好的识别模型。
可选地,该装置还包括:生成模块,用于基于第二对象的目标标注结果,生成新的训练数据;训练模块还用于利用新的训练数据对训练好的识别模型进行训练。
实施例4
根据本发明实施例,还提供了一种图像处理装置。该装置可以执行上述实施例2中提供的图像处理方法,在此不作赘述。
图4是根据本发明实施例的另一种图像处理装置的示意图,如图4所示,该装置包括:
第一显示模块42,用于在交互界面上显示待处理图像,其中,待处理图像中包含多个对象的三维点云数据;
第二显示模块44,用于在交互界面上显示待处理图像中包含的第一对象的标注结果,其中,利用训练好的识别模型对待处理图像进行图像识别,得到第一对象的标注结果,标注结果用于表征第一对象在待处理图像中的位置,以及第一对象的类型,第一对象为多个对象中的部分对象;
第三显示模块46,用于在交互界面上显示接收到的待处理图像中包含的第二对象的目标标注结果,其中,第二对象为多个对象中除第一对象之外的对象;
第四显示模块48,用于在交互界面上展示待处理图像的识别结果,其中,识别结果包括:第一对象的标注结果和第二对象的目标标注结果。
实施例5
根据本发明实施例,提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例1和2中的图像处理方法。
实施例6
根据本发明实施例,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述实施例1和2中的图像处理方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (19)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像,其中,所述待处理图像中包含多个对象的三维点云数据;
利用训练好的识别模型对所述待处理图像进行图像识别,得到所述待处理图像中包含的第一对象的标注结果,其中,所述标注结果用于表征所述第一对象在所述待处理图像中的位置,以及所述第一对象的类型,所述第一对象为所述多个对象中的部分对象;
获取接收到的所述待处理图像中包含的第二对象的目标标注结果,其中,所述第二对象为所述多个对象中除所述第一对象之外的对象;
输出所述待处理图像的识别结果,其中,所述识别结果包括:所述第一对象的标注结果和所述第二对象的目标标注结果。
2.根据权利要求1所述的方法,其特征在于,获取接收到的所述待处理图像中包含的第二对象的目标标注结果包括:
获取接收到的目标区域,所述目标区域中包含有所述第二对象;
在所述目标区域被拖动的过程中,利用所述训练好的识别模型对所述目标区域中的第二对象进行识别,得到所述第二对象的标注结果;
基于所述第二对象的标注结果,得到所述第二对象的置信值;
基于所述第二对象的置信值,确定所述第二对象的目标标注结果。
3.根据权利要求1所述的方法,其特征在于,在获取接收到的所述待处理图像中包含的第二对象的目标标注结果之前,所述方法还包括:
获取所述第二对象的子图像;
基于所述第一对象的标注结果和所述第二对象的子图像,生成目标输出信息;
输出所述目标输出信息。
4.根据权利要求3所述的方法,其特征在于,输出所述目标输出信息,包括:
基于所述第一对象的标注结果,确定所述第一对象的显示方式;
按照所述第一对象的显示方式,显示所述第一对象的标注结果,并显示所述第二对象的子图像。
5.根据权利要求4所述的方法,其特征在于,基于所述第一对象的标注结果,确定所述第一对象的显示方式,包括:
基于所述第一对象的标注结果,得到所述第一对象的置信值;
基于所述第一对象的置信值,确定所述第一对象的显示方式。
6.根据权利要求1所述的方法,其特征在于,在所述待处理图像包括多帧图像的情况下,利用训练好的识别模型对所述待处理图像进行图像识别,得到所述待处理图像中包含的第一对象的标注结果,包括:
利用所述训练好的识别模型对每帧图像进行识别,得到每帧图像的识别结果;
基于所述每帧图像的识别结果,确定第三对象在所述多帧图像中的移动路径,其中,所述第三对象为所述多个对象中的任意一个对象;
基于所述移动路径调整所述每帧图像中包含的第三对象的标注结果。
7.根据权利要求6所述的方法,其特征在于,基于所述每帧图像的识别结果,确定第三对象在所述多帧图像中的移动路径,包括:
判断所述每帧图像的识别结果中是否包含所述第三对象的标注结果;
如果第一图像的识别结果中包含所述第三对象的标注结果,则基于所述第三对象在所述第一图像中的位置,确定所述第三对象的移动路径,其中,所述第一图像为所述多帧图像中的至少一帧图像。
8.根据权利要求7所述的方法,其特征在于,如果所述多帧图像的识别结果中均未包含所述第三对象的标注结果,所述方法还包括:
获取所述多帧图像中的第一帧图像和最后一帧图像,得到第一图像;
获取接收到的所述第一图像中所述第三对象的标注结果;
基于所述第三对象在所述第一图像中的位置,确定所述移动路径。
9.根据权利要求8所述的方法,其特征在于,基于所述移动路径调整所述每帧图像中包含的第三对象的标注结果包括:
基于所述第三对象的标注结果,确定第二图像中包含的所述第三对象的标注结果,其中,所述第二图像为所述多帧图像中除所述第一图像之外的图像。
10.根据权利要求1所述的方法,其特征在于,在利用训练好的识别模型对所述待处理图像进行图像识别,得到所述待处理图像中包含的第一对象的标注结果之前,所述方法还包括:
获取多个训练数据,其中,每个训练数据包括:包含有一个对象的图像,以及所述对象的标注结果;
利用所述训练数据对识别模型进行训练,得到所述训练好的识别模型。
11.根据权利要求10所述的方法,其特征在于,在获取接收到的所述待处理图像中包含的第二对象的目标标注结果之后,所述方法还包括:
基于所述第二对象的目标标注结果,生成新的训练数据;
利用所述新的训练数据对所述训练好的识别模型进行训练。
12.一种图像处理方法,其特征在于,包括:
在交互界面上显示待处理图像,其中,所述待处理图像中包含多个对象的三维点云数据;
在所述交互界面上显示所述待处理图像中包含的第一对象的标注结果,其中,利用训练好的识别模型对所述待处理图像进行图像识别,得到所述第一对象的标注结果,所述标注结果用于表征所述第一对象在所述待处理图像中的位置,以及所述第一对象的类型,所述第一对象为所述多个对象中的部分对象;
在所述交互界面上显示接收到的所述待处理图像中包含的第二对象的目标标注结果,其中,所述第二对象为所述多个对象中除所述第一对象之外的对象;
在所述交互界面上展示所述待处理图像的识别结果,其中,所述识别结果包括:所述第一对象的标注结果和所述第二对象的目标标注结果。
13.一种图像处理装置,其特征在于,包括:
第一获取模块,用于获取待处理图像,其中,所述待处理图像中包含多个对象的三维点云数据;
识别模块,用于利用训练好的识别模型对所述待处理图像进行图像识别,得到所述待处理图像中包含的第一对象的标注结果,其中,所述标注结果用于表征所述第一对象在所述待处理图像中的位置,以及所述第一对象的类型,所述第一对象为所述多个对象中的部分对象;
第二获取模块,用于获取接收到的所述待处理图像中包含的第二对象的目标标注结果,其中,所述第二对象为所述多个对象中除所述第一对象之外的对象;
输出模块,用于输出所述待处理图像的识别结果,其中,所述识别结果包括:所述第一对象的标注结果和所述第二对象的目标标注结果。
14.根据权利要求13所述的装置,其特征在于,所述第二获取模块包括:
获取单元,用于获取接收到的目标区域,所述目标区域中包含有所述第二对象;
第一识别单元,用于在所述目标区域被拖动的过程中,利用所述训练好的识别模型对所述目标区域中的第二对象进行识别,得到所述第二对象的标注结果;
处理单元,用于基于所述第二对象的标注结果,得到所述第二对象的置信值;
第一确定单元,用于基于所述第二对象的置信值,确定所述第二对象的目标标注结果。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于获取所述第二对象的子图像;
生成模块,用于基于所述第一对象的标注结果和所述第二对象的子图像,生成目标输出信息;
输出模块,用于输出所述目标输出信息。
16.根据权利要求14所述的装置,其特征在于,在所述待处理图像包括多帧图像的情况下,所述识别模块包括:
第二识别单元,用于利用所述训练好的识别模型对每帧图像进行识别,得到每帧图像的识别结果;
第二确定单元,用于基于所述每帧图像的识别结果,确定第三对象在所述多帧图像中的移动路径,其中,所述第三对象为所述多个对象中的任意一个对象;
调整单元,用于基于所述移动路径调整所述每帧图像中包含的第三对象的标注结果。
17.一种图像处理装置,其特征在于,包括:
第一显示模块,用于在交互界面上显示待处理图像,其中,所述待处理图像中包含多个对象的三维点云数据;
第二显示模块,用于在所述交互界面上显示所述待处理图像中包含的第一对象的标注结果,其中,利用训练好的识别模型对所述待处理图像进行图像识别,得到所述第一对象的标注结果,所述标注结果用于表征所述第一对象在所述待处理图像中的位置,以及所述第一对象的类型,所述第一对象为所述多个对象中的部分对象;
第三显示模块,用于在所述交互界面上显示接收到的所述待处理图像中包含的第二对象的目标标注结果,其中,所述第二对象为所述多个对象中除所述第一对象之外的对象;
第四显示模块,用于在所述交互界面上展示所述待处理图像的识别结果,其中,所述识别结果包括:所述第一对象的标注结果和所述第二对象的目标标注结果。
18.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至11中任意一项所述的图像处理方法。
19.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至11中任意一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010324173.4A CN111429512B (zh) | 2020-04-22 | 2020-04-22 | 图像处理方法和装置、存储介质及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010324173.4A CN111429512B (zh) | 2020-04-22 | 2020-04-22 | 图像处理方法和装置、存储介质及处理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111429512A true CN111429512A (zh) | 2020-07-17 |
CN111429512B CN111429512B (zh) | 2023-08-25 |
Family
ID=71554385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010324173.4A Active CN111429512B (zh) | 2020-04-22 | 2020-04-22 | 图像处理方法和装置、存储介质及处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111429512B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111338742A (zh) * | 2020-05-19 | 2020-06-26 | 北京数字绿土科技有限公司 | 一种点云数据的批处理方法及处理装置 |
CN113343857A (zh) * | 2021-06-09 | 2021-09-03 | 浙江大华技术股份有限公司 | 标注方法、装置、存储介质及电子装置 |
CN114241384A (zh) * | 2021-12-20 | 2022-03-25 | 北京安捷智合科技有限公司 | 连续帧图片标注方法、电子设备及存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041366A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN106707293A (zh) * | 2016-12-01 | 2017-05-24 | 百度在线网络技术(北京)有限公司 | 用于车辆的障碍物识别方法和装置 |
WO2017107533A1 (zh) * | 2015-12-22 | 2017-06-29 | 广州视源电子科技股份有限公司 | 一种电子元件样本标注方法及装置 |
CN107818293A (zh) * | 2016-09-14 | 2018-03-20 | 北京百度网讯科技有限公司 | 用于处理点云数据的方法和装置 |
CN108573268A (zh) * | 2017-03-10 | 2018-09-25 | 北京旷视科技有限公司 | 图像识别方法和装置、图像处理方法和装置及存储介质 |
CN109255044A (zh) * | 2018-08-31 | 2019-01-22 | 江苏大学 | 一种基于YOLOv3深度学习网络的图像智能标注方法 |
US20190026545A1 (en) * | 2015-08-27 | 2019-01-24 | Shenzhen Prtek Co. Ltd. | Method and device for automatically capturing target object, and storage medium |
CN110175255A (zh) * | 2019-05-29 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 图像标注的方法、基于病理图像的标注展示方法及装置 |
CN110288019A (zh) * | 2019-06-21 | 2019-09-27 | 北京百度网讯科技有限公司 | 图像标注方法、装置和存储介质 |
CN110610169A (zh) * | 2019-09-20 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 图片标注方法和装置、存储介质及电子装置 |
CN110728210A (zh) * | 2019-09-25 | 2020-01-24 | 上海交通大学 | 一种三维点云数据的半监督目标标注方法和系统 |
CN110781941A (zh) * | 2019-10-18 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种基于主动学习的人环标注方法及装置 |
EP3614339A1 (en) * | 2018-08-21 | 2020-02-26 | Siemens Ltd. China | Method, apparatus, computer-readable storage media and a computer program for 3d reconstruction |
EP3621036A1 (en) * | 2018-09-07 | 2020-03-11 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for generating three-dimensional data, device, and storage medium |
CN110889463A (zh) * | 2019-12-10 | 2020-03-17 | 北京奇艺世纪科技有限公司 | 一种样本标注方法、装置、服务器及机器可读存储介质 |
CN110909768A (zh) * | 2019-11-04 | 2020-03-24 | 北京地平线机器人技术研发有限公司 | 一种标注数据获取方法及装置 |
-
2020
- 2020-04-22 CN CN202010324173.4A patent/CN111429512B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190026545A1 (en) * | 2015-08-27 | 2019-01-24 | Shenzhen Prtek Co. Ltd. | Method and device for automatically capturing target object, and storage medium |
WO2017041366A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
WO2017107533A1 (zh) * | 2015-12-22 | 2017-06-29 | 广州视源电子科技股份有限公司 | 一种电子元件样本标注方法及装置 |
CN107818293A (zh) * | 2016-09-14 | 2018-03-20 | 北京百度网讯科技有限公司 | 用于处理点云数据的方法和装置 |
CN106707293A (zh) * | 2016-12-01 | 2017-05-24 | 百度在线网络技术(北京)有限公司 | 用于车辆的障碍物识别方法和装置 |
CN108573268A (zh) * | 2017-03-10 | 2018-09-25 | 北京旷视科技有限公司 | 图像识别方法和装置、图像处理方法和装置及存储介质 |
EP3614339A1 (en) * | 2018-08-21 | 2020-02-26 | Siemens Ltd. China | Method, apparatus, computer-readable storage media and a computer program for 3d reconstruction |
CN109255044A (zh) * | 2018-08-31 | 2019-01-22 | 江苏大学 | 一种基于YOLOv3深度学习网络的图像智能标注方法 |
EP3621036A1 (en) * | 2018-09-07 | 2020-03-11 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for generating three-dimensional data, device, and storage medium |
CN110175255A (zh) * | 2019-05-29 | 2019-08-27 | 腾讯科技(深圳)有限公司 | 图像标注的方法、基于病理图像的标注展示方法及装置 |
CN110288019A (zh) * | 2019-06-21 | 2019-09-27 | 北京百度网讯科技有限公司 | 图像标注方法、装置和存储介质 |
CN110610169A (zh) * | 2019-09-20 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 图片标注方法和装置、存储介质及电子装置 |
CN110728210A (zh) * | 2019-09-25 | 2020-01-24 | 上海交通大学 | 一种三维点云数据的半监督目标标注方法和系统 |
CN110781941A (zh) * | 2019-10-18 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种基于主动学习的人环标注方法及装置 |
CN110909768A (zh) * | 2019-11-04 | 2020-03-24 | 北京地平线机器人技术研发有限公司 | 一种标注数据获取方法及装置 |
CN110889463A (zh) * | 2019-12-10 | 2020-03-17 | 北京奇艺世纪科技有限公司 | 一种样本标注方法、装置、服务器及机器可读存储介质 |
Non-Patent Citations (2)
Title |
---|
江文婷;龚小谨;刘济林;: "基于增量计算的大规模场景致密语义地图构建", 浙江大学学报(工学版), no. 02, pages 198 - 204 * |
沈新宁: "基于颜色特征的快速图像检索技术的研究", 中国优秀硕士学位论文全文数据库信息科技辑, no. 1, pages 138 - 773 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111338742A (zh) * | 2020-05-19 | 2020-06-26 | 北京数字绿土科技有限公司 | 一种点云数据的批处理方法及处理装置 |
CN113343857A (zh) * | 2021-06-09 | 2021-09-03 | 浙江大华技术股份有限公司 | 标注方法、装置、存储介质及电子装置 |
CN114241384A (zh) * | 2021-12-20 | 2022-03-25 | 北京安捷智合科技有限公司 | 连续帧图片标注方法、电子设备及存储介质 |
CN114241384B (zh) * | 2021-12-20 | 2024-01-19 | 北京安捷智合科技有限公司 | 连续帧图片标注方法、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111429512B (zh) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107273502B (zh) | 一种基于空间认知学习的图像地理标注方法 | |
CN111767878B (zh) | 嵌入式设备中基于深度学习的交通标志检测方法及系统 | |
CN111429512A (zh) | 图像处理方法和装置、存储介质及处理器 | |
CN112418216B (zh) | 一种复杂自然场景图像中的文字检测方法 | |
CN111461245A (zh) | 一种融合点云和图像的轮式机器人语义建图方法及系统 | |
CN111191570B (zh) | 图像识别方法和装置 | |
CN110390314B (zh) | 一种视觉感知方法及设备 | |
CN111523600A (zh) | 神经网络训练、目标检测、及智能设备控制的方法及装置 | |
CN110288715B (zh) | 虚拟项链试戴方法、装置、电子设备及存储介质 | |
CN111191611A (zh) | 基于深度学习的交通标志标号识别方法 | |
CN110827373B (zh) | 广告图片生成方法、装置以及存储介质 | |
CN113657409A (zh) | 车辆损失检测方法、装置、电子设备及存储介质 | |
CN109544561A (zh) | 细胞标注方法、系统和装置 | |
CN112016545A (zh) | 一种包含文本的图像生成方法及装置 | |
CN112883926A (zh) | 表格类医疗影像的识别方法及装置 | |
CN114519853A (zh) | 一种基于多模态融合的三维目标检测方法及系统 | |
CN112613434A (zh) | 道路目标检测方法、装置及存储介质 | |
CN115393872A (zh) | 一种训练文本分类模型的方法、装置、设备及存储介质 | |
CN115100469A (zh) | 一种基于分割算法的目标属性识别方法、训练方法和装置 | |
CN111563462A (zh) | 图像元素的检测方法及装置 | |
CN115019322A (zh) | 字体检测方法、装置、设备及介质 | |
JP2020149086A (ja) | 学習用データ生成装置、学習用データ生成方法、および学習用データ生成プログラム | |
CN117541546A (zh) | 图像裁剪效果的确定方法和装置、存储介质及电子设备 | |
CN116664873A (zh) | 图像信息处理方法、装置及存储介质 | |
CN115063800B (zh) | 文本识别方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |