CN115248868A - 数据标注方法、装置、设备及计算机可读存储介质 - Google Patents

数据标注方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN115248868A
CN115248868A CN202110546560.7A CN202110546560A CN115248868A CN 115248868 A CN115248868 A CN 115248868A CN 202110546560 A CN202110546560 A CN 202110546560A CN 115248868 A CN115248868 A CN 115248868A
Authority
CN
China
Prior art keywords
data
target
labeling
initial
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110546560.7A
Other languages
English (en)
Inventor
黄超
谢敏
孟泽楠
黄安利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xiantu Intelligent Technology Co Ltd
Original Assignee
Shanghai Xiantu Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xiantu Intelligent Technology Co Ltd filed Critical Shanghai Xiantu Intelligent Technology Co Ltd
Priority to CN202110546560.7A priority Critical patent/CN115248868A/zh
Priority to PCT/CN2022/070512 priority patent/WO2022242199A1/zh
Publication of CN115248868A publication Critical patent/CN115248868A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种数据标注方法,该方法包括:获取待标注的目标环境数据,并基于目标环境数据,生成环境中各个目标物体各自对应的初始标注结果;当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于该选定对象的初始标注结果进行展示,或者,将至少一帧数据中的关于该选定对象的初始标注结果进行自动调整后进行展示,以便标注人员对该展示的初始标注结果进行人工调整,得到该选定对象的目标标注结果。本申请提升了标注速度以及标注结果的准确性。本申请还提供了一种数据标注装置、设备及计算机可读存储介质。

Description

数据标注方法、装置、设备及计算机可读存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种数据标注方法、装置、设备及计算机可读存储介质。
背景技术
目前,在使用激光雷达进行较近距离(比如300米以内)的环境探测技术中,需要通过规则和模型对周围环境进行目标检测和识别,从而为下游其它模块提供更丰富的语义信息。例如,在自动驾驶系统中,感知模块需要通过激光雷达得到三维感知数据,并对这些三维感知数据进行处理,得到丰富的环境语义信息,比如,出现哪些交通参与者、有哪些障碍物影响车辆行驶等信息,通过目标检测方法对这些信息进行处理之后,提供给后续的决策规划模块,进行合理的路线规划、障碍物绕行、停止等待等操作。
为了实现目标检测,需要利用大量真实有效的标注数据进行模型训练、方法评估。在现有的数据标注方案中,是基于三维激光雷达数据,对特定数据在单机上进行单帧逐个标注,但是,这种标注方式都是人工一个个对物体进行标注和调整,标注效率较低(即标注速度较慢),而且,数据标注都是在单机上操作,导致标注结果的准确性较低。
发明内容
有鉴于此,本申请提供了一种数据标注方法、装置、设备及计算机可读存储介质,能够提升标注速度以及标注结果的准确性。
具体地,本申请是通过如下技术方案实现的:
一种数据标注方法,包括:
获取待标注的目标环境数据,并基于所述目标环境数据,生成环境中各个目标物体各自对应的初始标注结果;
当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于所述选定对象的初始标注结果进行展示,或者,将至少一帧数据中的关于所述选定对象的初始标注结果进行自动调整后进行展示,以便所述标注人员对该展示的初始标注结果进行人工调整,得到所述选定对象的目标标注结果;
其中,所述选定对象是所述标注人员从所述各个目标物体中选定的一个目标物体,所述至少一帧数据是所述目标人员在所述目标环境数据中具有标注权限的全部或部分数据,所述目标环境数据中的每一帧数据的标注权限属于至少一个标注人员。
一种数据标注装置,包括:
数据获取单元,用于获取待标注的目标环境数据;
预标注单元,用于基于所述目标环境数据,生成环境中各个目标物体各自对应的初始标注结果;
标注调整单元,用于当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于所述选定对象的初始标注结果进行展示,或者,将至少一帧数据中的关于所述选定对象的初始标注结果进行自动调整后进行展示,以便所述标注人员对该展示的初始标注结果进行人工调整,得到所述选定对象的目标标注结果;
其中,所述选定对象是所述标注人员从所述各个目标物体中选定的一个目标物体,所述至少一帧数据是所述目标人员在所述目标环境数据中具有标注权限的全部或部分数据,所述目标环境数据中的每一帧数据的标注权限属于至少一个标注人员。
一种电子设备,包括:处理器、存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于通过调用所述计算机程序,执行上述数据标注方法。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述数据标注方法。
在以上本申请提供的技术方案中,对于待标注的目标环境数据,可以对目标环境数据进行自动的预标注,以生成环境中各个目标物体各自对应的初始标注结果,提升了标注速度,而且,由于目标环境数据中的每一帧数据的标注权限属于一个或多个标注人员,所以,在通过预标注得到目标环境数据的初始标注结果之后,不同的标注人员均可以通过前端页面,在初始标注结果的基础上进行标注调整,提升了标注结果的准确性。
附图说明
图1为本申请示出的一种数据标注方法的流程示意图;
图2为本申请示出的数据标注系统的组成示意图;
图3为本申请示出的操作浏览器界面示意图;
图4为本申请示出的一种数据标注装置的组成示意图;
图5为本申请示出的一种电子设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
参见图1,为本申请实施例提供的一种数据标注方法的流程示意图,该方法包括以下步骤S101-S102:
S101:获取待标注的目标环境数据,并基于该目标环境数据,生成环境中各个目标物体各自对应的初始标注结果。
在本申请实施例中,目标环境数据中可以包括诸如环境中的车辆、行人、道路、树木等信息,目标环境数据作为待标注数据,其可以是预先收集到的初始环境数据,也可以是对初始环境数据进行预处理后的数据。
实际上,基于预处理后的数据进行数据标注,可以提升标注结果的准确性。在本申请实施例的一种实现方式中,S101中的“获取待标注的目标环境数据”,可以包括步骤A1-A3:
步骤A1:获取预先收集的初始环境数据。
在本实现方式中,可以利用目标车辆(比如自动驾驶车辆)上安装的激光雷达对周围环境进行持续的数据采集,以得到激光雷达的三维点云数据,这里,将该三维点云数据作为初始环境数据。此外,还可以利用目标车辆上安装的摄像头搜集周围的图像数据、以及利用诸如毫米波雷达进行数据采集等等,即,将激光雷达的三维点云数据、摄像头拍摄的图像数据、以及其它数据(比如毫米波雷达数据)等一起进行搜集。
其中,最主要的数据是激光雷达的三维点云数据,可以使用该数据进行数据标注操作;其次是图像数据,可以将其作为辅助数据,在三维点云数据不清晰(即数据比较稀疏)的时候,结合图像数据对环境中的物体进行对比查看,确保标注结果的正确性;最后是其它数据,可以在必要的时候,帮助更准确的进行目标分割和跟踪。
参见图2所示的数据标注系统的组成示意图,图2中的数据搜集模块1用于准备数据标注系统所需要的数据,可以由数据搜集模块1实现对三维点云数据、图像数据、其它数据等的搜集操作。
步骤A2:去除初始环境数据中的错误数据和/或噪音数据,得到中间环境数据。
对搜集到的初始环境数据进行预处理操作,首先进行数据清洗,去除掉初始环境数据中的错误数据和/或噪音数据,确保后续标注是在有效的数据上进行,这里,将清洗后的数据定义为中间环境数据。
步骤A3:将中间环境数据进行格式统一,得到目标环境数据。
在经数据清洗得到中间环境数据后,对中间环境数据进行格式转换,即,将不同格式的中间环境数据转换到相同的预定义格式上,这里,将经格式转换后的数据定义为目标环境数据,这样方便处理不同类型的数据。
此外,如果还搜集了上述的图像数据和/或其它数据,也可以对这些数据进行预处理操作,诸如上述数据清洗和格式转换的操作。
需要说明的是,上述数据清洗和格式转换的操作,可以由图2所示的预处理模块2实现。
接下来,当得到统一格式的目标环境数据后,对目标环境数据进行预标注,预先标注操作在服务后端进行,通过使用算法对目标环境数据进行预先标注,以初步标注出环境中各个物体的物体框以及各个物体对应的类别。其中,在进行预先标注时,可以使用基于规则的逻辑处理、传统的聚类方法或者基于深度学习的目标检测等算法。
在本申请实施例的一种实现方式中,S101中的“基于目标环境数据,生成环境中各个目标物体各自对应的初始标注结果”,可以包括:对目标环境数据进行物体检测和/或聚类处理,以生成环境中各个目标物体各自对应的初始标注结果。其中,在对目标环境数据进行物体检测时,具体可以利用预先训练的目标检测模型,对目标环境数据进行物体检测。
在本实现方式中,可以预先训练一个目标检测模型,通过目标检测算法对目标环境数据进行物体框的预测、并预测物体框中的目标物体对应的物体类别,这里,可以将环境中每一目标物体的物体框和物体类型,作为该目标物体的初始标注结果;此外,还可以通过传统的逻辑规则方式对目标环境数据进行聚类处理,当目标环境数据是三维点云数据时,不限于使用“洪水泛滥”的方式、使用无监督聚类方式等进行点云合并,得到各个目标物体的聚类点云数据。然后,基于上述物体检测和/或聚类处理的结果,得到环境中各个目标物体各自对应的初始标注结果,并将这些初始标注结果通过网络传输给前端的一个或多个标注人员的web页面,供标注人员进行操作。
需要说明的是,通过上述预标注操作得到环境中各个目标物体各自对应的初始标注结果,可以由图2所示的预标注模块3实现。
此外,当得到环境中各个目标物体各自对应的初始标注结果后,可以通过后续步骤S102对其中的一个或多个目标物体的初始标注结果进行人工调整,为便于区分,这里将被调整初始标注结果的目标物体定义为选定对象,当对该选定对象的初始标注结果进行人工调整后,得到该选定对象的目标标注结果。
基于此,本申请实施例还可以包括:利用选定对象的目标标注结果,对目标检测模型进行参数调整。具体来讲,上述内容中提及到,可以利用预先训练的目标检测模型对环境物体进行预标注,得到初始标注结果,在后续操作中,由于标注人员可以对错误的初始标注结果进行调整,并将这些调整后的目标标注结果记录下来,反馈给服务后端的目标检测模型,使得目标检测模型能够利用这些调整后的目标标注结果,对目标检测模型进行迭代再训练,以更新目标检测模型的模型参数,从而使得更新后的目标检测模型的检测结果更为准确。
S102:当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于该选定对象的初始标注结果进行展示,或者,将至少两一数据中的关于该选定对象的初始标注结果进行自动调整后进行展示,以便标注人员对该展示的初始标注结果进行人工调整,得到该选定对象的目标标注结果。
在本申请实施例中,可以有多个标注人员,通过预先设置,目标环境数据中的每一帧数据的标注权限可以属于至少一个标注人员,具体可以通过数据分片的方式来实现。也就是说,可以在通过上述步骤A3进行数据格式统一之后,再将格式统一之后的目标环境数据进行分片(该操作可以由图2所示的预处理模块2实现),在进行数据分片时,可以将时间范围波动很大的不同数据分片到相同小时间范围上,得到多个时间片段上的分片数据,这种数据分片操作,不但方便网络快速传输,还支持多人协作标注(即支持多个标注人员对初始标注结果进行调整、删除等操作)。需要说明的是,本申请实施例不对数据分片的方式进行限定,比如,可以采用重叠分片、重复分片等单一分片方式或组合分片方式;其中,重叠分片是指将某些数据划分给不同的数据分片,以使多个数据分片中包括相同的一些数据,对于每一数据分片,可以将其发送给一个或多个标注人员,而重复分片是指将部分分片数据,重复发给不同的两个或两个以上的标注人员,这样,每一标注人员将具有其所对应数据分片的调整、删除等标注权限,方便后续脚本自动检查多人标注结果是否一致。
因此,对于每一标注人员来讲,该标注人员对目标环境数据中的全部或部分数据的初始标注结果具有标注权限,这样,该标注人员可以在其具有标注权限的目标物体中选择标注调整对象,即,S102中的选定对象则是标注人员从各个目标物体中选定的一个目标物体,标注人员可以对该选定对象的初始标注结果进行人工调整,得到该选定对象的目标标注结果。需要说明的是,这是一种半监督的数据标注方式,即,在通过预标注得到初始标注结果之后,标注人员可以通过前端页面,在这个初始标注结果的基础上进行调整、删除等操作,而不必如现有技术那样完全由标注人员进行标注和调整。
在本申请实施例中,可以由标注人员与初始标注结果进行标注交互(由图2所示的标注交互模块4实现),具体地,标注人员可以通过在web网页端对初始标注结果进行单帧调整,也可以通过相应的连续逻辑规则和跟踪算法进行连续帧的标注,提高标注速度。在标注的同时,可以通过鼠标、键盘的点击、拖拽等操作,实现对目标环境数据的细节查看、初始标注结果(包括物体框、物体类别)的调整等。
其中,可以通过S102进行连续帧标注,即,当后端服务检测到标注人员在前端触发的该对选定对象的初始标注结果的调整请求后,可以将至少一帧数据中的关于该选定对象的初始标注结果进行展示,或者,将至少两一数据中的关于该选定对象的初始标注结果进行自动调整后进行展示,以便标注人员对该展示的初始标注结果进行人工调整。其中,由于该选定对象可能属于全部或部分帧数据,因此,这里的至少一帧数据是目标人员在目标环境数据中具有标注权限的全部或部分数据。
在本申请实施例的一种实现方式中,S102中的“将至少一帧数据中的关于该选定对象的初始标注结果进行自动调整后进行展示”,可以包括:将前一帧数据中的该选定对象的初始标注结果,复制到下一帧数据中;基于复制得到的初始标注结果,对该选定对象在下一帧数据中的初始标注结果进行自动调整;将自动调整后的标注结果进行展示。
在本实现方式中,可以使用最基础的处理方式,将前一帧数据的初始标注结果(比如物体框)直接复制到后一帧数据中,然后,结合后一帧数据的初始标注结果进行自动的细微调整,并将后一帧数据中的细微调整结果展示到web前端,供标注人员进行标注结果调整。这是一种通过连续逻辑规则进行连续帧标注的方式,这种方式可以有效提高标注速度。
在本申请实施例的一种实现方式中,S102中的“将至少一帧数据中的关于该选定对象的初始标注结果进行展示”,可以包括:对该选定对象进行目标跟踪,得到该选定对象在至少一帧数据中的初始标注结果,将得到的初始标注结果进行展示。具体的,在对该选定对象进行目标跟踪时,可以在检测到标注人员对跟踪路径设置的各个关键位置后,采用插值算法拟合出该跟踪路径,得到该跟踪路径上的该选定对象的初始标注结果,其中,该跟踪路径涉及至少一帧数据;或者,关于目标环境数据中的标注人员具有标注权限的数据,直接在该数据中对该选定对象进行目标跟踪,得到该选定对象在至少一帧数据中的初始标注结果。
在本实现方式中,可以使用跟踪算法对连续帧的初始标注结果进行调整,相应的跟踪算法会在标注人员在前端设置路径的关键位置后,利用插值算法在标注人员设置好之后通过拟合的方式对路径进行插值,得到路径上的该选定对象的初始标注结果,然后,标注人员在该结果上进行个别调整即可。另外,也可以通过目标跟踪算法直接在原始的目标环境数据上进行目标跟踪,并给出跟踪得到的该选定对象的初始标注结果,并将跟踪模型处理好的结果呈现给标注人员,由标注人员进行相应的修改和调整。这是一种通过跟踪算法进行连续帧标注的方式,这种方式可以有效提高标注速度。
进一步地,本申请实施例还可以包括:将至少两位标注人员对该选定对象的目标标注结果进行对比,并基于对比结果,确定该选定对象的标注质量。具体来讲,可以对各个标注人员在初始标注结果的基础上进行调整后得到的目标标注结果进行质量检查,确保目标标注结果的准确性(可以由图2所示的质量检查模块实现),其中,一种质量检查方式是通过人工抽检的方式查看标注质量,另一种质量检查方式是通过脚本进行自动化质检,自动化质检主要是基于上述的重叠分片、重复分片等分片数据进行对比检查,对比查看两个或者多个标注人员的目标标注结果,通过异同来分析标注结果的质量,比如,对于某个目标物体的目标标注结果,假设其共对应N个标注人员,如果其中的M个标注人员的标注结果一致,则M/N越大则标注质量越好、反之亦然。
接下来,对前端标注人员的一种操作浏览器界面进行示例性介绍。
参见图3所示的操作浏览器界面示意图,下面对图3所示的各个功能模块进行介绍。
模块31展示的是和目标环境数据时间比较接近时的图像数据(包括前摄像头和/或后摄像头采集的图像数据),作为辅助数据提供给标注人员,用于在目标环境数据比较稀疏的情况下,利用图像数据对环境物体进行对比查看。
模块32为主操作界面,标注人员主要在这里通过鼠标、键盘等进行画框、调整等方式,对标注结果进行调整,同时也可以通过放大、旋转等方式对目标环境数据进行细节查看;以及,在这里通过鼠标配合键盘的方式放置一定时间范围内的关键位置点,后端的算法模块通过插值的方式进行连续标注框(即物体框)的计算和前端展示。
模块33为标注框(即物体框)的列表,在列表中显示标注好的物体id、物体类别等,通过选择调整对象,使得模块32主界面能够切换到对应的标注框,并在模块32中进行标注框的调整、删除等操作。
模块34是在选中对应的标注框之后,显示该标注框所框选物体的鸟瞰图、侧面图(前面和侧面),或者通过鼠标点击切换到另外一个侧面图。
模块35为操作和设置面板,通过在面板中进行对应数据帧的选择,帧的前进、后退等操作,此外,可以在这里选择是否复制前一帧标注框(即物体框)。
在以上本申请提供的数据标注方法中,对于待标注的目标环境数据,可以对目标环境数据进行自动的预标注,以生成环境中各个目标物体各自对应的初始标注结果,提升了标注速度,而且,由于目标环境数据中的每一帧数据的标注权限属于一个或多个标注人员,所以,在通过预标注得到目标环境数据的初始标注结果之后,不同的标注人员均可以通过前端页面,在初始标注结果的基础上进行标注调整,提升了标注结果的准确性。
参见图4,为本申请实施例提供的一种数据标注装置的组成示意图,该装置包括:
数据获取单元410,用于获取待标注的目标环境数据;
预标注单元420,用于基于所述目标环境数据,生成环境中各个目标物体各自对应的初始标注结果;
标注调整单元430,用于当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于所述选定对象的初始标注结果进行展示,或者,将至少一帧数据中的关于所述选定对象的初始标注结果进行自动调整后进行展示,以便所述标注人员对该展示的初始标注结果进行人工调整,得到所述选定对象的目标标注结果;
其中,所述选定对象是所述标注人员从所述各个目标物体中选定的一个目标物体,所述至少一帧数据是所述目标人员在所述目标环境数据中具有标注权限的全部或部分数据,所述目标环境数据中的每一帧数据的标注权限属于至少一个标注人员。
在本申请实施例的一种实现方式中,所述数据获取单元410包括:
数据获取模块,用于获取预先收集的初始环境数据;
数据清洗模块,用于去除所述初始环境数据中的错误数据和/或噪音数据,得到中间环境数据;
格式统一模块,用于将所述中间环境数据进行格式统一,得到目标环境数据。
在本申请实施例的一种实现方式中,所述预标注单元420包括:
预标注模块,用于对所述目标环境数据进行物体检测和/或聚类处理,以生成环境中各个目标物体各自对应的初始标注结果。
在本申请实施例的一种实现方式中,所述预标注模块在对所述目标环境数据进行物体检测时,具体用于:
利用预先训练的目标检测模型,对所述目标环境数据进行物体检测。
在本申请实施例的一种实现方式中,所述装置还包括:
参数更新单元,用于利用所述选定对象的目标标注结果,对所述目标检测模型进行参数调整。
在本申请实施例的一种实现方式中,所述标注调整单元430包括:
目标跟踪模块,用于对所述选定对象进行目标跟踪,得到所述选定对象在至少一帧数据中的初始标注结果;
第一展示模块,用于将得到的初始标注结果进行展示。
在本申请实施例的一种实现方式中,所述目标跟踪模块,具体用于:
在检测到所述标注人员对跟踪路径设置的各个关键位置后,采用插值算法拟合出所述跟踪路径,得到所述跟踪路径上的所述选定对象的初始标注结果,其中,所述跟踪路径涉及至少一帧数据;
或者,关于所述目标环境数据中的所述标注人员具有标注权限的数据,直接在该数据中对所述选定对象进行目标跟踪,得到所述选定对象在至少一帧数据中的初始标注结果。
在本申请实施例的一种实现方式中,所述标注调整单元430包括:
标注复制模块,用于将前一帧数据中的所述选定对象的初始标注结果,复制到下一帧数据中;
自动调整模块,用于基于复制得到的初始标注结果,对所述选定对象在下一帧数据中的初始标注结果进行自动调整;
第二展示模块,用于将自动调整后的标注结果进行展示。
在本申请实施例的一种实现方式中,所述装置还包括:
质量检查单元,用于将至少两位标注人员对所述选定对象的目标标注结果进行对比,基于对比结果,确定所述选定对象的标注质量。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请实施例还提供了一种电子设备,该电子设备的结构示意图如图5所示,该电子设备5000包括至少一个处理器5001、存储器5002和总线5003,至少一个处理器5001均与存储器5002电连接;存储器5002被配置用于存储有至少一个计算机可执行指令,处理器5001被配置用于执行该至少一个计算机可执行指令,从而执行如本申请中任意一个实施例或任意一种可选实施方式提供的任意一种数据标注方法的步骤。
进一步,处理器5001可以是FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其它具有逻辑处理能力的器件,如MCU(Microcontroller Unit,微控制单元)、CPU(Central Process Unit,中央处理器)。
应用本申请实施例,对于待标注的目标环境数据,可以对目标环境数据进行自动的预标注,以生成环境中各个目标物体各自对应的初始标注结果,提升了标注速度,而且,由于目标环境数据中的每一帧数据的标注权限属于一个或多个标注人员,所以,在通过预标注得到目标环境数据的初始标注结果之后,不同的标注人员均可以通过前端页面,在初始标注结果的基础上进行标注调整,提升了标注结果的准确性。
本申请实施例还提供了另一种计算机可读存储介质,存储有计算机程序,该计算机程序用于被处理器执行时实现本申请中任意一个实施例或任意一种可选实施方式提供的任意一种数据标注方法的步骤。
本申请实施例提供的计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(RandomAccess Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
应用本申请实施例,对于待标注的目标环境数据,可以对目标环境数据进行自动的预标注,以生成环境中各个目标物体各自对应的初始标注结果,提升了标注速度,而且,由于目标环境数据中的每一帧数据的标注权限属于一个或多个标注人员,所以,在通过预标注得到目标环境数据的初始标注结果之后,不同的标注人员均可以通过前端页面,在初始标注结果的基础上进行标注调整,提升了标注结果的准确性。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (12)

1.一种数据标注方法,其特征在于,包括:
获取待标注的目标环境数据,并基于所述目标环境数据,生成环境中各个目标物体各自对应的初始标注结果;
当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于所述选定对象的初始标注结果进行展示,或者,将至少一帧数据中的关于所述选定对象的初始标注结果进行自动调整后进行展示,以便所述标注人员对该展示的初始标注结果进行人工调整,得到所述选定对象的目标标注结果;
其中,所述选定对象是所述标注人员从所述各个目标物体中选定的一个目标物体,所述至少一帧数据是所述目标人员在所述目标环境数据中具有标注权限的全部或部分数据,所述目标环境数据中的每一帧数据的标注权限属于至少一个标注人员。
2.根据权利要求1所述的方法,其特征在于,所述获取待标注的目标环境数据,包括:
获取预先收集的初始环境数据;
去除所述初始环境数据中的错误数据和/或噪音数据,得到中间环境数据;
将所述中间环境数据进行格式统一,得到目标环境数据。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标环境数据,生成环境中各个目标物体各自对应的初始标注结果,包括:
对所述目标环境数据进行物体检测和/或聚类处理,以生成环境中各个目标物体各自对应的初始标注结果。
4.根据权利要求3所述的方法,其特征在于,所述对所述目标环境数据进行物体检测,包括:
利用预先训练的目标检测模型,对所述目标环境数据进行物体检测。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
利用所述选定对象的目标标注结果,对所述目标检测模型进行参数调整。
6.根据权利要求1所述的方法,其特征在于,所述将至少一帧数据中的关于所述选定对象的初始标注结果进行展示,包括:
对所述选定对象进行目标跟踪,得到所述选定对象在至少一帧数据中的初始标注结果;
将得到的初始标注结果进行展示。
7.根据权利要求6所述的方法,其特征在于,所述对所述选定对象进行目标跟踪,得到所述选定对象在至少一帧数据中的初始标注结果,包括:
在检测到所述标注人员对跟踪路径设置的各个关键位置后,采用插值算法拟合出所述跟踪路径,得到所述跟踪路径上的所述选定对象的初始标注结果,其中,所述跟踪路径涉及至少一帧数据;
或者,关于所述目标环境数据中的所述标注人员具有标注权限的数据,直接在该数据中对所述选定对象进行目标跟踪,得到所述选定对象在至少一帧数据中的初始标注结果。
8.根据权利要求1所述的方法,其特征在于,所述将至少一帧数据中的关于所述选定对象的初始标注结果进行自动调整后进行展示,包括:
将前一帧数据中的所述选定对象的初始标注结果,复制到下一帧数据中;
基于复制得到的初始标注结果,对所述选定对象在下一帧数据中的初始标注结果进行自动调整;
将自动调整后的标注结果进行展示。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
将至少两位标注人员对所述选定对象的目标标注结果进行对比;
基于对比结果,确定所述选定对象的标注质量。
10.一种数据标注装置,其特征在于,包括:
数据获取单元,用于获取待标注的目标环境数据;
预标注单元,用于基于所述目标环境数据,生成环境中各个目标物体各自对应的初始标注结果;
标注调整单元,用于当检测到标注人员触发的对选定对象的初始标注结果的调整请求后,将至少一帧数据中的关于所述选定对象的初始标注结果进行展示,或者,将至少一帧数据中的关于所述选定对象的初始标注结果进行自动调整后进行展示,以便所述标注人员对该展示的初始标注结果进行人工调整,得到所述选定对象的目标标注结果;
其中,所述选定对象是所述标注人员从所述各个目标物体中选定的一个目标物体,所述至少一帧数据是所述目标人员在所述目标环境数据中具有标注权限的全部或部分数据,所述目标环境数据中的每一帧数据的标注权限属于至少一个标注人员。
11.一种电子设备,其特征在于,包括:处理器、存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于通过调用所述计算机程序,执行如权利要求1-9中任一项所述的数据标注方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-9任一项所述的数据标注方法。
CN202110546560.7A 2021-05-19 2021-05-19 数据标注方法、装置、设备及计算机可读存储介质 Pending CN115248868A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110546560.7A CN115248868A (zh) 2021-05-19 2021-05-19 数据标注方法、装置、设备及计算机可读存储介质
PCT/CN2022/070512 WO2022242199A1 (zh) 2021-05-19 2022-01-06 数据标注

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110546560.7A CN115248868A (zh) 2021-05-19 2021-05-19 数据标注方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN115248868A true CN115248868A (zh) 2022-10-28

Family

ID=83697026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110546560.7A Pending CN115248868A (zh) 2021-05-19 2021-05-19 数据标注方法、装置、设备及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN115248868A (zh)
WO (1) WO2022242199A1 (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296750B1 (en) * 2014-09-10 2019-05-21 Amazon Technologies, Inc. Robust data tagging
GB201804082D0 (en) * 2018-03-14 2018-04-25 Five Ai Ltd Image annotation
CN109816019A (zh) * 2019-01-25 2019-05-28 上海小萌科技有限公司 一种图像数据自动化辅助标注方法
CN110740231A (zh) * 2019-09-27 2020-01-31 浙江省北大信息技术高等研究院 视频数据标注方法、装置、电子设备及介质
CN112348122A (zh) * 2020-12-03 2021-02-09 苏州挚途科技有限公司 可行驶区域的标注方法、装置和电子设备

Also Published As

Publication number Publication date
WO2022242199A1 (zh) 2022-11-24

Similar Documents

Publication Publication Date Title
US20210182611A1 (en) Training data acquisition method and device, server and storage medium
CN108776772B (zh) 一种跨时间建筑物变化检测建模方法以及检测装置、方法及存储介质
US8447112B2 (en) Method for automatic license plate recognition using adaptive feature set
CA3122346C (en) Crowdsourced on-demand ai data annotation, collection and processing
JP2021510861A (ja) 魚の現在量、形状、及びサイズの決定
CN108319907A (zh) 一种车辆识别方法、装置和存储介质
CN107274402A (zh) 一种基于胸部ct影像的肺结节自动检测方法及系统
Yan et al. A low-cost video-based pavement distress screening system for low-volume roads
Li et al. Street tree segmentation from mobile laser scanning data
CN111027600B (zh) 图像类别预测方法和装置
CN110738247A (zh) 一种基于选择性稀疏采样的细粒度图像分类方法
CN110869942B (zh) 自馈深度学习方法和系统
CN110569856A (zh) 样本标注方法及装置、损伤类别的识别方法及装置
CN114730486B (zh) 用于生成用于对象检测的训练数据的方法和系统
WO2022156553A1 (zh) 呈现道路信息的方法和装置
CN115830416A (zh) 一种用于高速公路设备设施识别与预警的方法及系统
CN110298302A (zh) 一种人体目标检测方法及相关设备
CN115248868A (zh) 数据标注方法、装置、设备及计算机可读存储介质
CN116935134A (zh) 一种点云数据的标注方法、系统、终端及存储介质
CN114981615A (zh) 用于对道路运输路线进行计算机实现的分析的方法和装置
Stetsenko et al. Traffic lane congestion ratio evaluation by video data
JP2020149086A (ja) 学習用データ生成装置、学習用データ生成方法、および学習用データ生成プログラム
CN117441166A (zh) 用于训练分类器的方法和用于对块进行分类的系统
Shameli et al. Computer vision-based generating and updating of the public transit bus stop inventories
CN114999183B (zh) 一种交通路口车流量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination