CN110458226A - 图像标注方法及装置、电子设备和存储介质 - Google Patents
图像标注方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN110458226A CN110458226A CN201910730771.9A CN201910730771A CN110458226A CN 110458226 A CN110458226 A CN 110458226A CN 201910730771 A CN201910730771 A CN 201910730771A CN 110458226 A CN110458226 A CN 110458226A
- Authority
- CN
- China
- Prior art keywords
- image
- target object
- marked
- neural network
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/584—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of vehicle lights or traffic lights
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/588—Recognition of the road, e.g. of lane markings; Recognition of the vehicle driving pattern in relation to the road
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本公开涉及一种图像标注方法及装置、电子设备和存储介质,所述方法包括:对采集到的至少一组待标注图像分别进行识别,确定至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,至少两个图像中目标对象的指示状态不同;根据目标对象所在的图像区域,分别确定至少一组待标注图像的标注信息。本公开实施例可实现图像的高效自动标注。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种图像标注方法及装置、电子设备和存储介质。
背景技术
样本数据是使用机器学习方法进行图像识别的基础,一般需要提供大量的样本数据用于训练机器学习模型。然而,用于训练的样本数据一般需要进行标注,对于图像数据的标注多为人工标注,需要较长的时间和较高的成本。
发明内容
本公开提出了一种图像标注技术方案。
根据本公开的一方面,提供了一种图像标注方法,包括:对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,所述至少两个图像中目标对象的指示状态不同;根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息。
在一种可能的实现方式中,所述方法还包括:从所述至少一组待标注图像中确定出至少一个样本图像,每个样本图像具有对应的标注信息,其中,所述至少一个样本图像用于训练神经网络,所述神经网络用于识别图像中的对象。通过这种方式,能够从至少一组待标注图像中确定出样本图像,得到训练样本以训练神经网络,从而降低样本的标注成本。
在一种可能的实现方式中,所述对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,包括:对一组待标注图像中的至少两个第一图像进行差异识别,确定所述至少两个第一图像之间的差异信息,所述差异信息包括颜色差异及亮度差异中的至少一种;根据所述差异信息,确定所述至少两个第一图像中目标对象所在的图像区域。通过这种方式,可根据图像之间的差异信息确定目标对象所在的图像区域,提高对象区域识别的准确性,从而提高标注质量。
在一种可能的实现方式中,所述方法还包括:根据目标对象所在的图像区域的区域特征,确定所述目标对象的类别。通过这种方式,可根据区域特征直接确定目标对象的类别,从而简单快速地实现对象的类别识别。
在一种可能的实现方式中,根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息,包括:根据目标对象所在的图像区域和/或所述目标对象的类别,分别确定所述至少一组待标注图像的标注信息。通过这种方式,可使得对样本图像自动标注的内容更加丰富,以便更好地训练神经网络。
在一种可能的实现方式中,所述方法还包括:控制图像采集设备分别采集多个目标区域的第二图像,每个目标区域采集多个所述第二图像,每个目标区域的多个所述第二图像中包括不同指示状态的目标对象;根据各个目标区域的第二图像,分别确定各组待标注图像;其中,所述图像采集设备的采集方式包括动态采集和静态采集中的至少一种。通过这种方式,可采集到各目标区域的不同指示状态的图像,进而分别确定各组待标注图像,以便在后续处理中更容易地识别出图像中待标注的对象区域,提高标注质量。
在一种可能的实现方式中,所述方法还包括:在图像采集设备采集图像期间,控制目标对象的指示状态按预设规律进行变化,以使采集到的图像中所述目标对象的指示状态不同。通过这种方式,可使得图像采集设备更便利地采集到指示状态不同的待标注图像,以便后续处理。
在一种可能的实现方式中,每个待标注图像中的目标对象上具有指示标识,用于指示所述目标对象的指示状态,其中,所述指示标识位于所述目标对象的轮廓线、中心线及边缘线中的至少一处。通过这种方式,能够根据指示标识的指示状态确定目标对象的图像区域。
在一种可能的实现方式中,所述方法用于对交通模拟沙盘进行图像标注,所述目标对象包括所述交通模拟沙盘中的交通标志物,从而实现交通模拟沙盘中交通标志物的自动标注。
根据本公开的另一方面,提供了一种神经网络训练方法,包括:根据预设的训练集训练神经网络,所述神经网络用于识别图像中的对象,其中,所述训练集中包括根据上述图像标注方法标注得到的至少一个样本图像,每个样本图像具有对应的标注信息。通过这种方式,能够得到满足使用需求的神经网络。
根据本公开的另一方面,提供了一种图像处理方法,包括:将待处理图像输入神经网络中进行对象识别处理,确定所述待处理图像的目标对象,其中,所述神经网络包括根据上述神经网络训练方法训练得到的神经网络。通过这种方式,能够实现对图像中对象的识别。
根据本公开的另一方面,提供了一种交通模拟沙盘装置,包括:沙盘主体;交通标志物,设置在所述沙盘主体上;指示标识,设置在所述交通标志物的轮廓线、中心线及边缘线中的至少一处,其中,通过上述图像标注方法对所述装置进行图像标注。该装置能够实现交通场景的模拟,通过对该装置中的交通标志物进行自动标注,能够为应用于无人驾驶等使用场景的识别网络提供标注数据,降低图像标注的人工成本,提高标注质量和效率。
在一种可能的实现方式中,所述装置还包括:电子设备,所述电子设备用于实现上述图像标注方法、上述神经网络训练方法,以及上述图像处理方法中的至少一种。通过这种方式,能够对交通模拟沙盘装置中的交通标志物进行自动标注、通过标注数据训练对应的神经网络、部署已训练的网络实现图像识别,从而实现无人驾驶等各类识别任务。
根据本公开的另一方面,提供了一种图像标注装置,包括:图像识别模块,用于对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,所述至少两个图像中目标对象的指示状态不同;信息确定模块,用于根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息。
在一种可能的实现方式中,所述装置还包括:样本确定模块,用于从所述至少一组待标注图像中确定出至少一个样本图像,每个样本图像具有对应的标注信息,其中,所述至少一个样本图像用于训练神经网络,所述神经网络用于识别图像中的对象。
在一种可能的实现方式中,所述图像识别模块包括:差异确定子模块,用于对一组待标注图像中的至少两个第一图像进行差异识别,确定所述至少两个第一图像之间的差异信息,所述差异信息包括颜色差异及亮度差异中的至少一种;区域确定子模块,用于根据所述差异信息,确定所述至少两个第一图像中目标对象所在的图像区域。
在一种可能的实现方式中,所述装置还包括:类别确定模块,用于根据目标对象所在的图像区域的区域特征,确定所述目标对象的类别。
在一种可能的实现方式中,所述信息确定模块包括:信息确定子模块,用于根据目标对象所在的图像区域和/或所述目标对象的类别,分别确定所述至少一组待标注图像的标注信息。
在一种可能的实现方式中,所述装置还包括:图像采集模块,用于控制图像采集设备分别采集多个目标区域的第二图像,每个目标区域采集多个所述第二图像,每个目标区域的多个所述第二图像中包括不同指示状态的目标对象;图像确定模块,用于根据各个目标区域的第二图像,分别确定各组待标注图像;其中,所述图像采集设备的采集方式包括动态采集和静态采集中的至少一种。
在一种可能的实现方式中,所述装置还包括:状态控制模块,用于在图像采集设备采集图像期间,控制目标对象的指示状态按预设规律进行变化,以使采集到的图像中所述目标对象的指示状态不同。
在一种可能的实现方式中,每个待标注图像中的目标对象上具有指示标识,用于指示所述目标对象的指示状态,其中,所述指示标识位于所述目标对象的轮廓线、中心线及边缘线中的至少一处。
在一种可能的实现方式中,所述装置用于对交通模拟沙盘进行图像标注,所述目标对象包括所述交通模拟沙盘中的交通标志物。
根据本公开的另一方面,提供了一种神经网络训练装置,包括:训练模块,用于根据预设的训练集训练神经网络,所述神经网络用于识别图像中的对象,其中,所述训练集中包括根据上述图像标注装置标注得到的至少一个样本图像,每个样本图像具有对应的标注信息。
根据本公开的另一方面,提供了一种图像处理装置,包括:图像处理模块,用于将待处理图像输入神经网络中进行对象识别处理,确定所述待处理图像的目标对象,其中,所述神经网络包括根据上述神经网络训练装置训练得到的神经网络。
根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。
根据本公开的实施例,能够对各组待标注图像中具有不同指示状态的至少两个图像进行识别,确定各组待标注图像中目标对象所在的图像区域;根据图像区域确定各组待标注图像的标注信息。根据本公开的实施例,能够通过比较至少两个图像中目标对象的指示状态自动识别定位目标对象,方便快速地自动标注出图像中的目标对象,不需要人工一个一个进行标注,从而降低图像标注的人工成本,同时有助于提高标注质量和效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1示出根据本公开实施例的图像标注方法的流程图。
图2a和图2b示出根据本公开实施例的第一图像的示意图。
图3示出根据本公开实施例的一种图像标注方法的应用示例的流程图。
图4a和图4b示出根据本公开实施例的第二图像的示意图。
图5示出根据本公开实施例的一种图像标注方法的应用示例的流程图。
图6示出根据本公开实施例的第二图像的示意图。
图7a和图7b示出根据本公开实施例的沙盘图像采集的示意图。
图8示出根据本公开实施例的图像标注装置的框图。
图9示出根据本公开实施例的一种电子设备的框图。
图10示出根据本公开实施例的一种电子设备的框图。
具体实施方式
以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
图1示出根据本公开实施例的图像标注方法的流程图,如图1所示,该图像标注方法包括:
在步骤S11中,对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,所述至少两个图像中目标对象的指示状态不同。
在步骤S12中,根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息。
根据本公开实施例的图像标注方法可以由终端设备或服务器等电子设备执行,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备、带图像采集设备的机器小车等,所述方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可通过服务器执行所述方法。
举例来说,可将具有待标注的目标对象(例如人脸、动物、车辆、道路标志等)的区域确定为目标区域,通过图像采集设备(例如摄像头)采集目标区域的图像(例如视频帧)。可以分别在多个目标区域采集图像,在每个目标区域采集多张图像,并将同一目标区域的多张图像作为一组,从而得到各个目标区域的至少一组待标注图像,也即一组或两组以上的待标注图像。本公开对图像中待标注的目标对象的具体类型不作限定。
在一种可能的实现方式中,每组待标注图像包括至少两个图像(也即,两个或多个图像),所述至少两个图像中目标对象的指示状态不同,以便于在后续处理中对目标对象进行识别。其中,目标对象的指示状态可以由目标对象自身产生,也可以由借助目标对象之外的工具产生其指示状态,例如荧光带、LED灯带等,本公开对此不作限定。可通过目标对象自身或目标对象之外的工具的外观差异(例如颜色差异、亮度差异等)来表示目标对象的不同的指示状态。
在一种可能的实现方式中,可在采集完所有的待标注图像后,对采集到的至少一组待标注图像进行识别,也即先采集后识别;也可在采集到至少一组待标注图像后,对采集到的待标注图像进行识别,也即边采集边识别。本公开对具体的操作方式不作限定。
在一种可能的实现方式中,可在步骤S11中对采集到的至少一组待标注图像分别进行识别,确定各组待标注图像中目标对象所在的图像区域。针对任意一组待标注图像,可根据该组待标注图像的至少两个图像中,目标对象所在的图像区域在不同指示状态下的外观差异进行确定。例如,在至少两个图像中目标对象的不同指示状态出现在相同(或近似相同)的区域,则可以确认该区域为目标对象所在的图像区域。
例如,一个待标注图像中,目标对象的指示状态为红色发光状态;在另一个待标注图像中,目标对象的指示状态为绿色发光状态,而两个待标注图像中红色发光状态出现的区域与绿色发光状态出现在相同(或近似相同)的区域,则可以确认该区域为目标对象所在的图像区域。再例如,一个待标注图像中,目标对象的指示状态为高亮度状态;在另一个待标注图像中,目标对象的指示状态为低亮度状态,而两个待标注图像中高亮度状态出现的区域与低亮度状态出现在相同(或近似相同)的区域,则可以确认该区域为目标对象所在的图像区域。本公开对目标对象所在的图像区域的具体判断方式不作限制。
在一种可能的实现方式中,在确定目标对象所在的图像区域后,可在步骤S12中分别确定至少一组待标注图像的标注信息。其中,标注信息可以用于标记待标注图像中目标对象所在的图像区域。标注信息可包括目标对象所在图像区域的位置信息,例如与图像区域对应的矩形框在待标注图像中的像素位置(例如矩形框的至少两个相对的顶点的像素位置坐标),标注信息也可以为使用其它能够描述目标对象所在的图像区域的方式,本公开对此不作限定。该标注信息还可以包括目标对象的类型,例如交通标志物(如路牌)的类型。本公开对标注信息的具体内容不作限制。
根据本公开的实施例,能够对各组待标注图像中具有不同指示状态的至少两个图像进行识别,确定各组待标注图像中目标对象所在的图像区域;根据图像区域确定各组待标注图像的标注信息。根据本公开的实施例,能够通过比较至少两个图像中目标对象的指示状态自动识别定位目标对象,方便快速地自动标注出图像中的目标对象,不需要人工一个一个进行标注,从而降低图像标注的人工成本,同时有助于提高标注质量和效率。
在一种可能的实现方式中,根据本公开实施例的图像标注方法还可包括:从至少一组待标注图像中确定出至少一个样本图像,每个样本图像具有对应的标注信息。其中,所述至少一个样本图像可以用于训练神经网络,训练出的神经网络可以用于识别图像中的对象。
举例来说,从每组待标注图像中选择目标对象的指示状态满足条件(例如指示状态为低亮度状态)的一个或多个图像,和/或选择满足清晰度条件的一个或多个图像,将选中的图像作为样本图像,从而可从至少一组待标注图像中确定出至少一个样本图像。其中,每个样本图像具有对应的标注信息,例如目标对象所在的图像区域的位置。本公开对样本图像的具体选择条件不作限定。
在一种可能的实现方式中,上述步骤中确定出的样本图像可用于训练神经网络。也即,可通过将样本图像以及对应的标注信息作为训练样本加入训练集,并根据该训练集来训练神经网络。
在一种可能的实现方式中,该神经网络可以用于识别图像中的对象。其中,该神经网络可例如为CNN(Convolutional Neural Networks,卷积神经网络)、DNN((Deep NeuralNetworks,深度神经网络)等,本领域技术人员可以根据实际需要进行选择,本公开对此不作限定。
通过这种方式,能够从至少一组待标注图像中确定出样本图像,得到大量的训练样本以训练神经网络,从而降低样本的标注成本。
在一种可能的实现方式中,步骤S11包括:对一组待标注图像中的至少两个第一图像进行差异识别,确定至少两个第一图像之间的差异信息,差异信息包括颜色差异及亮度差异中的至少一种;根据差异信息,确定至少两个第一图像中目标对象所在的图像区域。
举例来说,至少两个第一图像可以是对同一区域(或近似同一区域)同一目标对象进行至少两次采集的图像,由于目标对象的指示状态不同,导致至少两个第一图像之间产生差异信息,通过识别这些差异信息,进而识别出目标对象所在的图像区域。
在一种可能的实现方式中,至少两个第一图像之间的差异信息,可以为目标对象的颜色不同,或者为目标对象的亮度不同,可以根据实际需要选择合适的差异信息,本公开对此不作限定。
在一种可能的实现方式中,第一图像中的目标对象的数量可以为多个,第一图像中不同目标对象的指示状态可以相同。例如,在一个第一图像中,多个目标对象可以均使用红色作为其指示状态,在另一个第一图像中,多个目标对象可以均使用绿色作为其指示状态。
在一种可能的实现方式中,第一图像中的目标对象的数量可以为多个,第一图像中不同目标对象的指示状态可以不同。例如,在一个第一图像中具有第一目标对象和第二目标对象,第一目标对象使用红色虚线作为其指示状态,第二目标对象使用绿色实线作为其指示状态。在另一个第一图像中,第一目标对象使用黄色虚线作为其指示状态,第二目标对象使用蓝色实线作为其指示状态。由此,可以利用不同颜色或颜色组合识别不同目标对象,从而可以识别出目标对象的类型。
在一种可能的实现方式中,根据差异信息,确定至少两个第一图像中目标对象所在的图像区域可以为对至少两个第一图像中相同位置的像素信息(例如该像素的颜色、饱和度、亮度等)进行比较,将像素信息不同的位置确定为至少两个第一图像中目标对象所在的图像区域。
图2a和图2b示出根据本公开实施例的第一图像的示意图。图2a示出的为根据本公开实施例的一种第一图像的示意图,图2b示出的为根据本公开实施例的另一种第一图像的示意图。图2a和图2b中的一组待标注图像包括第一图像10a和第一图像10b。图2a中的第一图像10a包括目标对象11和背景12,目标对象11在图2a中为第一指示状态。图2b中的第一图像10b包括目标对象11和背景12,目标对象11在图2b中为第二指示状态。
举例来说,背景12是指在此图像中可以不进行标注的内容,在图2a和图2b中,背景12的内容为可理解为其中示出的树状图形,但是背景12还可以为电线杆、房屋等,背景12用于描述目标对象11之外的图像内容,可以根据实际应用进行理解,本公开对此不作限定。应该理解,根据实际需求不同,背景12中的内容也有可能需要进行标注,或者对背景12中的内容的标注不需要利用指示状态示出其在图像中的位置。
如图2a和图2b所示,目标对象11在图2a中的第一指示状态和目标对象11在图2b中的第二指示状态不同,因此第一图像10a和第一图像10b之间形成差异信息,在机器识别过程中,根据此差异信息所在的位置,可以确定目标对象11所在的图像区域。
对于差异信息的识别方法,可以是对第一图像10a和第一图像10b相同位置区域的像素信息(例如该像素的颜色、饱和度、亮度等)进行比较,如果某一位置区域的超过预设数量的像素的像素信息不同或像素信息差异超过误差范围(如相机色差范围),则可以认为此位置区域为差异信息所在的位置区域。也可以是,如果第一图像10a和第一图像10b的某一相同区域内存在像素信息不同的多个像素,则认为此区域为差异信息所在的区域。
另外,由于背景12在图2a和图2b中未发生明显变化,所以背景12的位置不会被识别。
在一种可能的实现方式中,第一指示状态为红色,第二指示状态为绿色,第一指示状态和第二指示状态的颜色不同,从而形成差异信息。
在一种可能的实现方式中,第一种指示状态为目标对象11通电时的发光高亮状态,第二指示状态为目标对象11断电时的未发光状态,第一指示状态和第二指示状态的亮度不同,从而形成差异信息。
在一种可能的实现方式中,第一指示状态和第二指示状态也可以为上述状态之外的其它状态,例如指示状态中图案不同、线条样式不同等,指示状态的具体内容可以根据实际需要进行选择,本公开对此不作限定。
通过这种方式,可根据图像之间的差异信息确定目标对象所在的图像区域,提高对象区域识别的准确性,从而提高标注质量。
在一种可能的实现方式中,第一图像的数量并不限于两个,也可以为三个或更多个,此处为了便于理解,因此仅以两个第一图像进行举例说明。
在一种可能的实现方式中,可以从同一位置进行多次图像采集,或者从不同位置进行图像采集,第一图像的采集方式可以根据实际需要进行选择,本公开对此不作限定。
在一种可能的实现方式中,在步骤S11之前,根据本公开实施例的图像标注方法还可包括:控制图像采集设备分别采集多个目标区域的第二图像,每个目标区域采集多个所述第二图像,每个目标区域的多个所述第二图像中包括不同指示状态的目标对象;根据各个目标区域的第二图像,分别确定各组待标注图像;其中,所述图像采集设备的采集方式包括动态采集和静态采集中的至少一种。
举例来说,目标区域可以是具有期望识别的目标对象所在的区域。图像采集设备可以是摄像头、相机等,也可以是具有摄像头等图像采集装置的设备(如带摄像头的小车)等,可以根据实际需要选择合适的图像采集设备,本公开对此不作限定。
在一种可能的实现方式中,对第二图像的采集方式可以为静态采集。例如,图像采集设备在拍摄图片过程中保持静止,每采集完一组待标注图像后,改变其位置。静态采集可以用于图像采集设备难以在其中移动的场景,或者通过图像采集设备自行移动难以到达的位置,或需要的待标注图像数量较少等情况下。
在一种可能的实现方式中,对第二图像的采集方式还可以为动态采集。例如,控制图像采集设备缓慢移动,图像采集设备以固定频率采集图像。在该情况下,同一目标对象在相邻的至少两帧图像中的位置近似相同,可将相邻的至少两帧图像作为一组待标注图像。动态采集可以用于图像采集设备能够放置在移动物体(例如车辆)上移动或自主移动、需要的待标注图像数量要求较多的情况。本公开对具体的采集方式不作限定。
通过这种方式,可采集到各目标区域的不同指示状态的图像,进而分别确定各组待标注图像,以便在后续处理中更容易地识别出图像中待标注的对象区域,提高标注质量。
在一种可能的实现方式中,根据本公开实施例的图像标注方法还可包括:在图像采集设备采集图像期间,可以控制目标对象的指示状态按预设规律进行变化,以使采集到的图像中所述目标对象的指示状态不同。
在一种可能的实现方式中,预设规律可以指预先设定的指示状态的变化规则,例如变化的时间间隔、每次变化对应的指示状态等。如果目标对象的指示状态为亮度的不同,则可以控制目标对象在高亮与黯淡的指示状态间按预设时间间隔进行变化。又如,如果目标对象的指示状态为颜色的不同,则可以控制目标对象在红色与绿色的指示状态间按预设的时间间隔进行变化。如果目标对象的指示状态为多个,例如包括红色高亮、红色黯淡、绿色高亮及绿色黯淡的指示状态,则可控制目标对象在上述四个指示状态间按预设的时间间隔(如0.1秒)和/或按预设变化顺序(如红色高亮-红色黯淡-绿色高亮-绿色黯淡的顺序)进行变化。本公开对指示状态的具体变化方式不作限制。
通过这种方式,可使得图像采集设备更便利地采集到指示状态不同的待标注图像,以便后续处理。
在一种可能的实现方式中,每个待标注图像中的目标对象上具有指示标识(如示廓灯带),用于指示所述目标对象的指示状态,其中,指示标识位于目标对象的轮廓线、中心线及边缘线中的至少一处。
在一种可能的实现方式中,指示标识可设置在目标对象的轮廓线上,也即,可围绕目标对象的轮廓线设置。在目标对象的轮廓(边缘)为封闭的曲线形状(例如方形或圆形的交通标识等)的情况下,指示标识围绕目标对象的轮廓线设置,可反映出目标对象的形状,指示标识较为方便且易于搭建。
在一种可能的实现方式中,指示标识可设置在目标对象的中心线和/或边缘线上。在目标对象的轮廓(边缘)为较复杂的形状(非封闭的曲线形状,例如为具有中心线和边缘线道路等)的情况下,指示标识可沿目标对象的中心线和/或边缘线设置,以便反映出目标对象的形状,增加标注的准确度。应当理解,对于指示标识的设置方式可以根据实际需要进行选择,本公开对此不作限定。
在一种可能的实现方式中,根据本公开实施例的图像标注方法还可包括:根据目标对象所在的图像区域的区域特征,确定所述目标对象的类别。
举例来说,目标对象可以具有不同的类别,例如目标对象为交通标志物时,可包括车道线、信号灯、交通标志牌等多种类别。在这种情况下,可预先设置不同类别的目标对象对应的指示标识,使得指示标识具有不同的形状或颜色等。这样,在识别出目标对象所在的图像区域时,该图像区域具有区域特征(例如边界的形状、颜色或颜色组合),根据目标对象所在的图像区域的区域特征,就可以确定目标对象的类别。例如,信号灯的指示标识设置为圆形,交通标志牌的指示标识设置为矩形;信号灯的指示标识设置为绿色,交通标志牌的指示标识设置为红色等。本公开对此不作限制。
通过这种方式,可根据区域特征直接确定目标对象的类别,从而简单快速地实现对象的类别识别。
在一种可能的实现方式中,步骤S12包括:根据目标对象所在的图像区域和/或所述目标对象的类别,分别确定所述至少一组待标注图像的标注信息。
举例来说,在确定目标对象的类别后,也可将目标对象的类别作为待标注图像的一个标注信息,一个待标注图像中可能可以识别出多个目标对象的区域和/或类别,此时该待标注图像可以包括多个标注信息,或者标注信息包括多个条目,每个条目包括一个目标对象的区域位置和/类别信息。从而,待标注图像的标注信息可包括目标对象所在图像区域的位置信息和目标对象的类别中的至少一种。通过这种方式,可使得对样本图像自动标注的内容更加丰富,以便更好地训练神经网络。
在一种可能的实现方式中,根据本公开实施例的图像标注方法可用于对交通模拟沙盘进行图像标注,该交通模拟沙盘可包括模拟道路、交通标志物(如车道线、信号灯、交通标志牌等),用于模拟无人驾驶环境。待标注的目标对象包括交通模拟沙盘中的交通标志物,指示标识可包括示廓灯带,例如LED点状灯、荧光带等。例如,目标对象为交通指示牌,目标对象的指示标识可以为围绕指示牌外围设置的LED灯带。可以根据实际需要选择合适的指示标识,本公开对此不作限定。
通过上述图像标注方法,在待标注图像的目标对象所在的图像区域形成差异信息,从而根据这些差异信息所在的位置确定出目标对象所在的图像区域,还可以根据差异信息确定目标对象的类型,例如不同交通标志物使用不同颜色的灯带,因此可以方便快速地标注出目标对象,实现图像标注的自动标注。
前文所述图像标注方法可以应用于多种类型的数据标注。例如,识别飞机跑道时,对飞机跑道的标注。又如,识别文本时,对图像中的文字的标注。接下来,将通过对沙盘中交通标志物的识别过程具体说明本公开中的图像标注方法。
基于沙盘的无人驾驶环境模拟可以避免真实场景下无人驾驶试验的潜在危险,对于无人驾驶算法测试较为重要。在基于沙盘的无人驾驶模拟环境中,为了识别沙盘交通标志物(如车道线、信号灯、交通标志牌),需要进行沙盘交通标志物的图片采集和图片标注工作,其标注的数量、质量对识别算法的性能有着较大影响。一般,对交通标志物的标注需要依赖人工参与进行图像采集与图片标注工作。
但是,人工参与图片标注的情况下,一方面,沙盘交通标志物(如车道线、信号灯、交通标志牌等)的标注通常需要使用到特定的标注工具,并设定特定的标注规范与流程,不具有预定资质的标注人员往往难以迅速掌握;另一方面,人工标注沙盘交通标志物费时费力,且往往难以保证标注质量。因此,可以通过本公开中的图像标注方法进行对沙盘中交通标志物的自动标注。
在对沙盘中交通标志物进行自动标注前,可以搭建一套与之对应的交通模拟沙盘装置。该装置包括沙盘主体、交通标志物及指示标识(如示廓灯带)等。沙盘主体可包括模拟道路等用于模拟无人驾驶环境的主体部分,以便模拟车辆(小车)在其中行驶。交通标志物例如包括如车道线、信号灯、交通标志牌等,设置在所述沙盘主体上的对应位置(例如交通标志牌设置在模拟道路的两侧)。示廓灯带设置在所述交通标志物的轮廓线、中心线及边缘线中的至少一处。
举例来说,可以在沙盘中的交通标志物(如车道线、信号灯、交通标志牌)上搭建示廓灯带,示廓灯带粘贴的位置可以与交通标志物的拟标注位置重合。以矩形交通标志物为例,灯带需沿着矩形交通标志物边缘粘贴一周,形成一个矩型灯带,对于不规则形状(非封闭的曲线形状)的标志物,如车道线,示廓灯带粘贴可以遵循示廓灯带粘贴的位置与交通标志物的标注位置重合的原则,沿着车道线中心线粘贴。该交通模拟沙盘装置可通过上述的方法进行图像标注。
在一种可能的实现方式中,该交通模拟沙盘装置还可包括:电子设备,该电子设备用于实现上述的图像标注方法、神经网络训练方法以及图像处理方法中的至少一种。该电子设备可例如为终端设备和/或服务器,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal DigitalAssistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备、带图像采集设备的机器小车等,所述方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可通过服务器来实现上述各个方法。本公开对电子设备的具体类型不作限制。
在一种可能的实现方式中,该电子设备可与交通标志物的指示标识连接,控制指示标识按预设规律进行变化,使得交通标志物的指示状态对应变化,以便实现该交通模拟沙盘装置中交通标志物的自动标注。
图3示出根据本公开实施例的一种图像标注方法的应用示例的流程图,如图3所示,该方法包括:
在步骤A11中,搭建沙盘交通标志物的示廓灯带。示廓灯带可以沿轮廓线、中心线及边缘线中的至少一处设置,具体的设置方式可以根据实际需要进行选择,本公开对此不作限定。
在一种可能的实现方式中,示廓灯带粘贴的位置可以与交通标志物的拟标注位置重合。以矩形交通标志物为例,灯带需沿着矩形交通标志物边缘粘贴一周,形成一个矩型灯带。
在步骤A12中,点亮示廓灯带。举例来说,可以通过计算机控制的方式点亮示廓灯带,例如由图像采集设备或其他控制设备向示廓灯带发送控制指令点亮示廓灯带,或者通过开关控制的方式点亮示廓灯带,点亮示廓灯带的方式可以根据实际需要进行选择,本公开对此不作限定。
在步骤A13中,采集图像。经步骤A13中采集后,可得到示廓灯带为“亮”的待标注图像。
在步骤A14中,熄灭示廓灯带。举例来说,可以通过计算机控制的方式熄灭示廓灯带,例如由图像采集设备或其他控制设备向示廓灯带发送控制指令熄灭示廓灯带,或者开关控制的方式熄灭示廓灯带,熄灭示廓灯带的方式可以根据实际需要进行选择,本公开对此不作限定。
在步骤A15中,采集图像。经步骤A15中采集后,可得到示廓灯带为“灭”的待标注图像。
在步骤A16中,依据示廓灯带亮灭时采集的待标注图像的图像变化,确定沙盘交通标志物所在位置,并标注保存。
其中,步骤A16可以通过上述的图像标注方法实现。
例如,步骤A13和步骤A15在同一位置采集的多张图像可以作为一组待标注图像。其中,步骤A13中采集的图像可以作为一种第二图像,步骤A15中采集的图像可以作为另一种第二图像。两种第二图像中的目标对象的指示状态不同。
可以参见图4a和图4b,图4a和图4b示出根据本公开实施例的第二图像的示意图,其中图4a示出的为根据本公开实施例的一种第二图像的示意图,图4b示出的为根据本公开实施例的另一种第二图像的示意图。
图4a中的第二图像20a包括目标对象21、处于第一指示状态的示廓灯带22a和背景23;图4b中的第二图像20b包括目标对象21、处于第二指示状态的示廓灯带22b和背景23。其中,示廓灯带22a的第一指示状态为示廓灯带的发光状态,示廓灯带22b的第二指示状态为示廓灯带熄灭的状态。因为第一指示状态和第二指示状态的亮度不同,所以可以形成第二图像20a和第二图像20b间的差异信息,由此差异信息可以确定示廓灯带在第二图像20a和第二图像20b中的位置;由于示廓灯带围绕目标对象21的边缘设置,所以通过示廓灯带的位置即可标注出目标对象21的位置。
此外,在一种可能的实现方式中,不同目标对象贴有不同颜色的示廓灯带,根据示廓灯带在至少两个第二图像中的颜色差异,可以同时识别目标对象的类型。采用同一颜色示廓灯带时,可以根据形状差异识别目标对象的类型。
应该理解,第二图像的数量并不限于两个,也可以为三个或多个,此处为了便于理解,因此仅以两个第二图像进行举例说明。采集的第二图像可以为一组,也可以为多组,本公开对此不作限定。
举例来说,可以从采集到的视频中提取第二图像,也可以以固定频率采集第二图像,对第二图像的采集方式可以根据实际需要进行选择,本公开对此不作限定。
在一种可能的实现方式中,可以控制搭建好的示廓灯带以指定颜色反复亮灭。其中,示廓灯带的颜色可以与沙盘环境中的色彩(尤其是待标注的交通标志物的颜色)产生较大差异,以便后续根据示廓灯带亮灭时的图像变化对示廓灯带进行定位。
在一种可能的实现方式中,示廓灯带22a的第一指示状态可以为示廓灯发出绿色的光,示廓灯带22b的第二指示状态为示廓灯带发出红色的光。
举例来说,对于上述第二图像20a和第二图像20b进行采集的方式为静态采集的方式,即图像采集设备在拍摄图片过程中保持静止,每采集完一张标注图像后,改变图像采集设备的位置。虽然图4a和图4b中示出的目标对象21为指示直行的交通标志物,但是具体采集的目标对象可以根据实际需要进行选择,例如指示停止的交通标志物、指示等待的交通标志物或其它标志物,本公开对此不作限定。
通过上述图像标注方法,在待标注图像的目标对象21所在的图像区域形成差异信息,从而根据这些差异信息所在的位置确定出目标对象21所在的图像区域,因此可以方便快速地标注出目标对象21,进而得到训练样本,实现图像标注的自动标注。
在一种可能的实现方式中,对第二图像的动态采集可以是控制图像采集设备缓慢移动,图像采集设备以固定频率采集图像。
图5示出根据本公开实施例的一种图像标注方法的应用示例的流程图,如图5所示,该方法包括:
在步骤B11中,搭建沙盘交通标志物的示廓灯带。对于不规则形状(非封闭的曲线形状)的标志物,如车道线,示廓灯带粘贴可以遵循示廓灯带粘贴的位置与交通标志物的标注位置重合的原则,例如沿着车道线中心线及边缘线粘贴
在步骤B12中,放置并缓慢移动图像采集设备。
在步骤B13中,控制示廓灯带以指定颜色反复亮灭。
在步骤B14中,采集沙盘图像。采集沙盘图像的方式可以是使用相机按一定频率拍摄,也可以是使用摄像头拍摄视频后,从拍摄的视频中按帧提取,沙盘图像的采集方式可以根据实际需要进行选择,本公开对此不作限定。
在步骤B15中,依据示廓灯带亮灭时的图像变化,确定沙盘交通标志物所在位置,并标注保存
上述方法中,步骤B15可以通过上述任一所述的图像标注方法实现。
例如,步骤B14中采集的邻近的多个图像可以作为一组待标注图像,其中至少两个第二图像中的示廓灯带的指示状态不同。可以根据第二图像中示廓灯带的不同指示状态,分别确定各组待标注图像。其中,两种第二图像中的目标对象的指示状态不同。
可以参见图6,图6示出根据本公开实施例的第二图像的示意图,图6中的第二图像30包括示廓灯带31a、示廓灯带31b和示廓灯带31c。
在一种可能的实现方式中,第二图像30中的示廓灯带31a和示廓灯带31c是沿着弯道线的边缘指示线铺设,而示廓灯带31b是沿着弯道线的中心线铺设。
示廓灯带31a、示廓灯带31b和示廓灯带31c的第一指示状态为示廓灯带的发光状态,示廓灯带31a、示廓灯带31b和示廓灯带31c第二指示状态为示廓灯带熄灭的状态。因为第一指示状态和第二指示状态的亮度不同,所以可以形成多个第二图像30间差异信息,由此差异信息可以确定示廓灯带在多个第二图像30中的位置;由于示廓灯带围绕弯道线的边缘指示线铺设或弯道线的中心线铺设,所以通过示廓灯带的位置即可标注出弯道线的位置。
上述方法,依据示廓灯带亮灭时的图像变化,确定所采集的沙盘的图像中交通标志物的位置,并标注保存。当示廓灯带点亮时,图像采集设备采集一帧图像;当示廓灯带熄灭时,图像采集设备再次采集一帧图像;然后对这两帧图像做图像处理,根据示廓灯带颜色信息以及两帧图像间的帧差信息,定位示廓灯带的位置。最后,将示廓灯的带位置作为沙盘交通标志物的标注位置,标注保存。
通过上述图像标注方法,在待标注图像的目标图像所在的图像区域形成差异信息,从而根据这些差异信息所在的位置确定出目标图像所在的图像区域,因此可以方便快速地标注出目标图像,进而得到训练样本,实现图像标注的自动标注。
图7a和图7b示出根据本公开实施例的沙盘图像采集的示意图。图7a中示出的是采集矩形交通标志物时沙盘中的模拟布置,图7a中的矩形交通标志物的边缘设置有示廓灯。图7b示出的是采集弯道线时沙盘中的模拟布置,图7b中的弯道线的边缘线和中心线处设置有示廓灯。
根据本公开的实施例,能够在沙盘交通标志物上搭建示廓灯带,并通过对示廓灯带亮灭的检测,更方便、高效地对沙盘交通标志物进行自动标注,显著降低标注成本;通过对示廓灯带亮灭的检测实现沙盘交通标志物自动精准定位与标注,使得标注更加准确,从而实现更高的标注准确率。
本公开的实施例还提供一种神经网络训练方法,包括:
根据预设的训练集训练神经网络,该神经网络用于识别图像中的对象;其中,训练集中包括上述任一图像标注方法标注得到的至少一个样本图像,每个样本图像具有对应的标注信息。
在一种可能的实现方式中,可以将得到的至少一个样本图像的一部分作为训练集,将得到的样本图像的另一部分作为测试集。
在一种可能的实现方式中,送入训练集的样本图像可以为指示状态满足条件(例如指示状态为低亮度状态)的对象。可以根据与样本图像对应的标注信息确定需要神经网络识别的目标对象所在的图像区域,从而根据此标注信息对神经网络进行训练。
本公开的实施例还提供一种图像处理方法,包括:将待处理图像输入神经网络中进行对象识别处理,确定所述待处理图像的目标对象;其中,所述神经网络包括根据上述神经网络训练方法训练得到的神经网络。
例如,可以根据图6中的示廓灯待的指示状态,确定图6中弯道线所在的图像区域,由此确定图6中的第二图像30的标注信息,然后对应的此组第二图像中没有示廓灯待的第二图像作为样本图像,将此样本图像和标注信息作为训练集,送入神经网络进行训练。
神经网络训练完成后,可以利用训练处的模型对图6中的第二图像30进行识别,进而判断该模型能否识别带有示廓灯待的第二图像30中的弯道线,以此判断神经网络训练出的模型的质量。
在一种可能的实现方式中,用于上述提及的神经网络可以是CNN、DNN等,可以根据实际需要进行选择,本公开对此不作限定。
根据本公开的实施例,能够应用于各类无人驾驶、交通场景的模拟沙盘,各类机器人比赛赛道等各种使用场景中,自动标注出大量的样本图像,进而根据自动标注的样本图像训练对应的识别网络并进行部署,从而提高识别网络的性能。
可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
此外,本公开还提供了图像标注装置、神经网络训练装置、图像处理装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种图像标注方法、神经网络训练方法及图像处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
图8示出根据本公开实施例的图像标注装置的框图,如图8所示,所述图像标注装置包括:图像识别模块81,用于对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,所述至少两个图像中目标对象的指示状态不同;信息确定模块82,用于根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息。
在一种可能的实现方式中,所述装置还包括:样本确定模块,用于从所述至少一组待标注图像中确定出至少一个样本图像,每个样本图像具有对应的标注信息,其中,所述至少一个样本图像用于训练神经网络,所述神经网络用于识别图像中的对象。
在一种可能的实现方式中,所述图像识别模块包括:差异确定子模块,用于对一组待标注图像中的至少两个第一图像进行差异识别,确定所述至少两个第一图像之间的差异信息,所述差异信息包括颜色差异及亮度差异中的至少一种;区域确定子模块,用于根据所述差异信息,确定所述至少两个第一图像中目标对象所在的图像区域。
在一种可能的实现方式中,所述装置还包括:类别确定模块,用于根据目标对象所在的图像区域的区域特征,确定所述目标对象的类别。
在一种可能的实现方式中,所述信息确定模块包括:信息确定子模块,用于根据目标对象所在的图像区域和/或所述目标对象的类别,分别确定所述至少一组待标注图像的标注信息。
在一种可能的实现方式中,所述装置还包括:图像采集模块,用于控制图像采集设备分别采集多个目标区域的第二图像,每个目标区域采集多个所述第二图像,每个目标区域的多个所述第二图像中包括不同指示状态的目标对象;图像确定模块,用于根据各个目标区域的第二图像,分别确定各组待标注图像;其中,所述图像采集设备的采集方式包括动态采集和静态采集中的至少一种。
在一种可能的实现方式中,所述装置还包括:状态控制模块,用于在图像采集设备采集图像期间,控制目标对象的指示状态按预设规律进行变化,以使采集到的图像中所述目标对象的指示状态不同。
在一种可能的实现方式中,每个待标注图像中的目标对象上具有指示标识,用于指示所述目标对象的指示状态,其中,所述指示标识位于所述目标对象的轮廓线、中心线及边缘线中的至少一处。
在一种可能的实现方式中,所述装置用于对交通模拟沙盘进行图像标注,所述目标对象包括所述交通模拟沙盘中的交通标志物。
根据本公开的另一方面,提供了一种神经网络训练装置,包括:训练模块,用于根据预设的训练集训练神经网络,所述神经网络用于识别图像中的对象,其中,所述训练集中包括根据上述图像标注装置标注得到的至少一个样本图像,每个样本图像具有对应的标注信息。
根据本公开的另一方面,提供了一种图像处理装置,包括:图像处理模块,用于将待处理图像输入神经网络中进行对象识别处理,确定所述待处理图像的目标对象,其中,所述神经网络包括根据上述神经网络训练装置训练得到的神经网络。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。
本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为调用所述存储器存储的指令,以执行上述方法。
电子设备可以被提供为终端、服务器或其它形态的设备。
图9示出根据本公开实施例的一种电子设备800的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。
参照图9,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。
图10示出根据本公开实施例的一种电子设备1900的框图。例如,电子设备1900可以被提供为一服务器。参照图10,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种图像标注方法,其特征在于,所述方法包括:
对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,所述至少两个图像中目标对象的指示状态不同;
根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从所述至少一组待标注图像中确定出至少一个样本图像,每个样本图像具有对应的标注信息,
其中,所述至少一个样本图像用于训练神经网络,所述神经网络用于识别图像中的对象。
3.一种神经网络训练方法,其特征在于,所述方法包括:
根据预设的训练集训练神经网络,所述神经网络用于识别图像中的对象,
其中,所述训练集中包括根据权利要求1或2所述的方法标注得到的至少一个样本图像,每个样本图像具有对应的标注信息。
4.一种图像处理方法,其特征在于,所述方法包括:
将待处理图像输入神经网络中进行对象识别处理,确定所述待处理图像的目标对象,
其中,所述神经网络包括根据权利要求3所述的方法训练得到的神经网络。
5.一种交通模拟沙盘装置,其特征在于,所述装置包括:
沙盘主体;
交通标志物,设置在所述沙盘主体上;
指示标识,设置在所述交通标志物的轮廓线、中心线及边缘线中的至少一处,
其中,通过权利要求1或2所述的方法对所述装置进行图像标注。
6.一种图像标注装置,其特征在于,所述装置包括:
图像识别模块,用于对采集到的至少一组待标注图像分别进行识别,确定所述至少一组待标注图像中目标对象所在的图像区域,其中,每组待标注图像包括至少两个图像,所述至少两个图像中目标对象的指示状态不同;
信息确定模块,用于根据目标对象所在的图像区域,分别确定所述至少一组待标注图像的标注信息。
7.一种神经网络训练装置,其特征在于,所述装置包括:
训练模块,用于根据预设的训练集训练神经网络,所述神经网络用于识别图像中的对象,
其中,所述训练集中包括根据权利要求6所述的装置标注得到的至少一个样本图像,每个样本图像具有对应的标注信息。
8.一种图像处理装置,其特征在于,所述装置包括:
图像处理模块,用于将待处理图像输入神经网络中进行对象识别处理,确定所述待处理图像的目标对象,
其中,所述神经网络包括根据权利要求7所述的装置训练得到的神经网络。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行权利要求1至4中任意一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至4中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910730771.9A CN110458226B (zh) | 2019-08-08 | 2019-08-08 | 图像标注方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910730771.9A CN110458226B (zh) | 2019-08-08 | 2019-08-08 | 图像标注方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110458226A true CN110458226A (zh) | 2019-11-15 |
CN110458226B CN110458226B (zh) | 2022-04-01 |
Family
ID=68485520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910730771.9A Active CN110458226B (zh) | 2019-08-08 | 2019-08-08 | 图像标注方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110458226B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259980A (zh) * | 2020-02-10 | 2020-06-09 | 北京小马慧行科技有限公司 | 标注数据的处理方法和装置 |
CN111401224A (zh) * | 2020-03-13 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 目标检测方法、装置及电子设备 |
CN111640179A (zh) * | 2020-06-26 | 2020-09-08 | 百度在线网络技术(北京)有限公司 | 宠物模型的显示方法、装置、设备以及存储介质 |
CN111753661A (zh) * | 2020-05-25 | 2020-10-09 | 济南浪潮高新科技投资发展有限公司 | 一种基于神经网路的目标识别方法、设备及介质 |
CN112131414A (zh) * | 2020-09-23 | 2020-12-25 | 北京百度网讯科技有限公司 | 信号灯的图像的标注方法、装置、电子设备以及路侧设备 |
CN113392230A (zh) * | 2020-03-13 | 2021-09-14 | 阿里巴巴集团控股有限公司 | 标注数据处理和操作方法以及标注平台和数据库 |
CN113392263A (zh) * | 2021-06-24 | 2021-09-14 | 上海商汤科技开发有限公司 | 一种数据标注方法及装置、电子设备和存储介质 |
TWI744000B (zh) * | 2020-09-21 | 2021-10-21 | 財團法人資訊工業策進會 | 影像標記裝置、方法及其電腦程式產品 |
CN113627413A (zh) * | 2021-08-12 | 2021-11-09 | 杭州海康威视数字技术股份有限公司 | 数据标注方法、图像比对方法及装置 |
CN113688259A (zh) * | 2020-05-19 | 2021-11-23 | 阿波罗智联(北京)科技有限公司 | 导航目标的标注方法及装置、电子设备、计算机可读介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650705A (zh) * | 2017-01-17 | 2017-05-10 | 深圳地平线机器人科技有限公司 | 区域标注方法、装置和电子设备 |
CN108255961A (zh) * | 2017-12-21 | 2018-07-06 | 深圳市数字城市工程研究中心 | 街景视频的图像标注方法、终端设备及存储介质 |
CN109409364A (zh) * | 2018-10-16 | 2019-03-01 | 北京百度网讯科技有限公司 | 图像标注方法和装置 |
CN109508580A (zh) * | 2017-09-15 | 2019-03-22 | 百度在线网络技术(北京)有限公司 | 交通信号灯识别方法和装置 |
CN110009090A (zh) * | 2019-04-02 | 2019-07-12 | 北京市商汤科技开发有限公司 | 神经网络训练与图像处理方法及装置 |
-
2019
- 2019-08-08 CN CN201910730771.9A patent/CN110458226B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650705A (zh) * | 2017-01-17 | 2017-05-10 | 深圳地平线机器人科技有限公司 | 区域标注方法、装置和电子设备 |
CN109508580A (zh) * | 2017-09-15 | 2019-03-22 | 百度在线网络技术(北京)有限公司 | 交通信号灯识别方法和装置 |
CN108255961A (zh) * | 2017-12-21 | 2018-07-06 | 深圳市数字城市工程研究中心 | 街景视频的图像标注方法、终端设备及存储介质 |
CN109409364A (zh) * | 2018-10-16 | 2019-03-01 | 北京百度网讯科技有限公司 | 图像标注方法和装置 |
CN110009090A (zh) * | 2019-04-02 | 2019-07-12 | 北京市商汤科技开发有限公司 | 神经网络训练与图像处理方法及装置 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259980A (zh) * | 2020-02-10 | 2020-06-09 | 北京小马慧行科技有限公司 | 标注数据的处理方法和装置 |
CN111259980B (zh) * | 2020-02-10 | 2023-10-03 | 北京小马慧行科技有限公司 | 标注数据的处理方法和装置 |
CN111401224A (zh) * | 2020-03-13 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 目标检测方法、装置及电子设备 |
CN113392230A (zh) * | 2020-03-13 | 2021-09-14 | 阿里巴巴集团控股有限公司 | 标注数据处理和操作方法以及标注平台和数据库 |
CN113688259A (zh) * | 2020-05-19 | 2021-11-23 | 阿波罗智联(北京)科技有限公司 | 导航目标的标注方法及装置、电子设备、计算机可读介质 |
CN113688259B (zh) * | 2020-05-19 | 2024-06-07 | 阿波罗智联(北京)科技有限公司 | 导航目标的标注方法及装置、电子设备、计算机可读介质 |
CN111753661A (zh) * | 2020-05-25 | 2020-10-09 | 济南浪潮高新科技投资发展有限公司 | 一种基于神经网路的目标识别方法、设备及介质 |
CN111753661B (zh) * | 2020-05-25 | 2022-07-12 | 山东浪潮科学研究院有限公司 | 一种基于神经网路的目标识别方法、设备及介质 |
CN111640179B (zh) * | 2020-06-26 | 2023-09-01 | 百度在线网络技术(北京)有限公司 | 宠物模型的显示方法、装置、设备以及存储介质 |
CN111640179A (zh) * | 2020-06-26 | 2020-09-08 | 百度在线网络技术(北京)有限公司 | 宠物模型的显示方法、装置、设备以及存储介质 |
TWI744000B (zh) * | 2020-09-21 | 2021-10-21 | 財團法人資訊工業策進會 | 影像標記裝置、方法及其電腦程式產品 |
CN112131414A (zh) * | 2020-09-23 | 2020-12-25 | 北京百度网讯科技有限公司 | 信号灯的图像的标注方法、装置、电子设备以及路侧设备 |
CN113392263A (zh) * | 2021-06-24 | 2021-09-14 | 上海商汤科技开发有限公司 | 一种数据标注方法及装置、电子设备和存储介质 |
CN113627413A (zh) * | 2021-08-12 | 2021-11-09 | 杭州海康威视数字技术股份有限公司 | 数据标注方法、图像比对方法及装置 |
CN113627413B (zh) * | 2021-08-12 | 2024-06-04 | 杭州海康威视数字技术股份有限公司 | 数据标注方法、图像比对方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110458226B (zh) | 2022-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110458226A (zh) | 图像标注方法及装置、电子设备和存储介质 | |
CN107911614B (zh) | 一种基于手势的图像拍摄方法、装置和存储介质 | |
CN110266879A (zh) | 播放界面显示方法、装置、终端及存储介质 | |
CN109089170A (zh) | 弹幕显示方法及装置 | |
CN109618184A (zh) | 视频处理方法及装置、电子设备和存储介质 | |
CN104270565B (zh) | 图像拍摄方法、装置及设备 | |
CN108764069A (zh) | 活体检测方法及装置 | |
CN104537837B (zh) | 确定交通路线的方法、装置及系统 | |
CN109117862A (zh) | 图像标签识别方法、装置及服务器 | |
CN110009090A (zh) | 神经网络训练与图像处理方法及装置 | |
CN106804000A (zh) | 直播回放方法及装置 | |
CN106993229A (zh) | 互动属性展示方法及装置 | |
CN106713738A (zh) | 移动终端及其控制方法 | |
CN110378820A (zh) | 教学系统及方法、电子设备和存储介质 | |
CN109543536A (zh) | 图像标识方法及装置、电子设备和存储介质 | |
CN108833991A (zh) | 视频字幕显示方法及装置 | |
CN103914151B (zh) | 信息显示方法及装置 | |
CN104408066A (zh) | 基于位置信息的报警提示方法、装置及设备 | |
CN110262886A (zh) | 任务执行方法及装置、电子设备和存储介质 | |
CN107864225A (zh) | 基于ar的信息推送方法、装置及电子设备 | |
CN109286847A (zh) | 视频的播放进度展示方法及装置 | |
CN109727208A (zh) | 滤镜推荐方法、装置、电子设备及存储介质 | |
CN105262538B (zh) | 一种光信息定位系统 | |
CN107402019A (zh) | 一种视频导航的方法、装置及服务器 | |
CN105448085B (zh) | 过马路提示方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |