CN115345321A - 数据增广方法、装置、电子设备及存储介质 - Google Patents

数据增广方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115345321A
CN115345321A CN202211280470.9A CN202211280470A CN115345321A CN 115345321 A CN115345321 A CN 115345321A CN 202211280470 A CN202211280470 A CN 202211280470A CN 115345321 A CN115345321 A CN 115345321A
Authority
CN
China
Prior art keywords
parking space
image
image area
bird
eye view
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211280470.9A
Other languages
English (en)
Other versions
CN115345321B (zh
Inventor
李勇刚
赵雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Automobile Technology Co Ltd
Original Assignee
Xiaomi Automobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Automobile Technology Co Ltd filed Critical Xiaomi Automobile Technology Co Ltd
Priority to CN202211280470.9A priority Critical patent/CN115345321B/zh
Publication of CN115345321A publication Critical patent/CN115345321A/zh
Application granted granted Critical
Publication of CN115345321B publication Critical patent/CN115345321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)

Abstract

本公开提出一种数据增广方法、装置、电子设备及存储介质,涉及自动驾驶技术领域。包括:获取停车位鸟瞰图像,其中,停车位鸟瞰图像中包含N个停车位检测框,每个停车位检测框的尺寸相同,N为大于2的整数;对每个停车位检测框对应的图像区域进行目标检测,以确定每个图像区域对应的检测结果;基于每个图像区域对应的检测结果,将停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。由此,增加了停车位鸟瞰图像的数据多样性,为停车位检测模型的训练提供了丰富的训练样本数据,从而可以提高训练得到的停车位检测模型的性能,进而可以在自动驾驶过程中利用训练生成的停车位检测模型对停车场的停车位进行准确地检测。

Description

数据增广方法、装置、电子设备及存储介质
技术领域
本公开涉及自动驾驶技术领域,尤其涉及一种数据增广方法、装置、电子设备及存储介质。
背景技术
自动驾驶技术又称无人驾驶技术,是一种通过计算机系统实现无人驾驶的智能汽车技术。自动驾驶车辆在将车辆驶入停车位,需要先对停车场的停车位进行检测,以获取停车位的信息。
目前,停车位检测任务的主流算法为深度学习算法,然而深度学习算法依赖大规模训练样本数据集。在对深度模型进行训练之前,需要利用数据增广算法来对采集的训练样本进行数据增广,以扩充训练样本数据集。因此,如何对停车位检测任务的训练样本数据进行增广成为重点的研究方向。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
本公开第一方面实施例提出了一种数据增广方法,包括:
获取停车位鸟瞰图像,其中,所述停车位鸟瞰图像中包含N个停车位检测框,每个所述停车位检测框的尺寸相同,N为大于2的整数;
对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果;
基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。
本公开第二方面实施例提出了一种数据增广装置,包括:
获取模块,用于获取停车位鸟瞰图像,其中,所述停车位鸟瞰图像中包含N个停车位检测框,每个所述停车位检测框的尺寸相同,N为大于2的整数;
确定模块,用于对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果;
生成模块,用于基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。
本公开第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的数据增广方法。
本公开第四方面实施例提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,实现如本公开第一方面实施例提出的数据增广方法。
本公开提供的数据增广方法、装置、电子设备及存储介质,存在如下有益效果:
本公开实施例中,可以先获取停车位鸟瞰图像,之后对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果,最后可以基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。由此,可以在不改变停车位鸟瞰图像的背景信息的情况下,生成多种不同停车情况对应的图像,增加了数据多样性,为停车位检测模型的训练提供了丰富的训练样本数据,从而可以提高训练得到的停车位检测模型的性能,进而可以在自动驾驶过程中利用训练生成的停车位检测模型对停车场的停车位进行准确地检测。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本公开一实施例所提供的一种数据增广方法的流程示意图;
图2为本公开另一实施例所提供的一种数据增广方法的流程示意图;
图3为本公开一实施例提供的停车位鸟瞰图像中部分图像区域融合后的融合图像;
图4为本公开另一实施例所提供的数据增广装置的结构示意图;
图5示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的数据增广方法、装置、电子设备和存储介质。
图1为本公开实施例所提供的一种数据增广方法的流程示意图。
本公开实施例以该数据增广方法被配置于数据增广装置中来举例说明,该数据增广装置可以应用于任一电子设备中,以使该电子设备可以执行数据增广功能。
如图1所示,该数据增广方法可以包括以下步骤:
步骤101,获取停车位鸟瞰图像,其中,停车位鸟瞰图像中包含N个停车位检测框,每个停车位检测框的尺寸相同,N为大于2的整数。
需要说明的是,本公开实施例中,停车位鸟瞰图像中每个停车位的尺寸是相同的,即停车位检测框的长和停车位的宽都是相同的。
其中,停车位鸟瞰图像可以为对车辆采集的包含停车位的图像进行处理之后得到的包含停车位检测框的图像。或者,停车位鸟瞰图像也可以为从开源数据库中获取的图像,本公开对此不做限定。
可选的,可以先获取车辆上的多个摄像头采集的停车位图像,之后对多张停车位图像进行拼接,以获取初始鸟瞰图,进一步获取初始鸟瞰图对应的标注数据,最后根据标注数据及初始鸟瞰图,生成停车位鸟瞰图像。
其中,车辆上的摄像头可以为广角摄像头、环视摄像头、针孔摄像头等等。本公开对此不做限定。可以理解的是,由于车辆上的多个摄像头部署在车辆上的不同位置。因此,可以对车辆周围的环境进行图像采集。
在获取同一时刻每个相机采集的图像之后,可以根据每个相机的标定数据等将各个相机采集的图像进行转换和拼接操作,得到一张可以包含车辆周围停车位情况的初始鸟瞰图。
可选的,可以采用人工标注的方式对初始鸟瞰图中的停车位进行标注。或者,也可以采用机器自动标注之后,人工进行调整的方式对初始鸟瞰图中的停车位进行标注。本公开对此不做限定。
步骤102,对每个停车位检测框对应的图像区域进行目标检测,以确定每个图像区域对应的检测结果。
可选的,可以采用预先训练好的目标检测网络对每个停车位检测框对应的图像区域进行目标检测。即将每个停车位检测对应的图像区域分别输入目标检测网络中,以获取对应的目标检测结果。其中,检测的目标为图像区域中的车辆。
可选的,检测结果可以包括“包含车辆”和“不包含车辆”。
在一些实施例中,还可以采用标注的方式,对每个停车位检测框对应的图像区域中是否包含车辆进行标注。比如,停车位检测框对应的图像区域中包含车辆,则对应的标注结果可以为“1”,停车位检测框对应的图像区域中不包含车辆,则对应的标注结果可以为“0”。本公开对此不做限定。
步骤103,基于每个图像区域对应的检测结果,将停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。
其中,将停车位鸟瞰图像中的部分图像区域进行交换,可以理解为将两个停车位检测框对应的图像区域进行交换。
其中,将停车位鸟瞰图像中的部分图像区域进行融合,可以理解为将两个停车位检测框对应的图像区域进行融合。之后可以用融合后的结果,对被融合的图像区域进行替换。
可选的,可以基于每个图像区域对应的检测结果,将停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行交换,以生成新的停车位鸟瞰图像。
举例来说,停车位鸟瞰图像中包括停车位检测框A、停车位检测框B、停车位检测框C和停车位检测框D。其中,A和B的检测结果为包含车辆、C和D的结果为不包含车辆。则可以将A的图像区域与C的图像区域进行交换,以得到新的停车位鸟瞰图像。或者,也可以将B的图像区域与D的图像区域进行交换,以得到新的停车位鸟瞰图像。或者,也可以将A的图像区域与C的图像区域进行交换,及B的图像区域与D的图像区域进行交换,以得到新的停车位鸟瞰图像。
可选的,还可以基于每个图像区域对应的检测结果,将停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行融合,以生成新的停车位鸟瞰图像。
举例来说,停车位鸟瞰图像中包括停车位检测框A、停车位检测框B、停车位检测框C和停车位检测框D。其中,A和B的检测结果为包含车辆、C和D的结果为不包含车辆。则可以将A的图像区域与C的图像区域进行融合,并利用融合后的图像对A的图像区域进行替换,以生成新的停车位鸟瞰图像。或者,也利用融合后的图像对C的图像区域进行替换,以生成新的停车位鸟瞰图像。
可选的,还可以基于每个图像区域对应的检测结果,将停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行融合及替换,以生成新的停车位鸟瞰图像。
举例来说,停车位鸟瞰图像中包括停车位检测框A、停车位检测框B、停车位检测框C和停车位检测框D。其中,A和B的检测结果为包含车辆、C和D的结果为不包含车辆。则可以将A的图像区域与C的图像区域进行融合,并利用融合后的图像对A的图像区域进行替换,并将B的图像区域与C的图像区域进行替换,以生成新的停车位鸟瞰图像。
本公开实施例中,可以先获取停车位鸟瞰图像,之后对每个停车位检测框对应的图像区域进行目标检测,以确定每个图像区域对应的检测结果,最后可以基于每个图像区域对应的检测结果,将停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。由此,可以在不改变停车位鸟瞰图像的背景信息的情况下,生成多种不同停车情况对应的图像,增加了数据多样性,为停车位检测模型的训练提供了丰富的训练样本数据,从而可以提高训练得到的停车位检测模型的性能,进而可以在自动驾驶过程中利用训练生成的停车位检测模型对停车场的停车位进行准确地检测。
图2为本公开一实施例所提供的一种数据增广方法的流程示意图,如图2所示,该数据增广方法可以包括以下步骤:
步骤201,获取停车位鸟瞰图像,其中,停车位鸟瞰图像中包含N个停车位检测框,每个停车位检测框的尺寸相同,N为大于2的整数。
步骤202,对每个停车位检测框对应的图像区域进行目标检测,以确定每个图像区域对应的检测结果。
其中,步骤201及步骤202的具体实现形式,可参照本公开中其它各实施例中的详细步骤,此处不再具体描述。
步骤203,基于每个图像区域对应的检测结果,随机获取至少一组图像区域集合,其中,每组图像区域集合中包括一个检测结果为包含车辆的第一图像区域及一个检测结果为不包含车辆的第二图像区域。
举例来说,停车位鸟瞰图像中包括停车位检测框A、停车位检测框B、停车位检测框C、停车位检测框D和停车位E。其中,A和B的检测结果为包含车辆、C、D和E的结果为不包含车辆。则可以随机获取至少一组图像区域组合,比如,可以由A的图像区域与C的图像区域组合成一个图像区域集合,由B的图像区域与D的图像区域组合成一个图像区域集合、由B的图像区域和E的图像区域组成一个图像区域组合等等。本公开对此不做限定。
步骤204,将每组图像区域集合中的第一图像区域及第二图像区域进行融合,以获取每组图像区域集合对应的融合图像。
可选的,可以先获取第一图像区域对应的第一权重,及第二图像区域对应的第二权重,之后基于第一权重及第二权重,将第一图像区域与第二图像区域进行融合,以获取融合图像。
可选的,每组图像区域集合中第一图像区域对应的第一权重可以相同,也可以不同。本公开对此不做限定。比如,图像区域A和图像区域B分别为每组图像区域集合中的第一图像区域,则图像区域A对应的第一权重和图像区域B对应的第一权重可以相同也可以不同。
需要说明的是,每组图像区域集合中,第一权重与第二权重的和为1,则每组图像区域集合中第二图像区域对应的第二权重可以相同,也可以不同。
可选的,第一权重及第二权重可以为预先设置的。由于包含车辆的第一图像区域中比不过包含车辆的第二图像区域中包含更多的信息。因此,可以设置第一权重大于第二权重。比如,第一权重为0.7,第二权重为0.3.本公开对此不做限定。
可选的,对贝塔分布进行随机采样,以获取第一权重及第二权重,其中,第一权重与第二权重的和为1。从而增加了每组图像区域集合对应的第一权重及第二权重的随机性,从而进一步增加了数据多样性。
其中,贝塔分布是一个[0,1]的分布。因此,可以随机对贝塔分布中随机采样,以获取第一权重及第二权重。可选的,可以同时采样两个数据,使其何为1,从而分别得到第一权重及第二权重。或者,也可以为采样一个数据,将其作为第一权重,进而计算得到第二权重。本公开对此不做限定。
本公开实施例中,在确定了每组图像区域集合中第一图像区域对应的第一权重,及第二图像区域对应的第二权重之后,则可以将第一图像区域中每个像素点的像素值与第一权重的乘积,及第二图像区域中每个像素点的像素值与第二权重的乘积的和,确定为融合图像中每个像素点对应的像素值。
图3为本公开一实施例提供的停车位鸟瞰图像中部分图像区域融合后的融合图像。如图3所示,将停车位鸟瞰图像I中的第一图像区域A与第二图像区域B进行融合,得到融合图像I1、I2及I3。具体地,若第一权重为0.8、第二权重为0.2,则得到融合图像I1;若第一权重为0.5、第二权重为0.5,则得到融合图像I2;若第一权重为0.2、第二权重为0.8,则得到融合图像I3。本公开对此不做限定。
步骤205,基于每张融合图像,对停车位鸟瞰图像中对应的第一图像区域,和/或第二图像区域进行替换,以生成新的停车位鸟瞰图像。
本公开实施例中,在确定了融合图像之后,可以利用融合图像对停车位鸟瞰图像中对应的第一图像区域进行替换;或者对第二图像区域进行替换;或者第一图像区域及第二图像区域同时进行替换,以生成新的停车位鸟瞰图像。
可选的,还可以根据第一图像区域对应的第一权重与第二图像区域对应的第二权重的大小,确定对第一图像区域进行替换,还是对第二图像区域进行替换。
可选的,响应于第一权重大于第二权重,利用融合图像对第一图像区域进行替换,以生成新的停车位鸟瞰图像。
举例来说,一组图像区域集合中包含第一图像区域A和第二图像区域C,图像区域A对应的第一权重为0.8,图像区域C对应的第二权重为0.2,则可以利用融合图像对第一图像区域A进行替换,以生成新的停车位鸟瞰图像。
可选的,响应于第一权重小于或等于第二权重,利用融合图像对第二图像区域进行替换,以生成新的停车位鸟瞰图像。
举例来说,一组图像区域集合中包含第一图像区域A和第二图像区域C,图像区域A对应的第一权重为0.3,图像区域C对应的第二权重为0.7,则可以利用融合图像对第一图像区域B进行替换,以生成新的停车位鸟瞰图像。
本公开实施例中,将停车位鸟瞰图像中的第一图像区域及第二图像区域进行融合,以获取对应的融合图像,并利用融合图像,对停车位鸟瞰图像中对应的第一图像区域,和/或第二图像区域进行替换,以生成新的停车位鸟瞰图像。从而增加了停车位检测模型的训练样本数据,使停车位检测模型在训练的过程中可以学习到非真实车辆或停车位的数据,即类似与障碍物的特征,进而在利用停车位检测模型进行停车位检测时,可以准确地识别到停车位上存在的障碍物,避免车辆碰到障碍物。
本公开实施例中,可以先获取停车位鸟瞰图像,之后对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果,基于每个所述图像区域对应的检测结果,随机获取至少一组图像区域集合,其中,每组所述图像区域集合中包括一个检测结果为包含车辆的第一图像区域及一个检测结果为不包含车辆的第二图像区域,并将每组图像区域集合中的所述第一图像区域及所述第二图像区域进行融合,以获取每组图像区域集合对应的融合图像,最后基于每张所述融合图像,对所述停车位鸟瞰图像中对应的所述第一图像区域,和/或所述第二图像区域进行替换,以生成新的停车位鸟瞰图像。由此,可以将不包含车辆的图像区域与包含车辆的图像区域进行融合,并利用融合的图像对停车位鸟瞰图像中对应的图像区域进行替换,从而可以实现对停车位鸟瞰图像的增广,为停车位检测模型的训练提供了大量样本数据,增加了训练样本数据的多样性。
为了实现上述实施例,本公开还提出一种数据增广装置。
图4为本公开实施例所提供的数据增广装置的结构示意图。
如图4所示,该数据增广装置400可以包括:获取模块410、确定模块420、生成模块430。
获取模块410,用于获取停车位鸟瞰图像,其中,停车位鸟瞰图像中包含N个停车位检测框,每个停车位检测框的尺寸相同,N为大于2的整数;
确定模块420,用于对每个停车位检测框对应的图像区域进行目标检测,以确定每个图像区域对应的检测结果;
生成模块430,用于基于每个图像区域对应的检测结果,将停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。
可选的,生成模块,具体用于:
基于每个图像区域对应的检测结果,将停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行交换,以生成新的停车位鸟瞰图像;
和/或,
基于每个图像区域对应的检测结果,将停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行融合,以生成新的停车位鸟瞰图像。
可选的,生成模块430,包括:
第一获取单元,用于基于每个图像区域对应的检测结果,随机获取至少一组图像区域集合,其中,每组图像区域集合中包括一个检测结果为包含车辆的第一图像区域及一个检测结果为不包含车辆的第二图像区域;
第二获取单元,用于将每组图像区域集合中的第一图像区域及第二图像区域进行融合,以获取每组图像区域集合对应的融合图像;
生成单元,用于基于每张融合图像,对停车位鸟瞰图像中对应的第一图像区域,和/或第二图像区域进行替换,以生成新的停车位鸟瞰图像。
可选的,第二获取单元,具体用于:
获取第一图像区域对应的第一权重,及第二图像区域对应的第二权重;
基于第一权重及第二权重,将第一图像区域与第二图像区域进行融合,以获取融合图像。
可选的,第二获取单元,还具体用于:
对贝塔分布进行随机采样,以获取第一权重及第二权重,其中,第一权重与第二权重的和为1。
可选的,生成单元,具体用于:
响应于第一权重大于第二权重,利用融合图像对第一图像区域进行替换,以生成新的停车位鸟瞰图像;和/或,
响应于第一权重小于或等于第二权重,利用融合图像对第二图像区域进行替换,以生成新的停车位鸟瞰图像。
可选的,获取模块410,具体用于:
获取车辆上的多个摄像头采集的停车位图像;
对多张停车位图像进行拼接,以获取初始鸟瞰图;
获取初始鸟瞰图对应的标注数据;
根据标注数据及初始鸟瞰图,生成停车位鸟瞰图像。
本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
本公开实施例的数据增广装置,首先获取停车位鸟瞰图像,之后对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果,最后可以基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。由此,可以在不改变停车位鸟瞰图像的背景信息的情况下,生成多种不同停车情况对应的图像,增加了数据多样性,为停车位检测模型的训练提供了丰富的训练样本数据,从而可以提高训练得到的停车位检测模型的性能,进而可以在自动驾驶过程中利用训练生成的停车位检测模型对停车场的停车位进行准确地检测。
为了实现上述实施例,本公开还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的数据增广方法。
为了实现上述实施例,本公开还提出一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,实现如本公开前述实施例提出的数据增广方法。
图5示出了适于用来实现本公开实施方式的示例性电子设备的框图。图5显示的电子设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
本公开的技术方案,可以先获取停车位鸟瞰图像,之后对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果,最后可以基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。由此,由此,可以在不改变停车位鸟瞰图像的背景信息的情况下,生成多种不同停车情况对应的图像,增加了数据多样性,为停车位检测模型的训练提供了丰富的训练样本数据,从而可以提高训练得到的停车位检测模型的性能,进而可以在自动驾驶过程中利用训练生成的停车位检测模型对停车场的停车位进行准确地检测。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种数据增广方法,其特征在于,包括:
获取停车位鸟瞰图像,其中,所述停车位鸟瞰图像中包含N个停车位检测框,每个所述停车位检测框的尺寸相同,N为大于2的整数;
对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果;
基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。
2.根据权利要求1所述的方法,其特征在于,所述基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像,包括:
基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行交换,以生成新的停车位鸟瞰图像;
和/或,
基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行融合,以生成新的停车位鸟瞰图像。
3.根据权利要求2所述的方法,其特征在于,所述基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中检测结果为包含车辆的图像区域与检测结果为不包含车辆的图像区域进行融合,以生成新的停车位鸟瞰图像,包括:
基于每个所述图像区域对应的检测结果,随机获取至少一组图像区域集合,其中,每组所述图像区域集合中包括一个检测结果为包含车辆的第一图像区域及一个检测结果为不包含车辆的第二图像区域;
将每组所述图像区域集合中的所述第一图像区域及所述第二图像区域进行融合,以获取每组所述图像区域集合对应的融合图像;
基于每张所述融合图像,对所述停车位鸟瞰图像中对应的所述第一图像区域,和/或所述第二图像区域进行替换,以生成新的停车位鸟瞰图像。
4.根据权利要求3所述的方法,其特征在于,所述将每组所述图像区域集合中的所述第一图像区域及所述第二图像区域进行融合,以获取每组所述图像区域集合对应的融合图像,包括:
获取所述第一图像区域对应的第一权重,及所述第二图像区域对应的第二权重;
基于所述第一权重及所述第二权重,将所述第一图像区域与所述第二图像区域进行融合,以获取所述融合图像。
5.根据权利要求4所述的方法,其特征在于,所述获取所述第一图像区域对应的第一权重,及所述第二图像区域对应的第二权重,包括:
对贝塔分布进行随机采样,以获取所述第一权重及所述第二权重,其中,所述第一权重与所述第二权重的和为1。
6.根据权利要求4所述的方法,其特征在于,所述基于每张所述融合图像,对所述停车位鸟瞰图像中对应的所述第一图像区域,和/或所述第二图像区域进行替换,以生成新的停车位鸟瞰图像,包括:
响应于所述第一权重大于所述第二权重,利用所述融合图像对所述第一图像区域进行替换,以生成新的停车位鸟瞰图像;和/或,
响应于所述第一权重小于或等于所述第二权重,利用所述融合图像对所述第二图像区域进行替换,以生成新的停车位鸟瞰图像。
7.根据权利要求1-6任一所述的方法,其特征在于,所述获取停车位鸟瞰图像,包括:
获取车辆上的多个摄像头采集的停车位图像;
对多张所述停车位图像进行拼接,以获取初始鸟瞰图;
获取所述初始鸟瞰图对应的标注数据;
根据所述标注数据及所述初始鸟瞰图,生成所述停车位鸟瞰图像。
8.一种数据增广装置,其特征在于,包括:
获取模块,用于获取停车位鸟瞰图像,其中,所述停车位鸟瞰图像中包含N个停车位检测框,每个所述停车位检测框的尺寸相同,N为大于2的整数;
确定模块,用于对每个所述停车位检测框对应的图像区域进行目标检测,以确定每个所述图像区域对应的检测结果;
生成模块,用于基于每个所述图像区域对应的检测结果,将所述停车位鸟瞰图像中的部分图像区域进行交换和/或融合,以生成新的停车位鸟瞰图像。
9.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-7中任一所述的数据增广方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-7中任一所述的数据增广方法。
CN202211280470.9A 2022-10-19 2022-10-19 数据增广方法、装置、电子设备及存储介质 Active CN115345321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211280470.9A CN115345321B (zh) 2022-10-19 2022-10-19 数据增广方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211280470.9A CN115345321B (zh) 2022-10-19 2022-10-19 数据增广方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115345321A true CN115345321A (zh) 2022-11-15
CN115345321B CN115345321B (zh) 2023-02-17

Family

ID=83957336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211280470.9A Active CN115345321B (zh) 2022-10-19 2022-10-19 数据增广方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115345321B (zh)

Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180285663A1 (en) * 2017-03-31 2018-10-04 Here Global B.V. Method and apparatus for augmenting a training data set
CN110084118A (zh) * 2019-03-25 2019-08-02 哈尔滨工业大学(深圳) 行人检测训练数据库的建立方法、行人检测方法及装置
CN110599453A (zh) * 2019-08-08 2019-12-20 武汉精立电子技术有限公司 一种基于图像融合的面板缺陷检测方法、装置及设备终端
CN110619312A (zh) * 2019-09-20 2019-12-27 百度在线网络技术(北京)有限公司 定位元素数据的增强方法、装置、设备及存储介质
CN111767853A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 车道线检测方法和装置
CN111832745A (zh) * 2020-06-12 2020-10-27 北京百度网讯科技有限公司 数据增广的方法、装置及电子设备
US20210199446A1 (en) * 2019-12-31 2021-07-01 Lyft, Inc. Overhead view image generation
CN113076904A (zh) * 2021-04-15 2021-07-06 华南理工大学 一种基于深度学习的室外停车场空余车位检测方法
CN113361588A (zh) * 2021-06-03 2021-09-07 北京文安智能技术股份有限公司 基于图像数据增强的图像训练集生成方法和模型训练方法
US20210303886A1 (en) * 2020-03-31 2021-09-30 Robert Bosch Gmbh Semantically-consistent augmented training data for traffic light detection
CN113537105A (zh) * 2021-07-23 2021-10-22 北京经纬恒润科技股份有限公司 一种车位检测方法及装置
WO2022034678A1 (en) * 2020-08-13 2022-02-17 Nec Corporation Image augmentation apparatus, control method, and non-transitory computer-readable storage medium
CN114066858A (zh) * 2021-11-18 2022-02-18 深圳市商汤科技有限公司 模型训练方法及装置、电子设备和存储介质
CN114155177A (zh) * 2021-11-18 2022-03-08 中汽创智科技有限公司 一种图像增广方法、装置、电子设备及存储介质
US20220101047A1 (en) * 2020-09-30 2022-03-31 Nvidia Corporation Data augmentation including background modification for robust prediction using neural networks
CN114444653A (zh) * 2021-12-21 2022-05-06 武汉中海庭数据技术有限公司 一种数据增广对深度学习模型性能影响评估方法及系统
CN114445746A (zh) * 2022-01-26 2022-05-06 郑州云海信息技术有限公司 模型训练方法、铁路接触网异常检测方法及相关装置
CN114627438A (zh) * 2020-11-26 2022-06-14 千寻位置网络有限公司 目标检测模型生成方法、目标检测方法、设备及介质
CN114663397A (zh) * 2022-03-22 2022-06-24 小米汽车科技有限公司 可行驶区域的检测方法、装置、设备及存储介质
CN114782938A (zh) * 2022-03-23 2022-07-22 超级视线科技有限公司 车牌字符识别方法以及装置
CN114792414A (zh) * 2022-03-31 2022-07-26 北京鉴智科技有限公司 一种用于载体的目标变量检测方法及其系统
CN115042821A (zh) * 2022-08-12 2022-09-13 小米汽车科技有限公司 车辆控制方法、装置、车辆及存储介质
CN115205311A (zh) * 2022-07-15 2022-10-18 小米汽车科技有限公司 图像处理方法、装置、车辆、介质及芯片

Patent Citations (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180285663A1 (en) * 2017-03-31 2018-10-04 Here Global B.V. Method and apparatus for augmenting a training data set
CN110084118A (zh) * 2019-03-25 2019-08-02 哈尔滨工业大学(深圳) 行人检测训练数据库的建立方法、行人检测方法及装置
CN110599453A (zh) * 2019-08-08 2019-12-20 武汉精立电子技术有限公司 一种基于图像融合的面板缺陷检测方法、装置及设备终端
CN110619312A (zh) * 2019-09-20 2019-12-27 百度在线网络技术(北京)有限公司 定位元素数据的增强方法、装置、设备及存储介质
US20210199446A1 (en) * 2019-12-31 2021-07-01 Lyft, Inc. Overhead view image generation
US20210303886A1 (en) * 2020-03-31 2021-09-30 Robert Bosch Gmbh Semantically-consistent augmented training data for traffic light detection
CN111832745A (zh) * 2020-06-12 2020-10-27 北京百度网讯科技有限公司 数据增广的方法、装置及电子设备
CN111767853A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 车道线检测方法和装置
WO2022034678A1 (en) * 2020-08-13 2022-02-17 Nec Corporation Image augmentation apparatus, control method, and non-transitory computer-readable storage medium
US20220101047A1 (en) * 2020-09-30 2022-03-31 Nvidia Corporation Data augmentation including background modification for robust prediction using neural networks
CN114627438A (zh) * 2020-11-26 2022-06-14 千寻位置网络有限公司 目标检测模型生成方法、目标检测方法、设备及介质
CN113076904A (zh) * 2021-04-15 2021-07-06 华南理工大学 一种基于深度学习的室外停车场空余车位检测方法
CN113361588A (zh) * 2021-06-03 2021-09-07 北京文安智能技术股份有限公司 基于图像数据增强的图像训练集生成方法和模型训练方法
CN113537105A (zh) * 2021-07-23 2021-10-22 北京经纬恒润科技股份有限公司 一种车位检测方法及装置
CN114155177A (zh) * 2021-11-18 2022-03-08 中汽创智科技有限公司 一种图像增广方法、装置、电子设备及存储介质
CN114066858A (zh) * 2021-11-18 2022-02-18 深圳市商汤科技有限公司 模型训练方法及装置、电子设备和存储介质
CN114444653A (zh) * 2021-12-21 2022-05-06 武汉中海庭数据技术有限公司 一种数据增广对深度学习模型性能影响评估方法及系统
CN114445746A (zh) * 2022-01-26 2022-05-06 郑州云海信息技术有限公司 模型训练方法、铁路接触网异常检测方法及相关装置
CN114663397A (zh) * 2022-03-22 2022-06-24 小米汽车科技有限公司 可行驶区域的检测方法、装置、设备及存储介质
CN114782938A (zh) * 2022-03-23 2022-07-22 超级视线科技有限公司 车牌字符识别方法以及装置
CN114792414A (zh) * 2022-03-31 2022-07-26 北京鉴智科技有限公司 一种用于载体的目标变量检测方法及其系统
CN115205311A (zh) * 2022-07-15 2022-10-18 小米汽车科技有限公司 图像处理方法、装置、车辆、介质及芯片
CN115042821A (zh) * 2022-08-12 2022-09-13 小米汽车科技有限公司 车辆控制方法、装置、车辆及存储介质

Also Published As

Publication number Publication date
CN115345321B (zh) 2023-02-17

Similar Documents

Publication Publication Date Title
CN109711285B (zh) 识别模型的训练、测试方法和装置
CN109766793B (zh) 数据处理方法和装置
CN109977826B (zh) 物体的类别识别方法和装置
CN110647886A (zh) 兴趣点标注方法、装置、计算机设备和存储介质
CN110084230B (zh) 基于图像的车身方向检测方法和装置
CN110727816A (zh) 兴趣点类别确定方法和装置
CN110111018B (zh) 评估车辆感测能力的方法、装置、电子设备及存储介质
CN114596440A (zh) 语义分割模型的生成方法、装置、电子设备及存储介质
JP2021528767A (ja) 視覚的検索方法、装置、コンピュータ機器及び記憶媒体
CN110189242B (zh) 图像处理方法和装置
CN115345321B (zh) 数据增广方法、装置、电子设备及存储介质
CN109521419B (zh) 基于车辆雷达的目标跟踪方法和装置
CN111353273B (zh) 一种雷达数据标注方法、装置、设备及存储介质
CN116126740B (zh) 模型在环测试方法、装置、计算机设备及存储介质
CN112329916A (zh) 模型训练方法、装置、计算机设备及存储介质
CN115527083B (zh) 图像标注方法、装置和电子设备
CN114120259A (zh) 一种空车位识别方法及其系统、计算机设备、存储介质
CN115147474B (zh) 点云标注模型的生成方法、装置、电子设备及存储介质
CN111124862B (zh) 智能设备性能测试方法、装置及智能设备
CN115578386A (zh) 泊车图像生成方法、装置、电子设备及存储介质
CN112287144B (zh) 图片检索方法、设备及存储介质
CN113807354B (zh) 图像语义分割方法、装置、设备和存储介质
CN110647826A (zh) 商品训练图片的获取方法、装置、计算机设备和存储介质
CN113762001B (zh) 一种目标检测方法、装置、电子设备和存储介质
CN113781409B (zh) 一种螺栓松动检测方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant