CN114266879A - 三维数据增强、模型训练检测方法、设备及自动驾驶车辆 - Google Patents

三维数据增强、模型训练检测方法、设备及自动驾驶车辆 Download PDF

Info

Publication number
CN114266879A
CN114266879A CN202111602127.7A CN202111602127A CN114266879A CN 114266879 A CN114266879 A CN 114266879A CN 202111602127 A CN202111602127 A CN 202111602127A CN 114266879 A CN114266879 A CN 114266879A
Authority
CN
China
Prior art keywords
dimensional
data
matrix
transformation
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111602127.7A
Other languages
English (en)
Inventor
刘富强
蔡忠强
郭宇
陈岩
万吉
王军
王亮
马惠敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111602127.7A priority Critical patent/CN114266879A/zh
Publication of CN114266879A publication Critical patent/CN114266879A/zh
Priority to JP2022199273A priority patent/JP2023095806A/ja
Priority to EP22214090.7A priority patent/EP4207072A1/en
Priority to US18/085,264 priority patent/US20230206595A1/en
Priority to KR1020220181821A priority patent/KR20230098058A/ko
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/75Determining position or orientation of objects or cameras using feature-based methods involving models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/753Transform-based matching, e.g. Hough transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/02Affine transformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/10Selection of transformation methods according to the characteristics of the input images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/64Three-dimensional objects
    • G06V20/647Three-dimensional objects by matching two-dimensional images to three-dimensional objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本公开提供了一种三维数据增强、模型训练检测方法、设备及自动驾驶车辆,涉及数据处理领域,具体涉及深度学习、自动驾驶等领域,包括:获取原始二维图像和原始二维图像匹配的真值标注数据;根据目标变换元素对原始二维图像和二维真值标注数据变换得到变换二维图像和变换二维真值标注数据;根据目标变换元素对原始内参矩阵变换得到变换内参矩阵;根据变换内参矩阵对三维真值标注数据进行二维投影得到投影真值标注数据;根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据。本公开实施例能够提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。

Description

三维数据增强、模型训练检测方法、设备及自动驾驶车辆
技术领域
本公开涉及数据处理技术领域,具体涉及深度学习、自动驾驶等技术领域。
背景技术
数据增强(Data Augmentation)是指在不实质性的增加数据的情况下,从原始数据加工出更多的表示,提高原数据的数量及质量,以接近于更多数据量产生的价值。其原理是,通过对原始数据融入先验知识,加工出更多数据的表示,有助于模型判别数据中统计噪声,加强本体特征的学习,减少模型过拟合,提升泛化能力。
发明内容
本公开实施例提供了一种三维数据增强方法、模型训练方法、目标检测方法、装置、设备、存储介质、计算机程序产品及自动驾驶车辆,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。
第一方面,本公开实施例提供了一种三维数据增强方法,包括:
获取原始二维图像和所述原始二维图像匹配的真值标注数据;其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据;
根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据;
根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵;
根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据;
根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
第二方面,本公开实施例提供了一种模型训练方法,包括:
获取目标检测样本数据;其中,所述目标检测样本数据包括原始图像数据以及根据所述原始图像数据进行数据增强得到的三维增强图像数据;所述三维增强图像数据通过上述任一所述三维数据增强方法得到;
根据所述目标检测样本数据训练目标检测网络模型。
第三方面,本公开实施例提供了一种目标检测方法,包括:
获取待检测图像;
将所述待检测图像输入至目标检测网络模型,得到所述目标检测网络模型的目标检测结果;
其中,所述目标检测网络模型通过上述所述的模型训练方法训练得到。
第四方面,本公开实施例提供了一种三维数据增强装置,包括:
图像数据获取模块,用于获取原始二维图像和所述原始二维图像匹配的真值标注数据;其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据;
第一变换模块,用于根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据;
第二变换模块,用于根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵;
二维投影模块,用于根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据;
三维增强图像数据生成模块,用于根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
第五方面,本公开实施例提供了一种模型训练装置,包括:
样本数据获取模块,用于获取目标检测样本数据;其中,所述目标检测样本数据包括原始图像数据以及根据所述原始图像数据进行数据增强得到的三维增强图像数据;所述三维增强图像数据通过上述任一所述三维数据增强装置得到;
模型训练模块,用于根据所述目标检测样本数据训练目标检测网络模型。
第六方面,本公开实施例提供了一种目标检测装置,包括:
待检测图像获取模块,用于获取待检测图像;
目标检测结果获取模块,用于将所述待检测图像输入至目标检测网络模型,得到所述目标检测网络模型的目标检测结果;
其中,所述目标检测网络模型通过上述所述的模型训练装置训练得到。
第七方面,本公开实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面实施例所提供的三维数据增强方法,或执行第二方面实施例所提供的模型训练方法,或执行第三方面实施例所提供的目标检测方法。
第八方面,本公开实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面实施例所提供的三维数据增强方法,或执行第二方面实施例所提供的模型训练方法,或执行第三方面实施例所提供的目标检测方法。
第九方面,本公开实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面实施例所提供的三维数据增强方法,或第二方面实施例所提供的模型训练方法,或第三方面实施例所提供的目标检测方法。
第十方面,本公开实施例还提供了一种自动驾驶车辆,包括第七方面所提供的电子设备。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强。在得到三维增强图像数据之后,可以将原始图像数据和三维增强图像数据作为目标检测样本数据训练目标检测网络模型,从而根据训练得到的目标检测网络模型对待检测图像进行三维目标检测,得到最终的目标检测结果,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,以及根据数据增强后的样本数据训练得到的目标检测网络模型进行三维目标检测时存在的精度和召回率较低等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的一种三维数据增强方法的流程图;
图2是本公开实施例提供的一种三维数据增强方法的流程图;
图3是本公开实施例提供的一种三维数据增强方法的流程图;
图4是本公开实施例提供的一种模型训练方法的流程图;
图5是本公开实施例提供的一种目标检测方法的流程图;
图6是本公开实施例提供的一种三维数据增强装置的结构图;
图7是本公开实施例提供的一种模型训练装置的结构图;
图8是本公开实施例提供的一种目标检测装置的结构图;
图9是用来实现本公开实施例的三维数据增强方法、模型训练方法或目标检测方法的电子设备的结构示意图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
三维目标检测是以物体表面朝向的三维信息来识别完整的三维物体模型,在车联网、智能座舱、智能交通以及自动驾驶等技术领域应用极为广泛。例如,在自动驾驶领域中,可以领用三维目标检测技术来实现对障碍物的3D识别和检测。在三维目标检测技术中,单目3D目标检测是一个重要的技术分支。单目3D目标检测是指利用单个摄像机采集图像,对图像中的检测对象的3D属性,包括位置{x,y,z}(也即检测对象的三维坐标)、大小{H,W,L}(也即检测对象的高、宽和长)以及朝向{theta}等信息进行估计的技术。
在进行单目3D目标检测之前,往往需要利用带有标注数据的图像样本数据训练目标检测网络模型,以根据训练得到的目标检测网络模型实现单目3D目标检测的目的。然而,在对训练的样本数据进行标注时,不仅需要对摄像头的图像数据进行二维标注,还需要对检测对象的3D真值数据进行标注,导致实际的数据标注过程非常耗时,成本非常高。同时,由于在采集标注数据时,大部分数据都是相对重复的场景,比如很多连续帧中出现的障碍物都是相似的,因此样本数据的多样性也难以保证,进而降低了目标检测网络模型的精度和召回率。
为了解决上述问题,现有技术通常需要通过模拟改变相机参数的方法来对相机的等效内参进行变化或修正3D真值,如模拟改变相机焦距、模拟改变相机的感受野或模拟改变相机的位置。还有部分方法通过实例分割将实例级别的障碍物mask(掩膜),通过粘贴的方法,进行3D数据增强。当上述三维数据增强方法处理过程较为繁琐,数据处理成本较高。
在一个示例中,图1是本公开实施例提供的一种三维数据增强方法的流程图,本实施例可适用于在不增加数据采集和数据标注成本的前提下,大量扩充多样性的三维样本数据的情况,该方法可以由三维数据增强装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中。该电子设备可以是终端设备,也可以是服务器设备,本公开实施例并不对电子设备的具体设备类型进行限定。相应的,如图1所示,该方法包括如下操作:
S110、获取原始二维图像和所述原始二维图像匹配的真值标注数据;其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据。
其中,原始二维图像可以是原始采集的二维图像,可以是任意类型的二维图像,如RGB(Red,Green,Blue,三原色)图像、灰度图像或红外图像等,只要可以用于进行目标检测即可,本公开实施例并不对原始二维图像的图像类型和图像内容进行限定。真值标注数据可以是用于对原始二维图像进行标注的数据。二维真值标注数据可以是对原始二维图像的二维信息进行标注的数据,例如可以是二维形式的标注框(bbox)的坐标数据以及关键点的坐标数据等。三维真值标注数据可以是对原始二维图像的三维信息进行标注的数据,例如可以是障碍物的深度、长宽高以及朝向等三维信息。本公开实施例并不对二维真值标注数据和三维真值标注数据的标注对象和数据内容进行限定。可选的,真值标注数据可以是GT(Ground Truth)数据。相应的,二维真值标注数据可以是2D GT数据,三维真值标注数据可以是3D GT数据。
在本公开实施例中,在进行数据增强处理之前,可以获取原始二维图像和原始二维图像匹配的真值标注数据等原始图像数据。原始图像数据的获取方式可以是实时采集并标注,也可以是从存储原始图像数据的数据库下载导出获取。原始图像数据可以是用于自动驾驶的车辆摄像头采集的图像数据以及对图像数据进行标注得到的标注数据,或者还可以是监控摄像头采集的图像数据以及对图像数据进行标注得到的标注数据等,本公开实施例并不对原始二维图像和原始二维图像匹配的真值标注数据的获取方式和数据内容进行限定。
可选的,可以是在获取到原始二维图像之后,对原始二维图像的二维信息和三维信息进行标注,从而得到原始二维图像的二维真值标注数据和三维真值标注数据。
S120、根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据。
其中,目标变换元素可以是对原始图像数据进行变换的元素。示例性的,目标变换元素可以包括但不限于仿射变换矩阵、图像中检测对象的对称线或中心点等,只要能够实现对原始图像数据的变换即可,本公开实施例并不对目标变换元素的元素类型进行限定。变换二维图像可以是根据目标变换元素对原始二维图像进行变换得到的二维图像。变换二维真值标注数据可以是根据目标变换元素对二维真值标注数据进行变换得到的二维真值标注数据。
相应的,在获取到原始二维图像和所述原始二维图像匹配的真值标注数据之后,可以开始对其进行数据增强处理。在数据增强处理过程中,首先需要确定对图像和标注数据进行转换的目标变换元素,进而根据目标变换元素对原始二维图像和二维真值标注数据进行变换,得到匹配的变换二维图像和变换二维真值标注数据。
可以理解的是,根据目标变换元素对原始二维图像进行变换时,可以是对图像进行不同角度的变换,以模拟从不同角度拍摄同一时刻的图像实现对图像数据的扩充。相应的,根据目标变换元素对原始二维图像进行变换后,需要根据相同的原始二维图像进行变换对该原始二维图像匹配的二维真值标注数据进行变换,以保证图像数据和标注数据的一致性和统一性,得到的变换二维图像和变换二维真值标注数据即为一组扩充后的二维图像数据。
可选的,在根据目标变换元素对原始二维图像和二维真值标注数据进行变换之前,还可以判断是否需要进行数据增强处理。可选的,可以通过随机数据的取值来判断是否需要进行数据增强处理。或者,也还可以根据样本数据的丰富程度来判断是否需要进行数据增强处理。
S130、根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵。
其中,内参矩阵是将3D相机坐标变换到2D齐次图像坐标的矩阵,矩阵内的参数可以由相机的相关参数和相机图像的中心点坐标构成。相应的,原始内参矩阵可以是用于对原始二维图像的3D相机坐标变换到2D齐次图像坐标的矩阵,变换内参矩阵可以是用于对变换二维图像的3D相机坐标变换到2D齐次图像坐标的矩阵。
S140、根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据。
其中,投影真值标注数据可以是需要进行二维投影的三维真值标注数据进行二维投影后所得到的二维真值标注数据。所谓二维投影也即将3D相机坐标变换到2D齐次图像坐标。
在根据确定的目标变换元素对原始二维图像和二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据之后,可以进一步根据相同的目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,并根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据。
可以理解的是,部分原始二维图像匹配的三维真值标注数据是不需要进行二维投影的,例如在对图像进行变换时,如果图像中检测对象的深度信息和大小信息没有发生变化,则深度数据和大小数据等三维真值标注数据无需进行二维投影,但需要对检测对象的朝向数据进行相应的变换。因此,可选的,根据变换内参矩阵对三维真值标注数据进行二维投影时,可以选择部分需要投影到2D图像的三维真值标注数据进行二维投影。
S150、根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
其中,三维增强图像数据也即在原始二维图像和原始二维图像匹配的真值标注数据的基础上进行数据增强处理后所得到的扩充后的数据。
在本公开实施例中,根据目标变换元素对一组原始图像数据的原始二维图像和二维真值标注数据进行变换得到的变换二维图像和变换二维真值标注数据,并对该组原始图像数据的三维真值标注数据进行二维投影,得到投影真值标注数据之后,即可根据该组原始图像数据转换后得到的变换二维图像、变换二维真值标注数据和投影真值标注数据生成该组原始图像数据对应扩充的三维增强图像数据。
可以理解的是,根据目标变换元素类型的不同,一组原始图像数据可以对应扩充多组不同的三维增强图像数据。因此,本公开实施例所提供的三维数据增强方法可以在不进行人工标注的前提下,利用目标变换元素对原始图像数据扩充大量的三维增强图像数据。目标变换元素不同,其对应扩充得到的三维增强图像数据也不同,因此能够极大地提高三维增强图像数据的多样性。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性。
在一个示例中,图2是本公开实施例提供的一种三维数据增强方法的流程图,本公开实施例在上述各实施例的技术方案的基础上,进行了优化改进,给出了根据仿射变换矩阵对原始二维图像、二维真值标注数据以及原始内参矩阵进行变换的多种具体可选的实现方式。
如图2所示的一种三维数据增强方法,包括:
S210、获取原始二维图像和所述原始二维图像匹配的真值标注数据。
其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据
S220、根据所述仿射变换矩阵对所述原始二维图像和所述二维真值标注数据进行仿射变换,得到所述变换二维图像和所述变换二维真值标注数据。
在本公开实施例中,可选的,可以将仿射变换矩阵作为目标变换元素,对原始二维图像和二维真值标注数据进行仿射变换,得到对应的变换二维图像和变换二维真值标注数据。
S230、根据所述仿射变换矩阵对所述原始内参矩阵进行仿射变换,得到所述变换内参矩阵。
相应的,在根据仿射变换矩阵对原始二维图像和二维真值标注数据进行仿射变换后,可以利用相同的仿射变换矩阵对原始内参矩阵进行仿射变换,得到变换内参矩阵,以保证变换操作的一致性。
可以理解的是,仿射变换是一种二维坐标到二维坐标之间的线性变换,它保持了二维图形的“平直性”(即:直线经过变换之后依然是直线)和“平行性”(即:二维图形之间的相对位置关系保持不变,平行线依然是平行线,且直线上点的位置顺序不变)。由于仿射变换可以采用多种不同的仿射变换矩阵对原始图像数据进行变换,因此可以得到大量的变换图像数据,从而大幅提高样本数据的数据量。
在本公开的一个可选实施例中,所述仿射变换矩阵包括以下至少一项:缩放变换矩阵、平移变换矩阵、旋转变换矩阵、水平方向错切矩阵、竖直方向错切矩阵、相对原点反射矩阵、沿水平方向反射矩阵以及沿竖直方向反射矩阵。
其中,缩放变换矩阵可以用于对原始图像数据进行缩放变换;平移变换矩阵可以用于对原始图像数据进行平移变换;旋转变换矩阵可以用于对原始图像数据进行旋转变换;水平方向错切矩阵可以用于对原始图像数据进行水平方向错切变换,也即沿x轴方向错切变换;竖直方向错切矩阵可以用于对原始图像数据进行竖直方向错切变换,也即沿y轴方向错切变换;相对原点反射矩阵可以用于对原始图像数据进行相对坐标原点的反射变换;沿水平方向反射矩阵可以用于对原始图像数据进行沿水平方向反射变换,也即沿x轴方向反射变换;沿竖直方向反射矩阵可以用于对原始图像数据进行沿竖直方向反射变换,也即沿y轴方向反射变换。
假设仿射变换矩阵为A,则矩阵A的通用表达方式为:
Figure BDA0003433333910000091
其中,a、b、c、d、e、f为矩阵A的参数,根据仿射变换矩阵类型的不同,上述矩阵A的参数取值也不同。具体的,当仿射变换矩阵为缩放变换矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000092
其中,w表示在x轴方向上的缩放比例,h表示在y轴方向上的缩放比例。当仿射变换矩阵为旋转变换矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000093
其中,XΔ表示在x轴方向上的平移距离,YΔ表示在y轴方向上的平移距离。当仿射变换矩阵为平移变换矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000094
其中,θ表示沿y轴旋转的角度。当仿射变换矩阵为水平方向错切矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000095
其中,
Figure BDA0003433333910000096
表示沿y轴错切的角度。当仿射变换矩阵为竖直方向错切矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000101
其中,γ表示沿x轴错切的角度。当仿射变换矩阵为相对原点反射矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000102
当仿射变换矩阵为沿水平方向反射矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000103
当仿射变换矩阵为沿竖直方向反射矩阵时,矩阵A的表达方式具体可以为:
Figure BDA0003433333910000104
具体的,根据仿射变换矩阵对原始二维图像和二维真值标注数据进行仿射变换时,可以将原始二维图像和二维真值标注数据转换为匹配的矩阵形式。示例性的,原始二维图像的矩阵B可以为:
Figure BDA0003433333910000105
其中,像素点11坐标表示第一行第一列像素点的坐标,像素点1n坐标表示第一行第n列像素点的坐标,像素点n1坐标表示第n行第一列像素点的坐标,像素点nn坐标表示第n行第n列像素点的坐标。以像素点11坐标为例说明,像素点11坐标的表达式可以为(x11,y11,1)。二维真值标注数据的矩阵C可以为:[xb yb 1],其中,xb表示二维真值标注数据的横坐标,yb表示二维真值标注数据的纵坐标。相应的,可以基于表达式:A·B对原始二维图像进行仿射变换,并基于表达式:A·C对二维真值标注数据进行仿射变换。
假设原始内参矩阵为K,则矩阵K的通用表达方式为:
Figure BDA0003433333910000106
其中,fx表示相机在x方向的焦距,fy表示相机在y方向的焦距,fx和fy的值近似于相等。cx表示图像中心点的横坐标,cy表示图像中心点的纵坐标。
相应的,根据仿射变换矩阵对原始内参矩阵进行变换时,可以基于表达式:A·K对原始二维图像进行仿射变换,得到变换内参矩阵K’。也即K’=A·K。具体的,K’的矩阵形式为:
Figure BDA0003433333910000107
示例性的,以沿竖直方向反射矩阵作为目标变换元素为例说明,根据沿竖直方向反射矩阵对原始内参矩阵进行变换得到的K’具体为:
Figure BDA0003433333910000108
S240、根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据。
如果对原始二维图像进行二维投影,则可以基于表达式E=K·D实现原始二维图像中三维点到二维点的投影变换。其中,E表示三维点投影为二维点的坐标,可以为(xe,ye,1),xe为三维点投影为二维点的横坐标,ye为三维点投影为二维点的纵坐标。D为三维点的坐标,可以为(X,Y,Z)。
相应的,根据变换内参矩阵对三维真值标注数据进行二维投影,则可以基于表达式E’=K’·D实现变换二维图像中三维点到二维点的投影变换。
S250、根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性。
在一个示例中,图3是本公开实施例提供的一种三维数据增强方法的流程图,本公开实施例在上述各实施例的技术方案的基础上,进行了优化改进,给出了根据中心对称轴线对原始二维图像、二维真值标注数据以及原始内参矩阵进行变换的多种具体可选的实现方式。
如图3所示的一种三维数据增强方法,包括:
S310、获取原始二维图像和所述原始二维图像匹配的真值标注数据。
其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据。
S320、根据所述中心对称轴线对所述原始二维图像和所述二维真值标注数据进行翻转变换,得到所述变换二维图像和所述变换二维真值标注数据。
其中,中心对称轴线可以是图像中心点所在的竖直线。
除了可以采用仿射变换矩阵实现对二维图像数据的增强处理,还可以采用3DFlip(翻转)的方式对二维图像数据的增强处理。3D Flip的增强处理方式类似于对二维图像数据进行镜像翻转。
S330、根据所述中心对称轴线对所述三维真值标注数据进行翻转变换,得到变换三维真值标注数据。
其中,变换三维真值标注数据可以是是根据中心对称轴线对三维真值标注数据进行变换得到的三维真值标注数据。
具体的,可以以原始二维图像的中心对称轴线为基准,根据中心对称轴线对原始二维图像和二维真值标注数据进行翻转变换,得到变换二维图像和变换二维真值标注数据。在此基础上,还需要根据中心对称轴线对三维真值标注数据进行翻转变换,得到变换三维真值标注数据。
示例性的,假设某一原始二维图像的其中一个二维真值标注数据的坐标值为(x,y),该原始二维图像的其中一个三维真值标注数据的坐标值为(X,Y,Z),该原始二维图像的宽为w0,高为h0,则根据中心对称轴线对二维真值标注数据进行翻转变换得到的变换二维真值标注数据的坐标为(w0-x,h0-y)。根据中心对称轴线对三维真值标注数据进行翻转变换得到的变换三维真值标注数据的坐标为(-X,Y,Z)。
S340、获取所述原始二维图像中目标检测对象的对象中心点的目标变换三维真值标注数据。
其中,目标检测对象也即原始二维图像中需要检测识别的对象,可以是障碍物等任意类型的检测对象,本公开实施例并不对目标检测对象的类型进行限定。对象中心点可以是目标检测对象的中心点。目标变换三维真值标注数据可以是原始二维图像中目标检测对象的对象中心点的三维真值标注数据进行翻转变换后得到的变换三维真值标注数据。
S350、根据所述目标变换三维真值标注数据对所述原始内参矩阵进行变换,得到所述变换内参矩阵。
在本公开实施例中,根据中心对称轴线对原始内参矩阵进行变换时,需要以原始二维图像中目标检测对象的对象中心点的目标变换三维真值标注数据为基准,在目标检测对象的对象中心点的目标变换三维真值标注数据的基础上对原始内参矩阵进行变换,得到变换内参矩阵。
上述技术方案,通过利用中心对称轴线对原始图像数据进行翻转变换,丰富了数据增强的处理方式,可以得到大量的变换图像数据,从而大幅提高样本数据的数据量。
在本公开的一个可选实施例中,所述根据所述目标变换三维真值标注数据对所述原始内参矩阵进行变换,得到所述变换内参矩阵,可以包括:根据所述目标变换三维真值标注数据将所述原始内参矩阵变换为转换方程组;根据所述转换方程组和所述变换内参矩阵的变换矩阵参数构建目标矩阵方程;对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果;根据所述目标矩阵方程求解结果生成所述变换内参矩阵。
其中,转换方程组可以是根据原始内参矩阵的矩阵参数构建的方程组,变换矩阵参数也即变换内参矩阵的参数。目标矩阵方程可以是在转换方程组的基础上,根据变换内参矩阵的变换矩阵参数所构建的矩阵方程,用于求解变换内参矩阵的矩阵参数。目标矩阵方程求解结果也即目标矩阵方程中的未知参数的求解结果。
具体的,为了确定用于翻转变换所采用的变换内参矩阵,可以首先根据目标变换三维真值标注数据将原始内参矩阵变换为转换方程组,进而根据原始内参矩阵和变换内参矩阵的参数对应关系,利用变换内参矩阵的变换矩阵参数对转换方程组中原始内参矩阵的矩阵参数进行替换,得到由变换内参矩阵的变换矩阵参数构建的目标矩阵方程。进一步的,可以对构建的目标矩阵方程求解,得到目标矩阵方程求解结果。由于目标矩阵方程求解结果也即变换内参矩阵的变换矩阵参数的求解结果,因此可以直接根据求解得到的目标矩阵方程求解结果生成变换内参矩阵。
上述技术方案,通过构建方程组的方式将变换内参矩阵的变换矩阵参数引入矩阵方程,可以实现采用数据推导的流程快速求解变换内参矩阵的变换矩阵参数。
在本公开的一个可选实施例中,所述根据所述目标变换三维真值标注数据将所述原始内参矩阵变换为转换方程组,可以包括:根据所述目标变换三维真值标注数据和所述原始内参矩阵,获取所述目标检测对象的对象中心点在所述原始二维图像的目标归一化投影坐标;根据所述目标归一化投影坐标和所述目标变换三维真值标注数据将所述原始内参矩阵变换为所述转换方程组。
其中,目标归一化投影坐标也即目标检测对象的对象中心点在二维图像上的归一化投影坐标。
具体的,假设目标检测对象的对象中心点的三维真值标注数据为(X0,Y0,Z0),则目标变换三维真值标注数据为(-X0,Y0,Z0),为已知量。原始内参矩阵为
Figure BDA0003433333910000131
由于fx≈fy,因此,原始内参矩阵可以近似表示为
Figure BDA0003433333910000132
所以,可以根据目标变换三维真值标注数据和原始内参矩阵构建一个原始公式:
Figure BDA0003433333910000141
其中,u和v是两个未知量,具体是目标检测对象的对象中心点在原始二维图像的目标归一化投影坐标。将上述原始公式进行变形,即可得到转换方程组:
Figure BDA0003433333910000142
转换方程组的构建可以有效将原始内参矩阵通过方程组的形式进行表达,有利于后续推导求解变换内参矩阵的变换矩阵参数。
在本公开的一个可选实施例中,所述根据所述转换方程组和所述变换内参矩阵的变换矩阵参数构建目标矩阵方程,可以包括:根据所述转换方程组、和所述变换内参矩阵的变换矩阵参数构建目标方程组;根据所述目标方程组构建基准矩阵方程;根据所述变换三维真值标注数据对所述基准矩阵方程的矩阵元素进行扩充,得到所述目标矩阵方程。
其中,目标方程组可以是由转换方程组进一步转换的方程组。基准矩阵方程可以是由目标方程组转换得到的矩阵方程。
可以理解的是,由于经过翻转变换后,原始内参矩阵同样需要翻转变换为变换内参矩阵,因此,上述原始公式中需要采用变换内参矩阵求解目标检测对象的对象中心点在原始二维图像的目标归一化投影坐标。相应的,转换方程组内的原始内参矩阵的矩阵参数被变换内参矩阵的变换矩阵参数替换,得到对应的目标方程组:
Figure BDA0003433333910000143
其中,f'、cx'和cy'为变换矩阵参数。也即变换内参矩阵具体为:
Figure BDA0003433333910000144
进一步的,目标方程组可以抽象为Px–b=0,其中,P为未知量的矩阵形式的系数,b为常数项。Px–b=0可以进一步转换为矩阵方程:
Figure BDA0003433333910000145
其中,
Figure BDA0003433333910000146
对该矩阵方程进一步进行变形,将b的相关取值左移,得到基准矩阵方程:
Figure BDA0003433333910000147
其中,P的值更新为
Figure BDA0003433333910000148
由于基准矩阵方程中存在多个未知数,包括目标归一化投影坐标和变换内参矩阵的变换矩阵参数,因此,需要对基准矩阵方程进行扩充,提高基准矩阵方程的维度,才能够对基准矩阵方程中的未知数进行求解。因此,可以从已知的变换三维真值标注数据中选取多组已知量对基准矩阵方程的矩阵元素进行扩充。可选的,为了得到更好的求解效果,可以选取8组已知的变换三维真值标注数据对基准矩阵方程的矩阵元素进行扩充,得到最终的目标矩阵方程:
Figure BDA0003433333910000151
其中,(-X1,Y1,Z1)表示其中一组已知的变换三维真值标注数据。
上述技术方案,通过利用多组变换三维真值标注数据对目标方程组构建基准矩阵方程的矩阵元素进行扩充,可以保证目标矩阵方程能够被有效求解,从而提高目标矩阵方程的求解效率。
在本公开的一个可选实施例中,所述对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果,可以包括:确定目标最小二乘求解方法;根据所述目标最小二乘求解方法对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果。
其中,目标最小二乘求解方法可以是任意一种最小二乘求解方法。
在本公开实施例中,可以采用一种最小二乘求解方法作为目标最小二乘求解方法对目标矩阵方程进行求解,得到目标矩阵方程求解结果。
示例性的,针对目标矩阵方程:
Figure BDA0003433333910000152
可以采用SVD(Singular Value Decomposition,奇异值分解)的方式进行最小二乘求解,得到
Figure BDA0003433333910000153
的最终求解结果。进而可以根据已知的
Figure BDA0003433333910000154
构建变换内参矩阵:
Figure BDA0003433333910000155
上述技术方案,通过利用最小二乘求解方法可以简便快速地求解变换内参矩阵的变换矩阵参数。
S360、根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据。
S370、根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性。
在一个示例中,图4是本公开实施例提供的一种模型训练方法的流程图,本实施例可适用于利用上述数据增强处理方法处理得到的三维样本数据训练目标检测网络模型的情况,该方法可以由模型训练装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中。该电子设备可以是终端设备,也可以是服务器设备,本公开实施例并不对电子设备的具体设备类型进行限定。相应的,如图4所示,该方法包括如下操作:
S410、获取目标检测样本数据。
其中,目标检测样本数据也即用于训练目标检测网络模型的样本数据。可选的,目标检测样本数据可以包括原始图像数据以及根据原始图像数据进行数据增强得到的三维增强图像数据;三维增强图像数据可以通过上述任一所述三维数据增强方法得到。
其中,原始图像数据可以是原始二维图像和原始二维图像匹配的真值标注数据等未经数据增强处理的数据。
S420、根据所述目标检测样本数据训练目标检测网络模型。
其中,目标检测网络模型可以用于根据获取的图像进行三维目标检测,可以用于检测三维的障碍物或追踪对象等任意类型的检测对象。可选的,目标检测网络模型可以是任意类型经深度学习得到的网络模型,如卷积神经网络模型等,本公开实施例并不对目标检测网络模型的模型类型进行限定。
在本公开实施例中,在获取到原始图像数据后,可以将原始图像数据中的原始二维图像和原始二维图像匹配的真值标注数据采用上述任一所述三维数据增强方法进行数据增强处理,得到扩充的三维增强图像数据。该三维增强图像数据可以包括转换的二维图像以及该转换的二维图像匹配的转换的二维真值标注数据和转换的三维真值标注数据。相应的,在得到三维增强图像数据之后,即可将原始图像数据以及根据原始图像数据进行数据增强得到的三维增强图像数据同时作为目标检测样本数据,并将目标检测样本数据输入至目标检测网络模型,以训练目标检测网络模型。
由于三维增强图像数据实现了对原始图像数据的大量扩充,其数据量和数据的多样性更丰富,因此能够满足目标检测网络模型的训练需求,从而保证目标检测网络模型的精度和召回率。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强。在得到三维增强图像数据之后,可以将原始图像数据和三维增强图像数据作为目标检测样本数据训练目标检测网络模型,从而根据训练得到的目标检测网络模型对待检测图像进行三维目标检测,得到最终的目标检测结果,解决现有根据数据增强后的样本数据训练得到的目标检测网络模型进行三维目标检测时存在的精度和召回率较低等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。
在一个示例中,图5是本公开实施例提供的一种目标检测方法的流程图,本实施例可适用于利用上述模型训练方法训练得到的目标检测网络模型进行三维目标检测的情况,该方法可以由目标检测装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在电子设备中。该电子设备可以是终端设备,也可以是服务器设备,本公开实施例并不对电子设备的具体设备类型进行限定。相应的,如图5所示,该方法包括如下操作:
S510、获取待检测图像。
其中,待检测图像可以是需要进行三维目标检测的图像。
S520、将所述待检测图像输入至目标检测网络模型,得到所述目标检测网络模型的目标检测结果。
其中,所述目标检测网络模型通过上述所述的模型训练方法训练得到。
在本公开实施例中,当目标检测网络模型训练完成后,即可获取需要进行三维目标检测的待检测图像,并将待检测图像输入至目标检测网络模型,通过目标检测网络模型输出的目标检测结果实现对待检测图像的自动检测。
由于训练目标检测网络模型的样本数据采用了原始图像数据以及根据原始图像数据进行数据增强得到的三维增强图像数据,而三维增强图像数据实现了对原始图像数据的大量扩充,其数据量和数据的多样性更丰富,因此能够满足目标检测网络模型的训练需求,从而保证目标检测网络模型的精度和召回率。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强。在得到三维增强图像数据之后,可以将原始图像数据和三维增强图像数据作为目标检测样本数据训练目标检测网络模型,从而根据训练得到的目标检测网络模型对待检测图像进行三维目标检测,得到最终的目标检测结果,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,以及根据数据增强后的样本数据训练得到的目标检测网络模型进行三维目标检测时存在的精度和召回率较低等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。
需要说明的是,以上各实施例中各技术特征之间的任意排列组合也属于本公开的保护范围。
在一个示例中,图6是本公开实施例提供的一种三维数据增强装置的结构图,本公开实施例可适用于在不增加数据采集和数据标注成本的前提下,大量扩充多样性的三维样本数据的情况,该装置通过软件和/或硬件实现,并具体配置于电子设备中。该电子设备可以是终端设备,也可以是服务器设备,本公开实施例并不对电子设备的具体设备类型进行限定。
如图6所示的一种三维数据增强装置600,包括:图像数据获取模块610、第一变换模块620、第二变换模块630、二维投影模块640和三维增强图像数据生成模块650。其中,
图像数据获取模块610,用于获取原始二维图像和所述原始二维图像匹配的真值标注数据;其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据;
第一变换模块620,用于根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据;
第二变换模块630,用于根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵;
二维投影模块640,用于根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据;
三维增强图像数据生成模块650,用于根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性。
可选的,所述目标变换元素包括仿射变换矩阵;第一变换模块620具体用于:根据所述仿射变换矩阵对所述原始二维图像和所述二维真值标注数据进行仿射变换,得到所述变换二维图像和所述变换二维真值标注数据;第二变换模块630具体用于:根据所述仿射变换矩阵对所述原始内参矩阵进行仿射变换,得到所述变换内参矩阵。
可选的,所述仿射变换矩阵包括以下至少一项:缩放变换矩阵、平移变换矩阵、旋转变换矩阵、水平方向错切矩阵、竖直方向错切矩阵、相对原点反射矩阵、沿水平方向反射矩阵以及沿竖直方向反射矩阵。
可选的,所述目标变换元素包括中心对称轴线;第一变换模块620具体用于:根据所述中心对称轴线对所述原始二维图像和所述二维真值标注数据进行翻转变换,得到所述变换二维图像和所述变换二维真值标注数据;第二变换模块630具体用于:根据所述中心对称轴线对所述三维真值标注数据进行翻转变换,得到变换三维真值标注数据;获取所述原始二维图像中目标检测对象的对象中心点的目标变换三维真值标注数据;根据所述目标变换三维真值标注数据对所述原始内参矩阵进行变换,得到所述变换内参矩阵。
可选的,第二变换模块630具体用于:根据所述目标变换三维真值标注数据将所述原始内参矩阵变换为转换方程组;根据所述转换方程组和所述变换内参矩阵的变换矩阵参数构建目标矩阵方程;对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果;根据所述目标矩阵方程求解结果生成所述变换内参矩阵。
可选的,第二变换模块630具体用于:根据所述目标变换三维真值标注数据和所述原始内参矩阵,获取所述目标检测对象的对象中心点在所述原始二维图像的目标归一化投影坐标;根据所述目标归一化投影坐标和所述目标变换三维真值标注数据将所述原始内参矩阵变换为所述转换方程组。
可选的,第二变换模块630具体用于:根据所述转换方程组、和所述变换内参矩阵的变换矩阵参数构建目标方程组;根据所述目标方程组构建基准矩阵方程;根据所述变换三维真值标注数据对所述基准矩阵方程的矩阵元素进行扩充,得到所述目标矩阵方程。
可选的,第二变换模块630具体用于:确定目标最小二乘求解方法;根据所述目标最小二乘求解方法对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果。
上述三维数据增强装置可执行本公开任意实施例所提供的三维数据增强方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开任意实施例提供的三维数据增强方法。
由于上述所介绍的三维数据增强装置为可以执行本公开实施例中的三维数据增强方法的装置,故而基于本公开实施例中所介绍的三维数据增强方法,本领域所属技术人员能够了解本实施例的三维数据增强装置的具体实施方式以及其各种变化形式,所以在此对于该三维数据增强装置如何实现本公开实施例中的三维数据增强方法不再详细介绍。只要本领域所属技术人员实施本公开实施例中三维数据增强方法所采用的装置,都属于本公开所欲保护的范围。
在一个示例中,图7是本公开实施例提供的一种模型训练装置的结构图,本公开实施例可适用于利用上述数据增强处理方法处理得到的三维样本数据训练目标检测网络模型的情况,该装置通过软件和/或硬件实现,并具体配置于电子设备中。该电子设备可以是终端设备,也可以是服务器设备,本公开实施例并不对电子设备的具体设备类型进行限定。
如图7所示的一种模型训练装置700,包括:样本数据获取模块710和模型训练模块720。其中,
样本数据获取模块710,用于获取目标检测样本数据;其中,所述目标检测样本数据包括原始图像数据以及根据所述原始图像数据进行数据增强得到的三维增强图像数据;所述三维增强图像数据通过上述任一所述三维数据增强装置得到;
模型训练模块720,用于根据所述目标检测样本数据训练目标检测网络模型。
上述模型训练装置可执行本公开任意实施例所提供的模型训练方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开任意实施例提供的模型训练方法。
由于上述所介绍的模型训练装置为可以执行本公开实施例中的模型训练方法的装置,故而基于本公开实施例中所介绍的模型训练方法,本领域所属技术人员能够了解本实施例的模型训练装置的具体实施方式以及其各种变化形式,所以在此对于该模型训练装置如何实现本公开实施例中的模型训练方法不再详细介绍。只要本领域所属技术人员实施本公开实施例中模型训练方法所采用的装置,都属于本公开所欲保护的范围。
在一个示例中,图8是本公开实施例提供的一种目标检测装置的结构图,本公开实施例可适用于利用上述模型训练方法训练得到的目标检测网络模型进行三维目标检测的情况,该装置通过软件和/或硬件实现,并具体配置于电子设备中。该电子设备可以是终端设备,也可以是服务器设备,本公开实施例并不对电子设备的具体设备类型进行限定。
如图8所示的一种目标检测装置800,包括:待检测图像获取模块810和目标检测结果获取模块820。其中,
待检测图像获取模块810,用于获取待检测图像;
目标检测结果获取模块820,用于将所述待检测图像输入至目标检测网络模型,得到所述目标检测网络模型的目标检测结果;
其中,所述目标检测网络模型通过上述所述的模型训练装置训练得到。
上述目标检测装置可执行本公开任意实施例所提供的目标检测方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本公开任意实施例提供的目标检测方法。
由于上述所介绍的目标检测装置为可以执行本公开实施例中的目标检测方法的装置,故而基于本公开实施例中所介绍的目标检测方法,本领域所属技术人员能够了解本实施例的目标检测装置的具体实施方式以及其各种变化形式,所以在此对于该目标检测装置如何实现本公开实施例中的目标检测方法不再详细介绍。只要本领域所属技术人员实施本公开实施例中目标检测方法所采用的装置,都属于本公开所欲保护的范围。
在一个示例中,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如三维数据增强方法、模型训练方法或目标检测方法。例如,在一些实施例中,三维数据增强方法、模型训练方法或目标检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的三维数据增强方法、模型训练方法或目标检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行三维数据增强方法、模型训练方法或目标检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器还可以分布式系统的服务器,或者是结合了区块链的服务器。
本公开实施例通过利用目标变换元素对获取的原始二维图像和原始二维图像匹配的二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,并根据目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,以根据变换内参矩阵对三维真值标注数据进行二维投影,得到投影真值标注数据,最终根据变换二维图像、变换二维真值标注数据和投影真值标注数据生成三维增强图像数据,实现对原始二维图像和其匹配的真值标注数据进行数据增强。在得到三维增强图像数据之后,可以将原始图像数据和三维增强图像数据作为目标检测样本数据训练目标检测网络模型,从而根据训练得到的目标检测网络模型对待检测图像进行三维目标检测,得到最终的目标检测结果,解决现有对三维目标检测的样本数据进行数据增强处理时存在的数据标注成本高以及难以保证数据多样性等问题,以及根据数据增强后的样本数据训练得到的目标检测网络模型进行三维目标检测时存在的精度和召回率较低等问题,能够在不增加数据采集和数据标注成本的前提下,大量扩充三维样本数据,提高三维样本数据的多样性,进而提高三维目标检测的精度和召回率。
在上述实施例的基础上,本公开实施例还提供了一种自动驾驶车辆,包括车体,还包括上述实施例所述的电子设备。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (24)

1.一种三维数据增强方法,包括:
获取原始二维图像和所述原始二维图像匹配的真值标注数据;其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据;
根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据;
根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵;
根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据;
根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
2.根据权利要求1所述的方法,其中,所述目标变换元素包括仿射变换矩阵;所述根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,包括:
根据所述仿射变换矩阵对所述原始二维图像和所述二维真值标注数据进行仿射变换,得到所述变换二维图像和所述变换二维真值标注数据;
所述根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,包括:
根据所述仿射变换矩阵对所述原始内参矩阵进行仿射变换,得到所述变换内参矩阵。
3.根据权利要求2所述的方法,其中,所述仿射变换矩阵包括以下至少一项:缩放变换矩阵、平移变换矩阵、旋转变换矩阵、水平方向错切矩阵、竖直方向错切矩阵、相对原点反射矩阵、沿水平方向反射矩阵以及沿竖直方向反射矩阵。
4.根据权利要求1所述的方法,其中,所述目标变换元素包括中心对称轴线;所述根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据,包括:
根据所述中心对称轴线对所述原始二维图像和所述二维真值标注数据进行翻转变换,得到所述变换二维图像和所述变换二维真值标注数据;
所述根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵,包括:
根据所述中心对称轴线对所述三维真值标注数据进行翻转变换,得到变换三维真值标注数据;
获取所述原始二维图像中目标检测对象的对象中心点的目标变换三维真值标注数据;
根据所述目标变换三维真值标注数据对所述原始内参矩阵进行变换,得到所述变换内参矩阵。
5.根据权利要求4所述的方法,其中,所述根据所述目标变换三维真值标注数据对所述原始内参矩阵进行变换,得到所述变换内参矩阵,包括:
根据所述目标变换三维真值标注数据将所述原始内参矩阵变换为转换方程组;
根据所述转换方程组和所述变换内参矩阵的变换矩阵参数构建目标矩阵方程;
对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果;
根据所述目标矩阵方程求解结果生成所述变换内参矩阵。
6.根据权利要求5所述的方法,其中,所述根据所述目标变换三维真值标注数据将所述原始内参矩阵变换为转换方程组,包括:
根据所述目标变换三维真值标注数据和所述原始内参矩阵,获取所述目标检测对象的对象中心点在所述原始二维图像的目标归一化投影坐标;
根据所述目标归一化投影坐标和所述目标变换三维真值标注数据将所述原始内参矩阵变换为所述转换方程组。
7.根据权利要求6所述的方法,其中,所述根据所述转换方程组和所述变换内参矩阵的变换矩阵参数构建目标矩阵方程,包括:
根据所述转换方程组、和所述变换内参矩阵的变换矩阵参数构建目标方程组;
根据所述目标方程组构建基准矩阵方程;
根据所述变换三维真值标注数据对所述基准矩阵方程的矩阵元素进行扩充,得到所述目标矩阵方程。
8.根据权利要求5所述的方法,其中,所述对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果,包括:
确定目标最小二乘求解方法;
根据所述目标最小二乘求解方法对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果。
9.一种模型训练方法,包括:
获取目标检测样本数据;其中,所述目标检测样本数据包括原始图像数据以及根据所述原始图像数据进行数据增强得到的三维增强图像数据;所述三维增强图像数据通过权利要求1-8任一所述三维数据增强方法得到;
根据所述目标检测样本数据训练目标检测网络模型。
10.一种目标检测方法,包括:
获取待检测图像;
将所述待检测图像输入至目标检测网络模型,得到所述目标检测网络模型的目标检测结果;
其中,所述目标检测网络模型通过权利要求9所述的模型训练方法训练得到。
11.一种三维数据增强装置,包括:
图像数据获取模块,用于获取原始二维图像和所述原始二维图像匹配的真值标注数据;其中,所述真值标注数据包括二维真值标注数据和三维真值标注数据;
第一变换模块,用于根据目标变换元素对所述原始二维图像和所述二维真值标注数据进行变换,得到变换二维图像和变换二维真值标注数据;
第二变换模块,用于根据所述目标变换元素对原始内参矩阵进行变换,得到变换内参矩阵;
二维投影模块,用于根据所述变换内参矩阵对所述三维真值标注数据进行二维投影,得到投影真值标注数据;
三维增强图像数据生成模块,用于根据所述变换二维图像、所述变换二维真值标注数据和所述投影真值标注数据生成三维增强图像数据。
12.根据权利要求11所述的装置,其中,所述目标变换元素包括仿射变换矩阵;所述第一变换模块具体用于:
根据所述仿射变换矩阵对所述原始二维图像和所述二维真值标注数据进行仿射变换,得到所述变换二维图像和所述变换二维真值标注数据;
所述第二变换模块具体用于:根据所述仿射变换矩阵对所述原始内参矩阵进行仿射变换,得到所述变换内参矩阵。
13.根据权利要求12所述的装置,其中,所述仿射变换矩阵包括以下至少一项:缩放变换矩阵、平移变换矩阵、旋转变换矩阵、水平方向错切矩阵、竖直方向错切矩阵、相对原点反射矩阵、沿水平方向反射矩阵以及沿竖直方向反射矩阵。
14.根据权利要求11所述的装置,其中,所述目标变换元素包括中心对称轴线;所述第一变换模块具体用于:
根据所述中心对称轴线对所述原始二维图像和所述二维真值标注数据进行翻转变换,得到所述变换二维图像和所述变换二维真值标注数据;
所述第二变换模块具体用于:
根据所述中心对称轴线对所述三维真值标注数据进行翻转变换,得到变换三维真值标注数据;
获取所述原始二维图像中目标检测对象的对象中心点的目标变换三维真值标注数据;
根据所述目标变换三维真值标注数据对所述原始内参矩阵进行变换,得到所述变换内参矩阵。
15.根据权利要求14所述的装置,其中,所述第二变换模块具体用于:
根据所述目标变换三维真值标注数据将所述原始内参矩阵变换为转换方程组;
根据所述转换方程组和所述变换内参矩阵的变换矩阵参数构建目标矩阵方程;
对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果;
根据所述目标矩阵方程求解结果生成所述变换内参矩阵。
16.根据权利要求15所述的装置,其中,所述第二变换模块具体用于:
根据所述目标变换三维真值标注数据和所述原始内参矩阵,获取所述目标检测对象的对象中心点在所述原始二维图像的目标归一化投影坐标;
根据所述目标归一化投影坐标和所述目标变换三维真值标注数据将所述原始内参矩阵变换为所述转换方程组。
17.根据权利要求16所述的装置,其中,所述第二变换模块具体用于:
根据所述转换方程组、和所述变换内参矩阵的变换矩阵参数构建目标方程组;
根据所述目标方程组构建基准矩阵方程;
根据所述变换三维真值标注数据对所述基准矩阵方程的矩阵元素进行扩充,得到所述目标矩阵方程。
18.根据权利要求15所述的装置,其中,所述第二变换模块具体用于:
确定目标最小二乘求解方法;
根据所述目标最小二乘求解方法对所述目标矩阵方程进行求解,得到目标矩阵方程求解结果。
19.一种模型训练装置,包括:
样本数据获取模块,用于获取目标检测样本数据;其中,所述目标检测样本数据包括原始图像数据以及根据所述原始图像数据进行数据增强得到的三维增强图像数据;所述三维增强图像数据通过权利要求11-18任一所述三维数据增强装置得到;
模型训练模块,用于根据所述目标检测样本数据训练目标检测网络模型。
20.一种目标检测装置,包括:
待检测图像获取模块,用于获取待检测图像;
目标检测结果获取模块,用于将所述待检测图像输入至目标检测网络模型,得到所述目标检测网络模型的目标检测结果;
其中,所述目标检测网络模型通过权利要求19所述的模型训练装置训练得到。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的三维数据增强方法,或者实现如权利要求9所述的模型训练方法,或者实现如权利要求10所述的目标检测方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行权利要求1-8中任一项所述的三维数据增强方法,或者实现如权利要求9所述的模型训练方法,或者实现如权利要求10所述的目标检测方法。
23.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-8中任一项所述的三维数据增强方法,或者实现如权利要求9所述的模型训练方法,或者实现如权利要求10所述的目标检测方法。
24.一种自动驾驶车辆,包括如权利要求21所述的电子设备。
CN202111602127.7A 2021-12-24 2021-12-24 三维数据增强、模型训练检测方法、设备及自动驾驶车辆 Pending CN114266879A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN202111602127.7A CN114266879A (zh) 2021-12-24 2021-12-24 三维数据增强、模型训练检测方法、设备及自动驾驶车辆
JP2022199273A JP2023095806A (ja) 2021-12-24 2022-12-14 三次元データ強化、モデルトレーニング検出方法、機器および自動運転車両
EP22214090.7A EP4207072A1 (en) 2021-12-24 2022-12-16 Three-dimensional data augmentation method, model training and detection method, device, and autonomous vehicle
US18/085,264 US20230206595A1 (en) 2021-12-24 2022-12-20 Three-dimensional data augmentation method, model training and detection method, device, and autonomous vehicle
KR1020220181821A KR20230098058A (ko) 2021-12-24 2022-12-22 3차원 데이터 증강 방법, 모델 트레이닝 검출 방법, 설비 및 자율 주행 차량

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111602127.7A CN114266879A (zh) 2021-12-24 2021-12-24 三维数据增强、模型训练检测方法、设备及自动驾驶车辆

Publications (1)

Publication Number Publication Date
CN114266879A true CN114266879A (zh) 2022-04-01

Family

ID=80829950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111602127.7A Pending CN114266879A (zh) 2021-12-24 2021-12-24 三维数据增强、模型训练检测方法、设备及自动驾驶车辆

Country Status (5)

Country Link
US (1) US20230206595A1 (zh)
EP (1) EP4207072A1 (zh)
JP (1) JP2023095806A (zh)
KR (1) KR20230098058A (zh)
CN (1) CN114266879A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117689683B (zh) * 2024-02-01 2024-05-03 江苏一影医疗设备有限公司 一种双腿膝关节运动状态图像处理方法、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063748A (zh) * 2018-07-16 2018-12-21 重庆大学 基于数据增强的目标检测方法
CN113034567A (zh) * 2021-03-31 2021-06-25 奥比中光科技集团股份有限公司 一种深度真值获取方法、装置、系统及深度相机
CN113128434A (zh) * 2021-04-27 2021-07-16 南京大学 一种对单目rgb图像进行3d目标检测的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063748A (zh) * 2018-07-16 2018-12-21 重庆大学 基于数据增强的目标检测方法
CN113034567A (zh) * 2021-03-31 2021-06-25 奥比中光科技集团股份有限公司 一种深度真值获取方法、装置、系统及深度相机
CN113128434A (zh) * 2021-04-27 2021-07-16 南京大学 一种对单目rgb图像进行3d目标检测的方法

Also Published As

Publication number Publication date
US20230206595A1 (en) 2023-06-29
EP4207072A1 (en) 2023-07-05
JP2023095806A (ja) 2023-07-06
KR20230098058A (ko) 2023-07-03

Similar Documents

Publication Publication Date Title
EP3506161A1 (en) Method and apparatus for recovering point cloud data
CN113377888B (zh) 训练目标检测模型和检测目标的方法
US20210272306A1 (en) Method for training image depth estimation model and method for processing image depth information
US20220222951A1 (en) 3d object detection method, model training method, relevant devices and electronic apparatus
US11967132B2 (en) Lane marking detecting method, apparatus, electronic device, storage medium, and vehicle
CN113792851B (zh) 字体生成模型训练方法、字库建立方法、装置及设备
CN113724388B (zh) 高精地图的生成方法、装置、设备以及存储介质
CN112528858A (zh) 人体姿态估计模型的训练方法、装置、设备、介质及产品
CN112509126A (zh) 三维物体检测的方法、装置、设备及存储介质
CN112580666A (zh) 图像特征的提取方法、训练方法、装置、电子设备及介质
EP4207072A1 (en) Three-dimensional data augmentation method, model training and detection method, device, and autonomous vehicle
CN114359932A (zh) 文本检测方法、文本识别方法及装置
EP4318314A1 (en) Image acquisition model training method and apparatus, image detection method and apparatus, and device
CN116740665A (zh) 一种基于三维交并比的点云目标检测方法及装置
CN114511862B (zh) 表格识别方法、装置及电子设备
CN116129422A (zh) 单目3d目标检测方法、装置、电子设备和存储介质
CN113379884B (zh) 地图渲染方法、装置、电子设备、存储介质以及车辆
CN113361371B (zh) 道路提取方法、装置、设备以及存储介质
CN113901903A (zh) 道路识别方法和装置
CN113781653A (zh) 对象模型生成方法、装置、电子设备及存储介质
CN113205131A (zh) 图像数据的处理方法、装置、路侧设备和云控平台
CN113312979B (zh) 图像处理方法、装置、电子设备、路侧设备及云控平台
CN113762397B (zh) 检测模型训练、高精度地图更新方法、设备、介质及产品
US20230162383A1 (en) Method of processing image, device, and storage medium
Xie et al. Power Line Detection based on Subpixel-Neighborhood Attention in complex terrain backgrounds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination