CN114913213B - 一种鸟瞰特征的学习方法和装置 - Google Patents

一种鸟瞰特征的学习方法和装置 Download PDF

Info

Publication number
CN114913213B
CN114913213B CN202210536993.9A CN202210536993A CN114913213B CN 114913213 B CN114913213 B CN 114913213B CN 202210536993 A CN202210536993 A CN 202210536993A CN 114913213 B CN114913213 B CN 114913213B
Authority
CN
China
Prior art keywords
grid
aerial view
learning
model
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210536993.9A
Other languages
English (en)
Other versions
CN114913213A (zh
Inventor
张雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Qingyu Technology Co Ltd
Original Assignee
Suzhou Qingyu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Qingyu Technology Co Ltd filed Critical Suzhou Qingyu Technology Co Ltd
Priority to CN202210536993.9A priority Critical patent/CN114913213B/zh
Publication of CN114913213A publication Critical patent/CN114913213A/zh
Application granted granted Critical
Publication of CN114913213B publication Critical patent/CN114913213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/30Determination of transform parameters for the alignment of images, i.e. image registration
    • G06T7/33Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10028Range image; Depth image; 3D point clouds

Abstract

本发明实施例涉及一种鸟瞰特征的学习方法和装置,所述方法包括:步骤1获取训练集;步骤2提取第一图像、点云;步骤3构建栅格空间;步骤4进行鸟瞰特征图转换;根据栅格空间和第一特征图构建第一占据栅格图;根据栅格空间和第一点云构建第二占据栅格图;步骤5以第二占据栅格图为真值、第一占据栅格图为预测,以二值交叉熵损失函数计算第一损失值;步骤6第一损失值满足合理损失值范围则对学习计数器加1,不满足则清零;步骤7学习计数器等于0则对模型参数进行反向调制并转至步骤2,大于0但小于计数器阈值则转至步骤2,大于或等于计数器阈值则转至8;步骤8将鸟瞰特征提取模型标记为成熟模型。通过本发明可改善模型的鸟瞰特征转换准确度。

Description

一种鸟瞰特征的学习方法和装置
技术领域
本发明涉及数据处理技术领域,特别涉及一种鸟瞰特征的学习方法和装置。
背景技术
无人驾驶系统的感知模块若能以鸟瞰(Bird’s Eye View,BEV)图作为参考进行多目标跟踪,可以简化跟踪步骤、提高跟踪效率。但感知模块从相机获取的实景图像是不带深度信息的,需要另行开发定制模型按透视原理对实景图像进行鸟瞰特征图转换,再以鸟瞰特征图为参考进行多目标跟踪。在这个过程中,若定制模型的鸟瞰特征转换准确度不能得到保证则最终的多目标跟踪结果也无法得到有效保障,因此需要为该定制模型设计一个对应的鸟瞰特征学习方法来对其特征转换准确度进行监督。
发明内容
本发明的目的,就是针对现有技术的缺陷,提供一种鸟瞰特征的学习方法、装置、电子设备及计算机可读存储介质,通过本发明,可帮助定制模型对鸟瞰特征进行有效学习,还可改善模型的鸟瞰特征转换准确度。
为实现上述目的,本发明实施例第一方面提供了一种鸟瞰特征的学习方法,所述方法包括:
步骤1,获取训练集;所述训练集由多组训练数据对构成;每组所述训练数据对由一对经过配准的实景图像和激光雷达点云构成;
步骤2,从所述训练集中提取所述训练数据对作为对应的第一训练数据对;并从所述第一训练数据对中,提取所述实景图像作为对应的第一图像,提取所述激光雷达点云作为对应的第一点云;
步骤3,构建三维的栅格空间;
步骤4,使用鸟瞰特征提取模型对所述第一图像进行鸟瞰特征图转换生成对应的第一特征图;并根据所述栅格空间和所述第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;并根据所述栅格空间和所述第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;
步骤5,以所述第二占据栅格图为真值对象,以所述第一占据栅格图为预测对象,并以二值交叉熵损失函数为损失函数对所述预测对象与所述真值对象的损失值进行计算得到对应的第一损失值;
步骤6,判断所述第一损失值是否满足预设的合理损失值范围,若满足则对预设的学习计数器进行加1,若不满足则对所述学习计数器清零;
步骤7,若所述学习计数器等于0则对所述鸟瞰特征提取模型的模型参数进行反向调制并在调制完成后转至步骤2继续学习;若所述学习计数器大于0但小于预设的计数器阈值则转至步骤2继续学习;若所述学习计数器大于或等于所述计数器阈值则转至步骤8;
步骤8,将所述鸟瞰特征提取模型标记为成熟模型。
优选的,所述构建三维的栅格空间,具体包括:
以自车坐标系作为参考构建栅格空间三维坐标系,具体以预设的自车左间距l1作为左平移距离、以预设的自车后间距l2作为后平移距离对自车坐标系的原点坐标进行对应的向左、向后平移从而得到所述栅格空间三维坐标系;
根据所述自车左间距l1和预设的自车右间距l3计算得到最大边界值Lx,Lx=(l1+l2);并根据所述最大边界值Lx和预设的单位距离sx计算得到最大栅格编码Nx,Nx=Lx/sx
根据所述自车后间距l2和预设的自车前间距l4计算得到最大边界值Ly,Ly=(l2+l4);并根据所述最大边界值Ly和预设的单位距离sy计算得到最大栅格编码Ny,Nx=Ly/sy
按点云坐标系与所述栅格空间三维坐标系的坐标对应关系,获得所述激光雷达点云在所述栅格空间三维坐标系中Z轴上的多个z轴坐标值;统计所述z轴坐标值的数量记为第一数量m;并对所述z轴坐标值按从小到大的顺序进行排序得到第一坐标序列,按从大到小的顺序进行排序得到第二坐标序列;并根据所述第一数量m计算对应的第一索引id1=int(m*0.9),int()为取整函数;并将所述第一、第二坐标序列中的索引位置与所述第一索引id1匹配的所述z轴坐标值记为对应的第一坐标z1和第二坐标z2;并根据所述第一坐标z1和所述第二坐标z2计算最大边界值Lz=(z1-z2);并将最大栅格编码Nz设为预设的数量k;并根据所述最大边界值Lz和所述最大栅格编码Nz计算得到单位距离sz,sz=Lz/Nz
在所述栅格空间三维坐标系中,从原点出发沿X、Y、Z轴正向划定大小为Lx*Ly*Lz的空间区域作为所述栅格空间;并将所述栅格空间的X-Y平面作为所述鸟瞰平面;
将所述栅格空间划分成Nx*Ny*Nz个形状为sx*sy*sz的单位栅格Ai,j,h;并将所述鸟瞰平面划分成Nx*Ny个形状为sx*sy的单位栅格Bi,j;1≤i≤Nx,1≤j≤Ny,1≤h≤Nz;所述栅格空间中各个所述单位栅格Bi,j为对应的所述单位栅格Ai,j,h在所述鸟瞰平面的投影栅格。
优选的,所述根据所述栅格空间和所述第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图,具体包括:
将所述第一特征图落入所述鸟瞰平面的子图提取出来作为对应的第一子图;所述第一子图包括多个子图像素点;各个所述子图像素点对应一个子图特征向量;所述子图特征向量中至少包括高度特征;
对所述第一子图在所述鸟瞰平面上各个所述单位栅格Bi,j内的所述子图像素点进行聚类并对聚类的子图像素点进行高度特征统计生成对应的栅格特征Ci,j;并由得到的Nx*Ny个所述栅格特征Ci,j构成所述第一占据栅格图;所述第一占据栅格图的张量形状为Nx*Ny*1。
优选的,所述根据所述栅格空间和所述第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图,具体包括:
将所述第一点云落入所述栅格空间的部分点云提取出来作为对应的第二点云;并为所述栅格空间上各个所述单位栅格Ai,j,h分配一个对应的栅格特征Di,j,h;并将所述第二点云的任意点所在的单位栅格Ai,j,h的所述栅格特征Di,j,h设为1;并由Nx*Ny*Nz个所述栅格特征Di,j,h构成所述第二占据栅格图;所述第二占据栅格图的张量形状为Nx*Ny*Nz
本发明实施例第二方面提供了一种用于实现上述第一方面所述的鸟瞰特征的学习方法的装置,所述装置包括:获取模块、模型训练模块、模型收敛判断模块和模型标记模块;
所述获取模块用于获取训练集;所述训练集由多组训练数据对构成;每组所述训练数据对由一对经过配准的实景图像和激光雷达点云构成;
所述模型训练模块用于从所述训练集中提取所述训练数据对作为对应的第一训练数据对;并从所述第一训练数据对中,提取所述实景图像作为对应的第一图像,提取所述激光雷达点云作为对应的第一点云;并构建三维的栅格空间;并使用鸟瞰特征提取模型对所述第一图像进行鸟瞰特征图转换生成对应的第一特征图;并根据所述栅格空间和所述第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;并根据所述栅格空间和所述第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;并以所述第二占据栅格图为真值对象,以所述第一占据栅格图为预测对象,并以二值交叉熵损失函数为损失函数对所述预测对象与所述真值对象的损失值进行计算得到对应的第一损失值;
所述模型收敛判断模块用于判断所述第一损失值是否满足预设的合理损失值范围,若满足则对预设的学习计数器进行加1,若不满足则对所述学习计数器清零;并在所述学习计数器等于0时对所述鸟瞰特征提取模型的模型参数进行反向调制并在调制完成后回调所述模型训练模块继续学习;在所述学习计数器大于0但小于预设的计数器阈值时回调所述模型训练模块继续学习;在所述学习计数器大于或等于所述计数器阈值时转至所述模型标记模块;
所述模型标记模块用于将所述鸟瞰特征提取模型标记为成熟模型。
本发明实施例第三方面提供了一种电子设备,包括:存储器、处理器和收发器;
所述处理器用于与所述存储器耦合,读取并执行所述存储器中的指令,以实现上述第一方面所述的方法步骤;
所述收发器与所述处理器耦合,由所述处理器控制所述收发器进行消息收发。
本发明实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行上述第一方面所述的方法的指令。
本发明实施例提供了一种鸟瞰特征的学习方法、装置、电子设备及计算机可读存储介质,预先建立一个训练集,该训练集中每组训练数据对都由一对经过配准的实景图像和激光雷达点云组成;并基于该训练集对定制开发的鸟瞰特征提取模型进行训练;训练时,以自车前后左右约定平面大小和激光雷达点云的实际高度构建栅格空间,并基于该栅格空间对鸟瞰特征提取模型输出的鸟瞰图进行鸟瞰平面占据栅格图构建得到第一占据栅格图,并基于该栅格空间对激光雷达点云进行鸟瞰平面占据栅格图构建得到第二占据栅格图,以第二占据栅格图为真值对象、以第一占据栅格图为预测对象,以二值交叉熵损失函数为损失函数计算真值、预测对象的损失值,并基于损失值判断模型是否收敛。通过本发明对定制开发的鸟瞰特征提取模型进行持续训练,加快了模型对鸟瞰特征的学习精度,改善了模型的鸟瞰特征转换准确度。
附图说明
图1为本发明实施例一提供的一种鸟瞰特征的学习方法示意图;
图2为本发明实施例二提供的一种鸟瞰特征的学习装置的模块结构图;
图3为本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例一提供一种鸟瞰特征的学习方法,如图1为本发明实施例一提供的一种鸟瞰特征的学习方法示意图所示,本方法主要包括如下步骤:
步骤1,获取训练集;
其中,训练集由多组训练数据对构成;每组训练数据对由一对经过配准的实景图像和激光雷达点云构成。
这里,预先可通过实车路跑获得配对的原始实景图像和原始激光雷达点云,再对每对原始实景图像和原始激光雷达点云进行位姿配准就可得到训练数据对所需的实景图像和激光雷达点云;此处的实景图像和激光雷达点云原则上应是车载相机和激光雷达在相同或相邻时刻对同一场景进行拍摄和扫描得到的图像-点云对。
步骤2,从训练集中提取训练数据对作为对应的第一训练数据对;并从第一训练数据对中,提取实景图像作为对应的第一图像,提取激光雷达点云作为对应的第一点云。
步骤3,构建三维的栅格空间;
这里,栅格空间实际就是一个以第一点云的高度范围为高度参考,以预设的自车左间距l1、自车后间距l2、自车右间距l3、自车前间距l4构成的自车前后左右平面为平面参考,构建的一个能够覆盖当前图像-点云对绝大多数特征的三维空间,该空间被分割成一个个的栅格,所以称之为栅格空间;
具体包括:步骤31,以自车坐标系作为参考构建栅格空间三维坐标系,具体以预设的自车左间距l1作为左平移距离、以预设的自车后间距l2作为后平移距离对自车坐标系的原点坐标进行对应的向左、向后平移从而得到栅格空间三维坐标系;
这里,栅格空间三维坐标系实际与自车坐标系是近似的,只是为了便于栅格编码的计算,将自车坐标系向左平移了l1、向后平移了l2
步骤32,根据自车左间距l1和预设的自车右间距l3计算得到最大边界值Lx,Lx=(l1+l2);并根据最大边界值Lx和预设的单位距离sx计算得到最大栅格编码Nx,Nx=Lx/sx
例如,预设的自车左间距l1和自车右间距l3分别为20米,那么X轴上的最大边界值Lx=40米,预设的单位距离sx为1米,那么X轴上的最大栅格编码Nx=40;
步骤33,根据自车后间距l2和预设的自车前间距l4计算得到最大边界值Ly,Ly=(l2+l4);并根据最大边界值Ly和预设的单位距离sy计算得到最大栅格编码Ny,Nx=Ly/sy
例如,预设的自车后间距l2和自车前间距l4分别为20米、60米,那么Y轴上的最大边界值Ly=80米,预设的单位距离sy为1米,那么Y轴上的最大栅格编码Ny=80;
步骤34,按点云坐标系与栅格空间三维坐标系的坐标对应关系,获得激光雷达点云在栅格空间三维坐标系中Z轴上的多个z轴坐标值;统计z轴坐标值的数量记为第一数量m;并对z轴坐标值按从小到大的顺序进行排序得到第一坐标序列,按从大到小的顺序进行排序得到第二坐标序列;并根据第一数量m计算对应的第一索引id1=int(m*0.9),int()为取整函数;并将第一、第二坐标序列中的索引位置与第一索引id1匹配的z轴坐标值记为对应的第一坐标z1和第二坐标z2;并根据第一坐标z1和第二坐标z2计算最大边界值Lz=(z1-z2);并将最大栅格编码Nz设为预设的数量k;并根据最大边界值Lz和最大栅格编码Nz计算得到单位距离sz,sz=Lz/Nz
例如,激光雷达点云中有10个点,即m=10,这10个点在栅格空间三维坐标系中Z轴上的10个z轴坐标值分为1、2、3、3、5、3、7、8、9、10,按从小到大排序得到的第一坐标序列为{1、2、3、3、3、5、7、8、9、10},按从大到小排序得到的第二坐标序列为{10、9、8、7、5、3、3、3、2、1};那么,第一索引id1=int(m*0.9)=9,第一坐标z1=9,第二坐标z2=2,那么Z轴上的最大边界值Lz=9-2=7米,若预设的数量k=10,那么Z轴方向上的最大栅格编码Nz=10,Z轴方向上的栅格单位边长也就是单位距离sz=7/10=0.7米;
这里,与步骤32、33不同的是,在Z轴方向上的栅格单位边长也就是单位距离sz是一个动态变化的边长值,这是因为实际场景中点云的稀疏程度是不同的以本发明实施例这种固定Z向栅格数量、动态调整Z向栅格单位边长的方式可以更好的平均点云空间特征;
步骤35,在栅格空间三维坐标系中,从原点出发沿X、Y、Z轴正向划定大小为Lx*Ly*Lz的空间区域作为栅格空间;并将栅格空间的X-Y平面作为鸟瞰平面;
步骤36,将栅格空间划分成Nx*Ny*Nz个形状为sx*sy*sz的单位栅格Ai,j,h;并将鸟瞰平面划分成Nx*Ny个形状为sx*sy的单位栅格Bi,j
其中,1≤i≤Nx,1≤j≤Ny,1≤h≤Nz;栅格空间中各个单位栅格Bi,j为对应的单位栅格Ai,j,h在鸟瞰平面的投影栅格。
例如,已知X轴上的最大边界值Lx=40米、最大栅格编码Nx=40、单位距离sx为1米,Y轴上的最大边界值Ly=80米、最大栅格编码Ny=80、单位距离sy为1米,Z轴方向上的最大边界值Lz=7、最大栅格编码Nz=10、单位距离sz为0.7米;那么,栅格空间的大小即是40*80*7,由40*80*10个形状为1*1*0.7的三维单位栅格Ai,j,h构成;鸟瞰平面的大小为40*80,由40*80个形状为1*1的二维单位栅格Bi,j构成。
步骤4,使用鸟瞰特征提取模型对第一图像进行鸟瞰特征图转换生成对应的第一特征图;并根据栅格空间和第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;并根据栅格空间和第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;
具体包括:步骤41,使用鸟瞰特征提取模型对第一图像进行鸟瞰特征图转换生成对应的第一特征图;
其中,第一特征图包括多个像素点;每个像素点对应一个特征向量;每个特征向量中至少包括一个深度特征和一个高度特征;
这里,鸟瞰特征提取模型即是本发明实施例需要提高其鸟瞰特征学习能力的定制模型,其输出的第一特征图本质应是一个带有深度特征和高度特征的鸟瞰特征图;
步骤42,根据栅格空间和第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;
具体包括:步骤421,将第一特征图落入鸟瞰平面的子图提取出来作为对应的第一子图;
其中,第一子图包括多个子图像素点;各个子图像素点对应一个子图特征向量;子图特征向量中至少包括一个深度特征和一个高度特征;
这里,实际就是基于鸟瞰平面对第一特征图进行一次裁剪;
步骤422,对第一子图在鸟瞰平面上各个单位栅格Bi,j内的子图像素点进行聚类并对聚类的子图像素点进行高度特征统计生成对应的栅格特征Ci,j;并由得到的Nx*Ny个栅格特征Ci,j构成第一占据栅格图;
其中,第一占据栅格图的张量形状为Nx*Ny*1;
这里,本发明实施例在对第一子图在鸟瞰平面上各个单位栅格Bi,j内的子图像素点进行聚类时,实际就是参考深度特征将第一子图上落入各个单位栅格Bi,j的子图像素点纳入同一个子图像素点集合中从而得到Nx*Ny个子图像素点集合;在对聚类的子图像素点进行高度特征统计时有多种统计方法,其中一种为对各个子图像素点集合对应的所有高度特征进行均值计算并将计算结果作为对应的栅格特征Ci,j,其中另一种为取各个子图像素点集合中的最大高度特征作为对应的栅格特征Ci,j,另外还有多种统计方式具体可根据实施要求进行设定,在此不做一一赘述;最终得到的第一占据栅格图可视为第一子图的降采样特征图,像素点数量减少了、但每个像素点的特征增强了;
步骤43,根据栅格空间和第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;
具体包括:将第一点云落入栅格空间的部分点云提取出来作为对应的第二点云;并为栅格空间上各个单位栅格Ai,j,h分配一个对应的栅格特征Di,j,h;并将第二点云的任意点所在的单位栅格Ai,j,h的栅格特征Di,j,h设为1;并由Nx*Ny*Nz个栅格特征Di,j,h构成第二占据栅格图;
其中,第二占据栅格图的张量形状为Nx*Ny*Nz
这里,第二点云实际就是第一子图的真值对象,第二占据栅格图实际就是第一占据栅格图的真值对象。
步骤5,以第二占据栅格图为真值对象,以第一占据栅格图为预测对象,并以二值交叉熵损失函数为损失函数对预测对象与真值对象的损失值进行计算得到对应的第一损失值。
这里,二值交叉熵损失函数的技术实现可参考公开的二值交叉熵损失函数说明文献,在此不做进一步赘述;当前步骤先对第二占据栅格图各像素点对应的Nz个栅格特征Di,j,h进行高度特征预处理得到对应的高度特征Ei,j,再将第二占据栅格图的Nx*Ny个高度特征Ei,j作为真值、第一占据栅格图的Nx*Ny个栅格特征Ci,j作为预测值代入二值交叉熵损失函数进行计算得到第一损失值。
步骤6,判断第一损失值是否满足预设的合理损失值范围,若满足则对预设的学习计数器进行加1,若不满足则对学习计数器清零。
这里,第一损失值满足预设的合理损失值范围时被视为模型收敛;本发明实施例规定模型只有在连续多次收敛之后才可被认定为进入稳定的收敛阶段。
步骤7,若学习计数器等于0则对鸟瞰特征提取模型的模型参数进行反向调制并在调制完成后转至步骤2继续学习;若学习计数器大于0但小于预设的计数器阈值则转至步骤2继续学习;若学习计数器大于或等于计数器阈值则转至步骤8。
这里,若学习计数器等于0则说明模型为收敛,需要对模型进行反向调制并在调制后返回步骤2基于调制后的模型对下一组训练数据进行鸟瞰特征学习,此处模型反向调制的方式有多种,常见的有基于梯度的调制方式,在此不做一一赘述;若学习计数器大于0但小于预设的计数器阈值则说明模型连续收敛次数尚未达到预先设定的指定次数即计数器阈值,此时无需进行模型调制,只需返回步骤2提取下一组训练数据进行鸟瞰特征学习;若学习计数器大于或等于计数器阈值则说明模型已经稳定收敛,模型每次学习输出的鸟瞰特征的准确度也已达到预期设定要求,此时就可停止训练并转至步骤8将当前训练的鸟瞰特征提取模型标记为成熟模型。
步骤8,将鸟瞰特征提取模型标记为成熟模型。
这里,在将当次训练的鸟瞰特征提取模型标记为成熟模型之后,即可将之投入到实际应用中对相机拍摄图像进行实时鸟瞰特征图转换,并基于鸟瞰特征图进行实时的多目标跟踪处理。
图2为本发明实施例二提供的一种鸟瞰特征的学习装置的模块结构图,该装置为实现前述方法实施例的终端设备或者服务器,也可以为能够使得前述终端设备或者服务器实现前述方法实施例的装置,例如该装置可以是前述终端设备或者服务器的装置或芯片系统。如图2所示,该装置包括:获取模块201、模型训练模块202、模型收敛判断模块203和模型标记模块204。
获取模块201用于获取训练集;训练集由多组训练数据对构成;每组训练数据对由一对经过配准的实景图像和激光雷达点云构成。
模型训练模块202用于从训练集中提取训练数据对作为对应的第一训练数据对;并从第一训练数据对中,提取实景图像作为对应的第一图像,提取激光雷达点云作为对应的第一点云;并构建三维的栅格空间;并使用鸟瞰特征提取模型对第一图像进行鸟瞰特征图转换生成对应的第一特征图;并根据栅格空间和第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;并根据栅格空间和第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;并以第二占据栅格图为真值对象,以第一占据栅格图为预测对象,并以二值交叉熵损失函数为损失函数对预测对象与真值对象的损失值进行计算得到对应的第一损失值。
模型收敛判断模块203用于判断第一损失值是否满足预设的合理损失值范围,若满足则对预设的学习计数器进行加1,若不满足则对学习计数器清零;并在学习计数器等于0时对鸟瞰特征提取模型的模型参数进行反向调制并在调制完成后回调模型训练模块继续学习;在学习计数器大于0但小于预设的计数器阈值时回调模型训练模块继续学习;在学习计数器大于或等于计数器阈值时转至模型标记模块。
模型标记模块204用于将鸟瞰特征提取模型标记为成熟模型。
本发明实施例提供的一种鸟瞰特征的学习装置,可以执行上述方法实施例中的方法步骤,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,获取模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所描述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,ASIC),或,一个或多个数字信号处理器(Digital Signal Processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(System-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照前述方法实施例所描述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线路((Digital Subscriber Line,DSL))或无线(例如红外、无线、蓝牙、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
图3为本发明实施例三提供的一种电子设备的结构示意图。该电子设备可以为前述的终端设备或者服务器,也可以为与前述终端设备或者服务器连接的实现本发明实施例方法的终端设备或服务器。如图3所示,该电子设备可以包括:处理器301(例如CPU)、存储器302、收发器303;收发器303耦合至处理器301,处理器301控制收发器303的收发动作。存储器302中可以存储各种指令,以用于完成各种处理功能以及实现前述方法实施例描述的处理步骤。优选的,本发明实施例涉及的电子设备还包括:电源304、系统总线305以及通信端口306。系统总线305用于实现元件之间的通信连接。上述通信端口306用于电子设备与其他外设之间进行连接通信。
在图3中提到的系统总线305可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(Non-Volatile Memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器CPU、网络处理器(NetworkProcessor,NP)、图形处理器(Graphics Processing Unit,GPU)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中提供的方法和处理过程。
本发明实施例还提供一种运行指令的芯片,该芯片用于执行前述方法实施例描述的处理步骤。
本发明实施例提供了一种鸟瞰特征的学习方法、装置、电子设备及计算机可读存储介质,预先建立一个训练集,该训练集中每组训练数据对都由一对经过配准的实景图像和激光雷达点云组成;并基于该训练集对定制开发的鸟瞰特征提取模型进行训练;训练时,以自车前后左右约定平面大小和激光雷达点云的实际高度构建栅格空间,并基于该栅格空间对鸟瞰特征提取模型输出的鸟瞰图进行鸟瞰平面占据栅格图构建得到第一占据栅格图,并基于该栅格空间对激光雷达点云进行鸟瞰平面占据栅格图构建得到第二占据栅格图,以第二占据栅格图为真值对象、以第一占据栅格图为预测对象,以二值交叉熵损失函数为损失函数计算真值、预测对象的损失值,并基于损失值判断模型是否收敛。通过本发明对定制开发的鸟瞰特征提取模型进行持续训练,加快了模型对鸟瞰特征的学习精度,改善了模型的鸟瞰特征转换准确度。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种鸟瞰特征的学习方法,其特征在于,所述方法包括:
步骤1,获取训练集;所述训练集由多组训练数据对构成;每组所述训练数据对由一对经过配准的实景图像和激光雷达点云构成;
步骤2,从所述训练集中提取所述训练数据对作为对应的第一训练数据对;并从所述第一训练数据对中,提取所述实景图像作为对应的第一图像,提取所述激光雷达点云作为对应的第一点云;
步骤3,构建三维的栅格空间;
步骤4,使用鸟瞰特征提取模型对所述第一图像进行鸟瞰特征图转换生成对应的第一特征图;并根据所述栅格空间和所述第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;并根据所述栅格空间和所述第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;
步骤5,以所述第二占据栅格图为真值对象,以所述第一占据栅格图为预测对象,并以二值交叉熵损失函数为损失函数对所述预测对象与所述真值对象的损失值进行计算得到对应的第一损失值;
步骤6,判断所述第一损失值是否满足预设的合理损失值范围,若满足则对预设的学习计数器进行加1,若不满足则对所述学习计数器清零;
步骤7,若所述学习计数器等于0则对所述鸟瞰特征提取模型的模型参数进行反向调制并在调制完成后转至步骤2继续学习;若所述学习计数器大于0但小于预设的计数器阈值则转至步骤2继续学习;若所述学习计数器大于或等于所述计数器阈值则转至步骤8;
步骤8,将所述鸟瞰特征提取模型标记为成熟模型。
2.根据权利要求1所述的鸟瞰特征的学习方法,其特征在于,所述构建三维的栅格空间,具体包括:
以自车坐标系作为参考构建栅格空间三维坐标系,具体以预设的自车左间距l1作为左平移距离、以预设的自车后间距l2作为后平移距离对自车坐标系的原点坐标进行对应的向左、向后平移从而得到所述栅格空间三维坐标系;
根据所述自车左间距l1和预设的自车右间距l3计算得到最大边界值Lx,Lx=(l1+l2);并根据所述最大边界值Lx和预设的单位距离sx计算得到最大栅格编码Nx,Nx=Lx/sx
根据所述自车后间距l2和预设的自车前间距l4计算得到最大边界值Ly,Ly=(l2+l4);并根据所述最大边界值Ly和预设的单位距离sy计算得到最大栅格编码Ny,Nx=Ly/sy
按点云坐标系与所述栅格空间三维坐标系的坐标对应关系,获得所述激光雷达点云在所述栅格空间三维坐标系中Z轴上的多个z轴坐标值;统计所述z轴坐标值的数量记为第一数量m;并对所述z轴坐标值按从小到大的顺序进行排序得到第一坐标序列,按从大到小的顺序进行排序得到第二坐标序列;并根据所述第一数量m计算对应的第一索引id1=int(m*0.9),int()为取整函数;并将所述第一、第二坐标序列中的索引位置与所述第一索引id1匹配的所述z轴坐标值记为对应的第一坐标z1和第二坐标z2;并根据所述第一坐标z1和所述第二坐标z2计算最大边界值Lz=(z1-z2);并将最大栅格编码Nz设为预设的数量k;并根据所述最大边界值Lz和所述最大栅格编码Nz计算得到单位距离sz,sz=Lz/Nz
在所述栅格空间三维坐标系中,从原点出发沿X、Y、Z轴正向划定大小为Lx*Ly*Lz的空间区域作为所述栅格空间;并将所述栅格空间的X-Y平面作为所述鸟瞰平面;
将所述栅格空间划分成Nx*Ny*Nz个形状为sx*sy*sz的单位栅格Ai,j,h;并将所述鸟瞰平面划分成Nx*Ny个形状为sx*sy的单位栅格Bi,j;1≤i≤Nx,1≤j≤Ny,1≤h≤Nz;所述栅格空间中各个所述单位栅格Bi,j为对应的所述单位栅格Ai,j,h在所述鸟瞰平面的投影栅格。
3.根据权利要求2所述的鸟瞰特征的学习方法,其特征在于,所述根据所述栅格空间和所述第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图,具体包括:
将所述第一特征图落入所述鸟瞰平面的子图提取出来作为对应的第一子图;所述第一子图包括多个子图像素点;各个所述子图像素点对应一个子图特征向量;所述子图特征向量中至少包括高度特征;
对所述第一子图在所述鸟瞰平面上各个所述单位栅格Bi,j内的所述子图像素点进行聚类并对聚类的子图像素点进行高度特征统计生成对应的栅格特征Ci,j;并由得到的Nx*Ny个所述栅格特征Ci,j构成所述第一占据栅格图;所述第一占据栅格图的张量形状为Nx*Ny*1。
4.根据权利要求2所述的鸟瞰特征的学习方法,其特征在于,所述根据所述栅格空间和所述第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图,具体包括:
将所述第一点云落入所述栅格空间的部分点云提取出来作为对应的第二点云;并为所述栅格空间上各个所述单位栅格Ai,j,h分配一个对应的栅格特征Di,j,h;并将所述第二点云的任意点所在的单位栅格Ai,j,h的所述栅格特征Di,j,h设为1;并由Nx*Ny*Nz个所述栅格特征Di,j,h构成所述第二占据栅格图;所述第二占据栅格图的张量形状为Nx*Ny*Nz
5.一种用于实现权利要求1-4任一项所述的鸟瞰特征的学习方法的装置,其特征在于,所述装置包括:获取模块、模型训练模块、模型收敛判断模块和模型标记模块;
所述获取模块用于获取训练集;所述训练集由多组训练数据对构成;每组所述训练数据对由一对经过配准的实景图像和激光雷达点云构成;
所述模型训练模块用于从所述训练集中提取所述训练数据对作为对应的第一训练数据对;并从所述第一训练数据对中,提取所述实景图像作为对应的第一图像,提取所述激光雷达点云作为对应的第一点云;并构建三维的栅格空间;并使用鸟瞰特征提取模型对所述第一图像进行鸟瞰特征图转换生成对应的第一特征图;并根据所述栅格空间和所述第一特征图构建对应的鸟瞰平面占据栅格图并记为第一占据栅格图;并根据所述栅格空间和所述第一点云构建对应的鸟瞰平面占据栅格图并记为第二占据栅格图;并以所述第二占据栅格图为真值对象,以所述第一占据栅格图为预测对象,并以二值交叉熵损失函数为损失函数对所述预测对象与所述真值对象的损失值进行计算得到对应的第一损失值;
所述模型收敛判断模块用于判断所述第一损失值是否满足预设的合理损失值范围,若满足则对预设的学习计数器进行加1,若不满足则对所述学习计数器清零;并在所述学习计数器等于0时对所述鸟瞰特征提取模型的模型参数进行反向调制并在调制完成后回调所述模型训练模块继续学习;在所述学习计数器大于0但小于预设的计数器阈值时回调所述模型训练模块继续学习;在所述学习计数器大于或等于所述计数器阈值时转至所述模型标记模块;
所述模型标记模块用于将所述鸟瞰特征提取模型标记为成熟模型。
6.一种电子设备,其特征在于,包括:存储器、处理器和收发器;
所述处理器用于与所述存储器耦合,读取并执行所述存储器中的指令,以实现权利要求1-4任一项所述的方法步骤;
所述收发器与所述处理器耦合,由所述处理器控制所述收发器进行消息收发。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-4任一项所述的方法的指令。
CN202210536993.9A 2022-05-17 2022-05-17 一种鸟瞰特征的学习方法和装置 Active CN114913213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210536993.9A CN114913213B (zh) 2022-05-17 2022-05-17 一种鸟瞰特征的学习方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210536993.9A CN114913213B (zh) 2022-05-17 2022-05-17 一种鸟瞰特征的学习方法和装置

Publications (2)

Publication Number Publication Date
CN114913213A CN114913213A (zh) 2022-08-16
CN114913213B true CN114913213B (zh) 2024-03-22

Family

ID=82768855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210536993.9A Active CN114913213B (zh) 2022-05-17 2022-05-17 一种鸟瞰特征的学习方法和装置

Country Status (1)

Country Link
CN (1) CN114913213B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015120999A1 (de) * 2015-12-02 2017-06-08 Krauss-Maffei Wegmann Gmbh & Co. Kg Verfahren zur Erzeugung und Darstellung einer computergenerierten, eine Realumgebung abbildenden Simulationsumgebung
WO2021175434A1 (en) * 2020-03-05 2021-09-10 Cambridge Enterprise Limited System and method for predicting a map from an image
WO2022017147A1 (zh) * 2020-07-22 2022-01-27 上海商汤临港智能科技有限公司 点云数据的处理方法和装置、雷达装置、电子设备及计算机可读存储介质
CN114255270A (zh) * 2021-12-14 2022-03-29 广西路桥工程集团有限公司 基于倾斜摄影技术的路基土石方自动算量方法和平台
CN114443793A (zh) * 2022-01-25 2022-05-06 陈进雄 一种时空数据可视化的国土空间详细规划三维场景设计的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10261183B2 (en) * 2016-12-27 2019-04-16 Gerard Dirk Smits Systems and methods for machine perception
US11436743B2 (en) * 2019-07-06 2022-09-06 Toyota Research Institute, Inc. Systems and methods for semi-supervised depth estimation according to an arbitrary camera
US11410546B2 (en) * 2020-05-18 2022-08-09 Toyota Research Institute, Inc. Bird's eye view based velocity estimation
US11625839B2 (en) * 2020-05-18 2023-04-11 Toyota Research Institute, Inc. Bird's eye view based velocity estimation via self-supervised learning

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015120999A1 (de) * 2015-12-02 2017-06-08 Krauss-Maffei Wegmann Gmbh & Co. Kg Verfahren zur Erzeugung und Darstellung einer computergenerierten, eine Realumgebung abbildenden Simulationsumgebung
WO2021175434A1 (en) * 2020-03-05 2021-09-10 Cambridge Enterprise Limited System and method for predicting a map from an image
WO2022017147A1 (zh) * 2020-07-22 2022-01-27 上海商汤临港智能科技有限公司 点云数据的处理方法和装置、雷达装置、电子设备及计算机可读存储介质
CN114255270A (zh) * 2021-12-14 2022-03-29 广西路桥工程集团有限公司 基于倾斜摄影技术的路基土石方自动算量方法和平台
CN114443793A (zh) * 2022-01-25 2022-05-06 陈进雄 一种时空数据可视化的国土空间详细规划三维场景设计的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于WebGL的机载激光雷达点云数据可视化;曾;;湖南科技大学学报(自然科学版);20121225(04);全文 *
张爱武 ; 刘路路 ; 张希珍 ; .道路三维点云多特征卷积神经网络语义分割方法.中国激光.(04),全文. *

Also Published As

Publication number Publication date
CN114913213A (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN111079685B (zh) 一种3d目标检测方法
CN113819890B (zh) 测距方法、装置、电子设备及存储介质
CN110879994A (zh) 基于形状注意力机制的三维目测检测方法、系统、装置
CN112862874B (zh) 点云数据匹配方法、装置、电子设备及计算机存储介质
CN111028327A (zh) 一种三维点云的处理方法、装置及设备
CN111414953A (zh) 点云分类方法和装置
CN114581887A (zh) 车道线的检测方法、装置、设备和计算机可读存储介质
CN114782787A (zh) 一种对点云与图像数据进行特征融合的处理方法和装置
CN113326826A (zh) 网络模型的训练方法、装置、电子设备及存储介质
CN114463736A (zh) 一种基于多模态信息融合的多目标检测方法及装置
CN113255444A (zh) 图像识别模型的训练方法、图像识别方法和装置
CN116503836A (zh) 一种基于深度补全和图像分割的3d目标检测方法
CN116188931A (zh) 一种基于融合特征进行点云目标检测的处理方法和装置
Zhang et al. Accurate and Real-Time Object Detection Based on Bird's Eye View on 3D Point Clouds
CN114140758A (zh) 一种目标检测方法、装置及计算机设备
CN112734931B (zh) 一种辅助点云目标检测的方法及系统
CN115147333A (zh) 一种目标检测方法及装置
CN114913213B (zh) 一种鸟瞰特征的学习方法和装置
CN116994245A (zh) 基于深度学习的空间转录组分析方法、装置及可读介质
CN116468950A (zh) 一种类别引导中心点邻域搜索半径的三维目标检测方法
CN116415652A (zh) 一种数据生成方法、装置、可读存储介质及终端设备
CN115856874A (zh) 毫米波雷达点云降噪方法、装置、设备及存储介质
CN114663478A (zh) 一种根据多参考点预测信息估计锚点位置的方法
CN114638866A (zh) 一种基于局部特征学习的点云配准方法及系统
CN115436910B (zh) 一种对激光雷达点云进行目标检测的数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant