CN115619958B - 目标鸟瞰图的生成方法、装置、电子设备及存储介质 - Google Patents

目标鸟瞰图的生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115619958B
CN115619958B CN202211620942.0A CN202211620942A CN115619958B CN 115619958 B CN115619958 B CN 115619958B CN 202211620942 A CN202211620942 A CN 202211620942A CN 115619958 B CN115619958 B CN 115619958B
Authority
CN
China
Prior art keywords
pixel point
characteristic
value
feature
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211620942.0A
Other languages
English (en)
Other versions
CN115619958A (zh
Inventor
倪鹏程
张亚森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Pinecone Electronic Co Ltd
Xiaomi Automobile Technology Co Ltd
Original Assignee
Beijing Xiaomi Pinecone Electronic Co Ltd
Xiaomi Automobile Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Pinecone Electronic Co Ltd, Xiaomi Automobile Technology Co Ltd filed Critical Beijing Xiaomi Pinecone Electronic Co Ltd
Priority to CN202211620942.0A priority Critical patent/CN115619958B/zh
Publication of CN115619958A publication Critical patent/CN115619958A/zh
Application granted granted Critical
Publication of CN115619958B publication Critical patent/CN115619958B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • G06T17/05Geographic models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computer Graphics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Processing (AREA)

Abstract

本公开提出一种目标鸟瞰图的生成方法、装置、电子设备及存储介质,涉及自动驾驶技术领域。包括:获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同;根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点;根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。由此,对初始鸟瞰图中第二像素点对应的第一像素点的至少一个不同感受野的特征值进行处理,以确定每个第二像素点对应的特征值,从而提高了目标鸟瞰图特征的准确性,且生成的目标鸟瞰图特征能够支持多个不同的感知任务处理,提高了感知任务的效率及准确性。

Description

目标鸟瞰图的生成方法、装置、电子设备及存储介质
技术领域
本公开涉及自动驾驶技术领域,尤其涉及一种目标鸟瞰图的生成方法、装置、电子设备及存储介质。
背景技术
随着人工智能的快速发展,使得自动驾驶成为可能。为了保证自动驾驶车辆行驶的安全性,往往要根据大量的图像数据预测车辆周围的目标鸟瞰图(bird eye view,BEV),然后根据目标鸟瞰图进行不同的感知任务处理,例如,车道线检测、道路分割、目标检测和轨迹规划等,得到感知任务结果,感知任务结果在交通等领域中有着很重要的意义,可以保证自动驾驶车辆行驶的安全性。
基于目标鸟瞰图的感知表达其核心意涵为将采集到的车辆周围的图像映射到基于当前自身车辆位置的目标鸟瞰图BEV空间中。因此,如何对车辆上的周视相机采集的周视图像进行处理,以生成准确的目标鸟瞰图成为重点的研究方向。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
本公开第一方面实施例提出了一种目标鸟瞰图的生成方法,包括:
获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同;
根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个所述第二像素点对应的至少一个第一像素点;
根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。
可选的,所述根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图,包括:
在所述第一像素点对应多个特征值的情况下,基于第一窗口参数,确定所述第一像素点在每个特征值所在的特征图中的第一参考像素点;
根据所述第一像素点在每个特征图中的第一参考像素点的特征值,分别对所述第一像素点的每个特征值进行更新,以获取所述第一像素点对应的多个更新后的特征值;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
可选的,所述根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图,包括:
在所述第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在所述初始鸟瞰图中的位置编码,确定所述第一像素点在第一个特征图中的第二参考像素点,其中,所述第一像素点在所述第一个特征图中的第一个特征值对应的感受野最大;
根据所述第二参考像素点在所述第一个特征图中的特征值,对所述第一像素点的第一个特征值进行更新,以获取所述第一像素点更新后的第一个特征值;
根据所述更新后的第一个特征值及所述位置编码,确定所述第一像素点在第二个特征图中的第三参考像素点,其中,所述像素点在所述第二个特征图中的第二个特征值对应的感受野小于所述第一个特征值对应的感受野、且大于其余特征值对应的感受野;
根据所述第三参考素点在所述第二个特征图中的特征值,对所述第一像素点的第二个特征值进行更新,以获取所述第一像素点更新后的第二个特征值;
基于所述更新后的第二个特征值及所述位置编码,返回执行所述确定所述第一像素点在第三个特征图中的第四参考像素点的操作,直至获取所述第一像素点对应的多个更新后的特征值,其中,所述像素点在所述第三个特征图中的第三个特征值对应的感受野小于所述第二个特征值对应的感受野、且大于除所述第一个特征值及所述第二个特征值之外的其余特征值对应的感受野;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
可选的,对所述第一像素点的每个特征值进行更新的过程,还包括:
确定所述第一像素点在每个特征图中的各参考像素点的权重值;
基于每个特征图各参考像素点的权重值,将所述特征图中所述第一像素点对应的各参考像素点的特征值进行融合,以获取所述第一像素点在所述特征图中更新后的特征值。
可选的,所述确定所述第一像素点在每个特征图中的各参考像素点的权重值,包括:
根据所述第二窗口参数及所述位置编码,确定所述第一像素点在所述第一个特征图中的各个第二参考像素点的权重值;
根据所述第一像素点更新后的第i个特征值及所述位置编码,确定所述第一像素点在第i+1个特征图中的各个参考像素点的权重值,其中,i大于1、且小于或等于n,n为所述第一像素点对应的特征值个数。
可选的,在所述获取周视相机采集的周视图像中每个第一像素点的至少一个特征值之前,还包括:
根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务;
在所述各视觉任务对应的图像分辨率相同的情况下,确定待获取每个所述第一像素点的一个特征值;
在所述各视觉任务对应的图像分辨率不同的情况下,根据所述各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个所述第一像素点的特征值的数量。
可选的,所述获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,包括:
获取所述周视相机中每个摄像模组采集的初始图像;
基于每个所述摄像模组对应的坐标转换关系,将每个所述初始图像进行坐标转换,以生成所述周视图像。
本公开第二方面实施例提出了一种目标鸟瞰图的生成装置,包括:
第一获取模块,用于获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同;
第一确定模块,用于根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个所述第二像素点对应的至少一个第一像素点;
生成模块,用于根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。
可选的,所述生成模块,具体用于:
在所述第一像素点对应多个特征值的情况下,基于第一窗口参数,确定所述第一像素点在每个特征值所在的特征图中的第一参考像素点;
根据所述第一像素点在每个特征图中的第一参考像素点的特征值,分别对所述第一像素点的每个特征值进行更新,以获取所述第一像素点对应的多个更新后的特征值;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
可选的,所述生成模块,具体用于:
在所述第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在所述初始鸟瞰图中的位置编码,确定所述第一像素点在第一个特征图中的第二参考像素点,其中,所述第一像素点在所述第一个特征图中的第一个特征值对应的感受野最大;
根据所述第二参考像素点在所述第一个特征图中的特征值,对所述第一像素点的第一个特征值进行更新,以获取所述第一像素点更新后的第一个特征值;
根据所述更新后的第一个特征值及所述位置编码,确定所述第一像素点在第二个特征图中的第三参考像素点,其中,所述像素点在所述第二个特征图中的第二个特征值对应的感受野小于所述第一个特征值对应的感受野、且大于其余特征值对应的感受野;
根据所述第三参考素点在所述第二个特征图中的特征值,对所述第一像素点的第二个特征值进行更新,以获取所述第一像素点更新后的第二个特征值;
基于所述更新后的第二个特征值及所述位置编码,返回执行所述确定所述第一像素点在第三个特征图中的第四参考像素点的操作,直至获取所述第一像素点对应的多个更新后的特征值,其中,所述像素点在所述第三个特征图中的第三个特征值对应的感受野小于所述第二个特征值对应的感受野、且大于除所述第一个特征值及所述第二个特征值之外的其余特征值对应的感受野;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
可选的,还包括:
第二确定模块,用于确定所述第一像素点在每个特征图中的各参考像素点的权重值;
第二获取模块,用于基于每个特征图各参考像素点的权重值,将所述特征图中所述第一像素点对应的各参考像素点的特征值进行融合,以获取所述第一像素点在所述特征图中更新后的特征值。
可选的,所述第二确定模块,具体用于:
根据所述第二窗口参数及所述位置编码,确定所述第一像素点在所述第一个特征图中的各个第二参考像素点的权重值;
根据所述第一像素点更新后的第i个特征值及所述位置编码,确定所述第一像素点在第i+1个特征图中的各个参考像素点的权重值,其中,i大于1、且小于或等于n,n为所述第一像素点对应的特征值个数。
可选的,还包括:
第三确定模块,用于根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务;
第四确定模块,用于在所述各视觉任务对应的图像分辨率相同的情况下,确定待获取每个所述第一像素点的一个特征值;
第五确定模块,用于在所述各视觉任务对应的图像分辨率不同的情况下,根据所述各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个所述第一像素点的特征值的数量。
可选的,所述第一获取模块,具体用于:
获取所述周视相机中每个摄像模组采集的初始图像;
基于每个所述摄像模组对应的坐标转换关系,将每个所述初始图像进行坐标转换,以生成所述周视图像。
本公开第三方面实施例提出了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的目标鸟瞰图的生成方法。
本公开第四方面实施例提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,实现如本公开第一方面实施例提出的目标鸟瞰图的生成方法。
本公开提供的目标鸟瞰图的生成方法、装置、电子设备及存储介质,存在如下有益效果:
本公开实施例中,可以先获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同,之后根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点,最后根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。由此,对初始鸟瞰图中第二像素点对应的第一像素点的至少一个不同感受野的特征值进行处理,以确定每个第二像素点对应的特征值,从而提高了目标鸟瞰图特征的准确性,且生成的目标鸟瞰图特征能够支持多个不同的感知任务处理,提高了感知任务的效率及准确性。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本公开一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图;
图2为本公开一实施例提供的一种周视图像向初始鸟瞰图像转换的示意图;
图3为本公开另一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图;
图4为本公开另一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图;
图5为本公开另一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图;
图6为本公开一实施例所提供的目标鸟瞰图的生成装置的结构示意图;
图7示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的目标鸟瞰图的生成方法、装置、电子设备和存储介质。
图1为本公开实施例所提供的一种目标鸟瞰图的生成方法的流程示意图。
本公开实施例以该目标鸟瞰图的生成方法被配置于目标鸟瞰图的生成装置中来举例说明,该目标鸟瞰图的生成装置可以应用于任一电子设备中,以使该电子设备可以执行目标鸟瞰图的生成功能。
如图1所示,该目标鸟瞰图的生成方法可以包括以下步骤:
步骤101,获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同。
其中,可以采用多个视角不同的周视相机,采集载具(如车辆)周围的环境图像,每个周视相机用于采集一个视角的周视图像,多个周视相机覆盖载具周围的环境范围。每个周视相机定义自己的相机视角坐标系,通过各自的相机视角坐标系形成各自的相机视角空间,每个周视相机采集的周视图像为在对应的相机视角空间下的图像。
在一个实施例中,多个周视相机可以实时采集不同视角的多个周视图像,如图像1、2……N,并实时将采集到的周视图像发送给电子设备。这样,电子设备获取到的周视图像能够表征当前时刻载体周围环境的真实情况,并进而对每张周视图像进行特征提取,以获取每张周视图像中每个第一像素点的至少一个特征值。
在一个实施例中,载具上可以包括6个周视相机。6个周视相机分别设置在载体的正前方、左前方、右前方、正后方、左后方和右后方。本公开对此不做限定。
需要说明的是,基于周视相机的BEV感知算法中周视相机的参数作用至关重要,预先标定的周视相机参数建立了周视图像坐标和载具坐标的先验映射,有效使用该信息可加快将周视图像特征转换至BEV图像中,从而提高生成目标鸟瞰图的效率。但是,使用该相机参数也就代表该参数的变化会对生成目标鸟瞰图的效率造成影响。
可选的,为了减小相机参数的变化带来的影响,可以先获取周视相机中每个摄像模组采集的初始图像,之后基于每个摄像模组对应的坐标转换关系,将每个初始图像进行坐标转换,以生成周视图像。
具体地,可以先设定每个角度的周视相机对应的虚拟相机,及虚拟相机的内外参数,之后假设载具坐标系下的两条非平行直线,计算两条直线分别在同一角度的虚拟相机的内外参数和周视相机的摄像模组的内外参数下图像坐标投影坐标,则可通过最小二乘方法求取周视相机与虚拟相机间的坐标转换关系,进而将每个摄像模组拍摄的初始图像转换至虚拟相机下。由此,即使周视相机的参数发生变化,也可以根据周视相机与虚拟相机之间的坐标转换关系,将不同图像在虚拟相机下大致对齐,从而对于不同周视相机拍摄的图像均可以通过对应的虚拟相机内外参数大致找到初始鸟瞰图中每个第二像素点对应的第一像素点,这样极大降低了周视相机参数变化带来的影响。
可选的,可以将每个周视图像输入特征提取网络中,以获取每个周视图像中每个第一像素点对应的至少一个特征值。特征提取网络可以是一个经过训练的神经网络,例如:卷积神经网络、深度残差网络(deep residual network,ResNet)、transformer-based等,这里不做具体限定。
在一些实施例中,对周视图像进行特征提取,需要提取后的特征具有较大感受野并且其运行的速度要足够快。对于需要具有较大感受野,这里使用transformer-based模块作为网络基础单元,对于运行速度这里通过特征维度映射减少参与自注意力(self-attention)操作的数据量,从而达到加速的目的。而且对于视觉任务更多时候还需要网络具有输出不同分辨率特征的能力,从而适应不同任务对分辨率的需求偏好。因此,transformer-based模块还可以输出周视图像对应的不同分辨率的特征图,特征图的分辨率越小,对应的感受野越大。从而可以确定周视图像中每个第一像素点的至少一个特征值,且第一像素点的不同特征值对应的感受野不同。
其中,对于self-attention计算部分使用维度映射实现计算量下降,对于输入特征f∈RN*C,其中,N是特征的数据维度,C是通道(channel)维度,其计算复杂度为O(N2C),则为了减少计算量需要对特征数据维度N进行压缩,也就是数据从维度f∈RN*C变换成为,也就是对数据先进行压缩操作,之后经过全连接网络将数据维度变换为,这样上述注意力操作的计算复杂度就变为了,这里的参数M在不同的特征提取阶段上可以分别取值M∈[64,16,4,1]。
步骤102,根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点。
其中,鸟瞰图为根据透视原理,用高视点透视法从高处某一点俯视地面起伏绘制成的立体图。简单地说,就是在空中俯视某一地区所看到的图像,比平面图更有真实感。
本公开实施例中,初始鸟瞰图可以为从高处某一点俯视车辆周围环境的图像,但是初始鸟瞰图中并没有车辆周围环境的特征,即初始鸟瞰图可以为一张空白的图像。初始鸟瞰图可以确定需要生成的目标鸟瞰图中包含的车辆周围环境的范围。比如,初始鸟瞰图的大小可以为200*200,每个第二像素点代表的实际距离可以为0.5米(m),则生成的目标鸟瞰图中可以包含车辆周围50m范围内的环境特征。
可选的,在无需将周视相机采集的周视图像转换至对应的虚拟相机的坐标下的情况下,可以根据每个周视相机的相机参数(内参、外参),确定每个第二像素点对应的坐标转换关系。比如,利用每个周视相机的相机参数,对第二像素点进行转换,判断转换后的坐标在对应的每个周视图像中是否有对应的第一像素点,在任一周视图像有对应的第一像素点,则确定拍摄该任一周视图像的周视相机的相机参数,为第二像素点对应的坐标转换关系。
需要说明的是,为了使载具上的多个周视相机可以完整的拍摄出载具周围的环境,因此,安装位置相邻两个周视相机的拍摄区域会存在部分重叠。
图2为本公开一实施例提供的一种周视图像向初始鸟瞰图像转换的示意图;如图2所示,正前方的周视相机与右前方的周视相机存在部分重叠。若第二像素点对应正前方的周视相机与右前方的周视相机间的重叠部分,则第二像素点对应两个坐标转换关系,正前方的周视相机的相机参数,右前方的周视相机的相机参数,则第二像素点对应的两个第一像素点,即在正前方的周视相机拍摄的周视图像中对应一个第一像素点,在正前方的周视相机拍摄的周视图像中对应一个第一像素点。
若第二像素点仅对应正后方的周视图像中的一个第一像素点,则第二像素点对应坐标转换关系,正后方的周视相机的相机参数。
或者,在需要将周视相机中的摄像模组采集的初始图像转换至对应的虚拟相机的坐标下的情况下,可以根据每个虚拟相机的相机参数(内参、外参),确定每个第二像素点对应的坐标转换关系。比如,利用每个虚拟相机的相机参数,对第二像素点进行转换,判断转换后的坐标在对应的每个周视图像中是否有对应的第一像素点,在任一周视图像有对应的第一像素点,则确定拍摄该任一周视图像对应的虚拟相机的相机参数,为第二像素点对应的坐标转换关系。
步骤103,根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。
本公开实施例中,可以根据初始鸟瞰图中每个第二像素点对应的每个第一像素点的特征值,为初始鸟瞰图中的每个第二像素点赋予特征值,从而生成目标鸟瞰图。
可选的,在第二像素点对应一个第一像素点,且每个第一像素点对应一个特征值的情况下,将一个第一像素点对应的一个特征值确定为第二像素点对应的特征值。
可选的,在第二像素点对应一个第一像素点,且第一像素点对应多个特征值的情况下,将多个特征值进行融合,并将融合后的特征值确定为第二像素点对应的特征值。
可选的,在第二像素点对应两个第一像素点,且每个第一像素点对应一个特征值的情况下,将两个第一像素点分别对应的一个特征值进行融合,以确定第二像素点对应的特征值。
可选的,在第二像素点对应两个第一像素点,且每个第一像素点对应多个特征值的情况下,先将每个第一像素点对应的多个特征值进行融合,以确定每个第一像素点对应的融合特征值,之后将两个第一像素点对应的融合特征值进行融合,以确定第二像素点对应的特征值。
综上,即可确定每个第二像素点对应的特征值,从而即可生成目标鸟瞰图。
本公开实施例中,可以先获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同,之后根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点,最后根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。由此,对初始鸟瞰图中第二像素点对应的第一像素点的至少一个不同感受野的特征值进行处理,以确定每个第二像素点对应的特征值,从而提高了目标鸟瞰图特征的准确性,且生成的目标鸟瞰图特征能够支持多个不同的感知任务处理,提高了感知任务的效率及准确性。
图3为本公开一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图,如图3所示,该目标鸟瞰图的生成方法可以包括以下步骤:
步骤301,获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同。
步骤302,根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点。
其中,步骤301及步骤302的具体实现形式,可参照本公开其他各实施例中的详细描述,此处不再具体赘述。
步骤303,在第一像素点对应多个特征值的情况下,基于第一窗口参数,确定第一像素点在每个特征值所在的特征图中的第一参考像素点。
需要说明的是,基于每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点的过程中,由于周视相机拍摄的周视图像中缺少深度信息。因此,确定的第一像素点可能会存在偏差,为了减少误差,可以在确定每个第二像素点对应的至少一个第一像素点之后,可以基于第一窗口参数,获取第一像素点周围的多个像素点对应的特征值,进而对第一像素点周围的多个像素点对应的特征值进行处理,以获取第二像素点对应的特征,从而可以减少误差,提高确定的第二像素点的特征的准确性。
其中,第一窗口参数可以为预设的窗口大小,比如,第一窗口参数可以为3*7,4*5等。比如,若第一窗口参数为3*7,则以第一像素点为中心,获取每个特征值所在的特征图中第一像素点周围的3*7-1个像素点作为第一参考像素点。
举例来说,第一像素点对应两个特征值,则在第一个特征值所在的第一个特征图中,获取第一像素点周围的3*7-1个像素点作为第一像素点在第一个特征图中对应的第一参考像素点;则在第二个特征值所在的第二个特征图中,获取第一像素点周围的3*7-1个像素点作为第一像素点在第二特征图中对应的第一参考像素点。
步骤304,根据第一像素点在每个特征图中的第一参考像素点的特征值,分别对第一像素点的每个特征值进行更新,以获取第一像素点对应的多个更新后的特征值。
举例来说,将第一像素点对应两个特征值的情况下,将第一个特征值对应的第一个特征图中的第一参考像素点对应的特征值与第一像素点对应的第一个特征值进行融合,并基于融合后的特征值,对第一个特征值进行更新,以获取更新后的第一个特征值。将第二个特征值对应的第二个特征图中的第一参考像素点对应的特征值与第一像素点对应的第二个特征值进行融合,并基于融合后的特征值,对第二个特征值进行更新,以获取更新后的第二个特征值。
步骤305,将第一像素点对应的多个更新后的特征值进行融合,以确定第一像素点对应的融合后的特征值。
可选的,可以为每个更新后的特征值设置对应的权重,之后将多个更新后的特征值的加权和,确定为第一像素点对应的融合后的特征值。
或者,也可以将第一像素点对应的多个更新后的特征值进行拼接后卷积,以确定第一像素点对应的融合后的特征值。
步骤306,根据每个第二像素点对应的每个第一像素点的融合后的特征值,生成目标鸟瞰图。
可选的,在第二像素点对应一个第一像素点的情况下,将一个第一像素点对应的融合后的特征值确定为第二像素点对应的特征值。
可选的,在第二像素点对应两个第一像素点的情况下,将两个第一像素点对应的融合后的特征值进行融合,以确定第二像素点对应的特征值。
本公开实施例中,首先获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同,之后根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点,在第一像素点对应多个特征值的情况下,基于第一窗口参数,确定第一像素点在每个特征值所在的特征图中的第一参考像素点,并根据第一像素点在每个特征图中的第一参考像素点的特征值,分别对第一像素点的每个特征值进行更新,以获取第一像素点对应的多个更新后的特征值,最后将第一像素点对应的多个更新后的特征值进行融合,以确定第一像素点对应的融合后的特征值,根据每个第二像素点对应的每个第一像素点的融合后的特征值,生成目标鸟瞰图。由此,通过获取每张特征图中第一像素点周围的多个第一参考像素点,并根据参考像素点对应的特征值对第一像素点的特征值进行更新,从而可以减小确定的第二像素点对应的第一像素点的误差,从而进一步提高了目标鸟瞰图特征的准确性,进而进一步了提高了下游感知任务的准确性。
图4为本公开一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图,如图4所示,该目标鸟瞰图的生成方法可以包括以下步骤:
步骤401,获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同。
步骤402,根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点。
其中,步骤401及步骤402的具体实现形式,可参照本公开其他各实施例中的详细描述,此处不再具体赘述。
步骤403,在第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在初始鸟瞰图中的位置编码,确定第一像素点在第一个特征图中的第二参考像素点,其中,第一像素点在第一个特征图中的第一个特征值对应的感受野最大。
其中,第二窗口参数可以为预选设置的,获取第一像素点周围的像素点的范围,比如,第二窗口参数可以为3*7,即获取第一像素点周围21个第二参考像素点。第二参考像素点可以为分散在第一像素点周围的,本公开对此不做限定。
可选的,可以将第二像素点在初始鸟瞰图中的位置输入位置编码器中,以使位置编码器对第二像素点的位置进行编码,以获取第二像素点对应的位置编码。
具体地,还可以根据位置编码及初始鸟瞰图中第二像素点对应的初始特征,确定每个第二参考像素点相对于第一像素点的位置信息。
比如,第二窗口参数为3*7,则会预测窗口中的每个像素点对应的偏移量,从而确定出对应的第二参考像素点相对于第一像素点的位置,进而确定第二参考像素点。比如,以第一像素点为原点,第二窗口参数为3*7,则窗口中左上角的像素点的位置为(-3,3),若对应的偏移量为(-1,0),则确定(-4,3)所在的像素点为(-3,3)对应的第二参考像素点。需要说明的是,第一像素点所在的位置也可能会发生偏移,比如,第一像素点(0,0)对应的偏移量为(1,0),则确定(1,0)所在的像素点为第一像素点偏移后对应的第二参考像素点。
步骤404,根据第二参考像素点在第一个特征图中的特征值,对第一像素点的第一个特征值进行更新,以获取第一像素点更新后的第一个特征值。
具体地,可以将第二参考像素点在第一个特征图中的特征值进行融合,并利用融合后的特征值对第一像素点的第一个特征值进行更新,以获取第一像素点更新后的第一个特征值。
可选的,对第一像素点的每个特征值进行更新的过程,还包括:确定第一像素点在每个特征图中的各参考像素点的权重值,之后将特征图中第一像素点对应的各参考像素点的特征值进行融合,以获取第一像素点在特征图中更新后的特征值。
针对对第一像素点的第一个特征值进行更新的过程,包括:确定第一像素点在第一个特征图中的第二参考像素点的权重值,之后基于第一个特征图中各第二参考像素点的权重值,将第一个特征图中第一像素点对应的各第二参考像素点的特征值进行融合,以获取第一像素点在特征图中更新后的特征值。具体为,基于各第二参考像素点的权重值,将第二参考像素点的特征值进行加权和,以得到第一像素点在第一个特征图中更新后的第一个特征值。
可选的,确定第一像素点在每个特征图中的各参考像素点的权重值,包括:根据第二窗口参数及位置编码,确定第一像素点在第一个特征图中的各个第二参考像素点的权重值;根据第一像素点更新后的第i个特征值及位置编码,确定第一像素点在第i+1个特征图中的各个参考像素点的权重值,其中,i大于1、且小于或等于n,n为第一像素点对应的特征值个数。
针对确定第一像素点在第一个特征图中的第二参考像素点的权重值,包括:根据第二窗口参数及位置编码,确定第一像素点在第一个特征图中的各个第二参考像素点的权重值。将第二窗口参数、位置编码输入预测网络中,以获取每个第二参考像素点的权重值。
步骤405,根据更新后的第一个特征值及位置编码,确定第一像素点在第二个特征图中的第三参考像素点,其中,像素点在第二个特征图中的第二个特征值对应的感受野小于第一个特征值对应的感受野、且大于其余特征值对应的感受野。
本公开实施例中,由于感受野越大,可以反应图像的整体特征,因此,先确定第一像素点在感受野较大的第一个特征图中的更新后的第一个特征值,之后根据更新后的第一个特征值及位置编码,确定第一像素点在感受野比第一个特征图像的第二个特征图中的更新后的第二个特征值,从而可以准确地确定第一像素点在第二个特征图中的第三参考像素点,由此类推,可以将每个特征图中的特征进行级联处理,从而使生成的目标鸟瞰图更加准确。
可选的,在位置编码对应的第二像素点对应一个第一像素点的情况下,将更新后的第一个特征值及位置编码输入预测网络中,以获取第二窗口参数中每个像素点的对应的偏移量,基于偏移量,确定第一像素点在第二个特征图中的第三参考像素点。
在位置编码对应的第二像素点对应两个第一像素点的情况下,根据两个第一像素点分别对应的更新后的第一特征值,及位置编码,确定每个第一像素点在第二特征图中的第二参考像素点。具体可以为,将两个第一像素点分别对应的更新后的第一特征值进行融合,并将融合后的特征值及位置编码输入预测网络中,以获取第二窗口参数中每个像素点对应的偏移量,基于偏移量,确定每个第一像素点在第二个特征图中对应的第三参考像素点。
本公开实施例中,由于视角图像中缺乏深度信息,在将具有深度的第二像素点,转换至没有深度的第一像素点的过程中,可能存在误差,从而在确定第二像素点对应的第一像素点更新后的第一个特征值之后,可以基于更新后的第一个特征值,预测第一像素点在第二个特征图中的第三参考像素点,从而可以提高预测的准确性,进而提高更新后的第一像素点对应的第一个特征值的准确性,进一步提高生成的目标鸟瞰图的准确性。
步骤406,根据第三参考素点在第二个特征图中的特征值,对第一像素点的第二个特征值进行更新,以获取第一像素点更新后的第二个特征值。
针对对第一像素点的第二个特征值进行更新的过程,包括:确定第一像素点在第二个特征图中的第三参考像素点的权重值,之后基于第二个特征图中各第三参考像素点的权重值,将第二个特征图中第一像素点对应的各第三参考像素点的特征值进行融合,以获取第一像素点在第二特征图中更新后的特征值。具体为,基于各第三参考像素点的权重值,将第三参考像素点的特征值进行加权和,以得到第一像素点更新后的第二个特征值。
可选的,确定第一像素点在第二个特征图中的第三参考像素点的权重值,包括:根据第一像素点更新后的第一个特征值及位置编码,确定第一像素点在第二个特征图中的各个第三参考像素点的权重值。
具体为,在位置编码对应的第二像素点对应一个第一像素点的情况下。将更新后的第一个特征值及位置编码输入预测网络中,以获取各个第三参考像素点的权重值。
在位置编码对应的第二像素点对应两个第一像素点的情况下,根据两个第一像素点分别对应的更新后的第一特征值,及位置编码,确定每个第一像素点在第二个特征图中的各个第三参考像素点的权重值。具体可以为,将两个第一像素点分别对应的更新后的第一特征值进行融合,并将融合后的特征值及位置编码输入预测网络中,以获取第一像素点在第二个特征图中的各个第三参考像素点的权重值。
本公开实施例中,在确定了更新后的第一个特征值及位置编码之后,可以将更新后的第一个特征值及位置编码输入预测网络中,有预测网络同时预测第一像素点在第二个特征图中的第三参考像素点,及第三参考像素点的权重值。
步骤407,基于更新后的第二个特征值及位置编码,返回执行确定第一像素点在第三个特征图中的第四参考像素点的操作,直至获取第一像素点对应的多个更新后的特征值,其中,像素点在第三个特征图中的第三个特征值对应的感受野小于第二个特征值对应的感受野、且大于除第一个特征值及第二个特征值之外的其余特征值对应的感受野。
其中,步骤407的具体实现形式可参照本公开中步骤405及步骤406的具体实现形式,此处不再详细赘述。
步骤408,将第一像素点对应的多个更新后的特征值进行融合,以确定第一像素点对应的融合后的特征值。
可选的,可以将第一像素点对应的多个更新后的特征值进行拼接后卷积,以确定第一像素点对应的融合后的特征值。
可选的,还可以为第一像素点对应的每个更新后的特征值设置对应的权重,之后将多个更新后的特征值的加权和,确定为第一像素点对应的融合后的特征值。
步骤409,根据每个第二像素点对应的每个第一像素点的融合后的特征值,生成目标鸟瞰图。
可选的,在第二像素点对应一个第一像素点的情况下,将一个第一像素点的融合后的特征值确定为第二像素点对应的特征值。
可选的,在第二像素点对应两个第一像素点的情况下,将两个第一像素点对应的融合后的特征值进行融合,以确定第二像素点对应的特征值。具体为,可以将两个第一像素点对应的融合后的特征值相加。
本公开实施例中,可以先确定初始鸟瞰图中每个第二像素点在周视图像中对应的至少一个第一像素点,之后在第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在初始鸟瞰图中的位置编码,确定第一像素点在第一个特征图中的第二参考像素点,并根据第二参考像素点在第一个特征图中的特征值,对第一像素点的第一个特征值进行更新,以获取第一像素点更新后的第一个特征值,之后根据更新后的第一个特征值及位置编码,确定第一像素点在第二个特征图中的第三参考像素点,根据第三参考素点在第二个特征图中的特征值,对第一像素点的第二个特征值进行更新,以获取第一像素点更新后的第二个特征值,之后基于更新后的第二个特征值及位置编码,返回执行确定第一像素点在第三个特征图中的第四参考像素点的操作,直至获取第一像素点对应的多个更新后的特征值,最后将第一像素点对应的多个更新后的特征值进行融合,以确定第一像素点对应的融合后的特征值,根据每个第二像素点对应的每个第一像素点的融合后的特征值,生成目标鸟瞰图。由此,可以先根据第一像素点在第一个特征图中对应的第二参考像素点的特征值,对第一个特征值进行更新,之后根据更新后的第一个特征值及第二像素点的位置编码,确定第一像素点在第二个特征图中对应的第三参考像素点,依次类推,从而可以结合第一像素点对应的更新后的特征值,预测第一像素点在其余特征图中的参考像素点,从而使确定的参考像素点更加准确,进而使第一像素点对应的更新后的特征值更加准确,进一步使确定的目标鸟瞰图特征更加准确,进而进一步了提高了下游感知任务的准确性。
图5为本公开一实施例所提供的一种目标鸟瞰图的生成方法的流程示意图,如图5所示,该目标鸟瞰图的生成方法可以包括以下步骤:
步骤501,根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务。
其中,各视觉任务可以包括车道线检测、道路分割、目标检测和轨迹规划等。车辆当前处于使用状态的各视觉任务可以包含以上中的一种或多种,本公开对此不做限定。
步骤502,在各视觉任务对应的图像分辨率相同的情况下,确定待获取每个第一像素点的一个特征值。
可以理解的是,由于不同视觉任务对应的处理对象不同,有些视觉任务需要高级的语义特征,有些视觉任务需要低级的语义特征。包含高级的语义特征的特征图的图像分辨率较小,感受野较大;包含低级的语义特征的特征图的分辨率较大,感受野较小。因此,需要根据不同的视觉任务,提供不同的图像分辨率的特征图。
在一些实施例中,若各视觉任务所需的特征图对应的图像分辨率相同,则只需确定每个第一像素点对应的一个特征值即可,从而只需对每个第一像素点对应的一个特征值进行处理,即可获取个视觉任务所需的目标鸟瞰图,从而提高了个视觉任务的处理效率。
步骤503,在各视觉任务对应的图像分辨率不同的情况下,根据各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个第一像素点的特征值的数量。
在一些实施例中,若各视觉任务所需的特征图对应的图像分辨率不同,则需要根据各视觉任务分别对应的图像分辨率,确定所需的特征图的图像分辨率的数量。
比如,当前处于使用状态的各视觉任务所需特征图的图像分辨率的数量为3个,分别为1/4周视图像分辨率、1/16周视图像分辨率,1/32周视图像分辨率。则每个第一像素点的特征值的数量也为3个,分别为第一像素点在1/4周视图像分辨率的特征图中的特征值,第一像素点在1/16周视图像分辨率的特征图中的特征值,第一像素点在1/32周视图像分辨率的特征图中的特征值。
步骤504,获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同。
步骤505,根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点。
步骤506,根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。
其中,步骤504及步骤506的具体实现形式,可参照本公开其他各实施例中的详细描述,此处不再具体赘述。
本公开实施例中,根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务,之后在各视觉任务对应的图像分辨率相同的情况下,确定待获取每个第一像素点的一个特征值,在各视觉任务对应的图像分辨率不同的情况下,根据各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个第一像素点的特征值的数量,进而获取获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同,根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点,最后根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。由此,可以根据车辆当前处于使用状态的视觉任务,确定第一像素点对应的特征值的数量,及所需的特征值的感受野,之后对指定感受野的特征值进行处理,以获取目标鸟瞰图,从而使获取的目标鸟瞰图更加适合车辆当前的处于使用状态的各视觉任务,且提高了生成的目标鸟瞰图的效率。
为了实现上述实施例,本公开还提出一种目标鸟瞰图的生成装置。
图6为本公开实施例所提供的目标鸟瞰图的生成装置的结构示意图。
如图6所示,该目标鸟瞰图的生成装置600可以包括:
第一获取模块610,用于获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同;
第一确定模块620,用于根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点;
生成模块630,用于根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。
可选的,生成模块630,具体用于:
在第一像素点对应多个特征值的情况下,基于第一窗口参数,确定第一像素点在每个特征值所在的特征图中的第一参考像素点;
根据第一像素点在每个特征图中的第一参考像素点的特征值,分别对第一像素点的每个特征值进行更新,以获取第一像素点对应的多个更新后的特征值;
将第一像素点对应的多个更新后的特征值进行融合,以确定第一像素点对应的融合后的特征值;
根据每个第二像素点对应的每个第一像素点的融合后的特征值,生成目标鸟瞰图。
可选的,生成模块630,具体用于:
在第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在初始鸟瞰图中的位置编码,确定第一像素点在第一个特征图中的第二参考像素点,其中,第一像素点在第一个特征图中的第一个特征值对应的感受野最大;
根据第二参考像素点在第一个特征图中的特征值,对第一像素点的第一个特征值进行更新,以获取第一像素点更新后的第一个特征值;
根据更新后的第一个特征值及位置编码,确定第一像素点在第二个特征图中的第三参考像素点,其中,像素点在第二个特征图中的第二个特征值对应的感受野小于第一个特征值对应的感受野、且大于其余特征值对应的感受野;
根据第三参考素点在第二个特征图中的特征值,对第一像素点的第二个特征值进行更新,以获取第一像素点更新后的第二个特征值;
基于更新后的第二个特征值及位置编码,返回执行确定第一像素点在第三个特征图中的第四参考像素点的操作,直至获取第一像素点对应的多个更新后的特征值,其中,像素点在第三个特征图中的第三个特征值对应的感受野小于第二个特征值对应的感受野、且大于除第一个特征值及第二个特征值之外的其余特征值对应的感受野;
将第一像素点对应的多个更新后的特征值进行融合,以确定第一像素点对应的融合后的特征值;
根据每个第二像素点对应的每个第一像素点的融合后的特征值,生成目标鸟瞰图。
可选的,还包括:
第二确定模块,用于确定第一像素点在每个特征图中的各参考像素点的权重值;
第二获取模块,用于基于每个特征图各参考像素点的权重值,将特征图中第一像素点对应的各参考像素点的特征值进行融合,以获取第一像素点在特征图中更新后的特征值。
可选的,第二确定模块,具体用于:
根据第二窗口参数及位置编码,确定第一像素点在第一个特征图中的各个第二参考像素点的权重值;
根据第一像素点更新后的第i个特征值及位置编码,确定第一像素点在第i+1个特征图中的各个参考像素点的权重值,其中,i大于1、且小于或等于n,n为第一像素点对应的特征值个数。
可选的,还包括:
第三确定模块,用于根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务;
第四确定模块,用于在各视觉任务对应的图像分辨率相同的情况下,确定待获取每个第一像素点的一个特征值;
第五确定模块,用于在各视觉任务对应的图像分辨率不同的情况下,根据各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个第一像素点的特征值的数量。
可选的,第一获取模块610,具体用于:
获取周视相机中每个摄像模组采集的初始图像;
基于每个摄像模组对应的坐标转换关系,将每个初始图像进行坐标转换,以生成周视图像。
本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
本公开实施例的目标鸟瞰图的生成装置,首先获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同,之后根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点,最后根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。由此,对初始鸟瞰图中第二像素点对应的第一像素点的至少一个不同感受野的特征值进行处理,以确定每个第二像素点对应的特征值,从而提高了目标鸟瞰图特征的准确性,且生成的目标鸟瞰图特征能够支持多个不同的感知任务处理,提高了感知任务的效率及准确性。
为了实现上述实施例,本公开还提出一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的目标鸟瞰图的生成方法。
为了实现上述实施例,本公开还提出一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,实现如本公开前述实施例提出的目标鸟瞰图的生成方法。
图7示出了适于用来实现本公开实施方式的示例性电子设备的框图。图7显示的电子设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图7未显示,通常称为“硬盘驱动器”)。尽管图7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
本公开的技术方案,可以先获取周视相机采集的周视图像中每个第一像素点的至少一个特征值,其中,第一像素点的不同特征值对应的感受野不同,之后根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个第二像素点对应的至少一个第一像素点,最后根据与每个第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图。由此,对初始鸟瞰图中第二像素点对应的第一像素点的至少一个不同感受野的特征值进行处理,以确定每个第二像素点对应的特征值,从而提高了目标鸟瞰图特征的准确性,且生成的目标鸟瞰图特征能够支持多个不同的感知任务处理,提高了感知任务的效率及准确性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (12)

1.一种目标鸟瞰图的生成方法,其特征在于,包括:
获取周视相机中每个摄像模组采集的初始图像;
基于每个所述摄像模组对应的坐标转换关系,将每个所述初始图像进行坐标转换,以生成周视图像;
将每个所述周视图像输入特征提取网络中,以获取每个所述周视图像中每个第一像素点对应的至少一个特征值,其中,所述第一像素点的不同特征值对应的感受野不同;
根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个所述第二像素点对应的至少一个第一像素点;
根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图;
所述根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图,包括:
在所述第一像素点对应多个特征值的情况下,基于第一窗口参数,确定所述第一像素点在每个特征值所在的特征图中的第一参考像素点;
根据所述第一像素点在每个特征图中的第一参考像素点的特征值,分别对所述第一像素点的每个特征值进行更新,以获取所述第一像素点对应的多个更新后的特征值;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
2.如权利要求1所述的方法,其特征在于,所述根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图,还包括:
在所述第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在所述初始鸟瞰图中的位置编码,确定所述第一像素点在第一个特征图中的第二参考像素点,其中,所述第一像素点在所述第一个特征图中的第一个特征值对应的感受野最大;
根据所述第二参考像素点在所述第一个特征图中的特征值,对所述第一像素点的第一个特征值进行更新,以获取所述第一像素点更新后的第一个特征值;
根据所述更新后的第一个特征值及所述位置编码,确定所述第一像素点在第二个特征图中的第三参考像素点,其中,所述第三参考像素点在所述第二个特征图中的第二个特征值对应的感受野小于所述第一个特征值对应的感受野、且大于其余特征值对应的感受野;
根据所述第三参考像素点在所述第二个特征图中的特征值,对所述第一像素点的第二个特征值进行更新,以获取所述第一像素点更新后的第二个特征值;
基于所述更新后的第二个特征值及所述位置编码,返回执行所述确定所述第一像素点在第三个特征图中的第四参考像素点的操作,直至获取所述第一像素点对应的多个更新后的特征值,其中,所述第四参考像素点在所述第三个特征图中的第三个特征值对应的感受野小于所述第二个特征值对应的感受野、且大于除所述第一个特征值及所述第二个特征值之外的其余特征值对应的感受野;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
3.如权利要求2所述的方法,其特征在于,对所述第一像素点的每个特征值进行更新的过程,还包括:
确定所述第一像素点在每个特征图中的各参考像素点的权重值;
基于每个特征图各参考像素点的权重值,将所述特征图中所述第一像素点对应的各参考像素点的特征值进行融合,以获取所述第一像素点在所述特征图中更新后的特征值。
4.如权利要求3所述的方法,其特征在于,所述确定所述第一像素点在每个特征图中的各参考像素点的权重值,包括:
根据所述第二窗口参数及所述位置编码,确定所述第一像素点在所述第一个特征图中的各个第二参考像素点的权重值;
根据所述第一像素点更新后的第i个特征值及所述位置编码,确定所述第一像素点在第i+1个特征图中的各个参考像素点的权重值,其中,i大于1、且小于或等于n,n为所述第一像素点对应的特征值个数。
5.如权利要求1-4任一所述的方法,其特征在于,在所述获取每个所述周视图像中每个第一像素点对应的至少一个特征值之前,还包括:
根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务;
在所述各视觉任务对应的图像分辨率相同的情况下,确定待获取每个所述第一像素点的一个特征值;
在所述各视觉任务对应的图像分辨率不同的情况下,根据所述各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个所述第一像素点的特征值的数量。
6.一种目标鸟瞰图的生成装置,其特征在于,包括:
第一获取模块,用于获取周视相机中每个摄像模组采集的初始图像;基于每个所述摄像模组对应的坐标转换关系,将每个所述初始图像进行坐标转换,以生成周视图像;将每个所述周视图像输入特征提取网络中,以获取每个所述周视图像中每个第一像素点对应的至少一个特征值,其中,所述第一像素点的不同特征值对应的感受野不同;
第一确定模块,用于根据初始鸟瞰图中每个第二像素点对应的坐标转换关系,确定每个所述第二像素点对应的至少一个第一像素点;
生成模块,用于根据与每个所述第二像素点对应的每个第一像素点的特征值,生成目标鸟瞰图;
所述生成模块,具体用于:
在所述第一像素点对应多个特征值的情况下,基于第一窗口参数,确定所述第一像素点在每个特征值所在的特征图中的第一参考像素点;
根据所述第一像素点在每个特征图中的第一参考像素点的特征值,分别对所述第一像素点的每个特征值进行更新,以获取所述第一像素点对应的多个更新后的特征值;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
7.如权利要求6所述的装置,其特征在于,所述生成模块,还具体用于:
在所述第一像素点对应多个特征值的情况下,基于第二窗口参数及对应的第二像素点在所述初始鸟瞰图中的位置编码,确定所述第一像素点在第一个特征图中的第二参考像素点,其中,所述第一像素点在所述第一个特征图中的第一个特征值对应的感受野最大;
根据所述第二参考像素点在所述第一个特征图中的特征值,对所述第一像素点的第一个特征值进行更新,以获取所述第一像素点更新后的第一个特征值;
根据所述更新后的第一个特征值及所述位置编码,确定所述第一像素点在第二个特征图中的第三参考像素点,其中,所述第三参考像素点在所述第二个特征图中的第二个特征值对应的感受野小于所述第一个特征值对应的感受野、且大于其余特征值对应的感受野;
根据所述第三参考像素点在所述第二个特征图中的特征值,对所述第一像素点的第二个特征值进行更新,以获取所述第一像素点更新后的第二个特征值;
基于所述更新后的第二个特征值及所述位置编码,返回执行所述确定所述第一像素点在第三个特征图中的第四参考像素点的操作,直至获取所述第一像素点对应的多个更新后的特征值,其中,所述第四参考像素点在所述第三个特征图中的第三个特征值对应的感受野小于所述第二个特征值对应的感受野、且大于除所述第一个特征值及所述第二个特征值之外的其余特征值对应的感受野;
将所述第一像素点对应的多个更新后的特征值进行融合,以确定所述第一像素点对应的融合后的特征值;
根据每个所述第二像素点对应的每个第一像素点的融合后的特征值,生成所述目标鸟瞰图。
8.如权利要求7所述的装置,其特征在于,还包括:
第二确定模块,用于确定所述第一像素点在每个特征图中的各参考像素点的权重值;
第二获取模块,用于基于每个特征图各参考像素点的权重值,将所述特征图中所述第一像素点对应的各参考像素点的特征值进行融合,以获取所述第一像素点在所述特征图中更新后的特征值。
9.如权利要求8所述的装置,其特征在于,所述第二确定模块,具体用于:
根据所述第二窗口参数及所述位置编码,确定所述第一像素点在所述第一个特征图中的各个第二参考像素点的权重值;
根据所述第一像素点更新后的第i个特征值及所述位置编码,确定所述第一像素点在第i+1个特征图中的各个参考像素点的权重值,其中,i大于1、且小于或等于n,n为所述第一像素点对应的特征值个数。
10.如权利要求6-9任一所述的装置,其特征在于,还包括:
第三确定模块,用于根据车辆当前所使用的自动驾驶模式,确定当前处于使用状态的各视觉任务;
第四确定模块,用于在所述各视觉任务对应的图像分辨率相同的情况下,确定待获取每个所述第一像素点的一个特征值;
第五确定模块,用于在所述各视觉任务对应的图像分辨率不同的情况下,根据所述各视觉任务分别对应的不同图像分辨率的数量,确定待获取的每个所述第一像素点的特征值的数量。
11.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-5中任一所述的目标鸟瞰图的生成方法。
12.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-5中任一所述的目标鸟瞰图的生成方法。
CN202211620942.0A 2022-12-16 2022-12-16 目标鸟瞰图的生成方法、装置、电子设备及存储介质 Active CN115619958B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211620942.0A CN115619958B (zh) 2022-12-16 2022-12-16 目标鸟瞰图的生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211620942.0A CN115619958B (zh) 2022-12-16 2022-12-16 目标鸟瞰图的生成方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN115619958A CN115619958A (zh) 2023-01-17
CN115619958B true CN115619958B (zh) 2023-04-07

Family

ID=84880200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211620942.0A Active CN115619958B (zh) 2022-12-16 2022-12-16 目标鸟瞰图的生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115619958B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114842466A (zh) * 2022-03-16 2022-08-02 北京迈格威科技有限公司 目标检测方法、计算机程序产品和电子设备
CN115273022A (zh) * 2022-06-27 2022-11-01 重庆长安汽车股份有限公司 车辆的鸟瞰图生成方法、装置、车辆及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223038B (zh) * 2019-12-02 2023-06-09 上海赫千电子科技有限公司 一种车载环视图像的自动拼接方法及显示装置
EP4115318A1 (en) * 2020-03-05 2023-01-11 Cambridge Enterprise Limited System and method for predicting a map from an image
CN113002531B (zh) * 2021-02-08 2022-09-30 深圳市海沃德科技有限公司 车辆全景环视方法、系统、设备和计算机可读存储介质
CN114898315A (zh) * 2022-05-05 2022-08-12 北京鉴智科技有限公司 驾驶场景信息确定方法、对象信息预测模型训练方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114842466A (zh) * 2022-03-16 2022-08-02 北京迈格威科技有限公司 目标检测方法、计算机程序产品和电子设备
CN115273022A (zh) * 2022-06-27 2022-11-01 重庆长安汽车股份有限公司 车辆的鸟瞰图生成方法、装置、车辆及存储介质

Also Published As

Publication number Publication date
CN115619958A (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
CN110322500B (zh) 即时定位与地图构建的优化方法及装置、介质和电子设备
CN110866496B (zh) 基于深度图像的机器人定位与建图方法和装置
JP7240367B2 (ja) 車両の位置特定に用いられる方法、装置、電子デバイス及び記憶媒体
US11417017B2 (en) Camera-only-localization in sparse 3D mapped environments
CN109931945B (zh) Ar导航方法、装置、设备和存储介质
CN109961522B (zh) 图像投射方法、装置、设备和存储介质
US11227395B2 (en) Method and apparatus for determining motion vector field, device, storage medium and vehicle
CN104180814A (zh) 移动终端上实景功能中的导航方法和电子地图客户端
CN110349212B (zh) 即时定位与地图构建的优化方法及装置、介质和电子设备
CN110686676A (zh) 机器人重定位方法、装置及机器人
CN112288825A (zh) 相机标定方法、装置、电子设备、存储介质和路侧设备
CN113763478A (zh) 无人车相机标定方法、装置、设备、存储介质及系统
CN115456898A (zh) 停车场的建图方法、装置、车辆及存储介质
CN115249266A (zh) 航路点位置预测方法、系统、设备及存储介质
CN113223064A (zh) 一种视觉惯性里程计尺度的估计方法和装置
CN115619958B (zh) 目标鸟瞰图的生成方法、装置、电子设备及存储介质
CN110298320B (zh) 一种视觉定位方法、装置及存储介质
CN112085842B (zh) 深度值确定方法及装置、电子设备和存储介质
CN116642490A (zh) 基于混合地图的视觉定位导航方法、机器人及存储介质
CN113763481B (zh) 一种移动场景中多相机视觉三维地图构建与自标定方法
CN113222968B (zh) 融合毫米波和图像的检测方法、系统、设备及存储介质
CN114972530A (zh) 一种基于虚拟场景对摄像机的标定方法、装置、设备及存储介质
CN113762001B (zh) 一种目标检测方法、装置、电子设备和存储介质
CN117437306B (zh) 一种摄像头的标定方法、装置、设备及介质
CN117994614A (zh) 目标检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant