CN115063759A

CN115063759A - 一种三维车道线检测方法、装置、交通工具及存储介质

Info

Publication number: CN115063759A
Application number: CN202210540229.9A
Authority: CN
Inventors: 沈师达; 韩旭
Original assignee: Guangzhou Weride Technology Co Ltd
Current assignee: Guangzhou Weride Technology Co Ltd
Priority date: 2022-05-18
Filing date: 2022-05-18
Publication date: 2022-09-16
Anticipated expiration: 2042-05-18
Also published as: CN115063759B

Abstract

本发明公开了一种三维车道线检测方法、装置、交通工具及存储介质，方法包括：对二维图像进行深度估计，获得每个像素的深度估计信息；根据深度估计信息对二维图像进行转换，获得第一三维图像；对第一三维图像按指定范围进行划分，得到多个第二三维图像；使用第一预设网络模型对第二三维图像进行处理，获取第二三维图像中的第一车道线；连接相邻第二三维图像中的第一车道线，得到三维空间的第二车道线。通过本发明实施例，把二维图像转换成三维图像，然后在对三维图像进行划分，降低网络模型的计算量；在三维图像中提取车道线，从而提高了车道线的准确性。

Description

一种三维车道线检测方法、装置、交通工具及存储介质

技术领域

本发明涉及交通工具技术领域，尤其涉及一种三维车道线检测方法、装置、交通工具及存储介质。

背景技术

视觉车道线检测是指利用车载前向摄像头获取车辆前方视野，利用神经网络等算法提取图像中的车道线信息。前视图的车道线检测现已较为成熟，但是如何将图片中的车道线转换到三维空间，将这些车道线检测结果进一步利用，如建立语义地图，存在一定困难。语义地图类似一般的导航地图，其上诸如车道线这样的静态道路交通元素会被特殊标注，呈现方式为鸟瞰图。

发明内容

本发明的主要目的在于提供一种三维车道线检测方法、装置、交通工具及存储介质，旨在解决现有技术车道线转换到三维空间并建立语义地图时存在转换困难且转换精度较低的问题。

为实现上述目的，本发明提供了一种三维车道线检测方法，所述方法包括以下步骤：

S1：对二维图像进行深度估计，获得每个像素的深度估计信息；

S2：根据深度估计信息对所述二维图像进行转换，获得第一三维图像；

S3：对所述第一三维图像按指定范围进行划分，得到多个第二三维图像；

S4：使用第一预设网络模型对所述第二三维图像进行处理，获取所述第二三维图像中的第一车道线；

S5：连接相邻所述第二三维图像中的所述第一车道线，得到三维空间的第二车道线。

可选地，所述第一预设网络模型通过以下步骤进行训练：

对第三三维图像按指定范围进行划分，得到多个第四三维图像；

对所述第四三维图像中的存在车道线的概率和/所述车道线对应的四次函数进行标注；

使用标注后的所述第四三维图像对预设网络模型进行训练，所述预设网络模型输出所述第四三维图像的存在车道线的概率和/所述车道线对应的四次函数。

可选地，在所述步骤S4之前，还包括以下步骤：

使用第二预设网络模型对所述第二三维图像进行处理，判断所述第二三维图像是否存在车道线；

把存在车道线的所述第二三维图像提供给所述第一预设网络模型进行处理。

可选地，所述步骤S4，包括以下步骤：

使用第一预设网络模型对所述第二三维图像进行处理，输出所述第二三维图像存在车道线的存在概率和/所述车道线对应的四次方程和所述四次方程的参数概率；

判断所述存在概率是否大于第一阈值，如果大于所述第一阈值，则判断所述参数概率是否大于第二阈值；如果大于所述第二阈值，则获取所述四次方程；

根据所述四次方程得到第一车道线。

可选地，所述方法还包括以下步骤：

所述参数概率大于所述第二阈值的所述四次方程存在多个时，获取所述参数概率最大的四次方程。

可选地，所述步骤S5，包括以下步骤：

获取相邻所述第二三维图像中的所述第一车道线的相似性；

连接所述相似性最大的相邻所述第二三维图像中的所述第一车道线，得到三维空间的第二车道线。

此外，为实现上述目的，本发明还提出一种三维车道线检测装置，所述装置包括：

深度估计单元，用于对二维图像进行深度估计，获得每个像素的深度估计信息；

三维转换单元，用于根据深度估计信息对所述二维图像进行转换，获得第一三维图像；

图像划分单元，用于对所述第一三维图像按指定范围进行划分，得到多个第二三维图像；

车道线获取单元，用于使用第一预设网络模型对所述第二三维图像进行处理，获取所述第二三维图像中的第一车道线；

车道线连接单元，用于连接相邻所述第二三维图像中的所述第一车道线，得到三维空间的第二车道线。

可选地，所述装置还包括：

车道线判断单元，用于使用第二预设网络模型对所述第二三维图像进行处理，判断所述第二三维图像是否存在车道线；把存在车道线的所述第二三维图像提供给所述第一预设网络模型进行处理。

此外，为实现上述目的，本发明还提出一种交通工具，所述交通工具包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的三维车道线检测程序，所述三维车道线检测程序配置为实现如上文所述三维车道线检测方法的步骤。

此外，为实现上述目的，本发明还提出一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上文所述的三维车道线检测方法的步骤。

通过本发明实施例，把二维图像转换成三维图像，然后在对三维图像进行划分，降低网络模型的计算量；在三维图像中提取车道线，从而提高了车道线的准确性。

附图说明

图1为本发明提供的三维车道线检测方法的一个流程示意图。

图2为本发明提供的对第一预设网络模型进行训练的一个流程示意图。

图3为本发明提供的三维车道线检测方法的另一流程示意图。

图4为本发明提供的三维车道线获取的一个流程示意图。

图5为本发明提供的三维车道线连接的一个流程示意图。

图6为本发明提供的三维车道线检测装置实施例的结构框图。

图7为本发明提供的三维车道线检测装置实施例的另一结构框图。

图8是本发明实施例方案涉及的硬件运行环境的交通工具结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅以解释本发明，并不用于限定本发明。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身没有特定的意义。因此，“模块”、“部件”或“单元”可以混合地使用。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

在一个实施例中，如图1所示，本发明提供三维车道线检测方法，所述方法包括：

步骤S1、对二维图像进行深度估计，获得每个像素的深度估计信息。

图像深度估计：估计图像中场景的深度，即场景中各点像素到相机成像平面的垂直距离。获取场景中的深度信息够帮助我们更好地进行场景理解，因此图像深度估计在虚拟现实、语义分割、自动驾驶及三维重建等多个领域都有着广泛的应用。

无人驾驶车辆通过摄像头拍摄行驶中的路面信息后，需要对包含路面信息的图像进行深度估计，便于后续车道线提取时，把二维图像转换成三维图像。

图像深度估计使用的图像可以使用单目相机进行拍摄也可以使用双目相机进行拍摄。拍摄图片后使用相应的算法或神经网络进行处理，得到图像的深度信息。如可以使用基于机器学习的神经网络对单目相机拍摄的图像进行深度估计。深度估计属于现有技术，本实施例不对具体的深度估计方案进行限制。

无人驾驶车辆使用摄像头拍摄的路面图像和深度估计后每个像素对应深度信息，如下表所示：

序号	图像	深度估计信息
			1	路面图像A	深度估计信息A
2	路面图像B	深度估计信息B
			3	路面图像C	深度估计信息C
5	路面图像D	深度估计信息D

步骤S2、根据深度估计信息对所述二维图像进行转换，获得第一三维图像。

根据深度信息进行三维重建，属于现有技术方案。本实施例描述基于深度图的三维重建。

将步骤S1中获取的图像从相机坐标转为世间坐标，像素坐标通过相机的内参矩阵及该像素对应的深度估计信息，得到基于这个相机的世界坐标信息。然后通过RT矩阵转换到世界坐标并得到点云。得到点云之后，估计特的法线方向得到三角面片，再将图像的纹理信息填充到三角面片的顶点上，就完成三维重建。

根据图像的深度信息进行三维重建，也可以采用深度学习等网络模型进行转换，如“Depth Inference for Unstructured Multi-view Stereo”论文描述的网络模型。具体使用那种技术方案进行三维重建，本技术方案不进行限制。对包含深度信息的图像进行三维转换后得到的三维图像，如下表所示：

序号	图像	深度估计信息	三维图像
				1	路面图像A	深度估计信息A	路面三维图像A
2	路面图像B	深度估计信息B	路面三维图像B
				3	路面图像C	深度估计信息C	路面三维图像C
5	路面图像D	深度估计信息D	路面三维图像D

二维图像和三维图像不是一一对应，可以多张二维图像转成一张三维图像。

步骤S3、对所述第一三维图像按指定范围进行划分，得到多个第二三维图像。

对三维图像(如路面三维图像B)按照指定范围进行划分，如按640*320*512像素的指定空间对三维图像件划分，得到多个三维空间块。具体划分多大的三维空间块，需要经过后续车道线识别的需求进行设定。当划分的空间过小时，获取的三维空间中车道线曲线较小，不利于网络模型进行车道线的识别。因此，划分三维空间大小，可以根据网络模型来不断优化。划分的三维空间块，如下表所示：

步骤S4、使用第一预设网络模型对所述第二三维图像进行处理，获取所述第二三维图像中的第一车道线。

第一预设网络模块为深度学习神经网络，也可以是其他神经网络。具体使用那种神经网络本技术方案不进行限制。核心在于利用神经网络的非线性拟合采集到的第二图像中的轨迹信息，利用梯度下降的方法使神经网络习得轨迹与表示方程之间的关系。

车道线三维空间轨迹(即三维曲线)对应的表示方程为四次方程，如某个三维空间曲线A对应的方程为：

a＝10

x＝3*a*t/(1+(t^3))

y＝3*a*(t^2)/(1+(t^3))

不同的三维曲线对应不同的四次方程。

第一预设网络(如深度学习神经网络)采用监督的模型训练方式，具体训练流程，参见图2所述流程。

步骤S101、对第三三维图像按指定范围进行划分，得到多个第四三维图像。

对三维图像(如路面三维图像C)按照指定范围进行划分，如按640*320*512像素的指定空间对三维图像件划分，得到多个三维空间块。具体划分多大的三维空间块，可以根据实际需求进行设置。划分的三维空间块，如下表所示：

步骤S102、对所述第四三维图像中的存在车道线的概率和/所述车道线对应的四次函数进行标注。

对划分后的三维空间块的车道线的存在概率进行标注，同时对该车道线对应的四次曲线方程和参数概率进行标注。标注方式可以通过人工方式进行标注，如根据车道线上的点在三维空间中的坐标创建对应的四次方程。标注后的车道线存在概率和4次曲线方程，如下表所示：

步骤S103、使用标注后的所述第四三维图像对预设网络模型进行训练，所述预设网络模型输出所述第四三维图像的存在车道线的概率和/所述车道线对应的四次函数。

第四三维图像是指用于训练第一预网络设模的三维图像，本实施例中，第一预网络设模为深度学习网络模型。本申请实施例中采用有监督的模型训练方式，所以样本图像具有标注，用于标注样本图像的真实四次方程。在本申请实施例中，样本图像和四次方程，如下表所示：

第一预网络设模可以采用不同的神经网络，也可以采用大网络、多分支的结构进行回归，也即每个分支可以独立训练，运算相互独立。核心在于利用神经网络的非线性拟合采集到的曲线信息，利用梯度下降的方法使神经网络习得曲线和四次方程之间的关系。

使用训练好后的深度学习网络，对三维空间块(即第二三维图像)获取车道线轨迹对应的四次方程，具体参见图4所示流程。

步骤S201、使用第一预设网络模型对所述第二三维图像进行处理，输出所述第二三维图像存在车道线的存在概率和/所述车道线对应的四次方程和所述四次方程的参数概率。

把三维空间块(如三维空间块A)输入第一预设网络模型(如深度学习神经网络)，深度学习神经网络输出该三维空间块(如三维空间块A)是否存在车道线的概率，及存在车道线后对应的四次曲线方程及对应的参数概率。如下表所示：

步骤S202、判断所述存在概率是否大于第一阈值，如果大于所述第一阈值，则判断所述参数概率是否大于第二阈值；如果大于所述第二阈值，则获取所述四次方程。

步骤S203、所述参数概率大于所述第二阈值的所述四次方程存在多个时，获取所述参数概率最大的四次方程。

判断三维空间块中车道线存在概率是否大于某个阈值，如大于70％以上的三维空间才表示存在车道线。第一阈值具体设置值，根据实际需求进行设置。当车道线存在概率大于指定值后(即表示该三维空间存在车道线)才进一步判断四次方程的参数概率是否大于指定阈值。深度学习网络对三维空间总的车道线曲线进行4次方程预测时，可能会输出多个4次方程，同时输出该4次方程可能的参数概率。一个4次方程也可能有多个参数概率。获取参数概率大于指定阈值的四次方程，如参数概率大于75％的四次方程。如果四次方程的参数概率都低于指定阈值，则表示该三维空间块不存在车道线。

当参数概率大于指定阈值的参数概率有多个时，选择参数概率最大的四次方程。

经过上述判断，三维空间块A对应的曲线方程如下表所示：

步骤S204、根据所述四次方程得到第一车道线。

根据四次方程A和对应的参数B在三维空间块A中生产车道线对应的曲线。

步骤S5、连接相邻所述第二三维图像中的所述第一车道线，得到三维空间的第二车道线。

对三维图像(如路面三维图像C)按照指定范围进行划分，划分后的图片具有唯一编号，该编号记录划分后的图像的顺序。可以通过X、Y轴坐标来标识划分后的图像在划分前的位置，如下表所示：

图像	X轴序号	Y轴序号
			三维空间块A	1	1
三维空间块B	2	2
			三维空间块C	3	3
三维空间块D	4	4

对获取车道线(即获取到车道线对应的四次方程，然后根据四次方程生成三维空间的曲线)的图像，通过该图像的X、Y轴序号找到相邻的图像。如图像A相邻的图像为图像B，然后把图像A中的曲线A与图像B中的曲线B进行连接。曲线连接过程，参见图5所述流程：

步骤S301、获取相邻所述第二三维图像中的所述第一车道线的相似性。

获取相邻两个图像内的曲线的相似性，如获取图像A与图像B之间的车道线的相似性。一个图像会有多个相邻的图像，需要逐一获取相邻图像的车道线的相似性。

获取相邻图像的车道线的相似性可以采用神经网络，如深度学习网络模型进行处理。该网络模型对输入的两个图像给出该图像中车导线的相似度。该深度学习网络模型采用采用监督的模型训练方式，对相邻的两张三维图像中车道线的相似度进行标注，然后把标注后的样本输入深度学习网络模型进行训练，然后把训练好后的深度学习网络模型用于相邻两个三维图像中车道线的相似性判断。

深度学习网络模型对相邻两个三维图像中车道线的相似性判断后，得到如下表所示结果：

步骤S302、连接所述相似性最大的相邻所述第二三维图像中的所述第一车道线，得到三维空间的第二车道线。

获取到相邻图像之间的车道线相似性后，三维空间块A图像与相邻图像的车道性相似性，如下表所示：

序号	图像1	图像2	车道线相似性
				1	三维空间块A	三维空间块B	85％
2	三维空间块A	三维空间块C	75％
				3	三维空间块A	三维空间块D	65％

然后获取一个相似性最大的相邻图像进行车道线连接，如三维空间块A相邻图像相似性最大的是图像三维空间块B，则把三维空间块A和三维空间块B中的车道线曲线进行连接。连接时，把三维空间块A和三维空间块B最接近的曲线上的点进行连接，从而得到三维空间块A和三维空间块B之间连接后的曲线。以此类推，把所有分割后的第二三维图像中的曲线连接起来，就得到三维空间的车道线。

此外，本发明实施例还提出一种三维车道线检测方法，参见图3。所述方法在图1所示的方法基础上，还包括以下流程：

步骤S6：使用第二预设网络模型对所述第二三维图像进行处理，判断所述第二三维图像是否存在车道线；把存在车道线的所述第二三维图像提供给所述第一预设网络模型进行处理。

使用第二预设网络模型对分割后的第二三维图像进行处理，判断第二三维图像中是否存在车道线，如果存在车道线，则提取车道线特征。然后把只包含车道线的图像提供给第一预设网络模型进行处理，不包含车道线的图像不需要提供给第一预设网络模型信息处理。从而减少第一预设网络模型的计算量。

第二预设网络模型可以是能够提取图像特征的各种类型的网络模型，本申请实施例对第二预设网络模型的结构以及提取出的图像特征不加以限定。例如，第二预设网络模型可以是指U-Net(U-Network，U-网络)模型、PSPNet(Pyramid Scene ParsingNetwork，金字塔场景解析网络)模型、DenseNet(Dense Convolutional Network，密度卷积网络)模型、ResNet(Residual Network，残差网络)模型或MobileNet(Mobile Network)(移动网络)模型等。第二预设网络模型本身可以具有初始参数，初始参数可以为在ImageNet数据集上预训练得到的参数。在第一次迭代训练过程中，在初始参数的基础上对第二预设网络模型进行训练。

第二预设网络模型用于对第二图像进行识别、语义分割处理。在对第二预设网络模型进行训练之前，可以对第二预设网络模型的参数进行初始化。例如，采用方差为0.01，均值为0的高斯分布对第二预设网络模型的参数进行初始化。再例如，采用方差为0.001，均值为0的高斯分布对第二预设网络模型的参数进行初始化等。不同的模型参数可以采用相同的方式进行初始化，也可以采用不同的方式进行初始化，本申请实施例对此不加以限定。第二预设网络模型的结构和参数类型可以根据需求灵活设置，本申请实施例对此不加以限定。在设置好结构和参数类型，并且对参数进行初始化后，获取到第二预设网络模型。

本实施例对第二预设网络模型采用有标注方式进行训练，如对带有车道线的图片进行标注，标注该图像中存在车道线。

通过本发明实施例，利用第二预设网络判断分割后的图像是否存在车道线，然后把包含车道线的图像提供给第一预设网络进行处理，从而减少了提供给第一预设网络进行处理的图像，可以降低网络模型的计算量。

此外，本发明实施例还提出一种三维车道线检测装置，参照图6，所述三维车道线检测装置包括：

深度估计单元10，用于对二维图像进行深度估计，获得每个像素的深度估计信息；

三维转换单元20，用于根据深度估计信息对所述二维图像进行转换，获得第一三维图像；

图像划分单元30，用于对所述第一三维图像按指定范围进行划分，得到多个第二三维图像；

车道线获取单元40，用于使用第一预设网络模型对所述第二三维图像进行处理，获取所述第二三维图像中的第一车道线；

车道线连接单元50，用于连接相邻所述第二三维图像中的所述第一车道线，得到三维空间的第二车道线。

此外，本发明实施例还提出一种三维车道线检测装置，参照图7。在图6所示的三维车道线检测装置基础上，还包括：

车道线判断单元60，用于使用第二预设网络模型对所述第二三维图像进行处理，判断所述第二三维图像是否存在车道线；把存在车道线的所述第二三维图像提供给所述第一预设网络模型进行处理。

参照图8，图8为本发明实施例方案涉及的硬件运行环境的交通工具的结构示意图。

如图8所示，该交通工具可以包括：处理器1001，例如CPU，通信总线1002、用户接口1003，网络接口1004，存储器1005。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI、4G、5G接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图8中示出的结构并不构成对交通工具的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图8所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及三维车道线检测程序。

在图8所示的交通工具中，网络接口1004主要用于与外部网络进行数据通信；用户接口1003主要用于接收用户的输入指令；交通工具通过处理器1001调用存储器1005中存储的三维车道线检测程序，并执行以下操作：

可选地，所述第一预设网络模型通过以下步骤进行训练：

可选地，在所述步骤S4之前，还包括以下步骤：

可选地，所述步骤S4，包括以下步骤：

根据所述四次方程得到第一车道线。

可选地，所述方法还包括以下步骤：

可选地，所述步骤S5，包括以下步骤：

获取相邻所述第二三维图像中的所述第一车道线的相似性；

此外，本发明实施例还提出一种计算机可读存储介质，计算机可读存储介质上存储有三维车道线检测程序，三维车道线检测程序被处理器执行时实现如下操作：

可选地，所述第一预设网络模型通过以下步骤进行训练：

可选地，在所述步骤S4之前，还包括以下步骤：

可选地，所述步骤S4，包括以下步骤：

根据所述四次方程得到第一车道线。

可选地，所述方法还包括以下步骤：

可选地，所述步骤S5，包括以下步骤：

获取相邻所述第二三维图像中的所述第一车道线的相似性；

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，控制器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种三维车道线检测方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述方法，其特征在于，所述第一预设网络模型通过以下步骤进行训练：

3.根据权利要求1所述方法，其特征在于，在所述步骤S4之前，还包括以下步骤：

4.根据权利要求1所述方法，其特征在于，所述步骤S4，包括以下步骤：

根据所述四次方程得到第一车道线。

5.根据权利要求4所述方法，其特征在于，所述方法还包括以下步骤：

6.根据权利要求1所述方法，其特征在于，所述步骤S5，包括以下步骤：

获取相邻所述第二三维图像中的所述第一车道线的相似性；

7.一种三维车道线检测装置，其特征在于，所述装置包括：

8.根据权利要求7所述装置，其特征在于，所述装置还包括：

9.一种交通工具，其特征在于，所述交通工具包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的三维车道线检测程序，所述三维车道线检测程序配置为实现根据权利要求1至6中任一项所述三维车道线检测方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的三维车道线检测方法的步骤。