CN117765499A - 一种车辆辅助驾驶智能决策方法及系统 - Google Patents
一种车辆辅助驾驶智能决策方法及系统 Download PDFInfo
- Publication number
- CN117765499A CN117765499A CN202311859830.5A CN202311859830A CN117765499A CN 117765499 A CN117765499 A CN 117765499A CN 202311859830 A CN202311859830 A CN 202311859830A CN 117765499 A CN117765499 A CN 117765499A
- Authority
- CN
- China
- Prior art keywords
- feature vector
- image information
- feature
- vehicle
- decision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims abstract description 120
- 238000012545 processing Methods 0.000 claims abstract description 66
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000010586 diagram Methods 0.000 claims description 12
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 3
- 230000015654 memory Effects 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种车辆辅助驾驶智能决策方法及系统,所述方法包括:获取图像信息,图像信息为车载设备采集的第一车辆周围的目标物的图像;利用深度估计算法对图像信息进行处理,得到深度图像信息;将图像信息和深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量;将第一特征向量和所述第二特征向量进行级联,得到第三特征向量;将第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度,本发明通过深度估计算法处理图像信息避免了针对路面一些坑洼、裂缝、凸起、凹陷等区域难以精确感知的问题,从而提高了决策精度,保障了驾驶人员的行车安全。
Description
技术领域
本发明涉及智能驾驶技术领域,具体而言,涉及一种车辆辅助驾驶智能决策方法及系统。
背景技术
随着科技的发展,智能车辆逐渐融入人们的生活日常,智能车辆可以辅助驾驶员对车辆进行驾驶,通过智能车辆的车载设备采集周围数据,再对数据进行分析为驾驶人员提供决策信息,保证车辆行车安全,但是针对驾驶时道路上的一些障碍物仍然难以精确采集其数据辅助决策生成,导致驾驶人员驾驶时可能存在安全隐患。
发明内容
本发明的目的在于提供一种智能决策方法及系统,以改善上述问题。
为了实现上述目的,本申请实施例提供了如下技术方案:
一方面,本申请实施例提供了一种智能决策方法,所述方法包括:
获取图像信息,所述图像信息为车载设备采集的第一车辆周围的目标物的图像,所述第一车辆为驾驶人员所驾驶的车辆;
利用深度估计算法对所述图像信息进行处理,得到深度图像信息;
将所述图像信息和所述深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量均为空间特征向量;
将所述第一特征向量和所述第二特征向量进行级联,得到第三特征向量;
将所述第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度。
第二方面,本申请实施例提供了一种智能决策系统,所述系统包括:
获取模块,用于获取图像信息,所述图像信息为车载设备采集的第一车辆周围的目标物的图像,所述第一车辆为驾驶人员所驾驶的车辆;
第一处理模块,用于利用深度估计算法对所述图像信息进行处理,得到深度图像信息;
第二处理模块,用于将所述图像信息和所述深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量均为空间特征向量;
第三处理模块,用于将所述第一特征向量和所述第二特征向量进行级联,得到第三特征向量;
决策模块,用于将所述第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度。
第三方面,本申请实施例提供了一种智能决策设备,所述设备包括存储器和处理器。存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述智能决策方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述智能决策方法的步骤。
本发明的有益效果为:
本发明通过车载设备采集驾驶车辆周围的图像信息后利用深度估计算法对图像进行处理,得到深度图像信息,通过深度估计算法处理图像信息避免了针对路面一些坑洼、裂缝、凸起、凹陷等区域难以精确感知的问题,再提取图像信息和深度图像信息的空间上的特征并将其级联,得到第三特征向量,有效的融合了两种图像信息的特征,以提高车辆决策的精度,将第三特征向量发送至决策层输出第一车辆的方向盘转动角度和第一车辆的行驶速度辅助驾驶人员绕开目标物,从而保证行车安全。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中所述的智能决策方法流程示意图。
图2为本发明实施例中所述的智能决策系统结构示意图。
图3为本发明实施例中所述的智能决策设备结构示意图。
图中标注:901、获取模块;902、第一处理模块;903、第二处理模块;904、第三处理模块;905、决策模块;9021、第一处理单元;9022、第二处理单元;9023、第三处理单元;9024、生成单元;90221、第四处理单元;90222、第五处理单元;90223、第六处理单元;90241、第一获取单元;90242、第七处理单元;90243、第一计算单元;90244、第二计算单元;90245、第三计算单元;9051、第二获取单元;9052、第八处理单元;9053、第九处理单元;9054、第十处理单元;9055、决策单元;90531、第十一处理单元;90532、第十二处理单元;800、智能决策设备;801、处理器;802、存储器;803、多媒体组件;804、I/O接口;805、通信组件。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1:
本实施例提供了一种智能决策方法,可以理解的是,在本实施例中可以铺设一个场景,例如:在公路上驾驶车辆时,前方有障碍物或其他车辆,需要智能车辆做出决策辅助驾驶人员驾驶的场景。
参见图1,图中示出了本方法包括步骤S1、步骤S2、步骤S3、步骤S4以及步骤S5,其中具体为:
步骤S1、获取图像信息,所述图像信息为车载设备采集的第一车辆周围的目标物的图像,所述第一车辆为驾驶人员所驾驶的车辆;
在本步骤中,车载设备为车载红外相机,通过车载红外相机可以拍摄驾驶车辆周围目标物的图像信息,目标物包括第一车辆周围的车辆以及路面上的坑洼、裂缝、凸起、凹陷等区域,但不限于第一车辆周围的车辆以及路面上的坑洼、裂缝、凸起、凹陷等区域。
步骤S2、利用深度估计算法对所述图像信息进行处理,得到深度图像信息;
在本步骤中,道路复杂场景高精度的深度感知对自动驾驶的安全性具有重要的意义,通过深度估计算法对图像信息进行处理可以得到图像信息对应的深度图像信息,从而获取更多的数据进行分析,以确保决策的准确性。
可以理解的是,在所述步骤S2中还包括步骤S21、步骤S22、步骤S23以及步骤S24,其中具体为:
步骤S21、根据所述图像信息得到第一子图像信息和第二子图像信息,所述第一子图像信息为目标物的左视图,所述第二子图像信息为目标物的右视图;
在本步骤中,第一子图像信息为左红外相机拍摄的图像,第二子图像信息为右红外相机拍摄的图像。
步骤S22、将所述第一子图像信息和所述第二子图像信息发送至金字塔注意力网络进行特征提取,得到第一特征图和第二特征图;
可以理解的是,在所述步骤S22中还包括步骤S221、步骤S222以及步骤S223,其中具体为:
步骤S221、将所述第一子图像信息发送至卷积层,得到第四特征图;
在本步骤中,采用3个3X3的卷积核对第一子图像信息进行处理,得到第四特征图。
步骤S222、将所述第四特征图发送至残差网络,得到第五特征图;
在本步骤中,残差网络包括级联的25个残差块,需要说明的是残差块的结构为本领域技术人员所熟知的技术方案,故不在此赘述。
步骤S223、将所述第五特征图发送至四种不同尺寸的卷积层并将输入的特征图进行级联,得到第一特征图。
在本步骤中,由于针对道路场景中路面上的坑洼、裂缝、凸起、凹陷等区域容易出现视差误匹配的问题,所以需要提取全局上下文信息进行视差计算,因此,将第五特征图发送至四种不同尺寸的卷积核,以增加模型的感受野,然后逐渐整合不同尺度的特征,即可更精确的结合上下文特征的相邻尺度,需要说明的是四种不同尺寸的卷积核为1X1、3X3、5X5、7X7。
步骤S23、利用立体匹配算法对所述第一特征图和所述第二特征图进行代价计算,得到第三特征图,所述第三特征图为视差图;
在本步骤中,对所述第一特征图和所述第二特征图进行代价计算具体为:
V(p,x,y)=F1(x,y)||F2(x-p,y)
上式中,V为匹配代价值,F1和F2分别为第一特征图和第二特征图,p为视差,x和y分别表示像素点的横纵坐标。
通过上述公式,计算出第一特征图和第二特征图中相应像素点的匹配代价,对于每个像素点,将其周围的匹配代价进行特征聚合。
需要说明的是,本申请在进行特征聚合时,将高层特征进行上采样使其与低层特征尺寸相同,再将高层特征与低层特征进行融合,得到融合后的特征图,利用全局平均池化对融合后的特征图进行处理,得到通道注意力权重,利用3D卷积核对通道注意力权重进行聚合,并与原低层特征进行通道相乘,得到通道注意力特征图,对于通道注意力特征图中每个像素点,通过比较其与对应像素点之间的匹配代价,推断出该像素点的深度值,从而得到整张图像的视差图,在通道注意力特征图中包括了丰富的高层语义特征以及详细的低层纹理特征,可以有效的提高道路场景中路面上的坑洼、裂缝、凸起、凹陷等区域的视差精度。
步骤S24、根据所述第三特征图生成深度图像信息。
在本步骤中,由于决策层处理的是深度图像,因此需要将视差图转化为深度图像,才能为驾驶人员生成决策,以辅助驾驶。
可以理解的是,在所述步骤S24中还包括步骤S241、步骤S242、步骤S243、步骤S244以及步骤S245,其中具体为:
步骤S241、获取第一相机参数信息、第二相机参数信息,所述第一相机参数信息包括左右红外相机的基线、焦距以及内参数,所述第二相机参数信息包括RGB相机的内参数;
步骤S242、根据左右红外相机基线和焦距将所述第三特征图中的视差数据转化为深度值;
在本步骤中,深度值的计算公式具体为:
上式中,D为深度值,L为基线长度,c为焦距,f为视差数据,通过上述公式即可将视差数据转化为深度值。
步骤S243、根据深度值和左右红外相机的内参数进行计算,得到第一三维坐标信息,所述第一三维坐标信息包括在左红外相机坐标系中空间点对应的三维坐标和右红外相机坐标系中空间点对应的三维坐标;
步骤S244、根据所述第一三维坐标信息、左红外相机坐标系与RGB相机坐标系之间的映射关系以及右红外相机坐标系与RGB相机坐标系之间的映射关系计算空间点在RGB相机坐标系中的三维坐标,得到第二三维坐标信息;
步骤S245、根据所述第二相机参数信息和第二三维坐标信息计算空间点在RGB图像上的深度值,得到深度图像信息。
步骤S3、将所述图像信息和所述深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量均为空间特征向量;
在本步骤中,第一神经网络为深度卷积神经网络,深度卷积神经网络可以用来提取空间上的特征。
步骤S4、将所述第一特征向量和所述第二特征向量进行级联,得到第三特征向量;
步骤S5、将所述第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度。
可以理解的是,在所述步骤S5中还包括步骤S51、步骤S52、步骤S53、步骤S54以及步骤S55,其中具体为:
步骤S51、获取历史驾驶数据,所述历史驾驶数据包括第一车辆至少一个时刻对应的方向盘转动角度和行驶速度;
在本步骤中,通过将历史驾驶数据融入决策中,可以实现更好的车辆决策,提高决策的准确率。
步骤S52、将所述历史驾驶数据发送至第二神经网络进行特征提取,得到第四特征向量,所述第四特征向量为时间特征向量;
在本步骤中,第二神经网络为LSTM(长短期记忆网络),由于历史驾驶数据为时序数据,通过LSTM可以提取历史驾驶数据中的时序特征。
步骤S53、将所述第三特征向量和所述第四特征向量进行增强,得到增强后的第三特征向量和增强后的第四特征向量;
在本步骤中,通过对第三特征向量和第四特征向量的特征进行增强可以进一步的提高决策的精度,保证驾驶人员的行车安全。
可以理解的是,在所述步骤S53中还包括步骤S531,其中具体为:
步骤S531、将所述第三特征向量发送至空间特征增强模型,得到增强后的第三特征向量,所述空间特征增强模型包括第一全连接层和第二全连接层,所述第一全连接层为时对空全连接层,所述第二全连接层为空对空全连接层。
在本步骤中,时对空全连接层旨在学习时间特征对空间特征的指导作用,空对空全连接层旨在学习空间特征对其自身的交互,通过将第三特征向量进行增强可以有效的提高对周围空间的感知,从而避免路面一些坑洼、裂缝、凸起、凹陷等区域难以精确感知的问题。
可以理解的是,在所述步骤S53中还包括步骤S532,其中具体为:
步骤S532、将所述第四特征向量发送至时间特征增强模型,得到增强后的第四特征向量,所述时间特征增强模型包括第三全连接层和第四全连接层,所述第三全连接层为空对时全连接层,所述第四全连接层为时对时全连接层。
在本步骤中,空对时全连接层旨在空间特征对时间特征的指导作用,时对时全连接层旨在时间空间特征对其自身的交互,通过将第四特征向量进行增强可以更加有效的捕捉历史驾驶信息在时序上的特征,从而提高决策精度。
步骤S54、将所述增强后的第三特征向量和所述增强后的第四特征向量进行融合,得到第五特征向量;
步骤S55、将所述第五特征向量发送至决策层,得到决策结果。
在本步骤中,决策层采用纵横预测网络,纵横预测网络是由一个纵向的序列预测网络和一个横向的图像分类网络组成,在本申请中纵向网络为循环神经网络用于捕捉序列数据中的长期依赖关系,横向网络为卷积神经网络用于捕捉序列数据中的短期依赖关系,通过将这两个网络结合起来,纵横预测网络能够提高时间序列数据的预测精度,从而为驾驶人员提供更好的决策。
实施例2:
如图2所示,本实施例提供了一种智能决策系统,所述系统包括获取模块901、第一处理模块902、第二处理模块903、第三处理模块904以及决策模块905,其中具体为:
获取模块901,用于获取图像信息,所述图像信息为车载设备采集的第一车辆周围的目标物的图像,所述第一车辆为驾驶人员所驾驶的车辆;
第一处理模块902,用于利用深度估计算法对所述图像信息进行处理,得到深度图像信息;
第二处理模块903,用于将所述图像信息和所述深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量均为空间特征向量;
第三处理模块904,用于将所述第一特征向量和所述第二特征向量进行级联,得到第三特征向量;
决策模块905,用于将所述第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度。
在本公开的一种具体实施方式中,所述第一处理模块902中还包括第一处理单元9021、第二处理单元9022、第三处理单元9023以及生成单元9024,其中具体为:
第一处理单元9021,用于根据所述图像信息得到第一子图像信息和第二子图像信息,所述第一子图像信息为目标物的左视图,所述第二子图像信息为目标物的右视图;
第二处理单元9022,用于将所述第一子图像信息和所述第二子图像信息发送至金字塔注意力网络进行特征提取,得到第一特征图和第二特征图;
第三处理单元9023,用于利用立体匹配算法对所述第一特征图和所述第二特征图进行代价计算,得到第三特征图,所述第三特征图为视差图;
生成单元9024,用于根据所述第三特征图生成深度图像信息。
在本公开的一种具体实施方式中,所述第二处理单元9022中还包括第四处理单元90221、第五处理单元90222以及第六处理单元90223,其中具体为:
第四处理单元90221,用于将所述第一子图像信息发送至卷积层,得到第四特征图;
第五处理单元90222,用于将所述第四特征图发送至残差网络,得到第五特征图;
第六处理单元90223,用于将所述第五特征图发送至四种不同尺寸的卷积层并将输入的特征图进行级联,得到第一特征图。
在本公开的一种具体实施方式中,所述生成单元9024中还包括第一获取单元90241、第七处理单元90242、第一计算单元90243、第二计算单元90244以及第三计算单元90245,其中具体为:
第一获取单元90241,用于获取第一相机参数信息、第二相机参数信息,所述第一相机参数信息包括左右红外相机的基线、焦距以及内参数,所述第二相机参数信息包括RGB相机的内参数;
第七处理单元90242,用于根据左右红外相机基线和焦距将所述第三特征图中的视差数据转化为深度值;
第一计算单元90243,用于根据深度值和左右红外相机的内参数进行计算,得到第一三维坐标信息,所述第一三维坐标信息包括在左红外相机坐标系中空间点对应的三维坐标和右红外相机坐标系中空间点对应的三维坐标;
第二计算单元90244,用于根据所述第一三维坐标信息、左红外相机坐标系与RGB相机坐标系之间的映射关系以及右红外相机坐标系与RGB相机坐标系之间的映射关系计算空间点在RGB相机坐标系中的三维坐标,得到第二三维坐标信息;
第三计算单元90245,用于根据所述第二相机参数信息和第二三维坐标信息计算空间点在RGB图像上的深度值,得到深度图像信息。
在本公开的一种具体实施方式中,所述决策模块905中还包括第二获取单元9051、第八处理单元9052、第九处理单元9053、第十处理单元9054以及决策单元9055,其中具体为:
第二获取单元9051,用于获取历史驾驶数据,所述历史驾驶数据包括第一车辆至少一个时刻对应的方向盘转动角度和行驶速度;
第八处理单元9052,用于将所述历史驾驶数据发送至第二神经网络进行特征提取,得到第四特征向量,所述第四特征向量为时间特征向量;
第九处理单元9053,用于将所述第三特征向量和所述第四特征向量进行增强,得到增强后的第三特征向量和增强后的第四特征向量;
第十处理单元9054,用于将所述增强后的第三特征向量和所述增强后的第四特征向量进行融合,得到第五特征向量;
决策单元9055,用于将所述第五特征向量发送至决策层,得到决策结果。
在本公开的一种具体实施方式中,所述第九处理单元9053中还包括第十一处理单元90531,其中具体为:
第十一处理单元90531,用于将所述第三特征向量发送至空间特征增强模型,得到增强后的第三特征向量,所述空间特征增强模型包括第一全连接层和第二全连接层,所述第一全连接层为时对空全连接层,所述第二全连接层为空对空全连接层。
在本公开的一种具体实施方式中,所述第九处理单元9053中还包括第十二处理单元90532,其中具体为:
第十二处理单元90532,用于将所述第四特征向量发送至时间特征增强模型,得到增强后的第四特征向量,所述时间特征增强模型包括第三全连接层和第四全连接层,所述第三全连接层为空对时全连接层,所述第四全连接层为时对时全连接层。
需要说明的是,关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3:
相应于上面的方法实施例,本实施例中还提供了一种智能决策设备,下文描述的一种智能决策设备与上文描述的一种智能决策方法可相互对应参照。
图3是根据示例性实施例示出的一种智能决策设备800的框图。如图3所示,该智能决策设备800可以包括:处理器801,存储器802。该智能决策设备800还可以包括多媒体组件803,I/O接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该智能决策设备800的整体操作,以完成上述的智能决策方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该智能决策设备800的操作,这些数据例如可以包括用于在该智能决策设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该智能决策设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(NearFieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,智能决策设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的智能决策方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的智能决策方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由智能决策设备800的处理器801执行以完成上述的智能决策方法。
实施例4:
相应于上面的方法实施例,本实施例中还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种智能决策方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的智能决策方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种车辆辅助驾驶智能决策方法,其特征在于,包括:
获取图像信息,所述图像信息为车载设备采集的第一车辆周围的目标物的图像,所述第一车辆为驾驶人员所驾驶的车辆;
利用深度估计算法对所述图像信息进行处理,得到深度图像信息;
将所述图像信息和所述深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量均为空间特征向量;
将所述第一特征向量和所述第二特征向量进行级联,得到第三特征向量;
将所述第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度。
2.根据权利要求1所述的智能决策方法,其特征在于,利用深度估计算法对所述图像信息进行处理,得到深度图像信息,包括:
根据所述图像信息得到第一子图像信息和第二子图像信息,所述第一子图像信息为目标物的左视图,所述第二子图像信息为目标物的右视图;
将所述第一子图像信息和所述第二子图像信息发送至金字塔注意力网络进行特征提取,得到第一特征图和第二特征图;
利用立体匹配算法对所述第一特征图和所述第二特征图进行代价计算,得到第三特征图,所述第三特征图为视差图;
根据所述第三特征图生成深度图像信息。
3.根据权利要求2所述的智能决策方法,其特征在于,将所述第一子图像信息和所述第二子图像信息发送至金字塔注意力网络进行特征提取,得到第一特征图和第二特征图,包括:
将所述第一子图像信息发送至卷积层,得到第四特征图;
将所述第四特征图发送至残差网络,得到第五特征图;
将所述第五特征图发送至四种不同尺寸的卷积层并将输入的特征图进行级联,得到第一特征图。
4.根据权利要求2所述的智能决策方法,其特征在于,根据所述第三特征图生成深度图像信息,包括:
获取第一相机参数信息、第二相机参数信息,所述第一相机参数信息包括左右红外相机的基线、焦距以及内参数,所述第二相机参数信息包括RGB相机的内参数;
根据左右红外相机基线和焦距将所述第三特征图中的视差数据转化为深度值;
根据深度值和左右红外相机的内参数进行计算,得到第一三维坐标信息,所述第一三维坐标信息包括在左红外相机坐标系中空间点对应的三维坐标和右红外相机坐标系中空间点对应的三维坐标;
根据所述第一三维坐标信息、左红外相机坐标系与RGB相机坐标系之间的映射关系以及右红外相机坐标系与RGB相机坐标系之间的映射关系计算空间点在RGB相机坐标系中的三维坐标,得到第二三维坐标信息;
根据所述第二相机参数信息和第二三维坐标信息计算空间点在RGB图像上的深度值,得到深度图像信息。
5.根据权利要求1所述的智能决策方法,其特征在于,将所述第三特征向量发送至决策层,得到决策结果,包括:
获取历史驾驶数据,所述历史驾驶数据包括第一车辆至少一个时刻对应的方向盘转动角度和行驶速度;
将所述历史驾驶数据发送至第二神经网络进行特征提取,得到第四特征向量,所述第四特征向量为时间特征向量;
将所述第三特征向量和所述第四特征向量进行增强,得到增强后的第三特征向量和增强后的第四特征向量;
将所述增强后的第三特征向量和所述增强后的第四特征向量进行融合,得到第五特征向量;
将所述第五特征向量发送至决策层,得到决策结果。
6.根据权利要求5所述的智能决策方法,其特征在于,将所述第三特征向量和所述第四特征向量进行增强,得到增强后的第三特征向量和增强后的第四特征向量,包括:
将所述第三特征向量发送至空间特征增强模型,得到增强后的第三特征向量,所述空间特征增强模型包括第一全连接层和第二全连接层,所述第一全连接层为时对空全连接层,所述第二全连接层为空对空全连接层。
7.根据权利要求5所述的智能决策方法,其特征在于,将所述第三特征向量和所述第四特征向量进行增强,得到增强后的第三特征向量和增强后的第四特征向量,包括:
将所述第四特征向量发送至时间特征增强模型,得到增强后的第四特征向量,所述时间特征增强模型包括第三全连接层和第四全连接层,所述第三全连接层为空对时全连接层,所述第四全连接层为时对时全连接层。
8.根据权利要求3所述的智能决策方法,其特征在于,所述四种不同尺寸的卷积层为1X1、3X3、5X5和7X7。
9.根据权利要求3所述的智能决策方法,其特征在于,所述残差网络为级联的25个残差块。
10.一种车辆辅助驾驶智能决策系统,其特征在于,包括:
获取模块,用于获取图像信息,所述图像信息为车载设备采集的第一车辆周围的目标物的图像,所述第一车辆为驾驶人员所驾驶的车辆;
第一处理模块,用于利用深度估计算法对所述图像信息进行处理,得到深度图像信息;
第二处理模块,用于将所述图像信息和所述深度图像信息均发送至第一神经网络进行特征提取,得到第一特征向量和第二特征向量,所述第一特征向量和所述第二特征向量均为空间特征向量;
第三处理模块,用于将所述第一特征向量和所述第二特征向量进行级联,得到第三特征向量;
决策模块,用于将所述第三特征向量发送至决策层,得到决策结果,所述决策结果包括第一车辆的方向盘转动角度和第一车辆的行驶速度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311859830.5A CN117765499B (zh) | 2023-12-30 | 2023-12-30 | 一种车辆辅助驾驶智能决策方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311859830.5A CN117765499B (zh) | 2023-12-30 | 2023-12-30 | 一种车辆辅助驾驶智能决策方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117765499A true CN117765499A (zh) | 2024-03-26 |
CN117765499B CN117765499B (zh) | 2024-06-25 |
Family
ID=90318246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311859830.5A Active CN117765499B (zh) | 2023-12-30 | 2023-12-30 | 一种车辆辅助驾驶智能决策方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117765499B (zh) |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106214437A (zh) * | 2016-07-22 | 2016-12-14 | 杭州视氪科技有限公司 | 一种智能盲人辅助眼镜 |
CN106846350A (zh) * | 2016-11-23 | 2017-06-13 | 杭州视氪科技有限公司 | 一种基于rgb‑d相机和立体声的视障人士障碍物预警系统及方法 |
CN107917701A (zh) * | 2017-12-28 | 2018-04-17 | 人加智能机器人技术(北京)有限公司 | 基于主动式双目立体视觉的测量方法及rgbd相机系统 |
CN110009691A (zh) * | 2019-03-28 | 2019-07-12 | 北京清微智能科技有限公司 | 基于双目立体视觉匹配的视差图像生成方法及系统 |
US10503174B1 (en) * | 2019-01-31 | 2019-12-10 | StradVision, Inc. | Method and device for optimized resource allocation in autonomous driving on the basis of reinforcement learning using data from lidar, radar, and camera sensor |
CN111680554A (zh) * | 2020-04-29 | 2020-09-18 | 北京三快在线科技有限公司 | 自动驾驶场景的深度估计方法、装置和自主车辆 |
CN111982058A (zh) * | 2020-08-04 | 2020-11-24 | 北京中科慧眼科技有限公司 | 一种基于双目相机的测距方法、系统、设备和可读存储介质 |
US20210241479A1 (en) * | 2019-03-12 | 2021-08-05 | Tencent Technology (Shenzhen) Company Limited | Disparity map acquisition method and apparatus, device, control system and storage medium |
CN114937092A (zh) * | 2022-05-17 | 2022-08-23 | 苏州轻棹科技有限公司 | 一种基于相机内外参进行图像特征编码的处理方法和装置 |
CN115376321A (zh) * | 2022-08-24 | 2022-11-22 | 杭州超阳科技有限公司 | 智慧交通下的智能汽车的目标检测方法及其系统 |
CN115489536A (zh) * | 2022-11-18 | 2022-12-20 | 中国科学院心理研究所 | 一种驾驶辅助方法、系统、设备及可读存储介质 |
CN115998591A (zh) * | 2022-11-30 | 2023-04-25 | 微智医疗器械有限公司 | 双目视差估计方法和视觉假体以及计算机可读存储介质 |
CN116373910A (zh) * | 2023-05-22 | 2023-07-04 | 重庆赛力斯新能源汽车设计院有限公司 | 一种自动驾驶辅助方法及系统 |
CN116630779A (zh) * | 2023-06-01 | 2023-08-22 | 银牛微电子(无锡)有限责任公司 | 深度估计模型训练、深度估计方法、装置及存储介质 |
CN116883770A (zh) * | 2022-03-23 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 深度估计模型的训练方法、装置、电子设备及存储介质 |
US20230394690A1 (en) * | 2022-06-07 | 2023-12-07 | Hon Hai Precision Industry Co., Ltd. | Method for obtaining depth images for improved driving safety and electronic device |
US20230415779A1 (en) * | 2022-06-22 | 2023-12-28 | Hon Hai Precision Industry Co., Ltd. | Assistance method of safe driving and electronic device |
US20230415760A1 (en) * | 2022-06-22 | 2023-12-28 | Hon Hai Precision Industry Co., Ltd. | Method for assisting safer driving and electronic device |
-
2023
- 2023-12-30 CN CN202311859830.5A patent/CN117765499B/zh active Active
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106214437A (zh) * | 2016-07-22 | 2016-12-14 | 杭州视氪科技有限公司 | 一种智能盲人辅助眼镜 |
CN106846350A (zh) * | 2016-11-23 | 2017-06-13 | 杭州视氪科技有限公司 | 一种基于rgb‑d相机和立体声的视障人士障碍物预警系统及方法 |
CN107917701A (zh) * | 2017-12-28 | 2018-04-17 | 人加智能机器人技术(北京)有限公司 | 基于主动式双目立体视觉的测量方法及rgbd相机系统 |
US10503174B1 (en) * | 2019-01-31 | 2019-12-10 | StradVision, Inc. | Method and device for optimized resource allocation in autonomous driving on the basis of reinforcement learning using data from lidar, radar, and camera sensor |
US20210241479A1 (en) * | 2019-03-12 | 2021-08-05 | Tencent Technology (Shenzhen) Company Limited | Disparity map acquisition method and apparatus, device, control system and storage medium |
CN110009691A (zh) * | 2019-03-28 | 2019-07-12 | 北京清微智能科技有限公司 | 基于双目立体视觉匹配的视差图像生成方法及系统 |
CN111680554A (zh) * | 2020-04-29 | 2020-09-18 | 北京三快在线科技有限公司 | 自动驾驶场景的深度估计方法、装置和自主车辆 |
CN111982058A (zh) * | 2020-08-04 | 2020-11-24 | 北京中科慧眼科技有限公司 | 一种基于双目相机的测距方法、系统、设备和可读存储介质 |
CN116883770A (zh) * | 2022-03-23 | 2023-10-13 | 腾讯科技(深圳)有限公司 | 深度估计模型的训练方法、装置、电子设备及存储介质 |
CN114937092A (zh) * | 2022-05-17 | 2022-08-23 | 苏州轻棹科技有限公司 | 一种基于相机内外参进行图像特征编码的处理方法和装置 |
US20230394690A1 (en) * | 2022-06-07 | 2023-12-07 | Hon Hai Precision Industry Co., Ltd. | Method for obtaining depth images for improved driving safety and electronic device |
CN117252912A (zh) * | 2022-06-07 | 2023-12-19 | 鸿海精密工业股份有限公司 | 深度图像获取方法、电子设备及存储介质 |
US20230415779A1 (en) * | 2022-06-22 | 2023-12-28 | Hon Hai Precision Industry Co., Ltd. | Assistance method of safe driving and electronic device |
US20230415760A1 (en) * | 2022-06-22 | 2023-12-28 | Hon Hai Precision Industry Co., Ltd. | Method for assisting safer driving and electronic device |
CN115376321A (zh) * | 2022-08-24 | 2022-11-22 | 杭州超阳科技有限公司 | 智慧交通下的智能汽车的目标检测方法及其系统 |
CN115489536A (zh) * | 2022-11-18 | 2022-12-20 | 中国科学院心理研究所 | 一种驾驶辅助方法、系统、设备及可读存储介质 |
CN115998591A (zh) * | 2022-11-30 | 2023-04-25 | 微智医疗器械有限公司 | 双目视差估计方法和视觉假体以及计算机可读存储介质 |
CN116373910A (zh) * | 2023-05-22 | 2023-07-04 | 重庆赛力斯新能源汽车设计院有限公司 | 一种自动驾驶辅助方法及系统 |
CN116630779A (zh) * | 2023-06-01 | 2023-08-22 | 银牛微电子(无锡)有限责任公司 | 深度估计模型训练、深度估计方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117765499B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108027877B (zh) | 用于非障碍区检测的系统和方法 | |
EP3876141A1 (en) | Object detection method, related device and computer storage medium | |
CN111860227B (zh) | 训练轨迹规划模型的方法、装置和计算机存储介质 | |
Warren et al. | Online calibration of stereo rigs for long-term autonomy | |
CN111047634B (zh) | 场景深度的确定方法、装置、设备及存储介质 | |
CN111008660A (zh) | 语义地图的生成方法、装置、系统、存储介质及电子设备 | |
CN111753739B (zh) | 物体检测方法、装置、设备以及存储介质 | |
CN116222577A (zh) | 闭环检测方法、训练方法、系统、电子设备及存储介质 | |
CN114399737A (zh) | 一种道路检测方法、装置、存储介质及电子设备 | |
CN116740669B (zh) | 多目图像检测方法、装置、计算机设备和存储介质 | |
CN117765499B (zh) | 一种车辆辅助驾驶智能决策方法及系统 | |
Golovnin et al. | Video processing method for high-definition maps generation | |
CN116503825A (zh) | 自动驾驶场景下基于图像与点云融合的语义场景补全方法 | |
CN112184605A (zh) | 一种车辆驾驶视野增强方法、设备及系统 | |
CN114463710A (zh) | 车辆无人驾驶策略生成方法、装置、设备及存储介质 | |
CN112308904A (zh) | 一种基于视觉的建图方法、装置及车载终端 | |
Koornstra | Predicting Ego-Bicycle Trajectory: An LSTM-based Approach Using Camera and IMU | |
US20230386222A1 (en) | Method for detecting three-dimensional objects in roadway and electronic device | |
CN111815667B (zh) | 一种相机移动条件下高精度检测运动目标的方法 | |
Hadi et al. | Semantic instance segmentation in a 3D traffic scene reconstruction task | |
Faykus et al. | Utilizing neural networks for semantic segmentation on rgb/lidar fused data for off-road autonomous military vehicle perception | |
CN116612059B (zh) | 图像处理方法及装置、电子设备、存储介质 | |
CN111738267B (zh) | 基于线性多步残差学习的视觉感知方法及视觉感知装置 | |
US20230401733A1 (en) | Method for training autoencoder, electronic device, and storage medium | |
CN116758301B (zh) | 一种图像处理方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |