CN113361491A - 一种无人驾驶汽车对行人的过街意图预测方法 - Google Patents
一种无人驾驶汽车对行人的过街意图预测方法 Download PDFInfo
- Publication number
- CN113361491A CN113361491A CN202110813077.0A CN202110813077A CN113361491A CN 113361491 A CN113361491 A CN 113361491A CN 202110813077 A CN202110813077 A CN 202110813077A CN 113361491 A CN113361491 A CN 113361491A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- road
- pedestrians
- neural network
- tracking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/16—Anti-collision systems
- G08G1/166—Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
Abstract
一种无人驾驶汽车对行人的过街意图预测方法,涉及无人驾驶汽车技术领域。步骤1:行人检测模型以Faster RCNN为基础,并在此基础上采用SE Net结构改进神经网络卷积模块,并通过K‑means聚类设计具有道路行人检测针对性的锚框宽高比;步骤2:设计对道路行人跟踪的粒子滤波算法,利用多特征融合策略实现对道路行人进行跟踪;步骤3:设计基于神经网络的行人过街意图预测模型。可增强无人驾驶汽车对道路行人动作的预测能力,提高无人驾驶汽车感知与决策性能。
Description
技术领域
本发明涉及无人驾驶汽车技术领域,尤其是涉及一种无人驾驶汽车对行人的过街意图预测方法。
背景技术
无人驾驶汽车利用车载传感器来感知车辆周围环境及自身状态信息,并根据感知所获得的障碍物信息、车辆位置信息及道路信息,控制车辆的转向和速度,从而使车辆能够节能、安全地在道路上行驶。近几年世界众多企业及科研院所研制的无人驾驶汽车在道路上进行测试,体现出无人驾驶技术蓬勃发展的趋势。
环境感知作为无人驾驶技术的核心,为无人驾驶汽车决策提供周边环境信息,是实现规划和决策的必要条件。文献1(朱楠楠,李汪根,李童,“基于微型YOLO的行人检测,”计算机应用研究,vol.37,no.s1,pp.398-399,2021.)提出增加一个尺度融合的YOLOv3-tiny2、增加主干网络深度的YOLOv3-tiny3、前两者结合的YOLOv3-tiny23三种不同的网络结构,极大地提高行人检测的准确率。文献2(Wei Ran,Xu Hongda,Yang Mingkun,etal,“Real-Time Pedestrian Tracking Terminal Based on Adaptive Zero VelocityUpdate,”Sensors,vol.21,no.11,pp.3808-3808,2018.)提出一种基于卷积神经网络的自适应零速度更新方法对行人进行跟踪,并验证该算法的鲁棒性。然而,交通场景中的行人作为最容易受到伤害的群体,其过街意图受其运动状态所影响,通过环境感知对道路行人分析研究可以预测其过街意图,避免不必要的交通事故发生。
发明内容
本发明的目的在于解决现有技术中存在的上述问题,提供可增强无人驾驶汽车对道路行人动作的预测能力,提高无人驾驶汽车感知与决策性能的一种无人驾驶汽车对行人的过街意图预测方法。
本发明由三部分组成,分别是使用Faster RCNN对道路行人进行检测,并对神经网络结构进行改进测试,然后是利用多特征融合的粒子滤波算法对视频行人进行跟踪,最后是通过Conv-BiLSTM神经网络模型,获取影响行人过街意图的概率。
本发明包括以下步骤:
步骤1:行人检测模型以Faster RCNN为基础,并在此基础上采用SE Net结构改进神经网络卷积模块,并通过K-means聚类设计具有道路行人检测针对性的锚框宽高比;
步骤2:设计对道路行人跟踪的粒子滤波算法,利用多特征融合策略实现对道路行人进行跟踪;
步骤3:设计基于(Convolutional Bidirectional Long Short-term Memory,Conv-BiLSTM)神经网络的行人过街意图预测模型。
在步骤1中,所述设计具有道路行人检测针对性的锚框宽高比进一步包括以下子步骤:
(1)获取实验过程中所需的数据集,并使用LabelImg对其进行标注分类。
(2)使用SE Net优化行人检测VGG 16卷积神经网络模型的特征提取网络。
(3)采用K-Means聚类法优化具有检测道路行人的针对性的卷积神经网络FasterRCNN的锚框宽高比。
在步骤2中,所述设计对道路行人跟踪的粒子滤波算法,利用多特征融合策略实现对道路行人进行跟踪进一步包括以下子步骤:
(1)设计无人驾驶汽车对道路行人跟踪的粒子滤波算法。
(2)选择色相、饱和度和明度(Hue,Saturation,and Value,HSV)颜色空间的直方图特征。
(3)选取一个形状为正方形的像素网格,再寻找其中心点周围的像素样本点,并且对比两点的像素值大小,将每次的比较结果转化为一个二进制数,最后以此数值来计算纹理直方图。
(4)在计算梯度直方图之前首先要对各颜色通道进行归一化处理,之后用卷积核[-1 0 1]来计算图像梯度。
(5)对于上述提到的三种特征,在算法实际运行过程中不仅需要对特征直方图进行计算,还需要考量这三种特征对粒子滤波实际的贡献值,从而进一步来分配它们的权重。
(6)将连续10帧的动态权重的均值作为实际分配权重。
(7)建立以颜色特征为主,采用形状特征和纹理特征辅助的多特征融合策略。
在步骤3中,所述设计基于神经网络的行人过街意图预测模型进一步包括以下子步骤:
(1)选取行人是否有同行者、行人头部是否有偏转、行人距离车辆的距离、行人距离道路边缘的距离、行人的速度作为模型输入参数,模型输出参数为过街意图概率。
(2)设计由时间序列输入层、过街意图预测层和意图概率输出层三部分组成的Conv-BiLSTM神经网络结构,各层间Dropout率为0.75,每层隐藏单元个数为32,学习率为0.0007。
(3)利用堆叠Conv-BiLSTM结构预测分类的结果,并通过softmax层将分类结果转变为概率分布,最后输出行人过街意图的概率,以最大的类别输出概率作为预测的类别。
本发明首先提出一种基于Faster RCNN深度学习的道路行人检测方法,然后采用粒子滤波算法实现对道路行人的跟踪,在此研究基础上,通过(ConvolutionalBidirectional Long Short-term Memory,Conv-BiLSTM)神经网络模型预测行人过街意图,并通过softmax层将分类结果转变为概率分布,最后输出行人过街意图的概率。可增强无人驾驶汽车对道路行人动作的预测能力,提高无人驾驶汽车感知与决策性能。
附图说明
图1为本发明的无人驾驶汽车对行人过街意图预测方法流程图。
图2为本发明粒子滤波算法流程图。
具体实施方式
以下实施例将结合附图对本发明作进一步的说明。
无人驾驶汽车对行人过街意图预测方法流程图如图1所示,具体步骤如下:
步骤1:行人检测模型以Faster RCNN为基础,并在此基础上采用SE Net结构改进神经网络卷积模块,并通过K-means聚类设计具有道路行人检测针对性的锚框宽高比。实施步骤如下:
步骤1.1:获取实验过程中所需的数据集,并使用LabelImg对其进行标注分类。
步骤1.2:使用SE Net优化行人检测VGG 16卷积神经网络模型的特征提取网络,具体如下:
步骤1.2.1:采用迁移学习来避免因数据量较少导致的过拟合现象的发生,使用VGG16对网络进行参数的初始化处理。
步骤1.2.2:网络参数设置,学习率设置为0.001,学习率的变化率设置为0.1,动量参数设置为0.8,权值衰减率设置为0.0005。
步骤1.2.3:在VGG16的每一层最大池化层之前嵌入一个SE块,使其可以对进入池化层之前的卷积特征层进行处理。
步骤1.3:采用K-Means聚类法优化具有检测道路行人的针对性的卷积神经网络Faster RCNN的锚框宽高比。
步骤1.3.1:将行人锚框真实的宽高比记为样本M,通过聚类分析找到每一个样本m所属的类别n,最后将属于同类别n的样本m归类到一起并统计数量。
步骤1.3.2:经过聚类分析,可以得到道路行人的宽高比为w≈0.42h,将已经对区域候选网络进行改进的Faster R-CNN算法中区域建议网络的锚框的宽高比统一设置为0.42:1,调整之后的每个位置只有3个Anchor,对应的分类层输出6个节点,回归层输出12个节点。
步骤2:如图2所示,设计对道路行人跟踪的粒子滤波算法,利用多特征融合策略实现对道路行人进行跟踪。
步骤2.1:设计对道路行人跟踪的粒子滤波算法,具体步骤如下:
步骤2.1.1:对于视频帧的输入,首先采用前文中所提出的改进后的Faster R-CNN检测算法来检测视频帧中出现的行人。
步骤2.1.2:对于检测算法检测出来的行人算法会将其分为两种类型。其一是已经建立跟踪轨迹的行人,对于这种类型的行人,算法会对该行人检测时刻对应的上一时刻的粒子运动模型中抽样得到当前时刻的粒子;对于新出现的尚未建立轨迹的行人,算法会从该区域提取参考模板特征直方图,并且对其粒子进行初始化。
步骤2.1.3:每个粒子的观测模型融合包括颜色特征,局部二元模式(LocalBinary Pattern,LBP)纹理直方图,梯度直方图在内的三种互补性特征。算法在这一步会对每个粒子所表示的图像区域分别建立特征直方图。
步骤2.1.4:当粒子对应的3种类型的特征直方图生成后,算法会在这一步比较三种直方图特征和参考的模板特征直方图之间的距离。
步骤2.1.5:在粒子权重得以计算前,会先通过粒子各特征距离的指数函数计算得到似然概率,且三种特征距离各自的最小值作为基础参数可以计算得到动态权重。
步骤2.1.6:进行归一化处理,得到粒子权重,而单个行人所有粒子的加权平均值就可以表示当前检测时刻其状态向量,最后输出跟踪结果。
步骤2.1.7:粒子的权重会随着时间的变化而变化,为保证跟踪的效果,算法会重新抽样以保证可以获得权重相等的新的粒子。至此,算法完整的一次流程结束,开始对下一次输入进行处理。
步骤2.2:建立以颜色特征为主,采用形状特征和纹理特征辅助的多特征融合策略。
步骤2.2.1:,实验中选择色相、饱和度和明度(Hue,Saturation,and Value,HSV)颜色空间的直方图特征。
步骤2.2.2:选取一个形状为正方形的像素网格,再寻找其中心点周围的像素样本点,并且对比两点的像素值大小,将每次的比较结果转化为一个二进制数,最后以此数值来计算纹理直方图。
步骤2.2.3:在计算梯度直方图之前首先要对各颜色通道进行归一化处理,之后用卷积核[-1 0 1]来计算图像梯度。
步骤2.2.4:对于上述提到的三种特征,在算法实际运行过程中不仅需要对特征直方图进行计算,还需要考量这三种特征对粒子滤波实际的贡献值,从而进一步来分配它们的权重。
步骤2.2.5:将连续10帧的动态权重的均值作为实际分配权重。
步骤3:设计基于(Convolutional Bidirectional Long Short-term Memory,Conv-BiLSTM)神经网络的行人过街意图预测模型。
步骤3.1:选取行人是否有同行者、行人头部是否有偏转、行人距离车辆的距离、行人距离道路边缘的距离、行人的速度作为模型输入参数,模型输出参数为过街意图概率。
步骤3.2:设计由时间序列输入层、过街意图预测层和意图概率输出层三部分组成的Conv-BiLSTM神经网络结构,各层间Dropout率为0.75,每层隐藏单元个数为32,学习率为0.0007。
步骤3.3:利用堆叠Conv-BiLSTM结构预测分类的结果,并通过softmax层将分类结果转变为概率分布,最后输出行人过街意图的概率,以最大的类别输出概率作为预测的类别。
以上内容是结合优选技术方案对本发明所做的进一步详细说明,不能认定发明的具体实施仅限于这些说明。对本发明所属技术领域的普通技术人员来说,在不脱离本发明的构思的前提下,还可以做出简单的推演及替换,都应当视为本发明的保护范围。
Claims (4)
1.一种无人驾驶汽车对行人的过街意图预测方法,其特征在于包括以下步骤:
步骤1:行人检测模型以Faster RCNN为基础,并在此基础上采用SE Net结构改进神经网络卷积模块,并通过K-means聚类设计具有道路行人检测针对性的锚框宽高比;
步骤2:设计对道路行人跟踪的粒子滤波算法,利用多特征融合策略实现对道路行人进行跟踪;
步骤3:设计基于神经网络的行人过街意图预测模型。
2.如权利要求1所述一种无人驾驶汽车对行人的过街意图预测方法,其特征在于在步骤1中,所述设计具有道路行人检测针对性的锚框宽高比进一步包括以下子步骤:
(1)获取实验过程中所需的数据集,并使用LabelImg对其进行标注分类;
(2)使用SE Net优化行人检测VGG 16卷积神经网络模型的特征提取网络;
(3)采用K-Means聚类法优化具有检测道路行人的针对性的卷积神经网络Faster RCNN的锚框宽高比。
3.如权利要求1所述一种无人驾驶汽车对行人的过街意图预测方法,其特征在于在步骤2中,所述设计对道路行人跟踪的粒子滤波算法,利用多特征融合策略实现对道路行人进行跟踪进一步包括以下子步骤:
(1)设计无人驾驶汽车对道路行人跟踪的粒子滤波算法;
(2)选择色相、饱和度和明度颜色空间的直方图特征;
(3)选取一个形状为正方形的像素网格,再寻找其中心点周围的像素样本点,并且对比两点的像素值大小,将每次的比较结果转化为一个二进制数,最后以此数值来计算纹理直方图;
(4)在计算梯度直方图之前首先要对各颜色通道进行归一化处理,之后用卷积核[-1 01]来计算图像梯度;
(5)对于上述提到的三种特征,在算法实际运行过程中不仅需要对特征直方图进行计算,还需要考量这三种特征对粒子滤波实际的贡献值,从而进一步来分配它们的权重;
(6)将连续10帧的动态权重的均值作为实际分配权重;
(7)建立以颜色特征为主,采用形状特征和纹理特征辅助的多特征融合策略。
4.如权利要求1所述一种无人驾驶汽车对行人的过街意图预测方法,其特征在于在步骤3中,所述设计基于神经网络的行人过街意图预测模型进一步包括以下子步骤:
(1)选取行人是否有同行者、行人头部是否有偏转、行人距离车辆的距离、行人距离道路边缘的距离、行人的速度作为模型输入参数,模型输出参数为过街意图概率;
(2)设计由时间序列输入层、过街意图预测层和意图概率输出层三部分组成的Conv-BiLSTM神经网络结构,各层间Dropout率为0.75,每层隐藏单元个数为32,学习率为0.0007;
(3)利用堆叠Conv-BiLSTM结构预测分类的结果,并通过softmax层将分类结果转变为概率分布,最后输出行人过街意图的概率,以最大的类别输出概率作为预测的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110813077.0A CN113361491A (zh) | 2021-07-19 | 2021-07-19 | 一种无人驾驶汽车对行人的过街意图预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110813077.0A CN113361491A (zh) | 2021-07-19 | 2021-07-19 | 一种无人驾驶汽车对行人的过街意图预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113361491A true CN113361491A (zh) | 2021-09-07 |
Family
ID=77539757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110813077.0A Pending CN113361491A (zh) | 2021-07-19 | 2021-07-19 | 一种无人驾驶汽车对行人的过街意图预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113361491A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793502A (zh) * | 2021-09-15 | 2021-12-14 | 国网电动汽车服务(天津)有限公司 | 无信号灯控制下的行人过街预测方法 |
CN114067552A (zh) * | 2021-11-08 | 2022-02-18 | 山东高速建设管理集团有限公司 | 一种基于路侧激光雷达的行人过街轨迹追踪与预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711262A (zh) * | 2018-11-28 | 2019-05-03 | 大连理工大学 | 一种基于深度卷积神经网络的智能挖掘机行人检测方法 |
WO2019144575A1 (zh) * | 2018-01-24 | 2019-08-01 | 中山大学 | 一种快速行人检测方法及装置 |
CN110781785A (zh) * | 2019-10-18 | 2020-02-11 | 上海理工大学 | 基于Faster RCNN算法改进的交通场景下行人检测方法 |
CN112329682A (zh) * | 2020-11-16 | 2021-02-05 | 常州大学 | 一种基于穿越动作和交通场景上下文因素的行人穿越马路意图识别方法 |
-
2021
- 2021-07-19 CN CN202110813077.0A patent/CN113361491A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019144575A1 (zh) * | 2018-01-24 | 2019-08-01 | 中山大学 | 一种快速行人检测方法及装置 |
CN109711262A (zh) * | 2018-11-28 | 2019-05-03 | 大连理工大学 | 一种基于深度卷积神经网络的智能挖掘机行人检测方法 |
CN110781785A (zh) * | 2019-10-18 | 2020-02-11 | 上海理工大学 | 基于Faster RCNN算法改进的交通场景下行人检测方法 |
CN112329682A (zh) * | 2020-11-16 | 2021-02-05 | 常州大学 | 一种基于穿越动作和交通场景上下文因素的行人穿越马路意图识别方法 |
Non-Patent Citations (2)
Title |
---|
李克文;李新宇;: "基于SENet改进的Faster R-CNN行人检测模型", 计算机系统应用, no. 04, pages 266 - 271 * |
李锴;冯瑞;: "基于粒子滤波的多特征融合视频行人跟踪算法", 计算机工程, no. 24, pages 141 - 145 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113793502A (zh) * | 2021-09-15 | 2021-12-14 | 国网电动汽车服务(天津)有限公司 | 无信号灯控制下的行人过街预测方法 |
CN114067552A (zh) * | 2021-11-08 | 2022-02-18 | 山东高速建设管理集团有限公司 | 一种基于路侧激光雷达的行人过街轨迹追踪与预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103034836B (zh) | 道路标志检测方法和道路标志检测设备 | |
CN108304787A (zh) | 基于卷积神经网络的道路目标检测方法 | |
CN110263786B (zh) | 一种基于特征维度融合的道路多目标识别系统及方法 | |
US20160283864A1 (en) | Sequential image sampling and storage of fine-tuned features | |
CN111310583A (zh) | 一种基于改进的长短期记忆网络的车辆异常行为识别方法 | |
CN105550701A (zh) | 实时图像提取识别方法及装置 | |
CN112395951B (zh) | 一种面向复杂场景的域适应交通目标检测与识别方法 | |
KR20180036709A (ko) | 미디어 분류 | |
CN108875593A (zh) | 基于卷积神经网络的可见光图像天气识别方法 | |
CN113361491A (zh) | 一种无人驾驶汽车对行人的过街意图预测方法 | |
CN112329682B (zh) | 一种基于穿越动作和交通场景上下文因素的行人穿越马路意图识别方法 | |
CN109543672B (zh) | 基于稠密特征金字塔网络的物体检测方法 | |
CN114693924A (zh) | 一种基于多模型融合的道路场景语义分割方法 | |
CN112489081A (zh) | 一种视觉目标跟踪方法及装置 | |
CN113392725B (zh) | 基于视频数据的行人过街意图识别方法 | |
CN114049572A (zh) | 识别小目标的检测方法 | |
CN110032952A (zh) | 一种基于深度学习的道路边界点检测方法 | |
CN107862341A (zh) | 一种车辆检测方法 | |
CN114332921A (zh) | 基于改进聚类算法的Faster R-CNN网络的行人检测方法 | |
CN116311387A (zh) | 一种基于特征交集的跨模态行人重识别方法 | |
Sankaranarayanan et al. | Virtual mono-layered continuous containers for vehicle detection applications in intelligent transportation systems | |
CN112131996B (zh) | 基于通道分离卷积的路侧图像多尺度行人快速检测方法 | |
Dorrani | Traffic Scene Analysis and Classification using Deep Learning | |
CN114429621A (zh) | 一种基于ufsa算法改进的车道线智能检测方法 | |
CN115272995A (zh) | 一种基于生成对抗网络的雨雪天车道线检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |