CN116975781A - 一种自动驾驶车辆行为决策系统和方法 - Google Patents
一种自动驾驶车辆行为决策系统和方法 Download PDFInfo
- Publication number
- CN116975781A CN116975781A CN202310983299.6A CN202310983299A CN116975781A CN 116975781 A CN116975781 A CN 116975781A CN 202310983299 A CN202310983299 A CN 202310983299A CN 116975781 A CN116975781 A CN 116975781A
- Authority
- CN
- China
- Prior art keywords
- vehicle
- decision
- behavior
- time
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000006399 behavior Effects 0.000 claims abstract description 106
- 230000004927 fusion Effects 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 238000005065 mining Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000003066 decision tree Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 8
- 230000001133 acceleration Effects 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 230000007613 environmental effect Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W60/00—Drive control systems specially adapted for autonomous road vehicles
- B60W60/001—Planning or execution of driving tasks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60W—CONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
- B60W50/00—Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
- B60W2050/0001—Details of the control system
- B60W2050/0019—Control system elements or transfer functions
- B60W2050/0028—Mathematical models, e.g. for simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Automation & Control Theory (AREA)
- Human Computer Interaction (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种自动驾驶车辆行为决策系统,属于智能车辆领域,包括数据采集模块通过传感器获取周围环境信息,并构建道路模型;时空特征提取模块利用以LSTM‑CNN为基础的决策模型对道路模型信息进行提取,得到时空特征;驾驶行为规则提取模块对车辆的交互性进行分析得到不同行为产生的特征,依据这些特征构建驾驶行为规则特征挖掘算法得到行为规则特征编码;融合决策模块采用WIDE&DEEP融合模型将行为特征和与时空特征融合,最后输出行为决策结果。本发明还提供一种方法。
Description
技术领域
本发明属于智能车辆领域,涉及一种自动驾驶车辆行为决策系统和方法。
背景技术
行为决策是自动驾驶车辆中至关重要的环节,它基于环境感知数据对车辆的驾驶行为进行决策,以实现车辆的任务目标。
目前主要的自动驾驶车辆行为决策方法可以分为基于模型驱动和基于数据驱动的行为决策方法两种。但两种方法都存在一定的不足。
中国专利申请:停车场场景下融合预测算法的车辆行为决策方法及装置(申请号:CN202310045955.8),公开了一种停车场场景下融合预测算法的车辆行为决策方法及装置,其特征在于,包括:利用预测算法对目标车辆的行为进行预测;根据不同的预测结果对目标车辆的轨迹分别进行预测。该方法采用了基于长短时记忆网络LSTM的行为预测模型,单一的数据驱动方法存在可解释性不足的问题。文献《A systematic solution of humandriving behavior modeling and simulation for automated vehicle studies》采用决策树模型,通过对车辆间距、是否处于交叉路口等属性的判断,将自动驾驶车辆的驾驶行为划分为停车、路口处理、躲避车辆、超车并道等不同的状态,然后使用“IF-THRN”规则对这些状态进行建模和描述,直到达到叶子节点,最终实现自动驾驶车辆的行为决策。但难以处理复杂的交通场景和异常情况,缺乏对不确定性的处理能力,可能导致行为决策的不准确和不完备性。
发明内容
有鉴于此,本发明的目的在于针对当前基于模型驱动的方法面对复杂场景建模困难、可移植性差,基于数据驱动的行为决策方法缺乏可解释性问题,提出一种将基于模型与基于数据驱动两种方法进行有效结合的方法,提高决策模型的准确性、泛化能力和预测性能,提高自动驾驶车辆行为决策的准确性。
为达到上述目的,本发明提供如下技术方案:
一方面,本发明提供一种自动驾驶车辆行为决策系统,包括数据采集模块、时空特征提取模块、驾驶行为规则提取模块,融合决策模块;
所述数据采集模块通过传感器获取周围环境信息,并构建道路模型;
所述时空特征提取模块利用以LSTM-CNN为基础的决策模型对道路模型信息进行提取,得到时空特征;
所述驾驶行为规则提取模块对车辆的交互性进行分析得到不同行为产生的特征,依据这些特征构建驾驶行为规则特征挖掘算法得到行为规则特征编码;
所述融合决策模块采用WIDE&DEEP融合模型将行为特征和与时空特征融合,最后输出行为决策结果。
另一方面,本发明提供一种自动驾驶车辆行为决策方法,包括以下步骤:
S1:数据采集:通过传感器获取车辆周围的环境信息,并构建道路模型,道路模型包含车辆信息V和车道信息R;
S2:时空特征提取:通过对车辆信息V和车道信息R进行处理,提取得到时空特征SC;
S3:驾驶行为规则提取:根据数据采集模块的车辆信息V和车道信息R使用驾驶行为规则特征挖掘算法来构建行为规则特征编码,得到驾驶行为规则特征D;
S4:融合决策:采用WIDE&DEEP融合模型将驾驶行为特征D和时空特征SC进行融合,得到当前车辆的行为决策Y。
进一步,步骤S1中所述道路模型为{V,R},V是周围车辆集合{VEgo,VEgo_front,VEgo_back,VLeft_front,VLeft_back,VRight_front,VRight_back},分别是目标车辆、前方车辆、后方车辆、左侧前方车辆、左侧后方车辆、右侧前方车辆、右侧后方车辆;R是道路信息{M,Lid,F},其中M是车道数量,Lid是当前车道标号,F表明是否当前车道可进行变道,对于最左侧车道车辆无法进行左变道,对于最右侧车道车辆无法进行右变道;
对于每辆车有车辆状态信息{t,X,Y,Vel,Acc,θ,L,W,Lid,X_dis,Y_dis}分别是时间戳、横向位置、纵向位置、速度、加速度、转向角、车长、车宽、当前车道、与目标车辆横向偏移、与目标车辆纵向偏移;车辆之间的间距越大,车辆之间的交互性影响越小,用一个较大的值表示目标车辆的某一方位上没有车;针对周围没有车的缺省车辆的处理,用0m/s代表该缺省车辆的速度,对于与目标车辆横向偏移、与目标车辆纵向偏移,采用较大的值X_dis,Y_dis表示。
进一步,步骤S2中,搭建以LSTM-CNN为基础的行为决策模型提取时空特征,采用几个并行的LSTM分别提取左前车辆Left_front和左后车辆Left_back,右前车辆Right_front和右后车辆Right_back,前方车辆Front,后方车辆Back和目标车辆信息Ego时序特征的提取;最后利用全连接层融合特征得到时序特征S;采用残差CNN网络提取周围环境的空间特征C,最后将两者进行融合得到时空特征SC;
时序特征表达如下:
S=Flstm(V,R,T,N)
其中,S为时序特征;Flstm为LSTM网络模型;V是周围车辆状态集合;R是车道状态集合;其中T为时间步长;N为输入信息维度。
进一步,步骤S3所述驾驶行为规则提取,用GBDT驾驶行为规则挖掘算法进行挖掘,得到驾驶行为特征D;所挖掘的规则属性包含影响目标车辆采取不同驾驶行为的因素,包括目标车辆与周围环境车辆的时间、横向坐标、纵向坐标、速度、加速度、横向偏移量、纵向偏移量相关特征;特征编码规则为:设驾驶行为规则挖掘算法迭代M次得到最终输出则构建M颗决策树,每个样本落到每棵决策树的叶子节点置为1,其余为0,进而利用这些特征构造出一组0-1特征。
进一步,步骤S3具体包括以下步骤:
S31:对于训练集{(x1,y1),(x2,y2),(x3,y3),…,(xN,yN)},其中xi={V,R},是当前环境下对应的决策,N为样本数量,初始化一个弱学习器:
其中,L为平方损失函数;
S32:迭代次数(1到M),每次迭代拟合一颗树,对于每棵树首先计算每个样本的残差,即:
用(xi,rim)迭代更新一颗决策树,Rjm为新决策树的叶子节点区域,j=1,2,3,..,Jm,Jm为新决策树的叶子节点总数;
对叶子节点j=1,2,3,..,Jm计算最佳拟合值:
其中当样本对应的节点是叶子节点区域Rjm时I为1,否则为0;
S33:输出最后结果
当样本x最后输出结果与真实结果误差越小,拟合效果越好。
进一步,步骤S4中,将在特征提取阶段获得的时空特征与驾驶行为规则特征进行联合训练,最后输出当前的行为决策结果,包括车道保持、左换道和右换道,具体包括以下步骤:
S41:将挖掘的驾驶行为规则特征信息D通过Wide引入非线性交叉特征来实现记忆能力,得到驾驶行为规则信息WIDEd;
WIDEd=WT*D+b
式中W是权重矩阵,b偏移量;
S42:将提取的时空特征SC通过学习低维稠密向量,通过Deep组件探索历史数据中未出现或很少出现的特征;
时空特征SC由LSTM-CNN来实现,DEEPs是时空特征SC由DEEP网络组件进行处理得到的输出;
DEEPs=f(SC),SC=fLSTM-CNN(x)
S43:Wide&Deep输出:
在Wide组件与Deep组件的前向计算完成之后,对两部分的输出进行加权求和得到车辆决策结果,表示为:
Y=σ(WIDEd+DEEPs+b)
式中σ和b分别为激活函数和偏移量,Y表示n维行为决策的输出概率。
本发明的有益效果在于:本发明针对当前基于模型驱动的方法面对复杂场景建模困难、可移植性差,基于数据驱动的行为决策方法缺乏可解释性问题,通过将基于模型与基于数据驱动两种方法进行有效结合,采用基于模型驱动的驾驶行为规则挖掘算法来为基于LSTM-CNN行为决策模型提供更多先验性知识和弥补可解释的不足。本发明将两种方法的优点进行互补,有效提高了自动驾驶车辆行为决策的准确性,从而提高了车辆行驶安全。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为图1是本发明提供优选实施例一种自动驾驶车辆行为决策系统和方法的总体框架;
图2是本发明所述道路模型示意图;
图3是本发明所述数据驱动模型框架示意图;
图4是本发明所述融合决策阶段示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
图1所示为本发明一种自动驾驶车辆行为决策系统总体框架。该系统包括数据采集模块、时空特征提取模块、驾驶行为规则提取模块,融合决策模块四个部分:
所述数据采集模块通过传感器获取周围环境信息,并构建道路模型。该道路模型将作为整个决策系统的输入数据。
所述时空特征提取模块利用以LSTM-CNN为基础的决策模型对道路模型信息进行提取得到时空特征。
所述驾驶行为规则提取模块对车辆的交互性进行分析得到不同行为产生的特点,依据这些特征构建驾驶行为规则特征挖掘算法得到行为规则特征编码。
所述融合决策模块采用WIDE&DEEP融合模型将行为特征和与时空特征融合,最后输出行为决策结果。
图2所示为发明所述道路模型示意图,道路模型使用激光雷达采集的数据作为输入源,为了提取每辆车每条数据的周边车辆行驶信息,采用以下搜索策略来索引自车的周边车辆信息:
(1)对数据进行遍历,找到目标车辆并记录该车的时间戳和所在车道号。
(2)在数据中寻找与目标车辆时间号相同的其他车辆并加入候选周边车辆,记录它们的车道号,然后根据这些车辆与目标车辆所在的车道号、坐标位置来确定它们相对目标车辆的位置关系,如左侧、右侧、前方、后方等。
(3)对于每个候选车辆,计算其与目标车辆的横向偏差和纵向偏差,并根据这些距离筛选离目标车辆最近的6辆车,即左侧前方车辆、目标车前方车辆、右侧前方车、左侧后方车辆、目标车后方车辆和右侧后方车辆并记录这些车辆的状态信息。
(4)将所有周边车辆的状态信息加入到目标车辆的状态信息中,生成完整的车辆信息。
构建的道路模型为{V,R},V是周围车辆集合{VEgo,VEgo_front,VEgo_back,VLeft_front,VLeft_back,VRight_front,VRight_back},分别是目标车辆、前方车辆、后方车辆、左侧前方车辆、左侧后方车辆、右侧前方车辆、右侧后方车辆。R是道路信息{M,Lid,F},其中M是车道数量,Lid是当前车道标号,F表明是否当前车道可进行变道,对于最左侧车道车辆无法进行左变道,对于最右侧车道车辆无法进行右变道。
对于每辆车有车辆状态信息{t,X,Y,Vel,Acc,θ,L,W,Lid,X_dis,Y_dis}分别是时间戳、横向位置、纵向位置、速度、加速度、转向角、车长、车宽、当前车道、与目标车辆横向偏移、与目标车辆纵向偏移。并非每辆车的周围都有几辆车同时存在,会有缺省车辆产生。针对缺省车辆的处理,用0m/s代表该缺省车辆的速度,对于与目标车辆横向偏移、与目标车辆纵向偏移,X_dis,Y_dis表示,一般采用较大的值。
在使用采集数据中的车辆轨迹数据进行模型训练之前先采用局部加权散点平滑方法对激光雷达采集数据中车辆的坐标位置、速度、加速度进行处理,减少误差的影响,提高训练模型的精度和可信度。
如图3所示为本发明所述数据驱动模型框架示意图。在处理完数据集之后,将其用于本发明搭建的自动驾驶行为决策模型的训练与测试。时空特征提取模块通过LSTM和CNN网络分别提取自动驾驶车辆行驶过程中时序特征S和空间特征C,采用全连接层将时序特征和空间特征进行融合得到时空特征SC。
时序特征表达如下:
S=Flstm(V,R,T,N) (1)
其中,S为时序特征;Flstm为LSTM网络模型;V是周围车辆状态集合;R是车道状态集合;其中T为时间步长;N为输入信息维度。用GBDT驾驶行为规则挖掘算法进行挖掘,得到驾驶行为特征D。所挖掘的规则属性包含了影响目标车辆采取不同驾驶行为的因素,包括但不限于目标车辆与周围环境车辆的时间、横向坐标、纵向坐标、速度、加速度、横向偏移量、纵向偏移量等相关特征。特征编码规则为:设驾驶行为规则挖掘算法迭代M次得到最终输出则构建M颗决策树,每个样本落到每棵决策树的叶子节点置为1,其余为0,进而可以利用这些特征构造出一组0-1特征。具体包括以下步骤:
(1)对于训练集{(x1,y1),(x2,y2),(x3,y3),…,(xN,yN)},其中xi={V,R},是当前环境下对应的决策,N为样本数量。初始化一个弱学习器:
其中,L为平方损失函数。
(2)迭代次数(1到M),每次迭代拟合一颗树,对于每棵树首先计算每个样本的残差,即
用(xi,rim)迭代更新一颗决策树,Rjm为新决策树的叶子节点区域,j=1,2,3,..,Jm,Jm为新决策树的叶子节点总数。
对叶子节点j=1,2,3,..,Jm计算最佳拟合值:
其中当样本对应的节点是叶子节点区域Rjm时I为1,否则为0。
(3)输出最后结果
当样本x最后输出结果与真实结果误差较小时,拟合效果好。
图4所示为融合决策阶段示意图,将在特征提取阶段获得的时空特征与驾驶行为规则特征用WIDE&DEEP框架进行融合,并进行联合训练,最后输出当前的行为决策结果Y。具体包括以下步骤:
(1)将挖掘的驾驶行为规则特征信息D通过Wide引入非线性交叉特征来实现高效的记忆能力,得到更具有先验性的驾驶行为规则信息WIDEd。其中,驾驶行为特征D通过GBDT驾驶行为规则挖掘算法进行挖掘得到。
WIDEd=WT*D+b (6)
(2)将提取的时空特征SC通过学习低维稠密向量,通过Deep组件探索历史数据中未出现或很少出现的特征,来增强网络模型的泛化能力。
时空特征SC由LSTM-CNN来实现,DEEPs是时空特征SC由DEEP网络组件进行处理得到的输出。
DEEPs=f(SC),SC=fLSTM-CNN(x) (7)
(3)Wide&Deep输出:
在Wide组件与Deep组件的前向计算完成之后,对两部分的输出进行加权求和得到车辆决策结果,表示为:
Y=σ(WIDEd+DEEPs+b) (8)
式中σ和b分别为激活函数和偏移量,Y表示n维行为决策的输出概率。若决策输出只有左转道、右换道、跟车三类,则决策向量为1x3的列向量。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (7)
1.一种自动驾驶车辆行为决策系统,其特征在于:包括数据采集模块、时空特征提取模块、驾驶行为规则提取模块,融合决策模块;
所述数据采集模块通过传感器获取周围环境信息,并构建道路模型;
所述时空特征提取模块利用以LSTM-CNN为基础的决策模型对道路模型信息进行提取,得到时空特征;
所述驾驶行为规则提取模块对车辆的交互性进行分析得到不同行为产生的特征,依据这些特征构建驾驶行为规则特征挖掘算法得到行为规则特征编码;
所述融合决策模块采用WIDE&DEEP融合模型将行为特征和与时空特征融合,最后输出行为决策结果。
2.一种自动驾驶车辆行为决策方法,其特征在于:包括以下步骤:
S1:数据采集:通过传感器获取车辆周围的环境信息,并构建道路模型,道路模型包含车辆信息V和车道信息R;
S2:时空特征提取:通过对车辆信息V和车道信息R进行处理,提取得到时空特征SC;
S3:驾驶行为规则提取:根据数据采集模块的车辆信息V和车道信息R使用驾驶行为规则特征挖掘算法来构建行为规则特征编码,得到驾驶行为规则特征D;
S4:融合决策:采用WIDE&DEEP融合模型将驾驶行为特征D和时空特征SC进行融合,得到当前车辆的行为决策Y。
3.根据权利要求2所述的自动驾驶车辆行为决策方法,其特征在于:步骤S1中所述道路模型为{V,R},V是周围车辆集合{VEgo,VEgo_front,VEgo_back,VLeft_front,VLeft_back,VRight_front,VRight_back},分别是目标车辆、前方车辆、后方车辆、左侧前方车辆、左侧后方车辆、右侧前方车辆、右侧后方车辆;R是道路信息{M,Lid,F},其中M是车道数量,Lid是当前车道标号,F表明是否当前车道可进行变道,对于最左侧车道车辆无法进行左变道,对于最右侧车道车辆无法进行右变道;
对于每辆车有车辆状态信息{t,X,Y,Vel,Acc,θ,L,W,Lid,X_dis,Y_dis}分别是时间戳、横向位置、纵向位置、速度、加速度、转向角、车长、车宽、当前车道、与目标车辆横向偏移、与目标车辆纵向偏移;车辆之间的间距越大,车辆之间的交互性影响越小,用一个较大的值表示目标车辆的某一方位上没有车;针对周围没有车的缺省车辆的处理,用0m/s代表该缺省车辆的速度,对于与目标车辆横向偏移、与目标车辆纵向偏移,采用较大的值X_dis,Y_dis表示。
4.根据权利要求2所述的自动驾驶车辆行为决策方法,其特征在于:步骤S2中,搭建以LSTM-CNN为基础的行为决策模型提取时空特征,采用几个并行的LSTM分别提取左前车辆Left_front和左后车辆Left_back,右前车辆Right_front和右后车辆Right_back,前方车辆Front,后方车辆Back和目标车辆信息Ego时序特征的提取;最后利用全连接层融合特征得到时序特征S;采用残差CNN网络提取周围环境的空间特征C,最后将两者进行融合得到时空特征SC;
时序特征表达如下:
S=Flstm(V,R,T,N)
其中,S为时序特征;Flstm为LSTM网络模型;V是周围车辆状态集合;R是车道状态集合;其中T为时间步长;N为输入信息维度。
5.根据权利要求2所述的自动驾驶车辆行为决策方法,其特征在于:步骤S3所述驾驶行为规则提取,用GBDT驾驶行为规则挖掘算法进行挖掘,得到驾驶行为特征D;所挖掘的规则属性包含影响目标车辆采取不同驾驶行为的因素,包括目标车辆与周围环境车辆的时间、横向坐标、纵向坐标、速度、加速度、横向偏移量、纵向偏移量相关特征;特征编码规则为:设驾驶行为规则挖掘算法迭代M次得到最终输出则构建M颗决策树,每个样本落到每棵决策树的叶子节点置为1,其余为0,进而利用这些特征构造出一组0-1特征。
6.根据权利要求5所述的自动驾驶车辆行为决策方法,其特征在于:步骤S3具体包括以下步骤:
S31:对于训练集{(x1,y1),(x2,y2),(x3,y3),…,(xN,yN)},其中xi={V,R},是当前环境下对应的决策,N为样本数量,初始化一个弱学习器:
其中,L为平方损失函数;
S32:迭代次数(1到M),每次迭代拟合一颗树,对于每棵树首先计算每个样本的残差,即:
用(xi,rim)迭代更新一颗决策树,Rjm为新决策树的叶子节点区域,j=1,2,3,..,Jm,Jm为新决策树的叶子节点总数;
对叶子节点j=1,2,3,..,Jm计算最佳拟合值:
其中当样本对应的节点是叶子节点区域Rjm时I为1,否则为0;
S33:输出最后结果
当样本x最后输出结果与真实结果误差越小,拟合效果越好。
7.根据权利要求2所述的自动驾驶车辆行为决策方法,其特征在于:步骤S4中,将在特征提取阶段获得的时空特征与驾驶行为规则特征进行联合训练,最后输出当前的行为决策结果,包括车道保持、左换道和右换道,具体包括以下步骤:
S41:将挖掘的驾驶行为规则特征信息D通过Wide引入非线性交叉特征来实现记忆能力,得到驾驶行为规则信息WIDEd;
WIDEd=WT*D+b
式中W是权重矩阵,b偏移量;
S42:将提取的时空特征SC通过学习低维稠密向量,通过Deep组件探索历史数据中未出现或很少出现的特征;
时空特征SC由LSTM-CNN来实现,DEEPs是时空特征SC由DEEP网络组件进行处理得到的输出;
DEEPs=f(SC),SC=fLSTM-CNN(x)
S43:Wide&Deep输出:
在Wide组件与Deep组件的前向计算完成之后,对两部分的输出进行加权求和得到车辆决策结果,表示为:
Y=σ(WIDEd+DEEPs+b)
式中σ和b分别为激活函数和偏移量,Y表示n维行为决策的输出概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310983299.6A CN116975781A (zh) | 2023-08-04 | 2023-08-04 | 一种自动驾驶车辆行为决策系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310983299.6A CN116975781A (zh) | 2023-08-04 | 2023-08-04 | 一种自动驾驶车辆行为决策系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116975781A true CN116975781A (zh) | 2023-10-31 |
Family
ID=88484770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310983299.6A Pending CN116975781A (zh) | 2023-08-04 | 2023-08-04 | 一种自动驾驶车辆行为决策系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116975781A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117643470A (zh) * | 2024-01-30 | 2024-03-05 | 武汉大学 | 基于脑电解译的疲劳驾驶检测方法及装置 |
-
2023
- 2023-08-04 CN CN202310983299.6A patent/CN116975781A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117643470A (zh) * | 2024-01-30 | 2024-03-05 | 武汉大学 | 基于脑电解译的疲劳驾驶检测方法及装置 |
CN117643470B (zh) * | 2024-01-30 | 2024-04-26 | 武汉大学 | 基于脑电解译的疲劳驾驶检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230161352A1 (en) | Dynamic obstacle avoidance method based on real-time local grid map construction | |
US11651302B2 (en) | Method and device for generating synthetic training data for an artificial-intelligence machine for assisting with landing an aircraft | |
Masmoudi et al. | A reinforcement learning framework for video frame-based autonomous car-following | |
CN114970321A (zh) | 一种基于动态轨迹流的场景流数字孪生方法及系统 | |
US11767028B2 (en) | Change detection criteria for updating sensor-based reference maps | |
CN116975781A (zh) | 一种自动驾驶车辆行为决策系统和方法 | |
Kolekar et al. | Behavior prediction of traffic actors for intelligent vehicle using artificial intelligence techniques: A review | |
CN115690153A (zh) | 一种智能体轨迹预测方法及系统 | |
Mukherjee et al. | Interacting vehicle trajectory prediction with convolutional recurrent neural networks | |
Kawasaki et al. | Multimodal trajectory predictions for autonomous driving without a detailed prior map | |
Wörmann et al. | Knowledge augmented machine learning with applications in autonomous driving: A survey | |
Wang et al. | Deep understanding of big geospatial data for self-driving: Data, technologies, and systems | |
Masmoudi et al. | Autonomous car-following approach based on real-time video frames processing | |
Bastani et al. | Inferring and improving street maps with data-driven automation | |
US8213709B1 (en) | Method and system for directed area search using cognitive swarm vision and cognitive Bayesian reasoning | |
Bittel et al. | Estimating high definition map parameters with convolutional neural networks | |
US20240001942A1 (en) | Performance testing for robotic systems | |
Schörner et al. | Grid-based micro traffic prediction using fully convolutional networks | |
Beglerovic et al. | Polar occupancy map-a compact traffic representation for deep learning scenario classification | |
Dey et al. | Machine learning based perception architecture design for semi-autonomous vehicles | |
Radhakrishnan et al. | Vehicle Pair Activity Classification using QTC and Long Short Term Memory Neural Network. | |
Park et al. | A simulation based method for vehicle motion prediction | |
Loquercio | Agile Autonomy: Learning High-Speed Vision-Based Flight | |
Kumar et al. | Situational Intelligence-Based Vehicle Trajectory Prediction in an Unstructured Off-Road Environment | |
Grzeszick et al. | Weakly supervised object detection with pointwise mutual information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |