CN113657433A - 一种车辆轨迹多模态预测方法 - Google Patents
一种车辆轨迹多模态预测方法 Download PDFInfo
- Publication number
- CN113657433A CN113657433A CN202110746125.9A CN202110746125A CN113657433A CN 113657433 A CN113657433 A CN 113657433A CN 202110746125 A CN202110746125 A CN 202110746125A CN 113657433 A CN113657433 A CN 113657433A
- Authority
- CN
- China
- Prior art keywords
- prediction
- track
- prior
- trajectory
- modal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000008569 process Effects 0.000 claims abstract description 18
- 230000002452 interceptive effect Effects 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 6
- 238000012216 screening Methods 0.000 claims abstract description 4
- 230000006399 behavior Effects 0.000 claims description 35
- 238000009826 distribution Methods 0.000 claims description 28
- 230000003993 interaction Effects 0.000 claims description 6
- 230000009471 action Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000001133 acceleration Effects 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000004800 variational method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种车辆轨迹多模态预测方法,包括以下步骤:S1、对预测场景、预测目标以及预测目标的行为风格进行分类;S2、利用全概率公式将先验预测模型分为行为模态预测模型和基于行为模态的轨迹预测模型;S3、建立多模态轨迹先验预测模型,对车辆进行先验的多模态轨迹预测形成先验轨迹库;S4、依据道路约束、动力学约束以及交通规则约束对先验轨迹库进行过滤、筛选以及优化;S5、利用基于贝叶斯纳什均衡理论的多智能体交互博弈过程作为后验模型,对先验模型中的轨迹概率进行修正,最终实现对车辆的未来轨迹预测。本发明能够提高智能车辆对交通环境中交通车辆的轨迹预测的稳定性与精确度。
Description
技术领域
本发明属于智能驾驶技术领域,具体涉及一种车辆轨迹多模态预测方法。
背景技术
无人驾驶车辆的发展,能够从根本上改变人们的出行方式,使人们的出行、生活方式更加智能化,预防交通事故、提高道路通行效率,改善公共空间质量。然而环境的多样性、不确定性给无人驾驶车辆的安全性能带来了巨大的挑战,车辆亟需一个可靠、稳定的预测系统对外界环境进行准确地建模和评估。
机动车、非机动车、人是无人驾驶环境中最重要的参与者,相关交通目标的轨迹预测是预测系统的重要环节。当前对轨迹的预测过程中存在目标行为轨迹的不确定性建模问题:无人驾驶环境复杂多变,传统确定性预测方法只能对轨迹的不确定性进行统计平均求解,无法完整表达目标轨迹的多样性。
另一方面,道路上各个交通参与者参与过程中,存在着相互影响,相互制约的关系,是否能够对参与者这种交互关系进行建模,直接影响着轨迹预测的精度。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,一种车辆轨迹多模态预测方法,使用LSTM-CVAE生成模型作为先验模型,使用基于贝叶斯纳什均衡理论的交互博弈过程作为后验模型,最终输出周边交通目标的各种可能的轨迹序列以及该轨迹序列出现的概率。
为了达到上述目的,本发明采用以下技术方案:
一种车辆轨迹多模态预测方法,包括以下步骤:
S1、对预测场景、预测目标以及预测目标的行为风格进行分类;
S2、利用全概率公式将先验预测模型分为行为模态预测模型和基于行为模态的轨迹预测模型,提取行为模态特征作为多模态控制量;
S3、利用LSTM-CVAE生成模型将序列预测与序列生成相结合,针对不同的预测目标轨迹的不确定性,建立多模态轨迹先验预测模型,对车辆进行先验的多模态轨迹预测形成先验轨迹库;
S4、依据道路约束、动力学约束以及交通规则约束对先验轨迹库进行过滤、筛选以及优化;
S5、利用基于贝叶斯纳什均衡理论的多智能体交互博弈过程作为后验模型,对先验模型中的轨迹概率进行修正,最终实现对车辆的未来轨迹预测。
进一步的,步骤S1具体为:
根据外界环境信息,将预测场景分为路口和非路口;将预测目标分为机动车、非机动车以及人,由此建立预测输入信息;
依据不同的道路工况和预测目标的当前速度、朝向以及历史轨迹进行行为风格预测并生成由碰撞权重、快速权重以及舒适权重三者组成的风格因子,同时创建地图道路约束、动力学约束以及交通规则约束,将地图按照约束情况划分为通行与不可通行区域。
进一步的,步骤2中,先验预测模型中,假设X为输入信息,Y为需要预测的轨迹,则对先验预测模型Pθ(Y|X)进行求解,利用全概率公式:
将历史轨迹到未来轨迹预测任务分解为历史轨迹-行为-未来轨迹的任务,同时提取出行为作为多模态化输出的模态控制量,分别建立历史轨迹-多模态行为的行为预测模型PθM(Mn|X),多模态行为-未来轨迹的轨迹预测模型PθY(Yn|X,Mn)。
进一步的,先验模型具体为依据不同的预测场景、预测目标以及行为概率,采用CVAE编码解码网络作为模型框架,在框架中结合LSTM序列网络,建立基于可控模态和历史轨迹输入的隐变量分布和基于隐变量分布的轨迹生成网络,从而形成多模态轨迹先验预测模型来进行先验预测轨迹生成和先验概率计算,多模态轨迹先验预测模型不考虑预测目标间的互动信息,负责依据道路工况、预测目标以及可能的行为建立多模态先验轨迹及先验概率。
进一步的,先验轨迹库具体为,利用划分的通行与不可通行区域对多模态轨迹先验预测模型输出的轨迹集合进行过滤,去除不合理的轨迹,形成当前时刻的目标先验轨迹库。
进一步的,后验模型具体为多智能体交互博弈后验模型,多智能体交互博弈后验模型将预测目标都视为博弈的智能体,将多模态轨迹先验预测模块输出的轨迹集合作为博弈的可选动作,将先验概率视为博弈初始的动作选择概率,建立起博弈环境,得到后验轨迹作为最终的预测轨迹。
进一步的,在多智能体交互博弈后验模型中,对每个目标对象i建立深度Q网络模型,利用先验轨迹库作为目标对象的可选动作,再利用先验概率初始化Q网络,建立与碰撞、快速性以及舒适性相关的奖励函数;
依据Q值概率反复进行轨迹的选择、奖励函数计算、Q网络反馈更新的过程,直至各目标奖励函数收敛;此时Q网络的Q值概率即所求的后验交互轨迹概率,综合轨迹即最终的多模态化轨迹及其概率输出。
进一步的,奖励函数具体为:
Ri=αi*ci+βi*vi+γi*ai 2
其中,ci代表当前轨迹是否发生碰撞,表示轨迹的安全性,vi代表当前轨迹的平均行驶速度,表示轨迹的快速性;ai 2代表当前轨迹的加速度,表示轨迹的舒适性。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明将车辆轨迹预测过程中难以统一解决的多模态输出难题和交互建模难题分开,建立先验和后验模型有序解决,避免了单一复杂模型带来的计算难度指数增长,也有利于中间对各个环节进行单独调试优化。
2、本发明巧妙结合生成模型的多模态输出能力和序列模型的序列预测能力,仅仅需要控制模态输入即可完成多模态输出,提高了输出的灵活性。与现有技术相比,通过求解历史轨迹输入和模态控制量在各个维度的高斯分布,仅用一个模型统一了多模态输出之间的关系,避免了不同模态的模型进行分开训练和集成使用才能完成多模态输出的目标,提升了模型使用效率,给后续的轨迹优化打下基础。
3、本发明方法首先为了求解方便忽略了车辆的交互过程,在先验模型中建立先验轨迹库及轨迹概率,避免了对NP难题的直接求解。反过来又利用前面得到的轨迹库进行多智能体交互博弈,使得无穷的动态博弈过程变为了有限的静态轨迹博弈过程,借此加入了前面忽视的车辆交互性,提高了多模态先验预测模型的精度,使得本方法能够高效地输出预测目标的预测轨迹。
附图说明
图1是本发明方法的整体流程图;
图2是本发明的道路Frenet坐标系;
图3是本发明车辆多模态行为分类示意图;
图4是本发明车辆多模态轨迹预测模型示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
如图1所示,本实施例假设预测场景发生在非路口场景中,需要对周围车辆进行预测,包括以下步骤:
假设模型输入X为车辆i在T时间内的历史轨迹坐标点,则:
其中
假设模型输出Y为轨迹在未来H时间内的轨迹坐标点:
其中
根据当前的场景,使用三种行为对车辆的轨迹进行分类,仅考虑车辆在直线道路上的横向行为M,具体分为:{M1:左变道、M2:不变道、M3:右变道},如图3所示。
S2、在获得外界车辆的信息后,先验预测模型可表示为Pθ(Y|X),依据全概率公式:
其中,Yn表示行为Mn下的轨迹。公式将先验预测模型分为两个部分:轨迹预测模型P(Yn|X,Mn)以及行为预测模型P(Mn|X)。轨迹预测模型是历史轨迹X条件下,在给定多模态行为类别内对未来轨迹进行边际推断,即求解车辆在不同行为下的轨迹集合及其可能的边际概率,行为预测模型旨在求解车辆在采取不同行为的概率。
由此,全概率公式通过中间变量Mn将单模态预测的过程,分解为所需的多模态预测过程,分别用多模态轨迹预测模型PθY(Yn|X,Mn)和行为预测模型PθM(Mn|X)来对先验预测模型Pθ(Y|X)进行求解。
S3、对于先验模型中第二部分轨迹预测模型PθY(Yn|X,Mn)的求解,传统编码解码序列模型经常被用来进行序列预测任务,但其存在一定局限性。编码器和解码器之间通过一个固定长度的隐变量Z进行联系。即编码器要将整个序列的信息压缩进一个固定长度的隐藏向量中去。然而隐藏向量无法完全表示整个序列的信息,先输入的信息会被后续信息稀释。输入序列越长,这个现象就越严重。这就使得在解码的时候一开始就没有获得输入序列足够的信息,解码准确度下降。另一方面,针对传统LSTM模型在多模态输出中无法表示出较好的灵活性问题,引入高斯分布来对隐变量进行求解,通过模态信息用不同的高斯分布来拟合输入分布,在传统RNN的基础上加入了序列生成模型的灵活性。同时为了结果可控,用高斯分布的目标均值来表示不同行为之间的差异,来建立行为可控的多模态轨迹序列生成模型LSTM-CVAE。
LSTM-CVAE多模态轨迹预测模型PθY(Yn|X,Mn),为了保证模型的多模态化输出,仅仅是M作为多模态输出的控制量是不够的,而X是历史状态无法改变,因此使用Z来替代M、X作为轨迹输出的输入或者控制量,Z和原来的P(M,X)深度相关,但为保持生成能力两者不能完成相同。为了求解方便,构建Z关于P(M,X)的高斯分布。由此有
PθY(Yn|X,Mn)=∑P(Y|Z)P(Z|Mn,X)
通过上式将LSTM-CVAE模型分为编码模型和解码模型两部分,解码模型:P(Y|Z),编码模型:P(Z|Mn,X)。
编码模型:依靠编码模型来完成输入转换和多模态控制量的构建,建立目标分布P(Z|Mn,X),为方便求解,假设P(Z|Mn,X)是以行为偏差μMn为均值的高斯分布。为满足Z要求,利用变分法,建立当前分布不断缩小分布间的差距来近似分布P(Z|Mn,X)。P(Z|Mn,X)是假设的高斯分布或逼近的目标分布;是模型的分布,是当前的分布,通过让当前的分布来逼近目标分布来完成符合要求的Z值的构建。
以高斯分布的参数μ和σ表示,利用全连接模型对行为的统计均值μM和方差σ进行求解,最终利用KL散度作为损失函数来让正态分布逼近求解P(Z|X,Mn),即
如图4所示,模型前半部分由LSTM组成,用于建立历史轨迹点的前后关系,再通过全连接网络分别对高斯分布的均值μM和方差σ2进行求解来近似分布P(Z|Mn,X),从而求得基于行为/模态均值μM的高斯分布P(Z|Mn,X)。
解码模型:通过编码器完成多模态控制量的构建,下一步就是根据控制量Z进行轨迹预测。从分布P(Z|Mn)中采样得到Z,基于重构误差的损失函数:
解码得到需要的输出Y以及P(Y|Z)即为需要预测的轨迹和概率。针对不同的行为Mn反复进行求解便可求得对应目标的多模态轨迹集合。
在多模态预测模型部分,编码器和解码器都使用了激活函数为ReLU的LSTM模型,而模态控制隐变量Z部分使用了双层全连接网络对高斯分布的均值和方差进行求解。而对于行为预测模型PθM(Mn|X)则直接用LSTM模型来计算。两个模型都使用了Adam优化器来进行训练。
S4、利用道路约束、动力学约束、交通规则约束建立二维平面地图掩膜层,对多模态轨迹集合进行过滤、筛选,将不合理轨迹进行屏蔽。
S5、对每个目标对象i建立深度Q网络模型,利用先验轨迹库作为目标对象的可选动作,再利用先验概率初始化Q网络,建立奖励函数
Ri=αi*ci+βi*vi+γi*ai 2
其中,ci代表当前轨迹是否发生碰撞,表示轨迹的安全性;vi代表当前轨迹的平均行驶速度,表示轨迹的快速性;ai 2代表当前轨迹的加速度,表示轨迹的舒适性;
针对目标不同的行为风格,给予不同权重αi、βi、γi的奖励函数。如此依据Q值概率反复进行轨迹的选择、奖励函数计算、Q网络反馈更新,直至各目标奖励函数收敛,此时的Q网络的Q值概率便是所求的后验交互轨迹概率,综合轨迹便是整个预测系统的最终多模态化轨迹及其概率输出。
本发明针对车辆行为轨迹的不确定性建模和交互性建模问题,基于LSTM-CVAE生成模型进行多模态先验轨迹预测。该模型结合了LSTM对于轨迹序列强大的预测以及CVAE模型强大的多样化生成能力,以预测目标历史轨迹序列、道路环境为输入,求解目标车辆在未来时刻的多模态轨迹序列及其概率,同时,引入了基于纳什均衡理论的动态博弈过程作为后验模型,对先验模型中输出的各项概率进行了修正,能够有效的提高预测算法的稳定性与精确度。
还需要说明的是,在本说明书中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种车辆轨迹多模态预测方法,其特征在于,包括以下步骤:
S1、对预测场景、预测目标以及预测目标的行为风格进行分类;
S2、利用全概率公式将先验预测模型分为行为模态预测模型和基于行为模态的轨迹预测模型,提取行为模态特征作为多模态控制量;
S3、利用LSTM-CVAE生成模型将序列预测与序列生成相结合,针对不同的预测目标轨迹的不确定性,建立多模态轨迹先验预测模型,对车辆进行先验的多模态轨迹预测形成先验轨迹库;
S4、依据道路约束、动力学约束以及交通规则约束对先验轨迹库进行过滤、筛选以及优化;
S5、利用基于贝叶斯纳什均衡理论的多智能体交互博弈过程作为后验模型,对先验模型中的轨迹概率进行修正,最终实现对车辆的未来轨迹预测。
2.根据权利要求1所述的一种车辆轨迹多模态预测方法,其特征在于,步骤S1具体为:
根据外界环境信息,将预测场景分为路口和非路口;将预测目标分为机动车、非机动车以及人,由此建立预测输入信息;
依据不同的道路工况和预测目标的当前速度、朝向以及历史轨迹进行行为风格预测并生成由碰撞权重、快速权重以及舒适权重三者组成的风格因子,同时创建地图道路约束、动力学约束以及交通规则约束,将地图按照约束情况划分为通行与不可通行区域。
4.根据权利要求1所述的一种车辆轨迹多模态预测方法,其特征在于,先验模型具体为依据不同的预测场景、预测目标以及行为概率,采用CVAE编码解码网络作为模型框架,在框架中结合LSTM序列网络,建立基于可控模态和历史轨迹输入的隐变量分布和基于隐变量分布的轨迹生成网络,从而形成多模态轨迹先验预测模型来进行先验预测轨迹生成和先验概率计算,多模态轨迹先验预测模型不考虑预测目标间的互动信息,负责依据道路工况、预测目标以及可能的行为建立多模态先验轨迹及先验概率。
5.根据权利要求2所述的一种车辆轨迹多模态预测方法,其特征在于,先验轨迹库具体为,利用划分的通行与不可通行区域对多模态轨迹先验预测模型输出的轨迹集合进行过滤,去除不合理的轨迹,形成当前时刻的目标先验轨迹库。
6.根据权利要求1所述的一种车辆轨迹多模态预测方法,其特征在于,后验模型具体为多智能体交互博弈后验模型,多智能体交互博弈后验模型将预测目标都视为博弈的智能体,将多模态轨迹先验预测模块输出的轨迹集合作为博弈的可选动作,将先验概率视为博弈初始的动作选择概率,建立起博弈环境,得到后验轨迹作为最终的预测轨迹。
7.根据权利要求6所述的一种车辆轨迹多模态预测方法,其特征在于,在多智能体交互博弈后验模型中,对每个目标对象i建立深度Q网络模型,利用先验轨迹库作为目标对象的可选动作,再利用先验概率初始化Q网络,建立与碰撞、快速性以及舒适性相关的奖励函数;
依据Q值概率反复进行轨迹的选择、奖励函数计算、Q网络反馈更新的过程,直至各目标奖励函数收敛;此时Q网络的Q值概率即所求的后验交互轨迹概率,综合轨迹即最终的多模态化轨迹及其概率输出。
8.根据权利要求7所述的一种车辆轨迹多模态预测方法,其特征在于,奖励函数具体为:
Ri=αi*ci+βi*vi+γi*ai 2
其中,ci代表当前轨迹是否发生碰撞,表示轨迹的安全性,vi代表当前轨迹的平均行驶速度,表示轨迹的快速性;ai 2代表当前轨迹的加速度,表示轨迹的舒适性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110746125.9A CN113657433B (zh) | 2021-07-01 | 2021-07-01 | 一种车辆轨迹多模态预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110746125.9A CN113657433B (zh) | 2021-07-01 | 2021-07-01 | 一种车辆轨迹多模态预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113657433A true CN113657433A (zh) | 2021-11-16 |
CN113657433B CN113657433B (zh) | 2023-07-21 |
Family
ID=78477869
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110746125.9A Active CN113657433B (zh) | 2021-07-01 | 2021-07-01 | 一种车辆轨迹多模态预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113657433B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114475656A (zh) * | 2022-02-21 | 2022-05-13 | 中国第一汽车股份有限公司 | 行驶轨迹预测方法、装置、电子设备以及存储介质 |
CN115009275A (zh) * | 2022-08-08 | 2022-09-06 | 北京理工大学前沿技术研究院 | 面向城市场景下车辆轨迹预测方法、系统及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046919A (zh) * | 2019-11-21 | 2020-04-21 | 南京航空航天大学 | 一种融合行为意图的周围动态车辆轨迹预测系统及方法 |
CN111931902A (zh) * | 2020-07-03 | 2020-11-13 | 江苏大学 | 一种生成对抗网络模型、及利用该生成对抗网络模型的车辆轨迹预测方法 |
CN111931905A (zh) * | 2020-07-13 | 2020-11-13 | 江苏大学 | 一种图卷积神经网络模型、及利用该模型的车辆轨迹预测方法 |
CN112015843A (zh) * | 2020-09-02 | 2020-12-01 | 中国科学技术大学 | 基于多车意图交互结果的行车风险态势评估方法及系统 |
CN112733908A (zh) * | 2020-12-31 | 2021-04-30 | 大连海事大学 | 一种高精度的车辆轨迹多模态预测方法 |
-
2021
- 2021-07-01 CN CN202110746125.9A patent/CN113657433B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046919A (zh) * | 2019-11-21 | 2020-04-21 | 南京航空航天大学 | 一种融合行为意图的周围动态车辆轨迹预测系统及方法 |
CN111931902A (zh) * | 2020-07-03 | 2020-11-13 | 江苏大学 | 一种生成对抗网络模型、及利用该生成对抗网络模型的车辆轨迹预测方法 |
CN111931905A (zh) * | 2020-07-13 | 2020-11-13 | 江苏大学 | 一种图卷积神经网络模型、及利用该模型的车辆轨迹预测方法 |
CN112015843A (zh) * | 2020-09-02 | 2020-12-01 | 中国科学技术大学 | 基于多车意图交互结果的行车风险态势评估方法及系统 |
CN112733908A (zh) * | 2020-12-31 | 2021-04-30 | 大连海事大学 | 一种高精度的车辆轨迹多模态预测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114475656A (zh) * | 2022-02-21 | 2022-05-13 | 中国第一汽车股份有限公司 | 行驶轨迹预测方法、装置、电子设备以及存储介质 |
CN115009275A (zh) * | 2022-08-08 | 2022-09-06 | 北京理工大学前沿技术研究院 | 面向城市场景下车辆轨迹预测方法、系统及存储介质 |
CN115009275B (zh) * | 2022-08-08 | 2022-12-16 | 北京理工大学前沿技术研究院 | 面向城市场景下车辆轨迹预测方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113657433B (zh) | 2023-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhattacharyya et al. | Simulating emergent properties of human driving behavior using multi-agent reward augmented imitation learning | |
CN113110592B (zh) | 一种无人机避障与路径规划方法 | |
Li et al. | Infogail: Interpretable imitation learning from visual demonstrations | |
CN109726804B (zh) | 一种基于行车预测场和bp神经网络的智能车辆驾驶行为拟人化决策方法 | |
CN112433525A (zh) | 基于模仿学习及深度强化学习的移动机器人导航方法 | |
Rempe et al. | Trace and pace: Controllable pedestrian animation via guided trajectory diffusion | |
CN114170789B (zh) | 基于时空图神经网络的智能网联车换道决策建模方法 | |
CN113657433A (zh) | 一种车辆轨迹多模态预测方法 | |
CN111931902A (zh) | 一种生成对抗网络模型、及利用该生成对抗网络模型的车辆轨迹预测方法 | |
CN112550314B (zh) | 适用于无人驾驶的嵌入优化式控制方法及其驾驶控制模块和自动驾驶控制系统 | |
CN110108292A (zh) | 车辆导航路径规划方法、系统、设备及介质 | |
Zhang et al. | A systematic solution of human driving behavior modeling and simulation for automated vehicle studies | |
CN111645673B (zh) | 一种基于深度强化学习的自动泊车方法 | |
Cai et al. | DQ-GAT: Towards safe and efficient autonomous driving with deep Q-learning and graph attention networks | |
CN114153213A (zh) | 一种基于路径规划的深度强化学习智能车行为决策方法 | |
Sun et al. | Vehicle turning behavior modeling at conflicting areas of mixed-flow intersections based on deep learning | |
Venkatesh et al. | Connected and automated vehicles in mixed-traffic: Learning human driver behavior for effective on-ramp merging | |
CN117227755A (zh) | 基于强化学习的复杂交通场景下自动驾驶决策方法及系统 | |
CN109752952A (zh) | 一种获取多维随机分布及强化控制器的方法和装置 | |
CN117007066A (zh) | 多规划算法集成的无人驾驶轨迹规划方法及相关装置 | |
Arbabi et al. | Planning for autonomous driving via interaction-aware probabilistic action policies | |
CN114997048A (zh) | 基于探索策略改进的td3算法的自动驾驶车辆车道保持方法 | |
Wang et al. | Multi-objective end-to-end self-driving based on Pareto-optimal actor-critic approach | |
CN115719547A (zh) | 基于多重交互行为的交通参与者轨迹预测方法及系统 | |
CN115009291A (zh) | 基于网络演化重放缓冲区的自动驾驶辅助决策方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |