CN109300144B - 一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 - Google Patents
一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 Download PDFInfo
- Publication number
- CN109300144B CN109300144B CN201811108075.6A CN201811108075A CN109300144B CN 109300144 B CN109300144 B CN 109300144B CN 201811108075 A CN201811108075 A CN 201811108075A CN 109300144 B CN109300144 B CN 109300144B
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- force model
- social force
- time
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001914 filtration Methods 0.000 title claims abstract description 15
- 238000005259 measurement Methods 0.000 claims abstract description 16
- 239000002245 particle Substances 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000004088 simulation Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 15
- 230000009471 action Effects 0.000 claims description 8
- 230000007704 transition Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/277—Analysis of motion involving stochastic approaches, e.g. using Kalman filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法,卡尔曼滤波器分为时间更新和测量更新两个部分;设定适应度函数,利用自适应变异粒子群算法对社会力模型的各种参数进行辨识;使用步骤二中模拟得出预计的行人轨迹,并根据步骤一卡尔曼时间更新公式计算得出行人下一时刻的位置值,最终得到先验估计值X(k|k‑1);根据卡尔曼测量更新公式计算得出行人的当前位置测量值Zk,并结合先验估计值X(k|k‑1)计算得出最优估计值;设定误差阈值ψ,判断社会力模型的预测位置和最优估计值之间的误差情况,并进行修正,完成轨迹预测工作。能在行人主动避让、转弯及直线行走时均能具有较精确的预测轨迹,有效较低与实际轨迹的误差,从而能满足所需的预测要求。
Description
技术领域
本发明涉及一种行人轨迹预测方法,具体是一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法。
背景技术
行人轨迹预测是根据行人当前的运动信息和历史数据估计出行人下一时刻的位置或者未来一段时间的运动轨迹。虽然人的运动具有很大的随机性,但是在车站等结构化环境中,人的长期运动通常是具有规律的,表现为连接各个出入口之间的连续轨迹。行人轨迹预测在无人驾驶、机器人避障规划以及城市交通管理等方面都具有非常大的实用价值。
现有的关于行人轨迹预测的方法主要分为两类:一类是基于数据的建模方式,如基于长短时记忆网络的人体运动预测算法,利用行人轨迹数据集训练神经网络来获取轨迹的预测值。另一类方法主要基于行人运动学模型,如基于卡尔曼滤波的行人轨迹预测算法,利用运动学模型得出行人下一步位置的先验估计,再采集观测信息对先验估计进行校正,完成行人位置预测。
虽然对于行人轨迹预测方面已经了很多成果,但是现有方法在预测过程中存在的主要问题是把行人当成了一般运动物体进行轨迹跟踪和预测,而没有考虑行人与行人以及行人与障碍物之间的作用关系。在多行人环境下,由于人的主动感知性,行人向目的地运动的过程中会主动改变运动方向避免与其他人或者障碍物发生碰撞,而这种运动方向的突然变化会导致轨迹预测的结果出现较大的误差。目前还没有一种考虑行人主动避障情况的预测方法。
发明内容
针对上述现有技术存在的问题,本发明提供一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法,能在行人主动避让、转弯及直线行走时均能具有较精确的预测轨迹,有效较低与实际轨迹的误差,从而能满足所需的预测要求。
为了实现上述目的,本发明采用的技术方案是:一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法,具体步骤为:
一、卡尔曼滤波器初始化;
卡尔曼滤波器分为时间更新和测量更新两个部分;在卡尔曼滤波器初始化时,根据行人运动学公式计算出时间更新阶段的状态转移矩阵和观测矩阵,分别为公式(1)中的矩阵A和公式(2)中的矩阵H;
Xk=AXk-1+Wk-1 (1)
Zk=HXk+Vk (2)
式中,Xk是k时刻的系统状态,A是n×n维的状态转移矩阵;H是m×n维的观测矩阵;Wk-1满足均值为零、协方差矩阵为Q的高斯分布;Vk为测量噪声,满足协方差矩阵为R的高斯分布;
二、社会力模型的参数辨识;
设定适应度函数,利用自适应变异粒子群算法对社会力模型的行人作用强度、行人作用范围、行人质量和行人半径的参数进行辨识,并模拟得出预计的行人轨迹;
三、卡尔曼滤波器的时间更新过程;
使用步骤二中模拟得出预计的行人轨迹,并根据步骤一卡尔曼时间更新公式计算得出行人下一时刻的位置值,将两个结果进行加权求和得出改进后卡尔曼滤波器的时间更新方程,最终得到先验估计值X(kk-1);
四、卡尔曼滤波器的测量更新过程;
根据步骤一卡尔曼测量更新公式计算得出行人的当前位置测量值Zk,将测量值Zk和先验估计值X(kk-1)带入行人运动方程,计算得出最优估计值,即
X(kk)=X(kk-1)+Kk(Zk-HX(kk-1)) (5)
五、事件触发更新过程;
由于参数辨识的结果存在一定的误差,社会力模型的模拟结果误差会越来越大,因此设定误差阈值ψ,判断社会力模型的预测位置和最优估计值之间的误差DisError是否超过误差阈值ψ;若未超过误差阈值ψ则按照社会力模型得出的轨迹作为预测轨迹;若超过误差阈值ψ时,即为一个触发事件(此时出现行人主动避让的情况,如行人突然转弯),此时以当前的最优估计值作为初始化数据输入到社会力模型中,重新获取行人运动轨迹;
六、判断任务是否结束;
判断步骤五的预测时刻是否为最终时刻,若是,则结束轨迹预测工作,若否则转至步骤三继续进行迭代预测。
与现有技术相比,本发明采用社会力模型和卡尔曼滤波器相结合方式,通过社会力模型和卡尔曼滤波器相互进行修正,从而保证预测轨迹与行人实际轨迹更贴近,因此本发明能在行人主动避让、转弯及直线行走时均能具有较精确的预测轨迹,有效较低与实际轨迹的误差,从而能满足所需的预测要求。
附图说明
图1是本发明实施例中模拟的8个行人的参考轨迹;
图2是本发明的流程图;
图3是本发明中参数辨识的过程图;
图4是本发明试验证明时不同方法的预测轨迹与参考轨迹路线图;
图5是图4中不同方法的预测轨迹与参考轨迹相比的误差图。
具体实施方式
下面将对本发明做进一步说明。
本发明的具体步骤为:
一、卡尔曼滤波器初始化;
在跟踪过程中,由于采样时间很短,目标在该采样时间内的运动可以看成匀速运动。因此得到行人的运动方程为
由于
Xk=AXk-1+Wk-1 (1)
Zk=HXk+Vk (2)
式中,Xk是k时刻的系统状态,A是n×n维的状态转移矩阵;H是m×n维的观测矩阵;Wk-1满足均值为零、协方差矩阵为Q的高斯分布;Vk为测量噪声,满足协方差矩阵为R的高斯分布;
二、社会力模型的参数辨识;
社会力模型的动力学方程:
合力方程为:
第i个行人受到的合力fi由行人的自驱力fi 0和行人与其他行人和障碍物之间交互力组成;在公式(10)中,和分别表示第i个行人的期望速率和方向,是t时刻行人的真实速度,τt是行人的反应时间,mi是第i个行人的质量。fi p表示除i外其他所有行人对第i个行人的斥力作用,即 表示第j个行人对第i个行人的作用力,具体公式为:
定义第i个行人的半径为ri;在公式(12)中:g(x)=max{0,x},Ai,Bi,k1和k2都为正常数;表示斥力,k1g(rij-dij)nij和分别表示压缩力和摩擦力,并且只在dij<rij时产生作用,也就是第i个行人和第j个行人发生了身体接触;为了方便表达,对公式中使用的变量作出如下定义:
rij=ri+rj (13)
dij=||ri-rj|| (14)
tij=[-nij(2),nij(1)]' (16)
采用自适应变异粒子群算法对作用强度系数Aα(Aw)、作用范围系数Bβ(Bw)、行人半径ri和质量mi(i=1,2…N)进行辨识;在粒子群算法中,每个粒子代表一个潜在解,个体粒子经过的最好位置成为个体极值,种群中的最好位置成为全局极值,所有粒子根据这两个经验信息进行迭代更新,第i个粒子的飞行速度和位置的计算方式为:
式中:和分别表示第i个粒子当前的位置和运动速度;c1,c2为非负的加速度因子;r1,r2是[0,1]之间的随机数;ω为惯性权重。主要有三个部分构成,第一部分是粒子的当前状态;第二部分是粒子自身的信任度;第三部分是种群信任度。
在此基础上,通过计算适应度值对粒子当前位置进行评价,根据社会力模型估计的特点,设定适应度函数为:
其中是t时刻行人位置的测量值,是t-1利用社会力模型计算出的t时刻行人位置;由于各参数在数量级上差别比较大,为了合理设置粒子群算法中粒子的位置,对参数采取归一化方式;在粒子群算法中,加速度因子c1=1.4,c2=1.5,惯性权重w=0.8,变异算子设置为0.9,种群数目50个,算法迭代次数为300次;辨识过程如图2所示,适应度值逐渐收敛于零,辨识结果与实际值对比如表一所示,其中Aα的单位为N,Bα的单位为m,行人半径ri(i=1,2...N)单位为m,行人质量mi(i=1,2...N)的单位为kg。
表1
三、卡尔曼滤波器的时间更新过程;
采用社会力模型来对行人与行人和行人与障碍物之间进行运动建模,将计算结果融入卡尔曼滤波时间更新方程中,改进后的方程为公式(4),即
函数f(Δθk)定义为:
在公式(4)中,X(kk-1)的状态由运动方程和社会力模型估计的模拟曲线共同决定。在行人运动方向改变较小时,由于社会力模型参数有一定的误差,卡尔曼滤波的预测效果比单纯的社会力模型要好,所以在行人直线运动时直接采用卡尔曼滤波进行预测;在行人运动方向改变较大时,卡尔曼滤波算法无法及时跟踪到目标此时的变化的,此时利用社会力模型计算出的变化量去估计X(kk-1);在行人运动变化方向在一定范围内时,将运动方程和社会力模型的增量值取不同权重相加得到X(kk-1)值;最后根据公式(24)更新先验协方差矩阵P(kk-1)。
P(kk-1)=AP(k-1k-1)A+Q (24)
四、卡尔曼滤波器的测量更新过程;
时间更新部分已经在步骤三种完成,测量更新是利用测量值对上一步的先验估计值进行修正来获取当前更为准确的最优估计值;首先根据公式(25)计算卡尔曼增益Kk,然后根据公式(5)计算该时刻行人位置的最优估计值;为了下次的迭代预测过程,需要根据公式(26)更新后验协方差矩阵P(kk);
X(kk)=X(kk-1)+Kk(Zk-HX(kk-1)) (5)
Kk=P(kk-1)HT(HP(KK-1)HT+R)-1 (25)
P(kk)=(I-KkH)P(kk-1) (26)
五、事件触发更新过程;
利用社会力模型可以得到行人一段时间内的运动轨迹曲线,但是随着误差的累计,预测的轨迹误差会越来越大,所以我们需要采取策略去尽量减少这种误差。为了节约计算机的运算资源,我们采取事件驱动的方式更新社会力模型的预测轨迹。事件触发机制设置为社会力模型的预测值和最优估计值之间的误差大于误差阈值ψ,根据公式(6)计算误差值,其中误差阈值ψ=0.005;当两个估计点之间的误差超过误差阈值ψ时就需要以当前的最优估计值作为初始化数据输入到社会力模型中,重新获取行人运动轨迹;
六、判断任务是否结束;
判断步骤五的预测时刻是否为最终时刻,若是,则结束轨迹预测工作,若否则转至步骤三继续进行迭代预测。
试验证明:
本发明是针对行人轨迹预测的,所以为了验证预测效果,首先用参数完全已知的社会力模型生成标准参考轨迹。设置行人质量设置为[45,75]kg的随机分布,行人尺寸设置为[0.25,0.35]的随机分布。作用强度系数Aα在考虑质量差异情况下,可用力的形式表示为2×103N。作用范围系数Bα以半径的形式设为定值,选取0.08m作为范围强度系数的值。弹性系数及摩擦系数分别为k1=1.2×105kg/s2和k2=2.4×105kg/m。假设8个行人在走廊中运动,利用参数确定的社会力模型绘制出图1所示的轨迹图,并将该轨迹作为行人的参考轨迹。
分别采用本发明的方法、卡尔曼滤波预测方法和社会力模型预测方法对上述设定的模拟行人进行预测,然后形成如图4所示的本发明的预测轨迹、卡尔曼滤波预测轨迹、社会力模型预测轨迹和行人的参考轨迹对比图;进而确定各个预测轨迹与参考轨迹的误差情况,如图5所示;通过图5可以看出卡尔曼滤波算法的预测轨迹在行人转弯处的误差较大,但是在行人直线阶段的预测误差比社会力模型要小;而本发明的方法无论是在行人转弯处,还是行人直线阶段其误差均较小,因此本发明预测的轨迹优于采用卡尔曼滤波预测方法的轨迹和采用社会力模型预测方法的轨迹。
Claims (1)
1.一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法,其特征在于,具体步骤为:
一、卡尔曼滤波器初始化;
卡尔曼滤波器分为时间更新和测量更新两个部分;在卡尔曼滤波器初始化时,根据行人运动学公式计算出时间更新阶段的状态转移矩阵A和观测矩阵H;
Xk=AXk-1+Wk-1 (1)
Zk=HXk+Vk (2)
式中,Xk是k时刻的系统状态,A是n×n维的状态转移矩阵;H是m×n维的观测矩阵;Wk-1满足均值为零、协方差矩阵为Q的高斯分布;Vk为测量噪声,满足协方差矩阵为R的高斯分布;
二、社会力模型的参数辨识;
设定适应度函数,利用自适应变异粒子群算法对社会力模型的行人作用强度、行人作用范围、行人质量和行人半径的参数进行辨识,并模拟得出预计的行人轨迹;
三、卡尔曼滤波器的时间更新过程;
使用步骤二中模拟得出预计的行人轨迹,并根据步骤一卡尔曼时间更新公式计算得出行人下一时刻的位置值,将两个结果进行加权求和得出改进后卡尔曼滤波器的时间更新方程,最终得到先验估计值X(k|k-1);
函数f(Δθk)定义为:
四、卡尔曼滤波器的测量更新过程;
根据步骤一卡尔曼测量更新公式计算得出行人的当前位置测量值Zk,将测量值Zk和先验估计值X(k|k-1)带入行人运动方程,计算得出最优估计值,即
X(k|k)=X(k|k-1)+Kk(Zk-HX(k|k-1)) (5)
其中Kk为:
Kk=P(k|k-1)HT(HP(k|k-1)HT+R)-1
P(k|k)=(I-KkH)P(k|k-1)
五、事件触发更新过程;
设定误差阈值ψ,判断社会力模型的预测位置和最优估计值之间的误差DisError是否超过误差阈值ψ;若未超过误差阈值ψ则按照社会力模型得出的轨迹作为预测轨迹;若超过误差阈值ψ时,即为一个触发事件,此时以当前的最优估计值作为初始化数据输入到社会力模型中,重新获取行人运动轨迹;
六、判断任务是否结束;
判断步骤五的预测时刻是否为最终时刻,若是,则结束轨迹预测工作,若否则转至步骤三继续进行迭代预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811108075.6A CN109300144B (zh) | 2018-09-21 | 2018-09-21 | 一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811108075.6A CN109300144B (zh) | 2018-09-21 | 2018-09-21 | 一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109300144A CN109300144A (zh) | 2019-02-01 |
CN109300144B true CN109300144B (zh) | 2021-12-24 |
Family
ID=65163714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811108075.6A Active CN109300144B (zh) | 2018-09-21 | 2018-09-21 | 一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109300144B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110276123B (zh) * | 2019-06-19 | 2023-01-20 | 中山大学 | 一种基于相对速度的社会力模型的人群仿真方法 |
CN110533013A (zh) * | 2019-10-30 | 2019-12-03 | 图谱未来(南京)人工智能研究院有限公司 | 一种轨迹检测方法及装置 |
CN111401233A (zh) * | 2020-03-13 | 2020-07-10 | 商汤集团有限公司 | 轨迹预测方法、装置、电子设备及介质 |
CN111459168B (zh) * | 2020-04-23 | 2021-12-10 | 上海交通大学 | 一种融合的自动驾驶汽车过街行人轨迹预测方法及系统 |
CN111935638A (zh) * | 2020-06-22 | 2020-11-13 | 西安理工大学 | 基于无线紫外光虚拟围栏的蜂群无人机机间避让预警方法 |
CN112152954B (zh) * | 2020-09-22 | 2022-09-27 | 中国人民解放军海军航空大学青岛校区 | 一种飞行模拟器坐标数据联网传输失真抑制方法 |
CN113112528A (zh) * | 2021-04-26 | 2021-07-13 | 中南财经政法大学 | 异常行为监控方法、装置、设备及存储介质 |
CN113763434B (zh) * | 2021-09-26 | 2024-02-02 | 东风汽车集团股份有限公司 | 一种基于卡尔曼滤波多运动模型切换的目标轨迹预测方法 |
CN115952930B (zh) * | 2023-03-14 | 2023-08-22 | 中国人民解放军国防科技大学 | 一种基于imm-gmr模型的社会行为体位置预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023244A (zh) * | 2016-04-13 | 2016-10-12 | 南京邮电大学 | 基于最小二乘法轨迹预测及智能避障模型的行人跟踪方法 |
CN107491749A (zh) * | 2017-08-11 | 2017-12-19 | 南京邮电大学 | 一种人群场景中全局和局部异常行为检测方法 |
CN107563518A (zh) * | 2017-09-12 | 2018-01-09 | 太原理工大学 | 一种基于社会力模型群优化算法的极限学习机的学习方法 |
-
2018
- 2018-09-21 CN CN201811108075.6A patent/CN109300144B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023244A (zh) * | 2016-04-13 | 2016-10-12 | 南京邮电大学 | 基于最小二乘法轨迹预测及智能避障模型的行人跟踪方法 |
CN107491749A (zh) * | 2017-08-11 | 2017-12-19 | 南京邮电大学 | 一种人群场景中全局和局部异常行为检测方法 |
CN107563518A (zh) * | 2017-09-12 | 2018-01-09 | 太原理工大学 | 一种基于社会力模型群优化算法的极限学习机的学习方法 |
Non-Patent Citations (3)
Title |
---|
《Abnormal Crowd Behavior Detection》;R. Raghavendra1等;《Human Behavior Understanding》;20111231;第134-145页 * |
《Particle Swarm Optimization Aided Kalman Filter for Object Tracking》;Nimmakayala Ramakoti 等;《IEEE》;20100112;第531-533页 * |
《People Tracking with Human》;Matthias Luber 等;《IEEE》;20100715;第464-469 * |
Also Published As
Publication number | Publication date |
---|---|
CN109300144A (zh) | 2019-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109300144B (zh) | 一种融合社会力模型和卡尔曼滤波的行人轨迹预测方法 | |
JP7069456B2 (ja) | マルチポリシー意思決定を導くための有益な結果を構築するための方法および装置 | |
CN110514206B (zh) | 一种基于深度学习的无人机飞行路径预测方法 | |
CN112356830A (zh) | 一种基于模型强化学习的智能泊车方法 | |
CN109960246B (zh) | 动作控制方法及装置 | |
Botteghi et al. | On reward shaping for mobile robot navigation: A reinforcement learning and SLAM based approach | |
CN113253733B (zh) | 一种基于学习和融合的导航避障方法、装置及系统 | |
Wissing et al. | Probabilistic time-to-lane-change prediction on highways | |
Kuutti et al. | End-to-end reinforcement learning for autonomous longitudinal control using advantage actor critic with temporal context | |
CN114020013B (zh) | 一种基于深度强化学习的无人机编队避撞方法 | |
CN114460936B (zh) | 基于离线增量学习的自动驾驶汽车路径规划方法及系统 | |
US11960291B2 (en) | Computer-implemented method and device for controlling a mobile robot based on semantic environment maps | |
CN114667852B (zh) | 一种基于深度强化学习的绿篱修剪机器人智能协同控制方法 | |
CN115542733A (zh) | 基于深度强化学习的自适应动态窗口法 | |
CN111949013A (zh) | 控制载具的方法和用于控制载具的装置 | |
Berntorp et al. | Motion planning of autonomous road vehicles by particle filtering: Implementation and validation | |
Jaafra et al. | Robust reinforcement learning for autonomous driving | |
Broecker et al. | Distance-based multi-robot coordination on pocket drones | |
Chen et al. | Pedestrian behavior prediction based on motion patterns for vehicle-to-pedestrian collision avoidance | |
Doellinger et al. | Environment-aware multi-target tracking of pedestrians | |
Regier et al. | Improving navigation with the social force model by learning a neural network controller in pedestrian crowds | |
CN113589810B (zh) | 智能体动态自主避障运动方法、装置、服务器及存储介质 | |
CN111413974B (zh) | 一种基于学习采样式的汽车自动驾驶运动规划方法及系统 | |
Jaafra et al. | Seeking for robustness in reinforcement learning: application on Carla simulator | |
Grigorescu | Vision dynamics-based learning control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |