CN117775015A - 一种人机博弈横纵向协同控制方法 - Google Patents
一种人机博弈横纵向协同控制方法 Download PDFInfo
- Publication number
- CN117775015A CN117775015A CN202410079675.3A CN202410079675A CN117775015A CN 117775015 A CN117775015 A CN 117775015A CN 202410079675 A CN202410079675 A CN 202410079675A CN 117775015 A CN117775015 A CN 117775015A
- Authority
- CN
- China
- Prior art keywords
- driver
- controller
- vehicle
- control
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000011217 control strategy Methods 0.000 claims abstract description 50
- 239000011159 matrix material Substances 0.000 claims description 42
- 230000001133 acceleration Effects 0.000 claims description 31
- 230000009471 action Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 19
- 230000002232 neuromuscular Effects 0.000 claims description 16
- 230000003993 interaction Effects 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 208000003443 Unconsciousness Diseases 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 238000012502 risk assessment Methods 0.000 claims description 3
- 238000009795 derivation Methods 0.000 claims description 2
- 238000011156 evaluation Methods 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 claims 1
- 238000010606 normalization Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 3
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000011151 fibre-reinforced plastic Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明涉及一种人机博弈横纵向协同控制方法,包括步骤一、在信息不对称的条件下,建立驾驶员和控制器的模型;步骤二、设计人机博弈横向和纵向协同控制策略;步骤三、理论推导达到博弈均衡时人机双方最优控制策略,所述的最优控制策略包括驾驶员和控制器的最优控制策略;步骤四、实现人机博弈横纵向协同控制;旨在逼真人机共驾模型,并减轻人机冲突和提高人机协同性能,从而实现横纵向人机协同控制。
Description
技术领域
本发明实施涉及车辆控制技术领域,具体涉及一种信息不对称条件下考虑驾驶员特性的人机博弈横纵向协同控制方法。
背景技术
实施车辆自动化有可能降低事故率,提高交通效率,从而推动自动驾驶的发展。然而,当前的自动驾驶系统在特定情况下并不能够独立有效完成驾驶任务,这给智能汽车带来安全风险。除了各种技术障碍外,自动驾驶技术的商业化还需要考虑社会因素,例如道德问题和与权利和责任有关的立法。因此,在现有的技术和应用框架内,人机协同控制为自动驾驶发展提供了一个可行的解决方案。
在当前的人机共享控制的研究中,大多研究恒定纵向车速下的横向共享控制,忽略了纵向速度对横向控制的影响。然而,在实际车辆运行过程中,驾驶员不仅需要通过转动方向盘来控制车辆,还需要通过踩油门或刹车踏板来控制车辆的速度。忽略车辆纵向速度的变化将极大地影响控制精度和车辆安全性。因此,有必要从横向和纵向两个维度考虑人机协同控制。此外,大多研究都是基于完全信息条件来进行人机博弈控制策略的设计。但是在实际情况下,驾驶员和控制器并不是都能获取全部博弈信息。博弈者可能依据自己的经验或者其他辅助措施来估计某一博弈信息,因此容易形成人机之间信息不对称。综上,有必要对信息不对称条件下人机博弈横纵向协同控制方法进行研究。
发明内容
本发明的目的是针对现有技术中存在的缺陷,提供一种人机博弈横纵向协同控制方法,旨在逼真人机共驾模型,并减轻人机冲突和提高人机协同性能,从而实现横纵向人机协同控制。
为了实现本发明的目的,本发明将采用如下所述的技术方案加以实施。
首先根据人机两者分别对对方操控信息的接收程度、各自对车辆状态的估计程度以及驾驶员神经肌肉延迟特性来建立信息不对称条件下的驾驶员和控制器的模型;然后考虑到人机冲突,采用博弈论来描述人机之间的耦合交互关系,并设计人机博弈横纵向协同控制策略,包含驾驶员和控制器的目标函数和驾驶权限分配策略的建立;最后,从理论层面推导达到博弈均衡时人机双方的最优控制策略,实现横纵向人机协同控制。本方法具体步骤如下:
一种人机博弈横纵向协同控制方法,包括如下所述的步骤:
步骤一、在信息不对称的条件下,建立驾驶员和控制器的模型;其中:
所述信息不对称是由于在实际驾驶过程中驾驶员和控制器各自获取对方操纵信息和估计车辆状态的方法和途径不同,所以人机协同控制过程中驾驶员和控制器对信息了解程度不一致形成的;
所述的驾驶员模型包括:
概率因子,根据驾驶员的驾驶技能、驾驶经验和驾驶风格综合判断驾驶员对控制器的操控信息的接收程度加以确定;
信息矩阵,根据驾驶员的驾驶技能、驾驶经验、先验知识和人机交互界面以及显示器功能建立的驾驶员对车辆状态的估计程度加以确定;所述信息矩阵包括:驾驶员单独驾驶时的信息矩阵和驾驶员在控制器辅助下协同控制时的信息矩阵;
所述的控制器模型包括:控制器的信息矩阵,根据驾驶员的神经肌肉延迟特性加以确定;
步骤二、利用博弈论将人机之间无意识竞争关系描述为博弈交互关系,并建立横向和纵向协同控制策略,所述协同控制策略包括:驾驶员和控制器目标函数和驾驶权限分配策略;其中,所述的驾驶员和控制器目标函数是根据迭代后得到的驾驶员和控制器的状态输出、各自的期望状态量和控制输入建立的;所述的驾驶权限分配策略是基于对横纵向风险场力的评估,同时考虑车辆速度变化来设计的;
步骤三、理论推导达到博弈均衡时人机双方最优控制策略,所述的最优控制策略包括驾驶员和控制器的最优控制策略;
步骤四、实现人机博弈横纵向协同控制。
作为本发明的优选方案,所述的驾驶员和控制器的模型,包括驾驶员的模型和控制器的模型,其中,
所述的驾驶员的模型为:
其中,ξd(t)为信息不对称条件下驾驶员估计的车辆状态量;为ξd(t)的一阶导;/>为驾驶员在控制器辅助下协同驾驶时估计的车辆状态量的一阶导;/>为驾驶员单独驾驶时估计的车辆状态量的一阶导;p为概率因子。驾驶员单独驾驶时估计的车辆状态量ξda(t)和在控制器辅助下协同驾驶时估计的车辆状态量ξsc(t)分别与车辆状态量ξ(t)之间的关系为:ξda(t)=Mdaξ(t),ξsc(t)=Mscξ(t),Mda为驾驶员单独驾驶时的信息矩阵;Msc为驾驶员在控制器辅助下协同控制时的信息矩阵;
所述的控制器的模型为:
其中,ξc(t)代表控制器估计的车辆状态量;为ξc(t)的一阶导;ud(t)为驾驶员的控制输入;uc(t)为控制器的控制输入;控制器对车辆状态量的估计ξc(t)与车辆状态量ξ(t)之间的关系为:ξc(t)=Mcξ(t),Mc为控制器的信息矩阵。
作为本发明的优选方案,所述的驾驶员和控制器的模型的建立过程:
首先,建立车辆动力学模型:
其中,Ccf和Ccr分别代表车辆前、后轮胎的侧偏刚度;m和Iz分别代表车辆质量和车辆的转动惯量;lf和lr分别代表车辆质心到其前轴和后轴的距离;r,δf,vx and vy分别代表横摆角、横摆角速度、前轮转角、纵向速度和横向速度;X和Y分别表示车辆的纵向和横向位移;a表示纵向加速度;
将上式转化为状态空间方程:
其中,ξ(t)代表车辆状态量, 代表ξ(t)的一阶导数;u(t)=[δf,a]T;
对状态空间方程进行泰勒级数展开,并进行离散化处理,可以得到:
ξ(k+1)=Ak,t(k)ξ(k)+Bk,t(k)u(k)+dk,t(k);
其中,ξ(k+1)代表k+1时刻车辆状态量;ξ(k)代表k时刻车辆状态量;u(k)代表k时刻控制量;
Ak,t(k)=I+TA(t),Bk,t(k)=TB(t),T为采样周期,
dk,t(k)=ξ(k+1)-Ak,t(k)ξ(k)-Bk,t(k)u(k);
在人机协同驾驶过程中,驾驶员和控制器都可以感知车辆状态和道路交通信息,做出相应的决策,共同参与车辆控制;因此将驾驶员和控制器的控制动作线性叠加后的结果作为车辆实际接收到的控制动作,如下式所示:
其中,λ代表驾驶权限,取值范围为0~1;δf代表车辆实际接受到的前轮转角;δd代表驾驶员施加的前轮转角;δc代表控制器施加的前轮转角;a代表车辆实际接受到的纵向加速度;ad代表驾驶员施加的纵向加速度;ac代表控制器施加的纵向加速度;
将状态空间方程和上式结合,得到共驾模式下车辆模型,表达式如下:
ξ(k+1)=Ak,t(k)ξ(k)+Bd,t(k)ud(k)+Bc,t(k)uc(k)+dk,t(k) (5)
其中,Bd,t(k)=λBk,t(k),Bc,t(k)=(1-λ)Bk,t(k),
ud(k)=[δd,ad]T,uc(k)=[δc,ac]T。
作为本发明的优选方案,所述的驾驶员和控制器目标函数是利用步骤一所述驾驶员和控制器的模型迭代后得到驾驶员和控制器的状态输出和各自的参考状态输出以及控制输入来建立的;
所述的驾驶权限分配策略是通过考虑车辆位置到道路边界的距离和道路限速计算横向和纵向风险场力,并考虑车辆速度的变化来设计的。
作为本发明的优选方案,所述的驾驶员和控制器目标函数表示式:
其中,Jd代表驾驶员的目标函数;Jc代表控制器的目标函数;Yd(k)代表迭代后得到的驾驶员的状态量输出;Yc(k)代表迭代后得到的控制器的状态量输出;Td(k)代表驾驶员的期望状态量;Tc(k)代表控制器的期望状态量;Q1、Q2、R1和R2均代表权重因子;δd(k)为预测时域内驾驶员施加的前轮转角控制序列;ad(k)为预测时域内驾驶员施加的纵向加速度控制序列;δc(k)为预测时域内控制器施加的前轮转角控制序列;ac(k)为预测时域内控制器施加的纵向加速度控制序列;
通过考虑车辆位置到道路边界的距离和道路限速来进行横纵向风险场力的计算,其表达式为:
其中,Fc代表横向风险场力;k1为常系数;k2为侧向坡度调整系数;m代表车辆质量;v代表车辆速度;yd为车辆重心到道路边界的距离;r0代表驾驶员对风险的关注范围;r1代表道路边界线的影响范围;D代表车道宽度;Fl代表纵向风险场力;vl,min和vl,nax分别表示道路所允许行驶的最低和最高车速;kx和ky分别表示车辆速度的纵向和横向梯度调整系数;xp和yp分别表示车辆与其他交通参与者在纵向和横向的距离;
基于所述的横纵向风险场力的评估,我们可以得到纵向和横向一体化风险评估模型;将横向风险场力Fc和纵向风险场力Fl进行归一化处理,可得到标准化的驾驶风险场力Fq;基于评估得到的驾驶风险场力Fq,建立考虑车辆速度变化的驾驶权限分配策略;驾驶权限的表达式:
其中,λ代表驾驶权限;ω1、ω2和ω3均为调优参数;
因此,信息不对称条件下人机博弈横纵向协同控制问题可以表述为:
其中,Jd代表驾驶员的目标函数;Jc代表控制器的目标函数;Yd(k)代表迭代后得到的驾驶员的状态量输出;Yc(k)代表迭代后得到的控制器的状态量输出;p为概率因子;ξsc(k)为驾驶员在控制器辅助下协同驾驶时k时刻估计的状态量;ξda(k)为驾驶员单独驾驶时k时刻估计的状态量;ξc(k)为控制器在k时刻估计的状态量;Ud(k)为预测时域Np内驾驶员的控制序列;Uc(k)为预测时域Np内控制器的控制序列;Ud(k-τ)为预测时域Np内考虑驾驶员神经肌肉延迟特性后控制器所接收到的驾驶员的控制序列;Φsc(k)为驾驶员在控制器辅助下协同驾驶时的状态干扰控制序列;Φda(k)为驾驶员单独驾驶时的状态干扰控制序列;Φc(k)为控制器的状态干扰控制序列;θd_sc、θc_sc和Γsc为驾驶员在控制器辅助下协同驾驶时的状态空间方程中系数矩阵在预测时域内迭代后的矩阵;/>θda和Γda为驾驶员单独驾驶时的状态空间方程中系数矩阵在预测时域内迭代后的矩阵;/>θc_d、θc_c和Γc为控制器的状态空间方程中系数矩阵在预测时域内迭代后的矩阵。
作为本发明的优选方案,所述的人机双方最优控制策略是基于步骤二中所述的人机之间博弈交互关系以及所述的横向和纵向协同控制策略,结合凸迭代辅助方程来求解最小二乘问题获得的。
作为本发明的优选方案,所述人机双方最优控制策略的理论推导过程:
根据博弈论中纳什均衡的概念,当博弈达到均衡时,存在一组控制输入(Ud *,Uc*)使得以下不等式关系成立:
其中,Jd(Ud *,Uc *)表示达到博弈均衡时驾驶员的目标函数;Jd(Ud,Uc *)表示在博弈均衡点处,驾驶员单方面改变自身控制策略后的驾驶员的目标函数;Jc(Ud *,Uc *)表示达到博弈均衡时控制器的目标函数;Jc(Ud *,Uc)表示在博弈均衡点处,控制器单方面改变自身控制策略后的控制器的目标函数;
要求解达到博弈均衡时人机双方最优控制策略,需满足上式所述博弈均衡条件;
首先,将控制器接收到考虑驾驶员神经肌肉延迟特性的驾驶员操纵信息Ud(k-τ)与Ud(k)进行转化:
Wk-τUd(k-τ)=WkUd(k);
其中,Wk-τ是Ud(k-τ)的信息提取矩阵;Wk是Ud(k)的信息提取矩阵;
然后,结合上式,将迭代后得到的驾驶员和控制器的状态输出带入到各自目标函数,将预测控制问题转化成求最小二乘问题;因此,最优控制序列Ud(k)*和Uc(k)*为如下最小二乘问题的解:
其中,p为概率因子;和/>均为权重因子;θd_sc、θda和θc_c均为状态空间方程中系数矩阵在预测时域内迭代后的矩阵;Ud(k)为预测时域内驾驶员的控制序列;Uc(k)为预测时域内控制器的控制序列;Ed(k)和Ec(k)均为偏差方程;
求解式可知,驾驶员最优控制策略Ud(k)*不仅与驾驶员自身估计的车辆状态和期望状态量有关,还与控制器控制动作有关;同理,控制器最优控制策略Uc(k)*与驾驶员控制动作有关;因此,两者控制动作存在着耦合关系。我们可以引入凸迭代辅助方程来进行求解,其表达式为:
其中,q表示迭代步数;当q→+∞,Ud(k)=Ud *(k)、Uc(k)=Uc *(k)。κ1、和κ2均为迭代权重值,取值范围0~1;
通过联立式可得到信息不对称条件下达到博弈均衡时驾驶员和控制器的最优控制策略。
作为本发明的优选方案,所述步骤四中的人机博弈横纵向协同控制的实现过程:
将求解出来的驾驶员和控制器最优控制动作,通过人机输入模式将驾驶员和控制器的最优控制动作进行线性叠加,其表达式为:
其中,δf和a分别代表车辆的前轮转角和纵向加速度;δd和ad分别代表驾驶员施加的前轮转角和纵向加速度;δc和ac分别代表控制器施加的前轮转角和纵向加速度;λ代表驾驶权限;
将线性叠加后得到前轮转角δf直接输入给车辆,对车辆横向运动进行控制;将线性叠加后得到的纵向加速度a输送给已标定的油门/刹车标定表,输出相应的油门开度或者制动主缸压力,对车辆纵向运动进行控制;从而实现横纵向人机协同控制。
有益效果
1.本发明针对研究中较少考虑信息不对称博弈以及普遍假设博弈模型是线性时不变,并忽略变化的车辆速度对横向共享控制的影响等问题,设计了一种信息不对称条件下考虑驾驶员特性的人机博弈横纵向协同控制框架,以逼真横纵向人机共驾模型,并提升横纵向人机协同控制性能。
2.根据驾驶员和控制器分别对对方操控信息的接收程度、各自对车辆状态的估计程度以及驾驶员神经肌肉延迟特性来确定概率因子p和信息矩阵M,以此建立信息不对称条件下的驾驶员和控制器的模型。
3.利用博弈论将人机无意识竞争关系描述为博弈交互关系,来处理人机之间冲突问题;并理论推导了达到博弈均衡时驾驶员和控制器的最优控制策略。
4.在对横纵向风险力评估的基础上,设计了考虑车辆速度的驾驶权限分配策略,以此为驾驶员提供不同程度的辅助。
附图说明
图1为本发明所述的一种人机博弈横纵向协同控制方法的流程简图;
图2为本发明所述的一种人机博弈横纵向协同控制方法的控制框架图;
图3为本发明所述的一种人机博弈横纵向协同控制方法的中概率因子p和信息矩阵M的相关因素示意图;
图4为本发明所述的一种人机博弈横纵向协同控制方法中的驾驶权限分配示意图,(a)为不同车速下驾驶权限分布曲线;(b)为驾驶权限分配的三维视图。
图5为本发明所述的一种人机博弈横纵向协同控制方法中信息不对称条件下人机博弈示意图;
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述:
作为本发明的实施例,如图1至图5所示,本发明的具体实施步骤如下:
步骤一、建立信息不对称条件下的驾驶员和控制器的模型:
首先,建立车辆动力学模型,如下:
其中,Ccf和Ccr分别代表车辆前、后轮胎的侧偏刚度;m和Iz分别代表车辆质量和车辆的转动惯量;lf和lr分别代表车辆质心到其前轴和后轴的距离;r,δf,vx and vy分别代表横摆角、横摆角速度、前轮转角、纵向速度和横向速度;X和Y分别表示车辆的纵向和横向位移;a表示纵向加速度。
将式(1)转化为状态空间方程:
其中,ξ(t)代表车辆状态量, 代表ξ(t)的一阶导数;u(t)=[δf,a]T。
对上述式(2)进行泰勒级数展开,并进行离散化处理,可以得到:
ξ(k+1)=Ak,t(k)ξ(k)+Bk,t(k)u(k)+dk,t(k) (3)
其中,ξ(k+1)代表k+1时刻车辆状态量;ξ(k)代表k时刻车辆状态量;u(k)代表k时刻控制量;
Ak,t(k)=I+TA(t),Bk,t(k)=TB(t),T为采样周期,
dk,t(k)=ξ(k+1)-Ak,t(k)ξ(k)-Bk,t(k)u(k)。
在人机协同驾驶过程中,驾驶员和控制器都可以感知车辆状态和道路交通信息,做出相应的决策,共同参与车辆控制。因此将驾驶员和控制器的控制动作线性叠加后的结果作为车辆实际接收到的控制动作,如式(4)所示:
其中,λ代表驾驶权限,取值范围为0~1;δf代表车辆实际接受到的前轮转角;δd代表驾驶员施加的前轮转角;δc代表控制器施加的前轮转角;a代表车辆实际接受到的纵向加速度;ad代表驾驶员施加的纵向加速度;ac代表控制器施加的纵向加速度。
将式(3)和式(4)结合,可得到共驾模式下车辆模型,表达式如下:
ξ(k+1)=Ak,t(k)ξ(k)+Bd,t(k)ud(k)+Bc,t(k)uc(k)+dk,t(k) (5)
其中,Bd,t(k)=λBk,t(k),Bc,t(k)=(1-λ)Bk,t(k),
ud(k)=[δd,ad]T,uc(k)=[δc,ac]T。
我们使用模型预测控制方法对驾驶员控制行为进行建模,将简化的车辆动力学模型作为驾驶员模型的预测模型。
基于上文所述,我们可以得到驾驶员单独驾驶时的驾驶员模型,表达式如下:
其中,ξda(t)为驾驶员单独驾驶时估计的状态量;为ξda(t)的一阶导数;ud(t)为驾驶员的控制输入。
将式(6)进行线性化和离散化处理,得到式(7):
ξda(k+1)=Ada(k)ξda(k)+Bda(k)ud(k)+dda(k) (7)
其中,ξda(k+1)为驾驶员单独驾驶时k+1时刻估计的状态量;ξda(k)为驾驶员单独驾驶时k时刻估计的状态量;ud(k)为k时刻驾驶员的控制输入;Ada(k)=Ak,t(k),Bda(k)=Bk,t(k),dda(k)=dk,t(k)。
基于上文所述,我们可以得到在控制器辅助下协同驾驶的驾驶员模型,表达式如下:
其中,ξsc(t)为驾驶员在控制器辅助下协同驾驶时估计的状态量;为ξsc(t)的一阶导数;ud(t)为驾驶员的控制输入;uc(t)为控制器的控制输入。
将式(8)进行线性化和离散化处理,得到式(9):
ξsc(k+1)=Asc(k)ξsc(k)+Bsc_d(k)ud(k)+Bsc_c(k)uc(k)+dsc(k) (9)
其中,ξsc(k+1)为驾驶员在控制器辅助下协同驾驶时k+1时刻估计的状态量;ξsc(k)为驾驶员在控制器辅助下协同驾驶时k时刻估计的状态量;ud(k)为k时刻驾驶员的控制输入;uc(k)为k时刻控制器的控制输入;
Asc(k)=Ak,t(k),Bsc_d(k)=Bd,t(k)=λBk,t(k),
dsc(k)=dk,t(k),Bsc_c(k)=Bc,t(k)=(1-λ)Bk,t(k)。
由此,我们得到了驾驶员单独驾驶和在控制器辅助下协同驾驶两种情况下的驾驶员模型。
在实际过程中,由于每个驾驶员的驾驶技能、驾驶经验和驾驶风格不同以及车内人机交互界面或者显示器功能的局限性而暂不能提供驾驶员所需要的全部信息,所以不同驾驶员对控制器的操纵信息的接受程度以及对车辆状态的估计程度是不同的,而且驾驶员几乎不可能掌握控制器的全部操纵信息以及车辆的全部状态量信息。因此,本发明采用概率因子p和信息矩阵M来建立信息不对称条件下驾驶员模型。
该概率因子p与驾驶员的驾驶技能、驾驶经验和驾驶风格有关,取值范围在0~1;当驾驶员驾驶技能高,驾驶员经验充足以及驾驶风格为稳重型,概率因子p值就越接近于1;反之,概率因子p值就越接近于0。它反映驾驶员对控制器的操纵信息接受程度,如图3所示。
该信息矩阵M与驾驶员的驾驶技能、驾驶经验、先验知识以及人机交互界面和显示器功能有关;信息矩阵M为对角矩阵,对角线上元素为0和1组成;驾驶员对车辆状态的估计数量越多且准确性越高,则元素1的数目越多。它来表示驾驶员估计的车辆状态与实际车辆状态之间的映射关系,反映驾驶员对车辆状态的估计程度。因此,驾驶员单独驾驶时估计的车辆状态量ξda(k)和在控制器辅助下协同驾驶时估计的车辆状态量ξsc(k)分别与车辆状态量ξ(k)之间的关系为:
ξda(k)=Mdaξ(k),ξsc(k)=Mscξ(k) (10)
其中,Mda为驾驶员单独驾驶时的信息矩阵;Msc为驾驶员在控制器辅助下协同控制时的信息矩阵。
综上,信息不对称下驾驶员模型由驾驶员单独驾驶时驾驶员模型、驾驶员在控制器辅助下协同驾驶时驾驶员模型、概率因子p以及信息矩阵来确定,其表达式如下:
其中,ξd(t)为信息不对称条件下驾驶员估计的车辆状态量;为ξd(t)的一阶导;/>为驾驶员在控制器辅助下协同驾驶时估计的车辆状态量的一阶导,其表达式如式(8)所示;/>为驾驶员单独驾驶时估计的车辆状态量的一阶导,其表达式如式(6)所示;p为概率因子。
将式(11)进行离散化处理,并联立式(7)和式(9),得下式:
此外,控制器在实际车辆行驶过程中可以根据传感器等硬件较全面且精确接收到驾驶员的操纵信息和车辆状态,所以控制器对信息的掌握程度要比驾驶员的掌握程度要高。考虑到现有传感器精度较高,可以假设控制器能够完全知道驾驶员的操纵信息以及车辆状态信息。控制器对车辆状态量的估计ξc(t)与车辆状态量ξ(t)之间的关系可以表示为:
ξc(t)=Mcξ(t) (13)
其中,Mc为控制器的信息矩阵。
同时由于驾驶员具有神经肌肉延迟特性,驾驶员大脑决定的控制动作要经过一段时间才能传递给控制器。为了提高模型的真实性以及减少驾驶员神经肌肉延迟特性对车辆控制精度的影响,因此有必要考虑驾驶员神经肌肉延迟特性。假设驾驶员神经肌肉延迟时间为t1,系统采样周期为T,则驾驶员大脑绝对的控制动作经过τ周期后传递给控制器,其中延迟周期τ=t1/T。
在此基础上,基于动力学模型,利用模型预测控制方法来建立信息不对称条件下考虑驾驶员神经肌肉延迟特性的控制器模型,表达式如下:
其中,ξc(t)代表控制器估计的车辆状态量;为ξc(t)的一阶导;ud(t)为驾驶员的控制输入;uc(t)为控制器的控制输入。
将式(14)进行线性化和离散化处理,得到下式:
ξc(k+1)=Ac(k)ξc(k)+Bc_d(k)ud(k-τ)+Bc_c(k)uc(k)+dc(k) (15)
其中,ξc(k+1)为控制器k+1时刻估计的状态量;ξc(k)为控制器k时刻估计的状态量;uc(k)为k时刻控制器的控制输入;ud(k-τ)为考虑驾驶员神经肌肉延迟特性后控制器在k时刻所接收到的驾驶员的控制输入;τ为延迟周期。
Ac(k)=Ak,t(k),Bc_d(k)=Bd,t(k)=λBk,t(k),
dc(k)=dk,t(k),Bc_c(k)=Bc,t(k)=(1-λ)Bk,t(k)。
步骤二、设计人机博弈横向和纵向协同控制策略:
在人机共驾过程中,驾驶员和控制器不断地交互各自的控制策略,并分别依据对方的控制策略来不断地调整自身的控制策略,使得自身目标函数最小,以追求自身最大收益;在驾驶员和控制器追求自身最大收益时,人机之间不免形成竞争关系,产生人机冲突。本步骤利用博弈论将人机之间无意识竞争关系描述为博弈交互关系,以此来处理人机之间冲突问题;并设计横纵向协同控制策略,包含驾驶员和控制器目标函数和驾驶权限分配策略的建立,其中根据迭代后得到的驾驶员和控制器的状态输出、各自的期望状态量和控制输入来建立目标函数,以追求路径跟踪性能和操纵平顺性;基于横纵向风险力的评估,并考虑车速变化来设计驾驶权限分配策略,从而为驾驶员提供不同程度地辅助,具体方式如下:
首先,将步骤一中信息不对称条件下驾驶员和控制器的离散后的状态空间方程进行迭代,得到驾驶员和控制器的状态输出方程。驾驶员的状态输出方程如式(16)所示:
同理,控制器的状态输出方程如式(17)所示:
其中,Yd(k)代表迭代后得到的驾驶员的状态量输出;Yc(k)代表迭代后得到的控制器的状态量输出;p为概率因子;ξsc(k)为驾驶员在控制器辅助下协同驾驶时k时刻估计的状态量;ξda(k)为驾驶员单独驾驶时k时刻估计的状态量;ξc(k)为控制器在k时刻估计的状态量;Ud(k)为预测时域Np内驾驶员的控制序列;Uc(k)为预测时域Np内控制器的控制序列;Ud(k-τ)为预测时域Np内考虑驾驶员神经肌肉延迟特性后控制器所接收到的驾驶员的控制序列;Np是预测时域;Nc是控制时域。
/>
然后,根据迭代后得到的驾驶员和控制器的状态量输出、各自的期望状态量和控制输入(包含各自施加的前轮转角和纵向加速度)来建立驾驶员和控制器的目标函数,以追求路径跟踪性能和操纵平顺性,提高人机横纵向协同性能目标函数如下:
其中,Jd代表驾驶员的目标函数;Jc代表控制器的目标函数;Yd(k)代表迭代后得到的驾驶员的状态量输出;Yc(k)代表迭代后得到的控制器的状态量输出;Td(k)代表驾驶员的期望状态量;Tc(k)代表控制器的期望状态量;Q1、Q2、R1和R2均代表权重因子;δd(k)为预测时域内驾驶员施加的前轮转角控制序列;ad(k)为预测时域内驾驶员施加的纵向加速度控制序列;δc(k)为预测时域内控制器施加的前轮转角控制序列;ac(k)为预测时域内控制器施加的纵向加速度控制序列。
接着,通过考虑车辆位置到道路边界的距离和道路限速来进行横纵向风险场力的计算;同时考虑车辆速度的变化来设计驾驶权限分配策略,以此能够根据实际情况为驾驶员提供不同程度的辅助。
一般来说,道路边界线能对车辆横向运动有约束作用。为了避免车辆与道路边界发生碰撞,建立道路边界势场来描述车道线对车辆的约束。当车辆接近道路边界时,道路边界势场力会逐渐增大。因此我们可以用式(19)来描述横向风险场力:
其中,Fc代表横向风险场力;k1为常系数;k2为侧向坡度调整系数;m代表车辆质量;v代表车辆速度;yd为车辆重心到道路边界的距离;r0代表驾驶员对风险的关注范围;r1代表道路边界线的影响范围;D代表车道宽度。
道路纵向速度限制是指车辆在道路上沿某一特定方向行驶时所允许的最高和最低速度。当车辆超过道路上的最高速度限制或低于道路上的最低速度限制时,驾驶员的操作行为不仅违反了交通规则,而且对附近行驶的其他车辆构成威胁。因此我们可以用式(20)来描述纵向风险场力:
其中,Fl代表纵向风险场力;m代表车辆质量;vl,min和vl,nax分别表示道路所允许行驶的最低和最高车速;r0代表驾驶员对风险的关注范围;r1代表道路边界线的影响范围;kx和ky分别表示车辆速度的纵向和横向梯度调整系数;xp和yp分别表示车辆与其他交通参与者在纵向和横向的距离。
基于所述的横纵向风险场力的评估,我们可以得到纵向和横向一体化风险评估模型;将横向风险场力Fc和纵向风险场力Fl进行归一化处理,可得到标准化的驾驶风险场力Fq,其表达式如下:
基于标准化的驾驶风险场力Fq,设计了驾驶权限的分配策略。在接管过程中,要考虑到驾驶员在恐慌情况下做出的决策不够理性,希望在驾驶风险场力Fq较大时,能够增加控制器的驾驶权重,以保证车辆能够规避风险;反之,驾驶员的驾驶权重占比高些。
另外在实际行驶过程中,车辆速度的变化会影响车辆的稳定性和安全性,因此在设计驾驶权限分配策略时有必要考虑车辆速度这一因素。我们希望速度越高,驾驶权限分布曲线随标准化的驾驶风险场力Fq的增大而下降得越快,从而使驾驶权限更快地转移给控制器,以保证接管过程的安全。
综合考虑驾驶风险场力Fq和车辆速度v这两方面来设计驾驶权限分配策略,我们可以用式(22)来描述:
其中,λ代表驾驶权限;ω1、ω2和ω3均为调优参数。
综上所述,在信息不对称条件下考虑驾驶员特性的人机博弈横纵向协同控制问题可以描述为:
步骤三、理论推导达到博弈均衡时人机双方最优控制策略:
根据博弈论中纳什均衡的概念,当博弈达到均衡时,存在一组控制输入(Ud *,Uc*)使得以下不等式关系成立:
其中,Jd(Ud *,Uc *)表示达到博弈均衡时驾驶员的目标函数;Jd(Ud,Uc *)表示在博弈均衡点处,驾驶员单方面改变自身控制策略后的驾驶员的目标函数;Jc(Ud *,Uc *)表示达到博弈均衡时控制器的目标函数;Jc(Ud *,Uc)表示在博弈均衡点处,控制器单方面改变自身控制策略后的控制器的目标函数。
因此当达到博弈均衡时,没有人可以通过单方面改变自身控制策略来获得更好的结果。
基于步骤二中所述的人机博弈横纵向协同控制策略,我们可以将求解达到博弈均衡时人机双方最优控制策略问题转化成求解式(23)。首先我们将驾驶员和控制器各自状态量输出方程带入各自目标函数中去,将求解式(23)问题转化成求解最小二乘问题;然后结合凸迭代辅助方程来处理驾驶员和控制器两者控制动作耦合交互问题;最后获得达到博弈均衡时驾驶员和控制器的最优控制策略,具体方式如下:
首先,将驾驶员和控制器各自状态输出方程带入到各自目标函数(Jd和Jc),即将式(16)和式(17)带入到式(18),可得下式:
其中,权重因子Qj=SQj TSQj,Rj=SRj TSRj,j=1,2;
/>
将考虑驾驶员神经肌肉延迟特性后得到的控制序列Ud(k-τ)与Ud(k)进行转化:
Wk-τUd(k-τ)=WkUd(k) (26)
其中,
因此,最优控制序列Ud(k)*和Uc(k)*为如下最小二乘问题的解:
为了提高计算结果的准确性和减少计算时间,可采用正交三角分解法来求解最小二乘问题。因此,驾驶员的最优控制序列Ud(k)*和控制器的最优控制序列Uc(k)*可以得到如下形式:
然后,由式(28)可知,驾驶员的最优控制序列Ud(k)*不仅取决于驾驶员自身的期望状态量Td(k)和估计的车辆系统状态ξsc(k)、ξda(k),还取决于控制器的控制序列Uc(k)。同样地,控制器的最优控制序列Uc(k)*也取决于驾驶员的控制序列Ud(k)。因此我们可以得知驾驶员和控制器的最优控制策略是相互耦合的,博弈双方优化问题的求解需要知道对方的优化结果,所以直接求解最优控制策略是不可能的。为了解决这个问题,我们可以使用凸迭代辅助方程:
其中,q表示迭代步数;当q→+∞,Ud(k)=Ud *(k)、Uc(k)=Uc *(k)。κ1、和κ2均为迭代权重值,取值范围0~1。
最后,联立式(28)和式(29),可获得达到博弈均衡时驾驶员和控制器的最优控制策略;驾驶员和控制器最优控制序列表达式如下:
其中,
步骤四、实现信息不对称条件下人机博弈横纵向协同控制:
首先分别提取步骤三中求解出来的驾驶员和控制器的最优控制序列Ud(k)*、Uc(k)*的第一项,然后通过人机输入模式将驾驶员和控制器的最优控制动作进行线性叠加,最后作用于车辆,从而实现横纵向协同控制,具体方式如下:
首先,按照式(31)提取步骤三中求解出来的驾驶员和控制器的最优控制序列Ud(k)*、Uc(k)*的第一项,作为未来k时刻驾驶员和控制器的最优控制动作ud(k)*、uc(k)*,具体表达式如下:
其中,ud(k)*=[δd,ad]T,uc(k)*=[δc,ac]T;δd和ad分别代表驾驶员施加的前轮转角和纵向加速度;δc和ac分别代表控制器施加的前轮转角和纵向加速度。
然后根据人机输入模式将驾驶员和控制器的最优控制动作ud(k)*、uc(k)*进行线性叠加,可得到未来k时刻车辆的前轮转角δf和纵向加速度a,如下式所示:
其中,λ代表驾驶权限。
最后,将得到的前轮转角δf直接作为车辆的输入,进而对车辆横向运动进行控制;将得到的纵向加速度a输入到已标定的油门/刹车标定表,可得到相应的油门开度或者制动主缸压力,进而对车辆纵向运动进行控制;通过得到的前轮转角δf以及油门开度或者制动主缸压力来实现信息不对称条件下考虑驾驶员特性的人机博弈横纵向协同控制。
上面结合实施例/附图对本发明的技术方案作了详细说明,但是本发明并不限于上述技术方案,对于本技术领域的普通技术人员来说,在获知本发明中记载内容后,在不脱离本发明原理的前提下,还可以对其作出若干同等变换和替代,这些同等变换和替代也应视为属于本发明的保护范围。
Claims (8)
1.一种人机博弈横纵向协同控制方法,其特征在于,包括如下所述的步骤:
步骤一、在信息不对称的条件下,建立驾驶员和控制器的模型;其中:
所述信息不对称是由于在实际驾驶过程中驾驶员和控制器各自获取对方操纵信息和估计车辆状态的方法和途径不同,所以人机协同控制过程中驾驶员和控制器对信息了解程度不一致形成的;
所述的驾驶员模型包括:
概率因子,根据驾驶员的驾驶技能、驾驶经验和驾驶风格综合判断驾驶员对控制器的操控信息的接收程度加以确定;
驾驶员的信息矩阵,根据驾驶员的驾驶技能、驾驶经验、先验知识和人机交互界面以及显示器功能建立的驾驶员对车辆状态的估计程度加以确定;所述信息矩阵包括:驾驶员单独驾驶时的信息矩阵和驾驶员在控制器辅助下协同控制时的信息矩阵;
所述的控制器模型包括:控制器的信息矩阵,根据驾驶员的神经肌肉延迟特性加以确定;
步骤二、利用博弈论将人机之间无意识竞争关系描述为博弈交互关系,并建立横向和纵向协同控制策略,所述协同控制策略包括:驾驶员和控制器目标函数和驾驶权限分配策略;其中,所述的驾驶员和控制器目标函数是根据驾驶员和控制器的模型迭代后得到的驾驶员和控制器的状态输出、各自的期望状态量和控制输入建立的;所述的驾驶权限分配策略是基于对横纵向风险场力的评估,同时考虑车辆速度变化来设计的;
步骤三、理论推导达到博弈均衡时人机双方最优控制策略,所述的最优控制策略包括驾驶员和控制器的最优控制策略;
步骤四、实现人机博弈横纵向协同控制。
2.根据权利要求1所述的一种人机博弈横纵向协同控制方法,其特征在于,
所述的驾驶员和控制器的模型,包括驾驶员的模型和控制器的模型,其中,
所述的驾驶员的模型为:
其中,ξd(t)为信息不对称条件下驾驶员估计的车辆状态量;为ξd(t)的一阶导;为驾驶员在控制器辅助下协同驾驶时估计的车辆状态量的一阶导;/>为驾驶员单独驾驶时估计的车辆状态量的一阶导;p为概率因子。驾驶员单独驾驶时估计的车辆状态量ξda(t)和在控制器辅助下协同驾驶时估计的车辆状态量ξsc(t)分别与车辆状态量ξ(t)之间的关系为:ξda(t)=Mdaξ(t),ξsc(t)=Mscξ(t),Mda为驾驶员单独驾驶时的信息矩阵;Msc为驾驶员在控制器辅助下协同控制时的信息矩阵;
所述的控制器的模型为:
其中,ξc(t)代表控制器估计的车辆状态量;为ξc(t)的一阶导;ud(t)为驾驶员的控制输入;uc(t)为控制器的控制输入;控制器对车辆状态量的估计ξc(t)与车辆状态量ξ(t)之间的关系为:ξc(t)=Mcξ(t),Mc为控制器的信息矩阵。
3.根据权利要求2所述的一种人机博弈横纵向协同控制方法,其特征在于:所述的驾驶员和控制器的模型的建立过程:
首先,建立车辆动力学模型:
其中,Ccf和Ccr分别代表车辆前、后轮胎的侧偏刚度;m和Iz分别代表车辆质量和车辆的转动惯量;lf和lr分别代表车辆质心到其前轴和后轴的距离;r,δf,vx and vy分别代表横摆角、横摆角速度、前轮转角、纵向速度和横向速度;X和Y分别表示车辆的纵向和横向位移;a表示纵向加速度;
将上式转化为状态空间方程:
其中,ξ(t)代表车辆状态量, 代表ξ(t)的一阶导数;u(t)=[δf,a]T;
对状态空间方程进行泰勒级数展开,并进行离散化处理,可以得到:
ξ(k+1)=Ak,t(k)ξ(k)+Bk,t(k)u(k)+dk,t(k);
其中,ξ(k+1)代表k+1时刻车辆状态量;ξ(k)代表k时刻车辆状态量;u(k)代表k时刻控制量;
Ak,t(k)=I+TA(t),Bk,t(k)=TB(t),T为采样周期,
dk,t(k)=ξ(k+1)-Ak,t(k)ξ(k)-Bk,t(k)u(k);
在人机协同驾驶过程中,驾驶员和控制器都可以感知车辆状态和道路交通信息,做出相应的决策,共同参与车辆控制;因此将驾驶员和控制器的控制动作线性叠加后的结果作为车辆实际接收到的控制动作,如下式所示:
其中,λ代表驾驶权限,取值范围为0~1;δf代表车辆实际接受到的前轮转角;δd代表驾驶员施加的前轮转角;δc代表控制器施加的前轮转角;a代表车辆实际接受到的纵向加速度;ad代表驾驶员施加的纵向加速度;ac代表控制器施加的纵向加速度;
将状态空间方程和上式结合,得到共驾模式下车辆模型,表达式如下:
ξ(k+1)=Ak,t(k)ξ(k)+Bd,t(k)ud(k)+Bc,t(k)uc(k)+dk,t(k) (5)
其中,Bd,t(k)=λBk,t(k),Bc,t(k)=(1-λ)Bk,t(k),
ud(k)=[δd,ad]T,uc(k)=[δc,ac]T。
4.根据权利要求1所述的一种人机博弈横纵向协同控制方法,其特征在于:所述的驾驶员和控制器目标函数是利用步骤一所述驾驶员和控制器的模型迭代后得到驾驶员和控制器的状态输出和各自的参考状态输出以及控制输入来建立的;
所述的驾驶权限分配策略是通过考虑车辆位置到道路边界的距离和道路限速计算横向和纵向风险场力,并考虑车辆速度的变化来设计的。
5.根据权利要求4所述的一种人机博弈横纵向协同控制方法,其特征在于,所述的驾驶员和控制器目标函数表示式:
其中,Jd代表驾驶员的目标函数;Jc代表控制器的目标函数;Yd(k)代表迭代后得到的驾驶员的状态量输出;Yc(k)代表迭代后得到的控制器的状态量输出;Td(k)代表驾驶员的期望状态量;Tc(k)代表控制器的期望状态量;Q1、Q2、R1和R2均代表权重因子;δd(k)为预测时域内驾驶员施加的前轮转角控制序列;ad(k)为预测时域内驾驶员施加的纵向加速度控制序列;δc(k)为预测时域内控制器施加的前轮转角控制序列;ac(k)为预测时域内控制器施加的纵向加速度控制序列;
通过考虑车辆位置到道路边界的距离和道路限速来进行横纵向风险场力的计算,其表达式为:
其中,Fc代表横向风险场力;k1为常系数;k2为侧向坡度调整系数;m代表车辆质量;v代表车辆速度;yd为车辆重心到道路边界的距离;r0代表驾驶员对风险的关注范围;r1代表道路边界线的影响范围;D代表车道宽度;Fl代表纵向风险场力;vl,min和vl,nax分别表示道路所允许行驶的最低和最高车速;kx和ky分别表示车辆速度的纵向和横向梯度调整系数;xp和yp分别表示车辆与其他交通参与者在纵向和横向的距离;
基于所述的横纵向风险场力的评估,我们可以得到纵向和横向一体化风险评估模型;将横向风险场力Fc和纵向风险场力Fl进行归一化处理,可得到标准化的驾驶风险场力Fq;基于评估得到的驾驶风险场力Fq,建立考虑车辆速度变化的驾驶权限分配策略;驾驶权限的表达式:
其中,λ代表驾驶权限;ω1、ω2和ω3均为调优参数;
因此,信息不对称条件下人机博弈横纵向协同控制问题可以表述为:
其中,Jd代表驾驶员的目标函数;Jc代表控制器的目标函数;Yd(k)代表迭代后得到的驾驶员的状态量输出;Yc(k)代表迭代后得到的控制器的状态量输出;p为概率因子;ξsc(k)为驾驶员在控制器辅助下协同驾驶时k时刻估计的状态量;ξda(k)为驾驶员单独驾驶时k时刻估计的状态量;ξc(k)为控制器在k时刻估计的状态量;Ud(k)为预测时域Np内驾驶员的控制序列;Uc(k)为预测时域Np内控制器的控制序列;Ud(k-τ)为预测时域Np内考虑驾驶员神经肌肉延迟特性后控制器所接收到的驾驶员的控制序列;Φsc(k)为驾驶员在控制器辅助下协同驾驶时的状态干扰控制序列;Φda(k)为驾驶员单独驾驶时的状态干扰控制序列;Φc(k)为控制器的状态干扰控制序列;θd_sc、θc_sc和Γsc为驾驶员在控制器辅助下协同驾驶时的状态空间方程中系数矩阵在预测时域内迭代后的矩阵;/>θda和Γda为驾驶员单独驾驶时的状态空间方程中系数矩阵在预测时域内迭代后的矩阵;/>θc_d、θc_c和Γc为控制器的状态空间方程中系数矩阵在预测时域内迭代后的矩阵。
6.根据权利要求1所述的一种人机博弈横纵向协同控制方法,其特征在于,所述的人机双方最优控制策略是基于步骤二中所述的人机之间博弈交互关系以及所述的横向和纵向协同控制策略,结合凸迭代辅助方程来求解最小二乘问题获得的。
7.根据权利要求6所述的一种人机博弈横纵向协同控制方法,其特征在于,所述人机双方最优控制策略的理论推导过程:
根据博弈论中纳什均衡的概念,当博弈达到均衡时,存在一组控制输入(Ud *,Uc*)使得以下不等式关系成立:
其中,Jd(Ud *,Uc *)表示达到博弈均衡时驾驶员的目标函数;Jd(Ud,Uc *)表示在博弈均衡点处,驾驶员单方面改变自身控制策略后的驾驶员的目标函数;Jc(Ud *,Uc *)表示达到博弈均衡时控制器的目标函数;Jc(Ud *,Uc)表示在博弈均衡点处,控制器单方面改变自身控制策略后的控制器的目标函数;
要求解达到博弈均衡时人机双方最优控制策略,需满足上式所述博弈均衡条件;
首先,将控制器接收到考虑驾驶员神经肌肉延迟特性的驾驶员操纵信息Ud(k-τ)与Ud(k)进行转化:
Wk-τUd(k-τ)=WkUd(k);
其中,Wk-τ是Ud(k-τ)的信息提取矩阵;Wk是Ud(k)的信息提取矩阵;
然后,结合上式,将迭代后得到的驾驶员和控制器的状态输出带入到各自目标函数,将预测控制问题转化成求最小二乘问题;因此,最优控制序列Ud(k)*和Uc(k)*为如下最小二乘问题的解:
其中,p为概率因子;和/>均为权重因子;θd_sc、θda和θc_c均为状态空间方程中系数矩阵在预测时域内迭代后的矩阵;Ud(k)为预测时域内驾驶员的控制序列;Uc(k)为预测时域内控制器的控制序列;Ed(k)和Ec(k)均为偏差方程;
求解式可知,驾驶员最优控制策略Ud(k)*不仅与驾驶员自身估计的车辆状态和期望状态量有关,还与控制器控制动作有关;同理,控制器最优控制策略Uc(k)*与驾驶员控制动作有关;因此,两者控制动作存在着耦合关系。我们可以引入凸迭代辅助方程来进行求解,其表达式为:
其中,q表示迭代步数;当q→+∞,Ud(k)=Ud *(k)、Uc(k)=Uc *(k)。κ1、和κ2均为迭代权重值,取值范围0~1;
通过联立式可得到信息不对称条件下达到博弈均衡时驾驶员和控制器的最优控制策略。
8.根据权利要求1所述的一种人机博弈横纵向协同控制方法,其特征在于,所述步骤四中的人机博弈横纵向协同控制的实现过程:
将求解出来的驾驶员和控制器最优控制动作,通过人机输入模式将驾驶员和控制器的最优控制动作进行线性叠加,其表达式为:
其中,δf和a分别代表车辆的前轮转角和纵向加速度;δd和ad分别代表驾驶员施加的前轮转角和纵向加速度;δc和ac分别代表控制器施加的前轮转角和纵向加速度;λ代表驾驶权限;
将线性叠加后得到前轮转角δf直接输入给车辆,对车辆横向运动进行控制;将线性叠加后得到的纵向加速度a输送给已标定的油门/刹车标定表,输出相应的油门开度或者制动主缸压力,对车辆纵向运动进行控制;从而实现横纵向人机协同控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410079675.3A CN117775015A (zh) | 2024-01-19 | 2024-01-19 | 一种人机博弈横纵向协同控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410079675.3A CN117775015A (zh) | 2024-01-19 | 2024-01-19 | 一种人机博弈横纵向协同控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117775015A true CN117775015A (zh) | 2024-03-29 |
Family
ID=90396450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410079675.3A Pending CN117775015A (zh) | 2024-01-19 | 2024-01-19 | 一种人机博弈横纵向协同控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117775015A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150336587A1 (en) * | 2014-05-20 | 2015-11-26 | Toyota Jidosha Kabushiki Kaisha | Driving assist device |
CN111717207A (zh) * | 2020-07-09 | 2020-09-29 | 吉林大学 | 一种考虑人车冲突的协同转向控制方法 |
CN112907967A (zh) * | 2021-01-29 | 2021-06-04 | 吉林大学 | 一种基于不完全信息博弈的智能车换道决策方法 |
CN113200056A (zh) * | 2021-06-22 | 2021-08-03 | 吉林大学 | 一种非完全信息非合作博弈人机共驾控制方法 |
CN113553726A (zh) * | 2021-08-06 | 2021-10-26 | 吉林大学 | 一种冰雪环境下的主从博弈型人机协同转向控制方法 |
CN116443017A (zh) * | 2022-01-06 | 2023-07-18 | 长春工业大学 | 一种基于自适应权重博弈的智能汽车驾驶权分配方法 |
CN116729417A (zh) * | 2023-05-22 | 2023-09-12 | 南京航空航天大学 | 一种基于非合作博弈的人机共驾横纵向联合控制方法 |
-
2024
- 2024-01-19 CN CN202410079675.3A patent/CN117775015A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150336587A1 (en) * | 2014-05-20 | 2015-11-26 | Toyota Jidosha Kabushiki Kaisha | Driving assist device |
CN111717207A (zh) * | 2020-07-09 | 2020-09-29 | 吉林大学 | 一种考虑人车冲突的协同转向控制方法 |
CN112907967A (zh) * | 2021-01-29 | 2021-06-04 | 吉林大学 | 一种基于不完全信息博弈的智能车换道决策方法 |
CN113200056A (zh) * | 2021-06-22 | 2021-08-03 | 吉林大学 | 一种非完全信息非合作博弈人机共驾控制方法 |
CN113553726A (zh) * | 2021-08-06 | 2021-10-26 | 吉林大学 | 一种冰雪环境下的主从博弈型人机协同转向控制方法 |
CN116443017A (zh) * | 2022-01-06 | 2023-07-18 | 长春工业大学 | 一种基于自适应权重博弈的智能汽车驾驶权分配方法 |
CN116729417A (zh) * | 2023-05-22 | 2023-09-12 | 南京航空航天大学 | 一种基于非合作博弈的人机共驾横纵向联合控制方法 |
Non-Patent Citations (2)
Title |
---|
刘俊等: "一种驾驶权动态调整的人机主从博弈共驾方法", 中国公路学报, vol. 35, no. 3, 31 March 2022 (2022-03-31), pages 127 - 138 * |
薛春铭等: "基于博弈论的人类驾驶与无人驾驶协作换道模型", 计算机工程, vol. 43, no. 12, 15 December 2017 (2017-12-15), pages 261 - 266 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Coordination control of differential drive assist steering and vehicle stability control for four-wheel-independent-drive EV | |
CN112733270B (zh) | 车辆行驶轨迹预测和轨迹偏离危险度评估的系统与方法 | |
CN113386781B (zh) | 一种基于数据驱动车辆动力学模型的智能车辆轨迹跟踪控制方法 | |
CN110827535B (zh) | 非线性车辆队列协同自适应抗扰纵向控制方法 | |
CN106154831B (zh) | 一种基于学习法的智能汽车纵向神经滑模控制方法 | |
Dai et al. | Optimum tyre force distribution for four-wheel-independent drive electric vehicle with active front steering | |
Regolin et al. | A sliding-mode virtual sensor for wheel forces estimation with accuracy enhancement via EKF | |
CN107600176B (zh) | 一种基于可拓控制理论的智能车辆主动转向控制方法 | |
CN114510063B (zh) | 一种无人履带车辆及其轨迹跟踪控制方法和系统 | |
CN114379583A (zh) | 一种基于神经网络动力学模型的自动驾驶车辆轨迹跟踪系统及方法 | |
Bobier | A phase portrait approach to vehicle stabilization and envelope control | |
CN110217227A (zh) | 一种适用于冰雪道路工况的转向制动联合避撞控制方法 | |
CN113485125A (zh) | 一种适用于任意通信拓扑的含时滞车辆队列稳定性控制方法及系统 | |
CN115179963A (zh) | 自动驾驶车辆换道的容错控制方法、介质、系统及汽车 | |
CN110027547A (zh) | 车辆横向控制方法和装置 | |
Liu et al. | Vehicle state estimation based on unscented Kalman filtering and a genetic-particle swarm algorithm | |
Chen et al. | Estimation of road-tire friction with unscented Kalman filter and MSE-weighted fusion based on a modified Dugoff tire model | |
Chen et al. | Sideslip angle fusion estimation method of three-axis autonomous vehicle based on composite model and adaptive cubature Kalman filter | |
CN117775015A (zh) | 一种人机博弈横纵向协同控制方法 | |
CN114537419A (zh) | 一种考虑驾驶员活跃度及驾驶能力的辅助控制器设计方法 | |
Hakima et al. | Improvement of vehicle handling by an integrated control system of four wheel steering and ESP with fuzzy logic approach | |
CN110471277A (zh) | 基于输出反馈增益规划的智能商用车自动循迹控制方法 | |
Wang | Control system design for autonomous vehicle path following and collision avoidance | |
CN112327626A (zh) | 基于数据分析的飞行器通道耦合协调控制方法 | |
Ding et al. | Estimation method of vehicle centroid sideslip angle based on DNN-EKF fusion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |