CN108646734B - 基于量子粒子群算法的非线性模型预测控制方法 - Google Patents
基于量子粒子群算法的非线性模型预测控制方法 Download PDFInfo
- Publication number
- CN108646734B CN108646734B CN201810394482.1A CN201810394482A CN108646734B CN 108646734 B CN108646734 B CN 108646734B CN 201810394482 A CN201810394482 A CN 201810394482A CN 108646734 B CN108646734 B CN 108646734B
- Authority
- CN
- China
- Prior art keywords
- vehicle
- control
- cost function
- particle
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002245 particle Substances 0.000 title claims abstract description 114
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005457 optimization Methods 0.000 claims abstract description 42
- 238000013461 design Methods 0.000 claims abstract description 32
- 230000008859 change Effects 0.000 claims description 16
- 230000001133 acceleration Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 239000004743 Polypropylene Substances 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- -1 polypropylene Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005610 quantum mechanics Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0223—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving speed control of the vehicle
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0212—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
- G05D1/0221—Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
- G05D1/021—Control of position or course in two dimensions specially adapted to land vehicles
- G05D1/0276—Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明涉及无人驾驶汽车控制领域,为提出采用量子粒子群算法并行设计的方案,确保控制输出满足车辆物理限制和人体舒适度要求,使车辆更好地适应当前路况。为此,本发明采取的技术方案是,基于量子粒子群算法的非线性模型预测控制方法,首先建立基于无人驾驶汽车的运动学模型,并将其进行离散化;在此基础上采用广义拉格朗日乘子法构造具有惩罚项和鼓励项的广义代价函数,从而将约束问题转化为无约束问题;接下来,进行量子粒子群算法的并行设计,并用其对模型预测控制的代价函数进行优化求解,得到一系列的控制量,最后将控制量的第一个分量作用到汽车上。本发明主要应用于无人驾驶汽车控制场合。
Description
技术领域
本发明涉及无人驾驶汽车控制领域,尤其是涉及一种并行设计的量子粒子群算法优化求解非线性模型预测控制在无人驾驶汽车轨迹跟踪时的代价函数的方法。
背景技术
模型预测控制是一种先进的控制算法,由于其独特的预测能力,在许多领域具有良好的控制效果,并在许多生产过程中得到了广泛的应用。然而模型预测控制需要在每一采样时刻,根据当前的测量信息,在线求解一个有限时域开环优化问题,这个过程会消耗很多时间。为了提高算法的快速性,人们引入了控制时域的概念。当预测时域大于控制时域时,将不再进行优化求解,而是把最后一个控制时刻求解出的控制量,作为今后时刻的控制输出。但是这样的处理方式在一定程度上降低了优化的自由度。为了提高模型预测控制的优化求解速度,许多研究者尝试各种快速优化求解的方法,主要分为以下两个方面:
1)算法性能优化,包括引入自适应时域和先进算法加速优化求解过程。为了将模型预测控制更好地应用于快速响应系统,基于二叉树的小波变换和多尺度过程模型在自适应预测时域得到应用。在优化算法方面,序列二次规划算法是求解非线性优化问题的常用有效方法。但由于其是一种基于梯度的优化算法,只有在非线性规划是凸的时候,才能保证解的存在,并收敛到全局最优。随着复杂性和规模的不断增加,随机优化方法和智能优化算法开始进入人们的视野,如遗传算法,粒子群优化算法。其中,遗传算法具有较强的全局搜索能力,不依赖于初始值的选取。然而,随着时域的增大,在线计算成本开始成倍增加,使得求解过程变得缓慢。粒子群算法是一种基于种群的模拟鸟类捕食过程的搜索算法,通过个体间信息交互,种群向最可能的问题解决点聚集。
2)算法硬件实现。现场可编程门阵列(FPGA)的并行特性经常用来加快算法的求解速度。而想利用FPGA的这种并行特性实现硬件加速,基本的要求是算法可以并行展开,并且算法比较容易在FPGA实现。文献表明,粒子群算法满足上述要求,并取得了良好的控制效果。但是传统的粒子群算法,其粒子的运动状态是用位置和速度来描述的,随着时间演化,粒子的运动轨迹是既定的。同时,粒子的移动速度受到一定的限制,使得粒子的搜索空间是一个有限的,并逐渐减小的区域,从而无法覆盖整个解空间。针对粒子群算法的不足,量子力学的相关理论被引入。其中,量子态的叠加效应,使得量子系统具有很高的不确定性,这种强大的不确定性使算法具有更强的全局搜索能力,保证了全局收敛性。而在实际工程应用中,量子粒子群算法也有其优势,因为只有收缩—扩张系数的最大值和最小值需要在实际应用中进行调整。
无人驾驶汽车作为一种快速的动态响应系统,其轨迹跟踪性能主要取决于转向和速度的控制。而模型预测控制由于其独特的预见性,已被应用于无人驾驶汽车的轨迹跟踪,包括理论基础的分析、MATLAB与CarSim联合仿真和实车测试。这些都表明了模型预测控制在无人驾驶汽车轨迹跟踪上有着良好的表现。
发明内容
为克服现有技术的不足,快速优化求解非线性模型预测控制的代价函数,本发明旨在提出采用量子粒子群算法并行设计的方案,将约束问题转化为无约束问题,并确保控制输出满足车辆物理限制和人体舒适度要求。此外,在不同的驾驶环境下,根据当前行驶环境和车辆姿态,实时调整评价函数的权重因子,使车辆更好地适应当前路况。为此,本发明采取的技术方案是,基于量子粒子群算法的非线性模型预测控制方法,首先建立基于无人驾驶汽车的运动学模型,并将其进行离散化;在此基础上采用广义拉格朗日乘子法构造具有惩罚项和鼓励项的广义代价函数,从而将约束问题转化为无约束问题;接下来,进行量子粒子群算法的并行设计,并用其对模型预测控制的代价函数进行优化求解,得到一系列的控制量,最后将控制量的第一个分量作用到汽车上。
具体地,基于车辆运动学模型的广义代价函数构造:
A.无人驾驶汽车运动学模型:
将其进行离散化:
B.广义代价函数
其中,Hp与Hc分别是预测时域和控制时域,xr|j、yr|j和是在第j时刻上给定的位姿参考值,对应的xp|j、yp|j和是在j时刻的输出预测值,△δj=δj-δ(j-1)是转向角在j时刻的变化量,△vj是车辆速度在j时刻的改变量,Mt是在第t次迭代时的惩罚项,vl1|t和vl2|t是在第t次迭代时的拉格朗日乘子,δmax是前轮的最大转向角,δj是在j时刻的前轮转向角,vmax是在当前环境和物理条件下车辆的最大速度,ω1为x轴方向位置权重因子,ω2为y轴方向位置权重因子,ω3为航向角权重因子,ω4为前轮转角变化量权重因子,ω5为速度变化权重因子,上述权重因子随着车辆的位置和驾驶条件改变,ωv|j是开关量权重因子,其定义为:
其中,ωv0是权重因子,condition 1由三部分组成:车辆速度在增加并且加速度大于设定值、车辆偏离给定参考轨迹0.3米和航向角偏离给定参考航向角0.09弧度,其中只要有一部分成立,condition 1就成立;
代价函数(2)中的第一项代表着预测值与参考值之间的偏差;第二项表示对控制输入变化率的约束,作用是为了防止突然的转向和加速;第三项是惩罚项,作用是为了防止输入超出车辆物理因素和环境因素所决定的约束;第四项是强调一种激励,确保车辆在正常情况下以最大速度行驶。
量子粒子群算法的并行设计具体地:并行设计量子粒子群算法,并用其进行无人驾驶汽车轨迹跟踪代价函数的优化求解:
第一步是随机初始化粒子位置,由于各个粒子在初始条件时是没有任何关联的,所以所有粒子能够并行初始化;第二步通过代价函数对每个粒子当前状态进行评估,在无人驾驶汽车轨迹跟踪时,每个粒子都可以获得当前参考点信息,从而保证代价函数的计算能够同时进行;第三步是更新局部最优值,将同一个粒子的两个适应度值进行比较,故也进行并行设计;第四步计算全局最优值和平均最佳位置,由于全局最优值是通过对比所有粒子的适应度进行实现的,因此必须将所有粒子聚集在一起进行,同样地,平均最佳位置的计算也需要所有粒子的局部最优位置,不过全局最优值和平均最佳位置能够同时计算;第五步选取平均最佳位置和全局最优值之间的随机值;第六步通过平均最佳位置和随机点更新所有粒子位置,在更新的过程中,因为平均最佳位置和全局最优值已经得到,每个粒子的随机点仍能够进行并行计算;最后,确定更新得到的的控制输出是否满足终止条件,如果满足,则输出控制结果,否则,算法将重复进行,这里的停止条件是满足控制效果或达到最大的迭代次数。
本发明的特点及有益效果是:
本发明所提出的基于量子粒子群算法的快速非线性模型预测控制在无人驾驶汽车轨迹跟踪上的并行设计,其优化求解器的设计具有更强的全局搜索能力,更快的计算能力,可以更好的满足无人驾驶汽车在高速运行时对控制器的要求。为了满足车辆本身的物理限制和保证乘客的舒适度,采用广义拉格朗日乘子法构造了具有惩罚项和鼓励项的广义代价函数,并将有约束问题转化为无约束问题,方便优化求解。此外,在不同的驾驶环境下,根据当前行驶环境和车辆姿态,随时调整评价函数的权重因子,使车辆更好地适应当前路况。
附图说明:
图1、车辆运动学模型。
图2、量子粒子群算法的并行设计流程图。
具体实施方式
为了快速优化求解非线性模型预测控制的代价函数。本发明采用量子粒子群算法并行设计的方案来解决上述问题。而对于无人驾驶汽车这种自身带有物理约束,同时又要满足人体舒适度要求的系统,本发明利用广义拉格朗日乘子法构造了具有惩罚项和鼓励项的广义代价函数,将约束问题转化为无约束问题,并确保控制输出满足车辆物理限制和人体舒适度要求。此外,在不同的驾驶环境下,根据当前行驶环境和车辆姿态,实时调整评价函数的权重因子,使车辆更好地适应当前路况。为此,本发明采取的技术方案是,基于量子粒子群算法的快速非线性模型预测控制在无人驾驶汽车轨迹跟踪上的并行设计,具体包括:
1、基于车辆运动学模型的广义代价函数构造:
A.车辆运动学模型(如图1所示):
将其进行离散化:
B.广义代价函数
其中,Hp与Hc分别是预测时域和控制时域,xr|j、yr|j和是在第j时刻上给定的位姿参考值,对应的xp|j、yp|j和是在j时刻的输出预测值,△δj=δj-δ(j-1)是转向角在j时刻的变化量,△vj是车辆速度在j时刻的改变量,Mt是在第t次迭代时的惩罚项,vl1|t和vl2|t是在第t次迭代时的拉格朗日乘子,δmax是前轮的最大转向角,δj是在j时刻的前轮转向角,vmax是在当前环境和物理条件下车辆的最大速度,ω1为x轴方向位置权重因子,ω2为y轴方向位置权重因子,ω3为航向角权重因子,ω4为前轮转角变化量权重因子,ω5为速度变化权重因子,上述权重因子随着车辆的位置和驾驶条件改变,ωv|j是开关量权重因子,其定义为:
其中,ωv0是权重因子。condition 1由三部分组成:车辆速度在增加并且加速度大于设定值、车辆偏离给定参考轨迹0.3米和航向角偏离给定参考航向角0.09弧度,其中只要有一部分成立,condition 1就成立。
代价函数(5)中的第一项代表着预测值与参考值之间的偏差;第二项表示对控制输入变化率的约束,作用是为了防止突然的转向和加速;第三项是惩罚项,作用是为了防止输入超出车辆物理因素和环境因素所决定的约束;第四项是强调一种激励,确保车辆在正常情况下以最大速度行驶。当然,vmax在不同的驾驶条件下将会有所不同。
2.量子粒子群算法的并行设计
并行设计量子粒子群算法,并用其进行无人驾驶汽车轨迹跟踪代价函数的优化求解。由车辆运动学表达式(4)可知,车的速度和方向盘转向是相互耦合,相互关联的。因此,表征粒子的内部各个分量不能单独求解。但由于分量个数少,即使顺序执行,也不会消耗太多时间。对于每一个粒子来说,它们之间是相互独立的,所以非常适合并行设计。此外,粒子数目通常情况下数量较多,所以是并行设计的关键。图2为量子粒子群算法的并行设计流程图。第一步是随机初始化粒子位置,由于各个粒子在初始条件时是没有任何关联的,所以所有粒子可以并行初始化。第二步通过代价函数对每个粒子当前状态进行评估。在无人驾驶汽车轨迹跟踪时,每个粒子都可以获得当前参考点信息,从而保证代价函数的计算能够同时进行。第三步是更新局部最优值。将同一个粒子的两个适应度值进行比较,故也可以进行并行设计。第四步计算全局最优值和平均最佳位置。由于全局最优值是通过对比所有粒子的适应度进行实现的,因此必须将所有粒子聚集在一起进行。同样地,平均最佳位置的计算也需要所有粒子的局部最优位置。不过全局最优值和平均最佳位置能够同时计算。第五步选取平均最佳位置和全局最优值之间的随机值。第六步通过平均最佳位置和随机点更新所有粒子位置。在更新的过程中,因为平均最佳位置和全局最优值已经得到,每个粒子的随机点仍能够进行并行计算。最后,确定更新得到的的控制输出是否满足终止条件。如果满足,则输出控制结果。否则,算法将重复进行。这里的停止条件是满足控制效果或达到最大的迭代次数。此外,量子粒子群算法扩展所有可以并行执行的步骤,将大大提高计算速度,与此同时也消耗更多的FPGA资源。有时,为了寻求速度与资源之间的平衡,可将粒子进行分组,然后组与组之间并行执行,组内顺序执行。
本发明是基于量子粒子群算法的快速非线性模型预测控制在无人驾驶汽车轨迹跟踪上的并行设计,具有求解速度快、搜素能力强的特点。具体实现方式为:首先建立基于无人驾驶汽车的运动学模型,并将其进行离散化;在此基础上采用广义拉格朗日乘子法构造具有惩罚项和鼓励项的广义代价函数,从而将约束问题转化为无约束问题,方便优化求解;接下来,进行量子粒子群算法的并行设计,并用其对模型预测控制的代价函数进行优化求解,得到一系列的控制量,最后将控制量的第一个分量作用到汽车上。
为了更清楚地说明本发明的目的、技术方案及优点,以下从带约束的非线性模型预测控制的基本框架、量子粒子群优化算法、基于无人驾驶汽车轨迹跟踪的量子粒子群算法并行设计等几个方面来对本发明作进一步解释说明。应当理解,此处所描述的具体设计方法仅仅用以解释本发明,并不用于限定本发明。
一、具有约束的非线性模型预测控制的基本框架
假设非线性控制系统可以由以下离散状态模型描述:
umin为最小控制输入量,umax为最大控制输入量,△umin为允许的最小控制输入变化量,△umax为允许的最大控制输入变化量。控制量u(k)的约束和控制增量△u(k)的约束一般来自执行器的饱和。在通常情况下,非线性模型预测控制的控制量u(k)的求解被转换为求取目标函数的最优值。基于带约束的离散时间状态模型,非线性最小优化问题可以按照如下形式给出:
在上述表达式中,J为需要优化求解的代价函数,x(k)是系统状态向量,U(k)为一系列的控制输入变量。此外,目标函数满足以下关系:
到目前为止,尚没有十分有效的方法对带有约束的代价函数直接进行优化优解。因此通常采用间接方法来解决该问题,即利用目标函数和约束条件构成增广目标函数,将约束优化问题转化为无约束优化问题。本发明利用广义拉格朗日乘子法构造具有惩罚项和鼓励项的广义代价函数。在惩罚因子的作用下,广义代价函数的最优解,即为带有约束的代价函数最优解。
在上u(t)式中是在第t次迭代的最优解。此时,带约束的非线性优化问题的求解转化为无约束问题:
二、量子粒子群优化算法
量子粒子群算法是一种在传统粒子群优化算法基础上,结合量子理论提出的改进算法。在量子粒子群算法中,建立一个量子化的吸引势场来束缚粒子,从而使得群体具有聚集态。在量子束缚态中,粒子可以以一定的概率密度出现在空间上的任意一点上。和传统粒子群优化算法相比,量子粒子群优化算法在全局优化性能上有了很大提高。量子粒子群的演化公式为:
其中,M表示总粒子数,D表示粒子维数。Xij(t)=(Xi1(t),Xi2(t),XiD(t))表示粒子的位置。Pi(t)=(Pi1(t),Pi2(t),,PiD(t))表示第i个粒子在第t次迭代时的最佳位置。Pg(t)=(Pg1(t),Pg2(t),,PgD(t))表示在第t次迭代时的全局最佳位置。mbest(t+1)是所有粒子最佳位置的平均值。PPij(t+1)是粒子个体最优值Pi(t)和群全局最优值Pg(t)之间的随机点。fij(t+1)和uij(t+1)是[0,1]之间的随机数。R(t+1)以一定概率分别取1或-1,通常的做法是:rand是[0,1]之间的随机数。α(t)是量子粒子群算法的收缩膨胀系数,它的取值可以固定不变或按照某种方式动态变化,通常情况下,可取:其中,Nmaxtime是最大迭代次数。随着迭代次数t的增加,α(t)从m线性减小到n.。通常情况下,取m=1,n=0.5。
三、基于无人驾驶汽车轨迹跟踪的量子粒子群算法并行设计
车辆运动学模型(如图1所示)为:
将其进行离散化:
广义代价函数
其中,Hp与Hc分别是预测时域和控制时域,xr|j、yr|j和是在第j时刻上给定的位姿参考值,对应的xp|j、yp|j和是在j时刻的输出预测值,△δj=δj-δ(j-1)是转向角在j时刻的变化量,△vj是车辆速度在j时刻的改变量,Mt是在第t次迭代时的惩罚项,vl1|t和vl2|t是在第t次迭代时的拉格朗日乘子,δmax是前轮的最大转向角,δj是在j时刻的前轮转向角,vmax是在当前环境和物理条件下车辆的最大速度,ω1为x轴方向位置权重因子,ω2为y轴方向位置权重因子,ω3为航向角权重因子,ω4为前轮转角变化量权重因子,ω5为速度变化权重因子,上述权重因子随着车辆的位置和驾驶条件改变,ωv|j是开关量权重因子,其定义为:
其中,ωv0是权重因子。condition 1由三部分组成:车辆速度在增加并且加速度大于设定值、车辆偏离给定参考轨迹0.3米和航向角偏离给定参考航向角0.09弧度,其中只要有一部分成立,condition 1就成立。
代价函数(17)中的第一项代表着预测值与参考值之间的偏差;第二项表示对控制输入变化率的约束,作用是为了防止突然的转向和加速;第三项是惩罚项,作用是为了防止输入超出车辆物理因素和环境因素所决定的约束;第四项是强调一种激励,确保车辆在正常情况下以最大速度行驶。当然,vmax在不同的驾驶条件下将会有所不同。
并行设计量子粒子群算法,并用其进行无人驾驶汽车轨迹跟踪代价函数的优化求解。由车辆运动学表达式(16)可知,车的速度和方向盘转向是相互耦合,相互关联的。因此,表征粒子的内部各个分量不能单独求解。但由于分量个数少,即使顺序执行,也不会消耗太多时间。对于每一个粒子来说,它们之间是相互独立的,所以非常适合并行设计。此外,粒子数目通常情况下数量较多,所以是并行设计的关键。图2为量子粒子群算法的并行设计流程图。第一步是随机初始化粒子位置,由于各个粒子在初始条件时是没有任何关联的,所以所有粒子可以并行初始化。第二步通过代价函数对每个粒子当前状态进行评估。在无人驾驶汽车轨迹跟踪时,每个粒子都可以获得当前参考点信息,从而保证代价函数的计算能够同时进行。第三步是更新局部最优值。将同一个粒子的两个适应度值进行比较,故也可以进行并行设计。第四步计算全局最优值和平均最佳位置。由于全局最优值是通过对比所有粒子的适应度进行实现的,因此必须将所有粒子聚集在一起进行。同样地,平均最佳位置的计算也需要所有粒子的局部最优位置。不过全局最优值和平均最佳位置能够同时计算。第五步选取平均最佳位置和全局最优值之间的随机值。第六步通过平均最佳位置和随机点更新所有粒子位置。在更新的过程中,因为平均最佳位置和全局最优值已经得到,每个粒子的随机点仍能够进行并行计算。最后,确定更新得到的的控制输出是否满足终止条件。如果满足,则输出控制结果。否则,算法将重复进行。这里的停止条件是满足控制效果或达到最大的迭代次数。此外,量子粒子群算法扩展所有可以并行执行的步骤,将大大提高计算速度,与此同时也消耗更多的FPGA资源。有时,为了寻求速度与资源之间的平衡,可将粒子进行分组,然后组与组之间并行执行,组内顺序执行。
Claims (2)
1.一种基于量子粒子群算法的非线性模型预测控制方法,其特征是,首先建立基于无人驾驶汽车的运动学模型,并将其进行离散化;在此基础上采用广义拉格朗日乘子法构造具有惩罚项和鼓励项的广义代价函数,从而将约束问题转化为无约束问题;接下来,进行量子粒子群算法的并行设计,并用其对模型预测控制的代价函数进行优化求解,得到一系列的控制量,最后将控制量的第一个分量作用到汽车上;具体地,基于车辆运动学模型的广义代价函数构造:
A.无人驾驶汽车运动学模型:
将其进行离散化:
B.广义代价函数
其中,Hp与Hc分别是预测时域和控制时域,xr|j、yr|j和是在第j时刻上给定的位姿参考值,对应的xp|j、yp|j和是在j时刻的输出预测值,Δδj=δj-δ(j-1)是转向角在j时刻的变化量,Δvj是车辆速度在j时刻的改变量,Mt是在第t次迭代时的惩罚项,vl1|t和vl2|t是在第t次迭代时的拉格朗日乘子,δmax是前轮的最大转向角,δj是在j时刻的前轮转向角,vmax是在当前环境和物理条件下车辆的最大速度,ω1为x轴方向位置权重因子,ω2为y轴方向位置权重因子,ω3为航向角权重因子,ω4为前轮转角变化量权重因子,ω5为速度变化权重因子,上述权重因子随着车辆的位置和驾驶条件改变,ωv|j是开关量权重因子,其定义为:
其中,ωv0是权重因子,condition 1由三部分组成:车辆速度在增加并且加速度大于设定值、车辆偏离给定参考轨迹0.3米和航向角偏离给定参考航向角0.09弧度,其中只要有一部分成立,condition 1就成立;
代价函数(2)中的第一项代表着预测值与参考值之间的偏差;第二项表示对控制输入变化率的约束,作用是为了防止突然的转向和加速;第三项是惩罚项,作用是为了防止输入超出车辆物理因素和环境因素所决定的约束;第四项是强调一种激励,确保车辆在正常情况下以最大速度行驶。
2.如权利要求1所述的基于量子粒子群算法的非线性模型预测控制方法,其特征是,量子粒子群算法的并行设计具体地:并行设计量子粒子群算法,并用其进行无人驾驶汽车轨迹跟踪代价函数的优化求解:第一步是随机初始化粒子位置,由于各个粒子在初始条件时是没有任何关联的,所以所有粒子能够并行初始化;第二步通过代价函数对每个粒子当前状态进行评估,在无人驾驶汽车轨迹跟踪时,每个粒子都可以获得当前参考点信息,从而保证代价函数的计算能够同时进行;第三步是更新局部最优值,将同一个粒子的两个适应度值进行比较,故也进行并行设计;第四步计算全局最优值和平均最佳位置,由于全局最优值是通过对比所有粒子的适应度进行实现的,因此必须将所有粒子聚集在一起进行,同样地,平均最佳位置的计算也需要所有粒子的局部最优位置,不过全局最优值和平均最佳位置能够同时计算;第五步选取平均最佳位置和全局最优值之间的随机值;第六步通过平均最佳位置和随机点更新所有粒子位置,在更新的过程中,因为平均最佳位置和全局最优值已经得到,每个粒子的随机点仍能够进行并行计算;最后,确定更新得到的的控制输出是否满足终止条件,如果满足,则输出控制结果,否则,算法将重复进行,这里的停止条件是满足控制效果或达到最大的迭代次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810394482.1A CN108646734B (zh) | 2018-04-27 | 2018-04-27 | 基于量子粒子群算法的非线性模型预测控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810394482.1A CN108646734B (zh) | 2018-04-27 | 2018-04-27 | 基于量子粒子群算法的非线性模型预测控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108646734A CN108646734A (zh) | 2018-10-12 |
CN108646734B true CN108646734B (zh) | 2021-04-02 |
Family
ID=63747896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810394482.1A Active CN108646734B (zh) | 2018-04-27 | 2018-04-27 | 基于量子粒子群算法的非线性模型预测控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108646734B (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018220505A1 (de) * | 2018-11-28 | 2020-05-28 | Robert Bosch Gmbh | Modellprädiktive Regelung mit verbesserter Berücksichtigung von Beschränkungen |
CN109808707B (zh) * | 2019-02-19 | 2020-12-08 | 武汉理工大学 | 一种基于随机模型预测的汽车转向控制方法及控制器 |
CN111781920A (zh) * | 2019-11-26 | 2020-10-16 | 北京京东乾石科技有限公司 | 自动驾驶方法、装置和存储介质 |
CN110949499B (zh) * | 2019-11-26 | 2022-03-22 | 江苏大学 | 一种商用车无人驾驶转角补偿系统及其控制方法 |
CN111413966B (zh) * | 2020-03-12 | 2022-04-29 | 天津大学 | 一种递进式模型预测无人驾驶规划跟踪协同控制方法 |
CN111307158B (zh) * | 2020-03-19 | 2022-11-18 | 哈尔滨工程大学 | 一种auv三维航路规划方法 |
CN111722174A (zh) * | 2020-05-31 | 2020-09-29 | 宁夏隆基宁光仪表股份有限公司 | 一种应用量子粒子群算法实现电能表异常诊断系统及方法 |
CN112800670B (zh) * | 2021-01-26 | 2024-05-03 | 清华大学 | 驾驶认知模型多目标结构优化方法及装置 |
CN113204236B (zh) * | 2021-04-14 | 2022-05-20 | 华中科技大学 | 一种智能体路径跟踪控制方法 |
CN113650622B (zh) * | 2021-07-16 | 2023-06-20 | 东风柳州汽车有限公司 | 车速轨迹规划方法、装置、设备及存储介质 |
CN113581285B (zh) * | 2021-08-25 | 2023-01-20 | 深圳亿嘉和科技研发有限公司 | 一种液压转向阿克曼型机器人的自动回充控制方法 |
CN113721620B (zh) * | 2021-08-30 | 2023-08-01 | 山东交通学院 | 基于粒子群-遗传混合算法的车辆横向pid控制方法 |
CN113885511B (zh) * | 2021-10-22 | 2023-12-12 | 温州大学乐清工业研究院 | 一种断路器柔性装配机器人的轨迹优化方法 |
CN114202117B (zh) * | 2021-12-07 | 2022-06-28 | 北京量子信息科学研究院 | 数据处理方法、装置、计算机设备和存储介质 |
CN114547901A (zh) * | 2022-02-25 | 2022-05-27 | 上海图灵智算量子科技有限公司 | 用模拟分叉解决带电粒子轨迹重构的方法 |
CN114995141A (zh) * | 2022-06-08 | 2022-09-02 | 天津大学 | 基于启发式模型预测控制的轨迹跟踪控制方法 |
CN116164747B (zh) * | 2022-12-15 | 2023-09-05 | 广东智能无人系统研究院(南沙) | 一种水下机器人的定位与导航方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101387888A (zh) * | 2008-09-27 | 2009-03-18 | 江南大学 | 基于二进制量子粒子群算法的移动机器人路径规划方法 |
CN101436073A (zh) * | 2008-12-03 | 2009-05-20 | 江南大学 | 基于量子行为粒子群算法的轮式移动机器人轨迹跟踪方法 |
JP2012138069A (ja) * | 2010-12-08 | 2012-07-19 | Mitsubishi Electric Research Laboratories Inc | 制御問題を解決するための方法 |
CN103995539A (zh) * | 2014-05-15 | 2014-08-20 | 北京航空航天大学 | 一种无人机自主编队评价指标与mpc编队控制方法 |
CN104851110A (zh) * | 2015-04-21 | 2015-08-19 | 南京邮电大学 | 基于量子粒子群优化的视觉跟踪方法 |
CN105320129A (zh) * | 2015-10-22 | 2016-02-10 | 清华大学 | 一种无人驾驶自行车轨迹跟踪控制的方法 |
CN107161207A (zh) * | 2017-05-08 | 2017-09-15 | 江苏大学 | 一种基于主动安全的智能汽车轨迹跟踪控制系统及控制方法 |
CN107561942A (zh) * | 2017-09-12 | 2018-01-09 | 重庆邮电大学 | 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法 |
CN107662211A (zh) * | 2017-10-16 | 2018-02-06 | 西北工业大学 | 一种基于量子粒子群算法的空间机器人预测控制方法 |
-
2018
- 2018-04-27 CN CN201810394482.1A patent/CN108646734B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101387888A (zh) * | 2008-09-27 | 2009-03-18 | 江南大学 | 基于二进制量子粒子群算法的移动机器人路径规划方法 |
CN101436073A (zh) * | 2008-12-03 | 2009-05-20 | 江南大学 | 基于量子行为粒子群算法的轮式移动机器人轨迹跟踪方法 |
JP2012138069A (ja) * | 2010-12-08 | 2012-07-19 | Mitsubishi Electric Research Laboratories Inc | 制御問題を解決するための方法 |
CN103995539A (zh) * | 2014-05-15 | 2014-08-20 | 北京航空航天大学 | 一种无人机自主编队评价指标与mpc编队控制方法 |
CN104851110A (zh) * | 2015-04-21 | 2015-08-19 | 南京邮电大学 | 基于量子粒子群优化的视觉跟踪方法 |
CN105320129A (zh) * | 2015-10-22 | 2016-02-10 | 清华大学 | 一种无人驾驶自行车轨迹跟踪控制的方法 |
CN107161207A (zh) * | 2017-05-08 | 2017-09-15 | 江苏大学 | 一种基于主动安全的智能汽车轨迹跟踪控制系统及控制方法 |
CN107561942A (zh) * | 2017-09-12 | 2018-01-09 | 重庆邮电大学 | 基于模型补偿的智能车辆轨迹跟踪模型预测控制方法 |
CN107662211A (zh) * | 2017-10-16 | 2018-02-06 | 西北工业大学 | 一种基于量子粒子群算法的空间机器人预测控制方法 |
Non-Patent Citations (5)
Title |
---|
Fast Nonlinear Model Predictive Control Parallel Design Using QPSO and Its Applications on Trajectory Tracking of Autonomous Vehicles;Zhiqiang Zuo 等;《IEEE》;20190131;全文 * |
Robust Model Predictive Control for automated trajectory tracking of an Unmanned Ground Vehicle;M. B. B. S. Eaton 等;《IEEE》;20121231;第4251-4255页 * |
基于量子粒子群算法的移动机器人的路径规划的研究;王坤;《中国优秀硕士学位论文全文数据库 信息科技辑》;20100515;第9-12,26-30,35-37页 * |
复杂道路环境下无人驾驶汽车的快速路径规划与控制;代立业;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20200615;全文 * |
快速模型预测控制的FPGA实现及其应用研究;许芳;《中国博士学位论文全文数据库 信息科技辑》;20140915;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN108646734A (zh) | 2018-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108646734B (zh) | 基于量子粒子群算法的非线性模型预测控制方法 | |
Zhou et al. | Deep convolutional neural network based fractional-order terminal sliding-mode control for robotic manipulators | |
Huang et al. | Parameterized batch reinforcement learning for longitudinal control of autonomous land vehicles | |
Dong et al. | Decentralized cooperative control of multiple nonholonomic dynamic systems with uncertainty | |
Rodríguez et al. | Grey wolf optimizer with dynamic adaptation of parameters using fuzzy logic | |
Han et al. | Adaptive computation algorithm for RBF neural network | |
Tzeng | Design of fuzzy wavelet neural networks using the GA approach for function approximation and system identification | |
Xue et al. | Trajectory planning for autonomous mobile robot using a hybrid improved QPSO algorithm | |
CN109884900B (zh) | 基于自适应模型预测控制的收获机路径跟踪控制器的设计方法 | |
McAllister et al. | Data-efficient reinforcement learning in continuous state-action Gaussian-POMDPs | |
Lee et al. | Deep reinforcement learning of semi-active suspension controller for vehicle ride comfort | |
Kebbati et al. | Optimized adaptive MPC for lateral control of autonomous vehicles | |
CN108287467A (zh) | 基于事件触发的无模型自适应数据驱动控制方法 | |
Huynh et al. | A TOPSIS multi-criteria decision method-based intelligent recurrent wavelet CMAC control system design for MIMO uncertain nonlinear systems | |
Chen et al. | Grey signal predictor and fuzzy controls for active vehicle suspension systems via Lyapunov theory | |
Banerjee et al. | A survey on physics informed reinforcement learning: Review and open problems | |
Juang et al. | A self-generating fuzzy system with ant and particle swarm cooperative optimization | |
Elsisi et al. | Improved bald eagle search algorithm with dimension learning-based hunting for autonomous vehicle including vision dynamics | |
Lee et al. | Recurrent neuro fuzzy control design for tracking of mobile robots via hybrid algorithm | |
Zhang et al. | Trajectory-tracking control of robotic systems via deep reinforcement learning | |
Al-Dabooni et al. | Mobile robot control based on hybrid neuro-fuzzy value gradient reinforcement learning | |
CN115343950A (zh) | 一种适应复杂路面的车辆路径跟踪控制方法及控制系统 | |
Wu et al. | An algorithm for solving travelling salesman problem based on improved particle swarm optimisation and dynamic step Hopfield network | |
Shahbazi et al. | Analytical approximation for the double-stance phase of a walking robot | |
Cheng et al. | Application of actor-critic learning to adaptive state space construction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |