CN112596373B - 一种基于量子萤火虫算法的无人机姿控参数智能整定方法 - Google Patents
一种基于量子萤火虫算法的无人机姿控参数智能整定方法 Download PDFInfo
- Publication number
- CN112596373B CN112596373B CN202011167531.1A CN202011167531A CN112596373B CN 112596373 B CN112596373 B CN 112596373B CN 202011167531 A CN202011167531 A CN 202011167531A CN 112596373 B CN112596373 B CN 112596373B
- Authority
- CN
- China
- Prior art keywords
- firefly
- quantum
- algorithm
- objective function
- fireflies
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000254158 Lampyridae Species 0.000 title claims abstract description 247
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000005457 optimization Methods 0.000 claims abstract description 29
- 230000014759 maintenance of location Effects 0.000 claims abstract description 14
- 230000035772 mutation Effects 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 18
- 239000002096 quantum dot Substances 0.000 claims description 18
- 238000010521 absorption reaction Methods 0.000 claims description 17
- 230000001965 increasing effect Effects 0.000 claims description 17
- 230000006399 behavior Effects 0.000 claims description 15
- 238000013461 design Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 8
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000007547 defect Effects 0.000 abstract description 3
- 238000012360 testing method Methods 0.000 description 12
- 230000006872 improvement Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000002028 premature Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B11/00—Automatic controllers
- G05B11/01—Automatic controllers electric
- G05B11/36—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
- G05B11/42—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/08—Control of attitude, i.e. control of roll, pitch, or yaw
- G05D1/0808—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft
- G05D1/0816—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability
- G05D1/0825—Control of attitude, i.e. control of roll, pitch, or yaw specially adapted for aircraft to ensure stability using mathematical models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供了一种基于量子萤火虫算法的无人机姿控参数智能整定方法,属于自动控制领域,建立无人机姿态运动模型,设计分数阶PID控制器,确定待整定参数,选择误差指标函数为目标函数;设置量子萤火虫算法参数;执行量子萤火虫算法进行控制器参数整定优化,获得本次整定最优控制器参数和目标函数值;判断目标函数值是否满足要求;若目标函数值满足需求,则萤火虫位置为最优姿态控制器参数,整定结束;否则,返回步骤2,重新设置量子萤火虫算法参数,执行步骤2‑4。该方法在标准萤火虫算法的基础上,利用量子理论、精英保留和变异行为进行改进,克服现有技术中标准萤火虫算法存在的后期收敛速度严重降低、收敛精度不高和易陷入局部最优的缺陷。
Description
技术领域
本发明属于自动控制领域,具体涉及一种基于量子萤火虫算法的无人机姿控参数智能整定方法。
背景技术
四旋翼无人机分数阶PID控制器虽然相比PID控制具有更好的控制性能,但控制器参数相比PID控制大幅增加,由于分数阶微分具有的非线性特征,导致分数阶控制器参数整定呈现多变量、非线性、多极值等问题,难以获得类似PID控制器参数的解析整定方法。因此,需要根据控制器性能指标将控制器参数整定问题转化为控制性能的优化问题来解决,然后采用具备多变量全局寻优能力的人工智能优化算法对该优化问题进行求解,从而实现控制器参数的整定。2009年,剑桥学者Xin-SheYang等根据自然界中萤火虫的发光行为,提出了萤火虫算法(FireFlyAlgorithm,FA)[X.-S.Yang,Firefly algorithms formultimodal optimization[J].Stochastic Algorithms:Foundations andApplications,SAGA 2009,Lecture Notes in Computer Sciences,Vol.5792,pp.169-178],通过模拟萤火虫的发光行为构建一种智能优化算法,用于解决多变量优化问题,是一种全局搜索能力强、收敛速度快和自适应性好的群集智能优化算法。该算法一经提出,就以其概念清晰、可实现性强和设计参数少等优点被应用于解决面向众多对象的参数优化设计问题。
但标准萤火虫算法仍存在一些缺陷:虽然前期具备很快的收敛速度,但后期收敛速度慢;受固定步长的影响,最终寻优结果精度并不理想。因此,针对上述算法缺陷众多学者也开始进行改进研究;例如采用自适应步长的方法改善后期寻优精度问题;将粒子群算法与萤火虫算法相结合,进一步提升收敛速度等。上述研究均在一定程度上提高了萤火虫算法的优化性能,但后期收敛性能下降、最终寻优结果精度低、易陷入局部最优等问题仍然存在,对于提高控制参数整定效率和控制效果来说,有必要对萤火虫算法进一步的改进完善。
因此,本申请提出一种基于量子萤火虫算法的无人机姿控参数智能整定方法。
发明内容
为了克服现有参数整定方法对无人机分数阶控制器参数寻优收敛精度不高、后期收敛速度严重降低和易陷入局部最优的缺陷。本发明提供一种基于量子萤火虫算法的无人机分数阶姿态控制器参数智能整定方法。该方法在标准萤火虫算法的基础上,采用量子位对萤火虫当前位置进行编码,用量子旋转门实现萤火虫位置更新,用量子非门增加萤火虫变异以避免早熟收敛,改进算法的寻优能力,从而加快控制器参数的整定速度、提升全局寻优能力和最优解的搜索精度。
为了实现上述目的,本发明提供如下技术方案:
基于量子萤火虫算法的无人机姿控参数智能整定方法,包括以下步骤:
步骤1、建立无人机姿态运动模型,设计分数阶PID控制器,确定待整定参数,选择误差指标函数为目标函数;
步骤2、设置量子萤火虫算法参数;
步骤3、执行量子萤火虫算法进行控制器参数整定优化,获得本次整定最优控制器参数和目标函数值;
步骤4、判断目标函数值是否满足要求;若目标函数值满足需求,则萤火虫位置为最优姿态控制器参数,整定结束;否则,返回步骤2,重新设置量子萤火虫算法参数,执行步骤2-4。
优选地,所述步骤1具体为:
建立四旋翼无人机的运动模型,设计分数阶PID姿态控制器其中e为俯仰角误差,为α阶分数阶微分算子,为β阶分数阶积分算子Kp、Ki、Kd为比例控制增益、积分控制增益和微分控制增益;确定待整定参数X=[Kp Ki Kd α β]T,选择时间乘以误差绝对值积分(ITAE)指标作为控制器参数整定的目标函数将控制器参数整定问题转化为控制器参数的优化问题,该问题表述如下:
X=[Kp Ki Kd α β] (I)
由于萤火虫算法是求目标函数最大值,而无人机飞控希望误差指标最小,则萤火虫算法的自身亮度计算公式为I0(X)=-f(X),其中f(X)=Y为控制器参数整定目标函数值,反映了控制器参数的姿态控制效果。
优选地,所述步骤2设置量子萤火虫算法参数包括:设计变量的寻优范围为[Downk,Upk],k=1,2,…5,[Downk,Upk]为第k个设计变量的寻优范围,Upk为范围上界、Downk为范围下界;亮度吸收系数为γ;β0为最大吸引力;最大迭代次数为lmax,lmax>0;精英保留策略的萤火虫个数为Numelite,Numelite>1;变异概率为Pmut,0<Prmut<1;令萤火虫之间的距离计算公式为di,j=||Xi-Xj||;当前迭代次数l=1。
优选地,所述步骤3具体包括以下步骤:
步骤3.1、量子萤火虫初始化,采用量子位的概率幅作为萤火虫当前位置编码,
式中,θij=2π×radmn;radmn为(0,1)之间的随机数;m是种群规模;n是优化变量空间维数;i=1,2,…,m;j=1,2,…,n;每个萤火虫位置占据遍历空间中的两个位置,分别对应量子态|0>和|1>的概率幅,即
XQic=(cos(θi1),cos(θi2),…,cos(θin)),XQis=(sin(θi1),sin(θi2),…,sin(θin)) (3)
式中,XQic为余弦位置,XQis为正弦位置;
步骤3.2、量子搜索
然后通过I0(X)计算当前量子位置XQi对应的每个解空间位置PQij,j=c,s的亮度值,取最大值作为当前量子位的亮度值I0Qi(XQi);
步骤3.3、公告板更新
根据每个量子萤火虫当前位置的目标函数值为I0Qi(XQi),将最大值Yboard=max(I0Q1(XQ1),I0Q2(XQ2),…,I0QN(XQN))和对应的萤火虫位置Xboard=XQij if Yij=Yboard,j=c,s赋值给公告板;
步骤3.4、精英保留
将所有萤火虫按目标函数值从大到小进行排序,将排序后的前Nelite个萤火虫直接保留到下一次迭代,前Nelite个萤火虫不参与后续行为;
步骤3.5、位置更新
设第i个萤火虫XQi当前位置为Pi=[θi1 θi2 … θin],使用式(2)计算第i个萤火虫XQi与第j个萤火虫之间的距离dij,得到第i个萤火虫Xi与其他所有萤火虫之间的距离Di=(di1,di2,…,dij,…,diN);
dij=||Pi-Pj|| 1≤j≤N (5)
计算第j个萤火虫到第i个萤火虫的亮度:
式中,Ij0为距离dji=0时的光强,即自身亮度,这里可取为目标函数值,意味着目标值越优,亮度越亮;γ为吸收系数,因为荧光会随着距离的增加和传播媒介的吸收逐渐减弱,所以设置光强吸收系数以体现此特性,可设置为常数;
当Iji(dji)>Ii0时,萤火虫i将向萤火虫j运动,运动受到萤火虫j对萤火虫i吸引力的影响,量子的移动由量子旋转门实现,因此量子萤火虫位置更新应变为量子旋转门转角的更新:
Δθij=βijΔθ*f(θkj-θij)/|f(θkj-θij)|+α(rand-1/2) (7)
对于处于当前最佳位置的萤火虫,进行随机移动,即
Δθi=α(rand-1/2) (8)
萤火虫Xi更新后的两个新位置为:
步骤3.6、变异处理
设定变异概率Pmut,通过每个萤火虫抽取随机数rand()判断该萤火虫是否发生变异;若Pmut>rand()则变异发生,则随机选择变异量子位j=ceil(5*rand()),则采用量子非门改变该位置的角度,增加多样性;
θij=θij+PI/2 (10)
步骤3.7、若当前迭代次数l≤lmax,则令l=l+1,并执行步骤3.2;否则执行步骤4;
步骤3.8、输出公告板上的萤火虫位置Xboard及最优结果Yboard。
本发明提供的基于量子萤火虫算法的无人机姿控参数智能整定方法具有以下有益效果:
(1)量子理论与萤火虫算法相结合,每个量子萤火虫位置相当于占据寻优空间中的两个位置,这样,每个萤火虫位置对应优化问题的两个解,提高了算法的遍历性,增加了算法的全局收敛速度。这样,量子旋转门通过改变萤火虫的量子幅角,实现了对两个位置的同步移动,在种群规模不变的情况下,扩展了对搜索空间的遍历性,提升了单次优化效率。
(2)标准萤火虫算法在搜索过程中,只接受最优解,从而可能会陷入局部最优,无法达到全局最优。本发明采用变异操作避免陷入局部最优改进策略,通过引入变异行为,不仅接受最优解,而且还以一定概率对萤火虫位置进行重构,这样就可以使得算法不定期的跳出局部最优控制器参数,从而达到全局最优的控制器参数,增强了算法的跳出局部最优能力。
(3)本发明引入了精英保留策略。在避免陷入局部最优的同时,将现有最优、次优控制器参数直接保留,可以保证前期计算的成果,避免重复搜索,浪费计算时间,加快控制器参数的整定收敛速度。
(4)采用量子萤火虫算法进行控制系统参数的整定方法,具有更快的收敛速度、更好的控制器参数整定效率和控制器参数全局寻优能力。
附图说明
为了更清楚地说明本发明实施例及其设计方案,下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明方法的流程图;
图2是本发明方法进行四旋翼无人机姿控参数整定结构图;
图3是本发明方法中量子萤火虫算法流程图;
图4是本发明方法中量子萤火虫的位置更新操作的流程图;
图5是本发明方法中量子萤火虫算法的变异操作的流程图;
图6是使用本发明方法对实施例2中分数阶PID控制器参数整定过程图;
图7是使用本发明方法对实施例2中分数阶PID控制器参数进行整定过程中每代最优控制器参数控制效果图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案并能予以实施,下面结合附图和具体实施例对本发明进行详细说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明提供了一种基于量子萤火虫算法的无人机姿控参数智能整定方法,具体如图1所示,包括以下步骤:
步骤1、建立无人机姿态运动模型,设计分数阶PID控制器,确定待整定参数,选择误差指标函数为目标函数;
具体为,如图2所示,设计分数阶PID控制为其中e为俯仰角误差,为α阶分数阶微分算子,为β阶分数阶积分算子Kp、Ki、Kd为比例控制增益、积分控制增益和微分控制增益。确定待整定参数X=[Kp Ki Kd α β]T,选择时间乘以误差绝对值积分(ITAE)指标作为控制器参数整定的目标函数将控制器参数整定问题转化为控制器参数的优化问题,该问题表述如下:
X=[Kp Ki Kd α β] (I)
由于萤火虫算法是求目标函数最大值,而无人机飞控希望误差指标最小,则萤火虫算法的自身亮度计算公式为I0(X)=-f(X),其中f(X)=Y为控制器参数整定目标函数值,反映了控制器参数的飞控效果;
步骤2、设置量子萤火虫算法参数;具体的,本实施例中步骤2设置量子萤火虫算法参数包括:设计变量的寻优范围为[Downk,Upk],k=1,2,…5,[Downk,Upk]为第k个设计变量的寻优范围,Upk为范围上界、Downk为范围下界;亮度吸收系数为γ;β0为最大吸引力;最大迭代次数为lmax,lmax>0;精英保留策略的萤火虫个数为Numelite,Numelite>1;变异概率为Pmut,0<Prmut<1;令萤火虫之间的距离计算公式为di,j=||Xi-Xj||;当前迭代次数l=1;
步骤3、执行量子萤火虫算法进行控制器参数整定优化,获得本次整定最优控制器参数和目标函数值;
具体的,如图3所示,本实施例中步骤3包括以下步骤:
步骤3.1、量子萤火虫初始化,采用量子位的概率幅作为萤火虫当前位置编码,
式中,θij=2π×radmn;radmn为(0,1)之间的随机数;m是种群规模;n是优化变量空间维数;i=1,2,…,m;j=1,2,…,n;每个萤火虫位置占据遍历空间中的两个位置,分别对应量子态|0>和|1>的概率幅,即
XQic=(cos(θi1),cos(θi2),…,cos(θin)),XQis=(sin(θi1),sin(θi2),…,sin(θin)) (3)
式中,XQic为余弦位置,XQis为正弦位置;
步骤3.2、量子搜索
然后通过I0(X)计算当前量子位置XQi对应的每个解空间位置PQij,j=c,s的亮度值,取最大值作为当前量子位的亮度值I0Qi(XQi);
步骤3.3、公告板更新
根据每个量子萤火虫当前位置的目标函数值为I0Qi(XQi),将最大值Yboard=max(I0Q1(XQ1),I0Q2(XQ2),…,I0QN(XQN))和对应的萤火虫位置Xboard=XQij if Yij=Yboard,j=c,s赋值给公告板;
步骤3.4、精英保留
将所有萤火虫按目标函数值从大到小进行排序,将排序后的前Nelite个萤火虫直接保留到下一次迭代,前Nelite个萤火虫不参与后续行为;
通过增加精英保留策略,便于后续位置更新、变异行为对除当前最优状态的萤火虫进行影响,保证前期计算的成果,避免重复搜索,浪费计算时间;
步骤3.5、位置更新
如图4所示,设第i个萤火虫XQi当前位置为Pi=[θi1 θi2 … θin],使用式(2)计算第i个萤火虫XQi与第j个萤火虫之间的距离dij,得到第i个萤火虫Xi与其他所有萤火虫之间的距离Di=(di1,di2,…,dij,…,diN);
dij=||Pi-Pj|| 1≤j≤N (5)
计算第j个萤火虫到第i个萤火虫的亮度:
式中,Ij0为距离dji=0时的光强(最亮),即自身亮度,这里可取为目标函数值,意味着目标值越优,亮度越亮;γ为吸收系数,因为荧光会随着距离的增加和传播媒介的吸收逐渐减弱,所以设置光强吸收系数以体现此特性,可设置为常数;
当Iji(dji)>Ii0时,萤火虫i将向萤火虫j运动,运动受到萤火虫j对萤火虫i吸引力的影响,量子的移动由量子旋转门实现,因此量子萤火虫位置更新应变为量子旋转门转角的更新:
Δθij=βijΔθ*f(θkj-θij)/|f(θkj-θij)|+α(rand-1/2) (7)
对于处于当前最佳位置的萤火虫,进行随机移动,即
Δθi=α(rand-1/2) (8)
萤火虫Xi更新后的两个新位置为:
这样,量子旋转门通过改变萤火虫的量子幅角,实现了对两个位置的同步移动,在种群规模不变的情况下,扩展了对搜索空间的遍历性;
步骤3.6、变异处理
萤火虫算法有陷入局部极值的可能,借鉴遗传算法,引入变异操作,增加种群多样性,避免早熟收敛,使用量子非门实现变异处理;如图5所示,设定变异概率Pmut,通过每个萤火虫抽取随机数rand()判断该萤火虫是否发生变异;若Pmut>rand()则变异发生,则随机选择变异量子位j=ceil(5*rand()),则采用量子非门改变该位置的角度,增加多样性;
θij=θij+PI/2 (10)
步骤3.7、若当前迭代次数l≤lmax,则令l=l+1,并执行步骤3.2;否则执行步骤4;
步骤3.8、输出公告板上的萤火虫位置Xboard及最优结果Yboard;
步骤4、判断目标函数值是否满足要求;若目标函数值满足需求,则萤火虫位置Xboard为最优姿态控制器参数,整定结束;否则,返回步骤2,重新设置量子萤火虫算法参数,执行步骤2-4。
为了便于技术人员理解和实施本发明,下面结合附图1-7及两个具体的实施例对本发明作进一步的详细描述。此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。利用标准算法和量子算法分别对各测试函数重复运行30次得到对优化结果进行分析,记录其收敛次数和收敛时的迭代次数,得到它们的平均迭代次数及收敛成功率,收敛成功率=收敛成功次数/30,表3给出了收敛性结果对比。
实施例1利用测试函数验证量子萤火虫算法的求解精度和收敛性
为验证改进算法在求解精度和收敛性方面的改进效果,选择标准测试函数Rosenbrock函数、Rastrigin函数对改进前后的算法效果进行对比,基于两种函数计算方法对于最小值的问题,就是得到食物浓度计算函数为Y=f(X)=-gh(X)h=Rosenbrock、Rastrigin,两种函数的数学表达式及全局最优解由表1给出。
假设量子萤火虫群中有N个量子萤火虫,F=(XQ1,XQ2,…,XQi,…,XQN),1≤i≤N,每个量子萤火虫个体的状态XQ可用测试函数的参数XQ=(θ1,θ2)为优化设计变量;[Downk,Upk]为第k个设计变量的寻优范围,Upk为范围上界、Downk为范围下界;XQi=(θ1i,θ2i,…,θni)表示量子萤火虫群中的第i个量子萤火虫的当前位置;θki(k=1,…,n,i=1,…,N)表示第i个量子萤火虫位置中第k个设计变量的当前值;量子萤火虫当前位置的亮度用Y=f(XQ)表示,其中Y为目标函数值,反映了不同位置下所解决问题模型的优劣程度;量子萤火虫之间的距离为di,j=||Xi-Xj||;亮度吸收系数为γ;β0为最大吸引力;最大迭代次数为lmax,lmax>0;精英保留策略的萤火虫个数为Numelite,Numelite>1;变异概率为Pmut,0<Prmut<1。
表1 实施例测试函数具体信息表
本发明的量子萤火虫方法与标准萤火虫算法主要改进体现在:
(2)将萤火虫之间的吸引力与量子旋转相结合,实现基于吸引力的自适应位置更新操作,Δθij=βijΔθ*f(θkj-θij)/|f(θkj-θij)|+α(rand-1/2);在标准萤火虫算法的位置更新中,采用固定步长进行移动,若固定步长较大,则可能导致后期萤火虫跳离最优解,出现收敛速度慢、精度低问题。若固定步长较小,结果精度较高,但收敛速度太慢。同时,依次移动只能改变搜索空间的一个位置。而本发明提出的量子萤火虫位置更新方法,在同一次迭代中,对相对吸引力大的个体使用较大的移动步长,加快其收敛速度,相反,对吸引力较小的个体使用较小的移动步长,提高寻优速度,通过吸收参数γ可以控制速度随吸引力变化的快慢,同时量子编码意味着一次量子位置更新将对应实际搜索空间中两个位置,大幅提升了单次优化效率。
(3)在标准萤火虫算法单次迭代流程最后,引入精英保留、变异行为,提高收敛速度,增加跳出局部最优能力。
精英保留行为将所有萤火虫按亮度从大到小进行排序,按照精英保留个数参数Nelite将排序后的前Nelite个萤火虫直接保留到下一次迭代,不参与后续行为。通过增加精英保留策略,便于后续位置更新、变异对除当前最优状态的萤火虫进行影响,保证前期计算的成果,避免重复搜索,浪费计算时间。
变异行为通过增加变异概率参数Pmut,通过抽取随机数,判断Pmut>rand()是否成立不定期的触发变异行为。若变异发生则随机选择变异量子位j=ceil(5*rand()),则采用量子非门改变该量子编码位置的角度θij=θij+PI/2,增加多样性,防止陷入局部最优,进行全局最优搜索。
图3给出了量子萤火虫算法的流程图,图4给出了量子萤火虫位置更新操作的流程图,图5给出了量子萤火虫变异行为的流程图。
实施例1中将本发明中量子萤火虫算法与标准萤火虫算法进行对比。其中萤火虫算法的萤火虫个数N=50、状态维数n=2、Rosenbrock函数和Rastrigin函数的状态变量范围分别为[UpGi,DownGi]=[-20,20],[UpRi,DownRi]=[-5.12,5.12]、萤火虫移动的最大步长Δθ=2、最大迭代次数lmax=100、亮度吸收系数γ=0.8、最大吸引力β0=1、、随机移动步长α=2。量子萤火虫算法中相同的参数设置与标准萤火虫算法一致,新增的算法参数设置精英保留策略的萤火虫个数为Nelite=4,Nelite>1;变异概率为Pmut=0.2,0<Prep<1;精英保留策略的萤火虫个数为Nelite=2,Nelite>1。
实施例1中,利用每种算法对各测试函数重复运行30次得到对优化结果进行分析,记录其收敛次数和收敛时的迭代次数,得到它们的平均迭代次数及收敛成功率,收敛成功率=收敛成功次数/30,表3给出了收敛性结果对比。
表3 实施例1的不同测试函数收敛性测试结果对比表
通过实施例1的收敛性测试结果可以看出,相对于标准萤火虫算法,本发明中量子萤火虫算法在最优值求解结果精度上由至少1个数量级的提高,在最优解位置求解精度上有近1个数量级的提高,在优化求解方面有很大提升。这也证明了本发明中对标准萤火虫算法改进的正确性。
在实施例1中,利用每种算法对各测试函数重复运行30次,记录其最优解及对应的萤火虫位置,并计算平均优化结果,表4给出了最优值优化求解结果对比。
表4 实施例的不同测试函数最优值求解结果对比表
通过实施例1的收敛性测试结果可以看出,相对于标准萤火虫算法,本发明中量子萤火虫算法在最优值求解结果精度上由至少1个数量级的提高,在最优解位置求解精度上有近1个数量级的提高,在优化求解方面有很大提升。这也证明了本发明中对标准萤火虫算法改进的正确性。
实施例2量子萤火虫算法四旋翼无人机参数整定可行性验证
参照附图1-7,本发明方法的具体实施步骤如下:
步骤1、建立典型四旋翼无人机俯仰姿态运动学模型为:
某型四旋翼飞行器的转动惯量为:Ix=0.045kgm2、Iy=0.06kgm2、Iz=0.083kgm2
p=0.06cos(0.3t)rad/s,r=0.04cos(0.6t)rad/s
将式(1)变换为式(2)的积分链式模型形式:
由俯仰姿态运动学模型阶数为2,设计分数阶PID控制器
俯仰角误差:e=θcmd-θ (3)
需整定的分数阶PID控制器参数为:X=[Kp Ki Kd α β]T,将控制器参数看作优化设计变量。
步骤2、设置萤火虫算法的萤火虫个数N=50、状态维数n=5、状态变量范围[Up1,Down1]=[1,20]、[Up2,Down2]=[0,20]、[Up3,Down3]=[5,20]、[Up4,Down4]=[0,1]、[Up5,Down5]=[0,1],萤火虫移动的最大步长Δθ=1、亮度吸收系数γ=0.8、最大吸引力β0=1、随机移动步长α=1,量子萤火虫算法中相同的参数设置与标准萤火虫算法一致,新增的算法参数设置精英保留策略的萤火虫个数为Nelite=4,Nelite>1;变异概率为Pmut=0.2,0<Prep<1;令亮度计算函数为Y=-J(X)ITAE。
步骤3、量子萤火虫初始化
结合实施例函数表达式可知萤火虫群中的每个萤火虫的状态均为一个5维向量,确定萤火虫个数N=50和设计变量维数n=5,利用rand()函数产生n=5行,N=50列个0-1之间的随机数,结合设计角度变量范围[0,2π],初始化获得N=50个量子萤火虫。
采用量子位的概率幅作为萤火虫当前位置编码,
式中,θij=2π×radmn;radmn为(0,1)之间的随机数;m是种群规模;n是优化变量空间维数;i=1,2,…,m;j=1,2,…,n。每个萤火虫位置占据遍历空间中的两个位置,分别对应量子态|0>和|1>的概率幅,即
XQic=(cos(θi1),cos(θi2),…,cos(θin)),XQis=(sin(θi1),sin(θi2),…,sin(θin)) (6)
式中,XQic为余弦位置,XQis为正弦位置。
步骤4、量子搜索
然后通过I0(X)计算当前量子位置XQi对应的每个解空间位置PQij,j=c,s的亮度值,取最大值作为当前量子位的亮度值I0Qi(XQi)。
步骤5、公告板更新
根据每个量子萤火虫当前位置的目标函数值为I0Qi(XQi),将最大值Yboard=max(I0Q1(XQ1),I0Q2(XQ2),…,I0QN(XQN))和对应的萤火虫位置Xboard=XQij if Yij=Yboard,j=c,s赋值给公告板;
步骤6、精英保留
将所有萤火虫按目标函数值从大到小进行排序,将排序后的前Nelite个萤火虫直接保留到下一次迭代,前Nelite个萤火虫不参与后续行为。
通过增加精英保留策略,便于后续位置更新、变异行为对除当前最优状态的萤火虫进行影响,保证前期计算的成果,避免重复搜索,浪费计算时间。
步骤7、位置更新
设第i个萤火虫XQi当前位置为Pi=[θi1 θi2 … θin],使用式(2)计算第i个萤火虫XQi与第j个萤火虫之间的距离dij,得到第i个萤火虫Xi与其他所有萤火虫之间的距离Di=(di1,di2,…,dij,…,diN);
dij=||Pi-Pj|| 1≤j≤N (9)
计算第j个萤火虫到第i个萤火虫的亮度:
式中,Ij0为距离dji=0时的光强(最亮),即自身亮度,这里可取为目标函数值,意味着目标值越优,亮度越亮;γ为吸收系数,因为荧光会随着距离的增加和传播媒介的吸收逐渐减弱,所以设置光强吸收系数以体现此特性,可设置为常数。
当Iji(dji)>Ii0时,萤火虫i将向萤火虫j运动,运动受到萤火虫j对萤火虫i吸引力的影响,量子的移动由量子旋转门实现,因此量子萤火虫位置更新应变为量子旋转门转角的更新:
Δθij=βijΔθ*f(θkj-θij)/|f(θkj-θij)|+α(rand-1/2) (11)
对于处于当前最佳位置的萤火虫,进行随机移动,即
Δθi=α(rand-1/2) (12)
萤火虫Xi更新后的两个新位置为:
这样,量子旋转门通过改变萤火虫的量子幅角,实现了对两个位置的同步移动,在种群规模不变的情况下,扩展了对搜索空间的遍历性。
步骤8、变异处理
萤火虫算法有陷入局部极值的可能,借鉴遗传算法,引入变异操作,增加种群多样性,避免早熟收敛,使用量子非门实现变异处理。设定变异概率Pmut,通过每个萤火虫抽取随机数rand()判断该萤火虫是否发生变异。若Pmut>rand()则变异发生,则随机选择变异量子位j=ceil(5*rand()),则采用量子非门改变该位置的角度,增加多样性。
θij=θij+PI/2 (14)
步骤9、若当前迭代次数l≤lmax,则令l=l+1,并执行步骤4;否则执行步骤11;
步骤10、输出公告板上的萤火虫位置Xboard及最优结果Yboard;
步骤11、若目标函数值满足需求,则Xboard即为最优姿态控制器参数。否则,返回步骤2,重新设置量子萤火虫算法参数,执行步骤3-11。
附图1给出了本发明方法进行控制器参数整定的流程图,附图2给出了应用本方法对四旋翼无人机分数阶PID姿态控制器进行整定的结构图。附图3-5附图1中量子萤火虫算法的执行流程图。附图6给出了实施例2的整定过程图,附图7给出了整定过程中每次当前最优控制器参数作用下的俯仰姿态控制曲线。
参照附图6可知目标函数值随迭代次数的增加不断减小,最终稳定在5.8附近。附图7中给出了每代当前最优控制器参数下的控制效果图,可知随着迭代次数的增加,最优控制参数不断更新,姿态控制效果不断提高。经过整定后获得最优控制器参数为:
Kp=7.91、Ki=2.87、Kd=19.8、α=0.72、β=0.98
最优ITAE指标为:5.76,可见仅经过30次迭代即可完成无人机自抗扰控制器参数整定。本发明方法在标准萤火虫算法的基础上,通过结合量子理论,引入精英保留、变异行对标准萤火虫算法进行改进,加快控制器参数整定的收敛速度、提高全局搜索能力和最优参数的求解精度。
本实施例在标准萤火虫算法的基础上,通过采用量子理论提高算法的单次寻优效率,加快收敛速度,引入精英保留、变异操作行为,克服现有参数整定方法对无人机分数阶PID控制器最优参数求解收敛精度不高、后期收敛性能严重降低和易陷入局部最优的缺陷的问题。该方法还可用于其他飞行器具有类似控制器结构的参数整定,具有一定的普适性。
以上所述实施例仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换,均属于本发明的保护范围。
Claims (2)
1.一种基于量子萤火虫算法的无人机姿控参数智能整定方法,其特征在于,包括以下步骤:
步骤1、建立无人机姿态运动模型,设计分数阶PID控制器,确定待整定参数,选择误差指标函数为目标函数;
步骤2、设置量子萤火虫算法参数;
步骤3、执行量子萤火虫算法进行控制器参数整定优化,获得本次整定最优控制器参数和目标函数值;
步骤4、判断目标函数值是否满足要求;若目标函数值满足需求,则萤火虫位置为最优姿态控制器参数,整定结束;否则,返回步骤2,重新设置量子萤火虫算法参数,执行步骤2-4;
所述步骤2设置量子萤火虫算法参数包括:设计变量的寻优范围为[Downk,Upk],k=1,2,…5,[Downk,Upk]为第k个设计变量的寻优范围,Upk为范围上界、Downk为范围下界;亮度吸收系数为γ;β0为最大吸引力;最大迭代次数为lmax,lmax>0;精英保留策略的萤火虫个数为Numelite,Numelite>1;变异概率为Pmut,0<Pmut<1;令萤火虫之间的距离计算公式为di,j=||Xi-Xj||;当前迭代次数l=1;
所述步骤3具体包括以下步骤:
步骤3.1、量子萤火虫初始化,采用量子位的概率幅作为萤火虫当前位置编码,
式中,θij=2π×rand;rand为(0,1)之间的随机数;m是种群规模;n是优化变量空间维数;i=1,2,…,m;j=1,2,…,n;每个萤火虫位置占据遍历空间中的两个位置,分别对应量子态|0>和|1>的概率幅,即:
XQic=(cos(θi1),cos(θi2),…,cos(θin)),XQis=(sin(θi1),sin(θi2),…,sin(θin)) (3)
式中,XQic为余弦位置,XQis为正弦位置;
步骤3.2、量子搜索
然后通过I0(X)计算当前量子位置XQi对应的每个解空间位置,即解空间中对应的正弦、余弦位置变量PQij',取最大值作为当前量子位的亮度值I0Qi(XQi);
步骤3.3、公告板更新
根据每个量子萤火虫当前位置的目标函数值为I0Qi(XQi),将最大值Yboard=max(I0Q1(XQ1),I0Q2(XQ2),…,I0QN(XQN))和对应的萤火虫位置Xboard=XQizifYiz=Yboard,z=c,s,赋值给公告板;
步骤3.4、精英保留
将所有萤火虫按目标函数值从大到小进行排序,将排序后的前Nelite个萤火虫直接保留到下一次迭代,前Nelite个萤火虫不参与后续行为;
步骤3.5、位置更新
设第i个萤火虫XQi当前位置为Pi=[θi1 θi2…θin],使用式(2)计算第i个萤火虫XQi与第j个萤火虫之间的距离dij,得到第i个萤火虫Xi与其他所有萤火虫之间的距离Di=(di1,di2,…,dij,…,diN);
dij=||Pi-Pj||,1≤j≤N (5)
计算第j个萤火虫到第i个萤火虫的亮度:
式中,Ij0为距离dij=0时的光强,即自身亮度;γ为吸收系数;
当Iij(dij)>Ii0时,萤火虫i将向萤火虫j运动,运动受到萤火虫j对萤火虫i吸引力的影响,量子的移动由量子旋转门实现,因此量子萤火虫位置更新应变为量子旋转门转角的更新:
Δθij=βijΔθ*f(θkj-θij)/|f(θkj-θij)|+α(rand-1/2) (7)
对于处于当前最佳位置的萤火虫,进行随机移动,即
Δθi=α(rand-1/2) (8)
萤火虫Xi更新后的两个新位置为:
步骤3.6、变异处理
设定变异概率Pmut,通过每个萤火虫抽取随机数rand()判断该萤火虫是否发生变异;若Pmut>rand()则变异发生,则随机选择变异量子位j”=ceil(5*rand()),则采用量子非门改变该位置的角度,增加多样性;
θik(l+1)=θik(l)+π/2 (10)
步骤3.7、若当前迭代次数l≤lmax,则令l=l+1,并执行步骤3.2;否则执行步骤4;
步骤3.8、输出公告板上的萤火虫位置Xboard及最优结果Yboard。
2.根据权利要求1所述的基于量子萤火虫算法的无人机姿控参数智能整定方法,其特征在于,所述步骤1具体为:
建立无人机的运动模型,设计分数阶PID姿态控制器其中e为俯仰角误差,为α阶分数阶微分算子,为β阶分数阶积分算子Kp、Ki、Kd为比例控制增益、积分控制增益和微分控制增益;确定待整定参数X=[Kp Ki Kd α β]T,选择时间乘以误差绝对值积分指标作为控制器参数整定的目标函数将控制器参数整定问题转化为控制器参数的优化问题,该问题表述如下:
由于萤火虫算法是求目标函数最大值,而无人机飞控希望误差指标最小,则萤火虫算法的自身亮度计算公式为I0(X)=-f(X),其中f(X)=Y为控制器参数整定目标函数值,反映了控制器参数的姿态控制效果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011167531.1A CN112596373B (zh) | 2020-10-27 | 2020-10-27 | 一种基于量子萤火虫算法的无人机姿控参数智能整定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011167531.1A CN112596373B (zh) | 2020-10-27 | 2020-10-27 | 一种基于量子萤火虫算法的无人机姿控参数智能整定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112596373A CN112596373A (zh) | 2021-04-02 |
CN112596373B true CN112596373B (zh) | 2023-05-23 |
Family
ID=75180609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011167531.1A Active CN112596373B (zh) | 2020-10-27 | 2020-10-27 | 一种基于量子萤火虫算法的无人机姿控参数智能整定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112596373B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113341696A (zh) * | 2021-06-10 | 2021-09-03 | 西北工业大学 | 一种运载火箭姿态控制参数智能整定方法 |
CN113406882B (zh) * | 2021-06-10 | 2023-07-11 | 西北工业大学 | 一种基于分数阶pid控制的核动力装置管路系统减振降噪方法 |
CN113364362B (zh) * | 2021-06-30 | 2023-03-24 | 青岛恒星智能装备有限公司 | 一种基于萤火虫优化的感应电机转速估计方法 |
CN116633830B (zh) * | 2023-05-25 | 2024-01-23 | 哈尔滨工业大学 | 一种基于萤火虫算法的种子变异操作调度方法 |
CN116817684B (zh) * | 2023-07-17 | 2024-03-26 | 东方空间技术(山东)有限公司 | 基于萤火虫算法的火箭入轨倾角修正方法、设备及介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104102791A (zh) * | 2014-08-01 | 2014-10-15 | 哈尔滨工程大学 | 一种基于量子萤火虫搜索机制的天线阵稀疏构建方法 |
CN104406593A (zh) * | 2014-12-03 | 2015-03-11 | 广西民族大学 | 一种确定无人机航路最优路径的方法 |
US9097751B1 (en) * | 2012-11-28 | 2015-08-04 | The United States Of America, As Represented By The Secretary Of The Navy | Linear voltage response of non-uniform arrays of bi-SQUIDs |
CN105760959A (zh) * | 2016-02-24 | 2016-07-13 | 武汉大学 | 一种基于两阶段萤火虫编码的机组组合优化方法 |
CN106325062A (zh) * | 2016-08-26 | 2017-01-11 | 武汉科技大学 | 一种基于改进萤火虫算法的恒定磨削力pid控制优化方法 |
CN107219858A (zh) * | 2017-04-26 | 2017-09-29 | 西北工业大学 | 一种改进萤火虫算法的多无人机协同耦合任务分配方法 |
CN107300925A (zh) * | 2017-07-12 | 2017-10-27 | 西北工业大学 | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 |
US10041833B1 (en) * | 2016-04-05 | 2018-08-07 | The United States of America as Represented by the Adminstrator of the NASA | System and method for active multispectral imaging and optical communications |
CN108388666A (zh) * | 2018-03-16 | 2018-08-10 | 重庆邮电大学 | 一种基于萤火虫算法的数据库多表连接查询优化方法 |
CN108549402A (zh) * | 2018-03-19 | 2018-09-18 | 哈尔滨工程大学 | 基于量子乌鸦群搜索机制的无人机群任务分配方法 |
CN108985549A (zh) * | 2018-05-25 | 2018-12-11 | 哈尔滨工程大学 | 基于量子鸽群机制的无人机任务分配方法 |
CN110948482A (zh) * | 2019-11-06 | 2020-04-03 | 江苏信息职业技术学院 | 一种冗余机器人轨迹规划方法 |
-
2020
- 2020-10-27 CN CN202011167531.1A patent/CN112596373B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9097751B1 (en) * | 2012-11-28 | 2015-08-04 | The United States Of America, As Represented By The Secretary Of The Navy | Linear voltage response of non-uniform arrays of bi-SQUIDs |
CN104102791A (zh) * | 2014-08-01 | 2014-10-15 | 哈尔滨工程大学 | 一种基于量子萤火虫搜索机制的天线阵稀疏构建方法 |
CN104406593A (zh) * | 2014-12-03 | 2015-03-11 | 广西民族大学 | 一种确定无人机航路最优路径的方法 |
CN105760959A (zh) * | 2016-02-24 | 2016-07-13 | 武汉大学 | 一种基于两阶段萤火虫编码的机组组合优化方法 |
US10041833B1 (en) * | 2016-04-05 | 2018-08-07 | The United States of America as Represented by the Adminstrator of the NASA | System and method for active multispectral imaging and optical communications |
CN106325062A (zh) * | 2016-08-26 | 2017-01-11 | 武汉科技大学 | 一种基于改进萤火虫算法的恒定磨削力pid控制优化方法 |
CN107219858A (zh) * | 2017-04-26 | 2017-09-29 | 西北工业大学 | 一种改进萤火虫算法的多无人机协同耦合任务分配方法 |
CN107300925A (zh) * | 2017-07-12 | 2017-10-27 | 西北工业大学 | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 |
CN108388666A (zh) * | 2018-03-16 | 2018-08-10 | 重庆邮电大学 | 一种基于萤火虫算法的数据库多表连接查询优化方法 |
CN108549402A (zh) * | 2018-03-19 | 2018-09-18 | 哈尔滨工程大学 | 基于量子乌鸦群搜索机制的无人机群任务分配方法 |
CN108985549A (zh) * | 2018-05-25 | 2018-12-11 | 哈尔滨工程大学 | 基于量子鸽群机制的无人机任务分配方法 |
CN110948482A (zh) * | 2019-11-06 | 2020-04-03 | 江苏信息职业技术学院 | 一种冗余机器人轨迹规划方法 |
Non-Patent Citations (2)
Title |
---|
Glowworm swarm optimization algorithm with Quantum-behaved properties;Jiangshao Gu,et al.;《2014 10th International Conference on Natural Computation (ICNC)》;20141231;第430-436页 * |
应用混沌萤火虫算法的无人机航迹规划;余胜东等;《机械设计与制造》;20181130(第11期);第113-116页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112596373A (zh) | 2021-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112596373B (zh) | 一种基于量子萤火虫算法的无人机姿控参数智能整定方法 | |
US20220004191A1 (en) | Usv formation path-following method based on deep reinforcement learning | |
CN107300925B (zh) | 基于改进鱼群算法的四旋翼无人机姿控参数整定方法 | |
CN111008449A (zh) | 一种用于战场仿真环境下深度强化学习推演决策训练的加速方法 | |
CN109522602A (zh) | 一种基于代理模型的Modelica模型参数优化方法 | |
CN113641099B (zh) | 一种超越专家演示的阻抗控制模仿学习训练方法 | |
CN114089776B (zh) | 一种基于深度强化学习的无人机避障方法 | |
CN103105774A (zh) | 基于改进的量子进化算法的分数阶pid控制器整定方法 | |
Fernandez-Gauna et al. | Experiments of conditioned reinforcement learning in continuous space control tasks | |
CN114859899A (zh) | 移动机器人导航避障的演员-评论家稳定性强化学习方法 | |
CN113379027A (zh) | 一种生成对抗交互模仿学习方法、系统、存储介质及应用 | |
CN117608200B (zh) | 一种海洋航行器路径规划方法 | |
CN115981372A (zh) | 一种高马赫数飞行器跳跃飞行段轨迹优化方法 | |
CN105117616B (zh) | 基于粒子群算法的微生物发酵优化方法 | |
CN118034373A (zh) | 一种平流层飞艇环境最优智能区域驻留控制方法及系统 | |
CN101866144A (zh) | 一种基于ITAE的Furuta摆智能控制方法 | |
CN113341696A (zh) | 一种运载火箭姿态控制参数智能整定方法 | |
CN107180261B (zh) | 基于滚动bp神经网络的温室小气候中长期预测方法 | |
CN108453737A (zh) | 一种基于神经网络的机器人动作轨迹获取系统及方法 | |
CN107886163A (zh) | 基于agn及cnn的单目标优化问题寻优方法及装置 | |
CN116400726A (zh) | 一种基于强化学习的旋翼无人机逃逸方法及系统 | |
CN113821057B (zh) | 一种基于强化学习的行星软着陆控制方法及系统和存储介质 | |
CN116047904A (zh) | 面向机器人操作技能学习的人员仿真现实混合训练方法 | |
CN115453880A (zh) | 基于对抗神经网络的用于状态预测的生成模型的训练方法 | |
Chen et al. | The determination of reward function in agv motion control based on dqn |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |