CN108803330B - 一种基于性格系数调节的教与学优化滑模控制方法 - Google Patents

一种基于性格系数调节的教与学优化滑模控制方法 Download PDF

Info

Publication number
CN108803330B
CN108803330B CN201810636095.4A CN201810636095A CN108803330B CN 108803330 B CN108803330 B CN 108803330B CN 201810636095 A CN201810636095 A CN 201810636095A CN 108803330 B CN108803330 B CN 108803330B
Authority
CN
China
Prior art keywords
learning
sliding mode
teaching
algorithm
character coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810636095.4A
Other languages
English (en)
Other versions
CN108803330A (zh
Inventor
肖玲斐
何虹兴
孟中祥
徐敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201810636095.4A priority Critical patent/CN108803330B/zh
Publication of CN108803330A publication Critical patent/CN108803330A/zh
Application granted granted Critical
Publication of CN108803330B publication Critical patent/CN108803330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于性格系数调节的教与学优化滑模控制方法,提出了一种基于性格系数调节的改进教与学算法,并用于优化滑模控制器的可设计参数,从而削弱滑模控制的抖振现象,实现滑模控制系统性能的提高,提高滑模控制方法的实用可行性。此外,在改进教与学算法中,针对算法后期搜索速度变慢的情况,设置了一个对性格系数的激励措施:当学员在学习过程中取得进步的时候,其性格系数会被修正。修正的规则是:当学员是在互学过程中取得进步时,令其性格系数增大;若学员是在自学过程中有所收获,则令其性格系数减小。通过性格系数及其激励措施,教与学算法的局部搜索能力增强,全局收敛性提高,算法后期的收敛速度加快,并能够有效避免早熟现象。

Description

一种基于性格系数调节的教与学优化滑模控制方法
技术领域
本发明涉及控制系统优化技术,具体涉及一种基于性格系数调节的教与学优化滑模控制方法。
背景技术
智能优化算法是近几十年里发展起来的一类启发式算法,代表性的智能优化算法有遗传算法、粒子群算法、人工神经网络、模拟退火算法等。
随着科学技术的不断进步,人们对高效的优化技术和精准的智能计算也提出了更高的要求,这也就要求一方面要不断地进行新型智能算法的研究,一方面也需要不断地对既有智能算法进行改进和完善。同时,拓宽智能算法的应用领域既能对带来实际的效益,给相关现实问题的研究带来一些启发,同时也是对算法内容的一种验证、诠释和补充。因此,智能算法的应用研究是一个同时具有理论意义和实际价值的重要课题。
本发明所研究的教与学算法则是近几年新出现的尚在发展阶段一种智能算法。
教与学算法(Teaching-Learning Based Optimization,TLBO)是Rao等人于2010年提出的一种新的群智能优化算法,该方法模拟教师的教导过程与学生的学习过程来求得最优解。教与学算法参数少、结构简单、概念简明、求解精度高、收敛速度快且具有极强的收敛能力。相比较一些经典的智能优化算法,比如粒子群算法,该算法的特点在于算法仅有群成员数和迭代代数两个参数,需要设置的参数少,可以避免参数设置不当引起的计算效率降低或易陷入局部收敛等问题。教与学算法从提出到现在短短的几年里,便已经引起了很多学者的关注,并得到了很好的应用。2012年Rao等分别提出了精英TLBO算法和改进教与学算法,两者分别应用在复杂优化问题和无约束优化问题,并均显示出了良好的性能。拓守恒等人对教与学算法进行改进,提出一种“自我学习”策略,并将改进方法应用到主动悬架LQR控制器权系数的优化。李岩等人提出一种考虑区间模式和本地模式协调的时滞广域阻尼控制器设计新方法,应用教与学优化算法确定最优增益序列,其对新英格兰测试系统的仿真结果表明该方法能有效抑制区间振荡的同时还能保证本地振荡模式不恶化,并对时滞有很好的鲁棒性。Zou等提出一种求解多目标优化问题的TLBO算法(MOPs),把当前种群中拥挤度最大的非劣解设为教师,非劣解的群体中心作为群体的平均个体,仿真结果表明了MOPs算法的有效性。教与学算法作为新兴的一种智能优化算法,尽管受到了很多学者的关注,并也得到了一些实践成效,可仍存在着很多的问题。与教与学算法相对鲜明的社会特性基础相比,其数学基础显得相对薄弱,缺乏深刻且有普遍意义的理论分析。而在实际应用也存在着容易早熟收敛的问题。教与学算法的“教”过程其实就是全部解向最优点靠拢的过程,这就使得算法的多样性容易过早丢失,跳出局部收敛的能力较差。而算法的设置参数较少,那么算法的结果往往依赖于随机选择的初始群体的分布情况,算法十分容易陷入早熟收敛和局部收敛。除了算法本身存在的问题之外,其具体应用研究也应当是今后研究的重点。考虑到教与学算法的研究时间较短,其应用领域仍有待于进一步拓宽。目前的应用研究稍显不足,今后的研究应当多注重在动态、多约束、离散、多目标等复杂问题上的研究和应用。就工程和自动化领域而言,这类复杂问题是普遍存在的。因此,教育学算法是一个十分具有研究价值和应用前景的课题。
智能算法在控制领域中的应用可以说是一个优化问题的拓展。考虑到随着技术的进步,控制对象变得越来越复杂,对控制任务的精度要求越来越高,控制器的设计还有很大的优化空间,因此采用智能算法去处理控制器的优化问题是一个非常行之有效的手段。
前苏联学者Utkin和Emelyanov在20世纪50年代提出了变结构控制的概念,并经过20年左右的发展,提出了滑模有关变结构VSC和滑模控制SMC的方法。此后,各国学者对滑模变结构控制的研究兴趣急剧上升。K.D.Young等从工程的角度,对滑模控制进行了全面分析,并对滑模控制所产生的抖振进行了精确分析和评估,针对连续系统中的抑制抖动提出了七种解决方法,并针对离散系统在三种情况下的滑模设计进行了分析,为滑模控制在工程商的应用提供了有益的指导。高为炳院士等首先提出了趋近律的概念,并首次提出了自由递阶的概念。到目前为止,滑模控制已形成了一个相对独立的研究分支,成为了自动控制系统的一种一般的设计方法,并在设计工程中得到了广泛的应用。
滑模控制本质上是一种特殊的非线性控制,主要表现为控制的不连续性。系统的结构并不固定,而是在动态过程中,按照设定的滑动模态的状态轨迹运动。然而,系统在到达滑模面时,往往需要考虑到滞后、惯性和离散系统的影响,本身的不连续开关特性难以使系统按照滑模面滑动,形成抖振,严重时甚至会破坏系统性能,造成失稳。
因此,滑模控制的抖振现象,一直是滑模控制理论与应用研究中,需要面对和解决的重要问题。
发明内容
发明目的:本发明针对常规教与学算法的优缺点,提出基于性格系数调节的教与学算法改进策略,并用于优化滑模控制律中的可设计参数,实现削弱滑模控制的抖振现象,提高滑模控制系统的性能,增强滑模控制方法的实用性。
技术方案:
一种基于性格系数调节的教与学优化滑模控制方法,包括步骤:
步骤(1):
对于如下状态空间模型描述的多输入多输出系统:
Figure BDA0001700880090000031
式中x(t)∈Rn是系统的状态变量,n表示状态变量的维数,t表示时间;u(t)∈Rm为控制输入,m表示输入变量的维数;y(t)∈Rp为测量输出变量,p表示输出变量的维数,A,B,C,D均为适当维数的常数矩阵,矩阵B和C满秩,且系统可控和可观;
步骤(2):
设计滑模函数s(t)为:
s(t)=σx(t) (2)
式中,σ为可设计的滑模参数矩阵,使得σB的逆矩阵(σB)-1存在;
根据极点配置方法,确定σ,用以保证滑模面
Figure BDA0001700880090000032
上状态能够渐近收敛到状态空间原点且具有良好的动态性能;
步骤(3):
设计滑模控制器u(t),用以保证状态x(t)从初始位置,到达滑模面
Figure BDA0001700880090000035
并之后不离开滑模面;
一方面,根据滑模面到达条件
Figure BDA0001700880090000033
采用趋近律设计方法,令
Figure BDA0001700880090000034
其中,ε>0和ρ>0为可设计的趋近律参数,sgn(·)为符号函数;
另一方面,对式(2)求导数,并结合式(1),有
Figure BDA0001700880090000041
对比式(3)与式(4),显然有
σ[Ax(t)+Bu(t)]=-εsgn(s)-ρs (5)
因此,可得滑模控制器u(t)的表达形式为
u(t)=(σB)-1[-σAx(t)-εsgn(s)-ρs] (6)
步骤(4):
通过基于性格系数调节的改进的教与学优化算法,对滑模控制器(6)中的参数ε和ρ进行优化;具体步骤如下:
步骤(4-1):
根据常规教与学优化算法,取定种群规模大小,迭代次数和选取适应值函数;对于一个优化问题:
Figure BDA0001700880090000042
搜索空间
Figure BDA0001700880090000043
空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数,
Figure BDA0001700880090000044
Figure BDA0001700880090000045
分别表示每一维的上界和下界,i=1,2,…,d;f(X)为目标函数;取X=(ε,ρ),因此d=2;
步骤(4-2):
初始化班级:在搜索空间中随机生成班级中的每个学员
Figure BDA0001700880090000046
j=1,2,…,NP;生成方法按如下公式进行:
Figure BDA0001700880090000047
其中,j=1,2,…,NP;i=1,2,…,d;
Figure BDA0001700880090000048
为点Xj的一个决策变量,NP为空间搜索点的个数;
对每一个学员赋予一个随机的性格系数β,其中β介于0和1之间,记为β=rand(0,1);性格系数β越接近1,表明该学员交际圈越广,越偏好互学;而性格系数β越接近0,则该学员更倾向于自学;
步骤(4-3):
选取成绩最为优秀的学员Xbest作为教师Xteacher,根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,具体的教学方法如下式:
Figure BDA0001700880090000051
difference=ri×(Xteacher-TFi×Mean)
式中:
Figure BDA0001700880090000052
Figure BDA0001700880090000053
分别表示第i个学员学习前和学习后的值,
Figure BDA0001700880090000054
表示全部学员的平均值;教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1),前者表征教师的教学能力,后者表征学生的学习能力;
步骤(4-4):
互学过程:
对第i个学员Xi赋予性格系数βi=rand(0,1),依据其性格系数的大小来随机选取Zi个学习对象
Figure BDA0001700880090000055
进行相互学习;
其中,p1=1,2,…,NP;p2=1,2,…,NP;…;
Figure BDA0001700880090000056
Zi是一个与性格系数相关的变量,Zi的选择依照如下公式进行:
Figure BDA0001700880090000057
式中,βmin和βmax分别表示群体性格系数的最小值和最大值;Zmin和Zmax则分别表示可参与到互学过程的同学的最小人数和最大人数;一般情况下,取Zmin=1、
Figure BDA0001700880090000058
进行互学:
Figure BDA0001700880090000059
Figure BDA0001700880090000061
其中,rand(1,d)表示在[0,1]随机生成一个d维的行向量;
Figure BDA0001700880090000062
表示在随机选择的Zi个学员中,具有最优适应度的个体;
如果
Figure BDA0001700880090000063
Figure BDA0001700880090000064
将βi+rand(0,1)×(1-βi)的值赋予βi,实现性格系数βi的更新;
步骤(4-5):
自学过程:
若βi<rand(0,1),则
Figure BDA0001700880090000065
若βi≥rand(0,1),则
Figure BDA0001700880090000066
如果
Figure BDA0001700880090000067
Figure BDA0001700880090000068
将βi[1-rand(0,1)]的值赋予βi,实现性格系数βi的更新;
step1和step2均为自学调整步长,且有:
Figure BDA0001700880090000069
Figure BDA00017008800900000610
式中,
Figure BDA00017008800900000611
表示由每一维的上界组成的集合,
Figure BDA00017008800900000612
表示由每一维的下界组成的集合;tT是当前迭代次数,T是允许最大迭代次数;
步骤(4-6):
最终得到优化的(ε,ρ),根据获得的(ε,ρ),依照式(6)确定滑模控制器u(t)。
有益效果:本发明针对常规教与学算法的优缺点,提出基于性格系数调节的教与学算法改进策略(MTLBO),并用于优化滑模控制系统设计中,将切换控制增益作为优化目标,通过优化得出一个优化的切换控制项,从而有效地减弱了抖振现象,提高了滑模控制系统的性能,增强了滑模控制方法的实用性。
此外,本发明所提MTLBO算法,对其他自动控制系统的控制器参数优化亦可提供有利参考。
附图说明
图1为常规教与学算法流程图。
图2为本发明具体实施例中超燃冲压发动机简图。
图3为在没有参数优化情况下,滑膜控制的仿真结果中系统状态量x变化曲线图。
图4为在没有参数优化情况下,滑膜控制的仿真结果中系统控制量u变化曲线图。
图5为Sphere函数进化曲线图。
图6为Rosenbrock函数进化曲线图。
图7为Griewank函数进化曲线图。
图8为Rastrigin函数进化曲线图。
图9为Ackley函数进化曲线图。
图10为Rotated hyper-ellipsoid函数进化曲线图。
图11为Schwefel Problem 2.22函数进化曲线图。
图12为采用本发明的方法进行的超燃冲压发动机滑模控制计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果中系统状态变量变化曲线比较图。
图13为采用本发明的方法进行的超燃冲压发动机滑模控制计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果中系统控制量变化曲线比较图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
常规教与学算法
常规TLBO算法是一种群集智能优化算法,种群规模等同于班级中的学员的数量,学员的学习能力相当于优化变量,学习成绩即是评价指标,其中的成绩最优者相当于教学阶段的教师。所有班级中的学员成绩都需要教师的“教”过程来引导,同时,学员间也需要互“学”来促使知识的吸收。这里,就涉及到“教师”、“学员”、和“班级”等几个基本概念。
对于一个优化问题:
Figure BDA0001700880090000071
搜索空间
Figure BDA0001700880090000072
空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数(决策变量的个数),
Figure BDA0001700880090000073
Figure BDA0001700880090000074
(i=1,2,…,d)分别表示为每一维的上界和下界,f(X)为目标函数。设
Figure BDA0001700880090000075
j=(1,2,…,NP)为搜索空间中的一个点,
Figure BDA0001700880090000076
为点Xj的一个决策变量,NP为空间搜索点的个数(也即是种群规模)。将其分别对应于常规TLBO算法中即为:
1)班级:在TLBO算法中,将搜索空间中所有搜索粒子的集合称为班级(class)。
2)学员:班级中的任意个体
Figure BDA0001700880090000081
称之为一个学员。
3)教师:班级中成绩最优的一名学员Xbest称之为教师,本发明中用Xteacher表示。
因此,一个班级可以用如下形式表示为:
Figure BDA0001700880090000082
其中:Xj(j=1,2,…,NP)表示班级学员,Xteacher=argmaxf(Xj)(j=1,2,…,NP)。NP为学员个数,d为学员所学科目数量。
算法步骤如图2所示:
1)初始化班级:在搜索空间中随机生成班级中的每个学员
Figure BDA0001700880090000083
j=(1,2,…,NP);生成方法按如下公式进行:
Figure BDA0001700880090000084
2)“教”阶段
在教与学算法的教学阶段,选取成绩最为优秀的学员Xbest作为教师Xteacher。根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,在一定程度上提高每个学员的成绩,从而提高班级平均值。需要注意的是,学员所能获取的知识量,既取决于教师和班级学员平均值Mean的差值,还取决于教师的教学因子和学生的学习能力,因此,教学阶段的提升空间是有限的。
假设学员的学科成绩服从正态分布,在最初,班级平均成绩为MeanA=30,平均成绩低且分布较广。经过教师多次的“教”过程,班级平均成绩逐步提高到MeanB=80,成绩提高且分布集中。具体的教学方法如下式:
Figure BDA0001700880090000085
difference=ri×(Xteacher-TFi×Mean)
式中:
Figure BDA0001700880090000091
Figure BDA0001700880090000092
分别表示第i个学员学习前和学习后的值,
Figure BDA0001700880090000093
表示全部学员的平均值。此外,式中还有两个重要的参数:教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1)。前者表征了教师的教学能力,后者表征了学生的学习能力。
3)“学”阶段
“学”阶段指的是学生间的相互学习,通过对比分析学员间的差异来进行学习。对每一个学员Xi(i=1,2,…,NP),在班级中随机选取一个学习对象Xj(j=1,2,…,NP,j≠i),Xi通过分析自己与Xj的差异进行学习调整,学习改进的方法类似于差分算法中的差分变异算子。不同的地方在于,教与学算法中的学习步长r对每个不同的学员采用不同的学习因子。学员Xi和Xj之间通过对比各自的目标函数值(也即学习成绩),较劣者向较优者靠拢,以这样的方式,实现学生间的互学和进步。具体的调整过程可用下式表示:
Figure BDA0001700880090000094
式中,ri为第i个学员的学习步长,且ri=U(0,1)。
4)“更新”操作
学员在通过“教”与“学”阶段时都要进行更新操作。更新操作的目的是用学习后的较优个体替代较劣个体,以实现全部学员平均成绩的提高。更新操作如下:
Figure BDA0001700880090000095
Figure BDA0001700880090000096
End.
基于性格系数调节的改进教与学算法(MTLBO):
对于单峰值优化问题,教与学算法的收敛速度很快,并有着很高的求解精度,并且由于算法结构简单,自定义参数少,运行代价较小。然而,在处理多峰值的优化问题时,由于教学阶段本质上是学员向教师快速靠拢的过程,算法的多样性丢失迅速,极易陷入局部搜索,因此在这类问题上常规教与学算法的全局搜索能力较差。为了改进教与学算法的性能,一种比较好的思路就算是对算法的“学习”阶段进行改进。
本发明提出一种改进的教与学算法,对“学”阶段进行了优化和改进,通过引入随机数操作使得算法跳出局部收敛的能力增强,同时设置了激励因子以加强算法后期的收敛速度。改进的主要目的是为了提高算法的局部搜索能力,使算法具有更好的全局收敛性。
在标准的教与学优化算法中,学习过程只有两个学员间的相互学习,学员间的信息交流较少。考虑到教与学算法本身鲜明的社会特性,不同性格的人往往具有不同的交际圈,其学习策略也就越不尽相同。本发明引入一个“性格系数”β,用来区别学员的学习方法。在初始化学员的参数时候,对每一个学员赋予一个随机的性格系数β=rand(0,1)。假定性格系数越大的人,交际圈越广,也越偏好互学。而性格系数越小的人,则更倾向于自学。
由于性格系数的引进和相关的变量调整,可能会出现算法后期搜索速度变慢的情况,因此引入一个激励措施:当学员在学习过程中取得进步的时候,其性格系数会被修正。当学员是在互学过程中取得进步时,令其性格系数增大;若学员是在自学过程中有所收获,则令其性格系数减小。
通过性格系数的引入和激励措施的调整以区分不同性格的人的学习手段,以增加算子的局部搜索能力,同时使得算法后期的收敛速度加快,可以有效地避免早熟现象,提高算法的全局收敛性。
其具体操作如下:
1)互学过程:
对第i个学员Xi赋予性格系数βi=rand(0,1),依据其性格系数的大小来随机选取Zi个学习对象
Figure BDA0001700880090000101
进行相互学习。Zi是一个与性格系数相关的变量,其作用是确定所选取的学员个数,Zi的选择依照如下公式进行:
Figure BDA0001700880090000102
式中,βmin和βmax分别表示群体性格系数的最小值和最大值。Zmin和Zmax则分别表示可参与到互学过程的同学的最小人数和最大人数。一般情况下,取Zmin=1、
Figure BDA0001700880090000111
由于参与互学过程的人数往往不止一个,为了避免盲目学习浪费时间,提高学习效率和成功率,需要比较全部学习对象的优劣性并计算小组成员的差异性,以得到一个局部最优的学习方式。
互学过程的伪代码如下:
For i=1:NP
Figure BDA0001700880090000112
Select Zi individuals at random from the current population,when
Figure BDA0001700880090000113
Figure BDA0001700880090000114
Figure BDA0001700880090000115
Figure BDA0001700880090000116
andβi=βi+rand(0,1)×(1-βi);
End
其中,rand(1,d)表示在[0,1]随机生成一个d维的行向量。
Figure BDA0001700880090000117
表示在随机选择的Zi个学员中,具有最优适应度的个体。
2)自学过程:
相比于互学过程是为了保持种群的多样,自我学习的过程则更多地赋予了算法更高的局部搜索能力。假定性格系数较高的学员自学能力较弱,其自我学习调整主要是对现有知识的梳理和复习,因而搜索空间较窄;而性格系数较低的学员更偏好自学,自我学习能力较强,自学的过程主要是对新知识的学习过程,因此搜索空间较广。依照这种假定,有两种策略对学员进行自学调整。考虑到随着算法的进行,种群的适应度也在不断变高,学习效率也将不断减慢,因此通过自适应的学习步长来调整局部搜索能力。具体的“自学”过程的伪代码如下:
Figure BDA0001700880090000118
Figure BDA0001700880090000121
式中,
Figure BDA0001700880090000122
表示由每一维的上界组成的集合,
Figure BDA0001700880090000123
表示由每一维的下界组成的集合;tT是当前迭代次数,T是允许最大迭代次数。
基于改进教与学算法(MTLBO)的滑模控制系统:
对于如下的多输入多输出系统:
Figure BDA0001700880090000124
式中x(t)∈Rn是系统的状态变量,n表示状态变量的维数,t表示时间;u(t)∈Rm为控制输入,m表示输入变量的维数;y(t)∈Rp为测量输出变量,p表示输出变量的维数,A,B,C,D均为适当维数的常数矩阵,矩阵B和C满秩,且系统可控和可观;
步骤(2):
设计滑模函数s(t)为:
s(t)=σx(t) (2)
式中,σ为可设计的滑模参数矩阵,使得σB的逆矩阵(σB)-1存在;
根据极点配置方法,确定σ,用以保证滑模面
Figure BDA0001700880090000131
上状态能够渐近收敛到状态空间原点且具有良好的动态性能;
步骤(3):
设计滑模控制器u(t),用以保证状态x(t)从初始位置,到达滑模面
Figure BDA0001700880090000139
并之后不离开滑模面;
一方面,根据滑模面到达条件
Figure BDA0001700880090000132
采用趋近律设计方法,令
Figure BDA0001700880090000133
其中,ε>0和ρ>0为可设计的趋近律参数,sgn(·)为符号函数;
另一方面,对式(2)求导数,并结合式(1),有
Figure BDA0001700880090000138
对比式(3)与式(4),显然有
σ[Ax(t)+Bu(t)]=-εsgn(s)-ρs (5)
因此,可得滑模控制器u(t)的表达形式为
u(t)=(σB)-1[-σAx(t)-εsgn(s)-ρs] (6)
步骤(4):将滑模控制器(6)中的参数ε和ρ作为优化目标,通过基于性格系数调节的改进的教与学优化算法进行优化,取定种群规模大小,迭代次数和选取适应值函数,并考虑到控制量约束条件,可采用改进的教与学算法(MTLBO)进行滑模控制器参数优化,得出最优的(ε,ρ);具体如下:
步骤(4-1):
根据常规教与学优化算法,取定种群规模大小,迭代次数和选取适应值函数;对于一个优化问题:
Figure BDA0001700880090000134
搜索空间
Figure BDA0001700880090000135
空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数,
Figure BDA0001700880090000136
Figure BDA0001700880090000137
分别表示每一维的上界和下界,i=1,2,…,d;f(X)为目标函数;取X=(ε,ρ),因此d=2;
步骤(4-2):
初始化班级:在搜索空间中随机生成班级中的每个学员
Figure BDA0001700880090000141
j=1,2,…,NP;生成方法按如下公式进行:
Figure BDA0001700880090000142
其中,j=1,2,…,NP;i=1,2,…,d;
Figure BDA0001700880090000143
为点Xj的一个决策变量,NP为空间搜索点的个数;
对每一个学员赋予一个随机的性格系数β,其中β介于0和1之间,记为β=rand(0,1);性格系数β越接近1,表明该学员交际圈越广,越偏好互学;而性格系数β越接近0,则该学员更倾向于自学;
步骤(4-3):
选取成绩最为优秀的学员Xbest作为教师Xteacher,根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,具体的教学方法如下式
Figure BDA0001700880090000144
difference=ri×(Xteacher-TFi×Mean)
式中:
Figure BDA0001700880090000145
Figure BDA0001700880090000146
分别表示第i个学员学习前和学习后的值,
Figure BDA0001700880090000147
表示全部学员的平均值;教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1),前者表征教师的教学能力,后者表征学生的学习能力;
步骤(4-4):
互学过程:
对第i个学员Xi赋予性格系数βi=rand(0,1),依据其性格系数的大小来随机选取Zi个学习对象
Figure BDA0001700880090000148
进行相互学习;
其中,p1=1,2,…,NP;p2=1,2,…,NP;…;
Figure BDA0001700880090000151
Zi是一个与性格系数相关的变量,Zi的选择依照如下公式进行:
Figure BDA0001700880090000152
式中,βmin和βmax分别表示群体性格系数的最小值和最大值;Zmin和Zmax则分别表示可参与到互学过程的同学的最小人数和最大人数;
进行互学:
Figure BDA0001700880090000153
Figure BDA0001700880090000154
其中,rand(1,d)表示在[0,1]随机生成一个d维的行向量;
Figure BDA0001700880090000155
表示在随机选择的Zi个学员中,具有最优适应度的个体;
如果
Figure BDA0001700880090000156
Figure BDA0001700880090000157
将βi+rand(0,1)×(1-βi)的值赋予βi,实现性格系数βi的更新;
步骤(4-5):
自学过程:
若βi<rand(0,1),则
Figure BDA0001700880090000158
若βi≥rand(0,1),则
Figure BDA0001700880090000159
如果
Figure BDA00017008800900001510
Figure BDA00017008800900001511
将βi[1-rand(0,1)]的值赋予βi,实现性格系数βi的更新;
step1和step2均为自学调整步长,且有:
Figure BDA00017008800900001512
Figure BDA00017008800900001513
式中,
Figure BDA0001700880090000161
表示由每一维的上界组成的集合,
Figure BDA0001700880090000162
表示由每一维的下界组成的集合;tT是当前迭代次数,T是允许最大迭代次数;
步骤(4-6):
最终得到优化的(ε,ρ),根据获得的(ε,ρ),依照式(6)确定滑模控制器u(t)。
本发明对超燃冲压发动机的燃油控制问题,采用了滑模控制的方式。首先将燃油控制传递函数矩阵模型转换为状态空间模型,之后设计滑模控制器。在此基础上,应用改进的教与学算法对滑模参数进行优化,以提升控制性能。仿真结果结果证明了超燃冲压发动机燃油控制系统的滑模控制的稳定性和良好的动态特性,以及应用改进教与学算法优化设计滑模控制器的可行性。
超燃冲压发动机由进气道、燃烧室和尾喷管组成,简图如图2所示,选用两点供油的燃烧室构型。燃油控制系统的模型为:y=G(s)u,传递函数矩阵如下式所示。
Figure BDA0001700880090000163
控制输入为u=(u1,u2)T,其中u1=mf1,u2=mf2
u1为第一路燃油喷嘴供油量;u2为第二路燃油喷嘴供油量。
系统的输出y=(y1,y2)T,其中y1=σ1=P2.2/P2,y2=σ2=P3/P2
σ1为第一路燃油喷嘴后的燃烧室静压恢复系数;σ2为燃烧室的静压恢复系数;P2为燃烧室入口静压;P2.2为第一路燃油喷嘴后静压;P3为燃烧室出口静压。
该燃油控制系统是一个多输入多输出系统,根据现代控制理论,可知该系统可控且可观,其传递函数矩阵式(18)可以转换为如下的多输入多输出状态空间模型:
Figure BDA0001700880090000164
y(t)=Cx(t)+Du(t).
其中,
Figure BDA0001700880090000165
Figure BDA0001700880090000171
根据滑模控制理论和极点配置方法,选取可设计的滑模参数矩阵
Figure BDA0001700880090000172
首先,我们考虑无优化时的超燃冲压发动机滑模控制。
选取可设计趋近律参数ε和ρ分别为ε=0.5,ρ=10,选取状态初值为x0=[-0.3,0.5]。在没有参数优化情况下,仿真结果如图3和图4所示。
从仿真结果看来,当系统的状态偏离平衡点时,所设计的滑模变结构状态调节器能很好的对被控对象进行控制。所设计的滑模控制器具有良好的动静态的特性,并且没有稳态误差,控制抖振较小几乎没有。然而,在实际系统中,往往需要考虑其他的一些实际问题,比如油耗,进油量的限制等因素。因此,在进行滑模控制器设计时,需要根据特定的一些要求进行优化。这是一个优化问题,因而,可以用到改进的教与学优化算法进行计算,得出一个综合最优的滑模控制器。
其次,我们对本发明的基于性格系数调节的改进教与学算法(MTLBO)算法进行性能测试:
为了初步验证教与学改进策略的有效性,通过将七个常用的Benchmark测试函数作为教与学算法的目标函数,对基本教与学算法和改进教与学算法进行简单的比较。七个测试函数的具体表达式如下所示:
1)Sphere函数:
Figure BDA0001700880090000173
变量范围为(-100,100),最优值为0.
2)Rosenbrock函数:
Figure BDA0001700880090000174
变量范围为(-10,10),最优值为0.
3)Griewank函数:
Figure BDA0001700880090000175
变量范围(-600,600),最优值为0.
4)Rastrigin函数:
Figure BDA0001700880090000176
变量范围(-100,100),最优值为0.
5)Ackley函数:
Figure BDA0001700880090000181
变量范围(-100,100),最优值为0.
6)Rotated hyper-ellipsoid函数:
Figure BDA0001700880090000182
变量范围(-100,100),最优值为0.
7)Schwefel2.22问题:
Figure BDA0001700880090000183
变量范围(-10,10),最优值为0.
设置七个函数的的维数均为30,算法种群规模NP=10,函数最大迭代次数为100。每个函数通过20次运行进行结果统计,统计结果见下表:
表1
Figure BDA0001700880090000184
图5~11分别绘制了这七个测试函数在一次计算过程中,适应值的变化曲线:其横坐标为迭代次数G,纵坐标为函数适应值的10为底的对数。
由表1可以看出,在20次的运算中,运用改进教与学算法(MTLBO)计算的结果要更为精确一些,无论是最优解best还是平均解mean都比基本教与学算法(TLBO)的运算结果更好。但是,其方差(std)和最差解(worst)则相对的结果较差。其主要原因在于,MTLBO通过引入性格评定系数和自学阶段,尽管改善了TLBO的局部搜索能力,但由于引入了许多的随机量,因此算法整体的收敛性较差。尽管可以通过改进互学阶段和教学阶段来强化收敛,但种群的分布还是较基本教与学算法差。也因此,统计20次的运算结果,其方差和最差解相对不太令人满意。
但由图5-11却可以看出,算法尽管收敛性较差,但总体上收敛速度和精度是比基本算法要高的,这也证明了改进策略的有效性。而对于Rosenbrock函数,无论是TLBO和MTLBO,算法的结果均陷入了局部收敛。Rosenbrock函数是一个单峰函数,最优值为0,最优解应当为(1,1,1,...,1)。但实际考虑Rosenbrock函数,由于
Figure BDA0001700880090000191
前的系数100比后一项大得多,在算法计算过程中,往往会使群体收敛在
Figure BDA0001700880090000192
这条曲线附近,需要很强的局部搜索能力才能跳出局部收敛。而从统计结果也可看出,最优值的数量级相对较小,则说明了最优解收敛在
Figure BDA0001700880090000193
附近,算法的计算结果在一定程度上是值得保证的。事实上,对于多峰值优化问题,MTLBO算法是比TLBO算法优秀的。Rastrigin函数和Griewank函数,均为多峰值优化问题,全局最优解为0。从进化曲线图可以看出,MTLBO算法具有更高的收敛精度和更快的收敛速度,这说明了改进的算法在一定程度上是能处理多峰值优化问题的,也证明了改进方案的可行性。
之后,我们设计基于MTLBO优化的超燃冲压发动机滑模控制器。
对滑模控制器(6)中的参数ε和ρ进行优化,令搜索空间中搜索点X为X=(ε,ρ),
取种群规模Size=20,迭代次数G=20。选取适应值函数为最小能量的二次型形式
Figure BDA0001700880090000194
选取
Figure BDA0001700880090000195
采用本发明改进的教与学算法进行计算,得出最优的(ε,ρ)为[0.6295×I2×2,5.0733×I2×2]。将计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果进行比较,其结果如图12和图13所示。
通过对比可以看出,优化后的滑模控制器具有更为良好的综合性能。相比之下,基于改进教与学算法的滑模控制器的动态响应过程,控制量全程较小,并且具有更小的抖振。尽管由于控制量的减小使得系统的响应速度变慢,但考虑到在实际过程,系统状态到达滑模阶段过快往往会引起高频的抖振现象从而造成不利影响。因此,控制量的减小也有助于消除抖振的产生,同时减小的能量的损耗。因此,优化后的控制器具有更为良好的综合性能,仿真结果证明了该方法的有效性和可行性。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种基于性格系数调节的教与学优化滑模控制方法,其特征在于:包括步骤:
步骤(1):
对于如下状态空间模型描述的多输入多输出系统:
Figure FDA0001700880080000011
式中x(t)∈Rn是系统的状态变量,n表示状态变量的维数,t表示时间;u(t)∈Rm为控制输入,m表示输入变量的维数;y(t)∈Rp为测量输出变量,p表示输出变量的维数,A,B,C,D均为适当维数的常数矩阵,矩阵B和C满秩,且系统可控和可观;
步骤(2):
设计滑模函数s(t)为:
s(t)=σx(t) (2)
式中,σ为可设计的滑模参数矩阵,使得σB的逆矩阵(σB)-1存在;
根据极点配置方法,确定σ,用以保证滑模面
Figure FDA0001700880080000015
上状态能够渐近收敛到状态空间原点且具有良好的动态性能;
步骤(3):
设计滑模控制器u(t),用以保证状态x(t)从初始位置,到达滑模面
Figure FDA0001700880080000016
并之后不离开滑模面;
一方面,根据滑模面到达条件
Figure FDA0001700880080000012
采用趋近律设计方法,令
Figure FDA0001700880080000013
其中,ε>0和ρ>0为可设计的趋近律参数,sgn(·)为符号函数;
另一方面,对式(2)求导数,并结合式(1),有
Figure FDA0001700880080000014
对比式(3)与式(4),显然有
σ[Ax(t)+Bu(t)]=-εsgn(s)-ρs (5)
因此,可得滑模控制器u(t)的表达形式为
u(t)=(σB)-1[-σAx(t)-εsgn(s)-ρs] (6)
步骤(4):
通过基于性格系数调节的改进的教与学优化算法,对滑模控制器(6)中的参数ε和ρ进行优化;具体步骤如下:
步骤(4-1):
根据常规教与学优化算法,取定种群规模大小,迭代次数和选取适应值函数;对于一个优化问题:
Figure FDA0001700880080000021
搜索空间
Figure FDA0001700880080000022
空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数,
Figure FDA0001700880080000023
Figure FDA0001700880080000024
分别表示每一维的上界和下界,i=1,2,…,d;f(X)为目标函数;取X=(ε,ρ),因此d=2;
步骤(4-2):
初始化班级:在搜索空间中随机生成班级中的每个学员
Figure FDA0001700880080000025
j=1,2,…,NP;生成方法按如下公式进行:
Figure FDA0001700880080000026
其中,j=1,2,…,NP;i=1,2,…,d;
Figure FDA0001700880080000028
为点Xj的一个决策变量,NP为空间搜索点的个数;
对每一个学员赋予一个随机的性格系数β,其中β介于0和1之间,记为β=rand(0,1);
步骤(4-3):
选取成绩最为优秀的学员Xbest作为教师Xteacher,根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,具体的教学方法如下式:
Figure FDA0001700880080000027
difference=ri×(Xteacher-TFi×Mean)
式中:
Figure FDA0001700880080000031
Figure FDA0001700880080000032
分别表示第i个学员学习前和学习后的值,
Figure FDA0001700880080000033
表示全部学员的平均值;教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1),前者表征教师的教学能力,后者表征学生的学习能力;
步骤(4-4):
互学过程:
对第i个学员Xi赋予性格系数βi=rand(0,1),依据其性格系数的大小来随机选取Zi个学习对象
Figure FDA0001700880080000034
进行相互学习;
其中,p1=1,2,…,NP;p2=1,2,…,NP;…;
Figure FDA00017008800800000312
Zi是一个与性格系数相关的变量,Zi的选择依照如下公式进行:
Figure FDA0001700880080000035
式中,βmin和βmax分别表示群体性格系数的最小值和最大值;Zmin和Zmax则分别表示可参与到互学过程的同学的最小人数和最大人数;
进行互学:
Figure FDA0001700880080000036
Figure FDA0001700880080000037
其中,rand(1,d)表示在[0,1]随机生成一个d维的行向量;
Figure FDA0001700880080000038
表示在随机选择的Zi个学员中,具有最优适应度的个体;
如果
Figure FDA0001700880080000039
Figure FDA00017008800800000310
将βi+rand(0,1)×(1-βi)的值赋予βi,实现性格系数βi的更新;
步骤(4-5):
自学过程:
若βi<rand(0,1),则
Figure FDA00017008800800000311
若βi≥rand(0,1),则
Figure FDA0001700880080000041
如果
Figure FDA0001700880080000042
Figure FDA0001700880080000043
将βi[1-rand(0,1)]的值赋予βi,实现性格系数βi的更新;
step1和step2均为自学调整步长,且有:
Figure FDA0001700880080000044
Figure FDA0001700880080000045
式中,
Figure FDA0001700880080000046
表示由每一维的上界组成的集合,
Figure FDA0001700880080000047
表示由每一维的下界组成的集合;tT是当前迭代次数,T是允许最大迭代次数;
步骤(4-6):
最终得到优化的(ε,ρ),根据获得的(ε,ρ),依照式(6)确定滑模控制器u(t)。
CN201810636095.4A 2018-06-20 2018-06-20 一种基于性格系数调节的教与学优化滑模控制方法 Active CN108803330B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810636095.4A CN108803330B (zh) 2018-06-20 2018-06-20 一种基于性格系数调节的教与学优化滑模控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810636095.4A CN108803330B (zh) 2018-06-20 2018-06-20 一种基于性格系数调节的教与学优化滑模控制方法

Publications (2)

Publication Number Publication Date
CN108803330A CN108803330A (zh) 2018-11-13
CN108803330B true CN108803330B (zh) 2020-12-11

Family

ID=64083871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810636095.4A Active CN108803330B (zh) 2018-06-20 2018-06-20 一种基于性格系数调节的教与学优化滑模控制方法

Country Status (1)

Country Link
CN (1) CN108803330B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109745044B (zh) * 2018-12-19 2022-02-22 陕西师范大学 基于代理模型Volterra建模的脑电信号编码解码方法
CN109917647B (zh) * 2019-03-06 2020-12-11 南京航空航天大学 一种基于教学策略改进的教与学算法及充液航天器优化滑模控制方法
CN111506855B (zh) * 2020-02-18 2023-06-30 华北理工大学 利用tlbo算法优化深度置信网络模型预测海洋数据的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103675799A (zh) * 2013-10-24 2014-03-26 华中科技大学 一种相控阵声纳系统换能器稀疏面阵优化方法
CN104267693A (zh) * 2014-09-22 2015-01-07 华中科技大学 一种机械加工能量效率的切削参数优化方法
WO2015089233A1 (en) * 2013-11-01 2015-06-18 Brain Corporation Apparatus and methods for haptic training of robots
CN105226638A (zh) * 2015-09-06 2016-01-06 清华大学 基于改进教与学算法的电力系统可用输电能力计算方法
CN105843197A (zh) * 2016-05-26 2016-08-10 江南大学 基于教与学算法的离散制造车间静态调度优化系统
CN106681148A (zh) * 2017-01-10 2017-05-17 南京航空航天大学 一种航空发动机积分正切模糊自适应滑模控制器设计方法
CN106837678A (zh) * 2017-03-15 2017-06-13 大连大学 基于改进tlbo算法的水轮发电机组pid调速器参数优化
CN107193212A (zh) * 2017-06-26 2017-09-22 南京航空航天大学 基于新型灰狼优化算法的航空发动机非线性预测控制方法
CN107908113A (zh) * 2017-12-29 2018-04-13 安徽理工大学 基于改进tlbo算法的自抗扰控制器参数整定方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130210554A1 (en) * 2012-02-10 2013-08-15 Kurt Carlson Portable Batter Training Apparatus

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103675799A (zh) * 2013-10-24 2014-03-26 华中科技大学 一种相控阵声纳系统换能器稀疏面阵优化方法
WO2015089233A1 (en) * 2013-11-01 2015-06-18 Brain Corporation Apparatus and methods for haptic training of robots
CN104267693A (zh) * 2014-09-22 2015-01-07 华中科技大学 一种机械加工能量效率的切削参数优化方法
CN105226638A (zh) * 2015-09-06 2016-01-06 清华大学 基于改进教与学算法的电力系统可用输电能力计算方法
CN105843197A (zh) * 2016-05-26 2016-08-10 江南大学 基于教与学算法的离散制造车间静态调度优化系统
CN106681148A (zh) * 2017-01-10 2017-05-17 南京航空航天大学 一种航空发动机积分正切模糊自适应滑模控制器设计方法
CN106837678A (zh) * 2017-03-15 2017-06-13 大连大学 基于改进tlbo算法的水轮发电机组pid调速器参数优化
CN107193212A (zh) * 2017-06-26 2017-09-22 南京航空航天大学 基于新型灰狼优化算法的航空发动机非线性预测控制方法
CN107908113A (zh) * 2017-12-29 2018-04-13 安徽理工大学 基于改进tlbo算法的自抗扰控制器参数整定方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Integral Tangent Adaptive Fuzzy Sliding Mode Control for Engine;yuezhu etc;《Eighth International Conference on Intelligent Control and Information Processing》;20171130;第109-115页 *
飞机纵向姿态传感器故障鲁棒容错控制;丁润泽;《上海应用技术学院学报》;20150630;第15卷(第2期);第167-173页 *

Also Published As

Publication number Publication date
CN108803330A (zh) 2018-11-13

Similar Documents

Publication Publication Date Title
CN108803330B (zh) 一种基于性格系数调节的教与学优化滑模控制方法
CN104636985A (zh) 一种改进bp神经网络的输电线路无线电干扰预测方法
CN112114521A (zh) 航天器智能预测控制进入制导方法
CN110286586A (zh) 一种磁流变阻尼器混合建模方法
CN111008790A (zh) 一种水电站群发电调度规则提取方法
CN105427241A (zh) 一种大视场显示设备的畸变校正方法
CN108062585A (zh) 一种基于飞蛾扑火算法计算函数最值的方法
Xiao et al. ℓ1-gain filter design of discrete-time positive neural networks with mixed delays
CN114880806A (zh) 基于粒子群优化的新能源汽车销量预测模型参数优化方法
CN107392315A (zh) 一种优化大脑情感学习模型的方法
CN116432539A (zh) 一种时间一致性协同制导方法、系统、设备及介质
CN109917647B (zh) 一种基于教学策略改进的教与学算法及充液航天器优化滑模控制方法
Red’ko et al. Iterative method for distribution of capital in transparent economic system
Guan et al. Robust adaptive recurrent cerebellar model neural network for non-linear system based on GPSO
Wei et al. Improved grey wolf optimization based on the Quantum-behaved mechanism
CN113050745B (zh) 选秀竞争算法dca及基于该算法的光伏系统最大功率点跟踪方法
Zhao et al. Evaluation of women’s entrepreneurship education based on BP neural network
Ying et al. A novel optimization algorithm for BP neural network based on RS-MEA
Chen et al. Learning to optimize differentiable games
Egamberdiyev the The Use of Neural Networks in Predicting Children’s Creative Ability in Preschool Education
Qu et al. A new neural network with genetic algorithm in searching nonlinear function extremum
Deng Aquila optimizer with dynamic group strategy for global optimization tasks
Yanchun Research on reform intelligent effect evaluation system (RIEES) of teaching methods of ideological and political theory course in colleges and universities
CN117787096A (zh) 基于生成对抗模仿学习的含落角约束制导方法
Pavani et al. Economic Load Dispatch Solution Using Teaching Learning Optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant