CN108803330B - 一种基于性格系数调节的教与学优化滑模控制方法 - Google Patents
一种基于性格系数调节的教与学优化滑模控制方法 Download PDFInfo
- Publication number
- CN108803330B CN108803330B CN201810636095.4A CN201810636095A CN108803330B CN 108803330 B CN108803330 B CN 108803330B CN 201810636095 A CN201810636095 A CN 201810636095A CN 108803330 B CN108803330 B CN 108803330B
- Authority
- CN
- China
- Prior art keywords
- learning
- sliding mode
- teaching
- algorithm
- character coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000005457 optimization Methods 0.000 title claims abstract description 51
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 112
- 230000008569 process Effects 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims description 46
- 238000013461 design Methods 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000013459 approach Methods 0.000 claims description 6
- 150000001875 compounds Chemical class 0.000 claims description 4
- 230000001965 increasing effect Effects 0.000 abstract description 4
- 230000002028 premature Effects 0.000 abstract description 4
- 230000005284 excitation Effects 0.000 abstract description 3
- 230000002829 reductive effect Effects 0.000 abstract description 3
- 238000004088 simulation Methods 0.000 description 14
- 238000011160 research Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 11
- 239000000446 fuel Substances 0.000 description 11
- 230000006872 improvement Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 6
- 238000002485 combustion reaction Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 102100025912 Melanopsin Human genes 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 244000145845 chattering Species 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 239000013213 metal-organic polyhedra Substances 0.000 description 2
- 238000012011 method of payment Methods 0.000 description 2
- 230000010355 oscillation Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 210000001258 synovial membrane Anatomy 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种基于性格系数调节的教与学优化滑模控制方法,提出了一种基于性格系数调节的改进教与学算法,并用于优化滑模控制器的可设计参数,从而削弱滑模控制的抖振现象,实现滑模控制系统性能的提高,提高滑模控制方法的实用可行性。此外,在改进教与学算法中,针对算法后期搜索速度变慢的情况,设置了一个对性格系数的激励措施:当学员在学习过程中取得进步的时候,其性格系数会被修正。修正的规则是:当学员是在互学过程中取得进步时,令其性格系数增大;若学员是在自学过程中有所收获,则令其性格系数减小。通过性格系数及其激励措施,教与学算法的局部搜索能力增强,全局收敛性提高,算法后期的收敛速度加快,并能够有效避免早熟现象。
Description
技术领域
本发明涉及控制系统优化技术,具体涉及一种基于性格系数调节的教与学优化滑模控制方法。
背景技术
智能优化算法是近几十年里发展起来的一类启发式算法,代表性的智能优化算法有遗传算法、粒子群算法、人工神经网络、模拟退火算法等。
随着科学技术的不断进步,人们对高效的优化技术和精准的智能计算也提出了更高的要求,这也就要求一方面要不断地进行新型智能算法的研究,一方面也需要不断地对既有智能算法进行改进和完善。同时,拓宽智能算法的应用领域既能对带来实际的效益,给相关现实问题的研究带来一些启发,同时也是对算法内容的一种验证、诠释和补充。因此,智能算法的应用研究是一个同时具有理论意义和实际价值的重要课题。
本发明所研究的教与学算法则是近几年新出现的尚在发展阶段一种智能算法。
教与学算法(Teaching-Learning Based Optimization,TLBO)是Rao等人于2010年提出的一种新的群智能优化算法,该方法模拟教师的教导过程与学生的学习过程来求得最优解。教与学算法参数少、结构简单、概念简明、求解精度高、收敛速度快且具有极强的收敛能力。相比较一些经典的智能优化算法,比如粒子群算法,该算法的特点在于算法仅有群成员数和迭代代数两个参数,需要设置的参数少,可以避免参数设置不当引起的计算效率降低或易陷入局部收敛等问题。教与学算法从提出到现在短短的几年里,便已经引起了很多学者的关注,并得到了很好的应用。2012年Rao等分别提出了精英TLBO算法和改进教与学算法,两者分别应用在复杂优化问题和无约束优化问题,并均显示出了良好的性能。拓守恒等人对教与学算法进行改进,提出一种“自我学习”策略,并将改进方法应用到主动悬架LQR控制器权系数的优化。李岩等人提出一种考虑区间模式和本地模式协调的时滞广域阻尼控制器设计新方法,应用教与学优化算法确定最优增益序列,其对新英格兰测试系统的仿真结果表明该方法能有效抑制区间振荡的同时还能保证本地振荡模式不恶化,并对时滞有很好的鲁棒性。Zou等提出一种求解多目标优化问题的TLBO算法(MOPs),把当前种群中拥挤度最大的非劣解设为教师,非劣解的群体中心作为群体的平均个体,仿真结果表明了MOPs算法的有效性。教与学算法作为新兴的一种智能优化算法,尽管受到了很多学者的关注,并也得到了一些实践成效,可仍存在着很多的问题。与教与学算法相对鲜明的社会特性基础相比,其数学基础显得相对薄弱,缺乏深刻且有普遍意义的理论分析。而在实际应用也存在着容易早熟收敛的问题。教与学算法的“教”过程其实就是全部解向最优点靠拢的过程,这就使得算法的多样性容易过早丢失,跳出局部收敛的能力较差。而算法的设置参数较少,那么算法的结果往往依赖于随机选择的初始群体的分布情况,算法十分容易陷入早熟收敛和局部收敛。除了算法本身存在的问题之外,其具体应用研究也应当是今后研究的重点。考虑到教与学算法的研究时间较短,其应用领域仍有待于进一步拓宽。目前的应用研究稍显不足,今后的研究应当多注重在动态、多约束、离散、多目标等复杂问题上的研究和应用。就工程和自动化领域而言,这类复杂问题是普遍存在的。因此,教育学算法是一个十分具有研究价值和应用前景的课题。
智能算法在控制领域中的应用可以说是一个优化问题的拓展。考虑到随着技术的进步,控制对象变得越来越复杂,对控制任务的精度要求越来越高,控制器的设计还有很大的优化空间,因此采用智能算法去处理控制器的优化问题是一个非常行之有效的手段。
前苏联学者Utkin和Emelyanov在20世纪50年代提出了变结构控制的概念,并经过20年左右的发展,提出了滑模有关变结构VSC和滑模控制SMC的方法。此后,各国学者对滑模变结构控制的研究兴趣急剧上升。K.D.Young等从工程的角度,对滑模控制进行了全面分析,并对滑模控制所产生的抖振进行了精确分析和评估,针对连续系统中的抑制抖动提出了七种解决方法,并针对离散系统在三种情况下的滑模设计进行了分析,为滑模控制在工程商的应用提供了有益的指导。高为炳院士等首先提出了趋近律的概念,并首次提出了自由递阶的概念。到目前为止,滑模控制已形成了一个相对独立的研究分支,成为了自动控制系统的一种一般的设计方法,并在设计工程中得到了广泛的应用。
滑模控制本质上是一种特殊的非线性控制,主要表现为控制的不连续性。系统的结构并不固定,而是在动态过程中,按照设定的滑动模态的状态轨迹运动。然而,系统在到达滑模面时,往往需要考虑到滞后、惯性和离散系统的影响,本身的不连续开关特性难以使系统按照滑模面滑动,形成抖振,严重时甚至会破坏系统性能,造成失稳。
因此,滑模控制的抖振现象,一直是滑模控制理论与应用研究中,需要面对和解决的重要问题。
发明内容
发明目的:本发明针对常规教与学算法的优缺点,提出基于性格系数调节的教与学算法改进策略,并用于优化滑模控制律中的可设计参数,实现削弱滑模控制的抖振现象,提高滑模控制系统的性能,增强滑模控制方法的实用性。
技术方案:
一种基于性格系数调节的教与学优化滑模控制方法,包括步骤:
步骤(1):
对于如下状态空间模型描述的多输入多输出系统:
式中x(t)∈Rn是系统的状态变量,n表示状态变量的维数,t表示时间;u(t)∈Rm为控制输入,m表示输入变量的维数;y(t)∈Rp为测量输出变量,p表示输出变量的维数,A,B,C,D均为适当维数的常数矩阵,矩阵B和C满秩,且系统可控和可观;
步骤(2):
设计滑模函数s(t)为:
s(t)=σx(t) (2)
式中,σ为可设计的滑模参数矩阵,使得σB的逆矩阵(σB)-1存在;
步骤(3):
其中,ε>0和ρ>0为可设计的趋近律参数,sgn(·)为符号函数;
另一方面,对式(2)求导数,并结合式(1),有
对比式(3)与式(4),显然有
σ[Ax(t)+Bu(t)]=-εsgn(s)-ρs (5)
因此,可得滑模控制器u(t)的表达形式为
u(t)=(σB)-1[-σAx(t)-εsgn(s)-ρs] (6)
步骤(4):
通过基于性格系数调节的改进的教与学优化算法,对滑模控制器(6)中的参数ε和ρ进行优化;具体步骤如下:
步骤(4-1):
根据常规教与学优化算法,取定种群规模大小,迭代次数和选取适应值函数;对于一个优化问题:搜索空间空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数,和分别表示每一维的上界和下界,i=1,2,…,d;f(X)为目标函数;取X=(ε,ρ),因此d=2;
步骤(4-2):
对每一个学员赋予一个随机的性格系数β,其中β介于0和1之间,记为β=rand(0,1);性格系数β越接近1,表明该学员交际圈越广,越偏好互学;而性格系数β越接近0,则该学员更倾向于自学;
步骤(4-3):
选取成绩最为优秀的学员Xbest作为教师Xteacher,根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,具体的教学方法如下式:
difference=ri×(Xteacher-TFi×Mean)
式中:和分别表示第i个学员学习前和学习后的值,表示全部学员的平均值;教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1),前者表征教师的教学能力,后者表征学生的学习能力;
步骤(4-4):
互学过程:
进行互学:
步骤(4-5):
自学过程:
step1和step2均为自学调整步长,且有:
步骤(4-6):
最终得到优化的(ε,ρ),根据获得的(ε,ρ),依照式(6)确定滑模控制器u(t)。
有益效果:本发明针对常规教与学算法的优缺点,提出基于性格系数调节的教与学算法改进策略(MTLBO),并用于优化滑模控制系统设计中,将切换控制增益作为优化目标,通过优化得出一个优化的切换控制项,从而有效地减弱了抖振现象,提高了滑模控制系统的性能,增强了滑模控制方法的实用性。
此外,本发明所提MTLBO算法,对其他自动控制系统的控制器参数优化亦可提供有利参考。
附图说明
图1为常规教与学算法流程图。
图2为本发明具体实施例中超燃冲压发动机简图。
图3为在没有参数优化情况下,滑膜控制的仿真结果中系统状态量x变化曲线图。
图4为在没有参数优化情况下,滑膜控制的仿真结果中系统控制量u变化曲线图。
图5为Sphere函数进化曲线图。
图6为Rosenbrock函数进化曲线图。
图7为Griewank函数进化曲线图。
图8为Rastrigin函数进化曲线图。
图9为Ackley函数进化曲线图。
图10为Rotated hyper-ellipsoid函数进化曲线图。
图11为Schwefel Problem 2.22函数进化曲线图。
图12为采用本发明的方法进行的超燃冲压发动机滑模控制计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果中系统状态变量变化曲线比较图。
图13为采用本发明的方法进行的超燃冲压发动机滑模控制计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果中系统控制量变化曲线比较图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
常规教与学算法
常规TLBO算法是一种群集智能优化算法,种群规模等同于班级中的学员的数量,学员的学习能力相当于优化变量,学习成绩即是评价指标,其中的成绩最优者相当于教学阶段的教师。所有班级中的学员成绩都需要教师的“教”过程来引导,同时,学员间也需要互“学”来促使知识的吸收。这里,就涉及到“教师”、“学员”、和“班级”等几个基本概念。
对于一个优化问题:搜索空间空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数(决策变量的个数),和(i=1,2,…,d)分别表示为每一维的上界和下界,f(X)为目标函数。设j=(1,2,…,NP)为搜索空间中的一个点,为点Xj的一个决策变量,NP为空间搜索点的个数(也即是种群规模)。将其分别对应于常规TLBO算法中即为:
1)班级:在TLBO算法中,将搜索空间中所有搜索粒子的集合称为班级(class)。
3)教师:班级中成绩最优的一名学员Xbest称之为教师,本发明中用Xteacher表示。
因此,一个班级可以用如下形式表示为:
其中:Xj(j=1,2,…,NP)表示班级学员,Xteacher=argmaxf(Xj)(j=1,2,…,NP)。NP为学员个数,d为学员所学科目数量。
算法步骤如图2所示:
2)“教”阶段
在教与学算法的教学阶段,选取成绩最为优秀的学员Xbest作为教师Xteacher。根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,在一定程度上提高每个学员的成绩,从而提高班级平均值。需要注意的是,学员所能获取的知识量,既取决于教师和班级学员平均值Mean的差值,还取决于教师的教学因子和学生的学习能力,因此,教学阶段的提升空间是有限的。
假设学员的学科成绩服从正态分布,在最初,班级平均成绩为MeanA=30,平均成绩低且分布较广。经过教师多次的“教”过程,班级平均成绩逐步提高到MeanB=80,成绩提高且分布集中。具体的教学方法如下式:
difference=ri×(Xteacher-TFi×Mean)
式中:和分别表示第i个学员学习前和学习后的值,表示全部学员的平均值。此外,式中还有两个重要的参数:教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1)。前者表征了教师的教学能力,后者表征了学生的学习能力。
3)“学”阶段
“学”阶段指的是学生间的相互学习,通过对比分析学员间的差异来进行学习。对每一个学员Xi(i=1,2,…,NP),在班级中随机选取一个学习对象Xj(j=1,2,…,NP,j≠i),Xi通过分析自己与Xj的差异进行学习调整,学习改进的方法类似于差分算法中的差分变异算子。不同的地方在于,教与学算法中的学习步长r对每个不同的学员采用不同的学习因子。学员Xi和Xj之间通过对比各自的目标函数值(也即学习成绩),较劣者向较优者靠拢,以这样的方式,实现学生间的互学和进步。具体的调整过程可用下式表示:
式中,ri为第i个学员的学习步长,且ri=U(0,1)。
4)“更新”操作
学员在通过“教”与“学”阶段时都要进行更新操作。更新操作的目的是用学习后的较优个体替代较劣个体,以实现全部学员平均成绩的提高。更新操作如下:
End.
基于性格系数调节的改进教与学算法(MTLBO):
对于单峰值优化问题,教与学算法的收敛速度很快,并有着很高的求解精度,并且由于算法结构简单,自定义参数少,运行代价较小。然而,在处理多峰值的优化问题时,由于教学阶段本质上是学员向教师快速靠拢的过程,算法的多样性丢失迅速,极易陷入局部搜索,因此在这类问题上常规教与学算法的全局搜索能力较差。为了改进教与学算法的性能,一种比较好的思路就算是对算法的“学习”阶段进行改进。
本发明提出一种改进的教与学算法,对“学”阶段进行了优化和改进,通过引入随机数操作使得算法跳出局部收敛的能力增强,同时设置了激励因子以加强算法后期的收敛速度。改进的主要目的是为了提高算法的局部搜索能力,使算法具有更好的全局收敛性。
在标准的教与学优化算法中,学习过程只有两个学员间的相互学习,学员间的信息交流较少。考虑到教与学算法本身鲜明的社会特性,不同性格的人往往具有不同的交际圈,其学习策略也就越不尽相同。本发明引入一个“性格系数”β,用来区别学员的学习方法。在初始化学员的参数时候,对每一个学员赋予一个随机的性格系数β=rand(0,1)。假定性格系数越大的人,交际圈越广,也越偏好互学。而性格系数越小的人,则更倾向于自学。
由于性格系数的引进和相关的变量调整,可能会出现算法后期搜索速度变慢的情况,因此引入一个激励措施:当学员在学习过程中取得进步的时候,其性格系数会被修正。当学员是在互学过程中取得进步时,令其性格系数增大;若学员是在自学过程中有所收获,则令其性格系数减小。
通过性格系数的引入和激励措施的调整以区分不同性格的人的学习手段,以增加算子的局部搜索能力,同时使得算法后期的收敛速度加快,可以有效地避免早熟现象,提高算法的全局收敛性。
其具体操作如下:
1)互学过程:
对第i个学员Xi赋予性格系数βi=rand(0,1),依据其性格系数的大小来随机选取Zi个学习对象进行相互学习。Zi是一个与性格系数相关的变量,其作用是确定所选取的学员个数,Zi的选择依照如下公式进行:
由于参与互学过程的人数往往不止一个,为了避免盲目学习浪费时间,提高学习效率和成功率,需要比较全部学习对象的优劣性并计算小组成员的差异性,以得到一个局部最优的学习方式。
互学过程的伪代码如下:
For i=1:NP
End
2)自学过程:
相比于互学过程是为了保持种群的多样,自我学习的过程则更多地赋予了算法更高的局部搜索能力。假定性格系数较高的学员自学能力较弱,其自我学习调整主要是对现有知识的梳理和复习,因而搜索空间较窄;而性格系数较低的学员更偏好自学,自我学习能力较强,自学的过程主要是对新知识的学习过程,因此搜索空间较广。依照这种假定,有两种策略对学员进行自学调整。考虑到随着算法的进行,种群的适应度也在不断变高,学习效率也将不断减慢,因此通过自适应的学习步长来调整局部搜索能力。具体的“自学”过程的伪代码如下:
基于改进教与学算法(MTLBO)的滑模控制系统:
对于如下的多输入多输出系统:
式中x(t)∈Rn是系统的状态变量,n表示状态变量的维数,t表示时间;u(t)∈Rm为控制输入,m表示输入变量的维数;y(t)∈Rp为测量输出变量,p表示输出变量的维数,A,B,C,D均为适当维数的常数矩阵,矩阵B和C满秩,且系统可控和可观;
步骤(2):
设计滑模函数s(t)为:
s(t)=σx(t) (2)
式中,σ为可设计的滑模参数矩阵,使得σB的逆矩阵(σB)-1存在;
步骤(3):
其中,ε>0和ρ>0为可设计的趋近律参数,sgn(·)为符号函数;
另一方面,对式(2)求导数,并结合式(1),有
对比式(3)与式(4),显然有
σ[Ax(t)+Bu(t)]=-εsgn(s)-ρs (5)
因此,可得滑模控制器u(t)的表达形式为
u(t)=(σB)-1[-σAx(t)-εsgn(s)-ρs] (6)
步骤(4):将滑模控制器(6)中的参数ε和ρ作为优化目标,通过基于性格系数调节的改进的教与学优化算法进行优化,取定种群规模大小,迭代次数和选取适应值函数,并考虑到控制量约束条件,可采用改进的教与学算法(MTLBO)进行滑模控制器参数优化,得出最优的(ε,ρ);具体如下:
步骤(4-1):
根据常规教与学优化算法,取定种群规模大小,迭代次数和选取适应值函数;对于一个优化问题:搜索空间空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数,和分别表示每一维的上界和下界,i=1,2,…,d;f(X)为目标函数;取X=(ε,ρ),因此d=2;
步骤(4-2):
对每一个学员赋予一个随机的性格系数β,其中β介于0和1之间,记为β=rand(0,1);性格系数β越接近1,表明该学员交际圈越广,越偏好互学;而性格系数β越接近0,则该学员更倾向于自学;
步骤(4-3):
选取成绩最为优秀的学员Xbest作为教师Xteacher,根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,具体的教学方法如下式
difference=ri×(Xteacher-TFi×Mean)
式中:和分别表示第i个学员学习前和学习后的值,表示全部学员的平均值;教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1),前者表征教师的教学能力,后者表征学生的学习能力;
步骤(4-4):
互学过程:
式中,βmin和βmax分别表示群体性格系数的最小值和最大值;Zmin和Zmax则分别表示可参与到互学过程的同学的最小人数和最大人数;
进行互学:
步骤(4-5):
自学过程:
step1和step2均为自学调整步长,且有:
步骤(4-6):
最终得到优化的(ε,ρ),根据获得的(ε,ρ),依照式(6)确定滑模控制器u(t)。
本发明对超燃冲压发动机的燃油控制问题,采用了滑模控制的方式。首先将燃油控制传递函数矩阵模型转换为状态空间模型,之后设计滑模控制器。在此基础上,应用改进的教与学算法对滑模参数进行优化,以提升控制性能。仿真结果结果证明了超燃冲压发动机燃油控制系统的滑模控制的稳定性和良好的动态特性,以及应用改进教与学算法优化设计滑模控制器的可行性。
超燃冲压发动机由进气道、燃烧室和尾喷管组成,简图如图2所示,选用两点供油的燃烧室构型。燃油控制系统的模型为:y=G(s)u,传递函数矩阵如下式所示。
控制输入为u=(u1,u2)T,其中u1=mf1,u2=mf2。
u1为第一路燃油喷嘴供油量;u2为第二路燃油喷嘴供油量。
系统的输出y=(y1,y2)T,其中y1=σ1=P2.2/P2,y2=σ2=P3/P2。
σ1为第一路燃油喷嘴后的燃烧室静压恢复系数;σ2为燃烧室的静压恢复系数;P2为燃烧室入口静压;P2.2为第一路燃油喷嘴后静压;P3为燃烧室出口静压。
该燃油控制系统是一个多输入多输出系统,根据现代控制理论,可知该系统可控且可观,其传递函数矩阵式(18)可以转换为如下的多输入多输出状态空间模型:
y(t)=Cx(t)+Du(t).
其中,
首先,我们考虑无优化时的超燃冲压发动机滑模控制。
选取可设计趋近律参数ε和ρ分别为ε=0.5,ρ=10,选取状态初值为x0=[-0.3,0.5]。在没有参数优化情况下,仿真结果如图3和图4所示。
从仿真结果看来,当系统的状态偏离平衡点时,所设计的滑模变结构状态调节器能很好的对被控对象进行控制。所设计的滑模控制器具有良好的动静态的特性,并且没有稳态误差,控制抖振较小几乎没有。然而,在实际系统中,往往需要考虑其他的一些实际问题,比如油耗,进油量的限制等因素。因此,在进行滑模控制器设计时,需要根据特定的一些要求进行优化。这是一个优化问题,因而,可以用到改进的教与学优化算法进行计算,得出一个综合最优的滑模控制器。
其次,我们对本发明的基于性格系数调节的改进教与学算法(MTLBO)算法进行性能测试:
为了初步验证教与学改进策略的有效性,通过将七个常用的Benchmark测试函数作为教与学算法的目标函数,对基本教与学算法和改进教与学算法进行简单的比较。七个测试函数的具体表达式如下所示:
设置七个函数的的维数均为30,算法种群规模NP=10,函数最大迭代次数为100。每个函数通过20次运行进行结果统计,统计结果见下表:
表1
图5~11分别绘制了这七个测试函数在一次计算过程中,适应值的变化曲线:其横坐标为迭代次数G,纵坐标为函数适应值的10为底的对数。
由表1可以看出,在20次的运算中,运用改进教与学算法(MTLBO)计算的结果要更为精确一些,无论是最优解best还是平均解mean都比基本教与学算法(TLBO)的运算结果更好。但是,其方差(std)和最差解(worst)则相对的结果较差。其主要原因在于,MTLBO通过引入性格评定系数和自学阶段,尽管改善了TLBO的局部搜索能力,但由于引入了许多的随机量,因此算法整体的收敛性较差。尽管可以通过改进互学阶段和教学阶段来强化收敛,但种群的分布还是较基本教与学算法差。也因此,统计20次的运算结果,其方差和最差解相对不太令人满意。
但由图5-11却可以看出,算法尽管收敛性较差,但总体上收敛速度和精度是比基本算法要高的,这也证明了改进策略的有效性。而对于Rosenbrock函数,无论是TLBO和MTLBO,算法的结果均陷入了局部收敛。Rosenbrock函数是一个单峰函数,最优值为0,最优解应当为(1,1,1,...,1)。但实际考虑Rosenbrock函数,由于前的系数100比后一项大得多,在算法计算过程中,往往会使群体收敛在这条曲线附近,需要很强的局部搜索能力才能跳出局部收敛。而从统计结果也可看出,最优值的数量级相对较小,则说明了最优解收敛在附近,算法的计算结果在一定程度上是值得保证的。事实上,对于多峰值优化问题,MTLBO算法是比TLBO算法优秀的。Rastrigin函数和Griewank函数,均为多峰值优化问题,全局最优解为0。从进化曲线图可以看出,MTLBO算法具有更高的收敛精度和更快的收敛速度,这说明了改进的算法在一定程度上是能处理多峰值优化问题的,也证明了改进方案的可行性。
之后,我们设计基于MTLBO优化的超燃冲压发动机滑模控制器。
对滑模控制器(6)中的参数ε和ρ进行优化,令搜索空间中搜索点X为X=(ε,ρ),
取种群规模Size=20,迭代次数G=20。选取适应值函数为最小能量的二次型形式选取采用本发明改进的教与学算法进行计算,得出最优的(ε,ρ)为[0.6295×I2×2,5.0733×I2×2]。将计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果进行比较,其结果如图12和图13所示。
通过对比可以看出,优化后的滑模控制器具有更为良好的综合性能。相比之下,基于改进教与学算法的滑模控制器的动态响应过程,控制量全程较小,并且具有更小的抖振。尽管由于控制量的减小使得系统的响应速度变慢,但考虑到在实际过程,系统状态到达滑模阶段过快往往会引起高频的抖振现象从而造成不利影响。因此,控制量的减小也有助于消除抖振的产生,同时减小的能量的损耗。因此,优化后的控制器具有更为良好的综合性能,仿真结果证明了该方法的有效性和可行性。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (1)
1.一种基于性格系数调节的教与学优化滑模控制方法,其特征在于:包括步骤:
步骤(1):
对于如下状态空间模型描述的多输入多输出系统:
式中x(t)∈Rn是系统的状态变量,n表示状态变量的维数,t表示时间;u(t)∈Rm为控制输入,m表示输入变量的维数;y(t)∈Rp为测量输出变量,p表示输出变量的维数,A,B,C,D均为适当维数的常数矩阵,矩阵B和C满秩,且系统可控和可观;
步骤(2):
设计滑模函数s(t)为:
s(t)=σx(t) (2)
式中,σ为可设计的滑模参数矩阵,使得σB的逆矩阵(σB)-1存在;
步骤(3):
其中,ε>0和ρ>0为可设计的趋近律参数,sgn(·)为符号函数;
另一方面,对式(2)求导数,并结合式(1),有
对比式(3)与式(4),显然有
σ[Ax(t)+Bu(t)]=-εsgn(s)-ρs (5)
因此,可得滑模控制器u(t)的表达形式为
u(t)=(σB)-1[-σAx(t)-εsgn(s)-ρs] (6)
步骤(4):
通过基于性格系数调节的改进的教与学优化算法,对滑模控制器(6)中的参数ε和ρ进行优化;具体步骤如下:
步骤(4-1):
根据常规教与学优化算法,取定种群规模大小,迭代次数和选取适应值函数;对于一个优化问题:搜索空间空间中任一搜索点X=(x1,x2,…xd),其中d表示维空间的维数,和分别表示每一维的上界和下界,i=1,2,…,d;f(X)为目标函数;取X=(ε,ρ),因此d=2;
步骤(4-2):
对每一个学员赋予一个随机的性格系数β,其中β介于0和1之间,记为β=rand(0,1);
步骤(4-3):
选取成绩最为优秀的学员Xbest作为教师Xteacher,根据各个学员的学科成绩,学员将依据教师与班级学员平均值Mean之间的差值来进行学习,具体的教学方法如下式:
difference=ri×(Xteacher-TFi×Mean)
式中:和分别表示第i个学员学习前和学习后的值,表示全部学员的平均值;教师的教学因子TFi=round[1+rand(0,1)]和学生的学习步长ri=rand(0,1),前者表征教师的教学能力,后者表征学生的学习能力;
步骤(4-4):
互学过程:
式中,βmin和βmax分别表示群体性格系数的最小值和最大值;Zmin和Zmax则分别表示可参与到互学过程的同学的最小人数和最大人数;
进行互学:
步骤(4-5):
自学过程:
step1和step2均为自学调整步长,且有:
步骤(4-6):
最终得到优化的(ε,ρ),根据获得的(ε,ρ),依照式(6)确定滑模控制器u(t)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810636095.4A CN108803330B (zh) | 2018-06-20 | 2018-06-20 | 一种基于性格系数调节的教与学优化滑模控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810636095.4A CN108803330B (zh) | 2018-06-20 | 2018-06-20 | 一种基于性格系数调节的教与学优化滑模控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108803330A CN108803330A (zh) | 2018-11-13 |
CN108803330B true CN108803330B (zh) | 2020-12-11 |
Family
ID=64083871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810636095.4A Active CN108803330B (zh) | 2018-06-20 | 2018-06-20 | 一种基于性格系数调节的教与学优化滑模控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108803330B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109745044B (zh) * | 2018-12-19 | 2022-02-22 | 陕西师范大学 | 基于代理模型Volterra建模的脑电信号编码解码方法 |
CN109917647B (zh) * | 2019-03-06 | 2020-12-11 | 南京航空航天大学 | 一种基于教学策略改进的教与学算法及充液航天器优化滑模控制方法 |
CN111506855B (zh) * | 2020-02-18 | 2023-06-30 | 华北理工大学 | 利用tlbo算法优化深度置信网络模型预测海洋数据的方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103675799A (zh) * | 2013-10-24 | 2014-03-26 | 华中科技大学 | 一种相控阵声纳系统换能器稀疏面阵优化方法 |
CN104267693A (zh) * | 2014-09-22 | 2015-01-07 | 华中科技大学 | 一种机械加工能量效率的切削参数优化方法 |
WO2015089233A1 (en) * | 2013-11-01 | 2015-06-18 | Brain Corporation | Apparatus and methods for haptic training of robots |
CN105226638A (zh) * | 2015-09-06 | 2016-01-06 | 清华大学 | 基于改进教与学算法的电力系统可用输电能力计算方法 |
CN105843197A (zh) * | 2016-05-26 | 2016-08-10 | 江南大学 | 基于教与学算法的离散制造车间静态调度优化系统 |
CN106681148A (zh) * | 2017-01-10 | 2017-05-17 | 南京航空航天大学 | 一种航空发动机积分正切模糊自适应滑模控制器设计方法 |
CN106837678A (zh) * | 2017-03-15 | 2017-06-13 | 大连大学 | 基于改进tlbo算法的水轮发电机组pid调速器参数优化 |
CN107193212A (zh) * | 2017-06-26 | 2017-09-22 | 南京航空航天大学 | 基于新型灰狼优化算法的航空发动机非线性预测控制方法 |
CN107908113A (zh) * | 2017-12-29 | 2018-04-13 | 安徽理工大学 | 基于改进tlbo算法的自抗扰控制器参数整定方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130210554A1 (en) * | 2012-02-10 | 2013-08-15 | Kurt Carlson | Portable Batter Training Apparatus |
-
2018
- 2018-06-20 CN CN201810636095.4A patent/CN108803330B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103675799A (zh) * | 2013-10-24 | 2014-03-26 | 华中科技大学 | 一种相控阵声纳系统换能器稀疏面阵优化方法 |
WO2015089233A1 (en) * | 2013-11-01 | 2015-06-18 | Brain Corporation | Apparatus and methods for haptic training of robots |
CN104267693A (zh) * | 2014-09-22 | 2015-01-07 | 华中科技大学 | 一种机械加工能量效率的切削参数优化方法 |
CN105226638A (zh) * | 2015-09-06 | 2016-01-06 | 清华大学 | 基于改进教与学算法的电力系统可用输电能力计算方法 |
CN105843197A (zh) * | 2016-05-26 | 2016-08-10 | 江南大学 | 基于教与学算法的离散制造车间静态调度优化系统 |
CN106681148A (zh) * | 2017-01-10 | 2017-05-17 | 南京航空航天大学 | 一种航空发动机积分正切模糊自适应滑模控制器设计方法 |
CN106837678A (zh) * | 2017-03-15 | 2017-06-13 | 大连大学 | 基于改进tlbo算法的水轮发电机组pid调速器参数优化 |
CN107193212A (zh) * | 2017-06-26 | 2017-09-22 | 南京航空航天大学 | 基于新型灰狼优化算法的航空发动机非线性预测控制方法 |
CN107908113A (zh) * | 2017-12-29 | 2018-04-13 | 安徽理工大学 | 基于改进tlbo算法的自抗扰控制器参数整定方法 |
Non-Patent Citations (2)
Title |
---|
Integral Tangent Adaptive Fuzzy Sliding Mode Control for Engine;yuezhu etc;《Eighth International Conference on Intelligent Control and Information Processing》;20171130;第109-115页 * |
飞机纵向姿态传感器故障鲁棒容错控制;丁润泽;《上海应用技术学院学报》;20150630;第15卷(第2期);第167-173页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108803330A (zh) | 2018-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108803330B (zh) | 一种基于性格系数调节的教与学优化滑模控制方法 | |
CN104636985A (zh) | 一种改进bp神经网络的输电线路无线电干扰预测方法 | |
CN112114521A (zh) | 航天器智能预测控制进入制导方法 | |
CN110286586A (zh) | 一种磁流变阻尼器混合建模方法 | |
CN111008790A (zh) | 一种水电站群发电调度规则提取方法 | |
CN105427241A (zh) | 一种大视场显示设备的畸变校正方法 | |
CN108062585A (zh) | 一种基于飞蛾扑火算法计算函数最值的方法 | |
Xiao et al. | ℓ1-gain filter design of discrete-time positive neural networks with mixed delays | |
CN114880806A (zh) | 基于粒子群优化的新能源汽车销量预测模型参数优化方法 | |
CN107392315A (zh) | 一种优化大脑情感学习模型的方法 | |
CN116432539A (zh) | 一种时间一致性协同制导方法、系统、设备及介质 | |
CN109917647B (zh) | 一种基于教学策略改进的教与学算法及充液航天器优化滑模控制方法 | |
Red’ko et al. | Iterative method for distribution of capital in transparent economic system | |
Guan et al. | Robust adaptive recurrent cerebellar model neural network for non-linear system based on GPSO | |
Wei et al. | Improved grey wolf optimization based on the Quantum-behaved mechanism | |
CN113050745B (zh) | 选秀竞争算法dca及基于该算法的光伏系统最大功率点跟踪方法 | |
Zhao et al. | Evaluation of women’s entrepreneurship education based on BP neural network | |
Ying et al. | A novel optimization algorithm for BP neural network based on RS-MEA | |
Chen et al. | Learning to optimize differentiable games | |
Egamberdiyev | the The Use of Neural Networks in Predicting Children’s Creative Ability in Preschool Education | |
Qu et al. | A new neural network with genetic algorithm in searching nonlinear function extremum | |
Deng | Aquila optimizer with dynamic group strategy for global optimization tasks | |
Yanchun | Research on reform intelligent effect evaluation system (RIEES) of teaching methods of ideological and political theory course in colleges and universities | |
CN117787096A (zh) | 基于生成对抗模仿学习的含落角约束制导方法 | |
Pavani et al. | Economic Load Dispatch Solution Using Teaching Learning Optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |