CN108803330B

CN108803330B - 一种基于性格系数调节的教与学优化滑模控制方法

Info

Publication number: CN108803330B
Application number: CN201810636095.4A
Authority: CN
Inventors: 肖玲斐; 何虹兴; 孟中祥; 徐敏
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2020-12-11
Anticipated expiration: 2038-06-20
Also published as: CN108803330A

Abstract

本发明公开了一种基于性格系数调节的教与学优化滑模控制方法，提出了一种基于性格系数调节的改进教与学算法，并用于优化滑模控制器的可设计参数，从而削弱滑模控制的抖振现象，实现滑模控制系统性能的提高，提高滑模控制方法的实用可行性。此外，在改进教与学算法中，针对算法后期搜索速度变慢的情况，设置了一个对性格系数的激励措施：当学员在学习过程中取得进步的时候，其性格系数会被修正。修正的规则是：当学员是在互学过程中取得进步时，令其性格系数增大；若学员是在自学过程中有所收获，则令其性格系数减小。通过性格系数及其激励措施，教与学算法的局部搜索能力增强，全局收敛性提高，算法后期的收敛速度加快，并能够有效避免早熟现象。

Description

一种基于性格系数调节的教与学优化滑模控制方法

技术领域

本发明涉及控制系统优化技术，具体涉及一种基于性格系数调节的教与学优化滑模控制方法。

背景技术

智能优化算法是近几十年里发展起来的一类启发式算法，代表性的智能优化算法有遗传算法、粒子群算法、人工神经网络、模拟退火算法等。

随着科学技术的不断进步，人们对高效的优化技术和精准的智能计算也提出了更高的要求，这也就要求一方面要不断地进行新型智能算法的研究，一方面也需要不断地对既有智能算法进行改进和完善。同时，拓宽智能算法的应用领域既能对带来实际的效益，给相关现实问题的研究带来一些启发，同时也是对算法内容的一种验证、诠释和补充。因此，智能算法的应用研究是一个同时具有理论意义和实际价值的重要课题。

本发明所研究的教与学算法则是近几年新出现的尚在发展阶段一种智能算法。

教与学算法(Teaching-Learning Based Optimization,TLBO)是Rao等人于2010年提出的一种新的群智能优化算法，该方法模拟教师的教导过程与学生的学习过程来求得最优解。教与学算法参数少、结构简单、概念简明、求解精度高、收敛速度快且具有极强的收敛能力。相比较一些经典的智能优化算法，比如粒子群算法，该算法的特点在于算法仅有群成员数和迭代代数两个参数，需要设置的参数少，可以避免参数设置不当引起的计算效率降低或易陷入局部收敛等问题。教与学算法从提出到现在短短的几年里，便已经引起了很多学者的关注，并得到了很好的应用。2012年Rao等分别提出了精英TLBO算法和改进教与学算法，两者分别应用在复杂优化问题和无约束优化问题，并均显示出了良好的性能。拓守恒等人对教与学算法进行改进，提出一种“自我学习”策略，并将改进方法应用到主动悬架LQR控制器权系数的优化。李岩等人提出一种考虑区间模式和本地模式协调的时滞广域阻尼控制器设计新方法，应用教与学优化算法确定最优增益序列，其对新英格兰测试系统的仿真结果表明该方法能有效抑制区间振荡的同时还能保证本地振荡模式不恶化，并对时滞有很好的鲁棒性。Zou等提出一种求解多目标优化问题的TLBO算法(MOPs)，把当前种群中拥挤度最大的非劣解设为教师，非劣解的群体中心作为群体的平均个体，仿真结果表明了MOPs算法的有效性。教与学算法作为新兴的一种智能优化算法，尽管受到了很多学者的关注，并也得到了一些实践成效，可仍存在着很多的问题。与教与学算法相对鲜明的社会特性基础相比，其数学基础显得相对薄弱，缺乏深刻且有普遍意义的理论分析。而在实际应用也存在着容易早熟收敛的问题。教与学算法的“教”过程其实就是全部解向最优点靠拢的过程，这就使得算法的多样性容易过早丢失，跳出局部收敛的能力较差。而算法的设置参数较少，那么算法的结果往往依赖于随机选择的初始群体的分布情况，算法十分容易陷入早熟收敛和局部收敛。除了算法本身存在的问题之外，其具体应用研究也应当是今后研究的重点。考虑到教与学算法的研究时间较短，其应用领域仍有待于进一步拓宽。目前的应用研究稍显不足，今后的研究应当多注重在动态、多约束、离散、多目标等复杂问题上的研究和应用。就工程和自动化领域而言，这类复杂问题是普遍存在的。因此，教育学算法是一个十分具有研究价值和应用前景的课题。

智能算法在控制领域中的应用可以说是一个优化问题的拓展。考虑到随着技术的进步，控制对象变得越来越复杂，对控制任务的精度要求越来越高，控制器的设计还有很大的优化空间，因此采用智能算法去处理控制器的优化问题是一个非常行之有效的手段。

前苏联学者Utkin和Emelyanov在20世纪50年代提出了变结构控制的概念，并经过20年左右的发展，提出了滑模有关变结构VSC和滑模控制SMC的方法。此后，各国学者对滑模变结构控制的研究兴趣急剧上升。K.D.Young等从工程的角度，对滑模控制进行了全面分析，并对滑模控制所产生的抖振进行了精确分析和评估，针对连续系统中的抑制抖动提出了七种解决方法，并针对离散系统在三种情况下的滑模设计进行了分析，为滑模控制在工程商的应用提供了有益的指导。高为炳院士等首先提出了趋近律的概念，并首次提出了自由递阶的概念。到目前为止，滑模控制已形成了一个相对独立的研究分支，成为了自动控制系统的一种一般的设计方法，并在设计工程中得到了广泛的应用。

滑模控制本质上是一种特殊的非线性控制，主要表现为控制的不连续性。系统的结构并不固定，而是在动态过程中，按照设定的滑动模态的状态轨迹运动。然而，系统在到达滑模面时，往往需要考虑到滞后、惯性和离散系统的影响，本身的不连续开关特性难以使系统按照滑模面滑动，形成抖振，严重时甚至会破坏系统性能，造成失稳。

因此，滑模控制的抖振现象，一直是滑模控制理论与应用研究中，需要面对和解决的重要问题。

发明内容

发明目的：本发明针对常规教与学算法的优缺点，提出基于性格系数调节的教与学算法改进策略，并用于优化滑模控制律中的可设计参数，实现削弱滑模控制的抖振现象，提高滑模控制系统的性能，增强滑模控制方法的实用性。

技术方案：

一种基于性格系数调节的教与学优化滑模控制方法，包括步骤：

步骤(1)：

对于如下状态空间模型描述的多输入多输出系统：

式中x(t)∈Rⁿ是系统的状态变量，n表示状态变量的维数，t表示时间；u(t)∈R^m为控制输入，m表示输入变量的维数；y(t)∈R^p为测量输出变量，p表示输出变量的维数，A,B,C,D均为适当维数的常数矩阵，矩阵B和C满秩，且系统可控和可观；

步骤(2)：

设计滑模函数s(t)为：

s(t)＝σx(t) (2)

式中，σ为可设计的滑模参数矩阵，使得σB的逆矩阵(σB)^-1存在；

根据极点配置方法，确定σ，用以保证滑模面

上状态能够渐近收敛到状态空间原点且具有良好的动态性能；

步骤(3)：

设计滑模控制器u(t)，用以保证状态x(t)从初始位置，到达滑模面

并之后不离开滑模面；

一方面，根据滑模面到达条件

采用趋近律设计方法，令

其中，ε＞0和ρ＞0为可设计的趋近律参数，sgn(·)为符号函数；

另一方面，对式(2)求导数，并结合式(1)，有

对比式(3)与式(4)，显然有

σ[Ax(t)+Bu(t)]＝-εsgn(s)-ρs (5)

因此，可得滑模控制器u(t)的表达形式为

u(t)＝(σB)^-1[-σAx(t)-εsgn(s)-ρs] (6)

步骤(4)：

通过基于性格系数调节的改进的教与学优化算法，对滑模控制器(6)中的参数ε和ρ进行优化；具体步骤如下：

步骤(4-1)：

根据常规教与学优化算法，取定种群规模大小，迭代次数和选取适应值函数；对于一个优化问题：

搜索空间

空间中任一搜索点X＝(x₁,x₂,…x_d)，其中d表示维空间的维数，

和

分别表示每一维的上界和下界，i＝1,2,…,d；f(X)为目标函数；取X＝(ε,ρ)，因此d＝2；

步骤(4-2)：

初始化班级：在搜索空间中随机生成班级中的每个学员

j＝1,2,…,NP；生成方法按如下公式进行：

其中，j＝1,2,…,NP；i＝1,2,…,d；

为点X^j的一个决策变量，NP为空间搜索点的个数；

对每一个学员赋予一个随机的性格系数β，其中β介于0和1之间，记为β＝rand(0,1)；性格系数β越接近1，表明该学员交际圈越广，越偏好互学；而性格系数β越接近0，则该学员更倾向于自学；

步骤(4-3)：

选取成绩最为优秀的学员X_best作为教师X_teacher，根据各个学员的学科成绩，学员将依据教师与班级学员平均值Mean之间的差值来进行学习，具体的教学方法如下式：

difference＝r_i×(X_teacher-TF_i×Mean)

式中:

和

分别表示第i个学员学习前和学习后的值，

表示全部学员的平均值；教师的教学因子TF_i＝round[1+rand(0,1)]和学生的学习步长r_i＝rand(0,1)，前者表征教师的教学能力，后者表征学生的学习能力；

步骤(4-4)：

互学过程：

对第i个学员Xⁱ赋予性格系数βⁱ＝rand(0,1)，依据其性格系数的大小来随机选取Zⁱ个学习对象

进行相互学习；

其中，p₁＝1,2,…,NP；p₂＝1,2,…,NP；…；

Zⁱ是一个与性格系数相关的变量，Zⁱ的选择依照如下公式进行：

式中，β_min和β_max分别表示群体性格系数的最小值和最大值；Z_min和Z_max则分别表示可参与到互学过程的同学的最小人数和最大人数；一般情况下，取Z_min＝1、

进行互学：

其中，rand(1,d)表示在[0,1]随机生成一个d维的行向量；

表示在随机选择的Zⁱ个学员中，具有最优适应度的个体；

如果

则

将βⁱ+rand(0,1)×(1-βⁱ)的值赋予βⁱ，实现性格系数βⁱ的更新；

步骤(4-5)：

自学过程：

若βⁱ<rand(0,1)，则

若βⁱ≥rand(0,1)，则

如果

则

将βⁱ[1-rand(0,1)]的值赋予βⁱ，实现性格系数βⁱ的更新；

step₁和step₂均为自学调整步长，且有：

式中，

表示由每一维的上界组成的集合，

表示由每一维的下界组成的集合；t_T是当前迭代次数，T是允许最大迭代次数；

步骤(4-6)：

最终得到优化的(ε,ρ)，根据获得的(ε,ρ)，依照式(6)确定滑模控制器u(t)。

有益效果：本发明针对常规教与学算法的优缺点，提出基于性格系数调节的教与学算法改进策略(MTLBO)，并用于优化滑模控制系统设计中，将切换控制增益作为优化目标，通过优化得出一个优化的切换控制项，从而有效地减弱了抖振现象，提高了滑模控制系统的性能，增强了滑模控制方法的实用性。

此外，本发明所提MTLBO算法，对其他自动控制系统的控制器参数优化亦可提供有利参考。

附图说明

图1为常规教与学算法流程图。

图2为本发明具体实施例中超燃冲压发动机简图。

图3为在没有参数优化情况下，滑膜控制的仿真结果中系统状态量x变化曲线图。

图4为在没有参数优化情况下，滑膜控制的仿真结果中系统控制量u变化曲线图。

图5为Sphere函数进化曲线图。

图6为Rosenbrock函数进化曲线图。

图7为Griewank函数进化曲线图。

图8为Rastrigin函数进化曲线图。

图9为Ackley函数进化曲线图。

图10为Rotated hyper-ellipsoid函数进化曲线图。

图11为Schwefel Problem 2.22函数进化曲线图。

图12为采用本发明的方法进行的超燃冲压发动机滑模控制计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果中系统状态变量变化曲线比较图。

图13为采用本发明的方法进行的超燃冲压发动机滑模控制计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果中系统控制量变化曲线比较图。

具体实施方式

下面结合附图对本发明作更进一步的说明。

常规教与学算法

常规TLBO算法是一种群集智能优化算法，种群规模等同于班级中的学员的数量，学员的学习能力相当于优化变量，学习成绩即是评价指标，其中的成绩最优者相当于教学阶段的教师。所有班级中的学员成绩都需要教师的“教”过程来引导，同时，学员间也需要互“学”来促使知识的吸收。这里，就涉及到“教师”、“学员”、和“班级”等几个基本概念。

对于一个优化问题：

搜索空间

空间中任一搜索点X＝(x₁,x₂,…x_d)，其中d表示维空间的维数(决策变量的个数)，

和

(i＝1,2,…,d)分别表示为每一维的上界和下界，f(X)为目标函数。设

j＝(1,2,…,NP)为搜索空间中的一个点，

为点X^j的一个决策变量，NP为空间搜索点的个数(也即是种群规模)。将其分别对应于常规TLBO算法中即为:

1)班级：在TLBO算法中，将搜索空间中所有搜索粒子的集合称为班级(class)。

2)学员：班级中的任意个体

称之为一个学员。

3)教师：班级中成绩最优的一名学员X_best称之为教师，本发明中用X_teacher表示。

因此，一个班级可以用如下形式表示为：

其中:X^j(j＝1,2,…,NP)表示班级学员,X_teacher＝argmaxf(X^j)(j＝1,2,…,NP)。NP为学员个数，d为学员所学科目数量。

算法步骤如图2所示：

1)初始化班级：在搜索空间中随机生成班级中的每个学员

j＝(1,2,…,NP)；生成方法按如下公式进行：

2)“教”阶段

在教与学算法的教学阶段，选取成绩最为优秀的学员X_best作为教师X_teacher。根据各个学员的学科成绩，学员将依据教师与班级学员平均值Mean之间的差值来进行学习，在一定程度上提高每个学员的成绩，从而提高班级平均值。需要注意的是，学员所能获取的知识量，既取决于教师和班级学员平均值Mean的差值，还取决于教师的教学因子和学生的学习能力，因此，教学阶段的提升空间是有限的。

假设学员的学科成绩服从正态分布，在最初，班级平均成绩为Mean_A＝30，平均成绩低且分布较广。经过教师多次的“教”过程，班级平均成绩逐步提高到Mean_B＝80，成绩提高且分布集中。具体的教学方法如下式：

difference＝r_i×(X_teacher-TF_i×Mean)

式中:

和

分别表示第i个学员学习前和学习后的值，

表示全部学员的平均值。此外，式中还有两个重要的参数：教师的教学因子TF_i＝round[1+rand(0,1)]和学生的学习步长r_i＝rand(0,1)。前者表征了教师的教学能力，后者表征了学生的学习能力。

3)“学”阶段

“学”阶段指的是学生间的相互学习，通过对比分析学员间的差异来进行学习。对每一个学员Xⁱ(i＝1,2,…,NP)，在班级中随机选取一个学习对象X^j(j＝1,2,…,NP,j≠i)，Xⁱ通过分析自己与X^j的差异进行学习调整，学习改进的方法类似于差分算法中的差分变异算子。不同的地方在于，教与学算法中的学习步长r对每个不同的学员采用不同的学习因子。学员Xⁱ和X^j之间通过对比各自的目标函数值(也即学习成绩)，较劣者向较优者靠拢，以这样的方式，实现学生间的互学和进步。具体的调整过程可用下式表示：

式中，r_i为第i个学员的学习步长，且r_i＝U(0,1)。

4)“更新”操作

学员在通过“教”与“学”阶段时都要进行更新操作。更新操作的目的是用学习后的较优个体替代较劣个体，以实现全部学员平均成绩的提高。更新操作如下:

End.

基于性格系数调节的改进教与学算法(MTLBO)：

对于单峰值优化问题，教与学算法的收敛速度很快，并有着很高的求解精度，并且由于算法结构简单，自定义参数少，运行代价较小。然而，在处理多峰值的优化问题时，由于教学阶段本质上是学员向教师快速靠拢的过程，算法的多样性丢失迅速，极易陷入局部搜索，因此在这类问题上常规教与学算法的全局搜索能力较差。为了改进教与学算法的性能，一种比较好的思路就算是对算法的“学习”阶段进行改进。

本发明提出一种改进的教与学算法，对“学”阶段进行了优化和改进，通过引入随机数操作使得算法跳出局部收敛的能力增强，同时设置了激励因子以加强算法后期的收敛速度。改进的主要目的是为了提高算法的局部搜索能力，使算法具有更好的全局收敛性。

在标准的教与学优化算法中，学习过程只有两个学员间的相互学习，学员间的信息交流较少。考虑到教与学算法本身鲜明的社会特性，不同性格的人往往具有不同的交际圈，其学习策略也就越不尽相同。本发明引入一个“性格系数”β，用来区别学员的学习方法。在初始化学员的参数时候，对每一个学员赋予一个随机的性格系数β＝rand(0,1)。假定性格系数越大的人，交际圈越广，也越偏好互学。而性格系数越小的人，则更倾向于自学。

由于性格系数的引进和相关的变量调整，可能会出现算法后期搜索速度变慢的情况，因此引入一个激励措施：当学员在学习过程中取得进步的时候，其性格系数会被修正。当学员是在互学过程中取得进步时，令其性格系数增大；若学员是在自学过程中有所收获，则令其性格系数减小。

通过性格系数的引入和激励措施的调整以区分不同性格的人的学习手段，以增加算子的局部搜索能力，同时使得算法后期的收敛速度加快，可以有效地避免早熟现象，提高算法的全局收敛性。

其具体操作如下:

1)互学过程：

进行相互学习。Zⁱ是一个与性格系数相关的变量，其作用是确定所选取的学员个数，Zⁱ的选择依照如下公式进行:

式中，β_min和β_max分别表示群体性格系数的最小值和最大值。Z_min和Z_max则分别表示可参与到互学过程的同学的最小人数和最大人数。一般情况下，取Z_min＝1、

由于参与互学过程的人数往往不止一个，为了避免盲目学习浪费时间，提高学习效率和成功率，需要比较全部学习对象的优劣性并计算小组成员的差异性，以得到一个局部最优的学习方式。

互学过程的伪代码如下:

For i＝1:NP

Select Zⁱ individuals at random from the current population,when

andβⁱ＝βⁱ+rand(0,1)×(1-βⁱ)；

End

其中，rand(1,d)表示在[0,1]随机生成一个d维的行向量。

表示在随机选择的Zⁱ个学员中，具有最优适应度的个体。

2)自学过程：

相比于互学过程是为了保持种群的多样，自我学习的过程则更多地赋予了算法更高的局部搜索能力。假定性格系数较高的学员自学能力较弱，其自我学习调整主要是对现有知识的梳理和复习，因而搜索空间较窄；而性格系数较低的学员更偏好自学，自我学习能力较强，自学的过程主要是对新知识的学习过程，因此搜索空间较广。依照这种假定，有两种策略对学员进行自学调整。考虑到随着算法的进行，种群的适应度也在不断变高，学习效率也将不断减慢，因此通过自适应的学习步长来调整局部搜索能力。具体的“自学”过程的伪代码如下：

式中，

表示由每一维的上界组成的集合，

表示由每一维的下界组成的集合；t_T是当前迭代次数，T是允许最大迭代次数。

基于改进教与学算法(MTLBO)的滑模控制系统：

对于如下的多输入多输出系统：

步骤(2)：

设计滑模函数s(t)为：

s(t)＝σx(t) (2)

根据极点配置方法，确定σ，用以保证滑模面

步骤(3)：

并之后不离开滑模面；

一方面，根据滑模面到达条件

采用趋近律设计方法，令

另一方面，对式(2)求导数，并结合式(1)，有

对比式(3)与式(4)，显然有

σ[Ax(t)+Bu(t)]＝-εsgn(s)-ρs (5)

因此，可得滑模控制器u(t)的表达形式为

u(t)＝(σB)^-1[-σAx(t)-εsgn(s)-ρs] (6)

步骤(4)：将滑模控制器(6)中的参数ε和ρ作为优化目标，通过基于性格系数调节的改进的教与学优化算法进行优化，取定种群规模大小，迭代次数和选取适应值函数，并考虑到控制量约束条件，可采用改进的教与学算法(MTLBO)进行滑模控制器参数优化，得出最优的(ε,ρ)；具体如下：

步骤(4-1)：

搜索空间

和

步骤(4-2)：

初始化班级：在搜索空间中随机生成班级中的每个学员

j＝1,2,…,NP；生成方法按如下公式进行：

其中，j＝1,2,…,NP；i＝1,2,…,d；

为点X^j的一个决策变量，NP为空间搜索点的个数；

步骤(4-3)：

选取成绩最为优秀的学员X_best作为教师X_teacher，根据各个学员的学科成绩，学员将依据教师与班级学员平均值Mean之间的差值来进行学习，具体的教学方法如下式

difference＝r_i×(X_teacher-TF_i×Mean)

式中:

和

分别表示第i个学员学习前和学习后的值，

步骤(4-4)：

互学过程：

进行相互学习；

其中，p₁＝1,2,…,NP；p₂＝1,2,…,NP；…；

式中，β_min和β_max分别表示群体性格系数的最小值和最大值；Z_min和Z_max则分别表示可参与到互学过程的同学的最小人数和最大人数；

进行互学：

其中，rand(1,d)表示在[0,1]随机生成一个d维的行向量；

表示在随机选择的Zⁱ个学员中，具有最优适应度的个体；

如果

则

步骤(4-5)：

自学过程：

若βⁱ<rand(0,1)，则

若βⁱ≥rand(0,1)，则

如果

则

将βⁱ[1-rand(0,1)]的值赋予βⁱ，实现性格系数βⁱ的更新；

step₁和step₂均为自学调整步长，且有：

式中，

表示由每一维的上界组成的集合，

步骤(4-6)：

本发明对超燃冲压发动机的燃油控制问题，采用了滑模控制的方式。首先将燃油控制传递函数矩阵模型转换为状态空间模型，之后设计滑模控制器。在此基础上，应用改进的教与学算法对滑模参数进行优化，以提升控制性能。仿真结果结果证明了超燃冲压发动机燃油控制系统的滑模控制的稳定性和良好的动态特性，以及应用改进教与学算法优化设计滑模控制器的可行性。

超燃冲压发动机由进气道、燃烧室和尾喷管组成，简图如图2所示，选用两点供油的燃烧室构型。燃油控制系统的模型为：y＝G(s)u，传递函数矩阵如下式所示。

控制输入为u＝(u₁,u₂)^T，其中u₁＝m_f1，u₂＝m_f2。

u₁为第一路燃油喷嘴供油量；u₂为第二路燃油喷嘴供油量。

系统的输出y＝(y₁,y₂)^T，其中y₁＝σ₁＝P_2.2/P₂，y₂＝σ₂＝P₃/P₂。

σ₁为第一路燃油喷嘴后的燃烧室静压恢复系数；σ₂为燃烧室的静压恢复系数；P₂为燃烧室入口静压；P_2.2为第一路燃油喷嘴后静压；P₃为燃烧室出口静压。

该燃油控制系统是一个多输入多输出系统，根据现代控制理论，可知该系统可控且可观，其传递函数矩阵式(18)可以转换为如下的多输入多输出状态空间模型：

y(t)＝Cx(t)+Du(t).

其中，

根据滑模控制理论和极点配置方法，选取可设计的滑模参数矩阵

首先，我们考虑无优化时的超燃冲压发动机滑模控制。

选取可设计趋近律参数ε和ρ分别为ε＝0.5，ρ＝10，选取状态初值为x₀＝[-0.3,0.5]。在没有参数优化情况下，仿真结果如图3和图4所示。

从仿真结果看来，当系统的状态偏离平衡点时，所设计的滑模变结构状态调节器能很好的对被控对象进行控制。所设计的滑模控制器具有良好的动静态的特性，并且没有稳态误差，控制抖振较小几乎没有。然而，在实际系统中，往往需要考虑其他的一些实际问题，比如油耗，进油量的限制等因素。因此，在进行滑模控制器设计时，需要根据特定的一些要求进行优化。这是一个优化问题，因而，可以用到改进的教与学优化算法进行计算，得出一个综合最优的滑模控制器。

其次，我们对本发明的基于性格系数调节的改进教与学算法(MTLBO)算法进行性能测试：

为了初步验证教与学改进策略的有效性，通过将七个常用的Benchmark测试函数作为教与学算法的目标函数，对基本教与学算法和改进教与学算法进行简单的比较。七个测试函数的具体表达式如下所示：

1)Sphere函数:

变量范围为(-100,100)，最优值为0.

2)Rosenbrock函数:

变量范围为(-10,10)，最优值为0.

3)Griewank函数:

变量范围(-600,600),最优值为0.

4)Rastrigin函数:

变量范围(-100,100),最优值为0.

5)Ackley函数:

变量范围(-100,100)，最优值为0.

6)Rotated hyper-ellipsoid函数:

变量范围(-100,100)，最优值为0.

7)Schwefel2.22问题:

变量范围(-10,10),最优值为0.

设置七个函数的的维数均为30，算法种群规模NP＝10，函数最大迭代次数为100。每个函数通过20次运行进行结果统计，统计结果见下表：

表1

图5～11分别绘制了这七个测试函数在一次计算过程中，适应值的变化曲线：其横坐标为迭代次数G，纵坐标为函数适应值的10为底的对数。

由表1可以看出，在20次的运算中，运用改进教与学算法(MTLBO)计算的结果要更为精确一些，无论是最优解best还是平均解mean都比基本教与学算法(TLBO)的运算结果更好。但是，其方差(std)和最差解(worst)则相对的结果较差。其主要原因在于，MTLBO通过引入性格评定系数和自学阶段，尽管改善了TLBO的局部搜索能力，但由于引入了许多的随机量，因此算法整体的收敛性较差。尽管可以通过改进互学阶段和教学阶段来强化收敛，但种群的分布还是较基本教与学算法差。也因此，统计20次的运算结果，其方差和最差解相对不太令人满意。

但由图5-11却可以看出，算法尽管收敛性较差，但总体上收敛速度和精度是比基本算法要高的，这也证明了改进策略的有效性。而对于Rosenbrock函数，无论是TLBO和MTLBO，算法的结果均陷入了局部收敛。Rosenbrock函数是一个单峰函数，最优值为0，最优解应当为(1,1,1,...,1)。但实际考虑Rosenbrock函数，由于

前的系数100比后一项大得多，在算法计算过程中，往往会使群体收敛在

这条曲线附近，需要很强的局部搜索能力才能跳出局部收敛。而从统计结果也可看出，最优值的数量级相对较小，则说明了最优解收敛在

附近，算法的计算结果在一定程度上是值得保证的。事实上，对于多峰值优化问题，MTLBO算法是比TLBO算法优秀的。Rastrigin函数和Griewank函数，均为多峰值优化问题，全局最优解为0。从进化曲线图可以看出，MTLBO算法具有更高的收敛精度和更快的收敛速度，这说明了改进的算法在一定程度上是能处理多峰值优化问题的，也证明了改进方案的可行性。

之后，我们设计基于MTLBO优化的超燃冲压发动机滑模控制器。

对滑模控制器(6)中的参数ε和ρ进行优化，令搜索空间中搜索点X为X＝(ε,ρ)，

取种群规模Size＝20，迭代次数G＝20。选取适应值函数为最小能量的二次型形式

选取

采用本发明改进的教与学算法进行计算，得出最优的(ε,ρ)为[0.6295×I_2×2，5.0733×I_2×2]。将计算出的结果生成控制器仿真并与自行设计的滑模控制器仿真结果进行比较，其结果如图12和图13所示。

通过对比可以看出，优化后的滑模控制器具有更为良好的综合性能。相比之下，基于改进教与学算法的滑模控制器的动态响应过程，控制量全程较小，并且具有更小的抖振。尽管由于控制量的减小使得系统的响应速度变慢，但考虑到在实际过程，系统状态到达滑模阶段过快往往会引起高频的抖振现象从而造成不利影响。因此，控制量的减小也有助于消除抖振的产生，同时减小的能量的损耗。因此，优化后的控制器具有更为良好的综合性能，仿真结果证明了该方法的有效性和可行性。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。