CN109031958A

CN109031958A - 分数阶多智能体追踪一致性的迭代学习控制方法

Info

Publication number: CN109031958A
Application number: CN201811204100.0A
Authority: CN
Inventors: 王立明; 李小健
Original assignee: Langfang Normal University
Current assignee: Dragon Totem Technology Hefei Co ltd
Priority date: 2018-10-16
Filing date: 2018-10-16
Publication date: 2018-12-18
Anticipated expiration: 2038-10-16
Also published as: CN109031958B

Abstract

一种分数阶多智能体追踪一致性的迭代学习控制方法，包括以下步骤：a.将阶数不同的分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在一定时间区间内的稳定性控制问题；b.设计具有初始状态学习能力的分布式P‑型迭代学习控制器；c.求解迭代学习控制器中待定的初始状态学习矩阵和迭代学习增益矩阵。本发明利用迭代学习控制方法解决了阶数不同的分数阶多智能体系统中初始状态偏移与模型未知同时存在情形下的协调追踪问题，所提出的迭代学习控制器不仅设计求解简单，可以抵制初始状态的偏移，而且能够保证阶数不同的分数阶多智能体系统经过一定迭代次数之后在整个运动过程中的一致性，具有很强的实用性。

Description

分数阶多智能体追踪一致性的迭代学习控制方法

技术领域

本发明涉及一种利用迭代学习控制方法解决含有阶数差异、初始状态偏移和模型未知的分数阶多智能体系统协调追踪控制方法，属于控制技术领域。

背景技术

近年来的研究发现，一些特殊条件的物理系统，如在沙地或泥泞的道路上运行的车辆和在雨、雪、冰雹等天气中飞行的飞行器等，应该用分数阶系统描述。此外，许多自然现象，如在分形环境中智能体的同步行为，高分子流体和多孔介质等，也必须利用具有分数阶动力学的智能体模型才能合理解释。由于在工程、生物和社会经济等领域均具有广泛的应用前景，分数阶多智能体系统成为当前系统控制领域的一个研究热点。控制领域的研究人员主要关注分数阶多智能体系统的分布式协调控制，即如何基于分数阶智能个体之间的局部信息交互和相互协作，共同实现期望的宏观涌现行为。依据是否具有领导者，已有的关于分数阶多智能体系统的研究成果可以分为两类,即无领导的一致性(或称协调调节一致性)和有领导者的一致性(或称协调追踪一致性)。与无领导的一致性问题相比,有领导者的一致性问题有着更广泛的应用且更有挑战性。最近，学者们从不同角度研究了分数阶多智能体系统的一致性追踪问题，如具有不同动力学的分数阶多智能体系统协调追踪问题,存在通讯间断或输入时滞的分数阶多智能体系统的一致性追踪问题，有限时间的分数阶多智能体的一致性追踪问题和具有不确定性的分数阶多智能体的一致性追踪问题。

虽然国内外众多学者对分数阶多智能体协调追踪控制问题进行了大量研究并取得了一系列成果，但在现有文献中，为讨论方便，一般假设分数阶多智能体的模型完全已知并且智能体的分数阶方程的阶数是相同的。然而在实际工程应用中，智能体的模型参数(包含智能体的分数阶方程的阶数)通常存在着差异，有时智能体的模型信息也是未知的。因此，考虑含有阶数差异且模型未知的分数阶多智能体系统协调追踪控制问题是十分必要的。另一方面，一些实际的协调追踪任务，如卫星的轨迹控制要求在完成任务的整个过程中一致性始终保持。然而，已有针对分数阶多智能体一致性追踪问题研究的成果都是在时间趋于某个有限值或无穷时才成立，并且不能保证一致性在整个控制过程中始终成立。如果上述这些问题不解决的话，就很难实现分数阶多智能体系统协调追踪理论的真正应用和推广。

事实上，智能体的分数阶方程的阶数差异和系统的分布式信息架构相互交织耦合，给阶数不同的分数阶多智能体系统协调追踪的分析和研究带来了困难。已有研究表明，对于传统的单个被控对象，当模型可以被表示为分数阶方程时，可以利用成熟的迭代学习理论设计控制器使得相应的闭环系统具有期望的轨迹跟踪性能。鉴于此，将传统的迭代学习控制理论及方法应用到阶数不同的分数阶多智能体系统的协调追踪控制中将会是一个可行的方案。然而，考虑到阶数不同的分数阶多智能体系统的复杂性、阶数的差异性、初始状态的偏移性、智能个体之间的信息耦合性以及所考虑的协调追踪问题的特殊性，如何应用已有的迭代学习控制理论及方法解决阶数不同的分数阶多智能体系统一致性控制问题成为控制领域的一个难题。

发明内容

本发明的目的在于针对现有技术之弊端，提供一种分数阶多智能体追踪一致性的迭代学习控制方法，以解决含有阶数差异、初始状态偏移和模型未知的分数阶多智能体系统的协调追踪控制问题。

本发明所述问题是以下述技术方案实现的：

一种分数阶多智能体追踪一致性的迭代学习控制方法，所述方法包括以下步骤：

a.将阶数不同的分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在一定时间区间内的稳定性控制问题：

由1个具有分数阶动力学的领导者和N个具有分数阶动力学但阶数不相同的跟随者组成的分数阶多智能体系统，领导者的动态模型为：

其中，α₀∈(0,1),为采用Caputo微分定义的α₀阶导数，x₀(t)∈Rⁿ和y₀(t)∈R^m分别为领导者在t时刻的状态和输出，R表示实数集合，n为状态向量x₀(t)的维数，m为输出向量y₀(t)的维数,f₀(x₀(t),t)是领导者的非线性动力学函数，C₀(t)是具有合适维数的领导者的时变输出矩阵；

第j个跟随者的动态模型为

其中，α_j∈(0,1),j＝1,2,L,N,N为跟随者的个数,为采用Caputo微分定义的α_j阶导数；

x_i,j(t)∈Rⁿ和y_i,j(t)∈R^m分别为第j个跟随者在第i次迭代中t时刻的状态和输出；u_i,j(t)∈R^p为第j个跟随者在第i次迭代中t时刻的控制输入，f(x_i,j(t),t)是第j个跟随者的非线性动力学函数，C(t)是具有合适维数的跟随者的时变输出矩阵，B(t)和D(t)是具有合适维数的时变输入矩阵；

跟随者的动态模型写成紧格式为：

其中，

F(x_i(t))＝[f^T(x_i,1(t)),f^T(x_i,2(t)),L,f^T(x_i,N(t))]^T∈R^nN，右上脚标“T”表示矩阵或向量的转置，表示克罗内克积，I_N表示阶数为N的单位矩阵；

本控制方法的目标是：对于不同阶数的分数阶多智能体系统，设计具有初始状态学习能力的分布式迭代学习控制器，使y_i,j(t)能够跟踪到y₀(t)的轨迹。定义追踪误差

e_i,j(t)＝y₀(t)-y_i,j(t),

则上述目标转化为：对于任意初始条件x_i,j(0)和t∈[0,T]，设计控制器使成立，从而将分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在一定时间区间内的稳定性控制问题；

b.设计具有初始状态学习能力的分布式P-型迭代学习控制器：

定义信息测量函数

即：

其中，a_jk是A的第(j,k)个单元,A是跟随者之间的通讯拓扑的邻接矩阵，N_j是第j个跟随者的邻居集合，如果跟随者j能够直接获得领导者的轨迹信息，那么d_j＝1；否则d_j＝0，设计分布式P-型迭代学习控制器：

其中Γ(t)是需要设计的迭代学习增益矩阵，初始条件的更新率设计为

x_i+1,j(0)＝x_i,j(0)+L_ee_i,j(0),

其中L_e是需要设计的初始状态学习矩阵；

c.求解迭代学习控制器中待定的初始状态学习矩阵L_e和迭代学习增益矩阵Γ(t)，利用迭代学习控制器实现y_i,j(t)对y₀(t)的跟踪控制。

求解迭代学习控制器中待定的初始状态学习矩阵L_e和迭代学习增益矩阵Γ(t)的具体方法如下：

定义第i次迭代中的两个列向量

ξ_i,j(t)的紧格式可表示为

其中L是跟随者之间的通讯拓扑图的拉普拉斯矩阵，

求解矩阵L+D′的第j个特征值λ_j(j＝1,2,L,N)，将λ_j(j＝1,2,L,N)、C(0)和D(0)代入不等式其中max(g)为取最大值函数，函数ρ(X)表示矩阵X的谱半径，I_m表示阶数为m的单位矩阵，求解出L_e和Γ(0)的关系式；

将λ_j(j＝1,2,L,N)和D(t)代入不等式求解出Γ(t)应该满足的条件；

综合考虑L_e、Γ(0)和Γ(t)应该满足的条件，给出使不等式：

成立的L_e、Γ(0)和Γ(t)的取值。

本发明利用已有的迭代学习控制方法解决了阶数不同的分数阶多智能体系统中初始状态偏移与模型未知同时存在情形下的协调追踪问题，所提出的迭代学习控制器不仅设计求解简单，可以抵制初始状态的偏移，而且能够保证阶数不同的分数阶多智能体系统经过一定迭代次数之后在整个运动过程中的一致性，具有很强的实用性。

附图说明

下面结合附图对本发明作进一步详述。

图1为本发明中分布式P-型迭代学习控制器的设计流程示意图；

图2为本发明中分布式迭代学习控制器作用下，阶数不同的分数阶多智能体系统实现输出一致性的框图；

图3为本发明中多智能体之间通信拓扑图；

图4为迭代学习控制器作用下一个分数阶领导者和三个分数阶跟随者的输出轨迹；

图5为分数阶跟随者的初始状态与迭代次数之间的关系；

图6为领导-跟随分数阶多智能体系统中输出的最大追踪误差与迭代次数之间的关系。

文中各符号为：α_j∈(0,1),j＝1,2,L,N,N为跟随者的个数,α₀∈(0,1)，和分别为采用Caputo微分定义的α₀阶和α_j阶导数，x₀(t)∈Rⁿ和y₀(t)∈R^m分别为领导者在t时刻的状态和输出，R表示实数集合，n为状态向量x₀(t)的维数，m为输出向量y₀(t)的维数,和分别表示领导者在第i次迭代中t时刻的状态向量x_i,0(t)的分量1和2，f₀(x₀(t),t)是领导者的非线性动力学函数，C₀(t)是具有合适维数的领导者的时变输出矩阵,x_i,j(t)∈Rⁿ和y_i,j(t)∈R^m分别为第j个跟随者在第i次迭代中t时刻的状态和输出，和分别表示跟随者j在第i次迭代中t时刻的状态向量x_i,j(t)的分量1和2；u_i,j(t)∈R^p为第j个跟随者在第i次迭代中t时刻的控制输入，f(x_i,j(t),t)是第j个跟随者的非线性动力学函数，C(t)是具有合适维数的跟随者的时变输出矩阵，B(t)和D(t)是具有合适维数的时变输入矩阵，I_N表示阶数为N的单位矩阵，a_jk是A的第(j,k)个单元,A是跟随者之间的通讯拓扑的邻接矩阵，N_j是第j个跟随者的邻居集合，Γ(t)是需要设计的迭代学习增益矩阵，L_e是需要设计的初始状态学习矩阵，L是跟随者之间的通讯拓扑图的拉普拉斯矩阵，λ_j(j＝1,2,L,N)是矩阵L+D′的第j个特征值，max(g)为取最大值函数，函数ρ(X)表示矩阵X的谱半径，右上脚标“T”表示矩阵或向量的转置，表示克罗内克积，||X||表示矩阵X的行和范数或向量X的最大值范数。

具体实施方式

本发明针对具有初始状态偏移、阶数差异且模型未知的分数阶多智能体系统的协调追踪控制问题，提出利用局部状态信息实现初始状态学习的迭代学习控制方法，使得阶数不同的分数阶多智能体系统能够实现输出的一致性。

如图l所示，本发明的技术解决方案是按如下步骤实现的：

1.问题转化：即将阶数不同的分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在一定时间区间内的稳定性控制问题；

2.设计具有初始状态学习能力的分布式P-型迭代学习控制器；

3.分析闭环分数阶多智能体系统实现输出一致性的整体形式的收敛条件；

4.分析闭环分数阶多智能体系统实现输出一致性的个体形式的收敛条件；

5.求解迭代学习控制器中待定的初始状态学习矩阵和迭代学习增益矩阵。

本发明有以下技术特征：

(1)步骤l中通过定义一个恰当的信息检测函数，将阶数不同的分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在一定时间区间内的稳定性控制问题。

(2)步骤2中设计的是一个具有初始状态学习能力的分布式P-型迭代学习控制器，并且控制器的设计不需要利用多智能体的模型信息。

(3)步骤3中基于压缩映射理论，利用通讯拓扑矩阵的λ范数给出能够保证闭环分数阶多智能体系统实现输出一致性的整体形式的收敛条件。

(4)步骤4中基于Schur三角化定理将个体智能体的动力学从整体智能体的动力学中解耦出来，利用通讯拓扑矩阵的特征值将整体形式的收敛条件表示为个体形式的收敛条件。

(5)步骤5中以线性矩阵不等式的形式给出迭代学习控制器中初始状态学习矩阵和迭代学习增益矩阵的计算公式，从而可以使用Matlab的LMI工具箱方便地进行矩阵求解。

本发明与现有技术相比的优点在于

(1)本发明考虑了实际应用中，阶数不同的分数阶多智能体系统中初始状态偏移与模型未知同时存在情形下的协调追踪问题，充实了迭代学习控制的研究内容，拓宽了其工程应用范围。

(2)本发明所提出的迭代学习控制器不仅设计求解简单，可以抵制初始状态的偏移，而且能够保证阶数不同的分数阶多智能体系统经过一定迭代次数之后在整个运动过程中的一致性，具有很强的实用性。

下面对本方法进行详细叙述：

其中，α₀∈(0,1),为采用Caputo微分定义的α₀阶导数。x₀(t)∈Rⁿ和y₀(t)∈R^m分别为领导者在t时刻的状态和输出,f₀(x₀(t),t)是领导者的非线性动力学函数，其数学表达式不需要事先知道，C₀(t)是具有合适维数的领导者的时变输出矩阵。

第j个跟随者的动态模型为

其中，α_j∈(0,1),j＝1,2,L,N,为采用Caputo微分定义的α_j阶导数。

x_i,j(t)∈Rⁿ和y_i,j(t)∈R^m分别为第j个跟随者在第i次迭代中t时刻的状态和输出,u_i,j(t)∈R^p为第j个跟随者在第i次迭代中t时刻的控制输入，f(x_i,j(t),t)是第j个跟随者的非线性动力学函数，其数学表达式不需要事先知道。C(t)是具有合适维数的跟随者的时变输出矩阵，B(t)和D(t)是具有合适维数的时变输入矩阵。

跟随者的动态模型(2)写成紧格式为

其中，

F(x_i(t))＝[f^T(x_i,1(t)),f^T(x_i,2(t)),L,f^T(x_i,N(t))]^T∈R^nN，右上脚标“T”表示矩阵或向量的转置。表示克罗内克积，I_N表示阶数为N的单位矩阵。

本发明的目标是：对于不同阶数的分数阶多智能体系统(2)，设计具有初始状态学习能力的分布式迭代学习控制器，使系统(2)的输出能够跟踪到系统(1)的输出轨迹。参照图l，本发明的具体实现过程如下：

步骤1：问题转化

定义追踪误差

e_i,j(t)＝y₀(t)-y_i,j(t), (4)

那么本发明的目的为：对于任意初始条件x_i,j(0)和t∈[0,T]，设计控制器使成立。这样，就将分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在时间区间t∈[0,T]内的稳定性控制问题。

步骤2：具有初始状态学习能力的分布式P-型迭代学习控制器的设计

定义信息测量函数

其中，a_jk是A的第(j,k)个单元,A是跟随者之间的通讯拓扑的邻接矩阵。N_j是第j个跟随者的邻居集合。如果跟随者j能够直接获得领导者的轨迹信息，那么d_j＝1；否则d_j＝0。

利用追踪误差(4)，(5)式可以写成

基于(6)，设计分布式P-型迭代学习控制器

其中Γ(t)是需要设计的迭代学习增益矩阵。控制器(7)只依赖于系统(1)和(2)的输入和输出信息，不包含系统(1)和(2)的模型信息，因此控制器(7)是无模型控制器。

初始条件的更新率设计为

x_i+1,j(0)＝x_i,j(0)+L_ee_i,j(0), (8)

其中L_e是需要设计的初始状态学习矩阵。

步骤3：闭环分数阶多智能体系统实现输出一致性的整体形式的收敛条件分析

定义第i次迭代中的两个列向量

ξ_i,j(t)的紧格式可写为

其中L是跟随者之间的通讯拓扑图的拉普拉斯矩阵，

利用(9)和(10),(7)可以写成

将(11)代入(2)并利用(5)可以得到

基于(12)可以得到闭环分数阶多智能体系统在初始时刻能够实现输出一致性的条件：

对于给定的领导-跟随分数阶多智能体系统(1)和(2)，如果

成立，其中||X||表示矩阵X的行和范数或向量X的最大值范数，那么具有初始状态学习更新率(8)的分布式P-型迭代学习控制器(7)能够保证

基于(12)和(13)，也可以得到闭环分数阶多智能体系统在t∈(0,T]上协调追踪一致性的收敛条件与控制器的设计准则：

对于给定的领导-跟随分数阶多智能体系统(1)和(2)，如果

成立，其中max(g)为取最大值函数，那么对于t∈(0,T]和初始输入u₀(t)＝0，具有初始状态学习更新率(8)的P-型迭代学习控制器(7)能够保证

综合(13)和(14)得到闭环分数阶多智能体系统实现输出一致性的整体形式的收敛条件为

步骤4：闭环分数阶多智能体系统实现输出一致性的个体形式的收敛条件分析

基于Schur三角化定理，利用通讯拓扑矩阵的特征值可以将整体形式的收敛条件(13)和(14)分别表示为个体形式的收敛条件(16)和(17)

其中λ_j(j＝1,2,L,N)为矩阵L+D′的第j个特征值，函数ρ(X)表示矩阵X的谱半径。

综合(16)和(17)得到闭环分数阶多智能体系统实现输出一致性的个体形式的收敛条件为

步骤5：初始状态学习矩阵和迭代学习增益矩阵的求解

求解矩阵L+D′的特征值λ_j(j＝1,2,L,N)。将λ_j(j＝1,2,L,N)、C(0)和D(0)代入不等式(16)求解出L_e和Γ(0)的关系式。将λ_j(j＝1,2,L,N)和D(t)代入不等式(17)求解出Γ(t)应该满足的条件。

综合考虑L_e、Γ(0)和Γ(t)应该满足的条件，给出使不等式(15)和(16)同时成立的L_e、Γ(0)和Γ(t)的取值，从而得到满足不等式(18)的取值条件。

本发明的效果可以通过以下仿真进一步说明：

仿真内容：令t∈[0,10]，考虑由一个分数阶领导者和三个分数阶跟随者组成的领导-跟随分数阶多智能体系统，其中领导者的方程为

其中α₀＝0.8，和分别表示领导者在第i次迭代中t时刻的状态向量x_i,0(t)的分量1和2。

跟随者的方程为

其中(α₁,α₂,α₃)＝(0.97,0.7,0.95)，和分别表示跟随者j在第i次迭代中t时刻的状态向量x_i,j(t)的分量1和2。

图1为本发明中分布式P-型迭代学习控制器的设计流程示意图，图2描述了在分布式迭代学习控制器作用下，阶数不同的分数阶多智能体系统实现输出一致性的框图，图3描述了网络智能体之间的通信拓扑图。由图3可知，因此，L+D′的特征值为0.382，1和2.618。令由(20)知C(0)＝[0.2,0.1],D(0)＝[0.5,0.1]。验证收敛条件(16),得验证收敛条件(17),得因此,收敛条件(18)被满足，在具有初始状态学习率(8)的控制器(7)的作用下能够实现跟随者(20)对领导者(19)的输出轨迹追踪。图4描述了分数阶领导者和所有分数阶跟随者在不同迭代次数时的轨迹，其中(a)、(b)和(c)分别为第4次迭代、第6次迭代和第10次迭代的仿真结果。图5描述了分数阶跟随者的初始状态与迭代次数之间的关系。图6描述了领导-跟随分数阶多智能体系统中输出的最大追踪误差与迭代次数之间的关系。由图4、5和6可以看出，本发明中提出的分布式迭代学习控制器具有初始状态学习能力，能够抵制初始状态的偏移，控制阶数不同的分数阶多智能体系统实现输出一致性。

Claims

1.一种分数阶多智能体追踪一致性的迭代学习控制方法，其特征是，所述方法包括以下步骤：

第j个跟随者的动态模型为

跟随者的动态模型写成紧格式为：

其中，

本控制方法的目标是：对于不同阶数的分数阶多智能体系统，设计具有初始状态学习能力的分布式迭代学习控制器，使y_i,j(t)能够跟踪到y₀(t)的轨迹，定义追踪误差

e_i,j(t)＝y₀(t)-y_i,j(t),

则上述目标转化为：对于任意初始条件x_i,j(0)和t∈[0,T]，设计控制器使j＝1,2,…,N成立，从而将分数阶多智能体系统协调追踪的控制问题转化为追踪误差系统在时间区间t∈[0,T]内的稳定性控制问题；

b.设计具有初始状态学习能力的分布式P-型迭代学习控制器：

定义信息测量函数

即：

x_i+1,j(0)＝x_i,j(0)+L_ee_i,j(0),

其中L_e是需要设计的初始状态学习矩阵；

2.根据权利要求1所述的一种分数阶多智能体追踪一致性的迭代学习控制方法，其特征是，求解迭代学习控制器中待定的初始状态学习矩阵L_e和迭代学习增益矩阵Γ(t)的具体方法如下：

定义第i次迭代中的两个列向量

ξ_i,j(t)的紧格式可写为：

其中L是跟随者之间的通讯拓扑图的拉普拉斯矩阵，

综合考虑L_e、Γ(0)和Γ(t)应该满足的条件，给出使不等式：

成立的L_e、Γ(0)和Γ(t)的取值。