CN114167728B

CN114167728B - 带有死区约束的多智能体系统的自适应控制方法及装置

Info

Publication number: CN114167728B
Application number: CN202111494314.8A
Authority: CN
Inventors: 黄成杰; 谢胜利; 刘治; 陈辞; 谢侃
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2023-01-31
Anticipated expiration: 2041-12-08
Also published as: CN114167728A

Abstract

本发明提出一种带有死区约束的多智能体系统的自适应控制方法及装置，包括建立多智能体系统，包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器。建立执行器的死区逆模型。建立多智能体系统的误差函数。设计多智能体系统的控制系统。将所设计的控制系统输出的控制信号输入到多智能体系统中，控制信号先经过执行器的死区逆模型转换再经过死区，消除死区约束的影响，同时将误差函数收敛趋向于零，使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出，让死区的影响可以忽略不计，保证了多智能体系统的稳定性和一致性。

Description

带有死区约束的多智能体系统的自适应控制方法及装置

技术领域

本发明涉及智能体控制领域，更具体地，涉及一种带有死区约束的多智能体系统的自适应控制方法及装置。

背景技术

多智能体系统是由一群具备一定感知、通信、计算和执行能力的智能体通过通信等方式关联成的一个网络系统，智能体指任何能通过传感器感知环境和通过执行器作用于环境的实体。近年来，工业自动化不断发展，系统的集成度、通信方式、互联方式等都在以复杂的趋势变化。因此，对于复杂系统的理论研究显得至关重要。多智能体的一致性控制问题是近年来控制科学领域中最受到关注的问题之一。一致性是指随着时间的增大，多智能体系统中的所有个体的状态都趋于一个相同的值。

现有一种非线性多智能体系统的最优一致性控制方法，先根据异构多智能体系统各个体动力学特性，建立参考行为模型，采用领导者—跟随者的控制模式，形成以参考行为模型为个体组成的多智能体系统；然后根据多智能体的网络拓扑结构，构建动态图型博弈全局误差动力学模型，定义多智能体局部性能指标函数，根据全局纳什均衡，可得贝尔曼最优方程；再在仅利用智能体局部信息条件下，采用基于值函数逼近的执行—评价执行网络框架的方式，在线迭代学习获得最优一致性协议，实现各参考模型行为的一致性。本发明相对现有技术，在保证最优控制性能下，解决复杂多智能体系统的一致性问题。

然而，上述方法忽略了多智能体系统中跟随者智能体受到的死区约束的干扰，不能保证多智能体系统的稳定性和一致性。

发明内容

本发明为补偿每个跟随者智能体受到的死区约束，解决多智能体系统一致性问题。

为解决上述技术问题，本发明的技术方案如下：

第一个方面，本发明提出一种带有死区约束的多智能体系统的自适应控制方法，包括：

建立多智能体系统，包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器；

建立所述执行器的死区逆模型；

建立多智能体系统的误差函数，所述误差函数包括第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差，以及第i个跟随者智能体第k阶状态与虚拟控制器之间的误差；

设计多智能体系统的控制系统，将所设计的控制系统输出的控制信号输入到多智能体系统中，执行器接收控制信号，控制信号先经过执行器的死区逆模型转换再经过死区，消除死区约束的影响，同时将误差函数收敛趋向于零，使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出。

优选地，对于第i个跟随者智能体，建立如下的系统模型：

y_i＝x_i,1

u_i＝DZ(v_i)

其中，

表示第i个跟随者智能体第k阶状态的导数，k为系统状态变量的阶数；

表示第i个跟随者智能体第n_i阶状态的导数，n_i表示第i个跟随者智能体的系统阶数；

表示系统的状态变量；ψ_i,k(·)和

(·)为系统模型中未知的光滑函数；y_i表示系统输出；u_i表示控制输入。

优选地，对于领导者智能体，建立如下的系统模型：

y₀＝x₀

其中，y₀表示领导者智能体的输出；x₀表示领导者智能体的状态，

表示领导者智能体状态的导数，f₀表示已知的动态函数，t表示时间。

优选地，所述死区逆模型DI表示为：

其中，u_i,d表示实际的控制输入；m_i,l表示死区模型的左斜率，m_i,r表示死区模型的右斜率；b_i,l和b_i,r表示死区逆模型的断点；ρ_i,l和ρ_i,r表示死区逆模型的有界函数，其公式如下所示：

其中，κ为可选取的常数参数。

优选地，建立基于神经网络的函数逼近器，用于处理多智能体系统控制过程中面临的非线性未知函数；所述基于神经网络的函数逼近器的定义如下：

其中，F_i,k(Z)为未知函数，

为理想的权重矩阵，φ_i,k为高斯型径向基函数，∈_i,k(Z)为神经网络近似误差；

符号

和神经网络径向基函数Φ_i,k(Z)的定义如下：

其中，m_i,k表示矩阵中k个含0个数，

表示矩阵中n_i个含0个数。

优选地，所述第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差s_i,1表示为：

其中，a_ij≥0表示第i个跟随者智能体能够获取到第j个跟随者智能体的信息，即他们之间有通信拓扑；b_i≥0表示第i个跟随者智能体能够获取到领导者智能体的信息；y_j表示第j个跟随者智能体的输出。

优选地，第i个跟随者智能体的第k个虚拟控制器表示为：

其中，

c_i,k，δ_i,k，δ_i,k+1，r_i,k和l_i为设计的参数；Φ_i,k(χ_i,k)为神经网络的径向基函数向量，且χ_i,k＝[x_i,1,x_i,2,...,x_i,k,x_j,1,x_j,2,...,x_j,k,y₀]^T；

为多智能体系统的自适应参数；

为多智能体系统拓扑的入度矩阵；s_i,k为第i个智能体的第k阶状态与虚拟控制器之间的误差；α_i,l-1为第l-1个虚拟控制器；ω_i,k为设定函数，τ_i,k为调和函数；sg_i,k(·)和f_i,k(·)为一系列的光滑函数，其表示如下：

优选地，第i个跟随者智能体实际控制器表示为：

其中，

l_i，

，Γ_i为设计的参数；

为神经网络的径向基函数向量；

为多智能体系统的自适应参数；

为设定输入参数矩阵；

为设定函数，

为调和函数，ρ_r(v)、ρ_l(v)、ρ_r(t)和ρ_l(v)为有界函数。

优选地，第i个跟随者智能体第k阶状态与虚拟控制器之间的误差s_i,k表示为：

s_i,k＝x_i,k-α_i,k-1

其中，α_i,k-1表示第i个跟随者智能体的第k-1个虚拟控制器。

第二个方面，本发明还提出一种带有死区约束的多智能体系统的自适应控制装置，应用于上述任一方案所述的带有死区约束的多智能体系统的自适应控制方法，包括：

多智能体系统，包括跟随者智能体的系统模型和领导者智能体的系统模型和执行器；

死区约束补偿模块，包括执行器的死区逆模型，用于补偿跟随者智能体受到的死区约束；

控制模块，包括跟随者智能体的虚拟控制器和实际控制器，用于控制跟随者智能体的输出能够跟踪领导者智能体的输出；

误差计算模块，用于计算多智能体系统中跟随者智能体第一阶状态与领导者智能体输出之间的误差，以及跟随者智能体第k阶状态与虚拟控制器之间的误差。

与现有技术相比，本发明技术方案的有益效果是：通过建立执行器的死区逆模型，补偿跟随者智能体受到的死区约束，使得控制信号先经过执行器的死区逆模型转换再经过死区约束，最终消除死区约束的干扰，让死区的影响可以忽略不计，保证了多智能体系统的稳定性和一致性。

附图说明

图1为带有死区约束的多智能体系统的自适应控制方法的流程图。

图2为执行器死区补偿机制的原理图。

图3为死区逆模型的仿真图。

图4为多智能体系统的拓扑图。

图5为领导者智能体以及四个跟随者智能体的输出轨迹图。

图6为四个跟随者智能体的第2阶状态轨迹曲线图。

图7为四个跟随者智能体的跟踪误差曲线图。

图8为带有死区约束的多智能体系统的自适应控制装置的原理图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

请参阅图1-图2，本实施例提出一种带有死区约束的多智能体系统的自适应控制方法，包括：

建立多智能体系统，包括跟随者智能体的系统模型和领导者智能体的系统模型。

在所述多智能体系统中建立其执行器的死区逆模型；

建立多智能体系统的误差函数，所述误差函数包括第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差，以及第i个跟随者智能体第k阶状态与虚拟控制器之间的误差。

设计多智能体系统的控制系统；

将所设计的控制系统输出的控制信号输入到多智能体系统中，执行器接收控制信号，控制信号先经过执行器的死区逆模型转换再经过死区，消除死区约束的影响。同时将误差函数收敛趋向于零，使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出。如图2所示，图2为执行器死区补偿机制的原理图，智能体是任何能通过传感器感知环境和通过执行器作用于环境的实体，在具体实施过程中，通过建立执行器的死区逆模型，补偿跟随者智能体受到的死区约束，使得控制信号先经过执行器的死区逆模型转换再经过死区约束，最终消除死区约束的干扰，让死区的影响可以忽略不计，将所设计的控制系统以及相应的自适应律输入到多智能体系统中，将误差函数收敛趋向于零，使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出，保证了多智能体系统的稳定性和一致性。

实施例2

本实施例提出一种带有死区约束的多智能体系统的自适应控制方法，包括：

建立多智能体系统，包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器。

本实施例中，对于第i个跟随者智能体，建立如下的系统模型：

y_i＝x_i,1

u_i＝DZ(v_i)

其中，

表示系统的状态变量；ψ_i,k(·)和

本实施例中，对于领导者智能体，建立如下的系统模型：

y₀＝x₀

建立所述执行器的死区逆模型。

本实施例中，建立的死区逆模型DI表示为：

其中，κ为可选取的常数参数。

如图3所示，图3为死区逆模型的仿真图，从图3可以看出，构建的死区逆模型为理想的逆模型，因此本实施例的补偿方法能够有效解决死区执行器对系统的影响。

建立基于神经网络的的函数逼近器，用于处理系统控制过程中面临的非线性未知函数。

本实施例中，基于神经网络的的函数逼近器定义如下：

其中，F_i,k(Z)为未知函数，

符号

和神经网络径向基函数Φ_i,k(Z)的定义如下：

其中，m_i,k表示矩阵中k个含0个数，

表示矩阵中n_i个含0个数。

本实施例利用神经网络来处理系统机构的未知性，也将多智能体系统的类型扩展到非严格反馈的非线性系统，给许多现实非严格反馈的多智能体系统一致性提供了方法和理论依据。

本实施例中，第i个跟随者智能体第一阶状态与领导者智能体输出之间的误差s_i,1表示为：

本实施例中，第i个跟随者智能体第k阶状态与虚拟控制器之间的误差s_i,k表示为：

s_i,k＝x_i,k-α_i,k-1

其中，α_i,k-1表示第i个跟随者智能体的第k-1个虚拟控制器。

设计多智能体系统的控制系统，所述控制系统包括跟随者智能体的虚拟控制器和实际控制器。本实施例设计的虚拟控制器能够保证每一步设计的跟随者智能体能够稳定运行，每一个误差能够收敛；实际控制器能够保证整个跟随者智能体系统和领导者智能体系统稳定。

本实施例中，跟随者智能体的第k个虚拟控制器表示为：

其中，

为多智能体系统的自适应参数；

本实施例分别列举了第i个跟随者智能体的第一个虚拟控制器和第二个虚拟控制器：

第i个跟随者智能体的第一个虚拟控制器表示为：

其中，

c_i,1，δ_i,1，r_i,1是设计参数，在设计过程中进行选择；Φ_i,1(χ_i,1)是神经网络的径向基函数向量，且χ_i,1＝[x_i,1,x_j,1,y₀]^T；

是系统的自适应参数；

为多智能体系统拓扑的入度矩阵；s_i,1为第i个智能体的第一阶状态与领导者智能体输出的误差。

第i个跟随者智能体的第二个虚拟控制器表示为：

其中，

c_i,2，δ_i,2，δ_i,3，r_i,2，l_i是设计参数，在设计过程中进行选择；Φ_i,2(χ_i,2)是神经网络的径向基函数向量，且χ_i,2＝[x_i,1,x_i,2,x_j,1,x_j,2,y₀]^T；

是系统的自适应参数；

为多智能体系统拓扑的入度矩阵；s_i,2为第i个智能体的第二阶状态与虚拟控制器之间的误差。

本实施例中，所述跟随者智能体实际控制器表示为：

其中，

l_i，

，Γ_i为设计的参数；

为神经网络的径向基函数向量；

为多智能体系统的自适应参数；

为设定输入参数矩阵；

为设定函数，

为调和函数，ρ_r(v)、ρ_l(v)、ρ_r(t)和ρ_l(v)为有界函数。

本实施例通过建立一系列的控制器作用于多智能体系统，解决误差函数的收敛问题。更具体地说，误差函数中包含了多个误差函数，每个跟随者智能体和领导者智能体之间的误差趋于零或者在零附近的小区间，那么就等同于多智能体系统的共识跟踪得以实现。

本实施例针对待涉及的多智能系统，利用图论，构建相应的拓扑。如图4所示，图4为多智能体系统的拓扑图，在拓扑图中每一个节点相当于智能体，能个智能体能获取的彼此之间的信息是有限的。根据反推法的思想，将每个智能体系统切分成n个子系统，再依次为每个子系统设计相应的虚拟控制器，反推到最后一个子系统，能够设计出该智能体的实际控制器输入。将所设计的控制器以及自适应律输入到多智能体系统，系统中的每个跟随者智能体能够跟踪领导者智能体的运动轨迹。

本实施例对上述带有死区约束的多智能体系统的自适应控制方法进行仿真验证：

给定多智能体系统的数学模型：

仿真结果如图5-图7所示，图5为领导者智能体以及四个跟随者智能体的输出轨迹图，从图5可以看出，四个跟随者智能体能够跟踪上领导者智能体并实现同步；图6为四个跟随者智能体的第2阶状态轨迹曲线图；图7为四个跟随者智能体的跟踪误差曲线图，通过图7可以看出，在设计的控制算法下，多智能体的跟踪误差收敛，从而实现多智能体的同步。

实施例3

请参阅图8，本实施例提出一种带有死区约束的多智能体系统的自适应控制装置，应用于上述实施例提出的带有死区约束的多智能体系统的自适应控制方法，包括：多智能体系统、死区约束补偿模块、控制模块和误差计算模块。

所述多智能体系统包括跟随者智能体的系统模型、领导者智能体的系统模型和执行器。

所述死区约束补偿模块包括执行器的死区逆模型，用于补偿跟随者智能体受到的死区约束；

所述控制模块，包括跟随者智能体的虚拟控制器和实际控制器，用于控制跟随者智能体的输出能够跟踪领导者智能体的输出；虚拟控制器能够保证每一步设计的跟随者智能体能够稳定运行，每一个误差能够收敛；实际控制器能够保证整个跟随者智能体系统和领导者智能体系统稳定。

所述误差计算模块，用于计算多智能体系统中跟随者智能体第一阶状态与领导者智能体输出之间的误差，以及跟随者智能体第k阶状态与虚拟控制器之间的误差。

在具体实施过程中，控制模块输出的控制信号输入到多智能体系统中，执行器接收控制信号；控制信号先经过死区约束补偿模块中的执行器的死区逆模型，使得控制信号先经过执行器的死区逆模型转换再经过死区约束，最终消除死区约束的干扰，补偿跟随者智能体受到的死区约束，让死区的影响可以忽略不计，将误差计算模块中跟随者智能体第一阶状态与领导者智能体输出之间的误差，以及跟随者智能体第k阶状态与虚拟控制器之间的误差收敛趋向于零，使跟随者智能体的输出能够跟踪并趋同领导者智能体的输出，保证了多智能体系统的稳定性和一致性。

附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。