CN115297000B - 有向拓扑下分布式自适应事件触发多自主体包含控制方法 - Google Patents
有向拓扑下分布式自适应事件触发多自主体包含控制方法 Download PDFInfo
- Publication number
- CN115297000B CN115297000B CN202210723055.XA CN202210723055A CN115297000B CN 115297000 B CN115297000 B CN 115297000B CN 202210723055 A CN202210723055 A CN 202210723055A CN 115297000 B CN115297000 B CN 115297000B
- Authority
- CN
- China
- Prior art keywords
- self
- leader
- follower
- matrix
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001960 triggered effect Effects 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004891 communication Methods 0.000 claims abstract description 28
- 239000011159 matrix material Substances 0.000 claims description 55
- 239000003795 chemical substances by application Substances 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 13
- 239000011782 vitamin Substances 0.000 claims description 4
- 229940088594 vitamin Drugs 0.000 claims description 4
- 229930003231 vitamin Natural products 0.000 claims description 4
- 235000013343 vitamin Nutrition 0.000 claims description 4
- 150000003722 vitamin derivatives Chemical class 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 abstract description 7
- 230000007246 mechanism Effects 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 description 25
- 238000010168 coupling process Methods 0.000 description 25
- 238000005859 coupling reaction Methods 0.000 description 25
- 230000003044 adaptive effect Effects 0.000 description 21
- 230000008859 change Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 7
- 238000005265 energy consumption Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000005094 computer simulation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
- H04L41/0836—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability to enhance reliability, e.g. reduce downtime
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/042—Network management architectures or arrangements comprising distributed management centres cooperatively managing the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/0816—Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了有向拓扑下分布式自适应事件触发的异构多自主体包含控制方法,可用于军事中无人坦克、无人车、无人机的协同包含跟踪控制。针对具有不同动力学模型的线性多自主体系统、基于一种不需要知道通讯网络全局信息的自适应事件触发方法,提出了一种有向拓扑网络下的异构多自主体的分布式包含控制算法。为达到上述目的,本发明的技术方案包括如下步骤:采用事件触发数据传输机制,针对含有领导者和跟随者自主体的通讯网络下,利用邻居的局部信息实现跟随着包络在由领导者智能体所组成的凸包内的分布式控制。
Description
技术领域
本发明涉及属于智能控制方面多自主体协同技术领域,涉及一种有向拓扑 下分布式自适应事件触发的异构多自主体包含控制方法。。
背景技术
多自主体系统是指一定数量的具有自主能力的智能体为了完成期望的任务, 通过相互间的信息交换而耦合成的群体系统。,从广义的角度上说,多自主体可 以是无人艇、无人机、车辆,也可以是电机、传感器等。多自主体系统具有以 下几个共同特征:分布式、自主化、复杂功能分布式化。多智能体的包含控制 问题是指包含多个领导者和跟随者由初始的位置出发,通过与相邻自主体进行 一定的相对信息交换,使这一些个体进行不断地修正自身的状态,最终使跟随 者的状态包含在由多个领导者状态所围成的凸包内。
包含控制在军事领域中有着应用价值。在执行军事任务中,地面上的坦克、 车辆、天上四旋翼无人机、固定翼无人机都可以作为不同种结构的自主体,地 面上的自主体被要求到达由天上无人机群所构成二维平面内,以确保它们的安 全。在实际作战场景中,地面上的自主体(如坦克、车辆)可能无法准确得到 全局的定位信息,这就导致了对其实现精准的控制是困难的。同时天上的自主 体(如无人机)可以相对准确地获得比较精确地坐标位置。由于每一个自主体 可以获得其自身于邻近自主体之间的相对信息(主要是相对位置信息和相对速 度信息)。目前,常采用的集中式控制,即:通过一个中央控制器,去控制所有个体方式的鲁棒性对比于分布式比较差。因此通过自主体之间的相对信息就能 够保证所有跟随者运动至由多个领导者所围成的区域内,从而确保了军事中的 各自主体的安全和运动的稳定。
目前各自主体之间的通讯一般是双向通讯的,由于在自主体的通讯网络中, 网络带宽和传输能力都非常有限,因此高效的带宽和能源利用非常重要。分布 式事件触发机制可以在保证自主体抵达期望的位置的前提下,能尽可能减少网 络传输带宽占用,节省数据传输能耗,因此受到广泛关注。
发明内容
有鉴于此,本发明提供了有向拓扑下分布式自适应事件触发的异构多自主 体包含控制方法,可用于军事中无人坦克、无人车、无人机的协同包含跟踪控 制。针对具有不同动力学模型的线性多自主体系统、基于一种不需要知道通讯 网络全局信息的自适应事件触发方法,提出了一种有向拓扑网络下的异构多自 主体的分布式包含控制算法。
为达到上述目的,本发明的技术方案包括如下步骤:采用事件触发数据传 输机制,针对含有领导者和跟随者自主体的通讯网络下,利用邻居的局部信息 实现跟随着包络在由领导者智能体所组成的凸包内的分布式控制。
进一步地,方法包括以下步骤:
步骤1:确定多自主体系统中的各自主体中跟随者数量与领导者数量,并构 建自主体的动力学方程;
步骤2:设计有向的多自主体通讯拓扑图,该通讯拓扑图满足每一个领导者 到每一个跟随者都存在一条有向路径。
步骤3:设计分布式自适应控制器,利用邻居的局部信息实现跟随着包络在 由领导者智能体所组成的凸包内的分布式控制。
步骤4:设定自适应事件触发条件,当每一个自主体i监测判断其需要发生 触发之后,自主体i采集使用周围邻居自主体的相对信息;若每一个自主体i判 断其自身不需要触发,则不更新周围邻居自主体的相对信息。
步骤5、设定系统的运行事件T,对步骤1中的多自主体系统进行离散化, 利用步骤3中的分布式自适应控制器设计构造以及步骤4的事件触发条件运行 每个自主体系统。
步骤6、在每一时刻k,k=1,2,L,输出yi(k),即得到时刻k所要求的自主体i的 输出状态的值。
进一步地,步骤1具体为:
跟随者自主体即跟随者个数N,领导者自主体即领导者为N;用IF表示跟随 者的索引集{1,2,...,N},IL表示领导者的索引集{N+1,N+2,...,N+M},跟随者和领 导者的动力学方程分别是:
其中xi(t)为t时刻第i个跟随者状态,ui(t)为t时刻第i个跟随者的控制输入,为t时刻第i个跟随者的状态的一阶导数,yi(t)为第i个跟随者的输出量,ωl(t) 为第l个领导者的状态量,为第l个领导者的状态量的一阶导数,yl(t)为第i个 领导者的输出量,l为领导者的序号。
跟随者输入初始状态xi(0),领导者输入的初始状态wl(0),分 别为ni维,pi维实向量,分别是ni×ni维矩阵,ni×qi维矩阵,pi×ni维矩阵;ωl∈Rn,yl∈Rp n维,p维矩阵;S∈Rn×n,R∈Rp×n为n×n 维,p×n维矩阵。
进一步地,步骤2具体包括如下步骤:
检验所述多自主体系统的系统动态需要满足S的所有的特征值都有非负实 部;设计的各个自主体的通讯拓扑图需要满足每一个领导者到每一个跟随者都 存在一条有向路径;所给出的矩阵S对于满足
其中υ表示矩阵S的一个特征值,函数σ(·)表示矩阵的特征值的集合,I表示 相应的单位矩阵,ni表示第i个自主体的状态数量,qi表示第i个自主体控制器的 控制输入维数;对于所述多自主体系统,任意自主体i都存在一组解(Πi,Ui),满 足输出调节器方程
其中Πi,Ui表示上述等式的解矩阵;
如权利要求3所述的方法,其特征在于,所述步骤3,具体为:
设计三个合适的控制参数第一控制参数第二控制参数Ki,1,第三控制参 数Ki,2,三者满足Ai+BiKi,1的所有特征值的实部是小于等于0的, Ki,2=Ui-Ki,1Πi,F=-QTP,Γ=PQQTP,其中P,Q>0是正定矩阵,满足以下黎 卡提方程:STP+PS-PQQTP+I=0
根据上述准备,设计分布式自适应控制器如下:对于任意时刻t∈[tk,tk+1),
上述gi(t)表示一个平滑的非线性函数,具有下面的形式:
相关参数的设定值和需要满足的要求如下:
k:第i个跟随者的第k次事件触发的序号,用于描述触发瞬间区间,k∈N, N为自然数的集合;
ui(t):第i个自主体的控制输入,
ζi(t):第i个自主体的局部观测器,利用输出信息来估计自主体自身的状态 信息, 表示第i个自主体局部观测器在t时刻的一阶导数,用于计 算其下一时刻的状态量。
εi(t):第i个自主体的分布式事件触发观测器,利用邻居自主体之间的相对 信息来估计自主体期望达成的状态,εi(t)∈Rn;表示第i个自主体分布式观测 器在t时刻的一阶导数。
ci(t):分布式事件触发观测器的自适应耦合系数,它可以使用观测到的相对 误差和克服系统在设计控制器时对拉普拉斯矩阵特征值的依赖,ci(t)∈R;同时, ci(0)表示第i个自主体的分布式事件触发观测器的自适应耦合系数的初始值, ci(0)>0;表示自适应耦合系数ci在t时刻的一阶导数。
α:自适应耦合系数的速率调节值,用于调节耦合系数变化的速率,α∈R是 一个大于零的常数。
β(t):自适应耦合系数抑制速率增长的调节值,用于抑制系统初始阶段耦合 系数变化的速率,β(t)=be-θt∈R是一个时变函数,b,θ是大于零的常数;
m:用于调节分布式观测器εi(t)中gi(t)的一个正数常值;
第i个自主体在最近一次的触发瞬间的邻居自主体间的观测值εi(t)与 期望值的误差和,其中表示在t时 刻自主体i的事件序列号;
一个二次系数值,用于自适应调节控制器的输入,
Ki,1:第i个自主体的增益矩阵,
Ki,2:第i个自主体的增益矩阵,
第i个自主体的局部观测器εi(t)的反馈矩阵,
Γ:局部观测器εi(t)中用于调节耦合系数的增益矩阵,Γ∈Rn×n;
aij:表示自主体j到自主体i之间的耦合权重系数,aij≥0;若aij>0表示自主 体j到自主体i之间
存在一条边,表示信息可以从自主体j传递到自主体i,其中|aij|表示权重 值;若aij=0表示自主体j到自主体i之间不存在边,表示信息无法从自主体j传 递到自主体i。
进一步地,步骤4具体为:
在任意时间段[tk,tk+1)内,利用下式求出组合测量误差ei(t):
根据设计的控制器设计,求出如下各个自主体分布式观测状态的紧凑形式:
根据上述表达式就能得到如下形式:
其中
δ=col{δ1,....,δN},ε=col{ε1,....,εN},e=diag{e1,...,eN}, ω=col{ωN,....,ωM},
用表示自主体i的触发间隔,其中表示为自主体i的下一 次触发时刻,它由以下事件触发条件决定:
上述的变量η1,η2,b1,b2,θ1, θ2是大于零的常数;当每一个自主体i监测判断其需要发生触发之后,自主体i将 会采集使用周围邻居自主体的相对信息;若每一个自主体i判断其自身不需要触 发,则不更新周围邻居自主体的相对信息;
为了实现自主体之间的离散通讯而不是连续通讯,根据所给出事件触发条 件,可以看到条件中存在不能直接得出的参数ei,ρi,δi。可以注意到ei,δi可 以转化为以下形式:
其中i,j∈IF,表示发送给自主体i的所有邻居自主体i的数量。通过在触 发时刻传输邻居智能体的形式cj(t),就可以计算出于是通过上述有 关时间t的微分方程迭代,就能准确预测出事件触发条件所需变量的值。
有益效果:
1、本发明采用事件触发数据传输机制,与传统的时间触发测量相比,具有 运算量小,低能耗等优点,可以将数据在能耗最低的情况下进行更为有效、充 分的利用,同时,由于采用分布式算法,每一个个体的鲁棒性更强,应用场景 更加广泛。本发明采用事件触发数据传输机制,与传统的时间触发策略相比, 减少冗余测量传输,在保证估计精度的前提下节省网络带宽和传输能耗。
2、本发明给出了有向通讯拓扑图下的一种分布式自适应事件触发算法,相 对于传统集中式控制算法,该方法可以仅利用自主体之间的相对信息实现期望 的控制,能够应对不同的由于传感器限制导致不能获取系统全局信息的情况。
3、本发明提出自适应算法不局限于无向通讯网络图,而是可以应用于有向 网络图中,所要求的有向网络图至于要满足每一个领导者到每一个跟随者都含 有一条有向路径。
4、本发明能够提高系统的可靠性。以军事中的多机作战为背景,如果只利 用一个中央控制器对参与的自主体进行控制,若中央控制器系统发生故障,那 么整个作战系统将会发生崩溃。而多个自主体相关通讯同时发生故障的可能性 很小,因此多自主体集成的分布式控制系统将提高系统的可靠性。
5、本发明抗通讯中断能力强,能够提高系统控制运动精度。本发明采用了 事件触发的运动算法,即使在某一个事件间隔内,自主体之间的通讯发生中断, 所采用的控制器将通过一种预测机制,来拟合出邻居自主体的对应状态,从而 判断系统控制器是否发生变化,确保了系统的稳定性和有效性。
6、本发明提高系统的鲁棒性。通常在有自主体直接的通讯受到中断时,通 讯拓扑的拉普拉斯矩阵的特征值信息会发生改变。而通常的分布式控制器在设 计控制器的时候是需要通讯拓扑的拉普拉斯矩阵的特征值信息的。本发明采用 的算法则可以避免这一种情况的发生,因为它可以在设计控制器的时候不需要 任何特征值信息,从而在一定程度上避免了由于通讯中断引起的不稳定。
7、本发明可直接用于不同的线性动力学模型的无人车、无人机的控制,并 且方法实施简单,易于推广。在军事领域中的多战车野外作战、多无人机飞行 等许多应用领域都有潜在价值。
附图说明
图1为本发明所述有向拓扑下分布式自适应事件触发的异构多自主体包含 控制方法的计算机流程框图;
图2为异构多自主体之间的有向通讯拓扑关系,其中编号1-4表示异构跟随 者智能体,编号5-7表示同构领导者多自主体,有向箭头表示自主体间信息流的 传递方向关系;
图3为计算机仿真曲线之不同时刻下的多自主体输出状态的截图,图3中 的(a)-(d)图表示分别表示时刻为0秒,5秒,8秒,10秒时刻的快照;虚线表 示由领导者所围成的凸包图,圆点表示跟随者的输出状态信息,方块点表示领 导者的输出状态信息;
图4为所有自主体的输出状态在0-10秒内的变化曲线值。图4中的(a)为 状态yi1的状态变化图。图4中的(b)为状态yi2的状态变化图;虚线表示跟随者 的输出状态曲线,实线为领导者的输出状态曲线。
图5为计算机仿真曲线之分布式观测器局部误差总值和局部观测器的误差 值,其中图5中的(a)、(b)为分布式观测器的局部误差总值的两个不同状态, 图5中的(c)为各跟随者局部观测器误差值的范数。
图6为跟随者局部观测器的事件触发图。其中,横纵坐标表示跟随者智能 体发生事件触发的时刻信息,竖坐标为各跟随者各事件触发的间隔信息。
图7为跟随者局部观测器的事件触发的间隔图。其中实线段为跟随者的最 小触发间隔,虚线段为跟随者的中位数触发间隔。
具体实施方式
下面结合附图并举实施例,对本发明进行详细描述。
本发明提供了一种本发明提出有向拓扑下分布式自适应事件触发的异构多 自主体包含控制方法,可用于军事中无人坦克、无人车、无人机的协同包含跟 踪控制。针对具有不同动力学模型的线性多自主体系统、基于一种不需要知道 通讯网络全局信息的自适应事件触发方法,提出了一种有向拓扑网络下的异构 多自主体的分布式包含控制算法。
本发明采用事件触发数据传输机制,与传统的时间触发测量相比,具有运 算量小,低能耗等优点,可以将数据在能耗最低的情况下进行更为有效、充分 的利用,同时,由于采用分布式算法,每一个个体的鲁棒性更强,应用场景更 加广泛。
其特征在于,所述方法在计算机上依次按以下步骤进行实现:
1、一种有向拓扑下分布式自适应事件触发的异构多自主体包含控制方法:
步骤1、跟随者自主体(以下简称跟随者)个数N,领导者自主体(以下简 称领导者)为N;用IF表示跟随着的索引集{1,2,...,N},IL表示领导者智能体的索 引集{N+1,N+2,...,N+M},它们的动力学方程分别是:
跟随者输入初始状态xi(0),领导者输入的初始状态wl(0),分别为ni维,pi维实向量,分别是ni×ni维矩阵,ni×qi维矩阵,pi×ni维矩阵;ωl∈Rn,yl∈Rp,S∈Rn×n,R∈Rp×n为n维,p维,n×n维, p×n维矩阵。
步骤2、检验所研究的多自主体的系统动态需要满足S的所有的特征值都有 非负实部;设计的各个自主体的通讯拓扑图需要满足每一个领导者到每一个跟 随者都存在一条有向路径;所给出的矩阵S对于满足
其中函数σ(·)表示矩阵的特征值的集合;对于所研究的多自主体系统,任意 自主体i都存在一组解(Πi,Ui),它们满足输出调节器方程:
步骤3、设计合适的控制参数Ki,1,Ki,2满足Ai+BiKi,1的所有特 征值的实部是小于等于0的,Ki,2=Ui-Ki,1Πi,F=-QTP,Γ=PQQTP,其中P,Q>0 是正定矩阵,它们需满足以下黎卡提等式:
STP+PS-PQQTP+I=0
根据上述准备,设计分布式自适应控制器如下:对于任意时刻t∈[tk,tk+1),
上述gi(t)表示一个平滑的非线性函数,它具有下面的形式:
相关参数的设定值和需要满足的要求如下:
k:第i个跟随者的第k次事件触发的序号,用于标记触发瞬间区间,k∈N, N为自然数的集合;
ui(t):第i个自主体的控制输入,
ζi(t):第i个自主体的局部观测器,利用输出信息来估计自主体自身的状态 信息,
εi(t):第i个自主体的分布式事件触发观测器,利用邻居自主体之间的相对 信息来估计自主体期望达成的状态,εi(t)∈Rn;
ci(t):分布式事件触发观测器的自适应耦合系数,它可以使用观测到的相对 误差和克服系统在设计控制器时对拉普拉斯矩阵特征值的依赖,ci(t)∈R;同时, ci(0)表示第i个自主体的分布式事件触发观测器的自适应耦合系数的初始值, ci(0)>0;
α:自适应耦合系数的速率调节值,用于调节耦合系数变化的速率,α∈R是 一个大于零的常数。
β(t):自适应耦合系数抑制速率增长的调节值,用于抑制系统初始阶段耦合 系数变化的速率,β(t)=be-θt∈R是一个时变函数,b,θ是大于零的常数;
m:用于调节分布式观测器εi(t)中gi(t)的一个正数常值;
第i个自主体在最近一次的触发瞬间的邻居自主体间的观测值εi(t)与 期望值的误差和,其中表示在t时 刻自主体i的事件序列号;
一个二次系数值,用于自适应调节控制器的输入,
Ki,1:第i个自主体的增益矩阵,
Ki,2:第i个自主体的增益矩阵,
第i个自主体的局部观测器εi(t)的反馈矩阵,
Γ:局部观测器εi(t)中用于调节耦合系数的增益矩阵,Γ∈Rn×n;
aij:表示自主体j到自主体i之间的耦合权重系数,aij≥0;若aij>0表示自 主体j到自主体i之间
存在一条边(表示信息可以从自主体j传递到自主体i),其中|aij|表示权重 值;若aij=0表示自主体j到自主体i之间不存在边(表示信息无法从自主体j传 递到自主体i);
步骤4、在任意时间段[tk,tk+1)内,利用下式求出组合测量误差
根据设计的控制器设计,求出如下各个自主体分布式观测状态的紧凑形式:
根据上述表达式就能得到如下形式:
其中δ=col{δ1,....,δN},ε=col{ε1,....,εN},e=diag{e1,...,eN}, ω=col{ωN,....,ωM},
下面令表示自主体i的触发间隔,其中指代自主体i的下 一次触发时刻,它由以下事件触发条件决定:
上述的变量η1,η2,b1,b2,θ1, θ2是大于零的常数。当每一个自主体i监测判断其需要发生触发之后,自主体i将 会采集使用周围邻居自主体的相对信息;若每一个自主体i判断其自身不需要触 发,则不更新周围邻居自主体的相对信息。
为了实现自主体之间的离散通讯而不是连续通讯,根据所给出事件触发条 件,可以看到条件中存在不能直接得出的参数ei,ρi,δi。可以清楚知道ei,δi可 以由以下式子得到:
其中i,j∈IF,表示发送给自主体i的所有邻居自主体i的数量。通过在触 发时刻传输邻居智能体的形式cj(t),就可以计算出于是通过上述有 关时间t的微分方程迭代,就能准确预测出事件触发条件所需变量的值。
步骤5、设定系统的运行时间T,对步骤(1)中的系统进行离散化,利用步骤 (3)中的控制器设计构造,以及步骤(4)的事件触发条件运行每个自主体系统。
步骤6、在每一时刻k,k=1,2,L,输出yi(k),即得到时刻k所要求的自主体i的 输出状态的值。
具体实施例:
硬件环境:计算机;相关器
软件配置:Windows 2000/XP;matlab或C语言或C++等任何一种语言环境 软件。
下面通过附图和实例对本发明的技术方案作进一步的详细说明。
有向拓扑下自适应事件触发的异构多自主体协同包含控制方法的方框图如 图1所示。
本发明的技术方案具体按以下步骤依次实现:
步骤1、跟随者自主体(以下简称跟随者)个数N,领导者自主体(以下简 称领导者)为N;用IF表示跟随着的索引集{1,2,...,N},IL表示领导者智能体的索 引集{N+1,N+2,...,N+M},它们的动力学方程分别是:
跟随者输入初始状态xi(0),领导者输入的初始状态wl(0),分 别为ni维,pi维实向量,分别是ni×ni维矩阵,ni×qi维矩阵,pi×ni维矩阵;ωl∈Rn,yl∈Rp S∈Rn×n,R∈Rp×n为n维,p维矩阵。
步骤2、检验所研究的多自主体的系统动态需要满足S的所有的特征值都有 非负实部;设计的各个自主体的通讯拓扑图需要满足每一个领导者到每一个跟 随者都存在一条有向路径;所给出的矩阵S对于满足
其中函数σ(g)表示矩阵的特征值的集合;对于所研究的多自主体系统,任意 自主体i都存在一组解(Πi,Ui),它们满足输出调节器方程
步骤3、设计合适的控制参数Ki,1,Ki,2满足Ai+BiKi,1的所有特 征值的实部是小于等于0的,Ki,2=Ui-Ki,1Πi,F=-QTP,Γ=PQQTP,其中P,Q>0 是正定矩阵,它们需满足以下黎卡提方程:
STP+PS-PQQTP+I=0
根据上述准备,设计分布式自适应控制器如下:对于任意时刻t∈[tk,tk+1),
上述gi(t)表示一个平滑的非线性函数,它具有下面的形式:
相关参数的设定值和需要满足的要求如下:
k:第i个跟随者的第k次事件触发的序号,用于描述触发瞬间区间,k∈N, N为自然数的集合;
ui(t):第i个自主体的控制输入,
ζi(t):第i个自主体的局部观测器,利用输出信息来估计自主体自身的状态 信息,
εi(t):第i个自主体的分布式事件触发观测器,利用邻居自主体之间的相对 信息来估计自主体期望达成的状态,εi(t)∈Rn;
ci(t):分布式事件触发观测器的自适应耦合系数,它可以使用观测到的相对 误差和克服系统在设计控制器时对拉普拉斯矩阵特征值的依赖,ci(t)∈R;同时, ci(0)表示第i个自主体的分布式事件触发观测器的自适应耦合系数的初始值, ci(0)>0;
α:自适应耦合系数的速率调节值,用于调节耦合系数变化的速率,α∈R是 一个大于零的常数。
β(t):自适应耦合系数抑制速率增长的调节值,用于抑制系统初始阶段耦合 系数变化的速率,ε(t)=be-θt∈R是一个时变函数,b,θ是大于零的常数;
m:用于调节分布式观测器εi(t)中gi(t)的一个正数常值;
第i个自主体在最近一次的触发瞬间的邻居自主体间的观测值εi(t)与 期望值的误差和,其中表示在t时 刻自主体i的事件序列号;
系数值,用于自适应地调节控制器的输入,
Ki,1:第i个自主体的增益矩阵,
Ki,2:第i个自主体的增益矩阵,
第i个自主体的局部观测器εi(t)的反馈矩阵,
Γ:局部观测器εi(t)中用于调节耦合系数的增益矩阵,Γ∈Rn×n;
aij:表示自主体j到自主体i之间的耦合权重系数,aij≥0;若aij>0表示自 主体j到自主体i之间存在一条边(表示信息可以从自主体j传递到自主体i),其 中|aij|表示权重值;若aij=0表示自主体j到自主体i之间不存在边(表示信息无 法从自主体j传递到自主体i);
步骤4、在任意时间段[tk,tk+1)内,利用下式求出组合测量误差
根据设计的控制器设计,求出如下各个自主体分布式观测状态的紧凑形式:
根据上述表达式就能得到如下形式:
其中定义δ=col{δ1,....,δN},ε=col{ε1,....,εN},e=diag{e1,...,eN}, ω=col{ωN,....,ωM},
令表示自主体i的触发间隔,其中表示为自主体i的下一 次触发时刻,它由以下事件触发条件决定:
上述的变量η1,η2,b1,b2,θ1, θ2是大于零的常数。当每一个自主体i监测判断其需要发生触发之后,自主体i将 会采集使用周围邻居自主体的相对信息;若每一个自主体i判断其自身不需要触 发,则不更新周围邻居自主体的相对信息。
为了实现自主体之间的离散通讯而不是连续通讯,根据所给出事件触发条 件,可以看到条件中存在不能直接得出的参数ei,ρi,δi。可以知道ei,δi可以 转化为以下形式:
其中i,j∈IF,表示发送给自主体i的所有邻居自主体i的数量。通过在触 发时刻传输邻居智能体的形式cj(t),就可以计算出于是通过上述有 关时间t的微分方程迭代,就能准确预测出事件触发条件所需变量的值。
步骤5、设定系统的运行事件T,对步骤(1)中的系统进行离散化,利用步骤 (3)中的控制器设计构造,以及步骤(4)的事件触发条件运行每个自主体系统。
步骤6、在每一时刻k,k=1,2,L,输出yi(k),即得到时刻k所要求的自主体i的 输出状态的值。
下面将通过仿真实验测试本发明方法的有效性。
考虑一组异构自主体,它包含4个异构跟随者(序号标记为1、2、3、4) 和3个同构领导者(序号标记为5、6、7),它们的运动学模型的各矩阵具有如 下形式:
所有自主体的状态的初始值为x1(0)=[-1,3,1]T,x2(0)=[-2,1,2]T,x3(0)=[6,-2]T, x4(0)=[5,-3]T,ω5(0)=[-2,1]T,ω6(0)=[-1,1.5]T,ω7(0)=[1.2,-0.7]T。
同时,设定每一个自主体控制器中的初始矢量ζi和εi的各个值为0,ci(0)=2, m=0.5,α=1,β=2e-t,β1=β2=e-0.5t,η1=η2=1。同时,该多自主体的通信拓 扑图的拉普拉斯矩阵为:
为了满足步骤2中的条件,设定
于是,就可以求解以下各跟随者需要的反馈矩阵:
各个局部观测器的增益矩阵为
设定根据步骤2中的黎卡提方程,得出
于是就可以直接求出
本发明选取对所研究的线性连续系统进行离散化,离散间隔为10-4秒,并观 察所提算法的有效性。仿真结果如图3--图7和表1所示。
图2表示领导者与跟随者之间的通讯拓扑图。从图2中可以看出,1、2、3、 4序号是跟随者,5、6、7序号为领导者智能体。此外,可以看出每一个领导者 到每一个跟随者都存在着至少一条有向路径。
图3表示跟随者和领导者的输出状态yi1与yi2在时间为0秒、5秒、7.5秒、 10秒的状态快照图。从图4可以看出,本发明所提出的多自主体包含控制算法 能够将所有跟随者自主体包围在由三个领导者们输出状态所围成的凸包内,这 说明了所提出的算法能够实现期望的包含控制。
图4表示本发明提出的多自主体包含控制算法在0秒到10秒内各输出状态 的变化趋势。可以看出,4个跟随者在所涉及的自适应事件触发算法下,其输出 状态能够从初始的分散状态进入至3个领导者的输出所组成的范围内。
表5给出了分布式观测器εi(t)中的变量和局部观测器观测误差的状态变 化图。表示自主体自身的观测值与邻居观测值差值的变化。由此可见,各自 主体的观测器差值仅在触发时刻发生变化(因为在触发时刻,各自主体需要更 新所需要的邻居智能体信息),而在不需要触发的时刻不改变其数值。这一特征 也表明智能体之间的信息交互是基于离散采样的,而不是连续采样。另一方面, 可以根据局部观测器观测误差的变化可以体现出局部观测器能够估计出自主体 i自身的状态。
图6、图7和表1表示每一个跟随者的分布式事件触发观测的触发信息。 由于,该实验对线性系统以10-4秒内进行线性化。从图6、图7可以看出,所提 出的算法能够避免芝诺行为的发生,即:不会在有限时间内发生无限的触发信 息。图7给出了各跟随者的最小触发时间间隔和最大时间间隔,反应了所给出 的算法的使用的有效性和可靠性。从表1中,我们给出了跟随者智能体的触发 详细的触发信息,包含10秒内每个跟随者的触发次数、最小间隔、中位间隔, 这更充分地反应了本发明所提出的触发策略的良好表现。
表1
智能体编号 | 触发次数 | 最小时间间隔 | 中位时间间隔 |
1 | 155 | 0.0044秒 | 0.0443秒 |
2 | 189 | 0.0064秒 | 0.0221秒 |
3 | 135 | 0.0256秒 | 0.0403秒 |
4 | 57 | 0.0623秒 | 0.1048秒 |
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保 护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。
Claims (1)
1.有向拓扑下分布式自适应事件触发多自主体包含控制方法,其特征在于,包括以下步骤:
步骤1:确定多自主体系统中的各自主体中跟随者数量与领导者数量,并构建自主体的动力学方程;
步骤2:设计有向的多自主体通讯拓扑图,该通讯拓扑图满足每一个领导者到每一个跟随者都存在一条有向路径;
步骤3:设计分布式自适应控制器,利用邻居的局部信息实现跟随者包络在由领导者智能体所组成的凸包内的分布式控制;
步骤4:设定自适应事件触发条件,当每一个自主体i监测判断其需要发生触发之后,自主体i采集使用周围邻居自主体的相对信息;若每一个自主体i判断其自身不需要触发,则不更新周围邻居自主体的相对信息;
步骤5、设定系统的运行事件T,对步骤1中的多自主体系统进行离散化,利用步骤3中的分布式自适应控制器以及步骤4的事件触发条件运行每个自主体系统;
步骤6、在每一时刻k,k=1,2,…,输出yi(k),即得到时刻k所要求的自主体i的输出状态的值;
其中,所述步骤1具体为:
跟随者自主体即跟随者个数N,领导者自主体即领导者为M;用IF表示跟随者的索引集{1,2,...,N},IL表示领导者的索引集{N+1,N+2,...,N+M},跟随者和领导者的动力学方程分别是:
其中xi(t)为t时刻第i个跟随者状态,ui(t)为t时刻第i个跟随者的控制输入,为t时刻第i个跟随者的状态的一阶导数,yi(t)为第i个跟随者的输出量,ωl(t)为第l个领导者的状态量,为第l个领导者的状态量的一阶导数,yl(t)为第l个领导者的输出量,l为领导者的序号;
跟随者输入初始状态xi(0),领导者输入的初始状态wl(0),分别为ni维,pi维实向量,分别是ni×ni维矩阵,ni×qi维矩阵,pi×ni维矩阵;ωl∈Rn,yl∈Rp分别为n维,p维矩阵;S∈Rn×n,R∈Rp×n分别为n×n维,p×n维矩阵;
所述步骤2具体包括如下步骤:
检验所述多自主体系统的系统动态需要满足S的所有的特征值都有非负实部;设计的各个自主体的通讯拓扑图需要满足每一个领导者到每一个跟随者都存在一条有向路径;所给出的矩阵S对于满足
其中υ表示矩阵S的一个特征值,函数σ(·)表示矩阵的特征值的集合,I表示相应的单位矩阵,ni表示第i个自主体的状态数量,qi表示第i个自主体控制器的控制输入维数;对于所述多自主体系统,任意自主体i都存在一组解(Πi,Ui),满足输出调节器方程
其中Πi,Ui表示上述等式的解矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210723055.XA CN115297000B (zh) | 2022-06-21 | 2022-06-21 | 有向拓扑下分布式自适应事件触发多自主体包含控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210723055.XA CN115297000B (zh) | 2022-06-21 | 2022-06-21 | 有向拓扑下分布式自适应事件触发多自主体包含控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115297000A CN115297000A (zh) | 2022-11-04 |
CN115297000B true CN115297000B (zh) | 2023-09-26 |
Family
ID=83821166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210723055.XA Active CN115297000B (zh) | 2022-06-21 | 2022-06-21 | 有向拓扑下分布式自适应事件触发多自主体包含控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115297000B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115993844B (zh) * | 2023-03-23 | 2023-05-30 | 西北工业大学深圳研究院 | 一种群体智能系统自适应事件触发时变分组编队控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108107725A (zh) * | 2017-12-05 | 2018-06-01 | 南京航空航天大学 | 基于事件触发的二阶时变时延多智能体系统包容控制方法 |
CN110933726A (zh) * | 2019-12-12 | 2020-03-27 | 华东交通大学 | 一种切换异构网络下的多智能体系统包含控制的实现方法 |
CN113268083A (zh) * | 2021-06-07 | 2021-08-17 | 山东大学 | 基于动态事件触发的多无人机系统编队跟踪控制方法 |
CN113296410A (zh) * | 2021-05-26 | 2021-08-24 | 哈尔滨理工大学 | 一种切换拓扑下的多智能体系统的领导跟随一致性方法 |
CN113589694A (zh) * | 2021-08-02 | 2021-11-02 | 厦门大学 | 异构多智能体系统的完全分布式抗饱和跟踪控制方法 |
WO2022077817A1 (zh) * | 2020-10-13 | 2022-04-21 | 湖南大学 | 一种基于视觉与性能约束的多无人机协同控制方法及系统 |
-
2022
- 2022-06-21 CN CN202210723055.XA patent/CN115297000B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108107725A (zh) * | 2017-12-05 | 2018-06-01 | 南京航空航天大学 | 基于事件触发的二阶时变时延多智能体系统包容控制方法 |
CN110933726A (zh) * | 2019-12-12 | 2020-03-27 | 华东交通大学 | 一种切换异构网络下的多智能体系统包含控制的实现方法 |
WO2022077817A1 (zh) * | 2020-10-13 | 2022-04-21 | 湖南大学 | 一种基于视觉与性能约束的多无人机协同控制方法及系统 |
CN113296410A (zh) * | 2021-05-26 | 2021-08-24 | 哈尔滨理工大学 | 一种切换拓扑下的多智能体系统的领导跟随一致性方法 |
CN113268083A (zh) * | 2021-06-07 | 2021-08-17 | 山东大学 | 基于动态事件触发的多无人机系统编队跟踪控制方法 |
CN113589694A (zh) * | 2021-08-02 | 2021-11-02 | 厦门大学 | 异构多智能体系统的完全分布式抗饱和跟踪控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115297000A (zh) | 2022-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111638726B (zh) | 基于事件触发通信的多无人机编队一致性控制方法 | |
Lin | Distributed UAV formation control using differential game approach | |
CN111522361B (zh) | 主-从模式的多无人机编队一致性控制方法 | |
CN110703795B (zh) | 一种基于切换拓扑的无人机群协同安全控制方法 | |
CN110162035B (zh) | 一种集群机器人在有障碍物场景中的协同运动方法 | |
CN110161847B (zh) | 一种基于分布式奇异观测器的无人机编队系统传感器故障估计方法 | |
Yang et al. | Event-triggered finite-time formation control for multiple unmanned aerial vehicles with input saturation | |
CN115297000B (zh) | 有向拓扑下分布式自适应事件触发多自主体包含控制方法 | |
Maciejowski et al. | Fault tolerant control using Gaussian processes and model predictive control | |
Zhu et al. | Back‐stepping sliding mode control method for quadrotor UAV with actuator failure | |
Chen et al. | Three-dimensional event-triggered fixed-time cooperative guidance law against maneuvering target with the constraint of relative impact angles | |
Jia et al. | Distributed analytical formation control and cooperative guidance for gliding vehicles | |
Wang et al. | Fixed-time event-triggered sliding mode cooperative path-following control with prescribed performance for USVs based on lumped disturbance observer | |
CN111596688B (zh) | 基于连续通信的多无人机编队一致性控制方法 | |
An et al. | Event-triggered adaptive control of hypersonic vehicles subject to actuator nonlinearities | |
Wu et al. | Elman Neural Network‐Based Direct Lift Automatic Carrier Landing Nonsingular Terminal Sliding Mode Fault‐Tolerant Control System Design | |
Meng et al. | Fixed-Time Optimal Fault-Tolerant Formation Control with Prescribed Performance for Fixed-Wing UAVs Under Dual Faults | |
Zhao et al. | Dynamic evaluation strategies for multiple aircrafts formation using collision and matching probabilities | |
Watanabe et al. | Optimal 3-D guidance from a 2-D vision sensor | |
CN110162084A (zh) | 基于一致性理论的飞航导弹集群系统编队控制方法 | |
CN115145312A (zh) | 仅方位角测量下基于双领导者模式的集群协同控制方法 | |
CN115373260A (zh) | 一种基于预定性能函数的农用无人机容错控制方法 | |
Wu et al. | Integral event-triggered time-varying formation tracking for UAV swarm systems with switching directed topologies | |
Shi et al. | Finite-time adaptive cooperative guidance for multiple missiles | |
CN114995518B (zh) | 从飞行器gps目标定位失效时的主-从式协同制导方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |