CN116414037A - 一种用于集群系统约束控制的自适应装置 - Google Patents

一种用于集群系统约束控制的自适应装置 Download PDF

Info

Publication number
CN116414037A
CN116414037A CN202310678172.3A CN202310678172A CN116414037A CN 116414037 A CN116414037 A CN 116414037A CN 202310678172 A CN202310678172 A CN 202310678172A CN 116414037 A CN116414037 A CN 116414037A
Authority
CN
China
Prior art keywords
follower
leader
state
adaptive
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310678172.3A
Other languages
English (en)
Other versions
CN116414037B (zh
Inventor
董希旺
王庆
孔祥锡
化永朝
于江龙
任章
吕金虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202310678172.3A priority Critical patent/CN116414037B/zh
Publication of CN116414037A publication Critical patent/CN116414037A/zh
Application granted granted Critical
Publication of CN116414037B publication Critical patent/CN116414037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种用于集群系统约束控制的自适应装置,涉及集群系统协同控制领域,其中,第一自适应观测器、第二自适应观测器和自适应控制器;第一自适应观测器用于基于目标跟随者的第一运动状态向量,预测目标领导者的运动状态向量;第二自适应观测器用于基于目标跟随者的第二运动状态向量,预测目标领导者的指令信息;自适应控制器用于根据目标领导者的运动状态向量和指令信息,基于鲁棒预定义输出约束,对集群系统中的各跟随者进行约束控制。本发明通过第一、第二自适应观测器,可以预测目标领导者的状态和指令信息,并可以通过自适应控制器,使跟随者跟随领导者的状态和指令进行移动,从而实现了集群系统的约束控制。

Description

一种用于集群系统约束控制的自适应装置
技术领域
本发明涉及集群系统协同控制领域,特别是涉及一种用于集群系统约束控制的自适应装置。
背景技术
目前,包括无人车和无人机在内的集群系统协同控制技术因其在海洋测绘、搜索和救援等领域的广泛应用而受到越来越多的关注。在许多实际情况下,具有不同类型和不同动力学的多个机器人可以通过彼此协作更有效地完成一些复杂或大型任务,例如在火灾后使用无人车和无人机进行协作搜索和救援或海啸灾难,通过无人车和空中无人机的组合,空地协同控制系统可以大大提高工作效率,弥补单一机器人的局限性。因此,研制一种可用于无人车和无人机在内的集群系统约束控制的自适应观测器,对于集群系统协同控制领域的发展十分重要。
发明内容
本发明的目的是提供一种用于集群系统约束控制的自适应装置,可实现包括无人车和空中无人机的集群系统的约束控制。
本发明提供了一种用于集群系统约束控制的自适应装置,包括:第一自适应观测器、第二自适应观测器和自适应控制器;
所述第一自适应观测器,用于基于集群系统中目标跟随者的第一运动状态向量,预测目标领导者的运动状态向量;所述第一运动状态向量包括所述目标跟随者的位置状态、速度状态和加速度状态;所述运动状态向量为所述目标领导者的位置状态、速度状态和加速度状态;
所述第二自适应观测器,用于基于所述集群系统中目标跟随者的第二运动状态向量,预测所述目标领导者的指令信息;所述第二运动状态向量包括所述目标跟随者的目标救援地点、当前速度、所述目标跟随者与相邻跟随者的相对速度以及所述目标跟随者与目标领导者的距离;
所述自适应控制器,包括输出约束控制协议模型,用于根据所述目标领导者的运动状态向量和指令信息,基于鲁棒预定义输出约束,对所述集群系统中的各跟随者进行约束控制。
可选的,所述第一自适应观测器,具体如下:
Figure SMS_1
Figure SMS_2
其中,
Figure SMS_7
,/>
Figure SMS_3
,/>
Figure SMS_10
为第i个跟随者在t时刻的第一运动状态向量;/>
Figure SMS_6
,/>
Figure SMS_8
分别为正参数,/>
Figure SMS_11
为第j个状态变化量在第i个跟随者处的估计值,/>
Figure SMS_17
Figure SMS_13
,/>
Figure SMS_15
为估计矩阵,/>
Figure SMS_5
为第i个跟随者对第M个领导者状态的估计值,a为与状态向量维数相等的矩阵,/>
Figure SMS_9
Figure SMS_12
Figure SMS_16
,/>
Figure SMS_14
Figure SMS_18
为第j个领导者对自身状态的估计值,/>
Figure SMS_4
表示第i个跟随者对第j个领导者状态的估值与第j个领导者对自身状态的估值之间的差值。
可选的,所述第二自适应观测器,具体如下:
Figure SMS_19
Figure SMS_20
其中,
Figure SMS_22
,/>
Figure SMS_25
为跟随者i在时间/>
Figure SMS_27
时对于/>
Figure SMS_23
的估算输出矩阵;/>
Figure SMS_24
,/>
Figure SMS_28
是正实数,为跟随者i对于领导者j的观测器增益,/>
Figure SMS_29
为领导者j在时间t的输出,
Figure SMS_21
和/>
Figure SMS_26
分别为跟随者和领导者的个数。
可选的,所述自适应控制器,具体如下:
Figure SMS_30
其中,ui(t)为第i个跟随者的控制输入,xi(t)表示第i个跟随者的状态向量,Xij(t)表示第i个跟随者对第j个领导者状态的估计误差,Q1i和Qij(t)为可调参数矩阵,
Figure SMS_31
为第i个跟随者与第j个领导者之间的连接权重;/>
Figure SMS_32
为第i个跟随者的状态反馈增益函数;
Figure SMS_33
是第i个来自跟随者的未知参数估值。
可选的,还包括:
跟随者动力模块,用于获取跟随者的运动状态信息。
可选的,所述跟随者动力模型,具体如下:
Figure SMS_34
yi(t)=Cixi(t);
其中,
Figure SMS_35
分别为跟随者/>
Figure SMS_39
的状态向量、输入向量和输出向量,/>
Figure SMS_40
,/>
Figure SMS_37
,/>
Figure SMS_38
分别为/>
Figure SMS_41
的常数矩阵;
Figure SMS_42
为基有界函数向量,/>
Figure SMS_36
为未知常数矩阵。
可选的,还包括:
领导者动力模块,用于获取目标领导者的状态信息。
可选的,所述领导者动力模型,具体如下:
Figure SMS_43
zj(t)=Fjsj(t);
其中,
Figure SMS_44
和/>
Figure SMS_45
分别为领导者/>
Figure SMS_46
的状态向量和输出向量,
Figure SMS_47
为目标领导者的系统矩阵,/>
Figure SMS_48
为目标领导者的输出矩阵。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种用于集群系统约束控制的自适应装置,包括:第一自适应观测器、第二自适应观测器和自适应控制器;第一自适应观测器,用于基于集群系统中目标跟随者的第一运动状态向量,预测目标领导者的运动状态向量;第一运动状态向量包括目标跟随者的位置状态、速度状态和加速度状态;运动状态向量为目标领导者的位置状态、速度状态和加速度状态;第二自适应观测器,用于基于集群系统中目标跟随者的第二运动状态向量,预测目标领导者的指令信息;第二运动状态向量包括目标跟随者的目标救援地点、当前速度、目标跟随者与相邻跟随者的相对速度以及目标跟随者与目标领导者的距离;自适应控制器,包括输出约束控制协议模型,用于根据目标领导者的运动状态向量和指令信息,基于鲁棒预定义输出约束,对集群系统中的各跟随者进行约束控制。本发明通过第一自适应观测器、第二自适应观测器,可以预测集群系统中领导者的状态信息和指令信息,并可以通过自适应控制器控制集群系统中跟随目标领导者的跟随者的运动,使其按照预设的约束条件进行移动,从而实现集群系统的约束控制。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的集群系统拓扑结构图;
图2为预定义输出约束控制观测估计误差
Figure SMS_49
曲线图;
图3为自适应观测器控制协议的稳定输出约束误差
Figure SMS_50
的变化曲线图;
图4为预定义输出约束控制状态估计误差
Figure SMS_51
变化曲线图;
图5为估计误差
Figure SMS_52
在50秒内的变化曲线图;
图6为估计误差
Figure SMS_53
在50秒内的变化曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种用于集群系统约束控制的自适应装置,可实现包括无人车和空中无人机的集群系统的约束控制。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明提供的一种用于集群系统约束控制的自适应装置,包括:第一自适应观测器、第二自适应观测器和自适应控制器。
所述第一自适应观测器,用于基于集群系统中目标跟随者的第一运动状态向量,预测目标领导者的运动状态向量;所述第一运动状态向量包括所述目标跟随者的位置状态、速度状态和加速度状态;所述运动状态向量为所述目标领导者的位置状态、速度状态和加速度状态。
所述第二自适应观测器,用于基于所述集群系统中目标跟随者的第二运动状态向量,预测所述目标领导者的指令信息;所述第二运动状态向量包括所述目标跟随者的目标救援地点、当前速度、所述目标跟随者与相邻跟随者的相对速度以及所述目标跟随者与目标领导者的距离。
所述自适应控制器,包括输出约束控制协议模型,用于根据所述目标领导者的运动状态向量和指令信息,基于鲁棒预定义输出约束,对所述集群系统中的各跟随者进行约束控制。
具体的,自适应观测装置的作用是确保每个跟随者都能够收敛于领导者,从而实现集群系统的约束控制。
举例来说,假设有一个无人车和两个无人机组成的集群系统,其中无人车为领导者,两个无人机为跟随者。在执行任务时,无人车需要向两个无人机发送指令,让它们跟随无人车进行协同工作。由于无人车和无人机的动力学特性不同,因此它们的运动状态也不同,这就导致了集群系统的约束控制问题。为了解决这个问题,可以使用本发明中提出的自适应观测器来实现集群系统的约束控制。具体来说,自适应观测装置可以根据无人车和无人机的状态信息和指令信息,对两个无人机进行约束控制,确保它们能够跟随无人车进行协同工作。
以火灾救援为例,多个领导者在发现了一个位置的火情时,需要一些跟随者跟随去救援。此时,可以使用本发明中提出的自适应观测装置来实现跟随者与领导者之间的约束控制,确保跟随者能够有效地协同工作,提高救援效率。
观测器的运作流程可以分为两个部分:第一部分是第一自适应观测器,用于预测集群系统中目标领导者的运动状态向量;第二部分是第二自适应观测器,用于预测集群系统中目标领导者的指令信息。
如图1所示,无人车1、2、3为领导者,以无人车1为例,在火灾救援场景中,假设有一个无人车1为领导者,多个无人机(无人机4-9中的一部分)为跟随者。无人车需要向多个无人机发送指令,让它们跟随无人车进行协同工作。在这个过程中,第一自适应观测器可以根据跟随者的状态信息,如位置状态、速度状态和加速度状态,来预测无人车的状态信息,如位置状态、速度状态和加速度状态。同时,跟随者之间也可以通过信息交互来获得相邻跟随者的状态信息,从而更准确地预测无人车的状态信息。例如,当第一自适应观测器观测到无人机4的位置变化较为平均,速度为匀速,加速度接近于零时,说明跟随者无人机4已经成功跟随领导者无人车1进行运动,且领导者无人车1的位置状态、速度状态和加速度状态与无人机4较为接近。
第二自适应观测器则用于预测无人车的指令信息,如跟随者的目标救援位置。跟随者的状态信息包括跟随者的目标救援地点、当前速度、所述跟随者与相邻跟随者的相对速度以及所述跟随者与领导者的距离。通过这些状态信息,第二自适应观测器可以预测无人车的指令信息,从而实现跟随者与领导者之间的约束控制。
在一些实施例中,所述自适应装置还包括领导者动力模块和跟随者动力模块,具体可以如下:
其中,领导者动力模块,包括领导者动力模型,用于获取目标领导者的状态信息;对于一般的异构非线性集群系统,领导者动力模块的领导者动力模型,具体可以如下:
Figure SMS_54
式中,
Figure SMS_55
和/>
Figure SMS_56
分别代表领导者/>
Figure SMS_57
的状态和输出向量,其中
Figure SMS_58
是有界的。/>
Figure SMS_59
表示系统矩阵,/>
Figure SMS_60
表示输出矩阵,对于任何跟随者/>
Figure SMS_61
都是未知的。
其中,所述自适应装置中的跟随者动力模块,包括跟随者动力模型,用于获取领导者的状态信息。对于一般的异构非线性集群系统,跟随者动力模块中的跟随者动力模型,具体可以如下:
Figure SMS_62
其中
Figure SMS_63
分别表示跟随者/>
Figure SMS_67
的状态、输入和输出向量,/>
Figure SMS_70
,/>
Figure SMS_65
,/>
Figure SMS_68
表示/>
Figure SMS_71
的常数矩阵。/>
Figure SMS_72
是可镇定的,/>
Figure SMS_64
是可检测的,/>
Figure SMS_66
是基有界函数向量,/>
Figure SMS_69
是未知常数矩阵。
此外,在完成领导者动力模型和跟随者动力模型之后,本发明还给出对于鲁棒预定义输出约束的定义,即如果存在多个预定义的非负常数
Figure SMS_73
,满足/>
Figure SMS_74
使得领导者动力模型和跟随者动力模型描述的异构非线性集群系统存在解,则认为实现了鲁棒的预定义输出约束控制,约束控制如下所示:
Figure SMS_75
其中,yi(t)∈RP,表示跟随者
Figure SMS_76
的输入向量,zj领导者/>
Figure SMS_77
的输出向量,M为跟随者的个数,/>
Figure SMS_78
为第i个跟随者与第j个领导者之间的连接权重
在一些实施例中,建立第一自适应观测器,具体可以如下:
根据目标节点的相邻节点信息,针对跟随者
Figure SMS_79
,构建如下所示的自适应观测器:
Figure SMS_80
式中,
Figure SMS_81
,/>
Figure SMS_82
,/>
Figure SMS_83
为第i个跟随者在t时刻的状态向量;/>
Figure SMS_84
,/>
Figure SMS_85
分别为正参数,/>
Figure SMS_86
为第j个状态变化量在第i个跟随者处的估计值。
自适应观测器中,
Figure SMS_87
具体可以如下表示:
Figure SMS_88
Figure SMS_89
式中,
Figure SMS_90
为估计矩阵,/>
Figure SMS_91
为第i个跟随者对第M个领导者状态的估计值,a为与状态向量维数相等的矩阵/>
Figure SMS_92
具体可以如下:
Figure SMS_93
Figure SMS_94
Figure SMS_95
,式中,/>
Figure SMS_96
,/>
Figure SMS_97
为第j个领导者对自身状态的估计值,/>
Figure SMS_98
表示第i个跟随者对第j个领导者状态的估值与第j个领导者对自身状态的估值之间的差值。
第一自适应观测器,可以如下:
Figure SMS_99
Figure SMS_100
式中,
Figure SMS_101
Figure SMS_102
Figure SMS_103
Figure SMS_104
Figure SMS_105
Figure SMS_106
,/>
Figure SMS_107
由于追随者之间的通信链路是双向的,即拓扑图是无向的,那么
Figure SMS_108
为正定矩阵,式中的/>
Figure SMS_109
Figure SMS_110
,/>
Figure SMS_111
可以得出
Figure SMS_112
,并且/>
Figure SMS_113
,那么,根据领导者动力模型和第一自适应观测器公式/>
Figure SMS_114
和/>
Figure SMS_115
可以改写为:
Figure SMS_116
Figure SMS_117
依据上述规定,对于第
Figure SMS_119
个跟随者,任意/>
Figure SMS_121
,/>
Figure SMS_125
,自适应观测器/>
Figure SMS_118
收敛于不同领导者/>
Figure SMS_122
的整个状态,即/>
Figure SMS_124
。此外,/>
Figure SMS_126
存在且对于所有/>
Figure SMS_120
都是有界的,并且满足/>
Figure SMS_123
因此,当输入到系统的信号
Figure SMS_127
为PE信号时,则可以得到/>
Figure SMS_128
,即
Figure SMS_129
,实现了领导者状态的估计。
例如,在建立第一自适应观测器时,如图1所示的集群系统拓扑结构图,邻居节点的相对信息指的是跟随者节点4与其邻居节点5之间的相对信息,这些相对信息可以包括邻居节点j的状态、速度、位置等信息,以及跟随者节点4与邻居节点5之间的相对位置、速度等信息。跟随者节点通过观测邻居节点的状态、速度、位置等信息,来构建自适应观测器来估计领导者的状态。具体来说,第一自适应观测器是根据邻居节点的相对信息来构建的,这些相对信息包括邻居节点的状态、速度、位置等信息,以及跟随者节点与邻居节点之间的相对位置、速度等信息。假设在火灾救援的场景中,如果我们想估计无人机(领导者)1的状态,我们可以选择与无人机1相连的跟随者4、5、6中的一个作为观测器,假设我们选择跟随者4。跟随者4可以观测到自己与无人机1之间的相对位置和速度,同时也可以通过与邻居节点之间的信息交互,获得与跟随者5、6相连的无人机的状态信息。然后,通过第一自适应观测器来估计无人机1的状态。具体来说,第一自适应观测器,它可以根据跟随者4的观测结果和与邻居节点之间的信息交互来自适应地估计无人机(领导者)1的状态。
在一些实施例中,建立第二自适应观测器,具体可以如下:
第二自适应观测器为观测非同一不确定性领导者输出的自适应观测器。鉴于多个非同一不确定性领导者的输出对任何追随者都是未知的,并且领导者输出矩阵的信息是解决后续输出调节方程的关键,本发明提出了第二自适应观测器,基于第一自适应观测器及其与邻近从属者的交互,来估算目标领导者的输出,这些交互信息包括从属者节点的状态、输出、系统或输出矩阵以及不确定参数等信息。第二自适应观测器具体如下:
Figure SMS_130
Figure SMS_131
其中,
Figure SMS_132
,/>
Figure SMS_133
表示第/>
Figure SMS_134
个从属者在时间/>
Figure SMS_135
时对于/>
Figure SMS_136
的估算输出矩阵;/>
Figure SMS_137
的形式如下:
Figure SMS_138
其中
Figure SMS_141
是正实数,表示第/>
Figure SMS_143
个跟随者对于第/>
Figure SMS_145
个领导者的观测器增益,/>
Figure SMS_140
表示第/>
Figure SMS_142
个领导者在时间/>
Figure SMS_144
的输出,/>
Figure SMS_146
和/>
Figure SMS_139
分别为跟随者和领导者的个数。
对于第
Figure SMS_147
个跟随者,在第二自适应观测器下,估计误差趋近于零,即
Figure SMS_148
,同时输出矩阵观测器/>
Figure SMS_149
可以估计第/>
Figure SMS_150
个领导者的输出矩阵,即/>
Figure SMS_151
,实现了领导者输出信息的估计。
此外,本申请在应用构建的第一自适应观测器和第二自适应观测器研究异构非线性集群系统的鲁棒预定义输出约束问题时。解决此问题的关键步骤是得到系统输出调节方程的解,并构建相应的鲁棒预定义输出约束控制协议。但是,由于矩阵
Figure SMS_152
和/>
Figure SMS_153
不完全已知,因此在构建约束控制协议之前,需要重新开发一种新的方法来解决输出调节问题。方法如下:
定义对于跟随者
Figure SMS_154
和领导者/>
Figure SMS_155
,总是存在解/>
Figure SMS_156
满足以下调节器方程:
Figure SMS_157
当且仅当对于所有
Figure SMS_158
,其中/>
Figure SMS_159
表示/>
Figure SMS_160
的谱,满足
Figure SMS_161
时,调节方程才有解,但是/>
Figure SMS_162
都是未知的,这意味着不能直接求解调节方程的解。虽然目前存在一种迭代自适应方法来解决的问题,但这种方法并没有考虑到状态和输出矩阵/>
Figure SMS_163
同时都是完全未知的情况。因此,本发明在此基础上又开发了一种新的自适应方法来处理这种具有未知状态和输出矩阵的分布式控制系统的输出调节的问题。
针对任意初始值
Figure SMS_164
,本发明提出了一个自适应方法,该方法通过求解以下方程来实现输出调节:
Figure SMS_165
其中,
Figure SMS_166
,/>
Figure SMS_167
和/>
Figure SMS_168
均为已知量,/>
Figure SMS_169
为未知向量,表示系统状态和控制输入。本发明证明输出调节存在唯一有界解/>
Figure SMS_170
,并且该解趋近于/>
Figure SMS_171
。这种自适应方法能够解决状态和输出矩阵均为未知的情况,具有实际应用价值。
在一些实施例中,在解决系统输出调节方程解的逼近问题后,开始设计异构不确定非线性集群系统的自适应输出约束控制器(自适应控制器)。根据本发明,为了确保由领导者动力模型和跟随者动力模型中描述的异构不确定非线性集群系统实现鲁棒预定义输出约束,提出了以下自适应鲁棒预定义输出约束控制协议,该协议基于构建的第一自适应观测器和第二自适应观测器对
Figure SMS_172
进行控制。
所述自适应控制器中的输出约束控制协议模型,具体可以如下:
Figure SMS_173
式中,
Figure SMS_176
,/>
Figure SMS_178
Figure SMS_182
,/>
Figure SMS_175
Figure SMS_177
,ui(t)为第i个跟随者的控制输入,xi(t)表示第i个跟随者的状态向量,Xij(t)表示第i个跟随者对第j个领导者状态的估计误差,Q1i和Qij(t)为可调参数矩阵,/>
Figure SMS_181
为第i个跟随者与第j个领导者之间的连接权重;/>
Figure SMS_183
为第i个跟随者的状态反馈增益函数;/>
Figure SMS_174
是第i个来自跟随者的未知参数估值,/>
Figure SMS_179
为第i个跟随者对系统参数的平均估计值;/>
Figure SMS_180
第i个跟随者的自适应增益;/>
Figure SMS_184
第i个跟随者的平均自适应增益。
式中,学习率
Figure SMS_185
和修改增益/>
Figure SMS_186
分别表示正常数,/>
Figure SMS_187
构造如下:
Figure SMS_188
在该控制协议下,系统能够实现鲁棒预定义输出约束。
Figure SMS_189
Figure SMS_190
Figure SMS_191
Figure SMS_192
。因此,根据领导者动力模型、跟随者动力模型和输出约束控制协议模型可以推导出/>
Figure SMS_193
Figure SMS_194
Figure SMS_195
其中
Figure SMS_196
由于
Figure SMS_197
,且/>
Figure SMS_198
,因此可得:
Figure SMS_199
其中
Figure SMS_200
,/>
Figure SMS_201
仿真算例:
本发明考虑一个由三个领导者和六个跟随者组成的异构非线性集群系统。集群系统的拓扑结构如图1所示。跟随者和领导者的动态分别根据领导者动力模型和跟随者动力模型确定,其中,
Figure SMS_202
,/>
Figure SMS_206
Figure SMS_209
,/>
Figure SMS_205
,/>
Figure SMS_207
,/>
Figure SMS_210
,/>
Figure SMS_211
Figure SMS_203
,/>
Figure SMS_208
,/>
Figure SMS_212
Figure SMS_213
,其中,/>
Figure SMS_204
是跟随者的集合。
非线性项
Figure SMS_214
可表示为/>
Figure SMS_215
Figure SMS_216
Figure SMS_217
Figure SMS_218
Figure SMS_219
Figure SMS_220
Figure SMS_223
,/>
Figure SMS_226
,选择/>
Figure SMS_229
,其中/>
Figure SMS_221
为在区间/>
Figure SMS_224
内的一个随机数。在第一自适应观测器和自适应控制器中选择/>
Figure SMS_227
。借助MAtLAB,可将增益矩阵
Figure SMS_230
设计成/>
Figure SMS_222
Figure SMS_225
Figure SMS_228
在考虑到设计的自适应控制器的情况下,针对所考虑的集群系统,图2、4、5和6显示了估计误差
Figure SMS_231
和/>
Figure SMS_232
的变化过程。同时,图3展示了自适应控制器的自适应观测器控制协议的稳定输出约束误差
Figure SMS_233
的变化过程。
此外,如图1所示,为了预测领导者1的位置和速度,需要知道至少一个与领导者1相连的跟随者的状态,然后通过第一自适应观测器来估计领导者1的状态。如果第一观测器的输入端输入的跟随者状态信息为跟随者8的状态信息,那么需要对跟随者5的状态进行估计,然后才能估计跟随者4的状态,最终才能估计领导者1的状态。
综上所述,本发明具有以下优点:
本发明提供的集群系统约束控制的自适应装置,采用第一自适应观测器和第二自适应观测器来预测集群系统中领导者的状态信息和指令信息。此外,还通过自适应装置中的自适应控制器来控制集群系统中的跟随者,使其按照预设的约束条件进行移动。通过这种方式,可以实现集群系统的约束控制。具体来说,第一自适应观测器能够对领导者的运动状态进行实时观测和预测,包括其位置、速度和加速度等信息。第二自适应观测器则能够对领导者的指令信息进行实时观测和预测,包括其目标位置和速度等信息。在预测了领导者的状态信息和指令信息后,自适应控制器能够生成相应的控制指令,将其传递给跟随者,以实现集群系统的约束控制。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (8)

1.一种用于集群系统约束控制的自适应装置,其特征在于,包括:第一自适应观测器、第二自适应观测器和自适应控制器;
所述第一自适应观测器,用于基于集群系统中目标跟随者的第一运动状态向量,预测目标领导者的运动状态向量;所述第一运动状态向量包括所述目标跟随者的位置状态、速度状态和加速度状态;所述运动状态向量为所述目标领导者的位置状态、速度状态和加速度状态;
所述第二自适应观测器,用于基于所述集群系统中目标跟随者的第二运动状态向量,预测所述目标领导者的指令信息;所述第二运动状态向量包括所述目标跟随者的目标救援地点、当前速度、所述目标跟随者与相邻跟随者的相对速度以及所述目标跟随者与目标领导者的距离;
所述自适应控制器,包括输出约束控制协议模型,用于根据所述目标领导者的运动状态向量和指令信息,基于鲁棒预定义输出约束,对所述集群系统中的各跟随者进行约束控制。
2.根据权利要求1所述的自适应装置,其特征在于,所述第一自适应观测器,具体如下:
Figure QLYQS_1
Figure QLYQS_2
其中,
Figure QLYQS_9
,/>
Figure QLYQS_5
,/>
Figure QLYQS_8
为第i个跟随者在t时刻的第一运动状态向量;/>
Figure QLYQS_7
,/>
Figure QLYQS_13
分别为正参数,/>
Figure QLYQS_12
为第j个状态变化量在第i个跟随者处的估计值,/>
Figure QLYQS_14
Figure QLYQS_11
,/>
Figure QLYQS_17
为估计矩阵,/>
Figure QLYQS_3
为第i个跟随者对第M个领导者状态的估计值,a为与状态向量维数相等的矩阵,/>
Figure QLYQS_10
Figure QLYQS_6
Figure QLYQS_15
,/>
Figure QLYQS_16
Figure QLYQS_18
为第j个领导者对自身状态的估计值,/>
Figure QLYQS_4
表示第i个跟随者对第j个领导者状态的估值与第j个领导者对自身状态的估值之间的差值。
3.根据权利要求1所述的自适应装置,其特征在于,所述第二自适应观测器,具体如下:
Figure QLYQS_19
Figure QLYQS_20
其中,
Figure QLYQS_22
,/>
Figure QLYQS_23
为跟随者i在时间/>
Figure QLYQS_24
时对于/>
Figure QLYQS_25
的估算输出矩阵;/>
Figure QLYQS_27
,/>
Figure QLYQS_28
是正实数,为跟随者i对于领导者j的观测器增益,/>
Figure QLYQS_29
为领导者j在时间t的输出,/>
Figure QLYQS_21
Figure QLYQS_26
分别为跟随者和领导者的个数。
4.根据权利要求1所述的自适应装置,其特征在于,所述自适应控制器,具体如下:
Figure QLYQS_30
其中,ui(t)为第i个跟随者的控制输入,xi(t)表示第i个跟随者的状态向量,Xij(t)表示第i个跟随者对第j个领导者状态的估计误差,Q1i和Qij(t)为可调参数矩阵,
Figure QLYQS_31
为第i个跟随者与第j个领导者之间的连接权重;/>
Figure QLYQS_32
为第i个跟随者的状态反馈增益函数;/>
Figure QLYQS_33
是第i个来自跟随者的未知参数估值。
5.根据权利要求1所述的自适应装置,其特征在于,还包括:
跟随者动力模块,用于获取跟随者的运动状态信息。
6.根据权利要求5所述的自适应装置,其特征在于,所述跟随者动力模型,具体如下:
Figure QLYQS_34
yi(t)=Cixi(t);
其中,
Figure QLYQS_36
分别为跟随者/>
Figure QLYQS_38
的状态向量、输入向量和输出向量,/>
Figure QLYQS_40
,/>
Figure QLYQS_37
,/>
Figure QLYQS_39
分别为/>
Figure QLYQS_41
的常数矩阵;
Figure QLYQS_42
为基有界函数向量,/>
Figure QLYQS_35
为未知常数矩阵。
7.根据权利要求1所述的自适应装置,其特征在于,还包括:
领导者动力模块,用于获取目标领导者的状态信息。
8.根据权利要求7所述的自适应装置,其特征在于,所述领导者动力模型,具体如下:
Figure QLYQS_43
zj(t)=Fjsj(t);
其中,
Figure QLYQS_44
和/>
Figure QLYQS_45
分别为领导者/>
Figure QLYQS_46
的状态向量和输出向量,
Figure QLYQS_47
为目标领导者的系统矩阵,/>
Figure QLYQS_48
为目标领导者的输出矩阵。
CN202310678172.3A 2023-06-09 2023-06-09 一种用于集群系统约束控制的自适应装置 Active CN116414037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310678172.3A CN116414037B (zh) 2023-06-09 2023-06-09 一种用于集群系统约束控制的自适应装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310678172.3A CN116414037B (zh) 2023-06-09 2023-06-09 一种用于集群系统约束控制的自适应装置

Publications (2)

Publication Number Publication Date
CN116414037A true CN116414037A (zh) 2023-07-11
CN116414037B CN116414037B (zh) 2023-08-18

Family

ID=87054633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310678172.3A Active CN116414037B (zh) 2023-06-09 2023-06-09 一种用于集群系统约束控制的自适应装置

Country Status (1)

Country Link
CN (1) CN116414037B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275435A (zh) * 2019-05-24 2019-09-24 广东工业大学 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法
CN112596546A (zh) * 2020-12-21 2021-04-02 中国人民解放军空军预警学院雷达士官学校 一种基于长机行为预测的僚机编队控制系统及方法
CN113900380A (zh) * 2021-11-17 2022-01-07 北京航空航天大学 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
CN114935943A (zh) * 2022-06-09 2022-08-23 北京航空航天大学 一种无人机与无人车集群编队跟踪控制方法及系统
CN114995133A (zh) * 2022-05-26 2022-09-02 武汉理工大学 基于混杂逻辑动态模型的船舶纵向列队混杂预测控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110275435A (zh) * 2019-05-24 2019-09-24 广东工业大学 基于观测器的多单臂机械手输出一致自适应命令滤波控制方法
CN112596546A (zh) * 2020-12-21 2021-04-02 中国人民解放军空军预警学院雷达士官学校 一种基于长机行为预测的僚机编队控制系统及方法
CN113900380A (zh) * 2021-11-17 2022-01-07 北京航空航天大学 一种异构集群系统鲁棒输出编队跟踪控制方法及系统
CN114995133A (zh) * 2022-05-26 2022-09-02 武汉理工大学 基于混杂逻辑动态模型的船舶纵向列队混杂预测控制方法
CN114935943A (zh) * 2022-06-09 2022-08-23 北京航空航天大学 一种无人机与无人车集群编队跟踪控制方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WANG, Q ET AL.: "Fully Distributed Adaptive Formation Tracking for Directed Heterogeneous Multi-Agent Systems With Unknown Input", IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS II-EXPRESS BRIEFS, vol. 70, no. 2, pages 700 - 704, XP011933974, DOI: 10.1109/TCSII.2022.3212211 *
宋敏;魏瑞轩;沈东;胡明朗;: "基于非线性动态逆的无人机编队协同控制", 控制与决策, no. 03, pages 448 - 452 *

Also Published As

Publication number Publication date
CN116414037B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
Franco et al. Cooperative constrained control of distributed agents with nonlinear dynamics and delayed information exchange: A stabilizing receding-horizon approach
CN114020042A (zh) 一种异构无人集群编队合围跟踪控制方法及系统
Wang et al. Adaptive dynamic surface control for cooperative path following of marine surface vehicles with input saturation
Hong et al. Energy-efficient online path planning of multiple drones using reinforcement learning
Kingravi et al. Reproducing kernel Hilbert space approach for the online update of radial bases in neuro-adaptive control
CN114237041B (zh) 一种基于预设性能的空-地协同固定时间容错控制方法
Yang et al. Event-triggered finite-time formation control for multiple unmanned aerial vehicles with input saturation
Yan et al. Collision-avoiding flocking with multiple fixed-wing UAVs in obstacle-cluttered environments: a task-specific curriculum-based MADRL approach
CN112631335A (zh) 一种基于事件触发的多四旋翼无人机固定事件编队方法
CN112859915B (zh) 基于饱和阈值事件触发的高层消防无人机编队控制方法及系统
Liu et al. Distributed adaptive fuzzy control approach for prescribed-time containment of uncertain nonlinear multi-agent systems with unknown hysteresis
CN111983923B (zh) 一种受限多智能体系统编队控制方法、系统及设备
KR20230119023A (ko) 단기 기억 장치가 있는 어텐션 신경망
Hu et al. VGAI: End-to-end learning of vision-based decentralized controllers for robot swarms
Gao et al. Cooperative optimal output regulation of multi-agent systems using adaptive dynamic programming
KR20220154785A (ko) 다중 태스크 강화 학습에서 메타-그래디언트를 사용한 액션 선택을 위한 학습 옵션
Yan et al. Limited communication consensus control of leader-following multi-UUVs in a swarm system under multi-independent switching topologies and time delay
Conde et al. Time-varying formation controllers for unmanned aerial vehicles using deep reinforcement learning
Cui et al. Simplified optimized finite-time containment control for a class of multi-agent systems with actuator faults
CN116466588A (zh) 多智能体系统的有限时间时变编队跟踪控制方法及系统
CN116414037B (zh) 一种用于集群系统约束控制的自适应装置
Guo et al. Decoupled sliding mode control of underactuated nonlinear systems using a fuzzy brain emotional cerebellar model control system
CN116339321A (zh) 一种基于5g通信的全局信息驱动的分布式多机器人强化学习编队合围方法
Ma et al. Mixed H _ ∞ H∞ and Passive Depth Control for Autonomous Underwater Vehicles with Fuzzy Memorized Sampled-Data Controller
Ma et al. Distributed formation of autonomous underwater vehicles with unreliable switching topologies and transmission delays

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant