CN115993845B - 一种集群智能系统协同运动规划与编队控制方法 - Google Patents

一种集群智能系统协同运动规划与编队控制方法 Download PDF

Info

Publication number
CN115993845B
CN115993845B CN202310287976.0A CN202310287976A CN115993845B CN 115993845 B CN115993845 B CN 115993845B CN 202310287976 A CN202310287976 A CN 202310287976A CN 115993845 B CN115993845 B CN 115993845B
Authority
CN
China
Prior art keywords
time
intelligent
predicted
agents
formation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310287976.0A
Other languages
English (en)
Other versions
CN115993845A (zh
Inventor
赵宇
杨澜
刘永芳
周媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Shenzhen Institute of Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Shenzhen Institute of Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University, Shenzhen Institute of Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202310287976.0A priority Critical patent/CN115993845B/zh
Publication of CN115993845A publication Critical patent/CN115993845A/zh
Application granted granted Critical
Publication of CN115993845B publication Critical patent/CN115993845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种集群智能系统协同运动规划与编队控制方法,涉及集群智能系统技术领域。该方法包括获取所有智能体的初始状态信息并设置编队初始条件;根据所有智能体的目标编队构型和通信拓扑确定智能体下一时刻的期望位置;根据集群智能系统的动力学方程,建立智能体位置预测模型;根据智能体下一时刻的期望位置,建立编队控制目标函数;以智能体运动的加速度及运动空间区间作为约束条件对编队控制目标函数进行优化,构建当前时刻的预测轨迹;采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解,确定无碰撞轨迹并控制所有智能体进行编队。本发明实现了在保证避碰条件下的运动轨迹规划,同时按照规划的路径完成编队任务。

Description

一种集群智能系统协同运动规划与编队控制方法
技术领域
本发明涉及集群智能系统技术领域,具体涉及一种集群智能系统协同运动规划与编队控制方法。
背景技术
近年来,集群智能系统出现在许多工程领域,这些系统的控制问题越来越受到人们的重视。协同控制的目标是使多个自治智能体通过局部交互进行有效地协同工作,实现集体群体行为。在执行大规模的复杂任务时,协同移动的集群智能系统具有较高的工作效能和较强的容错能力。
运动规划与控制是集群智能系统协同控制研究中的一个重要分支。由于其他智能体正在规划并同时执行其轨迹,这就要求运动规划算法要具有迅速响应复杂环境变化的能力,在避免与其他智能体发生碰撞的同时完成编队控制任务。因此,如何实现在共享环境中执行任务并生成无碰撞轨迹是本领域值得研究的问题。
发明内容
针对现有技术中的上述不足,本发明提供了一种集群智能系统协同运动规划与编队控制方法,以实现集群智能系统在规定的区域内规划出安全无碰撞的路径并实现编队控制任务。
为了达到上述发明目的,本发明采用的技术方案为:
一种集群智能系统协同运动规划与编队控制方法,包括以下步骤:
S1、获取所有智能体的初始状态信息并设置编队初始条件;
S2、根据所有智能体的目标编队构型和通信拓扑确定智能体下一时刻的期望位置;
S3、根据集群智能系统的动力学方程,建立智能体位置预测模型;
S4、根据智能体下一时刻的期望位置和智能体位置预测模型,建立编队控制目标函数;
S5、以智能体运动的加速度及运动空间区间作为约束条件对编队控制目标函数进行优化,构建当前时刻的预测轨迹;
S6、采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解,确定无碰撞轨迹并控制所有智能体进行编队。
可选地,步骤S1中:
初始状态信息具体包括初始位置信息和初始速度信息;
编队初始条件具体包括时间序列、智能体间的安全距离、时间步长参数、预测时间步及预测视界长度。
可选地,步骤S2中智能体下一时刻的期望位置表示为:
Figure SMS_1
其中,
Figure SMS_2
和/>
Figure SMS_3
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure SMS_4
为智能体jt z时刻的位置信息,h ih j分别为智能体i和智能体j的期望编队构型常数,/>
Figure SMS_5
为智能体i的相邻智能体的集合,/>
Figure SMS_6
为智能体i的相邻智能体的个数。
可选地,步骤S3中智能体位置预测模型表示为:
Figure SMS_7
其中,
Figure SMS_9
为智能体it z时刻的预测位置序列,/>
Figure SMS_12
,/>
Figure SMS_15
为智能体i到达t z时刻的第k t预测时间步的初始状态,/>
Figure SMS_10
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure SMS_14
Figure SMS_17
,/>
Figure SMS_19
,/>
Figure SMS_8
Figure SMS_13
,/>
Figure SMS_16
和/>
Figure SMS_18
分别为单位矩阵和零矩阵,/>
Figure SMS_11
为时间步长参数,K为预测视界长度。
可选地,步骤S4中编队控制目标函数具体为:
Figure SMS_20
Figure SMS_21
Figure SMS_22
Figure SMS_23
其中,
Figure SMS_25
为编队控制目标函数,/>
Figure SMS_28
为智能体it z时刻上的预测输入序列,/>
Figure SMS_32
为智能体it z时刻的轨迹误差,/>
Figure SMS_27
为智能体it z时刻的控制量,/>
Figure SMS_30
为智能体it z时刻的输入变化量,/>
Figure SMS_34
和/>
Figure SMS_37
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure SMS_24
为正定块对角矩阵,T为矩阵转置符号,/>
Figure SMS_31
为控制量的惩罚权重系数,
Figure SMS_35
,/>
Figure SMS_38
和/>
Figure SMS_26
分别为单位矩阵和零矩阵,
Figure SMS_29
,/>
Figure SMS_33
为智能体i到达t z时刻的第k t-1预测时间步应用的实际输入信息,/>
Figure SMS_36
为零矩阵。
可选地,步骤S5中以智能体运动的加速度及运动空间区间作为约束条件具体为:
Figure SMS_39
其中,
Figure SMS_41
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure SMS_47
Figure SMS_51
分别为最小输入序列和最大输入序列,/>
Figure SMS_42
,/>
Figure SMS_46
分别为运动空间的最小位置序列和最大位置序列,/>
Figure SMS_50
Figure SMS_54
,/>
Figure SMS_40
,/>
Figure SMS_44
Figure SMS_48
,/>
Figure SMS_52
和/>
Figure SMS_43
分别为单位矩阵和零矩阵,/>
Figure SMS_45
为时间步长参数,K为预测视界长度,/>
Figure SMS_49
,/>
Figure SMS_53
为智能体i到达t z时刻的第k t预测时间步的初始状态。
可选地,步骤S6中带有软约束的按需避碰策略具体为:
当智能体预测在第
Figure SMS_55
预测时间步发生碰撞时,在优化问题中引入碰撞约束及松弛变量,表示为:
Figure SMS_56
/>
其中,
Figure SMS_58
,/>
Figure SMS_63
为对角矩阵,
Figure SMS_67
和/>
Figure SMS_59
分别为智能体i和智能体j利用第/>
Figure SMS_62
预测时间步的可用信息得到的第/>
Figure SMS_66
预测时间步的预测位置信息,/>
Figure SMS_70
为智能体i利用第
Figure SMS_57
预测时间步的可用信息得到的第/>
Figure SMS_61
预测时间步的预测位置信息,n为模拟边界的阶数,/>
Figure SMS_65
表示在第/>
Figure SMS_69
预测时间步上检测到发生碰撞的预测视界,
Figure SMS_60
,/>
Figure SMS_64
为2范数,/>
Figure SMS_68
为智能体间的安全距离,/>
Figure SMS_71
为决策变量。
可选地,步骤S6中采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解具体为:
Figure SMS_72
其中,
Figure SMS_107
为代价函数,
Figure SMS_110
,/>
Figure SMS_113
为编队控制目标函数,
Figure SMS_116
,/>
Figure SMS_119
为所有决策变量/>
Figure SMS_121
的堆叠向量,
Figure SMS_123
,/>
Figure SMS_74
为标量优化参数,
Figure SMS_80
分别为零矩阵、全一矩阵和单位矩阵,T为矩阵转置符号,/>
Figure SMS_84
Figure SMS_88
分别为智能体i在初始时刻t 0的位置信息和智能体i在预测视界为1的位置信息预测值,/>
Figure SMS_92
为智能体i设定的初始位置,/>
Figure SMS_96
和/>
Figure SMS_100
分别为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_104
预测时间步的状态预测值和加速度预测值,
Figure SMS_93
表示在第/>
Figure SMS_97
预测时间步上的预测视界,/>
Figure SMS_101
为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_105
预测时间步的状态预测值,
Figure SMS_108
Figure SMS_111
,/>
Figure SMS_114
,/>
Figure SMS_117
Figure SMS_106
,/>
Figure SMS_109
和/>
Figure SMS_112
分别为单位矩阵和零矩阵,/>
Figure SMS_115
为时间步长参数,K为预测视界长度,/>
Figure SMS_118
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure SMS_120
,/>
Figure SMS_122
分别为最小输入序列和最大输入序列,/>
Figure SMS_124
,/>
Figure SMS_76
分别为运动空间的最小位置序列和最大位置序列,/>
Figure SMS_78
,/>
Figure SMS_82
为在k t时刻的初始状态,k t为预测时间步,
Figure SMS_86
Figure SMS_90
,/>
Figure SMS_94
,/>
Figure SMS_98
为智能体i到达t z时刻的第k t预测时间步的初始状态,/>
Figure SMS_102
为对角矩阵,n为模拟边界的阶数,
Figure SMS_73
和/>
Figure SMS_79
分别为智能体i和智能体j利用第/>
Figure SMS_83
预测时间步的可用信息得到的第/>
Figure SMS_87
预测时间步的预测位置信息,
Figure SMS_91
,/>
Figure SMS_95
为2范数,/>
Figure SMS_99
为智能体间的安全距离,/>
Figure SMS_103
为决策变量,/>
Figure SMS_75
和/>
Figure SMS_77
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure SMS_81
为智能体jt z时刻的位置信息,h ih j分别为智能体i和智能体j的期望编队构型常数,/>
Figure SMS_85
为智能体i的相邻智能体的集合,/>
Figure SMS_89
为智能体i的相邻智能体的个数。
本发明具有以下有益效果:
本发明首先获取所有智能体的初始状态信息并设置编队初始条件;然后根据所有智能体的目标编队构型和通信拓扑确定智能体下一时刻的期望位置;再根据集群智能系统的动力学方程,建立智能体位置预测模型;从而根据智能体下一时刻的期望位置,建立编队控制目标函数;并以智能体运动的加速度及运动空间区间作为约束条件对编队控制目标函数进行优化,构建当前时刻的预测轨迹;最后采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解,确定无碰撞轨迹并控制所有智能体进行编队。本发明实现了集群智能系统在保证避碰条件下的运动轨迹规划,同时按照规划的路径完成编队任务。
附图说明
图1所示为本发明实施例提供的一种集群智能系统协同运动规划与编队控制方法的流程示意图;
图2所示为本发明实施例中6架无人机的通信拓扑的示意图;
图3所示为本发明实施例中无人机集群系统位置随时间变化的示意图;
图4所示为本发明实施例中无人机集群系统编队的移动轨迹的示意图;
图5所示为本发明实施例中无人机集群系统中无人机1与其他无人机间的相对距离的示意图;
图6所示为本发明实施例中无人机集群系统编队一致性误差的示意图;
图7所示为本发明实施例中无人机集群系统加速度变化的示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,本发明实施例提供的一种集群智能系统协同运动规划与编队控制方法,包括以下步骤S1至S6:
S1、获取所有智能体的初始状态信息并设置编队初始条件;
在本发明的一个可选实施例中,本实施例针对的集群智能系统为多个可移动的线性动力学的智能体组成的系统,首先需要获取所有智能体的初始状态信息并设置编队初始条件,其中初始状态信息具体包括初始位置信息和初始速度信息;编队初始条件具体包括时间序列、智能体间的安全距离、时间步长参数、预测时间步及预测视界长度。
具体而言,时间序列为
Figure SMS_125
,其中,/>
Figure SMS_129
并且初始时刻/>
Figure SMS_131
;智能体间的安全距离为/>
Figure SMS_126
;时间步长参数/>
Figure SMS_130
;预测时间步
Figure SMS_132
,/>
Figure SMS_133
并且/>
Figure SMS_127
;预测视界离散化时间指标为
Figure SMS_128
。/>
S2、根据所有智能体的目标编队构型和通信拓扑确定智能体下一时刻的期望位置;
在本发明的一个可选实施例中,本实施例定义目标编队构型
Figure SMS_134
,其中T为矩阵转置符号;通信拓扑具体为每一个智能体只与其相邻智能体互相通信且具有生成树,从而确定智能体下一时刻的期望位置表示为:
Figure SMS_135
其中,
Figure SMS_136
和/>
Figure SMS_137
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure SMS_138
为智能体jt z时刻的位置信息,h ih j分别为智能体i和智能体j的期望编队构型常数,/>
Figure SMS_139
为智能体i的相邻智能体的集合,/>
Figure SMS_140
为智能体i的相邻智能体的个数,N为智能体的总数。
S3、根据集群智能系统的动力学方程,建立智能体位置预测模型;
在本发明的一个可选实施例中,本实施例的集群智能系统的动力学方程为:
Figure SMS_141
其中,
Figure SMS_142
分别为在时间步长为k时刻下智能体i的离散化
Figure SMS_143
轴方向上的位置、速度和加速度。本实施例以加速度作为输入,离散化步长选取为
Figure SMS_144
根据集群智能系统的动力学方程,建立一个线性模型来表示在固定视界长度K上的智能体的状态,智能体i的动力学模型表示为:
Figure SMS_145
其中,
Figure SMS_146
和/>
Figure SMS_147
分别为维度为3的单位矩阵和零矩阵,/>
Figure SMS_148
为时间步长参数,
Figure SMS_149
、/>
Figure SMS_150
和/>
Figure SMS_151
分别为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_152
预测时间步的位置信息预测值、速度信息预测值和加速度信息预测值。
从而得到智能体位置预测模型表示为:
Figure SMS_153
/>
其中,
Figure SMS_165
为智能体it z时刻的预测位置序列,/>
Figure SMS_156
Figure SMS_161
为智能体i到达t z时刻的第k t预测时间步的初始状态,/>
Figure SMS_155
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure SMS_158
,/>
Figure SMS_162
为智能体i在第k t预测时间步进行预测时的第一个预测视界上的预测输入;/>
Figure SMS_166
为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_163
预测时间步的预测加速度信息,即智能体i在第k t预测时间步进行预测时的第二个预测视界上的预测输入;/>
Figure SMS_167
为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_157
预测时间步的预测加速度信息,即智能体i在第k t预测时间步进行预测时的第K个预测视界上的预测输入;/>
Figure SMS_159
Figure SMS_169
,/>
Figure SMS_172
Figure SMS_170
,/>
Figure SMS_173
,/>
Figure SMS_160
Figure SMS_164
,/>
Figure SMS_168
和/>
Figure SMS_171
分别为单位矩阵和零矩阵,/>
Figure SMS_154
为时间步长参数,K为预测视界长度。
S4、根据智能体下一时刻的期望位置,建立编队控制目标函数;
在本发明的一个可选实施例中,本实施例以轨迹误差、控制量和输入变化量建立编队控制目标函数;其中轨迹误差项旨在最小化视界上最后
Figure SMS_174
个时间步的预测位置与下一时刻期望位置之间的误差之和,表示为:
Figure SMS_175
其中,
Figure SMS_176
为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_177
预测时间步的预测位置信息,/>
Figure SMS_178
为智能体i在/>
Figure SMS_179
时刻的位置信息,K为预测视界长度。/>
上式可以转化为含输入序列的二次代价函数,表示为:
Figure SMS_180
其中,
Figure SMS_181
是一个正定块对角矩阵,在每个时间步长上对误差进行加权;
Figure SMS_182
为智能体i到达t z时刻的第k t预测时间步的预测位置序列,/>
Figure SMS_183
为智能体it z+1时刻的位置序列。
控制量项旨在利用二次代价函数来最小化控制量,表示为:
Figure SMS_184
其中,
Figure SMS_185
是一个正定块对角矩阵,/>
Figure SMS_186
;/>
Figure SMS_187
为控制量的惩罚权重系数。
输入变化量项用于最小化加速度的变化,从而使输入轨迹平滑,表示为:
Figure SMS_188
其中,
Figure SMS_189
和/>
Figure SMS_190
分别为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_191
预测时间步和第/>
Figure SMS_192
预测时间步的预测加速度信息,K为预测视界长度。
上式可以转化为含输入序列的二次代价函数,表示为:
Figure SMS_193
其中,
Figure SMS_194
,/>
Figure SMS_195
,/>
Figure SMS_196
是一个正定块对角矩阵,
Figure SMS_197
,/>
Figure SMS_198
为输入变化量的惩罚权重系数。
根据上述轨迹误差、控制量和输入变化量建立编队控制目标函数,表示为:
Figure SMS_199
Figure SMS_200
Figure SMS_201
Figure SMS_202
其中,
Figure SMS_204
为编队控制目标函数,/>
Figure SMS_207
为智能体it z时刻上的预测输入序列,/>
Figure SMS_211
为智能体it z时刻的轨迹误差,/>
Figure SMS_205
为智能体it z时刻的控制量,/>
Figure SMS_208
为智能体it z时刻的输入变化量,/>
Figure SMS_212
和/>
Figure SMS_215
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure SMS_203
为正定块对角矩阵,T为矩阵转置符号,/>
Figure SMS_209
为控制量的惩罚权重系数,
Figure SMS_213
,/>
Figure SMS_216
和/>
Figure SMS_206
分别为单位矩阵和零矩阵,
Figure SMS_210
,/>
Figure SMS_214
为智能体i到达t z时刻的第k t-1预测时间步应用的实际输入信息,具体是指实际应用的加速度信息,/>
Figure SMS_217
为零矩阵。
S5、以智能体运动的加速度及运动空间区间作为约束条件对编队控制目标函数进行优化,构建当前时刻的预测轨迹;
在本发明的一个可选实施例中,本实施例建立的优化问题是基于没有检测到任何未来碰撞的情况下建立的,目标代价函数为
Figure SMS_218
,约束条件限制了智能体运动的最小和最大加速度及运动空间,表示为/>
Figure SMS_219
其中,
Figure SMS_228
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,
Figure SMS_221
,/>
Figure SMS_224
分别为最小输入序列和最大输入序列,/>
Figure SMS_231
,/>
Figure SMS_235
分别为运动空间的最小位置序列和最大位置序列,/>
Figure SMS_232
,/>
Figure SMS_236
Figure SMS_229
Figure SMS_233
,/>
Figure SMS_220
,/>
Figure SMS_225
Figure SMS_223
,/>
Figure SMS_226
和/>
Figure SMS_230
分别为单位矩阵和零矩阵,/>
Figure SMS_234
为时间步长参数,K为预测视界长度,/>
Figure SMS_222
,/>
Figure SMS_227
为智能体i到达t z时刻的第k t预测时间步的初始状态。
S6、采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解,确定无碰撞轨迹并控制所有智能体进行编队。
在本发明的一个可选实施例中,本实施例采用的带有软约束的按需避碰策略具体为:
当智能体预测在第
Figure SMS_237
预测时间步发生碰撞时,在优化问题中引入碰撞约束及松弛变量,表示为:
Figure SMS_238
其中,
Figure SMS_241
为对角矩阵来模拟智能体的碰撞边界,/>
Figure SMS_244
为智能体i利用第/>
Figure SMS_247
预测时间步的可用信息得到的第/>
Figure SMS_242
预测时间步的预测位置信息,
Figure SMS_245
为智能体j利用第/>
Figure SMS_248
预测时间步的可用信息得到的第/>
Figure SMS_250
预测时间步的预测位置信息,n为模拟边界的阶数,通常取2,/>
Figure SMS_240
表示在预测/>
Figure SMS_243
时刻上检测到发生碰撞的某一个预测视界,/>
Figure SMS_246
为智能体间的安全距离,/>
Figure SMS_249
为决策变量,
Figure SMS_239
为矩阵范数。/>
上式关于智能体i
Figure SMS_251
处泰勒级数展开,得到
Figure SMS_252
其中,
Figure SMS_253
Figure SMS_254
将碰撞约束包含在智能体的子集
Figure SMS_255
内,表示为
Figure SMS_256
其中,
Figure SMS_257
模拟了智能体周围的半径,将/>
Figure SMS_258
限制为智能体i半径内的邻居子集,目的是在优化问题中安全地减少碰撞约束的数量。
本实施例采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解具体为:
Figure SMS_259
其中,
Figure SMS_292
为代价函数,
Figure SMS_295
,/>
Figure SMS_299
为编队控制目标函数,
Figure SMS_301
,/>
Figure SMS_303
为所有决策变量/>
Figure SMS_305
的堆叠向量,下标aug表示使用的是增广状态矩阵,/>
Figure SMS_307
Figure SMS_261
为标量优化参数,/>
Figure SMS_264
分别为零矩阵、全一矩阵和单位矩阵,T为矩阵转置符号,/>
Figure SMS_268
和/>
Figure SMS_272
分别为智能体i在初始时刻t 0的位置信息和智能体i在预测视界为1的位置信息预测值,/>
Figure SMS_276
为智能体i设定的初始位置,/>
Figure SMS_280
Figure SMS_284
分别为智能体i利用预测k t时刻的可用信息得到的/>
Figure SMS_288
时刻的状态预测值和加速度预测值,/>
Figure SMS_271
表示在预测/>
Figure SMS_275
时刻上的某一个预测视界,
Figure SMS_279
为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure SMS_283
预测时间步的状态预测值,/>
Figure SMS_287
Figure SMS_291
,/>
Figure SMS_294
,/>
Figure SMS_297
Figure SMS_293
,/>
Figure SMS_296
和/>
Figure SMS_298
分别为单位矩阵和零矩阵,/>
Figure SMS_300
为时间步长参数,K为预测视界长度,/>
Figure SMS_302
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure SMS_304
,/>
Figure SMS_306
分别为最小输入序列和最大输入序列,/>
Figure SMS_308
,/>
Figure SMS_262
分别为运动空间的最小位置序列和最大位置序列,/>
Figure SMS_266
,/>
Figure SMS_270
为在k t时刻的初始状态,k t为预测时间步,
Figure SMS_274
Figure SMS_278
,/>
Figure SMS_282
为对角矩阵,n为模拟边界的阶数,/>
Figure SMS_286
和/>
Figure SMS_290
分别为智能体i和智能体j利用第/>
Figure SMS_260
预测时间步的可用信息得到的第/>
Figure SMS_265
预测时间步的预测位置信息,
Figure SMS_269
,/>
Figure SMS_273
为智能体间的安全距离,
Figure SMS_277
为决策变量,/>
Figure SMS_281
和/>
Figure SMS_285
分别为智能体it z时刻和t z+1时刻的位置信息,
Figure SMS_289
为智能体jt z时刻的位置信息,h ih j分别为智能体i和智能体j的期望编队构型常数,/>
Figure SMS_263
为智能体i的相邻智能体的集合,/>
Figure SMS_267
为智能体i的相邻智能体的个数。
下面以具体实例对本实施例提供的一种集群智能系统协同运动规划与编队控制方法进行具体分析说明。
考虑在二维平面移动的6架无人机组成的集群系统,图2给出了无人机间的有向通信拓扑。设置无人机间的安全距离为
Figure SMS_309
,/>
Figure SMS_310
,时间步长参数/>
Figure SMS_311
,/>
Figure SMS_312
,视界预测长度/>
Figure SMS_313
。此外,每个无人机的初始z位置保持在同一平面上,初始xy位置及编队构型如下表1:
表1
Figure SMS_314
如果无人机i利用
Figure SMS_315
时刻的预测信息没有检测到任何未来的碰撞,那么它通过求解下式来更新其输入序列:
Figure SMS_316
如果无人机i利用
Figure SMS_317
时刻的预测信息检测到了未来的碰撞,那么它通过求解下式来更新其输入序列:/>
Figure SMS_318
图3和图4分别展示了无人机集群系统的运动过程及运动轨迹,可以看出无人机1与无人机2、无人机3与无人机6发生了位置的交互并生成了各自安全的无碰撞轨迹,并且所有的无人机实现了协同编队并在之后保持编队构型。
以无人机1为例说明本实施例的避碰效果,如图5所示,虚线表示无人机间的安全距离
Figure SMS_319
,无人机1与其他无人机之间的相对距离总是大于安全距离。
图6展示了6个无人机的一致性误差
Figure SMS_320
随时间的变化情况,在/>
Figure SMS_321
时均收敛到0,达到了期望的编队构型。
由图7可以看出,每个无人机的输入均落在
Figure SMS_322
范围内,满足设置的输入约束。从上述结果可以看出,无人机集群系统在所设计的协同运动规划与编队控制下,可以找到安全无碰撞的路径并完成期望的编队任务。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (6)

1.一种集群智能系统协同运动规划与编队控制方法,其特征在于,包括以下步骤:
S1、获取所有智能体的初始状态信息并设置编队初始条件;
S2、根据所有智能体的目标编队构型和通信拓扑确定智能体下一时刻的期望位置;
S3、根据集群智能系统的动力学方程,建立智能体位置预测模型;
S4、根据智能体下一时刻的期望位置和智能体位置预测模型,建立编队控制目标函数;
S5、以智能体运动的加速度及运动空间区间作为约束条件对编队控制目标函数进行优化,构建当前时刻的预测轨迹;
S6、采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解,确定无碰撞轨迹并控制所有智能体进行编队;
其中带有软约束的按需避碰策略具体为:
当智能体预测在第
Figure QLYQS_1
预测时间步发生碰撞时,在优化问题中引入碰撞约束及松弛变量,表示为:
Figure QLYQS_2
其中,
Figure QLYQS_4
,/>
Figure QLYQS_10
为对角矩阵,/>
Figure QLYQS_14
和/>
Figure QLYQS_6
分别为智能体i和智能体j利用第/>
Figure QLYQS_9
预测时间步的可用信息得到的第
Figure QLYQS_13
预测时间步的预测位置信息,/>
Figure QLYQS_17
为智能体i利用第/>
Figure QLYQS_3
预测时间步的可用信息得到的第/>
Figure QLYQS_7
预测时间步的预测位置信息,n为模拟边界的阶数,
Figure QLYQS_11
表示在第/>
Figure QLYQS_15
预测时间步上检测到发生碰撞的预测视界,
Figure QLYQS_5
,/>
Figure QLYQS_8
为2范数,/>
Figure QLYQS_12
为智能体间的安全距离,/>
Figure QLYQS_16
为决策变量;
采用带有软约束的按需避碰策略对编队控制目标函数的优化过程进行迭代求解具体为:
Figure QLYQS_18
/>
其中,
Figure QLYQS_52
为代价函数,
Figure QLYQS_55
,/>
Figure QLYQS_58
为编队控制目标函数,
Figure QLYQS_61
,/>
Figure QLYQS_64
为所有决策变量/>
Figure QLYQS_67
的堆叠向量,
Figure QLYQS_69
,/>
Figure QLYQS_20
为标量优化参数,
Figure QLYQS_24
分别为零矩阵、全一矩阵和单位矩阵,T为矩阵转置符号,/>
Figure QLYQS_28
Figure QLYQS_32
分别为智能体i在初始时刻t 0的位置信息和智能体i在预测视界为1的位置信息预测值,/>
Figure QLYQS_36
为智能体i设定的初始位置,/>
Figure QLYQS_40
和/>
Figure QLYQS_44
分别为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure QLYQS_48
预测时间步的状态预测值和加速度预测值,
Figure QLYQS_21
表示在第/>
Figure QLYQS_23
预测时间步上的预测视界,/>
Figure QLYQS_27
为智能体i利用第k t预测时间步的可用信息得到的第/>
Figure QLYQS_31
预测时间步的状态预测值,
Figure QLYQS_35
Figure QLYQS_39
,/>
Figure QLYQS_43
,/>
Figure QLYQS_47
Figure QLYQS_42
,/>
Figure QLYQS_46
和/>
Figure QLYQS_50
分别为单位矩阵和零矩阵,/>
Figure QLYQS_53
为时间步长参数,K为预测视界长度,/>
Figure QLYQS_56
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure QLYQS_59
,/>
Figure QLYQS_62
分别为最小输入序列和最大输入序列,/>
Figure QLYQS_65
,/>
Figure QLYQS_51
分别为运动空间的最小位置序列和最大位置序列,/>
Figure QLYQS_54
,/>
Figure QLYQS_57
为在k t时刻的初始状态,k t为预测时间步,
Figure QLYQS_60
Figure QLYQS_63
,/>
Figure QLYQS_66
,/>
Figure QLYQS_68
为智能体i到达t z时刻的第k t预测时间步的初始状态,/>
Figure QLYQS_70
为对角矩阵,n为模拟边界的阶数,/>
Figure QLYQS_19
和/>
Figure QLYQS_25
分别为智能体i和智能体j利用第/>
Figure QLYQS_29
预测时间步的可用信息得到的第/>
Figure QLYQS_33
预测时间步的预测位置信息,
Figure QLYQS_37
,/>
Figure QLYQS_41
为2范数,/>
Figure QLYQS_45
为智能体间的安全距离,/>
Figure QLYQS_49
为决策变量,/>
Figure QLYQS_22
和/>
Figure QLYQS_26
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure QLYQS_30
为智能体jt z时刻的位置信息,h ih j分别为智能体i和智能体j的期望编队构型常数,/>
Figure QLYQS_34
为智能体i的相邻智能体的集合,/>
Figure QLYQS_38
为智能体i的相邻智能体的个数。
2.根据权利要求1所述的一种集群智能系统协同运动规划与编队控制方法,其特征在于,步骤S1中:
初始状态信息具体包括初始位置信息和初始速度信息;
编队初始条件具体包括时间序列、智能体间的安全距离、时间步长参数、预测时间步及预测视界长度。
3.根据权利要求1所述的一种集群智能系统协同运动规划与编队控制方法,其特征在于,步骤S2中智能体下一时刻的期望位置表示为:
Figure QLYQS_71
其中,
Figure QLYQS_72
和/>
Figure QLYQS_73
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure QLYQS_74
为智能体jt z时刻的位置信息,h ih j分别为智能体i和智能体j的期望编队构型常数,/>
Figure QLYQS_75
为智能体i的相邻智能体的集合,/>
Figure QLYQS_76
为智能体i的相邻智能体的个数。
4.根据权利要求1所述的一种集群智能系统协同运动规划与编队控制方法,其特征在于,步骤S3中智能体位置预测模型表示为:
Figure QLYQS_77
其中,
Figure QLYQS_80
为智能体it z时刻的预测位置序列,/>
Figure QLYQS_82
,/>
Figure QLYQS_85
为智能体i到达t z时刻的第k t预测时间步的初始状态,/>
Figure QLYQS_81
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure QLYQS_83
,/>
Figure QLYQS_86
,/>
Figure QLYQS_88
,/>
Figure QLYQS_78
Figure QLYQS_84
,/>
Figure QLYQS_87
和/>
Figure QLYQS_89
分别为单位矩阵和零矩阵,/>
Figure QLYQS_79
为时间步长参数,K为预测视界长度。
5.根据权利要求1所述的一种集群智能系统协同运动规划与编队控制方法,其特征在于,步骤S4中编队控制目标函数具体为:
Figure QLYQS_90
Figure QLYQS_91
Figure QLYQS_92
Figure QLYQS_93
其中,
Figure QLYQS_95
为编队控制目标函数,/>
Figure QLYQS_101
为智能体it z时刻上的预测输入序列,
Figure QLYQS_106
为智能体it z时刻的轨迹误差,/>
Figure QLYQS_96
为智能体it z时刻的控制量,/>
Figure QLYQS_100
为智能体it z时刻的输入变化量,/>
Figure QLYQS_104
和/>
Figure QLYQS_108
分别为智能体it z时刻和t z+1时刻的位置信息,/>
Figure QLYQS_94
为正定块对角矩阵,T为矩阵转置符号,/>
Figure QLYQS_99
为控制量的惩罚权重系数,
Figure QLYQS_103
,/>
Figure QLYQS_107
和/>
Figure QLYQS_97
分别为单位矩阵和零矩阵,
Figure QLYQS_98
,/>
Figure QLYQS_102
为智能体i到达t z时刻的第k t-1预测时间步应用的实际输入信息,/>
Figure QLYQS_105
为零矩阵。
6.根据权利要求1所述的一种集群智能系统协同运动规划与编队控制方法,其特征在于,步骤S5中以智能体运动的加速度及运动空间区间作为约束条件具体为:
Figure QLYQS_109
其中,
Figure QLYQS_111
为智能体i达到t z时刻的第k t预测时间步的预测输入序列,/>
Figure QLYQS_114
,/>
Figure QLYQS_118
分别为最小输入序列和最大输入序列,/>
Figure QLYQS_112
,/>
Figure QLYQS_115
分别为运动空间的最小位置序列和最大位置序列,/>
Figure QLYQS_119
Figure QLYQS_122
,/>
Figure QLYQS_110
,/>
Figure QLYQS_116
Figure QLYQS_120
,/>
Figure QLYQS_123
和/>
Figure QLYQS_113
分别为单位矩阵和零矩阵,/>
Figure QLYQS_117
为时间步长参数,K为预测视界长度,/>
Figure QLYQS_121
,/>
Figure QLYQS_124
为智能体i到达t z时刻的第k t预测时间步的初始状态。/>
CN202310287976.0A 2023-03-23 2023-03-23 一种集群智能系统协同运动规划与编队控制方法 Active CN115993845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310287976.0A CN115993845B (zh) 2023-03-23 2023-03-23 一种集群智能系统协同运动规划与编队控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310287976.0A CN115993845B (zh) 2023-03-23 2023-03-23 一种集群智能系统协同运动规划与编队控制方法

Publications (2)

Publication Number Publication Date
CN115993845A CN115993845A (zh) 2023-04-21
CN115993845B true CN115993845B (zh) 2023-05-30

Family

ID=85992457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310287976.0A Active CN115993845B (zh) 2023-03-23 2023-03-23 一种集群智能系统协同运动规划与编队控制方法

Country Status (1)

Country Link
CN (1) CN115993845B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116700012B (zh) * 2023-07-19 2024-03-01 合肥工业大学 一种多智能体的避撞编队合围控制器的设计方法
CN117270393B (zh) * 2023-10-07 2024-05-17 重庆大学 智能机器人集群协同控制系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8676466B2 (en) * 2009-04-06 2014-03-18 GM Global Technology Operations LLC Fail-safe speed profiles for cooperative autonomous vehicles
CN107992090B (zh) * 2018-01-25 2019-01-29 西北工业大学深圳研究院 一种应用于网络化集群智能体系统的自适应编队方法
CN108508914A (zh) * 2018-03-29 2018-09-07 哈尔滨理工大学 一种离散多智能体系统的编队控制方法
CN114594756A (zh) * 2020-11-30 2022-06-07 上海交通大学 动态障碍环境下的多车协同编队控制方法、终端及介质
US11840256B2 (en) * 2021-07-30 2023-12-12 Mitsubishi Electric Research Laboratories, Inc. Global multi-vehicle decision making system for connected and automated vehicles in dynamic environment
CN114527661B (zh) * 2022-02-23 2022-09-20 西北工业大学深圳研究院 一种用于集群智能系统的协同编队方法
CN114661069B (zh) * 2022-05-25 2022-09-06 西北工业大学深圳研究院 一种群体智能系统的编队控制方法
CN115599089A (zh) * 2022-08-02 2023-01-13 北京理工大学(Cn) 基于人工势场法的多智能体编队控制方法
CN115167451A (zh) * 2022-08-02 2022-10-11 陇东学院 一种离散异构多自主体编队合围跟踪控制方法及系统

Also Published As

Publication number Publication date
CN115993845A (zh) 2023-04-21

Similar Documents

Publication Publication Date Title
CN115993845B (zh) 一种集群智能系统协同运动规划与编队控制方法
Zhu et al. A neural network approach to dynamic task assignment of multirobots
CN110658821B (zh) 一种多机器人抗干扰分组时变编队控制方法及系统
Adepegba et al. Multi-agent area coverage control using reinforcement learning
Ren et al. Overview of recent research in distributed multi-agent coordination
Yan et al. Collision-avoiding flocking with multiple fixed-wing UAVs in obstacle-cluttered environments: a task-specific curriculum-based MADRL approach
CN110262523B (zh) 一种分布式群体机器人的自主避障蜂拥控制方法
CN112947575B (zh) 基于深度强化学习的无人机集群多目标搜索方法及系统
CN116755474A (zh) 一种无人机用电力巡线方法及系统
CN113900449B (zh) 多无人机轨迹规划方法、装置、无人机及存储介质
Shi et al. A learning approach to image-based visual servoing with a bagging method of velocity calculations
CN114610066A (zh) 复杂未知环境下分布式集群无人机编队飞行轨迹生成方法
Wang et al. A continuous actor-critic reinforcement learning approach to flocking with fixed-wing UAVs
Geng et al. Learning to cooperate in decentralized multi-robot exploration of dynamic environments
CN113485323B (zh) 一种级联多移动机器人灵活编队方法
CN115562357A (zh) 一种面向无人机集群的智能路径规划方法
Horla et al. AL-TUNE: A family of methods to effectively tune UAV controllers in in-flight conditions
Li et al. Vg-swarm: A vision-based gene regulation network for uavs swarm behavior emergence
Bell et al. Target tracking subject to intermittent measurements using attention deep neural networks
CN111176324B (zh) 一种多无人机分布式协同编队规避动态障碍的方法
Wu et al. Real-Time Path Planning Algorithm for UAV Swarm on Complex Terrain Based on Multi-objective Particle Swarm Optimization
Al-Aubidy et al. Multi-robot task scheduling and routing using neuro-fuzzy control
CN114115341B (zh) 一种智能体集群协同运动方法及系统
Wang et al. Revolutionary entrapment model of uniformly distributed swarm robots in morphogenetic formation
Singh et al. Learning safe cooperative policies in autonomous multi-UAV navigation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant