CN113359439B - 多智能体系统有限时间多目标协同追踪方法和存储介质 - Google Patents
多智能体系统有限时间多目标协同追踪方法和存储介质 Download PDFInfo
- Publication number
- CN113359439B CN113359439B CN202110544217.9A CN202110544217A CN113359439B CN 113359439 B CN113359439 B CN 113359439B CN 202110544217 A CN202110544217 A CN 202110544217A CN 113359439 B CN113359439 B CN 113359439B
- Authority
- CN
- China
- Prior art keywords
- agent
- target
- agent system
- agents
- cooperative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000004891 communication Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 23
- 230000014509 gene expression Effects 0.000 claims description 13
- 230000001133 acceleration Effects 0.000 claims description 6
- 230000005484 gravity Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 241001235534 Graphis <ascomycete fungus> Species 0.000 claims description 2
- 230000002860 competitive effect Effects 0.000 claims description 2
- 230000009471 action Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 206010044565 Tremor Diseases 0.000 description 1
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
本发明公开了多智能体系统有限时间多目标协同追踪方法和存储介质。本发明对N个多智能体进行运动学和动力学建模,并把这N个智能体分成M个子群,每个子群中都有一个相应的虚拟目标,设计多智能体系统的通讯拓扑图,由此可以设计出相应的有向图,在满足上一步骤所述有向图的前提下,设计多智能体系统的分层协同控制器,结合第一步的运动学和动力学模型,实现多智能体系统的有限时间多目标协同追踪控制。本发明设计的估计器算法可确保每个智能体都能在有限时间内获得其相应目标的准确信息,设计的本地层算法可以实现智能体的一对一有限时间局部跟踪。
Description
技术领域
本发明涉及分布式人工智能领域,特别是涉及多智能体系统有限时间多目标协同追踪方法和存储介质。
背景技术
多智能体系统是20世纪末至21世纪初分布式人工智能领域的国际前沿研究课题,其核心支撑理论是人工智能、分布式控制和分布式计算。进入21世纪,人们在解决大型、复杂的工程问题时,发现单个智能体的能力已经无法胜任,需要多个智能体在网络环境下以信息通讯的方式组成多智能体系统协同地解决工程问题。典型的多智能体系统包括多智能体系统,多无人机系统,智能电网和分布式卫星系统等。
但是,目前大多数的多智能体系统的控制方法仅适用于渐进时间内控制单个目标,且局限于研究用单积分器、双积分器动力学模型描述的智能体系统,并忽略了外部扰动、参数不确定性的影响。而在实际应用中,外部扰动、参数不确定性是不可避免的;同时,可能会要求多智能体系统通过目标追踪同时完成多个任务,且运用欧拉-拉格朗日动力学来描述的多智能体系统能更严谨地描述现实生活中的应用,例如:多个机械臂,多个无人智能小车,多个无人舰艇等;另外,很多实际的应用中对完成任务的时间会有需求,从而需要控制算法来实现更短的时间内执行任务。
因此,在考虑外部扰动及动力学模型参数不确定性的多智能体系统的一种多智能体系统有限时间多目标协同追踪方法具有重要意义。
发明内容
本发明要解决的技术问题在于,针对现有技术的无法满足有限时间多目标协同追踪技术缺陷,提供了多智能体系统有限时间多目标协同追踪方法和存储介质。
根据本发明的一个方面,本发明的提供一种多智能体系统有限时间多目标协同追踪方法,包括:
对多智能体系统中N个智能体进行运动学和动力学建模;
将N个智能体分成M个子群,每个子群中确定一个虚拟跟踪目标,其中N和M均为大于等于1的整数;
对智能体之间的交互作用进行建模,获得所述子群的通讯有向拓扑图;
根据所述通讯有向拓扑图,设计基于估计器的多智能体系统的分层协同控制器;
根据所述运动学和动力学模型,利用所述分层协同控制器,实现每个子群的智能体在有限时间收敛至所述每个子群的智能体对应的虚拟追踪目标的轨迹。
进一步地,所述对多智能体系统中N个智能体进行运动学和动力学建模包括:
运动学和动力学模型表达式为:
惯性矩阵为:
科氏离心矩阵为:
重力转矩为:
进一步地,所述模型表达式还可以表达为:
进一步地,当第i个智能体属于第l个子群时,所述跟踪目标的数学表达式为:
进一步地,所述获得所述子群的通讯有向拓扑图包括:
如果第i个智能体和第j个智能体是竞争关系,则aij<0,如果第i个智能
进一步地,所述将N个智能体分成M个子群包括:
多智能体系统被划分为M(M>1)个子群,每一个所述子群被描述为含有nl个智能体的子图:
进一步地,所述获得所述子群的通讯有向拓扑图还包括:
根据智能体与其对应跟踪目标之间的通讯状况,确定有向图的对角权重矩阵B:
其中,N=(1,2,...,i),若第i个智能体能够直接接收其跟踪目标的信息,则bi为取值大于0的数,如果不能,则bi=0。
进一步地,所述设计基于估计器的多智能体系统的分层协同控制器还包括:
所述分层协同控制器的数学表达式为:
其中,i∈Vl表示第l个子群里的第i智能体,集合是用来标记第l个子群中的所有智能体,表示N个智能体的集合,l∈{1,...,M}表示M个子群;τi1和τi2分别表示等效控制律和滑模控制律,λ1,λ2>0,Kp和Kd是两个正定对角矩阵, 0<α1<1,α2=2α1/(α1+1),和分别表示ε1,i和ε2,i的估计值,并且分别定义为:
进一步地,所述利用所述分层协同控制器,实现每个子群的智能体在有限时间收敛至所述每个子群的智能体对应的虚拟追踪目标的轨迹还包括:
结合所述闭环系统和稳定性分析,得到多目标协同追踪的误差满足以下条件:
根据本发明的另一个方面,还提供一种存储介质,其特征在于,其上存储有如前任一所述的一种多智能体系统有限时间多目标协同追踪方法。
在本发明所述的一种多智能体系统的有限时间多目标协同追踪控制方法中,提供一种考虑扰动及模型参数不确定性的多智能体系统的有限时间多目标协同追踪控制方法,通过选择合适的控制参数来提高多智能体系统的有限时间多目标协同追踪的速度和准确性。
总体而言,通过本发明提供的一种多智能体系统的有限时间多目标协同追踪控制方法,具有以下有益效果:
1、与传统的集中控制方式比起来,本项目采用的分布式控制方法具有更强的鲁棒性,更少的能耗和更高的执行效率;
2、考虑智能体模型中的动力学参数不确定性以及外部扰动,使得多目标协同追踪控制实用性更强;
3、与控制单一目标的系统来说,本项目是多目标控制,能够在需要同时处理多个任务的网络系统中发挥作用;
4、与渐进收敛时间相比,本项目所设计的控制算法的优势在于能够保证多智能体在有限时间内追踪到相应的目标,具有更好的跟踪性能。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例中的多智能体系统的系统流程图;
图2是本发明实施例中的多智能体系统的通讯有向拓扑图;
图3是本发明实施例中的三个子群中位置状态轨迹追踪图和位置状态估计量轨迹追踪图;
图4是本发明实施例中的三个子群中中速度状态轨迹追踪图和速度状态估计量轨迹追踪图;
图5是本发明实施例中的三个子群中位置估计误差图、局部位置追踪误差图以及在总体位置追踪误差图;
图6是本发明实施例中的三个子群中总体速度追踪误差图;
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
实施例一,如图1所述,为多智能体系统的系统流程图,具体包括以下步骤:
步骤S1:选定13个智能体与3个虚拟追踪目标,进行动力学和运动学建模;参考图2,其为多智能体系统的通讯有向拓扑图,其中,点1-13表示智能体,点L1-L3表示其对应的虚拟追踪目标;将编号1-3的智能体定义为第一个子群,编号4-8的智能体定义为第二个子群,编号9-13的智能体定义为第三个子群;参考图3,所述的多智能体具有不同的物理参数,具体见表1以及表2;
表1.多智能体系统中的物理参数
表2.多智能体系统中的物理参数的估计值:
步骤S11:对N个智能体进行动力学和运动学建模,模型表达式为:
在一些实施例中,建好的动力学和运动学模型可以改写为:
同时把这13个智能体分成3个子群,3个子群中的虚拟追踪目标分别对应为子群L1、L2、L3。
步骤S12、根据有限时间多目标协同追踪控制方法,步骤S1中追踪的多目标的数学表达式为:
其中,qo,l(t)、ωo,l(t)和分别表示第l个子群的追踪目标的位置状态、速度和加速度,l∈{1,2,3}表示多个目标子群的序号,当第i个智能体属于第l个子群时,上述表达式即为当前追踪目标;其中,
有向边eij∈ε,这意味着第i个智能体可以直接接收第j个智能体信息,如果第i个智能体和第j个智能体是竞争关系;则aij<0,如果是合作关系,则aij>0,否则aij=0,假设没有自循环,即aij=0,
此外,相应的拉普拉斯矩阵关于有向图定义为且有lij=-aij对于所有的所设计的多智能体系统被划分为3个子群,根据前面定义的邻接矩阵确定有向图的拉普拉斯矩阵对于每个智能体,至少存在一条路径,使得被考虑的智能体可以接收到领导者的信息,由此确定有向图的对角权重矩阵
B=diag(7,7,0,0,8,0,0,0,0,7,9,0,8)
步骤S3、在满足有向图的前提下,设计多智能体系统的基于估计器的分布式控制器,实现每个子群的智能体在有限时间收敛至其对应的虚拟目标轨迹,完成多智能体系统的有限时间多目标协同追踪控制;其中,基于估计器的分布式控制器中的控制参数的选取具体见表3:
表3分布式控制器中的控制参数
步骤S32、结合步骤S31得到的稳定性分析结果,从而得到多智能体系统的跟踪误差满足的条件:
当t→Tg时,qi→qi,1,ωi→ωi,1,i∈{1,2,3};qi→qi,2,ωi→ωi,2,i∈{4,5,6,7,8};qi→qi,3,ωi→ωi,3,i∈{9,10,11,12,13}即得到多智能体系统的有限时间多目标追踪。
如图3所示,(a)和(b)表示三个子群的多智能体位置状态qi1和qi2的追踪轨迹图,(c)和(d)表示三个子群的多智能体位置状态估计量的跟踪轨迹图,在所设计的状态估计器的作用下,三个子群中的智能体的位置状态估计量都在有限时间内收敛于其对应的跟踪目标轨迹。
如图4所示,(a)和(b)表示三个子群的多智能体速度状态ωi1,ωi2的追踪轨迹图,(c)和(d)表示三个子群的多智能体速度状态估计量的跟踪轨迹图,在所设计的状态估计器的作用下,三个子群中的智能体的速度状态估计量都在有限时间内收敛于其对应的追踪目标速度。
如图5所示,(a)和(b)表示三个子群中位置估计误差图,位置估计误差都在有限时间内收敛到[-0.005,0.005]内;(c)和(d)表示三个子群的局部追踪位置误差图,(e)和(f)表示三个子群的总体位置追踪误差ei1,ei2图,在所设计的控制器的作用下,三个子群中的智能体的位置状态都在有限时间内收敛到其对应的跟踪目标轨迹。
如图6所示,(a)和(b)表示的是三个子群的总体速度追踪误差图,(c)和(d)表示的是除颤后的三个子群的总体速度追踪误差图,表明三个子群中的智能体的速度状态都在有限时间内收敛到其对应的跟踪目标速度,且除颤后的速度状态颤动明显减小。
以上结合附图对本发明的实施方式进行了说明,但是本发明的保护范围并不局限于上述的具体实施方式,任何熟悉本技术领域的技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多变化或替换形式,这些都应该涵盖在本发明的保护范围之内。
Claims (9)
1.一种多智能体系统有限时间多目标协同追踪方法,其特征在于,包括:
对多智能体系统中N个智能体进行运动学和动力学建模;
将N个智能体分成M个子群,每个子群中确定一个虚拟跟踪目标,其中N和M均为大于等于1的整数;
对智能体之间的交互作用进行建模,获得所述子群的通讯有向拓扑图;
根据所述通讯有向拓扑图,设计基于估计器的多智能体系统的分层协同控制器;
所述分层协同控制器的数学表达式为:
其中,i∈Vl表示第l个子群里的第i智能体,集合是用来标记第l个子群中的所有智能体,表示N个智能体的集合,l∈{1,...,M}表示M个子群;τi1和τi2分别表示等效控制律和滑模控制律,λ1,λ2>0,Kp和Kd是两个正定对角矩阵, 0<α1<1,α2=2α1/(α1+1),和分别表示ε1,i和ε2,i的估计值,并且分别定义为:
根据所述运动学和动力学模型,利用所述分层协同控制器,实现每个子群的智能体在有限时间收敛至所述每个子群的智能体对应的虚拟追踪目标的轨迹。
9.一种存储介质,其特征在于,其上存储有如权利要求1-8任一所述的一种多智能体系统有限时间多目标协同追踪方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110544217.9A CN113359439B (zh) | 2021-05-19 | 2021-05-19 | 多智能体系统有限时间多目标协同追踪方法和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110544217.9A CN113359439B (zh) | 2021-05-19 | 2021-05-19 | 多智能体系统有限时间多目标协同追踪方法和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113359439A CN113359439A (zh) | 2021-09-07 |
CN113359439B true CN113359439B (zh) | 2022-06-24 |
Family
ID=77526554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110544217.9A Expired - Fee Related CN113359439B (zh) | 2021-05-19 | 2021-05-19 | 多智能体系统有限时间多目标协同追踪方法和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113359439B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114115002B (zh) * | 2021-11-11 | 2023-08-11 | 西北工业大学 | 一种基于二阶通讯拓扑的大型集群控制方法 |
CN114825402B (zh) * | 2022-04-28 | 2023-06-06 | 江南大学 | 自适应协同终端滑模控制方法、介质、电子设备及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109471361A (zh) * | 2018-12-17 | 2019-03-15 | 中国地质大学(武汉) | 一种异构多机器人系统的多目标跟踪控制方法 |
CN111522341A (zh) * | 2020-04-23 | 2020-08-11 | 中国地质大学(武汉) | 网络异构机器人系统的多时变编队跟踪控制方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170139423A1 (en) * | 2015-11-12 | 2017-05-18 | King Fahd University Of Petroleum And Minerals | Control system and method for multi-vehicle systems |
US10983532B1 (en) * | 2017-08-03 | 2021-04-20 | University Of South Florida | Distributed control of heterogeneous multi-agent systems |
CN109032137B (zh) * | 2018-07-24 | 2020-11-06 | 西北工业大学 | 多Euler-Lagrange系统分布式跟踪控制方法 |
CN110221542B (zh) * | 2019-06-04 | 2021-09-17 | 西北工业大学 | 一种二阶非线性多智能体系统固定时间协同跟踪控制方法 |
CN111290440B (zh) * | 2020-04-07 | 2023-06-20 | 中国人民解放军海军航空大学 | 基于双虚拟结构的多无人机编队Standoff跟踪控制及跟踪方法 |
-
2021
- 2021-05-19 CN CN202110544217.9A patent/CN113359439B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109471361A (zh) * | 2018-12-17 | 2019-03-15 | 中国地质大学(武汉) | 一种异构多机器人系统的多目标跟踪控制方法 |
CN111522341A (zh) * | 2020-04-23 | 2020-08-11 | 中国地质大学(武汉) | 网络异构机器人系统的多时变编队跟踪控制方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113359439A (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108646758B (zh) | 一种多移动机器人预设性能编队控制器结构及设计方法 | |
CN108803349B (zh) | 非线性多智能体系统的最优一致性控制方法及系统 | |
CN113359439B (zh) | 多智能体系统有限时间多目标协同追踪方法和存储介质 | |
CN109032137B (zh) | 多Euler-Lagrange系统分布式跟踪控制方法 | |
CN104698854B (zh) | 网络Euler‑Lagrange系统分布式模糊协同跟踪控制方法 | |
Lin et al. | A gated recurrent unit-based particle filter for unmanned underwater vehicle state estimation | |
CN105068427A (zh) | 一种多机器人系统有限时间鲁棒协同跟踪控制方法 | |
CN111522341A (zh) | 网络异构机器人系统的多时变编队跟踪控制方法及系统 | |
CN112051734B (zh) | 一种基于确定学习的轮式移动机器人事件触发跟踪控制方法 | |
CN114138010B (zh) | 一种基于加权偏差的多智能体高阶滑模编队控制方法 | |
CN112148036B (zh) | 网络化机器人系统的固定时间估计器的双边跟踪控制方法 | |
Liu et al. | Multi-agent formation control with target tracking and navigation | |
Shou et al. | Finite‐time formation control and obstacle avoidance of multi‐agent system with application | |
Liu et al. | Distributed adaptive fuzzy control approach for prescribed-time containment of uncertain nonlinear multi-agent systems with unknown hysteresis | |
CN116700327A (zh) | 一种基于连续动作优势函数学习的无人机轨迹规划方法 | |
Zhang et al. | Motion planning and adaptive neural sliding mode tracking control for positioning of uncertain planar underactuated manipulator | |
CN113885548B (zh) | 一种多四旋翼无人机输出约束状态一致博弈控制器 | |
Litimein et al. | Circular formation control with collision avoidance based on probabilistic position | |
CN115407661A (zh) | 基于方位测量信息多无人机系统非线性鲁棒跟踪控制方法 | |
Li et al. | Large-scale unmanned aerial vehicle formation maintenance algorithm based on virtual structure | |
Enjiao et al. | Finite-time control of formation system for multiple flight vehicles subject to actuator saturation | |
CN118131621A (zh) | 一种基于多智能体系统的分布式固定时间优化方法 | |
CN117724343A (zh) | 具有未知饱和磁滞输入的分布式有限时间动态面渐进跟踪控制方法 | |
CN115993780A (zh) | El型非线性集群系统时变编队优化跟踪控制方法及系统 | |
CN109176529B (zh) | 一种空间机器人协调运动的自适应模糊控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220624 |