CN105589333A - 多智能体系统分组包围控制方法 - Google Patents

多智能体系统分组包围控制方法 Download PDF

Info

Publication number
CN105589333A
CN105589333A CN201610077870.8A CN201610077870A CN105589333A CN 105589333 A CN105589333 A CN 105589333A CN 201610077870 A CN201610077870 A CN 201610077870A CN 105589333 A CN105589333 A CN 105589333A
Authority
CN
China
Prior art keywords
subsystem
target
agent
sigma
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610077870.8A
Other languages
English (en)
Other versions
CN105589333B (zh
Inventor
李�瑞
史莹晶
程祥
杨峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201610077870.8A priority Critical patent/CN105589333B/zh
Publication of CN105589333A publication Critical patent/CN105589333A/zh
Application granted granted Critical
Publication of CN105589333B publication Critical patent/CN105589333B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种多智能体系统分组包围控制方法,根据具体任务将多智能体系统划分为子系统,根据包围控制的实际需要确定各个子系统中每个智能体的结构向量;各个子系统分别对其目标群体中的目标进行位置探测,根据中心估计器来估计得到目标群体的中心,然后根据目标群体中心、智能体当前的位置和速度以及结构向量来计算其该智能体的控制量。本发明针对动态群体目标设计了光滑的中心估计器,具有有限时间收敛特性,利用其构建的控制协议也具有较好的收敛性,从而实现具有多组智能体系统的协调包围控制,尤其是对于具有任务继承关系的子系统,可以提高子系统在包围过程中的稳健性。

Description

多智能体系统分组包围控制方法
技术领域
本发明属于智能体控制技术领域,更为具体地讲,涉及一种多智能体系统分组包围控制方法。
背景技术
包围控制作为多智能体系统协调控制的一种,目的是实现对目标群体的包围编队,从而对其进行保护和监控等。由于其在民用及军用领域的潜在应用前景,目前已得到广泛关注。
在研究包围控制问题时,除了对单个目标的包围,还涉及到对群体目标的包围。在考虑对群体目标进行包围时,目标有可能是静止的,而更为普遍的情况是,目标群体的位置是变化的,这种变化有可能是目标群体中个体间的结构保持不变但整体变化,也可能是目标群体中个体间的结构也在变化。受传感器能力限制,智能体个体仅能获得目标群体的局部信息,因而,获得移动目标群体的位置是解决包围控制的一个关键。
另一方面,随着问题研究的深入,存在着由多组智能体联合完成任务的情况。如近年发展起来的模块化航天器系统备受关注。这种模块化思想提出将航天器按功能分成有效载荷、通信、定位等子系统,每个子系统又可由一系列功能相同的个体联合构成,这些个体以及子系统间可能物理分离,联合组成虚拟卫星。如其对目标进行探测时,具体的跟踪和图像获取可以通过侦查子系统实现,而获取的信息通过通信子系统传输给地面指挥控制中心。这个过程中,对目标的跟踪及图像获取涉及到侦查子系统中各个体相互配合,实现对目标的包围,信息整合等;而通信子系统则需要系统中各个体按照适合信息传输的结构,组成分布式雷达阵列,互相协调完成信息传输。在这种情况下,就需要对智能体系统之间不同的子系统进行分组包围控制,以保障各个子系统任务的完成。
目前,关于多组协调控制问题,已有一些研究成果,包括多组智能体的一致性及群集控制;双向一致性等。关于多组智能体协调包围控制,目前的研究成果较少,例如,关于对于一个固定目标,文献中实现了对其在不同轨道的环绕包围;对于两个不同的目标,文献实现了利用两组多智能体系统对其进行包围。关于多组智能体的协调包围控制,目前尚处于初始研究阶段,有待进一步深入研究。
发明内容
本发明的目的在于克服现有技术的不足,提供一种多智能体系统分组包围控制方法,针对具有多任务的多智能体系统,采用基于中心估计器的协调控制方法,以便实现多组智能体系统的协调包围控制。
为实现上述发明目的,本发明中的多智能体系统分组包围控制方法包括以下步骤:
S1:多智能体系统根据具体任务划分子系统,记多智能体系统中各子系统中智能体的集合为Sk={ski|i=1,2,…,Nk},其中k=1,2,…,K,K表示子系统数量,Nk表示第k个子系统中的智能体数量,ski表示第k个子系统中的第i个智能体;根据包围控制的实际需要确定各个子系统中各个智能体的结构向量ξki(t);
S2:记第k个子系统的目标群体集合为Ok={okj|j=1,2,…,Mk},其中okj表示第k个子系统目标群体中的第j个目标,Mk表示第k个子系统目标群体中的目标数量;每个子系统分别对其包围的目标群体位置进行探测,获取各个目标在当前时刻t的位置pkj(t);
S3:子系统Sk中的智能体ski根据以下公式估计其目标群体Ok的中心
p ^ k i ( t ) = φ k i ( t ) + p ~ k i ( t )
1 N k Σ i = 1 N k p ~ k i ( t ) = 1 M k Σ j = 1 M k p k j ( t )
φ · k i ( t ) = α Σ d ∈ U k i s i g ( p ^ k d ( t ) - p ^ k i ( t ) ) μ
其中,φki(0)=0,α和μ为设置参数,满足α∈R+,μ∈R+,Uki表示智能体ski的邻域,函数sig(·)μ=sgn(·)|·|μ,sgn(·)为符号函数;
S4:子系统中的各个智能体ski根据以下公式得到其在当前时刻t的控制量uki(t):
u k i ( t ) = q ^ · k i ( t ) - [ v k i ( t ) - q ^ k i ( t ) - ξ · k i ( t ) ] - [ x k i ( t ) - p ^ k i ( t ) - ξ k i ( t ) ]
其中,xki(t)和vki(t)分别表示智能体ski在当前时刻t的位置和速度。
本发明多智能体系统分组包围控制方法,根据具体任务将多智能体系统划分为子系统,根据包围控制的实际需要确定各个子系统中每个智能体的结构向量;各个子系统分别对其目标群体中的目标进行位置探测,根据中心估计器来估计得到目标群体的中心,然后根据目标群体中心、智能体当前的位置和速度以及结构向量来计算其该智能体的控制量。
本发明针对动态群体目标设计了光滑的中心估计器,具有有限时间收敛特性,利用其构建的控制协议也具有较好的收敛性,从而实现具有多组智能体系统的协调包围控制,尤其是对于具有任务继承关系的子系统,可以提高子系统在包围过程中的稳健性。
附图说明
图1是本发明多智能体系统分组包围控制方法的具体实施方式流程图;
图2是多组智能体系统协调控制示意图;
图3是多智能体系统的交流拓扑结构图;
图4是智能体和目标之间的探测关系结构示意图;
图5是子系统Sp中各智能体中心估计器的状态轨迹;
图6是子系统Sc中各智能体中心估计器的状态轨迹;
图7是智能体系统的三维曲线;
图8是仿真结束时智能体和目标的相对位置。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明多智能体系统分组包围控制方法的具体实施方式流程图。如图1所示,本发明多智能体系统分组包围控制方法的具体步骤如下:
S101:确定多智能体系统结构向量:
多智能体系统根据具体任务划分为若干个子系统,记多智能体系统中各子系统中智能体的集合为Sk={ski|i=1,2,…,Nk},其中k=1,2,…,K,K表示子系统数量,Nk表示第k个子系统中的智能体数量,ski表示第k个子系统中的第i个智能体。在多智能体系统中,一个智能体可能会承担多个任务,也就是说各子系统智能体的集合可能存在交集。
在K个子系统中,如果子系统Sc的任务被另一个子系统Sp决定,那么Sp称作父系统,Sc称作Sp的子系统。Sc中直接受外部信息作用的个体称为积极个体;而Sc中不直接受外部信息作用,而是由积极个体影响的个体称为被动个体。
对于多智能体系统,可采用二阶模型对其进行描述,其中智能体ski的模型描述如下:
x · k i ( t ) = v k i ( t ) , v · k i ( t ) = u k i ( t ) , - - - ( 1 )
其中xki(t)和vki(t)分别表示智能体ski在当前时刻t的位置和速度,uki(t)表示控制输入,上标圆点表示导数。
对于多智能体系统中的每个子系统Sk,如果向量ξki(t)能够用来确定智能体ski相对于目标群体中心或是相对于积极个体中心的相对位置,则称其为智能体ski的结构向量。特别地,将用来确定智能体ski相对于目标群体中心相对位置的结构向量构成的集合定义为包围结构,记作ξc(t);将用来确定智能体si相对于积极个体中心相对位置的结构向量构成的集合定义为共型结构,记作ξp(t)。包围结构及共型结构统称为联合结构。
因此在本发明中,首先需要根据包围控制的实际需要确定各个子系统中各个智能体的结构向量ξki(t),以作为包围控制的依据,从而实现基于不同任务的包围控制。
S102:探测包围目标位置:
由于具体任务不同,各个子系统需要进行包围的目标群体也可能不同。例如目标侦查子系统的目标群体即为侦查对象,而通信子系统的目标群体可以是侦查对象,也可以是目标侦查子系统中的某些智能体。因此记第k个子系统的目标群体集合为Ok={okj|j=1,2,…,Mk},其中okj表示第k个子系统目标群体中的第j个目标,Mk表示第k个子系统目标群体中的目标数量。每个子系统分别对其包围的目标群体位置进行探测,获取各个目标在当前时刻t的位置pkj(t)。
子系统在对目标群体进行位置探测时,可以由一个或部分智能体探测到各目标的位置后分享给邻居智能体,也可以每个智能体分别对其探测范围内的目标进行探测然后汇总到其中一个智能体或上位系统再下发。目标探测是包围控制领域的一种常用技术,在此不再赘述。
S103:目标中心估计:
智能体的包围运动是建立在目标中心位置已知的前提下,但是多智能体系统并不能够直接获得目标中心的位置,需要采用估计器根据各目标当前的位置及其他信息来估计目标群体的中心位置。
本发明中子系统Sk中的智能体ski,对目标群体Ok中心的估计器表达式如下:
p ^ k i ( t ) = φ k i ( t ) + p ~ k i ( t ) - - - ( 2 )
其中是目标群体Ok中各目标位置pkj(t)的线性时不变组合,满足:
1 N k Σ i = 1 N k p ~ k i ( t ) = 1 M k Σ j = 1 M k p k j ( t ) - - - ( 3 )
φki(t)满足以下表达式:
φ · k i ( t ) = α Σ d ∈ U k i s i g ( p ^ k d ( t ) - p ^ k i ( t ) ) μ - - - ( 4 )
其中,φki(0)=0,α和μ为设置参数,满足α∈R+,μ∈R+,Uki表示智能体ski的邻域,函数sig(·)μ=sgn(·)|·|μ,sgn(·)为符号函数。
对于中心估计器,只有当其收敛于目标中心时,才可以利用其进行包围控制协议设计,因此下面对本发明所采用的中心估计器的收敛性进行证明。
首先给出中心估计器收敛的定义:记智能体ski对其目标群体Ok的中心估计器如果存在σ∈R+,使得i′=1,2,…,Nk,那么,中心估计器被称作依误差容许值σ收敛的。如果σ=0,即那么中心估计器被称为渐进收敛的。
在进行目标中心估计器的收敛性分析时,由于各子系统采用的是形式相同的中心估计器,因此只需要对某一子系统及其相关目标群体进行分析即可。因此为了简洁,将子系统中智能体的数量记为n,其目标群体中目标的数量记为m,令智能体序号i=1,2,…,n,目标序号j=1,2,…,m,从而将中心估计器的表达式记为:
p ^ i ( t ) = φ i ( t ) + p ~ i ( t )
1 n Σ i = 1 n p ~ i ( t ) = 1 m Σ j = 1 m p j ( t ) - - - ( 5 )
φ · i ( t ) = α Σ d ∈ U i s i g ( p ^ d ( t ) - p ^ i ( t ) ) μ
根据本发明的应用实际情况可以确定以下两个假设:
假设1.多智能体系统中各子系统的拓扑结构是无向且联通的,并且各子系统的目标群体可以被该子系统完全探测。
假设2.对于目标群体,各个目标的速率是有界的,即目标的速度不会无限增大。
为了便于对收敛性进行分析,令:
e ( t ) = p ^ 1 ( t ) - p ‾ ( t ) p ^ 2 ( t ) - p ‾ ( t ) ... p ^ n ( t ) - p ‾ ( t ) T - - - ( 6 )
其中, p ‾ ( t ) = 1 m Σ j = 1 m p j ( t ) .
中心估计器的收敛性分析按下面步骤进行:
1)假定sup表示上确界,令β=max{D[epi(t)]|i=1,2,…,n}。首先证明存在γ(t)∈[-β,β],使得:
d d t | | e ( t ) | | 2 = Σ i = 1 n Σ g ∈ U i { | p ^ g ( t ) - p ^ i ( t ) | [ ( n - 1 ) γ ( t ) - α | p ^ g ( t ) - p ^ i ( t ) | μ ] } - - - ( 7 )
其中,Ui表示智能体si的邻域。
考虑到(5)式给出的中心估计器,可知因此
| | e ( t ) | | 2 = Σ i = 1 n [ p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) ] 2 - - - ( 8 )
从而有
d d t | | e ( t ) | | 2 = 2 Σ i = 1 n { [ p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) ] [ φ · i ( t ) + p ~ · i ( t ) - 1 n Σ l = 1 n p ^ · l ( t ) ] } - - - ( 9 )
由(5)可知
Σ i = 1 n { [ p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) ] φ · i ( t ) } = α Σ i = 1 n Σ g ∈ U i [ p ^ i ( t ) s i g ( p ^ g ( t ) - p ^ i ( t ) ) μ = - α 2 Σ i = 1 n Σ g ∈ U i | p ^ g ( t ) - p ^ i ( t ) | μ + 1 - - - ( 10 )
考虑到假设1,可以得到:
Σ i = 1 n { [ p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) ] p ~ · i ( t ) } ≤ β Σ i = 1 n | p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) | ≤ ( n - 1 ) βmax i , l = 1 n | p ^ i ( t ) - p ^ l ( t ) | ≤ ( n - 1 ) β 2 Σ i = 1 n Σ g ∈ U i | p ^ g ( t ) - p ^ i ( t ) | - - - ( 11 )
这说明存在一个γ(t)∈[-β,β],使得
Σ i = 1 n { [ p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) ] p ~ · i ( t ) } = ( n - 1 ) γ ( t ) 2 Σ i = 1 n Σ g ∈ U i | p ^ g ( t ) - p ^ i ( t ) | - - - ( 12 )
此外,显然有
Σ i = 1 n { [ p ^ i ( t ) - 1 n Σ l = 1 n p ^ l ( t ) ] [ - 1 n Σ l = 1 n p ^ · l ( t ) ] } = 0 - - - ( 13 )
综上,(7)式成立。
2)假定e(t)∈Rn,σ∈R+,V(t)=[||e(t)||22]2,且当||e(t)||<σ时有当||e(t)||>σ时有那么:(i)对于某个l>0,由V(t)≤l定义的集合Ωl是有界的;(ii)对Ωl中所有的e(t),有
(i)显然,只需说明(ii).由于
V · ( t ) = 2 [ | | e ( t ) | | 2 - σ 2 ] d d t [ | | e ( t ) | | 2 ] = 4 | | e ( t ) | | [ | | e ( t ) | | 2 - σ 2 ] d d t | | e ( t ) | | - - - ( 14 )
从而有(ii).
3)对于依误差容许值σ收敛的估计器如果σ1>σ,则必可在有限时间内依误差容许值σ1收敛。
假若不然,即对任意的T∈R+,总存在这里i∈{1,2,…,n}且i′∈{1,2,…,n},使得由于σ1>σ,因此相悖于 lim t → ∞ | p ^ i ( t ) - p ^ k ( t ) | ≤ σ , i,k=1,2,…,n。
4)对于任意给定的σ∈R+,可以找到α∈R+和μ∈R+,使得由(5)给出的中心估计器在有限时间内依误差容许值σ收敛。
由σ的任意性,只需证明由(5)给出的中心估计器依误差容许值σ收敛.显然,对于任意给定的σ∈R+,存在h∈{1,2,…},使得即便对于也可以令α=2(n-1)β及使得根据|·|μ在区间(0,+∞)的单调性以及(7)关于i=1,2,…,n,的对称性容易得出,对于任意给定的σ∈R+,可以找到α∈R+及μ∈R+,使得当||e(t)||<σ时,当||e(t)||>σ时,从而对于具有连续一阶偏导数的纯量函数V(t)=[||e(t)||22]2,第(2)步中的(i)和(ii)得以满足。于是由局部不变集原理,估计器的收敛性得以证明。
S104:控制器设计:
对于子系统中的各个智能体ski,在估计得到目标群体的中心后,根据以下控制协议即可得到该智能体ski的控制量uki(t),从而实现根据结构向量对目标的包围:
u k i ( t ) = q ^ · k i ( t ) - [ v k i ( t ) - q ^ k i ( t ) - ξ · k i ( t ) ] - [ x k i ( t ) - p ^ k i ( t ) - ξ k i ( t ) ] - - - ( 15 )
其中,在实际应用中,公式(15)中的导数都可以采用差分法来求得。
本发明中所针对的包围控制问题,包括两种任务:一是基于包围结构,利用父系统对移动目标实现包围,该包围结构是由任务驱动的;另一种是基于共型结构,利用子系统实现由父系统驱动的协调任务。由公式(15)所给出的控制协议,可以实现这两种任务的包围控制,接下来即对其进行证明。
欲证明满足(15)的控制协议可以实现对目标的包围,只需证明其满足同样地,为了简洁,只对某一子系统及其目标群体进行分析。将子系统中智能体的数量记为n,其目标群体中目标的数量记为m,令智能体序号i=1,2,…,n,目标序号j=1,2,…,m。将证明目标改写为通过构建一个李雅普诺夫函数,利用局部不变集原理可以得出上述结论。
定义 ζ i ( t ) = x i ( t ) - p ^ i ( t ) - ξ i ( t ) η i ( t ) = v i ( t ) - q ^ i ( t ) - ξ · i ( t ) . 假设定义一个具有连续一阶偏导数的纯量函数如下:
V ( t ) = 1 2 Σ i = 1 n [ ζ i ( t ) ] 2 + 1 2 Σ i = 1 n [ ζ i ( t ) + η i ( t ) ] 2 - - - ( 16 )
可以得到:
V · ( t ) = Σ i = 1 n [ ζ i ( t ) η i ( t ) ] - Σ i = 1 n { [ ζ i ( t ) + η i ( t ) ] [ ζ i ( t ) + ξ ·· i ( t ) ] } = - Σ i = 1 n [ ζ i ( t ) ] 2 - Σ i = 1 n { [ ζ i ( t ) + η i ( t ) ] ξ ·· i ( t ) } - - - ( 17 )
根据条件可得从而由局部不变集原理可知 lim t → ∞ [ x i ( t ) - p ^ i ( t ) - ξ i ( t ) ] = 0.
多组协调控制的第二个任务同样可以看作是依结构向量的包围控制问题,其中积极个体可以被看作目标。利用控制协议(15)亦可实现此时的协调控制任务。
假定子系统Ss为Sp的牵连系统,Ss的拓扑结构是无向且联通的。那么,对于Ss中的被动个体,若其对应的结构向量是积极个体对应结构向量的线性组合,则在忽略允许误差σ影响的情况下,Ss中牵连个体的包围控制也可以采用协议(15)实现。
为了便于描述,不妨将Ss中的积极个体看作目标Os,为此只需说明Ss和Os满足假设1、假设2、及积极个体对应结构向量的线性组合的二阶导数为零。
首先说明假设1被满足。由于Ss的拓扑结构是无向且联通的,则对任意一个积极个体si∈Os,其邻域Ui≠Φ。即Os可被Ss完全探测。
接下来考虑假设2。显然存在M1∈R,使得其中表示估计器的速率,np表示子系统Sp的智能体数量。又因为因此存在M2∈R,使得其中ξp(t)为Sp的包围结构。因此,存在M=M1+M2,使得M≥sup{|qj(t)||j∈J},其中J={j|sj∈Os}。
最后说明积极个体对应结构向量的线性组合的二阶导数为零,只需证明积极个体对应结构向量的二阶导数为零。事实上目前为止已经知道Ss和Os满足假设1和假设2,因此对于Os中的积极个体sj,其对应的结构向量记为ψj(t),则:
ψ j ( t ) = ξ j ( t ) - 1 m s Σ j = 1 m s ξ j ( t ) - - - ( 18 )
这里ms为积极个体数量,ξj(t)为sj在Sp中的结构向量,j∈J,其中J={j|sj∈Os}。由于显然
根据以上步骤和证明可知,本发明通过设计一种基于估计器的协调控制方法,从而实现了多组智能体系统的协调包围控制。为了说明本发明的技术效果,选用一个具有代表性的系统来进行仿真实验,本次仿真和检验都在Matlab和Simulink环境下进行的。
考虑具有8个个体的多智能体系统S,目的是监控由4个个体构成的目标群体,并将所获得的信息传给基站。图2是多组智能体系统协调控制示意图。如图2所示,智能体s1–s6的任务是包围并监控目标,而s5和s6将与s7和s8合作,形成天线阵,将信息传给基站。也就是说,本实施例中有两个子系统,一是由智能体s1–s6组成的侦查子系统,二是由智能体s5–s8组成的通信子系统。图3是多智能体系统的交流拓扑结构图。图4是智能体和目标之间的探测关系结构示意图。根据图3和图4,可以给出邻接矩阵A和探测矩阵B:
A = 0 1 0 0 0 1 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 1 0 1 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 B = 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 - - - ( 19 )
根据任务分配,多智能体系统分为两个子系统Sp={si|i=1,2,…,6}和Sc={s5,s6,s7,s8},其中,Sc是Sp的子系统,s5和s6是积极个体,而s7和s8是被动个体。对于Sp,选择适合完成包围-监控任务的包围结构ξp(t),如下式给出:
ξ p ( t ) = ( 3 , 0.1 π ) p ( 3 , 1.7 π ) p ( 3 , 1.3 π ) p ( 3 , 0.9 π ) p ( 3 , 0.5 π ) p + ( 0.25 + 0.15 t , 0.5 π + 0.4 ) p ( 3 , 0.5 π ) p + ( 0.25 + 0.15 t , 1.5 π + 0.4 ) p T - - - ( 20 )
显然,积极个体s5和s6属于Sp同时也属于Sc,因此它们具有两组结构向量:其一包括ξp5(t)和ξp6(t),将参与形成Sp的包围结构;第二组参与形成Sc的共型结构,记其为ξc1(t)和ξc2(t),其中被动个体s7和s8的结构向量记作ξc3(t)和ξc4(t),由于Sp和Sc具有继承关系,有ξc3(t)=3ξc1(t)和ξc4(t)=3ξc2(t)。
令目标群体中各个目标的运动轨迹满足以下公式:
p ( t ) = ( 7.5 + 0.14 t , + 0.5 + 0.06 t ) ( 7.5 + 0.14 t , - 0.5 + 0.06 t ) ( 6.5 + 0.14 t , - 0.5 + 0.06 t ) ( 6.5 + 0.14 t , + 0.5 + 0.06 t ) - - - ( 21 )
子系统Sp对4个目标构成的目标群体进行位置探测,各个智能体根据公式(2)至(4)建立中心估计器图5是子系统Sp中各智能体中心估计器的状态轨迹。子系统Sc对两个积极个体s5和s6进行位置探测,各个智能体根据公式(2)至(4)建立中心估计器图6是子系统Sc中各智能体中心估计器的状态轨迹。图5中表示Sp中第i个智能体的中心估计器,i=1,…,6,图6中表示Sc中第i′个智能体的中心估计器,i=1,…,4。根据式(21)采用可以计算得到子系统Sp的目标中心的实际运动轨迹。采用即可计算得到子系统Sc的目标中心的实际运动轨迹。这两条实际运动轨迹也分别在图5和图6中标示出来。根据图5和图6可知,在有限时间内收敛于目标中心亦可以实现在有限时间内收敛于目标中心可见本发明设计的中心估计器是有效的。
在仿真中,多智能体系统的初始状态为s(0)=0和v(0)=0。控制协议采用公式(15)。图7是智能体系统的三维曲线。图8是仿真结束时智能体和目标的相对位置。在图7和图8中,ο指的是目标或智能体的初始位置,·指的是终止位置。可以从图7看出,完成监控任务(在Sp中)的智能体个体从初始位置出发,形成并保持对目标群体的包围编队;完成通信任务的智能体(在Sc中)可以与子系统Sp合作,形成天线阵结构。在仿真结束时智能体系统和目标群体的相对位置关系如图8所示,展示了包围效果;此外,为了帮助理解Sc的包围结构,基站的位置和交流信号利用粗实线表示。可以从仿真结果看出所设计的控制协议具有良好的收敛性。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (1)

1.一种多智能体系统分组包围控制方法,其特征在于,包括以下步骤:
S1:多智能体系统根据具体任务划分子系统,记多智能体系统中各子系统中智能体的集合为Sk={ski|i=1,2,…,Nk},其中k=1,2,…,K,K表示子系统数量,Nk表示第k个子系统中的智能体数量,ski表示第k个子系统中的第i个智能体;根据包围控制的实际需要确定各个子系统中各个智能体的结构向量ξki(t);
S2:记第k个子系统的目标群体集合为Ok={okj|j=1,2,…,Mk},其中okj表示第k个子系统目标群体中的第j个目标,Mk表示第k个子系统目标群体中的目标数量;每个子系统分别对其包围的目标群体位置进行探测,获取各个目标在当前时刻t的位置pkj(t);
S3:子系统Sk中的智能体ski根据以下公式估计其目标群体Ok的中心
p ^ k i ( t ) = φ k i ( t ) + p ~ k i ( t )
1 N k Σ i = 1 N k p ~ k i ( t ) = 1 M k Σ j = 1 M k p k j ( t )
φ · k i ( t ) = α Σ d ∈ U k i s i g ( p ^ k d ( t ) - p ^ k i ( t ) ) μ
其中,φki(0)=0,α和μ为设置参数,满足α∈R+,μ∈R+,Uki表示智能体ski的邻域,函数sig(·)μ=sgn(·)|·|μ,sgn(·)为符号函数;
S4:子系统中的各个智能体ski根据以下公式得到其在当前时刻t的控制量uki(t):
u k i ( t ) = q ^ · k i ( t ) - [ v k i ( t ) - q ^ k i ( t ) - ξ · k i ( t ) ] - [ x k i ( t ) - p ^ k i ( t ) - ξ k i ( t ) ]
其中,xki(t)和vki(t)分别表示智能体ski在当前时刻t的位置和速度。
CN201610077870.8A 2016-02-03 2016-02-03 多智能体系统分组包围控制方法 Expired - Fee Related CN105589333B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610077870.8A CN105589333B (zh) 2016-02-03 2016-02-03 多智能体系统分组包围控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610077870.8A CN105589333B (zh) 2016-02-03 2016-02-03 多智能体系统分组包围控制方法

Publications (2)

Publication Number Publication Date
CN105589333A true CN105589333A (zh) 2016-05-18
CN105589333B CN105589333B (zh) 2018-09-07

Family

ID=55929004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610077870.8A Expired - Fee Related CN105589333B (zh) 2016-02-03 2016-02-03 多智能体系统分组包围控制方法

Country Status (1)

Country Link
CN (1) CN105589333B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502090A (zh) * 2016-09-29 2017-03-15 电子科技大学 一种三维空间中多智能体系统的定位及环绕控制方法
CN108181926A (zh) * 2017-12-28 2018-06-19 南京邮电大学 基于快速有限时间一致性协议的多智能体系统的编队方法
CN108427656A (zh) * 2018-01-03 2018-08-21 东南大学 一种基于矩阵加权一致性-卡尔曼滤波器的多目标包围控制方法
CN109031959A (zh) * 2018-10-26 2018-12-18 黑龙江大学 一种带有控制参数自适应补偿的非一致非线性系统协同控制方法及控制系统
CN109144047A (zh) * 2018-06-12 2019-01-04 南京理工大学 一种基于多智能体系统的有限时间编队控制方法
CN110084295A (zh) * 2019-04-19 2019-08-02 广东石油化工学院 一种多智能体系统分组包围控制方法及控制系统
CN111240332A (zh) * 2020-01-18 2020-06-05 湖南科技大学 一种复杂凸环境下群机器人协同作业的多目标围捕方法
CN111459161A (zh) * 2020-04-03 2020-07-28 北京理工大学 一种多机器人系统人为干预控制方法
CN111766783A (zh) * 2020-06-29 2020-10-13 北京航空航天大学 一种面向集群系统的有限时间内收敛的编队合围跟踪方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102215260A (zh) * 2011-06-02 2011-10-12 北京理工大学 一种具有连通性保持的多智能体系统协同控制方法
CN104181813A (zh) * 2014-06-11 2014-12-03 北京理工大学 具有连通性保持的拉格朗日系统自适应控制方法
CN104281053A (zh) * 2013-07-08 2015-01-14 哈尔滨点石仿真科技有限公司 一种解决通信时滞的多智能体协同控制方法
CN104865960A (zh) * 2015-04-29 2015-08-26 山东师范大学 基于平面的一种多智能体队形控制方法
CN105138006A (zh) * 2015-07-09 2015-12-09 哈尔滨工程大学 一种时滞非线性多智能体系统的协同追踪控制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102215260A (zh) * 2011-06-02 2011-10-12 北京理工大学 一种具有连通性保持的多智能体系统协同控制方法
CN104281053A (zh) * 2013-07-08 2015-01-14 哈尔滨点石仿真科技有限公司 一种解决通信时滞的多智能体协同控制方法
CN104181813A (zh) * 2014-06-11 2014-12-03 北京理工大学 具有连通性保持的拉格朗日系统自适应控制方法
CN104865960A (zh) * 2015-04-29 2015-08-26 山东师范大学 基于平面的一种多智能体队形控制方法
CN105138006A (zh) * 2015-07-09 2015-12-09 哈尔滨工程大学 一种时滞非线性多智能体系统的协同追踪控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宋永端: "Distributed Encirclement Control of Multi-agent Systems", 《PROCEEDINGS OF THE 33RD CHINESE CONTROL CONFERENCE》 *
魏婷婷: "多智能体系统协同包围目标控制算法的研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502090B (zh) * 2016-09-29 2019-03-01 电子科技大学 一种三维空间中多智能体系统的定位及环绕控制方法
CN106502090A (zh) * 2016-09-29 2017-03-15 电子科技大学 一种三维空间中多智能体系统的定位及环绕控制方法
CN108181926A (zh) * 2017-12-28 2018-06-19 南京邮电大学 基于快速有限时间一致性协议的多智能体系统的编队方法
CN108427656B (zh) * 2018-01-03 2021-06-08 东南大学 一种基于矩阵加权一致性-卡尔曼滤波器的多目标包围控制方法
CN108427656A (zh) * 2018-01-03 2018-08-21 东南大学 一种基于矩阵加权一致性-卡尔曼滤波器的多目标包围控制方法
CN109144047A (zh) * 2018-06-12 2019-01-04 南京理工大学 一种基于多智能体系统的有限时间编队控制方法
CN109144047B (zh) * 2018-06-12 2021-07-06 南京理工大学 一种基于多智能体系统的有限时间编队控制方法
CN109031959A (zh) * 2018-10-26 2018-12-18 黑龙江大学 一种带有控制参数自适应补偿的非一致非线性系统协同控制方法及控制系统
CN109031959B (zh) * 2018-10-26 2021-09-07 黑龙江大学 一种非一致非线性系统协同控制方法及控制系统
CN110084295A (zh) * 2019-04-19 2019-08-02 广东石油化工学院 一种多智能体系统分组包围控制方法及控制系统
CN111240332A (zh) * 2020-01-18 2020-06-05 湖南科技大学 一种复杂凸环境下群机器人协同作业的多目标围捕方法
CN111459161A (zh) * 2020-04-03 2020-07-28 北京理工大学 一种多机器人系统人为干预控制方法
CN111459161B (zh) * 2020-04-03 2021-07-06 北京理工大学 一种多机器人系统人为干预控制方法
CN111766783A (zh) * 2020-06-29 2020-10-13 北京航空航天大学 一种面向集群系统的有限时间内收敛的编队合围跟踪方法
CN111766783B (zh) * 2020-06-29 2021-08-24 北京航空航天大学 一种面向集群系统的有限时间内收敛的编队合围跟踪方法

Also Published As

Publication number Publication date
CN105589333B (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN105589333B (zh) 多智能体系统分组包围控制方法
Wen et al. Formation control with obstacle avoidance of second-order multi-agent systems under directed communication topology
Miao et al. Multi-objective region reaching control for a swarm of robots
Luo et al. Multisensor integration and fusion in intelligent systems
Castellanos et al. Robocentric map joining: Improving the consistency of EKF-SLAM
Lan et al. Distributed control of cooperative target enclosing based on reachability and invariance analysis
CN108896047B (zh) 分布式传感器网络协同融合与传感器位置修正方法
CN110658821B (zh) 一种多机器人抗干扰分组时变编队控制方法及系统
CN105068546B (zh) 一种卫星编队相对轨道自适应神经网络构形包含控制方法
CN106647771B (zh) 多移动机器人的最小步编队方法
CN106444701A (zh) 领导‑跟随型多智能体系统的有限时间鲁棒故障诊断设计方法
CN101650569B (zh) 三维空间中多运动体的寻迹编队控制方法
CN105635963A (zh) 多智能体分布式协同定位方法
CN112684709B (zh) 一种集群跟踪运动学建模方法、设备及存储介质
Bryson et al. Co-operative localisation and mapping for multiple UAVs in unknown environments
Wei et al. Distributed guidance law design for multi-UAV multi-direction attack based on reducing surrounding area
CN106502090B (zh) 一种三维空间中多智能体系统的定位及环绕控制方法
Li et al. Motion control of mobile under-actuated manipulators by implicit function using support vector machines
CN106127119A (zh) 基于彩色图像和深度图像多特征的联合数据关联方法
Yi et al. Neurodynamics-based leader-follower formation tracking of multiple nonholonomic vehicles
Zolghadr et al. Locating a two-wheeled robot using extended Kalman filter
CN112747752B (zh) 基于激光里程计的车辆定位方法、装置、设备和存储介质
Yang et al. Flocking shape analysis of multi-agent systems
Wang et al. The SLAM algorithm of mobile robot with omnidirectional vision based on EKF
Xu et al. Hunting problems of multi-quadrotor systems via bearing-based hybrid protocols with hierarchical network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180907

Termination date: 20210203