CN112311589B - 多智能体在Markov切换拓扑下的分组一致控制方法 - Google Patents

多智能体在Markov切换拓扑下的分组一致控制方法 Download PDF

Info

Publication number
CN112311589B
CN112311589B CN202010938427.1A CN202010938427A CN112311589B CN 112311589 B CN112311589 B CN 112311589B CN 202010938427 A CN202010938427 A CN 202010938427A CN 112311589 B CN112311589 B CN 112311589B
Authority
CN
China
Prior art keywords
agent
agents
state
group
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010938427.1A
Other languages
English (en)
Other versions
CN112311589A (zh
Inventor
纪良浩
史燕雪
杨莎莎
李华青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN202010938427.1A priority Critical patent/CN112311589B/zh
Publication of CN112311589A publication Critical patent/CN112311589A/zh
Application granted granted Critical
Publication of CN112311589B publication Critical patent/CN112311589B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明涉及多智能体系统控制领域,具体涉及一种多智能体在Markov切换拓扑下的分组一致控制方法,包括:确定系统在收敛一致过程中出现的子拓扑,计算子拓扑之间的概率转移矩阵;对智能体进行分组,设置智能体分组预期的收敛值,将拓扑中入度为零的智能体实施牵制;每个智能体向邻居发送自身的状态信息,邻居智能体对接收到的信息进行划分,得到相同组智能体和不同组智能体的状态信息;根据一致性控制协议分别对相同组智能体和不同组智能体的状态信息进行处理,得到该智能体与其邻居智能体的加权状态误差结果;将加权状态误差结果代入动态方程中对智能体状态进行更新,根据转移矩阵进行Markov切换拓扑,使系统达到分组一致。

Description

多智能体在Markov切换拓扑下的分组一致控制方法
技术领域
本发明涉及多智能体系统控制领域,具体涉及一种多智能体在Markov切换拓扑下的分组一致控制方法。
背景技术
近年来,专家学者受到自然界生物群集行为的启发将多智能体系统(multi-agentsystems,MASs)一致性应用于复杂系统协同控制中,多智能体系统一致性问题在群里控制、传感器网络、分布式计算、群体决策等领域有着重要的应用前景。多智能体系统分组一致性是指多智能体系统内部的同组智能体收敛一致,不同分组智能体达到不同的收敛值,分组一致性能更好解决复杂任务的并行处理。
在智能体之间传输信息的过程中,干扰、时延、丢包、链路故障等现象是不可避免的,这些故障现象会导致通信拓扑随时间变化。现有的多智能体系统在切换拓扑下实现一致性的方法主要有三类:
(1)一般切换拓扑,只要求联合拓扑结构含有有向生成树。通过智能体的邻居信息计算出平均值并作为控制输入进行状态更新,使系统最终达到平均一致。这种切换方式不考虑系统拓扑之间的转化概率,忽略了子拓扑之间的切换关系;
(2)伯努利切换拓扑,可以看成一个独立重复实验,并且切换到各个拓扑结构的概率都是固定不变,这种情况比较特殊,不符合现实复杂系统的需求;
(3)Markov切换拓扑,其具有无后效性,即未来的状态条件仅依赖于当前状态,与过去的状态无关。多智能体系统受各种环境因素影响系统的拓扑切换具有不确定性,因此,在当前拓扑状态下切换到其他拓扑状态的概率也是不同的。Markov切换方式更符合现实复杂系统的需求。
目前,对于多智能体协同控制的研究大多数基于同质多智能体系统,即系统内部所多有的智能体具有相同的动力学行为。同时对多智能体系统的拓扑要求较高,例如需要含有向生成树、入度平衡、强连通、对称等,这些特殊条件无法普遍适用于现实复杂的系统。在实际应用中,多智能体系统需要不同类型的智能体分工完成复杂工作,比如蜜蜂的分工建巢行为。此外,在同质多智能体系统中,单一的收敛值限制了系统的处理能力,无法实现多任务并行处理,工作效率低下。
对于复杂多智能体系统来说,通过系统内部的耦合作用很难达到一致性,通常需要外部的作用。与控制所有智能体相比较,通过牵制控制部分智能体系统可以达到指定的一致性状态,这种牵制控制方法不仅减少了工作量,而且降低了工作难度和控制成本。
上面提及的大多数研究工作都是基于单一的合作关系或者竞争关系,但现实有限的资源引发智能体间的竞争行为以及共同协作的合作行为,使得智能体间合作-竞争关系普遍存在复杂系统中,同时存在的合作-竞争关系更符合现实需求,例如:铁路系统。因此,一种具有合作-竞争关系的多智能体系统在Markov切换拓扑状态下如何实现牵制分组一致性,是一个亟待解决的问题。
发明内容
为了解决上述问题,本发明提供一种智能体在Markov切换拓扑下的分组一致控制方法。
一种多智能体在Markov切换拓扑下的分组一致控制方法,包括以下步骤:
S1、根据异质多智能体系统中智能体之间的信息交互,确定系统的拓扑结构以及系统在收敛一致的过程中出现的子拓扑,计算子拓扑结构之间状态转换的概率,得到子拓扑之间的概率转移矩阵;
S2、对异质多智能体系统中的智能体进行分组,将具有合作关系的智能体分为一组,将具有竞争关系的智能体分在不同组,设置每个智能体分组期望的收敛状态值,将由子拓扑结构组成的联合拓扑中入度为零的智能体实施牵制;
S3、每个智能体向邻居发送自身的状态信息,智能体在接收到邻居智能体的发送的信息后,根据邻居智能体所在的分组,对收到的信息进行划分,得到相同组智能体的状态信息和不同组智能体的状态信息;
异质多智能体系统由一阶智能体和二阶智能体组成,一阶智能体包含位置信息,二阶智能体包含位置信息和速度信息,第i个智能体的位置信息用xi(t)表示,速度信息用vi(t)表示,任意两个智能体之间存在合作关系或竞争关系,用(xj(t)-xi(t))表示第j个智能体和第i个智能体的合作关系,用(xj(t)+xi(t))表示第j个智能体和第i个智能体的竞争关系;
S4、设置一致性控制协议,每个智能体根据一致性控制协议分别对相同组智能体的状态信息和不同组智能体的状态信息进行处理,得到该智能体与其邻居智能体的加权状态误差结果;
S5、将加权状态误差结果代入动态方程中对智能体的状态进行更新,同时系统根据子拓扑之间的概率转移矩阵进行子拓扑间的切换;
S6、切换子拓扑结构后,将每个智能体分组的状态信息分别与对应智能体分组期望的收敛状态值作比较,若每个智能体分组的状态信息达到各自期望的收敛状态值时,则系统达到分组一致;若存在至少一个智能体分组的状态信息未达到各自期望的收敛状态值,则重复上述步骤S2-S5对智能体的状态进行迭代更新,直到每个智能体分组的状态信息达到各自期望的收敛状态值时,异质多智能体系统达到分组一致。
进一步的,将由子拓扑结构组成的联合拓扑中入度为零的智能体实施牵制,包括:系统拓扑中入度为零的智能体必须被牵制,其他智能体根据控制成本酌情增加牵制智能体的数量;系统拓扑中入度为零的智能体牵制方式是:
Figure BDA0002672764430000031
其中,di代表第i个智能体的牵制增益,xi(t)代表第i个智能体的位置信息,
Figure BDA0002672764430000032
代表第i个智能体所在分组的期望收敛状态值。
进一步的,对异质多智能体系统中的智能体进行分组包括:根据异质多智能体系统的系统拓扑对智能体进行分组,具有合作关系的分为同一组,将相互竞争的智能体分成不同组,即同组的智能体之间具有合作关系,不同组的智能体之间具有竞争关系;同组的智能体状态值趋于一致,不同组的智能体状态值趋于相反。
进一步的,所述一致性控制协议包括:
Figure BDA0002672764430000041
其中,ui(t)是第i个智能体的控制输入,α,β,γ表示系统的控制参数;NSi表示智能体i在同组内邻居智能体节点的集合,NDi智能体i在不同组内邻居智能体节点的集合,
Figure BDA0002672764430000042
表示智能体i与智能体j之间在第σ(t)拓扑连接权重;xj(t)表示智能体j的位置信息,xi(t)表示智能体i的位置信息;di表示牵制增益,如果智能体i被牵制,则di>0,否则di=0;xσi表示智能体i所在在分组的期望收敛状态值;vi(t)表示二阶智能体的速度信息,
Figure BDA0002672764430000043
分别表示一阶智能体集合和二阶智能体集合,且
Figure BDA0002672764430000044
Figure BDA0002672764430000045
表示所有智能体集合。
进一步的,所述动态方程包括:
Figure BDA0002672764430000046
其中,ui(t)表示智能体i在t时刻的控制输入,xi(t)表示智能体i的位置信息,
Figure BDA0002672764430000047
表示对xi(t)求导;vi(t)表示二阶智能体的速度信息,
Figure BDA0002672764430000048
表示对vi(t)求导;
Figure BDA0002672764430000049
表示所有智能体集合,
Figure BDA00026727644300000410
表示一阶智能体集合,
Figure BDA00026727644300000411
表示二阶智能体集合,且
Figure BDA00026727644300000412
本发明的有益效果:
1、本发明的异质多智能体系统中包括合作-竞争关系的多智能体,根据异质多智能体系统中智能体之间的竞争合作关系将智能体分为两个组,每个分组是异质的,即每个分组包括一阶和二阶智能体,这种竞争合作的内部关系相比于单一的合作关系或者竞争关系,更符合现实复杂系统的内部关系,最终使同组智能体收敛到相同值,不同组智能体收敛值相反。
2、本发明的多智能体系统是具有Markov切换拓扑的时变系统,Markov切换是目前最贴近实际系统的切换方法,相比于固定拓扑,Markov切换拓扑能更好的检测系统的鲁棒性。
3、本发明使用的牵制控制办法,通过牵制部分智能体,使系统收敛到期望值,这不但降低了控制成本,还减少了工作量。
4、本发明研究是一般拓扑结构,可以包含孤立节点或者连通分支,释放了一些对系统拓扑的严苛要求条件,系统适用性很广泛。
附图说明
下面结合附图和具体实施方式对本发明做进一步详细的说明。
图1为本发明实施例的系统控制流程图;
图2为本发明实施例的系统收敛过程中可能出现的拓扑图;
图3为本发明实施例的智能体位置演变图;
图4为本发明实施例的智能体速度演变图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所指的“多智能体系统”、“系统”均为异质多智能体系统,异质多智能体系统中包括一阶智能体和二阶智能体,一阶智能体的状态值包含位置信息,二阶智能体的状态值包含位置信息和速度信息。
本发明所指的异质多智能体系统中的拓扑结构没有严苛的约束条件,有孤立节点(一个节点表示一个智能体),也有连通分支。
如图1所示,一种智能体在Markov切换拓扑下的分组一致控制方法,该方法包括但不限于如下步骤:
S1、根据异质多智能体系统中的智能体之间的信息交互,确定系统的拓扑结构,并利用图论知识描述异质多智能体系统的拓扑关系;确定系统在收敛一致的过程中可能出现的子拓扑结构,计算子拓扑结构之间状态转换的概率,得到子拓扑之间的概率转移矩阵。
在异质多智能体系统中,子拓扑结构的切换方式服从Markov切换,且各个拓扑状态切换到其他状态的概率均不相同。所述Markov切换具有无后效性,下一步切换到的未来状态只与当前状态有关,与过去的状态无关,这种切换方法更加符合现实系统的拓扑变化。
利用随机过程中的连续时间马尔科夫链的相关知识对系统的子拓扑间切换进行分析,计算子拓扑结构之间状态转换的概率;
pij(h)为概率转移矩阵P∈Rs×s中的其中一个元素,表示从子拓扑i(状态i)切换到子拓扑j(状态j)的转移概率,计算表达式为:
Figure BDA0002672764430000061
其中,pij(h)表示状态i到状态j的状态转移概率,σ(t)是连续时间齐次马尔可夫链,表示t时刻系统目前所在的拓扑状态,例如σ(t+h)=j表示t+h时刻系统所在的拓扑状态是第j个拓扑,σ(t)=i表示t时刻系统所在的拓扑状态是第i个拓扑;πij表示拓扑状态i到拓扑状态j转移速率,且πii=-∑i≠jπij,i≠j,h是表示停留在当前拓扑的停留时间,o(h)表示h的高阶无穷小,i,j代表拓扑状态值,S={1,2,…,s}代表切换拓扑集合,又可称作子拓扑的集合,即表示一个智能体系统在收敛过程中有s个子拓扑。
S2、对异质多智能体系统中的智能体进行分组,将具有合作关系的智能体分为一组,将具有竞争关系的智能体分在不同组。为系统中的智能体分组设置期望的收敛状态值
Figure BDA0002672764430000062
将由子拓扑结构组成的联合拓扑中入度为零的智能体实施牵制,实施牵制就是控制智能体系统中的某些智能体,使系统中所有的智能体都达到期望的状态值。系统拓扑中入度为零的智能体必须被牵制,因为系统中入度为零的智能体接收不到其他智能体的信息,但它可以给其他智能体传递信息或者说它可以影响其他智能体,所以通过牵制这些入度为零的智能体,让这些智能体影响其他智能体,最终使所有的智能体趋向指定的状态。除了牵制系统中所有入度为零的智能体外,其他智能体根据控制成本酌情增加牵制智能体的数量。
在一个实施例中,智能体在异质多智能体系统内的分组方法包括:根据异质多智能体系统的系统拓扑对智能体进行分组,具有合作关系的智能体分为同一组,将相互竞争的智能体分到不同组,即同组的智能体之间具有合作关系,不同组的智能体之间具有竞争关系;同组的智能体状态值趋于一致,不同组的智能体状态值趋于相反。
在一个实施例中,系统拓扑中入度为零的智能体牵制方式是di(xi(t)-xi),其中di代表第i个智能体的牵制增益,xi(t)表示智能体i的位置信息,xσi代表第i个智能体所在分组的期望收敛状态值。
S3、每个智能体向邻居发送自身的状态信息,智能体在接收到邻居智能体的发送的信息后,根据邻居智能体所在的分组,对收到的信息进行划分,得到相同组智能体的状态信息和不同组智能体的状态信息。
S4、设置一致性控制协议,每个智能体根据一致性控制协议分别对相同组智能体的状态信息和不同组智能体的状态信息进行处理,处理的过程包括:对同组的智能体按照合作关系xj(t)-xi(t),对不同组的邻居智能体按照竞争关系xj(t)+xi(t)进行控制输入的计算,例如对于第i个智能体,如果具有通信关系的智能体j是智能体i同组或者具有合作关系,则将它们的位置信息相减;如果具有通信关系的智能体j是智能体i不同组或者具有竞争关系,则将它们的位置信息相加。最终得到发送智能体和接受的加权状态误差结果,加权状态误差结果包括位置误差、速度和牵制误差。
所述一致性控制协议包括:
Figure BDA0002672764430000081
其中,ui(t)是第i个智能体的控制输入,α,β,γ表示系统的控制参数;NSi表示智能体i在同组内邻居智能体节点的集合,NDi智能体i在不同组内邻居智能体节点的集合,
Figure BDA0002672764430000082
表示智能体i与智能体j之间在第σ(t)拓扑连接权重;xj(t)表示智能体j的位置信息,xi(t)表示智能体i的位置信息;di表示牵制增益,如果智能体i被牵制,则di>0,否则di=0;
Figure BDA0002672764430000083
表示智能体i所在在分组的期望收敛状态值;vi(t)表示二阶智能体的速度信息,
Figure BDA0002672764430000084
分别表示一阶智能体集合和二阶智能体集合,且
Figure BDA0002672764430000085
Figure BDA0002672764430000086
表示所有智能体集合。
S5、将加权状态误差结果代入动态方程中对系统内的智能体状态进行更新,同时系统根据子拓扑之间的概率转移矩阵进行子拓扑间的切换,系统在进行子拓扑结构切换时,由于每个子拓扑结构不同,所以每个节点在不同的子拓扑中邻居节点也不相同。
所述动态方程为:
Figure BDA0002672764430000087
其中,ui(t)表示智能体i在t时刻的控制输入,xi(t)表示智能体i的位置信息
Figure BDA0002672764430000088
表示对xi(t)求导,vi(t)表示二阶智能体的速度信息,
Figure BDA0002672764430000089
表示对vi(t)求导,
Figure BDA00026727644300000810
表示所有智能体集合,
Figure BDA00026727644300000811
表示一阶智能体集合,
Figure BDA00026727644300000812
表示二阶智能体集合,且
Figure BDA00026727644300000813
S6、切换子拓扑结构后,将每个智能体分组的状态信息分别与对应智能体分组期望的收敛状态值作比较,若每个智能体分组的状态信息达到各自期望的收敛状态值时,则系统达到分组一致;若存在至少一个智能体分组的状态信息未达到各自期望的收敛状态值,则重复上述步骤S2-S5对智能体的状态进行迭代更新,直到每个智能体分组的状态信息达到各自期望的收敛状态值时,异质多智能体系统达到分组一致。
本发明中,当异质多智能体系统满足以下两个条件时,系统中所有的智能体达到牵制分组一致,系统的分组一致性保证了系统内不同分组的智能体收敛到不同的一致性状态值,相同分组中的的智能体收敛到相同的一致性状态值。
条件一:系统内同组智能体的位置信息达到牵制期望的收敛状态值;
条件二:二阶智能体的速度相同。
智能体达到牵制分组一致的表达式如下所示:
Figure BDA0002672764430000091
其中,E[|*|2]表示*的均方,xi(t)代表第i个智能体的位置信息,σi为智能体i所在的分组,xσi为智能体i所在分组的期望收敛状态值,vi(t)表示二阶智能体的速度信息,
Figure BDA0002672764430000092
分别表示一阶智能体集合和二阶智能体集合,
Figure BDA0002672764430000093
是表示所有智能体的集合,且
Figure BDA0002672764430000094
本实施例考虑一个由m+n个智能体组成的多智能体系统,其中m个智能体为一阶智能体,其余n个智能体为二阶智能体。多智能体系统的关系拓扑可以用一个有向加权图G=(V,E,A)表示,每个智能体作为无向加权图G=(V,E,A)的一个节点,其中V={v1,v2,…,vm+n}中表示节点的集合,
Figure BDA0002672764430000095
表示边的集合,A=[aij]表示邻接矩阵,其中矩阵元素aij表示智能体节点i到j的连接权重。若节点i与节点j之间存在连接,即eij=(vj,vi),则aij>0;若节点i与节点j之间无连接,则aij=0。规定aij=0即系统无自环,与节点i相连的节点为节点i的邻居节点,节点i的邻居节点用集合Ni={vj∈V|(vj,vi)∈E}表示。系统节点的入度矩阵为
Figure BDA0002672764430000096
其中节点vi入度表示为
Figure BDA0002672764430000097
Figure BDA0002672764430000098
系统拓扑的拉普拉斯矩阵为
Figure BDA0002672764430000099
其中lij=-aij,i≠j,lii=∑i≠jaij
为了确保本发明满足了异质多智能体系统的牵制分组一致性条件,下面对其进行证明,包括:
定义智能体位置误差:
Figure BDA0002672764430000101
其中xi(t)是第i个智能体的位置信息,
Figure BDA0002672764430000102
是它所在分组的期望的收敛值。如果ei(t)趋近于0,即表示各个分组可以收敛到一致。
定义误差矩阵:ei(t)=(e1(t)T,e2(t)T,、、、,em+n(t)T)T
得到误差系统:
Figure BDA0002672764430000103
其中,
Figure BDA0002672764430000104
对误差ei(t)求导,α为耦合系数,NSi表示智能体i在同组内邻居智能体节点的集合,NDi智能体i在不同组内邻居智能体节点的集合,
Figure BDA0002672764430000105
是代表当前第σ(t)个拓扑拉普拉斯矩阵的元素,di为牵制增益。
定义矩阵
Figure BDA0002672764430000106
其中,Γ(t)表示系统拓扑关系的误差矩阵,
Figure BDA0002672764430000107
为第一组中的一阶智能体的误差矩阵,
Figure BDA0002672764430000108
为第一组中的二阶智能体的误差矩阵,
Figure BDA0002672764430000109
为第一组中的二阶智能体的速度矩阵,
Figure BDA00026727644300001010
为第二组中的一阶智能体的误差矩阵,
Figure BDA00026727644300001011
为第二组中的二阶智能体的误差矩阵,
Figure BDA00026727644300001012
为第二组中的二阶智能体的速度矩阵。
根据面前的控制协议经过矩阵的基本运算,不难得出如下的矩阵关系:
Figure BDA00026727644300001013
Figure BDA00026727644300001014
其中,
Figure BDA00026727644300001015
对Γ(t)求导,Θσ(t)是由误差系统推倒出来的误差关系矩阵,
Figure BDA00026727644300001016
表示第一组和第二组中的一阶智能体的关系,
Figure BDA0002672764430000111
表示第一组中一阶智能体和第二组中的二阶智能体之间的关系,
Figure BDA0002672764430000112
表示第一组中二阶智能体和第二组中的一阶智能体之间的关系,
Figure BDA0002672764430000113
表示第一组中二阶智能体和第二组中的二阶智能体之间的关系。
构造李雅普诺夫函数V(t):
Figure BDA0002672764430000114
Figure BDA0002672764430000115
其中,Vi(t)表示t时刻第i个系统拓扑的李雅普诺夫函数,s表示系统在收敛过程中能够出现的子拓扑个数,E[Γ]表示求Γ的期望,Γ(t)T表示求Γ(t)的转置,S表示系统在收敛过程中能够出现的子拓扑集合,
Figure BDA0002672764430000116
表示求V(t)的导数,
Figure BDA0002672764430000117
表示对Vi(t)求导,πij表示拓扑状态i到拓扑状态j转移速率,Vj表示第j个拓扑的李雅普诺夫函数,Θi表示第i个拓扑的误差系统推倒出来的误差关系矩阵,Θun是所有子拓扑结构Θσ(t)的并集。
根据M矩阵的性质,不难发现Θun是正定矩阵,即Θun>0,可以推出
Figure BDA0002672764430000118
根据李雅普诺夫稳定性定理,可以得出系统最终会收敛一致。
证明过程结束。
为了验证提出的合作-竞争牵制二分组一致性算法的效果,运用matlab进行仿真验证。本实施例以图2为实验拓扑图,一个由8个节点组成的异构多智能体系统,系统节点由一阶节点和二阶节点组成,其中节点1、节点2、节点3和节点4为一阶节点,节点5、节点6、节点7、节点8为二阶节点。将系统中的所有智能体分为两组,第一组智能体包括节点1、节点2、节点7、节点8,第二组智能体包括节点3、节点4、节点5、节点6。系统在收敛过程中会出现3个不同的子拓扑,由于系统和每个分组都异质的,且子拓扑结构中含有孤立节点,因此,系统拓扑更一般化。
关于系统中的参数值,选择α=1.1,β=0.7,γ=1.8,aij=1,i≠j;随机生成8个智能体的初始位置状态x(0)=(8,-4,5.5,7,6,-5.5,2,-3)T和二阶智能体的初始速度状态v(0)=(2.9,3.5,4,1)T;设置第一组智能体的预期收敛状态值
Figure BDA0002672764430000121
如果系统实现牵制分组一致性,则第一组智能体和第二组智能体分别收敛到5和-5。
状态转移速率矩阵为:
Figure BDA0002672764430000122
在本说明书的描述中,所述一个节点表示一个智能体,一阶节点表示一阶智能体,二阶节点表示二阶智能体。
仿真实验根据切换的时间步长来计算转移概率。为实现公平性,用一个等概率函数来选取0时刻的拓扑状态,然后根据转移速率矩阵和切换步长计算出的概率转移矩阵进行随机切换,来实现拓扑切换。
从仿真结果可以得出,如图3所示展示了所有智能体的位置演化过程。牵制入度为零的2、7、8智能体,不难发现1、2、7、8组智能体位置趋于期望收敛值5。相反的,它的竞争组3、4、5、6智能体趋于相反的收敛值-5。实现了同组智能体趋于一致,不同组趋于相反的收敛值,符合实现了合作-竞争的内部关系。
如图4所示展示了二阶智能体速度的演化过程。不难发现,二阶智能体5、6、7、8的速度趋于0,在每次的运行过程中,图示曲线略有细微不同,因为实验模拟的是Markov切换拓扑,具有的随机过程的分析,但即便是这样,结果系统依然实现了一致性。
经过仿真实验的验证,根据合作-竞争一致性控制协议,可以使系统中同组的智能体状态趋于一致,不同组的智能体状态趋于相反,在牵制2、7、8智能体的情况下,实现了Markov切换拓扑下多智能体系统的二分组一致性。
需要说明的是,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-0nly Memory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
以上所述仅是本申请的具体实施方式,应当指出,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种多智能体在Markov切换拓扑下的分组一致控制方法,其特征在于,包括以下步骤:
S1、根据异质多智能体系统中智能体之间的信息交互,确定系统的拓扑结构以及系统在收敛一致的过程中出现的子拓扑,计算子拓扑结构之间状态转换的概率,得到子拓扑之间的概率转移矩阵;
S2、对异质多智能体系统中的智能体进行分组,设置每个智能体分组期望的收敛状态值,将由子拓扑结构组成的联合拓扑中入度为零的智能体实施牵制;
S3、每个智能体向邻居发送自身的状态信息,智能体在接收到邻居智能体的发送的信息后,根据邻居智能体所在的分组,对收到的信息进行划分,得到相同组智能体的状态信息和不同组智能体的状态信息;
异质多智能体系统由一阶智能体和二阶智能体组成,一阶智能体包含位置信息,二阶智能体包含位置信息和速度信息,第i个智能体的位置信息用xi(t)表示,速度信息用vi(t)表示,任意两个智能体之间存在合作关系或竞争关系,用(xj(t)-xi(t))表示第j个智能体和第i个智能体的合作关系,用(xj(t)+xi(t))表示第j个智能体和第i个智能体的竞争关系;
S4、设置一致性控制协议,每个智能体根据一致性控制协议分别对相同组智能体的状态信息和不同组智能体的状态信息进行处理,得到该智能体与其邻居智能体的加权状态误差结果;
S5、将加权状态误差结果代入动态方程中对智能体的状态进行更新,同时系统根据子拓扑之间的概率转移矩阵进行子拓扑间的切换;
S6、切换子拓扑结构后,将每个智能体分组的状态信息分别与对应智能体分组期望的收敛状态值作比较,若每个智能体分组的状态信息达到各自期望的收敛状态值时,则系统达到分组一致;若存在至少一个智能体分组的状态信息未达到各自期望的收敛状态值,则重复上述步骤S2-S5对智能体的状态进行迭代更新,直到每个智能体分组的状态信息达到各自期望的收敛状态值时,异质多智能体系统达到分组一致。
2.根据权利要求1所述的一种多智能体在Markov切换拓扑下的分组一致控制方法,其特征在于,将由子拓扑结构组成的联合拓扑中入度为零的智能体实施牵制包括:系统拓扑中入度为零的智能体必须被牵制;
系统拓扑中入度为零的智能体牵制方式包括:
Figure FDA0002672764420000021
其中,di代表第i个智能体的牵制增益,xi(t)代表第i个智能体的位置信息,
Figure FDA0002672764420000022
代表第i个智能体所在分组的期望收敛状态值。
3.根据权利要求1所述的一种多智能体在Markov切换拓扑下的分组一致控制方法,其特征在于,对异质多智能体系统中的智能体进行分组包括:根据异质多智能体系统的系统拓扑对智能体进行分组,具有合作关系的分为同一组,将相互竞争的智能体分成不同组,即同组的智能体之间具有合作关系,不同组的智能体之间具有竞争关系;同组的智能体状态值趋于一致,不同组的智能体状态值趋于相反。
4.根据权利要求1所述的一种多智能体在Markov切换拓扑下的分组一致控制方法,其特征在于,所述一致性控制协议包括:
Figure FDA0002672764420000023
其中,ui(t)是第i个智能体的控制输入,α,β,γ表示系统的控制参数;NSi表示智能体i在同组内邻居智能体节点的集合,NDi表示智能体i在不同组内邻居智能体节点的集合,
Figure FDA0002672764420000024
表示智能体i与智能体j之间在第σ(t)拓扑连接权重;xj(t)表示智能体j的位置信息,xi(t)表示智能体i的位置信息;di表示牵制增益,如果智能体i被牵制,则di>0,否则di=0;
Figure FDA0002672764420000025
表示智能体i所在分组的期望收敛状态值;vi(t)表示二阶智能体的速度信息,ζ1、ζ2分别表示一阶智能体集合和二阶智能体集合,且ζ1∪ζ2=ζ,
Figure FDA0002672764420000035
ζ表示所有智能体集合。
5.根据权利要求1所述的一种多智能体在Markov切换拓扑下的分组一致控制方法,其特征在于,所述动态方程包括:
Figure FDA0002672764420000031
其中,ui(t)表示智能体i在t时刻的控制输入,xi(t)表示智能体i的位置信息,
Figure FDA0002672764420000032
表示对xi(t)求导;vi(t)表示二阶智能体的速度信息,
Figure FDA0002672764420000033
表示对vi(t)求导;ζ表示所有智能体集合,ζ1表示一阶智能体集合,ζ2表示二阶智能体集合,且ζ=ζ1∪ζ2
Figure FDA0002672764420000034
CN202010938427.1A 2020-09-09 2020-09-09 多智能体在Markov切换拓扑下的分组一致控制方法 Active CN112311589B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010938427.1A CN112311589B (zh) 2020-09-09 2020-09-09 多智能体在Markov切换拓扑下的分组一致控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010938427.1A CN112311589B (zh) 2020-09-09 2020-09-09 多智能体在Markov切换拓扑下的分组一致控制方法

Publications (2)

Publication Number Publication Date
CN112311589A CN112311589A (zh) 2021-02-02
CN112311589B true CN112311589B (zh) 2022-04-05

Family

ID=74483778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010938427.1A Active CN112311589B (zh) 2020-09-09 2020-09-09 多智能体在Markov切换拓扑下的分组一致控制方法

Country Status (1)

Country Link
CN (1) CN112311589B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114115157B (zh) * 2021-11-26 2024-03-08 厦门大学 针对智能体集群不确定丢包的优化控制方法、系统和装置
CN114371617A (zh) * 2021-12-13 2022-04-19 重庆邮电大学 基于脉冲控制的具有切换拓扑结构的多智能体系统的分组一致性控制方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107728471A (zh) * 2017-09-01 2018-02-23 南京理工大学 针对一类混合异质多智能体系统的分组一致性控制方法
CN108803349A (zh) * 2018-08-13 2018-11-13 中国地质大学(武汉) 非线性多智能体系统的最优一致性控制方法及系统
CN110308659A (zh) * 2019-08-05 2019-10-08 沈阳航空航天大学 具有时延和切换拓扑的不确定多智能体系统混合触发一致的控制方法
CN110376889A (zh) * 2019-07-12 2019-10-25 哈尔滨理工大学 具有时变时滞的异构网络化多智能体系统分组一致的方法
CN110442022A (zh) * 2019-07-19 2019-11-12 中国工程物理研究院计算机应用研究所 带有时滞异构多智能体系统的分组一致性控制方法
EP3605334A1 (en) * 2018-07-31 2020-02-05 Prowler.io Limited Incentive control for multi-agent systems
CN111240199A (zh) * 2020-01-15 2020-06-05 中国科学技术大学 马尔科夫切换拓扑条件下的二分同步性控制方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107728471A (zh) * 2017-09-01 2018-02-23 南京理工大学 针对一类混合异质多智能体系统的分组一致性控制方法
EP3605334A1 (en) * 2018-07-31 2020-02-05 Prowler.io Limited Incentive control for multi-agent systems
CN108803349A (zh) * 2018-08-13 2018-11-13 中国地质大学(武汉) 非线性多智能体系统的最优一致性控制方法及系统
CN110376889A (zh) * 2019-07-12 2019-10-25 哈尔滨理工大学 具有时变时滞的异构网络化多智能体系统分组一致的方法
CN110442022A (zh) * 2019-07-19 2019-11-12 中国工程物理研究院计算机应用研究所 带有时滞异构多智能体系统的分组一致性控制方法
CN110308659A (zh) * 2019-08-05 2019-10-08 沈阳航空航天大学 具有时延和切换拓扑的不确定多智能体系统混合触发一致的控制方法
CN111240199A (zh) * 2020-01-15 2020-06-05 中国科学技术大学 马尔科夫切换拓扑条件下的二分同步性控制方法及系统

Also Published As

Publication number Publication date
CN112311589A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
Tang et al. Leader-following consensus of a class of stochastic delayed multi-agent systems with partial mixed impulses
An et al. Group consensus control for networked multi-agent systems with communication delays
CN112311589B (zh) 多智能体在Markov切换拓扑下的分组一致控制方法
Jiang et al. Couple-group consensus for discrete-time heterogeneous multiagent systems with cooperative–competitive interactions and time delays
Huang et al. Distributed consensus for multiple Euler-Lagrange systems: An event-triggered approach
CN111781822B (zh) 一种多智能体系统的隐私保护分组一致性控制方法
Dai et al. Event-based consensus for second-order multi-agent systems with actuator saturation under fixed and Markovian switching topologies
CN109818792B (zh) 一种基于二阶线性系统时变耦合复杂动态网络模型的控制器
CN114851198B (zh) 一种多单连杆式机械臂的一致跟踪固定时间稳定控制方法
Cheng et al. Sampled-data scaled group consensus for second-order multi-agent systems with switching topologies and random link failures
US20230393558A1 (en) Control method for consensus of agricultural multi-agent system based on sampled data
Yu et al. Group consensus for a class of heterogeneous multi-agent networks in the competition systems
Dai et al. Event-triggered exponential synchronization of complex dynamical networks with cooperatively directed spanning tree topology
Liu et al. Observability of heterogeneous multi-agent systems
CN116794987A (zh) 基于事件触发控制的异构多智能体系统一致性控制方法
Li et al. Adaptive event-triggered group consensus of multi-agent systems with non-identical nonlinear dynamics
Yang et al. Optimal information propagation in sensor networks
CN109634138A (zh) 基于图上信号粗化的多智能体系统一致性方法
Ji et al. Distributed economic dispatch algorithm in smart grid based on event-triggered and fixed-time consensus methods
CN114594760A (zh) 一种基于动态事件触发的多无人船航向一致性控制方法
CN113867150A (zh) 一种具有饱和输入的多智能体的事件驱动控制方法
Mahmoud et al. Consensus in multi-agent systems over time-varying networks
Cao et al. Iterative learning control for impulsive multi-agent systems with varying trial lengths
CN112925197A (zh) 基于有限时间的多智能体系统二分一致跟踪方法
Gao et al. Neural network-based cooperative identification for a class of unknown nonlinear systems via event-triggered communication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant