CN113722653A - 一种多智能体系统分布式优化控制方法及存储介质 - Google Patents

一种多智能体系统分布式优化控制方法及存储介质 Download PDF

Info

Publication number
CN113722653A
CN113722653A CN202110982285.3A CN202110982285A CN113722653A CN 113722653 A CN113722653 A CN 113722653A CN 202110982285 A CN202110982285 A CN 202110982285A CN 113722653 A CN113722653 A CN 113722653A
Authority
CN
China
Prior art keywords
agent
iteration
agents
function
updating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110982285.3A
Other languages
English (en)
Other versions
CN113722653B (zh
Inventor
姜晓伟
曹爽
张斌
李刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202110982285.3A priority Critical patent/CN113722653B/zh
Publication of CN113722653A publication Critical patent/CN113722653A/zh
Application granted granted Critical
Publication of CN113722653B publication Critical patent/CN113722653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种多智能体系统分布式优化控制方法存储介质,本方法使用分布式交替方向乘子法优化框架,该算法拥有优秀的迭代速度,同时具有很强的鲁棒性与普适性,通信门限函数
Figure DDA0003229395380000011
的设计,规定智能体只有当本地信息更新足够有效时才能进行通信,保证了通信的高效性,大幅度减少系统优化所消耗的通信资源,对其迭代次数的设定也对系统降低通信损耗的能力有影响。自适应惩罚函数
Figure DDA0003229395380000012
的设计,根据智能体状态值的不同,具体设计了智能体在每次迭代中的惩罚项,能够保证系统的收敛速度,使系统每次迭代都具有足够的有效性,对其最大迭代次数kmax2的设置会对系统的收敛速度产生影响。

Description

一种多智能体系统分布式优化控制方法及存储介质
技术领域
本发明涉及技术领域,具体涉及一种多智能体系统分布式优化控制方法及存储介质。
背景技术
现有技术中提高多智能体的网络系统性能的分布式交替方向乘子算法,通过整合很多经典优化思路,例如梯度下降法,原始对偶算法等等,结合现代统计学习遇到的问题,提出了比较好实施的分布式计算框架,从原始对偶算子的角度出发,核心为原始对偶算法的增广拉格朗日法,能够解决特定形式的有约束凸优化问题。框架能够解决很多的优化问题,也拥有不错的收敛速率,但通信问题无法解决,没有考虑限制通信的条件,导致系统达到一致性的同时会产生很多的通信损耗,制约网络系统的进一步发展。
还有一种针对无中心网络系统的优化算法,基于分布式交替方向乘子算法框架,进一步考虑了通信问题,从通信问题中降低通信次数的方面出发,设计了通信审查方法,采用审查的方式,避免了系统中许多不必要的通信,达到了降低网络系统通信损耗的目的。但审查方式会加大网络系统计算量,同时在网络系统收敛后期,会出现许多无效的通信,或是通信次数过少,会影响网络系统的收敛速度,达到一致性的时间变慢,同样也影响了多智能体的网络系统性能。
发明内容
本发明解决的一个主要问题是多智能体网络系统通信损耗大,导致网络系统总体性能较较差的问题。
根据本发明的一个方面,本发明提供一种多智能体系统分布式优化控制方法,包括:
初始化所述多智能体系统的本地状态量;
初始化后的所述多智能体系统中的智能体迭代更新本地变量信息,迭代更新规则为:
Figure BDA0003229395360000021
其中,k代表迭代次数,
Figure BDA0003229395360000022
为函数fi(xi)取得最小值时状态值xi的取值,
Figure BDA0003229395360000023
为第k次迭代时智能体i本地数据原始变量信息,且
Figure BDA0003229395360000024
i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,
Figure BDA0003229395360000025
表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,
Figure BDA0003229395360000026
表示智能体对自身设置的惩罚项系数,
Figure BDA0003229395360000027
为第k-1次迭代时的对偶变量,通过迭代更新得到状态值xi;
迭代过程中,根据不同的所述智能体之间原始变量的误差,利用第一公式更新所述惩罚项系数,所述第一公式为:
Figure BDA0003229395360000028
其中,kmax2为惩罚项最大更新次数,惩罚函数变量
Figure BDA0003229395360000029
c0为惩罚项初始设定值,
Figure BDA00032293953600000210
为智能体i对自身设置的惩罚项系数,
Figure BDA00032293953600000211
为智能体i对邻居j设置的惩罚项系数,
Figure BDA00032293953600000212
为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数,且
Figure BDA00032293953600000213
其中,
Figure BDA00032293953600000214
为第k次迭代时智能体i的误差函数值,
Figure BDA00032293953600000215
为第k次迭代时智能体j的误差函数值,
Figure BDA00032293953600000216
为第k次迭代时智能体j的本地数据原始变量信息;
在迭代过程中,根据原始变量状态值,利用第二公式更新门限函数,所述第二公式为:
Figure BDA0003229395360000031
其中
Figure BDA0003229395360000032
Figure BDA0003229395360000033
为智能体i第k-1次的通信变量,用于记录通信后本地的原始变量值,τk是人为设定的随更新次数递减的序列,kmaxl为通信门限函数的最大更新次数。
根据所述门限函数,确认所述智能体是否能通信,若能通信,则所述智能体间交换信息,且更新
Figure BDA0003229395360000034
其中
Figure BDA0003229395360000035
为智能体i存储的通信变量,若智能体不能通信,则更新
Figure BDA0003229395360000036
利用第三公式迭代更新所述对偶变量,所述第三公式为:
Figure BDA0003229395360000037
其中,
Figure BDA0003229395360000038
为第k次迭代时的对偶变量,
Figure BDA0003229395360000039
为第k次迭代时对自身设置的惩罚项,
Figure BDA00032293953600000310
为第k次迭代时对邻居j设置的惩罚项;
智能体迭代更新本地变量信息时,同步判断所述多智能体系统的更新误差是否满足预设条件,若满足所述预设条件,则完成迭代过程,若不满足所述预设条件,则多智能体系统重新按照所述迭代更新规则迭代更新,直至满足所述预设条件并结束迭代。
进一步地,所述更新误差表达为第四公式:
Figure BDA00032293953600000311
其中,Xk为第k次迭代时矩阵形式的状态量,X0为多智能体系统初始状态值矩阵,Xk-1为第k-1次更新系统的状态值矩阵,C(k)为更新误差值,|| ||F表示矩阵的Frobenius范数,|| ||2表示该范数的平方值。
进一步地,所述多智能体系统分布式优化控制方法还包括:
设置衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数,所述误差函数为:
Figure BDA0003229395360000041
其中,
Figure BDA0003229395360000042
为衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数值,
Figure BDA0003229395360000043
表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最大值,
Figure BDA0003229395360000044
表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最小值。
进一步地,所述预设条件为所述系统更新误差的值小于10-8
进一步地,所述根据原始变量状态值,利用第二公式更新门限函数包括:
当门限函数更新次数超过kmax1次时,设置门限函数
Figure BDA0003229395360000045
为0,此时门限函数作用消失,在每次迭代过程中所有智能体均与其邻居进行通信。
进一步地,所述门限函数的最大更新次数kmax1为满足更新误差值C(k)>1×10-7时的最大迭代次数。
进一步地,当惩罚项更新次数超过所述惩罚项最大更新次数kmax2时,所述智能体的惩罚项重置为初始状态。
进一步地,所述惩罚项最大更新次数kmax2设置为当更新误差值C(k)>5×10-3时的更新次数。
根据本发明的另一个方面,还公开一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有如权利要求1-8任一所述的一种多智能体系统分布式优化控制方法。
本发明使用分布式交替方向乘子法优化框架,该算法拥有优秀的迭代速度,同时具有很强的鲁棒性与普适性,通信门限函数
Figure BDA0003229395360000046
的设计,规定智能体只有当本地信息更新足够有效时才能进行通信,保证了通信的高效性,大幅度减少系统优化所消耗的通信资源,对其迭代次数的设定也对系统降低通信损耗的能力有影响。自适应惩罚函数
Figure BDA0003229395360000047
的设计,根据智能体状态值的不同,具体设计了智能体在每次迭代中的惩罚项,能够保证系统的收敛速度,使系统每次迭代都具有足够的有效性,对其最大迭代次数kmax2的设置会对系统的收敛速度产生影响。总之,多智能体系统通过本算法的计算,可以达到优化一致性,一致性即系统中所有智能体均达到最优状态值
Figure BDA0003229395360000051
最优表示在该状态值下能够使得多智能体系统函数值总和达到最小。
附图说明
本发明构成说明书的一部分附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
图1为本发明实施例中多智能体网络系统节点更新步骤示意图。
图2为本发明实施例中全连通多智能系统结构示意图。
图3为本发明实施例中本算法与传统交替方向乘子算法的收敛速度与通信损耗效果比较示意图。
具体实施方式
下面将结合附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
实施例一,如图2所示,为本实施例全连通多智能系统结构示意图,多智能体系统(以下简称系统)包括的智能体个数记作n,每个独立智能体都保存有自身状态信息,规定第i个智能体的状态值为
Figure BDA0003229395360000061
状态值函数为
Figure BDA0003229395360000062
要求该本地状态函数fi(x)为凸函数,且存在最优解,才能保证算法最后可以求得最优值且仅有一个最优值。
系统通过无向连通网络进行通信,该网络定义为G={υ,ε},υ是一个非空的节点集合,每个节点代表一个智能体;ε代表一个有向的边集合,如果两个节点i,j可以进行通信,那么有(i,j)∈ε,节点j代表i的邻居,节点i的邻居集合记作Ni,其中i的邻居数量为di=|Ni|。每个智能体本地都需要保存数据原始变量,且智能体i的本地原始数据变量
Figure BDA0003229395360000063
对偶变量
Figure BDA0003229395360000064
通信变量
Figure BDA0003229395360000065
用于记录最近一次通信后本地的原始变量值,通信变量
Figure BDA0003229395360000066
用于记录最近一次通信后邻居的原始变量值。
为表示方便,系统的各变量的矩阵形式定义为
Figure BDA0003229395360000067
Figure BDA0003229395360000068
公式中字母右上角T均表示转置符号,其中,X为系统原始变量状态值矩阵,包含所有智能体的状态值信息,其中xn表示第n个智能体的状态值信息,
Figure BDA0003229395360000069
表示系统通信状态值矩阵,包含所有智能体的通信变量状态值信息,其中
Figure BDA00032293953600000610
表示第n个智能体的通信变量状态值,Λ表示系统对偶变量状态值,包含所有智能体的对偶变量状态值信息,其中λn表示第n个智能体的对偶变量状态值。由于系统拥有n个智能体,且上述每个变量xn
Figure BDA00032293953600000611
λn均为p维向量,故
Figure BDA00032293953600000612
矩阵均为n行p列的不同矩阵。
如图1所示,为系统中多智能体网络系统节点更新步骤示意图,智能体i的信息处理步骤具体为:
步骤一,首先为了使智能体系统能够达到一致性,需要系统将状态量初始化为0。设置初始化原始变量
Figure BDA0003229395360000071
对偶变量
Figure BDA0003229395360000072
通信变量
Figure BDA0003229395360000073
通信变量
Figure BDA0003229395360000074
惩罚函数变量
Figure BDA0003229395360000075
即将本地存储的所有有关邻居的状态值信息均进行初始化。
智能体信息初始化后,开始通过迭代更新寻找最优状态值
Figure BDA0003229395360000076
首先智能体i更新本地原始数据变量信息
Figure BDA0003229395360000077
Figure BDA0003229395360000078
按如下规则进行更新:
Figure BDA0003229395360000079
其中,k代表迭代次数,
Figure BDA00032293953600000710
为函数fi(xi)取得最小值时状态值xi的取值,
Figure BDA00032293953600000711
为第k次迭代时智能体i本地数据原始变量信息,且
Figure BDA00032293953600000712
i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,
Figure BDA00032293953600000713
表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,
Figure BDA00032293953600000714
表示k-1次迭代时智能体对自身设置的惩罚项系数,
Figure BDA00032293953600000715
为第k-1次迭代时的对偶变量;<x,y>表示向量x,y的内积。本步骤通过迭代得到使系统中所有智能体状态函数值总和更小的状态值xi
步骤二,为了找到更适合的惩罚项系数,根据不同智能体之间原始变量的误差更新惩罚项系数
Figure BDA00032293953600000716
cijk的更新公式为:
Figure BDA00032293953600000717
其中,
Figure BDA00032293953600000718
为衡量本地函数值与最大最小系统值的差距的表达式,kmax2为惩罚项最大更新次数,惩罚函数变量
Figure BDA00032293953600000719
c0为惩罚项初始设定值,
Figure BDA00032293953600000720
为智能体i对自身设置的惩罚项系数,
Figure BDA00032293953600000721
为第k+1次迭代时智能体i对邻居j设置的惩罚项系数;
Figure BDA0003229395360000081
表示为:
Figure BDA0003229395360000082
其中
Figure BDA0003229395360000083
Figure BDA0003229395360000084
规定如下:
Figure BDA0003229395360000085
Figure BDA0003229395360000086
其中,
Figure BDA0003229395360000087
表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最大值,
Figure BDA0003229395360000088
表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最小值,为公式表述方便,设置
Figure BDA0003229395360000089
为衡量第k次迭代智能体i与系统中其它智能体的状态误差,
Figure BDA00032293953600000810
为第k次迭代时智能体i的误差函数值,
Figure BDA00032293953600000811
为第k次迭代时智能体j的误差函数值,
Figure BDA00032293953600000812
为第k次迭代时智能体j的本地数据原始变量信息。
kmax2为惩罚项最大更新次数,当迭代次数超过kmax2时,智能体的惩罚项重置为初始状态,kmax2为C(k)满足一定条件时的迭代次数,根据不同的应用设计不同的kmax2可以获得更好的加快收敛速度的效果,一般设置kmax2为C(k)>5e-3时的最大迭代次数。
即表示当系统误差值C(k)达到某条件前,根据智能体状态值的不同,自适应更新最适合的惩罚项
Figure BDA00032293953600000813
当达到条件后,将
Figure BDA00032293953600000814
重置为初始状态,防止惩罚项影响系统一致性状态的达成。将kmax2根据不同的应用情况进行变更,能够获得更好的降低通信损耗效果。
步骤三,为了在每次迭代过程中都有合适的门限函数
Figure BDA00032293953600000815
需要根据原始变量状态值更新门限函数,
Figure BDA00032293953600000816
的更新公式为:
Figure BDA0003229395360000091
其中,
Figure BDA0003229395360000092
Figure BDA0003229395360000093
为智能体i第k-1次的通信变量,用于记录通信后本地的原始变量值,τk是人为设定的随更新次数递减的序列,kmaxl为通信门限函数的最大更新次数。因为迭代过程中
Figure BDA0003229395360000094
是随迭代过程逐渐减小的,为了衡量更新的有效性,τk也必须随着迭代次数增加而减小,为函数提供一个通信门限,不满足通信条件则无法通信,使系统原始变量更新较小时无法通信,从而减少通信的次数。
由于无法通信会影响系统一致性的达成,故当迭代次数超过kmax1时,设置门限函数
Figure BDA0003229395360000095
为0,此时门限函数作用消失,在每次迭代过程中智能体间均进行通信,能够使系统更快的达到一致性。
在一些实施例中,设置kmax1为满足C(k)>1e-7时的最大迭代次数,kmax1根据不同的应用情况进行变更,能够获得不同的降低通信损耗效果。
总之,此步骤决定智能体是否能通信,并为下一步对偶变量
Figure BDA0003229395360000096
的更新做数据准备。根据
Figure BDA0003229395360000097
决定智能体是否与邻居通信,进行信息传递。当
Figure BDA0003229395360000098
该智能体可以与其邻居进行通信,交换信息,更新
Figure BDA0003229395360000099
否则智能体不能通信,更新
Figure BDA00032293953600000910
如果i接收到来自邻居j的通信,则保存并更新
Figure BDA00032293953600000917
否则更新
Figure BDA00032293953600000911
步骤四,最后更新对偶变量
Figure BDA00032293953600000912
为交替方向乘子法中的λ算子,通过对偶域状态量
Figure BDA00032293953600000913
的更新,为下一次迭代找到更合适的原始变量
Figure BDA00032293953600000914
做准备。其更新公式为:
Figure BDA00032293953600000915
其中,
Figure BDA00032293953600000916
为第k次迭代时的对偶变量。
步骤五,判断更新误差是否满足要求,更新误差表示为数学表达式为:
Figure BDA0003229395360000101
此处Xk为第k次迭代时矩阵形式的状态量,X0为多智能体系统初始状态值矩阵,Xk-1为第k-1次更新系统的状态值矩阵,C(k)为更新误差值,|| ||F表示矩阵的Frobenius范数。
在一些实施例中,设置C(k)<10-8,也可根据应用情况进行调整,若C(k)满足要求,则完成迭代过程,若C(k)不满足要求,则返回第二步继续进行迭代,直至满足要求结束迭代。
总体上通过定义误差函数,来表示函数迭代后的状态值Xk距上次迭代状态值Xk-1的差距,要求当C(k)<10-8时结束迭代,得到最优值,此时多智能体系统达到一致性,得到的
Figure BDA0003229395360000102
即为最优结果
Figure BDA0003229395360000103
与现有的技术比较,本发明方法使得多智能体系统具有较快的收敛速率,和快速的收敛一致性,能够使系统较快的达到优化一致性。此外,系统的通信损耗低,多智能体系统间不需过多无效通信就可达到优化一致性过程。
下面结合实验数据来说明本方法的效果:
考虑一个具有50个智能体的多智能体系统,通过无向连通网络通信,解决分布式最小二乘法问题,智能体状态方程为
Figure BDA0003229395360000104
其中
Figure BDA0003229395360000105
Figure BDA0003229395360000106
Figure BDA0003229395360000107
为四维向量,A(i)为四维矩阵,b(i)为四维向量,A(i)和b(i)中的元素是智能体i区间[0,10]均匀分布的本地数据。
运行本算法完成一致性优化迭代过程后,比较本算法与传统交替方向乘子算法的收敛速度与通信损耗。
如图3中a和b所示,两图中横坐标均为迭代次数k,a图纵坐标为精准度C(k),b图纵坐标为通信损耗,通信损耗定义为多智能体系统完成一致性后,系统总共进行的通信次数。仿真实验比较了达到一定收敛精度时的系统的通信损耗和需要的迭代次数。所有参数都被调整到最佳,本发明算法的初始化变量使用了与传统交替方向乘子算法相同的惩罚项。
a图仿真结果表明,本发明算法在有通信门限函数影响收敛,且自适应惩罚项函数的加速情况下,能够做到不影响系统的收敛速度,同时右图能够看出,在相同的精准度要求下,能够显著降低系统的通信损耗,本发明算法的通信损耗大概为传统交替方向乘子法通信损耗的1/2。
综上表明,本发明在平衡通信损耗和收敛速度方面取得了良好的效果,能够在不影响收敛速度的情况下大幅降低通信损耗,具有实用性,适用于通信损耗严重又对收敛速度有一定要求的多智能体系统。
以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则范围之内所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

Claims (9)

1.一种多智能体系统分布式优化控制方法,其特征在于,包括:
初始化所述多智能体系统的本地状态量;
初始化后的所述多智能体系统中的智能体迭代更新本地变量信息,迭代更新规则为:
Figure FDA0003229395350000011
其中,k代表迭代次数,
Figure FDA0003229395350000012
为函数fi(xi)取得最小值时状态值xi的取值,
Figure FDA0003229395350000013
为第k次迭代时智能体i的本地数据原始变量信息,且
Figure FDA0003229395350000014
i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,
Figure FDA0003229395350000015
表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,
Figure FDA0003229395350000016
表示智能体对自身设置的惩罚项系数,
Figure FDA0003229395350000017
为第k-1次迭代时的对偶变量,通过迭代更新得到状态值xi
迭代过程中,根据不同的所述智能体之间原始变量的误差,利用第一公式更新所述惩罚项系数,所述第一公式为:
Figure FDA0003229395350000018
其中,kmax2为惩罚项最大更新次数,惩罚函数变量
Figure FDA0003229395350000019
c0为惩罚项初始设定值,
Figure FDA00032293953500000110
为智能体i对自身设置的惩罚项系数,
Figure FDA00032293953500000111
为智能体i对邻居j设置的惩罚项系数,
Figure FDA00032293953500000112
为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数,且
Figure FDA00032293953500000113
其中,
Figure FDA00032293953500000114
为第k次迭代时智能体i的误差函数值,
Figure FDA00032293953500000115
为第k次迭代时智能体j的误差函数值,
Figure FDA00032293953500000116
为第k次迭代时智能体j的本地数据原始变量信息;
在迭代过程中,根据原始变量状态值,利用第二公式更新门限函数,所述第二公式为:
Figure FDA0003229395350000021
其中
Figure FDA0003229395350000022
Figure FDA0003229395350000023
为智能体i第k-1次的通信变量,用于记录通信后本地的原始变量值,τk是人为设定的随更新次数递减的序列,kmaxl为通信门限函数的最大更新次数。
根据所述门限函数,确认所述智能体是否能通信,若能通信,则所述智能体间交换信息,且更新
Figure FDA0003229395350000024
其中
Figure FDA0003229395350000025
为智能体i存储的通信变量,若智能体不能通信,则更新
Figure FDA0003229395350000026
利用第三公式迭代更新所述对偶变量,所述第三公式为:
Figure FDA0003229395350000027
其中,
Figure FDA0003229395350000028
为第k次迭代时的对偶变量,
Figure FDA0003229395350000029
为第k次迭代时对自身设置的惩罚项,
Figure FDA00032293953500000210
为第k次迭代时对邻居j设置的惩罚项;
智能体迭代更新本地变量信息时,同步判断所述多智能体系统的更新误差是否满足预设条件,若满足所述预设条件,则完成迭代过程,若不满足所述预设条件,则多智能体系统重新按照所述迭代更新规则迭代更新,直至满足所述预设条件并结束迭代。
2.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述更新误差表达为第四公式:
Figure FDA00032293953500000211
其中,Xk为第k次迭代时矩阵形式的状态量,X0为多智能体系统初始状态值矩阵,Xk-1为第k-1次更新系统的状态值矩阵,C(k)为更新误差值,||||F表示矩阵的Frobenius范数。
3.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述多智能体系统分布式优化控制方法还包括:
设置衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数,所述误差函数为:
Figure FDA0003229395350000031
其中,
Figure FDA0003229395350000032
为衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数值,
Figure FDA0003229395350000033
表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最大值,
Figure FDA0003229395350000034
表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最小值。
4.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述预设条件为所述多智能体系统的更新误差的值小于10-8
5.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述根据原始变量状态值,利用第二公式更新门限函数包括:
当门限函数更新次数超过kmax1次时,设置门限函数
Figure FDA0003229395350000035
为0,此时门限函数作用消失,在每次迭代过程中所述智能体间均进行通信。
6.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述门限函数的最大更新次数kmax1为满足更新误差值C(k)>1×10-7时的最大迭代次数。
7.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,当惩罚项更新次数超过所述惩罚项最大更新次数kmax2时,所述智能体的惩罚项重置为初始状态。
8.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述惩罚项最大更新次数kmax2设置为当更新误差值C(k)>5×10-3时的更新次数。
9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有如权利要求1-8任一所述的一种多智能体系统分布式优化控制方法。
CN202110982285.3A 2021-08-25 2021-08-25 一种多智能体系统分布式优化控制方法及存储介质 Active CN113722653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110982285.3A CN113722653B (zh) 2021-08-25 2021-08-25 一种多智能体系统分布式优化控制方法及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110982285.3A CN113722653B (zh) 2021-08-25 2021-08-25 一种多智能体系统分布式优化控制方法及存储介质

Publications (2)

Publication Number Publication Date
CN113722653A true CN113722653A (zh) 2021-11-30
CN113722653B CN113722653B (zh) 2023-05-26

Family

ID=78677947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110982285.3A Active CN113722653B (zh) 2021-08-25 2021-08-25 一种多智能体系统分布式优化控制方法及存储介质

Country Status (1)

Country Link
CN (1) CN113722653B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115356924A (zh) * 2022-08-09 2022-11-18 哈尔滨工业大学 一种针对大型互联系统的数据驱动分布式优化控制方法
CN115983088A (zh) * 2022-10-09 2023-04-18 中国地质大学(北京) 一种基于集成学习建立的海相页岩原地气量预测模型

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259327A (zh) * 2020-01-15 2020-06-09 桂林电子科技大学 基于子图处理的多智能体系统一致性问题的优化方法
CN112235808A (zh) * 2020-10-12 2021-01-15 中国人民解放军海军航空大学 一种多智能体分布式协同动态覆盖方法及系统
CN113028613A (zh) * 2021-03-10 2021-06-25 浙江大学 基于快速admm的变风量系统分布式优化控制方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259327A (zh) * 2020-01-15 2020-06-09 桂林电子科技大学 基于子图处理的多智能体系统一致性问题的优化方法
CN112235808A (zh) * 2020-10-12 2021-01-15 中国人民解放军海军航空大学 一种多智能体分布式协同动态覆盖方法及系统
CN113028613A (zh) * 2021-03-10 2021-06-25 浙江大学 基于快速admm的变风量系统分布式优化控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张家绮;游科友;: "基于相对状态符号信息的分布式优化算法", 南京信息工程大学学报(自然科学版) *
李刚等: "基于观测器的多智能体系统的自适应一致性控制", 《南京信息工程大学学报(自然科学版)》 *
路万里等: "基于总变分最小化模型的异步并行GPU加速算法", 《光学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115356924A (zh) * 2022-08-09 2022-11-18 哈尔滨工业大学 一种针对大型互联系统的数据驱动分布式优化控制方法
CN115983088A (zh) * 2022-10-09 2023-04-18 中国地质大学(北京) 一种基于集成学习建立的海相页岩原地气量预测模型
CN115983088B (zh) * 2022-10-09 2023-08-15 中国地质大学(北京) 一种基于集成学习建立的海相页岩原地气量预测模型

Also Published As

Publication number Publication date
CN113722653B (zh) 2023-05-26

Similar Documents

Publication Publication Date Title
CN113722653A (zh) 一种多智能体系统分布式优化控制方法及存储介质
CN111988225B (zh) 基于强化学习和迁移学习的多路径路由方法
CN110196554B (zh) 一种多智能体系统的安全一致性控制方法
CN111181619A (zh) 基于深度强化学习的毫米波混合波束成形设计方法
Huang Application of generalized radial basis function networks to recognition of radar targets
Fujita Optimization of the hidden unit function in feedforward neural networks
CN113784410A (zh) 基于强化学习td3算法的异构无线网络垂直切换方法
CN112260733A (zh) 基于多智能体深度强化学习的mu-miso混合预编码设计方法
CN113159331B (zh) 一种网络化机器学习系统的自适应稀疏度量化方法
CN113934173A (zh) 基于脉冲控制的多智能体系统分组一致性控制方法
Sun et al. Markov decision evolutionary game theoretic learning for cooperative sensing of unmanned aerial vehicles
Xie et al. Global leader-following consensus of a group of discrete-time neutrally stable linear systems by event-triggered bounded controls
CN110190832B (zh) 变正则化参数多任务自适应滤波器网络
Hu et al. Consensus of switched multi-agent systems with binary-valued communications
CN107070511B (zh) 一种用于miso无线公平性网络的用户接入控制优化方法
CN115623575A (zh) 一种cr-noma场景下的功率分配方法
CN111709478B (zh) 一种基于锚图的模糊聚类方法及装置
CN108279564B (zh) 一种鲁棒的稀疏多任务自适应系统及迭代方法
CN113300890B (zh) 一种网络化机器学习系统的自适应通信方法
Kou et al. Intelligent selection: A neural network-based mac protocol-selection mechanism for wireless ad hoc networks
Jovanović et al. Scalable, dynamic and growing hardware self-organizing architecture for real-time vector quantization
CN110336600B (zh) 一种针对多线性系统的分布式自适应系统辨识方法
Bianchi et al. Distributed stochastic approximation for constrained and unconstrained optimization
Francis et al. Decentralized stochastic projection-free learning with compressed push-sum
CN116522989A (zh) 基于满足Holder关系的alpha-RePU激活函数构建的数据处理系统及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant