CN113722653A - 一种多智能体系统分布式优化控制方法及存储介质 - Google Patents
一种多智能体系统分布式优化控制方法及存储介质 Download PDFInfo
- Publication number
- CN113722653A CN113722653A CN202110982285.3A CN202110982285A CN113722653A CN 113722653 A CN113722653 A CN 113722653A CN 202110982285 A CN202110982285 A CN 202110982285A CN 113722653 A CN113722653 A CN 113722653A
- Authority
- CN
- China
- Prior art keywords
- agent
- iteration
- agents
- function
- updating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000005457 optimization Methods 0.000 title claims abstract description 27
- 238000004891 communication Methods 0.000 claims abstract description 66
- 230000009977 dual effect Effects 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 12
- 238000012804 iterative process Methods 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000013461 design Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 6
- 230000003044 adaptive effect Effects 0.000 abstract description 2
- 239000003795 chemical substances by application Substances 0.000 description 110
- 230000006870 function Effects 0.000 description 39
- 238000004422 calculation algorithm Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 241000764238 Isis Species 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
技术领域
本发明涉及技术领域,具体涉及一种多智能体系统分布式优化控制方法及存储介质。
背景技术
现有技术中提高多智能体的网络系统性能的分布式交替方向乘子算法,通过整合很多经典优化思路,例如梯度下降法,原始对偶算法等等,结合现代统计学习遇到的问题,提出了比较好实施的分布式计算框架,从原始对偶算子的角度出发,核心为原始对偶算法的增广拉格朗日法,能够解决特定形式的有约束凸优化问题。框架能够解决很多的优化问题,也拥有不错的收敛速率,但通信问题无法解决,没有考虑限制通信的条件,导致系统达到一致性的同时会产生很多的通信损耗,制约网络系统的进一步发展。
还有一种针对无中心网络系统的优化算法,基于分布式交替方向乘子算法框架,进一步考虑了通信问题,从通信问题中降低通信次数的方面出发,设计了通信审查方法,采用审查的方式,避免了系统中许多不必要的通信,达到了降低网络系统通信损耗的目的。但审查方式会加大网络系统计算量,同时在网络系统收敛后期,会出现许多无效的通信,或是通信次数过少,会影响网络系统的收敛速度,达到一致性的时间变慢,同样也影响了多智能体的网络系统性能。
发明内容
本发明解决的一个主要问题是多智能体网络系统通信损耗大,导致网络系统总体性能较较差的问题。
根据本发明的一个方面,本发明提供一种多智能体系统分布式优化控制方法,包括:
初始化所述多智能体系统的本地状态量;
初始化后的所述多智能体系统中的智能体迭代更新本地变量信息,迭代更新规则为:
其中,k代表迭代次数,为函数fi(xi)取得最小值时状态值xi的取值,为第k次迭代时智能体i本地数据原始变量信息,且i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,表示智能体对自身设置的惩罚项系数,为第k-1次迭代时的对偶变量,通过迭代更新得到状态值xi;
迭代过程中,根据不同的所述智能体之间原始变量的误差,利用第一公式更新所述惩罚项系数,所述第一公式为:
其中,kmax2为惩罚项最大更新次数,惩罚函数变量c0为惩罚项初始设定值,为智能体i对自身设置的惩罚项系数,为智能体i对邻居j设置的惩罚项系数,为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数,且其中,为第k次迭代时智能体i的误差函数值,为第k次迭代时智能体j的误差函数值,为第k次迭代时智能体j的本地数据原始变量信息;
在迭代过程中,根据原始变量状态值,利用第二公式更新门限函数,所述第二公式为:
利用第三公式迭代更新所述对偶变量,所述第三公式为:
智能体迭代更新本地变量信息时,同步判断所述多智能体系统的更新误差是否满足预设条件,若满足所述预设条件,则完成迭代过程,若不满足所述预设条件,则多智能体系统重新按照所述迭代更新规则迭代更新,直至满足所述预设条件并结束迭代。
进一步地,所述更新误差表达为第四公式:
其中,Xk为第k次迭代时矩阵形式的状态量,X0为多智能体系统初始状态值矩阵,Xk-1为第k-1次更新系统的状态值矩阵,C(k)为更新误差值,|| ||F表示矩阵的Frobenius范数,|| ||2表示该范数的平方值。
进一步地,所述多智能体系统分布式优化控制方法还包括:
设置衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数,所述误差函数为:
其中,为衡量第k次迭代智能体i与系统中其它智能体状态误差的误差函数值,表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最大值,表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最小值。
进一步地,所述预设条件为所述系统更新误差的值小于10-8。
进一步地,所述根据原始变量状态值,利用第二公式更新门限函数包括:
进一步地,所述门限函数的最大更新次数kmax1为满足更新误差值C(k)>1×10-7时的最大迭代次数。
进一步地,当惩罚项更新次数超过所述惩罚项最大更新次数kmax2时,所述智能体的惩罚项重置为初始状态。
进一步地,所述惩罚项最大更新次数kmax2设置为当更新误差值C(k)>5×10-3时的更新次数。
根据本发明的另一个方面,还公开一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有如权利要求1-8任一所述的一种多智能体系统分布式优化控制方法。
本发明使用分布式交替方向乘子法优化框架,该算法拥有优秀的迭代速度,同时具有很强的鲁棒性与普适性,通信门限函数的设计,规定智能体只有当本地信息更新足够有效时才能进行通信,保证了通信的高效性,大幅度减少系统优化所消耗的通信资源,对其迭代次数的设定也对系统降低通信损耗的能力有影响。自适应惩罚函数的设计,根据智能体状态值的不同,具体设计了智能体在每次迭代中的惩罚项,能够保证系统的收敛速度,使系统每次迭代都具有足够的有效性,对其最大迭代次数kmax2的设置会对系统的收敛速度产生影响。总之,多智能体系统通过本算法的计算,可以达到优化一致性,一致性即系统中所有智能体均达到最优状态值最优表示在该状态值下能够使得多智能体系统函数值总和达到最小。
附图说明
本发明构成说明书的一部分附图描述了本发明的实施例,并且连同说明书一起用于解释本发明的原理。
图1为本发明实施例中多智能体网络系统节点更新步骤示意图。
图2为本发明实施例中全连通多智能系统结构示意图。
图3为本发明实施例中本算法与传统交替方向乘子算法的收敛速度与通信损耗效果比较示意图。
具体实施方式
下面将结合附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
实施例一,如图2所示,为本实施例全连通多智能系统结构示意图,多智能体系统(以下简称系统)包括的智能体个数记作n,每个独立智能体都保存有自身状态信息,规定第i个智能体的状态值为状态值函数为要求该本地状态函数fi(x)为凸函数,且存在最优解,才能保证算法最后可以求得最优值且仅有一个最优值。
系统通过无向连通网络进行通信,该网络定义为G={υ,ε},υ是一个非空的节点集合,每个节点代表一个智能体;ε代表一个有向的边集合,如果两个节点i,j可以进行通信,那么有(i,j)∈ε,节点j代表i的邻居,节点i的邻居集合记作Ni,其中i的邻居数量为di=|Ni|。每个智能体本地都需要保存数据原始变量,且智能体i的本地原始数据变量对偶变量通信变量用于记录最近一次通信后本地的原始变量值,通信变量用于记录最近一次通信后邻居的原始变量值。
为表示方便,系统的各变量的矩阵形式定义为 公式中字母右上角T均表示转置符号,其中,X为系统原始变量状态值矩阵,包含所有智能体的状态值信息,其中xn表示第n个智能体的状态值信息,表示系统通信状态值矩阵,包含所有智能体的通信变量状态值信息,其中表示第n个智能体的通信变量状态值,Λ表示系统对偶变量状态值,包含所有智能体的对偶变量状态值信息,其中λn表示第n个智能体的对偶变量状态值。由于系统拥有n个智能体,且上述每个变量xn,λn均为p维向量,故矩阵均为n行p列的不同矩阵。
如图1所示,为系统中多智能体网络系统节点更新步骤示意图,智能体i的信息处理步骤具体为:
其中,k代表迭代次数,为函数fi(xi)取得最小值时状态值xi的取值,为第k次迭代时智能体i本地数据原始变量信息,且i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,表示k-1次迭代时智能体对自身设置的惩罚项系数,为第k-1次迭代时的对偶变量;<x,y>表示向量x,y的内积。本步骤通过迭代得到使系统中所有智能体状态函数值总和更小的状态值xi。
其中,为衡量本地函数值与最大最小系统值的差距的表达式,kmax2为惩罚项最大更新次数,惩罚函数变量c0为惩罚项初始设定值,为智能体i对自身设置的惩罚项系数,为第k+1次迭代时智能体i对邻居j设置的惩罚项系数;
其中,表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最大值,表示第k次迭代时多智能体系统中所有智能体状态函数值的2范数的最小值,为公式表述方便,设置为衡量第k次迭代智能体i与系统中其它智能体的状态误差,为第k次迭代时智能体i的误差函数值,为第k次迭代时智能体j的误差函数值,为第k次迭代时智能体j的本地数据原始变量信息。
kmax2为惩罚项最大更新次数,当迭代次数超过kmax2时,智能体的惩罚项重置为初始状态,kmax2为C(k)满足一定条件时的迭代次数,根据不同的应用设计不同的kmax2可以获得更好的加快收敛速度的效果,一般设置kmax2为C(k)>5e-3时的最大迭代次数。
即表示当系统误差值C(k)达到某条件前,根据智能体状态值的不同,自适应更新最适合的惩罚项当达到条件后,将重置为初始状态,防止惩罚项影响系统一致性状态的达成。将kmax2根据不同的应用情况进行变更,能够获得更好的降低通信损耗效果。
其中, 为智能体i第k-1次的通信变量,用于记录通信后本地的原始变量值,τk是人为设定的随更新次数递减的序列,kmaxl为通信门限函数的最大更新次数。因为迭代过程中是随迭代过程逐渐减小的,为了衡量更新的有效性,τk也必须随着迭代次数增加而减小,为函数提供一个通信门限,不满足通信条件则无法通信,使系统原始变量更新较小时无法通信,从而减少通信的次数。
在一些实施例中,设置kmax1为满足C(k)>1e-7时的最大迭代次数,kmax1根据不同的应用情况进行变更,能够获得不同的降低通信损耗效果。
总之,此步骤决定智能体是否能通信,并为下一步对偶变量的更新做数据准备。根据决定智能体是否与邻居通信,进行信息传递。当该智能体可以与其邻居进行通信,交换信息,更新否则智能体不能通信,更新如果i接收到来自邻居j的通信,则保存并更新否则更新
步骤五,判断更新误差是否满足要求,更新误差表示为数学表达式为:
此处Xk为第k次迭代时矩阵形式的状态量,X0为多智能体系统初始状态值矩阵,Xk-1为第k-1次更新系统的状态值矩阵,C(k)为更新误差值,|| ||F表示矩阵的Frobenius范数。
在一些实施例中,设置C(k)<10-8,也可根据应用情况进行调整,若C(k)满足要求,则完成迭代过程,若C(k)不满足要求,则返回第二步继续进行迭代,直至满足要求结束迭代。
与现有的技术比较,本发明方法使得多智能体系统具有较快的收敛速率,和快速的收敛一致性,能够使系统较快的达到优化一致性。此外,系统的通信损耗低,多智能体系统间不需过多无效通信就可达到优化一致性过程。
下面结合实验数据来说明本方法的效果:
考虑一个具有50个智能体的多智能体系统,通过无向连通网络通信,解决分布式最小二乘法问题,智能体状态方程为其中 即为四维向量,A(i)为四维矩阵,b(i)为四维向量,A(i)和b(i)中的元素是智能体i区间[0,10]均匀分布的本地数据。
运行本算法完成一致性优化迭代过程后,比较本算法与传统交替方向乘子算法的收敛速度与通信损耗。
如图3中a和b所示,两图中横坐标均为迭代次数k,a图纵坐标为精准度C(k),b图纵坐标为通信损耗,通信损耗定义为多智能体系统完成一致性后,系统总共进行的通信次数。仿真实验比较了达到一定收敛精度时的系统的通信损耗和需要的迭代次数。所有参数都被调整到最佳,本发明算法的初始化变量使用了与传统交替方向乘子算法相同的惩罚项。
a图仿真结果表明,本发明算法在有通信门限函数影响收敛,且自适应惩罚项函数的加速情况下,能够做到不影响系统的收敛速度,同时右图能够看出,在相同的精准度要求下,能够显著降低系统的通信损耗,本发明算法的通信损耗大概为传统交替方向乘子法通信损耗的1/2。
综上表明,本发明在平衡通信损耗和收敛速度方面取得了良好的效果,能够在不影响收敛速度的情况下大幅降低通信损耗,具有实用性,适用于通信损耗严重又对收敛速度有一定要求的多智能体系统。
以上所述仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则范围之内所作的任何修改、等同替换以及改进等,均应包含在本发明的保护范围之内。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
Claims (9)
1.一种多智能体系统分布式优化控制方法,其特征在于,包括:
初始化所述多智能体系统的本地状态量;
初始化后的所述多智能体系统中的智能体迭代更新本地变量信息,迭代更新规则为:
其中,k代表迭代次数,为函数fi(xi)取得最小值时状态值xi的取值,为第k次迭代时智能体i的本地数据原始变量信息,且i,j为两个相邻智能体,i的邻居智能体的集合记作Ni,i的邻居智能体的数量di=|Ni|,表示第k-1次迭代时智能体i对于邻居j设置的惩罚项系数,表示智能体对自身设置的惩罚项系数,为第k-1次迭代时的对偶变量,通过迭代更新得到状态值xi;
迭代过程中,根据不同的所述智能体之间原始变量的误差,利用第一公式更新所述惩罚项系数,所述第一公式为:
其中,kmax2为惩罚项最大更新次数,惩罚函数变量c0为惩罚项初始设定值,为智能体i对自身设置的惩罚项系数,为智能体i对邻居j设置的惩罚项系数,为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数,且其中,为第k次迭代时智能体i的误差函数值,为第k次迭代时智能体j的误差函数值,为第k次迭代时智能体j的本地数据原始变量信息;
在迭代过程中,根据原始变量状态值,利用第二公式更新门限函数,所述第二公式为:
利用第三公式迭代更新所述对偶变量,所述第三公式为:
智能体迭代更新本地变量信息时,同步判断所述多智能体系统的更新误差是否满足预设条件,若满足所述预设条件,则完成迭代过程,若不满足所述预设条件,则多智能体系统重新按照所述迭代更新规则迭代更新,直至满足所述预设条件并结束迭代。
4.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述预设条件为所述多智能体系统的更新误差的值小于10-8。
6.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述门限函数的最大更新次数kmax1为满足更新误差值C(k)>1×10-7时的最大迭代次数。
7.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,当惩罚项更新次数超过所述惩罚项最大更新次数kmax2时,所述智能体的惩罚项重置为初始状态。
8.如权利要求1所述的一种多智能体系统分布式优化控制方法,其特征在于,所述惩罚项最大更新次数kmax2设置为当更新误差值C(k)>5×10-3时的更新次数。
9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有如权利要求1-8任一所述的一种多智能体系统分布式优化控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110982285.3A CN113722653B (zh) | 2021-08-25 | 2021-08-25 | 一种多智能体系统分布式优化控制方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110982285.3A CN113722653B (zh) | 2021-08-25 | 2021-08-25 | 一种多智能体系统分布式优化控制方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113722653A true CN113722653A (zh) | 2021-11-30 |
CN113722653B CN113722653B (zh) | 2023-05-26 |
Family
ID=78677947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110982285.3A Active CN113722653B (zh) | 2021-08-25 | 2021-08-25 | 一种多智能体系统分布式优化控制方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113722653B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115356924A (zh) * | 2022-08-09 | 2022-11-18 | 哈尔滨工业大学 | 一种针对大型互联系统的数据驱动分布式优化控制方法 |
CN115983088A (zh) * | 2022-10-09 | 2023-04-18 | 中国地质大学(北京) | 一种基于集成学习建立的海相页岩原地气量预测模型 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259327A (zh) * | 2020-01-15 | 2020-06-09 | 桂林电子科技大学 | 基于子图处理的多智能体系统一致性问题的优化方法 |
CN112235808A (zh) * | 2020-10-12 | 2021-01-15 | 中国人民解放军海军航空大学 | 一种多智能体分布式协同动态覆盖方法及系统 |
CN113028613A (zh) * | 2021-03-10 | 2021-06-25 | 浙江大学 | 基于快速admm的变风量系统分布式优化控制方法 |
-
2021
- 2021-08-25 CN CN202110982285.3A patent/CN113722653B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259327A (zh) * | 2020-01-15 | 2020-06-09 | 桂林电子科技大学 | 基于子图处理的多智能体系统一致性问题的优化方法 |
CN112235808A (zh) * | 2020-10-12 | 2021-01-15 | 中国人民解放军海军航空大学 | 一种多智能体分布式协同动态覆盖方法及系统 |
CN113028613A (zh) * | 2021-03-10 | 2021-06-25 | 浙江大学 | 基于快速admm的变风量系统分布式优化控制方法 |
Non-Patent Citations (3)
Title |
---|
张家绮;游科友;: "基于相对状态符号信息的分布式优化算法", 南京信息工程大学学报(自然科学版) * |
李刚等: "基于观测器的多智能体系统的自适应一致性控制", 《南京信息工程大学学报(自然科学版)》 * |
路万里等: "基于总变分最小化模型的异步并行GPU加速算法", 《光学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115356924A (zh) * | 2022-08-09 | 2022-11-18 | 哈尔滨工业大学 | 一种针对大型互联系统的数据驱动分布式优化控制方法 |
CN115983088A (zh) * | 2022-10-09 | 2023-04-18 | 中国地质大学(北京) | 一种基于集成学习建立的海相页岩原地气量预测模型 |
CN115983088B (zh) * | 2022-10-09 | 2023-08-15 | 中国地质大学(北京) | 一种基于集成学习建立的海相页岩原地气量预测模型 |
Also Published As
Publication number | Publication date |
---|---|
CN113722653B (zh) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113722653A (zh) | 一种多智能体系统分布式优化控制方法及存储介质 | |
CN111988225B (zh) | 基于强化学习和迁移学习的多路径路由方法 | |
CN110196554B (zh) | 一种多智能体系统的安全一致性控制方法 | |
CN111181619A (zh) | 基于深度强化学习的毫米波混合波束成形设计方法 | |
Huang | Application of generalized radial basis function networks to recognition of radar targets | |
Fujita | Optimization of the hidden unit function in feedforward neural networks | |
CN113784410A (zh) | 基于强化学习td3算法的异构无线网络垂直切换方法 | |
CN112260733A (zh) | 基于多智能体深度强化学习的mu-miso混合预编码设计方法 | |
CN113159331B (zh) | 一种网络化机器学习系统的自适应稀疏度量化方法 | |
CN113934173A (zh) | 基于脉冲控制的多智能体系统分组一致性控制方法 | |
Sun et al. | Markov decision evolutionary game theoretic learning for cooperative sensing of unmanned aerial vehicles | |
Xie et al. | Global leader-following consensus of a group of discrete-time neutrally stable linear systems by event-triggered bounded controls | |
CN110190832B (zh) | 变正则化参数多任务自适应滤波器网络 | |
Hu et al. | Consensus of switched multi-agent systems with binary-valued communications | |
CN107070511B (zh) | 一种用于miso无线公平性网络的用户接入控制优化方法 | |
CN115623575A (zh) | 一种cr-noma场景下的功率分配方法 | |
CN111709478B (zh) | 一种基于锚图的模糊聚类方法及装置 | |
CN108279564B (zh) | 一种鲁棒的稀疏多任务自适应系统及迭代方法 | |
CN113300890B (zh) | 一种网络化机器学习系统的自适应通信方法 | |
Kou et al. | Intelligent selection: A neural network-based mac protocol-selection mechanism for wireless ad hoc networks | |
Jovanović et al. | Scalable, dynamic and growing hardware self-organizing architecture for real-time vector quantization | |
CN110336600B (zh) | 一种针对多线性系统的分布式自适应系统辨识方法 | |
Bianchi et al. | Distributed stochastic approximation for constrained and unconstrained optimization | |
Francis et al. | Decentralized stochastic projection-free learning with compressed push-sum | |
CN116522989A (zh) | 基于满足Holder关系的alpha-RePU激活函数构建的数据处理系统及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |