CN108803349A - 非线性多智能体系统的最优一致性控制方法及系统 - Google Patents
非线性多智能体系统的最优一致性控制方法及系统 Download PDFInfo
- Publication number
- CN108803349A CN108803349A CN201810917939.2A CN201810917939A CN108803349A CN 108803349 A CN108803349 A CN 108803349A CN 201810917939 A CN201810917939 A CN 201810917939A CN 108803349 A CN108803349 A CN 108803349A
- Authority
- CN
- China
- Prior art keywords
- model
- agent system
- network
- intelligent body
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Abstract
本发明公开了一种非线性多智能体系统的最优一致性控制方法及系统,先根据异构多智能体系统各个体动力学特性,建立参考行为模型,采用领导者—跟随者的控制模式,形成以参考行为模型为个体组成的多智能体系统;然后根据多智能体的网络拓扑结构,构建动态图型博弈全局误差动力学模型,定义多智能体局部性能指标函数,根据全局纳什均衡,可得贝尔曼最优方程;再在仅利用智能体局部信息条件下,采用基于值函数逼近的执行—评价执行网络框架的方式,在线迭代学习获得最优一致性协议,实现各参考模型行为的一致性。本发明相对现有技术,在保证最优控制性能下,能够高效地解决复杂多智能体系统的一致性问题,更具有实际应用价值和高强的可扩展性。
Description
技术领域
本发明涉及多智能体控制技术领域,尤其涉及复杂非线性多智能系统的最优一致性控制方法及系统。
背景技术
近年来,多智能体系统分布式协同问题引起了广大学者们的关注,其中主要涉及无人机、电力系统、分布式传感器、多机器人生产线、电磁管理等领域。最优一致性控制问题又是多智能体协同控制中一个热门,并具有挑战性的主题,也是复杂系统研究中的一个极其重要的方向。
一致性问题是多智能体系统研究中的一类基本问题。在实际工程应用中,根据性能要求和任务种类等因素和个体设计控制规则,通过个体间的互相协调,保证各个体的某个物理量达到相同,比如飞行器追踪的目标、编队控制中的队形或者集会问题中的目的地等。或者说一致性使得系统中每个个体都能随着时间的推移而最终趋于一个共同的状态。多智能体的最优一致性不仅保证各智能体行为的一致性要求,而且可以实现具体的最优性能指标要求。这将有效实现多智能设备之间协同,并保证控制过程中协调性能得到优化,推动复杂大规模系统控制的向前发展,并为工业、农业、国防军事等方面的多智能体设备提供更高效的技术支持。
在实际中,系统往往表现为复杂非线性,且存在各种扰动。由于实际情况复杂,难以对系统建立准确的动力学模型。另外,多智能体各个体结构不统一,即异构多智能体。目前多智能体最优一致性控制研究主要局限于已知积分器或线性系统的研究。然而,对复杂非线性系统的研究相对较少,特别是未知系统模型的情况下。因此,本发明充分考虑实际研究问题,提出一种可应用于存在干扰下未知模型非线性多智能体系统的最优一致性控制方法。对于多智能体最优一致性问题,通常根据多智能体网络的拓扑结构,构建由耦合HJB方程,并求解该方程以获得最优控制率。然而,由于系统模型是未知非线性的,且各个智能体动力学模型不一致,无法采用传统的求解方式获得耦合HJB方程解析解。
发明内容
针对现有技术中存在的问题,本发明提出了一种分层分布式控制架构,即下层模型参考自适应控制,上层分布式协同控制,结合模型参考自适应控制与自适应动态规划方法,先采用执行评价网络架构实现以参考模型为个体的多智能体系统最优一致性,然后通过智能体状态对参考模型行为的逼近,进而实现各智能体状态的一致。
为实现上述目的,本发明提供的非线性多智能系统的最优一致性控制方法及系统包括:
S1、根据异构多智能体系统各个体动力学特性,建立参考行为模型,采用领导者—跟随者的控制模式,形成以参考行为模型为个体组成的多智能体系统;
S2、根据多智能体系统的网络拓扑结构,构建动态图型博弈全局误差动力学模型,然后在动态图型博弈全局误差动力学模型基础上,根据全局纳什均衡和贝尔曼最优原理对多智能体局部性能指标函数,得到耦合HJB方程;
S3、在仅利用邻近智能体局部信息条件下,根据所述耦合HJB方程,采用基于值函数逼近的执行—评价执行网络框架的方式,分别对评价网络和执行网络进行逼近,在线迭代学习获得最优一致性协议,分别求得最优一致性协议逼近值,然后根据最优一致性协议逼近值对非线性多智能体系统进行一致性控制。
进一步地,在本发明的非线性多智能系统的最优一致性控制方法及系统中,针对未知模型智能体系统,采用递归神经网络的方式设计辨识器,对系统进行辨识
进一步地,在本发明的非线性多智能系统的最优一致性控制方法及系统中,根据参考行为模型,形成机器人与参考模型的状态误差空间,并利用辨识器获得机器人系统灵敏度函数逼近值,采用直接递归神经网络的模型参考自适应控制方法,实现机器人状态对参考行为的逼近。
相比于现有技术,本发明具有如下有益效果:
与现有技术中多智能体系统最优一致性控制相比,本发明主要考虑了复杂工况下的多智能系统协同控制问题,如多智能体表现为异构,个体动力学为未知模型非线性系统,考虑了系统存在着外在干扰的影响。通过采用分层分布式架构,更易于保证整个系统控制的可靠性、灵活性。在下层控制中,所采用直接递归神经网络的模型参考自适应控制方法对外界干扰具有更强的鲁棒性能。在上层控制中,所采用的基于在线值函数逼近的执行—评价网络架构可以在线前向实现求得逼近最优一致性协议。因此,本发明相对现有技术,在保证最优控制性能下,能够高效地解决复杂多智能体系统的一致性问题,更具有实际应用价值和高强的可扩展性。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明的非线性多智能体系统的最优一致性控制方法的流程图;
图2为本发明的所提出基于模型参考自适应控制与自适应动态规划的分层分布式最优一致性控制总图;
图3为本发明所设计的基于在线值函数逼近的多智能体一致性执行—评价网络架构图;
图4为本发明所提出直接递归神经网络的模型参考自适应控制结构图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
针对现有技术中存在的问题,本发明提出了一种分层分布式控制架构,即下层模型参考自适应控制,上层分布式协同控;充分结合了模型参考自适应控制与自适应动态规划方法,先采用执行评价网络架构实现以参考模型为个体的多智能体系统最优一致性,然后通过智能体状态对参考模型行为的逼近,进而实现各智能体状态的一致。
参考图1-图2,本发明的非线性多智能体系统的最优一致性控制方法包括如下步骤:
S1、由于各参考模型动力学模型已知,且表现为线性系统,通过采用各智能体个体行为逼近参考模型行为的方式可大大简化了未知非线性系统的最优一致性控制问题。根据由N个异构个体组成多智能体系统各个体动力学特性,建立参考行为模型xmi(k+1)=Axmi(k)+Biumi(k),其中xmi(k)表示参考模型状态,umi(k)表示参考输入,A和Bi表示系数矩阵,下标i=1、2、…、N表示第i个智能体。因为在多智能体一致性控制中领导者—跟随者控制模式简单可靠,所以本发明采用该种控制模式。定义领导者模型x0(k+1)=Ax0(k),形成以参考行为模型与领导者为个体组成的多智能体系统,其中系数矩阵A的大小由各智能体动力学特性和领导者轨迹而确定,x0(k)表示领导者的状态。
S2、本步骤主要根据参考模型以及其构成网络的拓扑结构,获得最优化的耦合HJB方程,以便于下一步求解HJB方程并得到最优控制策略。以各参考模型为个体的多智能体网络同原多智能体网络的拓扑结构相同。所以,根据原多智能体网络拓扑结构和参考模型,构建动态图型博弈全局误差动力学模型ei(k)表示参考模型局部邻域跟踪误差状态,aij表示为跟随者邻接矩阵对应的元素、di表示为入度的对角元素和bi表示为领导者邻接矩阵对应的对角元素,umi(k)表示参考模型的控制输入,umj(k)表示第j个参考模型的控制输入,是智能体i的临近智能体集。当ei(k)即收敛于0时,多智能体将实现各状态的一致性。
定义多智能体局部性能指标函数:作为智能体i最优目标函数,其中α为折扣因子,u(mj)(k)为邻近智能体参考模型输入,ri(ei(k),umi(k),u(mj)(k))表示智能体i的效用函数函数(以下均用ri(·)表示)。根据全局纳什均衡和贝尔曼最优原理,可得耦合HJB方程:
其中,ei(k)为智能体i局部邻域跟踪误差,umi(k)为智能体i参考模型的控制输入,u(mj)(k)为当前智能体邻近智能体参考模型的控制输入,α为折扣因子,智能体i最优性能指标函数。
S3、由于难以获得步骤S2中耦合HJB方程的解析解,本步骤采用一种自适应动态规划方法在线前向逼近其最优值函数,从而获得最优控制。在仅利用邻近智能体参考模型局部信息条件下,根据步骤S2中耦合HJB方程,采用基于值函数逼近的执行—评价执行网络框架的方式,分别对评价网络和执行网络进行逼近(BP神经网络具有万能逼近的能力),如图3所示。
在评价网络中,为逼近值函数采用BP神经网络
其中,σ(·)为激活函数,Wci(k)和Vci(k)表示为评价网络的权值,表示的估计值。
评价网络估计误差函数为:
采用梯度下降法更新评价网络权值:
Wci(k+1)=Wci(k)+ηcieci(k)σci(k),
其中ηci表示学习率。
在执行网络中,评价网络输出表示为:
其中,Wai(k)和Vai(k)表示为执行网络的权值。
定义执行网络误差函数为:
其中,Rii为正定对称权值矩阵,σ'ci(k)表示为σci(k)关于的偏导数。
采用梯度下降法更新执行网络权值:
其中,ηai表示为执行网络学习率。
通过这种在线迭代的方式,可求得最优一致性协议逼近值,进而根据求得最优一致性协议逼近值对非线性多智能体系统进行控制,从而实现各参考模型行为的一致性。
由于系统为未知非线性多智能体系统,需要对各个体进行系统辨识。针对未知模型多智能体系统,采用递归神经网络的方式设计辨识器,对系统进行辨识。根据神经网络的万能逼近原理,设计卷积神经网络辨识器:
其中, 表示辨识器对智能体i状态xi(k)的估计值,ui(k)表示智能体i的控制输入,WIi(k)、VIi(k)和VIDi(k)表示为辨识器的权值。
为实现对未知模型的辨识,采用梯度下降法更新辨识器权值
其中,σ'Ii(k)表示为σIi(k)关于偏的导数,ηIi、ηIvi和ηIDi表示学习率,为辨识误差。
这样即可实现对未知非线性个体的模型辨识,以进一步实现多智能体各个体对参考模型行为的逼近,从而实现多智能体系统行为的一致。
由于通过步骤S1-S3,参考模型行为实现了与领导者同步,若在模型已辨识下各智能体行为逼近各自参考模型即可实现多智能体行为的一致性。根据参考行为模型,形成多智能体个体与参考模型的状态误差空间,并利用辨识器获得多智能体个体灵敏度函数逼近值,采用直接递归神经网络的模型参考自适应控制方法,实现多智能体个体状态对参考行为的逼近,如图4所示。
直接递归神经网络控制率表示为
其中,Wci(k)、Vci(k)和VcDi(k)表示为控制器的权值,
为实现对自适应的模型参考自适应控制,采用梯度下降法更新控制器权值
其中ηcwi、ηcvi和ηcDi表示学习率,xui(k)为系统灵敏度函数,σ'ci(k)表示为σci(k)关于的偏导数,为辨识误差。
由于系统模型是未知的,这里通过辨识器近似处理
通过采用直接递归神经网络的模型参考自适应控制方法,实现机器人状态对参考行为的逼近,进而在最优性能指标下实现机器人状态的一致性。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (10)
1.一种非线性多智能体系统的最优一致性控制方法,其特征在于,包括如下步骤:
S1、根据异构多智能体系统各个体动力学特性,建立参考行为模型,采用领导者—跟随者的控制模式,形成以参考行为模型为个体组成的多智能体系统;
S2、根据多智能体系统的网络拓扑结构,构建动态图型博弈全局误差动力学模型,然后在动态图型博弈全局误差动力学模型基础上,根据全局纳什均衡和贝尔曼最优原理对多智能体局部性能指标函数,得到耦合HJB方程;
S3、在仅利用邻近智能体局部信息条件下,根据所述耦合HJB方程,采用基于值函数逼近的执行—评价执行网络框架的方式,分别对评价网络和执行网络进行逼近,在线迭代学习获得最优一致性协议,分别求得最优一致性协议逼近值,然后根据最优一致性协议逼近值对非线性多智能体系统进行一致性控制。
2.根据权利要求1所述的非线性多智能体系统的最优一致性控制方法,其特征在于,步骤S1的具体实现方法包括如下步骤:
根据由N个异构个体组成多智能体系统各个体动力学特性,建立参考行为模型xmi(k+1)=Axmi(k)+Biumi(k),其中xmi(k)表示参考模型状态,umi(k)表示参考输入,A和Bi表示系数矩阵,下标i=1、2、…、N表示第i个智能体;
其中,领导者模型为x0(k+1)=Ax0(k),以形成以参考行为模型与领导者为个体组成的多智能体系统,其中系数矩阵A的大小由各智能体动力学特性和领导者轨迹而确定,x0(k)表示领导者的状态,k表示第k个状态。
3.根据权利要求2所述的非线性多智能体系统的最优一致性控制方法,其特征在于,步骤S1的具体实现方法包括如下步骤:
构建动态图型博弈全局误差动力学模型:
其中,ei(k)表示参考模型局部邻域跟踪误差状态,aij表示为跟随者邻接矩阵对应的元素、di表示为入度的对角元素和bi表示为领导者邻接矩阵对应的对角元素,umi(k)表示参考模型的控制输入,umj(k)表示第j个参考模型的控制输入,是智能体i的临近智能体集;
多智能体局部性能指标函数为:
作为智能体i最优目标函数,其中α为折扣因子,u(mj)(k)为邻近智能体参考模型输入,ri(ei(k),umi(k),u(mj)(k))表示智能体i的效用函数函数;
根据全局纳什均衡和贝尔曼最优原理,可得耦合HJB方程:
其中,ei(k)为智能体i局部邻域跟踪误差,umi(k)为智能体i参考模型的控制输入,u(mj)(k)为当前智能体邻近智能体参考模型的控制输入,α为折扣因子,智能体i最优性能指标函数。
4.根据权利要求1所述的非线性多智能体系统的最优一致性控制方法,其特征在于,步骤S3中,对评价网络进行逼近,求得最优一致性协议逼近值过程中:
为逼近值函数采用BP神经网络进行逼近:
其中σ(·)为激活函数,Wci(k)和Vci(k)表示为评价网络的权值,表示函数的估计函数;
评价网络估计误差函数为:
采用梯度下降法更新评价网络权值
Wci(k+1)=Wci(k)+ηcieci(k)σci(k);
其中,ηci表示学习率。
5.根据权利要求1所述的非线性多智能体系统的最优一致性控制方法,其特征在于,步骤S3中,对执行网络进行逼近,求得最优一致性协议逼近值过程中:
评价网络输出umi(k)为:
其中,Wai(k)和Vai(k)表示为执行网络的权值;
执行网络误差函数为:
其中,Rii为正定对称权值矩阵,σ'ci(k)表示为σci(k)关于的偏导数;
采用梯度下降法更新执行网络权值:
其中,ηai表示为执行网络学习率。
6.根据权利要求1所述的非线性多智能体系统的最优一致性控制方法,其特征在于,还包括:针对未知模型多智能体系统,采用递归神经网络的方式设计辨识器,对系统进行辨识。
7.根据权利要求6所述的非线性多智能体系统的最优一致性控制方法,其特征在于,所述针对未知模型多智能体系统,采用递归神经网络的方式设计辨识器,对系统进行辨识的具体实现方法包括:
根据神经网络的万能逼近原理,设计卷积神经网络辨识器:
其中, 表示辨识器对智能体i状态xi(k)的估计值,ui(k)表示智能体i的控制输入,WIi(k)、VIi(k)和VIDi(k)表示为辨识器的权值,k代表第k个状态;
为实现对未知模型的辨识,采用梯度下降法更新辨识器权值:
其中,σ'Ii(k)表示为σIi(k)关于偏的导数,ηIi、ηIvi和ηIDi表示学习率,为辨识误差。
8.根据权利要求6所述的非线性多智能体系统的最优一致性控制方法,其特征在于,还包括:
根据参考行为模型,形成机器人与参考模型的状态误差空间,并利用辨识器获得机器人系统灵敏度函数逼近值,采用直接递归神经网络的模型参考自适应控制方法,实现机器人状态对参考行为的逼近。
9.根据权利要求8所述的非线性多智能体系统的最优一致性控制方法,其特征在于,所述根据参考行为模型,形成机器人与参考模型的状态误差空间,并利用辨识器获得机器人系统灵敏度函数逼近值,采用直接递归神经网络的模型参考自适应控制方法,实现机器人状态对参考行为的逼近的具体实现方法包括:
直接递归神经网络控制率表示为:
其中,Wci(k)、Vci(k)和VcDi(k)表示为控制器的权值,
为实现对自适应的模型参考自适应控制,采用梯度下降法更新控制器权值:
其中,ηcwi、ηcvi和ηcDi表示学习率,xui(k)为系统灵敏度函数,σ'ci(k)表示为σci(k)关于的偏导数,为辨识误差,
10.一种非线性多智能体系统的最优一致性控制系统,其特征在于,采用如权利要求1-9任一项所述非线性多智能体系统的最优一致性控制方法进行非线性多智能体系统的最优一致性控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810917939.2A CN108803349B (zh) | 2018-08-13 | 2018-08-13 | 非线性多智能体系统的最优一致性控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810917939.2A CN108803349B (zh) | 2018-08-13 | 2018-08-13 | 非线性多智能体系统的最优一致性控制方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108803349A true CN108803349A (zh) | 2018-11-13 |
CN108803349B CN108803349B (zh) | 2020-06-26 |
Family
ID=64079898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810917939.2A Active CN108803349B (zh) | 2018-08-13 | 2018-08-13 | 非线性多智能体系统的最优一致性控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108803349B (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491354A (zh) * | 2019-01-09 | 2019-03-19 | 辽宁石油化工大学 | 一种复杂工业过程数据驱动全厂级性能优化控制方法 |
CN109491249A (zh) * | 2018-11-30 | 2019-03-19 | 沈阳航空航天大学 | 一种存在DoS攻击时多智能体系统事件触发控制器的设计方法 |
CN109696830A (zh) * | 2019-01-31 | 2019-04-30 | 天津大学 | 小型无人直升机的强化学习自适应控制方法 |
CN109828460A (zh) * | 2019-01-21 | 2019-05-31 | 南京理工大学 | 一种针对双向异构多智能体系统的输出一致控制方法 |
CN110554600A (zh) * | 2019-08-12 | 2019-12-10 | 浙江工业大学 | 具有非线性特性的多智能体系统分布式协同控制方法 |
CN110554604A (zh) * | 2019-08-08 | 2019-12-10 | 中国地质大学(武汉) | 一种多智能体同步控制方法、设备及存储设备 |
CN110782011A (zh) * | 2019-10-21 | 2020-02-11 | 辽宁石油化工大学 | 一种基于强化学习的网络化多智能体系统分布式优化控制方法 |
CN111103833A (zh) * | 2019-12-20 | 2020-05-05 | 南京邮电大学 | 一种多化学反应罐反应液体积一致性控制器系统及设计方法 |
CN111722628A (zh) * | 2020-06-19 | 2020-09-29 | 江南大学 | 一种多智能体轨迹更新迭代学习的点到点跟踪控制方法 |
CN112180730A (zh) * | 2020-10-10 | 2021-01-05 | 中国科学技术大学 | 一种多智能体系统分层最优一致性控制方法和装置 |
CN112230552A (zh) * | 2020-10-30 | 2021-01-15 | 西北工业大学深圳研究院 | 针对离散时间多智能体博弈的抗干扰控制方法 |
CN112311589A (zh) * | 2020-09-09 | 2021-02-02 | 重庆邮电大学 | 多智能体在Markov切换拓扑下的分组一致控制方法 |
CN112363392A (zh) * | 2020-11-16 | 2021-02-12 | 湘潭大学 | 一类模型未知的多智能体分群一致性控制方法 |
CN112445132A (zh) * | 2019-08-30 | 2021-03-05 | 天津大学 | 一种多智能体系统最优状态一致性控制方法 |
CN112596395A (zh) * | 2020-12-24 | 2021-04-02 | 中国科学院重庆绿色智能技术研究院 | 一种多重信息约束下的多智能体一致性协同控制方法 |
CN112817230A (zh) * | 2020-12-29 | 2021-05-18 | 北京航天益森风洞工程技术有限公司 | 异构多智能体的协同控制方法和装置 |
CN113093555A (zh) * | 2021-04-14 | 2021-07-09 | 江南大学 | 一种多智能体全局一致性控制方法及系统 |
CN113485110A (zh) * | 2021-07-13 | 2021-10-08 | 北京理工大学 | 一种输出受限非线性系统分布式自适应最优协同控制方法 |
CN115185189A (zh) * | 2022-09-06 | 2022-10-14 | 人工智能与数字经济广东省实验室(广州) | 带隐私保护的一致性最优控制方法、系统、设备和介质 |
CN116500893A (zh) * | 2023-04-19 | 2023-07-28 | 齐鲁工业大学(山东省科学院) | 一种高阶多智能体的强化学习优化控制器构建方法及系统 |
CN117270485A (zh) * | 2023-11-23 | 2023-12-22 | 中国科学院数学与系统科学研究院 | 一种面向工业互联网场景的分布式多机动作协同控制方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1662391A2 (en) * | 2004-09-23 | 2006-05-31 | Rockwell Automation Technologies, Inc. | Integrated multi-agent system employing agents of different types |
US20140222887A1 (en) * | 2013-02-01 | 2014-08-07 | Introspective Power, Inc. | Generic distributed processing unit for multi-agent systems |
CN104267716A (zh) * | 2014-09-15 | 2015-01-07 | 南京航空航天大学 | 一种基于多智能体技术的分布式飞行控制系统故障诊断设计方法 |
CN105278331A (zh) * | 2015-05-26 | 2016-01-27 | 河海大学常州校区 | 一种微陀螺的鲁棒自适应神经网络h无穷控制方法 |
CN105578486A (zh) * | 2016-02-29 | 2016-05-11 | 重庆邮电大学 | 一种异构密集网络中容量与覆盖联合优化方法 |
CN105790314A (zh) * | 2016-03-08 | 2016-07-20 | 南京邮电大学 | 一种基于自适应动态规划的分布式发电机协调控制方法 |
CN106249717A (zh) * | 2016-08-29 | 2016-12-21 | 上海交通大学 | 一种基于执行器饱和多智能体系统建模的协调控制方法 |
CN106647253A (zh) * | 2016-09-28 | 2017-05-10 | 南京航空航天大学 | 航空发动机分布式控制系统多性能鲁棒跟踪控制方法 |
CN107728471A (zh) * | 2017-09-01 | 2018-02-23 | 南京理工大学 | 针对一类混合异质多智能体系统的分组一致性控制方法 |
-
2018
- 2018-08-13 CN CN201810917939.2A patent/CN108803349B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1662391A2 (en) * | 2004-09-23 | 2006-05-31 | Rockwell Automation Technologies, Inc. | Integrated multi-agent system employing agents of different types |
US20140222887A1 (en) * | 2013-02-01 | 2014-08-07 | Introspective Power, Inc. | Generic distributed processing unit for multi-agent systems |
US20140222886A1 (en) * | 2013-02-01 | 2014-08-07 | Introspective Power, Inc. | Generic distributed processing for multi-agent systems |
CN104267716A (zh) * | 2014-09-15 | 2015-01-07 | 南京航空航天大学 | 一种基于多智能体技术的分布式飞行控制系统故障诊断设计方法 |
CN105278331A (zh) * | 2015-05-26 | 2016-01-27 | 河海大学常州校区 | 一种微陀螺的鲁棒自适应神经网络h无穷控制方法 |
CN105578486A (zh) * | 2016-02-29 | 2016-05-11 | 重庆邮电大学 | 一种异构密集网络中容量与覆盖联合优化方法 |
CN105790314A (zh) * | 2016-03-08 | 2016-07-20 | 南京邮电大学 | 一种基于自适应动态规划的分布式发电机协调控制方法 |
CN106249717A (zh) * | 2016-08-29 | 2016-12-21 | 上海交通大学 | 一种基于执行器饱和多智能体系统建模的协调控制方法 |
CN106647253A (zh) * | 2016-09-28 | 2017-05-10 | 南京航空航天大学 | 航空发动机分布式控制系统多性能鲁棒跟踪控制方法 |
CN107728471A (zh) * | 2017-09-01 | 2018-02-23 | 南京理工大学 | 针对一类混合异质多智能体系统的分组一致性控制方法 |
Non-Patent Citations (5)
Title |
---|
KYRIAKOS G.等: "Multi-agent differential graphical games: Online adaptive learning solution for synchronization with optimality", 《AUTOMATICA》 * |
MOHAMMED I. ABOUHEAF等: "Multi-agent discrete-time graphical games and reinforcement learning solutions", 《AUTOMATICA》 * |
YUQIAN GUO等: "Robust stability of reset control systems with uncertain output matrix", 《AUTOMATICA》 * |
冯涛: "线性多智能体系统的一致性及其全局最优性研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
杨永亮: "无模型自适应动态规划及其在多智能体协同控制中的应用", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109491249B (zh) * | 2018-11-30 | 2022-01-18 | 沈阳航空航天大学 | 一种存在DoS攻击时确定一致性事件触发控制器的方法 |
CN109491249A (zh) * | 2018-11-30 | 2019-03-19 | 沈阳航空航天大学 | 一种存在DoS攻击时多智能体系统事件触发控制器的设计方法 |
CN109491354A (zh) * | 2019-01-09 | 2019-03-19 | 辽宁石油化工大学 | 一种复杂工业过程数据驱动全厂级性能优化控制方法 |
CN109828460A (zh) * | 2019-01-21 | 2019-05-31 | 南京理工大学 | 一种针对双向异构多智能体系统的输出一致控制方法 |
CN109696830A (zh) * | 2019-01-31 | 2019-04-30 | 天津大学 | 小型无人直升机的强化学习自适应控制方法 |
CN109696830B (zh) * | 2019-01-31 | 2021-12-03 | 天津大学 | 小型无人直升机的强化学习自适应控制方法 |
CN110554604A (zh) * | 2019-08-08 | 2019-12-10 | 中国地质大学(武汉) | 一种多智能体同步控制方法、设备及存储设备 |
CN110554604B (zh) * | 2019-08-08 | 2021-07-09 | 中国地质大学(武汉) | 一种多智能体同步控制方法、设备及存储设备 |
CN110554600A (zh) * | 2019-08-12 | 2019-12-10 | 浙江工业大学 | 具有非线性特性的多智能体系统分布式协同控制方法 |
CN110554600B (zh) * | 2019-08-12 | 2022-06-21 | 浙江工业大学 | 具有非线性特性的多智能体系统分布式协同控制方法 |
CN112445132A (zh) * | 2019-08-30 | 2021-03-05 | 天津大学 | 一种多智能体系统最优状态一致性控制方法 |
CN110782011A (zh) * | 2019-10-21 | 2020-02-11 | 辽宁石油化工大学 | 一种基于强化学习的网络化多智能体系统分布式优化控制方法 |
CN110782011B (zh) * | 2019-10-21 | 2023-11-24 | 辽宁石油化工大学 | 一种基于强化学习的网络化多智能体系统分布式优化控制方法 |
CN111103833B (zh) * | 2019-12-20 | 2023-03-07 | 南京邮电大学 | 一种多化学反应罐反应液体积一致性控制器系统及设计方法 |
CN111103833A (zh) * | 2019-12-20 | 2020-05-05 | 南京邮电大学 | 一种多化学反应罐反应液体积一致性控制器系统及设计方法 |
CN111722628A (zh) * | 2020-06-19 | 2020-09-29 | 江南大学 | 一种多智能体轨迹更新迭代学习的点到点跟踪控制方法 |
CN111722628B (zh) * | 2020-06-19 | 2021-07-09 | 江南大学 | 一种多智能体轨迹更新迭代学习的点到点跟踪控制方法 |
CN112311589A (zh) * | 2020-09-09 | 2021-02-02 | 重庆邮电大学 | 多智能体在Markov切换拓扑下的分组一致控制方法 |
CN112311589B (zh) * | 2020-09-09 | 2022-04-05 | 重庆邮电大学 | 多智能体在Markov切换拓扑下的分组一致控制方法 |
CN112180730A (zh) * | 2020-10-10 | 2021-01-05 | 中国科学技术大学 | 一种多智能体系统分层最优一致性控制方法和装置 |
CN112180730B (zh) * | 2020-10-10 | 2022-03-01 | 中国科学技术大学 | 一种多智能体系统分层最优一致性控制方法和装置 |
CN112230552A (zh) * | 2020-10-30 | 2021-01-15 | 西北工业大学深圳研究院 | 针对离散时间多智能体博弈的抗干扰控制方法 |
CN112230552B (zh) * | 2020-10-30 | 2022-05-13 | 西北工业大学深圳研究院 | 针对离散时间多智能体博弈的抗干扰控制方法 |
CN112363392B (zh) * | 2020-11-16 | 2022-05-24 | 湘潭大学 | 一类模型未知的多智能体分群一致性控制方法 |
CN112363392A (zh) * | 2020-11-16 | 2021-02-12 | 湘潭大学 | 一类模型未知的多智能体分群一致性控制方法 |
CN112596395B (zh) * | 2020-12-24 | 2022-05-24 | 中国科学院重庆绿色智能技术研究院 | 一种多重信息约束下的多智能体一致性协同控制方法 |
CN112596395A (zh) * | 2020-12-24 | 2021-04-02 | 中国科学院重庆绿色智能技术研究院 | 一种多重信息约束下的多智能体一致性协同控制方法 |
CN112817230A (zh) * | 2020-12-29 | 2021-05-18 | 北京航天益森风洞工程技术有限公司 | 异构多智能体的协同控制方法和装置 |
CN113093555A (zh) * | 2021-04-14 | 2021-07-09 | 江南大学 | 一种多智能体全局一致性控制方法及系统 |
CN113485110A (zh) * | 2021-07-13 | 2021-10-08 | 北京理工大学 | 一种输出受限非线性系统分布式自适应最优协同控制方法 |
CN115185189A (zh) * | 2022-09-06 | 2022-10-14 | 人工智能与数字经济广东省实验室(广州) | 带隐私保护的一致性最优控制方法、系统、设备和介质 |
CN115185189B (zh) * | 2022-09-06 | 2023-09-05 | 人工智能与数字经济广东省实验室(广州) | 带隐私保护的一致性最优控制方法、系统、设备和介质 |
CN116500893B (zh) * | 2023-04-19 | 2023-11-14 | 齐鲁工业大学(山东省科学院) | 一种高阶多智能体的强化学习优化控制器构建方法及系统 |
CN116500893A (zh) * | 2023-04-19 | 2023-07-28 | 齐鲁工业大学(山东省科学院) | 一种高阶多智能体的强化学习优化控制器构建方法及系统 |
CN117270485A (zh) * | 2023-11-23 | 2023-12-22 | 中国科学院数学与系统科学研究院 | 一种面向工业互联网场景的分布式多机动作协同控制方法 |
CN117270485B (zh) * | 2023-11-23 | 2024-02-06 | 中国科学院数学与系统科学研究院 | 一种面向工业互联网场景的分布式多机动作协同控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108803349B (zh) | 2020-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108803349A (zh) | 非线性多智能体系统的最优一致性控制方法及系统 | |
Liang et al. | A deep reinforcement learning network for traffic light cycle control | |
CN106874914B (zh) | 一种基于深度卷积神经网络的工业机械臂视觉控制方法 | |
CN105095966B (zh) | 人工神经网络和脉冲神经网络的混合计算系统 | |
Wang et al. | Opposition-based krill herd algorithm with Cauchy mutation and position clamping | |
CN105095965B (zh) | 人工神经网络和脉冲神经网络神经的混合通信方法 | |
CN107273936A (zh) | 一种gan图像处理方法及系统 | |
Zheng et al. | Parameter identification of nonlinear dynamic systems using an improved particle swarm optimization | |
CN106875004A (zh) | 复合模式神经元信息处理方法和系统 | |
CN108122048A (zh) | 一种运输路径调度方法及其系统 | |
Chen et al. | A Survey of Learning Spiking Neural P Systems and A Novel Instance. | |
Highley et al. | Load forecasting by ANN | |
CN110232443A (zh) | 实现液体状态机的脉冲神经网络数模混合电路系统 | |
CN110532545A (zh) | 一种基于复合神经网络建模的数据信息抽取方法 | |
Liu et al. | Self-repairing learning rule for spiking astrocyte-neuron networks | |
Lu et al. | A multi-agent adaptive traffic signal control system using swarm intelligence and neuro-fuzzy reinforcement learning | |
CN106503795A (zh) | 一种基于多神经元覆盖的神经网络结构设计方法 | |
Laite et al. | Behavioral analysis of agent based service channel design using neural networks | |
Faelden et al. | A neural network approach to a cooperative balancing problem in quadrotor-unmanned aerial vehicles (QUAVs) | |
Wang et al. | Network-wide traffic signal control using bilinear system modeling and adaptive optimization | |
CN109324505A (zh) | 一种基于机器学习的协同探测控制方法 | |
Dagli et al. | Understanding behavior of system of systems through computational intelligence techniques | |
CN107832833A (zh) | 基于混沌自主发育神经网络的场景识别方法、装置及系统 | |
Xue et al. | Improving liquid state machine with hybrid plasticity | |
Liu et al. | Time-varying formation of heterogeneous multiagent systems via reinforcement learning subject to switching topologies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |