CN112230552A - 针对离散时间多智能体博弈的抗干扰控制方法 - Google Patents
针对离散时间多智能体博弈的抗干扰控制方法 Download PDFInfo
- Publication number
- CN112230552A CN112230552A CN202011192651.7A CN202011192651A CN112230552A CN 112230552 A CN112230552 A CN 112230552A CN 202011192651 A CN202011192651 A CN 202011192651A CN 112230552 A CN112230552 A CN 112230552A
- Authority
- CN
- China
- Prior art keywords
- agent
- disturbance
- interference
- game
- observer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提供针对离散时间多智能体博弈的抗干扰控制方法。包括:S1,构建基于离散时间的智能体模型;S2,基于智能体模型,针对多智能体博弈系统中智能体受到的未知扰动,设计离散干扰观测器,用于对未知扰动进行估计和消除;S3,基于智能体模型设计博弈策略,用于对智能体的成本函数进行优化使多智能体博弈系统达到唯一的纳什均衡状态;S4,基于干扰观测器和博弈策略,设计多智能体博弈系统的抗干扰控制器,对智能体的成本函数进行优化并对未知扰动进行估计和消除;S5,确定抗干扰控制器中参数的约束。本发明可以对扰动进行很好的估计和消除。
Description
技术领域
本发明涉及一种多智能体抗干扰的纳什均衡寻求控制方法,具体涉及针 对离散时间多智能体博弈的抗干扰控制方法。
背景技术
经过几十年的研究,博弈论已经在众多领域中得到了广泛的研究和应用, 例如社会学与经济学、航空航天、通信工程、控制工程等。同样的,博弈论 也为多智能体工程问题提供了有效的解决工具。在多智能体博弈系统中,每 个智能体都是一个自私的决策者,他们会尽力优化自己的成本函数,而每个 智能体的成本函数之间又存在着耦合关系。已有的应用包括城市交通协调控 制、无线通信、智能电网、多智能体的控制问题等。在这类问题中,通常目 的都是设计有效的博弈控制策略使系统能够达到纳什均衡状态,在这种状态下,系统中的任何智能体都没有单方面改变状态的动机。大多数的研究都是 在个体不具备动力学或者没有干扰的情况下进行的。
而在实际工程问题中,几乎所有的系统都会受到由模型不确定性、传输 波动、环境噪声或其他原因引起的某种干扰。博弈或者智能体受到未知扰动 的影响会出现在很多场景中,例如光信噪比的功率控制、智能电网管理、网 络化控制。然而对于在未知扰动存在时的多智能体博弈纳什均衡寻求问题的 研究相对较少。显然直接忽略扰动带来的影响是不合理的,因为存在于博弈 动力学的扰动会对博弈的结果造成影响。
在各种抗干扰的方法中,干扰观测器可以实现未知扰动的准确估计并提 供一个前馈补偿项对扰动进行抵消,同时也有着很好的动态响应。而滑膜控 制能够克服系统的不确定性,对干扰和未建模动态具有很强的鲁棒性,对非 线性系统也有良好的控制效果。基于滑膜控制设计的观测器也已经展示出显 著的特性,尤其是超扭曲算法。但是关于超扭曲算法的研究绝大多数都是在 连续时间条件下,在离散时间系统中的研究很少。
发明内容
本发明针对受到未知扰动的离散多智能体博弈系统,克服现有技术的不 足,提供一种针对离散时间多智能体博弈的抗干扰控制方法。
本发明是通过以下技术方案来实现:
针对离散时间多智能体博弈的抗干扰控制方法,包括:
S1,构建基于离散时间的智能体模型;
S2,基于智能体模型,针对多智能体博弈系统中智能体受到的未知扰 动,设计离散干扰观测器,用于对未知扰动进行估计和消除;
S3,基于智能体模型设计博弈策略,用于对智能体的成本函数进行优 化使多智能体博弈系统达到唯一的纳什均衡状态;
S4,基于干扰观测器和博弈策略,设计多智能体博弈系统的抗干扰控 制器,对智能体的成本函数进行优化并对未知扰动进行估计和消除;
S5,确定抗干扰控制器中参数的约束。
优选的,S1中,构建的智能体模型如下:
xi,k+1=xi,k+μ(ui,k+di,k) (1)
单个智能体的模型中,xi,k+1表示第i个智能体在第k+1步的状态;xi,k表 示第i个智能体在第k步的状态;ui,k表示第i个智能体在第k步的控制输入; di,k表示第i个智能体在第k步受到的扰动;μ表示步长。
对扩张状态方程建立干扰观测器:
其中,z1,i,k+1和z2,i,k+1分别是在第k+1步时干扰观测器对xi,k+1和di,k+1的估计 量,z1,i,k和z2,i,k分别是第k步时干扰观测器对xi,k和di,k的估计量;α1、α2、α3和α4分别是干扰观测器的参数;e1,i,k是干扰观测器对智能体状态xi,k+1的观测 误差,定义为e1,i,k=z1,i,k-xi,k。
定义干扰观测器对扰动di,k的观测误差为e2,i,k,然后建立观测误差系统:
再进一步的,将第i个智能体的成本函数定义为其中N是智能体的总数量,T是矩阵的转置符号;代表第i个智能体的成本函数对自身状态的偏导数;定义并对多智能体博弈系 统做出如下假设:多智能体博弈系统中智能体的成本函数对于自身状 态xi是严格的凸函数;F(x)是强单调且Lipschitz连续的;基于上述假设, S3中的博弈策略设计为梯度博弈策略
再进一步的,S4中,抗干扰控制器的控制律设计如下:
再进一步的,S5中,结合干扰观测器和控制律建立闭环系统的状态方 程:
然后利用李雅普诺夫定理对多智能体博弈系统收敛性进行分析得到抗干 扰控制器中参数要满足的约束。
第二:对于给定的矩阵Γ=ΓT>0,参数矩阵Φ使得下列线性矩阵不等式 有正定的解H=HT>0;
其中σ和δ是两个正常数,I是单位矩阵,γ满足0<γ<1。
与现有技术相比,本发明具有以下有益的技术效果:
本发明可以对扰动进行很好的估计和消除,在多智能体博弈问题中,扰 动的存在是不能忽略的,因为未知扰动会对博弈的结果造成影响。本发明所 设计的抗干扰控制器可以实现对智能体自身的成本函数进行优化的同时,对 扰动进行估计和抵消,使系统达到唯一的纳什均衡状态。本发明与实际工程 问题相贴合,采用离散的智能体模型进行分析设计,而且设计的抗干扰控制 器对扰动的约束和信息要求很少,不需要知道扰动的具体形式,不约束扰动 有界,便于工程实现;通过设计干扰观测器对未知扰动进行观测估计,再结合博弈策略设计抗干扰的博弈控制策略,从而使受到干扰的系统最终达到纳 什均衡。
附图说明
图1为本发明的流程图。
图2为本发明实施例的结果数据。
具体实施方式
下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明 的解释而不是限定。
本发明首先构建智能体的博弈模型,其次针对系统中智能体受到的未知 扰动,设计离散扰动观测器,对未知扰动进行估计;然后对多智能体系统设 计博弈策略,对智能体的成本函数进行优化使系统达到唯一的纳什均衡状态; 之后结合扰动观测器和梯度博弈策略设计抗干扰控制器;最后通过对系统的 稳定性分析确定抗干扰控制器中参数的约束;本方法将博弈论和干扰观测器 应用在多智能体系统中,能够在消除未知扰动影响的同时优化智能体的成本 函数,使系统达到纳什均衡;本发明结合实际工程中会出现的扰动,抗扰动 能力强,适用于工程应用。
如图1所示,本发明的具体实施步骤如下:
(1)构建智能体模型
xi,k+1=xi,k+μ(ui,k+di,k) (1)
单个智能体的模型中,xi,k+1表示第i个智能体在第k+1步的状态;xi,k表 示第i个智能体在第k步的状态;ui,k表示第i个智能体在第k步的控制输入; di,k表示第i个智能体在第k步受到的扰动;μ表示步长,在本发明中步长是 定值。
本发明对于多智能体博弈系统做出如下假设:
2)F(x)是强单调且Lipschitz连续的。
(2)设计干扰观测器
在各种抗干扰的方法中,干扰观测器可以实现未知扰动的准确估计并提 供一个前馈补偿项对扰动进行抵消,同时也有着很好的动态响应。而滑膜控 制能够克服系统的不确定性,对干扰和未建模动态具有很强的鲁棒性,对非 线性系统也有良好的控制效果。因此本发明基于滑膜控制设计干扰观测器。
然后通过将扰动di,k扩张为新的状态得到扩张后系统的状态方程:
对智能体的扩张状态方程建立干扰观测器:
其中,z1,i,k+1、z2,i,k+1分别是在第k+1步时干扰观测器对xi,k+1和di,k+1的估计 量,同理z1,i,k、z2,i,k是第k步时干扰观测器对xi,k和di,k的估计量;α1、α2、α3、 α4是干扰观测器的参数;e1,i,k是干扰观测器对智能体状态xi,k+1的观测误差, 定义为e1,i,k=z1,i,k-xi,k。
定义干扰观测器对扰动di,k的观测误差为e2,i,k,然后可以得到误差方程:
通过以下定义得到式(4)的简化形式(5)
ei,k+1=Φei,k+Ψsign(e1,i,k) (5)
(3)设计博弈策略
在多智能体博弈系统中,每个智能体都是一个自私的决策者,他们会尽 力优化自己的成本函数,而每个智能体的成本函数之间又存在着耦合关系。 因此需要设计博弈策略对智能体自身的成本函数进行优化使系统达到纳什均 衡。
基于本发明对于多智能体博弈系统的假设,该系统有且只有唯一的纳什 均衡点。采用梯度博弈可以使系统达到纳什均衡。
(4)设计多智能体博弈系统的抗干扰控制器
抗干扰控制器的设计主要考虑实现两个功能:第一是优化每个智能体自 身的成本函数。这是因为在多智能体博弈中,每个智能体都具有自私性,也 就是首先要优化自身的性能;第二是对于存在的未知匹配扰动进行估计并消 除扰动。
基于前边设计的干扰观测器和梯度博弈策略,第i个智能体的控制律设 计如下:
(5)确定抗干扰控制器中参数的约束
结合之前设计的干扰观测器式(3)和控制律式(6)建立多智能体博弈 系统的状态方程:
将闭环系统的状态方程转化为紧凑形式
第二:对于给定的矩阵Γ=ΓT>0,参数矩阵Φ能够使得下列线性矩阵不 等式(LMI)有正定的解H=HT>0。
其中σ和δ是两个正常数,I是单位矩阵,γ满足0<γ<1。
本发明未详细说明部分属于领域技术人员公知常识。
实施例
为了验证该理论的正确性和有效性,本发明考虑了多智能体通信任务中 网络层发生的攻防博弈。其中智能体1-6是正常的智能体,智能体7、8为 敌方智能体。敌方智能体会尽可能降低普通智能体的通信能力,普通智能体 会尽可能提高自己的通信能力。并且每个智能体还会受到未知的扰动影响, 扰动的表达式如下:
从结果图2中可以看出,每个智能体都可以抵消未知扰动的影响,并且 在博弈策略下,最终多智能体系统达到了纳什均衡状态。
本发明针对受到未知扰动的离散多智能体博弈系统,充分考虑可能出现 的匹配扰动,基于干扰观测器设计抗干扰博弈控制策略,实现多智能体的纳 什均衡寻求,使系统达到唯一的纳什均衡状态。可能产生匹配扰动的原因包 括但不限于控制通道中的信号噪声、执行器故障、多智能体的成本函数不准 确、系统模型误差等。
本发明首先构建智能体的博弈模型,其次针对系统中智能体受到的未知 扰动,设计离散扰动观测器,对未知扰动进行估计;然后对多智能体系统设 计博弈策略,对智能体的成本函数进行优化使系统达到唯一的纳什均衡状态; 之后结合扰动观测器和梯度博弈策略设计抗干扰控制器;最后通过对系统的 稳定性分析确定抗干扰控制器中参数的约束;本方法将博弈论和干扰观测器 应用在多智能体系统中,能够在消除未知扰动影响的同时优化智能体的成本 函数,使系统达到纳什均衡;本发明结合实际工程中会出现的扰动,抗扰动 能力强,适用于工程应用。
Claims (7)
1.针对离散时间多智能体博弈的抗干扰控制方法,其特征在于,包括:
S1,构建基于离散时间的智能体模型;
S2,基于智能体模型,针对多智能体博弈系统中智能体受到的未知扰动,设计离散干扰观测器,用于对未知扰动进行估计和消除;
S3,基于智能体模型设计博弈策略,用于对智能体的成本函数进行优化使多智能体博弈系统达到唯一的纳什均衡状态;
S4,基于干扰观测器和博弈策略,设计多智能体博弈系统的抗干扰控制器,对智能体的成本函数进行优化并对未知扰动进行估计和消除;
S5,确定抗干扰控制器中参数的约束。
2.根据权利要求1所述的针对离散时间多智能体博弈的抗干扰控制方法,其特征在于,S1中,构建的智能体模型如下:
xi,k+1=xi,k+μ(ui,k+di,k) (1)
单个智能体的模型中,xi,k+1表示第i个智能体在第k+1步的状态;xi,k表示第i个智能体在第k步的状态;ui,k表示第i个智能体在第k步的控制输入;di,k表示第i个智能体在第k步受到的扰动;μ表示步长。
对扩张状态方程建立干扰观测器:
其中,z1,i,k+1和z2,i,k+1分别是在第k+1步时干扰观测器对xi,k+1和di,k+1的估计量,z1,i,k和z2,i,k分别是第k步时干扰观测器对xi,k和di,k的估计量;α1、α2、α3和α4分别是干扰观测器的参数;e1,i,k是干扰观测器对智能体状态xi,k+1的观测误差,定义为e1,i,k=z1,i,k-xi,k;
定义干扰观测器对扰动di,k的观测误差为e2,i,k,然后建立观测误差系统:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011192651.7A CN112230552B (zh) | 2020-10-30 | 2020-10-30 | 针对离散时间多智能体博弈的抗干扰控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011192651.7A CN112230552B (zh) | 2020-10-30 | 2020-10-30 | 针对离散时间多智能体博弈的抗干扰控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112230552A true CN112230552A (zh) | 2021-01-15 |
CN112230552B CN112230552B (zh) | 2022-05-13 |
Family
ID=74123249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011192651.7A Active CN112230552B (zh) | 2020-10-30 | 2020-10-30 | 针对离散时间多智能体博弈的抗干扰控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112230552B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115145296A (zh) * | 2022-07-20 | 2022-10-04 | 苏州三垣航天科技有限公司 | 多航天器系统及其抗干扰控制方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463094A (zh) * | 2017-07-13 | 2017-12-12 | 江西洪都航空工业集团有限责任公司 | 一种不确定信息下多无人机空战动态博弈方法 |
CN108712188A (zh) * | 2018-05-25 | 2018-10-26 | 电子科技大学 | 基于博弈论的智能抗干扰方法 |
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN110703602A (zh) * | 2019-10-22 | 2020-01-17 | 西北工业大学深圳研究院 | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 |
-
2020
- 2020-10-30 CN CN202011192651.7A patent/CN112230552B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107463094A (zh) * | 2017-07-13 | 2017-12-12 | 江西洪都航空工业集团有限责任公司 | 一种不确定信息下多无人机空战动态博弈方法 |
CN108712188A (zh) * | 2018-05-25 | 2018-10-26 | 电子科技大学 | 基于博弈论的智能抗干扰方法 |
CN108803349A (zh) * | 2018-08-13 | 2018-11-13 | 中国地质大学(武汉) | 非线性多智能体系统的最优一致性控制方法及系统 |
CN110703602A (zh) * | 2019-10-22 | 2020-01-17 | 西北工业大学深圳研究院 | 一种多机器人在轨装配姿态稳定的鲁棒微分博弈控制方法 |
Non-Patent Citations (2)
Title |
---|
FEIER LIAN 等: "Game-Theoretic Multi-Agent Control and Network Cost Allocation Under Communication Constraints", 《IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS 》 * |
YUAN YUAN 等: "Event-Triggered Strategy Design for Discrete-Time Nonlinear Quadratic Games With Disturbance Compensations: The Noncooperative Case", 《IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS: SYSTEMS》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115145296A (zh) * | 2022-07-20 | 2022-10-04 | 苏州三垣航天科技有限公司 | 多航天器系统及其抗干扰控制方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112230552B (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108490765B (zh) | 一种带有抗积分补偿的自抗扰控制器的设计方法 | |
Pan et al. | Adaptive controller design for tracking and disturbance attenuation in parametric strict-feedback nonlinear systems | |
Bao et al. | Modeling and control of air stream and hydrogen flow with recirculation in a PEM fuel cell system—II. Linear and adaptive nonlinear control | |
Vu et al. | Independent design of multi-loop PI/PID controllers for interacting multivariable processes | |
CN109669356B (zh) | 基于分数阶扩张状态观测器的自抗扰控制方法及控制器 | |
CN110705034B (zh) | 一种基于事件触发的永磁同步电机位置跟踪控制方法 | |
CN103195599B (zh) | 一种hcci燃烧基于模型的解耦及抗扰控制方法 | |
Xie et al. | On decoupling control of the VGT-EGR system in diesel engines: a new framework | |
Saifia et al. | Robust H∞ static output‐feedback control for discrete‐time fuzzy systems with actuator saturation via fuzzy Lyapunov functions | |
CN112230552B (zh) | 针对离散时间多智能体博弈的抗干扰控制方法 | |
Wang et al. | Multiple model predictive functional control for marine diesel engine | |
Liu et al. | Hamilton‐based adaptive robust control for the speed and tension system of reversible cold strip rolling mill | |
CN115773569A (zh) | 基于自抗扰解耦的海洋平台通风系统风量控制方法 | |
CN110032071B (zh) | 一种降阶自抗扰控制器及其建立方法 | |
Hu et al. | Fault-tolerant control based on adaptive dynamic programming for reentry vehicles subjected to state-dependent actuator fault | |
Zhang et al. | Adaptive event-triggered fuzzy tracking control of uncertain stochastic nonlinear systems with unmeasurable states | |
Yang et al. | Event-triggered control for networked predictive control systems with time delay and external disturbance | |
CN111859562B (zh) | 一种基于动态阻力特性的压力无关智能调节阀设计方法 | |
Li et al. | Asynchronous H∞ fixed-order filtering for LPV switched delay systems with mode-dependent average dwell time | |
Liu et al. | Immersion and invariance adaptive decentralized control for the speed and tension system of the reversible cold strip rolling mill | |
CN110737197A (zh) | 一种基于无模型的柴油机转速自适应自抗扰控制方法 | |
CN111459028B (zh) | 航空发动机最大推力状态降保守性二自由度μ控制器 | |
CN114704397A (zh) | 一种基于反步结构的vgt-egr柴油机空气系统多变量自抗扰控制方法 | |
CN115145296A (zh) | 多航天器系统及其抗干扰控制方法、装置和存储介质 | |
Li et al. | Adaptive fuzzy PI output feedback bounded control for a class of switched nonlinear systems with input constraint |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |