CN111694272B - 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置 - Google Patents

基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置 Download PDF

Info

Publication number
CN111694272B
CN111694272B CN202010710603.6A CN202010710603A CN111694272B CN 111694272 B CN111694272 B CN 111694272B CN 202010710603 A CN202010710603 A CN 202010710603A CN 111694272 B CN111694272 B CN 111694272B
Authority
CN
China
Prior art keywords
agent
fuzzy logic
logic system
order
nonlinear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010710603.6A
Other languages
English (en)
Other versions
CN111694272A (zh
Inventor
刘晓露
赵景钊
陈都鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Institute of Technology
Original Assignee
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Institute of Technology filed Critical Nanjing Institute of Technology
Priority to CN202010710603.6A priority Critical patent/CN111694272B/zh
Publication of CN111694272A publication Critical patent/CN111694272A/zh
Application granted granted Critical
Publication of CN111694272B publication Critical patent/CN111694272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/024Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明提供了一种基于模糊逻辑系统的非线性多智能体的自适应控制方法,该方法具体包括:构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;构建各个智能体有限时间趋同的控制器和对应的自适应律。其针对实际系统中存在异构的非线性因素的情况,采用带有异构的未知非线性动力特性的多智能体系统,避免不能实现闭环系统在有限时间内收敛到相同状态的问题,确保在有限时间内达到趋同的一种效果。其采用分布式架构,控制方法简单。

Description

基于模糊逻辑系统的非线性多智能体的自适应控制方法及 装置
技术领域
本发明涉及分布式控制领域,具体的涉及一种基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置。
背景技术
多智能体系统(MASs)分布式协同由于其在多机器人编队、无人飞行器、智能电网等方面具有很多潜在的应用而广受研究。协同行为研究的关键点在于对分布式局部相互作用所引起的全局变化的分析和控制,其中,趋同控制即智能体通过在各自邻域内的局部相互作用来达到一致的目标状态,是协同控制的一个基本问题。趋同问题的研究往往分为两种策略,无领导趋同和领导跟踪趋同,领导跟踪趋同策略存在一个实际存在或者是虚拟的领导者来影响跟随者的行为;而对于无领导策略,智能体间的协调不只是依赖于一个单独个体,每个智能体都对整体的行为产生影响。这两种策略可以根据实际需要灵活选择。
关于多智能体系统趋同,当前已有许多有效的控制方案来实现。考虑到控制策略的实用性,趋同速度十分重要,快速的收敛才能达成实用的效果,而代数连通性可以量化一般的线性多智能体在特定的控制策略下的收敛时间。因此,为了获取更快的收敛速度,控制方法通常为设计带有更大代数连通性的相互作用拓扑。
目前人们提出了一种基于最优顶点位置配置的方法,该方法使用加权网络来量化任意两个相邻智能体之间的相互作用强度,并通过最大化相互作用图的代数连通度的函数,进而获取较好的趋同速率。之后发展出一种半正定凸规划技术来最大化代数连通度的方法。通过大量的数值模拟研究发现小世界网络下的智能体相互作用可以获得更大的代数连通度,进而可以实现较快的趋同。在调制线性多智能体系统收敛速度过程中也发现在自冶智能体分层网络中加入一个反向链路,其同步能力可以解析证明。但以上的方法都是通过选择相互作用拓扑特定的网络结构来实现更高的趋同速率,但更为重要的是更好效果的控制方法的设计。另外,尽管可以通过最大化相互作用图的拉普拉斯矩阵的代数连通度来提升趋同速率,但在实际的系统中往往需要系统达到全局趋同的时间是有限的,进而使系统获得快速的收敛速率、更好的鲁棒性和更好的抗干扰能力。
大多数已有的研究注重于多智能体系统的渐进趋同控制,通过考虑指标、收敛率设计了许多有效的一般线性多智能体控制方案,但渐进趋同控制并不能保证闭环系统在有限时间内收敛到相同状态。目前现有的有限时间趋同控制方法大多要求系统的动力学特性是线性的,或者是系统的非线性特性是可以线性化的。这样的条件在实际的系统中非常严苛,实际的系统中存在大量的非线性因素,甚至这些非线性因素是未知的或者存在异构的非线性子系统,因此大多数的已有方法不能够在实际的控制系统中使用。
为此,针对上述所述需求,设计一种方法/装置,用于解决实际系统中由于存在异构的非线性因素,从而导致渐进趋同控制并不能保证闭环系统在有限时间内收敛到相同状态的问题。成为一种迫切需求。因此,一种基于模糊逻辑系统和自适应方法的非线性异构严格反馈多智能体系统有限时间趋同的控制方法,具有很大挑战,但确实成为了目前技术人员的创新设计理念。
发明内容
为克服现有技术的缺陷,本发明的目的在于提供一种基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置,其针对多智能体系统有限时间趋同技术,解决了现有技术中,由于实际系统中存在异构的非线性因素,从而导致渐进趋同控制并不能保证闭环系统在有限时间内收敛到相同状态的问题;实现了一组带有异构的未知非线性动力特性的多智能体系统在有限时间内达到趋同的一种效果。
鉴于上述问题,本发明提供一种基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置。
第一方面,本发明提供一种基于模糊逻辑系统的非线性多智能体的自适应控制方法,该方法具体包括:
步骤一:构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;
步骤二:使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;
步骤三:通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;
步骤四:构建各个智能体有限时间趋同的控制器和对应的自适应律。
优选地,所述步骤一中,以{1,2,…,N}依次代表各个智能体个体,根据两个智能体之间的通信关系构建邻接矩阵、拉普拉斯矩阵和固定矩阵。
优选地,各个智能体之间相互作用关系具体为:若两个智能体之间存在通信关系,则记相应的两个节点之间存在一条边,同时设若两个智能体之间存在通信关系,则该通信关系是双向的,即该多智能体系统的相互作用关系的拓扑图为一个无向图;
同时,定义该图的邻接矩阵
Figure BDA0002596394870000031
若智能体i与智能体j之间存在通信关系,则aij=1,反之aij=0;
同时,定义拓扑结构图的拉普拉斯矩阵为
Figure BDA0002596394870000032
若i≠j,
Figure BDA0002596394870000033
优选地,所述多智能体若存在一个主智能体,则定义固定矩阵
Figure BDA0002596394870000034
其中
Figure BDA0002596394870000035
若智能体i可以接受到主智能体的信息,反之则
Figure BDA0002596394870000036
优选地,所述步骤三中,通过反步法构建的李雅普诺夫函数为
Figure BDA0002596394870000037
优选地,所述步骤四中,各个智能体有限时间趋同的控制器ui和对应的自适应律分别为:
Figure BDA0002596394870000038
Figure BDA0002596394870000039
其中Ki,n、γi,n、λi,n为可以调制的正常数。
优选地,通过该分布式控制器ui和对应的自适应律,多智能体系统在有限时间Treach内实现趋同,其中,有限时间Treach具体为
Figure BDA00025963948700000310
其中各个参数如下所示:0<η<1,
Figure BDA00025963948700000311
c=min{Ki,ki,k,i=1,…,N,k=1,…,n},
Figure BDA00025963948700000312
Figure BDA00025963948700000313
第二方面,本发明提供一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,具体包括:
第一单元:用于构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;
第二单元:用于使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;
第三单元:用于通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;
第四单元:用于构建各个智能体有限时间趋同的控制器和对应的自适应律。
第三方面,本发明还另提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现上述方法的步骤。
第四方面,本发明还另提供了一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述方法的步骤。
该发明记载技术方案所带来的有益效果:
1、本发明针对多智能体系统的有限时间趋同控制的设计问题,利用反步法设计各阶子系统的李雅普诺夫函数,利用模糊逻辑系统良好的近似能力来近似多智能体系统的未知的异构动力特性,并利用李雅普诺夫稳定性方法来获取各阶子系统的控制器和自适应律。
2、解决了一组带有未知异构动力学的非线性严格反馈的多智能体系统的有限时间趋同问题,并对多智能体系统趋同的有限时间的阈值Treach提供了计算方法。
3、本发明通过模糊隶属函数的值恒小于1的性质进而放缩消除模糊隶属函数,从而使得控制方程之中不存在模糊逻辑系统中的结构,进而保证了所设计控制方法的分布式架构,也使得控制方法的形式更加简单。
4、本发明控制方法具有广泛应用性,可于信号处理、智能电网、无人机编队协同控制等方面广泛应用。
本发明所述的一种基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置,其针对实际系统中存在异构的非线性因素的情况,采用带有异构的未知非线性动力特性的多智能体系统,避免不能实现闭环系统在有限时间内收敛到相同状态的问题,确保在有限时间内达到趋同的一种效果。该控制方法采用分布式架构,控制方法简单,便于推广应用。
附图说明
图1是本发明基于模糊逻辑系统的非线性多智能体的自适应控制方法一较佳实施方式中流程框架结构示意图。
图2是本发明基于模糊逻辑系统的非线性多智能体的自适应控制方法一较佳实施方式中各智能体相互作用关系的拓扑结构图的构建流程图。
图3为本发明基于模糊逻辑系统的非线性多智能体的自适应控制方法一较佳实施方式中相互关系的拓扑结构图一具体示例。
图4为本发明基于模糊逻辑系统的非线性多智能体的自适应控制方法一较佳实施方式中各子系统输入控制器ui的图像。
图5为本发明基于模糊逻辑系统的非线性多智能体的自适应控制方法一较佳实施方式中各个连续扭摆子系统输出yi的图像。
图6为本发明基于模糊逻辑系统的非线性多智能体的自适应控制装置一较佳实施方式中框架结构示意图。
具体实施方式
本发明实施例提供了一种基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置,用于解决现有技术中,由于存在同义词及一词多义的情况,影响对文字信息进行精确解析、容易存在解析偏差的问题,及对公式、图片、表格内容信息的获取等上述问题;本发明提供的技术方案总体思路如下:
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。
实施例一:
图1为本发明一较佳实施方式中一种基于模糊逻辑系统的非线性多智能体的自适应控制方法的流程框架结构示意图。
本发明提供的一种基于模糊逻辑系统的非线性多智能体的自适应控制方法,该方法具体包括:
步骤一:构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;
步骤二:使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;
步骤三:通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;
步骤四:构建各个智能体有限时间趋同的控制器和对应的自适应律。
具体的,首先建立各个智能体之间的相互作用关系的拓扑图,如图2所示,从而利用多智能体系统中各个智能体之间相互作用关系来实现整体趋同分布式控制,记各个智能体为该拓扑图中的节点,以{1,2,…,N}依次代表各个智能体个体,根据两个智能体之间的通信关系构建邻接矩阵、拉普拉斯矩阵和固定矩阵;
其中,各个智能体之间相互作用关系具体为:若两个智能体之间存在通信关系,则记相应的两个节点之间存在一条边,同时设若两个智能体之间存在通信关系,则该通信关系是双向的,即该多智能体系统的相互作用关系的拓扑图为一个无向图;
同时,定义该图的邻接矩阵
Figure BDA0002596394870000061
若智能体i与智能体j之间存在通信关系,则aij=1,反之aij=0;
同时,定义拓扑结构图的拉普拉斯矩阵为
Figure BDA0002596394870000062
若i≠j,
Figure BDA0002596394870000063
进一步地,若所述多智能体存在一个主智能体,则定义固定矩阵
Figure BDA0002596394870000064
其中
Figure BDA0002596394870000065
若智能体i可以接受到主智能体的信息,反之则
Figure BDA0002596394870000066
对于多智能体系统中第i个智能体,具有严格反馈形式的动力学方程:
Figure BDA0002596394870000067
其中
Figure BDA0002596394870000068
yi∈R,ui分别为系统状态、系统输出、系统控制输入,
Figure BDA0002596394870000069
为位置的光滑非线性函数,也即代表了各个智能体未知的非线性动力特性。
本发明使用反步法逐步设计各阶子系统的李雅普诺夫函数:
做坐标变换如下
Figure BDA00025963948700000610
ei,k=xi,ki,k-1,k=2,…,n (3)
其中αi,k为虚拟控制信号。通过以下的李雅普诺夫函数的设计可以逐步求得针对于第i个智能体的第k阶虚拟控制信号αi,k,利用公式(3)可以进而获得可以获得ei,k,从而有利于进行第k步的李雅普诺夫函数的设计以及获取控制函数ui
令e1=[ei,1,…,ei,1]T,
Figure BDA00025963948700000611
第1步:取李雅普诺夫函数为
Figure BDA0002596394870000071
求导可得,并利用不等式放缩可得:
Figure BDA0002596394870000072
其中
Figure BDA0002596394870000073
为ζi,1的观测器,
Figure BDA0002596394870000074
Figure BDA0002596394870000075
m为正整数。
利用模糊逻辑系统良好的近似特性可得,从而可以对含有多智能体系统未知的动力学项fi,1
Figure BDA0002596394870000076
做近似,即对于任意给定的常数εi,1>0,存在模糊逻辑系统
Figure BDA0002596394870000077
使得:
Figure BDA0002596394870000078
其中εi,1i,1)代表了近似误差,
Figure BDA0002596394870000079
令ζi,1=||φi,1||2,则有
Figure BDA00025963948700000710
同时由于模糊隶属函数的值恒小于1,则有
Figure BDA00025963948700000711
经过代入后可得第1步的虚拟控制信号和自适应律分别为:
Figure BDA00025963948700000712
Figure BDA00025963948700000713
其中Ki,1、γi,1、λi,1为可以调制的正常数。
第k步:通过反步法构建李雅普诺夫函数,取李雅普诺夫函数为
Figure BDA00025963948700000714
求导可得,
Figure BDA00025963948700000715
其导数中与第1步类似地可定义含有未知动力学项fi,k
Figure BDA00025963948700000716
Figure BDA00025963948700000717
利用模糊逻辑系统可对该未知的动力特性近似:对于任意给定的εi,k>0,存在模糊逻辑系统
Figure BDA00025963948700000718
使得:
Figure BDA00025963948700000719
令ζi,k=||φi,k||2,由于模糊隶属函数的值恒小于1,则有
Figure BDA0002596394870000081
之后使用与第一步类似的分析可以取得第k步的虚拟控制信号和自适应律分别为
Figure BDA0002596394870000082
Figure BDA0002596394870000083
其中Ki,k、γi,k、λi,k,k=2,…,n-1为可以调制的正常数。
第n步:利用反步法取李雅普诺夫函数为
Figure BDA0002596394870000084
采用类似的分析,同时利用前n-1步取得的虚拟控制信号和自适应律,可以获得多智能体系统有限时间趋同各个智能体的控制器ui和相应的自适应律分别为
Figure BDA0002596394870000085
Figure BDA0002596394870000086
其中Ki,n、γi,n、λi,n为可以调制的正常数。
通过该分布式控制器ui和对应的自适应律,可以实现多智能体系统在有限时间Treach内实现趋同,同时可以对该有限时间Treach可以有具体
Figure BDA0002596394870000087
其中各个参数如下所示,0<η<1,
Figure BDA0002596394870000088
c=min{Ki,ki,k,i=1,…,N,k=1,…,n},
Figure BDA0002596394870000089
Figure BDA00025963948700000810
在获取各阶子系统的模糊隶属函数、估计器等之后,该有限时间Treach的计算公式之内所含的参数均可以通过以上的具体参数形式做计算或放缩,进而即可实现对有限时间Treach的确定,即确定多智能体系统趋同时间的阈值。
下述具体以连续扭摆系统为例。
该连续扭摆系统由四个相互之间存在作用关系的连续摆子系统组成,对于四个子系统之间的相互作用,可构建其相互作用关系的拓扑图,如图3所示,记各个子系统为该图中的节点,以节点{1,2,3,4}依次代表各个子系统,同时若两个子系统之间存在通信关系,则记相应的两个节点之间存在一条边,同时如果两个子系统之间存在通信关系,则该通信关系往往是双向的,即该多子系统系统的相互作用关系的拓扑图为一个无向图,进而我们可以定义该图的邻接矩阵
Figure BDA0002596394870000091
同时定义拓扑图的拉普拉斯矩阵为
Figure BDA0002596394870000092
为:
Figure BDA0002596394870000093
未对该连续扭摆系统选取主子系统,因而固定矩阵可选取为
Figure BDA0002596394870000094
其中
Figure BDA0002596394870000095
Figure BDA0002596394870000096
连续扭摆系统的动力学方程可以描述为严格反馈形式,以如下动力学方程的连续扭摆系统为例:
Figure BDA0002596394870000097
Figure BDA0002596394870000098
yi=xi,1
对以上的连续扭摆系统,使用本发明方法可以实现对各个子系统i动力学方程中的控制项ui设计控制器,即可实现该连续扭摆系统对于目标参考信号yd=sin(0.5t)的有限时间内趋同。
对各个子系统的输出yi做一定的坐标变换得:
Figure BDA0002596394870000099
ei,2=yii,
其中αi为虚拟控制函数。
按照发明内容之中发展的控制方法原理,即通过反步法建立各阶的李雅普诺夫函数,并利用模糊逻辑网络对各子系统动力特性的近似能力对各个子系统的动力特性做近似,逐步获取各阶虚拟控制函数αi,k,进而获得各个子系统的控制方程ui
具体到该具体实施例,首先获得对于每个子系统的第一阶的虚拟控制信号和自适应律,之后建立各个子系统对于指定的yd在有限时间内趋同的控制器和对应的自适应律,可得:
Step1:获取k=1时,虚拟控制信号为
Figure BDA00025963948700000910
自适应律为
Figure BDA00025963948700000911
Step 2:由n=2可得,第二步即可获取各个子系统的输入控制ui以及对应的自适应律,分别为
Figure BDA0002596394870000101
Figure BDA0002596394870000102
对其中的参数Ki,1、bi,1、γi,1等做一定的调制,取Ki,1=10,Ki,2=10,bi,1=1,bi,2=1,λi,1=10,λi,2=10,γi,1=1,γi,2=1,
Figure BDA0002596394870000103
可得
Figure BDA0002596394870000104
同时对各个连续扭摆系统的初始状态选择为x1=[8,-3]T,x2=[7,-2]T,x3=[6,-1]T,x1=[5,-4]T,同时自适应律所需的初始估计值为
Figure BDA0002596394870000105
Figure BDA0002596394870000106
通过利用坐标变换方程,从而可以实现各个子系统输入控制ui以及相应自适应律的实际计算。
各个子系统的输入ui的图像,如图4所示。
整个连续扭摆系统的输出表现,如图5所示,整个连续扭摆系统可以在有限时间内对指定目标信号的趋同。
同时,以下给出有限时间Treach的计算思路,整个扭摆系统趋同的阈值—有限时间Treach的计算公式为
Figure BDA0002596394870000107
利用上述确定的参数说明可得,由已经确定可调制的参数Ki,k、bi,k、γi,k等可以确定
Figure BDA0002596394870000108
的取值,并在确定各阶模糊隶属函数、估计器等的取值后即可确定χ(t)、Vn(χ)的取值,同时由0<η<1、
Figure BDA0002596394870000109
m为正整数,可对计算公式做取极值处理以实现对阈值Treach的计算。
实施例二:
基于与前述实施例一中的一种基于模糊逻辑系统的非线性多智能体的自适应控制方法同样的发明构思,本发明提供一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,如图6所示,具体包括:
第一单元:用于构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;
第二单元:用于使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;
第三单元:用于通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;
第四单元:用于构建各个智能体有限时间趋同的控制器和对应的自适应律。
前述实施例一中的一种基于模糊逻辑系统的非线性多智能体的自适应控制方法的各种变化方式和具体实例同样适用于本实施例的一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,通过前述对一种基于模糊逻辑系统的非线性多智能体的自适应控制方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种基于模糊逻辑系统的非线性多智能体的自适应控制装置的实施系统,所以为了说明书的简洁,在此不再详述。
实施例三:
基于与前述实施例一中一种基于模糊逻辑系统的非线性多智能体的自适应控制方法同样的发明构思,本发明还另提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现上述方法的步骤。
实施例四:
本发明还另提供了一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述方法的步骤。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本说明书实施例提供的一种基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置,通过步骤一:构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;步骤二:使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;步骤三:通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;步骤四:构建各个智能体有限时间趋同的控制器和对应的自适应律。从而解决了带有一组带有未知异构动力学性质的非线性严格反馈多智能体系统的有限时间趋同问题,利用模糊逻辑网络良好的近似特性以及自适应方法来近似未知的系统动力特性,并通过反步法来设计自适应模糊跟踪控制器,实现了多个智能体在有限时间内对于一般的目标迹线的跟踪。该控制方法中多智能体系统的非线性动力形式可以是未知的,同时各个智能体的动力学特性可以是异构的,因而具有更强的普适性和灵活性;便于推广应用。
本领域内的技术人员应明白,本发明的实施例可提供为系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的系统、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。
显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

Claims (5)

1.基于模糊逻辑系统的非线性多智能体的自适应控制方法,其特征在于:该方法具体包括:
步骤一:构建各个智能体之间相互作用关系的拓扑结构图,以各个智能体为该拓扑结构图中的节点;其中,以{1,2,…,N}依次代表各个智能体个体,根据两个智能体之间的通信关系构建邻接矩阵、拉普拉斯矩阵和固定矩阵;各个智能体之间相互作用关系具体为:若两个智能体之间存在通信关系,则记相应的两个节点之间存在一条边,同时设若两个智能体之间存在通信关系,则该通信关系是双向的,即该多智能体系统的相互作用关系的拓扑图为一个无向图;同时,定义该图的邻接矩阵
Figure FDA0003598949630000011
若智能体i与智能体j之间存在通信关系,则aij=1,反之aij=0;同时,定义拓扑结构图的拉普拉斯矩阵为
Figure FDA0003598949630000012
Figure FDA0003598949630000013
若i≠j,
Figure FDA0003598949630000014
所述多智能体若存在一个主智能体,则定义固定矩阵
Figure FDA0003598949630000015
其中
Figure FDA0003598949630000016
若智能体i可以接受到主智能体的信息,反之则
Figure FDA0003598949630000017
步骤二:使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;
步骤三:通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律,其中第一阶子系统李雅普诺夫函数为:
Figure FDA0003598949630000018
其中
Figure FDA0003598949630000019
为多智能体跟踪误差向量,λi,1为可以设定的正常数,
Figure FDA00035989496300000110
Figure FDA00035989496300000111
为ζi,1的估计器,ζi,1=||φi,1||2,φi,1为模糊逻辑系统中的权重向量;
第k阶子系统李雅普诺夫函数为(k=2,3,…,n):
Figure FDA00035989496300000112
其中ei,k为虚拟跟踪误差,λi,k为可以设定的正常数,
Figure FDA00035989496300000113
Figure FDA00035989496300000114
为ζi,k的估计器,ζi,k=||φi,k||2,φi,k为模糊逻辑系统中的权重向量;
步骤四:构建各个智能体有限时间趋同的控制器和对应的自适应律。
2.一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,其特征在于:具体包括:
第一单元:用于构建各个智能体之间相互作用关系的拓扑结构图;以各个智能体为该拓扑结构图中的节点;
第二单元:用于使用模糊逻辑系统获取各个智能体未知的动力特性,其包括各个智能体未知的非线性动力特性及系统状态信息;
第三单元:用于通过反步法构建各阶子系统的李雅普诺夫函数,求其各阶虚拟控制信号和自适应律;其中通过反步法构建的李雅普诺夫函数为
Figure FDA0003598949630000021
各阶虚拟控制函数的虚拟控制信号和自适应律分别具有以下形式:
Figure FDA0003598949630000022
Figure FDA0003598949630000023
其中Ki,k、γi,k、λi,k、bi,k为可以调制的正常数,ei,k为智能体i的k阶虚拟跟踪误差,
Figure FDA0003598949630000024
m∈N+
Figure FDA0003598949630000025
为ζi,j的估计器,ζi,k=||φi,k||2,φi,k为模糊逻辑系统中的权重向量;
第四单元:用于构建各个智能体有限时间趋同的控制器和对应的自适应律, 其中各个智能体有限时间趋同的控制器ui和对应的自适应律分别为:
Figure FDA0003598949630000026
Figure FDA0003598949630000027
其中Ki,n、γi,n、λi,n、bi,n为可以调制的正常数,ei,n为智能体i的n阶虚拟跟踪误差,
Figure FDA0003598949630000028
为ζi,n的估计器,ζi,n=||φi,n||2,φi,n为模糊逻辑系统中的权重向量。
3.根据权利要求2所述的一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,其特征在于:多智能在有限时间Treach内实现趋同,其中,有限时间Treach具体为
Figure FDA0003598949630000029
其中各个参数如下所示:0<η<1,
Figure FDA00035989496300000210
m∈N+
Figure FDA00035989496300000211
c=min{Ki,ki,k,i=1,…,N,k=1,…,n},
Figure FDA00035989496300000212
其中e为虚拟跟踪误差矩阵,
Figure FDA00035989496300000213
Figure FDA00035989496300000214
4.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时,实现权利要求1所述方法的步骤。
5.一种基于模糊逻辑系统的非线性多智能体的自适应控制装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现权利要求1所述方法的步骤。
CN202010710603.6A 2020-07-22 2020-07-22 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置 Active CN111694272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010710603.6A CN111694272B (zh) 2020-07-22 2020-07-22 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010710603.6A CN111694272B (zh) 2020-07-22 2020-07-22 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置

Publications (2)

Publication Number Publication Date
CN111694272A CN111694272A (zh) 2020-09-22
CN111694272B true CN111694272B (zh) 2022-05-27

Family

ID=72486714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010710603.6A Active CN111694272B (zh) 2020-07-22 2020-07-22 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置

Country Status (1)

Country Link
CN (1) CN111694272B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925197B (zh) * 2021-01-21 2022-08-12 南通大学 基于有限时间的多智能体系统二分一致跟踪方法
CN113472242B (zh) * 2021-07-05 2022-07-15 江南大学 基于多智能体的抗干扰自适应模糊滑模协同控制方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797454A (zh) * 2017-11-03 2018-03-13 南京航空航天大学 基于有限时间控制的多智能体系统协同容错控制方法
CN109144047A (zh) * 2018-06-12 2019-01-04 南京理工大学 一种基于多智能体系统的有限时间编队控制方法
CN111221335A (zh) * 2020-01-17 2020-06-02 大连海事大学 一种智能船舶自动舵系统的模糊自适应输出反馈有限时间控制方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797454A (zh) * 2017-11-03 2018-03-13 南京航空航天大学 基于有限时间控制的多智能体系统协同容错控制方法
CN109144047A (zh) * 2018-06-12 2019-01-04 南京理工大学 一种基于多智能体系统的有限时间编队控制方法
CN111221335A (zh) * 2020-01-17 2020-06-02 大连海事大学 一种智能船舶自动舵系统的模糊自适应输出反馈有限时间控制方法及系统

Also Published As

Publication number Publication date
CN111694272A (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
Liu et al. Exponential finite-time consensus of fractional-order multiagent systems
Xie et al. Event‐triggered consensus control for second‐order multi‐agent systems
Wang et al. Fuzzy neural network-based chaos synchronization for a class of fractional-order chaotic systems: an adaptive sliding mode control approach
Lee et al. Leader‐following consensus problem of heterogeneous multi‐agent systems with nonlinear dynamics using fuzzy disturbance observer
Zhao et al. Event-triggered optimal consensus tracking control for multi-agent systems with unknown internal states and disturbances
Yang et al. Time-varying formation tracking control for high-order nonlinear multi-agent systems in fixed-time framework
CN111694272B (zh) 基于模糊逻辑系统的非线性多智能体的自适应控制方法及装置
CN114967460B (zh) 时滞非线性多智能体系统的分布式协同控制方法
Wu et al. Finite-time adaptive neural command filtered control for non-strict feedback uncertain multi-agent systems including prescribed performance and input nonlinearities
Maslowski et al. Sufficient stochastic maximum principle for discounted control problem
Yang et al. Adaptive iterative learning control for multi-agent systems consensus tracking
Cui et al. Distributed containment control for nonlinear multiagent systems in pure‐feedback form
Aouiti et al. Finite‐time and fixed‐time sliding mode control for discontinuous nonidentical recurrent neural networks with time‐varying delays
Wu et al. Online estimation of unknown delays and parameters in uncertain time delayed dynamical complex networks via adaptive observer
Xiao et al. Graph attention mechanism based reinforcement learning for multi-agent flocking control in communication-restricted environment
Cui et al. Prescribed time tracking control of constrained Euler–Lagrange systems: An adaptive proportional–integral solution
Hager et al. Adaptive Neural network control of a helicopter system with optimal observer and actor-critic design
Peng et al. Cooperative tracking and estimation of linear multi-agent systems with a dynamic leader via iterative learning
Yi et al. Fixed-time connectivity-preserving consensus of periodically disturbed nonlinear multi-agent systems with limited communication ranges
CN112700099A (zh) 基于强化学习和运筹学的资源调度规划方法
Guan et al. Global asymptotic stabilization of cellular neural networks with proportional delay via impulsive control
Long et al. Finite-time consensus of nonlinear multi-agent systems via impulsive time window theory: a two-stage control strategy
CN114063438B (zh) 一种数据驱动的多智能体系统pid控制协议自学习方法
Wu et al. Distributed adaptive practical formation tracking for multi‐agent systems with actuator faults
Yan et al. Distributed minimum-energy containment control of continuous-time multi-agent systems by inverse optimal control

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200922

Assignee: Nanjing Dingbo controller Co.,Ltd.

Assignor: NANJING INSTITUTE OF TECHNOLOGY

Contract record no.: X2024980002011

Denomination of invention: Adaptive control method and device for nonlinear multi-agent systems based on fuzzy logic systems

Granted publication date: 20220527

License type: Common License

Record date: 20240206

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200922

Assignee: NANJING CHUANGYI INTELLIGENT TECHNOLOGY Co.,Ltd.

Assignor: NANJING INSTITUTE OF TECHNOLOGY

Contract record no.: X2024980003129

Denomination of invention: Adaptive control method and device for nonlinear multi-agent systems based on fuzzy logic systems

Granted publication date: 20220527

License type: Common License

Record date: 20240322