CN111308896B - 基于可变误差的非线性系统自适应最优控制方法 - Google Patents

基于可变误差的非线性系统自适应最优控制方法 Download PDF

Info

Publication number
CN111308896B
CN111308896B CN202010240156.2A CN202010240156A CN111308896B CN 111308896 B CN111308896 B CN 111308896B CN 202010240156 A CN202010240156 A CN 202010240156A CN 111308896 B CN111308896 B CN 111308896B
Authority
CN
China
Prior art keywords
function
iterative
iteration
performance index
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010240156.2A
Other languages
English (en)
Other versions
CN111308896A (zh
Inventor
刘德荣
魏庆来
林汉权
李超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN202010240156.2A priority Critical patent/CN111308896B/zh
Publication of CN111308896A publication Critical patent/CN111308896A/zh
Application granted granted Critical
Publication of CN111308896B publication Critical patent/CN111308896B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Feedback Control In General (AREA)

Abstract

一种可变误差的非线性自适应控制方法,通过引入合适的近似误差来逼近性能指标函数和策略控制函数,并使得指标函数能最终一致收敛。本发明结合神经网络,由于神经网络的良好的逼近性能,通过同时调节评价网络和策略网络的近似误差,使最终的性能指标函数能够收敛到最优评价函数的一个邻域内。

Description

基于可变误差的非线性系统自适应最优控制方法
本发明是申请号为201510272090.4、申请日为2015年5月25日、发明名称为“一种基于可变误差的非线性系统自适应最优控制方法”的中国发明专利申请的分案申请。
技术领域
本发明涉及智能控制技术领域,尤其涉及一种基于可变误差的非线性系统自适应最优控制方法。
背景技术
在当今的社会生活和工业领域存在着大量的复杂系统,如电力系统、交通系统、制造系统、化工过程系统、通信网络系统等,都需要被控系统在有限的资源条件下完成控制目标。最优控制是使控制系统的性能指标实现最优化的基本条件和综合方法,可概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。
随着科技的发展,人们对控制系统的性能也提出了越来越高的要求。而这些复杂系统通常具有高度的非线性、未知的动态特性、模型的不确定性等,难于建立精确的数学模型。而自适应控制可以看作是一个能根据环境变化智能调节自身特性的反馈控制系统,以使系统能按照一些设定的标准工作在最优状态。因此,如何设计出一种非线性系统自适应最优控制方法显得尤为重要。
发明内容
有鉴于此,本发明的主要目的在于提出一种基于可变误差的非线性系统自适应最优控制方法,以便满足对复杂系统的自适应控制。
为了实现上述目的,本发明提出了一种基于可变误差的非线性系统自适应最优控制方法,包括以下步骤:
步骤1、选择随机初始状态x0;选择任意半正定函数Ψ(xk)≥0;选择收敛精度ζ;给定参数序列{qi},其中0<qi<1;给定两个常数
Figure BDA00024315205600000211
0<ξ<1分别表示可变误差的衰减率;令迭代参数i=0;
步骤2、令初始性能指标函数
Figure BDA0002431520560000021
并求得参数γ0,使其满足V0(F(xk,uk))≤γ0U(xk,uk),其中F(xk,uk)是系统状态方程,V0(xk)为初始性能指标函数,U(xk,uk)是系统的效用函数,Ψ(xk)为半正定函数;
步骤3、计算得到初始控制律
Figure BDA0002431520560000022
以及初始迭代性能指标函数
Figure BDA0002431520560000023
其中,ρ0(xk)为迭代控制近似误差,π0(xk)为迭代性能指标函数近似误差;
步骤4、定义单步迭代的目标迭代性能指标函数为
Figure BDA0002431520560000024
定义全局迭代目标函数为
Figure BDA0002431520560000025
计算获得参数σ1使其满足
Figure BDA0002431520560000026
给定任意0<q0≤1,如果σ1满足
Figure BDA0002431520560000027
其中γ0可由步骤2得到,则估计参数γ1使其满足V1(F(xk,uk))≤γ1U(xk,uk),并令i=i+1,继续执行下一步;否则,令
Figure BDA0002431520560000028
和π0(xk)=ξπ0(xk),返回步骤3继续执行;
步骤5、对于任意i=1,2,...,计算得到迭代控制律
Figure BDA0002431520560000029
和迭代性能指标函数
Figure BDA00024315205600000210
其中ρi(xk)为迭代控制近似误差,πi(xk)迭代性能指标函数近似误差;
步骤6、定义全局迭代目标函数为
Figure BDA0002431520560000031
根据目标迭代性能指标函数
Figure BDA0002431520560000032
计算获得参数σi使其满足
Figure BDA0002431520560000033
给定任意0<qi≤1,如果σi满足
Figure BDA0002431520560000034
则估计γi+1使其满足Vi+1(F(xk,uk))≤γi+1U(xk,uk),并继续执行下一步;否则,令
Figure BDA0002431520560000035
和πi(xk)=ξπi(xk),返回步骤5继续执行;
步骤7、如果
Figure BDA0002431520560000036
ζ是收敛精度,即可获得最优性能指标函数和最优控制律;否则令i=i+1继续返回步骤5执行。
其中,在步骤5中采用两个神经网络,即执行网络与评判网络分别逼近迭代控制律与迭代性能指标函数。
其中,所述评判网络与执行网络均采用BP神经网络进行构建。
其中,在步骤6中获得参数γi的步骤为:
步骤I-1、令μ(xk)为任意给定的容许控制;
步骤I-2、对于i=1,2,...,根据μ(xk)构造新的性能指标函数Pi(xk),满足Pi+1(xk)=U(xk,μ(xk))+Pi(xk+1),其中P0(xk)=V0(xk)=Ψ(xk);
步骤I-3、给出
Figure BDA0002431520560000037
使其满足
Figure BDA0002431520560000038
步骤I-4、令
Figure BDA0002431520560000039
其中,在步骤6中获得参数γi的步骤为:
步骤II-1、对于
Figure BDA00024315205600000310
迭代性能指标函数
Figure BDA00024315205600000311
可以通过下式获得
Figure BDA00024315205600000312
其中πi(xk)为评判网络近似误差;
步骤II-2、令|πi(xk)|为πi(xk)的上界,定义新的迭代性能指标函数为
Figure BDA0002431520560000041
步骤II-3、令
Figure BDA0002431520560000042
步骤II-4、由
Figure BDA0002431520560000043
得出
Figure BDA0002431520560000044
步骤II-5、令
Figure BDA0002431520560000045
其中,在步骤6中获得参数γi的步骤为:
步骤III-1、记录σ 0σ 1,...,σ i-1γ 0γ 1,...,γ i-1
步骤III-2、通过
Figure BDA0002431520560000046
获得迭代性能指标函数
Figure BDA0002431520560000047
通过
Figure BDA0002431520560000048
获得目标迭代性能指标函数Γi(xk);
步骤III-3、对于
Figure BDA0002431520560000049
根据如下不等式
Figure BDA00024315205600000410
获得σ i;如果
Figure BDA00024315205600000411
σ i=1;根据如下不等式
Figure BDA00024315205600000412
获得
Figure BDA00024315205600000413
Figure BDA00024315205600000414
步骤III-4、令
Figure BDA00024315205600000415
通过下式解出γ i
Figure BDA00024315205600000416
步骤III-5、令γiγ i
基于上述技术方案可知,现有的自适应动态规划方法没有考虑到神经网络等近似结构的逼近误差,在误差存在条件下,现有方法无法在每次迭代中保证系统的稳定性和算法的收敛性,同时迭代时间较长;而本发明的自适应最优控制方法在自适应动态规划框架下,提出一种可变误差的策略迭代方法,该方法通过引入合适的近似误差来逼近性能指标函数和策略控制函数,并使得指标函数能最终一致收敛。本发明结合神经网络,由于神经网络的良好的逼近性能,通过同时调节评价网络和策略网络的近似误差,使最终的性能指标函数能够收敛到最优评价函数的一个邻域内。
附图说明
图1是作为本发明一个实施例的基于可变误差的非线性系统自适应最优控制方法的流程图;
图2是作为本发明一个实施例的基于可变误差的非线性系统自适应最优控制方法的神经网络实现框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明公开了一种可变误差的非线性自适应控制方法,属于最优控制领域。在现有的最优控制方法中,自适应动态规划被广泛应用于非线性系统。传统的自适应动态规划一般分为两个步骤:策略性能指标函数评价过程和策略更新过程,它要求每一次的性能指标函数和策略控制函数都能精确地得到,但在实际计算应用中往往不能实现。
具体来说,本发明所研究的非线性系统为xk+1=F(xk,uk),k=0,1,2,..,其中
Figure BDA0002431520560000051
是n维的系统状态向量,
Figure BDA0002431520560000052
是m维的系统控制向量,x0是系统的初始状态,F(xk,uk)为系统方程。
Figure BDA0002431520560000053
是时刻k→∞时的随机控制序列。将状态为x0,控制序列为u 0=(u0,u1,...)时的性能指标函数定义为
Figure BDA0002431520560000054
其中对于任意的xk,uk≠0,U(xk,uk)>0是系统的效用函数。
本发明的目的是找到一个最优的控制序列能使系统xk+1=F(xk,uk)稳定,同时性能指标函数J(xku k)达到最小。
定义控制序列集合
Figure BDA0002431520560000061
对于任意的控制序列u kΘ k,最优性能指标函数定义为
Figure BDA0002431520560000062
根据Bellman最优性原理,J*(xk)满足离散时间HJB方程
Figure BDA0002431520560000063
由此,最优控制可以表示为
Figure BDA0002431520560000064
将最优控制带入离散时间HJB方程可得,最优性能指标函数
J*(xk)=U(xk,u*(xk))+J*(F(xk,u*(xk))).
对于非线性系统,最优性能指标函数J*(xk)具有非线性且通常没有解析形式。这使得最优控制无法通过直接求解HJB方程来得到。因此,本发明提出了一种基于可变误差的非线性系统自适应最优控制方法。
图1示出了本发明的基于可变误差的非线性系统自适应最优控制方法的流程图。该迭代自适应最优控制方法是通过神经网络函数对最优性能指标函数J*(xk)进行逼近,具体步骤表示如下:
步骤1、初始化:选择随机初始状态x0;选择任意半正定函数Ψ(xk)≥0;选择收敛精度ζ;给定参数序列{qi},其中0<qi<1;给定两个常数
Figure BDA0002431520560000066
0<ξ<1;令迭代参数i=0;
步骤2、令初始性能指标函数
Figure BDA0002431520560000065
并求得参数γ0,使其满足
V0(F(xk,uk))≤γ0U(xk,uk);
其中,F(xk,uk)是系统的状态方程,U(xk,uk)是系统的效用函数。
步骤3、计算得到初始控制律
Figure BDA0002431520560000071
以及初始迭代性能指标函数
Figure BDA0002431520560000072
其中ρ0(xk)为迭代控制近似误差,π0(xk)为迭代性能指标函数近似误差;
步骤4、定义单步迭代的目标迭代性能指标函数
Figure BDA0002431520560000073
定义全局迭代目标函数为:
Figure BDA0002431520560000074
计算获得参数σ1使对于任意的状态xk其满足
Figure BDA0002431520560000075
给定任意0<q0≤1,如果σ1满足
Figure BDA0002431520560000076
则估计参数γ1使其满足
V1(F(xk,uk))≤γ1U(xk,uk),
并令i=i+1继续执行下一步。否则,减小神经网络近似误差,即令
Figure BDA0002431520560000077
和π0(xk)=ξπ0(xk),其中
Figure BDA0002431520560000078
ξ是误差衰减率,返回步骤3继续执行;
步骤5、对于任意i=1,2,...,计算得到迭代控制律
Figure BDA0002431520560000079
和迭代性能指标函数
Figure BDA00024315205600000710
其中ρi(xk)为迭代控制近似误差,πi(xk)迭代性能指标函数近似误差。
步骤6、定义全局迭代目标函数为
Figure BDA0002431520560000081
根据目标迭代性能指标函数
Figure BDA0002431520560000082
计算获得参数σi使其满足
Figure BDA0002431520560000083
给定任意0<qi≤1,如果σi满足
Figure BDA0002431520560000084
则估计γi+1使其满足
Vi+1(F(xk,uk))≤γi+1U(xk,uk)。
并继续执行下一步。否则,减小神经网络近似误差即令
Figure BDA0002431520560000085
和πi(xk)=ξπi(xk),返回步骤5继续执行;
步骤7、如果
Figure BDA0002431520560000086
其中ζ是收敛精度,那么最优性能指标函数和最优控制律即可获得;否则令i=i+1继续返回步骤5执行。
算法描述完毕。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合附图,对本发明作进一步的详细说明。
本发明的自适应最优控制方法是一种值迭代算法,在该算法中性能指标函数和控制律通过迭代进行更新(迭代指标i:0→∞)。
对于任意的状态
Figure BDA0002431520560000087
Ψ(xk)≥0是一任意的半正定函数,令初始性能指标函数
Figure BDA0002431520560000088
迭代控制律可按下式计算
Figure BDA0002431520560000089
其中
Figure BDA00024315205600000810
性能指标函数更新为
Figure BDA00024315205600000811
其中ρ0(xk)和π0(xk)分别为初始迭代控制近似误差和初始迭代性能指标函数近似误差。
之后,i=1,2,...时,迭代自适应动态规划算法在如下两式之间进行迭代:
Figure BDA0002431520560000091
Figure BDA0002431520560000092
其中ρi(xk)和πi(xk)分别为第i次迭代控制近似误差和第i次迭代性能指标函数近似误差。
由以上分析可知该算法用迭代性能指标函数
Figure BDA0002431520560000093
来近似最优性能指标函数J*(xk),用迭代控制律
Figure BDA0002431520560000094
来近似最优控制律u*(xk)。因此当i→∞时,该算法应当是收敛的,即
Figure BDA0002431520560000095
Figure BDA0002431520560000096
都收敛到最优值。
然而,由于初始性能指标函数Ψ(xk)是任意给定的,收敛性分析方法不同于其他传统的值迭代。在每一次迭代过程中,无法获得准确的迭代性能指标函数和准确的迭代控制律。这使得收敛性无法保证,为了克服这一缺点,建立了新的收敛性分析方法与收敛性判断标准。
本发明的自适应最优控制方法采用了两个神经网络,即执行网络(ActionNetwork)与评判网络(Critic Network)分别逼近迭代控制律与迭代性能指标函数,使得基于可变误差的非线性系统自适应最优控制方法可以运行并使得迭代性能指标函数收敛到最优性能指标函数的有限临域之内。本发明中,评判网络与执行网络均采用BP神经网络进行构建。
BP神经网络的结构包括输入层、隐含层和输出层三层结构,激活函数为双极S型函数。令隐含层神经元个数为L,输入层与隐含层间权值矩阵为Y,隐含层与输出层间权值矩阵为W,神经网络的输入为X,那么神经网络可以表示为
Figure BDA0002431520560000097
其中σ(YX)∈RL,是神经网络隐含层的输出向量,具体表达式是
Figure BDA0002431520560000101
为了加快神经网络的训练速度,令输入层与隐含层间权值矩阵Y为任意随机权值矩阵。当Y给定后其值固定不变,其值不进行更新,只调节隐含层与输出层权值矩阵W。因此,神经网络可以简化成如下形式
Figure BDA0002431520560000102
对于
Figure BDA0002431520560000103
执行网络的作用是逼近迭代控制律。定义执行网络的逼近目标为
Figure BDA0002431520560000104
执行网络的输出可以表示为
Figure BDA0002431520560000105
其中
Figure BDA0002431520560000106
为执行网络权值。定义执行网络误差为
Figure BDA0002431520560000107
那么执行网络的评价指标可以定义为
Figure BDA0002431520560000108
执行网络权值更新过程可以表示为
Figure BDA0002431520560000109
其中la>0为执行网络的学习律。训练执行网络使得迭代控制律满足
Figure BDA00024315205600001010
那么我们即可获得迭代控制律
Figure BDA00024315205600001011
对于
Figure BDA0002431520560000111
评判网络的作用是逼近迭代性能指标函数。定义评判网络的逼近目标为
Figure BDA0002431520560000112
评判网络的输出可以表示为
Figure BDA0002431520560000113
其中
Figure BDA0002431520560000114
为评判网络权值。定义评判网络误差为
Figure BDA0002431520560000115
那么评判网络的评价指标可以定义为
Figure BDA0002431520560000116
执行网络权值更新过程可以表示为
Figure BDA0002431520560000117
其中lc>0为执行网络的学习律,训练评判网络使得迭代性能指标函数律满足
Figure BDA0002431520560000118
那么我们即可获得迭代性能指标函数
Figure BDA0002431520560000119
可以看到,采用评判网络与执行神经网络,本发明中的迭代自适应动态规划方法即可运行。
Figure BDA00024315205600001110
是随机的可控的状态,对于
Figure BDA00024315205600001111
若步骤6中不等式
Figure BDA00024315205600001112
成立,其中0<qi<1满足,可知当i→∞时,迭代性能指标函数
Figure BDA0002431520560000121
收敛到最优性能指标函数J*(xk)的一个有界邻域内。
有界误差收敛准则的设计过程
由迭代误差σi+1满足
Figure BDA0002431520560000122
可知误差σi+1是参数γi的函数。当获得参数γi后,可以通过迭代误差σi+1来保证迭代性能指标函数
Figure BDA0002431520560000123
收敛。
Figure BDA0002431520560000124
为满足Vi(F(xk,uk))≤γiU(xk,uk)成立的γi的集合。由于近似误差的存在,准确的迭代性能指标函数Vi(xk)通常无法直接获得。因此参数γi无法直接由Vi(F(xk,uk))≤γiU(xk,uk)获得。本发明给出三种算法来获得参数γi
算法I:
步骤I-1、令μ(xk)为任意给定的容许控制。
步骤I-2、对于i=1,2,...,根据μ(xk)构造新的性能指标函数Pi(xk),满足
Pi+1(xk)=U(xk,μ(xk))+Pi(xk+1)
其中P0(xk)=V0(xk)=Ψ(xk);
步骤I-3、给出
Figure BDA0002431520560000125
使其满足
Figure BDA0002431520560000126
步骤I-4、令
Figure BDA0002431520560000127
算法II:
步骤II-1、对于
Figure BDA0002431520560000128
迭代性能指标函数
Figure BDA0002431520560000129
可以通过下式获得
Figure BDA00024315205600001210
其中πi(xk)为评判网络近似误差。
步骤II-2、令|πi(xk)|为πi(xk)的上界。定义新的迭代性能指标函数为
Figure BDA0002431520560000131
步骤II-3、令
Figure BDA0002431520560000132
步骤II-4、由
Figure BDA0002431520560000133
得出
Figure BDA0002431520560000134
步骤II-5、令
Figure BDA0002431520560000135
算法III:
步骤III-1、记录σ 0σ 1,...,σ i-1γ 0γ 1,...,γ i-1
步骤III-2、通过
Figure BDA0002431520560000136
获得迭代性能指标函数
Figure BDA0002431520560000137
通过
Figure BDA0002431520560000138
获得目标迭代性能指标函数Γi(xk);
步骤III-3、对于
Figure BDA0002431520560000139
根据如下不等式
Figure BDA00024315205600001310
获得σ i。如果
Figure BDA00024315205600001311
σ i=1。根据如下不等式
Figure BDA00024315205600001312
获得
Figure BDA00024315205600001313
步骤III-4、令
Figure BDA00024315205600001314
通过下式解出γ i
Figure BDA00024315205600001315
步骤III-5、令γiγ i
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种在智能控制领域的基于可变误差的非线性系统自适应最优控制方法,所述方法通过迭代更新性能指标函数和控制律,并通过迭代性能指标函数近似最优性能指标函数,通过迭代控制律近似最优控制律,得到最优性能指标函数和最优控制律,所述方法包括以下步骤:
步骤1、选择随机初始状态x0;选择任意半正定函数Ψ(xk)≥0,其中
Figure FDA0002431520550000011
是n维的系统状态向量,表示系统时间k时刻的状态量,k表示在时间k时刻,k=0,1,2,...;选择收敛精度ζ;给定参数序列{qi},其中0<qi<1;给定两个常数
Figure FDA0002431520550000012
0<ξ<1分别表示可变误差的衰减率;令迭代参数i=0;
步骤2、令初始性能指标函数
Figure FDA0002431520550000013
并求得参数γ0,使其满足V0(F(xk,uk))≤γ0U(xk,uk),其中F(xk,uk)是系统状态方程,V0(xk)为初始性能指标函数,U(xk,uk)是系统的效用函数,Ψ(xk)为半正定函数,
Figure FDA0002431520550000014
是m维的系统控制向量,表示在时间k时刻的系统输入信号;
步骤3、计算得到初始控制律
Figure FDA0002431520550000015
以及初始迭代性能指标函数
Figure FDA0002431520550000016
其中,ρ0(xk)为迭代控制近似误差,π0(xk)为迭代性能指标函数近似误差;
步骤4、定义单步迭代的目标迭代性能指标函数为
Figure FDA0002431520550000017
定义全局迭代目标函数为
Figure FDA0002431520550000018
计算获得参数σ1使其满足
Figure FDA0002431520550000019
给定任意0<q0≤1,如果σ1满足
Figure FDA00024315205500000110
其中γ0可由步骤2得到,则估计参数γ1使其满足V1(F(xk,uk))≤γ1U(xk,uk),并令i=i+1,继续执行下一步;否则,令
Figure FDA00024315205500000111
阳π0(xk)=ξπ0(xk),返回步骤3继续执行;
步骤5、对于任意i=1,2,...,计算得到迭代控制律
Figure FDA0002431520550000021
和迭代性能指标函数
Figure FDA0002431520550000022
其中ρi(xk)为迭代控制近似误差,πi(xk)迭代性能指标函数近似误差,其中采用两个神经网络,即执行网络与评判网络分别逼近迭代控制律与迭代性能指标函数;
步骤6、定义全局迭代目标函数为
Figure FDA0002431520550000023
根据目标迭代性能指标函数
Figure FDA0002431520550000024
计算获得参数σi使其满足
Figure FDA0002431520550000025
给定任意0<qi≤1,如果σi满足
Figure FDA0002431520550000026
则估计γi+1使其满足Vi+1(F(xk,uk))≤γi+1U(xk,uk),并继续执行下一步,其中γi+1表示在第i+1次迭代时的参数γi的值;否则,令
Figure FDA0002431520550000027
和πi(xk)=ξπi(xk),返回步骤5继续执行;
步骤7、如果
Figure FDA0002431520550000028
ζ是收敛精度,即可获得最优性能指标函数和最优控制律,从而对所述非线性系统进行良好控制;否则令i=i+1继续返回步骤5执行。
2.如权利要求1所述的在智能控制领域的非线性系统自适应最优控制方法,其特征在于,所述评判网络与执行网络均采用BP神经网络进行构建。
3.如权利要求1所述的在智能控制领域的非线性系统自适应最优控制方法,其特征在于,在步骤6中获得参数γi的步骤为:
步骤I-1、令μ(xk)为任意给定的容许控制;
步骤I-2、对于i=1,2,...,根据μ(xk)构造新的性能指标函数Pi(xk),满足Pi+1(xk)=U(xk,μ(xk))+Pi(xk+1),其中P0(xk)=V0(xk)=Ψ(xk);
步骤I-3、给出
Figure FDA0002431520550000029
使其满足
Figure FDA00024315205500000210
步骤I-4、令
Figure FDA00024315205500000211
4.如权利要求1所述的在智能控制领域的非线性系统自适应最优控制方法,其特征在于,在步骤6中获得参数γi的步骤为:
步骤II-1、对于
Figure FDA0002431520550000031
迭代性能指标函数
Figure FDA0002431520550000032
可以通过下式获得:
Figure FDA0002431520550000033
其中πi(xk)为评判网络近似误差;
步骤II-2、令|πi(xk)|为πi(xk)的上界,定义新的迭代性能指标函数为
Figure FDA0002431520550000034
步骤II-3、令
Figure FDA0002431520550000035
步骤II-4、由
Figure FDA0002431520550000036
得出
Figure FDA0002431520550000037
步骤II-5、令
Figure FDA0002431520550000038
5.如权利要求1所述的在智能控制领域的非线性系统自适应最优控制方法,其特征在于,在步骤6中获得参数γi的步骤为:
步骤III-1、记录σ 0σ 1,...,σ i-1γ 0γ 1,...,γ i-1
步骤III-2、通过
Figure FDA0002431520550000039
获得迭代性能指标函数
Figure FDA00024315205500000310
通过
Figure FDA00024315205500000311
获得目标迭代性能指标函数Γi(xk);
步骤III-3、对于
Figure FDA00024315205500000312
根据如下不等式
Figure FDA00024315205500000313
获得σ i;如果
Figure FDA00024315205500000314
σ i=1;根据如下不等式
Figure FDA00024315205500000315
获得
Figure FDA00024315205500000316
步骤III-4、令
Figure FDA00024315205500000317
通过下式解出γ i
Figure FDA00024315205500000318
步骤III-5、令γiγ i
CN202010240156.2A 2015-05-25 2015-05-25 基于可变误差的非线性系统自适应最优控制方法 Active CN111308896B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010240156.2A CN111308896B (zh) 2015-05-25 2015-05-25 基于可变误差的非线性系统自适应最优控制方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010240156.2A CN111308896B (zh) 2015-05-25 2015-05-25 基于可变误差的非线性系统自适应最优控制方法
CN201510272090.4A CN104834221A (zh) 2015-05-25 2015-05-25 一种基于可变误差的非线性系统自适应最优控制方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201510272090.4A Division CN104834221A (zh) 2015-05-25 2015-05-25 一种基于可变误差的非线性系统自适应最优控制方法

Publications (2)

Publication Number Publication Date
CN111308896A CN111308896A (zh) 2020-06-19
CN111308896B true CN111308896B (zh) 2021-07-13

Family

ID=53812175

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202010240156.2A Active CN111308896B (zh) 2015-05-25 2015-05-25 基于可变误差的非线性系统自适应最优控制方法
CN201510272090.4A Pending CN104834221A (zh) 2015-05-25 2015-05-25 一种基于可变误差的非线性系统自适应最优控制方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510272090.4A Pending CN104834221A (zh) 2015-05-25 2015-05-25 一种基于可变误差的非线性系统自适应最优控制方法

Country Status (1)

Country Link
CN (2) CN111308896B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105071421B (zh) * 2015-08-17 2019-03-15 中国科学院自动化研究所 办公建筑能耗管理方法
CN105644548B (zh) * 2015-12-28 2019-07-02 中国科学院深圳先进技术研究院 混合动力汽车的能量控制方法及装置
CN108196446B (zh) * 2017-12-14 2020-04-17 北京理工大学 模型未知的双电机负载的动态规划最优控制方法
CN109031949B (zh) * 2018-07-06 2020-07-28 广东工业大学 一种智能制造系统协同控制方法
CN110531715B (zh) * 2019-08-08 2021-03-02 北京北方华创微电子装备有限公司 Lpcvd工艺生产环境的控制方法及系统
CN110609525B (zh) * 2019-08-20 2021-11-23 南京航空航天大学 一种基于在线adp的非线性时滞系统最优控制方法
CN110888323A (zh) * 2019-11-26 2020-03-17 大连理工大学 一种用于切换系统智能优化的控制方法
CN112149361B (zh) * 2020-10-10 2024-05-17 中国科学技术大学 一种线性系统自适应最优控制方法和装置
CN114488783B (zh) * 2020-10-23 2023-12-22 太原理工大学 一种基于Scara机械臂的神经网络优化控制方法
CN112346342B (zh) * 2020-11-03 2022-10-11 中国人民解放军空军工程大学 一种非仿射动力学系统的单网络自适应评价设计方法
CN112650290B (zh) * 2020-12-24 2023-12-08 广东工业大学 带有扰动补偿的高层消防无人机编队优化控制方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103217899A (zh) * 2013-01-30 2013-07-24 中国科学院自动化研究所 基于数据的q函数自适应动态规划方法
CN103294029A (zh) * 2013-05-15 2013-09-11 华南理工大学 一种针对工业过程的高效数据驱动内模多项式控制器
EP2728425A1 (en) * 2012-11-05 2014-05-07 Rockwell Automation Technologies, Inc. Online integration of model-based optimization and model-less control
CN104238565A (zh) * 2014-09-30 2014-12-24 清华大学 一种应用于容错飞行控制系统的鲁棒控制分配方法
CN104460721A (zh) * 2014-09-23 2015-03-25 北京矿冶研究总院 一种湿法冶金浓密洗涤过程底流浓度优化控制方法
CN104614985A (zh) * 2014-11-27 2015-05-13 北京航空航天大学 一种基于非线性规划的高阶系统最优降阶方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609305B (zh) * 2008-06-18 2011-11-30 中国科学院自动化研究所 一种基于音圈电机的主动隔振控制方法
US8086328B2 (en) * 2008-08-29 2011-12-27 Honeywell International Inc. Systems and methods for vibration rectification error reduction in closed-loop accelerometer systems
JP5159695B2 (ja) * 2009-05-11 2013-03-06 中国電力株式会社 配電系統状態推定方法及び配電系統状態推定装置
US9240360B2 (en) * 2012-07-25 2016-01-19 International Business Machines Corporation Run-to-run control utilizing virtual metrology in semiconductor manufacturing
CN104022503B (zh) * 2014-06-18 2017-01-04 中国科学院自动化研究所 一种带有储能设备的智能微电网电能优化控制方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2728425A1 (en) * 2012-11-05 2014-05-07 Rockwell Automation Technologies, Inc. Online integration of model-based optimization and model-less control
CN103217899A (zh) * 2013-01-30 2013-07-24 中国科学院自动化研究所 基于数据的q函数自适应动态规划方法
CN103294029A (zh) * 2013-05-15 2013-09-11 华南理工大学 一种针对工业过程的高效数据驱动内模多项式控制器
CN104460721A (zh) * 2014-09-23 2015-03-25 北京矿冶研究总院 一种湿法冶金浓密洗涤过程底流浓度优化控制方法
CN104238565A (zh) * 2014-09-30 2014-12-24 清华大学 一种应用于容错飞行控制系统的鲁棒控制分配方法
CN104614985A (zh) * 2014-11-27 2015-05-13 北京航空航天大学 一种基于非线性规划的高阶系统最优降阶方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Adaptive Dynamic Programming for Finite-Horizon Optimal Control of Discrete-Time Nonlinear Systems With ε-Error Bound;Fei-Yue Wang;《IEEE Transactions on Neural Networks》;20110131;第22卷(第1期);全文 *
基于数据的智能电网电能自适应优化调控;王澄;《控制工程》;20140930;第21卷(第5期);全文 *
有限时间ADP算法的若干问题研究;丁强;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20110131(第1期);全文 *

Also Published As

Publication number Publication date
CN104834221A (zh) 2015-08-12
CN111308896A (zh) 2020-06-19

Similar Documents

Publication Publication Date Title
CN111308896B (zh) 基于可变误差的非线性系统自适应最优控制方法
Meng et al. Adaptive neural control of nonlinear MIMO systems with time-varying output constraints
CN104539601B (zh) 动态网络攻击过程可靠性分析方法及系统
CN103324093B (zh) 一种多模型自适应控制系统及其控制方法
CN103886395A (zh) 一种基于神经网络模型的水库优化调度方法
CN109725537A (zh) 一种改进的线性最优半主动控制方法
CN105469142A (zh) 一种基于样本增量驱动的神经网络增量型前馈算法
Hajebi et al. Online adaptive fuzzy logic controller using genetic algorithm and neural network for networked control systems
Setyawan et al. Adaptive Gaussian parameter particle swarm optimization and its implementation in mobile robot path planning
CN114740710A (zh) 一种随机非线性多智能体的强化学习优化编队控制方法
CN108594643B (zh) 一种针对全状态受限严格反馈系统的保性能控制方法
CN112835295B (zh) 基于pi模型的压电陶瓷执行器参数辨识和复合控制方法
CN103209417A (zh) 基于神经网络的频谱占用状态的预测方法以及装置
Du et al. Construction project cost estimation based on improved BP Neural Network
CN106371321A (zh) 一种焦化炉炉膛压力系统模糊网络优化pid控制方法
CN116880191A (zh) 一种基于时序预测的过程工业生产系统的智能控制方法
Wei et al. Adaptive dynamic programming with stable value iteration algorithm for discrete-time nonlinear systems
CN102055694B (zh) 基于粒子群的非线性系统辨识方法
CN114859725A (zh) 一种非线性系统自适应事件触发控制方法及系统
CN105260556B (zh) 发夹变异操作rna遗传算法的桥式吊车建模方法
CN114202063A (zh) 一种基于遗传算法优化的模糊神经网络温室温度预测方法
CN106444389A (zh) 一种废塑料裂解温度系统的模糊rbf网络优化pi控制方法
Song et al. Stable training method for echo state networks with output feedbacks
Sharma et al. Wavelet reduced order observer based adaptive tracking control for a class of uncertain nonlinear systems using reinforcement learning
CN109951874A (zh) 一种传感器网络中实时追踪移动未知节点的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant