CN112346342A - 一种非仿射动力学系统的单网络自适应评价设计方法 - Google Patents
一种非仿射动力学系统的单网络自适应评价设计方法 Download PDFInfo
- Publication number
- CN112346342A CN112346342A CN202011213022.8A CN202011213022A CN112346342A CN 112346342 A CN112346342 A CN 112346342A CN 202011213022 A CN202011213022 A CN 202011213022A CN 112346342 A CN112346342 A CN 112346342A
- Authority
- CN
- China
- Prior art keywords
- vector
- affine
- neural network
- performance index
- optimal control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 title claims abstract description 27
- 238000011156 evaluation Methods 0.000 title claims abstract description 12
- 239000013598 vector Substances 0.000 claims abstract description 60
- 238000013528 artificial neural network Methods 0.000 claims abstract description 32
- 230000003416 augmentation Effects 0.000 claims abstract description 24
- 238000005183 dynamical system Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 22
- 230000000694 effects Effects 0.000 description 8
- 238000004088 simulation Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
一种非仿射动力学系统的单网络自适应评价设计方法,包括以下步骤:建立非仿射连续动力学系统模型;定义增广向量,建立一次增广系统;设计辅助系统;基于一次增广系统和辅助系统,建立二次增广系统;设计性能指标函数;定义哈密尔顿‑雅可比‑贝尔曼方程;求解哈密尔顿‑雅可比‑贝尔曼方程,利用神经网络对性能指标函数进行求解,计算神经网络的权值向量;将性能指标函数的最优值代入最优控制律的表达式中,得到最终的最优控制律。本发明方法将单网络ACD方法拓展到了非仿射连续动力学系统的应用中,可用于各种非仿射连续动力学系统的最优控制,既适用于非仿射动力学系统,又适用于仿射动力学系统。
Description
技术领域
本发明属于自动控制技术领域,尤其涉及一种基于数据的非仿射动力学系统的自适应评价设计方法。
背景技术
自适应评价设计(Adaptive Critic Design,以下简称ACD)是近年来兴起的一种求解复杂动力学系统最优控制问题的新方法。ACD一般可分为单网络ACD和双网络ACD,单网络ACD仅含有评价网,双网络ACD同时含有评价网和执行网。和双网络ACD相比,单网络ACD的结构更为简单,所需的在线学习量更低,因而具有更好的应用前景。
公开号为CN110176776A号中国发明专利申请公开了一种基于鲁棒自适应评价设计的静止无功补偿器控制方法,设计了基于神经网络自适应评价的鲁棒自适应反步控制方案,实现了含有静止无功补偿器的电力系统的稳定控制。但是该方法是针对离散系统设计的,而在绝大多数的实际工程应用中,如飞行器控制系统、电动机控制系统,机器人控制系统等非仿射系统都是连续系统,该专利公开的方法无法应用于连续系统中。而且该专利公开的控制方法是基于动力学系统的数学模型建立的,对模型具有很强的依赖性,工程实用性十分有限。
发明内容
本发明的目的在于提供一种非仿射动力学系统的单网络自适应评价设计方法。
为了实现上述目的,本发明采取如下的技术解决方案:
一种非仿射动力学系统的单网络自适应评价设计方法,包括以下步骤:
S8、求解哈密尔顿-雅可比-贝尔曼方程,得到最优控制律;
S8-1、采用神经网络逼近性能指标函数,对性能指标函数进行估计,Vu(z(t))=(Wz)THz(z(t)),式中的Wz为神经网络的权值向量,Hz(z(t))为神经网络的基函数向量,利用神经网络计算得到Vu(z(t))后,由Vu(z(t))对z(t)求偏导,得到
由以上技术方案可知,本发明方法在建立一次增广系统后,通过定义辅助系统,将一次增广系统扩展为二次增广系统,从而使本发明方法适用于非仿射系统;同时引入神经网络对性能指标函数进行逼近,并为神经网络权值设计不依赖模型的更新律,将神经网络逼近对系统状态的偏导数代入先前求得的最优控制律,得到最终的最优控制律。本发明方法是单网络ACD方法,结构简单,计算量少,而且通过二次增广系统弥补了传统单网络ACD只适用于仿射动力学系统的技术缺陷,将现有单网络ACD方法拓展到了非仿射动力学系统的应用中,可用于各种非仿射动力学系统的最优控制。由于仿射动力学系统是非仿射动力学系统的一种特殊形式,因此,本发明方法既适用于非仿射动力学系统,又适用于仿射动力学系统。此外,本发明方法利用数据信息对神经网络权值进行更新,神经网络权值的逐次更新,摆脱了控制器对系统模型的依赖,克服了现有基于自适应评价设计的控制方法存在的复杂动力学系统建模困难、基于模型的单网络ACD方法具有局限性的不足,提高了工程实用性。
附图说明
图1为本发明方法的流程图;
图2为本发明实施例的仿真跟踪效果图;
图3为本发明实施例的仿真控制输入效果图;
图4为本发明实施例的仿真神经网络权值效果图。
下面结合附图和各实施例对本发明进一步详细说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明方法的流程图,下面结合图1,对本发明的方法进行说明。如图1所示,本发明方法包括以下步骤:
S1、建立非仿射连续动力学系统模型,该动力学系统模型为:式中的t表示时间,为系统函数向量,为状态向量,υ(t)为控制输入向量,其中,系统函数向量系统函数向量的元素是李普希茨连续的,状态向量n为动力学系统的状态的数量,控制输入向量υ(t)=[υ1(t),υ2(t),…,υm(t)]T,m为动力学系统的控制输入的数量,(·)T表示矩阵倒置;
S8、求解哈密尔顿-雅可比-贝尔曼方程,得到最优控制律;
S8-1、采用神经网络逼近性能指标函数,对性能指标函数进行估计,Vu(z(t))=(Wz)THz(z(t)),式中的Wz为神经网络的权值向量,Hz(z(t))为神经网络的基函数向量,神经网络可为任意类型的神经网络;利用神经网络计算得到Vu(z(t))后,由Vu(z(t))对z(t)求偏导,得到性能指标函数的最优值 表示求偏导;
S8-2、设计权值向量Wz的更新律:
Wz (i)表示权值向量第j次的更新值,j=1,2,3,…∞,u(j)(t)为权值向量第j次更新时的控制输入,即权值向量Wz会随j逐次更新,使控制输入达到最优,Ξ=<[Hz(z(t+T))-Hz(z(t))],[Hz(z(t+T))-Hz(z(t))]T>,T为一时间常数,时间常数的取值为经验值,高动态系统T的取值较小,如可为0.001~0.1,低动态系统T的取值较大,如可为0.1~1;步骤S8-1和步骤S8-2为两个平行的步骤,执行顺序上没有先后;
S8-3、将步骤S8-1得到的代入最优控制律的表达式中,并基于步骤S8-2的权值向量的更新律,得到最终的最优控制律:由于神经网络的权值向量不断随j逐次更新,本发明的控制律也会随之动态更新,直至到达最优的控制输入。
下面以一个电动机控制系统为例,对本发明的控制方法的效果进行仿真验证。电动机控制系统、机械手系统都是常规的二阶非仿射动力学系统,即以下实施例是对二阶非仿射动力学系统进行控制。首先,
基于一次增广系统和辅助系统,得到二次增广系统
求解哈密尔顿-雅可比-贝尔曼方程,得到最优控制律:
Vu(z(t))=(Wz)THz(z(t)),对性能指标函数进行估计,得到性能指标函数的最优值本实施例所用的神经网络的基函数向量Hz(z)=[hz,1(z),hz,2(z),hz,3(z)],其中, 神经网络的权值向量Wz=[w1,w2,…,w21]T;
下面利用按照本发明方法确定的最优控制律对电动机控制系统进行仿真控制,仿真条件如下:采用Matlab2012软件进行仿真。系统的控制效果如图2至图4所示。图2显示了本发明实施例的跟踪效果,从图2可以看出,本发明方法实现了系统状态对各自参考指令的精确跟踪。图3显示了控制输入的效果图,从图3可以看出,原始的控制输入υ(t)与由辅助系统的引入的控制输入u(t)均收敛。图4为神经网络权值效果图,从图4可以看出,神经网络所有权值均是收敛的。以上的仿真结果证明了本发明方法的有效性,本发明方法能实现对参考指令的精确跟踪,神经网络权值与控制输入均有界,表明闭环控制系统是稳定的。
以上所述,仅是本发明的较佳实施例而已,并非对本发明做任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (1)
1.一种非仿射动力学系统的单网络自适应评价设计方法,其特征在于,包括以下步骤:
S8、求解哈密尔顿-雅可比-贝尔曼方程,得到最优控制律;
S8-1、采用神经网络逼近性能指标函数,对性能指标函数进行估计,Vu(z(t))=(Wz)THz(z(t)),式中的Wz为神经网络的权值向量,Hz(z(t))为神经网络的基函数向量,利用神经网络计算得到Vu(z(t))后,由Vu(z(t))对z(t)求偏导,得到
S8-2、设计权值Wz的更新律:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011213022.8A CN112346342B (zh) | 2020-11-03 | 2020-11-03 | 一种非仿射动力学系统的单网络自适应评价设计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011213022.8A CN112346342B (zh) | 2020-11-03 | 2020-11-03 | 一种非仿射动力学系统的单网络自适应评价设计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112346342A true CN112346342A (zh) | 2021-02-09 |
CN112346342B CN112346342B (zh) | 2022-10-11 |
Family
ID=74356009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011213022.8A Expired - Fee Related CN112346342B (zh) | 2020-11-03 | 2020-11-03 | 一种非仿射动力学系统的单网络自适应评价设计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112346342B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113300365A (zh) * | 2021-07-14 | 2021-08-24 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应动态规划的有源电力滤波器控制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105487376A (zh) * | 2015-12-30 | 2016-04-13 | 南京航空航天大学 | 一种基于数据驱动单网络结构的最优控制方法 |
CN107894709A (zh) * | 2017-04-24 | 2018-04-10 | 长春工业大学 | 基于自适应评价网络冗余机器人视觉伺服控制 |
CN110176776A (zh) * | 2019-06-26 | 2019-08-27 | 东北大学 | 一种基于鲁棒自适应评价设计的静止无功补偿器控制方法 |
CN110320804A (zh) * | 2019-07-19 | 2019-10-11 | 中国人民解放军空军工程大学 | 一种非仿射动力学系统的控制方法 |
CN111308896A (zh) * | 2015-05-25 | 2020-06-19 | 中国科学院自动化研究所 | 基于可变误差的非线性系统自适应最优控制方法 |
-
2020
- 2020-11-03 CN CN202011213022.8A patent/CN112346342B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111308896A (zh) * | 2015-05-25 | 2020-06-19 | 中国科学院自动化研究所 | 基于可变误差的非线性系统自适应最优控制方法 |
CN105487376A (zh) * | 2015-12-30 | 2016-04-13 | 南京航空航天大学 | 一种基于数据驱动单网络结构的最优控制方法 |
CN107894709A (zh) * | 2017-04-24 | 2018-04-10 | 长春工业大学 | 基于自适应评价网络冗余机器人视觉伺服控制 |
CN110176776A (zh) * | 2019-06-26 | 2019-08-27 | 东北大学 | 一种基于鲁棒自适应评价设计的静止无功补偿器控制方法 |
CN110320804A (zh) * | 2019-07-19 | 2019-10-11 | 中国人民解放军空军工程大学 | 一种非仿射动力学系统的控制方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113300365A (zh) * | 2021-07-14 | 2021-08-24 | 云南电网有限责任公司电力科学研究院 | 一种基于自适应动态规划的有源电力滤波器控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112346342B (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111459051B (zh) | 一种带扰动观测器的离散终端滑模无模型控制方法 | |
Yang et al. | Adaptive neural prescribed performance tracking control for near space vehicles with input nonlinearity | |
Liu et al. | Adaptive fuzzy output tracking control for a class of uncertain nonlinear systems | |
Shi et al. | Adaptive fuzzy prescribed performance control for MIMO nonlinear systems with unknown control direction and unknown dead-zone inputs | |
Yang et al. | SGD-based adaptive NN control design for uncertain nonlinear systems | |
CN114217524A (zh) | 一种基于深度强化学习的电网实时自适应决策方法 | |
Shao et al. | Event-based adaptive fuzzy fixed-time control for nonlinear interconnected systems with non-affine nonlinear faults | |
CN112327631B (zh) | 一种粒子群优化rbf神经网络的pid控制方法 | |
CN111399376B (zh) | 一种t-s模糊系统的二维重复控制器设计优化方法 | |
CN112346342B (zh) | 一种非仿射动力学系统的单网络自适应评价设计方法 | |
CN111474922A (zh) | 一种连续非线性系统的控制器构建方法 | |
CN113325717B (zh) | 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质 | |
Mitra et al. | ANFIS based automatic voltage regulator with hybrid learning algorithm | |
Lu et al. | Adaptive finite-time anti-disturbance fuzzy control for uncertain time-delay nonlinear systems and its application to SVC | |
CN113820954A (zh) | 一种广义噪声下复杂非线性系统的容错控制方法 | |
Tanemura et al. | Closed-loop data-driven estimation on passivity property | |
Song et al. | Adaptive Fuzzy Control for a Class of MIMO Nonlinear Systems with Bounded Control Inputs. | |
CN110095985A (zh) | 一种观测器设计方法和抗干扰控制系统 | |
CN112731801B (zh) | 一种对称死区非线性的自适应动态面输出反馈控制方法 | |
Wang et al. | Adaptive neural control for MIMO nonlinear systems with state time-varying delay | |
Abbas et al. | Radial basis function neural network-based adaptive control of uncertain nonlinear systems | |
CN116954086B (zh) | 一种抽水蓄能机组调节系统智能预测控制方法及装置 | |
CN114744946B (zh) | 基于宽度学习干扰观测器的永磁同步电机控制方法及系统 | |
Xie et al. | Data-driven based method for power system time-varying composite load modeling | |
CN110504709B (zh) | 光伏集群无功电压调控方法、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20221011 |