CN109932900A - 一种非线性连续系统的权重更新方法 - Google Patents
一种非线性连续系统的权重更新方法 Download PDFInfo
- Publication number
- CN109932900A CN109932900A CN201910349572.3A CN201910349572A CN109932900A CN 109932900 A CN109932900 A CN 109932900A CN 201910349572 A CN201910349572 A CN 201910349572A CN 109932900 A CN109932900 A CN 109932900A
- Authority
- CN
- China
- Prior art keywords
- weight matrix
- matrix
- feedback controller
- weight
- nonlinear continuous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Feedback Control In General (AREA)
Abstract
本发明提出了一种新颖的基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法,并保证了系统的稳定性和避免了Zeno效应。反馈控制器是在事件触发机制下,采用神经网络来逼近的。由于控制输入为非线性控制输入,因此比传统线性控制输入应用范围更广。触发机制为利用系统输出值与控制器输出值之差来判断是否满足触发条件。由于采用了事件触发机制,所以与传统控制方法相比,降低了系统的能耗,也节约了资源。
Description
技术领域
本发明涉及一种新颖的基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法,主要涉及领域为非线性控制,事件触发机制和神经网络。
背景技术
近几年来,事件触发机制已经广泛运用于众多非线性控制的问题,它主要的优点在于能够降低系统的能耗和运算复杂度。采用事件触发机制的反馈控制器与传统采用周期采用的反馈控制器相比,最大的不同点在于触发机制允许系统误差一直增加直到下一个触发时刻,而不影响系统稳定性能,这也意味着触发时间间隔是不同的。已经有很多种事件触发机制被提出了,也有众多分析系统稳定性的方法被提出,但总体来说,在使用时间触发机制的前提下,Lyapunov直接法是最常用的分析系统稳定性的方法。
非线性系统的控制一直是一个难题,然而线性系统人们已经提出很多成熟而有效的控制方法,因此人们开始尝试利用具有神经网络的反馈控制器去控制非线性系统,让它逐渐逼近线性系统。人们已经证明具有一个输入层,一个隐层和一个输出层的神经网络能够逼近任意连续函数,这使得,在一定情况下,任意给定一个闭环系统矩阵,都可以采用连续的控制使原有的非线性系统趋向于线性系统,而非线性系统的控制输入即是神经网络的输出。
在工业生产中存在大量的非线性控制问题,如电机转速控制,工业机器人控制,自动驾驶汽车控制等。这些问题不仅要求控制速度快,还要求精准,这使得一般的线性反馈控制很难达到控制要求,因此促使了人们研究非线性控制输入。神经网络已经被证明具有良好的逼近性能,因此在非线性控制输入中,常引入神经网络来产生非线性控制输入。
发明内容
本发明的目的是:在非线性控制输入中将事件触发机制与神经网络结合。
为了达到上述目的,本发明的技术方案是提供了一种非线性连续系统的权重更新方法,通过修改反馈控制器中神经网络的权重来实现控制,反馈控制器至少包含输入系统状态向量采样器、零阶保持器、神经网络控制器、神经网络权矩阵更新律和时间触发机制,其特征在于,包括以下步骤
(1)利用反馈控制器的系统状态向量采样器将非线性连续系统的状态向量进行采样,输入反馈控制器的是采样后的状态向量,即分段连续的;
(2)在触发时刻τk,利用反馈控制器的零阶保持器将系统状态向量采样器最后采样的系统状态向量进行保存,并记为 即为输入到所述反馈控制器的所述神经网络控制器系统状态向量;
(3)将反馈控制器的神经网络控制器构建为一个输入层、一个隐层和一个输出层,表示为:
式中,W表示输出层权矩阵;V表示输入层常值权矩阵;g(·)表示控制增益函数;表示隐藏层激活函数,并有u(x)表示表示反馈控制输入;
(4)计算所述非线性连续系统的状态向量x与所述状态向量采样值的差,即事件触发误差e,
(5)将步骤(3)中神经网络控制器的输入权矩阵V设置为常矩阵;
(6)将反馈控制器的神经网络权矩阵更新律设置为如下形式:
式中,W为触发时刻之前步骤(3)中神经网络控制器的输出权矩阵的值;W+为触发时刻之后步骤(3)中神经网络控制器的输出权矩阵的值;表示步骤(2)中保存在零阶保持器中的系统状态向量,并且α>0为神经网络学习率;c>0、κ>0是均为常数;L是一个维数匹配矩阵;表示输出权矩阵的变化率;
(7)设置所述非线性连续系统的期望闭环系统矩阵,记为A;
(8)将反馈控制器的时间触发机制设置为如下形式:
||e||≥σs||x||
式中,是阈值系数,0<Γ<1,是步骤(3)中神经网络权矩阵更新律中的激活函数的Lipschitz常数,qmin是正定对称矩阵Q的最小特征值,P是一个正定对称矩阵,P和Q满足Lyapunov方程:ATP+PA=-Q,gmax是步骤(3)中神经网络控制器的控制增益函数的最大值。
优选地,在步骤(3)中,输出层权矩阵W定义在一个有界紧集上,以使||W||≤Wmax,Wmax为一正数;所述隐藏层激活函数定义在一个有界紧集上,以使 为一正数,同时满足Lipschitz条件,即 为一正常数;所述控制增益函数g(·)定义在一个有界紧集上,以使||g(·)||≤gmax,gmax为一正数。
优选地,在步骤(6)中,在触发时刻τk时,输出权矩阵W更新为W+,然后保持恒定,直至下一触发时刻τk+1。
优选地,在步骤(7)中,设置非线性连续系统的期望闭环系统矩阵A,并且当输出权矩阵W稳定趋于稳定值Wf时,非线性连续系统与反馈控制器共同构成的闭环系统表示为
式中,表示渐进误差函数,并有
优选地,在所述步骤(8)之后还包括如下步骤:
(9)若步骤(8)中条件满足,则按步骤(6)中权矩阵更新公式更新权矩阵W;
(10)若步骤(8)中条件满足,则将步骤(4)中时间触发误差e置为零;
(11)若步骤(8)中条件满足,则利用步骤(9)中得到的更新后的权矩阵W来更新σs;
(12)若步骤(8)中条件满足,则将系统状态采样器最后一次采样的状态送入所述零阶保持器;
(13)当触发误差||e||小于给定值后,则视为权矩阵已经接近目标权矩阵Wf。
本发明保证了系统的稳定性和避免了Zeno效应。反馈控制器是在事件触发机制下,采用神经网络来逼近的。由于控制输入为非线性控制输入,因此比传统线性控制输入应用范围更广。触发机制为利用系统输出值与控制器输出值之差来判断是否满足触发条件。由于采用了事件触发机制,所以与传统控制方法相比,降低了系统的能耗,也节约了资源。
本发明的有效性在于能够在保证系统稳定的前提下,让非线性系统逐渐趋于线性系统,而且神经网络控制器的权矩阵也趋于稳定值,还能够避免Zeno效应的发生。
附图说明
图1是神经网络结构图,其中,W表示输出层权矩阵,V表示输入层常值权矩阵,g(·)表示控制增益函数,表示隐藏层激活函数。
图2是状态反馈事件触发系统结构图,系统状态在事件触发时刻τk被送到零阶保持器,同时,神经网络控制器在权重更新律下,更新权重,计算新的控制输出,并送到零阶保持器。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本实施例以单输入二阶非线性系统来进一步说明本发明。
对于如上的单输入二阶非线性系统,本发明提供的一种基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法,包括以下步骤:
(1)利用系统状态向量采样器对上述系统状态x进行采样。
(2)在触发时刻τk,利用零阶保持器将系统状态向量采样器最后一次采样后的系统状态向量进行保存,并记为
(3)初始化期望闭环系统矩阵A,以及正定矩阵Q,并计算||A||,qmin,||P||。
(4)初始化神经网络输入常矩阵V和输出权矩阵W,并计算||W||。
(5)令系统控制输入为
(6)计算gmax,和
(7)计算非线性连续系统的状态向量x与状态向量采样值的差,即时间触发误差
(8)初始化Γ,α,c和κ并计算σs。
(9)判断小数反馈控制器的事件触发条件是否满足
||e||≥σs||x||
若触发条件满足,则按下述权矩阵更新公式更新权矩阵Q。
若触发条件满足,事件触发误差e置为零。
若触发条件满足,利用更新后的权矩阵W和下述公式来更新σs。
若触发条件满足,则将系统状态采样器最后一次采样的状态送入所述零阶保持器。
(10)当触发误差||e||小于给定值后,则可视为权矩阵已经接近目标权矩阵Wf。
Claims (5)
1.一种非线性连续系统的权重更新方法,通过修改反馈控制器中神经网络的权重来实现控制,反馈控制器至少包含输入系统状态向量采样器、零阶保持器、神经网络控制器、神经网络权矩阵更新律和时间触发机制,其特征在于,包括以下步骤
(1)利用反馈控制器的系统状态向量采样器将非线性连续系统的状态向量进行采样,输入反馈控制器的是采样后的状态向量,即分段连续的;
(2)在触发时刻τk,利用反馈控制器的零阶保持器将系统状态向量采样器最后采样的系统状态向量进行保存,并记为即为输入到所述反馈控制器的所述神经网络控制器系统状态向量;
(3)将反馈控制器的神经网络控制器构建为一个输入层、一个隐层和一个输出层,表示为:
式中,W表示输出层权矩阵;V表示输入层常值权矩阵;g(·)表示控制增益函数;表示隐藏层激活函数,并有u(x)表示反馈控制输入;
(4)计算所述非线性连续系统的状态向量x与所述状态向量采样值的差,即事件触发误差e,
(5)将步骤(3)中神经网络控制器的输入权矩阵V设置为常矩阵;
(6)将反馈控制器的神经网络权矩阵更新律设置为如下形式:
式中,W为触发时刻之前步骤(3)中神经网络控制器的输出权矩阵的值;W+为触发时刻之后步骤(3)中神经网络控制器的输出权矩阵的值;表示步骤(2)中保存在零阶保持器中的系统状态向量,并且α>0为神经网络学习率;c>0、κ>0是一个常数;L是一个维数匹配矩阵;表示输出权矩阵的变化率;
(7)设置所述非线性连续系统的期望闭环系统矩阵,记为A;
(8)将反馈控制器的时间触发机制设置为如下形式:
||e||≥σs||x||
式中,是阈值系数,0<Γ<1,是步骤(3)中神经网络权矩阵更新律中的激活函数的Lipschitz常数,qmin是正定对称矩阵Q的最小特征值,P是一个正定对称矩阵,P和Q满足Lyapunov方程:ATP+PA=-Q,gmax是步骤(3)中神经网络控制器的控制增益函数的最大值。
2.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在步骤(3)中,输出层权矩阵W定义在一个有界紧集上,以使||W||≤Wmax,Wmax为一正数;所述隐藏层激活函数定义在一个有界紧集上,以使 为一正数,同时满足Lipschitz条件,即 表示一个正常数;所述控制增益函数g(·)定义在一个有界紧集上,以使||g(·)||≤gmax,gmax为一正数。
3.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在步骤(6)中,在触发时刻τk时,输出权矩阵W更新为W+,然后保持恒定,直至下一触发时刻τk+1。
4.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在步骤(7)中,设置非线性连续系统的期望闭环系统矩阵A,并且当输出权矩阵W稳定趋于稳定值Wf时,非线性连续系统与反馈控制器共同构成的闭环系统表示为
式中,表示渐进误差函数,并有
5.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在所述步骤(8)之后还包括如下步骤:
(9)若步骤(8)中条件满足,则按步骤(6)中权矩阵更新公式更新权矩阵W;
(10)若步骤(8)中条件满足,则将步骤(4)中时间触发误差e置为零;
(11)若步骤(8)中条件满足,则利用步骤(9)中得到的更新后的权矩阵W来更新σs;
(12)若步骤(8)中条件满足,则将系统状态采样器最后一次采样的状态送入所述零阶保持器;
(13)当触发误差||e||小于给定值后,则视为权矩阵已经接近目标权矩阵Wf。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910349572.3A CN109932900A (zh) | 2019-04-28 | 2019-04-28 | 一种非线性连续系统的权重更新方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910349572.3A CN109932900A (zh) | 2019-04-28 | 2019-04-28 | 一种非线性连续系统的权重更新方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109932900A true CN109932900A (zh) | 2019-06-25 |
Family
ID=66991069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910349572.3A Pending CN109932900A (zh) | 2019-04-28 | 2019-04-28 | 一种非线性连续系统的权重更新方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109932900A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191021A (zh) * | 2021-05-26 | 2021-07-30 | 深圳大学 | 基于乘性测量不确定性的触发控制方法、装置及相关设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130226851A1 (en) * | 2012-02-29 | 2013-08-29 | Qualcomm Incorporated | Method and apparatus for modeling neural resource based synaptic placticity |
CN104951425A (zh) * | 2015-07-20 | 2015-09-30 | 东北大学 | 一种基于深度学习的云服务性能自适应动作类型选择方法 |
US9489623B1 (en) * | 2013-10-15 | 2016-11-08 | Brain Corporation | Apparatus and methods for backward propagation of errors in a spiking neuron network |
CN108356816A (zh) * | 2018-01-12 | 2018-08-03 | 南京邮电大学 | 基于输出位置的单臂机械手事件触发adp控制器结构 |
CN108942935A (zh) * | 2018-07-24 | 2018-12-07 | 南京邮电大学 | 基于输出位置的单臂机械手自适应控制器及控制方法 |
CN109683477A (zh) * | 2018-12-12 | 2019-04-26 | 中国地质大学(武汉) | 一种随机多智能体系统有限时间控制器的设计方法及系统 |
-
2019
- 2019-04-28 CN CN201910349572.3A patent/CN109932900A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130226851A1 (en) * | 2012-02-29 | 2013-08-29 | Qualcomm Incorporated | Method and apparatus for modeling neural resource based synaptic placticity |
US9489623B1 (en) * | 2013-10-15 | 2016-11-08 | Brain Corporation | Apparatus and methods for backward propagation of errors in a spiking neuron network |
CN104951425A (zh) * | 2015-07-20 | 2015-09-30 | 东北大学 | 一种基于深度学习的云服务性能自适应动作类型选择方法 |
CN108356816A (zh) * | 2018-01-12 | 2018-08-03 | 南京邮电大学 | 基于输出位置的单臂机械手事件触发adp控制器结构 |
CN108942935A (zh) * | 2018-07-24 | 2018-12-07 | 南京邮电大学 | 基于输出位置的单臂机械手自适应控制器及控制方法 |
CN109683477A (zh) * | 2018-12-12 | 2019-04-26 | 中国地质大学(武汉) | 一种随机多智能体系统有限时间控制器的设计方法及系统 |
Non-Patent Citations (2)
Title |
---|
AVIMANYU SAHOO 等: "Neural network-based event-triggered state feedback control of nonlinear continuous-time system", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 * |
崔黎黎 等: "非线性零和微分对策的事件触发自适应动态规划算法", 《控制理论与应用》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113191021A (zh) * | 2021-05-26 | 2021-07-30 | 深圳大学 | 基于乘性测量不确定性的触发控制方法、装置及相关设备 |
CN113191021B (zh) * | 2021-05-26 | 2022-02-01 | 深圳大学 | 基于乘性测量不确定性的触发控制方法、装置及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107728475B (zh) | 带有执行器饱和的切换系统事件触发控制设计方法 | |
CN109062041A (zh) | 基于事件触发的t-s模糊网络系统的控制方法 | |
CN108107725B (zh) | 基于事件触发的二阶时变时延多智能体系统包容控制方法 | |
CN111308896B (zh) | 基于可变误差的非线性系统自适应最优控制方法 | |
CN111431168A (zh) | 含干扰的非线性多机电力系统的输出反馈控制方法 | |
Chadli et al. | Static output feedback for Takagi-Sugeno systems: An LMI approach | |
CN109188907A (zh) | 一种应用于稳定平台控制系统的遗传退火粒子群混合算法及其稳定平台控制系统 | |
CN106802569B (zh) | 一种补偿执行机构死区非线性的自适应状态反馈控制方法 | |
Chen et al. | Zap Q-Learning with nonlinear function approximation | |
CN109932900A (zh) | 一种非线性连续系统的权重更新方法 | |
CN110308650B (zh) | 一种基于数据驱动的压电陶瓷驱动器控制方法 | |
Wang et al. | Output‐feedback stabilization of a class of stochastic high‐order nonlinear systems with stochastic inverse dynamics and multidelay | |
CN110048694A (zh) | 基于变元步长的随机傅里叶特征核最小均方算法 | |
CN106094524A (zh) | 基于输入趋势补偿的快速模型预测控制方法 | |
Wang et al. | Finite-time performance guaranteed event-triggered adaptive control for nonlinear systems with unknown control direction | |
CN116079741B (zh) | 一种电机驱动单连杆机械臂的自适应控制方法 | |
CN110244752B (zh) | 一种高超声速飞行器专家智能控制方法及飞行器 | |
Kaufmann | Penultimate approximations in extreme value theory | |
CN110095985A (zh) | 一种观测器设计方法和抗干扰控制系统 | |
CN110794676A (zh) | 基于Hammerstein-Wiener模型的CSTR过程非线性控制方法 | |
Zhang et al. | pth moment asymptotic interval stability and stabilization of linear stochastic systems via generalized H-representation | |
CN108520141B (zh) | 一种压电陶瓷作动器的迟滞非线性模拟方法 | |
Abramov | Optimal control of a large dam | |
Yuan et al. | Event-triggered adaptive prescribed performance tracking for nonlinear time-varying systems with unknown control directions | |
CN108646567B (zh) | 一种核电站稳压器压力被控对象动态矩阵控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190625 |