CN109932900A - 一种非线性连续系统的权重更新方法 - Google Patents

一种非线性连续系统的权重更新方法 Download PDF

Info

Publication number
CN109932900A
CN109932900A CN201910349572.3A CN201910349572A CN109932900A CN 109932900 A CN109932900 A CN 109932900A CN 201910349572 A CN201910349572 A CN 201910349572A CN 109932900 A CN109932900 A CN 109932900A
Authority
CN
China
Prior art keywords
weight matrix
matrix
feedback controller
weight
nonlinear continuous
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910349572.3A
Other languages
English (en)
Inventor
刘凡
周武能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
National Dong Hwa University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201910349572.3A priority Critical patent/CN109932900A/zh
Publication of CN109932900A publication Critical patent/CN109932900A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

本发明提出了一种新颖的基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法,并保证了系统的稳定性和避免了Zeno效应。反馈控制器是在事件触发机制下,采用神经网络来逼近的。由于控制输入为非线性控制输入,因此比传统线性控制输入应用范围更广。触发机制为利用系统输出值与控制器输出值之差来判断是否满足触发条件。由于采用了事件触发机制,所以与传统控制方法相比,降低了系统的能耗,也节约了资源。

Description

一种非线性连续系统的权重更新方法
技术领域
本发明涉及一种新颖的基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法,主要涉及领域为非线性控制,事件触发机制和神经网络。
背景技术
近几年来,事件触发机制已经广泛运用于众多非线性控制的问题,它主要的优点在于能够降低系统的能耗和运算复杂度。采用事件触发机制的反馈控制器与传统采用周期采用的反馈控制器相比,最大的不同点在于触发机制允许系统误差一直增加直到下一个触发时刻,而不影响系统稳定性能,这也意味着触发时间间隔是不同的。已经有很多种事件触发机制被提出了,也有众多分析系统稳定性的方法被提出,但总体来说,在使用时间触发机制的前提下,Lyapunov直接法是最常用的分析系统稳定性的方法。
非线性系统的控制一直是一个难题,然而线性系统人们已经提出很多成熟而有效的控制方法,因此人们开始尝试利用具有神经网络的反馈控制器去控制非线性系统,让它逐渐逼近线性系统。人们已经证明具有一个输入层,一个隐层和一个输出层的神经网络能够逼近任意连续函数,这使得,在一定情况下,任意给定一个闭环系统矩阵,都可以采用连续的控制使原有的非线性系统趋向于线性系统,而非线性系统的控制输入即是神经网络的输出。
在工业生产中存在大量的非线性控制问题,如电机转速控制,工业机器人控制,自动驾驶汽车控制等。这些问题不仅要求控制速度快,还要求精准,这使得一般的线性反馈控制很难达到控制要求,因此促使了人们研究非线性控制输入。神经网络已经被证明具有良好的逼近性能,因此在非线性控制输入中,常引入神经网络来产生非线性控制输入。
发明内容
本发明的目的是:在非线性控制输入中将事件触发机制与神经网络结合。
为了达到上述目的,本发明的技术方案是提供了一种非线性连续系统的权重更新方法,通过修改反馈控制器中神经网络的权重来实现控制,反馈控制器至少包含输入系统状态向量采样器、零阶保持器、神经网络控制器、神经网络权矩阵更新律和时间触发机制,其特征在于,包括以下步骤
(1)利用反馈控制器的系统状态向量采样器将非线性连续系统的状态向量进行采样,输入反馈控制器的是采样后的状态向量,即分段连续的;
(2)在触发时刻τk,利用反馈控制器的零阶保持器将系统状态向量采样器最后采样的系统状态向量进行保存,并记为 即为输入到所述反馈控制器的所述神经网络控制器系统状态向量;
(3)将反馈控制器的神经网络控制器构建为一个输入层、一个隐层和一个输出层,表示为:
式中,W表示输出层权矩阵;V表示输入层常值权矩阵;g(·)表示控制增益函数;表示隐藏层激活函数,并有u(x)表示表示反馈控制输入;
(4)计算所述非线性连续系统的状态向量x与所述状态向量采样值的差,即事件触发误差e,
(5)将步骤(3)中神经网络控制器的输入权矩阵V设置为常矩阵;
(6)将反馈控制器的神经网络权矩阵更新律设置为如下形式:
式中,W为触发时刻之前步骤(3)中神经网络控制器的输出权矩阵的值;W+为触发时刻之后步骤(3)中神经网络控制器的输出权矩阵的值;表示步骤(2)中保存在零阶保持器中的系统状态向量,并且α>0为神经网络学习率;c>0、κ>0是均为常数;L是一个维数匹配矩阵;表示输出权矩阵的变化率;
(7)设置所述非线性连续系统的期望闭环系统矩阵,记为A;
(8)将反馈控制器的时间触发机制设置为如下形式:
||e||≥σs||x||
式中,是阈值系数,0<Γ<1,是步骤(3)中神经网络权矩阵更新律中的激活函数的Lipschitz常数,qmin是正定对称矩阵Q的最小特征值,P是一个正定对称矩阵,P和Q满足Lyapunov方程:ATP+PA=-Q,gmax是步骤(3)中神经网络控制器的控制增益函数的最大值。
优选地,在步骤(3)中,输出层权矩阵W定义在一个有界紧集上,以使||W||≤Wmax,Wmax为一正数;所述隐藏层激活函数定义在一个有界紧集上,以使 为一正数,同时满足Lipschitz条件,即 为一正常数;所述控制增益函数g(·)定义在一个有界紧集上,以使||g(·)||≤gmax,gmax为一正数。
优选地,在步骤(6)中,在触发时刻τk时,输出权矩阵W更新为W+,然后保持恒定,直至下一触发时刻τk+1
优选地,在步骤(7)中,设置非线性连续系统的期望闭环系统矩阵A,并且当输出权矩阵W稳定趋于稳定值Wf时,非线性连续系统与反馈控制器共同构成的闭环系统表示为
式中,表示渐进误差函数,并有
优选地,在所述步骤(8)之后还包括如下步骤:
(9)若步骤(8)中条件满足,则按步骤(6)中权矩阵更新公式更新权矩阵W;
(10)若步骤(8)中条件满足,则将步骤(4)中时间触发误差e置为零;
(11)若步骤(8)中条件满足,则利用步骤(9)中得到的更新后的权矩阵W来更新σs
(12)若步骤(8)中条件满足,则将系统状态采样器最后一次采样的状态送入所述零阶保持器;
(13)当触发误差||e||小于给定值后,则视为权矩阵已经接近目标权矩阵Wf
本发明保证了系统的稳定性和避免了Zeno效应。反馈控制器是在事件触发机制下,采用神经网络来逼近的。由于控制输入为非线性控制输入,因此比传统线性控制输入应用范围更广。触发机制为利用系统输出值与控制器输出值之差来判断是否满足触发条件。由于采用了事件触发机制,所以与传统控制方法相比,降低了系统的能耗,也节约了资源。
本发明的有效性在于能够在保证系统稳定的前提下,让非线性系统逐渐趋于线性系统,而且神经网络控制器的权矩阵也趋于稳定值,还能够避免Zeno效应的发生。
附图说明
图1是神经网络结构图,其中,W表示输出层权矩阵,V表示输入层常值权矩阵,g(·)表示控制增益函数,表示隐藏层激活函数。
图2是状态反馈事件触发系统结构图,系统状态在事件触发时刻τk被送到零阶保持器,同时,神经网络控制器在权重更新律下,更新权重,计算新的控制输出,并送到零阶保持器。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本实施例以单输入二阶非线性系统来进一步说明本发明。
对于如上的单输入二阶非线性系统,本发明提供的一种基于神经网络的使用事件触发状态反馈控制的非线性连续系统的权重更新方法,包括以下步骤:
(1)利用系统状态向量采样器对上述系统状态x进行采样。
(2)在触发时刻τk,利用零阶保持器将系统状态向量采样器最后一次采样后的系统状态向量进行保存,并记为
(3)初始化期望闭环系统矩阵A,以及正定矩阵Q,并计算||A||,qmin,||P||。
(4)初始化神经网络输入常矩阵V和输出权矩阵W,并计算||W||。
(5)令系统控制输入为
(6)计算gmax
(7)计算非线性连续系统的状态向量x与状态向量采样值的差,即时间触发误差
(8)初始化Γ,α,c和κ并计算σs
(9)判断小数反馈控制器的事件触发条件是否满足
||e||≥σs||x||
若触发条件满足,则按下述权矩阵更新公式更新权矩阵Q。
若触发条件满足,事件触发误差e置为零。
若触发条件满足,利用更新后的权矩阵W和下述公式来更新σs
若触发条件满足,则将系统状态采样器最后一次采样的状态送入所述零阶保持器。
(10)当触发误差||e||小于给定值后,则可视为权矩阵已经接近目标权矩阵Wf

Claims (5)

1.一种非线性连续系统的权重更新方法,通过修改反馈控制器中神经网络的权重来实现控制,反馈控制器至少包含输入系统状态向量采样器、零阶保持器、神经网络控制器、神经网络权矩阵更新律和时间触发机制,其特征在于,包括以下步骤
(1)利用反馈控制器的系统状态向量采样器将非线性连续系统的状态向量进行采样,输入反馈控制器的是采样后的状态向量,即分段连续的;
(2)在触发时刻τk,利用反馈控制器的零阶保持器将系统状态向量采样器最后采样的系统状态向量进行保存,并记为即为输入到所述反馈控制器的所述神经网络控制器系统状态向量;
(3)将反馈控制器的神经网络控制器构建为一个输入层、一个隐层和一个输出层,表示为:
式中,W表示输出层权矩阵;V表示输入层常值权矩阵;g(·)表示控制增益函数;表示隐藏层激活函数,并有u(x)表示反馈控制输入;
(4)计算所述非线性连续系统的状态向量x与所述状态向量采样值的差,即事件触发误差e,
(5)将步骤(3)中神经网络控制器的输入权矩阵V设置为常矩阵;
(6)将反馈控制器的神经网络权矩阵更新律设置为如下形式:
式中,W为触发时刻之前步骤(3)中神经网络控制器的输出权矩阵的值;W+为触发时刻之后步骤(3)中神经网络控制器的输出权矩阵的值;表示步骤(2)中保存在零阶保持器中的系统状态向量,并且α>0为神经网络学习率;c>0、κ>0是一个常数;L是一个维数匹配矩阵;表示输出权矩阵的变化率;
(7)设置所述非线性连续系统的期望闭环系统矩阵,记为A;
(8)将反馈控制器的时间触发机制设置为如下形式:
||e||≥σs||x||
式中,是阈值系数,0<Γ<1,是步骤(3)中神经网络权矩阵更新律中的激活函数的Lipschitz常数,qmin是正定对称矩阵Q的最小特征值,P是一个正定对称矩阵,P和Q满足Lyapunov方程:ATP+PA=-Q,gmax是步骤(3)中神经网络控制器的控制增益函数的最大值。
2.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在步骤(3)中,输出层权矩阵W定义在一个有界紧集上,以使||W||≤Wmax,Wmax为一正数;所述隐藏层激活函数定义在一个有界紧集上,以使 为一正数,同时满足Lipschitz条件,即 表示一个正常数;所述控制增益函数g(·)定义在一个有界紧集上,以使||g(·)||≤gmax,gmax为一正数。
3.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在步骤(6)中,在触发时刻τk时,输出权矩阵W更新为W+,然后保持恒定,直至下一触发时刻τk+1
4.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在步骤(7)中,设置非线性连续系统的期望闭环系统矩阵A,并且当输出权矩阵W稳定趋于稳定值Wf时,非线性连续系统与反馈控制器共同构成的闭环系统表示为
式中,表示渐进误差函数,并有
5.根据权利要求1中所述的一种非线性连续系统的权重更新方法,其特征在于,在所述步骤(8)之后还包括如下步骤:
(9)若步骤(8)中条件满足,则按步骤(6)中权矩阵更新公式更新权矩阵W;
(10)若步骤(8)中条件满足,则将步骤(4)中时间触发误差e置为零;
(11)若步骤(8)中条件满足,则利用步骤(9)中得到的更新后的权矩阵W来更新σs
(12)若步骤(8)中条件满足,则将系统状态采样器最后一次采样的状态送入所述零阶保持器;
(13)当触发误差||e||小于给定值后,则视为权矩阵已经接近目标权矩阵Wf
CN201910349572.3A 2019-04-28 2019-04-28 一种非线性连续系统的权重更新方法 Pending CN109932900A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910349572.3A CN109932900A (zh) 2019-04-28 2019-04-28 一种非线性连续系统的权重更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910349572.3A CN109932900A (zh) 2019-04-28 2019-04-28 一种非线性连续系统的权重更新方法

Publications (1)

Publication Number Publication Date
CN109932900A true CN109932900A (zh) 2019-06-25

Family

ID=66991069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910349572.3A Pending CN109932900A (zh) 2019-04-28 2019-04-28 一种非线性连续系统的权重更新方法

Country Status (1)

Country Link
CN (1) CN109932900A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191021A (zh) * 2021-05-26 2021-07-30 深圳大学 基于乘性测量不确定性的触发控制方法、装置及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130226851A1 (en) * 2012-02-29 2013-08-29 Qualcomm Incorporated Method and apparatus for modeling neural resource based synaptic placticity
CN104951425A (zh) * 2015-07-20 2015-09-30 东北大学 一种基于深度学习的云服务性能自适应动作类型选择方法
US9489623B1 (en) * 2013-10-15 2016-11-08 Brain Corporation Apparatus and methods for backward propagation of errors in a spiking neuron network
CN108356816A (zh) * 2018-01-12 2018-08-03 南京邮电大学 基于输出位置的单臂机械手事件触发adp控制器结构
CN108942935A (zh) * 2018-07-24 2018-12-07 南京邮电大学 基于输出位置的单臂机械手自适应控制器及控制方法
CN109683477A (zh) * 2018-12-12 2019-04-26 中国地质大学(武汉) 一种随机多智能体系统有限时间控制器的设计方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130226851A1 (en) * 2012-02-29 2013-08-29 Qualcomm Incorporated Method and apparatus for modeling neural resource based synaptic placticity
US9489623B1 (en) * 2013-10-15 2016-11-08 Brain Corporation Apparatus and methods for backward propagation of errors in a spiking neuron network
CN104951425A (zh) * 2015-07-20 2015-09-30 东北大学 一种基于深度学习的云服务性能自适应动作类型选择方法
CN108356816A (zh) * 2018-01-12 2018-08-03 南京邮电大学 基于输出位置的单臂机械手事件触发adp控制器结构
CN108942935A (zh) * 2018-07-24 2018-12-07 南京邮电大学 基于输出位置的单臂机械手自适应控制器及控制方法
CN109683477A (zh) * 2018-12-12 2019-04-26 中国地质大学(武汉) 一种随机多智能体系统有限时间控制器的设计方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AVIMANYU SAHOO 等: "Neural network-based event-triggered state feedback control of nonlinear continuous-time system", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
崔黎黎 等: "非线性零和微分对策的事件触发自适应动态规划算法", 《控制理论与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191021A (zh) * 2021-05-26 2021-07-30 深圳大学 基于乘性测量不确定性的触发控制方法、装置及相关设备
CN113191021B (zh) * 2021-05-26 2022-02-01 深圳大学 基于乘性测量不确定性的触发控制方法、装置及相关设备

Similar Documents

Publication Publication Date Title
CN102621889B (zh) 一种压电陶瓷定位的复合控制方法
CN111308896B (zh) 基于可变误差的非线性系统自适应最优控制方法
Liu et al. Adaptive fixed-time hierarchical sliding mode control for switched under-actuated systems with dead-zone constraints via event-triggered strategy
CN107577146B (zh) 基于摩擦整体逼近的伺服系统的神经网络自适应控制方法
CN108490787A (zh) 基于事件触发的饱和系统复合非线性反馈控制器设计方法
CN108710301B (zh) 压电陶瓷作动器迟滞非线性在线辨识和补偿的方法及系统
CN111431168A (zh) 含干扰的非线性多机电力系统的输出反馈控制方法
Chen et al. Zap Q-Learning with nonlinear function approximation
CN109932900A (zh) 一种非线性连续系统的权重更新方法
CN111966226A (zh) 一种基于补偿型长短期记忆网络的触感通信容错方法及系统
CN110048694A (zh) 基于变元步长的随机傅里叶特征核最小均方算法
CN106094524A (zh) 基于输入趋势补偿的快速模型预测控制方法
Wang et al. Finite-time performance guaranteed event-triggered adaptive control for nonlinear systems with unknown control direction
Zhang et al. Adaptive event-triggered fuzzy tracking control of uncertain stochastic nonlinear systems with unmeasurable states
CN111399376B (zh) 一种t-s模糊系统的二维重复控制器设计优化方法
Chen et al. Zap q-learning with nonlinear function approximation
Kaufmann Penultimate approximations in extreme value theory
CN110794676A (zh) 基于Hammerstein-Wiener模型的CSTR过程非线性控制方法
Zhang et al. pth moment asymptotic interval stability and stabilization of linear stochastic systems via generalized H-representation
CN108520141B (zh) 一种压电陶瓷作动器的迟滞非线性模拟方法
Abramov Optimal control of a large dam
CN110244752B (zh) 一种高超声速飞行器专家智能控制方法及飞行器
CN108646567B (zh) 一种核电站稳压器压力被控对象动态矩阵控制方法
CN112286125A (zh) 电机驱动风扇事件触发固定时间容错控制方法及系统
Aquino et al. Minimax Control Problems: Optimality Conditions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190625