CN108536008A - 一种多输入多输出非线性系统的迭代学习控制方法 - Google Patents
一种多输入多输出非线性系统的迭代学习控制方法 Download PDFInfo
- Publication number
- CN108536008A CN108536008A CN201810184276.8A CN201810184276A CN108536008A CN 108536008 A CN108536008 A CN 108536008A CN 201810184276 A CN201810184276 A CN 201810184276A CN 108536008 A CN108536008 A CN 108536008A
- Authority
- CN
- China
- Prior art keywords
- iteration
- unknown
- iterative learning
- matrix
- learning control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
Abstract
本发明公开了一种多输入多输出非线性系统的迭代学习控制方法,包括如下步骤:(1)赋全部初值和跟踪参考轨迹值进行未知参数的时域‑迭代域解耦;(2)构建全部未知参数组成的未知矩阵向量;(3)设计基于最小二乘法的迭代学习控制方法。本发明针对多输入多输出系统,实现在有限时间内的多个跟踪轨迹的跟踪误差渐近收敛;针对多种迭代变化的未知参数,设计未知参数估计矩阵,一次估计全部未知向量矩阵,学习收敛性好;被控系统中的非线性函数仅要求满足线性增长条件,系统满足条件更宽泛,适应性更广。
Description
技术领域
本发明涉及非线性系统控制方法,尤其涉及一种多输入多输出系统的迭代学习控制方法。
背景技术
迭代学习控制起源于真实工业场所中的机械臂的控制研究,所以其被控系统必须满足能不断重复运行的要求,这样,我们可以充分利用多次反复运行中所能得到的信息(比如多次运行中的控制输入信息、输出跟踪误差信息、可测状态信息等)以弥补工业场所中肯定存在的多种系统不确定性。此时,限制迭代学习控制算法应用的主要有两个因素:其一,工业系统大部分是多输入多输出的,要想较好的将设计的算法应用于实际被控系统,仅针对简单的单输入单输出系统设计迭代学习控制律肯定是不能满足实际控制要求的;其二,实际系统在多次重复运行中肯定存在大量的多种非严格重复量,比如非严格重复的初态定位,非严格重复的系统变量,非严格重复的跟踪轨迹等。
系统中的非严格重复量的变化模式可以分为两类,随机有界变化和按照某种规律变化。针对机械臂抓取物品轨迹的变化方式进行分析发现,沿迭代轴方向机械臂线性的变化轨迹可综合表述为满足某种高阶内模。这样,可将高阶内模用数学公式描述成迭代域-时域变化的耦合变量。因此,被控系统中存在的多种非严格重复情况就可分为两类,随机有界变化和满足高阶内模变化规律。多种非严格重复情况加大了进行未知参数估计和迭代学习控制律设计的难度。
因此,如何针对存在多种非严格重复变化的多输入多输出系统,进行迭代学习控制律设计,实现在有限时间内的高精度跟踪成为研究非线性控制技术的重要内容之一。但是,考虑到设计的复杂性,类似的研究还很少见。
发明内容
发明目的:针对现有技术存在的问题,本发明的目的是提供一种针对多种变化模式的非严格重复问题,仅需要一次未知参数估计,即可实现在有限时间内渐近跟踪的多输入多输出系统的迭代学习控制方法,解决了一类存在高阶内模产生的未知参数的多输入多输出非线性系统中存在的跟踪精度低的问题,
技术方案:一种多输入多输出非线性系统的迭代学习控制方法,所述多输入多输出系统的离散时间动力学模型为:
其中,t∈{0,1,…,T}代表离散时间;k=1,2,…代表被控系统可重复运行的次数,即迭代次数;xk(t)∈Rn代表可测的系统状态;uk(t)∈Rn代表系统输入;l=1,2,…p代表系统中的未知参数;ξ(l)(xk(t),t)∈Rn,l=1,2,…p代表系统中的已知有界向量值函数;包括如下步骤:
(1)赋全部初值和跟踪参考轨迹值进行未知参数的时域-迭代域解耦;
(2)构建全部未知参数组成的未知矩阵向量;
(3)设计基于最小二乘法的迭代学习控制方法;
所述动力学模型满足如下先验条件:
条件1:非线性函数ξ(l)(xk(t),t)满足线性增长条件,即都有
|ξ(l)(xk(t),t)‖≤a1+a2‖xk(t)‖,l=1,2,…,p
其中,0<a1<∞,0<a2<∞;
条件2:对于所有的t∈{0,1,…,T}和k∈Z+,在迭代域上随机变化的状态初值xk(0)和跟踪参考轨迹都一致有界;
条件3:系统未知参数随时间-迭代变化而变化,且变化方式满足如下的高阶内模:
其中,i=1,2,…,ml代表已知的高阶内模系数。
所述步骤(1)中,具体包括如下内容:
(1.1)寻找合适的控制输入序列uk(t),t∈{0,1,…,T-1},使得当迭代次数k→∞时,系统状态xk(t)沿着迭代轴渐近跟踪到理想参考轨迹
(1.2)高阶内模产生的系统未知参数是时域-迭代域变化的,进行时域-迭代域解耦:
用ω表示迭代域的变化情况,满足
将公式中的系统未知参数的变化模式改写如下:
其中,
(1.3)定义矩阵向量有:
其中,是由高阶内模已知系数构成的矩阵;将(B(l))k的末行记为由得:
其中,
在中,未知时变-迭代变化的参数被解耦成两部分,迭代变化的已知向量部分,即以及时变的未知向量初值部分,即
所述步骤(2)中,具体包括如下内容:
(2.1)定义第k次迭代时的跟踪误差为:
由于
其中,是已知矩阵,结合上述两式,将跟踪误差表示为:
(2.2)令得:
其中,Ψ(t)是系统中的全部未知参数构成的未知矩阵向量。
所述步骤(3)中,具体包括如下内容:
(3.1)设计第k次迭代时的控制输入:
其中,是对未知矩阵Ψ(t)的第k次估计;
(3.2)的基于最小二乘法的学习更新律为:
其中,是正定学习增益矩阵,其迭代学习律为:
其中,In∈Rn×n是单位矩阵。
所述外循环的迭代次数k的结束条件设置为“系统跟踪误差是否小于等于某个给定误差值”,所述给定误差值和被控系统状态相关。当被控系统要求精度比较高时,如高精度场合机械臂的定位控制,要求给定误差可等于毫米级或更小。
此外,循环的迭代次数k的结束条件还可以设置为“迭代次数是否达到某个给定值”,所述给定值和被控系统相关。例如在永磁同步电机的速度跟踪控制中,一般要求迭代次数至少小于100次,即可实现控制目标。
有益效果
与现有技术相比,本发明具有如下显著进步:1、针对多输入多输出系统,实现在有限时间内的多个跟踪轨迹的跟踪误差渐近收敛;2、针对多种迭代变化的未知参数,设计未知参数估计矩阵,一次估计全部未知向量矩阵,学习收敛性好;3、被控系统中的非线性函数仅要求满足线性增长条件,系统满足条件更宽泛,适应性更广。
附图说明
图1为本发明的一种多输入多输出系统的迭代学习控制方法原理图;
图2为本发明多输入多输出系统的迭代学习控制方法的流程图;
图3a为二输入二输出非线性系统的实施例中,系统跟踪最大绝对值误差的跟踪曲线图;
图3b为二输入二输出非线性系统的实施例中,系统跟踪最大绝对值误差的跟踪曲线图;
图3c为二输入二输出非线性系统的实施例中,跟踪参考轨迹的时域-迭代域变化曲线图;
图3d是二输入二输出非线性系统的实施例中,跟踪参考轨迹的时域-迭代域变化曲线图。
具体实施方式
下面结合实施例和附图对本发明的技术方案作进一步详细说明。
在对未知参数进行时域-迭代域解耦的基础上,本发明引入最小二乘法进行全部未知参数构成的未知矩阵向量的估计,并引入一种新的迭代学习控制算法,使得轨迹跟踪误差在有限时间内渐近收敛。本发明的迭代学习控制方法同时解决了高阶内模产生的未知参数、跟踪轨迹和初态定位的非严格重复问题。
如图1所示,本发明的一种多输入多输出系统的迭代学习控制方法,主要内容如下:
1)未知参数的时域-迭代域解耦;
本发明的应用对象是一类多输入多输出非线性系统。一般离散时间动力学模型可以如下式表示:
其中,t∈{0,1,…,T}代表离散时间;k=1,2,…代表被控系统可重复运行的次数,即迭代次数;xk(t)∈Rn代表可测的系统状态;uk(t)∈Rn代表系统输入;l=1,2,…p代表系统中的未知参数;ξ(l)(xk(t),t)∈Rn,l=1,2,...p代表系统中的已知有界向量值函数。
此外,对于上述一般动力学系统模型进行迭代学习控制方法设计需要满足如下先验条件:
条件1:非线性函数ξ(l)(xk(t),t)满足线性增长条件,即都有
||ξ(l)(xk(t),t)||≤a1+a2||xk(t)||,l=1,2,…,p (2)
其中,0<a1<∞,0<a2<∞。
条件2:对于所有的t∈{0,1,…,T}和k∈Z+,在迭代域上随机变化的状态初值xk(0)和跟踪参考轨迹都一致有界。
条件3:系统未知参数随时间-迭代变化而变化,且变化方式满足如下的高阶内模:
其中,i=1,2,…,ml代表已知的高阶内模系数。
高阶内模是一种描述时间轴-迭代轴变化的一般线性方式。
在一个实施例中,高阶内模变化方式包括了比例变化方式,此时,
在另一个实施例中,高阶内模变化方式包括了仅随时间轴变化而不随迭代轴变化的情况,此时
控制目的是寻找合适的控制输入序列uk(t),t∈{0,1,…,T-1}使得当迭代次数k→∞时,系统状态xk(t)沿着迭代轴渐近跟踪到理想参考轨迹
高阶内模产生的系统未知参数(3)是时域-迭代域变化的。为了更好的分析系统中的未知情况,进行时域-迭代域解耦。
用ω表示迭代域的变化情况,满足
公式(3)中的系统未知参数的变化模式可改写如下:
其中,
定义矩阵向量有:
其中,是由高阶内模已知系数构成的矩阵。
将(B(l))k的最后一行记为由公式(5)可得:
其中,
在公式(6)中,未知时变-迭代变化的参数被解耦成两部分,迭代变化的已知向量部分,即和时变的未知向量初值部分,即部分。
2)构建全部未知参数组成的未知矩阵向量;
定义第k次迭代时的跟踪误差为:
由于
其中,是已知矩阵,再将公式(8)代入公式(7),跟踪误差可表示为:
令可得:
其中,Ψ(t)是系统中的全部未知参数构成的未知矩阵向量。
3)设计基于最小二乘法的迭代学习控制方法;
设计第k次迭代时的控制输入是
其中,是对未知矩阵Ψ(t)的第k次估计。
的基于最小二乘法的学习更新律为
其中,是正定学习增益矩阵。
正定学习增益矩阵的迭代学习律为:
其中,In∈Rn×n是单位矩阵。
如图2所示为本发明的流程示意图,首先赋全部初值和跟踪参考轨迹值。其次,令外循环为k,内循环为t,在内循环t中,计算系统跟踪误差、已知矩阵向量、未知参数估计矩阵向量、控制输入和系统状态变量,其中,内循环结束条件为时间t达到某个给定值,这个给定值是和被控系统状态相关的。外循环结束条件为系统跟踪误差是否小于等于某个给定误差,这个给定值是和被控系统状态相关的。在一些实施例中,外循环的结束条件设置为迭代次数是否达到某个给定值,这个给定值是和被控系统相关的。
通过以上流程设计,并为多输入多输出系统的迭代学习控制方法合理选择正定学习增益矩阵初值,可以得到迭代学习的正定学习增益矩阵、迭代学习控制输入和未知参数估计矩阵向量,使得基于最小二乘法的迭代学习控制方法能在多输入多输出的非线性系统上准确工作。
由于本发明中设计的控制方法适用于多种非线性系统,选择了下面的二输入二输出非线性系统进行了仿真实验,来阐明该发明所设计的方法的有效性。
被控系统的系统方程如下:
其中,和代表三个未知参数。
的迭代变化规律满足如下的高阶内模:
其中,的迭代变化的初值如下:
的迭代变化规律满足如下的高阶内模:
其中,的迭代变化的初值如下:
的迭代变化规律满足如下的高阶内模:
其中,的迭代变化的初值如下:
系统跟踪参考轨迹为:
其中,l=1,2,为随机变量。
根据公式(6),可求出随时变-迭变的已知矩阵向量为:
根据公式(6),可知则把(B(1))k的最后一行记为根据公式(6)还可得
根据公式(6),同理可知则把(B(2))k的最后一行记为根据公式(6)还可得
根据公式(6),同理可知则把(B(3))k的最后一行记为根据公式(6)还可得
根据公式(11)可知,Ψ(t)=[1.4sin(0.02πt),0.3cos(0.01πt),0.1sin(0.02πt),0.1cos(0.01πt),10-4πt2(0.5-0.01t/8)/3,10-4t2(1.5-0.01t)]T;取学习增益矩阵初值为根据公式(11)、(12)和(13)进行基于多输入多输出系统的迭代学习控制方法计算,获得仿真结果。
本发明将非严格重复性分解为由高阶内模引起的非严格重复性和随机有界变化的非严格重复性两种类型,引入状态空间模型重构方法,对高阶内模的未知基函数进行解耦,并设计未知参数矩阵向量,再利用最小二乘法设计未知参数估计律,进行未知参数的统一估计。随机有界变化的状态初值定位和参考轨迹则利用自适应迭代学习算法解决。所提出的迭代学习控制算法针对多种变化模式的非严格重复问题,仅需要一次未知参数估计,实现了在有限时间内的渐近跟踪。
由图3a-3d可见,针对多输入多输出的非线性系统,采用基于最小二乘法的迭代学习控制后,即使被控系统有诸多时域-迭代域变化的未知变量,系统跟踪参考轨迹是时域-迭代域变化的,且系统状态初值随机有界变化,系统跟踪误差渐近收敛到零。
Claims (6)
1.一种多输入多输出非线性系统的迭代学习控制方法,所述多输入多输出系统的离散时间动力学模型为:
其中,t∈{0,1,...,T}代表离散时间;k=1,2,...代表被控系统可重复运行的次数,即迭代次数;xk(t)∈Rn代表可测的系统状态;uk(t)∈Rn代表系统输入;l=1,2,...p代表系统中的未知参数;ξ(l)(xk(t),t)∈Rn,l=1,2,...p代表系统中的已知有界向量值函数;其特征在于,包括如下步骤:
(1)赋全部初值和跟踪参考轨迹值进行未知参数的时域-迭代域解耦;
(2)构建全部未知参数组成的未知矩阵向量;
(3)设计基于最小二乘法的迭代学习控制方法;
所述动力学模型满足如下先验条件:
条件1:非线性函数ξ(l)(xk(t),t)满足线性增长条件,即都有
||ξ(l)(xk(t),t)||≤a1+a2||xk(t)||,l=1,2,…,p
其中,0<a1<∞,0<a2<∞;
条件2:对于所有的t∈{0,1,…,T}和k∈Z+,在迭代域上随机变化的状态初值xk(0)和跟踪参考轨迹都一致有界;
条件3:系统未知参数随时间-迭代变化而变化,且变化方式满足如下的高阶内模:
其中,i=1,2,…,ml代表已知的高阶内模系数。
2.根据权利要求1所述的多输入多输出系统的迭代学习控制方法,其特征在于,所述步骤(1)中,具体包括如下内容:
(1.1)寻找合适的控制输入序列uk(t),t∈{0,1,…,T-1},使得当迭代次数k→∞时,系统状态xk(t)沿着迭代轴渐近跟踪到理想参考轨迹
(1.2)高阶内模产生的系统未知参数是时域-迭代域变化的,进行时域-迭代域解耦:
用ω表示迭代域的变化情况,满足
将公式中的系统未知参数的变化模式改写如下:
其中,
(1.3)定义矩阵向量有:
其中,是由高阶内模已知系数构成的矩阵;将(B(l))k的末行记为由得:
其中,
在中,未知时变-迭代变化的参数被解耦成两部分,迭代变化的已知向量部分,即以及时变的未知向量初值部分,即
3.根据权利要求2所述的多输入多输出系统的迭代学习控制方法,其特征在于,所述步骤(2)中,具体包括如下内容:
(2.1)定义第k次迭代时的跟踪误差为:
由于
其中,是已知矩阵,结合上述两式,将跟踪误差表示为:
(2.2)令得:
其中,Ψ(t)是系统中的全部未知参数构成的未知矩阵向量。
4.根据权利要求3所述的多输入多输出系统的迭代学习控制方法,其特征在于,所述步骤(3)中,具体包括如下内容:
(3.1)设计第k次迭代时的控制输入:
其中,是对未知矩阵Ψ(t)的第k次估计;
(3.2)的基于最小二乘法的学习更新律为:
其中,是正定学习增益矩阵,其迭代学习律为:
其中,In∈Rn×n是单位矩阵。
5.根据权利要求1所述的多输入多输出系统的迭代学习控制方法,其特征在于:所述外循环的迭代次数k的结束条件设置为“系统跟踪误差是否小于等于某个给定误差值”,所述给定误差值和被控系统的类型、控制目的及精度要求相关。
6.根据权利要求1所述的多输入多输出系统的迭代学习控制方法,其特征在于:所述外循环的迭代次数k的结束条件设置为“迭代次数是否达到某个给定值”,所述给定值和被控系统的类型、控制目的及精度要求相关。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810184276.8A CN108536008A (zh) | 2018-03-07 | 2018-03-07 | 一种多输入多输出非线性系统的迭代学习控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810184276.8A CN108536008A (zh) | 2018-03-07 | 2018-03-07 | 一种多输入多输出非线性系统的迭代学习控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108536008A true CN108536008A (zh) | 2018-09-14 |
Family
ID=63486792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810184276.8A Pending CN108536008A (zh) | 2018-03-07 | 2018-03-07 | 一种多输入多输出非线性系统的迭代学习控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108536008A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111459031A (zh) * | 2020-04-21 | 2020-07-28 | 青岛科技大学 | 一种面向学习的扰动观测器设计方法 |
CN113110063A (zh) * | 2021-05-08 | 2021-07-13 | 江南大学 | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008199020A (ja) * | 2007-02-15 | 2008-08-28 | Asml Netherlands Bv | リソグラフィ装置およびデバイス製造方法 |
CN104049534A (zh) * | 2014-04-29 | 2014-09-17 | 河海大学常州校区 | 微陀螺仪的自适应迭代学习控制方法 |
CN104330972A (zh) * | 2014-10-30 | 2015-02-04 | 清华大学 | 一种基于模型自适应的综合预测迭代学习控制方法 |
CN107423861A (zh) * | 2017-08-09 | 2017-12-01 | 北京工业大学 | 基于迭代学习的空气质量预测方法 |
-
2018
- 2018-03-07 CN CN201810184276.8A patent/CN108536008A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008199020A (ja) * | 2007-02-15 | 2008-08-28 | Asml Netherlands Bv | リソグラフィ装置およびデバイス製造方法 |
CN104049534A (zh) * | 2014-04-29 | 2014-09-17 | 河海大学常州校区 | 微陀螺仪的自适应迭代学习控制方法 |
CN104330972A (zh) * | 2014-10-30 | 2015-02-04 | 清华大学 | 一种基于模型自适应的综合预测迭代学习控制方法 |
CN107423861A (zh) * | 2017-08-09 | 2017-12-01 | 北京工业大学 | 基于迭代学习的空气质量预测方法 |
Non-Patent Citations (4)
Title |
---|
BAOBIN LIU 等: "Adaptive iterative learning control for a class of MIMO discrete-time nonlinear systems", 《THE 11TH INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE & EDUCATION (ICCSE 2016)》 * |
BAOBIN LIU 等: "Projection algorithm based adaptive iterative learning control for a class of discrete-time systems", 《2015 27TH CHINESE CONTROL AND DECISION CONFERENCE (CCDC)》 * |
丁健 等: "基于遗忘因子最小二乘的自适应学习控制", 《控制工程》 * |
刘保彬 等: "基于高阶内模的鲁棒自适应迭代学习控制", 《控制工程》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111459031A (zh) * | 2020-04-21 | 2020-07-28 | 青岛科技大学 | 一种面向学习的扰动观测器设计方法 |
CN113110063A (zh) * | 2021-05-08 | 2021-07-13 | 江南大学 | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 |
CN113110063B (zh) * | 2021-05-08 | 2022-05-31 | 江南大学 | 单轴进给系统的鲁棒单调收敛点对点迭代学习控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105205313B (zh) | 模糊高斯和粒子滤波方法、装置及目标跟踪方法、装置 | |
CA2718911C (en) | Method of multi-dimensional nonlinear control | |
CN105955031B (zh) | 非线性预测控制的fpga硬件加速控制器及其加速实现方法 | |
Hou et al. | Terminal impact angle constraint guidance with dual sliding surfaces and model-free target acceleration estimator | |
Fu et al. | Intelligent decoupling control of nonlinear multivariable systems and its application to a wind tunnel system | |
CN108536008A (zh) | 一种多输入多输出非线性系统的迭代学习控制方法 | |
Sentoni et al. | Approximate models for nonlinear process control | |
De Canete et al. | Object-oriented approach applied to ANFIS modeling and control of a distillation column | |
Chow et al. | A real-time learning control approach for nonlinear continuous-time system using recurrent neural networks | |
Li et al. | Discrete-time multi-player games based on off-policy Q-learning | |
Wen et al. | Novel data-driven two-dimensional Q-learning for optimal tracking control of batch process with unknown dynamics | |
Fu et al. | Robust adaptive nonlinear observer design via multi-time scales neural network | |
Song et al. | Adaptive dynamic programming: single and multiple controllers | |
CN110084324B (zh) | 基于极限学习机的卡尔曼滤波参数自适应更新方法 | |
Zhang et al. | Particle-swarm-optimization-based 2D output feedback robust constraint model predictive control for batch processes | |
CN111624872B (zh) | 一种基于自适应动态规划的pid控制器参数整定方法及系统 | |
Arshad et al. | Deep Deterministic Policy Gradient to Regulate Feedback Control Systems Using Reinforcement Learning. | |
CN110888323A (zh) | 一种用于切换系统智能优化的控制方法 | |
CN107168066A (zh) | 一种温室环境自适应控制方法 | |
Osman et al. | Predictive Functional Controller design for pneumatic actuator with stiffness characteristic | |
Tanemura et al. | Closed-loop data-driven estimation on passivity property | |
CN109946964B (zh) | 一种基于非严格重复问题的复杂非线性系统学习控制方法 | |
Algamal et al. | Reliability estimation of three parameters Weibull distribution based on particle swarm optimization | |
Khan et al. | Nonlinear robust observer design using an invariant manifold approach | |
Zhang et al. | Neural network identification and control for nonlinear dynamic systems with time delay |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180914 |