CN105487376B - 一种基于数据驱动单网络结构的最优控制方法 - Google Patents

一种基于数据驱动单网络结构的最优控制方法 Download PDF

Info

Publication number
CN105487376B
CN105487376B CN201511025977.XA CN201511025977A CN105487376B CN 105487376 B CN105487376 B CN 105487376B CN 201511025977 A CN201511025977 A CN 201511025977A CN 105487376 B CN105487376 B CN 105487376B
Authority
CN
China
Prior art keywords
sample
sampling period
training sample
svm
control law
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201511025977.XA
Other languages
English (en)
Other versions
CN105487376A (zh
Inventor
孙景亮
刘春生
魏阿龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201511025977.XA priority Critical patent/CN105487376B/zh
Publication of CN105487376A publication Critical patent/CN105487376A/zh
Application granted granted Critical
Publication of CN105487376B publication Critical patent/CN105487376B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开了一种基于数据驱动单网络结构的最优控制方法,通过不断更新训练样本加入LS‑SVM模型从而在线逼近最优性能指标函数对系统状态变量x的偏导数,然后通过最优控制律表达式直接计算得到,既省去了控制器网络,使结构更加简单,又减少了传统计算方法中的每次迭代中涉及到的计算过程,提高了执行速度。

Description

一种基于数据驱动单网络结构的最优控制方法
技术领域
本发明涉及智能控制领域,尤其涉及一种基于数据驱动单网络结构的最优控制方法。
背景技术
本世纪50~60年代,在空间技术发展和数字计算机实用化的推动下,最优控制技术在航空航天、工业生产、通信系统、机器人系统等复杂系统领域发挥出中流砥柱的作用。最优控制是使控制系统的性能指标达到最小的基本条件和综合方法。其研究的主要问题是:根据已建立的被控对象的时域数学模型或频域数学模型,选择一个容许控制律,使得被控对象按照预定要求运行,并使给定的某一性能指标达到最优值。
自适应动态规划自20世纪80年代提出以来,得到了快速发展,它有效地解决了最优控制“维数灾”的问题,在求解最优控制HJB方程中发挥出巨大的优势。自适应动态规划控制结构通常为actor-critic结构,即策略性能指标评价过程和策略更新过程,并且每个过程通过神经网络逼近器实现,通过策略迭代的方式更新,逐渐逼近最优解用来逼近最优性能指标函数和最优控制策略。
然而,随着科学技术的快速发展,控制系统日益复杂,通常具有高度的非线性、未知的动态特性、模型不确定等特性,其精确的数学模型往往无法建立。如此,自适应动态规划技术便不能发挥优势。再者,经典的actor-critic结构要求控制器必须具有两个逼近网络,分别去逼近最优代价函数和最优控制策略,这必然造成控制器的复杂和冗余,影响其在实际系统中的应用。另外,神经网络逼近器由于其本身的局限,例如:局部极值、过学习、适应性差等,使得最优控制器效果欠佳。
相比之下,支持向量机(SVM)具备全局最优、适应性强、理论完善等优点,尤其是最小二乘支持向量机(LS-SVM)将求解二次规划问题转化为求解线性方程的问题,简化了求解过程,提高了逼近器的学习速度。因此,如何利用上述优点,设计一种不完全依赖于系统模型,且结构简单的最优控制器尤为重要。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种基于数据驱动单网络结构的最优控制方法,以便满足复杂系统模型难以建立、控制器结构复杂等技术问题。
为实现以上技术目的,本发明将采取以下的技术方案:
一种基于数据驱动单网络结构的最优控制方法,包括以下步骤:
一种基于数据驱动单网络结构的最优控制方法,用于对满足利普希茨稳定的非线性系统进行控制,其特征在于:包括顺序执行的以下步骤:
步骤1、初始化:随机选择系统初始状态x0;选择半正定函数Q(x)≥0;选择对称正定矩阵R;选择LS-SVM逼近器的参数;设定训练样本集长度为L并随机选择训练样本加入训练样本集构成初始的训练样本集;设定新增样本集长度为l;设定阈值0<δ<1、容许逼近误差0<ε<1;设定样本采样周期T;
步骤2、选择一个初始稳定控制器作用于系统;
步骤3、实时检测系统当前t时刻系统状态变量xt与控制变量ut
步骤4、在每个采样周期内,将采集到的((xt,ut),λt-1(x))作为该采样周期的样本,其中状态-动作对(xt,ut)作为LS-SVM逼近器的输入样本,正则函数λ(x)在前一采样周期t-1时刻的值λt-1(x)作为LS-SVM逼近器的输出样本;
步骤5、根据||λt-1(x)-λt-2(x)||≤δ判断本次采样周期的样本中的输出样本与前一个采样周期的样本中的输出样本是否相近,若上式成立则舍弃本次采样周期的样本,否则将本次采样周期的样本加入至新增样本集;
步骤6、判断新增样本集是否溢出,是则将新增样本集所有样本全部加入训练样本集,并从训练样本集中相应地移除相同规模的已存在的训练样本,移除时按照这些已存在的训练样本加入训练样本集的先后顺序遵循先进先出原则进行,否则继续步骤5;
步骤7、将步骤6中获得的训练样本集中的所有样本加入LS-SVM逼近器,得到LS-SVM逼近器的输出,即为正则函数λt(x);
步骤8、利用正则函数λt(x),通过表达式直接求解得到本次迭代周期的控制律ut+1(t),并作用于控制系统;上式中,g(x)为输入耦合矩阵,此处g(x)中的x为系统状态变量xt的缩写,T表示转置;
步骤9、根据||ut+1(t)-ut(t)||≤ε判断本次迭代周期的控制律ut+1(t)与前一次迭代周期的控制率ut(t)是否有明显变化,若上式成立则表示还未得到最优控制率,返回步骤3,否则将ut+1(t)作为最优控制律输出,学习结束。
有益效果:
与传统的actor-critic控制结构以及神经网络逼近器相比,本发明提出的基于数据驱动单网络结构的最优控制方法省去了控制器网络,从而减少了控制器网络造成的误差影响;本发明中的评价网络利用LS-SVM模型逼近系统的最优正则函数,而非最优代价函数。具体优点包括:
1、本发明提出的基于数据驱动单网络结构的最优控制方法不依赖于精确的数学模型,从而对环境具有更好的适应能力;
2、单网络结构省去了控制器网络,使得整体控制器结构变得更为简洁,且相应地省去了控制器网络造成的误差影响;
3、LS-SVM逼近器较神经网络逼近器具有全局最优、适应性强、计算简单、理论完善等优点;
4、基于数据驱动方式避免了权值自适应更新方式不易实现的缺点。
附图说明
图1是本发明基于数据驱动单网络最优控制方法流程图;
图2是本发明基于数据驱动单网络最优控制方法的LS-SVM实现框图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
本发明所研究的非线性系统可表述如下:
其中,x(t)是系统状态变量同下文中出现的xt,f(x(t))为系统内部动态特性,g(x(t))是输入耦合矩阵,u(t)为控制输入向量同下文中出现的ut。系统初始状态为x(0)=x0,且f(x(t))+g(x(t))u(t)满足利普希茨稳定。为了表达简洁,下文中会出现将x(t)缩写为x、u(t)缩写为u的情况。
定义最优控制性能指标函数为:
其中,r(x,u)=Q(x)+uTRu,上标T表示矩阵或向量的转置(下文相同),Q(x)≥0为半正定函数,输入权值矩阵R>0为对称正定矩阵。
根据最优控制理论,最优控制的目的是找到一个控制序列能使非线性系统渐进稳定且性能指标函数V(x)达到最小。
定义Hamiltonian方程为:
其中,▽Vx表示性能指标函数对系统状态变量x的偏导数,即
则最优性能指标函数可表示为:
其中,表示最优性能指标函数对系统状态变量x的偏导数,即
根据Bellman最优性原理可得,最优控制律u*(t)为:
其中,上标-1表示矩阵求逆(下同),则R-1表示输入权值矩阵R的逆矩阵。
相应的HJB方程为:
由于系统精确模型往往难以获得,即f(x)无法得到,且具有非线性且通常没有解析解,如此最优控制u*(t)便无法求解。因此,本发明提出一种基于数据驱动单网络结构的最优控制方法。
图1表示了本发明基于数据驱动单网络结构的最优控制方法流程图。该迭代最优控制方法通过数据驱动LS-SVM模型在线逼近而非逼近最优性能指标函数V*(x),然后通过最优控制律表达式直接计算得到,既省去了控制器网络,使结构更加简单,又避免了传统actor-critic结构中每次迭代都需要计算的计算负荷,有效地提高了执行速度。具体步骤表述如下:
步骤1、初始化。
随机选择系统初始状态x0
选择半正定函数Q(x)≥0;
选择对称正定矩阵R;
设定训练样本集长度为L并随机选择训练样本加入训练样本集构成初始的训练样本集;
设定新增样本集长度为l;
设定样本采样周期T;
选择LS-SVM逼近器的参数:
这里选择高斯核函数作为LS-SVM模型中的核函数,x表示训练样本的集合,xi、xj表示训练样本集合中第i,j列,设定核函数中核宽度σ值;
设定LS-SVM模型中惩罚参数C值;
需要说明的是核宽度σ和惩罚参数C是非常重要的参数。σ取值过大会使模型过早收敛,达不到预测的目的。C取值较大,可以使训练样本数据和测试数据拟合的更好,但相应地会降低模型的适应能力;C取值较小可以提高训练模型的适应能力,但拟合精度会有所下降。在现有技术中,它们的选择可以根据经验、自举法、交叉验证等方法确定,其中,最常用的方法就是交叉验证法。
步骤2、选择一个初始稳定控制器,将其所具有的初始稳定控制律u(t0)作用于系统,其中t0表示初始时刻。初始稳定控制律不需要最优,可以是任意一种稳定的控制策略。在实际应用中,一个初始稳定的控制策略是很容易得到的,如常见的LQR、PID控制律等都可以作为初始稳定控制律。对于某些非线性系统,也许初始稳定控制律不易得到,但对于满足利普希茨稳定的控制系统,初始稳定控制律均可设定为u(t0)=0。
步骤3、检测系统当前t时刻系统状态变量xt与控制变量ut
步骤4、在每个采样周期内,将采集到的((xt,ut),λt-1(x))作为该采样周期的样本,其中状态-动作对(xt,ut)作为LS-SVM逼近器的输入样本,正则函数λ(x)在前一采样周期t-1时刻的值λt-1(x)作为LS-SVM逼近器的输出样本;
具体为以下步骤:定义正则函数为采样周期T=0.1s,在每个采样周期内,由测量到的状态变量xt和控制变量ut构成输入样本(xt,ut),上一采样周期的正则函数构成输出样本λt-1(x),其中下标t表示当前t时刻,则每个采样周期内,系统采集到的样本可表示为((xt,ut),λt-1(x))。值得注意的是,传统actor-critic结构中,逼近目标函数为代价函数V(x),是一个标量。而本发明逼近目标函数为正则函数λ(x),是一个向量。
步骤5、判断本次采样周期的样本中的输出样本与前一个采样周期的样本中的输出样本是否相近,是则舍弃本次采样周期的样本,并返回步骤4继续采样,否则将本次采样周期的样本加入新增样本集。
上述做法是为了减轻LS-SVM逼近器的计算压力,所以在每个样本输入训练样本前,必须先对样本进行预处理,即判断该组样本是否与上一组样本接近。如果两组样本接近,则说明本次采样周期的样本不会对系统性能产生较大改进,属于无效数据,应该舍弃。如果两组样本相差较大,则本次采样周期的样本能够改进系统性能,即可加入新增样本集。本发明通过以下判断式来判断两组样本是否相近:
||λt-1(x)-λt-2(x)||≤δ
其中,δ为步骤1中预先设定的阈值。如果||λt-1(x)-λt-2(x)||≤δ成立,则说明两组样本相近,应当舍弃本次采样周期的样本;反之,应该将本次采样周期的样本加入新增样本集。
步骤6、判断新增样本集是否溢出,是则将新增样本集所有样本全部加入训练样本集,并相应地移除相同规模大小的原始训练样本,按照“先进先出”规则变化,否则继续步骤5。
具体做法如下:根据步骤1中预先设定的新增样本集长度l,如果新增样本集长度等于l,则将新增样本集所有样本全部加入训练样本集,同时,按照“先进先出”的原则,移除原训练样本集中前l长度的原始样本,以保证训练样本集的长度始终为L。因此,训练样本集中的样本是由过去L组数据组成,可表述为{(xi,ui),λi-1(x)|i=t-L,t-L+1,…,t-1},其中((xt-1,ut-1),λt-2(x))表示在t-1时刻的训练样本。
步骤7、将训练样本集所有样本加入LS-SVM逼近器,求解正则函数λt(x)。由LS-SVM模型可得,正则函数λ(x)可以表述为:
λ(x)=wTφ(x)+b
其中,x为输入样本,即状态-动作对(xt,ut),w为LS-SVM逼近器的权重向量,T表示转置,φ(x)为从输入空间到高维特征空间的一个非线性映射,b是偏移量。
因此,问题可以描述为下列优化问题:
s.t.λ(xi)=wTφ(xi)+b+ξi其中,i=t-L,t-L+1,…,t-1
其中,ξi为松弛变量,它们度量数据点与理想值之间的偏差程度,其中含有下标i的变量表示与过去第i时刻的训练样本相关的值;C表示惩罚参数,用来控制模型复杂度与经验误差之间的平衡。
对上述优化问题,构建拉格拉日函数:
其中,αi表示与过去第i时刻的训练样本相关的拉格拉日因子。
根据Karush-Kuhn-Tucker最优化条件,分别对w,b,ξi和αi求偏导数,并令其等于零,整理可得矩阵表达式:
其中,
I=[1,1,…,1]T,λ(x)=[λt-L(x),λt-L+1(x),…,λt-1(x)]T表示LS-SVM模型的输出,即正则函数;α=[αt-Lt-L+1,…,αt-1]T,F∈RL×L表示L×L的实数矩阵,矩阵第i行第j列元素为Fij=φ(xi)·φ(xj)=K(xi,xj)(i,j=1,2,…,L),函数φ(·)表示从输入空间到高维特征空间的一个非线性映射,K(xi,xj)为核函数,一般选取为高斯核函数,xi表示训练样本集合中第i列,xj表示训练样本集合中第j列;
求解上述线性方程,可得LS-SVM逼近器的参数b和α。
步骤8、通过训练参数,得到逼近器的输出,即正则函数。即利用步骤7得到的LS-SVM逼近器,通过LS-SVM逼近器预测输出表达式,即核函数的加权线性和形式即可计算出正则函数λt(x)。
步骤9、利用正则函数,直接求解得到本次迭代控制律,并作用于控制系统。
在传统actor-critic结构中,通常利用以下两种方案求解最优控制律:第一种方案:采用两个神经网络结构,分别去逼近评价网络中的代价函数V(x)和控制网络中的控制律u(t)。这样设计必然会造成控制器结构的复杂,同时由于使用了两个逼近器,必然会造成最优控制器误差的加大。第二种方案:首先利用评价网络逼近器求得代价函数V(x),然后通过计算方可得到迭代控制律u(t)。这样做省去了控制网络逼近器,使得控制器结构简单,但在每一次迭代中,控制器都必须首先计算然后才能得到控制律,这必然增加了控制器计算负荷,尤其在工程应用中,计算微分更是不易实现。
因此,本发明避免了上述两种方案的缺点,采用基于数据驱动单网络结构的最优控制,直接去逼近正则函数λt(x),然后通过表达式即可计算出下一时刻的迭代控制律。
步骤10、判断相邻两个采样周期所对应产生的控制律是否有明显变化,是则表示还未得到最优解,则返回步骤3,继续训练。否则将本次采样周期所对应的控制律作为最优控制律输出,学习结束。判断相邻两个采样周期产生的控制律是否有明显变化的表达式如下所示:
||ut+1(t)-ut(t)||≤ε
其中,常数ε为容许误差。
经过上述步骤1~10后,得到的控制律和正则函数被认为是最优控制律和最优正则函数,由于故性能指标函数V(x)也是最优的。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (1)

1.一种基于数据驱动单网络结构的最优控制方法,用于对满足利普希茨稳定的非线性系统进行控制,其特征在于:包括顺序执行的以下步骤:
步骤1、初始化:随机选择系统初始状态x0;选择半正定函数Q(x)≥0;选择对称正定矩阵R;选择LS-SVM逼近器的参数;设定训练样本集长度为L并随机选择训练样本加入训练样本集构成初始的训练样本集;设定新增样本集长度为l;设定阈值0<δ<1、容许逼近误差0<ε<1;设定样本采样周期T;
步骤2、选择一个初始稳定控制器作用于系统;
步骤3、检测系统当前t时刻系统状态变量xt与控制变量ut
步骤4、在每个采样周期内,将采集到的((xt,ut),λt-1(x))作为该采样周期的样本,其中状态-动作对(xt,ut)作为LS-SVM逼近器的输入样本,正则函数λ(x)在前一采样周期t-1时刻的值λt-1(x)作为LS-SVM逼近器的输出样本;
步骤5、根据||λt-1(x)-λt-2(x)||≤δ判断本次采样周期的样本中的输出样本与前一个采样周期的样本中的输出样本是否相近,若上式成立则舍弃本次采样周期的样本,否则将本次采样周期的样本加入至新增样本集;
步骤6、判断新增样本集是否溢出,是则将新增样本集所有样本全部加入训练样本集,并从训练样本集中相应地移除相同规模的已存在的训练样本,移除时按照这些已存在的训练样本加入训练样本集的先后顺序遵循先进先出原则进行,否则继续步骤5;
步骤7、将步骤6中获得的训练样本集中的所有样本加入LS-SVM逼近器,得到LS-SVM逼近器的输出,即为正则函数λt(x);
步骤8、利用正则函数λt(x),通过表达式直接求解得到本次迭代周期的控制律ut+1(t),并作用于控制系统;上式中,g(x)为输入耦合矩阵,此处g(x)中的x为系统状态变量xt的缩写,T表示转置;
步骤9、根据||ut+1(t)-ut(t)||≤ε判断本次采样周期的控制律ut+1(t)与前一次迭代周期的控制率ut(t)是否有明显变化,若上式成立则表示还未得到最优控制律,返回步骤3,否则将ut+1(t)作为最优控制律输出,学习结束。
CN201511025977.XA 2015-12-30 2015-12-30 一种基于数据驱动单网络结构的最优控制方法 Expired - Fee Related CN105487376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511025977.XA CN105487376B (zh) 2015-12-30 2015-12-30 一种基于数据驱动单网络结构的最优控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511025977.XA CN105487376B (zh) 2015-12-30 2015-12-30 一种基于数据驱动单网络结构的最优控制方法

Publications (2)

Publication Number Publication Date
CN105487376A CN105487376A (zh) 2016-04-13
CN105487376B true CN105487376B (zh) 2018-05-08

Family

ID=55674426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511025977.XA Expired - Fee Related CN105487376B (zh) 2015-12-30 2015-12-30 一种基于数据驱动单网络结构的最优控制方法

Country Status (1)

Country Link
CN (1) CN105487376B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107544261B (zh) * 2017-10-26 2020-07-24 长春工业大学 不确定环境接触下的可重构机器人分散学习最优控制方法
CN108647059A (zh) * 2018-05-21 2018-10-12 Oppo广东移动通信有限公司 应用程序预测方法、装置、存储介质及移动终端
CN108789417B (zh) * 2018-07-30 2021-06-22 长春工业大学 基于自适应动态规划的可重构机械臂保代价分散控制方法
CN110531715B (zh) * 2019-08-08 2021-03-02 北京北方华创微电子装备有限公司 Lpcvd工艺生产环境的控制方法及系统
CN112346342B (zh) * 2020-11-03 2022-10-11 中国人民解放军空军工程大学 一种非仿射动力学系统的单网络自适应评价设计方法
CN113189867B (zh) * 2021-03-24 2023-11-14 大连海事大学 一种考虑位姿与速度受限的无人船自学习最优跟踪控制方法
CN114063438B (zh) * 2021-11-12 2023-09-22 辽宁石油化工大学 一种数据驱动的多智能体系统pid控制协议自学习方法
CN116736748A (zh) * 2022-03-01 2023-09-12 腾讯科技(深圳)有限公司 构建机器人的控制器的方法和机器人

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1758161A (zh) * 2005-11-11 2006-04-12 燕山大学 基于非线性约束预测控制的最优化控制方法
CN101464664A (zh) * 2009-01-09 2009-06-24 浙江工业大学 基于单种群和预交叉的差分进化算法的间歇反应器最优控制方法
CN101887239A (zh) * 2010-06-30 2010-11-17 浙江大学 一种自适应的工业过程最优控制系统及方法
CN103744292A (zh) * 2014-01-22 2014-04-23 东北大学 一种基于数据驱动的稀土萃取过程动态操作控制方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090093892A1 (en) * 2007-10-05 2009-04-09 Fisher-Rosemount Systems, Inc. Automatic determination of the order of a polynomial regression model applied to abnormal situation prevention in a process plant
DE102012216574A1 (de) * 2012-09-17 2014-03-20 Siemens Aktiengesellschaft Verfahren zur rechnergestützten Steuerung und/oder Regelung eines technischen Systems

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1758161A (zh) * 2005-11-11 2006-04-12 燕山大学 基于非线性约束预测控制的最优化控制方法
CN101464664A (zh) * 2009-01-09 2009-06-24 浙江工业大学 基于单种群和预交叉的差分进化算法的间歇反应器最优控制方法
CN101887239A (zh) * 2010-06-30 2010-11-17 浙江大学 一种自适应的工业过程最优控制系统及方法
CN103744292A (zh) * 2014-01-22 2014-04-23 东北大学 一种基于数据驱动的稀土萃取过程动态操作控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于数据的网络化系统最优控制;王艳 等;《控制工程》;20120131;第19卷(第1期);第165-168页 *

Also Published As

Publication number Publication date
CN105487376A (zh) 2016-04-13

Similar Documents

Publication Publication Date Title
CN105487376B (zh) 一种基于数据驱动单网络结构的最优控制方法
Gao et al. T–S-fuzzy-model-based approximation and controller design for general nonlinear systems
Xu et al. Adaptive observer based data-driven control for nonlinear discrete-time processes
CN102902203B (zh) 时间序列预测与智能控制结合的参数在线整定方法与系统
Luo et al. A laguerre neural network-based ADP learning scheme with its application to tracking control in the Internet of Things
CN103433924A (zh) 串联机器人高精度位置控制方法
CN105974795B (zh) 基于可控电抗器抑制电力系统低频振荡的模型预测控制方法
CN106774379A (zh) 一种智能超螺旋强鲁棒姿态控制方法
CN107272409B (zh) 一种基于迭代学习的直线伺服系统振动抑制方法
Tian et al. Time-delay compensation method for networked control system based on time-delay prediction and implicit PIGPC
WO2022156182A1 (zh) 车辆动力学模型的构建及车辆状态信息预测方法、装置
CN103399488B (zh) 基于自学习的多模型控制方法
CN113325721A (zh) 一种工业系统无模型自适应控制方法及系统
CN110687907A (zh) 基于模型动态重构的智能汽车解耦预测控制器及其控制方法
CN112987577A (zh) 一种无人车数据驱动自适应控制方法和装置
CN110097191A (zh) 信息处理方法以及信息处理系统
CN107633105A (zh) 一种基于改进混合蛙跳算法的四旋翼无人机参数辨识方法
CN107168066B (zh) 一种温室环境自适应控制方法
CN107450311A (zh) 逆模型建模方法及装置、以及自适应逆控制方法及装置
Jeyaraj et al. Real‐time data‐driven PID controller for multivariable process employing deep neural network
CN107703760B (zh) 基于rbf与gdhp的天然气吸收塔脱硫过程控制方法
CN105787265A (zh) 基于综合集成赋权法的原子自旋陀螺随机误差建模方法
CN104102131B (zh) 无穷时域优化的批次过程的线性二次容错控制方法
Arshad et al. Deep Deterministic Policy Gradient to Regulate Feedback Control Systems Using Reinforcement Learning.
CN116604532A (zh) 一种上肢康复机器人智能控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Sun Jingliang

Inventor after: Liu Chunsheng

Inventor after: Wei Along

Inventor before: Sun Jingliang

Inventor before: Liu Chunsheng

Inventor before: Wei Along

Inventor before: Yu Yang

Inventor before: Chen Yu

Inventor before: Guo Shuai

Inventor before: Niu Yanfeng

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180508

Termination date: 20201230

CF01 Termination of patent right due to non-payment of annual fee