CN113359452B - 基于Barzilai Borwein智能学习算法的控制器设计方法、系统 - Google Patents

基于Barzilai Borwein智能学习算法的控制器设计方法、系统 Download PDF

Info

Publication number
CN113359452B
CN113359452B CN202110647891.XA CN202110647891A CN113359452B CN 113359452 B CN113359452 B CN 113359452B CN 202110647891 A CN202110647891 A CN 202110647891A CN 113359452 B CN113359452 B CN 113359452B
Authority
CN
China
Prior art keywords
neural network
controller
follows
algorithm
cost function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110647891.XA
Other languages
English (en)
Other versions
CN113359452A (zh
Inventor
王桐
邱剑彬
王雨佳
纪文强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202110647891.XA priority Critical patent/CN113359452B/zh
Publication of CN113359452A publication Critical patent/CN113359452A/zh
Application granted granted Critical
Publication of CN113359452B publication Critical patent/CN113359452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开一种基于Barzilai Borwein智能学习算法的控制器设计方法,包括以下步骤:S1.利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术设计此代价函数下最优控制器;S2.利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,S3.通过仿真验证所提方法的有效性。本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系统的控制器。鉴于神经网络的参数,例如:宽度,中心值和学习速率会影响神经网络的逼近效果,本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系统的状态可测量,不需要被控对象的精确数学模型,也不需要手动进行控制器参数整定。

Description

基于Barzilai Borwein智能学习算法的控制器设计方法、 系统
技术领域
本发明涉及智能学习算法控制器设计技术领域,具体来说是一种基于BarzilaiBorwein智能学习算法的控制器设计方法、系统。
背景技术
在过去的几十年中,神经网络技术得益于它良好的逼近性能受到了广泛的关注并逐渐应用到各个领域。神经网络在控制领域中的应用主要是借助李亚普诺夫函数,设计使权值收敛的权值更新率,也是常说的自适应神经网络。关于自适应神经网络的成果有很多,几乎全部把自适应神经网络作为逼近系统中未知函数的工具,结合其它的控制技术,例如:滑模控制,自适应动态规划技术,反步技术等,设计基于模型的控制方案。从自适应神经网络的设计方法中可以看出,它只能保证权值收敛。最终的控制效果由神经网络参数和控制器参数共同决定,因为未知函数未知,神经网络的逼近效果是否良好我们是无从得知的。然而,好的逼近效果可以得到更好的控制性能。
现有的在控制领域,由于未知函数不可测量,利用智能学习算法,通过减小未知函数和神经网络之间的差值来更新神经网络权值是很困难的。同时,神经网络的参数,宽度,中心值和学习速率的选取也面临着巨大的挑战。现有的关于这些参数的选取都是基于试错法,然而,这种方法需要专家丰富的工程经验。当系统是强耦合,高度非线性时,选取合适的参数是非常困难的。
综上所述,基于神经网络的智能控制方案设计仍然存在以下几个难题:
1)如何利用智能学习算法,通过减小逼近误差自动更新神经网络的权值。
2)如何智能的选择较合适的神经网络参数。
如申请号为201911277170.3公开的一种机械臂及智能控制技术,该方法针对机械臂伸缩过程中的运动抖动问题,提出了一种结合模糊,遗传算法和PID技术的一种控制器设计方案,以提高对机械臂抖动的抑制和缩短机械臂在运动过程中达到稳态的时间。该技术存在以下缺点:
1)模糊算法需要专家的先验知识;
2)遗传算法具有易陷入局部最优的缺点。
又如申请号为201911070915.9公开的一种基于神经网络的自适应有限时间指令滤波反步控制方法。该方法采用了自适应神经网络技术,反步控制技术和指令滤波设计一种控制方案。其中,神经网络用于逼近系统中的未知函数,指令滤波为了避免标准反步法中计算复杂的问题。该算法可以保证跟踪误差在有限时间内收敛到足够小的范围内。该技术存在以下缺点:
1)此方案含有大量的控制器参数需要手动调节;
2)此方案应用的自适应神经网络技术,只能保证神经网络的权值收敛,并不能保证神经网络的逼近误差最小。
发明内容
本发明所要解决的技术问题在于提供一种无需被控对象的精确数学模型、无需要手动进行控制器参数整定的智能控制器设计方法。
本发明通过以下技术手段实现解决上述技术问题的:
基于Barzilai Borwein智能学习算法的控制器设计方法,包括以下步骤:
S1.利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术设计此代价函数下最优控制器;代价函数如下:
Figure GDA0003455497420000021
E(k+1)为在k+1时刻的代价函数,hj(k)为神经网络基函数向量H(X(k))中的第j个元素,cij(k)为矩阵c(k)第i行第j个元素,Xi(k)为输入向量X(k)的第i个元素;
S2.利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
神经网络的参数w,b,c的更新率定义如下:
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure GDA0003455497420000031
Figure GDA0003455497420000032
Figure GDA0003455497420000033
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))r(b(k1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc设计如下
Figure GDA0003455497420000034
w(k)为k时刻的权值,r(w(k))为代价函数关于w(k)的梯度;b(k)为k时刻的宽度值,r(b(k))为代价函数关于b(k)的梯度;c(k)为k时刻的中心值,r(c(k))为代价函数关于c(k)的梯度;
S3.通过仿真验证所提方法的有效性。
本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系统的控制器。鉴于神经网络的参数,例如:宽度,中心值和学习速率会影响神经网络的逼近效果,本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系统的状态可测量,不需要被控对象的精确数学模型,也不需要手动进行控制器参数整定。
进一步的,所述步骤S1具体为:
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,…
其中x(k)为k时刻系统的状态,f(x(k))与g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k)
其中,ke为大于零的常数,e(k+1)表示如下
e(k+1)=x(k+1)-xd(k+1)
=f(x(k))+g(x(k))u(k)-xd(k+1)
设计一个代价函数如下
Figure GDA0003455497420000041
根据神经网络技术,构造所述非线性离散系统的控制器如下
Figure GDA0003455497420000042
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
进一步的,所述步骤S2具体为:
神经网络的参数w,b,c的更新率定义如下:
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure GDA0003455497420000051
Figure GDA0003455497420000052
Figure GDA0003455497420000053
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))r(w(k-1))
χb(k)=b(k)b(k1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc设计如下
Figure GDA0003455497420000061
进一步的,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
与上述方法对应的,本发明还提供一种基于Barzilai Borwein智能学习算法的控制器设计系统,包括:
控制器构建模块,利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术构建此代价函数下最优控制器;代价函数如下:
Figure GDA0003455497420000062
E(k+1)为在k+1时刻的代价函数,hj(k)为神经网络基函数向量H(X(k))中的第j个元素,cij(k)为矩阵c(k)第i行第j个元素,Xi(k)为输入向量X(k)的第i个元素;
参数更新模块,利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
神经网络的参数w,b,c的更新率定义如下:
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure GDA0003455497420000071
Figure GDA0003455497420000072
Figure GDA0003455497420000073
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))r(b(k1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc设计如下
Figure GDA0003455497420000074
w(k)为k时刻的权值,r(w(k))为代价函数关于w(k)的梯度;b(k)为k时刻的宽度值,r(b(k))为代价函数关于b(k)的梯度;c(k)为k时刻的中心值,r(c(k))为代价函数关于c(k)的梯度;
验证模块,通过仿真验证所提方法的有效性。
进一步的,所述控制器构建模块具体执行过程为:
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,…
其中x(k)为k时刻系统的状态,f(x(k))与g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k)
其中,ke为大于零的常数,e(k+1)表示如下
e(k+1)=x(k+1)-xd(k+1)
=f(x(k))+g(x(k))u(k)-xd(k+1)
设计一个代价函数如下
Figure GDA0003455497420000081
根据神经网络技术,构造所述非线性离散系统的控制器如下
Figure GDA0003455497420000082
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
进一步的,所述参数更新模块具体执行过程为:
神经网络的参数w,b,c的更新率定义如下:
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure GDA0003455497420000091
Figure GDA0003455497420000092
Figure GDA0003455497420000093
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))r(b(k1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc设计如下
Figure GDA0003455497420000094
进一步的,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
本发明还提供一种处理设备,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的方法。
本发明的优点在于:
本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系统的控制器。鉴于神经网络的参数,例如:宽度,中心值和学习速率会影响神经网络的逼近效果,本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系统的状态可测量,不需要被控对象的精确数学模型,也不需要手动进行控制器参数整定。
附图说明
图1为本发明采用实施例中基于Barzilai Borwein智能学习算法的控制器设计方法获得的控制器控制方框图;
图2为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统跟踪性能图;
图3为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统跟踪误差曲线图;
图4为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统各项参数优化时间曲线图;
图5为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统学习速率随时间的变化曲线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例公开一种基于Barzilai Borwein智能学习算法的控制器设计方法,包括以下步骤:
步骤1、利用神经网络构建控制器;
步骤2、利用Barzilai Borwein算法智能更新神经网络的参数;
步骤3、通过仿真验证所提方法的有效性。
下面针对上述每一步骤进行详细描述:
步骤1、利用神经网络构建控制器
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (1)
其中x(k)为k时刻系统的状态,f(x(k))与g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (2)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k) (3)
其中,ke为大于零的常数,e(k+1)表示如下
Figure GDA0003455497420000113
设计一个代价函数如下
Figure GDA0003455497420000111
根据神经网络技术,构造所述非线性离散系统的控制器如下
Figure GDA0003455497420000112
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
需要注意的是,在本专利中神经网络的参数不是手动设计而是通过以下算法在线更新的
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k)) (7)
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure GDA0003455497420000121
Figure GDA0003455497420000122
Figure GDA0003455497420000123
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,它们决定了神经网络参数是否收敛和收敛速度。本专利将借助Barzilai Borwein算法设计这些参数。
步骤2、利用Barzilai Borwein算法智能更新神经网络的参数
定义以下变量
Figure GDA0003455497420000124
则学习速率ηw,ηb和ηc设计如下
Figure GDA0003455497420000131
本专利提出的控制算法步骤如下
第一步:给出参数的初始值:wj(0),bj(0),cij(0),ηw(0),ηb(0)和ηc(0),并设定一个阈值δ;
第二步:设计如公式(5)的代价函数,根据公式(7)-(10)更新神经网络参数;
第三步:当被更新的参数与上一时刻的值的差值小于阈值δ时,停止参数更新,否则返回步骤二;
第四步:输出控制器u。
本实施例所提控制算法的控制方框图如图1所示。
步骤3、通过仿真验证所提方法的有效性
考虑以下的非线性离散系统:
Figure GDA0003455497420000132
设计参考信号为:
xd(k)=sin(k) (12)
其中,采样时间Δt=0.01s。定义跟踪误差为e(k)=x(k)-xd(k),设计代价函数如下:
Figure GDA0003455497420000133
根据神经网络构造控制器如下
Figure GDA0003455497420000134
神经网络的输入为X=[x(k),xd(k)]T,神经网络的其它参数根据本专利所提的算法进行更新。
仿真结果如图2-5所示。
图2为系统的跟踪性能图。其中,短虚线为参考信号随时间的变化曲线,实线为本专利所提控制器下状态随时间的变化曲线,长虚线是不同学习速率下系统状态随时间的变化曲线。可以看出,在初始阶段时,实线具有更小的抖动。
图3为系统跟踪误差曲线,由于跟踪误差较小,基本重合。我们在第二个子图中绘制了跟踪误差稳态阶段的放大图。可以看到本专利所提的控制方案可以得到最小的稳态误差。
图4中第一个子图为神经网络权值随时间的变化曲线,第二个子图为神经网络宽度参数随时间的变化曲线,第三个子图绘制了中心值随时间的变化曲线。可以看到这个参数都在很短的时间内更新到了它们各自的最优值。
图5为本实施例所提算法下神经网络学习速率随时间的变化曲线,可以看出,学习速率可以在极短的时间内更新到它们各自的最优值。
从图2-3可以看出根据本专利所提算法更新得到的神经网络的参数可以获得最小的跟踪误差和最好的暂态性能,当参数大于或者小于本专利最终更新得到的参数时,控制效果都差于所提控制方案得到的控制效果。图4-5可以看出,本专利提出的控制方案可以使参数在很短的时间内更新到最优值。
与上述方法对应的,本实施例还公开一种基于Barzilai Borwein智能学习算法的控制器设计系统,包括:
控制器构建模块,利用神经网络构建控制器;
参数更新模块,利用Barzilai Borwein算法智能更新神经网络的参数;
验证模块,通过仿真验证所提方法的有效性。
下面针对上述每一模块进行详细描述:
控制器构建模块,利用神经网络构建控制器
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,…
其中x(k)为k时刻系统的状态,f(x(k))与g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k)
其中,ke为大于零的常数,e(k+1)表示如下
e(k+1)=x(k+1)-xd(k+1)
=f(x(k))+g(x(k))u(k)-xd(k+1)
设计一个代价函数如下
Figure GDA0003455497420000151
本实施例希望设计此代价函数下最优的控制器。根据神经网络技术,构造所述非线性离散系统的控制器如下
Figure GDA0003455497420000152
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
需要注意的是,在本专利中神经网络的参数不是手动设计而是通过以下算法在线更新的
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure GDA0003455497420000161
Figure GDA0003455497420000162
Figure GDA0003455497420000163
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,它们决定了神经网络参数是否收敛和收敛速度。本专利将借助Barzilai Borwein算法设计这些参数。
参数更新模块,利用Barzilai Borwein算法智能更新神经网络的参数
定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))r(c(k1))
则学习速率ηw,ηb和ηc设计如下
Figure GDA0003455497420000164
Figure GDA0003455497420000165
Figure GDA0003455497420000166
本专利提出的控制算法步骤如下
第一步:给出参数的初始值:wj(0),bj(0),cij(0),ηw(0),ηb(0)和ηc(0),并设定一个阈值δ;
第二步:设计如公式(5)的代价函数,根据公式(7)-(10)更新神经网络参数;
第三步:当被更新的参数与上一时刻的值的差值小于阈值δ时,停止参数更新,否则返回步骤二;
第四步:输出控制器u。
本实施例所提控制算法的控制方框图如图1所示。
验证模块,通过仿真验证所提方法的有效性
考虑以下的非线性离散系统:
Figure GDA0003455497420000171
设计参考信号为:
xd(k)=sin(k)
其中,采样时间Δt=0.01s。定义跟踪误差为e(k)=x(k)-xd(k),设计代价函数如下:
Figure GDA0003455497420000172
根据神经网络构造控制器如下
Figure GDA0003455497420000173
神经网络的输入为X=[x(k),xd(k)]T,神经网络的其它参数根据本专利所提的算法进行更新。
仿真结果如图2-5所示。
图2为系统的跟踪性能图。其中,短虚线为参考信号随时间的变化曲线,实线为本专利所提控制器下状态随时间的变化曲线,长虚线是不同学习速率下系统状态随时间的变化曲线。可以看出,在初始阶段时,实线具有更小的抖动。
图3为系统跟踪误差曲线,由于跟踪误差较小,基本重合。我们在第二个子图中绘制了跟踪误差稳态阶段的放大图。可以看到本专利所提的控制方案可以得到最小的稳态误差。
图4中第一个子图为神经网络权值随时间的变化曲线,第二个子图为神经网络宽度参数随时间的变化曲线,第三个子图绘制了中心值随时间的变化曲线。可以看到这个参数都在很短的时间内更新到了它们各自的最优值。
图5为本实施例所提算法下神经网络学习速率随时间的变化曲线,可以看出,学习速率可以在极短的时间内更新到它们各自的最优值。
从图2-3可以看出根据本专利所提算法更新得到的神经网络的参数可以获得最小的跟踪误差和最好的暂态性能,当参数大于或者小于本专利最终更新得到的参数时,控制效果都差于所提控制方案得到的控制效果。图4-5可以看出,本专利提出的控制方案可以使参数在很短的时间内更新到最优值。
本实施例还提供一种处理设备,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的方法。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.基于Barzilai Borwein智能学习算法的控制器设计方法,其特征在于,包括以下步骤:
S1.利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术设计此代价函数下最优控制器;考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,…
其中x(k)为k时刻系统的状态,f(x(k))与g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入; 假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k)
其中,ke为大于零的常数,e(k+1)表示如下
e(k+1)=x(k+1)-xd(k+1)
=f(x(k))+g(x(k))u(k)-xd(k+1)
设计一个代价函数如下
Figure FDA0003469793630000011
根据神经网络技术,构造系统(1)的控制器如下
Figure FDA0003469793630000012
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k);由于w(k)为权值向量,其第j个元素用wj(k)表示;同理,bj(k)为向量b(k)的第j个元素;cij(k)为矩阵c(k)第i行第j个元素;cj(k)为矩阵c(k)的第j列数据;
S2.利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
神经网络的参数w,b,c的更新率定义如下:
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure FDA0003469793630000021
Figure FDA0003469793630000022
Figure FDA0003469793630000023
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc设计如下
Figure FDA0003469793630000031
w(k)为k时刻的权值,r(w(k))为代价函数关于w(k)的梯度;b(k)为k时刻的宽度值,r(b(k))为代价函数关于b(k)的梯度;c(k)为k时刻的中心值,r(c(k))为代价函数关于c(k)的梯度;
S3.通过仿真验证所提方法的有效性。
2.根据权利要求1所述的基于Barzilai Borwein智能学习算法的控制器设计方法,其特征在于,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
3.基于Barzilai Borwein智能学习算法的控制器设计系统,其特征在于,包括:
控制器构建模块,利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术构建此代价函数下最优控制器;考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,…
其中x(k)为k时刻系统的状态,f(x(k))与g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入; 假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k)
其中,ke为大于零的常数,e(k+1)表示如下
e(k+1)=x(k+1)-xd(k+1)
=f(x(k))+g(x(k))u(k)-xd(k+1)
设计一个代价函数如下
Figure FDA0003469793630000041
根据神经网络技术,构造系统(1)的控制器如下
Figure FDA0003469793630000042
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k);由于w(k)为权值向量,其第j个元素用wj(k)表示;同理,bj(k)为向量b(k)的第j个元素;cij(k)为矩阵c(k)第i行第j个元素;cj(k)为矩阵c(k)的第j列数据;
参数更新模块,利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
神经网络的参数w,b,c的更新率定义如下:
w(k+1)=w(k)-ηw(k)r(w(k))
b(k+1)=b(k)-ηb(k)r(b(k))
c(k+1)=c(k)-ηc(k)r(c(k))
其中
Figure FDA0003469793630000051
Figure FDA0003469793630000052
Figure FDA0003469793630000053
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc设计如下
Figure FDA0003469793630000054
w(k)为k时刻的权值,r(w(k))为代价函数关于w(k)的梯度;b(k)为k时刻的宽度值,r(b(k))为代价函数关于b(k)的梯度;c(k)为k时刻的中心值,r(c(k))为代价函数关于c(k)的梯度;
验证模块,通过仿真验证所提方法的有效性。
4.根据权利要求3所述的基于Barzilai Borwein智能学习算法的控制器设计系统,其特征在于,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
5.一种处理设备,其特征在于,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1或2所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1或2所述的方法。
CN202110647891.XA 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统 Active CN113359452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110647891.XA CN113359452B (zh) 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110647891.XA CN113359452B (zh) 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Publications (2)

Publication Number Publication Date
CN113359452A CN113359452A (zh) 2021-09-07
CN113359452B true CN113359452B (zh) 2022-03-11

Family

ID=77533742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110647891.XA Active CN113359452B (zh) 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Country Status (1)

Country Link
CN (1) CN113359452B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN110262513A (zh) * 2019-07-12 2019-09-20 大连海事大学 一种海洋机器人轨迹跟踪控制结构的设计方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6889216B2 (en) * 2002-03-12 2005-05-03 Knowm Tech, Llc Physical neural network design incorporating nanotechnology

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN110262513A (zh) * 2019-07-12 2019-09-20 大连海事大学 一种海洋机器人轨迹跟踪控制结构的设计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
复值神经网络的共轭梯度学习算法研究;王雪;《中国优秀硕士学位论文全文数据库 信息科技辑》;20210115;I140-213 *

Also Published As

Publication number Publication date
CN113359452A (zh) 2021-09-07

Similar Documents

Publication Publication Date Title
Bechlioulis et al. A low-complexity global approximation-free control scheme with prescribed performance for unknown pure feedback systems
Chen et al. Kernel least mean square with adaptive kernel size
Shi et al. Robust design of integrated feedback and iterative learning control of a batch process based on a 2D Roesser system
Wang et al. A novel approach to feedback control with deep reinforcement learning
CN101493677B (zh) 一种神经网络的系统控制器结构及系统辨识结构
CA2678820C (en) Two-stage model predictive control technique
JP3556956B2 (ja) システム識別装置および方法
US20070078529A1 (en) On-line adaptive model predictive control in a process control system
JP7090734B2 (ja) 制御システム、制御方法及び記憶媒体
KR101849464B1 (ko) Pid 게인 자동 튜닝 방법
CN108345213B (zh) Mimo紧格式无模型控制器基于系统误差的参数自整定方法
Fan et al. Adaptive nearly optimal control for a class of continuous-time nonaffine nonlinear systems with inequality constraints
Norrlöf Disturbance rejection using an ILC algorithm with iteration varying filters
CN111930010A (zh) 一种基于lstm网络的通用mfa控制器设计方法
JP2021051462A (ja) 情報処理装置及びプログラム
CN113325717A (zh) 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
CN113359452B (zh) 基于Barzilai Borwein智能学习算法的控制器设计方法、系统
CN111240201B (zh) 一种扰动抑制控制方法
Tanemura et al. Closed-loop data-driven estimation on passivity property
CN116880191A (zh) 一种基于时序预测的过程工业生产系统的智能控制方法
CN117031965A (zh) 一种工业过程无穷时域优化学习控制方法及装置
Yi et al. Robust tuning of uncertainty and disturbance estimator-based control for stable processes with time delay
Arellano‐Muro et al. Online reinforcement learning control via discontinuous gradient
Chu IMC‐PID tuning method based on maximum sensitivity for uncertain multivariable systems
Bernardi et al. Adaptive predictive control for industrial processes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant