CN113359452A - 基于Barzilai Borwein智能学习算法的控制器设计方法、系统 - Google Patents

基于Barzilai Borwein智能学习算法的控制器设计方法、系统 Download PDF

Info

Publication number
CN113359452A
CN113359452A CN202110647891.XA CN202110647891A CN113359452A CN 113359452 A CN113359452 A CN 113359452A CN 202110647891 A CN202110647891 A CN 202110647891A CN 113359452 A CN113359452 A CN 113359452A
Authority
CN
China
Prior art keywords
neural network
controller
follows
algorithm
borwein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110647891.XA
Other languages
English (en)
Other versions
CN113359452B (zh
Inventor
王桐
邱剑彬
王雨佳
纪文强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202110647891.XA priority Critical patent/CN113359452B/zh
Publication of CN113359452A publication Critical patent/CN113359452A/zh
Application granted granted Critical
Publication of CN113359452B publication Critical patent/CN113359452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明公开一种基于Barzilai Borwein智能学习算法的控制器设计方法,包括以下步骤:S1.利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术设计此代价函数下最优控制器;S2.利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,S3.通过仿真验证所提方法的有效性。本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系统的控制器。鉴于神经网络的参数,例如:宽度,中心值和学习速率会影响神经网络的逼近效果,本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系统的状态可测量,不需要被控对象的精确数学模型,也不需要手动进行控制器参数整定。

Description

基于Barzilai Borwein智能学习算法的控制器设计方法、 系统
技术领域
本发明涉及智能学习算法控制器设计技术领域,具体来说是一种基于BarzilaiBorwein智能学习算法的控制器设计方法、系统。
背景技术
在过去的几十年中,神经网络技术得益于它良好的逼近性能受到了广泛的关注并逐 渐应用到各个领域。神经网络在控制领域中的应用主要是借助李亚普诺夫函数,设计使权值收敛的权值更新率,也是常说的自适应神经网络。关于自适应神经网络的成果有很多,几乎全部把自适应神经网络作为逼近系统中未知函数的工具,结合其它的控制技术,例如:滑模控制,自适应动态规划技术,反步技术等,设计基于模型的控制方案。从自 适应神经网络的设计方法中可以看出,它只能保证权值收敛。最终的控制效果由神经网 络参数和控制器参数共同决定,因为未知函数未知,神经网络的逼近效果是否良好我们 是无从得知的。然而,好的逼近效果可以得到更好的控制性能。
现有的在控制领域,由于未知函数不可测量,利用智能学习算法,通过减小未知函数和神经网络之间的差值来更新神经网络权值是很困难的。同时,神经网络的参数,宽 度,中心值和学习速率的选取也面临着巨大的挑战。现有的关于这些参数的选取都是基 于试错法,然而,这种方法需要专家丰富的工程经验。当系统是强耦合,高度非线性时, 选取合适的参数是非常困难的。
综上所述,基于神经网络的智能控制方案设计仍然存在以下几个难题:
1)如何利用智能学习算法,通过减小逼近误差自动更新神经网络的权值。
2)如何智能的选择较合适的神经网络参数。
如申请号为201911277170.3公开的一种机械臂及智能控制技术,该方法针对机械臂伸缩过程中的运动抖动问题,提出了一种结合模糊,遗传算法和PID技术的一种控制 器设计方案,以提高对机械臂抖动的抑制和缩短机械臂在运动过程中达到稳态的时间。 该技术存在以下缺点:
1)模糊算法需要专家的先验知识;
2)遗传算法具有易陷入局部最优的缺点。
又如申请号为201911070915.9公开的一种基于神经网络的自适应有限时间指令滤 波反步控制方法。该方法采用了自适应神经网络技术,反步控制技术和指令滤波设计一种控制方案。其中,神经网络用于逼近系统中的未知函数,指令滤波为了避免标准反步 法中计算复杂的问题。该算法可以保证跟踪误差在有限时间内收敛到足够小的范围内。 该技术存在以下缺点:
1)此方案含有大量的控制器参数需要手动调节;
2)此方案应用的自适应神经网络技术,只能保证神经网络的权值收敛,并不能保证神经网络的逼近误差最小。
发明内容
本发明所要解决的技术问题在于提供一种无需被控对象的精确数学模型、无需要手 动进行控制器参数整定的智能控制器设计方法。
本发明通过以下技术手段实现解决上述技术问题的:
基于Barzilai Borwein智能学习算法的控制器设计方法,包括以下步骤:
S1.利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数, 然后根据神经网络技术设计此代价函数下最优控制器;
S2.利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
其中,w(k)和w(k-1)为神经网络权值分别在k时刻和k-1时刻的值。r(w(k))和 r(w(k-1))分别为在w(k)和w(k-1)处的梯度值。类似的,b为神经网络的宽度参数, c为神经网络中心值。则学习速率ηw,ηb和ηc计算公式如下:
Figure BDA0003109936680000021
Figure BDA0003109936680000022
Figure BDA0003109936680000023
S3.通过仿真验证所提方法的有效性。
本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系 统的控制器。鉴于神经网络的参数,例如:宽度,中心值和学习速率会影响神经网络的逼近效果,本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系 统的状态可测量,不需要被控对象的精确数学模型,也不需要手动进行控制器参数整定。
进一步的,所述步骤S1具体为:
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (1)
其中x(k)为k时刻系统的状态,f(x(k))于g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (2)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)-kee(k) (3)
其中,ke为大于零的常数,e(k+1)表示如下
Figure BDA0003109936680000031
设计一个代价函数如下
Figure BDA0003109936680000032
我们希望设计此代价函数下最优的控制器。根据神经网络技术,构造系统(1)的控制器如下
Figure BDA0003109936680000033
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为 神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
进一步的,所述步骤S2具体为:
神经网络的参数w,b,c的更新率定义如下:
Figure BDA0003109936680000041
其中
Figure BDA0003109936680000042
Figure BDA0003109936680000043
Figure BDA0003109936680000044
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法 在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
Figure BDA0003109936680000045
则学习速率ηw,ηb和ηc设计如下
Figure BDA0003109936680000051
进一步的,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
与上述方法对应的,本发明还提供一种基于Barzilai Borwein智能学习算法的控制器设计系统,包括:
控制器构建模块,利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术构建此代价函数下最优控制器;
参数更新模块,利用Barzilai Borwein算法在线更新神经网络的参数ηω,ηb和ηc,更新算法如下:
定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηω,ηb和ηc计算公式如下:
Figure BDA0003109936680000052
Figure BDA0003109936680000053
Figure BDA0003109936680000054
验证模块,通过仿真验证所提方法的有效性。
进一步的,所述控制器构建模块具体执行过程为:
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (11)
其中x(k)为k时刻系统的状态,f(x(k))于g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (12)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k) (13)
其中,ke为大于零的常数,e(k+1)表示如下
Figure BDA0003109936680000061
设计一个代价函数如下
Figure BDA0003109936680000062
我们希望设计此代价函数下最优的控制器。根据神经网络技术,构造系统(1)的控制器如下
Figure BDA0003109936680000063
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为 神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
进一步的,所述参数更新模块具体执行过程为:
神经网络的参数w,b,c的更新率定义如下:
Figure BDA0003109936680000064
其中
Figure BDA0003109936680000071
Figure BDA0003109936680000072
Figure BDA0003109936680000073
ηω(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法 在线更新神经网络学习速率参数η,ηb和ηc
先定义以下变量
Figure BDA0003109936680000074
则学习速率ηw,ηb和ηc设计如下
Figure BDA0003109936680000075
进一步的,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
本发明还提供一种处理设备,包括至少一个处理器,以及与所述处理器通信连接的 至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令, 所述计算机指令使所述计算机执行上述的方法。
本发明的优点在于:
本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系 统的控制器。鉴于神经网络的参数,例如:宽度,中心值和学习速率会影响神经网络的逼近效果,本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系 统的状态可测量,不需要被控对象的精确数学模型,也不需要手动进行控制器参数整定。
附图说明
图1为本发明采用实施例中基于Barzilai Borwein智能学习算法的控制器设计方法获得的控制器控制方框图;
图2为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统跟踪性能图;
图3为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统跟踪误差曲线图;
图4为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统各项参数优化时间曲线图;
图5为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统学习速率随时间的变化曲线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明 一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在 没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例公开一种基于Barzilai Borwein智能学习算法的控制器设计方法,包括以下步骤:
步骤1、利用神经网络构建控制器;
步骤2、利用Barzilai Borwein算法智能更新神经网络的参数;
步骤3、通过仿真验证所提方法的有效性。
下面针对上述每一步骤进行详细描述:
步骤1、利用神经网络构建控制器
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (21)
其中x(k)为k时刻系统的状态,f(x(k))于g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (22)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k) (23)
其中,ke为大于零的常数,e(k+1)表示如下
Figure BDA0003109936680000091
设计一个代价函数如下
Figure BDA0003109936680000092
我们希望设计此代价函数下最优的控制器。根据神经网络技术,构造系统(1)的控制器如下
Figure BDA0003109936680000093
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为 神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X((k)),也即是控制器u(k)。
需要注意的是,在本专利中神经网络的参数不是手动设计而是通过以下算法在线更 新的
Figure BDA0003109936680000101
其中
Figure BDA0003109936680000102
Figure BDA0003109936680000103
Figure BDA0003109936680000104
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,它们决定了神经网络参数是否 收敛和收敛速度。本专利将借助Barzilai Borwein算法设计这些参数。
步骤2、利用Barzilai Borwein算法智能更新神经网络的参数
定义以下变量
Figure BDA0003109936680000105
则学习速率ηw,ηb和ηc设计如下
Figure BDA0003109936680000111
本专利提出的控制算法步骤如下
第一步:给出参数的初始值:wj(0),bj(0),cij(0),ηw(0),ηb(0)和ηc(0),并设定一个阈值δ;
第二步:设计如公式(5)的代价函数,根据公式(7)-(10)更新神经网络参数;
第三步:当被更新的参数与上一时刻的值的差值小于阈值δ时,停止参数更新,否则返回步骤二;
第四步:输出控制器u。
本实施例所提控制算法的控制方框图如图1所示。
步骤3、通过仿真验证所提方法的有效性
考虑以下的非线性离散系统:
Figure BDA0003109936680000112
设计参考信号为:
xd(k)=sin(k) (32)
其中,采样时间Δt=0.01s。定义跟踪误差为e(k)=x(k)-xd(k),设计代价函数如下:
Figure BDA0003109936680000113
根据神经网络构造控制器如下
Figure BDA0003109936680000114
神经网络的输入为X=[x(k),xd(k)]T,神经网络的其它参数根据本专利所提的算法进 行更新。
仿真结果如图2-5所示。
图2为系统的跟踪性能图。其中,短虚线为参考信号随时间的变化曲线,实线为本专利所提控制器下状态随时间的变化曲线,长虚线是不同学习速率下系统状态随时间的变化曲线。可以看出,在初始阶段时,实线具有更小的抖动。
图3为系统跟踪误差曲线,由于跟踪误差较小,基本重合。我们在第二个子图中绘制了跟踪误差稳态阶段的放大图。可以看到本专利所提的控制方案可以得到最小的稳态误差。
图4中第一个子图为神经网络权值随时间的变化曲线,第二个子图为神经网络宽度 参数随时间的变化曲线,第三个子图绘制了中心值随时间的变化曲线。可以看到这个参数都在很短的时间内更新到了它们各自的最优值。
图5为本实施例所提算法下神经网络学习速率随时间的变化曲线,可以看出,学习速率可以在极短的时间内更新到它们各自的最优值。
从图2-3可以看出根据本专利所提算法更新得到的神经网络的参数可以获得最小的 跟踪误差和最好的暂态性能,当参数大于或者小于本专利最终更新得到的参数时,控制效果都差于所提控制方案得到的控制效果。图4-5可以看出,本专利提出的控制方案可 以使参数在很短的时间内更新到最优值。
与上述方法对应的,本实施例还公开一种基于Barzilai Borwein智能学习算法的控制器设计系统,包括:
控制器构建模块,利用神经网络构建控制器;
参数更新模块,利用Barzilai Borwein算法智能更新神经网络的参数;
验证模块,通过仿真验证所提方法的有效性。
下面针对上述每一模块进行详细描述:
控制器构建模块,利用神经网络构建控制器
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (35)
其中x(k)为k时刻系统的状态,f(x(k))于g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (36)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k) (37)
其中,ke为大于零的常数,e(k+1)表示如下
Figure BDA0003109936680000131
设计一个代价函数如下
Figure BDA0003109936680000132
本实施例希望设计此代价函数下最优的控制器。根据神经网络技术,构造系统(1)的控制器如下
Figure BDA0003109936680000133
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为 神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
需要注意的是,在本专利中神经网络的参数不是手动设计而是通过以下算法在线更 新的
Figure BDA0003109936680000134
其中
Figure BDA0003109936680000141
Figure BDA0003109936680000142
Figure BDA0003109936680000143
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,它们决定了神经网络参数是否 收敛和收敛速度。本专利将借助Barzilai Borwein算法设计这些参数。
参数更新模块,利用Barzilai Borwein算法智能更新神经网络的参数 定义以下变量
Figure BDA0003109936680000144
则学习速率ηw,ηb和ηc设计如下
Figure BDA0003109936680000145
本专利提出的控制算法步骤如下
第一步:给出参数的初始值:wj(0),bj(0),cij(0),ηw(0),ηb(0)和ηc(0),并设定一个阈值δ;
第二步:设计如公式(5)的代价函数,根据公式(7)-(10)更新神经网络参数;
第三步:当被更新的参数与上一时刻的值的差值小于阈值δ时,停止参数更新,否则返回步骤二;
第四步:输出控制器u。
本实施例所提控制算法的控制方框图如图1所示。
验证模块,通过仿真验证所提方法的有效性
考虑以下的非线性离散系统:
Figure BDA0003109936680000151
设计参考信号为:
xd(k)=sin(k) (46)
其中,采样时间Δt=0.01s。定义跟踪误差为e(k)=x(k)-xd(k),设计代价函数如下:
Figure BDA0003109936680000152
根据神经网络构造控制器如下
Figure BDA0003109936680000153
神经网络的输入为X=[x(k),xd(k)]T,神经网络的其它参数根据本专利所提的算法进 行更新。
仿真结果如图2-5所示。
图2为系统的跟踪性能图。其中,短虚线为参考信号随时间的变化曲线,实线为本专利所提控制器下状态随时间的变化曲线,长虚线是不同学习速率下系统状态随时间的变化曲线。可以看出,在初始阶段时,实线具有更小的抖动。
图3为系统跟踪误差曲线,由于跟踪误差较小,基本重合。我们在第二个子图中绘制了跟踪误差稳态阶段的放大图。可以看到本专利所提的控制方案可以得到最小的稳态误差。
图4中第一个子图为神经网络权值随时间的变化曲线,第二个子图为神经网络宽度 参数随时间的变化曲线,第三个子图绘制了中心值随时间的变化曲线。可以看到这个参数都在很短的时间内更新到了它们各自的最优值。
图5为本实施例所提算法下神经网络学习速率随时间的变化曲线,可以看出,学习速率可以在极短的时间内更新到它们各自的最优值。
从图2-3可以看出根据本专利所提算法更新得到的神经网络的参数可以获得最小的 跟踪误差和最好的暂态性能,当参数大于或者小于本专利最终更新得到的参数时,控制效果都差于所提控制方案得到的控制效果。图4-5可以看出,本专利提出的控制方案可 以使参数在很短的时间内更新到最优值。
本实施例还提供一种处理设备,包括至少一个处理器,以及与所述处理器通信连接 的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。
本实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指 令,所述计算机指令使所述计算机执行上述的方法。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对 本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或 者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.基于Barzilai Borwein智能学习算法的控制器设计方法,其特征在于,包括以下步骤:
S1.利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术设计此代价函数下最优控制器;
S2.利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc计算公式如下:
Figure FDA0003109936670000011
Figure FDA0003109936670000012
Figure FDA0003109936670000013
S3.通过仿真验证所提方法的有效性。
2.根据权利要求1所述的基于Barzilai Borwein智能学习算法的控制器设计方法,其特征在于,所述步骤S1具体为:
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (49)
其中x(k)为k时刻系统的状态,f(x(k))于g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (50)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k) (51)
其中,ke为大于零的常数,e(k+1)表示如下
Figure FDA0003109936670000021
设计一个代价函数如下
Figure FDA0003109936670000022
我们希望设计此代价函数下最优的控制器。根据神经网络技术,构造系统(1)的控制器如下
Figure FDA0003109936670000023
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,X(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
3.根据权利要求2所述的基于Barzilai Borwein智能学习算法的控制器设计方法,其特征在于,所述步骤S2具体为:
神经网络的参数w,b,c的更新率定义如下:
Figure FDA0003109936670000024
其中
Figure FDA0003109936670000031
Figure FDA0003109936670000032
Figure FDA0003109936670000033
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
Figure FDA0003109936670000034
则学习速率ηw,ηb和ηc设计如下
Figure FDA0003109936670000035
4.根据权利要求3所述的基于Barzilai Borwein智能学习算法的控制器设计方法,其特征在于,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
5.基于Barzilai Borwein智能学习算法的控制器设计系统,其特征在于,包括:
控制器构建模块,利用神经网络构建控制器,针对某一形式的非线性离散系统,设计一代价函数,然后根据神经网络技术构建此代价函数下最优控制器;
参数更新模块,利用Barzilai Borwein算法在线更新神经网络的参数ηw,ηb和ηc,更新算法如下:
定义以下变量
χw(k)=w(k)-w(k-1)
γw(k)=r(w(k))-r(w(k-1))
χb(k)=b(k)-b(k-1)
γb(k)=r(b(k))-r(b(k-1))
χc(k)=c(k)-c(k-1)
γc(k)=r(c(k))-r(c(k-1))
则学习速率ηw,ηb和ηc计算公式如下:
Figure FDA0003109936670000041
Figure FDA0003109936670000042
Figure FDA0003109936670000043
验证模块,通过仿真验证所提方法的有效性。
6.根据权利要求5所述的基于Barzilai Borwein智能学习算法的控制器设计系统,其特征在于,所述控制器构建模块具体执行过程为:
考虑以下形式的非线性离散系统:
x(k+1)=f(x(k))+g(x(k))u(k),k=0,1,2,… (59)
其中x(k)为k时刻系统的状态,f(x(k))于g(x(k))为系统的未知结构模型,u(k)为k时刻的系统输入。假设系统的参数信号为xd(k),定义跟踪误差如下
e(k)=x(k)-xd(k) (60)
利用神经网络技术直接构建系统的未知控制器;
定义一个动态面为
s(k+1)=e(k+1)+kee(k) (61)
其中,ke为大于零的常数,e(k+1)表示如下
Figure FDA0003109936670000051
设计一个代价函数如下
Figure FDA0003109936670000052
我们希望设计此代价函数下最优的控制器。根据神经网络技术,构造系统(1)的控制器如下
Figure FDA0003109936670000053
其中,W=[w1,…,wq]T为神经网络的权值向量,H(X(k))=[h1(X(k)),…,hq(X(k))]T为神经网络的基函数,x(k)=[x(k),xd(k)]T为神经网络的输入向量,神经网络的输出使WTH(X(k)),也即是控制器u(k)。
7.根据权利要求5所述的基于Barzilai Borwein智能学习算法的控制器设计系统,其特征在于,所述参数更新模块具体执行过程为:
神经网络的参数w,b,c的更新率定义如下:
Figure FDA0003109936670000054
其中
Figure FDA0003109936670000061
Figure FDA0003109936670000062
Figure FDA0003109936670000063
ηw(k)>0,ηb(k)>0,ηc(k)>0为神经网络的学习速率,利用Barzilai Borwein算法在线更新神经网络学习速率参数ηw,ηb和ηc
先定义以下变量
Figure FDA0003109936670000064
则学习速率ηw,ηb和ηc设计如下
Figure FDA0003109936670000065
8.根据权利要求7所述的基于Barzilai Borwein智能学习算法的控制器设计系统,其特征在于,当被更新的参数与上一时刻的值的差值小于预设值阈值δ时,停止参数更新。
9.一种处理设备,其特征在于,包括至少一个处理器,以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至4任一所述的方法。
CN202110647891.XA 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统 Active CN113359452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110647891.XA CN113359452B (zh) 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110647891.XA CN113359452B (zh) 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Publications (2)

Publication Number Publication Date
CN113359452A true CN113359452A (zh) 2021-09-07
CN113359452B CN113359452B (zh) 2022-03-11

Family

ID=77533742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110647891.XA Active CN113359452B (zh) 2021-06-10 2021-06-10 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Country Status (1)

Country Link
CN (1) CN113359452B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030177450A1 (en) * 2002-03-12 2003-09-18 Alex Nugent Physical neural network design incorporating nanotechnology
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN110262513A (zh) * 2019-07-12 2019-09-20 大连海事大学 一种海洋机器人轨迹跟踪控制结构的设计方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030177450A1 (en) * 2002-03-12 2003-09-18 Alex Nugent Physical neural network design incorporating nanotechnology
CN109946975A (zh) * 2019-04-12 2019-06-28 北京理工大学 一种未知伺服系统的强化学习最优跟踪控制方法
CN110262513A (zh) * 2019-07-12 2019-09-20 大连海事大学 一种海洋机器人轨迹跟踪控制结构的设计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王雪: "复值神经网络的共轭梯度学习算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN113359452B (zh) 2022-03-11

Similar Documents

Publication Publication Date Title
Bechlioulis et al. A low-complexity global approximation-free control scheme with prescribed performance for unknown pure feedback systems
Chevalier et al. Fractional-order PID design: Towards transition from state-of-art to state-of-use
CN116610025B (zh) 一种基于改进元启发式算法的pid控制器优化方法
JP7090734B2 (ja) 制御システム、制御方法及び記憶媒体
Sanchez et al. Output feedback continuous twisting algorithm
Zheng et al. Prescribed finite-time consensus with severe unknown nonlinearities and mismatched disturbances
Rojas et al. Data-driven based IMC control
CN111930010A (zh) 一种基于lstm网络的通用mfa控制器设计方法
CN113325717B (zh) 基于互联大规模系统的最优容错控制方法、系统、处理设备、存储介质
CN107615183A (zh) 模型预测控制应用程序中相对于最佳性能值的优良性能的系统和方法
CN111240201B (zh) 一种扰动抑制控制方法
CN113359452B (zh) 基于Barzilai Borwein智能学习算法的控制器设计方法、系统
CN109613830B (zh) 基于递减预测步长的模型预测控制方法
CN116880191A (zh) 一种基于时序预测的过程工业生产系统的智能控制方法
Yi et al. Robust tuning of uncertainty and disturbance estimator-based control for stable processes with time delay
CN115981159A (zh) 基于模型辅助和类史密斯预估的广义改进自抗扰控制方法
Yuan et al. A robust adaptive controller for Hammerstein nonlinear systems
Chu IMC‐PID tuning method based on maximum sensitivity for uncertain multivariable systems
CN103064286A (zh) 一种工业过程的控制方法与设备
Li et al. Parameter estimation of multiple‐input single‐output Hammerstein controlled autoregressive system based on improved adaptive moment estimation algorithm
Zhang et al. Nonlinear Laguerre–Volterra observer‐controller and its application to process control
JP7207474B1 (ja) 情報処理装置
Cois et al. Fractional systems toolbox for Matlab: applications in system identification and Crone CSD
Arellano‐Muro et al. Online reinforcement learning control via discontinuous gradient
Wang et al. Learning from adaptive neural control with predefined performance for a class of nonlinear systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant