CN113359452B

CN113359452B - 基于Barzilai Borwein智能学习算法的控制器设计方法、系统

Info

Publication number: CN113359452B
Application number: CN202110647891.XA
Authority: CN
Inventors: 王桐; 邱剑彬; 王雨佳; 纪文强
Original assignee: Harbin Institute of Technology Shenzhen
Current assignee: Harbin Institute of Technology Shenzhen
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2022-03-11
Anticipated expiration: 2041-06-10
Also published as: CN113359452A

Abstract

本发明公开一种基于Barzilai Borwein智能学习算法的控制器设计方法，包括以下步骤：S1.利用神经网络构建控制器，针对某一形式的非线性离散系统，设计一代价函数，然后根据神经网络技术设计此代价函数下最优控制器；S2.利用Barzilai Borwein算法在线更新神经网络的参数η_w，η_b和η_c，S3.通过仿真验证所提方法的有效性。本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系统的控制器。鉴于神经网络的参数，例如：宽度，中心值和学习速率会影响神经网络的逼近效果，本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系统的状态可测量，不需要被控对象的精确数学模型，也不需要手动进行控制器参数整定。

Description

基于Barzilai Borwein智能学习算法的控制器设计方法、系统

技术领域

本发明涉及智能学习算法控制器设计技术领域，具体来说是一种基于BarzilaiBorwein智能学习算法的控制器设计方法、系统。

背景技术

在过去的几十年中，神经网络技术得益于它良好的逼近性能受到了广泛的关注并逐渐应用到各个领域。神经网络在控制领域中的应用主要是借助李亚普诺夫函数，设计使权值收敛的权值更新率，也是常说的自适应神经网络。关于自适应神经网络的成果有很多，几乎全部把自适应神经网络作为逼近系统中未知函数的工具，结合其它的控制技术，例如：滑模控制，自适应动态规划技术，反步技术等，设计基于模型的控制方案。从自适应神经网络的设计方法中可以看出，它只能保证权值收敛。最终的控制效果由神经网络参数和控制器参数共同决定，因为未知函数未知，神经网络的逼近效果是否良好我们是无从得知的。然而，好的逼近效果可以得到更好的控制性能。

现有的在控制领域，由于未知函数不可测量，利用智能学习算法，通过减小未知函数和神经网络之间的差值来更新神经网络权值是很困难的。同时，神经网络的参数，宽度，中心值和学习速率的选取也面临着巨大的挑战。现有的关于这些参数的选取都是基于试错法，然而，这种方法需要专家丰富的工程经验。当系统是强耦合，高度非线性时，选取合适的参数是非常困难的。

综上所述，基于神经网络的智能控制方案设计仍然存在以下几个难题：

1)如何利用智能学习算法，通过减小逼近误差自动更新神经网络的权值。

2)如何智能的选择较合适的神经网络参数。

如申请号为201911277170.3公开的一种机械臂及智能控制技术，该方法针对机械臂伸缩过程中的运动抖动问题，提出了一种结合模糊，遗传算法和PID技术的一种控制器设计方案，以提高对机械臂抖动的抑制和缩短机械臂在运动过程中达到稳态的时间。该技术存在以下缺点：

1)模糊算法需要专家的先验知识；

2)遗传算法具有易陷入局部最优的缺点。

又如申请号为201911070915.9公开的一种基于神经网络的自适应有限时间指令滤波反步控制方法。该方法采用了自适应神经网络技术，反步控制技术和指令滤波设计一种控制方案。其中，神经网络用于逼近系统中的未知函数，指令滤波为了避免标准反步法中计算复杂的问题。该算法可以保证跟踪误差在有限时间内收敛到足够小的范围内。该技术存在以下缺点：

1)此方案含有大量的控制器参数需要手动调节；

2)此方案应用的自适应神经网络技术，只能保证神经网络的权值收敛，并不能保证神经网络的逼近误差最小。

发明内容

本发明所要解决的技术问题在于提供一种无需被控对象的精确数学模型、无需要手动进行控制器参数整定的智能控制器设计方法。

本发明通过以下技术手段实现解决上述技术问题的：

基于Barzilai Borwein智能学习算法的控制器设计方法，包括以下步骤：

S1.利用神经网络构建控制器，针对某一形式的非线性离散系统，设计一代价函数，然后根据神经网络技术设计此代价函数下最优控制器；代价函数如下：

E(k+1)为在k+1时刻的代价函数，h_j(k)为神经网络基函数向量H(X(k))中的第j个元素，c_ij(k)为矩阵c(k)第i行第j个元素，X_i(k)为输入向量X(k)的第i个元素；

S2.利用Barzilai Borwein算法在线更新神经网络的参数η_w，η_b和η_c，更新算法如下：

神经网络的参数w，b，c的更新率定义如下：

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k))

c(k+1)＝c(k)-η_c(k)r(c(k))

其中

η_w(k)＞0，η_b(k)＞0，η_c(k)＞0为神经网络的学习速率，利用Barzilai Borwein算法在线更新神经网络学习速率参数η_w，η_b和η_c；

先定义以下变量

χ_w(k)＝w(k)-w(k-1)

γ_w(k)＝r(w(k))-r(w(k-1))

χ_b(k)＝b(k)-b(k-1)

γ_b(k)＝r(b(k))r(b(k1))

χ_c(k)＝c(k)-c(k-1)

γ_c(k)＝r(c(k))-r(c(k-1))

则学习速率η_w，η_b和η_c设计如下

w(k)为k时刻的权值，r(w(k))为代价函数关于w(k)的梯度；b(k)为k时刻的宽度值，r(b(k))为代价函数关于b(k)的梯度；c(k)为k时刻的中心值，r(c(k))为代价函数关于c(k)的梯度；

S3.通过仿真验证所提方法的有效性。

本发明基于不依赖系统数学模型的智能控制跟踪算法。此算法利用神经网络构造系统的控制器。鉴于神经网络的参数，例如：宽度，中心值和学习速率会影响神经网络的逼近效果，本发明提出一种在线自动调节参数的算法。整个控制器方案的实现只需要系统的状态可测量，不需要被控对象的精确数学模型，也不需要手动进行控制器参数整定。

进一步的，所述步骤S1具体为：

考虑以下形式的非线性离散系统：

x(k+1)＝f(x(k))+g(x(k))u(k)，k＝0，1，2，…

其中x(k)为k时刻系统的状态，f(x(k))与g(x(k))为系统的未知结构模型，u(k)为k时刻的系统输入。假设系统的参数信号为x_d(k)，定义跟踪误差如下

e(k)＝x(k)-x_d(k)

利用神经网络技术直接构建系统的未知控制器；

定义一个动态面为

s(k+1)＝e(k+1)+k_ee(k)

其中，k_e为大于零的常数，e(k+1)表示如下

e(k+1)＝x(k+1)-x_d(k+1)

＝f(x(k))+g(x(k))u(k)-x_d(k+1)

设计一个代价函数如下

根据神经网络技术，构造所述非线性离散系统的控制器如下

其中，W＝[w₁，…，w_q]^T为神经网络的权值向量，H(X(k))＝[h₁(X(k))，…，h_q(X(k))]^T为神经网络的基函数，X(k)＝[x(k)，x_d(k)]^T为神经网络的输入向量，神经网络的输出使W^TH(X(k))，也即是控制器u(k)。

进一步的，所述步骤S2具体为：

神经网络的参数w，b，c的更新率定义如下：

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k))

c(k+1)＝c(k)-η_c(k)r(c(k))

其中

先定义以下变量

χ_w(k)＝w(k)-w(k-1)

γ_w(k)＝r(w(k))r(w(k-1))

χ_b(k)＝b(k)b(k1)

γ_b(k)＝r(b(k))-r(b(k-1))

χ_c(k)＝c(k)-c(k-1)

γ_c(k)＝r(c(k))-r(c(k-1))

则学习速率η_w，η_b和η_c设计如下

进一步的，当被更新的参数与上一时刻的值的差值小于预设值阈值δ时，停止参数更新。

与上述方法对应的，本发明还提供一种基于Barzilai Borwein智能学习算法的控制器设计系统，包括：

控制器构建模块，利用神经网络构建控制器，针对某一形式的非线性离散系统，设计一代价函数，然后根据神经网络技术构建此代价函数下最优控制器；代价函数如下：

参数更新模块，利用Barzilai Borwein算法在线更新神经网络的参数η_w，η_b和η_c，更新算法如下：

神经网络的参数w，b，c的更新率定义如下：

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k))

c(k+1)＝c(k)-η_c(k)r(c(k))

其中

先定义以下变量

χ_w(k)＝w(k)-w(k-1)

γ_w(k)＝r(w(k))-r(w(k-1))

χ_b(k)＝b(k)-b(k-1)

γ_b(k)＝r(b(k))r(b(k1))

χ_c(k)＝c(k)-c(k-1)

γ_c(k)＝r(c(k))-r(c(k-1))

则学习速率η_w，η_b和η_c设计如下

验证模块，通过仿真验证所提方法的有效性。

进一步的，所述控制器构建模块具体执行过程为：

考虑以下形式的非线性离散系统：

x(k+1)＝f(x(k))+g(x(k))u(k)，k＝0，1，2，…

e(k)＝x(k)-x_d(k)

利用神经网络技术直接构建系统的未知控制器；

定义一个动态面为

s(k+1)＝e(k+1)+k_ee(k)

其中，k_e为大于零的常数，e(k+1)表示如下

e(k+1)＝x(k+1)-x_d(k+1)

＝f(x(k))+g(x(k))u(k)-x_d(k+1)

设计一个代价函数如下

根据神经网络技术，构造所述非线性离散系统的控制器如下

进一步的，所述参数更新模块具体执行过程为：

神经网络的参数w，b，c的更新率定义如下：

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k))

c(k+1)＝c(k)-η_c(k)r(c(k))

其中

先定义以下变量

χ_w(k)＝w(k)-w(k-1)

γ_w(k)＝r(w(k))-r(w(k-1))

χ_b(k)＝b(k)-b(k-1)

γ_b(k)＝r(b(k))r(b(k1))

χ_c(k)＝c(k)-c(k-1)

γ_c(k)＝r(c(k))-r(c(k-1))

则学习速率η_w，η_b和η_c设计如下

本发明还提供一种处理设备，包括至少一个处理器，以及与所述处理器通信连接的至少一个存储器，其中：所述存储器存储有可被处理器执行的程序指令，所述处理器调用所述程序指令能够执行上述的方法。

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述的方法。

本发明的优点在于：

附图说明

图1为本发明采用实施例中基于Barzilai Borwein智能学习算法的控制器设计方法获得的控制器控制方框图；

图2为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统跟踪性能图；

图3为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统跟踪误差曲线图；

图4为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统各项参数优化时间曲线图；

图5为采用本发明实施例中基于Barzilai Borwein智能学习算法的控制器设计方法仿真的系统学习速率随时间的变化曲线图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本实施例公开一种基于Barzilai Borwein智能学习算法的控制器设计方法，包括以下步骤：

步骤1、利用神经网络构建控制器；

步骤2、利用Barzilai Borwein算法智能更新神经网络的参数；

步骤3、通过仿真验证所提方法的有效性。

下面针对上述每一步骤进行详细描述：

步骤1、利用神经网络构建控制器

考虑以下形式的非线性离散系统：

x(k+1)＝f(x(k))+g(x(k))u(k)，k＝0，1，2，… (1)

e(k)＝x(k)-x_d(k) (2)

利用神经网络技术直接构建系统的未知控制器；

定义一个动态面为

s(k+1)＝e(k+1)+k_ee(k) (3)

其中，k_e为大于零的常数，e(k+1)表示如下

设计一个代价函数如下

根据神经网络技术，构造所述非线性离散系统的控制器如下

需要注意的是，在本专利中神经网络的参数不是手动设计而是通过以下算法在线更新的

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k)) (7)

c(k+1)＝c(k)-η_c(k)r(c(k))

其中

η_w(k)＞0，η_b(k)＞0，η_c(k)＞0为神经网络的学习速率，它们决定了神经网络参数是否收敛和收敛速度。本专利将借助Barzilai Borwein算法设计这些参数。

步骤2、利用Barzilai Borwein算法智能更新神经网络的参数

定义以下变量

则学习速率η_w，η_b和η_c设计如下

本专利提出的控制算法步骤如下

第一步：给出参数的初始值：w_j(0)，b_j(0)，c_ij(0)，η_w(0)，η_b(0)和η_c(0)，并设定一个阈值δ；

第二步：设计如公式(5)的代价函数，根据公式(7)-(10)更新神经网络参数；

第三步：当被更新的参数与上一时刻的值的差值小于阈值δ时，停止参数更新，否则返回步骤二；

第四步：输出控制器u。

本实施例所提控制算法的控制方框图如图1所示。

步骤3、通过仿真验证所提方法的有效性

考虑以下的非线性离散系统：

设计参考信号为：

x_d(k)＝sin(k) (12)

其中，采样时间Δt＝0.01s。定义跟踪误差为e(k)＝x(k)-x_d(k)，设计代价函数如下：

根据神经网络构造控制器如下

神经网络的输入为X＝[x(k)，x_d(k)]^T，神经网络的其它参数根据本专利所提的算法进行更新。

仿真结果如图2-5所示。

图2为系统的跟踪性能图。其中，短虚线为参考信号随时间的变化曲线，实线为本专利所提控制器下状态随时间的变化曲线，长虚线是不同学习速率下系统状态随时间的变化曲线。可以看出，在初始阶段时，实线具有更小的抖动。

图3为系统跟踪误差曲线，由于跟踪误差较小，基本重合。我们在第二个子图中绘制了跟踪误差稳态阶段的放大图。可以看到本专利所提的控制方案可以得到最小的稳态误差。

图4中第一个子图为神经网络权值随时间的变化曲线，第二个子图为神经网络宽度参数随时间的变化曲线，第三个子图绘制了中心值随时间的变化曲线。可以看到这个参数都在很短的时间内更新到了它们各自的最优值。

图5为本实施例所提算法下神经网络学习速率随时间的变化曲线，可以看出，学习速率可以在极短的时间内更新到它们各自的最优值。

从图2-3可以看出根据本专利所提算法更新得到的神经网络的参数可以获得最小的跟踪误差和最好的暂态性能，当参数大于或者小于本专利最终更新得到的参数时，控制效果都差于所提控制方案得到的控制效果。图4-5可以看出，本专利提出的控制方案可以使参数在很短的时间内更新到最优值。

与上述方法对应的，本实施例还公开一种基于Barzilai Borwein智能学习算法的控制器设计系统，包括：

控制器构建模块，利用神经网络构建控制器；

参数更新模块，利用Barzilai Borwein算法智能更新神经网络的参数；

验证模块，通过仿真验证所提方法的有效性。

下面针对上述每一模块进行详细描述：

控制器构建模块，利用神经网络构建控制器

考虑以下形式的非线性离散系统：

x(k+1)＝f(x(k))+g(x(k))u(k)，k＝0，1，2，…

e(k)＝x(k)-x_d(k)

利用神经网络技术直接构建系统的未知控制器；

定义一个动态面为

s(k+1)＝e(k+1)+k_ee(k)

其中，k_e为大于零的常数，e(k+1)表示如下

e(k+1)＝x(k+1)-x_d(k+1)

＝f(x(k))+g(x(k))u(k)-x_d(k+1)

设计一个代价函数如下

本实施例希望设计此代价函数下最优的控制器。根据神经网络技术，构造所述非线性离散系统的控制器如下

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k))

c(k+1)＝c(k)-η_c(k)r(c(k))

其中

参数更新模块，利用Barzilai Borwein算法智能更新神经网络的参数

定义以下变量

χ_w(k)＝w(k)-w(k-1)

γ_w(k)＝r(w(k))r(w(k-1))

χ_b(k)＝b(k)-b(k-1)

γ_b(k)＝r(b(k))-r(b(k-1))

χ_c(k)＝c(k)-c(k-1)

γ_c(k)＝r(c(k))r(c(k1))

则学习速率η_w，η_b和η_c设计如下

本专利提出的控制算法步骤如下

第四步：输出控制器u。

本实施例所提控制算法的控制方框图如图1所示。

验证模块，通过仿真验证所提方法的有效性

考虑以下的非线性离散系统：

设计参考信号为：

x_d(k)＝sin(k)

根据神经网络构造控制器如下

仿真结果如图2-5所示。

本实施例还提供一种处理设备，包括至少一个处理器，以及与所述处理器通信连接的至少一个存储器，其中：所述存储器存储有可被处理器执行的程序指令，所述处理器调用所述程序指令能够执行上述的方法。

本实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述的方法。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.基于Barzilai Borwein智能学习算法的控制器设计方法，其特征在于，包括以下步骤：

S1.利用神经网络构建控制器，针对某一形式的非线性离散系统，设计一代价函数，然后根据神经网络技术设计此代价函数下最优控制器；考虑以下形式的非线性离散系统：

x(k+1)＝f(x(k))+g(x(k))u(k)，k＝0，1，2，…

其中x(k)为k时刻系统的状态，f(x(k))与g(x(k))为系统的未知结构模型，u(k)为k时刻的系统输入；假设系统的参数信号为x_d(k)，定义跟踪误差如下

e(k)＝x(k)-x_d(k)

利用神经网络技术直接构建系统的未知控制器；

定义一个动态面为

s(k+1)＝e(k+1)+k_ee(k)

其中，k_e为大于零的常数，e(k+1)表示如下

e(k+1)＝x(k+1)-x_d(k+1)

＝f(x(k))+g(x(k))u(k)-x_d(k+1)

设计一个代价函数如下

根据神经网络技术，构造系统(1)的控制器如下

其中，W＝[w₁，…，w_q]^T为神经网络的权值向量，H(X(k))＝[h₁(X(k))，…，h_q(X(k))]^T为神经网络的基函数，X(k)＝[x(k)，x_d(k)]^T为神经网络的输入向量，神经网络的输出使W^TH(X(k))，也即是控制器u(k)；由于w(k)为权值向量，其第j个元素用w_j(k)表示；同理，b_j(k)为向量b(k)的第j个元素；c_ij(k)为矩阵c(k)第i行第j个元素；c_j(k)为矩阵c(k)的第j列数据；

神经网络的参数w，b，c的更新率定义如下：

w(k+1)＝w(k)-η_w(k)r(w(k))

b(k+1)＝b(k)-η_b(k)r(b(k))

c(k+1)＝c(k)-η_c(k)r(c(k))

其中