CN104050508A

CN104050508A - 一种基于klms的自适应小波核神经网络跟踪控制方法

Info

Publication number: CN104050508A
Application number: CN201410293347.XA
Authority: CN
Inventors: 赵玉新; 杜雪; 贾韧锋; 夏庚磊; 何立晖; 吴迪; 李旺; 常帅
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2014-06-25
Filing date: 2014-06-25
Publication date: 2014-09-17
Anticipated expiration: 2034-06-25
Also published as: CN104050508B

Abstract

本发明公开了一种基于KLMS的自适应小波核神经网络跟踪控制方法。包括以下几个步骤：初始化小波核神经网络；将预定值和由控制对象输出的实际观测值进行比较，得到误差信号，输入给小波核神经网络，求解代价函数；调节隐含层——输出层权值的自适应学习率，更新隐含层——输出层权值；调节输入层——隐含层权值的自适应学习率，更新输入层——隐含层权值；更新小波核函数的收缩因子；求解隐含层的诱导局部域及输出；求解输出层的诱导局部域及输出，将输出作为控制信号输送给控制对象的执行机构。本发明减少了迭代过程中的记忆内存和计算复杂度，并提高了控制系统的准确性和快速性。

Description

一种基于KLMS的自适应小波核神经网络跟踪控制方法

技术领域

本发明属于神经网络跟踪控制领域，尤其涉及一种基于KLMS的自适应小波核神经网络跟踪控制方法。

背景技术

人工神经网络是由人工神经元互联而成的网络系统，它从微观结构和功能上对人脑进行了抽象和简化，可以看作是一个由简单处理单元构成的规模宏大的高度并行处理器，天然具有存储经验知识和使之可用的特性。在处理计算上，虽然每个处理单元的功能看似简单，但大量简单处理单元的并行活动使网络在保证较快速度的前提下呈现出丰富的功能。神经网络控制的基本思想是从仿生学的角度，模拟人脑神经系统的动作方式，使其具有人脑那样的感知、学习和推理能力。其实维纳早在《控制论》一书中，就揭示了机器和生物系统所共同遵守的信息与控制规律，为人工神经网络的应用提供了理论依据。对控制科学而言，神经网络的巨大吸引力在于：

神经网络本质上是非线性系统，能够充分逼近复杂的非线性关系；

具有很高的自适应性和自组织性，能够学习和适应不确定性系统的动态特性；

由于神经元之间的广泛连接，即使有少量单元或连接损坏，也不影响系统的整体功能，

表现出很强的鲁棒性和容错能力；

信息的并行处理方式使得快速进行大量运算成为可能。

其中作为前向多层神经网络训练方法的BP算法应用最为广泛，使用BP神经网络进行跟踪控制无需依靠控制系统的数理模型，可以改进跟踪的准确性。然而这种传统网络存在着模型建立的物理解释、网络激活函数采用的全局性函数、网络收敛性的保证以及网络节点数的确定等尚待探讨和改善的问题。同时传统算法较低的学习效率及其易于陷入局部极小的缺陷又影响了控制算法的实时性。小波神经网络是基于小波变换而构成的神经网络模型，即用非线性小波基函数取代通常的神经元非线性激励函数，把小波变换与神经网络有机地结合起来，从而充分继承了两者的优点。

然而小波网络在更新网络的过程中依然保持着用梯度下降法调节权值的传统采用，因此不可避免地存在着过分强调克服学习错误而导致泛化性能不强，过拟合及不适定性等问题。为了从根源提高小波网络的计算效率，应从神经网络的核心——LMS算法入手进行改进。LMS以其计算量小及容易实现而著称，但不能广泛应用于非线性领域。随着核理论与核技巧的广泛应用，Weifeng.L等学者在2007年首次提出基于核理论的LMS计算的在线学习方法，将高斯核函数引入LMS算法中，这项研究引起了机器学习领域的广泛关注。核方法将输入数据映射到一个高维空间中，从而将非线性问题转化为线性问题。这种基于核理论的方法衍生于再生希尔伯特空间(RKHS)，通过线性结构来实现一定的非线性空间计算从而避免了计算过程中的显式正则化现象，减少了迭代过程中的记忆内存与计算复杂度。但对于高斯核来说，其在拟合过程中遇到较为复杂的非线性信号，往往不能很好的逼近目标。目前核函数多用于支持向量机和径向基神经网络，已有文献表明，这两种机器学习方法中的核函数通过平移不可能生成该子空间上的一组完备的基。这种基的不完备性导致了不能逼近该子空间上的任意分类界面。而小波函数形成的核函数仅通过平移伸缩便能生成L₂(R)空间上的一组完备的基。

发明内容

本发明的目的是提供一种基于KLMS的小波核网络，快速精确的一种基于KLMS的自适应小波核神经网络跟踪控制方法。

本发明是通过以下技术方案实现的：

一种基于KLMS的自适应小波核神经网络跟踪控制方法，包括以下几个步骤：

步骤一：初始化小波核神经网络；

小波核神经网络包括输入层I、隐含层J、输出层K，隐含层的激活函数采用小波核函数输出层采用一般激励函数f(x)，输入层——隐含层的权值为w_JI，隐含层——输出层的权值为w_KJ；

小波核函数为：

其中，a_i＞0为小波收缩因子，ψ(x)一维母小波函数；

步骤二：将预定值和由控制对象输出的实际观测值进行比较，得到误差信号，输入给小波核神经网络，求解代价函数；

步骤三：调节隐含层——输出层权值的自适应学习率η_K(n)，更新隐含层——输出层权值；

步骤四：调节输入层——隐含层权值的自适应学习率η_J(n)，更新输入层——隐含层权值；

步骤五：更新小波核函数的收缩因子；

步骤六：求解小波核神经网络中隐含层的诱导局部域v_J(n)及输出x_J；

步骤七：求解小波核神经网络中输出层的诱导局部域v_K(n)及输出z_K，将输出z_K作为控制信号输送给控制对象的执行机构。

本发明一种基于KLMS的自适应小波核神经网络跟踪控制方法，还可以包括：

1、代价函数ε(n)为：

ϵ (n) = \frac{1}{2} e^{2} (n)

其中，e(n)为将预定值和由控制对象输出的实际观测值进行比较得到的误差信号。

2、隐含层——输出层间的权值所采用的自适应学习率为：

η_{K} (n) = \{\begin{matrix} η_{\max}, η > η_{\max} \\ \frac{1}{f^{'} (v_{K} (n)) (x_{1}^{2} (n - 1) + x_{2}^{2} (n - 1) + . . . + x_{K}^{2} (n - 1)) + σ_{v}^{2}}, η_{\min} < η < η_{\max} \\ η_{\min}, η < η_{\min} \end{matrix}

其中0＜σ_v＜1，η_max和η_min为设定的自适应学习率的最大值和最小值，w_kj(n)为权值，x_j(n)为隐含层神经元输入，w_KJ(n)和x_J(n)分别为w_kj(n)和x_j(n)构成的矩阵，J为隐含层神经元总数，f(·)为输出层K的激励函数；

更新后的隐含层——输出层权值为：

其中，v_J(n)为隐含层的诱导局部域，v_J(0)为区间(0，1)内的随机数。

3、输入层——隐含层权值的自适应学习率为：

η_{J} (n) = \frac{1}{K} Σ_{k = 1}^{K} η_{k} (n)

更新后的输入层——隐含层权值为：

其中，v_J(n)为输入层的诱导局部域，v_J(0)为区间(0，1)内的随机数，w_ij(n)为权值，x_i(n)为输入层神经元输入，w_JI(n)和x_I(n)分别为w_ij和x_i(n)构成的矩阵，I为输入层神经元总数。

4、更新后的收缩因子为：

a(n+1)＝a(n)-μ'▽_a(n)(e²(n))

其中，μ'是固定学习率，▽_a(n)是代价函数对a(n)的偏导数。

5、隐含层单个神经元j的诱导局部域v_J(n)和神经元输出x_J分别为：

v_{J} (n) = Σ_{i = 1}^{I} w_{ji} (n) x_{i} (n) = x_{I}^{T} (n) w_{JI} (n)

6、输出层单个神经元k的诱导局部域v_K(n)和神经元输出z_K分别为：

v_{K} (n) = Σ_{j = 1}^{J} w_{kj} (n) x_{j} (n) = x_{J}^{T} (n) w_{KJ} (n)

7、小波核函数的具体形式为：

其中w₀为常值参数，一般激励函数f(x)采用Sigmoid函数。

本发明的有益效果是：

本发明在现有小波网络的基础上，采用KLMS算法进行网络参数的学习，将小波核函数代替曾被广泛应用的高斯核函数等传统核函数，并引入自适应学习率进行迭代计算。本发明的控制模型的构造来自于过程控制系统的通用结构，例如核动力装置中的直流蒸汽发生器给水流量控制或稳压器的压力控制。控制对象的执行机构是直流蒸汽发生器，控制对象的观测值为实际给水流量。KLMS算法通过线性结构来实现一定的非线性空间计算从而避免了计算过程中的显式正则化现象，而小波函数形成的核函数仅通过平移伸缩便能生成L₂(R)空间上的一组完备的基。与传统小波网络相比，本发明减少了迭代过程中的记忆内存和计算复杂度，并提高了准确性和快速性。

附图说明

图1为自适应学习率的神经网络结构图；

图2为神经网络自适应训练流程图；

图3为复杂系统的神经网络跟踪控制原理图；

图4为神经元j的输入信号流图；

图5为跟踪控制拟合曲线与误差信号1；

图6为跟踪控制拟合曲线与误差信号2。

具体实施方式

下面结合附图对本发明做进一步详细说明。

本发明提出一种自适应小波核神经网络跟踪控制方法，构建一种Morlet小波核函数，并采用KLMS算法对小波核网络进行参数的迭代更新，从而实现对未知控制模型的跟踪控制。该方法的具体实施方式包括建立控制模型及神经网络模型，构造小波核函数，不同层间的权值更新以及小波核函数的收缩因子更新。本发明所述的基于KLMS算法的小波核函数采用在线学习方式进行，图1所示是小波核网络的系统结构图。下面将按照流程详述本发明提出的技术方案的具体实施方式，流程如图2所示。该实施方式主要包含以下几个关键内容：

步骤1建立控制系统模型，如附图3所示。令神经网络采用MISO的多层反馈网结构，设置循环停止准则。神经网络的状态空间模型可表述为：

其中w_n为小波网络的权值空间，x_n为网络输入，z_n为网络输出，φ_n为权值更新函数，为参数化的非线性函数。

步骤2构造小波核函数。小波变换的基本思想是利用一簇小波的线性组合实现任意函数的表示。若一维母小波函数为ψ(x)，利用张量积理论可分离的d维小波函数的特殊情况可以写成：

ψ_{d} (x) = Π_{i = 1}^{d} ψ (x_{i})

构造如下平移不变小波核函数：

k (x, x^{'}) = Σ_{i = 1}^{d} ψ_{i} (\frac{x_{i} - {x^{'}}_{i}}{a_{i}})

其中a_i＞0为小波收缩因子。将母小波函数替换成某些具体形式，便可获得相应的小波函数。由于满足核函数条件的小波函数并不多，其中Morlet是一种可以构造核函数的小波函数，因此本发明给出具体的小波函数(Morlet函数)的核函数表示：

k (x, x^{'}) = Π_{i = 1}^{d} \cos (w_{0} (\frac{x_{i} - {x^{'}}_{i}}{a_{i}})) \exp (- \frac{{(x_{i} - {x^{'}}_{i})}^{2}}{{2 a}_{i}^{2}})

其中w₀为常值参数。

步骤3构造小波核神经网络(Wavelet Kernel Neural Network,WKNN)。WKNN采用多层神经元，为便于理解，本发明的以MISO三层神经元进行阐述。网络分为输入层、隐含层及输出层，其中隐含层的激活函数采用小波核函数输出层采用一般激励函数f(x)即可，例如本发明采用的Sigmoid函数。WKNN采用传统网络的多层间权值分布，即输入层——隐含层和隐含层——输出层都存在权值，权值的矩阵大小视网络具体结构而定。其中输入层、隐含层和输出层分别用I、J和K表示，各层间的权值由由w_JI和w_KJ表示，如图4所示。

步骤4求解训练代价函数ε(n):

ϵ (n) = \frac{1}{2} e^{2} (n)

其中e(n)为将预定值和由控制对象输出的实际观测值进行比较得到的误差信号；

步骤5调节隐含层——输出层权值的自适应学习率η_K(n)。KLMS算法由LMS算法衍生，其优势在于核函数的运用，而计算原理与LMS近似。LMS算法产生于自适应滤波器研究，目前已证实，当输入较大时，滤波器会遇到梯度噪声大的问题，为了解决这一困难，人们提出了归一化滤波器——NLMS滤波器。由于NLMS多用于SISO系统，同时与神经网络相比，NLMS相当于单神经元的情况，且不含激励函数。为此本发明结合NLMS的理论思想，针对WKNN的特殊性和复杂性，采用以下方式对隐含层——输出层间权值更新时的自适应学习率进行计算：

η_{K} (n) = \frac{1}{f^{'} (v_{k} (n)) (x_{1}^{2} (n - 1) + x_{2}^{2} (n - 1) + . . . + x_{K}^{2} (n - 1)) + σ_{v}^{2}}

由此可知，η_K(n)的分母由两部分组成，第一部分为各输出神经元输入的平方和与神经元激活函数导数的乘积。当x²(n)较小时，也会很小，这样有可能出现数值计算的困难，因此加入分母的第二部分以克服这个问题。除此以外，为了保证η_k(n)的有效性，需对其加以阈值的限制：

η_{K} (n) = \{\begin{matrix} η_{\max}, η > η_{\max} \\ \frac{1}{f^{'} (v_{K} (n)) (x_{1}^{2} (n - 1) + x_{2}^{2} (n - 1) + . . . + x_{K}^{2} (n - 1)) + σ_{v}^{2}}, η_{\min} < η < η_{\max} \\ η_{\min}, η < η_{\min} \end{matrix}

步骤6更新隐含层——输出层突触权值。突触权值的调整过程采用梯度搜索及KLMS算法来寻求最优权值。其中作为更新的第一层组权值，令w_KJ(0)＝0，隐含层——输出层间的突触权值可由以下公式进行调整：

步骤7调节输入层——隐含层权值的自适应学习率η_J(n)。误差在反向传播调整过程中会逐渐减弱对权值的作用，因此在这两层间学习步长调整时，本发明在自适应效果与计算量之间采用折衷的方案，即每新一轮误差的调整过程中，步长也做相应的调整，但各个神经元间采用相同的学习率：

η_{J} (n) = \frac{1}{K} Σ_{k = 1}^{K} η_{k} (n)

步骤8更新输入层——隐含层突触权值。在步骤6的基础上，输入层——隐含层的突触权值由以下公式进行调整：

步骤9调节小波核函数的收缩因子。对网络学习有着决定作用的除了权值以外，小波核函数的收缩因子也起到至关重要的作用，由于在线学习的WKNN中每一学习时刻的收缩因子a(n)都是不同的，因此需要采用一种相应的递推方法来进行更新。与权值相同，更新a(n)的目的也是减少误差的最小均方，同时也可以依靠梯度搜索来实现。由于小波核函数具有可微性，则根据误差定义，收缩因子由下式进行更新：

a(n+1)＝a(n)-μ'▽_a(n)(e²(n))

其中μ'是固定学习率，▽_a(n)是代价函数对a(n)的偏导数，即梯度函数。根据微分链式规则：

{&dtri;}_{a (n)} = e (n) (\frac{{&PartialD; z}_{K}}{&PartialD; a (n)}) = e (n) (\frac{{&PartialD; z}_{K}}{&PartialD; u (n)} \frac{&PartialD; u (n)}{&PartialD; a (n)})

\frac{&PartialD; u (n)}{&PartialD; a (n)} = \frac{&PartialD; u (n)}{&PartialD; k (n)} \frac{&PartialD; k (n)}{&PartialD; a (n)} = η_{K} (n) Σ_{p = 0}^{n - 1} α (p) Hk (x (p), x (n))

其中

H = \frac{&PartialD; k}{&PartialD; a}, u = η_{K} (n) Σ_{p = 0}^{n - 1} α (p) k (x (p), x (n)) .

为此▽_a(n)可表示为：

{&dtri;}_{a (n)} = η_{K} (n) e (n) f^{'} (u) Σ_{p = 0}^{n - 1} α (p) Hk (x (p), x (n))

而结合α(n)＝e(n)f'(u)，收缩因子a(n)的更新公式为：

a (n + 1) = a (n) - μ (n) α (n) Σ_{p = 0}^{n - 1} α (p) Hk (x (p), x (n))

其中μ(n)＝μ'η_K(n)。

步骤10求解小波核网络中隐含层的诱导局部域v_J(n)及输出x_J。作为隐含层的J层，其单个神经元j由其输入神经元产生的输入信号所提供，神经元j的诱导局部域为：

v_{J} (n) = Σ_{i = 1}^{I} w_{ji} (n) x_{i} (n) = x_{I}^{T} (n) w_{JI} (n)

经过隐含层神经元的小波核函数作用后，输出x_J可表示为：

其中v_J(n)为诱导局部域，w_ij(n)为权值，x_i(n)为输入层神经元输入，w_JI(n)和x_I(n)分别为w_ij和x_i(n)构成的矩阵或向量，I为输入层神经元总数，为J层(隐含层)的小波核函数。

步骤11求解小波核网络中输出层的诱导局部域v_K(n)及输出z_K。作为输出层的K层，其单个神经元k由其隐含神经元产生的输入信号所提供，神经元k的诱导局部域为：

v_{K} (n) = Σ_{j = 1}^{J} w_{kj} (n) x_{j} (n) = x_{J}^{T} (n) w_{KJ} (n)

经过输出层神经元的活化作用后，输出z_K可表示为：

其中v_K(n)为诱导局部域，w_kj(n)为权值，x_j(n)为隐含层神经元输入，w_KJ(n)和x_J(n)分别为w_kj(n)和x_j(n)构成的矩阵或向量，J为隐含层神经元总数，f(·)为K层(输出层)的激励函数。

步骤12迭代更新，进入下一个参数循环。循环次数加1，返回步骤5对系统继续跟踪控制，直至满足停止准则。将控制信号输入执行机构并与系统进行计算融合，在一定的外界干扰条件下，输出被控参数值，并与预期量进行比较，完成闭环反馈控制的一个过程。为测试本发明中的小波核网络的性能，如附图5和6所示，分别对稳态响应与动态响应进行控制训练，同时均采用自适应学习率的小波神经网络与本发明的小波核函数神经网络进行对比仿真验证。

Claims

1.一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于，包括以下几个步骤：

步骤一：初始化小波核神经网络；

小波核函数为：

其中，a_i＞0为小波收缩因子，ψ(x)一维母小波函数；

步骤五：根据代价函数，更新小波核函数的收缩因子；

2.根据权利要求1所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的代价函数ε(n)为：

ϵ (n) = \frac{1}{2} e^{2} (n)

3.根据权利要求2所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的隐含层——输出层间的权值所采用的自适应学习率为：

η_{K} (n) = \{\begin{matrix} η_{\max}, η > η_{\max} \\ \frac{1}{f^{'} (v_{K} (n)) (x_{1}^{2} (n - 1) + x_{2}^{2} (n - 1) + . . . + x_{K}^{2} (n - 1)) + σ_{v}^{2}}, η_{\min} < η < η_{\max} \\ η_{\min}, η < η_{\min} \end{matrix}

更新后的隐含层——输出层权值为：

4.根据权利要求3所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的输入层——隐含层权值的自适应学习率为：

η_{J} (n) = \frac{1}{K} Σ_{k = 1}^{K} η_{k} (n)

更新后的输入层——隐含层权值为：

5.根据权利要求4所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的更新后的收缩因子为：

a(n+1)＝a(n)-μ'▽_a(n)(e²(n))

其中，μ'是固定学习率，▽_a(n)是代价函数对a(n)的偏导数。

6.根据权利要求5所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的隐含层单个神经元j的诱导局部域v_J(n)和神经元输出x_J分别为：

v_{J} (n) = Σ_{i = 1}^{I} w_{ji} (n) x_{i} (n) = x_{I}^{T} (n) w_{JI} (n)

7.根据权利要求6所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的输出层单个神经元k的诱导局部域v_K(n)和神经元输出z_K分别为：

v_{K} (n) = Σ_{j = 1}^{J} w_{kj} (n) x_{j} (n) = x_{J}^{T} (n) w_{KJ} (n)

8.根据权利要求7所述的一种基于KLMS的自适应小波核神经网络跟踪控制方法，其特征在于：所述的小波核函数的具体形式为：

其中w₀为常值参数，

一般激励函数f(x)采用Sigmoid函数。