CN107145937A - 基于弹性scad罚函数的回声状态网络时间序列预测方法 - Google Patents
基于弹性scad罚函数的回声状态网络时间序列预测方法 Download PDFInfo
- Publication number
- CN107145937A CN107145937A CN201710294257.6A CN201710294257A CN107145937A CN 107145937 A CN107145937 A CN 107145937A CN 201710294257 A CN201710294257 A CN 201710294257A CN 107145937 A CN107145937 A CN 107145937A
- Authority
- CN
- China
- Prior art keywords
- scad
- formula
- particle
- penalty functions
- echo state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于弹性SCAD罚函数的回声状态网络时间序列预测方法,结合 SCAD 罚函数和范数建立稀疏模型,该模型具有无偏估计、良好处理共线性和过拟合问题能力,从而提高模型的预测精度;针对该方法中的非凸函数优化问题,也给出基于局部二次近似的求解方法以及基于粒子群算法的超参数估计方法。
Description
技术领域
本发明涉及信息技术领域,具体地说是一种基于弹性SCAD罚函数的回声状态网络时间序列预测方法。
背景技术
回声状态神经网络是一种新型的递归神经网络学习方法。其通过引入一个随机生成、且保持不变的,称作为储备池的内部网络,来取代经典神经网络中的中间隐含层。当外部输入的时间序列进入回声状态网络时,便在内部建立起复杂多样的非线性映射关系,起到存储历史信息的作用,最后再通过一个简单的输出连接矩阵得到网络输出。
整个回声状态网络的储备池内部连接权值是固定不变的,调整仅仅针对输出连接矩阵进行, 克服了一般递归神经网络收敛速度慢、容易陷入局部最优和梯度消退等问题,克服了递归神经网络内在梯度和记忆渐消问题,同时也极大降低了训练阶段的计算量,达到估计精度和计算复杂度的折中。
回声状态网络通过储备池的规模来保证系统的动态性,但在储备池规模设置的过大,训练数据存在野点情况下,极有可能导致输出矩阵共线性和过拟合问题;反之如果储备池规模设置的过小,就可能导致其对真实系统的估计精度不足。
为了保证回声状态网络的动态性,在无法事先确知真实系统的复杂程度情况下,通常都设置较大的储蓄池规模,然后通过正则化方法对输出连接矩阵做出约束,建立稀疏解,克服可能存在的共线性和过拟合问题。
目前常用的正则化方法包括岭回归(L 2 范数)、L 1 范数、弹性网等,但是岭回归对于变量没有选择性,L 1 范数对于相关向量无效,并且这些方法对输出连接矩阵中的大权值系数施加更大的惩罚,对于这些大权值系数属于有偏估计。
发明内容
针对上述现有的回声状态网络中共线性和过拟合等问题,本发明提供一种基于弹性SCAD罚函数的回声状态网络时间序列预测方法。
为解决上述技术问题,本发明采用的技术方案为:
一种基于弹性SCAD罚函数的回声状态网络时间序列预测方法,包括以下步骤:
步骤一:对原始数据进行预处理,包括去除异常数据及消除数据的趋势性;
步骤二:建立回声状态网络模型
将时间序列训练数据送入回声状态网络中,储蓄池回声状态向量x(t)和输出向量y(t)模型如下:
(1)
(2)
式中W in 、W x 和W back 分别为输入矩阵、储备池连接矩阵和后向反馈矩阵,它们是已知的;W out 为储备池输出连接矩阵,是回声状态网络中唯一需要训练求解的;t时刻的储备池内部状态向量x(t)由当前输入u in (t)、上一时刻状态向量x(t-1)以及后向反馈向量y(t)共同激发产生;输出连接矩阵使用最小二乘法求解得到:
(3)
其中 是 的伪拟;
步骤三:弹性SCAD罚函数
为了应对回声状态网络输出矩阵多重共线性和过拟合问题,采用弹性SCAD罚函数估计权值,其具体模型如下:
(4)
式中第二项和第三项分别是SCAD罚函数和L 2 范数罚函数,其组成弹性SCAD罚函数,其中SCAD罚函数模型如下:
(5)
其中可调超参数,参数向量表示为w,对w j 的一阶导数表示为:
(6)
式(5)中SCAD罚函数在原点近似奇异值,能够产生稀疏解;对于置为常数,从而满足对的近似无偏估计;式(6)中SCAD罚函数导数在 上连续可导,但在原点处不可导;
步骤四:基于弹性SCAD罚函数的局部二次近似求解
SCAD罚函数在原点处不可微,不能直接用凸函数优化方法进行迭代;使用局部二次近似来近似分解SCAD罚函数,从而能求解该模型的近似解;设初始值已知,对 SCAD部分的局部二次近似模型如下:
(7)
式中是 的临近点,采用式(3)普通最小二乘得到, 的一阶导数表示为:
(8)
得到SCAD罚函数的近似表达后,对式(4)执行重复岭回归解得到:
(9)
其中:
(10)
实际中,采用最小二乘估计,只要一步迭代就能找到值;
步骤五:粒子群优化回声状态网络
基于弹性SCAD的回声状态网络包含较多的超参数,网格搜索法难以确定最优的超参数值,采用粒子群算法进行超参数优化;假设粒子用速度矢量v和位置矢量p进行描述,在时间步中,粒子通过更新速度矢量v i 来搜寻全局最优位置矢量p i ,同时每个粒子根据适应度和速度决定它自身的飞行方向,逐步移到较优区域,最终搜索到全局最优位置矢量,模型如下:
(11)
(12)
式中v i (t)和p i (t)分别为第i个粒子t时刻的速度分量和位置矢量;lb i (t)为第i粒子t时刻的最优位置分量;gb(t)为t时刻整个粒子群的最优位置分量;w为惯性权重,c 1 和c 2 为加速常数;rand 1 和rand 2 是介于0和1之间的随机数;
步骤六:下一时刻时间序列预测
通过下式获取所述预测数据:
(13)
其中,为第时刻输入值,为第时刻预测数据,为估计的输出权值矩阵。
所述弹性SCAD罚函数用于变量选择,克服储备池网络输出的共线性和过拟合问题,并用粒子群算法进行超参数估计,其具体步骤如下:
1)采集时间序列,并对数据进行预处理;
2)初始化储备池超参数、输入连接矩阵w in 、储备池连接矩阵w x 和反馈矩阵w back 和测试误差阈值;
3)确定输入矩阵大小 N和稀疏度SD值,设定回声状态网络中输入单元尺度IS、输入单元位移ISH、教师信号尺度 TS、教师信号位移 TSH及弹性SCAD罚函数中g,l 1 ,l 2 超参数范围;设置粒子群算法中的超参数,包括最大迭代次数M、测试误差阈值err,粒子群大小Npop、惯性权重w、c 1 和c 2 加速常数;
4)确定搜索空间,在搜索空间中随机初始化粒子群算法中各粒子的速度矢量v和位置矢量p;
5)输入训练样本(X,Y),根据式(3)估计初始输出连接矩阵;
6)使用式(9)计算最终的储备池输出连接矩阵估计;
7)采用均方根误差函数评价各粒子的适应度;
8)根据式(11)和式(12)更新各粒子的速度矢量V和位置矢量P;
9)判断迭代是否达到最大迭代次数或设定测试误差阈值err;若是,停止程序,输出最后的gb作为最优超参数选择,否则重复执行步骤4)-步骤6),直到满足设定条件为止;
10)使用式(13)对下一个时刻值进行预测。
本发明的有益效果:
本发明提供的基于弹性SCAD罚函数的回声状态网络时间序列预测方法,结合 SCAD 罚函数和L 2 范数建立稀疏模型,该模型具有无偏估计、良好处理共线性和过拟合问题能力,从而提高模型的预测精度;针对该方法中的非凸函数优化问题,也给出基于局部二次近似的求解方法以及基于粒子群算法的超参数估计方法。
附图说明
图1为本发明的整体实现流程图;
图2为弹性SCAD罚函数的回声状态网络示意图;
图3为Lorenz时间序列的一步预测结果。
具体实施方式
下面结合具体实施方式对本发明做进一步的阐述。
本发明技术的整体实现流程如附图1所示,具体步骤如下:
步骤1):数据采集和预处理
采集时间序列,包括输入数据X和输出时间序列Y;数据采集后,对其进行预处理,包括消除数据趋势性和去除异常数据;将预处理后的数据按时间点划分为训练数据集和预测数据集,其中远离当前时间点的数据划分为训练数据集,当前时间点前的一段时间内的数据划分为预测数据集。
步骤2):初始化储备池超参数、输入连接矩阵w in 和储备池连接矩阵w x 和反馈矩阵w back 和测试误差阈值;
步骤3):粒子群算法中的超参数初始化
本发明采用粒子群算法进行超参数优化,需要估计的超参数包括ESN和SCAD罚函数中的超参数,其中ESN中的超参数包括IS(Input Scaling)、输入单元位移ISH(Input Shift)、教师信号尺度 TS(Teacher Scaling)、教师信号位移 TSH(Teacher Shift)以及弹性SCAD罚函数中的g,l 1 ,l 2 等7个超参数;
步骤4):确定搜索空间,在搜索空间中随机初始化粒子群算法中各粒子的速度矢量v和位置矢量p。
步骤5):将时间序列训练数据(X,Y)送入回声状态网络中,储蓄池回声状态向量x(t)和输出向量y(t)模型如下:
(14)
(15)
其中W in 、W x 和W back 分别为输入矩阵、储备池连接矩阵和后向反馈矩阵,它们是已知的;W out 为储备池输出连接矩阵,是回声状态网络中唯一需要训练求解的;t时刻的储备池内部状态向量x(t)由当前输入u in (t)、上一时刻状态向量x(t-1)共同激发产生;
估计初始输出连接矩阵由最小二乘法求解得到:
(16)
步骤6):执行岭回归解估计非零元素的输出连接矩阵:
(17)
步骤7):利用均方根误差(NRMSE)函数计算各粒子的适应度:
(18)
步骤8):更新每个粒子的速度矢量v和位置矢量p:
(19)
(20)
式中v i (t)和p i (t)分别为第i个粒子t时刻的速度分量和位置矢量;lb i (t)为第i粒子t时刻的最优位置分量;gb(t)为t时刻整个粒子群的最优位置分量;w为惯性权重,c 1 和c 2 为加速常数;rand 1 和rand 2 是介于0和1之间的随机数;
步骤9):判断迭代是否达到最大迭代次数或设定测试误差阈值;若是,停止程序,输出最后的gb作为弹性SCAD回声状态网络的最优超参数选择,否则重复执行步骤4)-步骤6),直到满足设定条件为止;
步骤10):使用估计输出矩阵 对下一个时刻值进行预测:
(21)
其中,为第时刻输入值,为第时刻预测输出值。
Claims (2)
1.一种基于弹性SCAD罚函数的回声状态网络时间序列预测方法,其特征在于,包括以下步骤:
步骤一:对原始数据进行预处理,包括去除异常数据及消除数据的趋势性;
步骤二:建立回声状态网络模型
将时间序列训练数据送入回声状态网络中,储蓄池回声状态向量x(t)和输出向量y(t)模型如下:
(1)
(2)
式中w in 、w x 和w back 分别为输入矩阵、储备池连接矩阵和后向反馈矩阵,它们是已知的;w out 为储备池输出连接矩阵,是回声状态网络中唯一需要训练求解的;t时刻的储备池内部状态向量x(t)由当前输入u in (t)、上一时刻状态向量x(t-1)以及后向反馈向量y(t)共同激发产生;输出连接矩阵使用最小二乘法求解得到:
(3)
其中 是 的伪拟;
步骤三:弹性SCAD罚函数
为了应对回声状态网络输出矩阵多重共线性和过拟合问题,采用弹性SCAD罚函数估计权值,其具体模型如下:
(4)
式中第二项和第三项分别是SCAD罚函数和L 2 范数罚函数,其组成弹性SCAD罚函数,其中SCAD罚函数模型如下:
(5)
其中可调超参数,参数向量表示为w,对w j 的一阶导数表示为:
(6)
式(5)中SCAD罚函数在原点近似奇异值,能够产生稀疏解;对于置为常数,从而满足对的近似无偏估计;式(6)中SCAD罚函数导数在 上连续可导,但在原点处不可导;
步骤四:基于弹性SCAD罚函数的局部二次近似求解
SCAD罚函数在原点处不可微,不能直接用凸函数优化方法进行迭代;使用局部二次近似来近似分解SCAD罚函数,从而能求解该模型的近似解;设初始值已知,对 SCAD部分的局部二次近似模型如下:
(7)
式中是 的临近点,采用式(3)普通最小二乘得到, 的一阶导数表示为:
(8)
得到SCAD罚函数的近似表达后,对式(4)执行重复岭回归解得到:
(9)
其中:
(10)
实际中,采用最小二乘估计,只要一步迭代就能找到值;
步骤五:粒子群优化回声状态网络
基于弹性SCAD的回声状态网络包含较多的超参数,网格搜索法难以确定最优的超参数值,采用粒子群算法进行超参数优化;假设粒子用速度矢量v和位置矢量p进行描述,在时间步中,粒子通过更新速度矢量v i 来搜寻全局最优位置矢量p i ,同时每个粒子根据适应度和速度决定它自身的飞行方向,逐步移到较优区域,最终搜索到全局最优位置矢量,模型如下:
(11)
(12)
式中v i (t)和p i (t)分别为第i个粒子t时刻的速度分量和位置矢量;lb i (t)为第i粒子t时刻的最优位置分量;gb(t)为t时刻整个粒子群的最优位置分量;w为惯性权重,c 1 和c 2 为加速常数;;rand 1 和rand 2 是介于0和1之间的随机数;
步骤六:下一时刻时间序列预测
通过下式获取所述预测数据:
(13)
其中,为第时刻输入值,为第时刻预测数据,为估计的输出权值矩阵。
2.如权利要求1所述的基于弹性SCAD罚函数的回声状态网络时间序列预测方法,其特征在于:所述弹性SCAD罚函数用于变量选择,克服储备池网络输出的共线性和过拟合问题,并用粒子群算法进行超参数估计,其具体步骤如下:
1)采集时间序列,并对数据进行预处理;
2)初始化储备池超参数、输入连接矩阵w in 、储备池连接矩阵w x 和反馈矩阵w back 和测试误差阈值;
3)确定输入矩阵大小 N和稀疏度SD值,设定回声状态网络中输入单元尺度IS、输入单元位移ISH、教师信号尺度 TS、教师信号位移 TSH及弹性SCAD罚函数中g,l 1 ,l 2 超参数范围;设置粒子群算法中的超参数,包括最大迭代次数M、测试误差阈值err,粒子群大小Npop、惯性权重w、c 1 和c 2 加速常数;
4)确定搜索空间,在搜索空间中随机初始化粒子群算法中各粒子的速度矢量v和位置矢量p;
5)输入训练样本(X,Y),根据式(3)估计初始输出连接矩阵;
6)使用式(9)计算最终的储备池输出连接矩阵估计;
7)采用均方根误差函数评价各粒子的适应度;
8)根据式(11)和式(12)更新各粒子的速度矢量v和位置矢量p;
9)判断迭代是否达到最大迭代次数或设定测试误差阈值err;若是,停止程序,输出最后的gb作为最优超参数选择,否则重复执行步骤4)-步骤6),直到满足设定条件为止;
10)使用式(13)对下一个时刻值进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710294257.6A CN107145937A (zh) | 2017-04-28 | 2017-04-28 | 基于弹性scad罚函数的回声状态网络时间序列预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710294257.6A CN107145937A (zh) | 2017-04-28 | 2017-04-28 | 基于弹性scad罚函数的回声状态网络时间序列预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107145937A true CN107145937A (zh) | 2017-09-08 |
Family
ID=59775357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710294257.6A Pending CN107145937A (zh) | 2017-04-28 | 2017-04-28 | 基于弹性scad罚函数的回声状态网络时间序列预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107145937A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108113665A (zh) * | 2017-12-14 | 2018-06-05 | 河北大学 | 一种心电信号自动降噪方法 |
CN109686399A (zh) * | 2018-12-13 | 2019-04-26 | 韶关学院 | 一种基因数据集整合分析方法 |
CN110321422A (zh) * | 2018-03-28 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 在线训练模型的方法、推送方法、装置以及设备 |
CN112859924A (zh) * | 2021-01-27 | 2021-05-28 | 大连大学 | 一种人工干扰与esn-pso结合的无人机轨迹规划方法 |
CN113965472A (zh) * | 2021-10-22 | 2022-01-21 | 南京邮电大学 | 基于深度esn的多尺度网络流量预测方法 |
-
2017
- 2017-04-28 CN CN201710294257.6A patent/CN107145937A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108113665A (zh) * | 2017-12-14 | 2018-06-05 | 河北大学 | 一种心电信号自动降噪方法 |
CN110321422A (zh) * | 2018-03-28 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 在线训练模型的方法、推送方法、装置以及设备 |
CN110321422B (zh) * | 2018-03-28 | 2023-04-14 | 腾讯科技(深圳)有限公司 | 在线训练模型的方法、推送方法、装置以及设备 |
CN109686399A (zh) * | 2018-12-13 | 2019-04-26 | 韶关学院 | 一种基因数据集整合分析方法 |
CN112859924A (zh) * | 2021-01-27 | 2021-05-28 | 大连大学 | 一种人工干扰与esn-pso结合的无人机轨迹规划方法 |
CN112859924B (zh) * | 2021-01-27 | 2023-11-28 | 大连大学 | 一种人工干扰与esn-pso结合的无人机轨迹规划方法 |
CN113965472A (zh) * | 2021-10-22 | 2022-01-21 | 南京邮电大学 | 基于深度esn的多尺度网络流量预测方法 |
CN113965472B (zh) * | 2021-10-22 | 2023-06-30 | 南京邮电大学 | 基于深度esn的多尺度网络流量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107145937A (zh) | 基于弹性scad罚函数的回声状态网络时间序列预测方法 | |
CN110223517B (zh) | 基于时空相关性的短时交通流量预测方法 | |
Liang et al. | A deep reinforcement learning network for traffic light cycle control | |
CN107180530B (zh) | 一种基于深度时空卷积循环网络的路网状态预测方法 | |
CN109740742A (zh) | 一种基于lstm神经网络的目标跟踪方法 | |
CN108448610A (zh) | 一种基于深度学习的短期风功率预测方法 | |
CN107665230A (zh) | 用于智能家居控制的用户行为预测模型的训练方法及装置 | |
CN102622418B (zh) | 一种基于bp神经网络的预测装置及设备 | |
CN109522857A (zh) | 一种基于生成式对抗网络模型的人数估计方法 | |
CN105447510B (zh) | 基于人工蜂群优化lssvm的脉动风速预测方法 | |
CN106022239A (zh) | 一种基于循环神经网络的多目标跟踪方法 | |
CN105978732B (zh) | 一种基于粒子群优化最简回声状态网络参数的方法和系统 | |
CN107464419A (zh) | 一种考虑时空特性的短时交通流预测方法 | |
CN106022471A (zh) | 基于粒子群优化算法的小波神经网络模型船舶横摇实时预测方法 | |
CN106875004A (zh) | 复合模式神经元信息处理方法和系统 | |
CN110197251A (zh) | 基于深度学习网络的预测方法、装置、设备及存储介质 | |
CN114117259A (zh) | 一种基于双重注意力机制的轨迹预测方法及装置 | |
CN112990343B (zh) | 一种基于人工智能算法的水环境质量评价方法 | |
CN107292918A (zh) | 基于视频在线学习的跟踪方法和装置 | |
CN112231964B (zh) | 基于深度强化学习的气体泄漏源自主搜索及定位方法 | |
TW201737202A (zh) | 類Alexnet網路的模型訓練方法和裝置 | |
CN108826354A (zh) | 一种基于强化学习的火电燃烧优化方法 | |
CN105743611A (zh) | 一种基于稀疏字典的无线传感器网络缺失数据重构方法 | |
CN105303835A (zh) | 一种道路交通流状态的短时预测方法 | |
CN114572229A (zh) | 一种基于图神经网络的车速预测方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170908 |