CN111369072A - 一种基于稀疏化方法的核最小均方时间序列在线预测模型 - Google Patents

一种基于稀疏化方法的核最小均方时间序列在线预测模型 Download PDF

Info

Publication number
CN111369072A
CN111369072A CN202010195943.XA CN202010195943A CN111369072A CN 111369072 A CN111369072 A CN 111369072A CN 202010195943 A CN202010195943 A CN 202010195943A CN 111369072 A CN111369072 A CN 111369072A
Authority
CN
China
Prior art keywords
data
expected
neighbor
dictionary
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010195943.XA
Other languages
English (en)
Inventor
赵超超
任伟杰
韩敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202010195943.XA priority Critical patent/CN111369072A/zh
Publication of CN111369072A publication Critical patent/CN111369072A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Algebra (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于稀疏化方法的核最小均方时间序列在线预测模型,属于时间序列预测技术领域。本发明选择核自适应滤波器中经典的核最小均方算法作为基础算法,针对实际数据中存在异常值和自然噪声等问题,将稀疏化方法和自适应调整方法运用其中,提高算法模型的预测能力和抗噪能力。首先,运用归一化方法对数据进行预处理;然后,运用顺序异常值准则来剔除数据中的异常值;最后,将量化方法与权重自适应调整方法相结合,来减小预测模型字典的大小并提高模型的跟踪时变特性能力。本发明能够充分利用有效信息,排除异常信息的干扰,获得更加准确、紧凑的字典;通过控制参数的选择可以在算法效率和准确性之间达到良好的平衡;还可以在时变环境中自适应地调整权重。

Description

一种基于稀疏化方法的核最小均方时间序列在线预测模型
技术领域
本发明属于时间序列预测技术领域,涉及一种在线预测方法,尤其涉及一种基于核自适应滤波器算法而进行建模的预测模型。
背景技术
时间序列的在线预测在许多领域中起着越来越重要的作用,金融、环境、医药以及工程等领域里,经常以时间序列的形式收集数据。精确的时间序列预测在实际应用中具有重要价值。例如,通过对大型设备的故障诊断与剩余寿命预测,以“视情维修”替代传统的“定期维修”,从而可以降低维护费用,提高维护效率,甚至可以避免灾难性事故的发生。在实际预测应用中,大多数时间序列呈非线性特性,且需要在线处理方式,如股票走势预测、交通流实时预测以及半导体设备在线监测等。
随着各个领域的快速发展,所获取的各种数据的数量也在飞速增长,时间序列的长度逐渐增加,数据的统计特性随时间不断变化,每个新到达数据的线性增长结构增加了内核学习网络中的计算复杂性和内存需求。传统的离线预测方法难以达到预测的目标效果,这就对时间序列的在线预测方法提出了更高的需求:
(1)数据量的增加需要预测方法能降低计算复杂度,减小计算占用内存;(2)许多系统产生的时间序列还具有时变特性;(3)在实际应用中,收集的数据会有异常值,如果异常值被计算应用于模型中,将会对预测的准确性产生巨大的不良影响。因此,在处理时间序列数据时,运用稀疏性方法对数据进行预处理是十分有必要的。
因此,有必要针对具有时变特性和较大数据量的时间序列,设计出合适的在线预测方法,使其能够实时更新、提升预测效率、反映时间序列的时变特性、提高多步预测的精度,增强在线预测能力。
本发明由国家自然基金项目(61773087)资助。
发明内容
本发明针对现有技术中在线预测运算时间过长和预测不准确的问题,提供了一种基于稀疏化方法的核最小均方时间序列在线预测方法。
本发明采用的技术方案如下:
一种基于稀疏化方法的核最小均方时间序列在线预测模型,包括如下步骤:
步骤1:从实际数据中获取时间序列预测问题的样本数据,包括输入数据x(n)=[x1(n);x2(n);...x;m(n)]和预测目标y(n),其中xi(n)为第i个特征序列。
步骤2:运用归一化方法处理实验数据。
数据归一化处理是把所有数据都转化为[0,1]之间的数,其目的是消除各维数据间数量级差别,避免因为输入输出数据数量级差别较大而造成预测误差较大。采用归一化方法公式为:
Figure BDA0002417605560000021
其中,xi
Figure BDA0002417605560000022
分别代表样本数据归一化前后的值,xmax和xmin分别代表样本数据的最大值和最小值。
步骤3:划分训练集和测试集,并设置模型参数。
随机选取样本数据90%作为训练集,其余作为测试集。依据经验设置模型参数,包括模型学习率η,顺序异常值准则的用户定义系数λd和λv,量化阈值参数ε以及自适应调整参数
Figure BDA0002417605560000023
初始化模型参数,预测误差e(n)=y(1),权重向量α1=η·e(1),模型字典D(1)=x(1)。
步骤4:训练集数据按顺序进入预测模型进行训练。利用顺序异常值准则,剔除实验数据中的异常数据。所述的顺序异常值准则是依据历史数据,为新到达的数据建立预期区域,如果新数据超出预期区域,则将其标记为离群值。所述的预期区域由预期邻居距离和预期邻居方向向量组成。
4.1)预期邻居距离
在给定现有数据的信息的情况下,根据预期邻居距离推断顺序邻居数据之间的预期距离。根据预期邻居距离判断数据是否是异常值,预期邻居距离定义为:
Figure BDA0002417605560000024
其中,NDe(n)表示第n次迭代时的预期邻居距离;d<xi,xi+1>=||x(i+1)-x(i)||为相邻距离;系数2i/(n-2)(n-1)用于将更高的权重分配给更接近新数据的相邻距离。
第n次迭代的预期邻居距离的上边界和下边界被定义为:
Figure BDA0002417605560000025
其中,B_Dupper(n)和B_Dlower(n)分别表示第n次迭代中预期邻居距离的上边界和下边界;λd表示用户定义的系数;σd(n)表示{d<xi,xi+1>,i=1,2,...,n-2}的标准差。
计算相邻距离d<xn-1,xn>。如果相邻距离超出预期邻居距离的既定范围,则第n个数据将被怀疑为异常值。所述预期邻居距离的既定范围为[NDe(n)-λdσd,NDe(n)+λdσd]。
4.2)预期邻居方向向量
在给定所有现有数据的信息的情况下,预期邻居方向向量描述在顺序邻居数据之间的预期方向向量,从而推断出数据可能朝向的方向。预期邻居方向向量定义为:
Figure BDA0002417605560000031
其中,NVe(n)表示第n次迭代时的预期邻居方向向量;采用系数2i/(n-2)(n-1)是为更接近新数据的方向矢量分配更高的权重。
在第n次迭代中预期的邻居方向矢量的上边界和下边界被定义为:
Figure BDA0002417605560000032
其中,B_Vupper(n)和B_Vlower(n)分别表示第n次迭代时预期邻居方向向量的上边界和下边界;λv表示用户定义的系数;σv(n)表示{[x(i+1)-x(i)]/d<xi,xi+1>,i=1,2,...,n-2}的标准差。
计算相邻方向向量[x(n)-x(n-1)]/d<xn-1,xn>,如果超出预期邻居方向向量的既定范围,则第n个数据将被怀疑为异常值。所述的预期邻居方向向量的既定范围为[NVe(n)-λvσv,NVe(n)+λvσv]。
4.3)第n次迭代时,预期邻居距离和预期邻居方向向量的既定范围构成新到达数据的预期区域。如果当前相邻距离d<xn-1,xn>不在[NDe(n)-λdσd,NDe(n)+λdσd]区间内,同时当前相邻方向向量[x(n)-x(n-1)]/d<xn-1,xn>不在[NVe(n)-λvσv,NVe(n)+λvσv]区间内,则新到达的数据被标记为异常值。此时该数据将被剔除,开始迭代下一个训练集数据。
步骤5:当迭代次数为n时,当前的输入为{x(n),y(n)}。依据之前迭代所训练的临时预测模型计算预测目标
Figure BDA0002417605560000033
并得到预测误差e(n)。
所述的预测目标
Figure BDA0002417605560000034
其中,αn-1表示权重向量。κn-1表示核矩阵,对κn-1进行说明如下:κn-1=κ(D(n-1),x(n-1)),κ(xi,xj)=exp(-||xi-xj||/2σ2),这里采用高斯核,σ为核宽度;xi,xj表示任意的两个输入向量;D(n-1)表示第n次迭代时字典未更新前的状态,它包含被纳入字典的输入向量。
所述的预测误差
Figure BDA0002417605560000035
步骤6:运用量化方法减小模型字典大小并更新权值系数。所述量化方法采用量化条件进行判断,对冗余变量进行量化并用于权值系数更新,这就实现了在减小字典大小的同时利用了更多有效信息。
首先,计算x(n)与字典D(n-1)之间的距离:dis(x(n),D(n-1))=min1≤j≤n-1||x(n)-Dj(n-1)||,其中,j表示字典D(n-1)的第j个成员,||·||表示Euclidean范数。如果计算的距离dis(x(n),D(n-1))小于设置的量化参数ε,则不更新字典:D(n)=D(n-1)。输入数据将被量化到Dj(n-1),此时系数αn更新为αn=αj+η·e(n)。否则,将更新字典:D(n)=D(n-1)∪x(n),x(n)将成为现有字典中的新中心,此时系数αn=[αn;η·e(n)]。
步骤7:采用自适应调整方法更新权值系数。
如果输入中包含噪声或突然变化,或其他原因导致κn-1很小,则在更新αn后,效果会放大,甚至是灾难性的。因此,采用欧几里得范数的归一化策略来提高系统的自适应能力。权值可以更新为:
Figure BDA0002417605560000041
其中,
Figure BDA0002417605560000042
是用户定义的参数,其目的是避免分母为零。
这种方法可以显着提高在线顺序学习系统适应不同数据集的能力,尤其是那些包含噪音和突变的数据集的能力。
步骤8:利用训练好的模型对测试集数据进行测试,然后对预测值和测试集中的目标值进行反归一化计算。最后,计算预测值与测试集中目标值之间的均方根误差(RMSE)和对称平均绝对百分比误差(SMAPE)。
Figure BDA0002417605560000043
Figure BDA0002417605560000044
其中,y(n)为目标值,
Figure BDA0002417605560000045
为预测值,n是时间步数,N为样本总数。
步骤9:调整模型用户设定参数,并执行步骤4-8,得到多个训练好的模型和对应的评价指标RMSE和SMAPE。选取RMSE和SMAPE最小的模型作为预测模型。
本发明的有益效果为:本发明具有非常好的灵活性,可以针对不同的实际数据设置不同参数,进而得到不同的适应性模型。本发明将顺序异常值准则,权重自适应调整与量化方法相结合,与现有在线预测技术相比,本发明拥有更紧凑的字典和更高的准确率,并且预测速度和预测精度都非常令人满意。同时,它还具有良好的跟踪时变特性,对噪声具有一定的自适应能力。
附图说明
图1为本发明在线预测模型流程图。
图2(a)为2016年北京PM2.5时间序列预测曲线。
图2(b)为2016年北京PM2.5时间序列误差曲线。
具体实施方式
以下结合附图及具体实施例对本发明做进一步说明。
如图1所示,本发明提供了一种基于稀疏化方法的核最小均方时间序列在线预测方法,具体实施措施如下:
步骤1:从UCI数据库(https://archive.ics.uci.edu/ml/index.php)中获取时间序列预测问题的样本数据。该样本数据是2016年北京PM2.5混沌时间序列,该序列由2016年全年北京每小时的PM2.5、PM10、CO、NO2、O3、SO2、温度、气压、湿度、风速和风向共11个指标组成,总共包括8759个样本。此时系统的输入数据为8759个11维的输入向量,即x(n)=[x1(n);x2(n);...;x11(n)];预测目标y(n)=x1(n),即预测PM2.5值。
步骤2:运用归一化方法处理实验数据。
数据归一化处理是把所有数据都转化为[0,1]之间的数,其目的是消除各维数据间数量级差别,避免因为输入输出数据数量级差别较大而造成预测误差较大。采用归一化方法公式为:
Figure BDA0002417605560000051
其中,xi
Figure BDA0002417605560000052
分别代表样本数据归一化前后的值,xmax和xmin分别代表样本数据的最大值和最小值。
步骤3:划分训练集和测试集,并设置模型参数。
随机选取样本数据90%作为训练集,其余作为测试集。依据经验设置模型参数,包括模型学习率η,顺序异常值准则的用户定义系数λd和λv,量化阈值参数ε以及自适应调整参数
Figure BDA0002417605560000053
初始化模型参数,预测误差e(n)=y(1),权重向量α1=η·e(1),模型字典D(1)=x(1)。
步骤4:第n次迭代时,预期邻居距离和预期邻居方向向量的既定范围构成新到达数据的预期区域。如果当前相邻距离d<xn-1,xn>不在[NDe(n)-λdσd,NDe(n)+λdσd]区间内,同时当前相邻方向向量[x(n)-x(n-1)]/d<xn-1,xn>不在[NVe(n)-λvσv,NVe(n)+λvσv]区间内,则新到达的数据被标记为异常值。此时该数据将被剔除,开始迭代下一个训练集数据。
步骤5:当迭代次数为n时,当前的输入为{x(n),y(n)}。依据之前迭代所训练的临时预测模型计算预测目标
Figure BDA0002417605560000061
并得到预测误差e(n)。
所述的预测目标
Figure BDA0002417605560000062
其中,αn-1表示权重向量。κn-1表示核矩阵,对κn-1进行说明如下:κn-1=κ(D(n-1),x(n-1)),κ(xi,xj)=exp(-||xi-xj||/2σ2),这里采用高斯核,σ为核宽度;xi,xj表示任意的两个输入向量;D(n-1)表示第n次迭代时字典未更新前的状态,它包含被纳入字典的输入向量。
所述的预测误差
Figure BDA0002417605560000063
步骤6:运用量化方法减小模型字典大小并更新权值系数。
首先,计算x(n)与字典D(n-1)之间的距离:dis(x(n),D(n-1))=min1≤j≤n-1||x(n)-Dj(n-1)||,其中,j表示字典D(n-1)的第j个成员,||·||表示Euclidean范数。如果计算的距离dis(x(n),D(n-1))小于设置的量化参数ε,则不更新字典:D(n)=D(n-1)。输入数据将被量化到Dj(n-1),此时系数αn更新为αn=αj+η·e(n)。否则,将更新字典:D(n)=D(n-1)∪x(n),x(n)将成为现有字典中的新中心,此时系数αn=[αn;η·e(n)]。
步骤7:采用自适应调整方法更新权值系数。权值可以更新为:
Figure BDA0002417605560000064
其中,
Figure BDA0002417605560000065
是用户定义的参数,其目的是避免分母为零。
步骤8:利用训练好的模型对测试集数据进行测试,然后对预测值和测试集中的目标值进行反归一化计算。最后,计算预测值与测试集中的目标值之间的均方根误差(RMSE)和对称平均绝对百分比误差(SMAPE)。
Figure BDA0002417605560000066
Figure BDA0002417605560000067
其中,y(n)为目标值,
Figure BDA0002417605560000068
为预测值,n是时间步数,N为样本总数。
步骤9:调整模型用户设定参数,并执行步骤4-8,得到多个训练好的模型和对应的评价指标RMSE和SMAPE。选取RMSE和SMAPE最小的模型作为预测模型。
本次实验中选取的最佳模型参数为:学习率η=0.1,顺序异常值准则的用户定义系数λd=3,λv=5,量化阈值参数ε=1,自适应调整参数
Figure BDA0002417605560000069
高斯核宽度σ=3。
依据上述确定好的参数设置,进行10次实验各项指标取平均值,获得的实验结果为训练时间为16.6575秒,测试时间0.0439秒,RMSE为0.1182,SMAPE为0.3083。实验结果曲线如图2所示,图2(a)中实线代表原始数据曲线,虚线代表预测值曲线,预测曲线可以很好地遵循原始曲线。在图2(b)中,预测误差曲线的波动范围较小。因此,该模型在预测北京PM2.5值有良好的表现。
以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明保护范围内,对本发明做出各项修改或同等替换,但不脱离本发明技术方案的精神和范围,这种修改和通道内替换也应视为落在本发明的保护范围内。

Claims (1)

1.一种基于稀疏化方法的核最小均方时间序列在线预测模型,其特征在于,包括如下步骤:
步骤1:从实际数据中获取时间序列预测问题的样本数据,包括输入数据x(n)=[x1(n);x2(n);...x;m(n)]和预测目标y(n),其中xi(n)为第i个特征序列;
步骤2:运用归一化方法处理实验数据,采用归一化方法公式为:
Figure FDA0002417605550000011
其中,xi
Figure FDA0002417605550000012
分别代表样本数据归一化前后的值,xmax和xmin分别代表样本数据的最大值和最小值;
步骤3:划分训练集和测试集,并设置模型参数;
随机选取样本数据90%作为训练集,其余作为测试集;依据经验设置模型参数,包括模型学习率η,顺序异常值准则的用户定义系数λd和λv,量化阈值参数ε以及自适应调整参数
Figure FDA0002417605550000013
初始化模型参数,预测误差e(n)=y(1),权重向量α1=η·e(1),模型字典D(1)=x(1);
步骤4:训练集数据按顺序进入预测模型进行训练;利用顺序异常值准则,剔除实验数据中的异常数据;所述的顺序异常值准则是依据历史数据,为新到达的数据建立预期区域,如果新数据超出预期区域,则将其标记为离群值;所述的预期区域由预期邻居距离和预期邻居方向向量组成;
4.1)在给定现有数据的信息的情况下,根据预期邻居距离推断顺序邻居数据之间的预期距离;根据预期邻居距离判断数据是否是异常值,预期邻居距离定义为:
Figure FDA0002417605550000014
其中,NDe(n)表示第n次迭代时的预期邻居距离;d<xi,xi+1>=||x(i+1)-x(i)||为相邻距离;系数2i/(n-2)(n-1)用于将更高的权重分配给更接近新数据的相邻距离;
第n次迭代的预期邻居距离的上边界和下边界被定义为:
Figure FDA0002417605550000015
其中,B_Dupper(n)和B_Dlower(n)分别表示第n次迭代中预期邻居距离的上边界和下边界;λd表示用户定义的系数;σd(n)表示{d<xi,xi+1>,i=1,2,...,n-2}的标准差;
计算相邻距离d<xn-1,xn>;如果超出预期邻居距离的既定范围,则第n个数据将被怀疑为异常值;所述预期邻居距离的既定范围为[NDe(n)-λdσd,NDe(n)+λdσd];
4.2)在给定所有现有数据的信息的情况下,预期邻居方向向量描述在顺序邻居数据之间的预期方向向量,进而推断出数据可能朝向的方向;预期邻居方向向量定义为:
Figure FDA0002417605550000021
其中,NVe(n)表示第n次迭代时的预期邻居方向向量;采用系数2i/(n-2)(n-1)是为更接近新数据的方向矢量分配更高的权重;
在第n次迭代中预期的邻居方向矢量的上边界和下边界被定义为:
Figure FDA0002417605550000022
其中,B_Vupper(n)和B_Vlower(n)分别表示第n次迭代时预期邻居方向向量的上边界和下边界;λv表示用户定义的系数;σv(n)表示{[x(i+1)-x(i)]/d<xi,xi+1>,i=1,2,...,n-2}的标准差;
计算相邻方向向量[x(n)-x(n-1)]/d<xn-1,xn>,如果超出预期邻居方向向量的既定范围,则第n个数据将被怀疑为异常值;所述的预期邻居方向向量的既定范围为[NVe(n)-λvσv,NVe(n)+λvσv];
4.3)第n次迭代时,预期邻居距离和预期邻居方向向量的既定范围构成新到达数据的预期区域;如果当前相邻距离d<xn-1,xn>不在[NDe(n)-λdσd,NDe(n)+λdσd]区间内,同时当前相邻方向向量[x(n)-x(n-1)]/d<xn-1,xn>不在[NVe(n)-λvσv,NVe(n)+λvσv]区间内,则新到达的数据被标记为异常值;此时该数据将被剔除,开始迭代下一个训练集数据;
步骤5:当迭代次数为n时,当前的输入为{x(n),y(n)};依据之前迭代所训练的临时预测模型计算预测目标
Figure FDA0002417605550000023
并得到预测误差e(n);
所述的预测目标
Figure FDA0002417605550000024
其中,αn-1表示权重向量;κn-1表示核矩阵,对κn-1进行说明如下:κn-1=κ(D(n-1),x(n-1)),κ(xi,xj)=exp(-||xi-xj||/2σ2),这里采用高斯核,σ为核宽度;xi,xj表示任意的两个输入向量;D(n-1)表示第n次迭代时字典未更新前的状态,它包含被纳入字典的输入向量;
所述的预测误差
Figure FDA0002417605550000025
步骤6:运用量化方法减小模型字典大小并更新权值系数;首先,计算x(n)与字典D(n-1)之间的距离:dis(x(n),D(n-1))=min1≤j≤n-1||x(n)-Dj(n-1)||,其中,j表示字典D(n-1)的第j个成员,||·||表示Euclidean范数;如果计算的距离dis(x(n),D(n-1))小于设置的量化参数ε,则不更新字典:D(n)=D(n-1);输入数据将被量化到Dj(n-1),此时系数αn更新为αn=αj+η·e(n);否则,将更新字典:D(n)=D(n-1)∪x(n),x(n)将成为现有字典中的新中心,此时系数αn=[αn;η·e(n)];
步骤7:采用自适应调整方法更新权值系数;权值更新为:
Figure FDA0002417605550000031
其中,
Figure FDA0002417605550000032
是用户定义的参数,其目的是避免分母为零;
步骤8:利用训练好的模型对测试集数据进行测试,然后对预测值和测试集中的目标值进行反归一化计算;最后,计算预测值与测试集中目标值之间的均方根误差RMSE和对称平均绝对百分比误差SMAPE;
Figure FDA0002417605550000033
Figure FDA0002417605550000034
其中,y(n)为目标值,
Figure FDA0002417605550000035
为预测值,n是时间步数,N为样本总数;
步骤9:调整模型用户设定参数,并执行步骤4-8,得到多个训练好的模型和对应的评价指标RMSE和SMAPE;选取RMSE和SMAPE最小的模型作为预测模型。
CN202010195943.XA 2020-03-19 2020-03-19 一种基于稀疏化方法的核最小均方时间序列在线预测模型 Pending CN111369072A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010195943.XA CN111369072A (zh) 2020-03-19 2020-03-19 一种基于稀疏化方法的核最小均方时间序列在线预测模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010195943.XA CN111369072A (zh) 2020-03-19 2020-03-19 一种基于稀疏化方法的核最小均方时间序列在线预测模型

Publications (1)

Publication Number Publication Date
CN111369072A true CN111369072A (zh) 2020-07-03

Family

ID=71211879

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010195943.XA Pending CN111369072A (zh) 2020-03-19 2020-03-19 一种基于稀疏化方法的核最小均方时间序列在线预测模型

Country Status (1)

Country Link
CN (1) CN111369072A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283614A (zh) * 2021-04-29 2021-08-20 东北财经大学 基于OcE的PM2.5浓度预测方法
CN117931788A (zh) * 2024-03-21 2024-04-26 松立控股集团股份有限公司 一种多相机图像数据去重和时序校正的方法
CN117931788B (zh) * 2024-03-21 2024-05-28 松立控股集团股份有限公司 一种多相机图像数据去重和时序校正的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283614A (zh) * 2021-04-29 2021-08-20 东北财经大学 基于OcE的PM2.5浓度预测方法
CN113283614B (zh) * 2021-04-29 2023-09-12 东北财经大学 基于OcE的PM2.5浓度预测方法
CN117931788A (zh) * 2024-03-21 2024-04-26 松立控股集团股份有限公司 一种多相机图像数据去重和时序校正的方法
CN117931788B (zh) * 2024-03-21 2024-05-28 松立控股集团股份有限公司 一种多相机图像数据去重和时序校正的方法

Similar Documents

Publication Publication Date Title
CN110414788B (zh) 一种基于相似日和改进lstm的电能质量预测方法
CN112508243B (zh) 电力信息系统多故障预测网络模型的训练方法及装置
CN108445752B (zh) 一种自适应选择深度特征的随机权神经网络集成建模方法
CN110708318A (zh) 基于改进的径向基神经网络算法的网络异常流量预测方法
CN112884056A (zh) 基于优化的lstm神经网络的污水水质预测方法
CN110110434B (zh) 一种概率潮流深度神经网络计算的初始化方法
CN113689029A (zh) 基于麻雀搜索算法优化Elman神经网络的短期负荷预测方法
CN111784061B (zh) 一种电网工程造价预测模型的训练方法、装置和设备
CN111160620A (zh) 一种基于端到端记忆网络的短期风电功率预测方法
CN111931983A (zh) 一种降水量预测方法及系统
CN115115090A (zh) 一种基于改进lstm-cnn的风功率短期预测方法
CN115115113A (zh) 基于图注意力网络关系嵌入的设备故障预测方法及系统
CN115062528A (zh) 一种针对工业过程时序数据的预测方法
CN111369072A (zh) 一种基于稀疏化方法的核最小均方时间序列在线预测模型
CN114357870A (zh) 基于局部加权偏最小二乘的计量设备运行性能预测分析方法
CN113221442B (zh) 一种电厂设备健康评估模型的构建方法及装置
CN115659201A (zh) 物联网气体浓度检测方法及监控系统
CN115544890A (zh) 一种短期电力负荷预测方法及系统
CN114692507A (zh) 基于堆叠泊松自编码器网络的计数数据软测量建模方法
CN114298413A (zh) 一种水电机组振摆趋势预测方法
CN114638421A (zh) 一种发电机组备件需求的预测方法
CN107220483B (zh) 一种土体温度模式预测方法
Yin et al. Prediction model of dissolved oxygen in marine pasture based on hybrid gray wolf algorithm optimized support vector regression
CN110543724A (zh) 面向总体设计的卫星结构性能预测方法
CN111832818B (zh) 一种基于相关性分析的lstm网络发电多步预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200703