CN113961613A - 基于周期性过滤的线性预测方法 - Google Patents

基于周期性过滤的线性预测方法 Download PDF

Info

Publication number
CN113961613A
CN113961613A CN202110982762.6A CN202110982762A CN113961613A CN 113961613 A CN113961613 A CN 113961613A CN 202110982762 A CN202110982762 A CN 202110982762A CN 113961613 A CN113961613 A CN 113961613A
Authority
CN
China
Prior art keywords
data
linear prediction
periodic
prediction method
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110982762.6A
Other languages
English (en)
Inventor
汤蕾
顾力
张华�
聂鹏晨
万轶伦
黄鑫
马建楷
朱涛
邱名义
吴舒鋆
弥潇
陈淼
朱瑾
白朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Youyi Information Technology Co ltd
State Grid Shanghai Electric Power Co Ltd
Original Assignee
Shanghai Youyi Information Technology Co ltd
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Youyi Information Technology Co ltd, State Grid Shanghai Electric Power Co Ltd filed Critical Shanghai Youyi Information Technology Co ltd
Priority to CN202110982762.6A priority Critical patent/CN113961613A/zh
Publication of CN113961613A publication Critical patent/CN113961613A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/003Load forecast, e.g. methods or systems for forecasting future load demand
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于周期性过滤的线性预测方法,包括:根据业务场景从已构建的数据库中取出相应特征的历史时间序列数据;采用数据预处理算法对所述历史时间序列数据进行数据处理,得到处理后的数据;将所述处理后的数据进行分解,分解后采用时间序列STL分解算法去周期Sv,得到余项,即非周期数据Rv;将所述非周期数据Rv带入ARIMA模型进行训练预测;显示预测结果。该方法可以使得数据适应性强且不易丢失,并且预测效率高。

Description

基于周期性过滤的线性预测方法
技术领域
本发明涉及电力设备状态趋势预测领域,具体为一种基于周期性过滤的线性预测方法。
背景技术
在电力设备状态趋势预测领域,趋势预测就是基于设备相关指标的历史数据,通过对数据进行分析,带入预测模型进行训练,预测未来一段时间内的设备状态的发展趋势,根据预测结果,辅助用户提前对设备进行规划以及做出相应的决策。主要提供如下价值:提前知晓设备状态变化趋势,提高运维的效率,减少人力成本的支出,实现最优的投资回报比;从以前的故障后运维到现在的主动预判和提前预警,减少故障发生率以及因设备故障导致的损失;精细化、可视化效果展示,更加的准确直观。
现有技术的预测方法一般为:
1、统计类方法,例如,ARIMA就是一个在预测领域广泛应用的基于统计学思想的预测算法,快速高效,但是这个算法对数据的预处理有较高的要求,不能处理包含缺失值的和包含周期性的数据,极大的限制了该算法的应用。
2、时序分解,使用加法模型或乘法模型将原始序列拆分为4部分,分解出时间序列的趋势、周期和残差项;利用机器学习、深度学习方法,从特征工程入手,如LSTM、XG Boost、prophet等模型,这类方法对时间序列适应性强,但普遍存在可解释性差、运算时间长等弊端。
现有技术大多存在下列问题:
1、对于电力设备状态趋势预测场景,由于数据特性,导致数据模式差异较大,普遍存在周期等特性,而且由于一些不可抗力因素会存在较多的数据缺失,从而导致类似AIRIMA这些传统的统计学习类的方法不能得到很好的预测效果。
2、同时由于系统预测效率的要求,一些对数据适应性强的深度学习预测算法,在预测时间效率上又得不到满足。
因此,有必要提供一种电力设备的预测方法,使得数据适应性强不易丢失,并且预测效率高。
发明内容
本发明提供了一种基于周期性过滤的线性预测方法,使得数据适应性强且不易丢失,并且预测效率高。
为实现上述目的和其他相关目的,本发明提供了一种基于周期性过滤的线性预测方法,包括:
根据业务场景从已构建的数据库中取出相应特征的历史时间序列数据;
采用数据预处理算法对所述历史时间序列数据进行数据处理,得到处理后的数据;
将所述处理后的数据进行分解,分解后采用时间序列STL分解算法去周期Sv,得到余项,即非周期数据Rv
将所述非周期数据Rv带入ARIMA模型进行训练预测;
显示预测结果。
优选地,所述数据库包括需要预测的所有测点的历史时间序列数据。
优选地,所述采用数据预处理算法对所述历史时间序列数据进行数据处理,所述数据处理至少包括数据重采样、数据插值和异常值剔除。
优选地,所述重采样具体包括:
对所述历史时间序列数据通过指定频率的重采样技术,将其转化成数据频率稳定的目标序列,其中,若在一个数据采样周期内,有多个原始样本点,则取其均值作为采样最终的值,若没有原始样本点,则采用NAN值填充。
优选地,对所述历史时间序列数据进行重采样后,若数据中存在缺失值,则对缺失值进行所述数据插值,具体为:截取一段包含缺失数据的时间序列片段,用二次曲线进行拟合后,将数据缺失时间点v'带入所述二次曲线中, 得到插值点Y′v'
优选地,所述异常值剔除包括采用Hampel滤波器进行异常值的剔除。
优选地,所述时间序列STL分解算法包括内循环和外循环,所述内循环包括如下步骤:
步骤1、去趋势;
步骤2、周期子序列平滑;
步骤3、周期子序列的低通量过滤;
步骤4、去除平滑周期子序列的低通量,得到季节项;
步骤5、去周期;
步骤6、趋势平滑;
所述外循环包括:计算更新各样本点v的鲁棒权重值ρv,当所述内循环的步骤2与步骤6中进行LOESS回归时,将邻域权重乘以所述鲁棒权重值ρv。
优选地,所述ARIMA模型包括AR模型和MA模型,所述AR模型的 AR阶数通过偏自相关系数的函数截断点p来确定,所述MA模型的所述MA 阶数通过自相关系数的函数截断点q来确定。
综上所述,本发明通过对原始目标数据采用重采样、插值、异常值剔除等数据处理单元后,将处理后的数据带入STL时间序列分解算法,得到周期数据Sv和非周期余项数据Rv,并将Rv带入到ARIMA预测模型中去进行训练得到预测结果,辅助用户进行决策,能够降低运维成本和因故障带来的直接损失,同时也保留ARIMA模型的计算高效性优点,完美的解决了现有问题。
附图说明
图1为本发明一实施例提供的基于周期性过滤的线性预测技术的流程示意图;
图2本发明的一实施例提供的原始数据图和经过数据处理单后的数据示意图;
图3为本发明一实施例提供的STL分解算法后得倒的周期数据和非周期数据示意图;
图4为本发明一实施例提供的ARIMA预测效果对比示意图;
图5为本发明一实施例提供的ARIMA预测模型对于残差的预测示意图。
图6为本发明一实施例提供的ARIMA预测模型中ARIMA算法示意图。
具体实施方式
以下结合附图1-4和具体实施方式对本发明提出的基于周期性过滤的线性预测技术作进一步详细说明。根据下面说明,本发明的优点和特征将更清楚。需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施方式的目的。为了使本发明的目的、特征和优点能够更加明显易懂,请参阅附图。须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
参阅图1,本发明一实施例提供了一种基于周期性过滤的线性预测方法,包括如下步骤:
S100、根据业务场景从已构建的数据库中取出相应特征的历史时间序列数据;
所述业务场景如变电站主变负荷电流、油温以及油色谱数据发展趋势的预测,变电站开关柜局放状态预测等。以主变油温趋势预测为例,从数据库中取出相主变油温数据,并对其发展趋势进行预测从而监控主变的运行状态。
所述数据库包含非关系型数据库influxdb存储的历史数据,数据库包含需要预测的所有测点的历史时间序列数据,并将目标数据按照要求整理成时间序列数据并存储在数据库中。
S200、采用数据预处理算法对所述历史时间序列数据进行数据处理,所述数据处理至少包括重采样、缺失值填补和异常值剔除,得到处理后的数据;
在本实施例中,所述采用数据预处理算法对所述历史时间序列数据进行数据处理,具体包括数据重采样、数据插值和异常值剔除。所述重采样具体包括:
设定所述历史时间序列数据为Yv,则:
Yv=xc(vT)
通过指定频率的重采样技术,将所述原始样本序列为Yv转化成数据频率稳定的目标序列Y′v
Y′v=xc(vT′)
其中,T'表示所述指定频率,若在一个数据采样周期内,有多个原始样本点,则取其均值作为采样最终的值,若没有原始样本点,则采用NAN值填充。所述NAN值表示计算机科学中数值数据类型的一类值,表示未定义或不可表示的值。
此外,对所述历史时间序列数据进行重采样后,若数据中存在缺失值,则对缺失值进行所述数据差值,具体为:
截取一段包含缺失数据的时间序列片段,用二次曲线
Y′v=a1+a2v+a3v2
进行拟合后,将数据缺失时间点v'带入所述二次曲线中,得到插值点Y′v'
最后,采用Hampel滤波器进行异常值的剔除。
以下对Hampel滤波器进行解释说明:
Hampel滤波器是一种可以应用于时间序列的滤波器,用来识别离群值,并用更有代表性的值来替换它们。过滤器基本上是一个可配置宽度的滑动窗口,可以在时间序列中滑动。对于每个窗口,过滤器计算中值,并使用中值绝对偏差MAD来估计窗口的标准偏差σ,其中,
σ=1.4286*MAD
并且,对于窗口中的任何点,如果它距离窗口的中值超过3σ,那么Hampel滤波器将该点标识为异常值,并用窗口的中值替换它,替换公式为:
Figure BDA0003229752860000051
其中,mid(Yinterval)表示滑动窗口中的点的值得中值。
S300、将所述处理后的数据进行分解,分解后采用时间序列STL分解算法去周期Sv,得到余项,即非周期数据Rv
在本实施例中,所述STL算法如下:
所述STL算法分为内循环(inner loop)与外循环(outer loop),其中内循环主要做了趋势拟合与周期分量的计算。假定
Figure BDA0003229752860000052
为内循环中第 k-1次结束时的趋势分量和周期分量。
初始时
Figure BDA0003229752860000053
并有如下参数:
内层循环数n(i);
外层循环数n(o);
周期的样本数n(p)
下述步骤2中LOESS平滑参数n(s),
下述步骤3中LOESS平滑参数n(l),
下述步骤6中LOESS平滑参数n(t)。
每个周期相同位置的样本点组成一个子序列(sub-series),容易知道这样的子序列共有n(p)个,称之为cycle-sub-series。
内循环主要分为以下6个步骤:
步骤1、去趋势(Detrending),减去上一轮结果的趋势分量,即
Figure BDA0003229752860000069
步骤2、周期子序列平滑(Cycle-sub-series smoothing),用 LOESS(q=nn(s),d=1)对每个子序列做回归,并向前向后各延展一个周期;平滑结果组成temporary seasonalseries,记为
Figure BDA0003229752860000061
步骤3、周期子序列的低通量过滤(Low-Pass Filtering),对上一个步骤的结果序列
Figure BDA0003229752860000062
依次做长度为n(p)、3的滑动平均,然后做 LOESS(q=nn(l),d=1)回归,得到结果序列
Figure BDA0003229752860000063
相当于提取周期子序列的低通量;
步骤4、去除平滑周期子序列趋势(Detrending of Smoothed Cycle-sub-series),计算公式为:
Figure BDA0003229752860000064
步骤5、去周期(Deseasonalizing),减去周期分量
Figure BDA0003229752860000065
步骤6、趋势平滑(Trend Smoothing),对于去除周期之后的序列做 LOESS(q=nn(t),d=1)回归,得到趋势项
Figure BDA0003229752860000066
外层循环主要用于调节robustness weight,如果数据序列中有outlier,则余项会较大,定义:
h=6*median(Rv)
对于位置为v的数据点,其robustness weight为
ρv=B(Rv/h)
其中B函数为bi-square函数:
Figure BDA0003229752860000067
S400、将所述非周期数据Rv带入ARIMA模型进行训练预测;
在本实施例中,所述ARIMA模型包括AR模型和MA模型,所述AR模型的 AR阶数以及所述MA模型的MA阶数通过如下步骤进行确定:
所述AR阶数通过自相关系数函数来确定,所述自相关系数函数表示同一个变量Yt自身与其不同时滞的变化关系,具体为:
Figure BDA0003229752860000068
其中,k代表滞后项数,rk表明Yt与Yt-k的相关性;
所述MA阶数通过偏自相关系数函数来确定,所述偏自相关系数函数表示在计算变量Yt与Yt-k的相关性时会剔除yt-1,yt-2,…,yt-k+1对Yt与Yt-k的影响,即只计算与中间值无关的部分,具体为:
corr(Yt-f(t-1),(Yt-k-f(t-1))
f(t-1)=f(yt-1,...,yt-k+1)
分别通过所述自相关系数函数和所述偏自相关系数函数的函数截断点来确定所述AR阶数和所述MA阶数。
对于上述步骤,进一步说明如下:
首先,正如相关性系数表明两个变量之间的变化关系(正相关,负相关,不相关),自相关系数表明同一个变量自身与其不同时滞的变化关系,自相关系数截断点q用来确定MA阶数。
其次,为了那单纯测度Yt对Yt-k的影响,在计算变量Yt与Yt-k之间相关性时会剔除yt-1,yt-2,…,yt-k+1对Yt与Yt-k的影响,即只计算与中间值无关的部分,所以偏自相关函数截断点p用来确定AR阶数。
最后,ARIMA由AR模型和MA模型组成,可以将AR部分理解为对历史数据的记忆,MA部分理解为对历史残差的记忆。
yt=c+φ1yt-1+…+φpyt-p1εt-1+…+θqεt-qt
使用向后传递系数Byt=yt-1表示上述公式,一方面简化原模型,另一方面能更清楚的表示差分阶数,如图6所示。
同时,算法还提供预测的置信区间估计,一般情况下,对残差的预测通常有两种方法:
i):假设预测残差为∈t=NID(0,σ2),
置信区间为
Figure BDA0003229752860000071
向前1步预测为
Figure BDA0003229752860000072
多步预测为
Figure BDA0003229752860000073
那么c计算取决于置信区间:置信区间为95%:c=1.96;以ARIMA (0,0,q)举例,如下所示:
Figure BDA0003229752860000081
ii):使用boost-rap方法认为未来的残差与历史接近,即从历史残差数据集中随机采样,多步预测的置信区间为
Figure BDA0003229752860000082
S500、显示预测结果
该预测结果用于辅助用户决策。
以下对上述计算算法的原理进行介绍。
对于趋势预测相关算法,趋势预测根据场景的不同,采用的算法也不相同,对于一些比较平稳的指标数据,采用ARIMA算法可以完成预测,但对于类似低压套管温度等指标,其具有很强的周期性和趋势性,这样ARIMA 模型不能很好的去预测测点未来的趋势变化,这种情况下,一般采用 Holt-Winters、LSTM等算法进行预测,但在一些系统里,需要进行实时的计算和预测,那么类似Holt-Winters、LSTM这类算法在效率上得不到满足。本发明基于周期性过滤的线性预测技术,结合时间序列分解STL和ARIMA线性预测算法的一种高效的时间序列预测预测方法,对时间序列进行分解,去掉数据的周期性质,然后再用ARIMA算法进行训练和预测,最终加上去掉的周期性质,得到最终预测结果。
主要包括以下优势:
1、数据处理部分减去大部分噪音数据。
2、通过时间序列分解,加强了ARIMA线性预测算法对数据的适应性。
2、加强了时间序列预测效率和精度。
处理的优势效果如图2-5所示,参照图2,数据重采样、插值、异常值剔除前后对比,前小图为处理前数据可视化结果,后小图为经过数据预处理算子后的效果,明显看出,异常值已经被剔除,并且数据整体效果更加具有规律。参照图3,STL时间序列分解,很明显,数据的趋势Tv,周期Sv被提取出来,余项Rv更具平稳性。参照图4和图5,图5为原始电力数据时间序列,图4中虚线右边部分为经周期性过滤后的数据带入ARIMA模型后的预测结果,通过图5和图4虚线右边对比可见本发明的预测效果好。
本发明的优点在于通过对原始目标数据采用重采样、插值、异常值剔除等数据处理单元后,将处理后的数据带入STL时间序列分解算法,得到周期数据Sv和非周期余项数据Rv,并将Rv带入到ARIMA预测模型中去进行训练得到预测结果,辅助用户进行决策,能够降低运维成本和因故障带来的直接损失,同时也保留ARIMA模型的计算高效性优点,完美的解决了现有问题。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (8)

1.一种基于周期性过滤的线性预测方法,其特征在于,包括:
根据业务场景从已构建的数据库中取出相应特征的历史时间序列数据;
采用数据预处理算法对所述历史时间序列数据进行数据处理,得到处理后的数据;
将所述处理后的数据进行分解,分解后采用时间序列STL分解算法去周期Sv,得到余项,即非周期数据Rv
将所述非周期数据Rv带入ARIMA模型进行训练预测;
显示预测结果。
2.如权利要求1所述的周期性过滤的线性预测方法,其特征在于,所述数据库包括需要预测的所有测点的历史时间序列数据。
3.如权利要求1所述的周期性过滤的线性预测方法,其特征在于,所述采用数据预处理算法对所述历史时间序列数据进行数据处理,所述数据处理至少包括数据重采样、数据插值和异常值剔除。
4.如权利要求3所述的周期性过滤的线性预测方法,其特征在于,所述重采样具体包括:
对所述历史时间序列数据通过指定频率的重采样技术,将其转化成数据频率稳定的目标序列,其中,若在一个数据采样周期内,有多个原始样本点,则取其均值作为采样最终的值,若没有原始样本点,则采用NAN值填充。
5.如权利要求4所述的周期性过滤的线性预测方法,其特征在于,对所述历史时间序列数据进行重采样后,若数据中存在缺失值,则对缺失值进行所述数据插值,具体为:
截取一段包含缺失数据的时间序列片段,用二次曲线进行拟合后,将数据缺失时间点v'带入所述二次曲线中,得到插值点Y′v'
6.如权利要求5所述的周期性过滤的线性预测方法,其特征在于,所述异常值剔除包括采用Hampel滤波器进行异常值的剔除。
7.如权利要求1所述的周期性过滤的线性预测方法,其特征在于,所述时间序列STL分解算法包括内循环和外循环,所述内循环包括如下步骤:
步骤1、去趋势;
步骤2、周期子序列平滑;
步骤3、周期子序列的低通量过滤;
步骤4、去除平滑周期子序列的低通量,得到季节项;
步骤5、去周期;
步骤6、趋势平滑;
所述外循环包括:计算更新各样本点v的鲁棒权重值ρv,当所述内循环的步骤2与步骤6中进行LOESS回归时,将邻域权重乘以所述鲁棒权重值ρv。
8.如权利要求1所述的周期性过滤的线性预测方法,其特征在于,所述ARIMA模型包括AR模型和MA模型,所述AR模型的AR阶数通过偏自相关系数的函数截断点p来确定,所述MA模型的MA阶数通过自相关系数的函数截断点q来确定。
CN202110982762.6A 2021-08-25 2021-08-25 基于周期性过滤的线性预测方法 Pending CN113961613A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110982762.6A CN113961613A (zh) 2021-08-25 2021-08-25 基于周期性过滤的线性预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110982762.6A CN113961613A (zh) 2021-08-25 2021-08-25 基于周期性过滤的线性预测方法

Publications (1)

Publication Number Publication Date
CN113961613A true CN113961613A (zh) 2022-01-21

Family

ID=79460649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110982762.6A Pending CN113961613A (zh) 2021-08-25 2021-08-25 基于周期性过滤的线性预测方法

Country Status (1)

Country Link
CN (1) CN113961613A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114912077A (zh) * 2022-05-27 2022-08-16 中国海洋大学 一种融合随机搜索与混合分解误差订正的海浪预报算法
CN115495274A (zh) * 2022-11-15 2022-12-20 阿里云计算有限公司 基于时序数据的异常处理方法、网络设备和可读存储介质
CN118626995A (zh) * 2024-08-12 2024-09-10 长江三峡集团实业发展(北京)有限公司 一种不同量级洪水的挑选方法、装置及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180240202A1 (en) * 2015-08-19 2018-08-23 China Electric Power Research Institute Company Limited Method of predicting distribution network operation reliability
CN110334732A (zh) * 2019-05-20 2019-10-15 北京思路创新科技有限公司 一种基于机器学习的空气质量预报方法和装置
EP3623964A1 (en) * 2018-09-14 2020-03-18 Verint Americas Inc. Framework for the automated determination of classes and anomaly detection methods for time series
CN111310981A (zh) * 2020-01-20 2020-06-19 浙江工业大学 一种基于时间序列的水库水位趋势预测方法
CN111680397A (zh) * 2020-05-06 2020-09-18 北京航空航天大学 一种卫星季节波动遥测的自适应稳定性检测方法
CN112100711A (zh) * 2020-08-10 2020-12-18 南昌大学 一种基于arima和pso-elm的混凝土坝变形组合预报模型构建方法
CN112131212A (zh) * 2020-09-29 2020-12-25 合肥城市云数据中心股份有限公司 基于集成学习技术面向混合云场景的时序数据异常预测方法
CN112988840A (zh) * 2021-03-19 2021-06-18 北京京东振世信息技术有限公司 一种时间序列预测方法、装置、设备和存储介质
CN113298288A (zh) * 2021-04-12 2021-08-24 国网浙江省电力有限公司湖州供电公司 一种融合时间序列和神经网络的供电所运维成本预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180240202A1 (en) * 2015-08-19 2018-08-23 China Electric Power Research Institute Company Limited Method of predicting distribution network operation reliability
EP3623964A1 (en) * 2018-09-14 2020-03-18 Verint Americas Inc. Framework for the automated determination of classes and anomaly detection methods for time series
CN110334732A (zh) * 2019-05-20 2019-10-15 北京思路创新科技有限公司 一种基于机器学习的空气质量预报方法和装置
CN111310981A (zh) * 2020-01-20 2020-06-19 浙江工业大学 一种基于时间序列的水库水位趋势预测方法
CN111680397A (zh) * 2020-05-06 2020-09-18 北京航空航天大学 一种卫星季节波动遥测的自适应稳定性检测方法
CN112100711A (zh) * 2020-08-10 2020-12-18 南昌大学 一种基于arima和pso-elm的混凝土坝变形组合预报模型构建方法
CN112131212A (zh) * 2020-09-29 2020-12-25 合肥城市云数据中心股份有限公司 基于集成学习技术面向混合云场景的时序数据异常预测方法
CN112988840A (zh) * 2021-03-19 2021-06-18 北京京东振世信息技术有限公司 一种时间序列预测方法、装置、设备和存储介质
CN113298288A (zh) * 2021-04-12 2021-08-24 国网浙江省电力有限公司湖州供电公司 一种融合时间序列和神经网络的供电所运维成本预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114912077A (zh) * 2022-05-27 2022-08-16 中国海洋大学 一种融合随机搜索与混合分解误差订正的海浪预报算法
CN115495274A (zh) * 2022-11-15 2022-12-20 阿里云计算有限公司 基于时序数据的异常处理方法、网络设备和可读存储介质
CN115495274B (zh) * 2022-11-15 2023-03-07 阿里云计算有限公司 基于时序数据的异常处理方法、网络设备和可读存储介质
CN118626995A (zh) * 2024-08-12 2024-09-10 长江三峡集团实业发展(北京)有限公司 一种不同量级洪水的挑选方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN113961613A (zh) 基于周期性过滤的线性预测方法
CN112232447B (zh) 一种电力设备状态监测数据的完整样本集的构建方法
AU2012284498B2 (en) Monitoring method using kernel regression modeling with pattern sequences
CN107145645B (zh) 带不确定冲击的非平稳退化过程剩余寿命预测方法
CN111310981B (zh) 一种基于时间序列的水库水位趋势预测方法
US8660980B2 (en) Monitoring system using kernel regression modeling with pattern sequences
CN104166787B (zh) 一种基于多阶段信息融合的航空发动机剩余寿命预测方法
CN109376953B (zh) 一种中长期电量预测方法及系统
CN111444168A (zh) 一种配电室变压器日最大负荷异常数据检测处理方法
JP2014524095A (ja) 予測及び予知のための逐次的カーネル回帰モデリング方法
US20130024414A1 (en) System of Sequential Kernel Regression Modeling for Forecasting and Prognostics
CN116861201B (zh) 基于人工智能的电力供给系统
CN108435819B (zh) 一种铝型材挤压机能耗异常检测方法
KR20190013038A (ko) 다중 특징 추출기법을 이용한 다중 시계열 데이터 추세 예측 시스템 및 예측 방법
CN117271987A (zh) 一种配电设备环境状态数据智能采集处理方法
CN111639842B (zh) 一种设备健康评估方法、评估系统以及设备健康预测方法
CN117290685A (zh) 一种基于历史数据的电厂电力设备专家诊断系统及方法
CN117872900B (zh) 基于物联网技术的无纺布生产设备远程监控系统
CN112487361B (zh) 一种基于arima和小波变换的扇区短时交通流量预测方法
CN116629843B (zh) 智能化柴油发电机组的远程预警与维护决策支持系统
CN117236571A (zh) 一种基于物联网的规划方法和系统
CN113627685A (zh) 一种考虑风电上网负荷限制的风力发电机功率预测方法
CN116384843B (zh) 数字能源氮气站的能效评估模型训练方法及其监测方法
CN117129904A (zh) 一种基于数据分析的工业电源快速切换监测方法
CN112230628B (zh) 一种高噪音工业过程的数据识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination