CN102622496A - 一种嵌入模糊集状态的自适应预报方法和系统 - Google Patents
一种嵌入模糊集状态的自适应预报方法和系统 Download PDFInfo
- Publication number
- CN102622496A CN102622496A CN2011100277364A CN201110027736A CN102622496A CN 102622496 A CN102622496 A CN 102622496A CN 2011100277364 A CN2011100277364 A CN 2011100277364A CN 201110027736 A CN201110027736 A CN 201110027736A CN 102622496 A CN102622496 A CN 102622496A
- Authority
- CN
- China
- Prior art keywords
- forecast
- trend term
- time series
- obfuscation
- trend
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种多步预报方法和多步预报系统。多步预报方法包括步骤:对于预测要素的趋势项进行自适应模糊化处理,计算趋势项的自适应隶属度向量;根据趋势项的自适应隶属度向量,结合过去观测值生成具有模糊化特征的学习样本,并构建时间序列预测模型;以及利用时间序列预测模型进行多步预报。本发明可以实现高准确率、低误差率的预报。
Description
技术领域
本发明涉及预测技术领域,尤其涉及针对大质量惯性系统(如大气系统、水文系统)预测要素的多步预报方法和系统。
背景技术
预测技术普遍应用于气象、水文、生态环境等各种领域的目标要素的预报,例如众所周知的天气预报是对温度等目标要素的长期或短期的预测。
现有的预测技术针对预报对象的尺度特征进行方法设计。以大气系统举例,它的运动无论在空间上还是在时间上分辨都具有多尺度特征,因而描述大气系统的预报模式,在模型设计上也具有尺度上的针对性。根据不同的预报对象的尺度特征,预报模式的性能上存在很大差异。以现有的天气预报举例,预报模式对1-5d(天)有相对较高的准确性,但是对首日早期时段(1-12h(小时))及5d(天)以上的中长期天预报的参考价值却十分有限。尽管空间分辨率上,模式网格和数据同化系统的分辨率可达很高精度,但是改进局部尺度预测的准确性仍是一个紧迫且受到持续关注的热点问题(参考下述文献1和2)。
大尺度动力预报模式(数值预报)给出的趋势项,对于局部小尺度预报的结果有很大影响,因为它直接反映了时间尺度较大、空间范围较大的大气运动,强迫(激励)较小尺度环境的调制作用。趋势项是具体决定了小尺度环境的干湿冷暖特征的前兆信息。因此,如何处理大尺度趋势项对于小尺度预报情景极为重要。所谓大尺度运动是指空间范围较大,时间过程较长的一些现象(例如持续1天或几天的物理过程);而小尺度通常可以看做空间局部性的一个点,是未来很短时间之内发生的变化(例如与当前最临近的1-12h之内)。典型的,降水过程的发展就是大尺度运动进行能量和物质交换的结果,它不仅在相对较大空间尺度内发生,并且在较长的时间尺度上演化。而精细化的天气预报需要找到这些大尺度的信息对局部单点区域影响的关系,从而对小尺度要素特征进行准确预报。
以短时预报,特别是临近预报为例,它关注时间在1-12h,空间在10km范围内进行的预测过程。目前主要采用的方法有动力模式、统计模型和二者混合的统计降尺度预报方法(参考下述文献2),综合了这些方法的针对北京2008奥运的高精度预报,首日每3h的地面温度预报的平均绝对误差(MAE)达1.8℃(参考下述文献1),说明针对局部尺度的预报是一个具有挑战性的难题。
为了进一步说明大尺度趋势项的决定性作用,一些技术采用单一的历史样本构成的统计模型,在未使用数值天气预报(NWP)趋势信息的前提下,仅在前1~2步取得了较好的准确率,但是预报误差在长程阶段显著增长。时间序列预测技术存在的多步误差增长是一种普遍现象(参考下述文献3),通过改变统计方法或者优化模型参数并不能从本质上改善多步预报的精度。因此,在多步长预测的不同阶段,统计模式如何从有限分辨率的数值天气预报(NWP)中有效地提取并利用大尺度趋势信息就自然成为一个重要的问题。
另外,除短时预报之外,在大尺度运动到小尺度过度性质的预报技术中,也存在有下述问题。由于大尺度特征的未来情况通常是通过数值模式给出,即由物理方程定量的计算出大气状态在未来可能的趋势,大尺度特征本身是预报值而不是实测值,所以在描述大尺度特征对小尺度的影响程度时,存在着参考信息(大尺度特征)的不确定性描述的问题。
对短时预报而言,模式网格的尺度越精细越能更好地分辨小尺度运动。然而受到计算和同化条件的限制,实际的业务预报模式分辨率较低,一些由网格嵌套及参数化过程引入的预报风险也不可避免,就是说模式自身的不确定性不可忽略;另一方面,在统计模型中,利用数值天气预报(NWP)趋势信息时,怎样去描述它对大气趋势状态预报可能产生的影响,是一个困难的问题,因为它对预报效果的影响表现出的不确定性。在利用模式结果作为预报因子的过程中,趋势项通常被直接数值化,然后视作为样本特征。这种方式,使统计模型忽略了度量数值天气预报(NWP)趋势项的不确定性,因而丢失了有关预测状态的重要的信息。
参考文献:
1.Guo,H.,et al.,Refined forecast techniques and related verificationduring 2007 Olympic drilling.Meteorological Monthly,2008.34(6):p.17~25.
2.Benestad,R.E.,I.Hanssen-Bauer,and D.Chen,Empirical-statisticaldownscaling.2008,New Jersey:World Scientific.
3.Fan,J.and Q.Yao,Nonliear time series:Nonparametric and parametricmethods.1ed.2003,New York:Springer.
发明内容
针对上述提及的短时预报以及大尺度运动到小尺度过度性质的预报技术中存在的各种问题,本发明提出一种利用趋势项的自适应模糊化方法的多步预报方法,其可有效的利用于气象、水文、生态环境等各种领域的预测技术中,例如温度预测、风速预测和电力负荷预测等技术。
根据本发明的一方面,提供一种多步预报方法,包括:对于预测要素的趋势项进行自适应模糊化处理,计算趋势项的自适应隶属度向量的步骤;根据趋势项的自适应隶属度向量,结合过去观测值生成具有模糊化特征的学习样本,并构建时间序列预测模型的步骤;以及利用时间序列预测模型进行多步预报的步骤。
其中,计算趋势项的自适应隶属度向量的方法可进一步包括:滚动时间窗口至目标时间的步骤;根据目标时间之前的趋势项的预测值,按照预报输出的时间间隔,分别构建分段函数的步骤;依据分段函数计算每个时间间隔的隶属度向量,并进行归一化处理,从而获得在当前时间窗口的趋势项的自适应隶属度向量的步骤;以及滚动时间窗口,并重复上述步骤的步骤。
其中,依照下述S型分段函数将数值天气预报趋势项转化为(μ00,μ06,μ12,μ18)4维向量所代表的所述隶属度向量:
其中,e为自然常数;logsig为S型函数,系数a,b决定对钟型的形状和位置,取a=5/3和b=5;b1,b2,b3,b4,b5为所述S型隶属度分段函数的系数;r为大尺度趋势项离散时间间隔;x表示整点的时间;u00,u06,u12,u18分别表示00h,06h,12h,18h的4个时间状态的模糊集。
其中,构建时间序列预测模型的步骤可进一步包括:根据过去的实际观测值构成学习样本,并通过训练学习样本确定预测模型的步骤;根据模糊化处理后的趋势向量,与所述学习样本共同构成具有模糊化特征的学习样本的步骤;以及对具有模糊化特征的学习样本进行归一化处理,利用交叉验证的方法优化预测模型参数,构成时间序列预测模型的步骤。
其中,可利用支撑向量机对预报公式和公式中的未知函数f(·)进行估计,构成本实施例的时间序列预测模型,其中,p代表使用历史观测的数量,称之为延迟参数,表示在t时刻连续对t+k时刻做出k步预报,Xt代表实际观测,t=1,2,3,...,T是来自实际观测的时长为T的时间序列,NWPt代表趋势项。
其中,所述自适应模糊化处理可采用线性或非线性隶属度函数模糊化方式,线性隶属度函数模糊化方式包括三角波隶属度函数模糊化方式,非线性隶属度函数模糊化方式包括正态分布型隶属度函数模糊化方式或S型对钟函数模糊化方式。
其中,可包括进一步模糊化处理基于时间序列周期特征的时间项的步骤。
其中,可进一步包括预处理步骤,所述预处理包括时间分辨率的匹配和调整预报的时间漂移。
其中,可从不同的数值天气预报模式中提取所述趋势项,并将趋势项进行集合平均,或者,在取得至少两个模式的趋势项之后,分别对趋势项进行模糊化编码处理,然后将模糊化趋势项向量合并为单一趋势项模糊化向量。
根据本发明的另一方面,提供.一种多步预报系统,包括:模糊化处理部,对于预测要素的趋势项进行自适应模糊化处理,计算趋势项的自适应隶属度向量;模型构建部,根据模糊化处理部计算的趋势项的自适应隶属度向量,结合过去观测值生成具有模糊化特征的学习样本,并构建时间序列预测模型;以及预报部,利用模型构建部构建的时间序列预测模型进行多步预报
本文提出的趋势项模糊化方法显著优于直接使用趋势项的方法,说明模糊化具有改善多步预报性能的作用。本质上,模糊逻辑编码产生了新的统计特征,更好地、动态地融合了大尺度趋势信息,有效地提高了统计模型处理不确定性信息时的推理能力。因此,本发明可以实现高准确率、低误差率的温度、风力等各类预报。
附图说明
图1显示了依照本发明的大气环境的多步预报方法的流程;
图2显示了模糊逻辑的隶属度函数以及隶属度函数将趋势项转化为一组趋势向量的过程;
图3显示了本发明的计算趋势项的自适应隶属度向量的方法;
图4显示了构建支撑向量机时间序列预报模型的具体过程;
图5显示了依照本发明的多步预报系统的配置结构图。
具体实施方式
本发明提供一种针对气象、水文、生态环境等各种领域的预测要素的大气环境多步预报方法和系统,可广泛利用于例如温度预测、降水预测、风速预测和电力负荷预测等领域的短时预报及慢变系统调制下的快变系统的特征预报技术。
依照本发明的针对大气环境的多步预报方法,针对例如温度、降水量、风力等预测要素,采用模糊化预测要素的趋势项的方式,实现高准确率低误差率的多步预报方法。图1显示了依照本发明的大气环境的多步预报方法的流程。主要包括:对于预测要素的趋势项进行自适应模糊化处理,计算趋势项的自适应隶属度向量的步骤(S101);根据趋势项的自适应隶属度向量,结合过去观测值生成具有模糊化特征的学习样本,并构建时间序列预测模型的步骤(S102);以及利用时间序列预测模型进行多步预报的步骤(S103)。
在本发明中,趋势项(trend term)定义为对大尺度过程轮廓的预测结果。也就是说,对大尺度过程预测的数值化结果进行时间上的离散采样后的结果。
(实施例1:大气系统预报模式)
由于趋势项对预报模式的预报精度的影响具有模糊性,简单地采用“没有影响”或“全有影响”的非此即彼的二值逻辑,对改善预报模式的效果非常有限。而采用模糊理论中的相关方法对大气系统预报模式中出现的趋势项这种不确定、不清晰、不完整的状态进行描述,就是比较自然的方法。由于大尺度趋势项的存在时间上离散的特征,它仅能够给出有限时间间隔的趋势概况,例如给出每6小时间隔的瞬时温度状况,因而它对小尺度特征的影响是随着时间进程表现出逐渐增强的趋势,由此可以在短时预报关注的时段内,对趋势项的影响分时段赋值,也就是在(1-6小时之内)的不同时段对其影响程度给予不同的权值,这在本质上是一种降低风险的有效策略。
在这里分段赋值采用一组分段函数描述。不失一般性,若以A(A1,A2,…,An)表示时间域各个分段元素的集合,时间过程以u(u1,u2,u3,…un)表示,那么,上述的分段赋值非常容易使用模糊理论中的隶属度函数映射过程来表示,记为μA(u),由如下表示式(1)代表。
式中A={A1,A2,…,An}是由有序的元素A1,A2,…,An组成的集合。隶属度值a的大小表示u隶属于A的程度,换句话说,它度量了对其状态不确定性认可的程度,因此μA(u)也就是对不确定性的评价函数。模糊理论的内容可以参见参考文献:Zadeh,L.A.,Fuzzy sets as a basis for a theory of possibility.Fuzzy Sets and Systems,1999.100:p.9-34)。
在本实施例中,采用由式(2a-2e)表示的对钟型隶属度函数μA(u),即由S型分段函数描述,如图2所示。应理解的是,隶属度函数还可以采用其他线性和非线性的形态,例如三角波隶属度函数等。
在图2所示的模糊逻辑的隶属度函数中,显示了4个S型隶属度函数,黑色直线表示模糊化过程。1维趋势预测过程被分段映射到4维模糊子集中。因为根据数值天气预报(NWP)预报的常规格式,预测值的输出间隔是6小时,所以模糊集分别定义u1=00h,u2=06h,u3=12h,u4=18h的4个时间状态。
下面将对本发明的趋势项的自适应模糊化方式进行具体介绍。
本实施例的多步预报方法通过模糊化的方法引入数值天气预报(NWP)趋势项。通过隶属度函数将趋势项转化为一组趋势向量,下面以S型函数举例。如公式(2a-2e)定义,具体转化过程由图1所清晰表示。
其中,由数值天气预报(NWP)对当日00h,06h,12h,18h,24h时刻的预报结果来确定系数b1~b5,并且对其进行归一化处理。系数r表示数值天气预报(NWP)输出的时间间隔(6h),对应的取值为r=6,x表示整点的时间。系数a,b为S型函数的参数,决定对钟型函数的形状和位置,取a=5/3和b=5。
<趋势项的自适应隶属度向量计算方法>
在本实施例中采用函数Y=fmt(NWP,D,H),fmt函数代表上述公式(2a-2e)所表示的分段函数。其中,输入为NWP:数值模式的预测值,输出间隔为r,D(日期)和H(小时)。
图3显示了本发明的计算趋势项的自适应隶属度向量的方法,包括:滚动时间窗口至目标时间的步骤(S301);根据目标时间之前的趋势项的预测值,按照预报输出的时间间隔,分别构建分段函数的步骤(S302);依据分段函数计算每个时间间隔的隶属度向量,并进行归一化处理,从而获得在当前时间窗口的趋势项的自适应隶属度向量的步骤(S303);以及滚动时间窗口,并重复上述步骤的步骤(S304)。
以GMT 00h为例,具体步骤如下:
(1)滚动时间窗口至GMT 00h;
(2)归一化D-1(日期)的数值天气预报(NWP)趋势项;
(3)代入归一化的趋势项预测值到上述方程2,构建分段函数2a-2e;
(4)对于H属于D,依据分段函数计算每个时间间隔的隶属度值;
(5)更新数值天气预报(NWP)趋势项。
从而获得Y=(μ00,μ06,μ12,μ18):趋势项模糊化编码。
举例来说,数值天气预报(NWP)预报日期D(20101115)当日的温度值在00h,06h,12h,18h,24h五个整点时刻趋势项分别为(12.2,16.4,23.0,20.8,10.0),则归一化系数(b1,b2,b3,b4,b5)=(12.2,16.4,23.0,20.8,10.0)./max(T),其中max(T)表示数值天气预报(NWP)趋势项在某个时段内的最大值,这里取整个学习样本时段,./表示每个元素分别除以max(T)。
在公式(2a-2e)中,x表示整点的时间,则在D日内,对于x属于[00h~23h],x值分别为0~23。例如为了确定20101115的16h的趋势项,设定r=6,x=16,max(T)为历史学习样本中最大值30.2,S型函数参数a=5/3和b=5。分别将上述参数带入公式(2a-2e)得(u00,u06,u12,u18)=(0,0,0.12,0.69),该向量称之为D日中16h的趋势项隶属度向量。
然后NWP预报日期滑动为D+1(20101116),预报当日的温度,重复上述过程。
为了直观描述模糊化处理的效果,图2对比了传统插值与模糊化处理趋势项的区别。趋势项经过传统插值处理,预测值在16h趋势值大小介于[b3,b4]之间,且是1维实数。与此相对,经过模糊化处理的趋势项转化为隶属度向量,是由(μ00,μ06,μ12,μ18)表示的4维向量。从图2可知,16h的趋势项特征属于早上(morning),中午(noon),午夜(midnight)和晚上(evening)预测的程度分别由方程μ00(16),μ06(16),μ12(16)和μ18(16)确定。图2所示的隶属度函数具有自适应特征,即随着时间窗口的滚动,数值天气预报(NWP)趋势项随之更新,隶属度函数以动态方式重新构建,因此隶属度值也随之更新。对趋势变化可能性的度量是由一组数值天气预报(NWP)预测值决定。根据本实施例的模糊化处理不仅动态地描述了趋势跃阶变化的可能性,同时还保留了预测对象日变化的周期性相位特征,为统计过程提供了更为丰富的信息。
<支撑向量机多步预测模型>
在趋势项的自适应模糊化处理之后,依照本实施例的多步预报方法进一步利用支撑向量机(SVM)算法模型来构建预报模型,从而进行温度预报。
支撑向量机算法是一种性能优异的统计预测方法,用于短时预测主要有两个优势。其一,支撑向量机(SVM)在学习样本数较少的情况下仍然具有良好的推理能力,而实际观测所得的样本数通常是有限的小样本数据;其二,支撑向量机(SVM)可调参数少,而且性能十分稳定,利于模型结构的确定。小样本的情况对短时预报强调时效性而言十分重要,使用较少样本意味着建模将节省大量的计算时间,避免了预测模型在大样本数据下优化耗时严重的问题。
本文采用最小二乘支撑向量机(Least Squares Support Vector Machine,LS-SVM)算法(参考文献:Suykens,J.A.K.,et al.,Weighted least squaressupport vector machines:robustness and sparse approximation.Neurocomputing,2002.48:p.85-105)。这种算法将标准的支撑向量机凸函数优化问题转化为Karush-Kuhn-Tucker条件下的一组线性方程组,大大提高了求解的速度。
图4显示了构建支撑向量机时间序列预报模型的具体过程。主要的步骤是确定黑箱模型的学习样本,即确定样本特征中的输入和输出组成,然后通过训练学习样本确定模型结构。具体步骤参照图4。
步骤S401:根据过去的实际观测值构成学习样本,并通过训练学习样本确定预测模型。
以Xt代表实际观测,即{Xt},t=1,2,...,T是来自地面温度时长为T的时间序列,假设基于过去p个观测值Xt,Xt-1,...,Xt-p来预报Xt,Xt+1,...,Xt+k,则向前K步预报可以记做:
公式(3)称为直接预测法,表示在t时刻连续对t+k时刻做出k步预报。这里对于未知函数f(·)的估计用支撑向量机(SVM)实现。p代表使用历史观测的数量,称之为延迟参数。为了确定时间序列的延迟步长p,常规做法需要分别依次设置1,2,3,...,n步观测数据的嵌入,通过评估模型在测试集上的预测性能筛选出合适的步长。在得到延迟步长p后,学习样本的输入特征为Xt,Xt-1,...,Xt-p,输出特征为然后LS-SVM算法通过训练学习样本确定预测模型。公式(3)中原始特征为不包含数值天气预报(NWP)趋势项的原始时间序列特征,学习样本仅包括历史观测数据。
步骤S402:利用根据图2所示获得的模糊化后的趋势向量,与步骤S401获得的学习样本共同构成具有模糊化特征的学习样本。
现在对公式(3)变形,加入数值天气预报(NWP)的趋势项,新的预报公式记做:
其中NWPt是模式预测值(趋势项),如果对其进行模糊化隶属度函数处理,则形成模糊化趋势向量[u00,u06,u12,u18],然后与p步延迟的历史样本特征Xt,Xt-1,...,Xt-p共同构成具有模糊化特征的学习样本。如果对NWPt不做模糊化处理,而是直接引入(通过方波化插值,或者线性插值、样条插值等方法),则形成的学习样本退化为不包含模糊特征的一般形式。
步骤S403:对具有模糊化特征的学习样本进行归一化处理,利用交叉验证的方法优化预测模型参数,构成时间序列预测模型。
学习样本经过归一化处理,即将数量值通过线性变化映射到[-1,1]之间,有利于数值求解的稳定。确定支撑向量机算法的参数,通常以交叉验证的方法进行,例如将学习样本划分为等规模的5份,用其中4份样本训练模型,用余下的1份样本验证模型的结果。这种样本抽样方法,可以形成一簇子模型,支撑向量机(SVM)最优参数通过综合多个子预测模型参数获得,从而最大程度上反应样本的整体特征。
最后,利用支撑向量机(SVM)对预报公式(3)和公式(4)中的未知函数f(·)进行估计,构成本实施例的时间序列预测模型,从而利用该时间序列预测模型,获得高准确率、低误差率的温度预报。
值得注意的是,提取趋势信息(趋势项)时,还可以使用多模式集合的结果。举例说明,趋势项从不同的数值天气预报(NWP)模式中提取(可以是相同尺度,也可以是不同尺度),然后将趋势项进行集合平均(即算术平均),从而进一步减少趋势项估计的不确定性。在变化例中,在取得多个模式(至少两个)的趋势项之后,分别对趋势项进行模糊化编码处理,然后将多个模糊化趋势项向量合并为单一趋势项模糊化向量,从而使学习样本体现对多个模式预测趋势的不确定性估计。
另外,本实施例使用S型隶属度函数,真值是非线性变化的。也可以利用一些其他线性函数,如三角波,其真值变化呈现出线性特征;或者其他非线性函数充当隶属度函数,例如正态分布型函数。
另外,最小二乘支撑向量机(LS-SVM)是支撑向量机(SVM)的一种求解算法,常见的还有序列最小优化(SMO)算法等。这里支撑向量机(SVM)作为一种映射函数,描述学习样本与预测值之间的关系。显然,本方法不局限于使用LS-SVM或者SMO等算法,也不局限于使用支撑向量机。换句话说,根据本发明的思想,用人工神经网络,多元回归等统计方法都可以代替这里所采用的支撑向量机。
(实施例1的修改例)
<预处理>
在温度短时预报的例子中,众所周知,数值天气预报(NWP)数值模式可以预测一个轮廓信息,即在00h,06h,12h,18h,24h给出每6h间隔的温度值。在本修改例中,可以进一步通过对趋势项的预处理插值,例如,使用常见的插值算法(线性插值、样条插值等),使其更加连续。
预处理可进一步对趋势项进行漂移校正处理。数值天气预报(NWP)预测结果通常存在相位的滞后或者超前的现象,比如说预报明天有雨可能后天才会下,但也可能今天就提前下了。预处理中漂移匹配就是处理模式相位偏差,其通过计算互信息(MI)值,将数值天气预报(NWP)预测结果和实际的情况相对,比较数值天气预报(NWP)存在的相位差,从而进行校正。常见的漂移校正方法有相关系数法、互信息法等。
应注意的是,预处理的具体方式与本方法的实际应用密切相关,针对不同应用实例,可根据实际需要选择采用或不采用预处理。另外,本方法也可同样应用于大尺度运动到小尺度过度性质的预报,在短期气候预测中,在大尺度数值模型给出未来1-3月的趋势的情况下,同样可以采用本方法对其趋势项模糊化,比如,预测的对象可以是以旬(10天)、月尺度的降水量要素。
整个模糊化处理,最终产生向量形式的样本特征,都将作为新增属性组成最终的学习样本,视作支撑向量机(SVM)输入。
<实验>
本实施例使用的模式资料由欧洲中尺度天气预报中心(ECMWF)的TL799L91全球模式生成(以下简称T799模式)。T799模式每日GMT 00h和12h各起报一次,积分预报240h,每隔6h输出,水平分辨率达0.25°×0.25°,网格距约为25km。本实施例使用00h起报的地面2m温度,时段为20090827~20091231。
地面温度的时间序列由深圳蔡屋围遥测站采集,它位于114.1032°E,22.5476°N,是中国国家基准气候站。原始序列经过仪器1h自动平均处理,信号采样相当于经过带通滤波器的平滑,已经对高频噪声有所抑制。选取与T799相同时段的温度序列。该时段资料完整,且经过后期质量控制。
T799模式资料与站点观测数据存在空间匹配的问题。于是,首先对趋势项进行预处理。取T799模式最邻近观测站点的网格点,以其空间平均值作为模式的趋势项。
其次,T799模式资料与站点观测数据也存在时间分辨率匹配的问题。与绝大多数NWP的输出间隔是6h相同,T799模式可以提供未来06h,12h,18h,24h,......,240h整点时刻的预测,相对于站点观测记录1h间隔而言,模式时间分辨率的尺度稀疏,需要经过加密处理才能相互匹配。常见的匹配方法有方波化、插值等。在本实施例中,上述时间项的模糊化方法能够自适应的实现时间分辨率的匹配。
最后调整T799模式预报的时间漂移。通过计算T799预测量和站点观测量之间的互信息(Mutual Information,MI),判断模式时间漂移量。计算方法可参见参考文献:Moddemeijer,R.,On estimation of entropy andmutual information of continuous distributions.Signal Processing,1989.16(3):p.233-248。在信息论中,互信息的定义是I(X:Y)=H(X)-H(X|Y),式右边后一项称为条件熵,其表示已知Y以后,对X仍存在的不确定度。因此互信息I(X;Y)是表示当收到Y以后所获得关于信源X的信息量。模式时间漂移量取值为互信息取得最大值的时刻。
对当日而言,T799提前1~9d的历史预报均可涵盖短时临近预报的范围。由于数值天气预报(NWP)同样存在预报误差随步长增加而显著增大的问题,使用提前一天(1d)预报这种时间上最为临近的结果。T799模式预报结果与观测值之间的互信息变化在30h的位置上互信息值最大,说明二者相互包含的信息量最多。因此,将T799提前1d预报并向后推移6h的输出作为当日的趋势参考。
在这里,通过严格的对比实验来验证具有模糊特征的支撑向量机的预报性能。这里的统计模型采用LS-SVM回归算法,通过它建立学习样本与预测值的映射关系。筛选样本中具有代表性的特征属性是非常关键的步骤。为了确定时间序列的延迟步长,分别设置1~24h,28h,32h,36h,40h,44h,48h步观测数据的嵌入,由上述公式(3)、(4)连续预测未来1-12h的整点温度。支撑向量机参数优化由交叉验证实现,核函数采用高斯核。样本前5/6个设置为训练集,最后1/6个为测试集。
具体设置4组实验的学习样本分别具有以下特征:
实验1.学习样本的特征组成仅包括历史观测数据。实验1是一种不包含数值天气预报趋势项和模糊化处理方法的标准时间序列预测,将它的预测结果作为基准线供对比。
实验2.学习样本的特征组成包括:(1)历史观测数据;(2)静态趋势项,它是由S型隶属度函数描述,取方程(2a-2e)的系数b1-b5为常数1。静态趋势项体现了日变化的周期性相位特征。但是,必须指出,静态编码不会包含趋势信息,这是很显然的,就是说样本没有描述趋势跃阶变化的可能性的特征。静态隶属度向量以24h周期循环出现,每个日变化的隶属度值不发生改变。
实验3.学习样本的特征组成包括:(1)历史观测数据;(2)数值天气预报趋势项。对数值天气预报趋势项分别进行2.3小节所述的空间分辨率匹配、线性插值方式的时间分辨率匹配,及数值天气预报预测结果的时间漂移匹配。实验3包含了趋势项,但是未经过模糊化处理,目的是分析引入趋势项的直接形式,对预测性能的改善程度。
实验4.学习样本的特征组成包括:(1)历史观测数据;(2)数值天气预报趋势项模糊编码,它是由公式2a-2e描述的自适应隶属度函数生成的4维趋势向量。对数值天气预报趋势项的处理进行空间匹配和漂移匹配。实验4包含了趋势项的模糊化处理。
对比实验的评价指标包括:平均绝对误差MAE,表示预测的精度;误差小于1℃的百分比,表示预测的准确率;误差大于2℃的百分比,表示预测的失误率。它们分别由公式5-7定义,其中表示支撑向量机预测结果,Xi表示地面温度观测的时间序列。
为了分析嵌入步长对预报误差的影响,实验分别将延迟嵌入步长的设置在1-24h为1h间隔,在24-48h为4h间隔。实验1在11~13步延迟的嵌入邻域内取得最小平均绝对误差MAE;相应地显示实验2在2~4步,实验3在5~7步,实验4在2~4步延迟嵌入邻域内取得最小MAE。这说明最优延迟步长与学习样本的特征组成有关,平均绝对误差MAE最优的邻域是一个变量,将延迟步长设定为一个固定常量是不合理的。因此将相应最优邻域内的平均值定为最终预测结果,这种处理方法可以减少由选择迟滞步长引入的不确定性。
为使对比实验的结果更加直观起见,表1对比了预测的平均精度。实验4的平均MAE最小,仅为0.84℃。实验2~4的MAE均优于实验1,精度提升在20%~40%之间。该结果有力地表明增加趋势项能够显著改善时间序列模型多步预报的精度。实验2与实验3的MAE相当,但是实验2在步长1~8优于实验3,而在步长9~12表现相反,说明趋势项在多步预报后期,即长程预测阶段作用明显。对比实验3与实验4,二者均嵌入了趋势项,区别仅在于前者是直接引入,而后者使用了模糊化处理,后者的预测精度提升了25%,说明模糊化对统计模型学习趋势不确定性有更大的效果。
表2对比了预测误差在1℃之内的准确率。实验1~4中,1步预报的准确率均达到97%以上,2步预报的准确率也达到82%以上。说明对于温度短时预报而言,支撑向量机(SVM)时间序列方法1~2步预报性能已经十分优异。值得注意的是,实验2在1步有准确率下降现象,同样实验3在1~2步的准确率也是下降的,实验4在1步的准确率也仅有微弱的提升。这表明对于1步预报而言,趋势项特征对提高1步预报准确率并无明显帮助。平均而言,实验4获得最高的准确率,达到70%,说明模糊化趋势项对改进1℃以内的准确率的效果最为显著。
表3对比了预测误差大于2℃的误差率。实验4的误差率最低,仅有10%。实验2比实验3误差率低,说明模糊化的作用要比直接引用趋势项的作用明显;实验2的1步预测的误差率上升,实验3的2~3步误差率上升,说明趋势项在预报初期增大了预测的误差率。
表14组平均实验的平均绝对误差MAE对比
表24组实验MAE小于1℃百分比
表34组实验MAE大于2℃百分比
整体而言,预测性能随着步长的增加而下降。无论是否嵌入趋势项、时间项,或者采取模糊化处理与否,多步预测的误差迅速增长。实验4的预测精度最高且下降速度最缓,小于1℃的准确率下降速度最缓,大于2℃的误差率上升速度最慢,说明模糊化趋势项对改进多步预报性能的效果最显著。
本实施例使用的时间序列算法是一种结构简单的统计降尺度方法,从对比实验的结果看,模糊化趋势项对多步预报性能的改进作用是显著的,其原因是趋势项采用了模糊化处理技术。自适应隶属度向量对实际趋势的不确定性(可能性)描述,采用了模糊集的处理方法,最大程度上保留它的有效信息。隶属度向量是一组新增的统计特征,本质上它直接扩展了学习样本的特征空间。也就是说,原本统计模型是通过单点趋势值来估计某一个事件发生的程度,现在本发明的统计模型使用了隶属度向量,它描述了实际天气过程的涨落趋势符合数值天气预报(NWP)的可能性。显然,使用了模糊化的趋势项信息后,样本的统计特征包含了对数值天气预报(NWP)不确定性的度量,体现出更丰富的可解释性。
其次,趋势项模糊化的直观作用是消除了数值天气预报(NWP)趋势信息的不完整性。由上述可知,数值天气预报(NWP)输出的时间分辨率,相对于短时预报尺度,是稀疏的或者不完整的。隶属度函数产生了连续的等间隔的趋势向量,实现了二者时间分辨率的匹配。这种匹配的过程包含了数值天气预报(NWP)前后多个阶段的预测信息,比直接插值或者方波化处理的方式更为精细。
时间序列记录的是大气系统的一组真实解,当样本不足时,预测模型对大气系统轨迹的概率描述会陷入偏差,仅仅从历史演变状况中难以捕捉长程的预测特征,需要适时地补充大尺度趋势信息。本发明利用了模糊理论中隶属度函数以实现减少数值天气预报(NWP)趋势项信息自身不确定性。基于支撑向量机SVM的时间序列预报模型是一种结构简单、相对低计算开销的统计预测方法,能够快速获得结果。
依照本发明提出的多步预报方法,由于采用自适应模糊化算法,能够有效提取数值模式趋势项变化信息。数值实验系统地验证了模糊化趋势项的作用:(1)整体上,无论在预报精度、准确率,还是控制误差增速方面,模糊化趋势项预测效果优于直接引用趋势项的方法。(2)趋势项具有阶段性的作用,它从整体上改善了多步长预测在长程阶段的准确率,模糊化产生的编码作为新增统计特征,更好地动态融合了大尺度趋势预测信息,反馈了短时天气系统内在的周期性规律。
值得注意的是,本方法使用的数值天气预报(NWP)趋势项来自T799全球模式,网格距在25km左右,类似预报信息还可以从美国环境预报中心(NCEP)等面向公众的全球模式业务预报中获取。
(实施例2实现多步预报方法的系统)
根据上述实施例中的大气环境的多步预报方法,本发明以进一步提供实现该多步预报方法的系统。
图5显示了依照本发明的多步预报系统的结构性示意图。
如图5所示,本发明的多步预报系统100包括模糊化处理部101,模型构建部102和预报部103。其中,模糊化处理部101对于预测要素的趋势项(例如,数值天气预报趋势项)进行例如图2所示自适应模糊化处理,计算趋势项的自适应隶属度向量,例如[u00,u06,u12,u18]。模型构建部102根据趋势项的自适应隶属度向量[u00,u06,u12,u18],结合过去观测值Xt,Xt-1,...,Xt-p,生成具有模糊化特征的学习样本,并构建时间序列预测模型(参见上述步骤403)。预报部103利用模型构建部102构建的时间序列预测模型进行多步预报。
其中,模糊化处理部101进一步包括时间窗口滚动单元111,分段构建单元112和计算单元113。时间窗口滚动单元111滚动时间窗口至目标时间,构建单元112根据目标时间之前的趋势项的预测值,按照预报输出的时间间隔,分别构建分段函数,如公式2所示。计算单元113根据构建单元112构建的分段函数,计算每个时间间隔的隶属度向量,并进行归一化处理,从而获得在当前时间窗口的趋势项的自适应隶属度向量。之后,时间窗口滚动单元111进一步滚动时间窗口至下一时间,分段构建单元112和计算单元113重新构建函数且计算趋势项的自适应隶属度向量。
模型构建部102进一步包括学习样本构建单元121,模糊化特征学习样本构建单元122和时间序列预测模型123。其中,学习样本构建单元121根据过去的实际观测值构成学习样本。模糊化特征学习样本构建单元122结合学习样本构建单元121所获得的学习样本以及模糊化处理部101获得的模糊化后的趋势向量,构建具有模糊化特征的学习样本。时间序列预测模型123对具有模糊化特征的学习样本进行归一化处理,并利用交叉验证的方法优化预测模型参数,从而构成时间序列预测模型。
最终,预报部103利用模型构建部102构建的时间序列预测模型进行多步预报。根据本发明的多步预报系统,模糊逻辑编码产生了新的统计特征,更好地、动态地融合了大尺度趋势信息,有效地提高了统计模型处理不确定性信息时的推理能力,从而可以获得高准确率、低误差率的预报(例如温度等)。
上面结合多步预报方法和系统对本发明进行了说明,应理解的是,本发明的范围不限于上述说明的特定实施方式,本领域的技术人员可以在不脱离本发明的精神或范围的情况下,对本发明进行多种改进和变化。因此,如果这些改进和变化落在所附权利要求及其等同范围内,则本发明涵盖这些改进和变化。
Claims (10)
1.一种多步预报方法,包括:对于预测要素的趋势项进行自适应模糊化处理,计算趋势项的自适应隶属度向量的步骤;根据趋势项的自适应隶属度向量,结合过去观测值生成具有模糊化特征的学习样本,并构建时间序列预测模型的步骤;以及利用时间序列预测模型进行多步预报的步骤。
2.根据权利要求所述1的多步预报方法,其中,
计算趋势项的自适应隶属度向量的方法进一步包括:滚动时间窗口至目标时间的步骤;根据目标时间之前的趋势项的预测值,按照预报输出的时间间隔,分别构建分段函数的步骤;依据分段函数计算每个时间间隔的隶属度向量,并进行归一化处理,从而获得在当前时间窗口的趋势项的自适应隶属度向量的步骤;以及滚动时间窗口,并重复上述步骤的步骤。
3.根据权利要求2所述的多步预报方法,其中,
依照下述S型分段函数将数值天气预报趋势项转化为(μ00,μ06,μ12,μ18)4维向量所代表的所述隶属度向量:
其中,e为自然常数;logsig为S型函数,系数a,b决定对钟型的形状和位置,取a=5/3和b=5;b1,b2,b3,b4,b5为所述S型隶属度分段函数的系数;r为大尺度趋势项离散时间间隔;x表示整点的时间;u00,u06,u12,u18分别表示00h,06h,12h,18h的4个时间状态的模糊集。
4.根据权利要求1所述的时间序列多步预报方法,其中,
构建时间序列预测模型的步骤进一步包括:根据过去的实际观测值构成学习样本,并通过训练学习样本确定预测模型的步骤;根据模糊化处理后的趋势向量,与所述学习样本共同构成具有模糊化特征的学习样本的步骤;以及对具有模糊化特征的学习样本进行归一化处理,利用交叉验证的方法优化预测模型参数,构成时间序列预测模型的步骤。
6.根据权利要求1所述的时间序列多步预报方法,其中,
所述自适应模糊化处理采用线性或非线性隶属度函数模糊化方式,线性隶属度函数模糊化方式包括三角波隶属度函数模糊化方式,非线性隶属度函数模糊化方式包括正态分布型隶属度函数模糊化方式或S型对钟函数模糊化方式。
7.根据权利要求1所述的时间序列多步预报方法,其中,包括进一步模糊化处理基于时间序列周期特征的时间项的步骤。
8.根据权利要求1所述的时间序列多步预报方法,其中,进一步包括预处理步骤,所述预处理包括时间分辨率的匹配和调整预报的时间漂移。
9.根据权利要求1所述的时间序列多步预报方法,其中,
从不同的数值天气预报模式中提取所述趋势项,并将趋势项进行集合平均,或者,在取得至少两个模式的趋势项之后,分别对趋势项进行模糊化编码处理,然后将模糊化趋势项向量合并为单一趋势项模糊化向量。
10.一种多步预报系统,包括:模糊化处理部,对于预测要素的趋势项进行自适应模糊化处理,计算趋势项的自适应隶属度向量;模型构建部,根据模糊化处理部计算的趋势项的自适应隶属度向量,结合过去观测值生成具有模糊化特征的学习样本,并构建时间序列预测模型;以及预报部,利用模型构建部构建的时间序列预测模型进行多步预报。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110027736.4A CN102622496B (zh) | 2011-01-26 | 2011-01-26 | 一种嵌入模糊集状态的自适应多步预报方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110027736.4A CN102622496B (zh) | 2011-01-26 | 2011-01-26 | 一种嵌入模糊集状态的自适应多步预报方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102622496A true CN102622496A (zh) | 2012-08-01 |
CN102622496B CN102622496B (zh) | 2016-07-06 |
Family
ID=46562412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110027736.4A Expired - Fee Related CN102622496B (zh) | 2011-01-26 | 2011-01-26 | 一种嵌入模糊集状态的自适应多步预报方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102622496B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105808948A (zh) * | 2016-03-08 | 2016-07-27 | 中国水利水电科学研究院 | 一种自动修正的多模式数值降雨集合预报方法 |
WO2016155372A1 (zh) * | 2015-03-27 | 2016-10-06 | 北京奇虎科技有限公司 | 预测空气质量指数的方法与装置 |
CN107167178A (zh) * | 2017-05-18 | 2017-09-15 | 重庆大学 | 车内环境检测方法及检测系统 |
CN108629195A (zh) * | 2017-03-21 | 2018-10-09 | 北京京东尚科信息技术有限公司 | 一种数据处理的方法、装置、电子设备和计算机存储介质 |
CN111126767A (zh) * | 2019-11-25 | 2020-05-08 | 山东师范大学 | 基于高斯模糊信息粒的水文时间序列预测方法及系统 |
CN112541634A (zh) * | 2020-12-16 | 2021-03-23 | 国网江苏省电力有限公司检修分公司 | 一种顶层油温预测、误报火警判别方法、装置和存储介质 |
CN112580845A (zh) * | 2019-09-30 | 2021-03-30 | 北京金风慧能技术有限公司 | 气象数据处理方法、装置、设备及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009082042A1 (en) * | 2007-12-21 | 2009-07-02 | Industry University Cooperation Foundation Of Kyungwon University | Nonlinear time series prediction method for weighted average defuzzification based on newfm |
CN101870076A (zh) * | 2010-07-02 | 2010-10-27 | 西南交通大学 | 一种基于性能退化模型的数控机床导轨副寿命预测方法 |
TW201039264A (en) * | 2009-04-24 | 2010-11-01 | Univ Nat Taiwan Science Tech | Forecasting TAIFEX based on particle swarm optimization |
-
2011
- 2011-01-26 CN CN201110027736.4A patent/CN102622496B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009082042A1 (en) * | 2007-12-21 | 2009-07-02 | Industry University Cooperation Foundation Of Kyungwon University | Nonlinear time series prediction method for weighted average defuzzification based on newfm |
TW201039264A (en) * | 2009-04-24 | 2010-11-01 | Univ Nat Taiwan Science Tech | Forecasting TAIFEX based on particle swarm optimization |
CN101870076A (zh) * | 2010-07-02 | 2010-10-27 | 西南交通大学 | 一种基于性能退化模型的数控机床导轨副寿命预测方法 |
Non-Patent Citations (1)
Title |
---|
宋明军: "基于模糊时间序列的时变动态系统模糊建模", 《现代防御技术》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016155372A1 (zh) * | 2015-03-27 | 2016-10-06 | 北京奇虎科技有限公司 | 预测空气质量指数的方法与装置 |
CN105808948A (zh) * | 2016-03-08 | 2016-07-27 | 中国水利水电科学研究院 | 一种自动修正的多模式数值降雨集合预报方法 |
CN108629195A (zh) * | 2017-03-21 | 2018-10-09 | 北京京东尚科信息技术有限公司 | 一种数据处理的方法、装置、电子设备和计算机存储介质 |
CN107167178A (zh) * | 2017-05-18 | 2017-09-15 | 重庆大学 | 车内环境检测方法及检测系统 |
CN107167178B (zh) * | 2017-05-18 | 2019-07-05 | 重庆大学 | 车内环境检测方法及检测系统 |
CN112580845A (zh) * | 2019-09-30 | 2021-03-30 | 北京金风慧能技术有限公司 | 气象数据处理方法、装置、设备及计算机可读存储介质 |
CN111126767A (zh) * | 2019-11-25 | 2020-05-08 | 山东师范大学 | 基于高斯模糊信息粒的水文时间序列预测方法及系统 |
CN112541634A (zh) * | 2020-12-16 | 2021-03-23 | 国网江苏省电力有限公司检修分公司 | 一种顶层油温预测、误报火警判别方法、装置和存储介质 |
CN112541634B (zh) * | 2020-12-16 | 2024-03-15 | 国网江苏省电力有限公司检修分公司 | 一种顶层油温预测、误报火警判别方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102622496B (zh) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Random forest solar power forecast based on classification optimization | |
Wu et al. | Probabilistic wind-power forecasting using weather ensemble models | |
Tang et al. | Solar power generation forecasting with a LASSO-based approach | |
Stathopoulos et al. | Wind power prediction based on numerical and statistical models | |
CN102622496A (zh) | 一种嵌入模糊集状态的自适应预报方法和系统 | |
Alessandrini et al. | A novel application of an analog ensemble for short-term wind power forecasting | |
CN105678404B (zh) | 基于网购电和动态关联因子的微电网负荷预测系统及方法 | |
Rocha et al. | Estimation of daily, weekly and monthly global solar radiation using ANNs and a long data set: a case study of Fortaleza, in Brazilian Northeast region | |
Zhang et al. | A new statistical precipitation downscaling method with Bayesian model averaging: a case study in China | |
CN103679263A (zh) | 基于粒子群支持向量机的雷电临近预测方法 | |
Gani et al. | A combined method to estimate wind speed distribution based on integrating the support vector machine with firefly algorithm | |
Kretzschmar et al. | Neural network classifiers for local wind prediction | |
CN103117546A (zh) | 一种超短期风电功率滑动预测方法 | |
CN102495937A (zh) | 一种基于时间序列的预测方法 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN104463358A (zh) | 一种耦合偏互信息和cfs集合预报的小水电发电能力预测方法 | |
Kumar et al. | Statistical models for long-range forecasting of southwest monsoon rainfall over India using step wise regression and neural network | |
CN116826710A (zh) | 基于负荷预测的削峰策略推荐方法、装置及存储介质 | |
Guo et al. | A new approach for interval forecasting of photovoltaic power based on generalized weather classification | |
Díaz et al. | Statistical post‐processing of ensemble forecasts of temperature in Santiago de Chile | |
CN117273200B (zh) | 一种基于卷积优化算法和Pyraformer神经网络的径流区间预报方法 | |
Liu et al. | Forecasting of wind velocity: An improved SVM algorithm combined with simulated annealing | |
Su et al. | An evaluation of two statistical downscaling models for downscaling monthly precipitation in the Heihe River basin of China | |
CN115456286A (zh) | 一种短期光伏功率预测方法 | |
KR20230072219A (ko) | 날씨 예측 데이터를 이용한 확률적 시나리오 기법의 최적 입찰량 결정 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160706 Termination date: 20200126 |