CN110737975A

CN110737975A - 基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法

Info

Publication number: CN110737975A
Application number: CN201910950409.2A
Authority: CN
Inventors: 畅黎; 岳云鹏; 王赞; 王媛; 丁文超; 张琳; 邱超; 王斌; 刘纲; 杨雷
Original assignee: WEINAN POWER SUPPLY Co OF STATE GRID SHAANXI ELECTRIC POWER Co; State Grid Corp of China SGCC
Current assignee: WEINAN POWER SUPPLY Co OF STATE GRID SHAANXI ELECTRIC POWER Co; State Grid Corp of China SGCC
Priority date: 2019-10-08
Filing date: 2019-10-08
Publication date: 2020-01-31
Anticipated expiration: 2039-10-08
Also published as: CN110737975B

Abstract

本发明公开了一种基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，本发明从大型风电场的风速和输出功率的特点出发，将自回归(AR)模型与经验模态分解(EMD)相结合，建立EMD‑AR风速预测模型。同时建立了基于预测相对误差的异常检测和修正模型，并采用神经网络估计了相对误差的概率分布，获得了异常检测阈值，提高了预测模型的准确性。对于提高电力系统的可靠性、安全性，提升电力企业的经济效益具有重要的实用价值。

Description

基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法

技术领域

本发明属于电力系统领域，具体涉及一种基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法。

背景技术

受风电场所在区域的限制，以及受尾流效应的影响，不同机组的风速及输出功率不同。其次，风电输出功率具有明显的间歇性和波动性。特别是随着大型风电场的建立，风电功率的不确定性导致并网时对电网造成冲击，产生严重的后果。如果能事先预测风电功率的大小，则可根据风电功率的大小，合理安排火电出力的大小，具有重要的实用价值和意义。因此，风电场风速和输出功率的短期和超短期预测在电力系统监控、电力系统调度中具有非常重要的作用。

随着风电产业的飞速发展，目前大型风电场所占比重越来越大。通过对一个大型风电场的风速进行预测可以对该地区的风能分布以及风电场的并网给予一定的指导，同时也是实现风电功率预测的重要部分。针对大型风电场的风速和功率预测，常用预测方法是对单个机组进行风速和功率预测，然后获取整个区域的风速场分布与功率预测，这种预测方法存在预测效率低的缺点。由于风速具有一定的地域性，地理位置较近的区域风速具有一定的相似性，如果对整个区域的风速和功率进行快速预测，则具有更为重要的实用价值。大型风电场风速和风电功率的准确预测，不仅能监控整个风电场区域，还能有效制定整个区域的电力调度计划。这样既保证了电力系统的安全，还降低了系统的运营成本。

此外，风电功率异常检测与修正也是提高风功率预测准确性的重要途经。对异常风电功率数据进行有效的检测和修正，不仅可以提高并网的安全性，帮助调度部门制定更为合理的调度计划，更可以提升风电功率预测方法的可靠性。因此，寻求一种风电功率异常检测与修正方法，加入风功率预测模型，具有十分重要的价值。

发明内容

本发明的目的在于提供一种基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，以克服现有技术的缺陷，本发明从大型风电场的风速和输出功率的特点出发，将自回归(AR)模型与经验模态分解(EMD)相结合，建立EMD-AR风速预测模型。同时建立了基于预测相对误差的异常检测和修正模型，并采用神经网络估计了相对误差的概率分布，获得了异常检测阈值，提高了预测模型的准确性。对于提高电力系统的可靠性、安全性，提升电力企业的经济效益具有重要的实用价值。

为达到上述目的，本发明采用如下技术方案：

一种基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，具体如下：

(1)基于k-means聚类分析的区域风速预测

风速区域预测方法主要是为了克服单一机组风速预测方法存在的效率低的缺点。由于大型风电场的机组往往较多，且分布在较广区域，逐一对机组风速进行预测不仅需要消耗大量的时间，还需要收集每个机组的历史时刻的风速信息等，成本较高。而风速的区域预测方法基于不同机组风速序列的相似性，可以提高风速预测的效率。

由于大的区域内有的机组风速序列之间具有一定相似性，而有的机组之间没有这种相似性，因而不能直接根据一个机组的风速对其它机组进行外推，而必须对区域进行划分，将区域划分为若干个子区域，子区域内的机组由于位置较近或处于同一风口，因而其风速序列具有向相关性。机组风速序列是一个多维向量，无法采用传统的方法对其进行相似性的划分。k-means是一种典型聚类分析方法，根据样本之间的欧式距离的大小对样本进行类别的划分，具有计算速度快的优点。k-means聚类分析的思想如下：从样本中随机地选取K个对象作为类别的中心。然后，对剩下的样本根据其与K个类中心的欧氏距离进行类别判断，欧氏距离最小的那个类别就是该样本的类别。在下次迭代过程中，重新计算每一个类别的中心，再继续进行类别的判断，直至所有的类别没有变化时，说明算法已经收敛，类别划分完毕。类中心的选取一般可按照样本的平均值来计算。

k-means算法的计算流程如下：

1)设定类别个数K。

2)从M个样本x(i),i＝1,2,…,M中随机选取K个样本作为中心。

3)计算剩余样本分别与第k个类别中心的欧氏距离，即

d_i(k)＝|x(i)-O(k)|,i＝1,2,…,M-K (1)

式中，O(k)表示第k个类中心。

4)选取与样本中心欧氏距离最小的类别作为该样本新的类别标示；

5)重新计算各个类中心，类别中心为属于该类的所有样本的平均值，第k类的中心计算式为：

式中，W表示属于第k类的样本数。

6)返回步骤3)继续迭代，最后直至所有的类别划分或类心变化小于阈值，则算法结束。

在进行区域风速预测时，关键机组的选取非常重要。在子区域内，关键机组具有代表整个子区域的特点。在子区域内，关键机组的风速序列应该位于子区域的中心，最具有代表性，因此可以选取离类中心距离最近的风速序列所对应的机组作为关键机组。

假设子区域内的机组个数为M个，第m个机组的风速序列为{x_m(1),x_m(1),…,x_m(S)}，则子区域的类中心为：

式中，S为风速序列的长度。然后，计算每一个机组风速序列与类中心的欧氏距离，即：

选择使得上式取值最小的机组即为关键机组。

接下来，需要根据关键机组的风速对子区域内其它机组的风速进行估计。由于风速具有一定的偶然变化特性，不能根据关键机组的个别点的风速数据来估计其它机组的风速，而需要根据过去大量数据来估计。也就是说，根据过去时刻的风速值，用关键机组的风速表示非关键机组的风速。假设子区域内的总的机组个数为M，{x_c(1),x_c(2),…x_c(S)}表示关键机组的风速序列；假设关键机组与子区域内第w个机组的关系系数为a_w。则第w个机组的风速序列中第(s+1)个点为：

x_w(s+1)＝α_wx_c(s+1) (5)

接下来关键是确定关系系数，这里根据关键机组的历史风速寻找最优的系数，使得第w个机组的风速表示结果与真实结果之间的误差最小，即：

对每一非关键机组进行上述运算，即可得到每一个非关键的风速表示式。从而得到子区域内每一个机组的风速。图1是区域风速预测的流程。

(2)EMD-AR区域风速预测模型

EMD分解通过对序列进行不同尺度的分解，得到不同时间尺度上的平稳序列，找到序列在不同频率上的变化特性及变化规律。将EMD与AR模型相结合，分析不同时间尺度下风速数据序列的特性，从而减小不同频率上的干扰或混叠。并消除数据序列的随机性；然后建立每一个原态模型序列的AR模型，对每一个原态模型序列进行预测；最后得到风速预测结果。

假设{P(1),P(2),…,P(n),…P(N)}表示实际的风电功率序列，N表示总的样本数，也就是当前时刻的前N个时刻；C_i,i＝1,2,…X表示经过模态分解后得到的第i个模态，X为模态个数，则风电功率序列的模态序列为：

C_i＝{c_i(1),c_i(2),…,c_i(X)} (7)

对每一个模态C_i,i＝1,2,…,X进行AR模型的预测，则第n+1个样本的模态预测为：

式中，p表示预测模型的阶次，也就是N+1时刻的预测值等于前面p个时刻实测值的线性组合；j表示前面第j时刻；c_n-j表示第n-j个模态的实际值，α_j表示其权重参数；ε_n-j表示回归模型允许的误差。

分解后的第一功率模态表示功率序列中的噪声分量，因而该模态需要剔除，其它模态反映序列的不同尺度的变化规律。最终，原序列可表示X-1个模态与残差的和，即：

式中，r_M(N+1)表示EMD分解后的残差项，反映了功率序列的直流分量；

表示第N+1时刻的功率预测值。

图2是基于EMD-AR模型的风电功率预测流程。首先，对风电功率序列进行模态分解；然后对每个模态IMF进行AR模型预测，得到下一时刻的模态预测结果；最后，对除掉第一模态的其它模态和残差序列求和即为功率预测结果。

(3)风电功率数据异常检测

(a)异常检测模型

对于超短期风电功率来说，由于天气原因引起的风速变化不会引起输出功率的较大变化，属于正常的波动范围。而风机的故障、传感器的故障引起的异常往往具有一定的突发性，输出功率会有较大的变化，不属于正常的波动。

异常数据检测就是根据功率的预测结果与真实值之间的偏差的判断，其依据是假定预测模型的可靠性。由于风电功率的大小不一，预测结果与真实值之间的偏差一般不能采用绝对误差，通常采用相对误差判断。风电功率预测的相对误差定义为：

式中，P_e表示风电场额定装机容量；P(n)和

分别表示第n个样本的实测值和预测值；N表示总的样本数。

由于异常检测的前提是预测方法的可靠性。这就要求预测方法本身具有一定的可靠性。依据单一预测方法往往具有更大的风险。如果由多类方法分别得到预测相对误差，综合考虑更能保证异常检测的准确性和可靠性。分别采用结合EMD-AR模型和BP神经网络的风速-功率预测方法以及基于EMD-AR的时间序列法分别预测输出功率，然后分别计算预测的相对误差。由公式(10)的相对误差，分别设定两种方法的异常判断的阈值，如果相对误差e₁(n)和e₂(n)均大于各自的阈值，则为异常数据；否则为正常数据。假设两种方法的异常判断阈值分别为θ₁和θ₂，则满足：

e₁(n)>θ₁

e₂(n)>θ₂ (11)

则该点就是一个异常点。

异常检测完毕后，还需要对异常数据进行处理。以实际的预测值代替实测值(异常点)，在后续时间点的预测建模中，根据预测值进行建模，从而消除了异常数据的影响。

风电功率异常检测和处理的流程(见图3)如下：

1)初始化。

2)分别采用EMD-AR模型和BP神经网络预测风电功率。

3)计算每一个时间点的预测相对误差。

4)采用神经网络计算异常检测的阈值。

5)对异常数据进行检测和修正。

(b)预测误差概率分布估计

为了获取异常判断的阈值，根据公式(10)，需要知道功率预测相对误差的概率分布特性，根据概率分布特性，在一定的置信水平下，确定异常判断的阈值。传统概率分布模型无法准确描述预测绝对误差的概率分布，为此采用BP神经网络对相对误差的概率分布进行估计。首先，对于任意的随机变量y来说，其概率密度函数p(y)服从[0,1]的均匀分布，原因如下：

假设e(i),(i＝1,2,…,Y)表示得到的预测绝对误差序列，并且认为预测相对误差e本身是一个连续型随机变量，e(i)是随机变量e的样本。假设预测相对误差e的概率密度函数为p(e)，其概率分布函数为F(e)，满足：

根据公式(12)，如果以预测相对误差序列e(i),i＝1,2,…,N作为神经网络的输入，以[0,1]均匀分布的随机数作为神经网络的目标，则神经网络训练完成后，该神经网络实际上表示相对误差e的概率分布函数F(e)。

实际操作时，随机生成z(1)<z(2)<…<z(N)，服从[0,1]的均匀分布，作为神经网络的输入；对预测相对误差序列e(i),i＝1,2,…,N进行排序，使其满足e(1)<e(2)<…<e(N)，作为神经网络的输出，则神经网络表示相对误差e的概率分布的反函数F^-1(e)。在一定置信水平α下，将α作为神经网络的输入，即可求出其对应的阈值θ_α。

其中，z(1)<z(2)<…<z(N)采用神经网络估计预测误差的概率分布，由于预测误差的概率分布函数服从区间[0,1]的均匀分布，故而将随机生成的服从[0,1]的均匀分布的随机数z(i)作为神经网络的输入，相应的神经网络的输出是预测误差。为了估计预测误差的概率分布函数(也就是神经网络的传递函数)，需要对其输入和输出进行排序。

本发明可以实现风电场风速和功率的预测、异常检测和修正,与现有技术相比，主要有以下效果：

(1)针对大区域风速的多变性以及弱相关性，根据各机组风速数据之间的相关性，采用k-means聚类方法将区域分为若干个子区域；通过寻找关键机组，建立了非关键机组与关键机组之间的关系系数，实现了大型风电场的区域风速预测。

(2)根据预测的风速，以及温度、湿度、气压等因素，结合经验模态分解和自适应滑动平均模型，建立EMD-AR风电功率预测模型，实现区域风电功率预测；预测结果具有较高的可靠性和准确性。

(3)建立基于预测相对误差的异常检测和分析模型，给出了基于神经网络的相对误差的概率分布和异常检测的阈值估计方法，实现风电功率异常检测和修正。

附图说明

图1为区域风速预测流程图；

图2为EMD-AR模型功率预测流程图；

图3为风电功率异常检测和修正流程图；

图4为各子区域机组风速实测结果图；

图5为各子区域的风速预测相对误差图；

图6为晴天风电功率预测结果图；

图7为雨天风电功率预测结果图；

图8为两种预测方法的相对误差概率分布；

图9为离散异常检测及修正结果；

图10为连续异常检测及修正结果。

具体实施方式

下面对本发明作进一步详细描述：

本发明以陕西省某大型风电场为具体实施案例对方法正确性进行验证。

(1)区域风速预测

选取的风电场共包含3个区域，每个区域包含机组33台，这三个区域分布在较广的区域。采用前述区域划分法分别对3个区域进行子区域的划分。表1给出了第1个区域33台机组的区域划分结果。

表1子区域划分结果

根据公式(3)和(4)计算每个子区域的关键机组，计算结果如表2所示。

表2关键机组选取结果

图4是各子区域内部分机组风速的实测结果，可以看出，各子区域机组的风速曲线的轮廓比较相似，而不同子区域的风速轮廓差距较大，这说明了基于k-means的子区域划分结果是可靠的，也说明了子区域划分的必要性。

根据公式(5)和(6)可得到如表3所示的每一个机组与关键机组的关系系数。由此关系系数最终可得到每一个机组的预测风速。

表3子区域非关键机组的关系系数

图5是计算得到的各子区域的几组机组的风速预测相对误差e。

表4是经计算多个时刻各个机组的预测风速与实际风速预测误差比较，表中有的机组的预测误差较大，主要因为这些机组与关键机组间的相关性较小，导致预测误差较大。

表4各机组风速预测误差

表5统计了各个子区域每一个机组的直接预测结果和采用区域预测法的预测误差，求其平均值得到的预测误差MAPE值。可以看出，区域预测法的预测误差低于传统的直接外推法，预测性能有所提升。

表5子区域风速预测MAPE比较

(2)区域风电功率预测

该风电场2015年的总的出力数据，共99台机组，每台机组的额定功率为1.5MW。基于Matalb平台，采用EMD-AR模型对整个风电场的输出功率进行预测，并将预测结果与采用BP神经网络的预测结果相比较。下面如不做说明，涉及到的相关参数设置如表6所示。

表6相关参数设置

(a)晴天预测结果及分析

图6给出了晴天天气下风电场输出功率的实测值和预测值，图中黑色实线是实测值，三角符号表示BP神经网络预测值，方框表示EMD-AR模型预测值。其中，EMD-AR模型的时间序列以30为准。从图中可以发现，两种预测模型的结果与真实值的发展趋势一致，但EMD-AR模型的结果更接近真实值。

表7给出了其中二十个时刻的预测结果及预测误差比较。在有的时间点上，由于风速预测的误差，导致该点的功率误差较大，例如7:45、9:15、10:30处，BP神经网络预测误差较大。在7:45、10:15处，EMD-AR模型的预测误差较大，原因在于此时功率序列出现了较大幅度的变化，时间序列分析法往往对这种序列的突然变化很难准确预测。BP神经网络依赖于风速预测的准确性，EMD-AR模型对序列的突变点较难准确预测。

表7晴天风电功率预测误差

在进行多次实验后，分别统计两种方法的预测误差，得到如表8所示的各类预测误差及合格率结果。可以发现，基于EMD-AR模型的直接预测法的误差均小于BP神经网络的误差，整体合格率为100％。而BP神经网络的合格率为96.67％，整体预测效果不如EMD-AR模型。

表8晴天天气两种方法预测指标比较

(b)雨天预测结果及分析

选取雨天数据进行预测。图7给出了雨天天气下风电场输出功率的实测值和预测值，图中黑色实线是实测值，三角符号表示BP神经网络预测值，方框表示EMD-AR模型预测结果。

表9是两种方法的预测结果和绝对误差。可以发现，在21:30、21:45、00:30以及02:15时刻，BP神经网络预测误差较大。此外，在00:00、00:30、01:15以及02:15处，EMD-AR模型的预测误差较大。

表9雨天风电功率预测误差

表10给出了两种预测模型的预测误差及合格率的结果。可以发现，类似于晴天天气的结果，基于EMD-AR模型的直接预测法的误差均小于BP神经网络的误差，预测性能更优。

表10雨天天气两种方法预测指标比较

通过比较两组数据的预测结果，不管是什么天气状况，基于BP神经网络和基于EMD-AR的两种预测模型均能对风电场的输出功率进行有效预测，但总体上，EMD-AR模型预测性能更优。

(3)风电功率数据异常检测

(a)相对误差分布特性

分别采用结合EMD-AR模型和BP神经网络的风速-功率预测方法以及基于EMD-AR的时间序列法分别预测输出功率，计算其相对误差，然后估计相对误差的概率分布函数。单隐层神经网络对概率分布估计方法进行验证，隐层神经元的个数取20，激活函数为tansig函数，输出函数为logsig函数。

图8是两种预测方法得到的概率分布函数曲线。由于两种预测方法的预测相对误差不同，因而其概率分布函数有明显区别。在置信水平0.995下，相对误差为0.232，因此阈值θ ₁取值为23.2％。同理，在置信水平0.995下，计算得到的阈值θ ₂为17.6％。

(b)异常检测与修正

针对实际的风电功率序列进行异常检测与修正。实验中的原始序列没有异常数据，为正常序列，在其中添加异常数据，进行检测和处理。图9是异常检测和处理结果，黑色圆圈代表原始序列，上三角符号表示添加了异常数据的数据序列，方框表示异常检测和修正后的预测结果。图中，分别在n＝23和n＝34处添加了异常。可以看出，经异常检测处理后，检测到这两处异常，并进行了修正，修正后的序列与原始功率序列比较接近。

表11给出了序列的后20个样本的相对误差结果，可以看出，在n＝23和n＝34，相对误差均满足式(11)的异常检测标准，因而将其视为异常点。

表11离散异常的预测相对误差

添加连续异常数据，图10是连续异常检测和处理结果，在n＝15至17处添加了连续异常数据。经异常检测环节，检测到这3处连续异常，并进行了修正，修正后的序列与原始功率序列比较接近。

表12给出了序列6至20处的预测误差结果，可以看出，在n＝15、16和17处，相对误差均满足式(11)的异常检测标准。

表12连续异常的预测相对误差

离散和连续异常检测和修正的两个仿真实验结果表明，本发明中的异常检测和修正方法是有效的。将两种不同类型的预测模型相结合，当两种预测模型的预测相对误差均大于各自的阈值时，才认定为风电功率数据为异常数据，进一步保证了异常检测的可靠性。在实际分析中，如果预测的相对误差略大于或略小于异常检测的阈值，此时，可以认为是疑似异常点，在建立预测模型时，可以去掉该数据点。

Claims

1.基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，其特征在于，包括以下步骤：

步骤1、基于k-means聚类分析的区域风速预测

步骤1.1、采用k-means聚类分析将风电场的机组所在区域划分为若干子区域；

步骤1.2、选取子区域关键机组；

步骤1.3、计算关键机组与其它机组关系系数；

步骤1.4、由关键机组风速估计其他机组风速；

步骤2、基于EMD-AR模型风电功率预测；

步骤2.1、通过EMD模型对风电功率序列进行模态分解；

步骤2.2、对每个模态IMF进行AR模型预测，得到下一时刻的模态预测结果；

步骤2.3：对除掉第一模态的其它模态和残差序列求和即为功率预测结果；

步骤3、风电功率数据异常检测

步骤3.1、分别采用EMD-AR模型和BP神经网络预测风电功率；

步骤3.2、计算每一个时间点的预测相对误差；

步骤3.3、采用神经网络计算异常检测的阈值；

步骤3.4、对异常数据进行检测和修正。

2.根据权利要求1所述的基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，其特征在于，步骤1.2具体为：假设子区域内的机组个数为M个，第m个机组的风速序列为{x_m(1),x_m(1),…,x_m(S)}，则子区域的类中心为：

式中，S为风速序列的长度；然后，计算每一个机组风速序列与类中心的欧氏距离，即：

选择使得上式取值最小的机组即为关键机组。

3.根据权利要求1所述的基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，其特征在于，步骤1.3及步骤1.4具体为：假设子区域内的总的机组个数为M，{x_c(1),x_c(2),…x_c(S)}表示关键机组的风速序列；假设关键机组与子区域内第w个机组的关系系数为a_w，则第w个机组的风速序列中第(s+1)个点为：

x_w(s+1)＝α_wx_c(s+1)

根据关键机组的历史风速寻找最优的系数，使得第w个机组的风速表示结果与真实结果之间的误差最小，即：

对每一非关键机组进行上述运算，即得到每一个非关键的风速表示式，从而得到子区域内每一个机组的风速。

4.根据权利要求1所述的基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，其特征在于，步骤2.2及2.3具体为：假设{P(1),P(2),…,P(n),…P(N)}表示实际的风电功率时间序列，N表示总的样本数，也就是当前时刻的前N个时刻；C_i,i＝1,2,…X表示经过模态分解后得到的第i个模态，X为模态个数，则风电功率序列的模态序列为：

C_i＝{c_i(1),c_i(2),…,c_i(X)}

式中，p表示预测模型的阶次，也就是N+1时刻的预测值等于前面p个实测值的线性组合；j表示前面第j时刻；c_n-j表示第n-j个模态的实际值，α_j表示权重参数；ε_n-j表示回归模型允许的误差；

分解后的第一功率模态表示功率序列中的噪声分量，因而将该模态剔除，其它模态反映序列的不同尺度的变化规律，则功率预测结果表示X-1个模态与残差的和，即：

式中，r_X(N+1)表示EMD分解后的残差项，反映了功率序列的直流分量；

表示第N+1时刻的功率预测值。

5.根据权利要求1所述的基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，其特征在于，步骤3中风电功率预测的相对误差定义为：

式中，P_e表示风电场额定装机容量；P(n)和

分别表示第n个样本的实测值和预测值；N表示总的样本数；

分别采用结合EMD-AR模型和BP神经网络的风速-功率预测方法以及基于EMD-AR的时间序列法分别预测输出功率，然后分别计算预测的相对误差e₁(n)和e₂(n)，由上式的相对误差，分别设定两种方法的异常判断的阈值，如果相对误差e₁(n)和e₂(n)均大于各自的阈值，则为异常数据；否则为正常数据；假设两种方法的异常判断阈值分别为θ₁和θ₂，当满足：

e₁(n)>θ₁

e₂(n)>θ₂

则该点就是一个异常点。

6.根据权利要求5所述的基于经验模态分解与自回归模型的风电场风速、功率预测和异常修正方法，其特征在于，异常判断阈值的获取方法具体为：对于任意的随机变量y来说，其概率密度函数p(y)服从[0,1]的均匀分布，原因如下：

假设e(i),(i＝1,2,…,Y)表示得到的预测绝对误差序列，并且认为预测相对误差e本身是一个连续型随机变量，e(i)是随机变量e的样本，假设预测相对误差e的概率密度函数为p(e)，其概率分布函数为F(e)，满足：

如果以预测相对误差序列e(i),i＝1,2,…,N作为神经网络的输入，以[0,1]均匀分布的随机数作为神经网络的目标，则神经网络训练完成后，该神经网络实际上表示相对误差e的概率分布函数F(e)；

实际操作时，随机生成z(1)<z(2)<…<z(N)，服从[0,1]的均匀分布，作为神经网络的输入；对预测相对误差序列e(i),i＝1,2,…,N进行排序，使其满足e(1)<e(2)<…<e(N)，作为神经网络的输出，则神经网络表示相对误差e的概率分布的反函数F^-1(e)，在一定置信水平α下，将α作为神经网络的输入，即求出其对应的阈值；

其中，z(1)<z(2)<…<z(N)采用神经网络估计预测误差的概率分布，由于预测误差的概率分布函数服从区间[0,1]的均匀分布，故而将随机生成的服从[0,1]的均匀分布的随机数z(i)作为神经网络的输入，相应的神经网络的输出是预测误差，为了估计预测误差的概率分布函数，即神经网络的传递函数，对其输入和输出进行排序。