CN102831489B

CN102831489B - 电力配网建设物资需求预测方法及装置

Info

Publication number: CN102831489B
Application number: CN201210313675.2A
Authority: CN
Inventors: 杨晶晶; 李隽�; 齐志刚; 金波; 杨骏伟; 廖红; 杨灿魁
Original assignee: Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd
Priority date: 2012-08-29
Filing date: 2012-08-29
Publication date: 2016-03-09
Anticipated expiration: 2032-08-29
Also published as: CN102831489A

Abstract

一种电力配网建设物资需求预测方法，包括步骤：获取历史项目预设属性的参数和各种历史项目物资使用量，将所述各种历史项目物资使用量标准化到预设范围内；根据所述历史项目预设属性的参数、标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；获取待测项目预设属性的参数，根据所述隐含节点权重参数矩阵和所述待测项目预设属性的参数，采用所述预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量。根据方法提供了相应的装置。本方案实现对多种物资用量同时预测，模型简单，兼顾关联性。

Description

电力配网建设物资需求预测方法及装置

技术领域

本发明涉及预测方法，特别是涉及电力配网建设物资需求预测方法及装置。

背景技术

物资管理作为现代企业的第三个利润源泉，日益成为企业战略的重要组成部分，成为提高企业经营效益、增强核心竞争力的重要力量。而对于物资密集型的企业(如电力企业)，物资管理的重要与迫切性便更为突出。物资需求预测是根据历史的物资使用数据，利用数据挖掘方法，发现物资使用内在规律，指导企业在未来的物资投入与使用(如采购、物流、存储、领用等)，减少人力、物力、财力的浪费，提高企业效益的重要方法，是物资管理的重要内容之一。

电力配网生产物资需求量大，且种类繁多。根据配网物资管理要求，每年开展物资需求预测工作，传统做法是由下至上的工作模式：下层机构调研、统计、估算、上报，上层机构审批、汇总、生成总体需求。从组织到收集，从审核到汇总，耗费大量人力物力，层层上报，审核工作量大，生成需求时间周期长，无法对多种物资同时进行预测，对配网生产的物资购置，设备存储，物资领用等各生产环节产生不利影响，制约电力配网生产项目的高效高质建设。

对此，为了提高物资需求申报的速度、节省人力物力、实现对多种物资同时预测，保证配网生产物资使用及时得当，保证供应商按时按量供货，保证配网建设顺利进行，迫切需要一种针对多种电力配网物资需求的预测的方法。

随着机器学习方法不断发展，目前多种预测方法(如BP神经网络，SVM，各类回归模型等)都应用于大量的不同预测场景，但对于电力配网建设物资需求预测还是鲜见的。配网生产物资需求量大，且种类繁多，而且不同物资之间的使用并不是完全独立的关系，所以运用通常的回归方法(如logistic回归，多元线性回归等)无法实现多种物资同时预测，忽略了多种物资使用之间的关联性，从而无法满足电力配网物资的需求预测工作。而BP神经网络或支持向量机(SVM)等模型其模型复杂度高，训练时间长，需要人工设置的参数多而杂，不利于电力配网物资需求预测的模型的固化与扩展。

发明内容

基于此，有必要针对实现多种物资同时预测的问题，提供一种电力配网建设物资需求预测方法及装置。

一种电力配网建设物资需求预测方法，包括步骤：

获取历史项目预设属性的参数和各种历史项目物资使用量，将所述各种历史项目物资使用量标准化到预设范围内；

根据所述历史项目预设属性的参数、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

获取待测项目预设属性的参数，根据所述隐含节点权重参数矩阵和所述待测项目预设属性的参数，采用所述预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量。

上述电力配网建设物资需求预测方法，采用极限学习机构建预测模型，实现对多种物资用量同时预测，模型简单，训练快速，兼顾物资之间的关联性。

一种电力配网建设物资需求预测装置，包括：

预处理模块，用于获取历史项目预设属性的参数和各种历史项目物资使用量，将所述各种历史项目物资使用量标准化到预设范围内；

建模模块，用于根据所述历史项目预设属性的参数、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

预测模块，获取待测项目预设属性的参数，根据所述隐含节点权重参数矩阵和所述待测项目预设属性的参数，采用所述预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量。

上述电力配网建设物资需求预测方法，建模模块采用极限学习机构建预测模型，实现对多种物资用量同时预测，模型简单，训练快速，兼顾物资之间的关联性。

附图说明

图1为本发明电力配网建设物资需求预测方法实施例一的流程示意图；

图2为本发明电力配网建设物资需求预测方法实施例二的流程示意图；

图3为本发明电力配网建设物资需求预测方法实施例三的流程示意图；

图4为本发明电力配网建设物资需求预测装置的结构示意图。

具体实施方式

以下针对本发明电力配网建设物资需求预测方法及装置的各实施例进行详细描述。

首先针对电力配网建设物资需求预测方法进行描述。

实施例一

参见图1，是本发明电力配网建设物资需求预测方法实施例一的流程示意图，包括步骤：

步骤S101：获取历史项目预设属性的参数和各种历史项目物资使用量，将各种历史项目物资使用量标准化到预设范围内；

步骤S102：根据历史项目预设属性的参数、标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据预测模型确定隐含节点权重参数矩阵；

步骤S103：获取待测项目预设属性的参数，根据隐含节点权重参数矩阵和待测项目预设属性的参数，采用预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

首先获取历史项目预设属性的内容和历史项目物资使用量，预设属性可以为地市局信息、电压等级、预计完成期限、概算金额等。预设属性可以为其中的一个或多个。

为了方便计算，对历史物资同种使用量进行单位的统一。把历史项目物资使用量进行标准化处理。所谓标准化处理，是指将每项历史项目物资使用量缩小或放大到预设范围。其中，预设范围可以为[0,1]。进一步地，可以按照物资目录对历史物资进行分类和物资用量的汇总。物资目录可以为一级物资目录、二级物资目录等，具体根据需要设定。例如按照电网一级物资目录，对历史物资进行分类和物资用量的汇总。因为细类的物资种类太多，多于6000多种，直接预测准确率不高且实际的意义可能不大。故本发明将细类物资按统一的一级物资目录进行汇总，汇总后物资种类大大缩小，比如有60种。这样更宏观地进行预测，可以更准确地得到大类物资的用量。

本发明使用的单隐层前馈神经网络(singlehiddenlayerfeedforwardnetworks，SLFNs)为极限学习机(ExtremeLearningMachines，简称ELM)，来构建配网项目物资需求预测模型。

ELM模型在学习阶段主要学习两种参数，一种是激励函数G的内部参数a_i,b_i(i＝1,2,...,L)，第二种是隐含层节点数L。当a_i,b_i(i＝1,2,...,L)通过一个均值为0方差为1的简单高斯分布随机取得时，ELM可以以接近0误差地拟合训练数据，所以，在学习阶段，a_i,b_i(i＝1,2,...,L)参数可随机获取。隐藏层节点数的学习方面，模型在验证集上的加权准确率随着隐含层节点数的增加不断增加，但当隐含层节点数到达400点后加权准确率的增加并不显著，且模型训练时间随着隐藏层节点数的增加呈指数级的增加，主要因为求矩阵逆/伪逆的运算时间受隐藏层节点数的影响是指数级的。因此本发明在训练ELM时预设隐含节点数设为400，但随着日后的训练数据的增加，会适当增加隐藏节点数。当然，也可以根据需要设为其他值。

给定一个包含N个项目样本的M维目标预测物资的训练数据集其中M为物资种类，x_i＝[x_i1,x_i2,…x_in]^T∈Rⁿ为项目样本i的预设属性，t_i＝[t_i1,t_i2,…t_iM]^T∈R^M，并且0≤t_ij≤1,j＝1,...,M对应于该项目样本在M维物资的使用量，可以为数量、重量或金额等。当模型中使用量是用的数量时，预测时只能预测数量，当模型中使用量是用的金额时，预测时只能预测金额。可以同时对多种目标进行预测，比如同时对重量和金额进行预测，则在训练时对重量和金额进行训练，预测时就能输出重量和金额。基于L个隐含节点数和L个隐含节点对应的激励函数的ELM可以利用项目的项目特征属以零误差地逼近项目物资使用量：

Σ_{j = 1}^{L} β_{j} g_{j} (a_{j}, b_{j}, x_{i}) = t_{i}, i = 1, ..., N - - - (1)

在ELM中，g_j(a_j,b_j,x_i)一般定义为RBF函数或者加性函数，本发明优选加性函数，如下：

g^Additive _j(a_j,b_j,x_i)＝G(a_j·x_i+b_j),a_j∈R,b_j∈R

相应地，公式(1)可以转写为矩阵的形式：

Hβ＝T

其中，

H (a_{1}, ... a_{L}, b_{1}, ... b_{L}, x_{1}, ... x_{N}) = {[\begin{matrix} g (a_{1}, b_{1}, x_{1}) & ... & g (a_{L}, b_{L}, x_{1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{N}) & ... & g (a_{L}, b_{L}, x_{N}) \end{matrix}]}_{N \times L},

β = {[\begin{matrix} β_{1}^{T} \\ . \\ . \\ . \\ β_{L}^{T} \end{matrix}]}_{L \times M}, T = {[\begin{matrix} t_{1}^{T} \\ . \\ . \\ . \\ t_{L}^{T} \end{matrix}]}_{N \times M}

矩阵H表示隐含节点输出矩阵，矩阵β表示隐含节点权重参数矩阵，T表示项目物资使用量矩阵，L表示隐含节点数，a_i,b_i(i＝1,2,…,L)通过一个均值为0方差为1的简单高斯分布随机取得。

当隐含节点数L等于训练样本数目N时，β可以通过隐含节点输出矩阵H的逆获得训练误差为0的解。当隐含节点数L小于训练样本数目N时，β可以通过奇异值分解等方法利用隐含节点输出矩阵H的伪逆计算，达到最小化||Hβ-T||的目的。从而，可以确定隐含节点权重参数矩阵β。

获取待测项目预设属性的内容，采用待测项目预设属性的内容x_i和历史训练中随机生成的a_i,b_i(i＝1,...,L)作为输入，根据历史训练中确定的隐含节点权重参数矩阵β，可求得待测物资预测值。按照标准化缩小或放大的比例对预测值进行放大或缩小，确定待测项目物资使用量。

进一步，可以判断预测值是否为负值，如果否，按标准化对应比例还原预测值，确定对应待测项目物资使用量，若是，则获取待测项目的历史项目物资使用量，确定待测项目的历史项目物资使用量的平均值，根据平均值与服从N(0,1)的正态分布乘积的绝对值，确定预测值，按标准化对应比例还原预测值，确定待测项目物资使用量。按照标准化还原是指按照原来缩小或放大比例对该项目物资使用量进行放大或缩小，使其按比例还原预测值真实大小。

实施例二

参见图2，是本发明电力配网建设物资需求预测方法实施例二的流程示意图，包括步骤：

步骤S201：获取历史项目预设属性的参数和各种历史项目物资使用量，将所述各种历史项目物资使用量标准化到预设范围内；

步骤S202：根据所述历史项目预设属性的参数、标准化的各种历史项目物资使用量和预设隐含节点数，采用增量极限学习机构建预测模型，根据预测模型确定隐含节点权重参数矩阵；

步骤S203：获取待测项目预设属性的参数，根据隐含节点权重参数矩阵和待测项目预设属性的参数，采用预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

当训练数据庞大的时候，ELM算法的训练速度会受到限制。本实施例提供一种新的算法，取名增量极限学习机，即OP-ELM，用来构建模型。OP-ELM模型在学习阶段主要学习两种参数，一种是激励函数G的内部参数a_i,b_i(i＝1,2,…,L)，第二种是隐含层节点数L。当a_i,b_i(i＝1,2,…,L)通过一个均值为0方差为1的简单高斯分布随机取得时，OP-ELM可以以接近0误差地拟合训练数据，所以，在学习阶段，a_i,b_i(i＝1,2,…,L)参数可随机获取。隐藏层节点数的学习方面，模型在验证集上的加权准确率随着隐含层节点数的增加不断增加，但当隐含层节点数到达400点后加权准确率的增加并不显著，且模型训练时间随着隐藏层节点数的增加呈指数的增加，主要因为求矩阵逆/伪逆的运算时间受隐藏层节点数的影响是指数的。因此本发明在训练OP-ELM时预设隐含节点数设为400，但随着日后的训练数据的增加，会适当增加隐藏节点数。当然，也可以根据需要设为其他值。

给定一个包含N个项目样本的M维目标预测物资的训练数据集其中M为物资种类，x_i＝[x_i1,x_i2,…x_in]^T∈Rⁿ为项目样本i的预设属性参数和项目类型属性，t_i＝[t_i1,t_i2,…t_iM]^T∈R^M，并且0≤t_ij≤1,j＝1,...,M对应于该项目样本在M维物资的使用量，可以为数量、重量或金额等。当模型中使用量是用的数量时，预测时只能预测数量，当模型中使用量是用的金额时，预测时只能预测金额。可以同时对多种目标进行预测，比如同时对重量和金额进行预测，则在训练时对重量和金额进行训练，预测时就能输出重量和金额。基于L个隐含节点数和L个隐含节点对应的激励函数的OP-ELM可以利用项目的项目特征属以零误差地逼近项目物资使用量：

在OP-ELM中，训练数据是一批一批地提交给OP-ELM进行训练。在每一轮训练中，OP-ELM利用隐含节点固化历史数据的知识，在历史批次和当前批次数据中，训练全局最优的隐含节点权重参数矩阵β。而且每一轮训练过程中，训练算法的输入仅依赖于当前批次的数据，无需再次扫描历史数据，模型参数规模也不会因为历史数据量的变化而增大。相应地，海量数据的ELM训练过程逐步分解为若干批次的OP-ELM训练，最终OP-ELM的解等价于ELM在全部训练数据基础上一次性学习的结果。OP-ELM在保证模型精度和泛化能力的同时，给出了一种快速有效的在线学习方法，满足了海量数据训练的计算需求。也就是OP-ELM将增量一批一批的输入，用迭代方法进行计算。具体如下：

给定ELM隐含节点数L及对应的参数初始批次的训练数据隐含节点输出矩阵H₀和T₀分别可以通过等式(3)和等式(4)计算。

H_{0} = {[\begin{matrix} g (a_{1}, b_{1}, x_{1}) & ... & g (a_{L}, b_{L}, x_{1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{N_{0}}) & ... & g (a_{L}, b_{L}, x_{N_{0}}) \end{matrix}]}_{N_{0} \times L} - - - (3),

T_{0} = {[\begin{matrix} t_{1}^{T} \\ . \\ . \\ . \\ t_{N_{0}}^{T} \end{matrix}]}_{N_{0} \times M} - - - (4)

隐含节点权重参数矩阵β₀可以通过等式(5)求解。

H₀β₀＝T₀(5)

假定和等式(5)等价于

P₀β₀＝Q₀(6)

相应地，在等式(6)中，矩阵P₀和Q₀大小分别为L×L和L×M，于训练样本集大小无关。

给定新一批次的训练数据类似原始ELM的计算方式，隐含节点权重参数矩阵β₁可以根据公式(7)计算。

[\begin{matrix} H_{0} \\ H_{1} \end{matrix}] β_{1} = [\begin{matrix} T_{0} \\ T_{1} \end{matrix}] - - - (7)

相应地，等式(7)等价于

P₁β₁＝Q₁

其中，

P_{1} = {[\begin{matrix} H_{0} \\ H_{1} \end{matrix}]}^{T} [\begin{matrix} H_{0} \\ H_{1} \end{matrix}] = H_{0}^{T} H_{0} + H_{1}^{T} H_{1} = P_{0} + H_{1}^{T} H_{1}

Q_{1} = {[\begin{matrix} H_{0} \\ H_{1} \end{matrix}]}^{T} [\begin{matrix} T_{0} \\ T_{1} \end{matrix}] = H_{0}^{T} T_{0} + H_{1}^{T} T_{1} = Q_{0} + H_{1}^{T} T_{1}

将上述过程推广到第k+1批训练数据

X_{k + 1} = {(x_{i}, t_{i})}_{i = Σ_{k = 0}^{k} N_{j} + 1}^{Σ_{j = 0}^{k + 1} N_{j}}

可以得到，

H_{k + 1} = {[\begin{matrix} g (a_{1}, b_{1}, x_{(Σ_{j = 0}^{k} N_{j}) + 1}) & ... & g (a_{L}, b_{L}, x_{(Σ_{j = 0}^{k} N_{j}) + 1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{Σ_{j = 0}^{k + 1} N_{j}}) & ... & g (a_{L}, b_{L}, x_{Σ_{j = 0}^{k + 1} N_{j}}) \end{matrix}]}_{N_{k + 1} \times L}

T_{k + 1} = {[\begin{matrix} t_{(Σ_{j = 0}^{k} N_{j}) + 1}^{T} \\ . \\ . \\ . \\ t_{Σ_{j = 0}^{k + 1} N_{j}}^{T} \end{matrix}]}_{N_{k + 1} \times m}

P_k+1β_k+1＝Q_k+1(8)

其中，

P_{k + 1} = {[\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}] = H_{0}^{T} H_{0} + {LH}_{k}^{T} H_{k} + H_{k + 1}^{T} H_{k + 1} = P_{k} + H_{k + 1}^{T} H_{k + 1}

Q_{k + 1} = {[\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} T_{0} \\ . \\ . \\ . \\ T_{k} \\ T_{k + 1} \end{matrix}] = H_{0}^{T} T_{0} + {LH}_{k}^{T} T_{k} + H_{k + 1}^{T} H_{k + 1} = Q_{k} + H_{k + 1}^{T} T_{k + 1}

给定隐含节点数目L，可微激励函数g，K个批次的训练数据集OP-ELM通过等式(8)，经过K轮迭代，可以求出隐含节点权重参数矩阵β_k+1，用于对新数据的预测，P_k和Q_k为中间变量，所述K为大于或等于0的整数。

获取待测项目预设属性的内容，采用待测项目预设属性的参数，将待测项目预设属性的参数作为x_i输入，根据历史训练中随机生成的a_i,b_i(i＝1,2,...,L)和历史训练中确定的隐含节点权重参数矩阵β，可求得待测物资预测值。按照标准化缩小或放大的比例对预测值进行放大或缩小(即，按照原来缩小或放大比例对该项目物资使用量进行放大或缩小)预测值，确定待测项目物资使用量。

进一步，可以判断预测值是否为负值，如果否，按标准化对应比例还原预测值，确定对应待测项目物资使用量，若是，则获取待测项目的历史项目物资使用量，确定待测项目的历史项目物资使用量的平均值，根据平均值与服从N(0,1)的正态分布乘积的绝对值，确定预测值，按标准化对应比例还原预测值，确定待测项目物资使用量。按照标准化还原是指按照原来缩小或放大比例对该项目物资使用量进行放大或缩小，使其按比例还原预测值的真实大小。

实施例三

参见图3，是本发明电力配网建设物资需求预测方法实施例三的流程示意图，包括步骤：

步骤S301：获取历史项目预设属性的参数和各种历史项目物资使用量，对历史项目采用聚类算法进行分群，确定聚类族，对聚类族采用关键词频分析法，确定项目类型属性，将各种历史项目物资使用量标准化到预设范围内；

步骤S302：根据历史项目预设属性的参数、标准化的各种历史项目物资使用量、预设隐含节点数和项目类型属性，采用极限学习机构建预测模型，根据预测模型确定隐含节点权重参数矩阵；

步骤S303：获取待测项目预设属性的参数和待测项目的项目类型属性，根据隐含节点权重参数矩阵、待测项目预设属性的参数和待测项目的项目类型属性，采用预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

首先获取历史项目预设属性的内容和历史项目物资使用量，预设属性可以为地市局信息、电压等级、预计完成期限、概算金额等。由于只利用基本属性进行预测效果不够好，为了提高算法准确率，本发明设法构造类型属性对每个项目的类型的进行描述。通过先聚类与后关键词频分析方法构造出如“配电站”，“负荷”，“重载”类项目等概念数十个，每个项目可能属于多个项目类型，也可能不属于任何一个项目类型。本发明选用GlobalK-Means算法作为项目领料物资数据的聚类算法，从一个既定的训练样本的整体中心开始，每次从训练样本中选取一个使聚类误差减少最大的点作为新的中心点，然后调整聚类中心，如此往复，直到到达K个中心点为止，以此来保证此K个中心点是最优的聚类中心点，也即使聚出来的类具有内聚度最高，耦合度最低的特点。因此GlobalK-Means相比较于普通K-Means的聚类算法，有更好的聚类效果，更加符合电力配网建设物资需求预测对聚类效果准确度高的要求。

给定一个距离的计算公式Dist，对于一个已经被聚到G类(i.e.C₁,...,C_G)的训练集其聚类误差可以计算为：

D (C_{1}, ..., C_{G}) = Σ_{n = 1}^{N c} Σ_{g = 1}^{G} δ (x_{n} &Element; C_{g}) D i s t (x_{n}, {mean}_{C_{g}})

其中是样例X_n与类C_g中心点：

{Mean}_{C_{g}} = \frac{Σ_{i = 1}^{N c} δ (x_{i} &Element; C_{g}) x_{i}}{Σ_{i = 1}^{N c} δ (x_{i} &Element; C_{g})}, δ (x_{i} &Element; C_{g}) = \begin{matrix} 0 i f x_{i} d o e s n o t b e l o n g t o C_{g} \\ 1 i f x_{i} b e lo n g s t o C_{g} \end{matrix}

的距离函数。该距离函数可以为欧氏距离，马氏距离等。其中，Nc是数据点的个数，X有Nc个点。G是指聚类数，有G个类。GlobalK-Means每一轮对训练集的每一点进行考虑，取可以使到整体聚类误差最小的点作为新增的聚类中心，调整聚类中心后再用同样的方法添加新的中心点，如此反复，直到聚类数到达目标聚类数为止。其每一轮的计算复杂度为：O(nncd)其中n为样本容量，c为当前的聚类数，d为数据维度。

进一步地，本发明通过FastGlobalK-Means对聚类进行加速，对于每一点能否作为聚类中心的计算由原来的计算整体聚类误差变为计算误差减少量，如下：

b_{n} = Σ_{j = 1}^{N} m a x (d_{c - 1}^{j} - | | x_{n} - x_{j} | |^{2}, 0),

i = \arg \max_{n} b_{n}

其中是点x_j到达先前生成的c-1个聚类中心里最近点的距离的平方，||x_n-x_j||²为x_j到x_n的距离的平方。如果某个点被重新聚到以x_n为聚类中心的新的类，其到x_n的距离的平方必然比到原所属类中心点要小，其减少量必大于0，令其在b_n上累计，则b_n正比于点x_n作为新的聚类中心的聚类误差的减小量，取令b_n最大的点x_n为新的聚类中心，可保证本轮聚类结果最优。此算法的每一轮的计算复杂度为O(nnd)，比原始的GlobalK-Means要小很多。

进一步地，采用K-DTree进行加速。即使FastGlobalK-Means的复杂度比GlobalK-Means要小得多，但其计算复杂度仍然是比较大的。运用K-DTree方法，将原始数据空间进行分割，保证物理上相近数据被划分到生成的K-DTree的同一个叶子节点里。此加速方法的核心思想在于，对将每一个数据点是否成为新的聚类中心的考察转化为对已经分割好的每一个相邻紧密的簇的中心点进行考察，这样可以在基本保证聚类效果的情况之下有效降低算法复杂度。设定K-DTree的每个叶子节点的容量为l，则算法的复杂度可以再由FastGlobalK-Means的O(nnd)降低到O(nnd/l)。

对项目的历史项目物资使用量采用聚类算法进行项目分群后，对分群后的历史物资采用关键词频分析。由于电力配网项目的名称多有较为统一的规范，因此每一个项目的项目名称提供了此项目部分基本信息，如“XX10kv电桩工程”为一个关于“电桩”类的电压等级为10kv的项目，此类项目名称提供了电力配网项目的某些如用料，配电性质，电压等级等信息，因此找到每个项目名称里面的关键词成为了取得此部分项目信息的关键。

在GlobalK-Means产生的项目群中利用中文分词方法(如利用中国科学院汉语分词系统ICTCLAS)，对每个项目名称进行分词处理，过滤对预测分析没有信息量但出现频率很高的“stopwords”如“项目”，“工程”等词，再统计每个词的词频，词频高的词语被定义为关键词。这样的关键词再经由业务人员的分析与选择，成为每个项目的项目类型属性之一，作为下一步模型预测的输入属性值。

进一步地，为了方便计算，对历史物资同种使用量进行单位的统一。把历史项目物资使用量进行标准化处理。所谓标准化处理，是指将每项历史项目物资使用量缩小或放大到预设范围。其中，预设范围可以为[0,1]。进一步地，可以按照物资目录对历史物资进行分类和物资用量的汇总。物资目录可以为一级物资目录、二级物资目录等，具体根据需要设定。例如按照电网一级物资目录，对历史物资进行分类和物资用量的汇总。因为细类的物资种类太多，多于6000多种，直接预测准确率不高且实际的意义可能不大。故本发明将细类物资按统一的一级物资目录进行汇总，汇总后物资种类大大缩小，比如有60种。这样更宏观地进行预测，可以更准确地得到大类物资的用量。

本发明使用的单隐层前馈神经网络(singlehiddenlayerfeedforwardnetworks，SLFNs)为极限学习机(ExtremeLearningMachines)，来构建配网项目物资需求预测模型。

给定一个包含N个项目样本的M维目标预测物资的训练数据集其中M为物资种类，x_i＝[x_i1,x_i2,…x_in]^T∈Rⁿ为项目样本i的预设属性参数和项目类型属性，t_i＝[t_i1,t_i2,…t_iM]^T∈R^M，并且0≤t_ij≤1,j＝1,...,M，t_i对应于该项目样本在M维物资的使用量，可以为数量、重量或金额等。当模型中使用量是用的数量时，预测时只能预测数量，当模型中使用量是用的金额时，预测时只能预测金额。可以同时对多种目标进行预测，比如同时对重量和金额进行预测，则在训练时对重量和金额进行训练，预测时就能输出重量和金额。基于L个隐含节点数和L个隐含节点对应的激励函数的ELM可以利用项目的项目特征属以零误差地逼近项目物资使用量：

Σ_{j = 1}^{L} β_{j} g_{j} (a_{j}, b_{j}, x_{i}) = t_{i}, i = 1, ..., N - - - (1)

g^Additive _j(a_j,b_j,x_i)＝G(a_j·x_i+b_j),a_j∈R,b_j∈R

相应地，公式(1)可以转写为矩阵的形式：

Hβ＝T

其中，

H (a_{1}, ... a_{L}, b_{1}, ... b_{L}, x_{1}, ... x_{N}) = {[\begin{matrix} g (a_{1}, b_{1}, x_{1}) & ... & g (a_{L}, b_{L}, x_{1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{N}) & ... & g (a_{L}, b_{L}, x_{N}) \end{matrix}]}_{N \times L},

β = {[\begin{matrix} β_{1}^{T} \\ . \\ . \\ . \\ β_{L}^{T} \end{matrix}]}_{L \times M}, T = {[\begin{matrix} t_{1}^{T} \\ . \\ . \\ . \\ t_{L}^{T} \end{matrix}]}_{N \times M}

矩阵H表示隐含节点输出矩阵，矩阵β表示隐含节点权重参数矩阵，T表示项目物资使用量矩阵，L表示隐含节点数，a_i,b_i(i＝1,...,L)通过一个均值为0方差为1的简单高斯分布随机取得。

获取待测项目预设属性的参数，采用待测项目预设属性的参数，判断是否存在历史训练时的项目类型属性，如果存在，则将待测项目预设属性的参数和项目类型属性作为x_i输入，否则xi里面对应于项目类型属性的位置为0，xi里面对应于预设属性位置输入预设属性的参数。根据历史训练中随机生成的a_i,b_i(i＝1,2,...,L)和历史训练中确定的隐含节点权重参数矩阵β，可求得待测物资预测值。按照原来缩小或放大比例对该项目物资使用量进行放大或缩小预测值，确定待测项目物资使用量。

进一步，可以判断预测值是否为负值，若否，按标准化对应比例还原预测值，确定对应待测项目物资使用量，若是，则获取待测项目的历史项目物资使用量，确定待测项目的历史项目物资使用量的平均值，根据平均值与服从N(0,1)的正态分布乘积的绝对值，确定预测值，按标准化对应比例还原预测值，确定待测项目物资使用量。按照标准化还原是指按照原来缩小或放大比例对该项目物资使用量进行放大或缩小，使其按比例还原预测值的真实大小。

同理可得，结合实施例一至实施例三，电力配网建设物资需求预测方法包括步骤

获取历史项目预设属性的参数和各种历史项目物资使用量，对历史项目物资使用量采用聚类算法进行分群，确定聚类族，对聚类族采用关键词频分析法，确定项目类型属性，将各种历史项目物资使用量标准化到预设范围内；

根据历史项目预设属性的参数、标准化的各种历史项目物资使用量、预设隐含节点数和项目类型属性，采用增量的极限学习机或极限学习机构建预测模型，根据预测模型确定隐含节点权重参数矩阵；

获取待测项目预设属性的参数和待测项目的项目类型属性，根据隐含节点权重参数矩阵、待测项目预设属性的参数和待测项目的项目类型属性，采用预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

具体方法与实施例一至实施例三类似，在此不再赘述。

根据上述本发明电力配网建设物资需求预测方法，本发明提供一种电力配网建设物资需求预测装置，通过应用本发明电力配网建设物资需求预测装置，建模模块采用极限学习机构建预测模型，实现对多种物资用量同时预测，模型简单，训练快速，兼顾物资之间的关联性。参见图4，为本发明电力配网建设物资需求预测装置的结构示意图，包括：预处理模块401、建模模块402、预测模块403。因为模块的功能不同，可以有不同的工作过程。实施例一中建模模块采用极限学习机构建预测模型，实现对多种物资用量同时预测。实施例二中，建模模块采用极限学习机构建预测模型，预处理模块还用于确定项目类型属性，不仅实现对多种物资用量同时预测，还能提高预测准确率。实施例三中建模模块采用增量学习机构建预测模型，实现在历史项目数较大的情况下，简单、快速的对多种物质使用量同时预测。

实施例一

预处理模块401，用于获取历史项目预设属性的参数和各种历史项目物资使用量，将各种历史项目物资使用量标准化到预设范围内；

建模模块402，用于根据历史项目预设属性的参数、标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

预测模块403，获取待测项目预设属性的参数，根据所述隐含节点权重参数矩阵和待测项目预设属性的参数，采用预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

首先预处理模块401获取历史项目预设属性的内容和历史项目物资使用量，预设属性可以为地市局信息、电压等级、预计完成期限、概算金额等。

为了方便计算，预处理模块401对历史物资同种使用量进行单位的统一。把历史项目物资使用量进行标准化处理。所谓标准化处理，是指将每项历史项目物资使用量缩小或放大到预设范围。其中，预设范围可以为[0,1]。进一步地，预处理模块401可以按照物资目录对历史物资进行分类和物资用量的汇总。物资目录可以为一级物资目录、二级物资目录等，具体根据需要设定。例如按照电网一级物资目录，对历史物资进行分类和物资用量的汇总。因为细类的物资种类太多，多于6000多种，直接预测准确率不高且实际的意义可能不大。故本发明将细类物资按统一的一级物资目录进行汇总，汇总后物资种类大大缩小，比如有60种。这样更宏观地进行预测，可以更准确地得到大类物资的用量。

本发明建模模块402使用的单隐层前馈神经网络(singlehiddenlayerfeedforwardnetworks，SLFNs)为极限学习机(ExtremeLearningMachines，简称ELM)，来构建配网项目物资需求预测模型。

给定一个包含N个项目样本的M维目标预测物资的训练数据集其中M为物资种类，x_i＝[x_i1,x_i2,…x_in]^T∈Rⁿ为项目样本i的预设属性，并且0≤t_ij≤1,j＝1,...,M对应于该项目样本在M维物资的使用量，可以为数量、重量或金额等。当模型中使用量是用的数量时，预测时只能预测数量，当模型中使用量是用的金额时，预测时只能预测金额。可以同时对多种目标进行预测，比如同时对重量和金额进行预测，则在训练时对重量和金额进行训练，预测时就能输出重量和金额。。基于L个隐含节点数和L个隐含节点对应的激励函数的ELM可以利用项目的项目特征属以零误差地逼近项目物资使用量：

Σ_{j = 1}^{L} β_{j} g_{j} (a_{j}, b_{j}, x_{i}) = t_{i}, i = 1, ..., N - - - (1)

g^Additive _j(a_j,b_j,x_i)＝G(a_j·x_i+b_j),a_j∈R,b_j∈R

相应地，公式(1)可以转写为矩阵的形式：

Hβ＝T

其中，

H (a_{1}, ... a_{L}, b_{1}, ... b_{L}, x_{1}, ... x_{N}) = {[\begin{matrix} g (a_{1}, b_{1}, x_{1}) & ... & g (a_{L}, b_{L}, x_{1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{N}) & ... & g (a_{L}, b_{L}, x_{N}) \end{matrix}]}_{N \times L},

β = {[\begin{matrix} β_{1}^{T} \\ . \\ . \\ . \\ β_{L}^{T} \end{matrix}]}_{L \times M}, T = {[\begin{matrix} t_{1}^{T} \\ . \\ . \\ . \\ t_{L}^{T} \end{matrix}]}_{N \times M}

矩阵H表示隐含节点输出矩阵，矩阵β表示隐含节点权重参数矩阵，T表示项目物资使用量矩阵，L表示隐含节点数，a_i,b_i(i＝1,2,...,L)通过一个均值为0方差为1的简单高斯分布随机取得。

预测模块403获取待测项目预设属性的内容，采用待测项目预设属性的内容x_i作为输入，根据历史训练中随机生成的a_i,b_i(i＝1,2,...,L)和历史训练中确定的隐含节点权重参数矩阵β，可求得待测物资预测值。按照原来缩小或放大比例对该项目物资使用量进行放大或缩小预测值，确定待测项目物资使用量。

进一步，预测模块403可以判断预测值是否为负值，如果否，按标准化对应比例还原预测值，确定对应待测项目物资使用量，若是，则获取待测项目的历史项目物资使用量，确定待测项目的历史项目物资使用量的平均值，根据平均值与服从N(0,1)的正态分布乘积的绝对值，确定预测值，按标准化对应比例还原预测值，确定待测项目物资使用量。按照标准化还原是指按照原来缩小或放大比例对该项目物资使用量进行放大或缩小，使其按比例还原预测值的真实大小。

实施例二

预处理模块401，用于获取历史项目预设属性的参数和各种历史项目物资使用量，对历史项目采用聚类算法进行分群，确定聚类族，对聚类族采用关键词频分析法，确定项目类型属性，将各种历史项目物资使用量标准化到预设范围内；

建模模块402，用于根据历史项目预设属性的参数、标准化的各种历史项目物资使用量、预设隐含节点数和项目类型属性，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

预测模块403，用于获取待测项目预设属性的参数和待测项目的项目类型属性，根据隐含节点权重参数矩阵、待测项目预设属性的参数和待测项目的项目类型属性，采用预测模型确定对应待测项目物资使用量的预测值，按照标注化还原预测值，确定对应待测项目物资使用量。

预处理模块401首先获取历史项目预设属性的内容和历史项目物资使用量，预设属性可以为地市局信息、电压等级、预计完成期限、概算金额等。由于只利用基本属性进行预测效果不够好，为了提高算法准确率，本发明预处理模块401设法构造类型属性对每个项目的类型的进行描述。预处理模块401通过先聚类与后关键词频分析方法构造出如“配电站”，“负荷”，“重载”类项目等概念数十个，每个项目可能属于多个项目类型，也可能不属于任何一个项目类型。本发明预处理模块401选用GlobalK-Means算法作为项目领料物资数据的聚类算法，从一个既定的训练样本的整体中心开始，每次从训练样本中选取一个使聚类误差减少最大的点作为新的中心点，然后调整聚类中心，如此往复，直到到达K个中心点为止，以此来保证此K个中心点是最优的聚类中心点，也即使聚出来的类具有内聚度最高，耦合度最低的特点。因此GlobalK-Means相比较于普通K-Means的聚类算法，有更好的聚类效果，更加符合电力配网建设物资需求预测对聚类效果准确度高的要求。

D (C_{1}, ..., C_{G}) = Σ_{n = 1}^{N c} Σ_{g = 1}^{G} δ (x_{n} &Element; C_{g}) D i s t (x_{n}, {mean}_{C_{g}})

其中是样例X_n与类C_g中心点：

{Mean}_{C_{g}} = \frac{Σ_{i = 1}^{N c} δ (x_{i} &Element; C_{g}) x_{i}}{Σ_{i = 1}^{N c} δ (x_{i} &Element; C_{g})}, δ (x_{i} &Element; C_{g}) = \begin{matrix} 0 i f x_{i} d o e s n o t b e l o n g t o C_{g} \\ 1 i f x_{i} b e lo n g s t o C_{g} \end{matrix}

进一步地，本发明预处理模块401通过FastGlobalK-Means对聚类进行加速，对于每一点能否作为聚类中心的计算由原来的计算整体聚类误差变为计算误差减少量，如下：

b_{n} = Σ_{j = 1}^{N} m a x (d_{c - 1}^{j} - | | x_{n} - x_{j} | |^{2}, 0),

i = \arg \underset{n}{m a x} b_{n}

其中是点xj到达先前生成的c-1个聚类中心里最近点的距离的平方，||x_n-x_j||²为x_j到x_n的距离的平方。如果某个点被重新聚到以x_n为聚类中心的新的类，其到x_n的距离的平方必然比到原所属类中心点要小，其减少量必大于0，令其在b_n上累计，则b_n正比于点x_n作为新的聚类中心的聚类误差的减小量，取令b_n最大的点x_n为新的聚类中心，可保证本轮聚类结果最优。此算法的每一轮的计算复杂度为O(nnd)，比原始的GlobalK-Means要小很多。

进一步地，预处理模块401采用K-DTree进行加速。即使FastGlobalK-Means的复杂度比GlobalK-Means要小得多，但其计算复杂度仍然是比较大的。运用K-DTree方法，将原始数据空间进行分割，保证物理上相近数据被划分到生成的K-DTree的同一个叶子节点里。此加速方法的核心思想在于，对将每一个数据点是否成为新的聚类中心的考察转化为对已经分割好的每一个相邻紧密的簇的中心点进行考察，这样可以在基本保证聚类效果的情况之下有效降低算法复杂度。设定K-DTree的每个叶子节点的容量为l，则算法的复杂度可以再由FastGlobalK-Means的O(nnd)降低到O(nnd/l)。

预处理模块401对项目历史项目物资使用量采用聚类算法进行项目分群后，对分群后的历史物资采用关键词频分析。由于电力配网项目的名称多有较为统一的规范，因此每一个项目的项目名称提供了此项目部分基本信息，如“XX10kv电桩工程”为一个关于“电桩”类的电压等级为10kv的项目，此类项目名称提供了电力配网项目的某些如用料，配电性质，电压等级等信息，因此找到每个项目名称里面的关键词成为了取得此部分项目信息的关键。

进一步地，为了方便计算，预处理模块401对历史物资同种使用量进行单位的统一。把历史项目物资使用量进行标准化处理。所谓标准化处理，是指将每项历史项目物资使用量缩小或放大到预设范围。其中，预设范围可以为[0,1]。进一步地，可以按照物资目录对历史物资进行分类和物资用量的汇总。物资目录可以为一级物资目录、二级物资目录等，具体根据需要设定。例如按照电网一级物资目录，对历史物资进行分类和物资用量的汇总。因为细类的物资种类太多，多于6000多种，直接预测准确率不高且实际的意义可能不大。故本发明将细类物资按统一的一级物资目录进行汇总，汇总后物资种类大大缩小，比如有60种。这样更宏观地进行预测，可以更准确地得到大类物资的用量。

本发明建模模块402使用的单隐层前馈神经网络(singlehiddenlayerfeedforwardnetworks，SLFNs)为极限学习机(ExtremeLearningMachines)，来构建配网项目物资需求预测模型。

给定一个包含N个项目样本的M维目标预测物资的训练数据集其中M为物资种类，x_i＝[x_i1,x_i2,…x_in]^T∈Rⁿ为项目样本i的预设属性参数和项目类型属性，t_i＝[t_i1,t_i2,…t_iM]^T∈R^M，并且0≤t_ij≤1,j＝1,...,M对应于该项目样本在M维物资的使用量，可以为数量、重量或金额等。当模型中使用量是用的数量时，预测时只能预测数量，当模型中使用量是用的金额时，预测时只能预测金额。可以同时对多种目标进行预测，比如同时对重量和金额进行预测，则在训练时对重量和金额进行训练，预测时就能输出重量和金额。。基于L个隐含节点数和L个隐含节点对应的激励函数的ELM可以利用项目的项目特征属以零误差地逼近项目物资使用量：

Σ_{j = 1}^{L} β_{j} g_{j} (a_{j}, b_{j}, x_{i}) = t_{i}, i = 1, ..., N - - - (1)

g^Additive _j(a_j,b_j,x_i)＝G(a_j·x_i+b_j),a_j∈R,b_j∈R

相应地，公式(1)可以转写为矩阵的形式：

Hβ＝T

其中，

H (a_{1}, ... a_{L}, b_{1}, ... b_{L}, x_{1}, ... x_{N}) = {[\begin{matrix} g (a_{1}, b_{1}, x_{1}) & ... & g (a_{L}, b_{L}, x_{1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{N}) & ... & g (a_{L}, b_{L}, x_{N}) \end{matrix}]}_{N \times L},

β = {[\begin{matrix} β_{1}^{T} \\ . \\ . \\ . \\ β_{L}^{T} \end{matrix}]}_{L \times M}, T = {[\begin{matrix} t_{1}^{T} \\ . \\ . \\ . \\ t_{L}^{T} \end{matrix}]}_{N \times M}

预测模块403获取待测项目预设属性的内容，采用待测项目预设属性的参数，判断是否存在历史训练时的项目类型属性，如果存在，则将待测项目预设属性的参数和项目类型属性作为x_i输入，否则x_i里面对应于项目类型属性的位置为0，x_i里面对应于预设属性位置输入预设属性的参数。根据历史训练中随机生成的a_i,b_i(i＝1,2,...,L)和历史训练中确定的隐含节点权重参数矩阵β，可求得待测物资预测值。按照原来缩小或放大比例对该项目物资使用量进行放大或缩小预测值，确定待测项目物资使用量。

实施例三

预处理模401，用于获取历史项目预设属性的参数和各种历史项目物资使用量，将各种历史项目物资使用量标准化到预设范围内；

建模模块402，用于根据所述历史项目预设属性的参数、标准化的各种历史项目物资使用量和预设隐含节点数，采用增量极限学习机构建预测模型，根据预测模型确定隐含节点权重参数矩阵；

预测模块403，用于获取待测项目预设属性的参数，根据隐含节点权重参数矩阵和待测项目预设属性的参数，采用预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

首先预处理模401获取历史项目预设属性的内容和历史项目物资使用量，预设属性可以为地市局信息、电压等级、预计完成期限、概算金额等。预设属性可以为其中的一个或多个。

为了方便计算，预处理模401对历史物资同种使用量进行单位的统一。把历史项目物资使用量进行标准化处理。所谓标准化处理，是指将每项历史项目物资使用量缩小或放大到预设范围。其中，预设范围可以为[0,1]。进一步地，可以按照物资目录对历史物资进行分类和物资用量的汇总。物资目录可以为一级物资目录、二级物资目录等，具体根据需要设定。例如按照电网一级物资目录，对历史物资进行分类和物资用量的汇总。因为细类的物资种类太多，多于6000多种，直接预测准确率不高且实际的意义可能不大。故本发明将细类物资按统一的一级物资目录进行汇总，汇总后物资种类大大缩小，比如有60种。这样更宏观地进行预测，可以更准确地得到大类物资的用量。

当训练数据庞大的时候，ELM算法的训练速度会受到限制。本实施例建模模块402采用一种新的算法，取名增量极限学习机，即OP-ELM，用来构建模型。OP-ELM模型在学习阶段主要学习两种参数，一种是激励函数G的内部参数a_i,b_i(i＝1,2,...,L)，第二种是隐含层节点数L。当a_i,b_i(i＝1,2,...,L)通过一个均值为0方差为1的简单高斯分布随机取得时，OP-ELM可以以接近0误差地拟合训练数据，所以，在学习阶段，a_i,b_i(i＝1,2,...,L)参数可随机获取。隐藏层节点数的学习方面，模型在验证集上的加权准确率随着隐含层节点数的增加不断增加，但当隐含层节点数到达400点后加权准确率的增加并不显著，且模型训练时间随着隐藏层节点数的增加呈指数级的增加，主要因为求矩阵逆/伪逆的运算时间受隐藏层节点数的影响是指数级的。因此本发明在训练OP-ELM时预设隐含节点数设为400，但随着日后的训练数据的增加，会适当增加隐藏节点数。当然，也可以根据需要设为其他值。

H_{0} = {[\begin{matrix} g (a_{1}, b_{1}, x_{1}) & ... & g (a_{L}, b_{L}, x_{1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{N_{0}}) & ... & g (a_{L}, b_{L}, x_{N_{0}}) \end{matrix}]}_{N_{0} \times L} - - - (3),

T_{0} = {[\begin{matrix} t_{1}^{T} \\ . \\ . \\ . \\ t_{N_{0}}^{T} \end{matrix}]}_{N_{0} \times M} - - - (4)

隐含节点权重参数矩阵β₀可以通过等式(5)求解。

H₀β₀＝T₀(5)

假定和等式(5)等价于

P₀β₀＝Q₀(6)

[\begin{matrix} H_{0} \\ H_{1} \end{matrix}] β_{1} = [\begin{matrix} T_{0} \\ T_{1} \end{matrix}] - - - (7)

相应地，等式(7)等价于

P₁β₁＝Q₁

其中，

P_{1} = {[\begin{matrix} H_{0} \\ H_{1} \end{matrix}]}^{T} [\begin{matrix} H_{0} \\ H_{1} \end{matrix}] = H_{0}^{T} H_{0} + H_{1}^{T} H_{1} = P_{0} + H_{1}^{T} H_{1}

Q_{k + 1} = {[\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} T_{0} \\ . \\ . \\ . \\ T_{k} \\ T_{k + 1} \end{matrix}] = H_{0}^{T} T_{0} + H_{1}^{T} T_{1} = Q_{0} + H_{1}^{T} T_{1}

将上述过程推广到第k+1批训练数据

X_{k + 1} = {(x_{i}, t_{i})}_{i = Σ_{j = 0}^{k} N_{j} + 1}^{Σ_{j = 0}^{k + 1} N_{j}}

可以得到，

H_{k + 1} = {[\begin{matrix} g (a_{1}, b_{1}, x_{(Σ_{j = 0}^{k} N_{j}) + 1}) & ... & g (a_{L}, b_{L}, x_{(Σ_{j = 0}^{k} N_{j}) + 1}) \\ . & . \\ . & ... & . \\ . & . \\ g (a_{1}, b_{1}, x_{Σ_{j = 0}^{k + 1} N_{j}}) & ... & g (a_{L}, b_{L}, x_{Σ_{j = 0}^{k + 1} N_{j}}) \end{matrix}]}_{N_{k + 1} \times L}

T_{k + 1} = {[\begin{matrix} t_{(Σ_{j = 0}^{k} N_{j}) + 1}^{T} \\ . \\ . \\ . \\ t_{Σ_{j = 0}^{k + 1} N_{j}}^{T} \end{matrix}]}_{N_{k + 1} \times m}

P_k+1β_k+1＝Q_k+1(8)

其中，

P_{k + 1} = {[\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}] = H_{0}^{T} H_{0} + {LH}_{k}^{T} H_{k} + H_{k + 1}^{T} H_{k + 1} = P_{k} + H_{k + 1}^{T} H_{k + 1}

Q_{k + 1} = {[\begin{matrix} H_{0} \\ . \\ . \\ . \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} T_{0} \\ . \\ . \\ . \\ T_{k} \\ T_{k + 1} \end{matrix}] = H_{0}^{T} T_{0} + {LH}_{k}^{T} T_{k} + H_{k + 1}^{T} H_{k + 1} = Q_{k} + H_{k + 1}^{T} T_{k + 1}

预测模块403获取待测项目预设属性的内容，采用待测项目预设属性的参数，将待测项目预设属性的参数作为x_i输入，根据历史训练中随机生成的a_i,b_i(i＝1,2,...,L)和历史训练中确定的隐含节点权重参数矩阵β，可求得待测物资预测值。按照原来缩小或放大比例对该项目物资使用量进行放大或缩小预测值，确定待测项目物资使用量。

进一步，预测模块403可以判断预测值是否为负值，如果否，按标准化对应比例还原预测值，确定对应待测项目物资使用量，若是，则获取待测项目的历史项目物资使用量，确定待测项目的历史项目物资使用量的平均值，根据平均值与服从N(0,1)的正态分布乘积的绝对值，确定预测值，按标准化对应比例还原预测值，确定待测项目物资使用量。按照标准化还原是指按照原来缩小或放大比例对该项目物资使用量进行放大或缩小，使其按比例还原预测值真实大小。同理可得，结合实施例二和实施例三的装置，电力配网建设物资需求预测装置包括：

预处理模块，用于获取历史项目预设属性的参数和各种历史项目物资使用量，对各种历史项目物资使用量采用聚类算法进行分群，确定聚类族，对聚类族采用关键词频分析法，确定项目类型属性，将各种历史项目物资使用量标准化到预设范围内；

建模模块，用于根据历史项目预设属性的参数、项目类型属性、标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机或增量学习机构建预测模型，根据预测模型确定隐含节点权重参数矩阵；

预测模块，用于获取待测项目预设属性的参数和待测项目的项目类型属性，根据隐含节点权重参数矩阵、待测项目预设属性的参数和待测项目的项目类型属性，采用预测模型确定预测值，按标准化对应比例还原预测值，确定对应待测项目物资使用量。

具体实施方式与实施例二和实施例三类似，在此不再赘述。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种电力配网建设物资需求预测方法，其特征在于，包括步骤：

根据所述历史项目预设属性的参数、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型获得隐含节点输出矩阵和项目物资使用量矩阵，采用公式Hβ＝T确定隐含节点权重参数矩阵，其中，H为所述隐含节点输出矩阵，T为所述项目物资使用量矩阵，β为所述隐含节点权重参数矩阵；

2.根据权利要求1所述的电力配网建设物资需求预测方法，其特征在于，还包括步骤：

对历史项目物资使用量采用聚类算法进行分群，确定聚类族；

对所述聚类族采用关键词频分析法，确定项目类型属性；

所述确定隐含节点权重参数矩阵包括步骤：

根据所述历史项目预设属性的参数、所述项目类型属性、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

所述确定待测项目物资使用量包括步骤：

获取待测项目预设属性的参数和待测项目的项目类型属性，根据所述隐含节点权重参数矩阵、所述待测项目预设属性的参数和待测项目的项目类型属性，采用所述预测模型确定对应待测项目物资使用量的预测值，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量。

3.根据权利要求1所述的电力配网建设物资需求预测方法，其特征在于，当历史项目数大于预设阈值时，将历史项目分为预设批次，极限学习机按预设批次顺序训练，采用公式P_k+1β_k+1＝Q_k+1确定隐含节点权重参数矩阵β_k+1，其中，

P_{k + 1} = {[\begin{matrix} H_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} H_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ H_{k} \\ H_{k + 1} \end{matrix}] = H_{0}^{T} H_{0} + {LH}_{k}^{T} H_{k} + H_{k + 1}^{T} H_{k + 1} = P_{k} + H_{k + 1}^{T} H_{k + 1}

Q_{k + 1} = {[\begin{matrix} H_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} T_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ T_{k} \\ T_{k + 1} \end{matrix}] = H_{0}^{T} T_{0} + {LH}_{k}^{T} T_{k} + H_{k + 1}^{T} H_{k + 1} = Q_{k} + H_{k + 1}^{T} T_{k + 1}

P_{0} = H_{0}^{T} H_{0}, Q_{0} = H_{0}^{T} T_{0}, P_{0} β_{0} = Q_{0},

H_k表示第K批次的隐含节点输出矩阵，K表示历史项目批次，T_k表示第K批次项目物资使用量矩阵，β_k表示第K批次的隐含节点权重参数矩阵，L表示隐含节点数，P_k和Q_k为中间变量，所述K为大于或等于0的整数。

4.根据权利要求3所述的电力配网建设物资需求预测方法，其特征在于，还包括步骤：

对所述聚类族采用关键词频分析法，确定项目类型属性；

所述确定隐含节点权重参数矩阵包括步骤：

根据所述历史项目预设属性的参数、所述项目类型属性、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用所述P_k+1β_k+1＝Q_k+1构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

所述确定待测项目物资使用量包括步骤：

5.根据权利要求2或4所述的电力配网建设物资需求预测方法，其特征在于，所述聚类算法为GlobalK-Means算法，采用FastGlobalK-Means算法或K-DTree算法对GlobalK-Means算法进行加速。

6.根据权利要求1或2或3或4所述的电力配网建设物资需求预测方法，其特征在于，

所述预设属性包括：电压等级、预计完成期限、概算金额、地市局中的任意一种或任意组合，

和/或

所述的历史项目物资使用量包括金额、重量、长度、数量中的任意一种或任意组合。

7.根据权利要求1或2或3或4所述的电力配网建设物资需求预测方法，其特征在于，所述获取历史项目预设属性的内容时，还包括步骤：

对历史项目物资按照物资目录进行物资分类和物资用量的汇总，

和/或

统一历史项目物资同种使用量单位。

8.根据权利要求1或2或3或4所述的电力配网建设物资需求预测方法，其特征在于，采用预测模型确定预测值后还包括步骤：

判断预测值是否为负值，若否，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量，若是，则获取所述待测项目的历史项目物资使用量，确定所述待测项目的历史项目物资使用量的平均值，根据所述平均值与正态分布乘积的绝对值，确定预测值，按标准化对应比例还原所述预测值，确定待测项目物资使用量。

9.一种电力配网建设物资需求预测装置，其特征在于，包括：

建模模块，用于根据所述历史项目预设属性的参数、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型获得隐含节点输出矩阵和项目物资使用量矩阵，采用公式Hβ＝T确定隐含节点权重参数矩阵，其中，H为所述隐含节点输出矩阵，T为所述项目物资使用量矩阵，β为所述隐含节点权重参数矩阵；

10.根据权利要求9所述的电力配网建设物资需求预测装置，其特征在于，

所述预处理模块还用于对历史项目物资使用量采用聚类算法进行分群，确定聚类族，对所述聚类族采用关键词频分析法，确定项目类型属性；

所述建模模块还用于根据所述历史项目预设属性的参数、所述项目类型属性、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用极限学习机构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

所述预测模块还用于获取待测项目预设属性的参数和待测项目的项目类型属性，根据所述隐含节点权重参数矩阵、所述待测项目预设属性的参数和待测项目的项目类型属性，采用所述预测模型确定预测值，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量。

11.根据权利要求9所述的电力配网建设物资需求预测装置，其特征在于，

所述建模模块还用于当历史项目数大于预设阈值时，将历史项目分为预设批次，极限学习机按预设批次顺序训练，采用公式P_k+1β_k+1＝Q_k+1确定隐含节点权重参数矩阵β_k+1，其中，

P_{k + 1} = {[\begin{matrix} H_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} H_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ H_{k} \\ H_{k + 1} \end{matrix}] = H_{0}^{T} H_{0} + {LH}_{k}^{T} H_{k} + H_{k + 1}^{T} H_{k + 1} = P_{k} + H_{k + 1}^{T} H_{k + 1}

Q_{k + 1} = {[\begin{matrix} H_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ H_{k} \\ H_{k + 1} \end{matrix}]}^{T} [\begin{matrix} T_{0} \\ \begin{matrix} . \\ . \\ . \end{matrix} \\ T_{k} \\ T_{k + 1} \end{matrix}] = H_{0}^{T} T_{0} + {LH}_{k}^{T} T_{k} + H_{k + 1}^{T} H_{k + 1} = Q_{k} + H_{k + 1}^{T} T_{k + 1}

P_{0} = H_{0}^{T} H_{0}, Q_{0} = H_{0}^{T} T_{0}, P_{0} β_{0} = Q_{0},

12.根据权利要求11所述的电力配网建设物资需求预测装置，其特征在于，

所述建模模块还用于根据所述历史项目预设属性的参数、所述项目类型属性、所述标准化的各种历史项目物资使用量和预设隐含节点数，采用P_k+1β_k+1＝Q_k+1构建预测模型，根据所述预测模型确定隐含节点权重参数矩阵；

13.根据权利要求9或10或11或12所述的电力配网建设物资需求预测装置，其特征在于，

所述预处理模块还用于对历史项目物资按照物资目录进行物资分类和物资用量的汇总，

和/或

统一历史项目物资同种使用量单位，

和/或

所述预测模块还用于判断预测值是否为负值，若否，按标准化对应比例还原所述预测值，确定对应待测项目物资使用量，若是，则获取所述待测项目的历史项目物资使用量，确定所述待测项目的历史项目物资使用量的平均值，根据所述平均值与正态分布乘积的绝对值，确定预测值，按标准化对应比例还原所述预测值，确定待测项目物资使用量，

和/或