CN108694470B - 一种基于人工智能的数据预测方法及装置 - Google Patents

一种基于人工智能的数据预测方法及装置 Download PDF

Info

Publication number
CN108694470B
CN108694470B CN201810602426.2A CN201810602426A CN108694470B CN 108694470 B CN108694470 B CN 108694470B CN 201810602426 A CN201810602426 A CN 201810602426A CN 108694470 B CN108694470 B CN 108694470B
Authority
CN
China
Prior art keywords
component
prediction
data
original
imf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810602426.2A
Other languages
English (en)
Other versions
CN108694470A (zh
Inventor
孔祥玉
李闯
孔令桐
郑锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201810602426.2A priority Critical patent/CN108694470B/zh
Publication of CN108694470A publication Critical patent/CN108694470A/zh
Application granted granted Critical
Publication of CN108694470B publication Critical patent/CN108694470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于人工智能的数据预测方法及装置,方法包括:对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;根据各分量的频率选择预测模型的核函数,建立粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型;采用粒子群算法‑参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。装置包括:基于经验模态分解数据分解单元、数据预处理单元、基于最小冗余度最大相关性标准提取单元、最佳指标库单元、基于粒子群算法‑参数寻优的最小二乘支持向量机负荷预测单元、以及加权叠加单元。

Description

一种基于人工智能的数据预测方法及装置
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种基于人工智能的数据预测方法及装置,本发明基于历史数据时间序列对目标变量的变化趋势进行快速精确的预测。
背景技术
数据预测是指基于大数据对事物发展趋势进行预先的估计。高效精确的数据预测是正确决策的依据和保证,许多行业和领域都会涉及预测问题,例如:预测某股票的未来价格,预测电力负荷变化趋势,预测某商品的未来销量以及行业趋势预测等。
目前常用的单一预测方法可分为两类:传统预测方法和智能预测方法。其中,传统预测方法包括回归分析法、自回归滑动平均模型、灰色模型等。智能预测方法包括人工神经网络、支持向量机和模糊逻辑等。
随着数据收集和数据存储技术的快速进步使得各组织机构可以大量获取各类数据,这为从不同维度预测某一行业或专业的变化趋势提供了数据支持。然而预测目标多维度化意味着预测环境的复杂化,采用单一的智能预测方法难以应对复杂环境给预测精度和效率带来的挑战,综合多种数据处理与智能预测的组合方法可以取得较好的预测精度和效率。
发明内容
本发明的目的在于提高数据预测的精度和效率,提供一种基于人工智能的数据预测方法及装置,为实现上述目的,本发明采用以下技术方案:
一种基于人工智能的数据预测方法,所述方法包括以下步骤:
利用经验模态分解将原始负荷时间序列分解成本征模函数分量和残差分量;
对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;
运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;
根据各分量的频率选择预测模型的核函数,建立粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型;
采用粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。
进一步地,所述对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集的步骤具体为:
获取影响原始负荷时间序列变化的m个因素的数据;从各影响因素数据中取出对应原始负荷时间序列的n个数据元素,形成特征列向量;
组合所述各影响因素特征数据,形成矩阵Fn×m;数据归一化处理组合后的所述数据矩阵;
取矩阵的每一列为一个特征即可获得所述原始特征集Fm={x1,x2…xm},其中xm为特征。
其中,所述方法将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。
另一实施例,一种基于人工智能的电力负荷预测装置,所述装置包括:
数据加工单元,用于异常数据点的辨识和修正;
基于经验模态分解数据分解单元,用于分解预测目标的原始负荷时间序列;
数据预处理单元,用于处理各影响因素特征数据,获得所述原始特征集;
基于最小冗余度最大相关性标准提取单元,用于从所述原始特征集中提取最佳特征集
最佳指标库单元,用于存放所述最佳特征集,作为下次预测参考;
基于粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型预测单元,用于对所述各分量进行预测;
加权叠加单元,用于叠加各分量负荷预测值得到最终预测结果。
本发明提供的技术方案的有益效果是:
1、本发明通过EMD(经验模态分解)将历史数据时间序列分解为IMF(本征模函数)分量和残差分量,然后用mRMR(最小冗余度最大相关性标准)从历史数据和影响因素数据中提取最优特征集作为预测模型的输入特征;
2、本发明利用PSO-LSSVM(粒子群算法-参数寻优的最小二乘支持向量机)模型对每个分量进行预测,再通过加权叠加所有分量的预测值得到最终的预测结果;
3、本发明将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。
附图说明
图1为本发明提供的一种基于人工智能的电力负荷预测方法的流程图;
图2为本发明提供的EMD分解原始负荷时间序列示意图;
图3为本发明提供的对各分量进行数据预处理形成各分量的原始输入特征集的流程图;
图4为本发明提供的利用mRMR提取输入特征进行负荷预测的流程图;
图5为本发明提供的各分量的输入特征数量不同时的预测误差示意图;
图6为本发明提供的负荷预测结果示意图;
图7为本发明提供的不同方法负荷预测结果对比图。
图8为本发明提供的一种基于人工智能的数据预测装置的结构框图;
图9为本发明提供的数据加工单元的结构框图;
图10为本发明提供的数据预处理单元的结构框图;
图11为本发明提供的基于mRMR提取最佳特征单元的结构框图;
图12为本发明提供的分量imf5中特征mRMR值的降序排列图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
当前,组合预测方式可分为将多个单一预测模型的预测结果进行加权组合,以及将数据处理方法与智能预测方法相结合两类。本发明实施例将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。
如图1所示,本实施例提供的一种基于人工智能的电力负荷预测方法,该方法包括:
S11:获取原始负荷时间序列;
S12:利用EMD将原始负荷时间序列分解成本征模函数(IMF)分量和残差分量;
S13:对各分量进行数据预处理形成各分量的原始输入特征集;
S14:运用mRMR从原始输入特征集中提取各分量的最佳输入特征集;
S15:根据各分量的频率选择预测模型的核函数,建立PSO-LSSVM负荷预测模型;
S16:采用PSO-LSSVM负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果。
其中,该步骤S11中的原始负荷时间序列主要是通过数据采集与监视控制系统(SCADA)或高级量测体系(AMI)获得的。在电力系统中,SCADA系统应用最为广泛,技术发展也最为成熟,它在远动系统中占重要地位,可以对现场的运行设备进行监视和控制,以实现数据采集、设备控制、测量、参数调节以及各类信号报警等各项功能,在现今的变电站综合自动化建设中起了相当重要的作用。
其中,步骤S12,本实施例以我国某地电网2017年4月1日至6月30日2184h负荷时间序列的实际数据作为实验数据集输入EMD模型,通过EMD对原始负荷序列进行分解,如图2所示;
EMD分解原始负荷时间序列具体包括:电力系统的原始负荷时间序列本身具有随机性,加之市场环境下复杂的负荷影响因素致使负荷序列更加不稳定,运用EMD进行负荷分解可获得更具规律性的分量,在对各分量分别建立预测模型,可提高预测精度。
电力负荷可视为由若干个本征模函数(IMF)组成的一个时间序列。由IMF的定义知:IMF的每一个振动周期,只有一个振动模式,没有其他复杂的奇波。然而大多数所有要分析的数据都不是本征模函数,在任意时间点上,数据可能包含多个波动模式。
利用EMD分解负荷时间序列需基于假设[1]
(1)待分解的复杂信号是由简单的IMF组成;
(2)组成原始复杂信号的每一个IMF分量相互独立。
基于上述分析,对给定的原始负荷时间序列进行分解的具体步骤如下:
(1)找出原始负荷时间序列x(t)中所有局部极大值和局部极小值,并通过三次样条函数分别拟合x(t)的上包络线eup(t)和下包络线elow(t);
(2)计算上包络线eup(t)和下包络线elow(t)的平均值m1(t);
Figure BDA0001693574580000041
(3)计算原始负荷时间序列x(t)和包络线均值m1(t)的差值h1(t);
h1(t)=x(t)-m1(t) (2)
(4)如果差值h1(t)满足IMF条件,那么差值h1(t)就是求得的第一个IMF分量,它包含原始序列中最短的周期分量;否则将差值h1(t)视为原始负荷时间序列,重复步骤(1)~步骤(3),直到第k次迭代后的差值
Figure BDA0001693574580000042
满足IMF条件[2](该条件为本领域技术人员所公知,本发明实施例对此不做赘述)成为第一个IMF分量,记为:
Figure BDA0001693574580000043
通过限定标准差SD来判断筛选过程是否停止,以此判断差值
Figure BDA0001693574580000044
是否为IMF分量:
Figure BDA0001693574580000051
式中,
Figure BDA0001693574580000052
就是
Figure BDA0001693574580000053
的上下包络线的平均值,标准差SD的取值一般为0.2~0.3之间[3];
(5)从原始负荷时间序列x(t)中分离出第一个IMF分量imf1(t),即可得到x(t)的剩余分量r1(t);
r1(t)=x(t)-imf1(t) (5)
(6)将剩余分量r1(t)作为新的原始负荷时间序列,重复步骤(1)~步骤(5),直到剩余分量的幅值比预设值小或残余分量变为单调函数或常数为止,即可得到x(t)的所有IMF分量和剩余分量,该过程可以表示为:
Figure BDA0001693574580000054
其中,rn(t)为单调函数,模态数目n取决于原始负荷时间序列。
(7)则原始负荷时间序列x(t)可由IMF分量和剩余分量描述为:
Figure BDA0001693574580000055
经步骤(1)~(7)可将原始负荷时间序列分解为不同频率的子序列即IMF和残差r。
所述步骤S13,对各分量进行数据预处理形成各分量的原始输入特征集,具体步骤如图3所示包括:
S21:获取影响原始负荷时间序列变化的m个因素的数据;
S22:从各影响因素数据中取出对应原始负荷时间序列的n个数据元素,形成特征列向量;
S23:组合所述各影响因素特征数据,形成矩阵Fn×m
S24:数据归一化处理组合后的所述数据矩阵;
S25:取矩阵的每一列为一个特征即可获得所述原始特征集Fm={x1,x2…xm},其中xm为特征。
所述步骤S21,具体包括:影响原始负荷时间序列变化的因素有天气(温度,湿度,光照强度,风速)、需求侧管理(电价)、日类型以及近期负荷变化规律等;
所述天气因素的数据获取可以通过天气预报系统事先预知;
所述需求侧管理的数据可以通过电网相关部门获取;
为了便于数据处理可将所述日类型数据化(使用1和0分别表示节假日和非节假日,1~12依次表示一月至12月,1~7依次表示周一至周日,1~24依次表示一天中1至24小时);
所述近期负荷变化规律,遵循预测中“近小远大”的原则[4],即物理量未来的变化趋势更多地取决于历史时段中近期的发展规律,远期的历史数据与未来发展趋势的相关性较弱。本实施例考虑待预测时刻前一周的历史负荷数据时间序列作为影响因素特征。
所述步骤S22,本实施例以我国某地电网2017年4月1日至6月30日2184h负荷时间序列的实际数据作为实验数据集,每隔一小时取一个数据点,2184h负荷时间序列就有2184个数据元素,各影响因素数据就取负荷时间序列对应的2184(所述n=2184)个数据元素,以每个影响因素数据作为一个列向量,则m个因素构成m个特征列向量。
所述步骤S23,具体包括:将形成的m个因素构成的m个特征列向量组合为矩阵Fn×m
所述步骤S24,具体包括:根据公式(8)去除m个因素数据的不同量纲,并将其映射到0~1范围内;
Figure BDA0001693574580000061
式中,T为单个预测样本数据,Tn为数据样本的归一化参数,T'为样本数据的白化参数;
所述白化,一般为数据归一化前的重要一步,白化的原因是因为自然数据相邻元素之间有较大的相关性,通过白化可以降低数据的冗余性,使得数据更容易收敛。
所述步骤S25,具体包括:经所述步骤S24,形成归一化后的Fn×m矩阵,取矩阵的每一列为一个特征向量即可获得原始特征集合Fm={x1,x2…xm},其中xm为特征向量。
所述步骤S14,S15,S16,如图4所示具体步骤包括:
S31:采用增量搜索法从所述Fm中提取满足公式(9)的特征,形成候选特征集J;
所述公式(9)表示为:
Figure BDA0001693574580000062
其中,I(xi,y)指特征xi和目标变量y之间的互信息;n指特征个数;I(xj,xi)为互信息。
其中,
Figure BDA0001693574580000063
其中,p(xi)、p(y)和p(xi,y)分别为随机变量xi、y的边缘概率密度函数和联合概率密度函数。变量xi和变量y相关性越大,互信息的值I(xi,y)越大;两个变量相互独立时,互信息值为零,意味着两个变量之间不存在相互依赖关系。
S32:计算J中每个特征的mRMR值大小,并进行降序排列;
S33:依次选出J中mRMR值较大的特征,将其输入到PSO-LSSVM预测模型;
S34:根据公式(10),建立输入特征的数量与预测误差E的关系函数;
所述公式(10)表示为:
Figure BDA0001693574580000071
其中,yi为历史数据时间序列第i时刻的实际值;imfi′和imfi分别为各分量第i时刻的预测值和实际值;n指预测的时刻点数。
S35:依次选取各分量的所述预测误差最小时对应的特征数量,形成各分量的所述最佳输入特征集Q;
S36:将所述各分量的最佳输入特征集Q1,Q2…Qn分别输入所述PSO-LSSVM预测模型;
S37:得到所述各分量的预测结果Y1,Y2…Yn
S38:加权叠加各分量预测值得到最终预测结果
Figure BDA0001693574580000072
其中,ωi为权重,ωi∈(0,1)。
所述步骤S31,由于预测模型的输入特征会很大程度上影响短期负荷预测的准确性和效率,从原始数据中获得适当的影响负荷分量的特征因素,是进行负荷预测的一个关键步骤,最小冗余度最大相关性(mRMR)标准是使用互信息来测量两个变量之间依赖关系的方法,不仅考虑特征和目标变量之间的相关信息,而且获取特征之间的冗余信息;
由于mRMR的目标是从给定的特征集合中找出与目标变量有最大相关性且相互之间具有最小冗余度的特征,可使用增量搜索法搜索特征;
所述增量搜索法[5]搜索特征具体包括:假设已经从特征集合Fm中选取的n-1个特征共同构成特征集Jn-1,则根据增量搜索方法从集合{Fm-Jn-1}中选择第n个特征可用公式(9)表示,根据式(9)依次从特征集合Fm剩余的特征中搜索mRMR值最大的特征,最终得到的特征子集J即为候选特征集。
所述步骤S32,具体包括:在分别计算J中每个特征的mRMR值大小,并进行降序排列时,以分量imf5的候选特征集J为例,选取16个(由图5可看出:当imf5的输入特征数量为11个时,对应的预测误差最小;当超过11个后,预测误差会增大,因此没有必要列举过多的特征)特征进行mRMR值的降序排列,如图6所示;
所述图6中Lt-n(n=1,2,3,…)为待预测时刻前第n个小时对应的负荷特征;由于待预测时刻对应的日类型可提前预知,对应的温度可提前预测,则Tt为待预测时刻温度,Holidayt为待预测时刻是否为节假日,Montht为待预测时刻对应的月份,Weekdayt为待预测时刻对应的星期,Hourt为待预测时刻对应的小时;
所述计算mRMR值大小,具体包括:基于mRMR方法,最大相关性标准可通过特征xi和目标变量y之间的互信息的平均值表示为[6]
Figure BDA0001693574580000081
其中,xi指各分量的影响因素;y指各分量;特征集J指特征xi的集合:包含日类型特征信息数据(月,周,小时,节假日),天气特征信息数据(温度,湿度,光照强度,风速),需求侧管理信息数据(电价,激励措施)等;|J|指特征集J中的特征的数量;D指特征集J中各特征xi与目标变量y之间互信息的均值;I(xi,y)指特征xi和目标变量y之间的互信息。
所述互信息[7]是两个或多个随机变量之间交集部分的信息,在负荷预测中,互信息法用于捕获输入变量和目标变量之间的线性和非线性依赖程度,如果它们是独立的,互信息值为零;如果他们是依赖的,互信息值则对应于关系强度的正值。I(xi,y)可由下式求取:
Figure BDA0001693574580000082
其中,p(xi)、p(y)和p(xi,y)分别为随机变量xi、y的边缘概率分布和联合概率分布;变量xi和变量y相关性越大,互信息的值I(xi,y)越大;两个变量相互独立时,互信息值为零,意味着两个变量之间不存在相互依赖关系。
由于通过最大相关性标准[8]选择的特征可能具有一定的冗余度,而冗余特征并不能提高预测模型的精度,反而会降低精度并且会增加计算量;因此,在特征选择过程中,还需计算特征间的冗余度,最小冗余度需要每个特征xi之间的依赖关系达到最小,可由下式表示:
Figure BDA0001693574580000083
其中,I(xi,xj)为互信息,具体表达式参见上述计算公式,在此不做赘述。
则mRMR的值可由式(11)和式(13)表示为式(14),其单位:比特(bit)为信息量的度量单位;
maxψ(D,R),ψ=D-R (14)
其中,D为相关性;R为冗余度。公式(14)用于求取ψ的最大值。
所述步骤S33和S34,具体包括:由于J中特征xi的mRMR值大小不等,mRMR值较小的特征所包含的特征信息并不充分,若将该特征输入预测模型,会降低预测精度,因此需要从J中挑选出一定数量的特征,作为最佳特征集;考虑输入特征的数量对模型的预测精度和效率均有影响,本发明实施例选取各分量的绝对误差和实际负荷的比值的平均值,即公式(10),作为评判各分量输入特征的数量对其预测效果影响的依据。
如图6从左至右依次选出J中特征,输入到PSO-LSSVM预测模型[9],在根据公式(10),建立输入特征的数量与预测误差的关系函数,如图5所示。
所述PSO-LSSVM预测模型,具有泛化性能强和非线性拟合精度高的优势,在负荷预测研究中得到广泛应用。由于正则化参数和核函数参数在LSSVM建模中起着重要作用,可采用PSO算法[10]选择合适的参数,以降低负荷数据非线性、非平稳性对预测结果的影响。
由所述图2可看出:imf1~imf2分量的频率明显较高,而imf3~imf6和残差r分量的频率相对较低。由于对不同频率的分量选择恰当的模型的核函数,可提高预测精度,所以建立LSSVM预测模型时,imf1~imf2分量可选择有较好的局部自适应能力且学习能力较强的径向基核函数;imf3~imf6和残差r分量可选择适用于对低频信号进行建模的线性核函数。
所述LSSVM的核心思想是:通过一个非线性函数
Figure BDA0001693574580000091
将样本数据从一个原始特征空间映射到一个高维的特征空间;
建立该模型具体包括:设给定训练集为{xi,yi},其中xi∈Rm是模态分解后的输入样本
数据,yi∈R是相对应的输出数据。对这些样本点进行非线性回归估计时,LSSVM的
负荷预测线性回归函数可以表示为:
Figure BDA0001693574580000092
其中,w表示高维特征空间的权值向量;b表示偏差。
当使用LSSVM来解决回归优化问题时,优化目标函数中的损失函数就是误差的二次项,约束条件是等式约束,其优化问题可由下式表示为:
Figure BDA0001693574580000101
其中,J(w,e)是损失函数;ei是样本误差项;γ是正则化参数;
为了求解上述优化问题,引入Lagrange函数:
Figure BDA0001693574580000102
式中,αi为拉格朗日因子,根据Karush-Kuhn-Tucker条件,可以得到:
Figure BDA0001693574580000103
消去变量w和ei,优化问题可转化为如下线性方程:
Figure BDA0001693574580000104
式中,
Figure BDA0001693574580000105
是满足Mercer条件的核函数;α=[α12,...,αl]T
所述式(19)为线性方程组,可通过最小二乘法求出αi和b,则LSSVM的非线性负荷模型可表示为:
Figure BDA0001693574580000106
所述步骤S35,具体包括:依据图5依次选取各分量的E值最小时对应的特征数量,形成各个IMF分量和残差分量的最佳输入特征集Q,如下表所示;
Figure BDA0001693574580000107
Figure BDA0001693574580000111
由上表知:分量imf1~imf3和r的负荷时间序列变化规律主要受历史负荷影响,而分量imf4~imf6与日类型、温度和历史负荷关系紧密。
所述步骤S36、S37和S38,具体包括:所述最佳输入特征Q1,Q2…Qn确定后,通过PSO-LSSVM负荷预测模型先对各分量分别进行预测,得到所述各分量的预测结果Y1,Y2…Yn;根据上述公式(10)计算所述各分量的预测误差E1,E2…En;然后在根据公式
Figure BDA0001693574580000112
为所述各分量分配权重ω12…ωn;加权叠加各分量预测值得到最终预测结果
Figure BDA0001693574580000113
各分量的预测结果和加权叠加后最终预测结果如图6所示。
为了证明本发明提出的方法可行,选择了BP神经网络、LSSVM和PSO-LSSVM预测模型进行预测效果的对比。为了保证客观性,实验结果均为执行50次实验得到的平均值。图7为各个方法的预测结果对比分析图;
由所述图7可知,本发明方法拟合精度最好。
为了进一步证明本法的可行性,用上述三种方法和本方法对另外一组数据(某地2017年7月14日至20日连续一周的负荷)进行分别预测。各方法的预测误差比较,如下表所示;
Figure BDA0001693574580000114
Figure BDA0001693574580000121
由上表知:本方法比其他3种方法的预测误差明显要小;
本方法的平均绝对百分误差的总平均值为2.0944%,比BP神经网络的4.1957%、LSSVM的3.2515%、PSO-LSSVM的2.9037%都小。
如图8所示,本实施例还提供了一种基于人工智能的电力负荷预测装置,其具体包括:
S41:数据加工单元,用于异常数据点的辨识和修正;
S42:基于EMD数据分解单元,用于分解预测目标的原始负荷时间序列;
S43:数据预处理单元,用于处理各影响因素特征数据,获得所述原始特征集Fm
S44:基于mRMR提取最佳特征单元,用于从所述Fm中提取最佳特征集Q;
S45:最佳指标库单元,用于存放所述最佳特征集Q,作为下次预测参考;
S46:基于PSO-LSSVM模型预测单元,用于对所述各分量进行预测;
S47:加权叠加单元,用于叠加各分量负荷预测值得到最终预测结果。
所述步骤S41,具体包括:如图9所示;
S51:数据获取模块,用于从数据库中获取所述预测目标的原始负荷时间序列和所述m个影响因素的特征数据;
S52:异常数据点的辨识模块,用于从获取的数据中辨识出异常数据,可采用双向比较法来进行异常数据点的辨识,具体包括:
(1)选取所获取的m个影响因素的时间序列特征数据,根据需要选取θ值;
(2)按照公式(21),分别计算t时刻各影响因素的时间序列特征数据的平均值,得到阀值α(t);
(3)根据公式(22)和(23)判断t时刻各影响因素的时间序列特征数据是否异常,分别记录正常数据和异常数据;
所述公式(21)表示为:
Figure BDA0001693574580000122
所述公式(22)表示为:|L(i,t)-L(i,t-1)|≥θ*α(t);
所述公式(23)表示为:
Figure BDA0001693574580000123
式(21)、(22)和(23)中L(i,t)为第i月t时刻对应的数据值(i=1,2,…,n);阈值α(t)为t时刻各影响因素的时间序列特征数据的平均值;θ为人为规定的参数,通过调整θ值的大小可以改变辨识与修正的程度,θ值越大,修正的程度越低;
S53:异常数据点的修正模块,用于修正辨识出的所述异常数据,具体包括:
(4)将异常数据按照公式(24)进行修正,作为判断下一时刻数据的基准值;
所述公式(24)表示为:
Figure BDA0001693574580000131
其中L(j,t)是经判断后t时刻的正常数据,k为t时刻正常数据的个数;
(5)重复步骤(2)~(4)直至所有数据修复完成。
所述步骤S42,具体程序执行过程包括:
[loaddata,~,~]=xlsread('data.xls');%读取Excel文件中的特征数据
Load_col=6;%原始负荷时间序列所在的列的位置
t=0:1:(30+60)*24;%本实施例以某地区2017年4月1日至6月30日3个月的数据为原始负荷时间序列,一天取24个点,连续90天的负荷数据共2184个数据点
Load_y=loaddata(1:2184,Load_col)';%读取原始负荷时间序列
imf=emd(Load_y);%EMD分解原始负荷时间序列
my_emd_visu(Load_y,t,imf)%EMD专用画图函数,如图2所示
所述步骤S43,具体包括:如图10所示;
S61:数据组合模块,用于组合所述各影响因素特征数据,形成矩阵Fn×m,具体程序执行过程包括;
x=[Calendar,Weather,Price,Load];%组合日类型、天气、电价以及待预测前一周历史负荷数据
S62:数据归一化模块,根据公式(8)消除不同因素的量纲和限制数据范围,以便于数据处理,具体程序执行过程包括;
[x_scale,ps1]=mapminmax(x',0,1);
[y_scale,ps2]=mapminmax(Load_y,0,1);%将其映射到0~1范围内。
S63:原始特征集输出模块,用于提取并输出所述原始特征集Fm,具体包括:
经所述数据归一化,形成归一化后的Fn×m矩阵,取矩阵的每一列为一个特征向量即可获得原始特征集合Fm={x1,x2…xm},其中xm为特征向量。
所述步骤S44,具体包括:如图11所示;
S71:增量搜索模块,用于提取所述候选特征集J,具体包括:
假设已经从特征集合Fm中选取的n-1个特征共同构成特征集Jn-1,则根据增量搜索方法从集合{Fm-Jn-1}中选择第n个特征可用公式(9)表示,根据式(9)依次从特征集合Fm剩余的特征中搜索mRMR值最大的特征,最终得到的特征子集J即为候选特征集;
S72:mRMR值排序模块,根据公式(14)计算所述J中每个特征的mRMR值大小,并进行降序排列,如图12所示;
S73:PSO-LSSVM预测模块,用于预测从所述J中依次选出的特征;
S74:建立关系函数模块,用于建立输入特征的数量与预测误差E的关系函数;
如图12从左至右依次选出J中特征,输入到PSO-LSSVM预测模型,在根据公式(10),建立输入特征的数量与预测误差的关系函数,如图5所示;
S75:最佳输入特征集输出模块,用于选取所述各分量的预测误差E最小时对应的特征数量,形成各分量的最佳输入特征集Q,具体包括:
依据图11依次选取各分量的E值最小时对应的特征数量,形成各个IMF分量和残差分量的最佳输入特征集Q。
所述步骤S45,具体包括:
将负荷预测的每一天的最佳特征集Q导入最佳指标库,防止数据收集装置出现故障导致数据中断,若数据中断发生最佳指标库中根据相似日匹配最佳特征集。
所述步骤S46和S47,具体包括:
将所述各分量的最佳输入特征集Q1,Q2…Qn分别输入所述PSO-LSSVM预测模型;
得到所述各分量的预测结果Y1,Y2…Yn
根据上述公式(10)计算所述各分量的预测误差E1,E2…En
根据公式
Figure BDA0001693574580000141
为所述各分量分配权重ω12…ωn
加权叠加各分量预测值得到最终预测结果
Figure BDA0001693574580000142
上述的一种基于人工智能的电力负荷预测装置,将电力负荷预测任务分配到每个单元执行,每个单元在细化到具体的任务模块,依次执行,完成了本发明将数据处理方法EMD、特征提取方法mRMR和预测模型PSO-LSSVM组合进行电力负荷预测的任务。本发明可减少预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高预测精度。
参考文献
[1]Niu D,Dai S.A.Short-term load forecasting model with a modifiedparticle swarm optimization algorithm and least squares support vectormachine based on the denoising method of empirical mode decomposition andgrey relational analysis[J].Energies,2017,10.
[2]X Qiu,P N Suganthan and G A J Amaratunga,Electricity load demandtime series forecasting with empirical mode decomposition based random vectorfunctional link network[J].IEEE International Conference on Systems,2016,1394-1399.
[3]杨茂,陈郁林.基于EMD分解和集对分析的风电功率实时预测[J].电工技术学报,2016,31(21):86-93.
YANG Mao,CHEN Yulin.Real-time wind power forecasting based on EMDdecomposition and set pair analysis[J].Transactions of China ElectrotechnicalSociety,2016,31(21):86-93.
[4]康重庆,夏清,刘梅.电力系统负荷预测[M].北京:中国电力出版社,2017.KANGChongqing,XIA Qing,LIU Mei.Power system load forecast[M].Beijing:ChinaElectric Power Press,2017.
[5]Peng H,Long F,Ding C.Feature selection based on mutualinformationcriteria of max-dependency,max-relevance,and min-redundancy[J].IEEE Transactions on Pattern Analysis&Machine Intelligence,2005,27(8):1226-1238.
[6]李扬,顾雪平.基于改进最大相关最小冗余判据的暂态稳定评估特征选择[J].中国电机工程学报,2013,33(34):179-186+27.
LI Yang,GU Xueping.Transient stability evaluation feature Selectionbased on improved maximum dependent minimum redundancy criterion[J].ChineseJournal of Electrical Engineering,2013,33(34):179-186+27.Electric PowerSystems and Automation,2017,29(7):7-12.
[7]Keqiang Dong,LinanLong,Hong Zhang,You Gao.The mutualinformationbased minimum spanning tree to detectand evaluate dependenciesbetween aero-engine gas path system variables[J].Physica A:StatisticalMechanics and its Applications,2018,506.
[8]王琦,关添升,秦本双.基于MRMR的ORELM的短期风速预测[J].可再生能源,2018,36(01):85-90.
WANG Qi,GUAN Tiansheng,QIN Benshuang.Short-term wind speed predictionbased on MRMR ORELM[J].Renewable Energy,2018,36(01):85-90.
[9]马小津,朱博,等.基于改进PSO-LSSVM的短期电力负荷预测[J].控制理论与应用,2016,35(3):5-9,+11.
MA Xiaojin,ZHU Bo,et al.Short-term power load forecasting based onimproved PSO-LSSVM[J].Control Theory and Applications,2016,35(3):5-9,+11.
[10]张永峰,崔凯.应用共识PSO协同Trust-Tech方法的短期负荷预测[J].电力系统及其自动化学报.2017,29(7):7-12.
ZHANG Yongfeng,CUI Kai.Short-term load forecasting using consensusPSO and Trust-Tech method[J].Journal ofElectric Power Systems and Automation,2017,29(7):7-12.
本发明实施例对各器件的型号除做特殊说明的以外,其他器件的型号不做限制,只要能完成上述功能的器件均可。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于人工智能的电力负荷预测方法,其特征在于,所述方法包括以下步骤:
通过数据采集与监视控制系统或高级量测体系获得原始负荷时间序列;
电力负荷可视为由若干个本征模函数组成的一个时间序列,利用经验模态分解将原始负荷时间序列分解成本征模函数分量和残差分量;
对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集;
运用最小冗余度最大相关性标准从原始输入特征集中提取各分量的最佳输入特征集;
根据各分量的频率选择预测模型的核函数,建立粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型;
采用粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型对每个分量分别进行负荷预测,加权叠加所有分量的预测值得到最终的预测结果;
其中,对给定的原始负荷时间序列进行分解的具体步骤如下:
(1)找出原始负荷时间序列x(t)中所有局部极大值和局部极小值,并通过三次样条函数分别拟合x(t)的上包络线eup(t)和下包络线elow(t);
(2)计算上包络线eup(t)和下包络线elow(t)的平均值m1(t);
Figure FDA0003351407700000011
(3)计算原始负荷时间序列x(t)和包络线均值m1(t)的差值h1(t);
h1(t)=x(t)-m1(t) (2)
(4)如果差值h1(t)满足IMF条件,那么差值h1(t)就是求得的第一个IMF分量,它包含原始序列中最短的周期分量;否则将差值h1(t)视为原始负荷时间序列,重复步骤(1)~步骤(3),直到第k次迭代后的差值
Figure FDA0003351407700000012
满足IMF条件成为第一个IMF分量,记为:
Figure FDA0003351407700000013
通过限定标准差SD来判断筛选过程是否停止,以此判断差值
Figure FDA0003351407700000014
是否为IMF分量:
Figure FDA0003351407700000015
式中,
Figure FDA0003351407700000016
就是
Figure FDA0003351407700000017
的上下包络线的平均值;
(5)从原始负荷时间序列x(t)中分离出第一个IMF分量imf1(t),即可得到x(t)的剩余分量r1(t);
r1(t)=x(t)-imf1(t) (5)
(6)将剩余分量r1(t)作为新的原始负荷时间序列,重复步骤(1)~步骤(5),直到剩余分量的幅值比预设值小或残余分量变为单调函数或常数为止;
得到x(t)的所有IMF分量和剩余分量,该过程表示为:
Figure FDA0003351407700000021
其中,rn(t)为单调函数,模态数目n取决于原始负荷时间序列;
(7)则原始负荷时间序列x(t)由IMF分量和剩余分量描述为:
Figure FDA0003351407700000022
经步骤(1)~(7)将原始负荷时间序列分解为不同频率的子序列即IMF和残差r。
2.根据权利要求1所述的一种基于人工智能的电力负荷预测方法,其特征在于,所述对本征模函数分量和残差分量分别进行数据预处理形成各分量的原始输入特征集的步骤具体为:
获取影响原始负荷时间序列变化的m个因素的数据;从各影响因素数据中取出对应原始负荷时间序列的n个数据元素,形成特征列向量;
组合所述各影响因素特征数据,形成矩阵Fn×m;数据归一化处理组合后的所述数据矩阵;
取矩阵的每一列为一个特征即可获得所述原始特征集Fm={x1,x2…xm},其中xm为特征。
3.根据权利要求1所述的一种基于人工智能的电力负荷预测方法,其特征在于,所述方法将数据处理方法与智能预测方法相结合,减少了预测模型的输入特征数量,从而提高预测的效率,同时可充分考虑不同外部敏感因素的影响,提高了预测精度。
4.一种基于人工智能的电力负荷预测装置,其特征在于,所述装置包括:
数据加工单元,用于异常数据点的辨识和修正;
基于经验模态分解数据分解单元,用于分解预测目标的原始负荷时间序列;
数据预处理单元,用于处理各影响因素特征数据,获得所述原始特征集;
基于最小冗余度最大相关性标准提取单元,用于从所述原始特征集中提取最佳特征集;
最佳指标库单元,用于存放所述最佳特征集,作为下次预测参考;
基于粒子群算法-参数寻优的最小二乘支持向量机负荷预测模型预测单元,用于对各分量进行预测;
加权叠加单元,用于叠加各分量负荷预测值得到最终预测结果;
其中,用于分解预测目标的原始负荷时间序列如下:
(1)找出原始负荷时间序列x(t)中所有局部极大值和局部极小值,并通过三次样条函数分别拟合x(t)的上包络线eup(t)和下包络线elow(t);
(2)计算上包络线eup(t)和下包络线elow(t)的平均值m1(t);
Figure FDA0003351407700000031
(3)计算原始负荷时间序列x(t)和包络线均值m1(t)的差值h1(t);
h1(t)=x(t)-m1(t) (2)
(4)如果差值h1(t)满足IMF条件,那么差值h1(t)就是求得的第一个IMF分量,它包含原始序列中最短的周期分量;否则将差值h1(t)视为原始负荷时间序列,重复步骤(1)~步骤(3),直到第k次迭代后的差值
Figure FDA0003351407700000032
满足IMF条件成为第一个IMF分量,记为:
Figure FDA0003351407700000033
通过限定标准差SD来判断筛选过程是否停止,以此判断差值
Figure FDA0003351407700000034
是否为IMF分量:
Figure FDA0003351407700000035
式中,
Figure FDA0003351407700000036
就是
Figure FDA0003351407700000037
的上下包络线的平均值;
(5)从原始负荷时间序列x(t)中分离出第一个IMF分量imf1(t),即可得到x(t)的剩余分量r1(t);
r1(t)=x(t)-imf1(t) (5)
(6)将剩余分量r1(t)作为新的原始负荷时间序列,重复步骤(1)~步骤(5),直到剩余分量的幅值比预设值小或残余分量变为单调函数或常数为止;
得到x(t)的所有IMF分量和剩余分量,该过程表示为:
Figure FDA0003351407700000041
其中,rn(t)为单调函数,模态数目n取决于原始负荷时间序列;
(7)则原始负荷时间序列x(t)由IMF分量和剩余分量描述为:
Figure FDA0003351407700000042
经步骤(1)~(7)将原始负荷时间序列分解为不同频率的子序列即IMF和残差r。
CN201810602426.2A 2018-06-12 2018-06-12 一种基于人工智能的数据预测方法及装置 Active CN108694470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810602426.2A CN108694470B (zh) 2018-06-12 2018-06-12 一种基于人工智能的数据预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810602426.2A CN108694470B (zh) 2018-06-12 2018-06-12 一种基于人工智能的数据预测方法及装置

Publications (2)

Publication Number Publication Date
CN108694470A CN108694470A (zh) 2018-10-23
CN108694470B true CN108694470B (zh) 2022-02-22

Family

ID=63848835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810602426.2A Active CN108694470B (zh) 2018-06-12 2018-06-12 一种基于人工智能的数据预测方法及装置

Country Status (1)

Country Link
CN (1) CN108694470B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783485A (zh) * 2018-12-30 2019-05-21 国网天津市电力公司电力科学研究院 基于数据挖掘和支持向量机的配网历史量测数据校正方法
CN110095436A (zh) * 2019-05-30 2019-08-06 江南大学 苹果轻微损伤分类方法
CN110990781B (zh) * 2019-11-07 2024-01-05 深圳供电局有限公司 一种电动汽车充电负荷预测方法及其系统、存储介质
CN111160626B (zh) * 2019-12-10 2024-02-02 天津大学 一种基于分解融合的电力负荷时间序列控制方法
CN111178641B (zh) * 2020-01-03 2023-11-24 江南大学 基于特征提取和多核rsvr组合模型的短期电力负荷预测方法
CN111445078A (zh) * 2020-03-31 2020-07-24 国网河北省电力有限公司 基于长短期记忆神经网络的综合能源系统多元负荷预测方法
CN113269227A (zh) * 2021-04-15 2021-08-17 国网浙江省电力有限公司电力科学研究院 小微型负荷时空用电行为非侵入式深度分解方法及系统
CN114722876A (zh) * 2022-04-21 2022-07-08 沈阳顺义科技有限公司 一种旋转机械的状态预测和模式分类方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730130A (zh) * 2013-12-20 2014-04-16 中国科学院深圳先进技术研究院 一种病理嗓音的检测方法和系统
CN107239854A (zh) * 2017-05-22 2017-10-10 华北电力大学 基于emd‑gra‑mpso‑lssvm模型的负荷预测方法
CN107609671A (zh) * 2017-08-10 2018-01-19 燕山大学 一种基于综合因素评价模型的短期电力负荷预测方法
CN108038568A (zh) * 2017-12-05 2018-05-15 国家电网公司 一种基于粒子群算法的变权组合电力负荷短期预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI542887B (zh) * 2014-07-10 2016-07-21 國立成功大學 馬達故障檢測方法與馬達故障檢測系統

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103730130A (zh) * 2013-12-20 2014-04-16 中国科学院深圳先进技术研究院 一种病理嗓音的检测方法和系统
CN107239854A (zh) * 2017-05-22 2017-10-10 华北电力大学 基于emd‑gra‑mpso‑lssvm模型的负荷预测方法
CN107609671A (zh) * 2017-08-10 2018-01-19 燕山大学 一种基于综合因素评价模型的短期电力负荷预测方法
CN108038568A (zh) * 2017-12-05 2018-05-15 国家电网公司 一种基于粒子群算法的变权组合电力负荷短期预测方法

Also Published As

Publication number Publication date
CN108694470A (zh) 2018-10-23

Similar Documents

Publication Publication Date Title
CN108694470B (zh) 一种基于人工智能的数据预测方法及装置
CN110163429B (zh) 一种基于相似日优化筛选的短期负荷预测方法
CN111915092B (zh) 基于长短时记忆神经网络的超短期风电功率预测方法
CN106980910B (zh) 中长期电力负荷测算系统及方法
CN115270965A (zh) 一种配电网线路故障预测方法和装置
CN110689190A (zh) 一种电网负荷预测方法、装置及相关设备
CN111525587B (zh) 一种基于无功负荷态势的电网无功电压控制方法及系统
CN111160626B (zh) 一种基于分解融合的电力负荷时间序列控制方法
CN114595623A (zh) 一种基于XGBoost算法的机组设备基准值预测方法及系统
CN111178585A (zh) 基于多算法模型融合的故障接报量预测方法
CN114881101A (zh) 一种基于仿生搜索的电力系统典型场景关联特征选择方法
Šebalj et al. Analysis of methods and techniques for prediction of natural gas consumption: a literature review
CN114021483A (zh) 基于时域特征与XGBoost的超短期风电功率预测方法
CN110705859A (zh) 基于pca-自组织神经网络的中低压配电网运行状态评估方法
Shou et al. Forecasting the price trends of digital currency: a hybrid model integrating the stochastic index and grey Markov chain methods
CN114154716B (zh) 一种基于图神经网络的企业能耗预测方法及装置
CN112330030B (zh) 业扩物资需求预测系统及方法
CN110781206A (zh) 一种学习拆回表故障特征规则预测在运电能表是否故障的方法
CN116826745B (zh) 一种电力系统背景下的分层分区短期负荷预测方法及系统
CN111585277B (zh) 一种基于混合集成模型的电力系统动态安全评估方法
CN112633528A (zh) 基于支持向量机的电网一次设备运维检修成本确定方法
CN116823008A (zh) 一种园区能源利用效率评估方法、系统、设备和存储介质
CN115994784A (zh) 一种价格确定模型及其构建方法
Liu et al. Analysis and prediction of power distribution network loss based on machine learning
CN108123436B (zh) 基于主成分分析和多元回归算法的电压越限预测模型

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant