CN112183846B - 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 - Google Patents

基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 Download PDF

Info

Publication number
CN112183846B
CN112183846B CN202011021199.8A CN202011021199A CN112183846B CN 112183846 B CN112183846 B CN 112183846B CN 202011021199 A CN202011021199 A CN 202011021199A CN 112183846 B CN112183846 B CN 112183846B
Authority
CN
China
Prior art keywords
test
class
train
data
training set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011021199.8A
Other languages
English (en)
Other versions
CN112183846A (zh
Inventor
何耀耀
张婉莹
王云
肖经凌
周京京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202011021199.8A priority Critical patent/CN112183846B/zh
Publication of CN112183846A publication Critical patent/CN112183846A/zh
Application granted granted Critical
Publication of CN112183846B publication Critical patent/CN112183846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于模糊C均值聚类的TVF‑EMD‑MCQRNN负荷概率预测方法,包括:1对电力负荷及其影响因子进行预处理后按设定时间间隔进行分组;2对分组后的数据集划分训练集和测试集,使用模糊C均值聚类法分别对每组训练集和测试集进行聚类;3利用各类型训练集和测试集样本数据对TVF‑EMD‑MCQRNN模型进行训练和测试,得到各类型样本数据在不同分位点下的一系列条件分位数;4对各类型样本数据在相同分位点下的条件分位数分别进行求和得到各类型预测结果,从而实现概率密度预测。本发明能提高负荷预测的准确性,从而为电力系统的运行规划提供更全面、更有效的负荷信息。

Description

基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法
技术领域
本发明属于短期电力负荷预测技术领域,具体的说是一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法。
背景技术
电力负荷预测是电力系统规划的重要组成部分,在现代电力系统的能源分配和管理中起着至关重要的作用。高精度的负荷预测有利于电力系统在满足用户用电需求的同时制定合理的发电计划,从而有效地控制电力系统的规划和运行成本。然而随着新能源,如风能、太阳能等间歇性能源大规模接入电网,给电网的安全稳定、经济运行都带来了极大的挑战。相较于一般的电力负荷点预测方法,概率性负荷预测方法能反映负荷的不确定性特征,从而为电力系统可靠性分析、风险评估提供更科学的决策依据。
然而,随着电力系统规模的不断增加以及新兴技术的飞速发展,传统电力负荷预测技术受限于当前的电力环境,难以适应现代电力负荷数据非线性、随机性以及混沌性的特征合理进行建模,因此,为得到更加精确的负荷预测结果,需要不断更新优化负荷预测算法研究以保持先进性。此外,电力负荷的影响因素越来越复杂,这些因素对负荷精度的影响程度是模糊的,单一的预测模型已无法满足现代负荷预测的需求。大多数相关研究是由智能算法预测模型进行优化来提高负荷预测的精度,并没有对这些不确定因素进行预处理,忽略了历史负荷数据本身的信息价值。同时,电力负荷数据的分析难度也越来越来大,普通的数据预处理难以充分挖掘数据本身价值。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法,以期能充分考虑影响因素对负荷预测准确性的影响,同时有效地避免分位数交叉现象的产生,从而进一步提高负荷预测的准确性,为电力系统的运行规划提供更全面、更有效的负荷信息。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法的特点在于:包括以下步骤:
步骤1.获取电力负荷数据及其影响因子并进行预处理,从而得到预处理后的数据集Dataset={[Gm(t),P(t)]|t=1,2,...,T;m=1,2,...,M},包括:预处理后的电力负荷{P(t)|t=1,2,...,T}和电力负荷的M个影响因子{Gm(t)|m=1,2,...,M;t=1,2,...,T},其中,P(t)和Gm(t)分别为第t个时刻点的电力负荷及相应第t个时刻点的第m个影响因子;T′表示时刻点的个数,M表示电力负荷影响因子的种类数;
步骤2.设定时间间隔为s个时刻点,对所述预处理后的数据集Dataset进行分组,从而得到I组样本数据,且I满足[T′/s],其中,第i组样本数据表示为Dataseti=[G′m(i),P′(i)],G′m(i)=(Gm(s×(i-1)+1),Gm(s×(i-1)+2),…,Gm(s×i))T为第i组样本数据的第m个影响因子,Gm(s×i)表示在第s×i个时刻点的第m个影响因子,P′(i)=(P(s×(i-1)+1),P(s×(i-1)+2),…,P(s×i))T为第i组样本数据的电力负荷;P(s×i)表示在第s×i个时刻点的电力负荷,i=1,2,...,I;
步骤3.对I组样本数据{Dataseti|i=1,2,...,I}划分为训练集Train={Dataseti|i=1,2,...,p}和测试集Test={Dataseti|i=p+1,p+2,...,I},则训练集Train中含有p组样本数据,测试集Test中含有I-P组样本数据;
使用模糊C均值聚类法分别对训练集Train和测试集Test进行聚类得到K类样本数据,包括:K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K};
Figure GDA0003404561930000021
表示第k类的训练集,Ak为训练集Train的p组样本数据中属于第k类训练集的样本数据的序号集合,
Figure GDA0003404561930000022
表示第k类样本数据中第i组的第m个影响因子,Pk(i)表示第k类样本数据中第i组的电力负荷,
Figure GDA0003404561930000023
为第k类的测试集;Bk为测试集Test的I-P组样本数据中属于第k类测试集的样本数据的序号集合;
步骤4.利用K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K}分别对TVF-EMD-MCQRNN模型进行训练和测试:
步骤4.1.对第k类的训练集Traink和第k类的测试集Testk中的电力负荷{Pk(i)|i∈Ak∪Bk}进行TVF-EMD分解获得N个本征模态分量
Figure GDA0003404561930000024
其中,
Figure GDA0003404561930000025
表示对第k类的训练集Traink和第k类的测试集Testk进行TVF-EMD分解得到的第n个本征模态分量的第i组数据;则将第k类的训练集Traink和测试集Testk分别更新为
Figure GDA0003404561930000031
Figure GDA0003404561930000032
步骤4.2.将更新后的第k类训练集Train′k中第n个负荷本征模态分量
Figure GDA0003404561930000033
作为第k类训练集Train′k的响应变量,第k类训练集Train′k剩余的M个负荷影响因子
Figure GDA0003404561930000034
及N-1个负荷分量
Figure GDA0003404561930000035
的组合作为第k类训练集Train′k的解释变量,从而构建N个包含有M+N-1个解释变量和一个响应变量的数据集,记作
Figure GDA0003404561930000036
其中,
Figure GDA0003404561930000037
表示更新后的第k类训练集Train′k中构建的第n个数据集的第i组解释变量;且
Figure GDA0003404561930000038
Figure GDA0003404561930000039
是更新后的第k类训练集Train′k中构建的第n个数据集的第i组的第α个解释变量,
Figure GDA00034045619300000310
是更新后的第k类训练集Train′k中构建的第n个数据集的第i组响应变量;
同理对更新后的第k类测试集Test′k也构建出N个包括M+N-1个解释变量和一个响应变量的数据集,记作
Figure GDA00034045619300000311
其中,
Figure GDA00034045619300000312
是更新后的第k类测试集Test′k中构建的第n个数据集的第i组解释变量,
Figure GDA00034045619300000313
是更新后的第k类测试集Test′k中构建的第n个数据集的第i组响应变量;
步骤4.3将第α个解释变量
Figure GDA00034045619300000314
分为两组解释变量:
Figure GDA00034045619300000315
Figure GDA00034045619300000316
其中,Q为第α个解释变量
Figure GDA00034045619300000317
中具有单调递增关系的解释变量的序号集合,L为解释变量
Figure GDA00034045619300000318
中无单调约束的解释变量的序号集合,从而利用更新后的第k类训练集Train′k中构建的第n个数据集
Figure GDA00034045619300000319
对如式(1)所示单调复合分位数回归神经网络MCQRNN预测模型进行训练,从而得到训练后的MCQRNN预测模型;
Figure GDA00034045619300000320
式(1)中,h1(·)表示隐含层的激活函数,h2(·)表示输出层的激活函数;
Figure GDA00034045619300000321
代表第z个分位点,且z=1,2,…,Z,Z为分位点的数量;J为隐含层节点的个数,b′和b分别是隐含层和输出层的截距项,权向量Uk,nz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接输入层和隐含层的权向量集合,并有:
Figure GDA0003404561930000041
式(2)中,
Figure GDA0003404561930000042
表示更新后的第k类训练集Train′k中的第n个数据集在第q个输入层节点与第j个隐含层节点之间的权重,
Figure GDA0003404561930000043
表示更新后的第k类训练集Train′k中的第n个数据集在第l个输入层节点与第j个隐含层节点之间的权重,并有:
Figure GDA0003404561930000044
式(3)中,Vk,nz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接隐含层与输出层之间的权向量集合,其中,
Figure GDA0003404561930000045
表示更新后的第k类训练集Train′k中的第n个数据集在第j个隐含层节点与输出层之间的权重;
通过式(4)对式(1)进行优化求解,从而得到权重参数集合Uk,nz)和Vk,nz)的估计值
Figure GDA0003404561930000046
Figure GDA0003404561930000047
Figure GDA0003404561930000048
式(4)中,R为更新后的第k类训练集Train′k中序号集合Ak的序号数量,
Figure GDA0003404561930000049
是损耗函数;
步骤4.4.将更新后的第k类测试集Test′k中构建的N个数据集
Figure GDA00034045619300000410
中的第i组解释变量
Figure GDA00034045619300000411
输入所述训练后的MCQRNN预测模型中,从而得到更新后的K类测试集中N个数据集分别在Z个分位点下的条件分位数
Figure GDA00034045619300000412
其中,
Figure GDA00034045619300000413
表示更新后的第k类测试集Test′k中构建的第n个数据集在第z个分位点τz下的条件分位数预测结果;
Figure GDA00034045619300000414
Figure GDA00034045619300000415
分别表示权向量集合Uk,nz)和Vk,nz)的估计值;
步骤5.利用式(5)将更新后的第k类测试集Test′k中在相同分位点下的条件分位数预测结果相加,从而得到第i组样本数据Dataseti在第z个分位点下的条件分位数最终预测结果
Figure GDA0003404561930000051
进而得到第i组样本数据Dataseti在Z个分位点下的条件分位数最终预测结果
Figure GDA0003404561930000052
Figure GDA0003404561930000053
步骤6.将Z个分位点下的条件分位数最终预测结果
Figure GDA0003404561930000054
作为Epanechnikov核函数的输入变量;利用式(6)计算更新后的第k类测试集Test′k中任意一点r的电力负荷概率密度预测结果
Figure GDA0003404561930000055
Figure GDA0003404561930000056
式(8)中,光滑参数d为带宽,C(·)为Epanechnikov核函数。
与现有技术相比,本发明的有益效果在于:
1.本发明采用的模糊C均值聚类算法是一种基于划分的聚类算法,通过对数据对象之间的距离迭代计算,使得具有相似特征的数据聚为一类,利用模糊C均值聚类算法对电力负荷及其影响因子进行聚类分析,再依据各类样本数据特点选取合适的方法进行管理和预测,从而提高了预测效率和精度。
2.本发明利用TVF-EMD方法对具有波动性和随机性的电力负荷进行分解,全面分析和利用电力负荷的数据信息,获得若干特征互异的平稳子序列,使得原始电力负荷时间序列中各特征尺度间信息解耦,保证了分解结果的有效性,从而能够细致把握电力负荷的变化特征。
3.本发明使用的单调复合分位数回归神经网络方法,通过从标准分位数回归神经网络模型、单调多层感知器、复合分位数回归神经网络、期望回归神经网络和广义加性神经网络中提取元素进行了新的组合,并结合核密度估计实现了电力负荷的非参数概率性预测。此外,该方法避免了多种分位数回归方法中常出现的分位数交叉问题,更有效地量化电力系统的不确定性,使预测结果更准确。
附图说明
图1为本发明的整体流程图。
具体实施方式
本实施例中,一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法,如图1所示,是按如下步骤进行:
步骤1.获取电力负荷数据及其影响因子并进行预处理,从而得到预处理后的数据集Dataset={[Gm(t),P(t)]|t=1,2,...,T;m=1,2,...,M},包括:预处理后的电力负荷{P(t)|t=1,2,...,T}和电力负荷的M个影响因子{Gm(t)|m=1,2,...,M;t=1,2,...,T},其中,P(t)和Gm(t)分别为第t个时刻点的电力负荷及相应第t个时刻点的第m个影响因子;T′表示时刻点的个数,M表示电力负荷影响因子的种类数;
步骤2.设定时间间隔为s个时刻点,对预处理后的数据集Dataset进行分组,从而得到I组样本数据,且I满足[T′/s],其中,第i组样本数据表示为Dataseti=[G′m(i),P′(i)],G′m(i)=(Gm(s×(i-1)+1),Gm(s×(i-1)+2),...,Gm(s×i))T为第i组样本数据的第m个影响因子,Gm(s×i)表示在第s×i个时刻点的第m个影响因子,P′(i)=(P(s×(i-1)+1),P(s×(i-1)+2),…,P(s×i))T为第i组样本数据的电力负荷;P(s×i)表示在第s×i个时刻点的电力负荷,i=1,2,...,I;
步骤3.对I组样本数据{Dataseti|i=1,2,...,I}划分为训练集Train={Dataseti|i=1,2,...,p}和测试集Test={Dataseti|i=p+1,p+2,...,I},则训练集Train中含有p组样本数据,测试集Test中含有I-P组样本数据;
使用模糊C均值聚类法分别对训练集Train和测试集Test进行聚类,步骤为:
(1)以训练集Train为例,假设训练集Train被划分为K类,记作{Traink|k=1,2,...,K},令第k类训练集样本Traink的中心点为χk,则训练集Train中任意一组Dataseti,i=1,2,...,p与第k类训练集样本Traink的中心点χk的隶属度为uki
(2)先随机初始化一个满足约束条件(1)的uki值,然后根据式(2)计算出χk的值;
Figure GDA0003404561930000061
Figure GDA0003404561930000062
式(2)中,σ为隶属度uki的指数权重因子。
(3)将步骤(2)得到的χk作为输入,根据式(3)计算出新的uki值;
Figure GDA0003404561930000071
(4)式(4)中
Figure GDA0003404561930000072
表示训练集Train中任意一组Dataseti,i=1,2,...,p到第k类训练集样本Traink的中心点χk的加权平方距离之和,根据式(4)计算出目标函数φ值;
Figure GDA0003404561930000073
(5)再次根据式(2)、式(3)和式(4)迭代计算出χk、uki
Figure GDA0003404561930000074
的值,如此循环迭代计算,当
Figure GDA0003404561930000075
达到最小值时停止计算,输出χk和uki的值,完成聚类。
通过模糊C均值聚类法分别对训练集Train和测试集Test进行聚类后得到K类样本数据,包括:K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K};
Figure GDA0003404561930000076
表示第k类的训练集,Ak为训练集Train的p组样本数据中属于第k类训练集的样本数据的序号集合,
Figure GDA0003404561930000077
表示第k类样本数据中第i组的第m个影响因子,Pk(i)表示第k类样本数据中第i组的电力负荷,
Figure GDA0003404561930000078
为第k类的测试集;Bk为测试集Test的I-P组样本数据中属于第k类测试集的样本数据的序号集合;
步骤4.利用K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K}分别对TVF-EMD-MCQRNN模型进行训练和测试:
步骤4.1.对第k类的训练集Traink和第k类的测试集Testk中的电力负荷{Pk(i)|i∈Ak∪Bk}进行TVF-EMD分解,获得N个本征模态分量
Figure GDA0003404561930000079
其中,
Figure GDA00034045619300000710
表示对第k类的训练集Traink和第k类的测试集Testk进行TVF-EMD分解得到的第n个本征模态分量的第i组数据;则将第k类的训练集Traink和测试集Testk分别更新为
Figure GDA00034045619300000711
Figure GDA00034045619300000712
步骤4.2.将更新后的第k类训练集Train′k中第n个负荷本征模态分量
Figure GDA0003404561930000081
作为第k类训练集Train′k的响应变量,第k类训练集Train′k剩余的M个负荷影响因子
Figure GDA0003404561930000082
及N-1个负荷分量
Figure GDA0003404561930000083
的组合作为第k类训练集Train′k的解释变量,从而构建N个包含有M+N-1个解释变量和一个响应变量的数据集,记作
Figure GDA0003404561930000084
其中,
Figure GDA0003404561930000085
表示更新后的第k类训练集Train′k中构建的第n个数据集的第i组解释变量;且
Figure GDA0003404561930000086
Figure GDA0003404561930000087
是更新后的第k类训练集Train′k中构建的第n个数据集的第i组的第α个解释变量,
Figure GDA0003404561930000088
是更新后的第k类训练集Train′k中构建的第n个数据集的第i组响应变量;
同理对更新后的第k类测试集Test′k也构建出N个包括M+N-1个解释变量和一个响应变量的数据集,记作
Figure GDA0003404561930000089
其中,
Figure GDA00034045619300000810
是更新后的第k类测试集Test′k中构建的第n个数据集的第i组解释变量,
Figure GDA00034045619300000811
是更新后的第k类测试集Test′k中构建的第n个数据集的第i组响应变量;
步骤4.3将第α个解释变量
Figure GDA00034045619300000812
分为两组解释变量:
Figure GDA00034045619300000813
Figure GDA00034045619300000814
其中,Q为第α个解释变量
Figure GDA00034045619300000815
中具有单调递增关系的解释变量的序号集合,L为解释变量
Figure GDA00034045619300000816
中无单调约束的解释变量的序号集合,从而利用更新后的第k类训练集Train′k中构建的第n个数据集
Figure GDA00034045619300000817
对如式(5)所示单调复合分位数回归神经网络MCQRNN预测模型进行训练,从而得到训练后的MCQRNN预测模型;
Figure GDA00034045619300000818
式(5)中,h1(·)表示隐含层的激活函数,h2(·)表示输出层的激活函数;
Figure GDA00034045619300000819
代表第z个分位点,且z=1,2,…,Z,Z为分位点的数量;J为隐含层节点的个数,b′和b分别是隐含层和输出层的截距项,权向量Uk,nz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接输入层和隐含层的权向量集合,并有:
Figure GDA0003404561930000091
式(6)中,
Figure GDA0003404561930000092
表示更新后的第k类训练集Train′k中的第n个数据集在第q个输入层节点与第j个隐含层节点之间的权重,
Figure GDA0003404561930000093
表示更新后的第k类训练集Train′k中的第n个数据集在第l个输入层节点与第j个隐含层节点之间的权重,并有:
Figure GDA0003404561930000094
式(7)中,Vk,nz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接隐含层与输出层之间的权向量集合,其中,
Figure GDA0003404561930000095
表示更新后的第k类训练集Train′k中的第n个数据集在第j个隐含层节点与输出层之间的权重;
通过式(8)对式(5)进行优化求解,从而得到权重参数集合Uk,nz)和Vk,nz)的估计值
Figure GDA0003404561930000096
Figure GDA0003404561930000097
Figure GDA0003404561930000098
式(8)中,R为更新后的第k类训练集Train′k中序号集合Ak的序号数量,
Figure GDA0003404561930000099
是损耗函数,定义如下所示:
Figure GDA00034045619300000910
式(9)中,λ表示中间变量,Huber函数
Figure GDA00034045619300000911
公式如下:
Figure GDA00034045619300000912
式(10)中,α趋近于0。
步骤4.4.将更新后的第k类测试集Test′k中构建的N个数据集
Figure GDA00034045619300000913
中的第i组解释变量
Figure GDA00034045619300000914
输入训练后的MCQRNN预测模型中,从而得到更新后的K类测试集中N个数据集分别在Z个分位点下的条件分位数
Figure GDA0003404561930000101
其中,
Figure GDA0003404561930000102
表示更新后的第k类测试集Test′k中构建的第n个数据集在第z个分位点τz下的条件分位数预测结果;其中,
Figure GDA0003404561930000103
Figure GDA0003404561930000104
分别表示权向量集合Uk,nz)和Vk,nz)的估计值;
步骤5.利用式(9)将更新后的第k类测试集Test′k中在相同分位点下的条件分位数预测结果相加,从而得到第i组样本数据Dataseti在第z个分位点下的条件分位数最终预测结果
Figure GDA00034045619300001012
进而得到第i组样本数据Dataseti在Z个分位点下的条件分位数最终预测结果
Figure GDA0003404561930000105
Figure GDA0003404561930000106
步骤6.将Z个分位点下的条件分位数最终预测结果
Figure GDA0003404561930000107
作为Epanechnikov核函数的输入变量;利用式(10)计算更新后的第k类测试集Test′k中任意一点r的电力负荷概率密度预测结果
Figure GDA0003404561930000108
Figure GDA0003404561930000109
式(12)中,光滑参数d为带宽,C(·)为Epanechnikov核函数,并有:
Figure GDA00034045619300001010
式(13)中,
Figure GDA00034045619300001011

Claims (1)

1.一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法,其特征在于:包括以下步骤:
步骤1.获取电力负荷数据及其影响因子并进行预处理,从而得到预处理后的数据集Dataset={[Gm(t),P(t)]|t=1,2,..., T ′;m=1,2,...,M},包括:预处理后的电力负荷{P(t)|t=1,2,..., T ′}和电力负荷的M个影响因子{Gm(t)|m=1,2,...,M;t=1,2,...,T ′},其中,P(t)和Gm(t)分别为第t个时刻点的电力负荷及相应第t个时刻点的第m个影响因子;T′表示时刻点的个数,M表示电力负荷影响因子的种类数;
步骤2.设定时间间隔为s个时刻点,对所述预处理后的数据集Dataset进行分组,从而得到I组样本数据,且I满足[T′/s],其中,第i组样本数据表示为Dataseti=[G′m(i),P′(i)],G′m(i)=(Gm(s×(i-1)+1),Gm(s×(i-1)+2),…,Gm(s×i))T为第i组样本数据的第m个影响因子,Gm(s×i)表示在第s×i个时刻点的第m个影响因子,P′(i)=(P(s×(i-1)+1),P(s×(i-1)+2),...,P(s×i))T为第i组样本数据的电力负荷;P(s×i)表示在第s×i个时刻点的电力负荷,i=1,2,...,I;
步骤3.对I组样本数据{Dataseti|i=1,2,...,I}划分为训练集Train={Dataseti|i=1,2,...,p}和测试集Test={Dataseti|i=p+1,p+2,...,I},则训练集Train中含有p组样本数据,测试集Test中含有I-P组样本数据;
使用模糊C均值聚类法分别对训练集Train和测试集Test进行聚类得到K类样本数据,包括:K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K};
Figure FDA0003404561920000011
表示第k类的训练集,Ak为训练集Train的p组样本数据中属于第k类训练集的样本数据的序号集合,
Figure FDA0003404561920000012
表示第k类样本数据中第i组的第m个影响因子,Pk(i)表示第k类样本数据中第i组的电力负荷,
Figure FDA0003404561920000013
为第k类的测试集;Bk为测试集Test的I-P组样本数据中属于第k类测试集的样本数据的序号集合;
步骤4.利用K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K}分别对TVF-EMD-MCQRNN模型进行训练和测试:
步骤4.1.对第k类的训练集Traink和第k类的测试集Testk中的电力负荷{Pk(i)|i∈Ak∪Bk} 进行TVF-EMD分解获得N个本征模态分量
Figure FDA0003404561920000021
其中,
Figure FDA0003404561920000022
表示对第k类的训练集Traink和第k类的测试集Testk进行TVF-EMD分解得到的第n个本征模态分量的第i组数据;则将第k类的训练集Traink和测试集Testk分别更新为
Figure FDA0003404561920000023
Figure FDA0003404561920000024
步骤4.2.将更新后的第k类训练集Train′k中第n个负荷本征模态分量
Figure FDA0003404561920000025
作为第k类训练集Train′k的响应变量,第k类训练集Train′k剩余的M个负荷影响因子
Figure FDA0003404561920000026
及N-1个负荷分量
Figure FDA0003404561920000027
的组合作为第k类训练集Train′k的解释变量,从而构建N个包含有M+N-1个解释变量和一个响应变量的数据集,记作
Figure FDA0003404561920000028
其中,
Figure FDA0003404561920000029
表示更新后的第k类训练集Train′k中构建的第n个数据集的第i组解释变量;且
Figure FDA00034045619200000210
Figure FDA00034045619200000211
是更新后的第k类训练集Train′k中构建的第n个数据集的第i组的第α个解释变量,
Figure FDA00034045619200000212
是更新后的第k类训练集Train′k中构建的第n个数据集的第i组响应变量;
同理对更新后的第k类测试集Test′k也构建出N个包括M+N-1个解释变量和一个响应变量的数据集,记作
Figure FDA00034045619200000213
其中,
Figure FDA00034045619200000214
是更新后的第k类测试集Test′k中构建的第n个数据集的第i组解释变量,
Figure FDA00034045619200000215
是更新后的第k类测试集Test′k中构建的第n个数据集的第i组响应变量;
步骤4.3将第α个解释变量
Figure FDA00034045619200000216
分为两组解释变量:
Figure FDA00034045619200000217
Figure FDA00034045619200000218
其中,Q为第α个解释变量
Figure FDA00034045619200000219
中具有单调递增关系的解释变量的序号集合,L为解释变量
Figure FDA00034045619200000220
中无单调约束的解释变量的序号集合,从而利用更新后的第k类训练集Train′k中构建的第n个数据集
Figure FDA00034045619200000221
对如式(1)所示单调复合分位数回归神经网络MCQRNN预测模型进行训练,从而得到训练后的MCQRNN预测模型;
Figure FDA0003404561920000031
式(1)中,h1(·)表示隐含层的激活函数,h2(·)表示输出层的激活函数;
Figure FDA0003404561920000032
代表第z个分位点,且z=1,2,…,Z,Z为分位点的数量;J为隐含层节点的个数,b′和b分别是隐含层和输出层的截距项,权向量Uk,nz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接输入层和隐含层的权向量集合,并有:
Figure FDA0003404561920000033
式(2)中,
Figure FDA0003404561920000034
表示更新后的第k类训练集Train′k中的第n个数据集在第q个输入层节点与第j个隐含层节点之间的权重,
Figure FDA0003404561920000035
表示更新后的第k类训练集Train′k中的第n个数据集在第l个输入层节点与第j个隐含层节点之间的权重,并有:
Figure FDA0003404561920000036
式(3)中,Vk,nz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接隐含层与输出层之间的权向量集合,其中,
Figure FDA0003404561920000037
表示更新后的第k类训练集Train′k中的第n个数据集在第j个隐含层节点与输出层之间的权重;
通过式(4)对式(1)进行优化求解,从而得到权重参数集合Uk,nz)和Vk,nz)的估计值
Figure FDA0003404561920000038
Figure FDA0003404561920000039
Figure FDA00034045619200000310
式(4)中,R为更新后的第k类训练集Train′k中序号集合Ak的序号数量,
Figure FDA00034045619200000311
是损耗函数;
步骤4.4.将更新后的第k类测试集Test′k中构建的N个数据集
Figure FDA00034045619200000312
中的第i组解释变量
Figure FDA00034045619200000313
输入所述训练后的MCQRNN预测模型中,从而得到更新后的K类测试集中N个数据集分别在Z个分位点下的条件分位数
Figure FDA00034045619200000314
其中,
Figure FDA0003404561920000041
表示更新后的第k类测试集Test′k中构建的第n个数据集在第z个分位点τz下的条件分位数预测结果;
Figure FDA0003404561920000042
Figure FDA0003404561920000043
分别表示权向量集合Uk,nz)和Vk,nz)的估计值;
步骤5.利用式(5)将更新后的第k类测试集Test′k中在相同分位点下的条件分位数预测结果相加,从而得到第i组样本数据Dataseti在第z个分位点下的条件分位数最终预测结果
Figure FDA0003404561920000044
进而得到第i组样本数据Dataseti在Z个分位点下的条件分位数最终预测结果
Figure FDA0003404561920000045
Figure FDA0003404561920000046
步骤6.将Z个分位点下的条件分位数最终预测结果
Figure FDA0003404561920000047
作为Epanechnikov核函数的输入变量;利用式(6)计算更新后的第k类测试集Test′k中任意一点r的电力负荷概率密度预测结果
Figure FDA0003404561920000048
Figure FDA0003404561920000049
式(8)中,光滑参数d为带宽,C(·)为Epanechnikov核函数。
CN202011021199.8A 2020-09-25 2020-09-25 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 Active CN112183846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011021199.8A CN112183846B (zh) 2020-09-25 2020-09-25 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011021199.8A CN112183846B (zh) 2020-09-25 2020-09-25 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法

Publications (2)

Publication Number Publication Date
CN112183846A CN112183846A (zh) 2021-01-05
CN112183846B true CN112183846B (zh) 2022-04-19

Family

ID=73943991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011021199.8A Active CN112183846B (zh) 2020-09-25 2020-09-25 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法

Country Status (1)

Country Link
CN (1) CN112183846B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292453A (zh) * 2017-07-24 2017-10-24 国网江苏省电力公司电力科学研究院 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法
CN108830430A (zh) * 2018-08-01 2018-11-16 苏州大学张家港工业技术研究院 用于交通流量预测的卷积神经网络多点回归预测模型
CN110381523A (zh) * 2019-06-17 2019-10-25 盐城吉大智能终端产业研究院有限公司 一种基于tvf-emd-lstm模型的蜂窝基站网络流量预测方法
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN111144650A (zh) * 2019-12-26 2020-05-12 南京工程学院 电力负荷预测方法、装置、计算机可读存储介质及设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180129937A1 (en) * 2016-11-04 2018-05-10 Salesforce.Com, Inc. Quasi-recurrent neural network
US10970080B2 (en) * 2018-02-08 2021-04-06 Marvell Asia Pte, Ltd. Systems and methods for programmable hardware architecture for machine learning
US11328203B2 (en) * 2018-07-30 2022-05-10 Salesforce.Com, Inc. Capturing organization specificities with embeddings in a model for a multi-tenant database system
CN110348631A (zh) * 2019-07-09 2019-10-18 武汉四创自动控制技术有限责任公司 一种区域性电力负荷预测方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292453A (zh) * 2017-07-24 2017-10-24 国网江苏省电力公司电力科学研究院 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法
CN108830430A (zh) * 2018-08-01 2018-11-16 苏州大学张家港工业技术研究院 用于交通流量预测的卷积神经网络多点回归预测模型
CN110381523A (zh) * 2019-06-17 2019-10-25 盐城吉大智能终端产业研究院有限公司 一种基于tvf-emd-lstm模型的蜂窝基站网络流量预测方法
CN110674999A (zh) * 2019-10-08 2020-01-10 国网河南省电力公司电力科学研究院 基于改进聚类和长短期记忆深度学习的小区负荷预测方法
CN111144650A (zh) * 2019-12-26 2020-05-12 南京工程学院 电力负荷预测方法、装置、计算机可读存储介质及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Non-crossing nonlinear regression quantiles by monotone composite quantile regression neural network, with application to rainfall extremes;Cannon, Alex J1;《Stochastic Environmental Research & Risk Assessment》;20181231;第32卷(第11期);第3207-3225页 *
基于大数据分析与LASSO分位数回归的电力负荷概率密度预测方法;秦杨;《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》;20200115;第18-51页 *
基于机器学习的流量预测及基站休眠方法研究;任嘉鹏;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200815;第21-34页 *

Also Published As

Publication number Publication date
CN112183846A (zh) 2021-01-05

Similar Documents

Publication Publication Date Title
Li et al. A hybrid model based on synchronous optimisation for multi-step short-term wind speed forecasting
Xuan et al. Multi-model fusion short-term load forecasting based on random forest feature selection and hybrid neural network
CN109685252B (zh) 基于循环神经网络和多任务学习模型的建筑能耗预测方法
Zhang et al. Improving probabilistic load forecasting using quantile regression NN with skip connections
Ding et al. Point and interval forecasting for wind speed based on linear component extraction
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
Lin et al. Temporal convolutional attention neural networks for time series forecasting
CN109558975A (zh) 一种电力负荷概率密度多种预测结果的集成方法
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
CN113255900A (zh) 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法
Zhao et al. Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression
CN116703644A (zh) 一种基于Attention-RNN的短期电力负荷预测方法
Zhan et al. Reliable long-term energy load trend prediction model for smart grid using hierarchical decomposition self-attention network
CN110738363B (zh) 一种光伏发电功率预测方法
Wibawa et al. Long Short-Term Memory to Predict Unique Visitors of an Electronic Journal
CN116842848B (zh) 基于混合搜索进化优化的工业过程软测量建模方法、系统
CN112330051A (zh) 一种基于Kmeans与FR-DBN的短期负荷预测方法
Sun et al. Short-Term Exhaust Gas Temperature Trend Prediction of a Marine Diesel Engine Based on an Improved Slime Mold Algorithm-Optimized Bidirectional Long Short-Term Memory—Temporal Pattern Attention Ensemble Model
CN112183846B (zh) 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法
Zhang et al. Short-term electrical load forecasting based on Attention-GRU networks
CN116435987A (zh) 一种大规模风电集群超短期风电功率预测方法
Ahmadi et al. A fuzzy series‐parallel preprocessing (FSPP) based hybrid model for wind forecasting
CN115759343A (zh) 一种基于e-lstm的用户电量预测方法和装置
CN115630987A (zh) 一种增强深度注意力双向预测的分数阶长期价格引导方法
Zhang et al. Ensemble optimization approach based on hybrid mode decomposition and intelligent technology for wind power prediction system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant