CN112183846B - 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 - Google Patents
基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 Download PDFInfo
- Publication number
- CN112183846B CN112183846B CN202011021199.8A CN202011021199A CN112183846B CN 112183846 B CN112183846 B CN 112183846B CN 202011021199 A CN202011021199 A CN 202011021199A CN 112183846 B CN112183846 B CN 112183846B
- Authority
- CN
- China
- Prior art keywords
- test
- class
- train
- data
- training set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000012360 testing method Methods 0.000 claims abstract description 108
- 238000012549 training Methods 0.000 claims abstract description 93
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 239000011541 reaction mixture Substances 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims 1
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于模糊C均值聚类的TVF‑EMD‑MCQRNN负荷概率预测方法,包括:1对电力负荷及其影响因子进行预处理后按设定时间间隔进行分组;2对分组后的数据集划分训练集和测试集,使用模糊C均值聚类法分别对每组训练集和测试集进行聚类;3利用各类型训练集和测试集样本数据对TVF‑EMD‑MCQRNN模型进行训练和测试,得到各类型样本数据在不同分位点下的一系列条件分位数;4对各类型样本数据在相同分位点下的条件分位数分别进行求和得到各类型预测结果,从而实现概率密度预测。本发明能提高负荷预测的准确性,从而为电力系统的运行规划提供更全面、更有效的负荷信息。
Description
技术领域
本发明属于短期电力负荷预测技术领域,具体的说是一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法。
背景技术
电力负荷预测是电力系统规划的重要组成部分,在现代电力系统的能源分配和管理中起着至关重要的作用。高精度的负荷预测有利于电力系统在满足用户用电需求的同时制定合理的发电计划,从而有效地控制电力系统的规划和运行成本。然而随着新能源,如风能、太阳能等间歇性能源大规模接入电网,给电网的安全稳定、经济运行都带来了极大的挑战。相较于一般的电力负荷点预测方法,概率性负荷预测方法能反映负荷的不确定性特征,从而为电力系统可靠性分析、风险评估提供更科学的决策依据。
然而,随着电力系统规模的不断增加以及新兴技术的飞速发展,传统电力负荷预测技术受限于当前的电力环境,难以适应现代电力负荷数据非线性、随机性以及混沌性的特征合理进行建模,因此,为得到更加精确的负荷预测结果,需要不断更新优化负荷预测算法研究以保持先进性。此外,电力负荷的影响因素越来越复杂,这些因素对负荷精度的影响程度是模糊的,单一的预测模型已无法满足现代负荷预测的需求。大多数相关研究是由智能算法预测模型进行优化来提高负荷预测的精度,并没有对这些不确定因素进行预处理,忽略了历史负荷数据本身的信息价值。同时,电力负荷数据的分析难度也越来越来大,普通的数据预处理难以充分挖掘数据本身价值。
发明内容
本发明是为了解决上述现有技术存在的不足之处,提出一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法,以期能充分考虑影响因素对负荷预测准确性的影响,同时有效地避免分位数交叉现象的产生,从而进一步提高负荷预测的准确性,为电力系统的运行规划提供更全面、更有效的负荷信息。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法的特点在于:包括以下步骤:
步骤1.获取电力负荷数据及其影响因子并进行预处理,从而得到预处理后的数据集Dataset={[Gm(t),P(t)]|t=1,2,...,T;m=1,2,...,M},包括:预处理后的电力负荷{P(t)|t=1,2,...,T}和电力负荷的M个影响因子{Gm(t)|m=1,2,...,M;t=1,2,...,T},其中,P(t)和Gm(t)分别为第t个时刻点的电力负荷及相应第t个时刻点的第m个影响因子;T′表示时刻点的个数,M表示电力负荷影响因子的种类数;
步骤2.设定时间间隔为s个时刻点,对所述预处理后的数据集Dataset进行分组,从而得到I组样本数据,且I满足[T′/s],其中,第i组样本数据表示为Dataseti=[G′m(i),P′(i)],G′m(i)=(Gm(s×(i-1)+1),Gm(s×(i-1)+2),…,Gm(s×i))T为第i组样本数据的第m个影响因子,Gm(s×i)表示在第s×i个时刻点的第m个影响因子,P′(i)=(P(s×(i-1)+1),P(s×(i-1)+2),…,P(s×i))T为第i组样本数据的电力负荷;P(s×i)表示在第s×i个时刻点的电力负荷,i=1,2,...,I;
步骤3.对I组样本数据{Dataseti|i=1,2,...,I}划分为训练集Train={Dataseti|i=1,2,...,p}和测试集Test={Dataseti|i=p+1,p+2,...,I},则训练集Train中含有p组样本数据,测试集Test中含有I-P组样本数据;
使用模糊C均值聚类法分别对训练集Train和测试集Test进行聚类得到K类样本数据,包括:K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K};表示第k类的训练集,Ak为训练集Train的p组样本数据中属于第k类训练集的样本数据的序号集合,表示第k类样本数据中第i组的第m个影响因子,Pk(i)表示第k类样本数据中第i组的电力负荷,为第k类的测试集;Bk为测试集Test的I-P组样本数据中属于第k类测试集的样本数据的序号集合;
步骤4.利用K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K}分别对TVF-EMD-MCQRNN模型进行训练和测试:
步骤4.1.对第k类的训练集Traink和第k类的测试集Testk中的电力负荷{Pk(i)|i∈Ak∪Bk}进行TVF-EMD分解获得N个本征模态分量其中,表示对第k类的训练集Traink和第k类的测试集Testk进行TVF-EMD分解得到的第n个本征模态分量的第i组数据;则将第k类的训练集Traink和测试集Testk分别更新为和
步骤4.2.将更新后的第k类训练集Train′k中第n个负荷本征模态分量作为第k类训练集Train′k的响应变量,第k类训练集Train′k剩余的M个负荷影响因子及N-1个负荷分量的组合作为第k类训练集Train′k的解释变量,从而构建N个包含有M+N-1个解释变量和一个响应变量的数据集,记作其中,表示更新后的第k类训练集Train′k中构建的第n个数据集的第i组解释变量;且 是更新后的第k类训练集Train′k中构建的第n个数据集的第i组的第α个解释变量,是更新后的第k类训练集Train′k中构建的第n个数据集的第i组响应变量;
同理对更新后的第k类测试集Test′k也构建出N个包括M+N-1个解释变量和一个响应变量的数据集,记作其中,是更新后的第k类测试集Test′k中构建的第n个数据集的第i组解释变量,是更新后的第k类测试集Test′k中构建的第n个数据集的第i组响应变量;
步骤4.3将第α个解释变量分为两组解释变量:和其中,Q为第α个解释变量中具有单调递增关系的解释变量的序号集合,L为解释变量中无单调约束的解释变量的序号集合,从而利用更新后的第k类训练集Train′k中构建的第n个数据集对如式(1)所示单调复合分位数回归神经网络MCQRNN预测模型进行训练,从而得到训练后的MCQRNN预测模型;
式(1)中,h1(·)表示隐含层的激活函数,h2(·)表示输出层的激活函数;代表第z个分位点,且z=1,2,…,Z,Z为分位点的数量;J为隐含层节点的个数,b′和b分别是隐含层和输出层的截距项,权向量Uk,n(τz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接输入层和隐含层的权向量集合,并有:
式(2)中,表示更新后的第k类训练集Train′k中的第n个数据集在第q个输入层节点与第j个隐含层节点之间的权重,表示更新后的第k类训练集Train′k中的第n个数据集在第l个输入层节点与第j个隐含层节点之间的权重,并有:
式(3)中,Vk,n(τz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接隐含层与输出层之间的权向量集合,其中,表示更新后的第k类训练集Train′k中的第n个数据集在第j个隐含层节点与输出层之间的权重;
步骤4.4.将更新后的第k类测试集Test′k中构建的N个数据集中的第i组解释变量输入所述训练后的MCQRNN预测模型中,从而得到更新后的K类测试集中N个数据集分别在Z个分位点下的条件分位数其中,表示更新后的第k类测试集Test′k中构建的第n个数据集在第z个分位点τz下的条件分位数预测结果;和分别表示权向量集合Uk,n(τz)和Vk,n(τz)的估计值;
步骤5.利用式(5)将更新后的第k类测试集Test′k中在相同分位点下的条件分位数预测结果相加,从而得到第i组样本数据Dataseti在第z个分位点下的条件分位数最终预测结果进而得到第i组样本数据Dataseti在Z个分位点下的条件分位数最终预测结果
式(8)中,光滑参数d为带宽,C(·)为Epanechnikov核函数。
与现有技术相比,本发明的有益效果在于:
1.本发明采用的模糊C均值聚类算法是一种基于划分的聚类算法,通过对数据对象之间的距离迭代计算,使得具有相似特征的数据聚为一类,利用模糊C均值聚类算法对电力负荷及其影响因子进行聚类分析,再依据各类样本数据特点选取合适的方法进行管理和预测,从而提高了预测效率和精度。
2.本发明利用TVF-EMD方法对具有波动性和随机性的电力负荷进行分解,全面分析和利用电力负荷的数据信息,获得若干特征互异的平稳子序列,使得原始电力负荷时间序列中各特征尺度间信息解耦,保证了分解结果的有效性,从而能够细致把握电力负荷的变化特征。
3.本发明使用的单调复合分位数回归神经网络方法,通过从标准分位数回归神经网络模型、单调多层感知器、复合分位数回归神经网络、期望回归神经网络和广义加性神经网络中提取元素进行了新的组合,并结合核密度估计实现了电力负荷的非参数概率性预测。此外,该方法避免了多种分位数回归方法中常出现的分位数交叉问题,更有效地量化电力系统的不确定性,使预测结果更准确。
附图说明
图1为本发明的整体流程图。
具体实施方式
本实施例中,一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法,如图1所示,是按如下步骤进行:
步骤1.获取电力负荷数据及其影响因子并进行预处理,从而得到预处理后的数据集Dataset={[Gm(t),P(t)]|t=1,2,...,T;m=1,2,...,M},包括:预处理后的电力负荷{P(t)|t=1,2,...,T}和电力负荷的M个影响因子{Gm(t)|m=1,2,...,M;t=1,2,...,T},其中,P(t)和Gm(t)分别为第t个时刻点的电力负荷及相应第t个时刻点的第m个影响因子;T′表示时刻点的个数,M表示电力负荷影响因子的种类数;
步骤2.设定时间间隔为s个时刻点,对预处理后的数据集Dataset进行分组,从而得到I组样本数据,且I满足[T′/s],其中,第i组样本数据表示为Dataseti=[G′m(i),P′(i)],G′m(i)=(Gm(s×(i-1)+1),Gm(s×(i-1)+2),...,Gm(s×i))T为第i组样本数据的第m个影响因子,Gm(s×i)表示在第s×i个时刻点的第m个影响因子,P′(i)=(P(s×(i-1)+1),P(s×(i-1)+2),…,P(s×i))T为第i组样本数据的电力负荷;P(s×i)表示在第s×i个时刻点的电力负荷,i=1,2,...,I;
步骤3.对I组样本数据{Dataseti|i=1,2,...,I}划分为训练集Train={Dataseti|i=1,2,...,p}和测试集Test={Dataseti|i=p+1,p+2,...,I},则训练集Train中含有p组样本数据,测试集Test中含有I-P组样本数据;
使用模糊C均值聚类法分别对训练集Train和测试集Test进行聚类,步骤为:
(1)以训练集Train为例,假设训练集Train被划分为K类,记作{Traink|k=1,2,...,K},令第k类训练集样本Traink的中心点为χk,则训练集Train中任意一组Dataseti,i=1,2,...,p与第k类训练集样本Traink的中心点χk的隶属度为uki;
(2)先随机初始化一个满足约束条件(1)的uki值,然后根据式(2)计算出χk的值;
式(2)中,σ为隶属度uki的指数权重因子。
(3)将步骤(2)得到的χk作为输入,根据式(3)计算出新的uki值;
通过模糊C均值聚类法分别对训练集Train和测试集Test进行聚类后得到K类样本数据,包括:K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K};表示第k类的训练集,Ak为训练集Train的p组样本数据中属于第k类训练集的样本数据的序号集合,表示第k类样本数据中第i组的第m个影响因子,Pk(i)表示第k类样本数据中第i组的电力负荷,为第k类的测试集;Bk为测试集Test的I-P组样本数据中属于第k类测试集的样本数据的序号集合;
步骤4.利用K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K}分别对TVF-EMD-MCQRNN模型进行训练和测试:
步骤4.1.对第k类的训练集Traink和第k类的测试集Testk中的电力负荷{Pk(i)|i∈Ak∪Bk}进行TVF-EMD分解,获得N个本征模态分量其中,表示对第k类的训练集Traink和第k类的测试集Testk进行TVF-EMD分解得到的第n个本征模态分量的第i组数据;则将第k类的训练集Traink和测试集Testk分别更新为和
步骤4.2.将更新后的第k类训练集Train′k中第n个负荷本征模态分量作为第k类训练集Train′k的响应变量,第k类训练集Train′k剩余的M个负荷影响因子及N-1个负荷分量的组合作为第k类训练集Train′k的解释变量,从而构建N个包含有M+N-1个解释变量和一个响应变量的数据集,记作其中,表示更新后的第k类训练集Train′k中构建的第n个数据集的第i组解释变量;且 是更新后的第k类训练集Train′k中构建的第n个数据集的第i组的第α个解释变量,是更新后的第k类训练集Train′k中构建的第n个数据集的第i组响应变量;
同理对更新后的第k类测试集Test′k也构建出N个包括M+N-1个解释变量和一个响应变量的数据集,记作其中,是更新后的第k类测试集Test′k中构建的第n个数据集的第i组解释变量,是更新后的第k类测试集Test′k中构建的第n个数据集的第i组响应变量;
步骤4.3将第α个解释变量分为两组解释变量:和其中,Q为第α个解释变量中具有单调递增关系的解释变量的序号集合,L为解释变量中无单调约束的解释变量的序号集合,从而利用更新后的第k类训练集Train′k中构建的第n个数据集对如式(5)所示单调复合分位数回归神经网络MCQRNN预测模型进行训练,从而得到训练后的MCQRNN预测模型;
式(5)中,h1(·)表示隐含层的激活函数,h2(·)表示输出层的激活函数;代表第z个分位点,且z=1,2,…,Z,Z为分位点的数量;J为隐含层节点的个数,b′和b分别是隐含层和输出层的截距项,权向量Uk,n(τz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接输入层和隐含层的权向量集合,并有:
式(6)中,表示更新后的第k类训练集Train′k中的第n个数据集在第q个输入层节点与第j个隐含层节点之间的权重,表示更新后的第k类训练集Train′k中的第n个数据集在第l个输入层节点与第j个隐含层节点之间的权重,并有:
式(7)中,Vk,n(τz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接隐含层与输出层之间的权向量集合,其中,表示更新后的第k类训练集Train′k中的第n个数据集在第j个隐含层节点与输出层之间的权重;
式(10)中,α趋近于0。
步骤4.4.将更新后的第k类测试集Test′k中构建的N个数据集中的第i组解释变量输入训练后的MCQRNN预测模型中,从而得到更新后的K类测试集中N个数据集分别在Z个分位点下的条件分位数其中,表示更新后的第k类测试集Test′k中构建的第n个数据集在第z个分位点τz下的条件分位数预测结果;其中,和分别表示权向量集合Uk,n(τz)和Vk,n(τz)的估计值;
步骤5.利用式(9)将更新后的第k类测试集Test′k中在相同分位点下的条件分位数预测结果相加,从而得到第i组样本数据Dataseti在第z个分位点下的条件分位数最终预测结果进而得到第i组样本数据Dataseti在Z个分位点下的条件分位数最终预测结果
式(12)中,光滑参数d为带宽,C(·)为Epanechnikov核函数,并有:
Claims (1)
1.一种基于模糊C均值聚类的TVF-EMD-MCQRNN负荷概率预测方法,其特征在于:包括以下步骤:
步骤1.获取电力负荷数据及其影响因子并进行预处理,从而得到预处理后的数据集Dataset={[Gm(t),P(t)]|t=1,2,..., T ′;m=1,2,...,M},包括:预处理后的电力负荷{P(t)|t=1,2,..., T ′}和电力负荷的M个影响因子{Gm(t)|m=1,2,...,M;t=1,2,...,T ′},其中,P(t)和Gm(t)分别为第t个时刻点的电力负荷及相应第t个时刻点的第m个影响因子;T′表示时刻点的个数,M表示电力负荷影响因子的种类数;
步骤2.设定时间间隔为s个时刻点,对所述预处理后的数据集Dataset进行分组,从而得到I组样本数据,且I满足[T′/s],其中,第i组样本数据表示为Dataseti=[G′m(i),P′(i)],G′m(i)=(Gm(s×(i-1)+1),Gm(s×(i-1)+2),…,Gm(s×i))T为第i组样本数据的第m个影响因子,Gm(s×i)表示在第s×i个时刻点的第m个影响因子,P′(i)=(P(s×(i-1)+1),P(s×(i-1)+2),...,P(s×i))T为第i组样本数据的电力负荷;P(s×i)表示在第s×i个时刻点的电力负荷,i=1,2,...,I;
步骤3.对I组样本数据{Dataseti|i=1,2,...,I}划分为训练集Train={Dataseti|i=1,2,...,p}和测试集Test={Dataseti|i=p+1,p+2,...,I},则训练集Train中含有p组样本数据,测试集Test中含有I-P组样本数据;
使用模糊C均值聚类法分别对训练集Train和测试集Test进行聚类得到K类样本数据,包括:K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K};表示第k类的训练集,Ak为训练集Train的p组样本数据中属于第k类训练集的样本数据的序号集合,表示第k类样本数据中第i组的第m个影响因子,Pk(i)表示第k类样本数据中第i组的电力负荷,为第k类的测试集;Bk为测试集Test的I-P组样本数据中属于第k类测试集的样本数据的序号集合;
步骤4.利用K类训练集样本{Traink|k=1,2,...,K}和K类测试集样本{Testk|k=1,2,...,K}分别对TVF-EMD-MCQRNN模型进行训练和测试:
步骤4.1.对第k类的训练集Traink和第k类的测试集Testk中的电力负荷{Pk(i)|i∈Ak∪Bk} 进行TVF-EMD分解获得N个本征模态分量其中,表示对第k类的训练集Traink和第k类的测试集Testk进行TVF-EMD分解得到的第n个本征模态分量的第i组数据;则将第k类的训练集Traink和测试集Testk分别更新为和
步骤4.2.将更新后的第k类训练集Train′k中第n个负荷本征模态分量作为第k类训练集Train′k的响应变量,第k类训练集Train′k剩余的M个负荷影响因子及N-1个负荷分量的组合作为第k类训练集Train′k的解释变量,从而构建N个包含有M+N-1个解释变量和一个响应变量的数据集,记作其中,表示更新后的第k类训练集Train′k中构建的第n个数据集的第i组解释变量;且 是更新后的第k类训练集Train′k中构建的第n个数据集的第i组的第α个解释变量,是更新后的第k类训练集Train′k中构建的第n个数据集的第i组响应变量;
同理对更新后的第k类测试集Test′k也构建出N个包括M+N-1个解释变量和一个响应变量的数据集,记作其中,是更新后的第k类测试集Test′k中构建的第n个数据集的第i组解释变量,是更新后的第k类测试集Test′k中构建的第n个数据集的第i组响应变量;
步骤4.3将第α个解释变量分为两组解释变量:和其中,Q为第α个解释变量中具有单调递增关系的解释变量的序号集合,L为解释变量中无单调约束的解释变量的序号集合,从而利用更新后的第k类训练集Train′k中构建的第n个数据集对如式(1)所示单调复合分位数回归神经网络MCQRNN预测模型进行训练,从而得到训练后的MCQRNN预测模型;
式(1)中,h1(·)表示隐含层的激活函数,h2(·)表示输出层的激活函数;代表第z个分位点,且z=1,2,…,Z,Z为分位点的数量;J为隐含层节点的个数,b′和b分别是隐含层和输出层的截距项,权向量Uk,n(τz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接输入层和隐含层的权向量集合,并有:
式(2)中,表示更新后的第k类训练集Train′k中的第n个数据集在第q个输入层节点与第j个隐含层节点之间的权重,表示更新后的第k类训练集Train′k中的第n个数据集在第l个输入层节点与第j个隐含层节点之间的权重,并有:
式(3)中,Vk,n(τz)表示更新后的第k类训练集Train′k中的第n个数据集在第z个分位点τz下的连接隐含层与输出层之间的权向量集合,其中,表示更新后的第k类训练集Train′k中的第n个数据集在第j个隐含层节点与输出层之间的权重;
步骤4.4.将更新后的第k类测试集Test′k中构建的N个数据集中的第i组解释变量输入所述训练后的MCQRNN预测模型中,从而得到更新后的K类测试集中N个数据集分别在Z个分位点下的条件分位数其中,表示更新后的第k类测试集Test′k中构建的第n个数据集在第z个分位点τz下的条件分位数预测结果;和分别表示权向量集合Uk,n(τz)和Vk,n(τz)的估计值;
步骤5.利用式(5)将更新后的第k类测试集Test′k中在相同分位点下的条件分位数预测结果相加,从而得到第i组样本数据Dataseti在第z个分位点下的条件分位数最终预测结果进而得到第i组样本数据Dataseti在Z个分位点下的条件分位数最终预测结果
式(8)中,光滑参数d为带宽,C(·)为Epanechnikov核函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011021199.8A CN112183846B (zh) | 2020-09-25 | 2020-09-25 | 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011021199.8A CN112183846B (zh) | 2020-09-25 | 2020-09-25 | 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112183846A CN112183846A (zh) | 2021-01-05 |
CN112183846B true CN112183846B (zh) | 2022-04-19 |
Family
ID=73943991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011021199.8A Active CN112183846B (zh) | 2020-09-25 | 2020-09-25 | 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183846B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292453A (zh) * | 2017-07-24 | 2017-10-24 | 国网江苏省电力公司电力科学研究院 | 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法 |
CN108830430A (zh) * | 2018-08-01 | 2018-11-16 | 苏州大学张家港工业技术研究院 | 用于交通流量预测的卷积神经网络多点回归预测模型 |
CN110381523A (zh) * | 2019-06-17 | 2019-10-25 | 盐城吉大智能终端产业研究院有限公司 | 一种基于tvf-emd-lstm模型的蜂窝基站网络流量预测方法 |
CN110674999A (zh) * | 2019-10-08 | 2020-01-10 | 国网河南省电力公司电力科学研究院 | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 |
CN111144650A (zh) * | 2019-12-26 | 2020-05-12 | 南京工程学院 | 电力负荷预测方法、装置、计算机可读存储介质及设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180129937A1 (en) * | 2016-11-04 | 2018-05-10 | Salesforce.Com, Inc. | Quasi-recurrent neural network |
US10970080B2 (en) * | 2018-02-08 | 2021-04-06 | Marvell Asia Pte, Ltd. | Systems and methods for programmable hardware architecture for machine learning |
US11328203B2 (en) * | 2018-07-30 | 2022-05-10 | Salesforce.Com, Inc. | Capturing organization specificities with embeddings in a model for a multi-tenant database system |
CN110348631A (zh) * | 2019-07-09 | 2019-10-18 | 武汉四创自动控制技术有限责任公司 | 一种区域性电力负荷预测方法及系统 |
-
2020
- 2020-09-25 CN CN202011021199.8A patent/CN112183846B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292453A (zh) * | 2017-07-24 | 2017-10-24 | 国网江苏省电力公司电力科学研究院 | 一种基于集成经验模态分解与深度信念网络的短期风功率预测方法 |
CN108830430A (zh) * | 2018-08-01 | 2018-11-16 | 苏州大学张家港工业技术研究院 | 用于交通流量预测的卷积神经网络多点回归预测模型 |
CN110381523A (zh) * | 2019-06-17 | 2019-10-25 | 盐城吉大智能终端产业研究院有限公司 | 一种基于tvf-emd-lstm模型的蜂窝基站网络流量预测方法 |
CN110674999A (zh) * | 2019-10-08 | 2020-01-10 | 国网河南省电力公司电力科学研究院 | 基于改进聚类和长短期记忆深度学习的小区负荷预测方法 |
CN111144650A (zh) * | 2019-12-26 | 2020-05-12 | 南京工程学院 | 电力负荷预测方法、装置、计算机可读存储介质及设备 |
Non-Patent Citations (3)
Title |
---|
Non-crossing nonlinear regression quantiles by monotone composite quantile regression neural network, with application to rainfall extremes;Cannon, Alex J1;《Stochastic Environmental Research & Risk Assessment》;20181231;第32卷(第11期);第3207-3225页 * |
基于大数据分析与LASSO分位数回归的电力负荷概率密度预测方法;秦杨;《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》;20200115;第18-51页 * |
基于机器学习的流量预测及基站休眠方法研究;任嘉鹏;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200815;第21-34页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112183846A (zh) | 2021-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A hybrid model based on synchronous optimisation for multi-step short-term wind speed forecasting | |
Xuan et al. | Multi-model fusion short-term load forecasting based on random forest feature selection and hybrid neural network | |
CN109685252B (zh) | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 | |
Zhang et al. | Improving probabilistic load forecasting using quantile regression NN with skip connections | |
Ding et al. | Point and interval forecasting for wind speed based on linear component extraction | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
Lin et al. | Temporal convolutional attention neural networks for time series forecasting | |
CN109558975A (zh) | 一种电力负荷概率密度多种预测结果的集成方法 | |
CN112100911B (zh) | 一种基于深度bilstm的太阳辐射预测方法 | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
Zhao et al. | Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression | |
CN116703644A (zh) | 一种基于Attention-RNN的短期电力负荷预测方法 | |
Zhan et al. | Reliable long-term energy load trend prediction model for smart grid using hierarchical decomposition self-attention network | |
CN110738363B (zh) | 一种光伏发电功率预测方法 | |
Wibawa et al. | Long Short-Term Memory to Predict Unique Visitors of an Electronic Journal | |
CN116842848B (zh) | 基于混合搜索进化优化的工业过程软测量建模方法、系统 | |
CN112330051A (zh) | 一种基于Kmeans与FR-DBN的短期负荷预测方法 | |
Sun et al. | Short-Term Exhaust Gas Temperature Trend Prediction of a Marine Diesel Engine Based on an Improved Slime Mold Algorithm-Optimized Bidirectional Long Short-Term Memory—Temporal Pattern Attention Ensemble Model | |
CN112183846B (zh) | 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 | |
Zhang et al. | Short-term electrical load forecasting based on Attention-GRU networks | |
CN116435987A (zh) | 一种大规模风电集群超短期风电功率预测方法 | |
Ahmadi et al. | A fuzzy series‐parallel preprocessing (FSPP) based hybrid model for wind forecasting | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN115630987A (zh) | 一种增强深度注意力双向预测的分数阶长期价格引导方法 | |
Zhang et al. | Ensemble optimization approach based on hybrid mode decomposition and intelligent technology for wind power prediction system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |