CN112766585A - 基于软集成学习的电力短期滚动负荷预测方法、系统、终端 - Google Patents
基于软集成学习的电力短期滚动负荷预测方法、系统、终端 Download PDFInfo
- Publication number
- CN112766585A CN112766585A CN202110099887.4A CN202110099887A CN112766585A CN 112766585 A CN112766585 A CN 112766585A CN 202110099887 A CN202110099887 A CN 202110099887A CN 112766585 A CN112766585 A CN 112766585A
- Authority
- CN
- China
- Prior art keywords
- prediction
- soft
- ensemble learning
- learner
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000005096 rolling process Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000012360 testing method Methods 0.000 claims abstract description 9
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010801 machine learning Methods 0.000 claims description 4
- 238000003066 decision tree Methods 0.000 claims description 3
- 230000005611 electricity Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012706 support-vector machine Methods 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 9
- 230000008901 benefit Effects 0.000 abstract description 8
- 230000008569 process Effects 0.000 abstract description 6
- 230000000694 effects Effects 0.000 description 11
- 238000012935 Averaging Methods 0.000 description 6
- 230000010354 integration Effects 0.000 description 5
- 238000010187 selection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000007636 ensemble learning method Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于大数据在电力负荷预测中的应用领域,公开了一种基于软集成学习的电力短期滚动负荷预测方法、系统、终端,将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较;择拥有最低偏差率的学习器为待测样本的预测模型;引入滚动输入概念,通过不断更新训练数据对输出的关联性,得到预测结果。本发明通过不断更新训练集和邻域集,将新鲜信息的影响因素引入到新模型和新检验样本,形成“滚动预测”过程;通过学习器组的各基学习器在邻域中的表现,动态选择学习器用于待测区间的预测,避免一般集成学习中一般结合策略的不足;通过动态比较,选择最合适的基学习器实现软集成学习,具有简便优势。
Description
技术领域
本发明属于大数据在电力负荷预测中的应用领域,尤其涉及一种基于软集成学习的电力短期滚动负荷预测方法、系统、终端。
背景技术
目前,高精度电力短期区间负荷预测为电力系统安全、稳定、经济的运行提供重要保障,是市场环境下电力调度、供电计划等基础工作的重要依据,对机组最优组合、最优潮流、电力市场交易等具有重要意义。
传统机器学习技术针对电力区间负荷预测任务,首先引入模型评估指标,依靠人工经验利用多个学习算法基于给定训练集,训练出学习器,通过模型评估指标筛选出在验证集上具有最优表现的学习器,再利用最优表现的学习器进行预测任务。单一模型预测法虽然筛选出了最优学习器,却抛弃了大量备选个体学习器,缺乏对训练数据的多维度观察学习,不利于对区间数据的各阶段点进行针对性预测,对负荷区间各阶段不同的预测目标,无法得出比较精准的预测结果。
集成学习通过对学习器的有效组合,可以较好地解决因学习器单一而造成的,但集成效果受基学习器的选取对象、集成策略改动的影响而缺乏稳定性。其中,均值法对于如何结合各基学习器的输出有指导意义,但往往缺乏客观依据,无法准确指出针对什么样的学习器组合使用简单平均或者加权平均,随意选用均值方式可能会导致强学习器的效果被低估,弱学习器的效果被高估;投票法以多数投票和权重投票为主,则容易因为不可信的结合权重而得到低置信度的预测结果;Stacking为代表的学习法,虽然对样本学习的更加彻底,但容易因为模型筛选者经验不足,导致基学习器之间学习能力差距过大,影响Stacking策略的有效性。
基于上述原因,传统集成学习方法对区间负荷预测的应用有缺陷。
此外,电力负荷区间预测精度和输入数据时效性关联度很大,越是靠近预测对象的历史数据,对模型训练精度影响越大,也就是信息学中“数据关联度”的概念。对于训练数据,现有研究者更倾向于使用划分好并且固定不变的训练集,无视了时间序列信息关联性的重要影响,预测步长的增加,会导致误差加大,可能导致电力区间负荷预测精度逐步下降,无法达到应用要求。
通过上述分析,现有技术存在的问题及缺陷为:
(1)电力区间负荷预测中,针对负荷区间不同阶段,只选用一种学习器来进行预测,缺乏对区间电力数据的多角度观测和学习,预测结果不可靠。
(2)利用集成学习进行的短期电力负荷预测,其常规结合策略:均值法、投票法对于结合权重的选择主要依靠于人工经验,缺乏客观依据,导致强学习器的学习效果被低估、弱学习器的学习效果被高估,结合后的预测结果不准确;以Stacking为代表的学习法则容易导致过拟合现象。
(3)基于固定训练集的学习器,随着预测步长的增加,导致其对区间负荷总体预测精度下降,预测过程中未利用新鲜信息。
解决以上问题及缺陷的难度为:
(1)如何利用靠近预测对象的历史数据,即新鲜信息。
(2)如何在预测时针对预测大步长实现不同学习器的选择。
解决以上问题及缺陷的意义为:
(1)提高大步长负荷预测的精度。
(2)充分利用新鲜信息。
(3)实现不同学习器采用集成方式的新型应用。
发明内容
针对现有技术存在的问题,本发明提供了一种基于软集成学习的电力短期滚动负荷预测方法、系统、终端。
本发明是这样实现的,一种基于软集成学习的电力短期滚动负荷预测方法,包括以下步骤:
步骤一,将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较;
步骤二,选择拥有最低偏差率的学习器为待测样本的预测模型;
步骤三,引入“滚动输入”概念,通过不断更新训练数据对输出的关联性,得到更高精度的预测结果。
进一步,所述基于软集成学习的电力短期滚动负荷预测方法中,数据集为时间序列形式,预测任务是已知‘日最高温度’、‘日最低温度’、‘相对湿度’三者属性值,求取‘日用电量’属性值;在此基础上通过将待预测点真实值加入到左邻域,左邻域将其数据点真实值加入到训练集中以达到滚动预测的目的,其数据格式为:
(‘日最高温度’、‘日最低温度’、‘相对湿度’;‘日用电量’)
其中,前三项为输入属性;最后一项为输出属性。
进一步,所述基于软集成学习的电力短期滚动负荷预测方法中,初始训练集A=(A1,A2,A3,…,An),初始邻域B=(B1,B2,B3,…,Bm),初始待测区间C=(C1,C2,C3,…,Cp);其中A1,A2,A3,…,An;B1,B2,B3,…,Bm;C1,C2,C3,…,Cp均遵照所述数据格式,数据集中每个元素均为一条数据;A、B均已知所有属性值;C只知其输入属性值,其输出属性值为所预测值。
进一步,所述基于软集成学习的电力短期滚动负荷预测方法,还包括:
(1)初始训练集A=(A1,A2,A3,…,An),所述数据集随着滚动将被更新;
(2)将A分别输入CART、KNN、SVR进行训练,得到模型Model(CART)、Model(KNN)、Model(SVR);
(3)比较训练得来的Model(CART)、Model(KNN)、Model(SVR)模型,在初始领域B=(B1,B2,B3,…,Bm)中预测的误差率:Error(KNN)、Error(SVR)、Error(CART),选取误差率最小的训练模型Model(Min{Error(KNN),Error(SVR),Error(CART)})作为初始待测区间C=(C1,C2,C3,…,Cp)T中C1的预测模型,得到预测值Pre(C1);
(4)摒弃A1点,将B1点加入到A中,将训练集更新为(A2,A3,A4,…,An,B1);
(5)将C1点的真实值True(C1)加入到初始左邻域中,将左邻域更新为(B2,B3,B4,…,Bm,True(C1));
(6)重复步骤(3)~步骤(5)直到完成对整个待预测区间C(C1,C2,C3,C4,…,Cp)的预测,得出区间预测结果(Pre(C1),Pre(C2),Pre(C3),…,Pre(Cp))。
进一步,所述基于软集成学习的电力短期滚动负荷预测方法属于软集成学习,即预测整体任务是利用了不同的基学习器,但是每个预测子任务只使用一种基学习器,即软集成学习,基学习器的选择组合并不会显著影响学习效果,选择独立性最大的基学习器,在实际应用中,可加入多种学习器到学习器组中。
进一步,将以下算法作为动态集成的基学习算法:
CART算法包括:
设第i(i=1,2,...,n)个样本Ai的输入属性为Ai (1),Ai (2),Ai (3),输出值为Ai (4)。在训练数据集所在输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树。对输入空间划分采用启发式方法,每次划分逐一考察当前集合中所有输入分量的所有取值,根据平方误差最小化的准则选择最优的输入分量作为切分点。
SVR算法包括:
SVR算法是支持向量机在回归问题的应用。设输入变量为A(1),A(2),A(3),输出变量为A(4),SVR算法得到大间隔划分超平面模型:
f(A(1),A(2),A(3))=ω1A(1)+ω2A(2)+ω3A(3)+b
SVR算法容忍预测值f(A(1),A(2),A(3))与实际值A(4)之间最多有ε的误差,当误差绝对值大于ε时才计算损失;即以f(A(1),A(2),A(3))为中心,构建宽度为2ε的间隔带,训练样本落入此间隔区域,预测正确。
KNN算法包括:
KNN是一类有监督机器学习算法。对于测试样本Bi(i=1,2,...,n),基于欧式距离找出训练集A=(A1,A2,A3,…,An)中与其最靠近的k个样本,并取这k个样本的输出均值作为测试样本的预测值,即:
vi(i=1,2,…,K)表示选中k个样本的序号。
本发明的另一目的在于提供一种基于软集成学习的电力短期滚动负荷预测系统,所述基于软集成学习的电力短期滚动负荷预测系统包括:
预测偏差率比较模块,用于将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较;
待测样本预测模型获取模块,用于利用滚动输入方法,选择拥有最低偏差率的学习器为待测样本的预测模型;
预测结果获取模块,用于通过不断更新训练数据对输出的关联性,得到预测结果。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的基于软集成学习的电力短期滚动负荷预测方法。
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行所述的基于软集成学习的电力短期滚动负荷预测方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的基于软集成学习的电力短期滚动负荷预测方法,通过参考“局部区域准确估计动态分类器选择法”引入了滚动预测的概念,提出了“基于软集成学习的电力短期滚动负荷预测法”对电力用户用电量进行一个预测实践工作。
本发明通过训练一组学习器,克服了单一模型预测不全面的缺点。本发明通过学习器组的各基学习器在邻域中的表现,动态选择学习器用于待测区间的预测,避免了集成学习中一般结合策略的不足,譬如投票法和均值法难以解决的准确赋权问题,本发明通过动态比较,选择最合适的基学习器,相较传统集成学习结合策略参数设置的困难,本发明具有简便优势。本发明通过不断更新训练集和邻域集,将新鲜信息的影响因素不断引入到新模型和新检验样本(此处指左领域),形成一个“滚动预测”的过程。
本发明的方法与传统的单模型预测和集成学习都有所区别。单模型预测是从众多待选学习器中挑选出一个最优,摒弃其他的学习器,对数据观测深度不够,而本发明同样是利用基学习器进行预测,但是基于每次更新训练集和左邻域后的新模型预测,通过局部区域偏差率比较的方式,从待选新训练好的学习器中选用相对于邻域样本最优的预测模型,用于对待测区间数据的预测,从而达到更好的预测效果;一般的集成学习结合策略,对于结果的结合方式,其考察往往缺乏有力依据,多利用人工经验进行赋权,且调参工作复杂多变,不适于大范围推广。
综上所述,本发明结合了单模型预测的优点(预测结果唯一,不考虑赋权),又结合了集成学习的优点(通过多模型的预测效果动态对比),具有优越性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于软集成学习的电力短期滚动负荷预测方法流程图。
图2是本发明实施例提供的基于软集成学习的电力短期滚动负荷预测方法原理图。
图3是本发明实施例提供的滚动预测过程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于软集成学习的电力短期滚动负荷预测方法,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于软集成学习的电力短期滚动负荷预测方法包括以下步骤:
S101,将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较;
S102,选择拥有最低偏差率的学习器为待测样本的预测模型;
S103,引入“滚动输入”概念,通过不断更新训练数据对输出的关联性,得到更高精度的预测结果。
下面结合实施例对本发明作进一步描述。
本发明提出一种“基于软集成学习的电力短期滚动负荷预测法”,该构思得益于选择性集成中的“基于局部精度估计的动态分类器选择法”(DCS-LA)。首先,通过将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较,选择拥有最低偏差率的学习器为待测样本的预测模型;再者,对于随着预测步长增加降低预测精度的缺陷,本发明引入“滚动输入”概念,通过不断更新训练数据对输出的关联性,以期望得到更高精度的预测结果。
(1)实施方案陈述以前,对下列事项做出说明:
数据集为时间序列形式,预测任务是已知‘日最高温度’、‘日最低温度’、‘日平均温度’三者属性值,求取‘日用电量’属性值;在此基础上通过将待预测点真实值加入到左邻域,左邻域将其数据点真实值加入到训练集中以达到滚动预测的目的,其数据格式为:
(‘日最高温度’、‘日最低温度’、‘日平均温度’;‘日用电量’)
其中,前三项为输入属性;最后一项为输出属性。
已知,初始训练集A=(A1,A2,A3,…,An)T,初始邻域B=(B1,B2,B3,…,Bm)T,初始待测区间C=(C1,C2,C3,…,Cp)T,其中A1,A2,A3,…,An;B1,B2,B3,…,Bm;C1,C2,C3,…,Cp均遵照①中所述数据格式,数据集中每个元素均为一条数据;A、B均已知所有属性值;C只知其输入属性值,其输出属性值为所预测值。图3体现了滚动预测的过程。
(2)实施方案步骤(结合图2):
①初始训练集A=(A1,A2,A3,…,An)T,该数据集随着滚动将被更新。
②将A分别输入CART、KNN、SVR进行训练,得到模型Model(CART)、Model(KNN)、Model(SVR)。
③比较训练得来的Model(CART)、Model(KNN)、Model(SVR)模型,在初始领域B=(B1,B2,B3,…,Bm)T中预测的误差率:Error(KNN)、Error(SVR)、Error(CART),选取误差率最小的训练模型Model(Min{Error(KNN),Error(SVR),Error(CART)})作为初始待测区间C=(C1,C2,C3,…,Cp)T中C1的预测模型,得到预测值Pre(C1)。
④摒弃A1点,将B1点加入到A中,将训练集更新为(A2,A3,A4,…,An,B1)。
⑤将C1点的真实值True(C1)加入到初始左邻域中,将左邻域更新为(B2,B3,B4,…,Bm,True(C1))。
⑥重复步骤③~步骤⑤直到完成对整个待预测区间C(C1,C2,C3,C4,…,Cp)的预测,得出区间预测结果(Pre(C1),Pre(C2),Pre(C3),…,Pre(Cn))。
(3)具体技术方案
(一)数据准备
某用电负荷数据集,包含‘日最高温度’、‘日最低温度’、‘相对湿度’、‘日用电量’属性值。
(二)单一回归算法
因为此种方法属于软集成学习,因此基学习器的选择组合并不会显著影响学习效果,但是本发明倾向于选择独立性最大的基学习器,在实际应用中,可以考虑将CART算法、SVR算法、KNN算法加入到学习器组中。
CART算法包括:
设第i(i=1,2,...,n)个样本Ai的输入属性为Ai (1),Ai (2),Ai (3),输出值为Ai (4)。在训练数据集所在输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树。对输入空间划分采用启发式方法,每次划分逐一考察当前集合中所有输入分量的所有取值,根据平方误差最小化的准则选择最优的输入分量作为切分点。
SVR算法包括:
SVR算法是支持向量机在回归问题的应用。设输入变量为A(1),A(2),A(3),输出变量为A(4),SVR算法得到大间隔划分超平面模型:
f(A(1),A(2),A(3))=ω1A(1)+ω2A(2)+ω3A(3)+b
SVR算法容忍预测值f(A(1),A(2),A(3))与实际值A(4)之间最多有ε的误差,当误差绝对值大于ε时才计算损失;即以f(A(1),A(2),A(3))为中心,构建宽度为2ε的间隔带,训练样本落入此间隔区域,预测正确。
KNN算法包括:
KNN是一类有监督机器学习算法。对于测试样本Bi(i=1,2,...,n),基于欧式距离找出训练集A=(A1,A2,A3,…,An)中与其最靠近的k个样本,并取这k个样本的输出均值作为测试样本的预测值,即:
Vi(i=1,2,…,K)表示选中k个样本的序号。
(三)方案有效性验证
本发明的参考“局部区域准确估计动态分类器选择法”引入了滚动预测的概念,提出了“基于软集成学习的电力短期滚动负荷预测法”对电力用户用电量进行一个预测实践工作。
本发明通过训练一组学习器,克服了单一模型预测不全面的缺点。
通过学习器组的各基学习器在邻域中的表现,动态选择学习器用于待测区间的预测,避免了集成学习中一般结合策略的不足,譬如投票法和均值法难以解决的准确赋权问题,本发明通过动态比较,选择最合适的基学习器,相较传统集成学习结合策略参数设置的困难,本发明具有简便优势。
通过不断更新训练集和邻域集,将新鲜信息的影响因素不断引入到新模型和新检验样本(此处指左领域),形成一个“滚动预测”的过程。
本方法与传统的单模型预测和集成学习都有所区别。单模型预测是从众多待选学习器中挑选出一个最优,摒弃其他的学习器,对数据观测深度不够,而本发明同样是利用基学习器进行预测,但是基于每次更新训练集和左邻域后的新模型预测,通过局部区域偏差率比较的方式,从待选新训练好的学习器中选用相对于邻域样本最优的回归模型,用于对待测区间数据的预测,从而达到更好的预测效果;一般的集成学习结合策略,对于结果的结合方式,其往往缺乏有力依据,多利用人工经验进行赋权,且调参工作复杂多变,不适于大范围推广。
综上所述,本发明结合了单模型预测的优点(预测结果唯一,不考虑赋权),又结合了集成学习的优点(通过多回归模型的预测效果动态对比),具有优越性。
利用某地区负荷数据,包含了日最高温度、日最低温度、日平均温度、日用电量,采用以上软集成学习预测某月日用电量。采用Python语言编程,取得比只采用CART、KNN、SVR等算法更好的预测精度。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述基于软集成学习的电力短期滚动负荷预测方法包括:
将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较;
利用滚动输入方法,选择拥有最低偏差率的学习器为待测样本的预测模型;
通过不断更新训练数据对输出的关联性,得到预测结果。
2.如权利要求1所述的基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述滚动输入方法包括:
输入属性:日最高温度、日最低温度、日平均温度
输出属性:日用电量
数据集为时间序列形式,预测任务是已知日最高温度、日最低温度、日平均温度三者属性值,求取日用电量属性值;在此基础上通过将待预测点真实值加入到左邻域,左邻域将数据点真实值加入到训练集中实施滚动预测。
3.如权利要求1所述的基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述滚动预测方法包括:
初始训练集A=(A1,A2,A3,…,An),初始邻域B=(B1,B2,B3,…,Bm),初始待测区间C=(C1,C2,C3,…,Cp),其中A1,A2,A3,…,An;B1,B2,B3,…,Bm;C1,C2,C3,…,Cp的每个元素均为一条数据;A、B均已知所有输入输出;C只知其输入属性值,其输出属性值为所预测值。
4.如权利要求1所述的基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述基于软集成学习的电力短期滚动负荷预测方法具体包括:
(1)初始训练集A=(A1,A2,A3,…,An),所述数据集后续将随着滚动被更新;
(2)将A分别用CART算法、KNN算法、SVR算法进行训练,得到模型Model(CART)、Model(KNN)、Model(SVR);
(3)比较训练得来的Model(CART)、Model(KNN)、Model(SVR)模型,在初始领域B=(B1,B2,B3,…,Bm)中预测的误差率:Error(KNN)、Error(SVR)、Error(CART),选取误差率最小的训练模型Model(Min{Error(KNN),Error(SVR),Error(CART)})作为初始待测区间C=(C1,C2,C3,…,Cp)中C1的预测模型,得到预测值Pre(C1);
(4)摒弃A1点,将B1点加入到A中,将训练集更新为(A2,A3,A4,…,An,B1);
(5)将C1点的真实值True(C1)加入到左邻域中,将左邻域更新为(B2,B3,B4,…,Bm,True(C1));
(6)重复步骤(3)~步骤(5)直到完成对整个待预测区间C(C1,C2,C3,C4,…,Cp)的预测,得出区间预测结果(Pre(C1),Pre(C2),Pre(C3),…,Pre(Cp))。
5.如权利要求1所述的基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述学习器为多种学习器,组成学习器组。
6.如权利要求4所述的基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述多种学习器动态集成多种基学习算法包括CART算法、支持向量回归SVR算法、K-最近邻回归KNN算法。
7.如权利要求6所述的基于软集成学习的电力短期滚动负荷预测方法,其特征在于,所述CART算法包括:
设第i(i=1,2,...,n)个样本Ai的输入属性为输出值为在训练数据集所在输入空间中,递归地将每个区域划分为两个子区域并决定每个子区域上的输出值,构建二叉决策树;对输入空间划分采用启发式方法,每次划分逐一考察当前集合中所有输入分量的所有取值,根据平方误差最小化的准则选择最优的输入分量作为切分点;
所述SVR算法包括:
SVR算法是支持向量机在回归问题的应用。设输入变量为A(1),A(2),A(3),输出变量为A(4),SVR算法得到大间隔划分超平面模型:
f(A(1),A(2),A(3))=ω1A(1)+ω2A(2)+ω3A(3)+b
SVR算法容忍预测值f(A(1),A(2),A(3))与实际值A(4)之间最多有ε的误差,当误差绝对值大于ε时才计算损失;即以f(A(1),A(2),A(3))为中心,构建宽度为2ε的间隔带,训练样本落入此间隔区域,预测正确;
所述KNN算法包括:
KNN是一类有监督机器学习算法;对于测试样本Bi(i=1,2,...,n),基于欧式距离找出训练集A=(A1,A2,A3,…,An)中与其最靠近的k个样本,并取这k个样本的输出均值作为测试样本的预测值,即:
vi(i=1,2,…,K)表示选中k个样本的序号。
8.一种基于软集成学习的电力短期滚动负荷预测系统,其特征在于,所述基于软集成学习的电力短期滚动负荷预测系统包括:
预测偏差率比较模块,用于将在训练集上训练好的各学习器在待测样本的左邻域上,进行预测偏差率比较;
待测样本预测模型获取模块,用于利用滚动输入方法,选择拥有最低偏差率的学习器为待测样本的预测模型;
预测结果获取模块,用于通过不断更新训练数据对输出的关联性,得到预测结果。
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6任意一项所述的基于软集成学习的电力短期滚动负荷预测方法。
10.一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1~6任意一项所述的基于软集成学习的电力短期滚动负荷预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110099887.4A CN112766585A (zh) | 2021-01-25 | 2021-01-25 | 基于软集成学习的电力短期滚动负荷预测方法、系统、终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110099887.4A CN112766585A (zh) | 2021-01-25 | 2021-01-25 | 基于软集成学习的电力短期滚动负荷预测方法、系统、终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112766585A true CN112766585A (zh) | 2021-05-07 |
Family
ID=75707277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110099887.4A Pending CN112766585A (zh) | 2021-01-25 | 2021-01-25 | 基于软集成学习的电力短期滚动负荷预测方法、系统、终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766585A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114330935A (zh) * | 2022-03-10 | 2022-04-12 | 南方电网数字电网研究院有限公司 | 基于多种结合策略集成学习的新能源功率预测方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102270309A (zh) * | 2011-07-27 | 2011-12-07 | 华北电力大学 | 一种基于集成学习的短期电力负荷预测方法 |
US20140236486A1 (en) * | 2013-02-21 | 2014-08-21 | Saudi Arabian Oil Company | Methods, Program Code, Computer Readable Media, and Apparatus For Predicting Matrix Permeability By Optimization and Variance Correction of K-Nearest Neighbors |
CN107944594A (zh) * | 2017-09-30 | 2018-04-20 | 华南理工大学 | 一种基于spss与rkelm微网短期负荷预测方法 |
CN108875161A (zh) * | 2018-05-31 | 2018-11-23 | 长江勘测规划设计研究有限责任公司 | 基于卷积神经网络深度学习的流量等级预测方法 |
-
2021
- 2021-01-25 CN CN202110099887.4A patent/CN112766585A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102270309A (zh) * | 2011-07-27 | 2011-12-07 | 华北电力大学 | 一种基于集成学习的短期电力负荷预测方法 |
US20140236486A1 (en) * | 2013-02-21 | 2014-08-21 | Saudi Arabian Oil Company | Methods, Program Code, Computer Readable Media, and Apparatus For Predicting Matrix Permeability By Optimization and Variance Correction of K-Nearest Neighbors |
CN107944594A (zh) * | 2017-09-30 | 2018-04-20 | 华南理工大学 | 一种基于spss与rkelm微网短期负荷预测方法 |
CN108875161A (zh) * | 2018-05-31 | 2018-11-23 | 长江勘测规划设计研究有限责任公司 | 基于卷积神经网络深度学习的流量等级预测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114330935A (zh) * | 2022-03-10 | 2022-04-12 | 南方电网数字电网研究院有限公司 | 基于多种结合策略集成学习的新能源功率预测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Galar et al. | Ordering-based pruning for improving the performance of ensembles of classifiers in the framework of imbalanced datasets | |
CN107451894B (zh) | 数据处理方法、装置和计算机可读存储介质 | |
CN115577275A (zh) | 一种基于lof和孤立森林的时序数据异常监测系统及方法 | |
Huang et al. | SLNL: A novel method for gene selection and phenotype classification | |
CN110069732B (zh) | 一种信息展示的方法、装置及设备 | |
JP2020512651A (ja) | 検索方法、装置及び非一時的コンピュータ読取可能記憶媒体 | |
Hassan et al. | Accurately quantifying a billion instances per second | |
CN111325264A (zh) | 一种基于熵的多标签数据分类方法 | |
CN111046018A (zh) | 基于多目标优化的发电设备运行工况库构建方法和装置 | |
Yang et al. | A pattern fusion model for multi-step-ahead CPU load prediction | |
Lumauag et al. | An enhanced recommendation algorithm based on modified user-based collaborative filtering | |
Li et al. | Multi-objective particle swarm optimization for key quality feature selection in complex manufacturing processes | |
Zhang et al. | MAP-FCRNN: Multi-step ahead prediction model using forecasting correction and RNN model with memory functions | |
CN112766585A (zh) | 基于软集成学习的电力短期滚动负荷预测方法、系统、终端 | |
Han et al. | Dynamic ensemble selection classification algorithm based on window over imbalanced drift data stream | |
CN109657695A (zh) | 一种基于确定性退火的模糊划分聚类方法及装置 | |
CN117036781A (zh) | 一种基于树综合多样性深度森林的图像分类方法 | |
CN111832645A (zh) | 基于离散型乌鸦差分协同搜索算法的分类数据特征选择方法 | |
CN116662893A (zh) | 一种基于改进的樽海鞘算法优化svm的水质预测方法 | |
Dorado-Moreno et al. | Ordinal multi-class architecture for predicting wind power ramp events based on reservoir computing | |
JP6233432B2 (ja) | 混合モデルの選択方法及び装置 | |
Gjorgjioski et al. | Comparison of distances for multi-label classification with PCTs | |
Hang et al. | Gradient boosted binary histogram ensemble for large-scale regression | |
Shaikh et al. | Unerstanding Machine Learning Approach on Various Algorithms: A Case Study Implementation | |
Xiu et al. | Prediction method for lysine acetylation sites based on LSTM network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210507 |