CN112711913B - 基于粒度支持向量机的冷热电短期负荷预测系统及方法 - Google Patents
基于粒度支持向量机的冷热电短期负荷预测系统及方法 Download PDFInfo
- Publication number
- CN112711913B CN112711913B CN202110004055.XA CN202110004055A CN112711913B CN 112711913 B CN112711913 B CN 112711913B CN 202110004055 A CN202110004055 A CN 202110004055A CN 112711913 B CN112711913 B CN 112711913B
- Authority
- CN
- China
- Prior art keywords
- points
- sample
- support vector
- module
- cooling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000001816 cooling Methods 0.000 title claims abstract description 53
- 238000010438 heat treatment Methods 0.000 title claims abstract description 53
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 53
- 239000002245 particle Substances 0.000 claims abstract description 62
- 238000012549 training Methods 0.000 claims abstract description 49
- 239000013598 vector Substances 0.000 claims abstract description 43
- 238000005469 granulation Methods 0.000 claims abstract description 10
- 230000003179 granulation Effects 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 9
- 239000008187 granular material Substances 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- YCKRFDGAMUMZLT-UHFFFAOYSA-N Fluorine atom Chemical compound [F] YCKRFDGAMUMZLT-UHFFFAOYSA-N 0.000 claims description 8
- 229910052731 fluorine Inorganic materials 0.000 claims description 8
- 239000011737 fluorine Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 230000006399 behavior Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 230000005611 electricity Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000013277 forecasting method Methods 0.000 description 1
- 201000009240 nasopharyngitis Diseases 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/08—Thermal analysis or thermal optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/10—Noise analysis or noise optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Human Resources & Organizations (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Geometry (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于粒度支持向量机的冷热电短期负荷预测系统及方法,考虑了影响冷热电短期负荷预测的各类关键影响因素,通过采集历史冷热电负荷和关键影响因素的样本数据,运用共享最近邻相似度把样本划分为若干个信息粒,利用k最近邻连通度提取每个信息粒关键支持向量点,针对支持向量点进行支持向量机训练后得到最终的决策模型,然后利用决策模型进行冷热电负荷预测,以提高短期负荷预测准确率和降低时间复杂度。本发明方法在保证关键粒化信息不丢失的同时减低了负荷训练样本的复杂性,克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性,从而获得较好的预测精度和模型泛化能力。
Description
技术领域
本发明涉及综合能源系统负荷预测技术领域,尤其涉及一种基于粒度支持向量机的冷热电短期负荷预测系统及方法。
背景技术
由于受建筑围护结构要素、室外天气、用户行为和节假日等因素的影响,综合能源系统的冷热电短期负荷需求具有波动性和随机性。冷热电短期负荷预测的误差将会给电网和热网安全可靠稳定运行和调度管理带来诸多问题。常用的冷热电短期负荷预测方法主要包括以时间序列法和神经网络法,时间序列法的原理和模型均相对简单,难以满足当前对短期负荷预测的精度要求。神经网络方法考虑了影响负荷的不确定因素,预测效果较时间序列法有了明显的改善,但是在确定网络结构时缺乏理论方法。支持向量机(SVM)是一种基于统计学习理论的预测模型,它基于VC维理论和结构风险最小化原则,避免了传统机器学习中的过拟合和欠拟合等问题。
在给定样本的情况下,SVM的参数选择直接影响其模型的学习能力,同时对假设空间的规模和搜索方式有很大的影响。参数的选择决定着SVM模型的性能,如何得到最优的参数组合是SVM模型必须考虑的问题。我们可以把参数选取看作一个优化问题来处理,将智能优化算法引入到SVM参数寻优中。目前,智能优化SVM参数的方法主要由遗传算法、蚁群算法和粒子群优化算法。遗传算法搜索速度较慢,训练时间较长,增加了计算复杂度,对初始种群的选择有一定的依赖性;蚁群算法每次构造过程计算量较大,容易出现停滞现象,不能对空间进一步搜索,不利于发现更好解,对于连续优化问题(函数优化)无法直接应用;粒子群算法结构简单,容易实现,所涉及的参数较少,可能更快低收敛于最优解,具有更好的收敛速度,但是粒子群算法容易陷入局部最优解,并且算法后期的收敛速度较慢。结合粒度计算方法可以克服传统智能优化算法对于大规模数据划分粒的随机性,提升了训练效果,降低了训练代价,可以较好地提高预测模型的泛化能力;然而,实际数据中仍会存在数据集交叠的情况,而且大部分样本分布形态各异,如何将这些分布不规则的样本点合理地划分、解决子空间样本点分布不平衡、有效解决纯粒的关键点提取等问题,选择合适的划分机制是粒度支持向量机模型的关键所在。
发明内容
本发明的目的就是要提出一种基于粒度支持向量机的冷热电短期负荷预测系统及方法,旨在满足避免常规机器学习中的过拟合和欠拟合等问题的同时,又能保证关键粒化信息不丢失、减低负荷训练样本的复杂性,同时克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性,从而获得较好的预测精度和模型泛化能力。
为实现此目的,本发明所设计的基于粒度支持向量机的冷热电短期负荷预测系统,它包括数据采集模块、粒度划分模块、支持向量提取模块、预测模型训练模块和负荷预测模块;所述数据采集模块用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据,并完成关键影响因素样本数据预处理生成关键影响因素样本集;所述粒度划分模块用于运用共享最近邻相似度将数据采集模块输出的关键影响因素样本集进行粒群划分,获得若干个信息粒;所述支持向量提取模块用于利用k最近邻连通度对粒度划分模块输出的每个信息粒的关键支持向量点进行提取;所述预测模型训练模块针对支持向量提取模块输出的支持向量点,以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练,获得逐时负荷预测最终决策模型超参数组,建立粒度支持向量机负荷预测模型;所述负荷预测模块采用数据采集模块的关键影响因素预处理方法获得当前时刻关键影响因素样本数据,以当前时序行样本为输入变量值,基于预测模型训练模块输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果。
一种基于粒度支持向量机的冷热电短期负荷预测方法,它包括如下步骤:
S1,数据采集:所述数据采集模块用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据,并完成关键影响因素样本数据预处理生成关键影响因素样本集;
S2,粒度划分:所述粒度划分模块运用共享最近邻相似度把关键影响因素样本集划分为若干个信息粒;
S3,支持向量提取:所述支持向量提取模块利用k最近邻连通度提取每个信息粒的关键支持向量点;
S4,预测模型训练:所述预测模型训练模块针对各信息粒中提取的支持向量,以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练,获得逐时负荷预测最终决策模型超参数组,建立粒度支持向量机负荷预测模型;
S5,负荷预测:所述负荷预测模块采用S1中关键影响因素预处理方法获得当前时刻关键影响因素样本数据,以当前时序行样本为输入变量值,基于粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果。
本发明的有益效果:
本发明采用了共享最近邻相似度划分粒度的方法解决子空间样本点分布不平衡、纯粒的关键点提取等问题,是数据样本的更符合自然分布规律,在保证不丢失关键信息的前提下,尽可能的过滤掉冗余的数据,在简化样本点的同时减低了负荷训练样本的复杂性,克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性,从而获得较好的预测精度和模型泛化能力;对于提高综合能源供应可靠性以及线网规划安全高效运行具有重要意义,解决了现有的冷热电短期负荷预测模型泛化能力低、参数寻优速度慢、预测精度低等问题。
附图说明
图1为本发明的系统结构示意图;
图2为本发明的方法工作原理示意图;
图3为本发明预测模型与常规支持向量机技术预测结果对比示意图;
其中,1-数据采集模块、2-粒度划分模块、3-支持向量提取模块、4-预测模型训练模块、5-负荷预测模块、6-实际负荷输出模块。
具体实施方式
以下结合附图和具体实施例对本发明作进一步的详细说明:
本发明所设计的基于粒度支持向量机的冷热电短期负荷预测系统,如图1所示,它包括数据采集模块1、粒度划分模块2、支持向量提取模块3、预测模型训练模块4、负荷预测模块5和实际负荷输出模块6;所述数据采集模块1用于采集建筑物历史时序冷热电负荷,采集建筑围护结构要素和/或室外天气和/或用户行为和/或节假日等影响建筑冷热电负荷水平的关键影响因素,不同种类的关键影响因素以不同列数据形式存放至关键影响因素样本数据中,所述数据采集模块1完成关键影响因素样本数据预处理生成关键影响因素样本集,具体方法为所述数据采集模块1分别对关键影响因素样本数据每列关键影响因素计算贝塞尔函数标准差并清洗3倍以上误差的异常数据样本,让剩下的数据样本服从正态分布,并对剩下的数据样本进行归一化处理生成关键影响因素样本集;所述粒度划分模块2用于运用共享最近邻相似度将数据采集模块1输出的关键影响因素样本集进行粒群划分,获得若干个信息粒,以保证关键粒化信息不丢失、减低负荷训练样本的复杂性,同时克服传统粒度支持向量机对短期负荷历史样本数据粒化的随机性;所述支持向量提取模块3用于利用k最近邻连通度对粒度划分模块2输出的每个信息粒的关键支持向量点进行提取,旨在满足避免常规机器学习中的过拟合和欠拟合等问题,为预测模型训练提供最优化求解约束条件;所述预测模型训练模块4针对支持向量提取模块3输出的支持向量点,以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练,获得逐时负荷预测最终决策模型超参数组,建立粒度支持向量机负荷预测模型;所述负荷预测模块5采用数据采集模块1的关键影响因素预处理方法获得当前时刻关键影响因素样本数据,以当前时序行样本为输入变量值,基于预测模型训练模块4输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果;所述实际负荷输出模块6用于对负荷预测模块5输出的短期预测结果进行[0,1]反归一化处理,得到预测时刻冷热电逐时负荷实际计算结果。即:
y=ymin+y′×(ymax-ymin)
式中,y,表示该预测时刻负荷实际计算值;y′,表示该预测时刻负荷归一化值;ymin,表示该预测时刻负荷输出样本集最小值;ymax,表示预测时刻负荷输出样本集最大值。
上述技术方案中,所述数据采集模块1采集的关键影响因素包括建筑围护结构要素和/或室外天气和/或用户行为和/或节假日;所述样本数据为每间隔5分钟记录一组样本记录,包括前60天的历史负荷数据及影响因素数据。
上述技术方案中,所述数据采集模块1完成异常数据样本清洗的具体方法为:
第二步,ns为关键影响因素的原始样本数据记录长度;
其次,运用贝塞尔函数计算建筑冷热电负荷关键影响因素每列样本数据xi的标准差σ,即:
第三步,计算建筑冷热电负荷关键影响因素每列样本数据xi的绝对误差δ,即:
第四步,去除满足以下条件的样本数据清除,让剩下的数据样本服从正态分布,即:
δ≥3σ
第五步,对清洗后的样本集进行归一化处理,把干净数据集缩放至[0,1]之间,即:
式中,x′,表示该影响因素归一化值;x,表示该影响因素实际测量值;xmin,表示该影响因素的样本集最小值;xmax,表示该影响要素的样本集最大值。
上述技术方案中,所述粒度划分模块2完成粒群划分的具体方法为:
第一步,计算数据采集模块1输出的归一化后的每个样本点间的欧氏距离r,构造距离矩阵D为样本点,即:
D=(ai,j)n×n,xi,xj
式中,xi,xj是样本集{x1,x2,…,xn}中的任意两点,其中:
xi=[ri,1,ri,2,…,ri,n]
xj=[rj,1,rj,2,…,rj,n]
式中,ri,n为关键影响因素列n的样本点xi的欧氏距离;为rj,n为关键影响因素列n的样本点xj的欧氏距离;
第二步,计算距离矩阵D中每个点的共享最近邻相似度S(xi,xj),得到样本的相似度矩阵,即:
S(xi,xj)=s(nn[xi]∩nn[xj])
式中,nn[xi]和nn[xj]分别是xi和xj的k最近邻列表;s(nn[xi]∩nn[xj])表示距离矩阵D的大小;若xi和xj两点存在对方的k最近邻中,则定义两点为相似,且其共享最近邻点的个数为两点的相似度值S(xi,xj);
第三步,计算每个样本点的密度D(xi),将大于阈值n的点归为信息粒{K1,K2,…,Kn},小于阈值相似度n的点归为噪声点{N1,N2,…,Nn},即:
D(xi)=count[S(xi,xj)]≥n
式中,点xi的密度为在xj的k最近邻列表中与xi相似的点的个数;n为判断两个点是否相似的阈值,即两个点相似的条件是他们两者之间共享了不少于n个的最近邻;
K={D(xi)≥n}
N={D(xi)<n}
式中,K为信息粒,核心点密度不小于阈值n;N为噪声点,核心点密度小于阈值n。
上述技术方案中,所述支持向量提取模块3完成支持向量点提取的具体方法为:
第一步,对属于混合粒的信息粒{Ni},利用k最近邻法对其进行裁剪,得到关键信息{Gs};
第二步,对属于纯粒的信息粒{Ki},计算其k最近邻连通度st(xi,D),即:
st(xi,D)=∑c(xi)
式中,D,表示样本集;xi,表示任意一个样本点;c(xi),表示点xi出现在k最近邻列表中的次数;若xi是xj的k最近邻列表中的一点,则称点xi与点xj连通;
第三步,计算纯粒{Ki}中样本点的k最近邻连通度平均值Dm作为阈值,将连通度大于阈值的样本点删除并提取边缘点{Gb},对于粒化得到的噪声点保留为一个噪声粒{Gn},即:
Dm=∑st(xi,D)/s(D)
式中,s(D),表示样本集D中样本点的个数。
上述技术方案中,所述预测模型训练模块4完成预测模型训练的具体方法为:
第一步,将从混合粒中提取出的支持向量点{Gs}、从纯粒中提出的边缘点{Gb}、噪声点{Gn}进行组合,生成新的样本数据集D′;
第二步,设定SVM超参数变化范围:惩罚参数C为[10-2,103],损失函数参数ε为[10-3,10],RBF核函数参数σ为[10-2,102];
第三步,利用十折交叉验证法,将数据集D′分为10份,其中8份作为训练样本,剩余2份作为测试样本,采用高斯核函数进行SVM训练,寻找最优超参数组,得到短期负荷预测最终的决策模型,建立粒度支持向量机负荷预测模型。
一种基于粒度支持向量机的冷热电短期负荷预测方法,如图2所示,它包括如下步骤:
S1,数据采集:所述数据采集模块1从能管平台以时间间隔5分钟为一个采样周期采集前60天冷热电负荷历史数据作为输出变量,采集建筑围护结构要素和/或室外天气和/或用户行为和/或节假日等影响建筑冷热电负荷水平的关键影响因素作为输入变量,不同种类的关键影响因素以不同列数据形式存放至输入变量中,以影响因素作为输入变量、冷热电负荷作为输出变量构建原始训练样本集;所述数据采集模块1分别对输入变量每列关键影响因素计算贝塞尔函数标准差并清洗3倍以上误差的异常数据样本,让剩下的数据样本服从正态分布,对干净数据集缩放至[0,1]完成归一化处理;
S2,粒度划分:所述粒度划分模块2运用共享最近邻相似度把归一化后的样本划分为若干个信息粒;
S3,支持向量提取:所述支持向量提取模块3利用k最近邻连通度提取每个信息粒的关键支持向量点;
S4,预测模型训练:所述预测模型训练模块4针对各信息粒中提取的支持向量,以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练,获得逐时负荷预测最终决策模型超参数组,建立粒度支持向量机负荷预测模型;
S5,负荷预测:所述负荷预测模块5采用S1中关键影响因素预处理方法获得当前时刻关键影响因素样本数据,以当前时序行样本为输入变量值,基于粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果;
S6,实际负荷输出:所述实际负荷输出模块6对短期预测结果进行处理得到预测时刻冷热电逐时负荷实际计算结果。
上述技术方案中,所述步骤S1中,数据采集模块1完成异常数据样本清洗的具体方法为:
式中,ns为关键影响因素的原始样本数据记录长度。
S12,运用贝塞尔函数计算建筑冷热电负荷关键影响因素被测列xi的标准差σ,即:
S13,计算每个样本数据的绝对误差δ,即:
S14,去除满足以下条件的样本数据清除,让剩下的数据样本服从正态分布,即:
δ≥3σ
S15,对清洗后的样本集进行归一化处理,把干净数据集缩放至[0,1]之间,即:
式中,x′,表示该影响因素归一化值;x,表示该影响因素实际测量值;xmin,表示该影响因素的样本集最小值;xmax,表示该影响要素的样本集最大值。
上述技术方案中,粒度划分模块2完成粒群划分的具体方法为:
S21,计算数据采集模块1输出的归一化后的每个样本点间的欧氏距离r,构造距离矩阵D为样本点,即:
D=(ai,j)n×n,xi,xj
式中,xi,xj是样本集{x1,x2,…,xn}中的任意两点,其中:
xi=[ri,1,ri,2,…,ri,n]
xj=[rj,1,rj,2,…,rj,n]
式中,ri,n为关键影响因素列n的样本点xi的欧氏距离;为rj,n为关键影响因素列n的样本点xj的欧氏距离。
S22,计算距离矩阵D中每个点的共享最近邻相似度S(xi,xj),得到样本的相似度矩阵,即:
S(xi,xj)=s(nn[xi]∩nn[xj])
式中,nn[xi]和nn[xj]分别是xi和xj的k最近邻列表;s(nn[xi]∩nn[xj])表示距离矩阵D的大小;若xi和xj两点存在对方的k最近邻中,则定义两点为相似,且其共享最近邻点的个数为两点的相似度值S(xi,xj)。
S23,计算每个样本点的密度D(xi),将大于阈值n的点归为信息粒{K1,K2,…,Kn},小于阈值相似度n的点归为噪声点{N1,N2,…,Nn},即:
D(xi)=count[S(xi,xj)]≥n
式中,点xi的密度为在xj的k最近邻列表中与xi相似的点的个数;n为判断两个点是否相似的阈值,即两个点相似的条件是他们两者之间共享了不少于n个的最近邻。
K={D(xi)≥n}
N={D(xi)<n}
式中,K为信息粒,核心点密度不小于阈值n;N为噪声点,核心点密度小于阈值n。
上述技术方案中,所述步骤S3中,支持向量提取模块3完成支持向量点提取的具体方法为:
S31,对属于混合粒的信息粒{Ni},利用k最近邻法对其进行裁剪,得到关键信息{Gs};
S32,对属于纯粒的信息粒{Ki},计算其k最近邻连通度st(xi,D),即:
st(xi,D)=∑c(xi)
式中,D,表示样本集;xi,表示任意一个样本点;c(xi),表示点xi出现在k最近邻列表中的次数;若xi是xj的k最近邻列表中的一点,则称点xi与点xj连通。
S33,计算纯粒{Ki}中样本点的k最近邻连通度平均值Dm作为阈值,将连通度大于阈值的样本点删除并提取边缘点{Gb},对于粒化得到的噪声点保留为一个噪声粒{Gn},即:
Dm=∑st(xi,D)/s(D)
式中,s(D),表示样本集D中样本点的个数。
上述技术方案中,所述步骤S4中,预测模型训练模块4完成预测模型训练的具体方法为:
S41,将从混合粒中提取出的支持向量点{Gs}、从纯粒中提出的边缘点{Gb}、噪声点{Gn}进行组合,生成新的样本数据集D′;
S42,设定SVM超参数变化范围:惩罚参数C为[10-2,103],损失函数参数ε为[10-3,10],RBF核函数参数σ为[10-2,102];
S43,利用十折交叉验证法,将数据集D′分为10份,其中8份作为训练样本,剩余2份作为测试样本,采用高斯核函数进行SVM训练,寻找最优超参数组,得到短期负荷预测最终的决策模型,建立粒度支持向量机负荷预测模型。
本发明粒度支持向量机预测模型与常规支持向量机技术的10组实验MSE(均方误差)结果对比,如图3所示,平均预测精度比常规技术提高12.0%以上。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。
Claims (7)
1.一种基于粒度支持向量机的冷热电短期负荷预测系统,其特征在于:包括数据采集模块(1)、粒度划分模块(2)、支持向量提取模块(3)、预测模型训练模块(4)和负荷预测模块(5);
所述数据采集模块(1)用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据,并完成关键影响因素样本数据预处理生成关键影响因素样本集;
所述粒度划分模块(2)用于运用共享最近邻相似度将数据采集模块(1)输出的关键影响因素样本集进行粒群划分,获得若干个信息粒;
所述支持向量提取模块(3)用于利用k最近邻连通度对粒度划分模块(2)输出的每个信息粒的关键支持向量点进行提取;
所述预测模型训练模块(4)针对支持向量提取模块(3)输出的支持向量点,以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练,获得逐时负荷预测最终决策模型超参数组,建立粒度支持向量机负荷预测模型;
所述负荷预测模块(5)采用数据采集模块(1)的关键影响因素预处理方法获得当前时刻关键影响因素样本数据,以当前时序行样本为输入变量值,基于预测模型训练模块(4)输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果;
所述粒度划分模块(2)完成粒群划分的具体方法为:
第一步,计算数据采集模块(1)输出的归一化后的每个样本点间的欧氏距离r,构造距离矩阵D为样本点,即:
D=(ai,j)n×n,xi,xj
式中,xi,xj是样本集{x1,x2,…,xn}中的任意两点,其中:
xi=[ri,1,ri,2,…,ri,n]
xj=[rj,1,rj,2,…,rj,n]
式中,ri,n为关键影响因素列n的样本点xi的欧氏距离;为rj,n为关键影响因素列n的样本点xj的欧氏距离;
第二步,计算距离矩阵D中每个点的共享最近邻相似度S(xi,xj),得到样本的相似度矩阵,即:
S(xi,xj)=s(nn[xi]∩nn[xj])
式中,nn[xi]和nn[xj]分别是xi和xj的k最近邻列 表;s(nn[xi]∩nn[xj])表示距离矩阵D的大小;若xi和xj两点存在对方的k最近邻中,则定义两点为相似,且其共享最近邻点的个数为两点的相似度值S(xi,xj);
第三步,计算每个样本点的密度D(xi),将大于阈值n的点归为信息粒{K1,K2,…,Kn},小于阈值相似度n的点归为噪声点{N1,N2,…,Nn},即:
D(xi)=count[S(xi,xj)]≥n
式中,点xi的密度为在xj的k最近邻列表中与xi相似的点的个数;n为判断两个点是否相似的阈值,即两个点相似的条件是他们两者之间共享了不少于n个的最近邻;
K={D(xi)≥n}
N={D(xi)<n}
式中,K为信息粒,核心点密度不小于阈值n;N为噪声点,核心点密度小于阈值n;
所述支持向量提取模块(3)完成支持向量点提取的具体方法为:
第一步,对属于混合粒的信息粒{Ni},利用k最近邻法对其进行裁剪,得到关键信息{Gs};
第二步,对属于纯粒的信息粒{Ki},计算其k最近邻连通度st(xi,D),即:
st(xi,D)=∑c(xi)
式中,D,表示样本集;xi,表示任意一个样本点;c(xi),表示点xi出现在k最近邻列表中的次数;若xi是xj的k最近邻列表中的一点,则称点xi与点xj连通;
第三步,计算纯粒{Ki}中样本点的k最近邻连通度平均值Dm作为阈值,将连通度大于阈值的样本点删除并提取边缘点{Gb},对于粒化得到的噪声点保留为一个噪声粒{Gn},即:
Dm=∑st(xi,D)/s(D)
式中,s(D),表示样本集D中样本点的个数;
所述预测模型训练模块(4)完成预测模型训练的具体方法为:
第一步,将从混合粒中提取出的支持向量点{Gs}、从纯粒中提出的边缘点{Gb}、噪声点{Gn}进行组合,生成新的样本数据集D′;
第二步,设定SVM超参数变化范围:惩罚参数C为[10-2,103],损失函数参数ε为[10-3,10],RBF核函数参数σ为[10-2,102];
第三步,利用十折交叉验证法,将数据集D′分为10份,其中8份作为训练样本,剩余2份作为测试样本,采用高斯核函数进行SVM训练,寻找最优超参数组,得到短期负荷预测最终的决策模型,建立粒度支持向量机负荷预测模型。
2.根据权利要求1所述的基于粒度支持向量机的冷热电短期负荷预测系统,其特征在于:
还包括实际负荷输出模块(6),所述实际负荷输出模块(6)用于对负荷预测模块(5)输出的短期预测结果进行处理得到预测时刻冷热电逐时负荷实际计算结果;
所述数据采集模块(1)采集的关键影响因素包括建筑围护结构要素和/或室外天气和/或用户行为和/或节假日,不同种类的关键影响因素以不同列数据形式存放至关键影响因素样本数据中;所述样本数据为每间隔m分钟记录一组样本记录,包括前d天的历史负荷数据及影响因素数据。
3.根据权利要求1所述的基于粒度支持向量机的冷热电短期负荷预测系统,其特征在于:所述数据采集模块(1)完成异常数据样本清洗的具体方法为:
式中,ns为关键影响因素的原始样本数据记录长度;
第二步,运用贝塞尔函数计算建筑冷热电负荷关键影响因素每列样本数据xi的标准差σ,即:
第三步,计算建筑冷热电负荷关键影响因素每列样本数据xi的绝对误差δ,即:
第四步,去除满足以下条件的样本数据清除,让剩下的数据样本服从正态分布,即:
δ≥3σ
第五步,对清洗后的样本集进行归一化处理,把干净数据集缩放至[0,1]之间,即:
式中,x′,表示影响因素归一化值;x,表示影响因素实际测量值;xmin,表示影响因素的样本集最小值;xmax,表示影响要素的样本集最大值。
4.一种基于权利要求1-3任一项所述的基于粒度支持向量机的冷热电短期负荷预测系统的冷热电短期负荷预测方法,其特征在于,它包括如下步骤:
S1,数据采集:所述数据采集模块(1)用于采集建筑物历史时序冷热电负荷和影响建筑冷热电负荷水平的关键影响因素样本数据,并完成关键影响因素样本数据预处理生成关键影响因素样本集;
S2,粒度划分:所述粒度划分模块(2)用于运用共享最近邻相似度将数据采集模块(1)输出的关键影响因素样本集进行粒群划分,获得若干个信息粒;
S3,支持向量提取:所述支持向量提取模块(3)用于利用k最近邻连通度对粒度划分模块(2)输出的每个信息粒的关键支持向量点进行提取;
S4,预测模型训练:所述预测模型训练模块(4)针对支持向量提取模块(3)输出的支持向量点,以建筑物历史时序关键影响因素为输入变量、以建筑物历史时序冷热电负荷为输出变量进行SVM训练,获得逐时负荷预测最终决策模型超参数组,建立粒度支持向量机负荷预测模型;
S5,负荷预测:所述负荷预测模块(5)采用数据采集模块(1) 的关键影响因素预处理方法获得当前时刻关键影响因素样本数据,以当前时序行样本为输入变量值,基于预测模型训练模块(4)输出的粒度支持向量机负荷预测模型计算下一时段冷热电负荷归一化预测结果。
5.根据权利要求4所述的冷热电短期负荷预测方法,其特征在于:
步骤S5后还包括S6实际负荷输出,具体方法为:所述实际负荷输出模块(6)用于对负荷预测模块(5)输出的短期预测结果进行处理得到预测时刻冷热电逐时负荷实际计算结果;
步骤S1中,数据采集模块(1)完成异常数据样本清洗的具体方法为:
式中,ns为关键影响因素的原始样本数据记录长度;
S12,运用贝塞尔函数计算建筑冷热电负荷关键影响因素每列样本数据xi的标准差σ,即:
S13,计算建筑冷热电负荷关键影响因素每列样本数据xi的绝对误差δ,即:
S14,去除满足以下条件的样本数据清除,让剩下的数据样本服从正态分布,即:
δ≥3σ
S15,对清洗后的样本集进行归一化处理,把干净数据集缩放至[0,1]之间,即:
式中,x′,表示该影响因素归一化值;x,表示该影响因素实际测量值;xmin,表示该影响因素的样本集最小值;xmax,表示该影响要素的样本集最大值。
6.根据权利要求4所述的冷热电短期负荷预测方法,其特征在于:步骤S2中,粒度划分模块(2)完成粒群划分的具体方法为:
S21,计算数据采集模块(1)输出的归一化后的每个样本点间的欧氏距离r,构造距离矩阵D为样本点,即:
D=(ai,j)n×n,xi,xj
式中,xi,xj是样本集{x1,x2,…,xn}中的任意两点,其中:
xi=[ri,1,ri,2,…,ri,n]
xj=[rj,1,rj,2,…,rj,n]
式中,ri,n为关键影响因素列n的样本点xi的欧氏距离;为rj,n为关键影响因素列n的样本点xj的欧氏距离;
S22,计算距离矩阵D中每个点的共享最近邻相似度S(xi,xj),得到样本的相似度矩阵,即:
S(xi,xj)=s(nn[xi]∩nn[xj])
式中,nn[xi]和nn[xj]分别是xi和xj的k最近邻列表;s(nn[xi]∩nn[xj])表示距离矩阵D的大小;若xi和xj两点存在对方的k 最近邻中,则定义两点为相似,且其共享最近邻点的个数为两点的相似度值S(xi,xj);
S23,计算每个样本点的密度D(xi),将大于阈值n的点归为信息粒{K1,K2,…,Kn},小于阈值相似度n的点归为噪声点{N1,N2,…,Nn},即:
D(xi)=count[S(xi,xj)]≥n
式中,点xi的密度为在xj的k最近邻列表中与xi相似的点的个数;n为判断两个点是否相似的阈值,即两个点相似的条件是他们两者之间共享了不少于n个的最近邻;
K={D(xi)≥n}
N={D(xi)<n}
式中,K为信息粒,核心点密度不小于阈值n;N为噪声点,核心点密度小于阈值n。
7.根据权利要求4所述的冷热电短期负荷预测方法,其特征在于:步骤S3中,支持向量提取模块(3)完成支持向量点提取的具体方法为:
S31,对属于混合粒的信息粒{Ni},利用k最近邻法对其进行裁剪,得到关键信息{Gs};
S32,对属于纯粒的信息粒{Ki},计算其k最近邻连通度st(xi,D),即:
st(xi,D)=∑c(xi)
式中,D,表示样本集;xi,表示任意一个样本点;c(xi),表示点xi出现在k最近邻列表中的次数;若xi是xj的k最近邻列表中的一点,则称点xi与点xj连通;
S33,计算纯粒{Ki}中样本点的k最近邻连通度平均值Dm作为阈值,将连通度大于阈值的样本点删除并提取边缘点{Gb},对于粒化得到的噪声点保留为一个噪声粒{Gn},即:
Dm=∑st(xi,D)/s(D)
式中,s(D),表示样本集D中样本点的个数;
步骤S4中,预测模型训练模块(4)完成预测模型训练的具体方法为:
S41,将从混合粒中提取出的支持向量点{Gs}、从纯粒中提出的边缘点{Gb}、噪声点{Gn}进行组合,生成新的样本数据集D′;
S42,设定SVM超参数变化范围:惩罚参数C为[10-2,103],损失函数参数ε为[10-3,10],RBF核函数参数σ为[10-2,102];
S43,利用十折交叉验证法,将数据集D′分为10份,其中8份作为训练样本,剩余2份作为测试样本,采用高斯核函数进行SVM训练,寻找最优超参数组,得到短期负荷预测最终的决策模型,建立粒度支持向量机负荷预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110004055.XA CN112711913B (zh) | 2021-01-04 | 2021-01-04 | 基于粒度支持向量机的冷热电短期负荷预测系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110004055.XA CN112711913B (zh) | 2021-01-04 | 2021-01-04 | 基于粒度支持向量机的冷热电短期负荷预测系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112711913A CN112711913A (zh) | 2021-04-27 |
CN112711913B true CN112711913B (zh) | 2022-07-22 |
Family
ID=75548240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110004055.XA Active CN112711913B (zh) | 2021-01-04 | 2021-01-04 | 基于粒度支持向量机的冷热电短期负荷预测系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112711913B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117370770B (zh) * | 2023-12-08 | 2024-02-13 | 江苏米特物联网科技有限公司 | 一种基于Shapelet-XGboost的酒店负荷综合预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930347A (zh) * | 2012-10-15 | 2013-02-13 | 河海大学 | 一种需求响应下的短期负荷预测方法 |
CN110245783A (zh) * | 2019-05-20 | 2019-09-17 | 广东工业大学 | 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法 |
-
2021
- 2021-01-04 CN CN202110004055.XA patent/CN112711913B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930347A (zh) * | 2012-10-15 | 2013-02-13 | 河海大学 | 一种需求响应下的短期负荷预测方法 |
CN110245783A (zh) * | 2019-05-20 | 2019-09-17 | 广东工业大学 | 一种基于c-均值聚类模糊粗糙集的短期负荷预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112711913A (zh) | 2021-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107516170B (zh) | 一种基于设备故障概率和电网运行风险的差异自愈控制方法 | |
CN110619360A (zh) | 一种考虑历史样本相似性的超短期风功率预测方法 | |
CN111160401A (zh) | 一种基于均值漂移和XGBoost的异常用电判别方法 | |
CN111160626B (zh) | 一种基于分解融合的电力负荷时间序列控制方法 | |
CN110717610B (zh) | 一种基于数据挖掘的风电功率预测方法 | |
Senthil Kumar et al. | Feature selection used for wind speed forecasting with data driven approaches | |
Lee et al. | An efficient prediction for heavy rain from big weather data using genetic algorithm | |
CN114792158A (zh) | 基于时空融合图神经网络的多风电场短期功率预测方法 | |
CN112711913B (zh) | 基于粒度支持向量机的冷热电短期负荷预测系统及方法 | |
CN113884807B (zh) | 基于随机森林和多层架构聚类的配电网故障预测方法 | |
CN114357670A (zh) | 一种基于bls和自编码器的配电网用电数据异常预警方法 | |
CN113221442A (zh) | 一种电厂设备健康评估模型的构建方法及装置 | |
CN112508278A (zh) | 一种基于证据回归多模型的多联供系统负荷预测方法 | |
Chen et al. | Interval prediction of photovoltaic power using improved NARX network and density peak clustering based on kernel mahalanobis distance | |
CN114357865A (zh) | 一种水电站径流及其关联源荷功率年场景模拟和预测方法 | |
CN114692937A (zh) | 一种基于主变负载影响因素预测的主变负载预测方法 | |
CN109886507B (zh) | 基于主成分分析的电力系统短期负荷预测方法 | |
Wu et al. | Overview of day-ahead solar power forecasts based on weather classifications | |
He et al. | A deep neural network for anomaly detection and forecasting for multivariate time series in smart city | |
CN111832818B (zh) | 一种基于相关性分析的lstm网络发电多步预测方法 | |
Fang et al. | Research on Short-Term and Medium-Term Power Load Forecasting Based on STL-LightGBM | |
CN114091782B (zh) | 中长期电力负荷预测方法 | |
CN110826795B (zh) | 极端温度气象日母线日前负荷预测方法 | |
Chen et al. | Short-term Power System Load Data Forecasting Based On Subset Entropy Attribute Recursive Decision Tree Algorithm | |
CN117856241A (zh) | 一种渔业电网概率潮流预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |