CN109740826A - 一种基于动态数据挖掘的冷热电联供系统负荷预测方法 - Google Patents
一种基于动态数据挖掘的冷热电联供系统负荷预测方法 Download PDFInfo
- Publication number
- CN109740826A CN109740826A CN201910094042.9A CN201910094042A CN109740826A CN 109740826 A CN109740826 A CN 109740826A CN 201910094042 A CN201910094042 A CN 201910094042A CN 109740826 A CN109740826 A CN 109740826A
- Authority
- CN
- China
- Prior art keywords
- data
- load
- missing
- generation system
- power generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001816 cooling Methods 0.000 title claims abstract description 31
- 238000010438 heat treatment Methods 0.000 title claims abstract description 29
- 238000010248 power generation Methods 0.000 title claims abstract description 28
- 238000007418 data mining Methods 0.000 title claims abstract description 21
- 238000013277 forecasting method Methods 0.000 title claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 39
- 239000011159 matrix material Substances 0.000 claims abstract description 29
- 238000005286 illumination Methods 0.000 claims abstract description 10
- 238000013480 data collection Methods 0.000 claims abstract description 7
- 230000002159 abnormal effect Effects 0.000 claims abstract description 5
- 238000011068 loading method Methods 0.000 claims abstract description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000010219 correlation analysis Methods 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 5
- 238000005057 refrigeration Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 230000035515 penetration Effects 0.000 claims description 3
- 238000013139 quantization Methods 0.000 claims description 3
- 230000001932 seasonal effect Effects 0.000 abstract description 4
- 238000005265 energy consumption Methods 0.000 description 6
- 238000005065 mining Methods 0.000 description 6
- 238000013439 planning Methods 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 240000002853 Nelumbo nucifera Species 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000005520 electrodynamics Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000002918 waste heat Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000505 pernicious effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于动态数据挖掘的冷热电联供系统负荷预测方法,包括以下步骤:S1:构建负荷数据矩阵;S2:填补数据缺失值;若负荷数据缺失不严重,则采用滑动窗口平均法填补;若负荷数据集缺失严重,则采用基于马氏距离的k均值填充法填补缺失值;S3:对负荷矩阵异常数据的离群程度进行监测;S4:构建居民区冷热电负荷预测模型;S5:负荷数据动态关联规则挖掘;本发明根据气象因素对冷热电负荷的影响准确预测出一定运行周期内居民区冷热电负荷值;提高了冷热电负荷的预测计算的准确性;反映了不同季节不同温度、湿度、风速、光照强度等条件下的负荷变化规律,为电网调度运行以及供配电计划提供技术支撑。
Description
技术领域
本发明涉及电力系统及其自动化技术领域,更具体地,涉及一种基于动态数据挖掘的冷热电联供系统负荷预测方法。
背景技术
冷热电联供系统(combined cooling heating andpower,CCHP)是建立在“温度对口、梯级利用”概念基础上的先进高效用能技术,是能够实现制冷、供热及发电过程一体化的能源综合利用,系统冷热电联供系统不仅能实现能源的高效梯级利用进而提高能源的一次利用率,而且能有效减少CO2及有害气体的排放,具有良好的经济、环保和设备效益;因此,冷热电联供系统已是分布式能源发展的主要方向和形式,也是世界第二代能源技术发展的重要方向之一。
冷热电负荷准确预测是冷热电联供系统优化设计、运行调度和能量管理的关键因素和基本前提,具有重要的理论意义和使用价值;负荷预测是根据电力负荷、经济、社会、气象等的历史数据,探索电力负荷历史数据变化规律对未来负荷的影响,寻求电力负荷与各种相关因素之间的内在联系,从而对未来的负荷进行科学预测;区域建筑动态冷热电负荷在区域能源规划、分布式能源系统设计及应用分析等方面发挥着重要的作用;在用能规划阶段,各单体建筑或者建筑群仅确定功能和面积等控制性参数,没有完成具体的建筑设计,无详细的建筑信息;在此条件下,完成对规划阶段区域建筑总冷热电负荷的逐时预测,粗略分析区域建筑群空调负荷的逐时动态对于市政部门对能源基础设施的合理配置、设计者对方案的决策、相关产品的开发、初步的设备选型和调整建筑群配比等意义重大。
目前居民区冷热电负荷的模拟计算,已发展的较为成熟;经典的冷热电负荷计算方法有单位面积指标法、回归分析法、时间序列分析法、人工智能法、数值模拟预测法等。
随着我国城市化进程的加快,各地新区建设和旧城改造纷纷启动,尤其是绿色城区、生态城区、低碳城区、智慧城市等概念的不断普及,科学合理地规划设计城市最重要的基础设施。准确计算能源需求侧(居民区)的负荷是保证区域能源规划设计科学合理的基础,而如何准确而高效地预测建筑冷热电动态古河长期困扰能源规划行业;冷热电负荷计算不合理导致区域能源系统效率低、系统运行不稳定和资源浪费等现象;因此开发出准确而高效的建筑冷热电动态负荷预测方法及数据已经是区域能源规划设计行业的迫切需求;负荷数据具有数据量大、数据维度高的特点,导致常规的分析方法难以发现和总结负荷数据中隐藏的建筑用能规律和分项能耗数据间的关联;数据挖掘技术具有处理海量数据以及发现潜在的、新颖有用知识的分析能力,为人们认识蕴藏在数据中的信息和知识提供了一条途径。
目前,冷热电联供系统负荷预测存在不确定性、条件性和时间性,导致冷热电负荷的预测的准确计算存在一定的难度;关于冷热电负荷的预测问题,目前还有待开展更深入的研究。
发明内容
本发明为克服上述现有技术所述冷热电负荷的预测的准确计算存在一定难度的缺陷,提供一种基于动态数据挖掘的冷热电联供系统负荷预测方法。
其基本原理是通过数据挖掘的方式和方法,采用特征提取技术中主成分分析的方法,将冷热电负荷的原始数据进行选择、预处理、转换、挖掘抽取、分析和同化,提取出与环境、温度、时间、光照度、风速等因素,根据不同因素环境找出负荷变化规律,为冷热电联供系统运行优化提供条件。
所述方法针对冷热电联供系统及能源流通结构(如图1所示),并考虑温度、湿度、风速、光照强度等不确定性和随机性对冷热电负荷的影响,提出基于动态数据挖掘的居民区冷热电系统负荷分析与预测方法。
图1中,发电系统根据电负荷用量产生电能,电能产生过程中的余热可通过余热回收装置吸收热能,制冷系统可吸收热能或电能来产生冷能,通过合理输出冷热电能量,达到既满足负荷又不浪费的要求;因此,对冷热电负荷进行动态挖掘和分析,找出冷热电负荷的相关影响因素,从而准确预测负荷值对冷热电联供系统稳定高效运行具有重要意义。
冷热电联供系统负荷中冷热电负荷是典型的混沌时间序列,使得负荷表现出复杂性、不确定性、非线性等特点;冷热电负荷不仅与自身历史时间序列数据有关,而且负荷之间也相互影响;温度、湿度、风速、光照等天气因素更是影响冷热电负荷的重要因素;因此,为了更准确的预测冷热电负荷,本发明采用动态数据挖掘方法对居民区的冷热电联供系统负荷进行预测。
所述方法包括以下步骤:
S1:从历史和实时数据集中获取微居民区冷热电负荷数据信息,以及气象信息:温度、湿度、风速、光照强度等相关数据信息,构建负荷数据矩阵;
S2:填补数据缺失值;若负荷数据缺失不严重,则采用滑动窗口平均法填补;若负荷数据集缺失严重,则采用基于马氏距离的k均值填充法填补缺失值;
S3:对负荷矩阵异常数据的离群程度进行监测;
离群程度是指:通过赋予每一个数据对象一个表征该数据在整个数据集中的离群程度的因子,来衡量数据的分布情况,而不是明确的划分出哪些数据是离群数据哪些数据不是离群数据,这样数据的离群属性从是否离群的二元属性变为量化指标,更客观的反应离群数据的偏离程度;舍弃离群程度大的因子,以提高整个计算精度和缩短计算时间;计算离群程度,通过计算数据离群程度,可进一步提高负荷预测质量;
S4:构建居民区冷热电负荷预测模型;
采用决策树算法处理公共建筑能耗数据,建立一个易于理解的居民区冷热电负荷预测模型,并利用决策树算法选择影响负荷的主要因素,将其作为自变量,构建负荷回归分析模型;
S5:采用Apriori算法分析负荷数据、气象参数、人员活动规律以及建筑物特征之间所存在的内在相关性和连动关系,并对强关联规则进行解读,寻找提高负荷预测精度的关键切入点;
强关联规则解读方法:同时满足预先设定的最小支持度阈值和最小置信度阈值的规则称为强关联规则,分为有效强关联规则和无效强关联规则,主要由提升度l来衡量:
一般情况下,l(A→B)>1则为有效强关联规则,如果l(A→B)<1则为无效的强关联规则;特别地,如果l(A→B)=1,则表示A与B相互独立。
优选地,S1中负荷数据矩阵为:
其中,xHi1、xHi2、xHi3、xHi4、xHi5、xHi6、xHi7分别为电负荷、热负荷、冷负荷、温度、湿度、风度、光照强度。
优选地,S2中滑动窗口平均法为:
在填补负荷缺失数据时,把一个窗口内的m个数据近似的看成平稳,这样他们的算术平均值等于一个常量,然后用这个常量填补缺失的负荷数据值;
滑动窗口平均法表达式为:
其中,n为数据个数,k∈n。
优选地,其特征在于,S2中基于马氏距离的k均值填充法填补缺失值包括以下步骤:
S2.1:通过相关性分析,找到影响负荷数据缺失属性值的m个显著变量V={V1,V2,...,Vm},降低数据集的维度;
S2.2:计算缺失数据Xi和完整数据集Xj之间的马氏距离,并通过信息熵生成邻近域的系数矩阵ei,来量化表示最近领域中的数据与缺失数据的相似程度,相似度越高,对填补数据的影响越大;
S2.3:计算缺失数据Xi最近领域的加权平均值,并将该值作为缺失数据的预测值进行填补。
优选地,S2.1中相关性分析中度量相关系数之间关系性强弱的定量指标为Pearson;相关系数ρXY的表达式为:
Cov(Xi,Yi)=E(XiYi)-E(Xi)E(Yi)
Xi和Yi分别表示不同的时间序列,Xi和Yi为两类数据集,x,y分别为随机变量集X,Y中的值,xi∈X,yj∈Y,i∈n,j∈n,n为数据个数,X={x1,x2,x3…,xn},Y={y1,y2,y3…,yn}。
优选地,S2.2中缺失数据Xi和完整数据集Xj之间的马氏距离计算公式为:
信息熵的系数矩阵ei可表示为:
其中,k为完备数据个数,di为马氏距离,dr为确定值的马氏距离,ei为信息熵的系数矩阵。
优选地,S2.3中缺失数据的预测值可表示为:
k为完备数据个数,ei为信息熵的系数矩阵,er为确定值系数矩阵,Xni为距离缺失数据Xi距离最近的k个完备数据组成集合Xn={Xn1,Xn2…,Xni,…Xnk}中的一个值。
优选地,S3中离群程度的计算关系式为:
其中,d表示数据对象的第k距离领域链距离,D表示第k距离领域内链距离;dist(xi,xj)表示两点之间的链距离;dist(ei)为oi到xi的链距离,Nk为随机变量矩阵,u为数据集维度。
优选地,S4中居民区冷热电负荷预测模型为:
Y=β0+βiXi
其中,Y为负荷数据,β0和βi为回归系数,Xi为负荷的相关影响因素。
优选地,S5中Apriori算法步骤为:
S5.1:扫描数据库计算所有的频繁1-项集L1;
S5.2:根据连接条件,对L1进行自连接生成候选2-项集;
S5.3:扫描数据库,删除那些不满足最小支持度阈值的非频繁子集,生成频繁2-项集L2;
S5.4:通过已知频繁k-1项集Lk-1与子集连接生成候选k-项集,然后再次扫描数据库,生成频繁k-项集Lk,一直到不能再进行自连接产生频繁项集为止。
与现有技术相比,本发明技术方案的有益效果是:本发明根据气象因素对冷热电负荷的影响准确预测出一定运行周期内居民区冷热电负荷值;提高了冷热电负荷的预测计算的准确性;反映了不同季节不同温度、湿度、风速、光照强度等条件下的负荷变化规律,为电网调度运行以及供配电计划提供技术支撑
附图说明
图1为冷热电联供系统及能源流通结构示意图。
图2为基于马氏距离的k均值填充法填补缺失值的流程框图。
图3为本实施例所述基于动态数据挖掘的冷热电联供系统负荷预测方法的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
本实施例提供一种基于动态数据挖掘的冷热电联供系统负荷预测方法,所述方法包括以下步骤:
S1:构建数据矩阵;从多年历史和实时数据集中获取微居民区冷热电负荷数据信息,以及气象信息:温度、湿度、风速、光照强度等相关数据信息。通过处理、分析和计算,构建负荷数据矩阵。
其中,xHi1、xHi2、xHi3、xHi4、xHi5、xHi6、xHi7分别为电负荷、热负荷、冷负荷、温度、湿度、风度、光照强度。
S2:填补数据缺失值;采用基于马氏距离k均值填充法填补公共负荷数据矩阵缺失的数据,为降低能耗数据的维度并利用属性集蕴含的内在信息,通过相关性分析找到与缺失属性密切相关的数学,并使用信息熵计算最近领域的系数矩阵,量化非缺失数据属性对缺失数据属性的影响程度。
由于风电输出功率监测系统记录的数据量大且系统维护周期相对较长,所以系统存储的能耗数据集通常存在着数据缺失、冗余等情况。在对数据进行挖掘分析前,如果不能有效的填补缺失数据,将严重影响数据挖掘的质量,成为挖掘分析的障碍。特别是从纯数据角度出发进行建模师,如果不考虑数据集中存在的缺失数据就建立符合预测模型,那么模型很难有效的对负荷数据进行模型分析,并且模型的预测精度也难得到保障。若负荷数据缺失不严重,则采用滑动窗口平均法填补;若负荷数据集缺失严重,充分利用数据集蕴含的内在信息,考虑不同属性和数据间的相关性,采用基于马氏距离的k均值填充法填补缺失值;数据填补框图如图2所示。
(1)滑动窗口平均法:在填补负荷缺失数据时,把一个窗口内的m个数据近似的看成平稳,这样他们的算术平均值等于一个常量,然后用这个常量填补缺失的负荷数据值。滑动窗口平均法表达式为:
n为数据个数,k∈n。
(2)变量相关性分析:在对负荷缺失数据进行填补时,首先应该分析其他因素对负荷值的影响,因此采用相关性分析相关因素对负荷的影响程度;本实施例采用的度量相关系数之间关系性强弱的定量指标为Pearson;设时间序列Xi和Yi的相关系数ρXY的表达式为:
Cov(Xi,Yi)=E(XiYi)-E(Xi)E(Yi)
Xi和Yi分别表示不同的时间序列,Xi和Yi为两类数据集,x,y分别为随机变量集X,Y中的值,xi∈X,yj∈Y,i∈n,j∈n,n为数据个数,X={x1,x2,x3…,xn},Y={y1,y2,y3…,yn}。
分别计算每个天气因素和冷热电负荷之间的相关性,计算不同季节时相关天气因子与冷热电负荷之间的关系系数,并舍弃不同季节时相关性较低的天气因子。
其中缺失数据Xi和完整数据集Xj之间的马氏距离可表达为:
(3)马氏距离k均值填充法:马氏距离k均值填充法,首先通过相关性分析,找到影响负荷数据缺失属性值的m个显著变量V={V1,V2,...,Vm},降低数据集的维度,以达到在不影响填补结果准确性的前提下,减小填补算法时间复杂度的目的;然后计算缺失数据Xi和完整数据集Xj之间的马氏距离,并通过信息熵生成邻近域的系数矩阵ei,来量化表示最近领域中的数据与缺失数据的相似程度,相似度越高,对填补数据的影响越大;最后计算缺失数据Xi最近领域的加权平均值,并将该值作为缺失数据的预测值进行填补。
信息熵的系数矩阵ei可表示为:
数据缺失的预测值可表示为:
k为完备数据个数,d为马氏距离,dr为确定值的马氏距离,ei为信息熵的系数矩阵,er为确定值系数矩阵,Xni为距离缺失数据Xi距离最近的k个完备数据组成集合Xn={Xn1,Xn2…,Xni,…Xnk}中的一个值。
S3:负荷矩阵异常数据监测;针对现有异常数据监测算法时间复杂度高、参数鲁棒性差的问题,本发明提出局部离群数据监测算法(LODCD)。算法利用聚类方法从原始数据集中筛选出候选离群数据集,降低算法的时间复杂度;同时,在进行数据对象之间距离计算时,引入信息熵的概念,确定数据对象的离群属性以提高算法的检测准确率。确定数据集的离群属性后,采用新的局部链接离群因子(LCOF)度量候选离群数据集中数据的离群程度。离群程度的计算关系式为:
其中d表示数据对象的第k距离领域链距离,D表示第k距离领内链距离;dist(xi,xj)表示两点之间的链距离;dist(ei)为oi到xi的链距离,Nk为随机变量矩阵,u为数据集维度。
S4:构建负荷预测模型;采用决策树算法处理公共建筑能耗数据,建立一个易于理解的居民区冷热电负荷预测模型,并利用决策树算法选择影响负荷的主要因素,将其作为自变量,构建负荷回归分析模型。
决策树算法是数据挖掘方法中常用的技术之一,它使用类似流程的树结构将一组数据分离成各种预定义类,从而提供给定数据集的描述,分类和概括。在训练数据集的基础上建立商用建筑日总能耗的回归预测模型,模型的回归系数利用最小二乘进行计算,得到的回归方程为:
Y=β0+βiXi
其中,Y为负荷数据,β0和βi为回归系数,Xi为负荷的相关影响因素。
S5:负荷数据的动态关联规则挖掘;采用Apriori算法分析负荷数据、气象参数、人员活动规律以及建筑物特征之间所存在的内在相关性和连动关系,并运用专业知识对强关联规则进行解读,寻找提高负荷预测精度的关键切入点。
关联规则挖掘是在大量数据中发现项集之间的有价值的、潜在的关联或相关关系的一种数据挖掘方法,通过关联规则挖掘算法挖掘分析冷热电负荷数据信息,找到分项负荷数据库中数据项之间存在的内在、隐含的关联性,并以此为依据,探究提高负荷预测精确度的突破方向。
Apriori算法利用频繁项集性质的先验知识,通过逐层搜索的迭代方法,将k-项集用于探察(k+1)-项集,来穷尽数据集中的所有频繁项集;使用Apriori算法对冷热电负荷数据进行关联规则挖掘时,一方面研究负荷数据、气象参数、人员活动规律和建筑物特征间的内在关联性,寻找潜在的属性间规律;另一方面研究相关数据见得耦合关系,并寻找各属性之间的连动关系。
对负荷数据进行关联规则挖掘时,将各类型数据统一转化为布尔类型数据,使得数据统一化、标准化,其标准化公式为:
其中,x为原始数据,xmax为属性x的最小值,xmin为属性x的最大值。
数据标准化之后,对于负荷数据和除日平均干球温度之外的气象数据,将大于属性均值的数据定义为布尔型变量1,同理,转化得到布尔型变量0。然后,使用关联规则挖掘算法Apriori分析负荷、气象参数和人员活动规律之间的连动关系。
其中,Apriori算法步骤为:
S5.1:扫描数据库计算所有的频繁1-项集L1;
S5.2:根据连接条件,对L1进行自连接生成候选2-项集;
S5.3:扫描数据库,删除那些不满足最小支持度阈值的非频繁子集,生成频繁2-项集L2;
S5.4:通过已知频繁k-1项集Lk-1与子集连接生成候选k-项集,然后再次扫描数据库,生成频繁k-项集Lk,一直到不能再进行自连接产生频繁项集为止。
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,所述方法包括以下步骤:
S1:从历史和实时数据集中获取微居民区冷热电负荷数据信息,以及气象信息:温度、湿度、风速、光照强度等相关数据信息,构建负荷数据矩阵;
S2:填补数据缺失值;若负荷数据缺失不严重,则采用滑动窗口平均法填补;若负荷数据集缺失严重,则采用基于马氏距离的k均值填充法填补缺失值;
S3:对负荷矩阵异常数据的离群程度进行监测;
S4:构建居民区冷热电负荷预测模型;
S5:采用Apriori算法分析负荷数据、气象参数、人员活动规律以及建筑物特征之间所存在的内在相关性和连动关系,并对强关联规则进行解读,寻找提高负荷预测精度的关键切入点。
2.根据权利要求1所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S1中负荷数据矩阵为:
其中,xHi1、xHi2、xHi3、xHi4、xHi5、xHi6、xHi7分别为电负荷、热负荷、冷负荷、温度、湿度、风度、光照强度。
3.根据权利要求1所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S2中滑动窗口平均法为:
在填补负荷缺失数据时,把一个窗口内的m个数据近似的看成平稳,这样他们的算术平均值等于一个常量,然后用这个常量填补缺失的负荷数据值;
滑动窗口平均法表达式为:
其中,n为数据个数,k∈n。
4.根据权利要求1所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S2中基于马氏距离的k均值填充法填补缺失值包括以下步骤:
S2.1:通过相关性分析,找到影响负荷数据缺失属性值的m个显著变量V={V1,V2,...,Vm},降低数据集的维度;
S2.2:计算缺失数据Xi和完整数据集Xj之间的马氏距离,并通过信息熵生成邻近域的系数矩阵ei,来量化表示最近领域中的数据与缺失数据的相似程度,相似度越高,对填补数据的影响越大;
S2.3:计算缺失数据Xi最近领域的加权平均值,并将该值作为缺失数据的预测值进行填补。
5.根据权利要求4所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S2.1中相关性分析中度量相关系数之间关系性强弱的定量指标为Pearson;相关系数ρXY的表达式为:
Cov(Xi,Yi)=E(XiYi)-E(Xi)E(Yi)
Xi和Yi分别表示不同的时间序列,Xi和Yi为两类数据集,x,y分别为随机变量集X,Y中的值,xi∈X,yj∈Y,i∈n,j∈n,n为数据个数,X={x1,x2,x3…,xn},Y={y1,y2,y3…,yn}。
6.根据权利要求4所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S2.2中缺失数据Xi和完整数据集Xj之间的马氏距离计算公式为:
信息熵的系数矩阵ei可表示为:
其中,k为完备数据个数,di为马氏距离,dr为确定值的马氏距离,ei为信息熵的系数矩阵。
7.根据权利要求4所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S2.3中缺失数据的预测值可表示为:
k为完备数据个数,ei为信息熵的系数矩阵,er为确定值系数矩阵,Xni为距离缺失数据Xi距离最近的k个完备数据组成集合Xn={Xn1,Xn2…,Xni,…Xnk}中的一个值。
8.根据权利要求1所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S3中离群程度的计算关系式为:
其中,d表示数据对象的第k距离领域链距离,D表示第k距离领域内链距离;dist(xi,xj)表示两点之间的链距离;dist(ei)为0到xi的链距离,Nk为随机变量矩阵,u为数据集维度。
9.根据权利要求1所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S4中居民区冷热电负荷预测模型为:
Y=β0+βiXi
其中,Y为负荷数据,β0和βi为回归系数,Xi为负荷的相关影响因素。
10.根据权利要求1所述的基于动态数据挖掘的冷热电联供系统负荷预测方法,其特征在于,S5中Apriori算法步骤为:
S5.1:扫描数据库计算所有的频繁1-项集L1;
S5.2:根据连接条件,对L1进行自连接生成候选2-项集;
S5.3:扫描数据库,删除那些不满足最小支持度阈值的非频繁子集,生成频繁2-项集L2;
S5.4:通过已知频繁k-1项集Lk-1与子集连接生成候选k-项集,然后再次扫描数据库,生成频繁k-项集Lk,一直到不能再进行自连接产生频繁项集为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910094042.9A CN109740826A (zh) | 2019-01-30 | 2019-01-30 | 一种基于动态数据挖掘的冷热电联供系统负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910094042.9A CN109740826A (zh) | 2019-01-30 | 2019-01-30 | 一种基于动态数据挖掘的冷热电联供系统负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109740826A true CN109740826A (zh) | 2019-05-10 |
Family
ID=66366871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910094042.9A Pending CN109740826A (zh) | 2019-01-30 | 2019-01-30 | 一种基于动态数据挖掘的冷热电联供系统负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109740826A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490385A (zh) * | 2019-08-22 | 2019-11-22 | 广东电网有限责任公司 | 一种综合能源系统中电负荷和热负荷的联合预测方法 |
CN110911011A (zh) * | 2019-11-27 | 2020-03-24 | 医惠科技有限公司 | 一种脓毒血症的预警装置、设备及存储介质 |
CN111881565A (zh) * | 2020-07-17 | 2020-11-03 | 特变电工新疆新能源股份有限公司 | 一种光伏组件过程数据重建方法 |
CN111966676A (zh) * | 2020-09-04 | 2020-11-20 | 上海积成能源科技有限公司 | 一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法 |
CN112632047A (zh) * | 2020-12-02 | 2021-04-09 | 北京华能新锐控制技术有限公司 | 一种基于变窗口模式识别的时间序列数据处理方法 |
CN113095566A (zh) * | 2021-04-08 | 2021-07-09 | 国网山东省电力公司电力科学研究院 | 一种基于用能行为层次化分析的多源协调供能方法及系统 |
CN113377753A (zh) * | 2021-06-09 | 2021-09-10 | 国网吉林省电力有限公司 | 一种蓄热式电锅炉负荷数据清洗系统 |
CN114168574A (zh) * | 2021-10-27 | 2022-03-11 | 清华大学 | 一种面向工业负荷的数据缺失处理方法及装置 |
CN115310888A (zh) * | 2022-10-13 | 2022-11-08 | 国网天津市电力公司城东供电分公司 | 基于多元数据处理的综合能源用户用能行为关联分析方法 |
CN116400249A (zh) * | 2023-06-08 | 2023-07-07 | 中国华能集团清洁能源技术研究院有限公司 | 储能电池的检测方法及装置 |
CN116742625A (zh) * | 2023-08-14 | 2023-09-12 | 天津大学 | 变电站下网负荷的预测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105676824A (zh) * | 2016-03-02 | 2016-06-15 | 山东大学 | 一种可再生能源冷热电联供能量优化调度系统与方法 |
CN105678398A (zh) * | 2015-12-24 | 2016-06-15 | 国家电网公司 | 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统 |
CN106570581A (zh) * | 2016-10-26 | 2017-04-19 | 东北电力大学 | 能源互联网环境下基于属性关联的负荷预测系统及其方法 |
-
2019
- 2019-01-30 CN CN201910094042.9A patent/CN109740826A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105678398A (zh) * | 2015-12-24 | 2016-06-15 | 国家电网公司 | 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统 |
CN105676824A (zh) * | 2016-03-02 | 2016-06-15 | 山东大学 | 一种可再生能源冷热电联供能量优化调度系统与方法 |
CN106570581A (zh) * | 2016-10-26 | 2017-04-19 | 东北电力大学 | 能源互联网环境下基于属性关联的负荷预测系统及其方法 |
Non-Patent Citations (2)
Title |
---|
刘华: ""关联规则技术在智能配电网中的研究与应用"", 《中国优秀博硕士论文全文数据库 信息科技辑》 * |
崔冲: ""基于数据挖掘的公共建筑能耗预测与能效管理"", 《中国优秀博硕士论文全文数据库 信息科技辑》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490385A (zh) * | 2019-08-22 | 2019-11-22 | 广东电网有限责任公司 | 一种综合能源系统中电负荷和热负荷的联合预测方法 |
CN110911011A (zh) * | 2019-11-27 | 2020-03-24 | 医惠科技有限公司 | 一种脓毒血症的预警装置、设备及存储介质 |
CN111881565B (zh) * | 2020-07-17 | 2024-03-22 | 特变电工新疆新能源股份有限公司 | 一种光伏组件过程数据重建方法 |
CN111881565A (zh) * | 2020-07-17 | 2020-11-03 | 特变电工新疆新能源股份有限公司 | 一种光伏组件过程数据重建方法 |
CN111966676A (zh) * | 2020-09-04 | 2020-11-20 | 上海积成能源科技有限公司 | 一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法 |
CN112632047A (zh) * | 2020-12-02 | 2021-04-09 | 北京华能新锐控制技术有限公司 | 一种基于变窗口模式识别的时间序列数据处理方法 |
CN112632047B (zh) * | 2020-12-02 | 2023-08-01 | 北京华能新锐控制技术有限公司 | 一种基于变窗口模式识别的时间序列数据处理方法 |
CN113095566A (zh) * | 2021-04-08 | 2021-07-09 | 国网山东省电力公司电力科学研究院 | 一种基于用能行为层次化分析的多源协调供能方法及系统 |
CN113095566B (zh) * | 2021-04-08 | 2023-02-07 | 国网山东省电力公司电力科学研究院 | 一种基于用能行为层次化分析的多源协调供能方法及系统 |
CN113377753A (zh) * | 2021-06-09 | 2021-09-10 | 国网吉林省电力有限公司 | 一种蓄热式电锅炉负荷数据清洗系统 |
CN114168574A (zh) * | 2021-10-27 | 2022-03-11 | 清华大学 | 一种面向工业负荷的数据缺失处理方法及装置 |
CN114168574B (zh) * | 2021-10-27 | 2024-09-24 | 清华大学 | 一种面向工业负荷的数据缺失处理方法及装置 |
CN115310888A (zh) * | 2022-10-13 | 2022-11-08 | 国网天津市电力公司城东供电分公司 | 基于多元数据处理的综合能源用户用能行为关联分析方法 |
CN116400249A (zh) * | 2023-06-08 | 2023-07-07 | 中国华能集团清洁能源技术研究院有限公司 | 储能电池的检测方法及装置 |
CN116742625B (zh) * | 2023-08-14 | 2023-12-19 | 天津大学 | 变电站下网负荷的预测方法及系统 |
CN116742625A (zh) * | 2023-08-14 | 2023-09-12 | 天津大学 | 变电站下网负荷的预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109740826A (zh) | 一种基于动态数据挖掘的冷热电联供系统负荷预测方法 | |
Feng et al. | Assessing environmental performance in early building design stage: An integrated parametric design and machine learning method | |
Li et al. | Federated learning-based short-term building energy consumption prediction method for solving the data silos problem | |
Song et al. | An indoor temperature prediction framework based on hierarchical attention gated recurrent unit model for energy efficient buildings | |
CN112801411B (zh) | 一种基于生成对抗网络的网络流量预测方法 | |
Zhang et al. | A Big Data Mining and Blockchain‐Enabled Security Approach for Agricultural Based on Internet of Things | |
Zhang et al. | A CBR-based decision-making model for supporting the intelligent energy-efficient design of the exterior envelope of public and commercial buildings | |
Yu et al. | Ultra-short-term wind power subsection forecasting method based on extreme weather | |
Lao et al. | The optimized multivariate grey prediction model based on dynamic background value and its application | |
Liu et al. | A hybrid federated learning framework with dynamic task allocation for multi-party distributed load prediction | |
CN114386822A (zh) | 基于加权余弦相似度的重点人员用电行为异常分析方法 | |
Sun et al. | Load-forecasting method for IES based on LSTM and dynamic similar days with multi-features | |
CN112365082A (zh) | 一种基于机器学习的公共能源消耗预测方法 | |
Niu et al. | The prediction of carbon emissions from construction land in central Yunnan urban agglomeration area based on multiple linear regression model | |
Baldi et al. | The second law and the energy use mapping for sustainability planning | |
Jiale | Research on application potential prediction method for urban energy system based on decision tree | |
Gao et al. | Integrated Deep Neural Networks‐Based Complex System for Urban Water Management | |
Martinelli | Energy transition: digital (t) win? | |
Shao et al. | Wetland Ecotourism Development Using Deep Learning and Grey Clustering Algorithm from the Perspective of Sustainable Development | |
Yin et al. | Energy consumption parameter detection of green energy saving building based on artificial fish swarm algorithm | |
Feng et al. | Design of Comprehensive Energy System Considering Anomaly Detection of Multi-Energy Data | |
Li et al. | Electricity consumption forecast of hunan province using combined model based on multivariate linear regression and BP neural network | |
Wu et al. | Effect Evaluation and Intelligent Prediction of Power Substation Project Considering New Energy. | |
Wang et al. | Energy-saving optimisation method for green space planning of urban gardens based on artificial bee colony algorithm | |
Zhou et al. | Weather and random forest-based load profiling approximation models and their transferability across climate zones |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190510 |