CN111680852B - 地区整体能耗监控方法及其监控系统 - Google Patents
地区整体能耗监控方法及其监控系统 Download PDFInfo
- Publication number
- CN111680852B CN111680852B CN202010811186.4A CN202010811186A CN111680852B CN 111680852 B CN111680852 B CN 111680852B CN 202010811186 A CN202010811186 A CN 202010811186A CN 111680852 B CN111680852 B CN 111680852B
- Authority
- CN
- China
- Prior art keywords
- energy consumption
- data
- enterprise
- value
- dimension
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005265 energy consumption Methods 0.000 title claims abstract description 671
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012544 monitoring process Methods 0.000 title claims abstract description 59
- 238000013528 artificial neural network Methods 0.000 claims abstract description 90
- 238000012549 training Methods 0.000 claims abstract description 88
- 238000004364 calculation method Methods 0.000 claims abstract description 35
- 238000007621 cluster analysis Methods 0.000 claims abstract description 21
- 230000010354 integration Effects 0.000 claims abstract description 18
- 238000005259 measurement Methods 0.000 claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 230000000875 corresponding effect Effects 0.000 claims description 66
- 230000001174 ascending effect Effects 0.000 claims description 55
- 238000009826 distribution Methods 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 230000007704 transition Effects 0.000 claims description 9
- 230000004931 aggregating effect Effects 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000000630 rising effect Effects 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims description 2
- 238000013211 curve analysis Methods 0.000 claims 2
- 238000004519 manufacturing process Methods 0.000 abstract description 34
- 230000000737 periodic effect Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013024 troubleshooting Methods 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000711573 Coronaviridae Species 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 238000005267 amalgamation Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Marketing (AREA)
- Molecular Biology (AREA)
- Water Supply & Treatment (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Probability & Statistics with Applications (AREA)
Abstract
本发明公开了一种地区整体能耗监控方法及其监控系统,监控方法包括:步骤一,根据设定的维度进行数据清洗;步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平。本发明特别适用于复工复产时期的监测和预测,能够较为精准的预测后续的负荷能耗。
Description
技术领域
本发明属于一种地区整体能耗监控方法及使用其方法的监控系统,涉及一种以电力能源为代表的地区整体能耗监控方法及使用其方法的监控系统。
背景技术
2019年年末新冠病毒肺炎导致了大量企业出现了较长时间的停工,对于电网负荷来说,地区整体能效的变动与以往的经验并不一致。在以往时间段,负荷的较大变化往往只局限于长假和长假前后时间段内,而本次复工复产出现了能耗水平整体变化趋势复杂,能耗水平的监测与疫情、复工复产、生产行业等都紧密相关。因此在整个地区的能耗监测上存在监测常态化,无法采用通过日期进行一刀切推测,同时电网负荷监测也需要承当起社会整体复工复产态势监测的作用。因此,对电网负荷的能耗监测提出了更高的要求,不仅仅是要能看当前地区整体复工复产的态势,还要能对不同行业复工复产态势进行观测,进一步的还需要更多的预测功能,实现更多预测、推测功能,以期达到更为精准的复工复产帮扶、监控,辅助决策层进行下一步的决策。
中国国家专利申请号201510263771.4,授权公告号CN104820876B,公开了一种短期负荷预测方法和系统,其中,方法包括:获取相似日的负荷曲线集合,并利用小波变换对该负荷曲线集合内所有负荷曲线进行分解重构,得到负荷子曲线集合;对该负荷子曲线集合内所有负荷曲线进行负荷特性分析,将负荷特性分析结果通过组合负荷预测模型进行预测,得到初步负荷预测结果;将所述初步负荷预测结果通过误差预测模型进行校正,将输出的校正结果作为所述预测日的负荷预测结果。提高了短期负荷预测结果的精度,使得到精度较高的负荷预测结果。其技术内容公开了一种获取相似日的负荷曲线集合,利用小波变换解构之后进行特性分析,从而利用相似日进行负荷预测的方法。但是此技术内容中存在以下不足:第一,此技术方案严重依赖于相似日的数据,但是,疫情的出现,使得相似日的概念很难进行获取,特别是复工复产时段,虽然与春节复工有一定的相似,但是实际上依然存在巨大的差异。第二,相似日中的负荷是基本相似的,整体负荷状况基本能够保持在一个基准,因此,此技术方案更偏重于精确度的要求,但是现在处于复工复产的阶段,企业的数据变动巨大,各地区各行业之间都存在较大的不确定性,负荷的变化程度导致在复工复产的预测过程中不适用直接对相似日数据进行转换判断。
发明内容
本发明解决了现有技术仅仅只能针对当前能耗进行监控,对于复工复产等时期的能耗监控较弱,不能区分各个行业的能耗水平、无法对复工复产水平进行进一步预测等问题,提供一种以电力能源为代表的地区整体能耗监控方法及使用其方法的监控系统。
本发明解决其技术问题所采用的技术方案是:一种地区整体能耗监控方法,获取目标地区内企业的当前能耗数据和历史能耗数据,并通过执行以下步骤来判断并预测地区整体的能耗水平:
步骤一,根据设定的维度进行数据清洗;
步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;
步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;
步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;
步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;
步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平。
本发明的具体技术可以简单概括为以下内容:首先对获取的技术进行数据清洗,清洗之后的数据符合进行第二步处理;步骤二中,将常态数据、复工数据进行选用,特别是对复工数据进行聚类分析,主要的分类标准中至少包括企业能耗层级和企业能耗类型,也就是说至少是需要在企业能耗层级和企业能耗类型两个层面上将企业进行区分;步骤三,将聚类之后的数据进行数据整合,整合的意义在于,对训练数据测定之后进行关联整合,也就是通过已确定的不同维度参数来确定对应的基准能耗曲线,其中不同的维度参数作为训练数据,能耗数值作为训练验证结果,因此需要在步骤三中整合关联到能耗数值中,而在这个过程中,训练数据的测定子步骤是用于进一步优化训练数据的一个过程,至少要能在清洗后的原始数据之上进行一次数据膨胀,利用测定子步骤中的数据膨胀,可以增加输入参数,能够有效加强预测的准确性,当然,在一定条件下也可以直接将清洗过后的原始数据进行直接的神经网络训练,也能得到具有一定参考意义的数据内容;步骤四五中,神经网络作为分类使用,为了提高神经网络分类的准确性,需要对分类密度进行合理的设定,因此,在本发明的基础上,可以对地区内的能源大户进行分开的独立测算以增加计算的准确度,在企业数据密度足够的中段数据上,则大部分情况下只要分类划分合理,是可以通过选出相同类下典型的能耗数值及其能耗数值的变化形式来预测后续能耗的变动,只要在神经网络中的分类划分的足够细致,数据的准确性就会极大提高;步骤六,则可以根据各个企业的能耗水平进一步的推测地区内的整体能耗水平及其相关的预测。其中,步骤二和步骤三的设置也可以采用更多本地区特色的合理的参数和分类,还可以将包括能源来源等参数进行关联和计算,以期达到更好的适用性。因此,通过本发明的技术方案,提供了一种当前地区能耗水平预测的方法,特别是适用于复工复产时期的监测和预测,能够较为精准的预测后续的负荷能耗。当然在此基础上,也可以引入各种其他配合数据和方法进行进一步的强化其的预测性;例如,针对能源大客户即可应用如中国专利申请号CN201711070575.0 一种区域内支柱性电力用户的电量预测方法和系统所提供的技术方案进行监控和预测,而针对服务业小微企业,则可以直接通过写字楼的空置率等手段进行相应的监控和预测。
本发明针对现有技术,作出了如下改进:
本技术方案虽然也依赖相似日的数据,但是,本技术方案适用的相似日,区分有行业,对于相似日曲线的应用解析更为深入,解决了疫情的出现,使得相似日很难进行获取,特别是复工复产时段,虽然与春节复工有一定的相似,但是实际上依然存在巨大的差异的问题。使得a企业在复工情况下的能耗曲线参照b企业能耗曲线成为可能。另外,本技术方案更偏重于整体趋势的要求,对处于复工复产的阶段的企业数据进行分割计算,利用大数据参与的方式解决了各地区各行业之间都存在较大的不确定性的问题。
作为优选,在所述步骤一中,获取目标地区各历史阶段的历史能耗数据和当前能耗数据中至少包括以下子步骤:
a01,根据人工设定选择至少一个配电站或变电站作为目标地区确定点,以目标地区确定点中配电站或变电站供电范围选取所有企业的历史能耗数据或当前能耗数据;
a02,根据配电站或变电站和供电企业的供电关系,将配电站或变电站与历史能耗数据或当前能耗数据进行相互关联并进行存储;
a03,通过请求方式由政府和支付宝城市服务内容存储器中调取企业多维度信息与历史能耗数据或当前能耗数据进行一同存储。
本发明中,关联数据一个重要的点就是同一化,因此一般情况下可以选择各个企业对应的配电站作为同一的比较对比标准,进一步的由于是多个企业对应同一个配电站,可以降低相互之间的统计误差,但是在个别情况下,也不排除以变电站作为统计对象的情况;同时,由于配电站的计量和统计较为方便,将配电站作为合理的比较对象较为合理,企业多维度信息包括企业人数、企业经营范围、企业性质等各项维度数据,本发明中以企业性质维度为主,这里的企业性质指企业从事的行业性质,服务业、重工业、轻工业等。
作为优选,在步骤a02中,以企业能耗占用变电站或配电站的额定供电比作为能耗数值进行记录,记录时以目标地区整体供电额定值作为所有企业对比数值的统一标准,在目标区域进行变化时,根据目标地区整体供电额定值的变化进行换算。本发明采用了折算方式,可以在各个层级的区域中进行对比,相对比较直观。
作为优选,在所述步骤一中,对能耗数据根据设定的维度进行清洗,至少包括以下子步骤:
a04,读取企业多维度信息的设定,其中的维度至少包括根据企业性质维度、企业能耗层级和企业能耗类型维度;
a05,将企业实践信息、企业多维度信息、历史能耗数据和当前能耗数据进行关联形成带有维度的企业能耗数据;
a06,将企业时间信息、企业多维度信息、历史能耗数据和当前能耗数据按照企业多维度信息的设定存储为后续可用的多维度能耗数据。
本发明中的企业能耗数据即以时间轴关联的企业各个时间点的企业能耗数值连续集合,其整个连续集合是带有企业性质维度、企业能耗层级和企业能耗类型维度信息的。更进一步的就是在整个集合中每个企业能耗数值都带有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度,其中除了时间点维度外,其他维度都相同。
作为优选,企业性质维度由政府提供的注册经营范围确定,企业能耗层级由常态数据的均值进行确定,企业能耗层级至少存在有对应小微企业的最低级。本发明中,企业能耗层级主要用于区分能源大客户和针对服务业小微企业,这类企业具有各自的特点,在条件许可的条件下应当进行独立监控或者更换监控的方法,例如针对服务业小微企业,则可以直接通过写字楼的空置率等手段进行相应的监控和预测。对于各个层级的地区而言,服务业小微企业和能源大客户的设定条件也各不相同,可以通过相应的设定进行后续的区分,在区级地区的能源大客户并不必然在市级地区也属于能源大客户。
作为优选,在所述步骤二中,对清洗后的多维度能耗数据进行聚类分析,首先根据企业性质维度将企业性质中属于服务业且企业能耗层级为小微企业的部分企业从所有企业中取出,对于余下的所有企业以常态数据和复工数据分别执行以下步骤:
b01,构建企业多维度能耗数据空间,所述的企业多维度能耗数据空间至少包括企业能耗层级和企业能耗类型两个维度;
b02,根据人工选定的K个典型企业确定为K个聚类的中心;
b03,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;
b04,更新聚类中心,并重复b03步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供步骤三使用。
本发明中鉴于小微企业的性质与一般生产型企业存在较大不同,因此需要直接将其取出,而能源大客户因为存在与一般生产企业存在共性,因此不做去除,其数据可以进行后续的利用,故此,采用了上述方式。进一步的,本发明通过聚类的方式,将各个维度的信息加以利用,维度距离的计算中,需要设定企业多维度信息之间的维度距离,这个由人工加以规定,通过不同方式的调节后能够获得不同的结果,这个规定内容需要在整个地区计算时确定并统一。
作为优选,所述企业能耗类型由常态数据进行确定,将常态数据中企业能耗数值随着时间稳定收敛的企业确定为一类企业,将常态数据中企业能耗数值随着时间周期波动的企业确定为另一类企业。
本发明中,企业能耗数值大类上一般存在周期型和收敛型两大类形式,虽然很难完全符合周期型和收敛型的能耗表示,但是一般来说是可以较为明确的区分为周期型和收敛型两大类形,在此基础上其他能耗形式也可以根据近似的程度划分为周期型或收敛型,如果其变动幅度过大,则将其数据进行排除,由人工进行后续的处理。
作为优选,在所述步骤三中的训练数据测定子步骤:
c01,建立每一类的多维度能耗数据中的初始能耗数值集合Ro,Ro={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pk,t },Pk,t为k企业第t时间点的能耗数值,t为复工后从低能耗水平恢复后的时间维度表示,k为同一化后的企业编号,对能耗数值集合Ro进行均值和/或中位数计算,以能耗数值集合Ro为基础重构为前向差值能耗数值集合Re,Re={ P1,2-P1,1,P1,3-P1,2,…P1,t-P1,t-1,P2,2-P2,1,P2,3-P2,2,… P2,t-P2,t-1,… Pk,t-Pk,t-1 },对前向差值能耗数值集合进行均值和/或中位数计算;
c02,人工设定有对应能耗均值和/或能耗中位数的偏差系数值,通过偏差系数值确定每一类的多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
c03,选取所有符合mnk,t<Pk,t<mxk,t要求的企业,将所有符合要求的企业多维度能耗数值与时间维度重新进行关联后形成后续使用的能耗数值集合Rn,Rn={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pn,t },n≤k。
本发明此目的是将符合要求的企业进行筛选,这个筛选的方法就是为了鉴于小微企业的性质与一般生产型企业存在较大不同,因此需要直接将其取出,而能源大客户因为存在与一般生产企业存在共性,因此符合数据要求的能源大客户不做去除,其数据可以进行后续的利用,而不符合要求的可以被作为能源大客户进行独立计算和解析。在本发明中人工设定有对应能耗均值和/或能耗中位数的偏差系数值就是用于将能源大客户进行排查所设定的,很多情况下mnk,t取值都为0,特别是时间轴同一化的复工复产初期。更进一步的,mnk,t<Pk,t<mxk,t的形式设计,主要是为了同一化时间轴之后,确立大致的能耗变动趋势,只要位于这一趋势内的能耗数值集合,都可以被后续利用。能耗数值集合Rn与在整个集合中每个能耗数值都带有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度,其中除了时间点维度外,其他维度都相同。
作为优选,在步骤c02中,针对常态数据中企业能耗数值随着时间稳定收敛的企业采用能耗中位数与偏差系数值相关后计算多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
在步骤c02中,针对常态数据中企业能耗数值随着时间周期波动的企业采用能耗均值与偏差系数值相关后计算多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t。
本发明中,常态数据中企业能耗数值随着时间稳定收敛的企业采用能耗中位数计算更为合理,而常态数据中企业能耗数值随着时间周期波动的企业采用能耗均值或是能耗均值的中位数计算更为合理。
作为优选,在步骤三中,训练数据测定子步骤执行完成后,通过训练数据测定优化步骤后再送入神经网络进行训练:
d01,将能耗数值集合Rn拟合绘制能耗的均值曲线f(Rnav),Rnav为相同时间点处的能耗数值平均值,将前向差值能耗数值集合Re的均值拟合绘制能耗差值的均值曲线f(Reav),Reav为相同时间点处的能耗差值数值的平均值;
d02,根据能耗的均值曲线和能耗差值的均值曲线将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段;
d03,根据上升段、中间段和稳定段的分割方式,确定二次聚类的维度项,二次聚类的维度项至少包括对所有上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;
d04,设定若干个二次聚类的中心;在d04步骤中,根据需求设定二次聚类的中心,对于精确度要求越高的则d04,设定二次聚类的中心的个数越多,在设定二次聚类的中心时采用均匀分布、正态分布或卡方分布的形式进行设定。
d05,在步骤三中将能耗数值集合Rn和前向差值能耗数值集合Re制成对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1);
d06,对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1)确定企业复工的上升段、中间段和稳定段,并计算每个企业的二次聚类维度项形成企业的二次多维度数据;
d07,计算每个企业的二次多维度数据与二次聚类的中心的欧式距离,并根据欧式距离进行二次聚类;
d08,更新二次聚类的中心,并重复d07步骤直到二次聚类中心的迭代次数满足设定要求,将距离二次聚类的中心欧式距离最近的企业的二次多维度数据作为二次聚类时的中心数值集合。
在本发明中,首先将相同聚类后的数据的均值拟合成一条曲线,通过对曲线的分析将同一个聚类内的数据稳定分割成上升段、中间段和稳定段,然后根据分割后的结果,对能耗数值集合Rn进行数据膨胀,膨胀之后的数据在原有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度的基础上增加了上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率等维度,通过对带有这些维度的数据进行二次聚类,可以进一步对聚类内的数据作为细分。在细分过程中,对各个企业的能耗数值集合Rn进行拟合,以此来对各个企业自身的上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率等维度进行计算,这个维度和能耗数值集合Rn进行关联后送入神经网络进行训练。
作为优选,在步骤d02中,计算同一企业通过时间点进行关联的能耗数值的均值曲线的变化率、所占面积和/或拐点数量作为部分特征量,计算通过时间点进行关联的能耗数值的前向差值的均值曲线的变化率、所占面积和/或拐点数量作为另一部分特征量,根据特征量在分类器中的分类结果,将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段。
本发明中通过前向差值的计算,在原有数据基础上进行了放大,能够对变化率的识别更为敏感,对于能耗数值的复工数据的上升段、中间段和稳定段的划分更为准确合理,特别是对于上升段的识别和两种不同形式的稳定段的识别由前向差值为主进行分辨能够更为准确,稳定段的判别和常态数据也有相关性,可以设定当连续若干个时间点的能耗数值超过一定常态均值的90%开始记录为稳定段的开始时间点,或采用类似的方法,即可得到稳定段的划分。
作为优选,若执行d08步骤后,任意二次聚类后的数据量小于设定值,则将数据量小于设定值的二次聚类数据设定为目标数据集合,并执行数据扩充步骤:
d09,目标数据集合内的待扩充数据,在待扩充数据的上升段、中间段和稳定段三个区段内随机选择一个区段;
d10,在三个区段内任意选择一段数据作为待合并数据,根据待合并数据的时间点,去除待扩充数据内相应时间点的数据;在上升段、中间段和稳定段中,处于同一段区内选取的待扩充数据中能耗数值的个数大于待合并数据中能耗数值的个数的2倍;
d11,将待合并数据的首数据或首数据段中的能耗数值以及末数据或末数据段中的能耗数值分别通过过渡计算后与待扩充数据进行数据合并;
d12,判断目标数据集合内数据量是否大于设定值,若大于设定值则结束数据扩充步骤,否则重复执行步骤d10。
本发明中,由于对于小样本的地区来说,存在数据量不足的可能性,因此,本发明提出了以随机选取一段待扩充数据和一段待合并数据两者拼合的形式来进行扩充,扩充后的数据以待扩充数据作为基础样本,只选用待合并数据中的能耗数值,并不适用其关联的企业性质维度、企业能耗层级和企业能耗类型维度等数据,至于二次聚类时适用的维度,则由扩充后的数据重新计算获得,通过此方法可以明显扩充数据,用于后续的神经网络训练。
作为优选,在步骤d11中,待合并数据的首数据过渡计算的方式如下:
g01,选取待扩充数据Pa,c,Pa,c+1,…Pa,c+n,和待合并数据Pb,1,Pb,2,…Pb,c,
Pa,c表示待扩充数据采用a企业在c时间点处的能耗数值,Pb,c表示待合并数据采用b企业在c时间点处的能耗数值;
g02,待合并数据中的首数据为Pb,c,对应的待扩充数据为Pb,c ,
将Pb,c的能耗数值赋值为Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,s为时间维度上的距离相关值,e为自然常数;
g03,待扩充数据与待合并数据合并后的能耗数值按时间维度排序为:
Pb,1,Pb,2,…Pb,c-1,Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,Pa,c+1,…Pa,c+n,
能耗数值集合Rn中相同企业编号的能耗数值Pn,1,Pn,2,…Pn,t对应的企业性质维度、企业能耗层级和企业能耗类型维度均相等;
能耗数值集合Rn中采用数据扩充形式形成的能耗数值:
Pb,1,Pb,2,…Pb,c-1,Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,Pa,c+1,…Pa,c+n,
对应的企业性质维度、企业能耗层级和企业能耗类型维度与待扩充数据的企业性质维度、企业能耗层级和企业能耗类型维度相同。
本发明,合并数据时选用的自然常数e的指数函数,其中s为时间维度上的距离相关值0<s<1,在时间点均匀插入时可以直接选用 1/2,s也可以是为时间维度上与被插入最近相邻时间点距离平方与两个被插入时间点在时间维度上差值平方的比值,与时间维度上距离平方相关也和时间维度总长度平方相关,通过这个方式合并的数值,过渡平滑,在做曲线拟合的时候有较好的表现,能够辅助扩充数据的应用。
作为优选,在所述步骤四中利用测定优化步骤后的训练数据进行神经网络训练时执行以下步骤:
e01,在二次聚类后的属于同一类的所有数据中,二次聚类中心数值集合中的至少一个维度数据作为关联结果数据,企业的二次多维度数据作为关联训练数据;
e02,建立神经网络,将所有的关联训练数据和关联结果数据送入神经网络进行训练,直到训练后的神经网络的正确率大于设定值为止。
作为优选,在步骤e01中,若对应常态数据中企业能耗数值随着时间稳定收敛的企业,则将二次聚类后的属于同一类的二次聚类中心数值集合中稳定段的能耗数值的均值或中位数作为关联结果数据;
若对应常态数据中企业能耗数值随着时间周期波动的企业,则将二次聚类后的属于同一类的二次聚类的中心数值集合中稳定段的能耗数值的均值和最大变化率作为关联结果数据。
本发明中,此技术方案即对应二次聚类中心数值集合中的至少一个维度数据作为关联结果数据的具体表述,但是本发明中并不限定训练结果的数量,使用的神经网络可以是多输入单输出的神经网络,也可以是多输入多输出的神经网络。
作为优选,在步骤e01中,企业的二次多维度数据中只选取上升段和中间段数据作为关联训练数据。
本发明中,由于预测时所需的跨度较大,因此在神经网络训练时也需要将更多的算力分配在前期数据的分析和计算上,若是只通过选取部分上升段数据作为关联训练数据即能达到相应目标则为最佳,一般以上升段和中间段数据作为关联训练数据。
作为优选,在步骤e01中选用若干个串行的神经网络进行独立训练,其中至少一个神经网络针对上升段数据作为关联训练数据,至少一个神经网络针对中间段数据作为关联训练数据,在所有神经网络训练达到设定要求时将所有串行的神经网络进行合并。串行神经网络的合并属于现有技术中明显提高神经网络训练速度和训练有效性的一种技术方案,适合在本发明中进行应用。
作为优选,在所述步骤六中,包括以下子步骤:
f01,将清洗后的目标企业的当前企业能耗数据送入训练后的神经网络;
f02,通过神经网络输出当前企业能耗数据的分类,并根据当前企业能耗数据的分类获得所处分类在二次聚类时的中心数值集合;
f03,根据目标企业的当前能耗数据的时间点查询所处分类在二次聚类时的数值集合在对应时间点之后的数值集合作为目标企业的预测能耗数据。
经过训练的神经网络可以起到准确预测的功能,在这个前提下,采用目标企业的当前企业能耗数据中各个维度数据作为输入量,进入神经网络进行分类,特别是目标企业的二次聚合时所需用的维度数据作为输入量进行输入。更具体的说,目标企业进行一次聚类之后确定类别等参数,然后选择其的拟合曲线参数,根据上述聚类和拟合的参数,送入神经网络进行处理后可以给出一个在二次聚类后所在类处的典型数值,此典型数值和时间点关联后的曲线即为预测数据。更进一步的,还可根据当前目标企业的能耗数值与预测数据的差值进行进一步折算以期获得更为准确的数值,这个折算可以根据瞬时值进行折算:例如当前能耗数值为8,而同一时间点的预测数据能耗数值为10,而3个时间点后的预测数据能耗数值为20,则3个时间点后的目标企业的预测能耗数值为16。这个折算可以根据累积值进行折算:例如累积能耗数值为80,而同一时间点的预测数据能耗数值的累积值为100,而3个时间点后的预测数据能耗数值为20,则3个时间点后的目标企业的预测能耗数值为16。
作为优选,在f01步骤中,目标企业的当前能耗数据中若已经包括稳定段数据,则直接用于执行步骤六,否则将目标企业的当前能耗数据送入神经网络进行预测,目标企业的当前能耗数据至少需要包括一段上升段数据。
本发明中,直接用于执行步骤六是因为,直接选用其稳定段数据,这里需要指出的是,若为周期性数据,则至少确定存在有一个周期的能耗数值,而对于收敛性数值,则只需连续数个收敛数据即可。
作为优选,在步骤六中,通过下列公式进行能耗水平指数的计算:
上式中,Z为能耗水平指数,n为当前区域内符合计算设定的运营企业数量,当t为当前时间点时,Pm,t为编号为m的目标企业的当前能耗数据中的能耗数值,当t作为预测数据大于当前时间点时,Pm,t为目标企业的当前所处分类在二次聚类时的中心数值集合中的能耗数值在对应时间点处的能耗数值,Qn为目标企业的常态数据中的能耗数值。
作为优选,在显示地区的整体能耗水平时,设立有时间轴,在相同时间点下,显示当前或预测的地区的整体能耗水平;
在显示地区的整体能耗水平时,通过设定颜色色相、明度和纯度参数进行区分,当前地区的能耗水平处于不同层级时,采用色相进行区分;当前地区的能耗水平处于相同层级时,根据地区的整体能耗水平的具体参数采用相同色相不同明度和纯度进行区分。
本发明中采用相同色相不同明度和纯度进行区分时可以将能耗水平指数作为参数,直接用于调整相关的明度和纯度,在此技术上,显示的内容可见性直观性更佳,能够获得更好的体验。
一种地区整体能耗监控系统,使用如上所述的地区整体能耗监控方法,包括显示器、计算单元和数据采集单元,
所述数据采集单元,获取当前能耗数据和历史能耗数据;
所述显示器显示计算单元给出的当前地区的能耗水平;
所述计算单元通过执行以下步骤来判断并预测地区整体的能耗水平:
步骤一,根据设定的维度进行数据清洗;
步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;
步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;
步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;
步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;
步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平。
本发明的实质性效果是:本发明可以根据各个企业的能耗水平进一步的推测地区内的整体能耗水平及其相关的预测。其中,步骤二和步骤三的设置也可以采用更多本地区特色的合理的参数和分类,还可以将包括能源来源等参数进行关联和计算,以期达到更好的适用性。因此,通过本发明的技术方案,提供了一种当前地区能耗水平预测的方法,特别适用于复工复产时期的监测和预测,能够较为精准的预测后续的负荷能耗。
附图说明
图1为本发明中最终结果的一种效果示意图;
图2为本发明中关于聚类分析的一种示意图;
图3为本发明中2018年度复工复产的一种曲线示意图;
图4为本发明中2019年度复工复产的一种曲线示意图;
图5为本发明中能耗均值的一种示意图;
图6为本发明中能耗前向差值的一种示意图;
图7为本发明地区整体能耗监控方法的流程示意图;
图8为本发明地区整体能耗监控系统的结构示意图;
图中:1、显示器,2、计算单元,3、数据采集单元。
具体实施方式
下面通过具体实施例,对本发明的技术方案作进一步的具体说明。
实施例1:
一种地区整体能耗监控方法(参见附图7),获取目标地区内企业的当前能耗数据和历史能耗数据,并通过执行以下步骤来判断并预测地区整体的能耗水平:
步骤一,根据设定的维度进行数据清洗;
步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;
步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;
步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;
步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;
步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平。
本实施例的具体技术可以简单概括为以下内容,首先对获取的技术进行数据清洗,清洗之后的数据符合进行第二步处理;步骤二中,将常态数据、复工数据进行选用,特别是对复工数据进行聚类分析,主要的分类标准中至少包括企业能耗层级和企业能耗类型,也就是说至少是需要在企业能耗层级和企业能耗类型两个层面上将企业进行区分;步骤三,将聚类之后的数据进行数据整合,整合的意义在于,对训练数据测定之后进行关联整合,也就是通过已确定的不同维度参数来确定对应的基准能耗曲线,其中不同的维度参数作为训练数据,能耗数值作为训练验证结果,因此需要在步骤三中整合关联到能耗数值中,而在这个过程中,训练数据的测定子步骤是用于进一步优化训练数据的一个过程,至少要能在清洗后的原始数据之上进行一次数据膨胀,利用测定子步骤中的数据膨胀,可以增加输入参数,能够有效加强预测的准确性,当然,在一定条件下也可以直接将清洗过后的原始数据进行直接的神经网络训练,也能得到具有一定参考意义的数据内容;步骤四、步骤五中,神经网络作为分类使用,为了提高神经网络分类的准确性,需要对分类密度进行合理的设定,因此,在本实施例的基础上,可以对地区内的能源大户进行分开的独立测算以增加计算的准确度,在企业数据密度足够的中段数据上,则大部分情况下只要分类划分合理,是可以通过选出相同类下典型的能耗数值及其能耗数值的变化形式来预测后续能耗的变动,只要在神经网络中的分类划分的足够细致,数据的准确性就会极大提高;步骤六,则可以根据各个企业的能耗水平进一步的推测地区内的整体能耗水平及其相关的预测。其中,步骤二和步骤三的设置也可以采用更多本地区特色的合理的参数和分类,还可以将包括能源来源等参数进行关联和计算,以期达到更好的适用性。因此,通过本实施例的技术方案,提供了一种当前地区能耗水平预测的方法,特别是适用于复工复产时期的监测和预测,能够较为精准的预测后续的负荷能耗。本实施例实施时,只要数据量越大,那么其所在地区的整体准确性也就越高,因为所有的数据的平均值都会趋向于聚类中心,所以即使大部分企业的实际运行和作为预测使用的聚类中心间必然存在一定量的误差,但是此误差数据一方面是可以容忍的。另一方面,由于数量巨大,各个企业的误差被相互中和,因此在此基础上能够实现地区的整体能耗判断。进一步的,受限于地区经济状况本身,一般地区内企业的能耗数值都是以正态分布或金字塔型等形式,但是能源大户、支柱性企业的数量一般会较少,同时小微企业也存在用电能耗较少,统计时量级差距过大等问题。因此,需要针对一个地区设定不同的上下限,既能照顾到绝大多数的企业,又能将小微企业大型企业进行分别针对,以此来提高预测的精度,所以应当引入各种其他配合数据和方法进行进一步的强化其的预测性;例如,针对能源大客户即可应用如中国专利申请号CN201711070575.0 一种区域内支柱性电力用户的电量预测方法和系统所提供的技术方案进行监控和预测,而针对服务业小微企业,则可以直接通过写字楼的空置率等手段进行相应的监控和预测。另一方面,小微企业和大型企业的定义是可变的,在数据量足够的情况下,小微企业大型企业也可以采用本实施例中上述技术方案进行预测。也就是说,小微企业和大型企业在本实施例中,只是根据企业能耗数值以及当地的实际情况所差异化设定的分类,并不牵涉到税务、员工等商业定性。
在所述步骤一中,获取目标地区各历史阶段的历史能耗数据和当前能耗数据中至少包括以下子步骤:
a01,根据人工设定选择至少一个配电站或变电站作为目标地区确定点,以目标地区确定点中配电站或变电站供电范围选取所有企业的历史能耗数据或当前能耗数据;
a02,根据配电站或变电站和供电企业的供电关系,将配电站或变电站与历史能耗数据或当前能耗数据进行相互关联并进行存储;
a03,通过请求方式由政府和支付宝城市服务内容存储器中调取企业多维度信息与历史能耗数据或当前能耗数据进行一同存储。
本实施例中,关联数据一个重要的点就是同一化,因此一般情况下可以选择各个企业对应的配电站作为同一的比较对比标准,进一步的由于是多个企业对应同一个配电站,可以降低相互之间的统计误差,但是在个别情况下,也不排除以变电站作为统计对象的情况;同时,由于配电站的计量和统计较为方便,将配电站作为合理的比较对象,较为合理,企业多维度信息包括企业人数、企业经营范围、企业性质等各项维度数据,本实施例中以企业性质维度为主,这里的企业性质指企业从事的行业性质,服务业、重工业、轻工业等。
在步骤a02中,以企业能耗占用变电站或配电站的额定供电比作为能耗数值进行记录,记录时以目标地区整体供电额定值作为所有企业对比数值的统一标准,在目标区域进行变化时,根据目标地区整体供电额定值的变化进行换算。本实施例采用了折算方式,可以在各个层级的区域中进行对比,相对比较直观。
在所述步骤一中,对能耗数据根据设定的维度进行清洗,至少包括以下子步骤:
a04,读取企业多维度信息的设定,其中的维度至少包括根据企业性质维度、企业能耗层级和企业能耗类型维度;
a05,将企业实践信息、企业多维度信息、历史能耗数据和当前能耗数据进行关联形成带有维度的企业能耗数据;
a06,将企业时间信息、企业多维度信息、历史能耗数据和当前能耗数据按照企业多维度信息的设定存储为后续可用的多维度能耗数据。
本实施例中的企业能耗数据即以时间轴关联的企业各个时间点的企业能耗数值连续集合,其整个连续集合是带有企业性质维度、企业能耗层级和企业能耗类型维度信息的。更进一步的就是在整个集合中每个企业能耗数值都带有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度,其中除了时间点维度外,其他维度都相同。
企业性质维度由政府提供的注册经营范围确定,企业能耗层级由常态数据的均值进行确定,企业能耗层级至少存在有对应小微企业的最低级。本实施例中,企业能耗层级主要用于区分能源大客户和针对服务业小微企业,这类企业具有各自的特点,在条件许可的条件下应当进行独立监控或者更换监控的方法,例如针对服务业小微企业,则可以直接通过写字楼的空置率等手段进行相应的监控和预测。对于各个层级的地区而言,服务业小微企业和能源大客户的设定条件也各不相同,可以通过相应的设定进行后续的区分,在区级地区的能源大客户并不必然在市级地区也属于能源大客户。
在所述步骤二中,对清洗后的多维度能耗数据进行聚类分析(参见附图2),首先根据企业性质维度将企业性质中属于服务业且企业能耗层级为小微企业的部分企业从所有企业中取出,对于余下的所有企业以常态数据和复工数据分别执行以下步骤:
b01,构建企业多维度能耗数据空间,所述的企业多维度能耗数据空间至少包括企业能耗层级和企业能耗类型两个维度;
b02,根据人工选定的K个典型企业确定为K个聚类的中心;
b03,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;
b04,更新聚类中心,并重复b03步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供步骤三使用。
本实施例中鉴于小微企业的性质与一般生产型企业存在较大不同,因此需要直接将其取出,而能源大客户因为存在与一般生产企业存在共性,因此不做去除,其数据可以进行后续的利用,故此,采用了上述方式。进一步的,本实施例通过聚类的方式,将各个维度的信息加以利用,维度距离的计算中,需要设定企业多维度信息之间的维度距离,这个由人工加以规定,通过不同方式的调节后能够获得不同的结果,这个规定内容需要在整个地区计算时确定并统一。
所述企业能耗类型由常态数据进行确定,将常态数据中企业能耗数值随着时间稳定收敛的企业确定为一类企业,将常态数据中企业能耗数值随着时间周期波动的企业确定为另一类企业。
本实施例中,企业能耗数值大类上一般存在周期型和收敛型两大类形式(参见附图3和附图4),虽然很难完全符合周期型和收敛型的能耗表示,但是一般来说是可以较为明确的区分为周期型和收敛型两大类形,在此基础上其他能耗形式也可以根据近似的程度划分为周期型或收敛型,如果其变动幅度过大,则将其数据进行排除,由人工进行后续的处理。
在所述步骤三中的训练数据测定子步骤:
c01,建立每一类的多维度能耗数据中的初始能耗数值集合Ro,Ro={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pk,t },Pk,t为k企业第t时间点的能耗数值,t为复工后从低能耗水平恢复后的时间维度表示,k为同一化后的企业编号,对能耗数值集合Ro进行均值和/或中位数计算,以能耗数值集合Ro为基础重构为前向差值能耗数值集合Re,Re={ P1,2-P1,1,P1,3-P1,2,…P1,t-P1,t-1,P2,2-P2,1,P2,3-P2,2,… P2,t-P2,t-1,… Pk,t-Pk,t-1 },对前向差值能耗数值集合进行均值和/或中位数计算;
c02,人工设定有对应能耗均值和/或能耗中位数的偏差系数值,通过偏差系数值确定每一类的多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
c03,选取所有符合mnk,t<Pk,t<mxk,t要求的企业,将所有符合要求的企业多维度能耗数值与时间维度重新进行关联后形成后续使用的能耗数值集合Rn,Rn={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pn,t },n≤k。
本实施例此目的是将符合要求的企业进行筛选,这个筛选的方法就是为了鉴于小微企业的性质与一般生产型企业存在较大不同,因此需要直接将其取出,而能源大客户因为存在与一般生产企业存在共性,因此符合数据要求的能源大客户不做去除,其数据可以进行后续的利用,而不符合要求的可以被作为能源大客户进行独立计算和解析。在本实施例中人工设定有对应能耗均值和/或能耗中位数的偏差系数值就是用于将能源大客户进行排查所设定的,很多情况下mnk,t取值都为0,特别是时间轴同一化的复工复产初期。更进一步的,mnk,t<Pk,t<mxk,t的形式设计,主要是为了同一化时间轴之后,确立大致的能耗变动趋势,只要位于这一趋势内的能耗数值集合,都可以被后续利用。能耗数值集合Rn与在整个集合中每个能耗数值都带有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度,其中除了时间点维度外,其他维度都相同。
在步骤c02中,针对常态数据中企业能耗数值随着时间稳定收敛的企业采用能耗中位数与偏差系数值相关后计算多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
在步骤c02中,针对常态数据中企业能耗数值随着时间周期波动的企业采用能耗均值与偏差系数值相关后计算多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t。
本实施例中,常态数据中企业能耗数值随着时间稳定收敛的企业采用能耗中位数计算更为合理,而常态数据中企业能耗数值随着时间周期波动的企业采用能耗均值或是能耗均值的中位数计算更为合理(参见附图5和附图6)。
在步骤三中,训练数据测定子步骤执行完成后,通过训练数据测定优化步骤后再送入神经网络进行训练:
d01,将能耗数值集合Rn拟合绘制能耗的均值曲线f(Rnav),Rnav为相同时间点处的能耗数值平均值,将前向差值能耗数值集合Re的均值拟合绘制能耗差值的均值曲线f(Reav),Reav为相同时间点处的能耗差值数值的平均值;
d02,根据能耗的均值曲线和能耗差值的均值曲线将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段;
d03,根据上升段、中间段和稳定段的分割方式,确定二次聚类的维度项,二次聚类的维度项至少包括对所有上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;
d04,设定若干个二次聚类的中心;在d04步骤中,根据需求设定二次聚类的中心,对于精确度要求越高的则d04,设定二次聚类的中心的个数越多,在设定二次聚类的中心时采用均匀分布、正态分布或卡方分布的形式进行设定。
d05,在步骤三中将能耗数值集合Rn和前向差值能耗数值集合Re制成对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1);
d06,对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1)确定企业复工的上升段、中间段和稳定段,并计算每个企业的二次聚类维度项形成企业的二次多维度数据;
d07,计算每个企业的二次多维度数据与二次聚类的中心的欧式距离,并根据欧式距离进行二次聚类;
d08,更新二次聚类的中心,并重复d07步骤直到二次聚类中心的迭代次数满足设定要求,将距离二次聚类的中心欧式距离最近的企业的二次多维度数据作为二次聚类时的中心数值集合。
在本实施例中,首先将相同聚类后的数据的均值拟合成一条曲线,通过对曲线的分析将同一个聚类内的数据稳定分割成上升段、中间段和稳定段,然后根据分割后的结果,对能耗数值集合Rn进行数据膨胀,膨胀之后的数据在原有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度的基础上增加了上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率等维度,通过对带有这些维度的数据进行二次聚类,可以进一步对聚类内的数据作为细分。在细分过程中,对各个企业的能耗数值集合Rn进行拟合,以此来对各个企业自身的上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率等维度进行计算,这个维度和能耗数值集合Rn进行关联后送入神经网络进行训练。
在步骤d02中,计算同一企业通过时间点进行关联的能耗数值的均值曲线的变化率、所占面积和/或拐点数量作为部分特征量,计算通过时间点进行关联的能耗数值的前向差值的均值曲线的变化率、所占面积和/或拐点数量作为另一部分特征量,根据特征量在分类器中的分类结果,将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段。
本实施例中通过前向差值的计算,在原有数据基础上进行了放大,能够对变化率的识别更为敏感,对于能耗数值的复工数据的上升段、中间段和稳定段的划分更为准确合理,特别是对于上升段的识别和两种不同形式的稳定段的识别由前向差值为主进行分辨能够更为准确,稳定段的判别和常态数据也有相关性,可以设定当连续若干个时间点的能耗数值超过一定常态均值的90%开始记录为稳定段的开始时间点,或采用类似的方法,即可得到稳定段的划分。
若执行d08步骤后,任意二次聚类后的数据量小于设定值,则将数据量小于设定值的二次聚类数据设定为目标数据集合,并执行数据扩充步骤:
d09,目标数据集合内的待扩充数据,在待扩充数据的上升段、中间段和稳定段三个区段内随机选择一个区段;
d10,在三个区段内任意选择一段数据作为待合并数据,根据待合并数据的时间点,去除待扩充数据内相应时间点的数据;在上升段、中间段和稳定段中,处于同一段区内选取的待扩充数据中能耗数值的个数大于待合并数据中能耗数值的个数的2倍;
d11,将待合并数据的首数据或首数据段中的能耗数值以及末数据或末数据段中的能耗数值分别通过过渡计算后与待扩充数据进行数据合并;
d12,判断目标数据集合内数据量是否大于设定值,若大于设定值则结束数据扩充步骤,否则重复执行步骤d10。
本实施例中,由于对于小样本的地区来说,存在数据量不足的可能性。因此,本实施例提出了以随机选取一段待扩充数据和一段待合并数据两者拼合的形式来进行扩充,扩充后的数据以待扩充数据作为基础样本,只选用待合并数据中的能耗数值,并不适用其关联的企业性质维度、企业能耗层级和企业能耗类型维度等数据,至于二次聚类时适用的维度,则由扩充后的数据重新计算获得,通过此方法可以明显扩充数据,用于后续的神经网络训练。
在步骤d11中,待合并数据的首数据过渡计算的方式如下:
g01,选取待扩充数据Pa,c,Pa,c+1,…Pa,c+n,和待合并数据Pb,1,Pb,2,…Pb,c;
Pa,c表示待扩充数据采用a企业在c时间点处的能耗数值,Pb,c表示待合并数据采用b企业在c时间点处的能耗数值;
g02,待合并数据中的首数据为Pb,c,对应的待扩充数据为Pb,c ,
将Pb,c的能耗数值赋值为Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,s为时间维度上的距离相关值,e为自然常数;
g03,待扩充数据与待合并数据合并后的能耗数值按时间维度排序为:
Pb,1,Pb,2,…Pb,c-1,Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,Pa,c+1,…Pa,c+n 。
能耗数值集合Rn中相同企业编号的能耗数值Pn,1,Pn,2,…Pn,t对应的企业性质维度、企业能耗层级和企业能耗类型维度均相等;
能耗数值集合Rn中采用数据扩充形式形成的能耗数值:
Pb,1,Pb,2,…Pb,c-1,Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,Pa,c+1,…Pa,c+n
对应的企业性质维度、企业能耗层级和企业能耗类型维度与待扩充数据的企业性质维度、企业能耗层级和企业能耗类型维度相同。
本实施例,合并数据时选用的自然常数e的指数函数,其中s为时间维度上的距离相关值0<s<1,在时间点均匀插入时可以直接选用 1/2,s也可以是为时间维度上与被插入最近相邻时间点距离平方与两个被插入时间点在时间维度上差值平方的比值,与时间维度上距离平方相关也和时间维度总长度平方相关,通过这个方式合并的数值,过渡平滑,在做曲线拟合的时候有较好的表现,能够辅助扩充数据的应用。
在所述步骤四中利用测定优化步骤后的训练数据进行神经网络训练时执行以下步骤:
e01,在二次聚类后的属于同一类的所有数据中,二次聚类中心数值集合中的至少一个维度数据作为关联结果数据,企业的二次多维度数据作为关联训练数据;
e02,建立神经网络,将所有的关联训练数据和关联结果数据送入神经网络进行训练,直到训练后的神经网络的正确率大于设定值为止;
在步骤e01中,若对应常态数据中企业能耗数值随着时间稳定收敛的企业,则将二次聚类后的属于同一类的二次聚类中心数值集合中稳定段的能耗数值的均值或中位数作为关联结果数据;
若对应常态数据中企业能耗数值随着时间周期波动的企业,则将二次聚类后的属于同一类的二次聚类的中心数值集合中稳定段的能耗数值的均值和最大变化率作为关联结果数据。
本实施例中,此技术方案即对应二次聚类中心数值集合中的至少一个维度数据作为关联结果数据的具体表述,但是本实施例中并不限定训练结果的数量,使用的神经网络可以是多输入单输出的神经网络,也可以是多输入多输出的神经网络。
在步骤e01中,企业的二次多维度数据中只选取上升段和中间段数据作为关联训练数据。
本实施例中,由于预测时所需的跨度较大,因此在神经网络训练时也需要将更多的算力分配在前期数据的分析和计算上,若是只通过选取部分上升段数据作为关联训练数据即能达到相应目标则为最佳,一般以上升段和中间段数据作为关联训练数据。
在步骤e01中选用若干个串行的神经网络进行独立训练,其中至少一个神经网络针对上升段数据作为关联训练数据,至少一个神经网络针对中间段数据作为关联训练数据,在所有神经网络训练达到设定要求时将所有串行的神经网络进行合并。串行神经网络的合并属于现有技术中明显提高神经网络训练速度和训练有效性的一种技术方案,适合在本实施例中进行应用。
在所述步骤六中,包括以下子步骤:
f01,将清洗后的目标企业的当前企业能耗数据送入训练后的神经网络;
f02,通过神经网络输出当前企业能耗数据的分类,并根据当前企业能耗数据的分类获得所处分类在二次聚类时的中心数值集合;
f03,根据目标企业的当前能耗数据的时间点查询所处分类在二次聚类时的数值集合在对应时间点之后的数值集合作为目标企业的预测能耗数据。
经过训练的神经网络可以起到准确预测的功能,在这个前提下,采用目标企业的当前企业能耗数据中各个维度数据作为输入量,进入神经网络进行分类,特别是目标企业的二次聚合时所需用的维度数据作为输入量进行输入,更具体的说,目标企业进行一次聚类之后确定类别等参数,然后选择其的拟合曲线参数,根据上述聚类和拟合的参数,送入神经网络进行处理后可以给出一个在二次聚类后所在类处的典型数值,此典型数值和时间点关联后的曲线即为预测数据,更进一步的,还可根据当前目标企业的能耗数值与预测数据的差值进行进一步折算以期获得更为准确的数值,这个折算可以根据瞬时值进行折算:例如当前能耗数值为8,而同一时间点的预测数据能耗数值为10,而3个时间点后的预测数据能耗数值为20,则3个时间点后的目标企业的预测能耗数值为16。这个折算可以根据累积值进行折算:例如累积能耗数值为80,而同一时间点的预测数据能耗数值的累积值为100,而3个时间点后的预测数据能耗数值为20,则3个时间点后的目标企业的预测能耗数值为16。
在f01步骤中,目标企业的当前能耗数据中若已经包括稳定段数据,则直接用于执行步骤六,否则将目标企业的当前能耗数据送入神经网络进行预测,目标企业的当前能耗数据至少需要包括一段上升段数据。
本实施例中,直接用于执行步骤六是因为,直接选用其稳定段数据,这里需要指出的是,若为周期性数据,则至少确定存在有一个周期的能耗数值,而对于收敛性数值,则只需连续数个收敛数据即可。
在步骤六中,通过下列公式进行能耗水平指数的计算:
上式中,Z为能耗水平指数,n为当前区域内符合计算设定的运营企业数量,当t为当前时间点时,Pm,t为编号为m的目标企业的当前能耗数据中的能耗数值,当t作为预测数据大于当前时间点时,Pm,t为目标企业的当前所处分类在二次聚类时的中心数值集合中的能耗数值在对应时间点处的能耗数值,Qn为目标企业的常态数据中的能耗数值。
在显示地区的整体能耗水平时,设立有时间轴,在相同时间点下,显示当前或预测的地区的整体能耗水平;
在显示地区的整体能耗水平时(参见附图1),通过设定颜色色相、明度和纯度参数进行区分,当前地区的能耗水平处于不同层级时,采用色相进行区分;当前地区的能耗水平处于相同层级时,根据地区的整体能耗水平的具体参数采用相同色相不同明度和纯度进行区分。
本实施例中采用相同色相不同明度和纯度进行区分时可以将能耗水平指数作为参数,直接用于调整相关的明度和纯度,在此技术上,显示的内容可见性直观性更佳,能够获得更好的体验。本实施例中采用相同色相不同明度和纯度进行区分时可以将能耗水平指数作为参数,直接用于调整相关的明度和纯度,在此基础上,显示的内容可见性直观性更佳,能够获得更好的体验。具体的说,在同一张地图上设置了时间轴之后,通过调节时间轴,或者动画化之后,即使能耗层级相同,但是由于指数的变化,使用者依然可以明显感知到明度和纯度的变化,在人为观察和判断上较为可靠。在此基础上,还可以将本实施例中的小微企业数据与大中型生产企业的数据进行结合,以及能源大户的数据进行结合,从而进一步得出预测数据。使用者根据负荷恢复情况和预测情况,可以安排对应的措施,电网企业也可以根据对应的负荷情况,进行检修维护计划的安排。
本实施例中的显示图,还可以和其他更多的数据进行相关显示,比如,通过支付宝、钉钉、税务系统等,将企业中注册员工数量和企业能耗指数进行关联,如此一来就可以将能耗水平指数转换为员工复工率水平指数,通过这个员工复功率水平指数,即可进一步掌握当前社会的就业状态,将处于就业停工状态的员工数量进行大致统计,从而制定相应的措施。
一种地区整体能耗监控系统(参见附图8),使用如上所述的地区整体能耗监控方法,包括显示器1、计算单元2和数据采集单元3,
所述数据采集单元,获取当前能耗数据和历史能耗数据;
所述显示器显示计算单元给出的当前地区的能耗水平;
所述计算单元通过执行以下步骤来判断并预测地区整体的能耗水平:
步骤一,根据设定的维度进行数据清洗;
步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;
步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;
步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;
步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;
步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平。
本实施例针对现有技术,作出了如下改进:
本技术方案虽然也依赖相似日的数据,但是,本技术方案适用的相似日,区分有行业,对于相似日曲线的应用解析更为深入,解决了疫情的出现,使得相似日很难进行获取,特别是复工复产时段,虽然与春节复工有一定的相似,但是实际上依然存在巨大的差异的问题。使得a企业在复工情况下的能耗曲线参照b企业能耗曲线成为可能。第二,本技术方案更偏重于整体趋势的要求,对处于复工复产的阶段的企业数据进行分割计算,利用大数据参与的方式解决了各地区各行业之间都存在较大的不确定性的问题。
综上所述,本实施例可以根据各个企业的能耗水平进一步的推测地区内的整体能耗水平及其相关的预测。其中,步骤二和步骤三的设置也可以采用更多本地区特色的合理的参数和分类,还可以将包括能源来源等参数进行关联和计算,以期达到更好的适用性。因此,通过本实施例的技术方案,提供了一种当前地区能耗水平预测的方法,特别是适用于复工复产时期的监测和预测,能够较为精准的预测后续的负荷能耗。使用者即可根据电网能耗的使用情况和预测的使用情况,安排对应的措施,电网企业也可以根据对应的负荷情况,进行检修维护计划的安排,对电网设备进行合理的维护、改造、加装和升级。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
Claims (17)
1.一种地区整体能耗监控方法,其特征在于:获取目标地区内企业的当前能耗数据和历史能耗数据,并通过执行以下步骤来判断并预测地区整体的能耗水平:
步骤一,根据设定的维度进行数据清洗;
步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;
步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;
步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;
步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;
步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平;
在所述步骤二中,对清洗后的复工数据进行聚类分析,首先根据企业性质维度将企业性质中属于服务业且企业能耗层级为小微企业的部分企业从所有企业中取出,对于余下的所有企业以常态数据和复工数据分别执行以下步骤:
b01,构建企业多维度能耗数据空间,所述的企业多维度能耗数据空间至少包括企业能耗层级和企业能耗类型两个维度;
b02,根据人工选定的K个典型企业确定为K个聚类的中心;
b03,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;
b04,更新聚类中心,并重复b03步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供步骤三使用;
在所述步骤三中的训练数据测定子步骤:
c01,建立每一类的多维度能耗数据中的初始能耗数值集合Ro,Ro={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pk,t },Pk,t为k企业第t时间点的能耗数值,t为复工后从低能耗水平恢复后的时间维度表示,k为同一化后的企业编号,对能耗数值集合Ro进行均值和/或中位数计算,以能耗数值集合Ro为基础重构为前向差值能耗数值集合Re,Re={ P1,2-P1,1,P1,3-P1,2,…P1,t-P1,t-1,P2,2-P2,1,P2,3-P2,2,… P2,t-P2,t-1,… Pk,t-Pk,t-1 },对前向差值能耗数值集合进行均值和/或中位数计算;
c02,人工设定有对应能耗均值和/或能耗中位数的偏差系数值,通过偏差系数值确定每一类的多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
c03,选取所有符合mnk,t<Pk,t<mxk,t要求的企业,将所有符合要求的企业多维度能耗数值与时间维度重新进行关联后形成后续使用的能耗数值集合Rn,Rn={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pn,t },n≤k,Pn,t为符合mnk,t<Pk,t<mxk,t要求的n企业第t时间点的能耗数值;
在步骤三中,训练数据测定子步骤执行完成后,通过训练数据测定优化步骤后再送入神经网络进行训练:
d01,将能耗数值集合Rn拟合绘制能耗的均值曲线f(Rnav),Rnav为相同时间点处的能耗数值平均值,将前向差值能耗数值集合Re的均值拟合绘制能耗差值的均值曲线f(Reav),Reav为相同时间点处的能耗差值数值的平均值;
d02,根据能耗的均值曲线和能耗差值的均值曲线将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段;
d03,根据上升段、中间段和稳定段的分割方式,确定二次聚类的维度项,二次聚类的维度项至少包括对所有上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;
d04,设定若干个二次聚类的中心;
d05,在步骤三中将能耗数值集合Rn和前向差值能耗数值集合Re制成对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1);
d06,对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1)确定企业复工的上升段、中间段和稳定段,并计算每个企业的二次聚类维度项形成企业的二次多维度数据;
d07,计算每个企业的二次多维度数据与二次聚类的中心的欧式距离,并根据欧式距离进行二次聚类;
d08,更新二次聚类的中心,并重复d07步骤直到二次聚类中心的迭代次数满足设定要求,将距离二次聚类的中心欧式距离最近的企业的二次多维度数据作为二次聚类时的中心数值集合;
若执行d08步骤后,任意二次聚类后的数据量小于设定值,则将数据量小于设定值的二次聚类数据设定为目标数据集合,并执行数据扩充步骤:
d09,目标数据集合内的待扩充数据,在待扩充数据的上升段、中间段和稳定段三个区段内随机选择一个区段;
d10,在三个区段内任意选择一段数据作为待合并数据,根据待合并数据的时间点,去除待扩充数据内相应时间点的数据;
d11,将待合并数据的首数据或首数据段中的能耗数值以及末数据或末数据段中的能耗数值分别通过过渡计算后与待扩充数据进行数据合并;
d12,判断目标数据集合内数据量是否大于设定值,若大于设定值则结束数据扩充步骤,否则重复执行步骤d10;
在步骤d11中,待合并数据的首数据过渡计算的方式如下:
g01,选取待扩充数据Pa,c,Pa,c+1,…Pa,c+n,和待合并数据Pb,1,Pb,2,…Pb,c;
Pa,c表示待扩充数据采用a企业在c时间点处的能耗数值,Pb,c表示待合并数据采用b企业在c时间点处的能耗数值;
g02,待合并数据中的首数据为Pb,c,对应的待扩充数据为Pa,c ,
将Pb,c的能耗数值赋值为Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,s为时间维度上的距离相关值,e为自然常数;
g03,待扩充数据与待合并数据合并后的能耗数值按时间维度排序为:
Pb,1,Pb,2,…Pb,c-1,Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,Pa,c+1,…Pa,c+n;
通过对曲线的分析将同一个聚类内的数据稳定分割成上升段、中间段和稳定段,然后根据分割后的结果,对能耗数值集合Rn进行数据膨胀,膨胀之后的数据在原有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度的基础上增加了上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率维度,扩充后的数据以待扩充数据作为基础样本,只选用待合并数据中的能耗数值,并不适用其关联的企业性质维度、企业能耗层级和企业能耗类型维度数据,至于二次聚类时适用的维度,则由扩充后的数据重新计算获得。
2.根据权利要求1所述的地区整体能耗监控方法,其特征在于:
获取目标地区各历史阶段的历史能耗数据和当前能耗数据中至少包括以下子步骤:
a01,根据人工设定选择至少一个配电站或变电站作为目标地区确定点,以目标地区确定点中配电站或变电站供电范围选取所有企业的历史能耗数据或当前能耗数据;
a02,根据配电站或变电站和供电企业的供电关系,将配电站或变电站与历史能耗数据或当前能耗数据进行相互关联并进行存储;
a03,通过请求方式由政府和支付宝城市服务内容存储器中调取企业多维度信息与历史能耗数据或当前能耗数据进行一同存储。
3.根据权利要求2所述的地区整体能耗监控方法,其特征在于:
在步骤a02中,以企业能耗占用变电站或配电站的额定供电比作为能耗数值进行记录,记录时以目标地区整体供电额定值作为所有企业对比数值的统一标准,在目标区域进行变化时,根据目标地区整体供电额定值的变化进行换算。
4.根据权利要求2所述的地区整体能耗监控方法,其特征在于:
在所述步骤一中,对能耗数据根据设定的维度进行清洗,至少包括以下子步骤:
a04,读取企业多维度信息的设定,其中的维度至少包括根据企业性质维度、企业能耗层级和企业能耗类型维度;
a05,将企业实践信息、企业多维度信息、历史能耗数据和当前能耗数据进行关联形成带有维度的企业能耗数据;
a06,将企业实践信息、企业多维度信息、历史能耗数据和当前能耗数据按照企业多维度信息的设定存储为后续可用的多维度能耗数据。
5.根据权利要求4所述的地区整体能耗监控方法,其特征在于:企业性质维度由政府提供的注册经营范围确定,企业能耗层级由常态数据的均值进行确定,企业能耗层级至少存在有对应小微企业的最低级。
6.根据权利要求1所述的地区整体能耗监控方法,其特征在于:
所述企业能耗类型由常态数据进行确定,将常态数据中企业能耗数值随着时间稳定收敛的企业确定为一类企业,将常态数据中企业能耗数值随着时间周期波动的企业确定为另一类企业。
7.根据权利要求1所述的地区整体能耗监控方法,其特征在于:
在步骤c02中,针对常态数据中企业能耗数值随着时间稳定收敛的企业采用能耗中位数与偏差系数值相关后计算多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
在步骤c02中,针对常态数据中企业能耗数值随着时间周期波动的企业采用能耗均值与偏差系数值相关后计算多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t。
8.根据权利要求1所述的地区整体能耗监控方法,其特征在于:
在步骤d02中,计算同一企业通过时间点进行关联的能耗数值的均值曲线的变化率、所占面积和/或拐点数量作为部分特征量,计算通过时间点进行关联的能耗数值的前向差值的均值曲线的变化率、所占面积和/或拐点数量作为另一部分特征量,根据特征量在分类器中的分类结果,将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段。
9.根据权利要求1所述的地区整体能耗监控方法,其特征在于:
在所述步骤四中利用测定优化步骤后的训练数据进行神经网络训练时执行以下步骤:
e01,在二次聚类后的属于同一类的所有数据中,二次聚类中心数值集合中的至少一个维度数据作为关联结果数据,企业的二次多维度数据作为关联训练数据;
e02,建立神经网络,将所有的关联训练数据和关联结果数据送入神经网络进行训练,直到训练后的神经网络的正确率大于设定值为止。
10.根据权利要求9所述的地区整体能耗监控方法,其特征在于:
在步骤e01中,若对应常态数据中企业能耗数值随着时间稳定收敛的企业,则将二次聚类后的属于同一类的二次聚类的中心数值集合中稳定段的能耗数值的均值或中位数作为关联结果数据;
若对应常态数据中企业能耗数值随着时间周期波动的企业,则将二次聚类后的属于同一类的二次聚类中心数值集合中稳定段的能耗数值的均值和最大变化率作为关联结果数据。
11.根据权利要求9所述的地区整体能耗监控方法,其特征在于:
在步骤e01中,企业的二次多维度数据中只选取上升段和中间段数据作为关联训练数据。
12.根据权利要求9所述的地区整体能耗监控方法,其特征在于:
在步骤e01中选用若干个串行的神经网络进行独立训练,其中至少一个神经网络针对上升段数据作为关联训练数据,至少一个神经网络针对中间段数据作为关联训练数据,在所有神经网络训练达到设定要求时将所有串行的神经网络进行合并。
13.根据权利要求9所述的地区整体能耗监控方法,其特征在于:
在所述步骤六中,包括以下子步骤:
f01,将清洗后的目标企业的当前企业能耗数据送入训练后的神经网络;
f02,通过神经网络输出当前企业能耗数据的分类,并根据当前企业能耗数据的分类获得所处分类在二次聚类时的中心数值集合;
f03,根据目标企业的当前能耗数据的时间点查询所处分类在二次聚类时的数值集合在对应时间点之后的数值集合作为目标企业的预测能耗数据。
14.根据权利要求13所述的地区整体能耗监控方法,其特征在于:
在f01步骤中,目标企业的当前能耗数据中若已经包括稳定段数据,则直接用于执行步骤六,否则将目标企业的当前能耗数据送入神经网络进行预测,目标企业的当前能耗数据至少需要包括一段上升段数据。
16.根据权利要求15所述的地区整体能耗监控方法,其特征在于:
在显示地区的整体能耗水平时,设立有时间轴,在相同时间点下,显示当前或预测的地区的整体能耗水平;
在显示地区的整体能耗水平时,通过设定颜色色相、明度和纯度参数进行区分,当前地区的能耗水平处于不同层级时,采用色相进行区分;当前地区的能耗水平处于相同层级时,根据地区的整体能耗水平的具体参数采用相同色相,不同明度和不同纯度进行区分。
17.一种地区整体能耗监控系统,使用如权利要求1-16任一所述的地区整体能耗监控方法,其特征在于:包括显示器、计算单元和数据采集单元,
所述数据采集单元,获取当前能耗数据和历史能耗数据;
所述显示器显示计算单元给出的当前地区的能耗水平;
所述计算单元通过执行以下步骤来判断并预测地区整体的能耗水平:
步骤一,根据设定的维度进行数据清洗;
步骤二,对清洗后的多维度能耗数据分为常态数据和复工数据,对复工数据进行对应的聚类分析,聚类分析中的维度至少包括企业能耗层级和企业能耗类型两个维度;
步骤三,对聚类后的企业能耗数据进行数据整合,其中至少包括训练数据的测定子步骤;
步骤四,根据整合了各个维度的企业能耗数据进行神经网络训练;
步骤五,采用训练后的神经网络对当前各企业能耗数据进行分类和预测企业能耗水平;
步骤六,根据神经网络的计算结果来判断并预测地区的整体能耗水平;
在所述步骤二中,对清洗后的复工数据进行聚类分析,首先根据企业性质维度将企业性质中属于服务业且企业能耗层级为小微企业的部分企业从所有企业中取出,对于余下的所有企业以常态数据和复工数据分别执行以下步骤:
b01,构建企业多维度能耗数据空间,所述的企业多维度能耗数据空间至少包括企业能耗层级和企业能耗类型两个维度;
b02,根据人工选定的K个典型企业确定为K个聚类的中心;
b03,计算每个多维度能耗数据与聚类中心的欧式距离,并根据欧式距离进行聚类;
b04,更新聚类中心,并重复b03步骤直到聚类中心的迭代次数满足设定要求,将最后一次聚类后的多维度能耗数据供步骤三使用;
在所述步骤三中的训练数据测定子步骤:
c01,建立每一类的多维度能耗数据中的初始能耗数值集合Ro,Ro={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pk,t },Pk,t为k企业第t时间点的能耗数值,t为复工后从低能耗水平恢复后的时间维度表示,k为同一化后的企业编号,对能耗数值集合Ro进行均值和/或中位数计算,以能耗数值集合Ro为基础重构为前向差值能耗数值集合Re,Re={ P1,2-P1,1,P1,3-P1,2,…P1,t-P1,t-1,P2,2-P2,1,P2,3-P2,2,… P2,t-P2,t-1,… Pk,t-Pk,t-1 },对前向差值能耗数值集合进行均值和/或中位数计算;
c02,人工设定有对应能耗均值和/或能耗中位数的偏差系数值,通过偏差系数值确定每一类的多维度能耗数据中的能耗数值的上限值mxk,t和多维度能耗数据中的能耗数值的下限值mnk,t;
c03,选取所有符合mnk,t<Pk,t<mxk,t要求的企业,将所有符合要求的企业多维度能耗数值与时间维度重新进行关联后形成后续使用的能耗数值集合Rn,Rn={P1,1,P1,2,…P1,t,P2,1,P2,2,… P2,t,… Pn,t },n≤k,Pn,t为符合mnk,t<Pk,t<mxk,t要求的n企业第t时间点的能耗数值;
在步骤三中,训练数据测定子步骤执行完成后,通过训练数据测定优化步骤后再送入神经网络进行训练:
d01,将能耗数值集合Rn拟合绘制能耗的均值曲线f(Rnav),Rnav为相同时间点处的能耗数值平均值,将前向差值能耗数值集合Re的均值拟合绘制能耗差值的均值曲线f(Reav),Reav为相同时间点处的能耗差值数值的平均值;
d02,根据能耗的均值曲线和能耗差值的均值曲线将能耗数值集合Rn中对应企业的复工数据分为上升段、中间段和稳定段;
d03,根据上升段、中间段和稳定段的分割方式,确定二次聚类的维度项,二次聚类的维度项至少包括对所有上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率;
d04,设定若干个二次聚类的中心;
d05,在步骤三中将能耗数值集合Rn和前向差值能耗数值集合Re制成对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1);
d06,对应每个企业的能耗拟合曲线f(Pk,t)和拟合差值曲线f(Pk,t-Pk,t-1)确定企业复工的上升段、中间段和稳定段,并计算每个企业的二次聚类维度项形成企业的二次多维度数据;
d07,计算每个企业的二次多维度数据与二次聚类的中心的欧式距离,并根据欧式距离进行二次聚类;
d08,更新二次聚类的中心,并重复d07步骤直到二次聚类中心的迭代次数满足设定要求,将距离二次聚类的中心欧式距离最近的企业的二次多维度数据作为二次聚类时的中心数值集合;
若执行d08步骤后,任意二次聚类后的数据量小于设定值,则将数据量小于设定值的二次聚类数据设定为目标数据集合,并执行数据扩充步骤:
d09,目标数据集合内的待扩充数据,在待扩充数据的上升段、中间段和稳定段三个区段内随机选择一个区段;
d10,在三个区段内任意选择一段数据作为待合并数据,根据待合并数据的时间点,去除待扩充数据内相应时间点的数据;
d11,将待合并数据的首数据或首数据段中的能耗数值以及末数据或末数据段中的能耗数值分别通过过渡计算后与待扩充数据进行数据合并;
d12,判断目标数据集合内数据量是否大于设定值,若大于设定值则结束数据扩充步骤,否则重复执行步骤d10;
在步骤d11中,待合并数据的首数据过渡计算的方式如下:
g01,选取待扩充数据Pa,c,Pa,c+1,…Pa,c+n,和待合并数据Pb,1,Pb,2,…Pb,c;
Pa,c表示待扩充数据采用a企业在c时间点处的能耗数值,Pb,c表示待合并数据采用b企业在c时间点处的能耗数值;
g02,待合并数据中的首数据为Pb,c,对应的待扩充数据为Pa,c ,
将Pb,c的能耗数值赋值为Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,s为时间维度上的距离相关值,e为自然常数;
g03,待扩充数据与待合并数据合并后的能耗数值按时间维度排序为:
Pb,1,Pb,2,…Pb,c-1,Pa,c×(1-0.5e-s)+ Pb,c×0.5e-s,Pa,c+1,…Pa,c+n;
通过对曲线的分析将同一个聚类内的数据稳定分割成上升段、中间段和稳定段,然后根据分割后的结果,对能耗数值集合Rn进行数据膨胀,膨胀之后的数据在原有时间点维度、企业性质维度、企业能耗层级和企业能耗类型维度的基础上增加了上升段的上升时间、上升段的上升率、中间段持续时间、中间段的拐点数目、稳定段能耗均值和稳定段波动率维度,扩充后的数据以待扩充数据作为基础样本,只选用待合并数据中的能耗数值,并不适用其关联的企业性质维度、企业能耗层级和企业能耗类型维度数据,至于二次聚类时适用的维度,则由扩充后的数据重新计算获得。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010811186.4A CN111680852B (zh) | 2020-08-13 | 2020-08-13 | 地区整体能耗监控方法及其监控系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010811186.4A CN111680852B (zh) | 2020-08-13 | 2020-08-13 | 地区整体能耗监控方法及其监控系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680852A CN111680852A (zh) | 2020-09-18 |
CN111680852B true CN111680852B (zh) | 2020-11-06 |
Family
ID=72458330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010811186.4A Active CN111680852B (zh) | 2020-08-13 | 2020-08-13 | 地区整体能耗监控方法及其监控系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680852B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112327775A (zh) * | 2020-11-10 | 2021-02-05 | 夏洋 | 一种基于人工智能的企业复工复产程度监控系统及方法 |
CN114154716A (zh) * | 2021-12-03 | 2022-03-08 | 北京航天创智科技有限公司 | 一种基于图神经网络的企业能耗预测方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303263A (zh) * | 2015-11-16 | 2016-02-03 | 深圳合纵能源技术有限公司 | 一种区域电网的负荷预测系统及其方法 |
CN106951993A (zh) * | 2017-03-20 | 2017-07-14 | 国网江苏省电力公司常州供电公司 | 一种电能量数据预估方法 |
CN108734355B (zh) * | 2018-05-24 | 2022-03-08 | 国网福建省电力有限公司 | 一种应用于电能质量综合治理场景的短期电力负荷并行预测方法及系统 |
-
2020
- 2020-08-13 CN CN202010811186.4A patent/CN111680852B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111680852A (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680937B (zh) | 基于电力数据分级赋权的小微企业复工率评估方法 | |
WO2021213192A1 (zh) | 一种基于通用分布的负荷预测方法及负荷预测系统 | |
CN110097297A (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN116646933A (zh) | 一种基于大数据的电力负荷调度方法及系统 | |
CN111680852B (zh) | 地区整体能耗监控方法及其监控系统 | |
CN111027872B (zh) | 一种区域用户的用电成熟度确定方法及系统 | |
CN106372747B (zh) | 基于随机森林的台区合理线损率估计方法 | |
WO2020098728A1 (zh) | 集群负荷预测方法、装置及存储介质 | |
CN111210170B (zh) | 基于90%用电分布特征指标的环保管控监测及评价方法 | |
CN115907822A (zh) | 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法 | |
CN106951993A (zh) | 一种电能量数据预估方法 | |
CN112085256A (zh) | 考虑负荷跃变的全周期负荷预测方法 | |
CN107093005A (zh) | 基于大数据挖掘算法实现办税服务厅自动分级的方法 | |
CN110648253A (zh) | 一种基于历史投资成效的配电网投资分配方法 | |
CN112330089B (zh) | 装备制造类企业的综合能效监测方法及监测系统 | |
CN112508260A (zh) | 基于对比学习的配电变压器中长期负荷预测方法及装置 | |
CN117273457A (zh) | 一种基于客户画像进行月度负荷预测的方法及系统 | |
CN111127186A (zh) | 一种基于大数据技术的客户信用等级评价体系的使用方法 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 | |
CN112801415A (zh) | 基于马尔科夫链分布模型的超短期负荷预测方法及系统 | |
CN112308340A (zh) | 电力数据处理方法及装置 | |
Davarzani et al. | Study of missing meter data impact on domestic load profiles clustering and characterization | |
CN117851908B (zh) | 一种改进的在线低压台区电能表失准监测方法及装置 | |
CN116595102B (zh) | 一种改进聚类算法的大数据管理方法及系统 | |
Chen et al. | A new approach for power-saving analysis in consumer side based on big data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |