CN116628534A - 基于电力大数据的园区用能动态画像划分方法 - Google Patents
基于电力大数据的园区用能动态画像划分方法 Download PDFInfo
- Publication number
- CN116628534A CN116628534A CN202310765786.5A CN202310765786A CN116628534A CN 116628534 A CN116628534 A CN 116628534A CN 202310765786 A CN202310765786 A CN 202310765786A CN 116628534 A CN116628534 A CN 116628534A
- Authority
- CN
- China
- Prior art keywords
- park
- data
- model
- matrix
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 117
- 230000008859 change Effects 0.000 claims abstract description 37
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000005265 energy consumption Methods 0.000 claims abstract description 22
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000013210 evaluation model Methods 0.000 claims abstract description 13
- 238000010219 correlation analysis Methods 0.000 claims abstract description 9
- 238000000491 multivariate analysis Methods 0.000 claims abstract description 9
- 230000003068 static effect Effects 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 75
- 230000005611 electricity Effects 0.000 claims description 67
- 239000013598 vector Substances 0.000 claims description 64
- 238000004422 calculation algorithm Methods 0.000 claims description 51
- 238000011161 development Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 27
- 238000011156 evaluation Methods 0.000 claims description 23
- 230000009467 reduction Effects 0.000 claims description 19
- 238000000354 decomposition reaction Methods 0.000 claims description 17
- 238000009434 installation Methods 0.000 claims description 13
- 238000003064 k means clustering Methods 0.000 claims description 13
- 230000002354 daily effect Effects 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 12
- 239000000203 mixture Substances 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 5
- 238000013501 data transformation Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000003203 everyday effect Effects 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 4
- 238000007726 management method Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000004146 energy storage Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 2
- 230000014759 maintenance of location Effects 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 229920006395 saturated elastomer Polymers 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 description 17
- 230000006399 behavior Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000010206 sensitivity analysis Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 239000004743 Polypropylene Substances 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- -1 Polypropylene Polymers 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及基于电力大数据的园区用能动态画像划分方法,方法包括以下步骤:步骤1:面向园区用户综合用能特征的多元数据分析;步骤2:构建基于多维度能耗分析的成熟度评价模型,并通过基于多维度特征指标对园区群体结构进行划分;步骤3:构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像;步骤4:构建园区群体流动和园区画像动态变化的关联分析模型;步骤5:获取不同园区的静态与动态特征,形成基于用户用能特征及多元数据的园区动态画像模型;本发明具有构建标签库、识别特征、准确刻画用能需求和结构、评估服务潜力和价值状态的优点。
Description
技术领域
本发明属于可再生能源技术领域,具体涉及基于电力大数据的园区用能动态画像划分方法。
背景技术
能源是人类生存发展的基石,是国民经济的基础性产业和重要的战略性物质资源,可再生能源和信息通信技术将创新生产方式,形成“互联网+新能源”的新型能源发展方式,其中,由于园区具有多种用能方式和多样化用能需求,将作为能源消费的重点和综合能源技术的集中应用地;在开放售电的政策环境下,综合能源业务将逐渐发展成为公司的主营业务之一,园区作为各类能源消费的重要对象,是国网公司重要的综合能源用户群体,具有极为重要的发展潜力;园区拥有多种用能方式和多样化的用能需求,对于综合能源系统的部署提供了良好的地理条件;现有电力客户群体划分的研究较为成熟,但当用户能源利用拓展到冷热电气水等多种用能行为时,难以考虑客户标签的多维性和复杂性,基于多维用能数据定量、定性相似度计算提出园区群体结构划分方法难度较大;此外,群体结构成员变动的方式有多种,缺少适用于研究成员流动对园区画像影响的动态分析方法;因此,提供一种构建标签库、识别特征、准确刻画用能需求和结构、评估服务潜力和价值状态的基于电力大数据的园区用能动态画像划分方法是非常有必要的。
发明内容
本发明的目的是为了克服现有技术的不足,而提供一种构建标签库、识别特征、准确刻画用能需求和结构、评估服务潜力和价值状态的基于电力大数据的园区用能动态画像划分方法。
本发明的目的是这样实现的:基于电力大数据的园区用能动态画像划分方法,所述的方法包括以下步骤:
步骤1:面向园区用户综合用能特征的多元数据分析;
步骤2:构建基于多维度能耗分析的成熟度评价模型,并通过基于多维度特征指标对园区群体结构进行划分;
步骤3:构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像;
步骤4:构建园区群体流动和园区画像动态变化的关联分析模型;
步骤5:获取不同园区的静态与动态特征,形成基于用户用能特征及多元数据的园区动态画像模型。
所述的步骤1中的面向园区用户综合用能特征的多元数据分析具体包括以下方面:①通过SG186营销业务系统、用电信息采集系统、电能服务平台中园区用户的用电负荷特征,分析用户的需求侧资源构成及可调控能力,包括有源负荷、用户储能、可平移负荷、可削减负荷;②通过园区综合能源服务的冷、热、电、气、水等用能需求特征,分析园区典型异质能源之间的耦合性、可替换性及交互影响机理,增加面向园区综合用能特征的数据来源;③利用非侵入式辨识方法、物联网技术,采集各类典型用能设备的工作特性曲线,分析辨识园区工、商业用户的设备组成与生产、业务安排。
所述的步骤2具体包括以下步骤:
步骤2.1:构建基于双聚类算法的多维度能耗数据特征模型;
步骤2.2:构建基于组合预测方法的用能需求模型;
步骤2.3:构建考虑多维度用能需求分析的用户成熟度评价模型。
所述的步骤2.1中的构建基于双聚类算法的多维度能耗数据特征模型采用光谱双聚类算法,具体为:光谱双聚类算法以搜索数据中的局部特征信息为目的,影响所有数据内容的全局特征信息对搜索局部特征信息没有意义,因此采用双随机归一化和奇异值分解将其剔除;具体包括以下步骤:
步骤2.11:双随机归一化:双随机归一化方法可以对行和列同时进行归一化,可以在不破坏局部特征信息的同时降低全局特征信息的干扰;
步骤2.12:奇异值分解即SVD分解:奇异值分解可以将数据矩阵分解为特征向量组和特征值矩阵的乘积;其中特征向量组中包含构成局部特征的特征向量,因此先对矩阵进行SVD分解,再基于特征向量组进行向量筛选,可以获得局部特征的特征向量;在SVD分解算法中,假设归一化后的数据矩阵A=U·∑VT,其中矩阵A的维度为m×n;矩阵U的维度为m×m;矩阵V的维度为n×n;矩阵∑是一个对角矩阵,且维度为m×n维;再将归一化得到的矩阵A与其转置AT相乘,即可推导得到特征矩阵U:AAT=U∑VTV∑TUT=U∑∑TUT(1),同理将AT与A相乘,求解乘积矩阵的特征矩阵,则可得到矩阵V:ATA=V∑UTU∑TVT=V∑∑TVT(2),综上,SVD分解算法的结果为三个数据矩阵U、V、∑;其中矩阵U和矩阵V是特征向量组,分别包含初始数据矩阵行和列方向上的数据特征信息;∑为特征值矩阵,该矩阵中的数值反映对应特征向量包含的信息对于重构数据矩阵的重要性,特征值越大,则对应的特征向量越重要;因此可以删除最大特征值对应的特征向量,从而降低全局特征信息影响,再从矩阵和矩阵中分别挑选后续分析所需数据矩阵的行、列方向特征的向量;
步骤2.13:K-means聚类算法筛选用于数据变换的向量组:包含局部特征信息的子矩阵对应的特征向量的秩必然小于数据矩阵的维数,而向量的秩越小则对数据整体影响越小,因此子矩阵越有可能是局部特征信息的特征向量;对数据向量执行K-means聚类算法可以将大量数值聚为一列,这说明大量冗余数值具有相同的数据特征,可以将其删除,而借助矩阵行列变换也可以删除数据矩阵中的冗余数值,因此可以通过K-means聚类算法等效代替矩阵行列变换过程;K-means聚类算法对分解得到的矩阵U、V分别进行聚类,根据聚类的簇内差异,挑选聚类最紧凑的前N_best个向量,即为用来进行数据变换的向量组V_tr;向量留存数N_best为经过筛选后保留的特征向量的数量;保留的向量越多,则保留信息越多,越有利于后续分类;
步骤2.14:K-means聚类算法得到行标签:向量的夹角是向量间点乘运算的重要影响因素,因此包含不同局部特征向量相乘的结果会出现一定数值差异,为减小这种差异,将筛选得到的特征向量组V_tr与归一化后的数据矩阵A相乘,再对结果Pr进行K-means聚类,聚类结果即为光谱双聚类的行(用矩阵筛选的特征向量计算得到)或列(用矩阵筛选的特征向量计算得到)标签,即园区用户每天的用电类别,通过分析用户每天的用电类别完成用户用电类别标签的确定:Pr=A·V_tr(3),根据园区用户每天用电类别的统计计数情况,将出现次数最多的用电类别定义为园区用户的用电类别标签,反映园区用户的用电习惯,考虑到不同行业用户的有功、无功消耗方式不同,因此从无功和有功两个角度进行多维度分析,并定义用电行为特征为(用户有功用电类别,用户无功用电类别)组合,再在各个园区中将相同用电行为特征的用户划分为同一个群体结构,并赋予相应标签,从而实现园区群体结构的多维度划分。
所述的步骤2.2中的构建基于组合预测方法的用能需求模型采用基于等权递归方法进行区域电力用户未来3年的用电量以及年最大负荷组合预测,具体包括以下步骤:
步骤2.21:获取一定时间跨度的历史负荷(年用电量和最大负荷)数据序列;
步骤2.22:采用Logistic曲线模型进行中长期负荷预测,计算预测目标时间内对应的负荷预测值;
步骤2.23:采用改进灰色Verhulst模型进行中长期负荷预测,计算预测目标时间内对应的负荷预测值;
步骤2.24:将所有模型预测得到的负荷预测值进行汇总,得到高方案、中方案、低方案;
步骤2.25:采用等权递归算法求取区域电力用户预测目标时间内负荷的组合预测值。
所述的步骤2.22中的Logistic曲线模型对用户年用电量和最大负荷的历史数据进行拟合,得到园区用户未来3年的负荷规模,具体为:Logistic曲线的微分形式:对上式进行求解可得:/>式中,y为预测值,包括区域电力用户年用电量或者年最大负荷;k、a、b为待定参数,k为预测量的饱和值,a、b共同决定不同发展阶段用户负荷的增长速度;采用三段倒数和值法对参数k、a、b进行估计:首先,将3n年历史用电量数据y1,y2,...,yn,yn+1,...,y2n,y2n+1,...,y3n按时间段划分为3部分,对各段用电量数据求和:/>式中,Si为第i段用电量的倒数和;n为每段内包含的年数;将相邻时段用电量作差可得: 代入式(5)得:式中,t代表时间,取值是相对预测数据的起始年份,如计算使用1998年-2010年数据进行计算,则2011年的预测值对应的t为13。
所述的步骤2.23中的改进灰色Verhulst模型具体为:设非负原始时间序列数据为X(0)={x(0)(1),x(0)(2),...,x(0)(n)},即预测值(区域电力用户每年的年用电量、年最大负荷)构成的序列,对X(0)进行一阶累加得到序列:Z(1)是X(1)的紧邻均值序列,则:建立灰色Verhulst模型:x(0)(k)+az(1)(k)=b(z(1)(k))2(11),式中,a、b为待定参数,a为发展系数,b为灰作用量;微分方程形式为:/>则灰色Verhulst模型的时间序列响应为:/>进行一阶累减还原,得到输入序列的灰色Verhulst预测模型为:/>对模型中的待定参数进行最小二乘估计得:/>采用等维新息递补、残差修正建立改进灰色Verhulst模型,根据负荷增长的“近大远小”原则,在灰色Verhulst模型中引入等维新息递补处理,即:保证序列维数不变,每预测出一个新值,就把该预测值加入到原样本序列,并同时去掉样本序列中最早的1个数据,使样本数据中始终含有最新的数据信息,然后以新的样本序列重新输入到灰色Verhulst模型,循环下去直到得到目标预测年份的数据为止,通过灰色Verhulst模型进行饱和负荷预测,得到样本预测序列/>再将样本预测序列/>与样本观测序列x(0)(k)相减得到残差序列e(k),然后以残差序列作为输入,得到残差序列的预测值来补偿预测误差,因此,基于残差修正的改进灰色Verhulst模型的预测数据序列/>为:/>其中预测数据序列/>即为模型预测的未来区域用户每年的年用电量或者年最大负荷构成的序列。
所述的步骤2.25中的组合预测是指综合利用Logistic曲线模型和改进灰色Verhulst模型,采用等权递归法求取权重模型得出组合预测模型,具体为:当前有n种预测方法,记为F1,F2,...,Fn,F1 (1)=F1,F2 (1)=F2,...,Fn (1)=Fn,Fi={fit|t=1,2,...,T}(17),首先,进行第一轮进行平均:式中, 表示第i种单一预测方法在t时刻的预测值;ft (1)表示第一轮代数平均后在t时刻的预测值;假设n种预测方法中第i种单一预测模型的误差平方和最大,则用F(1)替换掉第i种方法的预测值,得到第二轮平均所需的n种方法预测值:如此重复进行,经过k轮平均,即可得到组合预测模型为:/>式中,/>为各单一预测方法的权重;如果F(k)的模型相对误差百分比已经达到可接受的水平,则停止迭代,否则继续迭代直到模型相对误差百分比满足要求。
所述的步骤2.3:构建考虑多维度用能需求分析的用户成熟度评价模型具体包括以下步骤:
步骤2.31:业扩报装需求评价指标;
步骤2.32:需求响应潜力评价指标;
步骤2.33:上市公司经营发展潜力;
步骤2.34:非上市公司经营发展潜力。
所述的步骤3中的构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像具体包括以下步骤:
步骤3.1:考虑社会属性的用户用能画像算法;
步骤3.2:园区用户复杂网络模型;
步骤3.3:基于吉尔文-纽曼算法的用户群体划分;
步骤3.4:基于群体变化过程的园区动态画像。
本发明的有益效果:本发明为基于电力大数据的园区用能动态画像划分方法,在使用中,本发明提出基于用户用能特征及多元数据的园区动态画像方法,采用面向园区用户综合用能特征的多元数据分析方法,基于多维度特征指标对园区群体结构进行划分,同时研究园区群体流动和园区画像动态变化的关联分析模型,得到不同园区的静态与动态特征获取方法,形成基于用户用能特征及多元数据的园区动态画像技术,从而为差异化、个性化的营销策略提供技术支持;本发明通过构建园区综合能源标签库系统,识别园区综合能源显著特征,准确刻画园区用能需求和用能结构,评估不同区域园区综合能源服务潜力和价值状态,辅助市场开拓人员精准营销,为园区综合能源技术推广及应用提供决策支持;本发明具有构建标签库、识别特征、准确刻画用能需求和结构、评估服务潜力和价值状态的优点。
附图说明
图1为本发明的流程图。
图2为本发明的光谱双聚类算法流程图。
图3为本发明的园区用户画像指标体系库示意图。
图4为本发明的园区群体结构与社交网络关联性分析示意图。
图5为本发明的GN算法流程图。
图6为本发明的演化分析流程图。
具体实施方式
下面结合附图对本发明做进一步的说明。
实施例1
如图1-6所示,基于电力大数据的园区用能动态画像划分方法,所述的方法包括以下步骤:
步骤1:面向园区用户综合用能特征的多元数据分析;
步骤2:构建基于多维度能耗分析的成熟度评价模型,并通过基于多维度特征指标对园区群体结构进行划分;
步骤3:构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像;
步骤4:构建园区群体流动和园区画像动态变化的关联分析模型;
步骤5:获取不同园区的静态与动态特征,形成基于用户用能特征及多元数据的园区动态画像模型。
在本实施例中,基于多维度特征的园区群体结构划分方法具体包括:①通过园区客户群体的技术、经济、社会等宏观属性,分析客户群体的产业技术特点、区域经济特性、社会环境影响、人员组成结构等关键因素,建立表征电网友好性、成长活跃指数、发展成熟度、客户生命周期的多维度特征指标体系;②通过以商业模式为目标导向的园区群体结构特征属性及划分原则,建立量化园区用户画像相似度的分析计算模型,提出多元数据聚类的园区群体结构多维度划分方法;③通过宏观群体结构和微观用能特征的内在关联,提出针对不同群体结构的用能需求评估模型;通过园区群体结构的重要度评估与综合能源发展潜力分析方法,建立园区群体的综合用能需求分析库。
步骤2具体包括以下步骤:
步骤2.1:构建基于双聚类算法的多维度能耗数据特征模型;
步骤2.2:构建基于组合预测方法的用能需求模型;
步骤2.3:构建考虑多维度用能需求分析的用户成熟度评价模型。
在本实施例中,本发明提出的基于光谱双聚类算法的园区群体结构多维度划分模型是基于数学模型方法的双聚类算法,采用了成熟的数学理论或模型,具有较好且稳定的数据分析结果;光谱双聚类算法的基础理论为线性代数理论,在该算法中,通过分析数据点特殊子矩阵的特征向量分析局部特征;因此借助线性代数理论分析数据矩阵的特征向量组,再从中筛选子矩阵的特征向量,即可实现光谱双聚类算法;光谱双聚类算法的工作流程如图2所示,先采用双随机归一化方法处理基础数据剔除对局部特征无关的数据信息,再对处理后的矩阵进行SVD分解获得矩阵特征向量组,然后基于该向量组筛选得到子矩阵的特征向量,最后基于K-means聚类完成光谱双聚类算法;
在本实施例中,双随机归一化计算流程为:①设迭代次数为k,并令k=1;②设数据矩阵为Ak,表示Ak中第i行、第j列的数据,则有对角矩阵Rk、Ck,这两个矩阵分别代表数据矩阵Ak在行和列两个方向的和;其中/>为Ak第i行的数值和;/>为Ak第j列的数值和;而辅助计算矩阵Ank为Ank=R-1AkC-1;③计算归一化前后的差异矩阵Dk=Ak-Ank;按行计算矩阵Dk的欧几里德范数值,即/>④令Ak=Ank,即此时迭代得到的结果即为Ak;⑤当满足Dik<ε或k=K时,停止迭代,得到归一化结果Ak,否则重复②-④过程,其中,ε是预设的阈值;K是预设的最大迭代次数;最后得到的矩阵Ak即为归一化后数据矩阵;
在本实施例中,基于K-means算法得到数据变化向量组计算流程:输入:M×N的特征向量组UT和指定挑选出的向量的数量,大小为N_best;输出:构成子矩阵的特征向量,也是用于数据变换的特征向量;
步骤一:将UT按行进行K-means计算,并计算数值和中性点的距离并求和得到距离矩阵Di;fork=1:M,在第k行执行聚类算法,得到第k行向量每列的分类标签及中心点构成的数组centers;for j=1:N,计算第k行中第j个值与其聚类中心点的距离,并将结果存入矩阵Di的第k行第j列处;end,end;
步骤二:分析距离矩阵得到特征向量,fork=1:M,计算Di矩阵第k行的欧几里得范数并结果存入数组Res的第k个位置;end。
将Res按从小到大进行排序,得到前N_best个值在Di中对应的行数;再按得到对的索引值在UT中找到对应的向量;这些向量构成的向量组即为向量组V_tr。
本发明为基于电力大数据的园区用能动态画像划分方法,在使用中,本发明提出基于用户用能特征及多元数据的园区动态画像方法,采用面向园区用户综合用能特征的多元数据分析方法,基于多维度特征指标对园区群体结构进行划分,同时研究园区群体流动和园区画像动态变化的关联分析模型,得到不同园区的静态与动态特征获取方法,形成基于用户用能特征及多元数据的园区动态画像技术,从而为差异化、个性化的营销策略提供技术支持;本发明通过构建园区综合能源标签库系统,识别园区综合能源显著特征,准确刻画园区用能需求和用能结构,评估不同区域园区综合能源服务潜力和价值状态,辅助市场开拓人员精准营销,为园区综合能源技术推广及应用提供决策支持;本发明具有构建标签库、识别特征、准确刻画用能需求和结构、评估服务潜力和价值状态的优点。
实施例2
如图1-6所示,基于电力大数据的园区用能动态画像划分方法,所述的方法包括以下步骤:
步骤1:面向园区用户综合用能特征的多元数据分析;
步骤2:构建基于多维度能耗分析的成熟度评价模型,并通过基于多维度特征指标对园区群体结构进行划分;
步骤3:构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像;
步骤4:构建园区群体流动和园区画像动态变化的关联分析模型;
步骤5:获取不同园区的静态与动态特征,形成基于用户用能特征及多元数据的园区动态画像模型。
在本实施例中,对于园区而言,用户的用能需求各异,能源种类具有多样性,相对应地,其业扩报装需求与常规电力用户有所不同,包括热泵新装需求与增加需求、气泵新装需求与增加需求、电力新装需求与增加需求;业扩报装需求可以在一定程度上表现园区内部能源需求程度,因此本发明提出基于数据驱动的园区电力用户业扩报装需求预测方法:首先,选取基于Logistic曲线模型和改进灰色Verhulst模型的组合预测方法,对用户未来3年的能源需求进行预测;然后将当前能源需求与未来能源需求作比,得到用户业扩报装需求评价指标,包括年平均用电量增长率、年平均最大负荷增长率、变压器当前负载率和变压器未来3年预期负载率;最后对典型园区进行业扩报装需求评价,为供电企业业扩报装业务开展提供理论依据与工程建议;
所述的步骤2.3:构建考虑多维度用能需求分析的用户成熟度评价模型具体包括以下步骤:
步骤2.31:业扩报装需求评价指标;
步骤2.32:需求响应潜力评价指标;
步骤2.33:上市公司经营发展潜力;
步骤2.34:非上市公司经营发展潜力。
在本实施例中,业扩报装需求评价指标具体为:业扩报装需求评价指标包含年平均用电量增长率、年平均最大负荷增长率、变压器当前负载率、变压器未来3年预期负载率四个方面;式中,Grate,1为年平均用电量增长率;Q、Q1、Q2、Q3分别表示用户当年用电量和未来1、2、3年用电量的预测值;/>式中,Grate,2为年平均最大负荷增长率;P、P1、P2、P3分别表示用户当年最大负荷和未来1、2、3年最大负荷的预测值;/>式中,Lrate,1为变压器当前负载率;Pmax为用户当前合同运行容量;/>式中,Lrate,2为变压器未来3年预期负载率;Rex=k1Grate,1+k2Grate,2+k3Lrate,1+k4Lrate,2(25),式中,Rex为园区电力用户能源业扩报装需求,是年平均用电量增长率、年平均最大负荷增长率、变压器当前负载率及变压器未来3年预期负载率四项指标的加权平均值;一般来说,k1=k2=k3=k4=1/4,可根据实际经验修订;整理可得园区电力用户业扩报装需求评价指标体系,如表1所示;
表1园区电力用户业扩报装需求评价指标体系
在本实施例中,需求响应潜力评价指标具体为:①基准负荷偏差:基准负荷偏差代表用户的潜在用电负荷水平,是指一年内用户每日每个采样点的用电负荷与基准负荷的差值的求和;其中,用户每日每个采样点的用电负荷组成该用户当日负荷模式,可以根据用户用电行为模式聚类方法得到;基准负荷是指用户日负荷最小时对应的各采样点负荷,为96个数值组成的序列,该序列又被成为年最小负荷模式:式中,Pmin(t)为基准负荷,即该用户年最小负荷模式下t采样时刻用户的功率;Ck(t)为第k类负荷模式下t采样时刻的功率;m为用户一年内负荷模式的类别数目;则基准负荷偏差为:式中,RLD为用户的基准负荷偏差;Nk为第k类负荷模式的相似日数量;②降负荷潜力:用户降负荷潜力是指用户降负荷率与高峰负荷削减率的最小值,表示用户通过直接改变生产安排从而影响负荷行为的可调节裕度;其中,降负荷率是指用户可平移负荷占总负荷的比率;高峰负荷削减率是用户调节负荷潜力的最大值;降负荷率的计算首先需要确定用户的日尖峰小时数,然后基于用户所在行业及对应的日负荷模式,提出用户降负荷率的计算模型:取用户全年最大负荷lmax(小时为单位),则判断负荷是否属于尖峰时刻的依据为:l>0.85lmax(28),式中,l为采样负荷,当某小时的负荷超过年最大负荷的85%时,认为该小时为尖峰小时;设全年尖峰小时数为Zyear,则每日尖峰小时数为:Z=Zyear/365(29),式中,Z为每日尖峰小时数,要求是对全年尖峰小时数进行365天平均后只入不舍的整数值;对应地,用户每日尖峰负荷时段为t1,t2,...,tZ,对应负荷记作:用户降负荷率除了受自身负荷模式影响外,还与其所在行业的需求响应降负荷率有关:/>式中,λ为不同行业内用户的平均降负荷率,参考表6-1进行取值;Nsum、Nk分别表示有效统计负荷天数和第k类负荷模式的相似日数量;高峰负荷削减率作为降负荷率是否可行的约束条件,对于降负荷潜力的评价具有重要意义:/>式中,Flim为高峰负荷削减率;lmin为用户日最小负荷;
表2不同行业内用户的需求响应降负荷率
综合考虑降负荷率与高峰负荷削减率的作用,用户降负荷潜力评价模型为:LD=min{LDR,Flim}(32),式中,LD为用户降负荷潜力评价结果;③分时用电量变异系数:变异系数用来表示两组数据离散程度的大小,对于需求响应而言,若用户峰时用电量远大于谷时用电量,用户削峰潜力较高,变异系数大;若用户峰谷时用电量相近,用户需求响应潜力低,变异系数小;由此可见,用户峰、谷、平分时用电量的变异系数可以在一定程度上反映用户用电行为的差异性:式中,CV表示用户峰、谷、平分时用电量的变异系数;SD1表示用户峰、谷、平分时用电量的标准差;MN1表示用户峰、谷、平分时用电量的平均值;④停电接受率:园区内电力用户的停电总时长可以在一定程度上反映用户的需求响应潜力,用户的停电总时长越长,说明用户持有的可削减负荷越多,其需求响应潜力越大;用户的停电总时长越短,则说明用户的停电敏感度越高,需求响应业务将避免面向此类用户开展,评估方式为:/>式中,St代表停电接受率;st(d)代表第d天的停电时长;γ代表修正系数,用于修正停电时长和停电接受率的关系;当用户停电时长的大小高于一定水平后,停电时长体现出的用户切负荷能力接近一致,因此,停电接受率与停电时长应表现为对数关系,这里取自然对数;
在本实施例中,需求响应潜力评价体系具体为:综上所述,提出需求响应潜力评价模型为:DR=w1RLD+w2LDR+w3CV+w4St(35),式中,DR为园区电力用户能源业扩报装需求,是基准负荷偏差、降负荷率、分时用电量变异系数、停电接受率四个指标的加权平均值;一般来说,w1=w2=w3=w4=1/4,可根据实际经验修订;整理可得园区电力用户的需求响应评价体系,如表3所示;
表3园区电力用户需求响应评价指标体系
在本实施例中,上市公司经营发展潜力具体为:需要从发展特征、政治特征、经济特征三个角度分析;一、发展特征由技术发展潜力与经济发展潜力加权平均获得;①技术发展潜力计算模型为:TR=T*0.6/5+I*0.4(36),式中,TR为技术发展潜力,是技术先进性归一化后的数值与创新成果转化率的加权平均值;T为技术先进性;I为创新成果转化率;②经济发展潜力的计算模型为:ER=E1*0.2+E2*0.1+E3*0.2+E4*0.1+E5*0.1+E6*0.3(37),式中,ER为经济发展潜力,为下级标签的加权平均值;E1为加权净资产收益率;E2为摊薄总资产收益率;E3为营业总收入同比增长率;E4为毛利率;E5为净利率;E6为总资产周转率;则发展特征计算模型为:DPlc=0.4*TR+0.6*ER(38),式中,DPlc为上市公司的发展特征;二、政治特征通过对政策扶持力度进行分析获得:①政策扶植力度的计算模型为:PR=(0.4*IP+0.6*IA)/5(39),式中,PR为政策扶植力度,是产业政策力度与行业吸引力的加权平均值;IP为产业政策力度;IA为行业吸引力;则,政策特征计算模型为:PPlc=PR(40),式中,PPlc为上市公司政策特征;三、经济特征由短期偿债能力与长期偿债能力加权平均获得;①短期偿债能力的计算模型为:SR=(CR+QR)/2(41),式中,SR为短期偿债能力,CR为流动比率;QR为速动比率;②长期偿债能力的计算模型为:LR=DAR(42),式中,LR为长期偿债能力;DAR为资产负债率;则经济特征的计算模型为:EPlc=0.4*SR+0.6*LR(43),式中,EPlc为上市公司的经济特征;
在本实施例中,非上市公司经营发展潜力具体为:其技术发展潜力与政府扶植力度的评价方法与上市公司保持一致,但经济特征有所区别,非上市公司的经济特征计算模型为:EPnk=0.5*CC+0.5*Gdue(44),式中,EPnk为非上市公司的经济特征;CC为资本能力;Gdue为尽调评分。
所述的步骤3中的构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像具体包括以下步骤:
步骤3.1:考虑社会属性的用户用能画像算法;
步骤3.2:园区用户复杂网络模型;
步骤3.3:基于吉尔文-纽曼算法的用户群体划分;
步骤3.4:基于群体变化过程的园区动态画像。
在本实施例中,计及群体结构状态变化的园区动态画像方法具体包括:①通过园区群体结构内部成员的规模、占比、周期内流入、流出等变化特点,提取反映群体结构状态变化的动态特征;②通过具有自组织自适应特性的数据聚类模型,观测园区群体结构状态,分析电价政策、节能服务、需求响应等因素对群体结构变迁的影响;③通过园区群体流动和园区画像动态变化的关联分析模型,提出包含静态及动态特征的园区动态画像方法;④通过事件触发和时间触发的动态更新机制,分析园区群体结构在不同策略下的演变过程与发展趋势,为园区综合能源服务的发展及能源政策的制定提供数据支撑;
在本实施例中,考虑社会属性的用户用能画像算法具体为:①园区用户画像指标体系库:从横纵两个维度建立指标体系,纵向维度包括原始标签、事实标签、模型标签和预测标签;而横向维度包括能源、政策、发展潜力及经济特征等多个方面;原始标签是指园区用户的最基本的信息,如用电量;事实标签是指根据原始数据可的数据进行统计分析得到的信息,如经营水平;模型标签是以事实标签为基础,通过构建事实标签与具体场景之间的模型,进行模型分析得到,如负荷饱和度;预测标签则是在模型标签的基础上做预测,如园区产业结构流动性;园区用户画像指标体系库如图3所示;②表征电网友好性指标体系:从园区用户画像指标体系库中选取原始标签、事实标签和模型标签三个纵向标签,再依次选取用电特征、政策扶持和基础设施三个横向标签构建电网友好性指标体系;用电特征中的用电类别、电压等级、电源路数、用电基本信息和负荷饱和度、波动、周期特征以及基础设施表征园区用户接入后对原有电网的影响;用电特征中的用电金额、用电量、负荷信息、违约用电电费、电量和工单信息表征园区用户的电费情况;政策扶持和增值服务、停电信息、用户用电敏感度和用户忠诚度表征园区用户对电网公司提供的辅助服务的响应程度;③表征成长活跃指数指标体系:在园区用户画像指标体系库中选取原始标签、事实标签、模型标签和预测标签四个纵向标签,在纵向标签中选取用能特征、政策扶持、经营状况、产业状况和基础设施等横向指标构建了保证成长活跃指数的指标体系;园区用户的用能特征、经营状况反映自身在该段时间内的成长活跃指数;政策扶持、产业状况和基础设施的变化可以直接反映园区的发展情况;④表征发展成熟度指标体系:在园区用户画像指标体系库中选取原始标签、事实标签、模型标签和预测标签四个纵向标签,选取用能特征、发展潜力、政策扶持、经营状况、产业状况、园区区位和基础设施等横向标签构建园区发展成熟度层级指标体系;其中,园区的政策扶持、产业状况、园区区位和基础设施反映园区增量用户选址的成熟度情况;增值服务、用户用能敏感度等反映用户对电网公司供电服务的响应程度;⑤表征生命周期指标体系:选取原始标签、事实标签、模型标签和预测标签四个纵向维度的标签,并选取用能特征、发展潜力、政策扶持、经营状况、产业状况、园区区位和基础设施横向标签构建园区生命周期层级指标体系;政策扶持、产业状况、园区区位和基础设施等标签可以反映园区自身情况;已入驻的园区用户的用能特征和经营状况可以反映该用户是否准备结束与园区的业务关系,从而可以反映园区的生命周期;
在本实施例中,园区用户复杂网络模型具体为:基于复杂网络理论的电力用户演化分析模型采用的基于用户用电特征相似度的复杂网络(下称网络),是体现电力用户群体用电模式相似关系的拓扑图,包括用户节点、节点连线、网络及社区;①用户节点包含用户所有的用电数据特征,体现用户的用电模式,包括用电类别、业扩报装需求水平和需求响应水平分析用户的用电模式,构成用户节点;用电类别为:式中,Ipcc是用户I的用电类别;/>是用户I的无功用电类别;/>是用户I的有功用电类别;②节点连线建立:节点v和节点w的相似度Sim(v,w)为:/> 式中:Simpcc(v,w)、Sime(v,w)、Simdr(v,w)分别为节点v和节点w用电类别、负荷增长水平、需求响应的相似度计算结果;va、vr、ve、vdr分别代表节点v的有功用电类别、无功用电类别、负荷增长水平、需求响应能力水平;wa、wr、we、wdr则分别表示节点w的有功用电类别、无功用电类别、负荷增长水平、需求响应能力水平;max(ge)、min(ge)、max(gdr)、min(gdr)分别代表所有节点的负荷增长水平的极大值和极小值、需求响应能力水平的极大值和极小值,用于归一化;R(a,b)表示向量a和向量b的相关系数;若两节点的相似度高于给定阈值,则说明两节点相似,应设置连线,否则,两节点之间不设置连线;重复计算两节点之间的相似度确定所有节点的连接关系,从而得到基于用户用电特征相似度的复杂网络;基于复杂网络理论的园区群体结构状态变化模型分为两个部分:园区电力用户群体复杂网络的构建和园区电力用户群体状态变化模型;前者负责将园区用户间复杂的用户关系转换为图的形式,为分析提供基础;后者根据电力用户的状态变化形式设计图更新方法,使得群体结构的变迁情况得到仿真。
在本实施例中,基于吉尔文-纽曼算法的用户群体划分具体为:吉尔文-纽曼算法即GN算法划分园区用户的社区,再从社区构成分析群体结构间的联系、从社区间的连通线分析社区间的相互作用、从社区的紧密程度分析外界因素对社区的影响,如图4所示,;GN算法是计算边介数并不断删除最高边介数对应边的算法。社区内部的边相比社区间起连接作用的边作为最短路径的次数更少,可以通过计算每条边作为连接网络中任意两个节点的最短路径的次数,再将次数最多的边删除,得到网络中社区的划分结果;加权网络中,边的权重会影响最短路径的选择,边的权重越小,意味着经过该边的惩罚越小,即两节点的相似性越高,权重越小;算法流程图如图5所示,首先,分析社区中高度中心性的节点特征,在此基础上完成群体结构状态评估;高度中心性的节点是指社区中与较多节点的特征相似的节点,该节点的特征能体现网络或社区的整体特征,度中心性是一种评价指标,用以评价节点在网络中的重要程度:式中,CD(Nv)为节点v的度中心性;g为网络中节点的总数量;Avw为网络邻接矩阵中的元素,表示节点v和节点w的连接关系,若节点v和节点w具有连接关系,则Avw为1,否则为0;等式右边为节点v与其他g-1个(不含节点v)节点的连接边数的和;采用GN算法实现社区划分:首先进行连线删除,保证社区间的连线最先被删除,社区内的连线最晚被删除;算法再对节点进行合并形成社区,输出最佳合并结果,计算合并后的网络的模块度,直至达到最大模块度,停止合并,最终得到划分结果;模块度为:
式中:Q为模块度;M为网络中边的数量;kvkw分别为节点v与节点w的度,分别表示与节点v、节点w直接连接的边的数量;(cv,cw)表示节点v和节点w是否在同一个社区,若是,则取值为1,否则,为0。
在本实施例中,基于群体变化过程的园区动态画像具体为:①基于敏感性分析的演化分析方法包括以下步骤:1)确定敏感性分析指标;2)计算该技术方案的目标值;3)选取不确定因素;4)计算不确定因素变动时对分析指标的影响程度;5)分析事件触发与时间触发下的群体结构变化过程;实现了演化分析,具体流程如图6所示;②基于演化分析的园区动态画像技术:通过对园区进行敏感性分析,得到园区群体结构在不同程度、不同因素影响下的变化趋势,从而了解到分析园区动态变化过程和动态变化趋势的重要指标,在应用过程中保持关注,实时更新,在此基础上,根据动态变化的指标构建动态用能需求库,如表4所示;
表4动态用能需求库构成
本发明为基于电力大数据的园区用能动态画像划分方法,在使用中,通过构建园区综合能源标签库系统,识别园区综合能源显著特征,准确刻画园区用能需求和用能结构,评估不同区域园区综合能源服务潜力和价值状态,辅助市场开拓人员精准营销,为园区综合能源技术推广及应用提供决策支持;本发明具有以下优点:①对电网公司现有相关业务系统(包括SG186营销业务系统、用电信息采集系统、电能服务平台、需求响应系统等)中园区用户的用电数据进行采集,研究用户用电负荷特征,分析用户需求侧资源构成及可调控能力,包括有源负荷、用户储能、可平移负荷、可削减负荷等;针对电网公司暂未掌握的蕴含园区综合用能特征的数据,考虑园区冷、热、电、气、水等各类异质能源之间的耦合性、可替换性及交互影响机理,选择面向园区综合用能特征的数据分析来源;采集调研各类典型用能设备的工作特性曲线,提出针对园区综合用能数据的非侵入式辨识方法,分析辨识园区工、商业用户的设备组成与生产、业务安排;综合考虑园区用能特征分析中所需的基础数据及派生数据,提出定制化的数据抽取、存储及查询分析方法,构建面向园区综合能源服务的公用信息模型与数据结构;②针对一定数量的园区开展实际调研,从技术、经济、社会等多个方面分析客户群体的产业技术特点、区域经济特性、社会环境影响、人员组成结构等因素,并提取出表征电网友好性、成长活跃指数、发展成熟度、客户生命周期的多维度特征指标;基于需求响应能力、再电气化潜力、节能潜力、绿证交易等目标导向来明确不同维度的群体结构划分原则,并建立量化园区用户画像相似度的分析计算模型,在特征指标的基础上,运用多元数据聚类的方法,实现对园区群体结构的多维度划分;关联分析宏观层面的园区群体结构和微观层面的用能特征,提出针对不同类型群体结构的用能需求评估模型,并验证模型的合理性;针对实际园区数据开展实证研究,根据多维度聚类划分结果,在群体结构内部获取中心节点,发现主导客户群及目标大客户,基于用能需求评估模型分析客户群及大客户的发展潜力,建立融合基础数据及派生数据的园区群体综合用能需求分析库;③获取不同时间点的园区数据,统计分析园区群体结构成员的规模、占比、周期内流入、流出等变化规律,提取反映群体结构状态变化的动态特征;建立园区群体结构的状态变化模型,运用自组织自适应数据聚类对不同时间断面的园区静态及动态数据进行聚类分析,形成完整的园区群体结构状态分析方法,并进一步分析电价政策、节能服务、需求响应等策略对群体结构变化的影响;通过敏感性分析,建立园区群体流动和园区画像动态变化的关联分析模型,最终形成园区动态画像方法,从不同维度、不同层面动态观测不同园区间结构特征的差异性;根据事件触发和时间触发的动态更新机制,动态更新园区群体的用能需求库,仿真分析园区群体结构在不同策略下的演变过程与发展趋势,为园区综合能源服务的发展及能源政策的制定提供数据支撑;本发明具有构建标签库、识别特征、准确刻画用能需求和结构、评估服务潜力和价值状态的优点。
Claims (10)
1.基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的方法包括以下步骤:
步骤1:面向园区用户综合用能特征的多元数据分析;
步骤2:构建基于多维度能耗分析的成熟度评价模型,并通过基于多维度特征指标对园区群体结构进行划分;
步骤3:构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像;
步骤4:构建园区群体流动和园区画像动态变化的关联分析模型;
步骤5:获取不同园区的静态与动态特征,形成基于用户用能特征及多元数据的园区动态画像模型。
2.如权利要求1所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤1中的面向园区用户综合用能特征的多元数据分析具体包括以下方面:①通过SG186营销业务系统、用电信息采集系统、电能服务平台中园区用户的用电负荷特征,分析用户的需求侧资源构成及可调控能力,包括有源负荷、用户储能、可平移负荷、可削减负荷;②通过园区综合能源服务的冷、热、电、气、水等用能需求特征,分析园区典型异质能源之间的耦合性、可替换性及交互影响机理,增加面向园区综合用能特征的数据来源;③利用非侵入式辨识方法、物联网技术,采集各类典型用能设备的工作特性曲线,分析辨识园区工、商业用户的设备组成与生产、业务安排。
3.如权利要求1所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2具体包括以下步骤:
步骤2.1:构建基于双聚类算法的多维度能耗数据特征模型;
步骤2.2:构建基于组合预测方法的用能需求模型;
步骤2.3:构建考虑多维度用能需求分析的用户成熟度评价模型。
4.如权利要求3所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2.1中的构建基于双聚类算法的多维度能耗数据特征模型采用光谱双聚类算法,具体为:光谱双聚类算法以搜索数据中的局部特征信息为目的,影响所有数据内容的全局特征信息对搜索局部特征信息没有意义,因此采用双随机归一化和奇异值分解将其剔除;具体包括以下步骤:
步骤2.11:双随机归一化:双随机归一化方法可以对行和列同时进行归一化,可以在不破坏局部特征信息的同时降低全局特征信息的干扰;
步骤2.12:奇异值分解即SVD分解:奇异值分解可以将数据矩阵分解为特征向量组和特征值矩阵的乘积;其中特征向量组中包含构成局部特征的特征向量,因此先对矩阵进行SVD分解,再基于特征向量组进行向量筛选,可以获得局部特征的特征向量;在SVD分解算法中,假设归一化后的数据矩阵A=U·∑VT,其中矩阵A的维度为m×n;矩阵U的维度为m×m;矩阵V的维度为n×n;矩阵∑是一个对角矩阵,且维度为m×n维;再将归一化得到的矩阵A与其转置AT相乘,即可推导得到特征矩阵U:AAT=U∑VTV∑TUT=U∑∑TUT(1),同理将AT与A相乘,求解乘积矩阵的特征矩阵,则可得到矩阵V:ATA=V∑UTU∑TVT=V∑∑TVT(2),综上,SVD分解算法的结果为三个数据矩阵U、V、∑;其中矩阵U和矩阵V是特征向量组,分别包含初始数据矩阵行和列方向上的数据特征信息;∑为特征值矩阵,该矩阵中的数值反映对应特征向量包含的信息对于重构数据矩阵的重要性,特征值越大,则对应的特征向量越重要;因此可以删除最大特征值对应的特征向量,从而降低全局特征信息影响,再从矩阵和矩阵中分别挑选后续分析所需数据矩阵的行、列方向特征的向量;
步骤2.13:K-means聚类算法筛选用于数据变换的向量组:包含局部特征信息的子矩阵对应的特征向量的秩必然小于数据矩阵的维数,而向量的秩越小则对数据整体影响越小,因此子矩阵越有可能是局部特征信息的特征向量;对数据向量执行K-means聚类算法可以将大量数值聚为一列,这说明大量冗余数值具有相同的数据特征,可以将其删除,而借助矩阵行列变换也可以删除数据矩阵中的冗余数值,因此可以通过K-means聚类算法等效代替矩阵行列变换过程;K-means聚类算法对分解得到的矩阵U、V分别进行聚类,根据聚类的簇内差异,挑选聚类最紧凑的前N_best个向量,即为用来进行数据变换的向量组V_tr;向量留存数N_best为经过筛选后保留的特征向量的数量;保留的向量越多,则保留信息越多,越有利于后续分类;
步骤2.14:K-means聚类算法得到行标签:向量的夹角是向量间点乘运算的重要影响因素,因此包含不同局部特征向量相乘的结果会出现一定数值差异,为减小这种差异,将筛选得到的特征向量组V_tr与归一化后的数据矩阵A相乘,再对结果Pr进行K-means聚类,聚类结果即为光谱双聚类的行或列标签,即园区用户每天的用电类别,通过分析用户每天的用电类别完成用户用电类别标签的确定:Pr=A·V_tr(3),根据园区用户每天用电类别的统计计数情况,将出现次数最多的用电类别定义为园区用户的用电类别标签,反映园区用户的用电习惯,考虑到不同行业用户的有功、无功消耗方式不同,因此从无功和有功两个角度进行多维度分析,并定义用电行为特征为(用户有功用电类别,用户无功用电类别)组合,再在各个园区中将相同用电行为特征的用户划分为同一个群体结构,并赋予相应标签,从而实现园区群体结构的多维度划分。
5.如权利要求3所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2.2中的构建基于组合预测方法的用能需求模型采用基于等权递归方法进行区域电力用户未来3年的用电量以及年最大负荷组合预测,具体包括以下步骤:
步骤2.21:获取一定时间跨度的历史负荷数据序列;
步骤2.22:采用Logistic曲线模型进行中长期负荷预测,计算预测目标时间内对应的负荷预测值;
步骤2.23:采用改进灰色Verhulst模型进行中长期负荷预测,计算预测目标时间内对应的负荷预测值;
步骤2.24:将所有模型预测得到的负荷预测值进行汇总,得到高方案、中方案、低方案;
步骤2.25:采用等权递归算法求取区域电力用户预测目标时间内负荷的组合预测值。
6.如权利要求5所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2.22中的Logistic曲线模型对用户年用电量和最大负荷的历史数据进行拟合,得到园区用户未来3年的负荷规模,具体为:Logistic曲线的微分形式:对上式进行求解可得:/>式中,y为预测值,包括区域电力用户年用电量或者年最大负荷;k、a、b为待定参数,k为预测量的饱和值,a、b共同决定不同发展阶段用户负荷的增长速度;采用三段倒数和值法对参数k、a、b进行估计:首先,将3n年历史用电量数据y1,y2,...,yn,yn+1,...,y2n,y2n+1,...,y3n按时间段划分为3部分,对各段用电量数据求和:式中,Si为第i段用电量的倒数和;n为每段内包含的年数;将相邻时段用电量作差可得:/> 代入式(5)得:/>式中,t代表时间,取值是相对预测数据的起始年份。
7.如权利要求5所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2.23中的改进灰色Verhulst模型具体为:设非负原始时间序列数据为X(0)={x(0)(1),x(0)(2),...,x(0)(n)},即预测值构成的序列,对X(0)进行一阶累加得到序列:Z(1)是X(1)的紧邻均值序列,则:建立灰色Verhulst模型:x(0)(k)+az(1)(k)=b(z(1)(k))2(11),式中,a、b为待定参数,a为发展系数,b为灰作用量;微分方程形式为:/>则灰色Verhulst模型的时间序列响应为:/>进行一阶累减还原,得到输入序列的灰色Verhulst预测模型为:/>对模型中的待定参数进行最小二乘估计得:/>采用等维新息递补、残差修正建立改进灰色Verhulst模型,根据负荷增长的“近大远小”原则,在灰色Verhulst模型中引入等维新息递补处理,即:保证序列维数不变,每预测出一个新值,就把该预测值加入到原样本序列,并同时去掉样本序列中最早的1个数据,使样本数据中始终含有最新的数据信息,然后以新的样本序列重新输入到灰色Verhulst模型,循环下去直到得到目标预测年份的数据为止,通过灰色Verhulst模型进行饱和负荷预测,得到样本预测序列/>再将样本预测序列/>与样本观测序列x(0)(k)相减得到残差序列e(k),然后以残差序列作为输入,得到残差序列的预测值来补偿预测误差,因此,基于残差修正的改进灰色Verhulst模型的预测数据序列/>为:/>其中预测数据序列x~(k)即为模型预测的未来区域用户每年的年用电量或者年最大负荷构成的序列。
8.如权利要求5所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2.25中的组合预测是指综合利用Logistic曲线模型和改进灰色Verhulst模型,采用等权递归法求取权重模型得出组合预测模型,具体为:当前有n种预测方法,记为F1,F2,...,Fn,首先,进行第一轮进行平均:/>式中,/> 表示第i种单一预测方法在t时刻的预测值;/>表示第一轮代数平均后在t时刻的预测值;假设n种预测方法中第i种单一预测模型的误差平方和最大,则用F(1)替换掉第i种方法的预测值,得到第二轮平均所需的n种方法预测值:/>如此重复进行,经过k轮平均,即可得到组合预测模型为:式中,/>为各单一预测方法的权重;如果F(k)的模型相对误差百分比已经达到可接受的水平,则停止迭代,否则继续迭代直到模型相对误差百分比满足要求。
9.如权利要求3所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤2.3:构建考虑多维度用能需求分析的用户成熟度评价模型具体包括以下步骤:
步骤2.31:业扩报装需求评价指标;
步骤2.32:需求响应潜力评价指标;
步骤2.33:上市公司经营发展潜力;
步骤2.34:非上市公司经营发展潜力。
10.如权利要求1所述的基于电力大数据的园区用能动态画像划分方法,其特征在于:所述的步骤3中的构建考虑群体演化过程的园区用能画像模型,实现计及群体结构状态变化的园区动态画像具体包括以下步骤:
步骤3.1:考虑社会属性的用户用能画像算法;
步骤3.2:园区用户复杂网络模型;
步骤3.3:基于吉尔文-纽曼算法的用户群体划分;
步骤3.4:基于群体变化过程的园区动态画像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310765786.5A CN116628534A (zh) | 2023-06-27 | 2023-06-27 | 基于电力大数据的园区用能动态画像划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310765786.5A CN116628534A (zh) | 2023-06-27 | 2023-06-27 | 基于电力大数据的园区用能动态画像划分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116628534A true CN116628534A (zh) | 2023-08-22 |
Family
ID=87617186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310765786.5A Withdrawn CN116628534A (zh) | 2023-06-27 | 2023-06-27 | 基于电力大数据的园区用能动态画像划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116628534A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118211819A (zh) * | 2024-05-22 | 2024-06-18 | 国网浙江省电力有限公司 | 基于能源需求特性的复杂用能实体画像重构方法及系统 |
CN118411050A (zh) * | 2024-04-29 | 2024-07-30 | 国网宁夏电力有限公司银川供电公司 | 基于电力数据的工业园区用能状况评价方法和装置 |
-
2023
- 2023-06-27 CN CN202310765786.5A patent/CN116628534A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118411050A (zh) * | 2024-04-29 | 2024-07-30 | 国网宁夏电力有限公司银川供电公司 | 基于电力数据的工业园区用能状况评价方法和装置 |
CN118211819A (zh) * | 2024-05-22 | 2024-06-18 | 国网浙江省电力有限公司 | 基于能源需求特性的复杂用能实体画像重构方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11663493B2 (en) | Method and system of dynamic model selection for time series forecasting | |
Fiot et al. | Electricity demand forecasting by multi-task learning | |
Bassamzadeh et al. | Multiscale stochastic prediction of electricity demand in smart grids using Bayesian networks | |
Asgharian et al. | The importance of the macroeconomic variables in forecasting stock return variance: A GARCH‐MIDAS approach | |
Matijaš et al. | Load forecasting using a multivariate meta-learning system | |
Su et al. | A systematic data-driven Demand Side Management method for smart natural gas supply systems | |
Pirbazari et al. | Evaluating feature selection methods for short-term load forecasting | |
Li et al. | Energy data generation with wasserstein deep convolutional generative adversarial networks | |
Nazir et al. | Forecasting energy consumption demand of customers in smart grid using Temporal Fusion Transformer (TFT) | |
CN116628534A (zh) | 基于电力大数据的园区用能动态画像划分方法 | |
Park et al. | A framework for baseline load estimation in demand response: Data mining approach | |
Zheng et al. | Interpretable building energy consumption forecasting using spectral clustering algorithm and temporal fusion transformers architecture | |
Muzumdar et al. | Designing a robust and accurate model for consumer-centric short-term load forecasting in microgrid environment | |
Raghavendra et al. | Artificial humming bird with data science enabled stability prediction model for smart grids | |
Bidoki et al. | Evaluating different clustering techniques for electricity customer classification | |
Markovič et al. | Data-driven classification of residential energy consumption patterns by means of functional connectivity networks | |
CN112288172A (zh) | 台区线损率的预测方法、装置 | |
Kumaraswamy et al. | An ensemble neural network model for predicting the energy utility in individual houses | |
Abumohsen et al. | Electrical load forecasting based on random forest, xgboost, and linear regression algorithms | |
Krstev et al. | An overview of forecasting methods for monthly electricity consumption | |
Sharma et al. | Optimal reconciliation of hierarchical wind power forecasts of correlated wind farms | |
Grolinger et al. | Energy slices: benchmarking with time slicing | |
Tang et al. | Leveraging socioeconomic information and deep learning for residential load pattern prediction | |
Ali et al. | Deep learning networks for short term load forecasting | |
Vilar-Fernández et al. | Nonparametric forecasting in time series—a comparative study |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230822 |
|
WW01 | Invention patent application withdrawn after publication |