CN116933962A - 一种面向电力用户负荷特性和可调节潜力的聚类方法 - Google Patents
一种面向电力用户负荷特性和可调节潜力的聚类方法 Download PDFInfo
- Publication number
- CN116933962A CN116933962A CN202310276887.6A CN202310276887A CN116933962A CN 116933962 A CN116933962 A CN 116933962A CN 202310276887 A CN202310276887 A CN 202310276887A CN 116933962 A CN116933962 A CN 116933962A
- Authority
- CN
- China
- Prior art keywords
- clustering
- load
- user
- data
- adjustable potential
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000005611 electricity Effects 0.000 claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 18
- 230000009467 reduction Effects 0.000 claims abstract description 15
- 238000012937 correction Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 10
- 230000002860 competitive effect Effects 0.000 claims abstract description 9
- 230000002441 reversible effect Effects 0.000 claims abstract description 7
- 230000005612 types of electricity Effects 0.000 claims abstract description 3
- 230000006399 behavior Effects 0.000 claims description 27
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000007613 environmental effect Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 230000001105 regulatory effect Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000010224 classification analysis Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000011524 similarity measure Methods 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 230000005856 abnormality Effects 0.000 claims 1
- 230000009191 jumping Effects 0.000 claims 1
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种面向电力用户负荷特性和可调节潜力的聚类方法,包括:获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息;利用OPTICS聚类方法对用电负荷数据进行一次聚类,获得一次聚类结果;采用PCA将用户用电行为影响因素数据进行特征降维,并将降维后的主成分作为二次聚类的输入层;针对同类型的用电负荷特性用户群进行二次聚类,利用自组织竞争神经网络(SOM)的模式分类性能得到考虑用户可调节潜力的二次聚类结果;基于反向修正原理,将二次聚类结果作为BiGRU神经网络的训练数据集,反向修正一次聚类结果,随后重复二次聚类流程,得到最终的考虑用户负荷特性和可调节潜力的综合聚类结果,确定所述负荷样本的类别。
Description
技术领域
本发明涉及电力负荷数据处理技术领域,具体是涉及一种面向电力用户负荷特性和可调节潜力的聚类方法。
背景技术
随着我国电力企业对客户侧互动和服务的逐渐重视,电力用户逐渐参与到电网公司的各项业务中来,负荷与源、网的互动调节也越来越多。但大规模用户的参与给电网公司开展需求侧调度工作也带来了挑战,用户负荷响应情况参差不齐、用户行为特征差异化严重,亟需开展对电力用户的精准化分类,以支撑更加高质量的电网友好互动调节。针对电力用户的可调节潜力及负荷特性,研究有效的数据分析技术和负荷分类方法对于节约需求响应成本具有重要的研究意义。
发明内容
本发明实施例提供一种面向电力用户负荷特性和可调节潜力的聚类方法,包括:
获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息;
利用OPTICS聚类方法对用电负荷数据进行一次聚类,得到N类用户群体,获得第一次负荷样本聚类结果;
采用PCA将用户用电行为影响因素数据进行特征降维,并将降维后的主成分作为二次聚类的输入层;
针对同类型的用电负荷特性用户群进行二次聚类,利用自组织竞争神经网络(SOM)的模式分类性能得到考虑用户可调节潜力的二次聚类结果;
基于反向修正原理,将二次聚类结果作为BiGRU神经网络的训练数据集,反向修正一次聚类结果,随后重复二次聚类流程,得到最终的考虑用户负荷特性和可调节潜力的综合聚类结果,确定所述负荷样本的类别。
进一步的,用电负荷数据包括:
负荷用电峰值Pmax、负荷用电谷值Pmin、负荷平均用电功率和负荷最大利用小时数Γ,其中,
式中,P(t)为t时刻负荷用电功率,T为负荷用电数据采集周期。
进一步的,还包括对用户负荷数据的预处理步骤,其包括:
首先,从数据集中随机选取多个特征值来构成特征空间;其次,在选取特征内的最大值和最小值之间随机分割值形成分区,构建孤立树;然后,将构建的孤立树组成iForest;最后,计算每一个点的异常得分。根据负荷数据特点设定相应的阈值,从而判断数据的异常与否,并对异常数据进行修正。修正方法为采用多阶拉格朗日内插值法计算异常数据近邻正常数据的均值进行替代。
进一步的,用户用电行为影响因素包括:
自我影响因素:用户用电模式、用户响应意愿、用户行为偏好;自然环境影响因素:温度变化、湿度变化、风力变化;社会环境影响因素:社会阶层、职业薪酬、家庭情况。
进一步的,利用OPTICS聚类方法对用电负荷数据进行一次聚类具体步骤包括:
1.标记数据集D中所有样本点均为未处理点,设置参数邻域半径ε以及点数MinPts。
2.创建有序队列和结果队列,其中结果队列用来存储样本的输出顺序。
3.若样本数据集D中的所有样本点均被标记为已处理,则算法结束。否则选取一个核心对象,将其直接密度可达点放入有序队列中,并依据可达距离升序排序。
4.若有序队列中已无样本点,则跳转步骤2,否则将有序队列的第一个点放入结果队列中,并做以下操作:1)如果该点不是核心对象则返回4,反之则记录该点所有的密度可达点;2)若直接密度可达点已在结果队列中,则忽略;若在有序队列中,则在新旧可达距离中选择更小的可达距离记录,并按距离远近依次排序;若不在两个队列中,则在有序队列中插入该点并排序。
5.迭代3、4直至算法结束,按顺序输出结果队列中的所有样本点及其对应的可达距离。
6.绘制坐标图,其中x轴是OPTICS算法处理点的先后顺序,y轴是点的最小可达性距离。在y轴上选定阈值,根据具体情况,确定恰当的阈值,以提取聚类,得到N类用户群体。
进一步的,选取PCA对用户用电行为多维影响因素数据进行特征降维,具体步骤包括:
设共有n个电力用户,每个用户的用电行为影响因素数据有p项指标,X1,X2,...,XP为初始设置的随机变量的集合,得到原始数据的矩阵X为
其中,矩阵X的p项指标中的数组做线性组合得:
式中:aip为系数,且满足x1,x2,...,xp为各项指标的对应的值;F1,F2,...,Fp为新的不相关变量。
具体步骤包括:
1.根据公式首先得到原始数据矩阵X;
2)计算均值
3)计算出协方差矩阵;
4)计算出协方差矩阵的特征向量和特征值;
5)确定主成分。
进一步的,用户用电行为影响因素多维提取主成分时,选取特征值大于1及累计方差贡献率达到85%以上的前k个特征指标,其累计贡献率表示为:将降维后的主成分作为二次聚类的输入层。
进一步的,采用SOM网络对用户可调潜力进行二次聚类的步骤包括:
1.向量归一化。将SOM网络的输入向量,即经过PCA特征降维后的主成分向量Z。
2.寻找获胜节点。当网络得到一个Z时,竞争层的所有Wij均与Z进行相似性比较,将和Z相似性最大的Wij判定为竞争获胜节点,记为Wc。其中,相似性的度量通过计算Wij和Z的欧氏距离(或夹角余弦)确定。
||Z-Wc||=min{dj}
式中,Wij为节点i和节点j之间的权重,Wc为获胜节点的权重。
3.参数调整Wij。
Wij(t+1)=Wij(t)+η(t)hc,j(t)(Zi-Wij(t))
式中,η(t)是学习速率,为增益函数,η(t)∈(0,1];hc,j(t)是领域函数,hc,j(t)通常采用高斯函数,即:
式中,dcj是神经元c和领域内任一被激活神经元j之间的距离;r是领域半径。
步骤3完成后需要返回第一步继续训练,当η(t)衰减至0或规定的值时,所有样本训练完成。训练结束后,输出编号一样的神经元就代表了特征上相似的类别,可以划分为同一类。
进一步的,基于反向修正原理,将二次聚类结果作为BiGRU神经网络的训练数据集,将个别用户种类进行调整,得到更为精准的聚类结果,反向修正一次聚类结果,对一次聚类结果进行调节,计算公式包括:
式中,GRU为传统的GRU网络运算过程,为t时刻前后隐藏层的状态与权重;为t时刻后向隐藏层状态与权重;bt为t时刻隐藏层状态的偏置。
进一步的,采取DB指数(davies-bouldin index,DBI)和轮廓系数(silhouettecoefficient,SI)作为用户负荷特性和可调节潜力综合聚类结果的评价性指标,计算公式包括:
式中,和/>分别为为第i类和第j类所有样本到其所属类中心距离的平均值;Mij为不同类别的类中心距离。
式中:ai为某一特征向量到所有它属于的簇中其它点的距离;bi为某一特征向量到与它相邻最近的一簇内的所有点的平均距离。
进一步的,采用OPTICS算法的一次聚类结果可以得到k类具有类内相似性和类间各异性的用户群体。针对用户基础信息采集数据,将各类用户主成分变量作为自组织竞争神经网络的输入参数进行用户用电行为分类分析,得到考虑用户可调节潜力的二次聚类结果。通过二次聚类,将一次聚类得到的k类不同负荷特性的用户又分为可调节潜力从强到弱的m类。而k类用户中存在偏离聚类中心较远的点,即偏离点,采用BiGRU神经网络反向调整聚类结果。以自组织竞争神经网络的二次聚类结果作为BiGRU神经网络的训练数据集。经BiGRU神经网络反向调节后,将产生修正的用户,能够将用电行为特性相对随机的用户进行精准聚类,最终确定所述负荷样本的类别,如代表负荷特性的第k类中的可调节潜力第m类。
本发明实施例提供一种面向电力用户负荷特性和可调节潜力的聚类方法,与现有技术相比,其有益效果如下:
采用面向用户负荷特性和可调节潜力综合聚类方法较其他常用聚类算法具有更好的聚类质量;采用BiGRU神经网络进行反向修正,解决了仅双层聚类无法识别个别用户的归类问题。
附图说明
图1为本发明实施例提供的一种面向电力用户负荷特性和可调节潜力的聚类方法流程图;
图2为本发明实施例提供的一种面向电力用户负荷特性和可调节潜力的聚类方法OPTICS算法流程图。
图3为本发明实施例提供的一种面向电力用户负荷特性和可调节潜力的聚类方法PCA-SOM算法流程图。
具体实施方式
以下通过具体实施例对本发明做进一步解释说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1~3,本发明实施例提供一种面向电力用户负荷特性和可调节潜力的聚类方法,该方法包括:
采用OPTICS算法的一次聚类结果可以得到k类具有类内相似性和类间各异性的用户群体。针对用户基础信息采集数据,将各类用户主成分变量作为自组织竞争神经网络的输入参数进行用户用电行为分类分析,得到考虑用户可调节潜力的二次聚类结果。通过二次聚类,将一次聚类得到的k类不同负荷特性的用户又分为可调节潜力从强到弱的m类。而k类用户中存在偏离聚类中心较远的点,即偏离点,采用BiGRU神经网络反向调整聚类结果。以自组织竞争神经网络的二次聚类结果作为BiGRU神经网络的训练数据集。经BiGRU神经网络反向调节后,将产生修正的用户,能够将用电行为特性相对随机的用户进行精准聚类,最终确定所述负荷样本的类别,如代表负荷特性的第k类中的可调节潜力第m类。
实施例:
1、获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息。
其中,用电负荷数据包括:负荷用电峰值Pmax、负荷用电谷值Pmin、负荷平均用电功率和负荷最大利用小时数Γ,其中,
式中,P(t)为t时刻负荷用电功率,T为负荷用电数据采集周期。
2、用电负荷数据预处理
首先,从数据集中随机选取多个特征值来构成特征空间;其次,在选取特征内的最大值和最小值之间随机分割值形成分区,构建孤立树;然后,将构建的孤立树组成iForest;最后,计算每一个点的异常得分。根据负荷数据特点设定相应的阈值,从而判断数据的异常与否,并对异常数据进行修正。修正方法为采用多阶拉格朗日内插值法计算异常数据近邻正常数据的均值进行替代。
3、通过调查问卷采集用户用电行为影响因素
包括:自我影响因素:用户用电模式、用户响应意愿、用户行为偏好;自然环境影响因素:温度变化、湿度变化、风力变化;社会环境影响因素:社会阶层、职业薪酬、家庭情况。
4、利用OPTICS聚类方法对用电负荷数据进行一次聚类
步骤包括:
1)标记数据集D中所有样本点均为未处理点,设置参数邻域半径ε以及点数MinPts。
2)创建有序队列和结果队列,其中结果队列用来存储样本的输出顺序。
3)若样本数据集D中的所有样本点均被标记为已处理,则算法结束。否则选取一个核心对象,将其直接密度可达点放入有序队列中,并依据可达距离升序排序。
4)若有序队列中已无样本点,则跳转步骤2,否则将有序队列的第一个点放入结果队列中,并做以下操作:如果该点不是核心对象则返回步骤4,反之则记录该点所有的密度可达点;若直接密度可达点已在结果队列中,则忽略;若在有序队列中,则在新旧可达距离中选择更小的可达距离记录,并按距离远近依次排序;若不在两个队列中,则在有序队列中插入该点并排序。
5)迭代步骤3、4直至算法结束,按顺序输出结果队列中的所有样本点及其对应的可达距离。
6)绘制坐标图,其中x轴是OPTICS算法处理点的先后顺序,y轴是点的最小可达性距离。在y轴上选定阈值,根据具体情况,确定恰当的阈值,以提取聚类,得到N类用户群体。
4、选取PCA对用户用电行为多维影响因素数据进行特征降维
公式包括:
设共有n个电力用户,每个用户的用电行为影响因素数据有p项指标,X1,X2,...,XP为初始设置的随机变量的集合,得到原始数据的矩阵X为
其中,矩阵X的p项指标中的数组做线性组合得:
式中:aip为系数,且满足x1,x2,...,xp为各项指标的对应的值;F1,F2,...,Fp为新的不相关变量。
具体步骤包括:
1)根据公式首先得到原始数据矩阵X;
2)计算均值
3)计算出协方差矩阵;
4)计算出协方差矩阵的特征向量和特征值;
5)确定主成分。
5、用户用电行为影响因素多维提取主成分时,选取特征值大于1及累计方差贡献率达到85%以上的前k个特征指标,其累计贡献率表示为:将降维后的主成分作为二次聚类的输入层。
6、采用SOM网络对用户可调潜力进行二次聚类
步骤包括:
1)向量归一化。将SOM网络的输入向量,即经过PCA特征降维后的主成分向量Z。
2)寻找获胜节点。当网络得到一个Z时,竞争层的所有Wij均与Z进行相似性比较,将和Z相似性最大的Wij判定为竞争获胜节点,记为Wc。其中,相似性的度量通过计算Wij和Z的欧氏距离(或夹角余弦)确定。
||Z-Wc||=min{dj}
式中,Wij为节点i和节点j之间的权重,Wc为获胜节点的权重。
3)参数调整Wij。
Wij(t+1)=Wij(t)+η(t)hc,j(t)(Zi-Wij(t))
式中,η(t)是学习速率,为增益函数,η(t)∈(0,1];hc,j(t)是领域函数,hc,j(t)通常采用高斯函数,即:
式中,dcj是神经元c和领域内任一被激活神经元j之间的距离;r是领域半径。
步骤3完成后需要返回第一步继续训练,当η(t)衰减至0或规定的值时,所有样本训练完成。训练结束后,输出编号一样的神经元就代表了特征上相似的类别,可以划分为同一类。
7、BiGRU神经网络反向修正一次聚类结果
基于反向修正原理,将二次聚类结果作为BiGRU神经网络的训练数据集,将个别用户种类进行调整,得到更为精准的聚类结果,反向修正一次聚类结果,对一次聚类结果进行调节,计算公式包括:
式中,GRU为传统的GRU网络运算过程,为t时刻前后隐藏层的状态与权重;为t时刻后向隐藏层状态与权重;bt为t时刻隐藏层状态的偏置。
8、模型性能评估
采取DB指数(davies-bouldin index,DBI)和轮廓系数(silhouettecoefficient,SI)作为用户负荷特性和可调节潜力综合聚类结果的评价性指标,计算公式包括:
式中,和/>分别为为第i类和第j类所有样本到其所属类中心距离的平均值;Mij为不同类别的类中心距离。
式中:ai为某一特征向量到所有它属于的簇中其它点的距离;bi为某一特征向量到与它相邻最近的一簇内的所有点的平均距离。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (10)
1.一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,包括:
S1、获取智能电表采集的用户负荷数据以及通过调查问卷采集的用户用电行为影响因素基础信息;
S2、利用OPTICS聚类方法对用电负荷数据进行一次聚类,得到N类用户群体,获得负荷样本一次聚类结果;
S3、采用PCA将用户用电行为影响因素数据进行特征降维,并将降维后的主成分作为二次聚类的输入层;
S4、针对同类型的用电负荷特性用户群进行二次聚类,利用自组织竞争神经网络(SOM)的模式分类性能得到考虑用户可调节潜力的二次聚类结果;
S5、基于反向修正原理,将二次聚类结果作为BiGRU神经网络的训练数据集,反向修正一次聚类结果,随后重复二次聚类流程,得到最终的考虑用户负荷特性和可调节潜力的综合聚类结果,确定所述负荷样本的类别。
2.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S1中,用电负荷数据包括:
负荷用电峰值Pmax、负荷用电谷值Pmin、负荷平均用电功率和负荷最大利用小时数Γ,其中,
式中,P(t)为t时刻负荷用电功率,T为负荷用电数据采集周期。
3.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S1中,还包括对电力负荷数据的预处理,其包括:
S11、从数据集中随机选取多个特征值来构成特征空间;
S12、在选取特征内的最大值和最小值之间随机分割值形成分区,构建孤立树;
S13、将构建的孤立树组成iForest;
S14、计算每一个点的异常得分。根据负荷数据特点设定相应的阈值,从而判断数据的异常与否,并对异常数据进行修正。修正方法为采用多阶拉格朗日内插值法计算异常数据近邻正常数据的均值进行替代。
4.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S1中,用户用电行为影响因素包括:
自我影响因素:用户用电模式、用户响应意愿、用户行为偏好;自然环境影响因素:温度变化、湿度变化、风力变化;社会环境影响因素:社会阶层、职业薪酬、家庭情况。
5.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S2中,利用OPTICS聚类方法对用电负荷数据进行一次聚类具体步骤包括:
S21、标记数据集D中所有样本点均为未处理点,设置参数邻域半径ε以及点数MinPts。
S22、创建有序队列和结果队列,其中结果队列用来存储样本的输出顺序。
S23、若样本数据集D中的所有样本点均被标记为已处理,则算法结束。否则选取一个核心对象,将其直接密度可达点放入有序队列中,并依据可达距离升序排序。
S24、若有序队列中已无样本点,则跳转S22,否则将有序队列的第一个点放入结果队列中,并做以下操作:如果该点不是核心对象则返回S24,反之则记录该点所有的密度可达点;若直接密度可达点已在结果队列中,则忽略;若在有序队列中,则在新旧可达距离中选择更小的可达距离记录,并按距离远近依次排序;若不在两个队列中,则在有序队列中插入该点并排序。
S25、迭代S23、S24直至算法结束,按顺序输出结果队列中的所有样本点及其对应的可达距离。
S26、绘制坐标图,其中x轴是OPTICS算法处理点的先后顺序,y轴是点的最小可达性距离。在y轴上选定阈值,根据具体情况,确定恰当的阈值,以提取聚类,得到N类用户群体。
6.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S3中,选取PCA对用户用电行为多维影响因素数据进行特征降维,公式包括:
设共有n个电力用户,每个用户的用电行为影响因素数据有p项指标,X1,X2,...,XP为初始设置的随机变量的集合,得到原始数据的矩阵X为:
其中,矩阵X的p项指标中的数组做线性组合得:
式中:aip为系数,且满足i=1,2,...,p;x1,x2,...,xp为各项指标的对应的值;F1,F2,...,Fp为新的不相关变量。
具体步骤包括:
S31、根据公式首先得到原始数据矩阵X;
S32、计算均值
S33、计算出协方差矩阵;
S34、计算出协方差矩阵的特征向量和特征值;
S35、确定主成分。
7.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S3中,用户用电行为影响因素多维提取主成分时,选取特征值大于1及累计方差贡献率达到85%以上的前k个特征指标,其累计贡献率表示为:将降维后的主成分作为二次聚类的输入层。
8.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S4中,采用SOM网络对用户可调潜力进行二次聚类的步骤包括:
S41、向量归一化。将SOM网络的输入向量,即经过PCA特征降维后的主成分向量Z。
S42、寻找获胜节点。当网络得到一个Z时,竞争层的所有Wij均与Z进行相似性比较,将和Z相似性最大的Wij判定为竞争获胜节点,记为Wc。其中,相似性的度量通过计算Wij和Z的欧氏距离(或夹角余弦)确定。
||Z-Wc||=min{dj}
式中,Wij为节点i和节点j之间的权重,Wc为获胜节点的权重。
S43、参数调整Wij。
Wij(t+1)=Wij(t)+η(t)hc,j(t)(Zi-Wij(t))
式中,η(t)是学习速率,为增益函数,η(t)∈(0,1];hc,j(t)是领域函数,hc,j(t)通常采用高斯函数,即:
式中,dcj是神经元c和领域内任一被激活神经元j之间的距离;r是领域半径。
S44、S43完成后需要返回S41继续训练,当η(t)衰减至0或规定的值时,所有样本训练完成。训练结束后,输出编号一样的神经元就代表了特征上相似的类别,可以划分为同一类。
9.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S5中,基于反向修正原理,将二次聚类结果作为BiGRU神经网络的训练数据集,将个别用户种类进行调整,得到更为精准的聚类结果,反向修正一次聚类结果,对一次聚类结果进行调节,计算公式包括:
式中,GRU为传统的GRU网络运算过程,为t时刻前后隐藏层的状态与权重;为t时刻后向隐藏层状态与权重;bt为t时刻隐藏层状态的偏置。
10.根据权利要求1所述的一种面向电力用户负荷特性和可调节潜力的聚类方法,其特征在于,所述S5中,采取DB指数(davies-bouldin index,DBI)和轮廓系数(silhouettecoefficient,SI)作为用户负荷特性和可调节潜力综合聚类结果的评价性指标,计算公式包括:
式中,和/>分别为为第i类和第j类所有样本到其所属类中心距离的平均值;Mij为不同类别的类中心距离。
式中:ai为某一特征向量到所有它属于的簇中其它点的距离;bi为某一特征向量到与它相邻最近的一簇内的所有点的平均距离。
所述基于电力负荷数据及用户基础信息采集数据的OPTICS-SOM-BiGRU模型得到精准聚类结果的步骤,包括:
采用OPTICS算法的一次聚类结果可以得到k类具有类内相似性和类间各异性的用户群体。针对用户基础信息采集数据,将各类用户主成分变量作为自组织竞争神经网络的输入参数进行用户用电行为分类分析,得到考虑用户可调节潜力的二次聚类结果。通过二次聚类,将一次聚类得到的k类不同负荷特性的用户又分为可调节潜力从强到弱的m类。而k类用户中存在偏离聚类中心较远的点,即偏离点,采用BiGRU神经网络反向调整聚类结果。以自组织竞争神经网络的二次聚类结果作为BiGRU神经网络的训练数据集。经BiGRU神经网络反向调节后,将产生修正的用户,能够将用电行为特性相对随机的用户进行精准聚类,最终确定所述负荷样本的类别,如代表负荷特性的第k类中的可调节潜力第m类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310276887.6A CN116933962A (zh) | 2023-03-17 | 2023-03-17 | 一种面向电力用户负荷特性和可调节潜力的聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310276887.6A CN116933962A (zh) | 2023-03-17 | 2023-03-17 | 一种面向电力用户负荷特性和可调节潜力的聚类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116933962A true CN116933962A (zh) | 2023-10-24 |
Family
ID=88393166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310276887.6A Pending CN116933962A (zh) | 2023-03-17 | 2023-03-17 | 一种面向电力用户负荷特性和可调节潜力的聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933962A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117454120A (zh) * | 2023-12-20 | 2024-01-26 | 山西思极科技有限公司 | 电力通信系统数据的采集分析方法 |
CN117874497A (zh) * | 2024-03-11 | 2024-04-12 | 国网北京市电力公司 | 一种负荷特征提取方法、装置、设备及介质 |
-
2023
- 2023-03-17 CN CN202310276887.6A patent/CN116933962A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117454120A (zh) * | 2023-12-20 | 2024-01-26 | 山西思极科技有限公司 | 电力通信系统数据的采集分析方法 |
CN117454120B (zh) * | 2023-12-20 | 2024-03-15 | 山西思极科技有限公司 | 电力通信系统数据的采集分析方法 |
CN117874497A (zh) * | 2024-03-11 | 2024-04-12 | 国网北京市电力公司 | 一种负荷特征提取方法、装置、设备及介质 |
CN117874497B (zh) * | 2024-03-11 | 2024-05-07 | 国网北京市电力公司 | 一种负荷特征提取方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111199016B (zh) | 一种基于DTW的改进K-means的日负荷曲线聚类方法 | |
CN106055918B (zh) | 一种电力系统负荷数据的辨识及修正方法 | |
CN116933962A (zh) | 一种面向电力用户负荷特性和可调节潜力的聚类方法 | |
WO2018045642A1 (zh) | 一种母线负荷预测方法 | |
CN108399453A (zh) | 一种电力客户信用等级评价方法和装置 | |
CN112613536B (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN106067034B (zh) | 一种基于高维矩阵特征根的配电网负荷曲线聚类方法 | |
CN110795690A (zh) | 风电场运行异常数据检测方法 | |
CN116526450A (zh) | 计及误差补偿的两阶段短期电力负荷组合预测方法 | |
CN108428055B (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
Bidoki et al. | Evaluating different clustering techniques for electricity customer classification | |
CN113869616A (zh) | 一种自适应的居民用户负荷预测方法 | |
CN118193778B (zh) | 一种融合多特征的遥感图像检索方法 | |
Wang et al. | Big data analytics for price forecasting in smart grids | |
CN111192158A (zh) | 一种基于深度学习的变电站日负荷曲线相似度匹配方法 | |
CN112149052B (zh) | 一种基于plr-dtw的日负荷曲线聚类方法 | |
CN117290673A (zh) | 一种基于多模型融合的船舶能耗高精度预测系统 | |
CN116308456A (zh) | 大数据环境下用户用电行为分析方法、系统、装置及介质 | |
CN115952895A (zh) | 一种风电装置功率预测方法、系统及存储介质 | |
CN114444760A (zh) | 一种基于模式提取和误差调整的行业用户电量预测方法 | |
CN104636489B (zh) | 描述属性数据的处理方法和装置 | |
CN112257910A (zh) | 一种绩效评分卡指标权重的优化方法及系统 | |
CN110598978A (zh) | 一种基于股票金融时间序列的技术指标处理方法 | |
CN113673168B (zh) | 模型参数修正方法、装置、设备及可读存储介质 | |
CN111784381A (zh) | 基于隐私保护和som网络的电力客户细分方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |