CN110321389A - 一种基于时间序列聚类的电能表设备类别识别方法 - Google Patents
一种基于时间序列聚类的电能表设备类别识别方法 Download PDFInfo
- Publication number
- CN110321389A CN110321389A CN201910401307.5A CN201910401307A CN110321389A CN 110321389 A CN110321389 A CN 110321389A CN 201910401307 A CN201910401307 A CN 201910401307A CN 110321389 A CN110321389 A CN 110321389A
- Authority
- CN
- China
- Prior art keywords
- electric energy
- energy meter
- time series
- recognition methods
- device class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明公开了一种基于时间序列聚类的电能表设备类别识别方法,电能表安装时间序列是长期趋势(T)、季节变动(S)、循环波动(C)、不规则波动(I)的叠加或耦合,其中,利用线性回归的方式及最小二乘法的求解方法构建特征T,利用中心化移动平均值计算季节指数从而构造特征S,利用移动平均及T分解循环波动从而构造特征C,实现了具有相互替代关系的设备码自动匹配。
Description
技术领域
本发明属于电能表设备高效识别技术领域,具体涉及一种基于时间序列聚类的电能表设备类别识别方法。
背景技术
时间序列线性趋势的确认大致分为两种方式,定性的描述:观察时间序列图;定量的描述:利用回归分析拟合一条趋势线,然后对回归系数进行显著性检验。如果回归系数显著,就可以得出线性趋势显著的结论,为了便于计算,通过定量描述来确定电能表安装时间序列的趋势。
电能表由于技术更新,各设备类别通常存在互相替代关系。现阶段对于具有相互替代关系的电能表时间序列的关联是基于专家经验而进行的人工关联。未能自动识别关联关系的,不能满足对于电能表安装序列进行进一步数据分析的要求。
发明内容
为解决现有技术的不足,本发明的目的在于自动识别具有相互替代关系的电能表设备。
为了实现上述目标,本发明采用如下的技术方案:
一种基于时间序列聚类的电能表设备类别识别方法,其特征在于,包括以下步骤:
步骤S1:数据准备及预处理,电能表安装的数据字段,包括设备码、设备类别、安装时间、安装类型,重塑安装时间字段,以年-月为粒度构建特征“安装年月”,同时以安装时间、安装类型、设备类别聚合数据,形成数据输入表,所述字段包括安装类型、设备类别、安装年月、数量;
步骤S2:电能表安装序列分解,通过确定趋势成分及其表示(T)、确定季节成分及其表示(S)和确定循环波动及其表示(C),通过产生的T、S、C三个特征构建电能表安装时间序列数据集D;
步骤S3:电能表安装序列分解特征聚类,按照电能表设备类别分簇,随机选取若干个样本计算质心向量,得到各个簇内的电能表即是具有相互替代关系目标设备码列表。
进一步的优选,电能表安装时间序列是长期趋势、季节变动、循环波动、不规则波动的叠加或耦合,其中不规则波动为噪声。
进一步的优选,通过线性回归的方式及最小二乘法的求解方法构建特征T,包括以下步骤:
步骤(1):预设回归方程为b0表示趋势线在Y轴上的截距;b1表示趋势线的斜率;t为某一时刻电能表的安装量;
步骤(2):根据最小二乘法获取两个待定系数:
在α=0.05的显著性水平下检验回归方程,同时利用R2综合检验线性关系是否显著,利用回归系数b1作为T的特征表示。
进一步的优选,利用中心化移动平均值计算季节指数从而构造特征S,包括以下步骤:
步骤(1):计算移动平均值,并对其结果采取中心化处理得出中心化移动平均值
其中,i为年标记,j为季度标记,j<=4。
步骤(2):计算移动平均的比值即季节比率,将序列的各观察值除以相应的中心化移动平均值,再计算出各比值的月度平均值
R为季节比率。
步骤(3):将步骤(2)计算的比率平均值除以总平均值
S即为季节指数。
进一步的优选,利用移动平均及T分解循环波动从而构造特征C,通过MA=T*C以及T值来分解循环波动
其中,MA为移动平均值,C即为循环波动。
进一步的优选,利用T,S,C构建特征集D,即
进一步的优选,电能表安装序列分解特征聚类包括以下具体步骤:
步骤(1):从电能表安装时间序列数据集D中随机选择k个样本作为初始的k个质心向量:{u1,u2,u3...uk}
步骤(2)对于n=1,2,……,N,将电能表设备类别簇C初始化为t=1,2……,k;
对于i=1,2……m,计算样本xi和各个质心向量uj的距离
将xi标记最小的dij所对应的类别λi,此时更新
对于j=1,2,……k,对Cj中所有样本点重新计算新的质心
若所有的k个质心向量都没有发生变化则转到步骤(3);
步骤(3):输出簇划分C={C1,C2,...Ck}
其中各个簇内的电能表即是具有相互替代关系目标设备码列表。
进一步的优选,利用特征集D,运用K-means聚类判断具有相互替代关系的电能表安装序列。
本发明的有益之处在于:本发明实现了具有相互替代关系的设备码自动匹配,利用电能表安装时间序列分解特征,模型依据电能表安装序列特征自动匹配具有相互替代关系的设备码,方便对于具有相互替代关系的设备码安装需求预测。
具体实施方式
以下结合具体实施例对本发明作具体的介绍。
数据准备及预处理
电能表安装数据主要字段:设备码、设备类别、安装时间、安装类型。重塑安装时间字段,以年-月为粒度构建特征“安装年月”;以安装时间、安装类型、设备类别聚合数据,形成数据输入表,其字段为安装类型、设备类别、安装年月、数量。
电能表安装序列通常蕴含高维的信息特征且存在一定的噪声,需要对电能表安装序列进行特征提取。电能表安装时间序列是长期趋势(T)、季节变动(S)、循环波动(C)、不规则波动(I)的叠加或耦合,其中不规则波动为噪声。
下面主要分析电能表安装序列的分解及长期趋势(T)、季节变动(S)、循环波动(C)的特征表示。
对于某一安装类型的电能表安装序列Y={Y1,Y2,Y3...Yn}n>=12期。
其中Y可以表示为Y=f(T,S,C),其中f一般为加法或者乘法模型。此部分由于并不讨论Y的完整表述,只考虑T,S,C的特征表示。
确定趋势成分及其表示(T):
预设回归方程为b0表示趋势线在Y轴上的截距;b1表示趋势线的斜率;t为某一时刻电能表的安装量。根据最小二乘法获取两个待定系数:
在α=0.05的显著性水平下检验回归方程,同时利用R2综合检验线性关系是否显著。利用回归系数b1作为T的特征表示。
确定季节成分及其表示(S):
一般利用季节指数来表示各年的季节成分,以此描述各年的季节变动模式。
(1)计算移动平均值,并对其结果采取中心化处理得出中心化移动平均值
i为年标记,j为季度标记,j<=4。
(2)计算移动平均的比值即季节比率,将序列的各观察值除以相应的中心化移动平均值,然后计算出各比值的月度平均值。
R为季节比率。
(3)将步骤(2)计算的比率平均值除以总平均值。
S即为季节指数。
确定循环波动及其表示(C):
利用MA=T*C以及步骤1中确定的T值来分解循环波动
其中MA为移动平均值,C即为循环波动。
构建时序数据集
利用上述求得的T,S,C三个特征构建电能表安装时间序列数据集D。
最后,电能表安装序列分解特征聚类:
(1)从电能表安装时间序列数据集D中随机选择k个样本作为初始的k个质心向量:{u1,u2,u3...uk}
(2)对于n=1,2,……N:
a)将电能表设备类别簇C初始化为t=1,2...k
b)对于i=1,2……m,计算样本xi和各个质心向量uj的距离
将xi标记最小的dij所对应的类别λi,此时更新
c)对于j=1,2,……k,对Cj中所有样本点重新计算新的质心
d)如果所有的k个质心向量都没有发生变化则转到步骤(3)
(3)输出簇划分C={C1,C2,...Ck}
其中各个簇内的电能表即是具有相互替代关系目标设备码列表。以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (8)
1.一种基于时间序列聚类的电能表设备类别识别方法,其特征在于,包括以下步骤:
步骤S1:数据准备及预处理,电能表安装的数据字段,包括设备码、设备类别、安装时间、安装类型,重塑安装时间字段,以年-月为粒度构建特征“安装年月”,同时以安装时间、安装类型、设备类别聚合数据,形成数据输入表,所述字段包括安装类型、设备类别、安装年月、数量;
步骤S2:电能表安装序列分解,通过确定趋势成分及其表示(T)、确定季节成分及其表示(S)和确定循环波动及其表示(C),通过产生的T、S、C三个特征构建电能表安装时间序列数据集D;
步骤S3:电能表安装序列分解特征聚类,按照电能表设备类别分簇,随机选取若干个样本计算质心向量,得到各个簇内的电能表即是具有相互替代关系目标设备码列表。
2.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于,所述电能表安装时间序列是长期趋势、季节变动、循环波动、不规则波动的叠加或耦合,其中不规则波动为噪声。
3.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于通过线性回归的方式及最小二乘法的求解方法构建特征T,包括以下步骤:
步骤(1):预设回归方程为b0表示趋势线在Y轴上的截距;b1表示趋势线的斜率;t为某一时刻电能表的安装量;
步骤(2):根据最小二乘法获取两个待定系数:
在α=0.05的显著性水平下检验回归方程,同时利用R2综合检验线性关系是否显著,利用回归系数b1作为T的特征表示。
4.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于利用中心化移动平均值计算季节指数从而构造特征S,包括以下步骤:
步骤(1):计算移动平均值,并对其结果采取中心化处理得出中心化移动平均值
其中,i为年标记,j为季度标记,j<=4。
步骤(2):计算移动平均的比值即季节比率,将序列的各观察值除以相应的中心化移动平均值,再计算出各比值的月度平均值
R为季节比率;
步骤(3):将步骤(2)计算的比率平均值除以总平均值
S即为季节指数。
5.根据权利要求3所述的基于时间序列聚类的电能表类别识别方法,其特征在于利用移动平均及T分解循环波动从而构造特征C,通过MA=T*C以及T值来分解循环波动
其中,MA为移动平均值,C即为循环波动。
6.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于,利用T,S,C构建特征集D,即
7.根据权利要求1所述的基于时间序列聚类的电能表类别识别方法,其特征在于,电能表安装序列分解特征聚类包括以下具体步骤:
步骤(1):从电能表安装时间序列数据集D中随机选择k个样本作为初始的k个质心向量:{u1,u2,u3...uk};
步骤(2)对于n=1,2,……,N,将电能表设备类别簇C初始化为
对于i=1,2……m,计算样本xi和各个质心向量uj的距离
将xi标记最小的dij所对应的类别λi,此时更新
对于j=1,2,……k,对Cj中所有样本点重新计算新的质心
若所有的k个质心向量都没有发生变化则转到步骤(3);
步骤(3):输出簇划分C={C1,C2,...Ck}
其中各个簇内的电能表即是具有相互替代关系目标设备码列表。
8.根据权利要求6所述的基于时间序列聚类的电能表类别识别方法,其特征在于利用特征集D,运用K-means聚类判断具有相互替代关系的电能表安装序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910401307.5A CN110321389B (zh) | 2019-05-14 | 2019-05-14 | 一种基于时间序列聚类的电能表设备类别识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910401307.5A CN110321389B (zh) | 2019-05-14 | 2019-05-14 | 一种基于时间序列聚类的电能表设备类别识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110321389A true CN110321389A (zh) | 2019-10-11 |
CN110321389B CN110321389B (zh) | 2023-06-23 |
Family
ID=68118998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910401307.5A Active CN110321389B (zh) | 2019-05-14 | 2019-05-14 | 一种基于时间序列聚类的电能表设备类别识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321389B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113515597A (zh) * | 2021-06-21 | 2021-10-19 | 中盾创新档案管理(北京)有限公司 | 一种基于关联规则挖掘的档案处理方法 |
CN114244824A (zh) * | 2021-11-25 | 2022-03-25 | 国家计算机网络与信息安全管理中心河北分中心 | 一种网络空间WEB类资产风险Server同性快速识别的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7783510B1 (en) * | 2006-06-23 | 2010-08-24 | Quest Software, Inc. | Computer storage capacity forecasting system using cluster-based seasonality analysis |
CN105608638A (zh) * | 2015-12-21 | 2016-05-25 | 深圳供电局有限公司 | 一种评价智能终端与电能表的表码数据同步状态的方法及其系统 |
CN106875057A (zh) * | 2017-02-17 | 2017-06-20 | 国网天津市电力公司 | 一种基于条件概率调整的电能计量装置短期需求预测方法 |
CN108009938A (zh) * | 2016-11-02 | 2018-05-08 | 中国电力科学研究院 | 一种基于形状的系统负荷聚类及负荷周期的模式识别方法 |
-
2019
- 2019-05-14 CN CN201910401307.5A patent/CN110321389B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7783510B1 (en) * | 2006-06-23 | 2010-08-24 | Quest Software, Inc. | Computer storage capacity forecasting system using cluster-based seasonality analysis |
CN105608638A (zh) * | 2015-12-21 | 2016-05-25 | 深圳供电局有限公司 | 一种评价智能终端与电能表的表码数据同步状态的方法及其系统 |
CN108009938A (zh) * | 2016-11-02 | 2018-05-08 | 中国电力科学研究院 | 一种基于形状的系统负荷聚类及负荷周期的模式识别方法 |
CN106875057A (zh) * | 2017-02-17 | 2017-06-20 | 国网天津市电力公司 | 一种基于条件概率调整的电能计量装置短期需求预测方法 |
Non-Patent Citations (1)
Title |
---|
孙添: "《基于时间序列分析的数据流异常值检测方法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113515597A (zh) * | 2021-06-21 | 2021-10-19 | 中盾创新档案管理(北京)有限公司 | 一种基于关联规则挖掘的档案处理方法 |
CN113515597B (zh) * | 2021-06-21 | 2022-11-01 | 中盾创新数字科技(北京)有限公司 | 一种基于关联规则挖掘的档案处理方法 |
CN114244824A (zh) * | 2021-11-25 | 2022-03-25 | 国家计算机网络与信息安全管理中心河北分中心 | 一种网络空间WEB类资产风险Server同性快速识别的方法 |
CN114244824B (zh) * | 2021-11-25 | 2024-05-03 | 国家计算机网络与信息安全管理中心河北分中心 | 一种网络空间WEB类资产风险Server同性快速识别的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110321389B (zh) | 2023-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104616079B (zh) | 基于气温变化的电网日用电量预测方法 | |
CN109508835A (zh) | 一种融合环境反馈的智慧电网短期电力负荷预测方法 | |
CN106485262A (zh) | 一种母线负荷预测方法 | |
CN111080032A (zh) | 一种基于Transformer结构的负荷预测方法 | |
CN109858758A (zh) | 一种配电网电能质量的组合赋权评估方法及系统 | |
CN105978037B (zh) | 基于风速预测的多时段电气互联系统最优潮流计算方法 | |
CN108846573A (zh) | 基于时间序列核距离的流域水文相似性估计方法 | |
CN107463993A (zh) | 基于互信息‑核主成分分析‑Elman网络的中长期径流预报方法 | |
CN108549907B (zh) | 一种基于多源迁移学习的数据校验方法 | |
CN110535149A (zh) | 一种公变台区电力负荷三相不平衡预测方法 | |
CN110321389A (zh) | 一种基于时间序列聚类的电能表设备类别识别方法 | |
CN110717619A (zh) | 一种自下而上配电网多尺度时空负荷预测方法及系统 | |
CN109492748A (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN111369120A (zh) | 一种基于设备迁移学习的非侵入式负荷监测方法 | |
CN110380444A (zh) | 一种基于变结构Copula的多场景下分散式风电有序接入电网的容量规划方法 | |
CN109190184A (zh) | 一种供热系统历史数据预处理方法 | |
CN105974495A (zh) | 利用分类拟合法预判目标区域未来平均云量的方法 | |
CN106121622A (zh) | 一种基于示功图的有杆泵抽油井的多故障诊断方法 | |
CN107203827A (zh) | 一种基于多尺度分析的风电机风速预测优化方法 | |
CN115687952B (zh) | 一种基于黎曼流形聚类的配电网线变关系辨识方法及装置 | |
CN109767043A (zh) | 一种电力负荷时间序列大数据智能建模与预测方法 | |
CN102567648B (zh) | 一种绿地生态评价单元粒度自适应栅格取样方法 | |
CN105631520A (zh) | 一种提取风速随机模糊不确定特征的建模新方法 | |
CN114498619A (zh) | 一种风电功率预测方法及装置 | |
Zhao et al. | Short-term microgrid load probability density forecasting method based on k-means-deep learning quantile regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |