CN111104977A - 电网三相不平衡多维时序分析方法 - Google Patents
电网三相不平衡多维时序分析方法 Download PDFInfo
- Publication number
- CN111104977A CN111104977A CN201911295701.1A CN201911295701A CN111104977A CN 111104977 A CN111104977 A CN 111104977A CN 201911295701 A CN201911295701 A CN 201911295701A CN 111104977 A CN111104977 A CN 111104977A
- Authority
- CN
- China
- Prior art keywords
- measurement data
- phase
- data set
- time sequence
- phase imbalance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000012300 Sequence Analysis Methods 0.000 title claims abstract description 9
- 238000005259 measurement Methods 0.000 claims abstract description 94
- 238000007418 data mining Methods 0.000 claims abstract description 11
- 238000003064 k means clustering Methods 0.000 claims abstract description 9
- 238000010219 correlation analysis Methods 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 4
- 238000012098 association analyses Methods 0.000 claims abstract description 4
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012731 temporal analysis Methods 0.000 claims 2
- 238000000700 time series analysis Methods 0.000 claims 2
- 238000000691 measurement method Methods 0.000 abstract description 2
- 238000007781 pre-processing Methods 0.000 description 3
- 208000035126 Facies Diseases 0.000 description 2
- 239000003990 capacitor Substances 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种本发明涉及一种三相不平衡分析技术领域,是一种电网三相不平衡多维时序分析方法,包括以下步骤:构建测量数据集,其中测量数据集包括多组测量数据;利用K均值聚类算法对测量数据集中的遥测数据进行聚类,并根据聚类结果更新测量数据集;利用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,获得三相不平衡时序关联规则。本发明基于配网的三相不平衡相关测量数据,结合K均值聚类算法和apriori数据挖掘算法进行三相不平衡相关测量数据的时序关联分析,并根据获得三相不平衡时序关联规则,提前对三相不平衡进行动态追踪,为三相不平衡的处理提供支持。
Description
技术领域
本发明涉及一种三相不平衡分析技术领域,是一种电网三相不平衡多维时序分析方法。
背景技术
目前配网中存在大量时空不均匀的分布单相负载,造成多数配网存在着不同程度的三相不平衡问题。三相不平衡会对配网造成一系列的影响,主要包括:(1)造成配电变压器的出力降低,电能转换效率下降大;(2)增加配电变压器和线路的损耗;(3)导致配网中重载相的供电电压质量严重下降;(4)使得配电变压器零序电流大大增大,引起的涡流损耗使配电变压器运行温度升高,危及其安全与寿命。
传统的处理配网三相不平衡主要采用手动投切电容器或电抗器,即在线路对地电容不平衡相上投入电容器或电抗器组,使线路三相电压恢复平衡。但由于配电网实际运行中线路对地参数多变,并且不能提前获知对三相不平衡发生的时序规则,从而难以准确、迅速地对三相不平衡过电压的动态跟踪及补偿。
发明内容
本发明提供了一种电网三相不平衡多维时序分析方法,克服了上述现有技术之不足,其能有效解决不能获知三相不平衡发生的时序规则,使得不能对处理三相不平衡提供动态跟踪的问题。
本发明的技术方案是通过以下措施来实现的:一种电网三相不平衡多维时序分析方法,包括以下步骤:
构建测量数据集,其中测量数据集包括多组测量数据,测量数据包括一个测量点在设定时间内根据固定时间间隔采集的测量数据,测量数据包括遥测数据、天气、区域、时间、测量点编号、三相不平衡标签;
利用K均值聚类算法对测量数据集中的遥测数据进行聚类,并根据聚类结果更新测量数据集;
利用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,获得三相不平衡时序关联规则。
下面是对上述发明技术方案的进一步优化或/和改进:
上述K均值聚类算法对测量数据集中的遥测数据进行聚类,包括:
在同一类测量数据中选取K个测量数据作为质心;
测量剩余每个测量数据与各个质心之间的最小距离,把其归到最近质心的类中,并重新划分各个类的质心;
重复上述步骤,直至相邻两次聚类的聚类中心没有任何变化,输出聚类过程中最后一次的均值。
上述用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,包括:
获得第K频繁项集,具体包括:
A、设置最小支持度;
B、从测量数据集中生成第一候选相集,将第一候选相集通过最小支持度过滤,生成第一频繁项集;
C、将第一频繁项集的两两项取交集,生成第二候选相集,将第二候选相集通过最小支持度过滤,生成第二频繁项集;
D、以此类推,直到第K频繁项集中仅有一个或没有数据项为止;
获得关联规则,具体包括:
A、设置最小置信度;
B、从第K频繁项集中找出置信度大于最小置信度的强关联规则,获得三相不平衡时序关联规则。
上述测量数据集构建完成后,对测量数据集进行特征工程。
本发明基于配网的三相不平衡相关测量数据,结合K均值聚类算法和apriori数据挖掘算法进行三相不平衡相关测量数据的时序关联分析,并根据获得三相不平衡时序关联规则,提前对三相不平衡进行动态追踪,为三相不平衡的处理提供支持。
附图说明
附图1为本发明的流程图。
附图2为本发明中对遥测数据进行聚类的流程图。
附图3为本发明中多维时序关联分析的流程图。
具体实施方式
本发明不受下述实施例的限制,可根据本发明的技术方案与实际情况来确定具体的实施方式。
下面结合实施例及附图对本发明作进一步描述:
实施例1:如附图1所示,该电网三相不平衡多维时序分析方法,包括以下步骤:
S1,构建测量数据集,其中测量数据集包括多组测量数据,测量数据包括一个测量点在设定时间内根据固定时间间隔采集的测量数据,测量数据包括遥测数据、天气、区域、时间、测量点编号、三相不平衡标签;
S2,利用K均值聚类算法对测量数据集中的遥测数据进行聚类,并根据聚类结果更新测量数据集;
S3,利用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,获得三相不平衡时序关联规则。
上述步骤S1中测量数据集包括多组测量数据,每组测量数据包括一个测量点在设定时间内根据固定时间间隔采集的测量数据,设定时间根据需要进行设定,同时测量数据根据固定时间间隔进行采集,例如若设定时间为1年,固定时间间隔为半小时,则一个测量点每一天均能采集48条测量数据,每条测量数据均包括遥测数据、天气、区域、时间、测量点编、三相不平衡标签等相关内容。其中遥测数据可为遥测数据4种属性的测量数据,三相不平衡标签为是否发生三相不平衡的标识数据。
通过上述步骤S2对遥测数据(例如遥测数据4种属性的测量数据)进行聚类,实现对测量数据的约减,降低利用apriori数据挖掘算法进行关联规则挖掘时的计算负担。通过上述步骤S3利用apriori数据挖掘算法获得三相不平衡时序关联规则,即根据置信度获得遥测数据、天气、区域、时间、三相不平衡标签之间时序关联规则,从而根据获得三相不平衡时序关联规则,提前对三相不平衡进行动态追踪,为三相不平衡的处理提供支持。
下面是对上述发明技术方案的进一步优化或/和改进:
如附图1、2所示,所述K均值聚类算法对测量数据集中的遥测数据进行聚类,包括:
S21,在同一类测量数据中选取K个测量数据作为质心;
S22,测量剩余每个测量数据与各个质心之间的最小距离,把其归到最近质心的类中,并重新划分各个类的质心;
S23,重复上述步骤,直至相邻两次聚类的聚类中心没有任何变化,输出聚类过程中最后一次的均值。
上述测量剩余每个测量数据与各个质心之间的最小距离,这里最小距离用欧式距离进行计算,计算过程如下:
设测量数据集D={x1,x2,…,xn},xi={xi1,xi2,…,xir},xj={xj1,xj2,…,xjr},则测量数据xi与测量数据xj之间的欧氏距离为:
如附图1、3所示,所述用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,包括:
S31,获得第K频繁项集,具体包括:
A、设置最小支持度;
B、从测量数据集中生成第一候选相集,将第一候选相集通过最小支持度过滤,生成第一频繁项集;
C、将第一频繁项集的两两项取交集,生成第二候选相集,将第二候选相集通过最小支持度过滤,生成第二频繁项集;
D、以此类推,直到第K频繁项集中仅有一个或没有数据项为止;
S32,获得关联规则,具体包括:
A、设置最小置信度;
B、从第K频繁项集中找出置信度大于最小置信度的强关联规则,获得三相不平衡时序关联规则。
上述支持度为数据集中包含该项集的记录所占的比例。上述通过最小支持度过滤候选相集,即剔除小于最小支持度的相。
例如:设W中有s%的事务同时支持物品集A和B,s%称为{A,B}的支持度,即:
support({A,B})=num(A∪B)/W=P(A∩B)
其中,num(A∪B)表示含有物品集{A,B}的事务集的个数。
上述置信度揭示了A出现时B是否会一定出现,如果出现,则出现的概率是多大。用公式表示则为物品A->B的置信度=物品{A,B}的支持度/物品{A}的支持度:
Confidence(A->B)=support({A,B})/support({A})=P(B|A)
如附图1所示,所述测量数据集构建完成后,对测量数据集进行特征工程。
对测量数据集中的测量数据进行特征工程,尽可能从原测量数据集中获取更多的信息,更新测量数据集,使得后续的时序关联分析更加准确。而特征工程就是获取更多的训练数据。测量数据集进行特征工程具体分析如下:
以设定时间设为1年,固定时间间隔设为为半小时,则一个测量点每一天均能采集48条测量数据,每条测量数据均包括遥测数据、天气、区域、时间、测量点编、三相不平衡标签等相关内容为例。
对测量数据集进行特征工程包括如下处理过程:
A、对三相不平衡标签进行预处理:
将每天的48条记录转成每天的一条记录,规则为:若测量点任一天任一时间发生了三相不平衡,即认为该测量点当天发生了三相不平衡。
B、对遥测数据进行预处理:
将每天48个点的数据由列转为行。如某测量点365天,每天48条记录,共17520行乘以1列的记录。转置后为365行乘以48列的记录。
C、对天气、区域、时间进行预处理:
对天气、区域、时间进行特征提取,例如时间中提取月份、星期特征。
以上技术特征构成了本发明的最佳实施例,其具有较强的适应性和最佳实施效果,可根据实际需要增减非必要的技术特征,来满足不同情况的需求。
Claims (5)
1.一种电网三相不平衡多维时序分析方法,其特征在于,包括以下步骤:
构建测量数据集,其中测量数据集包括多组测量数据,测量数据包括一个测量点在设定时间内根据固定时间间隔采集的测量数据,测量数据包括遥测数据、天气、区域、时间、测量点编号、三相不平衡标签;
利用K均值聚类算法对测量数据集中的遥测数据进行聚类,并根据聚类结果更新测量数据集;
利用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,获得三相不平衡时序关联规则。
2.根据权利要求1所述的电网三相不平衡多维时序分析方法,其特征在于,所述K均值聚类算法对测量数据集中的遥测数据进行聚类,包括:
在同一类测量数据中选取K个测量数据作为质心;
测量剩余每个测量数据与各个质心之间的最小距离,把其归到最近质心的类中,并重新划分各个类的质心;
重复上述步骤,直至相邻两次聚类的聚类中心没有任何变化,输出聚类过程中最后一次的均值。
3.根据权利要求1或2所述的电网三相不平衡多维时序分析方法,其特征在于,所述用apriori数据挖掘算法对测量数据集中的测量数据进行多维时序关联分析,包括:
获得第K频繁项集,具体包括:
A、设置最小支持度;
B、从测量数据集中生成第一候选相集,将第一候选相集通过最小支持度过滤,生成第一频繁项集;
C、将第一频繁项集的两两项取交集,生成第二候选相集,将第二候选相集通过最小支持度过滤,生成第二频繁项集;
D、以此类推,直到第K频繁项集中仅有一个或没有数据项为止;
获得关联规则,具体包括:
A、设置最小置信度;
B、从第K频繁项集中找出置信度大于最小置信度的强关联规则,获得三相不平衡时序关联规则。
4.根据权利要求1或2所述的电网三相不平衡多维时序分析方法,其特征在于,所述测量数据集构建完成后,对测量数据集进行特征工程。
5.根据权利要求3所述的电网三相不平衡多维时序分析方法,其特征在于,所述测量数据集构建完成后,对测量数据集进行特征工程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911295701.1A CN111104977A (zh) | 2019-12-16 | 2019-12-16 | 电网三相不平衡多维时序分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911295701.1A CN111104977A (zh) | 2019-12-16 | 2019-12-16 | 电网三相不平衡多维时序分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111104977A true CN111104977A (zh) | 2020-05-05 |
Family
ID=70423402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911295701.1A Pending CN111104977A (zh) | 2019-12-16 | 2019-12-16 | 电网三相不平衡多维时序分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111104977A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324858A (zh) * | 2013-07-03 | 2013-09-25 | 国家电网公司 | 配电网三相潮流状态估计方法 |
CN103400214A (zh) * | 2013-08-22 | 2013-11-20 | 华北电力大学 | 基于多维多层关联规则的电压暂降预测分析方法 |
CN204883710U (zh) * | 2015-01-19 | 2015-12-16 | 云南电力调度控制中心 | 一种基于规则的电网故障诊断智能系统 |
CN105354635A (zh) * | 2015-10-30 | 2016-02-24 | 国家电网公司 | 一种配电网不平衡谐波负荷指数预测方法 |
CN106451503A (zh) * | 2016-11-08 | 2017-02-22 | 温州商学院 | 带有温度和振动告警单元的三相不平衡治理装置及其实现方法 |
CN108549995A (zh) * | 2018-04-24 | 2018-09-18 | 江苏电力信息技术有限公司 | 一种通过数据挖掘实现配网公变电压异常决策分析的方法 |
-
2019
- 2019-12-16 CN CN201911295701.1A patent/CN111104977A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324858A (zh) * | 2013-07-03 | 2013-09-25 | 国家电网公司 | 配电网三相潮流状态估计方法 |
CN103400214A (zh) * | 2013-08-22 | 2013-11-20 | 华北电力大学 | 基于多维多层关联规则的电压暂降预测分析方法 |
CN204883710U (zh) * | 2015-01-19 | 2015-12-16 | 云南电力调度控制中心 | 一种基于规则的电网故障诊断智能系统 |
CN105354635A (zh) * | 2015-10-30 | 2016-02-24 | 国家电网公司 | 一种配电网不平衡谐波负荷指数预测方法 |
CN106451503A (zh) * | 2016-11-08 | 2017-02-22 | 温州商学院 | 带有温度和振动告警单元的三相不平衡治理装置及其实现方法 |
CN108549995A (zh) * | 2018-04-24 | 2018-09-18 | 江苏电力信息技术有限公司 | 一种通过数据挖掘实现配网公变电压异常决策分析的方法 |
Non-Patent Citations (8)
Title |
---|
吴克河等: "基于Storm的电网时间序列数据实时预测框架", 《计算机工程》 * |
廖建军等: "一种基于聚类分析与关联规则的联合挖掘算法", 《电脑学习》 * |
张鹏飞等: "基于气象因素和时间序列分析的配电网故障数量预测", 《上海电力》 * |
徐洁磐: "《人工智能导论》", 31 July 2019, 北京:中国铁道出版社 * |
戴小廷等: "数据挖掘在电力系统中的应用", 《重庆科技学院学报(自然科学版)》 * |
王岚等: "《营销管理数据挖掘的系统设计与实施》", 31 March 2016, 北京:中国书籍出版社 * |
鄂大伟等: "《福建省高等学校计算机规划教材 大学信息技术基础 以Python为舟 第5版》", 31 August 2019, 厦门:厦门大学出版社 * |
韩博闻: "基于Apriori关联算法的配电网运行大数据关联分析模型", 《上海电力大学学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Phase identification in electric power distribution systems by clustering of smart meter data | |
CN106845717B (zh) | 一种基于多模型融合策略的能源效率评价方法 | |
CN108830510B (zh) | 一种基于数理统计的电力数据预处理方法 | |
CN103455563B (zh) | 一种适用于智能变电站一体化监控系统的数据挖掘方法 | |
CN111754026B (zh) | 光伏电站群功率预测方法、装置、计算机设备及存储介质 | |
CN110458230A (zh) | 一种基于多判据融合的配变用采数据异常甄别方法 | |
CN108428055B (zh) | 一种考虑负荷纵向特性的负荷聚类方法 | |
CN108460486A (zh) | 一种基于改进聚类算法和神经网络的电压偏差预测方法 | |
CN111460001A (zh) | 一种配电网理论线损率评估方法及系统 | |
de Oliveira et al. | Deep learning method with manual post-processing for identification of spectral patterns of waveform distortion in PV installations | |
CN110703006A (zh) | 一种基于卷积神经网络的三相电能质量扰动检测方法 | |
CN111626559A (zh) | 一种基于主因子分析法的中压配电网线损关键特征指标提取方法及系统 | |
CN110673568B (zh) | 玻璃纤维制造业工业设备故障顺序确定方法及系统 | |
CN106707118B (zh) | 局部放电模式识别方法和装置 | |
CN118174276A (zh) | 一种低压光伏台区相序自动识别方法及装置 | |
Grigoras et al. | Processing of smart meters data for peak load estimation of consumers | |
CN111581298B (zh) | 大数据仓库的异构数据整合系统及方法 | |
CN117540317A (zh) | 基于余弦相似度与孤立森林的配网异常线变关系辨识方法 | |
CN110288383B (zh) | 基于用户属性标签的群体行为配电网用电异常检测方法 | |
CN111104977A (zh) | 电网三相不平衡多维时序分析方法 | |
Nithiyananthan et al. | Enhanced R package-based cluster analysis fault identification models for three phase power system network | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 | |
CN116720095A (zh) | 一种基于遗传算法优化模糊c均值的电特性信号聚类方法 | |
CN116664870A (zh) | 一种基于迁移学习的电能质量扰动识别方法 | |
CN112347655B (zh) | 一种基于机组运行性能评估的风电场理论功率计算方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200505 |
|
RJ01 | Rejection of invention patent application after publication |