CN111414957A - 一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法 - Google Patents

一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法 Download PDF

Info

Publication number
CN111414957A
CN111414957A CN202010190513.9A CN202010190513A CN111414957A CN 111414957 A CN111414957 A CN 111414957A CN 202010190513 A CN202010190513 A CN 202010190513A CN 111414957 A CN111414957 A CN 111414957A
Authority
CN
China
Prior art keywords
time sequence
pmu
algorithm
method based
disturbance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010190513.9A
Other languages
English (en)
Inventor
熊瑶
肖光意
秦拯
袁智勇
于力
徐全
张吉昕
李明道
葛宁超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
CSG Electric Power Research Institute
Original Assignee
Hunan University
CSG Electric Power Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University, CSG Electric Power Research Institute filed Critical Hunan University
Priority to CN202010190513.9A priority Critical patent/CN111414957A/zh
Publication of CN111414957A publication Critical patent/CN111414957A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及一种基于PCA算法和XGBoost算法的D‑PMU扰动分类方法。其发明内容主要包括(1)基于滑动平均法的D‑PMU时间序列预处理方法;(2)基于PCA算法的D‑PMU时间序列特征提取方法;(3)基于XGBoost算法的D‑PMU时间序列扰动分类方法。

Description

一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法
技术领域
本发明涉及分布式计算与存储和机器学习领域,是基于主成分分析法(PCA)和极致梯度提升算法(XGBoost)的配网相量测量装置(D-PMU)扰动分类方法。
背景技术
近年来,随着传感器测量技术、通信技术和计算机技术等在智能配电网中的广泛应用,结合我国电网的特点,性价比高并且适合故障定位的配网相量测量装置(D-PMU)在国内展开了泛的应用。D-PMU设备有效的解决了传统的测量传感器精度不够的问题,为智能配电网实现实时在线监测、故障诊断等提供了解决方案。
D-PMU测量值类型有幅值、相角、频率和频率变化率等,数据采集频率为10毫秒一次,在智能配电网配置有多台D-PMU设备的情况下,这会产生大量的D-PMU测量数据,如何提取D-PMU测量的时间序列的主要特征是至关重要的。同时智能配电网可能存在扰动或设备故障的情况,局部的某些故障如短路,可能影响到整个系统,所以快速准确地对可能存在的扰动进行分类是智能配电网的首要问题。
由于智能配电网中可能存在数据丢包等情况,导致数据丢失,本发明将滑动平均法应用于D-PMU时间序列的数据预处理,提高数据的质量并在一定程度上实现原始的数据的复原。根据D-PMU设备采集数据的高频特征和D-PMU时间序列的高维特征,本发明利用主成分分析算法对D-PMU时间序列矩阵进行降维处理,提取矩阵中的主成分特征。不仅可以合并相似的特征,还可以防止过拟合的发生以及减少内存的使用,使得后面分类算法的运行效率提高。由于电网中可能存在多种扰动情况,本发明使用极致梯度提升算法来对D-PMU时间序列做扰动分类,不仅可以减少过拟合,还可以减少不必要的计算,有很好的可调整性,可以预测扰动类型。本发明将D-PMU时间序列进行数据清洗、特征降维和扰动分类,为设备以及线路确定合理检修时间提供帮助。
发明内容
本发明目的旨在利用PCA和XGBoost算法,解决D-PMU信号的扰动分类问题。
为此,本发明提出了一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法,主要包括三大内容:
(1)基于滑动平均法的D-PMU时间序列预处理方法;
(2)基于PCA算法的D-PMU时间序列特征提取方法;
(3)基于XGBoost算法的D-PMU时间序列扰动分类方法;
具体内容如下:
如图1总体技术路线图,采用方法(1)对D-PMU时间序列进行数据清洗,获得预处理后的D-PMU时间序列;采用方法(2)对D-PMU时间序列矩阵进行特征降维,提取降维后主成分特征;采用方法(3)对D-PMU时间序列进行扰动分类,实现D-PMU实时扰动分类,为设备检修提供保障。
(1)基于滑动平均法的D-PMU时间序列预处理方法。
提取D-PMU前置解析后的时间序列矩阵DpmuRddSeq,其表达式如
Figure BDA0002415712980000031
所示,其中
Figure BDA0002415712980000032
表示1到m个时间戳对应的第一条母线的幅值,Psyn1,…,Psynm表示1到m个时间戳对应的相角同步值。而单个时间戳对应的时间序列是dpmuTseq,其表达式如
Figure BDA0002415712980000033
Figure BDA0002415712980000034
所示,
Figure BDA0002415712980000035
表示24条母线的幅值,
Figure BDA0002415712980000036
表示24条母线的相角,f,fC,Asyn,Psyn分别表示频率、频率变化、幅值同步、相角同步。
根据滑动平均法对D-PMU时间序列进行数据预处理,对D-PMU时间序列中的缺省值进行插值填补,实现D-PMU时间序列质量的提高,尽可能的还原D-PMU时间序列的原始信息。滑动平均法的公式如下:
Figure BDA0002415712980000037
其中xt-1,…,xt-m表示Mt前面m个真实值,Mt表示时间为t的D-PMU时间序列的插补值。
(2)基于PCA算法的D-PMU时间序列特征提取方法。
基于预处理后的D-PMU时间序列矩阵,通过函数AVG(∑χij)计算得出每列特征的平均数值,并去掉平均数值。
计算得到协方差矩阵A,并通过下面公式计算得到协方差矩阵的特征值和特征向量,其中λ为特征值,v为特征向量。
Av=λv (2)
设置一个阈值u,即降维后要保留的信息度,计算协方差矩阵特征值大于阈值的个数k,对特征值进行降序排序,取前k个特征值对应的特征向量作为主成分特征,其余特征向量作为噪声特征删除掉,构建得到新的D-PMU时间序列特征矩阵。
(3)基于XGBoost算法的D-PMU时间序列扰动分类方法。
基于PCA算法提取的主成分特征,采用XGBoost算法基于公式对特征矩阵数据进行训练。其中,F(xi)为模型的输出,xi为训练样本集的特征,k为cart树的个数。
Figure BDA0002415712980000041
模型的输出y通过引入softmax函数来实现多分类,选择一个较为合适的学习率,通过交叉验证得到一个最佳的树的个数k。通过模型的不断训练得到最优的参数,例如树的深度、最小叶子的权重、正则项化参数等,来防止过拟合。最后不断调整学习率,得到最优的参数的组合,使得XGBoost模型的损失函数足够小,XGBoost模型的损失函数公式如下表示,其中l损失函数,Ω代表树的复杂度,yi,
Figure BDA0002415712980000042
分别为实际值与预测值。
Figure BDA0002415712980000043
附图说明
图1为本发明技术路线图
图2为本发明实施路线图
具体实施方式
结合附图2实施路线图,本发明步骤如下:
第一步:数据解析和标注
采用Socket通信技术监听端口,利用Spark Streaming流处理框架实现D-PMU时间序列前置解析并完成进制转换。根据先验知识将D-PMU时间序列扰动分为五类:正常、振荡、切机、切负荷、短路,并标记数据样本,标签为{0,1,2,3,4}。
第二步:数据预处理
将D-PMU时间序列以500毫秒为时间进行切片,对每一个时间切片的D-PMU时间序列构建成一个50*52的特征矩阵,将D-PMU十六进制原始时间序列在集群中并行转换为对应的十进制时间序列。通过滑动平均法对D-PMU时间序列的缺省值进行预处理,提高实时数据的质量。
第三步:特征提取
将解析后的数据构建成时间序列矩阵,采用PCA算法计算均值、协方差矩阵、协方差矩阵的特征值和特征向量,根据设定的阈值k提取出前topK的主成分特征,将其他冗余特征删除。
第四步:模型训练和扰动分类
将提取后的主成分特征的时间序列矩阵输入XGBoost模型中,通过不断交叉验证调参,得到最优的输入参数组合,使得损失函数最小,基于训练样本得到的最优输入参数组合构建XGBoost模型,预测D-PMU时间序列的扰动类型。

Claims (4)

1.一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法,其特征是:
(1)基于滑动平均法的D-PMU时间序列预处理方法;
(2)基于PCA算法的D-PMU时间序列特征提取方法;
(3)基于XGBoost算法的D-PMU时间序列扰动分类方法。
2.根据权利要求1所述的基于滑动平均法的D-PMU时间序列预处理方法,其特征是,针对海量D-PMU时间序列可能存在丢包等导致数据缺失的问题,提取出经过前置解析的D-PMU时间序列,通过时间切片,将时间序列构建成特征矩阵,基于滑动平均法,实现D-PMU时间序列的缺省数据的插补,保证数据的质量。
3.根据权利要求1所述的基于PCA算法的D-PMU时间序列特征提取方法,其特征是,针对D-PMU时间序列高频和高维问题,提取基于滑动平均法预处理后的时间序列,基于PCA算法对时间序列矩阵降维,抽取其主成分特征,实现D-PMU时间序列特征提取,同时降低分类算法计算成本。
4.根据权利要求1所述的基于XGBoost算法的D-PMU时间序列扰动分类方法,其特征是,针对D-PMU设备以及线路可能存在扰动的问题,对提取得到的经过PCA算法提取D-PMU时间序列特征,采用XGBoost算法对D-PMU时间序列进行分类训练,预测D-PMU时间序列扰动分类。
CN202010190513.9A 2020-03-18 2020-03-18 一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法 Pending CN111414957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010190513.9A CN111414957A (zh) 2020-03-18 2020-03-18 一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010190513.9A CN111414957A (zh) 2020-03-18 2020-03-18 一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法

Publications (1)

Publication Number Publication Date
CN111414957A true CN111414957A (zh) 2020-07-14

Family

ID=71491080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010190513.9A Pending CN111414957A (zh) 2020-03-18 2020-03-18 一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法

Country Status (1)

Country Link
CN (1) CN111414957A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070154A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据处理方法和装置
CN112437396A (zh) * 2020-10-30 2021-03-02 华东师范大学 一种基于观测量降维的mlp室内定位方法
CN112668002A (zh) * 2020-12-24 2021-04-16 工业信息安全(四川)创新中心有限公司 一种基于特征扩充的工控安全检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070154A (zh) * 2020-09-07 2020-12-11 常州微亿智造科技有限公司 时间序列数据处理方法和装置
CN112437396A (zh) * 2020-10-30 2021-03-02 华东师范大学 一种基于观测量降维的mlp室内定位方法
CN112668002A (zh) * 2020-12-24 2021-04-16 工业信息安全(四川)创新中心有限公司 一种基于特征扩充的工控安全检测方法
CN112668002B (zh) * 2020-12-24 2022-07-26 工业信息安全(四川)创新中心有限公司 一种基于特征扩充的工控安全检测方法

Similar Documents

Publication Publication Date Title
CN111414957A (zh) 一种基于PCA算法和XGBoost算法的D-PMU扰动分类方法
CN111443259A (zh) 基于局部异常因子检测的有源配电网故障诊断方法及系统
CN110995475A (zh) 一种基于迁移学习的电力通信网故障检测方法
CN111538759B (zh) 一种基于分布式字典学习的工业过程智能监测方法与系统
CN109409444B (zh) 一种基于先验概率的多元电网故障类型的判别方法
CN111598166A (zh) 基于主分量分析和Softmax函数的单相接地故障分类方法和系统
CN114723285A (zh) 一种电网设备安全性评估预测方法
CN116522268B (zh) 一种配电网的线损异常识别方法
CN113822418A (zh) 一种风电场功率预测方法、系统、设备和存储介质
CN111654392A (zh) 基于互信息的低压配电网拓扑识别方法及系统
CN111856209A (zh) 一种输电线路故障分类方法及装置
CN114754973A (zh) 基于机器学习的风洞测力试验数据智能诊断与分析方法
CN113627685B (zh) 一种考虑风电上网负荷限制的风力发电机功率预测方法
CN116684878A (zh) 一种5g信息传输数据安全监测系统
CN114116832A (zh) 一种基于数据驱动的配电网异常识别方法
CN109684749B (zh) 一种考虑运行特性的光伏电站等值建模方法
CN113554010B (zh) 一种电网线路故障识别模型训练方法
CN111126645A (zh) 一种基于数据挖掘技术和改进支持向量机的风电预测算法
CN114781551A (zh) 一种基于大数据的电池多故障智能分类识别方法
CN114399407A (zh) 一种基于动静态选择集成的电力调度监控数据异常检测方法
CN112269778A (zh) 一种设备故障诊断方法
CN111753097A (zh) 基于深度学习的电力现货交易出清的数据分析方法及装置
Ji et al. Integrated Generative Adversarial Network and XGBoost for Anomaly Processing of Massive Data Flow in Dispatch Automation Systems.
CN117439146B (zh) 充电桩的数据分析控制方法及系统
CN116662828B (zh) 云网络多阶段异常检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200714

WD01 Invention patent application deemed withdrawn after publication