CN110298369A - 一种电力系统不良数据的辨识方法及系统 - Google Patents

一种电力系统不良数据的辨识方法及系统 Download PDF

Info

Publication number
CN110298369A
CN110298369A CN201810234014.8A CN201810234014A CN110298369A CN 110298369 A CN110298369 A CN 110298369A CN 201810234014 A CN201810234014 A CN 201810234014A CN 110298369 A CN110298369 A CN 110298369A
Authority
CN
China
Prior art keywords
cluster
data
measurement residuals
value
network model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810234014.8A
Other languages
English (en)
Inventor
王磊
马晓忱
黄宇鹏
李强
杨勇
刘益超
安亮亮
康晓华
陈郑平
谢巧云
陈雪净
占震滨
常乃超
张伟
王轶禹
胡静
吴锟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Electric Power Research Institute Co Ltd CEPRI
State Grid Gansu Electric Power Co Ltd
Electric Power Research Institute of State Grid Gansu Electric Power Co Ltd
Original Assignee
China Electric Power Research Institute Co Ltd CEPRI
State Grid Gansu Electric Power Co Ltd
Electric Power Research Institute of State Grid Gansu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Electric Power Research Institute Co Ltd CEPRI, State Grid Gansu Electric Power Co Ltd, Electric Power Research Institute of State Grid Gansu Electric Power Co Ltd filed Critical China Electric Power Research Institute Co Ltd CEPRI
Priority to CN201810234014.8A priority Critical patent/CN110298369A/zh
Publication of CN110298369A publication Critical patent/CN110298369A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种电力系统不良数据的辨识方法及系统,包括:将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;将获取的当前量测数据带入所述神经网络模型得到量测残差;对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。本发明避免了传统辨识方法的残差污染和残差淹没的问题,适用于各种类型不良数据的辨识,对存在不良数据的电力系统能准确辨识,提升了不良数据辨识的准确性和应用灵活性。

Description

一种电力系统不良数据的辨识方法及系统
技术领域
本发明涉及电力系统自动化领域,具体涉及一种电力系统不良数据的辨识方法及系统。
背景技术
电力系统能量管理系统使用的数据是通过SCADA系统获取的,从各厂站设备采集的量测数据,受采集仪表精度、数据传输通道、传输模式、传输延时等因素影响,不可避免地存在量测误差,产生较大误差的数据称之为不良数据。电力系统中存在的不良数据会对潮流分析计算、状态估计和在线分析软件的功能产生影响,调度员决策受到不良数据的干扰也会影响电力系统的正常运行。因此,电力系统不良数据的辨识对电网安全稳定运行有着重要的意义。
传统状态估计不良数据辨识的实用化工作在实际工程中面临很多困难,需要运维人员具备扎实的专业知识和丰富的实战经验,并且传统不良数据的辨识方法利用状态估计计算得到的量测残差进行分析,面对多个具有强相关关系的不良数据的情况,往往会出现残差污染和残差淹没的现象,影响不良数据辨识的准确性。
发明内容
为了解决现有技术中所存在的上述不足,本发明提供一种电力系统不良数据的辨识方法及系统。
本发明提供的技术方案是:一种电力系统不良数据的辨识方法,包括:
将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;
将获取的当前量测数据带入所述神经网络模型得到量测残差;
对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。
优选的,所述对所述量测残差进行聚类分析,确定电力系统不良数据的数量和位置信息,包括:
将量测残差设定为多个聚类;
根据设定的聚类数量、聚类的间隙值和离散度获得最佳聚类个数;
基于所述最佳聚类个数对所述量测残差进行聚类,得到聚类结果;
在所述聚类结果中确定电力系统不良数据的数量和位置。
优选的,所述根据设定的聚类数量、聚类的间隙值获得最佳聚类个数,包括:
设定聚类数量为k;
当设定k=1,此时如果满足下式时,所述最佳聚类个数为1;
gap(k)≥gap(k+1)-sk+1
当设定k>1时,满足下式的最小k值为最佳聚类个数;
angel(k)<angel(k+1)
式中:gap(k):量测残差的k个聚类的间隙值;gap(k+1):量测残差的k+1个聚类的间隙值;sk+1:参考数据集的聚类离散度的标准差;angel(k):ln W(k)~k曲线在k处的夹角;angel(k+1):ln W(k)~k曲线在k+1处的夹角。
优选的,所述量测残差的k个聚类的间隙值gap(k),按下式计算:
gap(k)=E[ln Wr(k)]-ln W(k)
式中:Wr(k):参考数据集聚类离散度;W(k):量测残差的聚类离散度;E[ln Wr(k)]:参考数据集聚类离散度期望值。
优选的,所述参考数据集聚类离散度期望值E[ln Wr(k)],按下式计算:
式中:F:参考数据集的个数;Wr,i(k):表示第i组参考数据的聚类离散值;i:表示参考数据中的第i个;
所述量测残差的聚类离散度W(k),按下述计算:
式中:a:表示量测残差的聚类中的第a个,a=1,2,…,k;ca:第a个量测残差聚类集;|ca|:第a个聚类中的量测个数;Da:第a个聚类内数据点间的距离之和。
优选的,所述第a个聚类内数据点间的距离之和Da,按下式计算:
式中:i:量测残差聚类集ca中第i个量测残差值;j:量测残差聚类集ca中第j个量测残差值;di,j:两个量测残差值间的距离。
优选的,所述参考数据集的聚类离散度的期望E[ln Wr(k)]的标准差,按下式所示:
式中:sk:参考数据集的聚类离散度的期望E[ln Wr(k)]的标准差;F:参考数据集的个数;sdk:参考数据集的聚类离散度ln Wr(k)的标准差;
所述参考数据集的聚类离散度ln Wr(k)的标准差sdk,按下式计算:
优选的,所述ln W(k)~k曲线在k处的夹角angel(k),按下式计算:
angel(k)=-arctan(ln W(k-1)-ln W(k))+arctan(ln W(k)-ln W(k+1))
式中:W(k-1):量测残差k-1个聚类的聚类离散度;W(k+1):量测残差k+1个聚类的聚类离散度;W(k):量测残差k个聚类的聚类离散度。
优选的,所述基于所述最佳聚类个数对所述量测残差进行聚类,包括:
在所述量测残差的所有数据中,任选所述最佳聚类个数的数据作为初始聚类中心,进行聚类获得聚类结果;
基于所述聚类结果,重新选择聚类中心开始循环聚类,获得聚类结果;
当连续两次聚类的聚类结果完全一致时,终止聚类循环,确定每一个聚类中的量测残差。
优选的,所述基于所述聚类结果,重新选择聚类中心开始循环聚类,包括:
基于所述聚类结果,计算初始聚类中心与对应聚类中其余数据的平均值,并将所述平均值作为新的聚类中心,继续进行聚类。
优选的,所述在所述聚类结果中确定电力系统不良数据的数量和位置,包括:
在所述聚类结果中,计算每一个聚类中量测残差的平均值,除平均值最小的聚类外,其余聚类中的量测残差对应的量测数据均为不良数据;
统计所述不良数据的数量并获取所述不良数据的位置。
优选的,所述将获取的当前量测数据带入所述神经网络模型得到量测残差,包括:
将所述当前量测数据带入所述神经网络模型,得到对应的状态估计的预测值;
基于所述当前量测数据与对应的所述状态估计的预测值的平方误差得到量测残差。
优选的,所述网络模型信息,包括:电力系统中的设备类型、设备名称和量测数据类型;
所述量测数据类型包括:有功功率量测、无功功率量测、电压量测、有功功率估计、无功功率估计和电压估计。
优选的,所述历史数据,包括:在连续时间断面上,电力系统全部设备的量测值和对应的状态估计值;
所述当前量测数据,包括:待辨识的时间断面上电力系统各个设备的当前量测值。
优选的,所述将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型,包括:
以时间断面对所述历史数据进行分组,将所述历史数据中电力系统全部设备的量测值作为输入神经元,对应的估计值作为输出神经元,预先设置隐含层神经元,进行训练得到神经网络模型。
进一步的,本方法还包括:辨识了电力系统不良数据的数量和位置后,对所述不良数据进行修正;
所述修正包括:根据所述不良数据的位置信息,将所述神经网络模型输出的状态估计值的预测值作为不良数据的修正值。
基于同一发明思路,本申请还提供了一种电力系统不良数据的辨识系统,包括:
训练模块,用于将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;
计算模块,用于将获取的当前量测数据带入所述神经网络模型得到量测残差;
辨识模块,用于对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。
优选的,所述辨识模块,包括:
预设子模块,用于将量测残差设定为多个聚类;
获取子模块,用于根据设定的聚类数量、聚类的间隙值和离散度获得最佳聚类个数;
聚类子模块,用于基于所述最佳聚类个数对所述量测残差进行聚类,得到聚类结果;
辨识子模块,用于在所述聚类结果中确定电力系统不良数据的数量和位置。与最接近的现有技术相比,本发明提供的技术方案具有以下有益效果:
1、本发明所提供的技术方案,将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;接着,将获取的当前量测数据带入所述神经网络模型得到量测残差;对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息,避免了传统辨识方法的残差污染和残差淹没的问题,适用于各种类型不良数据的辨识,对存在不良数据的电力系统能对其量测对应的估计值进行准确预测,提升了不良数据辨识的准确性。
2、本发明所提供的技术方案中,利用电力系统海量运行数据,基于数据挖掘算法进行电力系统不良数据的辨识,能够对电力系统中各类不良数据进行准确辨识,并对不良数据进行修正。
3、本发明所提供的技术方案,对于不同原因产生的不良数据、不同数量的不良数据、不同区域电力系统的设备数据均能够进行准确辨识并修正,具有辨识准确性和应用灵活性的特点。
4、本发明所提供的技术方案,基于的改进GSA间隙统计算法计算最佳聚类个数,可以将良好数据与不良数据所在聚类准确区分,提升了不良数据辨识的准确性。
5、本发明所提供的技术方案,基于神经网络模型的状态估计值预测模型可以预先训练,利用已训练完成的神经网络进行辨识的运算时间很短,适用于规模较大、数据量较大的电力系统,大大提高了在线辨识应用的快速性。
6、本发明所提供的技术方案,根据状态估计值预测模型,对系统不良数据给出修正信息,避免了因采集仪表精度、数据传输通道、传输模式、传输延时等因素造成的设备量测误差,并避免了设备量测误差对在线分析应用计算精度的影响。
附图说明
图1为本发明一种电力系统不良数据的辨识方法流程图。
具体实施方式
为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一步的说明。
图1为一种电力系统不良数据的辨识方法流程图,如图1所示,包括:
步骤S101:将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;
步骤S102:将获取的当前量测数据带入所述神经网络模型得到量测残差;
步骤S103:对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。
本实施例中提供的方法能够有效地辨识设备量测数据存在的量测误差,对单一不良数据和多不良数据两种情况,均能够准确辨识出不良数据的数量和具体位置;对辨识出的不良量测数据,能够进行修正,以提高在线分析应用的计算精度。
具体通过以下技术方案实现的:
1、获取电力系统网络模型和数据,得到历史和实时的电力系统量测和状态估计信息;
2、建立状态估计值预测模型,进行状态估计值预测,求取量测残差;
3、对量测残差进行聚类分析;
4、根据聚类分析的结果,得到不良数据的数量和位置信息,并对其进行修正。
实施例中,获取电力系统网络模型和数据,得到历史和实时的电力系统量测和状态估计信息,具体包括:
1‐1、获取所述电力系统的模型信息;获取电力系统的历史量测数据和对应状态估计数据;
其中,模型信息包括电力系统中的设备类型、设备名称、量测数据类型,所述量测数据类型包括有功功率量测、无功功率量测、电压量测、有功功率估计、无功功率估计和电压估计。
历史数据包括,在一段时间内的连续时间断面上,电力系统各个设备的量测值和对应估计值。
1‐2、获取电力系统的实时量测数据;
其中,数据为待辨识的量测数据,取自待辨识的时间断面上电力系统各个设备的量测值,通过SCADA系统获取。
实施例中,建立状态估计值预测模型,进行状态估计值预测,求取量测残差,包括:
2‐1.建立用于状态估计值预测的神经网络模型;
其中,神经网络模型,包括输入层神经元、隐含层神经元和输出层神经元,利用神经元间的连接关系实现复杂非线性网络的拟合。
神经网络模型的训练集数据为获取的全部时间断面的所有设备的历史量测数据和状态估计数据。每一个时间断面为一组训练数据,所有设备的量测数据作为输入神经元,全部设备的估计数据作为输出神经元,预先设置隐含层神经元,进行训练得到神经网络模型。
时间断面的数量即为训练集样本数,待辨识时间断面数据为测试集数据。
此神经网络模型的作用是对待辨识的量测值对应的状态估计值进行快速预测。
2‐2.利用所述神经网络对待辨识量测的估计值进行预测;
其中,对于训练完成的状态估计值预测神经网络模型,输入待辨识时间断面的全部设备量测值作为测试集数据,模型输出其对应的状态估计的预测值。
2‐3.计算待辨识时间断面的量测值与对应估计值的平方误差;
基于实时量测数据与对应的状态估计的预测值的平方误差得到量测残差。量测残差作为后续步骤聚类算法的输入数据集。
实施例中,对量测残差进行聚类分析,包括:
3‐1.利用改进GSA间隙统计算法计算最佳聚类个数;
GSA间隙统计算法,是一种强化聚类效果的数据挖掘算法,通过比较聚类结果的离散度指标和其参考值,确定最佳聚类个数,将良好数据和不良数据所在聚类准确区分。
3‐2.利用k‐means聚类算法对量测值和预测估计值的平方误差进行聚类。
应用聚类算法的目的是,利用智能算法对所有量测残差中显著高于一般可接受残差的较大残差进行辨别,以自动辨别出量测数据中的显著残差项,从而确定不良数据的数量和位置。
进一步的,步骤3‐1具体包括:
a.人为预设k值,将聚类数据样本集聚类为k个聚类c1,c2,...,ck,聚类数据样本集为量测残差。
b.对于k个聚类中的每一个聚类,计算其聚类内数据点间距离和Da
式(1)中,ca为第a个量测残差聚类集,i:量测残差聚类集ca中第i个量测残差值;j:量测残差聚类集ca中第j个量测残差值;di,j为两个量测残差值间的距离,所述距离采用欧几里得平方距离。
c.计算聚类样本集量测残差的聚类离散度W(k):
式(2)中,a:表示量测残差的聚类中的第a个,a=1,2,…,k;ca:第a个量测残差聚类集;|ca|为第a个聚类中的数据个数,即聚类中的量测个数。
d.生成F组均匀分布的参考数据集,将参考数据集聚类为k个聚类,计算参考数据集聚类离散度期望值:
其中:F:参考数据集的个数;Wr,i(k):表示第i组参考数据的聚类离散值;
i:表示参考数据中的第i个;
e.计算参考数据集的聚类离散度ln Wr(k)的标准差sdk和E[ln Wr(k)]的标准差sk
f.计算量测残差数据集的k个聚类的间隙值gap(k):
gap(k)=E[ln Wr(k)]-ln W(k) (5)
式中:Wr(k):参考数据集聚类离散度;W(k):量测残差的聚类离散度;E[ln Wr(k)]:参考数据集聚类离散度期望值。
g.判断量测残差数据集的最佳聚类个数,判别公式如下:
当设定k=1,此时如果满足下式时,所述最佳聚类个数为1;
gap(k)≥gap(k+1)-sk+1 (6)
当设定k>1时,满足下式的最小k值为最佳聚类个数;
angel(k)<angel(k+1) (7)
式中:gap(k):量测残差的k个聚类的间隙值;gap(k+1):量测残差的k+1
个聚类的间隙值;sk+1:参考数据集的聚类离散度的标准差;angel(k):ln W(k)~k曲线在k处的夹角;angel(k+1):ln W(k)~k曲线在k+1处的夹角;
其中,ln W(k)~k曲线在k处的夹角angel(k),按下式计算:
angel(k)=-arctan(ln W(k-1)-ln W(k))+arctan(ln W(k)-ln W(k+1))
式中:W(k-1):量测残差k-1个聚类的聚类离散度;W(k+1):量测残差k+1个聚类的聚类离散度;W(k):量测残差k个聚类的聚类离散度。
进一步的,步骤3‐2包括以下具体步骤:
a.根据最佳聚类个数k,任选聚类数据集中的k个量测残差数据作为初始聚类中心;
b.对聚类数据集中的每一个量测残差数据,计算其与k个聚类中心数据的距离,选择距离最近的一个归入其类;
c.聚类数据集中的所有设备的量测残差数据归类完成后,计算k个聚类的量测残差数据平均值,并将平均值作为新的聚类中心,重复b步骤聚类;
d.当连续两次聚类的聚类结果完全一致,终止b、c步骤循环,确定最终的聚类结果。
实施例中,根据聚类分析的结果,得到不良数据的数量和位置信息,并对其进行修正,包括:
4‐1.判断不良数据的数量和位置;
其中,判断方法为:1)若最佳聚类个数为1,则不存在不良数据;
2)若最佳聚类个数大于1,则存在不良数据;在聚类结果中,计算每一聚类中量测误差数据的平均值,平均值最小的聚类为良好数据类,其余聚类内的量测误差数据对应的量测全部为不良数据。
4‐2.对不良数据进行修正;
根据所述不良数据统计不良数据的数量和位置信息,利用状态估计值预测模型,将模型中不良数据位置输出的状态估计预测值作为不良数据的修正值。
基于同一发明构思,本实施例中还提供了一种电力系统不良数据的辨识系统,包括:
训练模块,用于将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;
计算模块,用于将获取的当前量测数据带入所述神经网络模型得到量测残差;
辨识模块,用于对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。
实施例中,所述辨识模块,包括:
预设子模块,用于将量测残差设定为多个聚类;
获取子模块,用于根据设定的聚类数量、聚类的间隙值和离散度获得最佳聚类个数;
聚类子模块,用于基于所述最佳聚类个数对所述量测残差进行聚类,得到聚类结果;
辨识子模块,用于在所述聚类结果中确定电力系统不良数据的数量和位置。
实施例中,获取子模块,包括:
设定单元,用于设定聚类数量为k;
判断单元,用于当设定k=1,此时如果满足下式时,所述最佳聚类个数为1;
gap(k)≥gap(k+1)-sk+1
还用于当设定k>1时,满足下式的最小k值为最佳聚类个数;
angel(k)<angel(k+1)
式中:gap(k):量测残差的k个聚类的间隙值;gap(k+1):量测残差的k+1个聚类的间隙值;sk+1:参考数据集的聚类离散度的标准差;angel(k):ln W(k)~k曲线在k处的夹角;angel(k+1):ln W(k)~k曲线在k+1处的夹角。
实施例中,所述聚类子模块,包括:
聚类单元,用于在所述量测残差的所有数据中,任选所述最佳聚类个数的数据作为初始聚类中心,进行聚类获得聚类结果;
循环单元,用于基于所述聚类结果,重新选择聚类中心开始循环聚类,获得聚类结果;
结果单元,用于当连续两次聚类的聚类结果完全一致时,终止聚类循环,确定每一个聚类中的量测残差。
实施例中,所述辨识子模块,包括:
辨识单元,用于在所述聚类结果中,计算每一个聚类中量测残差的平均值,除平均值最小的聚类外,其余聚类中的量测残差对应的量测数据均为不良数据;
统计单元,用于统计所述不良数据的数量并获取所述不良数据的位置。
实施例中,所述计算模块,包括:
第一计算单元,用于将所述当前量测数据带入所述神经网络模型,得到对应的状态估计的预测值;
第二计算单元,用于基于所述当前量测数据与对应的所述状态估计的预测值的平方误差得到量测残差。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

Claims (18)

1.一种电力系统不良数据的辨识方法,其特征在于,包括:
将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;
将获取的当前量测数据带入所述神经网络模型得到量测残差;
对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。
2.如权利要求1所述的方法,其特征在于,所述对所述量测残差进行聚类分析,确定电力系统不良数据的数量和位置信息,包括:
将量测残差设定为多个聚类;
根据设定的聚类数量、聚类的间隙值和离散度获得最佳聚类个数;
基于所述最佳聚类个数对所述量测残差进行聚类,得到聚类结果;
在所述聚类结果中确定电力系统不良数据的数量和位置。
3.如权利要求2所述的方法,其特征在于,所述根据设定的聚类数量、聚类的间隙值获得最佳聚类个数,包括:
设定聚类数量为k;
当设定k=1,此时如果满足下式时,所述最佳聚类个数为1;
gap(k)≥gap(k+1)-sk+1
当设定k>1时,满足下式的最小k值为最佳聚类个数;
angel(k)<angel(k+1)
式中:gap(k):量测残差的k个聚类的间隙值;gap(k+1):量测残差的k+1个聚类的间隙值;sk+1:参考数据集的聚类离散度的标准差;angel(k):lnW(k)~k曲线在k处的夹角;angel(k+1):lnW(k)~k曲线在k+1处的夹角。
4.如权利要求3所述的方法,其特征在于,所述量测残差的k个聚类的间隙值gap(k),按下式计算:
gap(k)=E[lnWr(k)]-lnW(k)
式中:Wr(k):参考数据集聚类离散度;W(k):量测残差的聚类离散度;E[lnWr(k)]:参考数据集聚类离散度期望值。
5.如权利要求4所述的方法,其特征在于,所述参考数据集聚类离散度期望值E[lnWr(k)],按下式计算:
式中:F:参考数据集的个数;Wr,i(k):表示第i组参考数据的聚类离散值;i:表示参考数据中的第i个;
所述量测残差的聚类离散度W(k),按下述计算:
式中:a:表示量测残差的聚类中的第a个,a=1,2,…,k;ca:第a个量测残差聚类集;|ca|:第a个聚类中的量测个数;Da:第a个聚类内数据点间的距离之和。
6.如权利要求5所述的方法,其特征在于,所述第a个聚类内数据点间的距离之和Da,按下式计算:
式中:i:量测残差聚类集ca中第i个量测残差值;j:量测残差聚类集ca中第j个量测残差值;di,j:两个量测残差值间的距离。
7.如权利要求5所述的方法,其特征在于,所述参考数据集的聚类离散度的期望E[lnWr(k)]的标准差,按下式所示:
式中:sk:参考数据集的聚类离散度的期望E[lnWr(k)]的标准差;F:参考数据集的个数;sdk:参考数据集的聚类离散度lnWr(k)的标准差;
所述参考数据集的聚类离散度lnWr(k)的标准差sdk,按下式计算:
8.如权利要求3所述的方法,其特征在于,所述lnW(k)~k曲线在k处的夹角angel(k),按下式计算:
angel(k)=-arctan(lnW(k-1)-lnW(k))+arctan(lnW(k)-lnW(k+1))
式中:W(k-1):量测残差k-1个聚类的聚类离散度;W(k+1):量测残差k+1个聚类的聚类离散度;W(k):量测残差k个聚类的聚类离散度。
9.如权利要求2所述的方法,其特征在于,所述基于所述最佳聚类个数对所述量测残差进行聚类,包括:
在所述量测残差的所有数据中,任选所述最佳聚类个数的数据作为初始聚类中心,进行聚类获得聚类结果;
基于所述聚类结果,重新选择聚类中心开始循环聚类,获得聚类结果;
当连续两次聚类的聚类结果完全一致时,终止聚类循环,确定每一个聚类中的量测残差。
10.如权利要求9所述的方法,其特征在于,所述基于所述聚类结果,重新选择聚类中心开始循环聚类,包括:
基于所述聚类结果,计算初始聚类中心与对应聚类中其余数据的平均值,并将所述平均值作为新的聚类中心,继续进行聚类。
11.如权利要求2所述的方法,其特征在于,所述在所述聚类结果中确定电力系统不良数据的数量和位置,包括:
在所述聚类结果中,计算每一个聚类中量测残差的平均值,除平均值最小的聚类外,其余聚类中的量测残差对应的量测数据均为不良数据;
统计所述不良数据的数量并获取所述不良数据的位置。
12.如权利要求1所述的方法,其特征在于,所述将获取的当前量测数据带入所述神经网络模型得到量测残差,包括:
将所述当前量测数据带入所述神经网络模型,得到对应的状态估计的预测值;
基于所述当前量测数据与对应的所述状态估计的预测值的平方误差得到量测残差。
13.如权利要求1所述的方法,其特征在于,
所述网络模型信息,包括:电力系统中的设备类型、设备名称和量测数据类型;
所述量测数据类型包括:有功功率量测、无功功率量测、电压量测、有功功率估计、无功功率估计和电压估计。
14.如权利要求1所述的方法,其特征在于,
所述历史数据,包括:在连续时间断面上,电力系统全部设备的量测值和对应的状态估计值;
所述当前量测数据,包括:待辨识的时间断面上电力系统各个设备的当前量测值。
15.如权利要求14所述的方法,其特征在于,所述将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型,包括:
以时间断面对所述历史数据进行分组,将所述历史数据中电力系统全部设备的量测值作为输入神经元,对应的估计值作为输出神经元,预先设置隐含层神经元,进行训练得到神经网络模型。
16.如权利要求1所述的方法,其特征在于,还包括:辨识了电力系统不良数据的数量和位置后,对所述不良数据进行修正;
所述修正包括:根据所述不良数据的位置信息,将所述神经网络模型输出的状态估计值的预测值作为不良数据的修正值。
17.一种电力系统不良数据的辨识系统,其特征在于,包括:
训练模块,用于将获取的电力系统的网络模型信息和历史数据进行训练,得到神经网络模型;
计算模块,用于将获取的当前量测数据带入所述神经网络模型得到量测残差;
辨识模块,用于对所述量测残差进行聚类分析,辨识电力系统不良数据的数量和位置信息。
18.如权利要求17所述的系统,其特征在于,所述辨识模块,包括:
预设子模块,用于将量测残差设定为多个聚类;
获取子模块,用于根据设定的聚类数量、聚类的间隙值和离散度获得最佳聚类个数;
聚类子模块,用于基于所述最佳聚类个数对所述量测残差进行聚类,得到聚类结果;
辨识子模块,用于在所述聚类结果中确定电力系统不良数据的数量和位置。
CN201810234014.8A 2018-03-21 2018-03-21 一种电力系统不良数据的辨识方法及系统 Pending CN110298369A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810234014.8A CN110298369A (zh) 2018-03-21 2018-03-21 一种电力系统不良数据的辨识方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810234014.8A CN110298369A (zh) 2018-03-21 2018-03-21 一种电力系统不良数据的辨识方法及系统

Publications (1)

Publication Number Publication Date
CN110298369A true CN110298369A (zh) 2019-10-01

Family

ID=68025334

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810234014.8A Pending CN110298369A (zh) 2018-03-21 2018-03-21 一种电力系统不良数据的辨识方法及系统

Country Status (1)

Country Link
CN (1) CN110298369A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016248A (zh) * 2020-08-31 2020-12-01 华北电力大学 一种基于Elman神经网络SCR脱硝系统不良数据辨识方法
CN112651460A (zh) * 2020-12-31 2021-04-13 新奥数能科技有限公司 一种光伏功率异常数据的识别方法及装置
CN113191485A (zh) * 2021-04-26 2021-07-30 东北大学 一种基于narx神经网络的电力信息网络安全检测系统及方法
CN113255775A (zh) * 2021-05-28 2021-08-13 神威超算(北京)科技有限公司 一种电力系统异常数据的识别方法、装置和智能芯片
CN114490836A (zh) * 2022-04-15 2022-05-13 国网天津市电力公司电力科学研究院 一种适用于电动汽车充电故障的数据挖掘处理方法
CN114912548A (zh) * 2022-07-11 2022-08-16 国网信息通信产业集团有限公司 一种利用电力人工智能的大气污染用户识别系统及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866715A (zh) * 2015-05-14 2015-08-26 同济大学 基于自适应核密度估计的电力系统抗差状态估计方法
CN106295850A (zh) * 2016-07-15 2017-01-04 广东电网有限责任公司电力科学研究院 一种基于历史量测的不良数据辨识方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866715A (zh) * 2015-05-14 2015-08-26 同济大学 基于自适应核密度估计的电力系统抗差状态估计方法
CN106295850A (zh) * 2016-07-15 2017-01-04 广东电网有限责任公司电力科学研究院 一种基于历史量测的不良数据辨识方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
葛成: ""基于GSA的电力系统不良数据辨识方法研究"", 《中国优秀硕士学位论文全文数据库·工程科技Ⅱ辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016248A (zh) * 2020-08-31 2020-12-01 华北电力大学 一种基于Elman神经网络SCR脱硝系统不良数据辨识方法
CN112651460A (zh) * 2020-12-31 2021-04-13 新奥数能科技有限公司 一种光伏功率异常数据的识别方法及装置
CN113191485A (zh) * 2021-04-26 2021-07-30 东北大学 一种基于narx神经网络的电力信息网络安全检测系统及方法
CN113191485B (zh) * 2021-04-26 2024-05-10 东北大学 一种基于narx神经网络的电力信息网络安全检测系统及方法
CN113255775A (zh) * 2021-05-28 2021-08-13 神威超算(北京)科技有限公司 一种电力系统异常数据的识别方法、装置和智能芯片
CN113255775B (zh) * 2021-05-28 2021-09-24 神威超算(北京)科技有限公司 一种电力系统异常数据的识别方法、装置和智能芯片
CN114490836A (zh) * 2022-04-15 2022-05-13 国网天津市电力公司电力科学研究院 一种适用于电动汽车充电故障的数据挖掘处理方法
CN114912548A (zh) * 2022-07-11 2022-08-16 国网信息通信产业集团有限公司 一种利用电力人工智能的大气污染用户识别系统及方法
CN114912548B (zh) * 2022-07-11 2022-10-25 国网信息通信产业集团有限公司 一种利用电力人工智能的大气污染用户识别系统及方法

Similar Documents

Publication Publication Date Title
CN110298369A (zh) 一种电力系统不良数据的辨识方法及系统
CN104794206B (zh) 一种变电站数据质量评价系统及方法
CN109829497B (zh) 一种基于监督学习的台区用户识别及判别方法
CN105740975B (zh) 一种基于数据关联关系的设备缺陷评估与预测方法
CN106505557B (zh) 一种遥测错误辨识方法及装置
CN106055918A (zh) 一种电力系统负荷数据辨识及修复方法
CN105846780A (zh) 一种基于决策树模型的光伏组件故障诊断方法
CN109767054A (zh) 基于深度神经网络算法的能效云评估方法及边缘能效网关
CN103869192B (zh) 智能电网线损检测方法和系统
CN109285087A (zh) 一种基于NB-IoT和GPU加速的台区拓扑识别方法
CN116125361B (zh) 电压互感器误差评估方法、系统、电子设备及存储介质
CN111628494B (zh) 一种基于逻辑回归法的低压配电网拓扑识别方法及系统
CN111900731A (zh) 一种基于pmu的电力系统状态估计性能评价方法
CN109298225B (zh) 一种电压量测数据异常状态自动识别模型系统及方法
CN103103570B (zh) 基于主元相似性测度的铝电解槽况诊断方法
CN110146743A (zh) 一种台区相位识别方法
CN113922412B (zh) 一种新能源多场站短路比全景化评估方法、系统、存储介质及计算设备
CN110874685A (zh) 基于神经网络的智能电能表运行状态判别方法及系统
CN111598165A (zh) 一种基于极限学习机的密度聚类离群点检测方法
CN110968703B (zh) 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统
CN114660531B (zh) 一种基于电表测量误差补偿的检测方法、系统及装置
CN103324858A (zh) 配电网三相潮流状态估计方法
CN117394337A (zh) 一种电网负荷预警方法及其系统
CN111612149A (zh) 一种基于决策树的主网线路状态检测方法、系统及介质
CN115685045A (zh) 一种电压互感器在线评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination