CN113780354B - 调度自动化主站系统遥测数据异常识别方法和装置 - Google Patents

调度自动化主站系统遥测数据异常识别方法和装置 Download PDF

Info

Publication number
CN113780354B
CN113780354B CN202110920427.3A CN202110920427A CN113780354B CN 113780354 B CN113780354 B CN 113780354B CN 202110920427 A CN202110920427 A CN 202110920427A CN 113780354 B CN113780354 B CN 113780354B
Authority
CN
China
Prior art keywords
data
sample
sample data
point
telemetry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110920427.3A
Other languages
English (en)
Other versions
CN113780354A (zh
Inventor
肖飞
尚学伟
叶洪波
李晓蕾
金芬兰
王昊
赵林
郝旭亮
刘兴宇
李超
祁海龙
陈飞
李鹏
王治华
刘冉
陈宏福
宋明曙
甘忠
李永光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Beijing Kedong Electric Power Control System Co Ltd
State Grid Shanghai Electric Power Co Ltd
State Grid Electric Power Research Institute
State Grid Xinjiang Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Beijing Kedong Electric Power Control System Co Ltd
State Grid Shanghai Electric Power Co Ltd
State Grid Electric Power Research Institute
State Grid Xinjiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Beijing Kedong Electric Power Control System Co Ltd, State Grid Shanghai Electric Power Co Ltd, State Grid Electric Power Research Institute, State Grid Xinjiang Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202110920427.3A priority Critical patent/CN113780354B/zh
Publication of CN113780354A publication Critical patent/CN113780354A/zh
Application granted granted Critical
Publication of CN113780354B publication Critical patent/CN113780354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Selective Calling Equipment (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明公开了调度自动化主站系统遥测数据异常识别方法和装置,包括从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据,根据样本数据的类型将数据分类;对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;根据聚类结果识别数据异常。本发明通过对样本进行筛选,提高了异常数据识别的准确性和效率;采用根据主站数据提取均值、方差等特征进行聚类,针对跳变、不变化、越限异常等典型问题,找出在不同情况下,不同测点的数据异常自适应识别方法,减少了人工识别步骤,节省投入,提高数据异常识别的准确性。

Description

调度自动化主站系统遥测数据异常识别方法和装置
技术领域
本发明涉及一种调度自动化主站系统遥测数据异常识别方法和装置,属于电力系统调度自动化技术领域。
背景技术
调度自动化主站系统通过各类传感器实现对发电、输电、配电、用电等环节的数据采集,并进行整理、分析获取相应的有效信息,通过这些信息实现对电网的实时监控,以便调度人员能够及时发现电网风险,作出科学准确的决策。对于遥测数据,包括电流、电压、有功、无功等量测量,主要是通过在主站端设定阈值来进行异常的判别。但在调度自动化主站系统中,大多是根据经验值对遥测数据设置阈值,给自动化人员带来大量的维护工作,由于阈值设置不合理或漏设置,导致遥测异常的误报、漏报情况时有发生,缺乏有效的异常辨识规则。
因此,有必要基于调度自动化主站信息支撑系统,增加自适应的遥测数据异常限值设定规则。基于对调度自动化主站系统的历史数据、实时数据的监视与分析工作,提升所设定阈值的准确性与可用性,自适应识别遥测数据异常,为自动化主站系统运行提供有力保障。
发明内容
本发明旨在针对目前调度自动化主站系统中缺乏有效的异常辨识规则的问题,提供调度自动化主站系统遥测数据异常识别方法。
本发明采用以下技术方案。
提供调度自动化主站系统遥测数据异常识别方法,包括以下步骤:从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据,根据样本数据的类型将数据分类;
对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;
分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;
根据聚类结果识别调度自动化主站系统遥测数据异常。
进一步地,根据样本数据的类型将数据分为电压数据、电流数据、有功数据、无功数据和其它数据,所述其它数据为除了电压数据、电流数据、有功数据和无功数据以外的数据。
进一步地,辨识无效样本数据并将该遥测点的各类无效样本数据剔除具体包括:
如果遥测点设置了零漂,当该遥测点的数据出现小于零漂值的数量达到样本的设定比例,则认为该遥测点数据不变化,该遥测点数据为无效样本数据,将该遥测点数据删除;
如果遥测数据类型是电流数据,电流数据小于空充设定值的情况达到样本的设定比例,则认为电流数据不变化,该遥测点的电流类样本数据为无效样本数据,将该遥测点的电流类样本数据剔除;
如果是光伏发电的有功数据或者电流数据,将该遥测点的夜晚的有功数据或者电流数据为无效数据,将该遥测点的夜晚的有功数据或者电流数据的数据采集量剔除;
基于时间序列化的数据的连续差值绝对值小于设定值,并且达到样本数据的设定比例,则该遥测点的数据为无效样本数据,将该遥测点的数据删除。
进一步地,对遥测点的各类剩下的有效样本数据进行聚类的方法包括:
(1)对遥测点的各类剩下的有效样本数据进行分段,每个区段包含n个样本;
(2)对每一个区段内的n个样本,计算其均值M和方差s2,将样本转化为二维数据;
(3)针对样本数据集的均值和方差,进行归一化处理;
(4)针对样本数据集,选择任意三个点作为起始质心点;
(5)计算样本数据集内所有样本数据的均值和方差,确定所有样本数据的均值和方差与质心点的距离,并选择距离最短的质心点;全部样本数据计算后,根据选择的质心点,可以得到样本数据集的三个簇;
(6)对三个簇中的数据分别取均值的平均值和方差的平均值,作为新质心,重复第(5)步,直到三个质心不再变化得到最终聚类结果。
进一步地,每隔设定时间从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据,根据样本数据执行聚类,得到每类遥测数据的聚类结果。
再进一步地,选取聚类结果中各个簇中方差最大的聚类簇的质心,作为跳变阈值设定基准,选取聚类结果中各个簇中均值最大的聚类簇的质心作为越限设定基准;剩下的一个聚类簇作为正常簇。
再进一步地,若电压数据或电流数据属于越限簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到越限簇质心的距离比上该均值和方差到正常簇质心的距离比小于第一设定比例,则确定电压数据或电流数据为越限的异常数据。
再进一步地,若电压数据或电流数据属于跳变簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第二设定比例,则确定电压数据或电流数据为跳变的异常数据。
再进一步地,若有功数据属于越限簇,则计算功数据的均值和方差;计算该均值和方差到越限簇质心的距离比上到正常簇质心的距离比小于第三设定比例,则确定有功数据为越限的异常数据;若有功数据属于跳变簇,则计算功数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第四设定比例,则确定有功数据为跳变的异常数据。
再进一步地,若无功数据或其它数据属于越限簇,所述其它数据为除了电压数据、电流数据、有功数据和无功数据以外的数据,则计算无功数据或其它数据的均值和方差;计算该均值和方差到越限簇质心的距离比上到正常簇质心的距离比小于第五设定比例,则确定无功数据或其它数据为越限的异常数据;若无功数据或其它数据属于跳变簇,则计算无功数据或其它数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第六设定比例,则确定无功数据或其它数据为跳变的异常数据。
本发明所取得地有益技术效果:
另一方面,本发明提供了10.调度自动化主站系统遥测数据异常识别,包括:样本数据采集模块、数据分类模块、无效样本数据剔除模块、聚类模块和数据异常识别模块;
所述样本数据采集模块,用于从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据;
所述数据分类模块,用于根据样本数据的类型将数据分类;
所述无效样本数据剔除模块,用于对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;
所述聚类模块,用于分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;
所述数据异常识别模块,用于根据聚类结果识别调度自动化主站系统遥测数据异常。
本发明提供了调度自动化主站系统遥测数据异常识别方法,通过对样本进行分类并筛选剔除无效样本,对剩余的有效样本进行聚类,根据聚类结果识别异常数据,提高了异常数据识别的准确性和效率;
本发明采用根据采集主机上送的主站数据提取均值、方差等特征进行聚类,针对跳变、不变化、越限异常等典型问题,找出在不同情况下,不同测点的数据异常自适应识别方法,减少了监控人员人工识别判断的步骤,节省专业人员的投入,提高数据异常识别的准确性。
附图说明
图1为本发明具体实施提供的聚类算法结果示意图;
图2为本发明具体实施里提供的调度自动化主站系统遥测数据异常识别方法流程示意图。
具体实施方式
以下将结合说明书附图和具体实施例对本发明做进一步说明。
实施例:调度自动化主站系统遥测数据异常识别方法,如图2所示,包括:从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据(即时序数据样本)作为样本数据,根据样本数据的类型将数据分类;
对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;
分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;
根据聚类结果识别调度自动化主站系统遥测数据异常。
通过对样本进行筛选提高了异常数据识别的准确性和效率。
本实施例中根据样本数据的类型将数据分为电压数据、电流数据、有功数据、无功数据和其它数据,所述其它数据为除了电压数据、电流数据、有功数据和无功数据以外的数据。
本发明根据基于时间序列化的遥测数据,通过进行时间比对辨识无效样本数据。辨识无效样本数据并将该遥测点的各类无效样本数据剔除具体包括:如果遥测点设置了零漂(如具体实施例中设定0.1),当该遥测点的数据出现小于零漂值的数量达到样本的设定比例(如具体实施例中设定比例设定为50%,则认为该遥测点数据不变化,将该遥测点数据删除;
如果遥测数据类型是电流,数据小于空充设定值(如具体实施例中设定10A)的情况达到样本的设定比例如(具体实施例中设定40%),则认为数据不变化,将该遥测点的电流类样本数据剔除;
如果是光伏发电的有功数据或者电流数据,则将该遥测点的夜晚的有功数据或者电流数据的数据采集量剔除;
基于时间序列化的数据的连续差值绝对值小于设定值(具体实施例中设定0.00001),并且达到样本数据的设定比例(具体实施例中设定40%),则将该遥测点的数据删除。
具体实施例中聚类方法采用K-Means聚类算法。
对遥测点的各类剩下的有效样本数据进行聚类的方法包括:
(1)对遥测点的各类剩下的有效样本数据进行分段(如(10秒钟分为一段),每个区段包含n个样本;
(2)对每一个区段内的n个样本,计算其均值M和方差s2,将样本转化为二维数据;
(3)针对样本数据集的均值和方差,进行归一化处理;
(4)针对样本数据集,选择任意三个点作为起始质心点;
(5)计算样本数据集内所有样本数据的均值和方差,确定所有样本数据的均值和方差与质心点的距离,并选择距离最短的质心点;全部样本数据计算后,根据选择的质心点,可以得到样本数据集的三个簇;
(6)对三个簇中的数据分别取均值的平均值和方差的平均值,作为新质心,重复第(5)步,直到三个质心不再变化得到最终聚类结果,聚类结果如图1所示。
具体实施本发明时,每隔设定时间(如15分钟)从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据,根据样本数据执行聚类,得到每类遥测数据的聚类结果。通过实时采集遥测数据并根据实时数据更新聚类结果,能够自适应的遥测数据异常,提升所设定阈值的准确性与可用性。
根据聚类结果进行数据异常识别包括:选取聚类结果中各个簇中方差最大的聚类簇的质心,作为跳变阈值设定基准,选取聚类结果中各个簇中均值最大的聚类簇的质心作为越限设定基准;剩下的一个聚类簇作为正常簇。
若电压数据或电流数据属于越限簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到越限簇质心的距离比上该均值和方差到正常簇质心的距离比小于第一设定比例(如0.6),则确定电压数据或电流数据为越限的异常数据。
若电压数据或电流数据属于跳变簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第二设定比例(如0.8),则确定电压数据或电流数据为跳变的异常数据。
若有功数据属于越限簇,则计算功数据的均值和方差;计算该均值和方差到越限簇质心的距离比上到正常簇质心的距离比小于第三设定比例(如0.8),则确定有功数据为越限的异常数据;若有功数据属于跳变簇,则计算功数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第四设定比例(如0.65),则确定有功数据为跳变的异常数据。
若无功数据或其它数据属于越限簇,所述其它数据为除了电压数据、电流数据、有功数据和无功数据以外的数据,则计算无功数据或其它数据的均值和方差;计算该均值和方差到越限簇质心的距离比上到正常簇质心的距离比小于第五设定比例(如0.7),则确定无功数据或其它数据为越限的异常数据;若无功数据或其它数据属于跳变簇,则计算无功数据或其它数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第六设定比例(如0.75),则确定无功数据或其它数据为跳变的异常数据。
本发明通过对样本进行筛选,提高了异常数据识别的准确性和效率;本发明采用数据聚类分析方法,对SCADA采集主机上送的主站数据提取均值、方差等特征,针对跳变、不变化、越限异常等典型问题研究其数据特征,找出在不同情况下,不同测点的数据异常自适应识别方法,减少了监控人员人工识别判断的步骤,节省专业人员的投入,提高数据异常识别的准确性。
与以上实施例提供的调度自动化主站系统遥测数据异常识别方法相对应地,本发明还提供了调度自动化主站系统遥测数据异常识别装置,包括:样本数据采集模块、数据分类模块、无效样本数据剔除模块、聚类模块和数据异常识别模块;
所述样本数据采集模块,用于从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据;
所述数据分类模块,用于根据样本数据的类型将数据分类;
所述无效样本数据剔除模块,用于对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;
所述聚类模块,用于分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;
所述数据异常识别模块,用于根据聚类结果识别调度自动化主站系统遥测数据异常。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,
装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (3)

1.调度自动化主站系统遥测数据异常识别方法,其特征是,包括以下步骤:
从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据,根据样本数据的类型将数据分类;
对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;
分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;
根据聚类结果识别调度自动化主站系统遥测数据异常;
根据样本数据的类型将数据分为电压数据、电流数据、有功数据、无功数据和其它数据,所述其它数据为除了电压数据、电流数据、有功数据和无功数据以外的数据;
辨识无效样本数据并将该遥测点的各类无效样本数据剔除具体包括:
如果遥测点设置了零漂,当该遥测点的数据出现小于零漂值的数量达到样本的设定比例,则认为该遥测点数据不变化,该遥测点数据为无效样本数据,将该遥测点数据删除;
如果遥测数据类型是电流数据,电流数据小于空充设定值的情况达到样本的设定比例,则认为电流数据不变化,该遥测点的电流类样本数据为无效样本数据,将该遥测点的电流类样本数据剔除;
如果是光伏发电的有功数据或者电流数据,将该遥测点的夜晚的有功数据或者电流数据为无效数据,将该遥测点的夜晚的有功数据或者电流数据的数据采集量剔除;
基于时间序列化的数据的连续差值绝对值小于设定值,并且达到样本数据的设定比例,则该遥测点的数据为无效样本数据,将该遥测点的数据删除;
对遥测点的各类剩下的有效样本数据进行聚类的方法包括:
(1)对遥测点的各类剩下的有效样本数据进行分段,每个区段包含n个样本;
(2)对每一个区段内的n个样本,计算其均值M和方差s2,将样本转化为二维数据;
(3)针对样本数据集的均值和方差,进行归一化处理;
(4)针对样本数据集,选择任意三个点作为起始质心点;
(5)计算样本数据集内所有样本数据的均值和方差,确定所有样本数据的均值和方差与质心点的距离,并选择距离最短的质心点;全部样本数据计算后,根据选择的质心点,可以得到样本数据集的三个簇;
(6)对三个簇中的数据分别取均值的平均值和方差的平均值,作为新质心,重复第(5)步,直到三个质心不再变化得到最终聚类结果;
根据聚类结果识别调度自动化主站系统遥测数据异常包括:选取聚类结果中各个簇中方差最大的聚类簇的质心,作为跳变阈值设定基准,选取聚类结果中各个簇中均值最大的聚类簇的质心作为越限设定基准;剩下的一个聚类簇作为正常簇;
若电压数据或电流数据属于越限簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到越限簇质心的距离比上该均值和方差到正常簇质心的距离比小于第一设定比例,则确定电压数据或电流数据为越限的异常数据;
若电压数据或电流数据属于跳变簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第二设定比例,则确定电压数据或电流数据为跳变的异常数据。
2.根据权利要求1所述的调度自动化主站系统遥测数据异常识别方法,其特征是,每隔设定时间从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据,根据样本数据执行聚类,得到每类遥测数据的聚类结果。
3.调度自动化主站系统遥测数据异常识别装置,其特征在于,包括:样本数据采集模块、数据分类模块、无效样本数据剔除模块、聚类模块和数据异常识别模块;
所述样本数据采集模块,用于从主站的各遥测点获取选定时间段的基于时间序列化的遥测数据作为样本数据;
所述数据分类模块,用于根据样本数据的类型将数据分类;
所述无效样本数据剔除模块,用于对各遥测点的各类样本数据进行筛选,辨识无效样本数据并将该遥测点的各类无效样本数据剔除;
所述聚类模块,用于分别对遥测点的各类剩下的有效样本数据进行聚类,迭代得到每类遥测数据的聚类结果;
所述数据异常识别模块,用于根据聚类结果识别调度自动化主站系统遥测数据异常;
根据样本数据的类型将数据分为电压数据、电流数据、有功数据、无功数据和其它数据,所述其它数据为除了电压数据、电流数据、有功数据和无功数据以外的数据;
辨识无效样本数据并将该遥测点的各类无效样本数据剔除具体包括:
如果遥测点设置了零漂,当该遥测点的数据出现小于零漂值的数量达到样本的设定比例,则认为该遥测点数据不变化,该遥测点数据为无效样本数据,将该遥测点数据删除;
如果遥测数据类型是电流数据,电流数据小于空充设定值的情况达到样本的设定比例,则认为电流数据不变化,该遥测点的电流类样本数据为无效样本数据,将该遥测点的电流类样本数据剔除;
如果是光伏发电的有功数据或者电流数据,将该遥测点的夜晚的有功数据或者电流数据为无效数据,将该遥测点的夜晚的有功数据或者电流数据的数据采集量剔除;
基于时间序列化的数据的连续差值绝对值小于设定值,并且达到样本数据的设定比例,则该遥测点的数据为无效样本数据,将该遥测点的数据删除;
对遥测点的各类剩下的有效样本数据进行聚类的方法包括:
(1)对遥测点的各类剩下的有效样本数据进行分段,每个区段包含n个样本;
(2)对每一个区段内的n个样本,计算其均值M和方差s2,将样本转化为二维数据;
(3)针对样本数据集的均值和方差,进行归一化处理;
(4)针对样本数据集,选择任意三个点作为起始质心点;
(5)计算样本数据集内所有样本数据的均值和方差,确定所有样本数据的均值和方差与质心点的距离,并选择距离最短的质心点;全部样本数据计算后,根据选择的质心点,可以得到样本数据集的三个簇;
(6)对三个簇中的数据分别取均值的平均值和方差的平均值,作为新质心,重复第(5)步,直到三个质心不再变化得到最终聚类结果;
根据聚类结果识别调度自动化主站系统遥测数据异常包括:选取聚类结果中各个簇中方差最大的聚类簇的质心,作为跳变阈值设定基准,选取聚类结果中各个簇中均值最大的聚类簇的质心作为越限设定基准;剩下的一个聚类簇作为正常簇;
若电压数据或电流数据属于越限簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到越限簇质心的距离比上该均值和方差到正常簇质心的距离比小于第一设定比例,则确定电压数据或电流数据为越限的异常数据;
若电压数据或电流数据属于跳变簇,则计算电压数据或电流数据的均值和方差;计算该均值和方差到跳变簇质心的距离比上到正常簇质心的距离比小于第二设定比例,则确定电压数据或电流数据为跳变的异常数据。
CN202110920427.3A 2021-08-11 2021-08-11 调度自动化主站系统遥测数据异常识别方法和装置 Active CN113780354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110920427.3A CN113780354B (zh) 2021-08-11 2021-08-11 调度自动化主站系统遥测数据异常识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110920427.3A CN113780354B (zh) 2021-08-11 2021-08-11 调度自动化主站系统遥测数据异常识别方法和装置

Publications (2)

Publication Number Publication Date
CN113780354A CN113780354A (zh) 2021-12-10
CN113780354B true CN113780354B (zh) 2024-01-23

Family

ID=78837396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110920427.3A Active CN113780354B (zh) 2021-08-11 2021-08-11 调度自动化主站系统遥测数据异常识别方法和装置

Country Status (1)

Country Link
CN (1) CN113780354B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117031277B (zh) * 2023-09-29 2023-12-19 苏州保邦电气有限公司 一种电机运行状态智能监测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102903114A (zh) * 2012-10-09 2013-01-30 河海大学 一种基于改进型层次聚类的高光谱遥感数据降维方法
CN104392315A (zh) * 2014-11-20 2015-03-04 国家电网公司 基于电网监视系统的遥测越限报警处理方法
CN109800130A (zh) * 2019-01-31 2019-05-24 郑州云海信息技术有限公司 一种设备监控方法、装置、设备及介质
CN110321940A (zh) * 2019-06-24 2019-10-11 清华大学 飞行器遥测数据特征提取与分级分类方法及装置
CN111157850A (zh) * 2020-01-15 2020-05-15 上海电力大学 一种基于均值聚类的电网线路故障识别方法
WO2020155756A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于聚类和sse的异常点比例优化方法及装置
CN112783938A (zh) * 2020-12-30 2021-05-11 河海大学 一种水文遥测实时数据异常检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10410135B2 (en) * 2015-05-21 2019-09-10 Software Ag Usa, Inc. Systems and/or methods for dynamic anomaly detection in machine sensor data

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102903114A (zh) * 2012-10-09 2013-01-30 河海大学 一种基于改进型层次聚类的高光谱遥感数据降维方法
CN104392315A (zh) * 2014-11-20 2015-03-04 国家电网公司 基于电网监视系统的遥测越限报警处理方法
WO2020155756A1 (zh) * 2019-01-28 2020-08-06 平安科技(深圳)有限公司 基于聚类和sse的异常点比例优化方法及装置
CN109800130A (zh) * 2019-01-31 2019-05-24 郑州云海信息技术有限公司 一种设备监控方法、装置、设备及介质
CN110321940A (zh) * 2019-06-24 2019-10-11 清华大学 飞行器遥测数据特征提取与分级分类方法及装置
CN111157850A (zh) * 2020-01-15 2020-05-15 上海电力大学 一种基于均值聚类的电网线路故障识别方法
CN112783938A (zh) * 2020-12-30 2021-05-11 河海大学 一种水文遥测实时数据异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
航天器遥测数据异常检测综述;彭喜元,庞景月,彭宇,刘大同;仪器仪表学报;第37卷(第9期);第1929-1945页 *

Also Published As

Publication number Publication date
CN113780354A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN113255795B (zh) 一种基于多指标集群分析的设备状态监测方法
CN110518880B (zh) 一种光伏电站状态诊断方法及装置
CN109740648A (zh) 电力负荷异常数据识别方法、装置和计算机设备
CN110388315B (zh) 基于多源信息融合的输油泵故障识别方法、装置及系统
CN105654229A (zh) 一种电网自动化系统及设备运行状态风险评估算法
CN111639921A (zh) 一种基于专家系统的设备故障智判与辅助处置方法
CN112462696A (zh) 一种智能制造车间数字孪生模型构建方法与系统
CN113780354B (zh) 调度自动化主站系统遥测数据异常识别方法和装置
CN113850488A (zh) 基于数字孪生的多品种小批量的多资源调度系统及方法
CN111178587A (zh) 一种基于spark框架的短期电力负荷快速预测方法
KR101960755B1 (ko) 미취득 전력 데이터 생성 방법 및 장치
CN110490220A (zh) 一种母线负荷辨识方法和系统
CN116166655B (zh) 大数据清洗系统
CN116993052A (zh) 一种基于数字孪生的智慧工厂生产在线监测分析系统
CN114936590A (zh) 一种光伏电站弃光数据识别方法、装置及存储介质
CN115392663A (zh) 一种基于大数据的数据采集处理方法
CN114399407A (zh) 一种基于动静态选择集成的电力调度监控数据异常检测方法
CN111652313A (zh) 基于聚类分析的多源异构数据挖掘方法
CN117277566B (zh) 基于大数据的电网数据分析电力调度系统及方法
CN111080476A (zh) 一种基于数据中台的用户窃电行为分析预警方法
CN117579704B (zh) 基于物联网的检测数据的采集方法及其系统
CN117391458B (zh) 基于数据分析的安全生产风险检测预警方法及系统
CN117370898B (zh) 一种电子数据安全管控系统
CN113158552B (zh) 基于时间序列的生物反应器运行状况分级预测方法及系统
CN117573888A (zh) 一种基于数据中台的供电所数字化运维方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant