CN114265837A - 一种站端交互数据特征提取方法 - Google Patents

一种站端交互数据特征提取方法 Download PDF

Info

Publication number
CN114265837A
CN114265837A CN202111588790.6A CN202111588790A CN114265837A CN 114265837 A CN114265837 A CN 114265837A CN 202111588790 A CN202111588790 A CN 202111588790A CN 114265837 A CN114265837 A CN 114265837A
Authority
CN
China
Prior art keywords
data
fault
station
information
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111588790.6A
Other languages
English (en)
Inventor
辛锐
陈连栋
程凯
申培培
刘咸通
李刚
王新颖
辛晓鹏
赵林丛
林静
杨超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
North China Electric Power University
Information and Telecommunication Branch of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
North China Electric Power University
Information and Telecommunication Branch of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, North China Electric Power University, Information and Telecommunication Branch of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202111588790.6A priority Critical patent/CN114265837A/zh
Publication of CN114265837A publication Critical patent/CN114265837A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明提供的一种站端交互数据特征提取方法,所述提取方法包括:获取终端设备采集到的站端交互数据和故障检测系统提取到的故障数据库的历史故障信息;融合所述站端交互数据和所述历史故障信息,获得融合设备信息;预处理所述融合设备信息,获得预处理信息;对所述预处理信息进行特征识别,获得特征识别结果;根据所述特征识别结果结合特征提取规则进行特征提取,获得故障特征。实现站端交互过程中数据的快速处理,利用数据融合模型的数据处理规则,对交互数据进行整合、识别、分类,然后提取特征、筛选关键信息,再进行格式转换,最后写入数据库,保障站端交互过程中变电站侧的数据安全,也为变电站的安全防护提供技术支持。

Description

一种站端交互数据特征提取方法
技术领域
本发明涉及电力建设领域,尤其涉及一种站端交互数据特征提取方法。
背景技术
变电站是电力建设的重要一环,智能化程度直接体现出整个电力系统的智能化程度,通信系统提高了监控中心的监测效果和准确性,从而保障电力生产的安全性和集控及调度业务的高效性。变电站为故障频发场所,随着电网规模的扩大和各生产单位用电量的增加,变电站一旦发生故障,将会造成巨大的经济损失。随着变电站的发展,变电站设备越来越复杂,大量终端设备应用其中,设备在机械结构、运行原理、数据传输方式方面差异巨大,与变电站系统间信息和数据融合度、互动性差,严重影响了设备状态管控能力,进而危及变电站通,信安全,终端与变电站交互产生的数据存在多元异构性,使用数据融合和特征提取技术解决。
传统的特征识别、提取方法,例如专家系统、贝叶斯网络和粗糙集理论都被应用到电力数据处理。专家系统对于系统维护要求度较高,需要人工移植数据来维持数据库的完整性,由于知识库容错能力差,所以时常诊断错误;贝叶斯网络比较依靠先验概率,且先验概率很多时候取决于假设,导致预测效果不佳,另外它对输入数据的表达形式很敏感;粗糙集理论在电力系统故障特征信息提取中应用是个创新之举,在处理不完整数据方面有着巨大的潜力,但因算法老旧,难以与现代人工智能算法结合,故数据提取效率很难提升。
发明内容
鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种站端交互数据特征提取方法。
根据本发明的一个方面,提供了一种站端交互数据特征提取方法,所述提取方法包括:
获取终端设备采集到的站端交互数据和故障检测系统提取到的故障数据库的历史故障信息;
融合所述站端交互数据和所述历史故障信息,获得融合设备信息;
预处理所述融合设备信息,获得预处理信息;
对所述预处理信息进行特征识别,获得特征识别结果;
根据所述特征识别结果结合特征提取规则进行特征提取,获得故障特征。
可选的,所述提取方法还包括:将所述故障特征根据需求调整所述故障特征的输出格式。
可选的,所述融合所述物理设备信息和所述历史故障信息具体包括:
采用D-S理论融合,设U为所述站端交互数据和所述历史故障数据形成的集合,其中,若m:2U→[0,1]满足条件:m(Φ)=0;
Figure BDA0003429058270000021
则可认定信任函数m是对U的概率分配,若
Figure BDA0003429058270000022
时,m(A)为A的基本可信数,得出信任度的高低;
设K为特征指标间的冲突加权值,
Figure BDA0003429058270000031
当K<∞是多源数据能进行有效融合的必要条件。
可选的,所述预处理所述融合设备信息具体包括:
所述融合设备信息包括数据噪声、数据缺失、数据冗余、数据重复、数据集不均衡;
根据所述融合设备信息的问题种类采取对应的策略进行预处理,获得预处理结果;
对所述预处理结果使用
Figure BDA0003429058270000032
公式进行标准化,其中
Figure BDA0003429058270000033
为均值,sj为标准差。
可选的,所述对所述预处理信息进行特征识别具体包括:
将所述站端交互数据中存在异常的数据进行标记,获得站端交互异常数据;
将所述站端交互异常数据结合所述历史故障数据分析故障类型;
定义故障匹配度为K_f,
Figure BDA0003429058270000034
其中Fm为两类数据匹配到的特征数,F为历史故障数据总特征数,若匹配度超过0.5,直接进行特征识别,识别结果辅助故障特征提取工作。
可选的,所述根据所述特征识别结果结合特征提取规则进行特征提取具体包括:
选取能够反映故障特征的指标变量;
引入关联规则,设D为站端交互数据集,D={δ12,...,δN},其中特征子集表示为δi={λ11,...,λN},λ称为项,定义支持度为第一故障特征A和第二故障特征B同时出现在一个站端数据集中的比例,
Figure BDA0003429058270000041
其中|D|为站端交互数据集中的数据条数,f(A∪B)为同时包含所述第一故障特征A和所述第二故障特征B的数据条数;
支持度为当站端交互数据检测出故障特征时,同时相关指标参量出现超出警示值的概率,结合特征提取规则,如果数值超过50%包含特征的数据被标记,故障特征被提取出来,获得故障特征。
本发明提供的一种站端交互数据特征提取方法,所述提取方法包括:获取终端设备采集到的站端交互数据和故障检测系统提取到的故障数据库的历史故障信息;融合所述站端交互数据和所述历史故障信息,获得融合设备信息;预处理所述融合设备信息,获得预处理信息;对所述预处理信息进行特征识别,获得特征识别结果;根据所述特征识别结果结合特征提取规则进行特征提取,获得故障特征。实现站端交互过程中数据的快速处理,利用数据融合模型的数据处理规则,对交互数据进行整合、识别、分类,然后提取特征、筛选关键信息,再进行格式转换,最后写入数据库,保障站端交互过程中变电站侧的数据安全,也为变电站的安全防护提供技术支持。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种站端交互数据特征提取方法的流程图;
图2为本发明实施例提供的智能变电站多源数据融合框架图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为站端交互故障特征提取流程。
特征提取:在研究对象中,保证数据原有价值属性的前提下,采用特征提取方法,然后选择最小的属性子集,属性子集表示原有数据变量信息,然后去除不相关冗余数据或者变量,直接分析设备典型状态变量能够降低分析处理数据的难度。
数据融合条件:运用关联规则对站端交互数据进行特征提取,目的在于找出与该类数据的紧密相关的指标参量,因需要对终端设备安全接入进行控制,可使用变电站历史故障数据作为指标参量。由变电站历史故障数据可知,当某些设备状态指标参量超出警示值时,会引起相应故障的发生,历史故障数据与站端交互数据之间是能够建立联系的,对两类数据进行融合。
提取规则:通过关联规则找出站端交互数据与指标参量之间的关系,分析指标参量对站端交互数据可信度,可信度表示为站端交互数据提取到故障特征时,同时相关指标参量出现超出警示值的概率,记为
Figure BDA0003429058270000061
其中Ri表示某一个特征指标的绝对可信度。
具体流程分为以下几步:
步骤1.数据融合:将各类终端设备采集到的物理设备信息和子系统信息与故障检测系统提取到故障数据库的历史故障信息进行融合,以提高故障特征定位的准确性和可靠性。
本发明中使用D-S理论作融合,设U为站端交互数据与历史故障数据形成的集合,其中,若m:2U→[0,1]满足条件:m(Φ)=0;
Figure BDA0003429058270000062
则可认定信任函数m是对U的概率分配,若
Figure BDA0003429058270000063
时,m(A)称为A的基本可信数,由此可得出信任度的高低。设K为特征指标间的冲突加权值,
Figure BDA0003429058270000064
当K<∞是多源数据能进行有效融合的必要条件。
步骤2.数据预处理:针对数据噪声、数据缺失、数据冗余、数据重复、数据集不均衡等问题采取对应策略,再使用
Figure BDA0003429058270000065
公式再进行标准化,其中
Figure BDA0003429058270000066
为均值,sj为标准差,以减少数据质量对特征提取效果的影响。
步骤3.特征识别:将站端交互数据中存在异常的数据进行标记,并结合历史故障数据分析其故障类型。定义故障匹配度为K_f,
Figure BDA0003429058270000071
其中Fm为两类数据匹配到的特征数,F为历史故障数据总特征数,若匹配度超过0.5,可直接进行特征识别,识别结果可辅助故障特征提取工作。
步骤4.特征提取:要对站端交互数据进行准确的故障特征提取,就需要选取最具代表性且能够灵敏反映故障特征的指标变量,通过分析最具代表性的指标参量可以推断出与历史故障数据相关的故障特征。
本发明中引入关联规则,设D是所有站端交互数据集,D={δ12,...,δN},其中特征子集表示为δi={λ11,...,λN},λ称为项,现定义支持度为特征A和特征B同时出现在一个站端数据集中的比例,即
Figure BDA0003429058270000072
其中|D|表示站端交互数据集中的数据条数,f(A∪B)表示同时包含特征A和特征B的数据条数,支持度表示为当站端交互数据检测出故障特征时,同时相关指标参量出现超出警示值的概率,支持度越接近100%就表明该指标参量与相应故障的紧密程度越大,有效性越高,结合特征提取规则,若此数值超过50%则包含该特征的数据被标记,其中的故障特征也会被提取出来。
步骤5.格式调整:根据后续的功能需求调整故障特征的输出格式,若后续需要故障上报则将故障特征调整为故障检测系统要求的格式,若后续仅需故障统计,调整为XML文档格式。
图2为智能变电站多源数据融合框架。
SCADA系统作为能量管理系统EMS的一个最主要的子系统,在电力系统中的应用最为广泛,技术发展也相对成熟。具备信息完整、提高效率、正确掌握系统运行状态、加快决策、能帮助快速诊断出系统故障状态等优势,对提高电网运行的可靠性、安全性与经济效益,实现电力调度自动化与现代化,提高调度的效率和水平方面有着不可替代的作用。
智能变电站中的SCADA系统负责数据采集、控制调节、报警处理、事故追忆等重要功能,掌握了变电站大量数据,所以变电站大部分业务操作必须调用SCADA数据。
SCADA数据获取方式:SCADA系统使用过正、反隔离装置连接Web服务器,为了保证两系统间的安全性,与外界系统之间设立信息防火墙。系统将SVG和CIM/XML模型通过转发,实时数据通过E文件转发的方式,从而获取SCADA数据。
终端设备采集到的数据特性分析
伴随着变电站的升级与智能设备运行时间提高,数据规模大幅增长,且数据的类型多种多样,由于终端的采集频率、采集内容以及采集周期各不相同,在不同时间尺度等级上所表现的数据内容有所差异。建立统一的大数据平台,实现数据的分布式存储、分析、处理以及变电站系统内部各类数据的共享,图1中的系统数据库集群。
智能变电站多源数据融合
变电站系统数据库集群中有来自不同子系统、不同类型的多源数据,对于这些数据辨识成为了融合的关键。利用模式识别技术,结合并行处理方法,对系统数据库集群进行分类梳理,并对系统所需的数据进行特征提取,实现关键信息筛选。将特征提取后的数据,进行数据转换,重新写入数据库集群,减轻数据库集群后台工作量。
基于数据融合技术,考虑到单一数据特征提取较为片面的缺点,对其进行弥补以获得精准故障特征提取与融合为目标。获得了多种故障特征指标后,需要确定每种指标的参考权重,进而有效的数据融合。确定权重的过程不仅基于客观事实,还应根据变电站运行情况进行主观上的调整和适应。
对于变电站的多源数据,其特征信息提取流程包括:(1)将不同数据系统的故障信号、故障信息进行梳理和采集:其中数据采集与监视控制系统中的实际信息表现为开关量,保护动作以及开关状态也是重要的开关量信息形式,电流信息以及电压信息则是电气量的具体表现。
(2)故障信息数据的分析:使用约简函数,对于开关量信息进行初步处理,同时使用聚类算法来进行辅助挖掘,对于电气量变化使用小波变换方法进行细致的分析与计算。
(3)多源故障特征指标的获取:在获取不同的故障特征指标过程中,需要引入不确定度分析,最终得出不同来源的指标。
(4)特征融合与故障决策:将证据融合理论作为基础进行数据的统一优化与融合。使用聚类决策模型,对故障候选集进行获取,最终结果将存入图2中的变电站故障检测系统。
有益效果:高效的数据处理方式,数据处理的时间越短,终端与变电站的交互越快,攻击难度越大,能够有效降低智能终端被攻击的概率以及变电站被入侵的概率。
本发明通过分析站端交互流程及数据特征,提出一种基于多源量测数据融合及特征提取技术,实现站端交互过程中数据的快速处理,该方法利用数据融合模型的数据处理规则,对交互数据进行整合、识别、分类,然后提取特征、筛选关键信息,再进行格式转换,最后写入数据库,保障站端交互过程中变电站侧的数据安全,也为变电站的安全防护提供技术支持。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种站端交互数据特征提取方法,其特征在于,所述提取方法包括:
获取终端设备采集到的站端交互数据和故障检测系统提取到的故障数据库的历史故障信息;
融合所述站端交互数据和所述历史故障信息,获得融合设备信息;
预处理所述融合设备信息,获得预处理信息;
对所述预处理信息进行特征识别,获得特征识别结果;
根据所述特征识别结果结合特征提取规则进行特征提取,获得故障特征。
2.根据权利要求1所述的一种站端交互数据特征提取方法,其特征在于,所述提取方法还包括:将所述故障特征根据需求调整所述故障特征的输出格式。
3.根据权利要求1所述的一种站端交互数据特征提取方法,其特征在于,所述融合所述物理设备信息和所述历史故障信息具体包括:
采用D-S理论融合,设U为所述站端交互数据和所述历史故障数据形成的集合,其中,若m:2U→[0,1]满足条件:m(Φ)=0;
Figure FDA0003429058260000011
则可认定信任函数m是对U的概率分配,若
Figure FDA0003429058260000012
时,m(A)为A的基本可信数,得出信任度的高低;
设K为特征指标间的冲突加权值,
Figure FDA0003429058260000013
当K<∞是多源数据能进行有效融合的必要条件。
4.根据权利要求1所述的一种站端交互数据特征提取方法,其特征在于,所述预处理所述融合设备信息具体包括:
所述融合设备信息包括数据噪声、数据缺失、数据冗余、数据重复、数据集不均衡;
根据所述融合设备信息的问题种类采取对应的策略进行预处理,获得预处理结果;
对所述预处理结果使用
Figure FDA0003429058260000021
公式进行标准化,其中
Figure FDA0003429058260000022
为均值,sj为标准差。
5.根据权利要求1所述的一种站端交互数据特征提取方法,其特征在于,所述对所述预处理信息进行特征识别具体包括:
将所述站端交互数据中存在异常的数据进行标记,获得站端交互异常数据;
将所述站端交互异常数据结合所述历史故障数据分析故障类型;
定义故障匹配度为K_f,
Figure FDA0003429058260000023
其中Fm为两类数据匹配到的特征数,F为历史故障数据总特征数,若匹配度超过0.5,直接进行特征识别,识别结果辅助故障特征提取工作。
6.根据权利要求1所述的一种站端交互数据特征提取方法,其特征在于,所述根据所述特征识别结果结合特征提取规则进行特征提取具体包括:
选取能够反映故障特征的指标变量;
引入关联规则,设D为站端交互数据集,D={δ12,...,δN},其中特征子集表示为δi={λ11,...,λN},λ称为项,定义支持度为第一故障特征A和第二故障特征B同时出现在一个站端数据集中的比例,
Figure FDA0003429058260000024
其中|D|为站端交互数据集中的数据条数,f(A∪B)为同时包含所述第一故障特征A和所述第二故障特征B的数据条数;
支持度为当站端交互数据检测出故障特征时,同时相关指标参量出现超出警示值的概率,结合特征提取规则,如果数值超过50%包含特征的数据被标记,故障特征被提取出来,获得故障特征。
CN202111588790.6A 2021-12-23 2021-12-23 一种站端交互数据特征提取方法 Pending CN114265837A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111588790.6A CN114265837A (zh) 2021-12-23 2021-12-23 一种站端交互数据特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111588790.6A CN114265837A (zh) 2021-12-23 2021-12-23 一种站端交互数据特征提取方法

Publications (1)

Publication Number Publication Date
CN114265837A true CN114265837A (zh) 2022-04-01

Family

ID=80829116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111588790.6A Pending CN114265837A (zh) 2021-12-23 2021-12-23 一种站端交互数据特征提取方法

Country Status (1)

Country Link
CN (1) CN114265837A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522382A (zh) * 2023-11-28 2024-02-06 江苏圣创半导体科技有限公司 一种自动售卖机故障预警方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522382A (zh) * 2023-11-28 2024-02-06 江苏圣创半导体科技有限公司 一种自动售卖机故障预警方法及系统
CN117522382B (zh) * 2023-11-28 2024-07-12 江苏圣创半导体科技有限公司 一种自动售卖机故障预警方法及系统

Similar Documents

Publication Publication Date Title
CN109146093B (zh) 一种基于学习的电力设备现场勘查方法
CN112611936B (zh) 一种基于边缘计算的配网变压器故障动态检测与分类系统
CN110336375B (zh) 一种电网监控告警信息的处理方法及系统
CN110807550B (zh) 基于神经网络的配变重过载识别预警方法及终端设备
CN111639921B (zh) 一种基于专家系统的设备故障智判与辅助处置方法
CN116187593B (zh) 一种配电网故障预测处理方法、装置、设备、存储介质
CN116614177B (zh) 一种光纤状态多维度参量监测系统
CN108596450B (zh) 电网风险预警方法和系统
CN118411154B (zh) 一种配电设备安全状态评估方法及系统
CN118395358B (zh) 一种变电站智能防误拓扑分析方法
Andrade et al. Data-driven anomaly detection and event log profiling of SCADA alarms
CN117251810A (zh) 基于数字孪生平台的变电站设备状态评估预警系统及方法
CN118313812A (zh) 一种基于机器学习的电力大数据采集处理方法
CN116468426A (zh) 基于Apriori算法的电网故障确定方法及存储介质
CN111736636A (zh) 一种基于知识图谱的水淹水车室预警方法及系统
CN114265837A (zh) 一种站端交互数据特征提取方法
CN114676791A (zh) 一种基于模糊证据推理的电力系统告警信息处理方法
CN117745057A (zh) 一种基于图神经网络的调度自动化系统安全风险评估方法
CN114399177B (zh) 一种基于Apriori的调度处置规则挖掘与生成方法及系统
CN113726007B (zh) 一种基于透明体系架构的智能录波器主站管理方法及系统
CN114626440A (zh) 一种监控信号的对象化分析方法及装置
Jingyu et al. Statistical analysis of distribution network fault information based on multi-source heterogeneous data mining
Zhang et al. [Retracted] Substation Operation Information Maintenance Based on Intelligent Data Mining
CN114742431A (zh) 一种基于调控管理规程和规则库的电网事件识别方法
CN117933909A (zh) 一种分布式云边协同任务管理系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination