CN111709668A - 基于数据挖掘技术的电网设备参数风险识别方法及装置 - Google Patents

基于数据挖掘技术的电网设备参数风险识别方法及装置 Download PDF

Info

Publication number
CN111709668A
CN111709668A CN202010645077.XA CN202010645077A CN111709668A CN 111709668 A CN111709668 A CN 111709668A CN 202010645077 A CN202010645077 A CN 202010645077A CN 111709668 A CN111709668 A CN 111709668A
Authority
CN
China
Prior art keywords
power grid
data mining
grid equipment
risk
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010645077.XA
Other languages
English (en)
Inventor
田君杨
黄超
杨彦
巫聪云
刘斌
蒙亮
韩冰
何洪
李海勇
覃丙川
秦蓓
孙翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi Power Grid Co Ltd
Original Assignee
Guangxi Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Power Grid Co Ltd filed Critical Guangxi Power Grid Co Ltd
Priority to CN202010645077.XA priority Critical patent/CN111709668A/zh
Publication of CN111709668A publication Critical patent/CN111709668A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)

Abstract

本发明公开了一种基于数据挖掘技术的电网设备参数风险识别方法及装置,其中所述方法包括:通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;基于所述电网设备参数数据挖掘模型建立风险评价指标;基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。在本发明实施中,有效识别出电网模型中的设备参数的异常点,从而保证设备参数绝对正确。

Description

基于数据挖掘技术的电网设备参数风险识别方法及装置
技术领域
本发明涉及电力系统及继电保护的技术领域,尤其涉及一种基于数据挖掘技术的电网设备参数风险识别方法及装置。
背景技术
电力系统的不断发展以及计算机技术在电力系统中的应用,积累了越来越多的电网设备参数历史数据,这些丰富的历史数据背后,隐藏着许多有用的知识和信息;数据挖掘就是从大量的、不完全的、模糊的、随机的数据中,提取出隐含在其中的人们事先不知道的、但是又潜在有用的信息和知识的过程;目前数据挖掘技术已经在电力系统的发电、输电、变电、配电、用电及电力市场的领域均有了不同的研究应用。
随着计算机技术的发展,电网公司中的不同业务部门都有各自的专业分析转件,例如整定计算软件、潮流分析软件、电力系统稳定分析软件、在线校核软件;不论是哪个专业的应用软件,其本质都是面对的同一张电网,电网中的设备参数应该是唯一的;但是,现实情况是各专业软件系统中的设备参数存在着少量不一致的情况,导致设备参数不能保证绝对正确而不能保证定值计算正确。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于数据挖掘技术的电网设备参数风险识别方法及装置,有效识别出电网模型中的设备参数的异常点,从而保证设备参数绝对正确。
为了解决上述技术问题,本发明实施例提供了一种基于数据挖掘技术的电网设备参数风险识别方法,所述方法包括:
通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;
基于所述电网设备参数数据挖掘模型建立风险评价指标;
基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。
可选的,所述通过将数据库中的数据进行关联来搭建电网设备参数数据挖掘模型包括:
确定电网设备参数是否存在风险点的研究目标;
基于所述研究目标建立数据挖掘库;
对所述数据挖掘库进行数据样本的分析、和数据的聚类、和数据挖掘的分析。
可选的,所述对所述数据挖掘库进行数据样本的分析包括:分析线路参数中的字段;其中,所述线路中的字段包括:正序电阻、和/或正序单位电阻、和/或正序电抗、和/或正序单位电抗、和/或零序电阻、和/或零序单位电阻、和/或零序电抗、和/或零序单位电抗、和/或正序阻抗角、和/或零序阻抗角、和/或正序互感电抗、和/或线路长度、和/或实测正序电阻、和/或实测正序电抗、和/或实测零序电阻、和/或实测零序电抗。
可选的,所述基于所述电网设备参数数据挖掘模型建立风险评价指标包括:
基于所述电网设备参数数据挖掘模型建立风险评价指标的完整性指标;
基于所述电网设备参数数据挖掘模型建立风险评价指标的正确性指标。
可选的,所述基于所述电网设备参数数据挖掘模型建立风险评价指标的完整性指标包括:电压等级、和/或导线型号、和/或电阻、和/或电抗的设备必备参数;和/或不同电压等级下的线路的几何均距分布规律;和/或不同型号下的线路负荷电流分布。
可选的,所述基于所述电网设备参数数据挖掘模型建立风险评价指标的正确性指标包括:基准电流在同一电压等级的唯一性;和/或基于基准值换算的正确性;和/或零序电抗与正序电抗比值;和/或正序阻抗角与零序阻抗角关系。
可选的,所述基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险包括:
基于聚类分析的算法对样本数据进行聚类分析,得到聚类分析的结果;
基于线性回归的算法对电网设备参数属性进行趋势预测,得到趋势预测的结果;
基于置信区间的算法通过计算得到挖掘对象的置信区间;
基于所述聚类分析的结果、所述趋势预测的结果、以及所述挖掘对象的置信区间识别电网设备参数异常点,从而识别到电网设备参数中的风险点。
另外,本发明实施例还提供了一种基于数据挖掘技术的电网设备参数风险识别装置,其特征在于,所述装置包括:
模型搭建模块:用于通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;
指标建立模块:用于基于所述电网设备参数数据挖掘模型建立风险评价指标;
风险识别模块:用于基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。
可选的,所述模型搭建模块还包括:用于确定电网设备参数是否存在风险点的研究目标;基于所述研究目标建立数据挖掘库;对所述数据挖掘库进行数据样本的分析、和数据的聚类、和数据挖掘的分析。
可选的,所述风险识别模块还包括:用于基于聚类分析的算法对样本数据进行聚类分析,得到聚类分析的结果;基于线性回归的算法对电网设备参数属性进行趋势预测,得到趋势预测的结果;基于置信区间的算法通过计算得到挖掘对象的置信区间;基于所述聚类分析的结果、所述趋势预测的结果、以及所述挖掘对象的置信区间识别电网设备参数异常点,从而识别到电网设备参数中的风险点。
在本发明实施中,搭建电网设备参数数据挖掘模型、建立风险评估指标、并综合运用数据挖掘的算法,通过对继电保护整定计算系统中的设备参数进行挖掘,提出从不同维度和角度对设备参数进行特性分析,能有效识别出电网模型中的设备参数的异常点,进而发现电网设备参数中存在的风险;另外,该电网设备参数数据挖掘模型简单、实用,有很好的实际应用推广前景,能够较易实现对不同应用系统中电网设备参数进行风险评估,为上级调度单位对下级调度单位的数据规范性、合理性校验提供有效审查手段,能够提高整定计算系统中设备参数的正确性,对提升继电保护整定计算过程的精益化管理水平有重要作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中的基于数据挖掘技术的电网设备参数风险识别方法的流程示意图;
图2是本发明实施例中的基于数据挖掘技术的电网设备参数风险识别装置的结构组成示意图;
图3是本发明实施例中的数据挖掘分析的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一
请参阅图1,图1是本发明实施例中的基于数据挖掘技术的电网设备参数风险识别方法的流程示意图。
如图1所示,一种基于数据挖掘技术的电网设备参数风险识别方法,所述方法包括:
S11:通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;
在本发明具体实施过程中,如图3所示,所述通过将数据库中的数据进行关联来搭建电网设备参数数据挖掘模型包括:确定电网设备参数是否存在风险点的研究目标;基于所述研究目标建立数据挖掘库;对所述数据挖掘库进行数据样本的分析、和数据的聚类、和数据挖掘的分析;可选的,所述对所述数据挖掘库进行数据样本的分析包括:分析线路参数中的字段;其中,所述线路中的字段包括:正序电阻、和/或正序单位电阻、和/或正序电抗、和/或正序单位电抗、和/或零序电阻、和/或零序单位电阻、和/或零序电抗、和/或零序单位电抗、和/或正序阻抗角、和/或零序阻抗角、和/或正序互感电抗、和/或线路长度、和/或实测正序电阻、和/或实测正序电抗、和/或实测零序电阻、和/或实测零序电抗。
具体的,(1)明确研究目标:在本发明实施例中的是为了发现和识别继电保护整定计算系统中的电网设备参数是否存在风险点,为保证继电保护整定计算正确性提供必备条件;(2)建立数据挖掘库:鉴于目前大部分调度单位都采用继电保护整定计算软件来计算保护定值,因此数据挖掘的数据源可以采用整定软件中所对应的设备参数库,这些数据直接用于正常的整定计算工作,数据质量是有保障的,可作为数据挖掘的元数据;(3)分析数据样本:通过分析数据找到电网设备参数中对整定计算工作影响较大的字段;例如线路参数应重点分析的字段包括:正序电阻、正序单位电阻、正序电抗、正序单位电抗、零序电阻、零序单位电阻、零序电抗、零序单位电抗、正序阻抗角、零序阻抗角、正序互感电抗、线路长度、实测正序电阻、实测正序电抗、实测零序电阻、实测零序电抗;(4)数据聚类:在准备数据时,可以添加一些条件进行聚类分析,例如按照调度单位、电压等级、设备类型的条件;(5)数据挖掘分析:设备参数的挖掘分析主要从参数的完整性及正确性两个方面开展,并依据不同的挖掘分析维度和分析方法提取合理性、正确性检查校验规则。
S12:基于所述电网设备参数数据挖掘模型建立风险评价指标;
在本发明具体实施过程中,所述基于所述电网设备参数数据挖掘模型建立风险评价指标包括:基于所述电网设备参数数据挖掘模型建立风险评价指标的完整性指标,包括:电压等级、和/或导线型号、和/或电阻、和/或电抗的设备必备参数;和/或不同电压等级下的线路的几何均距分布规律;和/或不同型号下的线路负荷电流分布;基于所述电网设备参数数据挖掘模型建立风险评价指标的正确性指标,包括:基准电流在同一电压等级的唯一性;和/或基于基准值换算的正确性;和/或零序电抗与正序电抗比值;和/或正序阻抗角与零序阻抗角关系。
具体的,对设备参数的风险分析主要从设备参数属性的完整性和数值正确性两个方面进行研究,因此需要分别建立数据分析的完整性指标和正确项指标;(1)完整性指标:设备参数的完整性是数据有效积累的基础,同时也是继电保护定值整定计算及数据分析的基本保障,通过对设备参数的不同属性进行分析,确定设备参数完整性。其部分完整性指标如下:①电压等级、导线型号、电阻、电抗等设备必备参数是否完整;②在不同电压等级下的线路的几何均距分布规律有何不同;③在不同型号下的线路负荷电流分布有何不同;(2)正确性指标:设备参数的正确性指标可以从有名值与基准值之间的关系进行分析,部分正确性指标如下:①基准电流在同一电压等级具有唯一性:基准电流是根据基准电压和基准容量计算得到的,在全网分析中,当某一电压等级,出现两个及以上基准电流时应进行风险预警;②基于基准值换算的正确性分析:通过比较设备参数的实测有名值与通过标么值返折算为的有名值进行比较,当这两者之间存在较大差异时,需对差异较大的数据进行风险预警;③零序电抗与正序电抗比值:通过对零序电抗与正序电抗的比值进行分析,可分析出零序电抗与正序电抗的参数趋势,识别出零序电抗与正序电抗比值的异常分布情况;④正序阻抗角与零序阻抗角关系:通过对正序阻抗角与零序阻抗角的大小进行数据分析,对不满足数据平均值规律的进行告警,为基于阻抗角维度的参数置信区间预测提供数据保障。
S13:基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。
在本发明具体实施过程中,所述基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险包括:基于聚类分析的算法对样本数据进行聚类分析,得到聚类分析的结果;基于线性回归的算法对电网设备参数属性进行趋势预测,得到趋势预测的结果;基于置信区间的算法通过计算得到挖掘对象的置信区间;基于所述聚类分析的结果、所述趋势预测的结果、以及所述挖掘对象的置信区间识别电网设备参数异常点,从而识别到电网设备参数中的风险点。
具体的,在本发明实施中综合运用多种数据挖掘的算法,从数据趋势分析与数据预测的角度去发现设备参数的异常数据;首先采用聚类分析的算法,对样本数据进行聚类分析;其次采用线性回归的算法对设备参数属性进行趋势预测,采用置信区间的算法计算挖掘对象的置信区间,最后筛选出设备参数中的风险点;具体如下:
(1)聚类分析的算法:本发明实施例采用基于划分方法的聚类分析算法,即把给定的包含n个数据对象的数据库,形成K个聚类数,划分算法将数据集合划分为K份(K<n),其中,每份集合代表一个聚类,划分方法采用k-means算法;此算法的步骤如下:①初始化:确定分组的个数K,在样本空间中选择K个点,称为种子,这些种子构成初始聚类中心,它们之间应该有足够的距离用于改善算法的收敛性;一般要求选出的K个观测数据间距离的倒数大于给定阈值,而且它们的距离应该大于它们与观测数据的聚类距离;一旦形成了种子,就形成了观测数据初始划分,将观测数据分到离中心较近的组中;②转移评价:计算每个观测数据到K个聚类中心的距离,观察数据和被分配到组间中心的距离应最小;如果不是最小,观察数据就应该被分到另一个离它最近的组中,再次计算旧组和新组的聚类中心;③循环:重复步骤②,直到得到一个较为稳定的分组:为了计算观测数据和组中心的距离,k-means算法采用了欧式距离,在第t步的迭代中,第i个观测数据和第l个聚类中心的距离等于:
Figure BDA0002572732010000071
其中,i=1,2...n;l=1,2...K
式(1)中:P表示数据矩阵的维数,
Figure BDA0002572732010000072
是第t步的迭代中计算的组的聚类中心;
(2)线性回归的算法:线性回归分析法主要对设备参数的不同属性关联关系进行分析,其考虑的维度均从属性参数的本身出发,可不考虑其他因素的影响,较适用于对整个电网的设备参数进行趋势预测分析;例如通过分析线路正序电抗与长度关系(X-L),发现正序电抗的异常信息,建立“X-L”分析模型,其获取的趋势线斜率即为单位正序电抗,当线路的正序电抗值与正常趋势线偏差较大时,说明该线路的正序电抗这个参数可能会存在不精准的风险;
(3)置信区间的算法:置信区间是一种常用的区间估计方法,所谓置信区间就是指由样本统计量所构造的总体参数的估计区间,分别以统计量的置信上限和置信下限为上下界构成的区间;一个概率样本的置信区间是对这个样本的某个参数的区间估计;置信区间展现的是某个参数的真实值有多大概率落在测量结果周围的程度,其给出的是被测量参数测量值的可信程度;对于一组给定的样本数据,其平均值为μ,标准偏差为σ,则其整体数据的平均值的100(1-σ)%置信区间(μ-Zα/2σ,μ+Zα/2σ),其中α为非置信水平在正态分布内的覆盖面积,Zα/2为对应的标准分数;置信区间分析法面向单一线路属性进行趋势预测分析,确定所分析设备参数的分布特征,显著性水平通常用α表示,本文将显著性水平因子α=0.05,置信度为1-α=0.95;通过数据模型分析获取置信区间上下限值,将该上下限作为参数是否正确的判断标准,超出该范围则进行风险预警。
在本发明实施中,搭建电网设备参数数据挖掘模型、建立风险评估指标、并综合运用数据挖掘的算法,通过对继电保护整定计算系统中的设备参数进行挖掘,提出从不同维度和角度对设备参数进行特性分析,能有效识别出电网模型中的设备参数的异常点,进而发现电网设备参数中存在的风险;另外,该电网设备参数数据挖掘模型简单、实用,有很好的实际应用推广前景,能够较易实现对不同应用系统中电网设备参数进行风险评估,为上级调度单位对下级调度单位的数据规范性、合理性校验提供有效审查手段,能够提高整定计算系统中设备参数的正确性,对提升继电保护整定计算过程的精益化管理水平有重要作用。
实施例二
请参阅图2,图2是本发明实施例中的基于数据挖掘技术的电网设备参数风险识别装置的结构组成示意图。
如图2所示,一种基于数据挖掘技术的电网设备参数风险识别装置,所述装置包括:
模型搭建模块11:用于通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;
在本发明具体实施过程中,所述模型搭建模块11还包括:用于确定电网设备参数是否存在风险点的研究目标;基于所述研究目标建立数据挖掘库;对所述数据挖掘库进行数据样本的分析、和数据的聚类、和数据挖掘的分析。
指标建立模块12:用于基于所述电网设备参数数据挖掘模型建立风险评价指标;
风险识别模块13:用于基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。
在本发明具体实施过程中,所述风险识别模块13还包括:用于基于聚类分析的算法对样本数据进行聚类分析,得到聚类分析的结果;基于线性回归的算法对电网设备参数属性进行趋势预测,得到趋势预测的结果;基于置信区间的算法通过计算得到挖掘对象的置信区间;基于所述聚类分析的结果、所述趋势预测的结果、以及所述挖掘对象的置信区间识别电网设备参数异常点,从而识别到电网设备参数中的风险点。
具体地,本发明实施例的装置相关功能模块的工作原理可参见方法实施例一的相关描述,这里不再赘述。
在本发明实施中,搭建电网设备参数数据挖掘模型、建立风险评估指标、并综合运用数据挖掘的算法,通过对继电保护整定计算系统中的设备参数进行挖掘,提出从不同维度和角度对设备参数进行特性分析,能有效识别出电网模型中的设备参数的异常点,进而发现电网设备参数中存在的风险;另外,该电网设备参数数据挖掘模型简单、实用,有很好的实际应用推广前景,能够较易实现对不同应用系统中电网设备参数进行风险评估,为上级调度单位对下级调度单位的数据规范性、合理性校验提供有效审查手段,能够提高整定计算系统中设备参数的正确性,对提升继电保护整定计算过程的精益化管理水平有重要作用。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种基于数据挖掘技术的电网设备参数风险识别方法及装置进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述方法包括:
通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;
基于所述电网设备参数数据挖掘模型建立风险评价指标;
基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。
2.根据权利要求1所述的基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述通过将数据库中的数据进行关联来搭建电网设备参数数据挖掘模型包括:
确定电网设备参数是否存在风险点的研究目标;
基于所述研究目标建立数据挖掘库;
对所述数据挖掘库进行数据样本的分析、和数据的聚类、和数据挖掘的分析。
3.根据权利要求2所述的基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述对所述数据挖掘库进行数据样本的分析包括:分析线路参数中的字段;其中,所述线路中的字段包括:正序电阻、和/或正序单位电阻、和/或正序电抗、和/或正序单位电抗、和/或零序电阻、和/或零序单位电阻、和/或零序电抗、和/或零序单位电抗、和/或正序阻抗角、和/或零序阻抗角、和/或正序互感电抗、和/或线路长度、和/或实测正序电阻、和/或实测正序电抗、和/或实测零序电阻、和/或实测零序电抗。
4.根据权利要求1所述的基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述基于所述电网设备参数数据挖掘模型建立风险评价指标包括:
基于所述电网设备参数数据挖掘模型建立风险评价指标的完整性指标;
基于所述电网设备参数数据挖掘模型建立风险评价指标的正确性指标。
5.根据权利要求4所述的基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述基于所述电网设备参数数据挖掘模型建立风险评价指标的完整性指标包括:电压等级、和/或导线型号、和/或电阻、和/或电抗的设备必备参数;和/或不同电压等级下的线路的几何均距分布规律;和/或不同型号下的线路负荷电流分布。
6.根据权利要求4所述的基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述基于所述电网设备参数数据挖掘模型建立风险评价指标的正确性指标包括:基准电流在同一电压等级的唯一性;和/或基于基准值换算的正确性;和/或零序电抗与正序电抗比值;和/或正序阻抗角与零序阻抗角关系。
7.根据权利要求1所述的基于数据挖掘技术的电网设备参数风险识别方法,其特征在于,所述基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险包括:
基于聚类分析的算法对样本数据进行聚类分析,得到聚类分析的结果;
基于线性回归的算法对电网设备参数属性进行趋势预测,得到趋势预测的结果;
基于置信区间的算法通过计算得到挖掘对象的置信区间;
基于所述聚类分析的结果、所述趋势预测的结果、以及所述挖掘对象的置信区间识别电网设备参数异常点,从而识别到电网设备参数中的风险点。
8.一种基于数据挖掘技术的电网设备参数风险识别装置,其特征在于,所述装置包括:
模型搭建模块:用于通过将数据库中的数据进行关联来搭建电网备参数数据挖掘模型;
指标建立模块:用于基于所述电网设备参数数据挖掘模型建立风险评价指标;
风险识别模块:用于基于所述风险评价指标及数据挖掘的算法识别电网设备参数异常点,从而识别到电网设备参数中的风险。
9.根据权利要求8所述的基于数据挖掘技术的电网设备参数风险识别装置,其特征在于,所述模型搭建模块还包括:用于确定电网设备参数是否存在风险点的研究目标;基于所述研究目标建立数据挖掘库;对所述数据挖掘库进行数据样本的分析、和数据的聚类、和数据挖掘的分析。
10.根据权利要求8所述的基于数据挖掘技术的电网设备参数风险识别装置,其特征在于,所述风险识别模块还包括:用于基于聚类分析的算法对样本数据进行聚类分析,得到聚类分析的结果;基于线性回归的算法对电网设备参数属性进行趋势预测,得到趋势预测的结果;基于置信区间的算法通过计算得到挖掘对象的置信区间;基于所述聚类分析的结果、所述趋势预测的结果、以及所述挖掘对象的置信区间识别电网设备参数异常点,从而识别到电网设备参数中的风险点。
CN202010645077.XA 2020-07-07 2020-07-07 基于数据挖掘技术的电网设备参数风险识别方法及装置 Pending CN111709668A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010645077.XA CN111709668A (zh) 2020-07-07 2020-07-07 基于数据挖掘技术的电网设备参数风险识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010645077.XA CN111709668A (zh) 2020-07-07 2020-07-07 基于数据挖掘技术的电网设备参数风险识别方法及装置

Publications (1)

Publication Number Publication Date
CN111709668A true CN111709668A (zh) 2020-09-25

Family

ID=72545826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010645077.XA Pending CN111709668A (zh) 2020-07-07 2020-07-07 基于数据挖掘技术的电网设备参数风险识别方法及装置

Country Status (1)

Country Link
CN (1) CN111709668A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139759A (zh) * 2021-05-19 2021-07-20 杭州市电力设计院有限公司余杭分公司 一种电网数据类资产管理方法及系统
CN113377745A (zh) * 2021-07-02 2021-09-10 贵州电网有限责任公司 一种统一标准的试验数据结构体系的构建方法
CN113378978A (zh) * 2021-07-02 2021-09-10 贵州电网有限责任公司 一种基于数据挖掘的试验数据智能分析方法
CN114838756A (zh) * 2022-03-31 2022-08-02 浙江石开电力设备制造有限公司 一种智能环网柜监控系统
CN113139759B (zh) * 2021-05-19 2024-06-04 杭州市电力设计院有限公司余杭分公司 一种电网数据类资产管理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795215A (zh) * 2010-01-28 2010-08-04 哈尔滨工程大学 网络流量异常检测方法及检测装置
CN106779505A (zh) * 2017-02-28 2017-05-31 中国南方电网有限责任公司 一种基于大数据驱动的输电线路故障预警方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795215A (zh) * 2010-01-28 2010-08-04 哈尔滨工程大学 网络流量异常检测方法及检测装置
CN106779505A (zh) * 2017-02-28 2017-05-31 中国南方电网有限责任公司 一种基于大数据驱动的输电线路故障预警方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴军英等: "基于大数据的变压器设备状态及风险分析研究与应用", 《电力大数据》 *
周云霞: "基于数据流的油水井工况趋势分析方法研究", 《中国优秀硕士学位论文全文数据库-工程科技Ⅰ辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139759A (zh) * 2021-05-19 2021-07-20 杭州市电力设计院有限公司余杭分公司 一种电网数据类资产管理方法及系统
CN113139759B (zh) * 2021-05-19 2024-06-04 杭州市电力设计院有限公司余杭分公司 一种电网数据类资产管理方法及系统
CN113377745A (zh) * 2021-07-02 2021-09-10 贵州电网有限责任公司 一种统一标准的试验数据结构体系的构建方法
CN113378978A (zh) * 2021-07-02 2021-09-10 贵州电网有限责任公司 一种基于数据挖掘的试验数据智能分析方法
CN113378978B (zh) * 2021-07-02 2023-11-24 贵州电网有限责任公司 一种基于数据挖掘的试验数据智能分析方法
CN114838756A (zh) * 2022-03-31 2022-08-02 浙江石开电力设备制造有限公司 一种智能环网柜监控系统
CN114838756B (zh) * 2022-03-31 2022-10-25 浙江石开电力设备制造有限公司 一种智能环网柜监控系统

Similar Documents

Publication Publication Date Title
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN112488395A (zh) 一种配电网线损预测方法及系统
CN107679734A (zh) 一种用于无标签数据分类预测的方法和系统
CN114519514B (zh) 一种低压台区合理线损值测算方法、系统及计算机设备
CN112418687B (zh) 基于用电特征的用户用电异常识别方法、装置和存储介质
CN112712203A (zh) 一种配电网日最高负荷预测方法和系统
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN114676749A (zh) 一种基于数据挖掘的配电网运行数据异常判定方法
CN111027841A (zh) 一种基于梯度提升决策树的低压台区线损计算方法
CN117154716B (zh) 一种分布式电源接入配电网的规划方法及系统
CN114266457A (zh) 一种配电线路异损诱因检测的方法
CN114202179A (zh) 目标企业的识别方法以及装置
CN113112186A (zh) 一种企业评估方法、装置及设备
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
CN117609818A (zh) 基于聚类与信息熵的电网关联关系发现方法
CN112949735A (zh) 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法
CN110781959A (zh) 基于birch算法和随机森林算法的电力客户分群方法
CN112732773B (zh) 一种继电保护缺陷数据的唯一性校核方法及系统
CN115186138A (zh) 一种配电网数据的比对方法及终端
CN113792749A (zh) 时间序列数据异常检测方法、装置、设备及存储介质
CN117539920B (zh) 基于房产交易多维度数据的数据查询方法及系统
CN113393169B (zh) 基于大数据技术的金融行业交易系统性能指标分析方法
CN112884167B (zh) 一种基于机器学习的多指标异常检测方法及其应用系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200925