CN112990776B - 一种配网设备健康度评价方法 - Google Patents

一种配网设备健康度评价方法 Download PDF

Info

Publication number
CN112990776B
CN112990776B CN202110450818.3A CN202110450818A CN112990776B CN 112990776 B CN112990776 B CN 112990776B CN 202110450818 A CN202110450818 A CN 202110450818A CN 112990776 B CN112990776 B CN 112990776B
Authority
CN
China
Prior art keywords
feature
evaluation
order
optimal
sample set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110450818.3A
Other languages
English (en)
Other versions
CN112990776A (zh
Inventor
陈冰心
郑风雷
万四维
苏华锋
李兆伟
徐卫东
陈世昌
廖肇毅
李顺尧
彭俊坚
陈果华
李靖
何俊达
张新忠
黄志威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN202110450818.3A priority Critical patent/CN112990776B/zh
Publication of CN112990776A publication Critical patent/CN112990776A/zh
Application granted granted Critical
Publication of CN112990776B publication Critical patent/CN112990776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)

Abstract

本发明公开了一种配网设备健康度评价方法,包括以下步骤:获取配网设备的运行日志,并基于运行日志提取评价特征样本集;基于评价特征样本集进行特征寻优,获得评价最优特征样本集,基于评价最优特征样本集建立健康度评价模型;对健康度评价模型进行评估优化,获得最优健康度评价模型,将最优健康度评价模型接入配网设备的实时运行数据输出端进行健康度实时评价。本发明能够将配网设备进行相似度划分成多个健康度社团,快速地对所有配网设备进行健康度评价,从而符合同类设备的统计分布规律,具有较高的精度,同时仅需一次模型计算即能够满足要求,提高了运算效率。

Description

一种配网设备健康度评价方法
技术领域
本发明涉及电网管理技术领域,具体涉及一种配网设备健康度评价方法。
背景技术
配电网设备是向用户供电的最终环节,在电网中起着重要作用,因而配电网络的安全稳定就显得特别重要。随着经济发展和城市化进程,我国配电网的规模也变得越来越大,用户们对于供电的可靠性要求也越来越严格。相比于高压电网,配电网设备电压等级低、设备数量多、网架结构复杂、在线监测设备不完善。所以配电网设备的状态可以根据设备的历史运行数据、历史试验报告以及巡检记录等建立评价模型来进行评估。
目前国家电网公司已经制定了配网设备评价标准,然而这些模型的判据通常都只能是与某一固定阈值或固定比例的阈值相比较。因为配网中的被评估设备绝大多数是状态良好的,如果套用固定的模型标准,可能会出现长时间(数十年)内所有设备评估结果都在规定阈值之内,无设备可检修;然后随着设备成批老化,突然大量设备的评估结果都在几年内超出规定阈值,导致短期内检修工作量急剧增大,设备检修工作无法正常开展。而配网设备数量庞大,其状态的诊断判据应是与同类设备的统计分布规律相比较(横向比较),或是与设备自身的历史数据分布规律相比较(纵向比较),而非单纯利用现有技术中的分类模型进行健康度非此即彼的评价,仅仅将配网设备判别为健康和亚健康两种形式,而且对每个配网设备均需要运用依次分类模型进行单独评价,最终导致配网设备检修评价工作量大,评价结果精度低。
发明内容
本发明的目的在于提供一种配网设备健康度评价方法,以解决现有技术中配网设备检修评价工作量大,评价结果精度低的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种配网设备健康度评价方法,包括以下步骤:
步骤S1、获取配网设备的运行日志,并基于所述运行日志提取评价特征样本集;
步骤S2、基于评价特征样本集进行特征寻优,获得评价最优特征样本集,基于所述评价最优特征样本集建立用于评估配网设备健康度的健康度评价模型;
步骤S3、对所述健康度评价模型进行评估优化,获得最优健康度评价模型,将所述最优健康度评价模型接入配网设备的实时运行数据输出端进行健康度实时评价。
可选地,所述获取配网设备的运行日志中,所述运行日志为所述配网设备的历史运行数据集合;
所述基于所述运行日志提取评价特征样本集,包括:
步骤S101、在运行日志中随机抽取与配网设备相同数量的运行健康数据作为正样本,将运行亚健康数据作为负样本,混合所述正样本和负样本,构成运行样本集;
步骤S102、对所述运行样本集进行特征量化,获得第一单阶特征;利用相关性分析所述第一单阶特征以实现特征降维,获得第二单阶特征;
步骤S103、基于所述运行样本集获取所述第二单阶特征的特征值,与所述第二单阶特征建立新映射,获得所述评价特征样本集。
可选地,所述步骤S102中,所述利用相关性分析所述第一单阶特征以实现特征降维,包括:
依次将所述第一单阶特征中所有的特征进行两两配对组合,获得双特征对,将所述双特征对的特征值带入相关性计算公式,获得双特征对的相关性系数;
遍历选取相关性系数高于相关性阈值的第一双特征对,在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
汇总所有双特征对进行配对拆分获得的第一单阶特征,构成第二单阶特征;
所述相关性计算公式为:
Figure 726875DEST_PATH_IMAGE001
其中,X为第一单阶特征,
Figure 649831DEST_PATH_IMAGE002
Figure 897273DEST_PATH_IMAGE003
为第一单阶特征中的第i,j个特征的特征值,
Figure 967997DEST_PATH_IMAGE004
Figure 959087DEST_PATH_IMAGE002
Figure 798867DEST_PATH_IMAGE003
的联合概率分布函数,而
Figure 217210DEST_PATH_IMAGE005
Figure 447334DEST_PATH_IMAGE006
分别是
Figure 304432DEST_PATH_IMAGE007
Figure 936402DEST_PATH_IMAGE003
的边缘 概率分布函数。
可选地,所述步骤S2中,所述基于评价特征样本集进行特征寻优,获得评价最优特征样本集,包括:
步骤S201、利用笛卡尔积将所述第二单阶特征进行编码融合,获得第一多阶特征,基于所述第一多阶特征对所述评价特征样本集进行映射更新,获得第二评价特征样本集;
步骤S202、基于所述第二评价特征样本集,并利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,基于所述最优多阶特征对所述第二评价特征样本集进行映射更新,获得评价最优特征样本集。
可选地,所述步骤S201中,利用笛卡尔积将所述第二单阶特征进行编码融合,获得第一多阶特征,包括:
对所述第二单阶特征分别进行矩阵编码,获得第二单阶特征矩阵,基于矩阵相乘公式进行编码融合,获得第一多阶特征矩阵;
将所述第二单阶特征的特征值代入第一多阶特征矩阵运算,获得第二评价特征样本集矩阵;
将所述第一多阶特征矩阵和第二评价特征样本集矩阵反矩阵解码获得第一多阶特征和第二评价特征样本集;
所述矩阵相乘公式为:
Figure 522716DEST_PATH_IMAGE008
其中,
Figure 568033DEST_PATH_IMAGE009
为第二单阶特征矩阵,T为转置运算符。
可选地,所述步骤S202中,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方式为:
利用第二评价特征样本集中各个正样本间的欧式距离,基于正样本内度的计算公式计算正样本内度;
利用第二评价特征样本集中各个正样本与各个负样本的欧氏距离,基于正样本外度的计算公式计算正样本外度;
利用免疫算法将所述正样本内度和所述正样本外度联合作为目标函数,建立最优多阶特征搜索模型;
所述正样本内度的计算公式为:
Figure 963242DEST_PATH_IMAGE010
所述正样本外度的计算公式为:
Figure 512035DEST_PATH_IMAGE011
其中,
Figure 537760DEST_PATH_IMAGE012
Figure 804793DEST_PATH_IMAGE013
分别为单个正样本,
Figure 3693DEST_PATH_IMAGE014
为单个负样本,M为正样本总数或负样本总 数,T为转置运算符。
可选地,所述利用免疫算法将所述正样本内度和所述正样本外度联合作为目标函数,包括:
对所述正样本内度利用最小化修正,得到:
Figure 282359DEST_PATH_IMAGE015
将最小化修正后的正样本内度
Figure 478985DEST_PATH_IMAGE016
和正样本外度
Figure 233314DEST_PATH_IMAGE017
联合,生成具有多目标搜索 特性的目标函数为:
Figure 970326DEST_PATH_IMAGE018
可选地,所述最优多阶特征搜索模型的搜索结果包括:由多个第一多阶特征构成的Pareto最优解集;
所述步骤S2中,所述基于评价特征样本集进行特征寻优,获得评价最优特征样本集,还包括:
利用爬山算法对Pareto解集实现局部优化;
所述利用爬山算法对Pareto解集实现局部优化,包括:
步骤S203、构建局部优化函数
Figure 493711DEST_PATH_IMAGE019
步骤S204、计算所述Pareto解集中所有第一多阶特征的局部优化函数值
Figure 861239DEST_PATH_IMAGE020
,利用 基于邻节点标识法更新第一多阶特征,并重新计算更新后第一多阶特征的局部优化函数值
Figure 837285DEST_PATH_IMAGE021
步骤S205、比较
Figure 315671DEST_PATH_IMAGE022
Figure 959142DEST_PATH_IMAGE023
Figure 294308DEST_PATH_IMAGE024
,则保留Pareto解集中的第一多阶特征;
Figure 23230DEST_PATH_IMAGE025
,则更新Pareto解集中的第一多阶特征;
步骤S206、重复步骤S203到步骤S205,直至完成对所述Pareto解集中所有多阶特征的更新,获得包含最优多阶特征的Pareto最优解集。
可选地,所述步骤S2中,所述基于所述评价最优特征样本集建立健康度评价模型,包括:
基于所述第二评价特征样本集获取所述最优多阶特征的特征值,将所述第二评价特征样本集与最优多阶特征建立新映射,获得评价最优特征样本集;
在所述评价最优特征样本集中依次随机抽取50%、30%和20%的数据,分别汇总作为训练集、测试集和验证集;
将所述训练集、测试集和验证集运用在多种机器学习聚类算法上,建模获得多组健康度评价模型,在多组健康度评价模型选择出最优健康度评价模型。
可选地,所述对所述健康度评价模型进行评估优化,获得最优健康度评价模型,包括:
基于聚类评价指标选取最优健康度评价模型,所述聚类评价指标包括模块度密度和互信息;
所述基于聚类评价指标选取最优健康度评价模型,包括:
绘制多组健康度评价模型的模块度密度曲线和互信息曲线;
依次比较多组模块度密度曲线和互信息曲线的数值,并选取模块度密度和互信息曲线顶点最大值对应的健康度评价模型作为最优健康度评价模型。
本发明与现有技术相比较具有如下有益效果:
本发明基于评价特征样本集进行特征寻优,获得评价最优特征样本集,并基于所述评价最优特征样本集建立健康度评价模型,从而能够将配网设备进行相似度划分成多个健康度社团,快速地对所有配网设备进行健康度评价,从而符合同类设备的统计分布规律,具有较高的精度,同时仅需一次模型计算即能够满足要求,提高了运算效率。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明提供的一种配网设备健康度评价方法的方法流程图;
图2为本发明提供的一种配网设备健康度评价方法中最优多阶特征生成流程图;
图3为本发明提供的一种配网设备健康度评价方法中健康度评价模型聚类结果结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-2所示,本发明提供了一种配网设备健康度评价方法,包括以下步骤:
步骤S1、获取配网设备的运行日志,并基于所述运行日志提取评价特征样本集;
步骤S2、基于评价特征样本集进行特征寻优,获得评价最优特征样本集,基于所述评价最优特征样本集建立用于评估配网设备健康度的健康度评价模型;
步骤S3、对所述健康度评价模型进行评估优化,获得最优健康度评价模型,将所述最优健康度评价模型接入配网设备的实时运行数据输出端进行健康度实时评价。
具体地,步骤S1中,运行日志为配网设备的历史运行数据集合,提取评价特征样本集的具体方式为:
步骤S101、在运行日志中随机抽取与配网设备相同数量的运行健康数据作为正样本,将运行亚健康数据作为负样本,混合正样本和负样本,构成运行样本集;
步骤S102、对运行样本集进行特征量化,获得第一单阶特征;利用相关性分析第一单阶特征以实现特征降维,获得第二单阶特征;
步骤S103、基于运行样本集获取第二单阶特征的特征值,与第二单阶特征建立新映射,获得评价特征样本集。
可以理解的是,运行健康数据和运行亚健康数据种类相一致,包括但不仅限于负荷转供能力、综合电压合格率、谐波合格率、供电可靠率、综合线损率、同层设备间负载率均衡度、不同层设备间负载率协调度、经济载荷供电距离合格率和分布式能源消纳能力,运行样本集中包括50%的健康设备和50%的亚健康设备以保证样本的均衡性,在实际使用中也可根据实景进行调整。
其中,步骤S102中,相关性分析实现特征降维的具体方式为:
依次将第一单阶特征中所有的特征进行两两配对组合,获得双特征对,将双特征对的特征值带入相关性计算公式,获得双特征对的相关性系数;
遍历选取相关性系数高于相关性阈值的第一双特征对,在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
汇总所有双特征对进行配对拆分获得的第一单阶特征,构成第二单阶特征;
具体地,所述相关性计算公式为:
Figure 102044DEST_PATH_IMAGE001
其中,X为第一单阶特征,
Figure 537705DEST_PATH_IMAGE002
Figure 43773DEST_PATH_IMAGE003
为第一单阶特征中的第i,j个特征的特征值,
Figure 259990DEST_PATH_IMAGE004
Figure 142496DEST_PATH_IMAGE002
Figure 494980DEST_PATH_IMAGE003
的联合概率分布函数,而
Figure 437528DEST_PATH_IMAGE005
Figure 810216DEST_PATH_IMAGE006
分别是
Figure 230833DEST_PATH_IMAGE007
Figure 703402DEST_PATH_IMAGE003
的边缘 概率分布函数。
可以理解的是,相关性系数是指两个特征的相似程度,利用相关性系数量化第一单阶特征间的相似程度,而后将第一单阶特征间相似程度高的多个特征仅用一个特征进行表征即可,实现特征降维的同时避免删除有效特征。
步骤S2中,特征寻优为基于多目标搜索策略和特征多阶融合相结合的寻找建立健康度评价模型最优特征的优化过程,基于评价特征样本集进行特征寻优获得评价最优特征样本集的具体方式:
步骤S201、利用笛卡尔积将第二单阶特征进行编码融合,获得第一多阶特征,基于第一多阶特征对评价特征样本集进行映射更新,获得第二评价特征样本集;
步骤S202、基于第二评价特征样本集,并利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,基于最优多阶特征对第二评价特征样本集进行映射更新,获得第二评价特征样本集。
具体地,步骤S201中,第二单阶特征进行编码融合获得第一多阶特征的具体方式为:
对第二单阶特征分别进行矩阵编码,获得第二单阶特征矩阵,基于矩阵相乘公式进行编码融合,获得第一多阶特征矩阵;
将第二单阶特征的特征值代入第一多阶特征矩阵运算,获得第二评价特征样本集矩阵;
将第一多阶特征矩阵和第二评价特征样本集矩阵反矩阵解码获得第一多阶特征和第二评价特征样本集;
矩阵相乘公式为:
Figure 551273DEST_PATH_IMAGE008
其中,
Figure 414187DEST_PATH_IMAGE009
为第二单阶特征矩阵,T为转置运算符;
可以理解的是,将单阶特征利用笛卡尔积方式融合形成多阶特征,可将单阶特征之间的区分属性进行增强,从而基于多阶特征建立的健康度评价模型的区分能力得以增强,则可提高健康度评价的精度。
步骤S202中,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方式为:
利用第二评价特征样本集中各个正样本与各个负样本的欧氏距离,基于正样本外度的计算公式计算正样本外度;
利用免疫算法将正样本内度和正样本外度联合作为目标函数,建立最优多阶特征搜索模型;
所述正样本内度的计算公式为:
Figure 638494DEST_PATH_IMAGE010
所述正样本外度的计算公式为:
Figure 965571DEST_PATH_IMAGE011
其中,
Figure 249921DEST_PATH_IMAGE012
Figure 662448DEST_PATH_IMAGE013
分别为单个正样本,
Figure 424868DEST_PATH_IMAGE014
为单个负样本,M为正样本总数或负样本总 数,T为转置运算符。
本实施例中,正样本内度利用最小化修正生成具有多目标搜索特性的目标函数,具体方式为:
对正样本内度利用最小化修正,得到:
Figure 544134DEST_PATH_IMAGE015
将最小化修正后的正样本内度
Figure 999386DEST_PATH_IMAGE026
和正样本外度
Figure 836892DEST_PATH_IMAGE027
联合,生成具有多目标搜索 特性的目标函数为:
Figure 403002DEST_PATH_IMAGE028
Q1越大,正样本内度越大,即正样本间连接关系越为密切,利用多阶特征进行预测待评价的配网设备与正样本的相似度越高,但正样本规模普遍较小;Q2越小,正样本外度越小,即正样本和负样本连接关系越为稀疏,利用多阶组合特征进行预测待评价的配网设备与正样本的相似度越低,但正样本规模普遍较大。
由于Q1和Q2相互冲突互补,这两个冲突互补的项体现了健康度相似度划分的两个方面,需要在二者之间权衡,取一个折衷点。
因此可将Q1和Q2是递增函数,换言之,
Figure 439091DEST_PATH_IMAGE029
为一常数,Q3和Q2是两个互相冲突的目 标函数,同时最小化Q3和Q2可以保证正样本内连接紧密而正样本间连接稀疏,因此利用Q3 和Q2作为多目标搜索策略的目标函数可获得区分正、负样本的最优多阶特征,即为建立健 康度评价模型获得最佳区分属性的最优多阶特征。
本实施例中,最优多阶特征搜索模型搜索结果为由多个第一多阶特征构成的Pareto最优解集,因此步骤S2中还包括利用爬山算法对Pareto解集实现局部优化,具体方式为:
步骤S203、构建局部优化函数
Figure 65245DEST_PATH_IMAGE030
步骤S204、计算所述Pareto解集中所有第一多阶特征的局部优化函数值
Figure 452364DEST_PATH_IMAGE020
,利用 基于邻节点标识法更新第一多阶特征,并重新计算更新后第一多阶特征的局部优化函数值
Figure 494269DEST_PATH_IMAGE031
步骤S205、比较
Figure 650444DEST_PATH_IMAGE020
Figure 447499DEST_PATH_IMAGE032
Figure 56335DEST_PATH_IMAGE033
,则保留Pareto解集中的第一多阶特征;
Figure 229827DEST_PATH_IMAGE034
,则更新Pareto解集中的第一多阶特征;
步骤S206、重复步骤S203到步骤S205,直至完成对所述Pareto解集中所有第一多阶特征的更新,获得包含多个作为最优多阶特征的第一多阶特征的Pareto最优解集。
可以理解的是,遗传算法为全局搜索(广域搜索)是进行大面积的搜索,容易陷入局部最优过早;因此,致力于找到更精确的解,为了提高算法的收敛速度,且避免算法陷入局部最优过早,利用爬山算法可获得更精确的最优多阶特征。
步骤S2中,基于评价最优特征样本集建立健康度评价模型的具体方法为:
基于第二评价特征样本集获取最优多阶特征的特征值,将第二评价特征样本集与最优多阶特征建立新映射,获得评价最优特征样本集;
在评价最优特征样本集中依次随机抽取50%、30%和20%的数据,分别汇总作为训练集、测试集和验证集;
将训练集、测试集和验证集运用在多种机器学习聚类算法上,建模获得多组健康度评价模型,在多组健康度评价模型选择出最优健康度评价模型。
如图3所示,利用聚类算法建立健康度评价模型,可以将多个配网设备进行聚类社团划分,从而可将配网设备划分成多组由健康度相似配网设备构成的社团簇,社团簇中的配网设备具有一致的健康度,从而进行统一检修维护,符合配网设备横向分布规律,划分合理度和精度高,避免大数据量的配网设备逐一进行健康度评价、分类以及检修而造成的计算、检修资源的大量占用。
可以理解的是,社团簇即为健康度的体现,比如社团簇为5个,则健康度分别为良好,一般,可疑,异常,危险,不仅限于分为良好和危险两种类型,从而可按健康度进行针对性检修,避免造成配网中的被评估设备绝大多数是状态良好的,如果套用固定的模型标准,可能会出现长时间(数十年)内所有设备评估结果都在规定阈值之内,无设备可检修;然后随着设备成批老化,突然大量设备的评估结果都在几年内超出规定阈值,导致短期内检修工作量急剧增大,设备检修工作无法正常开展。
本实施例中,基于聚类评价指标选取最优健康度评价模型,聚类评价指标包括模块度密度和互信息,具体方式为:
绘制多组健康度评价模型的模块度密度曲线和互信息曲线;
依次比较多组模块度密度曲线和互信息曲线的数值,并选取模块度密度和互信息曲线顶点最大值对应的健康度评价模型作为最优健康度评价模型。
其中,模块度密度的具体计算公式为
Figure 178191DEST_PATH_IMAGE035
,互信息的具体计算公 式为:
Figure 146147DEST_PATH_IMAGE036
,Y为正样本
Figure 242279DEST_PATH_IMAGE037
的真实划分。
D值越大,最优健康度评价模型划分的社团簇之间的紧密度越高,即相似度越高,从而划分在一个社团簇中的配网设备具有一致的健康度。
MNI越大,最优健康度评价模型划分的社团簇中配网设备的健康度与真实的健康度的相似程度越高,则最优健康度评价模型的评价准确性越高。
因此将D和MNI作为最优健康度评价模型的聚类评价指标进行健康度评价模型评估。
本发明利用多目标优化策略和特征融合策略选取区分配网设备健康度的最优评价特征,并基于最优评价特征建立用于配网设备健康度评价的聚类模型,可将配网设备进行相似度划分成多个健康度社团,快速将所有配网设备进行健康度评价,符合同类设备的统计分布规律,具有较高的精度,同时仅需一次模型计算,提高了运算效率。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (6)

1.一种配网设备健康度评价方法,其特征在于,包括以下步骤:
步骤S1、获取配网设备的运行日志,并基于所述运行日志提取评价特征样本集;
步骤S2、基于评价特征样本集进行特征寻优,获得评价最优特征样本集,基于所述评价最优特征样本集建立用于评估配网设备健康度的健康度评价模型;
步骤S3、对所述健康度评价模型进行评估优化,获得最优健康度评价模型,将所述最优健康度评价模型接入配网设备的实时运行数据输出端进行健康度实时评价;
所述获取配网设备的运行日志中,所述运行日志为所述配网设备的历史运行数据集合;
所述基于所述运行日志提取评价特征样本集,包括:
步骤S101、在运行日志中随机抽取与配网设备相同数量的运行健康数据作为正样本,将运行亚健康数据作为负样本,混合所述正样本和负样本,构成运行样本集;
步骤S102、对所述运行样本集进行特征量化,获得第一单阶特征;利用相关性分析所述第一单阶特征以实现特征降维,获得第二单阶特征;
步骤S103、基于所述运行样本集获取所述第二单阶特征的特征值,与所述第二单阶特征建立新映射,获得所述评价特征样本集;
所述步骤S2中,所述基于评价特征样本集进行特征寻优,获得评价最优特征样本集,包括:
步骤S201、利用笛卡尔积将所述第二单阶特征进行编码融合,获得第一多阶特征,基于所述第一多阶特征对所述评价特征样本集进行映射更新,获得第二评价特征样本集;
步骤S202、基于所述第二评价特征样本集,并利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,基于所述最优多阶特征对所述第二评价特征样本集进行映射更新,获得评价最优特征样本集;
所述步骤S202中,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方式为:
利用第二评价特征样本集中各个正样本间的欧式距离,基于正样本内度的计算公式计算正样本内度;
利用第二评价特征样本集中各个正样本与各个负样本的欧氏距离,基于正样本外度的计算公式计算正样本外度;
利用免疫算法将所述正样本内度和所述正样本外度联合作为目标函数,建立最优多阶特征搜索模型;
所述正样本内度的计算公式为:
Figure 950340DEST_PATH_IMAGE001
所述正样本外度的计算公式为:
Figure 772802DEST_PATH_IMAGE002
其中,
Figure 39836DEST_PATH_IMAGE003
Figure 425686DEST_PATH_IMAGE004
分别为单个正样本,
Figure 94565DEST_PATH_IMAGE005
为单个负样本,M为正样本总数或负样本总数,T 为转置运算符;
所述最优多阶特征搜索模型的搜索结果包括:由多个第一多阶特征构成的Pareto最优解集;
所述步骤S2中,所述基于评价特征样本集进行特征寻优,获得评价最优特征样本集,还包括:
利用爬山算法对Pareto解集实现局部优化;
所述利用爬山算法对Pareto解集实现局部优化,包括:
步骤S203、构建局部优化函数
Figure 87929DEST_PATH_IMAGE006
;Q3为最小化修正后的正样本内度;
步骤S204、计算所述Pareto解集中所有第一多阶特征的局部优化函数值
Figure 842258DEST_PATH_IMAGE007
,利用基于 邻节点标识法更新第一多阶特征,并重新计算更新后第一多阶特征的局部优化函数值
Figure 202439DEST_PATH_IMAGE008
步骤S205、比较
Figure 725824DEST_PATH_IMAGE007
Figure 155669DEST_PATH_IMAGE009
Figure 334977DEST_PATH_IMAGE010
,则保留Pareto解集中的第一多阶特征;
Figure 610101DEST_PATH_IMAGE011
,则更新Pareto解集中的第一多阶特征;
步骤S206、重复步骤S203到步骤S205,直至完成对所述Pareto解集中所有第一多阶特征的更新,获得包含多个作为最优多阶特征的第一多阶特征的Pareto最优解集。
2.根据权利要求1所述的一种配网设备健康度评价方法,其特征在于,所述步骤S102中,所述利用相关性分析所述第一单阶特征以实现特征降维,包括:
依次将所述第一单阶特征中所有的特征进行两两配对组合,获得双特征对,将所述双特征对的特征值带入相关性计算公式,获得双特征对的相关性系数;
遍历选取相关性系数高于相关性阈值的第一双特征对,在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
汇总所有双特征对进行配对拆分获得的第一单阶特征,构成第二单阶特征;
所述相关性计算公式为:
Figure 440522DEST_PATH_IMAGE012
其中,X为第一单阶特征,
Figure 775689DEST_PATH_IMAGE013
Figure 504610DEST_PATH_IMAGE014
为第一单阶特征中的第i,j个特征的特征值,
Figure 521108DEST_PATH_IMAGE015
Figure 19085DEST_PATH_IMAGE013
Figure 790732DEST_PATH_IMAGE014
的联合概率分布函数,而
Figure 367469DEST_PATH_IMAGE016
Figure 249975DEST_PATH_IMAGE017
分别是
Figure 602459DEST_PATH_IMAGE018
Figure 731958DEST_PATH_IMAGE014
的边缘 概率分布函数。
3.根据权利要求1所述的一种配网设备健康度评价方法,其特征在于,所述步骤S201中,利用笛卡尔积将所述第二单阶特征进行编码融合,获得第一多阶特征,包括:
对所述第二单阶特征分别进行矩阵编码,获得第二单阶特征矩阵,基于矩阵相乘公式进行编码融合,获得第一多阶特征矩阵;
将所述第二单阶特征的特征值代入第一多阶特征矩阵运算,获得第二评价特征样本集矩阵;
将所述第一多阶特征矩阵和第二评价特征样本集矩阵反矩阵解码获得第一多阶特征和第二评价特征样本集;
所述矩阵相乘公式为:
Figure 169892DEST_PATH_IMAGE019
其中,
Figure 590509DEST_PATH_IMAGE020
为第二单阶特征矩阵,T为转置运算符。
4.根据权利要求1所述的一种配网设备健康度评价方法,其特征在于,所述利用免疫算法将所述正样本内度和所述正样本外度联合作为目标函数,包括:
对所述正样本内度利用最小化修正,得到:
Figure 762DEST_PATH_IMAGE021
将最小化修正后的正样本内度
Figure 114211DEST_PATH_IMAGE022
和正样本外度
Figure 39442DEST_PATH_IMAGE023
联合,生成具有多目标搜索特性 的目标函数为:
Figure 949236DEST_PATH_IMAGE024
5.根据权利要求1所述的一种配网设备健康度评价方法,其特征在于,所述步骤S2中,基于所述评价最优特征样本集建立健康度评价模型,包括:
基于所述第二评价特征样本集获取所述最优多阶特征的特征值,将所述第二评价特征样本集与最优多阶特征建立新映射,获得评价最优特征样本集;
在所述评价最优特征样本集中依次随机抽取50%、30%和20%的数据,分别汇总作为训练集、测试集和验证集;
将所述训练集、测试集和验证集运用在多种机器学习聚类算法上,建模获得多组健康度评价模型,在多组健康度评价模型选择出最优健康度评价模型。
6.根据权利要求5所述的一种配网设备健康度评价方法,其特征在于,所述对所述健康度评价模型进行评估优化,获得最优健康度评价模型,包括:
基于聚类评价指标选取最优健康度评价模型,所述聚类评价指标包括模块度密度和互信息;
所述基于聚类评价指标选取最优健康度评价模型,包括:
绘制多组健康度评价模型的模块度密度曲线和互信息曲线;
依次比较多组模块度密度曲线和互信息曲线的数值,并选取模块度密度和互信息曲线顶点最大值对应的健康度评价模型作为最优健康度评价模型。
CN202110450818.3A 2021-04-26 2021-04-26 一种配网设备健康度评价方法 Active CN112990776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110450818.3A CN112990776B (zh) 2021-04-26 2021-04-26 一种配网设备健康度评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110450818.3A CN112990776B (zh) 2021-04-26 2021-04-26 一种配网设备健康度评价方法

Publications (2)

Publication Number Publication Date
CN112990776A CN112990776A (zh) 2021-06-18
CN112990776B true CN112990776B (zh) 2021-08-20

Family

ID=76340143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110450818.3A Active CN112990776B (zh) 2021-04-26 2021-04-26 一种配网设备健康度评价方法

Country Status (1)

Country Link
CN (1) CN112990776B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113487845A (zh) * 2021-06-25 2021-10-08 中国科学院重庆绿色智能技术研究院 一种人工智能学习系统及姿势纠正方法
CN115730923A (zh) * 2022-11-22 2023-03-03 北京思维实创科技有限公司 电扶梯系统智能轮保方法、系统、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866489A (zh) * 2010-06-30 2010-10-20 西安电子科技大学 基于免疫多目标聚类的图像分割方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140207799A1 (en) * 2013-01-21 2014-07-24 International Business Machines Corporation Hill-climbing feature selection with max-relevancy and minimum redundancy criteria
EP3014564A4 (en) * 2013-06-28 2016-12-07 Healthtap Inc SYSTEMS AND METHOD FOR EVALUATING AND SELECTION OF HEALTH SERVICE PROVIDERS
CN110009208B (zh) * 2019-03-26 2021-12-03 武汉理工大学 一种基于混合智能算法的柱上开关成套设备健康状态评估方法及装置
CN111126489A (zh) * 2019-12-24 2020-05-08 广东电网有限责任公司 一种基于集成学习的输电设备状态评价方法
CN111429034A (zh) * 2020-04-21 2020-07-17 国网信通亿力科技有限责任公司 一种配电网故障预测的方法
CN111667466B (zh) * 2020-05-26 2023-04-18 湖北工业大学 一种带钢表面质量缺陷多分类的多目标优化特征选择方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866489A (zh) * 2010-06-30 2010-10-20 西安电子科技大学 基于免疫多目标聚类的图像分割方法

Also Published As

Publication number Publication date
CN112990776A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN107169628B (zh) 一种基于大数据互信息属性约简的配电网可靠性评估方法
CN106850254B (zh) 一种电力通信网中关键节点识别方法
CN110969347B (zh) 一种输电网结构形态评估方法
CN112990776B (zh) 一种配网设备健康度评价方法
CN113077020B (zh) 一种变压器集群管理方法及系统
CN110232490A (zh) 一种配电网工程投资成效的评估方法及系统
CN108336739A (zh) 一种基于rbf神经网络的概率潮流在线计算方法
CN113139596A (zh) 低压台区线损神经网络的优化算法
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN112883632A (zh) 一种基于改进蚁群算法的锂电池等效电路模型参数辨识方法
CN113327047B (zh) 基于模糊综合模型的电力营销服务渠道决策方法及系统
CN111815085B (zh) 一种轨道交通能源管理系统综合能效评估的实现方法
CN113570345A (zh) 一种基于施工项目电路图的停电范围自动识别系统
CN117575564A (zh) 可扩展的基础设施网络组件维修与改造决策评估方法及系统
Li et al. Predicting Software Quality by Optimized BP Network Based on PSO.
CN115241981B (zh) 一种基于大数据的主动配电网监测方法
CN115526393B (zh) 一种基于变电工程关键影响因素筛选的造价预测方法
CN113283881B (zh) 一种远动信息源的自动审核方法及系统
CN110288159A (zh) 一种智慧城市建设测度方法
CN113986636B (zh) 一种基于硬盘自适应报告数据的数据中心硬盘故障预测方法
CN115564180A (zh) 一种基于大数据分析的电力网络可靠性评估方法
CN113515685A (zh) 一种融合Embedding强化拓扑与节点内容信息的社团检测方法
CN113868304A (zh) 一种配电网冗余数据的确定方法及系统
Kang et al. The study about intelligent manufacturing resource allocation efficiency based on mutual information criterion
CN109816276B (zh) 一种配电网可靠性指标评价方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant