CN113283881A - 一种远动信息源的自动审核方法及系统 - Google Patents

一种远动信息源的自动审核方法及系统 Download PDF

Info

Publication number
CN113283881A
CN113283881A CN202110810585.3A CN202110810585A CN113283881A CN 113283881 A CN113283881 A CN 113283881A CN 202110810585 A CN202110810585 A CN 202110810585A CN 113283881 A CN113283881 A CN 113283881A
Authority
CN
China
Prior art keywords
information source
telecontrol
telecontrol information
cluster
telemechanical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110810585.3A
Other languages
English (en)
Other versions
CN113283881B (zh
Inventor
段孟雍
钟志明
汪杰
苏俊妮
李波
武天龙
刘沛林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Original Assignee
Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd filed Critical Dongguan Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority to CN202110810585.3A priority Critical patent/CN113283881B/zh
Publication of CN113283881A publication Critical patent/CN113283881A/zh
Application granted granted Critical
Publication of CN113283881B publication Critical patent/CN113283881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了一种远动信息源的自动审核方法及系统,包括以下步骤:步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;步骤S2、利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;步骤S3、对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。本发明采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。

Description

一种远动信息源的自动审核方法及系统
技术领域
本发明涉及电力自动化技术领域,具体涉及一种远动信息源的自动审核方法及系统。
背景技术
电力系统远动为电力系统调度服务的远距离监测、控制技术,即管理和监控分布甚广的众多厂、所、站和设备、元器件的运行工况的一种技术手段。
为了方便对每个电子系统的查询审核,通常采用统一标准、统一信号点命名规范、且不出现缺点漏点重复等人为差错作为远动信息标准化点表,只需要填入相关的电压等级和间隔名称即可直接导入远动系统的信息点表,针对不同的列表规则对比每个远动系统的信息电表即可发现每个远动系统的不足之处。
但是在现有的技术中,利用远动信息点表进行远动信息源的人工审核判别远动信息源的工况状态,由于远动信息点表来自多个源头且侧重方向不同,会出现标准、规则不一的情况,人工审核无法将标准和规则整合且容易出现人为错漏、重复等现象,实际执行的效率低下,准确度低。
发明内容
本发明的目的在于提供一种远动信息源的自动审核方法及系统,以解决现有技术中实际执行的效率低下,准确度低的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种远动信息源的自动审核方法,包括以下步骤:
步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
步骤S2、利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;
步骤S3、对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
作为本发明的一种优选方案,所述步骤S1中,对远动信息源进行远动信息特征的提取的具体方法包括:
步骤S101、收集远动信息源的台账日志,并在所述台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集,其中,所述正样本为处于同类工况状态的远动信息源的工况数据,所述负样本为处于他类工况状态的远动信息源的工况数据;
步骤S102、对远动样本集中进行特征提取获得第一单阶特征,并将第一单阶特征利用相关性分析实现特征降维获得第二单阶特征;
步骤S103、基于远动样本集获取所述第二单阶特征的特征值,并将第二单阶特征的特征值与第二单阶特征建立新映射获得第一远动信息源集群样本集。
作为本发明的一种优选方案,所述步骤S102中,相关性分析实现特征降维的具体方法包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对并将双特征对的特征值带入相关性计算公式获得双特征对的相关性系数,相关性系数计算公式为:
Figure 117493DEST_PATH_IMAGE001
其中,I为相关性系数,X为第一单阶特征,
Figure 519786DEST_PATH_IMAGE002
Figure 191202DEST_PATH_IMAGE003
为第一单阶特征中的第ij个特征的特征值,
Figure 711045DEST_PATH_IMAGE004
Figure 259838DEST_PATH_IMAGE005
Figure 950540DEST_PATH_IMAGE003
的联合概率分布函数,而
Figure 342207DEST_PATH_IMAGE006
Figure 541108DEST_PATH_IMAGE007
分别是
Figure 944407DEST_PATH_IMAGE002
Figure 203350DEST_PATH_IMAGE003
的边缘概率分布函数;
遍历选取相关性系数高于相关性阈值的第一双特征对,并在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分获得的第一单阶特征汇总构成第二单阶特征。
作为本发明的一种优选方案,所述步骤S1中,对远动信息特征进行融合优化的具体方法包括:
利用笛卡尔积将所述第二单阶特征进行编码融合获得第一多阶特征,并基于所述第一多阶特征对所述第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于所述过渡远动信息源集群样本集利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对所述过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。
作为本发明的一种优选方案,所述多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方法包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,所述目标函数为:
Figure 583778DEST_PATH_IMAGE008
其中,
Figure 320790DEST_PATH_IMAGE009
Figure 968809DEST_PATH_IMAGE010
其中,minf为目标函数值,
Figure 398653DEST_PATH_IMAGE011
Figure 374700DEST_PATH_IMAGE012
为权重常数,
Figure 541501DEST_PATH_IMAGE013
,MNI为聚类准确度,t为第一多阶特征的使用数目,
Figure 184972DEST_PATH_IMAGE014
,M为第一多阶特征的总数目,H为混合矩阵,
Figure 520138DEST_PATH_IMAGE015
表征为过渡远动信息源集群样本集中的所述正负样本的聚类集群结构
Figure 249060DEST_PATH_IMAGE016
中正负样本集群k内的样本同时处于所述正负样本的真实聚类集群结构
Figure 452508DEST_PATH_IMAGE017
中正负样本集群l内的数目,np 1np 2分别是
Figure 950486DEST_PATH_IMAGE016
Figure 456553DEST_PATH_IMAGE017
划分结果中的集群个数,H k 和H l 分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
线性标定所述目标函数构建适应度函数,并利用多目标搜索算法求解所述目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;
选取所述最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源划分至多组远动信息源集群的最优多阶特征,所述适应度函数的计算公式为:
Figure 672771DEST_PATH_IMAGE018
其中,F为适应度值,
Figure 181375DEST_PATH_IMAGE019
为目标函数值,
Figure 533859DEST_PATH_IMAGE020
为扰动常数。
作为本发明的一种优选方案,所述步骤S2中,利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群的具体方法包括:
步骤一:基于所述最优多阶特征将所有远动信息源分别量化为单个远动信息源集群
Figure 476407DEST_PATH_IMAGE021
,其中
Figure 914342DEST_PATH_IMAGE022
表示第y台远动信息源的最优多阶特征的集合,
Figure 459593DEST_PATH_IMAGE023
表示第y台远动信息源的第
Figure 932162DEST_PATH_IMAGE024
个最优多阶特征,
Figure 780033DEST_PATH_IMAGE025
Figure 705263DEST_PATH_IMAGE026
,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,所述集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,所述相似性用果瓦系数进行度量:
Figure 555670DEST_PATH_IMAGE027
其中,
Figure 882746DEST_PATH_IMAGE028
为远动信息源
Figure 167097DEST_PATH_IMAGE029
和远动信息源
Figure 579624DEST_PATH_IMAGE030
的果瓦系数,
Figure 466677DEST_PATH_IMAGE031
为远动信息源
Figure 648260DEST_PATH_IMAGE029
和远动信息源
Figure 103512DEST_PATH_IMAGE030
Figure 3335DEST_PATH_IMAGE032
Figure 195544DEST_PATH_IMAGE033
上的取值,
Figure 231633DEST_PATH_IMAGE032
Figure 857786DEST_PATH_IMAGE033
分别表示第y1、y2台远动信息源的第
Figure 244905DEST_PATH_IMAGE034
个最优多阶特征,
Figure 473761DEST_PATH_IMAGE035
为加权变量,
Figure 629936DEST_PATH_IMAGE036
Figure 426991DEST_PATH_IMAGE037
,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤三:重复步骤二直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。
作为本发明的一种优选方案,所述步骤S3中,判别远动信息源的工况状态的具体方法包括:
对各远动信息源集群中的所有远动信息源运行监测数据
Figure 35827DEST_PATH_IMAGE038
分别进行归一化处理为消除不同指标量纲带来的差异,所述归一化公式为:
Figure 835418DEST_PATH_IMAGE039
其中,
Figure 846099DEST_PATH_IMAGE040
表示第
Figure 814055DEST_PATH_IMAGE041
台远动信息源的运行监测数据,
Figure 910187DEST_PATH_IMAGE042
表示第y台远动信息源的第
Figure 480846DEST_PATH_IMAGE043
类运行监测数据,n2表示集群中远动信息源的台数,
Figure 611613DEST_PATH_IMAGE044
表示归一化处理后第y台远动信息源的第
Figure 750470DEST_PATH_IMAGE043
类运行监测数据,p为运行监测数据的种类总数目,
Figure 333898DEST_PATH_IMAGE045
量化同一集群中的远动信息源两两之间的距离,所述距离用欧式距离度量,所述欧式距离的计算公式为:
Figure 209713DEST_PATH_IMAGE046
Figure 194986DEST_PATH_IMAGE047
为远动信息源
Figure 504745DEST_PATH_IMAGE029
和远动信息源
Figure 700103DEST_PATH_IMAGE030
的欧式距离,
Figure 753509DEST_PATH_IMAGE048
Figure 219388DEST_PATH_IMAGE049
分别表示为第y1、y2台远动信息源的第
Figure 700048DEST_PATH_IMAGE043
类运行监测数据,
Figure 992489DEST_PATH_IMAGE050
,n2表示集群中远动信息源的总数目,
Figure 849586DEST_PATH_IMAGE045
,p为运行监测数据的种类总数目;
设置距离阈值,基于所述距离阈值判定所述集群中远动信息源的运行状况。
作为本发明的一种优选方案,所述基于所述距离阈值判定所述集群中远动信息源的运行状况的方法包括:
若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量超过集群远动信息源总数目n2的85%,则确定远动信息源y运行状况为异常,否则,确定远动信息源y运行状况正常。
作为本发明的一种优选方案,本发明提供了一种根据所述的远动信息源的自动审核方法的审核系统,包括:
信息特征处理单元,用于对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
信息源集群划分单元,用于利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;
信息源审核单元,用于对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
作为本发明的一种优选方案,所述信息源审核单元还包括人工抽检单元,所述人工抽检单元用于定期对信息源审核单元进行人工审核实现对远动信息源的二次审核以确保审核的高准确度。
本发明与现有技术相比较具有如下有益效果:
本发明利用多目标搜索策略和特征融合策略在远动信息源的台账日志中依次进行特征提取、降维和融合选取出区分远动信息源分簇效果最好的最优多阶特征,并采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,以此为依据的每一个集群远动信息源之间理应具有相似的状态,再通过同一集群中远动信息源的运行监测数据的互比较了解集群内设备的差异性,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的自动审核方法流程图;
图2为本发明实施例提供的最优多阶特征生成流程图;
图3为本发明实施例提供的远动信息源集群结构示意图;
图4为本发明实施例提供的审核系统结构框图。
图中的标号分别表示如下:
1-信息特征处理单元;2-信息源集群划分单元;3-信息源审核单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4所示,本发明实施例提供了一种远动信息源的自动审核方法,包括以下步骤:
如图2所示,步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成最优信息特征组合,最优信息特征组合用于构建并自动审核远动信息源。
步骤S1中,对远动信息源进行远动信息特征的提取的具体方法包括:
步骤S101、收集远动信息源的台账日志,并在台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集,其中,正样本为处于同类工况状态的远动信息源的工况数据,负样本为处于他类工况状态的远动信息源的工况数据;
同类是指远动信息源的台账参数、工况数据相似可归属于同一类别即集群,他类是指远动信息源的台账参数、工况数据差异度大,不可归属于同一类别即集群。
步骤S102、对远动样本集中进行特征提取获得第一单阶特征,并将第一单阶特征利用相关性分析实现特征降维获得第二单阶特征;
步骤S103、基于远动样本集获取第二单阶特征的特征值,并将第二单阶特征的特征值与第二单阶特征建立新映射获得第一远动信息源集群样本集。
步骤S102中,相关性分析实现特征降维的具体方法包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对并将双特征对的特征值带入相关性计算公式获得双特征对的相关性系数,相关性系数计算公式为:
Figure 668507DEST_PATH_IMAGE051
其中,I为相关性系数,X为第一单阶特征,
Figure 320068DEST_PATH_IMAGE005
Figure 365384DEST_PATH_IMAGE052
为第一单阶特征中的第ij个特征的特征值,
Figure 760594DEST_PATH_IMAGE053
Figure 935485DEST_PATH_IMAGE005
Figure 23527DEST_PATH_IMAGE052
的联合概率分布函数,而
Figure 290560DEST_PATH_IMAGE054
Figure 348515DEST_PATH_IMAGE055
分别是
Figure 17394DEST_PATH_IMAGE005
Figure 276337DEST_PATH_IMAGE052
的边缘概率分布函数;
遍历选取相关性系数高于相关性阈值的第一双特征对,并在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分获得的第一单阶特征汇总构成第二单阶特征。
相关性系数是指两个特征的相似程度,利用相关性系数量化第一单阶特征间的相似程度,而后将第一单阶特征间相似程度高的多个特征仅用一个特征进行表征即可,实现特征降维的同时避免删除有效特征,特征降维可以有效的减少无效计算,并提高集群划分的运算精度。
步骤S1中,对远动信息特征进行融合优化的具体方法包括:
利用笛卡尔积将第二单阶特征进行编码融合获得第一多阶特征,并基于第一多阶特征对第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于过渡远动信息源集群样本集利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。
将单阶特征利用笛卡尔积方式融合形成多阶特征,可将单阶特征之间的区分属性进行增强,从而基于多阶特征建立的集群划分算法的区分能力得以增强,则可提高集群划分精度,将远动信息源精准归属至远动信息源集群集群。
多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方法包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,目标函数为:
Figure 765087DEST_PATH_IMAGE008
其中,
Figure 393777DEST_PATH_IMAGE009
Figure 917162DEST_PATH_IMAGE010
其中,minf为目标函数值
Figure 81427DEST_PATH_IMAGE011
Figure 323052DEST_PATH_IMAGE012
为权重常数,
Figure 988389DEST_PATH_IMAGE013
,MNI为聚类准确度,t为第一多阶特征的使用数目,
Figure 366281DEST_PATH_IMAGE014
,M为第一多阶特征的总数目,H为混合矩阵,
Figure 967026DEST_PATH_IMAGE015
表征为过渡远动信息源集群样本集中的正负样本的聚类集群结构
Figure 430369DEST_PATH_IMAGE016
中正负样本集群k内的样本同时处于正负样本的真实聚类集群结构
Figure 400861DEST_PATH_IMAGE017
中正负样本集群l内的数目,np 1np 2分别是
Figure 898838DEST_PATH_IMAGE016
Figure 404906DEST_PATH_IMAGE017
划分结果中的集群个数,H k 和H l 分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
利用聚类准确度和第一多阶特征的使用数目构建的目标函数,其中,聚类算法而言使用的特征数目越多则聚类准确度越高,因此第一多阶特征的使用数目与距离准确度存在互斥的竞争关系,同时第一多阶特征的使用数目与聚类准确度二者又分别体现了聚类分集群的两种优化目标,即少使用特征数目降低计算量获得多使用特征数目提高聚类准确度,因此将存在竞争的第一多阶特征的使用数目与聚类准确度进行权重组合,将单个目标的优化转变为多个目标的优化,实现对第一多阶特征的使用数目与聚类准确度的折衷优化以获得快速精确将远动信息源归置到集群中的最优多阶特征。
而且将目标函数设置为第一多阶特征的使用数目与聚类准确度的权重组合的反值,将多目标优化问题转变为目标函数的最小值求解问题,简化计算过程,提高效率。
线性标定目标函数构建适应度函数,并利用多目标搜索算法求解目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;
选取最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源划分至多组远动信息源集群的最优多阶特征,适应度函数的计算公式为:
Figure 371856DEST_PATH_IMAGE018
其中,F为适应度值,
Figure 254362DEST_PATH_IMAGE019
为目标函数值,
Figure 606846DEST_PATH_IMAGE020
为扰动常数。
适应度值反应了个体对环境的适应能力强弱,因此可以构建适应度函数来衡量个体的优劣,而且适应度函数可以在不利用外部信息的情况下,作为是多目标搜索算法挑选优秀个体的唯一依据,它由优化问题中目标函数映射而来,在本实施例的多目标优化问题中反映了Pareto解集中解的优劣,适应度值越高,则解越优。
步骤S2、利用最优信息特征组合将远动信息源进行同属性划分获得多组远动信息源集群;
步骤S2中,利用最优信息特征组合将远动信息源进行同属性划分获得多组远动信息源集群的具体方法包括:
步骤一:基于最优多阶特征将所有远动信息源分别量化为单个远动信息源集群
Figure 408448DEST_PATH_IMAGE021
,其中
Figure 472482DEST_PATH_IMAGE022
表示第y台远动信息源的最优多阶特征的集合,
Figure 158678DEST_PATH_IMAGE023
表示第y台远动信息源的第
Figure 490302DEST_PATH_IMAGE024
个最优多阶特征,
Figure 603752DEST_PATH_IMAGE025
Figure 528982DEST_PATH_IMAGE026
,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,相似性用果瓦系数进行度量:
Figure 753290DEST_PATH_IMAGE027
其中,
Figure 706465DEST_PATH_IMAGE028
为远动信息源
Figure 990816DEST_PATH_IMAGE029
和远动信息源
Figure 137763DEST_PATH_IMAGE030
的果瓦系数,
Figure 165762DEST_PATH_IMAGE031
为远动信息源
Figure 471979DEST_PATH_IMAGE029
和远动信息源
Figure 927231DEST_PATH_IMAGE030
Figure 827054DEST_PATH_IMAGE032
Figure 393164DEST_PATH_IMAGE033
上的取值,
Figure 55352DEST_PATH_IMAGE032
Figure 681505DEST_PATH_IMAGE033
分别表示第y1、y2台远动信息源的第
Figure 803045DEST_PATH_IMAGE034
个最优多阶特征,
Figure 172847DEST_PATH_IMAGE035
为加权变量,
Figure 453655DEST_PATH_IMAGE036
Figure 250710DEST_PATH_IMAGE037
,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤三:重复步骤二直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。
如图3所示,远动信息源集群包括五个集群,举例说明,集群1中的所有远动信息源具有相似的台账参数、工况数据,同理集群2中的所有远动信息源具有也具有相似台账参数、工况数据,而集群1和2之间的远动信息源台账参数、工况数据差异度大,因此可对集群1内部的各远动信息源的在线运行数据进行内相似性比对,并判别远动信息源的运行状态。
步骤S3、对远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
步骤S3中,判别远动信息源的工况状态的具体方法包括:
对各远动信息源集群中的所有远动信息源运行监测数据
Figure 859546DEST_PATH_IMAGE038
分别进行归一化处理为消除不同指标量纲带来的差异,归一化公式为:
Figure 767459DEST_PATH_IMAGE039
其中,
Figure 778140DEST_PATH_IMAGE040
表示第
Figure 395632DEST_PATH_IMAGE041
台远动信息源的运行监测数据,
Figure 491764DEST_PATH_IMAGE042
表示第y台远动信息源的第
Figure 203368DEST_PATH_IMAGE043
类运行监测数据,n2表示集群中远动信息源的台数,
Figure 458769DEST_PATH_IMAGE044
表示归一化处理后第y台远动信息源的第
Figure 597627DEST_PATH_IMAGE043
类运行监测数据,p为运行监测数据的种类总数目,
Figure 915475DEST_PATH_IMAGE045
量化同一集群中的远动信息源两两之间的距离,距离用欧式距离度量,欧式距离的计算公式为:
Figure 430770DEST_PATH_IMAGE046
Figure 42143DEST_PATH_IMAGE047
为远动信息源
Figure 351901DEST_PATH_IMAGE029
和远动信息源
Figure 157046DEST_PATH_IMAGE030
的欧式距离,
Figure 210453DEST_PATH_IMAGE048
Figure 174867DEST_PATH_IMAGE049
分别表示为第y1、y2台远动信息源的第
Figure 655527DEST_PATH_IMAGE043
类运行监测数据,
Figure 213547DEST_PATH_IMAGE050
,n2表示集群中远动信息源的总数目,
Figure 805065DEST_PATH_IMAGE045
,p为运行监测数据的种类总数目;
设置距离阈值,基于距离阈值判定集群中远动信息源的运行状况。
基于距离阈值判定集群中远动信息源的运行状况的方法包括:
若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量超过集群远动信息源总数目n2的85%,则确定远动信息源y运行状况为异常,否则确定远动信息源y运行状况正常。
如图4所示,基于上述远动信息源的自动审核方法,本发明提供了一种审核系统,包括:
信息特征处理单元1,用于对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
信息源集群划分单元2,用于利用最优信息特征组合将远动信息源进行同属性划分获得多组远动信息源集群;
信息源审核单元3,用于对远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
信息源审核单元还包括人工抽检单元,人工抽检单元用于定期对信息源审核单元进行人工审核实现对远动信息源的二次审核以确保审核的高准确度
本发明利用多目标搜索策略和特征融合策略在远动信息源的台账日志中依次进行特征提取、降维和融合选取出区分远动信息源分簇效果最好的最优多阶特征,并采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,以此为依据的每一个集群远动信息源之间理应具有相似的状态,再通过同一集群中远动信息源的运行监测数据的互比较了解集群内设备的差异性,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (10)

1.一种远动信息源的自动审核方法,其特征在于,包括以下步骤:
步骤S1、对远动信息源进行远动信息特征的提取,并对所述远动信息特征进行融合优化,生成用于最优信息特征组合;
步骤S2、利用所述最优信息特征组合对所述远动信息源进行同属性划分,获得多组远动信息源集群;
步骤S3、对所述远动信息源集群进行内相似性分析,判别远动信息源的工况状态,以实现远动信息源的自动审核。
2.根据权利要求1所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S1中,所述对远动信息源进行远动信息特征的提取,包括:
步骤S101、收集远动信息源的台账日志,并在所述台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集;其中,所述正样本为处于同类工况状态的远动信息源的工况数据,所述负样本为处于他类工况状态的远动信息源的工况数据;
步骤S102、对所述远动样本集进行特征提取获得第一单阶特征,将所述第一单阶特征利用相关性分析实现特征降维,获得第二单阶特征;
步骤S103、基于所述远动样本集获取所述第二单阶特征的特征值,基于第二单阶特征的特征值与所述第二单阶特征建立新映射,获得第一远动信息源集群样本集。
3.根据权利要求2所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S102包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对,将所述双特征对的特征值带入相关性计算公式,获得双特征对的相关性系数;
相关性系数计算公式为:
Figure 682812DEST_PATH_IMAGE001
其中,I为相关性系数,X为第一单阶特征,
Figure 599952DEST_PATH_IMAGE002
Figure 379690DEST_PATH_IMAGE003
为第一单阶特征中的第ij个特征的特征值,
Figure 774899DEST_PATH_IMAGE004
Figure 589271DEST_PATH_IMAGE002
Figure 536367DEST_PATH_IMAGE003
的联合概率分布函数,而
Figure 803401DEST_PATH_IMAGE005
Figure 2301DEST_PATH_IMAGE006
分别是
Figure 671179DEST_PATH_IMAGE002
Figure 664543DEST_PATH_IMAGE003
的边缘概率分布函数;
遍历选取相关性系数高于相关性阈值的第一双特征对,在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分所获得的第一单阶特征汇总构成第二单阶特征。
4.根据权利要求3所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S1中,所述对所述远动信息特征进行融合优化,包括:
利用笛卡尔积将所述第二单阶特征进行编码融合获得第一多阶特征,基于所述第一多阶特征对所述第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于所述过渡远动信息源集群样本集,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对所述过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。
5.根据权利要求4所述的一种远动信息源的自动审核方法,其特征在于,所述基于所述过渡远动信息源集群样本集,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,所述目标函数为:
Figure 44971DEST_PATH_IMAGE007
其中,
Figure 781983DEST_PATH_IMAGE008
Figure 305368DEST_PATH_IMAGE009
其中,minf为目标函数值,
Figure 735213DEST_PATH_IMAGE010
Figure 976838DEST_PATH_IMAGE011
为权重常数,
Figure 251962DEST_PATH_IMAGE012
,MNI为聚类准确度,t为第一多阶特征的使用数目,
Figure 20066DEST_PATH_IMAGE013
,M为第一多阶特征的总数目,H为混合矩阵,
Figure 355233DEST_PATH_IMAGE014
表征为过渡远动信息源集群样本集中的所述正负样本的聚类集群结构
Figure 84154DEST_PATH_IMAGE015
中正负样本集群k内的样本同时处于所述正负样本的真实聚类集群结构
Figure 162969DEST_PATH_IMAGE016
中正负样本集群l内的数目,np 1np 2分别是
Figure 660946DEST_PATH_IMAGE015
Figure 432593DEST_PATH_IMAGE016
划分结果中的集群个数,H k 和H l 分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
线性标定所述目标函数构建适应度函数,并利用多目标搜索算法求解所述目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;
选取所述最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源,划分至多组远动信息源集群的最优多阶特征;
所述适应度函数的计算公式为:
Figure 9330DEST_PATH_IMAGE017
其中,F为适应度值,
Figure 891836DEST_PATH_IMAGE018
为目标函数值,
Figure 244320DEST_PATH_IMAGE019
为扰动常数。
6.根据权利要求5所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S2包括:
步骤一:基于所述最优多阶特征将所有远动信息源分别量化为单个远动信息源集群
Figure 186868DEST_PATH_IMAGE020
,其中
Figure 624802DEST_PATH_IMAGE021
表示第y台远动信息源的最优多阶特征的集合,
Figure 45419DEST_PATH_IMAGE022
表示第y台远动信息源的第
Figure 642623DEST_PATH_IMAGE023
个最优多阶特征,
Figure 756072DEST_PATH_IMAGE024
Figure 681303DEST_PATH_IMAGE025
,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,所述集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,所述相似性用果瓦系数进行度量:
Figure 905611DEST_PATH_IMAGE026
其中,
Figure 967108DEST_PATH_IMAGE027
为远动信息源
Figure 877557DEST_PATH_IMAGE028
和远动信息源
Figure 290084DEST_PATH_IMAGE029
的果瓦系数,
Figure 318083DEST_PATH_IMAGE030
为远动信息源
Figure 499666DEST_PATH_IMAGE028
和远动信息源
Figure 689339DEST_PATH_IMAGE029
Figure 589161DEST_PATH_IMAGE031
Figure 279906DEST_PATH_IMAGE032
上的取值,
Figure 581574DEST_PATH_IMAGE031
Figure 942148DEST_PATH_IMAGE032
分别表示第y1、y2台远动信息源的第
Figure 329267DEST_PATH_IMAGE033
个最优多阶特征,
Figure 699069DEST_PATH_IMAGE034
为加权变量,
Figure 589664DEST_PATH_IMAGE035
Figure 386719DEST_PATH_IMAGE036
,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤三:重复步骤二,直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。
7.根据权利要求6所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S3中,所述判别远动信息源的工况状态,包括:
对各远动信息源集群中的所有远动信息源运行监测数据
Figure 621654DEST_PATH_IMAGE037
分别进行归一化处理为消除不同指标量纲带来的差异,所述归一化公式为:
Figure 795146DEST_PATH_IMAGE038
其中,
Figure 805827DEST_PATH_IMAGE039
表示第
Figure 773783DEST_PATH_IMAGE040
台远动信息源的运行监测数据,
Figure 869915DEST_PATH_IMAGE041
表示第y台远动信息源的第
Figure 706153DEST_PATH_IMAGE042
类运行监测数据,n2表示集群中远动信息源的台数,
Figure 174002DEST_PATH_IMAGE043
表示归一化处理后第y台远动信息源的第
Figure 312859DEST_PATH_IMAGE044
类运行监测数据,p为运行监测数据的种类总数目,
Figure 896288DEST_PATH_IMAGE045
量化同一集群中的远动信息源两两之间的距离,所述距离用欧式距离度量;
所述欧式距离的计算公式为:
Figure 270637DEST_PATH_IMAGE046
Figure 255911DEST_PATH_IMAGE047
为远动信息源
Figure 565669DEST_PATH_IMAGE028
和远动信息源
Figure 636393DEST_PATH_IMAGE029
的欧式距离,
Figure 315899DEST_PATH_IMAGE048
Figure 155679DEST_PATH_IMAGE049
分别表示为第y1、y2台远动信息源的第
Figure 636339DEST_PATH_IMAGE044
类运行监测数据,
Figure 53413DEST_PATH_IMAGE050
,n2表示集群中远动信息源的总数目,
Figure 910511DEST_PATH_IMAGE045
,p为运行监测数据的种类总数目;
设置距离阈值,基于所述距离阈值判定所述集群中远动信息源的运行状况。
8.根据权利要求7所述的一种远动信息源的自动审核方法,其特征在于,所述基于所述距离阈值判定所述集群中远动信息源的运行状况,包括:
若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量,超过集群远动信息源总数目n2的85%,则确定远动信息源y运行状况为异常;否则,确定远动信息源y运行状况正常。
9.一种远动信息源的自动审核系统,其特征在于,用于实现如权利要求1至8任一项所述的远动信息源的自动审核方法,包括:
信息特征处理单元(1),用于对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
信息源集群划分单元(2),用于利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;
信息源审核单元(3),用于对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
10.根据权利要求9所述的一种远动信息源的自动审核系统,其特征在于,所述信息源审核单元(3)还包括人工抽检单元,所述人工抽检单元用于定期对信息源审核单元进行人工审核,实现对远动信息源的二次审核。
CN202110810585.3A 2021-07-19 2021-07-19 一种远动信息源的自动审核方法及系统 Active CN113283881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110810585.3A CN113283881B (zh) 2021-07-19 2021-07-19 一种远动信息源的自动审核方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110810585.3A CN113283881B (zh) 2021-07-19 2021-07-19 一种远动信息源的自动审核方法及系统

Publications (2)

Publication Number Publication Date
CN113283881A true CN113283881A (zh) 2021-08-20
CN113283881B CN113283881B (zh) 2021-11-12

Family

ID=77286707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110810585.3A Active CN113283881B (zh) 2021-07-19 2021-07-19 一种远动信息源的自动审核方法及系统

Country Status (1)

Country Link
CN (1) CN113283881B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791300A (zh) * 2021-11-15 2021-12-14 广东电网有限责任公司东莞供电局 一种充电站的充电枪状态监测方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101959213A (zh) * 2009-07-13 2011-01-26 深圳市泰利得通信技术有限公司 一种远动通信系统测试方法
CN104052159A (zh) * 2014-06-25 2014-09-17 中国东方电气集团有限公司 一种用于风光储微网系统的能量管理控制器
US20190305589A1 (en) * 2016-11-10 2019-10-03 China Electric Power Research Institute Company Limited Distribution network risk identification system and method and computer storage medium
CN110388315A (zh) * 2019-07-05 2019-10-29 中国石油大学(北京) 基于多源信息融合的输油泵故障识别方法、装置及系统
CN111768082A (zh) * 2020-06-02 2020-10-13 广东电网有限责任公司 一种基于大数据分析的电力设备状态评估方法
CN112134871A (zh) * 2020-09-16 2020-12-25 天津大学 一种能源互联网信息支撑网络的异常流量检测装置及方法
CN112541833A (zh) * 2020-12-07 2021-03-23 广东电网有限责任公司 基于特征匹配知识库的电力系统远动数据质量治理方法及其系统
CN112950276A (zh) * 2021-03-12 2021-06-11 华扬联众数字技术(深圳)有限公司 一种基于多阶特征组合的种子人群拓展方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101959213A (zh) * 2009-07-13 2011-01-26 深圳市泰利得通信技术有限公司 一种远动通信系统测试方法
CN104052159A (zh) * 2014-06-25 2014-09-17 中国东方电气集团有限公司 一种用于风光储微网系统的能量管理控制器
US20190305589A1 (en) * 2016-11-10 2019-10-03 China Electric Power Research Institute Company Limited Distribution network risk identification system and method and computer storage medium
CN110388315A (zh) * 2019-07-05 2019-10-29 中国石油大学(北京) 基于多源信息融合的输油泵故障识别方法、装置及系统
CN111768082A (zh) * 2020-06-02 2020-10-13 广东电网有限责任公司 一种基于大数据分析的电力设备状态评估方法
CN112134871A (zh) * 2020-09-16 2020-12-25 天津大学 一种能源互联网信息支撑网络的异常流量检测装置及方法
CN112541833A (zh) * 2020-12-07 2021-03-23 广东电网有限责任公司 基于特征匹配知识库的电力系统远动数据质量治理方法及其系统
CN112950276A (zh) * 2021-03-12 2021-06-11 华扬联众数字技术(深圳)有限公司 一种基于多阶特征组合的种子人群拓展方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李刚 等: "电力设备状态评估中的数据科学问题:挑战与展望", 《电力系统自动化》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113791300A (zh) * 2021-11-15 2021-12-14 广东电网有限责任公司东莞供电局 一种充电站的充电枪状态监测方法及系统

Also Published As

Publication number Publication date
CN113283881B (zh) 2021-11-12

Similar Documents

Publication Publication Date Title
CN113077020B (zh) 一种变压器集群管理方法及系统
CN107609783B (zh) 一种基于数据挖掘的智能电能表综合性能进行评估的方法及系统
CN108898311A (zh) 一种面向智能配电网抢修调度平台的数据质量检测方法
CN111881124A (zh) 一种基于改进算法的状态估计的数据处理方法及系统
CN111999692B (zh) 一种多表误差的校准方法和装置
CN116579768B (zh) 一种发电厂在线仪表运维管理方法及系统
CN113283881B (zh) 一种远动信息源的自动审核方法及系统
CN112990776B (zh) 一种配网设备健康度评价方法
CN111709668A (zh) 基于数据挖掘技术的电网设备参数风险识别方法及装置
CN116432123A (zh) 一种基于cart决策树算法的电能表故障预警方法
CN116862081A (zh) 一种污染治理设备运维方法及系统
CN114487332A (zh) 一种地表水水质自动监测站运行效果评价方法、系统、介质及设备
CN113689079A (zh) 基于多元线性回归和聚类分析的台区线损预测方法及系统
CN115951123A (zh) 一种基于无线通信的电能计量方法及系统
CN110781959A (zh) 基于birch算法和随机森林算法的电力客户分群方法
CN112307648B (zh) 一种卫星通信系统可靠性模型的评估方法
CN116976574A (zh) 一种基于两阶段混合聚类算法的建筑负荷曲线降维方法
CN113327047A (zh) 基于模糊综合模型的电力营销服务渠道决策方法及系统
CN111815085B (zh) 一种轨道交通能源管理系统综合能效评估的实现方法
CN108614547B (zh) 一种基于削减因子的工业控制协议安全评估方法
CN113919610A (zh) 低压台区线损预测用arima模型构建方法及评估方法
CN112381422A (zh) 光伏电站性能的确定方法和装置
CN107196290B (zh) 基于量测平衡指标和设备状态相似度寻优的支路与母线连接关系辨识方法
CN113537528B (zh) 一种输变电设备状态监测数据的预处理方法及系统
CN109378834A (zh) 基于信息最大相关的大规模电网电压稳定裕度评估系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant