CN113283881B - 一种远动信息源的自动审核方法及系统 - Google Patents
一种远动信息源的自动审核方法及系统 Download PDFInfo
- Publication number
- CN113283881B CN113283881B CN202110810585.3A CN202110810585A CN113283881B CN 113283881 B CN113283881 B CN 113283881B CN 202110810585 A CN202110810585 A CN 202110810585A CN 113283881 B CN113283881 B CN 113283881B
- Authority
- CN
- China
- Prior art keywords
- information source
- telecontrol
- telecontrol information
- cluster
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012550 audit Methods 0.000 claims abstract description 15
- 230000002159 abnormal effect Effects 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 238000012544 monitoring process Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000004927 fusion Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 9
- 230000007704 transition Effects 0.000 claims description 8
- 238000005315 distribution function Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000002156 mixing Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000010219 correlation analysis Methods 0.000 claims description 5
- 238000007689 inspection Methods 0.000 claims description 4
- 238000010845 search algorithm Methods 0.000 claims description 4
- 235000013399 edible fruits Nutrition 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种远动信息源的自动审核方法及系统,包括以下步骤:步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;步骤S2、利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;步骤S3、对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。本发明采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。
Description
技术领域
本发明涉及电力自动化技术领域,具体涉及一种远动信息源的自动审核方法及系统。
背景技术
电力系统远动为电力系统调度服务的远距离监测、控制技术,即管理和监控分布甚广的众多厂、所、站和设备、元器件的运行工况的一种技术手段。
为了方便对每个电子系统的查询审核,通常采用统一标准、统一信号点命名规范、且不出现缺点漏点重复等人为差错作为远动信息标准化点表,只需要填入相关的电压等级和间隔名称即可直接导入远动系统的信息点表,针对不同的列表规则对比每个远动系统的信息电表即可发现每个远动系统的不足之处。
但是在现有的技术中,利用远动信息点表进行远动信息源的人工审核判别远动信息源的工况状态,由于远动信息点表来自多个源头且侧重方向不同,会出现标准、规则不一的情况,人工审核无法将标准和规则整合且容易出现人为错漏、重复等现象,实际执行的效率低下,准确度低。
发明内容
本发明的目的在于提供一种远动信息源的自动审核方法及系统,以解决现有技术中实际执行的效率低下,准确度低的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种远动信息源的自动审核方法,包括以下步骤:
步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
步骤S2、利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;
步骤S3、对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
作为本发明的一种优选方案,所述步骤S1中,对远动信息源进行远动信息特征的提取的具体方法包括:
步骤S101、收集远动信息源的台账日志,并在所述台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集,其中,所述正样本为处于同类工况状态的远动信息源的工况数据,所述负样本为处于他类工况状态的远动信息源的工况数据;
步骤S102、对远动样本集中进行特征提取获得第一单阶特征,并将第一单阶特征利用相关性分析实现特征降维获得第二单阶特征;
步骤S103、基于远动样本集获取所述第二单阶特征的特征值,并将第二单阶特征的特征值与第二单阶特征建立新映射获得第一远动信息源集群样本集。
作为本发明的一种优选方案,所述步骤S102中,相关性分析实现特征降维的具体方法包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对并将双特征对的特征值带入相关性计算公式获得双特征对的相关性系数,相关性系数计算公式为:
遍历选取相关性系数高于相关性阈值的第一双特征对,并在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分获得的第一单阶特征汇总构成第二单阶特征。
作为本发明的一种优选方案,所述步骤S1中,对远动信息特征进行融合优化的具体方法包括:
利用笛卡尔积将所述第二单阶特征进行编码融合获得第一多阶特征,并基于所述第一多阶特征对所述第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于所述过渡远动信息源集群样本集利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对所述过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。
作为本发明的一种优选方案,所述多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方法包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,所述目标函数为:
其中,minf为目标函数值,和为权重常数,,MNI为聚类准确度,t为第一多阶特征的使用数目,,M为第一多阶特征的总数目,H为混合矩阵,表征为过渡远动信息源集群样本集中的所述正负样本的聚类集群结构中正负样本集群k内的样本同时处于所述正负样本的真实聚类集群结构中正负样本集群l内的数目,np 1和np 2分别是和划分结果中的集群个数,H k 和H l 分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
线性标定所述目标函数构建适应度函数,并利用多目标搜索算法求解所述目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;
选取所述最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源划分至多组远动信息源集群的最优多阶特征,所述适应度函数的计算公式为:
作为本发明的一种优选方案,所述步骤S2中,利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群的具体方法包括:
步骤一:基于所述最优多阶特征将所有远动信息源分别量化为单个远动信息源集群,其中表示第y台远动信息源的最优多阶特征的集合,表示第y台远动信息源的第个最优多阶特征,,,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,所述集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,所述相似性用果瓦系数进行度量:
其中,为远动信息源和远动信息源的果瓦系数,为远动信息源和远动信息源在和上的取值,和分别表示第y1、y2台远动信息源的第个最优多阶特征,为加权变量,,,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤三:重复步骤二直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。
作为本发明的一种优选方案,所述步骤S3中,判别远动信息源的工况状态的具体方法包括:
量化同一集群中的远动信息源两两之间的距离,所述距离用欧式距离度量,所述欧式距离的计算公式为:
设置距离阈值,基于所述距离阈值判定所述集群中远动信息源的运行状况。
作为本发明的一种优选方案,所述基于所述距离阈值判定所述集群中远动信息源的运行状况的方法包括:
若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量超过集群远动信息源总数目n2的85%,则确定远动信息源y运行状况为异常,否则,确定远动信息源y运行状况正常。
作为本发明的一种优选方案,本发明提供了一种根据所述的远动信息源的自动审核方法的审核系统,包括:
信息特征处理单元,用于对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
信息源集群划分单元,用于利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;
信息源审核单元,用于对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
作为本发明的一种优选方案,所述信息源审核单元还包括人工抽检单元,所述人工抽检单元用于定期对信息源审核单元进行人工审核实现对远动信息源的二次审核以确保审核的高准确度。
本发明与现有技术相比较具有如下有益效果:
本发明利用多目标搜索策略和特征融合策略在远动信息源的台账日志中依次进行特征提取、降维和融合选取出区分远动信息源分簇效果最好的最优多阶特征,并采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,以此为依据的每一个集群远动信息源之间理应具有相似的状态,再通过同一集群中远动信息源的运行监测数据的互比较了解集群内设备的差异性,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
图1为本发明实施例提供的自动审核方法流程图;
图2为本发明实施例提供的最优多阶特征生成流程图;
图3为本发明实施例提供的远动信息源集群结构示意图;
图4为本发明实施例提供的审核系统结构框图。
图中的标号分别表示如下:
1-信息特征处理单元;2-信息源集群划分单元;3-信息源审核单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1-4所示,本发明实施例提供了一种远动信息源的自动审核方法,包括以下步骤:
如图2所示,步骤S1、对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成最优信息特征组合,最优信息特征组合用于构建并自动审核远动信息源。
步骤S1中,对远动信息源进行远动信息特征的提取的具体方法包括:
步骤S101、收集远动信息源的台账日志,并在台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集,其中,正样本为处于同类工况状态的远动信息源的工况数据,负样本为处于他类工况状态的远动信息源的工况数据;
同类是指远动信息源的台账参数、工况数据相似可归属于同一类别即集群,他类是指远动信息源的台账参数、工况数据差异度大,不可归属于同一类别即集群。
步骤S102、对远动样本集中进行特征提取获得第一单阶特征,并将第一单阶特征利用相关性分析实现特征降维获得第二单阶特征;
步骤S103、基于远动样本集获取第二单阶特征的特征值,并将第二单阶特征的特征值与第二单阶特征建立新映射获得第一远动信息源集群样本集。
步骤S102中,相关性分析实现特征降维的具体方法包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对并将双特征对的特征值带入相关性计算公式获得双特征对的相关性系数,相关性系数计算公式为:
遍历选取相关性系数高于相关性阈值的第一双特征对,并在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分获得的第一单阶特征汇总构成第二单阶特征。
相关性系数是指两个特征的相似程度,利用相关性系数量化第一单阶特征间的相似程度,而后将第一单阶特征间相似程度高的多个特征仅用一个特征进行表征即可,实现特征降维的同时避免删除有效特征,特征降维可以有效的减少无效计算,并提高集群划分的运算精度。
步骤S1中,对远动信息特征进行融合优化的具体方法包括:
利用笛卡尔积将第二单阶特征进行编码融合获得第一多阶特征,并基于第一多阶特征对第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于过渡远动信息源集群样本集利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。
将单阶特征利用笛卡尔积方式融合形成多阶特征,可将单阶特征之间的区分属性进行增强,从而基于多阶特征建立的集群划分算法的区分能力得以增强,则可提高集群划分精度,将远动信息源精准归属至远动信息源集群集群。
多目标搜索策略筛选第一多阶特征获得最优多阶特征的具体方法包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,目标函数为:
其中,minf为目标函数值和为权重常数,,MNI为聚类准确度,t为第一多阶特征的使用数目,,M为第一多阶特征的总数目,H为混合矩阵,表征为过渡远动信息源集群样本集中的正负样本的聚类集群结构中正负样本集群k内的样本同时处于正负样本的真实聚类集群结构中正负样本集群l内的数目,np 1和np 2分别是和划分结果中的集群个数,H k 和H l 分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
利用聚类准确度和第一多阶特征的使用数目构建的目标函数,其中,聚类算法而言使用的特征数目越多则聚类准确度越高,因此第一多阶特征的使用数目与距离准确度存在互斥的竞争关系,同时第一多阶特征的使用数目与聚类准确度二者又分别体现了聚类分集群的两种优化目标,即少使用特征数目降低计算量获得多使用特征数目提高聚类准确度,因此将存在竞争的第一多阶特征的使用数目与聚类准确度进行权重组合,将单个目标的优化转变为多个目标的优化,实现对第一多阶特征的使用数目与聚类准确度的折衷优化以获得快速精确将远动信息源归置到集群中的最优多阶特征。
而且将目标函数设置为第一多阶特征的使用数目与聚类准确度的权重组合的反值,将多目标优化问题转变为目标函数的最小值求解问题,简化计算过程,提高效率。
线性标定目标函数构建适应度函数,并利用多目标搜索算法求解目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;
选取最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源划分至多组远动信息源集群的最优多阶特征,适应度函数的计算公式为:
适应度值反应了个体对环境的适应能力强弱,因此可以构建适应度函数来衡量个体的优劣,而且适应度函数可以在不利用外部信息的情况下,作为是多目标搜索算法挑选优秀个体的唯一依据,它由优化问题中目标函数映射而来,在本实施例的多目标优化问题中反映了Pareto解集中解的优劣,适应度值越高,则解越优。
步骤S2、利用最优信息特征组合将远动信息源进行同属性划分获得多组远动信息源集群;
步骤S2中,利用最优信息特征组合将远动信息源进行同属性划分获得多组远动信息源集群的具体方法包括:
步骤一:基于最优多阶特征将所有远动信息源分别量化为单个远动信息源集群,其中表示第y台远动信息源的最优多阶特征的集合,表示第y台远动信息源的第个最优多阶特征,,,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,相似性用果瓦系数进行度量:
其中,为远动信息源和远动信息源的果瓦系数,为远动信息源和远动信息源在和上的取值,和分别表示第y1、y2台远动信息源的第个最优多阶特征,为加权变量,,,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤三:重复步骤二直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。
如图3所示,远动信息源集群包括五个集群,举例说明,集群1中的所有远动信息源具有相似的台账参数、工况数据,同理集群2中的所有远动信息源具有也具有相似台账参数、工况数据,而集群1和2之间的远动信息源台账参数、工况数据差异度大,因此可对集群1内部的各远动信息源的在线运行数据进行内相似性比对,并判别远动信息源的运行状态。
步骤S3、对远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
步骤S3中,判别远动信息源的工况状态的具体方法包括:
量化同一集群中的远动信息源两两之间的距离,距离用欧式距离度量,欧式距离的计算公式为:
设置距离阈值,基于距离阈值判定集群中远动信息源的运行状况。
基于距离阈值判定集群中远动信息源的运行状况的方法包括:
若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量超过集群远动信息源总数目n2的85%,则确定远动信息源y运行状况为异常,否则确定远动信息源y运行状况正常。
如图4所示,基于上述远动信息源的自动审核方法,本发明提供了一种审核系统,包括:
信息特征处理单元1,用于对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
信息源集群划分单元2,用于利用最优信息特征组合将远动信息源进行同属性划分获得多组远动信息源集群;
信息源审核单元3,用于对远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
信息源审核单元还包括人工抽检单元,人工抽检单元用于定期对信息源审核单元进行人工审核实现对远动信息源的二次审核以确保审核的高准确度
本发明利用多目标搜索策略和特征融合策略在远动信息源的台账日志中依次进行特征提取、降维和融合选取出区分远动信息源分簇效果最好的最优多阶特征,并采用层次聚类算法将台账参数、工况数据相似的远动信息源划分进同一远动信息源集群,以此为依据的每一个集群远动信息源之间理应具有相似的状态,再通过同一集群中远动信息源的运行监测数据的互比较了解集群内设备的差异性,能迅速判断哪台远动信息源处于异常状态,且异常检测准确率高。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。
Claims (8)
1.一种远动信息源的自动审核方法,其特征在于,包括以下步骤:
步骤S1、对远动信息源进行远动信息特征的提取,并对所述远动信息特征进行融合优化,生成最优信息特征组合;
步骤S2、利用所述最优信息特征组合对所述远动信息源进行同属性划分,获得多组远动信息源集群;
步骤S3、对所述远动信息源集群进行内相似性分析,判别远动信息源的工况状态,以实现远动信息源的自动审核;
所述步骤S1中,所述对远动信息源进行远动信息特征的提取,包括:
步骤S101、收集远动信息源的台账日志,并在所述台账日志中随机抽取相同数量的正样本和负样本混合构成远动样本集;其中,所述正样本为处于同类工况状态的远动信息源的工况数据,所述负样本为处于他类工况状态的远动信息源的工况数据;
步骤S102、对所述远动样本集进行特征提取获得第一单阶特征,将所述第一单阶特征利用相关性分析实现特征降维,获得第二单阶特征;
步骤S103、基于所述远动样本集获取所述第二单阶特征的特征值,基于第二单阶特征的特征值与所述第二单阶特征建立新映射,获得第一远动信息源集群样本集;
所述步骤S1中,所述对所述远动信息特征进行融合优化,包括:
利用笛卡尔积将所述第二单阶特征进行编码融合获得第一多阶特征,基于所述第一多阶特征对所述第一远动信息源集群样本集进行第一映射更新生成过渡远动信息源集群样本集;
基于所述过渡远动信息源集群样本集,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,并基于最优多阶特征对所述过渡远动信息源集群样本集进行第二映射更新获得第二远动信息源集群样本集。
2.根据权利要求1所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S102包括:
依次将第一单阶特征中所有特征进行两两配对组合获得双特征对,将所述双特征对的特征值带入相关性计算公式,获得双特征对的相关性系数;
相关性系数计算公式为:
遍历选取相关性系数高于相关性阈值的第一双特征对,在第一双特征对中随机选取第一特征,并对应删除所有双特征对中的第一特征,直至第一双特征对遍历完成;
将所有双特征对进行配对拆分所获得的第一单阶特征汇总构成第二单阶特征。
3.根据权利要求1所述的一种远动信息源的自动审核方法,其特征在于,所述基于所述过渡远动信息源集群样本集,利用多目标搜索策略筛选第一多阶特征获得最优多阶特征,包括:
利用第一多阶特征在过渡远动信息源集群样本集中的正负样本的聚类准确度和第一多阶特征的使用数目构建多目标搜索策略的目标函数,所述目标函数为:
其中,minf为目标函数值,和为权重常数,,MNI为聚类准确度,t为第一多阶特征的使用数目,,M为第一多阶特征的总数目,H为混合矩阵,表征为过渡远动信息源集群样本集中的所述正负样本的聚类集群结构中正负样本集群k内的样本同时处于所述正负样本的真实聚类集群结构中正负样本集群l内的数目,np 1和np 2分别是和划分结果中的集群个数,H k 和H l 分别为混合矩阵H中第k行和第l列的元素之和,N为过渡远动信息源集群样本集的样本数目;
线性标定所述目标函数构建适应度函数,并利用多目标搜索算法求解所述目标函数获得一组由第一多阶特征组成的最优多阶特征的Pareto解集;
选取所述最优多阶特征的Pareto解集中适应度值最高的解作为将远动信息源,划分至多组远动信息源集群的最优多阶特征;
所述适应度函数的计算公式为:
4.根据权利要求3所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S2包括:
步骤一:基于所述最优多阶特征将所有远动信息源分别量化为单个远动信息源集群,其中表示第y台远动信息源的最优多阶特征的集合,表示第y台远动信息源的第个最优多阶特征,,,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤二:依次计算两远动信息源集群的外相似性,并基于最大相似性进行集群融合归一,所述集群的相似性为两集群中相似性最大的一对远动信息源之间的相似性,所述相似性用果瓦系数进行度量:
其中,为远动信息源和远动信息源的果瓦系数,为远动信息源和远动信息源在和上的取值,和分别表示第y1、y2台远动信息源的第个最优多阶特征,为加权变量,,,m为最优多阶特征的总数目,n为远动信息源的总数目;
步骤三:重复步骤二,直至当前远动信息源集群总数目是最初远动信息源集群总数目的6%完成聚类。
5.根据权利要求4所述的一种远动信息源的自动审核方法,其特征在于,所述步骤S3中,所述判别远动信息源的工况状态,包括:
量化同一集群中的远动信息源两两之间的距离,所述距离用欧式距离度量;
所述欧式距离的计算公式为:
设置距离阈值,基于所述距离阈值判定所述集群中远动信息源的运行状况。
6.根据权利要求5所述的一种远动信息源的自动审核方法,其特征在于,所述基于所述距离阈值判定所述集群中远动信息源的运行状况,包括:
若各远动信息源集群中与远动信息源y的距离大于距离阈值的远动信息源数量,超过集群远动信息源总数目n2的85%,则确定远动信息源y运行状况为异常;否则,确定远动信息源y运行状况正常。
7.一种远动信息源的自动审核系统,其特征在于,用于实现如权利要求1至6任一项所述的远动信息源的自动审核方法,包括:
信息特征处理单元(1),用于对远动信息源进行远动信息特征的提取,并对远动信息特征进行融合优化生成构建远动信息源快速且精准的自动审核的最优信息特征组合;
信息源集群划分单元(2),用于利用所述最优信息特征组合将所述远动信息源进行同属性划分获得多组远动信息源集群;
信息源审核单元(3),用于对所述远动信息源集群进行内相似性分析判别远动信息源的工况状态以实现远动信息源的自动审核。
8.根据权利要求7所述的一种远动信息源的自动审核系统,其特征在于,所述信息源审核单元(3)还包括人工抽检单元,所述人工抽检单元用于定期对信息源审核单元进行人工审核,实现对远动信息源的二次审核。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110810585.3A CN113283881B (zh) | 2021-07-19 | 2021-07-19 | 一种远动信息源的自动审核方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110810585.3A CN113283881B (zh) | 2021-07-19 | 2021-07-19 | 一种远动信息源的自动审核方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113283881A CN113283881A (zh) | 2021-08-20 |
CN113283881B true CN113283881B (zh) | 2021-11-12 |
Family
ID=77286707
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110810585.3A Active CN113283881B (zh) | 2021-07-19 | 2021-07-19 | 一种远动信息源的自动审核方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113283881B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113791300A (zh) * | 2021-11-15 | 2021-12-14 | 广东电网有限责任公司东莞供电局 | 一种充电站的充电枪状态监测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110388315A (zh) * | 2019-07-05 | 2019-10-29 | 中国石油大学(北京) | 基于多源信息融合的输油泵故障识别方法、装置及系统 |
CN112134871A (zh) * | 2020-09-16 | 2020-12-25 | 天津大学 | 一种能源互联网信息支撑网络的异常流量检测装置及方法 |
CN112950276A (zh) * | 2021-03-12 | 2021-06-11 | 华扬联众数字技术(深圳)有限公司 | 一种基于多阶特征组合的种子人群拓展方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101959213A (zh) * | 2009-07-13 | 2011-01-26 | 深圳市泰利得通信技术有限公司 | 一种远动通信系统测试方法 |
CN104052159B (zh) * | 2014-06-25 | 2016-08-24 | 中国东方电气集团有限公司 | 一种用于风光储微网系统的能量管理控制器 |
CN108074021A (zh) * | 2016-11-10 | 2018-05-25 | 中国电力科学研究院 | 一种配电网风险辨识系统及方法 |
CN111768082A (zh) * | 2020-06-02 | 2020-10-13 | 广东电网有限责任公司 | 一种基于大数据分析的电力设备状态评估方法 |
CN112541833B (zh) * | 2020-12-07 | 2023-04-28 | 广东电网有限责任公司 | 基于特征匹配知识库的电力系统远动数据质量治理方法及其系统 |
-
2021
- 2021-07-19 CN CN202110810585.3A patent/CN113283881B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110388315A (zh) * | 2019-07-05 | 2019-10-29 | 中国石油大学(北京) | 基于多源信息融合的输油泵故障识别方法、装置及系统 |
CN112134871A (zh) * | 2020-09-16 | 2020-12-25 | 天津大学 | 一种能源互联网信息支撑网络的异常流量检测装置及方法 |
CN112950276A (zh) * | 2021-03-12 | 2021-06-11 | 华扬联众数字技术(深圳)有限公司 | 一种基于多阶特征组合的种子人群拓展方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113283881A (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113077020B (zh) | 一种变压器集群管理方法及系统 | |
CN107609783B (zh) | 一种基于数据挖掘的智能电能表综合性能进行评估的方法及系统 | |
CN108898311A (zh) | 一种面向智能配电网抢修调度平台的数据质量检测方法 | |
CN109492683A (zh) | 一种针对广域量测电力大数据数据质量的快速在线评估方法 | |
CN106651169A (zh) | 基于模糊综合评价的配电自动化终端状态评价方法及系统 | |
CN111881124A (zh) | 一种基于改进算法的状态估计的数据处理方法及系统 | |
CN113887908A (zh) | 考虑主客观交叉融合权重的桥梁风险评估方法 | |
CN113283881B (zh) | 一种远动信息源的自动审核方法及系统 | |
CN116579768B (zh) | 一种发电厂在线仪表运维管理方法及系统 | |
CN116862081B (zh) | 一种污染治理设备运维方法及系统 | |
CN112990776B (zh) | 一种配网设备健康度评价方法 | |
CN110632546A (zh) | 基于全网域证据集的电子式互感器可信度评估方法和装置 | |
CN113762764A (zh) | 一种进口食品安全风险自动分级与预警系统及方法 | |
CN112101761A (zh) | 清洁低碳、安全高效的能源体系建设成效综合评价方法 | |
CN114487332A (zh) | 一种地表水水质自动监测站运行效果评价方法、系统、介质及设备 | |
CN113327047A (zh) | 基于模糊综合模型的电力营销服务渠道决策方法及系统 | |
CN117154716B (zh) | 一种分布式电源接入配电网的规划方法及系统 | |
CN113689079A (zh) | 基于多元线性回归和聚类分析的台区线损预测方法及系统 | |
CN109378834A (zh) | 基于信息最大相关的大规模电网电压稳定裕度评估系统 | |
CN113919610A (zh) | 低压台区线损预测用arima模型构建方法及评估方法 | |
CN112381422A (zh) | 光伏电站性能的确定方法和装置 | |
CN110781959A (zh) | 基于birch算法和随机森林算法的电力客户分群方法 | |
CN115951123A (zh) | 一种基于无线通信的电能计量方法及系统 | |
CN116341290A (zh) | 一种长贮装备可靠性抽样检测方法 | |
CN114707784A (zh) | 一种基于组合赋权法的权重确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |