CN111985815A

CN111985815A - 一种能源电力运营评价指标的筛选方法及装置

Info

Publication number: CN111985815A
Application number: CN202010847472.6A
Authority: CN
Inventors: 刘威; 柳占杰; 高鸿达; 于灏; 陈睿欣; 郑厚清; 孙艺新; 贾德香; 王智敏; 刘素蔚; 王玓; 陈�光; 崔维平; 王程; 李心达; 刘睿
Original assignee: State Grid Energy Research Institute Co Ltd
Current assignee: State Grid Energy Research Institute Co Ltd
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2020-11-24

Abstract

本申请提供了一种能源电力运营评价指标的筛选方法及装置，方法包括：从数据库中获取能源相关数据，能源相关数据包括：运行数据、管理数据和客户数据；从能源相关数据中确定评价指标的属性，并根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合；利用Rand指数验证指标聚类集合的聚类结果，并根据验证结果确定基础参数；根据基础参数和指标聚类集合从评价指标中筛选获得核心指标。本申请通过无监督学习在全量特征中优化组合，提出基于聚类算法的特征筛选技术路线，聚合核心指标，保留大部分指标价值，解决多种特征科学筛选问题。本申请减低了在指标筛选过程中对人的过度依赖，提高了指标筛选的效率和科学性。

Description

一种能源电力运营评价指标的筛选方法及装置

技术领域

本申请属于能源电力运营技术领域，具体地讲，涉及一种能源电力运营评价指标的筛选方法及装置。

背景技术

能源电力领域正在面临数字革命的挑战，市场因素逐渐融入到能源企业运营管理流程，将对能源企业产生重要影响能源电力相关企业面临市场挑战，急需建立完备的指标体系，对数字时代能源电力企业进行合理全面的管理监督。

科学的评价指标体系是综合评价的重要前提，只有科学的评价指标体系，才有可能得出科学的综合评价结论，在构造综合评价体系框架时，初选的评价指标可以尽可能的全面。在指标体系优化的时候则需要考虑指标体系的全面性、科学性、层次性、可操作性、目的性等。当指标太多时，就会有很多重复指标，相互干扰，这就需要正确的、科学的方法筛选指标。目前，评价指标选取有多种方案。基于区分度分析方法，区分度是表示指标之间的差异长度，区分度越大指标特性越大，越具有代表性。基于相关性的分析方法，同一指标体系中指标之间的重叠性应尽量低，大量指标冗余容易出现结果失真。层次分析法，是指将与决策总是有关的元素分解成目标、准则、方案等层次，在此基础之上进行定性和定量分析的决策方法。层次分析法将一个负责的多目标决策问题作为一个系统，将目标分解为多个目标或准则，进而分解为多指标的若干层次，通过定性指标模糊量化方法算出层次单排序和总排序，已作为目标、多方案优化决策的系统方法。层次分析法基本逻辑是将决策问题按总目标、各层子目标、评价准则直至将具体的方案的顺序分解为不同的层次结构，然后用求解判断矩阵特征向量的办法，求得每一层次的各元素对上一层次某元素的优先权重，最终权重最大者即为最优方案。对于能源电力行业，随着新农村形势下的全能型乡镇供电所业务的全面化、精准化，使得乡镇供电所的运行环境也更加复杂。

综上所述，现有方案人为因素影响较大，对指标筛选起决定性作用。数字时代信息量增长迅速，影响因素也不断增多，以人为经验为主导的指标筛选方法已经不能满足需求，对科学合理的指标建设需求急迫。

发明内容

本申请提供了一种能源电力运营评价指标的筛选方法及装置，以至少解决目前在能源电力行业主要以人为经验为标准进行指标筛选的问题。

根据本申请的一个方面，提供了一种能源电力运营评价指标的筛选方法，包括：

从数据库中获取能源相关数据，能源相关数据包括：运行数据、管理数据和客户数据；

从能源相关数据中确定评价指标的属性，并根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合；

利用Rand指数验证指标聚类集合的聚类结果，并根据验证结果确定基础参数；

根据基础参数和指标聚类集合从评价指标中筛选获得核心指标。

在一实施例中，根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合，包括：

根据评价指标的属性计算评价指标之间的相关性；

采用K-means聚类算法以及评价指标之间的相关性将评价指标进行聚合分类获得相似的指标聚类集合。

在一实施例中，根据基础参数和指标聚类集合从评价指标中筛选获得核心指标，包括：

根据验证后的聚类结果，将指标聚类集合中相关性低于预设值的评价指标剔除，获得筛选后的评价指标；

计算筛选后的评价指标的算术平均值确定指标聚类集合的核心指标。

在一实施例中，根据评价指标的属性计算评价指标之间的相关性，包括：

根据评价指标的属性采用Minkovski距离算法计算评价指标之间的距离；或

根据评价指标的属性计算评价指标之间的皮尔逊相关系数；或

根据VDM距离算法基于评价指标的属性计算评价指标之间的VDM距离。

根据本申请的另一个方面，还提供了一种能源电力运营评价指标的筛选装置，包括：

数据获取单元，用于从数据库中获取能源相关数据，能源相关数据包括：运行数据、管理数据和客户数据；

指标聚类单元，用于从能源相关数据中确定评价指标的属性，并根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合；

Rand指数验证单元，用于利用Rand指数验证指标聚类集合的聚类结果，并根据验证结果确定基础参数；

核心指标筛选单元，用于根据基础参数和指标聚类集合从评价指标中筛选获得核心指标。

在一实施例中，指标聚类单元包括：

相关性获取模块，用于根据评价指标的属性计算评价指标之间的相关性；

聚类集合获取模块，用于采用K-means聚类算法以及评价指标之间的相关性将评价指标进行聚合分类获得相似的指标聚类集合。

在一实施例中，核心指标筛选单元包括：

误差剔除模块，用于根据验证后的聚类结果，将指标聚类集合中相关性低于预设值的评价指标剔除，获得筛选后的评价指标；

核心指标计算模块，用于计算筛选后的评价指标的算术平均值确定指标聚类集合的核心指标。

在一实施例中，相关性获取模块，包括：

Minkovski距离算法计算模块，用于根据评价指标的属性采用Minkovski距离算法计算评价指标之间的距离；

皮尔逊相关系数计算模块，用于根据评价指标的属性计算评价指标之间的皮尔逊相关系数；

VDM计算模块，用于根据VDM距离算法基于评价指标的属性计算评价指标之间的VDM距离。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请提供的一种能源电力运营评价指标的筛选方法流程图。

图2为本申请实施例中对评价指标进行聚合分类的流程图。

图3为本申请实施例中数据样本用圆点示意图。

图4为本申请实施例中从评价指标中筛选获得核心指标的流程图。

图5为本申请实施例中一种电子设备的具体实施方式。

图6为本申请提供的一种能源电力运营评价指标的筛选装置框图。

图7为本申请实施例中指标聚类单元的结构框图。

图8为本申请实施例中核心指标筛选单元的结构框图。

图9为本申请实施例中相关性获取模块的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

基于背景技术中所存在的问题，本申请依托乡镇供电所的运营评价场景，从各项业务需求出发，建立了无监督学习指标的筛选模型，致力于解决运营评价指标的科学合理筛选的问题。如图1所示，为本申请提供的一种能源电力运营评价指标的筛选方法，包括：

S101：从数据库中获取能源相关数据，能源相关数据包括：运行数据、管理数据和客户数据。

S102：从能源相关数据中确定评价指标的属性，并根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合。

通过调研实际需求来确定指标属性，然后结合需求选择合理的聚类算法，将众多指标聚合分类调整聚类簇数量，使功能、效果相似的指标相聚合，减轻多种指标初步筛选难度。

在一实施例中，根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合，如图2所示，包括：

S201：根据评价指标的属性计算评价指标之间的相关性。

S202：采用K-means聚类算法以及评价指标之间的相关性将评价指标进行聚合分类获得相似的指标聚类集合。

在一具体实施例中，首先通过距离计算获取评价指标之间的相关性，聚类算法核心在于距离计算，常用的距离计算方法有：

(1)Minkovski距离

给定样本

Minkovski距离定义为：

其中，p表征空间维度，当p＝1时，Minkovski距离转化为曼哈顿距离(Manhattandistance)；当p＝2时，Minkovski距离转化为欧式距离(Euvlidean distance)。

(2)皮尔逊相关系数

皮尔逊相关系数是统计学的重要系数指标，有多重应用形式。

式(2)为皮尔逊系数计算公式，两个连续变量(X,Y)的皮尔逊相关系数ρ_X,Y等于变量之间协方差鼠疫各自标准差的成绩。皮尔逊系数指介于-1到1之间，接近零的变量表示无相关性，接近1或-1的变量相关系数较强。皮尔逊相关系数可衡量变量之间线性关联程度。

(3)VDM距离

考虑非数值类属性，另m_d,a表示x^(d)＝a的样本数，m_d,a,k表示x^(d)＝a且位于簇C_k中的样本数量。则在属性d上的两个取值a,b之间的VDM距离为：

VDM距离刻画的是属性取值在各簇上的频率分布之间的差异。

在获得评价指标之间的距离，即相关性后，利用K-means聚类算法对这些评价指标进行聚类：

k-means算法采用距离作为相似性指标，从而发现给定数据集中的K个类，且每个类的中心是根据类中所有值的均值得到，每个类用聚类中心来描述。对于给定的一个包含n个d维数据点的数据集X以及要分得的类别K,选取欧式距离作为相似度指标，聚类目标是使得各类的聚类平方和最小。

给定样本集

假设聚类的簇划分C＝{C₁,C₂,…,C_K}，K-means算法的目标是最小化平方误差：

其中，

是簇C的均值向量。err越小，则簇内样本均值向量越紧密。

如图3所示，数据样本用圆点表示，每个簇的中心点用叉叉表示。聚类质心数量、每一类的样本数量等信息对K-means算法结果影响较大，也是关系到聚类算法性能的重要参量。对于聚类算法，需设置质心位置和样本数量。K-means算法实现过程如下：

1.聚类中心个数K

聚类中心的个数K需要事先给定，但在实际中这个K值的选定是非常难以估计的，并无相关数学依据和理论支撑。聚类中心个数需要调试过程中不断试错确定，通过设置一个[k,k+n]范围的K类值，逐个观察聚类结果，最终确定K值。

在实际情况中，对特定的数据集有对应一个最佳的K值，而换一个数据集，可能原来的K值效果就会下降。但是同一个项目中的一类数据，总体上来说，通过一个抽样小数据集确定一个最佳K值后，对之后的所有K值都能获得较好的效果

2.初始聚类中心(质心)的选择

K-means算法需要人为根据实际需求和经验确定初始聚类中心，不同的初始聚类中心可能导致完全不同的聚类结果。在实际使用中难以提前预知预判重要元素与非重要元素，质心选取难度较大。在实际计算过程中，可采用随机产生聚类质心策略，经过反复迭代确定最优质心。

假设数据集可以分为两类，令K＝2，随机在坐标上选两个点，作为两个类的中心点(聚类质心)

3.确定质心后，将余下的样本点根据距离度量标准进行归类

计算样本点和所有质心的“距离”，选取“距离”最小(argmin)的质心作为该样本所属的类别。这里要注意的是，特征空间中两个实例点的距离是两个实例点相似程度的反映，高维向量空间点的距离求解，可以泛化为高维距离公式，它在不同的阶次数中分为不同的形式。

S103：利用Rand指数验证指标聚类集合的聚类结果，并根据验证结果确定基础参数。

在一具体实施例中，利用Rand指数对聚类效果进行检验，指标筛选需要合理的指标支撑方法，分析最优分簇数量化额分簇效果。

(1)轮廓系数(silhouette coefficient)

轮廓系数系统考虑了内聚度和分离度两种因素，样本i的轮廓系数定义为：

其中，a(i)表示样本i与其所在簇内其他样本的平均距离，b(i)表示样本i与其他簇样本的平均距离。聚类总的轮廓系数sc为：

轮廓系数sc取值范围为[-1,1]，取值越接近1则说明聚类性能越好。

(2)Rand指数

选择合理的基础数据，用一定的度量评判聚类结果与基础数据符合程度。对数据集D＝{x₁,x₂,…,x_m}，假设通过聚类得到的簇划分为C＝{C₁,C₂,…,C_k}，参考模型给出的簇划分为

相应的将样本两两配对，定义：

则Rand指数(Rand Index,RI)表达式为：

RI结果在[0,1]区间，且数值越大聚类效果越好。

S104:根据基础参数和指标聚类集合从评价指标中筛选获得核心指标。

在一实施例中，根据基础参数和指标聚类集合从评价指标中筛选获得核心指标，如图4所示，包括：

S401：根据验证后的聚类结果，将指标聚类集合中相关性低于预设值的评价指标剔除，获得筛选后的评价指标。

S402：计算筛选后的评价指标的算术平均值确定指标聚类集合的核心指标。

本申请通过无监督学习在全量特征中优化组合，提出基于聚类算法的特征筛选技术路线，聚合核心指标，保留大部分指标价值，解决多种特征科学筛选问题。在指标筛选聚类模型构建中，提出不同指标聚类方法，并制定合理评估方法优化聚类簇数量和聚类效果，进而确定指标聚类结果，明确多种指标的相似关系，当进行核心指标筛选时，本申请提供了核心指标计算方法，建立起核心指标的基本体系，能够实现有效降低指标数量提高指标的针对性、有效性的效果。本申请减低了在指标筛选过程中对人的过度依赖，提高了指标筛选的效率和科学性。

基于同一发明构思，本申请实施例还提供了一种能源电力运营评价指标的筛选装置，可以用于实现上述实施例中所描述的方法，如下面实施例所述。由于该能源电力运营评价指标的筛选装置解决问题的原理与能源电力运营评价指标的筛选方法相似，因此能源电力运营评价指标的筛选装置的实施可以参见能源电力运营评价指标的筛选方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

本申请提供的一种能源电力运营评价指标的筛选装置，如图6所示，包括：

数据获取单元601，用于从数据库中获取能源相关数据，能源相关数据包括：运行数据、管理数据和客户数据；

指标聚类单元602，用于从能源相关数据中确定评价指标的属性，并根据评价指标的属性对评价指标进行聚合分类获得相似的指标聚类集合；

Rand指数验证单元603，用于利用Rand指数验证指标聚类集合的聚类结果，并根据验证结果确定基础参数；

核心指标筛选单元604，用于根据基础参数和指标聚类集合从评价指标中筛选获得核心指标。

在一实施例中，如图7所示，指标聚类单元602包括：

相关性获取模块701，用于根据评价指标的属性计算评价指标之间的相关性；

聚类集合获取模块702，用于采用K-means聚类算法以及评价指标之间的相关性将评价指标进行聚合分类获得相似的指标聚类集合。

在一实施例中，如图8所示，核心指标筛选单元604包括：

误差剔除模块801，用于根据验证后的聚类结果，将指标聚类集合中相关性低于预设值的评价指标剔除，获得筛选后的评价指标；

核心指标计算模块802，用于计算筛选后的评价指标的算术平均值确定指标聚类集合的核心指标。

在一实施例中，如图9所示，相关性获取模块701包括：

Minkovski距离算法计算模块901，用于根据评价指标的属性采用Minkovski距离算法计算评价指标之间的距离；

皮尔逊相关系数计算模块902，用于根据评价指标的属性计算评价指标之间的皮尔逊相关系数；

VDM计算模块903，用于根据VDM距离算法基于评价指标的属性计算评价指标之间的VDM距离。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式，参见图5，所述电子设备具体包括如下内容：

处理器(processor)501、内存502、通信接口(Communications Interface)503、总线504和非易失性存储器505；

其中，所述处理器501、内存502、通信接口503通过所述总线504完成相互间的通信；

所述处理器501用于调用所述内存502和非易失性存储器505中的计算机程序，所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。

在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施例的实施例而已，并不用于限制本说明书实施例。对于本领域技术人员来说，本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书实施例的权利要求范围之内。

Claims

1.一种能源电力运营评价指标的筛选方法，其特征在于，包括：

从数据库中获取能源相关数据，所述能源相关数据包括：运行数据、管理数据和客户数据；

从所述能源相关数据中确定评价指标的属性，并根据评价指标的属性对所述评价指标进行聚合分类获得相似的指标聚类集合；

利用Rand指数验证所述指标聚类集合的聚类结果，并根据验证结果确定基础参数；

根据所述基础参数和所述指标聚类集合从所述评价指标中筛选获得核心指标。

2.根据权利要求1所述的能源电力运营评价指标的筛选方法，其特征在于，所述根据评价指标的属性对所述评价指标进行聚合分类获得相似的指标聚类集合，包括：

根据评价指标的属性计算所述评价指标之间的相关性；

采用K-means聚类算法以及所述评价指标之间的相关性将所述评价指标进行聚合分类获得相似的指标聚类集合。

3.根据权利要求1所述的能源电力运营评价指标的筛选方法，其特征在于，所述根据所述基础参数和所述指标聚类集合从所述评价指标中筛选获得核心指标，包括：

根据验证后的聚类结果，将所述指标聚类集合中相关性低于预设值的评价指标剔除，获得筛选后的评价指标；

计算筛选后的评价指标的算术平均值确定所述指标聚类集合的核心指标。

4.根据权利要求2所述的能源电力运营评价指标的筛选方法，其特征在于，所述根据评价指标的属性计算所述评价指标之间的相关性，包括：

根据评价指标的属性采用Minkovski距离算法计算所述评价指标之间的距离；或

根据评价指标的属性计算所述评价指标之间的皮尔逊相关系数；或

根据VDM距离算法基于评价指标的属性计算所述评价指标之间的VDM距离。

5.一种能源电力运营评价指标的筛选装置，其特征在于，包括：

数据获取单元，用于从数据库中获取能源相关数据，所述能源相关数据包括：运行数据、管理数据和客户数据；

指标聚类单元，用于从所述能源相关数据中确定评价指标的属性，并根据评价指标的属性对所述评价指标进行聚合分类获得相似的指标聚类集合；

Rand指数验证单元，用于利用Rand指数验证所述指标聚类集合的聚类结果，并根据验证结果确定基础参数；

核心指标筛选单元，用于根据所述基础参数和所述指标聚类集合从所述评价指标中筛选获得核心指标。

6.根据权利要求5所述的能源电力运营评价指标的筛选装置，其特征在于，所述指标聚类单元包括：

相关性获取模块，用于根据评价指标的属性计算所述评价指标之间的相关性；

聚类集合获取模块，用于采用K-means聚类算法以及所述评价指标之间的相关性将所述评价指标进行聚合分类获得相似的指标聚类集合。

7.根据权利要求5所述的能源电力运营评价指标的筛选装置，其特征在于，所述核心指标筛选单元包括：

误差剔除模块，用于根据验证后的聚类结果，将所述指标聚类集合中相关性低于预设值的评价指标剔除，获得筛选后的评价指标；

核心指标计算模块，用于计算筛选后的评价指标的算术平均值确定所述指标聚类集合的核心指标。

8.根据权利要求6所述的能源电力运营评价指标的筛选装置，其特征在于，所述相关性获取模块，包括：

Minkovski距离算法计算模块，用于根据评价指标的属性采用Minkovski距离算法计算所述评价指标之间的距离；

皮尔逊相关系数计算模块，用于根据评价指标的属性计算所述评价指标之间的皮尔逊相关系数；

VDM计算模块，用于根据VDM距离算法基于评价指标的属性计算所述评价指标之间的VDM距离。

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至4中任意一项所述能源电力运营评价指标的筛选方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至4中任意一项所述能源电力运营评价指标的筛选方法。