CN113902485B

CN113902485B - 一种专变电力用户行业识别方法、装置及设备

Info

Publication number: CN113902485B
Application number: CN202111212168.5A
Authority: CN
Inventors: 周密; 祝宇翔; 李富盛; 刘傲; 钱斌; 李江南; 肖勇; 车诒颖
Original assignee: Shenzhen Power Supply Co ltd; China South Power Grid International Co ltd
Current assignee: Shenzhen Power Supply Co ltd; China South Power Grid International Co ltd
Priority date: 2021-10-18
Filing date: 2021-10-18
Publication date: 2024-08-13
Anticipated expiration: 2041-10-18
Also published as: CN113902485A

Abstract

本申请涉及一种专变电力用户行业识别方法、装置及设备，该识别方法通过X‑means聚类算法对每个专变电力用户每日的负荷曲线按照节假日、非节假日分别聚类，得到该专变电力用户的节假日和非节假日典型日负荷曲线；之后所有聚类后的m个专变电力用户的典型日负荷曲线按照节假日、非节假日分别进行第二次X‑means聚类，实现专变电力用户的有效行业分类，及时发现历史人为操作失误造成的专变电力用户档案录入错误的情况，提高行业识别效率。解决了现有对电力系统从智能电表获取的数据通过人工实现电力用户档案行业分类，此方式存在判断结果易出错、工作效率低且耗时耗力的技术问题。

Description

一种专变电力用户行业识别方法、装置及设备

技术领域

本申请涉及数据处理技术领域，尤其涉及一种专变电力用户行业识别方法、装置及设备。

背景技术

近年来，随着智能电表的全面覆盖与信息化建设的开展，各行业专变用户的用电行为分析受到了电力企业、政府及用户越来越多的关注。然而，大批量的历史电力用户档案录入都需经过用电客户申请、业务受理、现场勘查、计量录入、电费审核、归档等环节，电力用户的行业分类选择严重依赖于工作人员的经验判断以及系统操作，且归档后缺少对用户行业分类的校核，导致电力系统采集计算得到的行业电量及负荷数据的真实掌握存在不确定性。当根据电力系统采集数据，人员人为上判断行业总电量或者负荷数据与预期不符时，都需要调出该行业下所有用户，按照工作人员经验挑选可能分类错误的电力用户，安排运维人员现场走访调整，仍存在主观被动判断、耗费人力等问题。

发明内容

本申请实施例提供了一种专变电力用户行业识别方法、装置及设备，用于解决现有对电力系统从智能电表获取的数据通过人工实现电力用户档案行业分类，此方式存在判断结果易出错、工作效率低且耗时耗力的技术问题。

为了实现上述目的，本申请实施例提供如下技术方案：

一种专变电力用户行业识别方法，包括以下步骤：

获取同一个区域内的m个专变电力用户以及每个所述专变电力用户每日的数个负荷数据，并根据每个所述专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线；

采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线和曲线概率；

若同一个区域内中专变电力用户的典型日负荷曲线未进行行业分类，采用X-means聚类算法对m个所述专变电力用户的所有典型日负荷曲线按照节假日和非节假日分别进行聚类处理，得到聚类后同一个区域内的N条日负荷特征曲线；

若同一个区域内中专变电力用户的典型日负荷曲线已进行行业分类，采用欧式距离法对待行业分类的所述专变电力用户中典型日负荷曲线分别与同一个区域内的N条日负荷特征曲线计算，得到距离数据集合，从所述距离数据集合筛选出最小值对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线；

其中，一条所述典型日负荷曲线作为一个行业类别的日负荷曲线，所述典型日负荷曲线包括节日典型日负荷曲线和非假日典型日负荷曲线，所述曲线概率包括假日曲线概率和非假日曲线概率。

优选地，根据每个所述专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线之前，包括：根据每个所述专变电力用户的数个负荷数据中异常数据进行修复处理，得到修复后的负荷数据。

优选地，该专变电力用户行业识别方法包括：对每个所述专变电力用户的负荷数据中异常数据采用插值算法处理，得到修复后的负荷数据。

优选地，采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理之前，包括：对每条所述典型日负荷曲线的负荷数据采用最小-最大值归一化处理，得到归一化后的典型日负荷曲线。

优选地，采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线的步骤包括：

采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类，得到聚类后的日负荷曲线；

从聚类后的日负荷曲线中选择聚类天数最多的这类行业所有日负荷曲线对应的中心负荷曲线作为所述专变电力用户的典型日负荷曲线。

优选地，采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型概率的步骤包括：

根据聚类后的日负荷曲线，得到与节假日或非节假日日负荷曲线对应的行业类别和行业类别总数；

按每类行业类别中日负荷曲线条数从大到小排序，得到排序后行业类别；

对所述排序后行业类别中日负荷曲线条数逐一求和，并将求和条数与节假日或非节假日的日负荷曲线总条数对比，得到比值数值；

若所述比值数值大于阈值，则所述典型日负荷曲线的行业类别来自与所述求和条数对应的排序后行业类别；

其中，所述典型日负荷曲线的典型概率为所述比值数值。

优先地，该专变电力用户行业识别方法包括：选取N条日负荷特征曲线中间的一条日负荷特征曲线作为中心负荷特征曲线，所述中心负荷特征曲线为区域主行业的日负荷特征曲线。

优选地，该专变电力用户行业识别方法包括：获取每个所述专变电力用户每日的至少24个负荷数据。

本申请还提供一种专变电力用户行业识别装置，包括数据获取模块、聚类处理模块、第一识别模块和第二识别模块；

所述数据获取模块，用于获取同一个区域内的m个专变电力用户以及每个所述专变电力用户每日的数个负荷数据，并根据每个所述专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线；

所述聚类处理模块，用于采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线和曲线概率；

所述第一识别模块，用于根据同一个区域内中专变电力用户的典型日负荷曲线未进行行业分类，采用X-means聚类算法对m个所述专变电力用户的所有典型日负荷曲线按照节假日和非节假日分别进行聚类处理，得到聚类后同一个区域内的N条日负荷特征曲线；

所述第二识别模块，用于根据同一个区域内中专变电力用户的典型日负荷曲线已进行行业分类，采用欧式距离法对待行业分类的所述专变电力用户中典型日负荷曲线分别与同一个区域内的N条日负荷特征曲线计算，得到N个距离数据，从N个距离数据筛选出最小值对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线；

本申请还提供一种专变电力用户行业识别设备，包括处理器以及存储器；

所述存储器，用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器，用于根据所述程序代码中的指令执行上述所述的专变电力用户行业识别方法。

从以上技术方案可以看出，本申请实施例具有以下优点：提供一种专变电力用户行业识别方法、装置及设备，该识别方法包括：获取同一个区域内的m个专变电力用户以及每个专变电力用户每日的数个负荷数据，并根据每个专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线；采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线和曲线概率；若同一个区域内中专变电力用户的典型日负荷曲线未进行行业分类，采用X-means聚类算法对m个专变电力用户的所有典型日负荷曲线按照节假日和非节假日分别进行聚类处理，得到聚类后同一个区域内的N条日负荷特征曲线；若同一个区域内中专变电力用户的典型日负荷曲线已进行行业分类，采用欧式距离法对待行业分类的专变电力用户中典型日负荷曲线分别与同一个区域内的N条日负荷特征曲线计算，得到距离数据集合，从距离数据集合筛选出最小值对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线。该识别方法通过X-means聚类算法对每个专变电力用户每日的负荷曲线按照节假日、非节假日分别聚类，得到该专变电力用户的节假日和非节假日典型日负荷曲线；之后所有聚类后的m个专变电力用户的典型日负荷曲线按照节假日、非节假日分别进行第二次X-means聚类，实现专变电力用户的有效行业分类，及时发现历史人为操作失误造成的专变电力用户档案录入错误的情况，提高行业识别效率。解决了现有对电力系统从智能电表获取的数据通过人工实现电力用户档案行业分类，此方式存在判断结果易出错、工作效率低且耗时耗力的技术问题。

该专变电力用户行业识别方法通过对专变电力用户的负荷曲线采用X-means聚类进行聚类，即是将具有高度相似性曲线的划分为一类，而不同类的专变电力用户应该具有风格迥异的曲线特征，确定专变电力用户与所处日负荷特征曲线中对应的单个或多个行业是否一致，能够客观、主动、快速判断专变电力用户档案所选行业类别是否需要修正。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1为本申请一实施例的专变电力用户行业识别方法的步骤流程图；

图2为本申请一实施例的专变电力用户行业识别装置的框架图。

具体实施方式

为使得本申请的发明目的、特征、优点能够更加的明显和易懂，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本申请一部分实施例，而非全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

除非另有明确的规定和限定，本发明所述的术语“安装”、“相连”、“连接”以及所显示或讨论的“相互之间的耦合”或“直接耦合”或“通信连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通，也可以是通过一些接口，装置或单元的间接耦合或通信连接。对于本领域的普通技术人员而言，可以通过具体情况理解上述术语在本发明中的具体含义。

本申请实施例提供了一种专变电力用户行业识别方法、装置及设备，用于解决了现有对电力系统从智能电表获取的数据通过人工实现电力用户档案行业分类，此方式存在判断结果易出错、工作效率低且耗时耗力的技术问题。

图1为本申请一实施例的专变电力用户行业识别方法的步骤流程图。

如图1所示，本申请实施例提供了一种专变电力用户行业识别方法，包括以下步骤：

S1.获取同一个区域内的m个专变电力用户以及每个专变电力用户每日的数个负荷数据，并根据每个专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线。

需要说明的是，在步骤S1中主要是获取进行行业类别识别的专变电力用户足够多的负荷数据，建立一每日为单位的日负荷曲线。在本实施例中，日负荷曲线是以时间为横坐标、负荷为纵坐标建立的曲线。每条日负荷曲线对应一个行业类别。

在本申请实施例中，同一个区域下存在多行业和m个专变用户，同一个区域可为同一个电力企业下用户、同一个省级、地市级、区县级单位下的用户、同一气象站范围下用户，对于需要精细化确认用户行业的。其中，同一个区域不超过地市级范围，对于大电力企业整体行业分析的，同一个区域可为该电力企业下的所有专变用户。m个专变电力用户m的取值越大，对排查行业错误分类越佳，m必须大于选取的专变电力用户所处行业数的2倍，且各行业下至少有2户专变用户。

在本申请实施例中，用户档案行业分类按照2017版国民经济行业用电分类标准三级选择，涉及一级行业大类11类，二级行业分类71类，三级行业细项100余项。其中，每条日负荷曲线对应一个三级行业，那么一条典型日负荷曲线与用户档案行业对应于一个二级行业。

S2.采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线和曲线概率。

需要说明的是，在步骤S2中主要是将通过X-means聚类算法对每个专变电力用户的所有日负荷曲线分别按照节假日和非节假日进行聚类，分别得到聚类后的节日典型日负荷曲线和非假日典型日负荷曲线以及假日曲线概率和非假日曲线概率，为后续步骤S3和步骤S4提供数据以及识别依据。

在本申请实施例中，一条典型日负荷曲线作为一个行业类别的日负荷曲线。典型日负荷曲线包括节日典型日负荷曲线和非假日典型日负荷曲线，曲线概率包括假日曲线概率和非假日曲线概率。在本实施例中，每个专变电力用户聚类得到的典型日负荷曲线不少于2条。

S3.若同一个区域内中专变电力用户的典型日负荷曲线未进行行业分类，采用X-means聚类算法对m个专变电力用户的所有典型日负荷曲线按照节假日和非节假日分别进行聚类处理，得到聚类后同一个区域内的N条日负荷特征曲线。

需要说明的是，在步骤S3中主要是依据在一个区域中没有对专变电力用户进行行业分类，那么再次采用与步骤S2相同的X-means聚类算法分别对节假日和非节假日的典型日负荷曲线进行处理，得到聚类后同一个区域内的N条日负荷特征曲线，那么同一个区域内具有N个行业类别。

在本申请的实施例中，该专变电力用户行业识别方法包括选取N条日负荷特征曲线中间的一条日负荷特征曲线作为中心负荷特征曲线，中心负荷特征曲线作为该区域主行业的日负荷特征曲线。

S4.若同一个区域内中专变电力用户的典型日负荷曲线已进行行业分类，采用欧式距离法对待行业分类的专变电力用户中典型日负荷曲线分别与同一个区域内的N条日负荷特征曲线计算，得到距离数据集合，从距离数据集合筛选出最小值对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线。

需要说明的是，在步骤S4中主要是根据在该区域下已存在的专变电力用户进行聚类行业类别识别了，对新的专变电力用户(即是待行业识别的专变电力用户)采用欧式距离法将其自身的每条典型日负荷曲线与该区域已有的N条日负荷特征曲线进行计算，得到距离数据集合，将距离数据集合中最小数值的对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线。

在本申请的实施例中，若一个专变电力用户的典型日负荷曲线为x_{cus_i}＝{x_{cus_i_1},x_{cus_i_2},...,x_{cus_i_l}}；该区域已有的某j类行业类别的日负荷特征曲线为y_j＝{y_{j_1},y_{j_2},...,y_{j_h}}，则欧式距离为：该专变电力用户的典型日负荷曲线与该区域所有行业类别的日负荷特征曲线的距离数据最小值即为该专变电力用户的日负荷特征曲线；

式中，X_{cus_i_l}为专变电力用户第i条典型日负荷曲线的第l个负荷数据，y_{j_h}为某j类行业的第h条日负荷特征曲线，d为该专变电力用户的典型日负荷曲线与该区域某类行业的日负荷特征曲线的距离数据。

本申请提供的一种专变电力用户行业识别方法，包括：获取同一个区域内的m个专变电力用户以及每个专变电力用户每日的数个负荷数据，并根据每个专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线；采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线和曲线概率；若同一个区域内中专变电力用户的典型日负荷曲线未进行行业分类，采用X-means聚类算法对m个专变电力用户的所有典型日负荷曲线按照节假日和非节假日分别进行聚类处理，得到聚类后同一个区域内的N条日负荷特征曲线；若同一个区域内中专变电力用户的典型日负荷曲线已进行行业分类，采用欧式距离法对待行业分类的专变电力用户中典型日负荷曲线分别与同一个区域内的N条日负荷特征曲线计算，得到距离数据集合，从距离数据集合筛选出最小值对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线。该识别方法通过X-means聚类算法对每个专变电力用户每日的负荷曲线按照节假日、非节假日分别聚类，得到该专变电力用户的节假日和非节假日典型日负荷曲线；之后所有聚类后的m个专变电力用户的典型日负荷曲线按照节假日、非节假日分别进行第二次X-means聚类，实现专变电力用户的有效行业分类，及时发现历史人为操作失误造成的专变电力用户档案录入错误的情况，提高行业识别效率。解决了现有对电力系统从智能电表获取的数据通过人工实现电力用户档案行业分类，此方式存在判断结果易出错、工作效率低且耗时耗力的技术问题。

需要说明的是，该专变电力用户行业识别方法通过对专变电力用户的负荷曲线采用X-means聚类进行聚类，即是将具有高度相似性曲线的划分为一类，而不同类的专变电力用户应该具有风格迥异的曲线特征，确定专变电力用户与所处日负荷特征曲线中对应的单个或多个行业是否一致，能够客观、主动、快速判断专变电力用户档案所选行业类别是否需要修正。

在本申请的一个实施例中，专变电力用户行业识别方法包括：获取每个专变电力用户每日的至少24个负荷数据。

需要说明的是，建立的每个专变电力用户的日负荷曲线中包含有至少24个负荷数据。在本实施例中，以96个负荷数据作为案例说明，p_i＝{p_1,1,p_1,2,...,p_1,t,p_2,1,p_2,2,...,p_2,96,...,p_n,1,p_n,2,...,p_n,t}；p_i，t为第i日的负荷数据，t为每日获取负荷数据的时间点，n为负荷天数，i∈n，一般来说n大于365。

在本申请的一个实施例中，根据每个专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线之前，该专变电力用户行业识别方法包括：根据每个专变电力用户的数个负荷数据中异常数据进行修复处理，得到修复后的负荷数据。其中，对每个专变电力用户的负荷数据中异常数据采用插值算法处理，得到修复后的负荷数据。

需要说明的是，对每个专变电力用户的负荷数据中异常数据进行处理的方式可以分别采用四分位算法和四点插值法，也可以采用其它线性差值方法或神经网络算法。在本实施例中，四分位数是指将一个排好序的数据样本平均划分成四部分的3个数据点，每部分所包含的数据量是整个数据样本数据量的25％。一条日负荷曲线中的负荷数据作为一个样本，其中，一条日负荷曲线中的负荷数据是以时间进行排序的。若对于一个升序排列的样本X＝[x₁,x₂,...,x_b]，具体地：

首先，计算第2个四分位数即中位数Q₂

计算第1和第3个四分位数Q₁和Q₃，当b＝2c时，从Q₂处将X分为两部分，Q₂不包含在两部分数据之内，分别计算两部分的中位数Q′₂和Q″₂(Q′₂＜Q″₂)，则Q₁＝Q′₂，Q₃＝Q″₂。

当b＝4c+3时，有

当b＝4c+1时，有

通过计算出的Q₁和Q₃，可以得到四分位距：I_QR＝Q₃-Q₁。根据I_QR可以确定数据样本X中异常值的内限如下：[F₁,F_u]＝[Q₁-1.5I_QR,Q₃+1.5I_QR]。处于内限[F₁,F_u]以外的数据判定为异常值予以剔除，对处于内限[F₁,F_u]以内的数据判定为正常数据予以保留。分四位距与方差、标准差一样，表示一个变量的统计数据的分散情况，但四分位距是一种稳健统计，即I_QR的值不随个别的异常数据而有显著的变化，因此根据I_QR来识别异常值稳定可靠。

其次将识别得到的异常数据点的值替换为零值，使其和空缺数据呈现相同的数据状态，为进行数据修复做好准备。

之后是将数据集中所有的零值数据清空，并采取插值算法对原始数据中存在的大量空缺数据以及处理过的失真数据进行识别和修复。

最后采用插值细分算法利用相邻的4个点来计算新的插值点，在每次计算时都使用相同的运算规则。通过寻找与待插补时间相近的4个时间点，利用四点插值算法进行缺失数据插值具有理论可行性。

四点插值算法的具体计算式为：

式中，A_2t+1为待插补负荷数据；A_t-1,A_t,A_t+1,A_t+2分别为与待插补负荷数据最接近的4个时间所对应的负荷数据；ω为丈量参数，当ω∈[0,0.125]时，可得到较满意的插值点，本实施例中取区间中点，此时具有最佳的Holder正则性。

在本申请的一个实施例中，采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线的步骤包括：

采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类，得到聚类后的日负荷曲线；

从聚类后的日负荷曲线中选择聚类天数最多的这类行业所有日负荷曲线对应的中心负荷曲线作为专变电力用户的典型日负荷曲线。

需要说明的是，若每个专变电力用户包含有n条日负荷曲线，节假日的日负荷曲线为n1条、非节假日的日负荷曲线为n2条，n＝n1+n2，之后对节假日的日负荷曲线为n1条和非节假日的日负荷曲线为n2条分别采用X-means聚类算法进行聚类，得到聚类后的日负荷曲线，即是每类行业中聚类多条日负荷曲线，选择聚类条数最多的日负荷曲线(即是选择聚类天数最多这类行业中所有日负荷曲线)并将从这些日负荷曲线选取中间的一条日负荷曲线作为一条中心负荷曲线，该中心负荷曲线作为专变电力用户的典型日负荷曲线。在本实施例中，专变电力用户的典型日负荷曲线的数量至少两条，X-means聚类算法为现有技术，X-means聚类算法的内容此处不做限定。

在本申请的实施例中，采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型概率的步骤包括：

对排序后行业类别中日负荷曲线条数逐一求和，并将求和条数与节假日或非节假日的日负荷曲线总条数对比，得到比值数值；

若比值数值大于阈值，则典型日负荷曲线的行业类别来自与求和条数对应的排序后行业类别；

其中，典型日负荷曲线的典型概率为比值数值。

需要说明的是，对节假日的日负荷曲线聚类得到m1类行业(也称行业类别)，各类行业聚类后负荷曲线条数数量按由大到小排序为{n11、n12、n13……n1m1}，其中n11+n12+n13+……+n1m1＝n1；对非节假日的日负荷曲线聚类得到m2类，各类行业聚类后负荷曲线条数数量按由大到小排序为{n21、n22、n23……n2m2}，其中n21+n22+n23+……+n2m2＝n2。设定阈值K，K一般取50％。如K＝50％时，对于节假日的日负荷曲线，当行业类别中聚类的最多日负荷曲线为n11与节假日日负荷曲线的总数n1比值K1＝n11/n1>50％时，该专变电力用户的节假日典型日负荷曲线的行业类别来自n11日负荷曲线所在的行业类别，节假日典型概率η＝n11/n1；当K1＝n11/n1<50％时，判断K1＝(n11+n12)/n1是否大于50％，如大于50％，则该专变电力用户的节假日典型日负荷曲线的行业类别来自n11和n12日负荷曲线所在的行业类别，各自的典型概率η为n11/n1和n12/n1，以此类推，非节假日典型日负荷曲线选取的行业类别数目和对应概率也同样计算。在本实施例中，阈值可以根据需求设置。

在本申请的一个实施例中，采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理之前，该专变电力用户行业识别方法包括：对每条典型日负荷曲线的负荷数据采用最小-最大值归一化处理，得到归一化后的典型日负荷曲线。

需要说明的是，该专变电力用户行业识别方法采用X-means聚类算法对步骤S2聚类的同一区域内所有专变电力用户的节日典型日负荷曲线和非假日典型日负荷曲线中负荷数据单独进行归一化处理，以使得到的在步骤S3聚类的典型日负荷特征保留曲线的特征，部分保留专变电力用户整体负荷的量级，保证所有专变电力用户在统一维度下进行比较聚类。在本实施例中，归一化处理也可以选用最大归一化、Z-score归一化等处理方式。

实施例二：

如图2所示，本申请还提供一种专变电力用户行业识别装置，包括数据获取模块10、聚类处理模块20、第一识别模块30和第二识别模块40：

数据获取模块10，用于获取同一个区域内的m个专变电力用户以及每个专变电力用户每日的数个负荷数据，并根据每个专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线；

聚类处理模块20，用于采用X-means聚类算法对每个专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线和曲线概率；

第一识别模块30，用于根据同一个区域内中专变电力用户的典型日负荷曲线未进行行业分类，采用X-means聚类算法对m个专变电力用户的所有典型日负荷曲线按照节假日和非节假日分别进行聚类处理，得到聚类后同一个区域内的N条日负荷特征曲线；

第二识别模块40，用于根据同一个区域内中专变电力用户的典型日负荷曲线已进行行业分类，采用欧式距离法对待行业分类的专变电力用户中典型日负荷曲线分别与同一个区域内的N条日负荷特征曲线计算，得到N个距离数据，从N个距离数据筛选出最小值对应的日负荷特征曲线作为该专变电力用户行业类别的日负荷特征曲线；

其中，一条典型日负荷曲线作为一个行业类别的日负荷曲线，典型日负荷曲线包括节日典型日负荷曲线和非假日典型日负荷曲线，曲线概率包括假日曲线概率和非假日曲线概率。

需要说明的是，实施例二装置中模块的内容对应于实施例一控制方法的步骤内容，且实施例一控制方法的步骤内容已在实施例一详细阐述了，在此实施例中不再对实施例二装置中的模块进行详细阐述。

实施例三：

本申请还提供的一种专变电力用户行业识别设备，包括处理器以及存储器：

存储器，用于存储程序代码，并将程序代码传输给处理器；

处理器，用于根据程序代码中的指令执行上述的专变电力用户行业识别方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种专变电力用户行业识别方法，其特征在于，包括以下步骤：

其中，一条所述典型日负荷曲线作为一个行业类别的日负荷曲线，所述典型日负荷曲线包括节日典型日负荷曲线和非假日典型日负荷曲线，所述曲线概率包括假日曲线概率和非假日曲线概率；

采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型日负荷曲线的步骤包括：

从聚类后的日负荷曲线中选择聚类天数最多的这类行业所有日负荷曲线对应的中心负荷曲线作为所述专变电力用户的典型日负荷曲线；

采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理，得到典型概率的步骤包括：

对所述排序后行业类别中日负荷曲线条数逐一求和，并将求和条数与节假日或非节假日的日负荷曲线总条数对比，得到比值数值，所述典型日负荷曲线的典型概率为所述比值数值；

若所述比值数值大于阈值，则所述典型日负荷曲线的行业类别来自与所述求和条数对应的排序后行业类别。

2.根据权利要求1所述的专变电力用户行业识别方法，其特征在于，根据每个所述专变电力用户的数个负荷数据建立对应专变电力用户的日负荷曲线之前，包括：根据每个所述专变电力用户的数个负荷数据中异常数据进行修复处理，得到修复后的负荷数据。

3.根据权利要求2所述的专变电力用户行业识别方法，其特征在于，包括：对每个所述专变电力用户的负荷数据中异常数据采用插值算法处理，得到修复后的负荷数据。

4.根据权利要求1所述的专变电力用户行业识别方法，其特征在于，采用X-means聚类算法对每个所述专变电力用户的n条日负荷曲线按照节假日和非节假日分别进行聚类处理之前，包括：对每条所述典型日负荷曲线的负荷数据采用最小-最大值归一化处理，得到归一化后的典型日负荷曲线。

5.根据权利要求1所述的专变电力用户行业识别方法，其特征在于，包括：选取N条日负荷特征曲线中间的一条日负荷特征曲线作为中心负荷特征曲线，所述中心负荷特征曲线为区域主行业的日负荷特征曲线。

6.根据权利要求1所述的专变电力用户行业识别方法，其特征在于，包括：获取每个所述专变电力用户每日的至少24个负荷数据。

7.一种专变电力用户行业识别装置，其特征在于，包括数据获取模块、聚类处理模块、第一识别模块和第二识别模块；

8.一种专变电力用户行业识别设备，其特征在于，包括处理器以及存储器；

所述处理器，用于根据所述程序代码中的指令执行如权利要求1-6任意一项所述的专变电力用户行业识别方法。