CN114997321A

CN114997321A - 一种台区户变关系识别方法、装置、电子设备及存储介质

Info

Publication number: CN114997321A
Application number: CN202210685692.2A
Authority: CN
Inventors: 尹善耀; 许晓春; 何奕枫; 张胜强; 严利萍; 谢林翰; 刘静云; 钟振鑫
Original assignee: Guangdong Power Grid Co Ltd; Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd; Huizhou Power Supply Bureau of Guangdong Power Grid Co Ltd
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2022-09-02

Abstract

本发明公开了一种台区户变关系识别方法、装置、电子设备及存储介质。包括：获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据并对电表采集的时序电压数据进行标准化处理得标准化时序电压数据，针对每个电表的标准化时序电压数据提取特征并对特征进行聚类得到多个聚类集，每个聚类集中包含一个待识别变压器低压侧电表对应的特征向量以及多个用户端电表对应的特征向量。通过变压器低压侧和用户端的电表采集时序电压数据，不受采集范围所限制，也不易收到干扰，采集的时序电压数据准确度高，实现自动通过采集的时序电压数据识别户变关系，既节省人力成本，采集的时序电压数据不受范围所限制性，干扰小，能够准确识别大范围内的户变关系。

Description

一种台区户变关系识别方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及电力检测技术领域，尤其涉及一种台区户变关系识别方法、装置、电子设备及存储介质。

背景技术

随着经济的发展和城市化进程的不断推进，台区下的用户数量增长极为迅速，台区户变关系变动频繁，造成部分用户的真实户变关系与档案记载不相符的情况，正确的户变关系是负荷平衡管理、台区线损计算以及线路改造等业务开展的保障。

当前户变关系识别方法主要分为人工识别和台区设备识别，人工识别通过电力人员到各家各户现场进行用户台区归属的判断，台区设备识别主要依靠电力线宽带载波通信技术和脉冲电流采集数据后来实现户变关系。

上述人工识别的人力成本高、工作效率低、耗时长，而电力线宽带载波通信技术和脉冲电流采集数据，宽带载波信号传输范围有限，并且由于串扰等因素影响，易造成台区的错误归属问题，脉冲电流信号存在识别范围受限的影响。

发明内容

本发明提供一种台区户变关系识别方法、装置、电子设备及存储介质，以解决目前通过人工识别户变关系人力投入大，通过带载波通信技术和脉冲电流采集数据识别户变关系存在易受干扰、识别范围有限的问题。

第一方面，本发明实施例提供了一种台区户变关系识别方法，包括:

获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据；

对所述电表采集的所述时序电压数据进行标准化处理得标准化时序电压数据；

针对每个电表的标准化时序电压数据提取特征；

对所述特征进行聚类得到多个聚类集，每个所述聚类集中包含一个所述待识别变压器低压侧电表对应的特征向量以及所述待识别变压器低压侧的多个用户端电表对应的特征向量。

进一步的，所述对所述电表采集的所述时序电压数据进行标准化处理获得标准化时序电压数据之前，包括：

判断每个所述电表所采集的时序电压数据的采集率是否达到100％；

若否，则对所述时序电压数据进行插值处理，得到采样率为100％的时序电压数据；

若是，采用采样率为100％的时序电压数据构建原始电压矩阵U：

其中：N为用户和变压器的总数，d为电表采集的电压数据的总点数，

为电表i在t_h时刻的电压测量值，U的行向量U_i表示单个电表i在每一时刻的电压测量值，U的列向量

表示所有电表在t_h时刻的电压测量值。

进一步的，所述对所述电表采集的所述时序电压数据进行标准化处理得标准化时序电压数据，包括：

采用零均值标准化算法对所述原始电压矩阵U中的时序电压数据进行标准化处理，得到标准化后得到矩阵

其中，零均值标准化算法公式如下：

标准化后得到矩阵

如下：

其中：f_mean(U_i)为单个电表i的电压测量值的平均值，f_std(U_i)为单个电表i的电压测量值的标准差，

为标准化后的矩阵行向量，表示单个电表i在每一时刻的电压测量值的标准化值，

表示所有电表在t_h时刻的电压测量值的标准化值。

进一步的，所述针对每个电表的标准化时序电压数据提取特征，包括：

按照预设数值m将所述矩阵

划分为至少两个子序列矩阵；

针对每个所述子序列矩阵，根据所述子序列矩阵内的电压数据计算电压爬坡事件总数α和电压波动事件总数β，其中，电压爬坡事件总数α通过以下公式计算：

电压波动事件总数β通过以下公式计算：

上述公式中，

分别为每个子序列矩阵内的电压数据最大值和最小值，γ为设定的阈值，α_i为子序列矩阵内电表i的电压爬坡事件数，α为子序列矩阵内所有电表的电压爬坡事件数总和，k₁，k₂分别为子序列矩阵内电表i标准化后t_h时刻电压与t_h-1，t_h+1时刻电压线段斜率，ε为设定的阈值，

为电表i在t_h时刻的电压波动事件数，β_i为子序列矩阵内电表i的电压波动事件数，β为子序列矩阵内所有电表的电压波动事件数总和；

判断所述电压爬坡事件总数α是否小于预设阈值δ，以及判断所述电压波动事件总数β是否小于预设阈值η；

若是，计算所述子序列矩阵内每个电表的电压数据的均值，并采用所述均值替换所述电压数据；

若否，所述子序列矩阵内每个电表的电压数据保持不变；

采用多个所述子序列矩阵重新组成矩阵

以作为特征。

进一步的，所述对所述特征进行聚类得到多个聚类集，包括：

基于所述矩阵

利用高斯核函数构建电表间的权重矩阵W：

其中：w_i,j为权重矩阵W中的元素，表示电表i与电表j之间的权重关系，

为特征提取后矩阵

中电表i对应的行向量，

为特征提取矩阵

中电表j对应的行向量，σ为控制权重值大小的参数；

将权重矩阵的每一行元素求和得d_i,i＝1,2,…,N，并采用d_i组成N×N的对角矩阵得到度矩阵D:

通过等式

推导出拉普拉斯矩阵L；

计算拉普拉斯矩阵L的特征值和所述特征值对应的特征向量；

将特征值由小到大排列以确定出前k个特征值，将前k个特征值对应的k个特征向量ξ₁,ξ₂,…,ξ_k组成矩阵Y:

对矩阵Y中的每一行向量进行单位化后重新构成矩阵Q，其中，单位化公式如下：

矩阵Q如下：

将矩阵Q的每一行向量作为一个k维样本，并将矩阵Q中的N个样本进行基于K均值聚类算法计算获得聚类集，所述聚类集中包括一个待识别变压器低压侧电表对应的k为样本和所述待识别变压器低压侧的多个用户端电表对应的k为样本。

进一步的，所述将矩阵Q的每一行向量作为一个k维样本，并将矩阵Q中的N个样本进行基于K均值聚类算法计算获得聚类集，包括：

从N个样本中随机选取k个样本作为初始聚类中心；

计算所述N个样本与所述k个聚类中心之间的欧式距离，依据所述欧式距离将所述N个样本划分至距离最近的聚类中心所在聚类集中；

计算所述k个聚类集中样本的平均值，依据所述平均值重新确定所述k个聚类集的聚类中心，返回计算所述N个样本与所述k个聚类中心之间的欧式距离的步骤；

当所述k个聚类集的聚类中心不再发生改变时输出聚类集。

第二方面，本发明实施例还提供了一种台区户变关系识别装置，包括:

时序电压数据获取模块，用于获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据；

标准化处理模块，用于对所述电表采集的所述时序电压数据进行标准化处理得标准化时序电压数据；

特征提取模块，用于针对每个电表的标准化时序电压数据提取特征；

聚类模块，用于对所述特征进行聚类得到多个聚类集，每个所述聚类集中包含一个所述待识别变压器低压侧电表对应的特征向量以及所述待识别变压器低压侧的多个用户端电表对应的特征向量。

第三方面，本发明实施例还提供了一种电子设备，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个计算机程序，

当所述一个或多个计算机程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明第一方面所述的台区户变关系识别方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如本发明第一方面所述的台区户变关系识别方法。

本发明通过获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据，并进行标准化处理得到标准化时序电压数据，对每个电表的标准化时序电压数据进行特征提取，基于特征进行聚类得到多个聚类集，其中，每个聚类集中包含一个待识别变压器低压侧电表对应的特征向量以及待识别变压器低压侧的多个用户端电表对应的特征向量，即一个聚类集表示一个户变关系识别结果。本发明中通过变压器低压侧和用户端的电表采集时序电压数据，不受采集范围所限制，也不易收到干扰，采集的时序电压数据准确度高，并且通过对时序电压数据标准化、提取特征、聚类后得到户变关系识别结果，无需人工处理，实现了自动通过采集的时序电压数据识别户变关系，既节省了人力成本，采集的时序电压数据不受范围所限制性，干扰小，能够准确识别大范围内的户变关系。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种台区户变关系识别方法的流程图；

图2是本发明实施例二提供的一种台区户变关系识别方法的流程图；

图3是本发明实施例三提供的一种台区户变关系识别装置的结构示意图；

图4是本发明实施例四提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

实施例一

图1为本发明实施例一提供的一种台区户变关系识别方法的流程图，本实施例可适用于识别配电网中户变关系的情况，该方法可以由户变关系识别装置来执行，该装置可以通过软件和/或硬件的方式实现，并配置在本发明实施例的电子设备中，如图1所示，该台区户变关系识别方法包括如下步骤：

S110、获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据。

在配电网中，变压器低压侧安装有电表，用户端侧也安装有电表，可以通过抄表终端将电表的数据上传到数据库中。

配电网中有多个变压器，该变压器可以是低压变压器，例如输出220V、110V交流电的变压器，每个变压器低压侧可以连接多个用户，以为用户供电，本实施例需要识别的是每个变压器下的所有用户，或者是识别每个用户归属于某一变压器下，即识别户变关系。

待识别变压器低压侧可以是待识别变压器的输出端，所述用户端可以是属于该变压器所述台区下的用户。所述电表可以是智能电表，所述智能电表可以是以微处理器应用和网络通信技术为核心的智能化仪表，具有自动计量/测量、数据处理、双向通信和功能扩展等能力，本发明中不做具体限定。

其中，时序电压数据可以是按照预设周期采集所得的、按照采集时间先后顺序排列的电压数据序列，时序电压数据可以包括用户端的时序电压数据和变压器低压侧的时序电压数据，在一个示例中，时序电压数据的采集周期可以为每15分钟采集一次。

S120、对所述电表采集的所述时序电压数据进行标准化处理得标准化时序电压数据。

针对每个电表所采集的时序电压数据可以进行标准化处理，得到标准化时序电压数据，在一个示例中，可以采用零均值标准化算法对电表所采集的时序电压数据进行标准化，还可以采用min-max标准化(Min-max normalization)，log函数转换，atan函数转换，z-score标准化(zero-mena normalization)对时序电压数据进行标准化，本发明实施例对标准化方法不作限制。

S130、针对每个电表的标准化时序电压数据提取特征。

在一个可选实施例中，针对每个电表的标准化时序电压数据提取特征可以是对标准化时序电压数据进行自适应分段聚合近似操作，具体地，可以构建矩阵

该矩阵

的每一行元素为每个电表的标准化时序电压数据，然后按照预设数值m将矩阵

划分为至少两个子序列矩阵，针对每个子序列矩阵，根据子序列矩阵内的电压数据计算该子序列矩阵内的电压爬坡事件总数α和电压波动事件总数β，若果电压爬坡事件总数α小于预设阈值δ，并且电压波动事件总数β小于预设阈值η，则对于该子序列矩阵内每个电表的电压数据计算均值，采用该均值替换子序列矩阵内该电表的所有电压数据，反之，电压数据保持不变，然后采用更新后的子序列矩阵重新组成矩阵

作为特征。

其中，电压爬坡事件可以是子序列矩阵内每个电表的最大电压和最小电压的差值与预设阈值的表示，如果差值大于预设阈值，则确定发生爬坡事件，反之无爬坡事件，电压波动事件可以是子序列矩阵内每个电表所采集的电压的波动的表示，即对于子序列矩阵内每个电表所采集的任一个电压，通过该电压与前一电压计算出第一斜率，以及通过电压与后一电压计算出第二斜率，计算第一斜率与第二斜率的差值的绝对值，如果绝对值大于预设阈值，则确定发生电压波动事件，反之没有发生电压波动事件。

当然，本领域技术人员还可以通过其他方式提取特征，在一个示例中，可以在划分子系列矩阵后，采用子序列矩阵内的每个电表的电压数据生成电压曲线，将一个子序列矩阵内的所有电表的电压曲线输入预先训练特征提取模型中得到更新后的子序列矩阵，然后采用子序列矩阵重新组成矩阵作为特征，该矩阵中每一行元素可以是每一个电表的时序电压数据的特征。

S140、对所述特征进行聚类得到多个聚类集，每个所述聚类集中包含一个所述待识别变压器低压侧电表对应的特征向量以及多个用户端电表对应的特征向量。

通常地，变压器低压侧的时序电压数据与该变压器下所有用户的时序电压数据具有一定的相似性，示例性地，在一段时间内，如果变压器低压侧的电压发生爬坡事件，该变压器下的所有用户端侧的电压也大概率发生爬坡事件，即变压器低压侧的时序电压数据的特征与该变压器下用户的时序电压数据的特征具有相似性，可以通过该相似性来确定户变关系。

在一个可选实施例中，可以通过聚类算法对特征进行聚类，以将变压器低压侧的时序电压数据的特征和该变压器下的用户端的时序电压数据聚类到一个聚类集中，即最终的聚类结果中，每个聚类集中必然保护一个变压器低压侧的时序电压数据的特征，以及该变压器下所有用户的时序电压数据的特征，以通过聚类结果的聚类集来表示识别的户变关系。

其中，聚类算法可以基于K均值聚类算法、区域增长聚类算法等，本实施例对聚类算法不作限制。

实施例二

图2为本发明实施例二提供的一种台区户变关系识别方法的流程图，本发明实施例在上述实施例一的基础上进行优化，如图2所示，该台区户变关系识别方法包括：

S201、获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据。

在实际应用中，可以通过变压器低压侧电表和用户端电表按照预设周期采集电压，并将所采集到的电压通过抄表终端上传到数据库，在数据库中形成每个电表的时序电压数据，当检测到户变关系识别的触发事件时，从数据库中读取各个电表的时序电压数据，其中，触发事件可以是设定的时刻到达，如每个月最后一天的凌晨，或者是检测到线损计算事件等。

S202、判断每个电表所采集的时序电压数据的采集率是否达到100％。

其中，本发明实施例获取的时序电压数据可以是一段时间内的电压数据，由于时序电压数据是电表按照一定周期采集得到的，一段时间内采集到的电压数据的数量是可知的，可以判断每个电表所采集的电压数据是否小于预设数量，若是，说明可能是电表漏采集或者数据上传导致采集的电压数据缺失，则可以执行S203，否则执行S204。

S203、对时序电压数据进行插值处理，得到采样率为100％的时序电压数据。

其中，插值处理可以是数据插值，在离散数据的基础上补插连续函数，使得这条连续曲线通过全部给定的离散数据点，插值是离散函数逼近的重要方法，利用它可通过函数在有限个点处的取值状况，估算出函数在其他点处的近似值。

在一个示例中，可以采用均值插值方法对时序电压数据进行插值，即取缺失数据的前后多个数据的均值作为缺少数据，当然，还可以采用中值插值、最近值插值算法等，本发明实施例对插值所采用的算法不加以限制。

进行插值处理能够使采集到的时序电压数据更加完整，且在数据量太小的情况下可以增加数据量从而提升算法的执行效果，同时，插值处理可以对某个区域的值进行预测，从而使获得的数据更加准确，参考价值更高，在插值得到完整的时序电压数据之后，可以执行S204。

S204、采用采样率为100％的时序电压数据构建原始电压矩阵U。

具体地，构建的原始电压矩阵U为：

其中，N为用户和变压器的总数，d为电表采集的电压数据的总点数，

表示所有电表在t_h时刻的电压测量值。

采用采样率为100％的时序电压数据构建原始电压矩阵有效地确保了原始电压数据的有效性。

S205、采用零均值标准化算法对原始电压矩阵U中的时序电压数据进行标准化处理，得到标准化后得到矩阵

其中，零均值标准化算法可以是将原值减去均值后除以标准差，零均值标准化处理也可以叫做归一化处理，经过零均值标准化处理的数据消除了不同电表采集的电压数据的量纲影响，使数据指标之间的可比性更明确，从而进一步提升了数据之间进行综合对比评价的可信度，同时，零均值标准化处理也可以使不同特征具有相同的尺度(Scale)，零均值标准化算法公式如下：

当然，还可以通过min-max标准化(Min-max normalization)，log函数转换，atan函数转换，z-score标准化(zero-mena normalization)对时序电压数据进行标准化，本发明实施例对标准化方法不作限制。

标准化后得到矩阵

如下：

表示所有电表在t_h时刻的电压测量值的标准化值。

零均值标准化算法将原值减去均值后除以标准差，使得得到的特征满足均值为0，标准差为1的正态分布，使得原本可能分布相差较大的特征对模型有相同权重的影响。标准化后，让不同维度之间的特征在数值上有一定比较性，得出的参数值的大小可以反应出不同特征对样本label的贡献度，可以大大提高分类器的准确性。

S206、按照预设数值m将矩阵

划分为至少两个子序列矩阵。

其中，子序列矩阵可以是标准化矩阵

进行自适应分段聚合近似操作后产生的矩阵，按照时间的先后顺序进行排列的，m个连续的数据为一个子序列矩阵，可选的，将标准化矩阵

按照一定的数据点数分均划分为n个子序列矩阵

其中，d＝n×m。数值m为大于或等于2的自然数，可以是根据实际划分规则而定的，或参考采集时数据的时序长度d的长度进行划分，例如，智能电表的数据采样间隔可以为15分钟，那么一天就会有96个时序维度。同时可以按照1个小时的长度进行划分，此时，m等于4，或可以按照1.5小时划分，此时，m等于6。

其中，t可以是时间次序，例如，若存在连续的20个数据，t₁,t₂,……，t_d则代表第1，2，……，d个数据，此时，d等于20，若按照4个连续点一划分，则可以分为5段，即m等于4，n等于5。

S207、针对每个子序列矩阵，根据子序列矩阵内的电压数据计算电压爬坡事件总数α和电压波动事件总数β。

其中，电压爬坡事件可以是电压在短时间内出现大幅度变化的过程，在这一过程中电压的变化幅度、变化速率超过电力系统中控制策略的调节能力时，会引起电压不平衡的情况，电压爬坡事件总数α通过以下公式计算：

电压波动事件总数β通过以下公式计算：

上述公式中，

为电表i在t_h时刻的电压波动事件数，β_i为子序列矩阵内电表i的电压波动事件数，β为子序列矩阵内所有电表的电压波动事件数总和。

S208、判断电压爬坡事件总数α是否小于预设阈值δ，以及判断电压波动事件总数β是否小于预设阈值η。

其中，若电压爬坡事件总数α小于预设阈值δ，且电压波动事件总数β小于预设阈值η，则执行S209，若两者有一个不满足上述条件，则执行S210。

S209、计算子序列矩阵内每个电表的电压数据的均值，并采用均值替换电压数据。

其中，子序列矩阵可以是包含所有电表，均值替换可以是对所有电表进行均值替换，采用均值替换电压数据可以是将该子序列矩阵段维数降为1。

S210、子序列矩阵内每个电表的电压数据保持不变。

S211、采用多个子序列矩阵重新组成矩阵

以作为特征。

其中，多个子序列可以是S209、S210所得到的n个子序列矩阵

即根据子序列矩阵中数据的时间t的顺序合并成矩阵

作为特征。

利用特征提取算法能够有效降低原始数据维度且强化有用信息的占比，提高了户变关系识别的准确率。

S212、基于矩阵

利用高斯核函数构建电表间的权重矩阵W。

其中，高斯核函数可以是径向基函数，所谓径向基函数(Radial Basis Function，RBF)，是某种沿径向对称的标量函数，通常定义为空间中任一点x到某一中心xc之间欧氏距离的单调函数，可记作k(||x-xc||)，其作用往往是计算相似度，权重矩阵W为：

其中：w_i,j为权重矩阵W中元素，表示电表i与电表j之间的权重关系，

为特征提取后矩阵

中电表i对应的行向量，

为特征提取矩阵

中电表j对应的行向量，σ为控制权重值大小的参数。

S213、将权重矩阵的每一行元素求和得d_i,i＝1,2,…,N，并采用d_i组成N×N的对角矩阵得到度矩阵D。

其中，矩阵D为:

S214、通过等式

推导出拉普拉斯矩阵L。

其中，推导可以是将实际数据代入权重矩阵W和矩阵D中计算的到结果后，将该结果再代入等式

中求出拉普拉斯矩阵L。

S215、计算拉普拉斯矩阵L的特征值和特征值对应的特征向量。

其中，特征向量和特征值是数学概念，具体参见上个实施例的内容，计算拉普拉斯矩阵L的特征值和特征值对应的特征向量的过程是线性代数的基础求解过程，此处不再阐述。

S216、将特征值由小到大排列以确定出前k个特征值，将前k个特征值对应的k个特征向量ξ₁,ξ₂,…,ξ_k组成矩阵Y。

其中，矩阵Y为:

其中，ξ_k为拉普拉斯矩阵L的第k个特征向量，k为拉普拉斯矩阵L第k个特征值，N为用户和变压器的总数，y_1，k为第一个用户或台区电表的第k个特征值，y_N，k为第N个用户或台区电表的第k个特征值。

S217、对矩阵Y中的每一行向量进行单位化后重新构成矩阵Q。

其中，单位化公式如下：

矩阵Q如下：

其中，y_1，k为第一个用户或台区电表的第k个特征值单位化后的结果，y_N，k为第N个用户或台区电表的第k个特征值单位化后的结果。

S218、将矩阵Q的每一行向量作为一个k维样本，并将矩阵Q中的N个样本进行基于K均值聚类算法计算获得聚类集。

其中，K均值聚类算法可以是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类，没有(或最小数目)聚类中心再发生变化，误差平方和局部最小。

其中，将矩阵Q的每一行向量作为一个k维样本，并将矩阵Q中的N个样本进行基于K均值聚类算法计算获得聚类集，包括：

S1、从N个样本中随机选取k个样本作为初始聚类中心；

S2、计算N个样本与k个聚类中心之间的欧式距离，依据欧式距离将N个样本划分至距离最近的聚类中心所在聚类集中；

S3、计算k个聚类集中样本的平均值，依据平均值重新确定k个聚类集的聚类中心，返回计算N个样本与k个聚类中心之间的欧式距离的步骤；

S4、当k个聚类集的聚类中心不再发生改变时输出聚类集。

其中，聚类集可以是包括台区和复数用户端的一个集合。

由于每个集群均由一个变压器以及若干用户组成，且变压器是已知的台区信息，因此，整个集群便具有台区归属信息，故聚类结果能够显示出用户的台区归属情况。

本实施例通过读取待识别变压器低压侧及用户端的时序电压数据，采用采样率为100％的时序电压数据构建原始电压矩阵，采用零均值标准化算法对原始电压矩阵中的时序电压数据进行标准化处理，得到标准化后得到矩阵，按照预设数值将矩阵划分为至少两个子序列矩阵，采用多个子序列重新组成矩阵以作为特征，最终对标准化数据的特征进行聚类处理，识别显示户变关系识别结果，其中，变压器低压侧和用户端时序电压数据易获取，能够有效地降低户变关系识别的人工成本和难度。同时，利用特征提取算法有效地降低了原始数据维度，强化了有用信息的占比，从而提高了户变关系识别的准确率。

实施例三

图3为本发明实施例三提供的一种台区户变关系识别装置的结构示意图。如图3所示，该台区户变关系识别装置包括：

时序电压数据获取模块310，用于获取待识别变压器低压侧电表和用户端电表所采集的时序电压数据；

标准化处理模块320，用于对所述电表采集的所述时序电压数据进行标准化处理得标准化时序电压数据；

特征提取模块330，用于针对每个电表的标准化时序电压数据提取特征；

聚类模块340，用于对所述特征进行聚类得到多个聚类集，每个所述聚类集中包含一个所述待识别变压器低压侧电表对应的特征向量以及多个用户端电表对应的特征向量。

具体的，所述台区户变关系识别装置还包括：

数据完整性判断模块，用于判断每个所述电表所采集的时序电压数据的采集率是否达到100％；

插值模块，用于对所述时序电压数据进行插值处理，得到采样率为100％的时序电压数据；

原始电压矩阵构建模块，用于采用采样率为100％的时隙电压数据构建原始电压矩阵U：

表示所有电表在t_h时刻的电压测量值。

其中，所述标准化处理模块320还包括：

零均值标注化单元，用于采用零均值标准化算法对所述原始电压矩阵U中的时序电压数据进行标准化处理，得到标准化后得到矩阵

其中，零均值标准化算法公式如下：

标准化后得到矩阵

如下：

其中，f_mean(U_i)为单个电表i的电压测量值的平均值，f_std(U_i)为单个电表i的电压测量值的标准差，

表示所有电表在t_h时刻的电压测量值的标准化值。

其中，所述特征提取模块330包括：

子序列矩阵划分单元，用于按照预设数值m将所述矩阵

划分为至少两个子序列矩阵；

事件统计单元，用于针对每个所述子序列矩阵，根据所述子序列矩阵内的电压数据计算电压爬坡事件总数α和电压波动事件总数β，其中，电压爬坡事件总数α通过以下公式计算：

电压波动事件总数β通过以下公式计算：

上述公式中，

判断单元，用于判断所述电压爬坡事件总数α是否小于预设阈值δ，以及判断电压波动事件总数β是否小于预设阈值η；

电压替换单元，用于计算所述子序列矩阵内每个电表的电压数据的均值，并采用所述均值替换所述电压数据；

电压数据确定单元，用于子序列矩阵内每个电表的电压数据保持不变；

矩阵重组单元，用于采用多个所述子序列矩阵重新组成矩阵

以作为特征。

其中，所述聚类模块340包括：

权重矩阵构建单元，用于基于所述矩阵

利用高斯核函数构建电表间的权重矩阵W：

其中，w_i,j为权重矩阵W中元素，表示电表i与电表j之间的权重关系；

为特征提取后矩阵

中电表i对应的行向量；

为特征提取矩阵

中电表j对应的行向量；σ为控制权重值大小的参数；

度矩阵构建单元，用于将权重矩阵的每一行元素求和得d_i,i＝1,2,…,N，并采用d_i组成N×N的对角矩阵得到度矩阵D:

拉普拉斯矩阵推导单元，用于通过等式

推导出拉普拉斯矩阵L；

特征计算单元，用于计算拉普拉斯矩阵L的特征值和所述特征值对应的特征向量；

特征筛选单元，用于将特征值由小到大排列以确定出前k个特征值，将前k个特征值对应的k个特征向量ξ₁,ξ₂,…,ξ_k组成矩阵Y:

单位化单元，用于对矩阵Y中的每一行向量进行单位化后重新构成矩阵Q，其中，单位化公式如下：

矩阵Q如下：

K均值聚类单元，用于将矩阵Q的每一行向量作为一个k维样本，并将矩阵Q中的N个样本进行基于K均值聚类算法计算获得聚类集，所述聚类集中包括一个待识别变压器低压侧电表对应的k为样本和多个用户端电表对应的k为样本。

其中，所述K均值聚类单元包括：

随机选取单元，用于从N个样本中随机选取k个样本作为初始聚类中心；

划分单元，用于计算所述N个样本与所述k个聚类中心之间的欧式距离，依据所述欧式距离将所述N个样本划分至距离最近的聚类中心所在聚类集中；

聚类中心确定单元，用于计算所述k个聚类集中样本的平均值，依据所述平均值重新确定所述k个聚类集的聚类中心，返回计算所述N个样本与所述k个聚类中心之间的欧式距离的步骤；

聚类集输出单元，用于当所述k个聚类集的聚类中心不再发生改变时输出聚类集。

本发明实施例所提供的台区户变关系识别装置可执行本发明任意实施例所提供的台区户变关系识别方法，具备执行方法相应的功能模块和有益效果。

实施例四

图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图4所示，电子设备40包括至少一个处理器41，以及与至少一个处理器41通信连接的存储器，如只读存储器(ROM)42、随机访问存储器(RAM)43等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序，来执行各种适当的动作和处理。在RAM 43中，还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。

电子设备40中的多个部件连接至I/O接口45，包括：输入单元46，例如键盘、鼠标等；输出单元47，例如各种类型的显示器、扬声器等；存储单元48，例如磁盘、光盘等；以及通信单元49，例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理，例如台区户变关系识别方法。

在一些实施例中，台区户变关系识别方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元48。在一些实施例中，计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时，可以执行上文描述的审稿任务分配方法的一个或多个步骤。备选地，在其他实施例中，处理器41可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行台区户变关系识别方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的台区户变关系识别方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

实施例五

本实施例提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如本发明任意实施例所述的台区户变关系识别方法。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(RandomAccess Memory，RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。