CN111461921B

CN111461921B - 一种基于机器学习的负荷建模典型用户数据库更新方法

Info

Publication number: CN111461921B
Application number: CN202010240264.XA
Authority: CN
Inventors: 宋军英; 李欣然; 毛振宇; 钟伟; 崔益伟; 李培强; 邹鑫
Original assignee: Hunan University; State Grid Corp of China SGCC; State Grid Hunan Electric Power Co Ltd
Current assignee: Hunan University; State Grid Corp of China SGCC; State Grid Hunan Electric Power Co Ltd
Priority date: 2020-03-31
Filing date: 2020-03-31
Publication date: 2023-11-24
Anticipated expiration: 2040-03-31
Also published as: CN111461921A

Abstract

本发明公开了一种基于机器学习的负荷建模典型用户数据库更新方法，首先通过将多年调查统计和负荷控制系统总结归纳得到的负荷建模典型用户数据作为历史数据，运用机器学习的思路和方法，搭建机器学习模型；然后将获得的新用户数据输入机器学习模型，得到新用户所属行业分类：接着，运用历史数据及各典型用电行业聚类中心曲线，得到历史DB指标；最后将新用户数据引入计算，对历史负荷建模典型用户数据库进行更新优化。本方法在原有负荷建模技术的基础上引入机器学习方法，能够实现对典型用户数据库更新优化，且优化后典型用户数据库DB指标得到明显改善，具有良好的工程价值。

Description

一种基于机器学习的负荷建模典型用户数据库更新方法

技术领域

本发明属于电力系统分析与控制技术领域，特别涉及一种基于机器学习的负荷建模典型用户数据库更新方法。

背景技术

电力系统负荷模型对电网的运行、分析与控制有着重要的影响，但是建立准确的负荷模型一直以来就是电力系统分析控制领域公认的世界性难题，其关键的障碍就在于负荷特性自身的复杂性，这种复杂性的最突出表现则在于负荷特性的地域分散性和随机时变性，在线实时负荷建模则是解决负荷特性时变性的有效途径。

近年来，电网调度、配电自动化的快速建设与发展为负荷建模提供了丰富的基础数据信息，负荷建模已朝着工程实用化的方向发展。以湖南大学、河海大学为首的高校已经相继迈开负荷建模工程实用化的步伐，经过不断研究，结合多种软硬件技术和综合负荷建模方法理论诞生了诸多的负荷建模系统平台，如：负荷特性数据采集平台、变电站SCADA数据解析处理平台、故障录波数据解析处理平台、PMU数据解析平台、变电站综合负荷建模平台等。但相关平台或多或少存在建模功能单一、建模数据的来源不具备实时性、建模平台自动化程度低、操作步骤繁琐等诸多缺陷与不足：

随着智能配电网建设的快速推进，覆盖全电网范围、直达电网最末端(0.4kV低压端)电力用户和发电电源的新一代电力信息量测/采集系统为实现上述目标奠定了优越的基础条件，电力大数据和云计算/云终端技术则为实现上述目标提供了根本的技术支持。基于已建立的负荷建模理论方法、模型结构和实现技术体系，广域、完备、实时的负荷信息使得实现在线实时负荷建模目标成为可能。

发明内容

本发明所解决的技术问题是，针对现有技术的不足，提出一种基于机器学习的负荷建模典型用户数据库更新方法，可以有效实现建模数据库的自动更新和优化，建立更为准确的负荷建模平台。

为了实现上述技术目的，本发明的技术方案是，1、一种基于机器学习的负荷建模典型用户数据库更新方法，包括以下步骤：

1)利用调查统计和负荷控制系统，总结归纳出负荷建模典型用户数据库，得到用于负荷建模的典型用户相关负荷数据；

2)将负荷建模典型用户数据库中各用户数据作为历史数据，通过机器学习，得到用于用户行业分类的机器学习模型；

3)将获得的新用户数据输入机器学习模型，对新用户进行适用于负荷建模的用户行业分类，得到该用户所属行业类别；

4)运用历史数据及各典型用电行业聚类中心曲线，得到历史DBI(Davies-Bouldin指数)指标；再将新用户数据引入计算，结合其所属行业类别，得到新的DBI指标；根据得到历史DBI指标及新的DBI指标，判别新用户是否典型，对负荷建模典型用户数据库进行更新。

所述的基于机器学习的负荷建模典型用户数据库更新方法，所述步骤1)中，总结归纳出负荷建模典型用户数据库的过程包括：

1-1)从负荷控制系统中筛选用电容量较大且用电特性较稳定的用户作为典型用户；

1-2)从负荷控制系统中获得各典型用户日负荷功率曲线并进行预处理：对日负荷功率曲线中的异常数据进行识别并修正，对修正后的日负荷功率曲线数据进行标幺化处理；

1-3)采用模糊C均值方法对标幺化处理后的数据样本进行典型用电行业分类，得到n类典型用电行业聚类中心曲线，将典型用户相关负荷数据及典型用电行业聚类中心曲线入库，搭建负荷建模典型用户数据库。

所述的基于机器学习的负荷建模典型用户数据库更新方法，所述步骤1-2)中，对日负荷功率曲线进行预处理的过程为：

计算日负荷功率曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较，若超出阈值范围则视为异常数据；对异常数据进行进行修正，是首先判断负荷曲线的数据缺失量和异常量是否小于10％，若是，则先将异常量置为0即置为缺失量，再以一元三点抛物线插值算法对缺失量进行插值拟合，否则直接删除该条负荷曲线；

然后取用户的功率最大值p_kmax为基准值，根据公式一对原始数据样本进行标幺化处理，

p'_ki＝p_ki/p_kmax 公式一

其中，p_ki为经过筛选和异常数据处理后第k条用户日负荷功率曲线第i个数据点的功率数据；p'_ki为对p_ki进行归一化处理后第k条用户日负荷功率曲线第i个数据点的功率数据；

从而得到归一化的用户有功功率标幺值矩阵P'_k＝[p'_k1,p'_k2,...,p'_ki,...,p'_km]∈R^1×m和变电站下属典型用户的有功功率标幺值矩阵P'＝[P'₁,P'₂,...,P'_k,...,P'_N]^T∈R^N ^×m，其中R为实数，R的上标表示相应矩阵的行、列数。

所述的基于机器学习的负荷建模典型用户数据库更新方法，所述步骤1-3)包括以下过程：

设定初始聚类中心矩阵P_u ⁽⁰⁾＝[P_u1 ⁽⁰⁾,L,P_uj ⁽⁰⁾,L,P_un ⁽⁰⁾]^T∈R^n×m，为n类典型用户的m点有功功率标幺值的初始值；

通过公式二计算或更新隶属度矩阵：

其中，h∈[0,2]为加权指数；

得到第b轮迭代时，变电站下属第k个用户对于n类的隶属度V_k ^(b)＝[v_k1 ^(b),L,v_kj ^(b),L,v_kn ^(b)]∈R^1×n和变电站下属N个用户对于n类的隶属度矩阵V^(b)＝[V₁ ^(b),L,V_k ^(b),L,V_N ^(b)]^T∈R^N×n；

通过公式三更新聚类中心：

得到第b+1轮迭代得到的n类典型用户的聚类中心矩阵P_u ^(b+1)＝[P_u1 ^(b+1)，L，P_uj ^(b+1)，L，P_un ^(b+1]^T∈R^n×m直至则停止迭代；

根据各个用户相对于各个类的隶属度大小，进行典型用户分类，综合得到n类典型用户所包含的用户，以及n类典型行业等效日负荷功率曲线C_n＝[P_u1 ^b,L,P_uj ^b,L,P_um ^b]∈R^1×m，以及最优聚类中心矩阵C＝[C₁,L,C_j,L,C_n]^T∈R^n×m。

所述的基于机器学习的负荷建模典型用户数据库更新方法，步骤2)包括以下过程：

2-1)将典型用户基本负荷信息作为模型输入，包括用户名M_k、电压等级U_k、总变容量S_k及日负荷功率曲线数据P'_k＝[p'_k1,p'_k2,...,p'_ki,...,p'_km]∈R^1×m；其中p'_ki为经过预处理后第k条用户日负荷功率曲线第i个数据点的功率数据；，i＝1,2,3,...,m，m为负控系统采集的数据点数目；得到归一化的用户x_i＝[M_k,U_k,S_k,P'_k]∈R^1×(m+3)，即变电站下属第k个典型用户典型用户基本负荷信息，及变电站下属所有典型用户基本负荷信息x＝[M,U,S,P']∈R^N×(m+3)；

2-2)从步骤1)中得到的典型用户相关负荷数据，包括n类典型行业等效日负荷功率曲线C_n＝[P_u1 ^b,L,P_uj ^b,L,P_um ^b]∈R^1×m，以及最优聚类中心矩阵C＝[C₁,L,C_j,L,C_n]^T∈R^n×m，作为模型输出；

2-3)以负荷建模典型用户数据库中历史数据作为训练样本，将典型用户基本负荷信息x作为模型输入，将该典型用户所对应的典型行业聚类中心曲线C作为模型输出，对机器学习算法模型进行训练，机器学习模型选用支持向量机模型

选用公式四作为回归函数：

式中，y＝f(x)是新用户所对应的典型行业聚类中心曲线，x为新用户的输入向量，即新用户基本负荷信息，其中包括用户名M_k、电压等级U_k、总变容量S_k及日负荷功率曲线数据P'_k＝[p'_k1,p'_k2,...,p'_ki,...,p'_km]∈R^1×m；s为训练样本个数；x_i是第i个训练样本对应的输入向量，即第i个典型用户基本负荷信息；β为偏置值，是常数；K(x_i,x)为核函数，采用公式五所示的满足Mercer条件的径向基函数，σ是核参数，表示覆盖宽度；

α_i,为拉格朗日乘子，满足/>且α_i≥0，/>α_i,/>的取值满足：

y_i是第i个训练样本对应的输出值，即典型用户所对应的典型行业聚类中心曲线C_n＝[P_u1 ^b,L,P_uj ^b,L,P_um ^b]∈R^1×m；ε为惩罚因子，c为期望最大绝对误差；ε、c和σ的取值根据经验值确定，α_i,b的取值通过传统SMO算法来优化确定；在确定α_i,/>b参数后，代入公式四即得到分类表达式y＝f(x)。

所述的基于机器学习的负荷建模典型用户数据库更新方法，所述步骤3)中，对新用户进行分类的方法是：

将新用户基本负荷信息，包括用户名M_l、电压等级U_l、总变容量S_l及日负荷功率曲线数据P'_l＝[p'_l1,p'_l2,...,p'_li,...,p'_lm]∈R^1×m进行归整，得到归一化的用户x_l＝[M_l,U_l,S_l,P'_l]∈R^1×(m+3)，将x_l输入用于用户行业分类的机器学习模型中，形成新用户的模糊分类标记，即新用户的输入向量后，代入公式四得到的预测表达式，计算得到新用户所属的典型行业类别，即得到新用户所对应的典型行业聚类中心曲线y_l＝f(x_l)。

所述的基于机器学习的负荷建模典型用户数据库更新方法，所述步骤3)中，在对新用户的数据输入机器学习模型前，还包括对数据进行预处理的步骤：

对新用户日负荷功率曲线中的异常数据进行识别，对异常数据进行修正，对修正后的日负荷功率曲线数据进行标幺化处理：首先判断负荷曲线的数据缺失量和异常量是否小于10％，若是，则先将异常量置为0即置为缺失量，再以一元三点抛物线插值算法对缺失量进行插值拟合，得到处理后的新用户日负荷功率曲线P'_l＝[p'_l1,p'_l2,...,p'_li,...,p'_lm]∈R^1×m；否则认为新用户不具有代表性，直接删除该条负荷曲线。

所述的基于机器学习的负荷建模典型用户数据库更新方法，所述步骤4)中，对负荷建模典型用户数据库进行更新的方法如下：

通过DBI指标来判别新用户典型程度，即新用户的引入是否能够优化典型负荷数据库，以DBI指标越小为越好，计算公式如下：

其中，n表示聚类数目，DBI1、DBI2分别用来衡量历史DBI指标和引入新用户数据后的DBI指标，R1_i、R2_i分别用来衡量引入新用户数据前后第i类与第j类的相似度，计算公式如下：

其中，M_ij为第i类中心与第j类中心的距离，计算公式如下：

其中M_ij为第i类中心与第j类中心的距离；C_i为第i类的中心；a_di为第i类的中心点C_i的第d个属性的值；p取1时表示1-范数，p取2时表示2-范数，即两个类中心的欧式距离。

其中，S1_i、S2_i分别用来衡量引入新用户数据前后第i个类中数据点的分散程度，计算公式如下:

其中，X1_l、X2_l分别为引入新用户数据前后第i类中第l个数据点；C_i为第i典型行业的聚类中心；T1_i、T2_i分别为引入新用户数据前后第i类中数据点的个数；q取1时S_i为各点到中心的距离的均值，q取2时S_i为各点到中心的距离的标准差，它们都可以用来衡量类内分散程度；

同时通过对比公式八所得历史DBI指标DBI1和引入新用户后新的DB指标DBI2，来判别新用户典型程度，即新用户的引入是否能够优化典型负荷数据库：若新DB指标DBI2小于历史DB指标DBI1，则说明新用户的引入将减小原典型行业聚类中心曲线的分散程度，即新数据具有代表性，将新用户加入负荷建模典型用户数据库；否则，则说明新用户的引入将增大原典型行业聚类中心曲线的分散程度，即新数据不具有代表性，则将新数据舍弃，从而实现对负荷建模典型用户数据库的更新。

本发明的技术效果在于，依托调查统计和负荷控制系统总结归纳出的负荷建模典型用户数据库，在大数据背景下引入机器学习模型，实现数据库的更新优化。优化结果与工程实际相符，能够为电网公司分析用户用电行为，建立更加准确完备的典型用户数据库支撑。具有良好的应用前景。

附图说明

图1为本发明流程示意图。

图2为典型用户数据库搭建流程图。

图3为机器学习模型训练流程图。

图4为新用户分类方法流程图。

图5为典型用户数据库更新方法流程图。

具体实施方式

下面结合附图对本发明作进一步说明：

本实施例的总体思路框图如图1所示，包括以下步骤：

1)利用调查统计和负荷控制系统，总结归纳出负荷建模典型用户数据库，得到用于负荷建模的典型用户相关负荷数据。

2)结合1)得到的负荷建模典型用户数据库，将其中各用户数据作为历史数据，运用机器学习的思路和方法，得到用于用户行业分类的机器学习模型，将获得的新用户数据输入机器学习模型，对新用户进行适用于负荷建模的用户行业分类，得到该用户所属行业类别。

3)运用历史数据及各典型用电行业聚类中心曲线，得到历史DBI(Davies-Bouldin指数)指标；再将新用户数据引入计算，结合其所属行业类别，得到新的DBI指标。

4)结合3)得到历史DB指标及新的DBI指标，判别新用户是否典型，对负荷建模典型用户数据库进行更新。

其中步骤1)包括以下步骤：

1-1)利用实地调查和统计综合的方法，从负荷控制系统中的各用户信息中筛选用电容量较大且用电特性较稳定的用户作为典型用户。一般来说，用电容量较大的用户可选择用电容量排在当地前列的用户，比方说按用电量排序，取前30％的用户为用电容量较大的用户。而用电特性较稳定是指没有出现长时间断电现象的用户，也可根据实际情况进行选择。

1-2)从负荷控制系统中获得各典型用户日负荷功率曲线，对日负荷功率曲线中的异常数据进行识别，对异常数据进行修正，对修正后的日负荷功率曲线数据进行标幺化处理；

计算日负荷功率曲线中各采样时刻点的负荷功率的变化率并与预设阈值比较，若超出阈值范围则视为异常数据；对异常数据进行进行修正，是首先判断负荷曲线的数据缺失量和异常量是否小于10％，若是，则先将异常量置为0即置为缺失量，再以一元三点抛物线插值算法对缺失量进行插值拟合，否则直接删除该条负荷曲线。

取用户的功率最大值p_kmax为基准值，根据公式一对原始数据样本进行标幺化处理，

p'_ki＝p_ki/p_kmax 公式一

得到归一化的用户有功功率标幺值矩阵P'_k＝[p'_k1,p'_k2,...,p'_ki,...,p'_km]∈R¹ ^×m和变电站下属典型用户的有功功率标幺值矩阵P'＝[P'₁,P'₂,…,P'_k,…,P'_N]^T∈R^N×m。

设定初始聚类中心矩阵P_u ⁽⁰⁾＝[P_u1 ⁽⁰⁾,L,P_uj ⁽⁰⁾,L,P_un ⁽⁰⁾]^T∈R^n×m，为n类典型用户的m点有功功率标幺值的初始值。

通过下式计算或更新隶属度矩阵：

通过下式更新聚类中心：

得到第b+1轮迭代得到的n类典型用户的聚类中心矩阵P_u ^(b+1)＝[P_u1 ^(b+1)，L，P_uj ^(b+1)，L，P_un ^(b+1]^T∈R^n×m直至则停止迭代。

如图3所示，所述步骤2)的过程为：

以负荷建模典型用户数据库中历史数据作为训练样本，将典型用户基本负荷信息作为模型输入，将该典型用户所对应的典型行业聚类中心曲线作为模型输出，对机器学习算法模型进行训练，采用支持向量机模型对新用户数据进行典型行业分类，具体为：

2-1)典型用户基本负荷信息包括用户名M_k、电压等级U_k、总变容量S_k及日负荷功率曲线数据P'_k＝[p'_k1,p'_k2,…,p'_ki,…,p'_km]∈R^1×m,共同作为模型输入。其中p_ki为变电站下属第k个典型用户的第i点原始有功功率，i＝1,2,3,...,m，m为负控系统采集的数据点数目；得到归一化的用户x_i＝[M_k,U_k,S_k,P'_k]∈R^1×(m+3)，即变电站下属第k个典型用户典型用户基本负荷信息，以及变电站下属所有典型用户基本负荷信息x＝[M,U,S,P']∈R^N×(m+3)。

2-2)典型用户所对应的典型行业聚类中心曲线通过对标幺化处理后的典型用户日负荷功率曲线采用1-3)中模糊C均值聚类方法得到，包括n类典型行业等效日负荷功率曲线C_n＝[P_u1 ^b,L,P_uj ^b,L,P_um ^b]∈R^1×m，以及最优聚类中心矩阵C＝[C₁,L,C_j,L,C_n]^T∈R^n×m，作为模型输出。

2-3)本专利机器学习模型选用支持向量机(SVM)模型选用下式作为回归函数：

式中，y＝f(x)是新用户所对应的典型行业聚类中心曲线，x为新用户的输入向量，即新用户基本负荷信息(包括用户名M_k、电压等级U_k、总变容量S_k及日负荷功率曲线数据P'_k＝[p'_k1,p'_k2,…,p'_ki,…,p'_km]∈R^1×m)；s为训练样本个数；x_i是第i个训练样本对应的输入向量，即第i个典型用户基本负荷信息；b为偏置值，是常数；K(x_i,x)为核函数，采用如式(8)所示的径向基函数(满足Mercer条件)，σ是核参数，表示覆盖宽度；

α_i,为拉格朗日乘子，满足/>且α_i≥0，/>α_i,/>的取值要满足：

y_i是第i个训练样本对应的输出值，即典型用户所对应的典型行业聚类中心曲线C_n＝[P_u1 ^b,L,P_uj ^b,L,P_um ^b]∈R^1×m；ε为惩罚因子，c为期望最大绝对误差；ε、c和σ的取值根据经验值确定，α_i,b的取值通过SMO算法来优化确定；在确定α_i,/>b参数后，代入公式四即得到分类表达式y＝f(x)。

如图4所示，所述步骤3)的过程为：

对新用户日负荷功率曲线中的异常数据进行识别，对异常数据进行修正，对修正后的日负荷功率曲线数据进行标幺化处理；该过程中处理方法与典型用户负荷数据库搭建时曲线处理方式类似，判断负荷曲线的数据缺失量和异常量是否小于10％，若是，则先将异常量置为0即置为缺失量，再以一元三点抛物线插值算法对缺失量进行插值拟合，得到处理后的新用户日负荷功率曲线P'_l＝[p'_l1,p'_l2,…,p'_li,…,p'_lm]∈R^1×m；否则认为新用户不具有代表性，直接删除该条负荷曲线。

将新用户基本负荷信息(包括用户名M_l、电压等级U_l、总变容量S_l及日负荷功率曲线数据P'_l＝[p'_l1,p'_l2,…,p'_li,…,p'_lm]∈R^1×m)归整，得到归一化的用户x_l＝[M_l,U_l,S_l,P'_l]∈R^1×(m+3)，将x_l输入3)中搭建的机器学习模型中，形成新用户的模糊分类标记，即新用户的输入向量后，代入公式四得到的预测表达式，计算得到新用户所属的典型行业类别，即得到新用户所对应的典型行业聚类中心曲线y_l＝f(x_l)。

如图5所示，所述步骤4)的过程为：

DBI是类内距离之和与类外距离的比值。类内对象距离越小，类间距离越大，DBI指标也越小，聚类效果越好。该指标用于评价聚类质量，使用该指标可用于判别新用户典型程度，即新用户的引入是否能够优化典型负荷数据库。其计算公式如下：

其中，n表示聚类数目，DBI1、DBI2分别用来衡量历史DBI指标和引入新用户数据后的DBI指标，R1_i、R2_i分别用来衡量引入新用户数据前后第i类与第j类的相似度，其计算公式如下：

其中，M_ij为第i类中心与第j类中心的距离，其计算公式如下：

其中M_ij为第i类中心与第j类中心的距离；C_i为第i类的中心；a_di为第i类的中心点C_i的第d个属性的值；p取1时表示1-范数，p取2时表示2-范数(即两个类中心的欧式距离)。

其中，X1_l、X2_l分别为引入新用户数据前后第i类中第l个数据点；C_i为第i典型行业的聚类中心；T1_i、T2_i分别为引入新用户数据前后第i类中数据点的个数；q取1时S_i为各点到中心的距离的均值，q取2时S_i为各点到中心的距离的标准差，它们都可以用来衡量类内分散程度。

通过对比公式八所得历史DBI指标DBI1和引入新用户后新的DB指标DBI2，可判别新用户典型程度，即新用户的引入是否能够优化典型负荷数据库。若新DB指标DBI2小于历史DB指标DBI1，则说明新用户的引入将减小原典型行业聚类中心曲线的分散程度，即新数据具有代表性，将新用户加入负荷建模典型用户数据库；否则，则说明新用户的引入将增大原典型行业聚类中心曲线的分散程度，即新数据不具有代表性，则将新数据舍弃。从而实现了对负荷建模典型用户数据库的更新。

本发明采用的数据来源于湖南省电网公司在线实时负荷建模平台SQL2012数据库，并对其中负荷建模典型用户数据库中负荷曲线进行识别、筛选之后进行归一化处理；采用模糊C均值方法对标幺化处理后的数据样本进行典型用电行业分类，得到n类典型用电行业聚类中心曲线历史数据作为训练样本；将典型用户基本负荷信息(包括用户名、电压等级、总变容量及日负荷功率曲线标幺值数据)作为模型输入，将该典型用户所对应的典型行业聚类中心曲线作为模型输出，对机器学习算法模型进行训练，采用支持向量机模型对新用户数据进行典型行业分类，得到历史DB指标及引入新用户后的DB指标，判别新用户是否典型，实现对负荷建模典型用户数据库进行更新。

Claims

1.一种基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，包括以下步骤：

4)运用历史数据及各典型用电行业聚类中心曲线，得到历史DBI指标；再将新用户数据引入计算，结合其所属行业类别，得到新的DBI指标；根据得到历史DBI指标及新的DBI指标，判别新用户是否典型，对负荷建模典型用户数据库进行更新；

所述步骤4)中，对负荷建模典型用户数据库进行更新的方法如下：

其中，M_ij为第i类中心与第j类中心的距离，计算公式如下：

其中M_ij为第i类中心与第j类中心的距离；C_i为第i类的中心；a_di为第i类的中心点C_i的第d个属性的值；p取1时表示1-范数，p取2时表示2-范数，即两个类中心的欧式距离；

2.根据权利要求1所述的基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，所述步骤1)中，总结归纳出负荷建模典型用户数据库的过程包括：

3.根据权利要求2所述的基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，所述步骤1-2)中，对日负荷功率曲线进行预处理的过程为：

p'_ki＝p_ki/p_kmax 公式一

从而得到归一化的用户有功功率标幺值矩阵P'_k＝[p'_k1,p'_k2,…,p'_ki,...,p'_km]∈R^1×m和变电站下属典型用户的有功功率标幺值矩阵P'＝[P'₁,P'₂,...,P'_k,...,P'_N]^T∈R^N×m，其中R为实数，R的上标表示相应矩阵的行、列数。

4.根据权利要求2所述的基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，所述步骤1-3)包括以下过程：

设定初始聚类中心矩阵P_u ⁽⁰⁾＝[P_u1 ⁽⁰⁾,…,P_uj ⁽⁰⁾,…,P_un ⁽⁰⁾]^T∈R^n×m，为n类典型用户的m点有功功率标幺值的初始值；

通过公式二计算或更新隶属度矩阵：

其中，h∈[0,2]为加权指数；

得到第b轮迭代时，变电站下属第k个用户对于n类的隶属度V_k ^(b)＝[v_k1 ^(b),…,v_kj ^(b),…,v_kn ^(b)]∈R^1×n和变电站下属N个用户对于n类的隶属度矩阵V^(b)＝[V₁ ^(b),…,V_k ^(b),…,V_N ^(b)]^T∈R^N×n；

通过公式三更新聚类中心：

得到第b+1轮迭代得到的n类典型用户的聚类中心矩阵P_u ^(b+1)＝[P_u1 ^(b+1),…,P_uj ^(b+1),…,P_un ^(b+1)]^T∈R^n×m直至则停止迭代；

根据各个用户相对于各个类的隶属度大小，进行典型用户分类，综合得到n类典型用户所包含的用户，以及n类典型行业等效日负荷功率曲线C_n＝[P_u1 ^b,…,P_uj ^b,…,P_um ^b]∈R^1×m，以及最优聚类中心矩阵C＝[C₁,…,C_j,…,C_n]^T∈R^n×m。

5.根据权利要求2所述的基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，步骤2)包括以下过程：

2-1)将典型用户基本负荷信息作为模型输入，包括用户名M_k、电压等级U_k、总变容量S_k及日负荷功率曲线数据P'_k＝[p'_k1,p'_k2,…,p'_ki,…,p'_km]∈R^1×m；其中p'_ki为经过预处理后第k条用户日负荷功率曲线第i个数据点的功率数据，i＝1,2,3,...,m，m为负控系统采集的数据点数目；得到归一化的用户x_i＝[M_k,U_k,S_k,P'_k]∈R^1×(m+3)，即变电站下属第k个典型用户典型用户基本负荷信息，及变电站下属所有典型用户基本负荷信息x＝[M,U,S,P']∈R^N ^×(m+3)；

2-2)从步骤1)中得到的典型用户相关负荷数据，包括n类典型行业等效日负荷功率曲线C_n＝[P_u1 ^b,…,P_uj ^b,…,P_um ^b]∈R^1×m，以及最优聚类中心矩阵C＝[C₁,…,C_j,…,C_n]^T∈R^n×m，作为模型输出；

选用公式四作为回归函数：

式中，y＝f(x)是新用户所对应的典型行业聚类中心曲线，x为新用户的输入向量，即新用户基本负荷信息，其中包括用户名M_k、电压等级U_k、总变容量S_k及日负荷功率曲线数据P'_k＝[p'_k1,p'_k2,...,p'_ki,…,p'_km]∈R^1×m；s为训练样本个数；x_i是第i个训练样本对应的输入向量，即第i个典型用户基本负荷信息；β为偏置值，是常数；K(x_i,x)为核函数，采用公式五所示的满足Mercer条件的径向基函数，σ是核参数，表示覆盖宽度；

α_i,为拉格朗日乘子，满足/>且α_i≥0，/>α_i,/>的取值满足：

y_i是第i个训练样本对应的输出值，即典型用户所对应的典型行业聚类中心曲线C_n＝[P_u1 ^b,…,P_uj ^b,…,P_um ^b]∈R^1×m；ε为惩罚因子，c为期望最大绝对误差；ε、c和σ的取值根据经验值确定，α_i,b的取值通过传统SMO算法来优化确定；在确定α_i,/>b参数后，代入公式四即得到分类表达式y＝f(x)。

6.根据权利要求5所述的基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，所述步骤3)中，对新用户进行分类的方法是：

将新用户基本负荷信息，包括用户名M_l、电压等级U_l、总变容量S_l及日负荷功率曲线数据P'_l＝[p'_l1,p'_l2,...,p'_li,…,p'_lm]∈R^1×m进行归整，得到归一化的用户x_l＝[M_l,U_l,S_l,P'_l]∈R^1×(m+3)，将x_l输入用于用户行业分类的机器学习模型中，形成新用户的模糊分类标记，即新用户的输入向量后，代入公式四得到的预测表达式，计算得到新用户所属的典型行业类别，即得到新用户所对应的典型行业聚类中心曲线y_l＝f(x_l)。

7.根据权利要求1所述的基于机器学习的负荷建模典型用户数据库更新方法，其特征在于，所述步骤3)中，在对新用户的数据输入机器学习模型前，还包括对数据进行预处理的步骤：