一种用于确定低压台区线损率评估值的方法及系统
技术领域
本发明涉及低压台区技术领域,并且更具体地,涉及一种用于确定低压台区线损率评估值的方法及系统。
背景技术
线损是反映电力企业的经营和管理水平重要技术经济指标,其大小与电力企业的经济效益息息相关。低压台区线损指的是电压在0.4kV及以下情况下所产生的线损,这部分占到了整个配电网线损的一半以上,在电力系统的电能损耗中占的比例较大。因此,对低压台区的线损进行分析,有针对性地采取措施降低台区线损,将能显著地提高电力企业的效益,也将为缓解能源压力、减轻环境污染,构建节能环保型社会做出相应的贡献。
线损率计算所需要的原始数据主要包括电力网设备参数和电力网的运行参数(电流、电压、功率因数、有功及无功功率等)。由于低压台区的建设和管理状况参差不齐、台区和终端用户数目庞大、台账管理不完备、线路分布复杂多样、用电采集系统的采集成功率差别较大等因素,使得台区管理需要动用大量的人力、物力才能收集到必要的运行资料和数据,工作量非常大。基于上述现状,如何充分利用现有数据,快速、准确地计算出台区线损率是亟待解决的问题。
近年来,机器学习理论的发展与应用为线损率计算提供了新的途径。机器学习算法计算线损率无须建立数学模型,可以利用网络强大的自学能力、推广能力以及非线性处理能力来拟合线损率与特征参数之间复杂的非线性关系。此外,集成学习的出现,更使得原本的弱学习器经过集成达到强学习器的功能,因此利用集成学习算法可以更加准确的计算和评估台区线损率。
发明内容
针对上述问题本发明提出了一种用于确定低压台区线损率评估值的方法,包括:
获取电网低压台区多个历史电气特征指标与低压台区线损率之间的互信息,根据互信息确定影响电网低压台区线损的主要电气特征指标,并获取电网低压台区的线损率;
根据主要电气特征指标和线损率,生成训练模型;
获取目标低压台区主要电气特征指标,并对目标低压台区的主要电气特征指标进行标准化处理,获取得到目标低压台区的标准化数据,对目标低压台区的标准化数据使用训练模型进行评估,确定目标低压台区线损率的评估值。
可选的,方法,还包括:
对主要电气特征指标进行标准化处理,生成标准化数据;
对线损率进行归一化处理,生成归一化数据。
可选的,生成训练模型,具体为:构建决策树模型,并将决策树模型作为基学习器,针对基学习器构建bagging集成学习模型,使用bagging集成学习模型对标准化数据和归一化数据进行学习训练,生成训练模型。
可选的,针对基学习器构建bagging集成学习模型,具体为:
确定训练集,所述训练集为初始训练集中随机抽取的多个训练例;
确定学习训练次数,并根据确定的学习训练次数对训练集进行学习训练。
可选的,标准化数据作为bagging集成学习模型的输入数据;
所述归一化数据作为bagging集成学习模型的输出数据。
本发明还提出了一种用于确定低压台区线损率评估值的系统,包括:
采集模块,获取电网低压台区多个历史电气特征指标与低压台区线损率之间的互信息,根据互信息确定影响电网低压台区线损的主要电气特征指标,并获取电网低压台区的线损率;
训练模块,根据主要电气特征指标和线损率,生成训练模型;
评估模块,获取目标低压台区主要电气特征指标,并对目标低压台区的主要电气特征指标进行标准化处理,获取得到目标低压台区的标准化数据,对目标低压台区的标准化数据使用训练模型进行评估,确定目标低压台区线损率的评估值。
可选的,训练模块还用于:
对主要电气特征指标进行标准化处理,生成标准化数据;
对线损率进行归一化处理,生成归一化数据。
可选的,生成训练模型,具体为:构建决策树模型,并将决策树模型作为基学习器,针对基学习器构建bagging集成学习模型,使用bagging集成学习模型对标准化数据和归一化数据进行学习训练,生成训练模型。
可选的,针对基学习器构建bagging集成学习模型,具体为:
确定训练集,所述训练集为初始训练集中随机抽取的多个训练例;
确定学习训练次数,并根据确定的学习训练次数对训练集进行学习训练。
可选的,标准化数据作为bagging集成学习模型的输入数据;
所述归一化数据作为bagging集成学习模型的输出数据。
本发明无需建立复杂的数学模型,具有快速收敛和高精度等优点,为低压台区线损分析提供了技术支撑。
附图说明
图1为本发明一种用于确定低压台区线损率评估值的方法流程图;
图2为本发明一种用于确定低压台区线损率评估值的方法实施例决策树模型结构示意图;
图3为本发明一种用于确定低压台区线损率评估值的方法实施例学习算法模型结构示意图;
图4为本发明一种用于确定低压台区线损率评估值的方法实施例评估值均方误差图
图5为本发明一种用于确定低压台区线损率评估值的系统结构图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
本发明提出了一种用于确定低压台区线损率评估值的方法,如图1所示,包括:
获取电网低压台区多个历史电气特征指标与低压台区线损率之间的互信息,根据互信息确定影响电网低压台区线损的主要电气特征指标,并获取电网低压台区的线损率;
根据主要电气特征指标和线损率,生成训练模型;
获取目标低压台区主要电气特征指标,并对目标低压台区的主要电气特征指标进行标准化处理,获取得到目标低压台区的标准化数据,对目标低压台区的标准化数据使用训练模型进行评估,确定目标低压台区线损率的评估值。
其中,对主要电气特征指标进行标准化处理,生成标准化数据;
对线损率进行归一化处理,生成归一化数据。
生成训练模型,具体为:构建决策树模型,并将决策树模型作为基学习器,针对基学习器构建bagging集成学习模型,使用bagging集成学习模型对标准化数据和归一化数据进行学习训练,生成训练模型。
针对基学习器构建bagging集成学习模型,具体为:
确定训练集,所述训练集为初始训练集中随机抽取的多个训练例;
确定学习训练次数,并根据确定的学习训练次数对训练集进行学习训练。
标准化数据作为bagging集成学习模型的输入数据;
所述归一化数据作为bagging集成学习模型的输出数据。
下面结合实施例对本发明进行进一步的说明。
步骤1:通过互信息的方法,获取若干电气特征指标与台区线损率之间的互信息,根据所求的互信息值的大小,选取与台区线损率相关性较大作为台区线损评估的电气特征指标,其中,互信息定义如下:
式中,p(x,y)是X和Y的联合概率分布函数,而p(x)和p(y)分别是X和Y的边缘概率分布函数。
互信息越大,说明两个随机变量的相关性越大,如表1所示:
表1
上述表1中的特征为主要电气特征指标;
去掉互信息值小于0.9的电气特征指标,选取的电气特征指标包括8个:负载率,功率方差,最大负荷,形状系数k,最大负荷三相平均电流,三相不平衡度,居民用户占比,功率因数。
其中部分样本台区电气特征参数如表2所示:
表2
步骤2-1:将多个电气特征指标的参数值进行标准化处理;
选取的8个电气特征指标参数是作为基于bagging的集成学习算法的输入,也就是自变量。
各参数具有不同的单位和量级,对于集成学习算法来说只区分数据数值的大小,并不能反映出数据的单位,为了更好的应用上述算法,需要消除各参数间不同单位和量级对数值的影响,防止出现“大数吃小数”的现象,而数据的标准化就是将数据按比例缩放,使之落入一个小的特定区间去除数据的单位限制,将其转化为无量纲的纯数值。
设台区个数为N,每个台区的台区电气特征参数为8个,N个台区样本的台区电气特征参数组成台区电气特征向量X,有:
用xij表示台区电气特征向量X的第i行、第j列元素,i=1,2,...,N,j=1,2,...,8;
对台区电气特征参数进行标准化处理,有:
其中,Z
ij为x
ij标准化处理后的量,
为x
ij的平均值,s
ij为x
ij的方差;
根据以上处理,得到台区电气特征指标标准化后的参数值,其中部分标准化的台区电气特征指标如表3所示:
表3
步骤2-2:对台区线损率进行归一化处理;
设台区线损率为y,采用式(6)对台区线损率y进行归一化处理,有:
其中,y'i为第i个台区的台区线损率归一化后的值,yi为第i个台区的台区线损率,ymin为所有台区线损率的最小值,ymax为所有台区线损率的最大值,α、β为常数,且0.9<α<1,0<β<0.1,这里取α=0.99,β=0.01,得到归一化后台区的线损率。
步骤3:构建决策树模型,如图2所示,具体步骤如下:
以信息增益作为决策树属性选择的主要标准,在划分数据集之前之后信息发生的变化称为信息增益,获得信息增益最高的特征就是最好的选择。
信息增益表示一个集合D中数据的混乱程度,用I表示信息增益,D属性集合的信息增益计为:
其中,pi为D中样本属性的概率。属性A具有不同的属性值,可以将数据分为样本子集,D可以表示为D={D1,D2,Dn},则属性A的信息增益可以表示为:
此时,将A作为划分结点的属性,所获得的信息增益为:
GAIN(A)=I(D)-IA(D)
ID3决策树算法实现流程如下:(1)输入训练集D,属性集A;(2)判断训练集是否为空,是跳转到(6),否跳转到(3);(3)判断样本是否都属于类C,是跳转到(6),否跳转到(4);(4)判断属性列表是否为空,是跳转到(6),否跳转到(5);(5)计算属性列表中各个属性的信息增益,选择信息增益最高的属性标记结点N;(6)结束。
步骤4:以决策树模型为基学习器,构建bagging集成学习模型;
如图3所示,Bagging是给定一弱学习算法和一训练集,让学习算法训练m轮,每一轮的训练集由初始训练集中随机抽取n个训练例组成,初始训练例可以出现多次或根本不出现。训练之后可得到一个评估函数序列h1,…,hm最终的评估函数H简单平均方法对新的台区样本进行判别,能够提高集成模型的泛化性能。
本发明以决策树为弱学习算法,m选为10,构建基于Bagging的集成学习训练模型。
步骤5:利用bagging集成学习模型对标准化后的台区数据进行学习训练;
将标准化后的台区样本Zij作为模型的输入,归一化后的线损率y'i作为模型的输出,对台区样本数据进行训练,得到相应的基于Bagging的集成学习训练模型。
具体将步骤2中标准化后的台区电气特征指标作为输入数据,将归一化后的台区线损率作为输出数据,训练基于bagging的集成学习模型。
步骤6:根据构建的基于Bagging的集成学习训练模型,评估台区线损率。
采用训练好的基于Bagging的集成学习模型,以新的的标准化后的台区特征指标为输入,以评估的新的台区线损率y_pred1,…,y_predn为输出,对新的台区样本示例进行评估。
采用均方误差MSE衡量最终线损率评估效果,公式如下:
式中,y_test为每个台区线损率真实值,y_pred为每个台区线损率评估值,n为样本个数,MSE的值越小,表示评估效果越好。
求出台区评估值的均方误差MSE和运行时间,如图4所示,结果如表4所示:
表4
模型算法 |
bagging集成学习 |
均值方差(MSE) |
0.014736 |
运行时间(s) |
0.805375 |
本发明还提出了一种用于确定低压台区线损率评估值的系统200,如图5所示,包括:
采集模块201,获取电网低压台区多个历史电气特征指标与低压台区线损率之间的互信息,根据互信息确定影响电网低压台区线损的主要电气特征指标,并获取电网低压台区的线损率;
训练模块202,根据主要电气特征指标和线损率,生成训练模型;
评估模块203,获取目标低压台区主要电气特征指标,并对目标低压台区的主要电气特征指标进行标准化处理,获取得到目标低压台区的标准化数据,对目标低压台区的标准化数据使用训练模型进行评估,确定目标低压台区线损率的评估值。
其中,训练模块还用于:
对主要电气特征指标进行标准化处理,生成标准化数据;
对线损率进行归一化处理,生成归一化数据。
生成训练模型,具体为:构建决策树模型,并将决策树模型作为基学习器,针对基学习器构建bagging集成学习模型,使用bagging集成学习模型对标准化数据和归一化数据进行学习训练,生成训练模型。
针对基学习器构建bagging集成学习模型,具体为:
确定训练集,所述训练集为初始训练集中随机抽取的多个训练例;
确定学习训练次数,并根据确定的学习训练次数对训练集进行学习训练。
标准化数据作为bagging集成学习模型的输入数据;
所述归一化数据作为bagging集成学习模型的输出数据。
本发明无需建立复杂的数学模型,具有快速收敛和高精度等优点,为低压台区线损分析提供了技术支撑。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。