配电变压器重过载预测方法及终端设备
技术领域
本发明属于电力大数据应用技术领域,尤其涉及一种配电变压器重过载预测方法及终端设备。
背景技术
随着社会经济的飞速发展和用户电力需求的快速增长,生产、生活用电负荷不断攀升,若配电变压器自身的容量不足或运行状态较差,则很容易发生重过载的状况,不仅会加快配变器件的老化,降低设备的使用寿命,还会造成配变电压不稳、故障频发等事件,导致居民投诉率居高不下,带来巨大的经济损失。
现阶段对于配电变压器重过载的处理方法为事后处理,或者是采用简单阈值设定和人工经验判断预防措施,预警精准度不高和时效性差,造成人员成本投入大且周期长、检修反应慢,滞后性严重。
为有效提高电网应急能力,保证供电安全,需对配电变压器重过载进行精准预测,根据预测结果采取提前检修、分流、增容等措施,减少因重过载引发的电压不稳和停电现象的发生,从而提升供电质量和客户满意度,具有重大的应用价值。
发明内容
有鉴于此,本发明实施例提供了一种配电变压器重过载预测方法及终端设备,以解决现有技术中对配电变压器过重载状态预测不精准的问题。
本发明实施例的第一方面提供了一种配电变压器重过载预测方法,包括:
确定配电变压器所对应的待预测周期;
选取与所述待预测周期连续且位于所述待预测周期之前的预设数量的周期,并依次获取所述预设数量的周期和所述待预测周期中每一天所对应的特征变量的值,针对所述预设数量的周期或所述待预测周期中的任一天,所述特征变量包含所述配电变压器的配置信息、所述配电变压器所供应的行业信息、该天所对应的气象信息、该天所对应的时间信息和位于该天之前的所述配电变压器的负载信息;
根据所述预设数量的周期或所述待预测周期中任一天所对应的特征变量的值,得到该天所对应的特征向量;
针对所述预设数量周期中的任一天,判断该天所述配电变压器是否发生重过载;
获取训练集,所述训练集中包括所述预设数量周期中的任一天所述对应的特征向量和用于表示该天是否发生重过载的标签;
通过提升决策树算法对所述训练集进行训练,得到所述配电变压器所对应的重过载预测模型;
将所述配电变压器在所述待预测周内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果。
本发明实施例的第二方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
确定配电变压器所对应的待预测周期;
选取与所述待预测周期连续且位于所述待预测周期之前的预设数量的周期,并依次获取所述预设数量的周期和所述待预测周期中每一天所对应的特征变量的值,针对所述预设数量的周期或所述待预测周期中的任一天,所述特征变量包含所述配电变压器的配置信息、所述配电变压器所供应的行业信息、该天所对应的气象信息、该天所对应的时间信息和位于该天之前的所述配电变压器的负载信息;
根据所述预设数量的周期或所述待预测周期中任一天所对应的特征变量的值,得到该天所对应的特征向量;
针对所述预设数量周期中的任一天,判断该天所述配电变压器是否发生重过载;
获取训练集,所述训练集中包括所述预设数量周期中的任一天所述对应的特征向量和用于表示该天是否发生重过载的标签;
通过提升决策树算法对所述训练集进行训练,得到所述配电变压器所对应的重过载预测模型;
将所述配电变压器在所述待预测周内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
确定配电变压器所对应的待预测周期;
选取与所述待预测周期连续且位于所述待预测周期之前的预设数量的周期,并依次获取所述预设数量的周期和所述待预测周期中每一天所对应的特征变量的值,针对所述预设数量的周期或所述待预测周期中的任一天,所述特征变量包含所述配电变压器的配置信息、所述配电变压器所供应的行业信息、该天所对应的气象信息、该天所对应的时间信息和位于该天之前的所述配电变压器的负载信息;
根据所述预设数量的周期或所述待预测周期中任一天所对应的特征变量的值,得到该天所对应的特征向量;
针对所述预设数量周期中的任一天,判断该天所述配电变压器是否发生重过载;
获取训练集,所述训练集中包括所述预设数量周期中的任一天所述对应的特征向量和用于表示该天是否发生重过载的标签;
通过提升决策树算法对所述训练集进行训练,得到所述配电变压器所对应的重过载预测模型;
将所述配电变压器在所述待预测周内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果。
本发明提供了一种配电变压器重过载预测方法及终端设备,通过从用电信息采集系统、气象服务平台中提取出影响配变重过载的特征向量,并对特征变量信息进行预处理,针对提取的特征变量采用提升树算法进行数据建模,最终生成配变重过载的预测模型,通过该模型预测得出每台配变未来一周内在某一天是否发生重过载,提高了预测的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种配电变压器重过载预测方法的流程示意图;
图2为本发明实施例提供的一种判断配电变压器是否发生重过载的方法的流程示意图;
图3为本发明实施例提供的一种获取配电变压器所对应的重过载预测模型的方法的流程示意图;
图4为本发明实施例提供的一种配电变压器重过载预测装置的结构框图;
图5为本发明实施例提供的一种配电变压器重过载预测终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
配变电网的正常运行除了要考虑设备和线路本身性能和状态外,还会受到外部气候、环境、用户等各种复杂因素的影响,具有明显的大数据特征。配电变压器的重过载与台区内的活动用户数量和用户用电方式有关,而以上两方面又受到气候、时段、节假日、行业等自然和社会因素的影响。由于配变数量庞大,通过事中监控和事后处理的方式需要投入大量监测时间成本和技改检修人力成本。所以,发明提供一种基于提升决策树算法的配变电压器重过载预测方法,对于配变寿命、电网安全运行尤为重要。通过开展对配电变压器的预测,提前发现配变是否处于正常的运行状态,对于满足用户对生产、生活用电的可靠性,避免配变隐患被动检修治理等具有重要的现实意义和经济社会效益。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
本发明实施例提供了一种配电变压器重过载预测方法。结合图1,该方法包括:
S101,确定配电变压器所对应的待预测周期。
在本发明实施例中,一个周期指一个周。选定一个配电变压器,将即将到来的一周作为所述待预测周期,在本发明实施例中,待预测周期也可以称作待预测周。
S102,选取与所述待预测周期连续且位于所述待预测周期之前的预设数量的周期,并依次获取所述预设数量的周期和所述待预测周期中每一天所对应的特征变量的值,针对所述预设数量的周期或所述待预测周期中的任一天,所述特征变量包含所述配电变压器的配置信息、所述配电变压器所供应的行业信息、该天所对应的气象信息、该天所对应的时间信息和位于该天之前的所述配电变压器的负载信息。
举例来说,选择与待预测周连续,且位于待预测周之前的8个周作为所述预设数量的周期,按照时间由早到晚的顺序,将已经发生的8周称作第1周至第8周,将即将发生的一周作为待预测周,即第9周。
在本发明实施例中,针对待预测周和待预测周之前的预设数量的周期内的任一天,获取当天所对应的影响该配电变压器的因素的值,即当天多对应的多个特征变量。
具体的,根据一天中影响该配电变压器重过载的因素,将特征变量分五个方面进行说明,如下所述:
第一个方面,所述特征变量包括所述配电变压器的配置信息,具体的,所述配电变压器的配置信息包含所述配电变压器的配变类别和所述配电变压器的配变容量,若所述配电变压器为专用变压器,则将所述配电变压器的配变类别所对应的值标记为第一预设值;若所述配电变压器为公用变压器,则将所述配电变压器的配变类别所对应的值标记为第二预设值。
例如,所述第一预设值设置为1,所述第二预设值设置为2,则若该配电变压器为专用配电变压器,则配电变压器类别这一特征变量所对应的值为1,若该配电变压器为公用配电变压器,则配电变压器类别这一特征变量所对应的值为2。当然,上述第一预设值和第二预设值的取值仅为本发明实施例提供的一种可行的实施方式,其他任何基于本发明思路基础上对配电变压器类别的赋值,都在本发明保护范围之内。
具体的,该配电变压器的配置信息可通过现有的用电信息采集系统的数据表直接得到。
第二方面,所述特征变量还包括所述配电变压器所供应的行业信息。在本发明实施例中,确定多个行业类别,针对任一行业类别,为所述行业类别赋予特定值,其中,所述多个行业类别中的任意两个行业类别所对应的特定值不同;将所述配电变压器所供应的行业类别所对应的特定值,设定为所述配电变压器所供应的行业信息这一特征变量所对应的值。
具体的,一台配电变压器所服务的台区内包含一种主要的行业,该行业可以为工业、商业、居民、农业、公共事业、其他这六种也类别中的一种,在本发明实施例中,针对不同的行业赋予不同的特征值,以用于表示配电变压器所供应的行业信息这一特征变量的值。可选的,对不同行业的赋值方法可如下表1所示:
表1
行业类别 |
特定值 |
工业 |
1 |
商业 |
2 |
居民 |
3 |
农业 |
4 |
公共事业 |
5 |
其他 |
6 |
需要说明的是,表1所示的行业分类方法及特定值赋予方法仅为本发明实施例提供的一种可行的实施方式,其他基于本发明思想的行业分类方法及特定值赋予方法,也在本发明的保护范围之内。
第三方面,所述特征变量还包括该天所对应的气象信息。
具体的,该天所对应的气象信息包括该天的最高气温、最大湿度和降水量,上述特征变量所对应的具体的值可通过气象网站直接获取。
第四方面,所述特征变量还包括该天所对应的时间信息。
该天所对应的时间信息主要包括该天所处于的月份信息、该天位于一个星期中的时间信息和该天是否为节假日的信息。如对于预设数量的周期中的一天,确定该天所对应的时间信息主要确定该天位于哪个月份、位于一个星期的星期几以及当天是否是节假日。
一种可选的,该天为一周中的星期1,则该特征变量所对应的值为1,该天为一周中的星期2,则该特征变量所对应的值为2……,该天为一周中的星期日,则该特征变量所对应的值为7。该天所处于的月份的信息的赋值方法与上述方法相同。以及,若该天为节假日,则当天是否为节假日这一特征变量所对应的值为1,若该天不是节假日,则当天是否为节假日这一特征变量所对应的值为-1。
上述针对该天所对应的时间信息的多个特征变量的赋值方法仅为本发明实施例提供的一种可行的实施方式,依照本发明思想的其他赋值方式都在本发明的保护范围之内。
第五方面,所述特征变量还包括该天之前的所述配电变压器的负载信息。具体的,包括如下六项特征变量,每一项都可通过现有的电信采集系统采集该配电变压器的历史数据并计算得到。
第一项:与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率平均值。具体的,通过如下公式计算:
式中,表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率之和,rmaxavg_3为与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率平均值。
第二项:与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率标准差。具体的,通过如下公式计算:
式中,rimax表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的每天最大负载率,rmaxavg_3为与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率平均值,表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率的方差,rsd_3表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率的标准差。
第三项,与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的重过载次数之和,具体的,通过如下公式计算:
式中,Kizgz表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器每日发生重过载的次数,Czgz_3表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器发生重过载的次数之和。
第四项,与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率平均值,具体的,通过如下公式计算:
式中,表示与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率之和,rmaxavg_7为与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率平均值。
第五项,与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率标准差,具体的,通过如下公式计算:
式中,rimax表示与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的每天最大负载率,rmaxavg_7为与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率平均值,表示与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率的方差,rsd_7表示与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率的标准差。
第六项,与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的重过载次数之和,具体的,通过如下公式计算:
式中,Kizgz表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器每日发生重过载的次数,Czgz_7表示与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器发生重过载的次数之和。
S103,根据所述预设数量的周期或所述待预测周期中任一天所对应的特征变量的值,得到该天所对应的特征向量。
具体的,由步骤S102得到预设数量周期或待预测周期中任一天所对应的16项特征变量所对应的值,由这16项特征变量所对应的值构成该天所对应的特征向量。
S104,针对所述预设数量周期中的任一天,判断该天所述配电变压器是否发生重过载。
具体的,针对预设数量周期中的任一天,本发明实施例提供一种判断该天所述配电变压器是否发生重过载的方法,如图2所示,该方法包括:
S1041,获取所述配电变压器在该天多个时间点的负载率,其中,所述多个时间点中任意两个相邻时间点的时间间隔相同。
例如,选取该配电变压器在该天24个整点中每个整点的二次运行负荷数据,一天共采集24次,通过如下计算方法计算配电变压器在该天每个时间点的负载率:
计算配电变压器每天整点的一次有功及无功运行负荷,计算公式如下所示,
Pi=pi×CT×PT
Qi=qi×CT×PT
式中,i为该配电变压器每天的采集时间点,取值范围为1至24。Pi为每个采集时间点对应的一次有功负荷值,pi为每个采集时间点的二次有功负荷值,Qi为每个采集时间点对应的一次无功负荷值,qi为每个采集时间点的二次无功负荷值,CT为电流互感器变比,PT为电压互感器变比。
分析配电变压器的运行负荷特征,计算如下:
计算配电变压器在该天各个采集点的负载率,计算公式如下所示,
式中,CAP为配电变压器的运行容量,ri为配电变压器每个采集点的负载率。
S1042,若所述配电变压器在至少连续两个时间点的负载率高于预设阈值,则判断所述配电变压器在该天发生一次重过载。
例如,该预设阈值取80%,该配电变压器的负载率大于或等于80%,且连续出现两个及以上时间点,则记重过载一次。
S1043,若所述配电变压器在该天发生至少一次重过载,则判断所述配电变压器在该天发生重过载。
具体的,若该配电变压器在一天中发生一次重过载,则判断该电压器在该天发生重过载,该配电变压器在该天可能会发生多次重过载,也可能只发生一次重过载。
S105,获取训练集,所述训练集中包括所述预设数量周期中的任一天所述对应的特征向量和用于表示该天是否发生重过载的标签。
由于在本发明实施例中,与待预测周期连续且位于待预测周期之前的预设数量的周期已经发生,其中的每一天该配电变压器是否发生重过载的结果是确定的,通过步骤S101至步骤S103可得到其中每一天所对应的特征向量,该天配电变压器是否发生重过载的结果作为该天所对应的特征向量的标签,预设数量周期中的每一天所对应的特征向量和标签,构成本发明实施例中的训练集。
S106,通过提升决策树算法对所述训练集进行训练,得到所述配电变压器所对应的重过载预测模型。
通过提升决策树算法对该训练集进行学习,得到该配电变压器所对应的重过载预测模型,该模型的输入为一天所对应的特征向量,输出为该天配电变压器是否会发生重过载的结果。
S107,将所述配电变压器在所述待预测周期内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果。
通过步骤S101-步骤S103的方法得到待预测周期中每一天所对应的特征向量,针对待预测周期中的任一天,将该天所对应的特征向量作为重过载预测模型的输入,得到的输出即为该天该配电变压器是否为发生重过载的预测结果。
本发明实施例提供了一种配电变压器重过载预测方法,该方法通过综合考虑配电变压器的配置信息、所供应行业信息、每一天的气象信息、每一天的具体时间信息和位于该天之前的配电变压器的负载信息,构建待预测周之前的预设数量周期中每一天所对应的特征向量,并通过该天该配电变压器是否发生重过载的结果作为该天的特征向量的标签,得到训练集,通过提升决策树算法对该训练集进行训练,得到配电变压器所对应的重过载预测模型,并将待预测周期内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果,通过机器学习的方法,提高了预测精度,对于满足用户对生产、生活用电的可靠性,避免配变隐患被动检修治理等具有重要的现实意义和经济社会效益。
结合图3,本发明实施例还提供了一种获取配电变压器所对应的重过载预测模型的方法,该方法包括:
S301,通过提升决策树算法对所述训练集进行M轮训练,其中,当通过所述提升决策树算法对所述训练集进行首次训练时,对所述训练集中的N个训练样本赋予相同的初始权重,并通过提升决策树算法对所述训练集进行训练得到决策树T1,之后进行的每次训练,都获取上一轮训练中预测失败的样本,并增大预测失败的样本的权重,通过提升决策树算法对所述训练集进行训练得到决策树Ti,其中,2≤i≤M。
具体的,设由图1所对应的实施例中步骤S105得到的训练集为D;
且,D={(x1,y1),(x2,y2)...(xN,yN)};
其中,xi为训练集中的训练样本,即特征向量,yi为配变是否重过载的标签,设重过载为+1,正常为-1,yi={+1,-1}。
第一步,对训练集中的N个训练样本赋予相同的初始权重,且初始权重之和为1。
第二步,对训练集训练进行M轮训练,其中,每次训练,都获取上一轮训练中预测失败的样本,并增大预测失败的样本的权重,通过提升决策树算法对所述训练集进行训练得到决策树Ti,其中,2≤i≤M。
具体的,第二步的具体实现方式如下:
A)使用提升决策树算法对具有权值分布的Dm的配变训练样本进行分类,构造出第一个决策树模型T1,其中D1、D2、D3...DM的训练样本一样,其相对应的权重wm不同。如下:
为了便于说明,引入信息熵和信息增益的定义。
信息熵是表示随机变量不确定性的度量,设X是一个取有限个值的离散随机变量,其概率分布为:
P(X=xi)=pi,i=1,2...n,n代表取n个有限值;
则随机变量X的熵定义为:
熵越大,样本的不纯度越大;熵越小,样本的不纯度越小。
决策树中,上层结点样本数为n,信息熵记为Entropy(S),特征变量集为{A1,A2...Ag...},其中A1,A2...Ag...中的任一项为如步骤S102中所示的一种类型的特征变量。
如:变量A为上述特征变量集中的一个特征变量,依据变量集中的变量A划分得到下层结点,假设其有k个取值,第i个取值下mi个样本,信息熵记为Entropy(Si)。
信息增益则为Gain(S,A)
具体的,包括:
(1)若Di中所有实例属于同一类标签,则Ti为单结点树,并将类标签作为该结点的类标记,返回Ti;
(2)否则,按照(1)计算X中各类特征变量对Di的信息增益,选择信息增益最大的特征变量Ag,其中,X中包含训练集中的各个样本。
配变重过载预测训练集的特征变量中,当天气温、前一周最大负载率平均值、前一周最大负载率的标准差的特征值是连续值的,即该特征值ai是连续值的,则连续值特征ai的信息增益判断方法为:将ai的值按递增序排序,每对相邻值的中点被看做是可能的分裂点,给定xi的v个值,则需要计算v-1个可能的划分,例如,ai和ai+1之间的中点是对每个可能的分裂点计算信息增益,选出其中最大的信息增益info,作为具有连续特征值的特征变量的信息增益。并与其它的特征变量对应的信息增益进行比较,选出最大信息增益的特征变量Ag。
(3)若所有的特征变量均划分使用完毕,则将Di中样本数最大的标签作为该结点的类标记,返回Ti。
(4)如果Ag的信息增益小于阈值ε,则置Ti为单结点树,并将Ti中样本数最大的标签类作为类标记,返回Ti;
(5)否则,对Ag的每一个可能值aj,依Ag=aj将Di分割为若干非空子集Dij,构建子结点,由结点和子结点构成树Ti,返回Ti;
如果该具有连续特征值的特征变量为Ag,则其最大信息增益对应的分裂点划分Di数据样本,设分裂点为split_point,划分为Di1、Di2两个子样本分别为,Di1是满足Ag≤split_point的元组集合,Di2是满足Ag≥split_point的元组集合。
(6)对第i个子结点,以Dij为训练集,以A-{Ag}为特征变量集,递归地调用步(1)-步(5),得到子树Tij,返回Tij。其中{Ag}为已经使用过的特征变量,且不包含具有连续特征值的特征变量。
B)计算该决策树Ti的分类错误率并令其中I(yi≠Ti(xi))表示当yi≠Ti(xi)时取1,否则取0。
其中,wi为第i次训练所对应的训练集中训练样本xi所对应的权值,yi为训练样本xi所对应的标签,当配电变压器重过载时,yi设置为1,当配电变压器非重过载时,yi设置为-1,I(yi≠Ti(xi))表示当yi≠Ti(xi)时取1,当yi=Ti(xi)时取0;
令wi=wiexp{ciI(yi≠Ti(x))},i=1,...N,并归一化使
依据A)的方式,继续进行下一轮的训练。
第三步,将所构建的所有的决策树T1、T2、T3...TQ进行线性组合
其中Q为当前决策树的个数。
进而得配变重过载预测模型
使用预设配变测试集对模型G(x)进行测试,若准确率较的模型准确率低,则停止迭代,即Q=M。
或若模型G(x)的迭代次数达到设定阈值Z,则停止迭代,即Z=M。
S302,计算决策树Ti的错误率ei和权重ci。
通过如下公式计算决策树Ti的错误率ei:
其中,wi为第i次训练所对应的训练集中训练样本xi所对应的权值,yi为训练样本xi所对应的标签,当配电变压器重过载时,yi设置为1,当配电变压器非重过载时,yi设置为-1,I(yi≠Ti(xi))表示当yi≠Ti(xi)时取1,当yi=Ti(xi)时取0;
计算决策树Ti的权重ci:
令:
S303,将所构建的所有的决策树T1、T2、T3...TM进行线性组合,获取重过载预测模型G(x)。
获取重过载预测模型G(x):
本发明实施例提供了一种获取配电变压器所对应的重过载预测模型的方法,通过提取影响配电变压器重过载的因素,构成特征向量,得到训练集,通过提升决策树算法对训练集进行多轮训练,得到最终的重过载预测模型,算法合理、实用,提高了配电变压器重过载的预测精度。
图4为本发明实施例提供的一种配电变压器重过载预测装置示意图,结合图4,该装置包括:确定单元41,第一获取单元42,第一判断单元43,第二获取单元44,第三获取单元45和第二判断单元46;
所述确定单元41,用于确定配电变压器所对应的待预测周期;
所述第一获取单元42,用于选取与所述待预测周期连续且位于所述待预测周期之前的预设数量的周期,并依次获取所述预设数量的周期和所述待预测周期中每一天所对应的特征变量的值,针对所述预设数量的周期或所述待预测周期中的任一天,所述特征变量包含所述配电变压器的配置信息、所述配电变压器所供应的行业信息、该天所对应的气象信息、该天所对应的时间信息和位于该天之前的所述配电变压器的负载信息;
所述第一获取单元42还用于,用于根据所述预设数量的周期或所述待预测周期中任一天所对应的特征变量的值,得到该天所对应的特征向量;
所述第一判断单元43,用于针对所述预设数量周期中的任一天,判断该天所述配电变压器是否发生重过载;
所述第二获取单元44,用于获取训练集,所述训练集中包括所述预设数量周期中的任一天所述对应的特征向量和用于表示该天是否发生重过载的标签;
所述第三获取单元45,用于通过提升决策树算法对所述训练集进行训练,得到所述配电变压器所对应的重过载预测模型;
所述第二判断单元46,用于将所述配电变压器在所述待预测周内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果。
进一步的,所述配电变压器的配置信息包含所述配电变压器的配变类别和所述配电变压器的配变容量,第一获取单元42还用于:
若所述配电变压器为专用变压器,则将所述配电变压器的配变类别所对应的值标记为第一预设值;
若所述配电变压器为公用变压器,则将所述配电变压器的配变类别所对应的值标记为第二预设值。
进一步的,第一获取单元42还用于:
确定多个行业类别,针对任一行业类别,为所述行业类别赋予特定值,其中,所述多个行业类别中的任意两个行业类别所对应的特定值不同;
将所述配电变压器所供应的行业类别所对应的特定值,设定为所述配电变压器所供应的行业信息这一特征变量所对应的值。
进一步的,所述该天所对应的气象信息包括该天的最高气温、最大湿度和降水量;所述该天所对应的时间信息包括该天所处于的月份信息、该天位于一个星期中的时间信息和该天是否为节假日的信息。
进一步的,针对所述预设数量的周期或所述待预测周期中的任一天,所述位于该天之前的所述配电变压器的负载信息包括:
与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率平均值;
与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的最大负载率标准差;
与该天所处周期连续且位于该天所处周期之前三天的所述配电变压器的重过载次数之和;
与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率平均值;
与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的最大负载率标准差;
与该天所处周期连续且位于该天所处周期之前七天的所述配电变压器的重过载次数之和。
进一步的,第一判断单元43具体用于:
获取所述配电变压器在该天多个时间点的负载率,其中,所述多个时间点中任意两个相邻时间点的时间间隔相同;
若所述配电变压器在至少连续两个时间点的负载率高于预设阈值,则判断所述配电变压器在该天发生一次重过载;
若所述配电变压器在该天发生至少一次重过载,则判断所述配电变压器在该天发生重过载。
进一步的,所述训练集包括N个训练样本,第三获取单元45具体用于:
通过提升决策树算法对所述训练集进行M轮训练,其中,当通过所述提升决策树算法对所述训练集进行首次训练时,对所述训练集中的N个训练样本赋予相同的初始权重,并通过提升决策树算法对所述训练集进行训练得到决策树T1,之后进行的每次训练,都获取上一轮训练中预测失败的样本,并增大预测失败的样本的权重,通过提升决策树算法对所述训练集进行训练得到决策树Ti,其中,2≤i≤M;
通过如下公式计算决策树T1的错误率ei和权重ci:
其中,wi为第i次训练所对应的训练集中训练样本xi所对应的权值,yi为训练样本xi所对应的标签,当配电变压器重过载时,yi设置为1,当配电变压器非重过载时,yi设置为-1,I(yi≠Ti(xi))表示当yi≠Ti(xi)时取1,当yi=Ti(xi)时取0;
计算决策树Ti的权重ci;
获取重过载预测模型G(x):
本发明实施例提供了一种配电变压器重过载预测装置,该装置通过综合考虑配电变压器的配置信息、所供应行业信息、每一天的气象信息、每一天的具体时间信息和位于该天之前的配电变压器的负载信息,构建待预测周之前的预设数量周期中每一天所对应的特征向量,并通过该天该配电变压器是否发生重过载的结果作为该天的特征向量的标签,得到训练集,通过提升决策树算法对该训练集进行训练,得到配电变压器所对应的重过载预测模型,并将待预测周期内任一天所对应的特征向量作为所述重过载预测模型的输入,得到该天所述配电变压器是否会发生重过载的判断结果,通过结合机器学习的方法,提高了预测精度,对于满足用户对生产、生活用电的可靠性,避免配变隐患被动检修治理等具有重要的现实意义和经济社会效益。
图5为本发明实施例提供的一种终端设备的示意图。如图5所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,例如配电变压器重过载预测程序。所述处理器50执行所述计算机程序52时实现上述各个配电变压器重过载预测方法实施例中的步骤,例如图1所示的步骤101至107,或图2所示的步骤1041至1043。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块41至46的功能。
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。
所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述配电变压器重过载预测方法的步骤。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使对应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。