发明内容
为了解决光伏新能源电力系统容量优化过程中异常数据识别结果不准确的问题,本发明提供一种光伏新能源电力系统容量优化控制方法,所采用的技术方案具体如下:
获取光伏新能源电力系统的负载用电的历史数据,所述历史数据为连续预设天数的负载用电数据,每天的负载用电数据为一个用电量序列;
获取每天的用电总量,并获取连续预设天数的用电总量的中心数据,基于每天的用电总量与中心数据的差异以及去除目标天的用电总量前后的数据差异获取目标天的用电总量的第一异常程度;
将每个用电量序列中的元素按照时序编号,由所有用电量序列中同一编号的元素组成一个数据集,以每个元素作为目标元素,基于数据集中目标元素与邻域元素的差异、对应的所述第一异常程度获取目标元素的第二异常程度;
获取数据集中目标元素与相邻元素之间的变化趋势,基于目标元素对应的变化趋势与数据集内其他元素对应的变化趋势之间的差异、对应的第二异常程度获取目标元素的第三异常程度;
根据不同阶差下目标元素与数据集中相邻元素之间的变化趋势获取对应的角度变化,基于目标元素对应的角度变化与相邻元素对应的角度变化之间的差异、对应的第三异常程度获取目标元素的第四异常程度;
通过结合第二异常程度、第三异常程度和第四异常程度获取目标元素的最终异常程度,根据最终异常程度的大小筛选异常数据并剔除,得到准确数据,利用准确数据进行负载用电量预测进而完成光伏新能源电力系统容量的优化。
进一步的,所述中心数据的获取方法为:
对所有用电总量进行类别为1的聚类,得到一个聚类中心,聚类中心对应的用电总量即为所述中心数据。
进一步的,所述第一异常程度的获取方法为:
计算所有用电总量的方差作为基准值,以任意一天作为目标天,计算去除目标天的用电总量之后的剩余用电总量的方差作为评估方差,获取评估方差与基准值的差异,结合对应的用电总量与中心数据的差异获取每天的用电总量的所述第一异常程度。
进一步的,所述邻域元素的获取方法为:
获取目标元素与数据集中每个其他元素之间的差值绝对值,按照所述差值绝对值的大小从小到大选取对应的预设数量的其他元素作为目标元素的邻域元素。
进一步的,所述第二异常程度的获取方法为:
获取目标元素与每个邻域元素之间的差值绝对值,以邻域元素的所述第一异常程度作为对应邻域元素对应的差值绝对值的权重,获取所有邻域元素对应的差值绝对值的加权平均值作为目标元素的平均差值;
任选两个邻域元素组成参照组,计算参照组中的两个邻域元素之间的差值绝对值记为组内差值,并以该两个邻域元素对应的第一异常程度的和作为对应的组内差值的权重,获取所有参照组对应的组内差值的加权平均值作为平均组内差值;
以所述平均差值和所述平均组内差值的比值作为目标元素的所述第二异常程度。
进一步的,所述变化趋势的获取方法为:
以时间作为横坐标,以用电量作为纵坐标,统计每个用电量序列中所有元素的折线图,获取目标元素与相邻编号的元素的连线,所述连线与水平方向的夹角作为目标元素的所述变化趋势。
进一步的,所述第三异常程度的获取方法为:
以目标元素与数据集中每个其他元素对应的变化趋势的差异作为对应其他元素的趋势差异,计算每个其他元素的变化趋势对应的两个元素的第二异常程度的和的倒数作为对应趋势差异的权重,以所有其他元素的趋势差异的加权平均值作为目标元素的所述第三异常程度。
进一步的,所述第四异常程度的获取方法为:
获取目标元素与不同数量的相邻元素之间的变化趋势的差值作为对应阶差下目标元素的角度变化,计算每个阶差下目标元素与相邻元素的角度变化的差值绝对值,以所述差值绝对值与对应相邻元素的第三异常程度之间的比值作为对应相邻元素的变化差异,计算目标元素的预设个数的相邻元素的变化差异平均值与对应阶差的比值,所有阶差对应比值的均值为目标元素的所述第四异常程度。
进一步的,所述最终异常程度的获取方法为:
以目标元素的所述第二异常程度、所述第三异常程度以及所述第四异常程度的乘积作为目标元素的所述最终异常程度。
进一步的,在得到所述准确数据之后,还包括:
将剔除的异常数据所在数据集中保留的准确数据求均值作为对应异常数据位置处的插值,将所有异常数据利用对应插值替换后,得到用于进行负载用电量预测的处理后数据。
本发明至少具有如下有益效果:
首先将历史获取的每天的负载用电量组成一个用电量序列,能够将历史数据按照日期分段,以便获取不同日期的数据变化,进而筛选异常数据;获取每天的用电总量的中心数据,一般来说,居民每天的用电总量应当是相似的,即不同日期的用电总量差异不大,以中心数据作为每天的用电总量的参照,获取每天的用电总量与中心数据的差异来判断对应日期是否异常,并获取去除目标天的用电总量前后的数据差异反映目标天的总用电量的异常情况,一般来说去除前后的数据差异越大说明目标天的用电总量与群体内的普遍情况相差较大,即目标天的用电总量越有可能异常;两个用于异常判断的指标相结合得到每天的用电总量的第一异常程度;然后将每天的用电量序列中的所有元素按照时序编号,不同用电量序列中同一编号的元素组成一个数据集,按照时序编号后,不同用电量序列中同一编号的元素为不同日期同一时间下的用电量,利用数据集中每个目标元素与邻域元素的差异、目标元素所对应日期的第一异常程度获取目标元素的第二异常差异,一般来说,居民用电量是呈周期性变化的,目标元素与邻域元素的差异反映了对应时间下的异常程度,目标元素所对应日期的第一异常程度代表了所在日期的异常程度,相互结合后令得到的第二异常程度考虑了目标元素所在日期的整体的异常程度,更加准确地反映了目标元素的异常概率;利用目标元素与相邻元素之间的变化趋势获取第三异常程度和第四异常程度,考虑了目标元素反映的趋势变化情况,进一步提高了目标元素的异常程度的准确性,最后结合第二异常程度、第三异常程度和第四异常程度获取目标元素的最终异常程度,将得到的不同方面的异常程度相结合综合反映目标元素的最终异常程度,并依据最终异常程度的大小筛选出异常数据并剔除,得到准确数据用于负载用电量的预测,以便完成光伏新能源电力系统容量的优化。本发明综合考量多个方面的指标获取综合异常程度,能够更加准确地筛选出异常数据,提高光伏新能源电力系统中异常数据的识别精度,进而增强光伏新能源电力系统容量的优化效果。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种光伏新能源电力系统容量优化控制方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种光伏新能源电力系统容量优化控制方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种光伏新能源电力系统容量优化控制方法的步骤流程图,该方法包括以下步骤:
步骤S001,获取光伏新能源电力系统的负载用电的历史数据,历史数据为连续预设天数的负载用电数据,每天的负载用电数据为一个用电量序列。
在光伏新能源电力系统容量的控制中为保证负载用电需要对负载用电量进行预测,负载用电的预测主要依据负载用电的历史数据,所以首先需要在电力系统的负载段监测用电量,获得负载用电历史数据。
由于居民用电符合生活周期,因此获取每天的负载用电量数据,以连续预设天数的负载用电数据作为历史数据。
作为一个示例,在本发明实施例中每10分钟获取一个负载用电量,每天的所有负载用电组成的用电量序列为对应日期下的负载用电数据,预设天数为30天,以连续30天的负载用电数据作为获取的历史数据,即历史数据中包括30个用电量序列。
步骤S002,获取每天的用电总量,并获取连续预设天数的用电总量的中心数据,基于每天的用电总量与中心数据的差异以及去除目标天的用电总量前后的数据差异获取目标天的用电总量的第一异常程度。
获取每天0点到24点的用电量作为对应日期的用电总量,该用电总量为一个确定数值,一般来说,每天的用电总量都相差不大,比如城市居民大多数固定的生活节奏导致每一天居民用电情况基本一致,即用电量基本相等。
对所有用电总量进行类别为1的聚类,得到一个聚类中心,聚类中心对应的用电总量即为中心数据。
在连续多天的多个用电总量中,用电量数据的异常程度主要表现为具体数值的离群程度,所以首先对连续多天数据进行聚类,在本发明实施例中利用K-means聚类方法,设置聚类数量K=1,获得所有用电总量的聚类中心,聚类中心作为历史数据的参照,能够代表历史数据的普遍情况,因此以聚类中心对应的用电总量作为中心数据。
计算每个用电总量与中心数据之间的差值绝对值,通过对差值绝对值进行归一化得到用电总量与中心数据的差异,该差值绝对值越大,说明对应用电总量与作为参照的中心数据之间的差异越大,越离群。
计算所有用电总量的方差作为基准值,以任意一天作为目标天,计算去除目标天的用电总量之后的剩余用电总量的方差作为评估方差,获取评估方差与基准值的差异,结合对应的用电总量与中心数据的差异获取每天的用电总量的第一异常程度。
以第t天作为目标天为例,计算对应的第一异常程度:
其中,表示第t天的用电总量的第一异常程度,表示第t天的用电总量的评估方差,表示基准值,表示评估方差与基准值的差异,表示第t天的用电总量与中心数据之间的差值绝对值,表示所有差值绝对值中的最大值,表示以最大值作为分母的归一化结果,即用电总量与中心数据的差异。
需要说明的是,表示映射函数,用于将评估方差与基准值的差值的值映射到区间[0,1]上。且在其他实施例中,对用电总量与中心数据之间的差值绝对值的归一化方法还可以是其他的归一化方法。
基准值为去除第t天的用电总量之前的方差,评估方差为去除了第t天的用电总量之后的方差,通过计算并进行归一化来表征第t天的用电总量去除前后的数据差异,该数据差异越大,说明去除该数据后,得到的方差变化越大,也就是说第t天的用电总量与群体内的普遍情况相差较大,即作为目标天的第t天的用电总量越有可能异常。
第t天的用电总量与中心数据之间的差值绝对值表征了第t天的用电总量与作为参照的中心数据之间的差异,该差异越大,对应的用电总量越有可能异常。
评估方差与基准值的差异结合对应的用电总量与中心数据的差异获取每天的用电总量的第一异常程度,能够体现每天的用电总量的异常程度。
步骤S003,将每个用电量序列中的元素按照时序编号,由所有用电量序列中同一编号的元素组成一个数据集,以每个元素作为目标元素,基于数据集中目标元素与邻域元素的差异、对应的第一异常程度获取目标元素的第二异常程度。
基于每天数据的差异,获得每一天用电量数据的异常程度,但是实际负载用电量在不同日期存在差异,比如居民在工作日的作息与节假日的作息存在差异,导致不同日期不同时刻其用电量存在差异,从而影响数据异常识别,所以需要考虑不同日期对实际用电量的影响进行异常分析。
由于每个用电量序列均为每10分钟获取一个负载用电量组成的序列,将每个用电量序列中的元素按照时序编号后,同一编号的数据为不同日期在同一时刻下的负载用电量,通过将同一编号的元素组成一个数据集,分析不同日期在同一时刻下的数据。
负载用电量在每天存在的差异对于异常数据分析的影响主要体现在节假日的差异,在进行聚簇分析时,节假日的用电量会存在较小聚簇,导致传统的异常分析效果不佳,此时一般采用LDOF考虑小聚簇对异常分析的影响,从而获得更加准确的数据异常程度。
利用LDOF进行数据分析主要考虑每一个数据点与周围数据偏离程度,以每个元素作为目标元素进行分析,获取目标元素与数据集中每个其他元素之间的差值绝对值,按照差值绝对值的大小从小到大选取对应的预设数量的其他元素作为目标元素的邻域元素。
作为一个示例,在本发明实施例中预设数量为20,在其他实施例中预设数量的数值可以根据实际场景进行调整。
获取目标元素与每个邻域元素之间的差值绝对值,以邻域元素的第一异常程度作为对应邻域元素对应的差值绝对值的权重,获取所有邻域元素对应的差值绝对值的加权平均值作为目标元素的平均差值。
任选两个邻域元素组成参照组,计算参照组中的两个邻域元素之间的差值绝对值记为组内差值,并以该两个邻域元素对应的第一异常程度的和作为该组内差值的权重,获取所有参照组对应的组内差值的加权平均值作为平均组内差值。
以平均差值和平均组内差值的比值作为目标元素的第二异常程度。
以任意一个数据集中第i个元素作为目标元素为例,即对于任意一个属于第i天的时刻为例,计算第二异常程度:
首先计算作为目标元素的第i个元素对应的平均差值:
其中,k表示预设数量,即在本发明实施例中k为20;表示作为目标元素的第i个元素对应的第j个邻域元素与第i个元素之间的差值绝对值,表示第i个元素对应的第j个邻域元素的第一异常程度。
第j个邻域元素的第一异常程度的值越大,说明第j个邻域元素本身的异常程度越高,相对的,第j个邻域元素对作为目标元素的第i个元素的数据分布关系影响的可信度越低,对应的,第j个邻域元素对于第i个元素来说越不重要,即以第j个邻域元素的第一异常程度作为对应差值绝对值的权重,以所有邻域元素的差值绝对值的加权平均值来反映所有邻域元素的聚集特点,平均差值越大,说明第i个元素与周围的邻域元素越不聚集,那么第i个元素越有可能异常。
然后计算作为目标元素的第i个元素对应的平均组内差值:
其中,表示从k个邻域元素中任选两个组成参照组的数量,表示第个参照组中的一个邻域元素的第一异常程度,表示第个参照组中的另一个邻域元素的第一异常程度,表示的权重,表示第个参照组中的两个邻域元素之间的差值绝对值也即组内差值。
第个参照组中的两个邻域元素的第一异常程度和越大,说明第个参照组中的两个邻域元素本身数据越异常,那么这个参照组中两个邻域元素之间的距离对于所有邻域元素来说影响越大,以参照组中两个邻域数据之间的第一异常程度之和作为对应的差值绝对值的权重,并计算所有对照组的组内差值的加权平均值来表征第i个元素周围的邻域元素之间的差异情况,进而表征第i个元素周围的位置范围。
以平均差值和平均组内差值的比值作为目标元素的第二异常程度:,目标元素的第二异常程度越大,第i个元素越远离周围的k个邻域元素,即第i个元素的异常程度越大。
利用LDOF分析计算目标元素的第二异常程度,避免小聚簇的异常表现,在LDOF分析中同时考虑经过统计分析的数据异常程度,获得不同点在异常分析中的不同贡献,获得数据更加准确的异常程度。
步骤S004,获取数据集中目标元素与相邻元素之间的变化趋势,基于目标元素对应的变化趋势与数据集内其他元素对应的变化趋势之间的差异、对应的第二异常程度获取目标元素的第三异常程度。
上述步骤S003中基于每天用电量数据的差异利用LDOF异常分析获得目标元素对应的第二异常程度,是以数据的周期性进行数据异常分析,但是在实际中用电量为一个时序数据,即数据之间的时序关系直接反映数据变化,从而反映数据的异常程度。因此需要利用用电量的时序变化情况获取第三异常程度。
时间序列上数据之间的变化关系主要表现为数据变化趋势,以时间作为横坐标,以用电量作为纵坐标,统计每个用电量序列中所有元素的折线图,获取目标元素与相邻编号的元素的连线,该连线与水平方向的夹角作为目标元素的变化趋势。相邻元素即为相邻编号的元素,在时序上相邻。
以目标元素与数据集中每个其他元素对应的变化趋势的差异作为对应其他元素的趋势差异,计算每个其他元素的变化趋势对应的两个元素的第二异常程度的和的倒数作为该趋势差异的权重,以所有其他元素的趋势差异的加权平均值作为目标元素的第三异常程度。
同样任意一个数据集中第i个元素作为目标元素为例,计算对应的第三异常程度:
其中,表示作为目标元素的第i个元素的第三异常程度,表示第i个元素的变化趋势,表示第i个元素所在数据集中第v个其他元素的变化趋势,表示第v个其他元素的趋势差异,表示绝对值函数,表示第v个其他元素的第二异常程度,表示第v个其他元素的相邻编号的元素对应的第二异常程度,表示趋势差异的权重,N表示数据集中共有N个元素,在本发明实施例中N为30,除第i个元素以外共有N-1个其他元素。
第v个其他元素的计算变化趋势时对应的两个元素的第二异常程度越小,说明这两个元素本身越可能为正常数据,对于同一数据集中的第i个数据来说,影响越大,因此以第v个其他元素计算变化趋势时对应的两个元素的第二异常程度的和的倒数作为权重,反映作为目标元素的第i个元素与其他元素之间的差异,计算所有其他元素对应的趋势差异的加权平均值来反映第i个元素与同数据集内其他元素之间的偏离程度,即第i个元素在不同日期下于其他同一时间的数据之间的偏离程度,也即第i个元素的第三异常程度。
由于同一天内不同时刻的用电量的差异较大,所以无法直接利用同一天时序数据的变化趋势进行分析,所以通过上述步骤利用不同日期同一时刻的用电量据对应的变化趋势的差异进行异常分析,既存在数据变化关系,又具有异常对比数据,有效获得数据变化趋势的异常程度,便于后续的异常分析。
步骤S005,根据不同阶差下目标元素与数据集中相邻元素之间的变化趋势获取对应的角度变化,基于目标元素对应的角度变化与相邻元素对应的角度变化之间的差异、对应的第三异常程度获取目标元素的第四异常程度。
不同阶差的角度变化代表了目标元素与不同数量的相邻元素之间变化趋势的差异,同样任意一个数据集中第i个元素作为目标元素为例,1阶差时,对应的角度变化为,2阶差时,对应的角度变化为,3阶差时,对应的角度变化为,以此类推。
获取目标元素与不同数量的相邻元素之间的变化趋势的差值作为对应阶差下目标元素的角度变化,计算每个阶差下目标元素与相邻元素的角度变化的差值绝对值,以该差值绝对值与对应相邻元素的第三异常程度之间的比值作为对应相邻元素的变化差异,计算目标元素预设个数的相邻元素的变化差异平均值与对应阶差的比值,所有阶差对应比值的均值为目标元素的第四异常程度。
第i个元素作为目标元素时,计算对应的第四异常程度为:
其中,表示作为目标元素的第i个元素对应的第四异常程度,表示r阶差下第i个元素对应的角度差异,表示r阶差下第i个元素的第s个相邻元素的角度差异,表示第s个相邻元素的第三异常程度,表示第s个相邻元素的变化差异,n表示相邻元素的预设个数,r表示阶差的索引,m表示阶差的总数量。
作为一个示例,在本发明实施例中预设个数n为10,阶差的总数量m为3。在其他实施例中,m和n的具体数值均可以根据市实际情况调整。
第s个相邻元素的第三异常程度数值越大,说明第s个相邻元素所反映的趋势差异的可信度越低,因此以该值的倒数作为差值绝对值的权重。
随着阶差数的增加,目标元素与相邻元素之间的对应趋势关系减弱,结合对应的阶差数反映目标元素在时序上的异常程度,并通过获取所有阶差对应比值的均值反映经过m阶差后共同表征的第i个元素在时序上的异常程度。
步骤S006,通过结合第二异常程度、第三异常程度和第四异常程度获取目标元素的最终异常程度,根据最终异常程度的大小筛选异常数据并剔除,得到准确数据,利用准确数据进行负载用电量预测进而完成光伏新能源电力系统容量的优化。
以目标元素的第二异常程度、第三异常程度以及第四异常程度的乘积作为目标元素的最终异常程度。
第i个元素作为目标元素时,最终异常程度,结合本身的异常程度以及趋势的异常程度综合获取目标元素的最终异常程度,该值越大,对应的目标元素越有可能为异常数据。
在获取最终异常程度时,同时分析了每个时刻下的用电量本身与对应变化趋势之间的影响关系,使得数据异常分析更加可靠,获得更加准确的数据异常程度。其中在数据趋势分析中,结合多阶差对数据变化趋势的不同反映程度,避免单个较大阶差对数据变化趋势分析的影响,获得更加可靠的数据变化趋势,从数据变化趋势的异常体现对应的数据异常。
对所有时刻下的用电量对应的最终异常程度进行归一化,在本发明实施例中以最大最小归一化法完成归一化,得到归一化结果,通过设置阈值筛选异常数据,当时,对应的目标元素为异常数据。作为一个示例,本发明实施例中阈值的取值为0.9,在其他实施例中阈值的选取可以根据实际情况调整。
基于上述步骤筛选出历史数据中的所有异常数据后,为保证历史数据的准确性,将异常数据剔除,得到准确数据。
将剔除的异常数据所在数据集中保留的准确数据求均值作为该异常数据位置处的插值,将所有异常数据利用对应插值替换后,得到用于进行负载用电量预测的处理后数据。
通过插值获取更加准确的历史数据,更加有效地反映负载用电量。利用处理后数据进行负载用电量的预测,依据已有数据获取预测数据为现有技术,本发明实施例不再赘述具体预测过程。以预测的负载用电量作为光伏新能源电力系统容量。
进一步的,光伏新能源会受到天气等因素影响,还可以在获取预测负载用电量后,结合天气预报等数据对光伏新能源电力系统容量进行优化,以保证不同情况负载正常用电。
综上所述,本发明实施例获取光伏新能源电力系统的负载用电的历史数据,历史数据为连续预设天数的负载用电数据,每天的负载用电数据为一个用电量序列;获取每天的用电总量,并获取连续预设天数的用电总量的中心数据,基于每天的用电总量与中心数据的差异以及去除目标天的用电总量前后的数据差异获取目标天的用电总量的第一异常程度;将每个用电量序列中的元素按照时序编号,由所有用电量序列中同一编号的元素组成一个数据集,以每个元素作为目标元素,基于数据集中目标元素与邻域元素的差异、对应的第一异常程度获取目标元素的第二异常程度;获取数据集中目标元素与相邻元素之间的变化趋势,基于目标元素对应的变化趋势与数据集内其他元素对应的变化趋势之间的差异、对应的第二异常程度获取目标元素的第三异常程度;根据不同阶差下目标元素与数据集中相邻元素之间的变化趋势获取对应的角度变化,基于目标元素对应的角度变化与相邻元素对应的角度变化之间的差异、对应的第三异常程度获取目标元素的第四异常程度;通过结合第二异常程度、第三异常程度和第四异常程度获取目标元素的最终异常程度,根据最终异常程度的大小筛选异常数据并剔除,得到准确数据,利用准确数据进行负载用电量预测进而完成光伏新能源电力系统容量的优化。本发明综合考量多个方面的指标获取综合异常程度,能够更加准确地筛选出异常数据,提高光伏新能源电力系统中异常数据的识别精度,进而增强光伏新能源电力系统容量的优化效果。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围,均应包含在本申请的保护范围之内。