发明内容
为了解决格拉布斯准则中通过人为主观设定的置信概率获取的临界值,是无法对不停变化的电力数据进行准确的异常检测,进而无法准确的对能源电力数据进行质量评估的技术问题,本发明的目的在于提供一种能源电力数据质量评估方法,所采用的技术方案具体如下:
本发明提出了一种能源电力数据质量评估方法,该方法包括以下步骤:
获取预设天数内每个时刻下的电力数据;
构建每个电力数据的邻域,根据每个电力数据的邻域内电力数据的变化、相邻两个电力数据之间的差异和电力数据增减方向的改变次数,获取每个电力数据的变化值;
根据每个电力数据与对应的每个邻域电力数据之间的变化值差异和对应时刻之间的差异,以及每个电力数据与所在当天内最大电力数据对应时刻之间的差异,获取每个电力数据的第一异常值;
将任一个电力数据作为目标电力数据,将预设天数内每天与目标电力数据所在当天对应时刻相同的时刻作为参考时刻;根据目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异,目标电力数据与每个参考时刻下的电力数据之间的变化值差异,以及目标电力数据所在当天与每个参考时刻所在当天之间的最大电力数据对应时刻差异,获取目标电力数据的第二异常值;
根据每个电力数据的第一异常值和第二异常值,获取每个电力数据的置信概率;
根据每个电力数据的置信概率和变化值,通过格拉布斯准则,获取每个电力数据的异常得分值,对预设天数内的电力数据质量进行评估。
进一步地,所述变化值的获取方法为:
对于任一电力数据,获取该电力数据的邻域内电力数据增减方向的改变次数;其中,电力数据由增到减或者由减到增均为电力数据增减方向的一次改变;
根据该电力数据的邻域内最大电力数据与最小电力数据之间的差异,相邻两个电力数据之间的差异和电力数据增减方向的改变次数,获取该电力数据的变化值。
进一步地,所述变化值的计算公式为:
式中,为第a个电力数据的变化值;/>为第a个电力数据的邻域内最大的电力数据;/>为第a个电力数据的邻域内最小的电力数据;I为第a个电力数据的邻域内电力数据的总数量;/>为第a个电力数据的邻域内第(i+1)个电力数据;/>为第a个电力数据的邻域内第i个电力数据;/>为第a个电力数据的邻域内电力数据增减方向的改变次数;/>为绝对值函数;norm为归一化函数。
进一步地,所述第一异常值的获取方法为:
对于任一个电力数据,将该电力数据所在当天内最大的电力数据对应的时刻,作为目标时刻;
当目标时刻至少存在两个时,将当天内第一次出现的目标时刻作为初始目标时刻,当天内最后一次出现的目标时刻作为最终目标时刻;
当目标时刻只存在一个时,该目标时刻为当天的初始目标时刻和最终目标时刻;
根据该电力数据与对应的每个邻域电力数据之间的变化值差异和对应时刻之间的差异,以及该电力数据所在当天对应的时刻分别与初始目标时刻和最终目标时刻之间的差异,获取该电力数据的第一异常值。
进一步地,所述第一异常值的计算公式为:
式中,为第a个电力数据的第一异常值;V为第a个电力数据的邻域电力数据的总数量;/>为第a个电力数据的变化值;/>为第a个电力数据的第v个邻域电力数据的变化值;为第a个电力数据在所在当天对应的时刻;/>为第a个电力数据的第v个邻域电力数据在所在当天对应的时刻;/>为第一预设常数,大于0;/>为第a个电力数据所在当天的初始目标时刻;/>为第a个电力数据所在当天的最终目标时刻;/>为第二预设常数,大于0;/>为绝对值函数;min为取最小值函数;norm为归一化函数。
进一步地,所述第二异常值的获取方法为:
将目标电力数据所在当天内所有电力数据的累加结果,作为第一结果;
将目标电力数据与第一结果的比值,作为目标电力数据在所在当天的占比;
将所有参考时刻下电力数据的累加结果与预设天数内所有电力数据的累加结果的比值,作为所有参考时刻下的电力数据在预设天数内的占比;
将目标电力数据所在当天对应时刻距离最近的目标时刻,作为特征目标时刻;
将每个参考时刻所在当天内距离参考时刻最近的目标时刻,作为对应参考时刻的参考目标时刻;
对于任一参考时刻,当特征目标时刻和该参考时刻的参考目标时刻均存在一个时,将特征目标时刻与该参考时刻的参考目标时刻之间的差异,作为峰值时间差异;
当特征目标时刻或者该参考时刻的参考目标时刻存在两个时,获取每个特征目标时刻与该参考时刻的每个参考目标时刻之间的差异,作为第一差异;将最小的第一差异作为峰值时间差异;
根据目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异,目标电力数据与每个参考时刻下的电力数据之间的变化值差异,以及目标电力数据所在当天与每个参考时刻所在当天之间的峰值时间差异,获取目标电力数据的第二异常值。
进一步地,所述第二异常值的计算公式为:
式中,为第a个电力数据的第二异常值;/>为第a个电力数据;/>为第一结果;M为参考时刻的总数量;/>为第m个参考时刻下的电力数据;/>为预设天数内所有电力数据的累加结果;/>为第a个电力数据的变化值;/>为第m个参考时刻下的电力数据的变化值;/>为第a个电力数据所在当天与第m个参考时刻所在当天之间的峰值时间差异;/>为第三预设常数,大于0;/>为绝对值函数;norm为归一化函数。
进一步地,所述置信概率计算公式为:
式中,为第a个电力数据的置信概率;/>为第a个电力数据的第一异常值;/>为第a个电力数据的第二异常值。
进一步地,所述根据每个电力数据的置信概率和变化值,通过格拉布斯准则,获取每个电力数据的异常得分值的方法为:
根据每个电力数据的置信概率和变化值,通过格拉布斯准则,获取每个电力数据的变化值标准分数和临界值;
将每个电力数据的变化值标准分数与临界值的差值,作为对应电力数据的第一值;
当第一值大于预设的第一阈值时,将对应电力数据的第一值,作为异常得分值;
当第一值小于或者等于预设的第一阈值时,将第一阈值作为对应电力数据的异常得分值。
进一步地,所述对预设天数内的电力数据质量进行评估的方法为:
获取预设天数内所有电力数据的异常得分值的相加结果,作为整体异常值;
当归一化的整体异常值大于或者等于预设的整体异常值阈值时,预设天数内的电力数据质量差;
当归一化的整体异常值小于预设的整体异常值阈值时,预设天数内的电力数据质量合格。
本发明具有如下有益效果:
构建每个电力数据的邻域,根据每个电力数据的邻域内电力数据的变化、相邻两个电力数据之间的差异和电力数据增减方向的改变次数,获取每个电力数据的变化值,根据每个电力数据的变化值对每个电力数据的异常程度进行分析,避免了直接对每个电力数据的大小进行异常检测不准确的问题;因此,根据每个电力数据与对应的每个邻域电力数据之间的变化值差异和对应时刻之间的差异,以及每个电力数据与所在当天内最大电力数据对应时刻之间的差异,获取每个电力数据的第一异常值,初步判断每个电力数据的异常情况,为了更准确的对电力数据的异常情况进行分析,进而根据目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异,目标电力数据与每个参考时刻下的电力数据之间的变化值差异,以及目标电力数据所在当天与每个参考时刻所在当天之间的最大电力数据对应时刻差异,获取目标电力数据的第二异常值,进一步确定目标电力数据的异常程度;为了避免异常电力数据被漏检,正常电力数据被误检,因此,根据每个电力数据的第一异常值和第二异常值,自适应获取每个电力数据的置信概率,避免了人为主观设定的置信概率不准确的情况,进而根据每个电力数据的置信概率和变化值,通过格拉布斯准则,对每个电力数据进行准确的异常检测,确定预设天数内的异常电力数据,进而获取每个电力数据的异常得分值,对预设天数内的电力数据质量进行准确的评估,确保对电力资源进行合理规划,促进能源电力行业的健康发展。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种能源电力数据质量评估方法,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种能源电力数据质量评估方法的具体方案。
本发明实施例的具体场景为:预设天数内每天采集电力数据的次数和对应时刻均相同。
本发明实施例的目的为:由于电力数据属于时序数据,每天不同时刻下的电力数据会存在差异,同时,还可能因为节日、演出、比赛等特定活动导致不同天相同时刻下的电力数据也产生较大差异,因此,直接通过格拉布斯准则对多变的电力数据难以进行准确的异常检测。为了对电力数据进行准确的异常检测,从而对电力数据进行准确的质量评估,本发明实施例根据每个电力数据在邻域内的变化情况,获取每个电力数据的变化值,根据每个电力数据的变化值在同一天不同时刻和不同天相同时刻的差异来获得每个电力数据的异常程度,进而根据每个电力数据的异常程度自适应获取每个电力数据的置信概率,进而准确获取每个电力数据的异常得分,对预设天数内电力数据的质量进行准确的评估。其中,格拉布斯准则为现有技术,不再进行赘述。
请参阅图1,其示出了本发明一个实施例提供的一种能源电力数据质量评估方法的流程示意图,该方法包括以下步骤:
步骤S1:获取预设天数内每个时刻下的电力数据。
具体的,通过电力传感器获取每个时刻下的电力数据,为了提高对电力数据的质量进行评估的效率,本发明实施例将采集数据相邻两个时刻之间的时间间隔设定为10分钟,将预设天数设定为30天,实施者可根据实际情况设定采集数据相邻两个时刻之间的时间间隔和预设天数的大小,在此不进行限定。
步骤S2:构建每个电力数据的邻域,根据每个电力数据的邻域内电力数据的变化、相邻两个电力数据之间的差异和电力数据增减方向的改变次数,获取每个电力数据的变化值。
具体的,利用常规格拉布斯准则对电力数据进行质量评估时,首先计算每个电力数据的标准分数,即每个电力数据的残差与标准差的比值,将每个电力数据的标准分数与通过人为设定的置信概率获取的临界值进行比较,若标准分数大于临界值的电力数据较多,则说明预设天数内电力数据的质量越差。实际情况中,电力数据的大小是不断发生变化的,且变化的程度无法确定,仅通过电力数据的大小无法表现出电力数据的异常程度。但是电力数据的变化存在一定的趋势,且正常情况下电力数据的变化比较稳定,不会出现突然的偏离,因此,本发明实施例分别以每个电力数据为中心,在时序上向前和向后均延伸预设数量个电力数据,将延伸后的电力数据构成的数据段,作为对应电力数据的邻域,根据每个电力数据的邻域内电力数据的变化情况,获取每个电力数据的变化值。本发明实施例将预设数量设定为5,实施者可根据实际情况设定预设数量的大小,在此不进行限定。例如,以第a个电力数据为中心,若第a个电力数据在预设天数内对应的时刻为第20个时刻,则预设天数内的第15个时刻、第16个时刻、第17个时刻、第18个时刻、第19个时刻、第21个时刻、第22个时刻、第23个时刻、第24个时刻和第25个时刻,为第a个电力数据在时序上向前和向后所延伸的电力数据,第15个时刻到第25个时刻下的11个电力数据构成的数据段,即为第a个电力数据的邻域。需要说明的是,预设天数内的前5个电力数据和后5个电力数据不存在时序上前后各相邻的5个电力数据,因此,不获取预设天数内的前5个电力数据和后5个电力数据的变化值。其中,变化值越小,说明对应电力数据越正常,变化值越大,说明对应电力数据越可能受到噪声数据的干扰,存在异常的可能性越大。
优选地,获取变化值的方法为:对于任一电力数据,获取该电力数据的邻域内电力数据增减方向的改变次数;其中,电力数据由增到减或者由减到增均为电力数据增减方向的一次改变;电力数据增减方向的改变次数越大,说明该电力数据的邻域内电力数据的变化趋势越不稳定,该电力数据的变化程度越大。获取该电力数据的邻域内最大电力数据与最小电力数据之间的差异,当差异越大,说明该电力数据的邻域内电力数据的变化程度越大,间接说明该电力数据的变化程度越大。获取该电力数据的邻域内相邻两个电力数据之间的差值绝对值,当相邻两个电力数据之间的差值绝对值越小,说明相邻电力数据越接近,变化程度越小。因此,根据该电力数据的邻域内最大电力数据与最小电力数据之间的差异,相邻两个电力数据之间的差异和电力数据增减方向的改变次数,获取该电力数据的变化值。
作为一个示例,以第a个电力数据为例,获取第a个电力数据的变化值的计算公式为:
式中,为第a个电力数据的变化值;/>为第a个电力数据的邻域内最大的电力数据;/>为第a个电力数据的邻域内最小的电力数据;I为第a个电力数据的邻域内电力数据的总数量,本发明实施例为11;/>为第a个电力数据的邻域内第(i+1)个电力数据;为第a个电力数据的邻域内第i个电力数据;/>为第a个电力数据的邻域内电力数据增减方向的改变次数;/>为绝对值函数;norm为归一化函数。
需要说明的是,一定大于或者等于0,当/>越大时,说明第a个电力数据的邻域内电力数据的变化程度越大,/>越大;/>越大,说明第a个电力数据的邻域内第i个电力数据与第(i+1)个电力数据之间的变化程度越大,越大,说明第a个电力数据的邻域内电力数据的变化程度越大,/>越大;/>越大,说明第a个电力数据的邻域内电力数据的变化趋势越不稳定,/>越大;因此,/>越大,说明第a个电力数据的变化程度越大,间接说明第a个电力数据越可能存在异常。
根据获取第a个电力数据的变化值的方法,获取预设天数内每个电力数据的变化值。
步骤S3:根据每个电力数据与对应的每个邻域电力数据之间的变化值差异和对应时刻之间的差异,以及每个电力数据与所在当天内最大电力数据对应时刻之间的差异,获取每个电力数据的第一异常值。
具体的,一天内不同时间段下的电力数据变化趋势是不相同的,例如早上和半夜用电量较少,电力数据变化比较平缓,中午和晚上用电量较大,电力数据变化程度比较大。因此,电力数据的变化趋势是随着用电量的大小而增减的,在用电量大的时间段内电力数据的变化趋势也大,在用电量小的时间段内电力数据的变化趋势也小。为了准确获取每个电力数据的变化趋势,进行准确对每个电力数据的异常程度进行分析,本发明实施例获取预设天数内每天的电力数据的峰值即最大电力数据,最大电力数据通常分布在每天用电量大的时间段内,与每天内的最大电力数据在时序上距离越近的电力数据的变化趋势越大,与最大电力数据在时序上距离越远的电力数据的变化趋势越平缓。因此,为了对每个电力数据是否存在异常进行准确的分析,本发明实施例获取每个电力数据与对应的每个邻域电力数据之间的变化值差异,作为第一特征差异,当第一特征差异越大时,说明对应电力数据与邻域电力数据之间的变化值差异越大,间接说明对应电力数据越可能存在异常。在正常情况中,当某个电力数据与对应的邻域电力数据之间的时间间隔越大时,该电力数据与对应的邻域电力数据之间的第一特征差异越大,因此,为了通过第一特征差异更准确的获取每个电力数据的异常程度,本发明实施例获取每个电力数据与对应的每个邻域电力数据对应时刻之间的差异,对每个电力数据与对应的每个邻域电力数据之间的第一特征差异进行修正,进而更准确的表现出每个电力数据的异常程度。同时,获取每个电力数据与所在当天内最大电力数据对应时刻之间的差异,对每个电力数据与对应的每个邻域电力数据之间的第一特征差异进行进一步修正,提高获取每个电力数据的异常程度的准确性。进而根据每个电力数据与对应的每个邻域电力数据之间的变化值差异和对应时刻之间的差异,以及每个电力数据与所在当天内最大电力数据对应时刻之间的差异,获取每个电力数据的第一异常值。
优选地,获取第一异常值的方法为:对于任一个电力数据,将该电力数据所在当天内最大的电力数据对应的时刻,作为目标时刻;在实际情况中,每天中的目标时刻可能会存在多个,为了更准确的分析该电力数据的变化情况,进而对该电力数据的异常情况进行准确检测。当目标时刻至少存在两个时,将当天内第一次出现的目标时刻作为初始目标时刻,当天内最后一次出现的目标时刻作为最终目标时刻;当目标时刻只存在一个时,该目标时刻为当天的初始目标时刻和最终目标时刻;获取该电力数据所在当天对应的时刻分别与初始目标时刻和最终目标时刻之间的差异,确定该电力数据所在时刻与目标时刻之间的位置关系,提高获取该电力数据异常程度的准确性。进而根据该电力数据与对应的每个邻域电力数据之间的变化值差异和对应时刻之间的差异,以及该电力数据所在当天对应的时刻分别与初始目标时刻和最终目标时刻之间的差异,获取该电力数据的第一异常值。
作为一个示例,以步骤S2中的第a个电力数据为例,获取第a个电力数据的第一异常值的计算公式为:
式中,为第a个电力数据的第一异常值;V为第a个电力数据的邻域电力数据的总数量,本发明实施例为10;/>为第a个电力数据的变化值;/>为第a个电力数据的第v个邻域电力数据的变化值;/>为第a个电力数据在所在当天对应的时刻;/>为第a个电力数据的第v个邻域电力数据在所在当天对应的时刻;/>为第一预设常数,大于0;/>为第a个电力数据所在当天的初始目标时刻;/>为第a个电力数据所在当天的最终目标时刻;/>为第二预设常数,大于0;/>为绝对值函数;min为取最小值函数;norm为归一化函数;/>为第一特征差异。
本方法实施例将设定为0.1,避免分母为0,将/>设定为0.1,避免为0,实施者可根据实际情况设定/>和/>的大小,在此不进行限定。
需要说明的是,越大,说明第a个电力数据与第a个电力数据的第v个邻域电力数据之间的时间间隔越大,正常情况下,第一特征差异/>越大,因此,通过对第一特征差异/>进行修正,/>越小,第一特征差异/>参与获取/>的占比越小,使得/>越准确;/>越大,说明第a个电力数据在时序上距离最大电力数据的时间间隔越大,在正常情况中,/>应该越小,当/>越大时,说明第a个电力数据变化趋势突出程度越大,/>越大;因此,/>越大,说明第a个电力数据的变化趋势突出程度越大,第a个电力数据异常的程度越大。其中,/>的取值范围为0到1。需要说明的是,当第a个电力数据的邻域电力数据与第a个电力数据不在同一天时,此时在获取第a个电力数据与不是同一天的邻域电力数据对应时刻之间的差异时,若时序上第a个电力数据在不是同一天的邻域电力数据之前,则将不是同一天的邻域电力数据对应的时刻加上24;若时序上第a个电力数据在不是同一天的邻域电力数据之后,则将第a个电力数据对应的时刻加上24。
根据获取第a个电力数据的第一异常值的方法,获取每个电力数据的第一异常值。
步骤S4:将任一个电力数据作为目标电力数据,将预设天数内每天与目标电力数据所在当天对应时刻相同的时刻作为参考时刻;根据目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异,目标电力数据与每个参考时刻下的电力数据之间的变化值差异,以及目标电力数据所在当天与每个参考时刻所在当天之间的最大电力数据对应时刻差异,获取目标电力数据的第二异常值。
具体的,在不考虑各种因素干扰的情况下,电力数据具有较好的周期性,该周期性表现为每天相同时刻下的电力数据在所在当天的占比始终相近,且每天相同时刻下电力数据的变化值也相近,当某个电力数据在所在当天的占比和变化值,与预设天数内其他天相同时刻下的电力数据在所在当天的占比和变化值的差异越大时,说明该电力数据的异常程度较大,但考虑到特殊情况产生的影响,例如,一些演出、比赛、节日等活动导致的某些天内的电力使用情况可能与平时差异较大,因此,本发明实施例通过获取不同天之间的最大电力数据对应时刻差异,来确定不同天之间的电力数据的变化趋势差异,对电力使用情况差异较大的某些天内对应的数据在计算时赋予较小的权值,以降低计算误差,进而对每个电力数据的异常程度进行更准确的分析。为了更清晰的对每个电力数据进行分析,本发明实施例将任一个电力数据作为目标电力数据,将预设天数内每天与目标电力数据所在当天对应时刻相同的时刻作为参考时刻;因此,根据目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异,目标电力数据与每个参考时刻下的电力数据之间的变化值差异,以及目标电力数据所在当天与每个参考时刻所在当天之间的最大电力数据对应时刻差异,获取目标电力数据的第二异常值。
优选地,获取第二异常值的方法为:将目标电力数据所在当天内所有电力数据的累加结果,作为第一结果;将目标电力数据与第一结果的比值,作为目标电力数据在所在当天的占比;将所有参考时刻下电力数据的累加结果与预设天数内所有电力数据的累加结果的比值,作为所有参考时刻下的电力数据在预设天数内的占比;在不存在异常情况时,目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比越相近。将目标电力数据所在当天对应时刻距离最近的目标时刻,作为特征目标时刻;将每个参考时刻所在当天内距离参考时刻最近的目标时刻,作为对应参考时刻的参考目标时刻;对于任一参考时刻,当特征目标时刻和该参考时刻的参考目标时刻均存在一个时,将特征目标时刻与该参考时刻的参考目标时刻之间的差值绝对值,作为峰值时间差异;当特征目标时刻或者该参考时刻的参考目标时刻存在两个时,获取每个特征目标时刻与该参考时刻的每个参考目标时刻之间的差值绝对值,作为第一差异;将最小的第一差异作为峰值时间差异;峰值时间差异越大,说明目标电力数据所在当天和该参考时刻所在当天之间的电力使用情况的差异越大,为了准确获取目标电力数据的第二异常值,通过峰值时间差异对目标电力数据与该参考时刻下电力数据之间的变化值差异进行修正,降低计算误差。进而根据目标电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异,目标电力数据与每个参考时刻下的电力数据之间的变化值差异,以及目标电力数据所在当天与每个参考时刻所在当天之间的峰值时间差异,获取目标电力数据的第二异常值。
作为一个示例,以步骤S2中的第a个电力数据为例,第a个电力数据即为目标电力数据,获取第a个电力数据的第二异常值的计算公式为:
式中,为第a个电力数据的第二异常值;/>为第a个电力数据;/>为第一结果;M为参考时刻的总数量,本发明实施例为30;/>为第m个参考时刻下的电力数据;/>为预设天数内所有电力数据的累加结果;/>为第a个电力数据的变化值;/>为第m个参考时刻下的电力数据的变化值;/>为第a个电力数据所在当天与第m个参考时刻所在当天之间的峰值时间差异;/>为第三预设常数,大于0;/>为绝对值函数;norm为归一化函数。
本发明实施例将设定为1,避免分母为0,实施者可根据实际情况设定/>的大小,在此不进行限定。
需要说明的是,越大,说明第a个电力数据在所在当天的占比与所有参考时刻下的电力数据在预设天数内的占比的差异越大,第a个电力数据越可能存在异常,/>越大;/>越大,说明第a个电力数据所在当天与第m个参考时刻所在当天之间的用电量差异越大,为了降低这种特殊情况对获取/>的误差,通过/>对/>进行修正,使得/>更准确,/>越大,说明第a个电力数据的变化值与参考时刻下电力数据的变化值的差异越大,第a个电力数据越可能存在异常,/>越大;因此,/>越大,说明第a个电力数据与参考时刻下电力数据的变化趋势的差异越大,第a个电力数据的异常程度越大。其中,/>的取值范围为0到1。
根据获取第a个电力数据的第二异常值的方法,获取每个电力数据的第二异常值。
步骤S5:根据每个电力数据的第一异常值和第二异常值,获取每个电力数据的置信概率。
具体的,在格拉布斯准则中,置信概率是人为设定的参数,通过置信概率获取临界值,因此,置信概率的大小决定了对电力数据的异常检验是否严格。置信概率越大,临界值越大,电力数据被判定为异常数据的可能性就会越小。同时,所有电力数据设定的置信概率是相同的,偏大的置信概率可能会导致部分异常电力数据被漏检,偏小的置信概率可能会导致部分正常电力数据被误判为异常电力数据。当电力数据存在异常时,对应的置信概率应该越小,确保异常电力数据被准确的检测出来,避免漏检;当电力数据正常时,对应的置信概率应该越大,避免正常电力数据被误认为异常电力数据。因此,为了对电力数据进行准确的异常检测,进而根据每个电力数据的第一异常值和第二异常值,自适应获取每个电力数据的置信概率。
作为一个示例,以步骤S2中的第a个电力数据为例,获取第a个电力数据的置信概率的计算公式为:
式中,为第a个电力数据的置信概率;/>为第a个电力数据的第一异常值;/>为第a个电力数据的第二异常值。
需要说明的是,越大,/>越大,说明第a个电力数据存在异常的程度越大,为了对第a个电力数据进行准确的异常检测,/>越小;在格拉布斯准则中设定置信概率的取值范围在0.9-1之间,因此,本发明实施例为了确保/>的取值范围也在0.9-1之间,因此获取,使得/>的取值范围为(0,0.1]。
根据获取第a个电力数据的置信概率的方法,获取每个电力数据的置信概率。至此,自适应获取每个电力数据的置信概率。
步骤S6:根据每个电力数据的置信概率和变化值,通过格拉布斯准则,获取每个电力数据的异常得分值,对预设天数内的电力数据质量进行评估。
具体的,为了对预设天数内电力数据的质量进行准确的评估,根据每个电力数据的置信概率和变化值,通过格拉布斯准则,获取每个电力数据的变化值标准分数和临界值。当某个电力数据的变化值标准分数大于临界值时,该电力数据存在异常。因此,获取每个电力数据的变化值标准分数与临界值的差值,作为对应电力数据的第一值;本发明实施例将预设的第一阈值设定为0,实施者可根据实际情况设定预设的第一阈值的大小,在此不进行限定。当第一值大于预设的第一阈值时,将对应电力数据的第一值,作为异常得分值;当第一值小于或者等于预设的第一阈值时,将第一阈值作为对应电力数据的异常得分值。至此,获取预设天数内每个电力数据的异常得分值。其中,异常得分值为非负数。
为了表现出预设天数内电力数据的整体异常程度,本发明实施例获取预设天数内所有电力数据的异常得分值的相加结果,作为整体异常值。本发明实施例将预设的整体异常值阈值设定为0.7,实施者可根据实际情况设定预设的整体异常值阈值的大小,在此不进行限定。当归一化的整体异常值大于或者等于预设的整体异常值阈值时,预设天数内电力数据的整体异常程度大,可靠性低,预设天数内的电力数据质量差。当归一化的整体异常值小于预设的整体异常值阈值时,预设天数内电力数据的整体异常程度小,可靠性高,预设天数内的电力数据质量合格。至此,对预设天数内电力数据的质量进行准确的评估,有利于对能源电力资源进行合理规划,促进能源电力行业的健康发展。
至此,本发明完成。
综上所述,本发明实施例获取电力数据,构建电力数据的邻域,根据邻域内电力数据的变化,获取电力数据的变化值;根据电力数据与对应邻域电力数据的变化值差异和对应时刻的差异,电力数据与所在当天最大电力数据对应时刻的差异,获取第一异常值;根据相同时刻下的电力数据在所在当天的占比差异和最大电力数据对应时刻差异,以及变化值差异,获取第二异常值;根据第一异常值和第二异常值,获取置信概率,通过格拉布斯准则,对电力数据质量进行评估。本发明通过自适应获取每个电力数据的置信概率,进而准确确定预设天数内的异常电力数据,对预设天数内的电力数据质量进行准确评估。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。