CN115828134A - 用电数据样本构建、模型训练、账户类别确定方法和装置 - Google Patents

用电数据样本构建、模型训练、账户类别确定方法和装置 Download PDF

Info

Publication number
CN115828134A
CN115828134A CN202211346826.4A CN202211346826A CN115828134A CN 115828134 A CN115828134 A CN 115828134A CN 202211346826 A CN202211346826 A CN 202211346826A CN 115828134 A CN115828134 A CN 115828134A
Authority
CN
China
Prior art keywords
data
load
account
power
electricity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211346826.4A
Other languages
English (en)
Inventor
王祥
洪海敏
占兆武
唐远洋
蔡义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Gridcom Co Ltd
Shenzhen Zhixin Microelectronics Technology Co Ltd
Original Assignee
China Gridcom Co Ltd
Shenzhen Zhixin Microelectronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Gridcom Co Ltd, Shenzhen Zhixin Microelectronics Technology Co Ltd filed Critical China Gridcom Co Ltd
Priority to CN202211346826.4A priority Critical patent/CN115828134A/zh
Publication of CN115828134A publication Critical patent/CN115828134A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用电数据样本构建、模型训练、账户类别确定方法和装置,所述用电数据样本构建方法包括:获取用电负荷时间序列;利用用电负荷时间序列中预设值的占比以及对应的变异系数生成负荷曲线抖动数据;基于用电负荷时间序列进行相似度计算,确定第一周期特征数据;根据子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;对指定时间段内的用电负荷时间序列、负荷曲线抖动数据、第一周期特征数据、第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。由此通过为基础用电负荷时间序列数据构建与用电负荷规律特点相关的特征数据,可以有效提高用电用户分类的准确率。

Description

用电数据样本构建、模型训练、账户类别确定方法和装置
技术领域
本发明涉及电力技术领域,尤其涉及一种用电数据样本构建、模型训练、账户类别确定方法和装置。
背景技术
专变指的是独立使用专用变压器进行供电的一种模式。随着专变用户的数量与规模与日俱增,根据不同的用电规律对专变用户进行准确的分类,对于专变用户用电管理、负荷预测、用电行为分析等具有重要的意义。
然而,由于专变用户的用电规律多种多样,相关技术中对用电用户的分类准确度有待提高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种用电数据样本构建方法,通过为基础用电负荷时间序列数据构建与用电负荷规律特点相关的特征数据,以提高分类模型训练的准确率,从而提高对用电用户分类的准确率,保证将具有相似用电负荷规律的用户分到同一类别中。
本发明的第二个目的在于提出一种模型训练方法。
本发明的第三个目的在于提出一种用电账户类别确定方法。
本发明的第四个目的在于提出一种用电账户类别确定方法。
本发明的第五个目的在于提出一种用电数据样本构建装置。
本发明的第六个目的在于提出一种模型训练装置。
本发明的第七个目的在于提出一种用电账户类别确定装置。
本发明的第八个目的在于提出一种用电账户类别确定装置。
本发明的第九个目的在于提出一种计算机设备。
本发明的第十个目的在于提出一种计算机可读存储介质。
为达到上述目的,本发明的一个实施方式提出了一种用电数据样本构建方法,所述方法包括:获取用电负荷时间序列;其中,所述用电负荷时间序列被切割为若干子时间序列;利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数生成负荷曲线抖动数据;其中,所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据;根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;对指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。
根据本发明的一个实施方式,所述第二周期特征数据包括年周期特征数据;所述根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,包括:确定所述用电负荷时间序列对应的用电趋势时间序列;以年为时间单位对所述用电趋势时间序列进行切割,得到至少两个年用电趋势时间序列;基于任意两个年用电趋势时间序列之间的相关系数进行平均计算,确定所述年周期特征数据。
根据本发明的一个实施方式,所述确定所述用电负荷时间序列对应的用电趋势时间序列,包括:对指定时间段内的用电负荷时间序列进行平均计算,得到用电均值时间序列;对所述用电均值时间序列时间进行数据平滑过滤,得到所述用电负荷时间序列对应的用电趋势时间序列。
根据本发明的一个实施方式,所述第二周期特征数据包括日周期特征数据;所述根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,包括:以天为时间单位对所述用电负荷时间序列进行切割,得到至少两个天用电负荷序列;基于任意两个所述天用电负荷序列之间的相关系数进行平均计算,得到所述日周期特征数据。
根据本发明的一个实施方式,所述基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据,包括:按照预设时间单位对所述用电负荷时间序列进行切割,得到至少两个预设时间单位负荷序列;利用汉明距离算法计算任意两个预设时间单位负荷序列之间的相似度;将所述任意两个预设时间单位负荷序列之间的相似度的平均值作为所述第一周期特征数据。
根据本发明的一个实施方式,所述数据样本标注有用电账户类别;其中,所述用电账户类别为水平型类别、零值规律类别、年周期性类别、日周期性类别、随机型类别中的任一个;其中,属于所述水平型类别的用电账户的负荷曲线近似为直线;属于所述零值规律类别的用电账户的负荷曲线中零值占比超过阈值且非零值具有周期性规律;属于所述年周期性类别的用电账户的用电负荷曲线存在年周期性规律;属于所述日周期性类别的用电账户的用电负荷曲线存在日周期性规律。
本发明的一个实施方式提出了一种模型训练方法,所述方法包括:获取通过前述的任一实施方式所构建的数据样本,作为第一用电数据样本;将所述第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别;根据所述用电账户预测类别、所述数据样本被标注的用电账户类别对所述用电账户分类模型的参数进行更新,直至满足模型停止训练条件。
本发明的一个实施方式提出了一种用电账户类别确定方法,所述方法包括:获取目标账户的账户用电负荷数据;将所述账户用电负荷数据输入至通过前述模型训练方法训练得到的用电账户分类模型中,确定所述目标账户所属的目标用电账户类别。
本发明的一个实施方式提出了一种用电账户类别确定方法,所述方法包括:获取目标账户的用电负荷时间序列;确定所述目标账户的负荷曲线抖动数据、第一周期特征数据、第二周期特征数据;其中,所述负荷曲线抖动数据是利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数而生成的;所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;所述第一周期特征数据是基于所述目标账户的用电负荷时间序列进行相似度计算而确定的;所述第二周期特征数据是基于所述目标账户的若干子时间序列进行相似度计算而确定的;所述若干子时间序列是对所述目标账户的用电负荷时间序列进行切割得到的;基于所述目标账户在指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据构建账户用电负荷数据;根据所述账户用电负荷数据确定所述目标帐户所属的目标用电账户类别。
本发明的一个实施方式提出了一种用电数据样本构建装置,所述装置包括:时间序列获取模块,用于获取用电负荷时间序列;其中,所述用电负荷时间序列被切割为若干子时间序列;数据生成模块,用于利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数生成负荷曲线抖动数据;其中,所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;相似度计算模块,用于基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据;平均计算模块,用于根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;数据组合模块,用于对指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。
本发明的一个实施方式提出了一种模型训练装置,所述装置包括:数据样本获取模块,用于获取通过前述的任一项用电数据样本构建方法所构建的数据样本,作为第一用电数据样本;类别预测模块,用于将所述第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别;参数更新模块,用于根据所述用电账户预测类别、所述数据样本被标注的用电账户类别对所述用电账户分类模型的参数进行更新,直至满足模型停止训练条件。
本发明的一个实施方式提出了一种用电账户类别确定装置,所述装置包括:负荷数据获取模块,用于获取目标账户的账户用电负荷数据;类别确定模块,用于将所述账户用电负荷数据输入至通过前述模型训练方法训练得到的用电账户分类模型中,确定所述目标账户所属的目标用电账户类别。
本发明的一个实施方式提出了一种用电账户类别确定装置,所述装置包括:时间序列获取模块,用于获取目标账户的用电负荷时间序列;数据确定模块,用于确定所述目标账户的负荷曲线抖动数据、第一周期特征数据、第二周期特征数据;其中,所述负荷曲线抖动数据是利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数而生成的;所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;所述第一周期特征数据是基于所述目标账户的用电负荷时间序列进行相似度计算而确定的;所述第二周期特征数据是基于所述目标账户的若干子时间序列进行相似度计算而确定的;所述若干子时间序列是对所述目标账户的用电负荷时间序列进行切割得到的;负荷数据构建模块,用于基于所述目标账户在指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据构建账户用电负荷数据;类别确定模块,用于根据所述账户用电负荷数据确定所述目标用户所属的目标用电账户类别。
本发明的一个实施方式提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项实施方式所述的方法的步骤。
本发明的一个实施方式提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项实施方式所述的方法的步骤。
根据本发明提供的多个实施方式,能够按照用户用电负荷曲线在不同用电周期呈现出的显著的规律特性构建对应的用电负荷规律特征数据,以提高分类模型训练的准确率,从而提高对用电用户分类的准确度,保证将具有相同或相似用电负荷规律的用户划分到同一类别中。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1为根据本说明书一个实施方式提供的用电数据样本构建方法的流程示意图。
图2为根据本说明书一个实施方式提供的第二周期特征数据计算的流程示意图。
图3为根据本说明书一个实施方式提供的确定用电趋势时间序列的流程示意图。
图4为根据本说明书一个实施方式提供的第二周期特征数据计算的流程示意图。
图5为根据本说明书一个实施方式提供的确定第一周期特征数据的流程示意图。
图6为根据本说明书一个实施方式提供的模型训练方法的流程示意图。
图7为根据本说明书一个实施方式提供的用电账户类别确定方法的流程示意图。
图8为根据本说明书一个实施方式提供的用电账户类别确定方法的流程示意图。
图9为根据本说明书一个实施方式提供的用电数据样本构建装置的结构框图。
图10为根据本说明书一个实施方式提供的模型训练装置的结构框图。
图11为根据本说明书一个实施方式提供的用电账户类别确定装置的结构框图。
图12为根据本说明书一个实施方式提供的用电账户类别确定装置的结构框图。
图13a为根据本说明书一个实施方式提供的计算机设备的结构框图。
图13b为根据本说明书一个实施方式提供的计算机设备的结构框图。
图13c为根据本说明书一个实施方式提供的计算机设备的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
专变用户通常具有数量庞大、用电规律多种多样的特点,包括商业混合用电用户、办公专变用户、农用专变用户、民用专变用户、非普工业专变用户以及大工业专变用户等。随着智能电表的全面覆盖与信息化建设的开展,对各行业专变用户的用电管理和分析受到了电力企业、政府及用户越来越多的关注。根据专变用户的用电负荷规律对专变用户进行准确的分类,对于信息化建设发展下的用电管理具有非常重要的意义。
用电负荷曲线能够反映用电负荷随时间变化的规律。用电负荷曲线通常可以呈现出用户用电的负荷大小、负荷大小对应的时间轴、负荷波动过程等相关用电信息,因此,针对用电负荷曲线进行分析处理可以识别出用户在不同用电模式下的不同用电负荷规律,从而可以对用户进行分类。
相关技术中,通常使用分类或聚类算法对用电用户的用电负荷曲线进行分析处理,将用电负荷曲线形态相似的用户划分到同一类别中,将用电负荷曲线形态差异较大的用户划分到不同类别中,表示同一类别的用户具有相似的用电负荷规律,不同类别的用户具有差异较大的用电负荷规律。
在一些情况下,通常在针对用户一段时间的用电负荷曲线进行分类或聚类处理时,一方面,一些短期的波动可能对用电负荷曲线最终呈现出的特征有较大的影响,从而导致对用户分类的结果不准确;另一方面,可能无法兼顾用电负荷曲线分别在短期时间段和长期时间段所呈现出的不同特征,比如用户用电负荷曲线在短期时间段呈现出较大的差异,但是可能在长期时间段呈现出较大的相似性,从而导致对用户分类的结果不准确。
为了提高对具有不同用电负荷规律的用电用户进行分类的准确度,有必要提供一种用电数据样本构建、模型训练、账户类别确定的方法,能够按照用户用电负荷曲线在不同用电周期呈现出的显著的规律特性构建对应的用电负荷规律特征数据,以提高分类模型训练的准确率,从而提高对用电用户分类的准确度,保证将具有相同或相似用电负荷规律的用户划分到同一类别中。
本说明书实施方式提供一种用电数据样本构建方法,参考图1所示,该方法可以包括以下步骤。
S110、获取用电负荷时间序列。
其中,用电负荷时间序列被切割为若干子时间序列。
其中,用电负荷时间序列为能够体现用电用户的实际用电负荷曲线的基础特征的实际用电负荷数据。将用电负荷时间序列切割为若干子时间序列,是按照一定的时间周期对用电负荷时间序列进行划分,将用电负荷时间序列划分为若干个时间轴长度为该时间周期的子时间序列。具体地,用于对用电负荷时间序列进行划分的时间周期可以是日周期、周周期、半月周期、月周期、季度周期、年周期中的任一个。
S120、利用用电负荷时间序列中预设值的占比、用电负荷时间序列对应的变异系数生成负荷曲线抖动数据。
其中,变异系数是由用电负荷时间序列的均值、标准差决定的。
其中,预设值可以是用电用户在一段时间发生的偏离正常用电情况且基本保持不变的用电负荷数值。变异系数可以用于衡量用电负荷时间序列中用电数值的偏离程度。利用用电负荷时间序列中预设值的占比和变异系数生成负荷曲线抖动数据,可以作为数据样本的负荷曲线形态特征维度上的数据,用于体现用电负荷时间序列对应的用电负荷曲线的比较平稳的曲线形态特征。
具体地,说明如何计算得到变异系数。可以取用电用户一段时间的用电负荷时间序列,计算该用电负荷时间序列中的用电负荷数值的平均值avg,以及根据平均值计算得到该用电负荷时间序列的标准差std。根据得到的平均值和标准差,可以计算得到该用电负荷时间序列的变异系数CV=标准差std/平均值avg。利用预设值占比default,以及变异系数CV,可以生成该用电负荷时间序列的负荷曲线抖动数据J=[default,CV]。
S130、基于用电负荷时间序列进行相似度计算,确定第一周期特征数据。
其中,第一周期特征可以用于表示用户发生用电的时间较少,且用电负荷时间序列对应的用电负荷曲线呈现出周期性规律的特征。
在一些情况中,用电负荷时间序列的相似度可以用于衡量任意两个用电负荷时间序列的周期和趋势的一致性,因此,可以通过计算相似度作为用电负荷规律的特征数据,来衡量用电负荷时间序列是否具有对应的用电负荷规律。
具体地,可以经计算用电负荷时间序列的若干个时间长度为第一周期时长的子时间序列之间的相似度。第一周期时长可以根据对用户用电负荷曲线所呈现的周期性规律特征进行分析后确定。示例性地,用户在每年大多数月份不发生用电,每年少数几个月份的用电较多,对应的用户用电负荷曲线在每年少数几个月份呈现出用电负荷波动。根据对该用户用电负荷曲线的周期性规律进行分析后,可以以年为第一周期时长,计算该用户若干年的用电负荷时间序列两两之间的相似度,作为该用户的用电负荷数据在第一周期特征上的第一周期特征数据。
S140、根据子时间序列之间的相关系数进行平均计算,得到第二周期特征数据。
其中,第二周期特征可以用于表示用户长期发生用电,且用电负荷时间序列对应的用电负荷曲线呈现出周期性规律的特征。需要说明的是,子时间序列为按照第二周期时长对用电负荷时间序列进行划分得到的,子时间序列对应的用电负荷曲线在相似相位之间具有相似的变化趋势。
具体地,第二周期时长可以根据对用户用电负荷曲线所呈现的周期性规律特征分析后确定。示例性地,用户每个月的用电负荷存在相似的规律性,比如每个月上半个月的用电较多,下半个月的用电较少,对应的用户用电负荷曲线在每个月上半个月的用电负荷峰值较高,下半个月的用电负荷峰值较低。根据对该用户用电负荷曲线的周期性规律进行分析后,可以以月为第二周期时长,将该用户的用电负荷时间序列进行划分,得到若干个时间长度为月的子时间序列。分别计算该若干个子时间序列两两之间的相关系数,得到若干个相关系数,并计算该若干个相关系数的平均数,得到该用户的用电负荷数据在第二周期特征上的第二周期特征数据。
S150、对指定时间段内的用电负荷时间序列、负荷曲线抖动数据、第一周期特征数据、第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。
其中,指定时间段可以是预先设定的对用户的用电负荷时间序列进行采样的历史用电时间段,指定时间段内的用电负荷时间序列可以是数据样本的基础特征维度上的数据。具体地,通过前述方法得到的负荷曲线抖动数据可以是数据样本的负荷曲线形态特征维度上的数据;第一周期特征数据可以是数据样本的第一周期特征维度上的数据;第二周期特征数据可以是数据样本的第二周期特征维度上的数据。
在一些情况中,通过构建负荷曲线抖动数据、第一周期特征数据、第二周期特征数据,可以用于描述用户用电负荷时间序列中隐含的用户用电负荷规律,从而使用电账户分类模型可以从构建得到的数据样本中提取相关特征数据并进行分析,以使用电账户能够根据用电负荷规律被准确地划分。
示例性地,对用户过去一个月的用电负荷时间序列进行采样,以用作数据样本的基础特征数据。以14日为周期对用户过去一个月的用电负荷时间序列进行采样,可以将该用户在该月第1日至第14日的用电负荷时间序列取出作为该用户的第一条数据样本的基础特征数据;将第2日至第15日的用电负荷时间序列取出作为该用户的第二条数据样本的基础特征数据;将第3日至第16日的用电负荷时间序列取出作为该用户的第三条数据样本的基础特征数据;以此类推,可以采样得到该用户的至少15条数据样本的基础特征数据。为每一条的基础特征数据加上通过前述方法计算得到的该用户的负荷曲线抖动数据J、第一周期特征数据PF1、第二周期特征数据PF2,可以得到构建完成的该用户的至少15条数据样本,以用于对用电账户分类模型进行训练。
用电账户分类模型为可以是根据用户的用电负荷规律将用户划分到对应的用电账户分类类别中的时间序列分类模型。在一些实施例中,用电账户分类模型可以为LSTM(Long Short Term Memory,长短时记忆网络)时间序列分类模型。
上述实施方式中,通过构建与用户用电负荷曲线所呈现的曲线形态、周期性规律等相关的多个特征维度的数据,作为基础特征维度的用电负荷时间序列数据的补充,用于对用户的用电负荷规律进行准确的描述,以提高对用电账户分类模型训练的效果。
在一些实施方式中,第二周期特征数据包括年周期特征数据。参考图2所示,根据子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,可以包括以下步骤。
S210、确定用电负荷时间序列对应的用电趋势时间序列。
其中,年周期特征表示用户的用电负荷时间序列对应的年用电负荷曲线所呈现的周期性特征。用电趋势时间序列为对用电负荷时间序列中的短期波动进行消除或弱化后得到的时间序列,可以体现用电负荷时间序列中的长期趋势。
在一些情况中,可以通过用电负荷时间序列中长期趋势的变化规律来得到用电负荷的周期性规律。因此,可以通过用电趋势时间序列来体现对应用电负荷时间序列具有的周期性特征。具体地,用电趋势时间序列可以通过对用电负荷时间序列进行数据平滑处理得到。
S220、以年为时间单位对用电趋势时间序列进行切割,得到至少两个年用电趋势时间序列。
具体地,获取用户m(m≥2)年的用电负荷时间序列,对用电负荷时间序列进行数据平滑处理得到对应的m年的用电趋势时间序列。以年为单位,对该m年的用电趋势时间序列进行划分,可以将每一年的用电趋势时间序列对应划分为一个年用电趋势时间序列,从而得到m个年用电趋势时间序列。需要说明的是,在本说明书实施方式中,至少需要两年的用电负荷时间序列来分析确定用户的用电负荷规律具有年周期特征,因此,需要获取到用户至少两年的用电负荷时间序列来计算年周期特征数据。
S230、基于任意两个年用电趋势时间序列之间的相关系数进行平均计算,确定年周期特征数据。
具体地,分别计算m个年用电趋势时间序列中任意两个序列之间的相关系数,以衡量用电趋势时间序列在若干个年周期的相似性,从而可以进一步衡量用户用电负荷在若干个年周期的相似性。相关系数越大,表示对应两个年周期的用电负荷越一致。根据计算可以得到m*(m-1)/2个相关系数,计算相关系数的平均值,作为该用户的用电负荷在年周期特征上的年周期特征数据。
在一些实施例中,可以计算任意两个年用电趋势时间序列之间的皮尔逊相关系数,并进行平均计算,来确定年周期特征数据。
在一些实施方式中,参考图3所示,确定用电负荷时间序列对应的用电趋势时间序列,可以包括以下步骤。
S211、对指定时间段内的用电负荷时间序列进行平均计算,得到用电均值时间序列。
具体地,根据获取到的用户m年的用电负荷时间序列,对m年的每一天记录到的用电负荷时间序列中的用电负荷数值取平均值,得到每一天的日均用电负荷数据。将计算得到的日均用电负荷数据,作为该用户的m年的用电负荷时间序列中的新的元素,可以得到该用户m年的用电均值时间序列。
示例性地,用户的每一天用电负荷数据的记录频率可以为15分钟,即每一天记录到的用电负荷时间序列中包括在一天的96个记录时间点记录的96个用电负荷数值。对每一天的96个用电负荷数值取平均值,用于表示对应每一天的日均用电负荷数据。
S213、对用电均值时间序列时间进行数据平滑过滤,得到用电负荷时间序列对应的用电趋势时间序列。
在一些情况中,用户每一天的用电负荷数据通常都存在差异,因此用户的日均用电负荷数据通常存在差异。这种日均用电差异会导致用户m年的用电均值时间序列中存在以日为单位的短期波动,这种短期波动对于分析用户的用电负荷在以年为单位的周期中的长期趋势性不占太大的权重,因此,可以对用电均值时间序列进行数据平滑过滤,以消除或者弱化这些短期波动。具体地,可以使用过滤器对前述得到的用户m年的用电均值时间序列进行数据平滑过滤,使时间序列中包含的长期趋势性特征更加突出。示例性地,可以使用HP(Hodrick-Prescott)过滤器对用电均值时间序列进行数据平滑过滤。HP过滤器可以将用电均值时间序列分为趋势和周期性分量,从而得到m年的用电均值时间序列经过平滑过滤处理后的用电趋势时间序列,即m年的用电负荷时间序列对应的用电趋势时间序列。
在一些实施方式中,第二周期特征数据包括日周期特征数据。参考图4所示,根据子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,可以包括以下步骤。
S310、以天为时间单位对用电负荷时间序列进行切割,得到至少两个天用电负荷序列。
其中,日周期特征表示用户的用电负荷时间序列对应的日用电负荷曲线所呈现的周期性特征。
具体地,获取用户n(n≥2)天的用电负荷时间序列,以天为单位,对该n天的用电负荷时间序列进行划分,可以将每一天的用电负荷时间序列时间序列对应划分为一个天用电负荷序列,从而得到n个天用电负荷序列。需要说明的是,在本说明书实施方式中,至少需要两天的用电负荷时间序列来分析确定用户的用电负荷规律具有日周期特征,因此,至少需要获取到用户两天的用电负荷时间序列来计算日周期特征数据。
S320、基于任意两个天用电负荷序列之间的相关系数进行平均计算,得到日周期特征数据。
具体地,分别计算n个天用电负荷序列中任意两个序列之间的相关系数,以衡量该用户的用电负荷时间序列在若干个日周期的相似性。相关系数越大,表示对应两个日周期的用电负荷越一致。根据计算可以得到n*(n-1)/2个相关系数,计算相关系数平均值,作为该用户的用电负荷在日周期特征上的日周期特征数据。
在一些实施例中,可以计算任意两个天用电负荷序列之间的皮尔逊相关系数,并进行平均计算,来确定日周期特征数据。
在一些实施方式中,参考图5所示,基于用电负荷时间序列进行相似度计算,确定第一周期特征数据,可以包括以下步骤。
S131、按照预设时间单位对用电负荷时间序列进行切割,得到至少两个预设时间单位负荷序列。
其中,预设时间单位可以是根据用电负荷时间序列对应的用电负荷曲线呈现出的周期性规律确定的。具体地,预设时间单位通常可以是半月时间单位、月时间单位、季度时间单位、半年时间单位、年时间单位中的任一个。示例性地,用户在每年4月和10月用电较多,其他月份均不用电,即用电负荷曲线呈现出年周期性规律,可以以年为预设时间单位对该用户的用电负荷时间序列进行切割;也可以根据该用户每年4月和10月的用电负荷曲线具有较高的相似性,即用电负荷曲线呈现出半年周期性规律,以半年为预设时间单位对该用户的用电负荷时间序列进行切割。
示例性地,以用户在每年4月和10月用电较多,其他月份均不用电,且该用户每年4月和10月的用电负荷曲线的周期性和趋势性规律具有较高的相似度为例。获取用户m(m≥1)年的用电负荷时间序列,以半年为单位,对该m年的用电负荷时间序列进行划分,可以将每一年的用电负荷时间序列对应划分为两个半年的用电负荷序列,从而得到2m个半年用电负荷序列。
S133、利用汉明距离算法计算任意两个预设时间单位负荷序列之间的相似度。
在一些情况中,第一周期特征可以用于表示用户发生用电的时间较少,且用电负荷时间序列对应的用电负荷曲线呈现出周期性规律的特征,即用电负荷序列中存在大量0值。那么,可以理解的是,按照预设时间单位对用电负荷时间序列进行切割得到的各预设时间单位负荷序列中,也存在大量0值。因此,可以使用汉明距离算法来计算任意两个预设时间单位负荷序列之间的汉明距离,作为对应预设时间单位负荷序列之间的相似度。
S135、将任意两个预设时间单位负荷序列之间的相似度的平均值作为第一周期特征数据。
示例性地,以上述用户在每年4月和10月用电较多,其他月份均不用电,且该用户每年4月和10月的用电负荷曲线的周期性和趋势性规律具有较高的相似度为例。计算2m个半年用电负荷序列中任意两个半年用电负荷序列之间的相似度,可以得到m*(2m-1)个汉明距离,计算汉明距离的平均值,作为该用户的用电负荷在第一周期特征上的第一周期特征数据。
在一些实施方式中,数据样本标注有用电账户类别。
其中,用电账户类别为水平型类别、零值规律类别、年周期性类别、日周期性类别、随机型类别中的任一个。
其中,属于水平型类别的用电账户的负荷曲线近似为直线;属于零值规律类别的用电账户的负荷曲线中零值占比超过阈值且非零值具有周期性规律;属于年周期性类别的用电账户的用电负荷曲线存在年周期性规律;属于日周期性类别的用电账户的用电负荷曲线存在日周期性规律。
其中,用电账户类别为数据样本中每一条数据的标签,可以用于验证数据分类效果。在一些情况中,可以通过对电力专变用户的实际用电负荷进行数据分析,根据用户在不同用电模式下的不同用电负荷规律的周期和趋势特点,进一步归纳得到用于描述不同用电负荷规律的用电账户类别。
具体地,水平型类别的用电账户具有水平型曲线形态特征,表示用户在较长时间段内不用电,或者用电负荷基本不变。比如,通常需要常年低温运作的冷藏保鲜库。根据水平型类别的用电账户的用电负荷时间序列可以计算得到对应的负荷曲线抖动数据。在一些情况中,水平型类别的用电账户可能存在一段时间不用电的情况,对用电负荷时间序列对应的变异系数计算产生影响。为了提高对水平型类别的用电账户的用电负荷规律描述的准确性,可以将负荷曲线抖动数据中的预设值占比设定为0值占比。
零值规律类别的用电账户的用电负荷时间序列中,零值占比较大,且非零值存在周期性。零值规律类别的用电账户的负荷曲线中零值占比超过阈值,具体地,在零值规律类别的用电账户的用电负荷时间序列中通常有不少于半数的用电负荷数值为0。比如,通常只在每年冬季需要使用大量电力进行供热的供热锅炉房。根据零值规律类别的用电账户的用电负荷时间序列可以计算得到对应的第一周期特征数据。
年周期性类别的用电账户具有长期发生用电,且用电负荷时间序列对应的用电负荷曲线呈现出年周期性规律的特征。比如,通常根据农作物的生长周期产生用电的农业生产用户。根据年周期性的用电账户的用电负荷时间序列可以计算得到对应的第二周期特征数据,其中,第二周期特征数据为年周期特征数据。
日周期性类别的用电账户具有长期发生用电,且用电负荷时间序列对应的用电负荷曲线呈现出日周期性规律的特征。比如,通常白天和凌晨用电较少而用电负荷较低,晚上用电较多而用电负荷较高的居民。根据日周期性的用电账户的用电负荷时间序列可以计算得到对应的第二周期特征数据,其中,第二周期特征数据为日周期特征数据。
需要说明的是,若是从用电负荷时间序列对应的用电负荷曲线中得不出上述四种用电规律特征,那么,该类型的用电负荷时间序列所属用电账户可以标注为随机型类别。
上述实施方式中,根据大批量用户的用电负荷曲线呈现出的几类用电负荷规律特征设定5个标注类别,同时可以为不同类别标注的用电账户构建对应的用电负荷规律特征数据,用于根据用户的用电负荷规律对用户进行分类,以提高分类的准确率。
本说明书实施方式提供一种模型训练方法,参考图6所示,该方法可以包括以下步骤。
S410、获取通过前述用电数据样本构建方法所构建的数据样本,作为第一用电数据样本。
其中,第一用电数据样本为用于训练用电账户分类模型的数据。
具体地,通过前述用电数据样本构建方法,可以得到构建完成的包含用户的基础特征数据、负荷曲线抖动数据、第一周期特征数据和第二周期特征数据的若干条数据样本,作为用于训练用电账户分类模型的第一用电数据样本。
在一些实施方式中,通过前述用电数据样本构建方法所构建的数据样本包含标注的用电账户类别。
S420、将第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别。
其中,预测用于表示用电账户分类模型使用分类算法对第一用电数据样本进行分类处理,以得到对应的分类结果并输出;用电账户预测类别为用电账户分类模型输出的基于第一用电数据样本的分类结果。
S430、根据用电账户预测类别、数据样本被标注的用电账户类别对用电账户分类模型的参数进行更新,直至满足模型停止训练条件。
具体地,可以根据用电账户预测类别和数据样本被标注的用电账户类别计算准确率、损失函数的损失值等模型的评价标准,来对用电账户分类模型的参数进行训练和调整,直到最终训练得到的用电账户分类模型的准确率、损失值等满足条件为止。
示例性地,可以选取第一用电数据样本中的60%数据样本作为训练样本,用于训练和调整用电账户分类模型的参数;20%的数据样本作为验证样本,用于验证模型精度和调整模型超参数;剩下20%的数据样本作为测试样本,用于验证模型的泛化能力。将训练样本中的数据输入用电账户分类模型,根据损失函数、准确率等对模型参数进行训练和调整,得到训练后的多个用电账户分类模型;使用得到的多个用电账户分类模型对验证样本进行分类,并记录模型准确率,选出效果最佳的分类模型所对应的参数作为超参数,用于优化该用电账户分类模型,以得到最优的分类模型;使用测试样本对得到的最优分类模型进行用电账户分类的测试,以评估该最优分类模型的性能和预测能力。
本说明书实施方式提供一种用电账户类别确定方法,参考图7所示,该方法可以包括以下步骤。
S510、获取目标账户的账户用电负荷数据。
需要说明的是,使用用电账户分类模型对目标账户进行分类识别的过程中输入的数据与该用电账户分类模型训练时输入的数据样本结构是一样的。关于上述实施方式中获取目标账户的账户用电负荷数据的描述,请参考本说明书中关于用电数据样本构建的描述,具体这里不再赘述。
S520、将账户用电负荷数据输入至通过前述模型训练方法训练得到的用电账户分类模型中,确定目标账户所属的目标用电账户类别。
具体地,将获取到的目标账户的账户用电负荷数据作为输入数据,输入至训练得到的用电账户分类模型,用电账户分类模型输出经过分类算法识别得到的用电账户类别,作为该目标账户所属的目标用电账户类别。
本说明书实施方式提供一种用电账户类别确定方法,参考图8所示,该方法可以包括以下步骤。
S610、获取目标账户的用电负荷时间序列。
S620、确定目标账户的负荷曲线抖动数据、第一周期特征数据、第二周期特征数据。
其中,负荷曲线抖动数据是利用用电负荷时间序列中预设值的占比、用电负荷时间序列对应的变异系数而生成的;变异系数是由用电负荷时间序列的均值、标准差决定的;第一周期特征数据是基于目标账户的用电负荷时间序列进行相似度计算而确定的;第二周期特征数据是基于目标账户的若干子时间序列进行相似度计算而确定的;若干子时间序列是对目标账户的用电负荷时间序列进行切割得到的。
S630、基于目标账户在指定时间段内的用电负荷时间序列、负荷曲线抖动数据、第一周期特征数据、第二周期特征数据构建账户用电负荷数据。
S640、根据账户用电负荷数据确定目标帐户所属的目标用电账户类别。
需要说明的是,关于上述实施方式中构建账户用电负荷数据,以及确定目标账户所属的目标用电账户类别的描述,请参考本说明书中关于用电数据样本构建方法以及用电账户类别确定方法的描述,具体这里不再赘述。
本说明书实施方式提供一种用电数据样本构建装置,参考图9所示,该用电数据样本构建装置700包括:时间序列获取模块710、数据生成模块720、相似度计算模块730、平均计算模块740、数据组合模块750。
时间序列获取模块710,用于获取用电负荷时间序列;其中,用电负荷时间序列被切割为若干子时间序列。
数据生成模块720,用于利用用电负荷时间序列中预设值的占比、用电负荷时间序列对应的变异系数生成负荷曲线抖动数据;其中,变异系数是由用电负荷时间序列的均值、标准差决定的。
相似度计算模块730,用于基于用电负荷时间序列进行相似度计算,确定第一周期特征数据。
平均计算模块740,用于根据子时间序列之间的相关系数进行平均计算,得到第二周期特征数据。
数据组合模块750,用于对指定时间段内的用电负荷时间序列、负荷曲线抖动数据、第一周期特征数据、第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。
关于用电数据样本构建装置的具体限定可以参见上文中对于用电数据样本构建方法的限定,在此不再赘述。上述用电数据样本构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本说明书实施方式提供一种模型训练装置,参考图10所示,该模型训练装置800包括:数据样本获取模块810、类别预测模块820、参数更新模块830。
数据样本获取模块810,用于获取通过前述用电数据样本构建方法所构建的数据样本,作为第一用电数据样本。
类别预测模块820,用于将第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别。
参数更新模块830,用于根据用电账户预测类别、数据样本被标注的用电账户类别对用电账户分类模型的参数进行更新,直至满足模型停止训练条件。
关于模型训练装置的具体限定可以参见上文中对于模型训练方法的限定,在此不再赘述。上述模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本说明书实施方式提供一种用电账户类别确定装置,参考图11所示,该用电账户类别确定装置900包括:负荷数据获取模块910、类别确定模块920。
负荷数据获取模块910,用于获取目标账户的账户用电负荷数据。
类别确定模块920,用于将账户用电负荷数据输入至通过前述模型训练方法训练得到的用电账户分类模型中,确定目标账户所属的目标用电账户类别。
关于用电账户类别确定装置的具体限定可以参见上文中对于用电账户类别确定方法的限定,在此不再赘述。上述用电账户类别确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本说明书实施方式提供一种用电账户类别确定装置,参考图12所示,该用电账户类别确定装置1000包括:时间序列获取模块1010、数据确定模块1020、负荷数据构建模块1030、类别确定模块1040。
时间序列获取模块1010,用于获取目标账户的用电负荷时间序列。
数据确定模块1020,用于确定目标账户的负荷曲线抖动数据、第一周期特征数据、第二周期特征数据;其中,负荷曲线抖动数据是利用用电负荷时间序列中预设值的占比、用电负荷时间序列对应的变异系数而生成的;变异系数是由用电负荷时间序列的均值、标准差决定的;第一周期特征数据是基于目标账户的用电负荷时间序列进行相似度计算而确定的;第二周期特征数据是基于目标账户的若干子时间序列进行相似度计算而确定的;若干子时间序列是对目标账户的用电负荷时间序列进行切割得到的。
负荷数据构建模块1030,用于基于目标账户在指定时间段内的用电负荷时间序列、负荷曲线抖动数据、第一周期特征数据、第二周期特征数据构建账户用电负荷数据。
类别确定模块1040,用于根据账户用电负荷数据确定目标账户所属的目标用电账户类别。
关于用电账户类别确定装置的具体限定可以参见上文中对于用电账户类别确定方法的限定,在此不再赘述。上述用电账户类别确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本说明书实施方式还提供了一种计算机设备,参考图13a所示,该计算机设备1100包括存储器1110、处理器1120及存储在存储器1110上并可在处理器1120上运行的用电数据样本构建方法程序1130,处理器1120执行用电数据样本构建方法程序1130时,实现前述的用电数据样本构建方法。
本说明书实施方式还提供了一种计算机设备,参考图13b所示,该计算机设备1200包括存储器1210、处理器1220及存储在存储器1210上并可在处理器1220上运行的模型训练方法程序1230,处理器1120执行模型训练方法程序1130时,实现前述的模型训练方法。
本说明书实施方式还提供了一种计算机设备,参考图13c所示,该计算机设备1300包括存储器1310、处理器1320及存储在存储器1310上并可在处理器1320上运行的用电账户类别确定方法程序1330,处理器1320执行用电账户类别确定方法程序1130时,实现前述的用电账户类别确定方法。
本说明书实施方式还提供了一种计算机可读存储介质,其上存储有用电数据样本构建方法程序,该用电数据样本构建方法程序被处理器执行时实现前述的用电数据样本构建方法。
本说明书实施方式还提供了一种计算机可读存储介质,其上存储有模型训练方法程序,该模型训练方法程序被处理器执行时实现前述的模型训练方法。
本说明书实施方式还提供了一种计算机可读存储介质,其上存储有用电账户类别确定方法程序,该用电账户类别确定方法程序被处理器执行时实现前述的用电账户类别确定方法。
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (15)

1.一种用电数据样本构建方法,其特征在于,所述方法包括:
获取用电负荷时间序列;其中,所述用电负荷时间序列被切割为若干子时间序列;
利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数生成负荷曲线抖动数据;其中,所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;
基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据;
根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;
对指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。
2.根据权利要求1所述的方法,其特征在于,所述第二周期特征数据包括年周期特征数据;所述根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,包括:
确定所述用电负荷时间序列对应的用电趋势时间序列;
以年为时间单位对所述用电趋势时间序列进行切割,得到至少两个年用电趋势时间序列;
基于任意两个年用电趋势时间序列之间的相关系数进行平均计算,确定所述年周期特征数据。
3.根据权利要求2所述的方法,其特征在于,所述确定所述用电负荷时间序列对应的用电趋势时间序列,包括:
对指定时间段内的用电负荷时间序列进行平均计算,得到用电均值时间序列;
对所述用电均值时间序列时间进行数据平滑过滤,得到所述用电负荷时间序列对应的用电趋势时间序列。
4.根据权利要求1所述的方法,其特征在于,所述第二周期特征数据包括日周期特征数据;所述根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据,包括:
以天为时间单位对所述用电负荷时间序列进行切割,得到至少两个天用电负荷序列;
基于任意两个所述天用电负荷序列之间的相关系数进行平均计算,得到所述日周期特征数据。
5.根据权利要求1所述的方法,其特征在于,所述基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据,包括:
按照预设时间单位对所述用电负荷时间序列进行切割,得到至少两个预设时间单位负荷序列;
利用汉明距离算法计算任意两个预设时间单位负荷序列之间的相似度;
将所述任意两个预设时间单位负荷序列之间的相似度的平均值作为所述第一周期特征数据。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述数据样本标注有用电账户类别;其中,所述用电账户类别为水平型类别、零值规律类别、年周期性类别、日周期性类别、随机型类别中的任一个;
其中,属于所述水平型类别的用电账户的负荷曲线近似为直线;
属于所述零值规律类别的用电账户的负荷曲线中零值占比超过阈值且非零值具有周期性规律;
属于所述年周期性类别的用电账户的用电负荷曲线存在年周期性规律;
属于所述日周期性类别的用电账户的用电负荷曲线存在日周期性规律。
7.一种模型训练方法,其特征在于,所述方法包括:
获取通过权利要求1至6中的任一项方法所构建的数据样本,作为第一用电数据样本;
将所述第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别;
根据所述用电账户预测类别、所述数据样本被标注的用电账户类别对所述用电账户分类模型的参数进行更新,直至满足模型停止训练条件。
8.一种用电账户类别确定方法,其特征在于,所述方法包括:
获取目标账户的账户用电负荷数据;
将所述账户用电负荷数据输入至通过权利要求7中的方法训练得到的用电账户分类模型中,确定所述目标账户所属的目标用电账户类别。
9.一种用电账户类别确定方法,其特征在于,所述方法包括:
获取目标账户的用电负荷时间序列;
确定所述目标账户的负荷曲线抖动数据、第一周期特征数据、第二周期特征数据;其中,所述负荷曲线抖动数据是利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数而生成的;所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;所述第一周期特征数据是基于所述目标账户的用电负荷时间序列进行相似度计算而确定的;所述第二周期特征数据是基于所述目标账户的若干子时间序列进行相似度计算而确定的;所述若干子时间序列是对所述目标账户的用电负荷时间序列进行切割得到的;
基于所述目标账户在指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据构建账户用电负荷数据;
根据所述账户用电负荷数据确定所述目标帐户所属的目标用电账户类别。
10.一种用电数据样本构建装置,其特征在于,所述装置包括:
时间序列获取模块,用于获取用电负荷时间序列;其中,所述用电负荷时间序列被切割为若干子时间序列;
数据生成模块,用于利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数生成负荷曲线抖动数据;其中,所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;
相似度计算模块,用于基于所述用电负荷时间序列进行相似度计算,确定第一周期特征数据;
平均计算模块,用于根据所述子时间序列之间的相关系数进行平均计算,得到第二周期特征数据;
数据组合模块,用于对指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据进行组合,得到用于训练用电账户分类模型的数据样本。
11.一种模型训练装置,其特征在于,所述装置包括:
数据样本获取模块,用于获取通过权利要求1至6中的任一项方法所构建的数据样本,作为第一用电数据样本;
类别预测模块,用于将所述第一用电数据样本输入至用电账户分类模型进行预测,得到用电账户预测类别;
参数更新模块,用于根据所述用电账户预测类别、所述数据样本被标注的用电账户类别对所述用电账户分类模型的参数进行更新,直至满足模型停止训练条件。
12.一种用电账户类别确定装置,其特征在于,所述装置包括:
负荷数据获取模块,用于获取目标账户的账户用电负荷数据;
类别确定模块,用于将所述账户用电负荷数据输入至通过权利要求7中的方法训练得到的用电账户分类模型中,确定所述目标账户所属的目标用电账户类别。
13.一种用电账户类别确定装置,其特征在于,所述装置包括:
时间序列获取模块,用于获取目标账户的用电负荷时间序列;
数据确定模块,用于确定所述目标账户的负荷曲线抖动数据、第一周期特征数据、第二周期特征数据;其中,所述负荷曲线抖动数据是利用所述用电负荷时间序列中预设值的占比、所述用电负荷时间序列对应的变异系数而生成的;所述变异系数是由所述用电负荷时间序列的均值、标准差决定的;所述第一周期特征数据是基于所述目标账户的用电负荷时间序列进行相似度计算而确定的;所述第二周期特征数据是基于所述目标账户的若干子时间序列进行相似度计算而确定的;所述若干子时间序列是对所述目标账户的用电负荷时间序列进行切割得到的;
负荷数据构建模块,用于基于所述目标账户在指定时间段内的用电负荷时间序列、所述负荷曲线抖动数据、所述第一周期特征数据、所述第二周期特征数据构建账户用电负荷数据;
类别确定模块,用于根据所述账户用电负荷数据确定所述目标账户所属的目标用电账户类别。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
CN202211346826.4A 2022-10-31 2022-10-31 用电数据样本构建、模型训练、账户类别确定方法和装置 Pending CN115828134A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211346826.4A CN115828134A (zh) 2022-10-31 2022-10-31 用电数据样本构建、模型训练、账户类别确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211346826.4A CN115828134A (zh) 2022-10-31 2022-10-31 用电数据样本构建、模型训练、账户类别确定方法和装置

Publications (1)

Publication Number Publication Date
CN115828134A true CN115828134A (zh) 2023-03-21

Family

ID=85525882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211346826.4A Pending CN115828134A (zh) 2022-10-31 2022-10-31 用电数据样本构建、模型训练、账户类别确定方法和装置

Country Status (1)

Country Link
CN (1) CN115828134A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117057487A (zh) * 2023-10-12 2023-11-14 国网浙江省电力有限公司宁波供电公司 一种配电网碳排放强度预测方法、系统、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117057487A (zh) * 2023-10-12 2023-11-14 国网浙江省电力有限公司宁波供电公司 一种配电网碳排放强度预测方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
Zhang et al. Forecasting residential energy consumption: Single household perspective
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
Garcia-Perez et al. Fully-convolutional denoising auto-encoders for NILM in large non-residential buildings
Chicco et al. Emergent electricity customer classification
CN111553516A (zh) 一种短期电量负荷精准预测方法
CN112182720B (zh) 一种基于建筑能源管理应用场景的建筑能耗模型评价方法
CN115508770B (zh) 一种基于kl-nb算法的电能表运行状态在线评估方法
CN115828134A (zh) 用电数据样本构建、模型训练、账户类别确定方法和装置
JP2006011715A (ja) 資源消費量の推定方法及び装置
CN115660225A (zh) 一种基于电表通信模块的用电负荷预测管理方法及系统
CN114878934A (zh) 一种电能耗数据异常预警方法
CN114519514A (zh) 一种低压台区合理线损值测算方法、系统及计算机设备
CN116882804A (zh) 一种智能电力监控方法及系统
CN115496603A (zh) 基于人工智能技术的电力市场新能源日前交易决策方法
Hodge et al. Examining information entropy approaches as wind power forecasting performance metrics
CN113466520A (zh) 一种在线识别失准电能表的方法
CN113468811B (zh) 含新能源机组的电网备用容量概率化动态评估方法及系统
CN114254965A (zh) 乡村振兴电力监测方法、装置、电子设备及存储介质
CN112381436B (zh) 逐时电负荷生成方法、装置、电子设备及存储介质
Rawal et al. Statistical and Spectral Signature of Historical Electrical Demand Data
KR102635864B1 (ko) 딥러닝 알고리즘을 이용한 전력량계 오차 정밀도 진단방법
Davarzani et al. Study of missing meter data impact on domestic load profiles clustering and characterization
CN110659824A (zh) 电量平衡测算方法和装置
Sinitsyna et al. Some practical aspects of electric power consumption time series analysis
Nycander et al. An open model for generating high resolution wind power production scenarios

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination