CN116861306A - 一种基于用电趋势量化网络的异常用电检测方法 - Google Patents
一种基于用电趋势量化网络的异常用电检测方法 Download PDFInfo
- Publication number
- CN116861306A CN116861306A CN202310740549.3A CN202310740549A CN116861306A CN 116861306 A CN116861306 A CN 116861306A CN 202310740549 A CN202310740549 A CN 202310740549A CN 116861306 A CN116861306 A CN 116861306A
- Authority
- CN
- China
- Prior art keywords
- data
- electricity
- network
- electricity consumption
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 199
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 91
- 238000001514 detection method Methods 0.000 title claims abstract description 76
- 238000011002 quantification Methods 0.000 title claims abstract description 18
- 238000013139 quantization Methods 0.000 claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000010606 normalization Methods 0.000 claims abstract description 18
- 238000005070 sampling Methods 0.000 claims description 24
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 230000006399 behavior Effects 0.000 abstract description 9
- 230000008859 change Effects 0.000 abstract description 5
- 239000000284 extract Substances 0.000 abstract description 3
- 238000004458 analytical method Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000002354 daily effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000002347 injection Methods 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000003442 weekly effect Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于用电趋势量化网络的异常用电检测方法,属于用电行为分析技术领域。本发明的主要创新之处在于,搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型。其中,用电趋势信息提取层通过分时用电按日同比相除提取用电趋势变化信息;量化网络层可以解决分时用电按日同比相除后数据范围过大的问题,并可以消除用电行为的随机性导致的用电数据中的正常波动对异常用电检测产生的影响;归一化层的目的在于保留用电数据的时段信息;最后将量化结果与归一化处理结果合并后输入深度时间序列分类网络,并以最小化分类损失为目标,对异常用电检测模型进行训练;训练后的模型用于异常用电检测。
Description
技术领域
本发明属于用电行为分析技术领域,更具体地,涉及一种基于用电趋势量化网络的异常用电检测方法。
背景技术
异常用电检测是电网安全运行的重要支撑。在电网运行中,计量设备故障、用户窃电等均会导致电网公司采集不到用户真实的用电数据,这些数据为异常用电数据。异常用电会影响电网的调度以及供电安全,并使电力部门承受巨大的经济损失。如何利用智能电网收集的高精度、细时间粒度的用户用电数据进行有效异常用电检测具有重要意义,通过主动发现用电数据异常,能够及时对异常的计量装置维修或对窃电用户进行电费补缴和罚款,降低电力损失并保证电网的运行安全。
基于数据驱动的异常用电检测技术通过分析大量的用电数据,识别出异常用电的模式和特征,从而实现对异常用电的检测和识别。虽然已有许多基于数据驱动的研究致力于提高异常用电检测的准确率和可靠性,但这些研究主要只针对单一数据源进行了验证和测试,未考虑模型在未知场景下的检测问题。不同地域,不同时间,不同用户类型的用户的用电行为存在很大差异。训练用户特定的检测器极为耗费资源也不现实,而训练用户通用的检测器就不可避免的要考虑待检测用户数据与训练集用户数据的分布差异,现有的用户通用的检测器模型大多假设训练集和测试集同分布,在未知场景下的泛化能力不足。
现有的基于数据驱动的异常用电检测方法主要可分为机器学习方法和深度学习方法。机器学习方法大部分需要人工提取特征,再通过聚类、离群点检测、分类等算法进行处理最终找出异常用电用户,提取特征与当前训练集数据分布高度相关,当数据分布发生变化时,之前提取到的特征会失效,不具有良好的跨域泛化性。深度学习方法具有较强的数据建模和表征能力,能够更好地挖掘数据之间的内在联系和规律,且不依赖于人工建模,但当前的研究往往局限于特定用户检测或同用户域检测,未考虑到模型跨领域后的性能退化问题。
因此,研究如何提升异常用电检测模型的跨域泛化能力有助于提高异常用电检测的实际应用效果,为电力系统的安全稳定运行和智能化发展提供有力的支持和保障。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于用电趋势量化网络的异常用电检测方法,其目的在于解决现有异常用电检测模型在未知场景下性能退化明显的技术问题。
为实现上述目的,第一方面,本发明提供了一种基于用电趋势量化网络的异常用电检测模型的构建方法,包括以下步骤:
获取连续N天的用电量时序数据,并对其进行标注,作为训练样本集;其中,N为大于等于2的整数;
搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型;所述用电趋势信息提取层用于将所述训练样本集中每天的采样点数据除以N天中同时刻的采样数据,得到三维数组;所述量化网络层用于求取所述三维数组中所有数据的m个分位点,并分别计算每个数据与每个分位点的距离,得到每个数据对应的m个距离值,再通过神经网络将各距离值映射到n个量化区间,使用soft-argmax获得每个数据对应的量化结果;所述归一化层用于对训练样本集中数据进行归一化处理;其中,n为量化网络层的量化级数;
将所述量化结果与归一化处理结果合并后输入所述深度时间序列分类网络,并以最小化分类损失为目标,对所述异常用电检测模型进行训练。
进一步地,在获得所述三维数组的过程中,当遇到需要除以当日之后每一天中同时刻的采样数据时直接填充为1。
进一步地,在所述量化网络层求取所述三维数组中所有数据的m个分位点之前,还包括:将所述三维数组中最后一行数据舍弃,并将缩减后的三维数组输入所述量化网络层。
第二方面,本发明提供了一种基于用电趋势量化网络的异常用电检测方法,包括:将待检测的用电量时序数据输入到采用第一方面所述的基于用电趋势量化网络的异常用电检测模型的构建方法所构建的异常用电检测模型中,输出检测结果。
第三方面,本发明提供了一种基于用电趋势量化网络的异常用电检测模型的构建装置,包括:
获取模块,用于获取连续N天的用电量时序数据,并对其进行标注,作为训练样本集;其中,N为大于等于2的整数;
搭建模块,用于搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型;所述用电趋势信息提取层用于将所述训练样本集中每天的采样点数据除以N天中同时刻的采样数据,得到三维数组;所述量化网络层用于求取所述三维数组中所有数据的m个分位点,并分别计算每个数据与每个分位点的距离,得到每个数据对应的m个距离值,再通过神经网络将各距离值映射到n个量化区间,使用soft-argmax获得每个数据对应的量化结果;所述归一化层用于对训练样本集中数据进行归一化处理;其中,n为量化网络层的量化级数;
训练模块,用于将所述量化结果与归一化处理结果合并后输入所述深度时间序列分类网络,并以最小化分类损失为目标,对所述异常用电检测模型进行训练。
第四方面,本发明提供了一种基于用电趋势量化网络的异常用电检测装置,包括检测模块,所述检测模块用于将待检测的用电量时序数据输入到采用第三方面所述的基于用电趋势量化网络的异常用电检测模型的构建装置所构建的异常用电检测模型中,输出检测结果。
第五方面,本发明提供了一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现如第一方面所述的基于用电趋势量化网络的异常用电检测模型的构建方法和/或如第二方面所述的基于用电趋势量化网络的异常用电检测方法。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
本发明的主要创新之处在于,搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型。其中,用电趋势信息提取层通过分时用电按日同比相除提取用电趋势变化信息;量化网络层可以解决分时用电按日同比相除后数据范围过大的问题,并可以消除用电行为的随机性导致的用电数据中的正常波动对异常用电检测产生的影响;归一化层的目的在于保留用电数据的时段信息;最后将量化结果与归一化处理结果合并后输入深度时间序列分类网络,并以最小化分类损失为目标,对异常用电检测模型进行训练;训练后的模型用于异常用电检测。如此,本发明无需人工提取用电特征,就能够捕捉与领域无关的异常用电信息,具有良好的跨域检测能力。
附图说明
图1是本发明实施例提供的基于用电趋势量化网络的异常用电检测模型的构建方法的流程示意图;
图2是本发明实施例提供的异常用电检测模型结构图;
图3是本发明实施例提供的用电趋势信息提取层结构图;
图4是本发明实施例提供的量化网络层结构图;
图5是本发明实施例提供的进行异常用电检测的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
参阅图1,结合图2至图4,本发明提供了一种基于用电趋势量化网络的异常用电检测模型的构建方法,包括操作S1至操作S3。
操作S1,获取连续N天的用电量时序数据,并对其进行标注,作为训练样本集;其中,N为大于等于2的整数。
本实施例中,用电量时序数据,即智能电表所记录的每个标准时间间隔(常见的为15分钟或30分钟)内用户的用电量,本实施例中用电数据的采样间隔为30分钟,一天会有48个采样点。将用户分时用电数据按周分割,每条数据包含336个采样点用电数据。
此外,还需要对采样点用电数据进行必要的数据预处理,包括缺失值处理、数据清洗等。具体地:
(1)缺失值处理。由于智能电表计量设备故障或电表信息传输设备故障的存在,数据中会存在缺失值。对于少量数据缺失,本实施例使用线性插值的方式填补数据;对于大量数据缺失,采用直接过滤的方式处理。
(2)数据清洗。此处需进行清洗的数据为超出正常用电计量范围的极大值,持续性为零的极小值以及负数值,极大值定义为:
极大值=Q3+(Q3-Q1)*5
其中,Q3为四分之三分位点,Q1为四分之一分位点。
进一步,根据现场稽查结果对样本数据进行标注,构造训练样本集。示例性的,异常数据标记为1,正常数据标记为0。
操作S2,搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型;所述用电趋势信息提取层用于将所述训练样本集中每天的采样点数据除以N天中同时刻的采样数据,得到三维数组;所述量化网络层用于求取所述三维数组中所有数据的m个分位点,并分别计算每个数据与每个分位点的距离,得到每个数据对应的m个距离值,再通过神经网络将各距离值映射到n个量化区间,使用soft-argmax获得每个数据对应的量化结果;所述归一化层用于对训练样本集中数据进行归一化处理;其中,n为量化网络层的量化级数。
区别于现有技术,仅对原始数据进行归一化处理,即作为训练样本对分类网络进行训练。如图2所示,本发明提出了包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型。
具体地:
(1)用电趋势信息提取层。预处理数据通过分时用电同比相除得到用电趋势信息。
示例性的,如图3所示,为本发明的用电趋势信息提取层的示意图。假设一天的用电数据长度为D,一周的用电数据长度为7D。输入的单条数据为单变量时间序列,尺寸为1×7D,经过按日拆分将数组重构reshape为二维数组,尺寸变为7×D,接下来进行同比相除操作。同比相除操作指的是让每日的D条采样点数据除以之前每一天同时刻的采样数据,如周三五点钟的采样数据除以周二五点钟的数据,周三D条用电数据分别除以周一和周二对应时刻的D条用电数据,图3中数组矩阵的每个单元格都代表着D个点的序列,从图3中下方同比相除之后得到的表格示意图按列来看,最后一列代表的就是第七天的D条用电数据除以之前六天和第七天本身所得到的数据,当遇到需要除以之后天数的数据时直接填充为1,比如第二列代表一周第一天所需要相除的数据只有它本身,之后的所要填充的每个单元格的D条数据直接都置为1,当同比相除操作完成之后原来尺寸大小为7×D的数据便变成了7×7×D的三维数组,从三维数组的二维切面来看,下三角矩阵和对角线元素全部设置为1,这些部分并没有实际意义,只是为了填充维度,保留时间相关性,然而最后一行全部为没有实际含义的数值,可以直接舍弃掉,因此进行数组缩减后数据的尺寸就变为了6×7×D大小,再次进行数组重构便得到了数据尺寸为6×7D的多变量时间序列。
进行分时用电同比相除的目的在于挖掘用户的用电趋势变化信息,捕捉用电量持续减少型异常用电信息。用户的用电行为存在周期性,同时存在背景负荷(比如常开电器的用电量),如果异常用电检测模型所判别的用户在某周的某一时刻开始进行了异常用电的话,那么这周进行异常用电之后的日期的用电行为相比于正常用电时期必然会有减少的趋势变化,通过将每天的分时用电量数据与之前每天的分时用电量数据相除,可以在不进行数据预处理的情况下得到用电量减小的时刻信息。
(2)量化网络层。解决分时用电按日同比相除后数据范围过大的问题。分时用电按日同比相除可以彻底消除不同用电规模的影响,将分时用电量数据转化为分时用电量相比于之前每日的相同时期用电量的变化信息,同比相除之后数值小于1,即说明用电量变小。然而同比相除处理之后的数据范围为[0,一个较大值],此种数值范围过大的数据直接输入到神经网络会导致模型训练不稳定。
如图4所示,为本发明的量化网络结构图,对数据进行量化首先需要明确其在整体数据分布中的位置。通过对输入数据整体求分位点得到输入数据的各分位点,计算输入数据与每个分位点的L1距离便可得到输入数据在整体数据分布中的坐标,完成输入数据在整体分布中的定位。通过使用神经网络将距离坐标映射到不同的量化区间,再通过使用Softmax和argmax操作便可获得量化标签。自适应量化网络中m为分位点数量,n为量化级数,m设置为大于n几倍的值,给量化网络自适应选择量化阈值的空间。通常量化级数越大,量化精度越高,但可能会带来不同程度的噪声,不同类型数据的最优量化级数并不一定相同,需要实验加以确定。线性层的权重和偏差由神经网络反向传播加以确定。
此外,由于argmax操作为取最大值索引,该过程不可导,在神经网络中无法反向传播梯度,会导致量化网络无法更新网络参数,故此处采用soft-argmax操作代替Softmax和argmax取量化结果,计算公式如下:
其中τ为温度系数,可以控制Softmax函数输出概率分布的锐度,τ越小,输出的概率分布越接近one-hot向量,在训练过程中通过退火策略将τ从一个较大的值(比如1)慢慢退火到接近0值,实现对argmax的模拟;i=1,…,n,j=1,…,n。
(3)归一化层。添加一个通道的归一化数据的目的在于保留用电数据的时段信息,用电高峰时期的固定低用电量和用电低谷时期的固定低用电量行为相比,显然是用电高峰时期的固定低用电量更值得怀疑,同时用电低谷时期通常只有常开电器在工作形成背景负荷,背景负荷的突然或持续减少同样值得怀疑,高峰和低谷的时段信息以及背景负荷信息可以由归一化数据提供。
本实施例中,采用Min-Max归一化方法,将数据映射到[0,1]区间,xi为原始数据,xi′为归一化之后的数据,公式如下:
(4)深度时间序列分类网络。异常用电检测可视为标准的二分类任务,检测模型将样本划分为正常或者异常(任务中通常设定正常为0,异常为1)。用户的用电数据样本可视为单变量时间序列,因此异常用电检测任务可以使用最新的时间序列分类网络。以二分类的形式利用处理后的数据对深度时间序列分类网络进行训练。
操作S3,将所述量化结果与归一化处理结果合并后输入所述深度时间序列分类网络,并以最小化分类损失为目标,对所述异常用电检测模型进行训练。
在模型应用阶段,如图5所示,将待检测的用电量时序数据输入到训练好的异常用电检测模型中,得到类别概率,对于类别概率沿横坐标取最大值索引,若最大值索引为1,表明检测为异常用电,若最大值索引为0,表明检测为正常用电。
应用实例:
利用公开电力数据集和异常数据注入(False Data Injection,FDI)的方式构建跨域场景数据集以供所提模型算法的训练测试以及对比。
本实施例所使用的公开电力数据集包括:
(1)爱尔兰智能电表数据集,该数据集包含爱尔兰4225名居民用户和485名中小工商业用户从2009年7月15日至2010年12月31日的用电数据,采样间隔为30分钟。
(2)低碳伦敦智能电表数据集,该数据集包含英国伦敦5567名参与低碳伦敦项目的居民用户从2011年11月到2014年2月的用电数据,采样间隔为30分钟。
(3)UCI电力负荷数据集,该数据集包含370名大工业用户从2011年到2014年的用电数据,采样间隔为15分钟。为保证尺度一致,将该数据集每两个采样点数据相加合并,最终时间粒度为30分钟。
下面简称爱尔兰数据集,伦敦数据集和UCI Electricity数据集。
真实的异常用电用户用电数据可能存在以下特征:用电数据持续或变化性的减少;用电模式不规律;零用电;用电量的突然下降。本实施例的异常数据注入类型为如表1所示的六种类型。
表1本实施例使用的异常用电类型
*注:xt表示时刻t采集到的原始用电量,表示时刻t被篡改后的用电量,x为原始用电量序列,α,β为随机数,γ为百分位数,αt为一段随机序列中时刻t的数值,/>为用电量均值。
本实施例按照不同的用户,不同的用户类型,不同时间,不同地域,将三个公开数据集通过数据清洗后划分为4个不同的领域:
1)源域。源域包含爱尔兰数据集居民用户一年(52周,364天)的用电数据。
2)目标域1。该目标域包含爱尔兰数据集中的中小工商业用户一年(52周,364天)的用电数据。该领域场景模拟跨用户类型场景,源域的居民用电数据训练,检测工商业用户用电数据。
3)目标域2。该目标域包含伦敦数据集中参与低碳伦敦项目的居民用户一年的(52周,364天)的用电数据,该数据集用户因参与低碳计划,用电规模明显小于爱尔兰数据集居民用户。
4)目标域3。该目标域包含UCI Electricity数据集中大工业用户从2012年1月2日到2012年12月30日共52周,364天的用电数据。该目标域内用户用电规模远高于居民用户。
由于现有公开的细粒度数据集只有正常用电数据,需要构造含有异常用电数据的数据集进行模型训练和测试。出于降低数据维度、减少模型参数、加快训练速度的考虑,构建周级别异常用电数据集用于模型训练和效果测试。周级别异常用电数据集构造的步骤如下:
1)将进行数据清洗后的各个领域的用户随机划分正常用户和异常用户进行标注,正常用户和异常用户的比例为2:1。
2)将标记的异常用户随机分配表1中6种异常用电类型的1种进行异常用电类型标注。
3)将标注好异常用电类型的用户用电数据按周裁剪后,每周随机选取一点作为异常起始点,异常起始点的选取限制在第二天到倒数第二天的任意采样点时刻,以确保数据有足够的用电行为变化信息,将异常用电行为起始点之后的数据按照标注的异常用电类型所对应的转换公式转换为异常用电数据。
4)将每个域的正常用户标注数据按周裁剪后与异常数据注入处理后的异常数据合并构成该域的异常用电数据集。
最终各域的数据集信息如表2所示:
表2跨域场景数据集信息
本实施例以二分类的方式进行异常用电检测,将使用在源域训练好的分类模型在不同跨域场景下测试效果。本实施例使用准确率ACC和曲线下面积AUC作为评价指标,来表示模型的分类效果。
ACC表示模型分类的总的正确率,AUC(Area Under Curve)为接受者操作特征曲线(Receiver Operating Characteristic,ROC)曲线下面积,ROC曲线是以不同的分类阈值为基础绘制出的分类器的性能曲线,曲线横轴为假阳性率,纵轴为真阳性率。AUC能够在样本不平衡的情况下反映分类器的分类效果,取值范围在0.5和1之间,越接近1,说明模型分类性能越好。
采用这两个指标得到的结果如表3所示。训练时使用源域数据训练,测试时对各目标域数据进行测试。batch size设置为1024,训练轮次epoch为150,优化器使用带动量的SGD,学习率初值设置为0.1,第90个epoch后学习率降为0.01,第120个epoch后学习率降为0.001,分位点向量数量m设置为20,量化级数n设置为5,线性层的输入维度设置为20,输出维度设置为5,温度系数τ初值设置为1,第40个epoch后学习率降为0.1,第80个epoch后学习率降为0.01。
深度时间序列分类网络使用InceptionTime网络,深度时间序列分类模型添加本发明方法前后效果对比实验结果如表3所示,未使用本发明直接对归一化数据进行训练。由表可见,采用本发明后各目标域ACC和AUC以及平均ACC和平均AUC均有提升。本发明的用电趋势量化网络方法提升了异常用电检测模型的跨域检测能力。
表3深度时间序列分类模型添加本发明方法前后效果对比实验
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于用电趋势量化网络的异常用电检测模型的构建方法,其特征在于,包括以下步骤:
获取连续N天的用电量时序数据,并对其进行标注,作为训练样本集;其中,N为大于等于2的整数;
搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型;所述用电趋势信息提取层用于将所述训练样本集中每天的采样点数据除以N天中同时刻的采样数据,得到三维数组;所述量化网络层用于求取所述三维数组中所有数据的m个分位点,并分别计算每个数据与每个分位点的距离,得到每个数据对应的m个距离值,再通过神经网络将各距离值映射到n个量化区间,使用soft-argmax获得每个数据对应的量化结果;所述归一化层用于对训练样本集中数据进行归一化处理;其中,n为量化网络层的量化级数;
将所述量化结果与归一化处理结果合并后输入所述深度时间序列分类网络,并以最小化分类损失为目标,对所述异常用电检测模型进行训练。
2.根据权利要求1所述的基于用电趋势量化网络的异常用电检测模型的构建方法,其特征在于,在获得所述三维数组的过程中,当遇到需要除以当日之后每一天中同时刻的采样数据时直接填充为1。
3.根据权利要求2所述的基于用电趋势量化网络的异常用电检测模型的构建方法,其特征在于,在所述量化网络层求取所述三维数组中所有数据的m个分位点之前,还包括:将所述三维数组中最后一行数据舍弃,并将缩减后的三维数组输入所述量化网络层。
4.一种基于用电趋势量化网络的异常用电检测方法,其特征在于,包括:将待检测的用电量时序数据输入到采用权利要求1至3任一项所述的基于用电趋势量化网络的异常用电检测模型的构建方法所构建的异常用电检测模型中,输出检测结果。
5.一种基于用电趋势量化网络的异常用电检测模型的构建装置,其特征在于,包括:
获取模块,用于获取连续N天的用电量时序数据,并对其进行标注,作为训练样本集;其中,N为大于等于2的整数;
搭建模块,用于搭建包括用电趋势信息提取层、量化网络层、归一化层以及深度时间序列分类网络的异常用电检测模型;所述用电趋势信息提取层用于将所述训练样本集中每天的采样点数据除以N天中同时刻的采样数据,得到三维数组;所述量化网络层用于求取所述三维数组中所有数据的m个分位点,并分别计算每个数据与每个分位点的距离,得到每个数据对应的m个距离值,再通过神经网络将各距离值映射到n个量化区间,使用soft-argmax获得每个数据对应的量化结果;所述归一化层用于对训练样本集中数据进行归一化处理;其中,n为量化网络层的量化级数;
训练模块,用于将所述量化结果与归一化处理结果合并后输入所述深度时间序列分类网络,并以最小化分类损失为目标,对所述异常用电检测模型进行训练。
6.一种基于用电趋势量化网络的异常用电检测装置,其特征在于,包括检测模块,所述检测模块用于将待检测的用电量时序数据输入到采用权利要求5所述的基于用电趋势量化网络的异常用电检测模型的构建装置所构建的异常用电检测模型中,输出检测结果。
7.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现如权利要求1至3任一项所述的基于用电趋势量化网络的异常用电检测模型的构建方法和/或如权利要求4所述的基于用电趋势量化网络的异常用电检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310740549.3A CN116861306A (zh) | 2023-06-20 | 2023-06-20 | 一种基于用电趋势量化网络的异常用电检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310740549.3A CN116861306A (zh) | 2023-06-20 | 2023-06-20 | 一种基于用电趋势量化网络的异常用电检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116861306A true CN116861306A (zh) | 2023-10-10 |
Family
ID=88229571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310740549.3A Pending CN116861306A (zh) | 2023-06-20 | 2023-06-20 | 一种基于用电趋势量化网络的异常用电检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116861306A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407693A (zh) * | 2023-10-20 | 2024-01-16 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
CN117786564A (zh) * | 2023-11-23 | 2024-03-29 | 重庆邮电大学 | 一种异常用电智能检测方法 |
-
2023
- 2023-06-20 CN CN202310740549.3A patent/CN116861306A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117407693A (zh) * | 2023-10-20 | 2024-01-16 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
CN117407693B (zh) * | 2023-10-20 | 2024-05-24 | 湖北大学 | 基于部分域自适应和分位数回归的非侵入式负荷检测方法 |
CN117786564A (zh) * | 2023-11-23 | 2024-03-29 | 重庆邮电大学 | 一种异常用电智能检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
Faulkner et al. | Can we still predict the future from the past? Implementing non‐stationary flood frequency analysis in the UK | |
CN116861306A (zh) | 一种基于用电趋势量化网络的异常用电检测方法 | |
CN112836738B (zh) | 基于bp神经网络的窃电行为检测方法 | |
CN110119556B (zh) | 一种区域水源涵养功能的时空演变分析方法 | |
CN117556369B (zh) | 一种动态生成的残差图卷积神经网络的窃电检测方法及系统 | |
Liu | FDI and employment by industry: A co-integration study | |
CN115690576B (zh) | 基于夜光影像多特征的贫困率估算方法及系统 | |
CN116049340A (zh) | 考虑水位与水文连通性共存关系的湖泊最优水位确定方法 | |
Haining | Designing a health needs GIS with spatial analysis capability | |
CN114611738A (zh) | 一种基于用户用电行为分析的负荷预测方法 | |
CN118228069A (zh) | 用电负荷预测方法、装置、设备、介质和程序产品 | |
CN113269805B (zh) | 降水事件引导的遥感降水反演训练样本自适应选取方法 | |
CN110716998A (zh) | 一种精细尺度人口数据空间化方法 | |
Zhang et al. | Robust interval state estimation for distribution systems considering pseudo-measurement interval prediction | |
CN116401962A (zh) | 水质模型最优特征方案的推求方法 | |
Zhang et al. | Extraction of spatial-temporal features of bus loads in electric grids through clustering in a dynamic model space | |
CN113610436A (zh) | 一种承灾体动态脆弱性评估方法及系统 | |
CN116756653A (zh) | 一种基于多尺度差分量化的异常用电检测方法 | |
CN113962508A (zh) | 用电对象的识别方法及识别装置、电子设备 | |
Nurmatov | Econometric Analysis of the Efficiency of Using Tax Incentives | |
CN112685461A (zh) | 一种基于预判模型的窃电用户判断方法 | |
CN113723775B (zh) | 一种基于电力大数据的企业及行业运营风险的评估方法 | |
Kim et al. | Precipitation nowcasting using grid-based data in South Korea region | |
CN118550928B (zh) | 基于数字孪生的城市运行数据感知方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |