CN117150409A - 一种用电异常检测方法 - Google Patents
一种用电异常检测方法 Download PDFInfo
- Publication number
- CN117150409A CN117150409A CN202311186329.7A CN202311186329A CN117150409A CN 117150409 A CN117150409 A CN 117150409A CN 202311186329 A CN202311186329 A CN 202311186329A CN 117150409 A CN117150409 A CN 117150409A
- Authority
- CN
- China
- Prior art keywords
- data set
- abnormality detection
- model
- training
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 68
- 230000005856 abnormality Effects 0.000 title claims abstract description 60
- 238000012549 training Methods 0.000 claims abstract description 90
- 230000005611 electricity Effects 0.000 claims abstract description 78
- 230000002159 abnormal effect Effects 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000005070 sampling Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 3
- 230000001902 propagating effect Effects 0.000 claims description 2
- 230000006870 function Effects 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00002—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Marketing (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种用电异常检测方法,包括:获取需要检测的数据集,搭建用电异常检测判断模型,获取第一训练数据集,并对其进行预处理及数据采样,基于采样后的第一训练数据集对用电异常检测判断模型进行训练,将需要检测的数据集输入用电异常检测判断模型,判断此数据集是否发生异常,搭建用电异常检测识别模型,并获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练,将判断发生异常的数据集输入训练后的用电异常检测识别模型中,对其进行识别,得到识别结果。本发明提供的用电异常检测方法,能够实现用电异常判断及异常类型识别,便于使用,省时省力。
Description
技术领域
本发明涉及用电异常检测技术领域,特别是涉及一种用电异常检测方法。
背景技术
随着电力系统信息化技术的快速发展,电网信息系统产生了大量用电数据。在电网生产运行过程中,因数据传输干扰以及多源数据融合混叠,从而导致在对配电网数据进行量测时可能出现较大误差,即出现用电异常数据,进而降低了用电数据质量,影响电网运行状态和用户用电行为的准确分析。由此可见,对用电异常数据进行识别检测,就显得尤为重要。现有技术中往往需要通过人工经验来进行用电异常判断,费时费力,十分不便。因此,设计一种用电异常检测方法是十分有必要的。
发明内容
本发明的目的是提供一种用电异常检测方法,能够实现用电异常判断及异常类型识别,便于使用,省时省力。
为实现上述目的,本发明提供了如下方案:
一种用电异常检测方法,包括如下步骤:
步骤1:获取需要检测的数据集;
步骤2:搭建用电异常检测判断模型;
步骤3:获取第一训练数据集,并对其进行预处理及数据采样,基于采样后的第一训练数据集对用电异常检测判断模型进行训练;
步骤4:将需要检测的数据集输入用电异常检测判断模型,判断此数据集是否发生异常;
步骤5:搭建用电异常检测识别模型,并获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练;
步骤6:将判断发生异常的数据集输入训练后的用电异常检测识别模型中,对其进行识别,得到识别结果。
可选的,步骤2中,搭建用电异常检测判断模型,具体为:
基于BP神经网络模型搭建用电异常检测判断模型。
可选的,步骤3中,获取第一训练数据集,并对其进行预处理,具体为:
每隔固定时间获取用户用电数据,包括电压、电流、电量、用户类型、表记编号及测量点编号,并对用户用电数据是否异常进行标注,得到第一训练原始数据集,对第一训练原始数据集进行数据缺失及数据冗余情况处理,处理完毕后,对第一训练原始数据集进行去中心化处理,得到第一训练数据集。
可选的,步骤3中,对第一训练数据集进行数据采样,具体为:
获取第一训练数据集,其中,第一训练数据集包括正常用电的正样本及异常用电的负样本,将数据集中的每条数据均看作一个向量,计算所有数据的欧氏距离,设置超参数k值,根据计算得到的欧氏距离从负样本的k个近邻中随机获取一个样本,基于SMOTE过采样算法生成新的样本,并重复此操作,直至第一训练数据集正样本及负样本数量均衡,遍历所有新生成的样本,重新计算所有样本的欧式距离,根据新计算的欧式距离可以得到所有的Tomek Link,分析所有计算出的Tomek Link,若属于同一类别,则保留此样本,否则,则删除样本,得到数据采样后的第一训练数据集。
可选的,步骤5中,搭建用电异常检测识别模型,具体为:
搭建LSTM模型,并在LSTM模型中加入时间门及概率门,对LSTM模型的损失函数进行调整,最终得到改进后的LSTM模型,将其作为用电异常检测识别模型。
可选的,步骤5中,获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练,具体为:
获取第二训练数据集,其中,第二训练数据集中包括相邻的两个向量为时间先后关系,每个向量均包含时间戳及概率值信息,初始化LSTM模型的参数,将第二训练数据集输入LSTM模型中,在LSTM模型的细胞中计算时间门及概率门,并将最后一层的输出结果作为LSTM模型的输出,将LSTM模型的输出向量输入到全连接网络层中,通过softmax做激活函数完成多分类,并预测每个分类的概率,与真实的类别标签计算改进的交叉熵作为损失函数,并反向传播不断的优化模型,完成训练。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的用电异常检测方法,该方法包括获取需要检测的数据集,搭建用电异常检测判断模型,获取第一训练数据集,并对其进行预处理及数据采样,基于采样后的第一训练数据集对用电异常检测判断模型进行训练,将需要检测的数据集输入用电异常检测判断模型,判断此数据集是否发生异常,搭建用电异常检测识别模型,并获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练,将判断发生异常的数据集输入训练后的用电异常检测识别模型中,对其进行识别,得到识别结果,该方法首先对数据集进行是否异常判断,若异常则对其进行异常检测识别,能够得到异常类型,便于使用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例用电异常检测方法流程示意图。
具体实施方式
本发明的目的是提供一种用电异常检测方法,能够实现用电异常判断及异常类型识别,便于使用,省时省力。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明实施例提供的用电异常检测方法,包括如下步骤:
步骤1:获取需要检测的数据集;
步骤2:搭建用电异常检测判断模型;
步骤3:获取第一训练数据集,并对其进行预处理及数据采样,基于采样后的第一训练数据集对用电异常检测判断模型进行训练;
步骤4:将需要检测的数据集输入用电异常检测判断模型,判断此数据集是否发生异常;
步骤5:搭建用电异常检测识别模型,并获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练;
步骤6:将判断发生异常的数据集输入训练后的用电异常检测识别模型中,对其进行识别,得到识别结果。
步骤2中,搭建用电异常检测判断模型,具体为:
基于BP神经网络模型搭建用电异常检测判断模型;
BP(back propagation,反向传播)神经网络算法,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络模型之一,已广泛应用到模式识别、函数拟合以及系统控制等多个领域之中。BP神经网络能通过对大量“输入-输出”模式的样本进行学习建立映射关系,而无需事前揭示描述这种映射关系的数学方程。BP神经网络采用最速下降法这一学习规则,通过经验泛化误差的反向传播来不断调整网络的连接权值以及阈值,使神经网络模型对数据样本进行逼近的误差平方和最小。
BP神经网络算法一般包括三层神经网络结构,分别为输入层、一个或多个隐含层和输出层,其中每一层中都包括多个神经元,即节点。BP神经网络中样本从输入层节点输入,依次经过各隐含层节点在输出层节点输出,其中每一层节点的输出只影响下一层节点的输出。BP神经网络的核心思想就是利用输出后的误差来估计输出层前一层的误差,再用这层误差来估计更前一层误差,如此获取所有各层误差估计。这里的误差估计可以理解为某种偏导数,根据这种偏导数来调整各层的连接权值,再用调整后的连接权值重新计算输出误差。直到输出的误差达到符合的要求或者迭代次数溢出设定值。
BP神经网络模型分为两个阶段,第一阶段(正向过程)输入信息从输入层输入,依次经过各隐含层到输出层,计算各神经单元的输出值;第二阶段(反向传播过程)输出误差逐层向前算出隐含层神经单元的误差,并用次误差来修正前层连接权值。
步骤3中,获取第一训练数据集,并对其进行预处理,具体为:
每隔固定时间获取用户用电数据,包括电压、电流、电量、用户类型、表记编号及测量点编号,其中,有效信息包括电压、电流及电量,可采用每隔15分钟采集一次数据,每天得到96个有效数据点,根据这些有效数据点的基本数据计算统计特征表示用户的用电情况,用户类型、表记编号及测量点编号用于让模型学习到一些用户级和测量点级别的信息,增强模型的泛化性能;
另外需要对用户用电数据是否异常进行标注,得到第一训练原始数据集;
对第一训练原始数据集进行数据缺失及数据冗余情况处理,首先筛选出所有的有缺失值的数据,对这些数据进行分析,对不同的缺失类型采用不同的方法处理,主要有以下几种方式:对于有部分相似数据分布的用户,可以用这部分相似的数据填充当前用户的缺失数据;对于有大量缺失值的用户直接删除这些用户数据;对于只有个别缺失值的用户,使用-1填充这些缺失值。然后还需要处理数据冗余的问题,数据冗余是指原始集合存在重复数据或者高度近似的数据,这样的数据相当于增大了同一样本的权重,需要删除冗余的数据,同时处理缺失值的第一种方法也会带来这种冗余问题,所以在这一步骤做了数据冗余的处理,提升模型的学习效率;
对第一训练原始数据集进行去中心化处理,使用极大极小化方法,利用下式做去中心化处理,
其中μ是均值,σ是标准差,计算后的数据服从标准正态分布。由于数据样本有多个维度,每个维度的量纲是不同的,处理后的数据特征具有相同的尺度,使模型的学习过程中不会对某些特征有偏重。对于非数值型的类目特征,做了重新编码,将原始编号映射到新的空间中重新编号;
处理完毕后,得到第一训练数据集。
步骤3中,对第一训练数据集进行数据采样,具体为:
获取第一训练数据集,其中,第一训练数据集包括正常用电的正样本及异常用电的负样本,将数据集中的每条数据均看作一个向量,计算所有数据的欧氏距离,设置超参数k值,根据计算得到的欧氏距离从负样本的k个近邻中随机获取一个样本,基于SMOTE过采样算法生成新的样本,并重复此操作,直至第一训练数据集正样本及负样本数量均衡,遍历所有新生成的样本,重新计算所有样本的欧式距离,根据新计算的欧式距离可以得到所有的Tomek Link,分析所有计算出的Tomek Link,若属于同一类别,则保留此样本,否则,则删除样本,得到数据采样后的第一训练数据集。
步骤5中,搭建用电异常检测识别模型,具体为:
搭建LSTM模型,并在LSTM模型中加入时间门及概率门,对LSTM模型的损失函数进行调整,最终得到改进后的LSTM模型,将其作为用电异常检测识别模型;
在LSTM模型中加入时间门,本发明的用户用电数据点都是在某一时刻采集的,可以获取到时间戳信息,可以把此时间戳信息加入到模型中,对于每一个输入向量都与这个向量的时间戳计算出时间门特征,计算方法为:
T=σ(Wx+σ(Qt))
其中x代表输入向量,t代表输入向量的时间戳,W是输入向量的参数矩阵,矩阵行的维度为输入向量的长度,列的维度为LSTM模型隐藏层的大小,Q是时间戳的参数向量,其维度同样是隐藏层的大小,σ是激活函数,输入向量与时间戳和参数矩阵计算后都需要输入到激活函数中,T是时间门的输出,是最终计算出来的向量,维度与隐藏层相同,在模型的训练过程中,会不断的优化参数矩阵W和参数向量Q,提升时间门的学习能力;
在LSTM模型中引入概率门,与上述时间门的计算相似,O和U分别代表输入向量的参数矩阵和异常概率的参数向量,T代表的是经过了时间门计算后的输入向量,此时该向量的长度已经变为了隐藏层的维度大小,计算公式如下
P=σ(OT+σ(Up))
对LSTM模型的损失函数进行调整,对于每一条用户数据,它所属于的异常类别视作标签1,其他类别为标签0,为了提高模型的学习能力,使用交叉熵作为损失函数,但是在交叉熵计算中对负标签的计算需要乘以一个小于1的权重,损失函数如下:
其中p(lstm)表示模型最终对每种类别预测的概率,根据交叉熵的计算方法,负样本的损失函数需要乘以0,根据具体需求,将交叉熵损失函数中的0替换为了小于1的权重w。
步骤5中,获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练,具体为:
获取第二训练数据集,其中,第二训练数据集中包括相邻的两个向量为时间先后关系,每个向量均包含时间戳及概率值信息,初始化LSTM模型的参数,将第二训练数据集输入LSTM模型中,在LSTM模型的细胞中计算时间门及概率门,并将最后一层的输出结果作为LSTM模型的输出,将LSTM模型的输出向量输入到全连接网络层中,通过softmax做激活函数完成多分类,并预测每个分类的概率,与真实的类别标签计算改进的交叉熵作为损失函数,并反向传播不断的优化模型,完成训练,其中softmax的计算公式为:
xi表示第i类的预测值,e是指数函数的常数。
本发明提供的用电异常检测方法,该方法包括获取需要检测的数据集,搭建用电异常检测判断模型,获取第一训练数据集,并对其进行预处理及数据采样,基于采样后的第一训练数据集对用电异常检测判断模型进行训练,将需要检测的数据集输入用电异常检测判断模型,判断此数据集是否发生异常,搭建用电异常检测识别模型,并获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练,将判断发生异常的数据集输入训练后的用电异常检测识别模型中,对其进行识别,得到识别结果,该方法首先对数据集进行是否异常判断,若异常则对其进行异常检测识别,能够得到异常类型,便于使用。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种用电异常检测方法,其特征在于,包括如下步骤:
步骤1:获取需要检测的数据集;
步骤2:搭建用电异常检测判断模型;
步骤3:获取第一训练数据集,并对其进行预处理及数据采样,基于采样后的第一训练数据集对用电异常检测判断模型进行训练;
步骤4:将需要检测的数据集输入用电异常检测判断模型,判断此数据集是否发生异常;
步骤5:搭建用电异常检测识别模型,并获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练;
步骤6:将判断发生异常的数据集输入训练后的用电异常检测识别模型中,对其进行识别,得到识别结果。
2.根据权利要求1所述的用电异常检测方法,其特征在于,步骤2中,搭建用电异常检测判断模型,具体为:
基于BP神经网络模型搭建用电异常检测判断模型。
3.根据权利要求2所述的用电异常检测方法,其特征在于,步骤3中,获取第一训练数据集,并对其进行预处理,具体为:
每隔固定时间获取用户用电数据,包括电压、电流、电量、用户类型、表记编号及测量点编号,并对用户用电数据是否异常进行标注,得到第一训练原始数据集,对第一训练原始数据集进行数据缺失及数据冗余情况处理,处理完毕后,对第一训练原始数据集进行去中心化处理,得到第一训练数据集。
4.根据权利要求3所述的用电异常检测方法,其特征在于,步骤3中,对第一训练数据集进行数据采样,具体为:
获取第一训练数据集,其中,第一训练数据集包括正常用电的正样本及异常用电的负样本,将数据集中的每条数据均看作一个向量,计算所有数据的欧氏距离,设置超参数k值,根据计算得到的欧氏距离从负样本的k个近邻中随机获取一个样本,基于SMOTE过采样算法生成新的样本,并重复此操作,直至第一训练数据集正样本及负样本数量均衡,遍历所有新生成的样本,重新计算所有样本的欧式距离,根据新计算的欧式距离可以得到所有的TomekLink,分析所有计算出的Tomek Link,若属于同一类别,则保留此样本,否则,则删除样本,得到数据采样后的第一训练数据集。
5.根据权利要求4所述的用电异常检测方法,其特征在于,步骤5中,搭建用电异常检测识别模型,具体为:
搭建LSTM模型,并在LSTM模型中加入时间门及概率门,对LSTM模型的损失函数进行调整,最终得到改进后的LSTM模型,将其作为用电异常检测识别模型。
6.根据权利要求5所述的用电异常检测方法,其特征在于,步骤5中,获取第二训练数据集,基于第二训练数据集对用电异常检测识别模型进行训练,具体为:
获取第二训练数据集,其中,第二训练数据集中包括相邻的两个向量为时间先后关系,每个向量均包含时间戳及概率值信息,初始化LSTM模型的参数,将第二训练数据集输入LSTM模型中,在LSTM模型的细胞中计算时间门及概率门,并将最后一层的输出结果作为LSTM模型的输出,将LSTM模型的输出向量输入到全连接网络层中,通过softmax做激活函数完成多分类,并预测每个分类的概率,与真实的类别标签计算改进的交叉熵作为损失函数,并反向传播不断的优化模型,完成训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311186329.7A CN117150409A (zh) | 2023-09-14 | 2023-09-14 | 一种用电异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311186329.7A CN117150409A (zh) | 2023-09-14 | 2023-09-14 | 一种用电异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117150409A true CN117150409A (zh) | 2023-12-01 |
Family
ID=88900613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311186329.7A Pending CN117150409A (zh) | 2023-09-14 | 2023-09-14 | 一种用电异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117150409A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117997652A (zh) * | 2024-04-03 | 2024-05-07 | 江西师范大学 | 一种基于集成学习的车辆入侵检测方法及装置 |
CN118213938A (zh) * | 2024-04-12 | 2024-06-18 | 深圳市巨能伟业技术有限公司 | 基于人工智能的电源安全供电保护方法和系统 |
-
2023
- 2023-09-14 CN CN202311186329.7A patent/CN117150409A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117997652A (zh) * | 2024-04-03 | 2024-05-07 | 江西师范大学 | 一种基于集成学习的车辆入侵检测方法及装置 |
CN117997652B (zh) * | 2024-04-03 | 2024-06-07 | 江西师范大学 | 一种基于集成学习的车辆入侵检测方法及装置 |
CN118213938A (zh) * | 2024-04-12 | 2024-06-18 | 深圳市巨能伟业技术有限公司 | 基于人工智能的电源安全供电保护方法和系统 |
CN118213938B (zh) * | 2024-04-12 | 2024-08-30 | 深圳市巨能伟业技术有限公司 | 基于人工智能的电源安全供电保护方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111260030B (zh) | 基于a-tcn电力负荷预测方法、装置、计算机设备及存储介质 | |
CN106251059B (zh) | 一种基于概率神经网络算法的电缆状态评估方法 | |
CN117150409A (zh) | 一种用电异常检测方法 | |
CN107169628B (zh) | 一种基于大数据互信息属性约简的配电网可靠性评估方法 | |
CN110571792A (zh) | 一种电网调控系统运行状态的分析评估方法及系统 | |
CN112381673B (zh) | 一种基于数字孪生的园区用电信息分析方法及装置 | |
CN114091615B (zh) | 一种基于生成对抗网络的电能计量数据补全方法和系统 | |
CN112287605B (zh) | 一种基于图卷积网络加速的潮流校核方法 | |
CN113449919B (zh) | 一种基于特征和趋势感知的用电量预测方法及系统 | |
Barzola-Monteses et al. | Energy consumption of a building by using long short-term memory network: a forecasting study | |
CN111882157A (zh) | 一种基于深度时空神经网络的需求预测方法、系统及计算机可读存储介质 | |
CN114004162A (zh) | 一种多工况场景下的冶炼负荷谐波发射水平的建模方法 | |
CN111985719A (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN116542701A (zh) | 一种基于cnn-lstm组合模型的碳价预测方法及系统 | |
CN110880044A (zh) | 一种基于马尔科夫链的负荷预测方法 | |
CN111090747A (zh) | 一种基于神经网络分类的电力通信故障应急处置方法 | |
CN117787915A (zh) | 一种配电网数字孪生智慧大脑构建方法 | |
CN117410959A (zh) | 一种基于eemd-gwo-lstm网络和mc误差修正的电网负荷超短期预测方法 | |
CN115526393B (zh) | 一种基于变电工程关键影响因素筛选的造价预测方法 | |
CN109033413B (zh) | 一种基于神经网络的需求文档和服务文档匹配方法 | |
CN111061708A (zh) | 一种基于lstm神经网络的电能量预测与修复方法 | |
CN116523001A (zh) | 电网薄弱线路识别模型构建方法、装置和计算机设备 | |
CN116739130A (zh) | TCN-BiLSTM网络的多时间尺度负荷预测方法 | |
CN115619563A (zh) | 一种基于神经网络的股票价格分析方法 | |
CN114386666A (zh) | 一种基于时空相关性的风电场短期风速预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |