CN116227543B - 用电异常的检测方法、检测装置、电子装置和电子设备 - Google Patents
用电异常的检测方法、检测装置、电子装置和电子设备 Download PDFInfo
- Publication number
- CN116227543B CN116227543B CN202310510799.8A CN202310510799A CN116227543B CN 116227543 B CN116227543 B CN 116227543B CN 202310510799 A CN202310510799 A CN 202310510799A CN 116227543 B CN116227543 B CN 116227543B
- Authority
- CN
- China
- Prior art keywords
- electricity consumption
- consumption data
- lstm
- svr
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 481
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 146
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 238000003062 neural network model Methods 0.000 claims abstract description 117
- 238000000034 method Methods 0.000 claims abstract description 82
- 238000000611 regression analysis Methods 0.000 claims abstract description 30
- 230000005856 abnormality Effects 0.000 claims abstract description 28
- 230000015654 memory Effects 0.000 claims description 41
- 238000012706 support-vector machine Methods 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 23
- 238000003860 storage Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 6
- 230000009977 dual effect Effects 0.000 claims description 5
- 210000004027 cell Anatomy 0.000 description 25
- 230000008569 process Effects 0.000 description 22
- 238000013528 artificial neural network Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000007787 long-term memory Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Operations Research (AREA)
- Mathematical Optimization (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
Abstract
本申请提供了一种用电异常的检测方法、检测装置、电子装置和电子设备。该方法包括:获取用电量数据和用电量数据对应的环境信息,根据用电量数据和用电量数据对应的环境信息生成用电数据序列;将用电数据序列输入LSTM‑SVR神经网络模型中,以利用LSTM‑SVR神经网络模型对用电数据序列进行回归分析,并获取LSTM‑SVR神经网络模型输出的结果,得到预测用电量;获取当前时刻的真实用电量,计算预测用电量与真实用电量之间的二范数,在二范数的值大于预设阈值的情况下,标记真实用电量为第一异常用电数据,以使得根据第一异常用电数据确定异常用电的原因。通过本申请,解决了现有技术中用电异常的检测方法耗时耗力的问题。
Description
技术领域
本申请涉及用电量异常检测领域,具体而言,涉及一种用电异常的检测方法、检测装置、计算机可读存储介质、电子装置和电子设备。
背景技术
由于窃电、电表故障等原因会导致用户用电数据出现明显的异常,这种用电数据上的异常一方面会影响电网和供电系统的可靠性,一方面会带来一定的经济损失。该问题目前已成为电网异常检测中最关心的问题之一,因此,准确的检测系统中用户用电异常有助于锁定异常用户,由此可以为供电公司节省大量的人力物力、降低经济损失。
随着智能电网的发展以及相应的信息采集系统的完善,电网的用户用电系统采集并保存了大量的用电数据。随着机器学习方法的发展,越来越多的方法被应用于此类任务中,包括无监督学习方法和监督学习方法。基于无监督学习的方法主要包含聚类分析、离群点检测、时间序列异常分析等方法,此类方法的关键在于定义合适的距离测度来将异常用电与正常用电数据通过定义的距离测度区分开。由于用电数据存在漂移、波动等特性,人工设计特征模型越来越困难,且不同行业用电的时序特性差别很大,采用统一的距离度量方式和相似性度量方式的无监督学习方法适用范围非常有限。此外,有研究人员尝试使用监督学习方法实现用电异常检测任务,监督学习方法包括决策树,支持向量机,人工神经网络等模型,其中,长短时记忆(LSTM)、递归神经网络等应用广泛。但是这些模型存在以下问题:整个网络的训练过程都是依赖于标签信息的,而数据标注本身就会耗费大量人力资源。
因此,如何有效的利用有限的标记信息进行用电异常检测,是目前亟需解决的问题。
发明内容
本申请的主要目的在于提供一种用电异常的检测方法、检测装置、计算机可读存储介质、电子装置和电子设备,以至少解决现有技术中用电异常检测方法可靠性较低的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种用电异常的检测方法,包括:获取用电量数据和所述用电量数据对应的环境信息,根据所述用电量数据和所述用电量数据对应的所述环境信息生成用电数据序列,其中,所述环境信息至少包括所述用电量数据对应的天气信息和日期信息;将所述用电数据序列输入LSTM-SVR神经网络模型中,以利用所述LSTM-SVR神经网络模型对所述用电数据序列进行回归分析,并获取所述LSTM-SVR神经网络模型输出的结果,得到预测用电量;获取当前时刻的真实用电量,计算所述预测用电量与所述真实用电量之间的二范数,在所述二范数的值大于预设阈值的情况下,标记所述真实用电量为第一异常用电数据,以使得根据所述第一异常用电数据确定异常用电的原因。
可选地,将所述用电数据序列输入LSTM-SVR神经网络模型中,以利用所述LSTM-SVR神经网络模型对所述用电数据序列进行回归分析,包括:利用所述LSTM-SVR神经网络模型中的LSTM模型提取所述用电数据序列的特征信息,其中,所述特征信息为所述用电数据序列中所述用电量数据随所述用电量数据对应的所述天气信息和所述日期信息变化而变化的规律;利用所述LSTM-SVR神经网络模型中的SVR模型对所述特征信息进行回归分析,得到所述预测用电量。
可选地,利用所述LSTM-SVR神经网络模型中的LSTM模型提取所述用电数据序列的特征信息,包括:根据公式计算所述LSTM模型的输入门值,其中,x为所述用电数据序列,Wf是所述LSTM模型的权重,h是所述LSTM模型的状态值,bf是所述LSTM模型的偏置;根据公式/>,计算得到所述用电数据序列的特征信息,其中,ht表示所述特征信息,Ct表示所述LSTM模型t时刻的细胞状态值,ot表示所述LSTM模型t时刻的所述输入门值。
可选地,利用所述LSTM-SVR神经网络模型中的SVR模型对所述特征信息进行回归分析,得到所述预测用电量,包括:将所述特征信息作为输入,所述用电数据序列作为输出,根据公式对所述特征信息进行回归分析,获取所述SVR模型输出的结果,得到所述预测用电量,其中,x表示所述特征信息,y表示所述用电数据序列,K为所述SVR模型的高斯核且服从高斯分布,a和b为所述SVR模型的输出结果。
可选地,计算所述预测用电量与所述真实用电量之间的二范数,包括:根据公式计算所述预测用电量与所述真实用电量之间的二范数,其中,D表示所述二范数,Pre表示所述预测用电量,True表示所述真实用电量。
可选地,在所述二范数的值大于预设阈值的情况下,标记所述真实用电量为异常用电数据之前,包括:计算所述用电量数据中的第二异常用电数据与所述用电数据序列之间的欧氏距离和波动量,其中,所述第二异常用电数据为预先标记的且与正常用电数据的差值超过预设范围的用电数据,所述正常用电数据为所述用电数据中除所述第二异常用电数据之外的用电数据;将所述欧氏距离和所述波动量的差值作为预设阈值。
可选地,在根据所述用电量数据生成用电数据序列之前,还包括:对所述用电数据序列进行归一化处理;对归一化后的所述用电数据序列进行噪声去除处理,其中,所述噪声去除处理为剔除所述用电数据序列中具有明显偏差的数据。
根据本申请的另一方面,提供了一种用电异常的检测装置,包括:生成单元,用于获取用电量数据和所述用电量数据对应的环境信息,根据所述用电量数据和所述用电量数据对应的所述环境信息生成用电数据序列,其中,所述环境信息至少包括所述用电量数据对应的天气信息和日期信息;获取单元,用于将所述用电数据序列输入LSTM-SVR神经网络模型中,以利用所述LSTM-SVR神经网络模型对所述用电数据序列进行回归分析,并获取所述LSTM-SVR神经网络模型输出的结果,得到预测用电量;标记单元,用于获取当前时刻的真实用电量,计算所述预测用电量与所述真实用电量之间的二范数,在所述二范数的值大于预设阈值的情况下,标记所述真实用电量为第一异常用电数据,以使得根据所述第一异常用电数据确定异常用电的原因。
根据本申请的再一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的检测方法。
根据本申请的又一方面,提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行任意一种所述的检测方法。
根据本申请的又一方面,提供了一种电子设备,包括:一个或多个处理器,存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行任意一种所述的检测方法。
应用本申请的技术方案,首先获取用电量数据和用电量数据对应的环境信息,生成用电数据序列,将用电数据序列输入预先训练的LSTM-SVR神经网络模型中,通过LSTM-SVR神经网络模型预测用电量,获取真实用电量,并计算预测用电量与真实用电量的二范数,二范数大于预设阈值表明真实用电量存在异常,标记真实用电量为第一异常用电数据,并根据第一异常用电数据确定异常用电的原因。与现有技术中,异常用电量的检测方法需要人工对大量的异常用电量进行标记并作为标签进行神经网络模型的训练,耗费人力资源且可靠性较低,本申请无需人工大量标记异常用电数据作为神经网络模型的标签,将用电数据序列输入LSTM-SVR神经网络模型来预测用电量,并计算预测用电量与真实用电量的二范数,通过判断二范数是否大于预设阈值来判断真实用电量是否存在异常,因此,可以解决现有技术中用电异常的检测方法耗时耗力的问题,达到自动判断用电异常的效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请的实施例提供的一种执行用电异常的检测方法的移动终端的硬件结构框图;
图2示出了本申请的实施例提供的一种用电异常的检测方法的流程示意图;
图3示出了本申请的实施例提供的一种具体的用电异常的检测方法的流程示意图;
图4示出了本申请的实施例提供的一种用电异常的检测装置的结构框图。
其中,上述附图包括以下附图标记:
102、处理器;104、存储器;106、传输设备;108、输入输出设备。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
LSTM:长短期记忆网络,是一种时间循环神经网络,是为了解决一般RNN(循环神经网络)存在的长期依赖问题而提出。
正如背景技术中所介绍的,现有技术中用电异常的检测方法需要人工标记耗时耗力,为解决用电异常的检测方法耗时耗力的问题,本申请的实施例提供了一种用电异常的检测方法、检测装置、计算机可读存储介质、电子装置和电子设备。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种用电异常的检测方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的用电异常的检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种运行于移动终端、计算机终端或者类似的运算装置的用电异常的检测方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本申请实施例的一种用电异常的检测方法的流程图。如图2所示,该方法包括以下步骤:
步骤S201,获取用电量数据和上述用电量数据对应的环境信息,根据上述用电量数据和上述用电量数据对应的上述环境信息生成用电数据序列,其中,上述环境信息至少包括上述用电量数据对应的天气信息和日期信息;
具体地,由于用电量的稳定性是影响电力系统供电质量的重要因素,因此,需要对用电量进行检测,及时发现用电量异常的情况,对于调整供电系统的供电量等具有重要意义。本申请利用神经网络根据历史用电数据预测某一未来时间段的用电量,而用电量的预测需要结合多种环境信息,例如:天气信息和日期信息等,夏季气温偏高,空调用于制冷功能的用电量相比冬天的用电量大。因此,本申请首先获取某一历史时间段的用电量与用电量对应的天气信息和日期信息,作为用电数据序列。某一历史时间段为某一未来时间段之前的时间段,例如:预测明天的用电量,则可以获取明天之前一个月之内的用电数据以及对应的天气信息和日期信息作为用电数据序列。
步骤S202,将上述用电数据序列输入LSTM-SVR神经网络模型中,以利用上述LSTM-SVR神经网络模型对上述用电数据序列进行回归分析,并获取上述LSTM-SVR神经网络模型输出的结果,得到预测用电量;
具体地,在生成用电数据序列之后,将用电数据序列输入至预先训练好的LSTM-SVR神经网络模型,以利用LSTM-SVR神经网络模型根据用电数据序列对用电量进行预测,LSTM-SVR神经网络模型的输出结果即预测用电量。
步骤S203,获取当前时刻的真实用电量,计算上述预测用电量与上述真实用电量之间的二范数,在上述二范数的值大于预设阈值的情况下,标记上述真实用电量为第一异常用电数据,以使得根据上述第一异常用电数据确定异常用电的原因。
具体地,获取真实用电量,并计算预测用电量和真实用电量的二范数,通过判断二范数与预设阈值的大小,进而判断真实用电量是否存在异常,若存在异常,标记出该真实用电数据为异常用电数据,以用于根据异常用电数据查找异常用电的原因。
通过本实施例,首先获取用电量数据和用电量数据对应的环境信息,生成用电数据序列,将用电数据序列输入预先训练的LSTM-SVR神经网络模型中,通过LSTM-SVR神经网络模型预测用电量,获取真实用电量,并计算预测用电量与真实用电量的二范数,二范数大于预设阈值表明真实用电量存在异常,标记真实用电量为第一异常用电数据,并根据第一异常用电数据确定异常用电的原因。与现有技术中,异常用电量的检测方法需要人工对大量的异常用电量进行标记并作为标签进行神经网络模型的训练,耗费人力资源且可靠性较低,本申请无需人工大量标记异常用电数据作为神经网络模型的标签,将用电数据序列输入LSTM-SVR神经网络模型来预测用电量,并计算预测用电量与真实用电量的二范数,通过判断二范数是否大于预设阈值来判断真实用电量是否存在异常,因此,可以解决现有技术中用电异常的检测方法耗时耗力的问题,达到自动判断用电异常的效果。
为了准确地对用电量进行预测,具体实现过程中,上述步骤S202可以通过以下步骤实现:利用上述LSTM-SVR神经网络模型中的LSTM模型提取上述用电数据序列的特征信息,其中,上述特征信息为上述用电数据序列中上述用电量数据随上述用电量数据对应的上述天气信息和上述日期信息变化而变化的规律;利用上述LSTM-SVR神经网络模型中的SVR模型对上述特征信息进行回归分析,得到上述预测用电量。该方法通过LSTM-SVR神经网络模型提取用电数据序列的特征信息,这样可以根据用电数据序列的特征信息对用电量进行预测。
具体地,首先计算LSTM-SVR神经网络模型的“输入门”,根据“输入门”计算候选向量:,/>,其中,LSTM-SVR神经网络模型中的单元格状态记为Ct-1,接下来更新上一个状态值Ct−1到Ct,即将上一个状态值Ct−1乘以ft,用于表示需要LSTM-SVR神经网络模型忘记的部分。之后将得到的状态值加上it∗C̃t,当前时刻的细胞状态值可以根据/>确定,在LSTM-SVR神经网络模型中运行一个Sigmoid层,它决定了要输出细胞状态的哪些部分,然后通过tanh激活函数将细胞的状态值规则化到-1和1之间,并将其乘以Sigmoid门的输出,LSTM的隐藏层输出表示为:/>,由此,得到LSTM的特征信息h,在特征信息h的基础上,构建SVR模型进行回归分析。神经网络的特征信息与传统特征不同,神经网络旨在通过由神经元组成的非线性映射将原始数据映射到由神经网络隐藏层张成的空间中,这个空间称为特征空间,通过对神经网络隐藏层节点的调节,可以改变数据在特征空间中的表达使之能够更容易拟合目标,这种表达被称为神经网络的特征,该特征能够在神经网络完成训练后有效的捕捉用电数据序列的变化情况,从而反映用电序列的变化规律,这些特征表现为神经网络节点的激活值,假设网络的输入为x,网络形成的特征映射表示为Feature ()的形式,那么得到的特征则可以表示为f=Feature(x),这个f同x类似也是数值的形式。
具体实现过程中,上述步骤S202还可以通过以下步骤实现:根据公式计算上述LSTM模型的输入门值,其中,x为上述用电数据序列,Wf是上述LSTM模型的权重,h是上述LSTM模型的状态值,bf是上述LSTM模型的偏置;根据公式/>,计算得到上述用电数据序列的特征信息,其中,ht表示上述特征信息,Ct表示上述LSTM模型t时刻的细胞状态值,ot表示上述LSTM模型t时刻的上述输入门值,该方法计算首先计算LSTM模型的输入门值,根据输入门值计算用电数据序列的特征信息,这样可以根据上述特征信息对用电量进行预测。
具体地,如上文上述,首先根据公式计算LSTM-SVR神经网络模型的输入门值,其中,Wf是神经网络模型的权重,bf是神经网络模型的偏置,h是状态值,x是输入的用电数据序列;根据输入门计算得到候选向量:/>,,其中,LSTM-SVR神经网络模型中的单元格状态记为Ct-1,接下来更新上一个状态值Ct−1到Ct,即将上一个状态值Ct−1乘以ft,用于表示需要LSTM-SVR神经网络模型忘记的部分。LSTM的输出门将基于细胞状态值确定,运行一个Sigmoid层,它决定了要输出的细胞状态的哪些部分,然后通过tanh激活函数将细胞的状态规则化到-1和1之间,并将其乘以Sigmoid门的输出,至此LSTM只输出了我们决定的那些部分。LSTM的隐藏层输出表示为:/>,由此计算得到LSTM的特征信息h。
为了根据特征信息预测用电量,具体实现过程中,上述步骤S202还包括以下步骤:将上述特征信息作为输入,上述用电数据序列作为输出,根据公式对上述特征信息进行回归分析,获取上述SVR模型输出的结果,得到上述预测用电量,其中,x表示上述特征信息,y表示上述用电数据序列,K为上述SVR模型的高斯核且服从高斯分布,a和b为上述SVR模型的输出结果。
具体地,预先利用支持向量机(SVR)对特征信息和用电数据序列进行拟合,以一次函数为例,即中的x表示特征信息,y表示用电数据序列,K采用高斯核函数/>,对x和y进行拟合,利用对偶方法计算SVR长平面、训练SVR模型,得到参数a和b的拟合结果,之后,将用于预测用电量的用电数据序列的特征信息提取之后,输入至上述参数a和b已经确定的SVR模型中,输出的结果即为用电量的预测结果。
具体实现过程中,上述步骤S203可以通过以下步骤实现:根据公式计算上述预测用电量与上述真实用电量之间的二范数,其中,D表示上述二范数,Pre表示上述预测用电量,True表示上述真实用电量。
具体地,在实际应用过程中,利用LSTM-SVR神经网络模型生成下一时刻的预测用电量Pret,而该时刻的真实用电量Truet可以获取得到,然后计算预测用电量和真实用电量之间的欧式距离:,若距离大于预设阈值(L-σ),那么真实用电量Truet则被标记为异常数据。
为了较为合理的设置预设阈值,具体实现过程中,上述步骤S203还包括以下步骤:计算上述用电量数据中的第二异常用电数据与上述用电数据序列之间的欧氏距离和波动量,其中,上述第二异常用电数据为预先标记的且与正常用电数据的差值超过预设范围的用电数据,上述正常用电数据为上述用电数据中除上述第二异常用电数据之外的用电数据;将上述欧氏距离和上述波动量的差值作为预设阈值。
具体地,在LSTM-SVR神经网络模型训练完成后,根据现有的标签信息标记出用电数据序列中的异常点,得到第二异常用电数据,并计算第二异常用电数据与正常用电序列数据之间的欧式距离L和波动量σ。在一些可选的实施方式中,预设阈值设置为(L-σ),在用LSTM-SVR神经网络模型得到预测用电量之后,检测预测用电量和真实用电量之间的二范数如果在区间[L-σ, +∞],则判断为异常点即第一异常用电数据。
具体实现过程中,上述方法在步骤S201之前,还包括以下步骤:对上述用电数据序列进行归一化处理;对归一化后的上述用电数据序列进行噪声去除处理,其中,上述噪声去除处理为剔除上述用电数据序列中具有明显偏差的数据。该方法对用电数据序列进行预处理,这样可以使预测用电量的预测结果更加准确。
在一些可选的实施方式中,首先对数据进行归一化处理,使用normalize函数将数据进行正则化处理完成归一化,然后以14天为单位将用电量数据划分为用电数据序列,并对用电数据序列进行简单的预处理,筛选出明显的噪声数据并去除,便于神经网络模型学习用电数据序列的分布特征,得到准确的特征信息,对于剩下的用电数据序列中存在异常的一部分数据进行标注,并将天气信息、日期信息(节假日等)编码为向量形式拼接到用电数据序列中,形成最终的用电数据序列,以用于用电量的预测。
为了使得本领域技术人员能够更加清楚地了解本申请的技术方案,以下将结合具体的实施例对本申请的用电异常的检测方法的实现过程进行详细说明。
本实施例涉及一种具体的用电异常的检测方法,如图3所示,包括如下步骤:
步骤S1:获取用电量数据和上述用电量数据对应的环境信息,首先对用电量数据进行归一化处理,使用normalize函数将数据进行正则化处理完成归一化,然后以14天为单位将用电量数据划分为用电数据序列,并对用电数据序列进行简单的预处理,筛选出明显的噪声数据并去除,便于神经网络模型学习用电数据序列的分布特征,得到准确的特征信息,对于剩下的用电数据序列中存在异常的一部分数据进行标注,并将天气信息、日期信息(节假日等)编码为向量形式拼接到用电数据序列中,形成最终的用电序列数据(用电数据序列),以用于用电量的预测;
步骤S2:训练LSTM-SVR神经网络模型,LSTM进行特征提取,计算输入门:,其中,W f 是训练权重,b f 是偏置,h是状态值,x是用电数据序列;根据输入门计算候选向量:/>,,其中,单元格状态记为C t-1,接下来更新上一个状态值C t−1到C t 。具体而言,将上一个状态值C t−1乘以f t ,以此表达期待忘记的部分。之后将得到的值加上i t ∗C̃ t (上一步输入门的两个值),由此可以得到新的候选值,由此,当前时刻的细胞状态值可以根据f t 和i t ∗C̃ t 来确定:/>。最后,是LSTM的“输出门”,此输出将基于细胞状态。首先运行一个Sigmoid层,它决定了要输出的细胞状态的哪些部分。然后通过tanh激活函数将细胞的状态规则化到-1和1之间,并将其乘以Sigmoid门的输出,至此LSTM只输出了我们决定的那些部分。LSTM的隐藏层输出表示为:,由此得到LSTM的特征信息,表示为h;
步骤S3:进行SVR回归分析,首先定义高斯核:,然后根据核函数定义SVR模型:/>,其中,x表示特征信息,a, b为训练参数,根据上述公式,利用对偶方法计算SVR长平面、训练SVR模型,从而拟合用电序列数据,得到SVR模型中参数a和b的值;
步骤S4:将用于用电量预测的用电序列数据(用电数据序列)输入至LSTM-SVR神经网络模型中的LSTM模型,得到特征信息,将特征信息输入至LSTM-SVR神经网络模型中的SVR模型,获取LSTM-SVR神经网络模型的输出结果,得到预测数据(预测用电量);
步骤S5:根据现有的标签信息标记出用电数据序列中的异常点,得到第二异常用电数据,并计算第二异常用电数据与正常用电序列数据之间的欧式距离L和波动量σ,得到异常数据的监督信息(即预设阈值设置为(L-σ)),计算预测用电量与真实用电量的离群距离(二范数),在二范数大于预设阈值的情况下,标记真实用电量为第一异常用电数据,根据第一异常用电数据查找用电异常的原因。
本申请实施例还提供了一种用电异常的检测装置,需要说明的是,本申请实施例的用电异常的检测装置可以用于执行本申请实施例所提供的用于用电异常的检测方法。该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
以下对本申请实施例提供的用电异常的检测装置进行介绍。
图4是根据本申请实施例的用电异常的检测装置的示意图。如图4所示,该装置包括:
生成单元10,用于获取用电量数据和上述用电量数据对应的环境信息,根据上述用电量数据和上述用电量数据对应的上述环境信息生成用电数据序列,其中,上述环境信息至少包括上述用电量数据对应的天气信息和日期信息;
具体地,由于用电量的稳定性是影响电力系统供电质量的重要因素,因此,需要对用电量进行检测,及时发现用电量异常的情况,对于调整供电系统的供电量等具有重要意义。本申请利用神经网络根据历史用电数据预测某一未来时间段的用电量,而用电量的预测需要结合多种环境信息,例如:天气信息和日期信息等,夏季气温偏高,空调用于制冷功能的用电量相比冬天的用电量大。因此,本申请首先获取某一历史时间段的用电量与用电量对应的天气信息和日期信息,作为用电数据序列。某一历史时间段为某一未来时间段之前的时间段,例如:预测明天的用电量,则可以获取明天之前一个月之内的用电数据以及对应的天气信息和日期信息作为用电数据序列。
获取单元20,用于将上述用电数据序列输入LSTM-SVR神经网络模型中,以利用上述LSTM-SVR神经网络模型对上述用电数据序列进行回归分析,并获取上述LSTM-SVR神经网络模型输出的结果,得到预测用电量;
具体地,在生成用电数据序列之后,将用电数据序列输入至预先训练好的LSTM-SVR神经网络模型,以利用LSTM-SVR神经网络模型根据用电数据序列对用电量进行预测,LSTM-SVR神经网络模型的输出结果即预测用电量。
标记单元30,用于获取当前时刻的真实用电量,计算上述预测用电量与上述真实用电量之间的二范数,在上述二范数的值大于预设阈值的情况下,标记上述真实用电量为第一异常用电数据,以使得根据上述第一异常用电数据确定异常用电的原因。
具体地,获取真实用电量,并计算预测用电量和真实用电量的二范数,通过判断二范数与预设阈值的大小,进而判断真实用电量是否存在异常,若存在异常,标记出该真实用电数据为异常用电数据,以用于根据异常用电数据查找异常用电的原因。
通过本实施例,首先获取用电量数据和用电量数据对应的环境信息,生成用电数据序列,将用电数据序列输入预先训练的LSTM-SVR神经网络模型中,通过LSTM-SVR神经网络模型预测用电量,获取真实用电量,并计算预测用电量与真实用电量的二范数,二范数大于预设阈值表明真实用电量存在异常,标记真实用电量为第一异常用电数据,并根据第一异常用电数据确定异常用电的原因。与现有技术中,异常用电量的检测装置需要人工对大量的异常用电量进行标记并作为标签进行神经网络模型的训练,耗费人力资源且可靠性较低,本申请无需人工大量标记异常用电数据作为神经网络模型的标签,将用电数据序列输入LSTM-SVR神经网络模型来预测用电量,并计算预测用电量与真实用电量的二范数,通过判断二范数是否大于预设阈值来判断真实用电量是否存在异常,因此,可以解决现有技术中用电异常的检测装置耗时耗力的问题,达到自动判断用电异常的效果。
为了准确地对用电量进行预测,具体实现过程中,获取单元包括提取模块和执行模块,其中,提取模块用于利用上述LSTM-SVR神经网络模型中的LSTM模型提取上述用电数据序列的特征信息,其中,上述特征信息为上述用电数据序列中上述用电量数据随上述用电量数据对应的上述天气信息和上述日期信息变化而变化的规律;执行模块用于利用上述LSTM-SVR神经网络模型中的SVR模型对上述特征信息进行回归分析,得到上述预测用电量。该装置通过LSTM-SVR神经网络模型提取用电数据序列的特征信息,这样可以根据用电数据序列的特征信息对用电量进行预测。
具体地,首先计算LSTM-SVR神经网络模型的“输入门”,根据“输入门”计算候选向量:,/>,其中,LSTM-SVR神经网络模型中的单元格状态记为Ct-1,接下来更新上一个状态值Ct−1到Ct,即将上一个状态值Ct−1乘以ft,用于表示需要LSTM-SVR神经网络模型忘记的部分。之后将得到的状态值加上it∗C̃t,当前时刻的细胞状态值可以根据/>确定,在LSTM-SVR神经网络模型中运行一个Sigmoid层,它决定了要输出细胞状态的哪些部分,然后通过tanh激活函数将细胞的状态值规则化到-1和1之间,并将其乘以Sigmoid门的输出,LSTM的隐藏层输出表示为:/>,由此,得到LSTM的特征信息h,在特征信息h的基础上,构建SVR模型进行回归分析。
具体实现过程中,获取单元中的提取模块还包括第一计算模块和第二计算模块,其中,第一计算模块用于根据公式计算上述LSTM模型的输入门值,其中,x为上述用电数据序列,Wf是上述LSTM模型的权重,h是上述LSTM模型的状态值,bf是上述LSTM模型的偏置;第二计算模块用于根据公式,计算得到上述用电数据序列的特征信息,其中,ht表示上述特征信息,Ct表示上述LSTM模型t时刻的细胞状态值,ot表示上述LSTM模型t时刻的上述输入门值,该装置计算首先计算LSTM模型的输入门值,根据输入门值计算用电数据序列的特征信息,这样可以根据上述特征信息对用电量进行预测。
具体地,如上文上述,首先根据公式计算LSTM-SVR神经网络模型的输入门值,其中,Wf是神经网络模型的权重,bf是神经网络模型的偏置,h是状态值,x是输入的用电数据序列;根据输入门计算得到候选向量:,/>,其中,LSTM-SVR神经网络模型中的单元格状态记为Ct-1,接下来更新上一个状态值Ct−1到Ct,即将上一个状态值Ct−1乘以ft,用于表示需要LSTM-SVR神经网络模型忘记的部分。LSTM的输出门将基于细胞状态值确定,运行一个Sigmoid层,它决定了要输出的细胞状态的哪些部分,然后通过tanh激活函数将细胞的状态规则化到-1和1之间,并将其乘以Sigmoid门的输出,至此LSTM只输出了我们决定的那些部分。LSTM的隐藏层输出表示为:,由此计算得到LSTM的特征信息h。
为了根据特征信息预测用电量,具体实现过程中,获取单元中的执行模块还包括获取模块,用于将上述特征信息作为输入,上述用电数据序列作为输出,根据公式对上述特征信息进行回归分析,获取上述SVR模型输出的结果,得到上述预测用电量,其中,x表示上述特征信息,y表示上述用电数据序列,K为上述SVR模型的高斯核且服从高斯分布,a和b为上述SVR模型的输出结果。
具体地,预先利用支持向量机(SVR)对特征信息和用电数据序列进行拟合,以一次函数为例,即中的x表示特征信息,y表示用电数据序列,K采用高斯核函数/>,对x和y进行拟合,利用对偶装置计算SVR长平面、训练SVR模型,得到参数a和b的拟合结果,之后,将用于预测用电量的用电数据序列的特征信息提取之后,输入至上述参数a和b已经确定的SVR模型中,输出的结果即为用电量的预测结果。
具体实现过程中,标记单元包括第三计算模块,用于根据公式计算上述预测用电量与上述真实用电量之间的二范数,其中,D表示上述二范数,Pre表示上述预测用电量,True表示上述真实用电量。
具体地,在实际应用过程中,利用LSTM-SVR神经网络模型生成下一时刻的预测用电量Pret,而该时刻的真实用电量Truet可以获取得到,然后计算预测用电量和真实用电量之间的欧式距离:,若距离大于预设阈值(L-σ),那么真实用电量Truet则被标记为异常数据。
为了较为合理的设置预设阈值,具体实现过程中,标记单元还包括第四计算模块,用于计算上述用电量数据中的第二异常用电数据与上述用电数据序列之间的欧氏距离和波动量,其中,上述第二异常用电数据为预先标记的且与正常用电数据的差值超过预设范围的用电数据,上述正常用电数据为上述用电数据中除上述第二异常用电数据之外的用电数据;将上述欧氏距离和上述波动量的差值作为预设阈值。
具体地,在LSTM-SVR神经网络模型训练完成后,根据现有的标签信息标记出用电数据序列中的异常点,得到第二异常用电数据,并计算第二异常用电数据与正常用电序列数据之间的欧式距离L和波动量σ。在一些可选的实施方式中,预设阈值设置为(L-σ),在用LSTM-SVR神经网络模型得到预测用电量之后,检测预测用电量和真实用电量之间的二范数如果在区间[L-σ, +∞],则判断为异常点即第一异常用电数据。
具体实现过程中,上述装置还包括第一处理模块和第二处理模块,其中,第一处理模块用于对上述用电数据序列进行归一化处理;第二处理模块用于对归一化后的上述用电数据序列进行噪声去除处理,其中,上述噪声去除处理为剔除上述用电数据序列中具有明显偏差的数据。该装置对用电数据序列进行预处理,这样可以使预测用电量的预测结果更加准确。
在一些可选的实施方式中,首先对数据进行归一化处理,使用normalize函数将数据进行正则化处理完成归一化,然后以14天为单位将用电量数据划分为用电数据序列,并对用电数据序列进行简单的预处理,筛选出明显的噪声数据并去除,便于神经网络模型学习用电数据序列的分布特征,得到准确的特征信息,对于剩下的用电数据序列中存在异常的一部分数据进行标注,并将天气信息、日期信息(节假日等)编码为向量形式拼接到用电数据序列中,形成最终的用电数据序列,以用于用电量的预测。
上述用电异常的检测装置包括处理器和存储器,上述生成单元、获取单元和标记单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现用电异常的检测。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行上述用电异常的检测方法。
具体地,用电异常的检测方法包括:
步骤S201,获取用电量数据和上述用电量数据对应的环境信息,根据上述用电量数据和上述用电量数据对应的上述环境信息生成用电数据序列,其中,上述环境信息至少包括上述用电量数据对应的天气信息和日期信息;
具体地,由于用电量的稳定性是影响电力系统供电质量的重要因素,因此,需要对用电量进行检测,及时发现用电量异常的情况,对于调整供电系统的供电量等具有重要意义。本申请利用神经网络根据历史用电数据预测某一未来时间段的用电量,而用电量的预测需要结合多种环境信息,例如:天气信息和日期信息等,夏季气温偏高,空调用于制冷功能的用电量相比冬天的用电量大。因此,本申请首先获取某一历史时间段的用电量与用电量对应的天气信息和日期信息,作为用电数据序列。某一历史时间段为某一未来时间段之前的时间段,例如:预测明天的用电量,则可以获取明天之前一个月之内的用电数据以及对应的天气信息和日期信息作为用电数据序列。
步骤S202,将上述用电数据序列输入LSTM-SVR神经网络模型中,以利用上述LSTM-SVR神经网络模型对上述用电数据序列进行回归分析,并获取上述LSTM-SVR神经网络模型输出的结果,得到预测用电量;
具体地,在生成用电数据序列之后,将用电数据序列输入至预先训练好的LSTM-SVR神经网络模型,以利用LSTM-SVR神经网络模型根据用电数据序列对用电量进行预测,LSTM-SVR神经网络模型的输出结果即预测用电量。
步骤S203,获取当前时刻的真实用电量,计算上述预测用电量与上述真实用电量之间的二范数,在上述二范数的值大于预设阈值的情况下,标记上述真实用电量为第一异常用电数据,以使得根据上述第一异常用电数据确定异常用电的原因。
具体地,获取真实用电量,并计算预测用电量和真实用电量的二范数,通过判断二范数与预设阈值的大小,进而判断真实用电量是否存在异常,若存在异常,标记出该真实用电数据为异常用电数据,以用于根据异常用电数据查找异常用电的原因。
可选地,将上述用电数据序列输入LSTM-SVR神经网络模型中,以利用上述LSTM-SVR神经网络模型对上述用电数据序列进行回归分析,包括:利用上述LSTM-SVR神经网络模型中的LSTM模型提取上述用电数据序列的特征信息,其中,上述特征信息为上述用电数据序列中上述用电量数据随上述用电量数据对应的上述天气信息和上述日期信息变化而变化的规律;利用上述LSTM-SVR神经网络模型中的SVR模型对上述特征信息进行回归分析,得到上述预测用电量。
可选地,利用上述LSTM-SVR神经网络模型中的LSTM模型提取上述用电数据序列的特征信息,包括:根据公式计算上述LSTM模型的输入门值,其中,x为上述用电数据序列,Wf是上述LSTM模型的权重,h是上述LSTM模型的状态值,bf是上述LSTM模型的偏置;根据公式/>,计算得到上述用电数据序列的特征信息,其中,ht表示上述特征信息,Ct表示上述LSTM模型t时刻的细胞状态值,ot表示上述LSTM模型t时刻的上述输入门值。
可选地,利用上述LSTM-SVR神经网络模型中的SVR模型对上述特征信息进行回归分析,得到上述预测用电量,包括:将上述特征信息作为输入,上述用电数据序列作为输出,根据公式对上述特征信息进行回归分析,获取上述SVR模型输出的结果,得到上述预测用电量,其中,x表示上述特征信息,y表示上述用电数据序列,K为上述SVR模型的高斯核且服从高斯分布,a和b为上述SVR模型的输出结果。
可选地,计算上述预测用电量与上述真实用电量之间的二范数,包括:根据公式计算上述预测用电量与上述真实用电量之间的二范数,其中,D表示上述二范数,Pre表示上述预测用电量,True表示上述真实用电量。
可选地,在上述二范数的值大于预设阈值的情况下,标记上述真实用电量为异常用电数据之前,包括:计算上述用电量数据中的第二异常用电数据与上述用电数据序列之间的欧氏距离和波动量,其中,上述第二异常用电数据为预先标记的且与正常用电数据的差值超过预设范围的用电数据,上述正常用电数据为上述用电数据中除上述第二异常用电数据之外的用电数据;将上述欧氏距离和上述波动量的差值作为预设阈值。
可选地,在根据上述用电量数据生成用电数据序列之前,还包括:对上述用电数据序列进行归一化处理;对归一化后的上述用电数据序列进行噪声去除处理,其中,上述噪声去除处理为剔除上述用电数据序列中具有明显偏差的数据。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
从以上的描述中,可以看出,本申请上述的实施例实现了如下技术效果:
1)、本申请的用电异常的检测方法中,首先获取用电量数据和用电量数据对应的环境信息,生成用电数据序列,将用电数据序列输入预先训练的LSTM-SVR神经网络模型中,通过LSTM-SVR神经网络模型预测用电量,获取真实用电量,并计算预测用电量与真实用电量的二范数,二范数大于预设阈值表明真实用电量存在异常,标记真实用电量为第一异常用电数据,并根据第一异常用电数据确定异常用电的原因。与现有技术中,异常用电量的检测方法需要人工对大量的异常用电量进行标记并作为标签进行神经网络模型的训练,耗费人力资源且可靠性较低,本申请无需人工大量标记异常用电数据作为神经网络模型的标签,将用电数据序列输入LSTM-SVR神经网络模型来预测用电量,并计算预测用电量与真实用电量的二范数,通过判断二范数是否大于预设阈值来判断真实用电量是否存在异常,因此,可以解决现有技术中用电异常的检测方法耗时耗力的问题,达到自动判断用电异常的效果。
2)、本申请的用电异常的检测装置中,获取用电量数据和用电量数据对应的环境信息,生成用电数据序列,将用电数据序列输入预先训练的LSTM-SVR神经网络模型中,通过LSTM-SVR神经网络模型预测用电量,获取真实用电量,并计算预测用电量与真实用电量的二范数,二范数大于预设阈值表明真实用电量存在异常,标记真实用电量为第一异常用电数据,并根据第一异常用电数据确定异常用电的原因。与现有技术中,异常用电量的检测装置需要人工对大量的异常用电量进行标记并作为标签进行神经网络模型的训练,耗费人力资源且可靠性较低,本申请无需人工大量标记异常用电数据作为神经网络模型的标签,将用电数据序列输入LSTM-SVR神经网络模型来预测用电量,并计算预测用电量与真实用电量的二范数,通过判断二范数是否大于预设阈值来判断真实用电量是否存在异常,因此,可以解决现有技术中用电异常的检测装置耗时耗力的问题,达到自动判断用电异常的效果。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (7)
1.一种用电异常的检测方法,其特征在于,包括:
获取用电量数据和所述用电量数据对应的环境信息,根据所述用电量数据和所述用电量数据对应的所述环境信息生成用电数据序列,其中,所述环境信息至少包括所述用电量数据对应的天气信息和日期信息;
将所述用电数据序列输入LSTM-SVR神经网络模型中,以利用所述LSTM-SVR神经网络模型对所述用电数据序列进行回归分析,并获取所述LSTM-SVR神经网络模型输出的结果,得到预测用电量;
获取当前时刻的真实用电量,计算所述预测用电量与所述真实用电量之间的二范数,在所述二范数的值大于预设阈值的情况下,标记所述真实用电量为第一异常用电数据,以使得根据所述第一异常用电数据确定异常用电的原因;
将所述用电数据序列输入LSTM-SVR神经网络模型中,以利用所述LSTM-SVR神经网络模型对所述用电数据序列进行回归分析,包括:
利用所述LSTM-SVR神经网络模型中的LSTM模型提取所述用电数据序列的特征信息,其中,所述特征信息为所述用电数据序列中所述用电量数据随所述用电量数据对应的所述天气信息和所述日期信息变化而变化的规律;
利用所述LSTM-SVR神经网络模型中的SVR模型对所述特征信息进行回归分析,得到所述预测用电量;
利用所述LSTM-SVR神经网络模型中的LSTM模型提取所述用电数据序列的特征信息,包括:
根据公式计算所述LSTM模型的输入门值,其中,x t 为t时刻的所述用电数据序列,/>是所述LSTM模型的权重,h t 为t时刻的所述LSTM模型的状态值,/>是所述LSTM模型的偏置;
根据所述输入门值计算候选向量,基于所述候选向量计算得到t时刻的细胞状态值;
基于所述细胞状态值确定所述LSTM模型的输出门,运行一个Sigmoid层,通过tanh激活函数将所述细胞状态值规则化到-1和1之间,并将其乘以所述Sigmoid层的输出;
确定所述LSTM模型的隐藏层为,其中,ot表示所述LSTM模型t时刻的所述输入门值,b0是所述LSTM模型的初始偏置,ht-1是所述LSTM模型在t-1时刻的状态值,W0是所述LSTM模型的初始权重;
根据所述隐藏层中的,计算得到所述用电数据序列的特征信息,其中,ht表示所述特征信息,Ct表示所述LSTM模型t时刻的所述细胞状态值;
利用所述LSTM-SVR神经网络模型中的SVR模型对所述特征信息进行回归分析,得到所述预测用电量,包括:
将所述特征信息作为输入,所述用电数据序列作为输出,根据公式对所述特征信息进行回归分析,获取所述SVR模型输出的结果,得到所述预测用电量:预先利用支持向量机对特征信息和用电数据序列进行拟合,利用对偶方法计算所述SVR模型的长平面、训练所述SVR模型,得到参数a、b的拟合结果,将用于预测用电量的用电数据序列的特征信息提取之后,输入至所述参数a、b已经确定的所述SVR模型中,输出的结果即为所述预测用电量,其中,b为所述SVR模型中的参数,x表示所述特征信息,y表示所述用电数据序列,K为所述SVR模型的高斯核且服从高斯分布;
在所述二范数的值大于预设阈值的情况下,标记所述真实用电量为异常用电数据之前,包括:
计算所述用电量数据中的第二异常用电数据与所述用电数据序列之间的欧氏距离和波动量,其中,所述第二异常用电数据为在所述LSTM-SVR神经网络模型训练完成后根据现有的标签信息标记出的且与正常用电数据的差值超过预设范围的用电数据,所述正常用电数据为所述用电数据中除所述第二异常用电数据之外的用电数据;
将所述欧氏距离和所述波动量的差值作为预设阈值。
2.根据权利要求1所述的检测方法,其特征在于,计算所述预测用电量与所述真实用电量之间的二范数,包括:
根据公式计算所述预测用电量与所述真实用电量之间的二范数,其中,D表示所述二范数,Pret表示t时刻的所述预测用电量,Truet表示t时刻的所述真实用电量。
3.根据权利要求1至2中任意一项所述的检测方法,其特征在于,在根据所述用电量数据生成用电数据序列之前,还包括:
对所述用电数据序列进行归一化处理;
对归一化后的所述用电数据序列进行噪声去除处理,其中,所述噪声去除处理为剔除所述用电数据序列中具有明显偏差的数据。
4.一种用电异常的检测装置,其特征在于,包括:
生成单元,用于获取用电量数据和所述用电量数据对应的环境信息,根据所述用电量数据和所述用电量数据对应的所述环境信息生成用电数据序列,其中,所述环境信息至少包括所述用电量数据对应的天气信息和日期信息;
获取单元,用于将所述用电数据序列输入LSTM-SVR神经网络模型中,以利用所述LSTM-SVR神经网络模型对所述用电数据序列进行回归分析,并获取所述LSTM-SVR神经网络模型输出的结果,得到预测用电量;
标记单元,用于获取当前时刻的真实用电量,计算所述预测用电量与所述真实用电量之间的二范数,在所述二范数的值大于预设阈值的情况下,标记所述真实用电量为第一异常用电数据,以使得根据所述第一异常用电数据确定异常用电的原因;
所述获取单元包括:
提取模块,用于利用所述LSTM-SVR神经网络模型中的LSTM模型提取所述用电数据序列的特征信息,其中,所述特征信息为所述用电数据序列中所述用电量数据随所述用电量数据对应的所述天气信息和所述日期信息变化而变化的规律;
执行模块,用于利用所述LSTM-SVR神经网络模型中的SVR模型对所述特征信息进行回归分析,得到所述预测用电量;
所述提取模块包括:
第一计算模块,用于根据公式计算所述LSTM模型的输入门值,其中,x t 为t时刻的所述用电数据序列,/>是所述LSTM模型的权重,h t 为t时刻的所述LSTM模型的状态值,/>是所述LSTM模型的偏置;根据所述输入门值计算候选向量,基于所述候选向量计算得到t时刻的细胞状态值;基于所述细胞状态值确定所述LSTM模型的输出门,运行一个Sigmoid层,通过tanh激活函数将所述细胞状态值规则化到-1和1之间,并将其乘以所述Sigmoid层的输出;确定所述LSTM模型的隐藏层为,其中,ot表示所述LSTM模型t时刻的所述输入门值,b0是所述LSTM模型的初始偏置,ht-1是所述LSTM模型在t-1时刻的状态值,W0是所述LSTM模型的初始权重;
第二计算模块,用于根据所述隐藏层中的,计算得到所述用电数据序列的特征信息,其中,ht表示所述特征信息,Ct表示所述LSTM模型t时刻的所述细胞状态值;
所述执行模块包括:
获取模块,用于将所述特征信息作为输入,所述用电数据序列作为输出,根据公式对所述特征信息进行回归分析,获取所述SVR模型输出的结果,得到所述预测用电量:预先利用支持向量机对特征信息和用电数据序列进行拟合,利用对偶方法计算所述SVR模型的长平面、训练所述SVR模型,得到参数a、b的拟合结果,将用于预测用电量的用电数据序列的特征信息提取之后,输入至所述参数a、b已经确定的所述SVR模型中,输出的结果即为所述预测用电量,其中,b为所述SVR模型中的参数,x表示所述特征信息,y表示所述用电数据序列,K为所述SVR模型的高斯核且服从高斯分布;
所述标记单元包括:
第四计算模块,用于计算所述用电量数据中的第二异常用电数据与所述用电数据序列之间的欧氏距离和波动量,其中,所述第二异常用电数据为在所述LSTM-SVR神经网络模型训练完成后根据现有的标签信息标记出的且与正常用电数据的差值超过预设范围的用电数据,所述正常用电数据为所述用电数据中除所述第二异常用电数据之外的用电数据;其中,将所述欧氏距离和所述波动量的差值作为预设阈值。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至3中任意一项所述的检测方法。
6.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至3中任意一项所述的检测方法。
7.一种电子设备,其特征在于,包括:一个或多个处理器,存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行权利要求1至3中任意一项所述的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310510799.8A CN116227543B (zh) | 2023-05-09 | 2023-05-09 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310510799.8A CN116227543B (zh) | 2023-05-09 | 2023-05-09 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116227543A CN116227543A (zh) | 2023-06-06 |
CN116227543B true CN116227543B (zh) | 2023-08-04 |
Family
ID=86587661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310510799.8A Active CN116227543B (zh) | 2023-05-09 | 2023-05-09 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116227543B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116505663B (zh) * | 2023-06-28 | 2023-09-05 | 佛山市华易科技有限公司 | 一种农场用电安全状态监测预警系统 |
CN117290797B (zh) * | 2023-11-24 | 2024-02-02 | 国网山东省电力公司济宁供电公司 | 一种建筑能耗预测方法、系统、装置及介质 |
CN117472898B (zh) * | 2023-12-26 | 2024-04-02 | 国网江西省电力有限公司电力科学研究院 | 一种基于融合的配电网异常数据纠错方法及系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113205223A (zh) * | 2021-05-17 | 2021-08-03 | 上海电力大学 | 一种电量预测系统及其预测方法 |
CN113284002A (zh) * | 2021-04-09 | 2021-08-20 | 南方电网数字电网研究院有限公司 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
CN113657668A (zh) * | 2021-08-17 | 2021-11-16 | 西南科技大学 | 基于lstm网络的电力负荷预测方法及系统 |
CN113705915A (zh) * | 2021-09-01 | 2021-11-26 | 沈阳建筑大学 | 一种基于cnn-lstm-arima组合短期电力负荷预测方法 |
CN114330642A (zh) * | 2021-11-29 | 2022-04-12 | 国网浙江省电力有限公司杭州供电公司 | 一种用于多采样时间的建筑电力负荷预测方法 |
CN114356900A (zh) * | 2021-12-06 | 2022-04-15 | 南方电网科学研究院有限责任公司 | 一种电力数据异常检测方法、装置、设备及介质 |
CN114511159A (zh) * | 2022-04-20 | 2022-05-17 | 广东电网有限责任公司佛山供电局 | 基于条件变分自编码器的电力负荷概率预测方法和系统 |
CN115513951A (zh) * | 2022-11-17 | 2022-12-23 | 山东建筑大学 | 一种基于概念漂移检测的电力负荷预测方法及系统 |
CN115658673A (zh) * | 2022-11-09 | 2023-01-31 | 国网甘肃省电力公司兰州供电公司 | 一种基于大数据建模的电力数据质量离群检测方法 |
CN115730845A (zh) * | 2022-11-18 | 2023-03-03 | 广东电网有限责任公司云浮供电局 | 一种电力系统动态估计方法、装置、设备和可读存储介质 |
CN115759415A (zh) * | 2022-11-16 | 2023-03-07 | 国网河南省电力公司经济技术研究院 | 基于lstm-svr的用电需求预测方法 |
CN115759343A (zh) * | 2022-10-20 | 2023-03-07 | 国网浙江省电力有限公司经济技术研究院 | 一种基于e-lstm的用户电量预测方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101360790B1 (ko) * | 2009-04-22 | 2014-02-11 | 한국전력공사 | 발전소 계측기 성능 감시 예측 방법 |
US10712738B2 (en) * | 2016-05-09 | 2020-07-14 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for industrial internet of things data collection for vibration sensitive equipment |
JP6661559B2 (ja) * | 2017-02-03 | 2020-03-11 | 株式会社東芝 | 異常検出装置、異常検出方法およびプログラム |
US20220036199A1 (en) * | 2020-07-31 | 2022-02-03 | VoltSense, Inc. | System and method for predictive foliage impingement and wildfire management using generative adversarial network |
EP4057482A1 (de) * | 2021-03-10 | 2022-09-14 | Siemens Aktiengesellschaft | Verfahren und vorrichtung zur zustandsschätzung eines elektrischen netzes |
-
2023
- 2023-05-09 CN CN202310510799.8A patent/CN116227543B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113284002A (zh) * | 2021-04-09 | 2021-08-20 | 南方电网数字电网研究院有限公司 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
CN113205223A (zh) * | 2021-05-17 | 2021-08-03 | 上海电力大学 | 一种电量预测系统及其预测方法 |
CN113657668A (zh) * | 2021-08-17 | 2021-11-16 | 西南科技大学 | 基于lstm网络的电力负荷预测方法及系统 |
CN113705915A (zh) * | 2021-09-01 | 2021-11-26 | 沈阳建筑大学 | 一种基于cnn-lstm-arima组合短期电力负荷预测方法 |
CN114330642A (zh) * | 2021-11-29 | 2022-04-12 | 国网浙江省电力有限公司杭州供电公司 | 一种用于多采样时间的建筑电力负荷预测方法 |
CN114356900A (zh) * | 2021-12-06 | 2022-04-15 | 南方电网科学研究院有限责任公司 | 一种电力数据异常检测方法、装置、设备及介质 |
CN114511159A (zh) * | 2022-04-20 | 2022-05-17 | 广东电网有限责任公司佛山供电局 | 基于条件变分自编码器的电力负荷概率预测方法和系统 |
CN115759343A (zh) * | 2022-10-20 | 2023-03-07 | 国网浙江省电力有限公司经济技术研究院 | 一种基于e-lstm的用户电量预测方法和装置 |
CN115658673A (zh) * | 2022-11-09 | 2023-01-31 | 国网甘肃省电力公司兰州供电公司 | 一种基于大数据建模的电力数据质量离群检测方法 |
CN115759415A (zh) * | 2022-11-16 | 2023-03-07 | 国网河南省电力公司经济技术研究院 | 基于lstm-svr的用电需求预测方法 |
CN115513951A (zh) * | 2022-11-17 | 2022-12-23 | 山东建筑大学 | 一种基于概念漂移检测的电力负荷预测方法及系统 |
CN115730845A (zh) * | 2022-11-18 | 2023-03-03 | 广东电网有限责任公司云浮供电局 | 一种电力系统动态估计方法、装置、设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116227543A (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116227543B (zh) | 用电异常的检测方法、检测装置、电子装置和电子设备 | |
Corizzo et al. | Anomaly detection and repair for accurate predictions in geo-distributed big data | |
CN116245033B (zh) | 人工智能驱动的电力系统分析方法及智能软件平台 | |
CN111915092B (zh) | 基于长短时记忆神经网络的超短期风电功率预测方法 | |
Li et al. | A novel combined prediction model for monthly mean precipitation with error correction strategy | |
CN115036922B (zh) | 一种分布式光伏发电电量预测方法及系统 | |
CN114492922A (zh) | 一种中长期发电量预测方法 | |
Kumar et al. | Wind speed prediction using deep learning-LSTM and GRU | |
Akter et al. | Analysis and prediction of hourly energy consumption based on long short-term memory neural network | |
CN117110748A (zh) | 一种基于融合终端的变电站主设备运行状态异常检测方法 | |
CN114372631A (zh) | 一种基于小样本学习和lstm的缺资料地区径流预测方法 | |
CN117421571A (zh) | 一种基于配电网的拓扑实时辨识方法及系统 | |
CN116702992A (zh) | 一种发电功率预测方法、装置、电子设备及存储介质 | |
CN115603320A (zh) | 一种基于广域量测数据的实时感知与在线评估方法及系统 | |
CN113240217A (zh) | 一种基于集成预测模型的光伏发电预测方法及装置 | |
Tangrand | Some new contributions to neural networks and wavelets with applications | |
CN113033414B (zh) | 用电数据异常检测方法、装置、计算机设备和存储介质 | |
Nizar et al. | Forecasting of temperature by using LSTM and bidirectional LSTM approach: case study in Semarang, Indonesia | |
CN117554714A (zh) | 用电异常检测方法、用电异常检测装置和电子装置 | |
Sanz-Alcaine et al. | Online voltage prediction using gaussian process regression for fault-tolerant photovoltaic standalone applications | |
CN113723670A (zh) | 变时间窗口的光伏发电功率短期预测方法 | |
Bhattacharjee et al. | Short-term solar irradiance forecasting using long short term memory variants | |
Valero et al. | Analysis of different testing parameters in self-organizing maps for short-term load demand forecasting in Spain | |
Gan et al. | Load quality analysis and forecasting for power data set on cloud platform | |
Xu et al. | Water Level Prediction Based on SSA-LSTM Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |