CN113284002A - 用电数据异常检测方法、装置、计算机设备和存储介质 - Google Patents
用电数据异常检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113284002A CN113284002A CN202110383704.1A CN202110383704A CN113284002A CN 113284002 A CN113284002 A CN 113284002A CN 202110383704 A CN202110383704 A CN 202110383704A CN 113284002 A CN113284002 A CN 113284002A
- Authority
- CN
- China
- Prior art keywords
- data
- abnormal
- electricity utilization
- electricity
- utilization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 147
- 230000005611 electricity Effects 0.000 claims abstract description 255
- 230000002159 abnormal effect Effects 0.000 claims abstract description 176
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000004590 computer program Methods 0.000 claims description 25
- 230000005856 abnormality Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 230000000694 effects Effects 0.000 abstract description 3
- 230000001960 triggered effect Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000003287 bathing Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种用电数据异常检测方法、装置、计算机设备和存储介质,方法包括:获取用电数据序列;将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态;本申请通过预先构建的用电预测模型对用电数据序列进行识别处理,得到用电预测数据,根据预测数据与真实数据间的差值识别出是否为异常数据,当异常数据达到预设条件时,触发异常检测结果的生成,实现了无需人工对特征进行标注就能够对异常用电数据进行检测的效果,提高了用电数据异常检测的效率。
Description
技术领域
本申请涉及电力技术领域,特别是涉及一种用电数据异常检测方法、装置、计算机设备和存储介质。
背景技术
随着机器学习理论的发展,学者和从业人员逐渐将机器学习技术应用到用电数据异常检测任务中。
目前,由于用电数据存在漂移、波动等特性,人工设计特征模型越来越困难,且不同行业用电的时序特性差别很大,采用统一的距离度量方式和相似性度量方式的无监督学习方法适用范围非常有限,导致现有的用电数据异常检测方法的检测效率还较低。
因此,还需要一种能够提高检测效率的用电数据异常检测方法。
发明内容
基于此,有必要针对上述技术问题,提供一种用电数据异常检测方法、装置、计算机设备和存储介质。
一种用电数据异常检测方法,所述方法包括:
获取用电数据序列;
将所述用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
确定所述用电预测数据与所述用电真实数据之间的差值,若所述差值大于预设阈值,则将所述用电真实数据识别为候选异常数据;
当所述候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
在其中一个实施例中,在获取用电数据序列之前,还包括:
响应于终端发送的用电数据异常检测请求,获取与所述用电数据异常检测请求对应的用电检测数据以及用电约束信息;所述用电约束信息用于表征影响所述用电检测数据变化的条件因素。
在其中一个实施例中,所述获取用电数据序列,包括:对所述用电检测数据进行预处理;将预处理后的用电检测数据与所述用电约束信息以向量形式进行拼接,得到所述用电数据序列。
在其中一个实施例中,所述对所述用电检测数据进行预处理,包括:对所述用电检测数据进行标准化处理,得到预设取值范围内的用电检测数据;去除所述预设取值范围内的用电检测数据中的离群点后,得到所述预处理后的用电检测数据。
在其中一个实施例中,所述预先构建的用电预测模型通过以下方式获得,包括:获取样本用电数据集;基于所述样本用电数据集,对由限制玻尔兹曼机为基础单元构建的预测模型进行训练,当所述预测模型达到训练次数时得到所述预先构建的用电预测模型。
在其中一个实施例中,所述确定所述用电预测数据与所述用电真实数据之间的差值,包括:获取所述用电预测数据与所述用电真实数据的欧式距离,作为所述用电预测数据与所述用电真实数据之间的差值。
在其中一个实施例中,所述当所述候选异常数据达到预设异常条件时,包括:将所述候选异常数据输入时序异常聚类模型,得到所述时序异常聚类模型输出的时序异常聚类结果;当所述时序异常聚类结果达到预设累计值时,确认达到所述预设异常条件。
一种用电数据异常检测装置,所述装置包括:
用电数据获取模块,用于获取用电数据序列;
预测数据获取模块,用于将所述用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
异常数据识别模块,用于确定所述用电预测数据与所述用电真实数据之间的差值,若所述差值大于预设阈值,则将所述用电真实数据识别为候选异常数据;
异常状态识别模块,用于当所述候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用电数据序列;将所述用电数据序列输入预先构建的用电预测模型,得到用电预测数据;确定所述用电预测数据与所述用电真实数据之间的差值,若所述差值大于预设阈值,则将所述用电真实数据识别为候选异常数据;当所述候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取用电数据序列;将所述用电数据序列输入预先构建的用电预测模型,得到用电预测数据;确定所述用电预测数据与所述用电真实数据之间的差值,若所述差值大于预设阈值,则将所述用电真实数据识别为候选异常数据;当所述候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
上述用电数据异常检测方法、装置、计算机设备和存储介质,方法包括:获取用电数据序列;将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态;本申请通过预先构建的用电预测模型对用电数据序列进行识别处理,得到用电预测数据,根据预测数据与真实数据间的差值识别出是否为异常数据,当异常数据达到预设条件时,触发异常检测结果的生成,实现了无需人工对特征进行标注就能够对异常用电数据进行检测的效果,提高了用电数据异常检测的效率。
附图说明
图1为一个实施例中用电数据异常检测方法的应用环境图;
图2为一个实施例中用电数据异常检测方法的流程示意图;
图3为一个实施例中获取用电数据序列步骤的流程示意图;
图4为一个实施例中对用电检测数据进行预处理步骤的流程示意图;
图5为一个实施例中预先构建用电预测模型通方法的流程示意图;
图6为一个实施例中用电数据异常检测装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的用电数据异常检测方法,可以应用于如图1所示的应用环境中。其中,终端11通过网络与服务器12进行通信。服务器12获取终端11通过网络发送的用电数据序列;服务器12将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;服务器12确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;服务器12当检测到候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态,并将该用电数据异常检测结果发送给终端11。
其中,终端11可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器12可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种用电数据异常检测方法,以该方法应用于图1中的服务器12为例进行说明,包括以下步骤:
步骤21,获取用电数据序列。
其中,用电数据序列是指经过预先处理能够被服务器识别的,与用电数据相关的数据;用电数据序列中还包括一些能够影响用电数据变化情况的约束信息,例如节假日信息、天气状况、季节因素等。
具体地,服务器接收终端发送的用电数据,对用电数据进行离群点去除、插值计算等预处理,构建得到可以被模型识别,并且应用于模型训练的用电数据;再获取与用电数据相关的节假日信息、天气信息、季节信息等环境影响因素,处理为可以被识别的数据后与用电数据进行融合,得到用电数据序列。
本步骤服务器通过接收用电相关数据,经过预处理后得到可以被识别的用电数据序列,提高了用电数据的处理效率以及用电数据异常检测的效率。
步骤22,将用电数据序列输入预先构建的用电预测模型,得到用电预测数据。
其中,预先构建的用电预测模型是指经过训练能够对某一指定时刻用电情况进行预测的神经网络模型;预先构建的用电预测模型能够根据输入的用电数据序列进行识别、预测处理,得到与用电数据序列相对应的用电预测数据;用电预测数据是指预先构建的用电预测模型对用电数据序列进行识别、处理后的得到的结果。
具体地,服务器将获取到的用电数据序列输入预先构建的用电预测模型,在预先构建的用电预测模型处理完成后,服务器得到预先构建的用电预测模型出书的结果作为用电预测数据。
本步骤通过预先构建的用电预测模型对用电数据序列进行处理,得到相对应的用电预测数据,该用电预测数据能够反映出用电数据序列在后续时刻的变化趋势,根据变化趋势可以判断用电数据是否趋于异常,以实现对用电数据异常情况的预先检测;同时预先构建的用电预测模型能够对数据进行识别和处理,无需人工对特征进行标注,节省人力同时提高了用电数据异常检测的效率。
步骤23,确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据。
其中,用电真实数据是与用电预测数据同一时刻采集得到的真实用电数据;用电预测数据与用电真实数据之间的差值是指预测数据和真实数据之间的差值绝对值;由于用电异常预测数据是某个时刻所对应的数据,不能够直接反应未来一段时间的完整变化趋势,以做出异常的判断,因此需要将该超过预设阈值的用电真实数据作为候选异常数据,再根据候选异常数据的持续情况或者数量情况等做出进一步判断。
具体地,服务器获取与用电预测数据对应于同一时刻的实时用电数据作为用电真实数据,计算两个数据之间差值的绝对值;服务器获取相应的预设阈值,通过将差值绝对值与预设阈值比较判断出该用电真实数据是否为候选异常数据,若差值的绝对值大于预设阈值,则识别用电真实数据为候选异常数据,若值的绝对值小于等于预设阈值,则将用电真实数据识别为正常用电数据。
例如,用电预测数据为Pret,而该时刻用电真实数据Truet是存在且可以被获取到的;设置预设阈值a,然后可以通过计算用电预测数据和用电真实数据之间的欧式距离对候选异常数据进行识别:
Distance=||Pret-Truet||2;
若用电预测数据和用电真实数据之间的欧式距离大于a,那么用电真实数据则被识别为候选异常数据。
本步骤服务器通过用电预测数据与用电真实数据之间的差值大小,对用电真实数据进行候选异常数据的识别,对候选异常数据进行以做出准确度较高的用电数据异常检测;同时无需人工对特征进行标注,就能够对异常用电数据进行检测,提高了用电数据异常检测的效率。
步骤24,当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
其中,预设异常条件是指是否将用电数据异常检测结果识别为异常状态的判断条件;预设异常条件可以有多种类型,例如预设异常条件是时间条件时,假设条件为持续时间为5秒钟,则当候选异常数据持续5秒连续出现时,会将当前的用电数据异常检测结果确定为异常状态;再例如预设异常条件是数量条件时,假设条件为预设时长范围内出现次数达到10次,则当候选异常数据在预设时长范围内累计达到10次时,确定当前用电数据异常检测结果为异常状态。
具体地,服务器会将被识别的候选异常数据进行累计、判断等与预设异常条件有关的操作,并判断是否达到预设异常条件;当达到预设异常条件时,确定当前用电数据异常检测结果为异常状态,并向预先设定的终端设备、装置或者相关人员等发送预警信息。
本步骤通过为候选浴场数据设定预设异常条件,避免了数据突变或错误数据而造成的错误识别,通过预设异常条件提高了浴场监测的精度和鲁棒性。
上述用电数据异常检测方法、装置、计算机设备和存储介质,方法包括:获取用电数据序列;将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态;本申请通过预先构建的用电预测模型对用电数据序列进行识别处理,得到用电预测数据,根据预测数据与真实数据间的差值识别出是否为异常数据,当异常数据达到预设条件时,触发异常检测结果的生成,实现了无需人工对特征进行标注就能够对异常用电数据进行检测的效果,提高了用电数据异常检测的效率。
在一个实施例中,上述步骤21,在获取用电数据序列之前,还包括:响应于终端发送的用电数据异常检测请求,获取与用电数据异常检测请求对应的用电检测数据以及用电约束信息;用电约束信息用于表征影响用电检测数据变化的条件因素。
其中,用电约束信息是指例如节假日、天气、气温等能够影响用电检测数据变化的环境因素;用电检测数据是指从用电设备中采集、汇总、检测等方式直接得到的用电数据。用电数据异常检测请求是指终端发送的携带有时间信息、检测对象信息等的请求,服务器可以根据该请求识别出完成该请求需要获取的数据、预测进行的方式等。
具体地,服务器接收到终端发送的用电数据异常检测请求,对该请求进行解析,根据解析结果获取与用电数据异常检测请求对应的用电检测数据以及用电约束信息。
本实施例服务器通过响应终端发送的用电数据异常检测请求,实现对数据的获取以及检测目标对象的确定,提高了用电数据异常检测的效率。
在一个实施例中,如图3所示,上述步骤21,获取用电数据序列,包括:
步骤31,对用电检测数据进行预处理;
步骤32,将预处理后的用电检测数据与用电约束信息以向量形式进行拼接,得到用电数据序列。
具体地,服务器将天气状况、季节、节假日信息编码为向量形式拼接到经过预处理后的用电检测数据中,即得到用电数据序列;各序列的长度可根据用电检测时间的时间单位进行调整,具体可根据实际情况进行选择。
本实施例中,服务器通过对用电检测数据进行预处理能够去除离群点数据保证数据之间的相对统一,并且通过预处理能够统一数据的取值范围,使得模型的处理效率提高。
在一个实施例中,如图4所示,上述步骤31,对用电检测数据进行预处理,包括:
步骤41,对用电检测数据进行标准化处理,得到预设取值范围内的用电检测数据;
步骤42,去除预设取值范围内的用电检测数据中的离群点后,得到预处理后的用电检测数据。
具体地,服务器服首先对用电检测数据进行归一化,统一用电检测数据的取值范围至例如区间[0,1]内,然后以固定时间单位例如以7天为单位将数据划分为多个连续的数据块,筛选出数据中明显的离群点数据并进行去除,完成对用电检测数据的预处理。
本实施例中,服务器通过对用电检测数据进行预处理能够去除离群点数据保证数据之间的相对统一,并且通过预处理能够统一数据的取值范围,使得模型的处理效率提高。
在一个实施例中,如图5所示,上述步骤22,预先构建的用电预测模型通过以下方式获得,包括:
步骤51,获取样本用电数据集;
步骤52,基于样本用电数据集,对由限制玻尔兹曼机为基础单元构建的预测模型进行训练,当预测模型达到训练次数时得到预先构建的用电预测模型。
其中,样本用电数据集是预先处理好的能够对模型进行训练的数据;样本用电数据集中的数据预先标注了正常的用电数据以及部分异常的用电数据,通过这些数据能够对模型进行训练;训练次数是指预先规定好的预测模型能够用于识别预测的训练迭代次数。
具体地,服务于将样本用电数据集中正常的用电数据作为训练数据,将一个时序的实值RBM(Restricted Boltzmann Machine,限制玻尔兹曼机)模型作为待训练的预测模型;由于正常用电的数据服从具有一定的分布特性,这种分布特性可以建模为参数化高斯分布的形式,得到预测模型的联合概率函数:
其中,T表示总时间片长度,t表示当前时间片,h表示隐藏层变量,v表示可视层变量;p表示条件概率。
进一步地,预测模型的条件激活函数可以表示为:
其中,上标S表示转置,t表示当前时间片,σ和β表示对角矩阵,h表示隐藏层变量,v表示可视层变量,Z表示配分函数,W表示权重矩阵,b表示偏置,h和v的激活可以使用参数化的高斯分布的形式来表示,模型根据极大似然估计来训练:
其中,T表示总时间片,p表示条件概率,v表示可视层变量,模型可以通过近似的对比散度算法来训练,经充分训练后,得到预先构建的用电预测模型。
本实施例根据样本用电数据集中正常的用电数据训练由限制玻尔兹曼机为基础单元构建的预测模型,预测模型学习正常的用电数据的时序特征并将其参数化为高斯分布的形式,对于传递进来的可能的异常数据,则可以通过用电预测数据与用电真实数据之间的欧式距离,作为差值来检查用电真实数据是否为候选异常数据。
在一个实施例中,上述步骤24,当候选异常数据达到预设异常条件时,包括:将候选异常数据输入时序异常聚类模型,得到时序异常聚类模型输出的时序异常聚类结果;当时序异常聚类结果达到预设累计值时,确认达到预设异常条件。
具体地,可以使用半监督的时间序列分析模型(Time-Seq-Model)作为时序异常聚类模型,识别处理并输出的时序异常聚类结果。例如连续3个时间片被判断数据为异常数据,那么上报异常;再例如该用户出现超过7次的异常聚类结果,那么也进行异常上报。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种用电数据异常检测装置,包括:用电数据获取模块61、预测数据获取模块62、异常数据识别模块63和异常状态识别模块64,其中:
用电数据获取模块61,用于获取用电数据序列;
预测数据获取模块62,将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
异常数据识别模块63,确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;
异常状态识别模块64,当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
在一个实施例中,用电数据异常检测装置中还包括异常检测请求相应模块,用于响应于终端发送的用电数据异常检测请求,获取与用电数据异常检测请求对应的用电检测数据以及用电约束信息;用电约束信息用于表征影响用电检测数据变化的条件因素。
在一个实施例中,用电数据获取模块61,还用于对用电检测数据进行预处理;将预处理后的用电检测数据与用电约束信息以向量形式进行拼接,得到用电数据序列。
在一个实施例中,用电数据获取模块61,还用于对用电检测数据进行标准化处理,得到预设取值范围内的用电检测数据;去除预设取值范围内的用电检测数据中的离群点后,得到预处理后的用电检测数据。
在一个实施例中,用电数据异常检测装置中还包括用电预测模型构建模块,用于获取样本用电数据集;基于样本用电数据集,对由限制玻尔兹曼机为基础单元构建的预测模型进行训练,当预测模型达到训练次数时得到预先构建的用电预测模型。
在一个实施例中,异常数据识别模块63,还用于获取用电预测数据与用电真实数据的欧式距离,作为用电预测数据与用电真实数据之间的差值。
在一个实施例中,异常状态识别模块64,还用于将候选异常数据输入时序异常聚类模型,得到时序异常聚类模型输出的时序异常聚类结果;当时序异常聚类结果达到预设累计值时,确认达到预设异常条件。
关于用电数据异常检测装置的具体限定可以参见上文中对于用电数据异常检测方法的限定,在此不再赘述。上述用电数据异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用电数据异常检测数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用电数据异常检测方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取用电数据序列;
将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;
当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:响应于终端发送的用电数据异常检测请求,获取与用电数据异常检测请求对应的用电检测数据以及用电约束信息;用电约束信息用于表征影响用电检测数据变化的条件因素。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对用电检测数据进行预处理;将预处理后的用电检测数据与用电约束信息以向量形式进行拼接,得到用电数据序列。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对用电检测数据进行标准化处理,得到预设取值范围内的用电检测数据;去除预设取值范围内的用电检测数据中的离群点后,得到预处理后的用电检测数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取样本用电数据集;基于样本用电数据集,对由限制玻尔兹曼机为基础单元构建的预测模型进行训练,当预测模型达到训练次数时得到预先构建的用电预测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取用电预测数据与用电真实数据的欧式距离,作为用电预测数据与用电真实数据之间的差值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将候选异常数据输入时序异常聚类模型,得到时序异常聚类模型输出的时序异常聚类结果;当时序异常聚类结果达到预设累计值时,确认达到预设异常条件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取用电数据序列;
将用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
确定用电预测数据与用电真实数据之间的差值,若差值大于预设阈值,则将用电真实数据识别为候选异常数据;
当候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:响应于终端发送的用电数据异常检测请求,获取与用电数据异常检测请求对应的用电检测数据以及用电约束信息;用电约束信息用于表征影响用电检测数据变化的条件因素。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对用电检测数据进行预处理;将预处理后的用电检测数据与用电约束信息以向量形式进行拼接,得到用电数据序列。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对用电检测数据进行标准化处理,得到预设取值范围内的用电检测数据;去除预设取值范围内的用电检测数据中的离群点后,得到预处理后的用电检测数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取样本用电数据集;基于样本用电数据集,对由限制玻尔兹曼机为基础单元构建的预测模型进行训练,当预测模型达到训练次数时得到预先构建的用电预测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取用电预测数据与用电真实数据的欧式距离,作为用电预测数据与用电真实数据之间的差值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:将候选异常数据输入时序异常聚类模型,得到时序异常聚类模型输出的时序异常聚类结果;当时序异常聚类结果达到预设累计值时,确认达到预设异常条件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上各个实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种用电数据异常检测方法,其特征在于,所述方法包括:
获取用电数据序列;
将所述用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
确定所述用电预测数据与用电真实数据之间的差值,若所述差值大于预设阈值,则将所述用电真实数据识别为候选异常数据;
当所述候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
2.根据权利要求1所述的方法,其特征在于,在获取用电数据序列之前,还包括:
响应于终端发送的用电数据异常检测请求,获取与所述用电数据异常检测请求对应的用电检测数据以及用电约束信息;所述用电约束信息用于表征影响所述用电检测数据变化的条件因素。
3.根据权利要求1所述的方法,其特征在于,所述获取用电数据序列,包括:
对所述用电检测数据进行预处理;
将预处理后的用电检测数据与所述用电约束信息以向量形式进行拼接,得到所述用电数据序列。
4.根据权利要求3所述的方法,其特征在于,所述对所述用电检测数据进行预处理,包括:
对所述用电检测数据进行标准化处理,得到预设取值范围内的用电检测数据;
去除所述预设取值范围内的用电检测数据中的离群点后,得到所述预处理后的用电检测数据。
5.根据权利要求1所述的方法,其特征在于,所述预先构建的用电预测模型通过以下方式获得,包括:
获取样本用电数据集;
基于所述样本用电数据集,对由限制玻尔兹曼机为基础单元构建的预测模型进行训练,当所述预测模型达到训练次数时得到所述预先构建的用电预测模型。
6.根据权利要求1所述的方法,其特征在于,所述确定所述用电预测数据与所述用电真实数据之间的差值,包括:
获取所述用电预测数据与所述用电真实数据的欧式距离,作为所述用电预测数据与所述用电真实数据之间的差值。
7.根据权利要求1所述的方法,其特征在于,所述当所述候选异常数据达到预设异常条件时,包括:
将所述候选异常数据输入时序异常聚类模型,得到所述时序异常聚类模型输出的时序异常聚类结果;
当所述时序异常聚类结果达到预设累计值时,确认达到所述预设异常条件。
8.一种用电数据异常检测装置,其特征在于,所述装置包括:
用电数据获取模块,用于获取用电数据序列;
预测数据获取模块,用于将所述用电数据序列输入预先构建的用电预测模型,得到用电预测数据;
异常数据识别模块,用于确定所述用电预测数据与所述用电真实数据之间的差值,若所述差值大于预设阈值,则将所述用电真实数据识别为候选异常数据;
异常状态识别模块,用于当所述候选异常数据达到预设异常条件时,确定当前用电数据异常检测结果为异常状态。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110383704.1A CN113284002A (zh) | 2021-04-09 | 2021-04-09 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110383704.1A CN113284002A (zh) | 2021-04-09 | 2021-04-09 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113284002A true CN113284002A (zh) | 2021-08-20 |
Family
ID=77276437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110383704.1A Pending CN113284002A (zh) | 2021-04-09 | 2021-04-09 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113284002A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113917263A (zh) * | 2021-10-09 | 2022-01-11 | 乐创达投资(广东)有限公司 | 一种基于预测数据的异常能耗二次监测的方法及系统 |
CN114157486A (zh) * | 2021-12-03 | 2022-03-08 | 上海斗象信息科技有限公司 | 通信流量数据异常检测方法、装置、电子设备及存储介质 |
CN114880384A (zh) * | 2022-07-11 | 2022-08-09 | 杭州宇谷科技有限公司 | 一种无监督二轮电动车充电时序异常检测方法及系统 |
CN116227543A (zh) * | 2023-05-09 | 2023-06-06 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN116738049A (zh) * | 2023-06-13 | 2023-09-12 | 湖北华中电力科技开发有限责任公司 | 基于大数据技术的用电监测系统、方法、装置和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119758A (zh) * | 2019-04-01 | 2019-08-13 | 全球能源互联网研究院有限公司 | 一种用电数据异常检测及模型训练方法、装置 |
CN111178645A (zh) * | 2020-04-14 | 2020-05-19 | 深圳市朝阳辉电气设备有限公司 | 电力设备异常检测方法、装置、控制设备及存储介质 |
US20200233021A1 (en) * | 2018-03-29 | 2020-07-23 | Tsinghua University | Method and device for detecting electricity theft, and computer readable medium |
CN111737249A (zh) * | 2020-08-24 | 2020-10-02 | 国网浙江省电力有限公司 | 基于Lasso算法的异常数据检测方法及装置 |
-
2021
- 2021-04-09 CN CN202110383704.1A patent/CN113284002A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200233021A1 (en) * | 2018-03-29 | 2020-07-23 | Tsinghua University | Method and device for detecting electricity theft, and computer readable medium |
CN110119758A (zh) * | 2019-04-01 | 2019-08-13 | 全球能源互联网研究院有限公司 | 一种用电数据异常检测及模型训练方法、装置 |
CN111178645A (zh) * | 2020-04-14 | 2020-05-19 | 深圳市朝阳辉电气设备有限公司 | 电力设备异常检测方法、装置、控制设备及存储介质 |
CN111737249A (zh) * | 2020-08-24 | 2020-10-02 | 国网浙江省电力有限公司 | 基于Lasso算法的异常数据检测方法及装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113917263A (zh) * | 2021-10-09 | 2022-01-11 | 乐创达投资(广东)有限公司 | 一种基于预测数据的异常能耗二次监测的方法及系统 |
CN113917263B (zh) * | 2021-10-09 | 2022-05-24 | 乐创达投资(广东)有限公司 | 一种基于预测数据的异常能耗二次监测的方法及系统 |
CN114157486A (zh) * | 2021-12-03 | 2022-03-08 | 上海斗象信息科技有限公司 | 通信流量数据异常检测方法、装置、电子设备及存储介质 |
CN114880384A (zh) * | 2022-07-11 | 2022-08-09 | 杭州宇谷科技有限公司 | 一种无监督二轮电动车充电时序异常检测方法及系统 |
CN116227543A (zh) * | 2023-05-09 | 2023-06-06 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN116227543B (zh) * | 2023-05-09 | 2023-08-04 | 南方电网科学研究院有限责任公司 | 用电异常的检测方法、检测装置、电子装置和电子设备 |
CN116738049A (zh) * | 2023-06-13 | 2023-09-12 | 湖北华中电力科技开发有限责任公司 | 基于大数据技术的用电监测系统、方法、装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111210024B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN113284002A (zh) | 用电数据异常检测方法、装置、计算机设备和存储介质 | |
CN111950329A (zh) | 目标检测及模型训练方法、装置、计算机设备和存储介质 | |
Lai et al. | Online pattern matching and prediction of incoming alarm floods | |
CN113093985B (zh) | 传感器数据链路异常检测方法、装置和计算机设备 | |
CN113705685B (zh) | 疾病特征识别模型训练、疾病特征识别方法、装置及设备 | |
US20140188778A1 (en) | Computer-Implemented System for Detecting Anomaly Conditions in a Fleet of Assets and Method of Using the Same | |
CN113328908B (zh) | 异常数据的检测方法、装置、计算机设备和存储介质 | |
CN113326177B (zh) | 一种指标异常检测方法、装置、设备及存储介质 | |
JP6971514B1 (ja) | 情報処理装置、情報処理方法及びプログラム | |
KR20190001781A (ko) | 비정상 상황 검출 방법 및 이를 수행하기 위한 시스템 | |
CN110858072B (zh) | 设备运行状态的确定方法及装置 | |
CN113986674A (zh) | 时序数据的异常检测方法、装置和电子设备 | |
CN113723861A (zh) | 异常用电行为检测方法、装置、计算机设备和存储介质 | |
CN113110961B (zh) | 设备异常检测方法、装置、计算机设备及可读存储介质 | |
Huang et al. | A cosine-based correlation information entropy approach for building automatic fault detection baseline construction | |
Ding et al. | Health assessment and fault classification for hydraulic pump based on LR and softmax regression | |
CN117234844A (zh) | 云服务器异常管理方法、装置、计算机设备及存储介质 | |
CN113689020A (zh) | 业务信息预测方法、装置、计算机设备和存储介质 | |
CN117056842A (zh) | 构建设备异常监测模型的方法、装置、设备、介质及产品 | |
CN113033894B (zh) | 日用电量预测方法、装置、计算机设备和存储介质 | |
US20220269991A1 (en) | Evaluating reliability of artificial intelligence | |
CN113033414A (zh) | 用电数据异常检测方法、装置、计算机设备和存储介质 | |
Kotti | Industrial Automation with Safety Aspects using Machine Learning Techniques | |
US20240353818A1 (en) | Context discovery system and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210820 |
|
RJ01 | Rejection of invention patent application after publication |