CN109345408A - 基于长短期记忆网络的异常数据甄别方法 - Google Patents
基于长短期记忆网络的异常数据甄别方法 Download PDFInfo
- Publication number
- CN109345408A CN109345408A CN201810966095.0A CN201810966095A CN109345408A CN 109345408 A CN109345408 A CN 109345408A CN 201810966095 A CN201810966095 A CN 201810966095A CN 109345408 A CN109345408 A CN 109345408A
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- shot
- long term
- term memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007787 long-term memory Effects 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 23
- 238000005070 sampling Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 8
- 230000005611 electricity Effects 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 4
- 238000013450 outlier detection Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007087 memory ability Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于长短期记忆网络的异常数据甄别方法,包括:(1)获取电力系统正常运行的历史数据;(2)对于所述历史电力系统正常运行的历史数据,按照下列方式滚动采样,得到多对样本和标签:获取n个连续采样点为一个序列,作为一个样本,获取该样本的下一采样点,作为该样本的标签,其中,n为正整数;(3)建立长短期记忆网络模型,并采用部分样本和标签进行训练;(4)将待检测电表的部分正常运行数据,作为训练好的网络模型的输入,将输出数据与待检测电表的实际运行数据进行比较,将误差大于预设阈值的数据点判定为异常数据点。本发明精度和准确率更高。
Description
技术领域
本发明涉及计算机数据挖掘技术,尤其涉及一种基于长短期记忆网络的异常数据甄别方法。
背景技术
随着计算机、通讯、传感器技术在电网中的广泛应用、配网运营监测业务的不断推进以及大量监测计量装置的安装部署,配变台区监测可以获得海量的检测数据,此外,营销部门通过对用电数据的采集和分析,实现了用电监控、线损分析、负荷管理等日常工作。因此,实现对这些数据的有效挖掘应用,能够进一步促进配变台区的安全经济运行,同时这也是目前配网所面临的一大挑战。
异常点检测是一项重要的数据挖掘手段,通过对异常点的检测可以有效发现电表采集数据中的潜在问题。异常数据检测在智能用电系统中起非常重要的作用,利用有效的异常检测方法可以及时地发现用电数据时间序列中的异常点,恢复电力系统正常运行时电流、电压和功率的变化规律与特征,提高数据质量,并保证对故障电表及时检测和维修。
时间序列异常点检测作为一个相对成熟的研究领域,到目前为止已经出现了诸多方法;包括聚类方法和机器学习方法等。其中聚类方法通常对极值较为敏感,且存在模型属性构建不明确等缺点。机器学习的异常点检测方法,具有良好的泛化能力,但存在参数范围不易选取、学习能力较差等问题。
发明内容
发明目的:本发明针对现有技术存在的问题,提供一种基于长短期记忆网络的异常数据甄别方法,该方法基于深度学习技术,结合了长短期记忆网络学习历史数据中时间相关性的特点,能够直接学习大量的历史数据样本信息,使得检测精度进一步提升。
技术方案:本发明所述的基于长短期记忆网络的异常数据甄别方法包括:
(1)获取电力系统正常运行的历史数据;
(2)对于所述历史电力系统正常运行的历史数据,按照下列方式滚动采样,得到多对样本和标签:获取n个连续采样点为一个序列,作为一个样本,获取该样本的下一采样点,作为该样本的标签,其中,n为正整数;
(3)建立长短期记忆网络模型,并采用部分样本和标签进行训练;
(4)将待检测电表的部分正常运行数据,作为训练好的网络模型的输入,将输出数据与待检测电表的实际运行数据进行比较,将误差大于预设阈值的数据点判定为异常数据点。
进一步的,步骤(3)之后还包括步骤:
选择测试样本,对于将步骤(3)训练后的网络模型进行测试,查看误差是否在预设范围内,若是,则判定当前网络模型已训练好,执行步骤(4),若否,则返回执行步骤(3)。
进一步的,步骤(1)中所述电力系统正常运行的历史数据具体为正常运行时的电流、电压和功率分别与时间的关系曲线数据,来源于配网运营监测业务中获取的海量数据,具体包括用户采集系统和营销系统中采集到的配变用电数据。
进一步的,步骤(3)中建立的长短期记忆网络模型由输入门、输出门、遗忘门和记忆单元构成,计算公式分别为:
输入门:it=σ(wxixt+whiht-1+bi)
输出门:ot=σ(wxoxt+whoht-1+b0)
遗忘门:ft=σ(wxfxt+whfht-1+bf)
记忆单元:ct=tanh(wxcxt+whcht-1+bc)
式中,it、ot、ft和ct分别为输入门、输出门、遗忘门和记忆单元第t步的输出;xt和ht-1分别为模型第t步输入和历史输入;wxi、whi、wxo、who、wxf、whf、wxc和whc为隐含层权值;bi、bo、bc和bf为隐含层偏置值;tanh和σ为隐含层激活函数。
进一步的,步骤(3)进行训练时,模型优化函数为带动量的随机梯度下降算法,迭代次数为400,用于训练的样本批数为512,用于验证的样本所占比为5%。
进一步的,所述测试样本包括人工添加噪声的序列数据和存在故障的序列数据。
进一步的,步骤(4)中所述预设阈值为历史实际运行数据变化幅度的5%。
有益效果:本发明与现有技术相比,其显著优点是:
本发明提供的基于长短期记忆网络的异常数据甄别方法,具有以下特点:
(1)与现有技术相比,能够学习海量历史功率、电流和电压数据的特性,其适应范围更广,泛化能力更强;
(2)将长短期记忆网络模型引入到异常数据检测领域,充分发挥对于时间序列的循环记忆能力,提升模型的检测效果;
(3)相比于传统的异常检测方法,本发明的方法检测准确率更高,适用范围更广,可以满足电力系统中多种时间序列的检测和甄别;
(4)由于检测准确性的提高,检测结果可以提供给电表厂商和运行检修人员,以及时有效地对异常电表进行故障检修及维护。
附图说明
图1是本发明的一个实施例的流程示意图;
图2为人工添加噪声的序列数据;
图3为实际存在故障的序列数据;
图4为使用本发明中方法甄别得到的异常电流点和异常功率点。
具体实施方式
本实施案例提供了一种基于长短期记忆网络的异常数据甄别方法,如图1所示,包括:
步骤1:获取电力系统正常运行的历史数据。
其中,所述电力系统正常运行的历史数据具体为正常运行时的电流、电压和功率分别与时间的关系曲线数据,来源于配网运营监测业务中获取的海量数据,具体包括用户采集系统和营销系统中采集到的配变用电数据。
步骤2:对于所述历史电力系统正常运行的历史数据,按照下列方式滚动采样,得到多对样本和标签:获取n个连续采样点为一个序列,作为一个样本,获取该样本的下一采样点,作为该样本的标签,其中,n为正整数。
步骤3:建立长短期记忆网络模型,并采用部分样本和标签进行训练。
其中,长短期记忆网络模型由输入门、输出门、遗忘门和记忆单元构成,计算公式分别为:
输入门:it=σ(wxixt+whiht-1+bi)
输出门:ot=σ(wxoxt+whoht-1+b0)
遗忘门:ft=σ(wxfxt+whfht-1+bf)
记忆单元:ct=tanh(wxcxt+whcht-1+bc)
式中,it、ot、ft和ct分别为输入门、输出门、遗忘门和记忆单元第t步的输出;xt和ht-1分别为模型第t步输入和历史输入;wxi、whi、wxo、who、wxf、whf、wxc和whc为隐含层权值;bi、bo、bc和bf为隐含层偏置值;tanh和σ为隐含层激活函数。然后,设定长短期记忆网络的模型参数,具体包括:四层模型结构,输入层、一层长短期记忆层、一层全连接层和一层输出层;四层的节点数,分别为96、8、4、1;输入数据为最近历史96点的电压、电流及功率;模型优化函数为带动量的随机梯度下降算法;迭代次数为400;训练样本批数为512;训练样本中验证集所占比为5%。
步骤4:选择测试样本,对于将步骤3训练后的网络模型进行测试,查看误差是否在预设范围内,若是,则判定当前网络模型已训练好,执行步骤5,若否,则返回执行步骤3。
其中,所述测试样本包括人工添加噪声的序列数据和存在故障的序列数据,分别如图2和图3所示。
步骤5:将待检测电表的部分正常运行数据,作为训练好的网络模型的输入,将输出数据与待检测电表的实际运行数据进行比较,将误差大于预设阈值的数据点判定为异常数据点。
其中,所述预设阈值为历史实际运行数据变化幅度的5%。通过比较输出数据与待检测电表的实际运行数据甄别出的异常点如图4所示,图4中圆点为异常点。异常点检测结果及其准确率如表1所示。
表1异常点检测结果及其准确率
以上所揭露的仅为本发明一种较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (7)
1.一种基于长短期记忆网络的异常数据甄别方法,其特征在于该方法包括:
(1)获取电力系统正常运行的历史数据;
(2)对于所述历史电力系统正常运行的历史数据,按照下列方式滚动采样,得到多对样本和标签:获取n个连续采样点为一个序列,作为一个样本,获取该样本的下一采样点,作为该样本的标签,其中,n为正整数;
(3)建立长短期记忆网络模型,并采用部分样本和标签进行训练;
(4)将待检测电表的部分正常运行数据,作为训练好的网络模型的输入,将输出数据与待检测电表的实际运行数据进行比较,将误差大于预设阈值的数据点判定为异常数据点。
2.根据权利要求1所述基于长短期记忆网络的异常数据甄别方法,其特征在于:步骤(3)之后还包括模型测试环节:
选择测试样本,对于将步骤(3)训练后的网络模型进行测试,查看误差是否在预设范围内,若是,则判定当前网络模型已训练好,执行步骤(4),若否,则返回执行步骤(3)。
3.根据权利要求1所述基于长短期记忆网络的异常数据甄别方法,其特征在于:步骤(1)中所述电力系统正常运行的历史数据具体为正常运行时的电流、电压和功率分别与时间的关系曲线数据,来源于配网运营监测业务中获取的海量数据,具体包括用户采集系统和营销系统中采集到的配变用电数据。
4.根据权利要求1所述基于长短期记忆网络的异常数据甄别方法,其特征在于:步骤(3)中建立的长短期记忆网络模型由输入门、输出门、遗忘门和记忆单元构成,计算公式分别为:
输入门:it=σ(wxixt+whiht-1+bi)
输出门:ot=σ(wxoxt+whoht-1+b0)
遗忘门:ft=σ(wxfxt+whfht-1+bf)
记忆单元:ct=tanh(wxcxt+whcht-1+bc)
式中,it、ot、ft和ct分别为输入门、输出门、遗忘门和记忆单元第t步的输出;xt和ht-1分别为模型第t步输入和历史输入;wxi、whi、wxo、who、wxf、whf、wxc和whc为隐含层权值;bi、bo、bc和bf为隐含层偏置值;tanh和σ为隐含层激活函数。
5.根据权利要求1所述基于长短期记忆网络的异常数据甄别方法,其特征在于:步骤(3)进行训练时,模型优化函数为带动量的随机梯度下降算法,迭代次数为400,用于训练的样本批数为512,用于验证的样本所占比为5%。
6.根据权利要求2所述基于长短期记忆网络的异常数据甄别方法,其特征在于:所述测试样本包括人工添加噪声的序列数据和存在故障的序列数据。
7.根据权利要求1所述基于长短期记忆网络的异常数据甄别方法,其特征在于:步骤(4)中所述预设阈值为历史实际运行数据变化幅度的5%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810966095.0A CN109345408A (zh) | 2018-08-23 | 2018-08-23 | 基于长短期记忆网络的异常数据甄别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810966095.0A CN109345408A (zh) | 2018-08-23 | 2018-08-23 | 基于长短期记忆网络的异常数据甄别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109345408A true CN109345408A (zh) | 2019-02-15 |
Family
ID=65291792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810966095.0A Pending CN109345408A (zh) | 2018-08-23 | 2018-08-23 | 基于长短期记忆网络的异常数据甄别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109345408A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119758A (zh) * | 2019-04-01 | 2019-08-13 | 全球能源互联网研究院有限公司 | 一种用电数据异常检测及模型训练方法、装置 |
CN110457906A (zh) * | 2019-08-15 | 2019-11-15 | 国家电网公司华东分部 | 一种网络安全事件智能告警方法 |
CN110659390A (zh) * | 2019-07-30 | 2020-01-07 | 广东工业大学 | 一种基于深度卷积网络的视频内容检索方法 |
CN111563524A (zh) * | 2020-03-18 | 2020-08-21 | 宁波送变电建设有限公司永耀科技分公司 | 一种多站融合系统运行态势异常监测和告警合并方法 |
CN112464848A (zh) * | 2020-12-07 | 2021-03-09 | 国网四川省电力公司电力科学研究院 | 一种基于密度空间聚类的信息流异常数据监测方法及装置 |
CN113762470A (zh) * | 2021-08-23 | 2021-12-07 | 迟源 | 预测模型构建方法、预测方法、装置、设备及介质 |
CN115391160A (zh) * | 2022-10-26 | 2022-11-25 | 北京必示科技有限公司 | 一种异常变更检测方法、装置、设备及存储介质 |
CN116383749A (zh) * | 2023-04-07 | 2023-07-04 | 北京华云星地通科技有限公司 | 一种热镜温度异常检测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106656637A (zh) * | 2017-02-24 | 2017-05-10 | 国网河南省电力公司电力科学研究院 | 一种异常检测方法及装置 |
CN107239852A (zh) * | 2017-05-05 | 2017-10-10 | 南京邮电大学 | 一种基于深度学习的电量消耗预测方法 |
-
2018
- 2018-08-23 CN CN201810966095.0A patent/CN109345408A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106656637A (zh) * | 2017-02-24 | 2017-05-10 | 国网河南省电力公司电力科学研究院 | 一种异常检测方法及装置 |
CN107239852A (zh) * | 2017-05-05 | 2017-10-10 | 南京邮电大学 | 一种基于深度学习的电量消耗预测方法 |
Non-Patent Citations (1)
Title |
---|
LUKAS MAUCH等: "A NEW APPROACH FOR SUPERVISED POWER DISAGGREGATION BY USING A DEEP RECURRENT LSTM NETWORK", 《2015 IEEE GLOBAL CONFERENCE ON SIGNAL AND INFORMATION PROCESSING (GLOBALSIP)》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119758A (zh) * | 2019-04-01 | 2019-08-13 | 全球能源互联网研究院有限公司 | 一种用电数据异常检测及模型训练方法、装置 |
CN110659390A (zh) * | 2019-07-30 | 2020-01-07 | 广东工业大学 | 一种基于深度卷积网络的视频内容检索方法 |
CN110457906A (zh) * | 2019-08-15 | 2019-11-15 | 国家电网公司华东分部 | 一种网络安全事件智能告警方法 |
CN110457906B (zh) * | 2019-08-15 | 2023-03-31 | 国家电网公司华东分部 | 一种网络安全事件智能告警方法 |
CN111563524A (zh) * | 2020-03-18 | 2020-08-21 | 宁波送变电建设有限公司永耀科技分公司 | 一种多站融合系统运行态势异常监测和告警合并方法 |
CN112464848A (zh) * | 2020-12-07 | 2021-03-09 | 国网四川省电力公司电力科学研究院 | 一种基于密度空间聚类的信息流异常数据监测方法及装置 |
CN112464848B (zh) * | 2020-12-07 | 2023-04-07 | 国网四川省电力公司电力科学研究院 | 一种基于密度空间聚类的信息流异常数据监测方法及装置 |
CN113762470A (zh) * | 2021-08-23 | 2021-12-07 | 迟源 | 预测模型构建方法、预测方法、装置、设备及介质 |
CN115391160A (zh) * | 2022-10-26 | 2022-11-25 | 北京必示科技有限公司 | 一种异常变更检测方法、装置、设备及存储介质 |
CN116383749A (zh) * | 2023-04-07 | 2023-07-04 | 北京华云星地通科技有限公司 | 一种热镜温度异常检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109345408A (zh) | 基于长短期记忆网络的异常数据甄别方法 | |
CN111612651B (zh) | 一种基于长短期记忆网络的异常电量数据检测方法 | |
Mohamed et al. | History matching and uncertainty quantification: multiobjective particle swarm optimisation approach | |
CN107967485A (zh) | 用电计量设备故障分析方法及装置 | |
CN104317681A (zh) | 针对计算机系统的行为异常自动检测方法及检测系统 | |
CN108733966A (zh) | 一种基于决策树群的多维电能表现场状态检验方法 | |
CN105846780A (zh) | 一种基于决策树模型的光伏组件故障诊断方法 | |
CN111861211A (zh) | 一种具有双层反窃电模型的系统 | |
CN104598968A (zh) | 变压器故障诊断方法 | |
CN112036042A (zh) | 一种基于变分模态分解的动力设备异常检测方法及系统 | |
CN112149873A (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN104166718A (zh) | 一种适用于大电网的不良数据检测与辨识方法 | |
da Penha et al. | Fusing light and temperature data for fire detection | |
CN115237717A (zh) | 一种微服务异常检测方法和系统 | |
Cui et al. | An optimized swinging door algorithm for wind power ramp event detection | |
CN113988210A (zh) | 结构监测传感网失真数据修复方法、装置及存储介质 | |
Zhang et al. | Cleaning environmental sensing data streams based on individual sensor reliability | |
CN101237357B (zh) | 工业无线传感器网络故障在线检测方法 | |
CN104898039B (zh) | 基于故障传播概率模型的故障模式优选方法 | |
CN107689015A (zh) | 一种改进的电力系统不良数据辨识方法 | |
Frank et al. | Extracting operating modes from building electrical load data | |
CN111080484A (zh) | 一种配电网异常数据监测方法及装置 | |
CN112801426B (zh) | 一种基于关联参数挖掘的工业过程故障融合预测方法 | |
CN207992717U (zh) | 一种水电站闸门在线状态监测系统 | |
Lin et al. | On-line monitoring and fault diagnosis of PV array based on BP neural network optimized by genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190215 |