CN111666276A - 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法 - Google Patents

一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法 Download PDF

Info

Publication number
CN111666276A
CN111666276A CN202010528176.XA CN202010528176A CN111666276A CN 111666276 A CN111666276 A CN 111666276A CN 202010528176 A CN202010528176 A CN 202010528176A CN 111666276 A CN111666276 A CN 111666276A
Authority
CN
China
Prior art keywords
data
power load
abnormal
historical
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010528176.XA
Other languages
English (en)
Inventor
周浩
胡炳谦
顾一峰
韩俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Ieslab Energy Technology Co ltd
Original Assignee
Shanghai Ieslab Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Ieslab Energy Technology Co ltd filed Critical Shanghai Ieslab Energy Technology Co ltd
Priority to CN202010528176.XA priority Critical patent/CN111666276A/zh
Publication of CN111666276A publication Critical patent/CN111666276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Operations Research (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

由于实际生产生活中的用电不规律性(例如突发事件造成的用电高峰或低谷,监测系统故障等),经常会出现监测值背离实际情况或者不符合电力预测对象普遍用电规律的情况。在电力负荷预测中纳入这类异常的数值将会大大的降低电力负荷预测模型的训练效果,进而降低电力负荷预测结果的准确性,通过相应的数学统计的方式分析以及处理原始的电力负荷历史数据,保证用于电力负荷预测的负荷历史数据的有效性已经成为电力负荷预测中的一个重要研究课题。本发明公开了一种电力负荷预测中对历史负荷数据应用孤立森林算法剔除异常数据处理的方法,达到剔除电力系统运行中产生的异常历史电力负荷数据的目的。

Description

一种电力负荷预测中应用孤立森林算法剔除异常数据处理的 方法
技术领域
本发明涉及电力负荷预测技术领域,具体涉及一种电力负荷预测中对历史负荷数据中应用孤立森林算法剔除异常数据处理的方法。
背景技术
电力负荷预测在电力系统运营中起到决定性的作用,对电力负荷的准确预测是保证电力系统安全,经济运行和实现电网科学管理及调度的重要基础, 又是电力能源管理系统的核心组成部分,也是今后进行电网商业化运营的前提条件。 在电力负荷预测中,指定单位的历史负荷数据通常是进行预测计算,模拟的重要基础数据。 电力负荷预测通常会在考虑一些重要的系统 运行特性, 自然条件下, 研究或利用一系列数学方法, 找到历史数据之间特有的联系,在 满足一定精度的意义下,进而确定未来某特定时刻或某些特定时刻的电力负荷数值。由此 可见,电力历史负荷数据在电力负荷预测中十分关键,在电力预测数据分析,预测模型中都 会起到重要作用。但是,由于实际生产生活中的用电不规律性(例如突发事件造成的用电高峰或低谷,监测系统故障等),经常会出现监测值背离实际情况或者不符合电力预测对象普遍用电规律的 情况。在电力负荷预测中纳入这类异常的数值将会大大的降低电力负荷预测模型的训练效果,进而降低电力负荷预测结果的准确性。通过相应的数学统计的方式分析以及处理原始 的电力负荷历史数据,保证用于电力负荷预测的负荷历史数据的有效性已经成为电力负荷 预测中的一个重要研究课题。本发明公开了一种电力负荷预测中对历史负荷数据应用孤立森林算法剔除异常数据处理的方法,达到剔除电力系统运行中产生的异常历史电力负荷数据的目的。
发明内容
本发明提出了一种基于孤立森林算法对大量电力负荷历 史数据的异常数据筛选和去噪处理的方法, 其特点在于包括了孤立森林算法剔除极大异常数据以及线性插值恢复剔除数据两大功能模块,
孤立森林是用于异常检测的机器学习算法。这是一种无监督学习算法,通过隔离数据中的离群值识别异常。孤立森林是基于决策树的算法。从给定的特征集合中随机选择特征,然后在特征的最大值和最小值间随机选择一个分割值,来隔离离群值。这种特征的随机划分会使异常数据点在树中生成的路径更短,从而将它们和其他数据分开。一般而言,异常检测的第一步是构造「正常」内容,然后报告任何不能视为正常的异常内容。但孤立森林算法不同于这一原理,首先它不会定义「正常」行为,而且也没有计算基于点的距离。孤立森林不通过显式地隔离异常,它隔离了数据集中的异常点。孤立森林的原理是:异常值是少量且不同的观测值,因此更易于识别。孤立森林集成了孤立树,在给定的数据点中隔离异常值。隔离的异常值被标注并且立即剔除并由下一步骤补充相应的数据。孤立森林算法主要针对的是连续型结构化数据中的异常点。使用孤立森林的前提是,将异常点定义为那些 “容易被孤立的离群点” —— 可以理解为分布稀疏,且距离高密度群体较远的点。从统计学来看,在数据空间里,若一个区域内只有分布稀疏的点,表示数据点落在此区域的概率很低,因此可以认为这些区域的点是异常的;线性插值方法应用于恢复对前两步数据处理中被剔除的数据,通过被剔除数据时 间序列前后的数据来计算线性插值,最大程度的拟合模拟被剔除数据的实际值,进而一定程度上恢复被剔除的数据。
处理前的原始数据及处理后的应用数据将进行单因素方差分析(one way-ANOVA),计算两组数据间显著性差异值,需要保证两组数据间没有显著性差异。如果两组数据验证后存在显著性差异,则需要调整步孤立森林算法中具体限制性参数的选择,减少对原始数据剔除极大差异值的数量以及降低去噪处理的程度以确保处理后的数据与原始数据不存在显著性差异,处理后的数据保持有效性。实际收集到的电力负荷历史数据经过上述模块的处理,可以达到去除异常值与 去噪的效果,提高了原始数据的有效性。将进行过数据清洗后的电力负荷历史数据用于电力负荷预测模型将大大的提高电力负荷预测的可靠度与准确性, 本发明对历史负荷数据异常数据剔除和去噪处理的方法如图1所示。
附图说明
图1为本发明实施例中历史负荷数据异常数据剔除和去噪处理的方法的处理流程示意图。
图2 为本发明实施例中对子样本进行切割过程示意图 。
具体实施方式
为使得本发明的内容、目的、特征及优点能够更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护说明书的范围。
步骤一、数据预处理:对采集到的原始历史电力负荷历史数据按时间序列排列,确定数据集起止时间,检查数据在时间序列上的缺省,标明缺省值并记录缺省的起止时间。
步骤二、孤立森林算法剔除异常值:将经过步骤1预处理的历史电力负荷数据标注时间戳后输入孤立森林算法模型。首先对数据进行单棵树的训练:
1.从训练数据中随机选择 n个点作为子样本,放入一棵孤立树的根节点;
2.随机指定一个维度,在当前节点数据范围内,随机产生一个切割点 p —— 切割点产生于当前节点数据中指定维度的最大值与最小值之间;
3.此切割点的选取生成了一个超平面,将当前节点数据空间切分为2个子空间:把当前所选维度下小于 p 的点放在当前节点的左分支,把大于等于 p 的点放在当前节点的右分支;
4.在节点的左分支和右分支节点递归步骤 2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据(无法再继续切割) 或树已经生长到了所设定的高度。
图2所示为对子样本进行切割训练的过程,左图的Xi处于密度较高的区域,因此切割了十几次才被分到了单独的子空间,而右图的Xo落在边缘分布较稀疏的区域,只经历了四次切分就被 “孤立” 了。
在对孤立树分别进行计算后再整合全部孤立树的结果,由于切割过程是完全随机的,所以需要用 集合的方法来使结果收敛,即反复从头开始切,然后计算每次切分结果的平均值。在获得 t 个孤立树后,单棵树的训练就结束了。接下来就可以用生成的孤立树来评估测试数据了,即计算异常分数 s。 对于每个样本 x,需要对其综合计算每棵树的结果,通过下面的公式计算异常得分:
Figure 930706DEST_PATH_IMAGE002
h(x) 为 x 在每棵树的高度,c(Ψ) 为给定样本数 Ψ 时路径长度的平均值,用来对样本 x 的路径长度 h(x) 进行标准化处理。
对计算的异常得分进行分析: 如果异常得分接近 1,那么一定是异常点;如果异常得分远小于 0.5,那么一定不是异常点;如果异常得分所有点的得分都在 0.5 左右,那么样本中很可能不存在异常点。 对历史负荷数据的每个数据点的异常得分进行统计,通过设定不同的阈值,收紧或放松异常值剔除条件,按预想的效果剔除异常值。被剔除的异常值按时间戳被标记并输入至下一 步骤补充缺失值。
步骤三、线性插值补充数据:经过剔除异常值的数据集将会在时间序列上造成缺省,即在某些时间段没有相对应的历史数据,对于这些缺省值,将使用线性插值的方法进行数据补充,以保证电力负荷历史数据在时间序列上的连贯性。具体采用的计算方法如下:
Figure 227607DEST_PATH_IMAGE004
式中P(t)为需要补充的时间序列上某一时刻的电力负荷预测值, ft0为缺省开始时的电力负荷历史数据, ft1为缺省结束时的电力负荷历史数据,t为需要补充的缺省值的时刻,t0为缺省开始的时刻,t1为缺省结束的时刻。为了保证补充数据的准确性, ft0以及ft1的电力负荷历史数据一般不采用该时刻的瞬值,而采用时间序列上之前以及之后一段 时间内的平均值,具体取平均值得时间范围将由数据情况决定,通常采用至少20个数据的 平均值输入公式计算。
步骤四、数据有效性验证:原始电力负荷历史数据集与经过数据清洗剔除异常值,补充数据以及去噪处理之后的数据集需要进行数据有效性统计差异性的检查以保证数据的有效性。两组数据将进行单因素方差分析(one way-ANOVA),计算两组数据间显著性差异值,需要保证两组数据间没有显著性差异。如果两组数据验证后存在显著性差异,则需要调整步骤二、三的具体参数的选择,减少对原始数据剔除极大差异值的数量以及降低去噪处理的程度以确保处理后的数据与原始数据不存在显著性差异,处理后的数据保持有效性。
本发明提出了一种应用孤立森林算法剔除了用于电力负荷预测的原始历史数据中由于各种原因造成的异常值的方法,其特点为在电力负荷预测数据预处理中引入了在金融,制造业领域应用广泛的孤立森林算法,降低了电力负荷历史数据的突发性波动,使得用于电力负荷预测的历史数据准确性更 加高,显著提高了电力负荷的预测效果。孤立森林隔离数据点中的异常值,而不是分析正常的数据点。和其他正常的数据点相比,异常数据点的树路径更短,因此在孤立森林中的树不需要太大的深度,具有低内存需求,计算速度快等优点。通过本发明的应用,电力负荷预测模型将较少的被 异常值影响,使得预测模型的训练效果更好,减少由于数据不确定性带来的误差,预测准确性得到大幅提升。以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。

Claims (1)

1.一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法其特征在于,包括:
步骤一、数据预处理:对采集到的原始历史电力负荷历史数据按时间序列排列,确定数据集起止时间,检查数据在时间序列上的缺省,标明缺省值并记录缺省的起止时间;
步骤二、孤立森林算法剔除异常值:将经过步骤1预处理的历史电力负荷数据标注时间戳后输入孤立森林算法模型;
首先对数据进行单棵树的训练:
1)从训练数据中随机选择 n个点作为子样本,放入一棵孤立树的根节点;
2)随机指定一个维度,在当前节点数据范围内,随机产生一个切割点 p —— 切割点产生于当前节点数据中指定维度的最大值与最小值之间;
3)此切割点的选取生成了一个超平面,将当前节点数据空间切分为2个子空间:把当前所选维度下小于 p 的点放在当前节点的左分支,把大于等于 p 的点放在当前节点的右分支;
4)在节点的左分支和右分支节点递归步骤 2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据(无法再继续切割) 或树已经生长到了所设定的高度;
图2所示为对子样本进行切割训练的过程,左图的Xi处于密度较高的区域,因此切割了十几次才被分到了单独的子空间,而右图的Xo落在边缘分布较稀疏的区域,只经历了四次切分就被 “孤立” 了;
在对孤立树分别进行计算后再整合全部孤立树的结果,由于切割过程是完全随机的,所以需要用 集合的方法来使结果收敛,即反复从头开始切,然后计算每次切分结果的平均值;
在获得 t 个孤立树后,单棵树的训练就结束了;
接下来就可以用生成的孤立树来评估测试数据了,即计算异常分数 s;
对于每个样本 x,需要对其综合计算每棵树的结果,通过下面的公式计算异常得分:
Figure 245673DEST_PATH_IMAGE001
h(x) 为 x 在每棵树的高度,c(Ψ) 为给定样本数 Ψ 时路径长度的平均值,用来对样本 x 的路径长度 h(x) 进行标准化处理;
对计算的异常得分进行分析: 如果异常得分接近 1,那么一定是异常点;如果异常得分远小于 0.5,那么一定不是异常点;如果异常得分所有点的得分都在 0.5 左右,那么样本中很可能不存在异常点; 对历史负荷数据的每个数据点的异常得分进行统计,通过设定不同的阈值,收紧或放松异常值剔除条件,按预想的效果剔除异常值,被剔除的异常值按时间戳被标记并输入至下一 步骤补充缺失值;
步骤三、线性插值补充数据:经过剔除异常值的数据集将会在时间序列上造成缺省,即在某些时间段没有相对应的历史数据,对于这些缺省值,将使用线性插值的方法进行数据补充,以保证电力负荷历史数据在时间序列上的连贯性;
具体采用的计算方法如下:
Figure 973457DEST_PATH_IMAGE002
式中P(t)为需要补充的时间序列上某一时刻的电力负荷预测值, ft0为缺省开始时的电力负荷历史数据, ft1为缺省结束时的电力负荷历史数据,t为需要补充的缺省值的时 刻,t0为缺省开始的时刻,t1为缺省结束的时刻;为了保证补充数据的准确性, ft0以及ft1的电力负荷历史数据一般不采用该时刻的瞬值,而采用时间序列上之前以及之后一段 时间内的平均值,具体取平均值得时间范围将由数据情况决定,通常采用至少20个数据的 平均值输入公式计算;
步骤四、数据有效性验证:原始电力负荷历史数据集与经过数据清洗剔除异常值, 补充数据以及去噪处理之后的数据集需要进行数据有效性统计差异性的检查以保证数据 的有效性;
两组数据将进行单因素方差分析(one way-ANOVA),计算两组数据间显著性差异 值,需要保证两组数据间没有显著性差异,如果两组数据验证后存在显著性差异,则需要调整步骤二、三的具体参数的选择,减少对原始数据剔除极大差异值的数量以及降低去噪处理的程度以确保处理后的数据与原始数据不存在显著性差异,处理后的数据保持有效性。
CN202010528176.XA 2020-06-11 2020-06-11 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法 Pending CN111666276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010528176.XA CN111666276A (zh) 2020-06-11 2020-06-11 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010528176.XA CN111666276A (zh) 2020-06-11 2020-06-11 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法

Publications (1)

Publication Number Publication Date
CN111666276A true CN111666276A (zh) 2020-09-15

Family

ID=72387335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010528176.XA Pending CN111666276A (zh) 2020-06-11 2020-06-11 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法

Country Status (1)

Country Link
CN (1) CN111666276A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906979A (zh) * 2021-03-19 2021-06-04 上海电机学院 一种发电功率预测方法
CN113298297A (zh) * 2021-05-10 2021-08-24 内蒙古工业大学 一种基于孤立森林与wgan网络的风电输出功率预测方法
CN113496440A (zh) * 2021-06-28 2021-10-12 国网上海市电力公司 一种用户异常用电检测方法及系统
CN114547970A (zh) * 2022-01-25 2022-05-27 中国长江三峡集团有限公司 一种水电厂顶盖排水系统异常智能诊断方法
CN115496285A (zh) * 2022-09-26 2022-12-20 上海玫克生储能科技有限公司 一种电力负荷的预测方法、装置及电子设备
CN116365519A (zh) * 2023-06-01 2023-06-30 国网山东省电力公司微山县供电公司 一种电力负荷预测方法、系统、存储介质及设备
CN116451168A (zh) * 2023-06-15 2023-07-18 北京国电通网络技术有限公司 异常电力信息生成方法、装置、电子设备和可读介质
CN117150244A (zh) * 2023-10-30 2023-12-01 山东凯莱电气设备有限公司 基于电参数分析的智能配电柜状态监测方法及系统
CN117807547A (zh) * 2024-02-29 2024-04-02 国网山东省电力公司经济技术研究院 一种区域级综合能源大规模数据清洗方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108320063A (zh) * 2018-03-26 2018-07-24 上海积成能源科技有限公司 一种电力负荷预测中对异常数据剔除和去噪处理的方法
CN108777873A (zh) * 2018-06-04 2018-11-09 江南大学 基于加权混合孤立森林的无线传感网络异常数据检测方法
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN108985632A (zh) * 2018-07-16 2018-12-11 国网上海市电力公司 一种基于孤立森林算法的用电数据异常检测模型
WO2019129977A1 (fr) * 2017-12-28 2019-07-04 Worldline Detection d'anomalies par une approche combinant apprentissage supervise et non-supervise
CN110263866A (zh) * 2019-06-24 2019-09-20 苏州智睿新能信息科技有限公司 一种基于深度学习的电力用户负荷区间预测方法
CN110503570A (zh) * 2019-07-16 2019-11-26 国网江苏省电力有限公司滨海县供电分公司 一种异常用电数据检测方法、系统、设备、存储介质
US20200097810A1 (en) * 2018-09-25 2020-03-26 Oracle International Corporation Automated window based feature generation for time-series forecasting and anomaly detection
CN110958222A (zh) * 2019-10-31 2020-04-03 苏州浪潮智能科技有限公司 基于孤立森林算法的服务器日志异常检测方法及系统
WO2020078385A1 (zh) * 2018-10-18 2020-04-23 杭州海康威视数字技术股份有限公司 数据采集方法、装置、存储介质及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019129977A1 (fr) * 2017-12-28 2019-07-04 Worldline Detection d'anomalies par une approche combinant apprentissage supervise et non-supervise
CN108320063A (zh) * 2018-03-26 2018-07-24 上海积成能源科技有限公司 一种电力负荷预测中对异常数据剔除和去噪处理的方法
CN108776683A (zh) * 2018-06-01 2018-11-09 广东电网有限责任公司 一种基于孤立森林算法和神经网络的电力运维数据清洗方法
CN108777873A (zh) * 2018-06-04 2018-11-09 江南大学 基于加权混合孤立森林的无线传感网络异常数据检测方法
CN108985632A (zh) * 2018-07-16 2018-12-11 国网上海市电力公司 一种基于孤立森林算法的用电数据异常检测模型
US20200097810A1 (en) * 2018-09-25 2020-03-26 Oracle International Corporation Automated window based feature generation for time-series forecasting and anomaly detection
WO2020078385A1 (zh) * 2018-10-18 2020-04-23 杭州海康威视数字技术股份有限公司 数据采集方法、装置、存储介质及系统
CN110263866A (zh) * 2019-06-24 2019-09-20 苏州智睿新能信息科技有限公司 一种基于深度学习的电力用户负荷区间预测方法
CN110503570A (zh) * 2019-07-16 2019-11-26 国网江苏省电力有限公司滨海县供电分公司 一种异常用电数据检测方法、系统、设备、存储介质
CN110958222A (zh) * 2019-10-31 2020-04-03 苏州浪潮智能科技有限公司 基于孤立森林算法的服务器日志异常检测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
赵臣啸等: "基于孤立森林算法的取用水量异常数据检测方法", 《中国水利水电科学研究院学报》 *
风控大鱼: "异常检测算法--孤立森林剖析", 《知乎》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906979A (zh) * 2021-03-19 2021-06-04 上海电机学院 一种发电功率预测方法
CN113298297A (zh) * 2021-05-10 2021-08-24 内蒙古工业大学 一种基于孤立森林与wgan网络的风电输出功率预测方法
CN113298297B (zh) * 2021-05-10 2022-03-25 内蒙古工业大学 一种基于孤立森林与wgan网络的风电输出功率预测方法
CN113496440B (zh) * 2021-06-28 2023-12-12 国网上海市电力公司 一种用户异常用电检测方法及系统
CN113496440A (zh) * 2021-06-28 2021-10-12 国网上海市电力公司 一种用户异常用电检测方法及系统
CN114547970A (zh) * 2022-01-25 2022-05-27 中国长江三峡集团有限公司 一种水电厂顶盖排水系统异常智能诊断方法
CN114547970B (zh) * 2022-01-25 2024-02-20 中国长江三峡集团有限公司 一种水电厂顶盖排水系统异常智能诊断方法
CN115496285B (zh) * 2022-09-26 2023-09-12 上海玫克生储能科技有限公司 一种电力负荷的预测方法、装置及电子设备
CN115496285A (zh) * 2022-09-26 2022-12-20 上海玫克生储能科技有限公司 一种电力负荷的预测方法、装置及电子设备
CN116365519A (zh) * 2023-06-01 2023-06-30 国网山东省电力公司微山县供电公司 一种电力负荷预测方法、系统、存储介质及设备
CN116365519B (zh) * 2023-06-01 2023-09-26 国网山东省电力公司微山县供电公司 一种电力负荷预测方法、系统、存储介质及设备
CN116451168A (zh) * 2023-06-15 2023-07-18 北京国电通网络技术有限公司 异常电力信息生成方法、装置、电子设备和可读介质
CN116451168B (zh) * 2023-06-15 2023-09-12 北京国电通网络技术有限公司 异常电力信息生成方法、装置、电子设备和可读介质
CN117150244A (zh) * 2023-10-30 2023-12-01 山东凯莱电气设备有限公司 基于电参数分析的智能配电柜状态监测方法及系统
CN117150244B (zh) * 2023-10-30 2024-01-26 山东凯莱电气设备有限公司 基于电参数分析的智能配电柜状态监测方法及系统
CN117807547A (zh) * 2024-02-29 2024-04-02 国网山东省电力公司经济技术研究院 一种区域级综合能源大规模数据清洗方法
CN117807547B (zh) * 2024-02-29 2024-05-10 国网山东省电力公司经济技术研究院 一种区域级综合能源大规模数据清洗方法

Similar Documents

Publication Publication Date Title
CN111666276A (zh) 一种电力负荷预测中应用孤立森林算法剔除异常数据处理的方法
CN113570138B (zh) 一种时间卷积网络的设备剩余使用寿命预测方法及装置
CN105471659A (zh) 一种故障根因分析方法和分析设备
CN111027615B (zh) 基于机器学习的中间件故障预警方法和系统
CN111767951A (zh) 一种居民用电安全分析中应用孤立森林算法发现异常数据的方法
CN117241306B (zh) 一种4g网络异常流量数据实时监测方法
CN113093985B (zh) 传感器数据链路异常检测方法、装置和计算机设备
CN112101420A (zh) 一种相异模型下Stacking集成算法的异常用电用户识别方法
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN113568774A (zh) 使用无监督深度神经网络的多维时序数据实时异常检测方法
CN115062272A (zh) 一种水质监测数据异常识别及预警方法
CN111860980A (zh) 一种电力负荷预测中应用分类回归树插补补充缺失值的方法
CN112148561A (zh) 业务系统的运行状态预测方法、装置及服务器
CN115453356A (zh) 一种动力设备运行状态监测分析方法、系统、终端及介质
CN114528190A (zh) 单指标异常的检测方法、装置、电子设备及可读存储介质
Martínez et al. Predictability of the monthly North Atlantic Oscillation index based on fractal analyses and dynamic system theory
CN113112188B (zh) 一种基于预筛选动态集成的电力调度监控数据异常检测方法
US10909322B1 (en) Unusual score generators for a neuro-linguistic behavioral recognition system
Theumer et al. Anomaly detection on industrial time series for retaining energy efficiency
CN111275136B (zh) 基于小样本下的故障预测系统及其预警方法
CN117034197A (zh) 基于多维Isolate-Detect多变点检测的企业用电典型模式分析方法
CN115238779A (zh) 一种云盘的异常检测方法、装置、设备及介质
CN116955059A (zh) 根因定位方法、装置、计算设备及计算机存储介质
CN115766513A (zh) 一种异常检测方法和装置
CN115766504A (zh) 一种周期时间序列异常检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200915

RJ01 Rejection of invention patent application after publication