CN113298114B - 一种基于改进孤立森林算法检测电器投切事件的方法 - Google Patents
一种基于改进孤立森林算法检测电器投切事件的方法 Download PDFInfo
- Publication number
- CN113298114B CN113298114B CN202110408250.9A CN202110408250A CN113298114B CN 113298114 B CN113298114 B CN 113298114B CN 202110408250 A CN202110408250 A CN 202110408250A CN 113298114 B CN113298114 B CN 113298114B
- Authority
- CN
- China
- Prior art keywords
- window
- front window
- data
- abnormal
- forest algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000005856 abnormality Effects 0.000 claims abstract description 3
- 230000002159 abnormal effect Effects 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明涉及一种基于改进孤立森林算法检测电器投切事件的方法。本发明应用孤立森林算法思想,同时改进异常值,原本的孤立森林算法通过循环足够多的次数进行数据点深度收敛,结合指数函数来获取一个点的异常程度,这样的会导致算法进程慢,还会产生一个是否收敛的判别问题,本发明将每次形成孤立数的深度倒数作为异常值,同时在执行程序有限次后,将每次相同数的异常值累加形成最后的异常值指标,相较于原本算法的指标,本发明的程序执行时间大大缩短,且将原来判断是否收敛的问题转化为发散程度的问题,避免了判断的问题。
Description
技术领域
本发明涉及一种基于改进孤立森林算法检测电器投切事件的方法。
背景技术
当下,在非侵入式负荷监测研究方面,对电器的投切事件检测至关重要,同时也是现下重要的研究课题。现有的电器的投切事件检测技术大致有基于CUSUM算法、基于能量比算法、基于经验规则检测等方法,但这些方法有一些缺陷,如在信息利用方面,CUSUM算法只利用了总体的一个方差与均值,基于能量比算法也只利用前窗与后窗的一个总体能量差,缺失了单个点的信息,基于经验规则检测更是缺乏普适性,难以作为一种算法去研究。
在窗口设置方面,基于滑动窗的CUSUM检测投切事件方法作为典型的算法被广泛应用,但是该种方法一般设置固定长度的前窗进行事件特征提取,设置固定长度的后窗进行稳态特征提取,若检测出有事件发生只能知道哪个窗口处发生事件,但无法获知是哪个采样点发生事件。
本发明应用孤立森林算法思想,同时改进异常值,原本的孤立森林算法通过循环足够多的次数进行数据点深度收敛,结合指数函数来获取一个点的异常程度,这样的会导致算法进程慢,还会产生一个是否收敛的判别问题,本发明将每次形成孤立数的深度倒数作为异常值,同时在执行程序有限次后,将每次相同数的异常值累加形成最后的异常值指标,相较于原本算法的指标,本发明的程序执行时间大大缩短,且将原来判断是否收敛的问题转化为发散程度的问题,避免了判断的问题。
发明内容
本发明针对现有技术的不足,设计了一种基于改进孤立森林算法检测电器投切事件的方法。
本发明包括以下步骤:
步骤一、获取电流信息样本集;
步骤二、设置合适长度的前窗口与后窗口用于提取数据;
步骤三、将前窗中被选中的数据样本与后窗数据样本集混合,通过采用改进孤立森林算法判断出异常的点;
步骤四、根据从前窗依次加入后窗的数据被标记为异常点的个数判断是否发生电器投切事件;
步骤五、当窗口未检测到事件投切,则前窗长度变为一个单位长度,同时前窗后窗向前移动一个单位,当已经检测出投切事件时,则不再记录此时前窗及以前的数据,向前形成一个设定长度的后窗以及一个单位长度的前窗进行动态检测。
本发明的有益效果是:
1、针对上述传统方法不能确切知道事件发生的精确时间,本发明设置可变长度的前窗,通过逐点检测可以确切知道事件投切的时间。
2、针对上述传统方法未能充分利用每个点的信息,本发明采用改进孤立森林算法,通过后窗学习到每个数据样本的幅值,来计算前窗内数据与后窗内数据的差异度来检测事件投切。
3、针对上述原本的孤立森林算法进程慢,且产生是否收敛的判别问题,本发明改进异常值,相较于原本算法的指标,本发明的程序执行时间大大缩短。
附图说明
图1是本发明的流程图;
图2是本发明的仿真图。
具体实施方式
以下结合附图对本发明作进一说明。
本发明的一种基于改进孤立森林算法检测电器投切事件的方法,以检测单电器启停、状态转换识别为例,仿真采用matlab仿真软件。吹风机共依次进行停机至冷风一档、冷风一档至冷风二挡、冷风二挡至热风二挡、热风二挡至热风一档、热风一档至停机五个状态。结合图1和图2,具体方法包括以下步骤:
步骤一、将电流的200个样本作为样本集,包括采样点,即时间信息、电流幅值等信息。
步骤二、设置合适长度的前窗口与后窗口用于提取数据,前窗口为变长度窗口,用于提取前窗口内单个数据样本;后窗口为固定长度窗口,用于提取固定长度的数据样本即前窗正常推进时设置为1个单位;检测到异常时,长度应设置为小于第二次事件投切来临的区间长度,同时应考虑存在电网波动,原则上高于4个单位,本例设置为6个单位,后窗作为采集稳态数据的窗口,长度应该大于前窗长度,同时长度应设置为小于第二次事件投切来临的区间长度,本例设置为30个单位。
步骤三、将前窗中被选中的数据样本与后窗数据样本集混合,通过采用改进孤立森林算法判断出异常的点,具体步骤为:
STEP1:提取前窗和后窗中每个电流数据样本的幅值,去除时间信息后混合;
STEP2: 在单次执行程序中,多次在最大、最小幅值之间取随机值并记录下随机值,直到最大幅值与随机数,或者最小幅值与随机数之间、或者随机数之间只存在一个幅值样本,记为孤立出一个点,此时生成了的随机数的个数作为前窗中被选中的数据样本在后窗数据内的划分深度,取划分深度的倒数作为异常值,表征前窗中被选中的数据样本较于后窗数据的异常程度;
STEP3:设定合适孤立点数即停止该次程序,本例设置改进孤立森林算法每次孤立出5个点即停止该次程序;
STEP4:执行该程序有限次,本例以重复执行15次为例,将有限次被孤立出相同的点的异常值相加得到异常值排序表;
STEP5:根据异常值排序表,标记异常点,本例以15次被孤立点的异常值累加最高的2个值作为异常值为例;
STEP6:若前窗数据未被标记成异常点,则前窗保持一个单位长度,否则前窗变为设定长度,将其中的单个数据样本依次加入后窗重复进行STEP1~STEP6操作直至前窗内最后一个数据样本被检测完。
步骤四、根据从前窗依次加入后窗的数据被标记为异常点的个数判断是否发生电器投切事件,本例以6个单位的后窗中的5个数据都被标记为异常点则表示发生电器投切事件为例。
步骤五、当窗口未检测到事件投切,则前窗长度变为一个单位长度,同时前窗后窗向前移动一个单位,当已经检测出投切事件时,则不再记录此时前窗及以前的数据,向前形成一个设定长度的后窗以及一个单位长度的前窗进行动态检测。如图2所示,横坐标为电流数据采样点,纵坐标为电流幅值,单位为安培,标记点1为吹风机进行停机至冷风一档操作,被本方法检测到,并打上标记“/”;标记点2为吹风机进行冷风一档至冷风二挡操作,被本方法检测到,并打上标记“/”;标记点3为吹风机进行冷风二挡至热风二挡操作,被本方法检测到,并打上标记“/”;标记点4为吹风机进行热风二挡至热风一档操作,被本方法检测到,并打上标记“/”;标记点5为吹风机进行热风一档至停机操作,被本方法检测到,并打上标记“/”,本例仿真效果显示设计方法识别了所有状态转换的识别,且无误检。
Claims (3)
1.一种基于改进孤立森林算法检测电器投切事件的方法,该方法包括以下步骤:
步骤一、获取电流信息样本集;
步骤二、设置合适长度的前窗口与后窗口用于提取数据;
步骤三、将前窗中被选中的数据样本与后窗数据样本集混合,通过采用改进孤立森林算法判断出异常的点;
步骤四、根据从前窗依次加入后窗的数据被标记为异常点的个数判断是否发生电器投切事件;
步骤五、当窗口未检测到事件投切,则前窗长度变为一个单位长度,同时前窗后窗向前移动一个单位,当已经检测出投切事件时,则不再记录此时前窗及以前的数据,向前形成一个设定长度的后窗以及一个单位长度的前窗进行动态检测;
其中所述的通过采用改进孤立森林算法判断出异常的点具体是:
STEP1:提取前窗和后窗中每个电流数据样本的幅值,去除时间信息后混合;
STEP2:在单次执行程序中,多次在最大、最小幅值之间取随机值并记录下随机值,直到最大幅值与随机数,或者最小幅值与随机数之间、或者随机数之间只存在一个幅值样本,记为孤立出一个点;
此时生成了的随机数的个数作为前窗中被选中的数据样本在后窗数据内的划分深度,取划分深度的倒数作为异常值,表征前窗中被选中的数据样本较于后窗数据的异常程度;
STEP3:设定合适孤立点数即停止该次程序;
STEP4:执行本程序有限次,将有限次被孤立出相同的点的异常值相加得到异常值排序表;
STEP5: 根据异常值排序表,标记异常点;
STEP6:若前窗数据未被标记成异常点,则前窗保持一个单位长度,否则前窗变为设定长度,将其中的单个数据样本依次加入后窗重复进行STEP1~STEP6操作直至前窗内最后一个数据样本被检测完。
2.根据权利要求1所述的一种基于改进孤立森林算法检测电器投切事件的方法,其特征在于:电流信息样本包括时间和电流幅值。
3.根据权利要求1所述的一种基于改进孤立森林算法检测电器投切事件的方法,其特征在于:所述的前窗口为变长度窗口,用于提取前窗口内单个数据样本,后窗口为固定长度窗口,用于提取固定长度的数据样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110408250.9A CN113298114B (zh) | 2021-04-15 | 2021-04-15 | 一种基于改进孤立森林算法检测电器投切事件的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110408250.9A CN113298114B (zh) | 2021-04-15 | 2021-04-15 | 一种基于改进孤立森林算法检测电器投切事件的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113298114A CN113298114A (zh) | 2021-08-24 |
CN113298114B true CN113298114B (zh) | 2024-02-20 |
Family
ID=77319786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110408250.9A Active CN113298114B (zh) | 2021-04-15 | 2021-04-15 | 一种基于改进孤立森林算法检测电器投切事件的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113298114B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985632A (zh) * | 2018-07-16 | 2018-12-11 | 国网上海市电力公司 | 一种基于孤立森林算法的用电数据异常检测模型 |
CN109753960A (zh) * | 2018-12-24 | 2019-05-14 | 西安理工大学 | 基于分形理论的孤立森林水下人工目标检测方法 |
CN111833172A (zh) * | 2020-05-25 | 2020-10-27 | 百维金科(上海)信息科技有限公司 | 一种基于孤立森林的消费信贷欺诈行为检测方法及其系统 |
CN111970229A (zh) * | 2020-06-23 | 2020-11-20 | 北京航空航天大学 | 一种针对多种攻击方式的can总线数据异常检测方法 |
-
2021
- 2021-04-15 CN CN202110408250.9A patent/CN113298114B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985632A (zh) * | 2018-07-16 | 2018-12-11 | 国网上海市电力公司 | 一种基于孤立森林算法的用电数据异常检测模型 |
CN109753960A (zh) * | 2018-12-24 | 2019-05-14 | 西安理工大学 | 基于分形理论的孤立森林水下人工目标检测方法 |
CN111833172A (zh) * | 2020-05-25 | 2020-10-27 | 百维金科(上海)信息科技有限公司 | 一种基于孤立森林的消费信贷欺诈行为检测方法及其系统 |
CN111970229A (zh) * | 2020-06-23 | 2020-11-20 | 北京航空航天大学 | 一种针对多种攻击方式的can总线数据异常检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113298114A (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Quiroz et al. | Fault detection of broken rotor bar in LS-PMSM using random forests | |
CN110516788B (zh) | 一种基于Bi-LSTM算法的非侵入式负荷检测方法及系统 | |
CN117421687B (zh) | 一种数字化电力环网柜运行状态监测方法 | |
CN110504679B (zh) | 一种基于km匹配算法的非侵入式负荷辨识方法 | |
CN103675610B (zh) | 局部放电在线检测中的特征因子提取方法 | |
CN110579682A (zh) | 一种故障录波数据暂态同源对比方法及装置 | |
CN104363106A (zh) | 一种基于大数据技术的电力信息通信故障预警分析方法 | |
CN112396007A (zh) | 一种非侵入式居民负荷突变事件三阈值检测方法和系统 | |
CN117007883B (zh) | 一种用于光电耦合器多点温度测试系统 | |
CN103728134B (zh) | 机组轴承的检测方法和装置及风电机组 | |
CN108549914A (zh) | 基于Apriori算法的异常SER/SOE事件识别方法 | |
Pereira et al. | Semi-automatic labeling for public non-intrusive load monitoring datasets | |
CN118098695B (zh) | 一种基于温度传感器监测并具有自动预警功能的智能电缆 | |
CN109917264A (zh) | 一种换流阀晶闸管级短路试验装置及方法 | |
CN113298114B (zh) | 一种基于改进孤立森林算法检测电器投切事件的方法 | |
CN111917114B (zh) | 一种适用于嵌入式平台的电力负荷事件检测方法 | |
CN116760175A (zh) | 非侵入式负荷识别方法、装置、终端及存储介质 | |
CN109901003B (zh) | 一种逆变器功率故障检测方法及系统 | |
CN117743120A (zh) | 基于大数据技术的网卡异常检测方法 | |
CN109388512A (zh) | 针对大规模计算机集群异常程度的评估与分析系统 | |
CN116842425A (zh) | 一种低压交流系统中故障电弧的检测方法 | |
CN117195077A (zh) | 一种电力变压器声纹信号故障无监督检测方法 | |
CN108594035B (zh) | 一种负荷检测方法及系统 | |
CN112345824B (zh) | 一种基于分段线性近似算法的变频空调非侵入式辨识方法 | |
CN110032758B (zh) | 计算电信号的能量的方法、装置和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |