CN110929800B - 一种基于sax算法的商业体异常用电检测方法 - Google Patents

一种基于sax算法的商业体异常用电检测方法 Download PDF

Info

Publication number
CN110929800B
CN110929800B CN201911201095.2A CN201911201095A CN110929800B CN 110929800 B CN110929800 B CN 110929800B CN 201911201095 A CN201911201095 A CN 201911201095A CN 110929800 B CN110929800 B CN 110929800B
Authority
CN
China
Prior art keywords
training set
electric energy
data
energy data
hour
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911201095.2A
Other languages
English (en)
Other versions
CN110929800A (zh
Inventor
徐小凤
张垿
谭铭玺
周知瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Wanyi Energy Technology Co ltd
Original Assignee
Sichuan Wanyi Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Wanyi Energy Technology Co ltd filed Critical Sichuan Wanyi Energy Technology Co ltd
Priority to CN201911201095.2A priority Critical patent/CN110929800B/zh
Publication of CN110929800A publication Critical patent/CN110929800A/zh
Application granted granted Critical
Publication of CN110929800B publication Critical patent/CN110929800B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于sax算法的商业体异常用电检测方法,包括以下步骤:采集商业体的待检测电能数据,将与待检测电能数据所在日期相近五个月的电能数据作为训练集;将训练集中的电能数据进行时序符号化,并且判断训练集是否拆分,得到拆分训练集和不拆分训练集;根据训练集中时序符号化的电能数据,对拆分训练集和不拆分训练集进行分类;根据拆分训练集和不拆分训练集的分类结果,构建具有取值范围的样本集;根据样本集,生成每个设备一个小时对应的上下界阈值;对待检测电能数据进行异常用电判别,得到异常用电判断结果。本发明通过对商业体用电的监控,能够实现对异常用电的报警,有利于管理人员对商业体用能进行有效管理。

Description

一种基于sax算法的商业体异常用电检测方法
技术领域
本发明属于商业体用电检测领域,具体涉及一种基于sax算法的商业体异常用电检测方法。
背景技术
商业体用电特征受业务、设备类型的影响,回路复杂,回路数量众多,回路用电差异大,有单独设备回路,也有多个设备组成的复合回路。根据前期调研,商业体用电类型可分为:空调、电梯、动力、消防、照明等回路。根据对回路的分析,一些回路序列存在季节性、工作日与非工作日、是否固定启停、是否平稳用电等差异,这就决定了商业用电异常用能的检测场景比较复杂。目前用电异常检测技术包括曲线拟合,即根据拟合剩余的偏差来判别异常,这个属于波动异常,不适合不平稳的用电时序检测,即当遇到异方差的时序异常会比较难判别;也有根据当前数据历史相似天寻找相似的曲线来判断是否异常,相似天的计算方法包括KNN,DTW,聚类等方法,但是距离参数以及聚类个数设置比较复杂,且对于有固定启停的回路不能很好的判断启停边界,会将固定启停时序里面的一些波动误判别为异常。而LOF和随机森林容易将时序中的变化点识别为异常,且解释性较弱。所以目前现有技术商业体用电异常识别的准确率不高。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于sax算法的商业体异常用电检测方法解决了商业体用电异常识别的准确率不高的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于sax算法的商业体异常用电检测方法,包括以下步骤:
S1、采集商业体的待检测电能数据,将与待检测电能数据所在日期相近五个月的电能数据作为训练集;
S2、将训练集中的电能数据进行时序符号化,并且判断训练集是否拆分,得到拆分训练集和不拆分训练集;
S3、根据训练集中时序符号化的电能数据,对拆分训练集和不拆分训练集进行分类;
S4、根据拆分训练集和不拆分训练集的分类结果,构建具有取值范围的样本集;
S5、根据样本集,生成每个设备一个小时对应的上下界阈值;
S6、根据上下界阈值,对待检测电能数据进行异常用电判别,得到异常用电判断结果。
进一步地,所述步骤S1包括以下分步骤:
S1.1、采集商业体电能数据,并将其某一天的电能数据中作为待检测电能数据;
S1.2、根据待检测电能数据所在日期,采集商业体在与该日期接近五个月的电能数据,并将近五个月的电能数据作为训练集;
所述商业体电能数据为
Figure BDA0002295892390000021
i表示采集商业体电能数据所在日期的前i天,i=1,2,3,....,D,j表示在第i天中具体点位,j=0,1,...,23。
进一步地,所述步骤S2中将训练集中的电能数据进行时序符号化的具体方法为:
A1、将商业体电能数据的数据归一化到均值为0和方差为1的分布下;
A2、根据归一化后的商业体电能数据,获取其正态分布,并将正态分布下的面积等分为3部分,得到2个数值切割点;
A3、根据2个数值切割点,将训练集的数据划分为3部分;
A4、将3部分数据根据对应数值由大到小分别表示为a、b和c;
A5、根据a、b和c,将训练集中的数据按天划分,得到训练集每一天的天符号化串si
进一步地,所述步骤S2中判断训练集是否拆分,得到拆分训练集和不拆分训练集的具体方法为:
B1、统计训练集中工作日和非工作日的天符号化串出现次数,分别获取工作日和非工作日中出现最多的天符号化串;
B2、判断工作日和非工作日中出现最多的天符号化串是否相同,若是则不需要拆分训练集,得到不拆分训练集,否则将训练集拆分,得到拆分训练集为工作日训练集和非工作日训练集。
进一步地,所述步骤S3包括以下分步骤:
S3.1、判断不拆分训练集和拆分训练集中的数据是否为平稳时序,若是则将其加入平稳时序训练集,否则进入步骤S3.2;
S3.2、判断不拆分训练集和拆分训练集中的数据是否为固定启停时序,若是则将其加入固定启停时序训练集,否则将其加入其它时序训练集。
进一步地,所述判断不拆分训练集和拆分训练集中的数据是否为平稳时序的具体方法为:在不拆分训练集和拆分训练集中选出出现最多的两种字符,判断最多字符的均值是否落入第二多字符的分布内,若是则为平稳时序,否则为不平稳时序;
所述判断不拆分训练集和拆分训练集中的数据是否为固定启停时序的具体方法为:在不拆分训练集和拆分训练集中选出出现次数最多的天符号化串,若其出现次数占训练集总天数的50%以上,出现次数最多的天符号化串为固定启停时序。
进一步地,所述步骤S4包括以下分步骤:
S4.1、将平稳时序训练集中数据的第n-1小时、第n个小时和第n+1个小时的数据作为第n个小时的训练数据,得到第n个小时的样本值;
S4.2、若固定启停时序训练集中数据的第m个小时不在符号边界时,将其第m-1小时、第m个小时和第m+1个小时的数据作为第m个小时的训练数据,若第m个小时处于符号边界时,则将第m个小时的数据作为第m个小时的训练数据,得到第m个小时的样本值;
S4.3、将其它时序训练集中数据的第a个小时的数据作为第a个小时的训练数据,得到第a个小时的样本值;
S4.4、将样本值汇集到一个集合,得到样本集。
进一步地,所述步骤S5包括以下分步骤:
S5.1、判断是否未拆分训练集,若是则计算不拆分训练集中每个设备一个小时对应的上下界阈值,否则进入步骤S5.2;
S5.2、计算拆分训练集时工作日训练集中每个设备一个小时对应的上下界阈值,得到工作日上下界阈值;
S5.3、计算拆分训练集时非工作日训练集中每个设备一个小时对应的上下界阈值,得到非工作日上下界阈值。
进一步地,所述计算每个设备一个小时对应的上下界阈值的具体方法为:
C1、确定阈值列表,所述阈值列表为:
Figure BDA0002295892390000041
C2、根据阈值列表,确定上界阈值,所述上界阈值max_thresh为:
Figure BDA0002295892390000051
C3、根据阈值列表,确定下界阈值,所述下界阈值min_thresh为:
Figure BDA0002295892390000052
其中,P75表示第三四分位数,P25表示第一四分位数,mthmin_i和mthmax_i均表示阈值,max_i表示第i个小时,样本值从大到小的第五个值,min_i表示第i个小时,样本值从小到大的第五个值,i=0,1,2,...,23;
所述x表示阈值,f(x)、g(x)、h(x)和z(x)均为上下界阈值计算函数,它们表示如下:
Figure BDA0002295892390000053
进一步地,所述步骤S6中对待检测电能数据进行异常用电判别的具体方法为:
D1、判断是否未拆分训练集,若是则进入步骤D2,否则进入步骤D4;
D2、判断待检测电能数据中每一个小时的电能数据是否超过上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D3;
D3、判断待检测电能数据中每一个小时的电能数据是否小于下界阈值,若是则将其判断为偏低异常用电,否则为正常用电;
D4、判断待检测电能数据是否为工作日,若是则进入步骤D5,否则进入步骤D7;
D5、判断待检测电能数据中每一个小时的电能数据是否超过工作日的上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D6;
D6、判断待检测电能数据中每一个小时的电能数据是否小于工作日的下界阈值,若是则将其判断为偏低异常用电,否则为正常用电;
D7、判断待检测电能数据中每一个小时的电能数据是否超过非工作日的上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D8;
D8、判断待检测电能数据中每一个小时的电能数据是否小于非工作日的下界阈值,若是则将其判断为偏低异常用电,否则为正常用电。
本发明的有益效果为:
(1)本发明通过将数据符号化后进行商业体异常用电判断,以及区分工作日与非工作日的差异,对商业体用电方式进行判断,保证了准确地进行商业体的异常用电判断。
(2)本发明通过对商业体用电的监控,能够实现对异常用电的报警,有利于管理人员对商业体用能进行有效管理。
附图说明
图1为本发明提出的一种基于sax算法的商业体异常用电检测方法流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
下面结合附图详细说明本发明的实施例。
如图1所示,一种基于sax算法的商业体异常用电检测方法,包括以下步骤:
S1、采集商业体的待检测电能数据,将与待检测电能数据所在日期相近五个月的电能数据作为训练集;
S2、将训练集中的电能数据进行时序符号化,并且判断训练集是否拆分,得到拆分训练集和不拆分训练集;
S3、根据训练集中时序符号化的电能数据,对拆分训练集和不拆分训练集进行分类;
S4、根据拆分训练集和不拆分训练集的分类结果,构建具有取值范围的样本集;
S5、根据样本集,生成每个设备一个小时对应的上下界阈值;
S6、根据上下界阈值,对待检测电能数据进行异常用电判别,得到异常用电判断结果。
所述步骤S1包括以下分步骤:
S1.1、采集商业体电能数据,并将其某一天的电能数据中作为待检测电能数据;
S1.2、根据待检测电能数据所在日期,采集商业体在与该日期接近五个月的电能数据,并将近五个月的电能数据作为训练集;
所述商业体电能数据为
Figure BDA0002295892390000071
i表示采集商业体电能数据所在日期的前i天,i=1,2,3,....,D,j表示在第i天中具体点位,j=0,1,...,23。
在本实施例中,根据待检测电能数据所在日期,采集商业体在与该日期接近五个月的电能数据的具体方法为:确定待检测用电数据所在日期和月份,采集待检测用电数据所在月份中1号至其所在日期的用电数据,采集检测用电数据所在月份的上两个月的用电数据,采集去年与检测用电数据所在月份同月的上下两个月的用电数据和去年同月的用电数据。
所述步骤S2中将训练集中的电能数据进行时序符号化的具体方法为:
A1、将商业体电能数据的数据归一化到均值为0和方差为1的分布下;
A2、根据归一化后的商业体电能数据,获取其正态分布,并将正态分布下的面积等分为3部分,得到2个数值切割点;
A3、根据2个数值切割点,将训练集的数据划分为3部分;
A4、将3部分数据根据对应数值由大到小分别表示为a、b和c;
A5、根据a、b和c,将训练集中的数据按天划分,得到训练集每一天的天符号化串si
所述步骤S2中判断训练集是否拆分,得到拆分训练集和不拆分训练集的具体方法为:
B1、统计训练集中工作日和非工作日的天符号化串出现次数,分别获取工作日和非工作日中出现最多的天符号化串;
B2、判断工作日和非工作日中出现最多的天符号化串是否相同,若是则不需要拆分训练集,得到不拆分训练集,否则将训练集拆分,得到拆分训练集为工作日训练集和非工作日训练集。
所述步骤S3包括以下分步骤:
S3.1、判断不拆分训练集和拆分训练集中的数据是否为平稳时序,若是则将其加入平稳时序训练集,否则进入步骤S3.2;
S3.2、判断不拆分训练集和拆分训练集中的数据是否为固定启停时序,若是则将其加入固定启停时序训练集,否则将其加入其它时序训练集。
所述判断不拆分训练集和拆分训练集中的数据是否为平稳时序的具体方法为:在不拆分训练集和拆分训练集中选出出现最多的两种字符,判断最多字符的均值是否落入第二多字符的分布内,若是则为平稳时序,否则为不平稳时序;
所述判断不拆分训练集和拆分训练集中的数据是否为固定启停时序的具体方法为:在不拆分训练集和拆分训练集中选出出现次数最多的天符号化串,若其出现次数占训练集总天数的50%以上,出现次数最多的天符号化串为固定启停时序。
所述步骤S4包括以下分步骤:
S4.1、将平稳时序训练集中数据的第n-1小时、第n个小时和第n+1个小时的数据作为第n个小时的训练数据,得到第n个小时的样本值;
S4.2、若固定启停时序训练集中数据的第m个小时不在符号边界时,将其第m-1小时、第m个小时和第m+1个小时的数据作为第m个小时的训练数据,若第m个小时处于符号边界时,则将第m个小时的数据作为第m个小时的训练数据,得到第m个小时的样本值;
S4.3、将其它时序训练集中数据的第a个小时的数据作为第a个小时的训练数据,得到第a个小时的样本值;
S4.4、将样本值汇集到一个集合,得到样本集。
所述步骤S5包括以下分步骤:
S5.1、判断是否未拆分训练集,若是则计算不拆分训练集中每个设备一个小时对应的上下界阈值,否则进入步骤S5.2;
S5.2、计算拆分训练集时工作日训练集中每个设备一个小时对应的上下界阈值,得到工作日上下界阈值;
S5.3、计算拆分训练集时非工作日训练集中每个设备一个小时对应的上下界阈值,得到非工作日上下界阈值。
所述计算每个设备一个小时对应的上下界阈值的具体方法为:
C1、确定阈值列表,所述阈值列表为:
Figure BDA0002295892390000101
C2、根据阈值列表,确定上界阈值,所述上界阈值max_thresh为:
Figure BDA0002295892390000102
C3、根据阈值列表,确定下界阈值,所述下界阈值min_thresh为:
Figure BDA0002295892390000103
其中,P75表示第三四分位数,P25表示第一四分位数,mthmin_i和mthmax_i均表示阈值,max_i表示第i个小时,样本值从大到小的第五个值,min_i表示第i个小时,样本值从小到大的第五个值,i=0,1,2,...,23;
所述x表示阈值,f(x)、g(x)、h(x)和z(x)均为上下界阈值计算函数,它们表示如下:
Figure BDA0002295892390000104
所述步骤S6中对待检测电能数据进行异常用电判别的具体方法为:
D1、判断是否未拆分训练集,若是则进入步骤D2,否则进入步骤D4;
D2、判断待检测电能数据中每一个小时的电能数据是否超过上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D3;
D3、判断待检测电能数据中每一个小时的电能数据是否小于下界阈值,若是则将其判断为偏低异常用电,否则为正常用电;
D4、判断待检测电能数据是否为工作日,若是则进入步骤D5,否则进入步骤D7;
D5、判断待检测电能数据中每一个小时的电能数据是否超过工作日的上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D6;
D6、判断待检测电能数据中每一个小时的电能数据是否小于工作日的下界阈值,若是则将其判断为偏低异常用电,否则为正常用电;
D7、判断待检测电能数据中每一个小时的电能数据是否超过非工作日的上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D8;
D8、判断待检测电能数据中每一个小时的电能数据是否小于非工作日的下界阈值,若是则将其判断为偏低异常用电,否则为正常用电。
本发明通过将数据符号化后进行商业体异常用电判断,以及区分工作日与非工作日的差异,对商业体用电方式进行判断,保证了准确地进行商业体的异常用电判断。本发明通过对商业体用电的监控,能够实现对异常用电的报警,有利于管理人员对商业体用能进行有效管理。

Claims (7)

1.一种基于sax算法的商业体异常用电检测方法,其特征在于,包括以下步骤:
S1、采集商业体的待检测电能数据,将与待检测电能数据所在日期相近五个月的电能数据作为训练集;
S2、将训练集中的电能数据进行时序符号化,并且判断训练集是否拆分,得到拆分训练集和不拆分训练集;
其中,所述将训练集中的电能数据进行时序符号化的具体方法为:
A1、将商业体电能数据的数据归一化到均值为0和方差为1的分布下;
A2、根据归一化后的商业体电能数据,获取其正态分布,并将正态分布下的面积等分为3部分,得到2个数值切割点;
A3、根据2个数值切割点,将训练集的数据划分为3部分;
A4、将3部分数据根据对应数值由大到小分别表示为a、b和c;
A5、根据a、b和c,将训练集中的数据按天划分,得到训练集每一天的天符号化串si
所述判断训练集是否拆分,得到拆分训练集和不拆分训练集的具体方法为:
B1、统计训练集中工作日和非工作日的天符号化串出现次数,分别获取工作日和非工作日中出现最多的天符号化串;
B2、判断工作日和非工作日中出现最多的天符号化串是否相同,若是则不需要拆分训练集,得到不拆分训练集,否则将训练集拆分,得到拆分训练集为工作日训练集和非工作日训练集;
S3、根据训练集中时序符号化的电能数据,对拆分训练集和不拆分训练集进行分类;
具体地,包括以下分步骤:
S3.1、判断不拆分训练集和拆分训练集中的数据是否为平稳时序,若是则将其加入平稳时序训练集,否则进入步骤S3.2;
S3.2、判断不拆分训练集和拆分训练集中的数据是否为固定启停时序,若是则将其加入固定启停时序训练集,否则将其加入其它时序训练集;
S4、根据拆分训练集和不拆分训练集的分类结果,构建具有取值范围的样本集;
S5、根据样本集,生成每个设备一个小时对应的上下界阈值;
S6、根据上下界阈值,对待检测电能数据进行异常用电判别,得到异常用电判断结果。
2.根据权利要求1所述的基于sax算法的商业体异常用电检测方法,其特征在于,所述步骤S1包括以下分步骤:
S1.1、采集商业体电能数据,并将其某一天的电能数据中作为待检测电能数据;
S1.2、根据待检测电能数据所在日期,采集商业体在与该日期接近五个月的电能数据,并将近五个月的电能数据作为训练集;
所述商业体电能数据为
Figure FDA0003837023910000021
i表示采集商业体电能数据所在日期的前i天,i=1,2,3,....,D,j表示在第i天中具体点位,j=0,1,...,23。
3.根据权利要求1所述的基于sax算法的商业体异常用电检测方法,其特征在于,所述判断不拆分训练集和拆分训练集中的数据是否为平稳时序的具体方法为:在不拆分训练集和拆分训练集中选出出现最多的两种字符,判断最多字符的均值是否落入第二多字符的分布内,若是则为平稳时序,否则为不平稳时序;
所述判断不拆分训练集和拆分训练集中的数据是否为固定启停时序的具体方法为:在不拆分训练集和拆分训练集中选出出现次数最多的天符号化串,若其出现次数占训练集总天数的50%以上,出现次数最多的天符号化串为固定启停时序。
4.根据权利要求1所述的基于sax算法的商业体异常用电检测方法,其特征在于,所述步骤S4包括以下分步骤:
S4.1、将平稳时序训练集中数据的第n-1小时、第n个小时和第n+1个小时的数据作为第n个小时的训练数据,得到第n个小时的样本值;
S4.2、若固定启停时序训练集中数据的第m个小时不在符号边界时,将其第m-1小时、第m个小时和第m+1个小时的数据作为第m个小时的训练数据,若第m个小时处于符号边界时,则将第m个小时的数据作为第m个小时的训练数据,得到第m个小时的样本值;
S4.3、将其它时序训练集中数据的第a个小时的数据作为第a个小时的训练数据,得到第a个小时的样本值;
S4.4、将样本值汇集到一个集合,得到样本集。
5.根据权利要求3所述的基于sax算法的商业体异常用电检测方法,其特征在于,所述步骤S5包括以下分步骤:
S5.1、判断是否未拆分训练集,若是则计算不拆分训练集中每个设备一个小时对应的上下界阈值,否则进入步骤S5.2;
S5.2、计算拆分训练集时工作日训练集中每个设备一个小时对应的上下界阈值,得到工作日上下界阈值;
S5.3、计算拆分训练集时非工作日训练集中每个设备一个小时对应的上下界阈值,得到非工作日上下界阈值。
6.根据权利要求5所述的基于sax算法的商业体异常用电检测方法,其特征在于,所述计算每个设备一个小时对应的上下界阈值的具体方法为:
C1、确定阈值列表,所述阈值列表为:
Figure FDA0003837023910000041
C2、根据阈值列表,确定上界阈值,所述上界阈值max_thresh为:
Figure FDA0003837023910000042
C3、根据阈值列表,确定下界阈值,所述下界阈值min_thresh为:
Figure FDA0003837023910000051
其中,P75表示第三四分位数,P25表示第一四分位数,mthmin_i和mthmax_i均表示阈值,max_i表示第i个小时,样本值从大到小的第五个值,min_i表示第i个小时,样本值从小到大的第五个值,i=0,1,2,...,23;
所述x表示阈值,f(x)、g(x)、h(x)和z(x)均为上下界阈值计算函数,它们表示如下:
Figure FDA0003837023910000052
7.根据权利要求6所述的基于sax算法的商业体异常用电检测方法,其特征在于,所述步骤S6中对待检测电能数据进行异常用电判别的具体方法为:
D1、判断是否未拆分训练集,若是则进入步骤D2,否则进入步骤D4;
D2、判断待检测电能数据中每一个小时的电能数据是否超过上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D3;
D3、判断待检测电能数据中每一个小时的电能数据是否小于下界阈值,若是则将其判断为偏低异常用电,否则为正常用电;
D4、判断待检测电能数据是否为工作日,若是则进入步骤D5,否则进入步骤D7;
D5、判断待检测电能数据中每一个小时的电能数据是否超过工作日的上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D6;
D6、判断待检测电能数据中每一个小时的电能数据是否小于工作日的下界阈值,若是则将其判断为偏低异常用电,否则为正常用电;
D7、判断待检测电能数据中每一个小时的电能数据是否超过非工作日的上界阈值,若是则将其判断为偏高异常用电,否则进入步骤D8;
D8、判断待检测电能数据中每一个小时的电能数据是否小于非工作日的下界阈值,若是则将其判断为偏低异常用电,否则为正常用电。
CN201911201095.2A 2019-11-29 2019-11-29 一种基于sax算法的商业体异常用电检测方法 Active CN110929800B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911201095.2A CN110929800B (zh) 2019-11-29 2019-11-29 一种基于sax算法的商业体异常用电检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911201095.2A CN110929800B (zh) 2019-11-29 2019-11-29 一种基于sax算法的商业体异常用电检测方法

Publications (2)

Publication Number Publication Date
CN110929800A CN110929800A (zh) 2020-03-27
CN110929800B true CN110929800B (zh) 2022-10-21

Family

ID=69847764

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911201095.2A Active CN110929800B (zh) 2019-11-29 2019-11-29 一种基于sax算法的商业体异常用电检测方法

Country Status (1)

Country Link
CN (1) CN110929800B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139610A (zh) * 2021-04-29 2021-07-20 国网河北省电力有限公司电力科学研究院 一种针对变压器监测数据的异常检测方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138413A (zh) * 2015-08-19 2015-12-09 中国电力科学研究院 一种配电网在线数据异常检测方法
CN106780121A (zh) * 2016-12-06 2017-05-31 广州供电局有限公司 一种基于用电负荷模式分析的用电异常识别方法
CN106803137A (zh) * 2017-01-25 2017-06-06 东南大学 城市轨道交通afc系统实时进站客流量异常检测方法
CN107359609A (zh) * 2017-07-05 2017-11-17 许昌许继昌龙电能科技股份有限公司 电力系统中异常电压的监控方法及装置
CN108647737A (zh) * 2018-05-17 2018-10-12 哈尔滨工业大学 一种基于聚类的自适应时间序列异常检测方法及装置
CN108805747A (zh) * 2018-06-13 2018-11-13 山东科技大学 一种基于半监督学习的异常用电用户检测方法
CN109815210A (zh) * 2018-12-29 2019-05-28 河北省科学院应用数学研究所 轨道电压异常数据监测方法、系统及终端设备
CN110119758A (zh) * 2019-04-01 2019-08-13 全球能源互联网研究院有限公司 一种用电数据异常检测及模型训练方法、装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9833196B2 (en) * 2011-03-02 2017-12-05 The Regents Of The University Of California Apparatus, system, and method for detecting activities and anomalies in time series data
US10147049B2 (en) * 2015-08-31 2018-12-04 International Business Machines Corporation Automatic generation of training data for anomaly detection using other user's data samples

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138413A (zh) * 2015-08-19 2015-12-09 中国电力科学研究院 一种配电网在线数据异常检测方法
CN106780121A (zh) * 2016-12-06 2017-05-31 广州供电局有限公司 一种基于用电负荷模式分析的用电异常识别方法
CN106803137A (zh) * 2017-01-25 2017-06-06 东南大学 城市轨道交通afc系统实时进站客流量异常检测方法
CN107359609A (zh) * 2017-07-05 2017-11-17 许昌许继昌龙电能科技股份有限公司 电力系统中异常电压的监控方法及装置
CN108647737A (zh) * 2018-05-17 2018-10-12 哈尔滨工业大学 一种基于聚类的自适应时间序列异常检测方法及装置
CN108805747A (zh) * 2018-06-13 2018-11-13 山东科技大学 一种基于半监督学习的异常用电用户检测方法
CN109815210A (zh) * 2018-12-29 2019-05-28 河北省科学院应用数学研究所 轨道电压异常数据监测方法、系统及终端设备
CN110119758A (zh) * 2019-04-01 2019-08-13 全球能源互联网研究院有限公司 一种用电数据异常检测及模型训练方法、装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《A Fuzzy Shape-Based Anomaly Detection and Its Application to Electromagnetic Data》;Vyron Christodoulou等;《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》;20180930;第11卷(第9期);第3366-3379页 *
《基于优化SAX 和带权负荷特性指标的AP聚类用户用电行为分析》;李春燕等;《电工技术学报》;20190630;第34卷(第12期);第368-377页 *
《电力用户用电数据的异常数据审查和分类》;沈海涛等;《电力与能源》;20160229;第37卷(第1期);第17-22页 *

Also Published As

Publication number Publication date
CN110929800A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN106888205B (zh) 一种非侵入式基于功耗分析的plc异常检测方法
CN111798312B (zh) 一种基于孤立森林算法的金融交易系统异常识别方法
CN111641519B (zh) 异常根因定位方法、装置及存储介质
CN109740648B (zh) 电力负荷异常数据识别方法、装置和计算机设备
CN108304567B (zh) 高压变压器工况模式识别与数据分类方法及系统
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN111026738A (zh) 区域人口监控方法、系统、电子设备及存储介质
CN109784668B (zh) 一种用于电力监控系统异常行为检测的样本特征降维处理方法
CN116823227A (zh) 一种基于物联网的智能设备管理系统及方法
CN113868953B (zh) 工业系统中多机组运行优化方法、装置、系统及存储介质
CN116090605A (zh) 一种管网预警方法、装置、电子设备及存储介质
CN111881961A (zh) 基于数据挖掘的配电网故障风险等级预测方法
CN116956282B (zh) 基于网络资产内存时间序列多特征数据的异常检测系统
CN115794578A (zh) 一种电力系统的数据管理方法、装置、设备及介质
CN110929800B (zh) 一种基于sax算法的商业体异常用电检测方法
CN112199805A (zh) 一种输电线路隐患识别模型评估方法及装置
CN113010394B (zh) 一种用于数据中心的机房故障检测方法
CN109711450A (zh) 一种电网预想故障集预测方法、装置、电子设备及存储介质
CN110909813B (zh) 一种基于边缘算法的商业体异常用电检测方法
CN110807174B (zh) 一种基于统计分布的污水厂厂群出水分析及异常识别方法
CN109871403B (zh) 基于产业供应链的工业大数据分析方法
CN112365269A (zh) 风险检测方法、装置、设备以及存储介质
CN111209955A (zh) 基于深度神经网络和随机森林的飞机电源系统故障识别方法
CN116561692A (zh) 一种动态更新的实时量测数据检测方法
CN115295016A (zh) 一种设备运行状态监控方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant