CN114462771A - 用电异常分析方法、装置、设备、介质和产品 - Google Patents
用电异常分析方法、装置、设备、介质和产品 Download PDFInfo
- Publication number
- CN114462771A CN114462771A CN202111609057.8A CN202111609057A CN114462771A CN 114462771 A CN114462771 A CN 114462771A CN 202111609057 A CN202111609057 A CN 202111609057A CN 114462771 A CN114462771 A CN 114462771A
- Authority
- CN
- China
- Prior art keywords
- data
- historical
- encoder
- noise reduction
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 35
- 230000005611 electricity Effects 0.000 title claims description 168
- 230000009467 reduction Effects 0.000 claims abstract description 98
- 230000002159 abnormal effect Effects 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 53
- 238000004590 computer program Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000007405 data analysis Methods 0.000 claims abstract description 21
- 230000005856 abnormality Effects 0.000 claims abstract description 19
- 238000003860 storage Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims description 35
- 210000000349 chromosome Anatomy 0.000 description 26
- 210000002569 neuron Anatomy 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 238000001514 detection method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种用电异常分析方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取用户的用电数据,根据用电数据和预设的降噪自编码器,确定用电数据对应的重构数据,其中,降噪自编码器是基于用户的历史用电数据和历史用电数据对应的历史重构数据进行训练得到的,对重构数据进行数据分析,确定用电数据是否异常。采用本方法能够节约人力。
Description
技术领域
本申请涉及电网电力技术领域,特别是涉及一种用电异常分析方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着经济技术的发展和人们生活水平的提高,电能已经成为了人们生产和生活中必不可少的能源,然而窃电问题也明显增多。智能电表与智慧电网建设也在不断推进与完善,电力公司的电网大数据平台中获取大量的用户用电数据,通过对这些用电数据进行分析和研究,避免异常用电带来的潜在安全隐患。因此,对用电数据进行异常分析是一项有必要的工作,是保障电力企业收益的重要手段。
传统的用电异常检测方法,是通过人工根据经验来判断用电数据是否存在异常。例如获取一周内的用户用电数据,技术人员通过采用指标多次筛选用电数据并进行人工判断,指标筛选可以是对线损率>10%或<-10%的用电数据进行过滤,如果过滤后的用电数据跳变较大则认为用电数据异常,如果过滤后的用电数据变动较为平稳则则认为用电数据正常。
然而,传统的用电异常检测方法过于依赖人工,存在耗费人力问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够节约人力的用电异常分析方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种用电异常分析方法。所述方法包括:
获取用户的用电数据;
根据该用电数据和预设的降噪自编码器,确定该用电数据对应的重构数据;其中,该降噪自编码器是基于用户的历史用电数据和该历史用电数据对应的历史重构数据进行训练得到的;
对该重构数据进行数据分析,确定该用电数据是否异常。
在其中一个实施例中,根据该用电数据和预设的降噪自编码器,确定该用电数据对应的重构数据包括:
对该用电数据进行预处理,得到该用电数据对应的预处理数据;
将该预处理数据输入至该降噪自编码器,确定该用电数据对应的重构数据。
在其中一个实施例中,对该重构数据进行数据分析,确定该用电数据是否异常包括:
计算该重构数据和该预处理数据之间的相似度;
根据该相似度判断该用电数据是否异常。
在其中一个实施例中,根据该相似度判断该用电数据是否异常包括:
判断该相似度是否大于预设的相似度阈值,并根据判断结果确定该用电数据是否异常。
在其中一个实施例中,判断该相似度是否大于预设的相似度阈值,并根据判断结果确定该用电数据是否异常包括:
若该相似度大于该相似度阈值,则确定该用电数据异常;
或者,若该相似度不大于该相似度阈值,则确定该用电数据正常。
在其中一个实施例中,所述方法还包括:
获取多个用户的历史用电数据和每个该历史用电数据对应的历史重构数据;
对各该历史用电数据进行预处理,确定各该历史用电数据对应的历史预处理数据;
根据各该历史预处理数据和各该历史重构数据对初始降噪自编码器进行训练,确定该降噪自编码器。
第二方面,本申请还提供了一种用电异常分析装置。所述装置包括:
第一获取模块,用于获取用户的用电数据;
第一确定模块,用于根据该用电数据和预设的降噪自编码器,确定该用电数据对应的重构数据;其中,该降噪自编码器是基于用户的历史用电数据和该历史用电数据对应的历史重构数据进行训练得到的;
第二确定模块,用于对该重构数据进行数据分析,确定该用电数据是否异常。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一方法的步骤。
上述用电异常分析方法、装置、计算机设备、存储介质和计算机程序产品,通过获取用户的用电数据,并根据该用电数据和预设的降噪自编码器,确定该用电数据对应的重构数据;其中,该降噪自编码器是基于用户的历史用电数据和该历史用电数据对应的历史重构数据进行训练得到的,进而对该重构数据进行数据分析,确定该用电数据是否异常。由于本申请提供的方法无需依赖人工的经验对用电异常分析,而是根据训练得到的降噪自编码器对重构数据进行数据分析,进而确定用电数据是否异常,因此解决了传统技术中过于依赖人工而导致的耗费人力的问题,节约了人力。
附图说明
图1为本申请实施例中计算机设备的内部结构图;
图2为本申请实施例中提供的一种用电异常分析方法的流程示意图;
图3为本申请实施例中提供的一种确定重构数据的流程示意图;
图4为本申请实施例中提供的一种分析重构数据的流程示意图;
图5为本申请实施例中提供的确定降噪自编码器的流程示意图;
图6为本申请实施例提供的用电异常分析方法的总流程示意图;
图7为本申请实施例中提供的一种用电异常分析装置的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本实施例中,提供了一种用电异常分析方法,该方法可以应用于计算机设备,该计算机设备可以是服务器,也可以是终端,以终端为例,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种用电异常分析方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
图2为本申请实施例中提供的一种用电异常分析方法的流程示意图,该方法可以应用于计算机设备中,在一个实施例中,如图2所示,包括以下步骤:
S201,获取用户的用电数据。
在本实施例中,计算机设备获取用户的用电数据,用电数据可以包括电表收集到的在一段时间段内,例如1小时内的用电量数据、电压数据以及电流数据等,本实施例对用电数据内容和形式不做具体限制。
S202,根据用电数据和预设的降噪自编码器,确定用电数据对应的重构数据;其中,降噪自编码器是基于用户的历史用电数据和历史用电数据对应的历史重构数据进行训练得到的。
在本实施例中,计算机设备根据获取到的用电数据以及预设的降噪自编码器,确定用电数据对应的重构数据,其中,重构数据是用电数据的预测值。降噪自编码器是一种深度无监督模型,主要由编码器和解码器两个模块构成。基于降噪自编码器,输入用户的历史用电数据,进而降噪自编码器基于输入的历史用电数据添加高斯白噪音,再进行数据降维,然后对降维后的历史用电数据进行重构,得到历史用电数据对应的历史重构数据。需要说明的是,添加高斯白噪音相当于降噪自编码器的编码过程,数据降维和重构相当于降噪自编码的解码过程。本实施例中,根据用电数据和预设的降噪自编码器,可以通过如下方式一或方式二确定用电数据的对应的重构数据,本实施例对此不做限制。
方式一:将获取的用电数据输入至降噪自编码器,确定用电数据对应的重构数据。
方式二:对获取到的用电数据进行预处理,得到用电数据对应的预处理数据,进而将预处理数据输入至降噪自编码器,确定用电数据对应的重构数据。
S203,对重构数据进行数据分析,确定用电数据是否异常。
在本实施例中,计算机设备对得到的重构数据进行数据分析,确定用电数据是否异常。数据分析例如可以是比较重构数据和获取的用电数据之间的大小,再或者数据分析可以是比较重构数据和获取的用电数据之间的差异等等,例如重构数据和获取到的用电数据差异较大,就认为获取到的用电数据异常。
本实施例通过获取用户的用电数据,并根据用电数据和预设的降噪自编码器,确定用电数据对应的重构数据;其中,降噪自编码器是基于用户的历史用电数据和历史用电数据对应的历史重构数据进行训练得到的,进而对重构数据进行数据分析,确定用电数据是否异常。由于本申请提供的方法无需依赖人工的经验对用电异常分析,而是根据训练得到的降噪自编码器对重构数据进行数据分析,进而确定用电数据是否异常,因此解决了传统技术中过于依赖人工而导致的耗费人力的问题,节约了人力。
更进一步地,传统技术中依赖人工经验进行用电异常分析,可能存在误判、漏判以及分析效率不高的问题。而本实施例中,降噪自编码器是基于大量的用户的历史用电数据和历史用电数据对应的历史重构数据进行训练得到的,因此训练得到的降噪自编码器的准确性较高,同时采用该降噪自编码器确定用电数据的重构数据以及后续分析重构数据时,相比人工根据经验确定重构数据以及分析的速度更快,所需时间更短。因此,本实施例的方法还能够解决传统技术中存在误判、漏判以及分析效率不高的问题,提高用电异常分析的准确度和效率。
图3为本申请实施例中提供的一种确定重构数据的流程示意图,参照图3,本实施例涉及的是如何确定用电数据对应的重构数据的一种的可选的实现方式。在上述实施例的基础上,上述的S202还包括如下步骤:
S301,对用电数据进行预处理,得到用电数据对应的预处理数据。
在本实施例中,预处理包括回归插值和标准化处理。
用电数据在收集的过程中,由于机器例如电表损坏等原因容易导致收集的用电数据会有缺失,然而,缺失的用电数据中也同样蕴含着重要的信息。用电数据的缺失会对后续的用电异常分析工作带来一定的困难,甚至造成最终用电异常分析结果偏差,进而影响后续技术人员基于用异常分析进行决策的准确性。因此,本实施例中首先需要采用回归插值的方法对用电数据的缺失值进行填充。
更具体地,回归插值是根据样本中缺失变量和已得到变量构建回归方程。构建自变量与目标变量M的关系,自变量是用电数据中的已有数据,共有m个已有数据,m是大于等于2的整数;目标变量是用电数据中的缺失数据,因此第k个缺失值的插补估算值可根据如下式(1)进行计算,k是大于等于1小于等于m的整数。
其中,λi表示已有数据的权重值,λ0为初始权重,是已经预设好的值,Nik表示第k个自变量值,ξk表示随机性。
进一步地,不同属性的用电数据由于量级的问题可能在用电异常分析中使得量级小但是重要性高的数据占据非主导地位,其次还会影响用电异常分析的效率。因此,本实施例采用最大值-最小值法进行标准化处理,消除用电数据中不同属性具有不同量级时的影响。例如,用电数据包括属性1,属性2,……,属性X,其中属性X共有n个值,n为大于等于1的整数,属性X的n个值分为别为x1,x2,……xn,设xmax表示n个值中最大的值,xmin表示n个值中最小的值。根据如下公式(2),将属性X中的每个值经过最大值-最小值标准化操作映射在区间0-1之间。
其中,i取大于等于1小于等于n的整数,属性X中第i个值映射后为x′i。
因此,本实施例中,计算机设备采用公式(1)和(2)对获取的用电数据进行回归插值后再进行标准化处理,得到用电数据对应的预处理数据。
S302,将预处理数据输入至降噪自编码器,确定用电数据对应的重构数据。
在本实施例中,计算机设备将预处理数据作为预设的降噪自编码器的输入,进而输出用电数据对应的重构数据。
本实施例中对用电数据进行预处理,得到用电数据对应的预处理数据,并将预处理数据输入至降噪自编码器,确定用电数据对应的重构数据。由于对用电数据进行预处理,进一步能够提高了用电数据的准确性,从而提高基于预处理数据确定用电数据对应的重构数据的准确度和速度。
图4为本申请实施例中提供的一种分析重构数据的流程示意图,参照图4,本实施例涉及的是如何对重构数据进行数据分析的一种的可选的实现方式。在上述实施例的基础上,上述的S203还包括如下步骤:
S401,计算重构数据和预处理数据之间的相似度。
在本实施例中,计算机设备计算重构数据和预处理数据之间的相似度,更具体地,可计算重构数据和预处理数据之间的残差作为相似度。
S402,根据相似度判断用电数据是否异常。
在本实施例中,计算机设备根据相似度来判断用电数据是否异常。具体地,计算机设备判断相似度是否大于预设的相似度阈值,并根据判断结果确定用电数据是否异常。
本实施例中通过计算重构数据和预处理数据之间的相似度,并根据相似度判断用电数据是否异常,由于无需人工依赖经验来判断用电数据是否异常,因此节约了人力。
可选的,上述的S402还可以通过如下方式实现:
判断相似度是否大于预设的相似度阈值,并根据判断结果确定用电数据是否异常。
在本实施例中,可以比较相似度和相似度阈值的大小判断相似度是否大于预设的相似度阈值,若相似度的大小大于相似度阈值的大小,则确定用电数据异常;也可以计算相似度和相似度阈值的差值,若差值大于零,则相似度大于预设的相似度阈值,从而确定用电数据异常;也可以计算相似度和相似度阈值的商值,若商值大于1,则相似度大于预设的相似度阈值,从而确定用电数据异常。其中,相似度阈值可以是检测阈值ε,ε是一个根据降噪自编码器已知的值。
本实施例中通过判断相似度是否大于预设的相似度阈值,并根据判断结果确定用电数据是否异常,由于无需人工依赖经验来判断用电数据是否异常,因此节约了人力。
可选的,判断相似度是否大于预设的相似度阈值,并根据判断结果确定用电数据是否异常可以通过如下方式实现:
若相似度大于相似度阈值,则确定用电数据异常;或者,若相似度不大于相似度阈值,则确定用电数据正常。
在本实施例中,通过比较相似度与相似度阈值的大小确定用电数据是否异常。若相似度大于相似度阈值,即重构数据和预处理数据之间的残差大于检测阈值ε,则确定用电数据异常;若相似度不大于相似度阈值,即重构数据和预处理数据之间的残差不大于检测阈值ε,则确定用电数据正常。
在本实施例中若相似度大于相似度阈值,则确定用电数据异常,或者,若相似度不大于相似度阈值,则确定用电数据正常。由于比较相似度和相似度阈值就能够确定用电数据是否异常,进一步节省了人力,提高了用电异常分析的效率。
图5为本申请实施例中提供的确定降噪自编码器的流程示意图,参照图5,本实施例涉及的是如何确定降噪自编码器的一种的可选的实现方式。在上述实施例的基础上,上述的用电异常分析方法还包括如下步骤:
S501,获取多个用户的历史用电数据和每个历史用电数据对应的历史重构数据。
为了更清楚地对本申请降噪自编码器的训练方式进行说明,首先对本申请中的降噪自编码器(Denoising autoencoder,DAE)和有偏随机密钥遗传算法(Biased Random KeyGenetic Algorithm,BRKGA)做进一步说明。降噪自编码器由编码器和解码器两个模块构成,即具有编码过程和解码过程。编码过程和解码过程的函数表达式如式(3)和式(4)所示。
fθ(x)=sf(W*x+b) (3)
gη(x)=sg(WT*x+d) (4)
其中,fθ(x)是对输入数据的编码过程的函数表达式,gn(x)是对输入数据解码过程的函数表达式,sf和sg分别是编码器和解码器的非线性激活函数,sf为编码函数,sg为解码函数;θ={W,b},η={WT,d};W和WT表示权重矩阵;b和d表示偏置向量。
更具体地,降噪自编码器也是一种神经网络,降噪自编码器的网络参数包括所加噪声的分布、隐藏层神经元的个数、隐藏层神经元的偏置、节点之间连接的权值和相似度阈值等参数。结合遗传算法,将包括降噪自编码器的网络参数的一组数据称为“染色体”,即一条“染色体”包括降噪自编码器的网络参数,例如噪声的分布、隐藏层神经元的最大数量、每个隐藏层神经元的偏置值、节点之间连接的权值以及相似度阈值。
本实施例中定义:Ninput为降噪自编码器输入的数据的维度;Nhidden为隐藏层神经元的最大数量;Noutput为降噪自编码器输出的数据的维度;Ncon为降噪自编码器中网络节点间连接的数量;qi为二进制变量,用来表示第i个输入数据维度是否被加噪;yi为二进制变量,用来表示第i个隐藏层神经元是否被使用;bi为第i个隐藏层神经元的偏置值;wj为第j个连接的权值;i是大于等于1小于等于Nhidden的整数;j是大于等于1小于等于Ncon的整数。“染色体”的长度可以通过如下式(5)计算。
其中,是输入数据添加噪声的分布数量,表示使用的隐藏层神经元数量,是对应的隐藏层神经元的偏置值数量,是各神经元直接连接的权值数量,由于网络参数中还有一个检测阈值,因此l需要加1。结合式(5)可以看出,网络参数中的所有参数个数决定了“染色体”的长度。
本实施例中基于有偏随机密钥遗传算法优化降噪自编码器的网络参数,其中,随机密钥是在区间[0,1]中随机生成的实数。计算机设备获取多个用户的历史用电数据,并根据有偏随机密钥遗传算法在区间[0,1]中随机生成n个随机密钥,从而初始化对应的n个“染色体”,即初始化降噪自编码器的网络参数。例如,随机密钥1对应染色体1,染色体1包括一组网络参数,从而对应初始降噪自编码器1。其中,n是一个人为设定的大于零的整数值,是根据数据和实验给出的,例如是10或者15。
基于上述初始降噪自编码器,计算机设备根据预设规则将“染色体”中的网络参数提取出来,并基于预设规则计算,进而结合式(3)和式(4)完成降噪自编码器的编解码过程,从而得到每个历史用电数据对应的历史重构数据。
第二预设规则用于计算第i个隐藏层神经元是否被使用,如下式(7)。
其中,ai是第i个随机密钥。
第三预设规则用于计算yi=1的隐藏神经元的偏差值,如下式(8)。
第四预设规则用于将位于[0,1]区间内的随机密钥转换为位于[-1,1]区间内的权重值,如下式(9)。
第五预设规则用于计算相似度阈值,如下式(10)。
可以理解的是,结合第三预设规则和第四预设规则,如果yi=0,则第i个隐藏层的神经元的偏置值和与其互连的权值均为0,因此整个隐藏层神经元是统一的。降噪自编码器中的权重矩阵包括所有wj,偏置向量包括所有bi,因此式(3)和式(4)中的参数W、WT、b、d也体现在了“染色体”中。
S502,对各历史用电数据进行预处理,确定各历史用电数据对应的历史预处理数据。
在本实施例中,计算机设备也会对获取到的各历史用电数据进行预处理,从而确定各历史用电数据对应的历史预处理数据,预处理包括回归插值和标准化处理,方法与本申请中S201提供的方法相同,在此不再赘述。
S503,根据各历史预处理数据和各历史重构数据对初始降噪自编码器进行训练,确定降噪自编码器。
在本实施例中,n个随机密钥对应n个“染色体”,进而也对应n个初始降噪自编码器,因此,可以根据各历史预处理数据和各历史重构数据计算对应的适应度,从而可以计算出n个随机密钥对应的适应度函数,例如随机密钥1对应适应度1。降噪自编码器的无监督训练过程实际也是不断调整网络参数,从而确定最优适应度对应的网络参数。本实施例采用均方误差函数(Mean Square Error,MSE)作为适应度,计算公式如式(11)。
其中,Pk为用电数据的预测值,即各历史重构数据,Ak表示用电数据的实际值,即各历史预处理数据,N为各历史预处理数据的个数。
本实施例中将n个随机密钥向量进行排序分组,例如按照适应度排序分为两组,n个适应度中最小的若干个随机密钥被标记为精英个体,其余的被标记为非精英个体。本实施例不限制精英个体和非精英的个体的具体数量。进一步地,本实施例根据遗传算法,基于上述n个“染色体”迭代K次得到n个最后一代“染色体”。其中,“染色体”的迭代次数K是一个预设的指定值,例如K=100,第一次迭代后得到第一代染色体,100次迭代结束后得到最后一代染色体。具体地,迭代过程包括第k代的“染色次”由第k-1代精英个体的“染色体”、变异的“染色体”和由“染色体”交换产生的遗传后代三部分组成,以保证迭代的变化。可以理解的是,所有精英个体都被复制到了下一代;在初始种群中产生了少量的突变体也被添加到下一代,突变即随机的改变染色体的部分值,用[0,1]之间的随机值代替;下一代的剩余部分则是通过从精英群体和非精英群体中各随机挑选出一条遗传基因作为下一代的父母双亲,通过交换部分染色体得到子代。通过这三类方式得到的结果即构成了下一代。
本实施例得到n个最后一代“染色体”后,根据预设规则计算出n个最后一代“染色体”对应的适应度,并对n个最后一代染色体对应的适应度进行排序,得到最优适应度对应的“染色体”,进而确定该“染色体”对应的网络参数,从该得到确定降噪自编码器。需要说明的是,可以周期性地训练更新降噪自编码器,例如每30天就更新历史用电数据重新训练得到更新后的降噪自编码器,以便保证使用的降噪自编码器具有时效性。
本实施例中获取多个用户的历史用电数据和每个历史用电数据对应的历史重构数据,对各历史用电数据进行预处理,确定各历史用电数据对应的历史预处理数据,进而根据各历史预处理数据和各历史重构数据对初始降噪自编码器进行训练,确定降噪自编码器,进而提高了降噪自编码器的准确性,从而提高用电异常分析的准确性。
为了更清楚地对本实施例提供的供电方法进行介绍,在此结合图6进行解释说明。图6为本申请实施例提供的用电异常分析方法的总流程示意图,可以在计算机设备上执行。如图6所示,用户的用电数据会先进行回归插值对缺失值进行填充,再进行标准化处理消除用电数据中不同属性具有不同量级时的影响,并将预处理数据输入至降噪自编码器,得到用电数据对应的重构数据。其中,降噪自编码器是利用有偏随机密钥遗传算法优化训练后得到的模型,降噪自编码器中的网络参数包括检测阈值。进而计算重构数据和所述预处理数据之间的残差,从而将残差与检测阈值作比较,残差大于检测阈值时表示输入的用电数据异常,残差不大于检测阈值时表示输入的用电数据正常。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的用电异常分析方法的用电异常分析装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个用电异常分析装置实施例中的具体限定可以参见上文中对于用电异常分析方法的限定,在此不再赘述。
参照图7,图7为本申请实施例中提供的一种用电异常分析装置的结构示意图,该装置700包括第一获取模块701、第一确定模块702和第二确定模块703,其中:
第一获取模块701,用于获取用户的用电数据。
第一确定模块702,用于根据用电数据和预设的降噪自编码器,确定用电数据对应的重构数据;其中,降噪自编码器是基于用户的历史用电数据和历史用电数据对应的历史重构数据进行训练得到的。
第二确定模块703,用于对重构数据进行数据分析,确定用电数据是否异常。
本实施例提供的用电异常分析装置通过获取用户的用电数据,并根据用电数据和预设的降噪自编码器,确定用电数据对应的重构数据;其中,降噪自编码器是基于用户的历史用电数据和历史用电数据对应的历史重构数据进行训练得到的,进而对重构数据进行数据分析,确定用电数据是否异常。由于本申请提供的方法无需依赖人工的经验对用电异常分析,而是根据训练得到的降噪自编码器对重构数据进行数据分析,进而确定用电数据是否异常,因此解决了传统技术中过于依赖人工而导致的耗费人力的问题,节约了人力。
可选的,第一确定模块701包括:
预处理单元,用于对用电数据进行预处理,得到用电数据对应的预处理数据。
确定单元,用于将预处理数据输入至降噪自编码器,确定用电数据对应的重构数据。
可选的,第二确定模块703包括:
计算单元,用于计算重构数据和预处理数据之间的相似度。
判断单元,用于根据相似度判断用电数据是否异常。
可选的,判断单元用于判断相似度是否大于预设的相似度阈值,并根据判断结果确定用电数据是否异常。
可选的,判断单元包括用于若相似度大于相似度阈值,则确定用电数据异常,或者,若相似度不大于相似度阈值,则确定用电数据正常。
可选的,该装置700还包括:
第二获取模块,用于获取多个用户的历史用电数据和每个历史用电数据对应的历史重构数据。
第三确定模块,用于对各历史用电数据进行预处理,确定各历史用电数据对应的历史预处理数据。
第四确定模块,用于根据各历史预处理数据和各历史重构数据对初始降噪自编码器进行训练,确定降噪自编码器。
上述用电异常分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取用户的用电数据;
根据所述用电数据和预设的降噪自编码器,确定所述用电数据对应的重构数据;其中,所述降噪自编码器是基于用户的历史用电数据和所述历史用电数据对应的历史重构数据进行训练得到的;
对所述重构数据进行数据分析,确定所述用电数据是否异常。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述用电数据进行预处理,得到所述用电数据对应的预处理数据;
将所述预处理数据输入至所述降噪自编码器,确定所述用电数据对应的重构数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
计算所述重构数据和所述预处理数据之间的相似度;
根据所述相似度判断所述用电数据是否异常。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
判断所述相似度是否大于预设的相似度阈值,并根据判断结果确定所述用电数据是否异常。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
若所述相似度大于所述相似度阈值,则确定所述用电数据异常;
或者,若所述相似度不大于所述相似度阈值,则确定所述用电数据正常。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取多个用户的历史用电数据和每个所述历史用电数据对应的历史重构数据;
对各所述历史用电数据进行预处理,确定各所述历史用电数据对应的历史预处理数据;
根据各所述历史预处理数据和各所述历史重构数据对初始降噪自编码器进行训练,确定所述降噪自编码器。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取用户的用电数据;
根据所述用电数据和预设的降噪自编码器,确定所述用电数据对应的重构数据;其中,所述降噪自编码器是基于用户的历史用电数据和所述历史用电数据对应的历史重构数据进行训练得到的;
对所述重构数据进行数据分析,确定所述用电数据是否异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对所述用电数据进行预处理,得到所述用电数据对应的预处理数据;
将所述预处理数据输入至所述降噪自编码器,确定所述用电数据对应的重构数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
计算所述重构数据和所述预处理数据之间的相似度;
根据所述相似度判断所述用电数据是否异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
判断所述相似度是否大于预设的相似度阈值,并根据判断结果确定所述用电数据是否异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若所述相似度大于所述相似度阈值,则确定所述用电数据异常;
或者,若所述相似度不大于所述相似度阈值,则确定所述用电数据正常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取多个用户的历史用电数据和每个所述历史用电数据对应的历史重构数据;
对各所述历史用电数据进行预处理,确定各所述历史用电数据对应的历史预处理数据;
根据各所述历史预处理数据和各所述历史重构数据对初始降噪自编码器进行训练,确定所述降噪自编码器。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取用户的用电数据;
根据所述用电数据和预设的降噪自编码器,确定所述用电数据对应的重构数据;其中,所述降噪自编码器是基于用户的历史用电数据和所述历史用电数据对应的历史重构数据进行训练得到的;
对所述重构数据进行数据分析,确定所述用电数据是否异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对所述用电数据进行预处理,得到所述用电数据对应的预处理数据;
将所述预处理数据输入至所述降噪自编码器,确定所述用电数据对应的重构数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
计算所述重构数据和所述预处理数据之间的相似度;
根据所述相似度判断所述用电数据是否异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
判断所述相似度是否大于预设的相似度阈值,并根据判断结果确定所述用电数据是否异常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
若所述相似度大于所述相似度阈值,则确定所述用电数据异常;
或者,若所述相似度不大于所述相似度阈值,则确定所述用电数据正常。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取多个用户的历史用电数据和每个所述历史用电数据对应的历史重构数据;
对各所述历史用电数据进行预处理,确定各所述历史用电数据对应的历史预处理数据;
根据各所述历史预处理数据和各所述历史重构数据对初始降噪自编码器进行训练,确定所述降噪自编码器。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种用电异常分析方法,其特征在于,所述方法包括:
获取用户的用电数据;
根据所述用电数据和预设的降噪自编码器,确定所述用电数据对应的重构数据;其中,所述降噪自编码器是基于用户的历史用电数据和所述历史用电数据对应的历史重构数据进行训练得到的;
对所述重构数据进行数据分析,确定所述用电数据是否异常。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用电数据和预设的降噪自编码器,确定所述用电数据对应的重构数据,包括:
对所述用电数据进行预处理,得到所述用电数据对应的预处理数据;
将所述预处理数据输入至所述降噪自编码器,确定所述用电数据对应的重构数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述重构数据进行数据分析,确定所述用电数据是否异常,包括:
计算所述重构数据和所述预处理数据之间的相似度;
根据所述相似度判断所述用电数据是否异常。
4.根据权利要求3所述的方法,其特征在于,所述根据所述相似度判断所述用电数据是否异常,包括:
判断所述相似度是否大于预设的相似度阈值,并根据判断结果确定所述用电数据是否异常。
5.根据权利要求4所述的方法,其特征在于,所述判断所述相似度是否大于预设的相似度阈值,并根据判断结果确定所述用电数据是否异常,包括:
若所述相似度大于所述相似度阈值,则确定所述用电数据异常;
或者,若所述相似度不大于所述相似度阈值,则确定所述用电数据正常。
6.根据权利要求2-5任意一项所述的方法,其特征在于,所述降噪自编码器的训练方式包括:
获取多个用户的历史用电数据和每个所述历史用电数据对应的历史重构数据;
对各所述历史用电数据进行预处理,确定各所述历史用电数据对应的历史预处理数据;
根据各所述历史预处理数据和各所述历史重构数据对初始降噪自编码器进行训练,确定所述降噪自编码器。
7.一种用电异常分析装置,其特征在于,所述装置包括:
第一获取模块,用于获取用户的用电数据;
第一确定模块,用于根据所述用电数据和预设的降噪自编码器,确定所述用电数据对应的重构数据;其中,所述降噪自编码器是基于用户的历史用电数据和所述历史用电数据对应的历史重构数据进行训练得到的;
第二确定模块,用于对所述重构数据进行数据分析,确定所述用电数据是否异常。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111609057.8A CN114462771A (zh) | 2021-12-27 | 2021-12-27 | 用电异常分析方法、装置、设备、介质和产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111609057.8A CN114462771A (zh) | 2021-12-27 | 2021-12-27 | 用电异常分析方法、装置、设备、介质和产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114462771A true CN114462771A (zh) | 2022-05-10 |
Family
ID=81407121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111609057.8A Pending CN114462771A (zh) | 2021-12-27 | 2021-12-27 | 用电异常分析方法、装置、设备、介质和产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114462771A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117076991A (zh) * | 2023-10-16 | 2023-11-17 | 云境商务智能研究院南京有限公司 | 治污设备用电异常监测方法、装置及计算机设备 |
-
2021
- 2021-12-27 CN CN202111609057.8A patent/CN114462771A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117076991A (zh) * | 2023-10-16 | 2023-11-17 | 云境商务智能研究院南京有限公司 | 治污设备用电异常监测方法、装置及计算机设备 |
CN117076991B (zh) * | 2023-10-16 | 2024-01-02 | 云境商务智能研究院南京有限公司 | 治污设备用电异常监测方法、装置及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112734128B (zh) | 一种基于优化rbf的7日电力负荷峰值预测方法 | |
Cheng et al. | Enhanced state estimation and bad data identification in active power distribution networks using photovoltaic power forecasting | |
CN107506868A (zh) | 一种短时电力负荷预测的方法及装置 | |
CN112381673B (zh) | 一种基于数字孪生的园区用电信息分析方法及装置 | |
CN112733417A (zh) | 一种基于模型优化的异常负荷数据检测与修正方法和系统 | |
Huang et al. | An experimental method to estimate running time of evolutionary algorithms for continuous optimization | |
Xue et al. | Estimating state of health of lithium-ion batteries based on generalized regression neural network and quantum genetic algorithm | |
Liu et al. | Global maximum likelihood estimation procedure for multinomial probit (MNP) model parameters | |
Li et al. | Study on solution models and methods for the fuzzy assignment problems | |
CN114065653A (zh) | 电力负荷预测模型的构建方法与电力负荷预测方法 | |
Fu et al. | A compound framework incorporating improved outlier detection and correction, VMD, weight-based stacked generalization with enhanced DESMA for multi-step short-term wind speed forecasting | |
CN116937559A (zh) | 基于循环神经网络和张量分解的电力系统负荷预测系统和方法 | |
CN104834975A (zh) | 一种基于智能算法优化组合的电网负荷率预测方法 | |
CN117175574A (zh) | 电力系统调度方法、装置、计算机设备和存储介质 | |
CN114462771A (zh) | 用电异常分析方法、装置、设备、介质和产品 | |
Wang et al. | Modelling redundancy allocation for a fuzzy random parallel–series system | |
Ashofteh et al. | Application of bi-objective genetic programming for optimizing irrigation rules using two reservoir performance criteria | |
CN118195353A (zh) | 电力系统负荷预测方法、装置、计算机设备和存储介质 | |
Fu et al. | Lithium-ion battery SOH prediction based on VMD-PE and improved DBO optimized temporal convolutional network model | |
CN114066250A (zh) | 一种输电项目修理成本测算方法、装置、设备及存储介质 | |
CN118014352A (zh) | 基于lime模型的变电工程造价动态预警方法和装置 | |
CN114202174A (zh) | 一种电价风险等级预警方法、装置及存储介质 | |
CN116776209A (zh) | 一种关口计量装置运行状态辨识方法、系统、设备及介质 | |
CN115481767A (zh) | 面向配电网检修的运行数据处理方法、装置和计算机设备 | |
Nahid et al. | Home occupancy classification using machine learning techniques along with feature selection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |