CN115146735A - 用户用电异常识别 - Google Patents
用户用电异常识别 Download PDFInfo
- Publication number
- CN115146735A CN115146735A CN202210845519.4A CN202210845519A CN115146735A CN 115146735 A CN115146735 A CN 115146735A CN 202210845519 A CN202210845519 A CN 202210845519A CN 115146735 A CN115146735 A CN 115146735A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- power
- abnormal
- electricity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 claims abstract description 51
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 230000002159 abnormal effect Effects 0.000 claims abstract description 19
- 238000007637 random forest analysis Methods 0.000 claims abstract description 13
- 238000007418 data mining Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000003066 decision tree Methods 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000001932 seasonal effect Effects 0.000 claims description 3
- 230000003442 weekly effect Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims 1
- 230000006399 behavior Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及电力技术领域,且公开了用户用电异常识别,其包括以下步骤:S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据;S2、构建用电特征指标,其中,用电特征指标包括:1)电压不平衡;2)电流不平衡;3)二次侧分流;4)有功之和异常;5)用户自身负荷曲线异常;S3、计算指标权重,应用AHP算法,将专家经验量化;S4、对上述指标加权。该用户用电异常识别,通过采集终端采集到的用户电气特征数据和电量数据,首先构建用电特征指标,其次应用AHP算法为指标赋权,最后应用随机森林算法进行用户用电异常识别,相比传统的专家现场巡查识别方式,耗费时间短,人工成本低,针对性强,效率高,可满足当前用电异常检测的需求。
Description
技术领域
本发明涉及电力技术领域,具体为用户用电异常识别。
背景技术
近年来,随着市场经济的日益发展,电能作为一种清洁能源被广泛使用于国民经济的各个领域和人民的生产、生活中,由于电能费用占企业成本比重较大,一些不法经营者、个体私营业主为谋取暴利,置国家法律、法规于不顾,不择手段地窃取国家电能,猖狂的窃电行为严重损害了企业和个人的合法权益,扰乱了正常的供用电秩序,阻碍了电力事业的发展,给安全用电带来了严重威胁,窃电已经上升为一个不容忽视的社会问题。
随着各行业对电的需求不断扩大,违窃电问题变的越来越突出,违窃电等用户用电异常情况可能对电网的供电安全产生影响,同时也影响了供电企业的利益,如何精准识别用户用电异常行为成为供电企业特别关注的问题,传统的用电异常检测主要依靠经验丰富的专家现场巡查完成,耗时费力,针对性差,成本高,时间维度长,已经无法满足当前用电异常检测需求,针对上述方法的不足,需要引入当前流行的机器学习算法来自动而高效的识别异常信息。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了用户用电异常识别,具备用电特征凝聚专家经验,机器学习算法自动高效等优点,解决了传统的用户用电异常识别效率低、精准度差的问题。
(二)技术方案
为实现上述用电特征凝聚专家经验,机器学习算法自动高效的目的,本发明提供如下技术方案:用户用电异常识别,其包括以下步骤:
S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据;
S2、构建用电特征指标;
S3、计算指标权重,应用AHP算法,将专家经验量化;
S4、对上述指标加权,应用随机森林算法对用户用电进行异常识别。
优选的,所述用电特征指标包括:
1)电压不平衡;
2)电流不平衡
3)二次侧分流;
4)有功之和异常;
5)用户自身负荷曲线异常。
其中,1)-4)指标根据专家经验判断规则计算,5)指标应用聚类算法来自动识别异常。
优选的,所述用户电量数据包括日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征和空值特征,且所述特征包括最大值、最小值、平均值、方差、偏度、峰度、中位数、上四分位数、下四分位数和四分位差。
优选的,所述随机森林算法做特征选择的步骤如下:首先,对每一颗决策树选择相应的袋外数据,并计算袋外数据误差,记为errOOB1,随机对袋外数据OOB所有样本的特征X加入噪声干扰,重复计算袋外数据误差,记为errOOB2,假设森林中有N棵树,则特征X的重要性为:
∑(errOOB2-errOOB1)/N。
优选的,所述数据获取还包括数据挖掘,且数据挖掘包括确定数据挖掘的目标,收集数据挖掘所需要的输入数据集合,对数据进行预处理,导入模型,运行模型,完成数据训练。
优选的,所述确定数据挖掘的目标,在窃电行为分析上就是明确识别模型的目标,即准确识别出窃电用户,所述收集数据挖掘所需要的输入数据集合,窃电用户识别的模型数据来源主要是用电信息采集系统中的用户电力数据。
优选的,所述数据预处理,对输入数据进行预处理,其预处理包括数据清洗和数据的归一化,使杂乱无章的数据更加有序,模型表达与解释,模型输出的结果一般情况下为一系列数据集合,为了更为直观的表达,将数据转换为折线图或者直方图的形式,展现训练结果。
(三)有益效果
与现有技术相比,本发明提供了用户用电异常识别,具备以下有益效果:
该用户用电异常识别,通过采集终端采集到的用户电气特征数据和电量数据,首先构建用电特征指标,其次应用AHP算法为指标赋权,最后应用随机森林算法进行用户用电异常识别,相比传统的专家现场巡查识别方式,耗费时间短,人工成本低,针对性强,效率高,可满足当前用电异常检测的需求。
附图说明
图1为本发明提出的用户用电异常识别的步骤流程示意图;
图2为本发明提出的用户用电异常识别的数据挖掘流程示意图;
图3为本发明提出的用户用电异常识别的基于随机森林的核心特征图。
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本实施例中的用户用电异常识别,其包括以下步骤:
S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据,用户电量数据包括日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征和空值特征,且特征包括最大值、最小值、平均值、方差、偏度、峰度、中位数、上四分位数、下四分位数和四分位差;
S2、构建用电特征指标;
S3、计算指标权重,应用AHP算法,将专家经验量化,AHP是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法,它的特点是把复杂问题中的各种因素通过划分为相互联系的有序层次,使之条理化,根据对一定客观现实的主观判断结构(主要是两两比较)把专家意见和分析者的客观判断结果直接而有效地结合起来,将一层次元素两两比较的重要性进行定量描述;
S4、对上述指标加权,应用随机森林算法对用户用电进行异常识别,随机森林指的是利用多棵树对样本进行训练并预测的一种分类器,在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
其中,用电特征指标包括:
1)电压不平衡;
2)电流不平衡
3)二次侧分流;
4)有功之和异常;
5)用户自身负荷曲线异常。
其中,1)-4)指标根据专家经验判断规则计算,5)指标应用聚类算法来自动识别异常。
另外,随机森林算法做特征选择的步骤如下:首先,对每一颗决策树选择相应的袋外数据,并计算袋外数据误差,记为errOOB1,袋外数据指每次建立决策树时,通过重复抽样得到一个数据用于训练决策树,这时还有大约1/3的数据没有被利用,没有参与决策树的建立,这部分数据可以用于对决策树的性能进行评估,计算模型的预测错误率,称为袋外数据误差,随机对袋外数据OOB所有样本的特征X加入噪声干扰,重复计算袋外数据误差,记为errOOB2,假设森林中有N棵树,则特征X的重要性为:
∑(errOOB2-errOOB1)/N,这个数值之所以能够说明特征的重要性,是因为加入随机噪声后,袋外数据准确率大幅下降,即errOOB2上升,说明这个特征对于样本的预测结果有很大影响,进而说明重要程度比较高。
需要说明的是,数据获取还包括数据挖掘,且数据挖掘包括确定数据挖掘的目标,收集数据挖掘所需要的输入数据集合,对数据进行预处理,导入模型,运行模型,完成数据训练,确定数据挖掘的目标,在窃电行为分析上就是明确识别模型的目标,即准确识别出窃电用户,收集数据挖掘所需要的输入数据集合,窃电用户识别的模型数据来源主要是用电信息采集系统中的用户电力数据,数据预处理,对输入数据进行预处理,其预处理包括数据清洗和数据的归一化,使杂乱无章的数据更加有序,模型表达与解释,模型输出的结果一般情况下为一系列数据集合,为了更为直观的表达,将数据转换为折线图或者直方图的形式,展现训练结果。
本发明的有益效果是:
通过采集终端采集到的用户电气特征数据和电量数据,首先构建用电特征指标,其次应用AHP算法为指标赋权,最后应用随机森林算法进行用户用电异常识别,相比传统的专家现场巡查识别方式,耗费时间短,人工成本低,针对性强,效率高,可满足当前用电异常检测的需求。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (7)
1.用户用电异常识别,其特征在于,包括以下步骤:
S1、数据获取,获取用户瞬时量数据、电量数据和用户是否异常用电标签数据;
S2、构建用电特征指标;
S3、计算指标权重,应用AHP算法,将专家经验量化;
S4、对上述指标加权,应用随机森林算法对用户用电进行异常识别。
2.根据权利要求1所述的用户用电异常识别,其特征在于,所述用电特征指标包括:
1)电压不平衡;
2)电流不平衡
3)二次侧分流;
4)有功之和异常;
5)用户自身负荷曲线异常。
其中,1)-4)指标根据专家经验判断规则计算,5)指标应用聚类算法来自动识别异常。
3.根据权利要求1所述的用户用电异常识别,其特征在于,所述用户电量数据包括日用电特征、周用电量特征、月用电量特征、季用电量特征、年用电量特征、总用电量特征、0值特征和空值特征,且所述特征包括最大值、最小值、平均值、方差、偏度、峰度、中位数、上四分位数、下四分位数和四分位差。
4.根据权利要求1所述的用户用电异常识别,其特征在于,所述随机森林算法做特征选择的步骤如下:首先,对每一颗决策树选择相应的袋外数据,并计算袋外数据误差,记为errOOB1,随机对袋外数据OOB所有样本的特征X加入噪声干扰,重复计算袋外数据误差,记为errOOB2,假设森林中有N棵树,则特征X的重要性为:
∑(errOOB2-errOOB1)/N。
5.根据权利要求1所述的用户用电异常识别,其特征在于,所述数据获取还包括数据挖掘,且数据挖掘包括确定数据挖掘的目标,收集数据挖掘所需要的输入数据集合,对数据进行预处理,导入模型,运行模型,完成数据训练。
6.根据权利要求5所述的用户用电异常识别,其特征在于,所述确定数据挖掘的目标,在窃电行为分析上就是明确识别模型的目标,即准确识别出窃电用户,所述收集数据挖掘所需要的输入数据集合,窃电用户识别的模型数据来源主要是用电信息采集系统中的用户电力数据。
7.根据权利要求5所述的用户用电异常识别,其特征在于,所述数据预处理,对输入数据进行预处理,其预处理包括数据清洗和数据的归一化,使杂乱无章的数据更加有序,模型表达与解释,模型输出的结果一般情况下为一系列数据集合,为了更为直观的表达,将数据转换为折线图或者直方图的形式,展现训练结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210845519.4A CN115146735A (zh) | 2022-07-19 | 2022-07-19 | 用户用电异常识别 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210845519.4A CN115146735A (zh) | 2022-07-19 | 2022-07-19 | 用户用电异常识别 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115146735A true CN115146735A (zh) | 2022-10-04 |
Family
ID=83412220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210845519.4A Pending CN115146735A (zh) | 2022-07-19 | 2022-07-19 | 用户用电异常识别 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115146735A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795354A (zh) * | 2023-02-06 | 2023-03-14 | 北京志翔科技股份有限公司 | 三合一场所的识别方法和识别装置 |
-
2022
- 2022-07-19 CN CN202210845519.4A patent/CN115146735A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115795354A (zh) * | 2023-02-06 | 2023-03-14 | 北京志翔科技股份有限公司 | 三合一场所的识别方法和识别装置 |
CN115795354B (zh) * | 2023-02-06 | 2023-04-25 | 北京志翔科技股份有限公司 | 三合一场所的识别方法和识别装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN111738364B (zh) | 一种基于用户负荷与用电参量相结合的窃电检测方法 | |
Angelos et al. | Detection and identification of abnormalities in customer consumptions in power distribution systems | |
CN103617568B (zh) | 稳态电能质量预警机制中的异常数据判定阈值设定方法 | |
CN111614491B (zh) | 一种面向电力监控系统安全态势评估指标选取方法及系统 | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN109977535A (zh) | 一种线损异常诊断方法、装置、设备及可读存储介质 | |
CN111008193B (zh) | 一种数据清洗与质量评价方法及系统 | |
CN111861786B (zh) | 一种基于特征选择和孤立随机森林的专变窃电识别方法 | |
CN115865649B (zh) | 一种智能运维管理控制方法、系统和存储介质 | |
CN109947815B (zh) | 一种基于离群点算法的窃电辨识方法 | |
CN112418687B (zh) | 基于用电特征的用户用电异常识别方法、装置和存储介质 | |
CN116739829B (zh) | 一种基于大数据的电力数据分析方法、系统及介质 | |
CN115146735A (zh) | 用户用电异常识别 | |
CN116796271A (zh) | 一种居民用能异常识别方法 | |
CN115660262A (zh) | 一种基于数据库应用的工程智慧质检方法、系统及介质 | |
CN112733456B (zh) | 一种反窃电行为识别方法和系统 | |
CN111178690A (zh) | 基于风控评分卡模型的用电客户窃电风险评估方法 | |
CN113077165B (zh) | 一种发电机组市场力滥用判别方法 | |
CN117436688A (zh) | 一种基于电力营销数据的电费回收风险预警方法及系统 | |
CN110852621A (zh) | 电力客户负荷特性分析及分类方法、装置及可读存储介质 | |
CN111612054A (zh) | 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法 | |
CN111060755A (zh) | 一种电磁干扰诊断方法和装置 | |
CN115905319A (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN115081950A (zh) | 企业成长性评估建模方法、系统、计算机及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |