CN111506635A - 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 - Google Patents
一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 Download PDFInfo
- Publication number
- CN111506635A CN111506635A CN202010393170.6A CN202010393170A CN111506635A CN 111506635 A CN111506635 A CN 111506635A CN 202010393170 A CN202010393170 A CN 202010393170A CN 111506635 A CN111506635 A CN 111506635A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- electricity utilization
- abnormal
- autoregressive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 15
- 238000013480 data collection Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 13
- 238000007726 management method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000005612 types of electricity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Fuzzy Systems (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
针对大数据背景下智能用户用电行为分类问题,本发明公开了一种通过运用自回归和朴素贝叶斯算法,根据历史用电数据和实时的电力负荷情况来识别居民用电安全隐患的系统及方法,主要包括通过异常分析剔除掉个别极端用电数值,通过自回归模型建立每个用电单位的48小时用电曲线,以及利用朴素贝叶斯算法对实时的用电数据进行分类。
Description
技术领域
本发明涉及电力大数据分析领域,具体涉及一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法。
背景技术
运用用电负荷数据对居民用电安全进行监测和管理在近年来的社区管理中越来越多的被应用,对于如何分析出的潜在的用电安全隐患或特殊情况,如何进行分类管理也越来越被社区管理所重视,而成为了未来智能化城市系统中一个必须要解决的问题。随着我国的城市化推进,大量的人口群聚居住,传统的用电安全管理方法变得滞后和低效。对于很多具有潜在用电安全隐患的用电单位,往往做不到提前预判和识别,比如:非法群租房,独居老人,非法社区作坊等。随着智能电表在城市中的广泛推广应用,越来越多的实时用电负荷数据可以管理机构很好的收集到,这为智能化管理提供了数据上的可能。本发明旨在通过对实时的用电负荷数据,运用多种数理统计的模型来识别用户用电特征,分类用户用电情况,为城市管理者及供电,用电方对居民用电的综合管理提出决策性的意见。
发明内容
本发明提出了一种基于电力负荷数据分析居民用电行为的系统及方法,其主要的应用在于在分类用户用电规律,识别潜在非正常用电情况。整个过程包括了数据收集模块,剔除极端值模块, 自相关系数分析模块以及实时识别报告模块,如图1所示。
电力负荷数据收集模块通常通过智能电表等终端设备采集, 存储并处理原始居民用电负荷数据,并对这些数据进行分析, 整合, 校正, 填补缺失值, 以及标准化处理。异常分析模块将电力负荷数据中的极端异常值剔除, 这其中包括了, 数据录入时发生的读取错误照成的极大极小值和缺失值。异常分析之后的数据录入到自回归分析模块,该模块对每一个用电单位的负荷数据进行48小时的自回归分析,通过计算同一时段在不同天的相关性,分析出该用电单位的用电规律是正常, 较为正常, 还是异常。最后在朴素贝叶斯模型中,通过历史历史数据(正常和异常)训练模型,通过朴素贝叶斯模型对实时用电数据进行分类,并通过识别报告模块,报告该用户是否属于用电异常用户。
附图说明
图1为本发明实施中居民用电行为分析模块流程图。
图2为本发明实施中识别为用电行为正常的示意图。
图3为本发明实施中识别为用电行为较为正常的示意图。
图4为本发明实施中识别为用电行为异常的示意图。
具体实施方式
为使得本发明的内容、目的、特征及优点能够更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护说明书的范围。
整个系统运行的具体步骤如下。
1.数据收集模块:对每一个用电单位的用电数据进行收集和存储。用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为小时。
2.根据步骤1中所取得的处理后的用电负荷数据,首先对每一个用户的用电数据进行异常分析,剔除掉极端值:
1) 数据值为:
2) 假设每一个用户的数据负荷高斯分布:
3) 求出相应参数:
其中k值, 我们选取48,为48小时。
4.根据步骤3的结果, 原数据为每一个用户的小时用电量,转化为每一用户的自回归系数,训练数据集:
5.通过步骤3的自回归分析结果, 我们选择第24和48的值, 如果两个值相加的和大于0.4, 视为该用户用电行为正常;如果两个值相加的和小于0.4但大于0.15,视为该用户用电行为较为异常;如果两个值相加的和小于0.4但大于0.15,视为该用户用电行为异常:
输出实例x所属的类y:
(1)计算先验概率及条件概率
6.当实时数据进入系统会得到以下结果:其中图2为识别后用户正常用电行为,图3为识别后用户较为异常用电行为,图4为识别后用户异常用电行为。
本发明通过对用电负荷的深度数据分析挖掘,一种通过运用自回归和朴素贝叶斯算法,根据历史用电数据和实时的电力负荷情况来识别居民用电安全隐患的系统及方法。该方式针对一个社区区域内同一类别用电情况的用户进行分析,并建立群体代表性用电情况画像,将在规模化管理特定区域的用电安全情况有十分多的应用,并在很大程度上节省相关人员工作量与筛查速率,将改善行政管理和用电安全的效率。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做出种种的等同变形或替换,这些等同的变型或替换均包含在本申请权利要求所限定的范围内。
Claims (1)
1.本发明提出的一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法,其特征在于,包括:
步骤1、数据收集模块:对每一个用电单位的用电数据进行收集和存储,用电负荷数据可以采用不同的频率进行录入,在进入分析之前会求和或再分配为小时;
步骤2、根据步骤1中所取得的处理后的用电负荷数据,首先对每一个用户的用电数据进行异常分析,剔除掉极端值:
1) 数据值为:
2) 假设每一个用户的数据负荷高斯分布:
3) 求出相应参数:
其中k值, 我们选取48,为48小时;
步骤4、根据步骤3的结果, 原数据为每一个用户的小时用电量,转化为每一用户的自回归系数,训练数据集:
步骤5、通过步骤3的自回归分析结果, 我们选择第24和48的值, 如果两个值相加的和大于0.4, 视为该用户用电行为正常;如果两个值相加的和小于0.4但大于0.15,视为该用户用电行为较为异常;如果两个值相加的和小于0.4但大于0.15,视为该用户用电行为异常:
输出实例x所属的类y:
(1)计算先验概率及条件概率
步骤6、当实时数据进入系统会得到以下结果:其中图2为识别后用户正常用电行为,图3为识别后用户较为异常用电行为,图4为识别后用户异常用电行为。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010393170.6A CN111506635A (zh) | 2020-05-11 | 2020-05-11 | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010393170.6A CN111506635A (zh) | 2020-05-11 | 2020-05-11 | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111506635A true CN111506635A (zh) | 2020-08-07 |
Family
ID=71865065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010393170.6A Pending CN111506635A (zh) | 2020-05-11 | 2020-05-11 | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111506635A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111932138A (zh) * | 2020-08-17 | 2020-11-13 | 上海积成能源科技有限公司 | 一种基于高斯混合模型和期望极大算法的居民用电行为分析的系统及方法 |
CN111966676A (zh) * | 2020-09-04 | 2020-11-20 | 上海积成能源科技有限公司 | 一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法 |
CN112036469A (zh) * | 2020-08-28 | 2020-12-04 | 上海积成能源科技有限公司 | 一种基于自回归和提升树算法的居民用电行为分析的系统及方法 |
CN114971002A (zh) * | 2022-05-20 | 2022-08-30 | 国网湖北省电力有限公司营销服务中心(计量中心) | 一种基于计量终端负荷监测技术的异常电量预测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127360A (zh) * | 2016-06-06 | 2016-11-16 | 国网天津市电力公司 | 一种基于用户特性分析的多模型负荷预测方法 |
CN110264001A (zh) * | 2019-06-20 | 2019-09-20 | 国网上海市电力公司 | 基于多时序的用电负荷预测方法 |
CN110570090A (zh) * | 2019-08-12 | 2019-12-13 | 国网上海市电力公司 | 一种基于贝叶斯分类法的基线负荷模型的负荷辨识方法 |
CN110610280A (zh) * | 2018-10-31 | 2019-12-24 | 山东大学 | 一种电力负荷短期预测方法、模型、装置及系统 |
CN110689279A (zh) * | 2019-10-12 | 2020-01-14 | 上海积成能源科技有限公司 | 一种基于电力负荷数据的居民用电安全隐患分析系统及方法 |
CN110825723A (zh) * | 2019-10-09 | 2020-02-21 | 上海电力大学 | 一种基于用电负荷分析的居民用户分类方法 |
CN110826641A (zh) * | 2019-11-13 | 2020-02-21 | 上海积成能源科技有限公司 | 一种基于聚类分析归类居民用电情况的系统及方法 |
-
2020
- 2020-05-11 CN CN202010393170.6A patent/CN111506635A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127360A (zh) * | 2016-06-06 | 2016-11-16 | 国网天津市电力公司 | 一种基于用户特性分析的多模型负荷预测方法 |
CN110610280A (zh) * | 2018-10-31 | 2019-12-24 | 山东大学 | 一种电力负荷短期预测方法、模型、装置及系统 |
CN110264001A (zh) * | 2019-06-20 | 2019-09-20 | 国网上海市电力公司 | 基于多时序的用电负荷预测方法 |
CN110570090A (zh) * | 2019-08-12 | 2019-12-13 | 国网上海市电力公司 | 一种基于贝叶斯分类法的基线负荷模型的负荷辨识方法 |
CN110825723A (zh) * | 2019-10-09 | 2020-02-21 | 上海电力大学 | 一种基于用电负荷分析的居民用户分类方法 |
CN110689279A (zh) * | 2019-10-12 | 2020-01-14 | 上海积成能源科技有限公司 | 一种基于电力负荷数据的居民用电安全隐患分析系统及方法 |
CN110826641A (zh) * | 2019-11-13 | 2020-02-21 | 上海积成能源科技有限公司 | 一种基于聚类分析归类居民用电情况的系统及方法 |
Non-Patent Citations (1)
Title |
---|
李土高: "基于数据挖掘的用电行为分析及应用研究", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111932138A (zh) * | 2020-08-17 | 2020-11-13 | 上海积成能源科技有限公司 | 一种基于高斯混合模型和期望极大算法的居民用电行为分析的系统及方法 |
CN112036469A (zh) * | 2020-08-28 | 2020-12-04 | 上海积成能源科技有限公司 | 一种基于自回归和提升树算法的居民用电行为分析的系统及方法 |
CN111966676A (zh) * | 2020-09-04 | 2020-11-20 | 上海积成能源科技有限公司 | 一种居民用电数据挖掘中应用贝叶斯估计补充缺失值的方法 |
CN114971002A (zh) * | 2022-05-20 | 2022-08-30 | 国网湖北省电力有限公司营销服务中心(计量中心) | 一种基于计量终端负荷监测技术的异常电量预测方法 |
CN114971002B (zh) * | 2022-05-20 | 2023-08-25 | 国网湖北省电力有限公司营销服务中心(计量中心) | 一种基于计量终端负荷监测技术的异常电量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097297B (zh) | 一种多维度窃电态势智能感知方法、系统、设备及介质 | |
CN111506635A (zh) | 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法 | |
CN106780121B (zh) | 一种基于用电负荷模式分析的用电异常识别方法 | |
CN110689279A (zh) | 一种基于电力负荷数据的居民用电安全隐患分析系统及方法 | |
CN114723285B (zh) | 一种电网设备安全性评估预测方法 | |
CN110912737A (zh) | 一种基于混合模型的动态感知性能预告警方法 | |
CN107436277A (zh) | 基于相似距离判别的单指标数据质量控制方法 | |
CN112367273B (zh) | 基于知识蒸馏的深度神经网络模型的流量分类方法及装置 | |
CN115865649B (zh) | 一种智能运维管理控制方法、系统和存储介质 | |
CN113868006A (zh) | 时间序列的检测方法、装置、电子设备及计算机存储介质 | |
CN112990656A (zh) | 一种it设备监测数据的健康评价系统及健康评价方法 | |
CN110826641A (zh) | 一种基于聚类分析归类居民用电情况的系统及方法 | |
CN112906790B (zh) | 一种基于用电数据的独居老人识别方法和系统 | |
CN110636066A (zh) | 基于无监督生成推理的网络安全威胁态势评估方法 | |
CN111126820A (zh) | 反窃电方法及系统 | |
CN111191720A (zh) | 一种业务场景的识别方法、装置及电子设备 | |
CN115617784A (zh) | 一种信息化配电的数据处理系统及其处理方法 | |
CN115049410A (zh) | 窃电行为识别方法、装置、电子设备及计算机可读存储介质 | |
CN111666978A (zh) | 一种it系统运维大数据的智能故障预警系统 | |
CN111506636A (zh) | 一种基于自回归和近邻算法的居民用电行为分析的系统及方法 | |
CN113505980A (zh) | 智能交通管理系统可靠性评价方法、装置及系统 | |
CN117782198A (zh) | 一种基于云边端架构的公路机电设备运行监测方法及系统 | |
CN111967919A (zh) | 一种基于自回归和自适应提升算法的居民用电行为分析的系统及方法 | |
CN111861141A (zh) | 一种基于模糊故障率预测的配电网可靠性评估方法 | |
CN110807174A (zh) | 一种基于统计分布的污水厂厂群出水分析及异常识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200807 |
|
RJ01 | Rejection of invention patent application after publication |