CN112837178A - 一种电力客户用电数据的分析方法 - Google Patents
一种电力客户用电数据的分析方法 Download PDFInfo
- Publication number
- CN112837178A CN112837178A CN202110043737.1A CN202110043737A CN112837178A CN 112837178 A CN112837178 A CN 112837178A CN 202110043737 A CN202110043737 A CN 202110043737A CN 112837178 A CN112837178 A CN 112837178A
- Authority
- CN
- China
- Prior art keywords
- electricity consumption
- function
- monthly
- regression equation
- linear regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 51
- 238000004458 analytical method Methods 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012417 linear regression Methods 0.000 claims abstract description 18
- 238000004140 cleaning Methods 0.000 claims abstract description 4
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000010219 correlation analysis Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000004088 simulation Methods 0.000 claims description 3
- 238000011161 development Methods 0.000 abstract description 2
- 238000010238 partial least squares regression Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 206010033799 Paralysis Diseases 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Mathematical Analysis (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Tourism & Hospitality (AREA)
- Computational Mathematics (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种电力客户用电数据的分析方法,包括以下步骤:(1)采集数据并清洗和转换;(2)获得月用电量与相关变量的多元线性回归方程;(3)采用灰色预测法对相关变量预测;(4)将相关变量的预测结果作为多元线性回归方程的输入获得月用电量。本发明实现灰色预测模型与多元线性回归方程的有机结合,获得较高精度的预测结果,为各网电力发展规划提供可靠的基础数据支撑。
Description
技术领域
本发明涉及一种数据的分析方法,尤其涉及一种电力客户用电数据的分析方法。
背景技术
现行用电量的预测方法有灰色预测法、时间序列分析预测法、线性回归分析预测法、偏最小二乘回归预测法和神经网络预测法等。时间序列分析法对于中短期预测效果比较好,但是影响预测对象变化的因素较易发生突变,其结果会出现严重偏差。偏最小二乘回归是一种新的多元统计数据分析方法,是多元线性回归、典型相关分析和主成分分析的有机结合,模型精度和实用性都很高,但是偏最小二乘回归计算复杂,限制了其应用。神经网络方法预测结果较好,但是由于人工神经网络结构设计困难,训练易陷入瘫痪,常常得不到期望解。
发明内容
发明目的:本发明旨在解决现有技术的上述不足,提供一种电力客户用电数据的分析方法,解决单一预测方法预测偏差大的问题。
技术方案:本发明所述的电力客户用电数据的分析方法,包括以下步骤:
(1)采集数据并清洗和转换;
(2)获得月用电量与相关变量的多元线性回归方程;
(3)采用灰色预测法对相关变量预测;
(4)将相关变量的预测结果作为多元线性回归方程的输入获得月用电量。
步骤(2)中所述相关变量包括用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数。
步骤(2)包括以下步骤:
(21)获得多元线性回归方程的相关性分析函数;
(22)确定显著性水平α,获得相关变量与月用电量之间的相关系数;
(23)去除相关系数小于阈值的变量,重新获得剩余变量与月用电量之间的相关系数;
(24)对相关变量进行多元回归,获得初步多元回归方程;
(25)模型参数检验。
步骤(21)中的相关性分析函数包括后向选择函数、前向引入函数和多元回归函数。
步骤(25)包括以下步骤:
(251)模型模拟汇总;
(252)编写F检验函数;
(253)采用F检验函数进行F校验;
(254)编写T检验函数;
(255)使用T检验函数进行T校验。
步骤(3)中的灰色预测法为GM(1,1)模型。
有益效果:与现有技术相比,本发明的显著优点为实现灰色预测模型与多元线性回归方程的有机结合,取得较高精度的预测结果,为各网电力发展规划提供可靠的基础数据支撑。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明。由图1可知,本发明所述的电力客户用电数据的分析方法,包括以下步骤:
1、采集数据并清洗和转换
提取某省2018年9月至2020年8月共计24个月的月用电量数据、欠费数据、交费数据、异常用电记录、用电容量记录、业务办电数据。
使用SQL脚本对数据按月进行归并得到2018年9月至2020年8月每个月的用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数、用电量,具体信息如下:
2、建立多元线性回归方程,包括以下步骤:
(21)编写多元线性回归相关性分析函数,包括后向选择函数、前向引入函数、多元回归函数。
(22)取显著性水平α=0.05,把用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数、用电量数据代入函数,对各影响因素做相关性分析,输出结果如下:
通过相关性结果可知用户数据与月用电量相关系数为0.997,欠费金额与月用电量相关系数为0.992,交费金额与月用电量相关系数为0.993,平均用电容量与月用电量相关系数为0.989,异常用电次数与月用电量相关系数为0.221,业务办理次数与月用电量相关系数为0.782。
(23)将相关系数小于阈值的异常用电次数剔除。再次将用户数、欠费金额、交费金额、平均用电容量、业务办电次数、月用电量代入相关性分析函数,对各影响因素做相关性分析,输出结果如下:
(24)对相关系数小于阈值的业务办电次数剔除后,对变量进行多元回归,得到初步多元回归方程:
月用电量=1483213.2+6.333*用户数-0.703*欠费金额+1.581*交费金额+218.12*平均用电容量
(25)模型参数检验,具体包括以下步骤:
(251)模型模拟汇总,计算用户数、欠费金额、交费金额、平均用电容量4个自变量与月用电量整体相关系数R为0.997,相应的显著性概率值为0.000,表示在α=0.05的水平上是显著的。经过调整后的判断系数R2=0.994,说明有99.4%的影响因素可以由此模型来加以解释,表明所建立的回归模型较好。
(252)编写F检验函数。
(253)使用F检验函数进行F校验,得到以下结果:
F=1327.479,对于给定的显著性水平α=0.05,根据F检验临界值表可得检验值为3.55,F=1327.479>3.55,所以检验效果显著。
(254)编写T检验函数。
(255)使用T检验函数进行T校验,得到以下结果:
根据上表可得:t1=6.217,t2=7.392,t3=-.4.289,t4=6.210,t5=8.131;对于给定的α=0.05,查t分布表,得到t(n-m-1)=t(19)=1.729。因为以上t值绝对值均大于1.729,所以常数项以及X1,X2,X3,X4这4个回归系数的检验结果均显著。
根据以上检验,最终确定电量多元线性回归方程为:
Y=1483213.2+6.333*X1-0.703*X2+1.581*X3+218.12*X4。
其中:Y为月用电量;X1为用户数;X2为欠费金额;X3为交费金额;X4为平均用电容量。
3、采用灰色预测法对一段时间内的用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数预测。
(31)选取2018年9月至2020年8月用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数作为原始数据
(32)使用灰色预测法中的GM(1,1)模型对2021年1月至2022年12月用户数、欠费金额、交费金额、平均用电容量进行预测,预测结果如下:
4、将上述输出结果作为多元线性回归预测方程的输入计算月用电量,实现灰色预测模型与多元线性回归方程的有机结合,取得2021年1月至2022年12月的月用电量预测结果如下:
通过2018年9月至2020年8月用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数数据,使用灰度预测与多元线性回归预测方法,对2021年1月至2022年12月的月用电量进行预测分析。
Claims (6)
1.一种电力客户用电数据的分析方法,其特征在于:包括以下步骤:
(1)采集数据并清洗和转换;
(2)获得月用电量与相关变量的多元线性回归方程;
(3)采用灰色预测法对相关变量预测;
(4)将相关变量的预测结果作为多元线性回归方程的输入获得月用电量。
2.根据权利要求1所述的电力客户用电数据的分析方法,其特征在于:步骤(2)中所述相关变量包括用户数、欠费金额、交费金额、平均用电容量、异常用电次数、业务办电次数。
3.根据权利要求1所述的电力客户用电数据的分析方法,其特征在于:步骤(2)包括以下步骤:
(21)获得多元线性回归方程的相关性分析函数;
(22)确定显著性水平α,获得相关变量与月用电量之间的相关系数;
(23)去除相关系数小于阈值的变量,重新获得剩余变量与月用电量之间的相关系数;
(24)对相关变量多元回归,获得初步多元回归方程;
(25)模型参数检验。
4.根据权利要求3所述的电力客户用电数据的分析方法,其特征在于:步骤(21)中的相关性分析函数包括后向选择函数、前向引入函数和多元回归函数。
5.根据权利要求3所述的电力客户用电数据的分析方法,其特征在于:步骤(25)包括以下步骤:
(251)模型模拟汇总;
(252)编写F检验函数;
(253)采用F检验函数进行F校验;
(254)编写T检验函数;
(255)使用T检验函数进行T校验。
6.根据权利要求1所述的电力客户用电数据的分析方法,其特征在于:步骤(3)中的灰色预测法为GM(1,1)模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110043737.1A CN112837178A (zh) | 2021-01-13 | 2021-01-13 | 一种电力客户用电数据的分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110043737.1A CN112837178A (zh) | 2021-01-13 | 2021-01-13 | 一种电力客户用电数据的分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112837178A true CN112837178A (zh) | 2021-05-25 |
Family
ID=75927958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110043737.1A Pending CN112837178A (zh) | 2021-01-13 | 2021-01-13 | 一种电力客户用电数据的分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112837178A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100070441A1 (en) * | 2007-03-27 | 2010-03-18 | Fujitsu Limited | Method, apparatus, and program for generating prediction model based on multiple regression analysis |
CN103729689A (zh) * | 2013-12-20 | 2014-04-16 | 华南理工大学 | 一种基于行业分类与主导行业数据的电网电量预测方法 |
CN110751327A (zh) * | 2019-10-17 | 2020-02-04 | 武汉大学 | 基于多元线性回归和灰色Verhulst模型的长期负荷组合预测法 |
-
2021
- 2021-01-13 CN CN202110043737.1A patent/CN112837178A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100070441A1 (en) * | 2007-03-27 | 2010-03-18 | Fujitsu Limited | Method, apparatus, and program for generating prediction model based on multiple regression analysis |
CN103729689A (zh) * | 2013-12-20 | 2014-04-16 | 华南理工大学 | 一种基于行业分类与主导行业数据的电网电量预测方法 |
CN110751327A (zh) * | 2019-10-17 | 2020-02-04 | 武汉大学 | 基于多元线性回归和灰色Verhulst模型的长期负荷组合预测法 |
Non-Patent Citations (10)
Title |
---|
丁浩等: "基于多元线性回归模型和灰色理论的山东省用电量预测", 《河南科学》, no. 09, 8 October 2013 (2013-10-08), pages 1535 * |
严于鲜: "层次分析法在线性回归方程中的应用", 《四川理工学院学报(自然科学版)》 * |
严于鲜: "层次分析法在线性回归方程中的应用", 《四川理工学院学报(自然科学版)》, no. 05, 30 October 2006 (2006-10-30) * |
乔纳森•R•沃尔帕乌: "幼儿大动作发展规律及足弓发育特征研究", 中国对外经济贸易出版社, pages: 196 * |
于世刚等: "大连市年用电量预测模型优化研究", 《资源开发与市场》 * |
于世刚等: "大连市年用电量预测模型优化研究", 《资源开发与市场》, no. 12, 15 December 2014 (2014-12-15) * |
仇芝等: "用电量的灰色―多元回归耦合模型预测", 《华东电力》 * |
仇芝等: "用电量的灰色―多元回归耦合模型预测", 《华东电力》, no. 03, 24 March 2006 (2006-03-24) * |
任芳玲等: "线性回归与灰色理论在用电量预测中的应用", 《甘肃科学学报》 * |
任芳玲等: "线性回归与灰色理论在用电量预测中的应用", 《甘肃科学学报》, no. 02, 25 April 2018 (2018-04-25), pages 11 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978230B (zh) | 一种基于深度卷积神经网络的电力销售金额智能预测方法 | |
CN107832927B (zh) | 基于灰色关联分析法的10kV线路线变关系评价方法 | |
Creaco et al. | Parameterizing residential water demand pulse models through smart meter readings | |
CN104574209A (zh) | 一种城网配变重过载中期预警模型的建模方法 | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN111815060A (zh) | 一种用电地区短期负荷预测方法及装置 | |
CN111582568A (zh) | 基于电力数据的春节期间企业复工预测方法 | |
CN111199493A (zh) | 一种基于客户缴费信息及征信信息的欠费风险识别方法 | |
CN110991985A (zh) | 一种项目进度数据处理方法 | |
CN114662563A (zh) | 一种基于梯度提升算法的工业用电非侵入负荷分解方法 | |
Wohlschlager et al. | Environmental assessment of digital infrastructure in decentralized smart grids | |
Li et al. | In-house R&D, technology purchase and innovation: empirical evidences from Chinese hi-tech industries, 1995-2004 | |
CN112837178A (zh) | 一种电力客户用电数据的分析方法 | |
CN116843378A (zh) | 一种基于深度学习的五金配件供应预测方法及系统 | |
CN110727910B (zh) | 一种抄核收风险预测及业务联动的实现方法和系统 | |
CN113627821A (zh) | 一种基于用电行为特征进行异常用电识别的方法及系统 | |
CN109254970A (zh) | 一种数据的快速自定义图表展现的方法及装置 | |
CN111797924B (zh) | 一种基于聚类算法的三维度园区画像方法及系统 | |
CN115130924A (zh) | 一种源网荷储背景下微电网电力设备资产评估方法及系统 | |
Wang et al. | Estimation of global waste smartphones and embedded critical raw materials: An industry life cycle perspective | |
CN110264251B (zh) | 表征现金流的数据组织形式与基于多任务学习的预测方法 | |
CN113743894A (zh) | 一种用于电费账单复核的复核规则模型的建立方法及系统 | |
CN106651462A (zh) | 一种二手设备的估价方法 | |
CN111985721A (zh) | 一种基于季节性时间序列的企业开票金额预测方法 | |
CN101669137A (zh) | 用于使表示加权可变量的条规格化的处理设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210525 |
|
RJ01 | Rejection of invention patent application after publication |