CN109558994A - 一种基于mlr及pca模型的售电均价分析方法 - Google Patents
一种基于mlr及pca模型的售电均价分析方法 Download PDFInfo
- Publication number
- CN109558994A CN109558994A CN201811556435.9A CN201811556435A CN109558994A CN 109558994 A CN109558994 A CN 109558994A CN 201811556435 A CN201811556435 A CN 201811556435A CN 109558994 A CN109558994 A CN 109558994A
- Authority
- CN
- China
- Prior art keywords
- average electric
- sales rate
- model
- electric sales
- aiming field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000012417 linear regression Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 2
- 230000000717 retained effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 8
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 230000002596 correlated effect Effects 0.000 abstract description 5
- 238000007418 data mining Methods 0.000 abstract description 4
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000005611 electricity Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 238000000513 principal component analysis Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Finance (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于MLR及PCA模型的售电均价分析方法,所述方法包括:采集原始数据,基于预设指标从原始数据中采集目标字段,基于目标字段各网省售电均价分析模型和各行业售电均价分析模型。与现有技术相比,该售电均价分析方法,使用了大数据技术与数据挖掘算法模型,通过海量数据,真实、及时的了解了各网省和各行业售电均价的相关特征,通过这些特征分析,能够及时、准确、高效的对售电均价进行分析。
Description
技术领域
本发明涉及售电评估技术领域,尤其涉及一种基于MLR及PCA模型的售电均价分析方法。
背景技术
现有技术中,对各行业缴费问题的研究主要集中在缴费系统的完善与优化上,忽略了客户自身的体验与诉求,客户个性化需求得不到满足。当前客户服务要求呈现出多元化的发展趋势,传统的市场营销手段已不再适应新型的市场环境,客户个性化需求需要有新型缴费方式的支撑,使用传统方式缴费的客户占总缴费客户的比例仍较高,需对客户的缴费方式进行有效引导。
现有对客户缴费渠道的牵引,大都是通过问卷调查的形式收集客户的反馈意见,并据此提出改进意见。这种方法收集到的数据往往与总体存在一定的偏差,且需要投入大量的人力物力,数据的真实性也有待考量,目前还没有将大数据技术应用到缴费渠道的牵引上。
目前电力行业电费相关问题的研究主要集中在售电均价的分析上,通过这类研究,可以很好的分析出目前各网省以及各行业售电均价的整体情况,有助于分析售电均价的波动及规律。当前各网省以及各行业的售电均价呈现多元化、多维度的发展趋势,通过这些具有明显差异的特征,通过一定技术手段,可以对售电均价的数据价值进行进一步的钻取和分析。
以往对售电均价的分析大都是通过利率分析的形式分析售电均价的波动情况,并据此提出影响售电均价的影响因素,但这种方法分析得出的结果往往与总体存在一定的偏差,目前还没有将大数据技术应用到售电均价分析的工作之中。
发明内容
本发明所要解决的技术问题是提供一种基于MLR及PCA模型的售电均价分析方法,解决现有技术中对营业厅效能评估主要基于营业厅自身的特征,忽略了营业厅所处的地理位置、价值等因素导致在评估营业厅效能时不够全面的问题。
根据本发明的一个方面,提供一种基于MLR及PCA模型的售电均价分析方法,包括:
采集获取设定时长内售电均价信息的原始数据;
基于预设指标从所述原始数据中采集目标字段;
基于目标字段构建模型对售电均价进行分析。
所述原始数据,包括:
各网省售电均价信息及各行业售电均价信息。
所述对售电均价进行分析主要包括:
基于方法特征对原始数据进行采集;
基于原始数据生成所需数据集;
基于所述所需数据集进行目标字段采集;
基于所述目标字段建模并进行售电均价分析。
所述模型包括:
多元线性回归模型MLR和主成分分析模型PCA。
所述基于目标字段构建模型对售电均价进行分析,包括:
基于所述目标字段生成MLR售电均价分析模型并进行分析;
基于所述目标字段生成PCA售电均价分析模型并进行分析。
所述基于所述目标字段生成MLR售电均价分析模型,包括:
选取原始数据中的设定目标字段;
根据所述目标字段计算多元线性回归的损失函数e;
根据最小二乘法计算多元线性回归的参数;所述多元线性回归的损失参数根据如下公式获取:
其中,m为样本的数量,yi为样本的真实值,f(x)为预测值。
所述基于所述目标字段生成PCA售电均价分析模型,包括:
选取原始数据中的设定目标字段;
对于目标字段的数据Data中的每一维数据分别求平均值,并减去平均值,得到数据为DataAdjust;
计算DataAdjust的协方差矩阵;
计算协方差矩阵的特征向量和特征值;
将特征值从大到小排序,保留最大的K个特征向量。
根据本发明的,另一个方面,提供一种基于MLR及PCA模型的售电均价分析系统,包括:
数据采集模块,用于采集原始数据;
字段选择模块,用于基于预设指标从所述原始数据中采集目标字段;
建模模块,用于基于所述目标字段生成MLR模型及PCA模型并分析。
所述建模模块包括不同模型测试单元、各网省售电均价分析模型、各行业售电均价分析模型及售电均价综合分析模型,其中:
所述不同模型测试单元,用于基于所述目标字段生成售电均价分析模型;
所述各网省售电均价分析模型,用于对各网省售电均价情况进行分析;
所述行业售电均价分析模型,用于对各行业售电均价情况进行分析;
所述售电均价综合分析模型,用于对MLR模型及PCA模型结果进行综合分析。
所述字段选择模块包括预处理单元和选取单元,其中:
所述预处理单元,用于预处理所述原始数据生成建模数据;
所述选取单元,用于基于所述预设指标从所述建模数据中采集所述目标字段;
所述数据采集模块,还用于从所述建模数据中采集售电均价相关信息。
采用上述方案的有益效果是:
本发明提供了一种基于MLR及PCA模型的售电均价分析方案,包括采集原始数据,基于预设指标从原始数据中采集目标字段,基于目标字段各网省售电均价分析模型和各行业售电均价分析模型。与现有技术相比,该售电均价分析方法,使用了大数据技术与数据挖掘算法模型,通过海量数据,真实、及时的了解了各网省和各行业售电均价的相关特征,通过这些特征分析,能够及时、准确、高效的对售电均价进行分析。
附图说明
图1是本发明的基于MLR及PCA模型的售电均价分析方法原理流程图。
图2为本发明的基于MLR及PCA模型的售电均价分析建模方法流程图;
图3为本发明的基于MLR及PCA模型的售电均价分析系统之一结构示意图;
图4为本发明的基于MLR及PCA模型的售电均价分析系统之二结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
多元线性回归模型(multivariable linear regression model,MLR)在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响。其表达式为:
Yi=β0+β1*1i+β2*2i+β2*2i+βk*ki+μi,i=1,2,...,n。
主成分分析法(principal Component Analysis,PCA),旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。这种方法在引进多方面变量的同时将复杂因素归结为几个主成分,使问题简单化,同时得到的结果是更加科学有效的数据信息。
本发明的各个实施例中,主要包括如下步骤:
采集原始数据;
基于预设指标从所述原始数据中采集目标字段;
基于目标字段构建模型对售电均价进行分析。
所述售电均价分析方法主要由相应模型完成,所述分类模型主要作用于根据预设目标采集的目标字段,所述对售电均价进行分析主要包括:
基于方法特征对原始数据进行采集;
基于原始数据生成所需数据集;
基于所述所需数据集进行目标字段采集;
基于所述目标字段建模并进行售电均价分析。
所述基于所述预设指标从所述原始数据中采集所述目标字段包括:
预处理所述原始数据生成建模数据;
基于所述预设指标从所述建模数据中采集所述目标字段。
从所述建模数据中采集所需信息;
基于所采集的售电信息进行分析及汇总;
所述建模数据中采集售电数据还包括:
对各行业售电均价数据进行采集;
对各网省售电均价数据进行采集;
为这些字段设置标签。
以下结合附图对本发明进一步说明。
如图1所示,为本发明的实施例1提供的基于MLR及PCA模型的售电均价分析方法原理流程图,具体如下:
S101、采集原始数据;
在本发明中,数据采集分为两个部分,分别为各网省售电均价信息及各行业售电均价信息。
S102、基于预设指标从原始数据中采集目标字段;
根据模型的研究目的选取合适的指标,形成指标体系,即预设指标,是后续模型构建的基础。由预设指标可以从原始数据中采集到满足预设指标的目标字段。
S103、基于目标字段生成售电均价分析模型;
以各网省售电均价分析为例,售电均价分析模型可用于对各网省售电均价波动情况进行分析。
从上述技术方案可以看出,本发明提供了一种基于MLR及PCA模型的售电均价分析方法,包括采集原始数据,基于预设指标从原始数据中采集目标字段,基于目标字段生成售电均价分析模型。与现有技术相比,该种售电均价分析方法,使用了大数据技术与数据挖掘算法模型,通过海量数据,真实、及时的了解了各网省和各行业售电均价的相关特征,通过这些特征分析,能够及时、准确、高效的对售电均价进行分析。
如图2所示,为本发明公开的一种组合模型建模方法的实施例2的流程图,包括:
S201、采集原始数据;
在本发明中,数据采集分为两个部分,分别为各网省售电均价信息及各行业售电均价信息。
S202、基于预设指标从原始数据中采集目标字段;
根据模型的研究目的选取合适的指标,形成指标体系,即预设指标,是后续模型构建的基础。由预设指标可以从原始数据中采集到满足预设指标的目标字段。
S203、基于目标字段生成MLR售电均价分析模型;
以各网省售电均价分析为例,售电均价分析模型可用于对各网省售电均价波动情况进行分析。
生成MLR售电均价分析模型的方法可为:
(1)各网省售电均价信息中,选取各网省售电均价为目标字段;各行业售电均价信息中,选取各行业售电均价作为目标字段。
(2)计算多元线性回归的损失函数(e);
(3)使用最小二乘法计算多元线性回归的参数;
多元线性回归的损失参数:及使均方误差最小化时所对应的参数,所对应公式为:其中m为样本的数量,yi为样本的真实值,f(x)为预测值。
多元线性回归参数:在模型建模的任务中,目的为让预测值尽量逼近真实值,做到误差最小,而均方误差就是表达这种误差的一种,所以求解多元线性回归模型,及求解使均方误差最小化时所对应的参数:w*=argwmin(y-Xw)T(y-Xw),其中w*为模型对应的解,即使得均方误差函数最小化时的权重向量。用最小二乘法对模型的参数进行估计,具体做法是:损失函数对需要求解的参数进行求导,并且令其导数为0,求得相应的多元线性回归的参数。
多元线性回归模型(multivariable linear regression model,MLR)在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响。其表达式为:
Yi=β0+β1*1i+β2*2i+β2*2i+βk*ki+μi,i=1,2,...,n。
S204、基于目标字段生成PCA售电均价分析模型;
以各行业售电均价分析为例,售电均价分析模型可用于对各行业售电均价波动情况进行分析。
生成PCA售电均价分析模型的方法可为:
(1)各网省售电均价信息中,选取各网省售电均价为目标字段;各行业售电均价信息中,选取各行业售电均价作为目标字段;
(2)减去平均值,对于Data中的每一维数据分别求平均值,并减去平均值,得到数据为DataAdjust;
(3)计算DataAdjust的协方差矩阵。
(4)计算协方差矩阵的特征向量和特征值;
(5)将特征值从大到小排序,保留最大的K个特征向量。
主成分分析(Principal Component Analysis,PCA),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
综上所述,本发明实际上提出了一种基于MLR及PCA模型的售电均价分析模型,该模型可对各网省及各行业售电均价情况进行分析。
如图3所示,为本发明公开的一种组合模型建模系统实施例1的结构示意图,包括:
数据采集模块101,数据采集模块101用于采集原始数据;
以各行业售电均价分析为例,售电均价分析模型可用于对各行业售电均价波动情况进行分析。
字段选择模块102,字段选择模块102用于基于预设指标从原始数据中采集目标字段;
根据模型的研究目的选取合适的指标,形成指标体系,即预设指标,是后续模型构建的基础。由预设指标可以从原始数据中采集到满足预设指标的目标字段。
建模模块103,建模模块103用于基于目标字段生成售电均价分析模型;
采集到目标字段后,可由目标字段生成售电均价分析模型,该模型可用于分析各网省及各行业售电均价的整体情况。
从上述技术方案可以看出,本发明提供了一种组合模型建模系统,工作原理为采集原始数据,基于预设指标从原始数据中采集目标字段,基于目标字段生成预判模型。与现有技术相比,使用了大数据技术与数据挖掘算法模型,通过海量数据,真实、及时的了解了各网省和各行业售电均价的相关特征,通过这些特征分析,能够及时、准确、高效的对售电均价进行分析。
如图4所示,为本发明公开的一种组合模型建模系统的实施例2的结构示意图,包括:
数据采集模块201,数据采集模块201用于采集原始数据;
以各行业售电均价分析为例,售电均价分析模型可用于对各行业售电均价波动情况进行分析。
字段选择模块202,字段选择模块202用于基于预设指标从原始数据中采集目标字段;
根据模型的研究目的选取合适的指标,形成指标体系,即预设指标,是后续模型构建的基础。由预设指标可以从原始数据中采集到满足预设指标的目标字段。
建模模块203,建模模块203用于基于目标字段生成售电均价分析模型,分析模型包括MLR售电均价分析模型、PCA售电均价分析模型,建模模块203包括MLR售电均价分析模型建模单元204、PCA售电均价分析模型建模单元205,其中:
MLR售电均价分析模型建模单元204用于基于目标字段生成MLR售电均价分析模型;
以电网缴费为例,预测模型可用于对客户是否会发生欠费进行预测。
生成预测模型的方法可为:
(1)各网省售电均价信息中,选取各网省售电均价为目标字段;各行业售电均价信息中,选取各行业售电均价作为目标字段。
(2)计算多元线性回归的损失函数(e);
(3)使用最小二乘法计算多元线性回归的参数;
多元线性回归的损失参数:及使均方误差最小化时所对应的参数,所对应公式为:其中m为样本的数量,yi为样本的真实值,f(x)为预测值。
多元线性回归参数:在模型建模的任务中,目的为让预测值尽量逼近真实值,做到误差最小,而均方误差就是表达这种误差的一种,所以求解多元线性回归模型,及求解使均方误差最小化时所对应的参数:w*=argwmin(y-Xw)T(y-Xw),其中w*为模型对应的解,即使得均方误差函数最小化时的权重向量。用最小二乘法对模型的参数进行估计,具体做法是:损失函数对需要求解的参数进行求导,并且令其导数为0,求得相应的多元线性回归的参数。
多元线性回归模型(multivariable linear regression model,MLR)在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响。其表达式为:
Yi=β0+β1*1i+β2*2i+β2*2i+βk*ki+μi,i=1,2,...,n。
PCA售电均价分析模型建模单元205用于基于目标字段生成PCA售电均价分析模型;
以电网缴费为例,客户欠费风险等级细分模型可用于探索客户属性及行为习惯,将客户族群细分,研究各个族群的缴费习惯及欠费可能性。
生成PCA售电均价分析模型的方法可为:
(1)各网省售电均价信息中,选取各网省售电均价为目标字段;各行业售电均价信息中,选取各行业售电均价作为目标字段;
(2)减去平均值,对于Data中的每一维数据分别求平均值,并减去平均值,得到数据为DataAdjust;
(3)计算DataAdjust的协方差矩阵。
(4)计算协方差矩阵的特征向量和特征值;
(5)将特征值从大到小排序,保留最大的K个特征向量。
主成分分析(Principal Component Analysis,PCA),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
综上所述,本发明各个实施例的方案,包括采集原始数据,基于预设指标从原始数据中采集目标字段,基于目标字段各网省售电均价分析模型和各行业售电均价分析模型。与现有技术相比,该售电均价分析方法,使用了大数据技术与数据挖掘算法模型,通过海量数据,真实、及时的了解了各网省和各行业售电均价的相关特征,通过这些特征分析,能够及时、准确、高效的对售电均价进行分析。
根据特定的实施方式对本发明详细进行了说明,但上述的实施方式仅为例示,本发明不被上述实施方式限定。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于MLR及PCA模型的售电均价分析方法,其特征在于,包括:
采集获取设定时长内售电均价信息的原始数据;
基于预设指标从所述原始数据中采集目标字段;
基于目标字段构建模型对售电均价进行分析。
2.如权利要求1所述的方法,其特征在于,所述原始数据,包括:
各网省售电均价信息及各行业售电均价信息。
3.如权利要求1所述的方法,其特征在于,所述对售电均价进行分析主要包括:
基于方法特征对原始数据进行采集;
基于原始数据生成所需数据集;
基于所述所需数据集进行目标字段采集;
基于所述目标字段建模并进行售电均价分析。
4.如权利要求1所述的方法,其特征在于,所述模型包括:
多元线性回归模型MLR和主成分分析模型PCA。
5.如权利要求4所述的方法,其特征在于,所述基于目标字段构建模型对售电均价进行分析,包括:
基于所述目标字段生成MLR售电均价分析模型并进行分析;
基于所述目标字段生成PCA售电均价分析模型并进行分析。
6.如权利要求5所述的方法,其特征在于,所述基于所述目标字段生成MLR售电均价分析模型,包括:
选取原始数据中的设定目标字段;
根据所述目标字段计算多元线性回归的损失函数e;
根据最小二乘法计算多元线性回归的参数;所述多元线性回归的损失参数根据如下公式获取:
其中,m为样本的数量,yi为样本的真实值,f(x)为预测值。
7.如权利要求5所述的方法,其特征在于,所述基于所述目标字段生成PCA售电均价分析模型,包括:
选取原始数据中的设定目标字段;
对于目标字段的数据Data中的每一维数据分别求平均值,并减去平均值,得到数据为DataAdjust;
计算DataAdjust的协方差矩阵;
计算协方差矩阵的特征向量和特征值;
将特征值从大到小排序,保留最大的K个特征向量。
8.一种基于MLR及PCA模型的售电均价分析系统,其特征在于,包括:
数据采集模块,用于采集原始数据;
字段选择模块,用于基于预设指标从所述原始数据中采集目标字段;
建模模块,用于基于所述目标字段生成MLR模型及PCA模型并分析。
9.如权利要求8所述的系统,其特征在于,所述建模模块包括不同模型测试单元、各网省售电均价分析模型、各行业售电均价分析模型及售电均价综合分析模型,其中:
所述不同模型测试单元,用于基于所述目标字段生成售电均价分析模型;
所述各网省售电均价分析模型,用于对各网省售电均价情况进行分析;
所述行业售电均价分析模型,用于对各行业售电均价情况进行分析;
所述售电均价综合分析模型,用于对MLR模型及PCA模型结果进行综合分析。
10.如权利要求8或9所述的系统,其特征在于,所述字段选择模块包括预处理单元和选取单元,其中:
所述预处理单元,用于预处理所述原始数据生成建模数据;
所述选取单元,用于基于所述预设指标从所述建模数据中采集所述目标字段;
所述数据采集模块,还用于从所述建模数据中采集售电均价相关信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811556435.9A CN109558994A (zh) | 2018-12-19 | 2018-12-19 | 一种基于mlr及pca模型的售电均价分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811556435.9A CN109558994A (zh) | 2018-12-19 | 2018-12-19 | 一种基于mlr及pca模型的售电均价分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109558994A true CN109558994A (zh) | 2019-04-02 |
Family
ID=65870493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811556435.9A Pending CN109558994A (zh) | 2018-12-19 | 2018-12-19 | 一种基于mlr及pca模型的售电均价分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109558994A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881424A (zh) * | 2015-03-13 | 2015-09-02 | 国家电网公司 | 一种基于正则表达式的电力大数据采集、存储及分析方法 |
CN106530139A (zh) * | 2016-12-07 | 2017-03-22 | 国网河北省电力公司 | 电网投资分析模型指标参数计算方法 |
CN106682934A (zh) * | 2016-11-18 | 2017-05-17 | 云南电网有限责任公司电力科学研究院 | 一种购电竞价策略 |
CN107423859A (zh) * | 2017-08-07 | 2017-12-01 | 国家电网公司客户服务中心 | 一种组合模型建模方法及系统 |
-
2018
- 2018-12-19 CN CN201811556435.9A patent/CN109558994A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881424A (zh) * | 2015-03-13 | 2015-09-02 | 国家电网公司 | 一种基于正则表达式的电力大数据采集、存储及分析方法 |
CN106682934A (zh) * | 2016-11-18 | 2017-05-17 | 云南电网有限责任公司电力科学研究院 | 一种购电竞价策略 |
CN106530139A (zh) * | 2016-12-07 | 2017-03-22 | 国网河北省电力公司 | 电网投资分析模型指标参数计算方法 |
CN107423859A (zh) * | 2017-08-07 | 2017-12-01 | 国家电网公司客户服务中心 | 一种组合模型建模方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Şerban et al. | Artificial intelligence for smart renewable energy sector in europe—smart energy infrastructures for next generation smart cities | |
CN111062757B (zh) | 基于多路径寻优匹配的信息推荐方法及系统 | |
Cullmann | Benchmarking and firm heterogeneity: a latent class analysis for German electricity distribution companies | |
Llorca et al. | Using the latent class approach to cluster firms in benchmarking: An application to the US electricity transmission industry | |
KR100913125B1 (ko) | 패턴분석을 이용한 전력 수요정보분석 시스템 및 그 방법 | |
CN110930198A (zh) | 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备 | |
CN102982077B (zh) | 用户数据处理方法及装置 | |
Gerwig | Short term load forecasting for residential buildings—An extensive literature review | |
Jaeger et al. | Interpretable machine learning for diversified portfolio construction | |
Yuan et al. | Using least square support vector regression with genetic algorithm to forecast beta systematic risk | |
Lv et al. | EGA-STLF: A hybrid short-term load forecasting model | |
CN111199493A (zh) | 一种基于客户缴费信息及征信信息的欠费风险识别方法 | |
CN109726740A (zh) | 一种基于聚类分析的行业用电行为分析方法 | |
CN112686473A (zh) | 一种基于分类算法的用电量预测方法及预测系统 | |
Kegel et al. | Generating what-if scenarios for time series data | |
Kim et al. | Extracting baseline electricity usage using gradient tree boosting | |
CN115130811A (zh) | 电力用户画像的建立方法、装置及电子设备 | |
Deng et al. | Efficient automated deep learning for time series forecasting | |
Zhang et al. | Data-driven branching and selection for lot-sizing and scheduling problems with sequence-dependent setups and setup carryover | |
Abgottspon | Hydro power planning: Multi-horizon modeling and its applications | |
Rafi et al. | Enhancing cryptocurrency price forecasting accuracy: A feature selection and weighting approach with bi-directional LSTM and trend-preserving model bias correction | |
Uli | Co-evolutionary dynamics in the music industry | |
Chen et al. | A power line loss analysis method based on boost clustering | |
Vasin et al. | Exploring regional innovation systems through a convergent platform for Big Data | |
CN109558994A (zh) | 一种基于mlr及pca模型的售电均价分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190402 |