CN112053100A - 一种基于大数据的用户用电行为的分析方法 - Google Patents

一种基于大数据的用户用电行为的分析方法 Download PDF

Info

Publication number
CN112053100A
CN112053100A CN202011103760.7A CN202011103760A CN112053100A CN 112053100 A CN112053100 A CN 112053100A CN 202011103760 A CN202011103760 A CN 202011103760A CN 112053100 A CN112053100 A CN 112053100A
Authority
CN
China
Prior art keywords
consumption behavior
electricity consumption
user
characteristic parameter
parameter set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011103760.7A
Other languages
English (en)
Inventor
毕楠
沈学强
滕志军
李红彪
田洪亮
张秋实
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeast Electric Power University
Original Assignee
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeast Dianli University filed Critical Northeast Dianli University
Priority to CN202011103760.7A priority Critical patent/CN112053100A/zh
Publication of CN112053100A publication Critical patent/CN112053100A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Abstract

本发明及电力大数据分析领域,具体涉及一种基于大数据的用户用电行为的分析方法,包括如下步骤:S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;S3、基于SparkR的并行化k‑means算法实现目标用户用电行为特征参数集的分析,输出对应的分析结果。本发明可以准确快速的实现用户用电行为的自主分析,从而将纷繁多样的电力海量数据转换成具有信息和商业价值的可用数据。

Description

一种基于大数据的用户用电行为的分析方法
技术领域
本发明涉及电力大数据分析领域,具体涉及一种基于大数据的用户用电行为的分析方法。
背景技术
随着计算机和网络技术在电力企业持续深入的应用,电力企业的数据积累越来越多,这部分数据在一定程度上反应了供电企业长久以来的运行状况。采用大数据和云计算等新技术探索大用户用电行为和特征,并为大用户提供定制的电力服务逐步成为了电力市场关注的重点问题,同时也能够对电力行业的发展与进步带来新的方向。
聚类分析方法是目前常用的用户用电行为分析方法,基于k-means的聚类算法是行业内最普遍采用的聚类分析方法。k-means算法是解决聚类问题的一种经典算法,具有简单、快速的特点,对于处理电力大数据,该算法具有相对的伸缩性和高效性,但是k-means算法的聚类结构对初值比较敏感,不同的初值会导致不同的结果,一旦初值选择不当,聚类结果就会出现偏差。模糊C均值聚类算法是模糊聚类算法中应用最为广泛的一种算法,它通过优化目标函数得到每个样本点对所有类中心的隶属度,判断样本点的类属从而实现自动对样本数据的分类的目的。但是模糊C均值聚类算法无法直接处理,该算法无法识别给定数据是否具有聚类结构,且对初始值的选取依赖性也较强。
发明内容
本发明的目的在于提供一种基于大数据的用户用电行为的分析方法,可以准确快速的实现用户用电行为的自主分析,从而将纷繁多样的电力海量数据转换成具有信息和商业价值的可用数据。
为实现上述目的,本发明采取的技术方案为:
一种基于大数据的用户用电行为的分析方法,包括如下步骤:
S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果。
进一步地,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。
进一步地,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。
进一步地,所述步骤S1中,基于Hadoop同时运行所有的用电行为参数模型进行用户用电行为特征参数集同步挖掘,每一个用电行为模型配置一个独立的数据储存模块。
进一步地,还包括:基于Hadoop运行预设的模糊神经网络算法根据所述目标用户用电行为特征参数集的分析结果实现目标用户未来用电行为的预测分析,输出对应的预测分析结果的步骤。
进一步地,还包括:基于所述目标用户用电行为特征参数集的分析结果绘制动态曲线图的步骤,该动态曲线图上每一个坐标点均携带有其对应的用户用电行为特征参数集访问超链接。
进一步地,还包括:基于Hadoop运行预设的风险评估模型进行目标用户用电行为特征参数集的分析结果的评估,当评估结果落入预设的风险预警门限时,启动预警模块预警,并输出对应的风险防御措施的步骤。
本发明具有以下有益效果:
可以准确快速的实现用户用电行为的自主分析,从而将纷繁多样的电力海量数据转换成具有信息和商业价值的可用数据。
附图说明
图1为本发明实施例1一种基于大数据的用户用电行为的分析方法的流程图。
图2为本发明实施例2一种基于大数据的用户用电行为的分析方法的流程图。
图3为本发明实施例3一种基于大数据的用户用电行为的分析方法的流程图。
图4为本发明实施例4一种基于大数据的用户用电行为的分析方法的流程图。
具体实施方式
为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
如图1所示,一种基于大数据的用户用电行为的分析方法,包括如下步骤:
S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果。
本实施例中,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。
本实施例中,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。基于Hadoop同时运行所有的用电行为参数模型进行用户用电行为特征参数集同步挖掘,每一个用电行为模型配置一个独立的数据储存模块。
实施例2
如图2所示,一种基于大数据的用户用电行为的分析方法,包括如下步骤:
S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果;
S4、基于Hadoop运行预设的模糊神经网络算法根据所述目标用户用电行为特征参数集的分析结果实现目标用户未来用电行为的预测分析,输出对应的预测分析结果。
本实施例中,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。
本实施例中,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。基于Hadoop同时运行所有的用电行为参数模型进行用户用电行为特征参数集同步挖掘,每一个用电行为模型配置一个独立的数据储存模块。
实施例3
如图3所示,一种基于大数据的用户用电行为的分析方法,包括如下步骤:
S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果;
S4、基于所述目标用户用电行为特征参数集的分析结果绘制动态曲线图,该动态曲线图上每一个坐标点均携带有其对应的用户用电行为特征参数集访问超链接。
进一步地,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。
本实施例中,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。基于Hadoop同时运行所有的用电行为参数模型进行用户用电行为特征参数集同步挖掘,每一个用电行为模型配置一个独立的数据储存模块。
实施例4
如图4所示,一种基于大数据的用户用电行为的分析方法,包括如下步骤:S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖
掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果;
S4、基于Hadoop运行预设的风险评估模型进行目标用户用电行为特征参数集的分析结果的评估,当评估结果落入预设的风险预警门限时,启动预警模块预警,并基于模糊网络神经算法输出对应的风险防御措施。
本实施例中,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。
本实施例中,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。基于Hadoop同时运行所有的用电行为参数模型进行用户用电行为特征参数集同步挖掘,每一个用电行为模型配置一个独立的数据储存模块。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种基于大数据的用户用电行为的分析方法,其特征在于,包括如下步骤:
S1、采用数据挖掘模块基于预设的用电行为参数模型在电力大数据库内挖掘对应的用户用电行为特征参数集;
S2、基于类间区分度的属性约简算法实现用户用电行为特征参数集的预处理,得目标用户用电行为特征参数集;
S3、基于SparkR的并行化k-means算法实现目标用户用电行为特征参数集
的分析,输出对应的分析结果。
2.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,所述步骤S1中,用电行为参数模型基于用电行为关联参数和影响因子构建,每一个用电行为参数模型对应一个或多个关联参数对应的关联规则,并包含剔除一个或多个用电行为影响因子对应的剔除规则。
3.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,所述步骤S1中,每一个数据挖掘模块配置一个用电行为参数模型,每一个用电行为参数模型内均配置一身份标记模块,用于实现用户用电行为特征参数来源的标记,且每一个用户用电行为特征参数来源配置唯一的标记符号。
4.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,所述步骤S1中,基于Hadoop同时运行所有的用电行为参数模型进行用户用电行为特征参数集同步挖掘,每一个用电行为模型配置一个独立的数据储存模块。
5.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,还包括:基于Hadoop运行预设的模糊神经网络算法根据所述目标用户用电行为特征参数集的分析结果实现目标用户未来用电行为的预测分析,输出对应的预测分析结果的步骤。
6.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,还包括:基于所述目标用户用电行为特征参数集的分析结果绘制动态曲线图的步骤,该动态曲线图上每一个坐标点均携带有其对应的用户用电行为特征参数集访问超链接。
7.如权利要求1所述的一种基于大数据的用户用电行为的分析方法,其特征在于,还包括:基于Hadoop运行预设的风险评估模型进行目标用户用电行为特征参数集的分析结果的评估,当评估结果落入预设的风险预警门限时,启动预警模块预警,并输出对应的风险防御措施的步骤。
CN202011103760.7A 2020-10-15 2020-10-15 一种基于大数据的用户用电行为的分析方法 Pending CN112053100A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011103760.7A CN112053100A (zh) 2020-10-15 2020-10-15 一种基于大数据的用户用电行为的分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011103760.7A CN112053100A (zh) 2020-10-15 2020-10-15 一种基于大数据的用户用电行为的分析方法

Publications (1)

Publication Number Publication Date
CN112053100A true CN112053100A (zh) 2020-12-08

Family

ID=73605142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011103760.7A Pending CN112053100A (zh) 2020-10-15 2020-10-15 一种基于大数据的用户用电行为的分析方法

Country Status (1)

Country Link
CN (1) CN112053100A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法
CN111090643A (zh) * 2019-11-30 2020-05-01 广东新瑞世纪科技有限公司 一种基于数据分析系统下的海量用电数据挖掘方法
CN111260138A (zh) * 2020-01-18 2020-06-09 湖南大学 加权和自适应并行关联规则的火电机组能耗动态优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651424A (zh) * 2016-09-28 2017-05-10 国网山东省电力公司电力科学研究院 基于大数据技术的电力用户画像建立与分析方法
CN111090643A (zh) * 2019-11-30 2020-05-01 广东新瑞世纪科技有限公司 一种基于数据分析系统下的海量用电数据挖掘方法
CN111260138A (zh) * 2020-01-18 2020-06-09 湖南大学 加权和自适应并行关联规则的火电机组能耗动态优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱天怡 等: "基于数据驱动的用电行为分析方法及应用综述", 《电网技术》 *

Similar Documents

Publication Publication Date Title
CN111563521B (zh) 特定于场所的异常检测
Vercamer et al. Predicting consumer load profiles using commercial and open data
US20170315855A1 (en) Method of detecting anomalies on appliances and system thereof
US9249287B2 (en) Document evaluation apparatus, document evaluation method, and computer-readable recording medium using missing patterns
CN110826648A (zh) 一种利用时序聚类算法实现故障检测的方法
CN111724278A (zh) 一种面向电力多元负荷用户的精细分类方法及系统
Jiang et al. A family of joint sparse PCA algorithms for anomaly localization in network data streams
Maher et al. Effectiveness of different similarity measures for text classification and clustering
CN111090807A (zh) 一种基于知识图谱的用户识别方法及装置
Goldstein et al. Behavior analysis using unsupervised anomaly detection
CN114117134A (zh) 一种异常特征检测方法、装置、设备和计算机可读介质
Zwietasch Detecting anomalies in system log files using machine learning techniques
Park et al. Improving the accuracy and diversity of feature extraction from online reviews using keyword embedding and two clustering methods
CN110674288A (zh) 一种应用于网络安全领域的用户画像方法
CN112559833A (zh) 一种基于深度学习的互联网流量大数据分析方法
Seevers et al. Automatic detection of manufacturing equipment cycles using time series
Gholamian et al. On the naturalness and localness of software logs
CN116611003A (zh) 一种变压器故障诊断方法、装置、介质
CN112053100A (zh) 一种基于大数据的用户用电行为的分析方法
Sylligardos et al. Choose wisely: An extensive evaluation of model selection for anomaly detection in time series
Rusli et al. A Comparative Study of Machine Learning Classification Models on Customer Behavior Data
Tomazzoli et al. Machine learning for energy efficiency: Automatic detection of electric loads from power consumption
CN114090869A (zh) 目标对象处理方法、装置、电子设备及存储介质
US20220261856A1 (en) Method for generating search results in an advertising widget
Johnpaul et al. Representational primitives using trend based global features for time series classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201208

RJ01 Rejection of invention patent application after publication