CN106777005A - 基于大数据技术改进聚类算法的用户用电行为分析方法 - Google Patents

基于大数据技术改进聚类算法的用户用电行为分析方法 Download PDF

Info

Publication number
CN106777005A
CN106777005A CN201611114891.9A CN201611114891A CN106777005A CN 106777005 A CN106777005 A CN 106777005A CN 201611114891 A CN201611114891 A CN 201611114891A CN 106777005 A CN106777005 A CN 106777005A
Authority
CN
China
Prior art keywords
data
power utilization
user power
cluster
cluster centre
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611114891.9A
Other languages
English (en)
Inventor
赵新
刘建宇
谢秦
曹筱欧
赵宏振
姚国风
唐新忠
李天杰
郑凤柱
左小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Tianjin Electric Power Co Ltd
Beijing Guodiantong Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Tianjin Electric Power Co Ltd, Beijing Guodiantong Network Technology Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201611114891.9A priority Critical patent/CN106777005A/zh
Publication of CN106777005A publication Critical patent/CN106777005A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/80Management or planning
    • Y02P90/82Energy audits or management systems therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Fuzzy Systems (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于大数据技术改进聚类算法的用户用电行为分析方法。其包括建立用户用电行为分析平台;提取用电用户一段时间内各类电器使用频率、用电时长、各时段用电量在内数据;将上述数据以行形式存储;任选1个数据片作为初始聚类中心,然后计算每个数据片到初始聚类中心的距离;判断计算的新的聚类中心与上一轮聚类中心间的距离,如果两者的差值大于给定阈值;建立用户用电评价指标体系,确定用户用电评价等级等步骤。本发明优点:利用大数据处理技术并发分析海量数据,可以通过电力企业提取3年以上的用电用电行为信息、各电器用电量数据,实现更大的数据吞吐量,获取更为全面的用户用电特征数据。

Description

基于大数据技术改进聚类算法的用户用电行为分析方法
技术领域
本发明属于电力系统数据分析技术领域,尤其是涉及一种基于大数据技术改进聚类算法的用户用电行为分析方法。
背景技术
传统的k-means聚类算法,可以对一定量级(TB级、GB级)的数据进行挖掘分析。国家电网公司目前大力推广智慧家庭建设,提高居民用电智能化水平,采集了海量的用户用电行为、用电量数据采集,并对用户用电行为、用电量等数据信息,形成PB级存储数据,采用基于云计算平台和并行k-means聚类算法,可提高聚类分析效率,建立峰时耗电率、负荷率、谷电系数等时间序列特征,并采用熵权法计算各类特征权重,分析用户用电负荷趋势。未来随着智能电网的建设和发展,针对不同用户的用电行为分析,为国网公司制定峰谷阶梯电价策略、完善需求侧响应基线负荷提供相关依据和数据支撑。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于大数据技术改进聚类算法的用户用电行为分析方法。
为了达到上述目的,本发明提供的基于大数据技术改进聚类算法的用户用电行为分析方法包括按顺序进行的下列步骤:
1)建立基于大数据技术改进聚类算法的用户用电行为分析平台;该用户用电行为分析平台包括依次连接的用户用电特征数据导入模块、基于大数据技术改进的聚类数据挖掘模块、用户用电评价指标体系输出模块,所述的基于大数据技术改进的聚类数据挖掘模块包括依次连接的分布数据处理单元、聚类中心处理单元和迭代流程控制单元;
2)利用用户用电特征数据导入模块从配电网实际运行数据中提取用电用户一段时间内各类电器使用频率、用电时长、各时段用电量在内的数据;
3)利用分布数据处理单元将上述数据以行形式存储,然后按行分成数据片1、数据片2……数据片n;
4)利用聚类中心处理单元任选1个数据片作为初始聚类中心,然后计算每个数据片到初始聚类中心的距离,重新标记其所属的聚类类别;若输入的记录数据为上一轮迭代的聚类中心,则计算出距离其最近的聚类中心,并做新类别的标记,即重新划分用户用电评价等级,形成映射数据标记,即Map1、Map2……Mapn数据标记;
规约计算新的聚类中心:对形成的映射数据标记进行数据格式的映射回归转换,并将其存入非关系型数据库中;根据数据映射得到的中间结果计算出新的聚类中心,输入数据<key,value>对的形式为<聚类类别ID,{响亮属性集}>;所有key相同的记录(即有相同类别ID的记录)送给一个规约任务———累加key相同的点个数和各记录分量的和,求各分量的均值,得到新的聚类中心描述文件;输出结果<key,value>对的形式为<聚类类别ID,均值向量>数据标记,即Reduce1、Reduce2……Reduce n数据标记;
5)利用迭代流程控制单元判断计算的新的聚类中心与上一轮聚类中心间的距离,如果两者的差值大于给定阈值,则进入下一轮迭代,即执行映射——规约过程;如果差值小于给定的阈值,则找到了该数据片各类电器使用频率、用电时长、各时段用电量等因素所处等级范围,进入用户用电信用评价体系输出模块3;
6)利用用户用电信用评价体系输出模块建立用户用电评价指标体系,根据各因素范围界定进一步确定用户用电的评价等级。
在步骤6)中,用户用电评价指标体系由高到低依次划分为AAA级、AA级、A级、B级、C级、D级共六大等级。
本发明提供的基于大数据技术改进聚类算法的用户用电行为分析方法具有如下优点:
一、本发明利用大数据处理技术并发分析海量数据,可以通过电力企业提取3年以上的用电用电行为信息、各电器用电量数据,实现更大的数据吞吐量,获取更为全面的用户用电特征数据。
二、适用于大数据平台的改进的聚类数据挖掘算法并发分析海量用户用电行为数据,分析效率更高,更加准确的评估出用户用电行为特征。
附图说明
图1为本发明提供的基于大数据技术改进聚类算法的用户用电行为分析方法中所建立的用户用电行为分析平台构成框图。
图2为本发明提供的基于大数据技术改进聚类算法的用户用电行为分析方法流程图。
具体实施方式
下面结合附图和具体实施例对本发明提供的基于大数据技术改进聚类算法的用户用电行为分析方法进行详细说明。
1)建立基于大数据技术改进聚类算法的用户用电行为分析平台,如图1所示,该用户用电行为分析平台包括依次连接的用户用电特征数据导入模块1、基于大数据技术改进的聚类数据挖掘模块2、用户用电评价指标体系输出模块3,所述的基于大数据技术改进的聚类数据挖掘模块2包括依次连接的分布数据处理单元21、聚类中心处理单元22和迭代流程控制单元23;
2)利用用户用电特征数据导入模块1从配电网实际运行数据中提取用电用户一段时间内各类电器使用频率、用电时长、各时段用电量在内的数据;
3)利用分布数据处理单元21将上述数据以行形式存储,然后按行分成数据片1、数据片2……数据片n;
4)利用聚类中心处理单元22任选1个数据片作为初始聚类中心,然后计算每个数据片到初始聚类中心的距离,重新标记其所属的聚类类别;若输入的记录数据为上一轮迭代的聚类中心,则计算出距离其最近的聚类中心,并做新类别的标记,即重新划分用户用电评价等级,形成映射数据标记,即Map1、Map2……Map n数据标记;
规约计算新的聚类中心:对形成的映射数据标记进行数据格式的映射回归转换。并将其存入非关系型数据库中。根据数据映射得到的中间结果计算出新的聚类中心,输入数据<key,value>对的形式为<聚类类别ID,{响亮属性集}>;所有key相同的记录(即有相同类别ID的记录)送给一个规约任务———累加key相同的点个数和各记录分量的和,求各分量的均值,得到新的聚类中心描述文件;输出结果<key,value>对的形式为<聚类类别ID,均值向量>数据标记,即Reduce1、Reduce2……Reduce n数据标记。
5)利用迭代流程控制单元23判断计算的新的聚类中心与上一轮聚类中心间的距离,如果两者的差值大于给定阈值,则进入下一轮迭代,即执行映射——规约过程;如果差值小于给定的阈值,则找到了该数据片各类电器使用频率、用电时长、各时段用电量等因素所处等级范围,进入用户用电信用评价体系输出模块3;
6)利用用户用电信用评价体系输出模块3建立用户用电评价指标体系,即将用户用电进行等级划分,等级由高到低依次划分为AAA级、AA级、A级、B级、C级、D级等六大等级,根据各因素范围界定进一步确定用户用电的评价等级。

Claims (2)

1.一种基于大数据技术改进聚类算法的用户用电行为分析方法,其特征在于,所述的基于大数据技术改进聚类算法的用户用电行为分析方法包括按顺序进行的下列步骤:
1)建立基于大数据技术改进聚类算法的用户用电行为分析平台;该用户用电行为分析平台包括依次连接的用户用电特征数据导入模块1、基于大数据技术改进的聚类数据挖掘模块2、用户用电评价指标体系输出模块3,所述的基于大数据技术改进的聚类数据挖掘模块2包括依次连接的分布数据处理单元21、聚类中心处理单元22和迭代流程控制单元23;
2)利用用户用电特征数据导入模块1从配电网实际运行数据中提取用电用户一段时间内各类电器使用频率、用电时长、各时段用电量在内的数据;
3)利用分布数据处理单元21将上述数据以行形式存储,然后按行分成数据片1、数据片2……数据片n;
4)利用聚类中心处理单元22任选1个数据片作为初始聚类中心,然后计算每个数据片到初始聚类中心的距离,重新标记其所属的聚类类别;若输入的记录数据为上一轮迭代的聚类中心,则计算出距离其最近的聚类中心,并做新类别的标记,即重新划分用户用电评价等级,形成映射数据标记,即Map1、Map2……Map n数据标记;
规约计算新的聚类中心:对形成的映射数据标记进行数据格式的映射回归转换,并将其存入非关系型数据库中;根据数据映射得到的中间结果计算出新的聚类中心,输入数据<key,value>对的形式为<聚类类别ID,{响亮属性集}>;所有key相同的记录(即有相同类别ID的记录)送给一个规约任务———累加key相同的点个数和各记录分量的和,求各分量的均值,得到新的聚类中心描述文件;输出结果<key,value>对的形式为<聚类类别ID,均值向量>数据标记,即Reduce1、Reduce2……Reduce n数据标记;
5)利用迭代流程控制单元23判断计算的新的聚类中心与上一轮聚类中心间的距离,如果两者的差值大于给定阈值,则进入下一轮迭代,即执行映射——规约过程;如果差值小于给定的阈值,则找到了该数据片各类电器使用频率、用电时长、各时段用电量等因素所处等级范围,进入用户用电信用评价体系输出模块3;
6)利用用户用电信用评价体系输出模块3建立用户用电评价指标体系,根据各因素范围界定进一步确定用户用电的评价等级。
2.根据权利要求1所述的基于大数据技术改进聚类算法的用户用电行为分析方法,其特征在于,在步骤6)中,用户用电评价指标体系由高到低依次划分为AAA级、AA级、A级、B级、C级、D级共六大等级。
CN201611114891.9A 2016-12-07 2016-12-07 基于大数据技术改进聚类算法的用户用电行为分析方法 Pending CN106777005A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611114891.9A CN106777005A (zh) 2016-12-07 2016-12-07 基于大数据技术改进聚类算法的用户用电行为分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611114891.9A CN106777005A (zh) 2016-12-07 2016-12-07 基于大数据技术改进聚类算法的用户用电行为分析方法

Publications (1)

Publication Number Publication Date
CN106777005A true CN106777005A (zh) 2017-05-31

Family

ID=58874681

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611114891.9A Pending CN106777005A (zh) 2016-12-07 2016-12-07 基于大数据技术改进聚类算法的用户用电行为分析方法

Country Status (1)

Country Link
CN (1) CN106777005A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898273A (zh) * 2018-05-29 2018-11-27 国网能源研究院有限公司 一种基于形态分析的用户侧负荷特征聚类评价方法
CN109241190A (zh) * 2018-09-12 2019-01-18 国网江苏省电力有限公司苏州供电分公司 电力大数据混合计算架构
CN110415487A (zh) * 2019-06-06 2019-11-05 国网浙江省电力有限公司 一种基于物联网的空巢老人健康监测的优化分析方法
CN110555972A (zh) * 2019-06-06 2019-12-10 国网浙江省电力有限公司 基于智能插座采集海量数据的家用电器使用频率优化方法
CN112163781A (zh) * 2020-10-15 2021-01-01 国网冀北电力有限公司智能配电网中心 基于多维度指标聚类的园区用电群体生命周期评价方法
CN113434690A (zh) * 2021-08-25 2021-09-24 广东电网有限责任公司惠州供电局 基于聚类算法的用电预测评估方法、装置、系统及介质
CN115545107A (zh) * 2022-10-09 2022-12-30 贵州电网有限责任公司 一种基于海量电力数据的云计算方法、系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108898273A (zh) * 2018-05-29 2018-11-27 国网能源研究院有限公司 一种基于形态分析的用户侧负荷特征聚类评价方法
CN109241190A (zh) * 2018-09-12 2019-01-18 国网江苏省电力有限公司苏州供电分公司 电力大数据混合计算架构
CN110415487A (zh) * 2019-06-06 2019-11-05 国网浙江省电力有限公司 一种基于物联网的空巢老人健康监测的优化分析方法
CN110555972A (zh) * 2019-06-06 2019-12-10 国网浙江省电力有限公司 基于智能插座采集海量数据的家用电器使用频率优化方法
CN110555972B (zh) * 2019-06-06 2021-08-13 国网浙江省电力有限公司 基于智能插座采集海量数据的家用电器使用频率优化方法
CN112163781A (zh) * 2020-10-15 2021-01-01 国网冀北电力有限公司智能配电网中心 基于多维度指标聚类的园区用电群体生命周期评价方法
CN113434690A (zh) * 2021-08-25 2021-09-24 广东电网有限责任公司惠州供电局 基于聚类算法的用电预测评估方法、装置、系统及介质
CN113434690B (zh) * 2021-08-25 2022-02-08 广东电网有限责任公司惠州供电局 基于聚类算法的用电预测评估方法、装置、系统及介质
CN115545107A (zh) * 2022-10-09 2022-12-30 贵州电网有限责任公司 一种基于海量电力数据的云计算方法、系统

Similar Documents

Publication Publication Date Title
CN106777005A (zh) 基于大数据技术改进聚类算法的用户用电行为分析方法
CN109829604A (zh) 一种电网侧储能电站运行效果综合评估方法
CN103135009B (zh) 基于使用者回馈信息的电器侦测方法与系统
CN103559655B (zh) 基于数据挖掘的微网新型馈线负荷的预测方法
CN104504508B (zh) 基于层次分析与小波回归的台区闭环数据分析方法
CN107423769A (zh) 基于形态特征的电力负荷曲线自适应聚类方法
CN105160416A (zh) 一种结合主元分析与神经网络的台区合理线损预测方法
CN107133652A (zh) 基于K‑means聚类算法的用电客户价值评估方法及系统
CN107528350B (zh) 一种适应中长期电源规划的风电出力典型场景生成方法
CN105305490A (zh) 一种考虑电能质量经济性最优的有源配电网规划方法
CN107248031B (zh) 一种针对负荷曲线峰谷差的快速电力用户分类方法
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN105046584A (zh) 一种基于k-means算法的理想线损率的计算方法
CN107909208A (zh) 一种台区配网降损方法
CN109634940A (zh) 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法
CN112149873A (zh) 一种基于深度学习的低压台区线损合理区间预测方法
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN106372747A (zh) 基于随机森林的台区合理线损率估计方法
CN104331840A (zh) 电力市场环境下负荷零售商的最优购电方法
CN108876114A (zh) 考虑新能源接入的电网效率效益评估方法
CN104036364A (zh) 一种配电网网络结构水平评价方法
CN103632306A (zh) 一种基于聚类分析的配电网供电区域划分方法
CN109242174A (zh) 一种基于决策树的季节性负荷自适应划分方法
CN107944747A (zh) 一种基于改进主成分分析的低压台区评价方法
CN107966600A (zh) 一种基于深度学习算法的防窃电系统及其防窃电方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170531

WD01 Invention patent application deemed withdrawn after publication