CN111177138A - 电力需求侧的大数据分析方法、装置、设备及存储介质 - Google Patents

电力需求侧的大数据分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111177138A
CN111177138A CN201911395814.9A CN201911395814A CN111177138A CN 111177138 A CN111177138 A CN 111177138A CN 201911395814 A CN201911395814 A CN 201911395814A CN 111177138 A CN111177138 A CN 111177138A
Authority
CN
China
Prior art keywords
data
power
data analysis
demand side
power demand
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911395814.9A
Other languages
English (en)
Inventor
罗磊
朱祥明
杜岱弼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hengtai Energy Technology Co ltd
Original Assignee
Shenzhen Hengtai Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hengtai Energy Technology Co ltd filed Critical Shenzhen Hengtai Energy Technology Co ltd
Priority to CN201911395814.9A priority Critical patent/CN111177138A/zh
Publication of CN111177138A publication Critical patent/CN111177138A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请属于电力工程技术领域,涉及电力需求侧的大数据分析方法、装置、设备及存储介质。该电力需求侧的大数据分析方法包括:对获取到的电力数据进行数据清洗,包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;集合归属于同一缴费用户的且经过所述数据清洗的电力数据;将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;生成缴费用户分类表。本申请涉及的电力需求侧的大数据分析方法能够对缴费用户进行快速地分类。

Description

电力需求侧的大数据分析方法、装置、设备及存储介质
技术领域
本申请属于电力工程技术领域,涉及电力需求侧的大数据分析方法、装置、设备及存储介质。
背景技术
由于电力供给侧存在垄断性,因此电力市场并非是一个完全开放的市场,具有准入门槛高、行政管制严、技术屏障多等特点。基于此种现实情况,通过电力供给侧的改革来合理地调节发电、输电、配电以及用电之间的成本与效率,始终受到较大的阻碍。为了落实好国家的绿色能源政策,有效解决电力短缺,电价过高,服务质量低下等问题,积极推动电力需求侧的改革成为主观上迫切且客观上可行的重大举措。其中一项关键措施是落实电力需求侧管理(DSM,Demand Side Management)。
DSM的主要内容包括:综合运用经济、技术、管理以及必要的行政手段,引导、激励和约束全社会优化用电方式、提高用电效率,实现科学用电、有序用电以及节约用电的总体目标。由于电力需求侧的用电终端极多、负荷特性复杂,因此通过技术手段来具体化DSM的内容,是决定DSM能否在电力工业中的逐步深入应用的关键一步。总的来说,落实DSM不仅能够有效解决电力短缺,电价过高,服务质量低下等问题,而且能够给整个电力行业带来了巨大的经济效益。
电力工程的研究内容涉及到电能的生产、输配以及使用等多个环节。电力需求侧的研究主要集中在电能的使用环节,重点解决电力数据的采集、存储、分析和应用的技术问题,向电力供给侧提供准确的电力需求情况,进而帮助电力供给侧快速响应,同时给电力需求侧反馈有效的数据分析结果。
现有技术中,电力数据的产生是极其分散的,电力数据的维度也是非常多的,此外电力数据的数据量也是极其惊人的,因此如何高效处理电力数据,并基于处理后的电力数据对缴费用户进行分类就成为一个亟待解决的技术问题。
发明内容
本申请实施例一方面公开了一种电力需求侧的大数据分析方法,旨在提高电力数据的分析处理,快速地对缴费用户进行分类。
所述电力需求侧的大数据分析方法包括:对获取到的电力数据进行数据清洗,具体包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;集合归属于同一缴费用户的且经过所述数据清洗的电力数据;将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;生成缴费用户分类表。
在本申请的一些实施例中,所述偏差数据检测包括:构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;所述缺失值处理包括:全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;所述噪声数据光滑处理包括:将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
在本申请的一些实施例中,所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据包括:获取经过所述数据清洗的电力数据;提取用于表征电力数据维度的特征值;根据所述特征值选择集合计算方式;对集合结果进行评估;
所述集合计算方式包括基于n维电力数据对象的计算方式,所述基于n维电力数据对象的计算方式为
Figure BDA0002346275030000021
或者为
Figure BDA0002346275030000022
或者为CD=max(|xk-yk|)k;或者为
Figure BDA0002346275030000023
其中,ED为欧几里得距离,MD为曼哈顿距离,CD为切比雪夫距离,MKD为闵可夫斯基距离,xk为一个n维电力数据对象X=(x1,x2,...,xn)的取值,yk为另一个n维电力数据对象Y=(y1,y2,...,yn)的取值,p为特定值的闵可夫斯基距离对应的欧几里得距离或曼哈顿距离或切比雪夫距离;所述对集合结果进行评估包括:用已知的归属于同一缴费用户的集合的类别标签为标准;将所述集合结果得出的集合与所述标准进行比对,进而判断出所述集合结果的质量。
在本申请的一些实施例中,所述输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述输入层的激活函数为
Figure BDA0002346275030000024
exp(-xi)为对某一电力数据维度的取值xi的相反数的指数;所述隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述输出层输出最终计算结果。
本申请实施例另一方面公开了一种电力需求侧的大数据分析装置。所述电力需求侧的大数据分析装置包括:数据清洗模块10,用于对获取到的电力数据进行数据清洗;集合模块20,用于集合归属于同一缴费用户的且经过所述数据清洗的电力数据;数据分析神经网络模块30,用于将集合后的所述电力数据导入电力需求侧数据分析神经网络;缴费用户标识模块40,用于基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;用户分类表生成模块50,用于生成缴费用户分类表。
在本申请的一些实施例中,所述数据清洗模块10包括:偏差数据检测子模块11,用于构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;缺失值处理子模块12,用于进行全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;噪声数据光滑处理子模块13,用于将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
在本申请的一些实施例中,所述集合模块20包括:获取子模块21,用于获取经过所述数据清洗的电力数据;提取子模块22,用于提取用于表征电力数据维度的特征值;计算方式选择模块23,用于根据所述特征值选择集合计算方式;评估子模块24,用于对集合结果进行评估。
在本申请的一些实施例中,所述数据分析神经网络模块30的输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述数据分析神经网络模块30的隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述数据分析神经网络模块30的输出层输出最终计算结果。
本申请实施例另一方面还公开了一种电力需求侧的大数据分析设备。所述电力需求侧的大数据分析设备包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任意一种所述的电力需求侧的大数据分析方法。
本申请实施例另一方面还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种所述的电力需求侧的大数据分析方法。
与现有技术相比,本申请公开的技术方案主要有以下有益效果:
在本申请的实施例中,所述电力需求侧的大数据分析方法包括:对获取到的电力数据进行数据清洗,具体包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;集合归属于同一缴费用户的且经过所述数据清洗的电力数据;将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;生成缴费用户分类表。所述电力需求侧的大数据分析方法通过对获取到的电力数据进行数据清洗,并集合归属于同一缴费用户的且经过所述数据清洗的电力数据,使得多维度的电力数据得到梳理和集合。所述电力需求侧的大数据分析方法通过所述电力需求侧数据分析神经网络进行智能判断,实现了对缴费用户的快速分类。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本申请的一实施例中一种电力需求侧的大数据分析方法的示意图;
图2为本申请的一实施例中所述偏差数据检测步骤的示意图;
图3为本申请的一实施例中所述同组均值填充步骤的示意图;
图4为本申请的一实施例中所述噪声数据光滑处理步骤的示意图;
图5为本申请的一实施例中所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据步骤的示意图;
图6为本申请的一实施例中所述对集合结果进行评估步骤的示意图;
图7为本申请的一实施例中一种电力需求侧的大数据分析装置的示意图;
图8为本申请的一实施例中所述数据清洗模块10的示意图;
图9为本申请的一实施例中所述集合模块20的示意图;
图10为本申请的一实施例中电力需求侧的大数据分析设备100的基本结构框图。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的较佳实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
本申请的一实施例公开一种电力需求侧的大数据分析方法。
参考图1,为本申请的一实施例中一种电力需求侧的大数据分析方法的示意图。
如图1中所示意的,所述电力需求侧的大数据分析方法包括:
步骤1:对获取到的电力数据进行数据清洗。
所述对获取到的电力数据进行数据清洗包括:偏差数据检测、缺失值处理以及噪声数据光滑处理。
步骤2:集合归属于同一缴费用户的且经过所述数据清洗的电力数据。
步骤3:将集合后的所述电力数据导入电力需求侧数据分析神经网络。
所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列。
步骤4:基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识。
步骤5:生成缴费用户分类表。
所述电力需求侧的大数据分析方法通过对获取到的电力数据进行数据清洗,并集合归属于同一缴费用户的且经过所述数据清洗的电力数据,使得多维度的电力数据得到梳理和集合。所述电力需求侧的大数据分析方法通过所述电力需求侧数据分析神经网络进行智能判断,实现了对缴费用户的快速分类。
参考图2,为本申请的一实施例中所述偏差数据检测步骤的示意图。
如图2中所示意的,在本申请的一些实施例中,所述偏差数据检测包括:
步骤111:构建概率分布评估模型。
步骤112:所述概率分布评估模型包括但不限于高斯分布概率模型。
步骤113:应用所述概率分布评估模型检测出离群点。
步骤114:将所述离群点对应的值作为偏差数据。
在本申请的一些实施例中,所述缺失值处理包括:全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充。其中,所述全局常量自动填充具体为:同一个常量替换所有的所述缺失值。
在本申请的一些实施例中,所述中心度量填充具体为:通过取属性的平均值、中位数、众数等指标来填充所述缺失值。
参考图3,为本申请的一实施例中所述同组均值填充步骤的示意图。
如图3中所示意的,在本申请的一些实施例中,所述同组均值填充具体为:
步骤121:参考有缺失值记录的其他属性值。
步骤122:将数据按照其他属性分类做聚合运算。
步骤123:统计有缺失值一列的平均数或中位数等指标,并用其替换缺失值。
在本申请的一些实施例中,所述最有可能值填充包括:用样本中的已有变量来预测有缺失值的变量。
参考图4,为本申请的一实施例中所述噪声数据光滑处理步骤的示意图。
如图4中所示意的,在本申请的一些实施例中,所述噪声数据光滑处理包括:
步骤131:将所述电力数据中有噪声的变量拟合成一条直线或曲线。
步骤132:用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
参考图5,为本申请的一实施例中所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据步骤的示意图。
如图5中所示意的,在本申请的一些实施例中,所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据包括:
步骤21:获取经过所述数据清洗的电力数据。
步骤22:提取用于表征电力数据维度的特征值。
步骤23:根据所述特征值选择集合计算方式。
步骤24:对集合结果进行评估。
所述集合计算方式包括基于n维电力数据对象的计算方式,所述基于n维电力数据对象的计算方式为
Figure BDA0002346275030000051
或者为
Figure BDA0002346275030000052
或者为CD=max(|xk-yk|)k;或者为
Figure BDA0002346275030000053
其中,ED为欧几里得距离,MD为曼哈顿距离,CD为切比雪夫距离,MKD为闵可夫斯基距离,xk为一个n维电力数据对象X=(x1,x2,...,xn)的取值,yk为另一个n维电力数据对象Y=(y1,y2,...,yn)的取值,p为特定值的闵可夫斯基距离对应的欧几里得距离或曼哈顿距离或切比雪夫距离。
参考图6,为本申请的一实施例中所述对集合结果进行评估步骤的示意图。
如图6中所示意的,所述对集合结果进行评估包括:
步骤241:用已知的归属于同一缴费用户的集合的类别标签为标准。
步骤242:将所述集合结果得出的集合与所述标准进行比对,进而判断出所述集合结果的质量。
在本申请的一些实施例中,所述输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述输入层的激活函数为
Figure BDA0002346275030000061
exp(-xi)为对某一电力数据维度的取值xi的相反数的指数;所述隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述输出层输出最终计算结果。
本申请实施例另一方面公开了一种电力需求侧的大数据分析装置。
参考图7,为本申请的一实施例中一种电力需求侧的大数据分析装置的示意图。
如图7中所示意的,所述电力需求侧的大数据分析装置包括:
数据清洗模块10,用于对获取到的电力数据进行数据清洗。
集合模块20,用于集合归属于同一缴费用户的且经过所述数据清洗的电力数据。
数据分析神经网络模块30,用于将集合后的所述电力数据导入电力需求侧数据分析神经网络。
缴费用户标识模块40,用于基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识。
用户分类表生成模块50,用于生成缴费用户分类表。
参考图8,为本申请的一实施例中所述数据清洗模块10的示意图。
如图8中所示意的,在本申请的一些实施例中,所述数据清洗模块10包括:
偏差数据检测子模块11,用于构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据。
缺失值处理子模块12,用于进行全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充。
噪声数据光滑处理子模块13,用于将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
参考图9,为本申请的一实施例中所述集合模块20的示意图。
如图9中所示意的,在本申请的一些实施例中,所述集合模块20包括:
获取子模块21,用于获取经过所述数据清洗的电力数据。
提取子模块22,用于提取用于表征电力数据维度的特征值。
计算方式选择模块23,用于根据所述特征值选择集合计算方式。
评估子模块24,用于对集合结果进行评估。
在本申请的一些实施例中,所述数据分析神经网络模块30的输入层的每一个神经元用于输入一个所述电力数据维度的取值。所述数据分析神经网络模块30的隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划。若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果。在所述隐藏层的输出满足迭代终止条件后,由所述数据分析神经网络模块30的输出层输出最终计算结果。
本申请的一实施例公开了一种电力需求侧的大数据分析设备。具体请参考图10,为本申请的一实施例中电力需求侧的大数据分析设备100的基本结构框图。
如图10中所示意的,所述电力需求侧的大数据分析设备100包括通过系统总线相互通信连接存储器101、处理器102、网络接口103。需要指出的是,图10中仅示出了具有组件101-103的电力需求侧的大数据分析设备100,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。本技术领域技术人员应当理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器101至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器101可以是所述计算机设备100的内部存储单元,例如该计算机设备100的硬盘或内存。在另一些实施例中,所述存储器101也可以是所述计算机设备100的外部存储设备,例如该计算机设备100上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器101还可以既包括所述计算机设备100的内部存储单元也包括其外部存储设备。本实施例中,所述存储器101通常用于存储安装于所述计算机设备100的操作系统和各类应用软件,例如上述面向电力需求侧的装置的程序代码等。此外,所述存储器101还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器102在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器102通常用于控制所述计算机设备100的总体操作。本实施例中,所述处理器102用于运行所述存储器101中存储的程序代码或者处理数据,例如运行上述面向电力需求侧的装置的程序代码。
所述网络接口103可包括无线网络接口或有线网络接口,该网络接口103通常用于在所述计算机设备100与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有电力需求侧的大数据分析方法的程序代码,所述电力需求侧的大数据分析方法的程序代码可被至少一个处理器执行,以使所述至少一个处理器执行上述任意一种电力需求侧的大数据分析方法的步骤。
最后应说明的是,显然以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

Claims (10)

1.一种电力需求侧的大数据分析方法,其特征在于,包括:
对获取到的电力数据进行数据清洗,包括:偏差数据检测、缺失值处理以及噪声数据光滑处理;
集合归属于同一缴费用户的且经过所述数据清洗的电力数据;
将集合后的所述电力数据导入电力需求侧数据分析神经网络,所述电力需求侧数据分析神经网络包括:输入层、一层或以上的隐藏层以及输出层,所述缴费用户的一个电力数据维度的数据构成所述输入层的一个序列;
基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;
生成缴费用户分类表。
2.根据权利要求1所述的电力需求侧的大数据分析方法,其特征在于:
所述偏差数据检测包括:构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;
所述缺失值处理包括:全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;
所述噪声数据光滑处理包括:将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
3.根据权利要求1所述的电力需求侧的大数据分析方法,其特征在于,所述集合归属于同一缴费用户的且经过所述数据清洗的电力数据包括:获取经过所述数据清洗的电力数据;提取用于表征电力数据维度的特征值;根据所述特征值选择集合计算方式;对集合结果进行评估;
所述集合计算方式包括基于n维电力数据对象的计算方式,所述基于n维电力数据对象的计算方式为
Figure FDA0002346275020000011
或者为
Figure FDA0002346275020000012
或者为CD=max(|xk-yk|)k;或者为
Figure FDA0002346275020000013
其中,ED为欧几里得距离,MD为曼哈顿距离,CD为切比雪夫距离,MKD为闵可夫斯基距离,xk为一个n维电力数据对象X=(x1,x2,...,xn)的取值,yk为另一个n维电力数据对象Y=(y1,y2,...,yn)的取值,p为特定值的闵可夫斯基距离对应的欧几里得距离或曼哈顿距离或切比雪夫距离;
所述对集合结果进行评估包括:用已知的归属于同一缴费用户的集合的类别标签为标准;将所述集合结果得出的集合与所述标准进行比对,进而判断出所述集合结果的质量。
4.根据权利要求1所述的电力需求侧的大数据分析方法,其特征在于,所述输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述输入层的激活函数为
Figure FDA0002346275020000014
exp(-xi)为对某一电力数据维度的取值xi的相反数的指数;所述隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述输出层输出最终计算结果。
5.一种电力需求侧的大数据分析装置,其特征在于,包括:
数据清洗模块(10),用于对获取到的电力数据进行数据清洗;
集合模块(20),用于集合归属于同一缴费用户的且经过所述数据清洗的电力数据;
数据分析神经网络模块(30),用于将集合后的所述电力数据导入电力需求侧数据分析神经网络;
缴费用户标识模块(40),用于基于所述电力需求侧数据分析神经网络的最终计算结果进行缴费用户标识;
用户分类表生成模块(50),用于生成缴费用户分类表。
6.根据权利要求5所述的电力需求侧的大数据分析装置,其特征在于,所述数据清洗模块(10)包括:
偏差数据检测子模块(11),用于构建概率分布评估模型,应用所述概率分布评估模型检测出离群点,将所述离群点对应的值作为偏差数据;
缺失值处理子模块(12),用于进行全局常量自动填充、中心度量自动填充、同组均值自动填充以及最有可能值自动填充;
噪声数据光滑处理子模块(13),用于将所述电力数据中有噪声的变量拟合成一条直线或曲线,用所述直线或所述曲线上的值替代所述电力数据中有噪声的所述变量。
7.根据权利要求5所述的电力需求侧的大数据分析装置,其特征在于,所述集合模块(20)包括:
获取子模块(21),用于获取经过所述数据清洗的电力数据;
提取子模块(22),用于提取用于表征电力数据维度的特征值;
计算方式选择模块(23),用于根据所述特征值选择集合计算方式;
评估子模块(24),用于对集合结果进行评估。
8.根据权利要求5所述的电力需求侧的大数据分析装置,其特征在于,所述数据分析神经网络模块(30)的输入层的每一个神经元用于输入一个所述电力数据维度的取值;所述数据分析神经网络模块(30)的隐藏层将所述输入层的输出特征抽象到另一个维度空间,并对抽象后的特征进行线性规划;若电力需求侧数据分析神经网络包含多层所述隐藏层,则由多层所述隐藏层对输出特征进行多层次抽象,最终获得更好的线性规划结果;在所述隐藏层的输出满足迭代终止条件后,由所述数据分析神经网络模块(30)的输出层输出最终计算结果。
9.一种电力需求侧的大数据分析设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任意一项所述的电力需求侧的大数据分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任意一项所述的电力需求侧的大数据分析方法。
CN201911395814.9A 2019-12-30 2019-12-30 电力需求侧的大数据分析方法、装置、设备及存储介质 Pending CN111177138A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911395814.9A CN111177138A (zh) 2019-12-30 2019-12-30 电力需求侧的大数据分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911395814.9A CN111177138A (zh) 2019-12-30 2019-12-30 电力需求侧的大数据分析方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111177138A true CN111177138A (zh) 2020-05-19

Family

ID=70650507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911395814.9A Pending CN111177138A (zh) 2019-12-30 2019-12-30 电力需求侧的大数据分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111177138A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2786322A1 (en) * 2011-11-29 2014-10-08 Energy Aware Technology Inc. Method and system for forecasting power requirements using granular metrics
CN106780140A (zh) * 2016-12-15 2017-05-31 国网浙江省电力公司 基于大数据的电力信用评价方法
CN107895245A (zh) * 2017-12-26 2018-04-10 国网宁夏电力有限公司银川供电公司 一种基于用户画像的电费回收风险评估方法
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质
CN107247737B (zh) * 2017-05-10 2018-12-11 国家电网公司 基于用电量的台区违约用电分析与挖掘方法
CN110083593A (zh) * 2019-04-23 2019-08-02 中国大唐集团科学技术研究院有限公司华东电力试验研究院 电站运行参数清洗及修复方法、修复系统
CN110175167A (zh) * 2019-05-10 2019-08-27 国网天津市电力公司电力科学研究院 一种适用于低压台区用电数据的数据清洗方法及系统
CN110188095A (zh) * 2019-06-03 2019-08-30 东北电力大学 一种基于关联规则的电网设备数据流清洗方法
CN110503570A (zh) * 2019-07-16 2019-11-26 国网江苏省电力有限公司滨海县供电分公司 一种异常用电数据检测方法、系统、设备、存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2786322A1 (en) * 2011-11-29 2014-10-08 Energy Aware Technology Inc. Method and system for forecasting power requirements using granular metrics
CN106780140A (zh) * 2016-12-15 2017-05-31 国网浙江省电力公司 基于大数据的电力信用评价方法
CN107247737B (zh) * 2017-05-10 2018-12-11 国家电网公司 基于用电量的台区违约用电分析与挖掘方法
CN107895245A (zh) * 2017-12-26 2018-04-10 国网宁夏电力有限公司银川供电公司 一种基于用户画像的电费回收风险评估方法
CN108681973A (zh) * 2018-05-14 2018-10-19 广州供电局有限公司 电力用户的分类方法、装置、计算机设备和存储介质
CN110083593A (zh) * 2019-04-23 2019-08-02 中国大唐集团科学技术研究院有限公司华东电力试验研究院 电站运行参数清洗及修复方法、修复系统
CN110175167A (zh) * 2019-05-10 2019-08-27 国网天津市电力公司电力科学研究院 一种适用于低压台区用电数据的数据清洗方法及系统
CN110188095A (zh) * 2019-06-03 2019-08-30 东北电力大学 一种基于关联规则的电网设备数据流清洗方法
CN110503570A (zh) * 2019-07-16 2019-11-26 国网江苏省电力有限公司滨海县供电分公司 一种异常用电数据检测方法、系统、设备、存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHINWUFORWORK: "关于神经网络中隐藏层和神经元的深入理解", 《HTTPS://BLOG.CSDN.NET/CHINWUFORWORK/ARTICLE/DETAILS/85180132》 *
吴祺育的笔记: "关于神经网络中隐藏层和神经元的深入理解", 《简书》 *

Similar Documents

Publication Publication Date Title
CN108959187B (zh) 一种变量分箱方法、装置、终端设备及存储介质
CN113408341B (zh) 负荷识别方法、装置、计算机设备和存储介质
CN113542241B (zh) 一种基于CNN-BiGRU混合模型的入侵检测方法及装置
CN112463848A (zh) 检测用户异常行为的检测方法、系统、装置和存储介质
CN110069546A (zh) 一种数据分类方法、数据分类装置及终端设备
CN115617784A (zh) 一种信息化配电的数据处理系统及其处理方法
CN115794578A (zh) 一种电力系统的数据管理方法、装置、设备及介质
CN114202179A (zh) 目标企业的识别方法以及装置
CN111950623B (zh) 数据稳定性监控方法、装置、计算机设备及介质
CN115563477B (zh) 谐波数据识别方法、装置、计算机设备和存储介质
CN117559443A (zh) 尖峰负荷下大工业用户集群有序用电控制方法
CN106127602B (zh) 一种基于约简离群点算法的窃电辨识方法及装置
Jin et al. Power load curve clustering algorithm using fast dynamic time warping and affinity propagation
CN116561230A (zh) 一种基于云计算的分布式存储与检索系统
CN111177138A (zh) 电力需求侧的大数据分析方法、装置、设备及存储介质
CN115841338A (zh) 确定异常用电行为的方法及装置、非易失性存储介质
Ma The Research of Stock Predictive Model based on the Combination of CART and DBSCAN
Meng et al. Empirical mode decomposition-based multi-scale spectral graph convolution network for abnormal electricity consumption detection
CN111027296A (zh) 基于知识库的报表生成方法及系统
CN113033089A (zh) 用电量异常用户识别方法和装置
Ren et al. Multivariable panel data ordinal clustering and its application in competitive strategy identification of appliance-wiring listed companies
CN110658373A (zh) 一种基于多重算法融合的配电网窃电监测方法、模型及可读存储介质
Guan et al. Stock prediction via time series clustering and image feature extraction
CN114155038B (zh) 受疫情影响用户识别方法
CN113723835B (zh) 火电厂用水评估方法和终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200519

RJ01 Rejection of invention patent application after publication