CN112862179A - 一种用能行为的预测方法、装置及计算机设备 - Google Patents

一种用能行为的预测方法、装置及计算机设备 Download PDF

Info

Publication number
CN112862179A
CN112862179A CN202110151184.1A CN202110151184A CN112862179A CN 112862179 A CN112862179 A CN 112862179A CN 202110151184 A CN202110151184 A CN 202110151184A CN 112862179 A CN112862179 A CN 112862179A
Authority
CN
China
Prior art keywords
data
energy
different user
user categories
energy consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110151184.1A
Other languages
English (en)
Inventor
邵云峰
刘永强
袁博
任津京
武志强
冯秀丽
严骆锴
吴志刚
姚志安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Luliang Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Original Assignee
Tellhow Software Co ltd
Luliang Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tellhow Software Co ltd, Luliang Power Supply Co of State Grid Shanxi Electric Power Co Ltd filed Critical Tellhow Software Co ltd
Priority to CN202110151184.1A priority Critical patent/CN112862179A/zh
Publication of CN112862179A publication Critical patent/CN112862179A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Technology Law (AREA)

Abstract

本发明实施例公开了一种用能行为的预测方法、装置及计算机设备,用能行为的预测方法包括:采集用户的综合用能数据;对数据进行异常数据的检测和删除、数据清洗以得到修正数据,再对修正数据进行数据规范化处理,得到规范数据;利用近似传播算法,将规范数据对应的修正数据划分为不同用户类别的用能样本;根据不同用户类别的用能样本得到不同用户类别的用能统计图;根据用能统计图预测不同用户类别的用能行为;由此,本发明公开的技术方案在进行用能行为预测时,能得到数据的有效支撑;并将用能数据划分不同用户类别的用能数据,从而能针对不同的用户做出不同的预测,由此保证了行为预测的合理性和准确性。

Description

一种用能行为的预测方法、装置及计算机设备
技术领域
本发明涉及行为预测领域,尤其涉及一种用能行为的预测方法、装置 及计算机设备。
背景技术
在技术的不断变革下,能源的转换和分配也更加协调,新型能源市场 和交易机制的革新以及市场各方主体共同利益诉求,使得未来能源的利用 体系将走向以用户为中心的综合能源系统(Integrated Energy System,IES), 同时也将产生更多的新型综合能源服务商,以便更好地服务于市场用户的 个性化需求。以“互联网+”为中心的智慧能源住宅区将是综合能源服务商 进行用户侧服务管理的重点方向之一,因而对用户用能行为的分析和理解 是综合能源服务商适应用户用能需求增长和用能方式多元化趋势的重要途 径,同时也为用户制定个性化用能方案提供必要手段。因此,分析并预测 用户侧用能行为就显得十分迫切。
然而,分析用户侧用能行为面对着两个方面的问题,一方面现有技术 基本都是对用户用电行为的研究,无法满足现在综合能源系统分析要求, 另一方面,现在综合能源数据量非常庞大,数据来源广泛,能源数据来源 存在差异的问题和缺少数据质量控制机制,造成异常数据生成,导致用能 行为的预测精度低。
发明内容
为了解决用能行为预测精度低的问题,本发明提出了一种用能行为的 预测方法、装置及计算机设备,包括:
第一方面,本发明的第一种实施方式提出了一种用能行为的预测方法, 包括:
采集用户的综合用能数据,其中,综合用能数据包括用电数据、制冷 数据、用热数据以及用气数据;
对综合用能数据进行异常数据剔除和数据清洗,获得修正数据;
对修正数据进行规范化处理,得到规范数据;
通过近似传播算法对规范数据进行聚类分析,将规范数据对应的修正 数据划分成不同用户类别的用能样本;
根据不同用户类别的用能样本获得不同用户类别对应的用能统计图, 并根据用能统计图预测不同用户类别的用能行为。
具体的,上述用能行为的预测方法,包括:
基于正态分布和/或孤立森林模型,检测并删除综合用能数据中的异常 数据,得到正常数据;
对正常数据进行数据清洗,获得修正数据。
具体的,上述用能行为的预测方法,包括:
将修正数据转换为相同格式的待处理数据,再对待处理数据进行数据 压缩,得到统一数据;
对统一数据进行数据规范化处理,得到规范数据。
进一步的,上述用能行为的预测方法,包括:
利用主成分分析算法对规范数据进行特征提取,得到特征样本;
通过近似传播算法对特征样本进行聚类分析,将特征样本对应的修正 数据划分成不同用户类别的用能样本。
进一步的,上述用能行为的预测方法,包括:
根据不同用户类别的用能样本获得不同用户类别对应的用能统计图集 合,其中,用能统计图集合包括用电统计图、制冷统计图、用热统计图以 及用气统计图;
分别将不同用户类别的用能样本输入至关系耦合模型,得到不同用户 类别的用能关系模型;
根据用能统计图集合和用能关系模型,预测不同用户类别的用能行为。
可选的,上述关系耦合模型为预先训练好的长短期记忆神经网络模型。
具体的,上述用户类别包括工业用户、农业用户、商业用户以及居民 用户。
第二方面,本发明的第二种实施方式提出一种用能行为的预测装置, 包括:
采集模块,用于采集用户的综合用能数据,其中,综合用能数据包括 用电数据、制冷数据、用热数据以及用气数据;
修正模块,用于对综合用能数据进行异常数据剔除和数据清洗,获得 修正数据;
规范化处理模块,用于对修正数据进行规范化处理,得到规范数据;
分类模块,用于通过近似传播算法对规范数据进行聚类分析,将规范 数据对应的修正数据划分成不同用户类别的用能样本;
预测模块,用于根据不同用户类别的用能样本获得不同用户类别对应 的用能统计图,并根据用能统计图预测出不同用户类别的用能行为。
第三方面,本发明的第三种实施方式提出一种计算机设备,包括存储 器以及处理器,存储器存储有计算机程序,计算机程序在处理器上运行时 执行如第一方面中的用能行为的预测方法。
第四方面,本发明的第四种实施方式提出一种计算机可读存储介质, 计算机可读存储介质上存储有计算机程序,计算机程序在处理器上运行时 执行如第一方面中的用能行为的预测方法。
本发明在采集用户的综合用能数据后,对数据进行异常数据的检测和 删除、数据清洗得到修正数据,再对修正数据进行数据规范化处理,得到 规范数据,利用近似传播算法,将规范数据对应的修正数据划分为不同用 户类别的用能样本,最后根据不同用户类别的用能样本得到不同用户类别 的用能统计图,从而根据用能统计图预测不同用户类别的用能行为。由此, 本发明所提出的用能行为的预测方法,将来源广泛且数据质量不统一的综 合用能数据修正为合理的数据格式,因而在进行用能行为预测时,能得到 数据的有效支撑;并将用能数据划分不同用户类别的用能数据,从而能针 对不同的用户做出不同的预测,由此保证了行为预测的合理性和准确性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用 的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例, 因此不应被看作是对本发明保护范围的限定。在各个附图中,类似的构成 部分采用类似的编号。
图1示出了本发明用能行为的预测方法的流程示意图;
图2a和图2b分别示出了未经过和以经过本发明用能行为的预测方法 中的S120的修正的图示,其中,图2a为未经修正的用电数据统计图,图 2b为已经修正的用电数据统计图;
图3示出了一张近似传播算法的运行示意图;
图4a、图4b和图4c分别示出了一张通过本发明用能行为的预测方法 所得到的用电行为的预测图;
图5示出了一张孤立森林模型的运行示意图;
图6示出了通过本发明用能行为的预测方法中的S140后,某个商业用 户一天内的用电行为的统计图;
图7示出了一张本发明用能行为的预测方法的S150的流程示意图;
图8示出了本发明用能行为的预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。
通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同 的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详 细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选 定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动 的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在下文中,可在本发明的各种实施例中使用的术语“包括”、“具有” 及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述 项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步 骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、 数字、步骤、操作、元件、组件或前述项的组合的可能性。
此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理 解为指示或暗示相对重要性。
除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语) 具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的 含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在 相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含 义或过于正式的含义,除非在本发明的各种实施例中被清楚地限定。
实施例1
本发明的第一个实施例提出一种用能行为的预测方法,参照图1,图1 示出了一张用能行为的预测方法的流程示意图,此方法包括:
S110,采集用户的综合用能数据,其中,综合用能数据包括用电数据、 制冷数据、用热数据以及用气数据。
可选的,获取综合用能数据的方式包括但不限于:智能设备监测、消 费信息记录以及系统运行数据。具体而言,智能设备监测可以理解为通过 智能设备中内置的传感器采集用能数据,包括用户在某时刻的用电、用热、 制冷、用气等用能情况;消费信息记录则是指各类能源消费的收支记录, 如用户的用电度数、用气立方数、用热和制冷支出等消费信息;系统运行 数据一般指工业系统中,各类能源设备的运行数据。
可以理解的,本实施例中各类数据均是分类存储,即本实施例中的综 合用能数据实际为用电数据、制冷数据、用热数据以及用气数据的集合, 且在后续任一步骤中,均需要分类存储各类数据。
S120,对综合用能数据进行异常数据剔除和数据清洗,获得修正数据。
可以理解的,综合用能数据来源广泛,数据源不仅存在差异,还缺少 统一的数据质量控制机制,换言之,采集到的原始数据中可能存在异常数 据、错误数据、缺失数据以及重复数据,贸然使用原始数据来完成行为预 测,将会导致预测的结果难以得到数据支撑,使得预测的精度不够高。
因此,本实施例对采集到的综合用能数据进行异常数据剔除和数据清 洗,参照图2a和图2b,图2a出示了一张未经修正的用电数据统计图,图 2b出示了一张已经修正的用电数据统计图。
具体的,将综合用能数据中的异常数据剔除、错误数据进行修改和删 除,填充缺失数据以及合并重复数据,使得采集到的用能数据更为合理, 保证了用能行为的预测能更好地拟合现实情况。
S130,对修正数据进行规范化处理,得到规范数据。
具体的,本实施例需要将修正后的数据进行规范化处理,将修正数据 中各个元素的数值大小缩放至相同的范围,得到与修正数据具备映射关系 的规范数据,使得在进行后续步骤之前,将数据的维度、粒度以及量纲差 异调整至合理的数值或范围,从而提高后续步骤的执行效率,保证本实施 例的实施效率。
S140,通过近似传播算法对规范数据进行聚类分析,将规范数据对应 的修正数据划分成不同用户类别的用能样本。
可以理解的,用能习惯因人而异,因此,为了提供更好的个性化服务, 需要分析并预测不同用户的用能习惯。本实施例中,通过近似传播算法 (Affinity propagationClustering Algorithm),对规范数据进行聚类分析,将规 范数据划分成不同用户类别,从而将与规范数据具备映射关系的修正数据 划分为不同用户类别的用能样本。
优选的,本实施例采用了近似传播算法来完成聚类分析,是基于数据 点间的“信息传递”的一种聚类算法,近似传播算法相比于K均值算法, 鲁棒性强,准确度较高。
近似传播算法的基本思想是将全部数据点都当作潜在的聚类中心 (exemplar),然后数据点两两之间连线构成一个网络,再不断迭代网络中各 条边的吸引消息(responsibility)和归属信息(availability),示范性的,参照图 3,图3示出了一张近似传播算法的运行示意图;由图可知,当聚类中心经 过若干次迭代之后保持不变或者算法执行超过设定的迭代次数,又或者一 个小区域内的关于样本点的决策经过数次迭代后保持不变时,则算法结束, 即聚类完成。
S150,根据不同用户类别的用能样本获得不同用户类别对应的用能统 计图,并根据用能统计图预测不同用户类别的用能行为。
具体的,分别对不同的用户类别进行统计分析,得到不同用户类别对 应的用能统计图,其中,用能统计图包括但不限于折线统计图、柱状统计 图以及扇形统计图等;再根据用能统计图得出不同用户类别的用能行为, 具体而言,参见图4a、图4b以及图4c,图4a、图4b以及图4c分别示出 了用户y在5月6日、5月7日以及5月8日的用电行为预测图,预测了用户y在未来3天不同时段的用电情况,其中,横坐标为时间,纵坐标为用 电度数。
基于上述实施例1中的用能行为的预测方法,将来源广泛且数据质量 不统一的综合用能数据修正为合理的数据格式,因而在进行用能行为预测 时,能得到数据的有效支撑,并将用能数据划分不同的类别,从而能针对 不同的用户类别做出不同的预测,保证了行为预测的合理性和准确性。
具体的,上述S120,包括:
基于正态分布和/或孤立森林模型,检测并删除综合用能数据中的异常 数据,得到正常数据;
对正常数据进行数据清洗,获得修正数据。
优选的,本实施例采用了正态分布和/或孤立森林(Isolation Forest)模型 来完成异常数据的检测和删除。
具体而言,当采集到的数据符合正态分布时,本实施例基于3σ原则, 将采集的综合用能数据中0.3%的数据认定为异常数据并删除。
可以理解的,当采集到的数据不符合正态分布时,也可以用远离平均 值的多少倍标准差来描述异常数据的占比。
进一步的,在利用正态分布进行异常数据的检测和删除之前或之后, 本实施例基于孤立森林模型对综合用能数据进行异常数据的检测和删除。
具体而言,异常数据相对于其他数据存在明显的差异,这种差异一般 能通过各种统计的、距离的、密度的量化指标去描述,而孤立森林则是直 接去刻画数据的疏离(Isolation)程度,而不借助其他量化指标。
示范性的,参照图5,图5示出了一张孤立森林模型的运作示意图。假 设存在一组一维数据,若需要将点A和点B单独切分出来,可以采用如下 步骤:在最大值和最小值之间随机选择一个值x,按照<x和>=x可以把数 据分成左右两组;在这两组数据中分别重复这个步骤,直到数据不可再分。 显然,点B跟其他数据比较孤立,即疏离,只需要用很少的次数就可以把 点B单独切分出来;点A跟其他数据比较紧密,需要更多的次数才能把它 切分出来。
因此,在上面的例子中,点B由于跟其他数据隔的比较远,会被认为 是异常数据,而点A会被认为是正常数据。由此可知,异常数据由于跟其 他数据点较为疏离,仅需要较少几次切分就可以将它们单独划分出来,而 正常数据则明显需要更多的切分次数。
基于上述孤立森林的计算方式,本实施例首先从综合用能数据中随机 抽取一批样本,再从样本中随机选取一个点作为起始点,并在该起始点的 大值和最小值之间随机选取一个值,将样本中小于该值的数据划分为左分 支,大于等于该值的数据划分为右分支;不断在左右两个分支重复划分, 直至样本不可再分,只包含一条数据,或者全部数据相同时,或达到预设 的次数时,认定孤立森林模型训练完成;再通过训练好的孤立森林模型,对综合用能数据进行异常数据的检测和删除。
可以理解的,本实施例并未限定异常数据的检测必须要同时利用正态 分布和孤立森林模型来完成异常检测,可以仅使用正态分布,也可以只使 用孤立森林模型,或者是二者的组合,不对二者的使用做出任何限定。
更进一步的,在进行异常数据的检测和删除之后,本实施例还进行了 数据清洗。
具体而言,得到的正常数据中还存在错误数据,这些错误数据产生的 原因有:直接错误,如输入错误;数据的存储类型错误,如数字存成字符 串;数据编码错误,如用GBK编码UTF-8的数据;数据格式错误,如全角 与半角问题;依赖冲突,如表的字段之间的应该满足相应的关系。多值错 误,如多个值存储在同一个字段中的;当系统不完善时,还可能导致数据 不符合实际业务规则的错误。这种错误数据需要通过业务系统数据库用 SQL(Structured Query Language,结构化查询语言)的方式查找,并设置相应 的处理方式。
进一步的,得到的正常数据中还存在数据不完整的问题,如缺行、缺 列和字段丢失等情况。针对此类问题,本实施例通过预设的填充规则处理, 如数据的状态分布,使用中值、平均值或者使用k近邻分析后得到的中心 值,来完成填充。
而针对正常数据中的重复数据,本实施例通过判断数据间的属性值是 否相等来检测数据是否相等,相等的数据合并为一条数据,由此完成去重。
基于上述手段,本实施例将采集到的原始数据,即综合用能数据,进 行了异常剔除和数据清洗,使得后续步骤进行中使用的数据都是最接近真 实分布且合理的,还降低了对数据源的要求,保证了方法实施的鲁棒性和 健壮性。
进一步的,上述S130,包括:
将修正数据转换为相同格式的待处理数据,再对待处理数据进行数据 压缩,得到统一数据;
对统一数据进行数据规范化处理,得到规范数据。
可以理解的,为了提升后续步骤的实施效率,本实施例还对修正数据 进行了数据转换、数据压缩以及数据规范化。
具体而言,数据转换即将清洗后的正常数据转换为统一的格式化数据, 本实施例采用的数据转换的方法包括但不限于平滑处理、合计处理、数据 泛化处理、规格化处理以及属性构造处理中其中一种或多种,本实施例对 数据转换的方式不做任何限定。
数据压缩是指在保持原有数据集的完整性和准确性,不丢失有用信息 的前提下,按照一定的算法和方式对数据进行重新组织,用于减少存储空 间,提高其传输、存储和处理效率,减少数据的冗余和存储的空间;本实 施例采用的数据压缩的方法包括但不限于数据聚合、维度约减以及数据块 消减的其中一种或多种,数据压缩的方法可以根据实际情况调整,本实施 例对数据压缩的方式不做任何限定。
进一步的,本实施例为了消除指标之间的量纲和取值范围差异的影响, 进行了数据的规范化处理,对获取的统一数据进行了特征缩放,使之落入 一个特定的区域,便于进行综合分析;可选的,本实施例采用的规范化处 理方式包括但不限于最大-最小规范化(Min-Max Normalization)、零-均值规 范化(Zero-Mean Normalization)以及小数定标规范化,本实施例不对规范化 的方式进行任何限定。
可以理解的,S130中的得到规范数据的步骤并不需要限定在S130中, 写于S130中仅是为了更好描述本实施例的实施方式,本实施例仅要求得到 规范数据的步骤在S110之后,在S140之前完成即可。
具体的,上述S140,包括:
利用主成分分析算法对规范数据进行特征提取,得到特征样本;
通过近似传播算法对特征样本进行聚类分析,将特征样本对应的修正 数据划分成不同用户类别的用能样本。
可以理解的,为了进一步提升聚类分析的结果,即为了区分不同用户 类别,更好的提供差异化服务,本实施例基于主成分分析(Principle Component Analysis)算法,对获取到的规范数据的进行了特征提取,从而解 决了特征过多导致的维度灾难和特征冗余问题,同时能够减少聚类模型训 练的时间并提高了聚类模型的精度。
具体而言,主成分分析算法的实施步骤包括:1)对所有的样本进行中 心化:样本的每个特征减去该特征均值;2)计算样本的协方差矩阵;3) 对协方差矩阵进行特征值分解;4)取出最大的n个特征值对应的特征向量, 将所有的特征向量标准化后,组成特征向量矩阵;5)用特征向量矩阵乘以 样本集中的每一个样本x(i),转化为新的样本,即为降维后的输出样本。
基于上述主成分分析算法,本实施例将规范数据的方差最大的方向作 为主要特征,并利用提取到的数据进行聚类分析,保证了聚类的分析效率。
此外,关于S140和S150中的用户类别,本实施例通过聚类分析,将 用户类别划分为工业用户、农业用户、商业用户以及居民用户。
可以理解的,不同的用户类别的用电系统存在明显不同的差异,如工 业用户在平时工作日用电量相对较高,周末和节假日用电量会降低;农业 用电季节性比较明显,用电比较集中,如春夏排灌水利用电,秋季农业、 农副业用电较为集中,冬季用电较少;居民用电在每天早晨八点到晚上21 点用电量较高,其他时间用电量较低;商业用电在每天的十点到晚上十一 点用电量较为集中,其他时间段用电量比较少,示范性的,参照图6,图6 示出了一张某个商业用户一天内的用电行为的统计图。
进一步的,上述S150,参照图7,图7示出了S150的流程示意图,S150 包括:
S151,根据不同用户类别的用能样本获得不同用户类别对应的用能统 计图集合,其中,用能统计图集合包括用电统计图、制冷统计图、用热统 计图以及用气统计图。
具体而言,本实施例通过用能样本的用电数据、制冷数据、用热数据 以及用气数据绘制出了用户的用电统计图、制冷统计图、用热统计图以及 用气统计图,即用户在某段时期内的用电行为图、某段时期内的制冷行为 规律图、某段时期内的用热行为图以及某段时期内的用气行为图;其中, 用电行为可以理解为用户一天中,各个时间段的用电量;制冷行为可以理 解为一天中各个时间段,居民用户的空调制冷、冰箱制冷,或者商业用户 的冰柜制冷,仓库制冷等行为所消耗的用电量;用热行为可以理解一天中 各个时间段,居民用户的空调、地暖制热,工业或农业中的用热;而用气 则可以理解为一天中各个时段的用气立方数。
优选的,为了更好的体现出用电行为,本实施例采用了折线统计图形 式来完成用电行为图的绘制。可以理解的,折线统计图仅是一种优选的展 示和使用方式,本实施例也可以通过其他方式,如函数模型或其他形式的 统计图,本实施例不对用电行为的展示方式做出任何限定。
S152,分别将不同用户类别的用能样本输入至关系耦合模型,得到不 同用户类别的用能关系模型。
可以理解的,上述S151中的各类用能行为间,存在一定的正面联系或 负面联系,如用电行为、用热行为和制冷行为,三者间存在明显的正相关 和负相关的关系,且在居民用能中,用热和用气之间同样存在正相关的关 系。因此,为了满足现在综合能源系统分析要求,也了更好的分析用户的 用能行为,本实施例中,还分别将不同用户类别的用能样本输入至关系耦 合模型,得到不同用户类别的用能关系模型。
其中,训练好的用能关系模型能根据需求,得到用户在不同时间段的 用能关系,如电能消耗中制冷或制热的占比率,天然气能源的消耗中制热 的占比率,用热和制冷的相关率等,从而使用户的用能行为能得到更好的 说明和体现,在后续的行为预测中,能明确说明能源的具体使用状况。
可以理解的,用能关系可以采用多种形式来展现,本实施例用能关系 模型的输出可以为统计图、具体的数值或者数学模型,本实施例不对用能 关系的具体形式作出具体限定,仅提供一种可选的的展现形式。
具体的,上述关系耦合模型为预先训练好的长短期记忆(LSTM,Long Short-TermMemory)神经网络模型。
可以理解的,LSTM是RNN(循环神经网络,Recurrent Neural Network) 的变种之一,与RNN类似,LSTM对具备时间序列关系的输入也能进行很 好的处理,还解决了一般的RNN存在的长期依赖问题,从而能记住需要长 时间记忆的,忘记不重要的特征。
具体而言,本实施例针对不同用户类别的用能样本分别输入至预先训 练好的LSTM模型,得到不同用户类别的用能关系模型。
S153,根据用能统计图集合和用能关系模型,预测不同用户类别的用 能行为。
具体的,针对不同用户类别,本实施例根据此用户类别的用能统计图 集合和用能关系模型,得出此用户类别某段时期的用能行为;如一天中的 用电情况、用热多少、制冷占比、用气量以及各类能源间的关系,由此, 使得各个综合能源服务商能根据用户的具体用能情况来制定个性化用能方 案,从而提高了综合能源服务商的市场竞争力,保证了能源的利用率。
实施例2
本发明的第二个实施例提出一种用能行为的预测装置,参照图8,图8 示出了一张用能行为的预测装置的结构示意图,用能行为的预测装置200 包括:采集模块210、修正模块220、规范化处理模块230、分类模块240 以及预测模块250,其中:
采集模块210,用于采集用户的综合用能数据,其中,综合用能数据包 括用电数据、制冷数据、用热数据以及用气数据。
修正模块220,用于对综合用能数据进行异常数据剔除和数据清洗,获 得修正数据;
规范化处理模块230,用于对修正数据进行规范化处理,得到规范数据;
分类模块240,用于通过近似传播算法对规范数据进行聚类分析,将规 范数据对应的修正数据划分成不同用户类别的用能样本;
预测模块250,用于根据不同用户类别的用能样本获得不同用户类别对 应的用能统计图,并根据用能统计图预测出不同用户类别的用能行为。
应当理解,本实施例的技术方案通过上述各个功能模块的协同作用, 用于执行上述实施例1的用能行为的预测方法,实施例1所涉及的实施方 案以及有益效果在本实施例中同样适用,在此不再赘述。
在本实施例中,还涉及一种计算机设备,包括存储器和处理器,存储 器用于存储计算机程序,所述处理器运行所述计算机程序以使所述终端设 备能执行上述实施例1的方法。
在本实施例中,还涉及一种可读存储介质,存储有计算机程序,计算 机程序在处理器上运行时执行上述实施例1的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法, 也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的, 例如,附图中的流程图和结构图显示了根据本发明的多个实施例的装置、 方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上, 流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分, 所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注 的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框 实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所 涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及 结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用 的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块或单元可以集成在一起形 成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模 块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使 用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发 明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储 介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人 计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM, Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、 磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局 限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可 轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种用能行为的预测方法,其特征在于,包括:
采集用户的综合用能数据,其中,所述综合用能数据包括用电数据、制冷数据、用热数据以及用气数据;
对所述综合用能数据进行异常数据剔除和数据清洗,获得修正数据;
对所述修正数据进行规范化处理,得到规范数据;
通过近似传播算法对所述规范数据进行聚类分析,将所述规范数据对应的所述修正数据划分成不同用户类别的用能样本;
根据不同用户类别的所述用能样本获得不同用户类别对应的用能统计图,并根据所述用能统计图预测不同用户类别的用能行为。
2.根据权利要求1所述的方法,其特征在于,所述对所述综合用能数据进行异常数据剔除和数据清洗,获得修正数据,包括:
基于正态分布和/或孤立森林模型,检测并删除所述综合用能数据中的异常数据,得到正常数据;
对所述正常数据进行数据清洗,获得修正数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述修正数据进行规范化处理,得到规范数据,包括:
将所述修正数据转换为相同格式的待处理数据,再对所述待处理数据进行数据压缩,得到统一数据;
对所述统一数据进行数据规范化处理,得到规范数据。
4.根据权利要求1所述的方法,其特征在于,所述通过近似传播算法对所述规范数据进行聚类分析,将所述规范数据对应的所述修正数据划分成不同用户类别的用能样本,包括:
利用主成分分析算法对所述规范数据进行特征提取,得到特征样本;
通过近似传播算法对所述特征样本进行聚类分析,将所述特征样本对应的修正数据划分成不同用户类别的用能样本。
5.根据权利要求1所述的方法,其特征在于,所述根据不同用户类别的所述用能样本获得不同用户类别对应的用能统计图,并根据所述用能统计图预测不同用户类别的用能行为,包括:
根据不同用户类别的所述用能样本获得不同用户类别对应的用能统计图集合,其中,所述用能统计图集合包括用电统计图、制冷统计图、用热统计图以及用气统计图;
分别将不同用户类别的用能样本输入至关系耦合模型,得到不同用户类别的用能关系模型;
根据所述用能统计图集合和所述用能关系模型,预测不同用户类别的用能行为。
6.根据权利要求5所述的方法,其特征在于,所述关系耦合模型为预先训练好的长短期记忆神经网络模型。
7.根据权利要求1所述的方法,其特征在于,所述用户类别包括工业用户、农业用户、商业用户以及居民用户。
8.一种用能行为的预测装置,其特征在于,包括:
采集模块,用于采集用户的综合用能数据,其中,所述综合用能数据包括用电数据、制冷数据、用热数据以及用气数据;
修正模块,用于对所述综合用能数据进行异常数据剔除和数据清洗,获得修正数据;
规范化处理模块,用于对所述修正数据进行规范化处理,得到规范数据;
分类模块,用于通过近似传播算法对所述规范数据进行聚类分析,将所述规范数据对应的所述修正数据划分成不同用户类别的用能样本;
预测模块,用于根据不同用户类别的所述用能样本获得不同用户类别对应的用能统计图,并根据所述用能统计图预测出不同用户类别的用能行为。
9.一种计算机设备,其特征在于,包括存储器以及处理器,所述存储器存储有计算机程序,所述计算机程序在所述处理器上运行时执行如权利要求1-7任一项所述的用能行为的预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在处理器上运行时执行如权利要求1-7任一项所述的用能行为的预测方法。
CN202110151184.1A 2021-02-03 2021-02-03 一种用能行为的预测方法、装置及计算机设备 Pending CN112862179A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110151184.1A CN112862179A (zh) 2021-02-03 2021-02-03 一种用能行为的预测方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110151184.1A CN112862179A (zh) 2021-02-03 2021-02-03 一种用能行为的预测方法、装置及计算机设备

Publications (1)

Publication Number Publication Date
CN112862179A true CN112862179A (zh) 2021-05-28

Family

ID=75987848

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110151184.1A Pending CN112862179A (zh) 2021-02-03 2021-02-03 一种用能行为的预测方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN112862179A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704241A (zh) * 2021-10-27 2021-11-26 国网浙江省电力有限公司信息通信分公司 一种低业务依赖的能源数据智能稽核方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009527A (zh) * 2019-04-04 2019-07-12 国家电网有限公司 一种综合能源系统用户画像方法及系统
CN110619389A (zh) * 2019-09-23 2019-12-27 山东大学 一种基于lstm-rnn的冷热电联供系统负荷预测方法及系统
CN110675959A (zh) * 2019-08-19 2020-01-10 平安科技(深圳)有限公司 数据智能分析方法、装置、计算机设备及存储介质
CN110796307A (zh) * 2019-10-29 2020-02-14 北京天易数聚科技有限公司 一种综合能源系统分布式负荷预测方法及系统
CN111191856A (zh) * 2020-02-17 2020-05-22 天津大学 计及时序动态特性和耦合特性的区域综合能源系统多能负荷预测方法
CN112149890A (zh) * 2020-09-16 2020-12-29 国网山东省电力公司经济技术研究院 基于用户用能标签的综合能源负荷预测方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009527A (zh) * 2019-04-04 2019-07-12 国家电网有限公司 一种综合能源系统用户画像方法及系统
CN110675959A (zh) * 2019-08-19 2020-01-10 平安科技(深圳)有限公司 数据智能分析方法、装置、计算机设备及存储介质
CN110619389A (zh) * 2019-09-23 2019-12-27 山东大学 一种基于lstm-rnn的冷热电联供系统负荷预测方法及系统
CN110796307A (zh) * 2019-10-29 2020-02-14 北京天易数聚科技有限公司 一种综合能源系统分布式负荷预测方法及系统
CN111191856A (zh) * 2020-02-17 2020-05-22 天津大学 计及时序动态特性和耦合特性的区域综合能源系统多能负荷预测方法
CN112149890A (zh) * 2020-09-16 2020-12-29 国网山东省电力公司经济技术研究院 基于用户用能标签的综合能源负荷预测方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田浩含;撖奥洋;于立涛;张智晟;: "基于GRA-LSTM神经网络的区域综合能源系统多元负荷短期预测模型", 广东电力 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704241A (zh) * 2021-10-27 2021-11-26 国网浙江省电力有限公司信息通信分公司 一种低业务依赖的能源数据智能稽核方法
CN113704241B (zh) * 2021-10-27 2022-03-08 国网浙江省电力有限公司信息通信分公司 一种低业务依赖的能源数据智能稽核方法

Similar Documents

Publication Publication Date Title
CN107016068A (zh) 知识图谱构建方法及装置
CN105373894A (zh) 基于稽查数据的电力营销业务诊断模型的建立方法及系统
CN114048870A (zh) 一种基于日志特征智能挖掘的电力系统异常监测方法
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN116611546B (zh) 基于知识图谱的目标研究区域滑坡预测方法及系统
CN115905319B (zh) 一种海量用户电费异常的自动识别方法及系统
CN116701965A (zh) 一种基于birch聚类算法的企业用户全景碳画像方法
CN117078048A (zh) 基于数字孪生的智慧城市资源管理方法及系统
CN113094448B (zh) 住宅空置状态的分析方法及分析装置、电子设备
CN112862179A (zh) 一种用能行为的预测方法、装置及计算机设备
CN112733897B (zh) 确定多维样本数据的异常原因的方法和设备
CN116384949B (zh) 一种基于数字化管理的智慧政务信息数据管理系统
Nguyen et al. Detecting correlated columns in relational databases with mixed data types
CN108198115A (zh) 一种用于学生管理的应用管控系统
CN103136440A (zh) 数据处理方法和装置
CN115292274B (zh) 一种数据仓库主题模型构建方法和系统
CN106598492B (zh) 一种应用于海量不完整数据的压缩优化方法
CN116596574A (zh) 电网用户画像构建方法及系统
CN112614005B (zh) 企业复工状态的处理方法和装置
CN115146141A (zh) 基于数据特征的索引推荐方法及装置
CN109241048A (zh) 用于数据统计的数据处理方法、服务器及存储介质
Rodríguez-Gómez et al. A novel clustering based method for characterizing household electricity consumption profiles
CN113298310A (zh) 一种基于自定义配置的bi数据分析系统及方法
CN110807599A (zh) 电化学储能方案的决策方法、装置、服务器和存储介质
CN115563193B (zh) 一种用于数字信息的大数据分析处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220209

Address after: No.844, Longshan Road, Lishi District, Luliang City, Shanxi Province 033000

Applicant after: LVLIANG POWER SUPPLY COMPANY, STATE GRID SHANXI ELECTRIC POWER Co.

Address before: No.844, Longshan Road, Lishi District, Luliang City, Shanxi Province 033000

Applicant before: LVLIANG POWER SUPPLY COMPANY, STATE GRID SHANXI ELECTRIC POWER Co.

Applicant before: Taihao Software Co., Ltd

TA01 Transfer of patent application right