CN113780684A - 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法 - Google Patents

一种基于lstm神经网络的智慧楼宇用户用能行为预测方法 Download PDF

Info

Publication number
CN113780684A
CN113780684A CN202111205156.XA CN202111205156A CN113780684A CN 113780684 A CN113780684 A CN 113780684A CN 202111205156 A CN202111205156 A CN 202111205156A CN 113780684 A CN113780684 A CN 113780684A
Authority
CN
China
Prior art keywords
user
energy
clustering
value
lstm neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111205156.XA
Other languages
English (en)
Inventor
肖荣洋
黄鸿标
涂永昌
蒋国钧
黄雁
张丽镪
江顺源
陈泓霖
丘雪娇
曾蕴华
黄华
李鹏
童荣斌
戴思学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Longyan Power Supply Co of State Grid Fujian Electric Power Co Ltd
Original Assignee
Longyan Power Supply Co of State Grid Fujian Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Longyan Power Supply Co of State Grid Fujian Electric Power Co Ltd filed Critical Longyan Power Supply Co of State Grid Fujian Electric Power Co Ltd
Priority to CN202111205156.XA priority Critical patent/CN113780684A/zh
Publication of CN113780684A publication Critical patent/CN113780684A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,包括以下步骤:采集历史用能数据;收集楼宇中每一用户每日的历史用能数据,获得每一用户的历史日负荷曲线;用能行为分类;采用K‑Means聚类算法对所有用户的历史日负荷曲线进行聚类,通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K,得到K个聚类结果,并分别对每个聚类结果中的数据添加用户用能行为标签;训练预测模型;根据聚类结果,构建K个LSTM神经网络,以各聚类结果中用户的历史日负荷曲线作为训练样本分别对各LSTM神经网络进行训练,得到K个用能行为预测模型;利用训练好的K个用能行为预测模型对未来楼宇中任一用户的用能行为进行预测。

Description

一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法
技术领域
本发明涉及一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,属于用电行为预测技术领域。
背景技术
精确的楼宇负荷预测是实现楼宇电力负荷系统安全经济运行和智能化科学管理的基础,以“互联网+”为核心的智慧楼宇将成为能源服务商开展用户侧服务管理的重要方向之一,因而对用户用能行为的分析和预测是能源供应商适应用户用能需求增长和用能方式多元化趋势的重要途径,同时也为用户制定个性化用能方案提供了必要手段。因此,对用户侧用能行为进行深人分析显得十分迫切。
随着我国能源供给侧结构性改革的不断推进,用户负荷的类型和影响因素日益增多。在电力市场化环境下,用户用能行为、用户对激励政策的响应程度以及城市发展状况等都增加了用电模式的复杂性。然而,现阶段基于人工智能的负荷预测方法多为传统的BP神经网络,难以很好地处理这种复杂环境下输入和输出之间的关系。同时,电力系统信息化水平的提高,通过多种测量系统获取海量配用电信息,给负荷预测准确性的进一步提高带来了机遇,对这些数据的的有效分析成为提高电力负荷预测精度的关键。此外,随着智能监测设备和信息技术的不断发展,大规模、结构复杂以及高度实时性的能耗系统数据将不断涌现,以机器学习算法和大数据运算平台为主的实时数据快速分析决策将会成为最有效的手段。因此,基于多源异构大数据分析的用户用能行为预测分析,可实现综合能源系统用户侧用能信息的有效挖掘利用。随着国家节能减排进程的不断深入,分析用户用能行为规律将成为在满足用户个性化需求的同时实现能源利用率最大化的必要前提。
电力负荷数据具有时序性和非线性的特点,围绕其特点,国内外对短期电力负荷预测模型的研究一般分为两类,一类是时间序列分析方法,如回归分析法、指数平滑模型法、卡尔曼滤波法、多元线性回归法、傅里叶展开法模型和自回归积分滑动平均模型等,基本思想都是从随机时间序列的过去负荷值及现在负荷值来预测未来负荷值,第二类是机器学习分析方法,如反向传播(BP)神经网络预测、灰色投影和随机森林算法、深度信念网络预测、多核支持向量机算法来回归预测等。
时间序列分析法本质上是统计学方法,它的优点在于考虑了数据的时序性关系,对一些随时间线性变化的数据可以有效预测发展规律,但对于非线性关系数据的预测能力有限。BP神经网络本质上是对线性权函数的逼近,指的是利用函数中的一些线性参数的变动来对要识别的模式或者函数进行某种逼近。这种方法在识别输入和输出前后的数据不相关时才有效,但是在识别前后有关联的数据时,如果不把前一个数据作为后一个数据的输入变量的话,本质上该算法无法挖掘到数据产生的模式。其存在的问题在于缺少对时序数据时间相关性的考虑,需要人为添加时间特征来保证预测的结果。
基于挖掘时间序列数据内部模式的需求,出现了循环神经网络(RNN),使得输入之间相互关联。长短期记忆(LSTM)网络是一种有效的非线性循环神经网络,由于兼顾考虑了数据的时序性和非线性关系,被逐渐运用在负荷预测领域。
发明内容
为了解决上述现有技术中存在的问题,本发明提出了一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,采集楼宇每个用户的历史日负荷曲线并进行聚类,得到K类典型的历史日负荷曲线,并通过K类历史日负荷曲线分别对K个LSTM神经网络进行训练,得到K个用能行为预测模型,实现对楼宇特定用户的短期负荷预测。
本发明的技术方案如下:
一方面,本发明提供一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,包括以下步骤:
采集历史用能数据;收集楼宇中每一用户每日的历史用能数据,获得每一用户的历史日负荷曲线;
用能行为分类;采用K-Means聚类算法对所有用户的历史日负荷曲线进行聚类,通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K,得到K个聚类结果,并分别对每个聚类结果中的数据添加用户用能行为标签;
训练预测模型;根据聚类结果,构建K个LSTM神经网络,以各聚类结果中用户的历史日负荷曲线作为训练样本分别对各LSTM神经网络进行训练,得到K个用能行为预测模型;
利用训练好的K个用能行为预测模型对未来楼宇中任一用户的用能行为进行预测。
作为优选实施方式,在收集用户每日的历史用能数据时,对所述历史用能数据进行归一化处理,获得所述日负荷曲线。
作为优选实施方式,所述通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K的步骤具体如下:
随机选取一K值,将n个样本划分为K类;
对于第i个样本,定义其轮廓值为:
Figure BDA0003306598890000041
其中,a是第i个点与同类中其他点之间的平均距离;b为一个向量,其元素是第i个点与不同类的类内各点之间的平均距离;
计算出所有样本点的轮廓系数的均值即为根据当前K值进行聚类的聚类结果的轮廓系数;
计算DBI指数:
Figure BDA0003306598890000042
其中,Ri为根据当前K值进行聚类后,第i个类与其他类的最大相似度:
Figure BDA0003306598890000043
为每个类的最大相似度的均值;
重复选取K值,结合轮廓系数和DBI指数,获取一个使轮廓系数最大,DBI指数最小的K值,确定为所述最佳簇个数K。
作为优选实施方式,所述分别对每个聚类结果中的数据添加用户用能行为标签的步骤具体为:
将K个聚类中心的日负荷曲线作为每个聚类结果的特征曲线;根据特征曲线的波峰大小、波峰频率以及波峰位置,确定特征曲线的用能行为类型;
根据各特征曲线的用能行为类型,为对应聚类结果中所有的历史日负荷曲线添加对应的用户用能行为标签。
作为优选实施方式,所述训练预测模型的步骤具体为:
构建LSTM神经网络;
根据聚类结果,选取有相同用户用能行为标签的历史日负荷曲线作为训练样本集,作为LSTM神经网络训练的输入;
按时间序列重构历史日负荷曲线为行向量,序列前90%用于训练,后10%用于测试;
设置LSTM神经网络的时间序列,指定训练选项,采用上一时刻的观测值来预测下一时刻的预测值;
计算预测值与真实值之间的均方根误差RMSE来判断网络性能,当网络性能满足期望的精度后,输出为对应用户用能行为标签类型的用能行为预测模型;
重复上述步骤,得到K个用能行为预测模型。
另一方面,本发明还提供一种基于LSTM神经网络的智慧楼宇用户用能行为预测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任一实施例所述的预测方法。
再一方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明任一实施例所述的预测方法。
本发明具有如下有益效果:
1、本发明一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,采用K-Means聚类算法对每一用户的历史日负荷曲线对楼宇中各用户的用能行为进行划分,得到K类典型的用户用能行为曲线,并引入轮廓系数和DBI指数来确定最佳簇个数K,获取最佳的聚类效果;采用单向LSTM长短期记忆网络进行深度学习,构建K个用能行为预测模型,实现对楼宇特定用户的短期负荷预测。
2、本发明一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,可以通过用能行为预测模型算法演算出的楼宇用户的用电习惯与用电行为特征,可以根据用量勾画设备健康程度,诊断分析设备老化或故障引起的能源浪费,分析能源使用行为导致的能源浪费的关键因素。
附图说明
图1为本发明实施例一的流程图;
图2为本发明实施例中通过K-Means聚类算法进行聚类的动态聚类过程示例图;
图3为本发明实施例所涉及的标准RNN神经网络的拓扑结构展开图;
图4为本发明实施例所使用的LSTM神经网络的拓扑结构图;
图5为本发明实施例中创建并训练LSTM神经网络的流程图;
图6为本发明实施例中构建K类用能行为预测模型的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
实施例一:
参见图1,本发明提供一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,包括以下步骤:
采集历史用能数据;收集颗粒度为15分钟级的楼宇每户每日历史用能数据,即每日每一户需要采集96个能耗数据,获得每一用户的历史日负荷曲线;
用能行为分类;采用K-Means聚类算法对所有用户的历史日负荷曲线进行聚类,通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K,得到K个聚类结果,并分别对每个聚类结果中的数据添加用户用能行为标签,将楼宇用户划分成K类典型的用能行为规律类型;通过聚类可以得到两个重要信息:一是得到用户典型的负荷分布,二是可以成为按负荷特性对用户分类的重要数据。该方法对于负荷预测、负荷控制、用电异常检测等不同方面都有重要的理论和实际意义。用户的日负荷曲线是负荷分析的数据来源,是用户用能消费行为的直观体现。如果用户具有相似的用能模式,则他们也具有相似的负荷分布形状。为了方便企业的管理和制定有针对性的运营策略,可以根据用户负荷分布的相似性来对用户加以归类。而聚类分析在负荷分析中占主导有主导地位,是负荷分析的基础。
参见图,2,K-Means聚类算法具体如下:
第一:随机选取K个样品作为初始聚类中心。
第二:对除聚类中心之外的所有样本逐个归类,根据剩余的每个样本与每个聚类中心的距离,将他们归类到最接近的数据簇中,再重新计算各数据簇的聚类中心作为新的聚类中心。
第三:不断重复步骤二,直至准则函数收敛。一般情况下,采用平方误差准则,数学表达式如下:
Figure BDA0003306598890000081
上式中,E是数据库中所有对象的平方误差总和,p是空间中的点,mi是簇Ci的平均值。该式中的距离度量是欧几里得距离。运用这个误差函数,可以尽可能的让生成的簇紧凑独立。
K-Means聚类算法计算简单,并且可以用于各种数据类型,但需要提前确定数据簇的个数来作为输入参量,该参数的设置往往涉及到聚类效果。然而,对于不同的楼宇,用户间的个体差异化很大,因此针对不同的楼宇,用户用能行为聚类簇参数K不容易确定。K值的选定过程中,往往需要经过多次实验才能找到最佳聚类个数,为了确定最佳聚类效果,引入轮廓系数(silhouette coefficient)和DBI有效性指标进行评估,选取出最佳簇个数K。
训练预测模型;根据聚类结果,基于matlab平台构建K个LSTM神经网络,在聚类结果的基础之上,将用户的历史日负荷曲线按不同的用能类型分组并作为对应LSTM网络的输入,训练网络,得到K个用能行为预测模型;
LSTM神经网络是一种特殊的循环神经网络,循环神经网络是一种用于处理序列数据的神经网络,时间序列模型最常用最强大的的工具就是循环神经网络(RecurrentNeural network,RNN)。相比于普通神经网络的各计算结果之间相互独立的特点,RNN的每一次隐含层的计算结果都与当前输入以及上一次的隐含层结果相关,其很适合于处理序列变化的数据。通过这种方法,RNN的计算结果便具备了记忆之前几次结果的特点。在标准的RNN中,这个重复的模块只有一个非常简单的结构,例如单个tanh层。标准的RNN网络如图3所示,循环结构可以使得信息可以从当前步传递到下一步。不过RNN存在梯度消失的问题,即如果相关的信息和预测的位置之间的间隔比较小时,RNN可以学会使用先前的信息。但是当这个间隔不断增大时,RNN会丧失学习到连接如此远的信息的能力。LSTM神经网络的出现解决了长依赖问题。
LSTM网络结构如图4所示,其重复的单元模块不同于标准RNN网络里的单元只有一个网络层,它的内部有四个网络层,以一种非常特殊的方式进行交互。LSTM的特点就是在RNN结构之外添加了各层的阀门节点。阀门有3类:遗忘阀门(forget gate),输入阀门(input gate)和输出阀门(output gate)。这些阀门可以打开或关闭,用于判断模型网络的记忆态(之前网络的状态)在该层输出的结果是否达到阈值从而加入到当前该层的计算中。如图2所示,阀门节点利用sigmoid函数将网络的记忆态作为输入计算;如果输出结果达到阈值则将该阀门输出与当前层的的计算结果相乘作为下一层的输入;如果没有达到阈值则将该输出结果遗忘掉。每一层包括阀门节点的权重都会在每一次模型反向传播训练过程中更新。更具体的LSTM的判断计算过程如下:
LSTM的关键就是细胞状态。LSTM有通过精心设计的称作为“门”的结构来去除或者增加信息到细胞状态的能力。门是一种让信息选择式通过的方法。他们包含一个sigmoid神经网络层和一个pointwise乘法操作。Sigmoid层输出0到1之间的数值,描述每个部分有多少量可以通过。0代表“不许任何量通过”,1表示“允许任意量通过”。LSTM拥有三个门,来保护和控制细胞状态。
LSTM神经网络的基本步骤如下:
(1)决定丢弃信息
LSTM网络中的第一步是决定从细胞状态中丢弃什么信息。这个决定通过一个称为“遗忘门”完成。该门会读取ht-1和xt,输出一个在0到1之间的数值给每个在细胞状态Ct-1中的数字。1表示“完全保留”,0表示“完全舍弃”。
ft=σ(Wf×[ht-1,xt]+bf);
(2)确定更新的信息
下一步是确定什么样的新信息被保存在细胞状态中。这里包含两个部分。第一,sigmoid层称“输入门”决定什么值我们将要更新。然后,一个tanh层创建一个新的候选值向量
Figure BDA0003306598890000114
加入到状态中。
it=σ(Wi×[ht-1,xt]+bi);
Figure BDA0003306598890000111
(3)更新细胞状态
更新旧细胞状态,Ct-1更新为Ct,根据前面步骤计算的信息来产生对状态的更新。将旧状态与ft相乘,丢弃掉我们确定需要丢弃的信息,接着加上
Figure BDA0003306598890000112
就是新的候选值。
Figure BDA0003306598890000113
(4)输出信息
首先运行一个sigmoid层来确定细胞状态的哪个部分将输出。接着,细胞状态通过tanh进行处理(得到一个在-1到1之间的值)并将它和sigmoid门的输出相乘,最终,网络将基于细胞状态只输出我们确定输出的那部分信息。
ot=σ(Wo×[ht-1,xt]+bo);
ht=ot×tanh(Ct);
综上所述,LSTM神经网络是一种改进的循环神经网络(RNN)。它解决了RNN在模型训练中“梯度消失”的问题,可以学习到时间序列长短期依赖信息,是目前最成功的RNN架构。
利用训练好的K个用能行为预测模型对未来楼宇中任一用户的用能行为进行预测。
本实施例基于每一用户的历史日符合曲线对楼宇中各用户的用能行为进行聚类分析,并引入轮廓系数和DBI指数来确定最佳簇个数K,获取最佳的聚类效果;构建了基于用能行为划分的时间序列预测模型,实现对楼宇特定用户的短期负荷预测。
作为本实施例的优选实施方式,在收集用户每日的历史用能数据时,对所述历史用能数据进行归一化处理,将需要处理的历史用能数据经过处理后,限制在一定的范围内,将有量纲的表达式转换为无量纲的表达式,获得所述日负荷曲线。
作为本实施例的优选实施方式,所述通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K的步骤具体如下:
轮廓系数方法结合了凝聚度和分离度,可以以此来判断聚类的优良性,其值在-1到1之间取值,值越大表示聚类效果越好。依据这个原理,可以尝试用多个簇参量,在每个簇个数条件下重复计算轮廓系数,选择使轮廓系数取较大值时所对应的K值;
对于一个聚类任务,我们希望得到的簇中,簇内尽量紧密,簇间尽量远离,轮廓系数便是类的密集与分散程度的评价指标,第i个样本的轮廓值定义为:
Figure BDA0003306598890000131
其中,a是第i个点与同类中其他点之间的平均距离;b为一个向量,其元素是第i个点与不同类的类内各点之间的平均距离;轮廓值S(i)的取值范围为[-1,1],S(i)的值越大,说明第i个样本的分类越合理,当S(i)<0时,说明第i个样本的分类不合理,还有比目前分类更合理的分类;计算出所有样本点的轮廓系数的均值即为根据当前K值进行聚类的聚类结果的轮廓系数;
为了辅助理解,本实施例提供一个计算轮廓系数的例子;以下样本数据并不代表本发明实际数据,仅以此为例来补充说明轮廓系数的计算方法。
为了简化计算,取样本容量为5个,按K=2计算,以下为各样本点的坐标。
样本1(4,35);
样本2(8,36);
样本3(20,24);
样本4(25,26);
样本5(30,25);
通过K-Means聚类结果可知,样本1和样本2为一类(A类),样本3、4、5为一类(B类)。A类的聚类中心为(6,35.5),B类的聚类中心为(25,25)。
由轮廓系数的公式可得样本1的轮廓系数计算如下:
Figure BDA0003306598890000141
Figure BDA0003306598890000142
Figure BDA0003306598890000143
Figure BDA0003306598890000144
Figure BDA0003306598890000145
Figure BDA0003306598890000146
样本3的轮廓系数计算如下:
Figure BDA0003306598890000147
Figure BDA0003306598890000148
Figure BDA0003306598890000149
Figure BDA00033065988900001410
Figure BDA00033065988900001411
Figure BDA00033065988900001412
Figure BDA00033065988900001413
依次类推可得:
S(2)=0.8;
S(4)=0.76;
S(5)=0.71;
所有样本的轮廓系数S(i)的均值称为聚类结果的轮廓系数,因此当K=2时聚类结果的轮廓系数为
Figure BDA0003306598890000151
DBI指标由大卫L·戴维斯和唐纳德·Bouldin提出,是一种评估度量的聚类算法。
DBI算法定义了一个分散度的值Si:表示第i个类中,度量数据点的分散程度,
Figure BDA0003306598890000152
Xj表示第i类中第j个数据点;Ai表示第i类的中心;Ti表示第i类中数据点的个数;q取1表示:各点到中心的距离的均值,q取2时表示:各点到中心距离的标准差,它们都可以用来衡量分散程度。
DBI定义了一个距离值Mij:表示第i类与第j类的距离,计算公式为:
Figure BDA0003306598890000153
aki表示第i类的中心点的第K个属性的值,Mij则就是第i类与第j类中心的距离。
DBI定义了一个相似度的值Rij,计算公式为:
Figure BDA0003306598890000154
衡量第i类与第j类的相似度。通过以上公式的计算,我们再从Rij中选出最大值Ri=max(Rij),即第i类与其他类的相似度中最大的相似度的值。最后计算每个类的这些最大相似度的均值,便得到了DBI指数:
Figure BDA0003306598890000161
其中,Ri为根据当前K值进行聚类后,第i个类与其他类的最大相似度:
Figure BDA0003306598890000162
为每个类的最大相似度的均值;DBI指标就是计算类内距离之和与类外距离之比,来优化K值的选择,避免K-Means聚类算法中由于只计算准则函数而导致局部最优的情况,综上可知DBI指标越小聚类效果越佳;
重复选取K值,结合轮廓系数和DBI指数,获取一个使轮廓系数最大,DBI指数最小的K值,确定为所述最佳簇个数K。
作为本实施例的优选实施方式,所述分别对每个聚类结果中的数据添加用户用能行为标签的步骤具体为:
K个聚类中心的曲线,即为每类历史日负荷曲线中的特征曲线,通过分析特征曲线的波峰大小、波峰频率以及波峰位置,确定特征曲线的用能行为类型;
根据各特征曲线的用能行为类型,为对应聚类结果中所有的历史日负荷曲线添加对应的用户用能行为标签。
参见图5和图6,作为本实施例的优选实施方式,对楼宇中某一用户的用能行为进行预测,通常为短期负荷预测,需要在当天预测未来某一天的日用能规律曲线,预测频率为每15min一个负荷预测值,即预测某一天的96个负荷节点,所述训练预测模型的步骤具体为:
基于MATLAB仿真平台构建LSTM神经网络;
根据聚类结果,选取有相同用户用能行为标签的历史日负荷曲线作为训练样本集,作为LSTM神经网络训练的输入;
按时间序列重构历史日负荷曲线为行向量,序列前90%用于训练,后10%用于测试;
设置LSTM神经网络的时间序列,一般为交替一个时间步,指定训练选项,采用上一时刻的观测值来预测下一时刻的预测值;
计算预测值与真实值之间的均方根误差RMSE来判断网络性能,当网络性能满足期望的精度后,输出为对应用户用能行为标签类型的用能行为预测模型;
重复上述步骤,得到K个用能行为预测模型。
本实施例通过用户用能行为预测模型算法演算出的楼宇用户的用电习惯与用电行为特征,可以根据用量勾画设备健康程度,诊断分析设备老化或故障引起的能源浪费,分析能源使用行为导致的能源浪费的关键因素。有利于对未来的负荷运行时间进行优化调度,减少用户的总消耗电量,或据用电行为特征预测低碳排放优先的用电场景模型,为楼宇管理者提供参考。最终利用大数据推演一套具备最优经济效益的能耗配置方案,致力于让耗能设备趋近效率极限,以专业视角规范楼宇电器设备的使用,实现效率最高、成本最低的目标,提高能源利用率,达到低碳节能的效果。
楼宇系统用户侧数据由于采集到的颗粒度、用户群体数以及多样化的个性需求,都使得用户用能数据体量巨大,并且用户数据类型的异构特性也会引起数据量的成倍增长。高复合膨胀增长的能源数据蕴含着巨大的信息价值,从能源大数据中提取价值信息,为用户提供可选择的用能策略,是各大综合能源服务商和管理机构进行市场竞争的重要手段。用户侧用能数据的信息挖掘与提取将在能源市场化进程中发挥极其重要的作用。
实施例二:
本实施例提供一种基于LSTM神经网络的智慧楼宇用户用能行为预测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任一实施例所述的预测方法。
实施例三:
本实施例提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本发明任一实施例所述的预测方法。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (7)

1.一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,其特征在于,包括以下步骤:
采集历史用能数据;收集楼宇中每一用户每日的历史用能数据,获得每一用户的历史日负荷曲线;
用能行为分类;采用K-Means聚类算法对所有用户的历史日负荷曲线进行聚类,通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K,得到K个聚类结果,并分别对每个聚类结果中的数据添加用户用能行为标签;
训练预测模型;根据聚类结果,构建K个LSTM神经网络,以各聚类结果中用户的历史日负荷曲线作为训练样本分别对各LSTM神经网络进行训练,得到K个用能行为预测模型;
利用训练好的K个用能行为预测模型对未来楼宇中任一用户的用能行为进行预测。
2.根据权利要求1所述的一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,其特征在于:在收集用户每日的历史用能数据时,对所述历史用能数据进行归一化处理,获得所述日负荷曲线。
3.根据权利要求1所述的一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,其特征在于,所述通过计算轮廓系数和DBI指数确定聚类的最佳簇个数K的步骤具体如下:
随机选取一K值,将n个样本划分为K类;
对于第i个样本,定义其轮廓值为:
Figure FDA0003306598880000021
其中,a是第i个点与同类中其他点之间的平均距离;b为一个向量,其元素是第i个点与不同类的类内各点之间的平均距离;
计算出所有样本点的轮廓系数的均值即为根据当前K值进行聚类的聚类结果的轮廓系数;
计算DBI指数:
Figure FDA0003306598880000022
其中,Ri为根据当前K值进行聚类后,第i个类与其他类的最大相似度:
Figure FDA0003306598880000023
为每个类的最大相似度的均值;
重复选取K值,结合轮廓系数和DBI指数,获取一个使轮廓系数最大,DBI指数最小的K值,确定为所述最佳簇个数K。
4.根据权利要求1所述的一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,其特征在于,所述分别对每个聚类结果中的数据添加用户用能行为标签的步骤具体为:
将K个聚类中心的日负荷曲线作为每个聚类结果的特征曲线;根据特征曲线的波峰大小、波峰频率以及波峰位置,确定特征曲线的用能行为类型;
根据各特征曲线的用能行为类型,为对应聚类结果中所有的历史日负荷曲线添加对应的用户用能行为标签。
5.根据权利要求1所述的一种基于LSTM神经网络的智慧楼宇用户用能行为预测方法,其特征在于,所述训练预测模型的步骤具体为:
构建LSTM神经网络;
根据聚类结果,选取有相同用户用能行为标签的历史日负荷曲线作为训练样本集,作为LSTM神经网络训练的输入;
按时间序列重构历史日负荷曲线为行向量,序列前90%用于训练,后10%用于测试;
设置LSTM神经网络的时间序列,指定训练选项,采用上一时刻的观测值来预测下一时刻的预测值;
计算预测值与真实值之间的均方根误差RMSE来判断网络性能,当网络性能满足期望的精度后,输出为对应用户用能行为标签类型的用能行为预测模型;
重复上述步骤,得到K个用能行为预测模型。
6.一种基于LSTM神经网络的智慧楼宇用户用能行为预测设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的预测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5任一项所述的预测方法。
CN202111205156.XA 2021-10-15 2021-10-15 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法 Pending CN113780684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111205156.XA CN113780684A (zh) 2021-10-15 2021-10-15 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111205156.XA CN113780684A (zh) 2021-10-15 2021-10-15 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法

Publications (1)

Publication Number Publication Date
CN113780684A true CN113780684A (zh) 2021-12-10

Family

ID=78873200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111205156.XA Pending CN113780684A (zh) 2021-10-15 2021-10-15 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法

Country Status (1)

Country Link
CN (1) CN113780684A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114237057A (zh) * 2021-12-20 2022-03-25 东南大学 智慧楼宇用电分析的动态建模方法、系统、设备和介质
CN114386688A (zh) * 2022-01-07 2022-04-22 深圳市聚商鼎力网络技术有限公司 一种基于多数据融合的用户意图预测方法及系统
CN115600764A (zh) * 2022-11-17 2023-01-13 中船重工(武汉)凌久高科有限公司(Cn) 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法
CN116129560A (zh) * 2022-12-07 2023-05-16 中电信数智科技有限公司 一种基于人工智能的智慧楼宇管理系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114237057A (zh) * 2021-12-20 2022-03-25 东南大学 智慧楼宇用电分析的动态建模方法、系统、设备和介质
CN114237057B (zh) * 2021-12-20 2023-09-19 东南大学 智慧楼宇用电分析的动态建模方法、系统、设备和介质
CN114386688A (zh) * 2022-01-07 2022-04-22 深圳市聚商鼎力网络技术有限公司 一种基于多数据融合的用户意图预测方法及系统
CN114386688B (zh) * 2022-01-07 2022-12-06 逑美科技(上海)有限公司 一种基于多数据融合的用户意图预测方法及系统
CN115600764A (zh) * 2022-11-17 2023-01-13 中船重工(武汉)凌久高科有限公司(Cn) 基于权重邻域粗糙集快速约简的滚动时域能耗预测方法
CN116129560A (zh) * 2022-12-07 2023-05-16 中电信数智科技有限公司 一种基于人工智能的智慧楼宇管理系统

Similar Documents

Publication Publication Date Title
Wang et al. Application of a novel early warning system based on fuzzy time series in urban air quality forecasting in China
Nie et al. A novel hybrid model based on combined preprocessing method and advanced optimization algorithm for power load forecasting
CN113780684A (zh) 一种基于lstm神经网络的智慧楼宇用户用能行为预测方法
Jain et al. Data mining techniques: a survey paper
CN112990556A (zh) 一种基于Prophet-LSTM模型的用户用电能耗预测方法
Wang et al. A compound framework for wind speed forecasting based on comprehensive feature selection, quantile regression incorporated into convolutional simplified long short-term memory network and residual error correction
CN112350876A (zh) 一种基于图神经网络的网络流量预测方法
CN109461025B (zh) 一种基于机器学习的电能替代潜在客户预测方法
CN104809658B (zh) 一种低压配网台区线损的快速分析方法
CN104050242A (zh) 基于最大信息系数的特征选择、分类方法及其装置
CN114580706A (zh) 基于gru-lstm神经网络的电力金融业务风控方法及系统
CN113554466B (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN110555989A (zh) 一种基于Xgboost算法的交通量预测方法
Li et al. A novel combined prediction model for monthly mean precipitation with error correction strategy
Tian et al. A network traffic prediction method based on IFS algorithm optimised LSSVM
CN112149873A (zh) 一种基于深度学习的低压台区线损合理区间预测方法
CN111242161A (zh) 一种基于智能学习的非侵入式非居民用户负荷辨识方法
CN109242136A (zh) 一种微电网风电功率混沌遗传-bp神经网络预测方法
Xu et al. Graph-based time series edge anomaly detection in smart grid
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN116843083A (zh) 基于混合神经网络模型的碳排放预测系统及方法
Poczeta et al. Application of fuzzy cognitive maps to multi-step ahead prediction of electricity consumption
Wang et al. Cloud computing and extreme learning machine for a distributed energy consumption forecasting in equipment-manufacturing enterprises
CN116578858A (zh) 基于图神经网络的空压机故障预测与健康度评价方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination