CN115730744A - 基于用户模式与深度学习联合模型的用水量预测方法及系统 - Google Patents

基于用户模式与深度学习联合模型的用水量预测方法及系统 Download PDF

Info

Publication number
CN115730744A
CN115730744A CN202211565217.8A CN202211565217A CN115730744A CN 115730744 A CN115730744 A CN 115730744A CN 202211565217 A CN202211565217 A CN 202211565217A CN 115730744 A CN115730744 A CN 115730744A
Authority
CN
China
Prior art keywords
water consumption
term
prediction
gate
water
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211565217.8A
Other languages
English (en)
Inventor
许乐
郑恒
黄庆
胡维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongnan Water Technology Co ltd
Original Assignee
Zhongnan Water Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongnan Water Technology Co ltd filed Critical Zhongnan Water Technology Co ltd
Priority to CN202211565217.8A priority Critical patent/CN115730744A/zh
Publication of CN115730744A publication Critical patent/CN115730744A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于用户模式与深度学习联合模型的用水量预测方法及系统,通过利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。本发明使得在处理季节性分量时更加灵活,对异常值鲁棒性更高;通过普适性序列与个体序列的信息融合,充分挖掘数据信息,修正个体差异;通过分解加预测的组合模型,充分提取模型中的周期性等先验知识,能够更准确的掌握数据变化趋势,提高预测精度。

Description

基于用户模式与深度学习联合模型的用水量预测方法及系统
技术领域
本发明涉及城市供水管网技术领域,尤其公开了一种基于用户模式与深度学习联合模型的用水量预测方法及系统。
背景技术
随着社会的发展及人们生活水平的提高,用水量日益增长,水资源短缺问题日益突出。科学、准确的预测用水量,对于开展合理的供水规划具有重要的意义。
用水量数据本质上是一个时间序列,因此对用水量的预测方法通常采样时间序列分析预测方法,即挖掘历史时间序列数据特点,推断未来发展趋势。从实现预测的方法角度而言,目前主要分为基于统计的预测方法:如基础的简单平均法、移动平均法等,到目前常用的AR(Auto-regressive,自回归)、MA(MovingAverage,模型移动平均)、ARMA(Auto-regressive Moving Average,模型自回归移动平均)、ARIMA(Auto-regressiveIntegrated Moving Average Model,自回归移动平均模型),包括Facebook推出的Prophet等;另一类为机器学习算法:利用随机森林、支持向量机等的回归模型进行预测,或基于神经网络和深度学习,如BP(back propagation,反向传播算法)神经网络、卷积神经网络、长短期神经网络等。
目前研究者们常借鉴时间序列方面的研究方法用于用水量预测。张君雅、Yasar、Mombeni等主要运用基于统计的时间序列预测方法如回归分析、ARIMA、SARIMA(SeasonalAutoregressive Integrated Moving Average,季节性差分自回归滑动平均模型)等,专利CN113947240A中,运用了基于最小二乘的预测方法。专利CN109146196A中,运用了蜻蜓-高斯过程耦合算法。李彦彬《基于改进GM-LSSVR模型的郑州市用水量预测》、王梓涵《基于TCK-LSTM-ATT模型的城市用水量预测》、朱兴统《基于改进粒子群优化BP网络的城市用水量预测》、郭强《基于贝叶斯BP神经网络的区间需水预测方法》、专利CN112488392A、以及专利CN114757330A等中公开了基于机器学习、深度学习方面的方法,例如LSTM(Long Short-Term Memory,长短期记忆网络)、BP(back propagation,反向传播)神经网络、TCN(Temporal Convolutional Network,时域卷积网络)等,对预测模型进行改进,侧重于参数优化和计算速度提升等方面。在专利CN112036668A中,考虑了周期性分解的方法加入对周期性数据的考量。
然而,现有的技术方法中,较多关注于某一种预测模型方法上的性能优化,解决如算法收敛速度、预测的实时调度问题等,而往往忽略用户类别这一先验知识,未充分挖掘不同用户的用水特点,从而影响预测模型的性能。与此同时,不少预测方法将温度、湿度、风向、降水量等数据作为特征输入模型,增加了模型复杂度;某天的温度、湿度、风向等存在变化且只能在当天获取或预测,影响了预测效率。
因此,针对现有用水量预测方法中,对用水量数据的用户用水模式考虑相对较少,是目前亟待解决的技术问题。
发明内容
本发明提供了一种基于用户模式与深度学习联合模型的用水量预测方法及系统,旨在解决现有用水量预测方法中,对用水量数据的用户用水模式考虑相对较少的技术问题。
本发明的一方面涉及一种基于用户模式与深度学习联合模型的用水量预测方法,包括以下步骤:
利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;
利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。
进一步地,利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项的步骤包括:
利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;
进一步地,对于已经处理好的用水量时间序列xt,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。
对于已经处理好的用水量时间序列,分解的三个部分为:
xt=Tt+St+Nt
其中,xt为已经处理好的用水量时间序列,Tt为用水量序列的趋势部分,表示用水量的朝着某一方向变化的趋势;St为周期性部分,主要表示用水量的周期性特征;Nt为噪声项,为用水量时间序列的随机部分。
进一步地,利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项,最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测的步骤包括:
提取用户用水模式并融合周期性序列;
运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。
进一步地,长短期记忆人工神经网络的选择性记忆功能通过遗忘门、输入门和输出门三个门结构实现,
遗忘门的门结构为:
ft=σ(Wf·[ht-1,x’t]+bf)
其中,ft为遗忘门计算结果,σ为sigmoid函数,ht-1为上一个LSTM单元输出的用水量值,x’t为当前时刻用水信息输入向量,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置项;
输入门的门结构为:
it=σ(Wi·[ht-1,x’t]+bi)
Figure BDA0003986341500000031
其中,it为更新信息,
Figure BDA0003986341500000032
为更新的细胞状态计算结果;Wi、Wc分别为输入门的相应权矩阵;bi、bc分别为输入门的相应偏置项;细胞状态的更新公式为:
Figure BDA0003986341500000041
输出门的门结构为:
ot=σ(Wo·[ht-1,x’t]+bo)
ht=ot*tanh(Ct)
其中,ot表示细胞状态的输出部分,σ为sigmoid函数,ht-1为上一个长短期记忆人工神经网络单元输出的用水量值,Wo为输出门的相应权矩阵,bo为输出门的偏置项;ht为长短期记忆人工神经网络单元输出的用水量值。
本发明的另一方面涉及一种基于用户模式与深度学习联合模型的用水量预测系统,包括:
提取模块,用于利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;
预测模块,用于利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。
进一步地,提取模块包括:
预处理单元,利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;
分解单元,用于对于已经处理好的用水量时间序列xt,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。
进一步地,分解单元中,对于已经处理好的用水量时间序列,分解的三个部分为:
xt=Tt+St+Nt
其中,xt为已经处理好的用水量时间序列,Tt为用水量序列的趋势部分,表示用水量的朝着某一方向变化的趋势;St为周期性部分,主要表示用水量的周期性特征;Nt为噪声项,为用水量时间序列的随机部分。
进一步地,预测模块包括:
提取单元,用于提取用户用水模式并融合周期性序列;
预测单元,用于运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。
进一步地,预测单元中,长短期记忆人工神经网络的选择性记忆功能通过遗忘门、输入门和输出门三个门结构实现,
遗忘门的门结构为:
ft=σ(Wf·[ht-1,x’t]+bf)
其中,ft为遗忘门计算结果,σ为sigmoid函数,ht-1为上一个LSTM单元输出的用水量值,x’t为当前时刻用水信息输入向量,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置项;
输入门的门结构为:
it=σ(Wi·[ht-1,x’t]+bi)
Figure BDA0003986341500000051
其中,it为更新信息,
Figure BDA0003986341500000052
为更新的细胞状态计算结果;Wi、Wc分别为输入门的相应权矩阵;bi、bc分别为输入门的相应偏置项;细胞状态的更新公式为:
Figure BDA0003986341500000053
输出门的门结构为:
ot=σ(Wo·[ht-1,x’t]+bo)
ht=ot*tanh(Ct)
其中,ot表示细胞状态的输出部分,σ为sigmoid函数,ht-1为上一个长短期记忆人工神经网络单元输出的用水量值,Wo为输出门的相应权矩阵,bo为输出门的偏置项;ht为长短期记忆人工神经网络单元输出的用水量值。
本发明所取得的有益效果为:
本发明提供一种基于用户模式与深度学习联合模型的用水量预测方法及系统,通过利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。本发明提供的基于用户模式与深度学习联合模型的用水量预测方法及系统,对于基于时间序列分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM(Long Short-Term Memory,长短期记忆人工神经网络)算法相对于BP(back propagation,反向传播算法)、CNN(Convolutional NeuralNetworks,卷积神经网络)网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN(Recurrent Neural Network,Recurrent Neural Network)网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
附图说明
图1为本发明提供的基于用户模式与深度学习联合模型的用水量预测方法一实施例的流程示意图;
图2为图1中所示的利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项的步骤一实施例的细化流程示意图;
图3为图1中所示的利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的所述周期项进行融合,成为修正后的用水模式项,最终将提取的所述趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测的步骤一实施例的细化流程示意图;
图4为本发明提供的基于用户模式与深度学习联合模型的用水量预测方法一实施例的细化流程示意图;
图5为本发明提供的基于用户模式与深度学习联合模型的用水量预测系统一实施例的功能框图;
图6为图5中所示的提取模块一实施例的功能模图示意图;
图7为图5中所示的预测模块一实施例的功能模图示意图。
附图标号说明:
10、提取模块;20、预测模块;11、预处理单元;12、分解单元;21、提取单元;22、预测单元。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
如图1和图2所示,本发明第一实施例提出一种基于用户模式与深度学习联合模型的用水量预测方法,包括以下步骤:
步骤S100、利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项。
利用时间序列分解方法将用水量时间序列进行分解,提取分解后的用水量时间序列的趋势项及周期项。
步骤S200、利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。
利用聚类、统计规律等方法对用户进行分类,并获得分类后用水用户相应的用水模式;并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最后将提取的趋势项、噪声项及修正后的用水模式项作为特征输入基于LSTM(Long Short-TermMemory,长短期记忆人工神经网络)的深度学习和训练模型中,预测用水量结果。
本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,通过利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,对于分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM算法相对于BP、CNN网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
进一步地,请见图2,图2为图1中所示步骤S100一实施例的细化流程示意图,在本实施例中,步骤S100包括:
步骤S110、利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正。
从系统所获取的用水量时间序列中,因监测仪器、通信传输等原因,会出现部分单个或多个点的噪声或异常值,这些明显偏离常规模式的数据将对数据集的训练带来影响,因此应首先予以修正。在本实施例中,利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正。为保持时间序列的连续性,异常点及缺失值可由训练集平均值
Figure BDA0003986341500000081
代替。
步骤S120、对于已经处理好的用水量时间序列xt,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。
对于已经处理好的用水量时间序列xt,可利用时间序列分解算法将其分解为三个部分:
xt=Tt+St+Nt (1)
在公式(1)中,xt为已经处理好的用水量时间序列,Tt为用水量序列的趋势部分,表示用水量的朝着某一方向变化的趋势;St为周期性部分,主要表示用水量的周期性特征;Nt为噪声项,为用水量时间序列的随机部分。在本实施例中,根据用水特点的先验知识,设周期为24小时,具体周期内样本数可根据所获取时间序列的采样周期确定,以保证分解模型的灵活性,如采样周期为15分钟,则周期设为96。
本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;对于已经处理好的用水量时间序列xt,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,对于分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM算法相对于BP、CNN网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
优选地,参见图3,图3为图1中所示步骤S200一实施例的细化流程示意图,在本实施例中,步骤S200包括:
步骤S210、提取用户用水模式并融合周期性序列。
根据城市用水特点,将用户分成居民小区、中小学校、写字楼公司、商场等所需预测类别;按类别获取其样本并通过统计规律、机器学习中聚类算法等,获取相应类别用水模式特性曲线;可根据实际情况,将工作日与假日(包括普通周末和假期)分开,配合所需预测的用水量时间序列采样周期进行重新计算,最终将用对应时间段的用水模式分量Mt与周期性分量St融合,成为修正后的用水模式项S′t
步骤S220、运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。
在本实施例中,运用LSTM(Long Short-Term Memory,长短期记忆人工神经网络),经过时间序列分解后进行预测。
LSTM模型具备选择性记忆的优势,解决了循环神经网络(Recurrent NeuralNetwork,以下简称RNN)的梯度爆炸或梯度消失问题。其选择性记忆功能的实现主要通过三个门结构实现:即遗忘门、输入门和输出门。
遗忘门(forget gate):
ft=σ(Wf·[ht-1,x’t]+bf) (2)
LSTM网络可通过遗忘门决定细胞状态中用水量样本中哪些信息需要保留。在公式(2)中,σ为sigmoid函数,ht-1为上一个LSTM单元输出的用水量值,x’t为当前时刻用水信息输入向量,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置项。
输入门(input gate):
it=σ(Wi·[ht-1,x’t]+bi) (3)
Figure BDA0003986341500000101
在公式(3)和(4)中,it为更新信息,
Figure BDA0003986341500000102
为更新的神经细胞状态计算结果;Wi
神经元的更新公式如下:
Figure BDA0003986341500000103
输出门(output gate):
ot=σ(Wo·[ht-1,x’t]+bo) (6)
ht=ottanh(Ct) (7)
在公式(5)~(7)中,ot表示细胞状态的输出部分,σ为sigmoid函数,ht-1为上一个长短期记忆人工神经网络单元输出的用水量值,Wo为输出门的相应权矩阵,bo为输出门的偏置项;ht为长短期记忆人工神经网络单元输出的用水量值。
如图1至图4所示,本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,具体实施例为:
1、确定输入变量
将时间序列分解并与用户模式融合后后得到的趋势Tt、用水模式分量S’t和噪音Nt三个部分作为一个输入样本的三个特征,即
Xt=[Tt,S’t,Nt] (8)
在公式(8)中,Xt为模型输入向量,Tt为时间序列分解后得到的趋势,S’t为时间序列分解后得到的用水模式分量,Nt为时间序列分解后得到的噪声。
2、归一化
为避免三个特征的量纲为模型预测带来误差,统一样本的统计分布性,通过归一化函数将不同的特征均缩放到[0,1]范围内。
3、确定时间窗口进行样本划分,形成训练数据集
确定观测值序列长度Train_length以及预测步长Predict_length,即用前序一定长度的用水量数据,预测后续一定长度的用水量数据,并根据相应长度划分训练模型输入输出的长度,并形成训练数据和标签,其中:
一个样本数据集表示为:
X’t=[Xt-Train_length+1…,Xt-1,Xt] (9)
在公式(9)中,X’t表示样本向量,Train_length为观测值序列长度。
其对应标签为未分解前的时间点用水量数据:
Yt=[xt+1,xt+2…,xt+Predict_length] (10)
在公式(10)中,Yt表示未分解前的时间点用水量数据,Predict_length为预测步长。
4、模型训练
在LSTM模型中,确定隐藏层层数及其神经元数、训练次数,可选用均方误差函数作为损失函数,以Adam(Adaptive momentum,自适应动量的随机优化方法)算法作为优化器,提高计算效率,减少内存需求。
本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,通过提取用户用水模式并融合周期性序列;运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,对于分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM算法相对于BP、CNN网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
请见图5,图5为本发明提供的基于用户模式与深度学习联合模型的用水量预测系统一实施例的功能框图,在本实施例中,该基于用户模式与深度学习联合模型的用水量预测系统包括提取模块10和预测模块20,其中,提取模块10,用于利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;预测模块20,用于利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。
提取模块10利用时间序列分解算法)分解方法将用水量时间序列进行分解,提取分解后的用水量时间序列的趋势项、噪声项及周期项。
预测模块20利用聚类、统计规律等方法对用户进行分类,并获得分类后用水用户相应的用水模式;并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最后将提取的趋势项、噪声项及修正后的用水模式项作为特征输入基于LSTM(LongShort-Term Memory,长短期记忆人工神经网络)的深度学习和训练模型中,预测用水量结果。
本实施例提供的基于用户模式与深度学习联合模型的用水量预测系统,通过利用时间序列分解方法将用水量时间序列分解,提取其趋势项及周期项;利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的周期项进行融合,成为修正后的用水模式项;最终将提取的趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。本实施例提供的基于用户模式与深度学习联合模型的用水量预测系统,对于分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM算法相对于BP、CNN网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
进一步地,请见图6,图6为图5中所示的提取模块一实施例的功能模图示意图,在本实施例中,提取模块10包括预处理单元11和分解单元12,其中,预处理单元11,利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;分解单元12,用于对于已经处理好的用水量时间序列xt,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。
预处理单元11从系统所获取的用水量时间序列中,因监测仪器、通信传输等原因,会出现部分单个或多个点的噪声或异常值,这些明显偏离常规模式的数据将对数据集的训练带来影响,因此应首先予以修正。在本实施例中,利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正
分解单元12对于已经处理好的用水量时间序列xt,可利用时间序列分解算法将其分解为三个部分:
xt=Tt+St+Nt (11)
在公式(11)中,xt为已经处理好的用水量时间序列,Tt为用水量序列的趋势部分,表示用水量的朝着某一方向变化的趋势;St为周期性部分,主要表示用水量的周期性特征;Nt为噪声项,为用水量时间序列的随机部分。在本实施例中,根据用水特点的先验知识,设周期为24小时,具体周期内样本数可根据所获取时间序列的采样周期确定,以保证分解模型的灵活性,如采样周期为15分钟,则周期设为96。
本实施例提供的基于用户模式与深度学习联合模型的用水量预测系统,利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;对于已经处理好的用水量时间序列xt,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。本实施例提供的基于用户模式与深度学习联合模型的用水量预测系统,对于分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM算法相对于BP、CNN网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
优选地,参见图7,图7为图5中所示的预测模块一实施例的功能模图示意图,在本实施例中,预测模块20包括提取单元21和预测单元22,其中,提取单元21,用于提取用户用水模式并融合周期性序列;预测单元22,用于运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。
提取单元21根据城市用水特点,将用户分成居民小区、中小学校、写字楼公司、商场等所需预测类别;按类别获取其样本并通过统计规律、机器学习中聚类算法等,获取相应类别用水模式特性曲线;可根据实际情况,将工作日与假日(包括普通周末和假期)分开,配合所需预测的用水量时间序列采样周期进行重新计算,最终将用对应时间段的用水模式分量Mt与周期性分量St融合,成为修正后的用水模式项S′t
预测单元22运用LSTM(Long Short-Term Memory,长短期记忆人工神经网络),对基于时间序列分解算法分解后的时间序列进行预测。
LSTM模型具备选择性记忆的优势,解决了循环神经网络(Recurrent NeuralNetwork,以下简称RNN)的梯度爆炸或梯度消失问题。其选择性记忆功能的实现主要通过三个门结构实现:即遗忘门、输入门和输出门。
遗忘门(forget gate):
ft=σ(Wf·[ht-1,x’t]+bf) (12)
LSTM网络可通过遗忘门决定细胞状态中用水量样本中哪些信息需要保留。在公式(13)中,为sigmoid函数,ht-1为上一个LSTM单元输出的用水量值,x’t为当前时刻用水信息输入向量,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置项。
输入门(input gate):
it=σ(Wi·[ht-1,x’t]+bi) (13)
Figure BDA0003986341500000151
在公式(13)和(14)中,it为更新信息,
Figure BDA0003986341500000152
为更新的细胞状态计算结果;Wi
神经元的更新公式如下:
Figure BDA0003986341500000153
输出门(output gate):
ot=σ(Wo·[ht-1,x’t]+bo) (16)
ht=ot*tanh(Ct) (17)
在公式(15)~(17)中ot表示细胞状态的输出部分,σ为sigmoid函数,ht-1为上一个长短期记忆人工神经网络单元输出的用水量值,Wo为输出门的相应权矩阵,bo为输出门的偏置项;ht为长短期记忆人工神经网络单元输出的用水量值。
如图1至图4所示,本实施例提供的基于用户模式与深度学习联合模型的用水量预测方法,具体实施例为:
1、确定输入变量
将时间序列分解并与用户将时间序列分解并与用户模式融合后后得到的趋势Tt、用水模式分量S’t和噪音Nt三个部分作为一个输入样本的三个特征,即
Xt=[Tt,S’t,Nt] (18)
在公式(18)中,Xt为模型输入向量,Tt为时间序列分解后得到的趋势,S’t为时间序列分解后得到的用水模式分量,Nt为时间序列分解后得到的噪声。
2、归一化
为避免三个特征的量纲为模型预测带来误差,统一样本的统计分布性,通过归一化函数将不同的特征均缩放到[0,1]范围内。
3、确定时间窗口进行样本划分,形成训练数据集
确定观测值序列长度Train_length以及预测步长Predict_length,即用前序一定长度的用水量数据,预测后续一定长度的用水量数据,并根据相应长度划分训练模型输入输出的长度,并形成训练数据和标签,其中:
一个样本数据集表示为:
X’t=[Xt-Train_length+1…,Xt-1,X] (19)
在公式(19)中,X’t表示样本数据集,Train_length为观测值序列长度。
其对应标签为未分解前的时间点用水量数据:
Yt=[xt,xt+1…,xt+Predict_length] (20)
在公式(20)中,Yt表示未分解前的时间点用水量数据,Predict_length为预测步长。
4、模型训练
在LSTM模型中,确定隐藏层层数及其神经元数、训练次数,可选用均方误差函数作为损失函数,以Adam(Adaptive momentum,自适应动量的随机优化方法)算法作为优化器,提高计算效率,减少内存需求。
本实施例提供的基于用户模式与深度学习联合模型的用水量预测系统,同现有技术相比,通过提取用户用水模式并融合周期性序列;运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。本实施例提供的基于用户模式与深度学习联合模型的用水量预测系统,对于分解算法提取出来的周期性序列,加入用户分类模式的先验知识,通过普适性序列+个体序列的信息融合,充分挖掘数据信息,修正个体差异;LSTM算法相对于BP、CNN网络更适用于时间序列数据,并通过三个门结构实现选择性记忆,缓解了RNN网络训练时“梯度消失”问题;通过分解加预测的组合模型,充分提取模型中的周期性先验知识,能够更准确的掌握数据变化趋势,提高预测精度。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于用户模式与深度学习联合模型的用水量预测方法,其特征在于,包括以下步骤:
利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;
利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的所述周期项进行融合,成为修正后的用水模式项;最终将提取的所述趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。
2.如权利要求1所述的基于用户模式与深度学习联合模型的用水量预测方法,其特征在于,所述利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项的步骤包括:
利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;
对于已经处理好的用水量时间序列,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。
3.如权利要求2所述的基于用户模式与深度学习联合模型的用水量预测方法,其特征在于,对于已经处理好的用水量时间序列,分解的三个部分为:
xtt+t+t
其中,xt为经预处理后的用水量时间序列,Tt为用水量序列的趋势部分,表示用水量的朝着某一方向变化的趋势;St为周期性部分,主要表示用水量的周期性特征;Nt为噪声项,为用水量时间序列的随机部分。
4.如权利要求3所述的基于用户模式与深度学习联合模型的用水量预测方法,其特征在于,所述利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的所述周期项进行融合,成为修正后的用水模式项,最终将提取的所述趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测的步骤包括:
提取用户用水模式并融合周期性序列;
运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。
5.如权利要求4所述的基于用户模式与深度学习联合模型的用水量预测方法,其特征在于,所述长短期记忆人工神经网络的选择性记忆功能通过遗忘门、输入门和输出门三个门结构实现,
所述遗忘门的门结构为:
ft=σ(Wf·[ht-1,x’t]+bf)
其中,ft为遗忘门计算结果,σ为sigmoid函数,ht-1为上一个LSTM单元输出的用水量值,x’t为当前时刻用水信息输入向量,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置项;
所述输入门的门结构为:
it=σ(Wi·[ht-1,x’t]+bi)
Figure FDA0003986341490000021
其中,it为更新信息,
Figure FDA0003986341490000022
为更新的细胞状态计算结果;Wi、Wc分别为输入门的相应权矩阵;bi、bc分别为输入门的相应偏置项;细胞状态的更新公式为:
Figure FDA0003986341490000023
所述输出门的门结构为:
ot=σ(Wo·[ht-1,x’t]+bo)
ht=ot*tanh(Ct)
其中,ot表示细胞状态的输出部分,σ为sigmoid函数,ht-1为上一个长短期记忆人工神经网络单元输出的用水量值,Wo为输出门的相应权矩阵,bo为输出门的偏置项;ht为长短期记忆人工神经网络单元输出的用水量值。
6.一种基于用户模式与深度学习联合模型的用水量预测系统,其特征在于,包括:
提取模块(10),用于利用时间序列分解方法将用水量时间序列分解,提取其趋势项、噪声项及周期项;
预测模块(20),用于利用聚类、统计规律方法对用户进行分类并获得相应的用水模式,并将对应时段的用水模式与提取的所述周期项进行融合,成为修正后的用水模式项;最终将提取的所述趋势项、噪声项及修正后的用水模式项作为特征输入长短期记忆人工神经网络深度学习方法进行预测。
7.如权利要求6所述的基于用户模式与深度学习联合模型的用水量预测系统,其特征在于,所述提取模块(10)包括:
预处理单元(11),用于利用基于统计规律等方法对原始用水量时间序列训练数据进行预处理,将异常数据修正;
分解单元(12),用于对于已经处理好的用水量时间序列,利用时序分解算法进行分解,将已经处理好的用水量时间序列分解为趋势项、周期项和噪声项。
8.如权利要求7所述的基于用户模式与深度学习联合模型的用水量预测系统,其特征在于,
所述分解单元(12)中,对于已经处理好的用水量时间序列,分解的三个部分为:
xtt+t+t
其中,xt为经预处理的用水量时间序列,Tt为用水量序列的趋势部分,表示用水量的朝着某一方向变化的趋势;St为周期性部分,主要表示用水量的周期性特征;Nt为噪声项,为用水量时间序列的随机部分。
9.如权利要求6所述的基于用户模式与深度学习联合模型的用水量预测系统,其特征在于,所述预测模块(20)包括:
提取单元(21),用于提取用户用水模式并融合周期性序列;
预测单元(22),用于运用长短期记忆人工神经网络,对基于时序分解算法分解后的时间序列进行预测。
10.如权利要求9所述的基于用户模式与深度学习联合模型的用水量预测系统,其特征在于,所述预测单元(22)中,所述长短期记忆人工神经网络的选择性记忆功能通过遗忘门、输入门和输出门三个门结构实现,
所述遗忘门的门结构为:
ft=σ(Wf·[ht-1,x’t]+bf)
其中,ft为遗忘门计算结果,σ为sigmoid函数,ht-1为上一个LSTM单元输出的用水量值,x’t为当前时刻用水信息输入向量,Wf为遗忘门的权重矩阵,bf为遗忘门的偏置项;
所述输入门的门结构为:
it=σ(Wi·[ht-1,x’t]+bi)
Figure FDA0003986341490000041
其中,it为更新信息,
Figure FDA0003986341490000042
为更新的细胞状态计算结果;Wi、Wc分别为输入门的相应权矩阵;bi、bc分别为输入门的相应偏置项;细胞状态的更新公式为:
Figure FDA0003986341490000043
所述输出门的门结构为:
ot=σ(Wo·[ht-1,x’t]+bo)
ht=ot*tanh(Ct)
其中,ot表示细胞状态的输出部分,σ为sigmoid函数,ht-1为上一个长短期记忆人工神经网络单元输出的用水量值,Wo为输出门的相应权矩阵,bo为输出门的偏置项;ht为长短期记忆人工神经网络单元输出的用水量值。
CN202211565217.8A 2022-12-07 2022-12-07 基于用户模式与深度学习联合模型的用水量预测方法及系统 Pending CN115730744A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211565217.8A CN115730744A (zh) 2022-12-07 2022-12-07 基于用户模式与深度学习联合模型的用水量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211565217.8A CN115730744A (zh) 2022-12-07 2022-12-07 基于用户模式与深度学习联合模型的用水量预测方法及系统

Publications (1)

Publication Number Publication Date
CN115730744A true CN115730744A (zh) 2023-03-03

Family

ID=85300500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211565217.8A Pending CN115730744A (zh) 2022-12-07 2022-12-07 基于用户模式与深度学习联合模型的用水量预测方法及系统

Country Status (1)

Country Link
CN (1) CN115730744A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117436727A (zh) * 2023-12-18 2024-01-23 深圳中科超远科技有限公司 一种智能水利调度优化系统
CN117646935A (zh) * 2023-12-06 2024-03-05 深圳市博萱实业有限公司 一种多功能型空气源热泵控制方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117646935A (zh) * 2023-12-06 2024-03-05 深圳市博萱实业有限公司 一种多功能型空气源热泵控制方法及系统
CN117436727A (zh) * 2023-12-18 2024-01-23 深圳中科超远科技有限公司 一种智能水利调度优化系统

Similar Documents

Publication Publication Date Title
CN110298501B (zh) 基于长短时记忆神经网络的电负荷预测方法
CN109214592B (zh) 一种多模型融合的深度学习的空气质量预测方法
CN115730744A (zh) 基于用户模式与深度学习联合模型的用水量预测方法及系统
CN108985965A (zh) 一种结合神经网络和参数估计的光伏功率区间预测方法
CN109583565A (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN111652425B (zh) 一种基于粗糙集和长短期记忆网络的河流水质预测方法
CN111027772A (zh) 基于pca-dbilstm的多因素短期负荷预测方法
CN111027673B (zh) 一种地铁客流量预测方法
CN112232604B (zh) 基于Prophet模型提取网络流量的预测方法
CN110084398A (zh) 一种基于企业电力大数据的行业景气自适应检测方法
CN109102155B (zh) 一种超短期节点边际电价概率预测方法及系统
CN112329990A (zh) 一种基于lstm-bp神经网络的用户用电负荷预测方法
CN112766603A (zh) 一种交通流量预测方法、系统、计算机设备及存储介质
CN116503118A (zh) 一种基于分类选择强化预测模型的废旧家电价值评估系统
CN116227716A (zh) 一种基于Stacking的多因素能源需求预测方法及系统
CN111598328A (zh) 一种计及疫情事件的电力负荷预测方法
Sen Time series prediction based on improved deep learning
CN110222910A (zh) 一种有源配电网态势预测方法及预测系统
CN111524349B (zh) 一种语境特征注入的多尺度交通流预测模型建立方法及使用方法
CN109948678A (zh) 一种基于模糊贝叶斯理论的长期用电量预测方法
Al-Saffar et al. Data-Efficient MADDPG Based on Self-Attention for IoT Energy Management Systems
CN112862213B (zh) 一种基于周期回馈lstm的供热需求量预估方法、系统及设备
CN111402042B (zh) 一种用于股市大盘形态分析的数据分析与显示方法
CN114492967A (zh) 基于ceemdan和blstm组合模型的城轨车站客流预测方法和介质
CN113780377A (zh) 基于物联网数据在线学习的降雨等级预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination