CN115204502A - 压力预测模型的训练和预测方法、系统、设备及存储介质 - Google Patents

压力预测模型的训练和预测方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN115204502A
CN115204502A CN202210862249.8A CN202210862249A CN115204502A CN 115204502 A CN115204502 A CN 115204502A CN 202210862249 A CN202210862249 A CN 202210862249A CN 115204502 A CN115204502 A CN 115204502A
Authority
CN
China
Prior art keywords
pressure
model
network
training
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210862249.8A
Other languages
English (en)
Inventor
路强
滕进风
余烨
薛峰
黄毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN202210862249.8A priority Critical patent/CN115204502A/zh
Publication of CN115204502A publication Critical patent/CN115204502A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Operations Research (AREA)
  • Public Health (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

本发明提供压力预测模型的训练和预测方法、系统、设备及存储介质,属于城市智能供水管网技术领域。多监测点管网压力预测模型的训练方法包括:获取所监测城市供水管网的历史压力数据;构建压力预测模型,压力预测模型包括时间卷积网络模型和长短期记忆网络模型;基于历史压力数据对卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的压力预测模型,压力训练模型基于历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。本发明提供一种压力预测模型的训练方法,该压力预测模型基于城市供水管网上多监测点的关联性和周期性,高效精准的对管网上各个监测点的压力数据进行预测。

Description

压力预测模型的训练和预测方法、系统、设备及存储介质
技术领域
本发明涉及城市智能供水管网技术领域,具体涉及压力预测模型的训练和预测方法、系统、设备及存储介质。
背景技术
在城市供水管网系统中,由于物联网和传感器技术的广泛使用,使得供水系统中的管网压力数据得到大量的积累,物联网技术为城市供水系统中的数据管理提供了必要的基础和支持。如今,数据及其理解变得越来越重要,对供水管网压力数据进行分析,可以及时有效的确保供水安全。
城市DMA(District Metering Area,独立计量区域)供水管网是一种多源和多节点的流量系统,用于向用户输送具有足够压力和数量的水,它的特点是在一个DMA区域内供水管网具有多个压力监测点,且管网具有连通性,同时压力数据具有非线性和空间分布的特征。在城市供水管网中大多数监测是测量管网压力数据,供水业务人员通常根据测量的压力数据观察供水管网的运行状态,将整个管网的压力控制在合理的范围内,并根据当地压力损失判断是否有任何异常。因此,准确、快速地预测多个监测点的压力,对于实时调度和科学管理具有重要的意义。
考虑到供水管网的连通性,供水管网压力预测不同于单个点的预测,监测点的压力值会受到供水管网其他压力值的影响,供水业务人员需要关注的是区域内多个监测点压力数据的变化趋势。现有技术中差分自回归移动平均模型和循环神经网络在供水多监测点管网压力数据预测上,难以并行分析各个监测点的压力数据,无法快速高效的进行预测。而时间卷积网络(Temporal Convolutional Network,TCN)在处理长输入时间序列方面表现出比传统方法和循环神经网络具有更好的性能。由于卷积神经网络的固有缺点,限制了其在时间序列预测中的应用,而TCN不仅包含了传统卷积神经网络的局部连接和权重共享等基本技术。此外,TCN还具有简单的网络结构,在捕获长距离时间模式方面具有很大的优点。
故而,需要提供一种压力预测模型的训练和预测方法、系统、设备及存储介质,以解决上述问题。
发明内容
鉴于以上现有技术的缺点,本发明的目的在于提供一种压力预测模型的训练和预测方法、系统、设备及存储介质,以改善现有技术中,差分自回归移动平均模型和循环神经网络在供水多监测点管网压力数据预测上,难以并行分析各个监测点的压力数据,无法快速高效预测多监测点压力数据的技术问题。
为实现上述目的及其它相关目的,本发明提一种多监测点管网压力预测模型的训练方法,包括以下过程:
获取所监测城市供水管网的历史压力数据;
构建压力预测模型,所述压力预测模型包括时间卷积网络模型和长短期记忆网络模型;
基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,所述压力训练模型基于所述历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。
在本发明一实施例中,本发明还提供一种多监测点管网压力预测方法,所述多监测点管网压力预测方法采用上述任意一项实施例所述多监测点管网压力预测模型的训练方法训练得到的多监测点管网压力预测模型,所述多监测点管网压力预测方法包括:
获取所监测城市供水管网的历史压力数据;
将所述历史压力数据输入所述多监测点管网压力预测模型,获取所监测城市供水管网上各个监测点的压力预测结果。
在本发明一实施例中,本发明还提供一种多监测点管网压力预测模型的训练系统,所述系统包括:
数据获取单元,用于获取所监测城市供水管网的历史压力数据;
模型构建单元,用于构建压力预测模型,所述压力预测模型包括时间卷积网络模型和长短期记忆网络模型;
联合训练单元,基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,所述压力训练模型基于所述历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。
在本发明一实施例中,还提供一种计算机设备,包括处理器,所述处理器与存储器耦合,所述存储器存储有程序指令,当所述存储器存储的程序指令被所述处理器执行时实现上述任一项所述的方法。
在本发明一实施例中,还提供一种计算机可读存储介质,包括程序,当所述程序在计算机上运行时,使得计算机执行上述中任一项所述的方法。
本发明压力预测模型的训练和预测方法、系统、设备及存储介质,提供了一种压力预测模型,该压力预测模型应用于具有多监测点的城市DMA供水管网压力预测场景,充分考虑供水管网中监测点的属性信息,通过时间卷积网络模型与自注意力机制来捕获监测点的时间和周期特征信息;然后将具有时间和周期特征的压力数据作为基于长短期记忆网络的输入,学习供水管网压力数据的长期依赖性,进一步提取监测点压力数据的时间特征,最后通过全连接层得到最终预测结果。
综上所述,压力预测模型的训练和预测方法、系统、设备及存储介质,可通过时间卷积网络模型并行处理所监测城市供水管网上多个监测点的历史压力数据,同时采用自注意力机制来获取监测点本身的周期性特征,最后通过LSTM(Long Short-Term Memory,长短期记忆)网络的长期记忆的能力来获得监测点的时间依赖性,能够基于城市供水管网上多监测点的关联性和周期性,高效精准的对管网上各个监测点的压力数据进行预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例中压力预测模型的整体框架图;
图2为本发明一实施例中时间卷积网络模型中残差模块的结构示意图;
图3为本发明一实施例中时间卷积网络模型中扩张因果卷积的过程示意图;
图4为本发明一实施例中长短期记忆网络模型的结构示意图;
图5为本发明一实施例中多监测点管网压力预测模型的训练方法的流程示意图;
图6为本发明一实施例中步骤S1的流程示意图;
图7为本发明一实施例中步骤S3的流程示意图;
图8为本发明一实施例中多监测点管网压力预测模型预测结果和真实结果的数据对比图;
图9为本发明一实施例中压力预测模型在MAE指标下的最优参数选择示意图;
图10为本发明一实施例中多监测点管网压力预测模型的训练系统的结构框图。
元件标号说明:
10、多监测点管网压力预测模型的训练系统;11、数据获取单元;12、模型调用单元;13、联合训练单元。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其它优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法,通常按照常规条件,或者按照各制造商所建议的条件。
请参阅图1至图10。须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容所能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
请参见图1至图6,本发明的目的在于提供一种压力预测模型的训练和预测方法、系统、设备及存储介质,以改善现有技术中,差分自回归移动平均模型和循环神经网络在供水多监测点管网压力数据预测上,难以并行分析各个监测点的压力数据,无法快速高效预测多监测点压力数据的技术问题。
请参见图1至图5,基于本发明训练方法训练的压力预测模型,通过构建时间卷积网络模型实现对多维压力时序数据的同时处理,并采用自注意力模块,增强输出的时序特征向量中各分量的关联性;同时通过长短期记忆网络模型进一步提取时序特征向量中的时序特征,以将时序特征向量转化为预测特征向量;最后通过全连接层整合预测特征向量,获得所监测城市供水管网上多监测点的压力预测结果。
请参阅图1至图5,图5显示为本发明一实施例中多监测点管网压力预测模型的训练方法的流程示意图。在本发明一实施例中,提供一种多监测点管网压力预测模型的训练方法,包括以下过程:
步骤S1、获取所监测城市供水管网的历史压力数据;
具体地,如图6所示,所述步骤S1包括以下过程:
S11、获得所监测城市供水管网的历史压力数据,按时间先后将所述历史压力数据分为训练集和测试集;其中,所述历史压力数据包括城市供水管网上多个监测点的历史压力数据;
例如,所述历史压力数据包含了在2020年7月1日到2020年7月15日在DMA区域内供水管网络的12个压力监测点处采集的压力数据,数据采样频率是五分钟一次,每个监测点压力数据一共具有4320条。在步骤S11中,将前12天采集到的历史压力数据分为训练集,以用于训练压力预测模型;将剩余3天采集到的历史压力数据分为测试集,用于验证压力预测模型预测结果的准确性。
S12、基于所监测城市供水管网上的多个监测点,将所述训练集中对应各个监测点的历史压力数据分为多个时序分量,所述时序分量以用于代表不同时序段的压力数据;而后对应不同监测点按照时间顺序汇总多个时序分量获得压力时序数据,并对所述压力时序数据进行预处理,以便于输入压力预测模型。
其中,所述压力时序数据为依据在空间维度上多监测点信息和时间维度上按时间顺序排列的时序分量信息,而构建的多维矩阵。该压力时序数据表示为X={x1,x2,…,xm-1,xm}∈Rn×m,式中m代表监测点的序号,n代表监测点对应的时序长度(即时序分量数量)。
在本发明中,对压力时序数据的预处理包括,首先对压力时序数据的归一化处理,将压力时序数据中各个时序分量规范在(0,1)区间内,以便于加快模型的训练速度并获得更好的预测结果;然后按照时间卷积网络模型的输入时间序列长度L将压力时序数据转换为三维矩阵向量,例如,将第m个监测点的压力时序数据表示为
Figure BDA0003757168820000071
将压力时序数据
Figure BDA0003757168820000072
(转换为三维矩阵向量)输入压力预测模型的时间卷积网络模型,最终经过时间卷积网络模型和长短期记忆网络模型的特征提取,获得时序长度为K的输出数据
Figure BDA0003757168820000073
为预测结果,表示为
Figure BDA0003757168820000074
步骤S2、构建压力预测模型,所述压力预测模型包括时间卷积网络模型(TCN)和长短期记忆网络模型(LSTM);
其中,发明人发现城市供水管网是一种多节点监测系统,监测点与监测点之间是连通的,传统的供水管网压力的预测方法大多是基于单个节点的历史数据进行预测,而单个压力监测点的预测对于供水管网运行状态的分析具有一定的局限性。考虑到供水管网的连通性,供水业务人员关注的是区域内多个监测点压力数据的变化趋势。因此针对传统的方法在供水管网多监测点压力数据预测上的不足,采用时间卷积网络可以很好的解决这个问题,时间卷积网络适用于具有时间性和大感受野的序列数据,并且适合并行和分布式计算,使得它可以有效的提取数据的特征。
请参见图1至图3,所述时间卷积网络模型,用于提取压力时序数据中多个监测点之间表示压力相关性的时序特征,并汇总为时序特征向量。所述时间卷积网络模型中包括至少两个残差模块,并且时间卷积网络模型基于自注意力机制在模型中每个残差模块的输出端设置有自注意力模块;其中,所述残差模块用于从所述压力时序数据中提取时序特征向量,所述自注意力模块用于捕获所述时序特征向量自身的周期性特征,并基于所述周期性特征加权处理所述时序特征向量,获得具有周期性特征的时序特征向量,从而增强时序特征向量中各时序分量的关联性。
如图2和图3所示,所述时间卷积网络模型使用残差模块(Residual Block)来避免深度网络的梯度爆炸和消失的问题。所述残差模块具有两层因果卷积,每个因果卷积的输出端还依次设置有权重归一化、非线性映射函数(Rectified Linear Unit,ReLU)和Dropout输出层。并且,残差模块在两层因果卷积的输入端和输出端之间设置一个额外的残差连接,使得输入数据被直接添加到输出数据,从而避免深层网络性能饱和,保证深层网络的稳定性和性能。
具体地,残差模块通过因果卷积对输入的压力时序数据进行卷积处理,利用卷积核F=(f1,f2,…,fk)对输入数据中一监测点时序t及时序t以前时序长度L的时序分量进行卷积,从而获得对应该监测点中时序t-L至时序t阶段压力时序数据的时序特征
Figure BDA0003757168820000081
汇总时序特征即可获得压力时序数据的时序特征向量。其中,*为卷积运算符,当输入数据的时序长度小于设计的卷积核大小时,通常在输入时序的左侧应用零填充技术来实现因果卷积。
并且,如图3所示,在本发明中,因果卷积通过引入扩张卷积,对卷积的输入进行间隔采样以扩展时间卷积网络模型的感受野,扩张的因果卷积能够回顾较长的历史样本。其中,因果卷积的采样率由扩张卷积的系数d决定,因果卷积中隐藏层的扩张因子d随着网络的深度以指数方式增加,这使得因果卷积的深度网络能够快速收敛,但性能却变得饱和。引入扩张卷积后的因果卷积操作定义为:
Figure BDA0003757168820000082
式中,d为扩张卷积的系数,作为一个特例,当d=1时,扩张的因果卷积退化为正常的因果卷积。
如图1和图2所示,在本发明一实施例中,时间卷积网络模型中采用两个残差模块对压力时序数据进行特征提取;其中,第一个残差模块中因果卷积的卷积核大小为5,扩张系数为1,滤波器的数量为32;第二个残差模块中因果卷积的扩张系数为2,其他参数与第一个残差模块保持相同;而每个残差模块的输入端和输出端之间均设置有一个1×1卷积,保证每个残差模块的输入数据和输出数据的大小相同。
由上述内容可见,时间卷积网络模型作为序列建模的替代模型,在捕获长距离时间模式方面比循环神经网络具有更大的优点,时间卷积网络的反向传播从输出层到输入层与其它前馈网络相同,因此时间卷积网络能够处理海量的高度非线性的序列数据。由于深度多层的卷积神经网络在提取特征时性能会下降,而时间卷积网络采用扩张卷积在同样的网络深度中可以获取更多的历史输入数据,因此它在并行处理数据时具有更灵活的感受野。时间卷积网络适用于并行和分布式计算,并且适用于具有时间性和大感受野的序列数据,时间卷积网络不仅包含扩张的因果卷积和残差连接等模块,还包含了卷积神经网络的局部连接和权重共享等优点,使得它在处理多维特征的序列数据时,具有更好的特征提取能力和历史记忆能力,可以获得更好的预测结果。
此外,如图1所示,在本发明一实施例中,为了对预测密切相关的隐藏状态提供更大的权重,所述时间卷积网络模型在每个残差模块的输出端均设置了一个自注意力模块,所述自注意力模块可基于残差模块输出的时序特征向量提取周期性特征,并基于周期性特征加权处理时序特征向量,获得具有周期性特征的时序特征向量。
具体地,自注意力模块获取残差模块输出的时序特征向量,通过初始化获取三个权重矩阵Wq,Wk和Wv,将时序特征向量的每一维数据分别与三个权重矩阵相乘,获取查询向量Q,键向量K和值向量V,通过将查询向量Q与键向量K进行点积,并经过softmax计算注意力得分,最后将注意力得分和值向量V相乘获取加权值得到输出,自注意力机制公式如下所示:
Figure BDA0003757168820000101
其中,Q,K和V分别是查询向量,键向量和值向量矩阵。时序特征向量通过自注意力机制被合理分配不同的权重,突出更关键的影响因素,实现高层次的特征学习。通过加权后的时序特征向量,每个时序分量都可以充分利用输入序列携带的自身周期性的特征。因此采用自注意力机制来提取多个监测点压力自身的特征信息,每个不同的监测点都被视为单独的时间序列数据。
如图1和图4所示,所述长短期记忆网络模型用于将时序特征向量梳理为预测特征向量,然后通过全连接层整合预测特征向量获得压力预测结果,并输出压力预测结果。
其中,所述长短期记忆网络(LSTM)通过引入存储单元和门控机制,它可以在长序列中表现得更好。如图4所示,LSTM中通过引入输入门、遗忘门和输出门来选择性保留输入的时序特征向量的关键性信息,LSTM的遗忘门决定保留多少上一时刻的状态信息;输入门是决定保留当前时刻的状态信息;输出门是决定当前时刻的单元状态的输出量。LSTM使用三个门控机制解决了循环神经网络存在的问题,使得LSTM在序列数据中的长期特征学习方面具有良好的性能,可以获取序列中的长期依赖性。通过LSTM获得不同压力点时间维度的输出,LSTM的计算公式如下:
it=σ(Wxixt+Whiht-1+WciCt-1+bi)
ft=σ(Wxfxt+Whfht-1+WcfCt-1+bf)
Ct=ft*Ct-1+it*tanh(Wxcxt+Whcht-1+bc)
ot=σ(Wxoxt+Whoht-1+WcoCt+bo)
ht=ot*tanh(Ct)
其中,σ和tanh分别表示sigmoid和tanh操作;it,ft,ot分别表示输入门、遗忘门和输出门控机制,xt表示输入数据,Ct-1和Ct分别表示细胞状态信息。ht-1和ht表示上一时刻和当前时刻LSTM单元的输出。W和b分别代表门控机制的权重和偏差向量,*代表Hadamard积。
如图1所示,所述全连接层(MLP)作为压力预测模型的输出端,擅长学习输入和输出数据之间的非线性映射关系,用于整合预测特征向量,获得所监测城市供水管网上多监测点的压力预测结果。所述全连接层包括输入层、隐藏层和输出层。隐藏层对输入层的数据进行运算,每个神经元根据权重和偏差向量对输入数据进行加权求和,再通过非线性激活函数得到输出值。输出层则处理来自隐藏层的数据以产生输出。
步骤S3、基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,所述压力训练模型基于所述历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。
具体地,如图7所示,所述步骤S3包括以下过程:
S31、将所述训练集输入所述时间卷积网络模型。
S32、通过所述时间卷积网络模型获取所述压力时序数据的时序特征向量;具体为,通过时间卷积网络模型中的残差模块获取压力时序数据的时序特征向量,然后通过自注意力模块基于时序特征向量自身的周期性,对时序特征向量进行加权处理,获得具有周期性特征的时序特征向量。
S33、通过长短期记忆网络模型将具有周期性特征的时序特征向量梳理为预测特征向量;其中,通过长短期记忆网络的通过引入存储单元和门控机制,来选择性保留输入时序特征向量的关键性信息,从而将时序特征向量梳理为预测特征向量。
S34、通过全连接层整合预测特征向量,获得所监测城市供水管网上多监测点的压力预测结果。
S35、比对所述压力预测结果和测试集,获得所述压力预测模型的损失函数,通过迭代训练使所述损失函数最小化,获得训练好的所述压力预测模型。其中,在本发明一实施例中,利用Adam优化器来优化压力预测模型的损失函数,通过全连接层采用反向传播的监督学习来所述训练时间卷积网络模型和长短期记忆网络模型,在迭代训练过程中将压力预测模型的损失函数最小化,以获得训练好的所述压力预测模型。
其中,所述损失函数包括平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE中的至少一个;所述平均绝对误差为,
Figure BDA0003757168820000121
所述均方根误差为,
Figure BDA0003757168820000122
所述平均绝对百分比误差为,
Figure BDA0003757168820000123
其中,
Figure BDA0003757168820000124
表示压力数据的真实值,
Figure BDA0003757168820000125
表示第i个监测点压力数据的第j个时间点的预测值,m和n分别表示监测点压力数量和样本数量。
此外,由于本发明的压力预测模型的输入数据时序长度、LSTM神经元数量、卷积核大小和滤波器数量在训练过程中对模型的预测性能和学习效率具有较大影响。如图9所示,在本发明一实施例中,在MAE评价指标下,所述压力预测模型的输入时序长度为30,LSTM神经元数量为100,卷积核大小为5且滤波器的个数为32时,压力预测模型的预测误差达到最小值。
为验证本发明中压力预测模型(TSA-LSTM)相比现有模型对压力预测结果准确性的提升,通过实验将TSA-LSTM模型和几种现有模型的预测结果相对比。如表1所示,详细的描述如下,TSA-LSTM模型极大提高了预测结果,表明该模型对压力数据的预测结果取得了良好的效果。例如,对于5分钟的预测结果,TSA-LSTM模型与SVR模型相比,MAE和RMSE分别降低了约32.95%和12.09%。与XGBoost模型相比,MAE和RMSE分别降低了约13.37%和4.48%。这主要是由于SVR和XGBoost等方法在对具有高度非线性的管网压力数据进行特征提取时,具有一定的难度。与CNN-GRU模型相比,MAE和RMSE分别降低了约5.41%和3.90%;与TCN模型相比,MAE和RMSE分别降低了约4.37%和4.19%;尽管CNN-GRU和TCN模型在长期记忆方面有一定的优势,但针对并行的多个监测点压力数据的同时预测具有一定的局限性。
表1不同模型的预测结果
Figure BDA0003757168820000126
Figure BDA0003757168820000131
进一步,为验证本发明中压力预测模型(TSA-LSTM),通过将时间卷积网络模型(TCN)、自注意力机制和长短期记忆网络(LSTM)结合在一起的有效性,将TSA-LSTM模型分别与TCN-SA模型和TCN-LSTM模型进行了比较。从表1中可以看出,在MAE和RMSE两种实验评价指标下,可以清楚地看到TSA-LSTM模型具有更好的预测结果。以5分钟的预测结果可以看出,TSA-LSTM模型与TCN-SA模型的预测结果相比,MAE和RMSE分别降低了约2.78%和3.03%;与TCN-LSTM模型相比,MAE和RMSE分别降低了约1.69%和2.44%。图8是TSA-LSTM模型对某一个监测点压力5分钟预测结果可视化,可以看出预测值接近真实值,TSA-LSTM模型可以利用TCN良好的特征提取能力,TCN适合并行和分布式计算,因为它使用了基本的权重共享特性,自注意力机制可以关注数据的周期性特征,最后LSTM可以实现序列数据的长期预测效果。
请参阅图1至图5,请本发明还提供了一种多监测点管网压力预测方法,采用上述多监测点管网压力预测模型的训练方法训练得到的多监测点管网压力预测模型,所述多监测点管网压力预测方法包括:
获取所监测城市供水管网的历史压力数据;
将所述历史压力数据输入所述多监测点管网压力预测模型,获取所监测城市供水管网上各个监测点的压力预测结果。
请参阅图10,图10显示为本发明一实施例中多监测点管网压力预测模型的训练系统的结构框图。该多监测点管网压力预测模型的训练系统10包括数据获取单元11、模型构建单元12和联合训练单元13。其中,数据获取单元11用于获取所监测城市供水管网的历史压力数据;模型构建单元12用于构建压力预测模型,所述压力预测模型包括时间卷积网络模型和长短期记忆网络模型;联合训练单元13,基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,所述压力训练模型基于所述历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。
需要说明的是,为了突出本发明的创新部分,本实施例中并没有将与解决本发明所提出的技术问题关系不太密切的模块引入,但这并不表明本实施例中不存在其它的模块。
此外,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本发明所提供的实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本实施例还提出了一种计算机设备,该设备包括处理器和存储器,处理器和存储器耦合,存储器存储有程序指令,当存储器存储的程序指令被处理器执行时实现上述任务管理方法。处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件;所述存储器可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(Non-Volatile Memory),例如至少一个磁盘存储器。所述存储器可以为随机存取存储器(RandomAccess Memory,RAM)类型的内部存储器,所述处理器、存储器可以集成为一个或多个独立的电路或硬件,如:专用集成电路(Application Specific Integrated Circuit,ASIC)。需要说明的是,上述的存储器中的计算机程序可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
本实施例还提出一种计算机可读的存储介质,所述存储介质存储有计算机指令,所述计算机指令用于使计算机执行上述的任务管理方法。存储介质可以是电子介质、磁介质、光介质、电磁介质、红外介质或半导体系统或传播介质。存储介质还可以包括半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘可以包括光盘-只读存储器(CD-ROM)、光盘-读/写(CD-RW)和DVD。
本发明压力预测模型的训练和预测方法、系统、设备及存储介质,提供了一种压力预测模型,该压力预测模型应用于具有多监测点的城市DMA供水管网压力预测场景,充分考虑供水管网中监测点的属性信息,通过时间卷积网络模型与自注意力机制来捕获监测点的时间和周期特征信息;然后将具有时间和周期特征的压力数据作为基于长短期记忆网络的输入,学习供水管网压力数据的长期依赖性,进一步提取监测点压力数据的时间特征,最后通过全连接层得到最终预测结果。
综上所述,压力预测模型的训练和预测方法、系统、设备及存储介质,可通过时间卷积网络模型并行处理所监测城市供水管网上多个监测点的历史压力数据,同时采用自注意力机制来获取监测点本身的周期性特征,最后通过LSTM网络的长期记忆的能力来获得监测点的时间依赖性,能够基于城市供水管网上多监测点的关联性和周期性,高效精准的对管网上各个监测点的压力数据进行预测。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种多监测点管网压力预测模型的训练方法,其特征在于,包括:
获取所监测城市供水管网的历史压力数据;
构建压力预测模型,所述压力预测模型包括时间卷积网络模型和长短期记忆网络模型;
基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,所述压力训练模型基于所述历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。
2.根据权利要求1所述多监测点管网压力预测模型的训练方法,其特征在于,所述获取所监测城市供水管网的历史压力数据,包括:
获得所监测城市供水管网的历史压力数据,按时间先后将所述历史压力数据分为训练集和测试集;其中,所述历史压力数据包括城市供水管网上多个监测点的历史压力数据;
将所述训练集中各个监测点的所述历史压力数据按时间顺序分为多个时序分量,对应不同监测点汇总所述多个时序分量获得压力时序数据,并对所述压力时序数据进行预处理。
3.根据权利要求2所述多监测点管网压力预测模型的训练方法,其特征在于,所述时间卷积网络模型中设置有至少两个残差模块,所述时间卷积网络模型基于自注意力机制在所述残差模块的输出端设置有自注意力模块;其中,所述残差模块用于从所述压力时序数据中提取时序特征向量,所述自注意力模块用于捕获所述时序特征向量自身的周期性特征,并基于所述周期性特征加权处理所述时序特征向量,获得具有周期性特征的时序特征向量。
4.根据权利要求2所述多监测点管网压力预测模型的训练方法,其特征在于,所述基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,包括:
将所述训练集输入所述时间卷积网络模型;
通过所述时间卷积网络模型获取所述压力时序数据的时序特征向量;
通过长短期记忆网络模型将所述时序特征向量梳理为预测特征向量;
通过全连接层整合预测特征向量,获得所监测城市供水管网上多监测点的压力预测结果;
比对所述压力预测结果和测试集,获得所述压力预测模型的损失函数,通过迭代训练使所述损失函数最小化,获得训练好的所述压力预测模型。
5.根据权利要求4所述多监测点管网压力预测模型的训练方法,其特征在于,所述损失函数包括平均绝对误差MAE、均方根误差RMSE和平均绝对百分比误差MAPE中的至少一个;所述平均绝对误差为,
Figure FDA0003757168810000021
所述均方根误差为,
Figure FDA0003757168810000022
所述平均绝对百分比误差为,
Figure FDA0003757168810000023
其中,
Figure FDA0003757168810000024
表示压力数据的真实值,
Figure FDA0003757168810000025
表示第i个监测点压力数据的第j个时间点的预测值,m和n分别表示监测点压力数量和样本数量。
6.根据权利要求4所述多监测点管网压力预测模型的训练方法,其特征在于,所述全连接层基于所述损失函数通过反向传播的监督学习来所述训练时间卷积网络模型和长短期记忆网络模型。
7.一种多监测点管网压力预测方法,其特征在于,采用权利要求1至6任意一项所述多监测点管网压力预测模型的训练方法训练得到的多监测点管网压力预测模型,所述多监测点管网压力预测方法包括:
获取所监测城市供水管网的历史压力数据;
将所述历史压力数据输入所述多监测点管网压力预测模型,获取所监测城市供水管网上各个监测点的压力预测结果。
8.一种多监测点管网压力预测模型的训练系统,其特征在于,包括:
数据获取单元,用于获取所监测城市供水管网的历史压力数据;
模型构建单元,用于构建压力预测模型,所述压力预测模型包括时间卷积网络模型和长短期记忆网络模型;
联合训练单元,基于所述历史压力数据对所述卷积网络模型和长短期记忆网络模型进行联合训练,获得训练好的所述压力预测模型,所述压力训练模型基于所述历史压力数据对所监测城市供水管网上各个监测点的压力数据进行预测。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202210862249.8A 2022-07-21 2022-07-21 压力预测模型的训练和预测方法、系统、设备及存储介质 Pending CN115204502A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210862249.8A CN115204502A (zh) 2022-07-21 2022-07-21 压力预测模型的训练和预测方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210862249.8A CN115204502A (zh) 2022-07-21 2022-07-21 压力预测模型的训练和预测方法、系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115204502A true CN115204502A (zh) 2022-10-18

Family

ID=83584695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210862249.8A Pending CN115204502A (zh) 2022-07-21 2022-07-21 压力预测模型的训练和预测方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115204502A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611674A (zh) * 2023-07-20 2023-08-18 中建五局第三建设有限公司 一种建筑供给水智能调度运行方法
CN116861192A (zh) * 2023-07-27 2023-10-10 广东中山建筑设计院股份有限公司 基于satt-tcn-lstm模型的城市用水量预测方法
CN117236657A (zh) * 2023-11-14 2023-12-15 山东辰智电子科技有限公司 基于实时水压的城市供水区域动态划分控制系统及方法
CN117349610A (zh) * 2023-12-04 2024-01-05 西南石油大学 一种基于时间序列模型的压裂作业多时间步压力预测方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611674A (zh) * 2023-07-20 2023-08-18 中建五局第三建设有限公司 一种建筑供给水智能调度运行方法
CN116611674B (zh) * 2023-07-20 2023-09-22 中建五局第三建设有限公司 一种建筑供给水智能调度运行方法
CN116861192A (zh) * 2023-07-27 2023-10-10 广东中山建筑设计院股份有限公司 基于satt-tcn-lstm模型的城市用水量预测方法
CN117236657A (zh) * 2023-11-14 2023-12-15 山东辰智电子科技有限公司 基于实时水压的城市供水区域动态划分控制系统及方法
CN117349610A (zh) * 2023-12-04 2024-01-05 西南石油大学 一种基于时间序列模型的压裂作业多时间步压力预测方法
CN117349610B (zh) * 2023-12-04 2024-02-09 西南石油大学 一种基于时间序列模型的压裂作业多时间步压力预测方法

Similar Documents

Publication Publication Date Title
CN115204502A (zh) 压力预测模型的训练和预测方法、系统、设备及存储介质
Xuan et al. Multi-model fusion short-term load forecasting based on random forest feature selection and hybrid neural network
Behera et al. Multiscale deep bidirectional gated recurrent neural networks based prognostic method for complex non-linear degradation systems
Rhanoui et al. Forecasting financial budget time series: ARIMA random walk vs LSTM neural network
CN107977748B (zh) 一种多变量扭曲时间序列预测方法
Tan et al. Multi-node load forecasting based on multi-task learning with modal feature extraction
Shan et al. The data-driven fuzzy cognitive map model and its application to prediction of time series
CN116610998A (zh) 一种基于多模态数据融合的开关柜故障诊断方法和系统
CN114428803A (zh) 空压站运行优化方法、系统、存储介质及终端
Li et al. A neural networks based method for multivariate time-series forecasting
CN115965160B (zh) 一种数据中心能耗预测方法、装置、存储介质及电子设备
Zong et al. Embedded software fault prediction based on back propagation neural network
Ju et al. Hydrologic simulations with artificial neural networks
Feng et al. Graph convolution based spatial-temporal attention lstm model for flood forecasting
CN115694985A (zh) 基于tmb的混合网络流量攻击预测方法
CN116149895A (zh) 大数据集群性能预测方法、装置和计算机设备
CN115409262A (zh) 铁路数据中心关键性能指标趋势预测方法、异常识别方法
CN116386312A (zh) 一种交通量预测模型的构建方法和系统
Zhang et al. A traffic flow-forecasting model based on multi-head spatio–temporal attention and adaptive graph convolutional networks
CN115730845A (zh) 一种电力系统动态估计方法、装置、设备和可读存储介质
CN111859785B (zh) 流体特征提取方法、系统、计算机可读存储介质及设备
Tong et al. A prediction model for complex equipment remaining useful life using gated recurrent unit complex networks
Bi et al. Integrated spatio-temporal prediction for water quality with graph attention network and WaveNet
Jin Feasibility Analysis and Countermeasures of Psychological Health Training Methods for Volleyball Players Based on Artificial Intelligence Technology
Nurenie et al. Predicting Human Activity with LSTM Face Detection on Server Surveillance System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination