CN113240187A

CN113240187A - 预测模型生成方法、系统、设备、存储介质及预测方法

Info

Publication number: CN113240187A
Application number: CN202110579718.0A
Authority: CN
Inventors: 路强; 滕进风; 黎杰; 凌亮; 田红; 饶金刚
Original assignee: Hefei University of Technology
Current assignee: Hefei University of Technology
Priority date: 2021-05-26
Filing date: 2021-05-26
Publication date: 2021-08-10
Anticipated expiration: 2041-05-26
Also published as: CN113240187B

Abstract

本发明提供了预测模型生成方法、系统、设备、存储介质及预测方法，用于包含多个节点的供水管网的流量预测，预测模型生成方法包括：获取所有节点的拓扑结构图像和多个历史流量值；构建邻接矩阵和特征矩阵，并得到训练集和测试集；采用简化图卷积神经网络和长短期记忆网络进行模型的训练，得到初始预测模型；将测试集输入训练后的初始预测模型，进行精度的评估；若精度达标，则初始预测模型即为预测模型。本发明提供的预测模型生成方法、系统、设备、存储介质及预测方法能够同时进行多个节点的流量预测；通过提取供水管网的节点流量数据的空间特征和时间特征，以及对初始预测模型进行精度评估，使得最终的预测模型得到的预测流量值更加准确。

Description

预测模型生成方法、系统、设备、存储介质及预测方法

技术领域

本发明涉及流量预测技术领域，特别是涉及预测模型生成方法、系统、设备、存储介质及预测方法。

背景技术

供水管网作为城市供水系统的关键组成部分，是连接用户与水资源的纽带，担负着输水、配水的重要任务，供水管网被誉为城市的“生命线”，保障供水管网的正常工作对保证国民经济发展、保障居民日常生活都有着举足轻重的作用；随着城市供水规模的不断扩大，供水管网运行的效率、水力和水质的安全稳定也受到越来越多的挑战，因此需要对供水管网的流量进行预测，以预防故障发生。

近年来，随着智慧水务的发展，供水管网的基础信息与运行监测数据得到不断完善，在智慧城市建设的语境下，人工智能技术为传统供水管网流量预测提供了新的解决思路，然而，常见的时间序列预测方法如自回归模型、自回归移动平均模型、灰色预测等都无法学习到时序数据的非线性特征；机器学习算法如支持向量机又容易收敛于局部最优；进一步的，为了提高预测结果的准确度，深度学习也被广泛使用，而现有的供水管网流量预测方法虽然能在结果上取得了不错的效果，但大多是基于单个流量节点进行预测，只考虑了数据时间维度的属性特性，而忽略了节点与节点之间的相关性，即供水管网流量数据的空间特征。

综上，现有技术中的供水管网预测方法存在只能基于单个流量节点进行预测、忽略供水管网流量数据的空间特征等问题。

发明内容

鉴于以上现有技术的缺点，本发明的目的在于提供预测模型生成方法、系统、设备、存储介质及预测方法，以改善现有技术中的只能基于单个流量节点进行预测、忽略供水管网流量数据的空间特征等技术问题。

为实现上述目的及其他相关目的，本发明提供一种预测模型生成方法，所述预测模型用于供水管网的流量预测，所述供水管网包含多个节点，所述模型训练方法包括：

获取所有所述节点的拓扑结构图像和每个所述节点的多个历史流量值；

根据所述拓扑结构图像构建邻接矩阵；

根据每个所述节点的多个历史流量值构建特征矩阵，并根据所述特征矩阵处理得到训练集和测试集；

根据训练集和所述邻接矩阵，采用简化图卷积神经网络和长短期记忆网络进行训练，得到初始预测模型；

将测试集输入训练后的所述初始预测模型，并进行精度的评估；

若评估的结果为精度达标，则所述初始预测模型即为预测模型。

在本发明一实施例中，所述根据所述拓扑结构图像构建邻接矩阵的步骤包括：

按照所述节点的数量确定所述邻接矩阵的行数和列数；

根据所述拓扑结构图像中各个节点间的连接关系，构建所述邻接矩阵。

在本发明一实施例中，所述根据每个所述节点的多个历史流量值构建特征矩阵，并根据所述特征矩阵处理得到训练集和测试集的步骤包括：

构建所述特征矩阵：所述特征矩阵的行数为所述供水网的节点的数量；列数为针对每个节点的所述历史流量值的采集数量；元素为历史流量值；对所述特征矩阵进行归一化处理；

将归一化处理后的所述特征矩阵分为训练集和测试集。

在本发明一实施例中，所述初始预测模型包括简化图卷积神经网络、长短期记忆网络和全连接层；

所述根据训练集和所述邻接矩阵，采用简化图卷积神经网络和长短期记忆网络进行训练，得到初始预测模型的步骤包括：

将训练集和所述邻接矩阵输入简化图卷积神经网络；

根据邻接矩阵，简化图卷积神经网络采用如下公式处理得到度矩阵；

其中：

表示所述度矩阵；i表示所述邻接矩阵中的行数；j表示所述邻接矩阵中的列数；A表示所述邻接矩阵；I_N表示单位矩阵；

根据所述度矩阵，简化图卷积神经网络采用如下公式处理得到带有空间特征的历史流量值：

其中：f(x)表示带有空间特征的历史流量值；X表示归一化后的所述特征矩阵中的训练集；θ₁表示第一层简化图卷积神经网络的权重矩阵；θ₂表示第二层简化图卷积神经网络的权重矩阵；θ₃表示第三层简化图卷积神经网络的权重矩阵；

将带有空间特征的历史流量值通过激活函数，激活函数采用如下公式对带有空间特征的历史流量值进行处理：

其中：

表示经激活函数处理后的带有空间特征的历史流量值；σ表示tanh激活函数；θ为可学习的权重矩阵；

将经激活函数处理后的带有空间特征的历史流量值输入长短期记忆网络，得到带有时间特征和空间特征的历史流量值；

将带有时间特征和空间特征的历史流量值输入全连接层，以进行所述初始预测模型的训练。

在本发明一实施例中，采用均方根误差、平均绝对百分比误差、平均绝对误差中的至少一种作为精度的评估的标准。

在本发明一实施例中，所述将测试集输入训练后的所述神经网络模型，并对所述神经网络模型进行精度的评估的步骤还包括：

若评估的结果为精度不达标，则继续根据所述训练集和所述邻接矩阵进行神经网络模型的训练。

本发明还公开了一种预测模型生成系统，采用上述预测模型生成方法，所述预测模型生成系统包括：

获取模块，用于获取所有所述节点的拓扑结构图像和每个所述节点的多个历史流量值；

邻接矩阵构建模块，用于根据所述拓扑结构图像构建邻接矩阵；

特征矩阵构建模块，用于根据每个所述节点的多个历史流量值构建特征矩阵，并根据所述特征矩阵处理得到训练集和测试集；

模型训练模块，用于根据训练集和所述邻接矩阵，对基于简化图卷积神经网络和长短期记忆网络的神经网络模型进行训练；

模型评估模块，用于将测试集输入训练后的所述神经网络模型，并对所述神经网络模型进行精度的评估；

若评估的结果为精度达标，则表示当前的神经网络模型训练完成。

本发明还公开了一种预测模型生成设备，包括处理器，所述处理器和存储器耦合，所述存储器存储有程序指令，当所述存储器存储的程序指令被所述处理器执行时实现上述预测模型生成方法。

本发明还公开了一种计算机可读的存储介质，包括程序，当其在计算机上运行时，使得计算机执行上述预测模型生成方法。

本发明还公开了一种预测方法，用于供水管网的流量预测，采用上述预测模型生成方法得到的预测模型，所述流量预测方法包括：

实时采集所述供水管网中所有节点的流量值；

将所有所述流量值输入所述预测模型，得到所有所述节点下一时刻的预测流量值。

综上所述，本发明提供的预测模型生成方法、系统、设备、存储介质及预测方法能够同时进行多个节点的流量预测；综合考虑了供水管网中节点间的拓扑结构信息以及节点的属性信息；通过提取供水管网的节点流量数据的空间特征和时间特征，达到了更好的预测效果；对训练得到的初始预测模型进行精度评估，从而使得最终得到的预测模型得到预测流量值更加准确。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1显示为本发明的预测模型生成方法的系统流程图。

图2显示为本发明的预测模型生成系统的结构示意图。

图3显示为本发明的预测模型生成设备的结构示意图。

图4显示为本发明的以均方根误差和平均绝对误差为评估标准，初始预测模型与多种现有模型在1小时后的预测流量值和实际流量值的误差评估数据的柱状对比图。

图5显示为本发明的以平均绝对百分比误差为评估标准，初始预测模型与多种现有模型在1小时后和2小时后的预测流量值和实际流量值的误差评估数据的折线对比图。

元件标号说明

100、预测模型生成系统；

110、获取模块；

120、邻接矩阵构建模块；

130、特征矩阵构建模块；

140、模型训练模块；

150、模型评估模块；

200、预测模型生成设备；

210、处理器；

220、存储器。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其它优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。还应当理解，本发明实施例中使用的术语是为了描述特定的具体实施方案，而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法，通常按照常规条件，或者按照各制造商所建议的条件。

请参阅图1至图5。须知，本说明书附图所绘示的结构、比例、大小等，均仅用以配合说明书所揭示的内容，以供熟悉此技术的人士了解与阅读，并非用以限定本发明可实施的限定条件，故不具技术上的实质意义，任何结构的修饰、比例关系的改变或大小的调整，在不影响本发明所能产生的功效及所能达成的目的下，均应仍落在本发明所揭示的技术内容所能涵盖的范围内。同时，本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语，亦仅为便于叙述的明了，而非用以限定本发明可实施的范围，其相对关系的改变或调整，在无实质变更技术内容下，当亦视为本发明可实施的范畴。

当实施例给出数值范围时，应理解，除非本发明另有说明，每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义，本发明中使用的所有技术和科学术语与本技术领域的技术人员对现有技术的掌握及本发明的记载，还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。

供水管网是向用户输水和配水的管道系统，由管道、配件和附属设施组成；在供水管网的拓扑结构图像中，采用不同粗细的线条来表示管道，管道的分支点或交汇点一般统一称为节点。

请参阅图1，显示为本实施例中的一种预测模型生成方法，生成的预测模型用于供水管网的流量预测，供水管网包含多个节点，模型训练方法包括：

步骤S10、获取所有节点的拓扑结构图像和每个节点的多个历史流量值；

首先，获取供水管网中包含所有管道连接关系和节点设置位置的拓扑结构图，并在每个节点，按照一预设的采集频率进行流量值采样，优选的，按照每小时一次的采集频率采集每个节点的t个流量值，作为历史流量值。

步骤S20、根据拓扑结构图像构建邻接矩阵；

具体的：

按照节点的数量确定邻接矩阵的行数和列数；根据拓扑结构图像中各个节点间的连接关系，构建邻接矩阵。

优选的，当拓扑结构图像中包含了n个节点时，构建出的邻接矩阵的行数和列数均为n，进一步的，根据拓扑结构图像中各个节点间的连接关系确定该邻接矩阵中每个位置的元素，例如：当第i个节点和第j个节点间存在管道连接关系时，邻接矩阵中(i，j)处的元素为1，当第i个节点和第j个节点不存在管道连接关系时，邻接矩阵中(i，j)处的元素为0；邻接矩阵中(i，i)处的元素均为0。

步骤S30、根据每个节点的多个历史流量值构建特征矩阵，并根据特征矩阵处理得到训练集和测试集；

具体的：

构建特征矩阵：特征矩阵的行数为供水管网的节点的数量；列数为针对每个节点的历史流量值的采集数量；元素为历史流量值；对特征矩阵进行归一化处理；将归一化处理后的特征矩阵分为训练集和测试集。

优选的，当拓扑结构图像中包含了n个节点时，构建出的特征矩阵的行数为n行；当每个节点采集了t个历史流量值时，构建出的特征矩阵的列数为t列；进一步的，根据每个节点的多个历史流量值确定该邻接矩阵中每个位置的元素，例如：特征矩阵中(i，j)处的元素，即为第i个节点的第j个历史流量值。

针对特征矩阵中的每一列，将每个元素除以该行所有元素的平方和，并求开方，得到归一化后的特征矩阵的元素。

归一化后得到的特征矩阵中的元素作为训练预测模型的输入，其中，针对每个节点，将多个列中的元素作为训练集，将其余列的元素作为测试集。

步骤S40、根据训练集和邻接矩阵，采用简化图卷积神经网络和长短期记忆网络进行训练，得到初始预测模型；

初始预测模型包括简化图卷积神经网络、长短期记忆网络和全连接层。

则步骤S40包括：

将训练集和邻接矩阵输入简化图卷积神经网络；

其中：

表示度矩阵；i表示邻接矩阵中的行数；j表示邻接矩阵中的列数；A表示邻接矩阵；I_N表示单位矩阵；

根据度矩阵，简化图卷积神经网络采用如下公式处理得到带有空间特征的历史流量值：

其中：f(x)表示带有空间特征的历史流量值；X表示归一化后的特征矩阵中的训练集；θ₁表示第一层简化图卷积神经网络的权重矩阵；θ₂表示第二层简化图卷积神经网络的权重矩阵；θ₃表示第三层简化图卷积神经网络的权重矩阵；

其中：

将带有时间特征和空间特征的历史流量值输入全连接层，以进行初始预测模型的训练。

具体的：

在本实施例中，简化图卷积神经网络将拓扑结构图像用于深度学习，拓扑结构图像通常是由有限的非空节点集和节点之间的边集组成的，通常表示为G(V，E，A)，其中，G表示拓扑结构图像，V中的元素表示节点，E中的元素表示节点间的边，A表示邻接矩阵。

本实施例中的简化图卷积神经网络是在傅里叶域进行的，针对拓扑结构图像，采用如下公式处理得到对应的拉普拉斯矩阵：

L(G)＝D-A

其中，L(G)表示拉普拉斯矩阵；D为所有节点构成的度矩阵。

具体的，在度矩阵D中，D_ij＝∑_jA_ij。

则采用如下公式表示标准化后的拉普拉斯矩阵：

其中，

表示标准化后的拉普拉斯矩阵；I_N为单位矩阵；

标准化后的拉普拉斯矩阵是一个实对称半正定矩阵，从而采用如下公式进行分解：

其中，U＝[U₀,U₁,U₂,…,U_n-1]表示分解后的，标准化后的拉普拉斯矩阵的特征向量所构成的矩阵；Λ＝diag[λ₀,λ₁,λ₂,…,λ_n-1]表示分解后的，对应的特征值构成的对角矩阵；U^T为U的转置矩阵。

基于频谱的图卷积可定义为信号和滤波器在傅里叶域的乘积。直观上，图卷积操作可以看作是将空间域的拓扑结构图像表示的信号变换到频域，对频域属性进行滤波，然后恢复到原始的空间域中，从而完成图信号的降噪和特征提取功能；切比雪夫频谱卷积网络是由对角矩阵Λ的切比雪夫多项式组成的，因此可以采用一阶切比雪夫多项式进行近似计算，则采用如下公式表示：

其中，g_θ表示卷积核，θ表示可学习的权重矩阵。

进一步的，为了避免重复相乘操作导致数值不稳定，梯度爆炸等问题，令

以示矩阵中添加了自连接的邻接矩阵；同样的，令

本实施例中，的简化图卷积神经网络通过节点的一阶邻域捕获节点之间的空间特征，然后叠加多层简化图卷积神经网络，则采用如下公式表示：

其中，H表示简化图卷积神经网络的输出，l表示简化图卷积神经网络的层数。

优选的，采用三层简化图卷积神经网络捕获训练集的空间特征，则采用如下公式表示从训练集中得到的带有空间特征的历史流量值数据：

其中，f(x)表示带有空间特征的历史流量值数据；

采用一层简化图卷积神经网络的权重矩阵θ代替三层简化图卷积神经网络的权重矩阵θ₁、θ₂、θ₃，并在多个简化图卷积神经网络后加上一层激活函数，则三层简化图卷积神经网络最后得到的输出为：

其中，

表示最后得到的输出。

在该实施例中，还设置有编码层和解码层，编码层和解码层均包含一层长短期记忆网络(Long Short-Term Memory，LSTM)和一层Dropout，上述

作为编码层的输入，优选的，编码层和解码层中LSTM的神经元个数均为200个，Dropout的参数均为0.1，则编码层中LSTM采用如下公式处理得到相应的输出：

其中，σ为sigmod函数；i为输入门的输出；f为忘记门的输出值；o为输出门的输出值；t为当前节点；t-1为上一个节点；h为LSTM网络的输出；b_i为LSTM网络输入门的偏置；b_f为LSTM网络忘记门的偏置；b_o为LSTM网络输出门的偏置；W为LSTM中的权重矩阵；

为tanh函数；

为LSTM网络隐藏层的输出值；

为LSTM网络隐藏层的偏置；c为t节点的元胞状态。

解码层的LSTM将编码层的输出作为输入，处理过程与编码层的LSTM相同，解码层的输出即为带有时间特征和空间特征的历史流量值，将解码层的输出作为全连接层的输入，得到相应的预测流量值，到此为进行初始预测模型训练的完整过程。

步骤S50、将测试集输入训练后的初始预测模型，并进行精度的评估；

将测试集输入初始预测模型并进行精度评估。

具体的，计算得到初始预测模型的误差评估数据，优选的，可以采用均方根误差、平均绝对百分比误差、平均绝对误差中的至少一种作为精度的评估的标准。

其中：

平均绝对误差的取值范围在[0，+∞)，取值越接近0，表示得到的初始预测模型误差越小，相反的，则表示初始预测模型误差越大，采用如下公式得到平均绝对误差：

均方根误差的取值范围在[0，+∞)，取值越接近0，表示得到的初始预测模型误差越小，相反的，则表示初始预测模型误差越大，采用如下公式得到均方根误差：

平均绝对百分比误差的取值范围在[0，+∞)，取值越接近0，表示得到的初始预测模型误差越小，相反的，则表示初始预测模型误差越大，采用如下公式得到平均绝对百分比误差：

其中，MAE表示平均绝对误差，RMSE表示均方根误差，MAPE表示平均绝对百分比误差，

表示测试集中第i个样本的预测流量值，y_i表示测试集中第i个样本的真实流量值，即输入的历史流量值；n为测试集的样本数量。

优选的，可以设置一误差阈值，当最终的误差评估数据达到误差阈值时，评估的结果为精度达标，当最终的误差评估数据未达到误差阈值时，评估的结果为精度不达标；

若评估的结果为精度不达标，则继续根据训练集和邻接矩阵进行神经网络模型的训练。

若评估的结果为精度达标，则初始预测模型即为预测模型。

根据训练集和测试集，通过Arima模型、SVR模型、GRU模型、LSTM模型和本实施例中的初始预测模型计算得到的平均绝对误差、均方根误差、平均绝对百分比误差的对比如表1所示：

表1误差对比表

请参阅图4，显示为本实施例中以均方根误差和平均绝对误差为评估标准，初始预测模型与Arima模型、SVR模型、GRU模型、LSTM模型分别得出的一小时后的预测流量值与实际流量值的误差评估数据的柱状对比图。

请参阅图5，显示为本实施例中以平均绝对百分比误差为评估标准，初始预测模型与Arima模型、SVR模型、GRU模型、LSTM模型分别得出的，一小时后和两小时后的预测流量值与实际流量值的误差评估数据的折线对比图，在图5中，MAPE 1h_prediction指的是以平均绝对百分比误差为评估标准，得到的一小时后的预测流量值与实际流量值的误差评估数据；MAPE 2h_prediction指的是以平均绝对百分比误差为评估标准，得到的两小时后的预测流量值与实际流量值的误差评估数据。

请参阅图2，本实施例还提供了一种预测模型生成系统100，采用上述预测模型生成方法，包括：

获取模块110，用于获取所有节点的拓扑结构图像和每个节点的多个历史流量值；

邻接矩阵构建模块120，用于根据拓扑结构图像构建邻接矩阵；

特征矩阵构建模块130，用于根据每个节点的多个历史流量值构建特征矩阵，并根据特征矩阵处理得到训练集和测试集；

模型训练模块140，用于根据训练集和邻接矩阵，对基于简化图卷积神经网络和长短期记忆网络的神经网络模型进行训练；

模型评估模块150，用于将测试集输入训练后的神经网络模型，并对神经网络模型进行精度的评估；

请参阅图3，本实施例还提出了一种预测模型生成设备200，该目标轮廓提取设备200包括处理器210和存储器220，处理器210和存储器220耦合，存储器220存储有程序指令，当存储器220存储的程序指令被处理器210执行时实现上述预测模型生成方法。处理器210可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital SignalProcessing，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件；所述存储器220可能包含随机存取存储器(Random Access Memory，简称RAM)，也可能还包括非易失性存储器(Non-VolatileMemory)，例如至少一个磁盘存储器。所述存储器220也可以为随机存取存储器(RandomAccess Memory，RAM)类型的内部存储器，所述处理器210、存储器220可以集成为一个或多个独立的电路或硬件，如：专用集成电路(Application Specific Integrated Circuit，ASIC)。需要说明的是，上述的存储器520中的计算机程序可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，电子设备，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。

本实施例还提出一种计算机可读的存储介质，所述存储介质存储有计算机指令，所述计算机指令用于使计算机执行上述的预测模型生成方法。存储介质可以是电子介质、磁介质、光介质、电磁介质、红外介质或半导体系统或传播介质。存储介质还可以包括半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘可以包括光盘-只读存储器(CD-ROM)、光盘-读/写(CD-RW)和DVD。

本实施例还提供了一种预测方法，用于供水管网的流量预测，采用上述预测模型生成方法得到的预测模型，包括：

实时采集供水管网中所有节点的流量值；

将所有流量值输入预测模型，得到所有节点下一时刻的预测流量值。

具体的，在实际使用过程中，需将全连接层的输出进行反归一化，以得到最终的预测流量值。

综上所述，本发明提供的预测模型生成方法、系统、设备、存储介质及预测方法能够同时进行多个节点的流量预测；综合考虑了供水管网中节点间的拓扑结构信息以及节点的属性信息；通过提取供水管网的节点流量数据的空间特征和时间特征，达到了更好的预测效果；对训练得到的初始预测模型进行精度评估，从而使得最终得到的预测模型得到预测流量值更加准确。所以，本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。