CN113240187A - 预测模型生成方法、系统、设备、存储介质及预测方法 - Google Patents
预测模型生成方法、系统、设备、存储介质及预测方法 Download PDFInfo
- Publication number
- CN113240187A CN113240187A CN202110579718.0A CN202110579718A CN113240187A CN 113240187 A CN113240187 A CN 113240187A CN 202110579718 A CN202110579718 A CN 202110579718A CN 113240187 A CN113240187 A CN 113240187A
- Authority
- CN
- China
- Prior art keywords
- matrix
- prediction model
- neural network
- nodes
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 239000011159 matrix material Substances 0.000 claims abstract description 138
- 238000012549 training Methods 0.000 claims abstract description 54
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 44
- 230000015654 memory Effects 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims abstract description 27
- 238000011156 evaluation Methods 0.000 claims abstract description 26
- 238000013528 artificial neural network Methods 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims description 20
- 238000003062 neural network model Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 16
- 238000013527 convolutional neural network Methods 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 230000006403 short-term memory Effects 0.000 claims description 7
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 4
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了预测模型生成方法、系统、设备、存储介质及预测方法,用于包含多个节点的供水管网的流量预测,预测模型生成方法包括:获取所有节点的拓扑结构图像和多个历史流量值;构建邻接矩阵和特征矩阵,并得到训练集和测试集;采用简化图卷积神经网络和长短期记忆网络进行模型的训练,得到初始预测模型;将测试集输入训练后的初始预测模型,进行精度的评估;若精度达标,则初始预测模型即为预测模型。本发明提供的预测模型生成方法、系统、设备、存储介质及预测方法能够同时进行多个节点的流量预测;通过提取供水管网的节点流量数据的空间特征和时间特征,以及对初始预测模型进行精度评估,使得最终的预测模型得到的预测流量值更加准确。
Description
技术领域
本发明涉及流量预测技术领域,特别是涉及预测模型生成方法、系统、设备、存储介质及预测方法。
背景技术
供水管网作为城市供水系统的关键组成部分,是连接用户与水资源的纽带,担负着输水、配水的重要任务,供水管网被誉为城市的“生命线”,保障供水管网的正常工作对保证国民经济发展、保障居民日常生活都有着举足轻重的作用;随着城市供水规模的不断扩大,供水管网运行的效率、水力和水质的安全稳定也受到越来越多的挑战,因此需要对供水管网的流量进行预测,以预防故障发生。
近年来,随着智慧水务的发展,供水管网的基础信息与运行监测数据得到不断完善,在智慧城市建设的语境下,人工智能技术为传统供水管网流量预测提供了新的解决思路,然而,常见的时间序列预测方法如自回归模型、自回归移动平均模型、灰色预测等都无法学习到时序数据的非线性特征;机器学习算法如支持向量机又容易收敛于局部最优;进一步的,为了提高预测结果的准确度,深度学习也被广泛使用,而现有的供水管网流量预测方法虽然能在结果上取得了不错的效果,但大多是基于单个流量节点进行预测,只考虑了数据时间维度的属性特性,而忽略了节点与节点之间的相关性,即供水管网流量数据的空间特征。
综上,现有技术中的供水管网预测方法存在只能基于单个流量节点进行预测、忽略供水管网流量数据的空间特征等问题。
发明内容
鉴于以上现有技术的缺点,本发明的目的在于提供预测模型生成方法、系统、设备、存储介质及预测方法,以改善现有技术中的只能基于单个流量节点进行预测、忽略供水管网流量数据的空间特征等技术问题。
为实现上述目的及其他相关目的,本发明提供一种预测模型生成方法,所述预测模型用于供水管网的流量预测,所述供水管网包含多个节点,所述模型训练方法包括:
获取所有所述节点的拓扑结构图像和每个所述节点的多个历史流量值;
根据所述拓扑结构图像构建邻接矩阵;
根据每个所述节点的多个历史流量值构建特征矩阵,并根据所述特征矩阵处理得到训练集和测试集;
根据训练集和所述邻接矩阵,采用简化图卷积神经网络和长短期记忆网络进行训练,得到初始预测模型;
将测试集输入训练后的所述初始预测模型,并进行精度的评估;
若评估的结果为精度达标,则所述初始预测模型即为预测模型。
在本发明一实施例中,所述根据所述拓扑结构图像构建邻接矩阵的步骤包括:
按照所述节点的数量确定所述邻接矩阵的行数和列数;
根据所述拓扑结构图像中各个节点间的连接关系,构建所述邻接矩阵。
在本发明一实施例中,所述根据每个所述节点的多个历史流量值构建特征矩阵,并根据所述特征矩阵处理得到训练集和测试集的步骤包括:
构建所述特征矩阵:所述特征矩阵的行数为所述供水网的节点的数量;列数为针对每个节点的所述历史流量值的采集数量;元素为历史流量值;对所述特征矩阵进行归一化处理;
将归一化处理后的所述特征矩阵分为训练集和测试集。
在本发明一实施例中,所述初始预测模型包括简化图卷积神经网络、长短期记忆网络和全连接层;
所述根据训练集和所述邻接矩阵,采用简化图卷积神经网络和长短期记忆网络进行训练,得到初始预测模型的步骤包括:
将训练集和所述邻接矩阵输入简化图卷积神经网络;
根据邻接矩阵,简化图卷积神经网络采用如下公式处理得到度矩阵;
根据所述度矩阵,简化图卷积神经网络采用如下公式处理得到带有空间特征的历史流量值:
其中:f(x)表示带有空间特征的历史流量值;X表示归一化后的所述特征矩阵中的训练集;θ1表示第一层简化图卷积神经网络的权重矩阵;θ2表示第二层简化图卷积神经网络的权重矩阵;θ3表示第三层简化图卷积神经网络的权重矩阵;
将带有空间特征的历史流量值通过激活函数,激活函数采用如下公式对带有空间特征的历史流量值进行处理:
将经激活函数处理后的带有空间特征的历史流量值输入长短期记忆网络,得到带有时间特征和空间特征的历史流量值;
将带有时间特征和空间特征的历史流量值输入全连接层,以进行所述初始预测模型的训练。
在本发明一实施例中,采用均方根误差、平均绝对百分比误差、平均绝对误差中的至少一种作为精度的评估的标准。
在本发明一实施例中,所述将测试集输入训练后的所述神经网络模型,并对所述神经网络模型进行精度的评估的步骤还包括:
若评估的结果为精度不达标,则继续根据所述训练集和所述邻接矩阵进行神经网络模型的训练。
本发明还公开了一种预测模型生成系统,采用上述预测模型生成方法,所述预测模型生成系统包括:
获取模块,用于获取所有所述节点的拓扑结构图像和每个所述节点的多个历史流量值;
邻接矩阵构建模块,用于根据所述拓扑结构图像构建邻接矩阵;
特征矩阵构建模块,用于根据每个所述节点的多个历史流量值构建特征矩阵,并根据所述特征矩阵处理得到训练集和测试集;
模型训练模块,用于根据训练集和所述邻接矩阵,对基于简化图卷积神经网络和长短期记忆网络的神经网络模型进行训练;
模型评估模块,用于将测试集输入训练后的所述神经网络模型,并对所述神经网络模型进行精度的评估;
若评估的结果为精度达标,则表示当前的神经网络模型训练完成。
本发明还公开了一种预测模型生成设备,包括处理器,所述处理器和存储器耦合,所述存储器存储有程序指令,当所述存储器存储的程序指令被所述处理器执行时实现上述预测模型生成方法。
本发明还公开了一种计算机可读的存储介质,包括程序,当其在计算机上运行时,使得计算机执行上述预测模型生成方法。
本发明还公开了一种预测方法,用于供水管网的流量预测,采用上述预测模型生成方法得到的预测模型,所述流量预测方法包括:
实时采集所述供水管网中所有节点的流量值;
将所有所述流量值输入所述预测模型,得到所有所述节点下一时刻的预测流量值。
综上所述,本发明提供的预测模型生成方法、系统、设备、存储介质及预测方法能够同时进行多个节点的流量预测;综合考虑了供水管网中节点间的拓扑结构信息以及节点的属性信息;通过提取供水管网的节点流量数据的空间特征和时间特征,达到了更好的预测效果;对训练得到的初始预测模型进行精度评估,从而使得最终得到的预测模型得到预测流量值更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1显示为本发明的预测模型生成方法的系统流程图。
图2显示为本发明的预测模型生成系统的结构示意图。
图3显示为本发明的预测模型生成设备的结构示意图。
图4显示为本发明的以均方根误差和平均绝对误差为评估标准,初始预测模型与多种现有模型在1小时后的预测流量值和实际流量值的误差评估数据的柱状对比图。
图5显示为本发明的以平均绝对百分比误差为评估标准,初始预测模型与多种现有模型在1小时后和2小时后的预测流量值和实际流量值的误差评估数据的折线对比图。
元件标号说明
100、预测模型生成系统;
110、获取模块;
120、邻接矩阵构建模块;
130、特征矩阵构建模块;
140、模型训练模块;
150、模型评估模块;
200、预测模型生成设备;
210、处理器;
220、存储器。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其它优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。下列实施例中未注明具体条件的试验方法,通常按照常规条件,或者按照各制造商所建议的条件。
请参阅图1至图5。须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容所能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、“右”、“中间”及“一”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
当实施例给出数值范围时,应理解,除非本发明另有说明,每个数值范围的两个端点以及两个端点之间任何一个数值均可选用。除非另外定义,本发明中使用的所有技术和科学术语与本技术领域的技术人员对现有技术的掌握及本发明的记载,还可以使用与本发明实施例中所述的方法、设备、材料相似或等同的现有技术的任何方法、设备和材料来实现本发明。
供水管网是向用户输水和配水的管道系统,由管道、配件和附属设施组成;在供水管网的拓扑结构图像中,采用不同粗细的线条来表示管道,管道的分支点或交汇点一般统一称为节点。
请参阅图1,显示为本实施例中的一种预测模型生成方法,生成的预测模型用于供水管网的流量预测,供水管网包含多个节点,模型训练方法包括:
步骤S10、获取所有节点的拓扑结构图像和每个节点的多个历史流量值;
首先,获取供水管网中包含所有管道连接关系和节点设置位置的拓扑结构图,并在每个节点,按照一预设的采集频率进行流量值采样,优选的,按照每小时一次的采集频率采集每个节点的t个流量值,作为历史流量值。
步骤S20、根据拓扑结构图像构建邻接矩阵;
具体的:
按照节点的数量确定邻接矩阵的行数和列数;根据拓扑结构图像中各个节点间的连接关系,构建邻接矩阵。
优选的,当拓扑结构图像中包含了n个节点时,构建出的邻接矩阵的行数和列数均为n,进一步的,根据拓扑结构图像中各个节点间的连接关系确定该邻接矩阵中每个位置的元素,例如:当第i个节点和第j个节点间存在管道连接关系时,邻接矩阵中(i,j)处的元素为1,当第i个节点和第j个节点不存在管道连接关系时,邻接矩阵中(i,j)处的元素为0;邻接矩阵中(i,i)处的元素均为0。
步骤S30、根据每个节点的多个历史流量值构建特征矩阵,并根据特征矩阵处理得到训练集和测试集;
具体的:
构建特征矩阵:特征矩阵的行数为供水管网的节点的数量;列数为针对每个节点的历史流量值的采集数量;元素为历史流量值;对特征矩阵进行归一化处理;将归一化处理后的特征矩阵分为训练集和测试集。
优选的,当拓扑结构图像中包含了n个节点时,构建出的特征矩阵的行数为n行;当每个节点采集了t个历史流量值时,构建出的特征矩阵的列数为t列;进一步的,根据每个节点的多个历史流量值确定该邻接矩阵中每个位置的元素,例如:特征矩阵中(i,j)处的元素,即为第i个节点的第j个历史流量值。
针对特征矩阵中的每一列,将每个元素除以该行所有元素的平方和,并求开方,得到归一化后的特征矩阵的元素。
归一化后得到的特征矩阵中的元素作为训练预测模型的输入,其中,针对每个节点,将多个列中的元素作为训练集,将其余列的元素作为测试集。
步骤S40、根据训练集和邻接矩阵,采用简化图卷积神经网络和长短期记忆网络进行训练,得到初始预测模型;
初始预测模型包括简化图卷积神经网络、长短期记忆网络和全连接层。
则步骤S40包括:
将训练集和邻接矩阵输入简化图卷积神经网络;
根据邻接矩阵,简化图卷积神经网络采用如下公式处理得到度矩阵;
根据度矩阵,简化图卷积神经网络采用如下公式处理得到带有空间特征的历史流量值:
其中:f(x)表示带有空间特征的历史流量值;X表示归一化后的特征矩阵中的训练集;θ1表示第一层简化图卷积神经网络的权重矩阵;θ2表示第二层简化图卷积神经网络的权重矩阵;θ3表示第三层简化图卷积神经网络的权重矩阵;
将带有空间特征的历史流量值通过激活函数,激活函数采用如下公式对带有空间特征的历史流量值进行处理:
将经激活函数处理后的带有空间特征的历史流量值输入长短期记忆网络,得到带有时间特征和空间特征的历史流量值;
将带有时间特征和空间特征的历史流量值输入全连接层,以进行初始预测模型的训练。
具体的:
在本实施例中,简化图卷积神经网络将拓扑结构图像用于深度学习,拓扑结构图像通常是由有限的非空节点集和节点之间的边集组成的,通常表示为G(V,E,A),其中,G表示拓扑结构图像,V中的元素表示节点,E中的元素表示节点间的边,A表示邻接矩阵。
本实施例中的简化图卷积神经网络是在傅里叶域进行的,针对拓扑结构图像,采用如下公式处理得到对应的拉普拉斯矩阵:
L(G)=D-A
其中,L(G)表示拉普拉斯矩阵;D为所有节点构成的度矩阵。
具体的,在度矩阵D中,Dij=∑jAij。
则采用如下公式表示标准化后的拉普拉斯矩阵:
标准化后的拉普拉斯矩阵是一个实对称半正定矩阵,从而采用如下公式进行分解:
其中,U=[U0,U1,U2,…,Un-1]表示分解后的,标准化后的拉普拉斯矩阵的特征向量所构成的矩阵;Λ=diag[λ0,λ1,λ2,…,λn-1]表示分解后的,对应的特征值构成的对角矩阵;UT为U的转置矩阵。
基于频谱的图卷积可定义为信号和滤波器在傅里叶域的乘积。直观上,图卷积操作可以看作是将空间域的拓扑结构图像表示的信号变换到频域,对频域属性进行滤波,然后恢复到原始的空间域中,从而完成图信号的降噪和特征提取功能;切比雪夫频谱卷积网络是由对角矩阵Λ的切比雪夫多项式组成的,因此可以采用一阶切比雪夫多项式进行近似计算,则采用如下公式表示:
其中,gθ表示卷积核,θ表示可学习的权重矩阵。
本实施例中,的简化图卷积神经网络通过节点的一阶邻域捕获节点之间的空间特征,然后叠加多层简化图卷积神经网络,则采用如下公式表示:
其中,H表示简化图卷积神经网络的输出,l表示简化图卷积神经网络的层数。
优选的,采用三层简化图卷积神经网络捕获训练集的空间特征,则采用如下公式表示从训练集中得到的带有空间特征的历史流量值数据:
其中,f(x)表示带有空间特征的历史流量值数据;
采用一层简化图卷积神经网络的权重矩阵θ代替三层简化图卷积神经网络的权重矩阵θ1、θ2、θ3,并在多个简化图卷积神经网络后加上一层激活函数,则三层简化图卷积神经网络最后得到的输出为:
在该实施例中,还设置有编码层和解码层,编码层和解码层均包含一层长短期记忆网络(Long Short-Term Memory,LSTM)和一层Dropout,上述作为编码层的输入,优选的,编码层和解码层中LSTM的神经元个数均为200个,Dropout的参数均为0.1,则编码层中LSTM采用如下公式处理得到相应的输出:
其中,σ为sigmod函数;i为输入门的输出;f为忘记门的输出值;o为输出门的输出值;t为当前节点;t-1为上一个节点;h为LSTM网络的输出;bi为LSTM网络输入门的偏置;bf为LSTM网络忘记门的偏置;bo为LSTM网络输出门的偏置;W为LSTM中的权重矩阵;为tanh函数;为LSTM网络隐藏层的输出值;为LSTM网络隐藏层的偏置;c为t节点的元胞状态。
解码层的LSTM将编码层的输出作为输入,处理过程与编码层的LSTM相同,解码层的输出即为带有时间特征和空间特征的历史流量值,将解码层的输出作为全连接层的输入,得到相应的预测流量值,到此为进行初始预测模型训练的完整过程。
步骤S50、将测试集输入训练后的初始预测模型,并进行精度的评估;
将测试集输入初始预测模型并进行精度评估。
具体的,计算得到初始预测模型的误差评估数据,优选的,可以采用均方根误差、平均绝对百分比误差、平均绝对误差中的至少一种作为精度的评估的标准。
其中:
平均绝对误差的取值范围在[0,+∞),取值越接近0,表示得到的初始预测模型误差越小,相反的,则表示初始预测模型误差越大,采用如下公式得到平均绝对误差:
均方根误差的取值范围在[0,+∞),取值越接近0,表示得到的初始预测模型误差越小,相反的,则表示初始预测模型误差越大,采用如下公式得到均方根误差:
平均绝对百分比误差的取值范围在[0,+∞),取值越接近0,表示得到的初始预测模型误差越小,相反的,则表示初始预测模型误差越大,采用如下公式得到平均绝对百分比误差:
其中,MAE表示平均绝对误差,RMSE表示均方根误差,MAPE表示平均绝对百分比误差,表示测试集中第i个样本的预测流量值,yi表示测试集中第i个样本的真实流量值,即输入的历史流量值;n为测试集的样本数量。
优选的,可以设置一误差阈值,当最终的误差评估数据达到误差阈值时,评估的结果为精度达标,当最终的误差评估数据未达到误差阈值时,评估的结果为精度不达标;
若评估的结果为精度不达标,则继续根据训练集和邻接矩阵进行神经网络模型的训练。
若评估的结果为精度达标,则初始预测模型即为预测模型。
根据训练集和测试集,通过Arima模型、SVR模型、GRU模型、LSTM模型和本实施例中的初始预测模型计算得到的平均绝对误差、均方根误差、平均绝对百分比误差的对比如表1所示:
表1误差对比表
请参阅图4,显示为本实施例中以均方根误差和平均绝对误差为评估标准,初始预测模型与Arima模型、SVR模型、GRU模型、LSTM模型分别得出的一小时后的预测流量值与实际流量值的误差评估数据的柱状对比图。
请参阅图5,显示为本实施例中以平均绝对百分比误差为评估标准,初始预测模型与Arima模型、SVR模型、GRU模型、LSTM模型分别得出的,一小时后和两小时后的预测流量值与实际流量值的误差评估数据的折线对比图,在图5中,MAPE 1h_prediction指的是以平均绝对百分比误差为评估标准,得到的一小时后的预测流量值与实际流量值的误差评估数据;MAPE 2h_prediction指的是以平均绝对百分比误差为评估标准,得到的两小时后的预测流量值与实际流量值的误差评估数据。
请参阅图2,本实施例还提供了一种预测模型生成系统100,采用上述预测模型生成方法,包括:
获取模块110,用于获取所有节点的拓扑结构图像和每个节点的多个历史流量值;
邻接矩阵构建模块120,用于根据拓扑结构图像构建邻接矩阵;
特征矩阵构建模块130,用于根据每个节点的多个历史流量值构建特征矩阵,并根据特征矩阵处理得到训练集和测试集;
模型训练模块140,用于根据训练集和邻接矩阵,对基于简化图卷积神经网络和长短期记忆网络的神经网络模型进行训练;
模型评估模块150,用于将测试集输入训练后的神经网络模型,并对神经网络模型进行精度的评估;
若评估的结果为精度达标,则表示当前的神经网络模型训练完成。
请参阅图3,本实施例还提出了一种预测模型生成设备200,该目标轮廓提取设备200包括处理器210和存储器220,处理器210和存储器220耦合,存储器220存储有程序指令,当存储器220存储的程序指令被处理器210执行时实现上述预测模型生成方法。处理器210可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件;所述存储器220可能包含随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(Non-VolatileMemory),例如至少一个磁盘存储器。所述存储器220也可以为随机存取存储器(RandomAccess Memory,RAM)类型的内部存储器,所述处理器210、存储器220可以集成为一个或多个独立的电路或硬件,如:专用集成电路(Application Specific Integrated Circuit,ASIC)。需要说明的是,上述的存储器520中的计算机程序可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
本实施例还提出一种计算机可读的存储介质,所述存储介质存储有计算机指令,所述计算机指令用于使计算机执行上述的预测模型生成方法。存储介质可以是电子介质、磁介质、光介质、电磁介质、红外介质或半导体系统或传播介质。存储介质还可以包括半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘可以包括光盘-只读存储器(CD-ROM)、光盘-读/写(CD-RW)和DVD。
本实施例还提供了一种预测方法,用于供水管网的流量预测,采用上述预测模型生成方法得到的预测模型,包括:
实时采集供水管网中所有节点的流量值;
将所有流量值输入预测模型,得到所有节点下一时刻的预测流量值。
具体的,在实际使用过程中,需将全连接层的输出进行反归一化,以得到最终的预测流量值。
综上所述,本发明提供的预测模型生成方法、系统、设备、存储介质及预测方法能够同时进行多个节点的流量预测;综合考虑了供水管网中节点间的拓扑结构信息以及节点的属性信息;通过提取供水管网的节点流量数据的空间特征和时间特征,达到了更好的预测效果;对训练得到的初始预测模型进行精度评估,从而使得最终得到的预测模型得到预测流量值更加准确。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种预测模型生成方法,其特征在于,所述预测模型用于供水管网的流量预测,所述供水管网包含多个节点,所述模型训练方法包括:
获取所有所述节点的拓扑结构图像和每个所述节点的多个历史流量值;
根据所述拓扑结构图像构建邻接矩阵;
根据每个所述节点的多个历史流量值构建特征矩阵,并根据所述特征矩阵处理得到训练集和测试集;
根据训练集和所述邻接矩阵,采用简化图卷积神经网络和长短期记忆网络进行训练,得到初始预测模型;
将测试集输入训练后的所述初始预测模型,并进行精度的评估;
若评估的结果为精度达标,则所述初始预测模型即为预测模型。
2.根据权利要求1所述的预测模型生成方法,其特征在于,所述根据所述拓扑结构图像构建邻接矩阵的步骤包括:
按照所述节点的数量确定所述邻接矩阵的行数和列数;
根据所述拓扑结构图像中各个节点间的连接关系,构建所述邻接矩阵。
3.根据权利要求1所述的预测模型生成方法,其特征在于,所述根据每个所述节点的多个历史流量值构建特征矩阵,并根据所述特征矩阵处理得到训练集和测试集的步骤包括:
构建所述特征矩阵:所述特征矩阵的行数为所述供水网的节点的数量;列数为针对每个节点的所述历史流量值的采集数量;元素为历史流量值;
对所述特征矩阵进行归一化处理;
将归一化处理后的所述特征矩阵分为训练集和测试集。
4.根据权利要求1所述的预测模型生成方法,其特征在于,所述初始预测模型包括简化图卷积神经网络、长短期记忆网络和全连接层;
所述根据训练集和所述邻接矩阵,采用简化图卷积神经网络和长短期记忆网络进行训练,得到初始预测模型的步骤包括:
将训练集和所述邻接矩阵输入简化图卷积神经网络;
根据邻接矩阵,简化图卷积神经网络采用如下公式处理得到度矩阵;
根据所述度矩阵,简化图卷积神经网络采用如下公式处理得到带有空间特征的历史流量值:
其中:f(x)表示带有空间特征的历史流量值;X表示归一化后的所述特征矩阵中的训练集;θ1表示第一层简化图卷积神经网络的权重矩阵;θ2表示第二层简化图卷积神经网络的权重矩阵;θ3表示第三层简化图卷积神经网络的权重矩阵;
将带有空间特征的历史流量值通过激活函数,激活函数采用如下公式对带有空间特征的历史流量值进行处理:
将经激活函数处理后的带有空间特征的历史流量值输入长短期记忆网络,得到带有时间特征和空间特征的历史流量值;
将带有时间特征和空间特征的历史流量值输入全连接层,以进行所述初始预测模型的训练。
5.根据权利要求1所述的预测模型生成方法,其特征在于,采用均方根误差、平均绝对百分比误差、平均绝对误差中的至少一种作为精度的评估的标准。
6.根据权利要求1所述的预测模型生成方法,其特征在于,所述将测试集输入训练后的所述神经网络模型,并对所述神经网络模型进行精度的评估的步骤还包括:
若评估的结果为精度不达标,则继续根据所述训练集和所述邻接矩阵进行神经网络模型的训练。
7.一种预测模型生成系统,其特征在于,采用如权利要求1-6任意一项所述的预测模型生成方法,所述预测模型生成系统包括:
获取模块,用于获取所有所述节点的拓扑结构图像和每个所述节点的多个历史流量值;
邻接矩阵构建模块,用于根据所述拓扑结构图像构建邻接矩阵;
特征矩阵构建模块,用于根据每个所述节点的多个历史流量值构建特征矩阵,并根据所述特征矩阵处理得到训练集和测试集;
模型训练模块,用于根据训练集和所述邻接矩阵,对基于简化图卷积神经网络和长短期记忆网络的神经网络模型进行训练;
模型评估模块,用于将测试集输入训练后的所述神经网络模型,并对所述神经网络模型进行精度的评估;
若评估的结果为精度达标,则表示当前的神经网络模型训练完成。
8.一种预测模型生成设备,其特征在于,包括处理器,所述处理器和存储器耦合,所述存储器存储有程序指令,当所述存储器存储的程序指令被所述处理器执行时实现如权利要求1-6任意一项所述的预测模型生成方法。
9.一种计算机可读的存储介质,其特征在于,包括程序,当其在计算机上运行时,使得计算机执行如权利要求1-6任意一项所述的预测模型生成方法。
10.一种预测方法,其特征在于,用于供水管网的流量预测,采用如权利要求1-6任意一项所述的预测模型生成方法得到的预测模型,所述流量预测方法包括:
实时采集所述供水管网中所有节点的流量值;
将所有所述流量值输入所述预测模型,得到所有所述节点下一时刻的预测流量值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110579718.0A CN113240187B (zh) | 2021-05-26 | 2021-05-26 | 预测模型生成方法、系统、设备、存储介质及预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110579718.0A CN113240187B (zh) | 2021-05-26 | 2021-05-26 | 预测模型生成方法、系统、设备、存储介质及预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113240187A true CN113240187A (zh) | 2021-08-10 |
CN113240187B CN113240187B (zh) | 2022-10-11 |
Family
ID=77139187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110579718.0A Active CN113240187B (zh) | 2021-05-26 | 2021-05-26 | 预测模型生成方法、系统、设备、存储介质及预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113240187B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113743674A (zh) * | 2021-09-10 | 2021-12-03 | 中国电力科学研究院有限公司 | 基于深度学习的储能出力预测方法、系统、设备及介质 |
CN113779875A (zh) * | 2021-08-31 | 2021-12-10 | 润联软件系统(深圳)有限公司 | 基于图神经模型的风力发电量预测方法及其相关设备 |
CN113886181A (zh) * | 2021-09-30 | 2022-01-04 | 中南大学 | 应用于AIOps故障预警的动态阈值预测方法、设备及介质 |
CN114050975A (zh) * | 2022-01-10 | 2022-02-15 | 苏州浪潮智能科技有限公司 | 一种异构多节点互联拓扑生成方法和存储介质 |
CN114154716A (zh) * | 2021-12-03 | 2022-03-08 | 北京航天创智科技有限公司 | 一种基于图神经网络的企业能耗预测方法及装置 |
CN116700206A (zh) * | 2023-05-24 | 2023-09-05 | 浙江大学 | 基于多模态神经网络的工业控制系统异常检测方法及装置 |
CN117171258A (zh) * | 2023-09-07 | 2023-12-05 | 中国铁建港航局集团有限公司 | 基于gis定位ar管网信息展示方法、系统及存储介质 |
CN117370724A (zh) * | 2023-12-08 | 2024-01-09 | 广州优刻谷科技有限公司 | 一种数据异常预测模型的生成和更新方法及系统 |
CN117473144A (zh) * | 2023-12-27 | 2024-01-30 | 深圳市活力天汇科技股份有限公司 | 一种航线数据的存储方法、计算机设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190025813A1 (en) * | 2016-05-09 | 2019-01-24 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for intelligent collection and analysis of vehicle data |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN111079975A (zh) * | 2019-11-14 | 2020-04-28 | 青岛海信网络科技股份有限公司 | 一种交通数据预测方法、装置及交通工具控制方法 |
CN111130839A (zh) * | 2019-11-04 | 2020-05-08 | 清华大学 | 一种流量需求矩阵预测方法及其系统 |
-
2021
- 2021-05-26 CN CN202110579718.0A patent/CN113240187B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190025813A1 (en) * | 2016-05-09 | 2019-01-24 | Strong Force Iot Portfolio 2016, Llc | Methods and systems for intelligent collection and analysis of vehicle data |
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN111130839A (zh) * | 2019-11-04 | 2020-05-08 | 清华大学 | 一种流量需求矩阵预测方法及其系统 |
CN111079975A (zh) * | 2019-11-14 | 2020-04-28 | 青岛海信网络科技股份有限公司 | 一种交通数据预测方法、装置及交通工具控制方法 |
Non-Patent Citations (4)
Title |
---|
KAI-FUNG CHU等: "Deep Multi-Scale Convolutional LSTM Network for Travel Demand and Origin-Destination Predictions", 《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》 * |
张林等: "基于卷积神经网络的链接表示及预测方法", 《浙江大学学报(工学版)》 * |
朱凯利等: "基于图卷积神经网络的交通流量预测", 《智能计算机与应用》 * |
陈喜群等: "基于图卷积网络的路网短时交通流预测研究", 《交通运输系统工程与信息》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779875A (zh) * | 2021-08-31 | 2021-12-10 | 润联软件系统(深圳)有限公司 | 基于图神经模型的风力发电量预测方法及其相关设备 |
CN113743674A (zh) * | 2021-09-10 | 2021-12-03 | 中国电力科学研究院有限公司 | 基于深度学习的储能出力预测方法、系统、设备及介质 |
CN113886181A (zh) * | 2021-09-30 | 2022-01-04 | 中南大学 | 应用于AIOps故障预警的动态阈值预测方法、设备及介质 |
CN114154716A (zh) * | 2021-12-03 | 2022-03-08 | 北京航天创智科技有限公司 | 一种基于图神经网络的企业能耗预测方法及装置 |
CN114050975A (zh) * | 2022-01-10 | 2022-02-15 | 苏州浪潮智能科技有限公司 | 一种异构多节点互联拓扑生成方法和存储介质 |
CN116700206B (zh) * | 2023-05-24 | 2023-12-05 | 浙江大学 | 基于多模态神经网络的工业控制系统异常检测方法及装置 |
CN116700206A (zh) * | 2023-05-24 | 2023-09-05 | 浙江大学 | 基于多模态神经网络的工业控制系统异常检测方法及装置 |
CN117171258A (zh) * | 2023-09-07 | 2023-12-05 | 中国铁建港航局集团有限公司 | 基于gis定位ar管网信息展示方法、系统及存储介质 |
CN117171258B (zh) * | 2023-09-07 | 2024-04-12 | 中国铁建港航局集团有限公司 | 基于gis定位ar管网信息展示方法、系统及存储介质 |
CN117370724A (zh) * | 2023-12-08 | 2024-01-09 | 广州优刻谷科技有限公司 | 一种数据异常预测模型的生成和更新方法及系统 |
CN117370724B (zh) * | 2023-12-08 | 2024-04-16 | 广州优刻谷科技有限公司 | 一种数据异常预测模型的生成和更新方法及系统 |
CN117473144A (zh) * | 2023-12-27 | 2024-01-30 | 深圳市活力天汇科技股份有限公司 | 一种航线数据的存储方法、计算机设备及可读存储介质 |
CN117473144B (zh) * | 2023-12-27 | 2024-03-29 | 深圳市活力天汇科技股份有限公司 | 一种航线数据的存储方法、计算机设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113240187B (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113240187B (zh) | 预测模型生成方法、系统、设备、存储介质及预测方法 | |
CN110675623B (zh) | 基于混合深度学习的短时交通流量预测方法、系统、装置 | |
CN108805188B (zh) | 一种基于特征重标定生成对抗网络的图像分类方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN107992447B (zh) | 一种应用于河流水位预测数据的特征选择分解方法 | |
Wong et al. | Rainfall prediction model using soft computing technique | |
CN106022954B (zh) | 基于灰色关联度的多重bp神经网络负荷预测方法 | |
CN112350876A (zh) | 一种基于图神经网络的网络流量预测方法 | |
CN114220271A (zh) | 基于动态时空图卷积循环网络的交通流预测方法、设备及存储介质 | |
CN111027772A (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
CN113705864A (zh) | 基于VMD-CNN-BiLSTM-ATT混合模型的气象干旱预测方法及装置 | |
CN112116138A (zh) | 基于数据驱动的电力系统预测状态估计方法及系统 | |
CN115204502A (zh) | 压力预测模型的训练和预测方法、系统、设备及存储介质 | |
CN114358389A (zh) | 结合vmd分解和时间卷积网络的短期电力负荷预测方法 | |
CN113887704A (zh) | 交通信息预测方法、装置、设备及存储介质 | |
CN114006370A (zh) | 一种电力系统暂态稳定分析评估方法及系统 | |
CN111292121A (zh) | 一种基于园区画像的园区负荷预测方法及系统 | |
CN116052254A (zh) | 基于扩展卡尔曼滤波神经网络的视觉连续情感识别方法 | |
CN112668711B (zh) | 基于深度学习的洪水流量预测方法、装置和电子设备 | |
CN114282704A (zh) | 充电站充电负荷预测方法、装置、计算机设备和存储介质 | |
CN113850438A (zh) | 公共建筑能耗预测方法、系统、设备及介质 | |
CN117131991A (zh) | 基于混合神经网络的城市降雨量预测方法及平台 | |
Yang et al. | A structure optimization algorithm of neural networks for large-scale data sets | |
CN117196105A (zh) | 人数预测方法、装置、计算机设备、存储介质 | |
CN111738086A (zh) | 用于点云分割的构图方法、系统及点云分割系统、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |