CN112651665A - 一种基于图神经网络的地表水水质指标预测方法和装置 - Google Patents
一种基于图神经网络的地表水水质指标预测方法和装置 Download PDFInfo
- Publication number
- CN112651665A CN112651665A CN202110049864.2A CN202110049864A CN112651665A CN 112651665 A CN112651665 A CN 112651665A CN 202110049864 A CN202110049864 A CN 202110049864A CN 112651665 A CN112651665 A CN 112651665A
- Authority
- CN
- China
- Prior art keywords
- water quality
- quality index
- data
- site
- index prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000002352 surface water Substances 0.000 title claims abstract description 93
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 42
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 142
- 238000012544 monitoring process Methods 0.000 claims abstract description 108
- 238000010586 diagram Methods 0.000 claims abstract description 22
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 15
- 239000011159 matrix material Substances 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 13
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 5
- 238000011144 upstream manufacturing Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 4
- 230000036541 health Effects 0.000 abstract description 2
- 230000007613 environmental effect Effects 0.000 abstract 1
- 238000012549 training Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012731 temporal analysis Methods 0.000 description 3
- 238000000700 time series analysis Methods 0.000 description 3
- 238000003911 water pollution Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 239000003344 environmental pollutant Substances 0.000 description 2
- 231100000719 pollutant Toxicity 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于图神经网络的地表水水质指标预测方法和装置,包括以下步骤:采集并预处理水质指标监测数据和天气数据;基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图,依据预处理后的水质指标监测数据、天气数据和站点图对图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成的水质指标预测网络进行参数优化,参数优化结束后,参数确定的水质指标预测网络作为水质指标预测模型;利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。本发明结合图卷积神经网络和序列编解码器架构来预测地表水水质指标,在卫生健康、环境治理等领域具有广阔的应用前景。
Description
技术领域
本发明属于地表水水质指标预测领域,具体涉及一种基于图神经网络的地表水水质指标预测方法和装置。
背景技术
水污染是一个世界性难题,在发展中国家,因污染物的过量排放和监管体系的失能,约有10亿人不能饮用清洁水。饮用污染水会诱发消化道病变,对人类健康造成非常大的危害。水污染还会严重破坏水生生物的生存环境,如引起水污染的大部分化学药品会导致水生生物被毒死,污水中的有机物被微生物分解导致水体缺氧,危及鱼类的生存。地表水水质指标监测站点能实时获取所处水域的水质指标状况。挖掘生态环境大数据中的隐含信息可以实现高精度地表水水质指标预测,带来实际应用意义。
现有水质指标预测方法一般可以分为基于物理模型的方法和基于机器学习的方法两类。基于物理模型的方法以领域内的专业模型为基础,通过模拟污染物从排放到扩散的全过程来预测各地表水水质指标监测站点未来的水质指标情况。该类方法极度依赖数据集的完整性,并且需要根据场景调整模型的参数设置,泛化能力较差。
基于机器学习的方法是一种数据驱动的方法,通过挖掘历史数据中隐含的复杂依赖关系来预测地表水水质指标监测站点未来一段时间的各项指标。此类方法可以自动学习从多源数据输入到实际结果间的复杂映射关系,避免复杂的参数调整过程。基于机器学习的方法进一步可以细分为时间序列分析模型、通用回归模型和深度学习模型。时间序列分析模型通过发现历史序列中的线性规律来预测未来变化趋势,如ARIMA被用来建模历史水质指标监测序列中隐含的线性变化规律。但时间序列分析模型无法接受序列数据以外的特征输入。通用回归模型能支持多源数据输入,如线性回归模型、支持向量机、随机森林等。已经有研究将XGBoost模型用于利用水体中鱼类的运动特征辅助建模水体水质指标。此类方法的缺点是为了达到可观的预测准确率,需要复杂的特征工程,提升了模型的落地应用难度。
深度学习模型通过堆叠多层神经网络来拟合从输入到输出的非线性复杂映射,可实现自动化的特征学习,解决传统回归模型的特征选择问题,如LSTM模型被用来自动构建水质指标相关影响因素的特征,实现端到端的预测,对比传统模型取得了明显优势。但是,现有基于深度学习的水质指标预测方法往往没有考虑水文因素对水质指标的影响,也没有考虑多站点在水网上复杂的依赖关系。
发明内容
本发明的目的是提供一种基于图神经网络的地表水水质指标预测方法和装置,通过同时考虑各个地表水水质指标监测站点间的依赖关系和影响水质指标的天气因素来实现预测地表水水质指标,以提升地表水水质指标的准确性。
第一方面,为了实现上述发明目的,本发明提供了一种基于图神经网络的地表水水质指标预测方法,包括以下步骤:
采集并预处理水质指标监测数据和天气数据;
基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图,依据预处理后的水质指标监测数据、天气数据和站点图对图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成的水质指标预测网络进行参数优化,参数优化结束后,参数确定的水质指标预测网络作为水质指标预测模型;
利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。
优选地,在构建站点图时,以地表水水质指标监测站点为节点,以地表水水质指标监测站点的地理位置和站点之间的水路流向作为水文数据来构建节点之间连边,以获得站点图。
优选地,在构建站点图的邻接矩阵时,以上游地表水水质指标监测站点到下游地表水水质指标监测站点且两者之间的欧式距离小于阈值Rh的地表水水质指标监测站点之间才存在连边为约束条件,并以欧式距离的倒数为元素值,来计算邻接矩阵。
优选地,对水质指标预测网络进行参数优化时,以每个地表水水质指标监测站点的每个历史时刻的水质指标监测数据和天气数据拼接得到每个站点每个历史时刻的站点属性,将每个历史时刻的所有站点属性构成每个历史时刻的站点图属性作为一个样本数据,用作训练水质指标预测网络以优化参数。
优选地,对水质指标预测网络进行参数优化时,将每个历史时刻的站点图属性和站点图作为图卷积神经网络的输入,利用图卷积神经网络提取各地表水水质指标监测站点的嵌入表示,组成各个历史时刻的站点图的嵌入表示;
所述序列编解码器包括编码LSTM和解码LSTM,按照时间顺序,将各个历史时刻的站点图的嵌入表示依次输入至编码LSTM,利用编码LSTM对嵌入表示进行编码处理,得到所有地表水水质指标监测站点各个时刻的隐藏状态,并将最后历史时刻的隐藏状态作为所有地表水水质指标监测站点的编码向量组成站点图的编码向量;
利用站点图的编码向量初始化解码LSTM的隐藏状态,并将上一时刻的水质指标预测数据和下一时刻的天气数据拼接后作为当前时刻的输入数据,输入至解码LSTM和解码得到隐藏状态,将隐藏状态输入至多层感知机经映射计算得到当前时刻的水质指标预测数据,据此得到多个未来时刻的水质指标预测结果;
其中,解码LSTM的第一个时刻的输入数据为最后历史时刻的水质指标监测数据和下一时刻的天气数据拼接的数据。
优选地,对水质指标预测网络进行参数优化时,以水质指标监测数据的真实值与预测值的均方误差为损失函数,更新水质指标预测网络的参数。
优选地,对水质指标监测数据和天气数据的预处理包括:将异常值作为缺失值,采用线性插值法填充缺失值;对补全后的数据做归一化处理。
优选地,利用水质指标预测模型预测水质指标时,将历史时刻的水质指标监测数据和未来时刻的天气数据经预处理并拼接后输入至水质指标预测模型中,经计算,预测得到未来时刻的水质指标预测结果。
第二方面,为了实现上述发明目的,本发明提供了一种基于图神经网络的地表水水质指标预测装置,包括:
采集和预处理模块,用于采集并预处理水质指标监测数据和天气数据;
模型构建模块,用于基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图,依据预处理后的水质指标监测数据、天气数据和站点图对图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成的水质指标预测网络进行参数优化,参数优化结束后,参数确定的水质指标预测网络作为水质指标预测模型;
预测模块,用于利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。
本发明提供的一种基于图神经网络的地表水水质指标预测方法结合图卷积神经网络和序列编解码器架构来预测地表水水质指标,实现端到端的预测输出。与现有技术相比,本发明具有的有益效果至少包括:
1)构建站点图来建模地表水水质指标监测站点间的交互关系。在站点属性的构建上考虑了天气因素对水质指标的影响,在边的构建上考虑了地理、水文因素对水质指标的影响。
2)采用图卷积神经网络和序列编解码器架构建模区域内所有地表水水质指标监测站点的监测数据,考虑了各站点水质指标监测数据间复杂的空间、时间依赖关系。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是本发明实施例提供的基于图神经网络的地表水水质指标预测方法的流程图;
图2是本发明实施例提供的水质指标预测网络的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
为解决如何有效利用各个地表水水质指标监测站点间的依赖关系和影响水质指标的其他因素来提升水质指标的预测准确度的技术问题,本发明实施例提供了一种基于图神经网络的地表水水质指标预测方法和装置,具体包括:首先对地表水水质指标监测站点历史监测数据和天气数据进行预处理,得到训练数据集;其次根据地理和水文数据构建站点图,用于建模站点间复杂的依赖关系;然后通过图卷积神经网络实现图节点间的信息交互,从而建模站点间复杂的空间依赖关系;最后利用序列编解码器架构捕获水质指标序列中复杂的时间依赖关系,并得到多步预测数据。
图1是本发明实施例提供的基于图神经网络的地表水水质指标预测方法的流程图;图2是本发明实施例提供的水质指标预测网络的结构示意图。如图1和图2所示,实施例提供的基于图神经网络的地表水水质指标预测方法包括以下步骤:
步骤1,采集并预处理水质指标监测数据和天气数据,构建训练数据集。
各地表水水质指标监测站点通过传感器采集各种水质指标监测数据,同时还采集各种预报天气的天气数据。在获得水质指标监测数据和天气数据后,对对水质指标监测数据、天气数据进行异常值处理和归一化处理,并利用大小为τin+τout的滑动时间窗口对处理后的数据进行划分,得到训练数据集,τin表示历史时刻数,τout表示预测时刻数。
在进行数据异常值处理时,将异常值均作为缺失值进行处理,即将异常值作为缺失值,将所有缺失值采用线性插值法进行填充,线性插值法的计算公式如下:
其中,x、x0和x1表示缺失值及其前后有效样本的数值,t、t0和t1表示缺失值及其前后有效样本对应的时刻值。
对补全后的数据进行归一化处理时,归一化计算公式如下:
其中,μ表示样本均值,σ表示样本标准差,xnorm表示归一化操作后的输出值。
历史时刻数τin和预测时刻数τout均为人为设定,然后利用τin+τout的滑动时间窗口对预处理后的数据进行步长为p的划分。其中每个样本包括所有站点τin+τout个历史及未来时刻的水质指标监测数据 天气数据其中,Nstation表示地表水水质指标监测站点的个数,dwat表示水质指标的个数,dwea表示天气指标的个数。
步骤2,基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图。
实施例中,根据站点在水网上的地理位置以及站点间水路的流向,构建站点图G=(V,E,A),其中V表示节点集合,每个节点都对应预测区域内的一个地表水水质指标监测站点。E表示边集合,每条边包含地理、水文信息,反映了对应两个站点在水网上的交互关系。A表示G的邻接矩阵。
经研究发现,一个地表水水质指标监测站点的水质指标主要受上游而非下游区域的影响,因此在站点图G中,只有上游地表水水质指标监测站点到下游地表水水质指标监测站点且两者之间欧式距离小于阈值Rh的地表水水质指标监测站点之间才存在边的连接。根据上述条件计算站点图G的邻接矩阵A,A中各个元素Aa,b表示地表水水质指标监测站点a到地表水水质指标监测站点b之间的边的权重,权重为0则表示没有边的连接。Aa,b的计算公式如下:
其中[xa,ya]和[xb,yb]分别表示地表水水质指标监测站点a和地表水水质指标监测站点b的经纬度,da,b表示两个地表水水质指标监测站点间的欧氏距离,a→b表示地表水水质指标监测站点a和地表水水质指标监测站点b之间的流向是从地表水水质指标监测站点a到地表水水质指标监测站点b,Rh表示距离阈值。
步骤3,将训练数据集按照固定的批量大小进行分批,批次总数为Nbatch。
根据人为经验设定的批量大小m对训练数据集进行分批,批次总数为Nbatch。具体计算公式如下:
其中Nsample表示训练数据集中样本总数。
步骤4,从训练数据集中选取索引为k的一批训练样本,其中k∈{0,1,...,Nbatch}。对于该批次中的每一个训练样本,重复步骤5-9。
步骤5,依据水质指标监测数据和天气数据构建地表水水质指标监测站点的属性和站点图的属性。
实施例中,将各个历史时刻各个地表水水质指标监测站点的水质指标监测数据wati t和天气数据weai t进行拼接,得到各个历史时刻各个地表水水质指标监测站点的属性xi t,t∈{1,2,...,τin},i∈{1,2,...,Nstation},其中t表示时刻值,i表示站点序号,Nstation表示地表水水质指标监测站点的个数。t时刻所有地表水水质指标监测站点的属性构成了t时刻站点图的属性xt。站点属性xi t的计算公式如下:
步骤6,利用图卷积神经网络(GCN)获得各个历史时刻各个地表水水质指标监测站点的嵌入表示ri t和站点图的嵌入表示rt。
将站点图G及各个历史时刻各个站点的站点属性xi t输入到图卷积神经网络GCN中,实现节点间的信息交互,完成站点间空间依赖关系的建模,从而得到各个历史时刻各个站点的嵌入表示ri t,各个历史时刻的所有站点的嵌入表示ri t组成站点图的嵌入表示rt。GCN的计算公式如下:
其中,A是站点图的邻接矩阵,I是与A同型的单位矩阵,表示节点的自连接关系。本场景中的邻接矩阵A计算时考虑了边权,且是非对称矩阵。是的度矩阵,用来对矩阵行列作归一化处理。H(l)表示图卷积神经网络第l层所有节点的属性,H(0)对应t时刻输入的所有站点的属性xt。W(l)表示第l层的变换参数。σ表示非线性激活函数ReLU。
步骤7,利用编码LSTM基于站点图的嵌入表示rt提取站点图的编码向量z。
LSTM是一种为了解决RNN网络梯度消失问题所提出的改进型序列建模神经网络,通过在模型内部引入多功能的门控机制实现对序列长期记忆的保存,具体计算公式如下:
it=tanh(Wiinputt+Uiht-1+bi) (8)
ft=tanh(Wfinputt+Ufht-1+bf) (9)
ot=tanh(Woinputt+Uoht-1+bo) (10)
实施例中,将各个站点τin个历史时刻的表示,按时间顺序依次输入编码LSTM,得到各个站点τin个历史时刻的隐状态,然后将最后一个时刻的隐状态作为各个站点的编码向量zi。所有站点的编码向量构成了站点图的编码向量z。
步骤8,利用解码LSTM和多层感知机MLP预测未来时刻水质指标预测结果。
实施例中,采用编码LSTM得到的站点图的编码向量z初始化解码LSTM的隐状态。解码LSTM第一个时刻的输入,是各个站点最后一个历史时刻水质指标监测数据与第一个未来时刻天气数据拼接后的结果在每个时刻,解码LSTM都将得到的隐状态hi t输入多层感知机MLP中,得到该时刻的预测结果并将和下一时刻的天气数据weai t+1拼接的结果yi t+1,作为下一时刻解码LSTM的输入,直至得到τout个未来时刻的预测结果,t∈{τin+1,τin+2,...,τin+τout}。各个站点共享上述编码LSTM、解码LSTM和多层感知机MLP的参数。
其中拼接的具体计算过程见公式(6),解码LSTM的计算和编码LSTM类似,具体计算过程见公式(8)-(12)。多层感知机MLP的计算公式如下:
h=relu(Whinput+bh) (13)
o=Woh+bo (14)
其中,input对应解码LSTM的隐状态hi t,Wh,Wo表示权重矩阵,bh,bo表示偏置向量。
步骤9,构建损失函数并利用损失函数优化网络参数。
实施例中,依据水质指标监测数据的真实值与预测值的均方误差为损失函数,则单个训练样本的预测损失计算方式如下:
则批中所有样本的预测损失L为:
其中,s表示样本序号,Nstation表示站点数量,τout表示预测时刻数,dwat表示水质指标个数,wat表示水质指标监测数据的真实值,表示水质指标监测数据的预测值,Ls表示样本s的预测损失,m表示每个批中样本的数量。
然后根据批中所有样本的预测损失L,对整个水质指标预测网络中的网络参数进行调整。
步骤10,重复步骤4-9直到训练数据集的所有批次都参与了模型训练。
步骤11,重复步骤4-10直到达到指定迭代次数。
训练结束后,提取参数确定的图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成水质指标预测模型。
步骤12,应用时,利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。
给定地表水水质指标监测站点在水网上的地理位置、站点间水路的流向、τin个历史时刻的水质指标监测数据和天气数据、τout个未来时刻的天气数据,地表水水质指标预测任务是预测各个地表水水质指标监测站点τout个未来时刻的水质指标监测数据。
具体地,对当前时刻及之前τin个历史时刻的水质指标监测数据和天气数据,以及τout个未来时刻的天气预报数据进行异常值和归一化处理。然后将处理后的数据样本输入已训练好的水质指标预测模型,得到当前时刻之后τout个未来时刻的水质指标预测结果。
实施例还提供一种基于图神经网络的地表水水质指标预测装置,包括:
采集和预处理模块,用于采集并预处理水质指标监测数据和天气数据;
模型构建模块,用于基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图,依据预处理后的水质指标监测数据、天气数据和站点图对图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成的水质指标预测网络进行参数优化,参数优化结束后,参数确定的水质指标预测网络作为水质指标预测模型;
预测模块,用于利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。
需要说明的是,上述实施例提供的基于图神经网络的地表水水质指标预测装置在进行地表水水质指标预测时,应以上述各功能模块的划分进行举例说明,可以根据需要将上述功能分配由不同的功能模块完成,即在终端或服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于图神经网络的地表水水质指标预测装置与基于图神经网络的地表水水质指标预测方法实施例属于同一构思,其具体实现过程详见基于图神经网络的地表水水质指标预测方法实施例,这里不再赘述。
实施例提供的于图神经网络的地表水水质指标预测方法和装置,通过同时考虑各个地表水水质指标监测站点间的依赖关系和影响水质指标的天气因素,并结合图卷积神经网络、序列编解码器以及MLP架构来预测地表水水质指标,以提升地表水水质指标的准确性。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于图神经网络的地表水水质指标预测方法,其特征在于,包括以下步骤:
采集并预处理水质指标监测数据和天气数据;
基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图,依据预处理后的水质指标监测数据、天气数据和站点图对图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成的水质指标预测网络进行参数优化,参数优化结束后,参数确定的水质指标预测网络作为水质指标预测模型;
利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。
2.如权利要求1所述的基于图神经网络的地表水水质指标预测方法,其特征在于,在构建站点图时,以地表水水质指标监测站点为节点,以地表水水质指标监测站点的地理位置和地表水水质指标监测站点之间的水路流向作为水文数据来构建节点之间连边,以获得站点图。
3.如权利要求2所述的基于图神经网络的地表水水质指标预测方法,其特征在于,在构建站点图的邻接矩阵时,以上游地表水水质指标监测站点到下游地表水水质指标监测站点且两者之间的欧式距离小于阈值Rh的地表水水质指标监测站点之间才存在连边为约束条件,并以欧式距离的倒数为元素值,来计算邻接矩阵。
4.如权利要求1所述的基于图神经网络的地表水水质指标预测方法,其特征在于,对水质指标预测网络进行参数优化时,以每个地表水水质指标监测站点的每个历史时刻的水质指标监测数据和天气数据拼接得到每个站点每个历史时刻的站点属性,将每个历史时刻的所有站点属性构成每个历史时刻的站点图属性作为一个样本数据,用作训练水质指标预测网络以优化参数。
5.如权利要求4所述的基于图神经网络的地表水水质指标预测方法,其特征在于,对水质指标预测网络进行参数优化时,将每个历史时刻的站点图属性和站点图作为图卷积神经网络的输入,利用图卷积神经网络提取各地表水水质指标监测站点的嵌入表示,组成各个历史时刻的站点图的嵌入表示;
所述序列编解码器包括编码LSTM和解码LSTM,按照时间顺序,将各个历史时刻的站点图的嵌入表示依次输入至编码LSTM,利用编码LSTM对嵌入表示进行编码处理,得到所有地表水水质指标监测站点各个时刻的隐藏状态,并将最后历史时刻的隐藏状态作为所有地表水水质指标监测站点的编码向量组成站点图的编码向量;
利用站点图的编码向量初始化解码LSTM的隐藏状态,并将上一时刻的水质指标预测数据和当前时刻的天气数据拼接后作为当前时刻的输入数据,输入至解码LSTM和解码得到隐藏状态,将隐藏状态输入至多层感知机经映射计算得到当前时刻的水质指标预测数据,据此得到多个未来时刻的水质指标预测结果;
其中,解码LSTM的第一个时刻的输入数据为最后历史时刻的水质指标监测数据和该时刻的天气数据拼接的数据。
6.如权利要求1所述的基于图神经网络的地表水水质指标预测方法,其特征在于,对水质指标预测网络进行参数优化时,以水质指标监测数据的真实值与预测值的均方误差为损失函数,更新水质指标预测网络的参数。
7.如权利要求1所述的基于图神经网络的地表水水质指标预测方法,其特征在于,对水质指标监测数据和天气数据的预处理包括:将异常值作为缺失值,采用线性插值法填充缺失值;对补全后的数据做归一化处理。
8.如权利要求1所述的基于图神经网络的地表水水质指标预测方法,其特征在于,利用水质指标预测模型预测水质指标时,将历史时刻的水质指标监测数据和未来时刻的天气数据经预处理并拼接后输入至水质指标预测模型中,经计算,预测得到未来时刻的水质指标预测结果。
9.一种基于图神经网络的地表水水质指标预测装置,其特征在于,包括:
采集和预处理模块,用于采集并预处理水质指标监测数据和天气数据;
模型构建模块,用于基于地表水水质指标监测站点的地理位置数据和水文数据构建站点图,依据预处理后的水质指标监测数据、天气数据和站点图对图卷积神经网络、基于LSTM构建的序列编解码器以及多层感知机组成的水质指标预测网络进行参数优化,参数优化结束后,参数确定的水质指标预测网络作为水质指标预测模型;
预测模块,用于利用水质指标预测模型实现基于预处理后的水质指标监测数据和天气数据的水质指标预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110049864.2A CN112651665B (zh) | 2021-01-14 | 2021-01-14 | 一种基于图神经网络的地表水水质指标预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110049864.2A CN112651665B (zh) | 2021-01-14 | 2021-01-14 | 一种基于图神经网络的地表水水质指标预测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112651665A true CN112651665A (zh) | 2021-04-13 |
CN112651665B CN112651665B (zh) | 2022-12-20 |
Family
ID=75368161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110049864.2A Active CN112651665B (zh) | 2021-01-14 | 2021-01-14 | 一种基于图神经网络的地表水水质指标预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651665B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159409A (zh) * | 2021-04-14 | 2021-07-23 | 浙江大学 | 一种基于组感知图神经网络的全国城市空气质量预测方法 |
CN113188968A (zh) * | 2021-05-06 | 2021-07-30 | 长沙理工大学 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
CN113409167A (zh) * | 2021-08-19 | 2021-09-17 | 中国环境监测总站 | 一种水质异常分析方法及装置 |
CN114031147A (zh) * | 2021-11-02 | 2022-02-11 | 航天环保(北京)有限公司 | 利用波裂解纳米材料提升水质的方法及系统 |
CN114414751A (zh) * | 2021-12-15 | 2022-04-29 | 华能煤炭技术研究有限公司 | 一种地下水质检测方法及系统 |
CN115358463A (zh) * | 2022-08-18 | 2022-11-18 | 长沙学院 | 生态敏感区输变电建设工程水环境监测与影响评估方法 |
CN115936496A (zh) * | 2022-11-29 | 2023-04-07 | 中国环境科学研究院 | 水质预测模型数据治理标准化方法 |
CN116187203A (zh) * | 2023-04-20 | 2023-05-30 | 武汉大学 | 一种流域水质预测方法、系统、电子设备及存储介质 |
CN117332261A (zh) * | 2023-12-01 | 2024-01-02 | 深圳市伟昊净化设备有限公司 | 一种滤芯的效能评价方法、系统及存储介质 |
CN117933572A (zh) * | 2024-03-20 | 2024-04-26 | 四川飞洁科技发展有限公司 | 一种水质预测方法及相关装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636049A (zh) * | 2018-12-19 | 2019-04-16 | 浙江工业大学 | 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法 |
US20190114320A1 (en) * | 2017-10-17 | 2019-04-18 | Tata Consultancy Services Limited | System and method for quality evaluation of collaborative text inputs |
CN110110946A (zh) * | 2019-05-27 | 2019-08-09 | 江西博微新技术有限公司 | 基于各向异性Delaunay剖分的水质预测预警系统及其实现方法 |
US20200041550A1 (en) * | 2016-10-05 | 2020-02-06 | Telecom Italia S.P.A. | Method and system for estimating energy generation based on solar irradiance forecasting |
CN110852515A (zh) * | 2019-11-15 | 2020-02-28 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
AU2020100371A4 (en) * | 2020-03-12 | 2020-04-16 | Jilin University | Hierarchical multi-object tracking method based on saliency detection |
CN111126674A (zh) * | 2019-12-04 | 2020-05-08 | 浙江工业大学 | 基于深度模型的传播预测方法及其系统 |
CN111160628A (zh) * | 2019-12-13 | 2020-05-15 | 重庆邮电大学 | 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法 |
CN111563611A (zh) * | 2020-04-13 | 2020-08-21 | 北京工业大学 | 面向图卷积网络的云数据中心可再生能源时空预测方法 |
CN111639748A (zh) * | 2020-05-15 | 2020-09-08 | 武汉大学 | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 |
CN112215422A (zh) * | 2020-10-13 | 2021-01-12 | 北京工业大学 | 基于季节性分解的长短时记忆网络水质动态预警方法 |
-
2021
- 2021-01-14 CN CN202110049864.2A patent/CN112651665B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200041550A1 (en) * | 2016-10-05 | 2020-02-06 | Telecom Italia S.P.A. | Method and system for estimating energy generation based on solar irradiance forecasting |
US20190114320A1 (en) * | 2017-10-17 | 2019-04-18 | Tata Consultancy Services Limited | System and method for quality evaluation of collaborative text inputs |
CN109636049A (zh) * | 2018-12-19 | 2019-04-16 | 浙江工业大学 | 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法 |
CN110110946A (zh) * | 2019-05-27 | 2019-08-09 | 江西博微新技术有限公司 | 基于各向异性Delaunay剖分的水质预测预警系统及其实现方法 |
CN110852515A (zh) * | 2019-11-15 | 2020-02-28 | 北京工业大学 | 基于混合长短时记忆神经网络的水质指标预测方法 |
CN111126674A (zh) * | 2019-12-04 | 2020-05-08 | 浙江工业大学 | 基于深度模型的传播预测方法及其系统 |
CN111160628A (zh) * | 2019-12-13 | 2020-05-15 | 重庆邮电大学 | 一种基于CNN和双注意力seq2seq的空气污染物浓度预测方法 |
AU2020100371A4 (en) * | 2020-03-12 | 2020-04-16 | Jilin University | Hierarchical multi-object tracking method based on saliency detection |
CN111563611A (zh) * | 2020-04-13 | 2020-08-21 | 北京工业大学 | 面向图卷积网络的云数据中心可再生能源时空预测方法 |
CN111639748A (zh) * | 2020-05-15 | 2020-09-08 | 武汉大学 | 一种基于lstm-bp时空组合模型的流域污染物通量预测方法 |
CN112215422A (zh) * | 2020-10-13 | 2021-01-12 | 北京工业大学 | 基于季节性分解的长短时记忆网络水质动态预警方法 |
Non-Patent Citations (1)
Title |
---|
王嫄嫄: "基于LSTM的水质预测方法研究", 《中国优秀博硕士学位论文全文数据库(硕士)》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159409A (zh) * | 2021-04-14 | 2021-07-23 | 浙江大学 | 一种基于组感知图神经网络的全国城市空气质量预测方法 |
CN113188968A (zh) * | 2021-05-06 | 2021-07-30 | 长沙理工大学 | 基于组合深度学习模型的空气污染物浓度预测方法及系统 |
CN113409167A (zh) * | 2021-08-19 | 2021-09-17 | 中国环境监测总站 | 一种水质异常分析方法及装置 |
CN114031147A (zh) * | 2021-11-02 | 2022-02-11 | 航天环保(北京)有限公司 | 利用波裂解纳米材料提升水质的方法及系统 |
CN114414751B (zh) * | 2021-12-15 | 2024-05-10 | 华能煤炭技术研究有限公司 | 一种地下水质检测方法及系统 |
CN114414751A (zh) * | 2021-12-15 | 2022-04-29 | 华能煤炭技术研究有限公司 | 一种地下水质检测方法及系统 |
CN115358463A (zh) * | 2022-08-18 | 2022-11-18 | 长沙学院 | 生态敏感区输变电建设工程水环境监测与影响评估方法 |
CN115936496A (zh) * | 2022-11-29 | 2023-04-07 | 中国环境科学研究院 | 水质预测模型数据治理标准化方法 |
CN115936496B (zh) * | 2022-11-29 | 2023-09-19 | 中国环境科学研究院 | 水质预测模型数据治理标准化方法 |
CN116187203A (zh) * | 2023-04-20 | 2023-05-30 | 武汉大学 | 一种流域水质预测方法、系统、电子设备及存储介质 |
CN117332261A (zh) * | 2023-12-01 | 2024-01-02 | 深圳市伟昊净化设备有限公司 | 一种滤芯的效能评价方法、系统及存储介质 |
CN117332261B (zh) * | 2023-12-01 | 2024-03-22 | 深圳市伟昊净化设备有限公司 | 一种滤芯的效能评价方法、系统及存储介质 |
CN117933572A (zh) * | 2024-03-20 | 2024-04-26 | 四川飞洁科技发展有限公司 | 一种水质预测方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112651665B (zh) | 2022-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112651665B (zh) | 一种基于图神经网络的地表水水质指标预测方法和装置 | |
CN114626512B (zh) | 一种基于有向图神经网络的高温灾害预报方法 | |
CN111784041B (zh) | 一种基于图卷积神经网络的风电功率预测方法及系统 | |
CN105243435B (zh) | 一种基于深度学习元胞自动机模型的土壤含水量预测方法 | |
CN113516304B (zh) | 基于时空图网络的区域污染物时空联合预测方法及装置 | |
CN109583565A (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN111242344A (zh) | 一种基于循环神经网络和卷积神经网络的智能水位预测方法 | |
CN114841400A (zh) | 基于多任务时空图卷积的空气质量预测方法 | |
Li et al. | A method of rainfall runoff forecasting based on deep convolution neural networks | |
Shiri et al. | Forecasting daily stream flows using artificial intelligence approaches | |
CN116415730A (zh) | 一种预测水位的融合自注意力机制时空深度学习模型 | |
CN116384565A (zh) | 一种基于缺失数据填补的层次式大气臭氧浓度预测方法 | |
CN116562414A (zh) | 一种基于多源水文气象数据的陆地水储量变化预测方法 | |
CN116013426A (zh) | 一种高时空分辨率的站点臭氧浓度预测方法 | |
CN117233869B (zh) | 一种基于GRU-BiTCN的站点短期风速预测方法 | |
CN114462572A (zh) | 一种基于时空融合图的空气质量预测方法及装置 | |
CN115829163B (zh) | 基于多模式集成的长江中下游流域径流预测方法和系统 | |
CN116960962A (zh) | 一种跨区域数据融合的中长期区域负荷预测方法 | |
CN116822722A (zh) | 水位预测方法、系统、装置、电子设备及介质 | |
CN114169646B (zh) | 水华预测方法、装置、电子设备及计算机可读存储介质 | |
CN113792919B (zh) | 一种基于迁移学习深度学习相结合的风电功率预测方法 | |
CN115392128A (zh) | 一种利用时空卷积lstm网络模拟流域径流量的方法 | |
Sharma et al. | Hydrologic simulation approach for El Niño Southern Oscillation (ENSO)-affected watershed with limited raingauge stations | |
Şahin et al. | A new approach to prediction of SO2 and PM10 concentrations in Istanbul, Turkey: Cellular Neural Network (CNN) | |
CN113919533A (zh) | 一种基于人工智能的空气质量溯源预报方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |