CN117670147B - 一种湖泊水质预测方法及系统 - Google Patents

一种湖泊水质预测方法及系统 Download PDF

Info

Publication number
CN117670147B
CN117670147B CN202410140864.7A CN202410140864A CN117670147B CN 117670147 B CN117670147 B CN 117670147B CN 202410140864 A CN202410140864 A CN 202410140864A CN 117670147 B CN117670147 B CN 117670147B
Authority
CN
China
Prior art keywords
sequence
water quality
sub
predicted
quality index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410140864.7A
Other languages
English (en)
Other versions
CN117670147A (zh
Inventor
邓觅
吴永明
辛攀
钟华
姚忠
刘亚军
王茂林
李荣富
梁培瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Microbiology Jiangxi Academy Of Sciences Jiangxi Institute Of Watershed Ecology
Original Assignee
Institute Of Microbiology Jiangxi Academy Of Sciences Jiangxi Institute Of Watershed Ecology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Microbiology Jiangxi Academy Of Sciences Jiangxi Institute Of Watershed Ecology filed Critical Institute Of Microbiology Jiangxi Academy Of Sciences Jiangxi Institute Of Watershed Ecology
Priority to CN202410140864.7A priority Critical patent/CN117670147B/zh
Publication of CN117670147A publication Critical patent/CN117670147A/zh
Application granted granted Critical
Publication of CN117670147B publication Critical patent/CN117670147B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A20/00Water conservation; Efficient water supply; Efficient water use
    • Y02A20/152Water filtration

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及湖泊水质监测领域,特别是涉及一种湖泊水质预测方法及系统。其中,本发明所提供的预测方法包括如下步骤:分解第一序列,获得两组或者两组以上的子模态序列;根据子模态序列与第二序列之间的相关性,匹配子模态序列的参考水质指标;根据匹配结果,生成两组或者两组以上的目标子模态矩阵;分别基于目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值;汇总预测分量值,获得待预测水质指标的第一预测值。本发明通过将非平稳的待预测水质指标数据序列分解成多个相对平稳的子模态序列后再分别进行水质数据预测,极大程度地减少了噪声对预测结果的干扰,能够获得更为精准的水质预测数据。

Description

一种湖泊水质预测方法及系统
技术领域
本发明涉及湖泊水质监测领域,特别是涉及一种湖泊水质预测方法及系统。
背景技术
水质预测作为一种重要的湖泊管理方法,能够及时准确地评估湖泊水质的变化趋势和污染程度,为决策者提供科学依据,进而采取有效的保护措施以及恢复措施。
当前,水质预测方法主要分为统计方法、灰色系统理论法和机器学习方法。其中,统计方法具有简单易用、可解释性强的优点,但其方法通常建立在一定的假设前提下,对数据要求严格,主要包括时间序列分析法、指数平滑法和回归分析等。灰色系统理论法在数据相对匮乏或不完整的情况下,能够进行有效的预测分析,然而在应对数据复杂或非线性关系时,预测精度相对较低。相比于前两种方法,机器学习方法具备挖掘数据更深层次关联性的能力,适用于处理复杂的非线性问题,常用的机器学习方法包括支持向量机,极限学习机,人工神经网络等。
水质数据通常具有时间相关性,在进行水质预测时应考虑时间因素的影响。当前研究表明:长短期记忆网络(Long Short-Term Memory,LSTM)能够抓取时间信息,在处理长时序数据方面具有优势;双向长短期记忆网络(BILSTM)相较于长短期记忆网络,在处理长时序数据方面更具优势;基于时间卷积网络(TCN)的长短期记忆网络通过膨胀卷积增加感受野的范围来捕捉长序列数据信息,在处理长时序数据方面超过了单一长短期记忆网络的性能。
然而,在实际情况中的水质数据中具有非平稳性,当前用于预测水质的方法并不能有效地避免噪声造成的模态混叠问题,因此,亟需一种湖泊水质预测方法及系统,以分离水质数据中的噪声模态,进而获得更为精准的水质预测数据。
发明内容
针对现有技术的不足和实际应用的需求,本发明提供了一种湖泊水质预测方法及系统,旨在解决水质预测中存在的噪声干扰问题。
第一方面,本发明所提供的湖泊水质预测方法,包括如下步骤:分解第一序列,获得两组或者两组以上的子模态序列,所述第一序列为待预测水质指标的历史数据序列;根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标,所述第二序列为参考水质指标的历史数据序列;根据匹配结果,生成两组或者两组以上的目标子模态矩阵,任一组目标子模态矩阵包括一组子模态序列向量,以及一组或者多组第二序列向量;分别基于所述目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值;汇总所述预测分量值,获得待预测水质指标的第一预测值。
本发明所提供的湖泊水质预测方法,其增益在于:本发明将复杂的、非平稳的待预测水质指标的历史数据序列分解成多个相对平稳的子模态序列;再匹配与子模态序列相关性强的参考水质指标的历史数据序列,进而通过参考水质指标的历史数据序列预测对应子模态分量的预测分量值;再通过汇总多个预测分量值获得第一预测值。本发明所提供的湖泊水质预测方法解决了水质预测中噪声干扰问题,极大程度地减少了噪声对预测结果的干扰,能够获得更为精准的水质预测数据。
可选地,本发明所提供的湖泊水质预测方法还包括获取所述第一序列,所述获取所述第一序列,包括如下步骤:获取目标水域的历史水质指标数据,并整理所述历史水质指标数据,所述历史水质指标数据包括待预测水质指标数据;从所述历史水质指标数据中筛选出待预测水质指标数据,并利用所述待预测水质指标数据生成所述第一序列。本发明通过整理历史水质指标数据,以获得适用于后续数据分析的第一序列,有助于提升水质指标数据预测的效率和精准性。
可选地,本发明所提供的湖泊水质预测方法还包括获取所述第二序列,所述获取所述第二序列,包括如下步骤:获取目标水域的历史水质指标数据,并整理所述历史水质指标数据,所述历史水质指标数据包括参考水质指标数据;从所述历史水质指标数据中筛选出参考水质指标数据,并利用所述参考水质指标数据生成所述第二序列。本发明通过整理历史水质指标数据,以获得适用于后续数据分析的第二序列,有助于提升水质指标数据预测的效率和精准性。
可选地,本发明所提供的湖泊水质预测方法中所述分解第一序列,获得两组或者两组以上的子模态序列,包括如下步骤:基于所述第一序列构建变分约束方程,求解所述变分约束方程获得两组或者两组以上的子模态序列。本发明通过变分约束方程将复杂的、非平稳的待预测水质指标数据序列分解成多个相对平稳的子模态序列,再利用子模态序列实现待预测水质指标数据的预测,极大程度地减少了噪声对预测结果的干扰。
可选地,所述根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标,包括如下步骤:将两组或者两组以上的子模态序列分别输入随机森林模型,所述随机森林模型用于根据所述子模态序列与所述第二序列之间的相关性,对所述子模态序列进行分类;通过所述随机森林模型对所述子模态序列的分类结果,匹配所述子模态序列对应的参考水质指标,任一子模态序列匹配一项或者多项参考水质指标。本发明利用随机森林模型,高效且准确地利用数据相关性实现了子模态序列与参考水质指标之间的匹配,进而可以实现利用相关性程度更高的参考水质指标数据对子模态序列进行预测,不仅有助于降低预测模型的训练复杂度,还能够提升预测结果的精度。
可选地,本发明所提供的湖泊水质预测方法中所述分别基于所述目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值,任一所述预测分量值,包括如下获取步骤:将一组目标子模态矩阵输入到TCN网络,通过所述TCN网络捕捉所述子模态序列向量与所述第二序列向量的时序特征;将所述时序特征输入BILSTM网络,通过所述BILSTM网络根据所述时序特征预测所述子模态序列向量的预测分量值。本发明所利用的BILSTM网络不仅能学习到过去的信息,还能学习到未来的信息,通过双向历史信息数据,可以更好地挖掘时序特征,进而能够预测出更为精准的预测分量值。
可选地,本发明所提供的湖泊水质预测方法中所述汇总所述预测分量值,获得待预测水质指标的第一预测值,包括如下步骤:线性叠加全部预测分量值,获得待预测水质指标的第一预测值。本发明通过线性叠加全部的预测分量值,能够快速获得待预测水质指标的第一预测值,有助于提升水质指标数据预测的效率。
可选地,本发明所提供的湖泊水质预测方法还包括如下步骤:利用所述第一序列结合所述第一预测值,生成残差序列;通过所述残差序列,预测所述第一序列与所述第一预测值之间的残差值;利用所述残差值修正所述第一预测值,获得待预测水质指标的第二预测值。本发明通过残差序列对第一预测值进行修正,进而可以获得更加精准的第二预测值;同时,相比于第一序列,残差序列的特征更少,数据结构更简单,有助于提升修正第一预测值的实施效率。
进一步可选地,所述通过所述残差序列,预测所述第一序列与所述第一预测值之间的残差值,包括如下步骤:将所述残差序列输入BIGRU网络,通过所述BIGRU网络预测所述第一序列与所述第一预测值之间的残差值。本发明选用的BIGRU网络,能够更加快速且准确地实现第一序列与第一预测值之间的残差值预测。
第二方面,本发明还提供了一种湖泊水质预测系统,包括输入设备、处理器、存储器和输出设备,所述输入设备、所述处理器、所述存储器和所述输出设备相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行所述湖泊水质预测方法。
本发明所提供的湖泊水质预测系统,其增益在于:本发明所提供的湖泊水质预测系统,能够稳定且高效地执行所述湖泊水质预测方法,有助于更好地了解水质现状和发展趋势,进而为水资源的保护和治理提供科学的数据支持。
附图说明
图1为本发明实施例所提供的湖泊水质预测方法的第一流程图;
图2为本发明实施例所提供的湖泊水质预测方法的第二流程图;
图3为本发明实施例所提供的湖泊水质预测系统的结构示意图。
具体实施方式
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“在一个实施例中”、“在实施例中”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。
在一个实施例中,请参见图1和图2,图1为本发明实施例所提供的湖泊水质预测方法的第一流程图,图2为本发明实施例所提供的湖泊水质预测方法的第二流程图。如图1和图2所示,所述湖泊水质预测方法包括如下步骤:S01、分解第一序列,获得两组或者两组以上的子模态序列。
本发明所述的第一序列为待预测水质指标的历史数据序列;进一步地,所述历史数据序列为在一定采样频率下采集一组待预测水质指标数据,任一个采样时刻均对应一个待预测水质指标数据。
当待预测水质指标的历史数据序列中出现异常值或者缺失值时,可通过删除法和/或线性插值法修正或者补充对应时刻的待预测水质指标数据。具体地,所述待预测水质指标的历史数据序列满足如下表征模型:,其中,/>表示第一个采样时刻,/>表示在采样时刻/>采集的待预测水质指标数据/>,/>表示第二个采样时刻,/>表示在采样时刻/>采集的待预测水质指标数据/>,/>表示第n个采样时刻,/>表示在采样时刻/>采集的待预测水质指标数据/>
进一步地,为实施步骤S01,所述湖泊水质预测方法还包括获取所述第一序列,具体包括如下步骤:获取目标水域的历史水质指标数据,并整理所述历史水质指标数据,所述历史水质指标数据包括待预测水质指标数据;从所述历史水质指标数据中筛选出待预测水质指标数据,并利用所述待预测水质指标数据生成所述第一序列。
所述目标水域是指进行水质监测的池塘、河流、湖泊、海洋等水域。容易理解的是,在对目标水域进行水质监测时,通常是对目标水域中多项水质指标进行采样/记录/核对等数据采集操作;针对不同水质指标,其采样的频率可能相同,也可能不同,具体可以根据水质监测的需求设定。
通常情况下,用于评估水质的水质指标包括但不限于含溶解氧(DO)、水温(WT)、pH值、高锰酸盐指数(CODMn)、氨氮(NH3-N)、总磷(TP)、总氮(TN)和浊度(TU)等多项指标。本发明所提出的待预测水质指标即为根据实际监测需求设定的一项水质指标。
在本实施例中,步骤S01所述的分解第一序列,获得两组或者两组以上的子模态序列,包括如下步骤:基于所述第一序列构建变分约束方程,求解所述变分约束方程获得两组或者两组以上的子模态序列。
具体地,所述基于所述第一序列构建变分约束方程,求解所述变分约束方程获得两组或者两组以上的子模态序列,可通过VMD实现。VMD(Variational ModeDecomposition,变分模态分解方法)可以将待预测水质数据对应的第一序列自适应地分解为指定个数的模态分量,并且每个模态分量都具有相对应地频率和幅度特征。
进一步地,基于VMD所构建的变分约束方程满足如下模型:,其中,/>表示虚数单位,/>表示时间,/>表示子模态序列的总数量,e表示自然常数,/>表示对第k组子模态序列对应的模态函数进行希尔伯特变换,/>表示狄拉克函数,/>均表示第k组子模态序列对应的模态函数,/>表示频谱调制指数项,/>表示第k组子模态序列对应的模态函数的中心频率,/>表示第一序列对应的模态函数,/>表示第k组子模态序列对应的模态函数的带宽。
进一步地,在所述变分约束方程,首先利用希尔伯特变换获得各组子模态序列对应的模态函数的解析信号,再利用指数项对各模态函数的频谱调制使其平移到对应的基频带上,再通过梯度平方(L2)范数计算各个模态函数的带宽;进而构造变分方程使得各个模态函数的带宽之和最小,其约束条件为,所述约束条件具体表示各组子模态序列对应的模态函数之和为第一序列对应的模态函数。
当VMD实现上述步骤时,生成子模态序列的具体数量K,以及求解变分约束方程的惩罚项α可以根据预测需求进行设定。K值设定过小可能会遗漏有效模态,从而导致模态欠分解;K值设定过大会导致模态裂解,从而造成过分解;α值设定过小会导致信息冗余;α值设定过大会造成频带信息丢失。进一步地,在其他的一个或者多个可选的实施例中,利用粒子群优化算法(PSO)对VMD参数进行寻优,获取最优的[K,α]参数组合。
在其他的一个或者一些实施例中,如图1和图2所示,所述湖泊水质预测方法还包括如下步骤:S02、根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标。
所述第二序列为参考水质指标的历史数据序列。进一步地,所述历史数据序列为在一定采样频率下采集一组参考水质指标,任一个采样时刻均对应一个或者多个参考水质指标数据。
当参考水质指标的历史数据序列中出现异常值或者缺失值时,可通过删除法和/或线性插值法修正或者补充对应时刻的参考水质指标数据。具体地,所述参考水质指标的历史数据序列满足如下表征模型:,其中,/>表示第一个采样时刻,/>表示在采样时刻/>采集的参考水质指标数据/>,/>表示第二个采样时刻,/>表示在采样时刻/>采集的参考水质指标数据/>,/>表示第n个采样时刻,/>表示在采样时刻/>采集的参考水质指标数据/>
针对任一采样时刻所采集的参考水质指标数据/>,其包括了一项或者多项不同类型参考水质指标数据/>。例如,/>表示在采样时刻/>采集的第1项参考水质指标/>,/>表示在采样时刻/>采集的第2项参考水质指标/>,/>表示在采样时刻/>采集的第n项参考水质指标/>
进一步地,为实施步骤S02,所述湖泊水质预测方法还包括获取所述第二序列,具体包括如下步骤:获取目标水域的历史水质指标数据,并整理所述历史水质指标数据,所述历史水质指标数据包括参考水质指标数据;从所述历史水质指标数据中筛选出参考水质指标数据,并利用所述参考水质指标数据生成所述第二序列。
进一步地,本发明所提出的参考水质指标即为根据实际监测需求设定的一项或者多项非待预测的水质指标,任一项参考水质指标数据对应一组第二序列。
在这个或者这些实施例中,步骤S02所述的根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标,包括如下步骤:将两组或者两组以上的子模态序列分别输入随机森林模型,所述随机森林模型用于根据所述子模态序列与所述第二序列之间的相关性,对所述子模态序列进行分类;通过所述随机森林模型对所述子模态序列的分类结果,匹配所述子模态序列对应的参考水质指标,任一子模态序列匹配一项或者多项参考水质指标。
可以知道的是,随机森林是一种基于决策树的集成学习方法,通过数次对数据进行有放回的随机采样和特征抽样的方式组建训练集,从而构建不同的决策树,再以特定的组合方式将各决策树结果进行集成,最后以投票或者平均的方式得出最后的预测结果。
在本实施例中,随机森林作为集成学习模型,用于根据所述子模态序列与所述第二序列之间的相关性对所述子模态序列进行分类,进而获得与子模态序列相关性高的参考水质指标,从而剔除无关特征。
在其他的一个或者一些实施例中,如图1和图2所示,所述湖泊水质预测方法还包括如下步骤:S03、根据匹配结果,生成两组或者两组以上的目标子模态矩阵。
容易知道的是,步骤S02对不同频率的子模态序列进行了特征筛选,进而获得了与子模态序列相关性高的参考水质指标。在本实施例中,步骤S03根据匹配结果,生成了两组或者两组以上的目标子模态矩阵,所述子模态矩阵的具体数量与子模态序列数量相同,即任一组子模态序列对应生成一个目标模态矩阵;进一步地,任一个目标子模态矩阵中包括一组子模态序列向量,以及一组或者多组第二序列向量,其中,所述子模态序列向量为子模态序列组成的数据向量,第二序列向量为第二序列组成的数据向量。
在其他的一个或者一些实施例中,如图1和图2所示,所述湖泊水质预测方法还包括如下步骤:S04、分别基于所述目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值。
进一步地,获得任一目标子模态矩阵的预测分量值,包括如下获取步骤:将一组目标子模态矩阵输入到TCN网络,通过所述TCN网络捕捉所述子模态序列向量与所述第二序列向量的时序特征;将所述时序特征输入BILSTM网络,通过所述BILSTM网络根据所述时序特征预测所述子模态序列向量的预测分量值。
本实施例中,所述TCN网络是以一维卷积网络为基础构建的适用于时间序列任务的网络结构模型。相较于传统CNN网络,TCN引入了因果卷积(Causal Convolution)和膨胀卷积(Dilated Convolution),TCN网络通过引入因果卷积和膨胀卷积来增大感受野,使之可以在不损失信息的情况下,获取更大范围的依赖信息。
进一步地,在其他的一些可选的实施例中,所述TCN网络为TCN-self Attention网络,即在原始的TCN网络中添加自注意力机制(self Attention),与注意力机制相比,自注意力机制减少了对外部数据的依赖,更加专注于捕捉时序特征中的内部相关性。
本实施例中,所述BILSTM网络由前向和后向两个方向的LSTM组成,具有双向结构;其中,LSTM基于RNN模型的基础上通过引入输入门、输出门和遗忘门等门控机制,一定程度上避免了梯度爆炸和梯度消失的问题的网络模型。BILSTM不仅能学习到过去的信息,还能学习到未来的信息,通过双向历史信息数据,可以更好地挖掘时序数据上下文信息。
针对步骤S03中获得的两个或者两个以上的目标子模态矩阵,步骤S04可以基于一个TCN网络和一个BILSTM网络预测对应的预测分量值;也可以基于一个TCN网络和多个BILSTM网络预测对应的预测分量值;也可以基于多个TCN网络和一个BILSTM网络预测对应的预测分量值;也可以基于多个TCN网络和多个BILSTM网络预测对应的预测分量值;TCN网络和BILSTM网络的数量可以根据实际需求进行设置。
在一个具体的实施例中,为高效预测两个或者两个以上的目标子模态矩阵对应的预测分量值,根据目标子模态矩阵的数量设置了对应数量的TCN网络和BILSTM网络。进一步地,将两个或者两个以上目标子模态矩阵分别输入对应的TCN网络,通过对应的TCN网络捕捉对应目标子模态矩阵中的时序特征;将两个或者两个以上时序特征分别输入对应的BILSTM网络,通过对应的BILSTM网络根据对应的时序特征预测对应子模态序列向量的预测分量值。
在其他的一个或者一些实施例中,如图1和图2所示,所述湖泊水质预测方法还包括如下步骤:S05、汇总所述预测分量值,获得待预测水质指标的第一预测值。
进一步地,步骤S05中所述的汇总所述预测分量值,获得待预测水质指标的第一预测值,具体包括如下步骤:线性叠加全部预测分量值,获得待预测水质指标的第一预测值。
在其他的一个或者一些实施例中,还可以设置不同目标子模态矩阵对应的预测分量值的占比,进而获得通过加权参数结合对应的预测分量值,叠加获得待预测水质指标的第一预测值。
在一个具体的实施例中,基于步骤S01至步骤S05提出了一种VMD-RF-TCN-BILSTM混合网络模型,用以预测鄱阳湖总氮(TN)含量。进一步地,所述VMD用于分解第一序列,获得两组或者两组以上的子模态序列;所述RF用于根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标;所述TCN用于提取目标子模态矩阵中子模态序列向量与第二序列向量的时序特征;所述BILSTM用于基于所述目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值。
在本实施例中,具体为鄱阳湖都昌站2021年6月15日到2023年4月12日期间每日水质监测数据。该历史水质数据中包含溶解氧(DO)、水温(WT)、pH值、高锰酸盐指数(CODMn)、氨氮(NH3-N)、总磷(TP)、总氮(TN)和浊度(TU)共8项水质指标。具体地,待预测水质指标为总氮(TN),参考水质指标包括溶解氧(DO)、水温(WT)、pH值、高锰酸盐指数(CODMn)、氨氮(NH3-N)、总磷(TP)以及浊度(TU)。
基于上述历史水质指标数据,分别利用TCN、BILSTM、VMD-BILSTM、VMD-RF-BILSTM、TCN-BILSTM、VMD-RF-TCN-BILSTM,6个预测模型进行总氮(TN)预测,任一个模型的预测性能如下表所示:
预测模型 RMSE(mg/L) MSE(mg/L) MAE(mg/L) R2
TCN 0.249 0.062 0.219 0.794
BILSTM 0.223 0.050 0.141 0.835
VMD-BILSTM 0.177 0.031 0.120 0.895
VMD-RF-BILSTM 0.152 0.023 0.094 0.923
TCN-BILSTM 0.128 0.017 0.088 0.945
VMD-RF-TCN-BILSTM 0.088 0.008 0.069 0.974
其中,R2为决定系数,用于判断模型的拟合程度,其值越接近于1,表示模型拟合的越好;RMSE为均方根误差,MSE为均方误差,MAE表示平均绝对误差,RMSE、MSE和MAE均用于衡量的是真实值和预测值之间的偏差情况,值越小,表示模型预测越准确。
根据上表内容可知,相比于单一模型(TCN或者BILSTM),VMD-BILSTM预测模型具有更好的预测表现,这是因为VMD将非平稳的原始序列分解为数个相对平稳的子模态分量,提高了模型预测性能。
进一步地,使用RF算法对子模态分量进行特征选择后,VMD-RF-BILSTM预测模型的效果更好;相较于VMD-BILSTM预测模型的RMSE、MSE、MAE,其RMSE、MSE、MAE分别下降了14.12%、25.81%、21.67%,这是由于RF算法提取出了水质信息的隐藏特征,剔除了无关特征。
更进一步地,本发明所提出的TCN-BILSTM总体预测效果较好,这是因为TCN捕捉到了序列的时间动态特征,而自注意力机制进一步增强了模型学习能力,突出了数据中的重要部分。为消除噪声的影响,进一步提升混合模型的预测精度引入了VMD和RF算法,对应生成了VMD-RF-TCN-BILSTM预测模型,相比TCN-BILSTM预测模型的RMSE、MSE、MAE,其RMSE、MSE、MAE分别下降了31.25%、52.94%、21.59%,R2提高了2.98%。
为获得更加精准的水质指标预测值,在其他的一个或者一些实施例中,如图1和图2所示,所述湖泊水质预测方法还包括如下步骤:S06、利用所述第一序列结合所述第一预测值,生成残差序列;通过所述残差序列,预测所述第一序列与所述第一预测值之间的残差值;利用所述残差值修正所述第一预测值,获得待预测水质指标的第二预测值。
进一步地,所述残差序列可通过如下方式生成:结合所述第一序列和所述第一预测值,根据结合的序列中相邻两项待预测水质指标数据的差值,按照时序排列所述差值生成残差序列。相比于第一序列,残差序列的特征更少,数据结构更简单,有助于提升修正第一预测值的实施效率。
进一步地,所述通过所述残差序列,预测所述第一序列与所述第一预测值之间的残差值,包括如下步骤:将所述残差序列输入BIGRU网络,通过所述BIGRU网络预测所述第一序列与所述第一预测值之间的残差值。
其中,BIGRU网络是利用双向GRU(Gated Recurrent Unit)单元来处理输入序列的网络模型;其中,GRU是LSTM的一种变体,GRU将LSTM原有的三个门控单元减少到两个,从而提高了训练速度,同时在模型效果上与LSTM相当。
基于上述实施例中根据步骤S01至步骤S05,通过构建的VMD-RF-TCN-BILSTM混合网络模型预测的鄱阳湖总氮(TN)含量的第一预测值,在本实施例中,进一步通过步骤S06进行修正。
具体的,上述VMD-RF-TCN-BILSTM混合网络模型进一步调整为VMD-RF-TCN-BILSTM-BIGRU混合网络模型。基于上述历史水质指标数据,分别利用VMD-RF-TCN-BILSTM和VMD-RF-TCN-BILSTM-BIGRU,2个预测模型进行总氮(TN)预测,两个预测模型的预测性能如下表所示:
预测模型 RMSE(mg/L) MSE(mg/L) MAE(mg/L) R2
VMD-RF-TCN-BILSTM 0.088 0.008 0.069 0.974
VMD-RF-TCN-BILSTM-BIGRU 0.049 0.002 0.030 0.992
如上表所示,相较于VMD-RF-TCN-BILSTM的RMSE、MSE和MAE,VMD-RF-TCN-BILSTM-BIGRU通过BIGRU进行残差修正,其RMSE、MSE和MAE分别下降了44.31%、75%和56.52%,R2提高了1.82%,达0.992;VMD-RF-TCN-BILSTM-BIGRU通过BIGRU进行残差修正,能够抑制第一预测结果中的出现的高值低估的现象,具有更强的泛化能力。
在其他的一个或者多个实施中,为高效预测多个水质参数,利用通过构建多个上述VMD-RF-TCN-BILSTM预测模型或者VMD-RF-TCN-BILSTM-BIGRU预测模型;分别利用VMD-RF-TCN-BILSTM预测模型或者VMD-RF-TCN-BILSTM-BIGRU预测模型预测对应的水质指标数据,进而实现同时高效预测多个水质指标。
在其他的一个或者多个实施例中,本发明还提供了一种湖泊水质预测系统,请参见图3,图3为本发明实施例所提供的湖泊水质预测系统结构示意图。
如图3所示,所述湖泊水质预测系统包括输入设备、处理器、存储器和输出设备,所述输入设备、所述处理器、所述存储器和所述输出设备相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行所述湖泊水质预测方法。
进一步地,所述输入设备用于接收目标水域的历史水质指标数据,这些数据是进行水质预测的基础。在实际实施中,输入设备可以是各种传感器或数据采集设备,例如水质监测仪器、气象站等。这些设备可以通过现有技术与系统连接,将实时数据传输到系统中。
进一步地,所述处理器是系统的核心,负责执行湖泊水质预测方法中定义的计算机程序。它调用存储在存储器中的程序指令,实施湖泊水质预测算法。处理器通过对输入数据的处理和分析,生成水质预测结果。
进一步地,所述存储器用于存储湖泊水质预测系统的计算机程序,包括程序指令和相关数据。这些数据可能包括历史水质指标数据、训练好的神经网络模型参数等。例如利用使用云存储服务,将湖泊水质监测数据、模型参数等存储在可靠、可扩展的云存储系统中,以便随时访问和更新。
更进一步地,所述计算机程序是存储在存储器中的一系列程序指令,实现湖泊水质预测方法中描述的各项功能,包括数据处理、神经网络模型训练与预测、时序分析等。在其他的一个或者一些实施例中,所述计算机程序具体可以是使用C、C++、Python等编程语言编写程序,集成机器学习库(如TensorFlow、PyTorch)实现神经网络模型,并结合统计学方法进行水质预测。
进一步地,所述输出设备用于显示或传递水质预测结果。这可以包括图形界面、报告生成、数据导出等功能,使用户能够有效地理解和利用预测结果。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (7)

1.一种湖泊水质预测方法,其特征在于,包括如下步骤:
分解第一序列,获得两组或者两组以上的子模态序列,所述第一序列为待预测水质指标的历史数据序列;所述分解第一序列,获得两组或者两组以上的子模态序列,包括如下步骤:基于所述第一序列构建变分约束方程,求解所述变分约束方程获得两组或者两组以上的子模态序列;
根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标,所述第二序列为参考水质指标的历史数据序列;所述根据所述子模态序列与第二序列之间的相关性,匹配所述子模态序列的参考水质指标,包括如下步骤:将两组或者两组以上的子模态序列分别输入随机森林模型,所述随机森林模型用于根据所述子模态序列与所述第二序列之间的相关性,对所述子模态序列进行分类;通过所述随机森林模型对所述子模态序列的分类结果,匹配所述子模态序列对应的参考水质指标,任一子模态序列匹配一项或者多项参考水质指标;
根据匹配结果,生成两组或者两组以上的目标子模态矩阵,任一组目标子模态矩阵包括一组子模态序列向量,以及一组或者多组第二序列向量;
分别基于所述目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值;
汇总所述预测分量值,获得待预测水质指标的第一预测值;
利用所述第一序列结合所述第一预测值,生成残差序列;
通过所述残差序列,预测所述第一序列与所述第一预测值之间的残差值;
利用所述残差值修正所述第一预测值,获得待预测水质指标的第二预测值。
2.根据权利要求1所述的湖泊水质预测方法,其特征在于,还包括获取所述第一序列,所述获取所述第一序列,包括如下步骤:
获取目标水域的历史水质指标数据,并整理所述历史水质指标数据,所述历史水质指标数据包括待预测水质指标数据;
从所述历史水质指标数据中筛选出待预测水质指标数据,并利用所述待预测水质指标数据生成所述第一序列。
3.根据权利要求1所述的湖泊水质预测方法,其特征在于,还包括获取所述第二序列,所述获取所述第二序列,包括如下步骤:
获取目标水域的历史水质指标数据,并整理所述历史水质指标数据,所述历史水质指标数据包括参考水质指标数据;
从所述历史水质指标数据中筛选出参考水质指标数据,并利用所述参考水质指标数据生成所述第二序列。
4.根据权利要求1所述的湖泊水质预测方法,其特征在于,所述分别基于所述目标子模态矩阵中子模态序列向量与第二序列向量的时序特征,获得对应子模态序列向量的预测分量值,其中,任一所述预测分量值,包括如下获取步骤:
将一组目标子模态矩阵输入到TCN网络,通过所述TCN网络捕捉所述子模态序列向量与所述第二序列向量的时序特征;
将所述时序特征输入BILSTM网络,通过所述BILSTM网络根据所述时序特征预测所述子模态序列向量的预测分量值。
5.根据权利要求1所述的湖泊水质预测方法,其特征在于,所述汇总所述预测分量值,获得待预测水质指标的第一预测值,包括如下步骤:
线性叠加全部预测分量值,获得待预测水质指标的第一预测值。
6.根据权利要求1所述的湖泊水质预测方法,其特征在于,所述通过所述残差序列,预测所述第一序列与所述第一预测值之间的残差值,包括如下步骤:
将所述残差序列输入BIGRU网络,通过所述BIGRU网络预测所述第一序列与所述第一预测值之间的残差值。
7.一种湖泊水质预测系统,其特征在于,包括输入设备、处理器、存储器和输出设备,所述输入设备、所述处理器、所述存储器和所述输出设备相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1至6任一项所述的湖泊水质预测方法。
CN202410140864.7A 2024-02-01 2024-02-01 一种湖泊水质预测方法及系统 Active CN117670147B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410140864.7A CN117670147B (zh) 2024-02-01 2024-02-01 一种湖泊水质预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410140864.7A CN117670147B (zh) 2024-02-01 2024-02-01 一种湖泊水质预测方法及系统

Publications (2)

Publication Number Publication Date
CN117670147A CN117670147A (zh) 2024-03-08
CN117670147B true CN117670147B (zh) 2024-04-19

Family

ID=90075410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410140864.7A Active CN117670147B (zh) 2024-02-01 2024-02-01 一种湖泊水质预测方法及系统

Country Status (1)

Country Link
CN (1) CN117670147B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219126A (zh) * 2021-11-12 2022-03-22 三峡大学 基于残差修正的小水电渗透地区网供负荷预测方法
CN115271219A (zh) * 2022-08-01 2022-11-01 国网青海省电力公司 一种基于因果关系分析的短期负荷预测方法及预测系统
CN116451553A (zh) * 2022-11-09 2023-07-18 中国计量大学 一种改进的变分模态分解与BiGRU融合的水质预测方法
CN116720057A (zh) * 2023-06-09 2023-09-08 凯铭科技(杭州)有限公司 基于特征筛选与权值分配的江河水质预测方法及系统
CN117035155A (zh) * 2023-06-26 2023-11-10 西南交通大学 一种水质预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230108916A1 (en) * 2021-10-05 2023-04-06 Indian Institute Of Technology Bombay Method and system for forecasting non-stationary time-series

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219126A (zh) * 2021-11-12 2022-03-22 三峡大学 基于残差修正的小水电渗透地区网供负荷预测方法
CN115271219A (zh) * 2022-08-01 2022-11-01 国网青海省电力公司 一种基于因果关系分析的短期负荷预测方法及预测系统
CN116451553A (zh) * 2022-11-09 2023-07-18 中国计量大学 一种改进的变分模态分解与BiGRU融合的水质预测方法
CN116720057A (zh) * 2023-06-09 2023-09-08 凯铭科技(杭州)有限公司 基于特征筛选与权值分配的江河水质预测方法及系统
CN117035155A (zh) * 2023-06-26 2023-11-10 西南交通大学 一种水质预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
TCN water level prediction based on feature decomposition and reconstruction;Feihu Wang等;《 2021 7th International Conference on Hydraulic and Civil Engineering & Smart Water Conservancy and Intelligent Disaster Reduction Forum (ICHCE & SWIDR)》;20211229;全文 *
基于时空相关性的NAR动态神经网络风功率超短期组合预测;黄慧;贾嵘;董开松;;太阳能学报;20201028(10);全文 *
基于自动分发多级分解TCN-BiLSTM-LightGBM家庭PV发电量预测;杨建英;;电子制作;20200927(19);全文 *

Also Published As

Publication number Publication date
CN117670147A (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
Jaseena et al. Decomposition-based hybrid wind speed forecasting model using deep bidirectional LSTM networks
Chen et al. Short-term wind speed forecasting based on long short-term memory and improved BP neural network
Ma et al. A hybrid attention-based deep learning approach for wind power prediction
CN111242377B (zh) 一种集成深度学习和数据去噪的短期风速预测方法
CN114549925A (zh) 一种基于深度学习的海浪有效波高时间序列预测方法
CN112434891A (zh) 基于wcnn-alstm的太阳辐照度时间序列的预测方法
CN113673768A (zh) 基于vmd和cnn-lstm的风功率概率预测模型
Yang et al. One-dimensional deep attention convolution network (ODACN) for signals classification
CN117150359A (zh) 基于模型无关元学习的小样本故障诊断方法、系统、装置及介质
Cheng et al. Online power system event detection via bidirectional generative adversarial networks
CN116151464A (zh) 一种光伏发电功率预测方法、系统及可存储介质
CN117670147B (zh) 一种湖泊水质预测方法及系统
Wang et al. A hybrid deep learning method based on CEEMDAN and attention mechanism for network traffic prediction
CN116737681A (zh) 一种实时异常日志检测方法、装置、计算机设备和存储介质
Safari et al. A spatiotemporal wind power prediction based on wavelet decomposition, feature selection, and localized prediction
Ji et al. Multivariate time series prediction of high dimensional data based on deep reinforcement learning
Jin et al. A hybrid prediction framework based on deep learning for wind power
Zhang et al. A power data reconstruction method based on super-resolution generative adversarial network
Li et al. Scenario Generation of Renewable Energy Based on Improved Diffusion Model
CN114547976B (zh) 基于金字塔变分自编码器的多采样率数据软测量建模方法
CN117390967B (zh) 海上风电短期功率预测方法、装置、设备及存储介质
Wang et al. A Hybrid Wind Speed Prediction Model Based on Signal Decomposition and Deep 1DCNN
Yan et al. Short-term wind power prediction based on singular spectrum analysis and modified ConvBiGRU
Huangfu et al. Short-term Forecast of Wind Speed Based on Hybrid Multi-Stage Decomposition and LSTM Optimized by an Improved WOA
CN116979533B (zh) 融合自适应小波的自注意力风电场功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant