CN116522648A - 湖泊藻类状态预测方法及应用 - Google Patents
湖泊藻类状态预测方法及应用 Download PDFInfo
- Publication number
- CN116522648A CN116522648A CN202310490943.6A CN202310490943A CN116522648A CN 116522648 A CN116522648 A CN 116522648A CN 202310490943 A CN202310490943 A CN 202310490943A CN 116522648 A CN116522648 A CN 116522648A
- Authority
- CN
- China
- Prior art keywords
- algae
- data
- lake
- algae density
- remote sensing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000195493 Cryptophyta Species 0.000 title claims abstract description 276
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000007667 floating Methods 0.000 claims abstract description 49
- 230000033001 locomotion Effects 0.000 claims abstract description 33
- 238000013508 migration Methods 0.000 claims abstract description 30
- 230000005012 migration Effects 0.000 claims abstract description 30
- 230000007246 mechanism Effects 0.000 claims abstract description 28
- 239000000126 substance Substances 0.000 claims abstract description 11
- 238000006243 chemical reaction Methods 0.000 claims abstract description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 51
- 238000002310 reflectometry Methods 0.000 claims description 29
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000012549 training Methods 0.000 claims description 15
- 238000003860 storage Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000001514 detection method Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 230000002354 daily effect Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000012937 correction Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000005855 radiation Effects 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 241000192700 Cyanobacteria Species 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000009792 diffusion process Methods 0.000 description 4
- 230000003203 everyday effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000000546 chi-square test Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 239000011574 phosphorus Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 229930002868 chlorophyll a Natural products 0.000 description 1
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000036284 oxygen consumption Effects 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 238000003911 water pollution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/12—Simultaneous equations, e.g. systems of linear equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Algebra (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Geometry (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种湖泊藻类状态预测方法及应用,该方法包括:获取历史藻密度数据,构建藻密度数据集;基于藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率;基于藻类水平迁移机理模型和垂向运动规律预测湖泊藻类状态,其中,藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。该方法结合藻类水平迁移机理模型和垂向运动规律来预测湖泊藻类状态,优化了原有的纯数据驱动或机理驱动的藻类预测模型,提升了湖泊藻类状态的预测结果精度。
Description
技术领域
本发明是关于湖泊藻类监测技术领域,特别是关于一种湖泊藻类状态预测方法及应用。
背景技术
目前大量研究以湖泊蓝藻水华暴发监测为主,田晨等(一种利用贝叶斯优化的蓝藻遥感分类方法)利用哨兵2号卫星影像对蓝藻进行智能化提取;朱雨新等(基于遥感反射率的太湖优势藻识别方法)利用OLCI影像数据建立蓝藻光谱特征识别太湖优势藻种;申请号为CN202111302770.8的中国专利提出一种水、陆、空一体化的浅水湖泊蓝藻水华监测及预警系统;申请号为CN201910104708.4的中国专利提出一种基于OLCI的内陆富营养化湖泊水体蓝藻生物量比例遥感估算方法,该专利技术介绍了一种地面站点和遥感反射率数据耦合的方法,能够实现OLCI数据的藻密度估算。上述方法,通过水质站点或遥感影像等方法对湖库水环境进行监测,形成对监测区域藻情动态监测,但该类产品仅能做到对藻情暴发的实时监测,难以做到对未来被监测区域藻情暴发的及时预判。
目前针对于藻类预测的研究主要分为两种:机理驱动模型、数据驱动模型。机理驱动模型方法主要以中国专利申请CN201910471247.5提出的一种面向湖泊蓝藻灾害的立体监控及数据挖掘系统和方法,该方法模拟藻类的生长、消亡、沉浮、被捕食以及随水动力的迁移过程,其预测原理具有较强的理化性质。但由于实际理化机制参数十分复杂,且模型运行的理化参数一般源于藻类仿真实验室的生态实验,难以与真实湖泊生态参数相匹配,最终导致预测结果存在可靠性下降、预测质量不足等缺陷;同时由于其计算机制复杂,需要消耗大量机时参与模型计算的同时,仍需要大量不同类型的数据驱动机理模型运行,预测结果较差时需重新率定模型参数,后期模型维护难度与成本较高。
另一种数据驱动模型,基于数理统计、机器学习、数据挖掘等方法,对藻类暴发样本数据中隐含的内在规律进行挖掘,即利用数学手段分析气象、水质等多要素因子对藻类暴发的影响,样本数据对总体的估计程度越高,模型效果越好。目前主要研究进展如:申请号为CN202010493176.0的中国专利提出一种基于气象数据的蓝藻水华的预测方法和装置利用概率统计方法,对蓝藻暴发概率进行预测;申请号为CN202211042230.5的中国专利提出一种蓝藻密度预测方法、装置、电子设备及介质利用利用深度学习方法,依托长时序的站点监测数据,实现了站点藻密度的预测。
数据驱动模型相比于机理模型,其算法复杂度大幅降低,在研究时间范围内能够取得较好的蓝藻预测结果。但该类方法脱离了真实的理化性质,其计算结果的可理解性较差,且在实际蓝藻暴发预测中难以取得良好的应用效果。
公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。
发明内容
本发明的目的在于提供一种湖泊藻类状态预测方法及应用,其用以解决现有技术中对藻情监测预警不准确的技术问题。
为实现上述目的,本发明的实施例提供了一种湖泊藻类状态预测方法,所述方法包括:
获取历史藻密度数据,构建藻密度数据集;
基于所述藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,所述垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率;
基于藻类水平迁移机理模型和所述垂向运动规律预测湖泊藻类状态,其中,所述藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。
在本发明的一个或多个实施方式中,所述获取历史藻密度数据,构建藻密度数据集,具体包括:
基于藻类在空间中的点位,获取待预测日之前的N个周期内每个点位的藻密度数据;
筛选N个周期内每个点位对应的最大藻密度数据,并基于所有点位对应的最大藻密度数据构建藻密度数据集。
在本发明的一个或多个实施方式中,所述获取历史藻密度数据,具体还包括:
获取历史卫星遥感影像数据,其中,所述历史卫星遥感影像数据包括GOCI-II卫星遥感反射率数据;
将所述GOCI-II卫星遥感反射率数据输入预训练的水质反演模型,以得到历史藻密度数据。
在本发明的一个或多个实施方式中,所述方法还包括:
获取卫星遥感影像样本数据和对应的水质检测样本数据;
将所述卫星遥感影像样本数据和对应的水质检测样本数据进行地理空间匹配,以构建训练样本集;
基于所述训练样本集训练所述水质反演模型。
在本发明的一个或多个实施方式中,所述方法还包括:
对所述GOCI-II卫星遥感反射率数据的首个波段进行云层判别,以确定所述卫星遥感影像数据中的含云量;
保留含云量小于设定阈值的所述卫星遥感影像数据。
在本发明的一个或多个实施方式中,基于所述藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,具体包括:
基于所述藻密度数据集,对具有沉浮现象的点位对应的藻密度数据进行正态分布统计,以确定所述湖泊藻类的上浮折点藻密度;和/或,
将实时气象数据以及所述藻密度数据集作为特征变量进行回归计算,以确定所述湖泊藻类的每日上浮与下沉折点时刻;和/或,
基于所述藻密度数据集,统计前后连续两个周期内每个点位的藻密度数据,分别计算所述湖泊藻类的上浮速率和下沉速率。
在本发明的一个或多个实施方式中,所述实时气象数据为点位数据,所述方法还包括:
基于时间插值将所述实时气象数据转换为与所述GOCI-II卫星遥感反射率数据的时间节点相对应的逐时数据;
基于空间插值将所述逐时数据转换为栅格数据。
在本发明的另一个方面当中,还提供了一种湖泊藻类状态预测系统,所述系统包括:
获取模块,用于获取历史藻密度数据,构建藻密度数据集;
计算模块,用于基于所述藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,所述垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率;
预测模块,用于基于藻类水平迁移机理模型和所述垂向运动规律预测湖泊藻类状态,其中,所述藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。
在本发明的另一个方面当中,还提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的湖泊藻类状态预测方法。
在本发明的另一个方面当中,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的湖泊藻类状态预测方法。
与现有技术相比,根据本发明实施方式的湖泊藻类状态预测方法及应用,其利用历史藻密度数据以及对应的实时气象数据计算出湖泊藻类的垂向运动规律,并结合藻类水平迁移机理模型和垂向运动规律预测湖泊藻类状态,优化了原有的纯数据驱动或机理驱动的藻类预测模型,提升了湖泊藻类状态的预测结果精度。
另一方面,本发明在计算机制上优化传统模型中与藻类密度相关的计算过程,通过数据驱动的方法表达藻类垂向运动规律与水动力对藻类的水平迁移与扩散作用,大幅降低传统模型代码冗余性,提升预测的时效性。
附图说明
图1是根据本发明一实施方式的湖泊藻类状态预测方法的流程图;
图2是根据本发明一实施方式的湖泊藻类状态预测方法中水质反演模型的训练流程图;
图3是根据本发明一实施方式的湖泊藻类状态预测系统的结构示意图;
图4是根据本发明一实施方式的湖泊藻类状态预测的电子设备的硬件结构图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
除非另有其它明确表示,否则在整个说明书和权利要求书中,术语“包括”或其变换如“包含”或“包括有”等等将被理解为包括所陈述的元件或组成部分,而并未排除其它元件或其它组成部分。
参图1,介绍本发明湖泊藻类状态预测方法的一实施例,在本实施例中,该方法包括:
S101、获取历史藻密度数据,构建藻密度数据集。
本实施例中,可以通过对湖泊藻类的历史藻密度数据进行数据分析,根据分析结果来预测未来时间内的藻类状态。其中,历史藻密度数据可以依托卫星遥感影像数据通过水质反演得到。
具体地,本实施例中,首先可以通过网络爬取卫星遥感影像数据,该卫星遥感影像数据包括GOCI-II卫星遥感反射率数据,具体可以通过官网http://210.110.189.23/data/GOCI-II/爬取得到,该网站的GOCI-II卫星遥感反射率数据每日从7:00-16:00进行逐时更新,空间分辨率为250m,满足大型湖泊(≧500平方千米)的水环境监测需求,可实现对湖泊水质变化情况的全天候监测。
由于爬取到的卫星遥感影像数据可能包含某区域云量较大的遥感影像数据,在本实施例中,只统计含云量在设定阈值之内的遥感影像数据,含云量大于设定阈值的遥感影像数据则不具备监测和统计的意义,因此,需要将含云量大于设定阈值的遥感影像数据去除。
本实施例中,可通过云检测算法对GOCI-II卫星遥感反射率数据的首个波段(即第一个波段B1,其中心波长为380nm)进行云层判别,判别条件设定为B1≥0.3,并以此结果计算卫星遥感影像数据的含云量,保留研究区域内云量小于30%的卫星遥感影像数据,而云量大于30%的则不具备监测和统计意义。
为了确保水质反演结果的准确性,对保留下来的GOCI-II卫星遥感反射率数据进行预处理,具体包括对该数据进行重投影、大气校正、辐射校正等操作。其中重投影操作是将投影坐标系转换为WGS 1984UTM;大气校正可消除遥感影像中由大气散射和吸收引起的辐射误差;辐射校正可消除或改正因辐射误差而引起的遥感影像畸变。大气校正和辐射校正的方法可直接参考GOCI-II官网指导文件,此处不再做详细说明。
然后将预处理后的GOCI-II卫星遥感反射率数据输入预训练的水质反演模型,最终生成湖泊藻类的藻密度数据,从而可得到湖泊藻类的历史藻密度数据。
本实施例中,水质反演模型的构建过程主要是以GOCI-II卫星遥感反射率数据的特征变量为自变量,实测水质数据为因变量,通过分析GOCI-II卫星遥感反射率数据的光谱特征,建立波段比值、波段插值、归一化值等多变量特征工程,利用卡方检验、Gini指数等选取GOCI-II卫星遥感反射率数据的重要特征变量作为自变量,并结合XGBoost、SVM等机器学习回归算法拟合自变量和因变量,进行反演模型训练,最后生成水质反演模型。
其中,建立波段比值、波段插值、归一化值等多变量特征工程的目的是挖掘出GOCI-II卫星遥感反射率数据更多的光谱特征,能够有效提升反演算法的精度。进一步地,常用的特征变量除常规波段以外,还可以是其他波段,例如下表1所示的其他波段特征变量。
表中:NDVI为归一化植被指数,NDWI为水体指数,MNDWI为归一化差异水体指数,NDTI为归一化热差指数,WRI为水质污染指数。
可利用卡方检验和Gini指数等方法对GOCI-II卫星遥感反射率数据的所有特征变量进行重要性评价,按照特征的重要性对所有特征变量进行排序,可选取前20%的特征变量作为重要变量,用于水质反演模型的构建。
本实施例中,利用机器学习的方法对反演模型进行训练,主要是将GOCI-II卫星遥感反射率数据以及对应点位的水质监测数据进行同化,构建训练集对反演模型进行训练,以得到最终的水质反演模型。
其中,水质监测数据是指在监测区域内利用站点或人工巡测等方式,对湖泊固定点位水样进行采样、水质状况测算等操作后得到的水质指标数据,其主要包含藻密度、叶绿素a指标等数据。
具体训练过程参图2,首先获取卫星遥感影像样本数据和对应的水质检测样本数据,其中,卫星遥感影像样本数据包含GOCI-II卫星遥感反射率数据,然后将GOCI-II卫星遥感反射率数据和对应点位的水质检测样本数据进行地理空间匹配,同样利用卡方检验、Gini指数等选取GOCI-II卫星遥感反射率数据的重要特征变量,构建训练样本集以及测试样本集,最后将该训练样本集输入反演模型,利用该训练样本集训练反演模型,直至满足训练条件。
进一步地,利用测试样本集对所得到的反演模型进行测试,并利用平均绝对百分比误差(MAPE)、相关系数(R)、均方根误差(RMSE)等多个评价指标对反演模型进行精度评价,最后选择测试集结果MAPE<20%、R>0.8的反演模型确定为最终的水质反演模型。
如此,通过将历史卫星遥感影像数据输入所得到的水质反演模型中进行反演,最终可得到所需的历史藻密度数据。
进一步地,历史藻密度数据可以是待预测日之前的N个周期内每个点位的藻密度数据,然后筛选出N个周期内每个点位对应的最大藻密度数据,并基于所有点位对应的最大藻密度数据构建藻密度数据集。
在本实施例中,可以将每个小时对应的时间点作为一个周期,并选择待预测日之前的前三天共计N个小时内所有点位的藻密度数据为历史藻密度数据。
具体地,根据藻类在空间中的点位,获取待预测日之前的前三天共计N个小时内所有点位的藻密度数据,并将每个小时内所有点位对应的藻密度数据分别构建为一个藻密度空间矩阵,可得到N个藻密度空间矩阵,然后利用逐像元方法通过矩阵索引查找最大值的方式,筛选出每个藻密度空间矩阵中的每个点位对应的藻密度最大值,最后将每个点位对应的藻密度最大值构建为藻密度数据集。
示范性地,设藻密度空间矩阵用ADk=[X,Y]表示,X表示藻类在东西方向上的网格节点,Y表示藻类在南北方向上的网格节点,XxY构成一个点位,k为(0,N]内的任意整数。假设藻类在空间中共有176×176个点位,则每个小时内所有点位对应的藻密度数据构建的藻密度空间矩阵ADk均为176×176;假设N为30个小时,则对应有30个176×176的藻密度空间矩阵。
利用逐像元方法通过矩阵索引查找最大值的方式,分别筛选出这30个藻密度空间矩阵每个点位对应的藻密度最大值,并生成藻密度最值矩阵ADmax(i,j),其中,i为(0,X]内任意整数,j为(0,Y]内任意整数。最后,对藻密度最值矩阵ADmax(i,j)进行标准化,得到输入水质反演模型所需的数据格式,最后将其构建为藻密度数据集。
S102、基于藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率。
垂向运动规律是指湖泊藻类在垂直方向上的迁移过程,通过对历史藻密度数据进行统计分析,发现每日藻类垂向运动规律主要分为下沉与上浮阶段,而其中下沉与上浮阶段中间状态突变时间点即为上下沉浮时间折点。且上浮折点藻密度和每日上浮与下沉折点时刻分别用于表征湖泊藻类的最大面积以及爆发程度最强时刻。
具体地,在本实施例中,上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率的计算过程分别为:
1)湖泊藻类的上浮折点藻密度的具体计算过程为:基于藻密度数据集,对具有沉浮现象的点位对应的藻密度数据进行正态分布统计,以确定湖泊藻类的上浮折点藻密度。
计算出藻类的上浮折点藻密度的目的是为了确定每个点位藻密度上浮与下沉所需要的初始浓度阈值。经经验统计得到初始浓度阈值为100*104cells/L。本实施例中,对前后两个时刻藻密度变化绝对值小于100*104cells/L的情况进行统计分析,结果表明,藻密度不变化情况主要发生于藻密度数值在0*104cells/L至1250*104cells/L之间,其累计频率为97.44%,其中,藻密度总量数据基本符合正态分布,则取藻类上浮和下沉折点藻密度为1250*104cells/L,即湖泊藻类的上浮折点藻密度为1250*104cells/L。
2)湖泊藻类的每日上浮与下沉折点时刻的具体计算过程为:主要依托实时气象数据以及藻密度数据集,将实时气象数据以及藻密度数据集作为特征变量,并利用水质反演模型进行回归计算,从而得到湖泊藻类的每日上浮与下沉折点时刻。
其中,实时气象数据是指通过气象网站、气象站等渠道实时获取的监测区域内的气象数据情况,该气象数据类型主要包含气温、风速、风向、气压、湿度、云量、降雨量等数据。
进一步地,本实施例中的实时气象数据为点位数据,需要对其进行预处理,以得到输入水质反演模型所需的数据格式。具体地,首先基于时间插值将实时气象数据转换为与GOCI-II卫星遥感反射率数据的时间节点相对应的逐时数据,然后再基于空间插值将逐时数据转换为栅格数据。
3)湖泊藻类的上浮速率和下沉速率的具体计算过程分别为:基于藻密度数据集,统计前后连续两个周期内每个点位的藻密度数据,分别计算湖泊藻类的上浮速率和下沉速率。
其中,上浮速率的具体计算公式为:
下沉速率的具体计算公式为:
式中,ADt1表示在后一周期内每个点位对应的藻密度数据,ADt0表示在前一周期内每个点位对应的藻密度数据,t0代表当前时刻,tmax代表藻类上浮与下沉的折点时刻。
S103、基于藻类水平迁移机理模型和垂直运动规律预测湖泊藻类状态,其中,藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。
其中,水动力控制方程组为:
式中:u、v、w分别代表坐标系中x、y、σ方向流速;H、ξ、ρ、ρ0分别代表水深、水位、水体密度、水体参考密度;t代表计算时间,f、g分别代表科氏力、重力加速度;Bx、By分别代表x、y方向动量,Ah、Av分别代表水平、垂向涡粘性系数;v0、m0、m1分别为5*10-6m2/s、0.1、-1;l为普朗特长度、Ri代表反应流体稳定性状态的理查德森数;(τwx,τwy)、(τsx,τsy)分别代表σ=1的水气交界处风能输入与σ=0水土交界处的摩擦损耗;ρs、ρa分别代表表层水体密度、空气密度;CWD代表风速拖曳系数;WSx、WSy代表水面10m以上x、y方向风速;CSD代表湖底摩擦系数。
温度控制方程组为:
式中:BT代表温度方程在坐标变换中被引入的小项,T、Sh、Cp分别代表温度、外部进入系统的热量、水体热容;Kv、Kh分别代表热能在水平及垂直方向的扩散系数。
藻类物质迁移转化方程组为:
式中:Q代表藻密度。
传统的机理模型需要在计算机制上考虑不同类型水质变量如氮、磷等对藻类生长的影响机理,故需要对总氮、总磷、溶解氧、生物耗氧量等水质变量进行预测计算,由此会引发模型算法复杂度偏高、预测效率低下等问题。
本发明在计算机制上优化传统模型中与藻类密度计算过程,通过数据驱动方法表达藻类垂向运动规律与水动力对藻类的水平迁移与扩散作用,大幅降低传统模型代码冗余性,提升模型预测的时效性,保证蓝藻预测模型的高效运行。
参图3,介绍本发明湖泊藻类状态预测系统的一实施例,在本实施例中,该系统包括获取模块201、计算模块202和预测模块203。
获取模块201,用于获取历史藻密度数据,构建藻密度数据集,藻密度数据集包含湖泊藻类的藻密度数据以及水质监测数据;
计算模块202,用于基于藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率;
预测模块203,用于基于藻类水平迁移机理模型和垂直运动规律预测湖泊藻类状态,其中,藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。
一实施方式中,获取模块201具体用于:基于藻类在空间中的点位,获取待预测日之前的N个周期内每个点位的藻密度数据;筛选N个周期内每个点位对应的最大藻密度数据,并基于所有点位对应的最大藻密度数据构建藻密度数据集。
一实施方式中,获取模块201具体还用于:获取历史卫星遥感影像数据,其中,历史卫星遥感影像数据包括GOCI-II卫星遥感反射率数据;将GOCI-II卫星遥感反射率数据输入预训练的水质反演模型,以得到历史藻密度数据。
一实施方式中,获取模块201具体还用于:获取卫星遥感影像样本数据和水质检测样本数据;将卫星遥感影像样本数据和对应的水质检测样本数据进行地理空间匹配,以构建训练样本集;基于训练样本集训练所述水质反演模型。
一实施方式中,获取模块201具体还用于:对GOCI-II卫星遥感反射率数据的首个波段进行云层判别,以确定卫星遥感影像数据中的含云量;保留含云量小于设定阈值的卫星遥感影像数据。
一实施方式中,计算模块202具体用于:基于藻密度数据集,对具有沉浮现象的点位对应的藻密度数据进行正态分布统计,以确定湖泊藻类的上浮折点藻密度;和/或,
将实时气象数据以及藻密度数据集作为特征变量进行回归计算,以确定湖泊藻类的每日上浮与下沉折点时刻;和/或,
基于藻密度数据集,统计前后连续两个周期内每个点位的藻密度数据,分别计算湖泊藻类的上浮速率和下沉速率。
一实施方式中,计算模块202具体还用于:基于时间插值将实时气象数据转换为与GOCI-II卫星遥感反射率数据的时间节点相对应的逐时数据;基于空间插值将逐时数据转换为栅格数据。
进一步地,本实施例中的湖泊藻类状态预测系统还可以包括定时模块204,用于根据设定的定时任务脚本,自动地从数据中台中获取历史藻密度数据,并根据历史藻密度数据每日自动输出待预测日内的藻类状态,实现藻情自动监测预警功能。
图4示出了根据本说明书的实施例的湖泊藻类状态预测的电子设备30的硬件结构图。如图4所示,电子设备30可以包括至少一个处理器301、存储器302(例如非易失性存储器)、内存303和通信接口304,并且至少一个处理器301、存储器302、内存303和通信接口304经由总线305连接在一起。至少一个处理器301执行在存储器302中存储或编码的至少一个计算机可读指令。
应该理解,在存储器302中存储的计算机可执行指令当执行时使得至少一个处理器301进行本说明书的各个实施例中以上结合图1-2描述的各种操作和功能。
在本说明书的实施例中,电子设备30可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。
根据一个实施例,提供了一种比如计算机可读存储介质的程序产品。计算机可读存储介质可以具有指令(即,上述以软件形式实现的元素),该指令当被计算机执行时,使得计算机执行本说明书的各个实施例中以上结合图1-2描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
根据本发明实施方式的湖泊藻类状态预测方法及应用,其利用历史藻密度数据以及对应的实时气象数据计算出湖泊藻类的垂向运动规律,并结合藻类水平迁移机理模型和垂向运动规律预测湖泊藻类状态,优化了原有的纯数据驱动或机理驱动的藻类预测模型,提升了湖泊藻类状态的预测结果精度。
另一方面,本发明在计算机制上优化传统模型中与藻类密度相关的计算过程,通过数据驱动的方法表达藻类垂向运动规律与水动力对藻类的水平迁移与扩散作用,大幅降低传统模型代码冗余性,提升预测的时效性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
Claims (10)
1.一种湖泊藻类状态预测方法,其特征在于,所述方法包括:
获取历史藻密度数据,构建藻密度数据集;
基于所述藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,所述垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率;
基于藻类水平迁移机理模型和所述垂向运动规律预测湖泊藻类状态,其中,所述藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。
2.如权利要求1所述的湖泊藻类状态预测方法,其特征在于,所述获取历史藻密度数据,构建藻密度数据集,具体包括:
基于藻类在空间中的点位,获取待预测日之前的N个周期内每个点位的藻密度数据;
筛选N个周期内每个点位对应的最大藻密度数据,并基于所有点位对应的最大藻密度数据构建藻密度数据集。
3.如权利要求1所述的湖泊藻类状态预测方法,其特征在于,所述获取历史藻密度数据,具体还包括:
获取历史卫星遥感影像数据,其中,所述历史卫星遥感影像数据包括GOCI-II卫星遥感反射率数据;
将所述GOCI-II卫星遥感反射率数据输入预训练的水质反演模型,以得到历史藻密度数据。
4.如权利要求3所述的湖泊藻类状态预测方法,其特征在于,所述方法还包括:
获取卫星遥感影像样本数据和对应的水质检测样本数据;
将所述卫星遥感影像样本数据和对应的水质检测样本数据进行地理空间匹配,以构建训练样本集;
基于所述训练样本集训练所述水质反演模型。
5.如权利要求4所述的湖泊藻类状态预测方法,其特征在于,所述方法还包括:
对所述GOCI-II卫星遥感反射率数据的首个波段进行云层判别,以确定所述卫星遥感影像数据中的含云量;
保留含云量小于设定阈值的所述卫星遥感影像数据。
6.如权利要求3所述的湖泊藻类状态预测方法,其特征在于,基于所述藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,具体包括:
基于所述藻密度数据集,对具有沉浮现象的点位对应的藻密度数据进行正态分布统计,以确定所述湖泊藻类的上浮折点藻密度;和/或,
将实时气象数据以及所述藻密度数据集作为特征变量进行回归计算,以确定所述湖泊藻类的每日上浮与下沉折点时刻;和/或,
基于所述藻密度数据集,统计前后连续两个周期内每个点位的藻密度数据,分别计算所述湖泊藻类的上浮速率和下沉速率。
7.如权利要求6所述的湖泊藻类状态预测方法,其特征在于,所述实时气象数据为点位数据,所述方法还包括:
基于时间插值将所述实时气象数据转换为与所述GOCI-II卫星遥感反射率数据的时间节点相对应的逐时数据;
基于空间插值将所述逐时数据转换为栅格数据。
8.一种湖泊藻类状态预测系统,其特征在于,所述系统包括:
获取模块,用于获取历史藻密度数据,构建藻密度数据集;
计算模块,用于基于所述藻密度数据集以及对应的实时气象数据确定湖泊藻类的垂向运动规律,所述垂向运动规律包括上浮折点藻密度、每日上浮与下沉折点时刻、上浮速率和下沉速率;
预测模块,用于基于藻类水平迁移机理模型和所述垂向运动规律预测湖泊藻类状态,其中,所述藻类水平迁移机理模型包括用于确定流速的水动力控制方程组、确定温度的温度控制方程组、以及确定藻密度的藻类物质迁移转化方程组。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1至7中任一项所述的湖泊藻类状态预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的湖泊藻类状态预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310490943.6A CN116522648A (zh) | 2023-05-04 | 2023-05-04 | 湖泊藻类状态预测方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310490943.6A CN116522648A (zh) | 2023-05-04 | 2023-05-04 | 湖泊藻类状态预测方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116522648A true CN116522648A (zh) | 2023-08-01 |
Family
ID=87407815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310490943.6A Pending CN116522648A (zh) | 2023-05-04 | 2023-05-04 | 湖泊藻类状态预测方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116522648A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829628A (zh) * | 2024-01-04 | 2024-04-05 | 广东工业大学 | 基于递归多步预测的湖泊水华预警方法及装置、电子设备 |
-
2023
- 2023-05-04 CN CN202310490943.6A patent/CN116522648A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117829628A (zh) * | 2024-01-04 | 2024-04-05 | 广东工业大学 | 基于递归多步预测的湖泊水华预警方法及装置、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Salcedo-Sanz et al. | Machine learning information fusion in Earth observation: A comprehensive review of methods, applications and data sources | |
CN107703564B (zh) | 一种降雨预测方法、系统及电子设备 | |
US11966670B2 (en) | Method and system for predicting wildfire hazard and spread at multiple time scales | |
Zheng et al. | Prediction of harmful algal blooms in large water bodies using the combined EFDC and LSTM models | |
Khazaei et al. | GLOBathy, the global lakes bathymetry dataset | |
Zheng et al. | Application of wavelet-packet transform driven deep learning method in PM2. 5 concentration prediction: A case study of Qingdao, China | |
CN110705115A (zh) | 一种基于深度置信网络的气象预报方法和系统 | |
Dong et al. | Recent developments in artificial intelligence in oceanography | |
Chen et al. | Comparison of different methods for spatial downscaling of GPM IMERG V06B satellite precipitation product over a typical arid to semi-arid area | |
CN114399073A (zh) | 一种基于深度学习的海洋表面温度场预测方法 | |
CN116522648A (zh) | 湖泊藻类状态预测方法及应用 | |
CN111368843B (zh) | 一种基于语义分割的冰上湖提取的方法 | |
CN116562414A (zh) | 一种基于多源水文气象数据的陆地水储量变化预测方法 | |
Li et al. | Assimilating process context information of cellular automata into change detection for monitoring land use changes | |
Wu et al. | Short-term regional temperature prediction based on deep spatial and temporal networks | |
Shin et al. | Effects of spatiotemporal correlations in wind data on neural network-based wind predictions | |
Wang et al. | Deep learning in extracting tropical cyclone intensity and wind radius information from satellite infrared images—A review | |
Yao et al. | Retrieval of chlorophyll-a concentrations in the coastal waters of the Beibu Gulf in Guangxi using a gradient-boosting decision tree model | |
Rumapea et al. | Improving Convective Cloud Classification with Deep Learning: The CC-Unet Model. | |
Hu et al. | Retrieval of suspended sediment concentrations using remote sensing and machine learning methods: A case study of the lower Yellow River | |
Yao et al. | Prediction of Sea Surface Chlorophyll-a Concentrations Based on Deep Learning and Time-Series Remote Sensing Data | |
Chen et al. | Urban inundation rapid prediction method based on multi-machine learning algorithm and rain pattern analysis | |
Sahraei et al. | Deep learning for isotope hydrology: The application of long short-term memory to estimate high temporal resolution of the stable isotope concentrations in stream and groundwater | |
Zhu et al. | Robust remote sensing retrieval of key eutrophication indicators in coastal waters based on explainable machine learning | |
Ivanda et al. | An application of 1D convolution and deep learning to remote sensing modelling of Secchi depth in the northern Adriatic Sea |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |