CN117131365B - 基于海气动力场数据的赤潮预测方法、系统及介质 - Google Patents
基于海气动力场数据的赤潮预测方法、系统及介质 Download PDFInfo
- Publication number
- CN117131365B CN117131365B CN202311378640.1A CN202311378640A CN117131365B CN 117131365 B CN117131365 B CN 117131365B CN 202311378640 A CN202311378640 A CN 202311378640A CN 117131365 B CN117131365 B CN 117131365B
- Authority
- CN
- China
- Prior art keywords
- factors
- red tide
- time
- chlorophyll concentration
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 229930002875 chlorophyll Natural products 0.000 claims abstract description 85
- 235000019804 chlorophyll Nutrition 0.000 claims abstract description 85
- ATNHDLDRLWWWCB-AENOIHSZSA-M chlorophyll a Chemical compound C1([C@@H](C(=O)OC)C(=O)C2=C3C)=C2N2C3=CC(C(CC)=C3C)=[N+]4C3=CC3=C(C=C)C(C)=C5N3[Mg-2]42[N+]2=C1[C@@H](CCC(=O)OC\C=C(/C)CCC[C@H](C)CCC[C@H](C)CCCC(C)C)[C@H](C)C2=C5 ATNHDLDRLWWWCB-AENOIHSZSA-M 0.000 claims abstract description 85
- 238000012549 training Methods 0.000 claims abstract description 52
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 230000008859 change Effects 0.000 claims description 32
- 238000010219 correlation analysis Methods 0.000 claims description 14
- 238000009825 accumulation Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005381 potential energy Methods 0.000 description 2
- 239000013535 sea water Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- MMDJDBSEMBIJBB-UHFFFAOYSA-N [O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O.[NH6+3] Chemical compound [O-][N+]([O-])=O.[O-][N+]([O-])=O.[O-][N+]([O-])=O.[NH6+3] MMDJDBSEMBIJBB-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000005422 algal bloom Substances 0.000 description 1
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002845 discoloration Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C13/00—Surveying specially adapted to open water, e.g. sea, lake, river or canal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Hydrology & Water Resources (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于海气动力场数据的赤潮预测方法,包括以下步骤:基于关联性分析,于初始特征因子中,提取与叶绿素浓度分布相关的相关特征因子;基于相关特征因子,构建衍生特征因子;将相关特征因子和衍生特征因子作为目标特征因子,基于目标特征因子和叶绿素浓度的时序分布,构建训练数据集;基于训练数据集,构建并训练赤潮预测模型,获得训练后的赤潮预测模型;基于历史和预报的海气动力场数据,构建预测数据集,基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。本发明的一种基于海气动力场数据的赤潮预测方法、系统和介质,可实现仅基于海气动力场数据的高准确度的赤潮发生预测,有利于赤潮发生预测的常态化应用。
Description
技术领域
本申请属于赤潮预测技术领域,特别是涉及一种基于海气动力场数据的赤潮预测方法。
背景技术
随着科学技术的发展,越来越多的学者将机器学习方法应用于赤潮的研究与预测中,该类方法基于观测数据,实现了自动化的赤潮预警。但现有的基于机器学习的赤潮预测方法通常需要基于海气动力场数据以及生物和化学等多源因子,实现高准确度的赤潮预测,不仅涉及的数据量庞大,且多源因子的获取难度高,如氨态氮、硝态氮等生化因子,需要预先在目标海域设置生化观测装置,并基于观测数据分析获取,于实际应用时,难以满足常态化的赤潮预测需求。因此,如何仅基于易获取的海气动力场数据,实现准确度高且常态化的赤潮预测是目前亟需解决的重要问题。
发明内容
鉴于上述现有技术的缺点,本申请的目的在于提供一种基于海气动力场数据的赤潮预测方法,用于解决目前赤潮预测方法对多源因子依赖性强,难以实现常态化且准确度高的赤潮预测的问题。
为实现上述目的及其他相关目的,本发明提供一种基于海气动力场数据的赤潮预测方法,用于获取目标海域内的叶绿素浓度分布,包括以下步骤:
基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子,和基于所述相关特征因子,构建衍生特征因子;
将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;
基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;
基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。
于本发明的一实施例中,所述相关特征因子的获取方式包括:获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子。
于本发明的一实施例中,所述衍生特征因子的获取方式包括:
基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。
于本发明的一实施例中,所述训练数据集的构建方式包括:
将t时刻的叶绿素浓度作为标签,将与t时刻对应的目标时间段内的所述目标特征因子作为特征,组合所述标签与对应的所述特征,获得构建的训练数据;采用所述训练数据的构建方式,依次对各时刻的所述叶绿素浓度,和对应目标时间段内的所述目标特征因子进行所述训练数据的构建,获得训练数据集。
于本发明的一实施例中,所述与t时刻对应的目标时间段为所述t时刻前的时间子段,和所述t时刻后的时间子段。
于本发明的一实施例中,所述t时刻前的时间子段为7天,所述t时刻后的时间子段为3天。
于本发明的一实施例中,所述预测数据集的构建方式与所述训练数据集的构建方式相同。
对应地,本发明提供一种基于海气动力场数据的赤潮预测系统,用于获取目标海域内的叶绿素浓度分布,其特征在于,包括:
目标特征因子获取模块,用于基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子;和基于所述相关特征因子,构建衍生特征因子;
训练数据集构建模块,用于将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;
赤潮预测模型获取模块,用于基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;
赤潮预测结果获取模块,用于基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。
于本发明的一实施例中,所述目标特征因子获取模块包括:
相关特征因子获取子模块,用于获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子;
衍生特征因子获取子模块,用于基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。
对应地,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述赤潮预测方法。
如上所述,本申请所述的一种基于海气动力场数据的赤潮预测方法、系统及介质,具有以下有益效果:
通过在时间维度和/或空间维度上,分析海气动力场数据中的各初始特征因子的特征分布与叶绿素浓度分布的关联性,获取各所述初始特征因子中与赤潮发生高度相关的相关特征因子;其次,通过构建所述相关特征因子于时间维度和/或空间维度上的衍生因子,在深入挖掘了所述特征因子与所述叶绿素浓度的关联性的同时,提升了目标特征因子的数量,以满足模型训练的需求;以及,通过建立所述目标特征因子与赤潮发生在时间尺度上的联系,进一步提升仅基于所述海气动力场数据,预测赤潮发生的准确度,从而实现仅基于海气动力场数据的高准确度的赤潮发生预测。
附图说明
图1显示为本申请一实施例示出的一种基于海气动力场数据的赤潮预测方法的流程示意图。
图2显示为本申请一实施例示出的基于所述赤潮预测方法获取的2023年4月至5月外海海域的赤潮预测结果图。
图3显示为本申请一实施例示出的基于所述赤潮预测方法获取的2016年至2019年温州海域的预测叶绿素浓度与观测叶绿素浓度对比图。
图4显示为本申请一实施例示出的一种基于海气动力场数据的赤潮预测系统的模块示意图。
图5显示为本申请一实施例示出的目标特征因子获取模块的子模块示意图。
附图标记说明
S1~S4 步骤;300 赤潮预测系统;301 目标特征因子获取模块;3011 相关特征因子获取子模块;3012 衍生特征因子获取子模块;302 训练数据集构建模块;303 赤潮预测模型获取模块;304 赤潮预测结果获取模块。
具体实施方式
以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本申请的基本构想,遂图式中仅显示与本申请中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
术语的解释:
赤潮:又称藻华,是在特定的环境条件下,海水中的某些浮游植物爆发性增殖或高度聚集而引起水体变色的一种有害生态现象。
ERA5数据:是欧洲中期天气预报中心对1950年1月至今,全球气候的第五代大气再分析数据集,提供了大量大气、陆地和海洋气候变量的每小时估计值,其中,ERA5 DAILY提供每天7个ERA5气候再分析参数的汇总值,包括:2m空气温度、2m露点温度、总降水量、平均海平面气压、表面气压、10m的u风分量和10m的v风分量。
GFS数据:是来源于美国国家环境预报中心的全球预报系统,该系统每天发布四次全球范围的气象数据,包含温度、湿度、风场、降水量、辐射、云量、绝对涡度、海角对流有效势能等数据。
本申请以下实施例提供了一种基于海气动力场数据的赤潮预测方法,用于获取目标海域内的叶绿素浓度分布,所述海气动力场数据包括若干个不同的海气动力场特征因子(以下简称“特征因子”)所对应的数据;本申请通过在时间维度和/或空间维度上,分析海气动力场数据中的各初始特征因子(初始的海气动力场特征因子)的特征分布与叶绿素浓度分布的关联性,获取各所述初始特征因子中与赤潮发生高度相关的相关特征因子(与所述叶绿素浓度相关的海气动力场特征因子);其次,通过构建所述相关特征因子于时间维度和/或空间维度上的衍生因子,在深入挖掘了所述特征因子与所述叶绿素浓度的关联性的同时,提升了所述目标特征因子的数量,以满足模型训练的需求;以及,通过建立所述目标特征因子与赤潮发生在时间尺度上的联系,进一步提升仅基于所述海气动力场数据,预测赤潮发生的准确度,从而实现仅基于海气动力场数据的高准确度的赤潮发生预测。
如图1所示,于本实施例中,本发明的一种基于海气动力场数据的赤潮预测方法包括以下步骤:
步骤S1、基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子,和基于所述相关特征因子,构建衍生特征因子;
其中,所述初始特征因子为表征海洋物理环境特征的特征参数;示例性的,所述海洋物理环境特征包括:2m空气温度、2m露点温度、总降水量、平均海平面气压、表面气压、云量、绝对涡度、海角对流有效势能等。
于一种实施方式中,所述步骤S1于执行时,包括:
步骤S11、获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子。
于一种实施方式中,所述相关特征因子的获取方式,包括:
步骤S111、基于各年度的叶绿素浓度,获取赤潮发生时间段;
其中,所述赤潮发生时间段包括赤潮发生前的第一时间子段、赤潮发生时的第二时间子段和赤潮发生后的第三时间子段;所述赤潮发生是指所述叶绿素浓度大于预设叶绿素浓度阈值;示例性的,所述预设叶绿素浓度阈值为10mg/m3。
步骤S112、提取所述赤潮发生时间段内,各所述初始特征因子对应的时序分布和空间分布;基于所述初始特征因子的时序分布,获取所述初始特征因子的时序变化趋势;以及,基于所述初始特征因子的空间分布,获取所述初始特征因子的空间变化趋势;分别检测各年度的所述初始特征因子对应的所述时序变化趋势是否相同,或检测各年度的所述初始特征因子对应的所述空间变化趋势是否相同,若是,则将所述初始特征因子作为与所述叶绿素浓度变化相关的相关特征因子;
或者,获取所述初始特征因子在所述赤潮发生时间段内的变化量;检测各年度的所述初始特征因子在所述赤潮发生时间段内的变化量是否大于预设阈值,若是,则将所述初始特征因子作为与所述叶绿素浓度时序变化相关的相关特征因子;
其中,所述变化趋势相同是指各年度的所述初始特征因子在所述赤潮发生时间段内保持同样的上行、下降和/或震荡趋势;所述同样的上行趋势是指各年度的所述初始特征因子在所述赤潮发生时间段内,所述初始特征因子的起始变化的数值,大于所述初始特征因子的结束变化的数值,且所述起始变化的数值与所述结束变化的数值的差值大于预设变化阈值;所述同样的下降趋势是指各年度的所述初始特征因子在所述赤潮发生相关时间段内,所述初始特征因子的结束变化的数值,大于所述初始特征因子的起始变化的数值,且所述起始变化的数值与所述结束变化的数值的差值大于预设变化阈值;所述同样的震荡趋势是指各年度的所述初始特征因子在所述赤潮发生时间段内,所述初始特征因子的起始变化的数值与结束变化的数值的差值小于预设变化阈值。
于一具体实施例中,所述相关特征因子包括:海表面温度、风场沿岸分量、风场离岸分量和风速。
可选的,所述海气动力场数据基于ERA5数据和/或GFS数据获取。
可选的,所述叶绿素浓度基于生态浮标记录的观测数据获取。
步骤S12、基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。
于一种实施方式中,所述衍生特征因子的获取方式,包括:
步骤S121、计算所述相关特征因子,于时间维度上的变量和累积量;以及,计算所述相关特征因子与相关特征因子之间,于时间维度上的变量和累积量,以获得所述相关特征因子于时间维度的衍生因子;提取所述相关特征因子在目标海域的空间分布特征,以获得所述相关特征因子于空间维度的衍生因子;
其中,所述相关特征因子于时间维度的衍生因子包括:海表面温度变率、风场沿岸分量累积、风场离岸分量累积和风速累积等;所述海表面温度变率包括不同时间单位获取的目标海域海表面温度的变化量。
所述相关特征因子与相关特征因子之间于时间维度的衍生因子包括:温度与风速的乘积量、风速与风场沿岸分量的乘积量和风场沿岸分量与风场离岸分量累加和等。
所述相关特征因子于空间维度的衍生因子包括:等温线与目标海域的距离;所述等温线与目标海域的距离包括各温度等温线与目标海域的距离。
步骤S122、将所述衍生因子作为自变量,将所述叶绿素浓度作为因变量,采用相关性分析方法,计算各所述衍生因子与所述叶绿素浓度的相关系数,将所述衍生因子中与所述叶绿素浓度的相关系数大于预设相关性阈值的衍生因子,设为衍生特征因子。
于一具体实施例中,所述相关性分析方法为皮尔逊相关系数分析方法。
于一具体实施例中,所述衍生特征因子包括:海表面温度变率、临界温度等温线与目标海域的距离、风速累积和风场沿岸分量累积;于一优选例中,所述临界温度等温线为与目标海域的距离为17℃等温线与目标海域的距离。
其中,所述海表面温度变率为目标海域海表面温度以小时为单位的变化量;
所述临界温度为基于各年度赤潮发生时间段内,获取的各海表面温度的平均值;
所述风速累积为目标海域风速以小时为单位的累加和;
所述风场沿岸分量累积为目标海域外海风场在沿岸方向上,以小时为单位的分量的累加和,表征风场对海水的长期影响。
需要说明的是,考虑到海气动力场的各特征因子是在时间维度和空间维度的的协同作用下,对赤潮发生产生的影响,本申请中分别基于时间维度和空间维度,构建所述相关特征因子,和/或所述相关特征因子和相关特征因子之间的衍生因子,以深入挖掘海气动力场与赤潮发生的相关性。
步骤S2、将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;
具体的,将t时刻的叶绿素浓度作为标签,将与t时刻对应的目标时间段内的所述目标特征因子作为特征,组合所述标签与对应的所述特征,获得构建的训练数据;采用所述训练数据的构建方式,依次对各时刻的所述叶绿素浓度,和对应目标时间段内的所述目标特征因子进行所述训练数据的构建,获得训练数据集;
其中,所述与t时刻对应的目标时间段为所述t时刻前的第四时间子段,和所述t时刻后的第五时间子段;所述第四时间子段大于所述第五时间子段;
于一具体实施例中,所述第四时间子段为7天,所述第五时间子段为3天。
需要说明的是,赤潮的发生,是浮游植物在一段时间内,以及特定环境下发生的爆发式增殖的过程,且海气动力场是在一段时间内,在各因子的协同作用下使得海域环境发生改变,因此,t时刻浮游植物的生长,受t时刻过去一段时间,和t时刻未来一段时间的海气动力场的影响,基于此,本申请构建赤潮预测数据集时,将t时刻前后时间段内的所述目标特征因子,与所述t时刻的叶绿素浓度组合,作为一个训练数据,有利于所述赤潮预测模型,建立所述目标特征因子与赤潮发生在时间尺度上的关联性,以提高所述赤潮预测模型对赤潮发生预测的准确度;同时,考虑到所述目标特征因子在时间维度上的累积效应、各因子间的反应速度,以及浮游植物的生长周期,于一具体实施例中,将所述t时刻前的第四时间子段设置为7天;以及考虑到预报数据的误差会随时间的增加而变大,于一具体实施例中,将所述t时刻后的第五时间子段设置为3天。
步骤S3、基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;
具体的,将所述训练数据集,以8:2的比例划分为训练集与测试集,基于所述训练集和所述测试集,获得训练后的所述赤潮预测模型。
于一具体实施例中,所述赤潮预测模型为LSTM机器学习模型。
步骤S4、基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。
其中,所述预测数据集的构建方式与所述训练数据集的构建方式相同,在此不再赘述。
为验证本申请所述赤潮预测方法于赤潮预测问题中的性能,进行了如下实验:
其中,所述赤潮预测模型为LSTM机器学习模型;所述赤潮预测模型设置为包含10个隐含层,采用Adam梯度下降算法作为所述赤潮预测模型的激活函数,迭代次数为1000次,初始学习率为0.005,学习下降因子为0.1。
采用R2、RMSE、MAE和MBE,对训练和测试阶段的所述赤潮预测模型进行性能评估,获得所述赤潮预测模型于所述训练和测试阶段的评估结果,所述评估结果具体如下表1所示。
表1
阶段 | R2 | RMSE | MAE | MBE |
训练阶段 | 0.99 | 0.58 | 0.39 | 0.02 |
测试阶段 | 0.80 | 3.33 | 2.34 | 0.49 |
上表中,R2为决定系数,衡量数据对模型拟合程度的好坏,其取值范围在[0,1]之间,越接近1说明回归拟合效果越好;RMSE为均方根误差,衡量预测值与真实值之间的偏差;MAE为平均绝对误差,反映预测值误差的实际情况;MBE为平均偏差,反映预测值与真实值间的平均偏差,其值越小表示模型的预测能力越好。
请参阅图2,显示为基于所述方法获取的2023年4月至5月外海海域的赤潮预测结果图,其中,设定5mg/m3的叶绿素浓度值为赤潮中风险阈值、10mg/m3的叶绿素浓度值为赤潮阈值;如图2所示,该图显示为2023年的赤潮预测结果,其中,实线表示预测的叶绿素浓度值变化趋势,虚线表示赤潮阈值,点划线表示赤潮中风险阈值,基于图2的显示结果可知,本申请所述方法预测的叶绿素浓度分别于2023年4月21日前后,和5月1日前后大于赤潮阈值,即赤潮预测结果为:于2023年4月21日前后,和5月1日前后发生赤潮,该预测结果与外海海域的实际赤潮发生情况相吻合;由此可知,基于上述的赤潮预测结果及实际的赤潮发生情况,验证了本申请所述方法对赤潮发生预测的预测准确性。
请参阅图3,显示为基于所述方法获取的2016年至2019年温州海域的预测叶绿素浓度与观测叶绿素浓度对比图,其中,设定10mg/m3的叶绿素浓度值为赤潮阈值;如图3所示,图中实线表示基于本申请所述方法获取的预测的叶绿素浓度变化趋势,散点线表示观测的叶绿素浓度变化趋势,虚线表示赤潮阈值,基于图3的显示结果可知,其中实线与散点线的变化趋势相近,准确模拟了2016年四月初、2017年四月初以及2019年五月份的赤潮事件发生情况,从而表明了本申请所述方法于预测赤潮发生的准确性。
上述实施例中提供的一种基于海气动力场数据的赤潮预测方法,通过在时间维度和/或空间维度上,分析海气动力场数据中的各初始特征因子的特征分布与叶绿素浓度分布的关联性,获取各所述初始特征因子中与赤潮发生高度相关的相关特征因子;其次,通过构建所述相关特征因子于时间维度和/或空间维度上的衍生因子,在深入挖掘了所述特征因子与所述叶绿素浓度的关联性的同时,提升了目标特征因子的数量,以满足模型训练的需求的;以及,通过建立所述目标特征因子与赤潮发生在时间尺度上的联系,进一步提升仅基于所述海气动力场数据,预测赤潮发生的准确度,从而实现仅基于海气动力场数据的高准确度的赤潮发生预测。
如图4所示,于本实施例中,本发明提供一种基于海气动力场数据的赤潮预测系统,用于获取目标海域内的叶绿素浓度分布,包括:
目标特征因子获取模块301,基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子;和基于所述相关特征因子,构建衍生特征因子;
训练数据集构建模块302,将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;
赤潮预测模型获取模块303,用于基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;
赤潮预测结果获取模块304,用于基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。
如图5所示,于本实施例中,所述目标特征因子获取模块包括:
相关特征因子获取子模块3011,用于获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子;
衍生特征因子获取子模块3012,用于基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。
本申请实施例还提供了一种计算机可读存储介质。本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(magnetic tape),软盘(floppy disk),光盘(optical disc)及其任意组合。上述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本申请实施例还可以提供一种计算机程序产品,所述计算机程序产品包括一个或多个计算机指令。在计算设备上加载和执行所述计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。
所述计算机程序产品被计算机执行时,所述计算机执行前述方法实施例所述的方法。该计算机程序产品可以为一个软件安装包,在需要使用前述方法的情况下,可以下载该计算机程序产品并在计算机上执行该计算机程序产品。
上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,可以参见其他流程或结构的相关描述。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。
Claims (9)
1.一种基于海气动力场数据的赤潮预测方法,其特征在于,用于获取目标海域内的叶绿素浓度分布,所述方法包括:
基于关联性分析,于初始特征因子中,提取与所述叶绿素浓度分布相关的相关特征因子,和基于所述相关特征因子,计算所述相关特征因子,于时间维度上的变量和累积量;以及,计算所述相关特征因子与相关特征因子之间,于时间维度上的变量和累积量,以获得所述相关特征因子于时间维度的衍生因子;提取所述相关特征因子在目标海域的空间分布特征,以获得所述相关特征因子于空间维度的衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子;所述初始特征因子为表征海洋物理环境特征的特征参数;
将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;
基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;
基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于所述预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。
2.根据权利要求1所述的方法,其特征在于,所述相关特征因子的获取方式包括:
获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子。
3.根据权利要求1所述的方法,其特征在于,所述训练数据集的构建方式包括:
将t时刻的叶绿素浓度作为标签,将与t时刻对应的目标时间段内的所述目标特征因子作为特征,组合所述标签与对应的所述特征,获得构建的训练数据;采用所述训练数据的构建方式,依次对各时刻的所述叶绿素浓度,和对应目标时间段内的所述目标特征因子进行所述训练数据的构建,获得训练数据集。
4.根据权利要求3所述的方法,其特征在于,所述与t时刻对应的目标时间段为所述t时刻前的时间子段,和所述t时刻后的时间子段。
5.根据权利要求4所述的方法,其特征在于,所述t时刻前的时间子段为7天,所述t时刻后的时间子段为3天。
6.根据权利要求1所述的方法,其特征在于,所述预测数据集的构建方式与所述训练数据集的构建方式相同。
7.一种基于海气动力场数据的赤潮预测系统,其特征在于,包括:
目标特征因子获取模块,用于基于关联性分析,于初始特征因子中,提取与叶绿素浓度分布相关的相关特征因子,和基于所述相关特征因子,计算所述相关特征因子,于时间维度上的变量和累积量;以及,计算所述相关特征因子与相关特征因子之间,于时间维度上的变量和累积量,以获得所述相关特征因子于时间维度的衍生因子;提取所述相关特征因子在目标海域的空间分布特征,以获得所述相关特征因子于空间维度的衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子;所述初始特征因子为表征海洋物理环境特征的特征参数;
训练数据集构建模块,用于将所述相关特征因子和所述衍生特征因子作为目标特征因子,基于所述目标特征因子的时序分布,和与所述目标特征因子的时序分布对应的叶绿素浓度的时序分布,构建训练数据集;
赤潮预测模型获取模块,用于基于所述训练数据集,构建并训练赤潮预测模型,获得训练后的所述赤潮预测模型;
赤潮预测结果获取模块,用于基于目标特征因子,获取历史和预报的海气动力场数据;基于所述历史和预报的海气动力场数据,构建预测数据集;基于所述预测数据集,利用所述训练后的赤潮预测模型,获得赤潮预测结果。
8.根据权利要求7所述的系统,其特征在于,所述目标特征因子获取模块包括:
相关特征因子获取子模块,用于获取海气动力场数据中各初始特征因子的时序分布,和与所述海气动力场数据对应时间段的叶绿素浓度的时序分布,对各所述初始特征因子和所述叶绿素浓度进行关联性分析,获得所述初始特征因子中,与所述叶绿素浓度时序变化相关的相关特征因子;
衍生特征因子获取子模块,用于基于所述相关特征因子,构建衍生因子;对所述衍生因子和所述叶绿素浓度进行相关性分析,获得所述衍生因子中与所述叶绿素浓度变化相关的衍生特征因子。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现权利要求1至6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311378640.1A CN117131365B (zh) | 2023-10-24 | 2023-10-24 | 基于海气动力场数据的赤潮预测方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311378640.1A CN117131365B (zh) | 2023-10-24 | 2023-10-24 | 基于海气动力场数据的赤潮预测方法、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117131365A CN117131365A (zh) | 2023-11-28 |
CN117131365B true CN117131365B (zh) | 2024-02-13 |
Family
ID=88852961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311378640.1A Active CN117131365B (zh) | 2023-10-24 | 2023-10-24 | 基于海气动力场数据的赤潮预测方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117131365B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084716A (zh) * | 2020-09-15 | 2020-12-15 | 河北省科学院地理科学研究所 | 一种基于富营养化综合评价的赤潮预测预警方法 |
CN114239422A (zh) * | 2022-02-23 | 2022-03-25 | 中国海洋大学 | 基于机器学习提高海洋叶绿素a浓度预报准确度的方法 |
CN115587646A (zh) * | 2022-09-09 | 2023-01-10 | 中国海洋大学 | 基于时空特征融合的近海叶绿素a浓度预测方法及系统 |
CN116611580A (zh) * | 2023-06-21 | 2023-08-18 | 福州大学 | 一种基于多源数据与深度学习的海洋赤潮预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213614A1 (ja) * | 2019-04-15 | 2020-10-22 | 国立研究開発法人理化学研究所 | 環境因子予測装置、方法、プログラム、学習済モデルおよび記憶媒体 |
-
2023
- 2023-10-24 CN CN202311378640.1A patent/CN117131365B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112084716A (zh) * | 2020-09-15 | 2020-12-15 | 河北省科学院地理科学研究所 | 一种基于富营养化综合评价的赤潮预测预警方法 |
CN114239422A (zh) * | 2022-02-23 | 2022-03-25 | 中国海洋大学 | 基于机器学习提高海洋叶绿素a浓度预报准确度的方法 |
CN115587646A (zh) * | 2022-09-09 | 2023-01-10 | 中国海洋大学 | 基于时空特征融合的近海叶绿素a浓度预测方法及系统 |
CN116611580A (zh) * | 2023-06-21 | 2023-08-18 | 福州大学 | 一种基于多源数据与深度学习的海洋赤潮预测方法 |
Non-Patent Citations (4)
Title |
---|
Framework to Extract Extreme Phytoplankton Bloom Events with Remote Sensing Datasets: A Case Study;Wenfang Lu et al.;Remote Sensing;第14卷(第15期);第1-18页 * |
Monitoring, modeling and projection of harmful algal blooms in China;Weibing Guan et al.;Harmful Algae;第111卷;第1-8页 * |
海洋赤潮自动监测系统的研究与实现;贾旭东;中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑;第2021卷(第08期);第B027-656页 * |
长短期记忆神经网络在叶绿素a浓度预测中的应用;石绥祥;王蕾;余璇;徐凌宇;;海洋学报;42(02);第134-142页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117131365A (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Seasonal predictions of tropical cyclones using a 25-km-resolution general circulation model | |
Camera et al. | Evaluation of interpolation techniques for the creation of gridded daily precipitation (1× 1 km2); Cyprus, 1980–2010 | |
Larjavaara et al. | Temperature explains global variation in biomass among humid old‐growth forests | |
Nuijens et al. | The behavior of trade‐wind cloudiness in observations and models: The major cloud components and their variability | |
Pinto et al. | Identification and ranking of extraordinary rainfall events over Northwest Italy: The role of Atlantic moisture | |
Moeslund et al. | Light detection and ranging explains diversity of plants, fungi, lichens, and bryophytes across multiple habitats and large geographic extent | |
CN109472283B (zh) | 一种基于多重增量回归树模型的危险天气预测方法和装置 | |
Wang et al. | Trends and variability in temperature sensitivity of lilac flowering phenology | |
CN114595876A (zh) | 一种区域风场预测模型生成方法和装置、电子设备 | |
Lin et al. | RACORO continental boundary layer cloud investigations: 3. Separation of parameterization biases single‐column model CAM5 simulations of shallow cumulus | |
CN110458338A (zh) | 一种基于再分析资料的海面高度中长期统计预测方法 | |
Vigaud et al. | Probabilistic skill of subseasonal surface temperature forecasts over North America | |
Cagigal et al. | Climate‐based emulator of distant swell trains and local seas approaching a Pacific atoll | |
Pegion et al. | Understanding predictability of daily southeast US precipitation using explainable machine learning | |
Liu et al. | Multi‐scale response of runoff to climate fluctuation in the headwater region of the Kaidu River in Xinjiang of China | |
CN117131365B (zh) | 基于海气动力场数据的赤潮预测方法、系统及介质 | |
CN116628442B (zh) | 一种基于人工神经网络的地下水储量变化空间降尺度方法 | |
CN112579980A (zh) | 风场数据处理方法、装置、设备及存储介质 | |
CN116757321A (zh) | 太阳直接辐射量预测方法、系统、设备及存储介质 | |
Mitchell et al. | The use of the Conway–Maxwell–Poisson in the seasonal forecasting of tropical cyclones | |
Dzambo et al. | Characterizing relative humidity with respect to ice in midlatitude cirrus clouds as a function of atmospheric state | |
Su et al. | Deep-learning-derived planetary boundary layer height from conventional meteorological measurements | |
Alves et al. | Method for determining the footprint area of air temperature and relative humidity | |
Yarinich et al. | The effect of Moscow megapolis on warm-season precipitation depending on large-scale atmospheric conditions | |
Wang et al. | Evaluating deep updraft formulation in NCAR CAM3 with high‐resolution WRF simulations during ARM TWP‐ICE |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |