CN114242156A - 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统 - Google Patents
海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统 Download PDFInfo
- Publication number
- CN114242156A CN114242156A CN202111554198.4A CN202111554198A CN114242156A CN 114242156 A CN114242156 A CN 114242156A CN 202111554198 A CN202111554198 A CN 202111554198A CN 114242156 A CN114242156 A CN 114242156A
- Authority
- CN
- China
- Prior art keywords
- machine learning
- learning model
- relative abundance
- plastic
- marine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000607598 Vibrio Species 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 51
- 229920003023 plastic Polymers 0.000 title claims abstract description 51
- 239000004033 plastic Substances 0.000 title claims abstract description 51
- 230000001717 pathogenic effect Effects 0.000 title claims abstract description 41
- 206010047400 Vibrio infections Diseases 0.000 title claims abstract description 25
- 230000007613 environmental effect Effects 0.000 claims abstract description 78
- 238000010801 machine learning Methods 0.000 claims abstract description 66
- 238000012360 testing method Methods 0.000 claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 42
- 229920000426 Microplastic Polymers 0.000 claims description 21
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 10
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 9
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims description 9
- 229910052757 nitrogen Inorganic materials 0.000 claims description 9
- 229910052760 oxygen Inorganic materials 0.000 claims description 9
- 239000001301 oxygen Substances 0.000 claims description 9
- 229910052698 phosphorus Inorganic materials 0.000 claims description 9
- 239000011574 phosphorus Substances 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000012417 linear regression Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 201000010099 disease Diseases 0.000 abstract description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 4
- 238000009360 aquaculture Methods 0.000 abstract description 3
- 244000144974 aquaculture Species 0.000 abstract description 3
- 244000005700 microbiome Species 0.000 abstract description 2
- 244000000010 microbial pathogen Species 0.000 abstract 1
- 238000011160 research Methods 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000013535 sea water Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 208000034699 Vitreous floaters Diseases 0.000 description 1
- 206010048038 Wound infection Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000009364 mariculture Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 235000014102 seafood Nutrition 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 208000013223 septicemia Diseases 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Epidemiology (AREA)
- Public Health (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Bioethics (AREA)
- Physiology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统,方法包括:获得不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值;将所获得的数据整理成样本数据集,并对环境因素数据进行预处理;将经过预处理的样本数据集划分为训练集和测试集;构建机器学习模型,并使用所述训练集进行训练;使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果;将海洋观测站监测到的环境因素数据输入训练好的机器学习模型,获得海域海洋微塑料上弧菌相对丰度的实时预测数据。本发明解决了现有技术中无法对微塑料上微生物相对丰度实时监测的问题,为水产养殖区水产品的致病微生物病害监测及预防提供精确的数据支撑。
Description
技术领域
本发明属于海洋微塑料污染预测技术领域,具体涉及一种海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统。
背景技术
塑料的发明给人类的日常生活带来了巨大的便利,但塑料的废弃给自然环境造成了巨大的伤害,大部分废弃的塑料都由陆地河流进入海洋,严重影响海洋的生态环境。海洋中的塑料碎片在物理、化学和生物的作用下,会逐渐分解形成大量粒径小于5毫米的微塑料。世界各地的海洋都不同程度地受到了微塑料的污染,尤其是人口密集的河口地区和塑料制品使用率高的海水养殖区。相对于其它天然材质漂浮物,海洋中漂浮的微塑料具有更加稳定的物理化学性质,可以作为一个持续性的附着基质为海洋中的微生物提供栖息地。
弧菌可以导致人类在休闲洗浴时的伤口感染、败血症和摄入受污染的海鲜后引起疾病,也是引起海产品死亡的主要原因。研究表明,在海水和沉积物中含量极低的弧菌在微塑料表面却很高。并且,微塑料在被生物摄入后,微塑料上面的弧菌可以转移到生物体内,导致弧菌在生物体内积累,从而引起生物致病,甚至死亡。因此很多研究机构在研究世界各地的海洋微塑料上弧菌相对丰度的变化规律,发现微塑料上弧菌的相对丰度受不同环境因素的影响,这些环境因素为弧菌在微塑料上的生长提供了有利或不利的条件。目前,普遍采用实验方法研究环境因素对海洋微塑料上弧菌相对丰度的影响,实验方法虽说很准确,但在世界各地的海洋中进行实验研究的成本非常高,并且实验研究得出的数据只对实验海域有帮助,存在一定的局限性。为了解决实验方法的局限性,发明一种既能具备显著经济效益,又能对微塑料上弧菌相对丰度进行实时预测的方法尤为重要。
发明内容
本发明提供了一种海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统,能够在不同环境因素下快速准确预测海洋微塑料上致病性弧菌的相对丰度,进而可以建立基于环境因素的微塑料上弧菌相对丰度的长期动态监测系统,为水产养殖区域中水产品的致病微生物病害监测及预防提供精确的数据支撑。
本发明采用如下技术方案:
一方面,一种海洋微塑料上致病性弧菌相对丰度的实时预测方法,包括:
S101,基于采样的海洋实验数据,获得不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值;
S102,将所获得的数据整理成样本数据集,并对所述样本数据集中的环境因素数据进行预处理;
S103,将经过预处理的样本数据集划分为训练集和测试集;
S104,构建机器学习模型,并使用所述训练集进行训练,获得训练好的机器学习模型;
S105,使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标;
S106,将海洋观测站监测到的环境因素数据输入训练好的机器学习模型,获得海域海洋微塑料上弧菌相对丰度的实时预测数据。
优选的,S101中,所述环境因素包括温度、溶解氧、盐度、pH、总氮和总磷。
优选的,S102中,对样本数据集中的环境因素数据进行预处理的方法包括归一化处理,计算方法如下:
其中,x表示环境因素值,xmin表示环境因素的最小值,xmax表示环境因素的最大值。
优选的,S103中,将经过预处理的样本数据集划分为训练集和测试集,具体包括:
将样本数据集随机划分成训练集和测试集,所述训练集和测试集比例为8:2。
优选的,S104中,构建机器学习模型,并使用所述训练集进行训练,具体包括:
基于编程语言编写机器学习模型;
基于编程语言编写机器学习模型;
采用神经网络超参数搜索法和K折交叉验证法相结合的方法或采用网格搜索法和K折交叉验证法相结合的方法对机器学习模型进行不断训练,寻找出机器学习模型的最优超参数组合。
优选的,S104中,构建的机器学习模型包括全连接神经网络。
优选的,S105中,使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标,具体包括:
将测试集中环境因素数据输入到训练好的机器学习模型得出预测丰度;
将机器学习模型获得的预测丰度与测试集中的真实丰度进行对比;
使用均方根误差、平均绝对误差和决定系数对机器学习模型的预测性能及泛化能力指标进行评估。
优选的,所述均方根误差、平均绝对误差和决定系数的计算方法如下:
优选的,S106中,将海洋观测站监测到的环境因素数据输入训练好的机器学习模型之前,还包括:
判断监测的环境因素是否有缺失,如果有,对未监测到的环境因素,使用已监测到的环境因素数据进行线性回归估计获得;
对监测的环境因素和估计获得的环境因素数据进行归一化处理。
另一方面,一种海洋微塑料上致病性弧菌相对丰度的实时预测系统,包括:
历史数据获取模块,用于基于采样的海洋实验数据,获得不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值;
预处理模块,用于将所获得的数据整理成样本数据集,并对所述样本数据集中的环境因素数据进行预处理;
样本数据集划分模块,用于将经过预处理的样本数据集划分为训练集和测试集;
训练模块,用于构建机器学习模型,并使用所述训练集进行训练,获得训练好的机器学习模型;
测试模块,用于使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标;
实时预测模块,用于将海洋观测站监测到的环境因素数据输入训练好的机器学习模型,获得海域海洋微塑料上弧菌相对丰度的实时预测数据。
本发明的有益效果如下:
虽然环境因素与微塑料上弧菌相对丰度之间的相关性可以通过实验得到,但海洋环境中的环境因素是具体数值且动态变化的,这使得微塑料上致病性弧菌的相对丰度在特定环境下的精确预测成为一项挑战。基于现有技术的问题,本发明提出了一种将环境因素数据输入到训练好的机器学习模型在线预测微塑料上致病性弧菌相对丰度的方法及系统,解决了现有技术中无法对微塑料上致病性弧菌的相对丰度连续、实时监测的技术问题,与传统的实验方法相比,该方法具有以下优点:
(1)本发明通过训练好的机器学习模型能够实时精准预测不同环境因素下微塑料上致病性弧菌的相对丰度;
(2)本发明仅利用不同环境因素下微塑料上致病性弧菌的相对丰度的历史时序数据就可以构建机器学习模型,大大降低数据采集的工作量;
(3)本发明仅通过通过训练好的机器学习模型就能够得出精确预测值,无需额外现场实验研究,简单易行,成本低,具备显著的经济效益;
(4)本发明的机器学习模型可与海洋观测站中所测的环境数据相结合,对周边海域中微塑料上致病性弧菌的相对丰度进行在线实时预测。
以下结合附图及实施例对本发明作进一步详细说明,但本发明的一种海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统不局限于实施例。
附图说明
图1为本实施例的方法流程图;
图2为本实施例的机器学习模型的预测丰度值与实际丰度值的比较图。
图3为本实施例的机器学习模型预测某海域从2019年10月1日至2020年10月1日微塑料上致病性弧菌相对丰度的预测图;
图4为本实施例的系统框图。
具体实施方式
以下通过具体实施方式对本发明作进一步的描述。应当说明的是,此处所述具体实施例仅用于方便说明和解释本发明的具体实施方式,并不用于限定本发明。
为了使本发明的目的、技术方案更加清晰明了,以下结合附图以及案例,对本发明进行进一步说明。应当理解,此处所描述的案例仅用于解释本发明,并不用于限定本发明。
参见图1所示,一方面,本实施例一种海洋微塑料上致病性弧菌相对丰度的实时预测方法,利用我国多个海域的实验数据作为样本数据集,然后将数据集随机划分成训练集和测试集,采用训练集训练微塑料上致病性弧菌相对丰度的机器学习预测模型,随后利用测试集对训练好的机器学习模型的预测性能进行测试,最后将我国黄海某海洋监测站中环境因素数据导入到机器学习模型中实现对周边海域海洋微塑料上致病性弧菌相对丰度的实时预测。
本发明实施例的具体步骤如下:
S101,基于现场采样的实验研究数据,得到不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值。本实施例中总共有来自多个海域150组实验数据,实验数据包括环境因素和微塑料上致病性弧菌的相对丰度,其中环境因素包括温度、溶解氧、盐度、pH、总氮和总磷,温度的范围为10~30℃,溶解氧的范围为2.64~12.38mg/l,盐度的范围为8.21~31.95‰,pH的范围为6~8.9,总氮的范围为47.08~4050mg/l,总磷的范围为6.15~442mg/l,微塑料上致病性弧菌相对丰度的范围为0~90.98%。
S102,将所获得的数据整理成样本数据集,并对该样本数据集中的环境因素等特征进行预处理。本实施例为消除不同环境因素之间量纲的差异,对每个环境因素预处理方法为归一化处理,将每个环境因素的数值大小限定在[0,1]之间,计算方法如下:
其中,x表示环境因素值,xmin表示环境因素的最小值,xmax表示环境因素的最大值。
S103,将经过预处理的样本数据集划随机分为测试集和训练集。本实施例中训练集和测试集随机划分的比例为8:2,其中训练集120组数据,测试集30组数据。
S104,基于S103的训练集,构建并训练机器学习模型。本实施例基于Python编程语言编写全连接神经网络(DNN)算法模型,然后在训练集中采用自编神经网络超参数搜索法和K折交叉验证法相结合对DNN模型进行不断训练,寻找出DNN模型的最优超参数组合。
所述的神经网络超参数搜索法是针对神经网络模型调参的方法,具体做法为采用多个for循环嵌套的方式改变神经网络模型的隐含层层数和每个隐含层的神经元个数。
需要说明的是,本发明还可以使用其他已知的机器学习方法构建模型,并使用训练集进行训练,本实施例不做具体限制。具体可使用网格搜索法和K折交叉验证法相结合对其他机器学习模型进行不断训练,寻找出机器学习模型的最优超参数组合。
S105,基于S103的测试集,对基于S104中训练好的DNN模型进行测试,得出测试结果,计算DNN模型的预测性能及泛化能力指标。本实施中首先将S104中计算出的最优超参数组合代入到DNN模型中,然后将测试集中环境因素数据输入到DNN模型,最后将DNN模型的预测值与测试集中的真实值进行对比(参见图2所示),计算出DNN模型预测值与真实值之间的均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R2),RMSE、MAE和R2的具体计算方法如下:
其中,yi为真实值,表示模型的预测值,表示数据集中真实值的平均值;m为样本数量;RMSE表示均方根误差;MAE表示平均绝对误差;R2表示决定系数。RMSE和MAE的值越小,R2越接近1,表示模型的预测的准确度和泛化能力越好。本实施例计算得出RMSE为9.98,MAE为4.69,R2为0.894,RMSE和MAE的值比较小,R2越比较接近1,说明本实施例中训练好的DNN模型的预测准确度和泛化能力很好。
S106,将国家海洋数据中心中海洋观测站监测的环境因素数据导入到基于S105训练好的DNN模型,得出当地海域海洋微塑料上弧菌相对丰度的实时预测数据。本实施例中国家海洋数据中心海洋站监测的环境因素数据为完全共享的实测环境数据,来源于我国黄海某海洋站2019年10月1日至2020年10月1日监测的周边海域温度和盐度数据,数据按每天进行采集,共计365组数据。对于海洋站未监测的环境数据(如溶解氧、pH、总氮和总磷)则采用已监测的环境数据(如温度或盐度)进行线性回归估计计算出海洋站未监测的环境数据(如溶解氧、pH、总氮和总磷)的具体数值。具体做法包括:首先计算出S101步骤中150组实验数据的各环境因素的spearman相关性系数,计算得出不同环境因素间盐度和总磷的相关性系数最大(-0.86),盐度和总氮的相关性系数最大(-0.89),盐度和溶解氧的相关性系数最大(0.86),盐度和pH的相关性系数最大(-0.79),然后根据150组实验数据分别拟合出盐度和总磷、盐度和总氮、盐度和溶解氧、盐度和pH的线性回归方程,最后将海洋站已监测的环境数据(如温度或盐度)代入到各自的线性回归方程中,计算出溶解氧、pH、总氮和总磷的具体数值。对环境因素数据归一化预处理后作为输入数据输入到训练好的DNN模型中,得出这一海域从2019年10月1日至2020年10月1日微塑料上致病性弧菌相对丰度的预测图(参见图3所示)。从图3可以发现微塑料上弧菌的相对丰度随季节性变化明显,并且与海水温度和盐度密切相关,这一结论与现有很多文献所报道的一致。
综上所述,本发明提出的一种基于机器学习的海洋微塑料上致病性弧菌相对丰度的实时预测方法解决了现有技术中无法对微塑料上致病性弧菌相对丰度进行连续、实时监测的技术问题,为水产养殖区域中水产品的致病微生物病害监测及预防提供精确的数据支撑。
另一方面,参见图4所示,本实施例一种海洋微塑料上致病性弧菌相对丰度的实时预测系统,包括:
历史数据获取模块401,用于基于采样的海洋实验数据,获得不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值;
预处理模块402,用于将所获得的数据整理成样本数据集,并对所述样本数据集中的环境因素数据进行预处理;
样本数据集划分模块403,用于将经过预处理的样本数据集划分为训练集和测试集;
训练模块404,用于构建机器学习模型,并使用所述训练集进行训练,获得训练好的机器学习模型;
测试模块405,用于使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标;
实时预测模块406,用于将海洋观测站监测到的环境因素数据输入训练好的机器学习模型,获得海域海洋微塑料上弧菌相对丰度的实时预测数据。
一种海洋微塑料上致病性弧菌相对丰度的实时预测系统各模块的具体实现参见一种海洋微塑料上致病性弧菌相对丰度的实时预测方法中的具体实现,本实施例不做重复说明。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进与变换,而所有这些改进与变化都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,包括:
S101,基于采样的海洋实验数据,获得不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值;
S102,将所获得的数据整理成样本数据集,并对所述样本数据集中的环境因素数据进行预处理;
S103,将经过预处理的样本数据集划分为训练集和测试集;
S104,构建机器学习模型,并使用所述训练集进行训练,获得训练好的机器学习模型;
S105,使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标;
S106,将海洋观测站监测到的环境因素数据输入训练好的机器学习模型,获得海域海洋微塑料上弧菌相对丰度的实时预测数据。
2.根据权利要求1所述的海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,S101中,所述环境因素包括温度、溶解氧、盐度、pH、总氮和总磷。
4.根据权利要求1所述的海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,S103中,将经过预处理的样本数据集划分为训练集和测试集,具体包括:
将样本数据集随机划分成训练集和测试集,所述训练集和测试集比例为8:2。
5.根据权利要求1所述的海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,S104中,构建机器学习模型,并使用所述训练集进行训练,具体包括:
基于编程语言编写机器学习模型;
采用神经网络超参数搜索法和K折交叉验证法相结合的方法或采用网格搜索法和K折交叉验证法相结合的方法对机器学习模型进行不断训练,寻找出机器学习模型的最优超参数组合。
6.根据权利要求1所述的海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,S104中,构建的机器学习模型包括全连接神经网络。
7.根据权利要求1所述的海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,S105中,使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标,具体包括:
将测试集中环境因素数据输入到训练好的机器学习模型得出预测丰度;
将机器学习模型获得的预测丰度与测试集中的真实丰度进行对比;
使用均方根误差、平均绝对误差和决定系数对机器学习模型的预测性能及泛化能力指标进行评估。
9.根据权利要求1所述的海洋微塑料上致病性弧菌相对丰度的实时预测方法,其特征在于,S106中,将海洋观测站监测到的环境因素数据输入训练好的机器学习模型之前,还包括:
判断监测的环境因素是否有缺失,如果有,对未监测到的环境因素,使用已监测到的环境因素数据进行线性回归估计获得;
对监测的环境因素和估计获得的环境因素数据进行归一化处理。
10.一种海洋微塑料上致病性弧菌相对丰度的实时预测系统,其特征在于,包括:
历史数据获取模块,用于基于采样的海洋实验数据,获得不同环境因素下的海洋微塑料上弧菌相对丰度的历史实际值;
预处理模块,用于将所获得的数据整理成样本数据集,并对所述样本数据集中的环境因素数据进行预处理;
样本数据集划分模块,用于将经过预处理的样本数据集划分为训练集和测试集;
训练模块,用于构建机器学习模型,并使用所述训练集进行训练,获得训练好的机器学习模型;
测试模块,用于使用所述测试集对训练好的机器学习模型进行测试及评估,获得测试结果,并计算出机器学习模型的预测性能及泛化能力指标;
实时预测模块,用于将海洋观测站监测到的环境因素数据输入训练好的机器学习模型,获得海域海洋微塑料上弧菌相对丰度的实时预测数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111554198.4A CN114242156A (zh) | 2021-12-17 | 2021-12-17 | 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111554198.4A CN114242156A (zh) | 2021-12-17 | 2021-12-17 | 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114242156A true CN114242156A (zh) | 2022-03-25 |
Family
ID=80758291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111554198.4A Pending CN114242156A (zh) | 2021-12-17 | 2021-12-17 | 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114242156A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114862035A (zh) * | 2022-05-20 | 2022-08-05 | 厦门大学 | 一种基于迁移学习的组合式海湾水温预测方法 |
CN115470702A (zh) * | 2022-09-14 | 2022-12-13 | 中山大学 | 一种基于机器学习的污水处理水质预测方法及系统 |
CN116797756A (zh) * | 2023-08-16 | 2023-09-22 | 海博泰科技(青岛)有限公司 | 一种全息海洋背景场实现方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407691A (zh) * | 2016-09-28 | 2017-02-15 | 中国地质大学(武汉) | 一种赤潮生物量预测方法及装置 |
CN110379463A (zh) * | 2019-06-05 | 2019-10-25 | 山东大学 | 基于机器学习的海洋藻类成因分析及浓度预测方法和系统 |
CN111652443A (zh) * | 2020-06-05 | 2020-09-11 | 上海海洋大学 | 综合多源卫星遥感预测远洋渔业资源丰度的方法及其应用 |
US20210256422A1 (en) * | 2020-02-19 | 2021-08-19 | Google Llc | Predicting Machine-Learned Model Performance from the Parameter Values of the Model |
-
2021
- 2021-12-17 CN CN202111554198.4A patent/CN114242156A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106407691A (zh) * | 2016-09-28 | 2017-02-15 | 中国地质大学(武汉) | 一种赤潮生物量预测方法及装置 |
CN110379463A (zh) * | 2019-06-05 | 2019-10-25 | 山东大学 | 基于机器学习的海洋藻类成因分析及浓度预测方法和系统 |
US20210256422A1 (en) * | 2020-02-19 | 2021-08-19 | Google Llc | Predicting Machine-Learned Model Performance from the Parameter Values of the Model |
CN111652443A (zh) * | 2020-06-05 | 2020-09-11 | 上海海洋大学 | 综合多源卫星遥感预测远洋渔业资源丰度的方法及其应用 |
Non-Patent Citations (1)
Title |
---|
傅松哲;涂俊凌;夏斌;李贤;刘鹰;: "大西洋鲑循环水养殖系统弧菌总数快速预测模型", 中国水产科学, no. 02, 15 March 2015 (2015-03-15), pages 101 - 109 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114862035A (zh) * | 2022-05-20 | 2022-08-05 | 厦门大学 | 一种基于迁移学习的组合式海湾水温预测方法 |
CN114862035B (zh) * | 2022-05-20 | 2024-05-03 | 厦门大学 | 一种基于迁移学习的组合式海湾水温预测方法 |
CN115470702A (zh) * | 2022-09-14 | 2022-12-13 | 中山大学 | 一种基于机器学习的污水处理水质预测方法及系统 |
CN115470702B (zh) * | 2022-09-14 | 2024-06-11 | 中山大学 | 一种基于机器学习的污水处理水质预测方法及系统 |
CN116797756A (zh) * | 2023-08-16 | 2023-09-22 | 海博泰科技(青岛)有限公司 | 一种全息海洋背景场实现方法 |
CN116797756B (zh) * | 2023-08-16 | 2023-11-07 | 海博泰科技(青岛)有限公司 | 一种全息海洋背景场实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114242156A (zh) | 海洋微塑料上致病性弧菌相对丰度的实时预测方法及系统 | |
Zheng et al. | Prediction of harmful algal blooms in large water bodies using the combined EFDC and LSTM models | |
Huo et al. | Using artificial neural network models for eutrophication prediction | |
Rashid et al. | IoT based smart water quality prediction for biofloc aquaculture | |
Wentzky et al. | Seasonal succession of functional traits in phytoplankton communities and their interaction with trophic state | |
Liu et al. | Prediction of dissolved oxygen content in aquaculture of Hyriopsis cumingii using Elman neural network | |
CN102854296A (zh) | 一种基于集成神经网络的污水处理软测量方法 | |
CN114037163A (zh) | 一种基于动态权重pso优化bp神经网络的污水处理出水质量预警方法 | |
CN105447248B (zh) | 基于金属定量构效关系的海水急性基准预测方法 | |
Gutiérrez-Estrada et al. | A heuristic approach to predicting water beetle diversity in temporary and fluctuating waters | |
Li et al. | A new ANN-Markov chain methodology for water quality prediction | |
Gheytaspour et al. | Forecasting oxygen demand in treatment plant using artificial neural networks | |
Li et al. | Prediction and elucidation of the population dynamics of Microcystis spp. in Lake Dianchi (China) by means of artificial neural networks | |
Li et al. | Remote monitoring of water quality for intensive fish culture | |
Ye et al. | Prediction of effluent total nitrogen and energy consumption in wastewater treatment plants: Bayesian optimization machine learning methods | |
CN117164103A (zh) | 生活污水处理系统的智能控制方法、终端及系统 | |
CN113539386A (zh) | 基于clmvo-elm的溶解氧浓度预测方法、装置、设备及存储介质 | |
CN116884523A (zh) | 一种海洋牧场水质多参数预测方法 | |
CN102855404B (zh) | 湖库水华应急治理决策方案的筛选方法 | |
CN116720743A (zh) | 基于数据聚类和机器学习的碳排放测算方法 | |
CN106021884A (zh) | 一种基于神经网络原理的潜流湿地出水浓度的预测方法 | |
CN105527398A (zh) | 一种凡纳滨对虾养殖池塘水质的评价方法 | |
CN114864015A (zh) | 水体富营养化检测方法、装置、设备及存储介质 | |
CN113449789A (zh) | 基于大数据的全光谱水质监测设备监测水质的质控方法 | |
Jia et al. | A cluster-stacking-based approach to forecasting seasonal chlorophyll-a concentration in coastal waters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |