CN114778505A - 一种基于三维荧光检测的藻类爆发预警方法及系统 - Google Patents

一种基于三维荧光检测的藻类爆发预警方法及系统 Download PDF

Info

Publication number
CN114778505A
CN114778505A CN202210436641.6A CN202210436641A CN114778505A CN 114778505 A CN114778505 A CN 114778505A CN 202210436641 A CN202210436641 A CN 202210436641A CN 114778505 A CN114778505 A CN 114778505A
Authority
CN
China
Prior art keywords
dimensional fluorescence
algae
fluorescence data
data
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210436641.6A
Other languages
English (en)
Inventor
钱国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210436641.6A priority Critical patent/CN114778505A/zh
Publication of CN114778505A publication Critical patent/CN114778505A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/64Fluorescence; Phosphorescence
    • G01N2021/6417Spectrofluorimetric devices

Landscapes

  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种基于三维荧光检测的藻类爆发预警方法及系统,涉及三维荧光水质检测技术领域。所述方法包括数据采集、数据划分、数据预处理、主成分分析、异常值筛除、分类建模及藻类爆发预警步骤。本发明依据三维荧光区域面积积分对监测水域的三维荧光数据演化进行划分,确定监测水域藻类爆发期三维荧光光谱主成分得分分布,从而在实际检测中实现对藻类爆发的高准确率、快速预警。

Description

一种基于三维荧光检测的藻类爆发预警方法及系统
技术领域
本发明涉及三维荧光水质检测技术领域,特别是涉及一种基于三维荧光检测的藻类爆发预警方法及系统。
背景技术
有害藻类防治是水污染监控治理的重点研究方向,对藻类爆发进行预测可有效减少水产养殖损失、避免饮用水源污染。因影响藻类生长的因素较多,传统的氮磷比预测方法存在较大误差;而黑白瓶法检测呼吸率与初级生产力则存在检测周期长、预警期短的问题;三维荧光光谱可有效检测水体中藻类色素及蛋白,但相对类络氨酸、类色氨酸、类腐殖质等水体常见有机物的强荧光,藻类色素及蛋白的荧光强度通常偏弱,单纯依据藻类荧光峰很难实现对藻类爆发的提前预测。
发明内容
本发明的目的在于针对藻类爆发预警的需求,提供一种基于三维荧光检测的藻类爆发预警方法及系统,以对藻类爆发进行高准确率、快速预警。
为实现上述目的,本发明提供了如下方案:
一种基于三维荧光检测的藻类爆发预警方法,包括:
对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度;
对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵;
对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组;
建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分;所述PCA模型的输入为所述三维荧光数组,输出为主成分得分;
基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本;
根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型;
采用所述训练好的OPLS-DA模型对藻类爆发进行预警。
可选地,所述对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据,具体包括:
使用三维荧光光谱仪对所述监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光光谱仪的固定积分时间为0.1s,激发波长为200nm-800nm,CCD为高增益,光谱分辨率为121×250。
可选地,所述对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵,具体包括:
将所述三维荧光数据按月划分为12组,获得12组三维荧光数据组;
对每组所述三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分,得到每个三维荧光数据样本的面积积分FRIalgae;所述选定区域为355nm<Ex<760nm、600nm<Em<735nm的藻类色素及藻类蛋白荧光区域;
对每组所述三维荧光数据组中的所有三维荧光数据样本的面积积分FRIalgae求平均值,得到每组所述三维荧光数据组的月积分平均值
Figure BDA0003613110380000021
确定所述月积分平均值
Figure BDA0003613110380000022
的所述三维荧光数据组处于藻类旺盛期;
确定在所述处于藻类旺盛期的三维荧光数据组之前一个月采集的所述三维荧光数据组处于藻类爆发期;
确定在所述处于藻类旺盛期的三维荧光数据组之前两个月采集的所述三维荧光数据组处于藻类生长期;
将所述处于藻类生长期、所述藻类爆发期和所述藻类旺盛期的三组三维荧光数据组构成高维荧光数据矩阵。
可选地,所述对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组,具体包括:
对所述高维荧光数据矩阵依次进行三维荧光矩阵转一维向量、负值及空值置0、Savitzky-Golay滤波降噪以及帕累托归一化处理,得到预处理后的三维荧光数组。
可选地,所述基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本,具体包括:
对所述PCA模型进行Hotelling T2检验,选择置信区间99%,将所述三维荧光数组中不在所述置信区间内的三维荧光数据样本作为异常值筛除,得到筛除异常值的样本。
可选地,所述根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型,具体包括:
将所述筛除异常值的样本划分为训练集和预测校验集;
以所述训练集中各个样本的主成分得分为特征变量建立所述OPLS-DA模型;所述OPLS-DA模型的输入为样本的主成分得分,输出为样本的主成分得分分布;
采用所述训练集和预测校验集对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型。
可选地,所述采用所述训练好的OPLS-DA模型对藻类爆发进行预警,具体包括:
对所述监测水域预设监测点进行在线检测,获得所述监测水域的当前三维荧光数据组;
对所述当前三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分并求平均,得到所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000041
判断所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000042
是否大于等于3×106,获得第一判断结果;
若所述第一判断结果为所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000043
大于等于3×106,输出结果当前藻类生长已处于旺盛期;
若所述第一判断结果为所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000044
小于3×106,对所述当前三维荧光数据组进行数据预处理,得到预处理后的当前三维荧光数组;
将所述预处理后的当前三维荧光数组加入所述预处理后的三维荧光数组构成新的三维荧光数组;
对所述新的三维荧光数组进行主成分分析,得到所述新的三维荧光数组中每个样本的主成分得分;
将所述当前三维荧光数组的主成分得分输入所述训练好的的OPLS-DA模型,输出所述当前三维荧光数组的主成分得分分布;
若所述当前三维荧光数组的主成分得分分布处于所述藻类爆发期,进行藻类即将爆发的预警。
一种基于三维荧光检测的藻类爆发预警系统,包括:
数据采集模块,用于对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度;
数据划分模块,用于对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵;
数据预处理模块,用于对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组;
主成分分析模块,用于建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分;所述PCA模型的输入为所述三维荧光数组,输出为主成分得分;
异常值筛除模块,用于基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本;
分类建模模块,用于根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型;
藻类爆发预警模块,用于采用所述训练好的OPLS-DA模型对藻类爆发进行预警。
可选地,所述数据采集模块,具体包括:
数据采集单元,用于使用三维荧光光谱仪对所述监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光光谱仪的固定积分时间为0.1s,激发波长为200nm-800nm,CCD为高增益,光谱分辨率为121×250。
可选地,所述数据划分模块,具体包括:
数据分组单元,用于将所述三维荧光数据按月划分为12组,获得12组三维荧光数据组;
区域面积积分单元,用于对每组所述三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分,得到每个三维荧光数据样本的面积积分FRIalgae;所述选定区域为355nm<Ex<760nm、600nm<Em<735nm的藻类色素及藻类蛋白荧光区域;
月积分平均值计算单元,用于对每组所述三维荧光数据组中的所有三维荧光数据样本的面积积分FRIalgae求平均值,得到每组所述三维荧光数据组的月积分平均值
Figure BDA0003613110380000051
藻类旺盛期划分单元,用于确定所述月积分平均值
Figure BDA0003613110380000052
的所述三维荧光数据组处于藻类旺盛期;
藻类爆发期划分单元,用于确定在所述处于藻类旺盛期的三维荧光数据组之前一个月采集的所述三维荧光数据组处于藻类爆发期;
藻类生长期划分单元,用于确定在所述处于藻类旺盛期的三维荧光数据组两个月采集的所述三维荧光数据组处于藻类生长期;
数据矩阵构成单元,用于将处于所述藻类生长期、所述藻类爆发期和所述藻类旺盛期的三组三维荧光数据组构成高维荧光数据矩阵。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种基于三维荧光检测的藻类爆发预警方法及系统,所述方法包括:对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度;对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵;对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组;建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分;所述PCA模型的输入为所述三维荧光数组,输出为主成分得分;基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本;根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型;采用所述训练好的OPLS-DA模型对藻类爆发进行预警。采用本发明藻类爆发预警方法能够对藻类爆发进行高准确率、快速预警。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于三维荧光检测的藻类爆发预警方法的流程图;
图2为本发明提供的藻类旺盛期藻类荧光区域面积积分图;
图3为本发明提供的OPLS-DA得分分布图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的在于针对藻类爆发预警的需求,提供一种基于三维荧光检测的藻类爆发预警方法及系统,以对藻类爆发进行高准确率、快速预警。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明一种基于三维荧光检测的藻类爆发预警方法的流程图。参见图1,本发明一种基于三维荧光检测的藻类爆发预警方法包括:
步骤101:对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据。
具体地,使用三维荧光光谱仪对所述监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据。所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度。其中三维荧光光谱仪的固定积分时间为0.1s,激发波长为200nm-800nm,CCD设为高增益,光谱分辨率为121×250。
步骤102:对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵。
对所得到的三维荧光数据进行汇总建模分析,数据划分依据为藻类色素及藻类蛋白的总体区域面积积分的月平均值
Figure BDA0003613110380000071
设定
Figure BDA0003613110380000072
时样本处于藻类旺盛期,在此之前一个月的样本处于藻类爆发期,此前两个月的样本处于藻类生长期。优选地,选取的三维荧光区域为355nm<Ex<760nm、600nm<Em<735nm,该三维荧光区域涵盖了叶绿素abc、藻蓝蛋白、藻红蛋白、胡萝卜素、硅甲藻黄素等藻类荧光色素的主要三维荧光特征峰,相比市场上传统藻类传感器只检测藻蓝蛋白或叶绿素a的单个激发、发射光的方案,计算355nm<Ex<760nm、600nm<Em<735nm的区域面积积分对包括甲藻、硅藻、隐藻在内的多个门类的藻类总量描述更准确、相关性更好,针对海水体系时
Figure BDA0003613110380000081
的判定依据也可做出相应调整使其适用于海水三维荧光数据的划分。
Figure BDA0003613110380000082
为实验水体的经验数据,当该积分值达到3×106时藻类已为旺盛状态,但此前该区域荧光面积积分数据差异不明显,其他可溶性有机物荧光区域主成分特征存在差异,但这些类蛋白质、类腐殖质特征存在复杂的自相关及互相关,很难进行平行因子拆分判别其与藻类的相关性,故本发明指定此前一个月的样本处于爆发期,此前两个月的样本处于生长期。
因此,所述步骤102具体包括:
步骤2.1:将所述三维荧光数据按月划分为12组,获得12组三维荧光数据组。
步骤2.2:对每组所述三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分,得到每个三维荧光数据样本的面积积分FRIalgae。其中选定区域为355nm<Ex<760nm、600nm<Em<735nm的藻类色素及藻类蛋白荧光区域。
步骤2.3:对每组所述三维荧光数据组中的所有三维荧光数据样本的面积积分FRIalgae求平均值,得到每组所述三维荧光数据组的月积分平均值
Figure BDA0003613110380000083
步骤2.4:确定所述月积分平均值
Figure BDA0003613110380000084
的所述三维荧光数据组处于藻类旺盛期。
步骤2.5:确定在所述处于藻类旺盛期的三维荧光数据组之前一个月采集的所述三维荧光数据组处于藻类爆发期。
步骤2.6:确定在所述处于藻类旺盛期的三维荧光数据组之前两个月采集的所述三维荧光数据组处于藻类生长期。
步骤2.7:将处于所述藻类生长期、所述藻类爆发期和所述藻类旺盛期的三组三维荧光数据组构成高维荧光数据矩阵。
步骤103:所述对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组。
步骤103包括对所述高维荧光数据矩阵依次进行三维荧光矩阵转一维向量、负值及空值置0、Savitzky-Golay滤波降噪以及帕累托归一化处理,得到预处理后的三维荧光数组。
具体地,将获得的三维荧光矩阵数据转换为1×30250的一维向量,进一步将多个样本的一维向量组成样本数m×30250的三维荧光数组,将数组中负值及空值置0,对数组进行Savitzky-Golay滤波降噪,对数组进行帕累托归一化,从而得到预处理后的三维荧光数组。
步骤104:建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分。
建立主成分分析PCA模型,所述PCA模型的输入为所述三维荧光数组,输出为主成分得分。基于PCA模型对预处理后的m×30250三维荧光数组进行主成分分析(PrincipalComponent Analysis,PCA),得到各个主成分得分,选取主成分数量的依据为贡献率大于99%。
步骤105:所述基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本。
对所述PCA模型进行Hotelling T2检验,选择置信区间99%,将所述三维荧光数组中不在所述置信区间内的三维荧光数据样本作为异常值筛除,得到筛除异常值的样本。
步骤106:所述根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型。
所述步骤106具体包括:
步骤6.1:将所述筛除异常值的样本划分为训练集和预测校验集。
具体地,在筛除异常值的样本中选取二分之一作为训练集,剩余样本作为预测校验集。
步骤6.2:以所述训练集中各个样本的主成分得分为特征变量建立所述OPLS-DA(Orthogonal Partial Least Squares Discriminant Analysis,正交偏最小二乘法判别)模型。
具体地,以所述训练集中各个样本的主成分得分为特征变量建立所述OPLS-DA模型。其中自变量X为用训练集数据构建的样本数据矩阵,样本数据矩阵的行向量为训练集样本的主成分的得分、列为训练集样本序列;应变量Y为自定义类别变量。
自变量X可由以下公式确定:
Figure BDA0003613110380000101
其中
Figure BDA0003613110380000102
为可预测应变量Y的成分,
Figure BDA0003613110380000103
为X与Y的正交成分,E为残差矩阵。
对剔除正交成分的
Figure BDA0003613110380000104
与Y进行偏最小二乘法拟合获得OPLS-DA模型。所述OPLS-DA模型的输入为样本的主成分得分,输出为样本的主成分得分分布。图3为本发明提供的OPLS-DA得分分布图。如图3所示,在藻类演化过程中,藻类旺盛期、藻类爆发期和藻类生长期主成分得分出现明显聚类,将主成分得分分布位于模型藻类爆发期区间作为预警标的。
步骤6.3:采用所述训练集和预测校验集对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型。
将预测校验集数据输入训练好的OPLS-DA模型,验证藻类爆发期区间数据预测准确率。考虑到不同水系周边环境与污染源存在显著差异,训练好的OPLS-DA模型预测只针对训练集样本的采集水域,当需要对其他水域进行藻类爆发预警时,再次进行采样建模即可。
步骤107:所述采用所述训练好的OPLS-DA模型对藻类爆发进行预警。
三维荧光光谱仪设置积分时间为0.1s,激发波长200-800nm,CCD设置为高增益,光谱分辨率为121×250,采集监测水域的待测水样并进行在线检测,获得初始三维荧光光谱数据构成当前三维荧光数据组,进一步进入以下判定流程:
对355nm<Ex<760nm、600nm<Em<735nm进行区域面积积分,取平均获得
Figure BDA0003613110380000111
判断
Figure BDA0003613110380000112
是否大于等于3×106,若大于3×106,则输出结果藻类生长已处于旺盛期;若
Figure BDA0003613110380000113
小于3×106,进入下一步判断处理,对该样本数据组按照预处理步骤依次进行一维向量转换、空值及负值置0、滤波降噪、帕累托归一化处理;将该预处理后的待测样本数据组加入之前的m×30250数组组成新的(m+1)×30250数组;对新的(m+1)×30250数组进行主成分分析,选取的主成分数与之前m×30250数组PCA模型的一致;提取待测样本的主成分得分,输入此前建立的OPLS-DA模型,输出得分分布,若得分分布处于藻类爆发期,则输出藻类即将爆发的预警,若处于其他区间则不做预警。
因此,步骤107具体包括:
步骤7.1:对所述监测水域预设监测点进行在线检测,获得所述监测水域的当前三维荧光数据组。
步骤7.2:对所述当前三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分并求平均,得到所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000114
步骤7.3:判断所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000115
是否大于等于3×106
步骤7.4:若当前三维荧光数据组的积分平均值
Figure BDA0003613110380000116
大于等于3×106,输出结果当前藻类生长已处于旺盛期。
步骤7.5:若当前三维荧光数据组的积分平均值
Figure BDA0003613110380000117
小于3×106,进入步骤步骤7.6。
步骤7.6:对所述当前三维荧光数据组进行数据预处理,得到预处理后的当前三维荧光数组。
具体地,对所述当前三维荧光数据组依次进行一维向量转换、空值及负值置0、滤波降噪、帕累托归一化处理,得到预处理后的当前三维荧光数组。
步骤7.5:将所述预处理后的当前三维荧光数组加入所述预处理后的三维荧光数组构成新的三维荧光数组。
本发明数据预处理步骤将三维荧光处理成二维光谱,从而可以将OPLS-DA模型用于二维光谱。在真正使用时把待测样本数据作为校验集数据使用,即待测数据是建模数据的一部分。因此将所述预处理后的当前三维荧光数组加入建模阶段获得的所述预处理后的三维荧光数组,构成新的三维荧光数组。
步骤7.6:对所述新的三维荧光数组进行主成分分析,得到所述新的三维荧光数组中每个样本的主成分得分。
具体地,对新的三维荧光数组进行主成分分析,选取的主成分数量与之前三维荧光数组PCA模型的一致。
步骤7.7:将所述当前三维荧光数组的主成分得分输入所述训练好的的OPLS-DA模型,输出所述当前三维荧光数组的主成分得分分布。
步骤7.8:若所述当前三维荧光数组的主成分得分分布处于所述藻类爆发期,进行藻类即将爆发的预警。若所述当前三维荧光数组的主成分得分分布处于其他区间,则不做预警。
藻类生长与水质相关且对水体中有机物成分及含量产生持续影响,但溶解性显色有机物荧光峰过度重叠近似,很难通过主要荧光峰对水体有机物变化进行判断,本发明通过对监测水域的藻类三维荧光演化进行分类建模,充分利用三维荧光中所有与藻类变化相关的主成分,使该监测水域的后续三维荧光监测能对藻类爆发进行高准确率、快速预警。实验结果显示本发明提供的OPLS-DA模型用于藻类鉴别预测准确率为72%-100%,能够实现单个水体藻类爆发的高准确率快速预警。
下面提供本发明基于三维荧光检测的藻类爆发预警方法的一个具体实施例。
选取监测水域中不同水深、不同离岸距离的若干个采样点,按间隔时间一个月持续采集全年的三维荧光数据,以一个月的样本数据为一组。
对藻类色素及藻类蛋白荧光总体区域面积积分。图2为本发明提供的藻类旺盛期藻类荧光区域面积积分图。如图2所示,为一个处于藻类旺盛期的样本的三维荧光光谱图,通过计算机软件计算获得图2选定区域内藻类色素及藻类蛋白的三维荧光区域面积积分FRIalage
计算各个组三维荧光区域面积积分平均值
Figure BDA0003613110380000131
Figure BDA0003613110380000132
时确定该组样本为藻类旺盛期,此前一个月的数据组样本处于藻类爆发期,此前两个月的数据组样本处于藻类生长期。
进一步,对三组数据共111个样本进行预处理,将样本三维荧光矩阵降为一维向量、将空值与负值置0、进行Savitzky-Golay滤波降噪与帕累托归一化。
进一步,对111×30250数组进行PCA主成分分析,选取贡献率前16的主成分,累积贡献率超过99%。对PCA模型进行Hotelling T2检验,选择置信区间99%,不在此区间的样本作为异常值筛除。
在筛除异常值的样本中选取二分之一作为训练集、剩余样本作为预测校验集,以各个主成分得分为特征变量建立三分类的正交偏最小二乘法判别OPLS-DA模型,结果如图3所示,在藻类演化过程中,藻类旺盛期藻类爆发期与藻类生长期主成分得分出现明显聚类,将主成分得分分布位于模型藻类爆发期区间的作为预警标的。
将预测校验集数据输入OPLS-DA模型,验证藻类爆发期区间数据预测准确率,最终结果为78.9%,考虑到不同水系周边环境与污染源存在显著差异,本模型预测只针对训练集样本的采集水域,当需要对其他水域进行藻类爆发预警时,再次进行采样建模即可。
基于本发明提供方法,本发明还提供一种基于三维荧光检测的藻类爆发预警系统,包括:
数据采集模块,用于对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度。
数据划分模块,用于对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵。
数据预处理模块,用于对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组。
主成分分析模块,用于建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分;所述PCA模型的输入为所述三维荧光数组,输出为主成分得分。
异常值筛除模块,用于基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本。
分类建模模块,用于根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型。
藻类爆发预警模块,用于采用所述训练好的OPLS-DA模型对藻类爆发进行预警。
其中,所述数据采集模块具体包括:
数据采集单元,用于使用三维荧光光谱仪对所述监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光光谱仪的固定积分时间为0.1s,激发波长为200nm-800nm,CCD为高增益,光谱分辨率为121×250。
所述数据划分模块具体包括:
数据分组单元,用于将所述三维荧光数据按月划分为12组,获得12组三维荧光数据组。
区域面积积分单元,用于对每组所述三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分,得到每个三维荧光数据样本的面积积分FRIalgae;所述选定区域为355nm<Ex<760nm、600nm<Em<735nm的藻类色素及藻类蛋白荧光区域。
月积分平均值计算单元,用于对每组所述三维荧光数据组中的所有三维荧光数据样本的面积积分FRIalgae求平均值,得到每组所述三维荧光数据组的月积分平均值
Figure BDA0003613110380000141
藻类旺盛期划分单元,用于确定所述月积分平均值
Figure BDA0003613110380000142
的所述三维荧光数据组处于藻类旺盛期。
藻类爆发期划分单元,用于确定在所述处于藻类旺盛期的三维荧光数据组之前一个月采集的所述三维荧光数据组处于藻类爆发期。
藻类生长期划分单元,用于确定在所述处于藻类旺盛期的三维荧光数据组之前两个月采集的所述三维荧光数据组处于藻类生长期。
数据矩阵构成单元,用于将处于所述藻类生长期、所述藻类爆发期和所述藻类旺盛期的三组三维荧光数据组构成高维荧光数据矩阵。
所述数据预处理模块具体包括:
数据预处理单元,用于对所述高维荧光数据矩阵依次进行三维荧光矩阵转一维向量、负值及空值置0、Savitzky-Golay滤波降噪以及帕累托归一化处理,得到预处理后的三维荧光数组。
所述异常值筛除模块具体包括:
异常值筛除单元,用于对所述PCA模型进行Hotelling T2检验,选择置信区间99%,将所述三维荧光数组中不在所述置信区间内的三维荧光数据样本作为异常值筛除,得到筛除异常值的样本。
所述分类建模模块具体包括:
样本划分单元,用于将所述筛除异常值的样本划分为训练集和预测校验集。
OPLS-DA模型建立单元,用于以所述训练集中各个样本的主成分得分为特征变量建立所述OPLS-DA模型;所述OPLS-DA模型的输入为样本的主成分得分,输出为样本的主成分得分分布。
OPLS-DA模型训练单元,用于采用所述训练集和预测校验集对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型。
所述藻类爆发预警模块具体包括:
待测样本数据采集单元,用于对所述监测水域预设监测点进行在线检测,获得所述监测水域的当前三维荧光数据组。
待测样本区域面积积分单元,用于对所述当前三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分并求平均,得到所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000151
区域面积积分判断单元,用于判断所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000161
是否大于等于3×106,获得第一判断结果。
生长旺盛期判断单元,用于若所述第一判断结果为所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000162
大于等于3×106,输出结果当前藻类生长已处于旺盛期。
待测样本数据预处理单元,用于若所述第一判断结果为所述当前三维荧光数据组的积分平均值
Figure BDA0003613110380000163
小于3×106,对所述当前三维荧光数据组进行数据预处理,得到预处理后的当前三维荧光数组。
三维荧光数组更新单元,用于将所述当前三维荧光数组加入所述三维荧光数组构成新的三维荧光数组。
主成分分析单元,用于对所述新的三维荧光数组进行主成分分析,得到所述新的三维荧光数组中每个样本的主成分得分。
主成分得分分布计算单元,用于将所述当前三维荧光数组的主成分得分输入所述训练好的的OPLS-DA模型,输出所述当前三维荧光数组的主成分得分分布。
藻类爆发预警单元,用于若所述当前三维荧光数组的主成分得分分布处于所述藻类爆发期,进行藻类即将爆发的预警。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于三维荧光检测的藻类爆发预警方法,其特征在于,包括:
对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度;
对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵;
对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组;
建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分;所述PCA模型的输入为所述三维荧光数组,输出为主成分得分;
基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本;
根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型;
采用所述训练好的OPLS-DA模型对藻类爆发进行预警。
2.根据权利要求1所述的藻类爆发预警方法,其特征在于,所述对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据,具体包括:
使用三维荧光光谱仪对所述监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光光谱仪的固定积分时间为0.1s,激发波长为200nm-800nm,CCD为高增益,光谱分辨率为121×250。
3.根据权利要求1所述的藻类爆发预警方法,其特征在于,所述对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵,具体包括:
将所述三维荧光数据按月划分为12组,获得12组三维荧光数据组;
对每组所述三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分,得到每个三维荧光数据样本的面积积分FRIalgae;所述选定区域为355nm<Ex<760nm、600nm<Em<735nm的藻类色素及藻类蛋白荧光区域;
对每组所述三维荧光数据组中的所有三维荧光数据样本的面积积分FRIalgae求平均值,得到每组所述三维荧光数据组的月积分平均值
Figure FDA0003613110370000021
确定所述月积分平均值
Figure FDA0003613110370000022
的所述三维荧光数据组处于藻类旺盛期;
确定在所述处于藻类旺盛期的三维荧光数据组之前一个月采集的所述三维荧光数据组处于藻类爆发期;
确定在所述处于藻类旺盛期的三维荧光数据组之前两个月采集的所述三维荧光数据组处于藻类生长期;
将处于所述藻类生长期、所述藻类爆发期和所述藻类旺盛期的三组三维荧光数据组构成高维荧光数据矩阵。
4.根据权利要求1所述的藻类爆发预警方法,其特征在于,所述对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组,具体包括:
对所述高维荧光数据矩阵依次进行三维荧光矩阵转一维向量、负值及空值置0、Savitzky-Golay滤波降噪以及帕累托归一化处理,得到预处理后的三维荧光数组。
5.根据权利要求1所述的藻类爆发预警方法,其特征在于,所述基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本,具体包括:
对所述PCA模型进行Hotelling T2检验,选择置信区间99%,将所述三维荧光数组中不在所述置信区间内的三维荧光数据样本作为异常值筛除,得到筛除异常值的样本。
6.根据权利要求1所述的藻类爆发预警方法,其特征在于,所述根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型,具体包括:
将所述筛除异常值的样本划分为训练集和预测校验集;
以所述训练集中各个样本的主成分得分为特征变量建立所述OPLS-DA模型;所述OPLS-DA模型的输入为样本的主成分得分,输出为样本的主成分得分分布;
采用所述训练集和预测校验集对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型。
7.根据权利要求1所述的藻类爆发预警方法,其特征在于,所述采用所述训练好的OPLS-DA模型对藻类爆发进行预警,具体包括:
对所述监测水域预设监测点进行在线检测,获得所述监测水域的当前三维荧光数据组;
对所述当前三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分并求平均,得到所述当前三维荧光数据组的积分平均值
Figure FDA0003613110370000031
判断所述当前三维荧光数据组的积分平均值
Figure FDA0003613110370000032
是否大于等于3×106,获得第一判断结果;
若所述第一判断结果为所述当前三维荧光数据组的积分平均值
Figure FDA0003613110370000033
大于等于3×106,输出结果当前藻类生长已处于旺盛期;
若所述第一判断结果为所述当前三维荧光数据组的积分平均值
Figure FDA0003613110370000034
小于3×106,对所述当前三维荧光数据组进行数据预处理,得到预处理后的当前三维荧光数组;
将所述预处理后的当前三维荧光数组加入所述预处理后的三维荧光数组构成新的三维荧光数组;
对所述新的三维荧光数组进行主成分分析,得到所述新的三维荧光数组中每个样本的主成分得分;
将所述当前三维荧光数组的主成分得分输入所述训练好的的OPLS-DA模型,输出所述当前三维荧光数组的主成分得分分布;
若所述当前三维荧光数组的主成分得分分布处于所述藻类爆发期,进行藻类即将爆发的预警。
8.一种基于三维荧光检测的藻类爆发预警系统,其特征在于,包括:
数据采集模块,用于对监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光数据包括激发波长Ex、发射波长Em和荧光强度;
数据划分模块,用于对所述三维荧光数据进行数据划分,划分出处于藻类生长期、藻类爆发期和藻类旺盛期的三维荧光数据,构成高维荧光数据矩阵;
数据预处理模块,用于对所述高维荧光数据矩阵进行数据预处理,得到预处理后的三维荧光数组;
主成分分析模块,用于建立主成分分析PCA模型对所述三维荧光数组进行主成分分析,得到所述三维荧光数组中每个样本的主成分得分;所述PCA模型的输入为所述三维荧光数组,输出为主成分得分;
异常值筛除模块,用于基于所述PCA模型对所述三维荧光数组进行异常值筛除,得到筛除异常值的样本;
分类建模模块,用于根据所述筛除异常值的样本的主成分得分建立三分类的正交偏最小二乘法判别OPLS-DA模型,并对所述OPLS-DA模型进行训练和测试,生成训练好的OPLS-DA模型;
藻类爆发预警模块,用于采用所述训练好的OPLS-DA模型对藻类爆发进行预警。
9.根据权利要求8所述的藻类爆发预警系统,其特征在于,所述数据采集模块,具体包括:
数据采集单元,用于使用三维荧光光谱仪对所述监测水域预设监测点进行间隔时间为一个月的全年检测,获得所述监测水域的三维荧光数据;所述三维荧光光谱仪的固定积分时间为0.1s,激发波长为200nm-800nm,CCD为高增益,光谱分辨率为121×250。
10.根据权利要求8所述的藻类爆发预警系统,其特征在于,所述数据划分模块,具体包括:
数据分组单元,用于将所述三维荧光数据按月划分为12组,获得12组三维荧光数据组;
区域面积积分单元,用于对每组所述三维荧光数据组中的每个三维荧光数据样本中的选定区域进行三维荧光区域面积积分,得到每个三维荧光数据样本的面积积分FRIalgae;所述选定区域为355nm<Ex<760nm、600nm<Em<735nm的藻类色素及藻类蛋白荧光区域;
月积分平均值计算单元,用于对每组所述三维荧光数据组中的所有三维荧光数据样本的面积积分FRIalgae求平均值,得到每组所述三维荧光数据组的月积分平均值
Figure FDA0003613110370000051
藻类旺盛期划分单元,用于确定所述月积分平均值
Figure FDA0003613110370000052
的所述三维荧光数据组处于藻类旺盛期;
藻类爆发期划分单元,用于确定在所述处于藻类旺盛期的三维荧光数据组之前一个月采集的所述三维荧光数据组处于藻类爆发期;
藻类生长期划分单元,用于确定在所述处于藻类旺盛期的三维荧光数据组之前两个月采集的所述三维荧光数据组处于藻类生长期;
数据矩阵构成单元,用于将处于所述藻类生长期、所述藻类爆发期和所述藻类旺盛期的三组三维荧光数据组构成高维荧光数据矩阵。
CN202210436641.6A 2022-04-25 2022-04-25 一种基于三维荧光检测的藻类爆发预警方法及系统 Withdrawn CN114778505A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210436641.6A CN114778505A (zh) 2022-04-25 2022-04-25 一种基于三维荧光检测的藻类爆发预警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210436641.6A CN114778505A (zh) 2022-04-25 2022-04-25 一种基于三维荧光检测的藻类爆发预警方法及系统

Publications (1)

Publication Number Publication Date
CN114778505A true CN114778505A (zh) 2022-07-22

Family

ID=82433357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210436641.6A Withdrawn CN114778505A (zh) 2022-04-25 2022-04-25 一种基于三维荧光检测的藻类爆发预警方法及系统

Country Status (1)

Country Link
CN (1) CN114778505A (zh)

Similar Documents

Publication Publication Date Title
Al-Hiary et al. Fast and accurate detection and classification of plant diseases
Bontemps et al. An object-based change detection method accounting for temporal dependences in time series with medium to coarse spatial resolution
CN109142317B (zh) 一种基于随机森林模型的拉曼光谱物质识别方法
Xiaobo et al. Independent component analysis in information extraction from visible/near-infrared hyperspectral imaging data of cucumber leaves
CN108596246A (zh) 基于深度神经网络的土壤重金属含量检测模型的建立方法
Bendel et al. Evaluating the suitability of hyper-and multispectral imaging to detect foliar symptoms of the grapevine trunk disease Esca in vineyards
US20220390374A1 (en) Method for extracting raman characteristic peaks employing improved principal component analysis
CN110763660A (zh) 基于集成学习的libs定量分析方法
CN108596085A (zh) 基于卷积神经网络的土壤重金属含量检测模型的建立方法
CN108844941B (zh) 一种基于拉曼光谱和pca-hca的不同品位磷矿的鉴别和分类方法
CN107895136B (zh) 一种煤矿区域识别方法及系统
CN108573105A (zh) 基于深度置信网络的土壤重金属含量检测模型的建立方法
CN110108658B (zh) 一种污染气体红外光谱识别方法及系统
CN109187443B (zh) 基于多波长透射光谱的水体细菌微生物准确识别方法
Grifoni et al. Application of Graph Theory to unsupervised classification of materials by Laser-Induced Breakdown Spectroscopy
Alexander et al. Identifying spatial structure in phytoplankton communities using multi‐wavelength fluorescence spectral data and principal component analysis
DB et al. Classification of oil palm female inflorescences anthesis stages using machine learning approaches
CN115661069A (zh) 一种高光谱异常检测方法及计算机装置
CN115115940A (zh) 一种蓝藻水华监测方法及该方法的监测预警系统
CN113570538A (zh) 一种叶片rgb图像偏态分布参数信息采集及分析方法
CN109784390B (zh) 一种人工智能嗅觉动态响应图谱气体检测识别方法
Gurubasava et al. Analysis of agricultural soil pH using digital image processing
Eady et al. Methods for hyperspectral microscope calibration and spectra normalization from images of bacteria cells
Puno et al. Vision system for soil nutrient detection using fuzzy logic
CN117789038A (zh) 一种基于机器学习的数据处理与识别模型的训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220722