CN113705608A - 利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用 - Google Patents

利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用 Download PDF

Info

Publication number
CN113705608A
CN113705608A CN202110837232.2A CN202110837232A CN113705608A CN 113705608 A CN113705608 A CN 113705608A CN 202110837232 A CN202110837232 A CN 202110837232A CN 113705608 A CN113705608 A CN 113705608A
Authority
CN
China
Prior art keywords
algae
microalgae
model
paralytic shellfish
producing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110837232.2A
Other languages
English (en)
Inventor
江天久
徐薇
纽杰
苟偲钰
甘雯玉
张帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
University of Jinan
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202110837232.2A priority Critical patent/CN113705608A/zh
Publication of CN113705608A publication Critical patent/CN113705608A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用。本发明通过提取产麻痹性贝毒的藻类或不产麻痹性贝毒的藻类在不同环境条件下的三维荧光光谱信息,运用SVM和CNN模型提取实验藻类的特征峰,通过反复训练模型,并不断优化参数,得到可用于识别产麻痹性贝类毒素和不产麻痹性贝类毒素藻类的机器学习和深度学习模型,能用于产毒藻的识别。本发明对麻痹性贝毒藻类和非麻痹性贝毒藻类判别正确率很高,基本实现了对产毒藻快速准确识别的目的。本发明无需去除荧光原始光谱的瑞利散射,可有效降低数据处理的繁杂程度,提高模型的运行速度,更方便、快捷、准确的对产麻痹性贝类毒素藻类进行判别。

Description

利用机器学习和/或人工神经网络模型识别产痹性贝类毒素 藻类的方法与应用
技术领域
本发明属于有毒微藻识别防治领域,具体涉及一种利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用。
背景技术
赤潮是指水中的微生物由于水体环境及气候等原因大量繁殖导致水体变色的现象。近些年我国沿海的赤潮发生次数及面积有持续增加的趋势,经济损失严重。
根据赤潮的毒性特点,通常把赤潮分为三类,分别为无毒赤潮、鱼毒性赤潮和有毒赤潮。三类赤潮中,无毒赤潮发生的比例最高,这类赤潮不产毒素,鱼毒性赤潮产生的毒素只对鱼类造成影响,海洋中的其它生物通常不会对其富集,而有毒赤潮产生的毒素可以通过生物富集作用对人或动物的健康造成危害。有毒赤潮主要为浮游或底栖的藻类所造成。近年来,在我国的东海和长江口,多次发生大规模有毒藻赤潮,近岸海产贝类的食用安全风险增加。
有毒赤潮产生的毒素主要有麻痹性贝毒(Paralytic Shellfish Poisoning,PSP)、腹泻性贝毒(Diarrhetic Shellfish Poisoning,DSP)、记忆缺失性贝毒(AmnesicShellfish Poisoning,ASP)、神经性贝毒(Neurotoxic Shellfish Poisoning,NSP)和西加鱼毒(Ciguatera Fish Poisoning,CFP)等。
在所有的赤潮毒素中,麻痹性贝毒由于其分布广,毒性强而成为危害最大的生物毒素之一。产麻痹性贝毒的藻类主要集中在甲藻门,如膝沟藻属(Gonyaulax)、亚历山大藻属(Alexandrium)、裸甲藻属(Gymnodinium)。除了甲藻之外,其它门类的少数藻类也可以产PSP,如淡水藻中的蓝绿藻属,红藻和一些细菌。亚历山大藻属中的塔玛亚历山大藻(A.tamarense)、链状亚历山大藻(A.catenella)、微小亚历山大藻(A.minutum)是产PSP的主要藻类。
目前有一些检测PSP的方法,如生物检测法、免疫法、化学分析法,但这些方法要么检测对象单一,要么受制于准确性、灵敏性、重复性差的缺陷,无法广泛应用。
发明内容
本发明的首要目的在于提供一种利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法。
本发明的另一目的在于提供上述利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法的应用。
本发明的目的通过下述技术方案实现:
一种利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法,包括如下步骤:
(1)测定微藻在不同温度、盐度和光照强度下各生长期的三维荧光,得到微藻细胞的三维荧光光谱数据信息并将光谱文件转成TXT文件储存;其中,微藻包括产麻痹性贝毒微藻和不产麻痹性贝毒微藻;
(2)通过MATLAB读取步骤(1)所有TXT文件,并将每个TXT中的光谱信息数据信息进行最大归一化处理;
(3)运用SVM模型和CNN模型分别提取实验藻类的特征峰,通过对模型进行多次训练,模型不断学习特异性光谱特征信息,得到训练后的SVM模型和CNN模型;
(4)测定待测藻类的三维荧光光谱数据;将得到的待测藻类的三维荧光光谱数据进行归一化处理,运用训练后的SVM模型和CNN模型进行识别待测藻类是否为产痹性贝类毒素藻类。
步骤(1)中所述的生长期包括对数期、稳定期和衰亡期。
步骤(1)中所述的产麻痹性贝毒微藻的株数优选为3株以上。
所述的产麻痹性贝毒微藻优选为微小亚历山大藻(Alexandriumminimum,台湾株)AMSY、链状裸甲藻(Gymnodiniumcatenatum,防城巷株)GCFC和塔玛亚历山大藻(Alexandriumtamarense,香港株)ATHK。
步骤(1)中所述的不产麻痹性贝毒微藻的株数优选为18株以上。
所述的不产麻痹性贝毒微藻优选为塔玛亚历山大藻(A.tamarense)ATCZ、前沟藻(A.carterae)ACCZ、东海原甲藻(P.donghaiense)PDCZ、利马原甲藻(P.lima)PLCZ、利马原甲藻(P.lima)PLCZ1、米氏凯伦藻(K.mikimotoi)KMCZ、血红哈卡藻(A.sanguinea)ASCZ、杜氏盐藻(D.salina)DSCZ、亚心形爿藻(P.subcordiformis)PSCZ、黄绿等鞭金藻(I.galbana)IGCZ、等鞭金藻(I.galbana)IGC1、海洋卡盾藻(C.marina)CMHK、卵圆卡盾藻(C.ovata)COHK、赤潮异湾藻(H.akashiwo)HACZ、小定鞭藻(P.parvum)PPCZ、柔弱角毛藻(C.debilis)CDCZ、中肋骨条藻(S.costatum)SCCZ、尖刺拟菱形藻(P.pungens)PP1CZ和小球藻(C.vulgaris)CVCZ中的至少十八种。
步骤(1)和步骤(4)中所述的三维荧光数据优选为通过使用荧光分光光度计扫描获得,激发波长范围为400~600nm,发射波长范围为650~750nm,步长设置为5nm,狭缝宽度设置为10nm,扫描速度设置为30000nm/s,信号积分时间为0.004s,生长期隔天测一次。
步骤(1)中所述的光照强度优选为60μmolm-2s-1~200μmolm-2s-1;更优选为60μmolm-2s-1、120μmolm-2s-1和200μmolm-2s-1
步骤(1)中所述的温度优选为16℃~28℃;更优选为16℃、22℃和28℃。
步骤(1)中所述的盐度优选为25‰~35‰;更优选为25‰、30‰、35‰。
步骤(2)中所述的最大归一化的处理方法如下:
X*=[Xn-Xmin]/[Xmax-Xmin];
Xn:各个频点的荧光强度;
Xmax:荧光强度最大值;
Xmin:荧光强度最小值;
X*:归一化所得荧光光谱的相对强度值。
步骤(2)中所述的最大值归一化通过MATLAB 2020b编程软件实现。
步骤(3)中所述的SVM和CNN模型皆通过MATLAB 2020b编程软件实现。
步骤(3)中所述的SVM模型通过MATLAB 2020b软件中的APP。
步骤(3)中所述的训练后的SVM模型优选通过如下具体步骤得到:首先批量读取原数据并归一化,再将归一化的数据调用reshape函数一维化,接着将处理好的数据的70%导入MATLAB APP classification learner中,设置五折交叉验证方式,训练集产麻痹性贝毒微藻设置为1,不产毒藻设置为0,训练模型;将剩下30%数据导入训练好的模型中,作为验证集,进行分类判别。
步骤(3)中所述的训练后的CNN模型优选通过如下具体步骤得到:
A、通过MATLAB批量读取TXT文件中的数据并归一化;
B、设置CNN模型结构,包括输入层、卷积层、归一化层、ReLU层、最大池化层、全连接层、softmax层和输出层;
C、将步骤A得到的归一化的数据通过编程转化成4—D形式,训练集占总样本量70%,训练集产麻痹性贝毒微藻的目标设置为1,不产毒藻的目标设置为0,CNN模型训练时训练与验证比例设置为7:3,并运行程序对模型进行训练;将剩下30%数据导入训练好的模型中,作为验证集,进行分类判别。
步骤(4)中所述的识别的标准优选如下:若判别结果为1,则该待测藻类为产麻痹性贝毒的微藻;若判别结果为0,则该未知藻为不产麻痹性贝毒的微藻。
上述利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法在产痹性贝类毒素藻类鉴定中的应用。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明提供的是通过将同一种藻类不同生长期、不同环境条件下的所有荧光特征谱加入编程模型中训练,提取特征荧光特征谱,并将正确的将藻类分类,换言之,机器学习和深度学习模型集中了不同生长期、不同环境因子下所有特征谱。因此,利用机器学习和深度学习模型进行判别误差较小,相对较准确。
(2)本发明以SVM和CNN模型,对麻痹性贝毒藻类和非麻痹性贝毒藻类判别,麻痹性贝毒藻类和非麻痹性贝毒藻类判别正确率为SVM(96.25%和90.97%)、CNN(95.88%和94.28%),正确率很高,基本实现了对产毒藻快速准确识别的目的。
(3)本发明无需去除荧光原始光谱的瑞利散射,可有效降低数据处理的繁杂程度,提高模型的运行速度,更方便、快捷、准确的对产麻痹性贝类毒素藻类进行判别。
具体实施方式
下面结合实施例对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
一、实验方法
1、藻类的培养
藻类的培养所用的是天然海水(pH 7.5±0.1,盐度27‰,由广州市黄沙水产市场购得),使用0.45μm微孔滤膜过滤后,在121℃、15psi条件下灭菌25min,冷却到室温。用f/2改良配方配制藻类培养液,接种后置于人工气候箱中,温度25℃,光照强度150μmolm-2s-1,光暗循环L:D=12:12条件下培养。每种藻设三个平行样,每隔一天固定的时间取样,加鲁格固定后,在显微镜下进行藻细胞计数,绘制生长曲线。
2、不同环境下藻类的荧光光谱测定:
设置光照强度为60μmolm-2s-1、120μmolm-2s-1、200μmolm-2s-1,温度为16℃、22℃、28℃,盐度25‰、30‰、35‰三种环境因子。实验藻种在25℃,光暗循环L:D=12:12,光照强度150μmolm-2s-1条件下培养,待其进入对数生长期后,重新接种藻液,进行藻类生长的单因子控制实验,每种因子分三组,每组三个平行。其中,当单因素变化时,其他培养条件不变,如光照强度变化,那么培养温度为22℃,盐度为25‰;如培养温度变化,光照强度为120μmolm- 2s-1,盐度为25‰。绘制每种藻在不同环境条件下的生长曲线,确定藻类的生长期,并进行藻类PSP的HPLC检测和活体藻三维荧光光谱测定。
3、麻痹性贝毒的提取
将收集的藻液反复冻融(操作见“Selander E.Copepods induce paralyticshellfish toxin production in marine dinoflagellates[J].Proceedings of theRoyal Society B:Biological Sciences,2006.273(1594):1673-1680.”或是“Touzet N,et al.Influence of inorganic nutrition on growth and PSP toxin production ofAlexandrium minutum(Dinophyceae)from Cork Harbour,Ireland[J].Toxicon,2007.50(1):106-119”),用超声破碎仪破碎藻细胞(50%功率,2s运行、2s停止,15min),取破碎好的藻液镜检(破碎率>95%)。4℃、11000g离心10min,取上清液,重复上述步骤,用10000道尔顿滤膜孔径的超滤离心管离心(4℃、7200g、10min),取超滤液,于-20℃冰箱保存,用于毒素的HPLC分析。
4、麻痹性贝毒的HPLC检测
麻痹性贝毒的HPLC检测分析参考Oshima(Oshima Y,et al.Post-columnderivatization HPLC methods for paralytic shellfish poisons[J].Manual onHarmful Marine Microalgae.,1995:81-94.)建立,并经Anderso(Anderson,D.M.,etal.Paralytic shellfish poisoning in southern China[J].Toxicon,1996.34(5):579-590)修改的HPLC柱后衍生法。分析过程中采取3种不同的洗脱液等梯度洗脱方式,分析STX类毒素使用2mmol/mL的庚基磺酸钠离子对的30mmol/mL的磷酸铵缓冲液作为流动相,pH用氨水调为7.1,在洗脱时加入水:乙腈为100:5体积比例的乙腈水溶液;C类毒素使用2mmol/mL的四丁基磷酸氢氨溶液作为流动相,pH使用氨水调为6.1;分析GTX使用含2mmol/mL庚基磺酸钠离子对的浓度为10mmol/mL的磷酸铵缓冲液作为流动相,pH用氨水调至7.1。三类毒素分析过程中,柱后衍生系统的氧化剂均采用含有7mmol/mL高碘酸的浓度为50mmol/mL的磷酸氢二钾缓冲液,pH用KOH溶液调为9.0;酸化剂为0.5mol/mL的醋酸溶液。洗脱液流动相流速设置为0.8mL/min,柱后衍生系统采用的流速为0.4mL/min,洗脱时柱温均设置为33℃,柱后衍生温度GTX毒素和STX毒素为75℃,C类毒素为65℃。进行HPLC分析时,为了防止因为样品峰的漂移及不同时间所测峰面积有变化而引起的误差,每隔4个样品,加入毒素标准品分析,确保所测样品PSP各成分和含量的准确性。
5、实验数据的分析处理
在进行HPLC分析时,根椐标准品的出峰时间及峰面积,对样品峰进行分析,确定PSP各成分及其峰面积。各成分定量的计算公式如下:单位藻液体积PSP含量为:
单位藻液体积PSP含量为:X=VD÷(1000×VZ)×(VB×CB÷V1);
单位藻细胞PSP量计算公式为:X1=(VB×CB÷V1)×(VD÷VZ)÷N;
X为单位藻液体积PSP毒素含量(μmol/mL);
VB为标准品峰面积;
CB为标准品中毒素的浓度(μmol/mL);
V1为样品峰峰面积;
VZ为提取PSP时所取藻液体积(mL);
VD为提取PSP时定容的体积(mL);
X1为单位藻细胞PSP含量(μmol/细胞);
N为单位藻液所含的藻细胞数(细胞/mL);
计算出PSP各成分含量后,将各成分相加,得出样品中PSP的总量。
用Excel2010版和origin软件绘图,用SPSS19.0软件进行数据分析处理。
6、用于三维荧光光谱测定的藻细胞密度确定
为防止藻细胞在密度高时会产生荧光自吸收现象,取对数生长末期藻液,用f/2培养液分别稀释5、10、20、30、50、70、100倍,分别用三维荧光仪测定各密度的三维荧光光谱,确定适于三维荧光分析的最高藻细胞密度。
7、藻类活体三维荧光原始光谱的提取:
在测量之前,首先打开荧光分光光度计(型号F4600,日立,日本),为尽量确保藻类荧光光谱的稳定性和准确性,预热半个小时之后再开始使用。使用1cm的石英比色皿(为确保所有藻测量条件的一致性,整个实验过程使用同一个比色皿),设置激发波长范围为400-600nm,发射波长范围为650-750nm,步长设置为5nm,狭缝宽度设置为10nm,扫描速度设置为30000nm/s,信号积分时间为0.004s。在微藻生长期,隔天测一次。将扫描所得的文件(格式为*FD3)转化为txt格式文件,活体藻类的荧光信息为一个二维矩阵(21×11),对应400-600nm的激发波长和650-750nm的发射波长。
8.采用Delaunay三角内插值法(MATLAB处理软件)消除三维荧光光谱的瑞利散射
9、藻三维荧光光谱数据的预处理
(1)数据的归一化处理:
X*=[Xn-Xmin]/[Xmax-Xmin];
Xn:各个频点的荧光强度;
Xmax:荧光强度最大值;
Xmin:荧光强度最小值;
X*:归一化所得荧光光谱的相对强度值。
二、实验材料
所述的产麻痹性贝毒微藻优选为微小亚历山大藻(Alexandriumminimum,台湾株)AMSY、链状裸甲藻(Gymnodiniumcatenatum,防城巷株)GCFC和塔玛亚历山大藻(Alexandriumtamarense,香港株)ATHK。以上微藻均已在“叶志林等.温度,光照和盐度对产麻痹性贝类毒素藻类生长及产毒的影响.《海洋环境科学》,2018,37(3)”中公开。
所述的不产麻痹性贝毒微藻为塔玛亚历山大藻(A.tamarense)ATCZ、前沟藻(A.carterae)ACCZ、东海原甲藻(P.donghaiense)PDCZ、利马原甲藻(P.lima)PLCZ、利马原甲藻(P.lima)PLCZ1、米氏凯伦藻(K.mikimotoi)KMCZ、血红哈卡藻(A.sanguinea)ASCZ、杜氏盐藻(D.salina)DSCZ、亚心形爿藻(P.subcordiformis)PSCZ、黄绿等鞭金藻(I.galbana)IGCZ、等鞭金藻(I.galbana)IGC1、海洋卡盾藻(C.marina)CMHK、卵圆卡盾藻(C.ovata)COHK、赤潮异湾藻(H.akashiwo)HACZ、小定鞭藻(P.parvum)PPCZ、柔弱角毛藻(C.debilis)CDCZ、中肋骨条藻(S.costatum)SCCZ、尖刺拟菱形藻(P.pungens)PP1CZ、小球藻(C.vulgaris)CVCZ。以上藻株已在“CN2020107560870-三维荧光光谱法在识别产麻痹性贝类毒素微藻中的应用”中公开。
以上藻株均能从暨南大学赤潮与海洋生物学研究中心藻种室获得,申请人可向公众提供。
三、实验过程
(1)测定微藻细胞在不同温度、不同盐度和不同光照强度下的不同生长期的三维荧光,得到微藻细胞的三维荧光数据;其中,微藻细胞来源于上述产麻痹性贝毒微藻(共817个数据)和不产麻痹性贝毒微藻(共817个数据);
(2)将步骤(1)获得的微藻细胞的三维荧光数据转换成TXT文件格式,采用Delaunay三角内插值法消除三维荧光光谱的瑞利散射;再将三维荧光光谱最大归一化,然后将三维光谱数据分别导入SVM和CNN模型中,模型训练集和验证集分别占总样本量的70%和30%;具体入下:
(A)通过MATLAB 2020b软件中的APP建立SVM模型:首先批量读取原数据并归一化,由于原数据为11×21的矩阵,所以再将归一化的数据调用reshape函数一维化,随后将处理好的数据的70%导入MATLAB APP classification learner中,设置五折交叉验证方式,训练集产麻痹性贝毒微藻设置为1,不产毒藻设置为0,从而训练模型,将剩下30%数据导入训练好的模型中,作为验证集,进行分类判别;
(B)首先通过MATLAB批量读取TXT文件中的数据并归一化;随后设置CNN模型结,包括1个输入层、3个卷积层、3个归一化层、3个ReLU层、2个最大池化层、1个全连接层、1个softmax层和1个输出层;然后将归一化的数据通过编程转化成4—D形式,训练集占总样本量70%,训练集产麻痹性贝毒微藻的目标设置为1,不产毒藻的目标设置为0,CNN模型训练时训练与验证比例设置为7:3(这是在70%的总样本量的基础上设定的比例),并运行程序对模型进行训练,将剩下30%数据导入训练好的模型中,作为验证集,进行分类判别。
(C)对未提前设置标记藻判别时(此时藻类是否产毒已通过实验测得),将数据导入模型中,若判别结果为1,则该未知藻为产麻痹性贝毒的微藻;若判别结果为0,则该未知藻为不产麻痹性贝毒的微藻。
(3)加入训练的样本包括处理后的藻类在不同环境因子下的对数期、稳定期、衰亡期的所有荧光光谱,有利于对各种环境变量的产麻痹性贝类毒素微藻识别。
四、实验结果
1、有无去散射对模型判别准确率的影响
在传统的藻类毒性鉴别中,瑞利散射峰影响了特征光谱的提取。但机器学习和深度学习可以自动学习样品的特征,这意味着机器学习和深度学习可能不需要去除瑞利散射峰。因此,比较了去除瑞利散射峰和未去除瑞利散射峰的输入结果。表1的结果显示了SVM和CNN模型对每种藻类的测试精度。总验证准确率比较中,未去除瑞利散射峰的SVM(93.58%)和CNN(94.96%)的结果略好于去除瑞利散射峰的结果(92.67%、94.81%)。在有无去散射的显著性对比中发现,两种模型对是否去除瑞利散射没有显著性影响(表2)。因此,在接下来的实验中,我们选择了没有去除瑞利散射峰值的数据来训练模型。
表1 SVM和CNN对有无去除瑞利散射的判别准确率
Figure BDA0003177591600000051
表2 SVM和CNN对有无去除瑞利散射的显著性差异结果
Figure BDA0003177591600000052
2、SVM和CNN模型对判别准确率的比较
所有模型均经过40次以上的训练,以验证其稳定性。平均验证准确率在93.58%以上,产PSP藻类的准确度高于非PSP藻类。对比两种模型的测试结果(如表3所示),平均验证准确率分别为CNN(94.96%)、SVM(93.58%)。SVM的验证准确度浮动范围小,说明SVM在PSP和非PSP藻类分类中相对稳定。2种模型识别PSP藻类的准确率有时可达99.0%以上,平均验证准确率分别为96.25%(SVM)和95.88%(CNN)。在对非psp藻类进行识别时,CNN表现最好,平均验证准确率为94.28%。总的来说,CNN在准确性和稳定性方面优于SVM模型。
表3 SVM和CNN模型对藻类毒性判别准确率
Figure BDA0003177591600000053
Figure BDA0003177591600000061
3、SVM和CNN模型模型对单种藻的判别结果比
将本研究所用的每一种产麻痹性贝类毒素藻类和不产麻痹性贝类毒素藻类,分别选其浓度最高(104个细胞·mL-1)、荧光活性较强的数据,先进行归一化处理,再放入训练好的模型中,以验证模型对单种藻的判别准确率。两种模型对每种藻类的判别结果见表4。对于不产麻痹性贝类毒素藻类,两种模型的IGCZ、IGCZ1、PSCZ、TWCZ、PDCZ、COHK、PPCZ、CMHK、DSCZ、CDCZ、PLCZ、NCCZ和HACZ准确率均为100%。此外,只有CNN对ACCZ和CVCZ的测试是100%正确的,ATCZ的识别准确度是两种模型中最低的,即SVM为37.31%,CNN为63.21%。总的来说,CNN对不产麻痹性贝类毒素藻类的识别准确度高于SVM。对于产麻痹性贝类毒素藻类,CNN对AMSY、APQD、GCFC的识别准确率均在97%以上。SVM对GCFC的准确率为86.49%。此外,3种模型对APQD的平均判别精度均高于其他两种藻类。总的来说,三种模型对PSP藻的识别都是有效的。
表4 104个细胞·mL-1浓度下3种麻痹性贝类中毒藻和18种非麻痹性贝类中毒藻类的预测结果
Figure BDA0003177591600000062
4、SVM和CNN模型模型对3种不同浓度产PSP藻的判别结果比较
ATHK、APQD和GCFC的实验藻类样品分别浓缩为102、103和104个细胞·mL-1。结果如表5所示。对于102个细胞·mL-1的藻类样品,两种模型的准确性都较低,尤其是对于GCFC。对102个细胞·mL-1的GCFC进行分类,CNN的准确率为59.57%,SVM为70.21%。两种模型对103个细胞·mL-1浓度藻类的准确性最高CNN对三种藻类的准确率均在99%以上。2种模型对104个细胞·mL-1的藻类样品的正确率均略低于103个细胞·mL-1,且在104个细胞·mL-1时,除SVM对GCFC(86.49%)的判别准确率较低外,其余的正确率均高于95%。此外,在其他浓度梯度,SVM对GCFC的准确率普遍低于CNN模型,但总体而言,两种模型对产麻痹性贝毒的三种藻判别率较高。
表5 SVM和CNN对102-104个细胞·mL-1浓度下3种产麻痹性贝毒藻的判别结果
Figure BDA0003177591600000071
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (10)

1.一种利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法,其特征在于包括如下步骤:
(1)测定微藻在不同温度、盐度和光照强度下各生长期的三维荧光,得到微藻细胞的三维荧光光谱数据信息并将光谱文件转成TXT文件储存;其中,微藻包括产麻痹性贝毒微藻和不产麻痹性贝毒微藻;
(2)通过MATLAB读取步骤(1)所有TXT文件,并将每个TXT中的光谱信息数据信息进行最大归一化处理;
(3)运用SVM模型和CNN模型分别提取实验藻类的特征峰,通过对模型进行多次训练,模型不断学习特异性光谱特征信息,得到训练后的SVM模型和CNN模型;
(4)测定待测藻类的三维荧光光谱数据;将得到的待测藻类的三维荧光光谱数据进行归一化处理,运用训练后的SVM模型和CNN模型进行识别待测藻类是否为产痹性贝类毒素藻类。
2.根据权利要求1所述的方法,其特征在于:
步骤(1)中所述的生长期包括对数期、稳定期和衰亡期;
步骤(1)中所述的产麻痹性贝毒微藻的株数为3株以上;
步骤(1)中所述的不产麻痹性贝毒微藻的株数为18株以上。
3.根据权利要求2所述的方法,其特征在于:
所述的产麻痹性贝毒微藻为微小亚历山大藻(Alexandrium minimum)AMSY、链状裸甲藻(Gymnodinium catenatum)GCFC和塔玛亚历山大藻(Alexandrium tamarense)ATHK;
所述的不产麻痹性贝毒微藻为塔玛亚历山大藻(A.tamarense)ATCZ、前沟藻(A.carterae)ACCZ、东海原甲藻(P.donghaiense)PDCZ、利马原甲藻(P.lima)PLCZ、利马原甲藻(P.lima)PLCZ1、米氏凯伦藻(K.mikimotoi)KMCZ、血红哈卡藻(A.sanguinea)ASCZ、杜氏盐藻(D.salina)DSCZ、亚心形爿藻(P.subcordiformis)PSCZ、黄绿等鞭金藻(I.galbana)IGCZ、等鞭金藻(I.galbana)IGC1、海洋卡盾藻(C.marina)CMHK、卵圆卡盾藻(C.ovata)COHK、赤潮异湾藻(H.akashiwo)HACZ、小定鞭藻(P.parvum)PPCZ、柔弱角毛藻(C.debilis)CDCZ、中肋骨条藻(S.costatum)SCCZ、尖刺拟菱形藻(P.pungens)PP1CZ和小球藻(C.vulgaris)CVCZ中的至少十八种。
4.根据权利要求1所述的方法,其特征在于:
步骤(1)和步骤(4)中所述的三维荧光数据通过使用荧光分光光度计扫描获得,激发波长范围为400~600nm,发射波长范围为650~750nm,步长设置为5nm,狭缝宽度设置为10nm,扫描速度设置为30000nm/s,信号积分时间为0.004s,生长期隔天测一次。
5.根据权利要求1所述的方法,其特征在于:
步骤(1)中所述的光照强度为60μmol m-2s-1~200μmol m-2s-1
步骤(1)中所述的温度为16℃~28℃;
步骤(1)中所述的盐度为25‰~35‰。
6.根据权利要求1所述的方法,其特征在于:
步骤(2)中所述的最大归一化的处理方法如下:
X*=[Xn-Xmin]/[Xmax-Xmin];
Xn:各个频点的荧光强度;
Xmax:荧光强度最大值;
Xmin:荧光强度最小值;
X*:归一化所得荧光光谱的相对强度值。
7.根据权利要求1所述的方法,其特征在于:
步骤(2)中所述的最大值归一化通过MATLAB 2020b编程软件实现;
步骤(3)中所述的SVM和CNN模型通过MATLAB 2020b编程软件实现。
8.根据权利要求1所述的方法,其特征在于:
步骤(3)中所述的训练后的SVM模型通过如下具体步骤得到:首先批量读取原数据并归一化,再将归一化的数据调用reshape函数一维化,接着将处理好的数据的70%导入MATLABAPP classification learner中,设置五折交叉验证方式,训练集产麻痹性贝毒微藻设置为1,不产毒藻设置为0,训练模型;将剩下30%数据导入训练好的模型中,作为验证集,进行分类判别;
步骤(3)中所述的训练后的CNN模型通过如下具体步骤得到:
A、通过MATLAB批量读取TXT文件中的数据并归一化;
B、设置CNN模型结构,包括输入层、卷积层、归一化层、ReLU层、最大池化层、全连接层、softmax层和输出层;
C、将步骤A得到的归一化的数据通过编程转化成4—D形式,训练集占总样本量70%,训练集产麻痹性贝毒微藻的目标设置为1,不产毒藻的目标设置为0,CNN模型训练时训练与验证比例设置为7:3,并运行程序对模型进行训练;将剩下30%数据导入训练好的模型中,作为验证集,进行分类判别。
9.根据权利要求1所述的方法,其特征在于:
步骤(4)中所述的识别的标准如下:若判别结果为1,则该待测藻类为产麻痹性贝毒的微藻;若判别结果为0,则该未知藻为不产麻痹性贝毒的微藻。
10.权利要求1~9任一项所述的利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法在产痹性贝类毒素藻类鉴定中的应用。
CN202110837232.2A 2021-07-23 2021-07-23 利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用 Pending CN113705608A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110837232.2A CN113705608A (zh) 2021-07-23 2021-07-23 利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110837232.2A CN113705608A (zh) 2021-07-23 2021-07-23 利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用

Publications (1)

Publication Number Publication Date
CN113705608A true CN113705608A (zh) 2021-11-26

Family

ID=78650376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110837232.2A Pending CN113705608A (zh) 2021-07-23 2021-07-23 利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用

Country Status (1)

Country Link
CN (1) CN113705608A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104316505A (zh) * 2014-11-14 2015-01-28 深圳市朗诚实业有限公司 用于识别鱼毒性藻类的三维荧光标准光谱库的构建和应用
CN111912824A (zh) * 2020-07-31 2020-11-10 深圳市朗诚科技股份有限公司 三维荧光光谱法在识别产麻痹性贝类毒素微藻中的应用
CN112414979A (zh) * 2020-07-31 2021-02-26 深圳市朗诚科技股份有限公司 用于识别产麻痹性贝类毒素微藻的荧光特征标准谱库及其构建方法与应用
CN113030049A (zh) * 2021-03-10 2021-06-25 燕山大学 一种鱼毒性赤潮藻在线检测识别方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104316505A (zh) * 2014-11-14 2015-01-28 深圳市朗诚实业有限公司 用于识别鱼毒性藻类的三维荧光标准光谱库的构建和应用
CN111912824A (zh) * 2020-07-31 2020-11-10 深圳市朗诚科技股份有限公司 三维荧光光谱法在识别产麻痹性贝类毒素微藻中的应用
CN112414979A (zh) * 2020-07-31 2021-02-26 深圳市朗诚科技股份有限公司 用于识别产麻痹性贝类毒素微藻的荧光特征标准谱库及其构建方法与应用
CN113030049A (zh) * 2021-03-10 2021-06-25 燕山大学 一种鱼毒性赤潮藻在线检测识别方法及系统

Similar Documents

Publication Publication Date Title
Leboulanger et al. Application of a submersible spectrofluorometer for rapid monitoring of freshwater cyanobacterial blooms: a case study
Barranguet et al. Studying undisturbed autotrophic biofilms: still a technical challenge
Lu et al. A comparative study on three quantitating methods of microalgal biomass
Sfriso et al. Phycoerythrin productivity and diversity from five red macroalgae
Johan et al. Laboratory measurement: Chlorophyll-a concentration measurement with acetone method using spectrophotometer
štrojsová et al. Seasonal study of extracellular phosphatase expression in the phytoplankton of a eutrophic reservoir
Havlik et al. Monitoring of microalgal processes
Madrid et al. Microbial biomass estimation
CN111289489A (zh) 一种基于拉曼光谱的微生物单细胞生长检测方法
CN111912824B (zh) 三维荧光光谱法在识别产麻痹性贝类毒素微藻中的应用
CN112414979B (zh) 用于识别产麻痹性贝类毒素微藻的荧光特征标准谱库及其构建方法与应用
Alindonosi et al. Prospects for diatoms identification using metagenomics: a review.
GB2604677A (en) A method and system for online detection and identification of ichthyotoxic harmful algal bloom algae
Liu et al. Effects of irradiance on pigment signatures of harmful algae during growth process
CN113705608A (zh) 利用机器学习和/或人工神经网络模型识别产痹性贝类毒素藻类的方法与应用
CN113355264B (zh) 一株产甘油的嗜高温菌及其应用
CN111122484A (zh) 一种水体细菌的定性与定量方法
CN111549076B (zh) 一种荧光银纳米团簇探针的制备方法与应用
CN113984659A (zh) 一种基于单细胞拉曼光谱的好氧不产氧光合细菌检测方法
Cembella et al. ARCHEMHAB: Interactions and feedback mechanisms between hydrography, geochemical signatures and microbial ecology, with a focus on HAB species diversity, biogeography and dynamics
DUYGU et al. Investigating the effect of different growth media on biomass production of Pseudopediastrum boryanum (Turpin) E. Hegewald isolates
Yun et al. Accuracy of quantitative analysis of eDNA in seawater: comparison of filter pore size and real-time PCR methods
CN113673090B (zh) 检测产麻痹性贝类毒素微藻细胞密度的模型的建立方法
Callieri et al. Spatial-temporal study of cluster 5 picocyanobacteria and exopolymeric microgels in Lake Maggiore
Drits et al. Application of the high-temperature combustion method for measuring organic carbon content in fecal pellets and small-sized (≤ 1 mm) zooplankton

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211126