CN111122536A - 一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法 - Google Patents

一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法 Download PDF

Info

Publication number
CN111122536A
CN111122536A CN201911307247.7A CN201911307247A CN111122536A CN 111122536 A CN111122536 A CN 111122536A CN 201911307247 A CN201911307247 A CN 201911307247A CN 111122536 A CN111122536 A CN 111122536A
Authority
CN
China
Prior art keywords
enhanced raman
pesticide
surface enhanced
mixed
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911307247.7A
Other languages
English (en)
Inventor
朱家骥
刘丹丹
冯佩云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yancheng Institute of Technology
Original Assignee
Yancheng Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yancheng Institute of Technology filed Critical Yancheng Institute of Technology
Priority to CN201911307247.7A priority Critical patent/CN111122536A/zh
Publication of CN111122536A publication Critical patent/CN111122536A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • G01N21/658Raman scattering enhancement Raman, e.g. surface plasmons

Landscapes

  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

本发明公开了一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,属于表面增强拉曼光谱检测与化学计量学结合的技术领域。按照如下步骤进行:首先,将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,其次,将混合农药溶液与合成的表面增强拉曼基底混合,最终,采集混合农药溶液的表面增强拉曼光谱;其次,对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选;最后,将筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测。本发明具有速度快、检测精度高、稳定性好以及计算量少等优点,可用于混合农药中各农药含量的快速、高精度预测。

Description

一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量 的方法
技术领域
本发明属于表面增强拉曼光谱检测与化学计量学结合的技术领域,具体涉及一种基于表面增强拉曼光谱的特征谱带区间筛选及定量分析的方法。
背景技术
表面增强拉曼光谱(Surface-enhanced Raman Spectroscopy,SERS),是一种表面光谱技术,在待测分子与金、银、铜等粗糙金属相互作用后使拉曼光谱强度极大增强后得到的光谱。拉曼光谱虽然可以反映分子的特征结构,但拉曼散射效应的整个过程是固有的弱过程,且受限于拉曼散射截面,以至于获取的谱峰信号强度弱,难以达到对痕量物质的检测要求,不适用于待测物的敏感检测。SERS相对于拉曼具有显著的增强效果,是一种先进的拉曼技术,且具备无需前处理、灵敏度高、操作简单、实时快速检测等优点,在食品添加剂、环境污染物、农药残留检测等领域中均有应用。但是,表面增强拉曼光谱是一个高维矩阵,其波长数量远远大于光谱本身的数量,故在对表面增强拉曼光谱进行多元回归时,容易导致过拟合问题。因此,如何精确地解析表面增强拉曼光谱用于定性和定量分析是一个亟待解决的问题。
1971年,瑞典科学家SvanteWold以“化学计量学”(chemometrics)为一项基金命名。 1974年,他和美国化学家Bruce R.Kowalski在美国成立了国际化学计量学学会(International Chemometrics Society,ICS),将化学计量学定义为应用数据和统计学方法,设计和改进化学量测流程,用最优的方法从化学量测流程中尽可能的提取相关目标物的有用信息。此后,研究者们开始针对特定的分析要求,创造并改进了一系列的数据解析方法,如多元校正和多元分辨等。目前,化学计量学从基础理论与方法的研究进入到实际应用研究的阶段,如对红外光谱、核磁共振等各类仪器数据的处理,以及在药物学、食品科学、环境科学等领域得到了广泛地应用。
发明内容
发明目的:针对如何更加精确地解析表面增强拉曼光谱用于定量分析的问题,本发明提出一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,开发了表面增强拉曼光谱特征谱带区间筛选方法及混合农药溶液中各农药含量预测的方法,本发明具有预测精度高、鲁棒性好等优点。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,具体包括如下步骤:
步骤一:将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,其次,将混合农药溶液与合成的表面增强拉曼基底混合,最终,采集混合农药溶液的表面增强拉曼光谱;
步骤二:对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选;
步骤三:将筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测。
所述步骤一将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,其次,将混合农药溶液与合成的表面增强拉曼基底混合,最终,采集混合农药溶液的表面增强拉曼光谱,按照下述步骤进行:
(1)多种农药混合物溶液的配置:①将多种农药配制成统一浓度的标品溶液。②将已经配制的多种农药的标品溶液按照一定的体积比进行混合,得到多种农药混合溶液。
(2)金银核壳纳米颗粒表面增强拉曼基底的制备:①0.25mL浓度为0.1M的氯金酸溶于100mL的去离子水中,在磁力搅拌下加热至沸腾。快速注入1.5mL浓度为1%的柠檬酸钠之后,混合溶液回流约30分钟使之变成酒红色。在搅拌状态下逐渐冷却至室温,得到尺寸为~30nm的金纳米颗粒溶液。②在磁力搅拌下将10mL金纳米颗粒溶液与 1.5mL浓度为0.1M抗坏血酸混合,然后在混合溶液中以每30秒一滴的速度逐滴加入 3.5mL浓度为1mM的硝酸银溶液,被抗坏血酸还原的硝酸银逐渐生长在金纳米颗粒的表面。混合溶液搅拌30分钟,当其颜色由酒红色转变为橙黄色,表明金银核壳纳米颗粒已合成。
(3)混合农药溶液的表面增强拉曼光谱的采集:分别取100μL混合农药溶液和 100μL金银核壳纳米颗粒混合均匀,然后滴加到硅片进行表面增强拉曼光谱的采集。
所述步骤二对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选,按照下述步骤进行:
(1)将采集到的表面增强拉曼光谱按照Kennard-Stone算法划分为校正集与预测集,并将所有表面增强拉曼光谱的光谱区间划分为K个等宽的子区间,将校正集中的表面增强拉曼光谱数据定义为矩阵Xm×K,其中,m代表校正集中表面增强拉曼光谱的数量,K 代表子区间;定义校正集中混合农药溶液中各农药含量的真实值矩阵Ym×l,该矩阵中的值即为步骤一中配制的混合农药溶液中各农药的体积比,其中,m代表校正集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量;
(2)对校正集中表面增强拉曼光谱的K个子区间进行随机组合,每次随机组合的实现过程为:采用加权自举采样方法(weighted bootstrap sampling,WBS)对K个子区间进行R次有放回的加权采样,如果首次执行步骤(2),则R等于K,并且每个子区间被分配的采样权重为1/K,完成1次随机组合即可获得1个子数据集,该子数据集即为子区间的随机组合,该子数据集中所包含的子区间的数目为0.632*R(根据有放回的采样定量,每个子区间至少被采样1次的概率仅为0.632),对K个子区间进行M次随机组合,可获得M个子数据集;
(3)根据M个子数据集,即表示表面增强拉曼光谱K个子区间的M种随机组合。以其中1个子数据集为例,阐述如何在该数据集的基础上构建多元回归模型对混合农药溶液中各农药含量进行预测,并求出预测值的均方根误差(root mean squares error, RMSE),其步骤如下:①根据该子数据集中子区间的组合,从矩阵Xm×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵X’m×n,m代表校正集中表面增强拉曼光谱的数量,n代表该子数据集中的子区间,②采用偏最小二乘回归算法SIMPLS,求得矩阵Xm×K与矩阵Ym×l的回归系数Q,根据求得的回归系数Q及矩阵X’m×n,求得 Y’m×l=Q*X’m×n,则矩阵Y’m×l代表混合农药溶液中各农药含量的预测值,③由混合农药溶液中各农药含量的真实值矩阵Ym×l与预测值矩阵Y’m×l,根据公式(1)可求得混合农药溶液中各农药含量的预测值的均方根误差:
Figure RE-GDA0002421745310000031
其中,yi,j代表混合农药溶液中各农药含量的真实值,y’i,j代表混合农药溶液中各农药含量的预测值。同理,在M个子数据集的基础上可得M个预测值的均方根误差值(RMSE1,RMSE2,RMSE3,…,RMSEM),并且这些均方根误差值大致服从正态分布。其中,均方根误差值越小代表基于该子数据集构建的多元回归模型对混合农药溶液中各农药含量的预测性能越好,从M个子数据集中选取M*σ个具有较小的均方根误差值的子数据集做进一步分析,其中σ为参数,0<σ<1;
(4)计算并记录M*σ个子数据集的均方根误差值的平均值,定义为:RMSEmean
(5)根据公式(2)更新每个子区间的采样权重:
Figure RE-GDA0002421745310000032
其中,wi代表第i个子区间的采样权重,fi代表第i个子区间在M*σ个子数据集中出现的频率,其中,i的范围为:1≤i≤K。同时,计算M个子数据集中所包含的子区间的个数平均值取整,进而采用该平均值对步骤(2)中加权自举采样方法的有放回次数R 进行更新;
(6)进入迭代过程:重复步骤(2)-(6),观察RMSEmean的变化趋势,如果RMSEmean呈下降趋势,则继续迭代过程;相反,如果RMSEmean呈上升趋势,则迭代过程终止,进入步骤(7);
(7)找到最小的RMSEmean所对应的子数据集,其中的子区间组合即为最优的表面增强拉曼光谱特征谱带区间。
所述步骤三将步骤二中筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测,按照下述步骤进行:
(1)将预测集中的表面增强拉曼光谱数据定义为矩阵Ac×K,其中,c代表预测集中表面增强拉曼光谱的数量,K代表子区间;
(2)根据步骤二筛选得到的最优的表面增强拉曼光谱特征谱带区间,从矩阵Ac×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵A’c×d,其中,c代表预测集中表面增强拉曼光谱的数量,d代表筛选得到的最优的表面增强拉曼光谱特征谱带区间,同时,利用步骤二中获得的回归系数Q,计算得到Bc×l=Q*A’c×d,矩阵Bc×l即为混合农药溶液中各农药含量的预测值,其中,c代表预测集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量。
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
(1)本发明对表面增强拉曼光谱的特征谱带区间进行了筛选,相较于单纯的光谱波长筛选,特征谱带区间包含了更多的与被测物质相关的物理、化学信息,并且进行谱带区间的筛选能够更好的保留各波长间的协同效应,使得筛选得到的谱带区间的信噪比更高、稳定性更好,同时降低了整个方法的计算复杂度。
(2)本发明采用加权自举采样方法(weighted bootstrap sampling,WBS),对每一个光谱区间赋予一个采样权值,并在最优特征谱带区间搜索过程中不断更新各光谱区间的采样权值,同时,对于权值较高的光谱区间也将在后续的筛选中对其重要性进行多次评估,防止产生局部最小值而终止迭代的问题。
(3)本发明在筛选过程中采用软收缩策略,对于采样权值较低的光谱区间,仍然给予参加下一轮评估的机会,通过与其他光谱区间的组合,该光谱区间的重要性能够被重新唤醒,防止将一些有意义的光谱区间过早地剔除。
附图说明
图1不同体积比的毒死蜱与啶虫脒混合溶液的表面增强拉曼光谱(A)不同体积比的福美双、毒死蜱与啶虫脒混合溶液的表面增强拉曼光谱(B)。
图2预测集中毒死蜱与啶虫脒体积比的定量预测。
图3预测集中福美双、毒死蜱与啶虫脒体积比的定量预测。
图4是本发明方法的流程图。
具体实施方式
以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所作出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
实施例1:
以毒死蜱与啶虫脒混合农药溶液中两种农药体积比的预测为例,详细阐述本发明的具体实施方式。
所述一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法包含3个步骤:
所述步骤一将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,其次,将混合农药溶液与合成的表面增强拉曼基底混合,最终,采集混合农药溶液的表面增强拉曼光谱,按照下述步骤进行:
(1)毒死蜱与啶虫脒混合农药溶液的配置:①将毒死蜱与啶虫脒分别配制成统一浓度(1.0×10-4mol/L)的标品溶液。②将已经配制的毒死蜱与啶虫脒的标品溶液按照7 种体积比(0:100%,20%:80%,40%:60%,50%:50%,70%:30%,90%:10%,100%:0)进行混合,得到7种不同体积比的混合农药溶液的样品。
(2)金银核壳纳米颗粒SERS增强基底的制备:①0.25mL浓度为0.1M的氯金酸溶于100mL的去离子水中,在磁力搅拌下加热至沸腾。快速注入1.5mL浓度为1%的柠檬酸钠之后,混合溶液回流约30分钟使之变成酒红色。在搅拌状态下逐渐冷却至室温,得到尺寸为~30nm的金纳米颗粒溶液。②在磁力搅拌下将10mL金纳米颗粒溶液与 1.5mL浓度为0.1M抗坏血酸混合,然后在混合溶液中以每30秒一滴的速度逐滴加入 3.5mL浓度为1mM的硝酸银溶液。被抗坏血酸还原的硝酸银逐渐生长在金纳米颗粒的表面。混合溶液搅拌30分钟,当其颜色由酒红色转变为橙黄色,表明金银核壳纳米颗粒已合成。
(3)混合农药溶液的表面增强拉曼光谱的采集:从7种不同体积比的农药混合溶液的样品中分别取100μL混合农药溶液和100μL金银核壳纳米颗粒混合均匀,然后滴加到硅片进行表面增强拉曼光谱的采集,每种体积比的混合农药溶液采集10条表面增强拉曼光谱。图1(A)所示为7种体积比混合农药溶液的代表性的表面增强拉曼光谱。
所述步骤二对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选,按照下述步骤进行:
(1)将采集到的表面增强拉曼光谱按照Kennard-Stone算法划分为校正集与预测集,并将所有表面增强拉曼光谱的光谱区间划分为K(K=20)个等宽的子区间,将校正集中的表面增强拉曼光谱数据定义为矩阵Xm×K,其中,m(m=42)代表校正集中表面增强拉曼光谱的数量,K代表子区间;定义校正集中混合农药溶液中各农药含量的真实值矩阵Ym×l,该矩阵中的值即为步骤一中配制的混合农药溶液中各农药的体积比,其中,m 代表校正集中表面增强拉曼光谱的数量,l(l=2)代表混合农药溶液中农药种类的数量;矩阵中的每行元素为:0:100;20:80;40:60;50:50;70:30;90:10;100:0。
(2)对校正集中表面增强拉曼光谱的K个子区间进行随机组合,每次随机组合的实现过程为:采用加权自举采样方法(weighted bootstrap sampling,WBS)对K个子区间进行R次有放回的加权采样,如果首次执行步骤(2),则R等于K,并且每个子区间被分配的采样权重为1/K,完成1次随机组合即可获得1个子数据集,该子数据集即为子区间的随机组合,该子数据集中所包含的子区间的数目为0.632*R(根据有放回的采样定量,每个子区间至少被采样1次的概率仅为0.632),对K个子区间进行M(M=1500) 次随机组合,可获得M个子数据集;
(3)根据M个子数据集,即表示表面增强拉曼光谱K个子区间的M种随机组合。以其中1个子数据集为例,阐述如何在该数据集的基础上构建多元回归模型对混合农药溶液中各农药含量进行预测,并求出预测值的均方根误差(root mean squares error, RMSE),其步骤如下:①根据该子数据集中子区间的组合,从矩阵Xm×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵X’m×t,m代表校正集中表面增强拉曼光谱的数量,t代表该子数据集中的子区间,②采用偏最小二乘回归算法SIMPLS,求得矩阵Xm×K与矩阵Ym×l的回归系数Q1,根据求得的回归系数Q1及矩阵X’m×t,求得 Y’m×l=Q1*X’m×t,则矩阵Y’m×l代表混合农药溶液中各农药含量的预测值,③由混合农药溶液中各农药含量的真实值矩阵Ym×l与预测值矩阵Y’m×l,根据公式(1)可求得混合农药溶液中各农药含量的预测值的均方根误差:
Figure RE-GDA0002421745310000071
其中,yi,j代表混合农药溶液中各农药含量的真实值,y’i,j代表混合农药溶液中各农药含量的预测值。同理,在M个子数据集的基础上可得M个预测值的均方根误差值(RMSE1,RMSE2,RMSE3,…,RMSEM),并且这些均方根误差值大致服从正态分布。其中,均方根误差值越小代表基于该子数据集构建的多元回归模型对混合农药溶液中各农药含量的预测性能越好,从M个子数据集中选取M*σ个具有较小的均方根误差值的子数据集做进一步分析,其中σ为参数,σ=10%;
(4)计算并记录M*σ个子数据集的均方根误差值的平均值,定义为:RMSEmean
(5)根据公式(2)更新每个子区间的采样权重:
Figure RE-GDA0002421745310000072
其中,wi代表第i个子区间的采样权重,fi代表第i个子区间在M*σ个子数据集中出现的频率,其中,i的范围为:1≤i≤K。同时,计算M个子数据集中所包含的子区间的平均值,进而采用该平均值对步骤(2)中加权自举采样方法的有放回次数R进行更新;
(6)进入迭代过程:重复步骤(2)-(6),观察RMSEmean的变化趋势,如果RMSEmean呈下降趋势,则继续迭代过程;相反,如果RMSEmean呈上升趋势,则迭代过程终止,进入步骤(7);
(7)找到最小的RMSEmean所对应的子数据集,其中的子区间组合即为最优的表面增强拉曼光谱特征谱带区间。
步骤三将步骤二中筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测,按照下述步骤进行:
(1)将预测集中的表面增强拉曼光谱数据定义为矩阵Ac×K,其中,c(c=28)代表预测集中表面增强拉曼光谱的数量,K代表子区间;
(2)根据步骤二筛选得到的最优的表面增强拉曼光谱特征谱带区间,从矩阵Ac×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵A’c×u,其中,c代表预测集中表面增强拉曼光谱的数量,u代表筛选得到的最优的表面增强拉曼光谱特征谱带区间,同时,利用步骤二中获得的回归系数Q1,计算得到Bc×l=Q1*A’c×u,矩阵Bc×l即为混合农药溶液中各农药含量的预测值(如图2所示),其中,c代表预测集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量。
实施例2:
以福美双、毒死蜱与啶虫脒混合农药溶液中三种农药的体积比定量预测为例,详细阐述本发明的具体实施方式。
所述一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法包含3个步骤:
所述步骤一将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,其次,将混合农药溶液与合成的表面增强拉曼基底混合,最终,采集混合农药溶液的表面增强拉曼光谱,按照下述步骤进行:
(1)福美双、毒死蜱与啶虫脒农药混合溶液的配置:①将福美双、毒死蜱与啶虫脒分别配制成统一浓度(1.0×10-4mol/L)的标品溶液。②将已经配制的福美双、毒死蜱与啶虫脒的标品溶液按照7种体积比(30%:30%:30%,20%:30%:30%,10%:30%:30%, 30%:20%:30%,30%:10%:30%,30%:30%:20%,30%:30%:10%)进行混合,得到7种不同体积比的混合农药溶液的样品。
(2)金银核壳纳米颗粒SERS增强基底的制备:①0.25mL浓度为0.1M的氯金酸溶于100mL的去离子水中,在磁力搅拌下加热至沸腾。快速注入1.5mL浓度为1%的柠檬酸钠之后,混合溶液回流约30分钟使之变成酒红色。在搅拌状态下逐渐冷却至室温,得到尺寸为~30nm的金纳米颗粒溶液。②在磁力搅拌下将10mL金纳米颗粒溶液与 1.5mL浓度为0.1M抗坏血酸混合,然后在混合溶液中以每30秒一滴的速度逐滴加入 3.5mL浓度为1mM的硝酸银溶液。被抗坏血酸还原的硝酸银逐渐生长在金纳米颗粒的表面。混合溶液搅拌30分钟,当其颜色由酒红色转变为橙黄色,表明金银核壳纳米颗粒已合成。
(3)混合农药溶液的表面增强拉曼光谱的采集:从7种不同体积比的农药混合溶液的样品中分别取100μL混合溶液和100μL金银核壳纳米颗粒混合均匀,然后滴加到硅片进行表面增强拉曼光谱的采集,每种体积比的混合农药溶液采集10条表面增强拉曼光谱。图1(B)所示为7种体积比混合农药溶液的代表性的表面增强拉曼光谱。
所述步骤二对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选,按照下述步骤进行:
(1)将采集到的表面增强拉曼光谱按照Kennard-Stone算法划分为校正集与预测集,并将所有表面增强拉曼光谱的光谱区间划分为K(K=20)个等宽的子区间,将校正集中的表面增强拉曼光谱数据定义为矩阵Xm×K,其中,m(m=42)代表校正集中表面增强拉曼光谱的数量,K代表子区间;定义校正集中混合农药溶液中各农药含量的真实值矩阵Ym×l,该矩阵中的值即为步骤一中配制的混合农药溶液中各农药的体积比,其中,m 代表校正集中表面增强拉曼光谱的数量,l(l=3)代表混合农药溶液中农药种类的数量;矩阵每行的元素为:30:30:30;20:30:30;10:30:30;30:20:30;30:10:30;30:30:20; 30:30:10。
(2)对校正集中表面增强拉曼光谱的K个子区间进行随机组合,每次随机组合的实现过程为:采用加权自举采样方法(weighted bootstrap sampling,WBS)对K个子区间进行R次有放回的加权采样,如果首次执行步骤(2),则R等于K,并且每个子区间被分配的采样权重为1/K,完成1次随机组合即可获得1个子数据集,该子数据集即为子区间的随机组合,该子数据集中所包含的子区间的数目为0.632*R(根据有放回的采样定量,每个子区间至少被采样1次的概率仅为0.632),对K个子区间进行M(M=1500) 次随机组合,可获得M个子数据集;
(3)根据M个子数据集,即表示表面增强拉曼光谱K个子区间的M种随机组合。以其中1个子数据集为例,阐述如何在该数据集的基础上构建多元回归模型对混合农药溶液中各农药含量进行预测,并求出预测值的均方根误差(root mean squares error, RMSE),其步骤如下:①根据该子数据集中子区间的组合,从矩阵Xm×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵X’m×g,m代表校正集中表面增强拉曼光谱的数量,g代表该子数据集中的子区间,②采用偏最小二乘回归算法SIMPLS,求得矩阵Xm×K与矩阵Ym×l的回归系数Q2,根据求得的回归系数Q2及矩阵X’m×n,求得 Y’m×l=Q2*X’m×g,则矩阵Y’m×l代表混合农药溶液中各农药含量的预测值,③由混合农药溶液中各农药含量的真实值矩阵Ym×l与预测值矩阵Y’m×l,根据公式(1)可求得混合农药溶液中各农药含量的预测值的均方根误差:
Figure RE-GDA0002421745310000091
其中,yi,j代表混合农药溶液中各农药含量的真实值,y’i,j代表混合农药溶液中各农药含量的预测值。同理,在M个子数据集的基础上可得M个预测值的均方根误差值(RMSE1,RMSE2,RMSE3,…,RMSEM),并且这些均方根误差值大致服从正态分布。其中,均方根误差值越小代表基于该子数据集构建的多元回归模型对混合农药溶液中各农药含量的预测性能越好,从M个子数据集中选取M*σ个具有较小的均方根误差值的子数据集做进一步分析,其中σ为参数,σ=10%;
(4)计算并记录M*σ个子数据集的均方根误差值的平均值,定义为:RMSEmean
(5)根据公式(2)更新每个子区间的采样权重:
Figure RE-GDA0002421745310000101
其中,wi代表第i个子区间的采样权重,fi代表第i个子区间在M*σ个子数据集中出现的频率,其中,i的范围为:1≤i≤K。同时,计算M个子数据集中所包含的子区间的平均值,进而采用该平均值对步骤(2)中加权自举采样方法的有放回次数R进行更新;
(6)进入迭代过程:重复步骤(2)-(6),观察RMSEmean的变化趋势,如果RMSEmean呈下降趋势,则继续迭代过程;相反,如果RMSEmean呈上升趋势,则迭代过程终止,进入步骤(7);
(7)找到最小的RMSEmean所对应的子数据集,其中的子区间组合即为最优的表面增强拉曼光谱特征谱带区间。
步骤三将步骤二中筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测,按照下述步骤进行:
(1)将预测集中的表面增强拉曼光谱数据定义为矩阵Ac×K,其中,c(c=28)代表预测集中表面增强拉曼光谱的数量,K代表子区间;
(2)根据步骤二筛选得到的最优的表面增强拉曼光谱特征谱带区间,从矩阵Ac×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵A’c×z,其中,c代表预测集中表面增强拉曼光谱的数量,z代表筛选得到的最优的表面增强拉曼光谱特征谱带区间,同时,利用步骤二中获得的回归系数Q2,计算得到Bc×l=Q2*A’c×z,矩阵Bc×l即为混合农药溶液中各农药含量的预测值(如图3所示),其中,c代表预测集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量。

Claims (3)

1.一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,其特征在于,按照下述步骤进行:
步骤一:将多种互不发生化学反应的农药分别配制为统一浓度的溶液,然后将各农药溶液按照不同的体积比进行混合,将混合农药溶液与合成的表面增强拉曼基底混合,采集混合农药溶液的表面增强拉曼光谱;
步骤二:对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选;
步骤三:将筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测。
2.根据权利要求1所述的一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,其特征在于,所述步骤二对采集的混合农药溶液表面增强拉曼光谱进行特征谱带区间的筛选,按照下述步骤进行:
(1)将采集到的表面增强拉曼光谱按照Kennard-Stone算法划分为校正集与预测集,并将所有表面增强拉曼光谱的光谱区间划分为K个等宽的子区间,将校正集中的表面增强拉曼光谱数据定义为矩阵Xm×K,其中,m代表校正集中表面增强拉曼光谱的数量,K代表子区间;定义校正集中混合农药溶液中各农药含量的真实值矩阵Ym×l,该矩阵中的值即为步骤一中配制的混合农药溶液中各农药的体积比,其中,m代表校正集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量,矩阵的每行元素依次放置各个农药的体积比;
(2)对校正集中表面增强拉曼光谱的K个子区间进行随机组合,每次随机组合的实现过程为:采用加权自举采样方法对K个子区间进行R次有放回的加权采样,如果首次执行步骤(2),则R等于K,并且每个子区间被分配的采样权重为1/K,完成1次随机组合即可获得1个子数据集,该子数据集即为子区间的随机组合,对K个子区间进行M次随机组合,可获得M个子数据集;
(3)根据M个子数据集,即表示表面增强拉曼光谱K个子区间的M种随机组合,在该数据集的基础上构建多元回归模型对混合农药溶液中各农药含量进行预测,并求出预测值的均方根误差,其步骤如下:
①根据子数据集中子区间的组合,从矩阵Xm×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵X’m×n,m代表校正集中表面增强拉曼光谱的数量,n代表该子数据集中的子区间;
②采用偏最小二乘回归算法SIMPLS,求得矩阵Xm×K与矩阵Ym×l的回归系数Q,根据求得的回归系数Q及矩阵X’m×n,求得Y’m×l=Q*X’m×n,则矩阵Y’m×l代表混合农药溶液中各农药含量的预测值;
③由混合农药溶液中各农药含量的真实值矩阵Ym×l与预测值矩阵Y’m×l,根据公式(1)可求得混合农药溶液中各农药含量的预测值的均方根误差:
Figure FDA0002323511900000021
其中,yi,j代表混合农药溶液中各农药含量的真实值,y’i,j代表混合农药溶液中各农药含量的预测值,在M个子数据集的基础上可得M个预测值的均方根误差值(RMSE1,RMSE2,RMSE3,…,RMSEM),从M个子数据集中选取M*σ个具有较小的均方根误差值的子数据集做进一步分析,其中,σ为参数,0<σ<1;
(4)计算并记录M*σ个子数据集的均方根误差值的平均值,定义为:RMSEmean
(5)根据公式(2)更新每个子区间的采样权重:
Figure FDA0002323511900000022
其中,wi代表第i个子区间的采样权重,fi代表第i个子区间在M*σ个子数据集中出现的频率,其中,i的范围为:1≤i≤K,同时,计算M个子数据集中所包含的子区间个数的平均值取整,进而采用该平均值对步骤(2)中加权自举采样方法的有放回次数R进行更新;
(6)进入迭代过程:重复步骤(2)-(6),观察RMSEmean的变化趋势,如果RMSEmean呈下降趋势,则继续迭代过程;相反,如果RMSEmean呈上升趋势,则迭代过程终止,进入步骤(7);
(7)找到最小的RMSEmean所对应的子数据集,其中的子区间组合即为最优的表面增强拉曼光谱特征谱带区间。
3.根据权利要求1所述的一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法,其特征在于所述步骤三将步骤二中筛选得到的最优的表面增强拉曼光谱特征谱带区间用于对混合农药溶液中各农药含量的预测,按照下述步骤进行:
(1)将预测集中的表面增强拉曼光谱数据定义为矩阵Ac×K,其中,c代表预测集中表面增强拉曼光谱的数量,K代表子区间;
(2)根据步骤二筛选得到的最优的表面增强拉曼光谱特征谱带区间,从矩阵Ac×K中挑选出相对应的列,构成新的表面增强拉曼光谱数据矩阵A’c×d,其中,c代表预测集中表面增强拉曼光谱的数量,d代表筛选得到的最优的表面增强拉曼光谱特征谱带区间,利用步骤二中获得的回归系数Q,计算得到Bc×l=Q*A’c×d,矩阵Bc×l即为混合农药溶液中各农药含量的预测值,其中,c代表预测集中表面增强拉曼光谱的数量,l代表混合农药溶液中农药种类的数量。
CN201911307247.7A 2019-12-18 2019-12-18 一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法 Pending CN111122536A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911307247.7A CN111122536A (zh) 2019-12-18 2019-12-18 一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911307247.7A CN111122536A (zh) 2019-12-18 2019-12-18 一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法

Publications (1)

Publication Number Publication Date
CN111122536A true CN111122536A (zh) 2020-05-08

Family

ID=70499493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911307247.7A Pending CN111122536A (zh) 2019-12-18 2019-12-18 一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法

Country Status (1)

Country Link
CN (1) CN111122536A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023272749A1 (zh) * 2021-06-29 2023-01-05 江苏大学 一种小分子挥发物的特征信息提取方法及便携式检测系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108267438A (zh) * 2018-04-27 2018-07-10 中国农业大学 一种残留混合农药的拉曼光谱信号分析方法
CN110441282A (zh) * 2019-07-19 2019-11-12 盐城工学院 一种基于表面增强拉曼光谱和纸质微流控芯片的茶叶中农药残留检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108267438A (zh) * 2018-04-27 2018-07-10 中国农业大学 一种残留混合农药的拉曼光谱信号分析方法
CN110441282A (zh) * 2019-07-19 2019-11-12 盐城工学院 一种基于表面增强拉曼光谱和纸质微流控芯片的茶叶中农药残留检测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
DENG, BC等: "A bootstrapping soft shrinkage approach for variable selection in chemical modeling", 《ANALYTICA CHIMICA ACTA 》 *
刘燕德等: "脐橙表皮两种混合农药残留的表面增强拉曼光谱定量检测", 《光谱学与光谱分析》 *
宋相中: "近红外光谱定量分析中三种新型波长选择方法研究", 《中国优秀博硕士学位论文全文数据库(博士)工程科技Ⅰ辑》 *
常鹏著: "《基于数据驱动的间歇过程建模及故障监测》", 31 January 2019 *
王海阳等: "表面增强拉曼光谱检测脐橙果皮混合农药残留", 《农业工程学报》 *
赵琦等: "基于SERS法的苹果汁中混合农残的定性定量分析", 《食品工业科技》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023272749A1 (zh) * 2021-06-29 2023-01-05 江苏大学 一种小分子挥发物的特征信息提取方法及便携式检测系统

Similar Documents

Publication Publication Date Title
Košir et al. Use of SNIF-NMR and IRMS in combination with chemometric methods for the determination of chaptalisation and geographical origin of wines (the example of Slovenian wines)
Bundy et al. The mass assembly histories of galaxies of various morphologies in the goods fields
CN102735677A (zh) 一种具有普适性的表面增强拉曼光谱定量分析方法
CN102928396B (zh) 基于拉曼光谱的尿素同位素丰度的快速检测方法
CN109060771B (zh) 一种基于光谱不同特征集的共识模型构建方法
CN109409350B (zh) 一种基于pca建模反馈式载荷加权的波长选择方法
CN107727676A (zh) 一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法
Hassan et al. Rapid detection and prediction of chloramphenicol in food employing label-free HAu/Ag NFs-SERS sensor coupled multivariate calibration
Sha et al. Improving Raman spectroscopic identification of rice varieties by feature extraction
CN111122536A (zh) 一种基于表面增强拉曼光谱预测混合农药溶液中各农药含量的方法
Guodong et al. A feature selection method combined with ridge regression and recursive feature elimination in quantitative analysis of laser induced breakdown spectroscopy
Fu et al. Calibration methods of laser-induced breakdown spectroscopy
Li et al. Rapid detection of thiabendazole in food using SERS coupled with flower-like AgNPs and PSL-based variable selection algorithms
Ariyama et al. The determination technique of the geographic origin of Welsh onions by mineral composition and perspectives for the future
CN110068605A (zh) 一种基于pca-lda分析鉴别大米产地的方法
CN109781721A (zh) 一种同时测定锌电解液中铜钴镍铁含量的测试体系优化方法
CN106442474A (zh) 一种基于偏最小二乘法的水泥生料三率值测量方法
CN113670913A (zh) 水稻氮素含量反演高光谱植被指数构建方法
CN109959673B (zh) 一种陆相干酪根的评价方法
CN109211814B (zh) 一种基于三维光谱曲面分区特征的土壤剖面类型识别方法
Wu et al. Multivariate methods with feature wavebands selection and stratified calibration for soil organic carbon content prediction by Vis‐NIR spectroscopy
CN106950193B (zh) 基于自加权变量组合集群分析的近红外光谱变量选择方法
CN114004147B (zh) 一种土壤湿润状态下同时预测多种土壤属性的方法
CN115392305A (zh) 基于改进时间卷积网络的土壤有机质含量高光谱建模方法
CN115598162A (zh) 基于堆叠式模型的土壤重金属含量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination