CN110274890B - 一种复杂体系中目标物及其类似物的定量和定性检测方法 - Google Patents
一种复杂体系中目标物及其类似物的定量和定性检测方法 Download PDFInfo
- Publication number
- CN110274890B CN110274890B CN201910536443.5A CN201910536443A CN110274890B CN 110274890 B CN110274890 B CN 110274890B CN 201910536443 A CN201910536443 A CN 201910536443A CN 110274890 B CN110274890 B CN 110274890B
- Authority
- CN
- China
- Prior art keywords
- mixture
- support vector
- vector regression
- target object
- regression model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 19
- 239000000203 mixture Substances 0.000 claims abstract description 131
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000000862 absorption spectrum Methods 0.000 claims description 58
- 238000012549 training Methods 0.000 claims description 25
- 238000002790 cross-validation Methods 0.000 claims description 11
- 238000005259 measurement Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010521 absorption reaction Methods 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 abstract description 21
- VPWNQTHUCYMVMZ-UHFFFAOYSA-N 4,4'-sulfonyldiphenol Chemical class C1=CC(O)=CC=C1S(=O)(=O)C1=CC=C(O)C=C1 VPWNQTHUCYMVMZ-UHFFFAOYSA-N 0.000 abstract description 15
- 239000000126 substance Substances 0.000 abstract description 14
- 229930185605 Bisphenol Natural products 0.000 abstract description 13
- IISBACLAFKSPIT-UHFFFAOYSA-N bisphenol A Chemical compound C=1C=C(O)C=CC=1C(C)(C)C1=CC=C(O)C=C1 IISBACLAFKSPIT-UHFFFAOYSA-N 0.000 description 22
- ZFVMWEVVKGLCIJ-UHFFFAOYSA-N bisphenol AF Chemical compound C1=CC(O)=CC=C1C(C(F)(F)F)(C(F)(F)F)C1=CC=C(O)C=C1 ZFVMWEVVKGLCIJ-UHFFFAOYSA-N 0.000 description 9
- HCNHNBLSNVSJTJ-UHFFFAOYSA-N 1,1-Bis(4-hydroxyphenyl)ethane Chemical compound C=1C=C(O)C=CC=1C(C)C1=CC=C(O)C=C1 HCNHNBLSNVSJTJ-UHFFFAOYSA-N 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000001328 terahertz time-domain spectroscopy Methods 0.000 description 7
- 238000010200 validation analysis Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 4
- 238000004445 quantitative analysis Methods 0.000 description 4
- 239000013076 target substance Substances 0.000 description 4
- 239000004698 Polyethylene Substances 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000004451 qualitative analysis Methods 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- -1 bis-hydroxyphenyl Chemical group 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 229910001218 Gallium arsenide Inorganic materials 0.000 description 1
- 229910007709 ZnTe Inorganic materials 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3581—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation
- G01N21/3586—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation by Terahertz time domain spectroscopy [THz-TDS]
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1293—Using chemometrical methods resolving multicomponent spectra
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,通过采用支持向量回归方法,对单组分、双组分、三组分和四组分双酚的太赫兹光谱数据进行分析,以获得与混合物中目标物及其类似物在预设质量分数对应的频率的支持向量回归模型。利用所述支持向量回归模型对未知混合物样本的质量分数进行预测,最后,通过光谱重构,直观地评价支持向量回归模型对在太赫兹区混合物中的目标物质量分数预测的准确性,为对未知混合物中特定物质的质量分数检测提供了一种更加准确的方法。
Description
技术领域
本发明涉及物质检测技术领域,尤其涉及的是一种复杂体系中目标物及其类似物的定量和定性检测方法。
背景技术
近年来,因为太赫兹时域光谱(THz-TDS)具有低光子能量的要求,高信噪比,和分子共振响应,已被证明可作为一个快速的非接触式提取各种材料的性能的方法。现有技术中存在对溶液中含有特定物质的含量进行测定的需求,由于太赫兹光谱具有指纹谱的特征,物质的不同组成与光谱中的波峰位置具有一一对应的关系,因此可以利用太赫兹光谱进行物质种类的识别。
现有技术中常用的对混合物中物质的定性和定量检测方法是:使用有足够纯度单色光的分光光度计,在相同的条件下测定相近浓度的待测试样和标准品的溶液的吸收光谱,然后比较二者吸收光谱特征:吸收峰数目及位置、吸收谷及肩峰所在的位置等,分子结构相同的化合物应有完全相同的吸收光谱。在对定性出的物质进行定量检测,而这样的方法中若对含有多种组分的混合物进行检测,比较繁琐,是很多情况下混合物中物质并不能准确确定,从而给最终结果带来较大误差,不能满足对混合物所含物质的准确定性和定量分析的需要。
因此,现有技术还有待于进一步的改进。
发明内容
本发明的目的在于为用户提供一种复杂体系中目标物及其类似物的定量和定性检测方法,通过支持向量回归(SVR)的方法获得频率与目标质量分数的函数,克服现有技术中预测值误差较大的缺陷。
本发明解决技术问题所采用的技术方案如下:
一种复杂体系中目标物及其类似物的定量和定性检测方法,其中,包括以下步骤:
A、获取待检测混合物样本的太赫兹时域波形,根据所述太赫兹时域波形得到所述混合物样本的吸收光谱;
B按照预设频率步长从吸收光谱中选取多个吸收光谱数据,将所述吸收光谱数据分别代入已知目标物及其类似物组成的一元混合物、二元混合物以及多元混合物在不同频率值所对应不同质量分数的多个支持向量回归模型,得到混合物样本中所述目标物及其类似物质量分数的预测值;
C、利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建,并根据重建后得到的吸收光谱定性分析出混合物样本中所含目标物和/或目标物类似物的名称。
可选的,所述方法还包括:
A01、分别获取目标物及其类似物组成的一元混合物,二元混合物、以及多元混合物中预设质量分数范围内不同质量分数所对应不同频率的吸收光谱;
A02、利用支持向量回归法分析质量分数与频率之间的关系,分别得到目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物中基础支持向量回归模型:
A03、利用留-交叉验证方法对所述基础支持向量回归模型进行训练,得到训练后的支持向量回归模型。
可选的,所述步骤B还包括:
步骤B1、步骤B1、在所述目标物及其类似物所在的频率范围内选择出多个频率值,依次将所述吸收光谱数据代入目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物相对应的支持向量回归模型,得到不同频率值所对应的目标物和/或目标物类似物的质量分数的预测值。
可选的,所述步骤C还包括:
步骤C1、将混合物中目标物和/或目标物类似物的质量分数输入支持向量回归模型,得到太赫兹吸收光谱曲线。
可选的,所述步骤B包括:
步骤B2、依次将吸收光谱数据代入目标物及类似物的一元混合物所对应的支持向量回归模型、二元混合物所对应的支持向量回归模型和各个多元混合物所对应的支持向量回归模型,分别得到所述支持向量回归模型输出的目标物及类似物质量分数。
可选的,所述利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建的步骤包括:
步骤C2、将部分质量分数的预测值作为测试数据,将剩余部分的质量分数预测值作为训练数据;使用训练数据对支持向量回归模型进行训练;
步骤C3、将支持向量回归模型输出的各个频率值所对应的吸收系数作为吸收光谱数据,重建吸收光谱。
进一步的,所述步骤A03中还包括:
计算训练后得到的支持向量回归模型输出的结果与真实值之间误差的测定系数和/或均方误差;
当所述测定系数和/或均方误差满足预设阈值时,则停止对所述支持向量回归模型的训练,执行步骤B。
有益效果,本发明提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,通过采用支持向量回归(SVR)方法,对单组分、双组分、三组分和四组分双酚的太赫兹光谱数据进行分析,以获得与混合物中目标物及其类似物在预设质量分数对应的频率的支持向量回归模型。利用所述支持向量回归模型对未知混合物样本的质量分数进行预测,最后,通过光谱重构,直观地评价支持向量回归模型对在太赫兹区混合物中的目标物质量分数预测的准确性,为对未知混合物中特定物质的质量分数检测提供了一种更加准确的方法。
附图说明
图1是本发明提供的所述复杂体系中目标物及其类似物的定量和定性检测方法的步骤流程图;
图2是本发明实施例中频率在0.3-2.8THz范围内纯双酚A、双酚E、双酚S和双酚AF的吸收光谱图;
图3是本发明实施例中支持向量回归模型的数据矩阵结构示意图;
图4a 是本发明验证所得THz频率中的一元混合物样品中BpA吸收光谱重建与预测值的比较图;
图4b是本发明验证所得THz频率中的二元混合物样品中BpA吸收光谱重建与预测值的比较图;
图4c是本发明验证所得THz频率中的三元混合物样品中BpA吸收光谱重建与预测值的比较图;
图4d是本发明验证所得THz频率中的四元混合物样品中BpA吸收光谱重建与预测值的比较图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
本发明所述方法提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,如图1所示,包括以下步骤:
S1、获取待检测混合物样本的太赫兹时域波形,根据所述太赫兹时域波形得到所述混合物样本的吸收光谱。
将待检测混合物样本放置到太赫兹时域光谱系统的样品台上,获取该混合物样本的太赫兹时域波形,并将所述太赫兹时域波形中的光谱经过傅里叶变换并转换成吸收系数光谱。
S2、按照预设频率步长从吸收光谱中选取多个吸收光谱数据,将所述吸收光谱数据分别代入已知目标物及其类似物组成的一元混合物、二元混合物以及多元混合物在不同频率值所对应不同质量分数的多个支持向量回归模型,得到混合物样本中所述目标物及其类似物质量分数的预测值。
在预定的频率范围内(例如:双酚混合物的光谱范围为0.3-2.3THz),选择多个频率点,并将多个频率点所对应的数据信息输入到支持向量回归模型,得到的预测质量分数。由于所述支持向量回归模型是吸收光谱频率与目标物或者目标物类似物的质量分数的函数,因此基于频率点信息,可以得到目标物或者目标物类似物的质量分数信息。
具体的,本步骤中由于混合物样本具体含有的几种目标物及其类似物,和混合物样本中含有上述物质的质量分数均未知,因此为了实现对多元混合物中目标物及其类似物的定量和定性分析,本步骤还包括:
步骤S21、依次将吸收光谱数据中选取出的多个频率点代入目标物及类似物的一元混合物所对应的支持向量回归模型、二元混合物所对应的支持向量回归模型和各个多元混合物所对应的支持向量回归模型,分别得到所述支持向量回归模型输出的目标物及类似物质量分数。
S3、利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建,并根据重建后得到的吸收光谱定性分析出混合物样本中所含目标物和/或目标物类似物的名称。
利用留-交叉验证方法对上述步骤中预测出的混合物样本中的目标物及其类似物的质量分数对混合物样本的吸收光谱进行重建,并根据重建结果确定混合物样本中所含目标物和/或目标物类似物的质量分数及其名称。实现了对其进行定量和定性分析。
可选的,所述步骤S3还包括:
步骤S31、将混合物中目标物和/或目标物类似物的质量分数输入支持向量回归模型,得到太赫兹吸收光谱曲线。
具体的,上述步骤中所述利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建的步骤包括:
步骤S32、将计算出的部分已知质量分数作为测试数据,将计算出的剩余已知质量分数作为训练数据;使用训练数据对支持向量回归模型进行训练;
步骤S33、将支持向量回归模型输出的各个频率值所对应的吸收系数作为吸收光谱数据,重建吸收光谱。
分别通过依次对混合物中的目标物的质量分数、第一个目标物的类似物的质量分数、第二个目标物的类似物的质量分数和第三个目标物的类似物的质量分数进行预测,并将预测得到的质量分数相结合,对混合物的吸收光谱进行重建,判定出该混合物为一元混合物、二元混合物、三元混合物还是四元混合物。
在具体实施时,为了得到更好的预测效果,所述方法还包括:
S01、分别获取目标物及其类似物组成的一元混合物,二元混合物、以及多元混合物中预设质量分数范围内不同质量分数所对应不同频率的吸收光谱;
S02、利用支持向量回归法分析质量分数与频率之间的关系,分别得到目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物中基础支持向量回归模型:
S03、利用留-交叉验证方法对所述基础支持向量回归模型进行训练,得到训练后的支持向量回归模型。
上述步骤首先基于已知数据,对支持向量回归模型进行训练,并计算训练后得到的支持向量回归模型输出的结果与真实值之间误差的测定系数和/或均方误差;当所述测定系数和/或均方误差满足预设阈值时,则停止对所述支持向量回归模型的训练,说明训练后的支持向量回归模型预测结果相对精准,已经可以满足需求。
下面以对混合物中双酚A及其类似物的定量和定性检测,对本发明所述方法做更为详细的说明。
由于这些限制,双酚A逐渐被一些其他双酚类化合物取代,如双酚S(BPS),双酚AF(BPAF)或双酚E(BPE)。这些化学物质共有典型的双羟苯基官能团结构,统称为双酚类似物。尽管这些类似物不存在局限性,但现有研究已报道了双酚类似物(如BPAF和BPS)的多种毒性作用。应用上述所公开的方法对未知混合物中双酚A及其类似物进行定量和定性检测。
H1、获取混合物样本的吸收光谱。
对待测混合物样本在透射几何中使用自由空间THz-TDS系统进行THz-TDS测量。该系统由300mW锁模运转、800nm中心波长和84MHz重复频率脉冲组成,脉冲由Ti:蓝宝石振荡器产生,Ti:蓝宝石振荡器为2.2W 532 nm Nd:YV04激光器(SproutTM,灯塔光子学)泵浦。GaAs半导体天线用于产生THz脉冲,并采用ZnTe晶体进行电光检测。以扫描速度为5μm/步,间隔时间为300ms,结果标称分辨率为45 GHz的参数记录0-3.3mm(相当于0-22ps的时间窗)的THz光谱。所有样品都制作在样品台上,直径为3毫米的圆形区域。利用氮气吹扫光学装置,除去空气中的水蒸气,将湿度降低到小于5%。该系统的可用频率范围为0.1至2.6 THz。为了使系统产生的随机误差和样品中存在的异质性最小化,对测试混合物样品测量多次,求平均值。
步骤H2、将混合物样本的吸收光谱输入支持向量回归模型,得到输出结果。
将混合物引入到支持向量回归模型中,用支持向量回归模型分别对单一、二元、三元和四元混合物中BpA的质量分数百分比从0到48%进行拟合。注意,散射图越接近参考线,支持向量回归模型的预测就越可靠。预测也可以用测定系数(R2)和均方误差(MSE)进行定量评价。R2≤1是预测值与实际值的相关系数。MSE≥0是预测值与实际值之间的均方误差。R2越大和MSE值越小表明越好。
重复上述步骤,用支持向量回归模型分别对单一、二元、三元和四元混合物中对双酚S(BPS),双酚AF(BPAF)或双酚E(BPE)的质量分数从0到48%进行拟合,预测出双酚S(BPS),双酚AF(BPAF)或双酚E(BPE)的质量分数。
步骤H3、根据预测结果对混合物样本的吸收光谱进行重建。
将上述步骤中得到的预测结果输入支持向量回归模型,利用保留验证方案对混合物的吸收光谱进行重建。
本实施例通过透射式太赫兹时域光谱对四种双酚类混合物进行测量,应用支持向量机对其进行了分析。采用留一交叉验证方案,对双酚类混合物中BpA浓度的THz谱数据进行了有效的预测。采用保留验证方案作为重建THz吸收光谱的回归方法。我们的测量和方法突出了机器学习方法从复杂混合物系统的太赫兹谱中提取模糊特征的独特能力。我们的结果提供了进一步的证据,太赫兹光谱学结合机器学习方法是一个灵敏的定量分析工具,并应在未来的工业应用中发挥更大的作用。
在具体实施时,以双酚混合物中双酚类似物进行检测的方法,对如何根据已知信息构建支持向量回归模型进行以下解释:
设置双酚混合物的光谱范围为0.3-2.3THz,每个光谱中选择28个频率点。使用从每个吸收光谱中选择的优化频率步长给出n个光谱数据的训练数据集,其中,每个光谱数据点由m维向量 (m=28)和目标物质量分数组成。支持向量回归模型的目的是找到频率对混合物中双酚类似物质量分数 x的函数f(x),使得所有训练数据都可被预测,且与实际目标y的不超过预定义偏差ε≥0,同时函数f(x)尽可能平坦。
在支持向量回归模型中,f(x)的一般形式定义如下:
服从等式(2)和(3)。正常数C控制f(x)的平坦度和偏差违反的公差之间的折衷。方程(4)中的极小化问题可以用内核技巧在其对偶公式中更容易地求解。
对上述函数f(x)进行求解,通过将该质量分数的28个频率值输入到f(x),得到如图3所示的数据矩阵(图3 的矩阵中包括:具有4i+4行(i质量分数*4次测量)和29列(28个频率+1个质量分数值)),以获得函数输出值,即可得到预测未知的测试数据。较佳的,本发明中采用LIBSVM库中的ε-SVR模型。
为了验证本发明所提供方法的可以取得较准确的定量和定性结果,下面以实验结果对其进行验证。
首先,在具体的实施例中,选用双酚A(Alfa Aesar)及其三个双酚类似物、双酚E(TCI Tokyo Kasei)、双酚S和双酚AF(J&K Science)。分别称出含有少于0.05%杂质的4个待检测物样本,并用球磨机研磨成粉末。将纯聚乙烯(PE,Sigma-Aldrich)150mg与不同量的BpA混合,并混合其他三种双酚制成单组分、二元混合、三元混合和四元混合的颗粒。表1给出了颗粒中不同双酚的质量分数。将所有混合物以少量反复混合在一起并再次研磨,以避免在样品中形成聚集体和异质簇和限制获得太赫兹光谱时出现的散射干扰。
表1
用颗粒压力机以8tons/cm2的力对所有样品压2min制成直径为13mm的样品圆形样品块。每种混合物制备两个样品,其中一个作为THz-TDS测定的参考,以同样的方法制备出纯PE(150mg)颗粒和4种纯双酚颗粒。对每个样品测量4次,得到每个样品的太赫兹时域波形。
由于每个样品需要记录两个THz吸收光谱。因此,需要考虑每个样品的4个光谱。针对四元混合物的检测,则需要考虑到72个样品的混合物分析,144个原始光谱需引入到支持向量回归模型中。本发明中首先使用LOOCV来评估支持向量回归模型的性能。在LOOCV中,每次从原始数据集中选择吸收光谱作为测试数据,并且剩余的吸收光谱作为训练数据。SVR用训练数据训练,并对剩下的光谱数据进行测试以获得偏差。重复这个过程,直到数据集中的每个谱数据都测试一次,并在所有数据上平均SVR的性能。
将四类双酚混合物所得到的光谱数据(144个样本)引入到LOOCV-SVR(留一交叉验证-支持向量回归)模型中用于预测, LOOCV-SVR模型估计的预测值与实际值非常接近(R2=0.97985和MSE=0.0080439),因此本发明所述公开的检测方法可以取得较为准确的预测值。
另外,为了检验SVR模型的准确性和直观地呈现预测结果,随后采用保持验证方案。将样品中双酚的各种质量分数输入回归模型,得到THz吸收光谱的输出值。特别地,在每次验证过程中,将所有浓度数据中的已知质量分数值作为测试数据,剩余的质量分数值作为训练数据。在训练数据上训练SVR,并在来自完全未知浓度的保持数据上进行测试SVR。重复上述过程,直到每个浓度百分比测试一次,并通过对所有测试数据进行平均来获得SVR的性能。考虑到每次输出一个频率处的每个吸收值,经过多次计算,得到宽带太赫兹谱。
为了得到清晰的光谱图像,我们仅给出四个质量分数混合物的重建结果,如图4a-图4d所示,预测结果与实验结果吻合较好,四个质量分数混合物分别是:
单混合物(BpA=36%);
二元混合物(BpA:BpE=24%:24%);
三元混合物(BpA:BpE:BpS=24%:12%:12%)
四元混合物(BpA:BpE:BpS:BpAF=24:8:8:8)。
本发明提供了一种复杂体系中目标物及其类似物的定量和定性检测方法,通过采用支持向量回归(SVR)方法,对单组分、双组分、三组分和四组分双酚的太赫兹光谱数据进行分析,以获得与混合物中目标物及其类似物在预设质量分数对应的频率的支持向量回归模型。利用所述支持向量回归模型对未知混合物样本的质量分数进行预测,最后,通过光谱重构,直观地评价支持向量回归模型对在太赫兹区混合物中的目标物质量分数预测的准确性,为对未知混合物中特定物质的质量分数检测提供了一种更加准确的方法。
可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
Claims (5)
1.一种复杂体系中目标物及其类似物的定量和定性检测方法,其特征在于,包括以下步骤:
A、获取待检测混合物样本的太赫兹时域波形,根据所述太赫兹时域波形得到所述混合物样本的吸收光谱;
B、按照预设频率步长从吸收光谱中选取多个吸收光谱数据,将所述吸收光谱数据分别代入已知目标物及其类似物组成的一元混合物、二元混合物以及多元混合物在不同频率值所对应不同质量分数的多个支持向量回归模型,得到混合物样本中所述目标物及其类似物质量分数的预测值;
C、利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建,并根据重建后得到的吸收光谱定性分析出混合物样本中所含目标物和/或目标物类似物的名称;
所述步骤B还包括:
步骤B1、在所述目标物及其类似物所在的频率范围内选择出多个频率值,依次将所述吸收光谱数据代入目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物相对应的支持向量回归模型,得到不同频率值所对应的目标物和/或目标物类似物的质量分数的预测值;所述支持向量回归模型是吸收光谱频率与目标物或者目标物类似物的质量分数的函数。
2.根据权利要求1所述的复杂体系中目标物及其类似物的定量和定性检测方法,其特征在于,所述方法还包括:
A01、分别获取目标物及其类似物组成的一元混合物,二元混合物、以及多元混合物中预设质量分数范围内不同质量分数所对应不同频率的吸收光谱;
A02、利用支持向量回归法分析质量分数与频率之间的关系,分别得到目标物及其类似物组成的一元混合物、二元混合物、以及多元混合物中基础支持向量回归模型:
A03、利用留-交叉验证方法对所述基础支持向量回归模型进行训练,得到训练后的支持向量回归模型。
3.根据权利要求2所述的复杂体系中目标物及其类似物的定量和定性检测方法,其特征在于,所述步骤C还包括:
步骤C1、将混合物中目标物和/或目标物类似物的质量分数预测值输入支持向量回归模型,得到太赫兹吸收光谱曲线。
4.根据权利要求2或3所述的复杂体系中目标物及其类似物的定量和定性检测方法,其特征在于,所述利用留一交叉验证方法根据所述预测值对混合物样本的吸收光谱进行重建的步骤包括:
步骤C2、将部分质量分数预测值作为测试数据,将剩余部分的质量分数的预测值作为训练数据;使用训练数据对支持向量回归模型进行训练;
步骤C3、将支持向量回归模型输出的各个频率值所对应的吸收系数作为吸收光谱数据,重建吸收光谱。
5.根据权利要求2所述的复杂体系中目标物及其类似物的定量和定性检测方法,其特征在于,所述步骤A03中还包括:
计算训练后得到的支持向量回归模型输出的结果与真实值之间误差的测定系数和/或均方误差;
当所述测定系数和/或均方误差满足预设阈值时,则停止对所述支持向量回归模型的训练,执行步骤B。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910536443.5A CN110274890B (zh) | 2019-06-20 | 2019-06-20 | 一种复杂体系中目标物及其类似物的定量和定性检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910536443.5A CN110274890B (zh) | 2019-06-20 | 2019-06-20 | 一种复杂体系中目标物及其类似物的定量和定性检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110274890A CN110274890A (zh) | 2019-09-24 |
CN110274890B true CN110274890B (zh) | 2022-03-04 |
Family
ID=67961272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910536443.5A Active CN110274890B (zh) | 2019-06-20 | 2019-06-20 | 一种复杂体系中目标物及其类似物的定量和定性检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110274890B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274541A (zh) * | 2019-09-27 | 2020-06-12 | 中石化石油工程技术服务有限公司 | 一种岩心导热系数的确定方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105092513A (zh) * | 2015-08-18 | 2015-11-25 | 中国计量学院 | 一种测定混合药物中的药物成分的含量的方法 |
CN107561033A (zh) * | 2017-09-21 | 2018-01-09 | 上海理工大学 | 基于太赫兹光谱的混合物中关键物质定性和定量测定方法 |
-
2019
- 2019-06-20 CN CN201910536443.5A patent/CN110274890B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105092513A (zh) * | 2015-08-18 | 2015-11-25 | 中国计量学院 | 一种测定混合药物中的药物成分的含量的方法 |
CN107561033A (zh) * | 2017-09-21 | 2018-01-09 | 上海理工大学 | 基于太赫兹光谱的混合物中关键物质定性和定量测定方法 |
Non-Patent Citations (1)
Title |
---|
Terahertz spectroscopy of Bisphenol "A", "AF", "S", "E" and the interrelationship between their molecular vibrations;Yiwen Sun等;《Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy》;20181005;第70-77页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110274890A (zh) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Workman | A review of calibration transfer practices and instrument differences in spectroscopy | |
Duncan et al. | Photometric redshifts for the next generation of deep radio continuum surveys–I. Template fitting | |
Myers et al. | First measurement of the clustering evolution of photometrically classified quasars | |
Burger et al. | Hyperspectral NIR imaging for calibration and prediction: a comparison between image and spectrometer data for studying organic and biological samples | |
Gobrecht et al. | Major issues of diffuse reflectance NIR spectroscopy in the specific context of soil carbon content estimation: a review | |
Eliaerts et al. | Rapid classification and quantification of cocaine in seized powders with ATR‐FTIR and chemometrics | |
CA2575585A1 (en) | Method for producing independent multidimensional calibrating patterns | |
KR102214643B1 (ko) | 샘플 내 응력변형 분포 결정 방법 및 시스템 | |
Jensen et al. | Characterization of alginates by nuclear magnetic resonance (NMR) and vibrational spectroscopy (IR, NIR, Raman) in combination with chemometrics | |
Fan et al. | Direct calibration transfer to principal components via canonical correlation analysis | |
CN110274890B (zh) | 一种复杂体系中目标物及其类似物的定量和定性检测方法 | |
Lian et al. | Qualitative and quantitative analyses of potassium sorbate in milk powder using terahertz spectra | |
Nguyen et al. | A method for non-destructive determination of cocoa bean fermentation levels based on terahertz hyperspectral imaging | |
Boysworth et al. | Aspects of multivariate calibration applied to near-infrared spectroscopy | |
Schoot et al. | Predicting the performance of handheld near-infrared photonic sensors from a master benchtop device | |
Jha | Near infrared spectroscopy | |
Brun et al. | Quantification of rubber in high impact polystyrene by Raman spectroscopy. Comparison of a band fitting method and chemometrics | |
Chen et al. | Investigation of sample partitioning in quantitative near-infrared analysis of soil organic carbon based on parametric LS-SVR modeling | |
Abbas et al. | Prediction of source rock origin by chemometric analysis of Fourier transform infrared–attenuated total reflectance spectra of oil petroleum: evaluation of aliphatic and aromatic fractions by self-modeling mixture analysis | |
Chang et al. | Rapid determination of chemical and physical properties in marine sediments using a near-infrared reflectance spectroscopic technique | |
Amat-Tosello et al. | Contribution of external parameter orthogonalisation for calibration transfer in short waves—Near infrared spectroscopy application to gasoline quality | |
Lanza et al. | Non-parametric analysis of one-minute rain intensity measurements from the WMO Field Intercomparison | |
US20220196476A1 (en) | Method for configuring a spectrometry device | |
Kim et al. | Accurate determination of polyethylene pellet density using transmission Raman spectroscopy | |
Addabbo et al. | The hyperspectral unmixing of trace-gases from ESA SCIAMACHY reflectance data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |