CN103868999A - 一种利用色谱特征提取对样本进行鉴定的方法 - Google Patents

一种利用色谱特征提取对样本进行鉴定的方法 Download PDF

Info

Publication number
CN103868999A
CN103868999A CN201410130613.7A CN201410130613A CN103868999A CN 103868999 A CN103868999 A CN 103868999A CN 201410130613 A CN201410130613 A CN 201410130613A CN 103868999 A CN103868999 A CN 103868999A
Authority
CN
China
Prior art keywords
chromatographic
peak
curve
feature
box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410130613.7A
Other languages
English (en)
Other versions
CN103868999B (zh
Inventor
尤新革
曾武
徐端全
牟怿
王同晖
周龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN201410130613.7A priority Critical patent/CN103868999B/zh
Publication of CN103868999A publication Critical patent/CN103868999A/zh
Application granted granted Critical
Publication of CN103868999B publication Critical patent/CN103868999B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种利用色谱特征提取对样本进行鉴定的方法。该方法为:利用色谱仪采集样本的色谱信号;采用去噪函数对前述采集的色谱信号进行去噪;对前述去噪后的色谱信息提取色谱特征,所述提取的色谱特征包括曲线盒子特征、峰高、峰宽、峰面积、峰曲率;利用前述提取的色谱特征对样本进行分析鉴定。本发明的优点为:所述色谱特征提取方法中数据量小、运算速度快、正确率高、特征稳定,可直接采用提取的色谱特征进行统计分析和建模。

Description

一种利用色谱特征提取对样本进行鉴定的方法
技术领域
本发明属于色谱分析方法,具体涉及一种利用色谱特征提取对样本进行鉴定的方法。
背景技术
色谱仪在石油、化工、生物化学、医药卫生、食品工业、环保等方面应用很广。色谱分析主要是定性和定量两个方面。定性分析就是通过色谱分析样本含有的成分。定量分析需要配置不同浓度的标准溶液,通过建立浓度和物质峰面积之间的线性关系模型然后对物质的浓度进行检测。但是采集色谱信号的过程中由于温度、湿度、操作不当或者色谱柱更换等原因,使得采集到的色谱信号常常会出现峰的非一致漂移,即有的物质出峰时间提前有的物质出峰时间滞后,给后续的色谱信号分析造成困难。
发明内容
本发明的目的在于,提供一种利用色谱特征提取对样本进行鉴定的方法。主要解决现有技术中色谱峰的非一致漂移使得色谱信号分析困难的技术问题。
本发明为解决上述技术问题所采用的技术方案如下:
一种利用色谱特征提取对样本进行鉴定的方法,包括如下步骤:
步骤1,利用色谱仪采集样本的色谱信号;
步骤2,采用去噪函数对前述采集的色谱信号进行去噪;
步骤3,对前述去噪后的色谱信号提取色谱特征,所述提取的色谱特征包括曲线盒子特征、峰高、峰宽、峰面积、峰曲率;
步骤4,利用前述提取的色谱特征对样本进行分析鉴定。
优选地,所述步骤2中,采用Matlab软件提供的去噪函数wden对信号进行去噪。
优选地,所述步骤3中的曲线盒子特征,其计算方法如下:
将色谱信号峰看作是二维空间中的曲线,用方程表示为:y=f(x),其中x和y分别对应曲线上的点的位置和峰值;假设曲线长度为M,将曲线分成r段,每一段对应一叠r×r的盒子;设定在第i段曲线中,曲线峰值的最大值位于第l个盒子内,最小值位于第k个盒子内;则在第i段曲线中,覆盖曲线的盒子数为:nx(i)=l-k+1,盒子总数为:
Figure BDA0000485978330000021
对得到的序列(lnr,lnNr),在无标度区用最小二乘计算(lnr,lnNr)的斜率,得到的斜率取负号就是所述曲线盒子特征。
与现有技术相比,本发明的有益效果如下:
(1)提出一种通过色谱特征提取对样本进行分析鉴定的方法,在对样本进行分析时,不再需要工作曲线,并且消除了色谱峰漂移的影响。
(2)所述通过色谱特征提取对样本进行鉴定的方法中,提取的特征数据量小、运算速度快、正确率高、特征稳定,可直接采用提取的色谱特征进行统计分析和建模。
说明书附图
图1为本发明实施例中待测样本在改变外界条件前后的色谱信号图;
图2为本发明实施例中待测样本去噪后的色谱信号图;
图3为本发明实施例中色谱信号峰值检测的示意图;
图4为本发明实施例中酒样本在不同外界条件下的色谱信号图;
图5为本发明实施例中酒样本去噪后的色谱信号图;
图6为本发明实施例中酒样本色谱信号峰值的示意图;
图7为本发明实施例中同一种酒在不同条件下的色谱信号图。
具体实施方式
以下通过具体实施例来说明本发明的技术方案。
本发明的核心思想是:对采集的色谱信号进行去噪,对去噪后的色谱信号提取峰高、峰面积、峰宽、峰曲率以及曲线盒子特征。最后对提取的特征进行匹配实现对样本的分析鉴定,避免了因为色谱峰的非一致漂移造成的分析困难。
本发明中对色谱特征进行提取的详细过程如下:
一.色谱数据的采集
(1)选用仪器:美国Agilent公司GC-MSD7890-5975c气质联用仪;
(2)GC条件:配有Dean Switch装置,利用中心切割技术,使用HP-FFAP(30m×0.25mm,0.25μm,美国J&W公司)为一维色谱柱、HP-5(30m×0.25mm,0.25μm,美国J&W公司)为二维色谱柱,进样量1μL,分流比30:1;进样口温度250℃;中心切割范围:7.0-9.6min,将乙醇切入二维色谱柱中;载气为高纯N2;柱流速1mL/min;升温程序:初始温度为40℃,保持4min后,以4℃/min程序升温至240℃,保持25min。
MS条件:电子轰击(electron ionization,EI)离子源;电子能量70eV;离子源温度250℃;传输线温度280℃;四极杆温度为150℃;质量扫描范围m/z29-400。
二.色谱信号的去噪:采用Matlab软件提供的去噪函数wden对信号进行去噪。
三.峰值检测:采用Matlab软件提供的函数findpeaks求色谱信号的极值(即峰高)。
四.色谱特征提取:色谱特征包括盒子特征、峰高特征、峰宽特征、峰面积特征、峰曲率特征。
曲线盒子特征,其计算方法是将色谱峰看做是二维空间中的曲线,用方程表示为:y=f(x),其中x和y分别对应曲线上的点的位置和函数取值,假设曲线长度为M,将曲线分成r段,每一段对应一叠r×r的盒子,设在第i段曲线中,曲线幅值的最大值位于第l个盒子内,最小值位于第k个盒子内,则在第i段曲线中,覆盖曲线的盒子数为:nr(i)=l-k+1;盒子总数为:
Figure BDA0000485978330000031
对得到的序列(lnr,lnNr),在无标度区用最小二乘计算(lnr,lnNr)的斜率,得到的斜率取负号就是所述曲线盒子特征,ln表示取工程常数e=2.7183为底的自然对数。
所述峰高为:色谱峰最高点与基线之间的距离;所述峰宽为:谱峰拐点所作的切线在基线上截距的距离;所述峰面积为:峰围成的区域的面积;所述峰曲率特征为:计算色谱峰拐点范围内的点的曲率,求其均值和方差。
下面通过具体例子介绍利用色谱特征提取对样本进行鉴定的详细过程。
实例1,样本色谱峰漂移的分析
第一步:色谱信号采集
利用色谱仪采集待测样本的色谱信号峰;然后,改变色谱信号采集的外界条件(如温度、湿度或更换色谱柱等),第二次采集所述待测样本的色谱信号峰。参见图1,展示了待测样本在改变外界条件前后的色谱信号图。如图所示,第一次采集的色谱信号中出现三个信号峰,分别命名为A1,B1,C1。第二次采集的色谱信号中同样出现三个信号峰,分别命名为A2,B2,C2。从图中可以看出,由于采集过程中外界条件改变,待测样本的色谱信号峰出现漂移。
第二步:色谱信号的去噪
采用Matlab软件提供的去噪函数wden对信号进行去噪。参见图2,展示了待测样本去噪后的色谱信号图。
第三步:峰值检测
采用Matlab软件提供的函数findpeaks检测色谱信号的极值。参见图3,展示了色谱信号峰值检测的示意图。
第四步:色谱特征提取
所述提取的色谱特征包括盒子特征、峰高、峰宽、峰面积、峰曲率。对上述待测样本的色谱信号提取特征后,获得的特征值列于表1。
表1,色谱峰的特征值
Figure BDA0000485978330000051
对于上述信号峰A1和A2、B1和B2、C1和C2,当两者的特征值小于指定的阈值(0.5)时,可以认为虽然存在色谱峰的漂移,实际上属于同一种样本。
实例2,酒类样本的分析
在不同色谱柱条件下采集同一种白酒的色谱信号,各10个。采集酒样本的色谱信号,由于采集过程中外界条件变化,采集的色谱峰出现漂移。参见图4,展示了酒样本在不同外界条件下的色谱信号图。采用Matlab软件提供的去噪函数wden对采集的色谱信号进行去噪。参见图5,展示了酒样本去噪后的色谱信号图。采用Matlab软件提供的函数findpeaks检测色谱信号的峰值。参见图6,展示了酒样本色谱信号峰值的示意图。
获取所述酒样本色谱信号的特征,包括盒子特征、峰高、峰宽、峰面积、峰曲率。
计算原始色谱信号之间的距离(这里的距离是指原始信号的欧式距离);计算提取的特征之间的距离(这里的距离是指提取的特征之间的欧氏距离)。现将信号强度归一化,即每一个信号除以该信号的最大值。
表2是原始信号两两之间的距离,表3是提取的特征两两之间的距离,从图中可以看到,原始色谱信号两两之间的距离远远大于特征提取的特征之间的距离。表明这是一种能够抵抗色谱峰漂移的特征。
实例3,酒类鉴别
参见图7,展示了同一种酒在不同条件下的色谱信号图。如图所示,(a)和(b)是同一种酒在不同条件下获得的色谱信号,存在色谱峰漂移;(c)和(d)是同一种酒在不同条件下获得的色谱信号,同样存在色谱峰漂移(这里的c、d和a、b是两种不同种类的酒)。对每种酒样本各采集20个信号,共采集80个色谱信号数据。其它步骤和实例1、2相同,这里不再赘述。
取(a)和(c)对应的20个色谱信号,分别求色谱信号平均值,分别计算(b)和(d)对应的20个色谱信号到这两个平均值之间的距离;若距离小于5,则判定为某一类型酒,其判定结果的正确率为30%。取(a)和(c)对应的20个色谱信号,提取盒子特征、峰高特征、峰宽特征、峰面积特征、峰曲率特征,分别求特征的平均值,分别提取(b)和(d)对应的20个色谱信号的盒子特征、峰高特征、峰宽特征、峰面积特征、峰曲率特征,计算提取的特征到这两个平均值之间的距离;若距离小于5,则判定为某一类型酒,其判定结果的正确率为98%。
上述仅为本发明的部分优选实施例,本发明并不仅限于实施例的内容。对于本领域中的技术人员来说,在本发明方法范围内可以有各种变化和更改,所作的任何变化和更改,均在本发明保护范围之内。
表2原始色谱信号两两之间的距离
距离 1 2 3 4 5 6 7 8 9 10
1 0 9.813 9.6974 9.6720 10.3913 9.7878 10.2736 10.0239 9.9471 9.7956
2 9.813 0 10.1602 9.6541 10.1962 10.1762 10.2215 10.2299 10.5351 10.0132
3 9.6974 10.1602 0 10.1045 9.5565 10.4442 9.7500 10.3845 10.1890 10.5114
45 9.672010.3913 9.654110.1962 10.10459.5565 09.6228 9.62280 10.44659.6836 9.836910.4544 10.497310.4952 10.323410.4048 9.623510.5033
6 9.7878 10.1762 10.4442 10.4465 9.6836 0 9.7654 9.6586 9.8027 9.9770
7 10.2736 10.2215 9.7500 9.8369 10.4544 9.7654 0 10.2927 9.8734 9.6563
8 10.0239 10.2299 10.3845 10.4973 10.4952 9.6586 10.2927 0 9.9829 10.3689
9 9.9471 10.5351 10.1890 10.3234 10.4048 9.8027 9.8734 9.9829 0 9.5874
10 9.7956 10.0132 10.5114 9.6235 10.5033 9.9770 9.6563 10.3689 9.5874 0
表3提取的特征两两之间的距离
距离 1 2 3 4 5 6 7 8 9 10
1 0 1.6293 1.5422 1.6882 1.9134 1.4369 1.1862 1.0128 1.8129 1.6860
2 1.6293 0 1.4261 1.6921 1.6541 1.6202 1.9087 1.5231 1.8912 1.6171
3 1.5422 1.4261 0 1.6321 1.8264 1.5186 1.5953 1.7938 1.6231 1.7485
4 1.6882 1.6921 1.6321 0 1.6026 1.6000 1.6271 1.6157 1.9014 1.4653
5 1.9134 1.6541 1.8264 1.6026 0 1.6028 1.5525 1.5087 1.4734 1.6450
6 1.4369 1.6202 1.5186 1.6000 1.6028 0 1.4530 1.4472 1.6535 1.5748
7 1.1862 1.9087 1.5953 1.6271 1.5525 1.4530 0 1.8868 1.6051 1.5549
8 1.0128 1.5231 1.7938 1.6157 1.5087 1.4472 1.8868 0 1.4869 1.7940
9 1.8129 1.8912 1.6231 1.9014 1.4734 1.6535 1.6051 1.4869 0 1.7500
10 1.6860 1.6171 1.7485 1.4653 1.6450 1.5748 1.5549 1.7940 1.7500 0

Claims (3)

1.一种利用色谱特征提取对样本进行鉴定的方法,其特征在于所述方法包括如下步骤:
步骤1,利用色谱仪采集样本的色谱信号;
步骤2,采用去噪函数对前述采集的色谱信号进行去噪;
步骤3,对前述去噪后的色谱信号提取色谱特征,所述提取的色谱特征包括曲线盒子特征、峰高、峰宽、峰面积、峰曲率;
步骤4,利用前述提取的色谱特征对样本进行分析鉴定。
2.如权利要求1所述的利用色谱特征提取对样本进行鉴定的方法,其特征在于:所述步骤2中,采用Matlab软件提供的去噪函数wden对信号进行去噪。
3.如权利要求1所述的利用色谱特征提取对样本进行鉴定的方法,其特征在于:所述步骤3中的曲线盒子特征,其计算方法如下,
将色谱信号峰看作是二维空间中的曲线,用方程表示为:y=f(x),其中x和y分别对应曲线上的点的位置和峰值;假设曲线长度为M,将曲线分成r段,每一段对应一叠r×r的盒子;设定在第i段曲线中,曲线峰值的最大值位于第l个盒子内,最小值位于第k个盒子内;则在第i段曲线中,覆盖曲线的盒子数为:nr(i)=l-k+1,盒子总数为:
Figure FDA0000485978320000011
对得到的序列(lnr,lnNr),在无标度区用最小二乘计算(lnr,lnNr)的斜率,得到的斜率取负号就是所述曲线盒子特征。
CN201410130613.7A 2014-04-02 2014-04-02 一种利用色谱特征提取对样本进行鉴定的方法 Active CN103868999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410130613.7A CN103868999B (zh) 2014-04-02 2014-04-02 一种利用色谱特征提取对样本进行鉴定的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410130613.7A CN103868999B (zh) 2014-04-02 2014-04-02 一种利用色谱特征提取对样本进行鉴定的方法

Publications (2)

Publication Number Publication Date
CN103868999A true CN103868999A (zh) 2014-06-18
CN103868999B CN103868999B (zh) 2015-07-08

Family

ID=50907761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410130613.7A Active CN103868999B (zh) 2014-04-02 2014-04-02 一种利用色谱特征提取对样本进行鉴定的方法

Country Status (1)

Country Link
CN (1) CN103868999B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113189259A (zh) * 2021-03-24 2021-07-30 中国工程物理研究院材料研究所 一种氢同位素色谱峰数据处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020023066A1 (en) * 2000-06-26 2002-02-21 The Regents Of The University Of California Biologically-based signal processing system applied to noise removal for signal extraction
WO2008149436A1 (ja) * 2007-06-06 2008-12-11 Shimadzu Corporation 信号波形データ処理装置及び信号波形データのピーク検出結果補正方法
US20120187284A1 (en) * 2009-06-25 2012-07-26 Roland Geyer Functional Check and Variance Compensation in Mass Spectrometry
CN103105369A (zh) * 2013-01-30 2013-05-15 华中科技大学 液态物质光谱基线校正定量分析方法
CN103293257A (zh) * 2013-05-16 2013-09-11 云南烟草科学研究院 一种卷烟烟气色谱数据保留时间漂移mwfft校准方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020023066A1 (en) * 2000-06-26 2002-02-21 The Regents Of The University Of California Biologically-based signal processing system applied to noise removal for signal extraction
WO2008149436A1 (ja) * 2007-06-06 2008-12-11 Shimadzu Corporation 信号波形データ処理装置及び信号波形データのピーク検出結果補正方法
US20120187284A1 (en) * 2009-06-25 2012-07-26 Roland Geyer Functional Check and Variance Compensation in Mass Spectrometry
CN103105369A (zh) * 2013-01-30 2013-05-15 华中科技大学 液态物质光谱基线校正定量分析方法
CN103293257A (zh) * 2013-05-16 2013-09-11 云南烟草科学研究院 一种卷烟烟气色谱数据保留时间漂移mwfft校准方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WANG GUAN等: "auto-correction on retention time shifting of complex samples and development of related software", 《COMPUTERS AND APPLIED CHEMLSTRY》, vol. 22, no. 12, 31 December 2005 (2005-12-31), pages 1163 - 1167 *
李博岩 等: "中药色谱指纹图谱组分保留时间漂移的校准", 《分析化学研究报告》, vol. 32, no. 3, 31 March 2004 (2004-03-31), pages 313 - 316 *
潘振球 等: "一阶导数法在裂解色谱中的应用", 《色谱》, vol. 14, no. 3, 31 May 1996 (1996-05-31), pages 224 - 226 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113189259A (zh) * 2021-03-24 2021-07-30 中国工程物理研究院材料研究所 一种氢同位素色谱峰数据处理方法

Also Published As

Publication number Publication date
CN103868999B (zh) 2015-07-08

Similar Documents

Publication Publication Date Title
Gerhardt et al. Resolution-optimized headspace gas chromatography-ion mobility spectrometry (HS-GC-IMS) for non-targeted olive oil profiling
Avula et al. Authentication of true cinnamon (Cinnamon verum) utilising direct analysis in real time (DART)-QToF-MS
Hantao et al. Comprehensive two-dimensional gas chromatography combined to multivariate data analysis for detection of disease-resistant clones of Eucalyptus
Hantao et al. Determination of disease biomarkers in Eucalyptus by comprehensive two-dimensional gas chromatography and multivariate data analysis
US20070278395A1 (en) Apparatus and Method For Identifying Peaks In Liquid Chromatography/Mass Spectrometry And For Forming Spectra And Chromatograms
Nozal et al. The use of carbohydrate profiles and chemometrics in the characterization of natural honeys of identical geographical origin
Guigue et al. Ultrahigh-resolution FT-ICR mass spectrometry for molecular characterisation of pressurised hot water-extractable organic matter in soils
CN104237436A (zh) 一种沉积物中半挥发性卤代有机污染物定性筛查方法
Guo et al. Molecular differentiation of five Cinnamomum camphora chemotypes using desorption atmospheric pressure chemical ionization mass spectrometry of raw leaves
JP6873317B2 (ja) クロマトグラフィー質量分析方法およびクロマトグラフ質量分析装置
CN104007212B (zh) 一种基于局部相似性匹配的色谱特征峰波段提取与分析方法
Mallard AMDIS in the chemical weapons convention
Lei et al. MET-IDEA version 2.06; improved efficiency and additional functions for mass spectrometry-based metabolomics data processing
Xie et al. Rapid detection and quantification by GC–MS of camellia seed oil adulterated with soybean oil
CN104569197A (zh) 同时测定烟草中的糖、1,2-丙二醇和甘油的硅烷化gc/ms检测方法
Monasterio et al. Olive oil by capillary electrophoresis: Characterization and genuineness
Peruga et al. A robust GC-MS/MS method for the determination of chlorothalonil in fruits and vegetables
Fidelis et al. Chemical characterization of rosewood (Aniba rosaeodora Ducke) leaf essential oil by comprehensive two-dimensional gas chromatography coupled with quadrupole mass spectrometry
Hu et al. Determination of rare earth elements in navel oranges from different geographical regions of China by inductively coupled plasma-mass spectrometry
Yan et al. Application of identification and evaluation techniques for edible mushrooms: a review
CN104483425B (zh) 一种烟草及烟草制品中马来酰肼残留量的检测方法
CN103868999B (zh) 一种利用色谱特征提取对样本进行鉴定的方法
CN103353501A (zh) 一种基于gc/ms技术的普洱熟茶指纹图谱识别方法
Han et al. Benefit of the use of GCxGC/MS profiles for 1D GC/MS data treatment illustrated by the analysis of pyrolysis products from east Asian handmade papers
CN106596814B (zh) 一种复杂液‑质联用数据中的色谱峰定量分析方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant