CN113378755A - 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法 - Google Patents

基于等高线地图的气相离子迁移谱数据谱峰自动识别方法 Download PDF

Info

Publication number
CN113378755A
CN113378755A CN202110704471.0A CN202110704471A CN113378755A CN 113378755 A CN113378755 A CN 113378755A CN 202110704471 A CN202110704471 A CN 202110704471A CN 113378755 A CN113378755 A CN 113378755A
Authority
CN
China
Prior art keywords
peak
data
spectrum
spectral
gas phase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110704471.0A
Other languages
English (en)
Other versions
CN113378755B (zh
Inventor
王俊
郑成宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110704471.0A priority Critical patent/CN113378755B/zh
Publication of CN113378755A publication Critical patent/CN113378755A/zh
Application granted granted Critical
Publication of CN113378755B publication Critical patent/CN113378755B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/14Classification; Matching by matching peak patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种基于等高线地图的气相离子迁移谱数据谱峰自动识别方法,包括以下几个步骤:数据预处理:进行气相离子迁移谱数据有效区域保留,并进行平滑降噪和基线校正处理;绘制等高线地形图,同时保存所有谱峰的等高线坐标数据,并进行各谱峰中心点坐标的计算;基于等高线坐标数据,在预处理后的气相离子迁移谱数据中进行谱峰的特征提取;输入所有待测样本谱峰定位的坐标结果,通过差值对比,将位置存在小范围波动的谱峰进行谱峰整合,并通过计算平均值重新确定谱峰位置。本发明能够提取出GC‑IMS谱峰的中心坐标、强度和体积等有效特征信息,并能够将不同待测样本谱峰识别的结果进行整合,以解决现有GC‑IMS数据处理方法主观性强、计算量大等问题。

Description

基于等高线地图的气相离子迁移谱数据谱峰自动识别方法
技术领域
本发明涉及气相离子迁移谱分析技术领域,尤其是涉及了一种基于等高线地图的气相离子迁移谱(Gas Chromatography-Ion Mobility Spectroscopy, GC-IMS)数据谱峰自动识别方法。
背景技术
气相离子迁移谱技术作为一种新兴的挥发性有机化合物分析工具,具有灵敏度高(ppbv级)、选择性好和效率高等特点,近些年在食品风味分析、环境气体监测等领域得到了广泛应用。然而,在采集的气相离子迁移谱数据中,气相色谱的保留时间(Retention time)和离子迁移谱的漂移时间(Drift time)及与之对应的信号强度构成了复杂的三维空间数据。现有气相离子迁移谱数据处理方法主要为以下两种,其中一种为借助仪器配套软件通过人为观察手动选取标记点,此过程费时费力且主观性较强;另一种为直接利用全部指纹图谱数据进行分析,然而全谱数据量大且掺杂大量冗余信息,不利于后续模式识别分析。
发明内容
为了克服现有技术的不足,本发明目的在于提出了一种基于等高线地图的气相离子迁移谱数据谱峰自动识别方法,该方法能够提取出谱峰的坐标、强度和体积等有效特征信息,以解决现有数据处理方法主观性强、计算量大等问题。
一种基于等高线地图的气相离子迁移谱数据谱峰自动识别方法,包括以下步骤:(1)数据预处理:进行气相离子迁移谱数据有效区域保留,并进行平滑降噪和基线校正处理;
(2)谱峰定位:基于预处理后的气相离子迁移谱数据,绘制等高线地形图,同时保存所有谱峰的等高线坐标数据,并进行各谱峰中心点坐标的计算;基于等高线坐标数据,在预处理后的气相离子迁移谱数据中进行谱峰的特征提取;
(3)谱峰整合:输入所有待测样本谱峰定位的坐标结果,通过差值对比,将位置存在小范围波动的谱峰进行谱峰整合,并通过计算平均值重新确定谱峰位置。
所述的谱峰中心点坐标的计算包括如下过程:分别提取所有等高线中沿迁移时间、保留时间各自的最大值(
Figure 100002_DEST_PATH_IMAGE002
Figure 100002_DEST_PATH_IMAGE004
)和最小值(
Figure 100002_DEST_PATH_IMAGE006
Figure 100002_DEST_PATH_IMAGE008
),各谱峰中心点的坐标表示为(
Figure 100002_DEST_PATH_IMAGE010
Figure 100002_DEST_PATH_IMAGE012
)。
所述的谱峰的特征提取包括如下过程:首先,在预处理后的GC-IMS指纹图谱数据中,读取各谱峰中心点位置信号的强度值,记为峰强度特征;其次,在保留时间与迁移时间坐标最大值与最小值围成的矩形区域内,累加所有信号强度大于等高线阈值的信号值,结果记为峰体积特征,若谱峰未在图谱中出现,以上两种特征均记作0。
所述的谱峰整合包括如下过程:将每个待测样本定位得到的谱峰中心点坐标,按照先保留时间后迁移时间的顺序从小到大排列输入一个数据集;从头开始依次计算第n和第n+1个坐标数据差值,若差值同时小于保留时间和迁移时间设定的阈值,则顺序读取所有坐标数据;若任意一个差值大于设定阈值,停止读取并对第n个及其之前的所有坐标数据求平均值,同时记为整合后的谱峰位置;自第n+1个坐标数据开始,继续并循环以上两个步骤,直至所有谱峰整合完毕。
本发明具有的有益效果:
能够对GC-IMS数据谱峰进行自动识别定位,同时提取谱峰的峰强度、峰体积特征,无需进行手动挑选和处理且大幅度降低数据运算量。能够将不同待测样本识别到的谱峰进行整合,以消除分析仪器产生的系统误差。
附图说明
图1是本发明的流程框图。
图2是GC-IMS数据的二维指纹图谱。
图3是GC-IMS数据的等高线地形图;
其中,(a)部分为预处理后的GC-IMS二维指纹图谱,(b)和(c)部分分别为优化过程中阈值为0.3mv和0.6mv的等高线地形图。
具体实施方式
下面将结合附图与实施例对本发明作进一步阐述。
如图1所示,本发明所述的基于等高线地图的气相离子迁移谱数据谱峰自动识别方法,包括以下几个步骤:(1)数据预处理:进行气相离子迁移谱数据有效区域保留,并对其进行平滑降噪和基线校正等处理;(2)谱峰定位:基于预处理后的气相离子迁移谱数据,绘制其等高线地形图,同时保存所有谱峰的等高线坐标数据,并进行各谱峰中心点坐标的计算;进一步地,基于等高线坐标数据,在预处理后的气相离子迁移谱数据中进行谱峰的特征提取;(3)谱峰整合:输入所有待测样本谱峰定位的坐标结果,通过差值对比,将位置存在小范围波动的谱峰进行谱峰整合,并通过计算平均值重新确定谱峰位置。
(1)数据预处理:设定保留时间(Retention time)与迁移时间(Drift time)范围,删除GC-IMS指纹图谱数据(图2)中没有信号出现的部分,仅保留有效区域;利用Savitzky-Golay滤波器对信号进行平滑降噪处理,并以离子反应峰(RIP)位置为基线对迁移时间进行校正,同时将迁移时间表示为n×RIP。
(2)谱峰定位
(a)提取等高线数据:优化并设定等高线阈值的过程如图3所示,其中图3(a)为预处理后的GC-IMS二维指纹图谱,图3(b)和(c)分别为优化过程中阈值为0.3mv和0.6mv的等高线地形图,基于预处理后的GC-IMS指纹图谱数据,使用Matlab软件中“contour”函数绘制其等高线地形图,同时保存所有谱峰的等高线坐标数据。
(b)谱峰中心定位:分别提取所有等高线中沿迁移时间、保留时间各自的最大值(
Figure 867993DEST_PATH_IMAGE002
Figure 253975DEST_PATH_IMAGE004
)和最小值(
Figure 377919DEST_PATH_IMAGE006
Figure 241970DEST_PATH_IMAGE008
),各谱峰中心点的坐标可表示为(
Figure 649818DEST_PATH_IMAGE010
Figure 941122DEST_PATH_IMAGE012
)。
(c)提取谱峰特征:首先,在预处理后的GC-IMS指纹图谱数据中,读取各谱峰中心点位置信号的强度值,记为峰强度特征;其次,在迁移时间、保留时间的最大值与最小值围成的矩形区域内,累加所有信号强度大于等高线阈值的信号值,结果记为峰体积特征。若谱峰未在图谱中出现,以上两种特征均记作0。
(3)谱峰整合:将每个样本定位得到的谱峰中心点坐标,按照先保留时间后迁移时间的顺序从小到大排列输入一个数据集。从头开始依次计算第n和第n+1个坐标数据差值,若差值同时小于保留时间和迁移时间设定的阈值,则顺序读取所有坐标数据;若任意一个差值大于设定阈值,停止读取并对第n个及其之前的所有坐标数据求平均值,同时记为整合后的谱峰位置。自第n+1个坐标数据开始,继续并循环以上两个步骤,直至所有谱峰整合完毕。
实施例
1. 选取不同浓度的2-丁酮、2-戊酮、2-己酮、2-庚酮、2-辛酮和2-壬酮6种标准品的混合溶液为实验对象,混合溶液浓度区间在0.1-1mg/L、浓度梯度为0.1mg/L,共十个待测样品。每个待测样品各取1ml置于20ml的顶空进样瓶中,静置5min后抽取500μl的顶空气体进行GC-IMS的仪器分析。本案例中应用的是德国G.A.S.公司FlavourSpec®型GC-IMS检测仪器。
2. 经GC-IMS仪器分析后,删除GC-IMS指纹图谱数据中没有信号出现的部分,仅保留有效区域;利用Savitzky-Golay滤波器对信号进行平滑降噪处理,并以离子反应峰(RIP)位置为基线对迁移时间进行校正,同时将迁移时间表示为n×RIP。
3. 谱峰定位:
(a)提取等高线数据:优化并设定等高线阈值,基于预处理后的GC-IMS指纹图谱数据,使用Matlab软件中“contour”函数绘制其等高线地形图,同时保存所有谱峰的等高线坐标数据。
(b)谱峰中心定位:分别提取所有等高线中沿迁移时间、保留时间各自的最大值(
Figure 316477DEST_PATH_IMAGE002
Figure 984219DEST_PATH_IMAGE004
)和最小值(
Figure 246573DEST_PATH_IMAGE006
Figure 708779DEST_PATH_IMAGE008
),各谱峰中心点的坐标可表示为(
Figure 807316DEST_PATH_IMAGE010
Figure 13169DEST_PATH_IMAGE012
)。
(c)提取谱峰特征:首先,在预处理后的GC-IMS指纹图谱数据中,读取各谱峰中心点位置信号的强度值,记为峰强度特征;其次,在迁移时间、保留时间的最大值与最小值围成的矩形区域内,累加所有信号强度大于等高线阈值的信号值,结果记为峰体积特征。若谱峰未在图谱中出现,以上两种特征均记作0。
4. 谱峰整合:将每个样本定位得到的谱峰中心点坐标,按照先保留时间后迁移时间的顺序从小到大排列输入一个数据集。从头开始依次计算第n和第n+1个坐标数据差值,若差值同时小于保留时间和迁移时间设定的阈值,则顺序读取所有坐标数据;若任意一个差值大于设定阈值,停止读取并对第n个及其之前的所有坐标数据求平均值,同时记为整合后的谱峰位置。自第n+1个坐标数据开始,继续并循环以上两个步骤,直至所有谱峰整合完毕。
根据待测样本中各成分的化学性质和GC-IMS仪器的技术特点,测试样本分析得到的GC-IMS指纹图谱中会出现12个谱峰,分别为2-丁酮、2-戊酮、2-己酮、2-庚酮、2-辛酮和2-壬酮6种物质的单体和二聚体的离子反应峰。谱峰定位结果显示,12个谱峰全部被识别到且定位结果准确,所有样本中各自谱峰中心点坐标保留时间和迁移时间的标准差分别小于0.849s和0.006RIP,在不同样本间稳定性较好。各谱峰的中心点峰强度和峰体积特征均可被准确提取,同时各谱峰的中心点位置也通过重新计算实现了谱峰整合。

Claims (4)

1.一种基于等高线地图的气相离子迁移谱数据谱峰自动识别方法,其特征在于,包括以下步骤:(1)数据预处理:进行气相离子迁移谱(GC-IMS)数据有效区域保留,并进行平滑降噪和基线校正处理;
(2)谱峰定位:基于预处理后的气相离子迁移谱数据,绘制等高线地形图,同时保存所有谱峰的等高线坐标数据,并进行各谱峰中心点坐标的计算;基于等高线坐标数据,在预处理后的气相离子迁移谱数据中进行谱峰的特征提取;
(3)谱峰整合:输入所有待测样本谱峰定位的坐标结果,通过差值对比,将位置存在小范围波动的谱峰进行谱峰整合,并通过计算平均值重新确定谱峰位置。
2.根据权利要求1所述的气相离子迁移谱数据谱峰自动识别方法,其特征在于,所述的谱峰中心点坐标的计算包括如下过程:分别提取所有等高线中沿迁移时间、保留时间各自的最大值(
Figure DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE004
)和最小值(
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
),各谱峰中心点的坐标表示为(
Figure DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE012
)。
3.根据权利要求1所述的气相离子迁移谱数据谱峰自动识别方法,其特征在于,所述的谱峰的特征提取包括如下过程:首先,在预处理后的GC-IMS指纹图谱数据中,读取各谱峰中心点位置信号的强度值,记为峰强度特征;其次,在保留时间与迁移时间坐标最大值与最小值围成的矩形区域内,累加所有信号强度大于等高线阈值的信号值,结果记为峰体积特征,若谱峰未在图谱中出现,以上两种特征均记作0。
4.根据权利要求1所述的气相离子迁移谱数据谱峰自动识别方法,其特征在于,所述的谱峰整合包括如下过程:将每个待测样本定位得到的谱峰中心点坐标,按照先保留时间后迁移时间的顺序从小到大排列输入一个数据集;从头开始依次计算第n和第n+1个坐标数据差值,若差值同时小于保留时间和迁移时间设定的阈值,则顺序读取所有坐标数据;若任意一个差值大于设定阈值,停止读取并对第n个及其之前的所有坐标数据求平均值,同时记为整合后的谱峰位置;自第n+1个坐标数据开始,继续并循环以上两个步骤,直至所有谱峰整合完毕。
CN202110704471.0A 2021-06-24 2021-06-24 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法 Active CN113378755B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110704471.0A CN113378755B (zh) 2021-06-24 2021-06-24 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110704471.0A CN113378755B (zh) 2021-06-24 2021-06-24 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法

Publications (2)

Publication Number Publication Date
CN113378755A true CN113378755A (zh) 2021-09-10
CN113378755B CN113378755B (zh) 2022-06-24

Family

ID=77578878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110704471.0A Active CN113378755B (zh) 2021-06-24 2021-06-24 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法

Country Status (1)

Country Link
CN (1) CN113378755B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110019189A1 (en) * 2008-08-06 2011-01-27 Research Foundation Of The City University Of New York Sub-wavelength structures, devices and methods for light control in material composites
CN102928154A (zh) * 2012-11-27 2013-02-13 中国航天科技集团公司第五研究院第五一〇研究所 一种减小电子激励脱附中性粒子误差的极高真空测量方法
CN108403112A (zh) * 2018-04-02 2018-08-17 东北电力大学 基于嗅觉脑电波和gs-svm进行感官物质分类的方法
KR20180136817A (ko) * 2017-06-15 2018-12-26 삼성웰스토리 주식회사 Gas Chromatography-Ion Mobility Spectrometry(GC-IMS) 냄새지문 및 다변량통계분석을 이용한 혼합참기름 판별법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110019189A1 (en) * 2008-08-06 2011-01-27 Research Foundation Of The City University Of New York Sub-wavelength structures, devices and methods for light control in material composites
CN102928154A (zh) * 2012-11-27 2013-02-13 中国航天科技集团公司第五研究院第五一〇研究所 一种减小电子激励脱附中性粒子误差的极高真空测量方法
KR20180136817A (ko) * 2017-06-15 2018-12-26 삼성웰스토리 주식회사 Gas Chromatography-Ion Mobility Spectrometry(GC-IMS) 냄새지문 및 다변량통계분석을 이용한 혼합참기름 판별법
CN108403112A (zh) * 2018-04-02 2018-08-17 东北电力大学 基于嗅觉脑电波和gs-svm进行感官物质分类的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SERGIO OLLER-MORENO ET AL.: "Adaptive Asymmetric Least Squares baseline estimation for analytical instruments", 《2014 IEEE 11TH INTERNATIONAL MULTI-CONFERENCE ON SYSTEMS, SIGNALS & DEVICES (SSD14)》, 1 May 2014 (2014-05-01), pages 1 - 5 *

Also Published As

Publication number Publication date
CN113378755B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN110441423A (zh) 一种测定粮食香气成分的方法及其系统
CN111044638A (zh) 一种对不同品种烤烟烟叶分类鉴别的方法
CN106682278B (zh) 基于图像处理的超声速流场预测准确度判定装置及方法
CN112578039B (zh) 一种燕窝中掺假物的分析鉴定方法
CN112345759A (zh) 一种用于荧光强度峰检测的方法
CN111060642A (zh) 一种对同品种不同产地烟叶分类鉴别的方法
CN111487213A (zh) 多光谱融合的化学需氧量测试方法及装置
CN108535354A (zh) 一种钢丝绳漏磁检测和磁发射检测的损伤判定及定位方法
CN114155200B (zh) 基于卷积神经网络的遥感影像变化检测方法
CN109115908B (zh) 基于层次聚类提取特征的切达奶酪身份的判别标识方法
CN114878544B (zh) 一种从混合物sers光谱中识别目标成分的方法
CN110231328B (zh) 一种基于半峰高距离法的拉曼光谱定量分析方法
CN113378755B (zh) 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法
CN114965409A (zh) 基于图像边缘检测特征提取的三维荧光光谱有机污染物识别方法
CN111505174A (zh) 一种鉴别真假烟的方法
CN113640445B (zh) 基于图像处理的特征峰识别方法及计算设备、存储介质
CN111521577B (zh) 一种以二氧化碳峰面积为参比的红外光谱定量分析方法
CN112180004A (zh) 一种利用声表面波气相色谱仪现场鉴别高挥发性中药材的方法
US10444206B2 (en) Chromatography/mass spectrometry data processing device
CN116242954A (zh) 一种呼气分子分析气相色谱数据的自动化分析方法与系统
CN112180003B (zh) 一种利用声表面波气相色谱仪现场鉴别中挥发性中药材的方法
CN112180002A (zh) 一种利用声表面波气相色谱仪现场鉴别低挥发性中药材的方法
CN113607850A (zh) 一种利用挥发性有机物分析鉴定小麦品种的方法
CN107590824B (zh) 基于三维图像处理技术的岩石颗粒识别及位移跟踪方法
CN113533551B (zh) 一种基于gc-ims的香米共享风味指纹谱的提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant