CN114487073B - 一种飞行时间核酸质谱数据校准方法 - Google Patents

一种飞行时间核酸质谱数据校准方法 Download PDF

Info

Publication number
CN114487073B
CN114487073B CN202111610052.7A CN202111610052A CN114487073B CN 114487073 B CN114487073 B CN 114487073B CN 202111610052 A CN202111610052 A CN 202111610052A CN 114487073 B CN114487073 B CN 114487073B
Authority
CN
China
Prior art keywords
time
mass
flight
nucleic acid
charge ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111610052.7A
Other languages
English (en)
Other versions
CN114487073A (zh
Inventor
相双红
叶圣军
徐杰
李璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dipu Diagnosis Technology Co ltd
Original Assignee
Zhejiang Dipu Diagnosis Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dipu Diagnosis Technology Co ltd filed Critical Zhejiang Dipu Diagnosis Technology Co ltd
Priority to CN202111610052.7A priority Critical patent/CN114487073B/zh
Publication of CN114487073A publication Critical patent/CN114487073A/zh
Application granted granted Critical
Publication of CN114487073B publication Critical patent/CN114487073B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种飞行时间核酸质谱数据校准方法,包括:将获取到的飞行时间核酸质谱原始信号数据(Ii,ti)根据飞行时间质谱仪特有物理参数建立时间t与质荷比m/z的一次映射关系然后按照一定间隔长度进行分段,将符合条件的飞行时间核酸质谱一次映射信号数据点(Iij,m/zij)作为侯选峰,对候选峰进行高斯拟合,将高斯拟合后的候选峰的质荷比与期望峰的质荷比做差,当两者的差值绝对值小于特定值时,该候选峰确定为目标峰;利用目标峰求解得到时间与质荷比的二次映射关系,将飞行时间核酸质谱原始信号数据(Ii,ti)中的ti根据二次映射关系全部转化为质荷比m/zi,得到校准后的飞行时间核酸质谱数据(Ii,m/zi);本发明经过时间与质荷比的两次映射,极大的提高飞行时间核酸质谱数据的准确性和可靠性。

Description

一种飞行时间核酸质谱数据校准方法
技术领域
本发明属于质谱数据预处理以及信息提取技术领域,具体涉及一种飞行时间核酸质谱数据校准方法。
背景技术
在核酸质谱系统实验中,化合物离子的质荷比m/z测定的准确性决定了整台质谱仪性能是否优良,但质荷比m/z的测定会受到如环境温度湿度、样品量、电磁干扰、系统噪音等多种因素影响,从而导致质荷比m/z的偏移甚至失真。同时也会给质谱图产生较大的噪音,很难识别质谱峰的准确位置。
现有的质谱数据校准方法,通常首先要校正基线,然后再滤波去噪,但在去噪的过程中,由于噪音的复杂性会人为的降低目标峰的高度,进而降低了质谱的信噪比,同时由于去噪算法的影响,真实化合物离子的质荷比m/z会有所偏移,导致校准结果的不够准确,校准精度不足。
发明内容
发明目的:为解决现有质谱数据校准方法存在的校准结果不准确、校准精度不足等问题,本发明提出了一种新的飞行时间核酸质谱数据校准方法。
技术方案:一种飞行时间核酸质谱数据校准方法,包括以下步骤:
步骤1:获取飞行时间核酸质谱原始信号数据(Ii,ti),根据飞行时间质谱仪特有物理参数建立时间ti与质荷比m/zi的一次映射关系,将数据(Ii,ti)整理成一次映射信号数据(Ii,m/zi);其中,Ii表示离子强度,ti表示离子飞行时间,m/zi为一次映射离子质荷比, i表示采样点,i∈{1,2,3,…,n};
步骤2:将一次映射信号数据(Ii,m/zi)按照一定间隔长度进行分段,对于第j分段内第i采样点,获取其离子强度Iij,并计算离子强度Iij的一阶导数I′ij;选取符合以下条件的一次映射信号数据(Iij,m/zij):
式中,表示第j分段的强度阈值,/>为第j分段的强度阈值/>的二阶导数阈值,I′(i+1)j为第j分段内第i+1采样点的离子强度I(i+1)j的一阶导数I′(i+1)j
将符合以上条件的一次映射信号数据(Iij,m/zij)作为侯选峰位置;
步骤3:对步骤2得到的候选峰进行高斯拟合,将高斯拟合后的候选峰的质荷比m/zi与预设的期望峰的质荷比m/zexp做差,当两者的差值绝对值Δ小于特定值时,该候选峰确定为目标峰;
Δ=|m/zi-m/zexp|<特定值 (5)
步骤4:利用步骤3确定的目标峰的质荷比和对应的时间,求解飞行时间核酸质谱原始信号数据(Ii,ti)中时间ti与质荷比m/z的二次映射关系中的系数D、系数E和系数 F:
步骤5:将步骤1获取的飞行时间核酸质谱原始信号数据(Ii,ti)中的ti根据二次映射关系全部转化为质荷比m/zi,得到校准后的飞行时间核酸质谱数据(Ii,m/zi)。
进一步的,采用中心差分算法,计算得到离子强度Iij的一阶导数I′ij
进一步的,根据下式计算得到第j分段的强度阈值
式中,为第j分段内离子强度的平均值;σj为第j分段内离子强度的标准差;c为离子强度阈值系数;
根据下式计算得到第j分段的强度阈值的二阶导数阈值/>
式中,d为特定系数;Hj和Wj分别为第j分段内峰高最小的特征峰的峰高和半高全宽。
进一步的,所述的一次映射关系,表示为:
式中,A、B和C均为飞行时间质谱仪特有物理参数,为已知参数。
进一步的,采用最小二乘法对步骤2得到的候选峰进行高斯拟合。
有益效果:本发明的飞行时间核酸质谱数据校准方法,无需校准基线和滤波去噪,直接对质谱的原始数据进行处理,从而可以得到较高精度和准确度的质荷比m/z,极大的提高飞行时间核酸质谱数据的准确性和可靠性。
具体实施方式
现结合实施例对本发明的技术方案做进一步说明。
本发明的一种飞行时间核酸质谱数据校准方法,主要包括以下步骤:
S100:获取飞行时间核酸质谱原始信号数据(Ii,ti),其中,Ii表示离子强度也称为离子丰度,ti表示离子飞行时间,与Ii离子强度一一对应,i表示采样点,i∈{1,2,3,…,n}。
S200:根据飞行时间质谱仪特有物理参数建立飞行时间核酸质谱原始信号中时间t 与质荷比m/z特定的一次映射关系:
具体求解A、B和C:
式中,m/z1、m/z2和m/z3为已知设计参考品特征峰的质量,t1、t2和t3为飞行时间质谱仪对已知三个特征峰进行分析得到对应的时间,求解方程组从而计算出A、B和 C三个参数值,设计参考品特征峰数量大于等于3个,优选3个。
S300:飞行时间核酸质谱原始信号数据(Ii,ti)根据一次映射关系整理成一次映射信号数据(Ii,m/zi);m/zi为一次映射离子质荷比,i表示采样点,i∈{1,2,3,…,n};将整条一次映射信号数据(Ii,m/zi)按照一定间隔长度进行分段,对于第j分段内第i采样点, j∈{1,2,3,…,n},在第j分段内寻找离子强度Iij过零点的一阶导数I′ij,该一阶导数I′ij对应的原始信号强度质荷比为m/zij,即为可能的候选峰位置,其中,离子强度Iij的一阶导数I′ij使用中心差分方法进行求解;
S400:对于第j分段,根据下式计算得到第j分段的强度阈值和二阶导数阈值/>
式中,为第j分段内离子强度的平均值;σj为第j分段内离子强度的标准差;c为离子强度阈值系数c∈{1,2,3},优选为2;d为特定系数取值为2;Hj和Wj分别是第j分段内峰高最小的特征峰的峰高和半高全宽,当很难评估出Hj和Wj时,可取值为0;
S500:将符合式(4)的离子强度Iij选取出来,将(Iij,m/zij)作为候选峰位置;
S600:采用Levenberg-Marquardt算法、单纯性算法或信赖与反射算法等最小二乘法对S500寻找到的候选峰进行高斯拟合,得到拟合后的候选峰,将拟合后的候选峰的质荷比m/zi与期望峰(样品设计期望的峰)的质荷比m/zexp进行比较,当两者的差值绝对值Δ小于特定值时,此候选峰即为目标峰;
Δ=|m/zi-m/zexp|<特定值 (5)
S700:将S600确定的目标峰的质荷比和对应的时间带入到飞行时间核酸质谱原始信号数据(Ii,ti)中时间ti与质荷比m/z的二次映射关系(式(6))中,求解得到D、E和 F;
S800:将S200获取的飞行时间核酸质谱原始信号数据(Ii,ti)中的ti根据二次映射关系全部转化为质荷比m/zi,从而得到校准后的飞行时间核酸质谱数据(Ii,m/zi)。
有上述步骤可知,本发明无需对原始信号数据进行降噪,也就避免了质谱峰的失真;并经过时间t与质荷比m/z的两次映射,可以得到较高精度和准确度的质荷比m/z,极大的提高飞行时间核酸质谱数据的准确性和可靠性。

Claims (3)

1.一种飞行时间核酸质谱数据校准方法,其特征在于:包括以下步骤:
步骤1:获取飞行时间核酸质谱原始信号数据(Ii,ti),根据飞行时间质谱仪特有物理参数建立时间ti与质荷比m/zi的一次映射关系,将数据(Ii,ti)整理成一次映射信号数据(Ii,m/zi);其中,Ii表示离子强度,ti表示离子飞行时间,m/zi为一次映射离子质荷比,i表示采样点,i∈{1,2,3,…,n};
所述的一次映射关系,表示为:
式中,A、B和C均为飞行时间质谱仪特有物理参数;
按照下式求解得到A、B和C:
式中,m/z1、m/z2和m/z3为已知设计参考品特征峰的质量,t1、t2和t3为飞行时间质谱仪对已知三个特征峰进行分析得到对应的时间,求解方程组从而计算出A、B和C三个参数值;
步骤2:将一次映射信号数据(Ii,m/zi)按照一定间隔长度进行分段,对于第j分段内第i采样点,获取其离子强度Iij,并计算离子强度Iij的一阶导数I′ij;选取符合以下条件的一次映射信号数据(Iij,m/zij):
式中,表示第j分段的强度阈值,/>为第j分段的强度阈值/>的二阶导数阈值,I′(i+1)j为第j分段内第i+1采样点的离子强度I(i+1)j的一阶导数I′(i+1)j
根据下式计算得到第j分段的强度阈值
式中,为第j分段内离子强度的平均值;σj为第j分段内离子强度的标准差;c为离子强度阈值系数c∈{1,2,3};
根据下式计算得到第j分段的强度阈值的二阶导数阈值/>
式中,d为特定系数,取值为2;Hj和Wj分别为第j分段内峰高最小的特征峰的峰高和半高全宽;
将符合以上条件的一次映射信号数据(Iij,m/zij)作为侯选峰位置;
步骤3:对步骤2得到的候选峰进行高斯拟合,将高斯拟合后的候选峰的质荷比m/zi与预设的期望峰的质荷比m/zexp做差,当两者的差值绝对值Δ小于特定值时,该候选峰确定为目标峰;
Δ=|m/zi-m/zexp|<特定值 (5)
步骤4:利用步骤3确定的目标峰的质荷比和对应的时间,求解飞行时间核酸质谱原始信号数据(Ii,ti)中时间ti与质荷比m/z的二次映射关系中的系数D、系数E和系数F:
步骤5:将步骤1获取的飞行时间核酸质谱原始信号数据(Ii,ti)中的ti根据二次映射关系全部转化为质荷比m/zi,得到校准后的飞行时间核酸质谱数据(Ii,m/zi)。
2.根据权利要求1所述的一种飞行时间核酸质谱数据校准方法,其特征在于:采用中心差分算法,计算得到离子强度Iij的一阶导数I′ij
3.根据权利要求1所述的一种飞行时间核酸质谱数据校准方法,其特征在于:采用最小二乘法对步骤2得到的候选峰进行高斯拟合。
CN202111610052.7A 2021-12-27 2021-12-27 一种飞行时间核酸质谱数据校准方法 Active CN114487073B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111610052.7A CN114487073B (zh) 2021-12-27 2021-12-27 一种飞行时间核酸质谱数据校准方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111610052.7A CN114487073B (zh) 2021-12-27 2021-12-27 一种飞行时间核酸质谱数据校准方法

Publications (2)

Publication Number Publication Date
CN114487073A CN114487073A (zh) 2022-05-13
CN114487073B true CN114487073B (zh) 2024-04-12

Family

ID=81496451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111610052.7A Active CN114487073B (zh) 2021-12-27 2021-12-27 一种飞行时间核酸质谱数据校准方法

Country Status (1)

Country Link
CN (1) CN114487073B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115020187B (zh) * 2022-07-19 2022-11-01 广东省麦思科学仪器创新研究院 Maldi-tof ms及其飞行时间校准方法
CN116106396B (zh) * 2023-04-13 2023-06-27 杭州汇健科技有限公司 质谱数据的全谱拟合动态校正方法、装置、介质及质谱仪
CN116660358B (zh) * 2023-08-01 2023-11-24 浙江迪谱诊断技术有限公司 一种高分辨飞行时间质谱检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011033346A (ja) * 2009-07-29 2011-02-17 Shimadzu Corp クロマトグラフ質量分析データ解析方法及び装置
CN104316591A (zh) * 2014-09-25 2015-01-28 杭州电子科技大学 一种基于非线性拟合方式的肽质谱峰特征参数提取方法
CN110231328A (zh) * 2019-05-27 2019-09-13 湖南农业大学 一种基于半峰高距离法的拉曼光谱定量分析技术
CN111325121A (zh) * 2020-02-10 2020-06-23 浙江迪谱诊断技术有限公司 一种核酸质谱数值处理方法
CN112444556A (zh) * 2020-09-27 2021-03-05 浙江迪谱诊断技术有限公司 一种飞行时间核酸质谱参数确定方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010046731B4 (de) * 2010-09-28 2015-07-02 Bruker Daltonik Gmbh Kalibrierfunktion für Flugzeitmassenspektrometer höchster Massengenauigkeit
WO2012073322A1 (ja) * 2010-11-30 2012-06-07 株式会社島津製作所 質量分析データ処理装置
JP5967078B2 (ja) * 2011-04-04 2016-08-10 株式会社島津製作所 質量分析装置及び質量分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011033346A (ja) * 2009-07-29 2011-02-17 Shimadzu Corp クロマトグラフ質量分析データ解析方法及び装置
CN104316591A (zh) * 2014-09-25 2015-01-28 杭州电子科技大学 一种基于非线性拟合方式的肽质谱峰特征参数提取方法
CN110231328A (zh) * 2019-05-27 2019-09-13 湖南农业大学 一种基于半峰高距离法的拉曼光谱定量分析技术
CN111325121A (zh) * 2020-02-10 2020-06-23 浙江迪谱诊断技术有限公司 一种核酸质谱数值处理方法
CN112444556A (zh) * 2020-09-27 2021-03-05 浙江迪谱诊断技术有限公司 一种飞行时间核酸质谱参数确定方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
气溶胶飞行时间质谱仪单颗粒质谱偏移问题及其纠正算法;王新宁;陈宏;杨帆;杨新;;质谱学报(03);全文 *

Also Published As

Publication number Publication date
CN114487073A (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN114487073B (zh) 一种飞行时间核酸质谱数据校准方法
EP4016379B1 (en) Nucleic acid mass spectrum numerical processing method
CN117349683B (zh) 基于光谱数据的汽车配件涂装色差异常检测系统
CN111307751A (zh) 茶叶近红外光谱分析中谱图基线校正方法、系统、检测方法
CN111812190B (zh) 生物样品的复杂质谱数据的评估方法
CN114487072B (zh) 一种飞行时间质谱峰拟合方法
CN111141809B (zh) 一种基于非接触式电导信号的土壤养分离子含量检测方法
US8306758B2 (en) Systems and methods for maintaining the precision of mass measurement
CN116106396B (zh) 质谱数据的全谱拟合动态校正方法、装置、介质及质谱仪
CN111337452A (zh) 一种验证光谱数据模型转移算法可行性的方法
CN114330553B (zh) 基于监督学习的数字采集系统校准方法
CN114998329B (zh) 一种电子通讯设备射频屏蔽罩的精密冲压质量分析系统
CN109655842B (zh) 一种基于相关小波重构的高光谱热红外发射率反演方法
CN114577360B (zh) 一种拉曼测温雷达信号自动分析校准及反演方法
CN115372945A (zh) 一种基于同质目标的高光谱激光雷达距离效应校正的方法
US20070045529A1 (en) Mass spectrometry data analysis engine
CN117554545B (zh) 基于弱监督在线学习的质谱校正方法和装置
CN116678840B (zh) 一种水性低温耐腐蚀性涂料成分分析方法
US20230386811A1 (en) A method of calibrating a mass spectrometer
CN115015162A (zh) 近红外光谱模型匹配方法
CN117576487A (zh) 一种基于可变形卷积的探地雷达空洞目标智能识别方法
CN118225240A (zh) 一种超光谱分辨率光谱仪微弱信号的ils测量方法
CN113762759A (zh) 一种适用于食品检测的多指标系统评价方法
CN116879909A (zh) 基于激光测距的高海拔地区土方开挖标高快速测量方法
CN117497082A (zh) 一种基于xrf光谱仪合金牌号鉴定的智能方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Xiang Shuanghong

Inventor after: Ye Shengjun

Inventor after: Xu Jie

Inventor after: Li Xuan

Inventor before: Ye Shengjun

Inventor before: Xu Jie

Inventor before: Li Xuan

Inventor before: Xiang Shuanghong

GR01 Patent grant
GR01 Patent grant