CN109271913B - 一种基于偏微分方程的maldi质谱峰检测方法 - Google Patents

一种基于偏微分方程的maldi质谱峰检测方法 Download PDF

Info

Publication number
CN109271913B
CN109271913B CN201811031626.3A CN201811031626A CN109271913B CN 109271913 B CN109271913 B CN 109271913B CN 201811031626 A CN201811031626 A CN 201811031626A CN 109271913 B CN109271913 B CN 109271913B
Authority
CN
China
Prior art keywords
maldi mass
mass spectrum
peak detection
fractional order
derivative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811031626.3A
Other languages
English (en)
Other versions
CN109271913A (zh
Inventor
李远禄
李俊
赵伟静
蒋民
周慧敏
孙双龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201811031626.3A priority Critical patent/CN109271913B/zh
Publication of CN109271913A publication Critical patent/CN109271913A/zh
Application granted granted Critical
Publication of CN109271913B publication Critical patent/CN109271913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/626Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas
    • G01N27/628Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas and a beam of energy, e.g. laser enhanced ionisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Optics & Photonics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Electrochemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种基于偏微分方程的MALDI质谱峰检测方法,该方法先对MALDI质谱信号做基线校正,接着用导数谱方法增强信号,然后用时间‑空间分数阶扩散方程求解去噪得到最终的平滑后的MALDI质谱信号,最后选择幅度阈值和局部极大值法做峰识别得到MALDI谱峰列表,具有更好的保峰去噪效果,使用便捷。

Description

一种基于偏微分方程的MALDI质谱峰检测方法
技术领域
本发明涉及一种质谱峰检测方法,尤其涉及一种基于偏微分方程的MALDI质谱峰检测方法。
背景技术
MALDI质谱(基质辅助激光解吸电离质谱)峰检测是谱峰信号处理中的重要环节,谱峰检测的结果会对信号的后续分析产生影响。由于实验环境和仪器分辨水平等因素的影响,一些低振幅的谱峰和重叠的谱峰可能被噪声掩埋,化学、电离和电子噪声等往往会导致曲线下降,使谱峰信号产生基线漂移。
近年来,随着计算机和信息技术的迅猛发展,信号处理技术应运而生并且得到了迅速发展,多种信号处理模型相继被用到MALDI质谱峰检测中,实现了谱峰信号的基线校正和平滑,并较准确地检测出质谱中峰的位置,传统方法包括PROCESS法、LMS法、LIMPIC法、Cromwell法和CWT法。
对于已经提出的模型,可以用一个通用步骤分解,如图1所示,步骤分为三步:基线校正,平滑和峰识别,其中,基线校正和平滑顺序可以调换。这样的步骤分解可以更好地阐明不同谱峰检测模型的基本原理,更重要的是,它可以清楚地比较现有谱峰检测模型之间的异同。
基线校正包括最小二乘拟合法、三次样条插值法和小波变换法;常用峰识别方法包括幅值法、一阶导数法、二阶导数法和局部极大值法。
平滑是谱峰检测中最重要的一个步骤,最简单的平滑方法是滑动均值滤波,即将相邻的奇数个点求平均值代替原中心点;Savitzky-Golay滤波目前被广泛使用,该方法是一种广义的滑动均值滤波方法,它将一小组连续数据点做最小二乘拟合,并将多项式拟合曲线的中心点作为输出,相比于滑动均值滤波法,该方法具有更好的保峰效果,然而去噪效果不够好;高斯滤波是对滑动均值滤波平滑窗口的改进方法,使用高斯函数作为平滑窗口,类似的,Kaiser提出了Kaiser滤波,使用Kaiser窗作为平滑窗口,这两种方法效率较高,然而其对峰的保护效果不强。频谱分析是信号平滑中的另一类方法,这类方法需要先将信号转换到频域,再对其作频谱分析。小波方法是目前最常用的频谱分析方法,该方法可以较好的保护信号特征,然而选择不同的小波基和尺度,信号处理的结果也会大相径庭。
在MALDI质谱的平滑方法上,传统方法都有一定的缺陷。因此,如何进一步提高平滑效果是MALDI质谱峰检测中的一个重要问题。
发明内容
发明目的:针对背景技术中所提到的对于MALDI质谱现有平滑方法的不足,本发明提出一种基于偏微分方程的新的平滑模型,在去噪的同时,进一步保护峰的特征。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于偏微分方程的MALDI质谱峰检测方法,包括步骤:
(1)输入待处理的MALDI质谱信号,并对MALDI质谱做基线校正;
(2)对校正后的信号f(x)使用导数谱方法作增强,将增强后的噪声信号作为分数阶扩散模型的初始信号u(x,0),经扩散后得到增强后的信号。由此得到时间-空间分数阶扩散导数谱模型,该模型如下公式(1)所示:
Figure BDA0001789887500000021
其中,x是空间长度,t是时间长度,c是增强系数,g[u(x,t)]是扩散函数,
Figure BDA0001789887500000022
λ是控制扩散强度的阈值,其取值范围为500-2000,α表示时间分数阶次,β表示空间分数阶次。设τ和h分别为时间和空间步长,k和i分别为时间和空间序列,则有
t0=0,t1=τ,…,tk=kτ,k=1,2,…,N,
x0=0,x1=h,…,xi=ih,i=1,2,…,M。
(3)对时间分数阶导数进行Caputo定义下的离散化,Caputo分数阶定义如下:
Figure BDA0001789887500000023
时间分数阶导数离散化可得
Figure BDA0001789887500000024
其中,
Figure BDA0001789887500000025
表示离散后的u(xi,tk),
Figure BDA0001789887500000026
(4)空间分数阶导数离散可由左导数和右导数平均得到,如下所示:
Figure BDA0001789887500000031
其中
Figure BDA0001789887500000032
Figure BDA0001789887500000033
分别是Riemann-Liouville分数阶定义的左导数和右导数,分别定义为:
Figure BDA0001789887500000034
Figure BDA0001789887500000035
根据上式定义,空间分数阶导数离散化可得
Figure BDA0001789887500000036
其中
Figure BDA0001789887500000037
Figure BDA0001789887500000038
(5)考虑到信号过长,矩阵的秩会因过大而影响运行效率,因此使用卷积运算,为保证去噪效果兼顾运行时间,卷积平滑窗口长度通常取7到21,本发明取11,由(1)(3)(7)得到差分方案如下:
Uk=Γ(3-α)ταg·(Uk-1*r)+Uk-1,k=1 (10)
Figure BDA0001789887500000039
其中
Figure BDA0001789887500000041
最后将该增强平滑模型作为MALDI质谱峰检测中平滑步骤的新方法。
(6)对通过分数阶扩散平滑最终获得的MALDI质谱信号做峰识别,峰识别方法可以选择幅度阈值和局部极大值法。
(7)输出峰识别得到的MALDI谱峰列表。
有益效果:与现有技术相比,本发明具有以下有益技术效果:1、在MALDI谱峰的平滑中增加了增强步骤,增强了谱峰中弱峰的高度和重叠峰的分离度;2、使用了一种新的平滑方法,该平滑方法对谱峰具有更好的保峰去噪效果;3、使用简便,检测效果更佳,具有更好的应用前景。
附图说明
图1是本发明的流程图;
图2是峰检测中基线校正示意图;
图3是峰检测中信号增强和去噪示意图;
图4是峰检测中对峰的识别示意图;
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,一种基于偏微分方程的MALDI质谱峰检测方法,包括以下步骤:
(1)输入待处理的MALDI质谱信号。
(2)对MALDI质谱做基线校正,可以选择三次样条插值法,如图2所示。
(3)对校正后的MALDI质谱作增强和去噪处理,如图3所示,具体包括如下步骤:
(31)对校正后的MALDI质谱作增强处理,使用下式的导数谱方法对其做增强:
F(x)=f(x)-c·f(x)(2)
f(x)是基线校正后的MALDI质谱信号,F(x)是增强后的MALDI质谱信号,c是增强系数,当增强系数过小,增强效果不明显,过大会导致信号噪声过大,使去噪效果较差,因此可根据实际需要在5到50之间取值,本发明中取20,通过该式可以得到增强后的质谱信号;
(32)使用下式对增强后的MALDI质谱做平滑处理:
Figure BDA0001789887500000051
其中,u(x,t)为第t次迭代后的信号,α是时间分数阶导数的阶次,β是空间分数阶导数的阶次,F(x)是在区间[0,L]上的初始信号,也是本发明中增强后的MALDI质谱信号,g[u(x,t)]是扩散函数,
Figure BDA0001789887500000052
λ是控制扩散强度的阈值,当阈值过大时,去噪效果较好,然而保峰效果较差,当阈值过小时则相反,本发明适合的阈值范围为500-2000。
利用有限差分法对时间—空间分数阶扩散方程进行数值算法:设τ和h分别为时间和空间步长,k和i分别为时间和空间序列,则有
t0=0,t1=τ,…,tk=kτ,k=1,2,…,N,
x0=0,x1=h,…,xi=ih,i=1,2,…,M。
对于α阶的时间分数阶导数定义如下:
Figure BDA0001789887500000053
它的离散形式为:
Figure BDA0001789887500000054
其中,
Figure BDA0001789887500000055
表示离散后的u(xi,tk),
Figure BDA0001789887500000056
对于β阶的空间分数阶导数定义如下:空间分数阶离散可由左导数和右导数平均得到
Figure BDA0001789887500000057
其中
Figure BDA0001789887500000058
Figure BDA0001789887500000059
分别是Riemann-Liouville分数阶定义的左导数和右导数,分别定义为:
Figure BDA0001789887500000061
Figure BDA0001789887500000062
根据上式定义,空间分数阶导数离散化可得
Figure BDA0001789887500000063
其中
Figure BDA0001789887500000064
Figure BDA0001789887500000065
则其显式差分算法结果为:
Figure BDA0001789887500000066
Figure BDA0001789887500000067
其中
Figure BDA0001789887500000068
考虑到信号过长,矩阵
Figure BDA0001789887500000069
的秩会过大,影响运行效率,用卷积代替矩阵作运算,卷积平滑窗口长度的选取既要保证去噪效果,也要保证运行时间,因此通常取7到21,本发明取11,如下式所示:
Uk=Γ(3-α)ταg·(Uk-1*r)+Uk-1,k=1
Figure BDA00017898875000000610
其中
Figure BDA0001789887500000071
通过上述数值算法对时间—空间分数阶扩散方程进行求解,所求的数值解即为扩散后的结果,也就是最终的平滑后的MALDI质谱信号,本次示例α取1.05,β取2.6,τ取0.25,λ取1000,迭代次数取90。
(4)对通过分数阶扩散平滑最终获得的MALDI质谱信号做峰识别,峰识别方法可以选择幅度阈值和局部极大值法,如图4所示。
(5)输出峰识别得到的MALDI谱峰列表。

Claims (6)

1.一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于包括步骤:
(1)输入待处理的MALDI质谱信号,并对MALDI质谱做基线校正;
(2)对校正后的信号f(x),使用下式的导数谱方法对其做增强:
F(x)=f(x)-c·f(x)(2)
f(x)是基线校正后的MALDI质谱信号,F(x)是增强后的MALDI质谱信号,c是增强系数,将增强后的噪声信号作为分数阶扩散模型的初始信号u(x,0),经扩散后得到增强后的信号,由此得到时间-空间分数阶扩散导数谱模型,其中,x是空间长度;所述的时间-空间分数阶扩散导数谱模型如下公式:
Figure FDA0003417517360000011
其中,t是时间长度,c是增强系数,g[u(x,t)]是扩散函数,如下公式:
Figure FDA0003417517360000012
t0=0,t1=τ,…,tk=kτ,k=1,2,…,N,
x0=0,x1=h,…,xi=ih,i=1,2,…,M,
λ是控制扩散强度的阈值,其取值范围为500-2000,α表示时间分数阶次,β表示空间分数阶次,τ和h分别为时间和空间步长,k和i分别为时间和空间序列,M由质谱信号长度确定,N由去噪保峰效果确定;
(3)对时间分数阶导数进行基于Caputo分数阶定义的离散化;
(4)对空间分数阶导数进行基于Riemann-Liouville分数阶定义的离散化;
(5)使用卷积运算,得到可保证运行效率的增强平滑的有限差分方法,即作为MALDI质谱峰检测中平滑步骤的方法;
(6)对通过分数阶扩散平滑最终获得的MALDI质谱信号做峰识别;
(7)输出峰识别得到的MALDI谱峰列表。
2.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(1)中,所述的基线校正包括三次样条插值法。
3.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(3)中,所述的Caputo分数阶定义如下公式:
Figure FDA0003417517360000021
导数离散化可得:
Figure FDA0003417517360000022
其中,
Figure FDA0003417517360000023
表示离散后的u(xi,tk),k和i分别为时间和空间序列,
Figure FDA0003417517360000024
Figure FDA0003417517360000025
4.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(4)中,所述的空间分数阶导数的离散化如下公式:
Figure FDA0003417517360000026
其中
Figure FDA0003417517360000027
Figure FDA0003417517360000028
5.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(5)中,所述的差分方法如下:
Uk=Γ(3-α)ταg·(Uk-1*r)+Uk-1,k=1,
Figure FDA0003417517360000029
其中
Figure FDA0003417517360000031
6.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(6)中,所述的峰识别方法包括选择幅度阈值和局部极大值法。
CN201811031626.3A 2018-09-05 2018-09-05 一种基于偏微分方程的maldi质谱峰检测方法 Active CN109271913B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811031626.3A CN109271913B (zh) 2018-09-05 2018-09-05 一种基于偏微分方程的maldi质谱峰检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811031626.3A CN109271913B (zh) 2018-09-05 2018-09-05 一种基于偏微分方程的maldi质谱峰检测方法

Publications (2)

Publication Number Publication Date
CN109271913A CN109271913A (zh) 2019-01-25
CN109271913B true CN109271913B (zh) 2022-03-29

Family

ID=65187211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811031626.3A Active CN109271913B (zh) 2018-09-05 2018-09-05 一种基于偏微分方程的maldi质谱峰检测方法

Country Status (1)

Country Link
CN (1) CN109271913B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347813B (zh) * 2019-08-07 2024-07-09 顺丰科技有限公司 高信噪比时间序列的基线检测方法、设备及存储介质
CN110763913B (zh) * 2019-10-14 2022-02-01 南京信息工程大学 一种基于信号分段分类的导数谱平滑处理方法
CN113008874B (zh) * 2021-03-11 2022-07-26 合肥工业大学 基于基线校正和谱峰识别提升激光诱导击穿光谱技术定性检测能力的方法
CN113607679B (zh) * 2021-08-03 2022-05-27 浙大城市学院 一种基于离散极大值的太赫兹吸收峰位提取方法
CN114487072B (zh) * 2021-12-27 2024-04-12 浙江迪谱诊断技术有限公司 一种飞行时间质谱峰拟合方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008151153A1 (en) * 2007-06-02 2008-12-11 Cerno Bioscience Llc A self calibration approach for mass spectrometry
CN104457986A (zh) * 2014-10-23 2015-03-25 南京邮电大学 一种基于自适应正则化的光谱分辨率增强方法
CN107085840A (zh) * 2017-06-16 2017-08-22 南京信息工程大学 基于分数阶偏微分方程的图像去噪方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008151153A1 (en) * 2007-06-02 2008-12-11 Cerno Bioscience Llc A self calibration approach for mass spectrometry
CN104457986A (zh) * 2014-10-23 2015-03-25 南京邮电大学 一种基于自适应正则化的光谱分辨率增强方法
CN107085840A (zh) * 2017-06-16 2017-08-22 南京信息工程大学 基于分数阶偏微分方程的图像去噪方法

Also Published As

Publication number Publication date
CN109271913A (zh) 2019-01-25

Similar Documents

Publication Publication Date Title
CN109271913B (zh) 一种基于偏微分方程的maldi质谱峰检测方法
Morháč An algorithm for determination of peak regions and baseline elimination in spectroscopic data
CN105628645B (zh) 一种近红外分析模型的转移方法
CN106053430B (zh) 用于微量气体拉曼光谱检测基线校正的包络线迭代方法
Fu et al. A simple multi-scale Gaussian smoothing-based strategy for automatic chromatographic peak extraction
CN105069309B (zh) 一种识别水文时间序列非线性趋势的方法
US20150051843A1 (en) Systems and Methods to Process Data in Chromatographic Systems
CN105842190B (zh) 一种基于谱回归的近红外模型转移方法
Cook et al. Chemometrics for the analysis of chromatographic data in metabolomics investigations
CN110763913B (zh) 一种基于信号分段分类的导数谱平滑处理方法
CN112418072B (zh) 数据处理方法、装置、计算机设备和存储介质
Li et al. Time fractional super-diffusion model and its application in peak-preserving smoothing
CN105093315B (zh) 一种去除煤层强反射信号的方法
JP5447680B2 (ja) データ処理方法及び装置
JP6748085B2 (ja) 干渉検出および着目ピークのデコンボルーション
Samanipour et al. A two stage algorithm for target and suspect analysis of produced water via gas chromatography coupled with high resolution time of flight mass spectrometry
CN110646841A (zh) 时变稀疏反褶积方法及系统
CN102542284B (zh) 辨识光谱的方法
CN111505709B (zh) 一种基于稀疏谱分解的衰减定性分析的方法
Zhu et al. Spectral restoration using semi-blind deconvolution method with detail-preserving regularization
ITMI20071107A1 (it) Metodo e sistema per rilevare picchi peptidici in segnali hplc-ms.
CN117290788A (zh) 一种基于改进小波变换算法的配电网故障辨识方法及系统
Li et al. Haar wavelet based implementation method of the non–integer order differentiation and its application to signal enhancement
Wang et al. Missing data recovery combined with Parallel factor analysis model for eliminating Rayleigh scattering in the process of detecting pesticide mixture
CN113610817B (zh) 一种特征峰识别方法及计算设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant