CN109271913B - 一种基于偏微分方程的maldi质谱峰检测方法 - Google Patents
一种基于偏微分方程的maldi质谱峰检测方法 Download PDFInfo
- Publication number
- CN109271913B CN109271913B CN201811031626.3A CN201811031626A CN109271913B CN 109271913 B CN109271913 B CN 109271913B CN 201811031626 A CN201811031626 A CN 201811031626A CN 109271913 B CN109271913 B CN 109271913B
- Authority
- CN
- China
- Prior art keywords
- maldi mass
- mass spectrum
- peak detection
- fractional order
- derivative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001869 matrix assisted laser desorption--ionisation mass spectrum Methods 0.000 title claims abstract description 37
- 238000001514 detection method Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000009792 diffusion process Methods 0.000 claims abstract description 18
- 238000012937 correction Methods 0.000 claims abstract description 12
- 238000001228 spectrum Methods 0.000 claims abstract description 8
- 230000002708 enhancing effect Effects 0.000 claims abstract description 3
- 238000009499 grossing Methods 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 12
- 238000000816 matrix-assisted laser desorption--ionisation Methods 0.000 claims description 8
- 238000004949 mass spectrometry Methods 0.000 claims description 7
- 238000001819 mass spectrum Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011430 maximum method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
- G01N27/626—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas
- G01N27/628—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode using heat to ionise a gas and a beam of energy, e.g. laser enhanced ionisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Optics & Photonics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Electrochemistry (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种基于偏微分方程的MALDI质谱峰检测方法,该方法先对MALDI质谱信号做基线校正,接着用导数谱方法增强信号,然后用时间‑空间分数阶扩散方程求解去噪得到最终的平滑后的MALDI质谱信号,最后选择幅度阈值和局部极大值法做峰识别得到MALDI谱峰列表,具有更好的保峰去噪效果,使用便捷。
Description
技术领域
本发明涉及一种质谱峰检测方法,尤其涉及一种基于偏微分方程的MALDI质谱峰检测方法。
背景技术
MALDI质谱(基质辅助激光解吸电离质谱)峰检测是谱峰信号处理中的重要环节,谱峰检测的结果会对信号的后续分析产生影响。由于实验环境和仪器分辨水平等因素的影响,一些低振幅的谱峰和重叠的谱峰可能被噪声掩埋,化学、电离和电子噪声等往往会导致曲线下降,使谱峰信号产生基线漂移。
近年来,随着计算机和信息技术的迅猛发展,信号处理技术应运而生并且得到了迅速发展,多种信号处理模型相继被用到MALDI质谱峰检测中,实现了谱峰信号的基线校正和平滑,并较准确地检测出质谱中峰的位置,传统方法包括PROCESS法、LMS法、LIMPIC法、Cromwell法和CWT法。
对于已经提出的模型,可以用一个通用步骤分解,如图1所示,步骤分为三步:基线校正,平滑和峰识别,其中,基线校正和平滑顺序可以调换。这样的步骤分解可以更好地阐明不同谱峰检测模型的基本原理,更重要的是,它可以清楚地比较现有谱峰检测模型之间的异同。
基线校正包括最小二乘拟合法、三次样条插值法和小波变换法;常用峰识别方法包括幅值法、一阶导数法、二阶导数法和局部极大值法。
平滑是谱峰检测中最重要的一个步骤,最简单的平滑方法是滑动均值滤波,即将相邻的奇数个点求平均值代替原中心点;Savitzky-Golay滤波目前被广泛使用,该方法是一种广义的滑动均值滤波方法,它将一小组连续数据点做最小二乘拟合,并将多项式拟合曲线的中心点作为输出,相比于滑动均值滤波法,该方法具有更好的保峰效果,然而去噪效果不够好;高斯滤波是对滑动均值滤波平滑窗口的改进方法,使用高斯函数作为平滑窗口,类似的,Kaiser提出了Kaiser滤波,使用Kaiser窗作为平滑窗口,这两种方法效率较高,然而其对峰的保护效果不强。频谱分析是信号平滑中的另一类方法,这类方法需要先将信号转换到频域,再对其作频谱分析。小波方法是目前最常用的频谱分析方法,该方法可以较好的保护信号特征,然而选择不同的小波基和尺度,信号处理的结果也会大相径庭。
在MALDI质谱的平滑方法上,传统方法都有一定的缺陷。因此,如何进一步提高平滑效果是MALDI质谱峰检测中的一个重要问题。
发明内容
发明目的:针对背景技术中所提到的对于MALDI质谱现有平滑方法的不足,本发明提出一种基于偏微分方程的新的平滑模型,在去噪的同时,进一步保护峰的特征。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种基于偏微分方程的MALDI质谱峰检测方法,包括步骤:
(1)输入待处理的MALDI质谱信号,并对MALDI质谱做基线校正;
(2)对校正后的信号f(x)使用导数谱方法作增强,将增强后的噪声信号作为分数阶扩散模型的初始信号u(x,0),经扩散后得到增强后的信号。由此得到时间-空间分数阶扩散导数谱模型,该模型如下公式(1)所示:
其中,x是空间长度,t是时间长度,c是增强系数,g[u(x,t)]是扩散函数,
λ是控制扩散强度的阈值,其取值范围为500-2000,α表示时间分数阶次,β表示空间分数阶次。设τ和h分别为时间和空间步长,k和i分别为时间和空间序列,则有
t0=0,t1=τ,…,tk=kτ,k=1,2,…,N,
x0=0,x1=h,…,xi=ih,i=1,2,…,M。
(3)对时间分数阶导数进行Caputo定义下的离散化,Caputo分数阶定义如下:
时间分数阶导数离散化可得
(4)空间分数阶导数离散可由左导数和右导数平均得到,如下所示:
根据上式定义,空间分数阶导数离散化可得
其中
(5)考虑到信号过长,矩阵的秩会因过大而影响运行效率,因此使用卷积运算,为保证去噪效果兼顾运行时间,卷积平滑窗口长度通常取7到21,本发明取11,由(1)(3)(7)得到差分方案如下:
Uk=Γ(3-α)ταg·(Uk-1*r)+Uk-1,k=1 (10)
其中
最后将该增强平滑模型作为MALDI质谱峰检测中平滑步骤的新方法。
(6)对通过分数阶扩散平滑最终获得的MALDI质谱信号做峰识别,峰识别方法可以选择幅度阈值和局部极大值法。
(7)输出峰识别得到的MALDI谱峰列表。
有益效果:与现有技术相比,本发明具有以下有益技术效果:1、在MALDI谱峰的平滑中增加了增强步骤,增强了谱峰中弱峰的高度和重叠峰的分离度;2、使用了一种新的平滑方法,该平滑方法对谱峰具有更好的保峰去噪效果;3、使用简便,检测效果更佳,具有更好的应用前景。
附图说明
图1是本发明的流程图;
图2是峰检测中基线校正示意图;
图3是峰检测中信号增强和去噪示意图;
图4是峰检测中对峰的识别示意图;
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,一种基于偏微分方程的MALDI质谱峰检测方法,包括以下步骤:
(1)输入待处理的MALDI质谱信号。
(2)对MALDI质谱做基线校正,可以选择三次样条插值法,如图2所示。
(3)对校正后的MALDI质谱作增强和去噪处理,如图3所示,具体包括如下步骤:
(31)对校正后的MALDI质谱作增强处理,使用下式的导数谱方法对其做增强:
F(x)=f(x)-c·f(x)(2)
f(x)是基线校正后的MALDI质谱信号,F(x)是增强后的MALDI质谱信号,c是增强系数,当增强系数过小,增强效果不明显,过大会导致信号噪声过大,使去噪效果较差,因此可根据实际需要在5到50之间取值,本发明中取20,通过该式可以得到增强后的质谱信号;
(32)使用下式对增强后的MALDI质谱做平滑处理:
其中,u(x,t)为第t次迭代后的信号,α是时间分数阶导数的阶次,β是空间分数阶导数的阶次,F(x)是在区间[0,L]上的初始信号,也是本发明中增强后的MALDI质谱信号,g[u(x,t)]是扩散函数,λ是控制扩散强度的阈值,当阈值过大时,去噪效果较好,然而保峰效果较差,当阈值过小时则相反,本发明适合的阈值范围为500-2000。
利用有限差分法对时间—空间分数阶扩散方程进行数值算法:设τ和h分别为时间和空间步长,k和i分别为时间和空间序列,则有
t0=0,t1=τ,…,tk=kτ,k=1,2,…,N,
x0=0,x1=h,…,xi=ih,i=1,2,…,M。
对于α阶的时间分数阶导数定义如下:
它的离散形式为:
对于β阶的空间分数阶导数定义如下:空间分数阶离散可由左导数和右导数平均得到
根据上式定义,空间分数阶导数离散化可得
其中
则其显式差分算法结果为:
其中
Uk=Γ(3-α)ταg·(Uk-1*r)+Uk-1,k=1
其中
通过上述数值算法对时间—空间分数阶扩散方程进行求解,所求的数值解即为扩散后的结果,也就是最终的平滑后的MALDI质谱信号,本次示例α取1.05,β取2.6,τ取0.25,λ取1000,迭代次数取90。
(4)对通过分数阶扩散平滑最终获得的MALDI质谱信号做峰识别,峰识别方法可以选择幅度阈值和局部极大值法,如图4所示。
(5)输出峰识别得到的MALDI谱峰列表。
Claims (6)
1.一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于包括步骤:
(1)输入待处理的MALDI质谱信号,并对MALDI质谱做基线校正;
(2)对校正后的信号f(x),使用下式的导数谱方法对其做增强:
F(x)=f(x)-c·f(x)(2)
f(x)是基线校正后的MALDI质谱信号,F(x)是增强后的MALDI质谱信号,c是增强系数,将增强后的噪声信号作为分数阶扩散模型的初始信号u(x,0),经扩散后得到增强后的信号,由此得到时间-空间分数阶扩散导数谱模型,其中,x是空间长度;所述的时间-空间分数阶扩散导数谱模型如下公式:
其中,t是时间长度,c是增强系数,g[u(x,t)]是扩散函数,如下公式:
t0=0,t1=τ,…,tk=kτ,k=1,2,…,N,
x0=0,x1=h,…,xi=ih,i=1,2,…,M,
λ是控制扩散强度的阈值,其取值范围为500-2000,α表示时间分数阶次,β表示空间分数阶次,τ和h分别为时间和空间步长,k和i分别为时间和空间序列,M由质谱信号长度确定,N由去噪保峰效果确定;
(3)对时间分数阶导数进行基于Caputo分数阶定义的离散化;
(4)对空间分数阶导数进行基于Riemann-Liouville分数阶定义的离散化;
(5)使用卷积运算,得到可保证运行效率的增强平滑的有限差分方法,即作为MALDI质谱峰检测中平滑步骤的方法;
(6)对通过分数阶扩散平滑最终获得的MALDI质谱信号做峰识别;
(7)输出峰识别得到的MALDI谱峰列表。
2.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(1)中,所述的基线校正包括三次样条插值法。
6.根据权利要求1所述的一种基于偏微分方程的MALDI质谱峰检测方法,其特征在于:在步骤(6)中,所述的峰识别方法包括选择幅度阈值和局部极大值法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811031626.3A CN109271913B (zh) | 2018-09-05 | 2018-09-05 | 一种基于偏微分方程的maldi质谱峰检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811031626.3A CN109271913B (zh) | 2018-09-05 | 2018-09-05 | 一种基于偏微分方程的maldi质谱峰检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109271913A CN109271913A (zh) | 2019-01-25 |
CN109271913B true CN109271913B (zh) | 2022-03-29 |
Family
ID=65187211
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811031626.3A Active CN109271913B (zh) | 2018-09-05 | 2018-09-05 | 一种基于偏微分方程的maldi质谱峰检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109271913B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347813B (zh) * | 2019-08-07 | 2024-07-09 | 顺丰科技有限公司 | 高信噪比时间序列的基线检测方法、设备及存储介质 |
CN110763913B (zh) * | 2019-10-14 | 2022-02-01 | 南京信息工程大学 | 一种基于信号分段分类的导数谱平滑处理方法 |
CN113008874B (zh) * | 2021-03-11 | 2022-07-26 | 合肥工业大学 | 基于基线校正和谱峰识别提升激光诱导击穿光谱技术定性检测能力的方法 |
CN113607679B (zh) * | 2021-08-03 | 2022-05-27 | 浙大城市学院 | 一种基于离散极大值的太赫兹吸收峰位提取方法 |
CN114487072B (zh) * | 2021-12-27 | 2024-04-12 | 浙江迪谱诊断技术有限公司 | 一种飞行时间质谱峰拟合方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008151153A1 (en) * | 2007-06-02 | 2008-12-11 | Cerno Bioscience Llc | A self calibration approach for mass spectrometry |
CN104457986A (zh) * | 2014-10-23 | 2015-03-25 | 南京邮电大学 | 一种基于自适应正则化的光谱分辨率增强方法 |
CN107085840A (zh) * | 2017-06-16 | 2017-08-22 | 南京信息工程大学 | 基于分数阶偏微分方程的图像去噪方法 |
-
2018
- 2018-09-05 CN CN201811031626.3A patent/CN109271913B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008151153A1 (en) * | 2007-06-02 | 2008-12-11 | Cerno Bioscience Llc | A self calibration approach for mass spectrometry |
CN104457986A (zh) * | 2014-10-23 | 2015-03-25 | 南京邮电大学 | 一种基于自适应正则化的光谱分辨率增强方法 |
CN107085840A (zh) * | 2017-06-16 | 2017-08-22 | 南京信息工程大学 | 基于分数阶偏微分方程的图像去噪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109271913A (zh) | 2019-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271913B (zh) | 一种基于偏微分方程的maldi质谱峰检测方法 | |
Morháč | An algorithm for determination of peak regions and baseline elimination in spectroscopic data | |
CN105628645B (zh) | 一种近红外分析模型的转移方法 | |
CN106053430B (zh) | 用于微量气体拉曼光谱检测基线校正的包络线迭代方法 | |
Fu et al. | A simple multi-scale Gaussian smoothing-based strategy for automatic chromatographic peak extraction | |
CN105069309B (zh) | 一种识别水文时间序列非线性趋势的方法 | |
US20150051843A1 (en) | Systems and Methods to Process Data in Chromatographic Systems | |
CN105842190B (zh) | 一种基于谱回归的近红外模型转移方法 | |
Cook et al. | Chemometrics for the analysis of chromatographic data in metabolomics investigations | |
CN110763913B (zh) | 一种基于信号分段分类的导数谱平滑处理方法 | |
CN112418072B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
Li et al. | Time fractional super-diffusion model and its application in peak-preserving smoothing | |
CN105093315B (zh) | 一种去除煤层强反射信号的方法 | |
JP5447680B2 (ja) | データ処理方法及び装置 | |
JP6748085B2 (ja) | 干渉検出および着目ピークのデコンボルーション | |
Samanipour et al. | A two stage algorithm for target and suspect analysis of produced water via gas chromatography coupled with high resolution time of flight mass spectrometry | |
CN110646841A (zh) | 时变稀疏反褶积方法及系统 | |
CN102542284B (zh) | 辨识光谱的方法 | |
CN111505709B (zh) | 一种基于稀疏谱分解的衰减定性分析的方法 | |
Zhu et al. | Spectral restoration using semi-blind deconvolution method with detail-preserving regularization | |
ITMI20071107A1 (it) | Metodo e sistema per rilevare picchi peptidici in segnali hplc-ms. | |
CN117290788A (zh) | 一种基于改进小波变换算法的配电网故障辨识方法及系统 | |
Li et al. | Haar wavelet based implementation method of the non–integer order differentiation and its application to signal enhancement | |
Wang et al. | Missing data recovery combined with Parallel factor analysis model for eliminating Rayleigh scattering in the process of detecting pesticide mixture | |
CN113610817B (zh) | 一种特征峰识别方法及计算设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |