CN112395983B - 一种质谱数据峰位置对齐方法及装置 - Google Patents

一种质谱数据峰位置对齐方法及装置 Download PDF

Info

Publication number
CN112395983B
CN112395983B CN202011289277.2A CN202011289277A CN112395983B CN 112395983 B CN112395983 B CN 112395983B CN 202011289277 A CN202011289277 A CN 202011289277A CN 112395983 B CN112395983 B CN 112395983B
Authority
CN
China
Prior art keywords
spectrogram
segment
spectrum
data
aligned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011289277.2A
Other languages
English (en)
Other versions
CN112395983A (zh
Inventor
王磊
李庆运
王东鉴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Berui Biotechnology Co ltd
Original Assignee
Shenzhen Berui Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Berui Biotechnology Co ltd filed Critical Shenzhen Berui Biotechnology Co ltd
Priority to CN202011289277.2A priority Critical patent/CN112395983B/zh
Publication of CN112395983A publication Critical patent/CN112395983A/zh
Application granted granted Critical
Publication of CN112395983B publication Critical patent/CN112395983B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • G06F17/142Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/148Wavelet transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments
    • G06F2218/18Classification; Matching by matching signal segments by plotting the signal segments against each other, e.g. analysing scattergrams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Discrete Mathematics (AREA)
  • Signal Processing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开一种质谱数据峰位置对齐方法,包括以下步骤:获取原始谱图;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记;采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x);对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;采用FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段Si‑1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi‑1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi;用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的对齐谱S(x)。本发明具有操作简单明了、分析效率高、对齐准确等显著优势,有效改善了谱图数据处理的准确性与可靠性。

Description

一种质谱数据峰位置对齐方法及装置
技术领域
本发明涉及质谱分析技术领域,尤其涉及一种质谱数据峰位置对齐方法及装置。
背景技术
在质谱系统实验过程中,系统采集的谱图会受到诸如环境温度、进样速率、电磁干扰、系统噪声等多方面因素的干扰,这些干扰会使所采集的谱图产生畸变、漂移等失真现象,即使是相同的样品,在不同仪器以及条件下测得的谱图也不尽相同。同时,也会在谱图中加入许多无规则噪声,这些噪声能够降低有效信号的信噪比,对识别产生不利影响。在系统应用过程中,由于采样的时间、环境等因素不同,每次实验采集的谱图都存在差异,如果不经处理,这些外界因素引起的差异将会覆盖不同样品图谱之间本身的差异,导致识别错误。然而,现有的质谱数据处理模型中具有操作较为复杂、分析效率较低以及对齐不够准确的问题,不能满足谱图数据处理中对于准确性与可靠性的需求。
鉴于此,实有必要提供一种质谱数据峰位置对齐方法及装置以克服上述缺陷。
发明内容
本发明的目的是提供一种质谱数据峰位置对齐方法及装置,旨在改善现有的质谱数据处理模型中具有操作较为复杂、分析效率较低以及对齐不够准确的问题,实现多中心、多节点原始数据漂移的对齐与统一分析,有效改善谱图数据处理的准确性与可靠性,具有操作简单明了、分析效率高、对齐准确等显著优势。
为了实现上述目的,本发明一方面是提供一种质谱数据峰位置对齐方法,包括以下步骤:
步骤S11:获取原始谱图,并设定S(x)为待对齐谱,R(x)为参考谱;
步骤S12:设置高斯窗函数σ的初始值、最小值和步长Δσ;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记;
步骤S13:采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x);
步骤S14:对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;其中,T(x)的分段边界即为S(x)的分段边界,设S(x)的分段Si(x),i=1,2,...;
步骤S15:采用 FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段 Si-1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi-1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi
步骤S16:用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的待对齐谱S(x)。
在一个优选实施方式中,所述步骤S12之后还包括:
步骤S17:建立噪声分布的数学模型,采用movmean函数,结合小波变换、非线性滤波方法对原始谱图中的噪声进行非线性抑制、平滑降噪和优化处理。
在一个优选实施方式中,所述步骤S16之后还包括:
步骤S18:判断所述高斯窗函数σ是否达到设定的最小值,若结果为是,则算法结束;若结果为否,使σ’=σ-Δσ,并回到所述步骤S17。
在一个优选实施方式中,所述步骤S16之后还包括:
步骤S19:将对齐处理后的所述待对齐谱S(x)生成新的谱图数据,并输出保存至指定路径。
在一个优选实施方式中,所述步骤S16之后还包括:
步骤S20:将对齐处理后的所述待对齐谱S(x)进行绘图处理并输出。
本发明第二方面是提供一种质谱数据峰位置对齐装置,包括:
谱图定义模块,用于获取原始谱图,并设定S(x)为待对齐谱,R(x)为参考谱;
数据初始化模块,用于设置高斯窗函数σ的初始值、最小值和步长Δσ;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记;
平滑处理模块,用于采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x);
分段设定模块,用于对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;其中,T(x)的分段边界即为S(x)的分段边界,设S(x)的分段Si(x),i=1,2,...;
漂移量计算模块,用于采用 FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段 Si-1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi-1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi
校正处理模块,用于用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的待对齐谱S(x)。
在一个优选实施方式中,还包括:
噪声消除模块,用于建立噪声分布的数学模型,采用movmean函数,结合小波变换、非线性滤波方法对原始谱图中的噪声进行非线性抑制、平滑降噪和优化处理。
在一个优选实施方式中,还包括:
校正判断模块,用于判断所述高斯窗函数σ是否达到设定的最小值,若结果为是,则算法结束;若结果为否,使σ’=σ-Δσ,并回到所述噪声消除模块中进行处理。
在一个优选实施方式中,还包括:
谱图重生成模块,用于将对齐处理后的所述待对齐谱S(x)生成新的谱图数据,并输出保存至指定路径。
在一个优选实施方式中,还包括:
谱图绘图模块,用于将对齐处理后的所述待对齐谱S(x)进行绘图处理并输出。
本发明所提供的质谱数据峰位置对齐方法,能够快速读取原始谱图数据,通过设定参考峰R(x)与待对齐峰S(x),采用峰识别、峰位置标记、谱图平滑处理以及谱峰分段等一系列函数处理,得到各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;然后基于各分段位移量ΔPi校正相应的谱峰段Si(x),即可得到目标尺度下待对齐谱S(x)。具有操作简单明了、分析效率高、对齐准确等显著优势,有效改善了谱图数据处理的准确性与可靠性,具有广阔的实际应用前景。
同时,在优选实施方式中,采用基于概率的统计学方法,利用海量数据统计每个精确质量数附近噪声出现的频率和强度的分布函数,建立噪声分布的数学模型;同时结合小波变换、非线性滤波等数字信号处理方法,通过时域和频域处理手段,对谱图中的噪声进行非线性抑制、平滑等降噪和优化处理,实现对噪声的消减,有效提高谱图的信噪比,从而在识别过程中能够最大限度地保留谱图的特征,提高识别的正确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明提供的质谱数据峰位置对齐方法的流程图;
图2为采用图1所示质谱数据峰位置对齐方法对齐前原始谱图;
图3为采用图1所示质谱数据峰位置对齐方法对齐后峰位置对齐谱图;
图4为采用图1所示质谱数据峰位置对齐方法对齐前原始信号峰中心位置对比图;
图5为采用图1所示质谱数据峰位置对齐方法对齐后峰位置对齐峰中心位置对比图;
图6为本发明提供的质谱数据峰位置对齐装置的框架图。
具体实施方式
为了使本发明的目的、技术方案和有益技术效果更加清晰明白,以下结合附图和具体实施方式,对本发明进行进一步详细说明。应当理解的是,本说明书中描述的具体实施方式仅仅是为了解释本发明,并不是为了限定本发明。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本发明的实施例中,一方面是提供一种质谱数据峰位置对齐方法,对采集的原始谱图数据进行分析,其中,谱图数据包括飞行时间质谱数据、离子阱质谱数据、四极杆质谱数据以及离子迁移谱数据等多种谱图数据。需要说明的是,本发明提供的多个数据处理函数与模型可参考现有的函数与模型,例如,可参考MATLAB多个数据处理函数,本发明在此不作限定。
如图1所示,质谱数据峰位置对齐方法包括以下步骤S11-S16。
步骤S11:获取原始谱图,并设定S(x)为待对齐谱,R(x)为参考谱。
在本步骤中,待对齐谱S(x)以及参考谱R(x)为质谱在线检测所得到的原始谱图数据。
步骤S12:设置高斯窗函数σ的初始值、最小值和步长Δσ;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记。
在本步骤中,对数据进行初始化,对谱峰信号处理中所涉及到的高斯窗函数σ的初始值、最小值(最小尺度)和步长Δσ进行初始化定义。其中,通过采用findpeaks函数(寻找峰值函数)来确定原始谱图中的波峰与波谷,从而确定谱图中的谱峰,并进行标记。
进一步的,还包括步骤S17:建立噪声分布的数学模型,对原始谱图中的噪声进行非线性抑制、平滑降噪和优化处理。
在本步骤中,首先采用基于概率的统计学方法,利用海量数据统计每个质量数附近噪声出现的频率和强度的分布函数,建立噪声分布的数学模型。然后采用二维小波变换矩阵、非线性滤波等方法,对谱图中的噪声进行非线性抑制、平滑等降噪和优化处理,实现对噪声的消减,有效提高谱图的信噪比,从而在识别过程中能够最大限度地保留谱图的特征,提高识别的正确率。更进一步的,对原始谱图中未参与高斯拟合的采样点,进行信号强度置零处理。
步骤S13:采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x)。
其中,smoothdata函数为基于移动平均法等对含噪数据进行平滑处理的函数,基于统计规律,将连续的采样数据看成一个长度固定为N的队列,在新的一次测量后,上述队列的首数据去掉,其余N-1个数据依次前移,并将新的采样数据插入,作为新队列的尾;然后对这个队列进行算术运算,并将其结果做为本次测量的结果,从而获得各个谱峰的平滑波形。
步骤S14:对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;其中,T(x)的分段边界即为S(x)的分段边界,设S(x)的分段Si(x),i=1,2,...。
在本步骤中,首先通过findpeaks函数再次识别T(x)中的谱峰,然后将一个谱峰看做一个分段,其中分段边界应避免将 S(x)中谱峰分割成两部分。
步骤S15:采用 FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段 Si-1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi-1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi
在本步骤中,采用 FFT函数(Fast Fourier transform,快速傅里叶变换),基于离散傅氏变换的奇、偶、虚、实等特性,对S(x)分段后的各分段Si(x)与参考谱R(x)的各个对应分段进行比对,得出各个分段Si(x)相对于参考谱R(x)中所对应的分段的漂移量ΔPi,按ΔPi尝试移动Si(x),并进行迭代,直至获得不重叠时的漂移量ΔPi。因此,分段计算谱图漂移量,从而获得每个谱图分段所对应的漂移量,从而提升校准的准确性与可靠性。
步骤S16:用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的待对齐谱S(x)。
进一步的,在一个实施例中,步骤S16之后还包括:
步骤S18:判断所述高斯窗函数σ是否达到设定的最小值,若结果为是,则算法结束;若结果为否,使σ’=σ-Δσ,并回到步骤S17。
在本步骤中,为了减少信号截取后的泄露误差,采用高斯窗函数(截短函数)对标准谱图中信号进行截短。先前数据初始化步骤,已经预设定一个初始值与最小步长(即最小值),若高斯窗函数没有达到预设的最小尺度,则重新对谱图中进行谱峰识别与平滑处理等步骤,通过不断的迭代,最终使得高斯窗函数迭代值σ’达到预设的最小尺度,即标准谱图中因信号截取所造成的泄露导致的误差处于预设的范围之内。具体的,可通过网络把结果返回检测终端,完成本次判别。
进一步的,步骤S17之后还包括步骤S19和或/步骤S20。
步骤S19:将对齐处理后的待对齐谱S(x)生成新的谱图数据,并输出保存至指定路径。
步骤S20:将对齐处理后的待对齐谱S(x)进行绘图处理并输出。
具体的,将对齐处理后的待对齐谱S(x)生成新的谱图数据,并输出保存至制定路径。同时将待对齐谱S(x)进行绘图处理并输出,以考察与验证结果的可靠性和准确性。
举例来说,实施例一:
针对本发明所述的谱图对齐方法进行考察。随机选择18个采集于不同时间点、不同设备的质谱图,采用该发明算法对原始谱图进行对齐处理。图2所示为采用本方法对齐前原始谱图,可以看出相同质量轴位置处的谱图存在较大的质量偏差;图3所示为采用本方法对齐后峰位置对齐谱图,可以看出相同质量轴位置处谱图的质量偏差已得到充分修正,相同质量轴基本处于同一位置处;图4为采用本方法对齐前原始信号峰中心位置对比图,可以看出相同质量轴位置处的谱图中心位置存在较大的质量偏差;图5为采用算法对齐后峰位置对齐峰中心位置对比图,可以看出相同质量轴位置处谱图的质量偏差已得到充分修正,相同质量轴的中心位置基本处于同一位置处。
综上所述,本发明所提供的质谱数据峰位置对齐方法,能够快速读取原始谱图数据,通过设定参考峰R(x)与待对齐峰S(x),采用峰识别、峰位置标记、谱图平滑处理以及谱峰分段等一系列函数处理,得到各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;然后基于各分段位移量ΔPi校正相应的谱峰段Si(x),即可得到目标尺度下对齐谱S(x)。本方法实现多中心、多节点原始数据漂移的对齐与统一分析,具有操作简单明了、分析效率高、对齐准确等显著优势,有效改善了谱图数据处理的准确性与可靠性,具有广阔的实际应用前景。
同时,在优选实施方式中,采用基于概率的统计学方法,利用海量数据统计每个精确质量数附近噪声出现的频率和强度的分布函数,建立噪声分布的数学模型;同时结合小波变换、非线性滤波等数字信号处理方法,通过时域和频域处理手段,对谱图中的噪声进行非线性抑制、平滑等降噪和优化处理,实现对噪声的消减,有效提高谱图的信噪比,从而在识别过程中能够最大限度地保留谱图的特征,提高识别的正确率。
本发明第二方面是提供一种质谱数据峰位置对齐装置100,用于快速读取原始谱图数据,采用峰识别、峰位置标记、谱图平滑处理以及谱峰分段等一系列函数处理,得到各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;然后基于各分段位移量ΔPi校正相应的谱峰段Si(x),即可得到目标尺度下对齐谱S(x)。需要说明的是,质谱数据峰位置对齐装置100的实现原理及实施方式与上述的质谱数据峰位置对齐方法相一致,故在此不再赘述。
如图6所示,质谱数据峰位置对齐装置100包括:
谱图定义模块10,用于获取原始谱图,并设定S(x)为待对齐谱,R(x)为参考谱;
数据初始化模块20,用于设置高斯窗函数σ的初始值、最小值和步长Δσ;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记;
平滑处理模块30,用于采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x);
分段设定模块40,用于对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;其中,T(x)的分段边界即为S(x)的分段边界,设S(x)的分段Si(x),i=1,2,...;
漂移量计算模块50,用于采用 FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段 Si-1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi-1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi
校正处理模块60,用于用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的待对齐谱S(x)。
进一步的,在一个实施例中,如图6所示,质谱数据峰位置对齐装置100还包括:
噪声消除模块70,用于建立噪声分布的数学模型,采用movmean函数,结合小波变换、非线性滤波方法对原始谱图中的噪声进行非线性抑制、平滑降噪和优化处理。
进一步的,在一个实施例中,如图6所示,质谱数据峰位置对齐装置100还包括:
校正判断模块80,用于判断高斯窗函数σ是否达到设定的最小值,若结果为是,则算法结束;若结果为否,使σ’=σ-Δσ,并回到噪声消除模块70中进行处理。
进一步的,在一个实施例中,如图6所示,质谱数据峰位置对齐装置100还包括:
谱图重生成模块90,用于将对齐处理后的待对齐谱S(x)生成新的谱图数据,并输出保存至指定路径。
进一步的,在一个实施例中,如图6所示,质谱数据峰位置对齐装置100还包括:
谱图绘图模块91,用于将对齐处理后的待对齐谱S(x)进行绘图处理并输出。
本发明再一方面是提供一种终端(图中未示出),终端包括存储器、处理器以及存储在存储器并可在处理器上运行的质谱数据峰位置对齐程序,质谱数据峰位置对齐程序被所述处理器执行时实现如上述实施方式任一项所述的质谱数据峰位置对齐方法的各个步骤。
本发明还提供一种计算机可读存储介质(图中未示出),计算机可读存储介质存储有质谱数据峰位置对齐程序,质谱数据峰位置对齐程序被处理器执行时实现如上述实施方式任一项所述的质谱数据峰位置对齐方法的各个步骤。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的系统或装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的系统或装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和修改,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的设备和这里示出与描述的图示示例。

Claims (10)

1.一种质谱数据峰位置对齐方法,其特征在于,包括以下步骤:
步骤S11:获取原始谱图,并设定S(x)为待对齐谱,R(x)为参考谱;
步骤S12:设置高斯窗函数σ的初始值、最小值和步长Δσ;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记;
步骤S13:采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x);
步骤S14:对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;其中,T(x)的分段边界即为S(x)的分段边界,设S(x)的分段Si(x),i=1,2,...;
步骤S15:采用 FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段 Si-1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi-1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi
步骤S16:用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的待对齐谱S(x)。
2.如权利要求1所述的质谱数据峰位置对齐方法,其特征在于,所述步骤S12之后还包括:
步骤S17:建立噪声分布的数学模型,采用movmean函数,结合小波变换、非线性滤波方法对原始谱图中的噪声进行非线性抑制、平滑降噪和优化处理。
3.如权利要求2所述的质谱数据峰位置对齐方法,其特征在于,所述步骤S16之后还包括:
步骤S18:判断所述高斯窗函数σ是否达到设定的最小值,若结果为是,则算法结束;若结果为否,使σ’=σ-Δσ,并回到所述步骤S17。
4.如权利要求3所述的质谱数据峰位置对齐方法,其特征在于,所述步骤S16之后还包括:
步骤S19:将对齐处理后的所述待对齐谱S(x)生成新的谱图数据,并输出保存至指定路径。
5.如权利要求3所述的质谱数据峰位置对齐方法,其特征在于,所述步骤S16之后还包括:
步骤S20:将对齐处理后的所述待对齐谱S(x)进行绘图处理并输出。
6.一种质谱数据峰位置对齐装置,其特征在于,包括:
谱图定义模块,用于获取原始谱图,并设定S(x)为待对齐谱,R(x)为参考谱;
数据初始化模块,用于设置高斯窗函数σ的初始值、最小值和步长Δσ;采用findpeaks函数对S(x)进行谱峰识别,并对谱峰位置进行标记;
平滑处理模块,用于采用smoothdata函数对S(x)的谱图进行平滑处理,将平滑处理后的谱图记为T(x);
分段设定模块,用于对T(x)的谱峰进行再次识别,将每个谱峰当做一个分段;其中,T(x)的分段边界即为S(x)的分段边界,设S(x)的分段Si(x),i=1,2,...;
漂移量计算模块,用于采用 FFT函数方法计算各分段Si(x)相对于参考谱R(x)对应分段的漂移量ΔPi;按漂移量ΔPi移动Si(x),若与相邻分段 Si-1(x)或Si+1(x)发生谱峰重叠,则让ΔPi=ΔPi-1(ΔPi≥0),直到不发生重叠为止,记录不重叠时的漂移量ΔPi
校正处理模块,用于用各分段不重叠时的漂移量ΔPi校正相应的分段Si(x)的谱峰,得到目标尺度下的待对齐谱S(x)。
7.如权利要求6所述的质谱数据峰位置对齐装置,其特征在于,还包括:
噪声消除模块,用于建立噪声分布的数学模型,采用movmean函数,结合小波变换、非线性滤波方法对原始谱图中的噪声进行非线性抑制、平滑降噪和优化处理。
8.如权利要求7所述的质谱数据峰位置对齐装置,其特征在于,还包括:
校正判断模块,用于判断所述高斯窗函数σ是否达到设定的最小值,若结果为是,则算法结束;若结果为否,使σ’=σ-Δσ,并回到所述噪声消除模块中进行处理。
9.如权利要求8所述的质谱数据峰位置对齐装置,其特征在于,还包括:
谱图重生成模块,用于将对齐处理后的所述待对齐谱S(x)生成新的谱图数据,并输出保存至指定路径。
10.如权利要求8所述的质谱数据峰位置对齐装置,其特征在于,还包括:
谱图绘图模块,用于将对齐处理后的所述待对齐谱S(x)进行绘图处理并输出。
CN202011289277.2A 2020-11-18 2020-11-18 一种质谱数据峰位置对齐方法及装置 Active CN112395983B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011289277.2A CN112395983B (zh) 2020-11-18 2020-11-18 一种质谱数据峰位置对齐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011289277.2A CN112395983B (zh) 2020-11-18 2020-11-18 一种质谱数据峰位置对齐方法及装置

Publications (2)

Publication Number Publication Date
CN112395983A CN112395983A (zh) 2021-02-23
CN112395983B true CN112395983B (zh) 2022-03-18

Family

ID=74606325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011289277.2A Active CN112395983B (zh) 2020-11-18 2020-11-18 一种质谱数据峰位置对齐方法及装置

Country Status (1)

Country Link
CN (1) CN112395983B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029115A (en) * 1996-10-03 2000-02-22 Perkin Elmer Llc Analyzing spectrometric data
CN105928965A (zh) * 2016-05-11 2016-09-07 中国科学院武汉物理与数学研究所 一种核磁共振谱采样截断伪峰的抑制方法
CN109145873A (zh) * 2018-09-27 2019-01-04 广东工业大学 基于遗传算法的光谱高斯峰特征提取算法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5121443A (en) * 1989-04-25 1992-06-09 Spectra-Physics, Inc. Neural net system for analyzing chromatographic peaks
AU2003239409A1 (en) * 2002-05-09 2003-11-11 Surromed, Inc. Methods for time-alignment of liquid chromatography-mass spectrometry data
US7365311B1 (en) * 2005-09-08 2008-04-29 The Mathworks, Inc. Alignment of mass spectrometry data
FI20065430A0 (fi) * 2006-06-21 2006-06-21 Valtion Teknillinen Spektroskopiadatan normalisointi usean sisäisen standardin avulla
US8965094B2 (en) * 2012-04-14 2015-02-24 Nocimed, Llc Magnetic resonance spectroscopy pulse sequence, acquisition, and processing system and method
CN105784672A (zh) * 2016-04-12 2016-07-20 河北伊诺光学科技股份有限公司 一种基于双树复小波算法的毒品检测仪标准化方法
CN105954223A (zh) * 2016-04-28 2016-09-21 南京富岛信息工程有限公司 一种提高汽油性质预测精度的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6029115A (en) * 1996-10-03 2000-02-22 Perkin Elmer Llc Analyzing spectrometric data
CN105928965A (zh) * 2016-05-11 2016-09-07 中国科学院武汉物理与数学研究所 一种核磁共振谱采样截断伪峰的抑制方法
CN109145873A (zh) * 2018-09-27 2019-01-04 广东工业大学 基于遗传算法的光谱高斯峰特征提取算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种新的核磁共振谱峰对齐算法;黄赫等;《光电技术应用》;20130415;第28卷(第02期);第51-54、70页 *

Also Published As

Publication number Publication date
CN112395983A (zh) 2021-02-23

Similar Documents

Publication Publication Date Title
CN112415078B (zh) 一种质谱数据谱图信号校准方法及装置
CN109307862B (zh) 一种目标辐射源个体识别方法
CA2634328A1 (en) Method and system for trend detection and analysis
CN109633538B (zh) 非均匀采样系统的最大似然时差估计方法
CN109620213B (zh) 一种基于多尺度差分特征的心电识别方法及装置
CN113325277A (zh) 一种局部放电处理方法
CN114025379B (zh) 一种宽带多信号检测方法、装置和设备
CN108761380B (zh) 一种用于提高精度的目标波达方向估计方法
CN109444844B (zh) 一种提取目标散射中心特征的方法和装置
CN109923430B (zh) 用于进行相位差展开的装置及方法
CN111580654A (zh) 一种基于emd的脑电信号的短时特征提取方法
CN112395983B (zh) 一种质谱数据峰位置对齐方法及装置
CN112269182B (zh) 目标雷达信号的确定方法和装置、存储介质、电子装置
CN107481732B (zh) 一种口语测评中的降噪方法、装置及终端设备
CN109726667B (zh) 质谱数据处理方法和装置、计算机设备、计算机存储介质
CN109544593B (zh) 一种基于自相似度量的通用图像噪声估计方法
CN114280571B (zh) 一种雨杂波信号的处理方法、装置及设备
CN112014813B (zh) 一种天波雷达电离层污染校正方法及系统
CN111007369B (zh) 一种超高频电磁波信号到达时间差计算方法和装置
CN114118177A (zh) 一种基于奇异谱分析的位平面降噪方法、系统及存储介质
CN113219042A (zh) 一种用于人体呼出气体中各成分分析检测的装置及其方法
CN113762069A (zh) 一种任意噪声下长序列鲁棒增强快速趋势滤波方法
CN112327260A (zh) 一种sar回波数据中脉冲式干扰信号的抑制方法和装置
CN114036975B (zh) 基于频域-波数域解卷积的目标信号提取方法
CN111727454A (zh) 用于处理分段平滑信号的装置、方法和计算机程序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant