CN109726667B - 质谱数据处理方法和装置、计算机设备、计算机存储介质 - Google Patents

质谱数据处理方法和装置、计算机设备、计算机存储介质 Download PDF

Info

Publication number
CN109726667B
CN109726667B CN201811592209.6A CN201811592209A CN109726667B CN 109726667 B CN109726667 B CN 109726667B CN 201811592209 A CN201811592209 A CN 201811592209A CN 109726667 B CN109726667 B CN 109726667B
Authority
CN
China
Prior art keywords
mass spectrum
data
spectrum data
signal
baseline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811592209.6A
Other languages
English (en)
Other versions
CN109726667A (zh
Inventor
张必良
卢明华
何宇忠
石志鹏
张奕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ribobio Co ltd
Original Assignee
Guangzhou Ribobio Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ribobio Co ltd filed Critical Guangzhou Ribobio Co ltd
Priority to CN201811592209.6A priority Critical patent/CN109726667B/zh
Publication of CN109726667A publication Critical patent/CN109726667A/zh
Application granted granted Critical
Publication of CN109726667B publication Critical patent/CN109726667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明涉及一种质谱数据处理方法和装置、计算机设备、计算机存储介质。上述质谱数据处理方法包括:对采集的质谱数据进行平滑处理,得到平滑质谱数据;分别获取所述平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据所述基线数据进行曲线拟合,得到整谱基线,对所述整谱基线进行剔除;在剔除所述整谱基线之后的平滑质谱数据中识别谱峰,在所述谱峰中标定有效峰。本发明可以剔除平滑质谱数据中表征噪声数据的整谱基线,实现平滑质谱数据的去噪和校正,保证后续进行谱峰识别的平滑质谱数据的有效性,从而保证后续所识别的谱峰的准确性,提高后续样品鉴别的准确度。

Description

质谱数据处理方法和装置、计算机设备、计算机存储介质
技术领域
本发明涉及信号处理技术领域,特别是涉及一种质谱数据处理方法和装置、计算机设备、计算机存储介质。
背景技术
质谱仪(如基于MALDI-TOF方法的质谱仪)可以包括如下结构:高真空系统(真空腔体、真空飞行管)、运动控制系统(进退靶板结构、靶板移动结构)、光学系统(激光、视频监控)、离子源系统、电源控制系统(高压脉冲电源、开关电源)、采集测量系统(采集、信号倍增检测)、数据采集与处理分析系统。
上述质谱仪的基本原理是将样本经过期处理后,与基质溶液混合均匀,点在样品的靶板上,等混合溶液(样品与基质)干燥形成结晶体后,利用特定激光提供适合强度的能量轰击结晶体,基质吸收激光的能量使样本活性加强,进一步使得基质与样本之间不稳定,以发生电荷转移,达到样本分子电离的目的。针对上述电离后的样本分子等信号源数据进行质谱分析处理可以实现物质鉴别等目的,传统的质谱分析技术从相应信号源采集所需数据进行相应样品鉴别的过程中,容易受到原始数据中携带的噪声干扰,影响样品鉴别的准确度。
发明内容
基于此,有必要针对传统的质谱分析技术容易受到原始数据中携带的噪声干扰的技术问题,提供一种质谱数据处理方法和装置、计算机设备、计算机存储介质。
一种质谱数据处理方法,包括:
对采集的质谱数据进行平滑处理,得到平滑质谱数据;
分别获取平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据基线数据进行曲线拟合,得到整谱基线,对整谱基线进行剔除;
在剔除整谱基线之后的平滑质谱数据中识别谱峰,在谱峰中标定有效峰。
在一个实施例中,对采集的质谱数据进行平滑处理,得到平滑质谱数据之前,包括:
从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区;其中,质谱数据序列包括多个单元质谱数据,各个单元质谱数据分别携带时序参数;
根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据;
对采集的质谱数据进行平滑处理,得到平滑质谱数据,包括:
对合并质谱数据进行平滑处理,得到平滑质谱数据。
在一个实施例中,从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区,包括:
识别信号源中原始信号的信号幅值,根据信号幅值小于幅值阈值的原始信号确定第一质谱数据序列,根据信号幅值大于或者等于幅值阈值的原始信号确定第二质谱数据序列;
通过第一信号通道将第一质谱数据序列写入缓存区,通过第二信号通道将第二质谱数据序列写入缓存区。
在一个实施例中,根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据,包括:
分别在各个质谱数据序列中识别各个单元质谱数据的时序参数;
将时序参数一致的单元质谱数据进行合并,得到单元合并数据,根据单元合并数据确定合并质谱数据。
在一个实施例中,根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据之后,还包括:
对合并质谱数据进行傅里叶变换,得到频域质谱数据;
将频域质谱数据中大于频率上限且小于频率下限的数据进行滤除,得到第一滤波数据;
将第一滤波数据中幅值大于设定幅值的数据进行滤除,得到第二滤波数据;
对第二滤波数据进行反傅里叶变换,根据反傅里叶变换的结果更新合并质谱数据。
在一个实施例中,从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区,包括:
从信号源中分别针对样品的不同位置提取多组质谱数据序列,分别将各组质谱数据通过多个信号通道写入缓存区;其中,一组质谱数据序列包括多个信号通道分别匹配的质谱数据序列;
根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据,包括:
在缓存区分别根据时序参数将各组质谱数据序列合并为初始合并数据;
对初始合并数据进行叠加处理,根据叠加得到的数据确定合并质谱数据。
一种质谱数据处理装置,包括:
平滑处理模块,用于对采集的质谱数据进行平滑处理,得到平滑质谱数据;
获取模块,用于分别获取平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据基线数据进行曲线拟合,得到整谱基线,对整谱基线进行剔除;
识别模块,用于在剔除整谱基线之后的平滑质谱数据中识别谱峰,在谱峰中标定有效峰。
在一个实施例中,上述质谱数据处理装置,还包括:
提取模块,用于从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区;其中,质谱数据序列包括多个单元质谱数据,各个单元质谱数据分别携带时序参数;
合并模块,用于根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据;
所述平滑处理模块进一步用于:
对合并质谱数据进行平滑处理,得到平滑质谱数据。
一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例提供的质谱数据处理方法。
一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一实施例提供的质谱数据处理方法。
上述质谱数据处理方法、装置、计算机设备和计算机存储介质,可以对采集的质谱数据进行平滑处理,确定周期性噪声得到抑制的平滑质谱数据,再在上述平滑质谱数据中获取各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据基线数据进行曲线拟合,以得到表征噪声数据的整谱基线,并剔除上述整谱基线,实现平滑质谱数据的去噪和校正,保证后续进行谱峰识别的平滑质谱数据的有效性,从而保证后续所识别的谱峰的准确性,使从上述平滑质谱数据的谱峰中标定的有效峰能够更为准确地表征相应鉴别样品,可以提高后续样品鉴别的准确度。
附图说明
图1为一个实施例的质谱数据处理方法流程图;
图2为一个实施例的整谱基线剔除前后的质谱数据对比示意图;
图3为一个实施例的滤波平滑处理前后的质谱数据对比示意图;
图4为一个实施例的质谱数据处理装置结构示意图;
图5为一个实施例的计算机设备内部结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
需要说明的是,本发明实施例所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本发明实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
参考图1所示,图1为一个实施例的质谱数据处理方法流程图,包括:
S10,对采集的质谱数据进行平滑处理,得到平滑质谱数据;
上述步骤S10可以对采集的质谱数据进行算术平均平滑等平滑处理,以抑制所采集的质谱数据中的周期性噪声,保证所确定的平滑质谱数据的有效性。
S20,分别获取平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据基线数据进行曲线拟合,得到整谱基线,对整谱基线进行剔除;
可选地,上述步骤S20可以结合平滑质谱数据的特征,按照离子质荷比(m/z)的大小分布来动态调整谱基线。具体地,可以分别针对单个谱峰(峰值点),获取其左右两个正态分布的数据段,若每个数据段包括m个单元数据,则可以分别计算峰值点m个单元数据的数据平均值,将上述数据平均值确定为相应数据段的基线数据。在确定基线数据后,可以对上述基线数据进行二次拟合,得到整谱基线。
上述整谱基线为动态基线,该动态基线识别方法使基线能更为准确地表征噪声基线,且适用范围广,能精准表征不同情况下谱峰两侧的噪声数据,解决了经验阈值选择的局限性问题,使谱峰识别具有稳定性。对平滑质谱数据的整谱基线进行识别并剔除,可以实现平滑质谱数据的去噪和校正,保证所确定的平滑质谱数据的有效性,从而保证后续所识别的谱峰的准确性。
S30,在剔除整谱基线之后的平滑质谱数据中识别谱峰,在谱峰中标定有效峰。
上述步骤S30可以根据平滑质谱数据的特征,通过斜率变换趋势获知局部极值等方法,在连续的质谱数据上识别出谱峰,并进行存储。在进行谱峰识别后,可以在上述谱峰中筛选出符合离子质荷比(m/z)特征的数据点(谱峰),根据筛选得到的数据点确定有效峰,以依据上述有效峰进行相应鉴别,保证鉴别过程中的准确性。
具体地,上述有效峰可以用于样品鉴别,根据有效峰进行样品鉴别的过程可以包括:根据有效峰确定质谱数据序列的峰位置点,确定一组峰位置点,依次针对各个峰位置点与样品谱库的数据进行匹配,根据匹配结果鉴别相应样品。
可选地,可以识别某谱峰的的谱峰强度值,将上述谱峰强度值与噪声基线值进行比较,谱峰强度值与噪声基线值的比值越大说明信噪比(s/n)越好,为所需离子的有效峰的可能性越大,可信度等级也就越高。上述噪声基线值为相应谱峰处的基线数据,若该谱峰处存在多个基线数据,则该谱峰的噪声基线可以为多个基线数据的平均值。
在一个实施例中,整谱基线剔除前后的平滑质谱数据可以参考图2所示,图2中,纵坐标(Y轴坐标)表示信号的强度,横坐标(X轴坐标)表示m/z(离子质荷比)值,上图表示整谱基线剔除前的平滑质谱数据,下图表示整谱基线剔除后的平滑质谱数据。如图2所示,在基线校准前(进行整谱基线识别和剔除之前),表征平滑质谱数据的曲线整体向上漂移,其纵坐标的起始位置在40左右,最高强度的信号值为115.9,容易干扰平滑质谱数据中谱峰等目标参数的准确判读。而在基线校准后(进行整谱基线识别和剔除之后),表征平滑质谱数据的曲线漂移得到有效抑制,相应曲线纵坐标位置的起始点为0左右,平滑质谱数据中去除了基线噪音干扰,获得了最高强度信号的准确值73.9。通过基线动态识别校准方法,能准确获得信号(平滑质谱数据)的真实信噪比,提高信号中谱峰等目标参数判读的准确率。
本发明提供的质谱数据处理方法,可以对采集的质谱数据进行平滑处理,确定周期性噪声得到抑制的平滑质谱数据,再在上述平滑质谱数据中识别表征噪声数据的整谱基线,并剔除上述整谱基线,实现平滑质谱数据的去噪和校正,保证后续进行谱峰识别的平滑质谱数据的有效性,从而保证后续所识别的谱峰的准确性,使从上述平滑质谱数据的谱峰中标定的有效峰能够更为准确地表征相应鉴别样品,可以提高后续样品鉴别的准确度。
在一个实施例中,对采集的质谱数据进行平滑处理,得到平滑质谱数据之前,包括:
从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区;其中,质谱数据序列包括多个单元质谱数据,各个单元质谱数据分别携带时序参数;
根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据;
对采集的质谱数据进行平滑处理,得到平滑质谱数据,包括:
对合并质谱数据进行平滑处理,得到平滑质谱数据。
上述信号源可以接收鉴别样品的离子流,通过转换和倍增等处理获得质谱的原始电信号;信号源可以包括响应时间快、灵敏度高和检测面积大的微通道板离子检测器和PCI(外设部件互连标准)总线高速采集卡,其可以为质谱数据处理提供原始信号。执行上述步骤S10的质谱数据处理设备可以通过PCI总线连接信号源(具体连接信号源的高速采集卡),以提取所需的质谱数据。
上述缓存区为预先开辟的高速缓存区,该高速缓存区可以是读写高速度的内存堆或栈,其可以被主线程共享、管理。质谱的原始信号在短时间存在大量信号产生,通过缓存区的数据缓存操作处理瞬间峰值信号输入,可以避免因后端处理及外设显示而阻塞,造成原始信号的卡顿,甚至部分信号数据丢失等状况的发生,以保证质谱数据处理过程的实时性,不因质谱数据处理前后两端速率不一致而产生等待。
具体地,进行质谱数据处理的设备可以包括飞行时间质谱仪等质谱数据处理设备。上述质谱数据处理设备可以设置多个信号通道,每个信号通道分别传输不同幅值范围的质谱数据序列,比如,第一信号通道传输第一幅值范围的质谱数据序列,第二信号通道传输第二幅值范围的质谱数据序列,……,第i信号通道传输第i幅值范围的质谱数据序列,以分别针对不同的信号幅值对原始数据进行相应的提取和传输,可以提高所获得的质谱数据序列的精度。上述各个信号通道分别可以传输相应幅值范围的质谱数据序列,某信号通道对应的质谱数据序列为该信号通道对应的幅值范围内的质谱数据序列。上述质谱数据序列包括多个单元质谱数据,各个单元质谱数据在相应的质谱数据序列中按照时间先后顺序排列。
本实施例可以依据单元质谱数据携带的时序参数对单元质谱数据进行合并,以确定相应的合并质谱数据,使上述合并质谱数据可以表征全幅值的质谱数据,在提高质谱数据采集精度的基础上,可以保证所采集的质谱数据的完整性。
在一个实施例中,从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区,包括:
识别信号源中原始信号的信号幅值,根据信号幅值小于幅值阈值的原始信号确定第一质谱数据序列,根据信号幅值大于或者等于幅值阈值的原始信号确定第二质谱数据序列;
通过第一信号通道将第一质谱数据序列写入缓存区,通过第二信号通道将第二质谱数据序列写入缓存区。
上述幅值阈值可以依据原始信号的幅值特征以及质谱数据处理设备中采集卡能提供的采集幅度设置,比如可以设置为400mV(毫伏)等值。上述第一信号通道为传输低幅值信号(信号幅值小于幅值阈值的原始信号)的低幅值通道,上述第二信号通道为传输高幅值信号(信号幅值大于或者等于幅值阈值的原始信号)的高幅值通道。
本实施例通过双通道在从信号源采集所需的质谱数据序列,在提高质谱数据序列采集精度的基础上,还可以控制相应的采集成本,可以解决采集精度与采集成本之间的矛盾。
在一个实施例中,根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据,包括:
分别在各个质谱数据序列中识别各个单元质谱数据的时序参数,即分别在每个质谱数据序列中识别其中单元质谱数据的时序参数;
将时序参数一致的单元质谱数据进行合并,得到单元合并数据,根据单元合并数据确定合并质谱数据。
上述时序参数可以表征采集相应单元质谱数据的时刻信息;将时序参数一致的单元质谱数据进行合并,所得到的单元合并数据为在上述时序参数所表征的时刻采集的全幅值质谱数据。根据时序参数将单元合并数据按照时间先后顺利排列,便可以确定合并质谱数据,使上述合并质谱数据包括全幅值质谱数据,保证了合并质谱数据的完整性。
具体地,若信号通道包括第一信号通道和第二信号通道,第一信号通道传输的第一质谱数据序列和第二信号通道传输的第二质谱数据序列分别包括n个单元质谱数据。信号源原始信号的最高幅值为1V(伏),幅值阈值为400mV。
第一质谱数据序列An包括:At1、At2、……、Atn
第一质谱数据序列Bn包括:Bt1、Bt2、……、Btn
其中,Atn表示第一质谱数据序列中时序参数为tn的单元质谱数据,Btn表示第二质谱数据序列中时序参数为tn的单元质谱数据,上述时序参数为tn可以表征相应单元质谱数据的采集时刻和采集顺序,将时序参数一致(采集时刻相同)的单元质谱数据进行合并,得到的合并质谱数据为:
Pn:Pt1、Pt2、……、Ptn
上述单元合并数据Pn也可以写为:At1^Bt1、At2^Bt2、……、Atn^Btn,上述符号“^”表示合并,Atn^Btn表示将第一质谱数据序列和第二质谱数据序列中时序参数为tn的单元质谱数据进行合并,得到时序参数为tn的单元合并数据Ptn,根据单元合并数据确定的合并质谱数据便还原到0至1V的全幅值范围,在保证所确定的合并质谱数据的完整性的基础上,使采集精度提高了2两倍。
在一个实施例中,根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据之后,还包括:
对合并质谱数据进行傅里叶变换,得到频域质谱数据;
将频域质谱数据中大于频率上限且小于频率下限的数据进行滤除,得到第一滤波数据;
将第一滤波数据中幅值大于设定幅值的数据进行滤除,得到第二滤波数据;
对第二滤波数据进行反傅里叶变换,根据反傅里叶变换的结果更新合并质谱数据。
上述频率上限、频率下限以及设定幅值分别可以依据鉴别样品的质谱数据特征进行设置。合并质谱数据中,大于频率上限且小于频率下限的数据,和/或幅值大于设定幅值的数据为噪声数据,将这一部分数据进行滤除,可以提高所确定的合并质谱数据的有效性。
本实施例将合并质谱数据进行傅里叶变换,得到相应的频域质谱数据,再对上述频域质谱数据依次进行频率滤波和振幅滤波,以依据滤波后的数据更新合并质谱数据,使更新后的合并质谱数据中的高频干扰数据、低幅干扰数据等噪声数据得到有效消除,可以进一步提高相应质谱数据处理的效果。
作为一个实施例,经过频率滤波、振幅滤波以及平滑处理等滤波处理前后的质谱数据可以参考图3所示,图3中,滤波前的数据表示频率滤波、振幅滤波以及平滑处理等滤波平滑处理之前的数据,滤波后的数据表示频率滤波、振幅滤波以及平滑处理等滤波平滑处理之后的数据,图3表明,滤波平滑处理前,质谱数据中存在较多低幅和高频的噪声,同时有效信号上图谱中有很多锯齿毛刺,容易影响和干扰峰(谱峰)的识别;通过滤波平滑处理后,低幅和高频的噪声得到了消除,同时有效信号的波形更干净平滑,趋势更清晰,有利于峰的判别。
在一个实施例中,从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区,包括:
从信号源中分别针对样品的不同位置提取多组质谱数据序列,分别将各组质谱数据通过多个信号通道写入缓存区;其中,一组质谱数据序列包括多个信号通道分别匹配的质谱数据序列;
根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据,包括:
在缓存区分别根据时序参数将各组质谱数据序列合并为初始合并数据;
对初始合并数据进行叠加处理,根据叠加得到的数据确定合并质谱数据。
具体地,上述多组质谱数据序列分别来源于所鉴别样品的多个位置,在提取到一组质谱数据序列后,可以分别通过各个信号通道将该组质谱数据序列中各个信号通道对应的质谱数据序列写入缓存区;根据时序参数合并缓存区中该组质谱数据序列的各个质谱数据序列,以确定该组质谱数据序列对应的初始合并数据,并按照上述过程分别获取其他组质谱数据序列的初始合并数据,以确定各组质谱数据序列分别对应的初始合并数据。再对多个初始合并数据进行叠加处理,还可以对叠加得到的数据进行算术平均计算、差值计算或者绝对值权重法等处理,以重新确定进行平滑处理的合并质谱数据,降低或消除质谱数据序列采样过程中的随机误差,提高信噪比。
作为一个实施例,对初始合并数据进行叠加处理,根据叠加得到的数据确定合并质谱数据,包括:
分别识别每个初始合并数据中的单元初始数据,以及上述单元初始数据的时序参数;
将时序参数一致的单元初始数据进行叠加,根据叠加后的单元初始数据的平均数据确定单元叠加数据,根据单元叠加数据确定合并质谱数据,即按照时序参数,将单元叠加数据按照采集先后顺序排列,以确定合并质谱数据。
本实施例可以从鉴别样品的不同位置分别提取多组质谱数据序列,以获得多个初始合并数据,对初始合并数据进行叠加处理,以确定后续进行平滑处理的合并质谱数据,使进行平滑处理的合并质谱数据中的随机误差可以得到降低或者消除,提高上述合并质谱数据的信噪比。
在一个实施例中,可以将进行质谱数据处理的质谱数据处理设备连接一个显示设备,以通过上述显示设备显示如上任意一个实施例所产生的数据谱图(如合并质谱数据的数据谱图、平滑质谱数据的数据谱图等),以便相应用户可以及时获知各个数据谱图的特征。
参考图4,图4所示为一个实施例的质谱数据处理装置结构示意图,包括:
平滑处理模块10,用于对采集的质谱数据进行平滑处理,得到平滑质谱数据;
获取模块20,用于分别获取平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据基线数据进行曲线拟合,得到整谱基线,对整谱基线进行剔除;
识别模块30,用于在剔除整谱基线之后的平滑质谱数据中识别谱峰,在谱峰中标定有效峰。
在一个实施例中,上述质谱数据处理装置还可以包括:
提取模块,用于从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区;其中,质谱数据序列包括多个单元质谱数据,各个单元质谱数据分别携带时序参数;
合并模块,用于根据时序参数合并缓存区的各个质谱数据序列,得到合并质谱数据;
上述平滑处理模块进一步用于:
对合并质谱数据进行平滑处理,得到平滑质谱数据。
在一个实施例中,上述提取模块进一步用于:
识别信号源中原始信号的信号幅值,根据信号幅值小于幅值阈值的原始信号确定第一质谱数据序列,根据信号幅值大于或者等于幅值阈值的原始信号确定第二质谱数据序列;
通过第一信号通道将第一质谱数据序列写入缓存区,通过第二信号通道将第二质谱数据序列写入缓存区。
在一个实施例中,上述合并模块进一步用于:
分别在各个质谱数据序列中识别各个单元质谱数据的时序参数;
将时序参数一致的单元质谱数据进行合并,得到单元合并数据,根据单元合并数据确定合并质谱数据。
在一个实施例中,上述质谱数据处理装置,还包括:
第一变换模块,用于对合并质谱数据进行傅里叶变换,得到频域质谱数据;
第一滤除模块,用于将频域质谱数据中大于频率上限且小于频率下限的数据进行滤除,得到第一滤波数据;
第二滤除模块,用于将第一滤波数据中幅值大于设定幅值的数据进行滤除,得到第二滤波数据;
第二变换模块,用于对第二滤波数据进行反傅里叶变换,根据反傅里叶变换的结果更新合并质谱数据。
在一个实施例中,上述提取模块进一步用于:
从信号源中分别针对样品的不同位置提取多组质谱数据序列,分别将各组质谱数据通过多个信号通道写入缓存区;其中,一组质谱数据序列包括多个信号通道分别匹配的质谱数据序列;
上述合并模块进一步用于:
在缓存区分别根据时序参数将各组质谱数据序列合并为初始合并数据;
对初始合并数据进行叠加处理,根据叠加得到的数据确定合并质谱数据。
关于质谱数据处理装置的具体限定可以参见上文中对于质谱数据处理方法的限定,在此不再赘述。上述质谱数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储相关质谱数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种质谱数据处理方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
基于如上所述的示例,在一个实施例中还提供一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现如上述各实施例中的任意一种质谱数据处理方法。
上述计算机设备,通过所述处理器上运行的计算机程序,实现了质谱数据处理过程准确度的提升。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述质谱数据处理方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
据此,在一个实施例中还提供一种计算机存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上述各实施例中的任意一种质谱数据处理方法。
上述计算机存储介质,通过其存储的计算机程序,能够使相应质谱数据的有效峰能够更为准确地表征鉴别样品,可以提高后续样品鉴别的准确度。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种质谱数据处理方法,其特征在于,包括:
从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区;其中,所述质谱数据序列包括多个单元质谱数据,各个单元质谱数据分别携带时序参数;
根据所述时序参数合并所述缓存区的各个质谱数据序列,得到合并质谱数据;
对所述合并质谱数据进行平滑处理,得到平滑质谱数据;
分别获取所述平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据所述基线数据进行曲线拟合,得到整谱基线,对所述整谱基线进行剔除;
在剔除所述整谱基线之后的平滑质谱数据中识别谱峰,在所述谱峰中标定有效峰。
2.根据权利要求1所述的质谱数据处理方法,其特征在于,所述从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区,包括:
识别所述信号源中原始信号的信号幅值,根据所述信号幅值小于幅值阈值的原始信号确定第一质谱数据序列,根据所述信号幅值大于或者等于所述幅值阈值的原始信号确定第二质谱数据序列;
通过第一信号通道将所述第一质谱数据序列写入缓存区,通过第二信号通道将所述第二质谱数据序列写入缓存区。
3.根据权利要求1所述的质谱数据处理方法,其特征在于,所述根据所述时序参数合并所述缓存区的各个质谱数据序列,得到合并质谱数据,包括:
分别在各个质谱数据序列中识别各个单元质谱数据的时序参数;
将所述时序参数一致的单元质谱数据进行合并,得到单元合并数据,根据所述单元合并数据确定合并质谱数据。
4.根据权利要求1至3任一项所述的质谱数据处理方法,其特征在于,在所述根据所述时序参数合并所述缓存区的各个质谱数据序列,得到合并质谱数据之后,还包括:
对所述合并质谱数据进行傅里叶变换,得到频域质谱数据;
将所述频域质谱数据中大于频率上限且小于频率下限的数据进行滤除,得到第一滤波数据;
将所述第一滤波数据中幅值大于设定幅值的数据进行滤除,得到第二滤波数据;
对所述第二滤波数据进行反傅里叶变换,根据反傅里叶变换的结果更新所述合并质谱数据。
5.根据权利要求1至3任一项所述的质谱数据处理方法,其特征在于,所述从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区,包括:
从所述信号源中分别针对样品的不同位置提取多组质谱数据序列,分别将各组质谱数据通过多个信号通道写入所述缓存区;其中,一组质谱数据序列包括多个信号通道分别匹配的质谱数据序列;
所述根据所述时序参数合并所述缓存区的各个质谱数据序列,得到合并质谱数据,包括:
在所述缓存区分别根据时序参数将各组质谱数据序列合并为初始合并数据;
对所述初始合并数据进行叠加处理,根据叠加得到的数据确定所述合并质谱数据。
6.一种质谱数据处理装置,其特征在于,包括:
提取模块,用于从信号源中提取分别与多个信号通道匹配的质谱数据序列,分别通过各个信号通道将对应的质谱数据序列写入缓存区;其中,所述质谱数据序列包括多个单元质谱数据,各个单元质谱数据分别携带时序参数;
合并模块,用于根据所述时序参数合并所述缓存区的各个质谱数据序列,得到合并质谱数据;
平滑处理模块,用于对所述合并质谱数据进行平滑处理,得到平滑质谱数据;
获取模块,用于分别获取所述平滑质谱数据中各个谱峰两侧分别呈正态分布的数据段,分别将各个数据段的平均值确定为基线数据,根据所述基线数据进行曲线拟合,得到整谱基线,对所述整谱基线进行剔除;
识别模块,用于在剔除所述整谱基线之后的平滑质谱数据中识别谱峰,在所述谱峰中标定有效峰。
7.根据权利要求6所述的质谱数据处理装置,其特征在于,所述提取模块用于:
识别所述信号源中原始信号的信号幅值,根据所述信号幅值小于幅值阈值的原始信号确定第一质谱数据序列,根据所述信号幅值大于或者等于所述幅值阈值的原始信号确定第二质谱数据序列;
通过第一信号通道将所述第一质谱数据序列写入缓存区,通过第二信号通道将所述第二质谱数据序列写入缓存区。
8.根据权利要求6所述的质谱数据处理装置,其特征在于,所述合并模块用于:
分别在各个质谱数据序列中识别各个单元质谱数据的时序参数;
将所述时序参数一致的单元质谱数据进行合并,得到单元合并数据,根据所述单元合并数据确定合并质谱数据。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任意一项所述的质谱数据处理方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5任意一项所述的质谱数据处理方法。
CN201811592209.6A 2018-12-25 2018-12-25 质谱数据处理方法和装置、计算机设备、计算机存储介质 Active CN109726667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811592209.6A CN109726667B (zh) 2018-12-25 2018-12-25 质谱数据处理方法和装置、计算机设备、计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811592209.6A CN109726667B (zh) 2018-12-25 2018-12-25 质谱数据处理方法和装置、计算机设备、计算机存储介质

Publications (2)

Publication Number Publication Date
CN109726667A CN109726667A (zh) 2019-05-07
CN109726667B true CN109726667B (zh) 2021-03-02

Family

ID=66295966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811592209.6A Active CN109726667B (zh) 2018-12-25 2018-12-25 质谱数据处理方法和装置、计算机设备、计算机存储介质

Country Status (1)

Country Link
CN (1) CN109726667B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111325121B (zh) * 2020-02-10 2024-02-20 浙江迪谱诊断技术有限公司 一种核酸质谱数值处理方法
CN115545082B (zh) * 2022-10-20 2024-07-09 广东省麦思科学仪器创新研究院 质谱图生成方法、装置、系统及可读存储介质
CN118378020A (zh) * 2024-04-24 2024-07-23 洪启集成电路(珠海)有限公司 一种二次离子质谱曲线分层位置点的自动计算方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0511332D0 (en) * 2005-06-03 2005-07-13 Micromass Ltd Mass spectrometer
CN100483394C (zh) * 2006-04-14 2009-04-29 中国科学院计算技术研究所 一种质谱数据处理中噪音基线识别方法
US8389929B2 (en) * 2010-03-02 2013-03-05 Thermo Finnigan Llc Quadrupole mass spectrometer with enhanced sensitivity and mass resolving power
CN103270575B (zh) * 2010-12-17 2016-10-26 塞莫费雪科学(不来梅)有限公司 用于质谱法的数据采集系统和方法
CN107315046A (zh) * 2017-05-15 2017-11-03 北京毅新博创生物科技有限公司 一种icp‑ms信号处理方法

Also Published As

Publication number Publication date
CN109726667A (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
CN109726667B (zh) 质谱数据处理方法和装置、计算机设备、计算机存储介质
CN112415078B (zh) 一种质谱数据谱图信号校准方法及装置
US8304719B2 (en) Precise and thorough background subtraction
CN107860845B (zh) 自动解析gc-ms重叠峰准确识别化合物的方法
CN114025379B (zh) 一种宽带多信号检测方法、装置和设备
WO2018020363A1 (en) Systems and methods for identifying precursor and product ion pairs in scanning swath data
CN105307095B (zh) 一种基于fft的高分辨率音频频率测量方法
Williams et al. An algorithm for baseline correction of MALDI mass spectra
CN107194971A (zh) 一种金手指定位方法、装置及计算机可读存储介质
CN112463564B (zh) 确定影响主机状态的关联指标的方法及装置
US20140005954A1 (en) Method Of Processing Multidimensional Mass Spectrometry
US20140312220A1 (en) Method for mass analysis
JP2018504601A (ja) 曲線減算を介する類似性に基づく質量分析の検出
CN105721090A (zh) 一种非法调频广播电台的检测和识别方法
EP2483641A1 (en) Systems and methods for maintaining the precision of mass measurement
US10825668B2 (en) Library search tolerant to isotopes
US20200124568A1 (en) Apparatus and method for determining antibiotic resistance using maldi-tof mass spectrometry
CN111239657B (zh) 谱图的相位校正方法、装置及设备
US10309930B2 (en) Dynamic orthogonal analysis method
CN115541021A (zh) 拉曼光谱特征峰的定位方法、电子设备及存储介质
WO2018174757A1 (en) Decision based re-processing framework for radar technology
US10312954B1 (en) Identification of RFI (radio frequency interference)
CN114184668A (zh) 微生物鉴定方法和双极性标准谱图生成方法
CN112395983B (zh) 一种质谱数据峰位置对齐方法及装置
US11721535B2 (en) Apparatus and method for processing mass spectrum

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant