CN114118175A - Maldi-tof质谱信号的预处理方法、设备及介质 - Google Patents
Maldi-tof质谱信号的预处理方法、设备及介质 Download PDFInfo
- Publication number
- CN114118175A CN114118175A CN202111577373.1A CN202111577373A CN114118175A CN 114118175 A CN114118175 A CN 114118175A CN 202111577373 A CN202111577373 A CN 202111577373A CN 114118175 A CN114118175 A CN 114118175A
- Authority
- CN
- China
- Prior art keywords
- maldi
- mass spectrum
- tof mass
- spectrum signal
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001254 matrix assisted laser desorption--ionisation time-of-flight mass spectrum Methods 0.000 title claims abstract description 208
- 238000007781 pre-processing Methods 0.000 title claims abstract description 89
- 238000000034 method Methods 0.000 title claims abstract description 80
- 238000012545 processing Methods 0.000 claims abstract description 80
- 230000008569 process Effects 0.000 claims abstract description 27
- 230000009466 transformation Effects 0.000 claims abstract description 23
- 230000003595 spectral effect Effects 0.000 claims description 35
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 claims description 25
- 238000001819 mass spectrum Methods 0.000 claims description 24
- 238000000354 decomposition reaction Methods 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 22
- 238000004949 mass spectrometry Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 description 9
- 238000009499 grossing Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000005260 corrosion Methods 0.000 description 4
- 230000007797 corrosion Effects 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 230000003628 erosive effect Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
- G06F2218/06—Denoising by applying a scale-space analysis, e.g. using wavelet analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种MALDI‑TOF质谱信号的预处理方法、装置、终端设备及计算机可读存储介质,通过获取待处理的原始MALDI‑TOF质谱信号,并针对所述原始MALDI‑TOF质谱信号进行偶延拓处理;针对所述原始MALDI‑TOF质谱信号进行小波变换得到变换后的MALDI‑TOF质谱信号;从所述变换后的MALDI‑TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI‑TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI‑TOF质谱信号的预处理。本发明能够实现在针对原始MALDI‑TOF质谱信号进行的预处理过程中,通过小波变换将信号的低频和高频进行剥离从而很大程度上保证了整个预处理过程中高低频处理过程互不干扰,提升谱图预处理结果的准确性。
Description
技术领域
本发明涉及语音分析技术领域,尤其涉及一种MALDI-TOF质谱信号的预处理方法、装置、终端设备及计算机可读存储介质。
背景技术
在MALDI-TOF(质谱分析)领域中,输出的原始谱图信号往往因为如蛋白释放不充分、样本结晶差、仪器激光强度不稳定、公频干扰等诸多因素,导致信号基线漂移以及噪声。而这些问题会造成谱图后续寻峰及鉴定算法的严重错误。所以在获得谱图鉴定的峰列表数据之前,应当对原始谱图信号进行预处理。预处理的质量能直接影响之后寻找峰列表、谱图鉴定等步骤的结果。由此可见,研究质谱信号的预处理是研究整个质谱算法的关键基础。
目前,MALDI-TOF原始谱图的预处理一般由基线漂移校准、滤波去噪两部分组成。其中,在基线漂移校准部分,目前广泛采用的是膨胀与腐蚀算法(又称“顶帽”算法或形态学滤波),该方法是将原始信号中较高频的谱峰信息去除,来拟合原始谱图信号的基线,以达到基线漂移校准的目的。但是,质谱信号中不同位置的谱峰的形态受诸多因素影响,其往往是不确定的,比如谱峰宽度在有些位置可以达到上百个Da,而有些位置的窄峰宽度只有几个Da,导致形态学滤波器往往难以选取到合适的参数。若腐蚀程度较小,则原始信号中低频部分的基线很难被完整的过滤出来,易造成谱峰或噪声残留等问题;若腐蚀程度较大,则处理后的信号基线会产生严重畸变,导致接下来去除基线漂移失败。
而对于滤波去噪部分,目前有很多平滑滤波器可供使用,如高斯滤波、滑动平均滤波、Savitzky-Golay滤波(通常简称为S-G滤波)等,这些平滑方法旨在去除原始信号中的高频噪声。选择合适的滑动窗口,平滑滤波器在去噪方面有着很好的效果,目前上述几种滤波器都在该领域广泛被应用。但是受平滑滤波器局限性影响,处理后的谱峰宽度增大,造成谱峰的分辨率降低,对于后续的鉴定算法会有不利影响。
综上,上述MALDI-TOF进行预处理的两个步骤,其目标是去除掉低频部分的基线漂移以及高频部分的噪声,并保留信号中的峰,然而,现有技术无法准确将高、低频部分分开处理,从而造成互相干扰的情况,使谱图预处理结果不准确。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种MALDI-TOF质谱信号的预处理方法、终端设备及计算机可读存储介质,旨在解决现有针对MALDI-TOF质谱信号进行的预处理,在去除掉低频部分的基线漂移以及高频部分的噪声并保留信号中的峰时,无法准确将高、低频部分分开处理,而容易造成互相干扰的情况,导致谱图预处理结果不准确的技术问题。
本发明实施例提出一种MALDI-TOF质谱信号的预处理方法,该MALDI-TOF质谱信号的预处理方法包括:
获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
可选地,所述MALDI-TOF质谱信号的预处理方法还包括:
选取用于针对原始MALDI-TOF质谱信号进行小波变换的小波函数。
可选地,所述针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号的步骤,包括:
调用所述小波函数针对所述原始MALDI-TOF质谱信号进行小波分解得到质谱信号分量;
针对所述质谱信号分量进行多尺度信号处理;
重构进行多尺度信号处理后的质谱信号得到经过小波变换后的MALDI-TOF质谱信号。
可选地,所述质谱信号分量包括:近似分量,所述多尺度信号处理包括:基线漂移去除;
所述针对所述质谱信号分量进行多尺度信号处理的步骤,包括:
针对所述近似分量进行基线漂移去除得到处理后的近似分量。
可选地,所述质谱信号分量包括:细节分量,所述多尺度信号处理包括:高频噪声去除;
所述针对所述质谱信号分量进行多尺度信号处理的步骤,包括:
针对所述细节分量进行高频噪声去除得到处理后的细节分量。
可选地,所述针对所述原始MALDI-TOF质谱信号进行偶延拓处理的步骤,包括:
针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理。
可选地,所述根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分的步骤,包括:
在所述有用部分中确定针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理得到的延拓部分,并分别截断所述延拓部分,以得到与所述原始MALDI-TOF质谱信号等长的经过所述预处理之后的质谱信号。
此外,为实现上述目的,本发明还提供一种MALDI-TOF质谱信号的预处理装置,所述MALDI-TOF质谱信号的预处理装置包括:
获取模块,用于获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
小波变换模块,用于针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
延拓去除模块,用于从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
此外,为实现上述目的,本发明还提供一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的MALDI-TOF质谱信号的预处理程序,所述MALDI-TOF质谱信号的预处理程序被所述处理器执行时实现如上所述的MALDI-TOF质谱信号的预处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有MALDI-TOF质谱信号的预处理程序,所述MALDI-TOF质谱信号的预处理程序被处理器执行时实现如上所述的MALDI-TOF质谱信号的预处理方法的步骤。
本发明实施例提出的一种MALDI-TOF质谱信号的预处理方法、装置、终端设备及计算机可读存储介质,通过获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
本发明通过在获取到待处理的原始MALDI-TOF质谱信号之后,先针对该原始MALDI-TOF质谱信号进行偶延拓处理;然后,基于小波变换处理将该原始MALDI-TOF质谱信号进行变换得到变换后的MALDI-TOF质谱信号;最后,通过从变换后的MALDI-TOF质谱信号中截取出信号的有用部分,从而基于该有用部分将针对原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分进行去除,如此,即完成对该针对原始MALDI-TOF质谱信号进行的预处理过程,从而得到最终的输出图谱信号。
本发明能够实现在针对原始MALDI-TOF质谱信号进行的预处理过程中,通过小波变换将信号的低频和高频进行剥离,从而很大程度上保证了整个预处理过程中高低频处理过程互不干扰,且最终基于小波变换合成后的数据在时域上高、低频都有更好的表现,为后续的寻峰以及鉴定算法提供了可靠的数据质量。
附图说明
图1是本发明实施例方案涉及终端设备的硬件运行环境的结构示意图;
图2为本发明MALDI-TOF质谱信号的预处理方法一实施例的流程示意图;
图3为本发明MALDI-TOF质谱信号的预处理方法一实施例的具体应用流程示意图;
图4为本发明MALDI-TOF质谱信号的预处理方法一实施例涉及的小波函数;
图5为本发明MALDI-TOF质谱信号的预处理方法一实施例涉及小波变换的可视化应用界面;
图6为本发明MALDI-TOF质谱信号的预处理方法一实施例涉及预处理前的谱图信号;
图7为本发明MALDI-TOF质谱信号的预处理方法一实施例涉及预处理后的谱图信号;
图8为本发明MALDI-TOF质谱信号的预处理装置的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:通过获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
由于目前,MALDI-TOF原始谱图的预处理一般由基线漂移校准、滤波去噪两部分组成。其中,在基线漂移校准部分,目前广泛采用的是膨胀与腐蚀算法(又称“顶帽”算法或形态学滤波),该方法是将原始信号中较高频的谱峰信息去除,来拟合原始谱图信号的基线,以达到基线漂移校准的目的。但是,质谱信号中不同位置的谱峰的形态受诸多因素影响,其往往是不确定的,比如谱峰宽度在有些位置可以达到上百个Da,而有些位置的窄峰宽度只有几个Da,导致形态学滤波器往往难以选取到合适的参数。若腐蚀程度较小,则原始信号中低频部分的基线很难被完整的过滤出来,易造成谱峰或噪声残留等问题;若腐蚀程度较大,则处理后的信号基线会产生严重畸变,导致接下来去除基线漂移失败。
而对于滤波去噪部分,目前有很多平滑滤波器可供使用,如高斯滤波、滑动平均滤波、Savitzky-Golay滤波(通常简称为S-G滤波)等,这些平滑方法旨在去除原始信号中的高频噪声。选择合适的滑动窗口,平滑滤波器在去噪方面有着很好的效果,目前上述几种滤波器都在该领域广泛被应用。但是受平滑滤波器局限性影响,处理后的谱峰宽度增大,造成谱峰的分辨率降低,对于后续的鉴定算法会有不利影响。
综上,上述MALDI-TOF进行预处理的两个步骤,其目标是去除掉低频部分的基线漂移以及高频部分的噪声,并保留信号中的峰,然而,现有技术无法准确将高、低频部分分开处理,从而造成互相干扰的情况,使谱图预处理结果不准确。
本发明提供一种解决方案,能够实现在针对原始MALDI-TOF质谱信号进行的预处理过程中,通过小波变换将信号的低频和高频进行剥离,从而很大程度上保证了整个预处理过程中高低频处理过程互不干扰,且最终基于小波变换合成后的数据在时域上高、低频都有更好的表现,为后续的寻峰以及鉴定算法提供了可靠的数据质量。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端设备可以是各种网络终端设备,例如终端服务器,PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面3)播放器、数字广播接收器、穿戴式设备(比如智能手环、智能手表等)、导航装置、便携计算机等可移动式终端设备、或不可移动的终端设备。
如图1所示,该终端设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及MALDI-TOF质谱信号的预处理程序。
在图1所示的终端设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
进一步地,处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
选取用于针对原始MALDI-TOF质谱信号进行小波变换的小波函数。
进一步地,处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
调用所述小波函数针对所述原始MALDI-TOF质谱信号进行小波分解得到质谱信号分量;
针对所述质谱信号分量进行多尺度信号处理;
重构进行多尺度信号处理后的质谱信号得到经过小波变换后的MALDI-TOF质谱信号。
进一步地,所述质谱信号分量包括:近似分量,所述多尺度信号处理包括:基线漂移去除;
处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
针对所述近似分量进行基线漂移去除得到处理后的近似分量。
进一步地,所述质谱信号分量包括:细节分量,所述多尺度信号处理包括:高频噪声去除;
处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
针对所述细节分量进行高频噪声去除得到处理后的细节分量。
进一步地,处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理。
进一步地,处理器1001可以用于调用存储器1005中存储的MALDI-TOF质谱信号的预处理程序,并执行以下操作:
在所述有用部分中确定针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理得到的延拓部分,并分别截断所述延拓部分,以得到与所述原始MALDI-TOF质谱信号等长的经过所述预处理之后的质谱信号。
基于上述硬件结构,提出本发明MALDI-TOF质谱信号的预处理方法的各实施例。
请参照图2,在本发明MALDI-TOF质谱信号的预处理方法第一实施例中,该MALDI-TOF质谱信号的预处理方法包括:
步骤S10,获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
在本实施例中,终端设备在开始进行针对MALDI-TOF质谱信号的预处理时,先获取当前需要进行预处理的原始MALDI-TOF质谱信号。并且,终端设备在获取得到当前需要进行预处理的原始MALDI-TOF质谱信号之后,即针对该原始MALDI-TOF质谱信号进行偶延拓处理。
进一步地,在本实施例中,步骤S10中,“针对所述原始MALDI-TOF质谱信号进行偶延拓处理”的步骤,可以包括:
步骤S101,针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理。
在本实施例中,由于终端设备基于小波变换来针对原始MALDI-TOF质谱信号进行预处理时,小波变换中的小波分解会有边界畸变效应,因此,终端设备需要对原始MALDI-TOF质谱信号的两端都进行延拓。
需要说明的是,在本实施例中,终端设备在对原始MALDI-TOF质谱信号的两端进行延拓时,具体可以采用偶延拓,且延拓长度大于取一个采样窗口长度。
具体地,例如,请参照如图3所示应用流程中的信号拖延。终端设备基于偶延拓函数对于有n+1个离散点的原始MALDI-TOF质谱信号f(x),分别对该f(x)的两端进行偶延拓的延拓信号g(x)的计算公式如下:
需要说明的是,在本实施例中,由于终端设备在针对原始MALDI-TOF质谱信号进行偶延拓处理之后,原始MALDI-TOF质谱信号与延拓部分(或者称做:信号延拓)之间的交界处存在信号突变,而若终端设备没有处理该突变,则会影响后续基线漂移的补偿。因此,本实施例中,终端设备在该交界处将突变处0.2倍拓延的信号点数进行窗口宽为15的中值滤波,一次处理掉该突变。
进一步地,在一种可行的实施例中,本发明MALDI-TOF质谱信号的预处理方法,还可以包括:
步骤A,选取用于针对原始MALDI-TOF质谱信号进行小波变换的小波函数。
在本实施例中,终端设备在基于小波变换针对MALDI-TOF质谱信号进行预处理的过程中,还需要选取得到用于针对该MALDI-TOF质谱信号进行小波变换的小波函数。
具体地,例如,请参照如图3所示的应用流程,终端设备具体可以在针对原始MALDI-TOF质谱信号进行信号延拓之前,就进行选取小波函数的操作。即,终端设备从如图4所示的几种常用的小波函数中,选取合适的小波函数与分解级数,对于MALDI-TOF微生物质谱信号,选取Daubechies 6小波函数进行小波分解,分解级数与采样率以及噪声等级有关,一般分解至6-8级即可。
需要说明的是,在本实施例中,终端设备在选取小波函数是,需要遵循正交性、紧支撑性、对称性、平滑性。即,针对MALDI-TOF微生物质谱信号,具体选取满足上述特性的Daubechies 6来作为针对该MALDI-TOF微生物质进行小波分解的基函数,如此,能较好的将原始的该MALDI-TOF微生物质信号的高、低频特征分离开来。
步骤S20,针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
在本实施例中,终端设备在针对获取得到的当前需要进行预处理的原始MALDI-TOF质谱信号进行偶延拓处理之后,进一步针对该原始MALDI-TOF质谱信号进行小波变换,从而得到小波变换后的MALDI-TOF质谱信号。
进一步地,在本实施例中,步骤S20,可以包括:
步骤S201,调用所述小波函数针对所述原始MALDI-TOF质谱信号进行小波分解得到质谱信号分量;
具体地,例如,请参照如图3所示应用流程中的小波分解操作。终端设备在针对原始MALDI-TOF质谱信号进行信号延拓之后,即开始调用预先选取好的小波函数对该原始MALDI-TOF质谱信号进行小波分解操作。此小波分解操作具体是将一维时域信号分解到小波域,从而将高频的细节部分(又称细节分量),包含噪声和高频谱峰,以及低频的拟态部分(又称近似分量),包含基线和低频谱峰,二者分离开来。经过分解的近似分量,又可以再进行一级小波分解,得到下一级的近似分量和细节分量。如此往复进行下去可将原始信号分解成不同等级的高频噪声信号和低频有用信号。
需要说明的是,在本实施例中,终端设备针对原始MALDI-TOF质谱信号进行的小波分解操作,等效于让该原始MALDI-TOF质谱信号通过不同的高通、低通滤波器。终端设备针对原始MALDI-TOF质谱信号进行小波分解操作的分解过程具体可用以下公式表示:
其中,aj,k和dj,k分别是上面提到的近似分量和细节分量,h2n-k和g2n-k分别是分解低通滤波器和高通滤波器,j为层数,N为离散信号采样点数。对于MALDI-TOF微生物质谱信号,分解级数取7级。因为对于微生物质谱信号,在第7级近似分量能保证畸变较小的前提下剔除掉了绝大多数高频噪声,并有利于做接下来的基线漂移补偿。
步骤S202,针对所述质谱信号分量进行多尺度信号处理;
需要说明的是,在本实施例中,质谱信号分量包括:近似分量,多尺度信号处理包括:基线漂移去除;此外,该质谱信号分量还包括:细节分量,该多尺度信号处理还包括:高频噪声去除;
上述步骤S202,具体可以包括:
步骤S2021,针对所述近似分量进行基线漂移去除得到处理后的近似分量;
步骤S2022,针对所述细节分量进行高频噪声去除得到处理后的细节分量。
具体地,例如,请参照如图3所示应用流程中的低频去基线高频去噪操作。终端设备针对上述经过小波分解操作之后的第7级近似分量(即基于小波分解分离出来的第7级低频信号,其包含的信息主要为谱图信号的基线部分以及谱峰较低频部分),对该近似分量抽取合适的点进行平滑线性插值,可获得平滑基线,该细节分量减去该基线即可去除基线漂移,具体过程为:
1、选取扫描窗口宽度为40,抽值点为各窗口的0.20与0.25分位值,即各窗口内峰强在0.20和0.25位置的点作为该窗口的抽值点;
2、使用平滑线性插值法,将各个窗口的抽值点进行插值连接,得到该细节分量信号的基线;
3、该细节分量信号减去上一步插值法获得的基线,得到基线漂移修正后的低频信号分量。
然后,由于终端设备在后续做信号重构时是将第7级近似分量和1-7级细节分量进行重构,而1至7级细节分量反应的是原始谱图的高频细节部分,其包含的信息主要为谱图的噪声以及谱峰较高频的部分。因此,终端设备对各级细节分量进行合适的降噪处理,即能去除谱图里的噪声,同时能尽最大可能保留峰的形态,具体步骤如:
1、前两级的细节分量大多为纯高频噪声,降噪处理上建议采用全部去除的方式,即设置去噪阈值为0,以节省计算资源与时间;
2、第3级至第7级的细节分量,包含谱图的噪声的同时,也包含谱图的峰信号,所以去噪阈值的设置应该与该级的噪声水平呈正相关。
需要说明的是,在本实施例中,终端设备具体可以采用“绝对中位偏差”(MedianAbsolute Deviation:MAD)来估算该级细节分量的噪声水平。该MAD计算方式如下:
M=argmed(|dj-argmed(dj)|)
在本实施例中,相较于求方差σ来估算噪声水平,MAD利用中位值的特性能有效避开计算过程中峰值所造成的异常值的影响。在实际操作中,往往需要将MAD乘上一个系数k=1.4826来修正估算值。
最后,鉴于MALDI-TOF谱图本身的特点,即在初期时间(即小分子量)处噪声水平较大,后期时间噪声水平较小的特点,可分段设置降噪阈值,将降噪阈值分段点设置为0.10,0.20,0.30,0.4,0.50,0.70,1.00倍的信号采样点,3-7级的分量的阈值系数在k*MAD的基础上再乘上系数3.0,2.5,2.0,1.0,0.0,0.0来分级降噪(乘上0表示该级分量只包含高频谱峰信息,不予以降噪处理)。降噪处理可以采用硬阈值与软阈值法,公式分别如下:
硬阈值法:
软阈值法:
其中,T表示降噪阈值,如上所述,阈值和该细节分量所在级数j以及所在信号位置k有关。在本实施例中,终端设备具体采用软阈值法,相比于硬阈值法,终端设备将未超出阈值部分直接置零,而超出阈值部分只修正超出部分,这样做能使最后的重构信号更平滑,波形更稳定。
需要说明的是,在本实施例,如图3所示流程中的小波分解和低频去基线高频去噪的操作,还可称作小波变换多分辨率分析(Mallat算法),该过程具体可以进行可视化如图5所示的应用界面,其中,左半部分为小波分解出的低频近似分量,右半部分为高频细节分量。
在本实施例中,终端设备通过对近似分量的第7级进行了基线的修正,对细节分量的1-7级进行了不同程度的降噪。
步骤S203,重构进行多尺度信号处理后的质谱信号得到经过小波变换后的MALDI-TOF质谱信号。
具体地,例如,请参照如图3所示应用流程中的小波重构的操作。终端设备将低频修正基线漂移后的近似分量aj以及高频降噪后的细节分量dp、dp-1、dp-2、…、d1进行小波重构,从而得到处理后的时域信号,重构过程可看作通过小波重构滤波器实现的,同一基于Daubechies 6小波函数的重构公式如下:
即处理后的信号:
其中aj,k和dj,k分别是上面提到的近似分量和细节分量,hk-2n和gk-2n分别是重构低通滤波器和高通滤波器。
步骤S30,从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
在本实施例中,终端设备在针对原始MALDI-TOF质谱信号进行小波变换,从而得到小波变换后的MALDI-TOF质谱信号之后,进一步从该小波变换后的MALDI-TOF质谱信号中截取出信号的有用部分,从而,利用该有用部分将针对原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分进行去除,如此,即完成对该针对原始MALDI-TOF质谱信号进行的预处理过程,从而得到最终的输出图谱信号。
进一步地,在一种可行的实施例中,上述步骤S30中,“根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分”的步骤,可以包括:
步骤S301,在所述有用部分中确定针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理得到的延拓部分,并分别截断所述延拓部分,以得到与所述原始MALDI-TOF质谱信号等长的经过所述预处理之后的质谱信号。
具体地,例如,请参照如图3所示应用流程中的截断延拓部分的操作。由于终端设备在针对原始MALDI-TOF质谱信号进行偶延拓,针对该信号的两端都进行了延拓,因此,终端设备在上述小波重构的操作结束后应根据原始MALDI-TOF质谱信号长度,将重构后得到的信号的两端进行截断,从而得到和原始信号等长的处理后的信号,至此,终端设备针对该原始MALDI-TOF质谱信号进行的预处理过程结束。
需要说明的是,在本实施例中,终端设备针对原始MALDI-TOF质谱信号进行预处理前后,该原始MALDI-TOF质谱信号和最终输出的处理后MALDI-TOF质谱信号具体可如图6和图7所示,处理前原始MALDI-TOF质谱信号(图6所示)基线正向漂移明显,经过处理后的MALDI-TOF质谱信号(图7所示)将基线拉回至0处,使信号中各峰起始位置都是相对于零位置,经过修正的峰强度值更利于后续做算法分析。
在本实施例中,终端设备通过上述对原始MALDI-TOF质谱信号进行的预处理,使得该原始MALDI-TOF质谱信号里的高频噪声得到了有效抑制。经过处理后的MALDI-TOF质谱信号(图7所示)放大后可明显看出信号变得更平滑,同时各峰的形态得到了很好的保留,为后续分析谱图各峰的面积、信噪比、分辨率等性能提供了高质量的数据。
在本实施例中,本发明通过在获取到待处理的原始MALDI-TOF质谱信号之后,先针对该原始MALDI-TOF质谱信号进行偶延拓处理;然后,基于小波变换处理将该原始MALDI-TOF质谱信号进行变换得到变换后的MALDI-TOF质谱信号;最后,通过从变换后的MALDI-TOF质谱信号中截取出信号的有用部分,从而基于该有用部分将针对原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分进行去除,如此,即完成对该针对原始MALDI-TOF质谱信号进行的预处理过程,从而得到最终的输出图谱信号。
本发明能够实现在针对原始MALDI-TOF质谱信号进行的预处理过程中,通过小波变换将信号的低频和高频进行剥离,从而很大程度上保证了整个预处理过程中高低频处理过程互不干扰,且最终基于小波变换合成后的数据在时域上高、低频都有更好的表现,为后续的寻峰以及鉴定算法提供了可靠的数据质量。
此外,请参照图8,本发明实施例还提出一种MALDI-TOF质谱信号的预处理装置,所述MALDI-TOF质谱信号的预处理装置包括:
获取模块,用于获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
小波变换模块,用于针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
延拓去除模块,用于从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
优选地,本发明MALDI-TOF质谱信号的预处理装置,还包括:
函数选取模块,用于选取用于针对原始MALDI-TOF质谱信号进行小波变换的小波函数。
优选地,小波变换模块,包括:
小波分解单元,用于调用所述小波函数针对所述原始MALDI-TOF质谱信号进行小波分解得到质谱信号分量;
多尺度信号处理单元,用于针对所述质谱信号分量进行多尺度信号处理;
小波重构单元,用于重构进行多尺度信号处理后的质谱信号得到经过小波变换后的MALDI-TOF质谱信号。
优选地,所述质谱信号分量包括:近似分量,所述多尺度信号处理包括:基线漂移去除;多尺度信号处理单元,还用于针对所述近似分量进行基线漂移去除得到处理后的近似分量。
优选地,所述质谱信号分量包括:细节分量,所述多尺度信号处理包括:高频噪声去除;多尺度信号处理单元,还用于针对所述细节分量进行高频噪声去除得到处理后的细节分量。
优选地,获取模块,还用于针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理。
优选地,延拓去除模块,还用于在所述有用部分中确定针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理得到的延拓部分,并分别截断所述延拓部分,以得到与所述原始MALDI-TOF质谱信号等长的经过所述预处理之后的质谱信号。
本实施例提出的MALDI-TOF质谱信号的预处理装置的各个功能模块在运行时,实现如上所述的MALDI-TOF质谱信号的预处理方法的步骤,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质上存储有MALDI-TOF质谱信号的预处理程序,MALDI-TOF质谱信号的预处理程序被处理器执行时实现如上所述的MALDI-TOF质谱信号的预处理方法的步骤。
本发明计算机可读存储介质具体实施方式可以参照上述MALDI-TOF质谱信号的预处理方法各实施例,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种MALDI-TOF质谱信号的预处理方法,其特征在于,所述MALDI-TOF质谱信号的预处理方法包括:
获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
2.如权利要求1所述的MALDI-TOF质谱信号的预处理方法,其特征在于,所述MALDI-TOF质谱信号的预处理方法还包括:
选取用于针对原始MALDI-TOF质谱信号进行小波变换的小波函数。
3.如权利要求2所述的MALDI-TOF质谱信号的预处理方法,其特征在于,所述针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号的步骤,包括:
调用所述小波函数针对所述原始MALDI-TOF质谱信号进行小波分解得到质谱信号分量;
针对所述质谱信号分量进行多尺度信号处理;
重构进行多尺度信号处理后的质谱信号得到经过小波变换后的MALDI-TOF质谱信号。
4.如权利要求3所述的MALDI-TOF质谱信号的预处理方法,其特征在于,所述质谱信号分量包括:近似分量,所述多尺度信号处理包括:基线漂移去除;
所述针对所述质谱信号分量进行多尺度信号处理的步骤,包括:
针对所述近似分量进行基线漂移去除得到处理后的近似分量。
5.如权利要求3所述的MALDI-TOF质谱信号的预处理方法,其特征在于,所述质谱信号分量包括:细节分量,所述多尺度信号处理包括:高频噪声去除;
所述针对所述质谱信号分量进行多尺度信号处理的步骤,包括:
针对所述细节分量进行高频噪声去除得到处理后的细节分量。
6.如权利要求1所述的MALDI-TOF质谱信号的预处理方法,其特征在于,所述针对所述原始MALDI-TOF质谱信号进行偶延拓处理的步骤,包括:
针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理。
7.如权利要求6所述的MALDI-TOF质谱信号的预处理方法,其特征在于,所述根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分的步骤,包括:
在所述有用部分中确定针对所述原始MALDI-TOF质谱信号的两端分别进行偶延拓处理得到的延拓部分,并分别截断所述延拓部分,以得到与所述原始MALDI-TOF质谱信号等长的经过所述预处理之后的质谱信号。
8.一种MALDI-TOF质谱信号的预处理装置,其特征在于,所述MALDI-TOF质谱信号的预处理装置包括:
获取模块,用于获取待处理的原始MALDI-TOF质谱信号,并针对所述原始MALDI-TOF质谱信号进行偶延拓处理;
小波变换模块,用于针对所述原始MALDI-TOF质谱信号进行小波变换得到变换后的MALDI-TOF质谱信号;
延拓去除模块,用于从所述变换后的MALDI-TOF质谱信号中截取有用部分,并根据所述有用部分去除针对所述原始MALDI-TOF质谱信号进行偶延拓处理得到的延拓部分,以完成针对所述原始MALDI-TOF质谱信号的预处理。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的MALDI-TOF质谱信号的预处理程序,所述MALDI-TOF质谱信号的预处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的MALDI-TOF质谱信号的预处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有MALDI-TOF质谱信号的预处理程序,所述MALDI-TOF质谱信号的预处理程序被处理器执行时实现如权利要求1至7中任一项所述的MALDI-TOF质谱信号的预处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111577373.1A CN114118175A (zh) | 2021-12-21 | 2021-12-21 | Maldi-tof质谱信号的预处理方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111577373.1A CN114118175A (zh) | 2021-12-21 | 2021-12-21 | Maldi-tof质谱信号的预处理方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114118175A true CN114118175A (zh) | 2022-03-01 |
Family
ID=80361938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111577373.1A Pending CN114118175A (zh) | 2021-12-21 | 2021-12-21 | Maldi-tof质谱信号的预处理方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114118175A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536882A (zh) * | 2021-03-08 | 2021-10-22 | 东北电力大学 | 一种多类运动想象脑电信号特征提取及分类方法 |
WO2021217873A1 (zh) * | 2020-04-29 | 2021-11-04 | 平安科技(深圳)有限公司 | 心电信号中基线漂移的滤除方法、装置、设备及存储介质 |
-
2021
- 2021-12-21 CN CN202111577373.1A patent/CN114118175A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021217873A1 (zh) * | 2020-04-29 | 2021-11-04 | 平安科技(深圳)有限公司 | 心电信号中基线漂移的滤除方法、装置、设备及存储介质 |
CN113536882A (zh) * | 2021-03-08 | 2021-10-22 | 东北电力大学 | 一种多类运动想象脑电信号特征提取及分类方法 |
Non-Patent Citations (7)
Title |
---|
乔世杰: "小波图象编码中的对称边界延拓法", 《中国图象图形学报》 * |
卫佳骏等: "LMD端点延拓方法在脉象信号处理中的应用研究", 《计算机应用与软件》 * |
孙永鹏等: "改进EMD在轴承故障诊断中的应用", 《太原科技大学学报》 * |
梁耀等: "一种随钻泥浆脉冲信号的处理方法", 《电子设计工程》 * |
殷锡鸣等: "《高等数学》" * |
顾雯雯等: "小波分析在微型光谱仪信号去噪处理中的应用", 《信息技术》 * |
马壮等: "脉搏波信号中存在的噪声干扰分析及降噪方式研究", 《物联网技术》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7260272B2 (en) | Method and apparatus for noise reduction using discrete wavelet transform | |
Ehrentreich | Wavelet transform applications in analytical chemistry | |
CN111798396A (zh) | 一种基于小波变换的多功能图像处理方法 | |
US20140198992A1 (en) | Linear Transform-Based Image Processing Techniques | |
Meignen et al. | Retrieval of the modes of multicomponent signals from downsampled short-time Fourier transform | |
CN100471230C (zh) | 降噪方法和设备 | |
US20110069904A1 (en) | Image denoising method | |
CN111508518B (zh) | 一种基于联合字典学习和稀疏表示的单通道语音增强方法 | |
Witwit et al. | Global motion based video super-resolution reconstruction using discrete wavelet transform | |
CN113241089A (zh) | 语音信号增强方法、装置及电子设备 | |
He et al. | Multi-stage image denoising based on correlation coefficient matching and sparse dictionary pruning | |
CN111968651A (zh) | 一种基于wt的声纹识别方法及系统 | |
John et al. | A review on application of fourier transform in image restoration | |
Ayas et al. | Single image super resolution based on sparse representation using discrete wavelet transform | |
CN112037151A (zh) | 基于小波分析的图像去噪方法 | |
KR20100101463A (ko) | 노이즈 저감 장치 및 방법 | |
CN111192204A (zh) | 一种图像增强方法、系统和计算机可读存储介质 | |
CN113436078A (zh) | 一种自适用图像超分辨率重构方法及装置 | |
Serbes et al. | Modified dual tree complex wavelet transform for processing quadrature signals | |
JP2009098742A (ja) | 画像処理装置、画像処理方法及びそのプログラム | |
Satapathy et al. | Bio-medical image denoising using wavelet transform | |
CN114118175A (zh) | Maldi-tof质谱信号的预处理方法、设备及介质 | |
CN112185405A (zh) | 一种基于差分运算和联合字典学习的骨导语音增强方法 | |
CN116385898A (zh) | 一种卫星影像处理的方法和系统 | |
CN113611321B (zh) | 一种语音增强方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220301 |