CN110895799B - 提高质谱谱图质量的方法、计算机存储介质、以及电子终端 - Google Patents

提高质谱谱图质量的方法、计算机存储介质、以及电子终端 Download PDF

Info

Publication number
CN110895799B
CN110895799B CN201811069850.1A CN201811069850A CN110895799B CN 110895799 B CN110895799 B CN 110895799B CN 201811069850 A CN201811069850 A CN 201811069850A CN 110895799 B CN110895799 B CN 110895799B
Authority
CN
China
Prior art keywords
spectrogram
quality
mass
spectrum
spectrograms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811069850.1A
Other languages
English (en)
Other versions
CN110895799A (zh
Inventor
张小强
周旭
孙文剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Research Laboratory Shanghai Co Ltd
Original Assignee
Shimadzu Research Laboratory Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Research Laboratory Shanghai Co Ltd filed Critical Shimadzu Research Laboratory Shanghai Co Ltd
Priority to CN201811069850.1A priority Critical patent/CN110895799B/zh
Publication of CN110895799A publication Critical patent/CN110895799A/zh
Application granted granted Critical
Publication of CN110895799B publication Critical patent/CN110895799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4053Super resolution, i.e. output image resolution higher than sensor resolution
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明提供一种提高质谱谱图质量的方法,其包括:针对属于同一种类的样品,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图;重复步骤1得到多份具有较低谱图质量的谱图和具有较高谱图质量的谱图,以作为建模样本;将所述建模样本中的具有较低谱图质量的谱图作为模型输入,具有较高谱图质量的谱图作为模型的目标输出,通过深度学习算法进行训练以得到从较低谱图质量的谱图转换到较高谱图质量的谱图的转换模型;以所述建模样本之外其它的具有较低谱图质量的谱图作为输入,通过所述转换模型得到其对应的具有较高谱图质量的谱图。本发明具有深度学习算法效率高,精准度高等技术效果。

Description

提高质谱谱图质量的方法、计算机存储介质、以及电子终端
技术领域
本发明涉及质谱分析技术领域,特别是涉及提高质谱谱图质量的方法、计算机存储介质、以及电子终端。
背景技术
质谱谱图的质量(quality)通常由几个参数确定,比如谱图的信噪比,分辨率、质量精度或者质谱峰型。以分辨率为例,质谱仪器的分辨率可反映质谱仪分辨两个相邻质谱峰的能力,例如计算方法为M/ΔM,其中M为峰位的质量数,ΔM为半高峰宽。质谱仪器的分辨率由多种因素决定,比如在飞行时间质谱仪中,分辨率与仪器物理尺寸(如飞行管长度)、离子光学参数(如入射离子束相空间分布)、电学参数(如电压幅值和稳定性)、检测器及信号处理手段(如ADC或TDC)等都有关系。
对质谱信号进行适当的信号处理,可提高最终输出的质谱谱图的谱图质量。最简单常用的,比如可以使用数字平滑或滤波的算法,或者曲线求导及拟合的算法,以降低噪音,提高信噪比。对于谱图的分辨率及质量精度同样可以有多种处理的办法。例如,在专利US6870156中,将从模数转换器(ADC)得到的每张原始谱图进行检峰处理,并将一组处理过的原始谱图求和以得到直方图,最后做平滑光顺等处理得到高分辨谱图;在专利US8063358中,也用到了类似的方法,但是给出了一个特殊的利用二次导数来进行检峰的算法;在专利US8723108中,利用参考样品的信息,对每张原始谱图和其平均谱图分别进行检峰,再用平均谱图的峰位去校正每张原始谱图的峰位,最后重新做和谱以得到高分辨、高质量精度的谱图。
但需要说明的是,尽管这些信号处理算法属于对原始的“真”信号的数学处理,但该处理过程旨在对信号造成展宽、或者峰型畸变、或者带来噪音的一些实际因素加以消除,因此得到的信号或谱图仍然可被认为是“真”的结果。这些方法也在商业仪器中得到了广泛的利用。
为了得到这些信号处理或者谱图处理的算法,通常需要专业研究人员花费大量的时间和精力,例如:需要对一定数量的质谱谱图进行验证,以选择合适的算法,以及确定算法中的各种参数。即使如此,这些算法的适用性也往往存疑。比如,对谱图质量的提升有限,或者只适用于某些特定的质量段或者特定的基质条件,或者在提升某一参数的同时降低了另一参数(如提高分辨率的同时降低了信噪比),或者在处理后出现伪峰、丢峰等。究其原因,这些传统的信号处理算法都是基于人类研究人员对于质谱仪器和谱图处理理论的理解而尝试做出的,人类研究人员很难从海量的数据中自动选择和优化算法。
近年来,人工智能和深度学习算法的爆发性发展,加速了多个领域的研究进展。比如在图像处理领域,已经有比较成熟的深度学习算法,可以显著提高图像的质量。这方面的进展在文献arXiv:1706.09077v1中有较清楚的介绍,使用卷积神经网络(CNN)深度学习算法,配以相当程度的训练数据库,可以提高图像、视频或者深度地图中的分辨率。目前类似的深度学习算法也在质谱领域有了一些应用,但主要使用在谱图识别或者处理后数据统计相关的方面,比如文献arXiv:1705.01015v3中,利用深度学习中的深度卷积网络来提取肿瘤上的成像质谱(Imaging MS)的图像特征,从而对肿瘤进行分类和分析;又比如文献AnalChem.2017,89(23):12690-1269中,构建了一个深度神经网络模型来预测肽段中的子离子谱图,可以达到较高的准确率。但目前为止,还从未有人将深度学习的概念应用于质谱谱图质量的提升上。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供提高质谱谱图质量的方法、计算机可读存储介质、以及电子终端,用于解决现有技术中虽然已有一些提高质谱谱图的方法,但其效果都不尽如人意等技术问题。
为实现上述目的及其他相关目的,本发明提供一种提高质谱谱图质量的方法,所述方法包括如下步骤:步骤1:针对属于同一种类的样品,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图;其中,所述谱图质量与如下参数中的一种或多种相关:谱图的信噪比、分辨率、质量精度或者质谱峰型;步骤2:重复步骤1得到多份具有较低谱图质量的谱图和具有较高谱图质量的谱图,以作为建模样本;步骤3:将所述建模样本中的具有较低谱图质量的谱图作为模型输入,具有较高谱图质量的谱图作为模型的目标输出,通过深度学习算法进行训练以得到从较低谱图质量的谱图转换到较高谱图质量的谱图的转换模型;步骤4:以所述建模样本之外其它的具有较低谱图质量的谱图作为输入,通过所述转换模型得到其对应的具有较高谱图质量的谱图。
于本发明的一实施例中,所述步骤3具体包括:步骤S31:对所述具有较低谱图质量的谱图进行一维卷积或二维卷积,以输出得到第一卷积层;步骤S32:基于池化算法对所述第一卷积层进行池化处理,以输出得到采样层;步骤S33:基于激活函数算法对所述采样层进行处理,以输出得到激活函数层;步骤S34:对所述激活函数层进行卷积处理,以输出得到第二卷积层。
于本发明的一实施例中,所述步骤3还包括:步骤S35:重复步骤S32~S34多次,以得到更深深度的各层;步骤S36:以各层的数据作为残差深度学习网络模型的输入进行训练,以输出得到全连接层;步骤S37:基于上采样算法对所述全连接层进行上采样处理,以输出得到残差层;步骤S38:将所述残差层与所述具有较低谱图质量的谱图的原始数据或处理后的数据进行耦合,并将耦合后的数据与所述具有较高谱图质量的谱图的原始数据或处理后的数据进行比对,根据比对结果修改各层参数,其中,所述参数包括卷积核;步骤S39:针对所述多份具有较低谱图质量的谱图和具有较高谱图质量的谱图,重复步骤S31~S38,以使转换模型各层的参数收敛至最优区间。
于本发明的一实施例中,所述深度学习算法包括:基于卷积神经网络(CNN)的算法、基于递归神经网络(RNN)的算法、或者基于生成式对抗网络(GAN)的算法中的任意一种或多种组合。
于本发明的一实施例中,所述质谱仪包括质量分析器,所述质量分析器的类型包括:四极杆质量分析器、离子阱质量分析器、飞行时间质量分析器、或者傅立叶变换型质量分析器。
于本发明的一实施例中,在步骤1中,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,包括:在同一台质谱仪或者同一型号的两台质谱仪中设置不同的参数条件,以得到谱图质量不同的谱图。
于本发明的一实施例中,在步骤1中,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,包括:使用不同型号或者不同性能的两台质谱仪分别得到谱图质量不同的谱图。
于本发明的一实施例中,在步骤1中,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,包括:所述具有较低谱图质量的谱图由质谱仪通过分析实际样品得到;所述具有较高谱图质量的谱图为该样品通过理论计算得到的理论图谱,或者从数据库中查得的图谱。
于本发明的一实施例中,在执行步骤1之后且执行步骤2之前,或者在执行步骤2之后且执行步骤3之前,可执行步骤5;其中,令步骤1中的样品为第一样品,所述步骤5包括:使用与所述第一样品分属于不同类的一或多种第二样品,通过所述质谱仪得到所述第二样品对应的具有较低谱图质量的谱图和具有较高谱图质量的谱图。
于本发明的一实施例中,所述质谱仪与色谱仪联用,通过所述质谱仪和色谱仪得到相应的色谱-质谱谱图;其中,所述色谱-质谱谱图的二维或者更高维数据用作所述建模样本,以通过深度学习算法进行训练。
于本发明的一实施例中,所述质谱仪与离子迁移谱仪联用,通过所述质谱仪和离子迁移谱仪得到相应的离子迁移谱-质谱谱图;所述离子迁移谱-质谱谱图的二维或者更高维数据用作所述建模样本,以通过深度学习算法进行训练。
为实现上述目的及其他相关目的,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述提高质谱谱图质量的方法。
为实现上述目的及其他相关目的,本发明提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述电子终端执行所述提高质谱谱图质量的方法。
如上所述,本发明的提高质谱谱图质量的方法、计算机存储介质、以及电子终端,与传统的质谱谱图信号处理算法以及提高质谱谱图的谱图质量的方法相比,具有以下有益效果:1)该发明中利用深度学习算法来进行谱图质量提升,可大大缩短算法的开发时间;2)使用较大的训练数据库可以取得更好的质量提升效果,例如:更高的信噪比提升、更高的分辨率提升、更准确的质量精度、或者更好的质谱峰型,并更有效地避免了伪峰、丢峰等现象的发生;3)本发明适用的质谱仪器的种类广泛,甚至可以在低性能、低成本的质谱仪器上实现高端仪器的质谱谱图质量,节省开发成本且扩大应用范围。
附图说明
图1显示为本发明第一实施例的方法的流程图。
图2a显示为本发明第一实施例中两张不同分辨率质谱谱图中低分辨率谱图的示意图。
图2b显示为本发明第一实施例中两张不同分辨率质谱谱图中高分辨率谱图的示意图。
图3显示为本发明第二实施例的方法的流程图。
图4a显示为本发明第二实施例中两张不同信噪比质谱谱图中低信噪比谱图的示意图。
图4b显示为本发明第二实施例中两张不同信噪比质谱谱图中高信噪比谱图的示意图。
图5显示为本发明第三实施例的方法的流程图。
图6显示为本发明一实施例中电子终端的示意图。
元件标号说明
61                  处理器
62                  存储器
63                  通信接口
64                  系统总线
S11~S14            方法流程
S31~S34            方法流程
S51~S54            方法流程
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
如图1所示,展示本发明第一实施例中提高质谱谱图质量的方法的流程图。于本实施例中,所述方法用于提高质谱谱图的分辨率,该方法的流程具体包括:
S11:针对属于同一种类的样品,通过质谱仪得到具有较低分辨率的谱图和具有较高分辨率的谱图。需要说明的是,本发明中所述的质谱仪可以是任意种类的质谱仪。举例来说,正交式飞行时间质谱仪可在不同的分辨率模式下工作,并得到如图2a所示的低分辨率图谱,以及如图2b所示的高分辨率图谱。
S12:重复步骤S11得到多份具有较低分辨率的谱图和具有较高分辨率的谱图,以作为建模样本。需要说明的是,本发明中所述的多份具有较低谱图质量的谱图和具有较高谱图质量的谱图是指大量的质谱谱图,以在后续的深度学习算法中取得较好的训练效果。
值得注意的是,所述大量的质谱谱图既可是指全质量段的质谱谱图,也可以是指质谱谱图的分段。以飞行时间质谱为例:全质量段为0到2000,可将每10个质量数作为一段,则一张全质量段谱图即可得到200个质量段数据用于后续的机器学习。利用质谱谱图的分段作为所述大量的质谱谱图,一是更利于提升数据获取的效率,从有限的原始数据中获取大量数据;二是分段的质谱谱图相比于全质量段的质谱谱图更有利于快速进行深度学习;三是有利于抑制过拟合。
S13:将所述建模样本中的低分辨率谱图作为模型输入,高分辨率谱图作为模型的目标输出,通过深度学习算法进行训练以得到从低分辨率谱图转换到高分辨率谱图的转换模型。所述深度学习算法可以是:基于卷积神经网络(CNN)的算法、基于递归神经网络(RNN)的算法、或者基于生成式对抗网络(GAN)的算法,本发明对此不作限定。下文以基于卷积神经网络(CNN)的算法作为优选,举例说明深度学习算法提高谱图分辨率的步骤:
S131:在不引入位置信息即质量轴数据的情况下,对低分辨率谱图的原始数据或者处理后的数据进行一维卷积;也可针对低分辨率谱图的原始数据或者处理后的数据再加入一阶导数或者二阶导数之后进行二维卷积。可选的,在其他的实施例中也可引入质量轴数据以增加卷积维度,从而提高某些设备部分质量段的分辨率,上述操作的输出可定义为卷积层。
S132:基于池化算法对上述卷积层进行池化,池化处理后的输出定义为采样层。可选的,基于上采样算法对上述采样层进行上采样处理,以修改数据尺寸。需要说明的是,步骤S132为可选步骤而非必选步骤。
S133:基于激活函数对上述采样层进行处理,处理后的输出定义为激活函数层。可选的,基于上采样算法对上述激活函数层进行上采样处理,以修改数据尺寸。其中,所述激活函数例如为:RELU函数、ELU函数、sigmod函数、或者tanh函数等等,本发明对此不作限定。同样需要说明的是,步骤S133亦为可选步骤而非必选步骤。
S134:对所述激活函数层进行卷积处理,卷积处理后的输出定义为新的卷积层。需要说明的是,已经收敛完成的每一层的参数数据即为从低分辨率谱图到高分辨率谱图的转换模型。所述转换模型可用于其他未经历过训练的低分辨率谱图,以得到对应的高分辨率谱图。
S135:重复步骤S132~S134若干次,以得到更深深度的各层,并选取部分的所述采样层、激活函数层、或者新的卷积层进行保存。
S136:步骤S131~S135处理完成后得到的数据作为残差深度学习网络或其他深度学习网络模型的输入进行训练,将输出定义为全连接层。
S137:基于上采样算法对所述全连接层进行上采样处理,具体可与步骤S135中保存的数据进行耦合,重复若干次,输出定位为残差层。
S138:将所述残差层与低分辨率谱图的原始数据或处理后的数据进行耦合,将耦合后的数据与高分辨率谱图的原始数据或处理后的数据进行比对,根据比对结果修改上述各层的卷积核参数。
S139:针对大量的质谱图数据,重复步骤S131~S138,以使各层的卷积核参数收敛至合适的区间。
需要说明的是,上述各步骤可有效提高质谱谱图的分辨率,分辨率的提升效果取决于建模样本谱图的数量,还取决于建模样本谱图自身的分辨率。增加训练数据的数据量,并采用收敛性更好、拟合程度更高的算法,可提高算法的准确度,减少丢峰、伪峰等现象。此外,用于训练的高分辨率谱图决定了最终可得到的分辨率,比如,如果采用傅立叶变换型质量分析器(如FT-ICR或者Orbitrap)得到的谱图作为高分辨率谱图,最终可得到超过10万分辨率的谱图。
S14:以所述建模样本之外其它的具有较低分辨率的谱图作为输入,通过所述转换模型得到其对应的具有较高分辨率的谱图,所述其他的具有较低分辨率的谱图主要是指未经过深度学习训练的待提升分辨率的谱图。至此,本发明通过大量不同分辨率的谱图得到转换模型,并将该转换模型用于所述建模样本之外其它的具有较低分辨率的谱图,从而实现提升谱图的谱图质量。
如图3所示,展示本发明第二实施例中提高质谱谱图信噪比的方法流程图。所述方法具体包括:
S31:针对属于同一种类的样品,通过质谱仪得到具有较低信噪比的谱图和具有较高信噪比的谱图。
S32:重复步骤S31得到多份具有较低信噪比的谱图和具有较高信噪比的谱图,以作为建模样本。
S33:将所述建模样本中的低信噪比谱图作为模型输入,高信噪比谱图作为模型的目标输出,通过深度学习算法进行训练以得到从低信噪比谱图转换到高信噪比谱图的转换模型。
S34:以所述建模样本之外其它的具有较低信噪比的谱图作为输入,通过所述转换模型得到其对应的具有较高信噪比的谱图。
需要说明的是,本发明第二实施例的实施方式与第一实施例的实施方式类似,不同之处仅在于第二实施例中需获取大量具有不同信噪比的质谱谱图,而第一实施例中获取的是大量具有不同分辨率的质谱谱图。
如图4a和4b所示,展示本发明于第二实施例中低信噪比的质谱谱图与高信噪比的质谱谱图的示意图。为得到信噪比不同的两种质谱谱图,具体可选用同一种类、但不同浓度的样品来获取,或者选用质谱条件不同的同一样品来获取。另外需要指出的是,第二实施例虽于第一实施例的实施方式类似,但在实施结果上会有产生不同效果的可能性,在实际的应用中还需根据不同的目的选择相应的步骤。
如图5所示,展示本发明第三实施例中提高质谱谱图质量精度的方法流程图。所述方法具体包括:
S51:针对属于同一种类的样品,通过质谱仪得到具有较低质量精度的谱图和具有较高质量精度的谱图。
S52:重复步骤S31得到多份具有较低质量精度的谱图和具有较高质量精度的谱图,以作为建模样本。
S53:将所述建模样本中的低质量精度谱图作为模型输入,高质量精度谱图作为模型的目标输出,通过深度学习算法进行训练以得到从低质量精度谱图转换到高质量精度谱图的转换模型。
S54:以所述建模样本之外其它的具有较低质量精度的谱图作为输入,通过所述转换模型得到其对应的具有较高质量精度的谱图。需要说明的是,本发明第三实施例的实施方式与第一实施例、第二实施例的实施方式类似,不同之处仅在于第三实施例中需获取大量具有不同质量精度的质谱谱图,而第二实施例中需获取大量具有不同信噪比的质谱谱图,第一实施例中获取的是大量具有不同分辨率的质谱谱图。
本发明还提供未图示的第四实施例,该实施例对于影响质谱谱图质量的另外一个参数质谱峰型,也可以用完全类似与以上三个实施例的步骤来进行改善,其过程不再赘述。
需要说明的是,上述几个实施例基于不同的参数分别描述了如何利用深度学习算法提高质谱谱图质量的方法和流程,本发明还可将上述实施例中的方法加以综合,以同时提高其中的两个或更多个参数。举例来说:在实际的仪器中,灵敏度(信噪比)和分辨率往往是互相制约的因素。而在以往的信号处理算法中,若提高了分辨率往往信噪比会降低,或者出现相对的峰高或峰面积的比例失真,影响了定性定量。但在本发明的方法中,只要选用同时具备高信噪比、高分辨率的谱图用以训练,即可避免这种制约因素,同时提高信噪比和分辨率。又比如,本领域技术人员皆知的是,尽管分辨率和质量精度没有直接关系,但没有高的分辨率,不可能有准确的质量精度。在仪器硬件的改进中,提高分辨率本身,也往往会带来较高的质量精度。但对于采用信号处理算法来提高谱图分辨率的方法,往往会带来质量精度的偏移。而用本发明的方法中,只要选用同时具备高分辨率、高质量精度的谱图用以训练,即可以同时提高分辨率和质量精度。
上述各实施例中的深度学习算法,包括基于卷积神经网络(CNN)的算法,基于递归神经网络(RNN)的算法,基于生成式对抗网络(GAN)的算法等,或者将以上算法组合起来使用。或者使用深度学习领域其它合适的算法。比如,使用GAN算法可以代替实施例一中步骤S13中的残差深度学习方法,以取得可能的更快的收敛或者更好的拟合。
上述各实施例中质谱仪包括质量分析器,所述质量分析器的类型可以是四极杆质量分析器、离子阱质量分析器、飞行时间质量分析器、或者傅立叶变换型质量分析器等等。
上述各实施例中得到通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,其方法有多种。例如:在同一台质谱仪或者同一型号的两台质谱仪中设置不同的参数设置条件,比如,商业的飞行时间质谱仪中,一般可以设置“低分辨率高灵敏度”或者“高分辨率低灵敏度”模式,以获得不同质量的谱图;具体的,若使用四极杆质谱仪,可以设置不同的扫描顶点以得到不同的分辨率和灵敏度;若使用傅立叶变换型质谱仪,可以设置不同的扫描速度以得到不同的分辨率。
得到具有较低谱图质量的谱图和具有较高谱图质量的谱图的方法还例如:使用不同分辨率的两台质谱仪分别得到所述两张质谱谱图,所述两台质谱仪可以是同一类型但具有不同的性能的两台质谱仪,比如,两台质谱仪都使用飞行时间质谱仪,但其中一台的飞行管长度为50cm,另一台的飞行管长度为100cm,可得到对应于同一样品的不同的分辨率谱图;所述两台质谱仪也可以是不同类型的质谱仪,比如,其中一台是只有单位质量分辨的四极杆质谱仪,另一台是具有高分辨率的傅立叶变换型质谱仪。在使用不同的质谱仪时,需要注意要选用相同的样品和体系。另外,除了要提高的谱图质量的参数之外,例如分辨率,其它的参数,例如质量范围,尽量选用相同的条件,以提高深度学习算法的准确度。
上述各实施例中,还有一种得到两张不同谱图质量的质谱谱图的方法。即,所述较低谱图质量的谱图由质谱仪实际分析样品得到,比如,选用四极杆质谱仪对胰岛素样品进行分析得到真实的谱图。而较高谱图质量的质谱谱图为该样品通过理论计算得到的理论谱图,或者为从数据库中查到的谱图。比如,选用50k的分辨率,使用相关的软件,可计算得到胰岛素的理论谱图。
需要说明的是,上述各实施例中的低、高谱图质量的谱图数据,虽需来自同一种类的样品。但是可以添加一个步骤在上述用一种样品分别得到一组低、高谱图质量的谱图之后,或者在上述已经用一种样品分别得到大量的低、高谱图质量的谱图之后;在添加的这个步骤中,使用不同于以上所述的其它一种或多种样品,在质谱仪中分别得到较低谱图质量和较高谱图质量的谱图。
上述各实施例中,质谱仪可以跟色谱仪或者离子迁移谱仪联用,得到色谱-离子迁移谱-质谱的多维数据。以这种多维数据作为进行深度学习的训练样本。比如,在色谱-质谱联用时,有色谱保留时间和质荷比的两维信息,在每个色谱保留时间,质荷比的点上均有一个离子信号强度的值。对比于图像处理,比如黑白图像,色谱保留时间和质荷比相当于图像的x和y方向,离子信号强度相当于该点的灰度值。这样,提升色谱-质谱谱图的质量就非常类似于增强图像质量。加入离子迁移谱相当于再增加一个维度,可类比视频图像中的时间轴,提升色谱-离子迁移谱-质谱的谱图质量就类似于增强视频图像的质量。当然,在实际的深度学习算法中,会根据谱图的特征选择合适的转换模型,如第一个实施例中所述。上述用作训练样本的色谱-离子迁移谱-质谱的谱图,仍然是一一对应的低质量谱图和高质量谱图。这里,优选质谱的数据为低质量谱图和高质量谱图的区分。但是,该方法也可扩充至,利用低质量的色谱谱图和高质量的色谱谱图作为训练样本,用深度学习训练得到转换模型,以提高色谱谱图的谱图质量;或者利用低质量的离子迁移谱谱图和高质量的离子迁移谱谱图作为训练样本,用深度学习训练得到转换模型,以提高离子迁移谱谱图的谱图质量。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
如图6所示,展示本发明一实施例中电子终端的示意图。所述电子终端包括处理器61及存储器62,所述存储器62和通信接口63通过系统总线64与处理器61连接并完成相互之间的通信,所述存储器62用于存储计算机程序,所述通信接口63用于和其他设备进行通信,所述处理器61用于执行所述存储器62存储的计算机程序,以使所述电子终端执行所述提高质谱谱图质量的方法。
上述提到的系统总线可以是外设部件互连标准(PeripheralPomponentInterconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(RandomAccessMemory,简称RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明提供的提高质谱谱图质量的方法、计算机存储介质、以及电子终端,缩短了深度学习算法的开发周期短并提升了效率;使用较大的训练数据库可以取得更好的质量提升效果,例如:更高的信噪比提升、更高的分辨率提升、或者更准确的质量精度,并更有效地避免了伪峰、丢峰等现象的发生;此外,本发明适用的质谱仪器的种类广泛,甚至可以在低性能、低成本的质谱仪器上实现高端仪器的质谱谱图质量,节省开发成本且扩大应用范围。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (13)

1.一种提高质谱谱图质量的方法,其特征在于,所述方法包括如下步骤:
步骤1:针对属于同一种类的样品,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图;其中,所述谱图质量与如下参数中的一种或多种相关:谱图的信噪比、分辨率、质量精度或者质谱峰型;
步骤2:重复步骤1得到多份具有较低谱图质量的谱图和具有较高谱图质量的谱图,以作为建模样本;
步骤3:将所述建模样本中的具有较低谱图质量的谱图作为模型输入,具有较高谱图质量的谱图作为模型的目标输出,通过深度学习算法进行训练以得到从较低谱图质量的谱图转换到较高谱图质量的谱图的转换模型;
步骤4:以所述建模样本之外其它的具有较低谱图质量的谱图作为输入,通过所述转换模型得到其对应的具有较高谱图质量的谱图。
2.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,所述步骤3具体包括:
步骤S31:对所述具有较低谱图质量的谱图进行一维卷积或二维卷积,以输出得到第一卷积层;
步骤S32:基于池化算法对所述第一卷积层进行池化处理,以输出得到采样层;
步骤S33:基于激活函数算法对所述采样层进行处理,以输出得到激活函数层;
步骤S34:对所述激活函数层进行卷积处理,以输出得到第二卷积层。
3.根据权利要求2所述的提高质谱谱图质量的方法,其特征在于,所述步骤3还包括:
步骤S35:重复步骤S32~S34多次,以得到更深深度的各层;
步骤S36:以各层的数据作为残差深度学习网络模型的输入进行训练,以输出得到全连接层;
步骤S37:基于上采样算法对所述全连接层进行上采样处理,以输出得到残差层;
步骤S38:将所述残差层与所述具有较低谱图质量的谱图的原始数据或处理后的数据进行耦合,并将耦合后的数据与所述具有较高谱图质量的谱图的原始数据或处理后的数据进行比对,根据比对结果修改各层参数,其中,所述参数包括卷积核;
步骤S39:针对所述多份具有较低谱图质量的谱图和具有较高谱图质量的谱图,重复步骤S31~S38,以使转换模型各层的参数收敛至最优区间。
4.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,所述深度学习算法包括:基于卷积神经网络(CNN)的算法、基于递归神经网络(RNN)的算法、或者基于生成式对抗网络(GAN)的算法中的任意一种或多种组合。
5.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,所述质谱仪包括质量分析器,所述质量分析器的类型包括:四极杆质量分析器、离子阱质量分析器、飞行时间质量分析器、或者傅立叶变换型质量分析器。
6.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,在步骤1中,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,包括:在同一台质谱仪或者同一型号的两台质谱仪中设置不同的参数条件,以得到谱图质量不同的谱图。
7.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,在步骤1中,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,包括:使用不同型号或者不同性能的两台质谱仪分别得到谱图质量不同的谱图。
8.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,在步骤1中,通过质谱仪得到具有较低谱图质量的谱图和具有较高谱图质量的谱图,包括:
所述具有较低谱图质量的谱图由质谱仪通过分析实际样品得到;所述具有较高谱图质量的谱图为该样品通过理论计算得到的理论图谱,或者从数据库中查得的图谱。
9.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,在执行步骤1之后且执行步骤2之前,或者在执行步骤2之后且执行步骤3之前,可执行步骤5;其中,令步骤1中的样品为第一样品,所述步骤5包括:
使用与所述第一样品分属于不同类的一或多种第二样品,通过所述质谱仪得到所述第二样品对应的具有较低谱图质量的谱图和具有较高谱图质量的谱图。
10.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,所述质谱仪与色谱仪联用,通过所述质谱仪和色谱仪得到相应的色谱-质谱谱图;其中,所述色谱-质谱谱图的二维或者更高维数据用作所述建模样本,以通过深度学习算法进行训练。
11.根据权利要求1所述的提高质谱谱图质量的方法,其特征在于,所述质谱仪与离子迁移谱仪联用,通过所述质谱仪和离子迁移谱仪得到相应的离子迁移谱-质谱谱图;所述离子迁移谱-质谱谱图的二维或者更高维数据用作所述建模样本,以通过深度学习算法进行训练。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至11中任一项所述的提高质谱谱图质量的方法。
13.一种电子终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述电子终端执行如权利要求1至11中任一项所述提高质谱谱图质量的方法。
CN201811069850.1A 2018-09-13 2018-09-13 提高质谱谱图质量的方法、计算机存储介质、以及电子终端 Active CN110895799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811069850.1A CN110895799B (zh) 2018-09-13 2018-09-13 提高质谱谱图质量的方法、计算机存储介质、以及电子终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811069850.1A CN110895799B (zh) 2018-09-13 2018-09-13 提高质谱谱图质量的方法、计算机存储介质、以及电子终端

Publications (2)

Publication Number Publication Date
CN110895799A CN110895799A (zh) 2020-03-20
CN110895799B true CN110895799B (zh) 2023-05-09

Family

ID=69785607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811069850.1A Active CN110895799B (zh) 2018-09-13 2018-09-13 提高质谱谱图质量的方法、计算机存储介质、以及电子终端

Country Status (1)

Country Link
CN (1) CN110895799B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115280143A (zh) * 2020-03-27 2022-11-01 文塔纳医疗系统公司 用于识别质谱响应曲线中的至少一个峰的计算机实现的方法
CN112505133B (zh) * 2020-12-28 2023-09-12 黑龙江莱恩检测有限公司 一种基于深度学习的质谱检测方法
CN116310566B (zh) * 2023-03-23 2023-09-15 华谱科仪(北京)科技有限公司 色谱数据图处理方法、计算机设备和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002042733A2 (en) * 2000-11-16 2002-05-30 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
EP1766394A2 (en) * 2004-05-20 2007-03-28 Waters Investments Limited System and method for grouping precursor and fragment ions using selected ion chromatograms
CN108062744A (zh) * 2017-12-13 2018-05-22 中国科学院大连化学物理研究所 一种基于深度学习的质谱图像超分辨率重建方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020193950A1 (en) * 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002042733A2 (en) * 2000-11-16 2002-05-30 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
EP1766394A2 (en) * 2004-05-20 2007-03-28 Waters Investments Limited System and method for grouping precursor and fragment ions using selected ion chromatograms
CN108062744A (zh) * 2017-12-13 2018-05-22 中国科学院大连化学物理研究所 一种基于深度学习的质谱图像超分辨率重建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢丹丹 ; 张胜利 ; 刘佳宜 ; 王滔滔 ; .基于支持向量机的串联质谱图谱峰预处理.广州化工.2017,(08),全文. *

Also Published As

Publication number Publication date
CN110895799A (zh) 2020-03-20

Similar Documents

Publication Publication Date Title
CN110895799B (zh) 提高质谱谱图质量的方法、计算机存储介质、以及电子终端
US10296813B2 (en) Training method and apparatus for neural network for image recognition
CN110674835B (zh) 一种太赫兹成像方法及系统和一种无损检测方法及系统
US8743138B2 (en) Method and system for processing mass analysis data
JP6813033B2 (ja) 分析データ解析方法および分析データ解析装置
CN112418072A (zh) 数据处理方法、装置、计算机设备和存储介质
CN108982729A (zh) 用于提取质量迹线的系统和方法
US8560248B2 (en) Systems and methods for extending the dynamic range of mass spectrometry
EP3584795B1 (en) 3d mass spectrometry predictive classification
US7680606B2 (en) Two-step method to align three dimensional LC-MS chromatographic surfaces
CN112819769B (zh) 基于核函数和联合字典的非线性高光谱图像异常探测算法
JP2022534468A (ja) 走査型swathデータのリアルタイムエンコーディングおよび前駆体推測のための確率的フレームワークのための方法
KR20200018247A (ko) 멀티 모달 입력 기반의 뉴럴 네트워크를 이용한 물질 분석 방법 및 이를 위한 장치
CN113344846B (zh) 基于生成对抗网络和压缩感知的遥感图像融合方法及系统
CN115359847A (zh) 蛋白质组学串联质谱图寻峰算法
CN114067169A (zh) 一种基于卷积神经网络的拉曼光谱分析方法
EP3523818A1 (en) System and method for real-time isotope identification
CN112733775A (zh) 基于深度学习的高光谱影像分类方法
US20220373522A1 (en) Waveform Analytical Method and Waveform Analytical Device
US7904410B1 (en) Constrained dynamic time warping
JP2022507737A (ja) 信号処理用ノイズ低減フィルタ
US20220310374A1 (en) Subspace approach to accelerate fourier transform mass spectrometry imaging
Bartoň et al. Watershed Segmentation for Peak Picking in Mass Spectrometry Data
WO2023239622A1 (en) High-throughput mass spectrometry imaging with dynamic sparse sampling
Sarycheva et al. Robust Simulation Of Imaging Mass Spectrometry Data.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant