CN115541687A - 多目标串级质谱分析方法、装置、电子设备及存储介质 - Google Patents

多目标串级质谱分析方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115541687A
CN115541687A CN202211268545.1A CN202211268545A CN115541687A CN 115541687 A CN115541687 A CN 115541687A CN 202211268545 A CN202211268545 A CN 202211268545A CN 115541687 A CN115541687 A CN 115541687A
Authority
CN
China
Prior art keywords
ion mobility
ions
mass
parent
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211268545.1A
Other languages
English (en)
Inventor
马潇潇
钱耀
欧阳证
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202211268545.1A priority Critical patent/CN115541687A/zh
Publication of CN115541687A publication Critical patent/CN115541687A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Analytical Chemistry (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本申请涉及一种多目标串级质谱分析方法、装置、电子设备及存储介质,其中,方法包括:基于离子淌度‑串级质谱仪,获取样品离子经离子淌度分离后的离子淌度—一级质谱图;基于离子淌度‑串级质谱仪,获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度—二级质谱图;对离子淌度—一级质谱图和离子淌度—二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;以及对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。由此,解决了相关技术无法实现单次离子采样多目标物的串联质谱分析,串级质谱分析的样品利用率较低,质谱对微量样品中分子的分析覆盖度和结构解析能力较弱等问题。

Description

多目标串级质谱分析方法、装置、电子设备及存储介质
技术领域
本申请涉及串级质谱分析技术领域,特别涉及一种多目标串级质谱分析方法、装置、电子设备及存储介质。
背景技术
质谱是一种无标记的高灵敏度检测技术,可以同时检测样品中大量化合物分子。傅里叶变换离子回旋共振质量分析器和轨道阱质量分析器等高分辨质量分析器,能够获得化合物的精确分子质量,用于获得化合物的元素组成信息,但是无法对同分异构体进行区分和鉴定。
质谱与离子淌度分离技术相结合,能够区分质荷比相同但结构不同的离子,但是,离子结构的准确鉴定依赖于离子碰撞横截面积数据库的建立。利用串级质谱能够实现分子的精确结构鉴定,然而,在常规串级质谱分析过程中,在单次串级质谱扫描中仅能分析一种母离子,从而导致样品利用率的降低和分析时间的延长。在一个分析周期中,靶向(数据依赖)串级质谱分析方法依次对不同的母离子进行隔离和串级质谱分析,但是,该分析模式会显著增加样品消耗量、延长分析时间,尤其是在微量样品分析时,例如,在质谱成像和单细胞分析中,单个像素点(或单个细胞)可被采样的次数有限,因此该模式能分析的目标母离子的数量有限。
目前,相关技术可以将基于液相色谱的数据非依赖串级质谱分析方法应用于蛋白质组学和代谢组学当中,其能够显著提升鉴定分子结构数量和定量稳定性。在离子淌度质谱中应用类似的数据非依赖串级质谱分析方法有助于提升串级质谱分析单次进样的离子利用率,并解析更多分子结构。由于离子淌度是离子化后分离技术,且分离时间尺度为毫秒至秒量级,因此适用于微量、信号持续时间短的样品分析场景,尤其是质谱成像和单细胞分析。
然而,基于离子淌度-串级质谱仪的微量样品非靶向或多目标物串级质谱分析方法并未提出,且相关技术无法实现单次离子采样多目标物的串联质谱分析,串级质谱分析的样品利用率较低,质谱对微量样品中分子的分析覆盖度和结构解析能力较弱,亟待解决。
发明内容
本申请提供一种多目标串级质谱分析方法、装置、电子设备及存储介质,以解决相关技术无法实现单次离子采样多目标物的串联质谱分析,串级质谱分析的样品利用率较低,质谱对微量样品中分子的分析覆盖度和结构解析能力较弱等问题。
本申请第一方面实施例提供一种多目标串级质谱分析方法,包括以下步骤:基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度-一级质谱图;基于所述离子淌度-串级质谱仪,获取所述样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图;对所述离子淌度-一级质谱图和所述离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;以及对所述母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。
可选地,在本申请的一个实施例中,所述对所述离子淌度-一级质谱图和所述离子淌度-二级质谱图进行谱峰检测与提取,包括:对离子淌度-一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到多个母离子的特征;提取所述多个母离子的特征的强度随时间变化的第一列向量,生成所述母离子的强度矩阵。
可选地,在本申请的一个实施例中,所述对所述离子淌度-一级质谱图和所述离子淌度-二级质谱图进行谱峰检测与提取,包括:对离子淌度-二级质谱数据在质荷比维度进行一维特征检测,得到多个碎片离子的特征;提取所述多个碎片离子的特征的强度随时间变化的第二列向量,生成所述碎片离子的强度矩阵。
可选地,在本申请的一个实施例中,所述对所述母离子和碎片离子的强度矩阵进行解卷积计算,包括:基于所述母离子的强度矩阵和所述碎片离子的强度矩阵,求解预设优化问题,并计算母离子的总强度,以计算所有母离子特征迁移谱峰的距离和峰形的相似度。
本申请第二方面实施例提供一种多目标串级质谱分析装置,包括:第一获取模块,用于基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度-一级质谱图;第二获取模块,用于基于所述离子淌度-串级质谱仪,获取所述样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图;第三获取模块,用于对所述离子淌度-一级质谱图和所述离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;以及第四获取模块,用于对所述母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。
可选地,在本申请的一个实施例中,所述第三获取模块包括:第一检测单元,用于对离子淌度-一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到多个母离子的特征;第一生成单元,用于提取所述多个母离子的特征的强度随时间变化的第一列向量,生成所述母离子的强度矩阵。
可选地,在本申请的一个实施例中,所述第三获取模块还包括:第二检测单元,用于对离子淌度-二级质谱数据在质荷比维度进行一维特征检测,得到多个碎片离子的特征;第二生成单元,用于提取所述多个碎片离子的特征的强度随时间变化的第二列向量,生成所述碎片离子的强度矩阵。
可选地,在本申请的一个实施例中,所述第四获取模块包括:计算单元,用于基于所述母离子的强度矩阵和所述碎片离子的强度矩阵,求解预设优化问题,并计算母离子的总强度,以计算所有母离子特征迁移谱峰的距离和峰形的相似度。
本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的多目标串级质谱分析方法。
本申请第四方面实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,该程序被处理器执行时实现如上的多目标串级质谱分析方法。
由此,本申请的实施例具有以下有益效果:
本申请的实施例可以通过获取样品离子经离子淌度分离后的离子淌度-一级质谱图;获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图;对所获取的一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图,由此,本申请提高了串级质谱分析的样品利用率,能够实现单次离子采样多目标物的串联质谱分析,显著提升了对微量样品中生物分子的分析覆盖度、结构表征能力和分析速度,此外,本申请尤其适用于高分辨质谱成像、单细胞分析的非靶向或多目标物的串级质谱分析,以快速获取大量分子的结构和含量。由此,解决了相关技术无法实现单次离子采样多目标物的串联质谱分析,串级质谱分析的样品利用率较低,质谱对微量样品中分子的分析覆盖度和结构解析能力较弱等问题。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本申请实施例提供的一种多目标串级质谱分析方法的流程图;
图2为本申请的一个实施例提供的一种质谱成像数据采集与解卷积原理示意图;
图3为本申请的一个实施例提供的一种数据采集系统示意图;
图4为本申请的一个实施例提供的一种谱峰检测与谱图解卷积流程示意图;
图5为本申请的一个实施例提供的一种谱图解卷积的结果示意图;
图6为本申请的一个实施例提供的一种高通量串级质谱成像结果示意图;
图7为根据本申请实施例的多目标串级质谱分析装置的示例图;
图8为本申请实施例提供的电子设备的结构示意图。
附图标记说明:多目标串级质谱分析装置-10;第一获取模块-100、第二获取模块-200、第三获取模块-300、第四获取模块-400;存储器-801、处理器-802、通信接口-803。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
下面参考附图描述本申请实施例的多目标串级质谱分析方法、装置、电子设备及存储介质。针对上述背景技术中提到的问题,本申请提供了一种多目标串级质谱分析方法,在该方法中,通过获取样品离子经离子淌度分离后的离子淌度-一级质谱图;获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图;对所获取的一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图,从而本申请提高了串级质谱分析的样品利用率,可以实现单次离子采样多目标物的串联质谱分析,显著提升了对微量样品中生物分子的分析覆盖度、结构表征能力和分析速度,此外,本申请尤其适用于高分辨质谱成像、单细胞分析的非靶向或多目标物的串级质谱分析,以快速获取大量分子的结构和含量。由此,解决了相关技术无法实现单次离子采样多目标物的串联质谱分析,串级质谱分析的样品利用率较低,质谱对微量样品中分子的分析覆盖度和结构解析能力较弱等问题。
具体而言,图1为本申请实施例所提供的一种多目标串级质谱分析方法的流程图。
如图1所示,该多目标串级质谱分析方法包括以下步骤:
在步骤S101中,基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度-一级质谱图。
本申请的实施例可以利用离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度-一级质谱图。
需要说明的是,样品离子化可以采用任何软电离源,本申请的实施例中,可以采用Waters公司的DESI XS解吸电喷雾离子源以进行样品离子化。
进一步地,上述离子淌度分离可以采用具有时间分离效果的离子迁移谱分析器,例如,漂移管离子迁移谱分析器、行波离子迁移谱分析器、捕获离子迁移谱分析器等,在本申请的实施例中,可采用环形行波离子迁移谱分析器和飞行时间质量分析器分别进行离子淌度分离和质谱分析。
其中,离子迁移谱分析器和质量分析器在空间中按先后顺序排列。此外,在离子迁移谱分析器之前还可设置一个四极杆过滤器,用于隔离一段质量范围的离子以作后续分析。
具体地,本申请的实施例可将小鼠脑组织的冷冻切片作为样品,并通过上述解吸电喷雾离子源对该样本切片进行质谱成像分析。
如图2所示,在本申请实施例的质谱成像分析中,定义了一个空间网格区域,每一个小矩形网格代表一个像素点,每一个像素点又划分为两个子像素点。两个子像素点分别用于采集离子淌度-一级质谱数据和离子淌度-二级质谱数据。矩形像素的尺寸为50μm×100μm,子像素的尺寸为50μm×50μm,空间分辨率为50μm×100μm。
需要注意的是,上述质谱成像分析方法也适用于高通量单细胞分析。
可以理解的是,由于离子淌度分离时间仅为数百毫秒,不会显著延长数据采集时间。因此,本申请的实施例具有高通量、高灵敏等特点,尤其适用于质谱成像和单细胞分析等微量、信号持续时间短的样品的非靶向或多目标物串级质谱分析。
在步骤S102中,基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图。
在获取样品离子经离子淌度分离后的离子淌度-一级质谱图后,进一步地,本申请的实施例还可通过离子淌度-串级质谱仪,获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图。
需要说明的是,本申请的实施例可以采用碰撞诱导解离技术,使用固定的激发能量,以在离子迁移分析器和质量分析器之间实现宽窗口离子碎裂,即离子激发。
在具体实现过程中,本领域技术人员还可通过紫外光解离、表面诱导解离、电子捕获诱导解离、电子转移诱导解离等任何具备离子碎裂功能的技术实现离子激发,于此不做具体限制。
进一步地,本申请的实施例所采用的数据采集系统为Waters公司的环形离子淌度(Cyclic IMS)质谱仪,如图3所示。该系统主要部件包括离子源(解吸电喷雾离子源(DESI))、四极滤质器、环形离子迁移谱分析器、碰撞池和飞行时间质量分析器。
其中,DESI离子源用于将样品表面的化合物离子化,空间分辨率大于30μm,优选为50μm;四极滤质器用于筛选特定质荷比范围的离子;环形离子迁移谱分析器用于样品中待测物的离子淌度分离,淌度分辨率最高约为750,优选为50~100;碰撞池用于离子的碰撞诱导解离;飞行时间质量分析器用于离子质荷比的检测,质量分辨率最高约为100000,优选为50000。
由此,本申请的实施例通过离子淌度-串级质谱仪,获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图,为后续解卷积计算提供了依据,有效保障了多目标串级质谱分析的性能。
在步骤S103中,对离子淌度-一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵。
在获取离子淌度-一级质谱图和离子淌度-二级质谱图后,由于不同厂商的质谱仪器软件输出的数据格式不同,因此,可将原始数据文件通过开源软件MSConvert转化为.mzML格式的数据文件,在本申请实施例中,可将Waters公司的.raw格式的数据转化为.mzML格式的数据文件。
需要注意的是,本申请实施例的分析方法对从其他仪器厂商生产的仪器采集到的数据也同样适用。
进一步地,本申请的实施例可使用Python的开源程序库pymzml对.mzML格式的数据文件进行处理,将其转化为.mat格式的数据文件,以便于后续利用MATLAB脚本处理,如图4所示。其中,.mat数据文件包含离子淌度-一级质谱数据和离子淌度-二级质谱数据。
由此,通过上述数据预处理操作,从而为后续离子淌度-一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取提供了可靠的数据依据。
可选地,在本申请的一个实施例中,对离子淌度-一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,包括:对离子淌度-一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到多个母离子的特征;提取多个母离子的特征的强度随时间变化的第一列向量,生成母离子的强度矩阵。
需要说明的是,本申请的实施例可对上述获取的离子淌度-一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到N个母离子的特征,并提取N个特征的强度随时间变化的列向量pi(i=1,2,…,N),N个列向量排列成矩阵PT×N,其中T代表离子淌度采样的时间点数。
具体地,在本申请的实施例中,对离子淌度-一级质谱数据进行二维特征检测的过程如下所述:
1、在质荷比维度和漂移时间维度检测强度前N的数据点;
2、对每一个检测到的数据点,提取±0.01Th,±10ms的离子的迁移谱;
3、将所有迁移谱排列,得到N个母离子的数据矩阵PT×N
从而实现对离子淌度-一级质谱数据的二维特征检测,保障了多个母离子的二级质谱图的可靠性。
可选地,在本申请的一个实施例中,对离子淌度-一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,包括:对离子淌度-二级质谱数据在质荷比维度进行一维特征检测,得到多个碎片离子的特征;提取多个碎片离子的特征的强度随时间变化的第二列向量,生成碎片离子的强度矩阵。
进一步地,本申请的实施例可对上述获取的离子淌度-二级质谱数据在质荷比维度进行一维特征检测,得到M个碎片离子的特征,并提取M个特征的强度随时间变化的列向量fj(j=1,2,…,M),M个列向量排列成矩阵FT×M
根据上述得到的矩阵PT×N和矩阵FT×M,可得下式:
FT×M=PT×N·CN×M
其中,CN×M中第i行第j列的元素表示在特定激发能量下,第i个母离子碎裂产生第j个碎片离子质谱信号强度的比例。
作为一种可以实现的方式,本申请的实施例对离子淌度-二级质谱数据进行一维特征检测的过程如下所述:
1、在质荷比维度检测强度前M的数据点;
2、对每一个检测到的数据点,提取其左右各0.01Th范围的离子的迁移谱,排列成M个碎片离子的数据矩阵FT×M
由此,本申请的实施例通过对离子淌度-一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,有效保障了样品中大量分子的快速测定和结构表征的实现。
在步骤S104中,对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。
在获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵后,进一步地,本申请的实施例可以对母离子和碎片离子的强度矩阵进行解卷积计算,以获取多个母离子的二级质谱图。
可以理解的是,本申请的实施例通过利用离子淌度分离和宽窗口离子碎裂实现非靶向串级质谱数据采集,依据母离子和碎片离子强度之间的数学关系,重构母离子的二级谱图,从而实现近乎100%的离子利用率,有效提升了串级质谱分析的检测灵敏度。
可选地,在本申请的一个实施例中,对母离子和碎片离子的强度矩阵进行解卷积计算,包括:基于母离子的强度矩阵和碎片离子的强度矩阵,求解预设优化问题,并计算母离子的总强度,以计算所有母离子特征迁移谱峰的距离和峰形的相似度。
需要说明的是,本申请的实施例可以利用非负最小二乘法,如下式所示,以求解优化问题:
argminC||F-P·C||,subject to C≥0
Figure BDA0003894128030000081
从而得到矩阵C的近似解
Figure BDA0003894128030000082
以获取母离子产生碎片离子的系数矩阵CN×M,其中,
Figure BDA0003894128030000083
的每一行即代表不同母离子的归一化二级质谱图。
需要注意的是,在具体执行过程中,本领域技术人员还可以通过非负矩阵分解等方法进行优化问题的求解,于此不做具体限制。
进一步地,根据向量pi,本申请的实施例可通过下式求解峰面积得到该母离子的强度:
Figure BDA0003894128030000084
并计算第i个母离子产生第j个碎片的绝对强度:
IFj=IPi·cij
进而,本申请的实施例可以对所有母离子的迁移谱两两之间进行互相关分析,得到迁移谱峰之间的距离d和峰形相似度s,若d与s与设定的阈值d0,s0满足关系:d<d0且s>s0,则将迁移谱峰合并得到一个特征,同时将碎片离子绝对强度合并,得到新的系数矩阵
Figure BDA0003894128030000085
其合并过程如下所述:
1、待合并的一组特征包括编号为i1,i2,…,il的母离子,其质谱信号绝对强度分别为
Figure BDA0003894128030000086
则碎裂系数矩阵的第i1,i2,…,il行以母离子信号的绝对强度作加权平均,合并为一行:
Figure BDA0003894128030000087
第i个母离子特征产生第j个碎片离子的绝对强度为Ii·cij,其中Ii表示第i个母离子的绝对强度;
2、以像素点的总离子强度做归一化得到离子的归一化强度,以归一化强度或者归一化强度的平方根或对数值作为像素值,绘制母离子和碎片离子的质谱成像结果。
综上所述,本申请的实施例通过计算所有母离子特征的强度随时间变化向量的互相关,互相关取最大值的偏移量代表迁移谱峰之间的距离,互相关的最大值代表迁移谱峰峰形的相似度。若迁移谱峰之间的距离小于设定的阈值,并且谱峰相似度大于设定的阈值,则将两个特征和对应的碎片离子合并,形成一个特征,并将对应的碎片离子的强度合并。
由此,本申请的实施例可将传统串级质谱分析中离子利用率由1/N(N为拟测定母离子的数量)提升至接近100%,从而可在单次进样中分析多个母离子的结构信息,有效提升对微量样品中生物分子的分析覆盖度、结构表征能力和分析速度。
本申请的实施例提出的数据解卷积方法,不依赖数据库,具有简单、快速、准确、自动化等特点,还可适用于基于数据非依赖采集方法的液相色谱-串级质谱、气相色谱-电子电离质谱、毛细管电泳-串级质谱等数据的解卷积,通用性较强。
下述将结合附图,通过具体的实施例对本申请的多目标串级质谱分析方法进行介绍。
具体地,本申请实施例通过使用解吸电喷雾离子源对小鼠脑组织的冷冻切片在负模式下进行质谱分析,在单个像素点进行二级质谱的解卷积,单次质谱分析得到四个不同的母离子的二级质谱图,如图5所示。非靶向串级质谱分析方法解卷积得到的二级质谱图与靶向串级质谱分析测得的二级质谱图高度相似。
此外,本申请的实施例也使用DESI对小鼠脑组织的冷冻切片在正模式下进行质谱成像分析。定义的质谱成像区域范围为4.5mm×9mm,像素点大小为50μm×100μm,每个像素点又分为左右两个子像素点,大小均为50μm×50μm。其中左边的子像素点用于采集离子淌度-质谱数据,右边的子像素点用于采集离子淌度-二级质谱数据。四极杆过滤的质量范围为730~880Th。单次质谱成像实验共得到解卷积后21种不同母离子的二级质谱图,部分代表性二级质谱成像结果如图6所示。图6中第一列为从离子淌度-一级质谱数据直接重建的母离子质谱成像结果,第二列为从离子淌度-二级质谱数据直接重建的母离子的质谱成像结果,第三(四)列为解卷积后对应的碎片离子的质谱成像结果。碎片离子可用于母离子的结构鉴定。同时,本发明也能对解析生物分子同分异构体的结构或同重物的空间分布。例如,质荷比为782Th的离子,其二级质谱的碎片离子有两种空间分布,分别对应[PC 34:1+Na]+(782.5670Th)和[PC 36:4+H+(782.5694Th),二者为同重物,质荷比分离需要的分辨率超过30,0000,仅通过飞行时间一级质谱无法对二者进行区分,而本申请能够同时实现结构鉴定和空间分布的表征。
根据本申请实施例提出的多目标串级质谱分析方法,通过获取样品离子经离子淌度分离后的离子淌度-一级质谱图;获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图;对所获取的一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图,从而本申请提高了串级质谱分析的样品利用率,可以实现单次离子采样多目标物的串联质谱分析,显著提升了对微量样品中生物分子的分析覆盖度、结构表征能力和分析速度,此外,本申请尤其适用于高分辨质谱成像、单细胞分析的非靶向或多目标物的串级质谱分析,以快速获取大量分子的结构和含量。
其次参照附图描述根据本申请实施例提出的多目标串级质谱分析装置。
图7是本申请实施例的多目标串级质谱分析装置的方框示意图。
如图7所示,该多目标串级质谱分析装置10包括:第一获取模块100、第二获取模块200、第三获取模块300以及第四获取模块400。
其中,第一获取模块,用于基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度-一级质谱图。
第二获取模块,用于基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图。
第三获取模块,用于对离子淌度-一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵。
第四获取模块,用于对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。
可选地,在本申请的一个实施例中,第三获取模块300包括:第一检测单元和第一生成单元。
其中,第一检测单元,用于对离子淌度-一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到多个母离子的特征。
第一生成单元,用于提取多个母离子的特征的强度随时间变化的第一列向量,生成母离子的强度矩阵。
可选地,在本申请的一个实施例中,第三获取模块300还包括:第二检测单元和第二生成单元。
其中,第二检测单元,用于对离子淌度-二级质谱数据在质荷比维度进行一维特征检测,得到多个碎片离子的特征。
第二生成单元,用于提取多个碎片离子的特征的强度随时间变化的第二列向量,生成碎片离子的强度矩阵。
可选地,在本申请的一个实施例中,第四获取模块400包括:计算单元,用于基于母离子的强度矩阵和碎片离子的强度矩阵,求解预设优化问题,并计算母离子的总强度,以计算所有母离子特征迁移谱峰的距离和峰形的相似度。
需要说明的是,前述对多目标串级质谱分析方法实施例的解释说明也适用于该实施例的多目标串级质谱分析装置,此处不再赘述。
根据本申请实施例提出的多目标串级质谱分析装置,通过获取样品离子经离子淌度分离后的离子淌度-一级质谱图;获取样品离子经离子淌度分离和宽窗口碎裂后的离子淌度-二级质谱图;对所获取的一级质谱图和离子淌度-二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;对母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图,从而本申请提高了串级质谱分析的样品利用率,可以实现单次离子采样多目标物的串联质谱分析,显著提升了对微量样品中生物分子的分析覆盖度、结构表征能力和分析速度,此外,本申请尤其适用于高分辨质谱成像、单细胞分析的非靶向或多目标物的串级质谱分析,以快速获取大量分子的结构和含量。
图8为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:
存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机程序。
处理器802执行程序时实现上述实施例中提供的多目标串级质谱分析方法。
进一步地,电子设备还包括:
通信接口803,用于存储器801和处理器802之间的通信。
存储器801,用于存放可在处理器802上运行的计算机程序。
存储器801可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器801、处理器802和通信接口803独立实现,则通信接口803、存储器801和处理器802可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选地,在具体实现上,如果存储器801、处理器802及通信接口803,集成在一块芯片上实现,则存储器801、处理器802及通信接口803可以通过内部接口完成相互间的通信。
处理器802可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的多目标串级质谱分析方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或N个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种多目标串级质谱分析方法,其特征在于,包括以下步骤:
基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度—一级质谱图;
基于所述离子淌度-串级质谱仪,获取所述样品离子经离子淌度分离和宽窗口碎裂后的离子淌度—二级质谱图;
对所述离子淌度—一级质谱图和所述离子淌度—二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;以及
对所述母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。
2.根据权利要求1所述的方法,其特征在于,所述对所述离子淌度—一级质谱图和所述离子淌度—二级质谱图进行谱峰检测与提取,包括:
对离子淌度—一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到多个母离子的特征;
提取所述多个母离子的特征的强度随时间变化的第一列向量,生成所述母离子的强度矩阵。
3.根据权利要求2所述的方法,其特征在于,所述对所述离子淌度—一级质谱图和所述离子淌度—二级质谱图进行谱峰检测与提取,包括:
对离子淌度—二级质谱数据在质荷比维度进行一维特征检测,得到多个碎片离子的特征;
提取所述多个碎片离子的特征的强度随时间变化的第二列向量,生成所述碎片离子的强度矩阵。
4.根据权利要求3所述的方法,其特征在于,所述对所述母离子和碎片离子的强度矩阵进行解卷积计算,包括:
基于所述母离子的强度矩阵和所述碎片离子的强度矩阵,求解预设优化问题,并计算母离子的总强度,以计算所有母离子特征迁移谱峰的距离和峰形的相似度。
5.一种多目标串级质谱分析装置,其特征在于,包括:
第一获取模块,用于基于离子淌度-串级质谱仪,获取样品离子经离子淌度分离后的离子淌度—一级质谱图;
第二获取模块,用于基于所述离子淌度-串级质谱仪,获取所述样品离子经离子淌度分离和宽窗口碎裂后的离子淌度—二级质谱图;
第三获取模块,用于对所述离子淌度—一级质谱图和所述离子淌度—二级质谱图进行谱峰检测与提取,获取母离子和碎片离子在质荷比和漂移时间维度的强度矩阵;以及
第四获取模块,用于对所述母离子和碎片离子的强度矩阵进行解卷积计算,获取多个母离子的二级质谱图。
6.根据权利要求5所述的装置,其特征在于,所述第三获取模块包括:
第一检测单元,用于对离子淌度—一级质谱数据在时间维度和质荷比维度进行二维特征检测,得到多个母离子的特征;
生成单元,用于提取所述多个母离子的特征的强度随时间变化的第一列向量,生成所述母离子的强度矩阵。
7.根据权利要求6所述的装置,其特征在于,所述第三获取模块还包括:
第二检测单元,用于对离子淌度—二级质谱数据在质荷比维度进行一维特征检测,得到多个碎片离子的特征;
第二生成单元,用于提取所述多个碎片离子的特征的强度随时间变化的第二列向量,生成所述碎片离子的强度矩阵。
8.根据权利要求7所述的装置,其特征在于,所述第四获取模块包括:
计算单元,用于基于所述母离子的强度矩阵和所述碎片离子的强度矩阵,求解预设优化问题,并计算母离子的总强度,以计算所有母离子特征迁移谱峰的距离和峰形的相似度。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-4任一项所述的多目标串级质谱分析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-4任一项所述的多目标串级质谱分析方法。
CN202211268545.1A 2022-10-17 2022-10-17 多目标串级质谱分析方法、装置、电子设备及存储介质 Pending CN115541687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211268545.1A CN115541687A (zh) 2022-10-17 2022-10-17 多目标串级质谱分析方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211268545.1A CN115541687A (zh) 2022-10-17 2022-10-17 多目标串级质谱分析方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115541687A true CN115541687A (zh) 2022-12-30

Family

ID=84735939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211268545.1A Pending CN115541687A (zh) 2022-10-17 2022-10-17 多目标串级质谱分析方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115541687A (zh)

Similar Documents

Publication Publication Date Title
US11790629B2 (en) Intensity normalization in imaging mass spectrometry
US7451052B2 (en) Application of comprehensive calibration to mass spectral peak analysis and molecular screening
CN104297355B (zh) 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法
CN105122051B (zh) 分析系统
US20150144784A1 (en) Exponential Scan Mode for Quadrupole Mass Spectrometers to Generate Super-Resolved Mass Spectra
CN108982729B (zh) 用于提取质量迹线的系统和方法
US20090210167A1 (en) Computational methods and systems for multidimensional analysis
WO2019102798A1 (en) Data acquisition method in a mass spectrometer
GB2570062B (en) Improved method of FT-IMS
US11348771B2 (en) Mass spectrometric determination of particular tissue states
CN106341983A (zh) 优化光谱数据的方法
Leitner et al. SnapShot: mass spectrometry for protein and proteome analyses
Xu et al. A new retrospective, multi‐evidence veterinary drug screening method using drift tube ion mobility mass spectrometry
WO2014045093A1 (en) Systems and methods for acquiring data for mass spectrometry images
CN115541687A (zh) 多目标串级质谱分析方法、装置、电子设备及存储介质
US20210335588A1 (en) Processing of spatially resolved, ion-spectrometric measurement signal data to determine molecular content scores in two-dimensional samples
CA3163129A1 (en) Method and system for the identification of compounds in complex biological or environmental samples
US20230028227A1 (en) Method and device for the quantification of target ion species
WO2023032181A1 (ja) 質量分析データ解析方法及びイメージング質量分析装置
CN114414656A (zh) 一种基于血清代谢指纹自体免疫疾病模型的构建方法
Floris et al. Fundamentals of two dimensional Fourier transform mass spectrometry
CN116519835A (zh) 一种质谱定性分析方法及质谱仪
CN115290741A (zh) 用于分析质谱数据的设备
Noy et al. Robust estimation and graph-based meta clustering for LC-MS feature extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination