CN113552247A - 一种样品未知成分的液质联用非靶向分析方法 - Google Patents
一种样品未知成分的液质联用非靶向分析方法 Download PDFInfo
- Publication number
- CN113552247A CN113552247A CN202110675956.1A CN202110675956A CN113552247A CN 113552247 A CN113552247 A CN 113552247A CN 202110675956 A CN202110675956 A CN 202110675956A CN 113552247 A CN113552247 A CN 113552247A
- Authority
- CN
- China
- Prior art keywords
- sample
- ion
- information
- mass
- ions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/26—Conditioning of the fluid carrier; Flow patterns
- G01N30/28—Control of physical parameters of the fluid carrier
- G01N30/34—Control of physical parameters of the fluid carrier of fluid composition, e.g. gradient
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
- G01N30/8679—Target compound analysis, i.e. whereby a limited number of peaks is analysed
Abstract
本发明涉及一种检测样品中未知成分的方法,所述方法通过非靶向信息的采集,将样品溶液中所有成分的信息进行采集,之后对所采集到的信息进行数据处理分析,从而确认样品中有哪些化合物,并进一步确定其含量。所述样品溶液中所有成分的采集是通过液质联用仪使用多梯度洗脱后采集到所有成分的信息。
Description
技术领域
本申请涉及用于样品分析和检测的技术,尤其涉及样品中未知成分分析和检测的技术。
背景技术
溶液样品是化学化工、医药、生物等诸多行业最常见的样品形式,其中很多样品的组成成分复杂,含有大量未知成分。并且这些未知成分往往可能具有特殊的性质或功能。对于一种组成未知的样品,准确快速地解析出其中的分子组成信息,具有重要的应用价值。
液质联用仪(LCMS)是液相色谱与质谱联用的分析仪器。液质联用仪的主要分析目标是有机化合物。LCMS利用液相色谱作为前端的进样和分离手段,依靠色谱柱的分离能力,将样品中各有机组分进行分离。各组份被分离后在流动相的带动下,依次进入质谱的离子源,被气化和离子化为分散的带电粒子(母离子)。带电粒子再进入质谱的质量分析器,根据质荷比的不同被质谱进行质量分辨(确定质荷比)并检测各个质荷比粒子量的多少。
液相色谱(LC)作为质谱前端提供进样和化合物的分离。色谱的分离原理众多,它是依靠化合物在色谱柱固定相和流动相间的分配能力的不同,把一个混合物体系中的各种化合物分离开。与质谱联用时经常采用的色谱柱为反相柱和Hilic柱。
质谱做为LCMS的检测与输出端,有多种质量分析的方式,如四极杆质谱、飞行时间质谱、离子阱质谱、轨道阱质谱等。这些质量分析器进行质量分辨的原理各不相同。现代分析仪器中,常把上述不同质量分辨手段串联到一起使用,组成串联质谱仪。串联质谱仪比传统的单质量分析器质谱具有更广泛的应用空间,除了可以识别母离子(也称一级离子)的质荷比,也可以挑选母离子将其打碎。然后,质谱再通过质量分辨和检测,获得母离子的碎片离子(也称子离子或二级离子)信息,因此,母离子对应的二级离子质谱图就成为质谱定性分析的关键证据。
LCMS在采集样品信息和进行数据处理分析时,有两种常见的策略:靶向分析和非靶向分析。靶向策略的目标是检测样品中是否含有研究者关注的目标化合物。这里的目标数目,可以是样品中的一个化合物,也可以是几百乃至上千个化合物。进行靶向分析时,需要在检测方法中,根据靶向目标化合物的信息设置对应的一级和二级离子的信息,形成靶向检测方法,再进行样品检测。对靶向分析中的某一个目标化合物而言,根据检测的目标化合物的精确分子量、带何种电荷、产生碎片例子时的碰撞能量,碎片离子的质荷比,与信息库中的相应信息比较,从而确定目标化合物的性质和含量。
靶向分析要求分析检测人员必须明确样品中可能存在的,需要定性、定量分析的各分子成分信息。而对于存在于样品中,却不包括在靶向目标中的未知成分,则在靶向分析中不可能被关注和发现。
非靶向分析的策略是利用高分辨串联质谱,采集样品中所有能检测到的离子的所有一级和二级质谱信息。通过数据处理,对采集到的信息进行数据的定性和定量分析,从而发现样品中有哪些化合物,并确定其含量。这种采集和分析策略,一般采用数据非依赖型采集(DIA)模式的数据。显而易见,DIA数据一般非常庞大,单个样本的DIA数据一般在几百到几千Mb大小。此外,在DIA数据中,建立母离子和子离子的归属关系,即二级谱图的去卷积,非常困难。
如何在这样巨大的数据中准确发现不包括在靶向目标中的未知成分的信息,建立一套完善的非靶向DIA数据采集和数据挖掘方法,用于未知溶液样品组成的解析,是目前国际难题。目前日本理化研究所,美国Scripps研究所,丹麦科学院分别独立开发了依据信号峰峰型和重现性进行未知分子组分识别的分析方法,公布了MS—DIAL,XCMS,mzMine等一系列数据挖掘方法。其中,MS-DIAL可以同时解析分子的分子量信息和分子结构信息,XCMS和mzMine只能解析分子量信息,不能进行二级谱图分析。同时,这些已经公布的方法只对峰型良好的分子信息解析有效,不能解析峰型对称性差或者样品中浓度很低的分子信息。进一步来说,这些方法对色谱信息的利用度还存在局限,一般只利用提取离子色谱峰的保留时间和峰对称度信息。而化合物的色谱保留行为,作为一种对化合物进行区分和鉴别的有效手段,在目前的质谱非靶向数据处理方法中均未被涉及。
本发明利用高分辨串联质谱,根据化合物色谱保留行为的特点,采集样品中所有能检测到的离子的一级和二级质谱信息,再对采集到的信息进行数据的定性和定量分析,从而对样品中的所有成分,尤其包括峰型对称性差或浓度低的成分进行定性和定量确认。
发明内容
本发明首先提供一种检测样品中未知成分的方法,所述方法通过多液相梯度非靶向信息的采集,对样品溶液中所有成分的信息进行采集,之后对所采集到的样本中的多液相梯度非靶向质谱数据信息进行数据处理分析,从而确认样品中有哪些化合物,并进一步确定其含量。
本发明的非靶向信息是通过液质联用仪(LCMS)对溶液样品的成分信息进行采集。所述信息采集包括如下步骤:
1、将样品进行前处理,注入液质联用仪(LCMS),
2、利用不同浓度洗脱液,进行多梯度洗脱,
3、质谱仪进行多次扫描,获得同一样品的一级母离子和二级子离子的信息,及其保留时间和保留行为信息,
4、通过一级或二级离子的兴趣区域(Region Of Interest,ROI)确定样品中化合物的数量,
5、对比一级母离子和二级子离子的离子提取离子色谱峰保留时间和保留行为、一级母离子和二级子离子提取离子色谱峰型匹配度,确认一级母离子和二级子离子的归属关系,从而得到这个一级母离子的二级子离子谱图,
6、对每个一级离子的二级离子谱图进行自动谱库匹配,从而实现样品中所有成分的确认。
进一步,多梯度洗脱是指6-15次的洗脱,优选是7-10次的洗脱。进一步,为了获得样本中所有成分的信息,优选采用多种液质联用检测模式进行信息采集,如选择反相色谱柱正离子模式、反相色谱柱负离子模式、Hilic色谱柱正离子模式、Hilic色谱柱负离子模式的两种或多种组合。
更进一步,质谱采集工作利用DIA采集模式,以采集母离子质量范围内的所有母离子色谱保留行为信息和所有存在的母离子产生的所有碎片离子色谱保留行为信息。
其次,本发明提供一种用于进行样品未知成分分析的系统,该系统包括:液质联用仪和数据处理单元,所述液质联用仪用于样品成分信息的采集,数据处理单元用于对采集的信息进行数据处理,从而获得样品中成分的定性和定量信息。样品成分信息的采集优选包括对所有成分的一级母离子信息的采集和二级子离子信息的采集。
采用本发明的样品分析系统检测样品中未知成分的方法,通过潜在化合物峰的色谱保留规律进行有效信息的筛选,过滤背景噪声干扰,能有效识别峰型质量差或在溶液中浓度低的真实分子信息。
附图说明
图1:农药中未知样品分子成分解析示意图
(通过色谱保留行为对DIA数据分析,用于发现痕量和缺乏良好对称性色谱峰,以及利用色谱保留行为进行二级谱去卷积的示意图)
具体实施方式
用于本发明的质谱可以是串联质谱仪,通过质量分辨原理不同的质谱仪的串联,可获得溶液样品中各成分的母离子信息即一级母离子信息,同时也可以获得母离子的碎片离子的信息即二级子离子的信息。母离子打碎后可以产生什么样的碎片离子,主要取决于母离子化合物的结构。因此,母离子对应的二级子离子质谱图就成为质谱定性分析的关键信息。
在DIA模式下,产生二级子离子的母离子不是单一离子、而是由一个质量范围内的多个母离子一起打碎的,这时,确定二级子离子的归属问题即碎片离子到底是由哪个母离子产生的问题将是首先需要解决的问题。
本发明的检测样品中未知成分的方法,解决二级子离子的归属问题即碎片离子到底是由哪个母离子产生的问题,也是发明的核心之一。其解决方案主要包括数据采集和数据处理工作。
数据采集
液相色谱(LC)作为质谱前端提供进样和化合物的分离,每种化合物在通过色谱柱时,有不同的洗脱时间或称保留时间(RT),如果改变了色谱分离条件(经常是改变流动相),每个化合物的RT也会随之改变。如果有规律的改变流动相,各化合物的RT也会有规律的改变。这个RT因条件变化而产生的变化,称为色谱保留行为。而混合组份中的各个化合物,因为其自身的结构不同,因此具有各自的色谱保留行为。
本发明通过有规律的改变液相色谱洗脱条件,如进行多梯度的洗脱,则可获得混合组份中各个化合物的保留行为,进而通过质谱仪的二级检测,可获得混合组分中所有的一级母离子和二级子离子的保留行为信息。
为了采集到混合样品中所有成分的色谱保留行为信息,质谱采集工作可以循环进行多次扫描即DIA扫描,第一次扫描针对全部分子量范围的一级离子即母离子,如第一次扫描在70-1200Da范围内扫描母离子;之后将一定范围的母离子按照分子量大小分成若干组,依次将每一组母离子打碎进行扫描,如第二次将100-200Da范围内的所有母离子打碎扫描二级,第三次将200-300Da范围内所有母离子打碎扫描二级,依次类推,以此方法采集母离子质量范围内的所有母离子色谱保留行为信息(第一次扫描得到)和所有存在的母离子产生的所有碎片离子色谱保留行为信息(第2-N次扫描得到)。N值由母离子分子量的范围分布决定,如7-15次,10-13次等。
利用DIA扫描得到的所有一级母离子信息和二级子离子信息,还可以形成各自的色谱图(称为提取色谱图)。这样采用多梯度洗脱得到的一级母离子和二级子离子的提取色谱图中呈现的化合物色谱峰,也会随着液相条件的改变而改变。这种变化遵从于色谱保留行为规律,因此是可识别和可预测的。
为了采集到混合样品中所有成分的色谱保留行为信息,进一步可以通过多种液质检测模式进行采集
如反相色谱柱正离子模式:
液相方面:根据样品实际情况可以选择适合的反相洗脱体系和色谱柱。比如,分析农残样本,采用水/乙腈洗脱体系,配备Waters ACQUITY UPLC HSS T3 column(1.8μm,2.1×100mm)柱;在细胞代谢组学实验中可采用水/乙腈:异丙醇(1:1)洗脱体系,配备WatersACQUITY UPLC HSS T3 column(1.8μm,2.1×100mm)柱。洗脱体系中可根据实验对象的特点,选择适合的添加剂。在细胞代谢组学试验中,选择在水相和有机相中均添加一定浓度的甲酸和乙酸铵(如0.1%甲酸和2mM/L乙酸铵)。上述流动相和添加剂均为LCMS级试剂。柱温箱温度一般设置为高于室温,对质控样品进行多次进样,每次进样,采用不同洗脱梯度进行洗脱;如,在细胞分析实验中,采用7次梯度洗脱。
质谱方面:使用具有非数据依赖采集模式(DIA模式)的Q-TOF或分辨率相当的其它类型高分辨质谱。质谱采集方法包括一级质谱采集和一级质谱分窗口的二级质谱采集(SWATH采集)模式。SWATH模式可以根据一级离子的分布设置可变采集窗口,或采用直接指定窗口宽度的固定窗口模式。其它质谱参数,如离子源参数、去簇电压(DP)、碰撞能(CE)和碰撞能扩散(CES)等,均根据样品和流动相情况,根据实际需要,分别设置。如,在农药标准分析中,将100-1000Da的一级扫描范围划分为12个二级采集窗口。在细胞提取液分析中,将70-1200Da的一级扫描范围划分为10个二级采集窗口。去簇电位(DP)、碰撞能(CE)和碰撞能扩散(CES)分别设置为80V、35V和15V。
如Hilic色谱柱正离子模式:
液相方面,根据样品实际情况选择适合的Hilic洗脱体系和色谱柱。比如,在细胞代谢组学实验中可采用:水:乙腈(9:1)/乙腈:水(9:1)洗脱体;色谱柱配备Waters ACQUITYBEH Amide柱(1.7um,2.1×100mm)。洗脱体系中可根据实验对象的特点,选择适合的添加剂。在细胞代谢组学试验中,选择在水相和有机相中均添加10mM/L乙酸铵和0.1%甲酸。上述流动相和添加剂均为LCMS级试剂。柱温箱温度一般设置为高于室温,对质控样品进行多次进样,每次进样,采用不同洗脱梯度进行洗脱。
质谱方面:使用具有非数据依赖采集模式(DIA模式)的Q-TOF或分辨率相当的其它类型高分辨质谱。质谱采集方法包括一级质谱采集和一级质谱分窗口的二级质谱采集(SWATH采集)模式。SWATH模式可以根据一级离子的分布设置可变采集窗口,或采用直接指定窗口宽度的固定窗口模式。其它质谱参数,如离子源参数、去簇电压(DP)、碰撞能(CE)和碰撞能扩散(CES)等,均根据样品和流动相情况,根据实际需要,分别设置。如,在农药标准分析中,将100-1000Da的一级扫描范围划分为12个二级采集窗口。在细胞提取液分析中,将70-1200Da的一级扫描范围划分为10个二级采集窗口。去簇电位(DP)、碰撞能(CE)和碰撞能扩散(CES)分别设置为80V、35V和15V。
对质控样本的逐级稀释检测:利用合适的溶剂,对质控样本进行等比例稀释2倍-64倍;选择质控样本中对应采集模式下覆盖度最好的色谱梯度(即能提取到最多化合物峰信息的梯度),如细胞样本中使用G4梯度,对所有等比例稀释样本进行4次分析。
数据分析
质谱检测到一个化合物,即可在特定保留时间,在其一级和二级离子m/z区域发现信号强度的增加,即发现一级或二级离子的兴趣区域(roi)。Roi的发现是利用广泛使用的centWave算法。在一般centWave算法中,零强度点的出现会立即触发ROI终止。本发明对centWave的修改是ROI不能超过1个零点。根据我们的观察,这种修改有助于提取峰显示不连续或不规则色谱峰。对等比例稀释样本和重复进样分析样本,也采用相同模式提取ROI。
一级离子与二级离子的确认与归属:通过色谱保留行为探测,可以发现,在不同洗脱条件下,同一个一级离子的roi在保留时间的变化上应该遵从线性的色谱保留行为规律。由于保留行为的线性度可能随离子的变化而变化,我们确定了保留行为的最小线性度(如R2,一般>0.9),选择提取的色谱图(如±15ppm)作为特征色谱图,并计算出该峰值ROI内的信号强度来表示该峰。在多梯度洗脱中均能够发现同一离子的ROI,且符合保留行为规律,即认为该离子真实存在于样本中,同时也确定了其在各样本中的保留时间。
对于逐级稀释样本,发现的一级离子和二级离子的ROI强度变化,应该遵从逐级稀释的规律。对于不符合稀释规律的样本,应作为假阳性结果去除。
对重复进样样本,发现的一级离子和二级离子的ROI强度和质量数稳定性应该保持一致。对于不一致的ROI,应作为背景干扰去除。
因为来源于同一个化合物的一级离子和二级离子的ROI在同一分析方法中具有相同的保留时间,在多梯度实验中,遵从相同的色谱保留行为,因此,通过对比一级离子和二级离子的保留时间和保留行为,即可确认一级离子和二级离子的归属关系,即实现去卷积,从而得到这个一级离子的二级谱图。
化合物的注释:对发现的二级谱图进行自动谱库匹配。通过在一级谱图中对各离子的质量数计算,可以识别正离子模式下的[M+H]+,[M+Na]+,[M+K]+,[M+NH4]+,[M+ACN+H]+,[M-H2O+H]+峰,以及负离子模式下的[M-H]-,[M+HCOO]-峰等;设定一级离子质量偏差容忍值,和二级离子偏差容忍值,进行自动谱库匹配分析。匹配相似度以DP值的形式输出。DP值约接近1,说明相似度越高。
通过本发明方法所检测的化合物具有大约小于0.01ng/ml的浓度。该方法可以结合食品相关行业、药品相关行业、化工行业或环境相关行业来执行。样品可以从固体、液体、食物、固体食物、液体食物、水、污泥、土壤、鱼组织、动物组织、植物、蔬菜、水果、牛奶、蜂蜜、果汁和鸟组织中的任一种获得。样品也可以从饮用水、地表水、地下水和废水中的任一种获得。该方法还可以包括通过在所述液相色谱分离之前进行固相萃取来浓缩样品。可以在所述固相提取之前进行至少一个其他样品处理步骤。所述化合物可以是药物、个人护理产品、内分泌干扰物、药物和农药中的任何一种。
本发明方法的第一个改进点在于提取色谱峰信号点的抓取。目前主流方法采用centWave方法,即非靶向液相质谱数据中的信号点须具有连续性。当液相质谱数据呈现在以时间(横轴)和提取离子的强度(纵轴)为坐标轴的二维图像(提取色谱图)上时,信号点必须在横轴和纵轴方向上都需要保证连续性,任何一个方向上出现断点(信号强度为0)即中断该信号点的数据摄取。采用这种方式,依次全面抓取所有信号点的信息。我们的改进点在于允许在横轴或纵轴方向上出现不多于1个断点。也即,当出现第一个断点时,该信号点的抓取不中断,只有出现第2个断点时才完成该信号点数据的抓取。该改进方案可有效抓取峰型不够完美的分子信号峰,或者样品中浓度极低的分子信号峰。(也可以理解为,利用色谱保留规律,可以降低在峰发现阶段,对噪音阈值的要求)
第二个改进点在于通过分子信号峰的色谱保留规律进行有效信息的筛选,过滤去除背景噪声干扰。目前的其它数据挖掘手段均根据信号峰的峰型特征筛选有效信息,不能有效识别峰型质量差或溶液浓度低的真实分子信息。
第三个改进点在于通过“人工智能”深度学习手段,学习在系列液相质谱分析方法条件下采集到的真实分子信号峰的色谱保留规律用于对未知分子化学性质的解析。目前的数据挖掘手段只关注分子信号峰在单一液相质谱分析条件下采集到的信号峰的色谱保留时间。色谱保留规律可准确有效地反映未知分子的化学性质,但是色谱保留时间不具备此项功能,除非有标准品或者非常准确的保留指数预测模型才可以。
实施例1:51种农残混标成分的解析
1、待测样品的准备
对51种农药标准品(天津阿尔塔科技有限公司)的混合物进行非靶向分子分析。该样品已经储存了1年以上时间,已过保质期,怀疑其中部分分子分解。农药标准混合物用甲醇稀释至1ppm,用于液相质谱分析。
2、仪器型号
采用岛津超高效液相色谱AB-sciex5600q-TOF质谱仪进行分析。在Waters-ACQUITY-UPLC-HSS-T3柱(1.8um,2.1×100mm)上,采用RPLC模式,分7个梯度进行混合农药化学标准品的分离。以水和乙腈为流动相,分别加入0.1vol%的甲酸添加剂进行色谱洗脱。在DIA(SWATH)模式下进行质谱扫描,将100-1000Da的一级扫描范围划分为12个二级采集窗口。分离电位(DP)、碰撞能(CE)和碰撞能分离(CES)分别设置为80V、35V和15V。
3、实验数据采集步骤
将样品通过亲水接触色谱分离模式进行分析,质谱统一采用非依赖数据采集方法,将农药样品进行质谱分析,该步骤通过多个梯度(见表1)利用T3色谱柱分离这些未知样品或未知样品的混合物,用以建立供软件分析提取一级和二级色谱峰,并发现色谱保留规律的样品信息数据库,建库的目的是记录未知样品中各个分子的信息,包括这些分子的分子量、离子碎片信息、色谱保留行为信息。其中离子碎片信息将反映该分子的分子结构特征,色谱保留行为反映分子的化学性质。经过该步骤后,我们将通过逐级稀释样品的方法来确认信号峰强度与浓度的线性关系,该步骤的目的是考察检索到的分子信号峰强度与它在样品中的浓度是否有正相关的关系。理论上绝大多数的分子的信号强度与它在样品中的浓度应具有正相关的关系,依此可以评价数据检索结果的质量。最后我们根据建库的结果,靶向分析在不同批次制备的各个未知样品中各分子成分的浓度,进行相对定量,从而建立各样品中分子成分差异与其性质差异之间的关系,客观揭示未知样品宏观性质与微观组成之间的联系。
表1:洗脱浓度-时间表
色谱保留行为去卷积
使用ProteoWinzard(3.0.18160版本)将所有实验数据转换成文本文件,并通过MATLAB(R2016a)的自编辑代码进一步处理。基于SWATH扫描设置,将分析物的原始数据分成几个文件。第一文件包含Q1扫描的信息。从第二文件,每个文件包含具有位于每个分离的SWATH窗口中的m/z值的离子的所获取的数据。因此,对于具有n个MS/MS扫描窗口的SWATH设置,我们可以获得(n+1)个数据文件。当我们在M个洗脱梯度下分析样品时,可以得到总共M(N+1)个文件。
在每个数据文件中,我们可以观察到以保留时间、m/z和强度为轴的三维空间中的一系列分离的噪声区域。使用最广泛采用的CentWave算法,通过小的修改检测感兴趣区域(ROI)。在CentWave算法中,零强度斑点的出现触发ROI立即终止。我们对CentWave的修改是ROI可以包括不超过一个零点。根据我们的观察,这种修改有助于提取在时间过程中显示不连续外观的峰。
通过色谱保留行为方程检查提取的前体的ROI。由于保留行为的线性可能从一个离子偏离到另一个离子,因此我们首先确定保留行为的最小线性(R2)。我们选择了最具特征的色谱图用于这种评价。如果仅存在一个峰,则选择前体的提取色谱图(±15ppm)作为特征色谱图。总结在这种峰的ROI内的信号强度以表示其丰度。位于m/z区域中的所有其它ROI(如果它们存在)应当具有小于0.1的相对丰度。所有特征色谱峰的保留行为与保留行为方程相匹配。其中,使用试错策略来计算柱的死时间(t0)。将它们的线性最小值(R2)设定为最小阈值。对于以RPLC模式分离的农药标准,t0和最小值R2确定为1.03分钟和0.90分钟。然后,检查所有色谱峰的保留行为。在所有检测的梯度中,需要离子峰的最少4次出现以确定其保留行为的线性。线性R2值超过0.90的峰被确定为进一步加工的候选前体。一个离子峰的重复出现不仅在验证其在保留行为中是有用的,而且在确认分子离子的存在中也是有价值的。然后基于前体在不同洗脱梯度下的保留时间将MS/MS离子与前体匹配。在每个洗脱梯度下,前体离子与其产物离子之间的偏差应不大于0.2分钟。类似地,如果它们在所有洗脱梯度中的出现超过4次,则确认了真实的二级峰。
与谱库匹配
在15ppm的一级离子容忍偏差和0.1Da的二级离子容忍偏差下进行实验离子和标准普库之间的精确质量匹配,而对于正离子考虑离子加合物,例如[M+H]+、[M+Na]+、[M+K]+、[M+NH4]+、[M+ACN+H]+、和中性丢失离子[M-H2O+H]+和对于负离子考虑[M-H]-、[M+HCOO]-、和中性丢失离子[M-H2O-H]。
当一级离子可以和数据库匹配,将构建的解卷积二级谱与AB Sciex拥有的数据库和MassBank数据库的参考二级谱进行比较。在DIA数据采集中,二级谱是在CE值为35V下获得的。因此,使用在CE35V下标准品谱库进行匹配。标准谱库采用包含82,426正离子谱图和36,580个负离子谱图的MassBank数据库用于匹配农药混合物中的离子。提取其中CE范围为25-40V的MS/MS谱图作为匹配参考。采用公用的点积算法来计算谱图匹配度,其算法如下。
其中"W"表示有助于相似性计算的加权碎片峰强度。"W"作为[m/z]0.5[丰度]1计算。"L"表示谱库,"E"表示实验。当我们将实验谱与库谱进行比较时,我们首先在两个谱中搜索每个离子的m/z值。子离子的质量误差设定为±25ppm。对于库谱中存在但实验谱中不存在的离子,将离子添加到实验谱中但用零强度标记,反之亦然。因此,可以获得具有相同矩阵长度的两个谱的两个数据矩阵。计算的DP值可以代表两个光谱之间的总体相似性。在每个光谱中选择最多20个最高子离子用于谱图相似性匹配。
4、检测结果:
使用8个洗脱梯度(G1-G8)用于样品的LC-MS分析。同一样品的8个上样数据集被用作去卷积的组。图1-a显示液相色谱采用系列多梯度的8个梯度;图1-b和图1-e显示,利用各个一级和二级离子提取色谱峰的色谱保留行为,就可有效识别各个分子的母离子及其对应的子离子的信息。该方法经实验验证可有效识别信号峰峰型丑陋的分子成分(图1c)和样品中浓度极低的分子成分(图1f)。解析出的分子二级谱图真实性很高(经数据库验证)(图1d和g黑色为解析出的谱图,蓝色为标准谱图)。本方法相比现有的其它方法(MS-DIAL)具有显著优势,其它方法不能识别峰型丑陋的分子信号峰,也不能准确解析出未知样品中浓度很低的分子的二级质谱图(图1h)。
MS-DIAL没有利用色谱保留行为,而是依靠同一色谱梯度下的重复进样方式,排除掉部分不能重复出现的一级和二级峰(不能重现可能是噪音,也有可能是应为目标化合物含量太低,不能再重复进样中持续被发现),同时,利用二级离子的提取色谱峰是否和一级离子提取色谱峰的表留时间和对称性是否一致,来决定一级离子和二级离子之间的归属关系。因此,以往的数据处理方法,对峰型丑陋(对称性不佳)和低含量的化合物(一级或二级提取离子峰时有时无)无能为力。而采用色谱保留行为确认一级和二级离子的归属关系(解卷积),可以容忍峰型丑陋和时有时无的色谱峰(在多梯度洗脱中,必然有几组梯度有利于目标化合物的分离,进而容易被发现,同时,这些被发现的一级和二级色谱峰,必然遵从色谱保留行为。虽然这些色谱峰不是在全部梯度都被发现,但是依靠色谱表留行为,也可以作出有效的识别。
在所有报道过的或商业化的方法中只有MS-DIAL和本方法可以解析复杂未知样品中非靶向分子的二级质谱信息。通过对比检测获得如下结果,本方法比MS-DIAL可以解析更多的分子信息。靶向确认结果证实了解析结果的真实性。
表2:本方法与MS-DIAL方法农残混标非靶向液相质谱数据挖掘结果比较
该农药混合物已储存一年,已发生部分降解。实验中总共检测到375个母离子,其中244个离子被确定为高可信度的真实离子,因为它们的产物离子的色谱图也被成功提取,并进行谱库匹配鉴定。成功鉴定的标准是:化合物二级谱图与MassBank谱库中潜在目标谱图的相似性的DP值超过0.4。在所有标准品中,有31种化合物可以通过我们的方法成功鉴定。相比之下,MS-DIAL仅识别了17种化合物。手动检查确认了40种化合物的母离子和子离子均存在,其中8种化合物无法从IDA数据中解卷积,因为它们的保留时间小于1分钟。这些在色谱图前沿洗脱的离子嵌入了复杂的噪声中。虽然它们的碎片离子可以通过人工检查来识别,但它们很难自动去卷积。令人惊讶的是,利用色谱保留行为,可以解卷积氯氟嘧磺隆和甲维菌素的母离子,并在二级匹配中与标准库成功匹配。即使手动检查也无法提供(即,此类化合物的母离子和产物离子,通过常规匹配或人工检查均无法辨认)。,
实施例2:Hela(宫颈癌)细胞内容物中分子成分的解析
1、待测样品的准备
本发明方法采用Hela(宫颈癌)细胞内溶代谢物进行验证。培养Hela细胞系:Hela细胞在37℃下悬浮于PBS溶液中,然后以1500转/分离心5分钟,丢弃溶剂,再将含有10%胎牛血清(FBS)的高糖DMEM培养基加入培养瓶中。将细胞悬液转移到培养瓶中,在37℃的温度下,在5%的二氧化碳、95%的空气和100%的相对湿度中培养。制备了不含FBS的新鲜DMEM培养基,并用其代替了用过的培养基。细胞饥饿12h,用含10%胎牛血清(FBS)和三氧化二砷(10μM)的DMEM代替培养基,培养24h,对照细胞在相同条件下孵育,不添加三氧化二砷。对细胞悬浮计数。然后,抽取每个样本2×106个细胞,用1ml溶剂(20:80)提取亲水性代谢物体积:水体积:MeOH),在60W下超声处理1分钟,使用20个循环,占空比为50%。在4℃下以15000g离心10min除去细胞碎片,吸取300μL上层溶液进行真空离心干燥。在制备液相质谱分析样品时,提取物用500μL预冷的提取液(50:50)(水:乙腈)复溶。在15000g下离心,丢弃不溶物,并抽吸250μL进行液相质谱分析。
2、仪器型号
采用岛津超高效液相色谱AB-sciex5600q-TOF质谱仪进行分析。Hela细胞提取物在Waters-ACQUITY-UPLC-HSS-T3柱上以反相色谱方式分离,在Waters-ACQUITY-BEH-Amide柱(1.7um,2.1×100mm)上以亲水接触色谱模式分离。以水和乙腈为流动相,分别加入0.1vol%的甲酸添加剂进行色谱洗脱。在DIA(SWATH)模式下进行质谱扫描。将70-1200Da的一级扫描范围划分为10个二级采集窗口。分离电位(DP)、碰撞能(CE)和碰撞能分离(CES)分别设置为80V、35V和15V。
3、实验数据采集步骤
将样品通过反相色谱分离模式分别分析,质谱统一采用非依赖数据采集方法,将不同组别的Hela细胞样品进行质谱分析,该步骤通过多个梯度利用T3和Hilic色谱柱分离这些Hela细胞样品的混合物,用以建立供软件分析提取的一级和二级色谱峰,并发现色谱保留规律的样品信息数据库(本案例设计了7个不同洗脱能力的梯度)。建库的目的是记录未知样品中各个分子的信息,包括这些分子的分子量、离子碎片信息、色谱保留行为信息。其中离子碎片信息将反映该分子的分子结构特征,色谱保留行为反映分子的化学性质。涉及到多个样品的未知样品组,我们通过混合进样(使用QC样本)的方式可以减少实验操作,降低分析成本,提高数据采集效率。经过该步骤后,我们将通过逐级稀释样品的方法来确认信号峰强度与浓度的线性关系,该步骤的目的是考察检索到的分子信号峰强度与它在样品中的浓度是否有正相关的关系。最后我们根据建库的结果,靶向分析在不同批次制备的各个Hela细胞样品中各分子成分的浓度,进行相对定量,从而建立各样品中分子成分差异与其性质差异之间的关系,客观揭示Hela细胞样品宏观性质与微观组成之间的联系。
4、实验结果
依据Hela细胞内容物,本方法与现有数据挖掘方法MS-DIAL,XCMS以及商用软件MarkerView,Progenesis QI进行了比较。其中本方法与MS-DIAL可解析分子的精确分子量和二级质谱信息,而其它方法只能解析未知样品中分子的精确分子量。所解析的分子在不同批次的Hela细胞内容物样品中可重现的分子被认为是真实存在的分子。结果见表2。
表3:本方法与其它数据挖掘方法在Hela细胞内容物非靶向液相质谱数据挖掘结果比较
将对照样品的提取物和用三氧化二砷(ATO)处理的细胞混合,使用seven-LC梯度方案和基于SWATH技术的6次重复LC-MS分析进行DIA分析。相比之下,数据相关采集(DDA)也在梯度G4下进行了6次重复的LC-MS分析。基于DIA和DDA数据的PLS-DA分析得出了对照组和ATO处理的Hela细胞组之间的显着差异使用对照组和ATO组的细胞提取物的混合物,使用保留行为的方法可以解卷积8,741个离子,其中57.8%的离子在对照组或ATO组的每个样品中可重现。MS-DIAL还可以解卷积7,922个离子,并且47.1%的离子是可重现的。XCMS解卷积了总共8,042个离子,其中48.8%的离子是可重现的。XCMS的性能与MS-DIAL相当,但XCMS仅解卷积母离子。与MS-DIAL相比,使用保留行为的方法在检索更多真实离子峰方面表现更好的证据是,更多的去卷积离子可重现(即使用保留行为的方法5,054(57.8%)、MS-DIAL 3,729(47.1%)、XCMS 3,921(48.8%))。MarkerView和Progenesis QI等商业软件可以从DIA数据集中提取前体离子,但它们在从嘈杂的背景中提取真正的前体离子的性能相当差(即,<20%的离子是可重现的)。同时,虽然DDA可以检索大量离子特征(包括它们的MS/MS谱),只有11.2%的非目标离子是可重现的。在所有亲水性代谢物中,由于酸性代谢物与典型液相色谱固定相上的硅烷醇基之间存在强氢键,因此经常观察到峰展宽。尽管经常添加酸添加剂以抑制峰拖尾,但在典型的代谢分析中无法轻易克服这些缺陷。当这些亲水性化合物在HILIC模式下以改变的洗脱梯度进行分离时,它们可能会与固定相发生强烈的相互作用和可观察到的保留行为。在这里,我们展示了使用保留行为方法能够成功鉴定许多重要的酸性代谢物,这是峰形匹配方法无法实现的。作为一个典型的例子,在负离子模式下采集的数据集中检索到了m/z为244.0409的代谢物。根据在HILIC模式下在7个梯度中获得的色谱图,我们可以在6-16分钟的洗脱时间范围内指定4个峰。这些离子显示出良好的色谱保留行为(即,根据方程1,R2在0.99-1.00范围内)。由于极低的峰强度(即<200cps),不可能仅通过一种洗脱梯度来指定离子峰。然而,离子可以很容易地被使用保留行为的方法解卷积。显示了它们在ATO和对照组中的再现性(即每组9个样品)。在重叠的提取离子色谱图中,我们可以观察到ATO上调峰P1和下调P2的情况,而P3和P4是可重复的,
此外,在Metaboanalyst(版本4.0)上用KEGG途径(人类)对显示出统计学差异的代谢物进行基因集富集分析(GSEA),以揭示ATO对Hela细胞代谢的影响。使用保留行为的方法显示出增强的敏感性,这在探索浓度下调的代谢物方面优于其他解卷积方法,尤其是在负离子模式下。
本方法与MS-DIAL均可解析未知样品中分子的二级质谱信息,可用于分子结构的确认。通过与HMDB数据库匹配可确认783个分子的信息,而MS-DIAL只能确认682个分子的信息。
Claims (9)
1.一种检测样品中未知成分的方法,所述方法通过多液相洗脱梯度配合质谱非靶向信息的采集,将样品溶液中所有成分的信息进行采集,之后对所采集到的信息利用化合物多液相梯度的色谱保留行为进行数据处理分析,从而确认样品中有哪些化合物,并进一步确定其含量,所述溶液中所有成分的采集是通过液质联用仪使用多梯度洗脱后采集到所有成分的信息。
2.如权利要求1所述的检测样品中未知成分的方法,所述液质联用仪包括串联质谱仪,通过质量分辨原理不同的质量分析器的串联,可获得溶液样品中各成分的母离子信息即一级母离子信息,同时也可以获得母离子的碎片离子的信息即二级子离子的信息。
3.如权利要求1或2所述的检测样品中未知成分的方法,所述液质联用仪的检测模式选择反相色谱柱正离子模式、反相色谱柱负离子模式、Hilic色谱柱正离子模式、Hilic色谱柱负离子模式的两种或多种组合。
4.如权利要求1-3任一项所述的检测样品中未知成分的方法,所述检测方法进一步包括如下步骤:
(1)、将样品进行前处理,注入液质联用仪(LCMS),
(2)、配置不同浓度洗脱液,进行多梯度洗脱,
(3)、质谱仪进行多次扫描,获得一级母离子和二级子离子的质荷比、强度、保留行为和保留时间信息,
(4)、通过检索一级或二级离子的兴趣区域(roi)确定样品中化合物的存在,
(5)、对比一级母离子和二级子离子的保留时间和保留行为,确认一级母离子和二级子离子的归属关系,从而得到这个一级母离子的二级子离子谱图,
(6)、对每个一级母离子的二级子离子谱图进行自动谱库匹配,从而实现样品中所有成分的注释。
5.如权利要求1-4任一项所述的检测样品中未知成分的方法,在多梯度洗脱中对样本进行逐级等比例稀释。
6.如权利要求5所述的检测样品中未知成分的方法,对于逐级稀释样本,发现的一级母离子和二级子离子的ROI强度变化,应该遵从逐级稀释的规律,对于不符合稀释规律的样本,应作为假阳性结果去除。
7.如权利要求4-6任一项所述的检测样品中未知成分的方法,包括多次重复进样的步骤,对重复进样样本,一级母离子和二级子离子的ROI强度和质量数稳定性应该保持一致,对于不一致的ROI,应作为背景干扰去除。
8.一种用于进行样品未知成分分析的系统,该系统包括:液质联用仪和数据处理单元,所述液质联用仪用于样品多梯度洗脱后采集所有成分的信息,数据处理单元用于对采集的信息进行数据处理,从而获得样品中成分的定性和定量信息。
9.如权利要求8所述的用于进行样品未知成分分析的系统,所述液质联用仪包括串联的质谱,用于对所有成分的一级母离子信息和二级子离子信息的采集。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110675956.1A CN113552247A (zh) | 2021-06-18 | 2021-06-18 | 一种样品未知成分的液质联用非靶向分析方法 |
PCT/CN2021/118409 WO2022262132A1 (zh) | 2021-06-18 | 2021-09-15 | 一种样品未知成分的液质联用非靶向分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110675956.1A CN113552247A (zh) | 2021-06-18 | 2021-06-18 | 一种样品未知成分的液质联用非靶向分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113552247A true CN113552247A (zh) | 2021-10-26 |
Family
ID=78130661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110675956.1A Pending CN113552247A (zh) | 2021-06-18 | 2021-06-18 | 一种样品未知成分的液质联用非靶向分析方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113552247A (zh) |
WO (1) | WO2022262132A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115015462A (zh) * | 2022-07-01 | 2022-09-06 | 广西特色作物研究院 | 一种基于液质联用非靶向分析的柑橘黄龙病检测方法 |
CN115389690A (zh) * | 2022-09-27 | 2022-11-25 | 中国科学院生态环境研究中心 | 环境中苯并三唑紫外线吸收剂类污染物的全面识别方法 |
CN115453009A (zh) * | 2022-10-14 | 2022-12-09 | 广东工业大学 | 一种不依赖保留时间的化学物质注释方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117153295B (zh) * | 2023-08-30 | 2024-03-12 | 南京大学 | 一种非靶向识别全氟化合物同系物的方法以及识别系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4973628B2 (ja) * | 2008-08-29 | 2012-07-11 | 株式会社島津製作所 | クロマトグラフ質量分析データ解析方法及び装置 |
CN109870535B (zh) * | 2017-12-01 | 2021-03-16 | 中国科学院大连化学物理研究所 | 一种基于混合生物样本的酰基肉碱大规模定性方法 |
CN108490098B (zh) * | 2018-05-21 | 2020-05-05 | 安徽瑞思威尔科技有限公司 | 一种白酒中未知农药残留的非靶向快速筛查方法 |
CN110579555B (zh) * | 2018-06-08 | 2021-09-14 | 中国科学院大连化学物理研究所 | 一种拟靶向代谢组学分析的离子对挑选方法 |
CN110646535B (zh) * | 2019-09-26 | 2022-12-27 | 上海烟草集团有限责任公司 | 一种烟草中多农残非靶向筛查及定量的检测方法 |
-
2021
- 2021-06-18 CN CN202110675956.1A patent/CN113552247A/zh active Pending
- 2021-09-15 WO PCT/CN2021/118409 patent/WO2022262132A1/zh unknown
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115015462A (zh) * | 2022-07-01 | 2022-09-06 | 广西特色作物研究院 | 一种基于液质联用非靶向分析的柑橘黄龙病检测方法 |
CN115015462B (zh) * | 2022-07-01 | 2023-06-23 | 广西特色作物研究院 | 一种基于液质联用非靶向分析的柑橘黄龙病检测方法 |
CN115389690A (zh) * | 2022-09-27 | 2022-11-25 | 中国科学院生态环境研究中心 | 环境中苯并三唑紫外线吸收剂类污染物的全面识别方法 |
CN115389690B (zh) * | 2022-09-27 | 2023-09-05 | 中国科学院生态环境研究中心 | 环境中苯并三唑紫外线吸收剂类污染物的全面识别方法 |
CN115453009A (zh) * | 2022-10-14 | 2022-12-09 | 广东工业大学 | 一种不依赖保留时间的化学物质注释方法 |
CN115453009B (zh) * | 2022-10-14 | 2023-08-22 | 广东工业大学 | 一种不依赖保留时间的化学物质注释方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2022262132A1 (zh) | 2022-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113552247A (zh) | 一种样品未知成分的液质联用非靶向分析方法 | |
Knolhoff et al. | Non-targeted screening approaches for contaminants and adulterants in food using liquid chromatography hyphenated to high resolution mass spectrometry | |
CN103109345B (zh) | 产物离子光谱的数据独立获取及参考光谱库匹配 | |
Qi et al. | Analysis of natural organic matter via fourier transform ion cyclotron resonance mass spectrometry: an overview of recent non‐petroleum applications | |
Gosetti et al. | Contaminants in water: non-target UHPLC/MS analysis | |
CA2298181C (en) | Non-targeted complex sample analysis | |
CN109828068B (zh) | 质谱数据采集及分析方法 | |
US20070083337A1 (en) | Method of using data binning in the analysis of chromatography/spectrometry data | |
CN109870536B (zh) | 一种基于液相色谱-质谱联用的高覆盖脂质组学分析方法 | |
CN107144646B (zh) | 一种应用液质联用技术结合代谢组学方法判别真蜂蜜与糖浆掺假蜂蜜的分析方法 | |
CN111721857A (zh) | 一种运用广泛靶向代谢组学技术鉴别荔枝品种的方法 | |
EP2455759B1 (en) | Mass spectrometry imaging with substance identification | |
CN108828051B (zh) | 快速蒸发离子化质谱的南极磷虾油的脂质实时检测方法 | |
CN111562327A (zh) | 一种基于分子网络的废水中致毒有机污染物非目标筛查分析的方法 | |
CN107192770B (zh) | 一种鉴别荆条蜜与糖浆掺假荆条蜜的分析方法 | |
CN111458417B (zh) | 联合检测待测样品中多种抗生素的方法及试剂盒 | |
CN111157664A (zh) | 生物代谢组学数据处理方法、分析方法及装置和应用 | |
Pérez-Parada et al. | Analytical improvements of hybrid LC-MS/MS techniques for the efficient evaluation of emerging contaminants in river waters: a case study of the Henares River (Madrid, Spain) | |
CN111474272A (zh) | 检测绿原酸类化合物方法和试剂盒 | |
CN101169417A (zh) | 用磁珠支持基质及质谱判断正常人与肝癌的试剂盒和方法 | |
Hawkes et al. | High-resolution mass spectrometry strategies for the investigation of dissolved organic matter | |
Wiseman et al. | Desorption electrospray ionization (DESI) mass spectrometry: a brief introduction and overview | |
CN114280202A (zh) | 一种用于诊断镉中毒的生物标志物及其应用 | |
Furlani et al. | Liquid chromatography-mass spectrometry for clinical metabolomics: an overview | |
Amoresano et al. | Mass spectrometry in metabolomics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |