CN114280199B - 反相液相色谱保留指数的移植方法 - Google Patents
反相液相色谱保留指数的移植方法 Download PDFInfo
- Publication number
- CN114280199B CN114280199B CN202111651334.1A CN202111651334A CN114280199B CN 114280199 B CN114280199 B CN 114280199B CN 202111651334 A CN202111651334 A CN 202111651334A CN 114280199 B CN114280199 B CN 114280199B
- Authority
- CN
- China
- Prior art keywords
- compounds
- compound
- chromatographic
- retention
- reversed phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000014759 maintenance of location Effects 0.000 title claims abstract description 143
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000004366 reverse phase liquid chromatography Methods 0.000 title claims abstract description 29
- 150000001875 compounds Chemical class 0.000 claims abstract description 244
- 239000007788 liquid Substances 0.000 claims abstract description 21
- 239000012071 phase Substances 0.000 claims description 71
- 238000004587 chromatography analysis Methods 0.000 claims description 38
- 238000012360 testing method Methods 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 23
- 238000010828 elution Methods 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 239000007791 liquid phase Substances 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 239000012074 organic phase Substances 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 239000002904 solvent Substances 0.000 claims description 6
- 150000002894 organic compounds Chemical class 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 abstract description 8
- 238000004458 analytical method Methods 0.000 abstract description 6
- 101100113998 Mus musculus Cnbd2 gene Proteins 0.000 description 14
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 11
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 9
- 238000010276 construction Methods 0.000 description 6
- 238000004949 mass spectrometry Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 238000002054 transplantation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 150000002500 ions Chemical class 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000012086 standard solution Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 229910001868 water Inorganic materials 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 239000008346 aqueous phase Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 238000001819 mass spectrum Methods 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 239000011550 stock solution Substances 0.000 description 2
- 229910021642 ultra pure water Inorganic materials 0.000 description 2
- 239000012498 ultrapure water Substances 0.000 description 2
- 239000012224 working solution Substances 0.000 description 2
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 1
- 241000289247 Gloriosa baudii Species 0.000 description 1
- 241001089723 Metaphycus omega Species 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- VZTDIZULWFCMLS-UHFFFAOYSA-N ammonium formate Chemical compound [NH4+].[O-]C=O VZTDIZULWFCMLS-UHFFFAOYSA-N 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000019253 formic acid Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 238000002514 liquid chromatography mass spectrum Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229940054967 vanquish Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Treatment Of Liquids With Adsorbents In General (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了基于校准集化合物保留指数和误差反向传播网络构建的反相液相色谱保留指数的移植方法,以提高保留指数在不同方法间的移植效率和准确度,进而建立一种准确、灵活和通用的液相CRI数据库,提高了化学分析领域需要根据色谱保留信息进行方法移植和化合物鉴别的准确度。
Description
技术领域
本发明涉及分析化学领域,具体地,涉及反相液相色谱保留指数的移植方法。
背景技术
非靶向/可疑筛查是指利用代谢组学的技术鉴别样品中的多种未知成分。基于高分辨质谱的非靶向筛查方法最显著的优点之一,是基于其全质谱扫描方式的无偏检测,即可以在没有任何先验知识的情况下采集到样品中高通量的质谱信息,已被广泛用于分析复杂样品中数千种不同理化性质的化合物。然而其高通量筛选也带来了许多化合物无法准确识别的问题。
传统的未知物识别过程主要依赖于网络或自建数据库中记录的化合物质谱特征与色谱保留特征。其中化合物的质谱特征主要指离子的精确质荷比、理论同位素分布、二级质谱碎片及特征碎片离子的丰度比信息,而色谱保留特征主要指化合物在特定色谱方法条件下的保留时间信息。然而,受液相色谱仪的不同与色谱方法的高变异性造成了相同化合物的液相色谱保留时间(Retention time,RT)在多次实验间具有大小不等的偏差现象,难以在不同色谱方法间甚至相同色谱方法不同色谱仪器间进行移植。高变异现主要体现在人为无意的改变(如流动相pH的微小变化、梯度延迟、梯度分散、管路长度、色谱柱老化程度等)与人为有意的改变(如色谱柱种类、运行时间、流速、梯度、柱温等),因此化合物的保留时间只能通过标准品在相同的仪器和色谱分析方法下进行实验测定,否则很容易出现假阳性识别。
由此,克服反相液相色谱保留时间的高变异性等相关参数移植方法有待进一步研究。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种反相液相色谱保留指数的移植方法。本发明实施例的方法基于校准集化合物保留指数(Chromatographic retention index of calibrants,CRIoC)和误差反向传播网络构建的反相液相色谱保留指数的移植方法,以提高保留指数在不同方法间的移植效率和准确度,进而建立一种准确、灵活和通用的液相CRI数据库,提高了化学分析领域需要根据色谱保留信息进行方法移植和化合物鉴别的准确度。
需要说明的是,本发明是基于发明人的下列工作而完成的:
由于化合物的保留时间只能通过标准品在相同的仪器和色谱分析方法下进行实验测定,否则很容易出现假阳性识别,发明人基于液相色谱分离的CRI进行移植,这种计算方式在一定程度上减小了由梯度延迟、梯度分散、管路长度变化等因素对保留时间的影响。CRI的计算方法主要有两种。一种为采用不同碳数的同系物作为基准指标,根据待测化合物X及其流出顺序前后碳数为Z和Z+1的同系物的保留时间计算待测化合物的CRI,该方法可以明显改善因色谱条件变化引起的保留时间偏差,但所提出的CRI计算方式需要将待测化合物和同系物的出峰顺序进行比较,耗时较长,此外该方法常用于校准相同色谱柱相同流动相组成以及相同梯度运行时间下的保留指数。另一种为选择多种包含广泛物理化学性质的化合物作为校准物,根据校准物中保留时间的最小值和最大值,计算待测化合物的CRI,该方法所提出的CRI值具有计算方式简单的优点,但不同色谱方法间相同化合物的CRI值依然存在较大误差。
发明人采用误差反向传播(Back Propagation,BP)网络算法对后一CRI计算方法进行校准,BP网络由输入层、隐含层和输出层组成,BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,从而,利用BP网络构建色谱方法-保留指数定量关系QMRR模型,预测新方法下化合物的保留指数,进而实现化合物的保留指数在不同色谱方法之间的移植。
因而,根据本发明的一个方面,本发明提供了一种反相液相色谱保留指数的移植方法。根据本发明的实施例,该方法包括:利用液相色谱仪对初始化合物集在不同反相色谱条件下进行液相检测,以便得到不同色谱条件下初始化合物集中各化合物的保留时间;基于所述初始化合物集中各化合物的反相色谱保留特性,将所述初始化合物集分为不同子集,并按比例将所述不同子集的化合物分为校准集化合物、训练集化合物和测试集化合物;基于所述初始化合物集中各化合物的保留时间,以便得到所述初始化合物集中各化合物在不同色谱条件下的色谱保留指数;基于误差反向传播(BP)神经网络,构建所述校准集化合物的色谱条件-保留指数关系模型;在第一反相色谱条件和第二反相色谱条件下分别对所述校准集化合物进行检测,以便获得所述校准集化合物分别在所述第一反相色谱条件和所述第二反相色谱条件下的保留指数;在所述第一反相色谱条件对待测化合物进行检测,以便得到所述待测化合物在所述第一反相色谱条件的保留指数;以及基于所述校准集化合物的保留指数关系模型,利用所述校准集化合物分别在所述第一反相色谱条件和所述第二反相色谱条件下的保留指数和所述待测化合物在所述第一反相色谱条件的保留指数,预测得到所述待测化合物在所述第二反相色谱条件的保留指数。
根据本发明实施例的反相液相色谱保留指数的移植方法,基于校准集化合物保留指数(Chromatographic retention index of calibrants,CRIoC)和BP网络,通过建立准确、灵活和通用的液相CRI数据库,以提高非靶向/可疑筛查等化学分析领域需要根据色谱保留信息进行化合物鉴别的准确度。该方法提高了CRI数据库在不同方法间的移植效率和准确度,改善了因色谱条件变化或液相系统不稳定等因素引起的保留指数偏差而导致的CRI据库不可持续使用和难以共建共享的情况,避免了重新建立新方法下CRI数据库的麻烦,有效解决了针对反相液相色谱保留时间的高变异性现象所导致的保留指数数据库不可持续使用和难以共建共享的问题。
另外,根据本发明上述实施例的反相液相色谱保留指数的移植方法,还可以具有如下附加的技术特征:
根据本发明的实施例,所述反相色谱条件的参数包括色谱柱类型、色谱柱温度、洗脱流速、梯度洗脱比例、流动相组成和色谱运行时间。
根据本发明的实施例,基于所述初始化合物集中各化合物的反相色谱保留特性,利用自组织神经网络算法(SOM)对所述初始化合物集进行聚类分析,将所述初始化合物集分为不同子集,并按比例将所述不同子集的化合物分为校准集化合物、训练集化合物和测试集化合物。
根据本发明的实施例,按照1:(4-10):(2-4)的比例权重将所述不同子集的化合物分为所述校准集化合物、所述训练集化合物和所述测试集化合物。
根据本发明的实施例,基于校准集化合物和目标化合物的实测保留时间,利用公式(1),得到所述色谱条件下各所述校准集化合物和目标物化合物在不同色谱方法下的保留指数,
其中,RTmax、RTmin分别为所述不同色谱条件中,所述校准集化合物中实测保留时间的最大值和最小值;RTi为所述色谱方法下目标化合物的实测保留时间;CRIi为所述色谱条件下所述目标化合物的实测保留指数。
根据本发明的实施例,基于所述误差反向传播神经网络,构建所述色谱条件-保留指数关系模型的方法包括:基于所述网络,深度学习并构建不同色谱方法下所述校准集化合物保留指数关系初始模型;利用所述训练集化合物的保留指数对所述保留指数关系初始模型进行内部验证,并基于公式(2)以平均相对误差为评价指标,对所述保留指数关系初始模型进行优化直到收敛为止,以便得到保留指数关系校验模型;
其中,CRIMea、CRIPre分别为某个色谱方法下所述训练集化合物的实测保留指数和预测保留指数,n为所述训练集化合物的个数,MRE为平均相对误差;以及采用所述测试集化合物的保留指数对所述保留指数关系初始模型进行外部验证和性能评价,以便得到所述保留指数关系模型。
根据本发明的实施例,所述初始化合物集包括至少8个化合物,优选地,至少15个化合物,更优选地,至少30个化合物。
根据本发明的实施例,所述第一反相色谱条件和第二反相色谱条件均包括:
色谱柱:反相液相色谱柱;
色谱运行时间:不低于10min;
色谱洗脱流速:0.1ml/min~1.0ml/min;
色谱柱温度:20℃~50℃。
根据本发明的实施例,所述液相检测的洗脱方式均为梯度洗脱。
根据本发明的实施例,梯度洗脱的有机相初始比例在第一反相色谱条件和第二反相色谱条件的差异不高于30%;且梯度洗脱的有机相最高比例在第一反相色谱条件和第二反相色谱条件的差异不高于30%;
且第一反相色谱条件和第二反相色谱条件的水相流动相应具有相同的缓冲溶剂;
且第一反相色谱条件和第二反相色谱条件的有机流动相应具有相同的缓冲溶剂;
根据本发明的实施例,利用液相色谱仪或液相色谱质谱联用仪,得到所述不同色谱条件下所述初始化合物集中各化合物的所述保留时间。
根据本发明的实施例,所述初始化合物集中的化合物是覆盖广泛物理化学性质的有机化合物。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的反相液相色谱保留指数的移植方法的流程示意图;
图2显示了根据本发明一个实施例的利用QMRR模型减小相同化合物的CRI在不同色谱方法下的偏差示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不能理解为对本发明的限制。
需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
根据本发明的一个方面,本发明提供了一种反相液相色谱保留指数的移植方法。根据本发明实施例的反相液相色谱保留指数的移植方法,基于校准集化合物保留指数(Chromatographic retention index of calibrants,CRIoC)和BP网络的反相液相色谱保留指数,通过建立准确、灵活和通用的液相CRI数据库,以提高非靶向/可疑筛查等化学分析领域需要根据色谱保留信息进行化合物鉴别的CRI准确度。该方法提高了CRI数据库在不同方法间的移植效率和准确度,改善了因色谱条件变化或液相系统不稳定等因素引起的保留指数偏差而导致的CRI据库不可持续使用和难以共建共享的情况,避免了重新建立新方法下CRI数据库的麻烦,有效解决了针对反相液相色谱保留时间的高变异性现象所导致的保留指数数据库不可持续使用和难以共建共享的问题。
本发明实施例的反相液相色谱保留指数的移植方法,适用于非靶向/可疑筛查等需要建立准确、灵活、通用的保留时间数据库,对复杂多类别成分的样品进行定性识别的食品安全、环境安全和生物医药等分析领域。
为了进一步理解本发明实施例的反相液相色谱保留指数的移植方法,在此,参考图1,对该方法进行解释说明,根据本发明的实施例,该方法包括:
S100液相检测
根据本发明的实施例,利用液相色谱仪对初始化合物集在不同反相色谱条件下进行液相检测,得到不同色谱条件下初始化合物集中各化合物的保留时间。也就是说,分别检测初始化合物集中各化合物在多个不同色谱条件下的相应的保留时间,建立该类别化合物的保留时间数据库。
根据本发明的实施例,利用液相色谱仪对初始化合物集在不同反相色谱条件下进行液相检测的方法包括:配制适合浓度的混合标准样品,需保证混合标准样品具有良好的响应信号,且不存在相同或相近信号峰干扰初始化合物的RT识别;随后建立多种不同的反相液相色谱洗脱方法,色谱方法覆盖多种反相色谱柱、洗脱流速、系统梯度、流动相组成、运行时间;在不同色谱方法下对混合标准样品进行分析,得到不同色谱条件下初始化合物集中各化合物的保留时间。
根据本发明的实施例,所述色谱条件的参数包括反相色谱柱类型、色谱柱温度、洗脱流速、梯度洗脱比例、流动相组成和色谱运行时间。
根据本发明的实施例,所述初始化合物集中的化合物是覆盖广泛物理化学性质的有机化合物。一般来说,通过大数据调研食品和环境等领域中有机化合物的现存种类,选择了覆盖广泛物理化学性质的有机化合物,构建初始化合物集,以建立适用范围更广的QMRR模型。初始化合物集包含的化合物的数量,根据QMRR模型的覆盖度不同而不同,通常的,化合物的数量越多,QMRR模型的覆盖度越广。根据本发明的实施例,所述初始化合物集包括至少8个化合物,优选地,至少15个化合物,更优选地,至少30个化合物。由此,满足QMRR模型构建的样本数量要求。
根据本发明的实施例,利用液相色谱仪或液相色谱质谱联用仪,得到所述不同色谱条件下所述初始化合物集中各化合物的所述保留时间。
S200划分校准集化合物、训练集化合物和测试集化合物
根据本发明的实施例,基于所述初始化合物集中各化合物的反相色谱保留特性,将所述初始化合物集分为不同子集,并按比例将所述不同子集的化合物分为校准集化合物、训练集化合物和测试集化合物。QMRR模型的预测性能及其准确性由校准集化合物的物理化学性质范围,校准集化合物、训练集化合物和测试集化合物之间物理化学性质的相似程度决定。
根据本发明的实施例,基于所述初始化合物集中各化合物的反相色谱保留特性,利用自组织神经网络算法(SOM)对所述初始化合物集进行聚类分析,将所述初始化合物集分为不同子集,并按比例将所述不同子集的化合物分为校准集化合物、训练集化合物和测试集化合物。由此,划分得到的校准集化合物、训练集化合物和测试集化合物具有相似物理化学性质空间,有利于提高QMRR模型的预测性能和准确性。
根据本发明的实施例,按照1:(28):(13)的比例权重将所述不同子集的化合物分为所述校准集化合物、所述训练集化合物和所述测试集化合物。由此,划分得到的训练集化合物数量2倍高于校准集化合物的数量,测试集化合物数量1倍高于校准集化合物的数量,有利于提高QMRR模型的预测性能和准确度。
S300计算色谱保留指数
根据本发明的实施例,基于所述初始化合物集中各化合物的保留时间,以便得到所述初始化合物集中各化合物在不同色谱条件下的色谱保留指数。由于化合物的保留时间受色谱方法高变异性的影响存在大小不等的偏差,发明人选择色谱保留指数进行移植,有利于减小由色谱方法高变异性对保留指数的影响,进而使QMRR模型的预测性能和准确度更高。
根据本发明的实施例,基于校准集化合物和目标化合物的实测保留时间,利用公式(1),得到所述色谱条件下各所述校准集化合物和目标化合物在不同色谱方法下的保留指数,
其中,RTmax、RTmin分别为所述不同色谱条件中,所述校准集化合物中实测保留时间的最大值和最小值;RTi为所述色谱方法下目标化合物的实测保留时间;CRI为所述色谱条件下所述目标化合物的实测保留指数。
S400模型构建
根据本发明的实施例,基于误差反向传播(BP)神经网络,构建所述校准集化合物的色谱条件-保留指数关系模型。其中,BP神经网络由输入层、隐含层和输出层组成,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
根据本发明的实施例,基于所述误差反向传播神经网络,构建所述色谱条件-保留指数关系模型的方法包括:基于所述网络,深度学习并构建不同色谱方法下所述校准集化合物保留指数关系初始模型;利用所述训练集化合物的保留指数对所述保留指数关系初始模型进行内部验证,并基于公式(2)以平均相对误差为评价指标,对所述保留指数关系初始模型进行优化直到收敛为止,以便得到保留指数关系校验模型;
其中,CRIMea、CRIPre分别为某个色谱方法下所述训练集化合物的实测保留指数和预测保留指数,n为所述训练集化合物的个数,MRE为平均相对误差;以及采用所述测试集化合物的保留指数对所述保留指数关系初始模型进行外部验证和性能评价,以便得到所述保留指数关系模型。
S500校准集化合物不同反相色谱条件下的保留指数
根据本发明的实施例,在第一反相色谱条件和第二反相色谱条件下分别对所述校准集化合物进行检测,以便获得所述校准集化合物分别在所述第一反相色谱条件和所述第二反相色谱条件下的保留指数。
根据本发明的实施例,所述液相检测的洗脱方式均为梯度洗脱。由此,分离效率更高。
根据本发明的实施例,所述梯度洗脱的有机相初始比例在所述第一反相色谱条件和所述第二反相色谱条件的差异不高于30%;且所述梯度洗脱的有机相最高比例在所述第一反相色谱条件和所述第二反相色谱条件的差异不高于30%;且第一反相色谱条件和第二反相色谱条件的水相流动相具有相同的缓冲溶剂;且第一反相色谱条件和第二反相色谱条件的有机流动相具有相同的缓冲溶剂。由此,第一和第二反相色谱的差异控制在上述范围内,反相液相色谱保留指数的移植准确度高。
S600待测化合物第一反相色谱条件的保留指数
根据本发明的实施例,在所述第一反相色谱条件对待测化合物进行检测,以便得到所述待测化合物在所述第一反相色谱条件的保留指数。
S700预测待测化合物在第二反相色谱条件的保留指数
根据本发明的实施例,基于所述校准集化合物的保留指数关系模型,利用所述校准集化合物分别在所述第一反相色谱条件和所述第二反相色谱条件下的保留指数和所述待测化合物在所述第一反相色谱条件的保留指数,预测得到所述待测化合物在所述第二反相色谱条件的保留指数。
也就是说,当基于液相色谱分离的检测方法在仪器间移植或进行色谱参数调整(如色谱柱、洗脱流速、系统梯度、流动相组成、运行时间)时,首先直接测定新方法(即第二反相色谱条件)下校准集化合物的保留时间;随后根据公式(1)计算新方法下校准集化合物的保留指数;然后借助QMRR模型,输入原方法和新方法下校准集化合物的保留指数以及原方法下其它化合物的保留指数,预测新方法下其它化合物的保留指数,进而实现其它化合物的保留指数在不同色谱方法之间的移植。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明性的,而不能理解为对本发明的限制。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件(或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品,例如可以采购自Sigma公司。
实施例1
根据本发明实施例的反相液相色谱保留指数的移植方法,选取在ESI正模式或ESI负模式可检测出的304种化合物构成初始化合物集,这些化合物具有复杂物理化学性质(logKow=-8.5~12.3,MW=75Da~1549),可较完整地覆盖反相色谱各个保留时间,构建QMRR模型,并对该模型移植准确度进行比较,具体方法如下:
1.仪器
Vanquish UPLC-Q Exactive Plus Orbitrap高效液相色谱串联轨道离子阱质谱仪(Thermo Fisher Scientific,San Jose,CA,U.S.A.)。
2.试剂和药品
质谱纯甲醇、乙腈、甲酸全部购买于赛默飞世尔科技(中国)有限公司;色谱纯甲酸铵购买于Sigma-Aldrich试剂有限公司(中国);混合标准溶液与色谱流动相配制时所用的超纯水均由实验室内Milli-Q(德国Merck Millipore有限公司)超纯水系统(电阻率>18.2MΩ/cm)得到;分析纯标准品购买于国内和国外多种试剂公司,包括但不限于阿拉丁化学试剂有限公司(上海)、天津阿尔塔试剂公司(天津)、Sigma-Aldrich试剂有限公司(中国)、中国计量科学研究(北京)。
3.混合标准溶液配制
使用甲醇或乙腈或丙酮或异丙醇或水配制单组分储备液,使用10%甲醇水溶液将单组分储备液稀释,配制各化合物浓度范围为50~500μg·kg-1的混合标准工作溶液,全部置于-20℃冰箱保存备用。
4.质谱条件
采用全质谱扫描(Full MS)监测方法获取混合标准溶液的色谱保留时间。质谱扫描范围分为两段,第1段扫描范围为60Da~400Da,第2段扫描范围为400Da~1600Da;离子监测模式:HESI+和HESI-分开扫描;质谱分辨率:140 000;AGC:1e6;最大驻留时间:100ms;质量提取窗口:3ppm(HESI+)和10ppm(HESI-);毛细管电压::3.5kV(HESI+)和2.5kV(HESI-);毛细管温度:250℃;鞘气流速:40Arb;雾化气流速:8Arb;反吹气流速:0;喷雾针温度:390℃;RF电压:60eV。
5.色谱条件
11种不同色谱分离条件(色谱柱、流速、洗脱梯度、运行时间、柱温、流动相组成)参数见表1。色谱柱均为反相色谱材料,规格统一为2.1x 100mm,1.7μm。色谱条件LC-1、LC-2、LC-3、LC-4、LC-5、LC-6、LC-7、LC-8和LC-9的水相A为H2O:MEOH=9:1,v/v,有机相B为MEOH,色谱条件LC-10和LC-11的水相A为H2O,有机相B为乙腈,详细流动相组成参见表1。变速洗脱指在色谱运行过程中流速随流动相的梯度变化而变化。本实施例的变速洗脱的流速变化范围为0.2ml/min~0.48ml/min。进样体积为5μL。样品池温度为10℃。
表1色谱条件明细
6.数据预处理
(1)将基于LC1方法的标准样品数据导入采用Xcalibur Qual Browser软件中进行峰提取,基于304种化合物的结构信息和液相色谱质谱相关的检测方法,比对色谱峰离子的精确分子质量和二级碎片数据,确定每个化合物的峰型、响应情况、离子化形式和基于LC1方法的保留时间。
(2)分别导入剩余10种方法(LC2-LC11)的标准样品数据进行峰提取,逐一手动检查和记录304种化合物的保留时间,以确保不同色谱方法中相同化合物的保留时间正确性。
7.模型移植准确度比较
(1)利用CRIoCs计算11种色谱方法下所有化合物CRI值,将LC2-LC11方法下实测数据作为初始CRIs值。
(2)依据该304种初始化合物在11种不同反相液相色谱方法下的保留特性,分别选择31种、217种和62种均具有与初始化合物相同保留特性的化合物作为校准集化合物、训练集集化合物和测试集化合物。
(3)基于BP网络,构建用于预测新方法下待测化合物RTI值的QMRR模型。最后再依据LC1-LC11方法的CRIoCs,借助QMRR模型,将LC2-LC11方法下其它化合物的CRIs值移植到LC1方法下。
为了验证LC2-LC11各方法初始CRIs值和移植CRIs值分别与LC1方法下实测CRIs的匹配准确度,本实施例将LC2-LC11方法下的实测CRIs值(y)与LC1方法下的实测CRIs值(x)做图2A,将基于LC2-LC11方法的移植CRIs值(y)与LC1方法下的实测CRIs值(x)做图2B,将图2中的图2A与图2B进行比较,发现采用QMRR模型可以将不同(LC2-LC11)色谱方法下的初始CRIs值移植到LC1方法下,与初始CRIs值相比,移植CRIs值与预测值与LC1方法下的实测CRIs值更接近,平均偏差从36.6降低到9.6,降低了73.7%,证明了移植后的CRIs与实测值匹配准确度有了显著性的提高。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
Claims (12)
1.一种反相液相色谱保留指数的移植方法,其特征在于,包括:
利用液相色谱仪对初始化合物集在不同反相色谱条件下进行液相检测,以便得到不同色谱条件下初始化合物集中各化合物的保留时间;
基于所述初始化合物集中各化合物的反相色谱保留特性,将所述初始化合物集分为不同子集,并按比例将所述不同子集的化合物分为校准集化合物、训练集化合物和测试集化合物;
基于所述初始化合物集中各化合物的保留时间,以便得到所述初始化合物集中各化合物在不同色谱条件下的色谱保留指数;
基于误差反向传播神经网络,构建所述校准集化合物的色谱条件-保留指数关系模型;
在第一反相色谱条件和第二反相色谱条件下分别对所述校准集化合物进行检测,以便获得所述校准集化合物分别在所述第一反相色谱条件和所述第二反相色谱条件下的保留指数;
在所述第一反相色谱条件对待测化合物进行检测,以便得到所述待测化合物在所述第一反相色谱条件的保留指数;以及
基于所述校准集化合物的保留指数关系模型,利用所述校准集化合物分别在所述第一反相色谱条件和所述第二反相色谱条件下的保留指数和所述待测化合物在所述第一反相色谱条件的保留指数,预测得到所述待测化合物在所述第二反相色谱条件的保留指数,
其中,基于校准集化合物和目标化合物的实测保留时间,利用公式(1),得到所述色谱条件下各所述校准集化合物和目标物化合物在不同色谱方法下的保留指数,
其中,
RTmax、RTmin分别为所述不同色谱条件中,所述校准集化合物中实测保留时间的最大值和最小值;
RTi为所述色谱方法下目标化合物的实测保留时间;
CRIi为所述色谱条件下所述目标化合物的实测保留指数;
其中,基于所述误差反向传播神经网络,构建所述色谱条件-保留指数关系模型的方法包括:
基于所述网络,深度学习并构建不同色谱方法下所述校准集化合物保留指数关系初始模型;
利用所述训练集化合物的保留指数对所述保留指数关系初始模型进行内部验证,并基于公式(2)以平均相对误差为评价指标,对所述保留指数关系初始模型进行优化直到收敛为止,以便得到保留指数关系校验模型;
其中,CRIMea、CRIPre分别为某个色谱方法下所述训练集化合物的实测保留指数和预测保留指数,n为所述训练集化合物的个数,MRE为平均相对误差;以及
采用所述测试集化合物的保留指数对所述保留指数关系初始模型进行外部验证和性能评价,以便得到所述保留指数关系模型。
2.根据权利要求1所述的方法,其特征在于,所述反相色谱条件的参数包括色谱柱类型、色谱柱温度、洗脱流速、梯度洗脱比例、流动相组成和色谱运行时间。
3.根据权利要求1所述的方法,其特征在于,基于所述初始化合物集中各化合物的反相色谱保留特性,利用自组织神经网络算法对所述初始化合物集进行聚类分析,将所述初始化合物集分为不同子集,并按比例将所述不同子集的化合物分为校准集化合物、训练集化合物和测试集化合物。
4.根据权利要求1所述的方法,其特征在于,按照1:(2-8):(1-3)的比例权重将所述不同子集的化合物分为所述校准集化合物、所述训练集化合物和所述测试集化合物。
5.根据权利要求1所述的方法,其特征在于,所述初始化合物集包括至少8个化合物。
6.根据权利要求5所述的方法,其特征在于,所述初始化合物集包括至少15个化合物。
7.根据权利要求6所述的方法,其特征在于,所述初始化合物集包括至少30个化合物。
8.根据权利要求1所述的方法,其特征在于,所述第一反相色谱条件和第二反相色谱条件应符合:
色谱柱:反相液相色谱柱;
色谱运行时间:不低于10min;
色谱洗脱流速:0.1ml/min~1.0ml/min;
色谱柱温度:20℃~50℃。
9.根据权利要求8所述的方法,其特征在于,所述液相检测的洗脱方式均为梯度洗脱。
10.根据权利要求9所述的方法,其特征在于,所述梯度洗脱的有机相初始比例在所述第一反相色谱条件和所述第二反相色谱条件的差异不高于30%;且所述梯度洗脱的有机相最高比例在所述第一反相色谱条件和所述第二反相色谱条件的差异不高于30%;且第一反相色谱条件和第二反相色谱条件的水相流动相具有相同的缓冲溶剂;且第一反相色谱条件和第二反相色谱条件的有机流动相具有相同的缓冲溶剂。
11.根据权利要求1所述的方法,其特征在于,利用液相色谱仪或液相色谱质谱联用仪,得到所述不同色谱条件下所述初始化合物集中各化合物的所述保留时间。
12.根据权利要求1所述的方法,其特征在于,所述初始化合物集中的化合物是覆盖广泛物理化学性质的有机化合物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111651334.1A CN114280199B (zh) | 2021-12-30 | 2021-12-30 | 反相液相色谱保留指数的移植方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111651334.1A CN114280199B (zh) | 2021-12-30 | 2021-12-30 | 反相液相色谱保留指数的移植方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114280199A CN114280199A (zh) | 2022-04-05 |
CN114280199B true CN114280199B (zh) | 2024-08-16 |
Family
ID=80878602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111651334.1A Active CN114280199B (zh) | 2021-12-30 | 2021-12-30 | 反相液相色谱保留指数的移植方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114280199B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112255361A (zh) * | 2020-09-18 | 2021-01-22 | 复旦大学 | 基于scac-ri的液相色谱保留时间数据库校正方法 |
CN113358808A (zh) * | 2021-07-01 | 2021-09-07 | 佳木斯大学 | 一种利用反相色谱保留指数对极性化合物定性鉴别的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8620595B2 (en) * | 2010-03-26 | 2013-12-31 | University Of Manitoba | Methods for determining the retention of peptides in reverse phase chromatography using linear solvent strength theory |
IT201600111757A1 (it) * | 2016-11-07 | 2018-05-07 | Chromaleont Srl | Identificazione di molecole incognite tramite l'utilizzo di Indici di Ritenzione in Cromatografia Liquida, Subcritica e Supercritica |
-
2021
- 2021-12-30 CN CN202111651334.1A patent/CN114280199B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112255361A (zh) * | 2020-09-18 | 2021-01-22 | 复旦大学 | 基于scac-ri的液相色谱保留时间数据库校正方法 |
CN113358808A (zh) * | 2021-07-01 | 2021-09-07 | 佳木斯大学 | 一种利用反相色谱保留指数对极性化合物定性鉴别的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114280199A (zh) | 2022-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Strategies for large-scale targeted metabolomics quantification by liquid chromatography-mass spectrometry | |
CN104297355B (zh) | 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法 | |
Schilling et al. | Generation of high-quality SWATH® acquisition data for label-free quantitative proteomics studies using TripleTOF® mass spectrometers | |
CN103308621B (zh) | 高通量液相色谱法串联质谱法检测25羟基维生素d的方法 | |
Koek et al. | Quantitative metabolomics based on gas chromatography mass spectrometry: status and perspectives | |
CN106018600B (zh) | 一种区分假阳性质谱峰信号且定量校正质谱峰面积的代谢组学方法 | |
Rodziewicz et al. | Rapid determination of chloramphenicol residues in milk powder by liquid chromatography–elektrospray ionization tandem mass spectrometry | |
US12072322B2 (en) | Method for matrix effect correction in quantitative mass spectrometric analysis of analytes in complex matrices | |
CN109187614A (zh) | 基于核磁共振和质谱的代谢组学数据融合方法及其应用 | |
CN102680565B (zh) | 同位素稀释电喷雾萃取电离串联质谱快速检测尿肌酐的分析方法 | |
CN108490096A (zh) | 人血清中25羟基维生素d的检测方法 | |
CN102337341B (zh) | Maldi-tof质谱双内标及其定量检测方法 | |
CN116106396B (zh) | 质谱数据的全谱拟合动态校正方法、装置、介质及质谱仪 | |
CN105424827A (zh) | 一种代谢组学数据随机误差的筛选和校正方法 | |
CN111398487A (zh) | 一种保留指数在气相色谱-串联质谱分析烟草香味成分中的应用方法 | |
CN117461087A (zh) | 用于鉴别质谱中的分子种类的方法和装置 | |
CN105548115B (zh) | 土壤中总汞的测定方法 | |
CN114280199B (zh) | 反相液相色谱保留指数的移植方法 | |
Stroh et al. | Automated sub-ppm mass accuracy on an ESI-TOF for use with drug discovery compound libraries | |
CN108931590B (zh) | 多批次靶向代谢组学数据的校正方法 | |
CN115508483A (zh) | 一种快速检测血清样本中甲基丙二酸的lc-ms/ms方法 | |
CN111024872B (zh) | 一种芝麻香型白酒中3-甲硫基丙醇的快速检测方法 | |
CN110632228B (zh) | 一种自动实现uplc-hrms中保留时间漂移校正与化合物注册的方法 | |
Solovyeva et al. | viqc: Visual and intuitive quality control for mass spectrometry-based proteome analysis | |
CN111239237A (zh) | 一种高通量质谱检测试剂盒及其质检方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |