CN112435719A - 一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法 - Google Patents

一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法 Download PDF

Info

Publication number
CN112435719A
CN112435719A CN202011233370.1A CN202011233370A CN112435719A CN 112435719 A CN112435719 A CN 112435719A CN 202011233370 A CN202011233370 A CN 202011233370A CN 112435719 A CN112435719 A CN 112435719A
Authority
CN
China
Prior art keywords
chinese medicine
separation
chromatographic
traditional chinese
statistical model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011233370.1A
Other languages
English (en)
Inventor
严斌俊
葛志伟
陈大勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Chinese Medicine University ZCMU
Original Assignee
Zhejiang Chinese Medicine University ZCMU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Chinese Medicine University ZCMU filed Critical Zhejiang Chinese Medicine University ZCMU
Priority to CN202011233370.1A priority Critical patent/CN112435719A/zh
Publication of CN112435719A publication Critical patent/CN112435719A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures

Landscapes

  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,属于中药成分含量测定技术领域。该方法通过获取单味中药液相色谱‑质谱的分析数据,确定复方中药的待测成分及质谱检测的离子,提取液相色谱‑质谱的色谱峰参数,建立色谱保留多元统计模型,根据建立复方中药色谱分离条件的优化模型,得到复方中药的最佳分离条件。本发明可在未对复方中药样品开展任何分析的情况下,直接通过计算得到其分析所需的色谱分离条件。该方法能避免大量的实验摸索,可用于快速、系统地开发单味中药以不同配伍方式组合而成的各种复方中药的分析方法。

Description

一种基于色谱保留多元统计模型快速寻找复方中药分析液相 色谱分离条件的方法
技术领域
本发明属于中药成分含量测定技术领域,具体涉及一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法。
背景技术
液相色谱-紫外检测是常用的分析手段。质谱检测器比紫外检测器具有更好的灵敏度和选择性,使得液相色谱-质谱联用(LC-MS)成为复方中药等复杂样品分析的常用手段之一。由于选择反应检测(SRM)、多反应检测(MRM)等质谱检测模式通常需要昂贵的串联质谱仪,而选择离子检测模式(SIM)在最常见的单四级杆质谱仪上就能使用,仪器成本低、通用性好,得到了广泛应用。但使用SIM模式要求能找到合适的色谱分离条件,使复杂样品中SIM检测离子通道下有响应的干扰成分与待测成分得到良好的分离,因此优化色谱分离条件的过程有时比较繁琐费时。尤其是在复方中药等复合基质(即由多种单一基质混合而成的样品基质)分析中,存在多个来源的大量干扰成分,使上述问题变得更加复杂。
有研究者通过对色谱保留情况的预测来减少LC-MS分析方法开发所需的实验量(Analytical Chemistry,2015,87,7241-7249)。较多研究者中从机理模型的角度进行了研究(Analytical Chemistry,2012,84,6611-6618;Journal of Chromatography A,2012,1247,71-80),建立了保留时间与分析参数、化合物性质参数(疏水常数、拓扑学指数、几何参数等)之间的定量模型,如定量结构保留关系模型(Analytical Chemistry,2015,87,7241-7249;Analytical Chemistry,2017,89,1870-1878;Analytica Chimica Acta,2007,602,164-172)等。然而这些方法需要事先知道化合物结构式,才能得到化合物性质参数。但在复方中药分析中,虽然待测成分的结构式一般是已知的,但干扰成分的结构式通常都不清楚,上述方法的使用受限。而基于统计模型的方法并不需要成分结构的信息,在中药等复杂对象的研究中有较好的适用性。得到预测模型后,即可根据分析方法评价指标(分离度等),建立色谱分离参数的优化模型,得到一个符合要求的分析方法。
复方中药通过多个药味配伍后作用于人体多个靶点而发挥疗效,其配伍方式灵活多变,数量已远远超过中药材的数量。复方中药传统的分析方法开发模式主要依赖研究者的经验,当复方组成改变时,待测成分和干扰成分都会发生变化,研究者通常是从头开始建立分析方法。由于复方数量众多,已达到约10万首,逐一对其进行分析方法的开发需要消耗大量时间。因此,很有必要在现有技术基础之上,寻找一种能快速确定复方中药分析液相色谱分离条件的方法,从而系统地开发各种复方中药的分析方法。
发明内容
针对上述现有技术中存在的问题,本发明的目的在于设计提供一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法。
该方法首先从单味药材分析数据预测复方中药分析时的色谱分离情况,该预测的合理性是:同一成分在固定的色谱分析条件下,其色谱峰保留时间和峰形是不变的,因此分离条件参数与保留时间、峰宽等色谱峰参数之间的定量关系通常不受复方药味组成的影响。因此,无论中药组方如何变化,均能以从单味中药获取的数据为突破口,以多元统计模型的形式归纳和表征色谱保留规律,利用两者共有的规律预测复方中药分析时的色谱分离情况。然后,根据分析方法评价指标,建立色谱分离参数的优化模型,快速优化分析条件,从而高效地建立复方中药分析方法。该方法可快速寻找复方中药分析液相色谱分离条件,避免大量的实验摸索,可用于快速、系统地开发单味中药以不同配伍方式组合而成的各种复方中药的分析方法。
一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于通过获取单味中药液相色谱-质谱的分析数据,确定复方中药的待测成分及质谱检测的离子,提取液相色谱-质谱的色谱峰参数,建立色谱保留多元统计模型,根据如下公式得到复方中药的最佳分离条件,
Figure BDA0002765940580000031
p(X1,X2,…,Xn)>L (2)
X1,X2,…,Xn∈分离参数建模范围 (3)
其中,p代表分离概率,p(X1,X2,...,Xn)代表在X1,X2,…,Xn的分离条件参数下各待测成分全部实现良好分离的概率,maximize代表最大化,
Figure BDA0002765940580000032
代表全部待测成分中最长的保留时间,
Figure BDA0002765940580000033
代表在X1,X2,…,Xn的分离条件参数下全部待测成分中最长的保留时间,w1代表分离概率p的权重系数,w2代表分析时间的权重系数,s.t.代表约束条件,L代表分离概率最低限。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于包括以下步骤:
(1)获取单味中药液相色谱-质谱的分析数据;
(2)确定复方中药的待测成分及质谱检测的离子,在步骤(1)采集的液相色谱-质谱分析数据中,根据一级、二级质谱信息及对照品保留时间,找出待测成分的色谱峰;
(3)提取液相色谱-质谱的色谱峰参数;
(4)建立色谱保留多元统计模型,所述多元统计模型包括RBF-ANN模型、LS-SVM模型、二阶多项式模型、多元线性回归模型;
(5)建立复方中药色谱分离条件的优化模型,得到复方中药的最佳分离条件;
(6)验证复方中药色谱分离条件。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(1)具体为:取单味中药的40-60%V/V乙醇提取液,稀释浓度,以不同分离条件进行液相色谱-质谱分析,得到分析数据,所述质谱分析采用全扫描模式,以数据依赖采集模式获得二级质谱。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(2)具体为:根据拟建立分析方法的检测需求,确定复方中药的待测成分,根据待测成分分子量M,设置质谱检测离子为准分子离子[M-H]-或[M+H]+的质荷比。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(3)具体为:根据拟运行分析方法的质谱仪检测质荷比的误差,设置数据提取时质荷比的宽度W,根据步骤(1)获取的液相色谱-质谱分析数据,在检测质荷比±W/2m/z范围内提取色谱图,图中即显示出待测成分和干扰成分的色谱峰,从图中读取色谱峰参数包括保留时间和峰宽,在不同色谱条件下,根据各峰的信息包括相对峰高、一级质谱、二级DDA质谱和精确质荷比来匹配色谱峰,若有重叠的色谱峰,则使用多元曲线分辨算法进行处理,得到重叠前的色谱峰参数。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(4)具体为:将分离条件参数作为自变量即X1,X2,…,Xn,将待测成分和干扰成分的色谱峰参数包括保留时间作为因变量,建立多元统计模型,定量表征分离条件参数对色谱峰参数的影响,以留一法进行交叉验证,采用交叉验证的误差方根RMSECV对模型预测误差大小进行估计。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(5)具体为:由步骤(4)建立的二阶多项式多元线性回归模型进行仿真计算得到分离概率p,由步骤(4)建立的多元统计模型从分离条件参数中计算得到tB、tE,以此建立复方中药色谱分离条件的优化模型如下:
Figure BDA0002765940580000057
p(X1,X2,...,Xn)>L (2)
X1,X2,...,Xn∈分离参数建模范围 (3)
其中,p代表分离概率,p(X1,X2,...,Xn)代表在X1,X2,...,Xn的分离条件参数下各待测成分全部实现良好分离的概率,maximize代表最大化,
Figure BDA0002765940580000051
代表全部待测成分中最长的保留时间,
Figure BDA0002765940580000052
代表在X1,X2,...,Xn的分离条件参数下全部待测成分中最长的保留时间,w1代表分离概率p的权重系数,w2代表分析时间的权重系数,s.t.代表约束条件,L代表分离概率最低限。
公式(1)中
Figure BDA0002765940580000053
用来表征色谱分析时间的长短,w2前的负号表示
Figure BDA0002765940580000054
越小越好,通过最小化
Figure BDA0002765940580000055
以最小化色谱分析时间。
公式(2)中要求分离条件能以足够大的概率满足色谱分离要求,L是概率的最低限。当希望分析方法的稳健性较好(即分离条件微小波动下仍能保证良好的分离度)时,可将L设为较大值(如95%)。
公式(3)要求分离条件参数在考察过的范围内,以保证色谱峰参数能被合理预测。在分析方法开发中,当认为必须尽量提高分析方法稳健性,而分析时间长短不重要时,可将权重w2设为0。当希望分析时间尽可能短时,可将权重w1设为较小值(如0),以最小化
Figure BDA0002765940580000056
并将尝试将L设为较小值(如30%),以使公式(2)更容易被满足。由优化模型求解得到复方中药的最佳分离条件。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(5)中最佳分离的判断方法为:由步骤(4)建立的多元统计模型以分离条件参数X1,X2,…,Xn计算得到tB、tE,其中tB代表峰的起始时间,tE代表峰的结束时间,以tB2-tE1来表征分离情况,其中tB2是后一个峰的起始时间,tE1是前一个峰的结束时间,当对于所有的待测成分,其tB、tE与各干扰成分同时满足tB2-tE1>0时,认为得到足够的分离;当出现由于保留时间因各种因素的影响而产生波动时,采用Monte-Carlo仿真估计分离概率表征色谱分离的稳健性。
假设各成分的实际保留时间与预测值的偏差服从均值为0、标准差为步骤(4)中得到的各个RMSECV的正态分布。对每种分离条件参数下各个成分的保留时间分别进行1000-10000次Monte-Carlo仿真,当每个待测成分与所有干扰成分均实现分离时,才认为色谱分离成功。分离概率p由仿真中成功实现分离的次数除以仿真次数计算得到。
所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(6)具体为:用步骤(5)得到的最佳分离条件对复方中药样品进行液相色谱-质谱分析,质谱检测选择离子检测模式,验证待测成分得到良好分离。
与现有技术相比,本发明具有以下有益效果:
(1)能充分利用中药分析数据,以多元统计模型的形式总结分析方法开发经验。
(2)可在未对复方中药样品开展任何分析的情况下,直接通过计算得到其分析所需的色谱分离条件。
(3)目前复方中药数量已远远超出单味中药数量,而对于药味组成相近的多个复方中药,可通过对处方中各单味中药定量色谱保留规律的研究,系统而高效地建立各个复方的分析方法,即能通过研究数量相对较少的单味药材而建立其相互配伍而成的多种复方的分析方法,显著提高分析方法开发效率。
(4)随着对中药理解的加深和质量标准的提高,当需要添加某些重要成分到含测指标中或需要改变原有含测指标时,能高效地优化分离参数得到相适应的分析方法。
附图说明
图1为实施例1中不同分离条件下白术-白芍-延胡索复方待测成分均得到分离的概率,pHAMP=2.73、MPFR=0.5时APMP和GST的影响;
图2为实施例1中不同分离条件下白术-白芍-延胡索复方待测成分均得到分离的概率,APMP=40、GST=27时pHAMP和MPFR的影响;
图3为实施例1中白术-白芍-延胡索复方的LC-MS分析结果;
图4为实施例2中不同分离条件下白术-白芍-延胡索-麦冬复方待测成分均得到分离的概率,pHAMP=2.73、MPFR=0.5时,APMP和GST的影响;
图5为实施例2中不同分离条件下白术-白芍-延胡索-麦冬复方待测成分均得到分离的概率,APMP=40、GST=27时pHAMP和MPFR的影响;
图6为实施例2中白术-白芍-延胡索-麦冬复方的LC-MS分析结果;
图7为实施例3中不同分离条件下白芍-延胡索复方待测成分均得到分离的概率,pHAMP=2.73、MPFR=0.5时APMP和GST的影响;
图8为实施例3中不同分离条件下白芍-延胡索复方待测成分均得到分离的概率,APMP=40、GST=27时pHAMP和MPFR的影响;
图9为实施例3中白芍-延胡索复方的LC-MS分析结果。
具体实施方式
以下将结合附图和具体实施例进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
实施例1:
一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,该方法包括以下步骤:
(1)单味中药液相色谱-质谱分析数据的获取
分别取白术、白芍、延胡索、麦冬饮片40g,加400mL 50%(v/v)乙醇,加热回流1h,提取2次,药液合并,滤过,于旋转蒸发仪60℃浓缩至20mL,得到各浓缩液。使用50%乙醇作为提取溶剂能使亲水和疏水的成分都被提取出来。分别取各中药浓缩液0.1g,用60%(v/v)甲醇定容到10mL,得到各中药的供试液。复方中药的供试液由相应的单味中药浓缩液混合后,按上述相同方法稀释得到。
分别以白术、白芍、延胡索、麦冬供试液为样品,采用Box-Behnken实验设计对四个分离参数进行考察(表1-2)。为了涵盖更大的梯度变化范围,使用二阶梯度,用两个参数对梯度转换点进行表征,反映流动相比例设置情况。0-GST分钟乙腈比例从10%上升到APMP,GST-48分钟乙腈比例从APMP上升到80%。在C18色谱柱上,通过对GST和APMP值进行调整,可以涵盖很多成分分析所需的流动相梯度变化范围。当GST较大、APMP较小时,转换点前流动相梯度变化较慢,转换点后梯度变化较快。第三个分析参数pHAMP是流动相中水相的pH。三个pH(3.23、2.73、2.23)分别对应水相中甲酸浓度0.01%、0.1%、1%。第四个分析参数是流动相的流速MPFR。本实验设计无预先设置的目标待测成分。
表1.Box-Behnken实验设计中各分离条件参数水平和编码值
Figure BDA0002765940580000081
Figure BDA0002765940580000091
表2.Box-Behnken实验设计表
Figure BDA0002765940580000092
以Waters UPLCI-Class液相色谱仪串联AB SCIEXTripleTOF 5600plus质谱仪进行LC-MS分析.采用Waters公司的Acquity UPLC HSS C18 SB色谱柱(粒径1.8um,内径3mm柱长150mm),以乙腈为流动相A,以甲酸-水溶液为流动相B,甲酸浓度、流动相梯度和流速按表2设置,柱温40℃,进样量5μL,进行LC-MS分析。质谱分析采用全扫描的模式,并以数据依赖采集(DDA)模式获得二级质谱。电喷雾电离接口电压+5.5kV,电离源温度600OC,帘气(氮气)35psi,去簇电压100V,碰撞能量10eV.在二级质谱采集中,碰撞能量在20、40、60eV间交替变换。母离子扫描质荷比范围100-1500m/z,子离子扫描质荷比范围50-1500m/z。
(2)确定复方中药所需测定的成分及质谱检测的离子
本实施例拟建立白术-白芍-延胡索复方的分析方法,所需测定的成分包括芍药内酯苷、苯甲酰芍药苷、白术内酯I、白术内酯II、白术内酯III、延胡索乙素、四氢小檗碱、延胡索甲素。质谱检测采用正离子模式,根据各待测成分分子量M,设置质谱检测离子为准分子离子[M+H]+的质荷比。
(3)LC-MS分析数据的提取
根据拟运行所开发方法的质谱仪检测质荷比的误差,设置数据提取时质荷比的宽度为0.5。根据步骤(1)采集的LC-MS分析数据,在检测质荷比±0.25m/z范围内提取色谱图,图中即显示出待测成分和干扰成分的色谱峰,从图中读取保留时间、峰宽等色谱峰参数。峰高远远小于待测成分峰高的干扰峰不考虑,因为其对待测成分定量的影响可忽略。保留时间小于2分钟的峰也不考虑,因为不会干扰待测成分测定。
不同色谱条件下色谱峰的匹配根据各峰的相对峰高、一级质谱、二级DDA质谱、精确质荷比等信息进行。在一些分离条件下,延胡索乙素和延胡索提取液中干扰峰有重叠,使用多元曲线分辨算法进行处理,得到重叠前的色谱峰参数。
(4)色谱保留多元统计模型的建立
本实施例中发现没有成分的峰宽在不同分离条件下发生明显的变化,也没有明显的拖尾峰,都是峰宽0.3分钟左右的峰,所以不对峰宽建模,只对保留时间建模。以保留时间-0.15分钟作为色谱峰起始时间(tB),以保留时间+0.15分钟作为色谱峰结束时间(tE)。将分离条件参数作为自变量,待测成分和干扰成分的保留时间作为因变量(Y),建立多元统计模型,定量地表征分离条件参数的影响。以留一法进行交叉验证,采用交叉验证误差均方根(RMSECV)对模型预测误差大小进行估计。所建立的多元统计模型包括RBF-ANN模型、LS-SVM模型、二阶多项式多元线性回归模型(采用逐步回归)等,各成分建模效果如表3所示。三种模型的建模效果都较好,LS-SVM模型能得到更小的RMSECV,但三种模型差别不大,而且二阶多项式模型(公式4)更容易从回归系数(表4)判断各个分离参数的影响,所以后续工作都是基于二阶多项式模型进行的。
Y=b0+b1X1+b2X2+b3X3+b4X4+b11X1 2+b22X2 2+b33X3 2+b44X4 2+b12X1X2+b13X1X3+b14X1X4+b23X2X3+b24X2X4+b34X3X4 (4)
表3.实施例1-3涉及的待测成分与干扰成分保留时间的统计建模效果
Figure BDA0002765940580000111
Figure BDA0002765940580000121
表4.实施例1-3涉及的待测成分与干扰成分保留时间多元线性回归模型中的回归系数
Figure BDA0002765940580000122
Figure BDA0002765940580000131
a/表示在逐步回归建模中该项没有被选中。
(5)复方中药色谱分离条件的优化
分离概率p由步骤(4)建立的二阶多项式模型经仿真计算得到。以tB2-tE1来表征分离情况,其中tB2是后一个峰的起始时间,tE1是前一个峰的结束时间。当对于所有的待测成分,其tB、tE与各干扰成分同时满足tB2-tE1>0时,认为得到足够的分离。首先由步骤(4)建立的多元统计模型从分离条件参数计算tB、tE。在实际分析中,由于保留时间会因各种因素的影响而产生波动。在此情况下,为表征色谱分离的稳健性,采用Monte-Carlo仿真估计分离概率。假设各成分的实际保留时间与预测值的偏差服从均值为0、标准差为步骤(4)中得到的各个RMSECV(表3)的正态分布。对每种分离条件参数下各个成分的保留时间分别进行3000次Monte-Carlo仿真,当每个待测成分与所有干扰成分均实现分离时,才认为色谱分离成功。分离概率p由仿真中成功实现分离的次数除以3000计算得到。各种分离条件下,预测得到的分离概率如图1-2所示。
建立色谱分离条件优化模型如公式1-3。为了寻找能使分离概率达到最大的条件,将w1设为1,w2设为0,L设为30%。由优化模型求解得到该复方中药的最佳分离条件为APMP=39.6%,GST=36分钟,pHAMP=1%,MPFR=0.568mL/min。在该分离条件预测分离概率为78%。
(6)复方中药色谱分离条件的验证
用步骤(5)得到的最佳分离条件对该复方中药样品进行LC-MS分析,质谱检测采用SIM模式,实验验证,各待测成分均得到了良好的色谱分离(如图3)。
实施例2:
一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,该方法包括以下步骤:
(1)单味中药液相色谱-质谱分析数据的获取
该步骤已在实施例1中完成,本实施例可直接使用实施例1中获取的数据。
(2)确定复方中药所需测定的成分及质谱检测的离子
本实施例拟建立白术-白芍-延胡索-麦冬复方的分析方法,所需测定的成分包括芍药内酯苷、苯甲酰芍药苷、白术内酯I、白术内酯II、白术内酯III、延胡索乙素、四氢小檗碱、延胡索甲素、甲基麦冬黄烷酮B。质谱检测采用正离子模式,根据各待测成分分子量M,设置质谱检测离子为准分子离子[M+H]+的质荷比。
(3)LC-MS分析数据的提取
根据拟运行所开发方法的质谱仪检测质荷比的误差,设置数据提取时质荷比的宽度为0.5。根据步骤(1)采集的LC-MS分析数据,在检测质荷比±0.25m/z范围内提取色谱图,图中即显示出待测成分和干扰成分的色谱峰,从图中读取保留时间、峰宽等色谱峰参数。峰高远远小于待测成分峰高的干扰峰不考虑,因为其对待测成分定量的影响可忽略。保留时间小于2分钟的峰也不考虑,因为不会干扰待测成分测定。
不同色谱条件下色谱峰的匹配根据各峰的相对峰高、一级质谱、二级DDA质谱、精确质荷比等信息进行。在一些分离条件下,延胡索乙素和延胡索提取液中干扰峰有重叠,使用多元曲线分辨算法进行处理,得到重叠前的色谱峰参数。
上述大部分待测成分和相关干扰成分的色谱峰参数已在实施例1中完成,本实施例可直接使用实施例1中的数据。
(4)色谱保留多元统计模型的建立
本实施例中发现没有成分的峰宽在不同分离条件下发生明显的变化,也没有明显的拖尾峰,都是峰宽0.3分钟左右的峰,所以不对峰宽建模,只对保留时间建模。以保留时间-0.15分钟作为色谱峰起始时间(tB),以保留时间+0.15分钟作为色谱峰结束时间(tE)。将分离条件参数作为自变量,待测成分和干扰成分的保留时间作为因变量,建立多元统计模型,定量地表征分离条件参数的影响。以留一法进行交叉验证,采用交叉验证误差均方根(RMSECV)对模型预测误差大小进行估计。大部分待测成分和相关干扰成分的色谱保留多元统计模型已在实施例1中建立,本实施例可直接使用实施例1中的模型。
所建立的多元统计模型包括RBF-ANN模型、LS-SVM模型、二阶多项式多元线性回归模型等,各成分建模效果如表3所示。三种模型的建模效果都较好,LS-SVM模型能得到更小的RMSECV,但三种模型差别不大,而且二阶多项式模型更容易从回归系数(表4)判断各个分离参数的影响,所以后续工作都是基于二阶多项式模型进行的。
(5)复方中药色谱分离条件的优化
分离概率p由步骤(4)建立的二阶多项式模型经仿真计算得到。以tB2-tE1来表征分离情况,其中tB2是后一个峰的起始时间,tE1是前一个峰的结束时间。当对于所有的待测成分,其tB、tE与各干扰成分同时满足tB2-tE1>0时,认为得到足够的分离。首先由步骤(4)建立的多元统计模型从分离条件参数计算tB、tE。在实际分析中,由于保留时间会因各种因素的影响而产生波动。在此情况下,为表征色谱分离的稳健性,采用Monte-Carlo仿真估计分离概率。假设各成分的实际保留时间与预测值的偏差服从均值为0、标准差为步骤(4)中得到的各个RMSECV(表3)的正态分布。对每种分离条件参数下各个成分的保留时间分别进行3000次Monte-Carlo仿真,当每个待测成分与所有干扰成分均实现分离时,才认为色谱分离成功。分离概率p由仿真中成功实现分离的次数除以3000计算得到。各种分离条件下,预测得到的分离概率如图4-5所示。
建立色谱分离条件优化模型如公式1-3。为了寻找能使分离概率达到最大的条件,将w1设为1,w2设为0,L设为30%。由优化模型求解得到该复方中药的最佳分离条件为APMP=36.2%,GST=34.3分钟,pHAMP=1%,MPFR=0.552mL/min。在该分离条件预测分离概率为69.3%。
(6)复方中药色谱分离条件的验证
用步骤(5)得到的最佳分离条件对该复方中药样品进行LC-MS分析,质谱检测采用SIM模式,实验验证,各待测成分均得到了良好的色谱分离(图6)。
实施例3:
一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,该方法包括以下步骤:
(1)单味中药液相色谱-质谱分析数据的获取。
该步骤已在实施例1中完成,本实施例可直接使用实施例1中获取的数据。
(2)确定复方中药所需测定的成分及质谱检测的离子。
本实施例拟建立白芍-延胡索复方的分析方法,所需测定的成分包括芍药内酯苷、苯甲酰芍药苷、延胡索乙素、四氢小檗碱、延胡索甲素。质谱检测采用正离子模式,根据各待测成分分子量M,设置质谱检测离子为准分子离子[M+H]+的质荷比。
(3)LC-MS分析数据的提取
根据拟运行所开发方法的质谱仪检测质荷比的误差,设置数据提取时质荷比的宽度为0.5。根据步骤(1)采集的LC-MS分析数据,在检测质荷比±0.25m/z范围内提取色谱图,图中即显示出待测成分和干扰成分的色谱峰,从图中读取保留时间、峰宽等色谱峰参数。
本实施例中全部待测成分和相关干扰成分的色谱峰参数已在实施例1中完成,本实施例可直接使用实施例1中的数据。
(4)色谱保留多元统计模型的建立
本实施例中全部待测成分和相关干扰成分的色谱保留多元统计模型已在实施例1中建立,本实施例可直接使用实施例1中的模型。
(5)复方中药色谱分离条件的优化
分离概率p由步骤(4)建立的二阶多项式模型经仿真计算得到。以tB2-tE1来表征分离情况,其中tB2是后一个峰的起始时间,tE1是前一个峰的结束时间。当对于所有的待测成分,其tB、tE与各干扰成分同时满足tB2-tE1>0时,认为得到足够的分离。首先由步骤(4)建立的多元统计模型从分离条件参数计算tB、tE。在实际分析中,由于保留时间会因各种因素的影响而产生波动。在此情况下,为表征色谱分离的稳健性,采用Monte-Carlo仿真估计分离概率。假设各成分的实际保留时间与预测值的偏差服从均值为0、标准差为步骤(4)中得到的各个RMSECV(表3)的正态分布。对每种分离条件参数下各个成分的保留时间分别进行3000次Monte-Carlo仿真,当每个待测成分与所有干扰成分均实现分离时,才认为色谱分离成功。分离概率p由仿真中成功实现分离的次数除以3000计算得到。各种分离条件下,预测得到的分离概率如图7-8所示。
建立色谱分离条件优化模型如公式1-3。在分离概率能达到95%的前提下,最小化保留时间(即L设为95%,w1设为0,w2设为1)。由优化模型求解得到该复方中药的最佳分离条件为APMP=42%,GST=36分钟,pHAMP=1%,MPFR=0.6mL/min。预测最迟洗脱的苯甲酰芍药苷保留时间(用于表征分析方法所需时间)为22.4分钟。
(6)复方中药色谱分离条件的验证
用步骤(5)得到的最佳分离条件对该复方中药样品进行LC-MS分析,质谱检测采用SIM模式,实验验证,各待测成分均得到了良好的色谱分离(图9)。最迟洗脱的苯甲酰芍药苷保留时间(用于表征分析方法所需时间)为分钟,与预测值接近。
以上所述仅是本发明的优选实施方式,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于通过获取单味中药液相色谱-质谱的分析数据,确定复方中药的待测成分及质谱检测的离子,提取液相色谱-质谱的色谱峰参数,建立色谱保留多元统计模型,根据如下公式得到复方中药的最佳分离条件,
Figure DEST_PATH_IMAGE001
其中,p代表分离概率,
Figure DEST_PATH_IMAGE003
代表在X 1 ,X 2 ,…,X n 的分离条件参数下各待测成分的分离概率,maximize代表最大化,
Figure DEST_PATH_IMAGE005
代表全部待测成分中最长的保留时间,
Figure DEST_PATH_IMAGE007
代表在X 1 ,X 2 ,…,X n 的分离条件参数下全部待测成分中最长的保留时间,w 1代表分离概率p的权重系数,w 2 代表分析时间的权重系数,s.t.代表约束条件,L代表分离概率最低限。
2.如权利要求1所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于包括以下步骤:
(1)获取单味中药液相色谱-质谱的分析数据;
(2)确定复方中药的待测成分及质谱检测的离子,在步骤(1)采集的液相色谱-质谱分析数据中,根据一级、二级质谱信息及对照品保留时间,找出待测成分的色谱峰;
(3)提取液相色谱-质谱的色谱峰参数;
(4)建立色谱保留多元统计模型,所述多元统计模型包括RBF-ANN模型、LS-SVM模型、二阶多项式多元线性回归模型;
(5)建立复方中药色谱分离条件的优化模型,得到复方中药的最佳分离条件;
(6)验证复方中药色谱分离条件。
3.如权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(1)具体为:取单味中药的40-60%V/V乙醇提取液,稀释浓度,以不同分离条件进行液相色谱-质谱分析,得到分析数据,所述质谱分析采用全扫描模式,以数据依赖采集模式获得二级质谱。
4.如权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(2)具体为:根据拟建立分析方法的检测需求,确定复方中药的待测成分,根据待测成分分子量M,设置质谱检测离子为准分子离子[M-H]-或[M+H]+的质荷比。
5. 如权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(3)具体为:根据拟运行分析方法的质谱仪检测质荷比的误差,设置数据提取时质荷比的宽度W,根据步骤(1)获取的液相色谱-质谱分析数据,在检测质荷比±W/2 m/z范围内提取色谱图,图中即显示出待测成分和干扰成分的色谱峰,从图中读取色谱峰参数包括保留时间和峰宽,在不同色谱条件下,根据各峰的信息包括相对峰高、一级质谱、二级DDA质谱和精确质荷比来匹配色谱峰,若有重叠的色谱峰,则使用多元曲线分辨算法进行处理,得到重叠前的色谱峰参数。
6.如权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(4)具体为:将分离条件参数作为自变量即X 1 , X 2 ,…,X n ,将待测成分和干扰成分的色谱峰参数包括保留时间作为因变量,建立多元统计模型,定量表征分离条件参数对色谱峰参数的影响,以留一法进行交叉验证,采用交叉验证的误差方根RMSECV对模型预测误差大小进行估计。
7.权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(5)具体为:由步骤(4)建立的二阶多项式多元线性回归模型进行仿真计算得到分离概率p,由步骤(4)建立的多元统计模型从分离条件参数中计算得到t B t E ,以此建立复方中药色谱分离条件的优化模型如下:
Figure 914929DEST_PATH_IMAGE001
其中,p代表分离概率,
Figure 300911DEST_PATH_IMAGE003
代表在X 1 ,X 2 ,…,X n 的分离条件参数下各待测成分全部实现良好分离的概率,maximize代表最大化,
Figure 674123DEST_PATH_IMAGE005
代表全部待测成分中最长的保留时间,
Figure DEST_PATH_IMAGE008
代表在X 1 ,X 2 ,…,X n 的分离条件参数下全部待测成分中最长的保留时间,w 1代表分离概率p的权重系数,w 2 代表分析时间的权重系数,s.t.代表约束条件,L代表分离概率最低限。
8.权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(5)中最佳分离的判断方法为:由步骤(4)建立的多元统计模型以分离条件参数X 1 ,X 2 ,…,X n 计算得到t B t E ,其中t B 代表峰的起始时间,t E 代表峰的结束时间,以t B2 -t E1 来表征分离情况,其中t B2 是后一个峰的起始时间,t E1 是前一个峰的结束时间,当对于所有的待测成分,其t B t E 与各干扰成分同时满足t B2 -t E1 >0时,认为得到足够的分离;当出现由于保留时间因各种因素的影响而产生波动时,采用Monte-Carlo仿真估计分离概率表征色谱分离的稳健性。
9.权利要求2所述的一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法,其特征在于所述步骤(6)具体为:用步骤(5)得到的最佳分离条件对复方中药样品进行液相色谱-质谱分析,质谱检测选择离子检测模式,验证待测成分得到良好分离。
CN202011233370.1A 2020-11-06 2020-11-06 一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法 Withdrawn CN112435719A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011233370.1A CN112435719A (zh) 2020-11-06 2020-11-06 一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011233370.1A CN112435719A (zh) 2020-11-06 2020-11-06 一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法

Publications (1)

Publication Number Publication Date
CN112435719A true CN112435719A (zh) 2021-03-02

Family

ID=74699615

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011233370.1A Withdrawn CN112435719A (zh) 2020-11-06 2020-11-06 一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法

Country Status (1)

Country Link
CN (1) CN112435719A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113358808A (zh) * 2021-07-01 2021-09-07 佳木斯大学 一种利用反相色谱保留指数对极性化合物定性鉴别的方法
CN113376283A (zh) * 2021-06-10 2021-09-10 中国科学院成都生物研究所 基于小数据集的可用于非靶向危害物筛查的色谱条件快速开发方法
CN117969737A (zh) * 2024-04-02 2024-05-03 中国人民解放军联勤保障部队第九六四医院 一种测定白及多糖药物质量检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113376283A (zh) * 2021-06-10 2021-09-10 中国科学院成都生物研究所 基于小数据集的可用于非靶向危害物筛查的色谱条件快速开发方法
CN113358808A (zh) * 2021-07-01 2021-09-07 佳木斯大学 一种利用反相色谱保留指数对极性化合物定性鉴别的方法
CN117969737A (zh) * 2024-04-02 2024-05-03 中国人民解放军联勤保障部队第九六四医院 一种测定白及多糖药物质量检测方法
CN117969737B (zh) * 2024-04-02 2024-06-11 中国人民解放军联勤保障部队第九六四医院 一种测定白及多糖药物质量检测方法

Similar Documents

Publication Publication Date Title
CN103308621B (zh) 高通量液相色谱法串联质谱法检测25羟基维生素d的方法
CN104297355B (zh) 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法
Brenna et al. High‐precision continuous‐flow isotope ratio mass spectrometry
CN105527364A (zh) 超高效液相色谱串联质谱检测血清25羟基维生素d的方法
Liu et al. Global characterization of neutral saccharides in crude and processed Radix Rehmanniae by hydrophilic interaction liquid chromatography tandem electrospray ionization time-of-flight mass spectrometry
CN105122051B (zh) 分析系统
US20060255258A1 (en) Chromatographic and mass spectral date analysis
CN109564207B (zh) 用于检测和定量代谢物的质谱方法
CN106018600B (zh) 一种区分假阳性质谱峰信号且定量校正质谱峰面积的代谢组学方法
CN103235057A (zh) 一种利用气相色谱-质谱不解析化合物鉴别白酒原产地的方法
CN105301163A (zh) 一种测定生物体代谢产物的靶向代谢组学分析方法
CN109828068A (zh) 质谱数据采集及分析方法
CN112435719A (zh) 一种基于色谱保留多元统计模型快速寻找复方中药分析液相色谱分离条件的方法
CN112986430B (zh) 一种娟珊牛奶粉和荷斯坦牛奶粉的差异标志物筛选方法及其应用
CN109696510B (zh) 基于uhplc-ms获取转基因和非转基因玉米代谢差异的方法
Kumar et al. LCMS-a Review and a Recent Update
CN112136043B (zh) 用于检测和定量肝功能代谢产物的质谱测定方法
WO2003102543A2 (en) A method of using data binning in the analysis of chromatograhpy/spectrometry data
CN104215716A (zh) 一种检测人血清中总睾酮的方法
CN112255344B (zh) 一种超高效液相色谱串联质谱鉴别不同年份白酒的方法
CN108490096A (zh) 人血清中25羟基维生素d的检测方法
CN113892029A (zh) 用于检测代谢物的质谱分析方法
CN110715994A (zh) 用UHPLC-Q-Orbitrap MS分析酸枣仁和理枣仁差异性化学成分的方法
CN106537139B (zh) 通过质谱法定量他莫昔芬及其代谢物
CN108414643A (zh) 一种冷鲜鸡中生物胺的液相色谱-三重四级杆质谱检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20210302