CN108593825B - 红参质谱数据的挖掘与特异性标志物的筛选方法 - Google Patents

红参质谱数据的挖掘与特异性标志物的筛选方法 Download PDF

Info

Publication number
CN108593825B
CN108593825B CN201810068370.7A CN201810068370A CN108593825B CN 108593825 B CN108593825 B CN 108593825B CN 201810068370 A CN201810068370 A CN 201810068370A CN 108593825 B CN108593825 B CN 108593825B
Authority
CN
China
Prior art keywords
ginseng
red ginseng
data
analysis
red
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810068370.7A
Other languages
English (en)
Other versions
CN108593825A (zh
Inventor
张晓哲
赵强
赵楠
程孟春
刘欣欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Institute of Chemical Physics of CAS
Original Assignee
Dalian Institute of Chemical Physics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Institute of Chemical Physics of CAS filed Critical Dalian Institute of Chemical Physics of CAS
Priority to CN201810068370.7A priority Critical patent/CN108593825B/zh
Publication of CN108593825A publication Critical patent/CN108593825A/zh
Application granted granted Critical
Publication of CN108593825B publication Critical patent/CN108593825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种红参质谱数据的挖掘与特异性标志物的发现方法,包括下述步骤:红参与白参提取物经液相色谱分离后通过质谱分析;采集质谱并通过数据处理软件对齐每个特征的m/z,Retention time,峰强度等;用代谢组学相关软件对标准化后的数据进行主成分分析,得到表达样本相似性和差异性的得分图;使用单变量统计分析方法确定红参的生物标志物;通过人参属其它物种的药材,进一步确定红参生物标志物的独特性;使用红参的强大的生物标志物作为人工神经网络的输入层,从多种人参属药材中鉴别红参;利用本发明的方法可以快速地、准确地将红参的生物标志物寻找出来,同时也为其他中药材寻找生物标记物提供新的思路和方法。

Description

红参质谱数据的挖掘与特异性标志物的筛选方法
技术领域
本发明属于植物组学领域,涉及一种快速发现红参的生物标志物的方法,具体为红参质谱数据的挖掘与特异性标志物的筛选方法。
背景技术
人参通过空气干燥或在98-100℃下蒸煮,分别加工成白参和红参,从而改善其保质期和药物活性。先前的研究已经表明,三萜皂苷作为它们的主要生物活性成分,约70种人参皂苷被分离,通过质谱表征或暂时鉴定的人参有600余种化合物。红参和白参中有很多相似的成分,例如人参皂苷,多糖和脂质。人参中存在至少16种不同的氨基酸,其高还原糖在制备红参时容易引发美拉德反应,导致形成麦芽酚,精氨酰-果糖-葡萄糖等。
发现新的生物标志物,是植物,生物以及医学研究的基本部分,具有良好的生物标记物的特征在于高灵敏度(识别真阳性)和特异性(识别真阴性),能够提供明确的确认/排除信息。超高效液相色谱与高分辨质谱联用(UHPLC-HRMS)是此类分析的有力工具。
近年来,为快速鉴别白参和红参,进行了大量尝试。然而由于储存和加工的不绝对,白参中也有一些红参的生物标志物,“独特的特征/标记”的确切定义也是模糊的,因此,真正的红参的生物标记物仍然需要探索。
因此,我们整合非靶向代谢组学和标记物验证方法,提出独特的红参标记物,对区分两种人参加工品具有重要的意义。
发明内容
本发明的目的是提供一种红参质谱数据的挖掘与特异性标志物的发现的方法。
本发明的技术方案概述如下:
1.红参质谱数据的挖掘与特异性标志物的发现的方法,其特征是包括下述步骤:
(1)红参和白参化合物的提取;(2)通过液质联用对红参和白参进行非靶向分析,对其组分进行测定;(3)数据处理软件提取分析数据并导入到代谢组学相关软件进行主成分分析;(4)对数据进行挖掘来发现生物标志物(5)红参生物标志物的验证;
上述方法中,步骤(1)分别取30个以上的不同来源(不同产地或不同季节生产或不同药房)的红参与白参药材进行粉碎,各取相同质量于离心管中,分别加入体积比为10%-50%乙腈水溶液为提取溶剂,药材粉末与溶剂的质量体积比为0.1g/ml-0.3g/ml,混合均匀;超声10-30分钟,分离,收集溶剂,重复提取n次,n为大于等于1的整数,合并提取液,得到提取液1;药渣加入上述相同体积但是体积比为60%-90%乙腈水为提取溶剂,混合均匀,再次提取;超声10-30分钟,分离,收集溶剂,重复提取n次,n为大于等于1的整数,合并提取液,得到提取液2;将上述提取液1,2分别加入一定体积二甲基亚砜(DMSO),真空浓缩(除去乙腈,水),分别得到浓缩物1,2;浓缩物1溶解于上述合并提取液1的1/5-1/3,体积浓度为10%-20%乙腈水,浓缩物2溶解于上述合并提取液2的1/5-1/3,体积浓度为50%-80%乙腈水溶液;4-10℃下超速离心10-20分钟,收集上清1和2。
上述的方法中,步骤(2)流动相A为浓度为0.5%的醋酸水,B为乙腈。色谱柱为DB-5MS,液相系统为Agilent 1290LC(Agilent Technologies,Waldbronn,Germany),色谱柱的规格为ZORBOX Eclipse Plus RR HD C18(150mm×3.6mm,1.8μm,Agilent,USA),在50℃-60℃下进行色谱分离。二元洗脱系统包含0.5%乙酸水溶液,梯度如下:0min:2%B,流速0.1mL/min;1min:2%B,流速0.3mL/min;15min:100%B,流速0.3mL/min;20min:100%B,流速0.3mL/min;20.1min:100%B,流速0.1mL/min;进样体积为1-5μl。
上述的方法中,质谱分析过程采用电喷雾离子源负离子模式进行检测;质谱参数如下:质谱仪采用电喷雾离子源负离子模式进行检测;质谱参数如下:毛细管电压为2800V-3000V,锥孔电压为80-150V,电喷雾气温度为340-360℃,数据采集范围在100-3000m/z。电喷雾气流量流量=6.0-10L/min;离子源电压=80V;二级质谱采取10-60eV的碰撞能量;每次扫描的采集时间为20-40秒。设置在线仪器的实时内标,以及加入到样品中的内标物的混合物用于校准实验数据。由软件进行数据采集。在线仪器的实时内标,m/z 112.98和1033.9888以及样品加入的内标物,5-氟尿嘧啶,没食子酸,原儿茶酸,3-硝基苯酚,对叔丁基苯酚,和2,4-二叔丁基苯酚的混合物用于校准实验数据。
上述的方法中,通过Progenesis QI软件提取步骤(2)由超高效液相色谱-四级杆飞行时间质谱仪所采集到的数据,对数据进行预处理(包括对特征的m/z和Retention time进行对齐和相同的特征进行合并等),排除同位素分布为100的特征(可能是噪音离子),生成峰强度列表。Progenesis QI参数如下:Filiter:0.3-0.8;Absolute ion intensity:100-2000。然后将得到的数据导入到metaboanalyst进行归一化处理,经标尺化后的数据进行主成分分析。主成分分析能够快速将数据集的相似性或差异化为少量主成分和变量的线性组合,简化多元数据,解释数据的主要变化,从而得到用于表达样本相似性和差异性的得分图;在得分图中,样品点相互之间距离越近,说明样本的相似度越大,距离越远,说明样本差异越大。
上述的方法中,对步骤(3)的数据进行挖掘来发现生物标志物。使用单变量分析方法的倍数变化和方差分析发现红参的潜在标志物,筛选出P(Anova)<0.05,且红参的特征强度>人参的特征强度,以及倍数变化的值为无穷大(意味着这些特征在红参特有,在白参中不存在或不可检测),存在于大于80%的红参样本的特征为潜在的红参的生物标志物。
上述的方法中,通过分析红参相对于白参的标志物在西洋参和三七样品中的存在情况,来验证红参标志物的独特性。基于人工神经网络(ANNs)对红参进行判别分析,对步骤(4)得到的生物标志物进行验证。使用SPSS 22软件(IL,Chicago,USA),建立多层感知器(MLP)的人工神经网络模型,将红参与其他人参属药材(包括白参,三七和西洋参)区分开,参数设置如下,隐藏层数=1-2;隐层和输出层的激活函数分别为双曲正切和恒等式;随机选择训练集和测试集;输入层包含1-4个含氮化合物的标志物,m/z800.39(tR=12.69和12.94min),724.30和424.14。选择了上述四个特征的原因是:(1)含氮化合物;(2)在红参中含量高,在白参中不可检测或不存在;(3)这些特征的提取色谱图在其他保留时间无相同m/z值的干扰;(4)输入层含有四个标记的m/z值,不包含保留时间,只要m/z测定准确,允许不同的实验室建立相同的方法鉴别红参。
本发明可适用于其他中药材以及生物样品,为它们寻找标记物提供新的思路和方法。
本发明公开了一种红参质谱数据的挖掘与特异性标志物的发现方法,包括下述步骤:红参与白参提取物经液相色谱分离后通过质谱分析;采集质谱并通过数据处理软件对齐每个特征的m/z,Retention time,峰强度等;用代谢组学相关软件对标准化后的数据进行主成分分析,得到表达样本相似性和差异性的得分图;使用单变量统计分析方法确定红参的生物标志物;通过人参属其它物种的药材,进一步确定红参生物标志物的独特性;使用红参的强大的生物标志物作为人工神经网络的输入层,从多种人参属药材中鉴别红参;利用本发明的方法可以快速地、准确地将红参的生物标志物寻找出来,这些生物标志物将有助于质量控制和标准化人参加工程序,为药理研究和掺假预防提供科学依据,同时也为其他中药材寻找生物标记物提供新的思路和方法。
相比现有技术,本发明具有的优势如下:
1.本发明使用液质联用为分析检测手段,适合于复杂体系的分离分析,提高了样品的分析通量,灵敏度、分离度和分析速度,有助于目标化合物与竞争性电离杂质的分离,从而减弱离子抑制作用。
2.本发明通过单变量分析以及多变量分析,对红参和白参进行了整体分析,建立了可靠的方法来确定红参特有的标志物,在白参中没有或者检测不到,并且验证红参特征离子在西洋参和三七中的存在情况,证明它们的独特性。
3.使用四个强大的含氮的红参特有的生物标志物建立的人工神经网络模型,在经过充分的训练之后可以准确区分红参与其他人参属样品(白参,三七和西洋参)。神经网络判别模型对预测红参具有较高的准确性。
4.上述红参特有标志物将适用于红参在加工过程中的质量控制,从而有助于了解这种草药的药理活性,为药理研究和掺假预防提供科学依据。
5.本发明所建立的发现红参的生物标志物的通用技术体系,可辐射应用到植物和微生物代谢组学分析、食品安全代谢组学分析等领域。
附图说明
图1-1显示了在负离子模式下获得的10个红参样品的基峰色谱(BPC)
图1-2分别显示了在负离子模式下获得的10个白参样品的基峰色谱(BPC)。红参(或白参)的药材内的BPC在很大程度上差异很小,而在红参和白参药材之间观察到显着差异。在=12-16min时差异最为显着,主要在红参中观察到色谱峰,这表明发现生物标志物的可能性;
图2所示为红参和白参的主成分分析聚类图,红参和白参显示出清晰的分类。两个主成分PC1和PC2变量的贡献分别为30.2%和6.6%,这意味着红参和白参有显著差异。
图3-1的m/z 800.3842的提取色谱峰的左侧峰,在红参中含量较高但在白参中不存在,是红参特有的生物标志物。
图3-2为20个红参的特征标记物使用热图表征,如图3-2显示,标志物在红参样本中峰强度高,在大多数白参中不可检测或不存在。
具体实施方式
现结合实施例对本发明做进一步详细说明,实施例仅限于说明本发明,而非对本发明的限定。
红参质谱数据的挖掘与特异性标志物的发现实施例
实施例1
1.红参和人参化合物的提取:
溶剂提取:将50个来源不同(不同药房)的红参与50个来源不同(不同药房)的白参药材进行粉碎,分别各取100mg,分别置于2ml离心管中,加入0.5ml体积浓度为10%的乙腈水溶液为提取液,混合均匀;超声(1130W,37千赫)15分钟,分离,收集溶剂,重复提取2次,合并提取液,得到提取液1;药渣加入0.5ml浓度为80%乙腈水,混合均匀,超声15分钟,分离,收集溶剂,重复提取2次,合并提取液,得到提取液2;将提取液1,和2分别加入8μL二甲基亚砜,真空浓缩(除去乙腈,水),分别得到浓缩物1和浓缩物2;将浓缩物1和浓缩物2分别溶解于200μL的10%乙腈水与50%乙腈水溶液,15000rpm在4℃下离心10分钟,收集上清液,分别得到上清液1和2;分别取40μL上清液1和2并加入10μL的内标物(5-氟尿嘧啶,没食子酸,原儿茶酸,3-硝基苯酚,对叔丁基苯酚,和2,4-二叔丁基苯酚的混合物,使它们在样品中的浓度分别为0.2mg/ml,0.02mg/ml,0.02mg/ml,0.01mg/ml,2mg/ml,2mg/ml,用于校准实验数据),混匀。
2.通过UHPLC-TOF-MS对红参和人参进行非靶向分析,对其组分进行测定
①超高相液相色谱测定步骤1获得样品成分及相对峰强度,色谱柱为DB-5MS,液相系统为Agilent 1290LC(Agilent Technologies,Waldbronn,Germany),色谱柱的规格为ZORBOX Eclipse Plus RR HD C18(150mm×3.6mm,1.8μm,Agilent,USA),在60℃下进行色谱分离。二元洗脱系统包含0.5%乙酸水溶液,梯度如下:0min:2%B,流速为0.1mL/min;1min:2%B,0.3mL/min;15min:100%B,0.3mL/min;20min:100%B,0.3mL/min;20.1min:100%B,0.1mL/min。
②Agilent 1290LC连接电喷雾离子化(ESI)的Agilent 6520Q-TOF质谱仪(Agilent Technologies,Santa Clara,CA,USA),采集模式为负离子模式。质谱参数如下:毛细管电压为2800V,锥孔电压为80V,电喷雾气温度为350℃,数据采集范围在100-2000m/z。电喷雾气流量流量=8.0L/min;离子源电压=80V;二级质谱采取30eV的碰撞能量;每次扫描的采集时间为30秒。红参(或白参)的药材内的BPC(基峰色谱图)在很大程度上差异很小,而在红参和白参药材之间观察到显着差异。在Retention time=12-16min时差异最为显着,主要在红参中观察到色谱峰,这表明发现生物标志物的可能性。如图1-1和图1-2所示;
3.Progenesis QI软件提取分析数据并导入到metaboanalyst进行主成分分析;
①通过UHPLC-Q-TOF-MS分析红参和白参样品(分别50个),分析时间为16min,对Retention time和m/z值进行校准,生成峰强度列表,使用Progenesis QI参数:Filiter:0.5;Absolute ion intensity:2000。对数据进行预处理(包括对特征的m/z和Retentiontime进行对齐和相同的特征进行合并等),排除同位素分布为100的特征(可能是噪音离子)
②进行多变量统计学分析,metaboanalyst用于发现红参独特生物标记物。参数如下:Data Filtering:Relative standard deviation;Sample normalization:sum;Datascaling:Pareto scaling。主成分分析能够快速将数据集的相似性或差异化为少量主成分和变量的线性组合,简化多元数据,解释数据的主要变化。得到用于表达样本相似性和差异性的得分图和载荷图;在得分图中,样品点相互之间距离越近,说明样本的相似度越大,距离越远,说明样本差异越大。图2所示,红参和白参显示出清晰的分类。两个主成分PC1和PC2变量的贡献分别为30.2%和6.6%,这意味着红参和白参有显著差异。
4.对数据进行挖掘来发现生物标志物
①上述步骤3①得到的特征中,筛选同时满足P(Anova)<0.05,且红参的特征强度>白参的特征强度,以及倍数变化的值为无穷大(意味着这些特征在红参特有,在白参中不存在或不可检测),存在于大于90%的红参样本的特征,排除假阳性(如共洗脱组分,加合物或碎片离子),噪音的特征离子等,分别将这些潜在的特征标志物提取色谱图和质谱图,验证可靠性,共选择了20个特征作为红参特有的标志物。
②选取20个特征物作为红参的生物标记物,如表一所示。前七个特征是红参和白参最大差异的特征,在所有红参样本中存在,所有白参样本中不存在。图3-1的m/z800.3842的提取色谱峰的左侧峰,在红参中含量较高但在白参中不存在,是红参特有的生物标志物。剩余的十三个特征,在个别的红参中不存在或者在个别的白参中存在,推测是由于缺乏标准化的储存和加工条件。20个红参的特征标记物使用热图表征,如图3-2显示,标志物在红参样本中峰强度高,在大多数白参中不可检测或不存在。
表1:实施例1得到的20个潜在的红参特有标记物的信息
Figure BDA0001557356820000061
Figure BDA0001557356820000071
5.红参生物标志物的验证:
①为了证明20红参标记物的特异性,对50个来源不同(不同药房)的西洋参与50个来源不同(不同药房)的三七药材采取上述相同的步骤1和2提取分离并分析,将步骤4得到的20个生物标志物的色谱图进行分析,判断它们在西洋参和三七中的存在情况,来验证红参标志物的独特性。结果表明有16个特征在西洋参和三七中也不存在。有5个特征暂定为含氮成分。如表1所示,√表示该特征存在于该药材中,而×表示该特征在该药材中不存在。
②基于人工神经网络(ANNs)对红参进行判别分析
人工神经网络分析具有良好的学习能力,在复杂系统中进行模式识别和分类。使用SPSS 22软件(IL,Chicago,USA),建立多层感知器(MLP)的人工神经网络模型,将红参与其他人参属药材(包括白参,三七和西洋参)区分开。
输入层包含四个含氮化合物的标志物,m/z 800.39(Retention time=12.69和12.94min),724.30和424.14。红参,白参,西洋参和三七用于ANN的总样本分别为84,93,94和95,并用于建立ANN模型并预测未知样本。选择46个红参,48个白参,46个西洋参和49个三七样品来建立MLP模型,训练集(62.4%)和测试集(37.6%),剩余的38个红参,45个白参,48个西洋参和46个三七样本被用来作为未知样本进行预测,验证模型的准确性。
预测精度分别为99.1%和100%,预测置信度为0.53-1.00。ANN模型能够识别未知样本的RG预测准确率达到100%。
实施例2
1.红参和人参化合物的提取:
溶剂提取:将50个来源不同(不同药房)的红参与50个来源不同(不同药房)的白参药材进行粉碎,分别各取100mg,分别置于2ml离心管中,加入0.4ml体积浓度为20%的乙腈水溶液为提取液,混合均匀;超声(1130W,37千赫)20分钟,分离,收集溶剂,重复提取3次,合并提取液,得到提取液1;药渣加入0.4ml浓度为90%乙腈水,混合均匀,超声20分钟,分离,收集溶剂,重复提取3次,合并提取液,得到提取液2;将提取液1,和2分别加入10μL二甲基亚砜,真空浓缩(除去乙腈,水),分别得到浓缩物1和浓缩物2;将浓缩物1和浓缩物2分别溶解于250μL的15%乙腈水与60%乙腈水溶液,15000rpm在8℃下离心20分钟,收集上清液,分别得到上清液1和2;分别取40μL上清液1和2并加入10μL的内标物(5-氟尿嘧啶,没食子酸,原儿茶酸,3-硝基苯酚,对叔丁基苯酚,和2,4-二叔丁基苯酚的混合物,使它们在样品中的浓度分别为0.1mg/ml,0.01mg/ml,0.03mg/ml,0.02mg/ml,3mg/ml,3mg/ml,用于校准实验数据),混匀。
2.通过UHPLC-TOF-MS对红参和人参进行非靶向分析,对其组分进行测定
①超高相液相色谱测定步骤1获得样品成分及相对峰强度,色谱柱为DB-5MS,液相系统为Agilent 1290LC(Agilent Technologies,Waldbronn,Germany),色谱柱的规格为ZORBOX Eclipse Plus RR HD C18(150mm×3.6mm,1.8μm,Agilent,USA),在60℃下进行色谱分离。二元洗脱系统包含0.5%乙酸水溶液,梯度如下:0min:2%B,流速为0.1mL/min;1min:2%B,0.3mL/min;15min:100%B,0.3mL/min;20min:100%B,0.3mL/min;20.1min:100%B,0.1mL/min。
②Agilent 1290LC连接电喷雾离子化(ESI)的Agilent 6520Q-TOF质谱仪(Agilent Technologies,Santa Clara,CA,USA),采集模式为负离子模式。质谱参数如下:毛细管电压为3000V,锥孔电压为90V,电喷雾气温度为355℃,数据采集范围在100-3000m/z。电喷雾气流量流量=8.0L/min;离子源电压=80V;二级质谱采取40eV的碰撞能量;每次扫描的采集时间为35秒。红参(或白参)的药材内的BPC(基峰色谱图)在很大程度上差异很小,而在红参和白参药材之间观察到显着差异。在Retention time=12-16min时差异最为显着,主要在红参中观察到色谱峰,这表明发现生物标志物的可能性。
3.Progenesis QI软件提取分析数据并导入到metaboanalyst进行主成分分析;
①通过UHPLC-Q-TOF-MS分析红参和白参样品(分别50个),分析时间为16min,对Retention time和m/z值进行校准,生成峰强度列表,使用Progenesis QI参数:Filiter:0.3;Absolute ion intensity:200。对数据进行预处理(包括对特征的m/z和Retentiontime进行对齐和相同的特征进行合并等),排除同位素分布为100的特征(可能是噪音离子)
②进行多变量统计学分析,metaboanalyst用于发现红参独特生物标记物。参数如下:Data Filtering:Relative standard deviation;Sample normalization:sum;Datascaling:Pareto scaling。主成分分析能够快速将数据集的相似性或差异化为少量主成分和变量的线性组合,简化多元数据,解释数据的主要变化。得到用于表达样本相似性和差异性的得分图和载荷图;在得分图中,样品点相互之间距离越近,说明样本的相似度越大,距离越远,说明样本差异越大。得到结果与图2相似。
4.对数据进行挖掘来发现生物标志物
①上述步骤3①得到的特征中,筛选同时满足P(Anova)<0.04,且红参的特征强度>白参的特征强度,以及倍数变化的值为无穷大(意味着这些特征在红参特有,在白参中不存在或不可检测),存在于大于85%的红参样本的特征,排除假阳性(如共洗脱组分,加合物或碎片离子),噪音的特征离子等,分别将这些潜在的特征标志物提取色谱图和质谱图,验证可靠性,共选择了与实施例1相同的20个特征作为红参特有的标志物。。
②分别将这些特征标志物提取色谱图和质谱图,验证可靠性,选取与实例一相同的20个特征物作为红参的生物标记物。前七个特征是红参和白参最大差异的特征,在所有红参样本中存在,所有白参样本中不存在。图3-1的m/z 800.3842的提取色谱峰的左侧峰,在红参中含量较高但在白参中不存在,是红参特有的生物标志物。剩余的十三个特征,在个别的红参中不存在或者在个别的白参中存在,推测是由于缺乏标准化的储存和加工条件。20个红参的特征标记物使用热图表征,结果与图3-2相似,标志物在红参样本中峰强度高,在大多数白参中不可检测或不存在。
5.红参生物标志物的验证:
①为了证明20红参标记物的特异性,对50个来源不同(不同药房)的西洋参与50个来源不同(不同药房)的三七药材采取上述相同的步骤1和2提取分离并分析,将步骤4得到的潜在生物标志物的色谱图进行分析,判断它们在西洋参和三七中的存在情况,来验证红参标志物的独特性。结果表明有16个特征在西洋参和三七中也不存在。有5个特征暂定为含氮成分。如表1所示,√表示该特征存在于该药材中,而×表示该特征在该药材中不存在。
②基于人工神经网络(ANNs)对红参进行判别分析
人工神经网络分析具有良好的学习能力,在复杂系统中进行模式识别和分类。使用SPSS 22软件(IL,Chicago,USA),建立多层感知器(MLP)的人工神经网络模型,将红参与其他人参属药材(包括白参,三七和西洋参)区分开。
输入层包含四个含氮化合物的标志物,m/z 800.39(Retention time=12.69和12.94min),724.30和424.14。红参,白参,西洋参和三七用于ANN的总样本分别为84,93,94和95,并用于建立ANN模型并预测未知样本。选择46个红参,48个白参,46个西洋参和49个三七样品来建立MLP模型,训练集(62.4%)和测试集(37.6%),剩余的38个红参,45个白参,48个西洋参和46个三七样本被用来作为未知样本进行预测,验证模型的准确性。
实例2结果与实例1中表1、图1-1,图1-2,图2,图3-1,图3-2所示一致,预测正确率为100%。

Claims (8)

1.红参质谱数据的挖掘与特异性标志物的筛选方法,其特征是,包括下述步骤:
(1)红参和白参中化合物的提取:
分别取30个以上的不同来源的红参与白参药材进行粉碎得药材粉末,分别各取相同质量于离心管中,分别加入体积浓度10%-50%乙腈水溶液为提取溶剂,药材粉末与溶剂的质量体积比为0.1g/ml-0.3g/ml,混合均匀;超声10-30分钟,分离,收集提取液,作为提取液1,或重复上述提取过程n次,n为大于等于1的整数,合并提取液,得到提取液1;
将上述收集提取液1后剩余的药渣加入同上述相同体积但是体积浓度60%-90%乙腈水为提取溶剂,混合均匀,再次提取;超声10-30分钟,分离,收集提取液,作为提取液1,或重复上述提取过程n次,n为大于等于1的整数,合并提取液,得到提取液2;
将上述提取液1和2分别加入二甲基亚砜,真空浓缩,分别得到浓缩物1和2; 浓缩物1溶解于上述提取液1体积的1/5-1/3,体积浓度为10%-20%乙腈水溶液中,浓缩物2溶解于上述提取液2体积的1/5-1/3,体积浓度为50%-80%乙腈水溶液中;分别4-10℃下超速离心10-20分钟,分别收集上清1和2;
(2)通过液质联用分别对红参和白参进行非靶向分析,对其组分进行测定:
对(1)得到的上清液1和2,分别吸取并加入内标物5-氟尿嘧啶,没食子酸,原儿茶酸,3-硝基苯酚,对叔丁基苯酚,和2,4-二叔丁基苯酚的混合物,作为分析样品,通过液质联用进行非靶向分析,二元洗脱系统,流动相A为体积浓度为0.5%的醋酸水,B为乙腈;梯度如下:0min: 2% B, 流速0.1 mL/min; 1 min: 2% B, 流速0.3 mL/min; 15 min: 100% B, 流速0.3 mL/min; 20 min: 100% B, 流速0.3 mL/min; 20.1 min: 100% B, 流速0.1 mL/min;在色谱柱温为50℃-60℃下进行色谱分离;进样体积为1-5μl;
质谱仪采用电喷雾离子源负离子模式进行检测;质谱参数如下:毛细管电压为2800V-3000V,锥孔电压为80-150V,电喷雾气温度为340-360℃,数据采集范围在100-3000m/z;电喷雾气流量流量= 6.0-10L/min;离子源电压= 80V;二级质谱采取10-60eV的碰撞能量;每次扫描的采集时间为20-40秒;
(3)数据处理软件提取分析数据并导入到代谢组学相关软件进行主成分分析:
通过数据处理软件软件提取步骤(2)由质谱仪所采集到的数据,对数据进行预处理:包括对特征的m/z和Retention time进行对齐和相同的特征进行合并,排除同位素分布为100的特征,生成峰强度列表;
(4)数据挖掘来发现生物标志物:
通过步骤(3)生成的红参和白参的峰强度列表,使用单变量分析方法的倍数变化和方差分析方法来发现相对于白参的红参的潜在标志物;
红参生物标志物的验证:
采用上述中相同的步骤(1)(2)分别提取分离并分析人参属其它药材西洋参和三七,将步骤(4)得到的潜在生物标志物的色谱图进行比对分析,判断它们在西洋参和三七中的存在情况,来验证红参标志物的独特性;
建立多层感知器MLP的人工神经网络ANNs模型,通过步骤(4)得到的红参标志物,对未知红参样品进行判别分析,将红参与其他人参属药材包括白参,三七和西洋参区分开;参数设置如下,隐藏层数= 1-2;隐层和输出层的激活函数分别为双曲正切和恒等式;随机选择训练集和测试集;
建立的人工神经网络ANNs模型,隐藏层为1-2层,输入层包含1-4个标志物,分别是m/z800.39,t R = 12.69和12.94min,724.30和424.14;选择上述四个特征的原因是:(1)含氮化合物;(2)在红参中含量高,在白参中不可检测或不存在; (3)这些特征的提取色谱图在其他保留时间无相同m / z值的干扰; (4)输入层含有四个标记的m / z值,不包含保留时间,只要m / z测定准确,允许不同的实验室建立相同的方法鉴别红参。
2.如权利要求1所述方法,其特征在于:
步骤(3)中生成峰强度列表;然后将得到的数据导入到代谢组学软件进行归一化处理,将标尺化后的数据进行主成分分析;主成分分析能够快速将数据集的相似性或差异化为少量主成分和变量的线性组合,简化多元数据,解释数据的主要变化,从而得到用于表达样本相似性和差异性的得分图;在得分图中,样品点相互之间距离越近,说明样本的相似度越大,距离越远,说明样本差异越大。
3.如权利要求1所述方法,其特征在于:步骤(1)提取液1或2的体积:加入的DMSO=20:1-10:1。
4.如权利要求1所述方法,其特征在于:步骤(3)由质谱仪所采集到的数据,通过Progenesis QI软件,对数据进行预处理包括对特征的m/z和Retention time进行对齐和相同的特征进行合并,Progenesis QI参数如下:Filiter: 0.3-0.8;Absolute ionintensity :100-2000。
5.如权利要求1所述方法,其特征在于:通过代谢组学metaboanalyst软件,对步骤(3)处理后的数据进行主成分分析;参数如下:Data Filtering: Relative standarddeviation;Sample normalization:sum; Data scaling: Pareto scaling。
6.如权利要求1所述方法,其特征在于:步骤(4)方差分析的选出方差P<0.05,且红参的特征强度>人参的特征强度,以及倍数变化的值为无穷大,存在于大于80%的红参样本的特征为潜在的红参的生物标志物。
7.如权利要求1所述方法,其特征在于:不同来源是指不同产地或不同季节生产或不同季节采收或不同药房。
8.如权利要求1所述方法,其特征在于:加入内标物5-氟尿嘧啶,没食子酸,原儿茶酸,3-硝基苯酚,对叔丁基苯酚,和2,4-二叔丁基苯酚的混合物,使它们在样品中的浓度分别为0.1—0.4mg/ml,0.01-0.04mg/ml,0.01-0.04mg/ml,0.005-0.02mg/ml,1-4mg/ml,1-4mg/ml,用于校准实验数据。
CN201810068370.7A 2018-01-24 2018-01-24 红参质谱数据的挖掘与特异性标志物的筛选方法 Active CN108593825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810068370.7A CN108593825B (zh) 2018-01-24 2018-01-24 红参质谱数据的挖掘与特异性标志物的筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810068370.7A CN108593825B (zh) 2018-01-24 2018-01-24 红参质谱数据的挖掘与特异性标志物的筛选方法

Publications (2)

Publication Number Publication Date
CN108593825A CN108593825A (zh) 2018-09-28
CN108593825B true CN108593825B (zh) 2020-07-07

Family

ID=63608686

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810068370.7A Active CN108593825B (zh) 2018-01-24 2018-01-24 红参质谱数据的挖掘与特异性标志物的筛选方法

Country Status (1)

Country Link
CN (1) CN108593825B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111089908A (zh) * 2018-10-24 2020-05-01 中国科学院大连化学物理研究所 保留时间对齐/校正用内标物、内标液、方法和试剂盒
CN111089909B (zh) * 2018-10-24 2021-06-22 中国科学院大连化学物理研究所 生物样本数据质量评价用内标物、内标液、方法和试剂盒
CN111257436A (zh) * 2018-11-30 2020-06-09 中国科学院大连化学物理研究所 一种利用质谱技术识别道地药材特异性标志物和差异性标志物及判断道地药材的方法
CN111257485B (zh) * 2018-11-30 2022-02-15 中国科学院大连化学物理研究所 一种使用多肽标志物区分西洋参和人参的方法
CN111595980B (zh) * 2020-06-21 2022-06-10 山东省海洋生物研究院 一种弧菌属菌种的鉴定方法
CN112342313B (zh) * 2021-01-05 2021-04-16 中国中药有限公司 一种鉴别黄芩产地的snp分子标记物及其方法与应用
CN113125589B (zh) * 2021-03-17 2022-01-04 广东省农业科学院农业质量标准与监测技术研究所 一种代谢组学分析技术鉴定鸭屎香单丛茶的应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013002455A1 (ko) * 2011-06-30 2013-01-03 한국생명공학연구원 가공인삼의 원산지 또는 연령 판별용 표준 마커, 이의 확립방법 또는 이를 이용한 원산지 또는 연령 판별방법
CN105424820A (zh) * 2015-07-10 2016-03-23 华润三九(雅安)药业有限公司 一种对11种人参皂苷类成分同时进行定性及定量的方法
CN105572212A (zh) * 2014-10-14 2016-05-11 中国科学院大连化学物理研究所 一种基于可视化质谱信息的生晒参和红参快速识别方法
KR20160053101A (ko) * 2014-10-30 2016-05-13 서울여자대학교 산학협력단 Lc-ms/ms와 전자코 분석기기를 병용한 시판 홍삼 농축액의 원산지 판별방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013002455A1 (ko) * 2011-06-30 2013-01-03 한국생명공학연구원 가공인삼의 원산지 또는 연령 판별용 표준 마커, 이의 확립방법 또는 이를 이용한 원산지 또는 연령 판별방법
CN105572212A (zh) * 2014-10-14 2016-05-11 中国科学院大连化学物理研究所 一种基于可视化质谱信息的生晒参和红参快速识别方法
KR20160053101A (ko) * 2014-10-30 2016-05-13 서울여자대학교 산학협력단 Lc-ms/ms와 전자코 분석기기를 병용한 시판 홍삼 농축액의 원산지 판별방법
CN105424820A (zh) * 2015-07-10 2016-03-23 华润三九(雅安)药业有限公司 一种对11种人参皂苷类成分同时进行定性及定量的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Holistic quality evaluation of commercial white and red ginseng using aUPLC-QTOF-MS/MS-based metabolomics approach;Hong-Mei Zhang et al;《Journal of Pharmaceutical and Biomedical Analysis》;20120117;第62卷;258-273 *
Profiling and multivariate statistical analysis of Panax ginseng based on ultra-high-performance liquid chromatography coupled with quadrupole-time-of-filght mass spectrometry;Wei Wu et al;《Journal of Pharmaceutical and Biomedical Analysis》;20141226;第107卷;141-150 *
Steaming-Induced Chemical Transformations and Holistic Quality Assessment of Red Ginseng Derived from by Means of HPLC-ESI-MS/MS Based Multicomponent Quantification Fingerprint;Yuan-yuan Xie et al;《J. Agric. Food Chem.》;20120730;8213-8224 *

Also Published As

Publication number Publication date
CN108593825A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN108593825B (zh) 红参质谱数据的挖掘与特异性标志物的筛选方法
Chan et al. Ultra‐performance liquid chromatography/time‐of‐flight mass spectrometry based metabolomics of raw and steamed Panax notoginseng
CN110057955B (zh) 乙型肝炎特异性血清标志物的筛选方法
Rubert et al. Metabolic fingerprinting based on high-resolution tandem mass spectrometry: a reliable tool for wine authentication?
CN109725072A (zh) 一种基于lc-ms/ms技术的筛查癌症生物标志物的靶向定性定量代谢组学分析方法
CN108303486A (zh) 一种保健食品中违禁药物的非目标物快速检测方法
Lu et al. Quantitative analysis of Cistanches Herba using high‐performance liquid chromatography coupled with diode array detection and high‐resolution mass spectrometry combined with chemometric methods
CN111721857A (zh) 一种运用广泛靶向代谢组学技术鉴别荔枝品种的方法
CN105574474A (zh) 一种基于质谱信息的生物特征图像识别方法
CN110057954B (zh) 血浆代谢标志物在诊断或监测hbv的应用
CN113406247B (zh) 一种基于irms、lc-q-tof-ms和多元素分析相结合的大豆产地溯源识别方法
CN112903890A (zh) 一种基于高分辨质谱技术鉴别食品中中药材成分的方法
CN113759003B (zh) 一种基于uplc指纹图谱和化学计量法的甘草产地判别方法
Han et al. Characterization of multiple constituents in rat plasma after oral administration of Shengmai San using ultra-performance liquid chromatography coupled with electrospray ionization/quadrupole-time-of-flight high-definition mass spectrometry
Tang et al. Discrimination of Radix Polygoni Multiflori from different geographical areas by UPLC-QTOF/MS combined with chemometrics
Qiu et al. Rapid authentication of different herbal medicines by heating online extraction electrospray ionization mass spectrometry
Wen et al. Direct infusion electrospray ionization-ion mobility-mass spectrometry for rapid metabolite marker discovery of medicinal Phellodendron Bark
CN111220750A (zh) 一种中药识别平台和利用该平台的中药识别方法
Plumb et al. A rapid simple approach to screening pharmaceutical products using ultra-performance LC coupled to time-of-flight mass spectrometry and pattern recognition
CN111257436A (zh) 一种利用质谱技术识别道地药材特异性标志物和差异性标志物及判断道地药材的方法
Tachi et al. Hierarchical clustering of liquid chromatography-tandem mass spectrometry data for screening of phosphodiesterase type 5 inhibitors and their analogues in adulterated dietary supplements
Fang et al. Matrix-assisted laser desorption/ionization time-of-flight mass spectrometry combined with chemometrics to identify the origin of Chinese medicinal materials
CN114814014A (zh) 快速检测保健食品中221种非法添加成分的方法
Liang et al. Distinguishing Smilax glabra and Smilax china rhizomes by flow-injection mass spectrometry combined with principal component analysis
Wu et al. Simultaneous qualitative and quantitative analysis of eight alkaloids in Corydalis Decumbentis Rhizoma (Xiatianwu) and Corydalis Rhizoma (Yanhusuo) by high‐performance liquid chromatography and high‐resolution mass spectrometry combined with chemometric methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant