CN108931590A - 多批次靶向代谢组学数据的校正方法 - Google Patents

多批次靶向代谢组学数据的校正方法 Download PDF

Info

Publication number
CN108931590A
CN108931590A CN201810472993.0A CN201810472993A CN108931590A CN 108931590 A CN108931590 A CN 108931590A CN 201810472993 A CN201810472993 A CN 201810472993A CN 108931590 A CN108931590 A CN 108931590A
Authority
CN
China
Prior art keywords
sample
batch
targeting
tested
metabolism group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810472993.0A
Other languages
English (en)
Other versions
CN108931590B (zh
Inventor
许丽
倪君君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hehe Diagnostic Medical Technology Ltd By Share Ltd
Original Assignee
Beijing Hehe Diagnostic Medical Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hehe Diagnostic Medical Technology Ltd By Share Ltd filed Critical Beijing Hehe Diagnostic Medical Technology Ltd By Share Ltd
Priority to CN201810472993.0A priority Critical patent/CN108931590B/zh
Publication of CN108931590A publication Critical patent/CN108931590A/zh
Application granted granted Critical
Publication of CN108931590B publication Critical patent/CN108931590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明多批次靶向代谢组学数据的校正方法包括:收集多份与待测样本相同的样本基质组成QC样本;在待测样本前添加1个QC样本作为第一QC样本,并且在后续的每8‑15个待测样本中插入1个QC样本,记录插入QC样本的进样序数n,然后按照完全相同条件对该批次所有样本进行检测分析,得到该批次的各样本中靶向代谢物的浓度;检测到的所有QC样本中靶向代谢物浓度与第一批次检测到的第一QC样本中靶向代谢物浓度的比值Y作为纵坐标,以该批次所有QC样本的进样序数n作为横坐标,构建相关线性拟合方程Y=a*n+b;将每一批次每个样本的进样序数n代入方程,分别得到该批次的每个样本的校正因子,对每个样本进行系统误差的校正。

Description

多批次靶向代谢组学数据的校正方法
技术领域
本发明涉及分析化学和代谢组学领域,是一种用于多批次代谢组学数据校正的方法。
背景技术
代谢组学是继基因组学、蛋白组学后系统生物学的另一重要研究领域,它以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标,通过定性鉴别和定量描述生物基质中小分子代谢物的表达与修饰变化,反映外界刺激或遗传修饰的细胞或组织的代谢应答变化。靶向代谢组学是对目标明确的代谢物的检测分析,常常要对大量样本进行分析及验证,通常需要将大量样本分多批次进行测试,而各批次间仪器响应的状态可能有所不同,造成不同批次间代谢数据的误差,为了使不同批次、不同人员、不同仪器的多批次数据可以整合分析,我们建立了一种多批次靶向代谢组学数据的校正方法,可满足长期靶向代谢组学分析的需要。
本发明首先在各分析批中加入QC样本,计算全部QC样本与第1个QC样本中靶向代谢物浓度的比值为Yn,再分别建立各批次的线性拟合模型,对数据集的系统误差进行校正。通过对上述过程的数据处理,可以准确、高效、高通量的校正代谢组数据的系统误差和随机误差,改善代谢组学数据的质量,实现多批次靶向代谢组学数据的整合分析。
发明内容
针对上述技术问题,本申请的发明目的是建立一种多批次靶向代谢组学数据校正的方法。该方法可校正系统误差,并一定程度上降低随机误差对结果的影响,具有数据处理过程简单、结果准确、可操作性强等特点,可广泛用于代谢组学研究。
为了完成本申请的发明目的,本申请采用以下技术方案:
本发明的一种多批次靶向代谢组学数据的校正方法,它包括以下步骤:
(一)制作QC样本:
收集多份与待测样本相同的样本基质,并均匀混合成一个大的样本,即为QC样本,对该QC样本进行分装保存;
(二)获取代谢组学数据:
在进行每一批次待测样本检测时,在待测样本前添加1个上述步骤(一)所述的QC样本作为第一QC样本,并且在后续的每815个待测样本中插入1个上述步骤(一)所述的QC样本,记录插入QC样本的进样序数n,然后按照完全相同条件对该批次所有样本进行检测分析,得到该批次的各样本中靶向代谢物的浓度;
(三)获得并构建线性拟合模型数据:
将步骤(二)检测到的所有QC样本中靶向代谢物浓度与第一批次检测到的第一QC样本中靶向代谢物浓度的比值Y作为纵坐标,以该批次所有QC样本的进样序数n作为横坐标,构建相关线性拟合方程Y=a*n+b,并且得到a和b;
(四)校正数据集的系统误差:
将每一批次每个样本的进样序数n代入到步骤(三)得到的方程Y=a*n+b中,分别得到该批次的每个样本的校正因子,用该批次的每个样本的仪器检测浓度除以每个样本的校正因子,得到对每个样本经过系统误差校正后的数据;
(五)多批次靶向代谢组学数据的校正:
重复步骤(二)至步骤(四),得到每一批次每个样本经过系统误差校正后的数据;
本发明的一种多批次靶向代谢组学数据的校正方法,其中:所述的检测分析为对检测样本进行的预处理或用色谱-质谱串联法进行的检测分析;
本发明的一种多批次靶向代谢组学数据的校正方法,其中:在步骤(二)中,在后续的每10个待测样本中插入1个上述步骤(一)所述的QC样本;
本发明的一种多批次靶向代谢组学数据的校正方法,其中:在步骤(一)中,收集至少50份与待测样本相同的样本基质;
本发明的一种多批次靶向代谢组学数据的校正方法,其中:在步骤(一)中,所述样本基质为健康人群的血浆、血清、全血、尿液或组织均浆。
本发明有益效果:
本发明所述的靶向代谢组学数据校正的方法,可有效、准确地校正代谢组学数据中的系统误差,处理过程简单方便、校正效果明显,可以显著地改善代谢组数据的质量,为靶向代谢组学研究提供可靠的实验依据。
附图说明
图1为第一批次样本即实施1中第1-111例进样样本数据的线性拟合模型示意图;
图2为用皮尔森相关系数来对本发明实施例中的数据与未经校正数据的比较;
图3为用欧氏距离来对本发明实施例中的数据与未经校正数据的比较;
图4为用QC样本RSD值来对本发明实施例中的数据与未经校正数据的比较。
下面将结合具体实施例和附图对本发明作进一步说明。
具体实施方式
下面通过实例进一步阐释本发明,实例仅限于说明本发明以便于理解,而非对本发明的限定。
实施例
本实施例要使用本发明的方法来测定728例血清样本中丙氨酸浓度,它采用液相色谱-三重四级杆串联质谱(LC-MS/MS)来测定728例血清样本中丙氨酸浓度,其中728例血清样本包括418例健康人,106例胃癌患者,204例肺癌患者。所有样本在8个不同批次实验中检测分析,其中第一批次有91例,第二批次有101例,第三批次有101例,第四批次有71例,第五批次有111例,第六批次有91例,第七批次有101例,第八批次有61例,以下以第一批次91例样本为例,对本发明进行说明:
本发明一种多批次靶向代谢组学数据的校正方法,它包括以下步骤:
(一)制作QC样本:
收集至少100份与待测样本相同的样本基质,例如:健康人群血清100份均匀混合成一个大的样本,即为QC样本,对该QC样本进行分装保存,例如:分装成500份QC样本;
(二)获取代谢组学数据:
在进行第一批次待测样本91例检测时,在待测样本前添加1个上述步骤(一)所述的QC样本作为第一QC样本,并且在后续的每10个待测样本中插入1个上述步骤(一)所述的QC样本,记录插入QC样本的进样序数n,以91例待检测样本为例,在后续中共插入9个QC样本,91例待测样本加上10个QC样本共计111个进样样本,然后按照完全相同条件对该批次所有样本进行预处理即使用液相色谱-三重四级杆串联质谱(LC-MS/MS)对丙氨酸浓度进行测定;
(三)获得并构建线性拟合模型数据:
将步骤(二)检测到的所有QC样本中靶向代谢物浓度与第一批次检测到的第一QC样本中靶向代谢物浓度的比值Y作为纵坐标,以该批次所有QC样本的进样序数n作为横坐标,构建相关线性拟合方程Y=a*n+b,并且得到a和b,如图1所示;
(四)校正数据集的系统误差:
将每一批次每个样本的进样序数n代入到步骤(三)得到的方程Y=a*n+b中,分别得到该批次的每个样本的校正因子,用该批次的每个样本的仪器检测浓度除以每个样本的校正因子,得到对每个样本经过系统误差校正后的数据,例如:对于进样序数n为13的样本来说,如图2所示,得到其校正因子为0.996,如果在该样本的血清中检测出的丙氨酸浓度为C,该样本经过系统误差校正后的丙氨酸浓度为C/0.996;
(五)多批次靶向代谢组学数据的校正:
重复步骤(二)至步骤(四),得到第二批次至第八批次的血清样本经过系统误差校正后的数据。
如图2至图3所示,将按本方法所校正的靶向代谢组数据结果与只用内标校正法校正后的结果进行比较。继而发现,我们建立的校正系统误差的方法,可以使整体QC样本数据展现出较大的皮尔森相关系数,如图2所示,说明应用本方法更好地校正了QC的系统误差;通过本方法进行系统误差校正后,QC样本欧氏距离减小,如图3所示,即表明在长期测试过程中,代谢组学研究的系统误差得以很好地校正,且RSD值的降低亦可说明此问题,如图4所示;此外,通过对数据集随机误差的校正,可降低各分类组数据的离散程度,使靶向代谢组研究中目标物的识别更为明显。
总之,本发明给出了一种校正靶向代谢组学数据系统误差的方法。与非校正数据集相比,本发明校正了系统误差后,可以实现不同批次、不同人员甚至不同仪器间的靶向代谢组学数据的整合。首次计算全部质量控制样本与第1个质控样本浓度的比值,而后利用同批次QC样本比值与QC序号建立单批次线性模型,对不同批次间的系统误差进行校正。采用本发明方法比内标校正的靶向代谢组学数据处理方法有更好的数据统计结果,校正后数据可获得更大的皮尔森相关系数大,更小的欧氏距离及RSD值。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变形。

Claims (5)

1.一种多批次靶向代谢组学数据的校正方法,它包括以下步骤:
(一)制作QC样本:
收集多份与待测样本相同的样本基质,并均匀混合成一个大的样本,即为QC样本,对该QC样本进行分装保存;
(二)获取代谢组学数据:
在进行每一批次待测样本检测时,在待测样本前添加1个上述步骤(一)所述的QC样本作为第一QC样本,并且在后续的每8-15个待测样本中插入1个上述步骤(一)所述的QC样本,记录插入QC样本的进样序数n,然后按照完全相同条件对该批次所有样本进行检测分析,得到该批次的各样本中靶向代谢物的浓度;
(三)获得并构建线性拟合模型数据:
将步骤(二)检测到的所有QC样本中靶向代谢物浓度与第一批次检测到的第一QC样本中靶向代谢物浓度的比值Y作为纵坐标,以该批次所有QC样本的进样序数n作为横坐标,构建相关线性拟合方程Y=a*n+b,并且得到a和b;
(四)校正数据集的系统误差:
将每一批次每个样本的进样序数n代入到步骤(三)得到的方程Y=a*n+b中,分别得到该批次的每个样本的校正因子,用该批次的每个样本的仪器检测浓度除以每个样本的校正因子,得到对每个样本经过系统误差校正后的数据;
(五)多批次靶向代谢组学数据的校正:
重复步骤(二)至步骤(四),得到每一批次每个样本经过系统误差校正后的数据。
2.如权利要求1所述的多批次靶向代谢组学数据的校正方法,其特征在于:所述的检测分析为对检测样本进行的预处理或用色谱-质谱串联法进行的检测分析。
3.如权利要求2所述的多批次靶向代谢组学数据的校正方法,其特征在于:在步骤(二)中,在后续的每10个待测样本中插入1个上述步骤(一)所述的QC样本。
4.如权利要求3所述的多批次靶向代谢组学数据的校正方法,其特征在于:在步骤(一)中,收集至少50份与待测样本相同的样本基质。
5.如权利要求4所述的多批次靶向代谢组学数据的校正方法,其特征在于:在步骤(一)中,所述样本基质为健康人群的血浆、血清、全血、尿液或组织均浆。
CN201810472993.0A 2018-05-17 2018-05-17 多批次靶向代谢组学数据的校正方法 Active CN108931590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810472993.0A CN108931590B (zh) 2018-05-17 2018-05-17 多批次靶向代谢组学数据的校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810472993.0A CN108931590B (zh) 2018-05-17 2018-05-17 多批次靶向代谢组学数据的校正方法

Publications (2)

Publication Number Publication Date
CN108931590A true CN108931590A (zh) 2018-12-04
CN108931590B CN108931590B (zh) 2020-12-01

Family

ID=64449250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810472993.0A Active CN108931590B (zh) 2018-05-17 2018-05-17 多批次靶向代谢组学数据的校正方法

Country Status (1)

Country Link
CN (1) CN108931590B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109752549A (zh) * 2019-03-04 2019-05-14 北京和合医学诊断技术股份有限公司 基于靶向代谢组学数据分析的模型建立方法
CN113903394A (zh) * 2021-09-14 2022-01-07 上海中科新生命生物科技有限公司 基于卷积神经网络的代谢分析中不同队列的校准方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101769910A (zh) * 2008-12-30 2010-07-07 中国科学院大连化学物理研究所 一种从血清代谢轮廓筛选恶性卵巢肿瘤标志物的方法
CN104297355A (zh) * 2013-07-17 2015-01-21 中国科学院大连化学物理研究所 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法
CN104458983A (zh) * 2013-09-16 2015-03-25 中国科学院大连化学物理研究所 一种有效获取血清小分子代谢物信息的方法
CN104713971A (zh) * 2015-04-01 2015-06-17 山东省肿瘤医院 一种基于lc-ms血清代谢组学技术分析血清代谢组学的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101769910A (zh) * 2008-12-30 2010-07-07 中国科学院大连化学物理研究所 一种从血清代谢轮廓筛选恶性卵巢肿瘤标志物的方法
CN104297355A (zh) * 2013-07-17 2015-01-21 中国科学院大连化学物理研究所 一种基于液相色谱/质谱联用的拟靶标代谢组学分析方法
CN104458983A (zh) * 2013-09-16 2015-03-25 中国科学院大连化学物理研究所 一种有效获取血清小分子代谢物信息的方法
CN104713971A (zh) * 2015-04-01 2015-06-17 山东省肿瘤医院 一种基于lc-ms血清代谢组学技术分析血清代谢组学的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李梅等: "质量控制图及其在啤酒仪器分析中的应用 ", 《啤酒科技》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109752549A (zh) * 2019-03-04 2019-05-14 北京和合医学诊断技术股份有限公司 基于靶向代谢组学数据分析的模型建立方法
CN109752549B (zh) * 2019-03-04 2021-11-09 北京和合医学诊断技术股份有限公司 基于靶向代谢组学数据分析的模型建立方法
CN113903394A (zh) * 2021-09-14 2022-01-07 上海中科新生命生物科技有限公司 基于卷积神经网络的代谢分析中不同队列的校准方法及系统

Also Published As

Publication number Publication date
CN108931590B (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
Kleiner Metaproteomics: much more than measuring gene expression in microbial communities
Poulos et al. Strategies to enable large-scale proteomics for reproducible research
Gatto et al. Initial recommendations for performing, benchmarking and reporting single-cell proteomics experiments
Caesar et al. Hierarchical cluster analysis of technical replicates to identify interferents in untargeted mass spectrometry metabolomics
Karpievitch et al. Normalization and missing value imputation for label-free LC-MS analysis
US8237107B2 (en) Spectrophotometric identification of microbe subspecies
Hortin Can mass spectrometric protein profiling meet desired standards of clinical laboratory practice?
Giroud et al. 1997 ESACP consensus report on diagnostic DNA image cytometry. Part II: Specific recommendations for quality assurance. European Society for Analytical Cellular Pathology.
Plebani Proteomics: the next revolution in laboratory medicine?
Malkar et al. Metabolic profiling of human saliva before and after induced physiological stress by ultra-high performance liquid chromatography–ion mobility–mass spectrometry
WO2004089972A2 (en) Mass spectrometry data analysis techniques
Fillet et al. The emergence of metabolomics as a key discipline in the drug discovery process
US20080234948A1 (en) System and Method for Characterizing a Chemical Sample
CN111579665A (zh) 一种基于uplc/hrms的代谢组学相对定量分析方法
CN103776891A (zh) 一种检测差异表达蛋白质的方法
CN108931590A (zh) 多批次靶向代谢组学数据的校正方法
Dumas et al. Analyzing the physiological signature of anabolic steroids in cattle urine using pyrolysis/metastable atom bombardment mass spectrometry and pattern recognition
CN113189249A (zh) 一种基于uplc-ms技术推断大鼠死亡时间的方法
CN113777209A (zh) 尿液中挥发性污染物暴露与效应标志物同步检测及应用
Thomas et al. Targeted proteomic assays for the verification of global proteomics insights
CN111157664A (zh) 生物代谢组学数据处理方法、分析方法及装置和应用
Ford et al. Clinical metabolomics for inborn errors of metabolism
McIntosh et al. Biomarker validation by targeted mass spectrometry
Hoyt et al. Perspective: A potential role for NUS in metabolite‐based in vitro diagnostics.
CN114200048B (zh) Lc-ms下机数据的处理方法及处理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant