CN106716123A - 冠心病患者特异性生物标志组合物及其用途 - Google Patents

冠心病患者特异性生物标志组合物及其用途 Download PDF

Info

Publication number
CN106716123A
CN106716123A CN201480082294.5A CN201480082294A CN106716123A CN 106716123 A CN106716123 A CN 106716123A CN 201480082294 A CN201480082294 A CN 201480082294A CN 106716123 A CN106716123 A CN 106716123A
Authority
CN
China
Prior art keywords
biological marker
training set
biomarker
marker composition
heart disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480082294.5A
Other languages
English (en)
Other versions
CN106716123B (zh
Inventor
冯强
刘志鹏
孟楠
王俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN106716123A publication Critical patent/CN106716123A/zh
Application granted granted Critical
Publication of CN106716123B publication Critical patent/CN106716123B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/493Physical analysis of biological material of liquid biological material urine
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2570/00Omics, e.g. proteomics, glycomics or lipidomics; Methods of analysis focusing on the entire complement of classes of biological molecules or subsets thereof, i.e. focusing on proteomes, glycomes or lipidomes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/32Cardiovascular disorders
    • G01N2800/324Coronary artery diseases, e.g. angina pectoris, myocardial infarction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Hematology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

提供一种疾病特异性代谢物谱,特别是涉及由冠心病患者尿液特异性代谢物谱筛选得到的生物标志组合物。以及所述生物标志组合物用于冠心病的患病风险评估、诊断、早期诊断以及病理分期的用途,以及冠心病的患病风险评估、诊断、早期诊断以及病理分期方法。提供的生物标志组合物可用于早期诊断冠心病,并且灵敏度高、特异性好,具有良好的应用前景。

Description

冠心病患者特异性生物标志组合物及其用途 技术领域
本发明涉及疾病特异性代谢物谱,特别是涉及由冠心病受试者尿液特异性代谢物谱筛选得到的生物标志组合物。本发明还涉及所述生物标志组合物用于冠心病的患病风险评估、诊断、早期诊断以及病理分期的用途,以及冠心病的患病风险评估、诊断、早期诊断以及病理分期方法。
背景技术
冠状动脉性心脏病(英语:coronary artery heart disease,CAHD),又称缺血性心脏病,简称冠心病,是一种最常见的心脏病,是指因冠状动脉狭窄、供血不足而引起的心肌机能障碍和(或)器质性病变,故又称缺血性心肌病(IHD),在2012年是全球第一大死因[1],也是人们住院的主要原因之一[2]。冠心病可发生于任何年龄,甚至于儿童,但是主要发病年龄为中年以后,并且其发病随着年龄的增长而增加。全球每年有将近1700万人死于动脉粥样硬化心脏病,2020年预计死亡增加50%,达2500万/年,占全球死亡人数的1/3,排第一位。我国每年死于心血管疾病的人数达250万,新发心肌梗死50万人,冠心病的发生有较显著的地区差异,北方城市普遍高于南方城市,在男女性别上也有显著性差异,男女比例为2-5∶1,数据显示全球冠心病患者分布也有类似差异[3]。目前对于冠心病的诊断缺乏比较统一的标准并且现有的诊断方法如心电图、心电图负荷试验、动态心电图、核素心肌显像、超声心动图、血液学检查、冠状动脉CT、冠状动脉造影及血管内成像技术等都具有一定的缺陷,例如,症状的观察、超声心动图检查则主观性太强,冠状动脉CT、冠状动脉造影及血管内成像技术等均为侵入式诊断,给患者带来额外的痛苦;现已发现的血液中单一的标志物诊断则存在敏感性和特异性差,假阳性率较高等缺点,开发一种无创、特异性、准确的冠心病诊断方法具有重要的意义[4、5]。
代谢组学是继基因组学和蛋白质组学之后发展起来的一门系统生物学学科,研究生物体在内在或者外在因素影响后其内源性代谢物种类、数量以及变化规律。代谢组学对有机体的整个代谢谱进行分析,探寻代谢物与生理病理变化之间的对应关系,从而为疾病诊断提供依据。因此,筛选与冠心病相关的代谢标志物,特别是多个代谢标志物的联合使用,对冠心病的代谢组学研究、临床诊断和治疗具有重大意义
发明内容
针对现有冠心病诊断方法的有创伤性,侵入性等缺点,本发明所要解决的问题是提供能够用于冠心病诊断和患病风险评估的生物标志物组合(即生物标志组合物),以及冠心病的诊断和患病风险评估方法。
本发明采用液相色谱质谱联用的分析方法,分析冠心病群体和对照组群体的血浆样本的代谢物谱,并用模式识别进行分析比较冠心病群体和对照组群体的代谢物谱,确定特异性液相色谱质谱数据以及相关特异性生物标志物,为后续理论研究和临床诊断提供依据。
本发明第一方面涉及生物标志组合物,其至少含有选自以下生物标志物1~8中的一种或数种:
生物标志物1,其质荷比为356.07±0.4amu,保留时间为606.57±60s;
生物标志物2,其质荷比为284.18±0.4amu,保留时间为538.89±60s;
生物标志物3,其质荷比为445.06±0.4amu,保留时间为494.89±60s;
生物标志物4,其质荷比为268.19±0.4amu,保留时间为589.52±60s;
生物标志物5,其质荷比为342.03±0.4amu,保留时间为625.52±60s;
生物标志物6,其质荷比为324.0459±0.4amu,保留时间为612.39±60s;
生物标志物7,其质荷比为324.0457±0.4amu,保留时间为652.06±60s;
生物标志物8,其质荷比为307.02±0.4amu,保留时间为607.78±60s; 例如含有其中的1种、2种、3种、4种、5种、6种、7种或8种。
在本发明的实施方案中,上述8种生物标志物的特征如表1所示。
在本发明的一个实施方案中,所述生物标志组合物至少含有生物标志物1~3;任选地,还含有生物标志物4~8中的一种或数种,例如1种、2种、3种、4种、5种。
在本发明的一个实施方案中,所述生物标志组合物含有生物标志物1~8。
在本发明的一个实施方案中,所述生物标志组合物含有生物标志物2、4~8。
本发明第二方面涉及试剂组合物,其含有用于检测本发明第一方面任一项的生物标志组合物的试剂。
在本发明中,用于检测上述生物标志物的试剂例如为可以与生物标志物结合的配体,例如抗体;任选地,所述用于检测的试剂还可以带有可检测的标记。所述试剂组合物为所有检测试剂的组合。
本发明第三方面涉及本发明第一方面任一项的生物标志组合物和/或第二方面任一项的试剂组合物用于制备试剂盒的用途,所述试剂盒用于冠心病的患病风险评估、诊断、早期诊断或病理分期。
在本发明的实施方案中,所述试剂盒还包括冠心病受试者和正常受试者的本发明第一方面任一项的生物标志组合物含量的训练集数据。
在本发明的一个实施方案中,其中所述的训练集数据如表2所示。
本发明还涉及一种用于冠心病的患病风险评估、诊断、早期诊断或病理分期的方法,所述方法包括测定受试者样本(例如尿液)中本发明第一方面任一项的生物标志组合物中各生物标志物的含量的步骤。
在本发明的一个实施方案中,其中测定受试者样本(例如尿液) 中本发明第一方面任一项的生物标志组合物中各生物标志物的含量的方法为液相色谱质谱联用的方法。
在本发明的一个实施方案中,所述方法还包括建立冠心病受试者和正常受试者(对照组)样本(例如尿液)的本发明第一方面任一项的生物标志组合物中各生物标示物含量的训练集的步骤。
在本发明的一个实施方案中,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
在本发明的一个实施方案中,其中所述训练集的数据如表2所示。
在本发明的一个实施方案中,所述方法还包括将受试者样本(例如尿液)中本发明第一方面任一项的生物标志组合物中各生物标志物的含量与冠心病受试者和正常受试者的生物标志组合物的训练集数据进行比较的步骤。
在本发明的一个实施方案中,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
在本发明的一个实施方案中,其中所述训练集的数据如表2所示。
在本发明的一个实施方案中,其中所述进行比较是指采用受试者工作特征曲线进行比较。
在本发明的一个实施方案中,其中比较步骤的结果判定方法为,若假定受试者为非冠心病患者,进行ROC诊断得到的非冠心病患者的概率小于0.5或者患冠心病的概率大于0.5,则表明原假定的受试者患冠心病的概率大、风险较高或者诊断为冠心病患者。
在本发明的具体实施方案中,所述方法包括以下步骤:
1)利用液相色谱质谱联用的方法测定受试者尿液中本发明第一方面任一项的生物标志组合物中各生物标志物的含量;
2)利用液相色谱质谱联用的方法测定冠心病受试者和正常受试者尿液中的本发明第一方面任一项的生物标志组合物的含量,并利用随机森林模型建立生物标志组合物含量的训练集(例如表2所示);
3)采用ROC曲线,将受试者尿液中本发明第一方面任一项的生 物标志组合物中各生物标志物的含量与冠心病受试者和正常受试者的生物标志组合物的训练集数据进行比较;
4)若假定受试者为非冠心病患者,进行ROC诊断得到的非冠心病患者的概率小于0.5或者患冠心病的概率大于0.5,则表明原假定的受试者患冠心病的概率大、风险较高或者诊断为冠心病患者。
本发明还涉及本发明第一方面任一项的生物标志组合物,用于冠心病的患病风险评估、诊断、早期诊断或病理分期。
在本发明的一个实施方案中,其中测定受试者样本(例如尿液)中本发明第一方面任一项的生物标志组合物中各生物标志物的含量的方法为液相色谱质谱联用的方法。
在本发明的一个实施方案中,还包括建立冠心病受试者和正常受试者的本发明第一方面任一项的生物标志组合物中各生物标志物含量的训练集的步骤。
在本发明的一个实施方案中,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
在本发明的一个实施方案中,其中所述训练集的数据如表2所示。
在本发明的一个实施方案中,还包括将受试者样本(例如尿液)中本发明第一方面任一项的生物标志组合物中各生物标志物的含量与冠心病受试者和正常受试者的生物标志组合物的训练集数据进行比较的步骤。
在本发明的一个实施方案中,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
在本发明的一个实施方案中,其中所述训练集的数据如表2所示。
在本发明的一个实施方案中,其中所述进行比较的方法是指采用受试者工作特征曲线的方法进行比较。
在本发明的一个实施方案中,其中比较步骤的结果判定方法为,若假定受试者为非冠心病患者,进行ROC诊断得到的非冠心病患者的概率小于0.5或者患冠心病的概率大于0.5,则表明原假定的受试者患 冠心病的概率大、风险较高或者诊断为冠心病患者。
在本发明的实施方案中,所述生物标志组合物中各生物标志物的含量,以及所述训练集中各生物标志物含量数据的获得,是通过以下步骤:
(1)样本的收集与处理:收集临床病人或者模型动物的尿液样本;样本经过有机溶剂进行液液萃取,有机溶剂包括但不限于乙酸乙酯、氯仿、乙醚、正丁醇、石油醚、二氯甲烷、乙腈等;或者经过蛋白沉淀,蛋白沉淀方法包括加入有机溶剂(例如甲醇、乙醇、丙酮、乙腈、异丙醇)、各类酸碱盐沉淀、加热沉淀、过滤/超滤、固相萃取,离心等方法单独或者综合的方式进行处理;样本进行干燥或者不进行干燥再利用各种有机溶剂(例如甲醇,乙腈,异丙醇,氯仿等,优选为甲醇、乙腈)或者水(单独或者组合,不含盐或者含盐)溶解;样本不进行衍生化或者利用试剂(例如三甲基硅烷,氯甲酸乙酯,N-甲基三甲基硅基三氟乙酰胺等)进行衍生化处理。
(2)液相色谱质谱分析测定(HPLC-MS):采用基于液相色谱和质谱的方法得到尿液中的代谢物谱,代谢物谱经过处理得到各个峰的峰高或者峰面积(peak intensity)以及质荷比和保留时间(retention time)等数据,其中的峰面积即代表生物标志物的含量。
在本发明的一个具体实施方式中,步骤(1)中的处理包括样本经过有机溶剂进行液液萃取;或者经过蛋白沉淀;样本进行干燥或者不进行干燥,再利用单独或者组合的有机溶剂或者水进行溶解,所述水不含盐或者含盐,盐包括氯化钠,磷酸盐,碳酸盐等;样本不进行衍生化或者利用试剂进行衍生化处理。
在本发明的一个具体实施方式中,步骤(1)有机溶剂进行液液萃取中,所述有机溶剂包括但不限于乙酸乙酯、氯仿、乙醚、正丁醇、石油醚、二氯甲烷、乙腈。
在本发明的一个具体实施方式中,步骤(1)蛋白沉淀中,包括但不限于加入有机溶剂、各类酸碱盐沉淀、加热沉淀、过滤/超滤、固相萃 取、离心方法单独或者组合的方式进行处理,其中所述有机溶剂包括甲醇、乙醇、丙酮、乙腈、异丙醇。
在本发明的一个具体实施方式中,步骤(1)中优选地包括使用蛋白沉淀方法进行处理,优选地使用乙醇进行蛋白沉淀。
在本发明的一个具体实施方式中,步骤(1)样本进行干燥或者不进行干燥,再利用有机溶剂或者水溶解中,所述有机溶剂包括甲醇、乙腈、异丙醇、氯仿,优选为甲醇、乙腈。
在本发明的一个具体实施方式中,步骤(1)样本利用试剂进行衍生化处理中,所述试剂包括三甲基硅烷,氯甲酸乙酯,N-甲基三甲基硅基三氟乙酰胺。
在本发明的一个具体实施方式中,步骤(2)中代谢物谱经过处理得到原始数据,所述原始数据优选地是各个峰的峰高或者峰面积以及质量数和保留时间等数据。
在本发明的一个具体实施方式中,步骤(2)中,对原始数据进行峰检测和峰匹配,优选地采用XCMS软件进行所述峰检测和峰匹配。
质谱分析类型大致分为离子阱、四级杆、静电场轨道离子阱、飞行时间质谱四类,这四类分析器的的质量偏差分别为0.2amu、0.4amu、3ppm、5ppm。本发明得到的实验结果是离子阱分析的,所以适用于所有以离子阱和四级杆为质量分析器的质谱仪器,包括Thermo Fisher的LTQ Orbitrap Velos、Fusion、Elite等,Waters的TQS、TQD等,AB Sciex的5500、4500、6500等,Agilent的6100、6490等,Bruker的amaZon speed ETD等。
在本发明的实施方案中,用质谱的峰面积(peak intensity)表示生物标志物的含量。
在本发明中,所述的质荷比和保留时间具有本领域公知的含义。
本领域技术人员公知,当采用不同的液相色谱质谱联用设备以及不同的检测方法时,本发明的生物标志组合物中各生物标志物的原子质量单位和保留时间会在一定范围内波动;其中,所述原子质量单位 可以在±0.4amu,例如±0.2amu,例如±0.1amu的范围内波动,所述保留时间可以在±60s,例如±45s,例如±30s,例如±15s的范围内波动。
在本发明中,随机森林模型和ROC曲线的使用方法为本领域所公知(参见参考文献[7]和[8]),本领域技术人员可以根据具体情况进行参数设置和调整。
在本发明中,所述训练集是指和测试集具有本领域公知的含义。在本发明的实施方案中,所述训练集是指包含一定样本数的冠心病受试者和正常受试者待测样本中的各生物标志物的含量的数据集合。所述测试集是用来测试训练集性能的数据集合。
在本发明中,构建了冠心病受试者和正常受试者的生物标志物的训练集,并以此为基准,对待测样本的生物标志物含量值进行评估。
在本发明的实施方案中,所述训练集的数据如表2所示。
在本发明中,所述受试者可以为人或者模型动物。
在本发明中,质荷比的单位为amu,amu是指原子质量单位,也称为道尔顿(Dalton,Da,D),是用来衡量原子或分子质量的单位,它被定义为碳12原子质量的1/12。
在本发明中,可以选用生物标志物中的一种或多种进行冠心病的患病风险评估、诊断或病理分期等,优选地,至少选取其中的三种,即生物标志物1~3进行评估,或者同时选用这8种生物标志物(生物标志物1~8)进行评估,以获得理想的灵敏度和特异性。
本领域技术人员知晓,当进一步扩大样本量时,利用本领域公知的样本检测和计算方法,可以得出每种生物标志物在样本中的正常含量值区间(绝对数值)。这样当采用除质谱以外的其它方法对生物标志物的含量进行检测时(例如利用抗体和ELISA方法等),可以将检测得到的生物标志物含量的绝对值与正常含量值进行比较,任选地,还可以结合统计学方法,以得出冠心病的患病风险评、诊断以及病理分期等。
不希望受任何理论的限制,发明人指出这些生物标志物是存在于人 体中的内源性化合物。通过本发明所述的方法对受试者尿液的代谢物谱进行分析,代谢物谱中的质量数值以及保留时间指示相应生物标志物的存在及在代谢物谱中的对应位置。同时,冠心病群体的所述生物标志物在其代谢物谱中表现出一定的含量范围值。
机体内源性小分子是生命活动的基础,疾病的状态与机体功能的变化必然会引起内源性小分子在体内代谢的变化,本发明表明,冠心病组和对照组的尿液代谢物谱存在明显的差异。本发明通过对冠心病组和对照组代谢物谱的比较和分析,得到多种相关的生物标志物,结合高质量的冠心病人群和正常人群生物标志物的代谢物谱数据作为训练集,能够准确地对冠心病进行患病风险评估、早期诊断和病理分期。该方法与目前常用的诊断方法相比,具有无创、方便、快捷的特点,且灵敏度高,特异性好。
附图说明
图1.冠心病患者组(a)和正常人组(b)质谱总离子流图.
图2.PLS-DA得分图。棱形(白色)代表正常组,三角形(黑色)代表冠心病组。
图3.主成分分析荷载图。三角形(黑色)代表VIP值大于1的变量。
图4.Volcano-plot图。水平虚线以上部分是差异代谢物,其中两条竖直虚线两侧的物质(黑色三角形)是fold-change大于1.2且Q-value小于0.05的代谢物,两条竖直虚线间的物质(灰色球型)是fold-change小于0.8且Q-value小于0.05的代谢物。
图5.S-plot图。棱形(黑色)是VIP大于1的变量。
图6.随机森林模型(Randomforest模型)的ROC图。Training ROC是基于训练集,AUC=1;Test ROC是基于测试集,AUC=0.9449。
图7是随机去掉训练集中的356.07和445.06质荷比的ROC测试集图,AUC=0.9289。
图8.8个潜在标记物的随机组合挑选图。竖直线标记处左侧是至少 需要检测的3个标记物。
具体实施方式
下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
本发明的冠心病和正常受试者的尿液样本来自广东省人民医院。
实施例1
1.1样本收集:收集志愿者的晨尿,立即置于-80℃低温冰箱中储存。正常组共收集52份尿液样本,冠心病组共收集40份尿液样本。
1.2样本的处理:冰冻的样本置于室温下解冻,取尿液样本500μL至于2.0mL离心管中,加入甲醇500μL稀释,10000rpm离心5min,备用。
1.3液相色谱质谱联用分析
仪器设备
HPLC-MS-LTQ Orbitrap Discovery(Thermo,Germany)
色谱条件
色谱柱:C18柱(150mm×2.1mm,5μm);流动相A:0.1%甲酸水溶液,流动相B:0.1%甲酸乙腈溶液;梯度洗脱程序:0~3min,5%B,3~36min,5%~80%B,36~40min,80%~100%B,40~45min,100%B,45~50min,100%~5%B,50~60min,5%B;流速:0.2mL/min;进样体积20μL。
质谱条件
ESI离子源,正离子模式采集数据,扫描质量m/z 50~1000。离子源参数ESI:鞘气为10,辅气为5,毛细管温度为350℃,锥孔电压4.5KV。
1.4数据处理
采用XCMS软件(例如得自http://metlin.scripps.edu/xcms/)对原 始数据进行峰检测和峰匹配,采用R软件利用PLS-DA(partial least squares-discriminant analysis)对冠心病组代谢物谱(图1a)和正常组代谢物谱(图1b)进行差异性变量进行模式识别分析,建立PLS-DA数学模型。
1.5比较和确定特征性代谢物谱
通过比较正常组与冠心病组的尿液代谢物谱图,建立冠心病患者尿液代谢物谱(图1),结果表明,正常组和冠心病组的尿液代谢物谱图是有明显差异的。
实施例2
2.1样本收集:收集志愿者的晨尿,立即置于-80℃低温冰箱中储存。正常组共收集52份尿液样本,冠心病组共收集40份尿液样本。
2.2样本的处理:冰冻的样本置于室温下解冻,取尿液样本500μL至于2.0mL离心管中,加入甲醇500μL稀释,10000rpm离心5min,备用。
2.3液相色谱质谱联用分析
仪器设备
HPLC-MS-LTQ Orbitrap Discovery(Thermo,Germany)
色谱条件
色谱柱:C18柱(150mm×2.1mm,5μm);流动相A:0.1%甲酸水溶液,流动相B:0.1%甲酸乙腈溶液;梯度洗脱程序:0~3min,5%B,3~36min,5%~80%B,36~40min,80%~100%B,40~45min,100%B,45~50min,100%~5%B,50~60min,5%B;流速:0.2mL/min;进样体积20μL。
质谱条件
ESI离子源,正离子模式采集数据,扫描质量m/z 50~1000。离子源参数ESI:鞘气为10,辅气为5,毛细管温度为350℃,锥孔电压4.5KV。
2.4数据处理
采用XCMS软件对原始数据进行相关前处理,得到二维矩阵数据, wilcox-test统计代谢物峰的显著性差异;采用正交偏最小二乘法判别分析(PLS-DA,partial least squares-discriminant analysis)对冠心病组代谢物谱(图1a)和正常组代谢物谱(图1b)进行差异性变量进行模式识别分析,结合VIP、Volcano-plot图和S-plot图筛选出潜在的生物标志物。
2.5代谢谱分析和潜在的生物标志物
2.5.1正交偏最小二乘法判别分析(PLS-DA)
采用PLS-DA方法来区分正常组和冠心病组,进一步通过VIP值(主成分分析Loading-plot)(图3)、Volcano-plot(图4)和S-plot(图5)筛选潜在标志物。从图3、图4可知,正常组和冠心病组存在明显的差异性代谢物。如图5所示,S-plot图中每个点代表一个变量,S-plot图表明变量与模型的相关性。黑色的棱形标记的变量为VIP大于1的变量,它们具有较大的偏差并且与模型有良好的相关性,见图2、5。
2.5.2潜在生物标记物
根据模式识别模型PLS-DA的VIP值筛选潜在标志物,在PLS-DA模型中提取VIP值大于1的变量,并进一步根据荷载图,Volcano-plot图和S-plot图进一步选择具有较大偏差和相关性的变量,以及结合P值小于0.05,Q值小于0.05的变量,得到8个潜在的生物标记物,如表1所示。
表1潜在的生物标记物
2.5.4受试者诊断曲线(ROC)
使用随机森林模型(RandomForest)[7]和受试者诊断曲线(reveiver operating characteristic curve,ROC,也叫受试者工作特征曲线)[8]对8个潜在标记物进行正常组与冠心病组的判别。通过选取92个正常组与冠心病组代谢物谱的峰面积数据采用ROC建模作为训练集(参见参考文献[7]和[8])(表2),另外选取303个测试样本(含冠心病的样本182个,正常对照样本121个)作为测试集,测试结果为AUC=0.9449,FN(假阴性)=0.230,FP(假阳性)=0.008(图6),具有较高的准确度和特异性,具有良好的开发为诊断方法的前景,从而为冠心病疾病的诊断提供依据。
利用随机森林模型计算这8个潜在的生物标记物对于肥胖组和正常组的分型能力,分型能力结果(从高往低排列)如表3所示,表中的标记物至少要采用前面的3种标记物进行检测(图8),这样AUC值在0.90左右,同时保持较高的灵敏度和特异性。
表3潜在标记物的分型能力
若随机去掉训练集中的质荷比,比如356.07和445.06,得到ROC测试集(上述303个测试集样本)的AUC=0.9289,AUC明显降低,FN=0.296和FP=0.016,FN和FP明显增大(图7),冠心病诊断能力有所降低。
参考文献:
[1]Finegold,JA;Asaria,P;Francis,DP.Mortality from ischaemic heart disease by country,region,and age:Statistics from World Health Organisation and United Nations.International journal of cardiology.4December 2012,168(2):934-45.
[2]World Health Organization Department of Health Statistics and Informatics in the Information,Evidence and Research Cluster.The global burden of disease 2004update.Geneva:WHO.2004.ISBN 92-4-156371-0.
[3]Elizabeth Barrett-Connor.Gender differences and disparities in all-cause and coronary heart disease mortality:epidemiological aspects.Best Pract Res Clin Endocrinol Metab.2013Aug;27(4):481-500.
[4]Madjid M,Willerson JT.Inflammatory markers in coronary heart disease.Br Med Bull.2011;100:23-38.doi:10.1093/bmb/ldr043.Epub 2011Oct 18.
[5]Spoletini I1,Vitale C,Rosano GM.Biomarkers for predicting postmenopausal coronary heart disease.Biomark Med.2011Aug;5(4):485-95.doi:10.2217/bmm.11.51.
[6]Kishore Kumar Pasikanti,Kesavan Esuvaranathan,Paul C.Ho,et al.Noninvasive urinary metabonomic diagnosis of human bladder cancer.Journal of Proteome Research,2010,9,2988-2995.
[7]Liaw,Andy&Wiener,Matthew.Classification and Regression by randomForest,R News(2002),Vol.2/3p.18.
[8]Jianguo Xia,David I.Broadhurst,Michael Wilson,David S.Wishart.Translational biomarker discovery in clinical metabolomics:an introductory tutorial.Metabolomics(2013)9:280-299.

Claims (27)

  1. 生物标志组合物,其至少含有选自以下生物标志物1~8中的一种或数种:
    生物标志物1,其质荷比为356.07±0.4amu,保留时间为606.57±60s;
    生物标志物2,其质荷比为284.18±0.4amu,保留时间为538.89±60s;
    生物标志物3,其质荷比为445.06±0.4amu,保留时间为494.89±60s;
    生物标志物4,其质荷比为268.19±0.4amu,保留时间为589.52±60s;
    生物标志物5,其质荷比为342.03±0.4amu,保留时间为625.52±60s;
    生物标志物6,其质荷比为324.0459±0.4amu,保留时间为612.39±60s;
    生物标志物7,其质荷比为324.0457±0.4amu,保留时间为652.06±60s;
    生物标志物8,其质荷比为307.02±0.4amu,保留时间为607.78±60s。
  2. 权利要求1的生物标志组合物,其至少含有生物标志物1~3;
    任选地,还含有生物标志物4~8中的一种或数种。
  3. 权利要求1的生物标志组合物,其含有生物标志物1~8。
  4. 试剂组合物,其含有用于检测权利要求1-3任一项的生物标志组合物的试剂。
  5. 权利要求1-3任一项的生物标志组合物和/或权利要求4的试剂组合物用于制备试剂盒的用途,所述试剂盒用于冠心病的患病风险评估、诊断、早期诊断或病理分期。
  6. 权利要求5的用途,所述试剂盒还包括冠心病受试者和正常受试者的权利要求1-3任一项的生物标志组合物含量的训练集数据。
  7. 权利要求6的用途,其中所述的训练集数据如表2所示。
  8. 一种用于冠心病的患病风险评估、诊断、早期诊断或病理分期的方法,所述方法包括测定受试者样本(例如尿液)中权利要求1-3任一项的生物标志组合物中各生物标志物的含量的步骤。
  9. 权利要求8的方法,其中测定受试者样本(例如尿液)中权利要求1-3任一项的生物标志组合物中各生物标志物的含量的方法为液相色谱质谱联用的方法。
  10. 权利要求8的方法,所述方法还包括建立冠心病受试者和正常受试者样本(例如尿液)的权利要求1-3任一项的生物标志组合物含量的训练集的步骤。
  11. 权利要求10的方法,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
  12. 权利要求11的方法,其中所述训练集的数据如表2所示。
  13. 权利要求7-12任一项的方法,所述方法还包括将受试者样本(例如尿液)中权利要求1-3任一项的生物标志组合物中各生物标志物的含量与训练集数据进行比较的步骤,所述训练集是指冠心病受试者和正常受试者样本的权利要求1-3任一项的生物标志组合物含量的训练集。
  14. 权利要求13的方法,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
  15. 权利要求14的方法,其中所述训练集的数据如表2所示。
  16. 权利要求13-15任一项的方法,其中所述进行比较是指采用受试者工作特征曲线进行比较。
  17. 权利要求16的方法,其中比较步骤的结果判定方法为,若假定受试者为非冠心病患者,进行ROC诊断得到的非冠心病患者的概率小于0.5或者患冠心病的概率大于0.5,则表明原假定的受试者患冠心病的概率大、风险较高或者诊断为冠心病患者。
  18. 权利要求1-3任一项的生物标志组合物,用于冠心病的患病风险评估、诊断、早期诊断或病理分期。
  19. 权利要求18的生物标志组合物,其中测定受试者样本(例如尿液)中权利要求1-3任一项的生物标志组合物中各生物标志物的含量的方法为液相色谱质谱联用的方法。
  20. 权利要求18的生物标志组合物,还包括建立冠心病受试者和正常受试者的权利要求1-3任一项的生物标志组合物含量的训练集的步骤。
  21. 权利要求20的生物标志组合物,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
  22. 权利要求21的生物标志组合物,其中所述训练集的数据如表2所示。
  23. 权利要求18-22任一项的生物标志组合物,还包括将受试者样本(例如尿液)中权利要求1-3任一项的生物标志组合物中各生物标志物的含量与训练集数据进行比较的步骤,所述训练集是指冠心病受试者和正常受试者样本的权利要求1-3任一项的生物标志组合物含 量的训练集。
  24. 权利要求23的生物标志组合物,其中所述训练集是利用多元统计分类模型(例如随机森林模型)建立的训练集。
  25. 权利要求24的生物标志组合物,其中所述训练集的数据如表2所示。
  26. 权利要求23-25任一项的生物标志组合物,其中所述进行比较是指采用受试者工作特征曲线进行比较。
  27. 权利要求26的生物标志组合物,其中比较步骤的结果判定方法为,若假定受试者为非冠心病患者,进行ROC诊断得到的非冠心病患者的概率小于0.5或者患冠心病的概率大于0.5,则表明原假定的受试者患冠心病的概率大、风险较高或者诊断为冠心病患者。
CN201480082294.5A 2014-09-30 2014-09-30 冠心病患者特异性生物标志组合物及其用途 Active CN106716123B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2014/087852 WO2016049829A1 (zh) 2014-09-30 2014-09-30 冠心病患者特异性生物标志组合物及其用途

Publications (2)

Publication Number Publication Date
CN106716123A true CN106716123A (zh) 2017-05-24
CN106716123B CN106716123B (zh) 2019-10-25

Family

ID=55629256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480082294.5A Active CN106716123B (zh) 2014-09-30 2014-09-30 冠心病患者特异性生物标志组合物及其用途

Country Status (4)

Country Link
US (1) US20170234852A1 (zh)
EP (1) EP3203228B1 (zh)
CN (1) CN106716123B (zh)
WO (1) WO2016049829A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862846A (zh) * 2022-12-23 2023-03-28 深圳爱湾医学检验实验室 一种尿结石风险评估模型的构建方法及构建体系

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008118413A2 (en) * 2007-03-26 2008-10-02 Bg Medicine, Inc. Methods for detecting coronary artery disease
US7459286B1 (en) * 2003-10-22 2008-12-02 The Cleveland Clinic Foundation Assessing the risk of a major adverse cardiac event in patients with chest pain
WO2010012306A1 (en) * 2008-07-31 2010-02-04 Queen Mary And Westfield College, University Of London Healthy kidney biomarkers
WO2010138899A2 (en) * 2009-05-28 2010-12-02 The Cleveland Clinic Foundation Trimethylamine-containing compounds for diagnosis and prediction of disease
CN102084251A (zh) * 2008-02-22 2011-06-01 奥塔哥创新有限公司 用于急性冠状动脉疾病的生物标志物
CN102323351A (zh) * 2011-08-12 2012-01-18 深圳华大基因科技有限公司 膀胱癌患者尿液特异性代谢物谱、建立方法及用途

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101769910A (zh) * 2008-12-30 2010-07-07 中国科学院大连化学物理研究所 一种从血清代谢轮廓筛选恶性卵巢肿瘤标志物的方法
US20150099668A1 (en) * 2012-05-14 2015-04-09 Uti Limited Partnership Metabolite biomarkers for staging colorectal cancer

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7459286B1 (en) * 2003-10-22 2008-12-02 The Cleveland Clinic Foundation Assessing the risk of a major adverse cardiac event in patients with chest pain
WO2008118413A2 (en) * 2007-03-26 2008-10-02 Bg Medicine, Inc. Methods for detecting coronary artery disease
CN102084251A (zh) * 2008-02-22 2011-06-01 奥塔哥创新有限公司 用于急性冠状动脉疾病的生物标志物
WO2010012306A1 (en) * 2008-07-31 2010-02-04 Queen Mary And Westfield College, University Of London Healthy kidney biomarkers
WO2010138899A2 (en) * 2009-05-28 2010-12-02 The Cleveland Clinic Foundation Trimethylamine-containing compounds for diagnosis and prediction of disease
CN102323351A (zh) * 2011-08-12 2012-01-18 深圳华大基因科技有限公司 膀胱癌患者尿液特异性代谢物谱、建立方法及用途

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115862846A (zh) * 2022-12-23 2023-03-28 深圳爱湾医学检验实验室 一种尿结石风险评估模型的构建方法及构建体系

Also Published As

Publication number Publication date
EP3203228A4 (en) 2018-07-04
EP3203228A1 (en) 2017-08-09
CN106716123B (zh) 2019-10-25
US20170234852A1 (en) 2017-08-17
EP3203228B1 (en) 2020-08-26
WO2016049829A1 (zh) 2016-04-07

Similar Documents

Publication Publication Date Title
CN102323351B (zh) 膀胱癌患者尿液特异性代谢物谱、建立方法及用途
CN103616450B (zh) 一种肺癌患者血清特异性代谢产物谱及其建立方法
CN108414660B (zh) 一组与肺癌早期诊断相关的血浆代谢小分子标志物的应用
CN111289736A (zh) 基于代谢组学的慢阻肺早期诊断标志物及其应用
CN104515860B (zh) 生物标记用于制备心脏衰竭诊断组合物的用途及诊断装置
CN101454331A (zh) 有效用于诊断前列腺癌的生物标记,及其方法
CN105651923B (zh) 诊断区分不稳定型心绞痛和急性心肌梗死的代谢标志物
CN101769910A (zh) 一种从血清代谢轮廓筛选恶性卵巢肿瘤标志物的方法
CN105044361A (zh) 一种适合于食管鳞状细胞癌早期诊断的诊断标记物及其筛选方法
CN105445408B (zh) 诊断区分冠状动脉粥样硬化和稳定型心绞痛的代谢标志物
CN104713970B (zh) 一种血清代谢组学分析模型的构建方法
CN105738526A (zh) 筛选三阴性乳腺癌特异性血清代谢标志物的方法
CN110514772A (zh) 透明肾细胞癌代谢标志物在肾细胞癌早期筛查和诊断产品中的应用
CN112183616B (zh) 一种脑胶质瘤诊断的诊断标志物、试剂盒及筛选方法和脑胶质瘤诊断模型的构建方法
CN106556656B (zh) 一种与胆石症相关的血浆代谢小分子标志物及其应用
CN109307764A (zh) 一组代谢标志物在制备胶质瘤诊断试剂盒方面的应用
CN112083111A (zh) 一种慢性药物性肝损伤相关肝硬化非侵入性诊断标志物及其应用
CN107076753B (zh) 肥胖人群特异性生物标志组合物及其用途
CN105486778B (zh) 诊断区分稳定型心绞痛和急性冠脉综合征的代谢标志物
CN107076710B (zh) 冠心病患者特异性生物标志组合物及其用途
CN109946411A (zh) 用于胸椎黄韧带骨化诊断的生物标记物及其筛选方法
CN104713969B (zh) 一种食管癌初步筛查用血清代谢组学分析模型的构建方法
CN106716123B (zh) 冠心病患者特异性生物标志组合物及其用途
CN114354952B (zh) 帕金森病代谢组学生物标志物及其应用
CN109946467B (zh) 一种用于胸椎黄韧带骨化诊断的生物标记物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1234492

Country of ref document: HK

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 518083, Beishan Industrial Zone, 146 North Mountain Road, Yantian District, Guangdong, Shenzhen 11F-3

Applicant after: BGI-Shenzhen Co., Ltd.

Applicant after: Shenzhen Huada Academy of life science

Address before: 518083, Beishan Industrial Zone, 146 North Mountain Road, Yantian District, Guangdong, Shenzhen 11F-3

Applicant before: BGI-Shenzhen Co., Ltd.

Applicant before: BGI-Shenzhen

GR01 Patent grant
GR01 Patent grant