CN112461986B - 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系 - Google Patents

一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系 Download PDF

Info

Publication number
CN112461986B
CN112461986B CN202110144115.8A CN202110144115A CN112461986B CN 112461986 B CN112461986 B CN 112461986B CN 202110144115 A CN202110144115 A CN 202110144115A CN 112461986 B CN112461986 B CN 112461986B
Authority
CN
China
Prior art keywords
carnitine
lpc
ifg
t2dm
biomarker system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110144115.8A
Other languages
English (en)
Other versions
CN112461986A (zh
Inventor
鄢丹
龙江兰
杨智睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Friendship Hospital
Original Assignee
Beijing Friendship Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Friendship Hospital filed Critical Beijing Friendship Hospital
Priority to CN202110144115.8A priority Critical patent/CN112461986B/zh
Publication of CN112461986A publication Critical patent/CN112461986A/zh
Priority to KR1020217041276A priority patent/KR20230136714A/ko
Priority to PCT/CN2021/089772 priority patent/WO2022166006A1/zh
Priority to US17/623,233 priority patent/US20230282355A1/en
Application granted granted Critical
Publication of CN112461986B publication Critical patent/CN112461986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/88Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
    • G01N2030/8809Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
    • G01N2030/8813Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
    • G01N2030/8818Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/04Endocrine or metabolic disorders
    • G01N2800/042Disorders of carbohydrate metabolism, e.g. diabetes, glucose metabolism
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Biotechnology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Primary Health Care (AREA)

Abstract

本发明公开了一种用于评估空腹血糖受损(IFG)和2型糖尿病(T2DM)患病风险的整合生物标志物体系,所述整合生物标志物体系包括样本中L‑谷氨酰胺、L‑缬氨酸、L‑亮氨酸、L‑赖氨酸、L‑脯氨酸、L‑苯丙氨酸、L‑精氨酸、L‑谷氨酸、L‑异亮氨酸、L‑蛋氨酸、左旋肉碱、乙酰基左旋肉碱、溶血磷脂酰胆碱(LPC(P‑16:0))、LPC(17:0)、LPC(14:0)、丙酰基左旋肉碱的定量测定结果。本发明首次公开了用于IFG和T2DM评估的整合生物标志物体系。本发明建立的IFG和T2DM受试者血清样本整合生物标志物体系包含了相互关联的生物网络路径上的生物标志物组,反映了IFG和T2DM的整体代谢特征信息,规避了单一或孤立地分析生物标志物而缺乏整体综合地反映疾病的特征信息。

Description

一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生 物标志物体系
技术领域
本发明涉及药学检测领域,特别是一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系。
背景技术
2型糖尿病(T2DM)是慢性代谢性疾病,空腹血糖受损(IFG)是糖尿病前期的一种类型,其空腹血糖值介于正常与T2DM之间。一般地,T2DM是不可逆的、终身性疾病,而IFG是可逆的。通过严格控制饮食、加强锻炼等生活方式干预后,可使IFG向糖尿病转变的转变率降低。2007年杨文英教授发表在《新英格兰医学杂志》的一个全国性调查表明,我国糖尿病的患病人数近1.0亿人,2016年世界卫生组织首次发布《全球糖尿病报告》显示,我国约有5亿成年人处于糖尿病前期,但由于糖尿病前期诊断率低,绝大部分人还不知道自己处于糖尿病前期。1999年世界卫生组织对IFG与T2DM的诊断标准为空腹血糖值的界定,但是,在受试者即将发展为IFG或T2DM时,空腹血糖诊断的敏感性是有所降低的。因此,探索IFG及T2DM的敏感诊断生物标志物至关重要,这对IFG和T2DM的早期诊断、IFG的早期干预、T2DM的预防和控制具有重要意义。
代谢物不仅反应了基因组与蛋白组的变化,还受到其他因素如环境因素和肠道菌群的影响,代谢物具有更强的动态性,对生物体的变化反映更加灵敏。中国专利CN104769434B公开了代谢物甘氨酸、溶血磷脂酰胆碱与乙酰肉毒碱C2可用于识别受试者中发展T2DM的倾向。然而,IFG和T2DM的诊断生物标志物呈现孤立和分散状态。多数研究是基于单中心的非靶向代谢组学研究,重现性低,难以体现生物标志物的临床应用价值。从系统生物学的角度而言,多个代谢物之间存在关联关系,以定量的多个代谢物作为IFG与T2DM的诊断生物标志物具有现实的应用价值。整合生物标志物体系是由疾病生物标志物整合形成的特征性变化谱,是体内重要代谢物变化趋势以及生物网络关联关系信号的真实综合响应。然而,至今尚未有研究建立IFG与T2DM患者的整合生物标志物体系。
因鉴于此,特提出此发明。
发明内容
本发明提供了一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系,所述整合生物标志物体系包括样本中L-谷氨酰胺在2000-160000ng/mL、L-缬氨酸在1200-96000ng/mL、L-亮氨酸在1000-80000ng/mL、L-赖氨酸在800-64000ng/mL、L-脯氨酸在800-64000ng/mL、L-苯丙氨酸在500-40000ng/mL、L-精氨酸在500-40000ng/mL、L-谷氨酸在500-40000ng/mL、L-异亮氨酸在300-24000ng/mL、L-蛋氨酸在250-20000ng/mL、左旋肉碱在200-16000ng/mL、乙酰基左旋肉碱在80-6400ng/mL、溶血磷脂酰胆碱LPC(P-16:0)在60-4800ng/mL、LPC(17:0)在60-4800ng/mL、LPC(14:0)在40-3200ng/mL、丙酰基左旋肉碱在4-320ng/mL范围内的定量测定结果。
进一步的,所述样本为受试者血清。
进一步的,所述定量测定结果以无细胞氨基酸混合物20AA、O-乙酰基-L-肉碱盐酸盐(N-甲基-D3)和溶血磷脂酰胆碱(20:0)(二十碳酰-12,12,13,13-D4)作为同位素内标分析获得。
进一步的,所述整合生物标志物体系还包括利用机器学习方法建立的模型。
进一步的,所述机器学习方法为极端梯度提升法。
相比于现有技术,本发明的优点在于:
本发明首次公开了用于评估IFG和T2DM风险的整合生物标志物体系。本发明建立的IFG和T2DM受试者血清样本整合生物标志物体系包含了相互关联的生物网络路径上的生物标志物组,反映了IFG和T2DM的整体代谢特征信息,规避了单一或孤立地分析生物标志物而缺乏整体综合地反映疾病的特征信息。本发明提供的基于定量的整合生物标志物体系源于临床真实世界、临床多中心、代表性较强,从而提高了疾病生物标志物潜在临床应用价值;本发明建立的靶向定量评价检测方法灵敏度高、特异性强、重现性好,检测样本用量少,操作简单。
附图说明
图1为L-谷氨酰胺、L-缬氨酸、L-亮氨酸、L-赖氨酸、L-脯氨酸与L-苯丙氨酸的选择反应监测模式(selective reaction monitoring,SRM)色谱图;
图2为L-精氨酸、L-谷氨酸、L-异亮氨酸、L-蛋氨酸、左旋肉碱与乙酰基左旋肉碱的SRM色谱图;
图3为溶血磷脂酰胆碱(LPC,P-16:0)、LPC(17:0)、LPC(14:0)与丙酰基左旋肉碱的SRM色谱图;
图4为受试者血清样本中16种代谢物浓度的小提琴图;
图5是受试者血清样本中16种代谢物对样本进行分类诊断的性能结果图;
图6是三种机器学习模型中16种代谢物的曲线下面积结果图;
图7是基于XGBoost模型的基尼不纯度、互信息和方差分析中上述16种代谢物的增量特征选择曲线图;
图8是受试者血清样本中16种代谢物的基尼不纯度排序图;
图9是三种机器学习模型对优选的10种代谢物的曲线下面积结果图;
图10是正常葡萄糖耐量、空腹血糖受损、2型糖尿病和高血脂症的整合生物标志物体系;
图11是利用整合生物标志物体系评价典型代表样本1结果示意图(正常葡萄糖耐量);
图12是利用整合生物标志物体系评价典型代表样本2结果示意图(空腹血糖受损);
图13是利用整合生物标志物体系评价典型代表样本3结果示意图(2型糖尿病);
图14是利用整合生物标志物体系评价典型代表样本4结果示意图(高血脂症)。
其中,图1-3中左中右三列分别表示溶剂空白、标准品和血清样本的结果;图11-14中LPC为溶血磷脂酰胆碱。
具体实施方式
为进一步阐述本发明为达成预定发明目的所采取的技术手段及结果,以下以较佳实施例,对依据本发明申请的具体实施方式、技术方案及特征,详细说明如后。下述说明中的多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
发明以下实施例选用的主要材料及来源分别如下:
分析中所用L-谷氨酰胺(批号:V900419)、L-缬氨酸(批号:94619)、L-亮氨酸(批号:61819)、L-赖氨酸(批号:23128)、L-脯氨酸(批号:81709)、L-苯丙氨酸(批号:852465P)、L-精氨酸(批号:11009-25G-F)、L-谷氨酸(批号:95436)、L-异亮氨酸(批号:I2752)、L-蛋氨酸(批号:64319-25G-F)、溶血磷脂酰胆碱(LPC(P-16:0))(批号:852464P)、LPC(17:0)(批号:855676P)、LPC(14:0)(批号:855575P)和丙酰基左旋肉碱(批号:91275)均购自美国Sigma-Aldrich公司;左旋肉碱(批号:DRE-C11045500)购自北京百灵威科技有限公司;乙酰基左旋肉碱盐酸盐(批号:DST190510-049)购自成都德思特生物技术有限公司;同位素无细胞氨基酸混合物(Cell Free Amino Acid Mix(20AA)(U-D,98%))(批号:DLM-6819-PK)、O-乙酰基-L-肉碱盐酸盐(N-甲基-D3,98%)(批号:DLM-754-0.05)和LPC(20:0)(二十碳酰-12,12,13,13-D4,98%)(批号:DLM-10520-0.001)均购自美国Cambridge IsotopeLaboratories公司;乙酸铵(批号:E057G140)购买自德国CNW Technologies GmbH公司;超高效液相色谱四级杆-静电场轨道阱高分辨精确质谱(美国Thermo Fisher Scientific公司,Q-Exactive);超高效液相色谱三重四极杆质谱仪(美国Thermo Fisher Scientific公司,TSQ-Altis);冷冻微量离心机(美国Thermo Fisher Scientific公司,Heraeus Fresco17);多用途旋涡混合器(美国Scientific Industries公司,Vortex Genie 2);5mL血清分离胶管(美国Becton,Dickinson and Company公司,367955);反相色谱柱(Waters,ACQUITYBEH C18和ACQUITY BEH HILIC)。
实施例一样本采集
本发明所述的整合生物标志物体系的样本来源于受试者血清。
于北京、郑州和开封三地5家临床中心招募受试者并收集血清样本。为了消除饮食干扰,在禁食过夜后统一于早晨7:00-9:00收集受试者血清样本。以5mL血清分离胶管收取受试者外周静脉血。静置30min后,用冷冻高速离心机以1510g、4℃条件下离心10min,取上清液200μL分装至1.5mL带标记的EP管中,在分析之前储存于-80℃冰箱。最终,共收集了1132份血清样本用于后续的分析作业。
实施例二标准曲线工作液及质量控制(QC)样品的配制
称取标准品L-谷氨酰胺、L-缬氨酸、L-亮氨酸、L-赖氨酸、L-脯氨酸、L-异亮氨酸、L-蛋氨酸、L-苯丙氨酸、L-精氨酸、L-谷氨酸、左旋肉碱和无细胞氨基酸混合物(20AA)适量,分别置于10mL容量瓶中,加入10%甲醇水溶解定容,配制成储备溶液。其中,L-谷氨酰胺浓度为4000μg/mL,L-缬氨酸、L-亮氨酸、L-赖氨酸、L-脯氨酸、L-异亮氨酸和L-蛋氨酸浓度均为2000μg/mL,L-苯丙氨酸、L-精氨酸、L-谷氨酸和左旋肉碱浓度均为1000μg/mL,20AA浓度为1000μg/mL。
称取LPC(P-16:0)、LPC(17:0)、LPC(14:0)、丙酰基左旋肉碱、LPC(20:0)(二十碳酰-12,12,13,13-D4,98%)(LPC(20:0)-d4)适量,加入乙腈水(1:1,v:v)溶液溶解定容,配制成LPC(P-16:0)、LPC(17:0)、LPC(14:0)、丙酰基左旋肉碱和LPC(20:0)-d4浓度均为100μg/mL的储备溶液。
称取乙酰基左旋肉碱盐酸盐和O-乙酰基-L-肉碱盐酸盐(N-甲基-D3,98%)(乙酰基-L-肉碱-d3)适量,加入4%盐酸水溶液溶解定容,配制成L-乙酰肉碱浓度为100μg/mL、乙酰基-L-肉碱-d3浓度为100μg/mL的储备溶液。
将上述制得的储备溶液置于4℃冰箱内保存待用。
精密吸取上述制备的20AA、乙酰基-L-肉碱-d3和LPC(20:0)-d4储备溶液适量置于500mL容量瓶内,加乙腈甲醇(3:1,v:v)溶液定容,配制成含内标20AA、乙酰基-L-肉碱-d3和LPC(20:0)-d4浓度分别为10μg/mL、500ng/mL和25ng/mL的乙腈甲醇蛋白沉淀剂工作溶液。
由于人的空白血清难以作为常规获得,因此以1x的磷酸缓冲盐溶液替代空白血清作为空白对照使用。吸取标准品的储备溶液适量,加入1x磷酸缓冲盐溶液逐级稀释,配置成7个浓度水平的标准曲线工作溶液,并设置低、中、高三个浓度的QC样本(LQC、MQC、HQC),用于后续的样本定量分析,标准曲线工作溶液和QC样本浓度如表1所示。
Figure GDA0003013012040000071
表1线性中标准曲线工作溶液和QC样本浓度
实施例三样本的定量分析
样本的预处理:精密吸取10μL制备的标准曲线工作溶液或质量控制(QC)样本置于1.5mL离心管中,各加入90μL血清样本稀释,涡旋1min混匀,加入乙腈甲醇蛋白沉淀剂工作溶液300μL,涡旋5min混匀,于16200g、4℃条件下离心10min,取上清液,用于后续分析。
色谱条件:使用Waters ACQUITY BEH HILIC(100mm×2.1mm,1.7μm)色谱柱;流动相A为含20mmol/L乙酸铵0.1%甲酸水,流动相B为含0.1%甲酸的乙腈;进样体积均为3μL,流速为0.30mL/min,柱温为40℃;液相洗脱程序:初始流动相B为95%,保持2.0min,在4.0min时呈线性降至60%,保持6.0min后,在0.2min内线性地升高至95%并保持1.8min,整个分析运行时间为12min。
质谱条件:电喷雾电离模式为正离子模式(ESI+),监测模式为选择反应监测。喷雾电压为3.5kV,碰撞气为高纯氮气,辅助气流速为17L/min,离子传输管温度为325℃,蒸发器温度为320℃。鞘气流速为20L/min。
随机抽取6份实施例一获得的血清样本,并按上述的预处理的方法进行预处理,同时,并制备预处理的6份空白对照以及6份预处理的1x的磷酸缓冲盐溶液,将上述样本进行分析,结果如图1-3所示,表明实测血清样本中各内源性物质对待分析物、同位素内标均不产生干扰,且待分析代谢物、同位素内标之间具有良好的分离度。
定量下限与检测限、线性与浓度范围与精密度结果如表2所示,代谢物在配制的浓度范围内均表现出良好的线性(相关系数R值均大于0.99);考察的6批次LQC、MQC、HQC日内精密度相对标准偏差(RSD)值为2.08%-11.87%;日间精密度RSD值为1.68%-11.23%。
Figure GDA0003013012040000081
Figure GDA0003013012040000091
表2定量下限与检测限、线性与浓度范围与精密度结果
日内准确度、提取回收率与基质效应考察结果如表3所示,LQC、MQC、HQC日内准确度相对误差(RE)值为-13.33%-13.72%,日间准确度RE值为-13.30%-13.18%,16种代谢物在LQC、HQC样本浓度下提取回收率平均值为68.68%-129.87%;基质效应平均值为74.54%-142.93%。
Figure GDA0003013012040000092
Figure GDA0003013012040000101
表3准确度、提取回收率与基质效应结果
稳定性结果如表4所示,代谢物在LQC、MQC、HQC浓度下于自动进样器放置24小时稳定性RSD值为0.85%-9.78%;于4℃冰箱放置24小时的稳定性RSD值为0.97%-10.20%;代谢物在5倍稀释条件下RSD值为0.60%-5.72%,表明在5倍稀释条件下对血清样本中代谢物含量测定无影响。经考察,16个代谢物的残留效应空白样本中的残留均小于定量下限的20%。
Figure GDA0003013012040000102
表4稳定性与稀释效应结果
上述结果证明本发明采用的靶向检测方法的选择性、定量下限与检测限、线性与浓度范围、精密度与准确度、提取回收率与基质效应、稳定性、稀释效应与残留效应均符合血清生物样本定量分析方法要求。
实施例四整合生物标志物体系的建立和应用
使用实施例三中所述的方法分析测定实施例一种收集的1132份样本。并使用其中的NGT(正常葡萄糖耐量)、IFG、T2DM和高血脂症样品建立模型。
其中,使用70-30留出法将样本数据集随机划分为训练集和测试集,使用训练集(232份NGT、314份IFG、230份T2DM和96份高血脂症)对模型进行训练,测试集(80份NGT、97份IFG、113份T2DM和50份高血脂症)用来测试模型。
使用TraceFinder软件提取数据之后,代谢物差异使用Kruskal-Wallis(克鲁斯卡尔-沃利斯)检验,多组间的检验使用邦费罗尼(Bonferroni)进行校正,用软件Origin 2019绘制训练集与测试集靶向代谢物含量,如图4所示,结果表明训练集和测试集中16个靶向代谢物的血清浓度存在显著性差异。以单个代谢物做受试者工作特征曲线分析,用曲线下面积(AUC)评估其性能,结果如图5所示,单个代谢物对四种类型样本的评价性能较差。从系统生物学的角度而言,以多个关联的代谢物作为评估疾病风险的生物标志物会具有更高的价值。因此,我们使用机器学习方法以16个靶向代谢物建立IFG与T2DM整合生物标志物体系的评价模型。
进一步的,为了筛选合适的方法来构建用于IFG和T2DM整合生物标志物体系的评价模型,在测试集中以AUC作为评估指标评估了三种机器学习方法(极端梯度提升(XGBoost)、逻辑回归和支持向量机)建立的评价模型性能,结果如图6所示。由图6可见,从AUC值看,XGBoost模型对NGT、IFG、T2DM与高血脂症四类样本的区分性能最好(XGBoost模型的AUC值是0.819、逻辑回归模型的AUC值是0.791、支持向量机模型的AUC值是0.789)。因此,选择XGBoost(极端梯度提升法)进行整合生物标志物体系模型的构建。
为了改善评价模型的特异性与敏感性,使用基尼不纯度、互信息和方差分析对代谢物重要性进行了排序,使用增量特征选择策略确定最佳代谢物子集。结果如图7-图8所示,在基于基尼不纯度的XGBoost模型中,当主要代谢物的数量增加到11个时,模型的性能未显示更好。因此,作为一种优选的方案,按基尼不纯度排序,选择前10个代谢物,LPC(P-16:0)、L-异亮氨酸、L-精氨酸、左旋肉碱、L-苯丙氨酸、L-谷氨酸、L-赖氨酸、L-蛋氨酸、L-亮氨酸和乙酰基左旋肉碱来构整合生物标志物体系。如图9所示,XGBoost模型AUC值为0.823,显然,在XGBoost模型中用10代谢物构建的模型的评价性能高于16个代谢物。
以测试集考察该模型的性能,并以AUC、准确度、灵敏度、特异性、精密度和F1得分来评估,结果如表5所示。
Figure GDA0003013012040000121
表5整合生物标志物体系评价性能
由表5所述的数据可得,该模型对于2DM和NGT进行鉴别的准确性为85%,对T2DM和IFG、T2DM和高血脂症的鉴别准确性分别为75%和89%。因此,该模型可以用于评估NGT、IFG、T2DM和高血脂症的风险。
为了使IFG与T2DM的整合生物标志物体系可视化,使用公式对原始数据进行标准化:生物标志物标准化后值(B(i))=(生物标志物标准化前的浓度(B(c))-生物标志物标准化前最小浓度(B(min)))/(生物标志物标准化前的最大浓度(B(max))-生物标志物标准化前最小浓度(B(min)))×100,标准化后计算B(i)平均值±标准差(mean±SD),以mean±SD作图。结果如图10所示,实线是四类样本中10种代谢物浓度标准化后的平均值,灰色区域是mean±SD,虚线是未知样本的10种代谢物浓度。基于XGBoost建立的整合生物标志物体系可以解释为,未知样本被评估为其在四类中具有最高评估值的一类。
此外,我们还呈现了具有代表性样本评估结果示意图,如图11-图14所示。样本1有较大患NGT风险(其在NGT组的评估值为0.795),样本2有较大患IFG风险(其在IFG组的评估值为0.676),样本3有较大患T2DM风险(其在T2DM组的评估值为0.597),样本4有较大患高血脂症风险(其在高血脂症组的评估值为0.702)。
以上所述,仅为本发明较佳的具体实施方式;但本发明的保护范围并不局限于此。任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其改进构思加以等同替换或改变,都应涵盖在本发明的保护范围内。

Claims (5)

1.一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系,其特征在于,所述整合生物标志物体系包括样本中的L-谷氨酰胺在2000-160000ng/mL、L-缬氨酸在1200-96000ng/mL、L-亮氨酸在1000-80000ng/mL、L-赖氨酸在800-64000ng/mL、L-脯氨酸在800-64000ng/mL、L-苯丙氨酸在500-40000ng/mL、L-精氨酸在500-40000ng/mL、L-谷氨酸在500-40000ng/mL、L-异亮氨酸在300-24000ng/mL、L-蛋氨酸在250-20000ng/mL、左旋肉碱在200-16000ng/mL、乙酰基左旋肉碱在80-6400ng/mL、溶血磷脂酰胆碱LPC(P-16:0)在60-4800ng/mL、LPC(17:0)在60-4800ng/mL、LPC(14:0)在40-3200ng/mL、丙酰基左旋肉碱在4-320ng/mL范围内的定量测定结果。
2.根据权利要求1所述的用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系,其特征在于,所述样本为受试者血清。
3.根据权利要求1所述的用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系,其特征在于,所述定量测定结果以无细胞氨基酸混合物20AA、O-乙酰基-L-肉碱盐酸盐(N-甲基-D3)和溶血磷脂酰胆碱(20:0)(二十碳酰-12,12,13,13-D4)作为同位素内标分析获得。
4.根据权利要求1所述的用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系,其特征在于,所述整合生物标志物体系还包括利用机器学习方法建立的模型。
5.根据权利要求4所述的用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系,其特征在于,所述机器学习方法为极端梯度提升法。
CN202110144115.8A 2021-02-03 2021-02-03 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系 Active CN112461986B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202110144115.8A CN112461986B (zh) 2021-02-03 2021-02-03 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系
KR1020217041276A KR20230136714A (ko) 2021-02-03 2021-04-26 공복 혈당 장애와 2형 당뇨병 발병 리스크를 평가하기 위한 통합 바이오 마커 시스템
PCT/CN2021/089772 WO2022166006A1 (zh) 2021-02-03 2021-04-26 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系
US17/623,233 US20230282355A1 (en) 2021-02-03 2021-04-26 Integrated Biomarker System for Evaluating Risks of Impaired Fasting Glucose (IFG) and Type 2 Diabetes Mellitus (T2DM)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110144115.8A CN112461986B (zh) 2021-02-03 2021-02-03 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系

Publications (2)

Publication Number Publication Date
CN112461986A CN112461986A (zh) 2021-03-09
CN112461986B true CN112461986B (zh) 2021-06-08

Family

ID=74802582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110144115.8A Active CN112461986B (zh) 2021-02-03 2021-02-03 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系

Country Status (4)

Country Link
US (1) US20230282355A1 (zh)
KR (1) KR20230136714A (zh)
CN (1) CN112461986B (zh)
WO (1) WO2022166006A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112461986B (zh) * 2021-02-03 2021-06-08 首都医科大学附属北京友谊医院 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系
CN116519812A (zh) 2022-01-24 2023-08-01 杭州凯莱谱精准医疗检测技术有限公司 生物标志物在制备妊娠糖尿病诊断试剂中的用途
CN114166977B (zh) * 2022-01-24 2022-06-21 杭州凯莱谱精准医疗检测技术有限公司 预测妊娠个体血糖值的系统
CN117288868B (zh) * 2023-11-24 2024-01-30 山东百诺医药股份有限公司 一种n-乙酰基-l-亮氨酸有关物质的检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106979982A (zh) * 2016-01-19 2017-07-25 上海市第六人民医院 一种用于糖尿病风险预测、治疗评价的方法及试剂盒
CN112229937A (zh) * 2020-12-21 2021-01-15 北京大学第三医院(北京大学第三临床医学院) 用于多囊卵巢综合征诊断的生物标志物和试剂盒及使用方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080187944A1 (en) * 2007-01-31 2008-08-07 Appa Rao Allam Butyrylcholinesterase as a marker of low-grade systemic inflammation
EP2414535A4 (en) * 2009-03-31 2012-12-26 Metabolon Inc BIOMARKERS RELATED TO INSULIN RESISTANCE AND METHODS OF USE
WO2014026991A1 (en) * 2012-08-13 2014-02-20 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Biomarkers for type 2 diabetes
JP2016510409A (ja) * 2013-01-31 2016-04-07 カプリオン プロテオミクス インコーポレーテッド 2型糖尿病のバイオマーカー及びその使用
EP3401683A1 (en) * 2017-05-10 2018-11-14 Eberhard Karls Universität Tübingen Medizinische Fakultät Diagnosing metabolic disease by the use of a biomarker
CN112461986B (zh) * 2021-02-03 2021-06-08 首都医科大学附属北京友谊医院 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系
CN212710793U (zh) * 2021-02-03 2021-03-16 首都医科大学附属北京友谊医院 一种检验空腹血糖受损和2型糖尿病的试剂盒

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106979982A (zh) * 2016-01-19 2017-07-25 上海市第六人民医院 一种用于糖尿病风险预测、治疗评价的方法及试剂盒
CN112229937A (zh) * 2020-12-21 2021-01-15 北京大学第三医院(北京大学第三临床医学院) 用于多囊卵巢综合征诊断的生物标志物和试剂盒及使用方法

Also Published As

Publication number Publication date
CN112461986A (zh) 2021-03-09
US20230282355A1 (en) 2023-09-07
WO2022166006A1 (zh) 2022-08-11
KR20230136714A (ko) 2023-09-26

Similar Documents

Publication Publication Date Title
CN112461986B (zh) 一种用于评估空腹血糖受损和2型糖尿病患病风险的整合生物标志物体系
WO2022144028A1 (zh) 用于评估受试者心血管疾病风险的代谢标志物组合及其应用
Ho et al. Electrospray ionisation mass spectrometry: principles and clinical applications
AU2011248464B2 (en) Metabolic biomarkers of autism
US10768183B2 (en) Metabolite panel for improved screening and diagnostic testing of cystic fibrosis
Wijeyesekera et al. Quantitative UPLC-MS/MS analysis of the gut microbial co-metabolites phenylacetylglutamine, 4-cresyl sulphate and hippurate in human urine: INTERMAP Study
CN112630311B (zh) 用于检测情感障碍的代谢标记物和试剂盒及使用方法
CN111505132A (zh) 液相色谱串联质谱检测新型心血管疾病风险标志物的方法
Siddiqui et al. Metabolomics: an emerging potential approach to decipher critical illnesses
CN115326960B (zh) 一种同时检测人血浆中8种抗癫痫药物及1种活性代谢物浓度的分析方法
Peake et al. Improved separation and analysis of plasma amino acids by modification of the MassTrak™ AAA Solution Ultraperformance® liquid chromatography method
Esmati et al. Mass spectrometry with derivatization method for concurrent measurement of amino acids and acylcarnitines in plasma of diabetic type 2 patients with diabetic nephropathy
CA3198282A1 (en) Method of detecting lung cancer
CN111458417B (zh) 联合检测待测样品中多种抗生素的方法及试剂盒
MIYANO et al. Development of precolumn derivatization–LC/MS for amino-acid-focused metabolomics
WO2021232211A1 (zh) 诊断肾病的标志物以及诊断方法
JP6128631B2 (ja) 糖尿病性腎症鑑別用マーカー及びその用途
CN109061179B (zh) 氨基酸联合因子在构建结直肠癌血液学诊断模型中的应用
CN114624362A (zh) 一种检测血清中晚期糖基化终末产物的试剂盒及其应用
CN114047263A (zh) 代谢标志物在制备用于诊断ais的检测试剂或检测物的用途及试剂盒
CN113252806B (zh) S-腺苷同型半胱氨酸在制备用于诊断或治疗川崎病的产品中的用途
CN114264767B (zh) 用于糖尿病诊断的生物标志物及其用途
CN113214386B (zh) 一种糖尿病早期诊断多肽标志物及其应用
CN118348170B (zh) 一种hplc-ms/ms法检测血浆中米洛巴林的方法
CN115219616B (zh) 基于液质联用技术测定生物样本中内源性物质包括辅酶q10浓度的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant