CN113484511B - 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用 - Google Patents
妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用 Download PDFInfo
- Publication number
- CN113484511B CN113484511B CN202110736608.0A CN202110736608A CN113484511B CN 113484511 B CN113484511 B CN 113484511B CN 202110736608 A CN202110736608 A CN 202110736608A CN 113484511 B CN113484511 B CN 113484511B
- Authority
- CN
- China
- Prior art keywords
- lipid
- gestational diabetes
- ceramide
- gestational
- acyl
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/92—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving lipids, e.g. cholesterol, lipoproteins, or their receptors
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/36—Gynecology or obstetrics
- G01N2800/368—Pregnancy complicated by disease or abnormalities of pregnancy, e.g. preeclampsia, preterm labour
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Hematology (AREA)
- Immunology (AREA)
- Urology & Nephrology (AREA)
- Cell Biology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Biophysics (AREA)
- Endocrinology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及妊娠期糖尿病孕早期血液脂质生物标志物的筛选及应用,属于脂质组学与人类健康技术领域。基于前瞻性设计筛选出血液1‑烷基,2‑酰基磷脂酰胆碱(36:1),1‑烯基,2‑酰基磷脂酰乙醇胺(38:6),磷脂酰肌醇(40:6),二酰甘油酯(18:0/18:1)和1‑烷基,2‑酰基磷脂酰乙醇胺(40:5)与妊娠期糖尿病发生风险升高有关,单己糖基神经酰胺(18:0),二己糖基神经酰胺(24:1),磷脂酰胆碱(40:7),二己糖基神经酰胺(24:0)和神经鞘磷脂(34:1)与妊娠期糖尿病发生风险降低有关。本发明生物标志物可作为检测靶点用于预测妊娠期糖尿病,或作为靶点制备治疗和/或预防妊娠期糖尿病药物。
Description
技术领域
本发明属于脂质组学与人类健康技术领域,更具体地,涉及一系列在孕早期与妊娠期糖尿病发病有关联的血液脂质生物标志物,尤其涉及妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用。
背景技术
妊娠期糖尿病(Gestational diabetes mellitus,GDM)是妊娠期首次发现的糖耐量异常,是妊娠期常见的疾病之一。我国妊娠期糖尿病的发病率已接近15%,病人总数位居世界第一(Gao,Sun et al.2019)。妊娠期糖尿病控制不佳会直接导致不良的妊娠结局发生(Metzger,Lowe et al.2008),对于孕妇本身也将显著增加其远期罹患2型糖尿病(T2DM)(Noctor and Dunne2015)或心血管疾病的风险(Tobias,Stuart et al.2017),且其子代更容易发生肥胖与糖耐量受损(Kawasaki,Arata et al.2018)。阐明妊娠期糖尿病的发病机制、寻找可用来早期预测妊娠期糖尿病的预测因子,对于预防和治疗妊娠期糖尿病、减少不良妊娠结局、降低产妇远期糖尿病等发病风险至关重要。
近年来,流行病学研究报道了一系列可能用于妊娠期糖尿病早期预测的生物标志物(Dias,Pheiffer et al.2018),如单核苷酸多态性位点(SNP)、DNA甲基化CpG位点、小分子RNA(miRNA)、细胞因子、人体内源性代谢物等。然而,尽管已发现较多具有潜在预测价值的生物标志物,但妊娠期糖尿病预测仍然面临较大的挑战;对于SNP、DNA甲基化CpG位点及miRNA,受种族和环境因素影响较大;对于内源性小分子物质,如细胞因子及代谢物等,受检测技术和平台的限制导致重现性较差,在不同人群中结论不一致;检测技术的成本较高等。由于上述问题的存在,可能会限制其临床应用。
代谢组学是针对体内小分子物质的大规模检测,能直接反映人体潜在的病理生理活动及细胞和组织的状态。由于脂质分子的复杂性及其生物学功能的重要性,“脂质组学”从“代谢组学”中分离出来成为独立的研究方向。脂质在人体正常的生理和异常的病理过程中均发挥着必不可少的重要作用。脂质组学检测技术的发展有助于全面探究人类疾病中多种类型的脂质在早期预警及发病机制中的潜在作用。
妊娠期糖尿病的病因可能包含肥胖、炎症和氧化应激介导的胰岛素抵抗(Chokwiriyachit,Dasanayake et al.2013,Davis,Crew et al.2020,Shen,Yang etal.2020),脂质可能在其中发挥着重要的生理功能(Han 2016),尤其是甘油二酯(Gao andYe 2012)、磷脂(Park,Sadanala et al.2015,Meikle and Summers 2017)和鞘脂类(Chavez and Summers 2012,Khan,Mohan et al.2019)的生物标志物在此前的多项研究中均有报道。近十年间,关于妊娠期糖尿病代谢组的流行病学研究均有陆续报道(Mao,Chenet al.2017,McCabe and Perng 2017,Chen,Francis et al.2018):然而其中多为横断面或病例对照研究设计,各种生物样本中代谢组的测量通常在疾病诊断时、发病后、甚至产后,由于疾病已经发生,代谢产物改变可能由妊娠期糖尿病所致而不是妊娠期糖尿病未发生时的变化,时序关系不明确,无法进行因果推断,也无法用于建立预测模型;既往研究的样本量均较小,病例数量通常在100人以下,统计检验效能不高;此外,关于中国孕妇人群的研究较匮乏。
既往很多研究也已尝试建立了多种妊娠期糖尿病的预测模型,但绝大多数只纳入了临床实践中常见的生物标志物(Lamain-de Ruiter,Kwee et al.2017,Sweeting,Appelblom et al.2017,Gao,Leng et al.2020)。近几年的一些研究开始在传统模型基础上引入某些代谢物(包括脂质)作为较新颖的生物标志物,并发现其能不同程度地提高传统预测模型的预测能力(Lu,Koulman et al.2016,Nevalainen,Sairanen et al.2016,Koosand Gornbein2020),提示代谢组或脂质组在妊娠期糖尿病预测方面具备一定的潜力。
发明内容
本发明的目的是提供妊娠期糖尿病孕早期血液脂质组生物标志物的筛选,最终共筛选出10个与妊娠期糖尿病有显著关联的脂质生物标志物,并基于此建立了一个脂质风险评分和疾病的预测模型。为妊娠期糖尿病的早期预防、高危孕妇的早期识别、妊娠期糖尿病发病风险的预测,以及干预治疗和精准用药提供指导。此外,能进一步帮助探究妊娠期糖尿病发病机理和新药或营养补充剂的研制。
根据本发明的第一方面,提供了妊娠期糖尿病的孕早期血液脂质生物标志物在制备试剂盒中的应用;所述试剂盒用于孕妇在孕早期预测其孕中期妊娠期糖尿病的发病风险;
所述生物标志物为1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)、单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)中的至少一种;
其中所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度升高;
其中所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度降低。
优选地,所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)各自独立地与妊娠期糖尿病风险升高相关。
优选地,所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)各自独立地与妊娠期糖尿病风险降低相关。
优选地,所述生物标志物来源于血浆或血清。
按照本发明的另一方面,提供了妊娠期糖尿病的孕早期血液脂质生物标志物在制备治疗和/或预防妊娠期糖尿病药物中的应用;
所述生物标志物为1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)、单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)中的至少一种;
其中所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度升高;
其中所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度降低。
优选地,所述药物为调脂类药物或营养补充剂。
按照本发明的另一方面,提供了妊娠期糖尿病的孕早期血液脂质生物标志物的筛选系统,包括:
样本前处理模块:所述样本前处理模块用于血液样本中脂质化合物的提取;
样本脂质组学检测模块:所述脂质组学检测模块用于脂质化合物的检测和定量;
数据质控模块:所述数据质控模块用于脂质组学数据的质量控制,确定每种分析物的定量限和批次内及批次间的变异系数;
定量数据前处理模块:所述定量数据前处理模块用于脂质组学定量数据的过滤和空白值的填补,并对各个脂质分子的浓度进行正态化和标准化处理;
差异脂质分子筛选和分析模块:所述差异脂质分子筛选和分析模块用于经过两独立样本t检验、多变量校正的条件logistic回归和错误发现率校正的方法进行筛选,获得在孕期糖尿病组和非孕期糖尿病组间存在浓度差异的脂质和与疾病发生风险存在显著关联的脂质;
最小绝对收敛和选择算子回归模型评估模块:所述最小绝对收敛和选择算子回归模型评估模块用于依次将最小绝对收敛和选择算子算法应用于未校正的条件logistic回归和校正协变量的广义线性回归模型进行降维,每步筛选均进行多次重复的交叉验证,筛选获得妊娠期糖尿病的孕早期血液脂质生物标志物;所述生物标志物为1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)、单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)中的至少一种;其中所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度升高;其中所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度降低。
优选地,还包括:
脂质风险评分模块:所述脂质风险评分模块用于通过条件logistic回归评估脂质生物标志物与妊娠期糖尿病发病风险的关联,将各个脂质的回归系数进行加权求和得到脂质风险评分;
妊娠期糖尿病风险因素预测模块:所述妊娠期糖尿病风险因素预测模块用于在传统预测因子及临床预测指标基础上加入妊娠期糖尿病相关的早期脂质生物标志物重新构建新的预测模型,采用受试者工作特征曲线中的曲线下面积以及重分类改善指标和综合判别改善指数参数评价建立的预测模型的预测效能。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,主要具备以下的技术优点:
(1)本发明基于一项前瞻性的巢式病例对照设计,该设计来源于中国的一项大型出生队列研究。通过对妊娠期糖尿病孕妇和非妊娠期糖尿病孕妇的孕早期血液脂质组学进行分析,筛选出10种血液脂质组学生物标志物,建立了相应的脂质风险评分和预测模型,并对模型的预测能力进行全面的评价,发现其能显著提高传统妊娠期糖尿病预测模型的预测效能。本发明筛选出一系列在孕早期与妊娠期糖尿病显著相关的血液脂质生物标志物。该设计样本量充足(包含336病例和672对照,采用年龄、纳入孕周和采样时间进行1:2匹配),统计效能较高。经过差异性检验、多重校正、机器学习降维、重复交叉验证等方法,筛选出一系列孕早期脂质标志物,将其纳入妊娠期糖尿病传统模型和临床模型均能显著提高模型的预测效能。本发明筛选步骤较为全面和严谨,标准较为严格,所得到脂质标志物的结果较为稳健。本发明中鉴定并筛选出的脂质标志物,能作为检测靶点用于制备孕早期预测妊娠期糖尿病发病风险试剂盒中的应用,在孕早期时用于识别妊娠期糖尿病高危孕妇,或作为靶点研制妊娠期糖尿病预防或/和治疗的药物或/和营养补充剂。
(2)本发明采用超高效液相色谱-质谱联用的检测技术对血液脂质组学进行检测,该检测方法对化合物的分离能力强,灵敏度和特异度均较高。使用靶向脂质组学技术和内标法,可以对各类脂质分子进行准确定量。
(3)血样在临床实践中最易获得,也是最常见的临床生化检测材料之一。人体血液含有丰富的内源性脂质代谢物,能反映机体代谢物的内暴露水平,是重要的脂质组学体液样本。血液样本具有较好的稳定性和代表性,能保证结果的可靠性。此外,在孕早期产检时孕妇也会常规接受多种项目的血液检查,因此本发明不会额外增加孕妇的检查次数。血液样本的易获得性、代表性、安全性、可负担性能保证受试者的依从性。
(4)本发明提出的基于孕早期血液脂质组的妊娠期糖尿病生物标记物相比既往报道的预测因子的预测能力有显著提高。因此该技术对疾病的早期预防、识别高危孕妇、疾病预测和治疗靶点的选择均具有较高价值。此外,本发明所述的生物标志物还具备用于监测妊娠期糖尿病患者对干预治疗效果的潜力。
附图说明
图1为本发明来源的流行病学设计和涉及到的统计方法,通过该流程筛选与妊娠期糖尿病显著相关的脂质标志物,并据此建立孕早期疾病的预测模型。
图2为本发明检测血液脂质组的色谱图,该图同时展示了多个离子通道,色谱峰峰形正常,无前延峰和拖尾峰,利用内标法定量。
图3为应用两独立样本t检验对孕早期血液脂质组在GDM组和非GDM组之间进行差异性分析及计算两组间的的差异倍数。以火山图的形式展示,横坐标为差异倍数,纵坐标为多重t检验后FDR校正P值的负对数。差异倍数为0时垂直虚线的右边为在GDM组显著上调的脂质,左边为显著下调的脂质。水平虚线代表了显著性P值,其上方代表显著变化的脂质,其下方代表无显著差异的脂质。
图4采用条件logistic回归估计脂质每增加一个log转换的标准差单位后对于妊娠期糖尿病风险的比值比,并根据脂质的化学结构(碳原子数量和双键数目)进行分组绘制了气泡图。每一个气泡代表一种脂质分子,以气泡的大小反映显著性水平,以气泡颜色的深浅反映比值比的大小。最终被筛选出来的10个脂质生物标志物以圆圈进一步做了强调。
图5为LASSO回归中惩罚项参数lambda依据10折交叉验证进行选取。图5中的A展示了随着lambda变化对应的模型中各个自变量系数的变化轨迹,图5中的B展示了根据交叉验证的均方差找到lambda最小值及其1个标准误内的lambda。
图6为通过单因素分析、多因素分析和机器学习的方法筛选血液脂质标志物的具体步骤及每一步筛选的候选脂质。
图7为最终筛选出的10个脂质生物标志物在GDM组和非GDM组之间浓度水平的比较,散点图展示了组内脂质的分布情况。通过两独立样本t检验,发现这10种脂质水平在GDM组和非GDM组均呈现显著差异(P<0.001)。
图8为最终筛选出的10个脂质生物标志物按照非GDM组四分位数进行分组,以第一四分位组为参照,计算其他分位组妊娠期糖尿病风险的比值比。其中五种脂质与妊娠期糖尿病风险降低有关,五种脂质与妊娠期糖尿病风险升高有关,且每种脂质的趋势性检验均具有统计学显著性(P<0.001)。
图9为构建的脂质风险评分在GDM组和非GDM组的分布和差异,经t检验发现两组间的差异具有统计学显著性(P<0.001)。
图10为通过ROC分析比较新构建的预测模型与传统模型、临床模型对妊娠期糖尿病预测效能的差异。基于传统妊娠期糖尿病风险因素的回归模型预测效能为0.653(95%CI:0.617,0.690);加入3种临床标志物(空腹血糖、空腹胰岛素和糖化血红蛋白)后预测模型预测效能达到0.701(95%CI:0.666,0.737);进一步加入10个脂质标志物后,预测效能显著提升至0.801(95%CI:0.772,0.829)。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明利用超高效液相色谱-质谱联用的方法共鉴定出366种血液脂质分子,作为孕早期妊娠期糖尿病生物标志物的候选脂质,共包含24种大类或亚类,主要涵盖甘油脂类、甘油磷脂、鞘脂类和固醇酯等类别。通过两独立样本的差异性检验,发现161种脂质分子在妊娠期糖尿病与非妊娠期糖尿病孕妇间存在差异,其中109种脂质在疾病组上调,52种在疾病组下调。
本发明中基于孕早期血液脂质组的妊娠期糖尿病生物标志物,血液1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)水平与妊娠期糖尿病发生风险增加有关,且脂质浓度每增加一个log转换后的标准差,多变量校正的妊娠期糖尿病风险的比值比即相对危险度分别为1.90、2.14、2.86、1.72、1.34;血液单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)、神经鞘磷脂SM(34:1)水平与妊娠期糖尿病发生风险降低有关,且脂质浓度每增加一个log转换后的标准差,多变量校正的妊娠期糖尿病风险的比值比分别为0.61、0.60、0.61、0.68和0.48。
1-烷基,2-酰基磷脂酰胆碱PC(O-36:1),其中O-36:1表示该结构中与甘油基团2个羟基相连的脂肪酸的总碳原子数为36,总双键数为1;1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6),其中P-38:6表示该结构中与甘油基团2个羟基相连的脂肪酸链的总碳原子数为38,其中2号位的总双键数为6;磷脂酰肌醇PI(40:6),其中40:6表示该结构中与甘油基团2个羟基相连的脂肪酸链的总碳原子数为40,总双键数为6;二酰甘油酯DG(18:0/18:1),其中18:0/18:1表示该结构中与甘油基团2个羟基相连的脂肪酸链,分别含有18个碳原子无双键及18个碳原子1个双键;1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5),其中O-40:5表示该结构中与甘油基团2个羟基相连的脂肪酸的总碳原子数为40,总双键数为5;单己糖基神经酰胺MHC(18:0),其中18:0表示单己糖基神经酰胺连接的脂肪酸链,含有18个碳原子且无双键;二己糖基神经酰胺DHC(24:1),其中24:1表示二己糖基神经酰胺连接的脂肪酸链,含有24个碳原子和1个双键;磷脂酰胆碱PC(40:7),其中40:7表示该结构中与甘油基团2个羟基相连的脂肪酸链的总碳原子数为40,总双键数为7;二己糖基神经酰胺DHC(24:0),其中24:0表示二己糖基神经酰胺连接的脂肪酸链,含有24个碳原子且无双键;神经鞘磷脂SM(34:1),其中34:1表示神经鞘磷脂连接的脂肪酸链,共含有34个碳原子和1个双键。
本发明中基于孕早期血液脂质组的妊娠期糖尿病生物标志物,将其分别通过回归系数进行加权求和获得基于妊娠期糖尿病的孕早期脂质风险评分。
本发明中基于孕早期血液脂质组的妊娠期糖尿病生物标志物,将其应用到传统和临床妊娠期糖尿病预测模型的优化改良中;已报道的孕早期妊娠期糖尿病预测模型由年龄、产次、家族糖尿病史、妊娠期糖尿病病史、吸烟、饮酒、体力活动、孕前体质指数、收缩压、高密度脂蛋白、甘油三脂、空腹血糖、糖化血红蛋白、空腹胰岛素等因子共同建立;将新鉴定出10种脂质分子作为预测因子进一步纳入模型,将模型的曲线下面积由0.701提高到0.801,重分类改善指标NRI(Net Reclassification Improvement)和综合判别改善指数IDI(Integrated Discrimination Improvement)均得到显著提高。
本发明中基于孕早期血液脂质组的妊娠期糖尿病生物标志物作为检测靶点在制备孕早期预测妊娠期糖尿病发病风险试剂盒中的应用。
本发明中基于孕早期血液脂质组的妊娠期糖尿病生物标志物作为靶点应用在开发治疗和/或预防妊娠期糖尿病的新药研制中;优选地,所述药物为调脂类药物或营养补充剂。
本发明中基于孕早期血液脂质组的妊娠期糖尿病脂质风险评分或预测模型用于识别孕早期妊娠期糖尿病高危孕妇及综合多种预测因子(人口学特征、生活方式和临床常用指标等)预测孕妇个体孕中期妊娠期糖尿病的发病风险;优选地,所述模型可以软件形式呈现。
本发明中基于孕早期血液脂质组的妊娠期糖尿病生物标志物的筛选系统,包括:
样本前处理模块:所述样本前处理模块用于血液样本中脂质化合物的提取;
样本脂质组学检测模块:所述脂质组学检测模块用于脂质化合物的检测和定量;
数据质控模块:所述数据质控模块用于脂质组学数据的实验室质量控制,确定每种分析物的定量限和批次内及批次间的变异系数;
定量数据前处理模块:所述定量数据前处理模块用于脂质组学定量数据的过滤和空白值的填补,对各个脂质分子的浓度进行正态化和标准化处理;
差异脂质分子筛选和分析模块:所述差异脂质分子筛选和分析模块用于经过两独立样本t检验、多变量校正的条件logistic回归和错误发现率(false discovery rate,FDR)校正的方法进行初筛,获得在GDM组和非GDM组间存在浓度差异的脂质和与疾病发生风险存在显著关联的脂质;
最小绝对收敛和选择算子(Least Absolute Shrinkage and SelectionOperator,LASSO)回归模型评估模块:所述LASSO回归模型评估模块,依次将LASSO算法应用于未校正的条件logistic回归和校正协变量的广义线性回归模型进行降维,每一步筛选均进行重复1000次的10折交叉验证,筛选获得与妊娠期糖尿病显著相关的血液脂质生物标志物;
脂质风险评分模块:所述脂质风险评分模块用于通过条件logistic回归评估脂质生物标志物与妊娠期糖尿病发病风险的关联,将各个脂质的回归系数进行加权求和得到脂质风险评分;
妊娠期糖尿病风险因素预测模块:所述妊娠期糖尿病风险因素预测模块用于在传统预测因子及临床预测指标基础上加入妊娠期糖尿病相关的早期脂质生物标志物重新构建新的预测模型,采用受试者工作特征曲线(receiver operating characteristiccurve,ROC)中的曲线下面积(AUC)以及其它的参数如NRI和IDI评价新建立的预测模型的预测效能及其变化。
本发明基于血液脂质组的孕早期妊娠期糖尿病生物标志物。其中脂质标志物的初筛过程是在24种大类/亚类366种脂质分子中进行的,主要涵盖了甘油脂类、甘油磷脂、鞘脂类和固醇酯等。
通过依次进行两独立样本t检验、多变量校正的条件logistic回归、错误发现率(False Discovery Rate,FDR)校正,筛选出188种在GDM组和非GDM组存在显著差异或与疾病发病风险有关的脂质。
通过LASSO算法进行机器学习和重复的交叉验证,筛选出10种与妊娠期糖尿病风险相关的血液脂质标志物。具体包括:血液单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)、神经鞘磷脂SM(34:1)水平与妊娠期糖尿病发生风险降低有关;血液1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)水平与妊娠期糖尿病发生风险增加有关。以上10个脂质分子每增加一个log转换后的标准差,多变量校正的比值比(Odds Ratio,OR),即相对危险度分别为:单己糖基神经酰胺MHC(18:0)(OR,0.61;95%CI,0.52,0.73)、二己糖基神经酰胺DHC(24:1)(OR,0.60;95%CI,0.50,0.71)、磷脂酰胆碱PC(40:7)(OR,0.61;95%CI,0.49,0.75)、二己糖基神经酰胺DHC(24:0)(OR,0.68;95%,0.58,0.80)、神经鞘磷脂SM(34:1)(OR,0.48;95%,0.39,0.59)、1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)(OR,1.90;95%,1.52,2.38)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)(OR,2.14;95%,1.73,2.65)、磷脂酰肌醇PI(40:6)(OR,2.86;95%,2.20,3.71)、二酰甘油酯DG(18:0/18:1)(OR,1.72;95%,1.39,2.11)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)(OR,1.34;95%,1.13,1.59)。
本发明的方法是基于中国一项大型的出生队列研究,采用配对的巢式病例对照研究设计。孕妇在孕早期纳入队列时均留取了血液样本。将孕中期通过75g糖耐量试验诊断为妊娠期糖尿病的孕妇归为病例组,并根据年龄(±3岁)、采样孕周(±4周)、采样时间(±4周)选取非妊娠期糖尿病的孕妇进行个体间的1:2匹配。将样本进行前处理提取血液中的脂质成分,并运用超高效液相色谱-质谱联用的检测技术对代谢物进行分离和检测,分析血液脂质组的构成、定量脂质分子浓度并分析其与妊娠期糖尿病的关联性。本发明所涉及到的研究方案得到了医学院伦理委员会的批准,所有参与队列并提供样本的孕妇均签署了知情同意书。
本次研究以血浆样本为例,血清和全血样本方法相同。
具体步骤为:
(1)血液样本的采集和保存:由经过统一培训的护士对孕妇进行静脉采血。使用EDTA包被的一次性真空抗凝管进行采血。采血后将采血管上下颠倒数次,与抗凝剂充分混匀。静置于4度冰箱,冷藏至少1小时后取出,放入高速离心机离心5分钟,控制转速为3000rpm。分离血浆于无菌ep管中并于-40℃冰箱中冷冻保存,半年内通过冷链运输转移至-80℃冰箱中长期保存,期间样本无冻融。若利用血清样本,则需通过真空促凝管进行采集和离心,步骤同上。
(2)血浆脂质的萃取:将血浆与混合内标和有机试剂混合物进行脂质提取和蛋白沉淀。该混合物经低温超声与离心后,取上清液转入仪器分析。
(3)上机检测:采用超高效液相色谱-质谱联用,配备色谱柱,与质谱仪联合使用。配备流动相A和流动相B。设定进样队列后自动进样,设定采样器温度、烘箱温度和流动相流速,并设置流动相的梯度。质谱仪系统配备了一个电喷雾电离探针,进行参数设置后采用多反应监测模式对脂类化合物进行检测和定量。为了进行质量控制,在整个实验过程中,添加溶剂空白,加有内标的溶剂加样,不加标内标的基质空白,以及用作测定样品内和测定间变异系数的质控样品的商业血浆样品。
(4)色谱图处理:使用图谱分析软件采用内标法定量,通过将每种分子的峰面积与相应内标的峰面积联系起来,计算出每种分子的浓度。
(5)通过流行病学常用统计方法和机器学习的算法筛选与妊娠期糖尿病关联的血液脂质生物标志物,并建立妊娠期糖尿病预测模型,分析流程如图1所示。
以下实施例均以血浆为例展开详细介绍。
实施例1:提取血浆脂质
将等分试样的20μL血浆加入11μL的内标混合物(含400pmol PC 14:0,PE 17:0,CE16:0(d7),COH(d7),BMP 14:0,SM 12:0,PG 14:0和PA 14:0;和50pmol TG 16:0/18:0/16:0(d5),LC 16:0(d3),GC 16:0(d3)],继续与244μL丁醇:甲醇(1:1,v/v)和10mM甲酸铵的混合物混合进行脂质提取和蛋白沉淀。样品混合物在冰水中充分涡流超声1小时,在20℃条件下14000×g离心10min。上清液转移进入仪器分析。
实施例2:超高效液相色谱-质谱联用上机检测
采用ExionLCTM AD超高效液相色谱-质谱联用(UHPLC,AB Sciex,多伦多,加拿大),配备Agilent Eclipse Plus C18柱(Agilent Technologies),并与QTRAP 5500质谱仪(AB Sciex,多伦多)联合使用。根据色谱条件使用ZORBAX Eclipse Plus C18柱(1.8μm,2.1×50mm,安捷伦),样品注入体积为2uL。流动相A和流动相B是水、乙腈和异丙醇的混合物,比例分别为50:30:20和1:9:90,A和B均包含10mM的甲酸铵。控制自动进样器为25℃,控制色谱柱的温度在45℃,以实现最佳的分析物溶解度和峰分离。流动相流速为0.3毫升/分钟,梯度如下:从25%B开始,在0.5分钟内完成从25%B增加到49%,然后在7.5分钟内增加到69%B,然后在3.8分钟内完成69%B增加到100%B,保持3分钟,紧接着在0.1分钟内减少到25%B并保持4.5分钟。每个样本的总运行时间为19.5分钟。
MS系统配备了一个电喷雾电离(ESI)探针,在正极模式下工作。脂类化合物的检测和定量采用多反应监测(MRM)模式。质谱仪参数设置如下:CUR:25psi,IonSpray电压:5500V,TEM:350℃,GS1:30psi,GS2:30psi。每个脂质具体的LC-MS/MS数据采集设置,如离子对、正离子模式优化去簇电压(volts)、聚焦电压(volts)、碰撞电压(volts)和碰撞室射出电压(volts)。
QA/QC程序包括溶剂空白,加有内标的溶剂加样,不加标内标的基质空白,以及用作测定样品内和测定间变异系数的QC样品的商业血浆样品。当每进入10个正式样本时,会插入一个质控样本,用于计算批次内和批次间的变异系数。内部质量控制数据表明,高于定量限(即1.8-17.2nmol/L)的分析物的批次内和批次间变异系数值分别小于14.7和16.8%。
最终,通过超高效液相色谱质谱联用的方法鉴定了涵盖24种大类/亚类共计366种脂质分子,脂质大类/亚类的名称、缩写及类内的Pearson关联系数如表1所示。
表1脂质大类/亚类的名称、缩写及在非GDM组类内的Pearson相关系数
实施例3:色谱图的处理
将实验数据导入analys1.6.3软件(AB Sciex),绘制标准曲线。血浆脂质组的色谱图如附图2所示。通过将每种分子的峰面积与相应内标的峰面积联系起来,采用内标法计算出每种分子的浓度。
实施例4:脂质生物标志物的筛选
通过流行病学常用统计方法和机器学习的算法筛选与妊娠期糖尿病关联的血浆脂质生物标志物,以下所有分析在Stata/SE 15.0(StataCorp,College Station,Texas)、SAS 9.4(SAS Institute,Cary,NC)和R软件3.6.1中完成。分析流程详述如下:
(1)数据的质控及正态化和标准化
检出率<80%或者批次内/批次间变异系数>20%分析物将会被过滤。在366种脂质中,38种脂质因检出率过低或质控变异系数过大被过滤,最终纳入下游分析的脂质为328种。在328脂质中,38种脂质缺失低于5%,3种脂质缺失介于5-20%。针对低于检出限的缺失值,将会使用该分析物检出限的二分之一进行浓度填补。由于脂质分子浓度通常为右偏态分布,因此浓度在进行分析前均需经过自然转化及Z分数(均值=0,标准差=1)转化。脂质大类/亚类在对照组内的相关系数,其中鞘脂类SM(r=0.76),甘油三酯TG(r=0.68),磷脂酰肌醇PI(r=0.63)和1-烯基,2-酰基磷脂酰胆碱PC(P)(r=0.62)类内的相关系数较高。此外,进一步发现甘油三酯TG和甘油二酯DG具有较高的类间相关性(r=0.59)。
(2)初步筛选候选脂质
将单因素差异分析和多因素回归分析相结合进行候选脂质的筛选,使用Benjamini–Hochberg假阳性率(false discovery rate,FDR)对多重检验进行校正,设置0.05为统计学显著界值。具体地,运用两独立样本t检验筛选在GDM组和非GDM组间显著的差异性脂质,如火山图所示(图3)展示了所有差异脂质并以不同灰度对性质进行区分:水平线以上代表了FDR校正后的P值(<0.05),在两组间具有显著差异的脂质共161个;垂直线以左代表了52个在病例组呈现下调的脂质,以右代表了109个在病例中呈现上调的脂质,且log2差异倍数的绝对值越大,代表该脂质在病例和对照间的含量差异大;对部分显著性水平高且含量差异大的脂质进行了标示。此外,运用协变量校正的条件logistic模型逐个进行回归筛选与妊娠期糖尿病发病风险相关的脂质,模型的协变量包括年龄、孕周、受教育程度、产次、父母糖尿病史、妊娠期糖尿病病史、吸烟状况(现在吸烟,过去吸烟,从不吸烟)、饮酒状况(现在饮酒、过去饮酒、从不饮酒)、体力活动水平(代谢当量)、孕前身体质量指数、收缩压、空腹血糖、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇和总甘油三酯,共筛选与妊娠期糖尿病关联的脂质154个(FDR校正的P值<0.05)。图4的气泡图展示了328种脂质分子与妊娠期糖尿病发病风险的关联强度和显著性,将同属一个大类/亚类的脂质进行分类展示。其中每个气泡代表一种脂质,气泡的大小代表FDR校正后的P值;气泡的颜色深度代表每个脂质每增加一个log标准差单位对于妊娠期糖尿病风险的比值比大小。选取在单因素差异分析或多因素回归中显著的188种脂质作为候选脂质进一步通过机器学习的算法进行筛选。
(3)机器学习降维筛选和验证
脂质组学数据具有高维度和高度共线性的特征。LASSO算法是一种用于避免过拟合和实现降维目的的正则化方法。基于匹配的巢式病例对照设计及潜在的混在因素可能影响脂质与妊娠期糖尿病的真实关联,本设计依次运用未校正的LASSO-条件logistic回归与校正混杂因素的LASSO-logistic回归方法进行数据降维与脂质生物标志物的筛选。为了防止过度拟合,LASSO惩罚项参数—lambda是通过10折交叉验证并使用交叉验证的均方误差作为损失函数确定的。具体而言,所有的样本被随机分成10个大小相同的部分。对于每个不同的lambda值,10个部分中有9个作为训练数据集来拟合模型参数,剩余的1个部分作为验证数据集来计算参数的均方误差。这个过程对每个lambda重复10次,并且保证依次使用不同的部分作为验证数据集。每次均能估计模型的均方误差,10折交叉验证后取10个均方误差的平均值。交叉验证的最小均方误差对应为lambda的最小值。为了得到预测变量数目较为简洁的预测模型,我们选择lambda.1se(即在lambda最小值的1个标准误差内,对应模型变量数最少的lambda)作为惩罚项参数。图5中的A展示了在进行一次LASSO回归中每个自变量系数随lambda值的变化轨迹,纵坐标是自变量系数的值,下横坐标是log(lambda),上横坐标是针对每个lambda的模型中非零系数的变量个数。由于需要在模型中对协变量进行校正,因此未对协变量进行惩罚,所有协变量均赋予的非零回归系数并始终保留在模型中。当变量系数等于零时代表该变量在对应lambda参数时未被纳入模型。图5中的B展示了在进行一次LASSO回归中模型的均方差随lambda变化的情况,根据交叉验证的均方差选择最优模型。尽管lambda最小时模型交叉验证的均方差最小,但模型不够简洁,将会不利于临床实践的开展。因此选择lambda.1se作为惩罚项参数能得到性能更优越且更简单的模型。考虑到交叉验证中数据集不同的分割方式会影响结果,且容易表现出较高的方差,因此将10折交叉验证的LASSO回归重复1000次,选取回归系数为非零且重现性100%作为脂质生物标记物,最终共筛选出10个稳健的脂质生物标志物。脂质组每一步的筛选情况和候选脂质数量以图6形式汇总。图7展示了10个脂质生物标志物在GDM组和非GDM组间浓度的水平和分布,所有脂质在两组之间均有显著的差异性。将妊娠期糖尿病作为因变量,筛选出的脂质生物标志物按照对照组的四分位数将人群分成四组,脂质作为分类变量纳入条件logistic回归模型。以各个脂质的第一四分位组为参照组,估计其它各组相对参照组的比值比;以每个脂质的四分位数的中位数替代该组,作为连续变量放入模型,评估各个脂质的线性趋势。图8展示了10个脂质生物标志物相比于第一四分位组,在第二、三、四分位组的比值比,且所有趋势性P值均<0.001。
为了进一步验证筛选结果的稳健性,我们采用了另外两种方法:弹性网络模型和随机森林模型。弹性网络是一种适用于高维数据变量选择的正则化方法。值得注意的是,弹性网络能够从一组相关性很高的变量中进行筛选,而能一定程度上克服LASSO算法针对高相关度的变量进行随机剔除的不足。弹性网络惩罚项由alpha控制(在0到1之间),alpha值可用于模型的优化。当alpha=1时,弹性网络等同于LASSO;当alpha=0时,等同于岭回归。利用准确度衡量并选择最优模型。在本设计中,弹性网络回归表明当α=1时能选取到最优模型,在此情况下结果即等同于LASSO回归,说明LASSO的结果具有可靠性。此外,随机森林是一种集成机器学习算法,广泛用于分类和回归。它是一种监督学习算法,可以生成和组合多个决策树,以获得更准确和稳定的预测。这种方法可以处理变量较多的大数据并估计每个变量的重要性。使模型平均精度下降高的变量被认为对样本分类起重要作用的因素。随机森林模型通过对所有候选脂质进行分析发现平均下降精度最高的3种脂质为PE(P-38:6)、SM 34:1和PC(O-36:1),它们均包含在通过LASSO回归鉴定的10种特征脂类中。此外,从随机森林模型中筛选到的前10种脂质中有5种与LASSO筛选的脂质相同,该结果证实了部分LASSO筛选结果的稳定性。但由于随机森林模型存在一定的随机性,可能会引起每次学习过程中变量的重要性发生变化,仅根据随机森林模型的结果可能会限制参数的选择和整合。因此在本设计中,仅用该模型的结果作为参考与部分验证。
本实施例分析可通过R包“clogitL1”和“glmnet”实现。
实施例5:构建脂质风险评分
为了便于理解,使用协变量校正的条件logistic回归估计各个脂质生物标志物与妊娠期糖尿病风险的关联。每个脂质的回归系数β作为权重,将脂质标准化后的值进行加权求和,以此构建脂质风险评分。
其中Xi代表各个脂质生物标志物的标准化值,βi代表各个脂质生物标志物对应的多变量校正模型中的回归系数,通过10个脂质标准化值加权和求得脂质风险评分。图9展示了GDM组和非GDM组脂质风险评分的差异和分布,GDM组的脂质风险评分显著高于非GDM组(P<0.001)。进一步分析发现,评分每增加一分对于妊娠期糖尿病风险的比值比为1.66(95%CI,1.50,1.85),即会增加66%患妊娠期糖尿病的风险。
实施例6:预测模型的建立和评估
以受试者工作特征曲线(receiver operating characteristic curve,ROC)来评估预测模型的准确率。横坐标X轴代表(1-特异性),即为假阳性率;纵坐标Y轴代表灵敏度,即为真阳性率。曲线下面积Area Under Curve(AUC)被用于表示预测的准确性,取值在0和1之间,AUC越大代表预测的准确率越高。AUC能够通过梯形法则求得,通常情况下AUC为0表示该方法对病例和非病例没有区分能力,0.7-0.8被认为区分度较好,0.8以上被认为区分度优异。当评估二分类logistic回归模型的预测能力,C-statistic的值就等于AUC。DeLong检验被用于比较各个模型间AUC的统计学差异。此外,进一步运用其它的参数比较各个预测模型预测能力的变化,如:重分类改善指标NRI(Net Reclassification Improvement)和综合判别改善指数IDI(Integrated Discrimination Improvement)。NRI表示比较的两个模型在正确分类研究对象个数上差距的量化,该指标有基于概率分类的或者基于概率值的;IDI表示两个模型在预测概率上(病人预测概率的提高和非病人预测概率的降低)差距的量化,该指标的表达方式有绝对值和相对值。在本设计中,孕早期妊娠期糖尿病传统预测模型由年龄、产次、家族糖尿病史、妊娠期糖尿病病史、吸烟、饮酒、体力活动、孕前体质指数、收缩压、高密度脂蛋白、甘油三脂、空腹血糖、糖化血红蛋白、空腹胰岛素等预测因子建立。由妊娠期糖尿病已知危险因素建立的传统预测模型的C-statistic为0.653(95%CI 0.617,0.690),当添加临床常用的血糖相关标志物后(孕早期空腹血糖、糖化血红蛋白和胰岛素)时,C-statistic提高为0.701(95%CI 0.666,0.737)(图10)。在前述模型基础上中继续添加10种新鉴定的脂质生物标志物作为预测因子,使C-statistic进一步提升到0.801(95%CI 0.772,0.829),DeLong检验表明相比传统模型和临床模型,新建立的预测模型预测效能显著提高:ΔAUC,9.9%;绝对IDI,13.3%;连续NRI为79.2%,分类NRI(<0.035、0.035~0.140和>0.140)的估计值为29.3%(所有的P<0.001)。建立预测模型后,采用ROC曲线中约登系数最大且敏感度高的值对应预测的P值为高危人群筛选的临界值。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.妊娠期糖尿病的孕早期血液脂质生物标志物组合在制备试剂盒中的应用;所述试剂盒联合传统预测因子和临床预测指标用于孕妇在孕早期预测其孕中期妊娠期糖尿病的发病风险;
所述生物标志物组合由1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)、单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)组成;
其中所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度升高;
其中所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度降低;
所述传统预测因子为年龄、产次、家族糖尿病史、妊娠期糖尿病病史、吸烟、饮酒、体力活动、孕前体质指数、收缩压、高密度脂蛋白、甘油三脂;
所述临床预测指标为孕早期空腹血糖、糖化血红蛋白和胰岛素。
2.如权利要求1所述的应用,其特征在于,所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)与妊娠期糖尿病风险升高相关。
3.如权利要求1所述的应用,其特征在于,所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)与妊娠期糖尿病风险降低相关。
4.如权利要求1所述的应用,其特征在于,所述生物标志物来源于血浆或血清。
5.孕妇在孕早期预测其孕中期妊娠期糖尿病的发病风险的系统,其特征在于,包括:
样本前处理模块:所述样本前处理模块用于血液样本中脂质化合物的提取;
样本脂质组学检测模块:所述脂质组学检测模块用于脂质化合物的检测和定量;
数据质控模块:所述数据质控模块用于脂质组学数据的质量控制,确定每种分析物的定量限和批次内及批次间的变异系数;
定量数据前处理模块:所述定量数据前处理模块用于脂质组学定量数据的过滤和空白值的填补,并对各个脂质分子的浓度进行正态化和标准化处理;
差异脂质分子筛选和分析模块:所述差异脂质分子筛选和分析模块用于经过两独立样本t检验、多变量校正的条件logistic回归和错误发现率校正的方法进行筛选,获得在妊娠期糖尿病组和非妊娠期糖尿病组间存在浓度差异的脂质和与疾病发生风险存在显著关联的脂质;
最小绝对收敛和选择算子回归模型评估模块:所述最小绝对收敛和选择算子回归模型评估模块用于依次将最小绝对收敛和选择算子算法应用于未校正的条件logistic回归和校正协变量的广义线性回归模型进行降维,每步筛选均进行多次重复的交叉验证,筛选获得妊娠期糖尿病的孕早期血液脂质生物标志物组合;所述生物标志物组合由1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)、1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)、单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)组成;其中所述1-烷基,2-酰基磷脂酰胆碱PC(O-36:1)、1-烯基,2-酰基磷脂酰乙醇胺PE(P-38:6)、磷脂酰肌醇PI(40:6)、二酰甘油酯DG(18:0/18:1)和1-烷基,2-酰基磷脂酰乙醇胺PE(O-40:5)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度升高;其中所述单己糖基神经酰胺MHC(18:0)、二己糖基神经酰胺DHC(24:1)、磷脂酰胆碱PC(40:7)、二己糖基神经酰胺DHC(24:0)和神经鞘磷脂SM(34:1)在妊娠期糖尿病患者组相较于非患者组的孕早期血液中浓度降低;
脂质风险评分模块:所述脂质风险评分模块用于通过条件logistic回归评估脂质生物标志物与妊娠期糖尿病发病风险的关联,将各个脂质的回归系数进行加权求和得到脂质风险评分;
妊娠期糖尿病风险因素预测模块:所述妊娠期糖尿病风险因素预测模块用于在传统预测因子及临床预测指标基础上加入上述妊娠期糖尿病相关的孕早期脂质生物标志物重新构建新的预测模型,采用受试者工作特征曲线中的曲线下面积以及重分类改善指标和综合判别改善指数参数评价建立的预测模型的预测效能;所述传统预测因子为年龄、产次、家族糖尿病史、妊娠期糖尿病病史、吸烟、饮酒、体力活动、孕前体质指数、收缩压、高密度脂蛋白、甘油三脂;所述临床预测指标为孕早期空腹血糖、糖化血红蛋白和胰岛素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110736608.0A CN113484511B (zh) | 2021-06-30 | 2021-06-30 | 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110736608.0A CN113484511B (zh) | 2021-06-30 | 2021-06-30 | 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113484511A CN113484511A (zh) | 2021-10-08 |
CN113484511B true CN113484511B (zh) | 2023-07-04 |
Family
ID=77936680
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110736608.0A Active CN113484511B (zh) | 2021-06-30 | 2021-06-30 | 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113484511B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114295755A (zh) * | 2021-12-30 | 2022-04-08 | 华中科技大学 | 一组用于妊娠期糖尿病早期诊断的标记物及其应用 |
CN117187381B (zh) * | 2023-11-03 | 2024-02-13 | 南京医科大学 | 一种用于妊娠期糖尿病早期辅助诊断的甲基化区域标志物组合及其应用 |
CN117233367B (zh) * | 2023-11-16 | 2024-02-09 | 哈尔滨脉图精准技术有限公司 | 妊娠期高血压风险评估的代谢标志物 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019027885A (ja) * | 2017-07-28 | 2019-02-21 | 国立大学法人千葉大学 | 妊娠糖尿病の発症リスクの診断用バイオマーカー |
CN113008972A (zh) * | 2021-02-26 | 2021-06-22 | 南芯芯仪(广州)制造有限公司 | 用于妊娠期糖尿病诊断的血清代谢标志物及其应用 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101802620A (zh) * | 2007-02-22 | 2010-08-11 | 特提斯生物科学公司 | 糖尿病状况的代谢标志物及其使用方法 |
US20120214821A1 (en) * | 2011-01-21 | 2012-08-23 | The Broad Institute, Inc. | Lipidomic Biomarkers of Diabetes |
WO2012122602A1 (en) * | 2011-03-15 | 2012-09-20 | Baker Idi Heart And Diabetes Institute Holdings Limited | Lipidomic method for assessing diabetes, pre-diabetes and obesity |
KR101355394B1 (ko) * | 2011-08-03 | 2014-01-29 | 서울대학교산학협력단 | 임신성 당뇨 조기 진단 정보를 제공하는 방법 및 임신성 당뇨 조기 진단 정보를 제공하는데 사용되는 임신성 당뇨 모니터링, 진단 및 스크리닝용 키트 |
CN103592389A (zh) * | 2013-11-15 | 2014-02-19 | 湖州市中心医院 | 一种基于妊娠糖尿病人血清lc/ms代谢组学分析方法 |
WO2015109116A1 (en) * | 2014-01-15 | 2015-07-23 | The Regents Of The University Of California | Metabolic screening for gestational diabetes |
GB201522190D0 (en) * | 2015-12-16 | 2016-01-27 | Patia Biopharma S A De C V | Methods, tools and systems for the prediction and assessment of gestational diabetes |
US20200348316A1 (en) * | 2017-11-20 | 2020-11-05 | Zora Biosciences Oy | Methods for prediction and early detection of diabetes |
EP3809880A4 (en) * | 2018-06-22 | 2022-03-23 | Fonterra Co-Operative Group Limited | USE OF POLAR LIPIDS TO TREAT OR PREVENT GESTATIONAL DIABETES MELLITUS |
EP3852896A1 (en) * | 2018-09-21 | 2021-07-28 | Waters Technologies Corporation | System and method for lipid quantification |
CN109709228B (zh) * | 2019-01-14 | 2022-06-14 | 上海市内分泌代谢病研究所 | 脂质联合标志物在制备诊断糖尿病的检测试剂或检测物的用途 |
CN110808097A (zh) * | 2019-10-30 | 2020-02-18 | 中国福利会国际和平妇幼保健院 | 一种妊娠期糖尿病预测系统及方法 |
CN113009162B (zh) * | 2021-02-26 | 2022-07-12 | 南芯芯仪(广州)制造有限公司 | 一种用于妊娠期糖尿病诊断的血清代谢标志物及其应用 |
-
2021
- 2021-06-30 CN CN202110736608.0A patent/CN113484511B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019027885A (ja) * | 2017-07-28 | 2019-02-21 | 国立大学法人千葉大学 | 妊娠糖尿病の発症リスクの診断用バイオマーカー |
CN113008972A (zh) * | 2021-02-26 | 2021-06-22 | 南芯芯仪(广州)制造有限公司 | 用于妊娠期糖尿病诊断的血清代谢标志物及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN113484511A (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113484511B (zh) | 妊娠期糖尿病的孕早期血液脂质生物标志物的筛选及应用 | |
Liu et al. | Comprehensive analysis of serum metabolites in gestational diabetes mellitus by UPLC/Q-TOF-MS | |
Kenny et al. | Novel biomarkers for pre-eclampsia detected using metabolomics and machine learning | |
US20190072569A1 (en) | Biomarkers of autism spectrum disorder | |
Wang et al. | Plasma lipidomics in early pregnancy and risk of gestational diabetes mellitus: A prospective nested case–control study in Chinese women | |
CA2767763A1 (en) | Method for predicting the likelihood of an onset of an inflammation associated organ failure | |
Wanichthanarak et al. | Accounting for biological variation with linear mixed-effects modelling improves the quality of clinical metabolomics data | |
WO2011072177A2 (en) | Biomarker assay for diagnosis and classification of cardiovascular disease | |
EP2164977A2 (en) | Biomarkers for pre-diabetes, cardiovascular diseases, and other metabolic-syndrome related disorders and methods using the same | |
WO2011063470A1 (en) | Lipid biomarkers for stable and unstable heart disease | |
CN113156018B (zh) | 一种肝胆疾病诊断模型的建立方法及诊断系统 | |
CN113009162B (zh) | 一种用于妊娠期糖尿病诊断的血清代谢标志物及其应用 | |
Lizewska et al. | Maternal plasma metabolomic profiles in spontaneous preterm birth: preliminary results | |
CN113008972A (zh) | 用于妊娠期糖尿病诊断的血清代谢标志物及其应用 | |
Yang et al. | Establishment of reference intervals of 24 chemistries in apparently healthy adult Han population of Northern China | |
Liang et al. | The fecal metabolome is associated with gestational diabetes mellitus | |
CN114167066B (zh) | 生物标志物在制备妊娠糖尿病诊断试剂中的用途 | |
CN117412703A (zh) | 利用类视黄醇代谢物早期预测早产的方法 | |
US20110136241A1 (en) | Type ii diabetes molecular bioprofile and method and system of using the same | |
CN114166977B (zh) | 预测妊娠个体血糖值的系统 | |
EP2339352A1 (en) | Use of endogenous metabolites for early diagnosing sepsis | |
CN114047263A (zh) | 代谢标志物在制备用于诊断ais的检测试剂或检测物的用途及试剂盒 | |
Long et al. | Exploration of the shared gene signatures between myocardium and blood in sepsis: evidence from bioinformatics analysis | |
CN113866285B (zh) | 用于糖尿病诊断的生物标志物及其应用 | |
US20230043689A1 (en) | Biomarkers for predicting intensive care unit stay duration for mechanically ventilated covid-19 patients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |