CN116559330A - 用于非综合征型唇腭裂产前无创诊断的脂质分子标志物及其应用 - Google Patents
用于非综合征型唇腭裂产前无创诊断的脂质分子标志物及其应用 Download PDFInfo
- Publication number
- CN116559330A CN116559330A CN202310598740.9A CN202310598740A CN116559330A CN 116559330 A CN116559330 A CN 116559330A CN 202310598740 A CN202310598740 A CN 202310598740A CN 116559330 A CN116559330 A CN 116559330A
- Authority
- CN
- China
- Prior art keywords
- lipid
- palate
- diagnosis
- cleft lip
- prenatal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000002632 lipids Chemical class 0.000 title claims abstract description 82
- 206010009260 Cleft lip and palate Diseases 0.000 title claims abstract description 35
- 208000016653 cleft lip/palate Diseases 0.000 title claims abstract description 35
- 238000003745 diagnosis Methods 0.000 title claims abstract description 24
- 239000003147 molecular marker Substances 0.000 title claims abstract description 11
- 210000003754 fetus Anatomy 0.000 claims abstract description 26
- 238000010801 machine learning Methods 0.000 claims abstract description 20
- IQGPMZRCLCCXAG-RUZDIDTESA-N 2-stearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[C@H](CO)COP([O-])(=O)OCC[N+](C)(C)C IQGPMZRCLCCXAG-RUZDIDTESA-N 0.000 claims abstract description 14
- 210000002966 serum Anatomy 0.000 claims abstract description 14
- 238000012216 screening Methods 0.000 claims abstract description 13
- 208000011580 syndromic disease Diseases 0.000 claims abstract description 11
- 238000003793 prenatal diagnosis Methods 0.000 claims abstract description 10
- 238000009609 prenatal screening Methods 0.000 claims abstract description 10
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 17
- 239000000523 sample Substances 0.000 claims description 16
- 238000001195 ultra high performance liquid chromatography Methods 0.000 claims description 16
- 238000010200 validation analysis Methods 0.000 claims description 11
- 150000002500 ions Chemical class 0.000 claims description 8
- 238000004949 mass spectrometry Methods 0.000 claims description 8
- 238000011282 treatment Methods 0.000 claims description 6
- 210000004369 blood Anatomy 0.000 claims description 4
- 239000008280 blood Substances 0.000 claims description 4
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 238000003759 clinical diagnosis Methods 0.000 claims description 4
- 238000000132 electrospray ionisation Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000001605 fetal effect Effects 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 239000003550 marker Substances 0.000 claims description 4
- 239000002207 metabolite Substances 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 210000004381 amniotic fluid Anatomy 0.000 claims description 2
- 239000012472 biological sample Substances 0.000 claims description 2
- 210000001808 exosome Anatomy 0.000 claims description 2
- 239000007788 liquid Substances 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 238000005173 quadrupole mass spectroscopy Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 10
- 238000004422 calculation algorithm Methods 0.000 abstract description 3
- 238000012795 verification Methods 0.000 abstract description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- 238000003066 decision tree Methods 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 238000007477 logistic regression Methods 0.000 description 6
- 238000002156 mixing Methods 0.000 description 5
- 208000032170 Congenital Abnormalities Diseases 0.000 description 4
- 206010010356 Congenital anomaly Diseases 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 238000002790 cross-validation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000036244 malformation Effects 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 206010009269 Cleft palate Diseases 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 206010009259 cleft lip Diseases 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 239000008925 shengjing Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 241000023308 Acca Species 0.000 description 1
- 206010061619 Deformity Diseases 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 1
- 206010044041 Tooth hypoplasia Diseases 0.000 description 1
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 1
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 1
- 210000001909 alveolar process Anatomy 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000007698 birth defect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000104 diagnostic biomarker Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000002013 hydrophilic interaction chromatography Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000000276 neural tube Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 239000012074 organic phase Substances 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000000405 serological effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
- G01N30/7233—Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
- G01N30/724—Nebulising, aerosol formation or ionisation
- G01N30/7266—Nebulising, aerosol formation or ionisation by electric field, e.g. electrospray
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
- G01N30/8679—Target compound analysis, i.e. whereby a limited number of peaks is analysed
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8696—Details of Software
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/88—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86
- G01N2030/8809—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample
- G01N2030/8813—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials
- G01N2030/8822—Integrated analysis systems specially adapted therefor, not covered by a single one of the groups G01N30/04 - G01N30/86 analysis specially adapted for the sample biological materials involving blood
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Immunology (AREA)
- General Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Dispersion Chemistry (AREA)
- Library & Information Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了用于非综合征型唇腭裂胎儿产前无创诊断的脂质分子标志物(FA(20:4)、LPC(18:0)和PC(16:0e_22:0))及其应用,属于医药生物技术领域。本发明首先利用脂质组学检测平台的非靶和靶向脂质技术,分别在训练队列和验证队列人群血清样本中检测并筛选差异表达的脂质分子。然后利用机器学习的算法,把脂质组学筛选出来的分子标志物整合在一起,优化、筛选出更有诊断价值的脂质分子,并建立一个通用的非综合征唇腭裂风险预警模型。为非综合征型唇腭裂胎儿产前筛查、预警和诊断提供了新的途径与策略,具有重大的临床意义。
Description
技术领域
本发明属于医药生物技术领域,具体涉及用于非综合征型唇腭裂胎儿产前无创诊断的脂质分子标志物(FA(20:4)、LPC(18:0)和PC(16:0e_22:0))及其应用。
背景技术
非综合征型唇腭裂是我国常见重大胎儿发育畸形,胎儿的呼吸、进食和语言等功能均受损害,并伴有牙齿发育不全,产后孩子要经历多次颅面部整形手术,严重损害出生人口生活质量。因此,研究非综合征型唇腭裂的胚胎早期无创诊断方法,使其能够在严重结构异常或不可逆损伤之前获得诊断,制定相应的胚胎早期治疗和预防新策略,对于减少畸形的致残率、提高人口素质具有极其重要意义。
建立早期无创的先天畸形筛查方法,一直是人们不断追求的理想目标。虽然目前影像学技术的发展非常迅速,使一些先天畸形的诊断时间获得提前,但仍无法达到早期筛查和诊断的要求。上颌骨牙槽突遮挡造成超声光束很难到达腭裂部位,因而对单发腭裂检出率极低。因此寻找早期无创的产前诊断分子标志物尤为重要,也为早期咨询及治疗提供依据。母体血清学检查是一种无创性产前诊断方法,孕妇易接受,适用于大范围产前筛查。因此,国内外许多学者都在致力于发现新的诊断特异性标志物的研究,但目前为止除了神经管畸形和唐氏综合症可以利用血清甲胎蛋白进行筛查外,其它出生缺陷尚没有在临床获得应用的诊断分子标志物。
近年来随着各种组学技术突飞猛进的发展,一系列新技术融入到高通量的组学研究中,使疾病诊断分子标志物筛查工作有了新的突破,也为目前大家非常重视的转化医学研究提供了极其重要的手段。脂质组学是研究病理变化和筛选疾病诊断生物标志物的一种很有前途的高通量组学研究方法。脂类包含许多亚类,在哺乳动物细胞中具有重要的生物学功能,如能量储存、构成膜结构和信号分子通路等。脂质组学包括非靶向脂质组学和靶向脂质组学。由于非靶向脂质组学的代谢物覆盖范围广,以及靶向脂质组学的结果可靠性,两种检测方法的整合应用是疾病相关分子标志物研究的有力策略。机器学习是人工智能的一个重要分支,可对高通量组学得到的庞大数据进行学习分析,进而预测得到较好的诊断模型。目前,脂质组学和机器学习联合应用是较新的研究策略。孕妇血清脂质组学研究可以充分考虑母体与胎儿两方面因素,从众多复杂的脂质中筛选出一组改变明显的关键性分子,综合分析其变化规律,将有利于确定疾病早期诊断和预后判定的分子标志物,也是未来将复杂的分子标志物转化为临床应用的趋势所在。
发明内容
针对上述问题,本发明提供本了用于非综合征型唇腭裂胎儿产前无创诊断的脂质分子标志物FA(20:4)、LPC(18:0)和PC(16:0e_22:0),所述标志物可单独或联合用于先天畸形产前筛查,为非综合征型唇腭裂治疗提供新的靶点。
为了实现上述目的,本发明提供了如下技术方案。
本发明公开了用于非综合征型唇腭裂胎儿产前无创诊断的分子标志物,是包括FA(20:4)、LPC(18:0)和PC(16:0e_22:0)一种或多种脂质组成。
进一步地,所述的分子标志物在制备用于非综合征型唇腭裂胎儿产前筛查、预警、临床诊断和生化检验产品中的应用。
进一步地,所述产品包括试剂、试剂盒、UHPLC Nexera LC-30A超高效液相色谱系统和超高效液相色谱-三重四级杆质谱联用仪(UHPLC-QTRAP MS)检测样本中的代谢物,通过质谱技术、机器学习相关方法对与非综合征型唇腭裂胎儿产前无创诊断相关的脂质分子标志物进行检测、验证及分析。
进一步地,所述非综合征型唇腭裂胎儿产前筛查、预警、临床诊断和生化检验的标本包括孕妇血液、外泌体、尿液、羊水和畸形胎儿或患儿标本。
本发明还公开了一种权利要求1所述的用于非综合征型唇腭裂胎儿产前无创诊断的分子标志物的筛选方法,其特征在于,具体步骤包括:
(1)获取受试者的血清生物样本进行预处理;
(2)采用UHPLC Nexera LC-30A超高效液相色谱系统进行分离,分别采用电喷雾电离正离子和负离子模式进行检测;样品经UHPLC分离后采用Q Exactive plus质谱仪进行质谱分析;采用LipidSearchsoftware version 4.1进行峰识别、脂质鉴定(二级鉴定)、峰提取、峰对齐、定量和定性处理,检测得到31类脂质亚类,1302个脂质分子;
(3)对训练队列中(2)检测到的脂质分子进行机器学习,以期筛选具有较好诊断效能的产前诊断脂质标志物。采用8种机器学习的方法(Lasso、RF、LR、Ridge、Corr、DT、CHI和MIC)筛选排名前50的脂质特征,后用鲁棒性秩聚合方法(RRA)对筛选到的脂质特征进行融合排名,去除同分异构体后,采用7种分类器(NB、SVM、RF、DT、LR、ADA、KNN)对脂质特征进行学习,其中NB分类器的学习效能最佳,35个脂质特征可达到较高的ROC曲线下面积;
(4)进一步扩大样本,在验证队列中对(3)得到的35个潜在诊断脂质分子标志物进行靶向脂质组学验证;对验证得出的16个脂质,采用以上8种机器学习的方法筛选脂质特征再次进行机器学习,后用RRA的方法对筛选到的脂质特征进行融合排名;接着使用以上7种分类器对脂质特征进行学习,其中NB分类器的学习效能最佳,3个脂质特征,即FA(20:4)、LPC(18:0)和PC(16:0e_22:0)组合。
本发明还公开了一种检测用于非综合征型唇腭裂胎儿产前无创诊断的分子标志物的试剂在制备胎儿产前无创诊断工具中的应用,所述标志物包括FA(20:4)、LPC(18:0)和PC(16:0e_22:0)一种或多种脂质组成。
本发明还公开了一种用于非综合征型唇腭裂胎儿产前筛查、预警和诊断的工具,其特征在于,所述工具能够检测FA(20:4)、LPC(18:0)和PC(16:0e_22:0)脂质分子表达量。
与现有技术相比本发明的有益效果。
本发明首次发现并证实在孕妇血中脂质代谢物,包括(FA(20:4)、LPC(18:0)和PC(16:0e_22:0))的表达异常与非综合征型唇腭裂胎儿的发生具有密切相关性,验证的样本量多,结果准确。
本发明首次使用非靶脂质组学和靶向脂质组学联合筛选非综合征型唇腭裂的产前诊断脂质分子标志物。
本发明整合多学科技术,生物领域联合计算机学科。利用多种机器学习算法构建非综合征型唇腭裂的产前诊断分子标志物,为非综合征型唇腭裂胎儿产前筛查、预警和诊断提供了新的途径与策略。
本发明利用脂质组学检测平台的非靶和靶向脂质技术,通过对比疾病患者和正常人群的血清脂质表达差异,容易分析出哪个脂质表达的异常与疾病相关。因此,在脂质组学检测中获知上述分子表达异常与非综合征型唇腭裂相关也属于使用了本发明的新用途,同样在本发明的保护范围之内。
本发明利用机器学习的算法,把脂质组学筛选出来的分子标志物整合在一起,优化、筛选出更有诊断价值的分子,并建立一个通用的非综合征唇腭裂风险预警模型。
附图说明
图1. 非靶向脂质组学筛选的脂质特征。(A)检测到31个脂质亚类,共含有1302个脂质。(B-F)在非综合征型唇腭裂组中差异表达的5个脂质亚类。(数据的表示形式为mean± SEM;n = 30,每组;*代表p<0.05与对照组相比;**代表p<0.01与对照组相比)。
图2. 不同分类器下的平均AUC和训练曲线图。(A)不同分类器随特征数目变化的AUC折线图。(B-H)不同分类器训练曲线图。
图3. 35个特征在NB分类器下五折交叉验证ROC曲线结果。
图4. 3个特征在不同分类器下AUC结果。(A)不同分类器随特征数目变化的AUC折线图。(B)3个特征在NB分类器下五折交叉验证AUC结果。
图5. 3个特征在NB分类器下五折交叉验证ROC曲线结果和内源性表达及部分依赖曲线。(A)NB分类器下3个脂质特征的AUC折线图。(B-D)3个脂质在验证队列中的内源性表达水平。(E)3个脂质特征的部分依赖曲线。
具体实施方式
下面结合实施例和附图对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。所用孕妇血清标本来源于盛京出生队列样本库,并获得中国医科大学附属盛京医院伦理委员会批准(批准号:2017PS264K)。
实施例1应用非靶向脂质组学技术筛选训练队列中的脂质诊断分子标志物。
1、分离血清。
采集全血样品于促凝管中,轻柔颠倒混匀后,使用4℃低温离心机,1600×g离心10min,离心后收集上清(血清)至新的EP管中,16000×g离心10min去除细胞碎片,将血清分装到多个离心管中,于-80℃低温冰箱中冻存。
2、非靶向脂质组学样本预处理。
取30例孕有健康胎儿的孕妇血清和30例孕有非综合征型唇腭裂胎儿的孕妇血清作为训练队列,其临床特征见表1,孕周、孕妇年龄和BMI指数均无统计学差异。血清在4℃环境缓慢解冻后,分别取样本100µL,加入240µL预冷甲醇,涡旋混合,加入800µL甲基叔丁基醚涡旋混合,加入200µL水,涡旋混合,室温放置20min,8000g 10℃离心15min,取上层有机相,氮气吹干,质谱分析时加入200µL异丙醇溶液复溶,涡旋,8000g 10℃离心15min,取上清进样分析。
表1. 用于非靶向脂质组学检测的孕妇临床特征
。
3、非靶向脂质组学色谱-质谱分析与数据处理。
样品采用UHPLC Nexera LC-30A超高效液相色谱系统进行分离。分别采用电喷雾电离正离子和负离子模式进行检测。样品经UHPLC分离后采用Q Exactive plus质谱仪进行质谱分析。采用LipidSearch software version 4.1进行峰识别、脂质鉴定(二级鉴定)、峰提取、峰对齐、定量和定性处理。提取得到的数据,删除RSD>30%的脂质分子。
4、非靶向脂质组学筛选的脂质特征。
检测到31类脂质亚类,1302个脂质分子。有5类脂质亚类表达具有显著差异,分别是AcCa、CerG2GNAc1、LPC、LPE和So(图1)。所有脂质分子中满足差异倍数FC≥1.2或≤0.83,p<0.05的脂质有181个。我们对所有数据进行采用3sigma原则进行异常值发现,对所有异常值采用K-NearestNeighbor(KNN)进行填充,邻居数目设置为5,并对所有数据采用log2变换,消除特征之间的数值差异。随后,采用前文提到的8种机器学习方法(Lasso、RF、LR、Ridge、Corr、DT、CHI和MIC)对这181个特征进行特征选择,其中对于Lasso和Ridge方法惩罚项系数设置为0.01,其余均采用scikit-learn默认参数。对于每个方法我们保留最优的前50个特征,随后利用鲁棒性秩聚合方法(RRA)融合这些排名列表,得到最终的特征排名。使用7种分类器(NB、SVM、RF、DT、LR、ADA、KNN)进行学习,发现NB分类器没有出现过拟合的风险,并且取得了较高的分类准确率,在训练集和测试集上分布比较均衡。每个分类器下各个评价指标的得分情况见表2。因此,选择NB分类器进行后续机器学习,前35个脂质分子可达到较好的诊断效能(图2)。NB分类器下的五折交叉验证AUC曲线如图3所示。ROC曲线下面积可达到0.95,特异性和敏感性分别为87%和90%。
表2. 35个脂质分子在不同分类器下的详细评价指标
缩写释义:
NB: Gaussian Naive Bayes; SVM: Support Vector Machine; RF: RandomForest; DT: Decision Tree; LR: Logistic Regression; ADA: Adaboost; KNN:K-NearestNeighbor.
ACC: Accuracy; TPR: True Positive Rate; TNR: True Negative Rate; FPR:False Positive Rate; FNR: False Negative Rate; AUC: Area Under the Curve.。
实施例2应用靶向脂质组学技术检测验证队列中的脂质诊断分子标志物。
1、验证队列中的孕妇特征及样本预处理。
验证队列中共纳入孕有健康胎儿的孕妇和孕有非综合征型唇腭裂胎儿的孕妇各20例,其临床特征见表3,孕周、孕妇年龄和BMI指数均无统计学差异。分离血清步骤同实施例1。样本在4℃环境下缓慢解冻后,取适量样本加入200µL甲醇,涡旋混合,加入20µL内标混合物,后续预处理步骤同实施例1。
表3. 用于靶向脂质组学检测的孕妇临床特征
。
2、靶向脂质组学色谱-质谱分析与数据处理。
在UHPLC Nexera LC-30A超高效液相色谱系统上,利用C18和HILIC NH2色谱柱对样品进行分离。分别采用电喷雾电离正离子和负离子模式进行检测。样品经UHPLC分离后采用AB 6500+QTRAP质谱仪进行质谱分析。使用Sciex OS软件对MRM原始数据进行峰提取,得到各物质的峰面积和内标峰面积的比值,再进一步计算各物质的含量。
3、靶向脂质组学验证的脂质特征。
对非靶向脂质组学和实施例1中采用的机器学习后的35个脂质在验证队列中进行扩大样本靶向验证,经过靶向脂质组学验证后共有16个脂质分子在非综合征型唇腭裂组中有统计学差异,并且表达趋势与非靶结果一致(表4)。
表4. 靶向脂质组学验证后有差异表达的脂质
。
实施例3使用机器学习构建非综合征型唇腭裂预警模型。
对靶向脂质组学验证得到的16个脂质分子采用以上8种机器学习的方法筛选脂质特征再次进行机器学习发现,NB分类器下的诊断效率较好(图4),最终有3个脂质分子组合FA(20:4)、LPC(18:0)和PC(16:0e_22:0)可达到较好的诊断效率,ROC曲线下面积可达到0.97,特异性为84%,敏感性为80%(图5A)。这3个脂质分子在非综合征型唇腭裂组中显著低表达(图5B-5D)。部分依赖图中,我们所选的3个脂质分子的相应曲线平均斜率比较高,对分类贡献程度较高,可以认为特征的重要程度较高(图5E)。以上结果说明,FA(20:4)、LPC(18:0)和PC(16:0e_22:0)联合应用可以构建产前非综合征型唇腭裂的诊断分子标志物。
Claims (7)
1.用于非综合征型唇腭裂胎儿产前无创诊断的分子标志物,是包括FA(20:4)、LPC(18:0)和PC(16:0e_22:0)一种或多种脂质组成。
2.如权利要求1所述的标志物,其特征在于,所述的分子标志物在制备用于非综合征型唇腭裂胎儿产前筛查、预警、临床诊断和生化检验产品中的应用。
3.如权利要求2所述的标志物,其特征在于,所述产品包括试剂、试剂盒、UHPLC NexeraLC-30A超高效液相色谱系统和超高效液相色谱-三重四级杆质谱联用仪(UHPLC-QTRAP MS)检测样本中的代谢物,通过质谱技术、机器学习相关方法对与非综合征型唇腭裂胎儿产前无创诊断相关的脂质分子标志物进行检测、验证及分析。
4.如权利要求2所述的标志物,其特征在于,所述非综合征型唇腭裂胎儿产前筛查、预警、临床诊断和生化检验的标本包括孕妇血液、外泌体、尿液、羊水和畸形胎儿或患儿标本。
5.一种权利要求1所述的用于非综合征型唇腭裂胎儿产前无创诊断的分子标志物的筛选方法,其特征在于,具体步骤包括:
(1)获取受试者的血清生物样本进行预处理;
(2)采用UHPLC Nexera LC-30A超高效液相色谱系统进行分离,分别采用电喷雾电离正离子和负离子模式进行检测;样品经UHPLC分离后采用Q Exactive plus质谱仪进行质谱分析;采用LipidSearch software version 4.1进行峰识别、脂质鉴定(二级鉴定)、峰提取、峰对齐、定量和定性处理,检测得到31类脂质亚类,共包括1302个脂质分子;
(3)对训练队列中(2)检测到的脂质分子进行机器学习,以期筛选具有较好诊断效能的产前诊断脂质标志物;采用8种机器学习的方法(Lasso、RF、LR、Ridge、Corr、DT、CHI和MIC)筛选排名前50的脂质特征,后用鲁棒性秩聚合方法(RRA)对筛选到的脂质特征进行融合排名,去除同分异构体后,采用7种分类器(NB、SVM、RF、DT、LR、ADA、KNN)对脂质特征进行学习,其中NB分类器的学习效能最佳,35个脂质特征可达到较高的ROC曲线下面积;
(4)进一步扩大样本,在验证队列中对(3)得到的35个潜在诊断脂质分子标志物进行靶向脂质组学验证;对验证得出的16个脂质,采用以上8种机器学习的方法筛选脂质特征再次进行机器学习,后用RRA的方法对筛选到的脂质特征进行融合排名;接着使用以上7种分类器对脂质特征进行学习,其中NB分类器的学习效能最佳,3个脂质特征,即FA(20:4)、LPC(18:0)和PC(16:0e_22:0)组合。
6.一种检测用于非综合征型唇腭裂胎儿产前无创诊断的分子标志物的试剂在制备胎儿产前无创诊断工具中的应用,所述标志物包括FA(20:4)、LPC(18:0)和PC(16:0e_22:0)一种或多种脂质组成。
7.一种用于非综合征型唇腭裂胎儿产前筛查、预警和诊断的工具,其特征在于,所述工具能够检测FA(20:4)、LPC(18:0)和PC(16:0e_22:0)脂质分子表达量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310598740.9A CN116559330A (zh) | 2023-05-25 | 2023-05-25 | 用于非综合征型唇腭裂产前无创诊断的脂质分子标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310598740.9A CN116559330A (zh) | 2023-05-25 | 2023-05-25 | 用于非综合征型唇腭裂产前无创诊断的脂质分子标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116559330A true CN116559330A (zh) | 2023-08-08 |
Family
ID=87486067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310598740.9A Pending CN116559330A (zh) | 2023-05-25 | 2023-05-25 | 用于非综合征型唇腭裂产前无创诊断的脂质分子标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116559330A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933160A (zh) * | 2023-09-19 | 2023-10-24 | 中国农业科学院农产品加工研究所 | 基于脂质特征-机器学习的肉品种和部位鉴别方法 |
-
2023
- 2023-05-25 CN CN202310598740.9A patent/CN116559330A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116933160A (zh) * | 2023-09-19 | 2023-10-24 | 中国农业科学院农产品加工研究所 | 基于脂质特征-机器学习的肉品种和部位鉴别方法 |
CN116933160B (zh) * | 2023-09-19 | 2024-01-09 | 中国农业科学院农产品加工研究所 | 基于脂质特征-机器学习的肉品种和部位鉴别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109072479A (zh) | 使用循环微粒对自发性早产风险进行分层 | |
KR101817785B1 (ko) | 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법 | |
Horgan et al. | An overview of proteomic and metabolomic technologies and their application to pregnancy research | |
EP3746048A1 (en) | Use of circulating microparticles to stratify risk of spontaneous preterm birth | |
AU2010277664A1 (en) | Method for predicting the likelihood of an onset of an inflammation associated organ failure | |
CN100410663C (zh) | 蛋白质组的分析方法 | |
CN113008972B (zh) | 用于妊娠期糖尿病诊断的血清代谢标志物及其应用 | |
US20150087553A1 (en) | Early trimester screening for early- and late-onset preeclampsia | |
CN113009162B (zh) | 一种用于妊娠期糖尿病诊断的血清代谢标志物及其应用 | |
CN110632326A (zh) | 用于质谱诊断地中海贫血症的特征蛋白标记组合物及其诊断产品 | |
CN116559330A (zh) | 用于非综合征型唇腭裂产前无创诊断的脂质分子标志物及其应用 | |
JP2022512890A (ja) | 試料の品質評価方法 | |
Li et al. | Analysis of biomarkers for congenital heart disease based on maternal amniotic fluid metabolomics | |
CN113156018A (zh) | 一种肝胆疾病诊断模型的建立方法及诊断系统 | |
Iles et al. | Direct and rapid mass spectral fingerprinting of maternal urine for the detection of Down syndrome pregnancy | |
WO2006086731A2 (en) | Method for identifying the risk of preterm delivery | |
LU101772B1 (en) | Non-invasive biomarkers for identification/prewarning of dairy cows with fatty liver disease | |
US20160018413A1 (en) | Methods of Prognosing Preeclampsia | |
EP4337784A1 (en) | Salivary metabolites are non-invasive biomarkers of hcc | |
Buhimschi | Using SELDI-TOF mass spectrometry on amniotic fluid and for clinical proteomics and theranostics in disorders of pregnancy | |
CN107003319B (zh) | 提供妊娠预测的方法 | |
CN113748344A (zh) | 肥胖孕妇先兆子痫风险的检测 | |
EP3750168A1 (en) | A system and method of generating a model to detect, or predict the risk of, an outcome | |
Thomas | Metabolic Biomarkers for the Prediction of Spontaneous Preterm Birth | |
CN117007810B (zh) | 用于预测静脉内平滑肌瘤进展的生物标志物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |