CN115097147B - 预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型 - Google Patents
预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型 Download PDFInfo
- Publication number
- CN115097147B CN115097147B CN202211016042.5A CN202211016042A CN115097147B CN 115097147 B CN115097147 B CN 115097147B CN 202211016042 A CN202211016042 A CN 202211016042A CN 115097147 B CN115097147 B CN 115097147B
- Authority
- CN
- China
- Prior art keywords
- model
- biomarker
- protein
- yang
- clinical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6893—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/26—Conditioning of the fluid carrier; Flow patterns
- G01N30/28—Control of physical parameters of the fluid carrier
- G01N30/32—Control of physical parameters of the fluid carrier of pressure or speed
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/26—Conditioning of the fluid carrier; Flow patterns
- G01N30/28—Control of physical parameters of the fluid carrier
- G01N30/34—Control of physical parameters of the fluid carrier of fluid composition, e.g. gradient
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8696—Details of Software
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/92—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving lipids, e.g. cholesterol, lipoproteins, or their receptors
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/26—Conditioning of the fluid carrier; Flow patterns
- G01N30/28—Control of physical parameters of the fluid carrier
- G01N30/32—Control of physical parameters of the fluid carrier of pressure or speed
- G01N2030/324—Control of physical parameters of the fluid carrier of pressure or speed speed, flow rate
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2405/00—Assays, e.g. immunoassays or enzyme assays, involving lipids
- G01N2405/04—Phospholipids, i.e. phosphoglycerides
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/26—Infectious diseases, e.g. generalised sepsis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/54—Determining the risk of relapse
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/60—Complex ways of combining multiple protein biomarkers for diagnosis
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Food Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Public Health (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Genetics & Genomics (AREA)
Abstract
本发明属于生物医药领域,涉及一种预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型,生物标志物为脱氧胆酸(Deoxycholic acid),(±)19(20)‑DiHDPA,5酮葡萄糖酸(5‑Ketogluconic acid),Lysopc 18:3,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,IGKV1D‑39中一种或几种组合。利用一份血液样本即可完成多种检测,易于实际应用,通过测定样本中多个生物标志物水平,在奥密克戎新冠病人复阳前对未来的复阳进行预测,指导病人出院后的观察和随访防控政策。
Description
技术领域
本发明属于生物医药领域,涉及一种预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型。
背景技术
奥密克戎感染症状轻,传播力强,已经引起全球大流行。新冠患者核酸转阴结束隔离后,如果进入社会重新出现核酸复阳现象将有可能造成新冠的进一步隐匿传播,难以控制。高复阳现象与新的新冠变异株越来越强的传播力或有密切的关系,通过血浆生物标志物对新冠患者进行筛查,在患者出现复阳前提前预警其发生,从而施行更精准的延长隔离政策或能极大的降低新冠的传播,对新冠传播的遏制和精准管控具有重要意义。现有研究尚未对奥密克戎变异株感染机体的血浆组学特征进行全面的描述,也没有奥密克戎变异株对机体免疫系统的损害情况的评估体系,部分基于患者血清或血浆的研究又存在着覆盖深度不够,检测指标不全面等不足,无法全面评估奥密克戎变异株对机体的损害,而复阳的发生机制和发生后的生理病理特征尤为复杂,常规的组学分析方法无法对复阳情况进行深入的分析,也无法对患者复阳情况进行预测性指导。因而,新冠疫情的精准防控急需可以预测复阳发生的生物标志物。
发明内容
本发明成功筛选了预警复阳发生的生物标记物,对高效、精准、低成本防控奥密克戎和类似轻症变异株具有重要的启示意义。本发明的主要目的在于通过测定样本中生物标志物水平,在Omicron新冠病人复阳前对未来的复阳进行预测,并通过有效预测病人未来复阳与否,指导病人出院后的观察和随访防控政策。
为了实现上述目的,根据本发明的一个方面,提供了一种预测奥密克戎复阳风险的生物标志物,所述生物标志物为脱氧胆酸,(±)19(20)-DiHDPA,5酮葡萄糖酸,Lysopc18:3, COLEC10,ERAP1,CLIC1,EIF5A,CPB1, IGKV1D-39中一种或几种组合。
所述样本为血浆。
测定方法为色谱-质谱分析方法。
本发明另一方面提供了一种预测奥密克戎复阳风险的代谢模型,所述代谢模型包括四种代谢物:脱氧胆酸,(±)19(20)-DiHDPA,5酮葡萄糖酸,Lysopc 18:3。
本发明另一方面提供了一种预测奥密克戎复阳风险的蛋白模型,所述蛋白模型包括十种蛋白:PLTP,LCP1,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,LBP,IGKV1D-39,IGLV3-16。
本发明另一方面提供了一种预测奥密克戎复阳风险的联合模型,所述联合模型由临床模型、代谢模型及蛋白模型组成,所述临床模型包括四种临床特征:核酸检测结果,性别,是否患有基础疾病,临床分型,代谢模型包括四种代谢物:脱氧胆酸,(±)19(20)-DiHDPA,5酮葡萄糖酸,Lysopc 18:3,蛋白模型包括十种蛋白:PLTP,LCP1,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,LBP,IGKV1D-39,IGLV3-16。
本发明的有益效果是:
本发明首次发现了与Omicron新冠病人复阳相关的生物标志物,利用一份血液样本即可完成多种检测,易于实际应用,通过测定样本中多个生物标志物水平在Omicron新冠病人复阳前对未来的复阳进行预测。并可以通过蛋白、代谢物、临床特征联合三种类型的特征进行预测。并通过有效预测病人未来复阳与否,指导病人出院后的观察和随访防控政策。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1. 预测Omicron 新冠病人是否复阳流程图;
图2. 质控样本(QC)样本变异系数分析;
图3. 机器学习流程;
图4. 筛选得到的4种临床特征重要性图;
图5. 筛选得到的4种代谢特征重要性图;
图6. 训练集Omicron 新冠患者的血浆代谢物相对表达量情况其中复阳为1与不复阳为0;
图7. 筛选得到的10种蛋白特征重要性图;
图8. 训练集Omicron 新冠患者的血浆蛋白(PLTP,LCP1,CLIC1,EIF5A,CPB1,IGKV1D-39)相对表达量情况,其中复阳为1与不复阳为0;
图9. 训练集Omicron 新冠患者的血浆蛋白(COLEC10,ERAP1, LBP, IGLV3-16)相对表达量情况,其中复阳为1与不复阳为0;
图10. 临床模型、代谢模型、蛋白模型预测样本概率得分;
图11. 联合模型在测试集上的受试者操作特征(ROC)曲线。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部试验结果。
本发明提出了预测Omicron(奥密克戎)新冠病人是否复阳的相关血浆蛋白、代谢和临床特征,整个过程如图1所示。下表为所有样本中各个类型数据的样本数量:
年龄16-69岁,代谢和蛋白样本是包含于临床信息人群之中的。
第一步 Omicron新冠病人临床特征检测(备注:没有用到细胞因子和生化指标):
主要测量指标为:核酸结果(所采样品阴性阳性),年龄,性别,收样间隔时间,疾病严重程度,接种新冠疫苗情况,是否患有基础疾病等(1为患有基础疾病,0为未患有基础疾病)。
其中核酸检测方法采用三种试剂,分别为伯杰、中元和之江(后替换为圣湘),伯杰和中元两种试剂均为双靶标(ORF lab和N)检测,之江试剂为三靶标(ORF lab、N和E)检测。
确定判断标准如下:
检测结果阳性: CT值小于35且有S形扩增曲线;CT值在35左右判定为灰区,应进行重复实验,若复检仍处于灰区且有S形扩增曲线则判断为阳性;
病例阳性:同一标本两个靶标(ORF lab和N)阳性则判断为病例阳性,如出现单靶标阳性则重采重测,若两种样本均出现单靶标阳性,或同类标本两次采样均出现单靶标阳性则判定为阳性;由于中元试剂灵敏度和稳定性最高,故作为主试剂进行判断。
本发明中所检测的样本为Omicron(奥密克戎)BA.1亚型毒株株感染者血浆。
第二步 Omicron新冠病人的血浆的代谢组学分析:
本部分基于液相质谱联用(LC-MS)技术进行非靶向代谢组学研究,具体如下:
代谢物提取和质量控制样本制备:
取100 μL样本置于EP管中,加入400 μL的80%甲醇水溶液,涡旋震荡,冰浴静置5min,15000 g、4℃离心 20 min;取一定量的上清加质谱级水稀释至甲醇含量为 53%;15000g、4℃离心20 min,收集上清,进样 LC-MS 进行分析。实验进行质量控制,在处理样品的同时制备了质控样本。质控样本为实验样本的等体积混合样本,用于平衡色谱-质谱系统和监测仪器状态,在整个实验过程中对系统稳定性进行评价,代谢质控样本在样本采集过程中不同时间点采集了11次。同时设置空白对照样本,主要用于去除背景离子。
色谱-质谱分析:
使用Vanquish UHPLC系统(Thermo Fisher Scientific,San Jose,USA),并联合QExactive™ HF-X 质谱(Thermo Fisher Scientific,San Jose,USA),采用数据依赖采集(DDA)模式,并通过正负两种采集模式分析。具体的扫描范围选100-1500 m/z;ESI源的设置如下:喷雾电压(Spray Voltage):3.5 kV; 鞘气流速(Sheath gas flow rate):35 psi;辅助气流速(Aux Gas flow rate):10 L/min; 离子传输管温度(Capillary Temp):320°C;离子导入射频电平(S-lens RF level):60; 辅助气加热器温度(Aux gas heater temp):350°C; 极性(Polarity): 正、负。下表为色谱梯度洗脱程序:
正模式:流动相 A:0.1%甲酸 (其他为水),流动相 B:甲醇
负模式:流动相 A:5 mM 醋酸铵,pH9.0,流动相 B:甲醇
数据预处理和代谢物鉴定:
将下机数据(.raw)文件导入CD 3.1搜库软件中进行处理,对每个代谢物进行保留时间、质荷比等参数的简单筛选,然后设置保留时间偏差 0.2 min 和质量偏差5 ppm ,对不同样品进行峰对齐,使鉴定更准确,随后设置质量偏差5 ppm、信号强度偏差30%、信噪比3、最小信号强度、加和离子等信息进行峰提取,同时对峰面积进行定量,再整合目标离子,然后通过分子离子峰和碎片离子进行分子式的预测并与 mzCloud(https://www.mzcloud.org/)、mzVault 和 Masslist 数据库进行比对,用空白样本去除背景离子,并对原始定量结果进行标准化处理,最后得到代谢物的鉴定和相对定量结果。
数据统计分析:
在质量控制分析中,血浆代谢组质控样本(QC)的变异系数(CV)的中位数为9.8%(图2),说明数据具有较高的一致性和可重复性。其中变异系数指的是质控样本中全部代谢物或蛋白的相对表达量的变异系数,计算方式是(标准偏差SD/平均值Mean)。使用 KEGG 数据库(https://www.genome.jp/kegg/pathway.html)、HMDB 数据库(https://hmdb.ca/metabolites)和LIPIDMaps数据库(http://www.lipidmaps.org/)对鉴定到的代谢物进行注释。
第三步Omicron新冠病人的血浆蛋白质组学分析:
通过TMT标记的蛋白质组学分析。具体蛋白组学分析方法如下:
1)实验批次设计和质量控制样本制备:
针对临床队列样本进行实验设计,综合考虑人群的不同临床特征,使用在线蛋白质组分析工具网站ProteomeExpert(https://proteomic.shinyapps.io/peserver/)使样本尽可能均匀分散,以最大程度避免批次效应。在处理样品的同时制备了质控样本。质控样本为实验样本的等体积混合样本,在整个实验过程中对系统稳定性进行评价。蛋白质控样本在样本采集过程中不同时间点采集了10次。
2)蛋白质组学分析:
血浆样本先使用High Select™ HSA/免疫球蛋白去除微型离心柱(ThermoFisher Scientific™, San Jose, USA)去除高丰度蛋白,然后加入50 μL 8 M尿素(溶于100 mM 的TEAB中)的裂解缓冲液中变性。再加入用10 mM三(2-羧基乙基)膦(TCEP) 32℃孵育30分钟,然后黑暗中于40 mM碘乙酰胺(IAA)孵育30分钟,还原并烷基化蛋白裂解物。用100 mM TEAB 200 μL进一步稀释后,再以胰蛋白酶:底物为1:50比例下在32℃下消化4小时,继而再加入同等比例的胰蛋白酶在32℃下消化12小时。加入32 µL 10%三氟乙酸(TFA)停止反应。这些经胰酶消化后的肽段使用除盐柱进行清洗除盐后,使用TMTpro 16plex按照厂家说明书对多肽进行标记。
3)TMT标记以及馏分分离:
通过1)的方法,将人群随机分为10个批次进行TMTpro 16plex标记,每批样品数量相同。对于每个批次的TMT样品,采用5%—35%乙腈(ACN)在10 mM氨水(pH = 10.0)中梯度分离,TMT标记的肽经该系统被分离为60个馏分,这些馏分再进一步合并为30个馏分。
4)高分辨质谱分析和数据分析:
使用nanoflow DIONEX UltiMate 3000 RSLCnano系统(Thermo FisherScientific, San Jose, USA),并联合Orbitrap 480高分辨率质谱(Thermo FisherScientific, San Jose, USA),采用数据依赖采集(DDA)模式,在线对每个馏分进行分析。
分析时,样本首先以6 μl/min的速度加载到预载柱(3 μm, 100 Å, 20 mm∗75 μmi.d.)上,然后以300 nL/min的流速,将加载在预载柱上的样品,冲洗至分析柱(1.9μm, 120a, 150mm∗75μm)中进行进一步的在线分离,分析时间为45分钟。其中缓冲液的具体成分:缓冲液A为2% ACN, 98% H2O(含0.1% FA),缓冲液B为98% ACN, 2% H2O(含0.1% FA)。所有试剂均为MS级。下表为色谱梯度洗脱程序:
质谱参数方面MS1的m/z范围为375—1800,分辨率为60,000 (200 m/z),AGC为3e6,最大离子注入时间(max IT)为50 ms。前体离子进行MS/MS的二级碎裂,其分辨率为30,000 (200 m/z),AGC 为200%,max IT为86 ms。启用了turbo-TMT和高级峰测定,隔离窗口设置为 0.7 m/z。
5)数据分析和质量控制:
使用Proteome Discoverer (版本2.4.1.15,Thermo Fisher Scientific) 和蛋白质数据库(从UniProtKB下载)对质谱数据进行分析。酶被设置为胰蛋白酶,有两个缺失的切割耐受性。静态修饰为半胱氨酸氨基甲基化 (+57.021464) 、赖氨酸残基及肽段N端TMTpro(+304.207145),可变修饰为蛋氨酸氧化(+15.994915)和肽段N端乙酰化(+42.010565)。前体离子质量偏差设置为10 ppm,碎裂离子质量偏差设置为0.02 Da。使用基于TMTpro(16plex)的蛋白质组学,对血浆蛋白质组和进行了鉴定和定量。在质量控制分析中,血浆蛋白质组质控样本(QC)的变异系数(CV)的中位数为3.3%(图2),说明数据具有较高的一致性和可重复性。接着,对血浆蛋白质组数据通过PCA降维分析发现,校正后在不同的批次之间,不同的仪器之间没有批次效应。
第四步 在训练集进行特征筛选,独立模型构建与测试和模型解释,下表为训练集中各个类型数据的样本数量:
机器学习部分通过R语言mlr3程序软件包完成。首先将病人随机划分为训练集和测试集,对于临床信息矩阵,基于训练集,用信息增益进行特征筛选,只留下信息增益information gain大于0的特征,共剩余4种临床特征,分别为核酸检测结果,性别,是否患有基础疾病,临床分型;
新型冠状病毒肺炎的临床分型分为四大类型,分别为轻型、普通型、重型和危重型,具体情况如下:
轻型新型冠状病毒肺炎:临床症状轻微,患者一般没肺炎表现。
普通型新型冠状病毒肺炎:患者具有发热、呼吸道症状,在影像中有肺炎表现。
重型新型冠状病毒肺炎指符合以下任何一条:
1、出现呼吸窘迫,即呼吸频率≥30/分;
2、静息状态下动脉血氧饱和度≤93%;
3、动脉血氧分压与吸入氧浓度的比值≤300mmHg;
4、临床症状进行性加重,在24-48小时内肺部影像进展>50%。
患者符合下面任何一条可以作为危重型新型冠状病毒肺炎:
1、呼吸衰竭,需要机械通气;
2、出现休克;
3、由于其他器官功能衰竭,需要ICU治疗。
本发明中样本采用轻型及普通型样本。
对于代谢矩阵,通过学生t检验(复阳与不复阳两组,两独立样本的双边学生t检验,不使用配对检验)筛选,选择p-value小于0.001的代谢物,共剩余4种代谢物(图6),分别为脱氧胆酸(Deoxycholic acid),(±)19(20)-DiHDPA,5酮葡萄糖酸(5-Ketogluconicacid),Lysopc 18:3;
对于血浆蛋白矩阵,首先在训练集上用默认参数训练随机森林模型,根据基尼系数,取最重要的前10个蛋白作为特征(蛋白用其对应的基因名表示)(图8,图9),分别为PLTP,LCP1,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,LBP,IGKV1D-39,IGLV3-16。
然后对于每类特征,分别在其对应的特征筛选后的矩阵上进行模型构建与测试。具体来说:
1) 在训练集上训练随机森林模型(使用500棵树,mtry设为根号下当前变量数,最小节点数设为1,使用基尼系数来衡量变量重要性),并在测试集上进行测试。
2)绘制特征重要性图,其反映了模型每个特征的重要程度(临床模型如图4,代谢模型如图5,蛋白模型如图7),其中各特征在模型中的特征重要性使用基尼系数来衡量。最后,对于每个特征,若为分类变量,则用列联表的费舍尔精确检验该变量与标签(复阳与否)之间的相关性,若为连续变量,则用箱线图展示其在复阳与不复阳两组之间的表达情况,并用学生t假设检验(复阳与不复阳两组,两独立样本的双边学生t检验,不使用配对检验)该变量在两组间的显著性。
第五步 机器学习联合模型构建及测试(图3),下表为联合模型中训练集和验证集数据的样本数量:
首先基于临床模型、代谢模型、蛋白模型三个单因素模型,对35个三个模型训练集的共同样本进行预测,得到这些样本的概率得分,分别记为临床得分(ClinicalScore),血浆代谢得分(MetaScore)和血浆蛋白得分(PlasmaScore),然后,把这三种得分作为特征,结合其对应的标签,训练联合逻辑回归模型(联合模型),并在测试集上进行测试。计算三种得分的重要性(图10),并绘制测试集上的ROC曲线(图11)。下表为各个模型以及联合模型预测效果:
本发明使用一份血液样本即可完成多种检测,易于实际应用,通过测定样本中多个生物标志物水平在Omicron新冠病人复阳前对未来的复阳进行预测。并可以通过蛋白、代谢物、临床特征联合三种类型的特征进行预测。并通过有效预测病人未来复阳与否,指导病人出院后的观察和随访防控政策。
本领域技术人员会理解,本发明不限于这里的实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (6)
1.预测奥密克戎复阳风险的生物标志物,其特征在于,所述生物标志物为脱氧胆酸,(±)19(20)-DiHDPA,5酮葡萄糖酸,Lysopc 18:3,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,IGKV1D-39中一种或几种组合。
2.根据权利要求1所述的生物标志物,其特征在于:预测奥密克戎复阳风险的样本为血浆。
3.根据权利要求2所述的生物标志物,其特征在于:预测奥密克戎复阳风险的测定方法为色谱-质谱分析方法。
4.一种预测奥密克戎复阳风险的代谢模型,其特征在于,所述代谢模型包括四种代谢物:脱氧胆酸,(±)19(20)-DiHDPA,5酮葡萄糖酸,Lysopc 18:3。
5.一种预测奥密克戎复阳风险的蛋白模型,其特征在于,所述蛋白模型包括十种蛋白:PLTP,LCP1,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,LBP,IGKV1D-39,IGLV3-16。
6.一种预测奥密克戎复阳风险的联合模型,其特征在于,所述联合模型由临床模型、代谢模型及蛋白模型组成,所述临床模型包括四种临床特征:核酸检测结果,性别,是否患有基础疾病,临床分型,所述代谢模型包括四种代谢物:脱氧胆酸,(±)19(20)-DiHDPA,5酮葡萄糖酸,Lysopc 18:3,所述蛋白模型包括十种蛋白:PLTP,LCP1,COLEC10,ERAP1,CLIC1,EIF5A,CPB1,LBP,IGKV1D-39,IGLV3-16。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211016042.5A CN115097147B (zh) | 2022-08-23 | 2022-08-23 | 预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211016042.5A CN115097147B (zh) | 2022-08-23 | 2022-08-23 | 预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115097147A CN115097147A (zh) | 2022-09-23 |
CN115097147B true CN115097147B (zh) | 2022-11-25 |
Family
ID=83300822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211016042.5A Active CN115097147B (zh) | 2022-08-23 | 2022-08-23 | 预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115097147B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116525128A (zh) * | 2023-01-30 | 2023-08-01 | 杭州市西溪医院 | 一种针对Omicron复阳的风险预测工具及构建方法及应用 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111733228A (zh) * | 2020-05-29 | 2020-10-02 | 武汉市金银潭医院 | 用于检测新型冠状病毒疾病是否治愈的标志物、试剂或试剂盒 |
CN113176411A (zh) * | 2021-03-10 | 2021-07-27 | 北京大学口腔医学院 | 利用唾液检测新型冠状病毒肺炎的生物标志物及其应用 |
CN113777330A (zh) * | 2021-11-11 | 2021-12-10 | 北京大学 | 一种疾病相关标志物的筛选方法、应用及试剂盒 |
WO2021251504A1 (ja) * | 2020-06-12 | 2021-12-16 | 国際スペースメディカル株式会社 | 血中rnaを利用したcovid-19重症化予測方法 |
WO2022056896A1 (zh) * | 2020-09-21 | 2022-03-24 | 上海市公共卫生临床中心 | 基于白介素37的呼吸道病毒感染(危)重症预警 |
WO2022071601A1 (ja) * | 2020-10-02 | 2022-04-07 | 国際スペースメディカル株式会社 | 血中エクソソームのタンパク質マーカーを利用したcovid-19重症化予測方法 |
WO2022095781A1 (zh) * | 2020-11-03 | 2022-05-12 | 上海市公共卫生临床中心 | 一种新冠肺炎病程预测和监控的分子标志物及其应用 |
WO2022114984A1 (en) * | 2020-11-25 | 2022-06-02 | Qatar Foundation For Education, Science And Community Development | Methods of treating sars-cov-2 infections |
CN114674969A (zh) * | 2022-03-25 | 2022-06-28 | 重庆市公共卫生医疗救治中心 | 尿液中生物标志物检测试剂在制备新冠肺炎诊断试剂盒中的用途 |
CN114674956A (zh) * | 2022-03-25 | 2022-06-28 | 重庆医科大学附属第一医院 | 尿液中生物标志物检测试剂在制备预测新冠肺炎神经精神后遗症的试剂盒中的用途 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111796097B (zh) * | 2020-05-29 | 2023-09-08 | 武汉市金银潭医院 | 诊断新冠肺炎由轻症转重症的血浆蛋白标志物、检测试剂或试剂工具 |
US20220084636A1 (en) * | 2020-09-14 | 2022-03-17 | The Board Of Trustees Of The Leland Stanford Junior University | Machine learning analysis for metabolomics classification and biomarker discovery |
-
2022
- 2022-08-23 CN CN202211016042.5A patent/CN115097147B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111733228A (zh) * | 2020-05-29 | 2020-10-02 | 武汉市金银潭医院 | 用于检测新型冠状病毒疾病是否治愈的标志物、试剂或试剂盒 |
WO2021251504A1 (ja) * | 2020-06-12 | 2021-12-16 | 国際スペースメディカル株式会社 | 血中rnaを利用したcovid-19重症化予測方法 |
WO2022056896A1 (zh) * | 2020-09-21 | 2022-03-24 | 上海市公共卫生临床中心 | 基于白介素37的呼吸道病毒感染(危)重症预警 |
WO2022071601A1 (ja) * | 2020-10-02 | 2022-04-07 | 国際スペースメディカル株式会社 | 血中エクソソームのタンパク質マーカーを利用したcovid-19重症化予測方法 |
WO2022095781A1 (zh) * | 2020-11-03 | 2022-05-12 | 上海市公共卫生临床中心 | 一种新冠肺炎病程预测和监控的分子标志物及其应用 |
WO2022114984A1 (en) * | 2020-11-25 | 2022-06-02 | Qatar Foundation For Education, Science And Community Development | Methods of treating sars-cov-2 infections |
CN113176411A (zh) * | 2021-03-10 | 2021-07-27 | 北京大学口腔医学院 | 利用唾液检测新型冠状病毒肺炎的生物标志物及其应用 |
CN113777330A (zh) * | 2021-11-11 | 2021-12-10 | 北京大学 | 一种疾病相关标志物的筛选方法、应用及试剂盒 |
CN114674969A (zh) * | 2022-03-25 | 2022-06-28 | 重庆市公共卫生医疗救治中心 | 尿液中生物标志物检测试剂在制备新冠肺炎诊断试剂盒中的用途 |
CN114674956A (zh) * | 2022-03-25 | 2022-06-28 | 重庆医科大学附属第一医院 | 尿液中生物标志物检测试剂在制备预测新冠肺炎神经精神后遗症的试剂盒中的用途 |
Non-Patent Citations (1)
Title |
---|
贵州省8500例2019新型冠状病毒核酸检测结果分析;冯勤颖等;《标记免疫分析与临床》;20200625(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115097147A (zh) | 2022-09-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fusaro et al. | Prediction of high-responding peptides for targeted protein assays by mass spectrometry | |
Mischak et al. | Technical aspects and inter-laboratory variability in native peptide profiling: The CE–MS experience | |
Duncan et al. | The pros and cons of peptide-centric proteomics | |
EP2210108B1 (en) | Methods for detecting major adverse cardiovascular and cerebrovascular events | |
US10309968B2 (en) | Methods and systems for assembly of protein sequences | |
CN111289736A (zh) | 基于代谢组学的慢阻肺早期诊断标志物及其应用 | |
CN111316106A (zh) | 自动化样品工作流程门控和数据分析 | |
CN110057954B (zh) | 血浆代谢标志物在诊断或监测hbv的应用 | |
Liang et al. | Metabolomics of alcoholic liver disease: a clinical discovery study | |
Albalat et al. | Improving peptide relative quantification in MALDI‐TOF MS for biomarker assessment | |
CN115097147B (zh) | 预测奥密克戎复阳风险的生物标志物及代谢、蛋白、联合模型 | |
JP2006510875A (ja) | コンステレーションマッピングおよびそれらの使用 | |
Möginger et al. | Histo-molecular differentiation of renal cancer subtypes by mass spectrometry imaging and rapid proteome profiling of formalin-fixed paraffin-embedded tumor tissue sections | |
WO2006129401A1 (ja) | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 | |
CN109946411B (zh) | 用于胸椎黄韧带骨化诊断的生物标记物及其筛选方法 | |
CN112669958B (zh) | 代谢物作为疾病诊断的生物标志物 | |
CN112305122B (zh) | 代谢物标志物及其在疾病中的应用 | |
Feng et al. | Selected reaction monitoring to measure proteins of interest in complex samples: a practical guide | |
JP6128631B2 (ja) | 糖尿病性腎症鑑別用マーカー及びその用途 | |
CN112599239A (zh) | 代谢物标志物及其在脑梗死诊断中的应用 | |
WO2020150609A1 (en) | Urine metabolomics based method of detecting renal allograft injury | |
CN112630344B (zh) | 代谢标志物在脑梗死中的用途 | |
EP2674758A1 (en) | A computational method for mapping peptides to proteins using sequencing data | |
Jiang et al. | Integration of metabolomics and peptidomics reveals distinct molecular landscape of human diabetic kidney disease | |
JP7479636B2 (ja) | 全身性エリテマトーデスの検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |