CN114544982A - 尘肺诊断的生物标志物及其应用 - Google Patents
尘肺诊断的生物标志物及其应用 Download PDFInfo
- Publication number
- CN114544982A CN114544982A CN202210314458.9A CN202210314458A CN114544982A CN 114544982 A CN114544982 A CN 114544982A CN 202210314458 A CN202210314458 A CN 202210314458A CN 114544982 A CN114544982 A CN 114544982A
- Authority
- CN
- China
- Prior art keywords
- pneumoconiosis
- decision tree
- lysophosphatidylcholine
- equal
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/92—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving lipids, e.g. cholesterol, lipoproteins, or their receptors
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/72—Mass spectrometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8675—Evaluation, i.e. decoding of the signal into analytical information
- G01N30/8679—Target compound analysis, i.e. whereby a limited number of peaks is analysed
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/04—Preparation or injection of sample to be analysed
- G01N30/06—Preparation
- G01N2030/062—Preparation extracting sample from raw material
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2405/00—Assays, e.g. immunoassays or enzyme assays, involving lipids
- G01N2405/04—Phospholipids, i.e. phosphoglycerides
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2405/00—Assays, e.g. immunoassays or enzyme assays, involving lipids
- G01N2405/04—Phospholipids, i.e. phosphoglycerides
- G01N2405/06—Glycophospholipids, e.g. phosphatidyl inositol
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/12—Pulmonary diseases
- G01N2800/122—Chronic or obstructive airway disorders, e.g. asthma COPD
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/50—Determining the risk of developing a disease
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Theoretical Computer Science (AREA)
- Pathology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Biotechnology (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Software Systems (AREA)
- Food Science & Technology (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Bioethics (AREA)
- Endocrinology (AREA)
- Probability & Statistics with Applications (AREA)
- Library & Information Science (AREA)
Abstract
本发明提供了尘肺诊断的生物标志物及其应用,属于生物检测技术领域。生物标志物为溶血磷脂酰胆碱(24:1)在制备诊断尘肺病的检测试剂中的应用,通过生物标志物溶血磷脂酰胆碱(24:1)结合溶血磷脂酰肌醇(16:0)、神经酰胺(d18:1/23:0)、甾醇、槲皮素3‑(2’‑半乳糖苷),来判断患尘肺病的风险,可进行提前预防、防范尘肺病的发生。
Description
技术领域
本发明属于生物检测技术领域,具体涉及一种尘肺诊断的生物标志物及其应用。
背景技术
尘肺病,学名为肺尘埃沉着病(Pneumoconiosis),是一种典型且严重的职业病。由于职业原因,工人长期吸入生产性粉尘(灰尘),容易导致肺部粉尘滞留,引起肺组织弥漫性纤维化,而粉尘中的二氧化硅含量越高,尘肺病发病时间越短,病变就越严重。
据统计,截止至2017年底,现有尘肺病人已达600万人。但是就目前诊断与检测技术而言,一般情况下,尘肺病诊断只能通过肺部CT或组织活检的方式确认患者。
尘肺病的发病时间受到个人体质与保护措施的影响,短的可能数月患病,时间长的几年至十几年不等。基于尘肺病病理的特殊性以及发病的不确定性,正在沿用的价格高昂、及时性差的检测方式越来越不适合尘肺病的检测与诊断,许多病人确诊尘肺病时已经进行至病理进程中晚期,极不利于后续治疗,致使病人沉陷长期的痛苦与折磨之中。
代谢组学是一种新兴的组学技术,在生物学研究中发挥着越来越重要的作用,因为它能够揭示机体细胞代谢的独特化学指纹特征。代谢组学作为一种无偏的小分子代谢物研究方法,代谢组学可通过分析内源性代谢物的变化来反映机体的状态,并进而识别特异性生物标志物或标志物群。如何寻找一种易于检测的生物标志物及方法,用来预测和诊断尘肺病是亟需解决的技术问题。
发明内容
为了解决上述技术问题,本发明提供生物标志物溶血磷脂酰胆碱 (24:1)在制备诊断尘肺病的检测试剂中的应用。
为实现上述目的,本发明采用以下的技术方案为:
生物标志物溶血磷脂酰胆碱(24:1)在制备诊断尘肺病的检测试剂中的应用。
生物标志物溶血磷脂酰胆碱(24:1),结合溶血磷脂酰肌醇(16:0)、 神经酰胺(d18:1/23:0)、甾醇、槲皮素3-(2’-半乳糖苷)在制备诊断尘肺病的检测试剂中的应用。
如上所述的应用,优选地,其是将溶血磷脂酰胆碱(24:1)结合溶血磷脂酰肌醇(16:0)、 神经酰胺(d18:1/23:0)、甾醇Pubescenol、槲皮素3-(2’-半乳糖苷)来判断是否存在有患尘肺病的风险。
如上所述的应用,优选地,将溶血磷脂酰肌醇(16:0)的含量记为R36,溶血磷脂酰胆碱(24:1)的含量记为R50,槲皮素3-(2’-半乳糖苷)记为R30,甾醇的含量记为R34,满足下面任一种情况,则判定为尘肺病,除此四种情况之外的其余情况,均不判定为尘肺病;
(1)R36<0.72,R50<0.35;
(2)R36<0.72,R50≥0.35,且R34<0.21;
(3)0.15<R36<0.72,R50≥0.35,且R34≥0.21且R30≥0.3;
(4)R36≥0.72,R34<0. 2。
如上所述的应用,优选地,通过检测血清中溶血磷脂酰胆碱(24:1)结合溶血磷脂酰肌醇(16:0)、神经酰胺(d18:1/23:0)、甾醇、槲皮素3-(2’-半乳糖苷)的含量,根据上述五种标志物构成的机器学习条件概率决策树模型中的TC值预测尘肺病:若TC≥0.300,则判定为尘肺病;若TC<0.300,则为无尘肺病。
如上所述的应用,优选地,机器学习条件概率决策树模型的构建是使用R语言的rpart包进行决策树模型建立,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1。
本发明的有益效果在于:
本发明提供了新的分子标志物溶血磷脂酰胆碱(24:1)PC(24:1(15Z)/0:0)及判别尘肺病的模型,可用于早期发现、诊断和预测尘肺病,在制备检测尘肺病的检测试剂盒应用。
本发明提供的用于诊断脑尘肺病的生物标志物为包括溶血磷脂酰胆碱(24:1)结合溶血磷脂酰肌醇(16:0)、 神经酰胺(d18:1/23:0)、甾醇、槲皮素3-(2’-半乳糖苷)的含量,根据五种标志物构成的机器学习条件概率决策树模型中的TC值预测尘肺病,有助于诊断是否存在尘肺病的倾向,可用于提前预防。
附图说明
图1为正离子模式下正常环境对照组与易感尘肺病环境对照组比较的S-plot图;
图2为负离子模式下正常环境对照组与易感尘肺病环境对照组比较的S-plot图;
图3为正离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的S-plot图;
图4为负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的S-plot图;
图5为正离子模式下正常环境对照组与易感尘肺病环境对照组比较的VIP>1的化合物;
图6为负离子模式下正常环境对照组与易感尘肺病环境对照组比较的VIP>1的化合物;
图7为正离子模式下正常环境对照组与易感尘肺病环境对照组比较的(O)PLS-DA的得分图;
图8为负离子模式下正常环境对照组与易感尘肺病环境对照组比较的(O)PLS-DA的得分图;
图9为正离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的VIP>1的化合物;
图10为负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的VIP>1的化合物;
图11为正离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的(O)PLS-DA的得分图;
图12为负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的(O)PLS-DA的得分图;
图13为正常环境对照组与易感尘肺环境对照组、易感尘肺环境对照组与患尘肺病实验组比较的初步标志物上调下调韦恩图;
图14为易感尘肺环境对照组与患尘肺病实验组比较得出的最终标志物建立的决策树概率模型图(变量为R36+R20+R34+R30+R50);
图15为易感尘肺环境对照组与患尘肺病实验组比较得出的最终标志物建立的决策树概率模型评价图(变量为R36+R20+R34+R30+R50)。
具体实施方式
以下实施例用于进一步说明本发明,但不应理解为对本发明的限制。在不背离本发明精神和实质的前提下,对本发明所作的修饰或者替换,均属于本发明的范畴。
若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
实施例1
模型建立样本群共196例,年龄范围30岁以上,其中生活或工作于正常环境未患尘肺病的对照人群50人,生活或工作于易感尘肺病环境未患尘肺病的对照人群85人,尘肺病患者人群61人。
生活或工作于正常环境未患尘肺病的对照人群、生活或工作于易感尘肺病环境未患尘肺病的对照人群中,肺功能指标正常,胸透X光成像检测显示无异常。
尘肺病患者人群中,肺功能指标异常,胸透X光成像检测显示存在异常。
样本采集:选取经临床评价为生活或工作于正常环境未患尘肺病的人群、生活或工作于易感尘肺病环境未患尘肺病的人群、尘肺病患者血清进行试验。
样品前处理
收集的上述人群的血清样本在冰上解冻,取200μL的血清用600μL的预冷异丙醇萃取,涡流1min,室温孵育10min,然后将萃取混合物在-20◦C下储存过夜,然后在低温冷冻离心机(E3116R,ESSENSCIEN公司,美国)12000rpm离心20min后,将取260μL上清液到新的离心管中,加入130μL异丙醇,130μL乙腈和65μL超纯水,调节样品异丙醇/乙腈/水比例为2.5:1:1,v:v:v。样品在LC-MS分析前保存在-80◦C。此外,还将每个萃取混合物的10μL组合在一起制备混合QC样品。
其中本发明中所用的试剂:异丙醇、甲酸,乙腈,甲酸氨,LC-MS级厂家均为Fisher。
2. 脂质组学的超高效液相色谱-质谱联用方法
样品用超高效液相色谱(UPLC;型号:ACQUITY UPLC I-Class系统;厂家:Waters,Manchester, UK)连接到带有ESI的Xevo-G2XS高分辨飞行时间 (QTOF)质谱仪(Waters)进行分析。采用CQUITY UPLC BEH C18色谱柱(2.1×10 0 mm,1.7μm,Waters),流动相A:流动相为10mM甲酸铵-0.1%甲酸-乙腈-超纯水,配置方法为称取甲酸铵0.63 g,甲酸10 g,用乙腈-水溶液(乙腈:水为60:40,v/v)溶解并定容至1000mL;流动相B为:10 mM甲酸铵-0.1%甲酸-异丙醇-乙腈,配置方法为称取甲酸铵0.63 g,甲酸10 g,用异丙醇-乙腈溶液(异丙醇:乙腈为90:10,v/v)溶解并定容至1000mL。在大规模研究之前,进行了包括10分钟、15分钟和20分钟洗脱期的中试实验,以评估流动相组成和流速对脂质保留时间的潜在影响。在PIM中,丰富的脂质前体离子和碎片以相同的顺序分离,具有相似的峰形和离子强度。此外,具有10分钟洗脱期的混合QC样品也表现出与测试样品相似的前体和碎片的基峰强度。流动相流速为0.4mL/min。该柱最初用40%B洗脱,然后在2分钟内线性梯度到43%B,然后在0.1min内将B的百分比增加到50%。在接下来的3.9分钟内,梯度进一步增加到54%B,然后B的量0.1分钟内增加到70%。在梯度的最后部分,B的量在1.9分钟内增加到99%。最后,溶液B在0.1分钟内返回到40%,并且在下一次进样之前将色谱柱平衡1.9分钟。每次进样量为5μL,用Xevo-G2XS型QTOF质谱仪检测正负两种模式下的脂质,采集范围为 m/z50~1200年,采集时间为0.2s/次。离子源温度为120℃,去溶温度为600℃,气体流量为1000L/h,以氮气为流动气体。毛细管电压为2.0kV(+)/锥体电压为1.5kV(-),锥体电压为30V。以亮氨酸脑啡肽进行标准质量测定,用甲酸钠溶液进行校正。样品被随机排序。每10个样本注入一个QC样本并进行分析,以调查数据的重复性。
采用数据采集软件(MassLynx4.1; 厂家:Waters)进行数据采集,结果分析:
3. 利用传统统计学寻找血清差异物质
使用Progenesis QI将质谱数据转化为可供统计的数据形式,正交偏最小二乘判别分析(OPLS-DA)结合了正交信号矫正(OSC)和 PLS-DA(偏最小而成判别分析) 方法,通过去除不相关的差异来筛选差异变量。如图1、图2为正负离子模式下正常环境对照组与易感尘肺病环境对照组比较的S-plot图(A代表正离子,B代表负离子),图3、图4为正负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的S-plot图(A代表正离子,B代表负离子),图中,横坐标表示主成分与代谢物的协相关系数,纵坐标表示主成分与代谢物的相关系数。满足p<0.05的条件下,正常环境对照组与易感尘肺病环境对照组相比,正离子模式有2099个差异物,负离子模式有1383个差异物;满足p<0.05的条件下,正常环境对照组与易感尘肺病环境对照组相比,正离子模式有2109个差异物,负离子模式有1383个差异物。
4. 利用多元统计学寻找血清中显著变化的差异物质
正交偏最小二乘判别分析(OPLS-DA)结合了正交信号矫正(OSC)和 PLS-DA(偏最小而成判别分析) 方法,通过去除不相关的差异来筛选差异变量。如图5与图6所示: VIP值为正负离子模式下正常环境对照组与易感尘肺病环境对照组比较时PLSDA第一主成分的变量重要性投影,通常以VIP>1为代谢组学常用评判标准,作为差异代谢物筛选的标准之一;图7与图8为正负离子模式下正常环境对照组(CK表示)与易感尘肺病环境对照组(CFD表示)两个分组中的第一主成分和第二主成分通过降维的方式所得的得分图,横坐标表示组间差异,纵坐标表示组内差异,且两组结果分离较好,说明此方案可以使用。易感尘肺病环境对照组(CFD表示)与患尘肺病实验组(CFB表示)建模同理(VIP图:图9与图10,主成分图:图11与图12)。在同时满足p<0.05,VIP>1的条件下:正常环境对照组(CK表示)与易感尘肺病环境对照组(CFD表示)比较中,正离子模式有92个差异物,负离子模式有159个差异物,共261个;易感尘肺病环境对照组(CFD表示)与患尘肺病实验组(CFB表示)比较中,正离子模式有45个差异物,负离子模式有27个差异物,共72个。图5与图6、图9与图10说明三组间两两比较时,CK组与CFD组、CFD与CFB组比较均有很多显著富集(VIP值大于1)的化合物,其中可能存在着干扰因素。图7与图8、图11与图12说明三组间两两比较时,CK组与CFD组、CFD与CFB组比较都可以有很好的建模效果,两组间的样本信息均可以被有效提取。
5. 对差异物质的混杂因素剔除
针对差异物上调或下调的情况进行进一步比较。由于在非易感尘肺病环境不能得尘肺病的实际情况,对CFD组与CFB组的存在差异的全体化合物进行了混杂因素剔除。在图13中,在 CFD组、CFB组比较得出的差异物中去除了与CK组、CFD组比较得出的差异物中重合的部分,最终获取了26个特异性强的CFB组上调差异物、27个特异性强的CFB组下调差异物。
6. 特征重要性Filter分析
为了进一步缩小范围,将53个化合物进行过滤法评分分析,用来反映单个指标对结局的信息包含程度的大小,其中分值越大说明变量越重要。设置可重复种子I = 2193,过滤法评分阈值为3.5,最终得到了5个化合物。结果如下表1。
表1尘肺病相关脂质的Filter分析
7. 内部人群十折交叉验证结果
为提高种变量化合物的生物诊断效果,需要根据上述生物标志物找出适合的模型进行行下一步的分析。由于真实世界中的非线性存在,实施例中选定半参数的决策树概率模型,模型由结点和有向边组成。结点有两种类型:内部结点和叶结点,其中内部结点表示一个特征或属性,叶结点表示一个类。一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点则对应于一个属性测试。每个结点包含的样本集合根据属性测试的结果被划分到子结点中,根结点包含样本全集,从根结点到每个叶结点的路径对应了一个判定测试序列。
将全体人群随机分为10份,选择1份为验证集,其他为训练集,如此反复十次,考察最佳的变量组合。考察五种化合物组合在决策树模型建设过程中的内部稳定性,包括AUC,敏感度,特异性都取平均值,并进行统计学显著性计算,结果如下表2,其中次序号对应的是内部验证中的第几次验证的序号,建模自变量为上述五个化合物,因变量为结局变量TC。
表2
五种化合物组合形成的决策树模型内部稳定性优秀,AUC平均值稳定在0.846左右。
同样的,考察除R50外的四种化合物组合在决策树模型建设过程中的内部稳定性,包括AUC,敏感度,特异性都取平均值,并进行统计学显著性计算,结果如下表3:
表3
四种化合物组合形成的决策树模型内部稳定性不佳,AUC平均值稳定在0.684左右。换言之,正是由于化合物R50的存在使得建立内部稳定的模型成为可能,化合物R50在标志物组合中也起到了十分重要的作用。
基于上述分析,使用原五种化合物建立了决策树模型,模型图如图14。其中,溶血磷脂酰肌醇(16:0)的含量记为R36,溶血磷脂酰胆碱(24:1)的含量记为R50,槲皮素3-(2’-半乳糖苷)记为R30,甾醇的含量记为R34,综合来看,出现下面四种情况将检测者判定为尘肺病人,具体如下:当R36值小于0.72时,R50值小于0.35此一种情况;当R36值小于0.72时,R50值大于等于0.35且R34值小于0.21此一种情况;当R36值小于0.72时,R50值大于等于0.35且R34值大于等于0.21且R30值大于等于0.3且R36值小于0.15此一种情况;当R36值大于等于0.72时,R34值小于0.2此一种情况。除此4中情况之外的其余情况,均判定检测者不为尘肺病人。
也就是说,测得的各物质的含量,将溶血磷脂酰肌醇(16:0)的含量记为R36,溶血磷脂酰胆碱(24:1)的含量记为R50,槲皮素3-(2’-半乳糖苷)记为R30,甾醇的含量记为R34,满足下面任一种情况,则判断为检测者为尘肺病人,除此四种情况之外的其余情况,均不判定检测者为尘肺病人。
(1)R36<0.72,R50<0.35;
(2)R36<0.72,R50≥0.35,且R34<0.21;
(3)0.15<R36<0.72,R50≥0.35,且R34≥0.21且R30≥0.3;
(4)R36≥0.72,R34<0. 2。
8. 外部数据集,决策树模型验证
通过外部人群的数据集验证上述结果的准确性,并绘制相应的ROC曲线图,结果如下:
验证人群:204人(外部人群),取样标准同上面所述的样本人群。生活或工作于易感尘肺病环境未患尘肺病的对照人群101人,尘肺病患者人群103人。进行决策树模型验证。
模型中的变量为上述5个代谢物R36+R20+R34+R30+R50,依据化合物含量值建立决策树模型,使用R语言的rpart包进行决策树模型建立,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1; 模型评价图如图15。
Sensitivity (敏感性)=0.820
Specificity (特异性)=0.812
Accuracy(准确度)=0.815
Thresholds(阈值)=0.300
根据样本的五种标志物检测数据带入所构成的机器学习条件概率决策树模型中的TC值预测尘肺病,若TC≥0.300,则判定样本为尘肺病;若TC<0.300,则无尘肺病。
数据显示:溶血磷脂酰胆碱(24:1),结合溶血磷脂酰肌醇(16:0)神经酰胺(d18:1/23:0)、甾醇、槲皮素3-(2’-半乳糖苷)表现出非常高的诊断能力,未来能进行临床试剂盒的应用。
通过对样本信息的对比分析可知:以上5种生物标记物,与易感尘肺病环境对照组相比,溶血磷脂酰肌醇(16:0)、神经酰胺(d18:1/23:0)、甾醇、溶血磷脂酰胆碱(24:1)在尘肺病患组均呈下降趋势,槲皮素3-(2’-半乳糖苷)则相反。
Claims (5)
1.生物标志物溶血磷脂酰胆碱(24:1)在制备诊断尘肺病的检测试剂中的应用。
2.如权利要求1所述的应用,其特征在于,生物标志物溶血磷脂酰胆碱(24:1)结合溶血磷脂酰肌醇(16:0)、 神经酰胺(d18:1/23:0)、甾醇、槲皮素3-(2’-半乳糖苷)在制备诊断尘肺病的检测试剂中的应用。
3.如权利要求1所述的应用,其特征在于,将溶血磷脂酰肌醇(16:0)的含量记为R36,溶血磷脂酰胆碱(24:1)的含量记为R50,槲皮素3-(2’-半乳糖苷)记为R30,甾醇的含量记为R34,满足下面任一种情况,则判定为尘肺病,除此四种情况之外的其余情况,均不判定为尘肺病;
(1)R36<0.72,R50<0.35;
(2)R36<0.72,R50≥0.35,且R34<0.21;
(3)0.15<R36<0.72,R50≥0.35,且R34≥0.21且R30≥0.3;
(4)R36≥0.72,R34<0. 2。
4.如权利要求1所述的应用,其特征在于,通过检测血清中溶血磷脂酰胆碱(24:1)结合溶血磷脂酰肌醇(16:0)、神经酰胺(d18:1/23:0)、甾醇、槲皮素3-(2’-半乳糖苷)的含量,根据上述五种标志物构成的机器学习条件概率决策树模型中的TC值预测尘肺病:若TC≥0.300,则判定为尘肺病;若TC<0.300,则为无尘肺病。
5.如权利要求4所述的应用,其特征在于,机器学习条件概率决策树模型的构建是使用R语言的rpart包进行决策树模型建立,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210314458.9A CN114544982A (zh) | 2022-03-28 | 2022-03-28 | 尘肺诊断的生物标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210314458.9A CN114544982A (zh) | 2022-03-28 | 2022-03-28 | 尘肺诊断的生物标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114544982A true CN114544982A (zh) | 2022-05-27 |
Family
ID=81665883
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210314458.9A Pending CN114544982A (zh) | 2022-03-28 | 2022-03-28 | 尘肺诊断的生物标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114544982A (zh) |
-
2022
- 2022-03-28 CN CN202210314458.9A patent/CN114544982A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109884302B (zh) | 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用 | |
CN111289736A (zh) | 基于代谢组学的慢阻肺早期诊断标志物及其应用 | |
CN112798771B (zh) | 用于诊断脑白质病变的生物标志物及其应用 | |
CN112798727B (zh) | 用于诊断脑白质病变的生物标志物f7及其应用 | |
US20150126403A1 (en) | Method of identifying proteins in human serum indicative of pathologies of human lung tissues | |
CN112834653A (zh) | 用于诊断脑白质病变的生物标志物f3及其应用 | |
CN115932277A (zh) | 一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用 | |
CN113447599B (zh) | 用于诊断脑白质病患者患脑梗死的生物标志物及其应用 | |
CN109946411B (zh) | 用于胸椎黄韧带骨化诊断的生物标记物及其筛选方法 | |
CN111458417A (zh) | 联合检测待测样品中多种抗生素的方法及试剂盒 | |
CN114019061B (zh) | 用于帕金森病检测的生物标志物及其应用 | |
WO2022255774A1 (ko) | 아실카르니틴 대사체를 포함하는 구강암 진단용 바이오마커 조성물 | |
CN114414819B (zh) | 诊断尘肺病的生物标志物及其应用 | |
CN114414809B (zh) | 用于诊断尘肺病的生物标志物的应用 | |
CN109946467B (zh) | 一种用于胸椎黄韧带骨化诊断的生物标记物 | |
CN114354952B (zh) | 帕金森病代谢组学生物标志物及其应用 | |
CN114544982A (zh) | 尘肺诊断的生物标志物及其应用 | |
CN114236019B (zh) | 脑白质病变的生物标志物的应用 | |
CN114414818B (zh) | 用于肺尘埃沉着病检测的生物标志物的应用 | |
CN113447600B (zh) | 用于诊断脑白质病患者患脑梗死的生物标志物及其应用 | |
CN114019079B (zh) | 诊断帕金森病的生物标志物及其应用 | |
CN114019078B (zh) | 用于帕金森病诊断的生物标志物的应用 | |
CN114047281B (zh) | 帕金森病的生物标志物的组合及其应用 | |
CN112834652B (zh) | 急性主动脉夹层患者特异性生物标志组合物及其用途 | |
CN115825308A (zh) | 鼻咽癌相关尿液标志物在制备用于鼻咽癌诊断/预后的产品中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |