CN114414809A - 用于诊断尘肺病的生物标志物的应用 - Google Patents

用于诊断尘肺病的生物标志物的应用 Download PDF

Info

Publication number
CN114414809A
CN114414809A CN202210314440.9A CN202210314440A CN114414809A CN 114414809 A CN114414809 A CN 114414809A CN 202210314440 A CN202210314440 A CN 202210314440A CN 114414809 A CN114414809 A CN 114414809A
Authority
CN
China
Prior art keywords
equal
pneumoconiosis
less
flavone
methylenedioxy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210314440.9A
Other languages
English (en)
Other versions
CN114414809B (zh
Inventor
薛腾
陈显扬
丁春光
彭方达
常婷婷
宋王婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongyuan Birui Biotechnology Zhuhai Hengqin Co ltd
Original Assignee
Zhongyuan Birui Biotechnology Zhuhai Hengqin Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongyuan Birui Biotechnology Zhuhai Hengqin Co ltd filed Critical Zhongyuan Birui Biotechnology Zhuhai Hengqin Co ltd
Priority to CN202210314440.9A priority Critical patent/CN114414809B/zh
Publication of CN114414809A publication Critical patent/CN114414809A/zh
Application granted granted Critical
Publication of CN114414809B publication Critical patent/CN114414809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/64Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving ketones
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • G01N30/8679Target compound analysis, i.e. whereby a limited number of peaks is analysed
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/92Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving lipids, e.g. cholesterol, lipoproteins, or their receptors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/04Preparation or injection of sample to be analysed
    • G01N30/06Preparation
    • G01N2030/062Preparation extracting sample from raw material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2405/00Assays, e.g. immunoassays or enzyme assays, involving lipids
    • G01N2405/04Phospholipids, i.e. phosphoglycerides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/12Pulmonary diseases
    • G01N2800/122Chronic or obstructive airway disorders, e.g. asthma COPD
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biotechnology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Signal Processing (AREA)

Abstract

本发明提供了用于诊断尘肺病的生物标志物的应用,生物标志物为7‑甲氧基‑5,6:3',4'‑双(亚甲基二氧基)黄酮在制备诊断尘肺病的检测试剂中的应用,通过生物标志物7‑甲氧基‑5,6:3',4'‑双(亚甲基二氧基)黄酮结合神经酰胺(d18:1/23:0)、磷脂酸(O‑16:0/18:0)、矢车菊素3‑(2G‑木糖基尿素苷),来判断患尘肺病的风险,可进行提前预防尘肺病的发生。

Description

用于诊断尘肺病的生物标志物的应用
技术领域
本发明属于生物检测技术领域,具体涉及一种用于诊断尘肺病的生物标志物的应用。
背景技术
尘肺病,学名为肺尘埃沉着病(Pneumoconiosis),是一种典型且严重的职业病。由于职业原因,工人长期吸入生产性粉尘(灰尘),容易导致肺部粉尘滞留,引起肺组织弥漫性纤维化,而粉尘中的二氧化硅含量越高,尘肺病发病时间越短,病变就越严重。
但是就目前诊断与检测技术而言,一般情况下,尘肺病诊断只能通过肺部CT或组织活检的方式确认患者。
尘肺病的发病时间受到个人体质与保护措施的影响,短的可能数月患病,时间长的几年至十几年不等。但是通常来讲,如果未经呼吸防护,环境又不好,短时间内即可患尘肺病。基于尘肺病病理的特殊性以及发病的不确定性,正在沿用的价格高昂、及时性差的检测方式越来越不适合尘肺病检测与诊断,许多病人确诊尘肺病时已经进行至病理进程中晚期,极不利于后续治疗,致使病人沉陷长期的痛苦与折磨之中。
代谢组学是一种新兴的组学技术,在生物学研究中发挥着越来越重要的作用,因为它能够揭示机体细胞代谢的独特化学指纹特征。代谢组学作为一种无偏的小分子代谢物研究方法,代谢组学可通过分析内源性代谢物的变化来反映机体的状态,并进而识别特异性生物标志物或标志物群。如何寻找一种易于检测的生物标志物及方法,用来预测和诊断尘肺病是亟需解决的技术问题。
发明内容
为了解决上述技术问题,本发明提供生物标志物磷脂酸(O-16:0/18:0)在制备诊断尘肺病的检测试剂中的应用。
为实现上述目的,本发明采用以下的技术方案为:
生物标志物7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮在制备诊断尘肺病的检测试剂中的应用。
生物标志物还包括神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)。
生物标志物7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮,结合神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)在制备诊断尘肺病的检测试剂中的应用。
如上所述的应用,优选地,其是将7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮结合神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)来判断是否存在有患尘肺病的风险。
如上所述的应用,优选地,通过检测血清中磷脂酸(O-16:0/18:0) 的含量、神经酰胺(d18:1/23:0)、7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮、矢车菊素3-(2G-木糖基尿素苷)的含量,将7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮的含量记为R28、磷脂酸(O-16:0/18:0)的含量记为R11、矢车菊素3-(2G-木糖基尿素苷)的含量记为R52、神经酰胺(d18:1/23:0)的含量记为R20;满足下面任一种情况,则判定为尘肺病,除此五种情况之外的其余情况,均不判定为尘肺病;
(1)R28<0.68;
(2)R28≥0.68,R11≥0.72且R52≥1.4;
(3)R28≥0.68,R11≥0.72且R52<1.4,0.78≤R52<1.2;
(4)R28≥0.68,R11<0.72 且0.46≤R20<1.3,且R52≤1.4;
(5)R28≥0.68,R11<0.72 且R20≥0.46,R52≥1.4且R20≥0.91。
如上所述的应用,优选地,通过检测血清中7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮的含量,结合神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)的含量,根据此四种生物标志物构成的机器学习条件概率决策树模型中的TC值预测尘肺病:若TC≥0.548,则判定为尘肺病;若TC<0.548,则为无尘肺病。
如上所述的应用,优选地,机器学习条件概率决策树模型的构建是使用R语言的rpart包进行决策树模型建立,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1。
本发明的有益效果在于:
本发明提供了新的生物标志物7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮、神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)及判别尘肺病的模型,可用于早期发现、诊断和预测尘肺病,在制备检测尘肺病的检测试剂盒应用。
本发明提供的用于诊断脑尘肺病的生物标志物为包括7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷),根据测定的血清中个生物标志物的含量或根据这四种生物标志物构成的机器学习条件概率决策树模型中的TC值预测尘肺病,有助于诊断是否存在尘肺病的倾向,可用于提前预防。
附图说明
图1为正离子模式下正常环境对照组与易感尘肺病环境对照组比较的S-plot图;
图2为负离子模式下正常环境对照组与易感尘肺病环境对照组比较的S-plot图;
图3为正离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的S-plot图;
图4为负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的S-plot图;
图5为正离子模式下正常环境对照组与易感尘肺病环境对照组比较的VIP>1的化合物;
图6为负离子模式下正常环境对照组与易感尘肺病环境对照组比较的VIP>1的化合物;
图7为正离子模式下正常环境对照组与易感尘肺病环境对照组比较的(O)PLS-DA的得分图;
图8为负离子模式下正常环境对照组与易感尘肺病环境对照组比较的(O)PLS-DA的得分图;
图9为正离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的VIP>1的化合物;
图10为负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的VIP>1的化合物;
图11为正离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的(O)PLS-DA的得分图;
图12为负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的(O)PLS-DA的得分图;
图13为正常环境对照组与易感尘肺环境对照组、易感尘肺环境对照组与患尘肺病实验组比较的初步标志物上调下调韦恩图;
图14为易感尘肺环境对照组与患尘肺病实验组比较得出的最终标志物建立的决策树概率模型图(变量为R11+R20+R28+R52);
图15为易感尘肺环境对照组与患尘肺病实验组比较得出的最终标志物建立的决策树概率模型评价图(变量为R11+R20+R28+R52)。
具体实施方式
以下实施例用于进一步说明本发明,但不应理解为对本发明的限制。在不背离本发明精神和实质的前提下,对本发明所作的修饰或者替换,均属于本发明的范畴。
若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。
实施例1
模型建立样本群共196例,其中生活或工作于正常环境未患尘肺病的对照人群50人(作为CK),生活或工作于易感尘肺病环境未患尘肺病的对照人群85人(作为CFD),尘肺病患者人群61人(作为CFB),年龄范围在30岁以上。
生活或工作于正常环境未患尘肺病的对照人群、生活或工作于易感尘肺病环境未患尘肺病的对照人群中,肺功能指标正常,胸透X光成像检测显示无异常。
尘肺病患者人群中,肺功能指标异常,胸透X光成像检测显示存在异常。
1.样品前处理
收集的上述人群的血清样本在冰上解冻,取200μL的血清用600μL的预冷异丙醇萃取,涡流1min,室温孵育10min,然后将萃取混合物在-20◦C下储存过夜,然后在低温冷冻离心机(E3116R,ESSENSCIEN公司,美国)12000rpm离心20min后,将取260μL上清液到新的离心管中,加入130μL异丙醇,130μL乙腈和65μL超纯水,调节样品异丙醇/乙腈/水按体积比的比例为2.5:1:1。样品在LC-MS分析前保存在-80℃。此外,还将每个萃取混合物的10μL组合在一起制备混合QC样品。
10mM甲酸铵-0.1%甲酸-乙腈-超纯水:具体指含溶质为10 mM甲酸铵和0.1%甲酸,溶剂为体积比为60:40的乙腈:水。
10 mM甲酸铵-0.1%甲酸-异丙醇-乙腈:具体指含溶质为10 mM甲酸铵和0.1%甲酸,溶剂为体积比为90:10的异丙醇:乙腈。
其中本发明中所用的试剂:异丙醇、甲酸,乙腈,甲酸铵,LC-MS级厂家均为Fisher。
2. 脂质组学的超高效液相色谱-质谱联用方法
样品用超高效液相色谱(UPLC;型号:ACQUITY UPLC I-Class系统;厂家:Waters,Manchester,UK)连接到带有ESI的Xevo-G2XS高分辨飞行时间 (QTOF)质谱仪(Waters)进行分析。采用CQUITY UPLC BEH C18色谱柱(2.1×10 0 mm,1.7μm,Waters),流动相A:流动相为10mM甲酸铵-0.1%甲酸-乙腈-超纯水,流动相B为:10 mM甲酸铵-0.1%甲酸-异丙醇-乙腈。在大规模研究之前,进行了包括10分钟、15分钟和20分钟洗脱期的中试实验,以评估流动相组成和流速对脂质保留时间的潜在影响。在PIM中,丰富的脂质前体离子和碎片以相同的顺序分离,具有相似的峰形和离子强度。此外,具有10分钟洗脱期的混合QC样品也表现出与测试样品相似的前体和碎片的基峰强度。流动相流速为0.4mL/min。该柱最初用40%流动相B洗脱,然后在2分钟内线性梯度到43%流动相B,然后在0.1min内将流动相B的百分比增加到50%。在接下来的3.9分钟内,梯度进一步增加到54%流动相B,然后流动相B的量0.1分钟内增加到70%。在梯度的最后部分,流动相B的量在1.9分钟内增加到99%。最后,流动相B在0.1分钟内返回到40%,并且在下一次进样之前将色谱柱平衡1.9分钟。每次进样量为5μL,用Xevo-G2XS型QTOF质谱仪检测正负两种模式下的脂质,采集范围为 m/z50~1200年,采集时间为0.2s/次。离子源温度为120℃,去溶温度为600℃,气体流量为1000L/h,以氮气为流动气体。毛细管电压为2.0kV(+)/锥体电压为1.5kV(-),锥体电压为30V。以亮氨酸脑啡肽进行标准质量测定,用甲酸钠溶液进行校正。样品被随机排序。每10个样本注入一个QC样本并进行分析,以调查数据的重复性。
采用数据采集软件(MassLynx4.1;厂家:Waters)进行数据采集,结果分析:
(1)利用传统统计学寻找血清差异物质
使用Progenesis QI将质谱数据转化为可供统计的数据形式,正交偏最小二乘判别分析(OPLS-DA)结合了正交信号矫正(OSC)和 PLS-DA(偏最小而成判别分析) 方法,通过去除不相关的差异来筛选差异变量。如图1、图2为正、负离子模式下正常环境对照组与易感尘肺病环境对照组比较的S-plot图(A代表正离子,B代表负离子),图3、图4为正、负离子模式下易感尘肺病环境对照组与患尘肺病实验组比较的S-plot图(A代表正离子,B代表负离子),图中,横坐标表示主成分与代谢物的协相关系数,纵坐标表示主成分与代谢物的相关系数。满足p<0.05的条件下,正常环境对照组与易感尘肺病环境对照组相比,正离子模式有2099个差异物,负离子模式有1383个差异物;满足p<0.05的条件下,正常环境对照组与易感尘肺病环境对照组相比,正离子模式有2109个差异物,负离子模式有1383个差异物。
(2)利用多元统计学寻找血清中显著变化的差异物质
正交偏最小二乘判别分析(OPLS-DA)结合了正交信号矫正(OSC)和 PLS-DA(偏最小而成判别分析) 方法,通过去除不相关的差异来筛选差异变量。如图5、图6的VIP值为正、负离子模式下正常环境对照组与易感尘肺病环境对照组比较时PLSDA第一主成分的变量重要性投影,通常以VIP>1为代谢组学常用评判标准,作为差异代谢物筛选的标准之一;图7与图8为正、负离子模式下正常环境对照组(CK表示)与易感尘肺病环境对照组(CFD表示)两个分组中的第一主成分和第二主成分通过降维的方式所得的得分图,横坐标表示组间差异,纵坐标表示组内差异,且两组结果分离较好,说明此方案可以使用。易感尘肺病环境对照组(CFD表示)与患尘肺病实验组(CFB表示)建模同理(VIP图:如图9与图10,主成分图:如图11与图12)。在同时满足p<0.05,VIP>1的条件下:正常环境对照组(CK表示)与易感尘肺病环境对照组(CFD表示)比较中,正离子模式有92个差异物,负离子模式有159个差异物,共261个;易感尘肺病环境对照组(CFD表示)与患尘肺病实验组(CFB表示)比较中,正离子模式有45个差异物,负离子模式有27个差异物,共72个。图5与图6、图9与图10说明三组间两两比较时,CK组与CFD组、CFD与CFB组比较均有很多显著富集(VIP值大于1)的化合物,其中可能存在着干扰因素。图7与图8、图11与图12说明三组间两两比较时,CK组与CFD组、CFD与CFB组比较都可以有很好的建模效果,两组间的样本信息均可以被有效提取。
(3)对差异物质的混杂因素剔除
针对差异物上调或下调的情况进行进一步比较。由于在非易感尘肺病环境不能得尘肺病的实际情况,对CFD组与CFB组的存在差异的全体化合物进行了混杂因素剔除。在图13中,在 CFD组、CFB组比较得出的差异物中去除了与CK组、CFD组比较得出的差异物中重合的部分,最终获取了26个特异性强的CFB组上调差异物、27个特异性强的CFB组下调差异物。
为了进一步缩小范围,将53个化合物进行大量分析筛选出以下4种化合物,具体如下表1。
表1尘肺病相关脂质筛选结果表
Figure 453588DEST_PATH_IMAGE001
(4)内部人群十折交叉验证结果
为提高种变量化合物的生物诊断效果,需要根据上述生物标志物找出适合的模型进行下一步的分析。由于真实世界中的非线性存在,本实施例中选定半参数的决策树概率模型,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1; 模型由结点和有向边组成。结点有两种类型:内部结点和叶结点,其中内部结点表示一个特征或属性,叶结点表示一个类。一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点则对应于一个属性测试。每个结点包含的样本集合根据属性测试的结果被划分到子结点中,根结点包含样本全集,从根结点到每个叶结点的路径对应了一个判定测试序列。
将全体人群随机分为10份,选择1份为验证集,其他为训练集,如此反复十次,考察最佳的变量组合。考察四种化合物组合在决策树模型建设过程中的内部稳定性,包括AUC,敏感度,特异性都取平均值,并进行统计学显著性计算,结果如下表2,其中次序号对应的是内部验证中的第几次验证的序号,建模自变量为上述四个化合物,因变量为结局变量TC。
表2
Figure 379956DEST_PATH_IMAGE002
结果说明四种化合物组合形成的决策树模型内部稳定性优秀,AUC平均值稳定在0.81左右。
基于上述分析,建立了决策树模型,使用R语言的rpart包进行决策树模型建立,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1,模型图如图14,图中满足条件(yes)往左走,不满足条件往右走。R28、R11、R52、R20分别表示7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)、神经酰胺(d18:1/23:0)测得血清中在质谱检测下的离子强度,作为化合物的测定值,其中综合来看,当R28值小于0.68时,此一种情况将检测者判定为尘肺病人;当R28值大于等于0.68时,R11值大于等于0.72且R52值大于等于1.4此一种情况,将检测者判定为尘肺病人;当R28值大于等于0.68时,R11值大于等于0.72且R52值小于1.4且R52值小于1.2且R52值大于等于0.78此一种情况,将检测者判定为尘肺病人;当R28值大于等于0.68时,R11值小于0.72且R20值大于等于0.46且R52值小于1.4且R20值小于1.3此一种情况,将检测者判定为尘肺病人;当R28值大于等于0.68时,R11值小于0.72且R20值大于等于0.46且R52值大于等于1.4且R20值大于等于0.91此一种情况,将检测者判定为尘肺病人。除此五种情况之外的其余情况,均不判定检测者为尘肺病人。
也就是说,测得的各物质的含量,将7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮的含量记为R28,磷脂酸(O-16:0/18:0)的含量记为R11,矢车菊素3-(2G-木糖基尿素苷)的含量记为R52,神经酰胺(d18:1/23:0)的含量记为R20,满足下面任一种情况,则判断为检测者为尘肺病人,除此五种情况之外的其余情况,均不判定检测者为尘肺病人。
(1)R28<0.68;
(2)R28≥0.68,R11≥0.72且R52≥1.4;
(3)R28≥0.68,R11≥0.72且R52<1.4,0.78≤R52<1.2;
(4)R28≥0.68,R11<0.72 且0.46≤R20<1.3,且R52≤1.4;
(5)R28≥0.68,R11<0.72 且R20≥0.46,R52≥1.4且R20≥0.91。
应用时也可将上述四种指标的测量值带入模型通过计算机运算即可得出TC值;若TC≥0.548,则判定为尘肺病;若TC<0.548,则无尘肺病为正常。
(5)外部数据集,决策树模型验证
通过外部人群的数据集验证上述结果的准确性,并绘制相应的ROC曲线图,结果如下:
验证人群:204人(外部人群),取样标准同上面所述的样本人群。生活或工作于易感尘肺病环境未患尘肺病的对照人群101人,尘肺病患者人群103人。进行决策树模型验证。
模型中的变量为上述4个代谢物R11+R20+R28+R52,依据化合物含量值建立决策树模型,模型评价图如图15。
Sensitivity (敏感性)=0.913
Specificity (特异性)=0.803
Accuracy(准确度) =0.872
Thresholds(阈值) =0.548
根据样本的四种标志物检测数据带入所构成的机器学习条件概率决策树模型中的TC值预测尘肺病,若TC≥0.548,则判定样本为尘肺病;若TC<0.548,则无尘肺病。
数据显示:磷脂酸(O-16:0/18:0)结合神经酰胺(d18:1/23:0)、7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮、矢车菊素3-(2G-木糖基尿素苷)表现出非常高的诊断能力,未来能进行临床试剂盒的应用。
通过对样本信息的对比分析可知:以上4种生物标志物,与易感尘肺病环境对照组相比,R20、R52在尘肺病患组呈下降趋势,R11、R28则相反。

Claims (5)

1.生物标志物7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮在制备诊断尘肺病的检测试剂中的应用。
2.如权利要求1所述的应用,其特征在于,生物标志物7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮结合神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)在制备诊断尘肺病的检测试剂中的应用。
3.如权利要求1所述的应用,其特征在于,将7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮的含量记为R28、磷脂酸(O-16:0/18:0)的含量记为R11、矢车菊素3-(2G-木糖基尿素苷)的含量记为R52、神经酰胺(d18:1/23:0)的含量记为R20;满足下面任一种情况,则判定为尘肺病,除此五种情况之外的其余情况,均不判定为尘肺病;
(1)R28<0.68;
(2)R28≥0.68,R11≥0.72且R52≥1.4;
(3)R28≥0.68,R11≥0.72且R52<1.4,0.78≤R52<1.2;
(4)R28≥0.68,R11<0.72 且0.46≤R20<1.3,且R52≤1.4;
(5)R28≥0.68,R11<0.72 且R20≥0.46,R52≥1.4且R20≥0.91。
4.如权利要求1所述的应用,其特征在于,通过检测血清中7-甲氧基-5,6:3',4'-双(亚甲基二氧基)黄酮的含量,并结合神经酰胺(d18:1/23:0)、磷脂酸(O-16:0/18:0)、矢车菊素3-(2G-木糖基尿素苷)的含量,根据此四种标志物的含量构成的机器学习条件概率决策树模型中的TC值预测尘肺病:若TC≥0.548,则判定为尘肺病;若TC<0.548,则为无尘肺病。
5.如权利要求4所述的应用,其特征在于,机器学习条件概率决策树模型的构建是使用R语言的rpart包进行决策树模型建立,设定有无尘肺病的变量为因子型变量,建模中的“method”参数设定为“class”,表明建立分类决策树模型;“model”参数设定为“False”,表明重抽样结果中不保留模型框架副本;“parms”参数设定为1,表明先验分布的变异系数对分裂速率的影响系数设定为1。
CN202210314440.9A 2022-03-28 2022-03-28 用于诊断尘肺病的生物标志物的应用 Active CN114414809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210314440.9A CN114414809B (zh) 2022-03-28 2022-03-28 用于诊断尘肺病的生物标志物的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210314440.9A CN114414809B (zh) 2022-03-28 2022-03-28 用于诊断尘肺病的生物标志物的应用

Publications (2)

Publication Number Publication Date
CN114414809A true CN114414809A (zh) 2022-04-29
CN114414809B CN114414809B (zh) 2022-06-21

Family

ID=81263085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210314440.9A Active CN114414809B (zh) 2022-03-28 2022-03-28 用于诊断尘肺病的生物标志物的应用

Country Status (1)

Country Link
CN (1) CN114414809B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1519236A (zh) * 2003-09-01 2004-08-11 ƽ 黄酮类化合物及含该类化合物提取物的用途和剂型
JP2004256529A (ja) * 2003-02-07 2004-09-16 Takeda Chem Ind Ltd 縮環ピリジン誘導体、その製造法および用途
WO2008119070A1 (en) * 2007-03-28 2008-10-02 Trustees Of Boston University Methods of treatment using sirt modulators and compositions containing sirt1 modulators
WO2008138123A1 (en) * 2007-05-09 2008-11-20 Thomas David Y Screening assay to identify correctors of protein trafficking defects
CN101347465A (zh) * 2007-07-16 2009-01-21 杨国良 黑柄炭角菌发酵液粉及其制备与应用
WO2010012153A1 (zh) * 2008-07-29 2010-02-04 常州高新技术产业开发区三维工业技术研究所有限公司 根皮苷衍生物及其制备方法和应用
US20100199370A1 (en) * 2007-02-06 2010-08-05 The State of Israel, Ministry of Agriculture & Rural Development, Agricultural Research Means and methods of producing fruits with high levels of anthocyanins and flavonols
CN103702654A (zh) * 2011-04-19 2014-04-02 伊诺瓦实验室 类胡萝卜素、植物雌激素和维生素c的组合用于预防和/或治疗色素沉着症的用途
CN103998035A (zh) * 2011-12-19 2014-08-20 阿雷斯贸易股份有限公司 包含格列酮和nrf2激活剂的药物组合物
CN104274682A (zh) * 2014-10-27 2015-01-14 王洪坤 一种治疗煤工尘肺的中药组合物及其制备方法
CN107290552A (zh) * 2017-07-27 2017-10-24 北京师范大学 高凝血状态的生物标志物及其应用
WO2019075263A2 (en) * 2017-10-11 2019-04-18 Illustris Pharmaceuticals, Inc. METHODS AND COMPOSITIONS WITH TOPICAL ADMINISTRATION
CN111999404A (zh) * 2020-08-14 2020-11-27 中元伯瑞生物科技(珠海横琴)有限公司 神经酸在制备甲状腺恶性肿瘤的检测试剂中的应用
CN112834653A (zh) * 2021-04-09 2021-05-25 宝枫生物科技(北京)有限公司 用于诊断脑白质病变的生物标志物f3及其应用
CN114002421A (zh) * 2021-12-30 2022-02-01 佛山市第三人民医院(佛山市精神卫生中心) 外泌体代谢物作为双相情感障碍标志物的应用

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004256529A (ja) * 2003-02-07 2004-09-16 Takeda Chem Ind Ltd 縮環ピリジン誘導体、その製造法および用途
CN1519236A (zh) * 2003-09-01 2004-08-11 ƽ 黄酮类化合物及含该类化合物提取物的用途和剂型
US20100199370A1 (en) * 2007-02-06 2010-08-05 The State of Israel, Ministry of Agriculture & Rural Development, Agricultural Research Means and methods of producing fruits with high levels of anthocyanins and flavonols
WO2008119070A1 (en) * 2007-03-28 2008-10-02 Trustees Of Boston University Methods of treatment using sirt modulators and compositions containing sirt1 modulators
WO2008138123A1 (en) * 2007-05-09 2008-11-20 Thomas David Y Screening assay to identify correctors of protein trafficking defects
CN101347465A (zh) * 2007-07-16 2009-01-21 杨国良 黑柄炭角菌发酵液粉及其制备与应用
WO2010012153A1 (zh) * 2008-07-29 2010-02-04 常州高新技术产业开发区三维工业技术研究所有限公司 根皮苷衍生物及其制备方法和应用
CN103702654A (zh) * 2011-04-19 2014-04-02 伊诺瓦实验室 类胡萝卜素、植物雌激素和维生素c的组合用于预防和/或治疗色素沉着症的用途
CN103998035A (zh) * 2011-12-19 2014-08-20 阿雷斯贸易股份有限公司 包含格列酮和nrf2激活剂的药物组合物
CN104274682A (zh) * 2014-10-27 2015-01-14 王洪坤 一种治疗煤工尘肺的中药组合物及其制备方法
CN107290552A (zh) * 2017-07-27 2017-10-24 北京师范大学 高凝血状态的生物标志物及其应用
WO2019075263A2 (en) * 2017-10-11 2019-04-18 Illustris Pharmaceuticals, Inc. METHODS AND COMPOSITIONS WITH TOPICAL ADMINISTRATION
CN111999404A (zh) * 2020-08-14 2020-11-27 中元伯瑞生物科技(珠海横琴)有限公司 神经酸在制备甲状腺恶性肿瘤的检测试剂中的应用
CN112834653A (zh) * 2021-04-09 2021-05-25 宝枫生物科技(北京)有限公司 用于诊断脑白质病变的生物标志物f3及其应用
CN114002421A (zh) * 2021-12-30 2022-02-01 佛山市第三人民医院(佛山市精神卫生中心) 外泌体代谢物作为双相情感障碍标志物的应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SUNI LEE 等: ""Role of Nephronectin in Pathophysiology of Silicosis"", 《INT. J. MOL. SCI.》 *
张春燕: "黄芪注射液对尘肺患者的抗氧化作用研究", 《中国医学创新》 *
彭方达 等: ""基于UPLC-QTOF/MS的尘肺潜伏性结核患者血清非靶向代谢组学分析"", 《中华劳动卫生职业病杂志》 *

Also Published As

Publication number Publication date
CN114414809B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN109884302B (zh) 基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用
CN111289736A (zh) 基于代谢组学的慢阻肺早期诊断标志物及其应用
CN112798771B (zh) 用于诊断脑白质病变的生物标志物及其应用
US20180088126A1 (en) Method of identifying proteins in human serum indicative of pathologies of human lung tissues
CA2619732A1 (en) Methods for the diagnosis of colorectal cancer and ovarian cancer health states
CN111929430B (zh) 用于诊断认知障碍的生物标记物及其应用
CN112834653A (zh) 用于诊断脑白质病变的生物标志物f3及其应用
CN115932277A (zh) 一种乳腺癌诊断标志物及其筛选方法、定量方法、诊断模型的构建方法及应用
CN113447599B (zh) 用于诊断脑白质病患者患脑梗死的生物标志物及其应用
CN114414809B (zh) 用于诊断尘肺病的生物标志物的应用
CN114414819B (zh) 诊断尘肺病的生物标志物及其应用
CN114019061B (zh) 用于帕金森病检测的生物标志物及其应用
CN109946467B (zh) 一种用于胸椎黄韧带骨化诊断的生物标记物
CN114354952B (zh) 帕金森病代谢组学生物标志物及其应用
CN114280202B (zh) 一种用于诊断镉中毒的生物标志物及其应用
CN114414818B (zh) 用于肺尘埃沉着病检测的生物标志物的应用
CN113447600B (zh) 用于诊断脑白质病患者患脑梗死的生物标志物及其应用
CN114236019B (zh) 脑白质病变的生物标志物的应用
CN115714013A (zh) 一种肺炎诊断的临床预测模型构建方法
CN114544982A (zh) 尘肺诊断的生物标志物及其应用
CN114019079B (zh) 诊断帕金森病的生物标志物及其应用
CN114019078B (zh) 用于帕金森病诊断的生物标志物的应用
CN114047281B (zh) 帕金森病的生物标志物的组合及其应用
CN112834652B (zh) 急性主动脉夹层患者特异性生物标志组合物及其用途
CN114264756A (zh) 用于诊断帕金森病的生物标志物r1及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant