CN114839369B - 急性高原反应微生物标志物及其应用 - Google Patents

急性高原反应微生物标志物及其应用 Download PDF

Info

Publication number
CN114839369B
CN114839369B CN202210657522.3A CN202210657522A CN114839369B CN 114839369 B CN114839369 B CN 114839369B CN 202210657522 A CN202210657522 A CN 202210657522A CN 114839369 B CN114839369 B CN 114839369B
Authority
CN
China
Prior art keywords
sample
sequencing
acute altitude
product
microbial marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210657522.3A
Other languages
English (en)
Other versions
CN114839369A (zh
Inventor
韩洋
何昆仑
姚咏明
田亚平
赵晓静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese PLA General Hospital
Original Assignee
Chinese PLA General Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese PLA General Hospital filed Critical Chinese PLA General Hospital
Priority to CN202210657522.3A priority Critical patent/CN114839369B/zh
Publication of CN114839369A publication Critical patent/CN114839369A/zh
Application granted granted Critical
Publication of CN114839369B publication Critical patent/CN114839369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2469/00Immunoassays for the detection of microorganisms
    • G01N2469/10Detection of antigens from microorganism in sample from host
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/40Disorders due to exposure to physical agents, e.g. heat disorders, motion sickness, radiation injuries, altitude sickness, decompression illness
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了急性高原反应微生物标志物及其应用。具体的,本发明提供了用于评估急性高原反应风险、诊断急性高原反应或评价急性高原反应程度的微生物标志物。本发明为急性高原反应的诊断和患病风险评估提供了新方法。

Description

急性高原反应微生物标志物及其应用
技术领域
本发明涉及生物技术领域,具体的,本发明涉及急性高原反应微生物标志物及其应用。
背景技术
随着高原地区交通状况的大力改善,高原地区与平原地区之间的联系也越来越紧密。平原人急进高原,未经习服,常因低氧而发生急性高原反应,症状诸如:头疼、心悸、胸闷、气短、乏力、睡眠障碍、外周水肿、恶心、呕吐、紫绀和少尿等,如处置不当,可继发高原肺水肿和高原脑水肿,严重者甚至导致死亡。低气压、低氧、低温、大风、干燥和强太阳辐射是高原特殊环境的主要特点,其中高原低气压性缺氧是是导致高原病的主要病因,而机体缺氧所致功能失代偿和靶器官受损是病变的基础。如果能够找到一些能够指征早期高原反应严重程度的临床生物标志物,将对急性高原反应的预防、病程进展的分类及早期干预有着非常重要的指导意义。
发明内容
本发明的目的在于提供用于评估急性高原反应风险、诊断急性高原反应或评价急性高原反应程度的微生物标志物,以及急性高原反应的诊断和患病风险评估方法,为实现该目的,本发明采用了如下技术方案:
本发明第一方面提供了一种用于诊断急性高原反应或评价急性高原反应程度的微生物标志物,其特征在于,所述的微生物标志物包括下列中的至少一种:g__Gemmiger;s__Gemmiger sp.An120、g__Pseudoflavonifractor;s__Pseudoflavonifractorcapillosus、g__Blautia;s__[Ruminococcus]torques、g__Eubacterium;s__Eubacteriumsp.CAG:38、g__Collinsella;s__Collinsella aerofaciens、g__Blautia;s__Blautiahansenii、g__Unclassified;s__uncultured bacterium,
作为一种优选的实施方式,所述的微生物标志物为g__Gemmiger;s__Gemmigersp.An120、g__Pseudoflavonifractor;s__Pseudoflavonifractor capillosus、g__Blautia;s__[Ruminococcus]torques、g__Eubacterium;s__Eubacterium sp.CAG:38、g__Collinsella;s__Collinsella aerofaciens、g__Blautia;s__Blautia hansenii、和g__Unclassified;s__uncultured bacterium的组合。
本发明第二方面提供了试剂在制备诊断急性高原反应或评价急性高原反应程度的产品中的用途,所述的试剂为检测受试者样品中如本发明第一方面所述的微生物标志物的含量或丰度的试剂。
作为一种实施方式,所述的试剂包括对所述微生物标志物具有特异性的引物、探针、反义寡核苷酸、适配体或抗体。
作为一种实施方式,通过选自以下方法进行微生物标志物的检测:16S测序、全基因组测序、定量聚合酶链反应、PCR-焦磷酸测序、荧光原位杂交、微阵列、或PCR-ELISA。
作为一种实施方式,所述的产品包括试剂盒、试纸、或芯片。
本发明第三方面提供了一种诊断急性高原反应或评价急性高原反应程度的产品,所述的产品包含检测受试者样品中如本发明第一方面所述的微生物标志物的含量或丰度的试剂。
作为一种实施方式,所述的试剂包括通过16S测序、全基因组测序、定量聚合酶链反应、PCR-焦磷酸测序、荧光原位杂交、微阵列或PCR-ELISA检测受试者样品中所述微生物标志物的含量或丰度的试剂。
作为一种实施方式,所述的试剂包括对所述微生物标志物具有特异性的引物、探针、反义寡核苷酸、适配体或抗体。
作为一种实施方式,所述的产品包括试剂盒、试纸、或芯片。
本发明第四方面提供了微生物标志物作为靶点用于筛选治疗或者预防急性高原反应的药物的用途,其中所述微生物标志物包括本发明第一方面所述的微生物标志物。
附图说明
图1为每个特征的贡献值结果图;
图2为特征数目与AUC值对应关系图;
图3为最优模型的ROC曲线。
具体实施方式
本发明所用术语具有相关领域普通技术人员通常理解的含义。然而,为了更好地理解本发明,对一些定义和相关术语的解释如下:
标志物
根据本发明的一个方面,本发明提供了一种微生物标志物。
根据本发明,术语“标志物”也称为“生物学标志物”,是指个体的生物状态的可测量指标。这样的生物标记物可以是在个体中的任何物质,只要它们与被检个体的特定生物状态(例如,疾病)有关系,例如,核酸标志物(也可以称为基因标志物,例如DNA),蛋白质标志物,细胞因子标记物,趋化因子标记物,碳水化合物标志物,抗原标志物,抗体标志物,物种标志物(种/属的标记)和功能标志物(KO/OG标记)等。其中,核酸标志物的含义并不局限于现有可以表达为具有生物活性的蛋白质的基因,还包括任何核酸片段,可以为DNA,也可以为RNA,可以是经过修饰的DNA或者RNA,也可以是未经修饰的DNA或者RNA,以及由它们组成的集合。在本文中核酸标志物有时也可以称为特征片段。在本发明中,生物标志物也可以用“肠道标志物”来表示,因为本发明所发现的与急性高原反应相关的生物标志物均存在于受试者的肠道内。生物标记物经过测量和评估,经常用以检查正常生物过程,致病过程,或治疗干预药理响应,而且在许多科学领域都是有用的。
试剂
本发明提供了试剂在制备诊断急性高原反应或评价急性高原反应程度的产品中的用途,所述的试剂为检测样品中前面所述的微生物标志物的含量或丰度的试剂。所述的试剂可以是本领域的任何常规的试剂,只要可以检测微生物标志物的丰度即可。
本发明所用的术语“丰度”是指生物样品中目标微生物的数量的量度。“丰度”也被称为“负载”。一般通过分子方法,典型地通过例如荧光原位杂交(FISH)、定量聚合酶链反应(qPCR)或PCR/焦磷酸测序测定所述目标微生物的16S rRNA基因拷贝数,进行细菌定量。生物样品内目标核酸序列丰度的定量可能是绝对的或相对的。“相对定量”通常是基于一个或多个内部参考基因,即来自参考菌株的16S rRNA基因,比如使用通用引物并且将目标核酸序列的丰度表达为总细菌16S rRNA基因拷贝的百分比或通过大肠杆菌16S rRNA基因拷贝归一化而测定的总细菌。“绝对定量”通过与DNA标准进行比较或通过DNA浓度归一化来给出目标分子的确切数目。
术语“定量水平”可以是浓度(每单位体积的DNA量)、每细胞数量的DNA量或基因拷贝数、循环阈值(Ct值)或其任何数学变换。
作为可选择的实施方式,检测微生物标志物丰度的试剂包括定量样品中微生物标志物的靶核酸的试剂。所述试剂可基于使用核酸分子的已知方法来发挥其功能:如PCR、如Southern杂交、Northern杂交、点杂交、荧光原位杂交(FISH)、DNA微阵列、ASO法、高通量测序平台等。
作为一种可选择的实施方式,检测微生物标志物的方法是测序的方法,所述测序方法是包括但不限于第二代测序方法或第三代测序方法。进行测序的手段并不受特别限制,通过二代或者三代测序的方法进行测序,可以实现快速高效的测序。作为具体的实施方式,所述测序方法是通过选自Hiseq2000、SOLiD、454、和单分子测序装置的至少一种进行的。由此,能够利用这些测序装置的高通量、深度测序的特点,从而有利于对后续测序数据进行分析,尤其是进行统计学检验时的精确性和准确度。
作为另外一种可选择的实施方式,检测微生物标志物丰度的试剂包括定量样品中微生物标志物的靶蛋白的试剂。所述试剂可基于使用检测蛋白的已知方法来发挥其功能:如夹心免疫测定,例如夹心ELISA,其中使用识别生物标志物上不同表位的两种抗体进行该生物标志物的检测;放射免疫测定(RIA)、直接、间接或对比酶联免疫吸附测定(ELISA)、酶免疫测定(EIA)、荧光免疫测定(FIA)、蛋白质印迹法、免疫沉淀法和基于任何颗粒的免疫测定(如使用金颗粒、银颗粒或乳胶颗粒、磁性颗粒或量子点)。可例如在微量滴定板或条的形式中实施免疫法。
作为依照本发明的检测产品的样品,可以使用例如自活检患者获得的固体样品或流体。样品不受特别限制,只要它适于本发明的测定;例如,它可以包括组织、血液、血浆、血清、淋巴液、尿液、浆膜腔液、脊髓液、滑液、房水、泪液、唾液、粪便或其级分或经过处理的材料。
在本发明的具体实施方案中,所述样品来源于粪便。
在本发明中,所述的试剂包括对所述微生物标志物具有特异性的引物、探针、反义寡核苷酸、适配体或抗体。
术语“引物”指的是能够形成与模板链互补的碱基对(bas e pair),并且起到用于复制模板链的起始点作用的7个~50个核酸序列。引物通常合成而得,但也可以使用自然生成的核酸。引物的序列并不一定需要与模板的序列完全相同,只要充分互补而能够与模板杂交即可。可以混入不改变引物的基本性质的追加特征。作为可以混入的追加特征的例子,有甲基化、带帽、一个以上的核酸被同系物取代和核酸间的修饰,但不限于此。
术语“探针”指的是能与另一分子的特定序列或亚序列或其它部分结合的分子。除非另有指出,术语“探针”通常指能通过互补碱基配对与另一多核苷酸(往往称为“靶多核苷酸”)结合的多核苷酸探针。根据杂交条件的严谨性,探针能和与该探针缺乏完全序列互补性的靶多核苷酸结合。探针可作直接或间接的标记,其范围包括引物。杂交方式包括,但不限于:溶液相、固相、混合相或原位杂交测定法。
术语“寡核苷酸”指的是由脱氧核糖核苷酸、核糖核苷酸或其任意组合构成的短聚合物。寡核苷酸的长度通常在大10个核苷酸和大约100个核苷酸之间。寡核苷酸优选地长度为15个核苷酸到70个核苷酸,最通常的是20个核苷酸到26个核苷酸。寡核苷酸可以用作引物或探针。
术语“适配体”是通过链内碱基间的氢键作用折叠形成稳定的发卡、茎环、假结、口袋、凸环和G-四链体等二级或三级结构,并与靶标产生空间结构匹配的高亲和力和特异性结合的核糖核酸和单链脱氧核糖核酸。
在本发明中,术语“抗体”以最广义使用,而且具体涵盖例如单克隆抗体,多克隆抗体,具有多表位特异性的抗体,单链抗体,多特异性抗体和抗体片段。此类抗体可以是嵌合的,人源化的,人的和合成的。
试剂盒
包含本发明的微生物检测试剂的产品可以试剂盒的形式实现。本发明的试剂盒不仅包含引物、探针、反义寡核苷酸、适体或抗体等用于检测所述微生物的检测试剂,并且还包括一种或多种适用于分析方法的其他成分组合物、溶液或装置。
在一个具体实施例中,在本发明中,包含对所述微生物标志物具有特异性的引物的试剂盒可以是含有用于进行PCR等的扩增反应的基本元件的试剂盒。例如,用于PCR的试剂盒可以包括试管或其他合适的容器、反应缓冲液、三磷酸碱基脱氧核苷酸(dNTP)、酶(如Taq聚合酶和逆转录酶)、脱氧核糖核酸酶(DNase)、核糖核酸酶(RNAse)抑试剂、DEPC-水、或无菌水等。
本发明所用的术语“ROC曲线”或“接受者操作特性曲线”是指展示二元分类器系统的性能随着其辨别阈值的变化的图形曲线。通过在各种阈值设置下绘制真阳性率对假阳性率的曲线来创建该曲线。真阳性率也被称为灵敏度。假阳性率计算为1-特异性。因此,ROC曲线是一系列截断值范围内的真阳性率对假阳性率(灵敏度vs(1-特异性))的图形显示以及选择最佳截断值进行临床使用的方式。将准确度表示为ROC曲线下面积(AUC),为比较测试性能提供了有用的参数。接近1的AUC表示该测试高度灵敏并且具有高度特异性,而AUC接近0.5则表明该测试既不灵敏也不具有特异性。
为更进一步阐述本发明所采取的技术手段及其效果,以下通过具体实施方式来进一步说明本发明的技术方案,但本发明并非局限在实施例范围内。
实施例1轻型急性高原反应人群和重型急性高原反应人群的分类模型
一、急性高原反应评分标准及人群信息
急性高原反应评分标准:急性高原反应路易斯湖国际诊断计分系统表(LakeLouise Scoring System,LLSS,1991).
根据下列5个症状的严重程度打分:头痛(0-3分),胃肠症状(0-3分),虚弱(0-3分),头晕(0-3分),睡眠困难(0-3分),并对最终得分求和。
Rank1(轻型):总得分<5分;
Rank2(重型):总得分≥5分;
对上高原一周内的人群进行分组:Rank1(n=25),Rank2(n=28)。
二、实验方法
本发明利用XGboost机器学习方法,对Rank1和Rank2两组共53人做分类,筛选出了7个微生物物种可以有效对急性高原反应的轻重做划分,AUC值为0.77。具体方法如下:
1、粪便样本采集与DNA提取
收集上述人群的粪便样品后采用试剂盒进行DNA提取,得到提取的DNA样本。
2、宏基因组高通量测序及分析
采用Illumina HiSeq测序平台测序,共获得5,933,464.129,999,99Mbp的原始数据(Raw Data)(平均数据量7,756.16Mbp),经过质控得到5,885,567.3Mbp的有效数据(Clean Data)(平均数据量为7,693.55Mbp),经过单样品组装及混合组装后,共得到97,165,177,458bp的Scaftigs。对各样品及混合组装的结果,采用MetaGeneMark软件进行基因预测,共得到123,459,411个开放阅读框(ORFs)(平均为161,385),经过去冗余后,共获得6,727,989个ORFs,总长为4,584.45Mbp,其中完整基因的个数为3,686,582,所占比例为54.79%。非冗余基因集与MicroNR库进行blastp比对,运用LCA算法进行物种注释,注释到属和门的比例分别为65.11%,86.00%。
(1)测序数据预处理
质控结果概述:总共测序数据量为5,933,464.129,999,99Mbp,平均测序数据量为7,756.16Mbp,质控后总体数据量及平均数据量分别为5,885,567.3Mbp,7,693.55Mbp,质控的有效数据率为99.19%。
数据预处理的具体处理步骤如下:
1)去除所含低质量碱基(质量值<=38)超过一定比例(默认设为40bp)的reads;
2)去除N碱基达到一定比例的reads(默认设为10bp);
3)去除与Adapter之间overlap超过一定阈值(默认设为15bp)的reads;
4)如果样品存在宿主污染,需与宿主数据库进行比对,过滤掉可能来源于宿主的reads;
(2)Metagenome组装
组装结果概述:共组装得到105,500,331,957bp的Scaffolds,平均长度为1,934.98bp,最大长度为1,733,071bp,N50为4,517.84bp,N90为692.50bp;从N处打断Scaffolds,生成Scaftigs,共得到97,165,177,458bp的Scaftigs,Scaftigs平均长度为1,868bp,N50为4,139bp,N90为678bp。
Metagenome组装的具体处理步骤如下:
1)经过预处理后得到Clean Data,使用SOAP denovo组装软件进行组装;
2)对于单个样品,首先选取一个K-mer(默认选取55)进行组装,得到该样品的组装结果;
3)将组装得到的Scaffolds从N连接处打断,得到不含N的序列片段,称为Scaftigs(i.e.,continuous sequences within scaffolds);
4)将各样品质控后的CleanData采用Bowtie2软件比对至各样品组装后的Scaftigs上,获取未被利用上的PE reads;
5)将各样品未被利用上的reads放在一起,进行混合组装,组装时,考虑到计算消耗和时间消耗,只选取一个kmer进行组装(默认-K 55),其他组装参数与单样品组装参数相同;
6)将混合组装的Scaffolds从N连接处打断,得到不含N的Scaftigs序列;
7)对于单样品和混合组装生成的Scaftigs,过滤掉500bp以下的片段,并进行统计分析和后续基因预测;
(3)基因预测及丰度分析
基因预测结果概述:一共预测得到123,459,411条ORFs,平均每个样品161,385条ORFs;经去冗余后,得到6,727,989条ORFs,去冗余后的ORFs总长为4,584.45Mbp,平均长度681.4bp,GC含量为45.77%,其中,完整基因有3,686,582个,占所有非冗余基因总数的54.79%。
基因预测基本步骤:
1)从各样品及混合组装的Scaftigs(>=500bp)出发,采用MetaGeneMark进行ORF(Open Reading Frame)预测及过滤;
2)对各样品及混合组装的ORF预测结果,采用CD-HIT软件进行去冗余;
3)将各样品的Clean Data比对至去冗余后的代表性基因上,计算得到基因在各样品中比对上的reads数目;
4)过滤掉在各个样品中,不存在支持reads数目>2的基因,获得最终用于后续分析的gene catalogue(Unigenes);
5)从比对上的reads数目及基因长度出发,计算得到各基因在各样品中的丰度信息;
6)基于gene catalogue中各基因在各样品中的丰度信息,进行基本信息统计,core-pan基因分析,样品间相关性分析,及基因数目韦恩图分析。
(4)物种注释
物种注释结果概述:原始去冗余后的预测基因共有6,727,989条,其中,能够注释到NR数据库的ORFs数目为5,317,849(79.04%),在能够注释到NR数据库的ORFs中,注释到界水平的比例为88.82%,门水平的比例为86.00%,纲水平的比例为81.43%,目水平的比例为80.77%,科水平的比例为69.52%,属水平的比例为65.11%,种水平的比例为49.00%。其中占主导地位的门主要包括Firmicutes,Proteobacteria,Bacteroidetes等。组间具有显著性差异的门主要有k__Bacteria\;p__Actinobacteria,k__Bacteria\;p__Chlamydiae,k__Archaea\;p__Euryarchaeota等。
注释基本步骤:
1)使用DIAMOND软件将Unigenes与从NCBI的NR(Version:2018.01)数据库中抽提出的细菌(Bacteria)、真菌(Fungi)、古菌(Archaea)和病毒(Viruses)序列进行比对(blastp,evalue<=1e-5);
2)比对结果过滤:对于每一条序列的比对结果,选取evalue<=最小evalue*10的比对结果进行后续分析;
3)过滤后,采取LCA算法(应用于MEGAN软件的系统分类),将出现第一个分支前的分类级别,作为各序列的物种注释信息;
4)从LCA注释结果及基因丰度表出发,获得各个样品在各个分类层级(界门纲目科属种)上的丰度信息和基因数目信息;
5)从各个分类层级(界门纲目科属种)上的丰度表出发,进行Krona分析,相对丰度概况展示,丰度聚类热图展示,PCA和NMDS降维分析,Anosim组间(内)差异分析,组间差异物种的Metastat和LEfSe多元统计分析。
3、分类模型的构建
利用上述流程得到的微生物物种丰度信息表建立机器学习分类模型。
基于XGBoost(eXtreme Gradient Boosting)选取不同数量的肠道微生物特征对上述Rank1组人群和Rank2组人群做分类,并使用十折交叉验证的方式最终取AUC值(ROC曲线下方的面积大小)的平均值,每次随机取数据的70%作为训练集,剩余的30%作为测试集,最终筛选出最优分类模型包含的7个特征:g__Gemmiger;s__Gemmiger sp.An120、g__Pseudoflavonifractor;s__Pseudoflavonifractor capillosus、g__Blautia;s__[Ruminococcus]torques、g__Eubacterium;s__Eubacterium sp.CAG:38、g__Collinsella;s__Collinsella aerofaciens、g__Blautia;s__Blautia hansenii、g__Unclassified;s__uncultured bacterium。
三、实验结果
基于7个特征构建的模型为最优模型。图1为每个特征的贡献值结果图;图2为特征数目与AUC值对应关系图。
图3为最优模型的ROC曲线,AUC值为0.77,说明这7个微生物物种可以有效对急性高原反应的轻重做划分。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

Claims (9)

1.一种用于诊断急性高原反应或评价急性高原反应程度的微生物标志物,其特征在于,所述的微生物标志物为g__Gemmiger;s__Gemmiger sp. An120、g__Pseudoflavonifractor;s__Pseudoflavonifractor capillosus、g__Blautia;s__[Ruminococcus] torques、g__Eubacterium;s__Eubacterium sp. CAG:38、g__Collinsella;s__Collinsella aerofaciens、g__Blautia;s__Blautia hansenii、和g__Unclassified;s__uncultured bacterium的组合。
2.试剂在制备诊断急性高原反应或评价急性高原反应程度的产品中的用途,其特征在于,所述的试剂为检测受试者样品中如权利要求1所述的微生物标志物的含量或丰度的试剂。
3.权利要求2所述的用途,其特征在于,所述的试剂包括对所述微生物标志物具有特异性的引物、探针、适配体或抗体。
4.根据权利要求3所述的用途,其特征在于,通过选自以下方法进行微生物标志物的检测:16S测序、全基因组测序、定量聚合酶链反应、PCR-焦磷酸测序、荧光原位杂交、微阵列、或PCR-ELISA。
5.根据权利要求2所述的用途,其特征在于,所述的产品包括试剂盒、试纸、或芯片。
6.一种诊断急性高原反应或评价急性高原反应程度的产品,其特征在于,所述的产品包含检测受试者样品中如权利要求1所述的微生物标志物的含量或丰度的试剂。
7.根据权利要求6所述的产品,其特征在于,所述的试剂包括通过16S测序、全基因组测序、定量聚合酶链反应、PCR-焦磷酸测序、荧光原位杂交、微阵列或PCR-ELISA检测受试者样品中所述微生物标志物的含量或丰度的试剂。
8.根据权利要求6所述的产品,其特征在于,所述的试剂包括对所述微生物标志物具有特异性的引物、探针、适配体或抗体。
9.根据权利要求6所述的产品,其特征在于,所述的产品包括试剂盒、试纸、或芯片。
CN202210657522.3A 2022-06-10 2022-06-10 急性高原反应微生物标志物及其应用 Active CN114839369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210657522.3A CN114839369B (zh) 2022-06-10 2022-06-10 急性高原反应微生物标志物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210657522.3A CN114839369B (zh) 2022-06-10 2022-06-10 急性高原反应微生物标志物及其应用

Publications (2)

Publication Number Publication Date
CN114839369A CN114839369A (zh) 2022-08-02
CN114839369B true CN114839369B (zh) 2023-04-18

Family

ID=82573631

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210657522.3A Active CN114839369B (zh) 2022-06-10 2022-06-10 急性高原反应微生物标志物及其应用

Country Status (1)

Country Link
CN (1) CN114839369B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108514901A (zh) * 2018-06-01 2018-09-11 东莞东阳光科研发有限公司 一种数字微流控芯片
CN111647673A (zh) * 2020-06-17 2020-09-11 中国医学科学院北京协和医院 微生物菌群在急性胰腺炎中的应用
CN112063709A (zh) * 2020-09-15 2020-12-11 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) 一种以微生物作为诊断标志物的重症肌无力的诊断试剂盒及应用
CN112251520A (zh) * 2020-09-19 2021-01-22 河北医科大学第二医院 微生物标志物在脑梗死诊断和治疗效果评价中的应用
CN113637744A (zh) * 2021-10-13 2021-11-12 中国医学科学院北京协和医院 微生物标志物在判断急性胰腺炎病程进展中的应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108514901A (zh) * 2018-06-01 2018-09-11 东莞东阳光科研发有限公司 一种数字微流控芯片
CN111647673A (zh) * 2020-06-17 2020-09-11 中国医学科学院北京协和医院 微生物菌群在急性胰腺炎中的应用
CN112063709A (zh) * 2020-09-15 2020-12-11 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) 一种以微生物作为诊断标志物的重症肌无力的诊断试剂盒及应用
CN112251520A (zh) * 2020-09-19 2021-01-22 河北医科大学第二医院 微生物标志物在脑梗死诊断和治疗效果评价中的应用
CN113637744A (zh) * 2021-10-13 2021-11-12 中国医学科学院北京协和医院 微生物标志物在判断急性胰腺炎病程进展中的应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
颜怡炜 等.高原缺氧环境下肠道菌群紊乱与急性重病症高原病.《临床医药文献杂志》.2017,第4530页. *

Also Published As

Publication number Publication date
CN114839369A (zh) 2022-08-02

Similar Documents

Publication Publication Date Title
CN111440884B (zh) 源于肠道的诊断肌少症的菌群及其用途
CN108368551B (zh) 用于诊断结核病的方法
CN111411150B (zh) 诊断肌少症的肠道菌群及其应用
US10793911B2 (en) Host DNA as a biomarker of Crohn&#39;s disease
CN111647673A (zh) 微生物菌群在急性胰腺炎中的应用
CN113637744B (zh) 微生物标志物在判断急性胰腺炎病程进展中的应用
CN114566224B (zh) 一种用于鉴别或区分不同海拔人群的模型及其应用
CN114839369B (zh) 急性高原反应微生物标志物及其应用
CN112011605B (zh) 微生物菌群在疾病诊断中的应用
CN112063709B (zh) 一种以微生物作为诊断标志物的重症肌无力的诊断试剂盒及应用
US11898210B2 (en) Tools for assessing FimH blockers therapeutic efficiency
CN113584190A (zh) 一种诊断草酸钙结石的肠道菌群标志物及其应用
CN102766573A (zh) 基因群检测结构
JP2021175381A (ja) アトピー性皮膚炎の検出方法
CN111662992A (zh) 与急性胰腺炎相关的菌群及其应用
CN113637782B (zh) 与急性胰腺炎病程进展相关的微生物标志物及其应用
CN114736970B (zh) 一种鉴别不同人群的方法
CN111996248B (zh) 检测微生物的试剂及其在重症肌无力诊断中的应用
CN112226501B (zh) 一种重症肌无力的肠道菌群标志物及其应用
CN112634983B (zh) 病原物种特异pcr引物优化设计方法
CN112011606B (zh) 肠道菌群在重症肌无力中的应用
CN111733206A (zh) 阴道微生物在复发性流产中的应用
KR20230028619A (ko) 아토피성 피부염 진단용 바이오마커 및 이의 용도
CN116377053A (zh) 冠状动脉扩张症的诊断生物标志物及其应用
CN116875685A (zh) 一种肝硬化合并门静脉系统血栓形成的诊断模型及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant