CN115261500B - 爆发力相关的肠道微生物标记物及其应用 - Google Patents
爆发力相关的肠道微生物标记物及其应用 Download PDFInfo
- Publication number
- CN115261500B CN115261500B CN202210970886.7A CN202210970886A CN115261500B CN 115261500 B CN115261500 B CN 115261500B CN 202210970886 A CN202210970886 A CN 202210970886A CN 115261500 B CN115261500 B CN 115261500B
- Authority
- CN
- China
- Prior art keywords
- explosive force
- subject
- intestinal
- clostridium
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/07—Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/145—Clostridium
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/46—Streptococcus ; Enterococcus; Lactococcus
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明属于生物医药领域,具体涉及爆发力相关的肠道微生物标记物及其应用。具体地,所述肠道微生物包括Bacillus_flexus;Allisonella_histaminiformans;Streptococcus_sp_HMSC063B03;Anaerosalibacter_massiliensis;bacterium_MS4;Paenibacillus_algorifonticola;Streptobacillus_moniliformis;Lachnoclostridium_Clostridium_symbiosum;Eubacterium_dolichum_CAG_375等。
Description
技术领域
本发明属于生物医药领域,具体涉及爆发力相关的肠道微生物标记物及其应用。
背景技术
公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
爆发力可以理解为体育运动中指在短暂间突然产生的力量,如起跑、起跳、投掷、扣球时使出的力量。爆发力实质是指不同的肌肉间的相互协调能力,力量素质以及速度素质相结合的一项人体体能素质。爆发力还可根据时间区分出三种不同的爆发力,30秒内的运动肌力与速度属于高爆发力,30秒至5分间的运动,肌耐力属于中爆发力,5分至15分间的运动也就是耐力属于低爆发力之范围。大多数的运动往往需要爆发力,如百米冲刺、杠铃挺举和抓举、投掷铅球等体育运动项目,既需要速度,又需要力量,这些就是爆发力的典型体现。要练出这强大的爆发力,训练手段是要有效提升人的瞬间爆力:快速和力量,一是提升快速动作的驾驭能力;二是提升力量迸发的释放能力。
人的胃肠道内寄居着数以万亿计的微生物,这些微生物称为肠道菌群(肠道微生物),是人体除染色体外的第二套基因组信息。随着DNA测序技术不断更新换代,人们研究肠道菌群的途径越来越方便,关于肠道菌群的研究愈加深入。肠道菌群既维护着人们机体生理活动的平衡,同时又受到多种因素的影响。越来越多的证据表明,人类肠道微生物群(GM)可能是诊断、治疗和预防许多人类疾病的有用标志物和贡献者,如肥胖、糖尿病、肝病、癌症和神经退行性疾病。肠道微生物群是一个复杂的微生态系统,在整个生命周期中保持相对稳定,但可能收到饮食的影响产生波动。
发明内容
本发明收集受试者基本信息及生物样本,通过30米冲刺成绩对受试者进行分组,并统一进行宏基因组高通量测序,对测序得到的基因进行物种注释,得到在两组之间表达量(丰度)表现出显著差异的肠道菌群。再利用机器学习分类模型获得最优模型,经验证,该模型可准确分辨受试者的爆发力强弱(高低)。具体地,本公开提出了如下技术方案:
第一方面,本发明提供了检测以下肠道微生物组合的试剂在分辨强弱爆发力人群中的应用,所述肠道微生物组合由以下微生物组成:
Bacillus_flexus;Allisonella_histaminiformans;
Streptococcus_sp_HMSC063B03;
Anaerosalibacter_massiliensis;bacterium_MS4;Paenibacillus_algorifonticola;
Streptobacillus_moniliformis;Lachnoclostridium_Clostridium_symbiosum;
Eubacterium_dolichum_CAG_375;Thermoflavimicrobium_dichotomicum;
Tepidibacillus_sp_HK_1;Ruminiclostridium_Clostridium_cellobioparum;
Paenibacillus_sp_NAIST15_1;Cellulophaga_lytica;
uncultured_bacterium_Ad_113_I18_contig2;Clostridium_sp_DL_VIII;
Orenia_marismortui;Butyrivibrio_sp_MB2005;
Marinilactibacillus_psychrotolerans;Clostridium_formicaceticum;
Sebaldella_termitidis;Megasphaera_sp_BV3C16_1;Defluviitoga_tunisiensis;
Blautia_sp_Marseille_P3087;Porphyromonas_asaccharolytica。
优选地,所述检测是针对来自于受试者的生物样本进行的;最优选地,所述生物样本是粪便样本。更准确地说,所述检测是检测受试者生物样本中肠道微生物组合中各个微生物的丰度(其基因的表达量强弱即代表了丰度),也即所述检测本发明所述肠道微生物组合的试剂也可以称为检测本发明所述肠道微生物组合中各个微生物的基因表达量的试剂。
优选地,所述基因表达量(gene expression)是指将来自基因的遗传信息合成功能性基因产物的过程,所有已知的生命,都利用基因表达来合成生命的大分子。
优选地,所述检测基因表达量的试剂包括以下方法中使用到的试剂:基于PCR的检测方法、Southern杂交方法、Northern杂交方法、点杂交方法、荧光原位杂交方法、DNA微阵列方法、ASO法、高通量测序平台方法。具体地,所述基于PCR的检测方法示例性的包括但不限于反转录PCR(RT-PCR)、连接酶链反应(Ligase chain reaction,LCR)、重组PCR(recombinant PCR)、巢式PCR(nest PCR)、多重PCR(multiplex PCR)、链替换扩增(Stranddisplacement amplification,SDA)、依赖核酸序列的扩增(Nucleic acid sequence-based amplification,NASBA)、转录依赖的扩增系统(Transcript-based amplificationsystem,TAS)、滚环扩增(Rolling circle amplification,RCA)、环介导的等温扩增(Loopmediated isothermal amplification,LAMP)等。
优选地,所述检测基因表达量的试剂的种类是公知的,具体包括但不限于特异性结合目标序列的特异性探针、扩增目标序列的特异性引物等。
另一方面,本发明提供了一种分辨强弱爆发力人群的试剂盒,所述试剂盒中包含检测以下肠道微生物组合的试剂:
Bacillus_flexus;Allisonella_histaminiformans;
Streptococcus_sp_HMSC063B03;
Anaerosalibacter_massiliensis;bacterium_MS4;Paenibacillus_algorifonticola;
Streptobacillus_moniliformis;Lachnoclostridium_Clostridium_symbiosum;
Eubacterium_dolichum_CAG_375;Thermoflavimicrobium_dichotomicum;
Tepidibacillus_sp_HK_1;Ruminiclostridium_Clostridium_cellobioparum;
Paenibacillus_sp_NAIST15_1;Cellulophaga_lytica;
uncultured_bacterium_Ad_113_I18_contig2;Clostridium_sp_DL_VIII;
Orenia_marismortui;Butyrivibrio_sp_MB2005;
Marinilactibacillus_psychrotolerans;Clostridium_formicaceticum;
Sebaldella_termitidis;Megasphaera_sp_BV3C16_1;Defluviitoga_tunisiensis;
Blautia_sp_Marseille_P3087;Porphyromonas_asaccharolytica。
优选地,所述试剂还可以包括提取DNA的试剂。
优选地,所述试剂还可以包括收集采集自受试者的生物样本的试剂。
优选地,所述试剂还可以包括相应PCR技术所需要的常用试剂,如dNTPs,MgCl2,双蒸水,荧光探针等,这些常用试剂都是本领域技术人员熟知,另外还有标准品和对照(如基因型标准品和空白对照等)。
优选地,所述试剂还可以包括基因表达量辅助检测试剂,所述基因表达量辅助检测试剂包括但不限于:使所述引物对应的扩增子可视化的反应试剂,例如通过琼脂糖凝胶电泳法、酶联凝胶法、化学发光法、原位杂交法、荧光检测法等使扩增子可视化的试剂;RNA提取试剂;逆转录试剂;cDNA扩增试剂;制备标准曲线所用的标准品。
优选地,所述试剂盒中还可以包括检测基因表达量、收集受试者生物样本所需要的仪器。
最优选地,所述生物样本是粪便样本。
另一方面,本发明提供了一种分辨强弱爆发力人群的系统,所述系统中包含根据对肠道微生物组合的检测结果判断受试者爆发力强弱的计算装置。
优选地,所述检测结果是针对来自受试者的样品进行检测而得到的。
最优选地,所述生物样本是粪便样本。
优选地,所述检测包括测序或基因表达量检测,检测得到的肠道微生物组合中各个微生物的基因表达量就可以代表肠道微生物的丰度,根据肠道微生物组合中各个肠道微生物的丰度即可分辨强弱爆发力人群。
优选地,所述系统还可以包括检测装置。
优选地,所述检测包括测序或检测肠道微生物组合中各个肠道微生物的基因表达量。
优选地,所述检测装置可以包括实时定量PCR仪、高通量测序平台、检测芯片和芯片信号读取器等。
优选地,所述系统还可以包括以下任意一种或多种:
1)检测结果收集装置,也可称为检测结果输入装置,具体地可以是鼠标、键盘、触摸屏显示器、一个或多个按钮、一个或多个开关、一个或多个触发器等等中的一个或多个;
2)结果输出装置,也可称为结果显示装置,具体地可以是液晶显示器(LCD)、发光二极管(LED)显示器、等离子体显示器、投影显示器、触摸屏显示器等等中的一个或多个;
3)结果发送装置,所述结果发送装置可以将受试者的是强或弱爆发力人群的分辨结果发送到患者或医护人员可以查阅的信息通信终端装置。
另一方面,本发明提供了前述试剂盒、系统在分辨强弱爆发力人群中的应用,在制备分辨强弱爆发力人群的产品中的应用。
另一方面,本发明提供了判断受试者爆发力强弱的方法,所述方法包括根据对肠道微生物组合的检测结果判断受试者爆发力强弱。
更具体地,所述方法包括以下步骤:
1)收集受试者的生物样本,具体地是粪便样本;
2)提取DNA;
3)测序或检测肠道微生物组合中各个肠道微生物的基因表达量;
4)根据3)的检测结果判断受试者属于强爆发力人群或弱爆发力人群。
本发明所提供的方法和/或系统的实施可包括手动地、自动地、或它们组合地来执行或完成所选任务。而且,根据本发明方法和/或系统的实施方式的实际仪器和设备,可通过硬件、通过软件、或通过固件或通过它们的组合使用操作系统来实施多个所选任务。
另一方面,本发明提供了可用于判断受试者爆发力强弱的肠道微生物组合的筛选方法,所述方法包括以下步骤:
1)将受试者分为爆发力强和爆发力弱两组;
2)检测受试者的候选肠道微生物水平;
3)比较爆发力的强受试者和爆发力弱的受试者检测结果之间的所述候选肠道微生物的差异度和/或相似性,得到差异的肠道微生物;
4)对步骤3)所得到的差异肠道微生物进行验证,AUC数值达到一定标准时即被认定为可用于判断受试者爆发力强弱的肠道微生物。
优选地,所述候选肠道微生物包括人体肠道中可能存在的任何微生物。
优选地,所述爆发力强弱通过30米冲刺的成绩体现。
更具体地,所述爆发力是下肢爆发力。
优选地,所述筛选方法的结果是本发明所提供的肠道微生物组合。
优选地,步骤2)中所述检测是通过基因测序进行的,所述基因测序(DNA测序)的方法可以是本领域所公知的任何测序方法,更具体地如本发明具体实施例所使用的是Illumina HiSeq测序平台测序。
另一方面,本发明还提供了一种建立分辨强弱爆发力人群的模型的方法,所述方法包括使用本发明所提供的肠道微生物组合进行模型构建。
优选地,所述模型构建的算法包括对数回归(LogReg),线性判别分析(LDA),特征基因线性判别分析(EigengeneLinearDiscriminant Analysis,ELDA),支持向量机(Support Vector Machines,SVM),随机森林(Random Forest,RF),递归分区树(RPART)、XGBoost(XGB)以及其他相关的决策树分类技术,ShrunkenCentroids(SC),StepAIC,最近的Kth邻居(Kth-Nearest Neighbor),Boosting,决策树(Decision Trees),神经网络,贝叶斯网络,支持向量机和隐马尔可夫模型(Hidden MarkovModels)等,进一步实现了许多此类算法技术,以执行特征(基因,微生物)选择和规则化(regularization)。生成的预测模型可以在其他研究中进行验证,或在它们最初进行训练的研究中交叉验证,使用诸如Bootstrap,Leave-One-Out(LOO)和10倍交叉验证(10-Fold cross-validation)(10倍CV)等技术进行。在各个步骤,可以根据本领域已知的技术通过值排列来估计错误发现率。
本公开的有益效果包括:
本公开通过检测肠道微生物作为分辨强弱爆发力人群的依据,并提供了相应的试剂盒和系统等产品,其相较于传统的依靠特征描述或长时间观察的方法,对强弱爆发力人群的区分有较高的灵敏度和特异性。
附图说明
图1是最优模型在分辨强弱爆发力人群时的ROC曲线图。
图2是使用不同物种个数进行强弱爆发力人群分辨时的AUC值统计图。
具体实施方式
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
实施例1、分辨强弱爆发力人群的模型构建及验证
一、受试者信息
选择141位受试者,测试跑完30米冲刺的用时。141名研究对象均为18-22岁之间的男性,身体形态上无肥胖或过瘦人群,无其他基础代谢疾病或外伤。
141个人的30米成绩,按照所用时间长短排序,所需时间越短爆发力越强,所需时间越长爆发力越弱,以参与人群成绩的中位数为分割点,前69名为第一组,后72名为第二组。具体地,第一组的平均用时为4秒5,第二组的平均用时为4秒9。两组分别代表了强爆发力和弱爆发力的人群。
二、实验方法
1、粪便样本采集与DNA提取
收集上述人群的粪便样品后采用试剂盒进行DNA提取,得到提取的DNA样本。
2、宏基因组高通量测序及分析
本研究采用Illumina HiSeq测序平台测序,共获得1,101,388.83Mbp的原始数据(Raw Data)(平均数据量为6,517.09Mbp),经过质控得到1,098,496.61Mbp的有效数据(Clean Data)(平均数据量为6,499.98Mbp),经过单样品组装及混合组装后,共得到21,297,727,819bp的Scaftigs。对各样品及混合组装的结果,采用MetaGeneMark软件进行基因预测,共得到26,606,828个开放阅读框(ORFs)(平均为157,437),经过去冗余后,共获得3,005,425个ORFs,总长为2,155.60Mbp,其中完整基因的个数为1,788,981,所占比例为59.53%。非冗余基因集与MicroNR库进行blastp比对,运用LCA算法进行物种注释,注释到属和门的比例分别为68.59%,88.87%。使用DIAMOND软件对非冗余基因集进行常用功能数据库注释(e-value<=10-5),有93,372(3.11%)个ORFs比对到CAZy数据库,1,834,009(61.02%)个ORFs比对到KEGG数据库,1,779,683(59.22%)个ORFs比对到eggNOG数据库。非冗余基因集与抗性基因数据库(CARD)进行注释(e-value<=10-30),有1330个基因比对到CARD数据库。
(1)测序数据预处理
质控结果概述:总共测序数据量为1,101,388.83Mbp,平均测序数据量为6,517.09Mbp,质控后总体数据量及平均数据量分别为1,098,496.61Mbp,6,499.98Mbp,质控的有效数据率为99.74%。
数据预处理的具体处理步骤如下:
1)去除所含低质量碱基(质量值<=38)超过一定比例(默认设为40bp)的reads;
2)去除N碱基达到一定比例的reads(默认设为10bp);
3)去除与Adapter之间overlap超过一定阈值(默认设为15bp)的reads;
4)如果样品存在宿主污染,需与宿主数据库进行比对,过滤掉可能来源于宿主的reads;
(2)Metagenome组装
组装结果概述:共组装得到23,380,685,107bp的Scaffolds,平均长度为2,043.82bp,最大长度为1,391,704bp,N50为5,318.81bp,N90为724.33bp;从N处打断Scaffolds,生成Scaftigs,共得到21,297,727,819bp的Scaftigs,Scaftigs平均长度为1,966bp,N50为4,668bp,N90为703bp。
Metagenome组装的具体处理步骤如下:
1)经过预处理后得到Clean Data,使用SOAP denovo组装软件进行组装;
2)对于单个样品,首先选取一个K-mer(默认选取55)进行组装,得到该样品的组装结果;
3)将组装得到的Scaffolds从N连接处打断,得到不含N的序列片段,称为Scaftigs(i.e.,continuous sequences within scaffolds);
4)将各样品质控后的CleanData采用Bowtie2软件比对至各样品组装后的Scaftigs上,获取未被利用上的PE reads;
5)将各样品未被利用上的reads放在一起,进行混合组装,组装时,考虑到计算消耗和时间消耗,只选取一个kmer进行组装(默认-K 55),其他组装参数与单样品组装参数相同;
6)将混合组装的Scaffolds从N连接处打断,得到不含N的Scaftigs序列;
7)对于单样品和混合组装生成的Scaftigs,过滤掉500bp以下的片段,并进行统计分析和后续基因预测;
(3)基因预测及丰度分析
基因预测结果概述:一共预测得到26,606,828条ORFs,平均每个样品157,437条ORFs;经去冗余后,得到3,005,425条ORFs,去冗余后的ORFs总长为2,155.60Mbp,平均长度717.24bp,GC含量为44.76%,其中,完整基因有1,788,981个,占所有非冗余基因总数的59.53%。
基因预测基本步骤:
1)从各样品及混合组装的Scaftigs(>=500bp)出发,采用MetaGeneMark进行ORF(Open Reading Frame)预测及过滤;
2)对各样品及混合组装的ORF预测结果,采用CD-HIT软件进行去冗余;
3)将各样品的Clean Data比对至去冗余后的代表性基因上,计算得到基因在各样品中比对上的reads数目;
4)过滤掉在各个样品中,不存在支持reads数目>2的基因,获得最终用于后续分析的gene catalogue(Unigenes);
5)从比对上的reads数目及基因长度出发,计算得到各基因在各样品中的丰度信息;
6)基于gene catalogue中各基因在各样品中的丰度信息,进行基本信息统计,core-pan基因分析,样品间相关性分析,及基因数目韦恩图分析。
(4)物种注释
物种注释结果概述:原始去冗余后的预测基因共有3,005,425条,其中,能够注释到NR数据库的ORFs数目为2,499,701(83.17%),在能够注释到NR数据库的ORFs中,注释到界水平的比例为91.61%,门水平的比例为88.87%,纲水平的比例为84.75%,目水平的比例为84.12%,科水平的比例为73.12%,属水平的比例为68.59%,种水平的比例为50.11%。其中占主导地位的门主要包括Firmicutes,Proteobacteria,Bacteroidetes等。组间具有显著性差异的门主要有k__Bacteria\;p__Acidobacteria,k__Eukaryota\;p__Zoopagomycota,k__Bacteria\;p__Dictyoglomi等。
注释基本步骤:
1)使用DIAMOND软件将Unigenes与从NCBI的NR(Version:2018.01)数据库中抽提出的细菌(Bacteria)、真菌(Fungi)、古菌(Archaea)和病毒(Viruses)序列进行比对(blastp,evalue<=1e-5);
2)比对结果过滤:对于每一条序列的比对结果,选取evalue<=最小evalue*10的比对结果进行后续分析;
3)过滤后,采取LCA算法(应用于MEGAN软件的系统分类),将出现第一个分支前的分类级别,作为各序列的物种注释信息;
4)从LCA注释结果及基因丰度表出发,获得各个样品在各个分类层级(界门纲目科属种)上的丰度信息和基因数目信息;
5)从各个分类层级(界门纲目科属种)上的丰度表出发,进行Krona分析,相对丰度概况展示,丰度聚类热图展示,PCA和NMDS降维分析,Anosim组间(内)差异分析,组间差异物种的Metastat和LEfSe多元统计分析。
3、分类模型的构建
利用上述流程得到的微生物物种丰度信息表建立机器学习分类模型。
基于XGBoost(eXtreme Gradient Boosting)选取不同数量的肠道微生物特征对上述强弱爆发力人群做分类,并使用十折交叉验证的方式最终取AUC值(ROC曲线下方的面积大小)的平均值,最终筛选出最优分类模型包含以下25种肠道微生物:
Bacillus_flexus;Allisonella_histaminiformans;
Streptococcus_sp_HMSC063B03;
Anaerosalibacter_massiliensis;bacterium_MS4;Paenibacillus_algorifonticola;
Streptobacillus_moniliformis;Lachnoclostridium_Clostridium_symbiosum;
Eubacterium_dolichum_CAG_375;Thermoflavimicrobium_dichotomicum;
Tepidibacillus_sp_HK_1;Ruminiclostridium_Clostridium_cellobioparum;
Paenibacillus_sp_NAIST15_1;Cellulophaga_lytica;
uncultured_bacterium_Ad_113_I18_contig2;Clostridium_sp_DL_VIII;
Orenia_marismortui;Butyrivibrio_sp_MB2005;
Marinilactibacillus_psychrotolerans;Clostridium_formicaceticum;
Sebaldella_termitidis;Megasphaera_sp_BV3C16_1;Defluviitoga_tunisiensis;
Blautia_sp_Marseille_P3087;Porphyromonas_asaccharolytica。
三、实验结果
基于25种肠道微生物构建的模型为最优模型。以141名受试者的肠道宏基因组数据对两组人群进行的分类,ROC曲线如附1所示,AUC达到0.9,代表了其准确分辨强弱爆发力人群的应用价值。
另外,使用不同个数的肠道微生物进行两组人群的分类,探究不同个数对应的AUC值,结果如图2所示。
Claims (22)
1.检测肠道微生物组合的试剂在分辨强弱爆发力人群中的应用,所述肠道微生物组合由以下微生物组成:
Bacillus_flexus;Allisonella_histaminiformans;
Streptococcus_sp_HMSC063B03;
Anaerosalibacter_massiliensis;bacterium_MS4;Paenibacillus_algorifonticola;
Streptobacillus_moniliformis;Lachnoclostridium_Clostridium_symbiosum;
Eubacterium_dolichum_CAG_375;Thermoflavimicrobium_dichotomicum;
Tepidibacillus_sp_HK_1;Ruminiclostridium_Clostridium_cellobioparum;
Paenibacillus_sp_NAIST15_1;Cellulophaga_lytica;
uncultured_bacterium_Ad_113_I18_contig2;Clostridium_sp_DL_VIII;
Orenia_marismortui;Butyrivibrio_sp_MB2005;
Marinilactibacillus_psychrotolerans;Clostridium_formicaceticum;
Sebaldella_termitidis;Megasphaera_sp_BV3C16_1;Defluviitoga_tunisiensis;
Blautia_sp_Marseille_P3087;Porphyromonas_asaccharolytica。
2.如权利要求1所述的应用,所述检测是针对来自于受试者的生物样本进行的,所述生物样本是粪便样本。
3.如权利要求1所述的应用,所述检测是检测受试者生物样本中肠道微生物组合中各个微生物的丰度信息,所述检测丰度信息的试剂包括以下方法中使用到的试剂:基于PCR的检测方法、Southern杂交方法、Northern杂交方法、点杂交方法、荧光原位杂交方法、DNA微阵列方法、ASO法、高通量测序平台方法。
4.如权利要求3所述的应用,所述基于PCR的检测方法包括反转录PCR、连接酶链反应、重组PCR、巢式PCR、多重PCR、链替换扩增、依赖核酸序列的扩增、转录依赖的扩增系统、滚环扩增、环介导的等温扩增。
5.如权利要求1所述的应用,所述试剂包括结合目标序列的特异性探针和/或扩增目标序列的特异性引物。
6.一种分辨强弱爆发力人群的试剂盒,所述试剂盒中包含检测以下肠道微生物组合的试剂:
Bacillus_flexus;Allisonella_histaminiformans;
Streptococcus_sp_HMSC063B03;
Anaerosalibacter_massiliensis;bacterium_MS4;Paenibacillus_algorifonticola;
Streptobacillus_moniliformis;Lachnoclostridium_Clostridium_symbiosum;
Eubacterium_dolichum_CAG_375;Thermoflavimicrobium_dichotomicum;
Tepidibacillus_sp_HK_1;Ruminiclostridium_Clostridium_cellobioparum;
Paenibacillus_sp_NAIST15_1;Cellulophaga_lytica;
uncultured_bacterium_Ad_113_I18_contig2;Clostridium_sp_DL_VIII;
Orenia_marismortui;Butyrivibrio_sp_MB2005;
Marinilactibacillus_psychrotolerans;Clostridium_formicaceticum;
Sebaldella_termitidis;Megasphaera_sp_BV3C16_1;Defluviitoga_tunisiensis;
Blautia_sp_Marseille_P3087;Porphyromonas_asaccharolytica。
7.如权利要求6所述的试剂盒,所述试剂还包括提取DNA的试剂。
8.如权利要求6所述的试剂盒,所述试剂还包括收集采集自受试者的生物样本的试剂。
9.如权利要求6所述的试剂盒,所述试剂还包括相应PCR技术所需要的常用试剂。
10.如权利要求6所述的试剂盒,所述试剂盒中还可以包括检测基因表达量、收集受试者生物样本所需要的仪器。
11.如权利要求10所述的试剂盒,所述检测的样本是粪便样本。
12.一种分辨强弱爆发力人群的系统,所述系统中包含根据对权利要求1所述的肠道微生物组合的检测结果判断受试者爆发力强弱的计算装置。
13.如权利要求12所述的系统,所述检测结果是针对来自受试者的样品进行检测而得到的,所述检测的样本是粪便样本。
14.如权利要求12所述的系统,所述系统还包括检测装置。
15.如权利要求12所述的系统,所述检测包括测序或检测肠道微生物组合中各个肠道微生物的丰度信息。
16.如权利要求12所述的系统,所述检测装置包括实时定量PCR仪、高通量测序平台、检测芯片和芯片信号读取器。
17.如权利要求12所述的系统,所述系统还包括以下任意一种或多种:
1)检测结果收集装置;
2)结果输出装置;
3)结果发送装置。
18.权利要求6所述的试剂盒、权利要求12所述的系统在分辨强弱爆发力人群中的应用。
19.一种判断受试者爆发力强弱的方法,所述方法包括根据对权利要求1所述的肠道微生物组合的检测结果判断受试者爆发力强弱。
20.如权利要求19所述的方法,所述方法包括以下步骤:
1)收集受试者的生物样本,具体地是粪便样本;
2)提取DNA;
3)测序或检测肠道微生物组合中各个肠道微生物的丰度信息;
4)根据3)的检测结果判断受试者属于强爆发力人群或弱爆发力人群。
21.一种建立分辨强弱爆发力人群的模型的方法,所述方法包括使用权利要求1所述的肠道微生物组合进行模型构建。
22.如权利要求21所述的方法,所述模型构建的算法包括对数回归、线性判别分析、特征基因线性判别分析、支持向量机、随机森林、递归分区树、XGBoost决策树分类技术、ShrunkenCentroids、StepAIC、Kth-Nearest Neighbor、Boosting、神经网络、贝叶斯网络、隐马尔可夫模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210970886.7A CN115261500B (zh) | 2022-08-14 | 2022-08-14 | 爆发力相关的肠道微生物标记物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210970886.7A CN115261500B (zh) | 2022-08-14 | 2022-08-14 | 爆发力相关的肠道微生物标记物及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115261500A CN115261500A (zh) | 2022-11-01 |
CN115261500B true CN115261500B (zh) | 2023-04-28 |
Family
ID=83750595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210970886.7A Active CN115261500B (zh) | 2022-08-14 | 2022-08-14 | 爆发力相关的肠道微生物标记物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115261500B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114045326A (zh) * | 2021-11-29 | 2022-02-15 | 广东药科大学 | 一种腹泻型肠易激综合征肠道微生物标志物及其应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111505288B (zh) * | 2020-05-15 | 2022-03-01 | 重庆医科大学 | 一种新的抑郁症生物标志物及其应用 |
CN112029844B (zh) * | 2020-07-30 | 2021-10-19 | 中国医学科学院病原生物学研究所 | 肠道微生物在诊断肌张力障碍症中的应用 |
-
2022
- 2022-08-14 CN CN202210970886.7A patent/CN115261500B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114045326A (zh) * | 2021-11-29 | 2022-02-15 | 广东药科大学 | 一种腹泻型肠易激综合征肠道微生物标志物及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN115261500A (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11312999B2 (en) | Set of genes for molecular classifying of medulloblastoma and use thereof | |
CN111411150B (zh) | 诊断肌少症的肠道菌群及其应用 | |
CN110283903A (zh) | 用于诊断胰腺炎的肠道微生物菌群 | |
CN112538545B (zh) | 真菌微生物组作为标志物在制备治疗筛查和肺癌诊断中的应用 | |
CN111647673A (zh) | 微生物菌群在急性胰腺炎中的应用 | |
CN115261499B (zh) | 耐力相关的肠道微生物标记物及其应用 | |
Sharma et al. | Exploring the Genetic Basis of Tuberculosis Susceptibility in Human Populations | |
CN110358849A (zh) | 源于肠道的诊断胰腺炎的生物标志物、筛选方法及其用途 | |
CN115261500B (zh) | 爆发力相关的肠道微生物标记物及其应用 | |
CN109652573B (zh) | 用于鼠伤寒沙门菌或其单相菌变种分型检测的vntr位点、检测引物组及检测分析方法 | |
CN114480636A (zh) | 胆汁细菌作为肝门部胆管癌诊断及预后标志物的用途 | |
CN111662992A (zh) | 与急性胰腺炎相关的菌群及其应用 | |
CN112011605A (zh) | 微生物菌群在疾病诊断中的应用 | |
EP3983561A1 (en) | Dna methylation based high resolution characterization of microbiome using nanopore sequencing | |
CN111996248B (zh) | 检测微生物的试剂及其在重症肌无力诊断中的应用 | |
CN112048552B (zh) | 诊断重症肌无力的肠道菌群及其应用 | |
CN113637782B (zh) | 与急性胰腺炎病程进展相关的微生物标志物及其应用 | |
CN114736970B (zh) | 一种鉴别不同人群的方法 | |
CN112634983B (zh) | 病原物种特异pcr引物优化设计方法 | |
KR102612260B1 (ko) | 여성의 탈모 진단을 위한 두피 마이크로바이옴 기반바이오 마커, 이를 이용한 탈모를 진단하는 방법, 및 기계 학습을 이용한 마이크로바이옴 기반 바이오 마커를 선별하는 방법 | |
CN114214438B (zh) | 胆道菌群检测试剂在制备预测胆道结石术后早期复发的试剂中的应用 | |
CN117778565B (zh) | Vte风险评估的检测试剂盒及应用 | |
CN114839369B (zh) | 急性高原反应微生物标志物及其应用 | |
CN116287400A (zh) | 一种用于鉴别系统性红斑狼疮的真菌微生物作为标志物的筛选方法及其应用 | |
CN118272552A (zh) | 源于肠道菌群的白癜风检测标志物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |