CN111430027A - 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 - Google Patents
基于肠道微生物的双相情感障碍生物标志物及其筛选应用 Download PDFInfo
- Publication number
- CN111430027A CN111430027A CN202010193092.5A CN202010193092A CN111430027A CN 111430027 A CN111430027 A CN 111430027A CN 202010193092 A CN202010193092 A CN 202010193092A CN 111430027 A CN111430027 A CN 111430027A
- Authority
- CN
- China
- Prior art keywords
- biomarker
- bipolar
- bipolar affective
- relative abundance
- species
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biotechnology (AREA)
- Artificial Intelligence (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Pathology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了基于肠道微生物的双相情感障碍生物标志物及其筛选应用。其中,生物标志物1)Ruminococcus‑gnavus;生物标志物2)Eubacterium_hallii;生物标志物3)Alistipes_onderdonkii;生物标志物4)Faecalibacterium_prausnitzii;生物标志物5)Prevotella_stercorea;生物标志物6)Bacteroidales_bacterium_ph8;上述6种中,Ruminococcus‑gnavus在双相情感障碍患者组中相对丰度升高,其余在双相情感障碍患者组中相对丰度降低。本发明还公开了所述的生物标志物作为检测靶点或检测目标在制备检测试剂盒中的应用,作为靶点在筛选治疗和/或者预防双相情感障碍的药物中的应用。
Description
技术领域
本发明涉及基于肠道微生物的双相情感障碍生物标志物及其筛选应用。
背景技术
双相情感障碍是一组严重的、反复发作的慢性精神疾病,全球发病率约为2~3%,发病年龄主要集中在青春期后期或者成年早期,是引起全世界年轻人残疾的第四大原因。以抑郁、躁狂或者轻躁狂交替或混合发作为主要临床特征,包括双相情感障碍I型(至少有一个躁狂发作、不需要有精神病或重大抑郁发作)和双相情感障碍II型(患者至少有一次轻躁发作和至少一次严重抑郁发作)以及阈下形式等亚型,表现为感知觉、情绪处理以及认知等方面的功能障碍。即使经过治疗,残留的情绪症状往往仍然存在,大约37%的患者在1年内复发为抑郁症或躁狂症,60%的患者在2年内复发。致残率较高,平均寿命较一般人减少10-20年,具有较高的致残率和死亡风险,其中因自杀而死亡的约有15%,因心血管疾病死亡的约为35%-40%,严重损害患者正常的社会生活功能。
尽管目前的研究认为双相情感障碍的发生是遗传因素和环境因素相互作用的结果,但针对双相情感障碍的诊断仍基于症状学的评估,尚缺乏可靠的生物标志物,阻碍了双相情感障碍的风险识别,大大增加了该病治疗的复杂性和难治性,恶化了预后。
发明内容
为了克服现有技术的不足,本发明的目的是提供基于肠道微生物的双相情感障碍生物标志物及其筛选应用,为双相情感障碍的早期识别、发展趋势预测以及精准用药提供指导,进一步帮助双相情感障碍发病机理、靶向用药等方面的研究。
本发明通过以下技术方案实现:
基于肠道微生物的双相情感障碍生物标志物,包括以下25种中的多种:
Gemella_morbillorum,Actinomyces_oris,Ruminococcus_gnavus,Barnesiella_intestinihominis,Coprobacillus_unclassified,Propionibacterium_propionicum,Fusobacterium_mortiferum,Corynebacterium_durum,Clostridium_perfringens,Rothia_aeria,Streptococcus_cristatus,Rothia_dentocariosa,Eubacterium_infirmum,Adlercreutzia_equolifaciens,Streptococcus_intermedius,Eubacterium_hallii,Paraprevotella_clara,Prevotella_copri,Alistipes_onderdonkii,Alistipes_sp_AP11,Faecalibacterium_prausnitzii,Coprococcus_sp_ART55_1,Prevotella_stercorea,Bacteroidales_bacterium_ph8,Bacteroides_plebeius;
其中,Propionibacterium_propionicum,Ruminococcus_gnavus,Corynebacterium_durum,Fusobacterium_mortiferum,Barnesiella_intestinihominis,Gemella_morbillorum,Eubacterium_infirmum,Rothia_dentocariosa,Rothia_aeriaStreptococcus_cristatus,Streptococcus_intermedius,Adlercreutzia_equolifaciens,Coprobacillus_unclassified,Clostridium_perfringens,Actinomyces_oris菌群的相对丰度在双相情感障碍患者组中显示升高,剩余菌群的相对丰度在双相情感障碍患者组中则下降。
所述的生物标志物,为以下6种:
生物标志物1)Ruminococcus-gnavus;重要性0.056007;
生物标志物2)Eubacterium_hallii ;重要性0.179768;
生物标志物3)Alistipes_onderdonkii;重要性0.082099;
生物标志物4)Faecalibacterium_prausnitzii;重要性0.098368;
生物标志物5)Prevotella_stercorea;重要性0.077305;
生物标志物6)Bacteroidales_bacterium_ph8;重要性0.069615;
上述6种中,Ruminococcus-gnavus在双相情感障碍患者组中相对丰度升高,其余在双相情感障碍患者组中相对丰度降低。
所述的生物标志物是基于对其基因序列的计算所提供的。
所述的生物标志物的相对丰度信息用于和参考值进行比较。
一种所述的生物标志物作为检测靶点或检测目标在制备检测试剂盒中的应用。
一种所述的生物标志物作为靶点在筛选治疗和/或者预防双相情感障碍的药物中的应用。
一种所述的生物标志物的筛选方法,步骤如下:
1)样本收集:收集样本受试者包括双相情感障碍患者和健康对照者的粪便样品,于-80℃条件下在冰箱内保存,以便对其进行DNA样本的提取;
2)对提取的DNA样本进行宏基因组测序与组装,之后将高质量的测序片段输入到Metaphlan2软件,计算出物种的相对丰度,依据以下步骤:
2.1)将高质量的测序片段与参考基因进行比对;
2 .2)根据比对后的结果统计插入片段的数量;
2 .3)将插入片段的数量与参考基因的长度进行标准化,最终得到对应的丰度;
3)将上述所得双相情感障碍患者与健康对照物种的相对丰度信息输入到LDA EffectSize(LEfSe)系统,分析组间差异菌群,包括以下三个步骤:
3.1)首先,利用非参数因子Kruskal-Wallis秩和检验检测两组之间的物种相对丰度差异,获得显著性差异物种;
3.2)其次,利用Wilcoxon 秩和检验检测上一步所获得的具有显著性差异的物种的所有亚种是否趋向于同一分类级别;
3.3)最后用线性判别分析(LDA),对数据进行降维、评估差异显著的菌群影响力(即LDAscore)得到最终的差异物种。
所述的筛选方法,进一步使用随机森林模型预测分析,步骤如下:
4.1)从受试者样本集中选取年龄、身高、体重等流行病学资料相匹配的双相情感障碍患者和健康对照者作为训练集,其余样品作为测试集,计算训练集内每个样本中物种的相对丰度;
4.2)将训练集中物种的相对丰度信息输入随机森林(RF)分类器中,并对分类器进行5次10折的交叉验证,对利用RF模型筛选出的每一个物种,依据其相对丰度信息计算双相情感障碍的患病风险、绘制ROC曲线,并计算其曲线下面积(AUC),将AUC作为判别模型效能评价的参数,在模型中输出每个物种的重要性指数,重要性指数越高,代表该标志物用来判别双相情感障碍和非双相情感障碍的重要性就越高。
所述训练集中,样本受试者包括50个双相情感障碍患者和50个健康对照,测试集中,样本受试者包括12个双相情感障碍患者和10个健康对照。
本发明的有益技术效果:
本发明通过对双相情感障碍患者和健康人群的肠道菌群以及基因序列进行分析,从而筛选出与双相情感障碍相关性高的生物标志物,并且利用该标志物诊断或者预测罹患双相情感障碍的风险。
粪便是机体的排泄物,其内除了包含不被吸收的代谢产物外,还包括有肠道微生物。对粪便样本进行研究,发现双相情感障碍患者和健康人群的差异菌群,进而准确地对双相情感障碍患者进行患病风险评估,有助于早期诊断。本发明基于对双相情感障碍患者和健康对照肠道微生物的比较和分析,得到两组之间的差异菌群,结合高质量的双相情感障碍患者和健康对照差异菌群相对丰度数据作为训练集,对双相情感障碍患者进行患病风险评估与早期诊断。
本发明提出的双相情感障碍相关生物标记物对疾病的早期诊断具有较高价值。首先,粪便样本的可获得性,可操作性以及安全性和可负担性保证了患者的依从性。其次,粪便样本的检测基于测序技术实现,由此得到的标志物灵敏性和特异性均较高。最后,本发明所述的标记物还可以用于监测双相情感障碍患者对药物治疗的反应。
附图说明
图1为根据本发明一个实施例物种种水平上双相情感障碍患者和健康对照者的菌群相对丰度差异情况。图示表明,双相情感障碍患者和健康对照在不同种水平菌群相对丰度存在显著差异。
图2为根据本发明的一个实施例对分类器进行5次10折交叉验证的错误率分布情况。
图3为根据本发明的一个实施例基于随机森林模型(6个肠道标志物) ,由双相情感障碍患者和健康对照组成的训练集的接收者操作特征 (Receiver OperatingCharacteristic,ROC)曲线和曲线下面积(Area under Curve,AUC)。
图4为根据本发明的一个实施例基于随机森林模型(6个肠道微生物标志物) ,由双相情感障碍患者和健康对照组成的测试集的接收者操作特征(Receiver OperatingCharacteristic,ROC)曲线和曲线下面积(Area under Curve,AUC)。
具体实施方式
本发明所用术语具有相关领域普通技术人员通常理解的含义。然而,为了更好地理解本发明,对一些定义和相关术语的解释如下:
“双相情感障碍”,是一组病因未明的、反复发作的慢性精神疾病,发病年龄主要集中在青春期后期或者成年早期,以抑郁、躁狂或者轻躁狂交替或混合发作为主要临床特征,表现为感知觉、情绪处理以及认知等方面的功能障碍。
“生物标志物”,一般是指可供客观测定和评价个体生物状态的某种具有特征性的生物化学指标,可以是处于不同生物学水平(个体、细胞、分子)上的任何反映机体特定生物状态(如疾病)的物质。包含蛋白质标志物、抗原抗体标志物、基因标志物、功能标志物等多种领域。其中基因标志物,包含所有的核酸片段,可以是任何经过或者未经过修饰的DNA、RNA或者是由它们组成的集合,以及其他任何能够表达具有生物活性蛋白质的基因。在本发明中,“生物标志物”也可以用 “肠道微生物标志物”、“肠道菌群”来表示,因为本发明所发现的与双相情感障碍相关的生物标志物均来自于经受试者肠道代谢后的粪便样本。
所述的生物标志物,通过运用高通量测序的技术,批量分析健康人群和双相情感障碍患者的粪便样本。通过将双相情感障碍患者与健康对照的测序结果进行比对,进而确定与双相情感障碍患者群相关的生物标志物的行相对丰度信息。
实施例
样品的收集与处理:本发明共收集受试者包括双相情感障碍患者(n=62)与健康对照(n=60)的粪便样本。其中,在本发明中,入组的双相情感障碍患者为符合《精神疾病的诊断和统计手册》(DSM-IV-TR)诊断依据的住院和/或门诊患者。同时符合以下入组标准:1)至少3个月内未服用药物或其他精神科药物;2)没有明显的自杀想法或既往自杀未遂;3)没有与其他精神障碍共病。健康受试者从当地社区招募,没有任何精神障碍和精神疾病家族史。两组间年龄、性别以及体重指数相匹配。所有受试者的排除标准包括:1)慢性感染、严重的系统性疾病(如糖尿病)和自身免疫性疾病;2)筛查前4周内食用抗生素、益生菌或益生菌;3)目前怀孕、哺乳或月经不调的女性;4)颅脑外伤史;5)磁共振成像(MRI)的禁忌症,如金属植入物或幽闭恐惧症。所有入组的双相情感障碍受试者给予喹硫平单药治疗(维持每日200~300 mg剂量)。将收集到的粪便样本于半个小时之内在-80℃冰箱冷藏,保存备用。
提取DNA:使用QIAGENT DNA试剂盒提取DNA,得到核酸样本。在1%琼脂糖凝胶上检测DNA降解程度和潜在污染。使用Qubit®2.0 Fluroeter (Life Technologies,CA,USA)中的Qubit® dsDNA分析试剂盒测量浓度。
文库构建和测序:用Covaris随机剪切DNA,然后使用NEBNextUltra TM DNALibrary Prep Kit for Illumina(NEB,美国)构建DNA文库。用Illumina NovaSeq 6000进行DNA文库测序,测序策略为双端150bp测序,质量控制(QC)采用自定义脚本。如果满足以下任何标准,则序列将被丢弃:1)包含三个或更多不明确碱基;2)包含20个或更多低Phred质量碱基(阈值是Q20);3)通过使用带有“-u 6”参数的CutAdap1.8.1版指定为适配序列;4)通过使用带有“-非常敏感”参数的Bowtie2版本2.3.4.2,可以与人类基因组参考(HG19)进行比对。对于双端序列,如果一个序列被认为是接头污染或人类基因组,那么它的配对序列也会被过滤掉。最后,得到高质量的测序片段(reads)。
将上述所述的高质量测序片段(reads) 输入到软件Metaphlan2 (http://segatalab.cibio .unitn .it/tools/metaphlan2/)执行完成相应的命令即可计算出微生物物种的相对丰度信息。
Metaphlan2分析软件于2015年发表于Nature Methods(MetaPhlAn2 forenhanced metagenomic taxonomic profiling ,Nature Methods 12 ,902-903(2015))。该文献提供了Metaphlan2分析软件计算物种相对丰度信息的步骤,具体如下:1)将高质量测序片段与参考的标记基因比对;2)根据比对结果统计插入片段的数量;3)将插入片段的数量对标记基因的长度进行标准化,得到对应的丰度。
利用LDA Effect Size(LEfSe)分析技术基于菌群相对丰度分析组间差异菌群,筛选双相情感障碍患者与对照组两组之间菌群相对丰度的差异情况。
将上述所述双相情感障碍患者与健康对照组菌群相对丰度信息输入到LEfSe在线分析网页(http://huttenhower.sph.harvard.edu/galaxy)进行双相情感障碍患者组与健康对照组两组之间的菌群相对丰度的差异性比较分析。参照文献(Segata N, Izard J,Waldron L, et al. Metagenomic biomarker discovery and explanation[J]. GenomeBiol, 2011, 12(6): R60.)主要分为三个步骤:1)首先,利用非参数因子Kruskal-Wallis秩和检验检测两组之间的物种相对丰度差异,获得显著性差异物种;2)其次,利用Wilcoxon秩和检验检测上一步所获得的具有显著性差异的物种的所有亚种是否趋向于同一分类级别;3)最后用线性判别分析(LDA),对数据进行降维、评估差异显著的菌群影响力(即LDAscore)得到最终的差异物种。
具体包括如下步骤:
本发明将122个样本(62个双相情感障碍患者和60个健康对照)经测序后得到的菌群相对丰度输入LEfSe在线分析网页,结果显示25种菌群的相对丰度,包括"Gemella_morbillorum","Actinomyces_oris","Ruminococcus_gnavus","Barnesiella_intestinihominis","Coprobacillus_unclassified","Propionibacterium_propionicum","Fusobacterium_mortiferum","Corynebacterium_durum","Clostridium_perfringens","Rothia_aeria","Streptococcus_cristatus","Rothia_dentocariosa","Eubacterium_infirmum","Adlercreutzia_equolifaciens","Streptococcus_intermedius","Eubacterium_hallii","Paraprevotella_clara","Prevotella_copri","Alistipes_onderdonkii","Alistipes_sp_AP11","Faecalibacterium_prausnitzii","Coprococcus_sp_ART55_1","Prevotella_stercorea","Bacteroidales_bacterium_ph8","Bacteroides_plebeius"在双相情感障碍患者组与健康对照组中存在明显的差异,其中"Propionibacterium_propionicum","Ruminococcus_gnavus","Corynebacterium_durum","Fusobacterium_mortiferum","Barnesiella_intestinihominis","Gemella_morbillorum","Eubacterium_infirmum","Rothia_dentocariosa", Rothia_aeria "Streptococcus_cristatus","Streptococcus_intermedius","Adlercreutzia_equolifaciens","Coprobacillus_unclassified","Clostridium_perfringens","Actinomyces_oris"菌群的相对丰度在双相情感障碍患者组中显示升高,剩余菌群的相对丰度在双相情感障碍患者组中则下降。图1 采用LEFSE和LDA分析比较差异菌群相。以LDA≥2作为差异有显著性的阈值。LDA评分显示未经治疗的BD患者(右部分,before)和健康对照组(左部分,HC)之间的细菌差异显著。
利用随机森林分类器筛选双相情感障碍发生风险的潜在生物标志物。
为进一步筛选双相情感障碍肠道微生物标志物,以“LEfSe分析技术筛选双相情感障碍患者与对照组两组之间菌群相对丰度的差异情况”为基础,构建双相情感障碍受试者和健康对照受试者肠道微生物标志物的训练集和测试集,并评估待测的测试集样本生物标志物的含量值。在本发明中,训练集是指具有一定样本数量的、年龄、身高、体重等流行病学资料相匹配的双相情感障碍和健康对照受试者待测粪便样本中的各生物标志物含量的数据集合,剩余样品无论流行病学资料是否相匹配均作为测试集。
具体包括如下步骤:
本发明从122个样品(62个双相情感障碍病人和60个健康人)中,选取年龄、身高、体重等流行病学资料相匹配的50个双相情感障碍患者和50个健康人作为训练集(表1-1、1-2、1-3),剩余的22个样品 (12个双相情感障碍患者和10个健康人) 作为测试集(表2)。然后将训练集中差异菌群的相对丰度信息输入随机森林(RF)分类器中,并对分类器进行5次10折的交叉验证,依据交叉验证结果(图2),RF分类器最终选取6种生物标记物作为最优标志物组合数来进行预测双相情感障碍疾病的风险。图2中,横坐标代表不同数量的物种组合,纵坐标代表预测双相情感障碍疾病时犯错误的概率。黑色的竖线(n=6)代表5次10折交叉验证后所取物种组合的平均值。利用RF模型筛选出的每一个物种,依据其相对丰度计算双相情感障碍的患病风险、绘制ROC曲线,并计算其曲线下面积(AUC)。(预测双相情感障碍训练集差异菌群的相对丰度信息如下表1-1、1-2、1-3,测试集差异菌群的相对丰度信息如下表2,表3显示出了6种生物标记物结合来预测训练集的患病概率)。
表3 训练集利用菌群标志物相对丰度信息预测患病率的准确性
ID | Accuracy | ID | Accuracy | ID | Accuracy |
s1B1050 | 0.812849 | HSH_44 | 0.567046 | HC011 | 0.346077 |
s1B1055 | 0.557355 | HSH_5 | 0.796871 | HC012 | 0.277077 |
B1004 | 0.767324 | HSH_54 | 0.808823 | HC013 | 0.379269 |
B1038 | 0.585916 | HSH_62 | 0.405607 | HC014 | 0.501242 |
B1047 | 0.797622 | HSH_76 | 0.843215 | HC015 | 0.226487 |
B1066 | 0.637646 | HSH_79 | 0.595853 | HC016 | 0.133485 |
B1072 | 0.729712 | HSH_88 | 0.513533 | HC017 | 0.277374 |
B1076 | 0.865263 | HSH_92 | 0.415546 | HC019 | 0.585155 |
B1103 | 0.424417 | HSH_96 | 0.828901 | HC020 | 0.288213 |
B1111 | 0.804256 | HSH_98 | 0.818419 | HC021 | 0.327576 |
B2001 | 0.838626 | s1B1007 | 0.46501 | HC022 | 0.640315 |
BP_13 | 0.724254 | s1B1008 | 0.608599 | HC023 | 0.207575 |
BP_2 | 0.493857 | s1B1063 | 0.501529 | HC027 | 0.200377 |
BP_3 | 0.818744 | s1B1065 | 0.668756 | HC028 | 0.247163 |
BP_6 | 0.665534 | s1B1067 | 0.777025 | HC029 | 0.364967 |
BP_9 | 0.667716 | s1B1068 | 0.510033 | HC030 | 0.258746 |
BP21 | 0.650515 | H_4 | 0.290338 | HC031 | 0.306325 |
BP23 | 0.585875 | H_44 | 0.288271 | HC032 | 0.308022 |
HSH_104 | 0.56104 | H_45 | 0.12369 | HC033 | 0.091807 |
HSH_106 | 0.778131 | H_50 | 0.521267 | HC034 | 0.307086 |
HSH_109 | 0.509922 | H_53 | 0.627444 | HC035 | 0.350065 |
HSH_112 | 0.7741 | H_56 | 0.476707 | HC036 | 0.162977 |
HSH_120 | 0.603087 | H_57 | 0.229628 | HC038 | 0.302604 |
HSH_127 | 0.561353 | H_62 | 0.316555 | HC039 | 0.16876 |
HSH_128 | 0.777423 | H_7 | 0.250399 | HC040 | 0.340343 |
HSH_133 | 0.692059 | H_8 | 0.153299 | HC041 | 0.161086 |
HSH_138 | 0.689465 | H_9 | 0.158859 | HC042 | 0.302094 |
HSH_157 | 0.828337 | H18 | 0.529342 | HC044 | 0.391107 |
HSH_160 | 0.664228 | HC001 | 0.506001 | HC045 | 0.379987 |
HSH_21 | 0.533279 | HC002 | 0.390909 | HC046 | 0.318514 |
HSH_27 | 0.614566 | HC005 | 0.114416 | HC047 | 0.178105 |
HSH_31 | 0.705096 | HC008 | 0.811865 | HC048 | 0.190459 |
HSH_33 | 0.802478 | HC009 | 0.330069 | ||
HSH_39 | 0.830639 | HC010 | 0.44499 |
注释:B、BP、S1B、HSH:双相情感障碍;H、HC:健康人
利用RF模型筛选训练集中菌群相对丰度对每一个体计算其双相情感障碍患病风险,绘制ROC曲线,并计算出AUC,作为判别模型效能评价参数。其中特异性表征的是对于不患病判对的概率,敏感性指的是对于患病判对的概率,对训练集样本的判别效能为:AUC=94.7%,95%置信区间CI=90.4%~99.1%。结果表明该模型所得代谢物组合可作为区分双相情感障碍与非双相情感障碍的潜在生物标志物(图3)。
图4示出了基于随机森林模型(25个生物标志物)由双相情感障碍患者和健康对照组成的测试集的ROC曲线和AUC,其中特异性表征的是对于不患病判对的概率,敏感性指的是对于患病判对的概率,对训练集样本的判别效能为:AUC=74.2%,95%置信区间CI=51.9~96.5%。结果表明该模型所得代谢物组合可作为区分双相情感障碍与非双相情感障碍的潜在生物标志物。
表4示出了6种生物标记物结合来预测测试集的患病概率。
表5示出了6种生物标记物的详细信息。
表4 测试集利用菌群标志物相对丰度预测患病率的准确性
ID | Accuracy | ID | Accuracy |
s1B1069 | 0.690738 | s1B2026 | 0.160341 |
s1B1094 | 0.857345 | H_14 | 0.418581 |
s1B1098 | 0.346751 | H_15 | 0.795526 |
s1B2002 | 0.298095 | H_16 | 0.266394 |
s1B2005 | 0.546693 | H_17 | 0.296719 |
s1B2006 | 0.54932 | H_20 | 0.281484 |
s1B2007 | 0.717752 | H_23 | 0.203055 |
s1B2008 | 0.266804 | H_27 | 0.266204 |
s1B2010 | 0.682385 | H_3 | 0.218626 |
s1B2018 | 0.524695 | H_30 | 0.354145 |
s1B2020 | 0.711019 | H_31 | 0.495924 |
注释:s1B:双相情感障碍;H:健康人
表5
标志物名称 | 模型预测中的重要性 | 富集方向 | 测试集AUC(%) | 95%置信区间 |
Ruminococcus-gnavus | 0.056007 | BP | 35.8 | 1.23~5.94 |
Eubacterium_hallii | 0.179768 | HC | 69.6 | 4.72~9.2 |
Alistipes_onderdonkii | 0.082099 | HC | 50 | 2.51~7.49 |
Faecalibacterium_prausnitzii | 0.098368 | HC | 63.8 | 3.96~8.79 |
Prevotella_stercorea | 0.077305 | HC | 48.3 | 2.35~7.32 |
Bacteroidales_bacterium_ph8 | 0.069615 | HC | 64.6 | 4.08~8.84 |
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均与首次标明的内容相同。
本发明采用宏基因组关联分析(Metagenome-Wide Association Study ,MWAS)的分析方法,经测序分析粪便样本的菌群组成及菌群相对丰度;用LEfse分析方法分析双相情感障碍患者组和健康对照组菌群相对丰度的差异情况;用随机森林判别模型判别双相情感障碍群体和非双相情感障碍群体,获得患病概率,用于双相情感障碍的患病风险评估。
在本发明中,所述的Illumina NovaSeq 6000测序和MWAS具有本领域所公知,本领域技术人员可以根据具体情况进行调整。根据本发明的实施例,可以依据文献(Jun Wang ,and Huijue Jia. Metagenome-wide association studies: fine-mining themicrobiome .Nature Reviews Microbiology 14 .8 (2016): 508-522 .)中记载的方法进行。
在本发明中,随机森林模型和ROC曲线的使用方法为本领域所公知,本领域技术人员可以根据具体情况进行参数设置和调整。根据本发明的实施例,可以根据文献(Stephanie J., et al. Metabolomic profiling of fatty acid and amino acidmetabolism in youth with obesity and type 2 diabetes : evidence for enhancedmitochondrial oxidation .Diabetes Care 2012 ,35:605-611 .)中记载的方法进行。
在本发明中,构建了双相情感障碍受试者和非双相情感障碍受试者生物标志物的训练集,在此基础上,对待测样本的生物标志物含量值进行评估。
本领域技术人员知晓,当进一步扩大样本量时,利用本领域公知的样本检测和计算方法,可以得出每种生物标志物在样本中的正常含量值区间(绝对数值)。可以将检测得到的生物标志物含量的绝对值与正常含量值进行比较,任选地,还可以结合统计学方法,以得出双相情感障碍患病风险评价、诊断以及用于监控双相情感障碍患者的治疗效果的效率等。
发明人指出这些生物标志物是存在于人体中的肠道菌群。通过本发明所述的方法对受试者肠道菌群进行关联分析,得到双相情感障碍群体的所述生物标志物在菌群检测中表现出一定的含量范围值。
以上结果表明,本发明公开的生物标志物具有较高的准确度和特异性,具有良好的开发为诊断方法的前景,从而为双相情感障碍的患病风险评估、诊断、早期诊断提供依据。
因此,本发明提出以下应用:
所述的基于肠道菌群的双相情感障碍生物标志物组合作为检测靶点或检测目标在制备检测试剂盒中的应用。
所述的基于肠道菌群的双相情感障碍生物标志物组合作为靶点在筛选双相情感障碍预测风险中的应用。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (9)
1.基于肠道微生物的双相情感障碍生物标志物,其特征在于,包括以下25种中的多种:
Gemella_morbillorum,Actinomyces_oris,Ruminococcus_gnavus,Barnesiella_intestinihominis,Coprobacillus_unclassified,Propionibacterium_propionicum,Fusobacterium_mortiferum,Corynebacterium_durum,Clostridium_perfringens,Rothia_aeria,Streptococcus_cristatus,Rothia_dentocariosa,Eubacterium_infirmum,Adlercreutzia_equolifaciens,Streptococcus_intermedius,Eubacterium_hallii,Paraprevotella_clara,Prevotella_copri,Alistipes_onderdonkii,Alistipes_sp_AP11,Faecalibacterium_prausnitzii,Coprococcus_sp_ART55_1,Prevotella_stercorea,Bacteroidales_bacterium_ph8,Bacteroides_plebeius;
其中,Propionibacterium_propionicum,Ruminococcus_gnavus,Corynebacterium_durum,Fusobacterium_mortiferum,Barnesiella_intestinihominis,Gemella_morbillorum,Eubacterium_infirmum,Rothia_dentocariosa,Rothia_aeriaStreptococcus_cristatus,Streptococcus_intermedius,Adlercreutzia_equolifaciens,Coprobacillus_unclassified,Clostridium_perfringens,Actinomyces_oris菌群的相对丰度在双相情感障碍患者组中显示升高,剩余菌群的相对丰度在双相情感障碍患者组中则下降。
2.根据权利要求1所述的生物标志物,其特征在于,为以下6种:
生物标志物1)Ruminococcus-gnavus;
生物标志物2)Eubacterium_hallii ;
生物标志物3)Alistipes_onderdonkii;
生物标志物4)Faecalibacterium_prausnitzii;
生物标志物5)Prevotella_stercorea;
生物标志物6)Bacteroidales_bacterium_ph8;
上述6种中,Ruminococcus-gnavus在双相情感障碍患者组中相对丰度升高,其余在双相情感障碍患者组中相对丰度降低。
3.根据权利要求1所述的生物标志物,其特征在于,所述的生物标志物是基于对其基因序列的计算所提供的。
4.根据权利要求1或者2所述的生物标志物,其特征在于,所述的生物标志物的相对丰度信息用于和参考值进行比较。
5.一种根据权利要求1或者2所述的生物标志物作为检测靶点或检测目标在制备检测试剂盒中的应用。
6.一种根据权利要求1或者2所述的生物标志物作为靶点在筛选治疗和/或者预防双相情感障碍的药物中的应用。
7.一种根据权利要求1所述的生物标志物的筛选方法,其特征在于,步骤如下:
1)样本收集:收集样本受试者包括双相情感障碍患者和健康对照者的粪便样品,于-80℃条件下在冰箱内保存,以便对其进行DNA样本的提取;
2)对提取的DNA样本进行宏基因组测序与组装,之后将高质量的测序片段输入到Metaphlan2软件,计算出物种的相对丰度,依据以下步骤:
2.1)将高质量的测序片段与参考基因进行比对;
2 .2)根据比对后的结果统计插入片段的数量;
2 .3)将插入片段的数量与参考基因的长度进行标准化,最终得到对应的丰度;
3)将上述所得双相情感障碍患者与健康对照物种的相对丰度信息输入到LDA EffectSize(LEfSe)系统,分析组间差异菌群,包括以下三个步骤:
3.1)首先,利用非参数因子Kruskal-Wallis秩和检验检测两组之间的物种相对丰度差异,获得显著性差异物种;
3.2)其次,利用Wilcoxon 秩和检验检测上一步所获得的具有显著性差异的物种的所有亚种是否趋向于同一分类级别;
3.3)最后用线性判别分析(LDA),对数据进行降维、评估差异显著的菌群影响力(即LDAscore)得到最终的差异物种。
8.根据权利要求7所述的筛选方法,其特征在于,进一步使用随机森林模型预测分析,步骤如下:
4.1)从受试者样本集中选取年龄、身高、体重等流行病学资料相匹配的双相情感障碍患者和健康对照者作为训练集,其余样品作为测试集,计算训练集内每个样本中物种的相对丰度;
4.2)将训练集中物种的相对丰度信息输入随机森林(RF)分类器中,并对分类器进行5次10折的交叉验证,对利用RF模型筛选出的每一个物种,依据其相对丰度信息计算双相情感障碍的患病风险、绘制ROC曲线,并计算其曲线下面积(AUC),将AUC作为判别模型效能评价的参数,在模型中输出每个物种的重要性指数,重要性指数越高,代表该标志物用来判别双相情感障碍和非双相情感障碍的重要性就越高。
9.根据权利要求8所述的筛选方法,其特征在于,所述训练集中,样本受试者包括50个双相情感障碍患者和50个健康对照,测试集中,样本受试者包括12个双相情感障碍患者和10个健康对照。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010193092.5A CN111430027B (zh) | 2020-03-18 | 2020-03-18 | 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 |
PCT/CN2020/081944 WO2021184412A1 (zh) | 2020-03-18 | 2020-03-28 | 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010193092.5A CN111430027B (zh) | 2020-03-18 | 2020-03-18 | 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111430027A true CN111430027A (zh) | 2020-07-17 |
CN111430027B CN111430027B (zh) | 2023-04-28 |
Family
ID=71549630
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010193092.5A Active CN111430027B (zh) | 2020-03-18 | 2020-03-18 | 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111430027B (zh) |
WO (1) | WO2021184412A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112029880A (zh) * | 2020-09-15 | 2020-12-04 | 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) | 用于重症肌无力的检测的微生物及应用 |
CN112226525A (zh) * | 2020-09-15 | 2021-01-15 | 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) | 重症肌无力诊断用试剂 |
CN112509635A (zh) * | 2021-02-05 | 2021-03-16 | 中国医学科学院阜外医院 | 针对稳定型冠心病的急性冠脉综合征风险预测方法及装置 |
CN112509701A (zh) * | 2021-02-05 | 2021-03-16 | 中国医学科学院阜外医院 | 急性冠脉综合征的风险预测方法及装置 |
CN114002421A (zh) * | 2021-12-30 | 2022-02-01 | 佛山市第三人民医院(佛山市精神卫生中心) | 外泌体代谢物作为双相情感障碍标志物的应用 |
CN114283890A (zh) * | 2021-12-15 | 2022-04-05 | 南京医科大学 | 一种基于瘤胃球菌微生物群的疾病风险预测方法及装置 |
CN114360726A (zh) * | 2021-02-05 | 2022-04-15 | 中国医学科学院阜外医院 | 稳定型冠心病发病风险评估标志物及其应用 |
WO2023123613A1 (zh) * | 2021-12-30 | 2023-07-06 | 浙江大学 | 双相情感障碍生物标志物及其应用 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115886818B (zh) * | 2022-11-25 | 2024-02-09 | 四川大学华西医院 | 一种基于胃肠电信号的抑郁焦虑障碍预测系统及其构建方法 |
CN116504363B (zh) * | 2023-05-10 | 2024-03-08 | 中国科学院心理研究所 | 基于组水平差异统计图的抑郁症tms个体化靶点定位方法及系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT821955E (pt) * | 1996-08-01 | 2002-07-31 | Lilly Co Eli | Uso de 3-(4-hexiloxi-1,2,5-tiadiazol-3-il)-1,2,5,6-tetrahidro-1-metilpiridina (xanomelina) para o tratamento da doenca bipolar |
GB0502979D0 (en) * | 2005-02-14 | 2005-03-16 | Univ Cambridge Tech | Biomarkers and uses thereof |
WO2008144613A1 (en) * | 2007-05-17 | 2008-11-27 | The University Of North Carolina At Chapel Hill | Biomarkers for the diagnosis and assessment of bipolar disorder |
WO2010039526A1 (en) * | 2008-09-23 | 2010-04-08 | Indiana University Research And Technology Corporation | Genes and single nucleotide polymorphisms for genetic testing in bipolar disorder |
CN102140520A (zh) * | 2011-01-21 | 2011-08-03 | 上海交通大学 | 用于双相情感障碍关联基因检测的引物、探针及其试剂盒 |
JP2018132526A (ja) * | 2017-02-16 | 2018-08-23 | 国立大学法人千葉大学 | 大うつ病性障害及び双極性障害のマーカー、検査方法、検査キット、及び治療薬のスクリーニング方法。 |
CN110731963A (zh) * | 2018-07-20 | 2020-01-31 | 华晶基因技术有限公司 | 左旋四氢巴马汀在治疗抑郁症、双相情感障碍等相关疾病及躁狂症和焦虑症的应用 |
WO2020244017A1 (zh) * | 2019-06-06 | 2020-12-10 | 西安交通大学医学院第一附属医院 | 一种基于肠道菌群的精神分裂症生物标志物组合、其应用及mOTU筛选方法 |
CN110838365A (zh) * | 2019-09-27 | 2020-02-25 | 康美华大基因技术有限公司 | 肠易激综合症相关菌群标志物及其试剂盒 |
-
2020
- 2020-03-18 CN CN202010193092.5A patent/CN111430027B/zh active Active
- 2020-03-28 WO PCT/CN2020/081944 patent/WO2021184412A1/zh active Application Filing
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112029880A (zh) * | 2020-09-15 | 2020-12-04 | 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) | 用于重症肌无力的检测的微生物及应用 |
CN112226525A (zh) * | 2020-09-15 | 2021-01-15 | 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) | 重症肌无力诊断用试剂 |
CN112029880B (zh) * | 2020-09-15 | 2023-04-28 | 石家庄市人民医院(石家庄市第一医院、石家庄市肿瘤医院、河北省重症肌无力医院、石家庄市心血管病医院) | 用于重症肌无力的检测的微生物及应用 |
CN112509635A (zh) * | 2021-02-05 | 2021-03-16 | 中国医学科学院阜外医院 | 针对稳定型冠心病的急性冠脉综合征风险预测方法及装置 |
CN112509701A (zh) * | 2021-02-05 | 2021-03-16 | 中国医学科学院阜外医院 | 急性冠脉综合征的风险预测方法及装置 |
CN114360726A (zh) * | 2021-02-05 | 2022-04-15 | 中国医学科学院阜外医院 | 稳定型冠心病发病风险评估标志物及其应用 |
CN114438165A (zh) * | 2021-02-05 | 2022-05-06 | 中国医学科学院阜外医院 | 针对稳定型冠心病的急性冠脉综合征风险评估标志物及应用 |
CN114438165B (zh) * | 2021-02-05 | 2023-11-21 | 中国医学科学院阜外医院 | 针对稳定型冠心病的急性冠脉综合征风险评估标志物及应用 |
CN114283890A (zh) * | 2021-12-15 | 2022-04-05 | 南京医科大学 | 一种基于瘤胃球菌微生物群的疾病风险预测方法及装置 |
CN114002421A (zh) * | 2021-12-30 | 2022-02-01 | 佛山市第三人民医院(佛山市精神卫生中心) | 外泌体代谢物作为双相情感障碍标志物的应用 |
WO2023123613A1 (zh) * | 2021-12-30 | 2023-07-06 | 浙江大学 | 双相情感障碍生物标志物及其应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2021184412A1 (zh) | 2021-09-23 |
CN111430027B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111430027B (zh) | 基于肠道微生物的双相情感障碍生物标志物及其筛选应用 | |
CN105368944B (zh) | 可检测疾病的生物标志物及其用途 | |
CN105296590B (zh) | 大肠癌标志物及其应用 | |
CN111505288B (zh) | 一种新的抑郁症生物标志物及其应用 | |
WO2020244018A1 (zh) | 一种精神分裂症的小规模生物标志物组合、其应用及metaphlan2筛选方法 | |
US20150211053A1 (en) | Biomarkers for diabetes and usages thereof | |
CN105132518B (zh) | 大肠癌标志物及其应用 | |
CN110904213B (zh) | 一种基于肠道菌群的溃疡性结肠炎生物标志物及其应用 | |
EP3786305A1 (en) | Biomarker for depression and use thereof | |
CN111020020A (zh) | 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法 | |
CN110838365A (zh) | 肠易激综合症相关菌群标志物及其试剂盒 | |
Pozzi et al. | A ‘multiomic’approach of saliva metabolomics, microbiota, and serum biomarkers to assess the need of hospitalization in coronavirus disease 2019 | |
CN113913490A (zh) | 非酒精性脂肪肝标志微生物及其应用 | |
CN110396538B (zh) | 偏头痛生物标志物及其用途 | |
WO2021184413A1 (zh) | 双相情感障碍疗效预测的肠道微生物标志物及其筛选应用 | |
CN112011605B (zh) | 微生物菌群在疾病诊断中的应用 | |
CN112384634A (zh) | 骨质疏松生物标志物及其用途 | |
CN112063709B (zh) | 一种以微生物作为诊断标志物的重症肌无力的诊断试剂盒及应用 | |
CN114657270A (zh) | 一种基于肠道菌群的阿尔茨海默病生物标志物及其应用 | |
CN114317671A (zh) | 可作为1型糖尿病生物标志物的肠道细菌和粪便代谢物及其应用 | |
CN114381493A (zh) | 炎症性肠病标志微生物及其应用 | |
CN111020021A (zh) | 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法 | |
CN112029880B (zh) | 用于重症肌无力的检测的微生物及应用 | |
CN113862382A (zh) | 肠道菌群的生物标志物在制备诊断成人免疫性血小板减少症的产品中的应用 | |
CN110396537B (zh) | 哮喘生物标志物及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |