CN114032278A - 结直肠癌的微生物标志物及其应用 - Google Patents

结直肠癌的微生物标志物及其应用 Download PDF

Info

Publication number
CN114032278A
CN114032278A CN202110326152.0A CN202110326152A CN114032278A CN 114032278 A CN114032278 A CN 114032278A CN 202110326152 A CN202110326152 A CN 202110326152A CN 114032278 A CN114032278 A CN 114032278A
Authority
CN
China
Prior art keywords
colorectal cancer
microbial
bacteria
virus
species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110326152.0A
Other languages
English (en)
Inventor
王慧
刘宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University School of Medicine
Original Assignee
Shanghai Jiaotong University School of Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University School of Medicine filed Critical Shanghai Jiaotong University School of Medicine
Priority to CN202110326152.0A priority Critical patent/CN114032278A/zh
Publication of CN114032278A publication Critical patent/CN114032278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/74Bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/66Microorganisms or materials therefrom
    • A61K35/76Viruses; Subviral particles; Bacteriophages
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K36/00Medicinal preparations of undetermined constitution containing material from algae, lichens, fungi or plants, or derivatives thereof, e.g. traditional herbal medicines
    • A61K36/06Fungi, e.g. yeasts
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • C12Q1/06Quantitative determination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • C12Q1/14Streptococcus; Staphylococcus
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Public Health (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Mycology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Toxicology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Primary Health Care (AREA)
  • General Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Alternative & Traditional Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Botany (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)

Abstract

本发明提供了一种结直肠癌的微生物标志物,其选自细菌、真菌、古菌和病毒中的一种及以上,优选为细菌和真菌的组合;本发明通过对结直肠癌个体和健康个体的粪便样本中微生物的丰度、组成及微生物间相互作用进行差异分析和比较,标志物在结直肠癌患者的粪便样本中的含量显著高于在健康个体的粪便样本中的含量,并且标志物之间的相互作用在结直肠癌患者的粪便样本中变化显著,且具有统计学意义,能够较为准确地确定个体是否患有结直肠癌,具有非侵入性辅助诊断结直肠癌的作用,患者耐受性强;本发明通过微生物组成分析获得结直肠癌患者肠道微生物组中特异性富集的物种种类、数量、比值和相互作用特征,最终以此为基础进行结直肠癌的诊断。

Description

结直肠癌的微生物标志物及其应用
技术领域
本发明属于微生物组或结直肠癌技术领域,具体涉及一种结直肠癌的微生物标志物及其应用。
背景技术
结直肠癌(colorectal cancer,CRC)作为全球第二大癌症相关死亡原因,每年约有90万死亡病例,并且其发病率在50岁以下人群中迅速上升。随着时间的推移,CRC的经济负担持续增长,预计2018年仅美国而言,其经济负担就约为166.3亿美元。因此,改进结直肠癌的筛查方法尤为重要,这可能不仅受到遗传和表观遗传因素的影响,还受到环境因素的影响,其中包括已深入研究的肠道微生物组。
与健康人相比,CRC患者的微生物群严重失调。多项研究已经揭示了CRC和细菌组之间的密切联系,细菌组是肠道微生物组的主要组成部分。目前已知在结直肠癌患者的粪便含有大量的前致癌细菌,包括具核梭杆菌、大肠杆菌、脆弱拟杆菌和胃链球菌,同时大量的有益菌或保护菌属如梭状芽胞杆菌、玫瑰杆菌、粪杆菌和双歧杆菌则消失。
人体宿主被微生物群所定植,这些微生物群由多种多样的生物体组成,除了细菌之外,还包括真菌、古菌和病毒。此外,考虑到宿主生态位的共享,这些生物之间还存在有大量的物种间相互作用,这对人体健康或疾病状态产生了重大影响。非细菌物种是胃肠道稳定的共生体,参与多种代谢活动。据报道,古菌在甲烷生成、重金属转化和免疫调节中发挥关键作用。病毒,特别是噬菌体,显著影响细菌的生长和全球的生态平衡。真菌及其菌群,调节宿主的免疫系统,并且与细菌及其它微生物物种有密切的相互作用。所以,仅仅依靠单一物种的检测,无法对CRC的诊断做出客观、精准和全面的系统性判断,必须结合多种物种,综合考虑各物种之间的相互作用关系。
A.目前临床常用的结直肠癌诊断方法主要包括X射线检查、肠镜检查和癌胚抗原(CEA) 检查。这三类方法各有优缺点,其中X射线检查的可观察全部结直肠病变的影像,同时可了解肠道运动情况,协助少数疾病的治疗,但该方法受检查者的经验水平与设备条件影响较大,无法获取病理标本确诊,不能做治疗,并且对凹陷性及平坦性病变识别能力较差,有辐射损害。目前肠镜检查适应于筛查、确诊、随访与治疗,可谓全天候手段,其优点是可直接观察病变,范围可及全结肠,没有盲区,能同时取病理标本,做某些内镜下治疗,减少部分外科手术。该项检查被认为是结肠肿瘤诊断的重要手段。但该方法的缺点是术前准备,尤其是肠道清洁处理稍显麻烦。诊断准确性受内镜医师的经验与操作技术熟练程度影响甚大,创伤性也较大,有一定比例的并发症,主要是出血与穿孔,少数会发生心血管突发事件。无痛肠镜可减少不适感,但增加麻醉风险,且收费要高一些。癌胚抗原(CEA)对早期病例的诊断价值不大;有研究表明,mir-92可以作为结直肠癌标志物,但是依据血液中mir-92的含量进行结直肠癌的诊断,错误率高达30%。随着人类基因组测序计划的完成以及高通量测序技术的发展,基因筛查技术已成为一种新的结直肠癌的诊断方法,在结直肠癌的早期诊断中具有显著的优势,其中宏基因组测序越来越受到普遍的欢迎。
B.已有的结直肠癌微生物标志物涉及的微生物种类少,且基本局限为单一物种如细菌,并未涉及四大界微生物之间的相互作用;
C.微生物组结构可能受基因、饮食、药物以及其他外界环境因素的影响,存在明显的个体间差异;
D.目前的微生物组研究大多集中在细菌,对于物种间的大规模相互作用并未触及,而且所得结果缺乏实验验证,因此很难全面代表疾病状态下的微生物组客观状态;
E.相较于传统的抗肿瘤治疗手段,微生物治疗已初步崭露头角,但特异性微生物种属应用于结直肠癌治疗的相关机制仍需要进一步研究;
F.目前结直肠癌微生物组学研究样本量均较小,所得结果不具有普适意义,需要大样本量和多中心合作以获得具有统计学意义的大样本数据;
G.目前的样本收集、DNA提取和微生物组分析流程参差不齐,需要建立标准化的样本收集与处理流程,以减少因采样标准差异而造成的实验结果偏倚;
F.如何优化采样技术并避免临床样本的污染也是当前面临的问题之一。
未来,更多的研究成果将进一步阐明稀少和稀有微生物组尤其是真菌与结直肠癌的关系,这些机理将为结直肠癌发生和发展机制、微生物标志物早期筛查、精准和个体化治疗方案等方面提供新的理论基础和治疗靶标。
发明内容
针对现有技术中的不足,迄今为止,只有少数研究探讨了非细菌肠道微生物的群落波动,以及疾病中多界微生物之间潜在的相互作用,如非酒精性脂肪性肝病、炎症性肠病。而且这些研究主要集中在单一界内物种的微生物相互作用上。CRC相关微生物群的研究涉及多个界物种(细菌、真菌、古菌和病毒),特别是这些微生物之间的相互作用,目前仍处于起步阶段。
本发明所涉及的微生物囊括细菌、真菌、古菌和病毒,可以较为全面地综合各种微生物,对CRC做出更为准确的判断。具体地,本发明涉及结直肠癌患者粪便样本中的细菌、真菌、古菌和病毒四大微生物类群标志物及不同物种间的特定相互作用关系,及其在结直肠癌筛查、诊断或辅助治疗中的应用。
为达到上述目的,本发明的解决方案是:
一种结直肠癌的微生物标志物,其选自细菌、真菌、古菌和病毒中的一种及以上。
优选地,结直肠癌的微生物标志物为细菌和真菌的组合。
一种上述的微生物标志物在制备结直肠癌诊断试剂和/或结直肠癌诊断药物中的应用。
一种药物组合物包括上述结直肠癌的微生物标志物。
一种诊断上述的微生物标志物的试剂盒,该试剂盒包括结直肠癌的微生物标志物。
一种预测结直肠癌的模型,其包括结直肠癌微生物标志物的丰度和微生物标志物间的相互作用。
优选地,结直肠癌微生物标志物的丰度测定方法为宏基因组测序。
人体宿主被微生物群所定植,这些微生物群由多种多样的生物体组成,除了细菌之外,还包括真菌、古菌和病毒。考虑到宿主生态位的共享,这些生物之间的相互作用可以对人类健康或疾病状态产生重大影响。非细菌物种是胃肠道稳定的共生体,参与多种代谢活动。据报道,古菌在甲烷生成、重金属转化和免疫调节中发挥关键作用。病毒,特别是噬菌体,显著影响细菌的健康和全球生态循环。真菌及其菌群,调节宿主的免疫系统,并且与细菌有密切的相互作用。所以,仅仅依靠单一物种的检测,无法对CRC的诊断做出精准的判断,必须结合多种物种,综合考虑各物种之间的相互作用关系。
本发明涉及提取结直肠癌患者粪便样本中的菌群DNA通过宏基因组测序对物种进行鉴定,获得肠道微生物组(微生物组是细菌、真菌、古菌和病毒互作所形成的动态平衡体系)中四大微生物类群的种类和丰度特征,并通过微生物组成分析获得结直肠癌患者肠道微生物组中特异性富集的物种种类、数量、比值和相互作用特征,最终以此为基础进行结直肠癌的诊断。
由于采用上述方案,本发明的有益效果是:
第一、本发明通过对结直肠癌个体和健康个体的粪便样本中微生物的丰度进行差异分析和比较,标志物在结直肠癌患者的粪便样本中的含量显著高于在健康个体的粪便样本中的含量,且具有统计学意义,能够较为准确地确定个体是否患有结直肠癌,具有非侵入性辅助诊断结直肠癌的作用,仅需粪便即可检测,患者耐受性强。
第二、本发明在CRC早期即可检测,一方面,可以早发现早诊断CRC病例,可以显著提高CRC患者的生存期;另一方面,可以有效节约医疗资源,从而更好地配置稀缺医疗资源。
第三、本发明所设计的单物种预测模型包括16种古菌、26种细菌、24种真菌和102种病毒,纳入物种广泛且量多,准确性高。
附图说明
图1为本发明的四界中CRC的总体微生物丰度示意图。
图2为本发明的四界中古菌、细菌、真菌和病毒丰度示意图。
图3为本发明的四界中CRC与对照样本的肠道微生物组组成示意图。
图4为本发明的四界中微生物种类变化示意图。
图5为本发明的四界中古菌、细菌和病毒种类变化示意图。
图6为本发明的古菌、细菌、真菌和病毒的AUROC值示意图。
图7为本发明每一个单一界别物种构建的分类模型在另一组独立人群队列中预测能力的表现图。
图8为本发明的两界中细菌和真菌的组合示意图。
图9为本发明的三界中细菌、真菌、古菌的预测示意图。
图10为本发明的四界中细菌、真菌、古菌和病毒的预测示意图。
图11为本发明的细菌-真菌模型中预测示意图。
图12为本发明的细菌和真菌组合特征构建的模型预测能力表现图。
图13为本发明运用内部随机森林基尼重要性方法通过预测能力表现交互验证评估细菌- 真菌组合特征的重要性图。
图14为本发明的验证队列中非CRC病例样本和相应对照样本AUC比较示意图。
具体实施方式
本发明提供了一种结直肠癌的微生物标志物及其应用。
本发明首次发现,在不同地域人群中,CRC患者和健康对照组之间除了细菌,在真菌、古菌和病毒也存在差异。目前尚未见有报道用于临床或关于结直肠癌筛查的四大微生物类群菌群谱,本发明首次进行了大规模的人群分析,并得到了囊括四大菌群的综合性、系统性、整合性的微生物组图谱,而且能更准确地辅助诊断结直肠癌。
因此,本发明主要涉及CRC的综合致癌微生物群,包括细菌、真菌、古菌和病毒。一方面,本发明在9个跨地域不同队列人群中测试了单物种诊断CRC的可预测性,并确定了一组微生物特征,这些特征可作为CRC特异性诊断的生物标志物,具有广泛的推广价值;因此本发明首次纳入来自9个队列的1368个大样本量人群,并且数据经过验证队列的验证。另一方面,本发明还发现,四个物种之间的组合诊断模型,其受试者工作特征曲线下面积(AUROC)要显著优于单个模型,尤其是细菌和真菌的组合诊断模型达到了最优的诊断效果。
所以,本发明的结直肠癌微生物标志物能够较为准确地确定个体是否患有结直肠癌,具有非侵入性辅助诊断结直肠癌的作用。
具体地,本发明中涉及9个队列共计1368个样本,包括5个发现队列和4个验证队列。
1.发现队列的建立:
5个发现队列来自5个国家(奥地利、法国、德国、中国(香港)和日本)的491名CRC受试者和494名无瘤对照者,将这5个队列分别记为AUS、FRA、GER、CHN_HK和JAP,数据均来自公开数据库。
其中,AUS:https://www.ebi.ac.uk/ena/browser/view/PRJEB7774
FRA:https://www.ebi.ac.uk/ena/browser/view/PRJEB6070
GER:https://www.ebi.ac.uk/ena/browser/view/PRJEB27928
CHN_HK:https://www.ebi.ac.uk/ena/browser/view/PRJEB10878
JAP:https://www.ncbi.nlm.nih.gov/sra/?term=DRA006684
1.1四界中与CRC相关微生物的单变量分析:
A.CRC的总体微生物丰度呈下降趋势(如图1所示)。
B.同样的下降趋势在古生菌、细菌、真菌和病毒微生物组也有观察到(如图2所示)。
C.在门水平上,本发明发现CRC与对照样本在的四界中的肠道微生物组组成不同(如图3 所示)。
D.在种水平上确定CRC患者的特定微生物种类变化,不同的微生物种类在组间差异很大,只有少数种类在组间表现出一致的趋势,其中96种细菌、56种真菌、25种古细菌和158 种病毒在CRC组和对照组的丰度存在差异,42种细菌、37种真菌、56种病毒在CRC患者中丰度升高(如图4和图5所示)。
1.2基于单一界物种的CRC微生物诊断模型的构建:诊断模型的能力由受试者工作特征曲线下面积(AUROC)判断,用来自各界的物种构建分类模型,并根据它们对总体微生物丰度的贡献,依次选择信息最丰富的物种。最终,我们确定了13种古生菌、26种细菌、24种真菌和102种病毒。
A.除了法国(FRA)和德国(GER)队列,细菌模型在所有队列中显示出最强的诊断CRC的能力(AUROC:0.73-0.88)。本发明的真菌生物标志物模型显示出卓越的区分能力(最大AUROC 为0.88,最小AUROC为0.65),特别是在FRA(0.87vs 0.85AUROC)和GER(0.85vs0.80 AUROC)数据集中,它表现得比细菌模型更好。同时,带有古菌平均AUROC(Avg AUROC)为0.72和病毒(Avg AUROC)为0.75生物标记的模型的AUROC值略低,均如图6所示。
B.为了评估上述任何一单界生物标志物是否在CRC中具有普遍性并克服地理异质性,我们进行了队列间转移分析和LOCO分析。在队列到队列的迁移分析中,该模型使用一个单队列数据集作为训练数据,随后在不同队列中验证作为测试数据。总体而言,与上述队列内模型相比,队列间转移验证的AUROC评分降低,并显示出队列间的高可变性(如图6所示)。
C.为了进一步减少在单个数据集上训练的限制,我们对模型进行了LOCL分析,分别在合并的、四个队列的数据集上训练模型,并在分别被排除的队列上验证模型。与队列间迁移分析相比,获得的AUROC值有所增加,这可能是因为训练数据集的规模更大。此外,我们在数据集内模型中观察到类似的趋势,细菌模型获得最高的中位AUROC(0.77),其次是真菌模型(中位AUROC=0.75)、病毒模型(中位AUROC=0.74)和古菌模型(中位AUROC=0.71)。总的来说,这些多界生物标志物在具有不同地理背景的队列中均显示了对CRC的无偏预测能力(如图6所示)。
2.验证队列的建立:4个验证队列来自3个国家(中国(上海)、意大利和美国)的193例 CRC患者和190例对照组,将这4个队列分别记为CHN_SH、ITAa、ITAb和USA。USA、 ITAa、ITAb来自公开数据库。
其中,USA:https://www.ebi.ac.uk/ena/browser/view/PRJEB12449
ITAa:https://www.ncbi.nlm.nih.gov/sra/?term=SRP136711
ITAb:https://www.ncbi.nlm.nih.gov/sra/?term=SRP136711
CHN_SH为本发明新建立的队列。
2.1CHN_SH队列的建立包括以下三步:
A.粪便样本的收集;
B.样本粪便DNA的提取;
C.测序和序列分析。
2.2使用独立的数据集进行额外的外部验证,以评估预筛选模型,避免过于乐观的模型准确性报告。所有的模型准确地检测到CRC患者,每个独立单一界物种模型显示更高的检测精度(细菌最大(AUROC为0.92)和古菌最低(AUROC为0.86)),如图7所示。
3.基于组合多界物种特征的CRC诊断模型改进:
通过对四大类群微生物组之间的互作分析获得了预测结直肠癌的更准确的标记物-微生物互作图谱(包括两两互作、三者互作、四者互作),其中细菌-真菌互作对的预测能力更强、准确性最高,例如Fusobacterium nucleatum和Aspergillus ochraceoroseus组合后可以显著刺激结直肠癌细胞增殖、促进细胞黏附并上调癌症相关基因表达等,此外还包括 Clostridiumbolteae-Candida pseudohaemulonis,Clostridiumbolteae-Nadsoniafulvescens互作,可以作为结直肠癌筛查以及结直肠癌发病机制的重要指标,极其有潜力成为结直肠癌筛查和早期诊断的非侵入性生物标志物。
3.1探索多界生物标志物组合的可预测性。
A.用两界生物标志物构建诊断模型。与单界诊断模型相比,双界生物标志物的AUROC 值显著提高,均在0.81以上,高于大多数单界生物标志物的AUROC值。其中,结合细菌和古生菌生物标志物的队列内模型的平均AUROC为0.84,高于任何单界模型(细菌的AUROC为0.83,古生菌的AUROC为0.72)。在其他两界生物标志物上也观察到类似的改善。值得注意的是,结合细菌和真菌生物标志物的模型的预测价值优于其他组合,达到平均 AUROC=0.86。不同队列的AUROC得分分别为0.93(AUS)、0.86(CHN_HK)、0.89(FRA)、0.88(GER)和0.75(JAP),如图8所示。
B.用三界生物标志物构建诊断模型。基于三界特征组合的模型预测值略高。细菌-真菌- 古菌模型的表现优于其他模型,平均AUROC(队列内)为0.85,高于任何单一界模型,但低于最优的两界模型。(A=古生菌;B=细菌;F=真菌;V=病毒),如图9所示。
C.用四界生物标志物构建诊断模型。基于四界生物标志物组合的模型的AUROC也没有进一步改善(Avg AUROC=0.84),如图10所示。
3.2确定细菌-真菌模型预测价值的基本特征。
A.在细菌-真菌模型中,A.niger(黑曲霉)丰度是一个平均排名最高的重要物种。其次,两种细菌,F.nucleatum和P.micra,是这些模型预测价值的第二和第三重要贡献者。同时, Talaromycesislandicus,A.rambellii,Sistotremastrumsuecicum,Trichophytonmentagrophytes等真菌种类以及Gemellamorbillorum、P.ascharolytica、Ruminococcusbicirculans等是最重要的前十贡献值者。此外,产丁酸细菌Roseburiacoccinalis和Butyricimonasfaecalis,致病菌 Bacteroidescaccae和Dialisterpneummosintes,真菌种Lipomycesstarkeyi,Saccharomyces cerevisiae和A.ochraceoroseus也在细菌-真菌模型中具有较高的平均等级。因此,这些特征排名分析强调了结合来自多个界的特征的必要性,特别是来自细菌和真菌界的特征,以最大化预测价值,如图11所示。
B.根据细菌和真菌丰度的排名依次添加物种来建立最小物种数的生物标记物panel。添加排名前13个物种后(如下),平均AUROC曲线开始最大化,AUROC为0.84(如图13所示)。构建的模型在单个队列中也取得了良好的表现。此外,除JAP(AUROC=0.71)外,所有队列模型识别CRC样本的准确率均高于0.84,AUS队列的预测力最高,AUROC为0.92,模型还显示出了跨队列的强可转移性(如图12中a所示),并且对独立验证数据集具有更高的预测值(如图12中b所示)。因此,本发明证明了13个来自细菌和真菌界的生物标志物作为基于粪便的无创CRC预筛查工具的适用性。
13个物种具体名称:
1.A.niger(Fungi)
2.F.nucleatum(Bacteria)
3.P.micra(Bacteria)
4.T.islandicus(Fungi)
5.A.rambellii(Fungi)
6.G.morbillorum(Bacteria)
7.P.asaccharolytica(Bacteria)
8.S.suecicum(Fungi)
9.R.bicirculans(Bacteria)
10.T.mentagrophytes(Fungi)
11.R.intestinalis(Bacteria)
12.B.caccae(Bacteria)
13.D.pneumosintes(Bacteria)
3.3细菌-真菌生物标志物在CRC预测模型中的特异性:
由于不同疾病的共同微生物群改变,有必要验证所识别的微生物标志物的疾病特异性,并确保CRC诊断模型的低假阳性率。因此,我们评估鉴别出的细菌和真菌特征组合对CRC 预测是否具有特异性。一些非CRC疾病数据集被评估,包括胃肠道疾病IBD(UC和CD)和非胃肠道疾病如2型糖尿病(T2D)、肝硬化(LC)和帕金森病(PD)。我们从每个外部对照组和病例 (疾病状态)组随机抽取样本,并将它们添加到独立验证队列的对照类中,以消除不同数据集之间的批处理效应。通过加入外部非CRC病例样本和相应对照样本后的AUC比较,如图14 所示,我们发现CHN-SH、ITAa和USA队列中CD和UC的AUC均略有下降,而ITAb队列的准确率有所提高。这一数据表明,来自这两种胃肠道疾病的样本对我们的CRC预测模型的影响有限。对于T2D、肝硬化和帕金森病,在相同的四个验证队列中,仅观察到预测准确性的微小变化,表明区分病例和外部对照的能力相似。总的来说,模型保持了很高的预测精度(平均AUC>0.80),表明我们的细菌-真菌模型的综合特征与其他微生物群系相关疾病无关,因此对CRC具有特异性。
其中,在单界微生物标志物的预测模型中,26种细菌、24种真菌、16种古菌以及102种病毒在结直肠癌组织中显著富集,可以作为潜在的预测结直肠癌的微生物标志物。
实际上,细菌单物种预测模型包括26种细菌,具体如下:
1.Fusobacteriumnucleatum
2.Parvimonasmicra
3.Gemellamorbillorum
4.Porphyromonasasaccharolytica
5.Ruminococcusbicirculans
6.Roseburiaintestinalis
7.Bacteroidescaccae
8.Dialisterpneumosintes
9.Lachnospiraceae bacterium KM106-2
10.Pseudobutyrivibrioxylanivorans
11.Streptococcus thermophiles
12.Lactobacillus ruminis
13.Butyricimonasfaecalis
14.Odoribactersplanchnicus
15.Ruthenibacteriumlactatiformans
16.Streptococcus anginosus
17.Faecalibacteriumprausnitzii
18.Fusobacteriumnecrophorum
19.Flavonifractorplautii
20.Bifidobacteriumpseudocatenulatum
21.Streptococcus oralis
22.Alistipesfinegoldii
23.Bacteroidescellulosilyticus
24.Clostridiales bacterium CCNA10
25.Mogibacteriumdiversum
26.Prevotellascopos
真菌单物种预测模型包括24种真菌,具体如下:
1.Aspergillus niger
2.Talaromycesislandicus
3.Aspergillus rambellii
4.Sistotremastrumsuecicum
5.Trichophytonmentagrophytes
6.Lipomycesstarkeyi
7.Saccharomyces cerevisiae
8.Penicilliumbrasilianum
9.Rhizophagusirregularis
10.Lachanceadasiensis
11.Aspergillus ochraceoroseus
12.Nosemabombycis
13.Blastomycesparvus
14.Mucorambiguus
15.Malasseziavespertilionis
16.Hypsizygusmarmoreus
17.Sclerotiniasclerotiorum
18.Nadsoniafulvescens
19.Absidiaglauca
20.Erysiphepulchra
21.Tilletia caries
22.Aspergillus violaceofuscus
23.Aspergillus nomiae
24.Rhizopusmicrospores
古菌单物种预测模型包括16种古菌,具体如下
1.Thermosphaera aggregans
2.Sulfodiicoccus acidiphilus
3.Sulfolobus acidocaldarius
4.Sulfuracidifex tepidarius
5.Sulfurisphaera tokodaii
6.Thermofilum uzonense
7.Pyrobaculum arsenaticum
8.Pyrobaculum neutrophilum
9.Halorubrum lacusprofundi
10.Methanobrevibacter smithii
11.Methanosphaera sp.BMS
12.Methanothermobacter sp.KEPCO-1
13.Methanococcoides methylutens
14.Pyrococcus horikoshii
15.Thermococcus gorgonarius
16.Thermococcus kodakarensis
病毒单物种预测模型包括102种病毒,具体如下:
1.Human mastadenovirus B
2.Simian mastadenovirus E
3.Torque teno canis virus
4.Spodoptera frugiperda ascovirus 1a
5.Perigonia lusca nucleopolyhedrovirus
6.Spodoptera littoralis nucleopolyhedrovirus
7.Adoxophyes orana granulovirus
8.Acidianus tailed spindle virus
9.Tea plant line pattern virus
10.Providence virus
11.Tea plant necrotic ring blotch virus
12.Rosellinia necatrix megabirnavirus 2-W8
13.Moumouvirus
14.Rhizoctonia solani dsRNA virus 2
15.Paramecium bursaria Chlorella virus A1
16.Aureococcus anophagefferens virus
17.African eggplant mosaic virus
18.Pepper severe mosaic virus
19.Seal parapoxvirus
20.BeAn 58058 virus
21.Solenopsis invicta virus 3
22.Thermus virus IN93
23.Pandoravirus macleodensis
24.Pandoravirus salinus
25.Tadarida brasiliensis polyomavirus 1
26.Xipapillomavirus 2
27.Parus major densovirus
28.Red-crowned crane parvovirus
29.Varroa mite associated genomovirus 1
30.Dickeya virus Limestone
31.Dickeya virus RC201
32.Pantoea virus Limelight
33.Citrobacter phage CR44b
34.Enterobacteria phage 285P
35.Synechococcus phage S-RIP1
36.Enterobacter virus EcL1
37.Shigella virus pSf1
38.Klebsiella virus PKP126
39.Bacillus virus Bc431
40.Staphylococcus virus MCE2014
41.Listeria virus LMTA148
42.Bacillus virus Mater
43.Mycobacterium virus Lukilu
44.Pandoravirus macleodensis
45.Pandoravirus salinus
46.Tadarida brasiliensis polyomavirus 2
47.Xipapillomavirus 3
48.Parus major densovirus
49.Red-crowned crane parvovirus
50.Varroa mite associated genomovirus 2
51.Dickeya virus Limestone
52.Dickeya virus RC2015
53.Pantoea virus Limelight
54.Citrobacter phage CR45b
55.Enterobacteria phage 286P
56.Synechococcus phage S-RIP2
57.Enterobacter virus EcL2
58.Shigella virus pSf2
59.Pandoravirus macleodensis
60.Pandoravirus salinus
61.Tadarida brasiliensis polyomavirus 2
62.Xipapillomavirus 3
63.Parus major densovirus
64.Red-crowned crane parvovirus
65.Varroa mite associated genomovirus 2
66.Dickeya virus Limestone
67.Dickeya virus RC2015
68.Pantoea virus Limelight
69.Citrobacter phage CR45b
70.Enterobacteria phage 286P
71.Synechococcus phage S-RIP2
72.Enterobacter virus EcL2
73.Shigella virus pSf2
74.Klebsiella virus PKP127
75.Bacillus virus Bc432
76.Staphylococcus virus MCE2015
77.Listeria virus LMTA149
78.Bacillus virus Mater
79.Mycobacterium virus Lukilu
80.Pandoravirus macleodensis
81.Pandoravirus salinus
82.Tadarida brasiliensis polyomavirus 2
83.Xipapillomavirus 3
84.Parus major densovirus
85.Red-crowned crane parvovirus
86.Varroa mite associated genomovirus 2
87.Dickeya virus Limestone
88.Dickeya virus RC2015
89.Pantoea virus Limelight
90.Citrobacter phage CR45b
91.Enterobacteria phage 286P
92.Synechococcus phage S-RIP2
93.Enterobacter virus EcL2
94.Shigella virus pSf2
95.Klebsiella virus PKP127
96.Bacillus virus Bc432
97.Staphylococcus virus MCE2015
98.Listeria virus LMTA149
99.Bacillus virus Mater
100.Mycobacterium virus Lukilu
101.Gordonia virus OneUp
102.Arthrobacter virus Tank
以下结合实施例对本发明作进一步的说明。
实施例:
本实施例的验证队列的构建过程包括:
(1)、样本粪便DNA的提取:
<1>、采集166受检者(80名结直肠癌患者和86名健康对照)的粪便,立即在-80℃冷冻,实验前置于冰上融合;
<2>、取0.18-0.22g粪便样本置于离心管中,加入1mL的Buffer SW,涡旋震荡5min后,12000rpm离心1min,弃上清;
<3>、加入600μL的Buffer SL、200μL溶菌酶,涡旋振荡1min(至样本充分均质化);
<4>、70℃水浴5min,接着80℃水浴10min,期间每隔5min涡旋振荡15s,之后平衡至室温;
<5>、12000rpm下离心3min,将上清移至装有玻璃珠的2.0mL的EP管中,接着放入组织细胞破碎仪中振荡5min,混匀后,再次振荡5min,静置15min;
<6>、将上清液转到新的2.0mL的EP管,加入600μL的Buffer GL,涡旋混匀,80℃水浴20min,期间每隔5min涡旋混匀15S;
<7>、待平衡至室温后(约10min),加入600μL无水乙醇,涡旋混匀;
<8>、将步骤7中液体转移至吸附柱,如果一次不能加完溶液,可分多次加入溶液,12000rpm离心1min;
<9>、向吸附柱中加入500μL的Buffer GW1(使用前检查是否加入了无水乙醇)12000rpm 离心1min;
<10>、重复步骤9;
<11>、向吸附柱中加入500μL的Buffer GW2(使用前检查是否已加入无水乙醇)12000rpm 离心1min;
<12>、空转,12000rpm离心2min,将吸附柱放入1.5mL锁扣EP管中,置于室温约5min,彻底晾干;
<13>、向吸附柱中间部位悬空滴加80μL的Buffer GE,室温放置5min,12000rpm离心 1min得到DNA。
(2)、测序和序列分析:
测序文库由Illumina的NEBNext Ultra DNA Library Prep Kit(NEB)生成,文库质量用安捷伦2100生物分析仪确认,并使用real-time PCR进行定量。在NovaSeq 6000(Illumina)上进行全基因组测序。所有样本都以150碱基对(bp)的读取长度配对末端测序,目标数据集大小为 12Gb。
另外,从序列阅读档案(Sequence Reads Archive,SRA)中下载了来自7个国家的8个人群的原始测序数据,主要来自发表的两篇CRC论文和日本队列。
其中,论文为:Thomas AM,Manghi P,Asnicar F,Pasolli E,Armanini F,ZolfoM,Beghini F, Manara S,Karcher N,Pozzi C,Gandini S,Serrano D,Tarallo S,Francavilla A,Gallo G,Trompetto M,Ferrero G,Mizutani S,Shiroma H,Shiba S,Shibata T,Yachida S,Yamada T,Wirbel J, Schrotz-King P,Ulrich CM,Brenner H,Arumugam M,Bork P,Zeller G,Cordero F,Dias-Neto E, Setubal JC,Tett A,PardiniB,Rescigno M,Waldron L,Naccarati A,Segata N.Metagenomic analysis ofcolorectal cancer datasets identifies cross-cohort microbial diagnosticsignatures and a link with choline degradation.Nat Med.2019Apr;25(4):667-678.doi:10.1038/s41591-019-0405-7. Epub 2019Apr 1.Erratum in:Nat Med.2019Dec;25(12):1948.PMID:30936548.
Wirbel J,Pyl PT,Kartal E,Zych K,Kashani A,Milanese A,Fleck JS,VoigtAY,Palleja A, Ponnudurai R,Sunagawa S,Coelho LP,Schrotz-King P,Vogtmann E,Habermann N,Niméus E, Thomas AM,Manghi P,Gandini S,Serrano D,Mizutani S,Shiroma H,Shiba S,Shibata T,Yachida S,Yamada T,Waldron L,Naccarati A,SegataN,Sinha R,Ulrich CM,Brenner H,Arumugam M, Bork P,Zeller G.Meta-analysis offecal metagenomes reveals global microbial signatures that are specific forcolorectal cancer.Nat Med.2019Apr;25(4):679-689.doi:10.1038/s41591-019-0406-6. Epub 2019Apr 1.PMID:30936547;PMCID:PMC7984229.
日本队列网址:https://www.ncbi.nlm.nih.gov/sra/?term=DRA006684
上述对实施例的描述是为了便于该技术领域的普通技术人员能理解和使用本发明。熟悉本领域技术人员显然可以容易的对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中,而不必经过创造性的劳动。因此,本发明不限于上述实施例。本领域技术人员根据本发明的原理,不脱离本发明的范畴所做出的改进和修改都应该在本发明的保护范围之内。

Claims (7)

1.一种结直肠癌的微生物标志物,其特征在于:其选自细菌、真菌、古菌和病毒中的一种及以上。
2.根据权利要求1所述的结直肠癌的微生物标志物,其特征在于:所述结直肠癌的微生物标志物为细菌和真菌的组合。
3.一种如权利要求1所述的微生物标志物在制备结直肠癌诊断试剂和/或结直肠癌诊断药物中的应用。
4.一种药物组合物,其特征在于:所述药物组合物包括权利要求1所述的微生物标志物。
5.一种诊断如权利要求1所述的微生物标志物的试剂盒,其特征在于:所述试剂盒包括权利要求1所述的微生物标志物。
6.一种预测结直肠癌的模型,其特征在于:其包括结直肠癌微生物标志物的丰度和微生物标志物间的相互作用。
7.根据权利要求6所述的模型,其特征在于:所述结直肠癌微生物标志物的丰度测定方法为宏基因组测序。
CN202110326152.0A 2021-03-26 2021-03-26 结直肠癌的微生物标志物及其应用 Pending CN114032278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110326152.0A CN114032278A (zh) 2021-03-26 2021-03-26 结直肠癌的微生物标志物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110326152.0A CN114032278A (zh) 2021-03-26 2021-03-26 结直肠癌的微生物标志物及其应用

Publications (1)

Publication Number Publication Date
CN114032278A true CN114032278A (zh) 2022-02-11

Family

ID=80139923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110326152.0A Pending CN114032278A (zh) 2021-03-26 2021-03-26 结直肠癌的微生物标志物及其应用

Country Status (1)

Country Link
CN (1) CN114032278A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109852714A (zh) * 2019-03-07 2019-06-07 南京世和基因生物技术有限公司 一种肠癌早期诊断和腺瘤诊断标志物及用途
CN110637097A (zh) * 2017-03-17 2019-12-31 第二基因组股份有限公司 利用基于序列的排泄物微生物群落调查数据来鉴定结直肠癌的组合生物标志物

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110637097A (zh) * 2017-03-17 2019-12-31 第二基因组股份有限公司 利用基于序列的排泄物微生物群落调查数据来鉴定结直肠癌的组合生物标志物
CN109852714A (zh) * 2019-03-07 2019-06-07 南京世和基因生物技术有限公司 一种肠癌早期诊断和腺瘤诊断标志物及用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
OLABISI OLUWABUKOLA COKER等: "Enteric fungal microbiota dysbiosis and ecological alterations in colorectal cancer", GUT MICROBIOTA *

Similar Documents

Publication Publication Date Title
US20190367995A1 (en) Biomarkers for colorectal cancer
WO2019233102A1 (zh) 用于结直肠癌诊断、检测或筛查的引物和探针组
WO2014019271A1 (en) Biomarkers for diabetes and usages thereof
CN101298629B (zh) Lrrc4基因启动子区甲基化检测在脑胶质瘤诊断中的应用及其检测系统
CN107208141B (zh) 用于结直肠癌相关疾病的生物标志物
CN104988216B (zh) 慢性心力衰竭相关的血清miRNA及其应用
WO2016049932A1 (en) Biomarkers for obesity related diseases
CN105861672A (zh) 一种人体外周血游离DNA中septin9基因甲基化检测试剂盒及检测方法
CN112609015A (zh) 一种预测结直肠癌风险的微生物标志物及其应用
WO2020248665A1 (zh) 结直肠癌的相关预测系统、电子设备和存储介质
CN112094907A (zh) 外周血红细胞微核dna及其应用
CN107557461B (zh) 一种用于肝癌易感基因早筛的核酸质谱的检测方法
CN104988141B (zh) BRCA2基因g.32912799T>C突变及其在乳腺癌辅助诊断中的应用
CN102534008A (zh) 一种与非贲门癌辅助诊断相关的snp标志物及其应用
CN115261465A (zh) 包括外泌体miR-125a-5p、miR-3158-3p等在肺癌诊断中的应用
WO2017156739A1 (zh) 分离的核酸及应用
CN105671179B (zh) 血清microRNA在肝癌诊断中的应用及诊断试剂盒
CN107557468B (zh) 一种与原发性肺癌辅助诊断相关的癌-睾丸基因遗传标志物及其应用
EP3250708B1 (en) Biomarkers for colorectal cancer related diseases
CN114032278A (zh) 结直肠癌的微生物标志物及其应用
CN113025730B (zh) 一种与肝硬化相关的肝内菌群标志物及其应用
CN104946751B (zh) BRCA1基因g.41244291delT突变及其在乳腺癌辅助诊断中的应用
CN112375832B (zh) 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法
CN109880903B (zh) 一种用于非小细胞肺癌辅助诊断的snp标志物及其应用
CN104962612B (zh) BRCA1基因g.41256139delT移码突变及其在制备乳腺癌辅助诊断试剂盒中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination