CN114032278A - 结直肠癌的微生物标志物及其应用 - Google Patents
结直肠癌的微生物标志物及其应用 Download PDFInfo
- Publication number
- CN114032278A CN114032278A CN202110326152.0A CN202110326152A CN114032278A CN 114032278 A CN114032278 A CN 114032278A CN 202110326152 A CN202110326152 A CN 202110326152A CN 114032278 A CN114032278 A CN 114032278A
- Authority
- CN
- China
- Prior art keywords
- colorectal cancer
- microbial
- bacteria
- virus
- species
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010009944 Colon cancer Diseases 0.000 title claims abstract description 105
- 208000001333 Colorectal Neoplasms Diseases 0.000 title claims abstract description 105
- 230000000813 microbial effect Effects 0.000 title claims abstract description 43
- 239000003550 marker Substances 0.000 title claims abstract description 24
- 241000894006 Bacteria Species 0.000 claims abstract description 56
- 241000700605 Viruses Species 0.000 claims abstract description 53
- 241000233866 Fungi Species 0.000 claims abstract description 40
- 244000005700 microbiome Species 0.000 claims abstract description 32
- 241000203069 Archaea Species 0.000 claims abstract description 31
- 230000003993 interaction Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 239000003814 drug Substances 0.000 claims description 3
- 239000008194 pharmaceutical composition Substances 0.000 claims description 3
- 239000003153 chemical reaction reagent Substances 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 241000894007 species Species 0.000 abstract description 31
- 238000003745 diagnosis Methods 0.000 abstract description 16
- 238000004458 analytical method Methods 0.000 abstract description 12
- 230000002550 fecal effect Effects 0.000 abstract description 9
- 230000000968 intestinal effect Effects 0.000 abstract description 7
- 239000000203 mixture Substances 0.000 abstract description 5
- 230000008859 change Effects 0.000 abstract description 2
- 239000000090 biomarker Substances 0.000 description 19
- 239000000523 sample Substances 0.000 description 15
- 230000001580 bacterial effect Effects 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 10
- 230000002538 fungal effect Effects 0.000 description 10
- 238000010200 validation analysis Methods 0.000 description 10
- 201000010099 disease Diseases 0.000 description 9
- 238000012216 screening Methods 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000001179 sorption measurement Methods 0.000 description 5
- 241000228245 Aspergillus niger Species 0.000 description 4
- 102000012406 Carcinoembryonic Antigen Human genes 0.000 description 4
- 108010022366 Carcinoembryonic Antigen Proteins 0.000 description 4
- 241001187099 Dickeya Species 0.000 description 4
- 241001470217 Dickeya virus Limestone Species 0.000 description 4
- 241000588914 Enterobacter Species 0.000 description 4
- 241000736262 Microbiota Species 0.000 description 4
- 241001330460 Pandoravirus Species 0.000 description 4
- 241000536682 Pandoravirus salinus Species 0.000 description 4
- 241000191515 Pantoea virus Limelight Species 0.000 description 4
- 241000604134 Parus major densovirus Species 0.000 description 4
- 241000179070 Red-crowned crane parvovirus Species 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 210000003608 fece Anatomy 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 241000588923 Citrobacter Species 0.000 description 3
- 241000193403 Clostridium Species 0.000 description 3
- 241000305071 Enterobacterales Species 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 241000605986 Fusobacterium nucleatum Species 0.000 description 3
- 208000018522 Gastrointestinal disease Diseases 0.000 description 3
- 241000186781 Listeria Species 0.000 description 3
- 241000186359 Mycobacterium Species 0.000 description 3
- 208000018737 Parkinson disease Diseases 0.000 description 3
- 241001464887 Parvimonas micra Species 0.000 description 3
- 241001288367 Shigella virus PSf2 Species 0.000 description 3
- 241001595411 Synechococcus phage S-RIP2 Species 0.000 description 3
- 241001380674 Tadarida brasiliensis polyomavirus 2 Species 0.000 description 3
- 241001136496 Talaromyces islandicus Species 0.000 description 3
- 241000895647 Varroa Species 0.000 description 3
- 241001071654 Xipapillomavirus 3 Species 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013399 early diagnosis Methods 0.000 description 3
- 210000001035 gastrointestinal tract Anatomy 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000228212 Aspergillus Species 0.000 description 2
- 241000965925 Aspergillus rambellii Species 0.000 description 2
- 241000217846 Bacteroides caccae Species 0.000 description 2
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 2
- 241001535058 Dialister pneumosintes Species 0.000 description 2
- 206010016654 Fibrosis Diseases 0.000 description 2
- 241001147749 Gemella morbillorum Species 0.000 description 2
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 241001135211 Porphyromonas asaccharolytica Species 0.000 description 2
- 241000398180 Roseburia intestinalis Species 0.000 description 2
- 241000062639 Ruminococcus bicirculans Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241001179562 Sistotremastrum suecicum Species 0.000 description 2
- 241000191940 Staphylococcus Species 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 235000006468 Thea sinensis Nutrition 0.000 description 2
- 241001045770 Trichophyton mentagrophytes Species 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000711 cancerogenic effect Effects 0.000 description 2
- 231100000315 carcinogenic Toxicity 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 208000019425 cirrhosis of liver Diseases 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 244000005709 gut microbiome Species 0.000 description 2
- 229910001385 heavy metal Inorganic materials 0.000 description 2
- 230000003832 immune regulation Effects 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 108091059456 miR-92-1 stem-loop Proteins 0.000 description 2
- 108091084336 miR-92-2 stem-loop Proteins 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000003260 vortexing Methods 0.000 description 2
- 241000235390 Absidia glauca Species 0.000 description 1
- 241001137524 Acidianus tailed spindle virus Species 0.000 description 1
- 241000681673 Adoxophyes orana granulovirus Species 0.000 description 1
- 241001053499 African eggplant mosaic virus Species 0.000 description 1
- 241001580959 Alistipes finegoldii Species 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 241000168434 Arthrobacter virus Tank Species 0.000 description 1
- 241000981397 Aspergillus ochraceoroseus Species 0.000 description 1
- 241000245649 Aspergillus violaceofuscus Species 0.000 description 1
- 241001245421 Aureococcus anophagefferens virus Species 0.000 description 1
- 241000192205 Bacillus virus Bc431 Species 0.000 description 1
- 241001032450 Bacteroides cellulosilyticus Species 0.000 description 1
- 241000606124 Bacteroides fragilis Species 0.000 description 1
- 241000957224 BeAn 58058 virus Species 0.000 description 1
- 241000186000 Bifidobacterium Species 0.000 description 1
- 241001134772 Bifidobacterium pseudocatenulatum Species 0.000 description 1
- 241000565603 Citrobacter phage CR44b Species 0.000 description 1
- 241000904825 Clostridiales bacterium Species 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000537219 Deltabaculovirus Species 0.000 description 1
- 241000637733 Enterobacteria phage 285P Species 0.000 description 1
- 241000290970 Erysiphe pulchra Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000605980 Faecalibacterium prausnitzii Species 0.000 description 1
- 241001134569 Flavonifractor plautii Species 0.000 description 1
- 241000605909 Fusobacterium Species 0.000 description 1
- 241000605952 Fusobacterium necrophorum Species 0.000 description 1
- 241000168418 Gordonia virus OneUp Species 0.000 description 1
- 241000204930 Halorubrum lacusprofundi Species 0.000 description 1
- 241001545456 Human mastadenovirus B Species 0.000 description 1
- 241001534815 Hypsizygus marmoreus Species 0.000 description 1
- 241000132137 Klebsiella virus PKP126 Species 0.000 description 1
- 241000737811 Lachancea dasiensis Species 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241000186870 Lactobacillus ruminis Species 0.000 description 1
- 241001149691 Lipomyces starkeyi Species 0.000 description 1
- 241000202985 Methanobrevibacter smithii Species 0.000 description 1
- 241000205026 Methanococcoides methylutens Species 0.000 description 1
- 241000805272 Methanosphaera sp. BMS Species 0.000 description 1
- 241000486140 Methanothermobacter sp. Species 0.000 description 1
- 241000198070 Mogibacterium diversum Species 0.000 description 1
- 241000458574 Moumouvirus Species 0.000 description 1
- 241000306281 Mucor ambiguus Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 241000193627 Nadsonia fulvescens Species 0.000 description 1
- 241001126828 Nosema bombycis Species 0.000 description 1
- 241001135232 Odoribacter splanchnicus Species 0.000 description 1
- 101150046368 PSF1 gene Proteins 0.000 description 1
- 241001287846 Palleronia Species 0.000 description 1
- 241000489834 Paramecium bursaria Chlorella virus A1 Species 0.000 description 1
- 241001496963 Penicillium brasilianum Species 0.000 description 1
- 241000723787 Pepper severe mosaic virus Species 0.000 description 1
- 241001678346 Perigonia lusca Species 0.000 description 1
- 241000257453 Pisaster ochraceus Species 0.000 description 1
- 241001678470 Prevotella scopos Species 0.000 description 1
- 241001569583 Providence virus Species 0.000 description 1
- 241001102666 Pseudobutyrivibrio xylanivorans Species 0.000 description 1
- 241000517244 Pyrobaculum arsenaticum Species 0.000 description 1
- 241001223147 Pyrobaculum neutrophilum Species 0.000 description 1
- 241000522615 Pyrococcus horikoshii Species 0.000 description 1
- 241000724548 Rhizoctonia solani dsRNA virus 2 Species 0.000 description 1
- 241001663183 Rhizophagus irregularis Species 0.000 description 1
- 241000721095 Rosellinia necatrix megabirnavirus 2-W8 Species 0.000 description 1
- 241000192031 Ruminococcus Species 0.000 description 1
- 241000190045 Ruthenibacterium lactatiformans Species 0.000 description 1
- 241000221696 Sclerotinia sclerotiorum Species 0.000 description 1
- 241001123657 Seal parapoxvirus Species 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 241000229305 Simian mastadenovirus E Species 0.000 description 1
- 241001103484 Solenopsis invicta virus 3 Species 0.000 description 1
- 241000183927 Spodoptera frugiperda ascovirus 1a Species 0.000 description 1
- 239000005933 Spodoptera littoralis nucleopolyhedrovirus Substances 0.000 description 1
- 241000701417 Spodoptera littoralis nucleopolyhedrovirus Species 0.000 description 1
- 241001307092 Staphylococcus virus MCE2014 Species 0.000 description 1
- 241000194008 Streptococcus anginosus Species 0.000 description 1
- 241000194025 Streptococcus oralis Species 0.000 description 1
- 241000629468 Sulfodiicoccus acidiphilus Species 0.000 description 1
- 241000205098 Sulfolobus acidocaldarius Species 0.000 description 1
- 241000985077 Sulfurisphaera Species 0.000 description 1
- 241001595412 Synechococcus phage S-RIP1 Species 0.000 description 1
- 241001380675 Tadarida brasiliensis polyomavirus 1 Species 0.000 description 1
- 241001237851 Thermococcus gorgonarius Species 0.000 description 1
- 241001235254 Thermococcus kodakarensis Species 0.000 description 1
- 241000191160 Thermofilum uzonense Species 0.000 description 1
- 241000531145 Thermosphaera aggregans Species 0.000 description 1
- 241001514263 Thermus virus IN93 Species 0.000 description 1
- 241000722093 Tilletia caries Species 0.000 description 1
- 241001340127 Torque teno canis virus Species 0.000 description 1
- 241000223238 Trichophyton Species 0.000 description 1
- 241000153905 Varroa mite associated genomovirus 1 Species 0.000 description 1
- 241000439450 Xipapillomavirus 2 Species 0.000 description 1
- 238000009098 adjuvant therapy Methods 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 238000003287 bathing Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000005773 cancer-related death Effects 0.000 description 1
- 231100000504 carcinogenesis Toxicity 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000002526 effect on cardiovascular system Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 238000011337 individualized treatment Methods 0.000 description 1
- 230000027056 interspecies interaction between organisms Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 208000008338 non-alcoholic fatty liver disease Diseases 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 231100000915 pathological change Toxicity 0.000 description 1
- 230000036285 pathological change Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 201000008827 tuberculosis Diseases 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 238000007473 univariate analysis Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/74—Bacteria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/66—Microorganisms or materials therefrom
- A61K35/76—Viruses; Subviral particles; Bacteriophages
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K36/00—Medicinal preparations of undetermined constitution containing material from algae, lichens, fungi or plants, or derivatives thereof, e.g. traditional herbal medicines
- A61K36/06—Fungi, e.g. yeasts
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
- C12Q1/06—Quantitative determination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/04—Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
- C12Q1/14—Streptococcus; Staphylococcus
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/70—Mechanisms involved in disease identification
- G01N2800/7023—(Hyper)proliferation
- G01N2800/7028—Cancer
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Veterinary Medicine (AREA)
- Mycology (AREA)
- Genetics & Genomics (AREA)
- Medical Informatics (AREA)
- Animal Behavior & Ethology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Toxicology (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Primary Health Care (AREA)
- General Chemical & Material Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Alternative & Traditional Medicine (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Botany (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
Abstract
本发明提供了一种结直肠癌的微生物标志物,其选自细菌、真菌、古菌和病毒中的一种及以上,优选为细菌和真菌的组合;本发明通过对结直肠癌个体和健康个体的粪便样本中微生物的丰度、组成及微生物间相互作用进行差异分析和比较,标志物在结直肠癌患者的粪便样本中的含量显著高于在健康个体的粪便样本中的含量,并且标志物之间的相互作用在结直肠癌患者的粪便样本中变化显著,且具有统计学意义,能够较为准确地确定个体是否患有结直肠癌,具有非侵入性辅助诊断结直肠癌的作用,患者耐受性强;本发明通过微生物组成分析获得结直肠癌患者肠道微生物组中特异性富集的物种种类、数量、比值和相互作用特征,最终以此为基础进行结直肠癌的诊断。
Description
技术领域
本发明属于微生物组或结直肠癌技术领域,具体涉及一种结直肠癌的微生物标志物及其应用。
背景技术
结直肠癌(colorectal cancer,CRC)作为全球第二大癌症相关死亡原因,每年约有90万死亡病例,并且其发病率在50岁以下人群中迅速上升。随着时间的推移,CRC的经济负担持续增长,预计2018年仅美国而言,其经济负担就约为166.3亿美元。因此,改进结直肠癌的筛查方法尤为重要,这可能不仅受到遗传和表观遗传因素的影响,还受到环境因素的影响,其中包括已深入研究的肠道微生物组。
与健康人相比,CRC患者的微生物群严重失调。多项研究已经揭示了CRC和细菌组之间的密切联系,细菌组是肠道微生物组的主要组成部分。目前已知在结直肠癌患者的粪便含有大量的前致癌细菌,包括具核梭杆菌、大肠杆菌、脆弱拟杆菌和胃链球菌,同时大量的有益菌或保护菌属如梭状芽胞杆菌、玫瑰杆菌、粪杆菌和双歧杆菌则消失。
人体宿主被微生物群所定植,这些微生物群由多种多样的生物体组成,除了细菌之外,还包括真菌、古菌和病毒。此外,考虑到宿主生态位的共享,这些生物之间还存在有大量的物种间相互作用,这对人体健康或疾病状态产生了重大影响。非细菌物种是胃肠道稳定的共生体,参与多种代谢活动。据报道,古菌在甲烷生成、重金属转化和免疫调节中发挥关键作用。病毒,特别是噬菌体,显著影响细菌的生长和全球的生态平衡。真菌及其菌群,调节宿主的免疫系统,并且与细菌及其它微生物物种有密切的相互作用。所以,仅仅依靠单一物种的检测,无法对CRC的诊断做出客观、精准和全面的系统性判断,必须结合多种物种,综合考虑各物种之间的相互作用关系。
A.目前临床常用的结直肠癌诊断方法主要包括X射线检查、肠镜检查和癌胚抗原(CEA) 检查。这三类方法各有优缺点,其中X射线检查的可观察全部结直肠病变的影像,同时可了解肠道运动情况,协助少数疾病的治疗,但该方法受检查者的经验水平与设备条件影响较大,无法获取病理标本确诊,不能做治疗,并且对凹陷性及平坦性病变识别能力较差,有辐射损害。目前肠镜检查适应于筛查、确诊、随访与治疗,可谓全天候手段,其优点是可直接观察病变,范围可及全结肠,没有盲区,能同时取病理标本,做某些内镜下治疗,减少部分外科手术。该项检查被认为是结肠肿瘤诊断的重要手段。但该方法的缺点是术前准备,尤其是肠道清洁处理稍显麻烦。诊断准确性受内镜医师的经验与操作技术熟练程度影响甚大,创伤性也较大,有一定比例的并发症,主要是出血与穿孔,少数会发生心血管突发事件。无痛肠镜可减少不适感,但增加麻醉风险,且收费要高一些。癌胚抗原(CEA)对早期病例的诊断价值不大;有研究表明,mir-92可以作为结直肠癌标志物,但是依据血液中mir-92的含量进行结直肠癌的诊断,错误率高达30%。随着人类基因组测序计划的完成以及高通量测序技术的发展,基因筛查技术已成为一种新的结直肠癌的诊断方法,在结直肠癌的早期诊断中具有显著的优势,其中宏基因组测序越来越受到普遍的欢迎。
B.已有的结直肠癌微生物标志物涉及的微生物种类少,且基本局限为单一物种如细菌,并未涉及四大界微生物之间的相互作用;
C.微生物组结构可能受基因、饮食、药物以及其他外界环境因素的影响,存在明显的个体间差异;
D.目前的微生物组研究大多集中在细菌,对于物种间的大规模相互作用并未触及,而且所得结果缺乏实验验证,因此很难全面代表疾病状态下的微生物组客观状态;
E.相较于传统的抗肿瘤治疗手段,微生物治疗已初步崭露头角,但特异性微生物种属应用于结直肠癌治疗的相关机制仍需要进一步研究;
F.目前结直肠癌微生物组学研究样本量均较小,所得结果不具有普适意义,需要大样本量和多中心合作以获得具有统计学意义的大样本数据;
G.目前的样本收集、DNA提取和微生物组分析流程参差不齐,需要建立标准化的样本收集与处理流程,以减少因采样标准差异而造成的实验结果偏倚;
F.如何优化采样技术并避免临床样本的污染也是当前面临的问题之一。
未来,更多的研究成果将进一步阐明稀少和稀有微生物组尤其是真菌与结直肠癌的关系,这些机理将为结直肠癌发生和发展机制、微生物标志物早期筛查、精准和个体化治疗方案等方面提供新的理论基础和治疗靶标。
发明内容
针对现有技术中的不足,迄今为止,只有少数研究探讨了非细菌肠道微生物的群落波动,以及疾病中多界微生物之间潜在的相互作用,如非酒精性脂肪性肝病、炎症性肠病。而且这些研究主要集中在单一界内物种的微生物相互作用上。CRC相关微生物群的研究涉及多个界物种(细菌、真菌、古菌和病毒),特别是这些微生物之间的相互作用,目前仍处于起步阶段。
本发明所涉及的微生物囊括细菌、真菌、古菌和病毒,可以较为全面地综合各种微生物,对CRC做出更为准确的判断。具体地,本发明涉及结直肠癌患者粪便样本中的细菌、真菌、古菌和病毒四大微生物类群标志物及不同物种间的特定相互作用关系,及其在结直肠癌筛查、诊断或辅助治疗中的应用。
为达到上述目的,本发明的解决方案是:
一种结直肠癌的微生物标志物,其选自细菌、真菌、古菌和病毒中的一种及以上。
优选地,结直肠癌的微生物标志物为细菌和真菌的组合。
一种上述的微生物标志物在制备结直肠癌诊断试剂和/或结直肠癌诊断药物中的应用。
一种药物组合物包括上述结直肠癌的微生物标志物。
一种诊断上述的微生物标志物的试剂盒,该试剂盒包括结直肠癌的微生物标志物。
一种预测结直肠癌的模型,其包括结直肠癌微生物标志物的丰度和微生物标志物间的相互作用。
优选地,结直肠癌微生物标志物的丰度测定方法为宏基因组测序。
人体宿主被微生物群所定植,这些微生物群由多种多样的生物体组成,除了细菌之外,还包括真菌、古菌和病毒。考虑到宿主生态位的共享,这些生物之间的相互作用可以对人类健康或疾病状态产生重大影响。非细菌物种是胃肠道稳定的共生体,参与多种代谢活动。据报道,古菌在甲烷生成、重金属转化和免疫调节中发挥关键作用。病毒,特别是噬菌体,显著影响细菌的健康和全球生态循环。真菌及其菌群,调节宿主的免疫系统,并且与细菌有密切的相互作用。所以,仅仅依靠单一物种的检测,无法对CRC的诊断做出精准的判断,必须结合多种物种,综合考虑各物种之间的相互作用关系。
本发明涉及提取结直肠癌患者粪便样本中的菌群DNA通过宏基因组测序对物种进行鉴定,获得肠道微生物组(微生物组是细菌、真菌、古菌和病毒互作所形成的动态平衡体系)中四大微生物类群的种类和丰度特征,并通过微生物组成分析获得结直肠癌患者肠道微生物组中特异性富集的物种种类、数量、比值和相互作用特征,最终以此为基础进行结直肠癌的诊断。
由于采用上述方案,本发明的有益效果是:
第一、本发明通过对结直肠癌个体和健康个体的粪便样本中微生物的丰度进行差异分析和比较,标志物在结直肠癌患者的粪便样本中的含量显著高于在健康个体的粪便样本中的含量,且具有统计学意义,能够较为准确地确定个体是否患有结直肠癌,具有非侵入性辅助诊断结直肠癌的作用,仅需粪便即可检测,患者耐受性强。
第二、本发明在CRC早期即可检测,一方面,可以早发现早诊断CRC病例,可以显著提高CRC患者的生存期;另一方面,可以有效节约医疗资源,从而更好地配置稀缺医疗资源。
第三、本发明所设计的单物种预测模型包括16种古菌、26种细菌、24种真菌和102种病毒,纳入物种广泛且量多,准确性高。
附图说明
图1为本发明的四界中CRC的总体微生物丰度示意图。
图2为本发明的四界中古菌、细菌、真菌和病毒丰度示意图。
图3为本发明的四界中CRC与对照样本的肠道微生物组组成示意图。
图4为本发明的四界中微生物种类变化示意图。
图5为本发明的四界中古菌、细菌和病毒种类变化示意图。
图6为本发明的古菌、细菌、真菌和病毒的AUROC值示意图。
图7为本发明每一个单一界别物种构建的分类模型在另一组独立人群队列中预测能力的表现图。
图8为本发明的两界中细菌和真菌的组合示意图。
图9为本发明的三界中细菌、真菌、古菌的预测示意图。
图10为本发明的四界中细菌、真菌、古菌和病毒的预测示意图。
图11为本发明的细菌-真菌模型中预测示意图。
图12为本发明的细菌和真菌组合特征构建的模型预测能力表现图。
图13为本发明运用内部随机森林基尼重要性方法通过预测能力表现交互验证评估细菌- 真菌组合特征的重要性图。
图14为本发明的验证队列中非CRC病例样本和相应对照样本AUC比较示意图。
具体实施方式
本发明提供了一种结直肠癌的微生物标志物及其应用。
本发明首次发现,在不同地域人群中,CRC患者和健康对照组之间除了细菌,在真菌、古菌和病毒也存在差异。目前尚未见有报道用于临床或关于结直肠癌筛查的四大微生物类群菌群谱,本发明首次进行了大规模的人群分析,并得到了囊括四大菌群的综合性、系统性、整合性的微生物组图谱,而且能更准确地辅助诊断结直肠癌。
因此,本发明主要涉及CRC的综合致癌微生物群,包括细菌、真菌、古菌和病毒。一方面,本发明在9个跨地域不同队列人群中测试了单物种诊断CRC的可预测性,并确定了一组微生物特征,这些特征可作为CRC特异性诊断的生物标志物,具有广泛的推广价值;因此本发明首次纳入来自9个队列的1368个大样本量人群,并且数据经过验证队列的验证。另一方面,本发明还发现,四个物种之间的组合诊断模型,其受试者工作特征曲线下面积(AUROC)要显著优于单个模型,尤其是细菌和真菌的组合诊断模型达到了最优的诊断效果。
所以,本发明的结直肠癌微生物标志物能够较为准确地确定个体是否患有结直肠癌,具有非侵入性辅助诊断结直肠癌的作用。
具体地,本发明中涉及9个队列共计1368个样本,包括5个发现队列和4个验证队列。
1.发现队列的建立:
5个发现队列来自5个国家(奥地利、法国、德国、中国(香港)和日本)的491名CRC受试者和494名无瘤对照者,将这5个队列分别记为AUS、FRA、GER、CHN_HK和JAP,数据均来自公开数据库。
其中,AUS:https://www.ebi.ac.uk/ena/browser/view/PRJEB7774
FRA:https://www.ebi.ac.uk/ena/browser/view/PRJEB6070
GER:https://www.ebi.ac.uk/ena/browser/view/PRJEB27928
CHN_HK:https://www.ebi.ac.uk/ena/browser/view/PRJEB10878
JAP:https://www.ncbi.nlm.nih.gov/sra/?term=DRA006684
1.1四界中与CRC相关微生物的单变量分析:
A.CRC的总体微生物丰度呈下降趋势(如图1所示)。
B.同样的下降趋势在古生菌、细菌、真菌和病毒微生物组也有观察到(如图2所示)。
C.在门水平上,本发明发现CRC与对照样本在的四界中的肠道微生物组组成不同(如图3 所示)。
D.在种水平上确定CRC患者的特定微生物种类变化,不同的微生物种类在组间差异很大,只有少数种类在组间表现出一致的趋势,其中96种细菌、56种真菌、25种古细菌和158 种病毒在CRC组和对照组的丰度存在差异,42种细菌、37种真菌、56种病毒在CRC患者中丰度升高(如图4和图5所示)。
1.2基于单一界物种的CRC微生物诊断模型的构建:诊断模型的能力由受试者工作特征曲线下面积(AUROC)判断,用来自各界的物种构建分类模型,并根据它们对总体微生物丰度的贡献,依次选择信息最丰富的物种。最终,我们确定了13种古生菌、26种细菌、24种真菌和102种病毒。
A.除了法国(FRA)和德国(GER)队列,细菌模型在所有队列中显示出最强的诊断CRC的能力(AUROC:0.73-0.88)。本发明的真菌生物标志物模型显示出卓越的区分能力(最大AUROC 为0.88,最小AUROC为0.65),特别是在FRA(0.87vs 0.85AUROC)和GER(0.85vs0.80 AUROC)数据集中,它表现得比细菌模型更好。同时,带有古菌平均AUROC(Avg AUROC)为0.72和病毒(Avg AUROC)为0.75生物标记的模型的AUROC值略低,均如图6所示。
B.为了评估上述任何一单界生物标志物是否在CRC中具有普遍性并克服地理异质性,我们进行了队列间转移分析和LOCO分析。在队列到队列的迁移分析中,该模型使用一个单队列数据集作为训练数据,随后在不同队列中验证作为测试数据。总体而言,与上述队列内模型相比,队列间转移验证的AUROC评分降低,并显示出队列间的高可变性(如图6所示)。
C.为了进一步减少在单个数据集上训练的限制,我们对模型进行了LOCL分析,分别在合并的、四个队列的数据集上训练模型,并在分别被排除的队列上验证模型。与队列间迁移分析相比,获得的AUROC值有所增加,这可能是因为训练数据集的规模更大。此外,我们在数据集内模型中观察到类似的趋势,细菌模型获得最高的中位AUROC(0.77),其次是真菌模型(中位AUROC=0.75)、病毒模型(中位AUROC=0.74)和古菌模型(中位AUROC=0.71)。总的来说,这些多界生物标志物在具有不同地理背景的队列中均显示了对CRC的无偏预测能力(如图6所示)。
2.验证队列的建立:4个验证队列来自3个国家(中国(上海)、意大利和美国)的193例 CRC患者和190例对照组,将这4个队列分别记为CHN_SH、ITAa、ITAb和USA。USA、 ITAa、ITAb来自公开数据库。
其中,USA:https://www.ebi.ac.uk/ena/browser/view/PRJEB12449
ITAa:https://www.ncbi.nlm.nih.gov/sra/?term=SRP136711
ITAb:https://www.ncbi.nlm.nih.gov/sra/?term=SRP136711
CHN_SH为本发明新建立的队列。
2.1CHN_SH队列的建立包括以下三步:
A.粪便样本的收集;
B.样本粪便DNA的提取;
C.测序和序列分析。
2.2使用独立的数据集进行额外的外部验证,以评估预筛选模型,避免过于乐观的模型准确性报告。所有的模型准确地检测到CRC患者,每个独立单一界物种模型显示更高的检测精度(细菌最大(AUROC为0.92)和古菌最低(AUROC为0.86)),如图7所示。
3.基于组合多界物种特征的CRC诊断模型改进:
通过对四大类群微生物组之间的互作分析获得了预测结直肠癌的更准确的标记物-微生物互作图谱(包括两两互作、三者互作、四者互作),其中细菌-真菌互作对的预测能力更强、准确性最高,例如Fusobacterium nucleatum和Aspergillus ochraceoroseus组合后可以显著刺激结直肠癌细胞增殖、促进细胞黏附并上调癌症相关基因表达等,此外还包括 Clostridiumbolteae-Candida pseudohaemulonis,Clostridiumbolteae-Nadsoniafulvescens互作,可以作为结直肠癌筛查以及结直肠癌发病机制的重要指标,极其有潜力成为结直肠癌筛查和早期诊断的非侵入性生物标志物。
3.1探索多界生物标志物组合的可预测性。
A.用两界生物标志物构建诊断模型。与单界诊断模型相比,双界生物标志物的AUROC 值显著提高,均在0.81以上,高于大多数单界生物标志物的AUROC值。其中,结合细菌和古生菌生物标志物的队列内模型的平均AUROC为0.84,高于任何单界模型(细菌的AUROC为0.83,古生菌的AUROC为0.72)。在其他两界生物标志物上也观察到类似的改善。值得注意的是,结合细菌和真菌生物标志物的模型的预测价值优于其他组合,达到平均 AUROC=0.86。不同队列的AUROC得分分别为0.93(AUS)、0.86(CHN_HK)、0.89(FRA)、0.88(GER)和0.75(JAP),如图8所示。
B.用三界生物标志物构建诊断模型。基于三界特征组合的模型预测值略高。细菌-真菌- 古菌模型的表现优于其他模型,平均AUROC(队列内)为0.85,高于任何单一界模型,但低于最优的两界模型。(A=古生菌;B=细菌;F=真菌;V=病毒),如图9所示。
C.用四界生物标志物构建诊断模型。基于四界生物标志物组合的模型的AUROC也没有进一步改善(Avg AUROC=0.84),如图10所示。
3.2确定细菌-真菌模型预测价值的基本特征。
A.在细菌-真菌模型中,A.niger(黑曲霉)丰度是一个平均排名最高的重要物种。其次,两种细菌,F.nucleatum和P.micra,是这些模型预测价值的第二和第三重要贡献者。同时, Talaromycesislandicus,A.rambellii,Sistotremastrumsuecicum,Trichophytonmentagrophytes等真菌种类以及Gemellamorbillorum、P.ascharolytica、Ruminococcusbicirculans等是最重要的前十贡献值者。此外,产丁酸细菌Roseburiacoccinalis和Butyricimonasfaecalis,致病菌 Bacteroidescaccae和Dialisterpneummosintes,真菌种Lipomycesstarkeyi,Saccharomyces cerevisiae和A.ochraceoroseus也在细菌-真菌模型中具有较高的平均等级。因此,这些特征排名分析强调了结合来自多个界的特征的必要性,特别是来自细菌和真菌界的特征,以最大化预测价值,如图11所示。
B.根据细菌和真菌丰度的排名依次添加物种来建立最小物种数的生物标记物panel。添加排名前13个物种后(如下),平均AUROC曲线开始最大化,AUROC为0.84(如图13所示)。构建的模型在单个队列中也取得了良好的表现。此外,除JAP(AUROC=0.71)外,所有队列模型识别CRC样本的准确率均高于0.84,AUS队列的预测力最高,AUROC为0.92,模型还显示出了跨队列的强可转移性(如图12中a所示),并且对独立验证数据集具有更高的预测值(如图12中b所示)。因此,本发明证明了13个来自细菌和真菌界的生物标志物作为基于粪便的无创CRC预筛查工具的适用性。
13个物种具体名称:
1.A.niger(Fungi)
2.F.nucleatum(Bacteria)
3.P.micra(Bacteria)
4.T.islandicus(Fungi)
5.A.rambellii(Fungi)
6.G.morbillorum(Bacteria)
7.P.asaccharolytica(Bacteria)
8.S.suecicum(Fungi)
9.R.bicirculans(Bacteria)
10.T.mentagrophytes(Fungi)
11.R.intestinalis(Bacteria)
12.B.caccae(Bacteria)
13.D.pneumosintes(Bacteria)
3.3细菌-真菌生物标志物在CRC预测模型中的特异性:
由于不同疾病的共同微生物群改变,有必要验证所识别的微生物标志物的疾病特异性,并确保CRC诊断模型的低假阳性率。因此,我们评估鉴别出的细菌和真菌特征组合对CRC 预测是否具有特异性。一些非CRC疾病数据集被评估,包括胃肠道疾病IBD(UC和CD)和非胃肠道疾病如2型糖尿病(T2D)、肝硬化(LC)和帕金森病(PD)。我们从每个外部对照组和病例 (疾病状态)组随机抽取样本,并将它们添加到独立验证队列的对照类中,以消除不同数据集之间的批处理效应。通过加入外部非CRC病例样本和相应对照样本后的AUC比较,如图14 所示,我们发现CHN-SH、ITAa和USA队列中CD和UC的AUC均略有下降,而ITAb队列的准确率有所提高。这一数据表明,来自这两种胃肠道疾病的样本对我们的CRC预测模型的影响有限。对于T2D、肝硬化和帕金森病,在相同的四个验证队列中,仅观察到预测准确性的微小变化,表明区分病例和外部对照的能力相似。总的来说,模型保持了很高的预测精度(平均AUC>0.80),表明我们的细菌-真菌模型的综合特征与其他微生物群系相关疾病无关,因此对CRC具有特异性。
其中,在单界微生物标志物的预测模型中,26种细菌、24种真菌、16种古菌以及102种病毒在结直肠癌组织中显著富集,可以作为潜在的预测结直肠癌的微生物标志物。
实际上,细菌单物种预测模型包括26种细菌,具体如下:
1.Fusobacteriumnucleatum
2.Parvimonasmicra
3.Gemellamorbillorum
4.Porphyromonasasaccharolytica
5.Ruminococcusbicirculans
6.Roseburiaintestinalis
7.Bacteroidescaccae
8.Dialisterpneumosintes
9.Lachnospiraceae bacterium KM106-2
10.Pseudobutyrivibrioxylanivorans
11.Streptococcus thermophiles
12.Lactobacillus ruminis
13.Butyricimonasfaecalis
14.Odoribactersplanchnicus
15.Ruthenibacteriumlactatiformans
16.Streptococcus anginosus
17.Faecalibacteriumprausnitzii
18.Fusobacteriumnecrophorum
19.Flavonifractorplautii
20.Bifidobacteriumpseudocatenulatum
21.Streptococcus oralis
22.Alistipesfinegoldii
23.Bacteroidescellulosilyticus
24.Clostridiales bacterium CCNA10
25.Mogibacteriumdiversum
26.Prevotellascopos
真菌单物种预测模型包括24种真菌,具体如下:
1.Aspergillus niger
2.Talaromycesislandicus
3.Aspergillus rambellii
4.Sistotremastrumsuecicum
5.Trichophytonmentagrophytes
6.Lipomycesstarkeyi
7.Saccharomyces cerevisiae
8.Penicilliumbrasilianum
9.Rhizophagusirregularis
10.Lachanceadasiensis
11.Aspergillus ochraceoroseus
12.Nosemabombycis
13.Blastomycesparvus
14.Mucorambiguus
15.Malasseziavespertilionis
16.Hypsizygusmarmoreus
17.Sclerotiniasclerotiorum
18.Nadsoniafulvescens
19.Absidiaglauca
20.Erysiphepulchra
21.Tilletia caries
22.Aspergillus violaceofuscus
23.Aspergillus nomiae
24.Rhizopusmicrospores
古菌单物种预测模型包括16种古菌,具体如下
1.Thermosphaera aggregans
2.Sulfodiicoccus acidiphilus
3.Sulfolobus acidocaldarius
4.Sulfuracidifex tepidarius
5.Sulfurisphaera tokodaii
6.Thermofilum uzonense
7.Pyrobaculum arsenaticum
8.Pyrobaculum neutrophilum
9.Halorubrum lacusprofundi
10.Methanobrevibacter smithii
11.Methanosphaera sp.BMS
12.Methanothermobacter sp.KEPCO-1
13.Methanococcoides methylutens
14.Pyrococcus horikoshii
15.Thermococcus gorgonarius
16.Thermococcus kodakarensis
病毒单物种预测模型包括102种病毒,具体如下:
1.Human mastadenovirus B
2.Simian mastadenovirus E
3.Torque teno canis virus
4.Spodoptera frugiperda ascovirus 1a
5.Perigonia lusca nucleopolyhedrovirus
6.Spodoptera littoralis nucleopolyhedrovirus
7.Adoxophyes orana granulovirus
8.Acidianus tailed spindle virus
9.Tea plant line pattern virus
10.Providence virus
11.Tea plant necrotic ring blotch virus
12.Rosellinia necatrix megabirnavirus 2-W8
13.Moumouvirus
14.Rhizoctonia solani dsRNA virus 2
15.Paramecium bursaria Chlorella virus A1
16.Aureococcus anophagefferens virus
17.African eggplant mosaic virus
18.Pepper severe mosaic virus
19.Seal parapoxvirus
20.BeAn 58058 virus
21.Solenopsis invicta virus 3
22.Thermus virus IN93
23.Pandoravirus macleodensis
24.Pandoravirus salinus
25.Tadarida brasiliensis polyomavirus 1
26.Xipapillomavirus 2
27.Parus major densovirus
28.Red-crowned crane parvovirus
29.Varroa mite associated genomovirus 1
30.Dickeya virus Limestone
31.Dickeya virus RC201
32.Pantoea virus Limelight
33.Citrobacter phage CR44b
34.Enterobacteria phage 285P
35.Synechococcus phage S-RIP1
36.Enterobacter virus EcL1
37.Shigella virus pSf1
38.Klebsiella virus PKP126
39.Bacillus virus Bc431
40.Staphylococcus virus MCE2014
41.Listeria virus LMTA148
42.Bacillus virus Mater
43.Mycobacterium virus Lukilu
44.Pandoravirus macleodensis
45.Pandoravirus salinus
46.Tadarida brasiliensis polyomavirus 2
47.Xipapillomavirus 3
48.Parus major densovirus
49.Red-crowned crane parvovirus
50.Varroa mite associated genomovirus 2
51.Dickeya virus Limestone
52.Dickeya virus RC2015
53.Pantoea virus Limelight
54.Citrobacter phage CR45b
55.Enterobacteria phage 286P
56.Synechococcus phage S-RIP2
57.Enterobacter virus EcL2
58.Shigella virus pSf2
59.Pandoravirus macleodensis
60.Pandoravirus salinus
61.Tadarida brasiliensis polyomavirus 2
62.Xipapillomavirus 3
63.Parus major densovirus
64.Red-crowned crane parvovirus
65.Varroa mite associated genomovirus 2
66.Dickeya virus Limestone
67.Dickeya virus RC2015
68.Pantoea virus Limelight
69.Citrobacter phage CR45b
70.Enterobacteria phage 286P
71.Synechococcus phage S-RIP2
72.Enterobacter virus EcL2
73.Shigella virus pSf2
74.Klebsiella virus PKP127
75.Bacillus virus Bc432
76.Staphylococcus virus MCE2015
77.Listeria virus LMTA149
78.Bacillus virus Mater
79.Mycobacterium virus Lukilu
80.Pandoravirus macleodensis
81.Pandoravirus salinus
82.Tadarida brasiliensis polyomavirus 2
83.Xipapillomavirus 3
84.Parus major densovirus
85.Red-crowned crane parvovirus
86.Varroa mite associated genomovirus 2
87.Dickeya virus Limestone
88.Dickeya virus RC2015
89.Pantoea virus Limelight
90.Citrobacter phage CR45b
91.Enterobacteria phage 286P
92.Synechococcus phage S-RIP2
93.Enterobacter virus EcL2
94.Shigella virus pSf2
95.Klebsiella virus PKP127
96.Bacillus virus Bc432
97.Staphylococcus virus MCE2015
98.Listeria virus LMTA149
99.Bacillus virus Mater
100.Mycobacterium virus Lukilu
101.Gordonia virus OneUp
102.Arthrobacter virus Tank
以下结合实施例对本发明作进一步的说明。
实施例:
本实施例的验证队列的构建过程包括:
(1)、样本粪便DNA的提取:
<1>、采集166受检者(80名结直肠癌患者和86名健康对照)的粪便,立即在-80℃冷冻,实验前置于冰上融合;
<2>、取0.18-0.22g粪便样本置于离心管中,加入1mL的Buffer SW,涡旋震荡5min后,12000rpm离心1min,弃上清;
<3>、加入600μL的Buffer SL、200μL溶菌酶,涡旋振荡1min(至样本充分均质化);
<4>、70℃水浴5min,接着80℃水浴10min,期间每隔5min涡旋振荡15s,之后平衡至室温;
<5>、12000rpm下离心3min,将上清移至装有玻璃珠的2.0mL的EP管中,接着放入组织细胞破碎仪中振荡5min,混匀后,再次振荡5min,静置15min;
<6>、将上清液转到新的2.0mL的EP管,加入600μL的Buffer GL,涡旋混匀,80℃水浴20min,期间每隔5min涡旋混匀15S;
<7>、待平衡至室温后(约10min),加入600μL无水乙醇,涡旋混匀;
<8>、将步骤7中液体转移至吸附柱,如果一次不能加完溶液,可分多次加入溶液,12000rpm离心1min;
<9>、向吸附柱中加入500μL的Buffer GW1(使用前检查是否加入了无水乙醇)12000rpm 离心1min;
<10>、重复步骤9;
<11>、向吸附柱中加入500μL的Buffer GW2(使用前检查是否已加入无水乙醇)12000rpm 离心1min;
<12>、空转,12000rpm离心2min,将吸附柱放入1.5mL锁扣EP管中,置于室温约5min,彻底晾干;
<13>、向吸附柱中间部位悬空滴加80μL的Buffer GE,室温放置5min,12000rpm离心 1min得到DNA。
(2)、测序和序列分析:
测序文库由Illumina的NEBNext Ultra DNA Library Prep Kit(NEB)生成,文库质量用安捷伦2100生物分析仪确认,并使用real-time PCR进行定量。在NovaSeq 6000(Illumina)上进行全基因组测序。所有样本都以150碱基对(bp)的读取长度配对末端测序,目标数据集大小为 12Gb。
另外,从序列阅读档案(Sequence Reads Archive,SRA)中下载了来自7个国家的8个人群的原始测序数据,主要来自发表的两篇CRC论文和日本队列。
其中,论文为:Thomas AM,Manghi P,Asnicar F,Pasolli E,Armanini F,ZolfoM,Beghini F, Manara S,Karcher N,Pozzi C,Gandini S,Serrano D,Tarallo S,Francavilla A,Gallo G,Trompetto M,Ferrero G,Mizutani S,Shiroma H,Shiba S,Shibata T,Yachida S,Yamada T,Wirbel J, Schrotz-King P,Ulrich CM,Brenner H,Arumugam M,Bork P,Zeller G,Cordero F,Dias-Neto E, Setubal JC,Tett A,PardiniB,Rescigno M,Waldron L,Naccarati A,Segata N.Metagenomic analysis ofcolorectal cancer datasets identifies cross-cohort microbial diagnosticsignatures and a link with choline degradation.Nat Med.2019Apr;25(4):667-678.doi:10.1038/s41591-019-0405-7. Epub 2019Apr 1.Erratum in:Nat Med.2019Dec;25(12):1948.PMID:30936548.
Wirbel J,Pyl PT,Kartal E,Zych K,Kashani A,Milanese A,Fleck JS,VoigtAY,Palleja A, Ponnudurai R,Sunagawa S,Coelho LP,Schrotz-King P,Vogtmann E,Habermann N,Niméus E, Thomas AM,Manghi P,Gandini S,Serrano D,Mizutani S,Shiroma H,Shiba S,Shibata T,Yachida S,Yamada T,Waldron L,Naccarati A,SegataN,Sinha R,Ulrich CM,Brenner H,Arumugam M, Bork P,Zeller G.Meta-analysis offecal metagenomes reveals global microbial signatures that are specific forcolorectal cancer.Nat Med.2019Apr;25(4):679-689.doi:10.1038/s41591-019-0406-6. Epub 2019Apr 1.PMID:30936547;PMCID:PMC7984229.
日本队列网址:https://www.ncbi.nlm.nih.gov/sra/?term=DRA006684
上述对实施例的描述是为了便于该技术领域的普通技术人员能理解和使用本发明。熟悉本领域技术人员显然可以容易的对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中,而不必经过创造性的劳动。因此,本发明不限于上述实施例。本领域技术人员根据本发明的原理,不脱离本发明的范畴所做出的改进和修改都应该在本发明的保护范围之内。
Claims (7)
1.一种结直肠癌的微生物标志物,其特征在于:其选自细菌、真菌、古菌和病毒中的一种及以上。
2.根据权利要求1所述的结直肠癌的微生物标志物,其特征在于:所述结直肠癌的微生物标志物为细菌和真菌的组合。
3.一种如权利要求1所述的微生物标志物在制备结直肠癌诊断试剂和/或结直肠癌诊断药物中的应用。
4.一种药物组合物,其特征在于:所述药物组合物包括权利要求1所述的微生物标志物。
5.一种诊断如权利要求1所述的微生物标志物的试剂盒,其特征在于:所述试剂盒包括权利要求1所述的微生物标志物。
6.一种预测结直肠癌的模型,其特征在于:其包括结直肠癌微生物标志物的丰度和微生物标志物间的相互作用。
7.根据权利要求6所述的模型,其特征在于:所述结直肠癌微生物标志物的丰度测定方法为宏基因组测序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110326152.0A CN114032278A (zh) | 2021-03-26 | 2021-03-26 | 结直肠癌的微生物标志物及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110326152.0A CN114032278A (zh) | 2021-03-26 | 2021-03-26 | 结直肠癌的微生物标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114032278A true CN114032278A (zh) | 2022-02-11 |
Family
ID=80139923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110326152.0A Pending CN114032278A (zh) | 2021-03-26 | 2021-03-26 | 结直肠癌的微生物标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114032278A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109852714A (zh) * | 2019-03-07 | 2019-06-07 | 南京世和基因生物技术有限公司 | 一种肠癌早期诊断和腺瘤诊断标志物及用途 |
CN110637097A (zh) * | 2017-03-17 | 2019-12-31 | 第二基因组股份有限公司 | 利用基于序列的排泄物微生物群落调查数据来鉴定结直肠癌的组合生物标志物 |
-
2021
- 2021-03-26 CN CN202110326152.0A patent/CN114032278A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110637097A (zh) * | 2017-03-17 | 2019-12-31 | 第二基因组股份有限公司 | 利用基于序列的排泄物微生物群落调查数据来鉴定结直肠癌的组合生物标志物 |
CN109852714A (zh) * | 2019-03-07 | 2019-06-07 | 南京世和基因生物技术有限公司 | 一种肠癌早期诊断和腺瘤诊断标志物及用途 |
Non-Patent Citations (1)
Title |
---|
OLABISI OLUWABUKOLA COKER等: "Enteric fungal microbiota dysbiosis and ecological alterations in colorectal cancer", GUT MICROBIOTA * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190367995A1 (en) | Biomarkers for colorectal cancer | |
WO2019233102A1 (zh) | 用于结直肠癌诊断、检测或筛查的引物和探针组 | |
WO2014019271A1 (en) | Biomarkers for diabetes and usages thereof | |
CN101298629B (zh) | Lrrc4基因启动子区甲基化检测在脑胶质瘤诊断中的应用及其检测系统 | |
CN107208141B (zh) | 用于结直肠癌相关疾病的生物标志物 | |
CN104988216B (zh) | 慢性心力衰竭相关的血清miRNA及其应用 | |
WO2016049932A1 (en) | Biomarkers for obesity related diseases | |
CN105861672A (zh) | 一种人体外周血游离DNA中septin9基因甲基化检测试剂盒及检测方法 | |
CN112609015A (zh) | 一种预测结直肠癌风险的微生物标志物及其应用 | |
WO2020248665A1 (zh) | 结直肠癌的相关预测系统、电子设备和存储介质 | |
CN112094907A (zh) | 外周血红细胞微核dna及其应用 | |
CN107557461B (zh) | 一种用于肝癌易感基因早筛的核酸质谱的检测方法 | |
CN104988141B (zh) | BRCA2基因g.32912799T>C突变及其在乳腺癌辅助诊断中的应用 | |
CN102534008A (zh) | 一种与非贲门癌辅助诊断相关的snp标志物及其应用 | |
CN115261465A (zh) | 包括外泌体miR-125a-5p、miR-3158-3p等在肺癌诊断中的应用 | |
WO2017156739A1 (zh) | 分离的核酸及应用 | |
CN105671179B (zh) | 血清microRNA在肝癌诊断中的应用及诊断试剂盒 | |
CN107557468B (zh) | 一种与原发性肺癌辅助诊断相关的癌-睾丸基因遗传标志物及其应用 | |
EP3250708B1 (en) | Biomarkers for colorectal cancer related diseases | |
CN114032278A (zh) | 结直肠癌的微生物标志物及其应用 | |
CN113025730B (zh) | 一种与肝硬化相关的肝内菌群标志物及其应用 | |
CN104946751B (zh) | BRCA1基因g.41244291delT突变及其在乳腺癌辅助诊断中的应用 | |
CN112375832B (zh) | 一种用于表征肺腺癌气阴两虚证的肠道菌群组合及筛选及模型建立方法 | |
CN109880903B (zh) | 一种用于非小细胞肺癌辅助诊断的snp标志物及其应用 | |
CN104962612B (zh) | BRCA1基因g.41256139delT移码突变及其在制备乳腺癌辅助诊断试剂盒中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |