JP7423101B2 - 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法 - Google Patents
細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法 Download PDFInfo
- Publication number
- JP7423101B2 JP7423101B2 JP2022526658A JP2022526658A JP7423101B2 JP 7423101 B2 JP7423101 B2 JP 7423101B2 JP 2022526658 A JP2022526658 A JP 2022526658A JP 2022526658 A JP2022526658 A JP 2022526658A JP 7423101 B2 JP7423101 B2 JP 7423101B2
- Authority
- JP
- Japan
- Prior art keywords
- cell
- cells
- cell population
- sequence
- cotus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 182
- 238000000034 method Methods 0.000 title claims description 136
- 238000012545 processing Methods 0.000 title description 13
- 238000012163 sequencing technique Methods 0.000 claims description 96
- 230000003321 amplification Effects 0.000 claims description 71
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 71
- 230000004544 DNA amplification Effects 0.000 claims description 35
- 244000005706 microflora Species 0.000 claims description 22
- 239000007864 aqueous solution Substances 0.000 claims description 19
- 239000011324 bead Substances 0.000 claims description 12
- 239000003153 chemical reaction reagent Substances 0.000 claims description 10
- 150000007523 nucleic acids Chemical class 0.000 claims description 10
- 108020004707 nucleic acids Proteins 0.000 claims description 9
- 102000039446 nucleic acids Human genes 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 7
- 239000006185 dispersion Substances 0.000 claims description 7
- 210000001035 gastrointestinal tract Anatomy 0.000 claims description 5
- 210000004027 cell Anatomy 0.000 description 576
- 239000013615 primer Substances 0.000 description 92
- 108020004465 16S ribosomal RNA Proteins 0.000 description 90
- 239000000523 sample Substances 0.000 description 80
- 238000009826 distribution Methods 0.000 description 75
- 244000005700 microbiome Species 0.000 description 65
- 239000000047 product Substances 0.000 description 59
- 241000894006 Bacteria Species 0.000 description 57
- 230000001580 bacterial effect Effects 0.000 description 57
- 108020004414 DNA Proteins 0.000 description 48
- 241000736262 Microbiota Species 0.000 description 34
- 238000005259 measurement Methods 0.000 description 32
- 241000699666 Mus <mouse, genus> Species 0.000 description 31
- 238000011304 droplet digital PCR Methods 0.000 description 31
- 238000005070 sampling Methods 0.000 description 27
- 239000000243 solution Substances 0.000 description 27
- 238000003752 polymerase chain reaction Methods 0.000 description 24
- 230000001413 cellular effect Effects 0.000 description 23
- 238000002474 experimental method Methods 0.000 description 23
- 238000004088 simulation Methods 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 19
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 230000002596 correlated effect Effects 0.000 description 17
- 239000003921 oil Substances 0.000 description 17
- 241000699670 Mus sp. Species 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 239000000203 mixture Substances 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 210000004534 cecum Anatomy 0.000 description 13
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 12
- 210000002429 large intestine Anatomy 0.000 description 12
- 239000002953 phosphate buffered saline Substances 0.000 description 12
- 238000007796 conventional method Methods 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 239000002773 nucleotide Substances 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 239000007787 solid Substances 0.000 description 11
- 241000894007 species Species 0.000 description 11
- 238000006467 substitution reaction Methods 0.000 description 11
- 238000003260 vortexing Methods 0.000 description 11
- 108091093088 Amplicon Proteins 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 238000000746 purification Methods 0.000 description 10
- 238000011002 quantification Methods 0.000 description 10
- 210000004556 brain Anatomy 0.000 description 9
- 238000001914 filtration Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 210000001072 colon Anatomy 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000000926 separation method Methods 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 7
- 239000011259 mixed solution Substances 0.000 description 7
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- 238000003491 array Methods 0.000 description 6
- 238000005119 centrifugation Methods 0.000 description 6
- 238000004925 denaturation Methods 0.000 description 6
- 230000036425 denaturation Effects 0.000 description 6
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000008346 aqueous phase Substances 0.000 description 5
- 210000003128 head Anatomy 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000007480 sanger sequencing Methods 0.000 description 5
- 238000009966 trimming Methods 0.000 description 5
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 241000566145 Otus Species 0.000 description 4
- 108010090804 Streptavidin Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 230000002902 bimodal effect Effects 0.000 description 4
- 238000011109 contamination Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000002523 gelfiltration Methods 0.000 description 4
- 230000003862 health status Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 4
- 239000011148 porous material Substances 0.000 description 4
- 101100476210 Caenorhabditis elegans rnt-1 gene Proteins 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 108700039887 Essential Genes Proteins 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 239000002738 chelating agent Substances 0.000 description 3
- 238000012864 cross contamination Methods 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004545 gene duplication Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000002705 metabolomic analysis Methods 0.000 description 3
- 230000001431 metabolomic effect Effects 0.000 description 3
- 238000000386 microscopy Methods 0.000 description 3
- 239000004005 microsphere Substances 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 210000003705 ribosome Anatomy 0.000 description 3
- 210000000813 small intestine Anatomy 0.000 description 3
- 210000002784 stomach Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- -1 1 μM dNTPs Substances 0.000 description 2
- 241000725101 Clea Species 0.000 description 2
- 241000193403 Clostridium Species 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 238000012313 Kruskal-Wallis test Methods 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 239000007984 Tris EDTA buffer Substances 0.000 description 2
- 210000000436 anus Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 210000003238 esophagus Anatomy 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 210000004209 hair Anatomy 0.000 description 2
- 230000013632 homeostatic process Effects 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000012074 organic phase Substances 0.000 description 2
- 239000002504 physiological saline solution Substances 0.000 description 2
- 229910052697 platinum Inorganic materials 0.000 description 2
- 239000002987 primer (paints) Substances 0.000 description 2
- 230000001850 reproductive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- 102100031126 6-phosphogluconolactonase Human genes 0.000 description 1
- 108010029731 6-phosphogluconolactonase Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108020000543 Adenylate kinase Proteins 0.000 description 1
- 102000002281 Adenylate kinase Human genes 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 101100163490 Alkalihalobacillus halodurans (strain ATCC BAA-125 / DSM 18197 / FERM 7344 / JCM 9153 / C-125) aroA1 gene Proteins 0.000 description 1
- 206010002091 Anaesthesia Diseases 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- 241000252983 Caecum Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241001466804 Carnivora Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010068051 Chimerism Diseases 0.000 description 1
- 108020001019 DNA Primers Proteins 0.000 description 1
- 239000003155 DNA primer Substances 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010000916 Fimbriae Proteins Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010018962 Glucosephosphate Dehydrogenase Proteins 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 108010053229 Lysyl endopeptidase Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 101100381816 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) bkdC gene Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 241000282576 Pan paniscus Species 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010022923 Peptidoglycan Glycosyltransferase Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 241000283089 Perissodactyla Species 0.000 description 1
- 102000009569 Phosphoglucomutase Human genes 0.000 description 1
- 241000425347 Phyla <beetle> Species 0.000 description 1
- 241001377010 Pila Species 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 241000282405 Pongo abelii Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 101710086015 RNA ligase Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 108050008280 Shikimate dehydrogenase Proteins 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241001493546 Suina Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 230000037005 anaesthesia Effects 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 101150040872 aroE gene Proteins 0.000 description 1
- 210000001815 ascending colon Anatomy 0.000 description 1
- UUQMNUMQCIQDMZ-UHFFFAOYSA-N betahistine Chemical compound CNCCC1=CC=CC=N1 UUQMNUMQCIQDMZ-UHFFFAOYSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 210000001731 descending colon Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- 239000012470 diluted sample Substances 0.000 description 1
- 230000002183 duodenal effect Effects 0.000 description 1
- 230000002900 effect on cell Effects 0.000 description 1
- 230000037149 energy metabolism Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000012632 fluorescent imaging Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 244000005709 gut microbiome Species 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000036571 hydration Effects 0.000 description 1
- 238000006703 hydration reaction Methods 0.000 description 1
- 210000003405 ileum Anatomy 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 210000001630 jejunum Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108010087904 neutravidin Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 101150086832 pdhC gene Proteins 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 238000002205 phenol-chloroform extraction Methods 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 108091000115 phosphomannomutase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000030592 phosphoserine aminotransferase Human genes 0.000 description 1
- 108010088694 phosphoserine aminotransferase Proteins 0.000 description 1
- 108020000161 polyphosphate kinase Proteins 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 108010017378 prolyl aminopeptidase Proteins 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 101150003830 serC gene Proteins 0.000 description 1
- DFEYYRMXOJXZRJ-UHFFFAOYSA-N sevoflurane Chemical compound FCOC(C(F)(F)F)C(F)(F)F DFEYYRMXOJXZRJ-UHFFFAOYSA-N 0.000 description 1
- 229960002078 sevoflurane Drugs 0.000 description 1
- 235000021391 short chain fatty acids Nutrition 0.000 description 1
- 150000004666 short chain fatty acids Chemical class 0.000 description 1
- 210000001599 sigmoid colon Anatomy 0.000 description 1
- 229920002545 silicone oil Polymers 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- CCEKAJIANROZEO-UHFFFAOYSA-N sulfluramid Chemical group CCNS(=O)(=O)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F CCEKAJIANROZEO-UHFFFAOYSA-N 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 210000003384 transverse colon Anatomy 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Description
[1]細胞集団の処理方法であって、
(A)単離された細胞集団を含む細胞の分散液から、液滴集団であって、水性の液滴を含み、前記液滴の少なくとも一部のそれぞれが、1つの細胞と1分子の細胞バーコードとを含む液滴集団を得ること
を含む、方法。
[2]細胞集団に含まれる遺伝子の塩基配列を分析する方法であって、
(A)単離された細胞集団を含む細胞の分散液から、液滴集団であって、水性の液滴を含み、前記液滴の少なくとも一部のそれぞれが、1つの細胞と1分子の細胞バーコードとを含む液滴集団を得ることと、
(B)得られたそれぞれの液滴中で、細胞バーコードの増幅産物と所定の遺伝子の増幅産物を得て、さらに、細胞バーコードと所定の遺伝子の全部または一部の塩基配列を含む連結物を得ることと、得られた連結物を液滴から水溶液中に回収して、得られた連結物をシークエンスして所定の遺伝子の塩基配列と細胞バーコードの塩基配列を決定することとを含む、方法。
[3]前記(B)において、細胞バーコードの増幅産物は、第一のプライマーに由来する第一の領域を有し、所定の遺伝子の増幅産物は、第二プライマーに由来する第二の領域を有し、第一の領域と第二の領域は、互いにハイブリダイズ可能な相補的な配列部分を有し、前記第一のプライマーおよび第二のプライマーはそれぞれ、1以上のタグ分子を連結しており、当該タグ分子は、前記連結物には含まれず、かつ、
前記(B)において、水溶液中に回収された連結物から、タグ分子を有する増幅産物を当該タグ分子に親和性を有する分子を担持したカラムまたはビーズを用いて除去することをさらに含む、上記[2]に記載の方法。
[4](C-1)決定された細胞バーコードの塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第一のクラスターを得ること
をさらに含む、上記[2]または[3]に記載の方法。
[5](D-1)得られた第一のクラスターの数から細胞集団に含まれる細胞の数または特定の所定の遺伝子を有する細胞の数を推定すること
をさらに含む、上記[4]に記載の方法。
[6](C-2)決定された所定の遺伝子の塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第二のクラスターを得ること
をさらに含む、上記[2]または[3]に記載の方法。
[7](D-2)得られた第二のクラスターの数から細胞集団に含まれる細胞の種類の数を推定することをさらに含む、上記[6]に記載の方法。
[8](C-3)決定された細胞バーコードの塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第一のクラスターを得ることと、決定された所定の遺伝子の塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第二のクラスターを得ること
をさらに含む、上記[2]または[3]に記載の方法。
[9](D-3)得られた細胞バーコードの塩基配列と所定の遺伝子の塩基配列の組合せの情報に基づいて、少なくとも1つのある第二のクラスターに分類された所定の遺伝子の塩基配列と連結している細胞バーコードの塩基配列から当該所定の遺伝子の塩基配列が分類された第一のクラスターを決定し、当該細胞バーコードが分類された第一のクラスターの数から、当該第二のクラスターに分類された細胞の数を推定すること
をさらに含む、上記[8]に記載の方法。
[10](C-4)同一の第一のクラスターに分類された配列が異なる第二のクラスターに分類される場合、当該第二のクラスターを同一の細胞ベースの操作上分類単位(cOTU)に分類することをさらに含む、上記[8]に記載の方法。
[11](E)第一の細胞集団と、第一の細胞集団とは異なる第二の細胞集団のそれぞれに関して、細胞集団に含まれる(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数を推定し、第一の細胞集団に関して推定された(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数を、第二の細胞集団に関して推定された(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数とそれぞれ比較することをさらに含む、上記[10]に記載の方法。
[12](F)第一の細胞集団に関して推定された(i)cOTUの数および(ii’)特定のcOTUに含まれる細胞の数と、第二の細胞集団に関して推定された(i)cOTUの数および(ii’)特定のcOTUに含まれる細胞の数を比較することを含む、上記[11]に記載の方法。
[13]細胞集団が、微生物叢である、上記[1]~[12]のいずれかに記載の方法。[14]微生物叢が、体内または体表の微生物叢である、上記[13]に記載の方法。
[15]微生物叢が、消化管内の微生物叢である、上記[13]に記載の方法。
[16]第一の細胞集団と第二の細胞集団が、同一対象の異なる部位から取得された微生物叢である、上記[11]または[12]に記載の方法。
[17]第一の細胞集団と第二の細胞集団が、異なる対象の同一の部位から取得された微生物叢である、上記[11]または[12]に記載の方法。
[18]第一の細胞集団と第二の細胞集団が、同一対象の同一の部位から異なる時間に取得された微生物叢である、上記[11]または[12]に記載の方法。
[19]細胞集団が、未知の細胞を含む、上記[1]~[18]のいずれかに記載の方法。
(A)単離された細胞集団を含む細胞の分散液から、液滴集団であって、水性の液滴を含み、前記液滴の少なくとも一部のそれぞれが、1つの細胞と1分子の細胞バーコードと
を含む液滴集団を得ること
を含む方法が提供される。
液滴集団であって、水性の液滴を含み、前記液滴の少なくとも一部のそれぞれが、1つの細胞と1分子の細胞バーコードとを含む液滴集団が提供される。この態様において、細胞は、単離された細胞集団(例えば、微生物叢)を構成していた細胞であり得る。
細胞集団に含まれる遺伝子配列を決定(または分析)する方法であって、
(A)単離された細胞集団を含む細胞の分散液から、液滴集団であって、水性の液滴を含み、前記液滴の少なくとも一部のそれぞれが、1つの細胞と1分子の細胞バーコードと
を含む液滴集団を得ることと、
(B)得られたそれぞれの液滴中で、細胞バーコードの増幅産物と所定の遺伝子の増幅産物を得て、さらに、細胞バーコードと所定の遺伝子の全部または一部の塩基配列を含む連結物を得ることと、得られた連結物をシークエンスして所定の遺伝子の塩基配列と細胞バーコードの塩基配列を決定することと
を含む、方法(以下、本発明の配列決定方法という)が提供される。
したがって、本発明の配列決定方法は、
前記(B)において、細胞バーコードの増幅産物は、第一のプライマーに由来する第一の領域を有し、所定の遺伝子の増幅産物は、第二プライマーに由来する第二の領域を有し、第一の領域と第二の領域は、互いにハイブリダイズ可能な相補的な配列部分を有し、前記第一のプライマーおよび第二のプライマーはそれぞれ、1以上のタグ分子を連結しており、当該タグ分子は、前記連結物には含まれず、かつ、
前記(B)において、水溶液中に回収された連結物から、タグ分子を有する増幅産物を当該タグ分子に親和性を有する分子を担持したカラムまたはビーズを用いて除去することをさらに含んでいてもよい。これにより、所望の連結物から、タグ分子を有する連結し損ねた増幅産物を分離することができる。
(C-1)細胞バーコードの塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第一のクラスターを得ること
をさらに含んでいてもよい。
(D-1)得られた第一のクラスターの数から細胞集団に含まれる細胞の数または特定の所定の遺伝子を有する細胞の数を推定すること
をさらに含んでいてもよい。
(C-2)決定された所定の遺伝子の塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第二のクラスターを得ること
をさらに含んでいてもよい。
(C-2α)あるクラスターにおいて、所定の遺伝子に関して相違する塩基配列が含まれている場合に、当該相違する塩基配列の1つの位置において、最も豊富な塩基を決定することと、二番目に豊富な塩基を決定することと、当該位置において、最も豊富な塩基を有する塩基配列の数(すなわち、リード数)に対する二番目に豊富な塩基を有する塩基配列の数(すなわち、リード数)の比(Ratio2nd)が所定の値以上である場合には、最も豊富な塩基を有する塩基配列と、二番目に豊富な塩基を有する塩基配列とを別のクラスターにクラスタリングすること
をさらに含み得る。これによって、同一クラスターに分類された塩基配列のうち、本来的に異なる遺伝子に由来するものを異なるものとして処理することができ、これにより、(c-2)の工程によって、異なる遺伝子が同一と評価される頻度を低減することができる。
(D-2)得られた第二のクラスターの数から細胞集団に含まれる細胞の種類の数(何種類の細胞が細胞集団に含まれるか)を推定すること
ができる。
(C-3)決定された細胞バーコードの塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第一のクラスターを得ることと、決定された所定の遺伝子の塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第二のクラスターを得ることと
をさらに含んでいてもよい。
(D-3)得られた細胞バーコードの塩基配列と所定の遺伝子の塩基配列の組合せの情報に基づいて、少なくとも1つのある第二のクラスターに分類された所定の遺伝子の塩基配列と連結している細胞バーコードの塩基配列から当該所定の遺伝子の塩基配列が分類された第一のクラスターを決定し、当該細胞バーコードが分類された第一のクラスターの数から、当該第二のクラスターに分類された細胞の数を推定すること
をさらに含んでいてもよい。
細胞ベースの操作上分類単位(cOTU)を作成することをさらに含んでいてもよい。細胞集団に含まれる微生物数及び種類が不明であることが多く、さらには、未知の微生物が存在する場合には、データベースに登録された既知の遺伝子配列情報からのみでは、細胞集団の遺伝子配列の分析は不十分となる。特に、所定の遺伝子の塩基配列ベースで操作上部類単位(OTU)を形成させると、所定の遺伝子についてある微生物種でn個の重複を有する場合には、当該微生物種の数が本来のn倍あるものとしてカウントされて誤差を生じることになる。また、2つの異なる微生物種において、一方は塩基配列AとBとを有し、他方はAとCとを有する場合に、塩基配列ベースで操作上部類単位(OTU)を形成させると、OTUは、AとBとCそれぞれに対応して3つ形成され、Aのカウントの分だけ細胞数に誤差を生じることになる。そこで、(C-4)では、遺伝子重複を有する細胞が細胞集団に含まれるときのカウントの上記誤差を低減するために、RepSeqの情報からcOTUを作成する。なお、cOTUは、理論的には、所定の遺伝子の塩基配列で分類できる微生物の分類単位であり、これまで上位の分類群でしか分類できなかった微生物をさらに詳細に分類する技術的手段である。これは、特に詳細な分類がなされていない微生物や未同定の微生物を含む細胞集団の分析において有用である。分類ができれば、これを元にして細胞集団間での相違を比較することができ、有利である。
(C-4)同一の第一のクラスターに分類された配列が異なる第二のクラスターに分類される場合、当該第二のクラスターを同一の細胞ベースの操作上分類単位(cOTU、すなわち同一の細胞分類)に分類すること
をさらに含んでいてもよい。
式:(Poission_Overlap)=(A×B×μ)/液滴総数は、
log10(Poission_Overlap)=log10{(A×B×μ)/液滴総数}
に変換することができる。さらに上記式は、
log10(Poission_Overlap)
=log10(A×B)-log10(液滴総数/μ)
変換することができる。ここで、AおよびBは実験的に測定でき、log10(液滴総数/μ)は実験毎に一定の定数とすることができる。従って、log10(液滴総数/μ)を定数ODとすると、上記式は、
log10(Poission_Overlap)=log10(A×B)-OD
に変換できる。これは、y=x-ODで直線近似することができる。AとBについて様々な整数を想定してlog10(Poission_Overlap)を算出することができる。現実のlog10(Overlap)の値が、計算されるlog10(Poission_Overlap)の信頼区間の外である場合、2つの塩基配列は1つの細胞内に含まれていたと推測することができる。また、log10(Poission_Overlap)の信頼区間の内部である場合、2つの塩基配列はそれぞれ異なる細胞に含まれていたと推測することができる。信頼区間としては、例えば、片側信頼区間(例えば、95%以上、98%以上、99%以上、または99.9%もしくはそれ以上の信頼区間とすることができる)を用いることができる。このようにして、統計学的にポワソン分布では説明ができない場合に、2つの塩基配列は1つの細胞内に含まれていたと推定することができる。あるいは、統計学的にポワソン分布で説明できるときには、2つの塩基配列は異なる細胞に存在したと推定することができる。
(E)第一の細胞集団と、第一の細胞集団とは異なる第二の細胞集団のそれぞれに関して、細胞集団に含まれる(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数を推定し、第一の細胞集団に関して推定された(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数を、第二の細胞集団に関して推定された(i)cOTUの数および/または(ii)特定のcOTU含まれる細胞の数と比較すること
をさらに含んでいてもよい。
(F)第一の細胞集団に関して推定された(i)cOTUの数および(ii’)特定のcOTUに含まれる細胞の数と、第二の細胞集団に関して推定された(i)cOTUの数および(ii’)特定のcOTUに含まれる細胞の数とを比較すること
をさらに含んでいてもよい。
(G)cOTU間の階層的クラスタリングを実施することをさらに含み得る。
階層クラスタリングは、例えば、cOTU間の相関の強度(例えば、スピアマンの相関係数r)に基づいて、当業者に周知の方法により行うことができる。階層クラスタリングは、また、rから算出されるcOTU間の距離に基づいて、当業者に周知の方法により行ってもよい。距離は例えば、1-最小(│r’│)[r’∈(r - OCI, r+OCI)]{ここで、OCIは各rの90%片側信頼区間を意味する}により算出され得る。階層的クラスタリングの結果は、系統樹として表示することができる。これは、例えば、Rのパッケージhclustまたはpheatmapにより行うことができる。また、ピアソンの相関係数rが閾値(例えば、0.5以上、または0.6以上など)以上となるcOTUのネットワークをパッケージigraphを用いて図示することができる。このようにして、複数の細胞集団におけるcOTUの関係性から、cOTU間の相関を図示することができる。
模擬細胞集団の準備
ヒト腸内細菌株(ATCC29098、ATCC700926、DSM14469、JCM1297、JCM5824、JCM5827、JCM9498、JCM10188、JCM14656、およびJCM17463)からなる模擬細胞集団を調製した9。これらの株の名称、供給源、培地および培養条件を表1に示す。培養菌を10%グリセロールで元の培地に保存するか、リン酸緩衝生理食塩水(PBS)中で、実験まで-80℃で保存した(表1)。JCM14656およびDSM14469は、培養後に遠心分離を用いてPBSによって1回洗浄された。JCM10188をGAM寒天(ニッスイ)上で培養し、細菌コロニーを収集し、3,200rpmで1分間ボルテックスすることによりPBSに懸濁した(VORTEX GENE 2、Scientific Industries)。
10株をPBSで希釈し、クラスIIのバイオセーフティキャビネット内で設定された濃度に従って混合した(表1)。希釈または混合の各工程に続いて、3,200rpmで1分間ボルテックスした。この混合10株の「模擬細胞集団」と呼ぶ。模擬細胞集団は実験まで-80℃で保存した。
*顕微鏡画像により測定された模擬細胞集団形成における添加濃度 (mean ± s.d., n=5, cells/μl)。
** “+”: グラム陽性; “-”: グラム陰性.
# -80℃で10%グリセロール下で培地中に保存された.
## -80℃でリン酸緩衝生理食塩水(PBS)中に保存された.
GAM、Gifu Anaerobic Medium (ニッスイ).
GAM Agar、Modified GAM Agar (ニッスイ)
LB、Luria-Bertani (Nacalai Tesque).
PYG、Peptone Yeast Glucose, DSMZ medium 104.
ATCC medium 1249、Modified Baar’s medium for sulfate reducers.
顕微鏡下蛍光イメージングにより各株の濃度を測定した。蛍光染色した細菌を、ポリスチレンミクロスフェア(Bacteria Counting Kit、Thermo Fisher Scientific)を用いて測定した。ヨウ化プロピジウム(Thermo Fisher Scientific)を用い、70℃で5分間加熱して細菌を染色した。体積は、細菌計数チャンバー(SLGC)を用いて測定したマイクロスフェアの濃度に基づいて計算した。各菌株について、5つの独立した測定を実施した;これらの5つの測定の平均濃度および標準偏差(誤差バーとして)を、模擬細胞集団における各菌株の濃度を計算するために使用した。
絶対濃度は、液滴デジタルPCR(ddPCR)によって測定された模擬細胞集団の総濃度(94,400細胞/μl)を用いて、シークエンスから決まった生のカウント値を正規化して得られた。
各株の16S rRNA遺伝子を、2×KAPA HiFi Hot start ready mix(Roche)およびプライマーF1-full-Fw/F3-full-Rv(表3)を用いて増幅した。次に、増幅した16S rRNA遺伝子をpCR-Blunt II-TOPOベクターにクローン化し、Zero Blunt TOPO PCR Cloning Kit (Thermo Fisher Scientific)を用いてE. coliで増幅した。次に、T7-プロモーターおよびSP6-プロモーターをプライマーとして、E. coliの単一コロニーからそれぞれ16S rRNA遺伝子を増幅した(表3)。最後に、各コロニーから増幅した16S rRNA遺伝子のV3-V4領域を、F2-Rvプライマー(表3)を用いてサンガーシークエンス(FASMAC)によりシークエンスした。
簡単に述べると、模擬細胞集団の細菌をPBSに懸濁し、細胞溶解のためにリゾチーム、アクロモペプチダーゼ、およびプロテイナーゼKに連続的に供した。次いで、フェノール-クロロホルム抽出によりDNAを回収した。Illumina adapter overhang nucleotide sequence(表3のCONV341FおよびCONV805R)を含む領域特異的プライマーを用いて、16S rRNA遺伝子のV3-V4領域を増幅した。増幅産物を、AMPure XP磁気ビーズ(Beckman Coulter)を用いて精製し、Nextera XT Index Kit v2(Illumina)を用いてインデックス化した。AMPure XPを用いた精製後、プールしたライブラリーをTapeStation(Agilent)およびKAPA Library Quantification Kit for Illumina (Kapa Biosystems)により定性および定量した。20%PhiX control v3(Illumina)をスパイクした変性ライブラリーを、MiSeqプラットフォーム(Illumina、2×300bp paired-end reads)でシークエンスした。配列データを質について確認し、Trimmomatic version 0.3847を用いてトリミングした。OTUはMothurバージョン1.35.148を用いて97%の同一性閾値でクラスター化した。各OTUで最も豊富に存在する配列は、OTUの代表的な配列として選択された(図1b)。
マウスの処置はすべて、理研の施設内動物実験委員会が承認したプロトコールに基づき、研究所の倫理指針に準拠して実施した。状態を維持しているマウスは以下のとおりであった。6週齢のC57BL6/J雄マウスをCLEA Japanから購入し、サンプリング前に同じケージにCE-2飼料(CLEA Japan)を給餌することにより理研施設で3日間維持した。
ネズミ盲腸は、セボフルラン麻酔下で頚椎脱臼後10分以内に手術により外に出した。異なる部位の盲腸内容物(図2a)を、滅菌済みはさみを用いてスライスすることによりサンプリングした。サンプリングプロセスは、クラスIIのバイオセーフティキャビネット内で手術後10分以内に行われた。各マウスの各部位のサンプルを、DNA Lobind Tube(Eppendorf)に採取した。対照では、2本の空試験管を用いた。サンプルの重量は、DNA Lobind Tube(全サンプルについて8.57~19.82mgの範囲)に採取した直後に測定した。次に、各試料を添加したPBS(1mg当たり50μl)に分散させ、3,200rpmで1分間ボルテックスすることにより混合した。懸濁試料は、その後の実験まで4℃で保存した。
マウス盲腸試料を、1mgの盲腸内容物当たり1mlのPBSに希釈し、その後、3,200rpmで1分間ボルテックスした。対照では、空のチューブにPBSを添加した。次いで、0.22μmの孔径のUltrafree-MC Centrifugal Filter(Merck)を用いて、希釈した試料400μlを遠心分離(10,000g、10分、4℃)により濾過した。メンブラン上に残った試料に400μlの新鮮なPBSを添加し、ピペッティングにより懸濁した後、全量を新しいDNA Lobind Tube中に写した。次いで、懸濁した試料を、3,200rpmで1分間ボルテックスした。懸濁試料およびフィルター通過液に含まれる細胞外DNAは、その後の測定まで4℃で保存した。なお、0.22μmのフィルターによるDNA分離の適切性は、0.1μmの孔径のフィルターを用いた場合と比較して、フィルター通過液中の細胞外DNAの量がほぼ一致し、フィルター通過液中に細胞が検出されなかったこと、フィロターろ過後のフィルター上から回収された細菌量が等しいこと、および、フィルターから回収された細菌量がデジタルPCRによる細菌数と相関することから確認された(図31参照)。
総濃度測定
細胞または細胞外16S rRNA遺伝子の総濃度は、プライマーF1-FwおよびF1-Rv(表3)を用いて、Droplet DigitalTM PCR(ddPCR)(Bio-Rad)により測定した。等モル混合した4つの細胞バーコードテンプレート(表3; 24個のランダム塩基を含有する各テンプレートは、我々の以前の文献25に従って設計され、ランダム塩基の数は、単一のMiSeqシークエンス作業において測定された個々の細胞を区別するのに十分であった)の濃度も、プライマーNoBiotin-Link-barcode-FおよびP5-index-R1P-barcode-R(表3)を用いたddPCRによって測定した。ddPCRは、QX200TM ddPCRTM EvaGreen(商標) Supermix(Bio-Rad)のユーザーマニュアルに従って実施した。
シークエンスライブラリーを作製するために、合計約240,000個の細胞(または細胞外の16S rRNA遺伝子の20,000コピー)を、等モル混合細胞バーコード、プライマー(400 nM P7-R2P-341F、400 nM P5-index-R1P-R、10 nM Biotin-link-805R、および10 nM Biotin-Link-F)、ddPCRTM Supermix for Probes (No dUTP)(Bio-Rad)、128ユニットのPlatinum Taq (Invitrogen)、および100 nM NTPを含む溶液960μLと混合した。3,200rpmで1分間ボルテックス後、混合溶液をBio-Rad droplet generatorにより液滴に封入し、30μlの混合溶液および80μlのDroplet Generation Oil for Probe (Bio-Rad)をDG8TMカートリッジ上の各チャネルにロードした(各試料について32チャネルを使用した)。模擬細胞集団測定のために、約600,000個の細胞を、細胞バーコードの約600,000コピー、320ユニットのPlatimum Taq、およびプライマー、dNTP、ddPCRTM Supermix for Probes (No dUTP)を含む2400μLの溶液と混合し;次いで、ボルテックス後、混合溶液を、試料あたり80チャンネルを使用して液滴に封入した。Miseqシークエンスのためのライブラリーを、液滴中におけるワンステップPCRによって生成した(95℃の5分間;94℃の45秒間および60℃の150秒間の6サイクル;94℃の25秒間および60℃の80秒間の49サイクル;98℃の10分間)。
液滴増幅技術により生成したライブラリーをクロロホルムを用いて回収し、80μlのTEバッファー(Invitrogen)および280μlのクロロホルム(Sigma)を、各DG8TMカートリッジ(8ウェル)から収集した液滴と混合し、その後10回ピペッティングし、水および有機相が分離されるまでボルテックスし;遠心後(21,900g、10分)、ライブラリーを含む水相の溶液を抽出した。次いで、AMPure XPを用いたビーズ精製および2%E-GelTM EX Agarose Gels (ThermoFisher Scienctific)を用いたゲル精製により、未連結バーコード増幅物、残存プライマー、回収溶液中の副産物などの非標的DNAを除去した。その後、ビオチン化された結合していない16S rRNA増幅物をストレプトアビジン磁気ビーズ(NEB)により除去し、結合していない16S rRNA増幅物をプライマーのBiotin-link-805R(図5)によりビオチン化した28。AMPure XP、ゲル、およびストレプトアビジンビーズを用いた精製工程は、それぞれ2回実施した。最後に、精製したライブラリーをDNA Clean and Concentrator Kit(Zymo Research)により濃縮した。ライブラリーの品質をAgilent 2100 Bioanalyzerにより確認し、プライマーP1_qPCR_FwおよびP2_qPCR_Rv(表3)を用いてqPCR(KAPA SYBR Fast qPCR kit, KAPA Biosystems)により濃度を測定した。AMPure XP、ゲル、およびストレプトアビジンビーズを使用する精製工程の詳細なプロトコールを、各製品のユーザー指示に従って実施した。
サンプルのライブラリーを、MiSeq platform (MiSeq Reagent Kit v3、600サイクル、Illumina)上で、Read 1については30サイクル、Index 1については295サイクル、Index 2については8サイクル、Read 2については295サイクルを割り当ててペアエンドのシークエンスをした(図5)。Illumina Index 1シークエンシングプライマーを、インデックスの代わりに16S rRNA配列を読み取るためにI1_primer(表3)と命名されたカスタムプライマーに置き換えた。シークエンスのための配列の不均一性を維持するために、別途作製したスパイクインコントロールを試料と共にシークエンスした(図18および19)。より具体的には、細菌、細胞外のDNA、または細胞バーコードの総濃度は、QX200TM ddPCR EvaGreenTM Supermix(Bio-Rad)の指示に従い、Droplet DigitalTM PCR(ddPCR)により測定した。細菌および細胞外DNA試料については、16S rRNA遺伝子のV1-V2領域を標的とするプライマー、F1-FwおよびF1-Rv、または16S rRNA遺伝子のV3-V4領域を標的とする341Fおよび805Rを用いた(表3)。細胞バーコードには、プライマーであるBiotin-Link-barcode-FおよびP5-index-R1P-barcode-R(index GTACTGAC含有)を用いた(表3)。QX200TM ddPCRTM EvaGreenTM Supermix、1μMプライマー、1μM dNTP、およびサンプル(多重希釈、1分間3,200rpmのボルテックス)を30μlの容量で混合し、混合のためにピペットで分注した。次に、Droplet Generation Oil for EvaGreen(Bio-Rad)、DG8TMカートリッジ(Bio-Rad)、およびDroplet Generator (Bio-Rad)を用いて、混合溶液を液滴に封入した。液滴PCRは、以下のステップにより実施した。初期変性には95℃が5分;変性には95℃45秒、アニーリングと伸長には60℃150秒の6サイクル;変性には95℃25秒とアニーリングと伸長には60℃80秒の39サイクル(F1-FwとF1-Rv)または95℃25秒とアニーリングと伸長には60℃80秒の34サイクル(プライマー341F/805R);シグナル安定化には4℃5分間および90℃5分間。その後、液滴の蛍光強度をQX200 Droplet Reader (Bio-Rad)により測定し、ソフトウェアQuantaSoft(Bio-Rad)による強度の二峰性分布の谷である閾値に基づいて陽性および陰性液滴数を決定した(図18a)。最後に、サンプルの濃度は、陽性および陰性液滴の比率およびサンプルの希釈率に基づいて算出した。
液滴生成のために、濃度250細胞/μlの細菌を使用した。この濃度は、1つの液滴の体積が約0.8nlであるので、約20%の液滴が細菌を含有することとなる。この条件下では、ポアソン分布に従い、細菌を含有する液滴の90%以上は1つの細菌のみを含み、他のものは2つ以上の細菌を含むこととなる。
理論的には、BarBIQは、シークエンスにより決定された各cOTUの比例濃度を総濃度を用いて正規化することによってcOTUの絶対濃度を測定し、異なる細胞バーコード濃度は各cOTUの比例濃度を変化させないことから、細胞バーコードの濃度はBarBIQにおける濃度測定に影響しない。しかしながら、より高濃度の細胞バーコードは、より多くのジャンクアンプリコンを生成し、これは16S rRNA配列の同定に影響するかもしれない。一方、低濃度の細胞バーコードは、細菌の検出効率を低下させるであろう。われわれは、BarBIQ測定のために100~250分子/μlの範囲の細胞バーコードを使用し、その結果、8~20%の液滴がバーコードを含むこととなった。細胞とバーコードの両方が含まれた液滴のみがシークエンスされるため、最終的に3%~11%がシークエンスされると予測された。
増幅物シークエンシング54においてPhixを用いてしばしば行われるように、シークエンシングにおける不均衡な塩基型を回避するために、設計されたスパイクインコントロールをライブラリーと混合し、同時にシークエンスした。スパイクインコントロールの作成の概略を図20に示す。最初に、174および176のランダム塩基を含む2つの一本鎖DNA(ssDNA)StdTarget1およびStdTarget2を、400nMの濃度で一晩、T4 RNAリガーゼ(NEB)により連結し、次いで65℃下で15分間、酵素の変性工程を行った。次に、StdTarget1および2の連結産物から別個の設計されたランダムバーコード(RandomBar_std1、RandomBar_std2、RandomBar_std3およびRandomBar_std4;図16および表3)を含む4種類の異なるプライマーを用いて、伸長によって4種類のランダムバーコードテンプレットを作成し、15分間の90℃から室温へのアニーリング工程の後、Klenowポリメラーゼ(NEB)を用いて伸長を行った。カラム精製後、4つの異なるインデックス化プライマー(RandomBar_std2についてはIndex_NSE501、RandomBar_std3についてはIndex_NSE502、RandomBar_std4についてはIndex_NSE505、RandomBar_std1についてはIndex_NSE506、図16および表3)および他の末端にcommon primer std_R2を用い、最後の工程によって作製した伸長したテンプレートから4種類のDNA産物を増幅した。約600塩基対を含む産物をゲル電気泳動で精製した。P1_qPCR_FwおよびP2_qPCR_Rvプライマーを用いてさらに2回PCRを行い、より多くの産物を増幅した;PCRの各ラウンドからの産物をゲル電気泳動により精製した。スパイクインコントロールは、プライマーP1_qPCR_FwおよびP2_qPCR_Rvを用いてqPCRにより測定した濃度に基づいて、これらの4種類の産物を等しい割合で混合することによって作製した。
Bar配列とcOTU(細胞型)を同定し、各cOTUを定量するシークエンスにより得られたデータを処理するためのパイプラインを開発した。パイプラインの主な戦略は図6に示し、各ステップの詳細はWO2018/235938Aおよび以下に記載される通りであった。原則として、MiSeqからのリードは、まず細胞バーコード(Read R1)25を用いてクラスター化した。次に、同じ細胞バーコードに連結された16S rRNA配列(Read I1およびR2)を、それらの配列同一性に基づいてさらにクラスター化した。各クラスター化16S rRNA配列グループに対する代表的な配列(RepSeq)を、各配列タイプに対するリード数とそれらのシークエンス品質の両方に基づいて生成した。各RepSeqのリード数とRepSeqの各配列型に対するRepSeqの数の両方に応じて、考えられる誤ったRepSeqを複数のステップでさらに除去した(WO2018/235938Aおよび図6参照)。独特のRepSeq配列型をBar配列と名付けた。次いで、Bar配列を、同じ液滴におけるそれらの共検出頻度に基づいてcOTUにクラスター化した。もし2つ以上のBar配列が同じ液滴で頻繁に検出されたならば、それらは同じ細菌由来の複数の16S rRNA遺伝子とみなし、それらを単一のcOTUにクラスター化した。次に、各cOTUに対する細胞数を、固有の細胞バーコードの数(すなわち、バーコードクラスター)によってカウントした。各cOTUの絶対細胞濃度は、ddPCRにより測定した試料の総濃度を用いて、cOTUのシークエンスで計数された細胞を標準化することによって決定した。さらに、サンプリングおよび/または測定中にコンタミしたcOTUを対照により同定した。
パイプラインの大部分はPerl(バージョン5.22.1)で書かれており、その他はソフトウェアで実施されていた。R(バージョン3.5.1)、ヌクレオチド配列クラスタライザー(バージョン0.0.7)25、bwa(バージョン0.7.15)49。本パイプラインで使用されているPerlのモジュールおよびRのパッケージは表4に列挙されている。
我々のシークエンスにおいて、R1(30塩基)は細胞バーコードであり、I1(295塩基)およびR2(塩基)は16S rRNA配列であり、I2(8塩基)は各試料をユニークに標識するインデックスであった。3回のシークエンス作業をすべて表4にまとめた。
細胞バーコード(R1)のリードは、当初の低品質リードの欠失を除き、以前の報告(WO2018/235938A)の通り、配列に基づいてクラスター化した。まず、広く実施されているように47、4つの連続した塩基からなる少なくとも1つのウインドウを含む低品質のR1リード(その平均スコアは15より小さい)を除外した。シークエンスラン1、2、および3のリードの割合はそれぞれ、0.23%、0.05%および0.06%であり、このプロセスによって除外された。次に、設計された細胞バーコードの最後の4つの固定塩基と一致するR1リードを次のステップのために選択した。サンプルとスパイクインコントロールの両方を含む同一シークエンスランに由来するすべての距離2のパラメータを有するR1リードを、ソフトウェア、ヌクレオチド配列-クラスタライザー25を用いてクラスター化した。異なるインデックスがなされたが、同じクラスターにクラスター化されたリードは除外された。得られたクラスターをBClusterと名付けた。各リードは、2つの16S rRNA配列(I1とR2)と細胞バーコード(R1)を有した(図6)。
この段階では、すべてのリードの末端を、リードの質およびそれらのプライマー部分に基づいて、一定の位置でトリミングした。MiSeqシークエンスにおけるリードの塩基の品質は、一般に、リードの末端において減少し、末端においてより多くのエラーを生じさせる50。データ処理の次の段階では、リードの長さは同じに保つ必要があるので、われわれは均一な閾値を適用し、1回のシークエンス作業ですべてのリードの末端をトリミングした。全リードの平均品質に基づいて、シークエンスランのトリミング位置を決定した;トリミング位置を選択する規則は、連続する2つの位置の平均品質の平均が25より低く(連続する2つの位置の平均品質の平均を使用して、シークエンスの品質の偶発的な変動を回避できる)始めたとき、リードの頭部から最初の位置を選ぶことであった。シークエンスラン1にはトリミング位置231(I1)と194(R2)、シークエンスラン2には294(I1)と267(R2)、シークエンスラン3には271(I1)と237(R2)を用いた。さらに、各リードのプライマー部分は、I1については21塩基、R2については17塩基である設計されたプライマーの長さに依存して直接トリミングされた。
この段階では、16S rRNA配列(I1およびR2)に基づいて各BCluster内のリードをクラスター化する2つのサブステップを実施した。
ステップ3.1において、ソフトウェアヌクレオチド配列クラスタライザーを用いて、リードI1およびR2をそれらの間の置換距離に基づいて距離3のパラメータでクラスター化し、同じMiSeq IDを有するリードI1およびR2を、物理的に連結することによって単一のリードとして考えた。
ステップ3.1は、エラーではなく真の16S rRNA配列であるかもしれない非常に類似した配列を統合したため、追加のクラスター化ステップが用いられた。ステップ3.1によって生成された各サブクラスターについて、リードは、リードの特定の位置に基づいて再びクラスター化された(すべてのリードは、第一の塩基によって整列された)。この過程の論理図を図20に示す。リード位置ごとに、塩基 (A、T、C、G) の種類を含むリード数をカウントし、1番目に豊富な塩基を含むリード数に対する、2番目に豊富な塩基を含むリード数の比(Ratio2ndと命名)を算出した。さらに、各リードのカウントは、この位置での塩基のシークエンスの品質スコアによって重み付けされた;規則は、スコアが15未満の場合は0として重み付けし、一方スコアが15以上である場合は、当該スコアを41で割ったスコアとして重み付けした。その後、全ての位置の中で最も高いRatio2ndを選択し、閾値0.75と比較した;Ratio2nd≧0.75の場合、2番目に豊富な塩基を含むリードは、新しいサブクラスターとして元のサブクラスターから分離された。その後、両方の新しい生成サブクラスターが同じ戦略によって再度クラスター化され、全てのサブクラスターの全ての位置のRatio2ndが0.75より低くなるまで繰り返しクラスタリングが実施された。最後のサブクラスターをSClusterと名付けた(図6)。液滴中の16S rRNA配列(同じ細菌からの複数の16S rRNA配列)の増幅効率はしばしば偏りがあった。したがって、この場合のRatio2ndは0.75未満かもしれないが、両方とも真の16S rRNA配列である。幸いなことに、同一の細菌由来のこれらの異なるタイプの配列(例えば、AおよびB)の増幅バイアスはランダムに起きた。例えば、時には配列Aがより多くのリードを有し、時として配列Bがより多くのリードを有したので、これら2つの配列型の両方が異なる液滴から同定されたかもしれず、増幅バイアスは、細胞計数に影響を及ぼさなかった。しかしながら、両方の配列型を検出した液滴の数は、より低い閾値を使用した場合と比較して閾値0.75を使用した場合に減少した。このことは、同じ細菌から2つの配列を同定するのに用いたステップに影響を与えるかもしれない(ステップ12参照)。他方、0.75より低い閾値を使用すると、誤った配列のみを含むサブクラスターを生成し得、次のプロセスに問題を生じる。従って、閾値0.75を用いて16S rRNA配列を同定したが、同じ細菌由来の両方の配列が同じ液滴で検出された場合には別の閾値0.1を用いて検出した。閾値0.1によって生成されたデータは同じ細菌由来の複数の16S rRNA配列を検出するためにのみ使用され、閾値0.75によっても同定された16S rRNA配列が使用された。なお、ステップ3では置換ミスを考慮したのみであるため、挿入ミスおよび欠失ミスはすべてSClusterとしてクラスター化したが、このパイプラインの副作用は次のステップで解決した。
各SClusterについて、リードI1およびR2の両方に対する代表的な配列(RepSeq)を、各塩基のシークエンス品質スコアおよび各タイプの塩基の割合の両方に基づいて生成した。各タイプの塩基の比率を計算するために、各タイプの塩基についてリード数を品質スコアで重み付けした。品質スコアが15未満の場合には0として重み付けし;スコアが15以上の場合には、41で除したスコアとして重み付けした。それぞれの位置について、1番目に豊富な塩基型を代表的な塩基として用いた(図6)。単一リードによるSCクラスターから生成されたRepSeqはエラーのリスクが高いため、この段階では単一リードによるRepSeqも除去した。各SClusterのリード数は、エラーを含む誤ったRepSeqと正しいRepSeqを区別する重要な情報として次の段階では使用された。
この段階で、ステップ2でプライマー部分として除外したリードの頭部(I1は21塩基、R2は17塩基)で生じた挿入または欠失(indels)に起因するエラー型のRepSeqを除去した。たとえば、BCluster xが16S rRNA配列のリードを含むと仮定し、そのうちのいくつかは頭部に2個の欠失をもつ場合、プライマー部分を切り取った後に2種類のリード(RepSeq iとj(リードには2個の欠失がある))が生じ、RepSeq jがiの左から右へ2塩基シフトしているはずである(図21)。このエラー型をシフトしたRepSeqと名付けた。
ステップ5の論理図を図21に示すが、戦略は以下の通りである。a)各BClusterで考えられるすべてのRepSeqs型ペアを見出し、1つのRepSeq型はもう1つのRepSeq型のシフト配列でり、そのシフトが8個未満であるRepSeq型のペアのみを選択した。b)シフトしたRepSeqタイプ(AおよびB)の各ペアについて、より多くのBClusterで同定されたRepSeqタイプを母親(mother)とし、他は可能な限りシフトと考えた。なぜなら、一般にエラーは正しいものより少ないからである。c)母親とシフトの各組について、母親のリードがシフトより多いBClusterの数(Nomother)およびその反対の事例(Noshift)をカウントした;母親とシフトの両方を含むBClusterのみを使用した;d)次に、エラーは正しいものより少ないので、NomotherがNoshiftより大きい時に、母親とシフトを保存した。e) 母親を伴うBClusterの中にこのシフトが存在する場合、このBClusterのシフトを削除し、母親にこのシフトのリード数(次のステップで母親に関するリード総数を使用した)を加え、母親を伴わないBClusterの中にシフトがある場合は、母親をシフトで置き換え(もし同一のシフトに関して2以上の母親が存在する場合には、より多くのBClusterで同定された母親を選ぶ)、シフトのリード数を置き換えられた母親に関するリード数として用いるという規則を用いて、d)において保存された母親とシフトのペアに基づいてシフトを除去した。I1およびR2RepSeqは独立して処理された。
このステップで、I1 RepSeqおよびR2 RepSeqは、それらの末端におけるそれらのオーバーラップした配列に基づいて連結された。V3-V4領域における16S rRNA遺伝子の長さの分布は、Silvaのデータベース(v123.1)に依存してほぼ(>99.9%)400bp~500bpの範囲であるため(図22)、I1とR2の両方のリードのための295塩基のシークエンスは、基本的に、I1とR2のリードの各対の末端の間で90以上の重複塩基を達成することができる。しかしながら、各リードの末端における低いシークエンス品質(ステップ2参照)のため、実施されたシークエンスランの最良の経験に基づいて、データ処理のために用いることができるのは、I1の約294塩基およびR2の約267塩基のみである。それでも、60以上の重複塩基を検出することができる。したがって、V3-V4領域における16S rRNA遺伝子の全長を得るために、I1 RepSeqとR2 RepSeqとの間の重複配列を見出し、それらを単一のRepSeqとして連結するステップを実施した。しかし、シークエンスの質が良くなかったため、シークエンスラン1ではI1では231塩基、R2では194塩基のみが用いられ、したがって、オーバーラップした配列は検出されず、I1とR2のRepSeqは連結されなかった。
一般に、I1とR2の両方のRepSeqの末端にある数個の塩基は、偶然に同じであり得る。従って、I1 RepSeqとR2 RepSeqの両方の末端における5個以上の同一塩基の閾値を、偽のオーバーラップを回避するために重なりとして使用したためと考えた。理論的には、偶発的な重複の可能性は(1/4)bであり、ここで、bは重複した塩基の数であり、5塩基の事故重複の可能性は(1/4)5≦0.00098である。
さらに、模擬細胞集団およびM0のデータでは、すべての偶発的な重複が<5塩基であった(短いリードが使用されたため、重複は見出せない)。
重複部分のI1 RepSeqとR2 RepSeq間の置換の違いが、リード末端部分の品質が相対的に低かったために、稀であっても起こるかもしれない。従って、これらのエラーを除去するためにもう一つのプロセスを適用した。この戦略は、a)上述の連結プロセスの後、連結していないRepSeqを発見した。b)次に、同一のBCluster内の他のRepSeq(それぞれI1およびR2 RepSeqを直接比較)で各RepSeqを比較し、その1つの塩基が異なるRepSeqを見つけた。c) 1塩基相違のRepSeqを連結した場合、連結されていないRepSeqを削除し、連結されたRepSeqにそのリードを追加した。
このステップでは、リードの主要部分における{リードの頭部(すなわち、プライマー部分、ステップ5参照)においてではない}1つの挿入または欠失(1-indel)エラーに起因して生じたエラータイプのRepSeqを除去した。ステップ3におけるクラスタリングは上述した置換のみに基づいていたため、インデルを含む誤ったリードをすべて分離し、個々のRepSeqを作成した。一般に、シークエンスのリードの中ごろに起こるインデルは非常にまれであるので(Schirmer M et al., BMC Bioinformatics 2016; 17:125)この段階では1-indelだけでなく、ステップ9で置換を伴う2塩基インデルと1-indelだけを考えた(後述)。
ステップ7の論理図を図23に示す。戦略は以下の通りである。a)各BClusterにおいて、1-indelの差異を持つRepSeqタイプの可能なペアをすべて見出した。b) エラーは一般に正しいものより少ないので、RepSeqタイプ(AおよびB)の各1-indel対について、より多くのBClusterで同定されるRepSeqタイプを母親とし、および他のものは1-indelであると考えた。c)母親と1-indelの各ペアについて、母親のリードが1-indel(Nomother)より多いBCluster数と、その反対の事例(No1-indel)を計数した;母親と1-indelの両方を含むBClusterのみを使用した。d)われわれは、NomotherがNo1-indelより大きいときにその母親と1-indelのペアだけを残した。なぜなら、エラーのリードは一般に正しいものより少ないからである。e)可能性のある1-indel及びその可能性のある母親を含むBClusterの数と可能な1-indelを含む全てのBClusterの数(No1-indel)との比(Rs)を計算し、条件付き文言Rs≦(No1-indel-3)/ No1-indelが真である場合、可能な母親と1-indelのペアを選択した。f)選択された母親と1-indelのペアに基づき、母親とBClusterの中に1-indelが存在する場合は、このBClusterでは1-indelを削除し、母親に1-indelのリード数を加え(次のステップでは、母親としてリード総数を用いる)、もし、母親を伴わないBClusterに1-indelが存在する場合には、1-indelのリード数を母親に置き換え(同じ1-indelに対して母親が2以上ある場合は、より多くのBClusterにおいて同定された母親を選択する)、1-indelのリード数を置き換えられた母親に関するリード数として用いる。
この段階で、キメラ増幅により生じたエラー型のRepSeqキメラを除去した。キメラは常にPCR中に起こり、産物をより複雑にする。特に16S rRNA増幅物の測定ではRepSeqキメラは非常によく起こる27。
キメラを除去する論理図は図24に示し、その戦略は以下の通りであった。a)各BClusterにおいて、RepSeqタイプ(A、B、C)のすべての可能な順序のキメラをチェックした;Aの頭部がBの頭部部分と同じであり、Aの他の部分(Bを伴う)がCの末端部分と同一であり、かつ、Aのリード数が3つ中最大では無い場合、Aはキメラと考えられ、BとCはこのキメラの親であると考えられた。b)同定されたキメラそれぞれについて、キメラを含むBClusterの数(Total_No)およびキメラのみを含むが親は含まないBClusterの数(No_d)を計数した。c)条件付き文言Ratio_d(= N_d/Total_No)≦0.1、かつ、Ratio_d≦1/Total_Noが真のとき、RepSeqsからキメラ候補を除外した。
BarBIQはキメラを1~5%しか持たず、これは従来の方法によるもの(~70%)27よりはるかに低く、この工程によりキメラを除去することができたことがわかる。BarBIQでキメラがほとんど生成されなかった理由は、バーコードおよびシークエンスアダプターが、分離された空間(すなわち、液滴)におけるワンステップ増幅によって、単一の細菌由来の16S rRNA遺伝子に付着したことであり、これは、異なる細菌由来の16S rRNA増幅物が混合されなかったことを意味する。このアプローチは、液滴およびバーコードを用いたハイスループット16S rRNA遺伝子シークエンスに関する最近の研究(Borgstrom E et al., Nat Commun 2015; 6: 7173およびSheth RU et al., Nat Biotechnol 2019; 37(8): 877-883)でさえ実施されていない。
このステップでは、1インデルおよび1置換エラー(CaseAと命名)、1インデルおよび2置換(CaseBと命名)、ならびに2インデル(CaseCと命名)を有するRepSeqのような高レベルのエラーは除去された。すでに述べたように、インデルのエラーのみが、ステップ3における我々のクラスタリング方法によって生じ得るので、ここで考察する高レベルのエラーは、インデルを含む。一方、もっと複雑なエラーはきわめてまれに起こり、ステップ10で取り除かれる。
ステップ9の論理図を図25に示し、戦略は以下の通りである。a)上記相違(Case A、B、C)の何れかを有する各BClusterのRepSeqタイプの可能なペアをすべて同定し、b)各同定ペアのRepSeqのリード数を比較した。RepSeq(小型/大型)間のリード数の比が閾値0.2よりも低ければ、リード数の少ないRepSeqを除外し、リード数を他のペアに追加した。
大半のエラーが上記のステップで除去された後も、未知のRepSeq(San配列とは異なる)は依然として模擬細胞集団のデータに残っていた。しかし、いずれも少数であった。そこで、残ったRepSeqsの種類ごとにBCluster数をカウントした。低カウントを原因とするばらつきが大きかったため、RepSeqタイプごとにサンプリングの反復(異なるサンプリングによる同一サンプルのシークエンス)に基づく平均カウントを用いた。各反復について、各RepSeqタイプのカウントついては、すべての反復の中で最高の総カウントに対するすべてのRepSeqタイプの総カウントによって正規化した。次いで、各RepSeqタイプの平均カウントを、全ての反復実験から計算した。模擬細胞集団に対して3回のサンプリングを行い、3回の反復実験から平均カウントを得た。最後に、平均カウントが2未満の場合、RepSeqタイプを除外した。
このステップの後、模擬細胞集団のデータについては、San配列が一致するRepSeqsタイプを除き、残ったRepSeqタイプはすべて、PCRによる1塩基エラー(ステップ11参照)またはコンタミネーション(ステップ14参照)として合理的に説明することができる。
1反復のみまたは2反復を用いても試験し、閾値<6(1反復)または閾値<3(2反復)が模擬細胞集団データに対して機能することを見出した。しかし、無作為性のため、1回と2回のサンプリングは、3回のサンプリングよりもリスクが高い可能性があるため、1回と2回のサンプリングを盲腸サンプルに用いた場合の閾値としてそれぞれ<10と<5を使用することとした。
この段階で、PCRによって生じたと思われるRepSeqタイプの一塩基エラーを除去した。このRepSeqの特徴を明らかにするため、まず、各San配列と1塩基またはゼロ塩基の差異を有する残存するRepSeqタイプをグループに分類した(この分析に関しては、低カウントRepSeqタイプを維持した、ステップ10を参照)。次に、各グループにおける全RepSeqタイプの平均カウントの分布(図26a)をプロットし、同一グループ内のSan-配列一致型RepSeqタイプの平均カウントに対する1塩基の異なるRepSeqタイプの最高平均カウントの比(最高比率)を算出した(図26b)。我々は、2つのカテゴリー(図26bのカテゴリー1と2):カテゴリー1はSan-配列一致型 RepSeq typeが1,000カウント以上のグループ、カテゴリー2はSan-配列一致型 RepSeq typeが1,000カウント未満のグループを見出した。カテゴリー1に関して、1塩基の異なるRepSeqタイプの最高平均数は2より大きく、それらの最高比率は異なるグループ間で一貫していた。これらの1塩基の異なるRepSeq型は、おそらくPCRによって生じた誤りであると結論づけた。それは、実際の16S rRNA配列に対する他の実際の16S rRNA配列の数の比は通常、16S rRNA配列の各タイプで異なるからである。そこで、San-配列一致型 RepSeqタイプのカウントに対する1塩基の異なるRepSeq型のカウントの比が1/400未満であるという閾値を用いて、これらのRepSeq型を除去するプロセスを適用した(図26b)。1反復のみが実施された場合は、データに対して1/100の閾値を使用した。カテゴリー2では、1塩基の異なるRepSeqタイプの最高平均カウントは異なるグループ間で類似しており、<2であったが、これはこれらの16S rRNA配列の低濃度に起因する可能性があり、エラーはランダムに発生し、全てのエラー配列は一致しなかった。RepSeqsの低カウントのリスクが高いため、ステップ10でRepSeqを除外した。模擬細胞集団データにおいて、1塩基の差のみを示す2つのRepSeqタイプのカウント数の間の比が1/50以上であれば、両方のRepSeqタイプがSan配列と一致することを確認した。しかし、この比率が1/400~1/50の範囲にある例は見つからなかった。さらに、我々の模擬細胞集団のデータでは、1つの奇妙なRepSeqタイプが検出された。この配列を確認することにより、それはサン配列JCM5824-AおよびJCM5824-Bの中央に一致するが、JCM5824-A/BのV3-V4領域の全長よりもはるかに短いことを見出した。JCM5824-A/Bの中央の6merは、16S rRNA遺伝子を増幅するために使用したフォワードプライマーの3’末端と同じであり、この奇妙な配列は同一液滴中のJCM5824-Aおよび/またはJCM5824-Bの全長V3-V4領域と常に同時検出され、そのカウントは常に非常に稀であった(3回の反復において2/4/1)ことから、この奇妙なRepSeq型は、JCM5824からの16S rRNA遺伝子の非特異的増幅産物であると解釈した。しかし、この種の短い増幅産物は盲腸検体では見つからなかったため、我々の最終パイプラインにはこれらの短い増幅産物を検出するためのいかなるステップも含めなかった。上記の全ステップ後、残ったRepSeqタイプ(固有RepSeqs)をBarBIQ同定配列(Bar配列)と名付け、各々ID番号でラベルした。
BarBIQの大きな利点を生かし、この段階での細胞バーコードに基づいて、同じ細菌から複数の16S rRNA配列を同定した。
Poission_Overlap=(A×B×μ)/液滴総数
{ここで、液滴総数は、細胞バーコードを含む液滴の総数であり;μは、定数であり、PCR増幅効率、シークエンス深度効果などを含み得る液滴における検出効率のための統合パラメータである}。他方、もしBar配列が同一細菌由来であれば、両方のBar配列が検出される液滴の数はポアソン分布に従わないであろう。
log10 (Poission_Overlap)= log10 (A×B) - log10 (液滴総数/μ)
同一のBClusterで検出されたRepSeqは、同一のcOTUに属する場合、単一細胞とみなした。次いで、各cOTUの細胞数を、細胞バーコード(BClusterの数)に基づいて計数した。ステップ3.2でパラメータ0.75で処理したデータを細胞数の計数に用いた。
この段階で、コントロールに基づいて異物混入したcOTUを除去した。異物混入したcOTUを同定するために、模擬細胞集団の対照サンプルM0またはマウスMa、MbおよびMcの盲腸サンプルの空試験管対照を用いて、同様の時間(数日間)内に同じ条件下で測定した。
各cOTUの絶対細胞濃度は、液滴デジタルPCRによって測定した総濃度を用いて、ステップ13で得られたカウントを正規化することによって算出した。
3種類の公的データベース、GreenGene(リリース13_5)10、Ribosomal Database Project(リリース11.5)11、およびSilva(リリース131.1)12において同定されたBar配列と最も近い(すなわち、最も高い同一性)16S rRNA遺伝子の間の配列同一性は、NCBI blast(バージョン2.7.1)51を用いて算出した。
同定されたcOTUの門から属への分類を、ブートストラップカットオフ50%36を用いたRDP分類によるそれらのBar配列に基づいて予測した。RDP分類は16S rRNAトレーニングセット11(https://rdp.cme.msu.edu/classifier/classifier.jsp)によりトレーニングされた。複数のBar配列を含むcOTUに対して、最も高いスコアを有する予測分類群を選択した。
Rパッケージveganのvegdist関数を用いて、細胞濃度に基づく各ペアのサンプル間のbray-Curtisの非類似度を算出した。以降の分析は、R(バージョン3.5.1)およびJupyterLab(バージョン0.34.9)を用いて実施した。
BarBIQで測定した試料Madistの技術反復中のcOTUのノイズは,Poisson分布から得た模擬ノイズとcOTU技術ノイズを比較することにより、主としてサンプリングノイズから確認した。技術反復における異なる検出総細胞数からのバイアスを排除するために、Rパッケージveganにおける機能希薄化を用いたサブサンプリングにより、各反復の細胞数を、反復中の最小総細胞数に対して標準化した。cOTUのノイズは、CV2によって定量され、ここで、CVは、3回の技術反復におけるcOTUの正規化細胞数に基づいて計算された係数の変動を示す52,53。各cOTUについてのシミュレートされたPoissonノイズを、試料中の与えられたcOTUの平均細胞数であるPoisson分布からランダムに生成された3つの数字(3つの技術反復を模倣するため)に基づいて計算し、2つのシミュレーション(1および2)を行った。次に、各cOTUについてCV2の理論平均補正後残差を算出した52,53。
Rmc =log10 (CV2)-log10 (CVPoisson 2);
ここで、CVPoissonは、ポアソン分布に基づく所定のcOTUに対する理論的CVである。試料Madistの全Rmcの分布はシミュレーションの分布と一致しており、BarBIQ測定の技術的ノイズは主としてサンプリングによるものであることが示唆された(図7c,d)。
各cOTUについて、シミュレーションにより、3匹のマウス(Madist1、Mbdist、McdistまたはMaprox1、Mbprox、Mcprox)の遠位または近位位置における細胞濃度のCVの95%信頼区間を推定した。シミュレーションプロセスを1,000回繰り返し、各時間について、所与のcOTUについて3つのシミュレートされた細胞濃度からCVを得た。各シミュレートされた濃度は、Poisson分布から生成されたランダム数により得られ、その平均は、試料中の所与のcOTUのシークエンス決定細胞数(すなわち、Madist1、Mbdist、McdistまたはMaprox1、Mbprox、Mcproxの1つ)であり、その後、この試料の推定総濃度を用いて正規化した。この推定総濃度は、その平均がこのサンプルの測定叢濃度であり、その標準偏差が平均の10.1%である正規分布からランダムに生成した(10.1%は、反復フィルタリングに関する5つの独立した実験の中で、平均によって標準化された最大標準偏差(10.1%)であった(図18))。各CVの95%信頼区間は、1,000回のシミュレーションCVの分布から得た。
階層的クラスタリングを、統計パッケージ中の機能hclustにより実施した(パッケージpheatmapを用いてヒートマップを描いた)。クラスタリングに用いられる距離は、1-最小(│r’│)[r’∈(r - OCI, r+OCI)]と定義され、ここで、OCIは各rの90%片側信頼区間を意味する。階層的クラスタリングの系統樹を完全連結法により得た。具体的には、含まれるすべてのcOTU間のピアソンの相関係数rを求めた。その後、ある微生物と他の微生物の距離を上記式に基づいて決定し、距離に基づいてcOTUをクラスタリングした。クラスタリング後の枝内の可能なcOTUペアの距離は枝の高さより低かった。各rのOCIは、シミュレーションにより得た。シミュレーションプロセスを1,000回繰り返し、各時間について、各cOTUの細胞濃度を、試料Madist1、Maprox1、Mbdist、Mbprox、McdistおよびMcprox(このプロセスは、上記のCV信頼区間のシミュレーションと同じである)についてランダムに生成し、各cOTU対についてピアソンのrを計算した。その後、OCIは、1,000回のシミュレーションされたシミュレータの分布から得られた。
1)異なる種はゲノム上に16S rRNA遺伝子の異なるコピー数を有し、大部分の種のコピー数は不明であるため、細胞数を測定し、異なる種の細胞数を比較するのは困難である;
2)16S rRNA配列の同定は、シークエンスおよび増幅エラーのために正確ではなく、低分類学的分解能をもたらす。
実際、シークエンスエラーは、分子バーコード24-26を用いて修正されたが、主に配列増幅時に生じるキメラ生成に由来する増幅エラーは、未だ十分に除去できていない27。
次に、各部位のcOTUに対する変動係数(CV、3匹の細胞濃度の標準偏差をそれらの平均値で除したCV)を算出することにより、3匹のマウスにおける細胞濃度の一貫性を定量した(図3a)。著者らは、各cOTUについて遠位と近位の位置の間のCVを比較し(図9aおよび9b)、大部分のcOTUのCVは、シミュレートされた信頼区間に基づいて異ならないことを見出した。興味深いことに、同一属のcOTUsの一貫性(すなわちCV)は、しばしば異なっていた(図9aおよび9b)(公的データベースからの情報が限られているため、分類はRDP分類36を用いて各cOTUのBar-sequenceにより予測されたことに注目)。例えば、Clostridium XIVa属のcOTUのCVは、両方の場所で0.05~1.70の範囲で変化した(図3b)。興味深いことに、この属のある種は、盲腸31の主要な機能であるブチレート37のような短鎖脂肪酸を生成することが報告されている。この知見は、細菌の生理学的役割の更なる理解のためには、属レベルより細かいレベルの細胞の定量、特に、cOTUレベルの細胞の定量が必要であることを示唆した37,38。
実験1. 大腸試料の細分化
大腸を細分化し、かつ細分化されたそれぞれの断片の位置情報を識別可能な状態で分析することを試みた。具体的には、マウスを屠殺した直後に大腸全体を摘出して直線状になるように広げ、それぞれの大腸固形内容物の位置関係を撮影記録した。一つの大腸固形内容物を腸壁に包まれた状態のまま滅菌済みハサミと滅菌済みピンセットを用いて取り出し、ブレインスライサ(室町機械、MK-RC-01)の穴の中央に盲腸側を左側にして置いた(図39のパネルa)。このとき、盲腸側(A)と肛門側(E)が識別できるように、ブレインスライサに予め印をつけた。
細菌細胞を含む、または含まない条件において、等モル混合した4つの細胞バーコードテンプレート(以下、等モル混合細胞バーコード)の濃度を、ddPCRを用いて測定した。具体的には、まず、QX200TM ddPCRTM EvaGreen Supermix(BioRad、#1864034)、1μMプライマー(NoBiotin-Link-barcode-FおよびP5-index-R1P-barcode-R)、0.1μM dNTP(New England BioLabs、N0447)、Platinum Taq DNA Polymerase(Thermo Fisher Scientific、10966034)、およびサンプル(等モル混合細胞バーコードとマウス盲腸より採取した細菌細胞、あるいは等モル混合細胞バーコードのみ)を30μlの容量で混合し、DG8カートリッジ(BioRad、#1864008)に分注した。次に、Droplet Generation Oil for EvaGreen(BioRad、#1864006)およびDroplet Generator(BioRad、#1864002JA)を用いて混合溶液を液滴に封入した。
第一ステージ;95℃5分
第二ステージ;95℃45秒と60℃150秒の繰り返しを6サイクル
第三ステージ;95℃25秒と60℃80秒の繰り返しを39サイクル
第四ステージ;4℃5分と90℃5分
その後、QX200 Droplet Reader (BioRad、#1864003JA)によりバーコードの濃度を測定した。
BarBIQ法のシークエンスライブラリー作製のためのPCRサイクル数が、液滴に含まれる細菌細胞の16S rRNA配列を増幅させるのに十分であることを確かめた。具体的には、まず、QX200TM ddPCRTM EvaGreen Supermix、1μMプライマー(F1-FwおよびF1-Rv)、0.1μM dNTP、およびサンプル(マウス盲腸より採取した細菌細胞)を30μlの容量で混合し、DG8カートリッジに分注した。
次に、Droplet Generation Oil for EvaGreenおよび Droplet Generatorを用いて、混合溶液を液滴に封入した。ddPCRは、第三ステージを除き、上記実験2.と同様のサイクル条件で実施した。第三ステージは、サイクル数を0、10、20、30、39、あるいは49に変えた。その後、液滴の蛍光強度をQX200 Droplet Readerにより測定し、ソフトウェア QuantaSoft(BioRad、#1864011JA)による強度の二峰性分布の谷である閾値に基づいて陽性および陰性液滴を決定した。
BarBIQ法のシークエンスライブラリー作製のための初期変性の時間が、液滴に含まれる細菌細胞の16S rRNA配列を増幅させるのに十分であることを確かめた。具体的には、まず、QX200TM ddPCRTM EvaGreen Supermix、1μMプライマー (F1-FwおよびF1-Rv)、0.1μM dNTP、およびサンプル(マウス盲腸より採取した細菌細胞)を30μlの容量で混合し、DG8カートリッジに分注した。次に、Droplet Generation Oil for EvaGreenおよびDroplet Generator を用いて、混合溶液を液滴に封入した。ddPCRは、第一ステージを除き、上記実験2.と同様のサイクル条件で実施した。第一ステージは、時間を0、5、あるいは10分間に変えた。その後、液滴の蛍光強度をQX200 Droplet Readerにより測定し、ソフトウェア QuantaSoftによる強度の二峰性分布の谷である閾値に基づいて陽性および陰性液滴を決定した。
Claims (16)
- 細胞集団に含まれる所定の遺伝子の塩基配列を分析するための方法であって、
(A)単離された細胞集団と固有のバーコード配列をそれぞれ有する細胞バーコードと核酸増幅用のプライマーおよび遺伝子増幅用試薬を含む細胞の分散液から、液滴集団であって、水性の液滴を含み、前記液滴の少なくとも一部のそれぞれが、1つの細胞と1分子の細胞バーコードとを含む液滴集団を得ることと、ここで、前記液滴集団は、細胞バーコードの増幅産物と前記細胞集団の細胞内の所定の遺伝子それぞれの増幅産物を得るために必要な核酸増幅用のプライマーおよび遺伝子増幅用試薬を含み、
(B)得られたそれぞれの液滴中で、細胞バーコードの増幅産物と所定の遺伝子それぞれの増幅産物を得て、さらに、細胞バーコードと所定の遺伝子の全部または一部の塩基配列を含む連結物を得ることと、得られた連結物を液滴から水溶液中に回収して、得られた連結物をシークエンスして所定の遺伝子の塩基配列と細胞バーコードの塩基配列を決定することと、
(C-1)決定された細胞バーコードの塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第一のクラスターを得ることと、
を含む、
方法。 - 前記(B)において、細胞バーコードの増幅産物は、第一のプライマーに由来する第一の領域を有し、所定の遺伝子の増幅産物は、第二プライマーに由来する第二の領域を有し、第一の領域と第二の領域は、互いにハイブリダイズ可能な相補的な配列部分を有し、前記第一のプライマーおよび第二のプライマーはそれぞれ、1以上のタグ分子を連結しており、当該タグ分子は、前記連結物には含まれず、かつ、
前記(B)において、水溶液中に回収された連結物から、タグ分子を有する増幅産物を当該タグ分子に親和性を有する分子を担持したカラムまたはビーズを用いて除去することをさらに含む、請求項1に記載の方法。 - (D-1)得られた第一のクラスターの数から細胞集団に含まれる細胞の数または特定の所定の遺伝子を有する細胞の数を推定すること
をさらに含む、請求項1または2に記載の方法。 - (C-2)決定された所定の遺伝子の塩基配列に基づいて、決定された塩基配列をクラスタリングして、複数の第二のクラスターを得ること
をさらに含む、請求項1~3のいずれか一項に記載の方法。 - (D-2)得られた第二のクラスターの数から細胞集団に含まれる細胞の種類の数を推定することをさらに含む、請求項4に記載の方法。
- (D-3)得られた細胞バーコードの塩基配列と所定の遺伝子の塩基配列の組合せの情報に基づいて、少なくとも1つのある第二のクラスターに分類された所定の遺伝子の塩基配列と連結している細胞バーコードの塩基配列から当該所定の遺伝子の塩基配列が分類された第一のクラスターを決定し、当該細胞バーコードが分類された第一のクラスターの数から、当該第二のクラスターに分類された細胞の数を推定すること
をさらに含む、請求項4に記載の方法。 - (C-4)同一の第一のクラスターに分類された配列が異なる第二のクラスターに分類される場合、当該第二のクラスターを同一の細胞ベースの操作上分類単位(cOTU)に分類することをさらに含む、請求項4に記載の方法。
- (E)第一の細胞集団と、第一の細胞集団とは異なる第二の細胞集団のそれぞれに関して、細胞集団に含まれる(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数を推定し、第一の細胞集団に関して推定された(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数を、第二の細胞集団に関して推定された(i)cOTUの数および/または(ii)特定のcOTUに含まれる細胞の数とそれぞれ比較することをさらに含む、請求項7に記載の方法。
- (F)第一の細胞集団に関して推定された(i)cOTUの数および(ii')特定のcOTUに含まれる細胞の数と、第二の細胞集団に関して推定された(i)cOTUの数および(ii')特定のcOTUに含まれる細胞の数を比較することを含む、請求項8に記載の方法。
- 細胞集団が、微生物叢である、請求項1~9のいずれか一項に記載の方法。
- 微生物叢が、体内または体表の微生物叢である、請求項10に記載の方法。
- 微生物叢が、消化管内の微生物叢である、請求項10に記載の方法。
- 第一の細胞集団と第二の細胞集団が、同一対象の異なる部位から取得された微生物叢である、請求項8または9に記載の方法。
- 第一の細胞集団と第二の細胞集団が、異なる対象の同一の部位から取得された微生物叢である、請求項8または9に記載の方法。
- 第一の細胞集団と第二の細胞集団が、同一対象の同一の部位から異なる時間に取得された微生物叢である、請求項8または9に記載の方法。
- 細胞集団が、未知の細胞を含む、請求項1~15のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020094141 | 2020-05-29 | ||
JP2020094141 | 2020-05-29 | ||
PCT/JP2021/020338 WO2021241721A1 (ja) | 2020-05-29 | 2021-05-28 | 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021241721A1 JPWO2021241721A1 (ja) | 2021-12-02 |
JP7423101B2 true JP7423101B2 (ja) | 2024-01-29 |
Family
ID=78744799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022526658A Active JP7423101B2 (ja) | 2020-05-29 | 2021-05-28 | 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230203600A1 (ja) |
EP (1) | EP4159873A1 (ja) |
JP (1) | JP7423101B2 (ja) |
CN (1) | CN115867676A (ja) |
CA (1) | CA3185619A1 (ja) |
WO (1) | WO2021241721A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114642684A (zh) * | 2022-03-21 | 2022-06-21 | 北京航空航天大学 | 用于防治焦虑抑郁症的直肠真杆菌(Eubacterium rectale) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016126871A2 (en) | 2015-02-04 | 2016-08-11 | The Regents Of The University Of California | Sequencing of nucleic acids via barcoding in discrete entities |
WO2018218222A1 (en) | 2017-05-26 | 2018-11-29 | Goldfless Stephen Jacob | High-throughput polynucleotide library sequencing and transcriptome analysis |
JP2018538006A (ja) | 2015-11-04 | 2018-12-27 | アトレカ インコーポレイテッド | 単一細胞に関連する核酸の解析のための、核酸バーコードの組み合わせセット |
US20190002974A1 (en) | 2010-12-16 | 2019-01-03 | Gigagen, Inc. | System and Methods for Massively Parallel Analysis of Nucleic Acids in Single Cells |
US20190025299A1 (en) | 2015-09-25 | 2019-01-24 | Francois Vigneault | High throughput process for t cell receptor target identification of natively-paired t cell receptor sequences |
US20190300968A1 (en) | 2018-03-27 | 2019-10-03 | The Trustees Of Columbia University In The City Of New York | Spatial Metagenomic Characterization of Microbial Biogeography |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
AU2017335897A1 (en) * | 2016-09-28 | 2019-04-04 | General Automation Lab Technologies, Inc. | High resolution systems, kits, apparatus, and methods for bacterial community relationship determination and other high throughput microbiology applications |
JP7160349B2 (ja) | 2017-06-23 | 2022-10-25 | 国立研究開発法人理化学研究所 | 核酸をシークエンシングする方法および解析する方法 |
-
2021
- 2021-05-28 WO PCT/JP2021/020338 patent/WO2021241721A1/ja unknown
- 2021-05-28 CN CN202180038544.5A patent/CN115867676A/zh active Pending
- 2021-05-28 US US17/928,184 patent/US20230203600A1/en active Pending
- 2021-05-28 JP JP2022526658A patent/JP7423101B2/ja active Active
- 2021-05-28 CA CA3185619A patent/CA3185619A1/en active Pending
- 2021-05-28 EP EP21812570.6A patent/EP4159873A1/en active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190002974A1 (en) | 2010-12-16 | 2019-01-03 | Gigagen, Inc. | System and Methods for Massively Parallel Analysis of Nucleic Acids in Single Cells |
WO2016126871A2 (en) | 2015-02-04 | 2016-08-11 | The Regents Of The University Of California | Sequencing of nucleic acids via barcoding in discrete entities |
JP2018508198A (ja) | 2015-02-04 | 2018-03-29 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 別個の実体におけるバーコード付加による核酸のシーケンシング |
US20190025299A1 (en) | 2015-09-25 | 2019-01-24 | Francois Vigneault | High throughput process for t cell receptor target identification of natively-paired t cell receptor sequences |
JP2018538006A (ja) | 2015-11-04 | 2018-12-27 | アトレカ インコーポレイテッド | 単一細胞に関連する核酸の解析のための、核酸バーコードの組み合わせセット |
WO2018218222A1 (en) | 2017-05-26 | 2018-11-29 | Goldfless Stephen Jacob | High-throughput polynucleotide library sequencing and transcriptome analysis |
US20190300968A1 (en) | 2018-03-27 | 2019-10-03 | The Trustees Of Columbia University In The City Of New York | Spatial Metagenomic Characterization of Microbial Biogeography |
Non-Patent Citations (1)
Title |
---|
Nature Communications,2020年,11:866,pp.1-9,Published online: 13 February 2020 |
Also Published As
Publication number | Publication date |
---|---|
CN115867676A (zh) | 2023-03-28 |
EP4159873A1 (en) | 2023-04-05 |
JPWO2021241721A1 (ja) | 2021-12-02 |
CA3185619A1 (en) | 2021-12-02 |
US20230203600A1 (en) | 2023-06-29 |
WO2021241721A1 (ja) | 2021-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021202149B2 (en) | Detecting repeat expansions with short read sequencing data | |
US11866777B2 (en) | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) | |
EP3169803B1 (en) | Non-invasive prenatal diagnosis of fetal genetic condition using cellular dna and cell free dna | |
US20220246234A1 (en) | Using cell-free dna fragment size to detect tumor-associated variant | |
JP2020530261A (ja) | 未知の遺伝子型の寄与体からのdna混合物の正確な計算による分解のための方法 | |
JP7423101B2 (ja) | 細胞集団の処理方法および細胞集団に含まれる遺伝子の分析方法 | |
CN114736970B (zh) | 一种鉴别不同人群的方法 | |
Barbaro | Overview of NGS platforms and technological advancements for forensic applications | |
Zolfo | Metagenomics-based discovery of unknown bacteriophages In the human microbiome | |
Bajaj et al. | MICROBIAL GENOMICS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220907 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221019 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20221019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221220 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230620 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230728 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7423101 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |