JP2022526982A - 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物 - Google Patents
線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物 Download PDFInfo
- Publication number
- JP2022526982A JP2022526982A JP2021559248A JP2021559248A JP2022526982A JP 2022526982 A JP2022526982 A JP 2022526982A JP 2021559248 A JP2021559248 A JP 2021559248A JP 2021559248 A JP2021559248 A JP 2021559248A JP 2022526982 A JP2022526982 A JP 2022526982A
- Authority
- JP
- Japan
- Prior art keywords
- bacillus
- sequence
- genome
- dna
- recombinant dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091028043 Nucleic acid sequence Proteins 0.000 title claims abstract description 215
- 108020004511 Recombinant DNA Proteins 0.000 title claims abstract description 176
- 238000000034 method Methods 0.000 title claims abstract description 160
- 241000193830 Bacillus <bacterium> Species 0.000 title claims abstract description 68
- 239000000203 mixture Substances 0.000 title abstract description 29
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 203
- 239000002773 nucleotide Substances 0.000 claims abstract description 201
- 108020004414 DNA Proteins 0.000 claims abstract description 167
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 claims abstract description 163
- 108091033409 CRISPR Proteins 0.000 claims abstract description 119
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 106
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 95
- 230000010354 integration Effects 0.000 claims abstract description 64
- 239000003550 marker Substances 0.000 claims abstract description 53
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 24
- 210000004027 cell Anatomy 0.000 claims description 327
- 108090000623 proteins and genes Proteins 0.000 claims description 254
- 102000040430 polynucleotide Human genes 0.000 claims description 113
- 108091033319 polynucleotide Proteins 0.000 claims description 113
- 239000002157 polynucleotide Substances 0.000 claims description 113
- 125000004122 cyclic group Chemical group 0.000 claims description 64
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 61
- 150000007523 nucleic acids Chemical group 0.000 claims description 57
- 238000011144 upstream manufacturing Methods 0.000 claims description 41
- 230000005782 double-strand break Effects 0.000 claims description 37
- 230000001105 regulatory effect Effects 0.000 claims description 34
- 108020004999 messenger RNA Proteins 0.000 claims description 28
- 230000009466 transformation Effects 0.000 claims description 25
- 210000000349 chromosome Anatomy 0.000 claims description 24
- 244000063299 Bacillus subtilis Species 0.000 claims description 21
- 230000000295 complement effect Effects 0.000 claims description 18
- 102000053602 DNA Human genes 0.000 claims description 15
- 230000002103 transcriptional effect Effects 0.000 claims description 14
- 230000000692 anti-sense effect Effects 0.000 claims description 12
- 230000006798 recombination Effects 0.000 claims description 12
- 238000005215 recombination Methods 0.000 claims description 12
- 241000193744 Bacillus amyloliquefaciens Species 0.000 claims description 10
- 241000194108 Bacillus licheniformis Species 0.000 claims description 10
- 230000001939 inductive effect Effects 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 8
- 230000002269 spontaneous effect Effects 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 7
- 238000001890 transfection Methods 0.000 claims description 6
- 241000193752 Bacillus circulans Species 0.000 claims description 5
- 241000193749 Bacillus coagulans Species 0.000 claims description 5
- 108700007698 Genetic Terminator Regions Proteins 0.000 claims description 5
- 241000194109 Paenibacillus lautus Species 0.000 claims description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 5
- 229940054340 bacillus coagulans Drugs 0.000 claims description 5
- 238000004520 electroporation Methods 0.000 claims description 5
- 230000009261 transgenic effect Effects 0.000 claims description 5
- 241000193422 Bacillus lentus Species 0.000 claims description 4
- 241000193385 Geobacillus stearothermophilus Species 0.000 claims description 4
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 claims description 3
- 239000001110 calcium chloride Substances 0.000 claims description 3
- 229910001628 calcium chloride Inorganic materials 0.000 claims description 3
- 230000021615 conjugation Effects 0.000 claims description 3
- 210000001938 protoplast Anatomy 0.000 claims description 3
- 230000035939 shock Effects 0.000 claims description 3
- 230000013011 mating Effects 0.000 claims description 2
- 238000010361 transduction Methods 0.000 claims description 2
- 230000026683 transduction Effects 0.000 claims description 2
- 230000002062 proliferating effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract 1
- 230000014509 gene expression Effects 0.000 description 109
- 102000004169 proteins and genes Human genes 0.000 description 88
- 102100031780 Endonuclease Human genes 0.000 description 72
- 239000013612 plasmid Substances 0.000 description 68
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 55
- 230000000694 effects Effects 0.000 description 48
- 230000008685 targeting Effects 0.000 description 47
- 108090000765 processed proteins & peptides Proteins 0.000 description 45
- 102000004196 processed proteins & peptides Human genes 0.000 description 44
- 229920001184 polypeptide Polymers 0.000 description 42
- 239000012634 fragment Substances 0.000 description 39
- 102000039446 nucleic acids Human genes 0.000 description 39
- 108020004707 nucleic acids Proteins 0.000 description 39
- 108091026890 Coding region Proteins 0.000 description 31
- 238000002744 homologous recombination Methods 0.000 description 30
- 230000006801 homologous recombination Effects 0.000 description 30
- 239000013598 vector Substances 0.000 description 29
- 108091079001 CRISPR RNA Proteins 0.000 description 27
- 150000001413 amino acids Chemical class 0.000 description 22
- 230000004048 modification Effects 0.000 description 22
- 238000012986 modification Methods 0.000 description 22
- 230000027455 binding Effects 0.000 description 20
- 238000010354 CRISPR gene editing Methods 0.000 description 19
- 238000009739 binding Methods 0.000 description 18
- 241000894007 species Species 0.000 description 17
- 238000013519 translation Methods 0.000 description 17
- 230000014616 translation Effects 0.000 description 17
- 108091005804 Peptidases Proteins 0.000 description 15
- 102000035195 Peptidases Human genes 0.000 description 15
- 241000193996 Streptococcus pyogenes Species 0.000 description 15
- 239000004365 Protease Substances 0.000 description 14
- 235000019419 proteases Nutrition 0.000 description 14
- 230000002441 reversible effect Effects 0.000 description 14
- 230000035772 mutation Effects 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 11
- 101150009206 aprE gene Proteins 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 230000001965 increasing effect Effects 0.000 description 11
- 229920001817 Agar Polymers 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 101710163270 Nuclease Proteins 0.000 description 10
- 239000008272 agar Substances 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 229940088598 enzyme Drugs 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 108010076504 Protein Sorting Signals Proteins 0.000 description 9
- 241000194020 Streptococcus thermophilus Species 0.000 description 9
- -1 but not limited to Proteins 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000003776 cleavage reaction Methods 0.000 description 9
- 230000003834 intracellular effect Effects 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 235000020183 skimmed milk Nutrition 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000005778 DNA damage Effects 0.000 description 7
- 231100000277 DNA damage Toxicity 0.000 description 7
- 241000196324 Embryophyta Species 0.000 description 7
- 241000588724 Escherichia coli Species 0.000 description 7
- 241001522878 Escherichia coli B Species 0.000 description 7
- 241000701959 Escherichia virus Lambda Species 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 230000005783 single-strand break Effects 0.000 description 7
- 108010065511 Amylases Proteins 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 229930027917 kanamycin Natural products 0.000 description 6
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 6
- 229960000318 kanamycin Drugs 0.000 description 6
- 229930182823 kanamycin A Natural products 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 230000002797 proteolythic effect Effects 0.000 description 6
- 125000006850 spacer group Chemical group 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 108020005544 Antisense RNA Proteins 0.000 description 5
- 101100297769 Bacillus subtilis (strain 168) pksR gene Proteins 0.000 description 5
- 241000588881 Chromobacterium Species 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 241000193985 Streptococcus agalactiae Species 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 239000003184 complementary RNA Substances 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 241000193764 Brevibacillus brevis Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 230000007018 DNA scission Effects 0.000 description 4
- 241000194025 Streptococcus oralis Species 0.000 description 4
- 108091023045 Untranslated Region Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229940041514 candida albicans extract Drugs 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 230000035800 maturation Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 101150112117 nprE gene Proteins 0.000 description 4
- 230000005937 nuclear translocation Effects 0.000 description 4
- 101150085518 pksR gene Proteins 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000028327 secretion Effects 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 239000012137 tryptone Substances 0.000 description 4
- 239000012138 yeast extract Substances 0.000 description 4
- 102000013142 Amylases Human genes 0.000 description 3
- 101100055551 Bacillus licheniformis amyS gene Proteins 0.000 description 3
- 101100267188 Bacillus subtilis (strain 168) yhfN gene Proteins 0.000 description 3
- 102100026189 Beta-galactosidase Human genes 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 101100227734 Escherichia coli (strain K12) frlB gene Proteins 0.000 description 3
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 3
- 241000588650 Neisseria meningitidis Species 0.000 description 3
- 102000004316 Oxidoreductases Human genes 0.000 description 3
- 108090000854 Oxidoreductases Proteins 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 3
- 235000019418 amylase Nutrition 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 101150055766 cat gene Proteins 0.000 description 3
- 101150020466 comK gene Proteins 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 239000012636 effector Substances 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000014621 translational initiation Effects 0.000 description 3
- 101150096952 yhfN gene Proteins 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 2
- 239000004382 Amylase Substances 0.000 description 2
- 108090000145 Bacillolysin Proteins 0.000 description 2
- 101100310360 Bacillus subtilis (strain 168) skfC gene Proteins 0.000 description 2
- 108091005658 Basic proteases Proteins 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- 241000190890 Capnocytophaga Species 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108091060290 Chromatid Proteins 0.000 description 2
- 102000004594 DNA Polymerase I Human genes 0.000 description 2
- 108010017826 DNA Polymerase I Proteins 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- 241000605909 Fusobacterium Species 0.000 description 2
- 101150106478 GPS1 gene Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 101100216056 Lactobacillus amylovorus amyL gene Proteins 0.000 description 2
- 102000004317 Lyases Human genes 0.000 description 2
- 108090000856 Lyases Proteins 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000589345 Methylococcus Species 0.000 description 2
- 108091005507 Neutral proteases Proteins 0.000 description 2
- 102000035092 Neutral proteases Human genes 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 240000000968 Parkia biglobosa Species 0.000 description 2
- 241000606860 Pasteurella Species 0.000 description 2
- 102000003992 Peroxidases Human genes 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000194008 Streptococcus anginosus Species 0.000 description 2
- 241001291896 Streptococcus constellatus Species 0.000 description 2
- 241000194042 Streptococcus dysgalactiae Species 0.000 description 2
- 241000194045 Streptococcus macacae Species 0.000 description 2
- 241000194019 Streptococcus mutans Species 0.000 description 2
- 241000193991 Streptococcus parasanguinis Species 0.000 description 2
- 241000589596 Thermus Species 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 241000723792 Tobacco etch virus Species 0.000 description 2
- 241000723873 Tobacco mosaic virus Species 0.000 description 2
- 241000589886 Treponema Species 0.000 description 2
- 241000589892 Treponema denticola Species 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 101150117416 cas2 gene Proteins 0.000 description 2
- 101150038500 cas9 gene Proteins 0.000 description 2
- 108091092356 cellular DNA Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 210000004756 chromatid Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 101150055601 cops2 gene Proteins 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000035699 permeability Effects 0.000 description 2
- 108040007629 peroxidase activity proteins Proteins 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 238000003259 recombinant expression Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 101150098466 rpsL gene Proteins 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 101150114414 skfC gene Proteins 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical compound N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 108010011619 6-Phytase Proteins 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 241000589291 Acinetobacter Species 0.000 description 1
- 241000567147 Aeropyrum Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 241000724328 Alfalfa mosaic virus Species 0.000 description 1
- 102000004400 Aminopeptidases Human genes 0.000 description 1
- 108090000915 Aminopeptidases Proteins 0.000 description 1
- 240000007304 Amorphophallus muelleri Species 0.000 description 1
- 241001109946 Aquimarina Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 108010045149 Archaeal Proteins Proteins 0.000 description 1
- 241000205046 Archaeoglobus Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 101100043766 Bacillus amyloliquefaciens apr gene Proteins 0.000 description 1
- 241001328122 Bacillus clausii Species 0.000 description 1
- 101900315840 Bacillus subtilis Alpha-amylase Proteins 0.000 description 1
- 108700026883 Bacteria AprE Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 241001567982 Bacteroides graminisolvens Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 108010059892 Cellulase Proteins 0.000 description 1
- 240000001817 Cereus hexagonus Species 0.000 description 1
- 240000000425 Chaenomeles speciosa Species 0.000 description 1
- 235000005078 Chaenomeles speciosa Nutrition 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 241000611330 Chryseobacterium Species 0.000 description 1
- 241001426140 Chryseobacterium tenax Species 0.000 description 1
- 108090000746 Chymosin Proteins 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241001657523 Coriobacteriaceae Species 0.000 description 1
- 241001162417 Coriobacteriaceae bacterium Species 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241000605716 Desulfovibrio Species 0.000 description 1
- 241000698776 Duma Species 0.000 description 1
- 241000710188 Encephalomyocarditis virus Species 0.000 description 1
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 1
- 101100438439 Escherichia coli (strain K12) ygbT gene Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108050001049 Extracellular proteins Proteins 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 241000721361 Flavobacterium soli Species 0.000 description 1
- 240000003362 Fragaria moschata Species 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 101100001650 Geobacillus stearothermophilus amyM gene Proteins 0.000 description 1
- 241001135750 Geobacter Species 0.000 description 1
- 229920001503 Glucan Polymers 0.000 description 1
- 108010073178 Glucan 1,4-alpha-Glucosidase Proteins 0.000 description 1
- 102100022624 Glucoamylase Human genes 0.000 description 1
- 239000004366 Glucose oxidase Substances 0.000 description 1
- 108010015776 Glucose oxidase Proteins 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 241001059853 Haemophilus pittmaniae Species 0.000 description 1
- 241000205065 Haloarcula Species 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000899240 Homo sapiens Endoplasmic reticulum chaperone BiP Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 240000006024 Lactobacillus plantarum Species 0.000 description 1
- 241000222722 Leishmania <genus> Species 0.000 description 1
- 108090001060 Lipase Proteins 0.000 description 1
- 102000004882 Lipase Human genes 0.000 description 1
- 239000004367 Lipase Substances 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000710118 Maize chlorotic mottle virus Species 0.000 description 1
- 241000723994 Maize dwarf mosaic virus Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 102100024295 Maltase-glucoamylase Human genes 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- 108010054377 Mannosidases Proteins 0.000 description 1
- 102000001696 Mannosidases Human genes 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 241000619533 Mesonia Species 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241000645872 Methylococcus mobilis Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 102100036617 Monoacylglycerol lipase ABHD2 Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241000186359 Mycobacterium Species 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 208000009525 Myocarditis Diseases 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000169855 Olivibacter Species 0.000 description 1
- 241000990071 Olsenella profusa Species 0.000 description 1
- 108091092740 Organellar DNA Proteins 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 241000606601 Pasteurella bettyae Species 0.000 description 1
- 241001112694 Peptococcaceae Species 0.000 description 1
- 241000206591 Peptococcus Species 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000607568 Photobacterium Species 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 108010059820 Polygalacturonase Proteins 0.000 description 1
- 241000605894 Porphyromonas Species 0.000 description 1
- 241000134844 Porphyromonas catoniae Species 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000205226 Pyrobaculum Species 0.000 description 1
- 230000007022 RNA scission Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108090001066 Racemases and epimerases Proteins 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000202917 Spiroplasma Species 0.000 description 1
- 241000202907 Spiroplasma apis Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241001400864 Streptococcus pseudoporcinus Species 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241001266658 Streptococcus sp. BS35b Species 0.000 description 1
- 241000059353 Streptococcus sp. SR4 Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000186339 Thermoanaerobacter Species 0.000 description 1
- 101100329497 Thermoproteus tenax (strain ATCC 35583 / DSM 2078 / JCM 9277 / NBRC 100435 / Kra 1) cas2 gene Proteins 0.000 description 1
- 241000204652 Thermotoga Species 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108060008724 Tyrosinase Proteins 0.000 description 1
- 102000003425 Tyrosinase Human genes 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 241001148134 Veillonella Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 244000195452 Wasabia japonica Species 0.000 description 1
- 235000000760 Wasabia japonica Nutrition 0.000 description 1
- 241000605941 Wolinella Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 108090000637 alpha-Amylases Proteins 0.000 description 1
- 102000004139 alpha-Amylases Human genes 0.000 description 1
- 108010030291 alpha-Galactosidase Proteins 0.000 description 1
- 102000005840 alpha-Galactosidase Human genes 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 229940024171 alpha-amylase Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 229940025131 amylases Drugs 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000002155 anti-virotic effect Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 108010051210 beta-Fructofuranosidase Proteins 0.000 description 1
- 108010047754 beta-Glucosidase Proteins 0.000 description 1
- 102000006995 beta-Glucosidase Human genes 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 101150000705 cas1 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 229940106157 cellulase Drugs 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229940080701 chymosin Drugs 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 108010005400 cutinase Proteins 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006114 demyristoylation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 235000020774 essential nutrients Nutrition 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000012224 gene deletion Methods 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 229940116332 glucose oxidase Drugs 0.000 description 1
- 235000019420 glucose oxidase Nutrition 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229940059442 hemicellulase Drugs 0.000 description 1
- 108010002430 hemicellulase Proteins 0.000 description 1
- IIRDTKBZINWQAW-UHFFFAOYSA-N hexaethylene glycol Chemical group OCCOCCOCCOCCOCCOCCO IIRDTKBZINWQAW-UHFFFAOYSA-N 0.000 description 1
- 108010018734 hexose oxidase Proteins 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000012966 insertion method Methods 0.000 description 1
- 230000008316 intracellular mechanism Effects 0.000 description 1
- 230000006525 intracellular process Effects 0.000 description 1
- 239000001573 invertase Substances 0.000 description 1
- 235000011073 invertase Nutrition 0.000 description 1
- OOYGSFOGFJDDHP-KMCOLRRFSA-N kanamycin A sulfate Chemical compound OS(O)(=O)=O.O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N OOYGSFOGFJDDHP-KMCOLRRFSA-N 0.000 description 1
- 229960002064 kanamycin sulfate Drugs 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 235000019421 lipase Nutrition 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- GNOLWGAJQVLBSM-UHFFFAOYSA-N n,n,5,7-tetramethyl-1,2,3,4-tetrahydronaphthalen-1-amine Chemical compound C1=C(C)C=C2C(N(C)C)CCCC2=C1C GNOLWGAJQVLBSM-UHFFFAOYSA-N 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000007857 nested PCR Methods 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 108010072638 pectinacetylesterase Proteins 0.000 description 1
- 102000004251 pectinacetylesterase Human genes 0.000 description 1
- 108020004410 pectinesterase Proteins 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229940085127 phytase Drugs 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000006798 ring closing metathesis reaction Methods 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012106 screening analysis Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 101150061166 tetR gene Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 108010087967 type I signal peptidase Proteins 0.000 description 1
- 241001624918 unidentified bacterium Species 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/75—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/65—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Abstract
バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込むための方法及び組成物が提供される。方法は、バチルス属(Bacillus sp.)細胞へのガイドRNA/Casエンドヌクレアーゼの導入のために、Cas9エンドヌクレアーゼ及びガイドRNAをコードする組換えDNAコンストラクトと組み合わせて、長いホモロジーアーム(それぞれ少なくとも1000のヌクレオチド長)によって隣接されるドナーDNAを含む線状組換えDNAコンストラクトを利用し、且つしたがって、前記バチルス属(Bacillus sp.)細胞のゲノムにおいて選択マーカーを組み込む必要性を伴わずに、前記バチルス属(Bacillus sp.)細胞のゲノムにドナーDNA配列を組み込むための非常に効率的な系を提供する。【選択図】 図1
Description
関連出願の相互参照
本出願は、全体として参照により本明細書に組み込まれる、2019年4月5日に出願された米国仮特許出願第62/829662号明細書の利益を主張するものである。
本出願は、全体として参照により本明細書に組み込まれる、2019年4月5日に出願された米国仮特許出願第62/829662号明細書の利益を主張するものである。
本発明は、細菌分子生物学の分野、特にバチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込むための組成物及び方法に関する。
電子的に提出された配列表の参照
配列表の認証謄本は、2020年3月20日に作成され、77キロバイトのサイズを有する、20200320_NB41329PCT_ST25というファイル名の1ASCIIフォーマットの配列表としてEFS-Webを介して電子的に提出され、本明細書と同時に出願される。このASCIIフォーマット文書に含まれる配列表は、本明細書の一部であり、その全体が参照により本明細書に組み込まれる。
配列表の認証謄本は、2020年3月20日に作成され、77キロバイトのサイズを有する、20200320_NB41329PCT_ST25というファイル名の1ASCIIフォーマットの配列表としてEFS-Webを介して電子的に提出され、本明細書と同時に出願される。このASCIIフォーマット文書に含まれる配列表は、本明細書の一部であり、その全体が参照により本明細書に組み込まれる。
組換えDNA技術により、標的のゲノム位置にDNA配列を挿入することが可能になった。部位特異的組換え系を使用する部位特異的組込み技術は、他の組換え技術と同様に、様々な生物体における目的の遺伝子の標的挿入の生成に使用されてきた。Cas系の部位特異的性質を前提として、例えば哺乳動物細胞中における、これらの系に基づくゲノム操作技術が説明されている(例えば、Hsu et al.,2014を参照されたい)。Casベースのゲノム操作は、意図したとおりに機能する場合、crRNAのDNAターゲティング領域(すなわち可変ターゲティングドメイン)がゲノム中の所望の標的部位に対して相同である組換えcrRNA(又は均等に機能するガイドRNA)を設計し、このcrRNAとCasエンドヌクレアーゼとを宿主細胞中で(任意の好都合な及び従来の手段によって)機能的複合体に組み合わせることにより、複雑なゲノム内での任意の特定の位置を実質的に標的とする能力を付与する。Cas9のRNA構成要素の配列は、Cas9が、(i)RNA構成要素の一部と相補的な配列、及び(ii)プロトスペーサー隣接モチーフ(PAM)配列を含有するDNAを認識して切断するように設計され得る。
Casベースのゲノム操作技術は、いくつかの異なる宿主細胞型に適用されているが、これらの技術は、既知の制限を有する。
バチルス属(Bacillus sp.)細胞のゲノムへの遺伝子組込みのための以前の方法は、自発的な二本鎖切断の発生及び短いホモロジーアームとともに線状DNA断片上で同じ場所に位置する選択マーカー(ゲノムに挿入されることになる目的の遺伝子(GOI)と、そのゲノムに組み込まれる目的の遺伝子を有したバチルス属(Bacillus sp.)細胞の同定も可能にするようにゲノムに挿入された選択マーカーとの両方を含む)の使用に依拠する(2002年2月21日に公開された国際公開第02/14490号パンフレット)。選択マーカー及びGOIは、通常、細胞内のDNAとの組換え時にGOI及び選択マーカーの両方が細胞のDNA中に組み込まれることになるように、2つの短いホモロジーアームによって隣接された。バチルス(Bacillus)細胞へのゲノム組込みのための短いホモロジーアームによる、そのような線状断片の形質転換中の選択マーカーの使用は、ゲノムの特定の位置の効率的な改変のために選択することが必要となる。マーカーは、発現のための正確な遺伝子座に組み込む必要があり、この組込みは、集団内及びゲノム内の確率的な様式で発生する希有な自発的DNA損傷に依拠する。この希有な事象は、マーカーの使用及び染色体組込みを組み合わせることによってのみ選択され得る。(2002年2月21日に公開された国際公開第02/14490号パンフレット)。
本開示は、集団の大部分を、所望の遺伝子座でDNA損傷を含有する細胞に本質的に変換する部位特異的DNA損傷(ゲノム中の標的部位での)を生成するための方法を記載する。したがって、染色体座位を改変するための制限的な工程がもはやなく;代わりに、制限的な特徴は、形質転換の効率であり、したがって、選択マーカーは、形質転換されていない細胞から、形質転換された細胞を区別するために必要となる。
バチルス・サブチリス(Bacillus subtilis)において、Cas/RNAガイド系と組み合わせた単一のプラスミド系の使用は、遺伝子欠失及び遺伝子における点変異の導入を可能にすることに関して記載されている(Altenbuchner J.,2016,Applied and Environmental Microbiology,vol.82(17)pg.5421-5427)。
ドナーDNA配列(目的のポリヌクレオチド、目的の遺伝子、単一コピーの遺伝子発現カセット又は複数コピーの遺伝子発現カセットなどであるが、これらに限定されない)をバチルス属(Bacillus sp.)細胞のゲノムの標的部位に組み込むための効果的、効率的又は他の点でより堅牢若しくは柔軟なCasベースの方法及びその組成物を開発することが依然として必要とされている。
本開示は、バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込むための方法及び組成物を含む。方法は、バチルス属(Bacillus sp.)細胞へのガイドRNA/Casエンドヌクレアーゼ系(RNA誘導型エンドヌクレアーゼ、RGENとも称される)の導入のために、Cas9エンドヌクレアーゼ及び任意選択によりガイドRNAをコードする組換えDNAコンストラクトと組み合わせて、長いホモロジーアーム(1000を超えるヌクレオチド長)によって隣接されるドナーDNA配列を含む線状組換えDNAコンストラクトを利用し、且つしたがって、前記バチルス属(Bacillus sp.)細胞のゲノムにおいて選択マーカーを組み込む必要性を伴わずに、前記バチルス属(Bacillus sp.)細胞のゲノムにドナーDNA配列を組み込むための非常に効率的な系を提供する。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。
一実施形態では、ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接され、各ホモロジーアームは、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000を超え、且つ最大で6000のヌクレオチド長であり、及びバチルス属(Bacillus sp.)細胞のゲノム上の前記標的部位に対する配列相同性を含む。
一実施形態では、ドナーDNA配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、分泌シグナル配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーRNAの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか1つの組合せからなる群から選択されるヌクレオチド配列を含む。
一態様では、線状組換えDNAは、スタッファー配列をさらに含み得る。
一実施形態では、線状組換えDNAコンストラクトは、一本鎖DNAコンストラクトである。
一実施形態では、線状組換えDNAコンストラクトは、二本鎖DNAコンストラクトである。
一態様では、方法は、前記バチルス属(Bacillus sp.)細胞からの子孫細胞を増殖させ、且つバチルス属(Bacillus sp.)子孫細胞であって、そのゲノム中に安定に組み込まれたドナーDNA配列を有するバチルス属(Bacillus sp.)子孫細胞を選択することをさらに含む。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、及び前記方法は、バチルス属(Bacillus sp.)細胞に、1000ヌクレオチドの上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接される前記ドナーDNA配列を含む線状組換えDNAコンストラクトと、前記環状組換えDNAコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~最大で23倍高い、バチルス属(Bacillus sp.)細胞のゲノムへのドナーDNA配列の組込みの頻度を有する、方法である。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、方法である。
一態様では、本明細書に記載される方法は、バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接されるドナーDNA配列を含み、前記ドナーDNAは、目的の前記遺伝子の複数のコピーを含み、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。
本開示は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込むための方法及び組成物を含む。方法は、バチルス属(Bacillus sp.)細胞へのガイドRNA/Casエンドヌクレアーゼ系(RGEN)の導入のために、Cas9エンドヌクレアーゼ(及びいずれかの組換えコンストラクト上に配置され得るガイドRNA)をコードする環状組換えDNAコンストラクトと組み合わせて、長いホモロジーアーム(>1000ヌクレオチド長)によって隣接されるドナーDNA配列を含む線状組換えDNAコンストラクトを利用し、且つしたがって、前記バチルス属(Bacillus sp.)細胞のゲノムにおいて選択マーカーを組み込む必要性を伴わずに、前記バチルス属(Bacillus sp.)細胞のゲノムにドナーDNA配列を組み込むための非常に効率的な系を提供する。
本明細書は、読み易くするためにいくつかの節で編成されている。しかしながら、読者は、1つの節でなされた記載が他の節に適用され得ることを理解するであろう。このように、本開示の異なる節で使用された見出しを限定的であると解釈すべきではない。
本明細書に示した見出しは、本明細書全体を参照することによって得ることができる本組成物及び方法の様々な態様又は実施形態を限定するものではない。したがって、直下で定義する用語は、本明細書全体を参照することによってより詳細に定義される。
他に定義されていない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明の組成物及び方法が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。本明細書に記載のものに類似の又は均等な任意の方法及び材料も本発明の組成物及び方法を実施又は試験するために使用できるが、以下では、例示的な方法及び材料について記載する。
本明細書に引用されている全ての刊行物及び特許は、個々の刊行物又は特許が、参照により組み込まれ、それらの刊行物が関連して引用される方法及び/又は材料を開示し、記載するように具体的且つ個別に示されているかのように、参照により本明細書に組み込まれる。
本明細書で使用する場合、用語「開示」又は「開示される開示」は、限定することを意味するものではなく、特許請求の範囲で定義されるか又は本明細書に記載される本開示のいずれかに一般的に適用される。これらの用語は、本明細書では互換的に用いられる。
Cas遺伝子及びタンパク質
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)遺伝子座は、例えば、外来DNAを破壊するために細菌及び古細菌細胞によって使用される、DNA切断系の成分をコードする特定の遺伝子座を指す(Horvath and Barrangou,2010,Science 327:167-170;2007年3月1日公開の国際公開第2007/025097号パンフレット)。CRISPR遺伝子座は、短い可変DNA配列(「スペーサー」と呼ばれる)によって分離された短いダイレクトリピート(CRISPRリピート)を含むCRISPRアレイからなり得、これは、多様なCas(CRISPR関連)遺伝子によって隣接され得る。所与のCRISPR遺伝子座におけるCRISPR関連遺伝子の数は、種によって変わり得る。マルチサブユニットエフェクター複合体(I型、III型及びIV型サブタイプを含む)を有するクラス1系及び単一タンパク質エフェクター(Cas9、Cpf1、C2c1、C2c2、C2c3などであるが、これらに限定されないII型及びV型サブタイプを含む)を有するクラス2系を含む複数のCRISPR/Cas系が記載されている。クラス1系(参照により本明細書に組み込まれるMakarova et al.2015,Nature Reviews;Microbiology Vol.13:1-15;Zetsche et al.,2015,Cell 163,1-13;Shmakov et al.,2015,Molecular_Cell 60,1-13;Haft et al.,2005,Computational Biology,PLoS Comput Biol 1(6):e60.doi:10.1371/journal.pcbi.0010060及び2013年11月23日に公開された国際公開第2013/176772A1号パンフレット)。細菌由来のII型CRISPR/Cas系は、CasエンドヌクレアーゼをそのDNA標的に誘導するために、crRNA(CRISPR RNA)及びtracrRNA(トランス活性化CRISPR RNA)を使用する。crRNAは、二本鎖DNA標的の一方の鎖に相補的なスペーサー領域及びtracrRNA(トランス活性化CRISPR RNA)と塩基対合し、Casエンドヌクレアーゼを導いて、DNA配列を切断させるRNA二本鎖を形成する領域を含有する。スペーサーは、Cas1及びCas2タンパク質を伴う十分に解明されていないプロセスによって得られる。全てのII型CRISPR/Cas遺伝子座は、cas9遺伝子に加えて、cas1及びcas2遺伝子を含有する(Chylinski et al.,2013,RNA Biology 10:726-737;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。II型CRISPR-Cas遺伝子座は、それぞれのCRISPRアレイ内のリピートに部分的に相補的なtracrRNAをコードすることができ、Csn1及びCsn2などの他のタンパク質を含むことができる。Cas1及びcas2遺伝子の近傍にcas9が存在することがII型遺伝子座の特徴である(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。I型CRISPR-Cas(CRISPR関連)系は、侵入しているウイルスDNAに対して防御するための単一のCRISPR RNA(crRNA)及びCas3とともに機能するCascade(抗ウイルス防御のためのCRISPR関連複合体)と呼ばれるタンパク質の複合体からなる(全体として本明細書に組み込まれるBrouns,S.J.J.et al.Science 321:960-964;Makarova et al.2015,Nature Reviews;Microbiology Vol.13:1-15)。
CRISPR(クラスター化して規則的な配置の短い回文配列リピート)遺伝子座は、例えば、外来DNAを破壊するために細菌及び古細菌細胞によって使用される、DNA切断系の成分をコードする特定の遺伝子座を指す(Horvath and Barrangou,2010,Science 327:167-170;2007年3月1日公開の国際公開第2007/025097号パンフレット)。CRISPR遺伝子座は、短い可変DNA配列(「スペーサー」と呼ばれる)によって分離された短いダイレクトリピート(CRISPRリピート)を含むCRISPRアレイからなり得、これは、多様なCas(CRISPR関連)遺伝子によって隣接され得る。所与のCRISPR遺伝子座におけるCRISPR関連遺伝子の数は、種によって変わり得る。マルチサブユニットエフェクター複合体(I型、III型及びIV型サブタイプを含む)を有するクラス1系及び単一タンパク質エフェクター(Cas9、Cpf1、C2c1、C2c2、C2c3などであるが、これらに限定されないII型及びV型サブタイプを含む)を有するクラス2系を含む複数のCRISPR/Cas系が記載されている。クラス1系(参照により本明細書に組み込まれるMakarova et al.2015,Nature Reviews;Microbiology Vol.13:1-15;Zetsche et al.,2015,Cell 163,1-13;Shmakov et al.,2015,Molecular_Cell 60,1-13;Haft et al.,2005,Computational Biology,PLoS Comput Biol 1(6):e60.doi:10.1371/journal.pcbi.0010060及び2013年11月23日に公開された国際公開第2013/176772A1号パンフレット)。細菌由来のII型CRISPR/Cas系は、CasエンドヌクレアーゼをそのDNA標的に誘導するために、crRNA(CRISPR RNA)及びtracrRNA(トランス活性化CRISPR RNA)を使用する。crRNAは、二本鎖DNA標的の一方の鎖に相補的なスペーサー領域及びtracrRNA(トランス活性化CRISPR RNA)と塩基対合し、Casエンドヌクレアーゼを導いて、DNA配列を切断させるRNA二本鎖を形成する領域を含有する。スペーサーは、Cas1及びCas2タンパク質を伴う十分に解明されていないプロセスによって得られる。全てのII型CRISPR/Cas遺伝子座は、cas9遺伝子に加えて、cas1及びcas2遺伝子を含有する(Chylinski et al.,2013,RNA Biology 10:726-737;Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。II型CRISPR-Cas遺伝子座は、それぞれのCRISPRアレイ内のリピートに部分的に相補的なtracrRNAをコードすることができ、Csn1及びCsn2などの他のタンパク質を含むことができる。Cas1及びcas2遺伝子の近傍にcas9が存在することがII型遺伝子座の特徴である(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。I型CRISPR-Cas(CRISPR関連)系は、侵入しているウイルスDNAに対して防御するための単一のCRISPR RNA(crRNA)及びCas3とともに機能するCascade(抗ウイルス防御のためのCRISPR関連複合体)と呼ばれるタンパク質の複合体からなる(全体として本明細書に組み込まれるBrouns,S.J.J.et al.Science 321:960-964;Makarova et al.2015,Nature Reviews;Microbiology Vol.13:1-15)。
本明細書における用語「Cas遺伝子」は、一般に、隣接しているCRISPR遺伝子座と結合するか、会合するか若しくは近接するか又は近傍にある遺伝子を指す。用語「Cas遺伝子」、「cas遺伝子」、「CRISPR関連(Cas)遺伝子」及び「クラスター化して規則的な配置の短い回文配列リピート関連遺伝子」は、本明細書で互換的に使用される。
用語「Casタンパク質」又は「Casポリペプチド」は、Cas(CRISPR関連)遺伝子によってコードされるポリペプチドを指す。Casタンパク質は、Casエンドヌクレアーゼを含む。
Casタンパク質は、細菌タンパク質又は古細菌タンパク質であり得る。本明細書におけるI~III型CRISPR Casタンパク質は、典型的には、起源が原核生物であり;例えば、I型及びIII型Casタンパク質は、細菌種又は古細菌種に由来し得るが、II型Casタンパク質(すなわちCas9)は、細菌種に由来し得る。他の態様において、Casタンパク質は、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらのホモログ又はそれらの改変型の1つ以上を含む。Casタンパク質としては、Cas9タンパク質、Cpf1タンパク質、C2c1タンパク質、C2c2タンパク質、C2c3タンパク質、Cas3、Cas3-HD、Cas5、Cas7、Cas8、Cas10又はこれらの組合せ若しくは複合体が挙げられる。
用語「Casエンドヌクレアーゼ」は、好適なポリヌクレオチド成分と複合体を形成するとき、特定のDNA標的配列の全て又は一部を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断をすることができるCasポリペプチド(Casタンパク質)を指す。Casエンドヌクレアーゼは、ガイドポリヌクレオチドによりガイドされて、二本鎖DNA中の特定の標的部位の全て又は一部を(例えば、細胞のゲノム中の標的部位で)認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する。本明細書に記載されるCasエンドヌクレアーゼは、1つ以上のヌクレアーゼドメインを含む。本明細書に記載されるドナーDNA挿入方法で用いられるCasエンドヌクレアーゼは、標的部位でDNAに一本鎖又は二本鎖切断を導入するエンドヌクレアーゼである。代わりに、Casエンドヌクレアーゼは、好適なRNA成分と複合体を形成するとき、DNA切断活性又はニッキング活性を欠く可能性があるが、DNA標的配列に依然として特異的に結合することができる。
本明細書で使用する場合、「Cas9」と称されるポリペプチド(Cas5、Csn1又はCsx12と以前に称された)、又は「Cas9エンドヌクレアーゼ」、又は「Cas9エンドヌクレアーゼ活性」を有することは、DNA標的配列の全て又は一部に特異的に結合し、且つ任意選択により切れ目を入れるか又は切断するためのcrヌクレオチド及びtracrヌクレオチド又はシングルガイドポリヌクレオチドと複合体を形成するCasエンドヌクレアーゼを指す。Cas9エンドヌクレアーゼは、RuvCヌクレアーゼドメイン及びHNH(H-N-H)ヌクレアーゼドメインを含み、これらは、それぞれ標的配列において一本鎖DNAを切断することができる(両方のドメインが協調して作用すると、DNA二本鎖が切断されるが、一方のドメインの活性ではニックに至る)。一般に、RuvCドメインは、サブドメインI、II及びIIIを含み、ドメインIは、Cas9のN末端近傍に位置し、サブドメインII及びIIIは、タンパク質の中央に位置し、HNHドメインに隣接している(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15、Hsu et al,2013,Cell 157:1262-1278)。Cas9エンドヌクレアーゼは、通常、少なくとも1つのポリヌクレオチド成分と複合体を形成するCas9エンドヌクレアーゼを利用するDNA切断系を含むII型CRISPR系に由来する。例えば、Cas9は、CRISPR RNA(crRNA)及びトランス活性化CRISPR RNA(tracrRNA)との複合体中に存在し得る。別の例では、Cas9は、シングルガイドRNAとの複合体中に存在し得る(Makarova et al.2015,Nature Reviews Microbiology Vol.13:1-15)。
Casエンドヌクレアーゼの「機能的断片」、「機能的に均等である断片」及び「機能的に均等な断片」は、本明細書では互換的に使用され、標的部位を認識し、それに結合し、且つ任意選択によりほどき、切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)能力が保持されているCasエンドヌクレアーゼの一部又は部分配列を指す。
本開示のCasエンドヌクレアーゼの「機能的バリアント」、「機能的に均等であるバリアント」及び「機能的に均等なバリアント」という用語は、本明細書では互換的に使用され、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択によりほどくか、切れ目を入れるか又は切断する能力が保持されている、本開示のCasエンドヌクレアーゼのバリアントを指す。
特定の標的DNA配列に向かう本明細書のCasタンパク質の結合活性及び/又はヌクレオチド鎖切断活性の決定は、参照により本明細書に開示される、米国特許第8697359号明細書に開示されるような、当技術分野において知られる任意の好適なアッセイによって評価され得る。例えば、宿主細胞/生物体中でCasタンパク質及び好適なRNA成分を発現させ、続いてインデルの存在について予測されるDNA標的部位を試験することによって決定することができる(この特定のアッセイにおけるCasタンパク質は、ヌクレオチド鎖切断活性[一本鎖又は二本鎖切断活性]を有するであろう)。予測される標的部位でのインデルの存在についての試験は、例えば、DNAシークエンシング法を介して又は標的配列の機能の消失についてアッセイすることによってインデル形成を推測することによって行われるであろう。別の例において、Casタンパク質活性は、標的部位又はその近傍の配列に相同な配列を含むドナーDNAが提供された宿主細胞/生物体において、Casタンパク質及び好適なRNA成分を発現させることによって決定され得る。標的部位でのドナーDNA配列(例えば、ドナーと標的配列との正常なHRによって予測されることになるもの)の存在は、ターゲティングが発生したことを示すであろう。
本明細書におけるCasエンドヌクレアーゼの非限定的な例は、以下の属のいずれかに由来するCasエンドヌクレアーゼであり得る:アエロピルム(Aeropyrum)、ピロバクルム(Pyrobaculum)、スルホロブス(Sulfolobus)、アーキオグロブス(Archaeoglobus)、ハロアーキュラ(Haloarcula)、メタノバクテリウム(Methanobacteriumn)、メタノコッカス(Methanococcus)、メタノサルシナ(Methanosarcina)、メタノパイラス(Methanopyrus)、ピロコッカス(Pyrococcus)、ピクロフィラス(Picrophilus)、テルモプラズマ(Thernioplasnia)、コリネバクテリウム(Corynebacterium)、マイコバクテリウム(Mycobacterium)、ストレプトマイセス(Streptomyces)、アクウィフェクス(Aquifrx)、ポルフィロモナス(Porphvromonas)、クロロビウム(Chlorobium)、サーマス(Thermus)、バチルス(Bacillus)、リステリア(Listeria)、スタフィロコッカス(Staphylococcus)、クロストリジウム(Clostridium)、サーモアナエロバクター(Thermoanaerobacter)、マイコプラズマ(Mycoplasma)、フソバクテリウム(Fusobacterium)、アゾアルカス(Azarcus)、クロモバクテリウム(Chromobacterium)、ナイセリア(Neisseria)、ニトロソモナス(Nitrosomonas)、デスルホビブリオ(Desulfovibrio)、ゲオバクター(Geobacter)、ミロコッカス(Myrococcus)、キャンピロバクター(Campylobacter)、ウォリネラ(Wolinella)、アシネトバクター(Acinetobacter)、エルウィニア(Erwinia)、エシェリキア(Escherichia)、レジオネラ(Legionella)、メチロコッカス(Methylococcus)、パスツレラ(Pasteurella)、フォトバクテリウム(Photobacterium)、サルモネラ(Salmonella)、キサントモナス(Xanthomonas)、エルシニア(Yersinia)、ストレプトコッカス(Streptococcus)、トレポネーマ(Treponema)、フランシセラ(Francisella)又はサーモトガ(Thermotoga)。さらに、本明細書におけるCasエンドヌクレアーゼは、例えば、参照により本明細書に組み込まれる米国特許出願公開第2010/0093617号明細書において開示されるとおりの配列番号462~465、467~472、474~477、479~487、489~492、494~497、499~503、505~508、510~516又は517~521のいずれかによってコードされ得る。
さらに、本明細書におけるCas9エンドヌクレアーゼは、例えば、ストレプトコッカス(Streptococcus)属(例えば、S.ピオゲネス(S.pyogenes)、S.ニューモニエ(S.pneumoniae)、S.サーモフィルス(S.thermophilus)、S.アガラクティエ(S.agalactiae)、S.パラサングイニス(S.parasanguinis)、S.オラリス(S.oralis)、S.サリバリウス(S.salivarius)、S.マカカエ(S.macacae)、S.ディスガラクティエ(S.dysgalactiae)、S.アンギノサス(S.anginosus)、S.コンステラトゥス(S.constellatus)、S.シュードポルシヌス(S.pseudoporcinus)、S.ミュータンス(S.mutans))、リステリア(Listeria)属(例えば、L.イノキュア(L.innocua))、スピロプラズマ(Spiroplasma)属(例えば、S.アピス(S.apis)、S.シルフィディコーラ(S.syrphidicola))、ペプトストレプトコッカス科(Peptostreptococcaceae)、アトポビウム(Atopobium)属、ポルフィロモナス(Porphyromonas)属(例えば、P.カトニエ(P.catoniae))、プレボテーラ(Prevotella)属(例えば、P.インターメディア(P.intermedia))、ベイロネラ(Veillonella)属、トレポネーマ(Treponema)属(例えば、T.ソクランスキィ(T.socranskii)、T.デンティコラ(T.denticola))、カプノシトファガ(Capnocytophaga)属、フィネゴルディア(Finegoldia)属(例えば、F.マグナ(F.magna))、コリオバクテリア(Coriobacteriaceae)科(例えばC.バクテリウム(C.bacterium))、オルセネラ(Olsenella)属(例えば、O.プロフューザ(O.profusa))、ヘモフィルス(Haemophilus)属(例えば、H.スプトルム(H.sputorum)、H.ピットマニエ(H.pittmaniae))、パスツレラ(Pasteurella)属(例えば、P.ベッティエ(P.bettyae))、オリビバクター(Olivibacter)属(例えば、O.シティエンシス(O.sitiensis))、エピリソニモナス(Epilithonimonas)属(例えばE.テナックス(E.tenax))、メソニア(Mesonia)属(例えば、M.モビリス(M.mobilis))、ラクトバシラス(Lactobacillus)属(例えば、L.プランタルム(L.plantarum))、バチルス(Bacillus)属(例えばB.セレウス(B.cereus))、アクイマリーナ(Aquimarina)属(例えば、A.ムエレリ(A.muelleri))、クリセオバクテリウム(Chryseobacterium)属(例えば、C.パルストレ(C.palustre))、バクテロイデス(Bacteroides)属(例えば、B.グラミニソルベンス(B.graminisolvens))、ナイセリア(Neisseria)属(例えば、N.メニンギティディス(N.meningitidis))、フランシセラ(Francisella)属(例えば、F.ノビシダ(F.novicida))又はフラボバクテリウム(Flavobacterium)属(例えば、F.フリギダリウム(F.frigidarium)、F.ソリ(F.soli))種に由来し得る。一態様では、S.ピオゲネス(S.pyogenes)のCas9エンドヌクレアーゼが本明細書に記載される。別の例として、Cas9エンドヌクレアーゼは、参照により本明細書に組み込まれるChylinski et al.(RNA Biology 10:726-737)において開示されるCas9タンパク質のいずれかであり得る。
したがって、本明細書におけるCas9エンドヌクレアーゼの配列は、例えば、参照により組み込まれるGenBankアクセッション番号G3ECR1(S.サーモフィルス(S.thermophilus))、WP_026709422、WP_027202655、WP_027318179、WP_027347504、WP_027376815、WP_027414302、WP_027821588、WP_027886314、WP_027963583、WP_028123848、WP_028298935、Q03JI6(S.サーモフィルス(S.thermophilus))、EGP66723、EGS38969、EGV05092、EHI65578(S.シュードポルシヌス(S.pseudoporcinus))、EIC75614(S.オラリス(S.oralis))、EID22027(S.コンステラツス(S.constellatus))、EIJ69711、EJP22331(S.オラリス(S.oralis))、EJP26004(S.アンギノサス(S.anginosus))、EJP30321、EPZ44001(S.ピオゲネス(S.pyogenes))、EPZ46028(S.ピオゲネス(S.pyogenes))、EQL78043(S.ピオゲネス(S.pyogenes))、EQL78548(S.ピオゲネス(S.pyogenes))、ERL10511、ERL12345、ERL19088(S.ピオゲネス(S.pyogenes))、ESA57807(S.ピオゲネス(S.pyogenes))、ESA59254(S.ピオゲネス(S.pyogenes))、ESU85303(S.ピオゲネス(S.pyogenes))、ETS96804、UC75522、EGR87316(S.ディスガラクトシエ(S.dysgalactiae))、EGS33732、EGV01468(S.オラリス(S.oralis))、EHJ52063(S.マカカエ(S.macacae))、EID26207(S.オラリス(S.oralis))、EID33364、EIG27013(S.パラサングイニス(S.parasanguinis))、EJF37476、EJO19166(ストレプトコッカス属(Streptococcus sp.)BS35b)、EJU16049、EJU32481、YP_006298249、ERF61304、ERK04546、ETJ95568(S.アガラクティエ(S.agalactiae))、TS89875、ETS90967(ストレプトコッカス属(Streptococcus sp.)SR4)、ETS92439、EUB27844(ストレプトコッカス属(Streptococcus sp.)BS21)、AFJ08616、EUC82735(ストレプトコッカス属(Streptococcus sp.)CM6)、EWC92088、EWC94390、EJP25691、YP_008027038、YP_008868573、AGM26527、AHK22391、AHB36273、Q927P4、G3ECR1又はQ99ZW2(S.ピオゲネス(S.pyogenes))に開示されるCas9アミノ酸配列のいずれかを含むことができる。代わりに、本明細書におけるCas9タンパク質は、例えば、米国特許出願公開第2010/0093617号明細書(参照により本明細書に組み込まれる)に開示されるとおりの配列番号462(S.サーモフィルス(S.thermophilus))、474(S.サーモフィルス(S.thermophilus))、489(S.アガラクティエ(S.agalactiae))、494(S.アガラクティエ(S.agalactiae))、499(S.ミュータンス(S.mutans))、505(S.ピオゲネス(S.pyogenes))又は518(S.ピオゲネス(S.pyogenes))のいずれかによってコードされ得る。
あるアミノ酸が、互いに類似した構造的特徴及び/又は電荷の特徴を共有する(すなわち保存されている)ならば、Cas9中の各位置のアミノ酸は、開示される配列に与えられるそのものであるか、又は以下のとおりに保存アミノ酸残基で置換され得る(「保存的アミノ酸置換」):
1.以下の小さい脂肪族の非極性又は弱極性の残基は、相互に置換することができる:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);
2.以下の極性の負電荷を有する残基及びそれらのアミドは、相互に置換することができる:Asp(D)、Asn(N)、Glu(E)、Gln(Q);
3.以下の極性の正電荷を有する残基は、相互に置換することができる:His(H)、Arg(R)、Lys(K);
4.以下の脂肪族の非極性残基は、相互に置換することができる:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);及び
5.以下の大きい芳香族残基は、相互に置換することができる:Phe(F)、Tyr(Y)、Trp(W)。
1.以下の小さい脂肪族の非極性又は弱極性の残基は、相互に置換することができる:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);
2.以下の極性の負電荷を有する残基及びそれらのアミドは、相互に置換することができる:Asp(D)、Asn(N)、Glu(E)、Gln(Q);
3.以下の極性の正電荷を有する残基は、相互に置換することができる:His(H)、Arg(R)、Lys(K);
4.以下の脂肪族の非極性残基は、相互に置換することができる:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);及び
5.以下の大きい芳香族残基は、相互に置換することができる:Phe(F)、Tyr(Y)、Trp(W)。
断片及びバリアントは、部位特異的変異誘発法及び合成的構築などの方法により得ることができる。エンドヌクレアーゼ活性を測定するための方法は、当技術分野でよく知られており、参照により本明細書に組み込まれる2013年5月1日に出願されたPCT/米国特許出願公開第13/39011号明細書、2016年5月12日に出願されたPCT/米国特許出願公開第16/32073号明細書、2016年5月12日に出願されたPCT/米国特許出願公開第16/32028号明細書などであるが、これらに限定されない。
Casエンドヌクレアーゼは、Casポリペプチドの改変形態を含むことができる。Casポリペプチドの改変形態としては、Casタンパク質の自然に存在するヌクレアーゼ活性を低下させるアミノ酸変化(例えば、欠失、挿入又は置換)を挙げることができる。例えば、いくつかの例では、Casタンパク質の改変形態は、対応する野生型Casポリペプチドの50%未満、40%未満、30%未満、20%未満、10%未満、5%未満又は1%未満のヌクレアーゼ活性を有する(2014年3月6日に公開された米国特許出願公開第20140068797A1号明細書)。いくつかの例では、Casポリペプチドの改変形態は、ヌクレアーゼ活性を実質的に有さず、触媒的に「不活化されたCas」又は「失活したCas(dCas)」と呼ばれる。不活化されたCas/失活したCasは、失活したCasエンドヌクレアーゼ(dCas)を含む。触媒的に不活性なCasは、異種配列に融合され得る。他のCas9バリアントは、HNH又はRuvCヌクレアーゼドメインのいずれかの活性を欠き、したがってDNAの1本の鎖のみを切断する能力がある(ニッカーゼバリアント)。
本明細書に記載されるCasエンドヌクレアーゼを発現する組換えDNAコンストラクトは、バチルス属(Bacillus sp.)細胞に一過的に組み込まれ得るか、又はバチルス属(Bacillus sp.)細胞のゲノムに安定に組み込まれ得る。
Casタンパク質融合物
Casエンドヌクレアーゼは、1つ以上の異種タンパク質ドメイン(例えば、Casポリペプチドに加えて、1つ、2つ、3つ又はそれを超えるドメイン)を含む融合タンパク質の一部であり得る。そのような融合タンパク質は、任意のさらなるタンパク質配列及び任意選択により任意の2つのドメイン間、例えばCasポリペプチドと第1の異種ドメインとの間にリンカー配列を含み得る。Casポリペプチドに融合され得るタンパク質ドメインの例としては、エピトープタグ(例えば、ヒスチジン[His]、V5、FLAG、インフルエンザ赤血球凝集素[HA]、myc、VSV-G、チオレドキシン[Trx])、レポーター(例えば、グルタチオン-5-トランスフェラーゼ[GST]、西洋ワサビペルオキシダーゼ[HRP]、クロラムフェニコールアセチルトランスフェラーゼ[CAT]、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ[GUS]、ルシフェラーゼ、緑色蛍光タンパク質[GFP]、HcRed、DsRed、シアン蛍光タンパク質[CFP]、黄色蛍光タンパク質[YFP]、青色蛍光タンパク質[BFP])及び以下の活性の1つ以上を有するドメインが挙げられるが、これらに限定されない:メチル化酵素活性、脱メチル化酵素活性、転写活性化活性(例えば、VP16又はVP64)、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性及び核酸結合活性。Casエンドヌクレアーゼは、DNA分子又は他の分子、例えばマルトース結合タンパク質(MBP)、S-タグ、Lex A DNA結合ドメイン(DBD)、GAL4A DNA結合ドメイン及び単純ヘルペスウィルス(HSV)VP16と結合するタンパク質との融合物中にも存在し得る。
Casエンドヌクレアーゼは、1つ以上の異種タンパク質ドメイン(例えば、Casポリペプチドに加えて、1つ、2つ、3つ又はそれを超えるドメイン)を含む融合タンパク質の一部であり得る。そのような融合タンパク質は、任意のさらなるタンパク質配列及び任意選択により任意の2つのドメイン間、例えばCasポリペプチドと第1の異種ドメインとの間にリンカー配列を含み得る。Casポリペプチドに融合され得るタンパク質ドメインの例としては、エピトープタグ(例えば、ヒスチジン[His]、V5、FLAG、インフルエンザ赤血球凝集素[HA]、myc、VSV-G、チオレドキシン[Trx])、レポーター(例えば、グルタチオン-5-トランスフェラーゼ[GST]、西洋ワサビペルオキシダーゼ[HRP]、クロラムフェニコールアセチルトランスフェラーゼ[CAT]、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ[GUS]、ルシフェラーゼ、緑色蛍光タンパク質[GFP]、HcRed、DsRed、シアン蛍光タンパク質[CFP]、黄色蛍光タンパク質[YFP]、青色蛍光タンパク質[BFP])及び以下の活性の1つ以上を有するドメインが挙げられるが、これらに限定されない:メチル化酵素活性、脱メチル化酵素活性、転写活性化活性(例えば、VP16又はVP64)、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性及び核酸結合活性。Casエンドヌクレアーゼは、DNA分子又は他の分子、例えばマルトース結合タンパク質(MBP)、S-タグ、Lex A DNA結合ドメイン(DBD)、GAL4A DNA結合ドメイン及び単純ヘルペスウィルス(HSV)VP16と結合するタンパク質との融合物中にも存在し得る。
Casエンドヌクレアーゼは、核移行配列(NLS)などの異種調節エレメントを含み得る。異種NLSアミノ酸配列は、本明細書における細胞の核内で検出可能な量のCasエンドヌクレアーゼの蓄積を駆動するのに十分な強度のものであり得る。NLSは、塩基性の、正の荷電を有する残基(例えば、リジン及び/又はアルギニン)の1つ(例えば、単節型)又は複数(例えば、双節型)の短い配列(例えば、2~20残基)を含み得、タンパク質表面上に曝されるのであれば、Casアミノ酸配列中のいずれの箇所にも配置され得る。NLSは、例えば、本明細書におけるCasタンパク質のN末端又はC末端に作動可能に連結され得る。例えば、2つ以上のNLS配列がCasタンパク質、例えばCasタンパク質のN末端及びC末端に連結され得る。Cas遺伝子は、Casコドン領域の上流のSV40核標的シグナル及びCasコドン領域の下流の双節型VirD2核移行シグナル(Tinland et al.(1992)Proc.Natl.Acad.Sci.USA 89:7442-6)に作動可能に連結され得る。本明細書における好適なNLS配列の非限定的な例としては、米国特許第6660830号明細書及び同第7309576号明細書に開示されるものが挙げられる(これらの文献は、いずれも参照により本明細書に組み込まれる)。異種NLSアミノ酸配列は、植物、ウイルス及び哺乳動物核移行シグナルを含む。
触媒的活性及び/又は不活性Casエンドヌクレアーゼは、異種配列に融合することができる(2014年3月6日に公開された米国特許出願公開第20140068797A1号明細書)。好適な融合パートナーとしては、限定はされないが、標的DNA又は標的DNAに関連するポリペプチド(例えば、ヒストン又は他のDNA結合性タンパク質)に直接的に作用することにより、転写を間接的に増加させる活性をもたらすポリペプチドが挙げられる。さらなる好適な融合パートナーとしては、限定はされないが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホフファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性又は脱ミリストイル化活性をもたらすポリペプチドが挙げられる。さらなる好適な融合パートナーとしては、限定はされないが、標的核酸の転写増加を直接的にもたらすポリペプチド(例えば、転写活性化因子又はその断片、転写活性化因子、小分子/薬剤反応性転写調節因子などをリクルートするタンパク質又はその断片)が挙げられる。触媒的に不活性なCas9エンドヌクレアーゼは、二本鎖切断を生成するFokIヌクレアーゼに融合することもできる(Guilinger et al.Nature biotechnology,volume 32,number 6,June 2014)。
ガイドポリヌクレオチド、ガイドRNA
本明細書で使用する場合、用語「ガイドポリヌクレオチド」は、Casエンドヌクレアーゼと複合体を形成することができ、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断することを可能にするポリヌクレオチド配列に関する。ガイドポリヌクレオチドは、一本鎖分子又は二本鎖分子であり得る。ガイドポリヌクレオチド配列は、RNA配列、DNA配列又はこれらの組合せ(RNA-DNA組合せ配列)であり得る。任意選択により、ガイドポリヌクレオチドは、ロックド核酸(LNA)、5-メチルdC、2,6-ジアミノプリン、2’-フルオロA、2’-フルオロU、2’-O-メチルRNA、ホスホロチオエート結合、コレステロール分子との結合、ポリエチレングリコール分子との結合、スペーサー18(ヘキサエチレングリコール鎖)分子との結合又は環化をもたらす5’から3’への共有結合などであるが、これらに限定されない少なくとも1つのヌクレオチド、ホスホジエステル結合又は結合修飾を含み得る。リボ核酸のみを含むガイドポリヌクレオチドは、「ガイドRNA」又は「gRNA」とも呼ばれる。
本明細書で使用する場合、用語「ガイドポリヌクレオチド」は、Casエンドヌクレアーゼと複合体を形成することができ、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断することを可能にするポリヌクレオチド配列に関する。ガイドポリヌクレオチドは、一本鎖分子又は二本鎖分子であり得る。ガイドポリヌクレオチド配列は、RNA配列、DNA配列又はこれらの組合せ(RNA-DNA組合せ配列)であり得る。任意選択により、ガイドポリヌクレオチドは、ロックド核酸(LNA)、5-メチルdC、2,6-ジアミノプリン、2’-フルオロA、2’-フルオロU、2’-O-メチルRNA、ホスホロチオエート結合、コレステロール分子との結合、ポリエチレングリコール分子との結合、スペーサー18(ヘキサエチレングリコール鎖)分子との結合又は環化をもたらす5’から3’への共有結合などであるが、これらに限定されない少なくとも1つのヌクレオチド、ホスホジエステル結合又は結合修飾を含み得る。リボ核酸のみを含むガイドポリヌクレオチドは、「ガイドRNA」又は「gRNA」とも呼ばれる。
ガイドポリヌクレオチドは、crヌクレオチド配列及びtracrヌクレオチド配列を含む二本鎖分子(二本鎖ガイドポリヌクレオチドとも呼ばれる)であり得る。crヌクレオチドは、標的DNA中のヌクレオチド配列にハイブリダイズすることができる第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)及びCasエンドヌクレアーゼ認識(CER)ドメインの一部である第2のヌクレオチド配列(tracrメイト配列とも呼ばれる)を含む。tracrメイト配列は、相補性領域に沿ってtracrヌクレオチド配列にハイブリダイズすることができ、Casエンドヌクレアーゼ認識ドメイン又はCERドメインを一緒に形成することができる。CERドメインは、Casエンドヌクレアーゼポリペプチドと相互作用することができる。二本鎖ガイドポリヌクレオチドのcrヌクレオチド及びtracrヌクレオチドは、RNA、DNA及び/又はRNA-DNA組合せ配列であり得る。(両方とも参照により本明細書に組み込まれる2015年3月19日に公開された米国特許出願公開第20150082478号明細書及び2015年2月26日に公開された米国特許出願公開第20150059010号明細書)。いくつかの実施形態では、二本鎖ガイドポリヌクレオチドのcrヌクレオチド分子は、(連続的な一続きのDNAヌクレオチドで構成される場合)「crDNA」と称されるか、(連続的な一続きのRNAヌクレオチドで構成される場合)「crRNA」と称されるか、又は(DNAヌクレオチドとRNAヌクレオチドとの組合せで構成される場合)「crDNA-RNA」と称される。crヌクレオチドは、細菌及び古細菌中に天然に存在するcrRNAの断片を含むことができる。本明細書で開示されるcrヌクレオチド中に存在し得る細菌及び古細菌中に天然に存在するcrRNAの断片のサイズは、限定されないが、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個又はより多くのヌクレオチドの範囲であり得る。いくつかの実施形態では、tracrヌクレオチドは、(連続的な一続きのRNAヌクレオチドで構成される場合)「tracrRNA」と称されるか、(連続的な一続きのDNAヌクレオチドで構成される場合)「tracrDNA」と称されるか、又は(DNAヌクレオチドとRNAヌクレオチドとの組合せで構成される場合)「tracrDNA-RNA」と称される。特定の実施形態では、RNA/Cas9エンドヌクレアーゼ複合体を誘導するRNAは、二本鎖crRNA-tracrRNAを含む二本鎖RNAである。
ガイドポリヌクレオチドは、少なくとも1つのtracrRNAに(非共有結合的に)連結された天然に存在しないキメラcrRNAを含む二重RNA分子を含む。天然に存在しないキメラcrRNAは、天然には一緒に見出されない領域を含むcrRNAを含む(すなわち、それらは、互いに異種である)。例えば、天然に存在しないcrRNAは、天然に存在するスペーサー配列が異種の可変ターゲティングドメインについて交換されるcrRNAである。天然に存在しないcrRNAは、第2のヌクレオチド配列(tracrメイト配列とも呼ばれる)に連結された、標的DNA中のヌクレオチド配列にハイブリダイズすることができる第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)を含み、その結果、第1の配列と第2の配列とは、天然には一緒に連結されて見出されない。
ガイドポリヌクレオチドは、tracrヌクレオチド配列に連結したcrヌクレオチド配列を含む単一分子(シングルガイドポリヌクレオチドとも呼ばれる)でもあり得る。シングルガイドポリヌクレオチドは、標的DNA中のヌクレオチド配列にハイブリダイズすることができる第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)及びCasエンドヌクレアーゼポリペプチドと相互作用するCasエンドヌクレアーゼ認識ドメイン(CERドメイン)を含む。「ドメイン」は、RNA、DNA及び/又はRNA-DNA組合せ配列であり得る連続的な一続きのヌクレオチドを意味する。シングルガイドポリヌクレオチドのVTドメイン及び/又はCERドメインは、RNA配列、DNA配列又はRNA-DNA組合せ配列を含み得る。crヌクレオチド及びtracrヌクレオチド由来の配列で構成されているシングルガイドポリヌクレオチドは、(連続的な一続きのRNAヌクレオチドで構成される場合)「シングルガイドRNA」又は(連続的な一続きのDNAヌクレオチドで構成される場合)「シングルガイドDNA」又は(RNA及びDNAヌクレオチドの組合せで構成される場合)「シングルガイドRNA-DNA」と称され得る。シングルガイドポリヌクレオチドは、Casエンドヌクレアーゼと複合体を形成することができ、前記ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体(ガイドポリヌクレオチド/Casエンドヌクレアーゼ系とも呼ばれる)は、Casエンドヌクレアーゼをゲノム標的部位に導くことができ、Casエンドヌクレアーゼがその標的部位を認識し、標的部位に結合し、且つ任意選択により標的部位に切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)ことを可能にする。
用語「可変ターゲティングドメイン」又は「VTドメイン」は、本明細書では互換的に使用され、二本鎖DNA標的部位の1本の鎖(ヌクレオチド配列)にハイブリダイズできる(相補的である)ヌクレオチド配列を含む。第1のヌクレオチド配列ドメイン(VTドメイン)と標的配列との間の%相補性は、少なくとも50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%であり得る。可変ターゲティングドメインの長さは、少なくとも12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29又は30ヌクレオチドであり得る。
可変ターゲティングドメインは、連続的な一続きの12~30、12~29、12~28、12~27、12~26、12~25、12~26、12~25、12~24、12~23、12~22、12~21、12~20、12~19、12~18、12~17、12~16、12~15、12~14、12~13、13~30、13~29、13~28、13~27、13~26、13~25、13~26、13~25、13~24、13~23、13~22、13~21、13~20、13~19、13~18、13~17、13~16、13~15、13~14、14~30、14~29、14~28、14~27、14~26、14~25、14~26、14~25、14~24、14~23、14~22、14~21、14~20、14~19、14~18、14~17、14~16、14~15、15~30、15~29、15~28、15~27、15~26、15~25、15~26、15~25、15~24、15~23、15~22、15~21、15~20、15~19、15~18、15~17、15~16、16~30、16~29、16~28、16~27、16~26、16~25、16~24、16~23、16~22、16~21、16~20、16~19、16~18、16~17、17~30、17~29、17~28、17~27、17~26、17~25、17~24、17~23、17~22、17~21、17~20、17~19、17~18、18~30、18~29、18~28、18~27、18~26、18~25、18~24、18~23、18~22、18~21、18~20、18~19、19~30、19~29、19~28、19~27、19~26、19~25、19~24、19~23、19~22、19~21、19~20、20~30、20~29、20~28、20~27、20~26、20~25、20~24、20~23、20~22、20~21、21~30、21~29、21~28、21~27、21~26、21~25、21~24、21~23、21~22、22~30、22~29、22~28、22~27、22~26、22~25、22~24、22~23、23~30、23~29、23~28、23~27、23~26、23~25、23~24、24~30、24~29、24~28、24~27、24~26、24~25、25~30、25~29、25~28、25~27、25~26、26~30、26~29、26~28、26~27、27~30、27~29、27~28、28~30、28~29又は29~30個のヌクレオチドを含み得る。
可変ターゲティングドメインは、DNA配列、RNA配列、改変DNA配列、改変RNA配列又はこれらの任意の組合せで構成され得る。VTドメインは、原核生物又は真核生物DNAに由来する標的配列に相補的であり得る。
用語(ガイドポリヌクレオチドの)「Casエンドヌクレアーゼ認識ドメイン」又は「CERドメイン」は、本明細書では互換的に使用され、Casエンドヌクレアーゼポリペプチドと相互作用するヌクレオチド配列を含む。CERドメインは、tracrヌクレオチドメイト配列を含み、その後にtracrヌクレオチド配列が続く。CERドメインは、DNA配列、RNA配列、改変DNA配列、改変RNA配列(例えば、2015年2月26日に公開された米国特許出願公開第2015-0059010A1号明細書(全体として参照により本明細書に組み込まれる)を参照されたい)又はこれらの任意の組合せで構成され得る。
シングルガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列は、RNA配列、DNA配列又はRNA-DNA組合せ配列を含むことができる。一実施形態では、シングルガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列(「ループ」とも呼ばれる)は、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99又は100個のヌクレオチド長であり得る。ループは、3~4、3~5、3~6、3~7、3~8、3~9、3~10、3~11、3~12、3~13、3~14、3~15、3~20、3~30、3~40、3~50、3~60、3~70、3~80、3~90、3~100、4~5、4~6、4~7、4~8、4~9、4~10、4~11、4~12、4~13、4~14、4~15、4~20、4~30、4~40、4~50、4~60、4~70、4~80、4~90、4~100、5~6、5~7、5~8、5~9、5~10、5~11、5~12、5~13、5~14、5~15、5~20、5~30、5~40、5~50、5~60、5~70、5~80、5~90、5~100、6~7、6~8、6~9、6~10、6~11、6~12、6~13、6~14、6~15、6~20、6~30、6~40、6~50、6~60、6~70、6~80、6~90、6~100、7~8、7~9、7~10、7~11、7~12、7~13、7~14、7~15、7~20、7~30、7~40、7~50、7~60、7~70、7~80、7~90、7~100、8~9、8~10、8~11、8~12、8~13、8~14、8~15、8~20、8~30、8~40、8~50、8~60、8~70、8~80、8~90、8~100、9~10、9~11、9~12、9~13、9~14、9~15、9~20、9~30、9~40、9~50、9~60、9~70、9~80、9~90、9~100、10~20、20~30、30~40、40~50、50~60、70~80、80~90又は90~100ヌクレオチド長であり得る。
別の態様では、シングルガイドポリヌクレオチドのcrヌクレオチドとtracrヌクレオチドとを連結するヌクレオチド配列は、限定はされないが、GAAAテトラループ配列などのテトラループ配列を含み得る。
シングルガイドポリヌクレオチドは、天然に存在しないキメラシングルガイドRNAを含む。用語「シングルガイドRNA」及び「sgRNA」は、本明細書では互換的に使用され、tracrRNA(トランス活性化CRISPR RNA)に融合した(tracrRNAにハイブリダイズするtracrメイト配列に連結した)可変ターゲティングドメインを含むcrRNA(CRISPR RNA)である2つのRNA分子の合成融合に関する。天然に存在しないキメラガイドRNAは、天然には一緒に見出されない領域を含む(すなわち、それらは、互いに異種である)。例えば、天然に存在しないキメラガイドRNAは、Casエンドヌクレアーゼを認識することができる第2のヌクレオチド配列に連結された、標的DNA中のヌクレオチド配列にハイブリダイズすることができる第1のヌクレオチド配列ドメイン(可変ターゲティングドメイン又はVTドメインと呼ばれる)を含み、その結果、第1のヌクレオチド配列と第2のヌクレオチド配列とは、天然には一緒に連結されて見出されない。
天然に存在しないキメラガイドRNAは、II型Casエンドヌクレアーゼと複合体を形成することができるII型CRISPR/Cas系のcrRNA又は及びtracrRNAを含み得、前記ガイドRNA/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に導くことができ、CasエンドヌクレアーゼがそのDNA標的部位を認識し、それに結合し、且つ任意選択によりそれに切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)ことを可能にする。
ガイドポリヌクレオチドは、ガイドポリヌクレオチドを化学的に合成すること(以下に限定されないが、Hendel et al.2015,Nature Biotechnology 33,985-989など)、ガイドポリヌクレオチドのインビトロでの生成及び/又はガイドRNAの自己スプライシング(以下に限定されないが、Xie et al.,2015,PNAS 112:3570-3575など)を含む、当技術分野で知られる任意の方法によって作製され得る。
Cas9に媒介されるDNAターゲティングを実施するための原核細胞におけるガイドRNAなどのRNA成分を発現する方法が記載されている(2016年6月23日に公開された国際公開第2016/099887号パンフレット及び2018年8月30日に公開された国際公開第2018/156705号パンフレット)。
いくつかの態様では、対象の核酸(例えば、ガイドポリヌクレオチド、ガイドポリヌクレオチドをコードするヌクレオチド配列を含む核酸;Casタンパク質をコードする核酸;crRNA又はcrRNAをコードするヌクレオチド、tracrRNA又はtracrRNAをコードするヌクレオチド、VTドメインをコードするヌクレオチド、CPRドメインをコードするヌクレオチドなど)は、追加の望ましい特徴(例えば、修飾されたか又は調節された安定性;細胞内ターゲティング;トラッキング、例えば蛍光ラベル;タンパク質又はタンパク質複合体のための結合部位など)を備える修飾又は配列を含む。ガイドポリヌクレオチド、VTドメイン及び/又はCERドメインのヌクレオチド配列修飾は、5’キャップ、3’ポリアデニル化テイル、リボスイッチ配列、安定性制御配列、dsRNA二本鎖を形成する配列、ガイドポリヌクレオチドを細胞内位置にターゲティングする修飾若しくは配列、トラッキングを提供する修飾若しくは配列、タンパク質のための結合部位を提供する修飾若しくは配列、ロックド核酸(LNA)、5-メチルdCヌクレオチド、2,6-ジアミノプリンヌクレオチド、2’-フルオロAヌクレオチド、2’-フルオロUヌクレオチド;2’-O-メチルRNAヌクレオチド、ホスホロチオエート結合、コレステロール分子への結合、ポリエチレングリコール分子への結合、スペーサー18分子への結合、5’から3’への共有結合又はこれらの任意の組合せからなる群から選択することができるが、これらに限定されない。これらの修飾は、少なくとも1種の追加の有益な特徴をもたらすことができ、ここで、この追加の有益な特徴は、修飾若しくは調節された安定性、細胞内ターゲティング、トラッキング、蛍光標識、タンパク質若しくはタンパク質複合体のための結合部位、相補的標的配列に対する修飾された結合親和性、細胞分解に対する修飾耐性及び増加した細胞透過性の群から選択される。
誘導型Cas系
用語「ガイドRNA/Casエンドヌクレアーゼ複合体」、「ガイドRNA/Casエンドヌクレアーゼ系」、「ガイドRNA/Cas複合体」、「ガイドRNA/Cas系」、「gRNA/Cas複合体」、「gRNA/Cas系」、「RNA誘導型エンドヌクレアーゼ」、「RGEN」は、本明細書では互換的に使用され、複合体を形成することができる少なくとも1つのRNA成分及び少なくとも1つのCasエンドヌクレアーゼを指し、ここで、前記ガイドRNA/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に導くことができ、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)ことを可能にする。
用語「ガイドRNA/Casエンドヌクレアーゼ複合体」、「ガイドRNA/Casエンドヌクレアーゼ系」、「ガイドRNA/Cas複合体」、「ガイドRNA/Cas系」、「gRNA/Cas複合体」、「gRNA/Cas系」、「RNA誘導型エンドヌクレアーゼ」、「RGEN」は、本明細書では互換的に使用され、複合体を形成することができる少なくとも1つのRNA成分及び少なくとも1つのCasエンドヌクレアーゼを指し、ここで、前記ガイドRNA/Casエンドヌクレアーゼ複合体は、CasエンドヌクレアーゼをDNA標的部位に導くことができ、CasエンドヌクレアーゼがDNA標的部位を認識し、それに結合し、且つ任意選択により切れ目を入れるか又は切断する(一本鎖又は二本鎖切断を導入する)ことを可能にする。
本開示は、バチルス属(Bacillus sp.)細胞において、標的配列の全て又は一部を認識し、それに結合し、且つ任意選択により切れ目を入れるか、ほどくか、又は切断することができるガイドRNA/Cas系を発現させるための発現コンストラクトをさらに提供する。
発現カセット及び組換えDNAコンストラクト
目的のポリヌクレオチド、目的の合成配列、目的の異種配列、目的の同種配列、目的の遺伝子などの本明細書で開示されるポリヌクレオチドは、目的の生物体における発現のための発現カセット(DNAコンストラクトとも呼ばれる)において提供され得る。
目的のポリヌクレオチド、目的の合成配列、目的の異種配列、目的の同種配列、目的の遺伝子などの本明細書で開示されるポリヌクレオチドは、目的の生物体における発現のための発現カセット(DNAコンストラクトとも呼ばれる)において提供され得る。
本明細書で使用する場合、用語「発現」は、前駆体又は成熟形態のいずれかにおける機能的な最終産物(例えば、crRNA、tracrRNA、mRNA、ガイドRNA、sRNA、siRNA、アンチセンスRNA又はポリペプチド(タンパク質))の産生を指す。用語「発現」は、以下に限定されないが、転写、転写後修飾、翻訳、翻訳後修飾及び分泌を含むポリペプチドの産生に関与する任意の段階を含む。
発現カセットは、5’及び3’調節配列並びに又は本明細書で開示されるとおりのポリヌクレオチドに作動可能に連結されたタグ及び合成配列を含み得る。
本明細書で開示される発現カセットは、バチルス属(Bacillus sp.)(宿主)細胞において機能する転写、転写及び翻訳開始領域(すなわちプロモーター)、5’非翻訳領域、様々なタンパク質タグ及び配列をコードするポリヌクレオチド、目的のポリヌクレオチド並びに転写及び翻訳終結領域(すなわち終結領域)を5’-3’方向に含み得る。発現カセットは、本明細書の別の箇所で記載される調節領域の転写調節下にあるポリヌクレオチドの挿入のための複数の制限部位及び/又は組換え部位と一緒にも提供される。調節領域(すなわちプロモーター、転写調節領域及び翻訳終結領域)及び/又は目的のポリヌクレオチドは、宿主細胞に対して又は互いに天然/類似のものであり得る。様々なタンパク質配列をコードする他のポリヌクレオチド配列は、目的のポリヌクレオチドの5’又は3’末端のいずれかに付加され得る。代わりに、調節領域及び/又は目的のポリヌクレオチドは、宿主細胞に対して又は互いに異種であり得る。
特定の実施形態では、本明細書で開示されるポリヌクレオチドは、本明細書の別の箇所で開示されるか又は当技術分野において知られるとおりの目的のポリヌクレオチド配列又は発現カセットの任意の組合せとともに積み重ねられ得る。積み重ねられたポリヌクレオチドは、最初のポリヌクレオチドと同じプロモーターに作動可能に連結され得るか、又は別々のプロモーターポリヌクレオチドに作動可能に連結され得る。
発現カセットは、対応する終結領域とともに目的のポリヌクレオチドに作動可能に連結されたプロモーターを含み得る。終結領域は、転写開始領域に対して天然のものであるか、作動可能に連結された目的のポリヌクレオチド若しくはプロモーター配列に対して天然のものであるか、宿主生物体に対して天然のものであるか、又は別の供給源(すなわち外来若しくは異種)に由来し得る。従来の終結領域は、ファージ配列、例えばラムダファージt0終結領域又は原核生物リボソームRNAオペロン若しくは細胞外タンパク質の分泌に関与する遺伝子(例えば、B.サブチリス(B.subtilis)由来のaprE、B.リケニフォルミス(B.licheniformis)由来のaprL)由来の強力なターミネーターから入手可能である。適切な終結領域は、オクトピン合成酵素終結領域及びノパリン合成酵素終結領域などのA.ツメファシエンス(A.tumefaciens)のTi-プラスミドから入手可能である。また、Guerineau et al.(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon et al.(1991)Genes Dev.5:141-149;Mogen et al.(1990)Plant Cell 2:1261-1272;Munroe et al.(1990)Gene 91:151-158;Ballas et al.(1989)Nucleic Acids Res.17:7891-7903;及びJoshi et al.(1987)Nucleic Acids Res.15:9627-9639を参照されたい。
適切な場合、目的のポリヌクレオチドは、形質転換又はターゲティングされた生物体における発現を増加させるために最適化され得る。例えば、ポリヌクレオチドは、発現の向上に関して生物体に好ましいコドンを使用するために合成又は改変され得る。
細胞宿主中で遺伝子発現を増強するために、追加の配列改変が知られる。これらには、遺伝子発現に有害であり得る、疑似ポリアデニル化シグナルをコードする配列、エクソン-イントロンスプライス部位シグナルをコードする配列、トランスポゾン様リピートをコードする配列及び他のそのようなよく特徴付けられた配列の除去が含まれる。配列のG-C含有量は、宿主細胞中で発現される既知の遺伝子を参照することによって算出される、所与の細胞宿主の平均的なレベルに調節され得る。可能な場合、予想されるヘアピン二次mRNA構造を避けるように配列を改変する。
発現カセットは、5’リーダー配列をさらに含有し得る。そのようなリーダー配列は、翻訳又はRNA安定性のレベルを増強するように作用し得る。5’非翻訳領域と互換的に使用される5’リーダー配列は、バチルス・サブチリス(Bacillus subtilis)aprE遺伝子若しくはバチルス・リケニフォルミス(Bacillus licheniformis)amyL遺伝子又は任意の細菌リボソームタンパク質遺伝子に由来するものなど、よく知られ且つよく特徴付けられた細菌UTRから得られるであろう。翻訳リーダーは、当技術分野で既知であり、下記が挙げられる:ピコルナウイルスリーダー、例えばEMCVリーダー(脳心筋炎5’非コード領域)(Elroy-Stein,et al.(1989)Proc.Natl.Acad.Sci.USA 86:6126-6130);ポティウイルスリーダー、例えばTEVリーダー(タバコエッチウイルス)(Gallie et al.(1995)Gene 165(2):233-238)、MDMVリーダー(トウモロコシ萎縮モザイクウイルス)(Johnson et al.(1986)Virology 154:9-20)及びヒト免疫グロブリン重鎖結合タンパク質(BiP)(Macejak et al.(1991)Nature 353:90-94);アルファルファモザイクウイルスのコートタンパク質mRNA由来の非翻訳リーダー(AMV RNA 4)(Jobling et al.(1987)Nature 325:622-625);タバコモザイクウイルスリーダー(TMV)(Gallie et al.(1989)in Molecular Biology of RNA,ed.Cech(Liss,New York),pp.237-256);並びにトウモロコシ退緑斑紋ウイルスリーダー(MCMV)(Lommel et al.(1991)Virology 81:382-385)。また、Della-Cioppa et al.(1987)Plant Physiol.84:965-968も参照されたい。翻訳を増強することで知られている他の方法、例えばイントロンなども使用することができる。
発現カセットの調製において、様々なDNA断片が、適当な向きで、必要に応じて適当なリーディングフレームにおいてDNA配列を提供するように操作され得る。この目標に向かって、アダプター又はリンカーがDNA断片の結合に使用され得るか、又は適当な制限部位、不要なDNAの除去、制限部位の除去などを提供するための他の操作が行われ得る。この目的のために、インビトロの変異誘発、プライマー修復、制限、アニーリング、再置換、例えば移行及びトランスバージョンが行われ得る。
いくつかの実施形態では、ガイドRNA及び/又はCasタンパク質をコードするヌクレオチド配列は、制御エレメント、例えばプロモーターなどの転写制御エレメントに作動可能に連結される。転写制御エレメントは、真核細胞又は原核細胞(例えば、細菌又はバチルス属(Bacillus sp.)細胞)のいずれかにおいて機能的であり得る。
バチルス属(Bacillus sp.)細胞内での遺伝子の発現において使用するための好適な原核生物プロモーター(原核細胞において機能的なプロモーター)及びプロモーター配列領域、それらのオープンリーディングフレーム(ORF)並びに/又はそれらのバリアント配列の非限定的な例は、一般に当業者に知られている。本開示のプロモーター配列は、一般に、それらがバチルス属(Bacillus sp.)細胞(例えば、B.リケニフォルミス(B.licheniformis)細胞、B.サブチリス(B.subtilis)細胞など)において機能的であるように選択される。同様に、バチルス属(Bacillus sp.)細胞内での遺伝子発現を駆動するために有用なプロモーターとしては、バチルス・リケニフォルミス(Bacillus licheniformis)アミラーゼ遺伝子(amyL)のプロモーター、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)マルトース生成アミラーゼ遺伝子(amyM)のプロモーター、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)アミラーゼ(amyQ)のプロモーター、バチルス・サブチリス(Bacillus subtilis)xylA及びxylB遺伝子のプロモーター、バチルス・サブチリス(Bacillus subtilis)アルカリプロテアーゼ(aprE)プロモーター(Stahl et al.,1984)、バチルス・サブチリス(Bacillus subtilis)のα-アミラーゼプロモーター(Yang et al.,1983)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)のα-アミラーゼプロモーター(Tarkinen et al.,1983)、バチルス・サブチリス(Bacillus subtilis)由来の中性プロテアーゼ(nprE)プロモーター(Yang et al.,1984)、変異体aprEプロモーター(国際公開第2001/51643号パンフレット)又はバチルス・リケニフォルミス(Bacillus licheniformis)若しくは他の関連するバチルス綱(Bacilli)由来の任意の他のプロモーターが挙げられるが、これらに限定されない。特定の他の実施形態では、プロモーターは、米国特許出願公開第2014/0329309号明細書に開示されたリボソームタンパク質プロモーター又はリボソームRNAプロモーター(例えば、rrnIプロモーター)である。spacのような合成プロモーターは、他の副因子に依存して構成的又は誘導性であり得る。n25、ラムダpL又はpRのようなファージプロモーターも同様に構成的又は誘導性であり得る。バチルス属(Bacillus sp.)細胞においてある範囲の活性(プロモーター強度)を有するプロモーターライブラリーをスクリーニング及び作製する方法は、国際公開第2003/089604号パンフレットに記載されている。
いくつかの実施形態では、Cas9エンドヌクレアーゼをコードするヌクレオチド配列は、バチルス属(Bacillus sp.)細胞において機能的な構成的プロモーターに作動可能に連結される。バチルス属(Bacillus sp.)内で機能的な構成的プロモーターとしては、バチルス・リケニフォルミス(Bacillus licheniformis)アミラーゼ遺伝子(amyL)のプロモーター、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)マルトース生成アミラーゼ遺伝子(amyM)のプロモーター、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)アミラーゼ(amyQ)のプロモーター、バチルス・サブチリス(Bacillus subtilis)アルカリプロテアーゼ(aprE)プロモーター、バチルス・サブチリス(Bacillus subtilis)のα-アミラーゼプロモーター(Yang et al.,1983)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)のα-アミラーゼプロモーター(Tarkinen et al.,1983)、バチルス・サブチリス(Bacillus subtilis)由来の中性プロテアーゼ(nprE)プロモーター(Yang et al.,1984)が挙げられるが、これらに限定されない。
本明細書で使用する場合、「組換え」は、例えば、化学合成又は遺伝子工学技術による核酸の単離セグメントの操作により、2つのさもなければ分離している配列セグメントの人工的組合せを指す。用語「組換え体」は、生物学的構成要素又は組成物(例えば、細胞、核酸、ポリペプチド/酵素、ベクターなど)に関連して使用されるとき、それらの生物学的構成要素又は組成物が天然で見られない状態のものであることを示す。換言すると、この生物学的構成要素又は組成物は、人の介入により天然の状態から改変されている。例えば、組換え細胞は、天然(すなわち非組換え)細胞中に見出されない1つ以上の遺伝子を発現する細胞、1つ以上の天然遺伝子を天然細胞と異なる量で発現する細胞及び/又は1つ以上の天然遺伝子を天然細胞と異なる条件下で発現する細胞を包含する。組換え核酸は、天然配列と1つ以上のヌクレオチドが異なり、異種配列(例えば、異種プロモーター、非天然又はバリアントシグナル配列をコードする配列など)に作動可能に連結され、イントロン配列を欠き、且つ/又は単離された形態であり得る。組換えポリペプチド/酵素は、天然配列と1つ以上のアミノ酸が異なり、異種配列と融合され、トランケートされるか若しくはアミノ酸の内部欠失を有し、天然細胞に見られない様式で(例えば、ポリペプチドをコードする発現ベクターが細胞中に存在することにより、ポリペプチドを過剰発現する組換え細胞から)発現され、且つ/又は単離された形態であり得る。いくつかの実施形態では、組換えポリヌクレオチド又はポリペプチド/酵素は、その野生型対応物と同一の配列を有するが、非天然形態(例えば、単離又は濃縮された形態)であることが強調される。
本明細書で使用する場合、「組換えDNA」又は「組換えDNAコンストラクト」は、核酸断片の人工的組合せを含む少なくとも1つの発現カセットを含むDNA配列を指す。組換えDNAコンストラクトは、本明細書で開示されるとおりの目的のポリヌクレオチドに作動可能に連結された5’及び3’調節配列を含み得る。例えば、組換えDNAコンストラクトは、異なる供給源に由来する調節配列及びコード配列を含み得る。そのような組換えDNAコンストラクトは、単独で使用され得るか、又は本明細書で環状組換えDNAコンストラクトとも呼ばれるベクターとともに使用され得る。ベクターの選択は、当業者によく知られているように、宿主細胞にベクターを導入するために使用されることになる方法に依存する。例えば、プラスミドベクターを使用することができる。当業者であれば、宿主細胞を問題なく形質転換し、選択し、且つ繁殖させるためにベクター上に存在しなければならない遺伝要素について熟知している。
本明細書で使用される標準的な組換えDNA及び分子クローニング技術は、当技術分野でよく知られており、Sambrook et al.,Molecular Cloning:A Laboratory Manual;Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989)においてより詳細に説明されている。
本明細書で使用する場合、「線状組換えDNAコンストラクト」は、線状である組換えDNAコンストラクトを指す。
本明細書で使用する場合、「環状組換えDNAコンストラクト」又は「環状組換えDNA」は、環状である組換えDNAコンストラクトを指す。用語「環状組換えDNAコンストラクト」は、任意の供給源に由来するか、又は合成的な(すなわち天然に存在しない)自律的に複製する配列、ゲノム組込み配列(単一又は複数コピーの遺伝子発現カセットなどであるが、これらに限定されない)、ファージ又はヌクレオチド配列を含む環状の追加の染色体外エレメントを含み、その中において、いくつかのヌクレオチド配列は、目的のポリヌクレオチドを細胞に導入することができる固有の構成に結合されているか又は組み換えられている。
一態様では、環状組換えDNAコンストラクトは、ベクター骨格及びCasエンドヌクレアーゼをコードするDNA配列に作動可能に連結されたプロモーター配列を含む。
別の態様では、環状組換えDNAコンストラクトは、ベクター骨格並びにCasエンドヌクレアーゼをコードするDNA配列に作動可能に連結された第1のプロモーター及びガイドRNAをコードするDNA配列に作動可能に連結された第2のプロモーターを含む。
いくつかの実施形態では、環状組換えDNAコンストラクトは、ベクター骨格及びバチルス属(Bacillus sp.)細胞において機能的な構成的プロモーターに作動可能に連結されたCas9エンドヌクレアーゼをコードするCas9エンドヌクレアーゼDNAを含む。
一態様では、環状組換えDNAコンストラクトは、本明細書で開示されるCas9エンドヌクレアーゼに作動可能に連結された異種5’及び3’調節配列を含む。これらの調節配列としては、バチルス属(Bacillus sp.)細胞において機能的な転写及び翻訳開始領域(すなわちプロモーター)、核移行シグナル並びに転写及び翻訳終結領域(すなわち終結領域)が挙げられるが、これらに限定されない。
一態様では、組換えDNAコンストラクトは、本明細書に記載されるCas9エンドヌクレアーゼをコードするDNAを含み、前記Cas9エンドヌクレアーゼは、核移行配列(NLS)などの異種調節エレメントに作動可能に連結されるか又はそれを含む。
一態様では、組換えDNAコンストラクトは、本明細書に記載されるCas9エンドヌクレアーゼをコードするDNAを含み、前記Cas9エンドヌクレアーゼは、タンパク質不安定化ドメイン(例えば、degタグ)に作動可能に連結されるか又はそれを含む。
一態様では、組換えDNAコンストラクトは、本明細書に記載されるCas9エンドヌクレアーゼをコードするDNAを含み、前記Cas9エンドヌクレアーゼは、タンパク質タグ(例えば、ポリヒスチジンタグ)に作動可能に連結されるか又はそれを含む。
一態様では、組換えDNAコンストラクトは、本明細書に記載されるCas9エンドヌクレアーゼをコードするDNAを含み、前記Cas9エンドヌクレアーゼは、蛍光タンパク質(例えば、GFP)に作動可能に連結されるか又はそれを含む。
一態様では、組換えDNAコンストラクトは、本明細書に記載されるCas9エンドヌクレアーゼをコードするDNAを含み、前記Cas9エンドヌクレアーゼは、DNA結合ドメイン(例えば、mu gam、tetR)に作動可能に連結されるか又はそれを含む。
標的部位
用語「標的部位」、「標的配列」、「標的部位配列」、「標的DNA」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」及び「プロトスペーサー」は、本明細書で互換的に使用され、限定はされないが、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体が認識し、結合し、且つ任意選択により切れ目を入れるか又は切断することができる、細胞の染色体、エピソーム、遺伝子導入座位又はゲノム中の任意の他のDNA分子(染色体、プラスミドDNAを含む)上のヌクレオチド配列などのポリヌクレオチド配列を指す。
用語「標的部位」、「標的配列」、「標的部位配列」、「標的DNA」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」及び「プロトスペーサー」は、本明細書で互換的に使用され、限定はされないが、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体が認識し、結合し、且つ任意選択により切れ目を入れるか又は切断することができる、細胞の染色体、エピソーム、遺伝子導入座位又はゲノム中の任意の他のDNA分子(染色体、プラスミドDNAを含む)上のヌクレオチド配列などのポリヌクレオチド配列を指す。
標的部位は、細胞のゲノム中の内在性部位であり得るか、又は代わりに、標的部位は、細胞に対して異種であるため、細胞のゲノム中で天然に存在し得ないか、又は標的部位は、天然に存在する場所と比較して異種のゲノム位置で見出すことができる。本明細書で使用される場合、用語「内在性標的配列」及び「天然標的配列」は、本明細書中で互換的に使用され、細胞のゲノムに内在するか又は天然のものであり、細胞のゲノム中のその標的配列の内在性又は天然の位置に存在する標的配列を指す。「人工標的部位」又は「人工標的配列」は、本明細書で互換的に使用され、細胞のゲノムに導入された標的配列を指す。そのような人工標的配列は、細胞のゲノム中の内在性標的配列又は天然標的配列と配列が同一であり得るが、細胞のゲノム中の異なる位置(すなわち非内在性位置又は非天然位置)に配置され得る。
「改変標的部位」、「改変標的配列」、「修飾標的部位」、「修飾標的配列」は、本明細書では互換的に使用され、改変されていない標的配列と比較した場合に少なくとも1つの改変を含む本明細書に開示される標的配列を指す。そのような「改変」としては、例えば、(i)少なくとも1つのヌクレオチドの置換、(ii)少なくとも1つのヌクレオチドの欠失、(iii)少なくとも1つのヌクレオチドの挿入、又は(iv)(i)~(iii)の任意の組合せが挙げられる。
Casエンドヌクレアーゼのための標的部位は、非常に特異的であり、正確なヌクレオチド位置に定義され得ることが多いが、ある場合には、所望のゲノム改変のための標的部位は、DNA切断が起こる部位のみと比べて広く定義され得る(例えば、ゲノムから欠失されるゲノム遺伝子座又は領域)。そのため、特定の場合(Cas/ガイドRNAの活性により起こるゲノム改変)、DNA切断が「標的部位又は標的部位の近傍で」起こると説明される。
「標的部位を修飾する」及び「標的部位を改変する」ための方法は、本明細書では互換的に使用され、改変標的部位を生成するための方法を指す。
スクリーニング可能なマーカーの表現型を使用せずに標的部位又は標的部位の近傍で改変ゲノムを有するそれらの細胞を同定するために、様々な方法を利用することができる。そのような方法は、PCR法、シークエンシング法、ヌクレアーゼ消化法、サザンブロット法及びそれらの任意の組合せを含むが、これらに限定されない、標的配列内の何らかの変化を検出するために標的配列を直接的に分析することであるとみなすことができる。
標的DNA配列(標的部位)の長さは、変動する可能性があり、例えば長さが少なくとも12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30ヌクレオチド以上である標的部位が含まれる。さらに、標的部位は、回文構造であり得ることも考えられ、すなわち、一方の鎖上の配列は、相補鎖上で反対方向に同一配列を読み取ることが可能である。ニック/切断部位は、標的配列内に存在する可能性があるか、又はニック/切断部位は標的配列の外側に存在する可能性がある。別の変形形態では、切断が互いに直接向かい合ったヌクレオチド位置で生じて平滑末端切断を生成する可能性があるか、又は他の場合、切り込みが互い違いに配置されて、5’オーバーハング又は3’オーバーハングのいずれかであり得る一本鎖オーバーハング(「粘着末端」とも呼ばれる)を生成する可能性がある。ゲノム標的部位の活性バリアントも使用され得る。そのような活性バリアントは、所与の標的部位に対して少なくとも65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又はそれを超える配列同一性を含むことができ、活性バリアントは、生物学的活性を保持し、したがってCasエンドヌクレアーゼにより認識及び切断することができる。
エンドヌクレアーゼによる標的部位の一本鎖又は二本鎖切断を測定するためのアッセイは、当技術分野で知られており、一般には、認識部位を含有するDNA基質に対する作用物質の全体的活性及び特異性を測定する。
プロトスペーサー隣接モチーフ(PAM)
本明細書における「プロトスペーサー隣接モチーフ」(PAM)は、ガイドポリヌクレオチド/Casエンドヌクレアーゼ(PGEN)系により認識される(標的とされる)標的配列(プロトスペーサー)に隣接する短いヌクレオチド配列を指す。Casエンドヌクレアーゼは、標的DNA配列の後にPAM配列がなければ、その標的DNA配列を正しく認識しない可能性がある。本明細書におけるPAMの配列及び長さは、使用されるCasタンパク質又はCasタンパク質複合体に応じて異なり得る。PAM配列は、任意の長さであり得るが、典型的には1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19又は20ヌクレオチド長である。
本明細書における「プロトスペーサー隣接モチーフ」(PAM)は、ガイドポリヌクレオチド/Casエンドヌクレアーゼ(PGEN)系により認識される(標的とされる)標的配列(プロトスペーサー)に隣接する短いヌクレオチド配列を指す。Casエンドヌクレアーゼは、標的DNA配列の後にPAM配列がなければ、その標的DNA配列を正しく認識しない可能性がある。本明細書におけるPAMの配列及び長さは、使用されるCasタンパク質又はCasタンパク質複合体に応じて異なり得る。PAM配列は、任意の長さであり得るが、典型的には1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19又は20ヌクレオチド長である。
本明細書におけるPAMは、通常、利用されているRGENの型を鑑みて選択される。本明細書におけるPAM配列は、例えば、Casが由来し得る、本明細書で開示される種のいずれかに由来する、本明細書に記載されるCas9バリアントなどのCasを含むPGENによって認識されるものであり得る。特定の実施形態では、PAM配列は、S.ピオゲネス(S.pyogenes)、S.サーモフィルス(S.thermophilus)、S.アガラクティエ(S.agalactiae)、N.メニンギティディス(N.meningitidis)、T.デンティコラ(T.denticola)又はF.ノビシダ(F.novicida)に由来するCas9を含むRGENによって認識されるものであり得る。例えば、本明細書に記載されるCas9 Y155バリアントを含むS.ピオゲネス(S.pyogenes)に由来する好適なCas9は、NGG(Nは、A、T、C、T又はGであり得る)のPAMを有する標的ゲノム配列に対して使用され得る。他の例として、好適なCas9は、以下のPAM配列を有するDNA配列を標的化するときに以下の種のいずれかに由来し得る:S.サーモフィルス(S.thermophilus)(NNAGAA)、S.アガラクティエ(S.agalactiae)(NGG)、NNAGAAW[Wは、A又はTである]、NGGNG)、N.メニンギティディス(N.meningitidis)(NNNNGATT)、T.デンティコラ(T.denticola)(NAAAAC)又はF.ノビシダ(F.novicida)(NG)(これらの特定のPAM配列の全てにおけるNは、A、C、T又はGである)。本明細書で有用なCas9/PAMの他の例としては、参照により本明細書に組み込まれるShah et al.(RNA Biology 10:891-899)及びEsvelt et al.(Nature Methods 10:1116-1121)において開示されるものが挙げられる。
バチルス属(Bacillus sp.)での効率的なドナーDNA組込みにおける、少なくとも1000ヌクレオチド長の長いホモロジーアームによって隣接されるドナーDNA配列を含む線状組換えDNAコンストラクトの使用
本開示は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNAを含む線状組換えDNAコンストラクトを使用してドナーDNA配列を組み込むための方法及び組成物を含む。
本開示は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNAを含む線状組換えDNAコンストラクトを使用してドナーDNA配列を組み込むための方法及び組成物を含む。
本出願人らは、驚くべきことに且つ予想外にも、長いホモロジーアーム(>1000ヌクレオチド)によって隣接されるドナーDNAを含む線状組換えDNAコンストラクト並びにCas9エンドヌクレアーゼ及びガイドRNAをコードする環状組換えDNAコンストラクト(バチルス属(Bacillus sp.)細胞へのガイドRNA/Casエンドヌクレアーゼ系の導入のための)が、バチルス属(Bacillus sp.)細胞に同時に導入されるとき、1000ヌクレオチド長の短いホモロジーアームによって隣接される前記同じドナーDNA配列を除いて全て同じ成分を有する対照系と比較して、ドナーDNA配列の組込みにおける効率の増加が観察されることを見出した(図1)。さらに、本明細書に記載される方法は、前記バチルス属(Bacillus sp.)細胞のゲノムへの選択マーカーの組込みを必要としない。
一実施形態によれば、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。
一態様では、ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接され、各ホモロジーアームは、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000を超え、且つ最大で6000のヌクレオチド長であり、及びバチルス属(Bacillus sp.)細胞のゲノム上の前記標的部位に対する配列相同性を含む。
一態様では、ドナーDNA配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーRNAの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか1つの組合せからなる群から選択されるヌクレオチド配列を含む。
一態様では、方法は、前記バチルス属(Bacillus sp.)細胞からの子孫細胞を増殖させ、且つバチルス属(Bacillus sp.)子孫細胞であって、そのゲノム中に安定に組み込まれたドナーDNA配列を有するバチルス属(Bacillus sp.)子孫細胞を選択することをさらに含む。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、及び前記方法は、バチルス属(Bacillus sp.)細胞に、1000ヌクレオチドの上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接される前記ドナーDNA配列を含む線状組換えDNAコンストラクトと、前記環状組換えDNAコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~最大で23倍高い、バチルス属(Bacillus sp.)細胞のゲノムへのドナーDNA配列の組込みの頻度を有する、方法である。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、方法である。
いくつかの実施形態では、バチルス属(Bacillus sp.)細胞は、バチルス・サブチリス(Bacillus subtilis)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・レンツス(Bacillus lentus)、バチルス・ブレビス(Bacillus brevis)、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)、バチルス・アルカロフィルス(Bacillus alkalophilus)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)、バチルス・クラウシイ(Bacillus clausii)、バチルス・ハロデュランス(Bacillus.halodurans)、バチルス・メガテリウム(Bacillus.megaterium)、バチルス・コアギュランス(Bacillus coagulans)、バチルス・サーキュランス(Bacillus circulans)、バチルス・ラウツス(Bacillus lautus)及びバチルス・チューリンギエンシス(Bacillus thuringiensis)からなる群から選択される。
本開示の線状組換えDNAコンストラクトは、少なくとも1000ヌクレオチドのホモロジーアームによって隣接されるドナーDNAを含み得、且つ任意選択により、ガイドRNAをコードするDNA断片を含み得(図2)、前記ガイドRNAは、CasエンドヌクレアーゼとともにRGENを形成することができ、前記RGENは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入できる。線状組換えDNAコンストラクト上のドナーDNAに関するガイドRNAの位置は、ドナーDNAが隣接するHR2アーム(3’ホモロジーアーム)の3’(下流)であり得る(図2において示されるとおり)。ガイドRNAをコードするDNAは、HR2アームに直接的に連結され得るか、又はHR2アームのさらに下流にあり得る(例えば、HR2アームと、ガイドRNAをコードするDNAとの間にヌクレオチドを有する)。線状組換えDNAコンストラクト上のドナーDNAに関するガイドRNAの位置は、ドナーDNAが隣接するHR1アーム(5’ホモロジーアーム)の5’(上流)でもあり得る(図において示されない)。ガイドRNAをコードするDNAは、HR1ホモロジーアームに直接的に連結され得るか、又はHR1アームのさらに上流にあり得る(例えば、HR1アームと、ガイドRNAをコードするDNAとの間にヌクレオチドを有する)。
バチルス属(Bacillus sp.)細胞のゲノムへの遺伝子組込みのための以前の方法は、自発的な二本鎖切断の発生及び短いホモロジーアームとともに線状DNA断片上で同じ場所に位置する選択マーカー(ゲノムに挿入されることになる目的の遺伝子と、そのゲノムに組み込まれる目的の遺伝子を有したバチルス属(Bacillus sp.)細胞の同定も可能にするようにゲノムに挿入された選択マーカーとの両方を含む)の使用に依拠する(2002年2月21日に公開された国際公開第02/14490号パンフレット)。選択マーカー及びGOIは、通常、細胞内のDNAとの組換え時にGOI及び選択マーカーの両方が細胞のDNA中に組み込まれることになるように、2つの短いホモロジーアームによって隣接された。バチルス(Bacillus)細胞へのゲノム組込みのための短いホモロジーアームによる、そのような線状断片の形質転換中の選択マーカーの使用は、ゲノムの特定の位置の効率的な改変のために選択することが必要となる。マーカーは、発現のための正確な遺伝子座に組み込む必要があり、この組込みは、集団内及びゲノム内の確率的な様式で発生する希有な自発的DNA損傷に依拠する。この希有な事象は、マーカーの使用及び染色体組込みを組み合わせることによってのみ選択され得る。(2002年2月21日に公開された国際公開第02/14490号パンフレット)。
対照的に、本開示は、集団の大部分を、所望の遺伝子座でDNA損傷を含有する細胞に本質的に変換する部位特異的DNA二本鎖切断(DNA損傷)を生成し、そのため、希有な自発的DNA損傷に依拠しない方法を記載する。したがって、DNA二本鎖切断の生成は、もはや染色体座位を改変するための制限的な工程ではなく(200年2月21日に公開された国際公開第02/14490号パンフレットにおける場合のように)、代わりに、本開示は、単に、形質転換効率の上昇を可能にするためにのみ、任意選択により(組換えDNAコンストラクト上に配置される)選択マーカーを使用して非形質転換細胞から形質転換細胞を区別する。
本明細書に記載されるとおり、本出願人らは、驚くべきことに且つ予想外にも、長いホモロジーアーム(>1000ヌクレオチド長)によって隣接されるドナーDNAを含む線状組換えDNAコンストラクトが、RGENをコードする組換えDNAコンストラクトと同時に導入されるとき、バチルス属(Bacillus sp.)ゲノム標的部位上の標的部位への高い効率の遺伝子組込みが前記ゲノムへの選択マーカーの組込みを伴わずに観察されることを見出した。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス属(Bacillus sp.)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記環状組換えDNAコンストラクトは、前記バチルス属(Bacillus sp.)子孫細胞のゲノムに組み込まれない選択マーカーを含む、方法である。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス属(Bacillus sp.)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記選択マーカーは、前記バチルス属(Bacillus sp.)子孫細胞のゲノムに安定に組み込まれない、方法である。
用語「ノックイン」、「遺伝子ノックイン」、「遺伝子挿入」及び「遺伝的ノックイン」は、本明細書では互換的に使用される。ノックインは、Casタンパク質を用いたターゲティングによって(例えば、好適なドナーDNAポリヌクレオチドも使用される相同組換え(HR)によって)細胞内の特定のDNA配列でのDNA配列の置換又は挿入を表す。ノックインの例は、遺伝子のコード領域中の異種アミノ酸コード配列の特異的な挿入又は遺伝子座中への転写調節エレメントの特異的な挿入である。
本明細書に記載される線状組換えDNAは、バチルス属(Bacillus sp.)細胞のゲノムに目的のポリヌクレオチド又は遺伝子を組み込むための方法において使用され得る。
一態様では、本方法は、標的部位での目的のポリヌクレオチド又は遺伝子の組込みを提供するために相同組換え(HR)を利用する。
本明細書で使用する場合、「ドナーDNA」及び「ドナーDNA配列」は、バチルス属(Bacillus sp.)細胞のゲノム上に配置されるCasエンドヌクレアーゼの標的部位に挿入されることになるヌクレオチド配列を含むDNA配列を指す。ドナーDNA配列は、第1(HR1)及び第2(HR2)の相同領域(ホモロジーアームとも呼ばれる)によって隣接され得る。ドナーDNA配列に隣接する第1及び第2の相同性の領域は、それぞれ細胞又は生物体ゲノムの標的部位中に存在するか又はそれに隣接する第1の及び第2のゲノム領域に対する相同性を共有する。
本明細書で使用する場合、「ホモロジーアーム」は、バチルス属(Bacillus sp.)ゲノム内の配列と相同である核酸配列を指す。より具体的には、ホモロジーアームは、標的配列に直接隣接する領域と約80~100%の配列同一性、約90~100%の配列同一性又は約95~100%の配列同一性を有する上流又は下流の領域である。
一態様では、バチルス属(Bacillus sp.)ゲノムに組み込まれることになる目的のヌクレオチド配列を含む二本鎖ドナーDNA配列に隣接し、且つ本明細書に記載される線状二本鎖組換えDNA上に配置される本開示のホモロジーアームは、約1001塩基対(bp)~2000bp;2000bp~3000bp;2000bp~4000bp;2000bp~5000bp;2000bp~6000bp、3000bp~4000bp;3000bp~5000bp;3000bp~6000bp、4000bp~5000bp;4000bp~6000bp、5000bp~最大で6000bpを含む。
一態様では、バチルス属(Bacillus sp.)ゲノムに組み込まれることになる目的のヌクレオチド配列を含む一本鎖ドナーDNA配列に隣接し、且つ本明細書に記載される線状一本鎖組換えDNA上に配置される本開示のホモロジーアームは、約1001ヌクレオチド~2000ヌクレオチド;2000ヌクレオチド~3000ヌクレオチド;2000ヌクレオチド~4000ヌクレオチド;2000ヌクレオチド~5000ヌクレオチド;2000ヌクレオチド~6000ヌクレオチド;3000ヌクレオチド~4000ヌクレオチド;3000ヌクレオチド~5000ヌクレオチド;3000ヌクレオチド~6000ヌクレオチド;4000ヌクレオチド~5000ヌクレオチド;4000ヌクレオチド~6000ヌクレオチド;5000ヌクレオチド~最大で6000ヌクレオチドを含む。
本明細書で使用する場合、対照実験において使用されるドナーDNA配列は、バチルス属(Bacillus sp.)ゲノムに組み込まれることになる目的のヌクレオチド配列を含む(且つ本明細書に記載される線状組換えDNA上に配置される)ドナーDNA配列と同一であるが、対照線状組換えDNAにおいてドナーDNA配列に隣接するホモロジーアームは、1000ヌクレオチド長の短いホモロジーアームによって隣接される。
一態様では、ドナーDNA配列は、バチルス属(Bacillus sp.)ゲノムに組み込まれることになる目的のヌクレオチド配列を含み、前記目的のヌクレオチド配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーRNAの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか1つの組合せからなる群から選択される。
いくつかの実施形態では、目的の遺伝子の5’及び3’末端は、ホモロジーアームによって隣接され、ホモロジーアームは、バチルス属(Bacillus sp.)細胞の標的化されるゲノム遺伝子座に直接隣接する核酸配列を含む。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス属(Bacillus sp.)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記方法は、前記バチルス属(Bacillus sp.)細胞に由来する子孫細胞を増殖させ、且つバチルス属(Bacillus sp.)子孫細胞であって、線状組換えDNA及び/又は環状組換えDNAコンストラクトを含有しない(且つ環状組換えDNA上に含まれる任意選択の選択マーカーを含有しない)が、そのゲノム中に安定に組み込まれる目的の遺伝子を有するバチルス属(Bacillus sp.)子孫細胞を選択することをさらに含む、方法である。
一実施形態では、方法は、バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス属(Bacillus sp.)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入し、前記方法は、バチルス属(Bacillus sp.)細胞に、1000ヌクレオチドの上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接される前記ドナーDNA配列を含む線状組換えDNAコンストラクトと、構成的プロモーターに作動可能に連結された前記ガイドRNA及び前記Cas9エンドヌクレアーゼDNA配列をコードする前記DNA配列を含む環状組換えDNAコンストラクトとを導入することを含む対照方法の組込みの頻度と比較して、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~最大で23倍高い、ドナーDNA配列の組込みの頻度をもたらす、方法である。
エピソームDNA分子も二本鎖切断中にライゲートされ得、例えば染色体二本鎖切断へのT-DNAの組込みがなされ得る(Chilton and Que,(2003)Plant Physiol 133:956-65;Salomon and Puchta,(1998)EMBO J 17:6086-95)。二本鎖切断の周囲の配列が、例えば、二本鎖切断の成熟に関与するエキソヌクレアーゼ活性によって改変されると、遺伝子変換経路は、非分裂体細胞中の相同染色体又はDNA複製後の姉妹染色分体などの相同配列を利用できる場合、原初の構造を回復させることができる(Molinier et al.,2004,Plant Cell 16:342-52)。異所性及び/又は後成的DNA配列も相同組換えのDNA修復鋳型として機能し得る(Puchta,(1999)Genetics 152:1173-81)。
相同組換え修復(HDR)は、二本鎖及び一本鎖DNA切断を修復する細胞内の機構である。相同組換え修復としては、相同組換え(HR)及び一本鎖アニーリング(SSA)が挙げられる(Lieber.2010 Annu.Rev.Biochem.79:181-211)。HDRの最も一般的な形態は、ドナーDNAとアクセプターDNAとの間の最も長い配列相同性の要件を有する相同組換え(HR)と呼ばれる。HDRの他の形態には、一本鎖アニーリング(SSA)及び切断誘導性複製が含まれ、これらは、HRと比較してより短い配列相同性を必要とする。ニック(一本鎖切断)に対する相同組換え修復は、二本鎖切断に対するHDRと異なる機構で起こり得る(Davis and Maizels.PNAS(0027-8424),111(10),p.E924-E932)。
「相同性」は、類似するDNA配列を意味する。例えば、ドナーDNA上で見出される「ゲノム領域に対する相同領域」とは、細胞又は生物体ゲノムの所与の「ゲノム領域」と類似する配列を有するDNAの領域のことである。相同領域は、切断される標的部位での相同組換えを促進するのに十分な任意の長さであり得る。例えば、相同領域は、この相同領域が、対応するゲノム領域との相同組換えを受けるのに十分な相同性を有するように、少なくとも5~10、5~15、5~20、5~25、5~30、5~35、5~40、5~45、5~50、5~55、5~60、5~65、5~70、5~75、5~80、5~85、5~90、5~95、5~100、5~200、5~300、5~400、5~500、5~600、5~700、5~800、5~900、5~1000、5~1100、5~1200、5~1300、5~1400、5~1500、5~1600、5~1700、5~1800、5~1900、5~2000、5~2100、5~2200、5~2300、5~2400、5~2500、5~2600、5~2700、5~2800、5~2900、5~3000、5~3100個又はより多い塩基の長さを含むことができる。「十分な相同性」は、2種のポリヌクレオチド配列が相同組換え反応のための基質として作用するのに十分な構造的類似性を有することを示す。この構造的類似性には、各ポリヌクレオチド断片の全長及びポリヌクレオチドの配列類似性が含まれる。配列類似性は、配列の全長にわたる配列同一性パーセント並びに/又は100%配列同一性を有する連続ヌクレオチドなどの局在化した類似性を含む保存領域及び配列の長さの一部にわたる配列同一性パーセントで説明することができる。
標的及びドナーポリヌクレオチドにより共有される相同性又は配列同一性の量は、多様であり得、約1~20bp、20~50bp、50~100bp、75~150bp、100~250bp、150~300bp、200~400bp、250~500bp、300~600bp、350~750bp、400~800bp、450~900bp、500~1000bp、600~1250bp、700~1500bp、800~1750bp、900~2000bp、1~2.5kb、1.5~3kb、2~4kb、2.5~5kb、3~6kb、3.5~7kb、4~8kb、5~10kbの範囲で単位整数値を有する全長及び/又は全領域を含むか、又は最大で標的部位の全長を含む。これらの範囲には、この範囲内の全ての整数が含まれ、例えば、1~20bpの範囲には、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19及び20bpが含まれる。相同性の量は、2種のポリヌクレオチドの完全にアラインされた長さ全体にわたる配列同一性パーセントで記載することもでき、それには、少なくとも約50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の配列同一性パーセントが含まれる。十分な相同性は、ポリヌクレオチドの長さと、全体的な配列同一性パーセントと、任意選択的に連続ヌクレオチドの保存領域又は局所的な配列同一性パーセントとの任意の組合せを含み、例えば、十分な相同性は、標的遺伝子座の領域に対して少なくとも80%の配列同一性を有する75~150bpの領域と説明することができる。十分な相同性は、高ストレンジェンシー条件下で特異的にハイブリダイズする2つのポリヌクレオチドの予測能力によっても説明することができ、例えばSambrook et al.,(1989)Molecular Cloning:A Laboratory Manual,(Cold Spring Harbor Laboratory Press,NY);Current Protocols in Molecular Biology,Ausubel et al.,Eds(1994)Current Protocols,(Greene Publishing Associates,Inc.and John Wiley&Sons,Inc.);及びTijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes,(Elsevier,New York)を参照されたい。
本明細書で使用する場合、「ゲノム領域」とは、標的部位のいずれかの側上に存在する、細胞のゲノム中の染色体のセグメントのことであるか、又は代わりに標的部位の一部も含むセグメントのことである。このゲノム領域は、このゲノム領域が対応する相同領域との相同組換えを受けるのに十分な相同性を有するように、少なくとも5~10、5~15、5~20、5~25、5~30、5~35、5~40、5~45、5~50、5~55、5~60、5~65、5~70、5~75、5~80、5~85、5~90、5~95、5~100、5~200、5~300、5~400、5~500、5~600、5~700、5~800、5~900、5~1000、5~1100、5~1200、5~1300、5~1400、5~1500、5~1600、5~1700、5~1800、5~1900、5~2000、5~2100、5~2200、5~2300、5~2400、5~2500、5~2600、5~2700、5~2800、5~2900、5~3000、5~3100個又はそれを超える塩基を含むことができる。
所定のゲノム領域と、ドナーDNA上で見出される対応する相同性領域との間の構造的類似性は、相同組換えが発生することを可能にする任意の程度の配列同一性であり得る。例えば、ドナーDNAの「相同領域」及び生物体ゲノムの「ゲノム領域」によって共有される相同性又は配列同一性の量は、それらの配列が相同組換えを受けるように、少なくとも50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%の配列同一性であり得る。
ドナーDNA上の相同領域は、標的部位に隣接する任意の配列に対する相同性を有する可能性がある。いくつかの例では、相同領域は、標的部位に直接隣接するゲノム配列に対して相当の配列相同性を共有するが、この相同領域を、標的部位に対してさらに5’又は3’であり得る領域に対して十分な相同性を有するように設計できることが認識される。相同領域は、下流のゲノム領域に加えて、標的部位の断片との相同性も有することができる。
一実施形態では、第1の相同領域は、標的部位の第1の断片をさらに含み、第2の相同領域は、標的部位の第2の断片を含み、これらの第1の断片及び第2の断片は、異なる。
本明細書で使用する場合、「相同組換え」には、相同性部位で2つのDNA分子間のDNA断片の交換が含まれる。相同組換えの頻度は、いくつかの因子によって影響を受ける。様々な生物体は、相同組換えの量及び相同組換え対非相同組換えの相対比率に関して変動する。相同組換えを観察するのに必要となる相同領域(ホモロジーアーム)の長さは、種間で変動する。
例えば、相同組換え(HR)を介した原核細胞又は生物体細胞のゲノムの改変は、遺伝子操作のための強力なツールである。相同組換えは、他の生物体においても実施されてきた。例えば、寄生原虫であるリーシュマニア(Leishmania)属における相同組換えのために、少なくとも150~200bpの相同性が必要とされ(Papadopoulou and Dumas,(1997)Nucleic Acids Res 25:4278-86)、150~200bpの相同性は、プロトバクテリアのE.コリ(E coli)における効率的な組換えに必要となる(Lovett et al(2002)Genetics 160:851-859)。バチルス(Bacillus)細胞において、わずか70bpの相同性の長さでも相同組換えに関与できるが、25bpのホモロジーアームの長さでは不可能である(Kahsanov FK et al Mol Gen Genetics(1992)234:494-497)。
遺伝子発現カセットの複数のコピーの導入
酵素産生のためのバチルス属(Bacillus sp.)宿主の開発におけるボトルネックの1つは、染色体における複数コピーの酵素発現カセットの抗生物質耐性マーカー(ARM)を含まない組込みである。組込みベクター、Cre/loxPシステム及び栄養要求性マーカーを使用するなどの既存の手法は、多くの時間を要し、編集効率が比較的低い。
酵素産生のためのバチルス属(Bacillus sp.)宿主の開発におけるボトルネックの1つは、染色体における複数コピーの酵素発現カセットの抗生物質耐性マーカー(ARM)を含まない組込みである。組込みベクター、Cre/loxPシステム及び栄養要求性マーカーを使用するなどの既存の手法は、多くの時間を要し、編集効率が比較的低い。
本明細書に記載される方法は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接されるドナーDNAを使用して目的の遺伝子(目的の遺伝子発現カセット)の複数のコピーの組込みを可能にし、各ホモロジーアームは、1000を超えるヌクレオチド長であり、高い効率の遺伝子組込みをもたらす。
複数コピーの遺伝子発現カセット又は複数コピーの発現カセットは、本明細書で互換的に使用され、少なくとも1つの目的の遺伝子を含む同じ発現カセットの複数のコピーを指す。一態様では、前記遺伝子発現カセットの複数のコピーは、2コピー、3コピー、4コピー、5コピー、6コピー、7コピー、8コピー、9コピー及び最大で10コピーからなる群から選択される。
一態様では、本明細書に記載される方法は、バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接されるドナーDNA配列を含み、前記ドナーDNAは、目的の前記遺伝子の複数のコピーを含み、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法である。
一態様では、前記遺伝子発現カセットの複数のコピーは、2コピー、3コピー、4コピー、5コピー、6コピー、7コピー、8コピー、9コピー及び最大で10コピーからなる群から選択される。
多重化
本明細書におけるターゲティング法は、例えば、この方法で2つ以上のDNA標的部位が標的化されるように実施することができる。そのような方法は、任意選択により、多重法として特徴付けられ得る。特定の実施形態では、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10又はそれを超える標的部位が同時に標的化され得る。多重法は、通常、複数の異なるRNA成分(そのそれぞれは、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体を固有のDNA標的部位に誘導するように設計されている)が提供される、本明細書におけるターゲティング法により実施される。
本明細書におけるターゲティング法は、例えば、この方法で2つ以上のDNA標的部位が標的化されるように実施することができる。そのような方法は、任意選択により、多重法として特徴付けられ得る。特定の実施形態では、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10又はそれを超える標的部位が同時に標的化され得る。多重法は、通常、複数の異なるRNA成分(そのそれぞれは、ガイドポリヌクレオチド/Casエンドヌクレアーゼ複合体を固有のDNA標的部位に誘導するように設計されている)が提供される、本明細書におけるターゲティング法により実施される。
定義
他に定義されていない限り、本明細書で使用する全ての技術用語及び科学用語は、本発明の組成物及び方法が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。
他に定義されていない限り、本明細書で使用する全ての技術用語及び科学用語は、本発明の組成物及び方法が属する技術分野の当業者が一般に理解する意味と同一の意味を有する。
「対立遺伝子」又は「対立遺伝子バリアント」は、染色体上の所定の遺伝子座を占有する遺伝子の数種の代替形の1つである。染色体上の所定の遺伝子座に存在する対立遺伝子全部が同一である場合、その生物は、その遺伝子座でホモ接合性である。染色体上の所定の遺伝子座に存在する対立遺伝子が異なる場合、その生物は、その遺伝子座でヘテロ接合性である。ポリペプチドの対立遺伝子バリアントは、遺伝子の対立遺伝子バリアントによってコードされるポリペプチドである。
本明細書で使用する場合、「宿主細胞」は、新たに導入されるDNA配列のための宿主又は発現媒体として作用する能力を有する細胞を指す。したがって、本開示の特定の実施形態では、宿主細胞は、バチルス属(Bacillus sp.)細胞である。
「組換え宿主細胞」(「遺伝子改変宿主細胞」とも呼ばれる)は、異種核酸、例えば組換えDNAコンストラクトが導入されているか、又は本明細書に記載されるガイドRNA/Casエンドヌクレアーゼ系などのゲノム改変系が導入されており、それを含む宿主細胞である。例えば、対象の細菌宿主細胞は、好適なバチルス属(Bacillus sp.)細胞への外来核酸(例えば、プラスミド又は環状組換えDNAコンストラクト)の導入により、遺伝子改変バチルス属(Bacillus sp.)細胞を含む。
本明細書で定義されるとおり、「親細胞」又は「親(宿主)細胞」は、互換的に使用され得、「未改変」親細胞を指す。例えば、「親」細胞は、「親」細胞のゲノムが(例えば、親細胞に導入された1つ以上の変異/改変によって)変更されて、その改変「娘」細胞を生成する微生物の任意の細胞又は株を指す。
本明細書で使用する場合、「改変細胞」又は「改変(宿主)細胞」は、互換的に使用され得、改変細胞が由来する「親」宿主細胞中に存在しない少なくとも1つの遺伝子改変を含む組換え(宿主)細胞を指す。
本明細書で使用する場合、「バチルス(Bacillus)属」又は「バチルス属(Bacillus sp.)」細胞には、当業者に知られる「バチルス(Bacillus)」属内の全ての種、例えば、以下に限定されないが、バチルス・サブチリス(Bacillus subtilis)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・レンツス(Bacillus lentus)、バチルス・ブレビス(Bacillus brevis)、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)、バチルス・アルカロフィルス(Bacillus alkalophilus)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)、バチルス・クラウシイ(Bacillus clausii)、バチルス・ハロデュランス(Bacillus.halodurans)、バチルス・メガテリウム(Bacillus.megaterium)、バチルス・コアギュランス(Bacillus coagulans)、バチルス・サーキュランス(Bacillus circulans)、バチルス・ラウツス(Bacillus lautus)及びバチルス・チューリンギエンシス(Bacillus thuringiensis)が含まれる。バチルス(Bacillus)属が分類学的再編成を受け続けていることは、認識されている。したがって、この属は、再分類された種、例えば、限定はしないが、現在、「ゲオバチルス・ステアロサーモフィルス(Geobacillus stearothermophilus)」と称されているB.ステアロサーモフィルス(B.stearothermophilus)などの生物体を含むものとする。
本明細書で使用する場合、用語「増加した」は、量又は活性の増加が比較されている量又は活性より少なくとも1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、100%又は少なくとも約2、3、4、5、6、7、8、9、10、11、12、13,14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390,400、410、420,430、440、440、450、460、470、480、490若しくは500倍多い量又は活性を指し得る。用語「増加した」、「~より大きい」及び「改善された」は、本明細書で互換的に使用される。用語「増加した」は、本明細書に記載される対照方法と比較して、本明細書に記載される多成分の方法によって得られる形質転換又は遺伝子編集効率を特徴付けるために使用され得る。
一態様では、増加は、目的の遺伝子を含むドナーDNA配列を含む線状組換えDNAコンストラクトを使用することによって得られる、バチルス属(Bacillus sp.)細胞への目的の遺伝子の組込み効率の増加であり、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000ヌクレオチドの短いホモロジーアームを有する対照組換えDNAによって得られるバチルス属(Bacillus sp.)細胞への前記目的の遺伝子の組込み効率と比較して、1000ヌクレオチドを超える長さである。一態様では、増加は、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13,14、15、16、17、18、19、20、21~最大で23倍の組込み効率における増加である。
本明細書で使用する場合、用語「組込み効率」は、そのゲノムに組み込まれる目的の所望の遺伝子を有する形質転換された細胞の数を、形質転換された細胞の総数で割ることによって定義される。この数に100を掛けて、%としてそれを表すことができる。
組込み効率(%)=(ゲノムに組み込まれる目的の遺伝子を有する形質転換された細胞の数/形質転換された細胞の総数)*100。
組込み効率(%)=(ゲノムに組み込まれる目的の遺伝子を有する形質転換された細胞の数/形質転換された細胞の総数)*100。
用語「保存ドメイン」又は「モチーフ」は、進化的に関連するタンパク質のアラインメントされた配列に沿って特定位置で保存された1セットのアミノ酸を意味する。他の位置のアミノ酸は、相同タンパク質間で変動し得る一方、特定の位置に高度に保存されるアミノ酸は、タンパク質の構造、安定性又は活性に必須のアミノ酸を示す。それらは、そのタンパク質ホモログのファミリーのアラインされた配列の高い保存度によって同定されるため、新しく決定された配列を有するタンパク質が予め同定されたタンパク質ファミリーに属するか否かを決定する識別子又は「シグネチャー」として使用することができる。
本明細書で使用する場合、「核酸」は、ポリヌクレオチドを意味し、デオキシリボヌクレオチド塩基又はリボヌクレオチド塩基の一本鎖又は二本鎖ポリマーを含む。核酸は、断片及び修飾ヌクレオチドも含み得る。したがって、用語「ポリヌクレオチド」、「核酸配列」、「ヌクレオチド配列」及び「核酸断片」は、一本鎖又は二本鎖であるRNA、及び/又はDNA、及び/又はRNA-DNAのポリマーを示すために互換的に使用され、任意選択により合成ヌクレオチド塩基、非天然ヌクレオチド塩基又は改変ヌクレオチド塩基を含有する。ヌクレオチド(通常、5’-一リン酸塩形態で見出される)は、単一文字表示により、以下のように称される:アデノシン又はデオキシアデノシン(それぞれRNA又はDNAに対して)に対して「A」、シトシン又はデオキシシトシンに対して「C」、グアノシン又はデオキシグアノシンに対して「G」、ウリジンに対して「U」、デオキシチミジンに対して「T」、プリン(A又はG)に対して「R」、ピリミジン(C又はT)に対して「Y」、G又はTに対して「K」、A又はC又はTに対して「H」、イノシンに対して「I」及び任意のヌクレオチドに対して「N」(例えば、DNA配列について言及する場合、Nは、A、C、T又はGであり得;RNA配列について言及する場合、Nは、A、C、U又はGであり得る)。
本明細書に記載されるポリヌクレオチド(又は核酸分子)は、「遺伝子」、「ベクター」及び「プラスミド」を含むことが理解される。
用語「遺伝子」は、あるタンパク質のコード配列の全て又は一部を含む特定のアミノ酸配列などであるが、これらに限定されない機能的な分子をコードするポリヌクレオチドを指し、例えば遺伝子が発現される条件を決定するプロモーター配列などの調節(非転写)配列を含み得る。遺伝子の転写領域は、イントロン、5’-非翻訳領域(UTR)及び3’-UTRを含む非翻訳領域(UTR)並びにコード配列を含み得る。「天然遺伝子」は、それ自体の調節配列とともに天然に見出される遺伝子を指す。
「コドン改変遺伝子」、又は「コドン優先遺伝子」、又は「コドン最適化遺伝子」とは、宿主細胞の好ましいコドン使用頻度を模倣するように設計されているコドン使用頻度を有する遺伝子のことである。遺伝子をコドン最適化するために行われる核酸変更は、親遺伝子のコードされるポリペプチドのアミノ酸配列を変更しないことを意味する「同義」である。しかしながら、天然遺伝子及びバリアント遺伝子の両方を特定の宿主細胞用にコドン最適化することができ、したがって、これに関して、制限は、意図されていない。コドン優先遺伝子を合成するための方法は、当技術分野で利用可能である。例えば、米国特許第5,380,831号明細書及び同第5,436,391号明細書並びにMurray et al.(1989)Nucleic Acids Res.17:477-498(参照により本明細書に組み込まれる)を参照されたい。
宿主生物体中で遺伝子発現を増強するために、追加の配列改変が知られる。これらとしては、例えば、疑似のポリアデ二ル化シグナルをコードする1つ以上の配列の除去、1つ以上のエクソン-イントロンスプライス部位シグナルの除去、1つ以上のトランスポゾン様リピートの除去及び遺伝子発現に有害である可能性のあるそうしたよく特徴付けられた他の配列の除去が挙げられる。配列のG-C含有量は、宿主細胞中で発現する既知の遺伝子を参照することによって算出される、所与の宿主生物体の平均的なレベルに調節され得る。可能な場合、1つ以上のmRNAの予測されるヘアピン二次構造を避けるために配列を改変する。
本明細書で使用する場合、用語「コード配列」は、その(コードされた)タンパク質産物のアミノ酸配列を直接的に指定するヌクレオチド配列を指す。コード配列の境界は、一般にオープンリーディングフレーム(以下では「ORF」)によって決定され、それは、通常、ATG開始コドンで開始する。コード配列には、通常、DNA、cDNA及び組換えヌクレオチド配列が含まれる。
本明細書で定義する場合、「オープンリーディングフレーム」(以下では「ORF」)という用語は、(i)開始コドン、(ii)アミノ酸を示す一連の2以上のコドン、及び(iii)終結コドンからなる連続するリーディングフレームを含む核酸又は核酸配列(天然に存在するか、天然に存在しないか、又は合成であるかにかかわらず)を意味し、ORFは、5’から3’の方向に読まれる(又は翻訳される)。
本明細書で使用する場合、用語「染色体組込み」は、目的のポリヌクレオチドがバチルス属(Bacillus sp.)染色体に組み込まれるプロセスを指す。線状ドナーDNAコンストラクト(ホモロジーアームによって隣接される線状ドナーDNA)のホモロジーアームは、バチルス属(Bacillus sp.)染色体の相同領域と整列されることになる。その後、ホモロジーアーム間の配列は、2つの交差(すなわち相同組換え)において目的のポリヌクレオチドによって置き換えられる。
「調節配列」は、コード配列の上流(5’非コード配列)、コード配列内又はコード配列の下流(3’非コード配列)に位置するヌクレオチド配列を指し、それは、関連するコード配列の転写、RNAプロセシング若しくは安定性又は翻訳に影響を及ぼす。調節配列としては、以下に限定されないが、プロモーター、翻訳リーダー配列、5’非翻訳配列、3’非翻訳配列、イントロン、ポリアデニル化標的配列、RNAプロセシング部位、エフェクター結合部位及びステムループ構造が挙げられる。
本明細書で使用する場合、用語「プロモーター」は、コード配列又は機能的RNAの発現を制御できる核酸配列を指す。一般に、コード配列は、プロモーター配列の3’(下流)に位置する。プロモーターは、それらの全体が天然遺伝子に由来し得るか、又は天然に見出される種々のプロモーターに由来する種々のエレメントから構成され得るか、又はさらに合成核酸セグメントを含み得る。種々のプロモーターは、種々の細胞型において、又は種々の発生段階において、又は種々の環境若しくは生理的条件に応答して、遺伝子の発現を指示し得ることが当業者に理解される。大多数の場合にほとんどの細胞型で遺伝子の発現をもたらすプロモーターは、一般に、「構成的プロモーター」と呼ばれる。ほとんどの場合、調節配列の正確な境界は、完全には明らかになっていないため、種々の長さのDNA断片が同一プロモーター活性を有し得ることがさらに認識されている。
「作動可能に連結される」は、2つ以上のエレメント間の機能的連結を意味するものとする。例えば、目的のポリヌクレオチドと調節配列(例えば、プロモーター)との間の作動可能な連結は、目的のポリヌクレオチドの発現を可能にする機能的連結である(すなわち、目的のポリヌクレオチドは、プロモーターの転写制御下にある)。作動可能に連結したエレメントは、連続的又は非連続的であり得る。コード配列(例えば、ORF)は、センス又はアンチセンス方向で調節配列に作動可能に連結され得る。2つのタンパク質コード領域の結合を指すために使用される場合、コード領域が同じリーディングフレームに存在することは、作動可能に連結されることによって意図される。
核酸は、それが別の核酸配列と機能的関連性に置かれている場合、「作動可能に連結されて」いる。例えば、分泌リーダー(すなわちシグナルペプチド)をコードするDNAは、ポリペプチドの分泌に関与するプレタンパク質として発現している場合、ポリペプチドのためのDNAに作動可能に連結しているか;プロモーター又はエンハンサーは、それが配列の転写に影響を及ぼす場合、そのコード配列に作動可能に連結しているか;又はリボソーム結合部位は、翻訳を促進するように配置されている場合、コード配列に作動可能に連結している。一般に、「作動可能に連結された」は、連結されているDNA配列が連続していること及び分泌リーダーの場合、連続しており且つ読み取り枠内にあることを意味する。しかしながら、エンハンサーは、隣接している必要はない。連結は、便宜的な制限部位でのライゲーションによって行われる。そのような部位が存在しない場合、従来の手法に従い、合成オリゴヌクレオチドアダプター又はリンカーが使用される。
本明細書で使用する場合、「目的のタンパク質コード配列の遺伝子に連結した目的の遺伝子の発現を制御する機能的プロモーター配列(又はそれらのオープンリーディングフレーム)」は、バチルス属(Bacillus)におけるコード配列の転写及び翻訳を制御するプロモーター配列を指す。例えば、特定の実施形態では、本開示は、5’プロモーター(又は5’プロモーター領域若しくはタンデム5’プロモーターなど)を含むポリヌクレオチドであって、そのプロモーター領域は、目的のタンパク質をコードする核酸配列に作動可能に連結している、ポリヌクレオチドを対象とする。したがって、特定の実施形態では、機能的プロモーター配列は、目的のタンパク質をコードする目的の遺伝子の発現を制御する。他の実施形態では、機能的プロモーター配列は、バチルス属(Bacillus sp.)細胞における目的のタンパク質をコードする異種遺伝子又は内在性遺伝子の発現を制御する。
プロモーター配列は、近位及びより遠位の上流エレメントからなり、後者のエレメントは、エンハンサーと称されることが多い。「エンハンサー」は、プロモーター活性を刺激することができるDNA配列であり、プロモーターの固有のエレメントであり得るか、又はプロモーターのレベル若しくは組織特異性を増強するために挿入された異種エレメントであり得る。
本明細書で開示される線状組換えDNA及び環状組換えDNAは、当技術分野において知られる任意の方法を使用してバチルス属(Bacillus sp.)細胞に導入され得る。
本明細書で定義する場合、「導入する」という用語は、少なくとも1つの組換えDNA、ポリヌクレオチド又はその遺伝子若しくはそのベクターを「細菌細胞に導入する」又は「バチルス属(Bacillus sp.)細胞に導入する」などの句で使用する場合、ポリヌクレオチドを細胞に導入するための当技術分野で知られる方法を含み、こうした方法としては、以下に限定されないが、プロトプラスト融合、天然又は人工形質転換(例えば、塩化カルシウム、エレクトロポレーション、熱ショック)、形質導入、トランスフェクション、接合などが挙げられる(例えば、Ferrari et al.,1989を参照されたい)。
「導入する」は、成分が生物体の細胞の内部又は細胞自体へ侵入するような方法において、細胞又は生物体などの生物体に、本明細書で開示される線状組換えDNA及び/又は環状組換えDNAを提供することを意味することが意図される。方法及び組成物は、生物体又は細胞に配列を導入するための特定の方法に依存せず、この生物体の少なくとも1つの細胞の内部に、本明細書で開示される線状組換えDNA及び/又は環状組換えDNAを単に侵入させるのみである。導入することは、核酸が細胞のゲノム内に組み込まれ得る(統合され得る)、バチルス属(Bacillus sp.)細胞内への核酸の組込みに関する言及を含み、且つ細胞への核酸の一過性(直接的)提供についての言及を含む。
細胞又は生物体にポリヌクレオチド、発現カセット、組換えDNAを導入するための方法は、当技術分野において知られており、自然形質転換能(国際公開第2017/075195号パンフレット、国際公開第2002/14490号パンフレット及び国際公開第2008/7989号パンフレットに記載されるとおり)、マイクロインジェクション(Crossway et al.,(1986)Biotechniques 4:320-34及び米国特許第6,300,543号明細書)、メリステム形質転換(米国特許第5,736,369号明細書)、エレクトロポレーション(Riggs et al.,(1986)Proc.Natl.Acad.Sci.USA 83:5602-6)、安定形質転換法、一過性形質転換法、弾道粒子加速法(微粒子銃)(米国特許第4,945,050号明細書;同第5,879,918号明細書;同第5,886,244号明細書;同第5,932,782号明細書)、ウイスカー媒介性形質転換(Ainley et al.2013,Plant Biotechnology Journal 11:1126-1134;Shaheen A.and M.Arshad 2011 Properties and Applications of Silicon Carbide(2011),345-358 Editor(s):Gerhardt,Rosario.Publisher:InTech,Rijeka,Croatia.CODEN:69PQBP;ISBN:978-953-307-201-2)、アグロバクテリウム(Agrobacterium)媒介性形質転換(米国特許第5,563,055号明細書及び同第5,981,840号明細書)、直接的遺伝子移入(Paszkowski et al.,(1984)EMBO J 3:2717-22)、ウイルス媒介性導入(米国特許第5,889,191号明細書、同第5,889,190号明細書、同第5,866,785号明細書、同第5,589,367号明細書及び同第5,316,931号明細書)、トランスフェクション、形質導入、細胞透過性ペプチド、メソポーラスシリカナノ粒子(MSN)媒介性の直接的タンパク質送達、局所適用、雄雌交雑、雌雄育種及びこれらの任意の組合せを含むが、これらに限定されない。安定形質転換は、生物体に導入されたヌクレオチドコンストラクトが生物体のゲノムに組み込まれ、その子孫に受け継がれ得ることを意味することが意図される。一過性形質転換は、ポリヌクレオチドが生物体に(直接的又は間接的に)導入されるが、この生物体のゲノムに組み込まれないか、又はポリペプチドが生物体に導入されることを意味することが意図される。一過性形質転換は、導入された組成物は、生物体内で一時的にのみ発現又は存在することを示す。
ゲノムの標的部位又はその近傍への挿入がなされたそれらの細胞を同定するために様々な方法が利用可能である。そのような方法は、PCR法、シークエンシング法、ヌクレアーゼ消化法、サザンブロット法及びそれらの任意の組合せを含むが、これらに限定されない、標的配列内の何らかの変化を検出するために標的配列を直接的に分析することであるとみなすことができる。例えば、本明細書に記載される方法に必要な範囲で参照により本明細書に組み込まれる米国特許出願第12/147,834号明細書を参照されたい。方法は、ゲノムに組み込まれた目的のポリヌクレオチドを含む細胞から生物体を回収することも含む。
用語「ゲノム」、細菌(宿主)細胞「ゲノム」又はバチルス(Bacillus)(宿主)細胞「ゲノム」は、核内に見出される染色体DNAのみならず、細胞の細胞内成分内に見出されるオルガネラDNA(染色体外DNA)を含む。
本明細書で使用する場合、用語「プラスミド」、「ベクター」及び「カセット」は、多くの場合、細胞の中心的な代謝に通常関与しない遺伝子を有し、通常、二本鎖DNA分子の形態の染色体外エレメントを指す。そのようなエレメントは、任意の供給源に由来する、線状又は環状の一本鎖又は二本鎖のDNA又はRNAである自己複製配列、ゲノム組込み配列ファージ又はヌクレオチド配列であり得、ここで、いくつかのヌクレオチド配列は、選択された遺伝子産物のためのプロモーター断片及びDNA配列を適切な3’非翻訳配列とともに細胞に導入することができる固有の構成に結合又は組み換えられている。
用語「ベクター」は、細胞内で複製(増殖)することができ、新たな遺伝子又はDNAセグメントを細胞中に運ぶことができる任意の核酸を含む。ベクターとしては、「エピソーム」(すなわち自律的に複製するか、又は宿主生物体の染色体に組み込むことができる)である、ウイルス、バクテリオファージ、プロウイルス、プラスミド、ファージミド、トランスポゾン及びBAC(細菌人工染色体)などの人工染色体が挙げられる。
用語「発現カセット」及び「発現ベクター」は、細胞内の特定の核酸の転写を許容する一連の特定の核酸要素を用いて、組換え的又は合成的に生成された核酸コンストラクトを指す。組換え発現カセットは、プラスミド、染色体、ミトコンドリアDNA、プラスチドDNA、ウイルス又は核酸断片内に組み込むことができる。通常、発現ベクターの組換え発現カセット部分には、他の配列の中でも、転写対象の核酸配列及びプロモーターが含まれる。いくつかの実施形態では、DNAコンストラクトには、標的細胞内の特定の核酸の転写を許容する一連の特定の核酸要素も含まれる。特定の実施形態では、本開示のDNAコンストラクトは、本明細書で定義する選択マーカー及び不活化染色体若しくは遺伝子セグメント又はDNAセグメントを含む。多数の原核生物発現ベクターが市販されており、当業者に知られている。適切な発現ベクターの選択は、当業者の知識の範囲内である。
本明細書で使用する場合、「ターゲティングベクター」は、その中にターゲティングベクターが形質転換される宿主細胞の染色体内の領域に相同なポリヌクレオチド配列を含み、その領域で相同組換えを駆動できるベクターである。例えば、ターゲティングベクターは、相同組換えによって宿主細胞の染色体に変異を導入する際に使用される。いくつかの実施形態では、ターゲティングベクターは、例えば、末端に付加された他の非相同配列(すなわちスタッファー配列又は隣接配列)を含む。末端は、例えば、ベクターへの挿入などのように、ターゲティングベクターが閉環を形成するように閉じることができる。適切なベクターの選択及び/又は構成は、十分に当業者の知識の範囲内である。
本明細書で使用する場合、用語「プラスミド」は、クローニングベクターとして使用され、且つ多くの細菌及び一部の真核生物において染色体外の自己複製遺伝要素を形成する環状の二本鎖(ds)DNAコンストラクトを指す。いくつかの実施形態では、プラスミドは、宿主細胞のゲノムに組み込まれる。
目的のポリヌクレオチドは、本明細書にさらに記載され、商業市場及び酵素の生産(細菌の発酵によって酵素を生産することを介するが、これに限定されない)に関与する人々の関心を反映するポリヌクレオチドを含む。
目的のポリヌクレオチドは、1つ以上の目的のタンパク質をコードできる。それは、他の生体機能を有し得る。目的のポリヌクレオチドは、形質転換されることになるバチルス属(Bacillus sp.)細胞のゲノム、すなわち同種又は異種配列のいずれかに既に存在しても又はしなくてもよい。
目的のヌクレオチドは、標的化される目的の遺伝子配列に関するメッセンジャーRNA(mRNA)の少なくとも一部に相補的なアンチセンス配列を含み得る。アンチセンスヌクレオチドは、対応するmRNAとハイブリダイズするように構成されている。アンチセンス配列は、その配列が対応するmRNAにハイブリダイズして、その発現を妨げる限り、改変され得る。この方法において、対応するアンチセンス配列に対して70%、80%又は85%の配列同一性を有するアンチセンス構築物を使用し得る。さらに、アンチセンスヌクレオチドの部分は、標的遺伝子の発現を妨げるために使用され得る。一般に、少なくとも50ヌクレオチド、100ヌクレオチド、200ヌクレオチド又はそれを超える配列が使用され得る。
さらに、目的のポリヌクレオチドは、生物体の内在性遺伝子の発現を抑制するセンス方向でも使用され得る。センス方向のポリヌクレオチドを使用して生物体の遺伝子発現を抑制するための方法は、当技術分野で知られている。この方法には、一般に、内在性遺伝子の転写に対応するヌクレオチド配列の少なくとも一部に作動可能に連結した、生物体内での発現を駆動するプロモーターを含むDNAコンストラクトで生物体を形質転換することが含まれる。通常、そのようなヌクレオチド配列は、内在性遺伝子の転写配列に対する実質的な配列同一性、一般に約65%を超える配列同一性、約85%を超える配列同一性又は約95%を超える配列同一性を有する。米国特許第5,283,184号明細書及び同第5,034,323号明細書(参照により本明細書に組み込まれる)を参照されたい。
表現型マーカーは、陽性選択マーカーであるか又は陰性選択マーカーであるかにかかわらず、視覚マーカー及び選択マーカーを含むスクリーニング可能又は選択マーカーである。任意の表現型マーカーを使用することができる。詳細には、選択マーカー又はスクリーニング可能マーカーは、多くの場合に特定の条件下において、1つの分子若しくはそれを含有する細胞を同定するか、又はこの分子若しくは細胞に有利若しくは不利に選択することを可能にするDNAセグメントを含む。これらのマーカーは、RNA、ペプチド若しくはタンパク質の産生などであるが、これらに限定されない活性をコードすることができるか、又はRNA、ペプチド、タンパク質、無機化合物及び有機化合物若しくは組成物などのための結合部位を提供することができる。
用語「選択マーカー」及び「選択マーカーをコードするヌクレオチド配列」は、(宿主)細胞内で発現することができ、選択マーカーの発現が、発現した遺伝子を含有する細胞に、対応する選択的作用物質の存在下又は必須栄養素の欠如下で増殖する能力を付与するヌクレオチド配列を指す。一態様では、選択マーカーは、ベクターを含有するそれらの宿主の選択を容易にできる、宿主細胞内で発現することができる核酸(例えば、遺伝子)を指す。そのような選択マーカーの例としては、抗菌剤が挙げられるが、これらに限定されない。
用語「選択マーカー」は、宿主細胞が目的の入来DNAを取り込んだか、又は何らかの他の反応が発生したことの兆候を提供する遺伝子を含む。通常、選択マーカーは、形質転換中に外来配列を受け入れていない細胞から外来DNAを含有する細胞を区別することを可能にする抗菌剤耐性又は代謝的優位性を宿主細胞に付与する遺伝子である。
「存在する選択マーカー」は、形質転換されることになる微生物の染色体上に位置するものである。存在する可能マーカーは、形質転換DNAコンストラクト上の選択マーカーと異なる遺伝子をコードする。選択マーカーは、当業者によく知られている。上記で示したように、マーカーは、抗微生物耐性マーカー(例えば、ampR、phleoR、specR、kanR、eryR、tetR、cmpR及びneoR(例えば、Guerot-Fleury,1995;Palmeros et al.,2000;及びTrieu-Cuot et al.,1983を参照されたい)であり得る。いくつかの実施形態では、本発明は、クロラムフェニコール耐性遺伝子(例えば、pC194上に存在する遺伝子及びバチルス・リケニフォルミス(Bacillus licheniformis)のゲノム内に存在する耐性遺伝子)を提供する。この耐性遺伝子は、本発明において且つ染色体に組み込まれたカセット及び組込み型プラスミドの染色体増幅を包含する実施形態において特に有用である(例えば、Albertini and Galizzi,1985;Stahl and Ferrari,1984を参照されたい)。本発明に従って有用な他のマーカーとしては、セリン、リシン、トリプトファンなどの栄養要求性マーカー及びβ-ガラクトシダーゼなどの検出マーカーが挙げられるが、これらに限定されない。
目的のポリヌクレオチドは、他の形質と組み合わせて積み重ねられ得るか又は使用され得る遺伝子を含む。
本明細書で使用する場合、用語「ポリペプチド」及び「タンパク質」は、互換的に使用され、ペプチド結合によって連結されたアミノ酸残基を含む任意の長さのポリマーを指す。本明細書では、アミノ酸残基に関して従来の1文字コード又は3文字コードを使用する。ポリペプチドは、直鎖状又は分岐鎖状であり得、改変アミノ酸を含み得、且つ非アミノ酸によって分断され得る。ポリポチペプチドという用語は、自然に又は介入;例えばジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化若しくは標識化成分との結合などの任意の他の操作若しくは改変によって改変されているアミノ酸ポリマーも包含する。また、この定義の範囲には、例えば、アミノ酸の1つ以上のアナログ(例えば、非天然アミノ酸などを含む)を含有するポリペプチド及び当技術分野において知られる他の改変も含まれる。
用語「目的のタンパク質」又は「POI」は、改変されたバチルス(Bacillus)(娘)細胞において発現することが所望される目的のポリペプチドを指す。したがって、本明細書で使用する場合、POIは、酵素、基質結合タンパク質、表面活性タンパク質、構造タンパク質、受容体タンパク質、抗体などであり得る。
本明細書で使用する場合、「目的の遺伝子」又は「GOI」は、POIをコードする核酸配列(例えば、ポリヌクレオチド、遺伝子又はORF)を指す。「目的のタンパク質」をコードする「目的の遺伝子」は、天然に存在する遺伝子、変異遺伝子又は合成遺伝子であり得る。
特定の実施形態では、本開示の目的の遺伝子は、酵素(例えば、アセチルエステラーゼ、アミノペプチダーゼ、アミラーゼ、アラビナーゼ、アラビノフラノシダーゼ、炭酸脱水酵素、カルボキシペプチダーゼ、カタラーゼ、セルラーゼ、キチナーゼ、キモシン、クチナーゼ、デオキシリボヌクレアーゼ、エピメラーゼ、エステラーゼ、α-ガラクトシダーゼ、β-ガラクトシダーゼ、α-グルカナーゼ、グルカンリザーゼ(glucan lysase)、エンド-β-グルカナーゼ、グルコアミラーゼ、グルコースオキシダーゼ、α-グルコシダーゼ、β-グルコシダーゼ、グルクロニダーゼ、グリコシルヒドロラーゼ、ヘミセルラーゼ、ヘキソースオキシダーゼ、ヒドロラーゼ、インベルターゼ、イソメラーゼ、ラッカーゼ、リパーゼ、リアーゼ、マンノシダーゼ、オキシダーゼ、酸化還元酵素、ペクチン酸リアーゼ、ペクチンアセチルエステラーゼ、ペクチンデポリメラーゼ、ペクチンメチルエステラーゼ、ペクチン分解酵素、ペルヒドロラーゼ、ポリオールオキシダーゼ、ペルオキシダーゼ、フェノールオキシダーゼ、フィターゼ、ポリガラクツロナーゼ、プロテアーゼ、ペプチダーゼ、ラムノ-ガラクツロナーゼ、リボヌクレアーゼ、トランスフェラーゼ、輸送タンパク質、トランスグルタミナーゼ、キシラナーゼ、ヘキソースオキシダーゼ及びこれらの組合せ)などの商業的に関連する工業用の目的のタンパク質をコードする。
「変異」は、核酸配列内の任意の変化又は変更を指す。点変異、欠失変異、サイレント変異、フレームシフト変異、スプライシング変異などを含む数種類の変異が存在する。変異は、特異的に(例えば、部位特異的変異誘発によって)又はランダムに(例えば、化学薬品、修復マイナス細菌株による継代によって)行われ得る。
「変異遺伝子」は、ヒトが介入して改変された遺伝子である。そのような「変異遺伝子」は、少なくとも1個のヌクレオチドの付加、欠失又は置換により、対応する非変異遺伝子の配列と異なる配列を有する。本開示の特定の実施形態では、この変異遺伝子は、本明細書で開示されるとおりのガイドポリヌクレオチド/Casタンパク質系の結果として生じる変更を含む。変異細胞又は生物体は、変異遺伝子を含む細胞又は生物体である。
本明細書で使用する場合、「標的化変異」は、誘導型Casタンパク質系を含む方法を含む、当業者に知られる任意の方法を使用して標的遺伝子内の標的配列を改変することによって作製された、天然遺伝子を含む、遺伝子(標的遺伝子と呼ばれる)中の変異である。Casタンパク質がcasエンドヌクレアーゼである場合、ガイドポリヌクレオチド/Casエンドヌクレアーゼ誘導標的化変異は、Casエンドヌクレアーゼによって認識及び切断されるゲノム標的部位の内又は外に位置するヌクレオチド配列内で発生し得る。
本明細書で使用する場合、ポリペプチド又はその配列に関連して、用語「置換」は、1つのアミノ酸の別のアミノ酸との置き換え(すなわち置換)を意味する。
本明細書で定義する場合、「内在性遺伝子」は、生物体のゲノム中の天然の位置に存在する遺伝子を指す。
本明細書で使用する場合、ポリヌクレオチド又はポリペプチド配列に関連した「異種」は、外来種を起源とする配列であるか、又は同種からのものであれば、組成及び/又はゲノム遺伝子座が意図的な人的介入により天然の形態から実質的に改変されている配列である。例えば、異種ポリヌクレオチドに作動可能に連結されたプロモーターは、このポリヌクレオチドが由来した種と異なる種からのものであるか、又は同一/類似種からのものであれば、一方若しくは両方が元の形態及び/若しくはゲノム遺伝子座から実質的に改変されているか、又はこのプロモーターが、作動可能に連結されたポリヌクレオチドの天然プロモーターではない。本明細書で使用する場合、別段の指定がない限り、キメラポリヌクレオチドは、コード配列に対して異種である転写開始領域に作動可能に連結したコード配列を含む。
本明細書で定義する場合、「異種」遺伝子、「非内在性」遺伝子又は「外来」遺伝子は、通常、宿主生物体に見出されないが、遺伝子導入によって宿主生物体に導入される遺伝子(又はORF)を指す。本明細書で使用する場合、用語「外来」遺伝子は、非天然生物中に挿入された天然遺伝子(若しくはORF)及び/又は天然若しくは非天然生物中に挿入されたキメラ遺伝子を含む。
本明細書で定義する場合、「異種」核酸コンストラクト又は「異種」核酸配列は、その中でそれが発現する細胞に対して天然ではない配列の部分を有する。
本明細書で定義する場合、「異種制御配列」は、天然では目的の遺伝子の発現を調節(制御)するために機能しない遺伝子発現制御配列(例えば、プロモーター又はエンハンサー)を指す。一般に、異種核酸配列は、その中にそれらが存在する細胞又はゲノムの一部に対して内在性(天然)ではなく、感染、トランスフェクション、形質転換、マイクロインジェクション、エレクトロポレーションなどによって細胞に付加されている。「異種」核酸コンストラクトは、天然宿主細胞内で見出される制御配列/DNAコード配列の組み合わせと同一の又は異なる制御配列/DNAコード(ORF)配列の組合せを含有し得る。
本明細書で使用する場合、用語「シグナル配列」及び「シグナルペプチド」は、成熟タンパク質又はタンパク質の前駆体形の分泌又は直接輸送に関与する可能性があるアミノ酸残基の配列を指す。シグナル配列は、一般的には、前駆体又は成熟タンパク質配列のN末端に位置する。シグナル配列は、内在性又は外来性であり得る。シグナル配列は、通常、成熟タンパク質に存在しない。シグナル配列は、一般的には、タンパク質が輸送された後にシグナルペプチダーゼによってタンパク質から切断される。
用語「由来する」には、用語「~から生じた」、「~から得られた」、「~から入手可能な」及び「~から作製された」が含まれ、一般には、1つの特定の材料若しくは組成物が別の材料若しくは組成物にその起源が見出されるか、又は他の特定の材料若しくは組成物を参照して記載できる特徴を有することを示す。
本明細書で使用する場合、「隣接配列」は、考察対象の配列の上流又は下流にある任意の配列を指す(例えば、遺伝子A-B-Cでは、遺伝子BがA及びCの遺伝子配列によって隣接される)。特定の実施形態では、入来配列は、両側でホモロジーアームによって隣接される。いくつかの実施形態では、隣接配列は、一方の側(3’又は5’)にのみ存在するが、他の実施形態では、隣接されている配列の両側に存在する。各ホモロジーアームの配列は、バチルス属(Bacillus sp.)ゲノム(バチルス(Bacillus)染色体など)中の配列に相同である。
本明細書で使用する場合、用語「スタッファー配列」は、ホモロジーアーム(一般的にはベクター配列)に隣接している任意の余分なDNAを指す。しかし、この用語は、任意の非相同DNA配列を包含する。いかなる理論によっても限定されるものではないが、スタッファー配列は、細胞がDNA取り込みを開始するために重要ではない標的を提供する。
核酸配列又はポリペプチド配列に関連して、配列同一性」又は「同一性」は、特定の比較ウィンドウ全体にわたり最大の一致のために整列された場合に同一である2つの配列における核酸塩基又はアミノ酸残基を意味する。
用語「配列同一性のパーセンテージ」は、比較ウィンドウ全体にわたり2つの最適に整列された配列を比較することにより決定される値を指し、比較ウィンドウ中のポリヌクレオチド配列又はポリペプチド配列の部分は、これらの2つの配列を最適に整列させるために、参照配列(付加又は欠失を含まない)と比較して付加又は欠失(すなわちギャップ)を含む場合がある。パーセンテージは、両方の配列内で同一の核酸塩基又はアミノ酸残基が生じる位置の数を求めて、マッチした位置の数を得て、マッチした位置の数を比較ウィンドウ内の位置の総数で除して、その結果に100を乗じて配列同一性のパーセンテージを得ることによって算出される。配列同一性パーセントの有用な例としては、50%、55%、60%、65%、70%、75%、80%、85%、90%若しくは95%又は50%~100%の任意の整数パーセンテージが挙げられるが、これらに限定されない。これらの同一性は、本明細書に記載したプログラムのいずれかを使用して決定することができる。
配列アラインメント及び同一性又は類似性のパーセントの計算は、LASERGENEバイオインフォマティクスコンピューティングスイート(DNASTAR Inc.,Madison,WI)のMegAlign(商標)プログラム(これに限定されない)を含む、相同配列を検出するために設計された様々な比較方法を使用して決定することができる。本出願に関連して、配列分析ソフトウェアが分析に使用される場合、他に規定されない限り、分析結果は、言及したプログラムの「デフォルト値」をベースとすることが理解されるであろう。本明細書で使用する「デフォルト値」は、最初に初期化されると、ソフトウェアで最初にロードされる数値又はパラメーターの任意のセットを意味するであろう。
「アラインメントのClustal V法」は、Clustal V(Higgins and Sharp,(1989)CABIOS 5:151-153;Higgins et al.,(1992)Comput Appl Biosci 8:189-191により説明されている)と表示され、LASERGENEバイオインフォマティクスコンピューティングスイート(DNASTAR Inc.,Madison,WI)のMegAlign(商標)プログラム中に見出されるアラインメント法に対応する。多重アラインメントの場合、デフォルト値は、GAP PENALTY=10及びGAP LENGTH PENALTY=10に対応する。Clustal法を使用したタンパク質配列のペアワイズアラインメント及び同一性パーセントの算出のためのデフォルトパラメーターは、KTUPLE=1、GAP PENALTY=3、WINDOW=5及びDIAGONALS SAVED=5である。核酸の場合、これらのパラメーターは、KTUPLE=2、GAP PENALTY=5、WINDOW=4及びDIAGONALS SAVED=4である。Clustal Vプログラムを使用した配列のアラインメント後、同一プログラム中の「配列距離」表を調べることにより、「同一性パーセント」を得ることができる。
「アラインメントのClustal W法」は、Clustal W(Higgins and Sharp,(1989)CABIOS 5:151-153;Higgins et al.,(1992)Comput Appl Biosci 8:189-191により説明されている)と表示され、LASERGENEバイオインフォマティクスコンピューティングスイート(DNASTAR Inc.,Madison,WI)のMegAlign(商標)v6.1プログラム中に見出されるアラインメント法に対応する。多重アラインメントのためのデフォルトパラメーター(GAP PENALTY=10、GAP LENGTH PENALTY=0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein Weight Matrix=Gonnet Series、DNA Weight Matrix=IUB)。Clustal Wプログラムを使用した配列のアラインメント後、同一プログラム中の「配列距離」表を調べることにより、「同一性パーセント」を得ることができる。
別途指定しない限り、本明細書に示される配列同一性/類似性値は、以下のパラメーターを用いるGAP Version 10(GCG、Accelrys,San Diego,CA)を使用して得られた値を指す:ヌクレオチド配列の同一性%及び類似性%は、ギャップ生成ペナルティウエイト50、ギャップ長伸長ペナルティウエイト3及びnwsgapdna.cmpスコアリングマトリックスを使用;アミノ酸配列の同一性%及び類似性%は、ギャップ生成ペナルティウエイト8、ギャップ長伸長ペナルティ2及びBLOSUM62スコアリングマトリックスを使用(Henikoff and Henikoff,(1989)Proc.Natl.Acad.Sci.USA 89:10915)。GAPは、Needleman and Wunsch,(1970)J Mol Biol 48:443-53のアルゴリズムを使用して、一致した数を最大化し、ギャップ数を最小限に抑える2種の配列全体のアラインメントを見出す。GAPは、全ての可能なアラインメント及びギャップ位置を考慮し、一致した塩基の単位でギャップ生成ペナルティ及びギャップ伸長ペナルティを使用して、一致した塩基の最大数及び最小のギャップを有するアラインメントを作成する。
「BLAST」は、国立生物工学情報センター((NCBI)によって提供されている、生物学的配列の類似領域を見出すために使用される検索アルゴリズムである。このプログラムでは、ヌクレオチド配列又はタンパク質配列を配列データベースと比較し、一致の統計学的有意性を計算して、問い合わせ配列に十分類似した配列を、類似性がランダムに起こったと予想されないように特定する。BLASTは、特定された配列及びそれらの問い合わせ配列に対するローカルアラインメントを報告する。
多くのレベルの配列同一性は、他の種からの又は天然に若しくは合成により改変されているポリペプチド(そのようなポリペプチドは、同一の又は類似した機能又は活性を有する)の特定に有用であることが当業者によく理解されるであろう。同一性パーセントの有用な例としては、限定はされないが、50%、55%、60%、65%、70%、75%、80%、85%、90%若しくは95%又は50%~100%の任意の整数パーセンテージが挙げられる。実際に、50%~100%の任意の整数のアミノ酸同一性、例えば51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%又は99%の同一性は、本開示の説明に有用であり得る。
「翻訳リーダー配列」は、遺伝子のプロモーター配列とコード配列との間に位置するポリヌクレオチド配列を指す。翻訳リーダー配列は、mRNAの翻訳開始配列の上流に存在する。翻訳リーダー配列は、mRNAへの一次転写物のプロセシング、mRNAの安定性又は翻訳効率に影響し得る。翻訳リーダー配列の例が記載されている(例えば、Turner and Foster,(1995)Mol Biotechnol 3:225-236を参照されたい)。
「3’非コード配列」、「転写ターミネーター」又は「終結配列」は、コード配列の下流に位置するDNA配列を指し、ポリアデニル化認識配列及びmRNAプロセシング又は遺伝子の発現に影響を及ぼすことができる、調節シグナルをコードする他の配列を含む。ポリアデニル化シグナルは、通常、mRNA前駆体の3’末端へのポリアデニル酸区域の付加に影響を及ぼすことによって特徴付けられる。様々な3’非コード配列の使用は、Ingelbrecht et al.,(1989)Plant Cell 1:671-680によって例示されている。
本明細書で使用する場合、「RNA転写物」は、RNAポリメラーゼにより触媒されるDNA配列の転写により生じる産物を指す。RNA転写物が、DNA配列の完全に相補的なコピーである場合、それは、一次転写物又はプレmRNAと呼ばれる。RNA転写物が、一次転写物プレmRNAの転写後のプロセシングで得られたRNA配列である場合、それは、成熟RNA又はmRNAと呼ばれる。「メッセンジャーRNA」又は「mRNA」は、イントロンを有しておらず、細胞によりタンパク質に翻訳され得るRNAを指す。「cDNA」は、mRNA鋳型に相補的であり、且つ逆転写酵素を使用してmRNA鋳型から合成されるDNAを指す。cDNAは、単鎖であるか、又はDNAポリメラーゼIのクレノウ断片を使用して二本鎖形態に変換され得る。「センス」RNAは、mRNAを含むRNA転写物を指し、細胞内又はインビトロでタンパク質に翻訳することができる。「アンチセンスRNA」は、標的一次転写物又はmRNAの全部又は一部に対して相補的であり、標的遺伝子の発現を遮断するRNA転写物を指す(例えば、米国特許第5,107,065号明細書を参照されたい)。アンチセンスRNAの相補性は、特定の遺伝子転写物の任意の部分、すなわち5’非コード配列、3’非コード配列、イントロン又はコード配列との相補性であり得る。「機能的RNA」は、アンチセンスRNA、リボザイムRNA又は翻訳され得ないが、それにもかかわらず細胞内プロセスに影響を及ぼす他のRNAを指す。用語「相補体」及び「逆相補体」は、mRNA転写物に関して本明細書では互換的に使用され、メッセージのアンチセンスRNAを定義することが意図されている。
「成熟」タンパク質は、翻訳後にプロセシングされたポリペプチド(すなわち一次翻訳産物中に存在する任意のプレペプチド又はプロペプチドが除去されているもの)を指す。「前駆体」タンパク質は、mRNAの翻訳の一次産物(すなわちプレペプチド及びプロペプチドが依然として存在する)を指す。プレペプチド及びプロペプチドは、細胞内局在化シグナルであり得るが、これに限定されない。
タンパク質は、アミノ酸の置換、欠失、トランケーション及び挿入を含む様々な方法で改変され得る。そのような操作のための方法は、一般に知られている。例えば、タンパク質のアミノ酸配列バリアントは、DNA内の変異によって調製することができる。変異誘発及びヌクレオチド配列改変の方法としては、例えば、Kunkel,(1985)Proc.Natl.Acad.Sci.USA 82:488-92;Kunkel et al.,(1987)Meth Enzymol 154:367-82;米国特許第4,873,192号明細書;Walker and Gaastra,eds.(1983)Techniques in Molecular Biology(MacMillan Publishing Company,New York)及びそこで引用された文献が挙げられる。タンパク質の生物学的活性に影響を与えそうにないアミノ酸置換についてのガイダンスは、例えば、Dayhoff et al.,(1978)Atlas of Protein Sequence and Structure(Natl Biomed Res Found,Washington,D.C.)のモデルに見出される。1つのアミノ酸を類似の特性を有する別のアミノ酸と交換するなどの保存的置換が好ましい可能性がある。保存的な欠失、挿入及びアミノ酸置換は、タンパク質の特性に過激な変化を引き起こさないことが予期され、置換、欠失、挿入又はこれらの組合せの影響は、通例のスクリーニング分析で評価することができる。二本鎖切断誘発活性の分析法が知られており、一般に、標的部位を含有するDNA基質上における試薬の全体の活性及び特異性を測定する。
標準のDNA単離、精製、分子クローニング、ベクター構築及び検証/特徴付けの方法は、十分に確立されており、例えばSambrook et al.,(1989)Molecular Cloning:A Laboratory Manual,(Cold Spring Harbor Laboratory Press,NY)を参照されたい。ベクター及びコンストラクトは、環状プラスミド及び線形ポリヌクレオチドを含み、これらは、目的のポリヌクレオチド及び任意選択により、リンカー、アダプター、調節要素又は分析要素を含む他の構成要素を含む。いくつかの実施例では、認識部位及び/又は標的部位は、イントロン、コード配列、5’UTR、3’UTR及び/又は調節領域内に含有され得る。
略語の意味は、以下のとおりである:「sec」は、秒を意味し、「min」は、分を意味し、「h」は、時間を意味し、「d」は、日を意味し、「μL」は、マイクロリットルを意味し、「mL」は、ミリリットルを意味し、「L」は、リットルを意味し、「μM」は、マイクロモルを意味し、「mM」は、ミリモルを意味し、「M」は、モルを意味し、「mmol」は、ミリモルを意味し、「μmole」は、マイクロモルを意味し、「g」は、グラムを意味し、「μg」は、マイクログラムを意味し、「ng」は、ナノグラムを意味し、「U」は、単位を意味し、「bp」は、塩基対を意味し、及び「kb」は、キロベースを意味する。
本明細書で開示する組成物及び方法の非限定的な例は、下記のとおりである。
1.バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス属(Bacillus sp.)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
2.ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接され、各ホモロジーアームは、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000を超え、且つ最大で6000のヌクレオチド長であり、及びバチルス属(Bacillus sp.)細胞のゲノム上の前記標的部位に対する配列相同性を含む、実施形態1の方法。
3.ドナーDNA配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーRNAの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか1つの組合せからなる群から選択されるヌクレオチド配列を含む、先行する実施形態のいずれかの方法。
4.線状組換えDNAコンストラクトは、スタッファー配列をさらに含む、先行する実施形態のいずれかの方法。
5.線状組換えDNAコンストラクトは、一本鎖DNAである、先行する実施形態のいずれかの方法。
6.線状組換えDNAコンストラクトは、二本鎖DNAである、先行する実施形態のいずれかの方法。
7.前記バチルス属(Bacillus sp.)細胞からの子孫細胞を増殖させ、且つバチルス属(Bacillus sp.)子孫細胞であって、そのゲノム中に安定に組み込まれたドナーDNA配列を有するバチルス属(Bacillus sp.)子孫細胞を選択することをさらに含む、先行する実施形態のいずれかの方法。
8.前記環状組換えDNAコンストラクトは、前記バチルス属(Bacillus sp.)子孫細胞のゲノムに組み込まれない選択マーカーを含む、先行する実施形態のいずれかの方法。
9.前記選択マーカーは、前記バチルス属(Bacillus sp.)子孫細胞のゲノムに安定に組み込まれない、実施形態8の方法。
10.線状組換えDNAコンストラクト及び第2の環状組換えDNAコンストラクトを含有しないバチルス属(Bacillus sp.)子孫細胞をさらに選択する、実施形態8の方法。
11.バチルス属(Bacillus sp.)細胞のゲノム上の標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、先行する実施形態のいずれかの方法。
12.ドナーDNAは、目的の遺伝子を含む、実施形態3の方法。
13.バチルス属(Bacillus sp.)細胞に、1000ヌクレオチドの上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接される前記ドナーDNA配列を含む線状組換えDNAコンストラクトと、前記環状組換えDNAコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~最大で23倍高い、バチルス属(Bacillus sp.)細胞のゲノムへのドナーDNA配列の組込みの頻度を有する、先行する実施形態のいずれかの方法。
14.バチルス属(Bacillus sp.)細胞は、バチルス・サブチリス(Bacillus subtilis)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・レンツス(Bacillus lentus)、バチルス・ブレビス(Bacillus brevis)、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)、バチルス・アルカロフィルス(Bacillus alkalophilus)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)、バチルス・クラウシイ(Bacillus clausii)、バチルス・ハロデュランス(Bacillus.halodurans)、バチルス・メガテリウム(Bacillus.megaterium)、バチルス・コアギュランス(Bacillus coagulans)、バチルス・サーキュランス(Bacillus circulans)、バチルス・ラウツス(Bacillus lautus)及びバチルス・チューリンギエンシス(Bacillus thuringiensis)からなる群から選択される、先行する実施形態のいずれかの方法。
15.線状組換えDNAコンストラクト及び第2の環状組換えDNAコンストラクトは、プロトプラスト融合、天然又は人工形質転換(例えば、塩化カルシウム、エレクトロポレーション、熱ショック)、形質導入、トランスフェクション、接合、ファージ送達、交配、自然形質転換能、誘導性形質転換能及びこれらの任意の組合せからなる群から選択される1つの手段を介してバチルス属(Bacillus sp.)細胞に同時に導入される、先行する実施形態のいずれかの方法。
16.バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接されるドナーDNA配列を含み、前記ドナーDNAは、目的の前記遺伝子の複数のコピーを含み、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
17.バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、前記目的の遺伝子を含むドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
18.少なくとも線状組換えDNAコンストラクト及び第2の環状組込みDNAコンストラクトを含む改変されたバチルス属(Bacillus sp.)細胞であって、前記線状組換えDNAコンストラクトは、上流(5’)ホモロジーアーム及び下流(3’)ホモロジーアームによって隣接されるドナーDNA配列を含み、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記ガイドRNAは、前記バチルス属(Bacillus sp.)細胞の染色体又はエピソーム上の標的部位配列に相補的な配列を含み、前記Cas9エンドヌクレアーゼDNA配列は、RNA誘導型エンドヌクレアーゼ(RGEN)を形成できるCas9エンドヌクレアーゼをコードし、前記RGENは、標的部位配列の全て又は一部に結合し、且つ任意選択により切断する、バチルス属(Bacillus sp.)細胞。
19.前記目的の遺伝子は、前記バチルス(Bacillus)細胞のゲノムに組み込まれる、実施形態10のバチルス(Bacillus)細胞。
20.バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの導入を伴わずに目的の遺伝子を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、前記目的の遺伝子を含むドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記線状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列をさらに含み、前記環状組換えDNAコンストラクトは、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞のゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
開示される本開示は、以下の実施例においてさらに定義される。これらの実施例は、本開示の特定の好ましい態様を示すが、例示のためにのみ示されていることが理解されるべきである。上の議論及びこれらの実施例から、当業者であれば本開示の特徴の本質を確認することができ、またその趣旨及び範囲から逸脱することなく、本開示を様々な用途及び条件に適応させるために本開示の様々な変更形態及び変形形態をなし得る。
実施例1
aprE Cas9ターゲティングベクターの構築
N末端核移行配列(NLS;「APKKKRKV」;配列番号2)、C末端NLS(「KKKKLK」;配列番号3)及びデカ-ヒスチジンタグ(「HHHHHHHHHH」;配列番号4)を含むストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質をコードする合成ポリヌクレオチド(配列番号1)は、バチルス・サブチリス(Bacillus subtilis)由来のaprEプロモーター(配列番号5)に作動可能に連結され、製造業者の使用説明書に従ってQ5 DNAポリメラーゼ(NEB)を使用し、フォワード(配列番号6)及びリバース(配列番号7)プライマー対を用いて増幅された。プラスミドpKB320(配列番号9)の骨格(配列番号8)は、製造業者の使用説明書に従ってQ5 DNAポリメラーゼ(NEB)を使用し、フォワード(配列番号10)及びリバース(配列番号11)プライマー対を用いて増幅された。
aprE Cas9ターゲティングベクターの構築
N末端核移行配列(NLS;「APKKKRKV」;配列番号2)、C末端NLS(「KKKKLK」;配列番号3)及びデカ-ヒスチジンタグ(「HHHHHHHHHH」;配列番号4)を含むストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のCas9タンパク質をコードする合成ポリヌクレオチド(配列番号1)は、バチルス・サブチリス(Bacillus subtilis)由来のaprEプロモーター(配列番号5)に作動可能に連結され、製造業者の使用説明書に従ってQ5 DNAポリメラーゼ(NEB)を使用し、フォワード(配列番号6)及びリバース(配列番号7)プライマー対を用いて増幅された。プラスミドpKB320(配列番号9)の骨格(配列番号8)は、製造業者の使用説明書に従ってQ5 DNAポリメラーゼ(NEB)を使用し、フォワード(配列番号10)及びリバース(配列番号11)プライマー対を用いて増幅された。
PCR産物を、Zymo clean and concentrate 5カラムを製造業者の使用説明書に従って使用して精製した。続いて、2つの断片を等モル比で混合するQ5ポリメラーゼ(NEB)を用いて、長時間オーバーラップ伸長PCR(POE-PCR)により、PCR産物を組み立てた。以下のPOE-PCR反応サイクルを実行した:98℃で5秒間、64℃で10秒間、72℃で4分15秒間を30サイクル。5μlのPOE-PCR(DNA)を製造業者の使用説明書に従ってTop10 E.コリ(E.coli)(Invitrogen)に形質転換し、50μg/mlの硫酸カナマイシンを含有し、1.5%寒天で固化させた溶原(L)培地(Miller処方;1%(w/v)トリプトン、0.5%酵母抽出物(w/v)、1%NaCl(w/v))で選択した。コロニーを37℃で18時間増殖させた。コロニーを採取し、Qiaprep DNAミニプレップキットを製造業者の使用説明書に従って使用してプラスミドDNAを調製し、55μlのddH2O中に溶出した。このプラスミドDNAについてサンガーシークエンシングを行い、シークエンシングプライマー(配列番号12~20)を使用して、正しい組み立てを確認した。
正しく組み立てられたプラスミドpRF694(配列番号21)を使用して、中間体プラスミドpRF748(配列番号22)を組み立てた。プラスミドpRF748の構築は、中断された合成gRNAカセットをプラスミドpRF694のNcoI/SalI部位にクローニングすることによって作製した。このカセットは、IDTによって合成的に生成され、B.サブチリス(B.subtilis)rrnIプロモーター(配列番号23)、合成ダブルターミネーター(配列番号24)、E.コリ(E.coli)rpsL遺伝子(配列番号25)、Cas9エンドヌクレアーゼ認識ドメインをコードするDNA(配列番号26)及びラムダファージT0ターミネーター(配列番号27)を含有する。
gRNA発現カセットを含有するDNA断片を、標準的な分子生物学的技術を用いてpRF694に組み入れてプラスミドpRF748を生成し、Cas9発現カセット及びgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成することができる。
中間体プラスミドpRF748を用いて、B.サブチリス(B.subtilis)のaprE遺伝子座に発現カセットを導入するためのプラスミドを組み立てた。より詳細には、B.サブチリス(B.subtilis)のaprE遺伝子座におけるyhfN遺伝子(配列番号28)は、Cas9標的部位(配列番号29)を含有する。標的部位は、PAM配列(配列番号31の最後の3塩基)を除去することにより、可変ターゲティング(VT)ドメインをコードするDNA配列(配列番号30)に変換され得る。VTドメインをコードするDNA配列(配列番号30)は、細胞内のRNAポリメラーゼによって転写された場合に機能性gRNA(配列番号32)を生成するように、Cas9エンドヌクレアーゼ認識ドメイン(CER;配列番号26)をコードするDNA配列に作動可能に融合され得る。gRNAをコードするDNA(配列番号33)は、バチルス属(Bacillus sp.)細胞において作動可能なプロモーター(例えば、B.サブチリス(B.subtilis)由来のrrnIプロモーター;配列番号23)及びバチルス属(Bacillus sp.)細胞において作動可能なターミネーター(例えば、ラムダファージのt0ターミネーター;配列番号27)に作動可能に連結され得るが、その結果、プロモーターを、gRNAをコードするDNAの5’側に配置し、ターミネーターを、gRNAをコードするDNAの3’側に配置して、gRNA発現カセット(配列番号34)を作製する。
B.サブチリス(B.subtilis)のyhfN遺伝子座(配列番号36)を標的化するプラスミドpRF793(配列番号35)を、製造者の使用説明書に従ってQ5を使用し、フォワード(配列番号37)及びリバース(配列番号38)プライマー対を用いてプラスミドpRF748(配列番号22)を増幅することにより作製した。これらのプライマーは、5’及び3’末端が重複し、yhfN可変ターゲティングドメインを含有する断片を作製するgRNAの可変ターゲティング領域を除いて、プラスミド全体(pRF748)を増幅する。このPCR産物を、製造業者の使用説明書に従ってNEBuilder(New England Biolabs)を用いて分子内集合反応に使用して、プラスミドpRF793(配列番号35)を作製し、Cas9発現カセット及びyhfNを標的とするgRNAをコードするgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成した。
実施例2
aprE発現カセットを発現するバチルス・サブチリス(Bacillus subtilis)細胞の作製
本実施例は、バチルス・サブチリス(Bacillus subtilis)細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、B.サブチリス(B.subtilis)細胞において作動可能なプロモーター(例えば、天然のB.サブチリス(B.subtilis)rrnIプロモーター;配列番号23)をコードするDNA配列に作動可能に融合されたyhfN遺伝子(配列番号39)の隣接領域5’に相同なDNA配列を含有し、これは、プロモーターが成熟遺伝子をコードするDNAの5’に配置され、且つターミネーターが成熟遺伝子をコードするDNAの3’に配置されるように、B.アミロリケファシエンス(B.amyloliquefaciens)aprターミネーターをコードするDNA配列(配列番号40)に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするDNA配列に作動可能に融合される。上記の発現カセットは、yhfN遺伝子の隣接領域3’に相同なDNA配列(配列番号41)に作動可能に融合された。
aprE発現カセットを発現するバチルス・サブチリス(Bacillus subtilis)細胞の作製
本実施例は、バチルス・サブチリス(Bacillus subtilis)細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、B.サブチリス(B.subtilis)細胞において作動可能なプロモーター(例えば、天然のB.サブチリス(B.subtilis)rrnIプロモーター;配列番号23)をコードするDNA配列に作動可能に融合されたyhfN遺伝子(配列番号39)の隣接領域5’に相同なDNA配列を含有し、これは、プロモーターが成熟遺伝子をコードするDNAの5’に配置され、且つターミネーターが成熟遺伝子をコードするDNAの3’に配置されるように、B.アミロリケファシエンス(B.amyloliquefaciens)aprターミネーターをコードするDNA配列(配列番号40)に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするDNA配列に作動可能に融合される。上記の発現カセットは、yhfN遺伝子の隣接領域3’に相同なDNA配列(配列番号41)に作動可能に融合された。
発現のためにPxylA誘導性プロモーターを使用してamyE遺伝子座で導入されたB.サブチリス(B.subtilis)comK遺伝子(配列番号42)を含有する親B.サブチリス(B.subtilis)細胞を、125mlのバッフル付きフラスコにおいて、15mlのL培地(1%w・v-1トリプトン、0.5%酵母抽出物w・v-1、1%NaCl w・v-1)中、37℃及び250RPMで一晩増殖させた。一晩培養したものを、125mlバッフル付きフラスコにおいて、10mlの新鮮なL培地中で0.2(OD600単位)に希釈した。培養物が37℃(250RPM)で0.9(OD600単位)に達するまで、細胞を増殖させた。D-キシロースを30%(w/v)のストックから0.3%(w/v)に加えた。細胞を37℃(250RPM)でさらに2.5時間増殖させ、7分間にわたり1700×gでペレット化した。細胞を、使用済み培地を使用して元の培養の4分の1量に再懸濁させた。100μlの濃縮細胞を、およそ1μgの天然のrrnIプロモーター(配列番号23)を含有するバリアントプロテアーゼ発現カセット及び製造業者の使用説明書に従って18時間のローリングサークル増幅(Syngis)を使用して増幅された前の実施例において記載されるpRF793プラスミド(配列番号35)と混合した。細胞/DNA形質転換混合物を、10μg/mLカナマイシン、1.6%(w/v)スキムミルクを含有し、1.5%(w/v)寒天で固化させたL培地(miller)にプレーティングした。37℃でコロニーを形成させた。カナマイシン及びスキムミルクを含有するL寒天上で増殖し、コロニーに隣接する領域に目に見える透明ゾーンを生成したコロニー(タンパク質分解活性を示す)を採取し、1.6%(w/v)スキムミルクを含有する寒天プレート上にストリークした。
組込み効率は、タンパク分解活性を示すコロニーに隣接する目に見える透明なゾーンを有するコロニーのコロニー数と比較した、コロニーに隣接する目に見える透明なゾーンを有しないコロニーのコロニー数によってアッセイされた。
驚くべきことに且つ予想外にも、プラスミドpRF793(配列番号35)及び線状発現カセットを使用して親B.サブチリス(B.subtilis)株においてaprE遺伝子座で組み込まれたプロテアーゼバリアント発現カセットに関する組込み効率は、発現カセット内のホモロジーアームの長さに依存して変動した。より長いホモロジーアーム(3Kbの長さ)が使用されたときに利点が観察され、それにより組込みの頻度を6パーセント~最大で75パーセント向上させた(表1)。
skfA Cas9ターゲティングベクターの構築
実施例1に記載されるとおりの正しく組み立てられたプラスミドpRF694(配列番号21)を使用して、中間体プラスミドpRF747(配列番号43)を組み立てた。プラスミドpRF747の構築は、中断された合成gRNAカセットをプラスミドpRF694のNcoI/SalI部位にクローニングすることによって作製した。このカセットは、IDTによって合成的に生成され、B.サブチリス(B.subtilis)narKpプロモーター(配列番号44)、合成ダブルターミネーター(配列番号24)、E.コリ(E.coli)rpsL遺伝子(配列番号25)、Cas9エンドヌクレアーゼ認識ドメインをコードするDNA(配列番号26)及びラムダファージT0ターミネーター(配列番号27)を含有する。gRNA発現カセットを含有するDNA断片を、標準的な分子生物学的技術を用いてpRF694に組み入れてプラスミドpRF747を生成し、Cas9発現カセット及びgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成した。中間体プラスミドpRF747を使用して、B.サブチリス(B.subtilis)のskf遺伝子座に発現カセットを導入するためのプラスミドを組み立てた。より詳細には、B.サブチリス(B.subtilis)のskf遺伝子座におけるskfC遺伝子(配列番号45)は、Cas9標的部位(配列番号46)を含有する。標的部位は、PAM配列(配列番号48の最後の3塩基)を除去することにより、可変ターゲティング(VT)ドメインをコードするDNA配列(配列番号47)に変換され得る。VTドメインをコードするDNA配列(配列番号47)は、細胞内のRNAポリメラーゼによって転写された場合に機能性gRNA(配列番号49)を生成するように、Cas9エンドヌクレアーゼ認識ドメイン(CER;配列番号26)をコードするDNA配列に作動可能に融合され得る。gRNAをコードするDNA(配列番号50)は、バチルス属(Bacillus sp.)細胞において作動可能なプロモーター(例えば、B.サブチリス(B.subtilis)由来のrrnIプロモーター;配列番号23)及びバチルス属(Bacillus sp.)細胞において作動可能なターミネーター(例えば、ラムダファージのt0ターミネーター;配列番号27)に作動可能に連結され得るが、その結果、プロモーターを、gRNAをコードするDNAの5’側に配置し、ターミネーターを、gRNAをコードするDNAの3’側に配置して、gRNA発現カセット(配列番号51)を作製する。B.サブチリス(B.subtilis)のskfC遺伝子(配列番号45)を標的化するプラスミドpRF776(配列番号52)を、製造者の使用説明書に従ってQ5を使用し、フォワード(配列番号53)及びリバース(配列番号54)プライマー対を用いてプラスミドpRF747(配列番号43)を増幅することにより作製した。これらのプライマーは、5’及び3’末端が重複し、skfC可変ターゲティングドメインを含有する断片を作製するgRNAの可変ターゲティング領域を除いて、プラスミド全体(pRF747)を増幅する。このPCR産物を、製造業者の使用説明書に従ってNEBuilder(New England Biolabs)を用いて分子内集合反応に使用して、プラスミドpRF776(配列番号52)を作製し、Cas9発現カセット及びskfCを標的とするgRNAをコードするgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成した。
実施例4
skfA実施例発現カセットを発現するバチルス・サブチリス(Bacillus subtilis)細胞の作製
本実施例は、バチルス・サブチリス(Bacillus subtilis)細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、B.サブチリス(B.subtilis)細胞において作動可能なプロモーター(例えば、天然のB.サブチリス(B.subtilis)rrnIプロモーター;配列番号23)をコードするDNA配列に作動可能に融合されたskf遺伝子(配列番号55)の隣接領域5’に相同なDNA配列を含有し、これは、プロモーターが成熟遺伝子をコードするDNAの5’に配置され、且つターミネーターが成熟遺伝子をコードするDNAの3’に配置されるように、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)aprターミネーターをコードするDNA配列(配列番号40)に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするDNA配列に作動可能に融合される。上記の発現カセットは、skf遺伝子の隣接領域3’に相同なDNA配列(配列番号56)に作動可能に融合される。
skfA実施例発現カセットを発現するバチルス・サブチリス(Bacillus subtilis)細胞の作製
本実施例は、バチルス・サブチリス(Bacillus subtilis)細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、B.サブチリス(B.subtilis)細胞において作動可能なプロモーター(例えば、天然のB.サブチリス(B.subtilis)rrnIプロモーター;配列番号23)をコードするDNA配列に作動可能に融合されたskf遺伝子(配列番号55)の隣接領域5’に相同なDNA配列を含有し、これは、プロモーターが成熟遺伝子をコードするDNAの5’に配置され、且つターミネーターが成熟遺伝子をコードするDNAの3’に配置されるように、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)aprターミネーターをコードするDNA配列(配列番号40)に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするDNA配列に作動可能に融合される。上記の発現カセットは、skf遺伝子の隣接領域3’に相同なDNA配列(配列番号56)に作動可能に融合される。
発現のためにPxylA誘導性プロモーターを使用してamyE遺伝子座で導入されたB.サブチリス(B.subtilis)comK遺伝子(配列番号42)を含有する親B.サブチリス(B.subtilis)細胞を、125mlのバッフル付きフラスコにおいて、15mlのL培地(1%w・v-1トリプトン、0.5%酵母抽出物w・v-1、1%NaCl w・v-1)中、37℃及び250RPMで一晩増殖させた。一晩培養したものを、125mlバッフル付きフラスコにおいて、10mlの新鮮なL培地中で0.2(OD600単位)に希釈した。培養物が37℃(250RPM)で0.9(OD600単位)に達するまで、細胞を増殖させた。D-キシロースを30%(w/v)のストックから0.3%(w/v)に加えた。細胞を37℃(250RPM)でさらに2.5時間増殖させ、7分間にわたり1700×gでペレット化した。細胞を、使用済み培地を使用して元の培養の4分の1量に再懸濁させた。100μlの濃縮細胞を、およそ1μgのバリアントプロテアーゼ発現カセット及び製造業者の使用説明書に従って18時間のローリングサークル増幅(Syngis)を使用して増幅された上記のpRF776プラスミド(配列番号52)と混合した。細胞/DNA形質転換混合物を、10μg/mLカナマイシン、1.6%(w/v)スキムミルクを含有し、1.5%(w/v)寒天で固化させたL培地(miller)にプレーティングした。37℃でコロニーを形成させた。カナマイシン及びスキムミルクを含有するL寒天上で増殖し、コロニーに隣接する領域に目に見える透明ゾーンを生成したコロニー(タンパク質分解活性を示す)を採取し、1.6%(w/v)スキムミルクを含有する寒天プレート上にストリークした。
組込み効率は、タンパク分解活性を示すコロニーに隣接する目に見える透明なゾーンを有するコロニーのコロニー数と比較した、コロニーに隣接する目に見える透明なゾーンを有しないコロニーのコロニー数によってアッセイされた。
驚くべきことに且つ予想外にも、プラスミドpRF776(配列番号52)及び線状発現カセットを使用して親B.サブチリス(B.subtilis)株においてskf遺伝子座で組み込まれたプロテアーゼバリアント発現カセットに関する組込み効率は、発現カセット内のホモロジーアームの長さに依存して変動した。より長いホモロジーアーム(3Kbの長さ)が使用されたときに利点が観察され、それにより組込みの頻度を0パーセント~最大で60パーセント向上させた(表2)。
pksR Cas9ターゲティングベクターの構築
中間体プラスミドpRF801(配列番号57)を、Cas9標的部位を導入するプライマー(配列番号59)を使用して、B.サブチリス(B.subtilis)由来のaprEプロモーター(配列番号5)に作動可能に融合されたCas9タンパク質をコードする合成ポリヌクレオチド(配列番号1)、gRNA発現カセット及びプラスミドpKB320(配列番号9)の骨格(配列番号8)を含有するプラスミドpRF787由来の2つの断片を増幅することによって構築した。標的部位は、PAM配列(配列番号61の最後の3塩基)を除去することにより、可変ターゲティング(VT)ドメインをコードするDNA配列(配列番号60)に変換され得る。VTドメインをコードするDNA配列(配列番号60)は、細胞内のRNAポリメラーゼによって転写された場合に機能性gRNA(配列番号62)を生成するように、Cas9エンドヌクレアーゼ認識ドメイン(CER;配列番号26)をコードするDNA配列に作動可能に連結されるように配置された。gRNAをコードするDNA(配列番号63)は、バチルス属(Bacillus sp.)細胞において作動可能なプロモーター(例えば、B.サブチリス(B.subtilis)由来のrrnIプロモーター;配列番号23)及びバチルス属(Bacillus sp.)細胞において作動可能なターミネーター(例えば、ラムダファージのt0ターミネーター;配列番号27)に作動可能に連結され得るが、その結果、プロモーターを、gRNAをコードするDNAの5’側に配置し、ターミネーターを、gRNAをコードするDNAの3’側に配置して、gRNA発現カセット(配列番号64)を作製する。
第1のプラスミド断片は、Cas9エンドヌクレアーゼ認識ドメインをコードする配列(CER;配列番号26)、ラムダt0ターミネーター(配列番号27)並びにプラスミドpKB320(配列番号9)の骨格(配列番号8)及びプラスミドpKB320(配列番号9)の骨格(配列番号8)を含有し、製造業者の使用説明書に従ってQ5並びにフォワード(配列番号65)及びリバース(配列番号66)プライマー対を使用して増幅された。第2のプラスミド断片は、gRNA発現カセット及びCas9発現カセットに関するプロモーターを含有し、製造業者の使用説明書に従ってQ5並びにフォワード(配列番号67)及びリバース(配列番号68)プライマー対セットを使用して増幅された。
serA上流領域(配列番号69)及びserA下流領域(配列番号70)に対応する2つのDNA断片は、製造業者の使用説明書に従ってQ5並びにserA上流領域に関するフォワード(配列番号71)及びリバース(配列番号72)プライマー対並びにserA下流領域に関するフォワード(配列番号73)及びリバース(配列番号74)プライマー対を使用して増幅された。
DNA断片を、製造業者の使用説明書に従ってNEBuilder(New England Biolabs)を用いて分子内集合反応に使用して、プラスミドpRF801(配列番号57)を作製し、Cas9発現カセット及びserAを標的とするgRNAをコードするgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成した。正しく組み立てられたプラスミドpRF801(配列番号57)を使用して、フォワード(配列番号76)及びリバース(配列番号77)プライマー対による部位特異的変異誘発を使用してCas9バリアント(配列番号75)を作製した。これらのプライマーは、プラスミド(pRF801)全体を増幅し、Cas9バリアントと関連する置換を組み込むために設計される。部位特異的変異誘発反応は、DpnIで消化され、Cas9バリアント発現カセット及びserAを標的とするgRNAをコードするgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成するプラスミドpRF827(配列番号78)を作製するために使用された。
中間体プラスミドpRF827を使用して、B.サブチリス(B.subtilis)のpksR遺伝子座に発現カセットを導入するためのプラスミドを組み立てた。より詳細には、B.サブチリス(B.subtilis)のpks遺伝子座におけるpksR遺伝子(配列番号79)は、Cas9標的部位(配列番号80)を含有する。標的部位は、PAM配列(配列番号82の最後の3塩基)を除去することにより、可変ターゲティング(VT)ドメインをコードするDNA配列(配列番号81)に変換され得る。VTドメインをコードするDNA配列(配列番号81)は、細胞内のRNAポリメラーゼによって転写された場合に機能性gRNA(配列番号83)を生成するように、Cas9エンドヌクレアーゼ認識ドメイン(CER;配列番号26)をコードするDNA配列に作動可能に融合され得る。gRNAをコードするDNA(配列番号84)は、バチルス属(Bacillus sp.)細胞において作動可能なプロモーター(例えば、B.サブチリス(B.subtilis)由来のspacプロモーター;配列番号85)及びバチルス属(Bacillus sp.)細胞において作動可能なターミネーター(例えば、ラムダファージのt0ターミネーター;配列番号27)に作動可能に連結され得るが、その結果、プロモーターを、gRNAをコードするDNAの5’側に配置し、ターミネーターを、gRNAをコードするDNAの3’側に配置して、gRNA発現カセット(配列番号86)を作製する。
B.サブチリス(B.subtilis)のpksR遺伝子(配列番号79)を標的化するプラスミドpSRS041(配列番号87)を、製造業者の使用説明書に従ってQ5並びに骨格に関するフォワード(配列番号88)及びリバース(配列番号89)プライマー対並びにフォワード(配列番号90)及びリバース(配列番号91)を使用して、2つの断片(一方のプラスミド骨格並びにもう一方のCas9及びgRNA発現カセット)においてプラスミドpRF827(配列番号78)を増幅することによって作製した。これらのプライマーは、5’及び3’末端が重複し、pksR可変ターゲティングドメインを含有する断片を作製するgRNAの可変ターゲティング領域を除いて、プラスミド全体(pRF827)の2つの断片を増幅する。これらのPCR産物を、製造業者の使用説明書に従ってNEBuilder(New England Biolabs)を用いて分子内集合反応に使用して、プラスミドpSRS041(配列番号87)を作製し、Cas9発現カセット及びpksRを標的とするgRNAをコードするgRNA発現カセットを含有するE.コリ(E.coli)-B.サブチリス(B.subtilis)シャトルプラスミドを生成した。
実施例6
pksR実施例発現カセットを発現するバチルス・サブチリス(Bacillus subtilis)細胞の作製
本実施例は、バチルス・サブチリス(Bacillus subtilis)細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、B.サブチリス(B.subtilis)細胞において作動可能なプロモーター(例えば、天然のB.サブチリス(B.subtilis)rrnIプロモーター;配列番号23)をコードするDNA配列に作動可能に融合されたpksR遺伝子(配列番号92)の隣接領域5’に相同なDNA配列を含有し、これは、プロモーターが成熟遺伝子をコードするDNAの5’に配置され、且つターミネーターが成熟遺伝子をコードするDNAの3’に配置されるように、B.アミロリケファシエンス(B.amyloliquefaciens)aprターミネーターをコードするDNA配列(配列番号40)に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするDNA配列に作動可能に融合される。上記の発現カセットは、pksR遺伝子の隣接領域3’に相同なDNA配列(配列番号93)に作動可能に融合される。
pksR実施例発現カセットを発現するバチルス・サブチリス(Bacillus subtilis)細胞の作製
本実施例は、バチルス・サブチリス(Bacillus subtilis)細胞のゲノムへのプロテアーゼ発現カセットの組込みを記載する。より具体的には、これらの発現カセットは、B.サブチリス(B.subtilis)細胞において作動可能なプロモーター(例えば、天然のB.サブチリス(B.subtilis)rrnIプロモーター;配列番号23)をコードするDNA配列に作動可能に融合されたpksR遺伝子(配列番号92)の隣接領域5’に相同なDNA配列を含有し、これは、プロモーターが成熟遺伝子をコードするDNAの5’に配置され、且つターミネーターが成熟遺伝子をコードするDNAの3’に配置されるように、B.アミロリケファシエンス(B.amyloliquefaciens)aprターミネーターをコードするDNA配列(配列番号40)に作動可能に融合されたプロテアーゼバリアント成熟遺伝子をコードするDNA配列に作動可能に融合される。上記の発現カセットは、pksR遺伝子の隣接領域3’に相同なDNA配列(配列番号93)に作動可能に融合される。
したがって、本実施例において、発現のためにPxylA誘導性プロモーターを使用してamyE遺伝子座で導入されたB.サブチリス(B.subtilis)comK遺伝子(配列番号42)を含有する親B.サブチリス(B.subtilis)細胞を、125mlのバッフル付きフラスコにおいて、15mlのL培地(1%w・v-1トリプトン、0.5%酵母抽出物w・v-1、1%NaCl w・v-1)中、37℃及び250RPMで一晩増殖させた。一晩培養したものを、125mlバッフル付きフラスコにおいて、10mlの新鮮なL培地中で0.2(OD600単位)に希釈した。培養物が37℃(250RPM)で0.9(OD600単位)に達するまで、細胞を増殖させた。D-キシロースを30%(w/v)のストックから0.3%(w/v)に加えた。細胞を37℃(250RPM)でさらに2.5時間増殖させ、7分間にわたり1700×gでペレット化した。細胞を、使用済み培地を使用して元の培養の4分の1量に再懸濁させた。100μlの濃縮細胞を、およそ1μgのバリアントプロテアーゼ発現カセット及び製造業者の使用説明書に従って18時間のローリングサークル増幅(Syngis)を使用して増幅された上記のpSRS041プラスミド(配列番号87)と混合した。細胞/DNA形質転換混合物を、10μg/mLカナマイシン、1.6%(w/v)スキムミルクを含有し、1.5%(w/v)寒天で固化させたL培地(miller)にプレーティングした。37℃でコロニーを形成させた。カナマイシン及びスキムミルクを含有するL寒天上で増殖し、コロニーに隣接する領域に目に見える透明ゾーンを生成したコロニー(タンパク質分解活性を示す)を採取し、1.6%(w/v)スキムミルクを含有する寒天プレート上にストリークした。
組込み効率は、タンパク分解活性を示すコロニーに隣接する目に見える透明なゾーンを有するコロニーのコロニー数と比較した、コロニーに隣接する目に見える透明なゾーンを有しないコロニーのコロニー数によってアッセイされた。
驚くべきことに且つ予想外にも、プラスミドpSRS041(配列番号87)及び線状発現カセットを使用して親B.サブチリス(B.subtilis)株においてpks遺伝子座で組み込まれたプロテアーゼバリアント発現カセットに関する組込み効率は、発現カセット内のホモロジーアームの長さに依存して変動した。より長いホモロジーアーム(3Kbの長さ)が使用されたときに利点が観察され、組込みの頻度を1パーセント~最大で46パーセント向上させた(表3)。
Claims (16)
- バチルス属(Bacillus sp.)細胞のゲノム上の標的部位に、前記ゲノムへの選択マーカーの組込みを伴わずにドナーDNA配列を組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、ドナーDNA配列を含み、前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接され、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス属(Bacillus sp.)細胞の前記ゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
- 前記ドナーDNA配列は、上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接され、各ホモロジーアームは、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000を超え、且つ最大で6000のヌクレオチド長であり、及び前記バチルス属(Bacillus sp.)細胞の前記ゲノム上の前記標的部位に対する配列相同性を含む、請求項1に記載の方法。
- 前記ドナーDNA配列は、目的のポリヌクレオチド、目的の遺伝子、転写調節配列、翻訳調節配列、プロモーター配列、ターミネーター配列、トランスジェニック核酸配列、メッセンジャーRNAの少なくとも一部と相補的なアンチセンス配列、異種配列又はこれらのいずれか1つの組合せからなる群から選択されるヌクレオチド配列を含む、請求項1に記載の方法。
- 前記線状組換えDNAコンストラクトは、一本鎖DNAである、請求項1に記載の方法。
- 前記線状組換えDNAコンストラクトは、二本鎖DNAである、請求項1に記載の方法。
- 前記線状組換えDNAコンストラクトは、スタッファー配列をさらに含む、請求項1に記載の方法。
- 前記バチルス属(Bacillus sp.)細胞からの子孫細胞を増殖させ、且つバチルス属(Bacillus sp.)子孫細胞であって、そのゲノム中に安定に組み込まれた前記ドナーDNA配列を有するバチルス属(Bacillus sp.)子孫細胞を選択することをさらに含む、請求項1に記載の方法。
- 前記環状組換えDNAコンストラクトは、バチルス属(Bacillus sp.)子孫細胞のゲノムに組み込まれない選択マーカーを含む、請求項1に記載の方法。
- 前記選択マーカーは、前記バチルス属(Bacillus sp.)子孫細胞の前記ゲノムに安定に組み込まれない、請求項8に記載の方法。
- 前記線状組換えDNAコンストラクト及び第2の環状組換えDNAコンストラクトを含有しないバチルス属(Bacillus sp.)子孫細胞をさらに選択する、請求項8に記載の方法。
- 前記バチルス属(Bacillus sp.)細胞の前記ゲノム上の前記標的部位は、染色体上のヌクレオチド配列、エピソーム上のヌクレオチド配列、遺伝子導入座位、内在性標的部位及び異種標的部位からなる群から選択される、請求項1に記載の方法。
- 前記ドナーDNAは、目的の遺伝子を含む、請求項3に記載の方法。
- バチルス属(Bacillus sp.)細胞に、1000ヌクレオチドの上流のホモロジーアーム(HR1)及び下流のホモロジーアーム(HR2)によって隣接される前記ドナーDNA配列を含む線状組換えDNAコンストラクトと、前記環状組換えDNAコンストラクトとを導入することを含む対照方法における目的の遺伝子の前記遺伝子の組込みの頻度と比較して、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21~最大で23倍高い、バチルス属(Bacillus sp.)細胞のゲノムへの前記ドナーDNA配列の組込みの頻度を有する、請求項1に記載の方法。
- 前記バチルス属(Bacillus sp.)細胞は、バチルス・サブチリス(Bacillus subtilis)、バチルス・リケニフォルミス(Bacillus licheniformis)、バチルス・レンツス(Bacillus lentus)、バチルス・ブレビス(Bacillus brevis)、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)、バチルス・アルカロフィルス(Bacillus alkalophilus)、バチルス・アミロリケファシエンス(Bacillus amyloliquefaciens)、バチルス・クラウシイ(Bacillus clausii)、バチルス・ハロデュランス(Bacillus.halodurans)、バチルス・メガテリウム(Bacillus.megaterium)、バチルス・コアギュランス(Bacillus coagulans)、バチルス・サーキュランス(Bacillus circulans)、バチルス・ラウツス(Bacillus lautus)及びバチルス・チューリンギエンシス(Bacillus thuringiensis)からなる群から選択される、請求項1に記載の方法。
- 前記線状組換えDNAコンストラクト及び第2の環状組換えDNAコンストラクトは、プロトプラスト融合、天然又は人工形質転換(例えば、塩化カルシウム、エレクトロポレーション、熱ショック)、形質導入、トランスフェクション、接合、ファージ送達、交配、自然形質転換能、誘導性形質転換能及びこれらの任意の組合せからなる群から選択される1つの手段を介して前記バチルス属(Bacillus sp.)細胞に同時に導入される、請求項1に記載の方法。
- バチルス属(Bacillus sp.)細胞のゲノムに、前記ゲノムへの選択マーカーの組込みを伴わずに目的の遺伝子の複数のコピーを組み込む方法であって、少なくとも線状組換えDNAコンストラクト及び環状組換えDNAコンストラクトをバチルス属(Bacillus sp.)細胞に同時に導入することを含み、前記線状組換えDNAコンストラクトは、上流のホモロジーアーム(HR1)及び下流のアーム(HR2)によって隣接されるドナーDNA配列を含み、前記ドナーDNAは、前記目的の遺伝子の複数のコピーを含み、各ホモロジーアームは、1000を超えるヌクレオチド長であり、前記環状組換えDNAコンストラクトは、ガイドRNAをコードするDNA配列と、Casエンドヌクレアーゼをコードするヌクレオチド配列に作動可能に連結された構成的プロモーターとを含み、前記Cas9エンドヌクレアーゼは、前記バチルス(Bacillus)細胞の前記ゲノムにおける標的部位又はその近傍で二本鎖切断を導入する、方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962829662P | 2019-04-05 | 2019-04-05 | |
US62/829,662 | 2019-04-05 | ||
PCT/US2020/026508 WO2020206202A1 (en) | 2019-04-05 | 2020-04-03 | Methods for integrating a donor dna sequence into the genome of bacillus using linear recombinant dna constructs and compositions thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022526982A true JP2022526982A (ja) | 2022-05-27 |
Family
ID=70465476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021559248A Pending JP2022526982A (ja) | 2019-04-05 | 2020-04-03 | 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20220177923A1 (ja) |
EP (1) | EP3947662A1 (ja) |
JP (1) | JP2022526982A (ja) |
KR (1) | KR20210148269A (ja) |
CA (1) | CA3136114A1 (ja) |
MX (1) | MX2021012158A (ja) |
WO (1) | WO2020206202A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112023027016A2 (pt) | 2021-06-24 | 2024-03-12 | Basf Se | Célula hospedeira modificada de bacillus compreendendo uma proteína reguladora da matriz extracelular a alterada e/ou uma proteína reguladora da matriz extracelular b alterada, método para produzir um composto de interesse, e, proteínas reguladoras das matrizes extracelulares a e b alteradas |
EP4359424A1 (en) | 2021-06-24 | 2024-05-01 | Basf Se | Improved bacillus production host |
BR112023027009A2 (pt) | 2021-06-24 | 2024-03-12 | Basf Se | Célula hospedeira modificada de bacillus licheniformis, e, métodos para produzir um composto de interesse e para aumentar a pureza de um composto de interesse |
WO2023117970A1 (en) | 2021-12-20 | 2023-06-29 | Basf Se | Method for improved production of intracellular proteins in bacillus |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US5107065A (en) | 1986-03-28 | 1992-04-21 | Calgene, Inc. | Anti-sense regulation of gene expression in plant cells |
US4873192A (en) | 1987-02-17 | 1989-10-10 | The United States Of America As Represented By The Department Of Health And Human Services | Process for site specific mutagenesis without phenotypic selection |
US5316931A (en) | 1988-02-26 | 1994-05-31 | Biosource Genetics Corp. | Plant viral vectors having heterologous subgenomic promoters for systemic expression of foreign genes |
US5990387A (en) | 1988-06-10 | 1999-11-23 | Pioneer Hi-Bred International, Inc. | Stable transformation of plant cells |
US5034323A (en) | 1989-03-30 | 1991-07-23 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5231020A (en) | 1989-03-30 | 1993-07-27 | Dna Plant Technology Corporation | Genetic engineering of novel plant phenotypes |
US5879918A (en) | 1989-05-12 | 1999-03-09 | Pioneer Hi-Bred International, Inc. | Pretreatment of microprojectiles prior to using in a particle gun |
US5932782A (en) | 1990-11-14 | 1999-08-03 | Pioneer Hi-Bred International, Inc. | Plant transformation method using agrobacterium species adhered to microprojectiles |
TW261517B (ja) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
BR9306802A (pt) | 1992-07-27 | 1998-12-08 | Pioneer Hi Bred Int | Processo independente de genótipos para produção de planta de soja transgénica e processo de regeneração de plantas de soja a partir de nodos cotiledonais |
IL108241A (en) | 1992-12-30 | 2000-08-13 | Biosource Genetics Corp | Plant expression system comprising a defective tobamovirus replicon integrated into the plant chromosome and a helper virus |
US5736369A (en) | 1994-07-29 | 1998-04-07 | Pioneer Hi-Bred International, Inc. | Method for producing transgenic cereal plants |
EP0892811B1 (de) | 1996-03-26 | 2002-12-18 | Razvan T. Radulescu | Peptide mit antiproliferativen eigenschaften |
AU3495297A (en) | 1996-07-08 | 1998-02-02 | Pioneer Hi-Bred International, Inc. | Transformation of zygote, egg or sperm cells and recovery of transformed plants from isolated embryo sacs |
US5981840A (en) | 1997-01-24 | 1999-11-09 | Pioneer Hi-Bred International, Inc. | Methods for agrobacterium-mediated transformation |
US6509185B1 (en) | 2000-01-07 | 2003-01-21 | Genencor International, Inc. | Mutant aprE promotor |
EP1309677B2 (en) | 2000-08-11 | 2012-04-11 | Genencor International, Inc. | Bacillus transformation, transformants and mutant libraries |
SI1495330T1 (sl) | 2002-04-12 | 2009-06-30 | Dowd Brian F O | Postopki identificiranja spojin, ki medsebojno vplivajo na transmembranske proteine |
EP1576094B1 (en) | 2002-04-22 | 2011-09-28 | Danisco US Inc. | Methods of creating modified promoters resulting in varying levels of gene expression |
DK2336362T3 (en) | 2005-08-26 | 2019-01-21 | Dupont Nutrition Biosci Aps | USE OF CRISPR-ASSOCIATED GENES (CAS) |
WO2008007989A1 (en) | 2006-07-11 | 2008-01-17 | Grabania, Bogdan | Head for directing objects, especially for displaying screens |
GB201009732D0 (en) * | 2010-06-10 | 2010-07-21 | Gene Bridges Gmbh | Direct cloning |
DK2788491T3 (en) | 2011-12-09 | 2019-04-01 | Danisco Us Inc | RIBOSOMAL PROMOTERS FROM B. SUBTILIS FOR PROTEIN PRODUCTION IN MICRO-ORGANISMS |
LT3401400T (lt) | 2012-05-25 | 2019-06-10 | The Regents Of The University Of California | Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
CA3109801C (en) | 2013-08-22 | 2024-01-09 | Andrew Cigan | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
CA2971391C (en) | 2014-12-17 | 2023-05-09 | E. I. Du Pont De Nemours And Company | Compositions and methods for efficient gene editing in e. coli using guide rna/cas endonuclease systems in combination with circular polynucleotide modification templates. |
WO2016109840A2 (en) * | 2014-12-31 | 2016-07-07 | Synthetic Genomics, Inc. | Compositions and methods for high efficiency in vivo genome editing |
JP7025325B2 (ja) | 2015-10-30 | 2022-02-24 | ダニスコ・ユーエス・インク | タンパク質発現の増強およびその方法 |
WO2017216392A1 (en) * | 2016-09-23 | 2017-12-21 | Dsm Ip Assets B.V. | A guide-rna expression system for a host cell |
US11866713B2 (en) | 2017-02-24 | 2024-01-09 | Danisco Us Inc. | Compositions and methods for increased protein production in bacillus licheniformis |
AU2018386002A1 (en) * | 2017-12-15 | 2020-05-28 | Danisco Us Inc | CAS9 variants and methods of use |
KR20200105879A (ko) * | 2018-01-03 | 2020-09-09 | 다니스코 유에스 인크. | 증가된 단백질 생산을 위한 돌연변이체 및 유전자 변형된 바실러스 세포 및 이의 방법 |
CN111699254A (zh) * | 2018-02-08 | 2020-09-22 | 齐默尔根公司 | 使用crispr在棒状杆菌属中进行基因组编辑 |
-
2020
- 2020-04-03 JP JP2021559248A patent/JP2022526982A/ja active Pending
- 2020-04-03 US US17/601,537 patent/US20220177923A1/en active Pending
- 2020-04-03 KR KR1020217035666A patent/KR20210148269A/ko active Search and Examination
- 2020-04-03 WO PCT/US2020/026508 patent/WO2020206202A1/en unknown
- 2020-04-03 EP EP20722108.6A patent/EP3947662A1/en active Pending
- 2020-04-03 CA CA3136114A patent/CA3136114A1/en active Pending
- 2020-04-03 MX MX2021012158A patent/MX2021012158A/es unknown
Also Published As
Publication number | Publication date |
---|---|
CA3136114A1 (en) | 2020-10-08 |
WO2020206202A1 (en) | 2020-10-08 |
KR20210148269A (ko) | 2021-12-07 |
MX2021012158A (es) | 2022-01-06 |
EP3947662A1 (en) | 2022-02-09 |
US20220177923A1 (en) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3585910B1 (en) | Compositions and methods for increased protein production in bacillus licheniformis | |
JP2022526982A (ja) | 線状組換えDNAコンストラクトを使用してバチルス(Bacillus)のゲノムにドナーDNA配列を組み込むための方法及びその組成物 | |
JP2022526414A (ja) | 二重環状組換えDNAコンストラクトを使用するバチルス(Bacillus)のゲノムへのポリヌクレオチド組込みのための方法及びその組成物 | |
US20240102028A1 (en) | Methods and compositions for efficient genetic modifications of bacillus licheniformis strains | |
US20210032639A1 (en) | Modified 5'-untranslated region (utr) sequences for increased protein production in bacillus | |
JP2022116087A (ja) | 微生物におけるタンパク質産生のための遺伝子操作されたリボソームプロモーター | |
JP2022509215A (ja) | バチルス属(bacillus)細胞におけるタンパク質産生増強のための新規なプロモーター配列及びその方法 | |
US11414643B2 (en) | Mutant and genetically modified Bacillus cells and methods thereof for increased protein production | |
US20230340442A1 (en) | Compositions and methods for enhanced protein production in bacillus licheniformis | |
US20220389372A1 (en) | Compositions and methods for enhanced protein production in bacillus cells | |
US20220282234A1 (en) | Compositions and methods for increased protein production in bacillus lichenformis | |
US20220389459A1 (en) | Selection marker free methods for modifying the genome of bacillus and compositions thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20230220 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240220 |