JP2024521806A - 合成Casタンパク質 - Google Patents
合成Casタンパク質 Download PDFInfo
- Publication number
- JP2024521806A JP2024521806A JP2023573060A JP2023573060A JP2024521806A JP 2024521806 A JP2024521806 A JP 2024521806A JP 2023573060 A JP2023573060 A JP 2023573060A JP 2023573060 A JP2023573060 A JP 2023573060A JP 2024521806 A JP2024521806 A JP 2024521806A
- Authority
- JP
- Japan
- Prior art keywords
- cas
- sequences
- nuclease
- ancestral
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title description 59
- 102000004169 proteins and genes Human genes 0.000 title description 53
- 230000000694 effects Effects 0.000 claims abstract description 124
- 108091033409 CRISPR Proteins 0.000 claims abstract description 105
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 68
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims abstract description 53
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims abstract description 53
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 47
- 108091028113 Trans-activating crRNA Proteins 0.000 claims abstract description 27
- 230000001580 bacterial effect Effects 0.000 claims abstract description 26
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 11
- 108020004414 DNA Proteins 0.000 claims description 192
- 101710163270 Nuclease Proteins 0.000 claims description 168
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 122
- 239000013612 plasmid Substances 0.000 claims description 98
- 210000004027 cell Anatomy 0.000 claims description 61
- 102000053602 DNA Human genes 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 44
- 241000894007 species Species 0.000 claims description 44
- 150000001413 amino acids Chemical class 0.000 claims description 34
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 33
- 239000012636 effector Substances 0.000 claims description 33
- 238000000338 in vitro Methods 0.000 claims description 32
- 150000007523 nucleic acids Chemical class 0.000 claims description 31
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 23
- 241000194017 Streptococcus Species 0.000 claims description 22
- 230000008685 targeting Effects 0.000 claims description 21
- 102000039446 nucleic acids Human genes 0.000 claims description 20
- 108020004707 nucleic acids Proteins 0.000 claims description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 19
- 230000003197 catalytic effect Effects 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 13
- 238000002703 mutagenesis Methods 0.000 claims description 12
- 231100000350 mutagenesis Toxicity 0.000 claims description 12
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 11
- 238000012239 gene modification Methods 0.000 claims description 10
- 238000006467 substitution reaction Methods 0.000 claims description 10
- 210000005260 human cell Anatomy 0.000 claims description 8
- 241000193403 Clostridium Species 0.000 claims description 7
- 230000005017 genetic modification Effects 0.000 claims description 7
- 235000013617 genetically modified food Nutrition 0.000 claims description 7
- 241000894006 Bacteria Species 0.000 claims description 6
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 108020001507 fusion proteins Proteins 0.000 claims description 6
- 102000037865 fusion proteins Human genes 0.000 claims description 6
- 230000001225 therapeutic effect Effects 0.000 claims description 6
- 241001112696 Clostridia Species 0.000 claims description 5
- 241000194033 Enterococcus Species 0.000 claims description 5
- 108700019146 Transgenes Proteins 0.000 claims description 5
- 241000186781 Listeria Species 0.000 claims description 4
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 4
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 4
- 241000207194 Vagococcus Species 0.000 claims description 4
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 3
- 241000425347 Phyla <beetle> Species 0.000 claims description 3
- 230000001747 exhibiting effect Effects 0.000 claims description 3
- 208000016361 genetic disease Diseases 0.000 claims description 3
- 230000004034 genetic regulation Effects 0.000 claims description 3
- 230000003007 single stranded DNA break Effects 0.000 claims description 3
- 241001227086 Anaerostipes Species 0.000 claims description 2
- 241000186000 Bifidobacterium Species 0.000 claims description 2
- 241001143779 Dorea Species 0.000 claims description 2
- 241001673422 Floricoccus Species 0.000 claims description 2
- 241000950833 Halolactibacillus Species 0.000 claims description 2
- 241001134638 Lachnospira Species 0.000 claims description 2
- 241001465754 Metazoa Species 0.000 claims description 2
- 241000634305 Pelagirhabdus Species 0.000 claims description 2
- 241000192031 Ruminococcus Species 0.000 claims description 2
- 238000012300 Sequence Analysis Methods 0.000 claims description 2
- 241001615200 Urinacoccus Species 0.000 claims description 2
- 210000004102 animal cell Anatomy 0.000 claims description 2
- 210000004602 germ cell Anatomy 0.000 claims description 2
- 241001446247 uncultured actinomycete Species 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 10
- 239000013066 combination product Substances 0.000 claims 6
- 229940127555 combination product Drugs 0.000 claims 6
- 239000003814 drug Substances 0.000 claims 1
- 229940079593 drug Drugs 0.000 claims 1
- 102000004190 Enzymes Human genes 0.000 abstract description 69
- 108090000790 Enzymes Proteins 0.000 abstract description 69
- 238000003776 cleavage reaction Methods 0.000 description 101
- 230000007017 scission Effects 0.000 description 98
- 229940088598 enzyme Drugs 0.000 description 68
- 102100031780 Endonuclease Human genes 0.000 description 37
- 238000003556 assay Methods 0.000 description 35
- 239000002773 nucleotide Substances 0.000 description 34
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 26
- 239000012634 fragment Substances 0.000 description 26
- 125000003729 nucleotide group Chemical group 0.000 description 26
- 241000193996 Streptococcus pyogenes Species 0.000 description 22
- 239000011543 agarose gel Substances 0.000 description 21
- 230000009021 linear effect Effects 0.000 description 21
- 230000005782 double-strand break Effects 0.000 description 19
- 238000011534 incubation Methods 0.000 description 18
- 239000000758 substrate Substances 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 238000012360 testing method Methods 0.000 description 16
- 239000000499 gel Substances 0.000 description 15
- 238000010362 genome editing Methods 0.000 description 15
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 12
- 238000002474 experimental method Methods 0.000 description 12
- 241000192125 Firmicutes Species 0.000 description 11
- 238000011002 quantification Methods 0.000 description 11
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 10
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 10
- 238000007481 next generation sequencing Methods 0.000 description 10
- 229920002401 polyacrylamide Polymers 0.000 description 9
- 238000001890 transfection Methods 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 8
- 230000037361 pathway Effects 0.000 description 8
- 125000006850 spacer group Chemical group 0.000 description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- 238000010354 CRISPR gene editing Methods 0.000 description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 239000007795 chemical reaction product Substances 0.000 description 7
- 239000000975 dye Substances 0.000 description 7
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 7
- 239000010931 gold Substances 0.000 description 7
- 229910052737 gold Inorganic materials 0.000 description 7
- 238000011068 loading method Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 241000194031 Enterococcus faecium Species 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 108091092584 GDNA Proteins 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 4
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 4
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 4
- 241000193468 Clostridium perfringens Species 0.000 description 4
- 230000007018 DNA scission Effects 0.000 description 4
- 238000002965 ELISA Methods 0.000 description 4
- 241000192016 Finegoldia magna Species 0.000 description 4
- 239000007995 HEPES buffer Substances 0.000 description 4
- 101100189169 Streptococcus pyogenes pam gene Proteins 0.000 description 4
- 241000194020 Streptococcus thermophilus Species 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 239000004202 carbamide Substances 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 230000035484 reaction time Effects 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 3
- 241000186361 Actinobacteria <class> Species 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 3
- 108700004991 Cas12a Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 101150063416 add gene Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012091 fetal bovine serum Substances 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000010166 immunofluorescence Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 230000006780 non-homologous end joining Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 238000013081 phylogenetic analysis Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- IGAZHQIYONOHQN-UHFFFAOYSA-N Alexa Fluor 555 Chemical compound C=12C=CC(=N)C(S(O)(=O)=O)=C2OC2=C(S(O)(=O)=O)C(N)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C(O)=O IGAZHQIYONOHQN-UHFFFAOYSA-N 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 229930182816 L-glutamine Natural products 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004624 confocal microscopy Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 230000002616 endonucleolytic effect Effects 0.000 description 2
- 238000001952 enzyme assay Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 230000002949 hemolytic effect Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 102000040430 polynucleotide Human genes 0.000 description 2
- 108091033319 polynucleotide Proteins 0.000 description 2
- 239000002157 polynucleotide Substances 0.000 description 2
- 230000006916 protein interaction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- AVWQQPYHYQKEIZ-UHFFFAOYSA-K trisodium;2-dodecylbenzenesulfonate;3-dodecylbenzenesulfonate;4-dodecylbenzenesulfonate Chemical compound [Na+].[Na+].[Na+].CCCCCCCCCCCCC1=CC=C(S([O-])(=O)=O)C=C1.CCCCCCCCCCCCC1=CC=CC(S([O-])(=O)=O)=C1.CCCCCCCCCCCCC1=CC=CC=C1S([O-])(=O)=O AVWQQPYHYQKEIZ-UHFFFAOYSA-K 0.000 description 2
- OSBLTNPMIGYQGY-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;boric acid Chemical compound OB(O)O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O OSBLTNPMIGYQGY-UHFFFAOYSA-N 0.000 description 1
- UAIUNKRWKOVEES-UHFFFAOYSA-N 3,3',5,5'-tetramethylbenzidine Chemical compound CC1=C(N)C(C)=CC(C=2C=C(C)C(N)=C(C)C=2)=C1 UAIUNKRWKOVEES-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 241001156739 Actinobacteria <phylum> Species 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 241000721047 Danaus plexippus Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 241000736262 Microbiota Species 0.000 description 1
- 206010068052 Mosaicism Diseases 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000194042 Streptococcus dysgalactiae Species 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 239000008051 TBE buffer Substances 0.000 description 1
- 239000006180 TBST buffer Substances 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008649 adaptation response Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000005875 antibody response Effects 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000000942 confocal micrograph Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 238000012236 epigenome editing Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 230000007236 host immunity Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000010569 immunofluorescence imaging Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 108091005763 multidomain proteins Proteins 0.000 description 1
- DILRJUIACXKSQE-UHFFFAOYSA-N n',n'-dimethylethane-1,2-diamine Chemical compound CN(C)CCN DILRJUIACXKSQE-UHFFFAOYSA-N 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000007425 progressive decline Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000001273 protein sequence alignment Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000013112 stability test Methods 0.000 description 1
- 229940115920 streptococcus dysgalactiae Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B10/00—ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Animal Behavior & Ethology (AREA)
- General Engineering & Computer Science (AREA)
- Physiology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本発明は、向上した能力を有する新しいCas酵素を生成するための系統学的祖先配列再構築の使用に関する。この戦略により、エンドヌクレアーゼ活性とは別個のニッカーゼ活性と、無効にされていないとしても緩和されているPAM要件とを示すことができる、現在存在している種のCas9タンパク質の祖先バリアントを得た。多種多様な既存の細菌種からのCas9 gRNAのtracrRNA構成要素を使用するための能力も観察された。【選択図】なし
Description
本発明は、認識されている微生物源から単離可能でない単体エフェクターCRISPRシステム関連ヌクレアーゼとして使用するのに適したCasタンパク質、すなわちクラスIIのCasタンパク質を得る方法に関する。そのために本発明は、既存の種のCasタンパク質配列を用いて編集された系統樹から進化追跡によって得られた再構築された祖先配列を提供する。従って、そのような再構築されたタンパク質は現代の提供源から単離可能ではないという意味で合成タンパク質であるが、ゲノム編集のために今では広く使用されているクラスIIのCRISPRシステムにおいて天然に生じるCasタンパク質と同じ方法で利用することができる。本発明者らは、そのような再構築された配列のために「祖先Cas」または「AnCas」という用語を造った。新規なCasタンパク質へのこの経路は有利なことに、最もよく使用されているII型Casタンパク質のストレプトコッカス・ピオゲネス(化膿レンサ球菌)(SpyCas9)と比較して、II型タンパク質のプロトスペーサー隣接モチーフ(PAM)要件の緩和を含む有用な特性に関して、ゲノム編集のために利用可能なCasタンパク質の多様性を加えることが分かった。
天然のCRISPR-Casシステムは、原核生物に感染性遺伝因子からの侵入核酸に応答する免疫を提供する。CRISPRコード化RNA分子(gRNA)によってガイドされるCasタンパク質は、外来性ゲノムの特異的領域を認識し、不活性化のためにそれを切断する。最初のCRISPR-Cas9システムはゲノム編集ツールとして別の目的に利用されたため、そのようなCRISPRシステムおよび他のクラスIIのCRISPR-Casシステムは、ゲノム工学の分野に革命を起こした。それにも関わらず、CRISPRは同様の座位における望ましくない突然変異の発生、遺伝的モザイク現象を生じさせる複数の対立遺伝子の産生、低い効率および免疫応答の宿主において生じ得る誘導などの限界により、治療ツールとしての実施のために準備ができていない。研究から、ヒトのドナーからの血液試料がスタフィロコッカス・アウレウス(黄色ブドウ球菌)由来のSpyCas9およびCas9への抗体により高い割合を示すことが分かった(Charlesworthら,2019.Nature Med.25(2):249-254)。
公知のCRISPR-Casシステムの数および多様性は、2012年のCRISPR-Cas9システムを用いたインビトロDNA編集研究の最初の開示以来、劇的に増加している。クラスIIシステムの際立った特徴は、II型システムを利用するCas9によって例示されているように、複合体のヌクレアーゼエフェクターが単一のマルチドメインタンパク質からなるという点である。標的認識は、エンドヌクレアーゼ切断作用のために塩基対を介してCasタンパク質をその標的核酸配列部位に誘導する構造的非翻訳RNAにより達成される。ガイドRNA(gRNA)認識に加えて、プロトスペーサー隣接モチーフ(PAM)と命名された配列モチーフは、Cas-ガイドRNA標的結合および切断の開始のために必要とされる。これは、天然の抗ウイルス防御システムにおいて自己を非自己から区別するために重要である。しかしそれは、遺伝的ツールとしてのクラスIIのCRISPR-Casシステムの別の目的での利用から生じるいくつかの所望の用途のためにあまり訳に立たない。
細菌性Cas9タンパク質は最初に研究されたCasタンパク質であり、SpyCas9は依然として最も広範囲に研究されているCas9であり、かつゲノム編集のために多く使用されている。そのようなタンパク質は、HNH様およびRuvC様ヌクレアーゼドメインである2つのヌクレアーゼドメインと、平滑末端で生じる二本鎖DNAエンドヌクレアーゼ切断のために必要とされる関連する触媒残基とを含むことにより、II型Cas9タンパク質として特徴づけられている。2012年以来、Casエンドヌクレアーゼは多くの異なる細菌および古細菌から単離されている。クラスIIのCasヌクレアーゼの最近の分類は、Makarovaら(2020年)(Nature Rev Microbiol.18(2):67-83)において再考されている3つの型および17個の亜型を含む。従って、クラスIIのCRISPR-Casシステムは現在のところII、VおよびVI型システムを含み、VI型システムは最初のものであり、かつ今までのところ専らRNAのみを切断するCRISPR-Casシステムの唯一の変種である。
V型システムは、それらのエフェクターCasタンパク質のドメイン構造によりII型システムとは基本的に異なる。II型エフェクター(Cas9ヌクレアーゼ)は、HNHヌクレアーゼがRuvC様ヌクレアーゼドメイン配列の内部に挿入された状態でそれぞれが標的DNAの一本鎖の切断に寄与する2つのヌクレアーゼドメインを含み、V型エフェクター(Cas12ヌクレアーゼ)は対照的に、両方の鎖を切断するRuvC様ドメインのみを含む。VI型エフェクター(Cas13ヌクレアーゼ)は、2つのHEPNドメインを含み、かつ見たところそれらの天然の環境において侵入DNAゲノムの転写物を標的にするため、II型およびV型のエフェクターとは関係がない。Cas13タンパク質は標的認識によって誘発されるコラテラル非特異的リボヌクレアーゼ活性も示す。
V型バリアントのうち、より小さいRuvC様ドメインを有するものは現在のところV~U亜型エフェクターとして分類されている。これらは、IS605様トランスポゾンによってコード化されるTnpBタンパク質(予測されるRuvC様ヌクレアーゼ)との高い配列類似性を示し、かつTnpBから完全に一人前のV型エフェクターへの進化経路上の中間体であると考えられている。CRISPR-Casシステムは、TnpBファミリーの系統学的解析によって分かっているように、複数の独立した機会に異なるグループのTnpBから進化した。4つのV~U亜型エフェクターの干渉活性の解析により、ごく最近になってから別個のV~F亜型にアップグレードされている1つのそのようなバリアントが得られた。V~F亜型エフェクター、すなわちCas12f(最初はCas14と示されていた)は一本鎖DNA(ssDNA)を切断することが分かった。しかし、V型Cas酵素の系統学的解析は、単一のRuvC様ヌクレアーゼドメインにより単離された天然に生じるそのようなヌクレアーゼを分類する手段としてのみ使用されてきた。
Gasiunasら(2020年)(Nature Com.11(1):5512)によるCRISPR-Cas9オルソログのための天然源の広範囲な探索によって最近追加された公知の天然に生じるクラスIIのCRISPR-Casシステムの多様性にも関わらず、特に治療分野において容易な様々な遺伝子改変という所望に対してなおさらなる多様性が所望されている。SpyCas9はゲノム編集のために、そして転写調節、エピゲノム編集、塩基編集およびプライム編集のための融合酵素として広く改変されてきた。その汎用性にも関わらず、SpyCas9はその「NGG」PAM認識要件によって特定のそのような用途のためになお限られている。新しいオルソログを探索するだけでなく、定向進化技術、例えば淘汰によるPAM相互作用ドメイン(PID)のランダム突然変異誘発を利用すること、およびColliasおよびBeisel(2021年)(Nature Com.12(1):555)によって再考されているような構造誘導突然変異誘発により、この要件を緩和するための試みがなされてきた。Waltonら(2020年)(Science.368(6488):290-296)は、構造誘導突然変異誘発の適用により、コンセンサスNR PAM配列(RはAまたはGである)、およびより低い有効性でRY PAM配列(YはCまたはTである)を認識するSpRYヌクレアーゼバリアントを達成した。これは今日までにCas9バリアントのために報告されている最も緩和されたPAM要件である。
上に示されているように、本発明者らはこの場合に、RNAプログラム可能CRISPR関連ヌクレアーゼの利用可能なツールセットを拡張するための新規な手法を採用した。系統学的祖先配列再構築と呼ばれるこの手法は、数十億年前に生存していた生物中に存在していたと予測される細菌性Cas9のバリアントを産生するために使用されてきた。祖先酵素はより大きい安定性および効率を有し、化学的無差別性を示し、かつそれらの現代の子孫よりも汎用である。さらに、遺伝子治療のために祖先酵素に目を向けることの利点は、これらのタンパク質に対する宿主の前から存在する免疫を潜在的に捨てることができるという点である。本発明者らは、例えば祖先ファーミキューテス門、バシラス綱およびストレプトコッカス(レンサ球菌)属のCas9形態を設計および試験した。それらは、ヒトのHEK293T細胞株の細胞において高レベルの発現、非特異的tracrRNA結合、および高効率の遺伝子編集を示す。
本発明は、ファーミキューテス門由来ならびに例えばストレプトコッカス・ピオゲネス(化膿レンサ球菌)を包含するストレプトコッカス(レンサ球菌)属の多くの種を含むクロストリジウムおよびバシラス綱の細菌クラス内のCas9酵素の多様な集団+放線菌門からのいくつかのCas9配列のための系統学的情報の使用に基づいているが、当然のことながら同じ手法を用いて他の分類型のCas単体ヌクレアーゼエフェクターの祖先版、例えば祖先V型もしくはVI型Cas酵素を得てもよい。祖先版は同じ型であってもよいが異なる亜型であってもよい。それには、Makarovaらの同書に記載されているような現在の分類の任意の亜型から新規な亜型を割り当ててもよい。
従って一態様では、本発明は、機能的な単体エフェクターCasタンパク質ヌクレアーゼ(一般にクラスIIのCasタンパク質と呼ぶ)、例えば機能的なCas9バリアントを得るための系統学的祖先再構築方法であって、
(a)同じ分類型の天然に生じる単体エフェクターCasヌクレアーゼ配列、例えばII型Cas9配列の集団を含み、かつ複数の既存の種、好ましくは2つ以上の属、なおより好ましくは2つ以上の綱(場合により2つ以上の門を跨ぐ)から得られるCas配列の集団の配列解析からの系統樹を提供する工程と、
(b)この系統樹から進化経路を遡ることにより祖先バリアント配列を選択する工程であって、選択された祖先バリアントの各アミノ酸のために高確率のアミノ酸を決定する工程と、
(c)Casタンパク質エンドヌクレアーゼおよび/またはニッカーゼ活性を示すことができる前記バリアントを産生する工程と
を含む方法を提供する。
(a)同じ分類型の天然に生じる単体エフェクターCasヌクレアーゼ配列、例えばII型Cas9配列の集団を含み、かつ複数の既存の種、好ましくは2つ以上の属、なおより好ましくは2つ以上の綱(場合により2つ以上の門を跨ぐ)から得られるCas配列の集団の配列解析からの系統樹を提供する工程と、
(b)この系統樹から進化経路を遡ることにより祖先バリアント配列を選択する工程であって、選択された祖先バリアントの各アミノ酸のために高確率のアミノ酸を決定する工程と、
(c)Casタンパク質エンドヌクレアーゼおよび/またはニッカーゼ活性を示すことができる前記バリアントを産生する工程と
を含む方法を提供する。
当然のことながら、工程(a)の系統樹の提供のためのCas配列の開始集団は、そのような方法の事前適用によって得られる1つ以上の所定の祖先バリアント配列を含んでいてもよい。
タンパク質オルソログのタンパク質配列アラインメントにより系統樹を編集するためのコンピュータ実装方法がよく知られている。本明細書には、進化経路を編集し、それにより天然に生じるCasタンパク質の祖先バリアントを予測し、かつ何百万年も前から再構築することを可能にするコンピュータ実装方法の使用についてさらに記載されている。本発明者らは、高い産生レベルならびに高い効率のDNAの標的化および編集を示す20~30億年程も古いCas9酵素の「復活」を初めて報告する。
要するに、工程(b)のコンピュータ実装は、
(i)同じ属、例えばストレプトコッカス(レンサ球菌)属の配列のある部分を形成するそれぞれが複数の種の配列のためのちょうど祖先バリアントである祖先バリアントの配列を編集すること、好ましくはさらに
(ii)(i)で達成された配列を使用して、祖先属として割り当てられている1つ以上の祖先バリアント配列、例えば利用可能なストレプトコッカス(レンサ球菌)属Cas配列の全てまたは少なくとも大きい割合のためだけに編集されている祖先配列である祖先配列および/または複数の属の開始種の配列まで遡ることができる祖先綱として割り当てられている1つ以上の祖先バリアント配列、例えば複数の属を跨ぐ利用可能なバシラス綱配列の全てまたは少なくとも大きい割合のためだけに祖先配列として編集されている祖先配列を編集すること、好ましくはさらに
(iii)2つ以上の綱の開始種まで遡ることができる少なくとも1つの綱間祖先配列を編集すること
を含んでいてもよい。そのような祖先バリアントは産生のための好ましい選択であり得るが、このように編集された様々な祖先バリアントは有利な特性を有していることを見い出すことができる。
(i)同じ属、例えばストレプトコッカス(レンサ球菌)属の配列のある部分を形成するそれぞれが複数の種の配列のためのちょうど祖先バリアントである祖先バリアントの配列を編集すること、好ましくはさらに
(ii)(i)で達成された配列を使用して、祖先属として割り当てられている1つ以上の祖先バリアント配列、例えば利用可能なストレプトコッカス(レンサ球菌)属Cas配列の全てまたは少なくとも大きい割合のためだけに編集されている祖先配列である祖先配列および/または複数の属の開始種の配列まで遡ることができる祖先綱として割り当てられている1つ以上の祖先バリアント配列、例えば複数の属を跨ぐ利用可能なバシラス綱配列の全てまたは少なくとも大きい割合のためだけに祖先配列として編集されている祖先配列を編集すること、好ましくはさらに
(iii)2つ以上の綱の開始種まで遡ることができる少なくとも1つの綱間祖先配列を編集すること
を含んでいてもよい。そのような祖先バリアントは産生のための好ましい選択であり得るが、このように編集された様々な祖先バリアントは有利な特性を有していることを見い出すことができる。
バシラス綱およびクロストリジウム綱の両方の既存の細菌種のCas9配列を含む、上に記載されているCas9配列の集団から開始するそのような綱間祖先バリアント配列(または共通祖先門配列)の編集に繋がる1つのそのような進化経路マップが図1に示されている。バシラス綱の細菌種の開始配列は、SpyCas9を含むストレプトコッカス(レンサ球菌)属の多く(数は28)の公知のCas9配列を含むことに気づくであろう。かなりの数(例えば25個以上)の既存のストレプトコッカス(レンサ球菌)属のCas9配列を含むバシラス綱に属する多様な範囲の細菌からのCas9配列を含む開始配列のそのような多様な集団の使用は、そのような進化マップ構築のために非常に望ましいものとして認識されるであろう。
工程(c)の産生は通常、好適な宿主細胞、例えば大腸菌における発現のために核酸配列を提供することによるものである。コード配列はコドン最適化されていてもよい。
典型的な具体例は、あらゆるPAM要件の知識がない場合であっても所望されている切断活性をどのように試験することができるかを示している。望ましくは、最初にインビトロ試験によってそのような活性が観察される場合、それはヒトの細胞におけるさらなる試験において維持されるであろう。例えば、複数の既存の種からのCas9配列の集団から開始して選択された祖先バリアントが達成された場合、選択された祖先バリアントの活性は、インビトロ条件下および既存の種からのCas9配列、例えばSpyCas9のエンドヌクレアーゼ活性のために適していることが知られているヒトの細胞株において試験してもよい。ヒトの細胞におけるそのような試験のために、Cas酵素のためにヒトのコドン最適化配列が、選択された細胞におけるCasタンパク質発現に適した発現ベクターに望ましくは用いられるであろう。
最初に選択されたバリアントがCasエンドヌクレアーゼである場合、その後にそれを関連するヌクレアーゼ触媒部位のアミノ酸突然変異誘発のために知られている方法でニッカーゼに変換するかdeadCas(dcas)に変換してもよく、かつ/または非ヌクレアーゼエフェクターに融合させてもよい。例えば、Cas9エンドヌクレアーゼの一方または両方のヌクレアーゼ部位を不活性化させ、かつCas9酵素を別のエフェクター、例えば塩基編集またはプライム編集のための酵素または転写もしくは後成的調節因子に結合させる方法がよく知られている。
上に記載されている祖先再構築方法によって得られる新規なCas酵素、および例えば宿主細胞における発現のための発現ベクターにおいて提供されるそれをコードする核酸配列も本発明によって包含される。本発明の範囲内で、本明細書に記載されているCasヌクレアーゼまたはCasヌクレアーゼバリアントを本明細書では互換的に「祖先Cas」または「AnCas」と呼ぶ。
特に興味深いここに教示されている祖先配列再構築とは、参照ヌクレアーゼとしてのSpyCasによるdsDNAプラスミド標的の直線化のための条件下でSpyCas9と比較して、より高い比のニック入りテンプレート:直線化テンプレートによって反映される時間分離可能なニッカーゼおよびエンドヌクレアーゼ活性を示すAnCasバリアント酵素の達成である。すなわち、本明細書に記載されているAnCasバリアント酵素は、同じ条件下でSpyCas9と比較してより大きい割合のニック入りプラスミドDNAテンプレートを産生することができたり、あるいは同じ条件下でSpyCas9と比較してプラスミドDNAテンプレートにおいてより低い割合の二本鎖切断を生じさせたりすることができる。実際によく知られているように、SpyCas9は、1つのヌクレアーゼ部位が除去されている場合を除いて、よく用いられる使用条件下ではニッカーゼ酵素として認識されない。対照的にここでは、SpyCas9により少なくとも4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比が得られるという条件下で、少なくとも2.3:1~少なくとも1:4の直線化DNAプラスミドテンプレート:ニック入りDNAプラスミドテンプレートの比を有するCas9祖先バリアントとして得られるAnCas酵素が提供される。すなわち、30分後にLFCA、LBCAおよびLSCAなどの本発明に従って得られるAnCas酵素は、DNAテンプレートの少なくとも30%~DNAテンプレートの少なくとも70%、例えば約80%にニックを入れることができるが、同じ条件下でSpyCas9は同じ量の時間でDNAテンプレートの約10%にニックを入れる(図11を参照)。従って言い換えると、AnCasヌクレアーゼは、SpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが生じさせるがAnCasヌクレアーゼおよび目的のバリアントは同じ条件下で観察可能なニック入り標的を提供する条件下で、dsDNAプラスミド標的に対してより高いニック率およびより低い直線化率を有する。
これは、AnCas酵素において、SpyCas9と比較して緩和されたPAM要件、すなわち実際には、SpyCas9がNGG、例えばTGGのその認識される3ヌクレオチドPAM要件を維持して有意なDNA切断活性を示すという条件下で観察不可能な3ヌクレオチドまたは最大7ヌクレオチド特異的PAM要件と組み合わせてもよい。
さらに、そのような緩和されたPAM要件は、非常に柔軟なgRNA使用と組み合わせられていることが観察された。従って本明細書において報告されているように、AnCasはCas9オルソログを有する多種多様な既存の細菌種のいずれかのものに対応するCas9 tracrRNA構成要素と共にsgRNAを利用できることが分かった。従って標的化配列は異なってもよいが、sgRNAはそれ以外については、複数の公知のCas9オルソログと共に用いられ得るようなsgRNAに似ている。そのような非特異的tracrRNAの使用は、任意の公知のCas9オルソログについて以前に報告されたことがある性質ではない。
またそのような有利な特性は、一本鎖DNAおよび一本鎖RNAを切断するための能力と組み合わせて達成された。この場合も同様に、これはSpyCas9から区別される特性である。
そのようなAnCasの例として、ここでは、本発明者らによって最終ファーミキューテス門共通祖先(LFCA)と命名されたSpyCas9を含む既存のファーミキューテス門Cas9酵素の非常に有利な祖先が提供される(図1、図9のノード63および配列番号1を参照)。
配列番号1-LFCA
MKKDYSIGLDIGTNSVGWAVTDDNYNLVRKKMKVLGNTDKKSIGKALWGVRLFDAAETAEERRMHRTTRRRYTRRRQRIDLLQEIFQEEISKVDPSFFIRLNESRLHPEDKTDDRHPLFGDNETDKDYHKQYPTIYHLRKHLMESDEKHDIRLVYLALHHIIKYRGHFLIEGDLNSENTDVEELFKQLVQVFNDTFEEEHLSEEAIDIEEILTDKKSRSTRAKEVVKLFGSEKKQACISALIKLIVGLKGNLKKVFGDAEDTSIHFSKDNYEEDLEAIRDIIPDEYADLFEAIKALYDAIVLSGILGGSTSNTKAKVSASMIARYEQHQKDLKQLKQFVKEHLPEKYNEIFSDNTKNGYSAYIEGGTSQEDFYKYLKKILKELEEAEYLLEEIENENFLPKQRTSDNGVIPYQIHLEELRAILKNQGKYYPFLKENAEKIESILTFRIPYYVGPLARGNGRFAWMIRKKDGKITPWNFDEVVDKEKSAEEFIERMTNNCTYLPGENVLPKNSLLYEKFTVLNELNNVRLTTDKGKTRRFSAEQKQEIFDDLFRKNRKVTKKKLEDYLKREYEEFDSADISGIDGEFKSSLGSYHDFCKIVVKGNSLDEEDYKDIIEEIIKWLTVFEDRKMLRRRLEKYSEILTEEQIKKICKRHYTGWGRLSRKLLTGIRDKETGKSIIDVLRETDSSNRNFMQLLSDEDLSFKEEIEQANAEAEGENLHEIVEDLPGSPAIKRGILQALKIVDEIVKVMGHEPKNIFVEMARENQKTGRGRRSTKKRLKRLQEALKNLGSNLLKELPRDDNELRNDRLFLYYTQMGKCMYTGEPIDLDDLSNYDIDHIIPQSFIKDDSLDNRVLVSREENARKTDNFPSPEIRRKMKSFWQMLLKAGLISKKKFDRLTRADRGDFTDDELAGFIARQLVETRQITKHVATLLKQRYPTEKDEEDKTIRNAKIVSVKANLVSEFRQDFGLYKCREVNDYHHAHDAYLNAVVGNALLKKYPQLAAEFIKGDYRKNNAREENKANAKMHFYSNIMNSFTSDVKIADETGEIVWDKEKDIATVRKVMNYHQVLITRKVEEEKGGFFDQTILSKGNSKKLIPLKKNLDPEKYGGYNSPTVAYSVLVEYDIEKGKKKKLKTVKQLVGIPIRERAKLEKNPIKYLEKKGYQNPKVDLLIKIPKNSLFELDGGRRRILAAAKELKNANQLVLPAEEYTLLDKVAKIIKKNNSESIEYVEEHLSEFDELLESLIDYSPKLALQDKNLEKIKEAFEQLNLADKKEVAKEIINLLHCTATTANAALKFLGGSKNRMRYTSIKELLNASLIHQSITGLYETRIDLGKLGED
配列番号1-LFCA
MKKDYSIGLDIGTNSVGWAVTDDNYNLVRKKMKVLGNTDKKSIGKALWGVRLFDAAETAEERRMHRTTRRRYTRRRQRIDLLQEIFQEEISKVDPSFFIRLNESRLHPEDKTDDRHPLFGDNETDKDYHKQYPTIYHLRKHLMESDEKHDIRLVYLALHHIIKYRGHFLIEGDLNSENTDVEELFKQLVQVFNDTFEEEHLSEEAIDIEEILTDKKSRSTRAKEVVKLFGSEKKQACISALIKLIVGLKGNLKKVFGDAEDTSIHFSKDNYEEDLEAIRDIIPDEYADLFEAIKALYDAIVLSGILGGSTSNTKAKVSASMIARYEQHQKDLKQLKQFVKEHLPEKYNEIFSDNTKNGYSAYIEGGTSQEDFYKYLKKILKELEEAEYLLEEIENENFLPKQRTSDNGVIPYQIHLEELRAILKNQGKYYPFLKENAEKIESILTFRIPYYVGPLARGNGRFAWMIRKKDGKITPWNFDEVVDKEKSAEEFIERMTNNCTYLPGENVLPKNSLLYEKFTVLNELNNVRLTTDKGKTRRFSAEQKQEIFDDLFRKNRKVTKKKLEDYLKREYEEFDSADISGIDGEFKSSLGSYHDFCKIVVKGNSLDEEDYKDIIEEIIKWLTVFEDRKMLRRRLEKYSEILTEEQIKKICKRHYTGWGRLSRKLLTGIRDKETGKSIIDVLRETDSSNRNFMQLLSDEDLSFKEEIEQANAEAEGENLHEIVEDLPGSPAIKRGILQALKIVDEIVKVMGHEPKNIFVEMARENQKTGRGRRSTKKRLKRLQEALKNLGSNLLKELPRDDNELRNDRLFLYYTQMGKCMYTGEPIDLDDLSNYDIDHIIPQSFIKDDSLDNRVLVSREENARKTDNFPSPEIRRKMKSFWQMLLKAGLISKKKFDRLTRADRGDFTDDELAGFIARQLVETRQITKHVATLLKQRYPTEKDEEDKTIRNAKIVSVKANLVSEFRQDFGLYKCREVNDYHHAHDAYLNAVVGNALLKKYPQLAAEFIKGDYRKNNAREENKANAKMHFYSNIMNSFTSDVKIADETGEIVWDKEKDIATVRKVMNYHQVLITRKVEEEKGGFFDQTILSKGNSKKLIPLKKNLDPEKYGGYNSPTVAYSVLVEYDIEKGKKKKLKTVKQLVGIPIRERAKLEKNPIKYLEKKGYQNPKVDLLIKIPKNSLFELDGGRRRILAAAKELKNANQLVLPAEEYTLLDKVAKIIKKNNSESIEYVEEHLSEFDELLESLIDYSPKLALQDKNLEKIKEAFEQLNLADKKEVAKEIINLLHCTATTANAALKFLGGSKNRMRYTSIKELLNASLIHQSITGLYETRIDLGKLGED
さらなる例として、ここでは、本発明者らによって最終バシラス綱共通祖先(LBCA)と命名されたSpyCas9を含む既存のバシラス綱Cas9酵素の非常に有利な祖先バリアントも提供される(図1を参照、図9のノード70および配列番号2を参照)。このAnCasは、ストレプトコッカス(レンサ球菌)属種を含むバシラス綱の幅広い現代の細菌種のCas配列まで進化追跡可能な祖先綱バリアントを示す。
配列番号2-LBCA
MKKDYSIGLDIGTNSVGWAVITDDYKVVRKKMKVLGNTDKKSIKKNLWGVRLFDSGETAEDTRLKRTTRRRYTRRRNRICYLQEIFQEEMNKVDDSFFHRLDESFLVPEDKKYDRHPIFGNLEEEVAYHEQYPTIYHLRKHLADSSEKADLRLVYLALAHIIKYRGHFLIEGDLNTENTDVEELFKQFVQVYNQTFEEQHLSDETIDVEEILTEKVSKSRRAENVLKLFPNEKKNGLFGQLIKLIVGLQGNFKKVFDLSEDAKLQFSKDTYEEDLENLLAMIGDEYADLFLAAKNLYDAILLSGILTTTDNNTKAKLSASMIKRYEEHQKDLAQLKQFIKEHLPDKYNEIFSDSSKNGYAGYIEGKTSQEDFYKYLKKILSKIDGAEYFLEKIEQENFLRKQRTFDNGVIPHQIHLEELRAILRRQGKYYPFLKENQEKIEQILTFRIPYYVGPLARGNSRFAWLTRKSDEPITPWNFDEVVDKEKSAEAFIERMTNYDTYLPNEKVLPKHSLLYEKFTVFNELTKVRYVTDRGKTQNFSAEQKQEIFDDLFKKNRKVTKKKLENYLKKEYEYFDSPDITGIEDEFNASLGTYHDLLKILKSKDFLDDEENEEILEDIVKILTVFEDRKMIRKRLEKYSDILTEEQLKKLERRHYTGWGRLSRKLINGIRDKQSGKTILDYLIDDDSSNRNFMQLINDDNLSFKEEIEKAQVIGETENLHEIVQDLPGSPAIKKGILQSLKIVDELVKVMGHEPKNIVVEMARENQTTSRGRRNSKQRLKRLEEALKNLGSNLLKEHPVDNQQLQNDRLYLYYLQNGKDMYTGQELDIDNLSNYDIDHIIPQSFIKDNSIDNRVLVSSEENRGKSDNVPSKEVVRKMKSFWQKLLNAGLISQRKFDNLTKAERGGLTEDDKAGFIKRQLVETRQITKHVANILDSRFNTEKDEEDNTIRNVKIITLKSNLVSQFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPQLEPEFVYGDYRKNNAREENKATAKKHFYSNIMNFFASEVKIADETGEIVWDKEKDIATVRKVLSYHQVNIVKKVEVQKGGFSKETILPKGNSNKLIPRKNNWDPKKYGGFDSPTVAYSVLVTYDIEKGKKKKLKTVKELVGITIMERSAFEKNPIAYLEKKGYQNPQEDVLIKLPKYSLFELENGRRRMLASAKELQKGNQMVLPAHLVTLLYHAKRIDKSNNSESLEYVEEHRNEFDELLDYIIDFSEKYILADKNLEKIKKLYEQNNEADIKELAKSFINLLTFTAMGAPAAFKFFGETIDRKRYTSIKELLNATLIHQSITGLYETRIDLGKLGED
配列番号2-LBCA
MKKDYSIGLDIGTNSVGWAVITDDYKVVRKKMKVLGNTDKKSIKKNLWGVRLFDSGETAEDTRLKRTTRRRYTRRRNRICYLQEIFQEEMNKVDDSFFHRLDESFLVPEDKKYDRHPIFGNLEEEVAYHEQYPTIYHLRKHLADSSEKADLRLVYLALAHIIKYRGHFLIEGDLNTENTDVEELFKQFVQVYNQTFEEQHLSDETIDVEEILTEKVSKSRRAENVLKLFPNEKKNGLFGQLIKLIVGLQGNFKKVFDLSEDAKLQFSKDTYEEDLENLLAMIGDEYADLFLAAKNLYDAILLSGILTTTDNNTKAKLSASMIKRYEEHQKDLAQLKQFIKEHLPDKYNEIFSDSSKNGYAGYIEGKTSQEDFYKYLKKILSKIDGAEYFLEKIEQENFLRKQRTFDNGVIPHQIHLEELRAILRRQGKYYPFLKENQEKIEQILTFRIPYYVGPLARGNSRFAWLTRKSDEPITPWNFDEVVDKEKSAEAFIERMTNYDTYLPNEKVLPKHSLLYEKFTVFNELTKVRYVTDRGKTQNFSAEQKQEIFDDLFKKNRKVTKKKLENYLKKEYEYFDSPDITGIEDEFNASLGTYHDLLKILKSKDFLDDEENEEILEDIVKILTVFEDRKMIRKRLEKYSDILTEEQLKKLERRHYTGWGRLSRKLINGIRDKQSGKTILDYLIDDDSSNRNFMQLINDDNLSFKEEIEKAQVIGETENLHEIVQDLPGSPAIKKGILQSLKIVDELVKVMGHEPKNIVVEMARENQTTSRGRRNSKQRLKRLEEALKNLGSNLLKEHPVDNQQLQNDRLYLYYLQNGKDMYTGQELDIDNLSNYDIDHIIPQSFIKDNSIDNRVLVSSEENRGKSDNVPSKEVVRKMKSFWQKLLNAGLISQRKFDNLTKAERGGLTEDDKAGFIKRQLVETRQITKHVANILDSRFNTEKDEEDNTIRNVKIITLKSNLVSQFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPQLEPEFVYGDYRKNNAREENKATAKKHFYSNIMNFFASEVKIADETGEIVWDKEKDIATVRKVLSYHQVNIVKKVEVQKGGFSKETILPKGNSNKLIPRKNNWDPKKYGGFDSPTVAYSVLVTYDIEKGKKKKLKTVKELVGITIMERSAFEKNPIAYLEKKGYQNPQEDVLIKLPKYSLFELENGRRRMLASAKELQKGNQMVLPAHLVTLLYHAKRIDKSNNSESLEYVEEHRNEFDELLDYIIDFSEKYILADKNLEKIKKLYEQNNEADIKELAKSFINLLTFTAMGAPAAFKFFGETIDRKRYTSIKELLNATLIHQSITGLYETRIDLGKLGED
例として、さらにここでは、本発明者らによって最終ストレプトコッカス(レンサ球菌)属共通祖先(LSCA)と命名されたSpyCas9の非常に有利な祖先バリアントが提供される(図1、図9のノード91および配列番号3を参照)。このAnCasは共通祖先属とみなされるAnCasを示す。それはSpyCas9を含む表1に列挙されている全ての開始ストレプトコッカス(レンサ球菌)属配列の作り出された共通祖先である。
配列番号3-LSCA
MKKPYSIGLDIGTNSVGWAVITDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRRNRICYLQEIFSEEMNKVDDSFFHRLDESFLVPEDKKYDRHPIFGNLAEEVAYHEQYPTIYHLRKHLADSTEKADLRLVYLALAHIIKFRGHFLIEGDLNAENTDVQKLFQQFVEVYNQTFEESHLSEETIDVEEILTEKISKSRRLENLIKHFPNEKKNGLFGNLIALILGLQPNFKTNFDLSEDAKLQFSKDTYEEDLENLLAQIGDEYADLFLAAKNLYDAILLSGILTVTDNSTKAPLSASMIKRYEEHQKDLAQLKQFIKEHLPDKYNEIFSDKSKNGYAGYIEGKTSQEDFYKYLKKILSKIDGAEYFLDKIDREDFLRKQRTFDNGSIPHQIHLQELHAILRRQGEYYPFLKENQEKIEKILTFRIPYYVGPLARGNSRFAWLTRKSDEKITPWNFDEVVDKESSAEAFIERMTNYDTYLPNEKVLPKHSLLYETFTVYNELTKVKYVTERGKTQFFSAEQKQEIFDHLFKKNRKVTKKKLKDYLEKEFEEFDSVDITGVEDEFNASLGTYHDLLKILKDKDFLDDEENEEILEDIVLTLTLFEDREMIRKRLEKYSDLFTKEQLKKLERRHYTGWGRLSRKLINGIRDKQSGKTILDYLIDDGSSNRNFMQLINDDSLSFKEEIEKAQVIGETDNLHEVVQDLAGSPAIKKGILQSLKIVDELVKVMGHNPENIVVEMARENQTTNRGRRNSRQRLKRLEEALKNLGSNILKEHPVDNQQLQNDRLYLYYLQNGKDMYTGEELDIDNLSQYDIDHIIPQSFIKDDSIDNRVLTSSEENRGKSDNVPSIEVVRKMKSFWQKLLNAGLISQRKFDNLTKAERGGLTEDDKAGFIKRQLVETRQITKHVAQILDSRFNTERDENDKRIRNVKIITLKSNLVSQFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPKLEPEFVYGDYKKYNDRERGKATAKMFFYSNIMNFFKTEVKLADETGEIVWDKEKDFATVRKVLSYPQVNIVKKVEVQTGGFSKESILPKGNSDKLIPRKNNWDPKKYGGFDSPTVAYSVLVVADVEKGKAKKLKTVKELVGITIMERSAFEKNPIAFLEKKGYQNIQEDLIIKLPKYSLFELENGRRRLLASAKELQKGNEMVLPAHLVTLLYHAKRIDKSNNSENLEYVEKHKNEFDELLDYIIDFSEKYILADKNLEKIKELYDQNDDADINELASSFINLLTFTALGAPAAFKFFGETIDRKRYTSTKEVLNATLIHQSITGLYETRIDLSKLGED
配列番号3-LSCA
MKKPYSIGLDIGTNSVGWAVITDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRRNRICYLQEIFSEEMNKVDDSFFHRLDESFLVPEDKKYDRHPIFGNLAEEVAYHEQYPTIYHLRKHLADSTEKADLRLVYLALAHIIKFRGHFLIEGDLNAENTDVQKLFQQFVEVYNQTFEESHLSEETIDVEEILTEKISKSRRLENLIKHFPNEKKNGLFGNLIALILGLQPNFKTNFDLSEDAKLQFSKDTYEEDLENLLAQIGDEYADLFLAAKNLYDAILLSGILTVTDNSTKAPLSASMIKRYEEHQKDLAQLKQFIKEHLPDKYNEIFSDKSKNGYAGYIEGKTSQEDFYKYLKKILSKIDGAEYFLDKIDREDFLRKQRTFDNGSIPHQIHLQELHAILRRQGEYYPFLKENQEKIEKILTFRIPYYVGPLARGNSRFAWLTRKSDEKITPWNFDEVVDKESSAEAFIERMTNYDTYLPNEKVLPKHSLLYETFTVYNELTKVKYVTERGKTQFFSAEQKQEIFDHLFKKNRKVTKKKLKDYLEKEFEEFDSVDITGVEDEFNASLGTYHDLLKILKDKDFLDDEENEEILEDIVLTLTLFEDREMIRKRLEKYSDLFTKEQLKKLERRHYTGWGRLSRKLINGIRDKQSGKTILDYLIDDGSSNRNFMQLINDDSLSFKEEIEKAQVIGETDNLHEVVQDLAGSPAIKKGILQSLKIVDELVKVMGHNPENIVVEMARENQTTNRGRRNSRQRLKRLEEALKNLGSNILKEHPVDNQQLQNDRLYLYYLQNGKDMYTGEELDIDNLSQYDIDHIIPQSFIKDDSIDNRVLTSSEENRGKSDNVPSIEVVRKMKSFWQKLLNAGLISQRKFDNLTKAERGGLTEDDKAGFIKRQLVETRQITKHVAQILDSRFNTERDENDKRIRNVKIITLKSNLVSQFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPKLEPEFVYGDYKKYNDRERGKATAKMFFYSNIMNFFKTEVKLADETGEIVWDKEKDFATVRKVLSYPQVNIVKKVEVQTGGFSKESILPKGNSDKLIPRKNNWDPKKYGGFDSPTVAYSVLVVADVEKGKAKKLKTVKELVGITIMERSAFEKNPIAFLEKKGYQNIQEDLIIKLPKYSLFELENGRRRLLASAKELQKGNEMVLPAHLVTLLYHAKRIDKSNNSENLEYVEKHKNEFDELLDYIIDFSEKYILADKNLEKIKELYDQNDDADINELASSFINLLTFTALGAPAAFKFFGETIDRKRYTSTKEVLNATLIHQSITGLYETRIDLSKLGED
ここでは、本発明者らによって最終化膿性共通祖先(LPCA)および最終化膿性/溶血性共通祖先(LPDCA)と命名された、ストレプトコッカス・ピオゲネス(化膿レンサ球菌)を含む2種以上のストレプトコッカス(レンサ球菌)属種まで進化追跡可能なSpyCas9の祖先バリアントも提供される(図9のノード92および95のそれぞれならびに配列番号4および5を参照)。
配列番号4-LPCA
MKKPYSIGLDIGTNSVGWAVITDDYKVPAKKMKVLGNTDRQSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSEEMAKVDDSFFHRLEESFLVPEDKKYDRHPIFGNLADEVAYHENYPTIYHLRKKLADSTEKADLRLIYLALAHIIKFRGHFLIEGDLNAENTDVQKLFHQLVDTYNQLFEEDQLDTETIDAKAILTAKISKSRRLENLISQIPGQKKNGLFGNLIALSLGLTPNFKSNFDLSEDAKLQLSKDTYEEDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILTVNDESTKAPLSASMIKRYEEHQQDLALLKQLVKEQLPEKYKEIFSDKSKNGYAGYIDGKTSQEEFYKYIKPILSKLDGAEEFLAKIDREDFLRKQRTFDNGSIPHQIHLEELHAILRRQEEYYPFLKDNQEKIEKILTFRIPYYVGPLARGNSRFAWLTRKSDEAITPWNFEEVVDKEASAQAFIERMTNFDTYLPNEKVLPKHSLLYETFTVYNELTKVKYVTEGMTKPFLSAEQKQAIVDLLFKKNRKVTVKQLKEDYFKKIECFDSVDITGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEKRLAKYADLFDKKVLKKLKRRHYTGWGRLSRKLINGIRDKQSGKTILDFLKADGFANRNFMQLINDDSLSFKEEIEKAQVIGQTDSLHEVVADLAGSPAIKKGILQTIKIVDELVKVMGHNPENIVIEMARENQTTAQGIKNSRQRMKRLEEVLKKLGSNILKEHPVDNTQLQNDRLYLYYLQNGKDMYTGQELDIDNLSQYDIDHIIPQSFIKDDSIDNKVLTSSEENRGKSDNVPSIEVVRKMKSYWQKLLNAGLISQRKFDNLTKAERGGLTESDKAGFIKRQLVETRQITKHVAQILDSRFNTERDENDKPIRNVKIITLKSKLVSDFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPKLEPEFVYGDYKKYDDKERGKATAKMFFYSNIMNFFKTEVKLANETGEIVWDKEKDFATVRKVLSYPQVNIVKKTEVQTGGFSKESILPKGNSDKLIPRKNNWDPKKYGGFDSPTVAYSVLVVAKVEKGKAKKLKTVKELVGITIMERSAFEKNPIAFLEAKGYQDIQEDLIIKLPKYSLFELENGRRRLLASAKELQKGNEMVLPAHLVTFLYHASRIDKSTSSENLEYVEQHKHEFDEILDYIIDFSERYILADKNLEKIKSLYNQNDDSDINELASSFINLFTFTALGAPAAFKFFDATIDRKRYTSTKEVLNATLIHQSITGLYETRIDLSQLGGD
配列番号5-LPDCA
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLAKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRHYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEEIQKAQVSGQGDSLHEQIANLAGSPAIKKGILQTVKVVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDEQEIGKATAKRFFYSNIMNFFKTEITLANETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKAKKLKSVKELVGITIMERSSFEKNPIDFLEAKGYKDVQKDLIIKLPKYSLFELENGRRRMLASAGELQKGNEMVLPAKLVTFLYHASHIEKSKSPENNAYVEQHKHDLDEILEYISEFSKRYILADKNLSKVKSLFNKHEDSSISELASSIINLFTLTSLGAPAAFKFLDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
配列番号4-LPCA
MKKPYSIGLDIGTNSVGWAVITDDYKVPAKKMKVLGNTDRQSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSEEMAKVDDSFFHRLEESFLVPEDKKYDRHPIFGNLADEVAYHENYPTIYHLRKKLADSTEKADLRLIYLALAHIIKFRGHFLIEGDLNAENTDVQKLFHQLVDTYNQLFEEDQLDTETIDAKAILTAKISKSRRLENLISQIPGQKKNGLFGNLIALSLGLTPNFKSNFDLSEDAKLQLSKDTYEEDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILTVNDESTKAPLSASMIKRYEEHQQDLALLKQLVKEQLPEKYKEIFSDKSKNGYAGYIDGKTSQEEFYKYIKPILSKLDGAEEFLAKIDREDFLRKQRTFDNGSIPHQIHLEELHAILRRQEEYYPFLKDNQEKIEKILTFRIPYYVGPLARGNSRFAWLTRKSDEAITPWNFEEVVDKEASAQAFIERMTNFDTYLPNEKVLPKHSLLYETFTVYNELTKVKYVTEGMTKPFLSAEQKQAIVDLLFKKNRKVTVKQLKEDYFKKIECFDSVDITGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEKRLAKYADLFDKKVLKKLKRRHYTGWGRLSRKLINGIRDKQSGKTILDFLKADGFANRNFMQLINDDSLSFKEEIEKAQVIGQTDSLHEVVADLAGSPAIKKGILQTIKIVDELVKVMGHNPENIVIEMARENQTTAQGIKNSRQRMKRLEEVLKKLGSNILKEHPVDNTQLQNDRLYLYYLQNGKDMYTGQELDIDNLSQYDIDHIIPQSFIKDDSIDNKVLTSSEENRGKSDNVPSIEVVRKMKSYWQKLLNAGLISQRKFDNLTKAERGGLTESDKAGFIKRQLVETRQITKHVAQILDSRFNTERDENDKPIRNVKIITLKSKLVSDFRKDFGLYKVREINDYHHAHDAYLNAVVGTALLKKYPKLEPEFVYGDYKKYDDKERGKATAKMFFYSNIMNFFKTEVKLANETGEIVWDKEKDFATVRKVLSYPQVNIVKKTEVQTGGFSKESILPKGNSDKLIPRKNNWDPKKYGGFDSPTVAYSVLVVAKVEKGKAKKLKTVKELVGITIMERSAFEKNPIAFLEAKGYQDIQEDLIIKLPKYSLFELENGRRRLLASAKELQKGNEMVLPAHLVTFLYHASRIDKSTSSENLEYVEQHKHEFDEILDYIIDFSERYILADKNLEKIKSLYNQNDDSDINELASSFINLFTFTALGAPAAFKFFDATIDRKRYTSTKEVLNATLIHQSITGLYETRIDLSQLGGD
配列番号5-LPDCA
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLAKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRHYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEEIQKAQVSGQGDSLHEQIANLAGSPAIKKGILQTVKVVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDEQEIGKATAKRFFYSNIMNFFKTEITLANETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKAKKLKSVKELVGITIMERSSFEKNPIDFLEAKGYKDVQKDLIIKLPKYSLFELENGRRRMLASAGELQKGNEMVLPAKLVTFLYHASHIEKSKSPENNAYVEQHKHDLDEILEYISEFSKRYILADKNLSKVKSLFNKHEDSSISELASSIINLFTLTSLGAPAAFKFLDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
LFCA Cas、LBCA CasおよびLSCA Casの全てが、SpyCas9 dsDNA切断に適した条件下でSpyCas9よりも高いニック率および低いエンドヌクレアーゼ(二本鎖切断)率を示すことが分かった。これらの活性の比は、これまで観察された最も高い比を有するLFCA Casを含む祖先の年齢の関数であることが分かった。
LFCA Cas、LBCA CasおよびLSCA Casの全てが、上に記載されているPAM要件の緩和を有するCas9バリアントを達成するための本発明の祖先再構築戦略の有用性も例示している。従って、そのようなAnCasヌクレアーゼをPAMlessとみなしてもよい。
LFCA Cas、LBCA CasおよびLSCA Casの全てが、本明細書において報告されている研究によって示されているように、一本鎖DNAを切断することができることがさらに分かった。LFCAおよびLBCA Casも、本明細書において報告されている研究によって示されているように、一本鎖RNAを切断することができることが分かった。
最後に、LFCA Cas、LBCA CasおよびLSCA Casの全てが、本明細書において報告されている研究によって示されているように、抗Cas9抗体に対して弱い応答しか誘発しないことがさらに分かった。この特徴はインビボ用途のために特に興味深いものであり得る。
以下の図および添付の特許請求の範囲を参照しながら、本発明について以下にさらに説明する。
ここに教示されている戦略によって機能的な祖先Casバリアントを得るための開始配列集団は、好ましくは例示されているように、それにより系統樹を配列アラインメント情報に基づいて構築することができる存在している細菌種からのCas9配列の集団であってもよい。系統樹を構築するためのコンピュータ実装方法は、配列アラインメントおよび保存された領域の認識を必要とする分野においてよく知られている。但し、上に記載されているように、系統樹を別のクラスIIのCas酵素型の配列から構築し得るということは除外されない。
好ましくは、開始配列は2つ以上の属を跨ぐ。例えば実施例の箇所に示されているように、有利な祖先Cas9バリアントを探索する際に、複数のCas9配列は、ストレプトコッカス、エンテロコッカス、リステリア、クロストリジウム、ペラギルハブダス(Pelagirhabdus)、ハロラクティバシラス(Halolactibacillus)、フルオリコッカス(Floricoccus)、バゴコッカス(Vagococcus)、ウリナコッカス(Urinacoccus)、バゴコッカス(Vagococcus)、ドレア(Dorea)、ルミノコッカス、ラクノスピラ、アナエロスティペス(Anaerostipes)、オルセネラ(Oisenella)およびビフィドバクテリウムのうちの2つ以上から選択されてもよい。2つ以上の種の配列は、各選択された属、例えば2、3、4つ以上、例えば最大25個以上、例えば28個のストレプトコッカス(レンサ球菌)属種からの配列から選択されてもよい。上に記載されているように、LSCAは、図1によって示されているストレプトコッカス・ピオゲネス(化膿レンサ球菌)を含む表1に列挙されている28個全てのストレプトコッカス(レンサ球菌)属種の進化追跡可能な共通祖先である。
より好ましくは、配列の開始集団は目的の門の2つ以上の綱を跨ぐ。従って上に示されているように、有利な祖先Cas9バリアントを探索する際に、開始集団において細菌のバシラス綱およびクロストリジウム綱の両方由来のCas9配列を組み合わせることが有用であることが分かった。例えば配列の開始集団は望ましくは、ストレプトコッカス(レンサ球菌)属の異なる種由来の少なくとも複数の配列、エンテロコッカスの異なる種由来の複数の配列、リステリアの異なる種由来の複数の配列およびクロストリジウム属種由来の複数の配列を含んでいてもよい。開始集団の多様性は、実施例の箇所で用いられているCas9配列の開始集団にいくつかの放線菌配列を含めることにより示されているように、門を横切ってさらに拡大させてもよい。望ましくは、Cas配列の開始集団は複数の亜型を跨いでいてもよい。
公知のCas配列から編集された系統樹から開始して、予測される祖先形態への進化経路を編集してもよく、これは今日から何百万年も遡ることと同等であってもよい。本発明に従って得られる選択された祖先バリアント配列は、現在から少なくとも5億年、例えば少なくとも7~8億年またはさらには10億年以上の進化期間と同等であってもよい。上に記載されているように、進化期間は20~30億年と同程度の長さ、例えば約22~24億年と同等であってもよい。
図1によって示されているように、LFCA Casは、クロストリジウム綱およびバシラス綱(両方がファーミキューテス門の細菌属)を跨ぎ、かついくつかの放線菌が追加された既存の細菌種の集団由来のCas9配列の系統樹の進化経路解析から得られた、Cas酵素のそのような再構築された祖先である。それは、バシラス綱由来の既存のCas9酵素までの進化経路のより初期の祖先メンバーの祖先(配列番号2を有するLBCA Casと命名された再構築された祖先綱)およびより具体的にはストレプトコッカス(レンサ球菌)属由来の幅広いCas酵素の再構築された祖先(配列番号3を有する再構築された祖先属LSCA Cas)の祖先として考えることができる。次いでLSCAはストレプトコッカス(レンサ球菌)属由来のより小さい選択範囲(28個のうちの8つ)のCas酵素の再構築された祖先(配列番号4を有するLPCA Casと命名された再構築された祖先)の祖先であり、次いでLPCAはストレプトコッカス・ピオゲネス(化膿レンサ球菌)およびストレプトコッカス・ディスガラクティエ(Streptococcus dysgalactiae)配列の祖先(配列番号5を有する再構築された祖先LPDCA Cas)である。
本明細書および添付の図で使用される「Bys」、「Bya」および「Gya」という用語は、数十億年を指すために同義で使用される。
上に記載されているように、LFCA Casは図示されている進化経路のノード63によって表されており、配列番号1に示されているアミノ酸配列を有する。それはインビトロおよびヒトの細胞の両方において、高い産生レベルならびにDNAを標的化および編集する高い効率を示す。
従ってここでは本発明の態様として、そのような新規なCas酵素の同定のための本明細書において教示されている戦略の採用によって得られた機能的な祖先Casの好ましい例を表す、配列番号1のアミノ酸配列を有するLFCA Casを含むかそれからなるCasヌクレアーゼが提供される。LFCA CasはSpyCas9に進化的に関連しているものとみなされるが、それを特に好ましいAnCasヌクレアーゼにさせる多くの有利な違いを有する。
LFCA Casの興味深い性質として、以下が報告されている。
(i)LFCA Casは天然では知られておらず、かつSpyCas9とのたった54%の配列同一性を有する。それにも関わらず、それは実施例の箇所に示されているガイドRNA/Casタンパク質相互作用のためにSpyCas sgRNAの3’末端を有するsgRNAを用いることができる、
(ii)SpyCas9とは対照的に、それは時間分離可能なニッキング活性と、その後に、SpyCas9 PAM配列を提供し、かつSpyCas9による同じプラスミドのエンドヌクレアーゼ切断のための条件下で二本鎖プラスミドDNAに対してエンドヌクレアーゼ活性とを示す。
(iii)それは広いPAM特異性を示し、図4aのPAM車輪グラフによって示されているように、LFCA CasはPAM認識の特異性を示さなかった。図4bの切断データは、3ヌクレオチド配列に関わらずニック入りプラスミドDNAが10nMで10分以内に、提案されているPAM配列を提供したことを示している。対照的に、SpyCas9は同じ条件下で、そのカノニカルPAM配列すなわちTGGを含むプラスミドのほぼ100%を切断し、かつ他のPAM配列との低い活性を示すか全く活性を示さなかった。PAM提供について7ヌクレオチドバリアント配列を用いて同様の結果が得られた。従って試験した条件下で、LFCA Casを「PAMless」と命名することができる。
(iv)それはgRNA要件における高い柔軟性を示し、図8によって示されているように、それは複数の既存の細菌種のいずれかのものに対応するCas9 tracrRNA構成要素を有し、かつストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)およびフィネゴルディア・マグナ(Finegoldia magna)ならびにストレプトコッカス・ピオゲネス(化膿レンサ球菌)を含む多種多様なものを跨ぐsgRNAを利用することができる。
(v)LFCA Casはより高い切断活性を示し、次いで低い温度(4~20℃)およびpH7.9でニッキング活性として観察されるSpyCas9を示した。
(vi)より高い温度(53~60℃)で、それはニッカーゼおよびエンドヌクレアーゼ活性の両方が観察される状態でSpyCas9よりも高い熱安定性を示した。
(vii)異なるpHおよび37℃でのpH安定性試験において、LFCA Casは酸性条件下でSpy Cas9よりも高い活性を維持した。アルカリ性pHでは、LFCA Casの活性は同じままであり、ここではSpyCas9はその最適な性能を示した。
(viii)LFCA Casは、図13に示すように一本鎖DNA基質に対して切断活性を示す。よく知られているように、これは遺伝子改変分野における通常の使用条件下ではSpyCas9の活性ではない。
(i)LFCA Casは天然では知られておらず、かつSpyCas9とのたった54%の配列同一性を有する。それにも関わらず、それは実施例の箇所に示されているガイドRNA/Casタンパク質相互作用のためにSpyCas sgRNAの3’末端を有するsgRNAを用いることができる、
(ii)SpyCas9とは対照的に、それは時間分離可能なニッキング活性と、その後に、SpyCas9 PAM配列を提供し、かつSpyCas9による同じプラスミドのエンドヌクレアーゼ切断のための条件下で二本鎖プラスミドDNAに対してエンドヌクレアーゼ活性とを示す。
(iii)それは広いPAM特異性を示し、図4aのPAM車輪グラフによって示されているように、LFCA CasはPAM認識の特異性を示さなかった。図4bの切断データは、3ヌクレオチド配列に関わらずニック入りプラスミドDNAが10nMで10分以内に、提案されているPAM配列を提供したことを示している。対照的に、SpyCas9は同じ条件下で、そのカノニカルPAM配列すなわちTGGを含むプラスミドのほぼ100%を切断し、かつ他のPAM配列との低い活性を示すか全く活性を示さなかった。PAM提供について7ヌクレオチドバリアント配列を用いて同様の結果が得られた。従って試験した条件下で、LFCA Casを「PAMless」と命名することができる。
(iv)それはgRNA要件における高い柔軟性を示し、図8によって示されているように、それは複数の既存の細菌種のいずれかのものに対応するCas9 tracrRNA構成要素を有し、かつストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)およびフィネゴルディア・マグナ(Finegoldia magna)ならびにストレプトコッカス・ピオゲネス(化膿レンサ球菌)を含む多種多様なものを跨ぐsgRNAを利用することができる。
(v)LFCA Casはより高い切断活性を示し、次いで低い温度(4~20℃)およびpH7.9でニッキング活性として観察されるSpyCas9を示した。
(vi)より高い温度(53~60℃)で、それはニッカーゼおよびエンドヌクレアーゼ活性の両方が観察される状態でSpyCas9よりも高い熱安定性を示した。
(vii)異なるpHおよび37℃でのpH安定性試験において、LFCA Casは酸性条件下でSpy Cas9よりも高い活性を維持した。アルカリ性pHでは、LFCA Casの活性は同じままであり、ここではSpyCas9はその最適な性能を示した。
(viii)LFCA Casは、図13に示すように一本鎖DNA基質に対して切断活性を示す。よく知られているように、これは遺伝子改変分野における通常の使用条件下ではSpyCas9の活性ではない。
ヒトの細胞において(本明細書ではHEK293T細胞を用いて例示されている)、LFCA Casは好適なgRNAを用いてそのような細胞において発現される場合に標的化された座位においてインデル形成を促進することができることが分かった(本明細書ではAAVS1座位を用いて例示されている)。さらに、同じ座位におけるノックイン遺伝子改変を促進するための能力が、図6および図7に示すように確認された。
本発明の態様として、それぞれ配列番号2、3、4および5のアミノ酸配列を有するLBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Casを含むかそれからなるCasヌクレアーゼが提供される。LBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Casはそれぞれ、それらをCas酵素として公知のCas9酵素から区別する興味深い性質をLFCA Casと共有する。特に興味深いのは、例えば実施例の箇所においてLBCA CasおよびLSCA Casについてさらに示されているように、SpyCasと比較して産生されるニック入りプラスミドテンプレートのより高い割合である(以下の典型的な具体例によって示されているように、SpyCasと比較してプラスミド直線化率に対するより高いニック率と同等である)。上に記載されているように、ニック入りプラスミドテンプレートの割合(および/またはニック率)は、興味深いことに祖先の年齢と共にこのグループの酵素において上昇することが分かり、この特徴はLFCA Casにおいて最も明白である。対照的に、直線化率および/または二本鎖切断の割合は祖先の年齢と共に減少することが分かった。
従って、本発明は、
(i)LFCA Casとして命名され、かつ配列番号1に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(ii)LBCA Casとして命名され、かつ配列番号2に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(iii)LSCA Casとして命名され、かつ配列番号3に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(iv)LPCA Casとして命名され、かつ配列番号4に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(v)LPDCA Casとして命名され、かつ配列番号5に記載されているアミノ酸配列を有するCasヌクレアーゼ、または
SpyCas9と比較して以下の際立った特性:
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート、
(b)当該バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、DNAプラスミド標的に対するより高いニック率およびより低い直線化率(好ましくは、少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比)、
(c)LFCA Cas、LBCA Casおよび/またはLSCA Casのいずれかに匹敵する緩和されたPAM要件、
(d)一本鎖DNAを切断するための能力、
(e)標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
のうちの1つ以上を保持するそのようなCasヌクレアーゼのバリアント
を含むかそれからなるCasヌクレアーゼに関する。
(i)LFCA Casとして命名され、かつ配列番号1に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(ii)LBCA Casとして命名され、かつ配列番号2に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(iii)LSCA Casとして命名され、かつ配列番号3に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(iv)LPCA Casとして命名され、かつ配列番号4に記載されているアミノ酸配列を有するCasヌクレアーゼ、
(v)LPDCA Casとして命名され、かつ配列番号5に記載されているアミノ酸配列を有するCasヌクレアーゼ、または
SpyCas9と比較して以下の際立った特性:
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート、
(b)当該バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、DNAプラスミド標的に対するより高いニック率およびより低い直線化率(好ましくは、少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比)、
(c)LFCA Cas、LBCA Casおよび/またはLSCA Casのいずれかに匹敵する緩和されたPAM要件、
(d)一本鎖DNAを切断するための能力、
(e)標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
のうちの1つ以上を保持するそのようなCasヌクレアーゼのバリアント
を含むかそれからなるCasヌクレアーゼに関する。
本明細書で使用される「バリアント」という用語は、配列番号1、配列番号2、配列番号3、配列番号4および配列番号5のいずれか1つの配列とそれぞれ比較して少なくとも1つのアミノ酸突然変異(例えば、付加、置換または欠失)を有するCasヌクレアーゼを指す。典型的にはCasヌクレアーゼバリアントは、配列番号1、配列番号2、配列番号3、配列番号4または配列番号5のアミノ酸配列と少なくとも60%の配列同一性、好ましくは少なくとも65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%以上の配列同一性を共有する。当然のことながら、Casバリアントのアミノ酸配列は、配列番号1、配列番号2、配列番号3、配列番号4または配列番号5のいずれか1つと100%同一ではない。
いくつかの実施形態では、Casヌクレアーゼバリアントのアミノ酸配列は、配列番号1のアミノ酸配列と少なくとも60%、65%、70%、75%、80%、85%、90%、95%以上の配列同一性を共有する。
いくつかの実施形態では、Casヌクレアーゼバリアントのアミノ酸配列は、配列番号2のアミノ酸配列と少なくとも75%、80%、85%、90%、95%以上の配列同一性を共有する。
いくつかの実施形態では、Casヌクレアーゼバリアントのアミノ酸配列は、配列番号3のアミノ酸配列と少なくとも80%、85%、90%、95%以上の配列同一性を共有する。
いくつかの実施形態では、Casヌクレアーゼバリアントのアミノ酸配列は、配列番号4のアミノ酸配列と少なくとも85%、90%、95%以上の配列同一性を共有する。
いくつかの実施形態では、Casヌクレアーゼバリアントのアミノ酸配列は、配列番号5のアミノ酸配列と少なくとも95%、96%、97%、98%、99%以上の配列同一性を共有する。
いくつかの実施形態では、本発明に係るCasヌクレアーゼは置換または欠失、例えばエンドヌクレアーゼおよび/またはニッカーゼ活性がLFCA Cas、LBCA Casおよび/またはLSCA Casの緩和されたPAM特異性と共に保持される1つ以上の保存的置換による1つ以上のアミノ酸変化を有する。いくつかの実施形態では、本発明に係るCasヌクレアーゼはニッカーゼ活性を有する。いくつかの実施形態では、本発明に係るCasヌクレアーゼは緩和されたPAM要件を有する。いくつかの実施形態では、本発明に係るCasヌクレアーゼはPAM要件を有さず、すなわちCasヌクレアーゼはPAMlessである。
好ましい実施形態では、本発明のCasヌクレアーゼは配列番号1を有するLFCAまたはそのバリアントであるか、配列番号2を有するLBCAまたはそのバリアントである。
例として、LBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Casは、以下のさらなる興味深い性質を有する。
(a)LBCA Casは天然では知られておらず、かつSpyCas9と70%の同一性しか有しない。LSCA Casは天然では知られておらず、かつSpyCas9と75%の同一性しか有さない。LPCA Casは天然では知られておらず、かつSpyCas9と83.5%の同一性を有する。LPDCA Casは天然では知られておらず、かつSpyCas9と97.5%の同一性を有する。それにも関わらず、それらは実施例の箇所に示されているガイドRNA/Casタンパク質相互作用のためにSpyCas sgRNAの3’末端を有するsgRNAを用いることができる。
(b)SpyCas9とは対照的に、上に記載されているように、LBCA CasおよびLSCA Casの両方が緩和されたPAM要件(図13a、図13bおよび図24)および一本鎖DNAを切断するためのその能力(図14)をLFCA Casと共有することが分かった。
(a)LBCA Casは天然では知られておらず、かつSpyCas9と70%の同一性しか有しない。LSCA Casは天然では知られておらず、かつSpyCas9と75%の同一性しか有さない。LPCA Casは天然では知られておらず、かつSpyCas9と83.5%の同一性を有する。LPDCA Casは天然では知られておらず、かつSpyCas9と97.5%の同一性を有する。それにも関わらず、それらは実施例の箇所に示されているガイドRNA/Casタンパク質相互作用のためにSpyCas sgRNAの3’末端を有するsgRNAを用いることができる。
(b)SpyCas9とは対照的に、上に記載されているように、LBCA CasおよびLSCA Casの両方が緩和されたPAM要件(図13a、図13bおよび図24)および一本鎖DNAを切断するためのその能力(図14)をLFCA Casと共有することが分かった。
但し、本明細書において例示されている新規なAnCas酵素は、核酸修飾のために有利なそのような酵素を達成するための本発明の新規な祖先配列再構築手法の有用性の単に例示であることが理解されるであろう。当然のことながら、本明細書における教示は、SpyCas9と比較して同じ新規な特性、例えば
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート(すなわち二本鎖切断の割合)、および/または
(b)当該バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、DNAプラスミド標的に対するより高いニック率およびより低い直線化率(少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比と同等であってもよい)、および/または
(c)LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件、および/または
(d)一本鎖DNAおよび/または一本鎖RNAを切断するための能力、および/または
(e)標的化配列が、例えばストレプトコッカス・ピオゲネス(化膿レンサ球菌)、ストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)およびフィネゴルディア・マグナ(Finegoldia magna)の全てを含む複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
の1つ以上を共有する例示されているAnCas酵素のバリアントを含む他のCas9バリアント酵素の達成の道を開く。
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート(すなわち二本鎖切断の割合)、および/または
(b)当該バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、DNAプラスミド標的に対するより高いニック率およびより低い直線化率(少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比と同等であってもよい)、および/または
(c)LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件、および/または
(d)一本鎖DNAおよび/または一本鎖RNAを切断するための能力、および/または
(e)標的化配列が、例えばストレプトコッカス・ピオゲネス(化膿レンサ球菌)、ストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)およびフィネゴルディア・マグナ(Finegoldia magna)の全てを含む複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
の1つ以上を共有する例示されているAnCas酵素のバリアントを含む他のCas9バリアント酵素の達成の道を開く。
特に本発明の態様として、機能的な等価物の好ましい祖先Casヌクレアーゼも本明細書において提供され、その機能的な等価物は図9の進化経路上のノードによって表されている。これらの機能的な等価物のCasヌクレアーゼのアミノ酸配列は、添付の配列表に配列番号10~236として与えられている。
本発明は、祖先Casヌクレアーゼを得るための方法にまで及び、ここでは選択される祖先酵素は、既存のCas9酵素まで進化追跡可能であり、好ましくは例えば、SpyCas9まで進化追跡可能であり、かつ上に記載されている特性(a)~(e):
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート、
(b)当該バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、DNAプラスミド標的に対するより高いニック率およびより低い直線化率(好ましくは、少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比)、
(c)LFCA Cas、LBCA Casおよび/またはLSCA Casのいずれかに匹敵する緩和されたPAM要件、
(d)一本鎖DNAを切断するための能力、
(e)標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
の1つ以上を有する。
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート、
(b)当該バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化またはほぼ専ら直線化のみが得られるという条件下での、DNAプラスミド標的に対するより高いニック率およびより低い直線化率(好ましくは、少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比)、
(c)LFCA Cas、LBCA Casおよび/またはLSCA Casのいずれかに匹敵する緩和されたPAM要件、
(d)一本鎖DNAを切断するための能力、
(e)標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
の1つ以上を有する。
場合により、特性(a)および(d)の一方もしくは両方または特性(a)および(e)の一方もしくは両方と組み合わせられたか、あるいは場合により(a)、(d)および(e)の全てと組み合わせられた、上に記載されている緩和されたPAM特異性を有するAnCasの選択が特に好ましいものであり得る。上に記載されているように、選択されたAnCasは、例えばSpyCas9により少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比が得られるという条件下で、少なくとも約2.3:1~少なくとも1:4の間の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比を提供してもよい。
従って本発明の方法を適用して、以下:
・SpyCas9により少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比が得られるという条件下での、少なくとも約2.3:1~少なくとも1:4の間の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比、
・LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件、
・一本鎖DNAおよび/または一本鎖RNAを切断するための能力、および
・標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
という特性うちの1つ以上を有する祖先Casヌクレアーゼを得ることができる。
・SpyCas9により少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比が得られるという条件下での、少なくとも約2.3:1~少なくとも1:4の間の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比、
・LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件、
・一本鎖DNAおよび/または一本鎖RNAを切断するための能力、および
・標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
という特性うちの1つ以上を有する祖先Casヌクレアーゼを得ることができる。
そのような方法は、そのようなAnCasヌクレアーゼをニッカーゼのみまたはヌクレアーゼ活性を有しないdeadCasのいずれかであるバリアントに変換すること、および/または例えば融合タンパク質において非ヌクレアーゼエフェクターへの結合を提供することをさらに含んでいてもよい。ニッカーゼのみまたはヌクレアーゼ活性を有しないdeadCasのいずれかであるそのようなバリアントおよび/または融合タンパク質も、本発明における産物それ自体として考えられる。
いくつかの実施形態では、Casヌクレアーゼは、触媒部位の突然変異誘発によりヌクレアーゼ活性を有しないdeadCasに変換された、本発明に係るヌクレアーゼの非ヌクレアーゼ修飾されたdeadCasバリアントである。いくつかの実施形態では、Casヌクレアーゼは触媒活性を伴わない。いくつかの実施形態では、CasヌクレアーゼはdeadCasである。
いくつかの実施形態では、CasヌクレアーゼまたはCasヌクレアーゼバリアントは、遺伝子改変もしくは調節のために非ヌクレアーゼエフェクターと結合されている。いくつかの実施形態では、非ヌクレアーゼエフェクターはCasヌクレアーゼまたはCasヌクレアーゼバリアントと前記非ヌクレアーゼエフェクターとを含む融合タンパク質である。
いくつかの実施形態では、祖先Casヌクレアーゼは以下の特性:
・一本鎖DNAを切断するための能力、および/または
・一本鎖RNAを切断するための能力
のうちの1つ以上をさらに有する。
・一本鎖DNAを切断するための能力、および/または
・一本鎖RNAを切断するための能力
のうちの1つ以上をさらに有する。
一実施形態では、祖先Casヌクレアーゼは、LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件を有する。一実施形態では、祖先CasヌクレアーゼはPAM要件を有しない。
いくつかの実施形態では、祖先Casヌクレアーゼは以下の特性:
・一本鎖DNAを切断するための能力,
・一本鎖RNAを切断するための能力、および/または
・LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件
のうちの1つ以上を有する。
・一本鎖DNAを切断するための能力,
・一本鎖RNAを切断するための能力、および/または
・LFCA Cas、LBCA CasおよびLSCA Casのいずれに匹敵する緩和されたPAM要件
のうちの1つ以上を有する。
いくつかの実施形態では、祖先Casヌクレアーゼは以下の特性:
・一本鎖DNAを切断するための能力、
・一本鎖RNAを切断するための能力、および/または
・LFCA Casに匹敵するPAM要件不要状態(すなわちPAMless活性)
のうちの1つ以上を有する。
・一本鎖DNAを切断するための能力、
・一本鎖RNAを切断するための能力、および/または
・LFCA Casに匹敵するPAM要件不要状態(すなわちPAMless活性)
のうちの1つ以上を有する。
SpyCas9と比較して際立った上記特性(a)~(e)のうちの1つ以上を保持する上に記載されている例示されているAnCasヌクレアーゼのバリアントも提供される。この場合も同様に、例えば場合により上記(a)、(b)、(d)および(e)に指定されている1つ、2つまたは全ての特性、例えば上に記載されているSpyCas9と比較してより多くのニック入りテンプレートおよび/またはより少ない直線化テンプレートの産生(二本鎖切断の量)、および/または上に記載されているSpyCas9と比較してより高いニック率:直線化率の比、および/または一本鎖DNAを切断するための能力と共に、LFCA Casによって示されるような緩和されたPAM特異性の保持が特に好ましいものであり得る。好ましくは、全てのこれらの特性が保持される。
上に示されているように機能的等価物である、すなわち上に列挙されているLFCA Casの特性(i)~(viii)の全てを維持するLFCA Casおよびそのバリアントが特に好ましい。但し、上で考察されている少なくとも緩和されたPAM特異性および/または柔軟なtracrRNA利用を保持するLFCA Casバリアントは、Cas酵素ツールボックスへの非常に好ましい追加とみなされる。
慣習によれば、「直線活性」および「エンドヌクレアーゼ活性」という用語は、プラスミドの形態で提供される二本鎖DNAの両方の鎖を切断するためのヌクレアーゼ活性を指すように本明細書において同義で使用される。「直線化活性率」、「直線化率」および「直線活性率」という用語は、時間の関数として両方の鎖を介して切断された標的dsDNAの量の尺度を指すために本明細書において同義で使用される。本明細書で使用される「ニッカーゼ」は、プラスミドなどのdsDNA分子の一本鎖のみを切断し、それによりニックを形成するヌクレアーゼを指す。「ニッカーゼ活性率」および「ニック率」は同義で使用され、時間の関数として一本鎖を介して切断された標的dsDNAの量の尺度を指す。ニッカーゼおよび/または直線活性率は、
(i)30nMのCasヌクレアーゼをgRNAと共に、切断緩衝液(例えば、100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μgのBSA、pH7.9)中で1:1の比および37℃で少なくとも5分間インキュベートすること、
(ii)標的DNA、例えばプラスミドを添加すること、
(iii)例えば30分間インキュベートすること、
(iv)切断反応を停止すること、および
(v)例えば、最終反応産物をアガロースゲル上で泳動させることにより、最終反応産物を可視化すること
を含む方法によって試験してもよい。
(i)30nMのCasヌクレアーゼをgRNAと共に、切断緩衝液(例えば、100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μgのBSA、pH7.9)中で1:1の比および37℃で少なくとも5分間インキュベートすること、
(ii)標的DNA、例えばプラスミドを添加すること、
(iii)例えば30分間インキュベートすること、
(iv)切断反応を停止すること、および
(v)例えば、最終反応産物をアガロースゲル上で泳動させることにより、最終反応産物を可視化すること
を含む方法によって試験してもよい。
30分間のインキュベーション時間を用いる記載されている方法と同様の方法を用いて、本発明の好ましいCasヌクレアーゼは、SpyCas9により少なくとも4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比が得られるという条件下で、少なくとも2.3:1~少なくとも1:4の間の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比を生成してもよい。従って上に記載されているように30分後に、LFCA、LBCAおよびLSCAなどの本発明に従って得られるAnCas酵素は、DNAテンプレートの少なくとも30%~少なくとも70%、例えばDNAテンプレートの約80%にニックを入れてもよく、同じ条件下でSpyCas9は、図11に示すように同じ量の時間でDNAテンプレートの約10%にニックを入れる。
本発明の好ましいCasヌクレアーゼによって形成される二本鎖切断(DSB)を有するDNAテンプレート(すなわち、直線化テンプレート)の割合は、10%~約70%であってもよい。本発明の好ましいCasヌクレアーゼによって形成される二本鎖切断(DSB)を有するDNAテンプレートの割合は、最大で70%、60%、50%、40%、30%、20%または10%であってもよい。本発明の好ましいCasヌクレアーゼによって形成される二本鎖切断(DSB)を有するDNAテンプレートの割合は15%~約65%であってもよい。本発明の好ましいCasヌクレアーゼによってDNAテンプレートにおいて形成される二本鎖切断の割合(DSB)は19%~約62%であってもよい。
LFCA Casによって形成される二本鎖切断(DSB)を有するDNAテンプレートの割合は約19%であってもよい。LBCA Casによって形成される二本鎖切断(DSB)を有するDNAテンプレートの割合は約36%であってもよい。LSCA Casによって形成される二本鎖切断(DSB)を有するDNAテンプレートの割合は約62%であってもよい。逆に、本発明の好ましいCasヌクレアーゼのうちのいずれか1つを試験するために使用されるような同じ実験条件下で、SpyCas9によって形成された二本鎖切断(DSB)を有するDNAテンプレートの割合は少なくとも70%、75%または80%である。
本発明の好ましいCasヌクレアーゼによって形成されるニックを有するDNAテンプレート(すなわち、ニック入りテンプレートが生成される)の割合は20%~約100%であってもよい。本発明の好ましいCasヌクレアーゼによって形成されるニックを有するDNAテンプレートの割合は少なくとも30%、40%、50%、60%、70%、80%または90%であってもよい。本発明の好ましいCasヌクレアーゼによって形成されるニックを有するDNAテンプレートの割合は20%~約90%であってもよい。本発明の好ましいCasヌクレアーゼによって形成されるニックを有するDNAテンプレートの割合は35%~約85%であってもよい。
LFCA Casによって形成されるニックを有するDNAテンプレートの割合は約80%であってもよい。LBCA Casによって形成されるニックを有するDNAテンプレートの割合は約65%であってもよい。LSCA Casによって形成されるニックを有するDNAテンプレートの割合は約35%であってもよい。逆に、本発明の好ましいCasヌクレアーゼのうちのいずれか1つを試験するために使用される同じ実験条件下でSpyCas9によって形成されたニックを有するDNAテンプレートの割合は最大で約20%または10%である。
図12に示すように、本発明の好ましい祖先Cas酵素の切断活性の違いは、直線化率およびニック率により示すことができる。従って、本発明の好ましいCasヌクレアーゼの直線化率は約0.001~約0.1m-1であってもよいものとみなすことができる。本発明の好ましいCasヌクレアーゼのニック率は約-0.4~約-0.1m-1であってもよい。例えば直線化率およびニック率は表2に示されているとおりであってもよい。
いくつかの実施形態では、Casヌクレアーゼバリアントはニッカーゼ活性のみを保持するように触媒部位の突然変異誘発により改変されている。いくつかの実施形態では、CasヌクレアーゼバリアントはCasニッカーゼである。いくつかの実施形態では、Casヌクレアーゼのアミノ酸配列は、置換または欠失、例えば1つ以上の保存的置換による1つ以上のアミノ酸変化を含み、それによりLFCA Casの緩和されたPAM特異性と共にエンドヌクレアーゼおよび/またはニッカーゼ活性が保持されている。
上記から、上で考察されているLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Casおよびそれらのバリアント(ならびにそれらの機能的等価物、例えば図9の進化経路上のノードによって表されているもの、または本発明の祖先再構築戦略に従って得られる他のもの)がCasタンパク質、特に最も高い観察されたニック率を有するLFCA Casのツールボックスへの非常に有用な新規な追加としてみなされることは明らかであろう。それらは、ニッカーゼのみの作用を促進するための条件下で直接使用してもよい(但し、例えばLFCAニッカーゼ、LBCAニッカーゼおよびLSCAニッカーゼ、LPCAニッカーゼおよびLPDCAニッカーゼとしてニッカーゼ活性のみを保持するための触媒部位の突然変異誘発による改変は除外されない)。LFCA Cas、LBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Casのいずれかまたはそのようなバリアントは、遺伝子改変のためのエフェクタータンパク質、例えば塩基編集のためのデアミナーゼまたはプライム編集のための逆転写酵素などの塩基エディターと結合(例えば融合)されていてもよい。
当然のことながら、置換または欠失、例えば1つ以上の保存的置換により1つ以上のアミノ酸変化を有するLFCA Cas、LBCA Cas、LSCA Cas、LPCAおよびLPCDA Casのいずれのバリアント(または触媒部位の突然変異誘発により得られる対応するニッカーゼ)は、エンドヌクレアーゼおよび/またはニッカーゼ活性が保持されるという条件で、Cas9エンドヌクレアーゼまたはCas9ニッカーゼとして同様に用いてもよい。LFCA Cas、LBCA Casおよび/またはLSCA Casのために示されている緩和されたPAM特異性も保持するそのようなバリアントは特に興味深く、かつ本発明の一部を形成している。
本発明の一部を形成する本発明の祖先再構築戦略によって得られるAnCasヌクレアーゼのバリアントまたは触媒部位の突然変異誘発により得られる対応するニッカーゼのバリアントは、例えば1つ以上の所望の際立った特性を保持することを条件として、親酵素と様々な程度の配列同一性を有していてもよい。それらは例えば少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%または少なくとも99%の配列同一性を有していてもよい。
天然に生じるCas9ヌクレアーゼと同様に、上に記載されているLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Casのいずれかまたはそれらのバリアント(ならびにそれらの機能的等価物、例えば図9の進化経路上のノードによって表されているものまたは本発明の祖先再構築戦略に従って得られるそれ以外のもの)も、触媒部位の突然変異誘発によりヌクレアーゼ活性を有しないdCasに変換してもよく、かつさらに非ヌクレアーゼエフェクタータンパク質と結合(例えば融合)させてもよい。
従って、上で考察されているLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasおよびLPCDA Cas、それらのバリアント(ならびにそれらの機能的等価物、例えば図9の進化経路上のノードによって表されているものまたは本発明の祖先再構築戦略に従って得られるそれ以外のもの)は、既存の種の天然に生じるCas9ヌクレアーゼおよびその改変版のために考えられるあらゆる種類の遺伝子改変技術において用いてもよい。これらは塩基エディターなどの遺伝子改変もしくは調節のためのエフェクターと組み合わせた使用にまで及び、ここでの結合は国際公開第2017/011721号(ラトガース大学、Horizon Discovery社にライセンスが与えられている)において教示されているようなガイドおよびRNA結合ドメインのRNA伸長を介したものである。Collantesら,2021.CRISPR J.4(1):58-68も参照されたい。
好ましくは、例えば非ヌクレアーゼエフェクターに結合または融合されているCas酵素バリアントは、ニッカーゼ活性のみを有するかヌクレアーゼ活性を有しない(すなわちdCasである)ために、従来の触媒部位の突然変異誘発により改変されたヌクレアーゼ活性を有する本発明に従って得られる任意のAnCasまたはそのバリアントであってもよく、かつ例えばLFCA Cas、LBCA Casおよび/またはLSCA Casにより観察される緩和されたPAM特異性を示す。
本発明は、それらのバリアントおよび機能的等価物を含む本明細書に記載されているAnCasタンパク質の発現のための核酸、例えばそのようなタンパク質の発現のための発現ベクターをさらに提供する。そのようなベクターは、ガイドRNAまたはDNAから発現されるガイドRNAと共に用いてもよい。従って、本明細書において教示されているAnCasヌクレアーゼまたはそのバリアントもしくは機能的等価物を提供するベクターと好適なガイドRNAとの組み合わせが細胞へのトランスフェクションのために提供されてもよい。例えばヒトの細胞におけるLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasまたはLPCDA Casまたはそのバリアントもしくは機能的等価物の発現のためのベクターを含む1つ以上のベクターを含むそのような組み合わせは、薬学的に許容される賦形剤を含む医薬組成物の形態で提供されてもよい。
好ましくは、Casタンパク質はLFCA Casまたは対応するニッカーゼであってもよい。当然のことながら、本明細書において教示されている祖先酵素のいずれかの対応するニッカーゼ、例えばLBCAニッカーゼ、LSCAニッカーゼ、LPCAニッカーゼまたはLPCDAニッカーゼがそのように提供されてもよい。
従って本発明はさらに、本発明に係るCasヌクレアーゼまたはCasヌクレアーゼバリアントを発現することができる核酸に関する。
いくつかの実施形態では、核酸はDNAもしくはRNA分子である。いくつかの実施形態では、核酸はDNA分子、例えば相補的なDNA分子である。いくつかの実施形態では、核酸はRNA分子、例えばメッセンジャーRNA分子である。
いくつかの実施形態では、核酸は一本鎖または二本鎖である。いくつかの実施形態では、核酸は一本鎖である。いくつかの実施形態では、核酸は二本鎖である。
いくつかの実施形態では、核酸は天然のヌクレオチドを含む。いくつかの実施形態では、核酸は天然および非天然のヌクレオチドの組み合わせを含む。
いくつかの実施形態では、核酸はベクターに含まれている。好適なベクターの非限定的な例は、プラスミド、フォスミド、コスミド、人工の染色体またはウイルスベクターを含む。いくつかの実施形態では、当該ベクターはナノ粒子、例えば脂質ナノ粒子に含まれている。
本発明はさらに、本明細書の上に記載されている本発明に係る核酸を含むベクターとCasヌクレアーゼまたはそのバリアントもしくは機能的等価物を標的DNA配列に標的化するためのガイドRNAとの組み合わせ、あるいはガイドRNAを発現することができるベクターに関する。
あるいは、LFCA Cas、LBCA Cas、LSCA Cas、LPCA CasまたはLPCDA Casなどの本明細書において教示されている新規なAnCasヌクレアーゼまたはそのバリアントもしくは機能的等価物、例えば上で考察されている対応するニッカーゼは、例えば単離された細胞の中への電気穿孔法による細胞へのトランスフェクションのためのガイドRNAを含むリボ核タンパク質(RNP)複合体として提供されてもよい。従って本発明はさらに、本発明に係るCasヌクレアーゼまたはCasヌクレアーゼバリアントを含むリボ核タンパク質複合体、あるいはCasヌクレアーゼまたはCasヌクレアーゼバリアントおよびCasヌクレアーゼまたはCasヌクレアーゼバリアントを標的DNA配列に標的化するためのガイドRNAに言及する。
当然のことながら、本明細書で使用される「ガイドRNA」という用語は、RNA(sgRNA)を標的化する単一の分子、あるいは天然に生じるCas9に関して好適であれば、(i)標的配列に相補的なヌクレオチド配列を含むDNA標的化セグメント(crRNA)と、(ii)Casタンパク質と相互作用するタンパク質結合セグメント(tracrRNA)とを含む2つの配列からなるRNAであってもよい。
さらなる態様では、本発明は標的核酸配列、例えば標的DNA配列を改変または調節するための方法であって、標的配列を(i)教示されているCasタンパク質、例えば上で考察されているLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasまたはLPCDA Casあるいはそのバリアントもしくは機能的等価物と、(ii)標的配列にCasタンパク質を標的化するためのガイドRNAとを含む複合体と接触させることを含み、
(a)前記接触させることは、好ましくは人間の生殖細胞系列同一性を改変する方法は除外されるという条件で、インビトロで単離された標的核酸配列とのもの、あるいはエクスビボで細胞内でのものである、および/または
(b)本方法はヒトもしくは動物の体に対して実施される医学的治療方法ではない
のいずれかである方法を提供する。
(a)前記接触させることは、好ましくは人間の生殖細胞系列同一性を改変する方法は除外されるという条件で、インビトロで単離された標的核酸配列とのもの、あるいはエクスビボで細胞内でのものである、および/または
(b)本方法はヒトもしくは動物の体に対して実施される医学的治療方法ではない
のいずれかである方法を提供する。
当該複合体は、例えばこの目的の導入遺伝子を標的DNA配列内に導入するために目的の導入遺伝子をコードする核酸分子をさらに含んでいてもよい。
好ましくは、本Casタンパク質は、同じ緩和されたPAM要件を保持する、例えば上に記載されているLFCA Cas、LBCA Casまたは別の例示されているAnCasヌクレアーゼであってもよい。好ましくは、本Casタンパク質はそのようなAnCasであってもよいが、融合タンパク質の形態でニッカーゼ活性のみを示すかヌクレアーゼ活性を示さないように改変されていてもよい。
そのような方法は、例えばエクスビボでのヒトもしくは動物細胞の遺伝子改変にまで及ぶ。ここに教示されているCasタンパク質、例えばLFCA Cas、LBCA Casまたはその他のAnCas(それらのバリアントおよび機能的等価物を含む)を例えば、場合により限定されるものではないが、プロトプラストにおいて標的配列を改変することにより植物における遺伝子改変との関連での用途を有していてもよい。
当然のことながら本発明は、標的核酸配列、例えばDNA配列を改変または調節することにより治療処置に使用するための組み合わせにまで及び、ここでは当該組み合わせは、
(i)本明細書において教示されているCasタンパク質、例えば上で考察されているLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasまたはLPCDA Casあるいはそのバリアントもしくは機能的等価物またはそれを発現することができるポリヌクレオチドと、
(ii)本Casタンパク質を標的核酸配列に標的化するためのガイドRNAまたはそれを発現することができるポリヌクレオチドと
を含む。
(i)本明細書において教示されているCasタンパク質、例えば上で考察されているLFCA Cas、LBCA Cas、LSCA Cas、LPCA CasまたはLPCDA Casあるいはそのバリアントもしくは機能的等価物またはそれを発現することができるポリヌクレオチドと、
(ii)本Casタンパク質を標的核酸配列に標的化するためのガイドRNAまたはそれを発現することができるポリヌクレオチドと
を含む。
特に治療処置は、遺伝性疾患の予防および/または治療を含んでもよい。次いで当該組み合わせは、目的の導入遺伝子をコードする核酸分子をさらに含んでもよく、ここでは前記目的の導入遺伝子は、例えば遺伝性疾患に関与する遺伝子欠陥を補償してもよい。
上に示されているように、例えばLFCA CasのSpyCas9との低い配列同一性は、そのような使用を想定することに関連して有利であるとみなす。そのような使用は例えば病原菌におけるCas作用を包含してもよく、あるいは腸微生物叢または皮膚微生物叢の操作のためであってもよい。
以下の典型的な具体例は、Cas酵素LFCA Cas、LBCA CasおよびLSCA Casの取得および試験の両方を参照しながら本発明を例示するが、上に記載されている、進化解析のために系統樹を提供するCas酵素配列の開始集団の選択に応じて、有利な特性を有する他の祖先Casタンパク質を同じ戦略によって得ることができるものと考えられる。予測される復活は30億年ほどの古さであってもよい。
実施例1
既存のCas9配列からのCasヌクレアーゼの祖先配列再構築
クエリーとしてSpyCas9(Uniprotコード:Q99ZW2)配列を用いて、Uniprotデータベースからいくつかのファーミキューテス門細菌種由来の遺伝子Cas9の配列を収集した。この検索から、ファーミキューテス門由来のバシラス綱およびクロストリジウム綱内のCas9遺伝子の何百個もの配列の存在を確認した。放線菌からのいくつかの配列も発見した。59個の配列(表1)をダウンロードした後、配列アラインメントを構築し、これにより有意な保存を示す配列の一部を用いてCas9配列の共通起源を確認した。ベイズ推定(BEASTソフトウェア)を用い、系統樹を編集してこれらの配列の系統学的関係を確認した。最尤法を用いて、約24億年遡ってファーミキューテス門最終共通祖先(LFCA)に対して5つのAnCas配列を再構築した(図1を参照)。LFCA Casから現代のストレプトコッカス・ピオゲネス(化膿レンサ球菌)までの進化経路を辿った。LFCA CasはSpyCas9と約50%の同一性しか有しない(500以上の突然変異を有する)ことが分かった。クロストリジウムおよびエンテロコッカス属種に至るものなどの他の進化経路を構築した。祖先Cas酵素をコードする遺伝子を合成し、発現ベクターにクローニングし、大腸菌において発現させ、実験室で精製した。LFCAからストレプトコッカス・ピオゲネス(化膿性レンサ球菌)までの経路から5種類のAnCas酵素(図1に太字で示されている)が得られた。5種類全てが、SpyCas9との約50~ほぼ95%の範囲の配列同一性に関わらず高レベルで発現され、折り畳まれており、かつ可溶性であることが分かった。
既存のCas9配列からのCasヌクレアーゼの祖先配列再構築
クエリーとしてSpyCas9(Uniprotコード:Q99ZW2)配列を用いて、Uniprotデータベースからいくつかのファーミキューテス門細菌種由来の遺伝子Cas9の配列を収集した。この検索から、ファーミキューテス門由来のバシラス綱およびクロストリジウム綱内のCas9遺伝子の何百個もの配列の存在を確認した。放線菌からのいくつかの配列も発見した。59個の配列(表1)をダウンロードした後、配列アラインメントを構築し、これにより有意な保存を示す配列の一部を用いてCas9配列の共通起源を確認した。ベイズ推定(BEASTソフトウェア)を用い、系統樹を編集してこれらの配列の系統学的関係を確認した。最尤法を用いて、約24億年遡ってファーミキューテス門最終共通祖先(LFCA)に対して5つのAnCas配列を再構築した(図1を参照)。LFCA Casから現代のストレプトコッカス・ピオゲネス(化膿レンサ球菌)までの進化経路を辿った。LFCA CasはSpyCas9と約50%の同一性しか有しない(500以上の突然変異を有する)ことが分かった。クロストリジウムおよびエンテロコッカス属種に至るものなどの他の進化経路を構築した。祖先Cas酵素をコードする遺伝子を合成し、発現ベクターにクローニングし、大腸菌において発現させ、実験室で精製した。LFCAからストレプトコッカス・ピオゲネス(化膿性レンサ球菌)までの経路から5種類のAnCas酵素(図1に太字で示されている)が得られた。5種類全てが、SpyCas9との約50~ほぼ95%の範囲の配列同一性に関わらず高レベルで発現され、折り畳まれており、かつ可溶性であることが分かった。
進化解析に関するさらなる情報については、以下の材料および方法の箇所を参照されたい。
AnCas酵素のエンドヌクレアーゼ活性の試験
祖先Casがエンドヌクレアーゼ活性を示すか否かを試験するために、7つのランダムヌクレオチド(NNNNNNN)を有するDNAライブラリーと、これらのヌクレオチドの後の配列を標的化するためのgRNAとを設計した。LFCA Cas PAM配列が未知であったため、このランダムDNAライブラリーが必要であった(図2a)。ランダムライブラリーの提供のための配列をプラスミドpUC18にクローニングし、844bpの配列を増幅させて直線状DNA断片を生成した。SpyCas9切断により2つの断片、すなわち566bpを有するものと、PAM配列を含む278bpを有するより小さいものとを生成した。PCR断片を標的化するgRNAとのLFCA CasおよびSpyCas9の両方のインキュベーションにより、両方の断片の生成に成功し(図2b)、祖先Casが触媒活性を有することを確認した。さらに、PCRによりライブラリーから抽出されたストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAM(NGG)を含むDNA断片は、両方のCas酵素によって認識された。LFCAはストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAMを認識し、かつDNAを切断するすることができた(図2c)。
祖先Casがエンドヌクレアーゼ活性を示すか否かを試験するために、7つのランダムヌクレオチド(NNNNNNN)を有するDNAライブラリーと、これらのヌクレオチドの後の配列を標的化するためのgRNAとを設計した。LFCA Cas PAM配列が未知であったため、このランダムDNAライブラリーが必要であった(図2a)。ランダムライブラリーの提供のための配列をプラスミドpUC18にクローニングし、844bpの配列を増幅させて直線状DNA断片を生成した。SpyCas9切断により2つの断片、すなわち566bpを有するものと、PAM配列を含む278bpを有するより小さいものとを生成した。PCR断片を標的化するgRNAとのLFCA CasおよびSpyCas9の両方のインキュベーションにより、両方の断片の生成に成功し(図2b)、祖先Casが触媒活性を有することを確認した。さらに、PCRによりライブラリーから抽出されたストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAM(NGG)を含むDNA断片は、両方のCas酵素によって認識された。LFCAはストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAMを認識し、かつDNAを切断するすることができた(図2c)。
LFCA CasのDNA切断動態を調べるために、ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAM(TGG)を含むDNA断片をクローニングし、5~160分間の範囲の異なる時間でLFCA CasまたはSpyCas9と共にインキュベートした。両方の酵素をgRNAおよび標的DNAと共にインキュベートし、ローディングバッファーおよびEDTAを添加することによりこの反応を止めた。この試料を1%アガロースゲル上で泳動させて、スーパーコイルDNA、ニック入りDNAおよび直線状DNAを検出した(図3a)。アガロースゲル(図3b)上で、Cas酵素活性後に異なるDNA高次構造が観察された。バンド強度を測定し、両方の酵素による総切断率を異なる時間で計算した(図3c)。両方の酵素は10分後にプラスミドDNAのほぼ100%を切断した。しかしLFCA CasはDNAの1本鎖を切断し、かつ他の鎖の切断は時間と共に増加し、すなわち図3dに示すように、ニッキングおよびエンドヌクレアーゼ活性が時間において分離されることが観察された。それに対してSpyCas9はDNAの2つの鎖を同時に切断する。
別の一連の実験では、AnCas遺伝子を合成し、アラビノース誘導プロモーターとAnCasを細胞膜周辺腔に導くgIIIコード化シグナルとを運ぶpBAD/gIII発現ベクターにクローニングした。全てのAnCasが大腸菌BL21細胞において高レベルで発現された。
活性試験は、AnCasがストレプトコッカス・ピオゲネス(化膿性レンサ球菌)からのsgRNAならびにそのカノニカル5’-NGG-3’PAM配列を認識する極度に単純化されたシナリオを仮定することにより開始した。TGG PAMの上流のDNA断片に向かって標的化される20nt長のスペーサ領域を含むsgRNAを設計し、全てを4007bpのスーパーコイルプラスミドの中に配置した。インビトロ切断アッセイは、異なる消化時間で標的DNAおよびsgRNAと共にAnCasまたはSpCas9をインキュベートすることにより行った。切断効率において明確な違いはあるが、試験した全ての酵素がニッカーゼおよびDSB活性をそれぞれ示す、緩和された直線状産物を生成した。予期したとおり、SpCas9は短いインキュベーション時間後にニック入り産物を示し、より長いインキュベーション時間後に直線状産物を示した(図15A)。しかしAnCasの場合、その挙動は最も古いLFCA AnCasからより最近の酵素に変化した(図15A)。LFCA AnCasは主としてニッカーゼ活性を示し、DSB活性は60分を超える時間の経過後にのみ顕著になった。他のAnCasは、より若いAnCasにおいてより強烈なDSB活性と共に漸進的挙動を示した(図15A)。各AnCasおよびSpCas9のためのニック入り画分および直線状画分の両方を3つの形態、すなわち総切断率(図15B)、ニック入り画分(図15A)および直線状画分(図15D)において定量化し、かつインキュベーション時間に対してプロットし、これはニック入り画分の漸進的減少および直線状画分の増加を示している。SpCas9はより高い割合の直線状産物を有し、最も古いLFCA AnCasは最も高い割合のニック入り画分を有していた。直線状画分およびニック入り産物の割合を地質時代に対してプロットし、これはニッカーゼからDSB活性への進化傾向を示している(図15E)。ニッカーゼからDSB活性への進化傾向と共に、HNHドメイン変位に関連づけられたLFCA AnCasタンパク質において観察された構造的違いは、最も古いAnCasすなわちLFCA AnCasが減少または抑制された活性を有する祖先HNHドメインを示し得ることを示唆している。これを調べるために、H838A LFCA AnCas突然変異体のインビトロ活性を試験した(野生型SpCas9アミノ酸配列に関してはH840A)。この突然変異体はニック入り産物と、驚くべきことに直線状産物とを産生することができ、野生型LFCA AnCasにより得られたものと実際に同一のプロファイルを示した(図19A~図19D)。これらの結果は、Cpf1(Cas12a)、Cas14(Cas12f)またはCasΦ(Cas12j)27~30などのHNHドメインを欠いているいくつかのV型エフェクターヌクレアーゼにおいて以前に示されたことがあるように、LFCA AnCasがLFCA AnCasにおいて観察されるニッカーゼおよびDSB活性に寄与するRuvCドメインと共に未成熟HNHドメインを含み得ることを示唆している。
別の一連の実験では2種類のAnCas、すなわちLBCA CasおよびLSCA CasのDNA切断活性を、LFCA CasおよびSpyCas9のDNA切断活性と比較した。
標的配列の後にTGG PAM配列を含むプラスミドを異なる時間にわたって各酵素と共にインキュベートした。4種類の酵素の切断率は総切断率を比較した場合に同様であった(図10a)。しかし直線化率およびニック率は酵素によって異なった。LBCA CasおよびLSCA Casは、LFCA Casよりも高いが、SpyCas9よりもなお低い直線化率を有することが分かった(図10b)。対照的に、LBCA CasおよびLSCA Casのニック率はLFCA Casのものよりも低かったが、SpyCas9のニック率よりも高かった(図10c)。
AnCas酵素の切断活性は、図11に示されている傾向を辿ることを認めることができた。30分間のインキュベーション時間後の二本鎖切断の割合は、SpyCas9について最も高いことを認めることができ、祖先Cas酵素の年齢と共に減少する(すなわち、二本鎖切断の割合は、SpyCas9の%DSB>LSCA Casの%DSB>LBCA Casの%DSB>LFCA Casの%DSBのように、祖先酵素が古くなるにつれて減少することを認めることができる)。
形成されたニック入りテンプレートの割合について反対の相関が認められた(すなわち、SpyCas9のニック切断率%<LSCA Casのニック切断率%<LBCA Casのニック切断率%<LFCA Casのニック切断率%)。
図11に示されているDSBおよびニック入りテンプレートの割合を時間依存値に変換することにより、直線化率およびニック率を計算し、プロットすることができた。直線化率およびニック率は、当該率を各祖先の年齢に対してプロットした場合に見られる傾向に従っているように思われる(図12)。
PAM決定
以下のPAMライブラリー構築の箇所に記載されているように、DNAライブラリーからPCRにより増幅させたDNA断片を使用してLFCA CasのPAM特異性を決定した。LFCA CasをgRNAおよびDNAライブラリーと共に1時間インキュベートし、反応産物を2%アガロースゲルにおいて泳動させた。278bpの小さい断片をアガロースゲルから抽出し、Ion Torrent次世代シーケンシング(NGS)で解析した。シークエンシングデータから、LFCA Casによって認識される各PAMの頻度を解析し、当該ライブラリーにおける各PAMの全体的頻度に対する総割合を計算した。計算した頻度をPAM車輪グラフにおいてプロットして、祖先CasのPAM親和性を可視化した(図4a)。この車輪グラフは、SpyCas9と比較してLFCA CasのPAM選択性の喪失を示している。
以下のPAMライブラリー構築の箇所に記載されているように、DNAライブラリーからPCRにより増幅させたDNA断片を使用してLFCA CasのPAM特異性を決定した。LFCA CasをgRNAおよびDNAライブラリーと共に1時間インキュベートし、反応産物を2%アガロースゲルにおいて泳動させた。278bpの小さい断片をアガロースゲルから抽出し、Ion Torrent次世代シーケンシング(NGS)で解析した。シークエンシングデータから、LFCA Casによって認識される各PAMの頻度を解析し、当該ライブラリーにおける各PAMの全体的頻度に対する総割合を計算した。計算した頻度をPAM車輪グラフにおいてプロットして、祖先CasのPAM親和性を可視化した(図4a)。この車輪グラフは、SpyCas9と比較してLFCA CasのPAM選択性の喪失を示している。
この結果を確認するために、異なるPAMの組み合わせ(TNN3ヌクレオチドの組み合わせおよびCCC)を含む標的DNAを運ぶDNAプラスミドを用いてインビトロPAM決定アッセイを行った。各PAMと共に10分間インキュベートしたLFCAおよびSpyCas9(10nM)は異なる切断活性を有していた。LFCA Casは試験した全てのPAMにより同様のニッキング活性を示した。対照的に、SpyCas9はTGG PAM(その周知のカノニカルPAM配列)により切断を示し、かつ他のPAMによりLFCA Casよりも低い切断を示した(図4b)。
別の一連の実験では、異なるPAMを認識するAnCasエンドヌクレアーゼの能力を調べた。各AnCasの好ましいPAM配列を決定するために、全ての可能なPAMに対応する標的配列およびその後に7つのランダムヌクレオチド(NNNNNNN)を含むDNAライブラリーを設計した。ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)の足場および標的配列に相補的な20個のヌクレオチドを用いてsgRNAを設計した。標的およびPAM配列の両方を含む844bpの断片を増幅するためにPCRプライマーを設計し、これをAnCasおよびSpCas9のための基質として使用した。精製したCasタンパク質および転写されたsgRNAを用いるインビトロ消化は、PCR標的を用いて行った。5種類のAnCasの全てが2つの断片、すなわち566bpのものとAnCasによって認識されるPAM配列を含む278bpのより小さいものとを生成した。小さい断片を精製し、次世代シークエンシング(NGS)により配列決定し、解析して、各AnCasからPAM配列多様性を決定し、どのように進化がそれを変化させたかを推定することを可能にした。図16Aは、5種類のAnCasおよびSpCas9について、PAM車輪グラフ(Kronaプロット)の形態でPCR切断アッセイの結果をまとめている。先に観察されているように、LFCA AnCasは、試験したPAM配列のいずれに対しても選択性を示さなかった。他のCasタンパク質では、標的近位位置2および3において特異的なヌクレオチドへの選択性が検出された(図22)。例えば、LBCA AnCasの場合、NGGへの僅かな選択性が明らかになったが、さらなるPAM配列(NNG)も検出された。より最近のAnCasでは、NGGへの偏りがより明白であった(データは示さず)。
全ての配列を解析した後、NGG PAMを含むリードの割合を系統学的解析において推定される各AnCaの地質時代に対してプロットした。経時的なNGG濃縮を反映する傾向が観察され、これはNGG忠実度がより最近のストレプトコッカス(レンサ球菌)属祖先においてPAMlessからNGG選択性への徐々の進行を描写する進化的特徴であることを示している(図16B)。これにより、宿主細胞によって獲得されるスペーサの数が経時的に増加した際に予期される、PAM認識に対する進化する適応応答の仮説が確認される。最終的に、特にニッカーゼ活性を超えるDSB活性の増大(ほとんどの原核生物において有害である)がこの能力に対して淘汰圧をさらに増加させるというシナリオでは、CRISPR座位の自己切断を回避するために強力なPAM認識能力が必要とされるであろう。PAM許容(すなわち「ほぼPAMless」)Cas9バリアントが以前に記載されているが、LFCA AnCasは本発明者らが知っている限りでは、これまでに報告された最初の完全にPAMlessなCas9エンドヌクレアーゼである。
LFCA AnCasのPAMless能力をさらに探索するために、一般的なTNN PAM内の全部で6つのPAM配列(TAC、TCC、TAT、TTT、TTCおよびTAC)に隣接する標的DNAの切断を試験するために、インビトロPAM決定アッセイを設計した。CCC PAMもそのセットに含めて、最初のTヌクレオチド以外の可能性を確認した。AnCasエフェクターを標的DNAのそれぞれおよびsgRNAと共に10分間インキュベートし、切断産物をアガロースゲルにより確認した(データは示さず)。ニック入り産物および直線状産物の両方が観察され、これは全てのTNN PAM配列による切断活性を示している。SpCas9の場合、TGG PAMのみがスーパーコイルDNA基質の二本鎖切断を示した。ニック入り産物および直線状産物の割合を、図16Cに表されている各PAMについて定量化した。最も古いAnCas(LFCA CasおよびLBCA Cas)では、切断の割合は試験した全てのPAM配列について同様であり、その際、インキュベーション時間を考慮して予期したとおり主としてニック入り産物を生じさせた。より若いAnCasおよびSpCas9の場合、切断画分はTGG PAMに対して高レベルに達し、NGG PAM選択性を示している。CCC対照の場合、切断プロファイルは非NGG PAM配列から得られたものと同様であった。
別の一連の実験では、この場合も同様に以下のPAMライブラリー構築の箇所に記載されているように、DNAライブラリーからのPCRにより増幅されたDNA断片を用いてPAM決定を行った。LBCA CasまたはLSCA Casを2%アガロースゲルにおける反応の実行により、gRNAおよびDNAライブラリーと共に1時間インキュベートした。278bpの小さい断片をアガロースゲルから抽出し、Ion Torrent次世代シーケンシング(NGS)により解析した。シークエンシングデータからAnCas酵素によって認識される各PAMの頻度を決定し、ライブラリーにおける各PAMの全体的頻度に対する総割合を計算した。計算した頻度をPAM車輪グラフにおいてプロットして両方のAnCasに対するPAM親和性を可視化した(図13a)。この車輪グラフは、LFCA Casによって示されているように、LBCAおよびLSCA Casの同様のPAM選択性を示す。
異なるPAMヌクレオチドの組み合わせ(TNN)を有する標的DNAを運ぶDNAプラスミドを用いて、PAM決定アッセイをインビトロで行った。LBCA CasおよびLSCA Cas(10nM)を各PAMと共に10分間インキュベートした(図13b)。LBCA Casは、いくつかのPAMにより同様またはさらにはLFCA Casよりも高い切断率を示した。LSCA Casは試験した全てのPAM配列による切断も示したが、より低い活性を有する。試験した全てのPAMについてLFCA Casと比較して始終より高い直線活性が認められ、LBCA CasおよびLSCA Casのより高い直線状切断率を強調している。
最後に本発明者らは、当該技術分野において開示されているCas9タンパク質、特に
・国際公開第2021/084533A1号に開示されている、いわゆる「祖先Cas9タンパク質」(WO’533の配列番号268)、および
・Waltonら(2020.Science.368(6488):290-296)のほぼPAMlessのCas9タンパク質「SpG」*および「SpRY」**
に対して、LFCA Cas(上に示されているようにどんなPAM配列にも選択性を有しない)およびLBCA Cas(NNG配列に対する選択性によりほぼPAMlessであることが分かった)のPAM選択性を比較することを望んだ。
*SpG:D1135L/S1136W/G1218K/E1219Q/R1335Q/T1337R
**SpRY:A61R/L1111R/D1135L/S1136W/G1218K/E1219Q/N1317R/A1322R/R1333P/R1335Q/T1337R
・国際公開第2021/084533A1号に開示されている、いわゆる「祖先Cas9タンパク質」(WO’533の配列番号268)、および
・Waltonら(2020.Science.368(6488):290-296)のほぼPAMlessのCas9タンパク質「SpG」*および「SpRY」**
に対して、LFCA Cas(上に示されているようにどんなPAM配列にも選択性を有しない)およびLBCA Cas(NNG配列に対する選択性によりほぼPAMlessであることが分かった)のPAM選択性を比較することを望んだ。
*SpG:D1135L/S1136W/G1218K/E1219Q/R1335Q/T1337R
**SpRY:A61R/L1111R/D1135L/S1136W/G1218K/E1219Q/N1317R/A1322R/R1333P/R1335Q/T1337R
全ての場合に、野生型SpCas9対照を基準に含めた。
7つのランダムヌクレオチドを含むDNAライブラリーを設計し、pUC18プラスミド(Genscript社)にクローニングした。このランダムライブラリーをXL1blue大腸菌にトランスフェクトし、数時間増幅させて、PAM配列における最大可変性を達成した。
PAM決定アッセイは、切断緩衝液中に30nMの各被験Casタンパク質を含む3nMのDNAライブラリープラスミドを、7つのランダムヌクレオチドの上流の20個のヌクレオチドを標的化するgRNAと共にインキュベートすることにより行った。この反応系を37℃で1時間インキュベートし、EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher Scientific社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。PAMライブラリー特異的なPCRベースの増幅をアダプターおよび特異的オリゴを用いて行った:
当該断片はIlluminaシークエンシングにより配列決定し、それらのリードをGeneious Prime(2020年版)を用いて参照配列に対してマップした。Illumina miSeqリードを、短いリードのためにminimap2を用いて増幅させた配列に対してアラインメントして非特異的配列を除外した。次いで、アラインメントしたリードから、PAM領域の前に3つのヌクレオチドを有するリードを選択した。カスタムスクリプトを用いて、目的の領域中のヌクレオチドを抽出した。最後にggseqlogoを用いてPAM領域のロゴプロットを得、各試料のPAM車輪グラフをKronaToolsを用いてグラフで表した。
本発明者らのデータは、試験した6種類の異なるCasタンパク質のうち、LFCA Casのみが完全にPAMlessであったことを示した。LBCA Casは最も制限のないPAM要件を有する2番目のCasタンパク質であった。全ての他のCasタンパク質は、より制限的なPAM選択性を有していた(図24)。
興味深いことに、国際公開第2021/084533A1号に開示されているいわゆる「祖先Cas9タンパク質」は、野生型SpCas9のものと同一のNGG PAM要件を示した。
従ってこれらのデータから、本発明者らのAnCasタンパク質は当該技術分野において開示されているものとは逆に、真にPAMlessであるか少なくともほぼPAMlessであることが確認される。
gRNA認識
最も古いAnCasによって示されたPAM認識の無差別性は、これらのAnCasがgRNA認識に対しても無差別性を示すか否かという疑問を提起した。祖先gRNAの再構築は理想的であるが、異なる種からのcrRNAリピートおよびtracrRNAの配列おける可変性はこれを非常に難しくさせる。この限界を克服し、かつAnCasの無差別性をなお評価するために、異なる種からの現代のsgRNAを試験した。全部で5種類のsgRNAを、いくつかのファーミキューテス門の綱を網羅するストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)、スタフィロコッカス・アウレウス(黄色ブドウ球菌)およびフィネゴルディア・マグナ(Finegoldia magna)から選択した。これらのsgRNAは、sgRNAの分類および機能に対する過去の研究に従って選択し、ここではsgRNAを7つのクラスターに分けた。これらの異なるsgRNAは、「18sgのRNA」および「20ntのsgRNA」とそれぞれ呼ばれる18および20ヌクレオチド長の2つのサイズのスペーサを含むストレプトコッカス・ピオゲネス(化膿性レンサ球菌)ガイドと対比させた。
最も古いAnCasによって示されたPAM認識の無差別性は、これらのAnCasがgRNA認識に対しても無差別性を示すか否かという疑問を提起した。祖先gRNAの再構築は理想的であるが、異なる種からのcrRNAリピートおよびtracrRNAの配列おける可変性はこれを非常に難しくさせる。この限界を克服し、かつAnCasの無差別性をなお評価するために、異なる種からの現代のsgRNAを試験した。全部で5種類のsgRNAを、いくつかのファーミキューテス門の綱を網羅するストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)、スタフィロコッカス・アウレウス(黄色ブドウ球菌)およびフィネゴルディア・マグナ(Finegoldia magna)から選択した。これらのsgRNAは、sgRNAの分類および機能に対する過去の研究に従って選択し、ここではsgRNAを7つのクラスターに分けた。これらの異なるsgRNAは、「18sgのRNA」および「20ntのsgRNA」とそれぞれ呼ばれる18および20ヌクレオチド長の2つのサイズのスペーサを含むストレプトコッカス・ピオゲネス(化膿性レンサ球菌)ガイドと対比させた。
SpCas9および5種類のAnCasを、標的プラスミドDNAおよびTGG PAM認識部位と共に37℃で10分間インキュベートした。図17Aの切断産物のアガロースゲルから、予期したとおり、SpCas9がそれ自体のsgRNAを使用した場合にのみプラスミドDNAを直線化したが、20ntのスペーサ版を使用した場合により効率的であり、かつ他の種からのsgRNAが主としてニック入り産物を生じ、大部分のスーパーコイルDNA基質をそのままにしたことを観察することができる。それどころか、LFCA CasおよびLBCA Casは、全てのsgRNAによりプラスミドDNAにニックを入れ、かつ直線化することができ、エンテロコッカス・フェシウムのsgRNAはLFCA Casに対してより良好な効率を示し、ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)からの18ntのsgRNAはLBCA Casにとって好ましかった。他のAnCasも試験し、主としてLFCA CasおよびLBCA CasがsgRNAに対して顕著な無差別性を有していたことが観察された。全ての他のAnCasおよびSpCas9は、ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)からの20ntのsgRNAにより最も良く機能するように見えた(図17B)。
過去の研究は、sgRNA認識の特異性に対するRECドメインの寄与を示してきた。表3に示すように、このドメインは、最も古いものから最も新しいAnCasへと減少するRMSD傾向と共に最も高いRMSDの差を示す。これらの発見は、最も古いAnCasにおいて観察されたsgRNA無差別性と共に、淘汰圧がCasヌクレアーゼを経時的に向上したガイド特異性まで誘導したかもしれないことを示唆している。実際にこの無差別性はII-C型Cas9において既に観察されたことがあり、これはCas9ヌクレアーゼの昔の記憶であることが示唆されてきた。これらのヌクレアーゼにおいて、この無差別性はPAMに依存しないssDNA切断およびより弱い基質DNA巻き戻し能力にも関連づけられている。
別の一連の実験では、上に記載されている同じインビトロでのプラスミド切断アッセイを用いて、様々なtracrRNA配列に結合される標的化配列と共にsgRNAを使用するためのLFCA Casの能力を調べた。様々な既存の細菌種のCas9 gRNAによって用いられるtracrRNA構成要素に対応するtracrRNA配列を用いた。従って、ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAM TGGを含むプラスミドが提供された。それを通常の20ntのスペーサまたは短縮された18ntのスペーサを含む細菌種ストレプトコッカス・サーモフィルス(サーモフィルス菌)、エンテロコッカス・フェシウム、クロストリジウム・パーフリンジェンス(ウェルシュ菌)およびフィネゴルディア・マグナ(Finegoldia magna)またはストレプトコッカス・ピオゲネス(化膿性レンサ球菌)sgRNAのそれぞれに由来するtracrRNAを有するsgRNAの存在下で、SpyCas9またはLFCA Casのいずれかと共にインキュベートした。用いられるgRNA配列に関するさらなる情報については、Gasiunasら(2020年)(Nat Commun.11(1):5512;同定されたCas9オルソログのgRNA配列を提供するサプリメンタルデータを参照)を参照することができる。インキュベーション後に、反応産物をアガロースゲル上で泳動させ、スーパーコイルDNA、ニック入りDNAおよび直線状DNAの程度を観察した。ゲルの結果は図8に示されている。LFCA Cas9は非常に柔軟なgRNA使用を有することは明らかである。それは用いられるgRNAのtracrRNA要素に関わらず、プラスミドDNAにニックを入れるか直線化することができた。実際に、従来のストレプトコッカス・ピオゲネス(化膿性レンサ球菌)sgRNA以外のいくつかのsgRNAにより向上した切断が認められた。そのようなgRNA柔軟性はSpyCas9については示されず、上に示されているようにLFCA Casの別の新規な性質であると考えられる。
熱およびpH安定性
pH7.9および4℃~60℃の範囲の異なる温度で1時間にわたって切断反応を行うことにより、LFCA Casの熱安定性を調べた。LFCA Casは低い温度(4℃および20℃)でSpyCas9よりも高い活性を示し、53℃~60℃でより高い熱安定性を示した(図5a)。ニッキングおよびエンドヌクレアーゼ活性を計算し、LFCA Casがより低い温度でニッキング活性を有し、より高い温度ではこの2つの活性は同等に分散されることが観察された(図5b)。
pH7.9および4℃~60℃の範囲の異なる温度で1時間にわたって切断反応を行うことにより、LFCA Casの熱安定性を調べた。LFCA Casは低い温度(4℃および20℃)でSpyCas9よりも高い活性を示し、53℃~60℃でより高い熱安定性を示した(図5a)。ニッキングおよびエンドヌクレアーゼ活性を計算し、LFCA Casがより低い温度でニッキング活性を有し、より高い温度ではこの2つの活性は同等に分散されることが観察された(図5b)。
pH安定性の評価のために、異なるpH値(4~9.5)および37℃でアッセイを行った(図5c)。酸性のpHにおいて、LFCA CasはSpyCas9と比較して、より高い活性を維持した。アルカリ性pHにおいて、LFCA Casの活性は同じままであり、SpyCas9はその最適な性能を示した。ニッキングおよびエンドヌクレアーゼ活性に関しては、pHは温度と同様に活性に影響を与える(図5d)。これらの結果は、一般に祖先酵素が有する高い安定性を示す。
上述のとおり、AnCas、特にLFCA AnCasは、HNHドメインを欠いているV型エフェクターヌクレアーゼ(例えば、Cpf1(Cas12a)、Cas14(Cas12f)またはCasΦ(Cas12j)27-30)といくつかの共通点を共有し得る。それらの数多くの祖先酵素がより広いpHおよび温度範囲で機能する能力を示し、そのように環境条件への後での適応を示したことを考慮して、別の一連の実験ではAnCasヌクレアーゼを異なる温度およびpH条件下で試験した。図21A~図21Bに示すように、活性が急激に低下するSpCas9およびより新しいAnCasとは異なり、LFCA Cas、LBCA CasおよびLSCA Casなどの最も古いAnCasは7以下のpH値で高い活性を示した。温度に関しては、AnCasエンドヌクレアーゼは低温および高温、すなわち10℃未満および50℃超でSpCas9よりも優れていた。
LFCA CasによるHEK293T細胞ゲノム編集
HEK293T細胞にLFCA Casヒト化遺伝子を運ぶ発現プラスミドをトランスフェクトして、編集ゲノムDNAにおける祖先酵素の有効性を調べた。ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAMによりAAVS1座位を標的化するためのgRNAを設計した。コード化LFCA Casを含む発現プラスミドを別のプラスミドと同時トランスフェクトしてgRNAを発現させた(図6a)。
HEK293T細胞にLFCA Casヒト化遺伝子を運ぶ発現プラスミドをトランスフェクトして、編集ゲノムDNAにおける祖先酵素の有効性を調べた。ストレプトコッカス・ピオゲネス(化膿性レンサ球菌)PAMによりAAVS1座位を標的化するためのgRNAを設計した。コード化LFCA Casを含む発現プラスミドを別のプラスミドと同時トランスフェクトしてgRNAを発現させた(図6a)。
次いで、ゲノムDNAを抽出して挿入および欠失イベント(インデル)を調べた。抗Cas9抗体(橙黄色)を用いて細胞の免疫蛍光画像を作成することにより、細胞内LFCA Cas発現を確認した(図6b)。細胞核をDAPIで青色に染色した。SpyCas9と同様に、核においてLFCA Casを発現した細胞が観察された。トランスフェクションから72時間後に、ゲノムDNAをHEK293T細胞から抽出し、AAVS1座位の断片を増幅させ、ここではCas酵素切断を標的化した。
これらの断片を用いてT7E1エンドヌクレアーゼアッセイを行ってゲノム編集を確認した(図6c)。T7E1のインキュベーション後に、2つの予期した断片が観察され、LFCA Casトランスフェクション後にインデル形成が確認された。対照としてのSpyCas9の細胞内発現により同じことが観察された。
さらに、LFCA CasおよびSpyCas9ゲノム切断後のノックイン活性を調べた。前の実験と同じ戦略に従ったが、AAVS1座位と相同な配列によって挟まれたeGFP遺伝子を含むDNAテンプレートを追加して、相同末端結合(HDR)を促進した(図6d)。トランスフェクションから72時間後に、細胞は緑色の蛍光を示した(図6e)。定量化した蛍光強度は、LFCA Casでトランスフェクトされた細胞においてより高い値を示した(図6f)。
AAVS1領域を標的化する同様のノックイン実験を行ったが、SpyCas9のPAMとは異なるPAMを使用した。この実験では、TTC PAMを標的化した(図7)。細胞にgRNAおよびLFCA CasまたはSpyCas9をトランスフェクトした。DNAテンプレートからの全ての試料において、72時間後に蛍光が観察された(SpyCas9を含むTTC試料では若干の一過性の蛍光)。gDNAを抽出し、AAVS1座位を増幅させた。PCR単位複製配列をゲル上で泳動させた。全てのLFCA Cas試料において予期したバンドが観察されたが、SpyCas9を含む試料では観察されなかった。AAVS1座位においてgDNAを抽出し、かつ増幅させた。PCR単位複製配列を電気泳動ゲル上で泳動させ、予期したとおり、SpyCas9により標的化されたTTC PAMは別として予期したバンドが全ての試料において観察された。
実施例2:一本鎖DNAおよび一本鎖RNAに対するエンドヌクレアーゼ活性
上述のとおり、最も古いAnCas(LFCA CasおよびLBCA Cas)は注目すべきニッカーゼ活性を示した。このニッカーゼ活性をssDNA活性に関連づけてもよい。ssDNA切断活性はII-C亜型Cas9などのより小さいCas9に存在する祖先形質であると示唆された。これを、AnCasなどのサブII-A型からの祖先形態のニッカーゼ活性において反映させることもできる。より小さい触媒ドメインを有するより初期の形態のCas9は、より大きい祖先ヌクレアーゼになお存在していたこのssDNA切断活性の起源であったかもしれず、次いでこれは分化プロセスの一部として経時的にDSB活性に向かって徐々に進化した。
上述のとおり、最も古いAnCas(LFCA CasおよびLBCA Cas)は注目すべきニッカーゼ活性を示した。このニッカーゼ活性をssDNA活性に関連づけてもよい。ssDNA切断活性はII-C亜型Cas9などのより小さいCas9に存在する祖先形質であると示唆された。これを、AnCasなどのサブII-A型からの祖先形態のニッカーゼ活性において反映させることもできる。より小さい触媒ドメインを有するより初期の形態のCas9は、より大きい祖先ヌクレアーゼになお存在していたこのssDNA切断活性の起源であったかもしれず、次いでこれは分化プロセスの一部として経時的にDSB活性に向かって徐々に進化した。
一本鎖DNAに対する祖先Cas9酵素(LFCA Cas、LBCA CasおよびLSCA Cas)の活性を試験した。EcoRI制限酵素によって直線化された一本鎖プラスミドm13mp18を基質として使用した。AnCas酵素およびSpyCas9をそれぞれ、プラスミドおよびプラスミドを標的化するように設計したgRNAと共にインキュベートした。対照として、DNAおよび酵素(ただしgRNAは使用しない)を一緒にインキュベートした(図14)。3種類の祖先酵素は、gRNAの有無に関わらず一本鎖DNAを切断することが分かった。マンガンが反応系中に存在する場合に、同様の活性がSpyCas9により認められた。LSCA Casは一本鎖DNAについて最も高い切断率を示した。
別の一連の実験では、最も古いAnCasをSpy-sgRNAの20ntのスペーサ領域に相補的な標的配列を含む85ntのssDNA基質を用いて試験した。図17Cおよび図17Eに示すように、LFCA CasおよびLBCA CasはSpCas9のレベルよりも最も高いレベルのssDNA切断を示した。データへの指数関数フィットは、LFCA CasおよびLBCA Casについて非常により速い速度を示し、LBCA Casではほぼ完全な切断に達した(表4)。活性を60ntのssRNA標的に対して試験し、これは匹敵する結果を示した(図17Dおよび図17F)。切断活性の指数関数フィットはLBCA Casについて最大速度および振幅を示し、この場合も同様に完全な切断に達した(表4)。これらの結果は、古代のLFCA CasおよびLBCA Casの両方、特にLBCA CasがRNA誘導性リボヌクレアーゼとして挙動することを示している。
一本鎖基質に対する最も古いAnCasの活性は、初期Casヌクレアーゼがそれらの基質に対して活性であったかもしれないということを示唆しており、これは先に述べたように古代の形質であるように思われる。ssDNAおよびssRNAに対するLBCA Casの注目すべき活性がCas12a、Cas14およびCas13aの活性に似ていることを考慮すると、これらの能力はさらなる重要な意味を有し得、これは全てのクラス1エフェクターヌクレアーゼの活性の中での関係を示唆している。この機能的な無差別性も、LBCA Casをゲノム編集用途のための非常に多用途なエンドヌクレアーゼとして推奨する。
より無差別な特徴を示す最も古いAnCasエンドヌクレアーゼが抗Cas9抗体に対して異なる応答も有し得るか否かをさらに調べた。LBCA CasおよびLFCA Casを抗Cas9ウサギ抗体と共にインキュベートした。ELISA試験は抗体結合の減少を示した(図17g)。これらのヌクレアーゼを運ぶ宿主生物が長い間絶滅しており、従ってどんな生物とも接触してきていないことを考慮すると、これは予期されたとおりである。Cas9に対する抗体は古代のCas形態に対してより弱い応答を有し得ると推論することができる。このより低い抗体応答は、インビボ編集における潜在的用途にとって興味深いものであり得、ここではSpCas9および他の現代のエンドヌクレアーゼに対する免疫応答は現在の限界を表す。
実施例3:AnCasバリアントのインビボ活性
これらの合成の祖先CasがDNA切断すなわち二本鎖切断(DSB)を行い、かつ標準SpCas9と関連づけられたものと同様の条件下で非相同末端結合(NHEJ)によって細胞中で編集を誘発することができるか否かという疑問に答えるために、これらの祖先ヌクレアーゼのゲノム編集活性を培養液中の哺乳類細胞(HEK293T)において試験した。これらの細胞に、ヒト化版のAnCasまたはSpCas9ならびに対応するsgRNA(配列番号237~239を有する20ntのスペーサ標的を運ぶストレプトコッカス・ピオゲネス(化膿性レンサ球菌)からの標準sgRNA)を含むプラスミドベクターを同時トランスフェクトした。同時トランスフェクションから72時間後に、細胞を回収し、ゲノムDNAを抽出した。Mosaic Finderソフトウェアによる高度解析を用いる次世代シークエンシング(NGS)によって、HEK293T細胞においてインビトロ部位特異的編集を測定した。
これらの合成の祖先CasがDNA切断すなわち二本鎖切断(DSB)を行い、かつ標準SpCas9と関連づけられたものと同様の条件下で非相同末端結合(NHEJ)によって細胞中で編集を誘発することができるか否かという疑問に答えるために、これらの祖先ヌクレアーゼのゲノム編集活性を培養液中の哺乳類細胞(HEK293T)において試験した。これらの細胞に、ヒト化版のAnCasまたはSpCas9ならびに対応するsgRNA(配列番号237~239を有する20ntのスペーサ標的を運ぶストレプトコッカス・ピオゲネス(化膿性レンサ球菌)からの標準sgRNA)を含むプラスミドベクターを同時トランスフェクトした。同時トランスフェクションから72時間後に、細胞を回収し、ゲノムDNAを抽出した。Mosaic Finderソフトウェアによる高度解析を用いる次世代シークエンシング(NGS)によって、HEK293T細胞においてインビトロ部位特異的編集を測定した。
図18に示すようにAnCasエンドヌクレアーゼは、LFCA Casを除いてヒトのゲノムDNAにおいてロバストな遺伝子編集を行った。これは、切断のためにおそらくHNHドメインを使用しないLFCA Casの固有の特徴を考慮すれば予期可能であり、他の種類のCasヌクレアーゼに類似して一本鎖基質においてより良く機能するように思われる。
RFP再構成に基づいてトラフィックライトレポーター(TLR)を用いて部位特異的切断を試験した。この方法は、蛍光活性化セルソーティング(FACS)に基づくHEK293T細胞におけるDNA修復の監視を可能にする。この場合も同様にSpCas9のために最適化された条件を用い、これらの結果はNGSによって決定されたものに一致しており(図23)、これはそれらのロバスト性を示している。
材料および方法
祖先配列再構築
上に記載され、かつ表1ならびに図1および図9に列挙されている開始Cas9配列をNCBIデータベースからダウンロードした。MEGAプラットフォーム上でMUSCLEソフトウェアを用いて配列のアラインメントを行い、手動で編集した。MEGAを用いて最良の進化モデルを推定し、ガンマ分布モデルを含むJones-Tylor-Thornton(JTT)を得た。並列処理のためにBEAGLEライブラリーを含むBEAST v1.8.4パッケージソフトウェアを用い、かつマルコフ連鎖モンテカルロ(MCMC)を用いるベイズ推定に基づいて、系統樹推定を行った。デフォルトの出生および死亡率と共にTTOLからの分子情報を用いて、相関のない対数正規クロックモデル(UCLN)により分岐時間を推定した。マルチコアサーバにおいて計算を実行した。BEASTからのLogCombinerユーティリティを用いて、生成された系統樹からそれらの25%をバーンインとして破棄した。TRACERを用いてMCMCログファイルを確認し、全てのパラメータが有効な試料サイズ(ESS)>100を示すことを保証した。全てのノードの事後確率は0.65を超えており、それらのうちのほとんどがほぼ1であった。Figure Tree v1.4.2を使用して系統樹を可視化し、かつ編集した。最後に、部位およびJTTモデル全体の可変置換率のためのガンマ分布と共にPAML4.8を用いて最尤法により祖先配列再構築を行った。全てのアミノ酸について事後確率を計算し、各部位のために最も高い事後確率を有する残基を選択した。再構築のための系統樹から、最終ファーミキューテス門共通祖先(LFCA)、最終バシラス綱共通祖先(LBCA、最終ストレプトコッカス(レンサ球菌)属共通祖先(LSCA)、最終化膿性共通祖先(LPCA)、最終化膿性/溶血性共通祖先(LPDCA)を選択した。
祖先配列再構築
上に記載され、かつ表1ならびに図1および図9に列挙されている開始Cas9配列をNCBIデータベースからダウンロードした。MEGAプラットフォーム上でMUSCLEソフトウェアを用いて配列のアラインメントを行い、手動で編集した。MEGAを用いて最良の進化モデルを推定し、ガンマ分布モデルを含むJones-Tylor-Thornton(JTT)を得た。並列処理のためにBEAGLEライブラリーを含むBEAST v1.8.4パッケージソフトウェアを用い、かつマルコフ連鎖モンテカルロ(MCMC)を用いるベイズ推定に基づいて、系統樹推定を行った。デフォルトの出生および死亡率と共にTTOLからの分子情報を用いて、相関のない対数正規クロックモデル(UCLN)により分岐時間を推定した。マルチコアサーバにおいて計算を実行した。BEASTからのLogCombinerユーティリティを用いて、生成された系統樹からそれらの25%をバーンインとして破棄した。TRACERを用いてMCMCログファイルを確認し、全てのパラメータが有効な試料サイズ(ESS)>100を示すことを保証した。全てのノードの事後確率は0.65を超えており、それらのうちのほとんどがほぼ1であった。Figure Tree v1.4.2を使用して系統樹を可視化し、かつ編集した。最後に、部位およびJTTモデル全体の可変置換率のためのガンマ分布と共にPAML4.8を用いて最尤法により祖先配列再構築を行った。全てのアミノ酸について事後確率を計算し、各部位のために最も高い事後確率を有する残基を選択した。再構築のための系統樹から、最終ファーミキューテス門共通祖先(LFCA)、最終バシラス綱共通祖先(LBCA、最終ストレプトコッカス(レンサ球菌)属共通祖先(LSCA)、最終化膿性共通祖先(LPCA)、最終化膿性/溶血性共通祖先(LPDCA)を選択した。
上記方法によって同定されたノード配列は、本出願と共に提供されている配列表に記載されており、それはその全体が本明細書に明示的に組み込まれる。
タンパク質の産生および精製
大腸菌細胞発現のためのコドン最適化を用いてLFCA Casコード配列を合成した。このコード配列をpBAD/His発現ベクター(ThermoFisher社)にクローニングし、タンパク質発現のために大腸菌BL21(DE3)(Life Technologies社)にトランスフェクトした。SpyCas9発現プラスミドはAddgene社から購入した(プラスミド#62934)。細胞をOD600が0.6に達するまでLB培地中37℃でインキュベートした。LFCA Casの発現のためにL-アラビノースを0.1%になるまで細胞に添加し、SpyCas9の発現のためにIPTGを1mMになるまで細胞に添加し、かつ20℃で一晩タンパク質誘導した。細胞は4000rpmの遠心分離によってペレット化した。ペレットを抽出緩衝液(20mMのHEPES(pH7.5)、300mMのNaCl、25mMのイミダゾール、0.5mMのTCEP)に再懸濁させた。15分間インキュベーションしながら、このペレットに100mg/mLのリゾチーム(Thermo Scientific社)を添加した。次いで、このペレットを30%の振幅および10分間の3サイクルで超音波処理した。33,000gで1時間の超遠心分離により細胞デブリを分離した。精製のために、上澄みをHis GraviTrap親和性カラム(GE Healthcare社)を用いて混合し、溶出緩衝液(20mMのHEPES(pH7.5)、300mMのNaCl、500mMのイミダゾール、0.5mMのTCEP)で溶離した。タンパク質をSuperdex 200HRカラム(GE Healthcare社)を用いるサイズ排除クロマトグラフィによりさらに精製し、20mMのHEPES(pH7.5)、1MのKCl、10mMのMgCl2、0.5mMのTCEPで溶離した。タンパク質精製の確認のために、SDS-PAGEを8%ゲルと共に使用した。Nanodrop 2000Cにおいて280nmで吸光度を測定することによりタンパク質濃度を計算した。
大腸菌細胞発現のためのコドン最適化を用いてLFCA Casコード配列を合成した。このコード配列をpBAD/His発現ベクター(ThermoFisher社)にクローニングし、タンパク質発現のために大腸菌BL21(DE3)(Life Technologies社)にトランスフェクトした。SpyCas9発現プラスミドはAddgene社から購入した(プラスミド#62934)。細胞をOD600が0.6に達するまでLB培地中37℃でインキュベートした。LFCA Casの発現のためにL-アラビノースを0.1%になるまで細胞に添加し、SpyCas9の発現のためにIPTGを1mMになるまで細胞に添加し、かつ20℃で一晩タンパク質誘導した。細胞は4000rpmの遠心分離によってペレット化した。ペレットを抽出緩衝液(20mMのHEPES(pH7.5)、300mMのNaCl、25mMのイミダゾール、0.5mMのTCEP)に再懸濁させた。15分間インキュベーションしながら、このペレットに100mg/mLのリゾチーム(Thermo Scientific社)を添加した。次いで、このペレットを30%の振幅および10分間の3サイクルで超音波処理した。33,000gで1時間の超遠心分離により細胞デブリを分離した。精製のために、上澄みをHis GraviTrap親和性カラム(GE Healthcare社)を用いて混合し、溶出緩衝液(20mMのHEPES(pH7.5)、300mMのNaCl、500mMのイミダゾール、0.5mMのTCEP)で溶離した。タンパク質をSuperdex 200HRカラム(GE Healthcare社)を用いるサイズ排除クロマトグラフィによりさらに精製し、20mMのHEPES(pH7.5)、1MのKCl、10mMのMgCl2、0.5mMのTCEPで溶離した。タンパク質精製の確認のために、SDS-PAGEを8%ゲルと共に使用した。Nanodrop 2000Cにおいて280nmで吸光度を測定することによりタンパク質濃度を計算した。
gRNA合成
標的に相補的な配列を有するgRNAを合成し、pUC18ベクターにクローニングした。Phusion(登録商標)Hot Start Flex DNAポリメラーゼ(NEB社)を用いるPCRによりgRNA配列を増幅させた。mi-PCR精製キット(Metabion社)を用いてPCR産物を精製した。HiScribe T7高収率RNA合成キット(NEB社)を用いてgRNAを合成した。PCR断片は5’末端にT7プロモーターと、3’末端にストレプトコッカス・ピオゲネス(化膿性レンサ球菌)のsgRNAからの配列とを有していた。反応系を一晩インキュベートし、Monarch(登録商標)RNA精製カラムキットのプロトコルに従ってsgRNAを精製した。TBE緩衝液を含む2%アガロースゲルによる電気泳動によりgRNA完全性を分析した。
標的に相補的な配列を有するgRNAを合成し、pUC18ベクターにクローニングした。Phusion(登録商標)Hot Start Flex DNAポリメラーゼ(NEB社)を用いるPCRによりgRNA配列を増幅させた。mi-PCR精製キット(Metabion社)を用いてPCR産物を精製した。HiScribe T7高収率RNA合成キット(NEB社)を用いてgRNAを合成した。PCR断片は5’末端にT7プロモーターと、3’末端にストレプトコッカス・ピオゲネス(化膿性レンサ球菌)のsgRNAからの配列とを有していた。反応系を一晩インキュベートし、Monarch(登録商標)RNA精製カラムキットのプロトコルに従ってsgRNAを精製した。TBE緩衝液を含む2%アガロースゲルによる電気泳動によりgRNA完全性を分析した。
インビトロ切断アッセイ
精製したLFCA CasおよびSpyCas9を用いてインビトロ切断アッセイを行った。全てのアッセイにおいて、切断緩衝液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μgのBSA、pH7.9)中に1:1の比で、30nMのCasヌクレアーゼを30nMのgRNAと共に37℃で15分間インキュベートした。次いで、3nMの標的DNAを添加し、実験に応じて異なる時間にわたってインキュベートした。EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化した。
精製したLFCA CasおよびSpyCas9を用いてインビトロ切断アッセイを行った。全てのアッセイにおいて、切断緩衝液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μgのBSA、pH7.9)中に1:1の比で、30nMのCasヌクレアーゼを30nMのgRNAと共に37℃で15分間インキュベートした。次いで、3nMの標的DNAを添加し、実験に応じて異なる時間にわたってインキュベートした。EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化した。
インビトロでの熱およびpH安定性
条件を変えたこと以外は、インビトロ切断のために先に説明されているプロトコルに従ってアッセイを行った。熱安定性のためのアッセイは4~60℃で変化させた温度を用いてpH7.9で行った。pH安定性のためのアッセイは37℃で行い、pHは4~9.5で変化させた。1時間後に、EDTAを含む6×ローディングダイ(NEB社)を添加することによりこの反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化した。
条件を変えたこと以外は、インビトロ切断のために先に説明されているプロトコルに従ってアッセイを行った。熱安定性のためのアッセイは4~60℃で変化させた温度を用いてpH7.9で行った。pH安定性のためのアッセイは37℃で行い、pHは4~9.5で変化させた。1時間後に、EDTAを含む6×ローディングダイ(NEB社)を添加することによりこの反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化した。
PAMライブラリーの構築
7つのランダムヌクレオチドを含むDNAライブラリーを設計し、Genscript社製のpUC18プラスミドにクローニングした。このランダムライブラリーをXL1blue大腸菌にトランスフェクトし、数時間増幅してPAM配列における最大可変性を達成した。7つのランダムヌクレオチドを含むDNAライブラリーからのプライマー(F’AATAGGCGTATCACGAGGC(配列番号6)およびR’AGCGAGTCAGTGAGCGAG(配列番号7))を用いて、844bpのPCR断片を増幅させた。
7つのランダムヌクレオチドを含むDNAライブラリーを設計し、Genscript社製のpUC18プラスミドにクローニングした。このランダムライブラリーをXL1blue大腸菌にトランスフェクトし、数時間増幅してPAM配列における最大可変性を達成した。7つのランダムヌクレオチドを含むDNAライブラリーからのプライマー(F’AATAGGCGTATCACGAGGC(配列番号6)およびR’AGCGAGTCAGTGAGCGAG(配列番号7))を用いて、844bpのPCR断片を増幅させた。
PAM決定
PAM決定アッセイは、切断緩衝液中で30nMのLFCA Casを含むDNAライブラリーからの3nMのPCR断片および7つのランダムヌクレオチドの上流の20個のヌクレオチドを標的化する30nMのgRNAをインキュベートすることにより行った。反応系を37℃で1時間インキュベートした。EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。GeneJetゲル抽出キット(ThermoFisher社)を用いて、278bpの小さい断片をアガロースゲルから精製した。この断片をIon Torrentにより配列決定し、得られたリードを参照配列においてマップした。0個のミスマッチを有する参照に対してアラインメントされたリードを選択し、各PAMについて頻度を計算した。
PAM決定アッセイは、切断緩衝液中で30nMのLFCA Casを含むDNAライブラリーからの3nMのPCR断片および7つのランダムヌクレオチドの上流の20個のヌクレオチドを標的化する30nMのgRNAをインキュベートすることにより行った。反応系を37℃で1時間インキュベートした。EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。GeneJetゲル抽出キット(ThermoFisher社)を用いて、278bpの小さい断片をアガロースゲルから精製した。この断片をIon Torrentにより配列決定し、得られたリードを参照配列においてマップした。0個のミスマッチを有する参照に対してアラインメントされたリードを選択し、各PAMについて頻度を計算した。
HEK293T細胞のゲノム編集
細胞を1%(w/v)L-グルタミンおよびペニシリン-ストレプトマイシン(100IU/ml)が添加されたDMEN+10%FBS培地中に維持した。LFCA CasおよびSpyCas9のためのヒト化コード配列をpCDNA3.1(ThermoFisher社)発現ベクターにクローニングし、gRNAをTOPOベクター(ThermoFisher社)にクローニングした。プラスミドをリポフェクタミンLTX(ThermoFisher社)と共に5分間インキュベートし、細胞に同時トランスフェクトした。この培地をトランスフェクションから24時間後に変え、72時間後に細胞を回収した。製造業者のプロトコルに従ってDNAzol試薬(ThermoFisher社)を用いてgDNAを細胞から抽出した。gDNAからのプライマー(F’TATTGTTCCTCCGTGCGTCAG(配列番号8)およびR’GACGAGAAACACAGCCCCA(配列番号9))を用い、Phusion(登録商標)Hot Start Flex DNAポリメラーゼ(NEB社)を用いるPCRによりDNA標的を増幅させた。これらのPCR単位複製配列を基質として用いてT7EIアッセイを行ってインデル形成を確認した。製造業者のプロトコルに従って、T7E1エンドヌクレアーゼ(NEB社)を使用した。EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。
細胞を1%(w/v)L-グルタミンおよびペニシリン-ストレプトマイシン(100IU/ml)が添加されたDMEN+10%FBS培地中に維持した。LFCA CasおよびSpyCas9のためのヒト化コード配列をpCDNA3.1(ThermoFisher社)発現ベクターにクローニングし、gRNAをTOPOベクター(ThermoFisher社)にクローニングした。プラスミドをリポフェクタミンLTX(ThermoFisher社)と共に5分間インキュベートし、細胞に同時トランスフェクトした。この培地をトランスフェクションから24時間後に変え、72時間後に細胞を回収した。製造業者のプロトコルに従ってDNAzol試薬(ThermoFisher社)を用いてgDNAを細胞から抽出した。gDNAからのプライマー(F’TATTGTTCCTCCGTGCGTCAG(配列番号8)およびR’GACGAGAAACACAGCCCCA(配列番号9))を用い、Phusion(登録商標)Hot Start Flex DNAポリメラーゼ(NEB社)を用いるPCRによりDNA標的を増幅させた。これらのPCR単位複製配列を基質として用いてT7EIアッセイを行ってインデル形成を確認した。製造業者のプロトコルに従って、T7E1エンドヌクレアーゼ(NEB社)を使用した。EDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、最終反応産物を2%アガロースゲル上で泳動させた。ゲルをSYBR金(ThermoFisher社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。
eGFP遺伝子とAAVS1座位の500bpの相同なアームによって挟まれたCMVプロモーターとを含む二本鎖DNAテンプレートを利用したこと以外は、ノックイン実験と同じ戦略を使用した。72時間後に共焦点顕微鏡法によって免疫蛍光を定量化した。
免疫蛍光研究
24時間のLFCA CasおよびSpyCas9プラスミドのトランスフェクション後に、HEK293T細胞を4%パラホルムアルデヒドで30分間固定した。細胞を0.2%TritonX-100/PBSと共に室温で30分間インキュベートし、次いでブロッキング工程のために3%BSA、0.05%Tween20と共に1時間インキュベートした。細胞をTPBS(0.05%Tween-PBS)で3回洗浄し、ポリクローナル抗Cas9抗体(1:100、600-401-GK0、Thermofisher社)と共に37℃で1時間インキュベートした。細胞をTPBSで3回洗浄し、二次抗体(Alexa Fluor 555で標識したヤギ抗ウサギ、1:200、A-21428、Thermofisher社)と共に10分間インキュベートした。この工程でDAPIを添加し、最後に1回細胞を洗浄し、共焦点顕微鏡法により可視化した。
24時間のLFCA CasおよびSpyCas9プラスミドのトランスフェクション後に、HEK293T細胞を4%パラホルムアルデヒドで30分間固定した。細胞を0.2%TritonX-100/PBSと共に室温で30分間インキュベートし、次いでブロッキング工程のために3%BSA、0.05%Tween20と共に1時間インキュベートした。細胞をTPBS(0.05%Tween-PBS)で3回洗浄し、ポリクローナル抗Cas9抗体(1:100、600-401-GK0、Thermofisher社)と共に37℃で1時間インキュベートした。細胞をTPBSで3回洗浄し、二次抗体(Alexa Fluor 555で標識したヤギ抗ウサギ、1:200、A-21428、Thermofisher社)と共に10分間インキュベートした。この工程でDAPIを添加し、最後に1回細胞を洗浄し、共焦点顕微鏡法により可視化した。
gRNA無差別性についてのインビトロ切断アッセイ
gRNA無差別性についてのインビトロ切断のために、TGG PAMを運ぶDNAプラスミドを使用した。切断アッセイは切断緩衝液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μg/BSA、pH7.9)中37℃で行った。3nMのAnCasおよびSpCas9を各細菌種の3nMのsgRNAと共に1:1の比で、切断緩衝液中で15分間インキュベートし、3nMのDNAプラスミドを添加した。10分後にEDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、2%アガロースゲル上で泳動させた。同様に、ゲルをSYBR金(ThermoFisher Scientific社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化した。
gRNA無差別性についてのインビトロ切断のために、TGG PAMを運ぶDNAプラスミドを使用した。切断アッセイは切断緩衝液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μg/BSA、pH7.9)中37℃で行った。3nMのAnCasおよびSpCas9を各細菌種の3nMのsgRNAと共に1:1の比で、切断緩衝液中で15分間インキュベートし、3nMのDNAプラスミドを添加した。10分後にEDTAを含む6×ローディングダイ(NEB社)を添加することにより反応を止め、2%アガロースゲル上で泳動させた。同様に、ゲルをSYBR金(ThermoFisher Scientific社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化した。
ssDNAおよびssRNAについてのインビトロ切断アッセイ
精製したLFCA(FCA)AnCas、LBCA(BCA)AnCasおよびSpCas9エンドヌクレアーゼを用いてインビトロ切断アッセイを行った。全てのアッセイにおいて、30nMの酵素を30nMのsgRNA(Spy-sgRNA 20nt)と共に1:1の比で切断緩衝液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μg/BSA、pH7.9)中37℃で15分間インキュベートした。次いで、3nMの標的(ssDNAまたはssRNA)を添加し、異なる時間間隔(0、5、10、30および60分間)でインキュベートした。ssDNA標的のために、尿素を含む6×ローディングダイ(NEB社)を添加することにより反応を止めた。試料を80℃で10分間沸騰させ、2.5%変性尿素アガロースゲルにより分離させた。ssRNA標的のために、尿素を含む2×RNAゲルローディングバッファー(NEB社)を添加することにより反応を止めた。試料を95℃で10分間沸騰させ、15%変性尿素ポリアクリルアミドゲル電気泳動により分離させた。全ての場合に、ゲルをSYBR金(ThermoFisher Scientific社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化し、単一指数関数的減衰曲線に当てはめた。
精製したLFCA(FCA)AnCas、LBCA(BCA)AnCasおよびSpCas9エンドヌクレアーゼを用いてインビトロ切断アッセイを行った。全てのアッセイにおいて、30nMの酵素を30nMのsgRNA(Spy-sgRNA 20nt)と共に1:1の比で切断緩衝液(100mMのNaCl、50mMのTris-HCl、10mMのMgCl2、100μg/BSA、pH7.9)中37℃で15分間インキュベートした。次いで、3nMの標的(ssDNAまたはssRNA)を添加し、異なる時間間隔(0、5、10、30および60分間)でインキュベートした。ssDNA標的のために、尿素を含む6×ローディングダイ(NEB社)を添加することにより反応を止めた。試料を80℃で10分間沸騰させ、2.5%変性尿素アガロースゲルにより分離させた。ssRNA標的のために、尿素を含む2×RNAゲルローディングバッファー(NEB社)を添加することにより反応を止めた。試料を95℃で10分間沸騰させ、15%変性尿素ポリアクリルアミドゲル電気泳動により分離させた。全ての場合に、ゲルをSYBR金(ThermoFisher Scientific社)で染色し、ChemiDoc XRS+システム(Bio-Rad社)により画像化した。切断をImageJにより定量化し、単一指数関数的減衰曲線に当てはめた。
ELISA試験
Elisa試験は、他のところに記載されている修正されたプロトコルを使用して行った60。簡単に言うと、1μg/ウェルのSpCas9、LFCA AnCas、LBCA AnCasおよびウシ血清アルブミン(BSA、Sigma Aldrich社)を1×重炭酸緩衝液で希釈し、96ウェルプレート(ThermoFisher Scientific社)に4℃で一晩コーティングした。プレートを1×洗浄緩衝液(TBST、ThermoFisher Scientific社)で洗浄し、1%BSAブロッキング溶液を用いて室温で1時間ブロッキングを行った。抗Cas9ウサギ抗体(Rockland社、600-401-GK0)を1%BSAブロッキング溶液で1:25000で希釈し、プレートを室温で2時間インキュベートした。次いでプレートを洗浄し、1%BSAブロッキング溶液で1:2000で希釈したHRP結合ヤギ抗ウサギIgG(H+L)(Invitrogen社)を添加し、室温で1時間インキュベートした。最後に、3,3’,5,5’-テトラメチルベンジジンELISA基質溶液(ThermoFisher Scientific社)を添加し、室温で10分間インキュベートした。1N硫酸により反応を止めた。吸光度はVICTOR X5マイクロプレートリーダー(PerkinElmer社)を用いて450nmで測定した。
Elisa試験は、他のところに記載されている修正されたプロトコルを使用して行った60。簡単に言うと、1μg/ウェルのSpCas9、LFCA AnCas、LBCA AnCasおよびウシ血清アルブミン(BSA、Sigma Aldrich社)を1×重炭酸緩衝液で希釈し、96ウェルプレート(ThermoFisher Scientific社)に4℃で一晩コーティングした。プレートを1×洗浄緩衝液(TBST、ThermoFisher Scientific社)で洗浄し、1%BSAブロッキング溶液を用いて室温で1時間ブロッキングを行った。抗Cas9ウサギ抗体(Rockland社、600-401-GK0)を1%BSAブロッキング溶液で1:25000で希釈し、プレートを室温で2時間インキュベートした。次いでプレートを洗浄し、1%BSAブロッキング溶液で1:2000で希釈したHRP結合ヤギ抗ウサギIgG(H+L)(Invitrogen社)を添加し、室温で1時間インキュベートした。最後に、3,3’,5,5’-テトラメチルベンジジンELISA基質溶液(ThermoFisher Scientific社)を添加し、室温で10分間インキュベートした。1N硫酸により反応を止めた。吸光度はVICTOR X5マイクロプレートリーダー(PerkinElmer社)を用いて450nmで測定した。
ヒトのHEK293T細胞のインビボ切断
他のところに記載されているように(Harms,D.W.ら.Human Genetics 83,2014)、ヒトのHEK293T細胞において祖先Casヌクレアーゼの機能的な検証を行った。無菌の濾過した10%ウシ胎児血清(FBS)、10mMのHEPES(pH7.4)、2mMのL-グルタミンおよびペニシリン(100IU/ml)-ストレプトマイシン(100μg/ml)が添加されたDMEM培地(ダルベッコ変法イーグル培地、Gibco社)において細胞を増殖させ、無菌フードを用いて無菌条件下で取り扱った。HEK293T細胞を37℃、95%の湿度および5%CO2のインキュベータ中で培養した。ヒト化AnCasをpcDNA3.1プラスミド発現ベクター(ThermoFisher社)にクローニングした。sgRNA標的配列をBreaking-Casウェブツール62を用いて設計し、Golden Gateクローニング方法によりMLM3636プラスミドベクター(Addgene社#43860)にクローニングした。hCas9プラスミド(Addgene社#41815)からのSpCas9を陽性対照として使用した。インビボゲノム編集試験のために細胞を、抗生物質を含まない0.5mlの体積のDMEM中に4×105細胞/mlの密度で24ウェルプレートに播種した。これらの細胞に、1μgのhCas/hAnCasプラスミドおよび0.5μgの対応するsgRNAプラスミドを、1つのウェル当たり100μlのOpti-MEM(Gibco社)で希釈した2μlのリポフェクタミン2000(Life Technologies社)でトランスフェクトした。トランスフェクションから72時間後に、High Pureテンプレート調製キット(Roche社)を用いてゲノムDNAを単離した。標的DSBを取り囲んでいるPCR増幅されたDNA断片に対するT7エンドヌクレアーゼIアッセイによりインデル発生を評価した。
他のところに記載されているように(Harms,D.W.ら.Human Genetics 83,2014)、ヒトのHEK293T細胞において祖先Casヌクレアーゼの機能的な検証を行った。無菌の濾過した10%ウシ胎児血清(FBS)、10mMのHEPES(pH7.4)、2mMのL-グルタミンおよびペニシリン(100IU/ml)-ストレプトマイシン(100μg/ml)が添加されたDMEM培地(ダルベッコ変法イーグル培地、Gibco社)において細胞を増殖させ、無菌フードを用いて無菌条件下で取り扱った。HEK293T細胞を37℃、95%の湿度および5%CO2のインキュベータ中で培養した。ヒト化AnCasをpcDNA3.1プラスミド発現ベクター(ThermoFisher社)にクローニングした。sgRNA標的配列をBreaking-Casウェブツール62を用いて設計し、Golden Gateクローニング方法によりMLM3636プラスミドベクター(Addgene社#43860)にクローニングした。hCas9プラスミド(Addgene社#41815)からのSpCas9を陽性対照として使用した。インビボゲノム編集試験のために細胞を、抗生物質を含まない0.5mlの体積のDMEM中に4×105細胞/mlの密度で24ウェルプレートに播種した。これらの細胞に、1μgのhCas/hAnCasプラスミドおよび0.5μgの対応するsgRNAプラスミドを、1つのウェル当たり100μlのOpti-MEM(Gibco社)で希釈した2μlのリポフェクタミン2000(Life Technologies社)でトランスフェクトした。トランスフェクションから72時間後に、High Pureテンプレート調製キット(Roche社)を用いてゲノムDNAを単離した。標的DSBを取り囲んでいるPCR増幅されたDNA断片に対するT7エンドヌクレアーゼIアッセイによりインデル発生を評価した。
図1に従うノード識別を有する再構築された祖先配列
全てが1340または1368個のアミノ酸残基(再構築方法に応じる)であった。配列は、配列番号1~5および10~236に記載されているものとして開示されている。
全てが1340または1368個のアミノ酸残基(再構築方法に応じる)であった。配列は、配列番号1~5および10~236に記載されているものとして開示されている。
配列番号1~5は上に例示されている祖先Casタンパク質に対応している。
Claims (24)
- (i)配列番号1に記載されているアミノ酸配列を有するLFCAヌクレアーゼ、
(ii)配列番号2に記載されているアミノ酸配列を有するLBCAヌクレアーゼ、
(iii)配列番号3に記載されているアミノ酸配列を有するLSCAヌクレアーゼ、
(iv)配列番号4に記載されているアミノ酸配列を有するLPCAヌクレアーゼ、
(v)配列番号5に記載されているアミノ酸配列を有するLPDCAヌクレアーゼ、または
(vi)(i)~(v)のいずれか1つに記載のCasヌクレアーゼのバリアントを含むかそれからなるCasヌクレアーゼであって、前記バリアントは、
・配列番号1のアミノ酸配列との少なくとも60%の配列同一性、または
・配列番号2のアミノ酸配列との少なくとも75%の配列同一性、または
・配列番号3のアミノ酸配列との少なくとも80%の配列同一性、または
・配列番号4のアミノ酸配列との少なくとも85%の配列同一性、または
・配列番号5のアミノ酸配列との少なくとも95%の配列同一性
を共有し、かつ
さらに、前記バリアントはSpyCas9と比較した場合に、以下の際立った特性:
(a)SpyCas9により実質的に専ら直線化DNAプラスミドテンプレートのみが得られるという条件下での、より高い割合のニック入りDNAプラスミドテンプレートおよび/またはより低い割合の直線化DNAプラスミドテンプレート、
(b)前記バリアントが観察可能なニック入り標的を提供する間にSpyCas9により実質的に専ら直線化のみが生じる(少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比)という条件下で、DNAプラスミド標的に対するより高いニック率および/またはより低い直線化率、
(c)LFCA、LBCAまたはLSCAのうちのいずれかに匹敵する緩和されたPAM要件、
(d)一本鎖DNAを切断するための能力、および
(e)前記標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
の1つまたはいくつかを保持しているCasヌクレアーゼ。 - 前記Casヌクレアーゼは、そのニッカーゼ活性のみを保持するように触媒部位の突然変異誘発により改変されている、請求項1に記載のCasヌクレアーゼ。
- 前記Casヌクレアーゼは、置換または欠失、好ましくは1つまたはいくつかの保存的置換による1つまたはいくつかのアミノ酸変化を含み、それにより前記Casヌクレアーゼのエンドヌクレアーゼおよび/またはニッカーゼ活性が保持され、かつそれによりLFCA Casの緩和されたPAM特異性が保持される、請求項1または2に記載のCasヌクレアーゼ。
- 前記Casヌクレアーゼは、そのヌクレアーゼ活性を無効にするように触媒部位の突然変異誘発により改変されている、請求項1~3のいずれか1項に記載のCasヌクレアーゼ。
- 前記Casヌクレアーゼは、遺伝子改変もしくは調節の非ヌクレアーゼエフェクターに結合または融合されている、請求項1~4のいずれか1項に記載のCasヌクレアーゼ。
- 請求項1~5のいずれか1項に記載のCasヌクレアーゼをコードする核酸。
- (i)請求項1~5のいずれか1項に記載のCasヌクレアーゼまたは請求項6に記載の核酸を含むベクター、および(ii)ガイドRNAまたはガイドRNAを発現するベクターを含むかそれからなる組み合わせ産物であって、前記ガイドRNAは標的DNA配列に前記Casヌクレアーゼを標的化する組み合わせ産物。
- 請求項1~5のいずれか1項に記載のCasヌクレアーゼおよびガイドRNAを含むリボ核タンパク質複合体であって、前記ガイドRNAは標的DNA配列に前記Casヌクレアーゼを標的化するリボ核タンパク質複合体。
- 標的核酸配列、好ましくはDNA配列を改変または調節するための方法であって、前記標的核酸配列を、(i)請求項1~3または5のいずれか1項に記載のCasヌクレアーゼ、および(ii)前記標的配列に前記Casヌクレアーゼを標的化するガイドRNAと接触させることを含み、さらに
(a)前記接触させることは、前記方法が人間の生殖細胞系列同一性を改変する方法ではないという条件で、インビトロで単離された標的核酸とのもの、またはエクスビボで細胞内でのものである、あるいは
(b)前記方法はヒトもしくは動物体に対して実施される医学的治療方法ではない
のいずれかである方法。 - 前記標的核酸配列は、エクスビボのヒトもしくは動物細胞における標的DNA配列である、請求項9に記載の方法。
- 薬物として使用するための請求項7に記載の組み合わせ産物。
- 標的核酸配列を改変または調節することによる治療処置の方法に使用するための、請求項7に記載の組み合わせ産物。
- 前記治療処置方法は遺伝性疾患を予防および/または治療することを含む、請求項12に記載の使用のための組み合わせ産物。
- 前記組み合わせ産物は目的の導入遺伝子をコードする核酸分子をさらに含む、請求項12または13に記載の使用のための組み合わせ産物。
- 機能的な単体エフェクターCasタンパク質ヌクレアーゼを得るための系統学的祖先再構築方法であって、
(a)同じ分類型の天然に生じる単体エフェクターCasヌクレアーゼ配列を含み、かつ複数の既存の種、好ましくは2つ以上の属、なおより好ましくは2つ以上の綱(場合により2つ以上の門を跨ぐ)から得られる、Cas配列の集団の配列解析からの系統樹を提供する工程と、
(b)前記系統樹から進化経路を遡ることにより祖先バリアント配列を選択する工程であって、前記選択された祖先バリアントの各アミノ酸のために高確率のアミノ酸を決定する工程と、
(c)Casタンパク質エンドヌクレアーゼおよび/またはニッカーゼ活性を示すことができる前記バリアントを産生する工程と
を含む方法。 - 工程(b)は、
(i)同じ属の配列のある部分を形成するそれぞれがちょうど複数の種の配列のための祖先バリアントである祖先バリアントの配列を編集すること、好ましくはさらに
(ii)(i)で達成された前記配列を用いて祖先属として割り当てられている1つ以上の祖先バリアント配列および/または複数の属の開始種の配列に遡ることができる祖先綱として割り当てられている1つ以上の祖先バリアント配列を編集すること、好ましくはさらに
(iii)2つ以上の綱の開始種に遡ることができる少なくとも1つの綱間祖先配列を編集すること
を含む、請求項15に記載の方法。 - 前記選択された祖先バリアント配列は、現在から少なくとも5億年、例えば少なくとも7~8億年、より好ましくは少なくとも10億年、例えば約20~30億年の進化期間に匹敵する、請求項15または16に記載の方法。
- 前記選択された祖先バリアント配列は既存の細菌種のCas9配列の祖先バリアントである、請求項15~17のいずれか1項に記載の方法。
- Cas9配列の開始集団は、ストレプトコッカス、エンテロコッカス、リステリア、クロストリジウム、ペラギルハブダス(Pelagirhabdus)、ハロラクティバシラス(Halolactibacillus)、フルオリコッカス(Floricoccus)、バゴコッカス(Vagococcus)、Urinacoccus、バゴコッカス(Vagococcus)、ドレア(Dorea)、ルミノコッカス、ラクノスピラ、アナエロスティペス(Anaerostipes)、オルセネラ(Oisenella)およびビフィドバクテリウムのうちの2種以上から選択される複数の細菌性Cas9配列を含む、請求項18に記載の方法。
- 配列の開始集団は、任意に放線菌のCas9配列が追加された、2つ以上の細菌クラス、好ましくは細菌のバシラス綱およびクロストリジウム綱の両方からのCas9配列、例えばストレプトコッカス(レンサ球菌)属の異なる種由来の少なくとも複数の配列、エンテロコッカス属の異なる種由来の複数の配列、リステリアの異なる種由来の複数の配列およびクロストリジウム属種由来の複数の配列を跨ぐ、請求項18または19に記載の方法。
- 前記選択された祖先バリアント配列は、2つ以上の綱の開始種まで遡ることができる綱間祖先バリアント配列である、請求項15~20のいずれか1項に記載の方法。
- 前記選択された祖先バリアントは、エンドヌクレアーゼ二本鎖DNA切断を示すことができるように決定し、かつニッカーゼのみまたはヌクレアーゼ活性を有しないdeadCasのいずれかにさらに変換し、かつ/または例えば融合タンパク質において非ヌクレアーゼエフェクターに結合させる、請求項15~21のいずれか1項に記載の方法。
- Cas9配列の祖先バリアントは、以下の特性:
(a)SpyCas9により少なくとも約4:1の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比が得られるという条件下での、少なくとも約2.3:1~少なくとも1:4の間の直線化DNAプラスミド標的:ニック入りDNAプラスミドテンプレートの比、
(b)LFCA、LBCAまたはLSCAのうちのいずれかに匹敵する緩和されたPAM要件、
(c)一本鎖DNAを切断するための能力、
(d)前記標的化配列が、複数の既存の細菌種によって用いられるCas9 gRNAのtracrRNA構成要素から選択可能なtracrRNA構成要素に結合されるsgRNAを使用するための能力
の1つまたはいくつかを有する、請求項18~21のいずれか1項に記載の方法。 - 前記選択された祖先バリアントを、ニッカーゼのみまたはヌクレアーゼ活性を有しないdeadCasのいずれかであるバリアントにさらに変換し、かつ/または例えば融合タンパク質において非ヌクレアーゼエフェクターとの結合を提供する、請求項23に記載の方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21382474 | 2021-05-25 | ||
EP21382474.1 | 2021-05-25 | ||
GB2107671.6 | 2021-05-28 | ||
GBGB2107671.6A GB202107671D0 (en) | 2021-05-28 | 2021-05-28 | Synthetic cas proteins |
EP22165690.3 | 2022-03-30 | ||
EP22165690 | 2022-03-30 | ||
PCT/EP2022/064307 WO2022248607A2 (en) | 2021-05-25 | 2022-05-25 | Synthetic cas proteins |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024521806A true JP2024521806A (ja) | 2024-06-04 |
Family
ID=82319633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023573060A Pending JP2024521806A (ja) | 2021-05-25 | 2022-05-25 | 合成Casタンパク質 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4347808A2 (ja) |
JP (1) | JP2024521806A (ja) |
WO (1) | WO2022248607A2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7044373B2 (ja) | 2015-07-15 | 2022-03-30 | ラトガース,ザ ステート ユニバーシティ オブ ニュージャージー | ヌクレアーゼ非依存的な標的化遺伝子編集プラットフォームおよびその用途 |
US20220010293A1 (en) * | 2018-02-23 | 2022-01-13 | Pioneer Hi-Bred International, Inc. | Novel cas9 orthologs |
US20220380740A1 (en) * | 2018-10-24 | 2022-12-01 | The Broad Institute, Inc. | Constructs for improved hdr-dependent genomic editing |
AU2020373362A1 (en) * | 2019-10-28 | 2022-05-26 | Targetgene Biotechnologies Ltd | Pam-reduced and pam-abolished CAS derivatives compositions and uses thereof in genetic modulation |
-
2022
- 2022-05-25 EP EP22735069.1A patent/EP4347808A2/en active Pending
- 2022-05-25 JP JP2023573060A patent/JP2024521806A/ja active Pending
- 2022-05-25 WO PCT/EP2022/064307 patent/WO2022248607A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2022248607A3 (en) | 2023-01-05 |
WO2022248607A2 (en) | 2022-12-01 |
EP4347808A2 (en) | 2024-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022246445B2 (en) | Variants of Cpf1 (Cas12a) with altered PAM specificity | |
JP6745391B2 (ja) | 遺伝子操作CRISPR−Cas9ヌクレアーゼ | |
US10526591B2 (en) | Engineered CRISPR-Cas9 nucleases | |
EP3526324B1 (en) | Crispr-associated (cas) protein | |
AU2021201354A1 (en) | Nuclease profiling system | |
EP3765616B1 (en) | Novel crispr dna and rna targeting enzymes and systems | |
JP2023002712A (ja) | S.ピオゲネスcas9変異遺伝子及びこれによってコードされるポリペプチド | |
AU2017204909A1 (en) | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing | |
AU2016274452A1 (en) | Thermostable Cas9 nucleases | |
US12012621B2 (en) | Systems, methods, and compositions for RNA-guided RNA-targeting CRISPR effectors | |
US10920272B2 (en) | High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro | |
US20220364067A1 (en) | Base editing enzymes | |
WO2018172798A1 (en) | Argonaute system | |
KR20220084322A (ko) | 세포에서 하나 이상의 표적-특이적인 프로그램 가능한 뉴클레아제의 오프-타겟 활성을 프로파일링하는 진정한 편향되지 않은 시험관내 분석(abnoba-seq) | |
CA3234217A1 (en) | Base editing enzymes | |
JP2024521806A (ja) | 合成Casタンパク質 | |
US20240240165A1 (en) | Synthetic cas proteins | |
CN117858944A (zh) | 合成cas蛋白 | |
JP7518549B2 (ja) | 遺伝子編集における非意図的な変異の阻害 | |
US20220186254A1 (en) | Argonaute proteins from prokaryotes and applications thereof | |
US20230348877A1 (en) | Base editing enzymes | |
Adorno | Engineering Controllable and Efficient Base Editors by Targeted Manipulation of DNA Deaminases | |
JP2022526695A (ja) | 遺伝子編集における非意図的な変異の阻害 | |
Keiser | Functional Characterization of the Newly Discovered Type V CRISPR-Cas Protein Cas12a2 | |
Halpin-Healy | Structure and Function of a Transposon-Encoded CRISPR-Cas System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240501 |