JP2024521876A - 変異体Cas12jエンドヌクレアーゼ - Google Patents
変異体Cas12jエンドヌクレアーゼ Download PDFInfo
- Publication number
- JP2024521876A JP2024521876A JP2023573663A JP2023573663A JP2024521876A JP 2024521876 A JP2024521876 A JP 2024521876A JP 2023573663 A JP2023573663 A JP 2023573663A JP 2023573663 A JP2023573663 A JP 2023573663A JP 2024521876 A JP2024521876 A JP 2024521876A
- Authority
- JP
- Japan
- Prior art keywords
- cas12j
- mutant
- seq
- endonuclease
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010042407 Endonucleases Proteins 0.000 title claims abstract description 336
- 102000004533 Endonucleases Human genes 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 claims abstract description 117
- 230000000694 effects Effects 0.000 claims abstract description 76
- 150000007523 nucleic acids Chemical group 0.000 claims description 321
- 102000039446 nucleic acids Human genes 0.000 claims description 249
- 108020004707 nucleic acids Proteins 0.000 claims description 249
- 108020004414 DNA Proteins 0.000 claims description 194
- 239000002773 nucleotide Substances 0.000 claims description 194
- 125000003729 nucleotide group Chemical group 0.000 claims description 193
- 238000006467 substitution reaction Methods 0.000 claims description 183
- 102000053602 DNA Human genes 0.000 claims description 126
- 235000001014 amino acid Nutrition 0.000 claims description 126
- 238000003776 cleavage reaction Methods 0.000 claims description 102
- 230000007017 scission Effects 0.000 claims description 100
- 102000040430 polynucleotide Human genes 0.000 claims description 98
- 108091033319 polynucleotide Proteins 0.000 claims description 98
- 239000002157 polynucleotide Substances 0.000 claims description 98
- 150000001413 amino acids Chemical class 0.000 claims description 87
- 238000012217 deletion Methods 0.000 claims description 83
- 230000037430 deletion Effects 0.000 claims description 83
- 230000035772 mutation Effects 0.000 claims description 72
- 229940024606 amino acid Drugs 0.000 claims description 70
- 108090000623 proteins and genes Proteins 0.000 claims description 70
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 62
- 102000004169 proteins and genes Human genes 0.000 claims description 58
- 235000018102 proteins Nutrition 0.000 claims description 54
- 238000003780 insertion Methods 0.000 claims description 53
- 230000037431 insertion Effects 0.000 claims description 53
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 51
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 46
- 229920001184 polypeptide Polymers 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 39
- 201000010099 disease Diseases 0.000 claims description 38
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 38
- 210000004027 cell Anatomy 0.000 claims description 34
- 230000014509 gene expression Effects 0.000 claims description 34
- 230000003197 catalytic effect Effects 0.000 claims description 24
- 208000015181 infectious disease Diseases 0.000 claims description 23
- 101710163270 Nuclease Proteins 0.000 claims description 22
- 208000035473 Communicable disease Diseases 0.000 claims description 21
- 108020005004 Guide RNA Proteins 0.000 claims description 21
- 102000004190 Enzymes Human genes 0.000 claims description 20
- 108090000790 Enzymes Proteins 0.000 claims description 20
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 claims description 17
- 239000012634 fragment Substances 0.000 claims description 16
- 238000000338 in vitro Methods 0.000 claims description 15
- 125000000539 amino acid group Chemical group 0.000 claims description 14
- 230000027455 binding Effects 0.000 claims description 14
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 13
- 230000002452 interceptive effect Effects 0.000 claims description 13
- 210000004899 c-terminal region Anatomy 0.000 claims description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 8
- 210000004962 mammalian cell Anatomy 0.000 claims description 8
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 6
- 239000000090 biomarker Substances 0.000 claims description 6
- 239000012678 infectious agent Substances 0.000 claims description 6
- 244000052769 pathogen Species 0.000 claims description 6
- 230000001717 pathogenic effect Effects 0.000 claims description 6
- 101710147059 Nicking endonuclease Proteins 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 5
- 239000010949 copper Substances 0.000 claims description 5
- 230000005782 double-strand break Effects 0.000 claims description 5
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 claims description 5
- 241000894006 Bacteria Species 0.000 claims description 4
- 108010077544 Chromatin Proteins 0.000 claims description 4
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 4
- 102000005720 Glutathione transferase Human genes 0.000 claims description 4
- 108010070675 Glutathione transferase Proteins 0.000 claims description 4
- 239000004471 Glycine Substances 0.000 claims description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 4
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 claims description 4
- WAEMQWOKJMHJLA-UHFFFAOYSA-N Manganese(2+) Chemical compound [Mn+2] WAEMQWOKJMHJLA-UHFFFAOYSA-N 0.000 claims description 4
- 235000004279 alanine Nutrition 0.000 claims description 4
- 229960002685 biotin Drugs 0.000 claims description 4
- 235000020958 biotin Nutrition 0.000 claims description 4
- 239000011616 biotin Substances 0.000 claims description 4
- 210000004369 blood Anatomy 0.000 claims description 4
- 239000008280 blood Substances 0.000 claims description 4
- 102000021178 chitin binding proteins Human genes 0.000 claims description 4
- 108091011157 chitin binding proteins Proteins 0.000 claims description 4
- 210000003483 chromatin Anatomy 0.000 claims description 4
- 229910052802 copper Inorganic materials 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 4
- 229910052759 nickel Inorganic materials 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 230000005783 single-strand break Effects 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 241000238421 Arthropoda Species 0.000 claims description 3
- 241000244203 Caenorhabditis elegans Species 0.000 claims description 3
- 241000498255 Enterobius vermicularis Species 0.000 claims description 3
- 241000233866 Fungi Species 0.000 claims description 3
- 241000244206 Nematoda Species 0.000 claims description 3
- 108010047956 Nucleosomes Proteins 0.000 claims description 3
- 102000029797 Prion Human genes 0.000 claims description 3
- 108091000054 Prion Proteins 0.000 claims description 3
- 208000002474 Tinea Diseases 0.000 claims description 3
- 241000893966 Trichophyton verrucosum Species 0.000 claims description 3
- 241000726445 Viroids Species 0.000 claims description 3
- 241000700605 Viruses Species 0.000 claims description 3
- 210000001124 body fluid Anatomy 0.000 claims description 3
- 239000010839 body fluid Substances 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 206010014881 enterobiasis Diseases 0.000 claims description 3
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 230000002458 infectious effect Effects 0.000 claims description 3
- 244000000012 macroparasite Species 0.000 claims description 3
- 230000000813 microbial effect Effects 0.000 claims description 3
- 210000001623 nucleosome Anatomy 0.000 claims description 3
- 230000003071 parasitic effect Effects 0.000 claims description 3
- 239000013612 plasmid Substances 0.000 claims description 3
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 3
- 230000003612 virological effect Effects 0.000 claims description 3
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 claims description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 2
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 claims description 2
- 108010052875 Adenine deaminase Proteins 0.000 claims description 2
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 claims description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 2
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 claims description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 2
- 102000003960 Ligases Human genes 0.000 claims description 2
- 108090000364 Ligases Proteins 0.000 claims description 2
- 102000003992 Peroxidases Human genes 0.000 claims description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims description 2
- 239000004473 Threonine Substances 0.000 claims description 2
- 108091023040 Transcription factor Proteins 0.000 claims description 2
- 102000040945 Transcription factor Human genes 0.000 claims description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 2
- 241000545067 Venus Species 0.000 claims description 2
- 235000003704 aspartic acid Nutrition 0.000 claims description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims description 2
- 235000013922 glutamic acid Nutrition 0.000 claims description 2
- 239000004220 glutamic acid Substances 0.000 claims description 2
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 claims description 2
- 229960000310 isoleucine Drugs 0.000 claims description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 2
- 230000009438 off-target cleavage Effects 0.000 claims description 2
- 108040007629 peroxidase activity proteins Proteins 0.000 claims description 2
- 210000002381 plasma Anatomy 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000000582 semen Anatomy 0.000 claims description 2
- 210000002966 serum Anatomy 0.000 claims description 2
- 210000001138 tear Anatomy 0.000 claims description 2
- 210000002700 urine Anatomy 0.000 claims description 2
- 239000004474 valine Substances 0.000 claims description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims 1
- 230000002103 transcriptional effect Effects 0.000 claims 1
- 230000001976 improved effect Effects 0.000 abstract description 15
- 238000010586 diagram Methods 0.000 abstract description 2
- 102100031780 Endonuclease Human genes 0.000 description 221
- 108091079001 CRISPR RNA Proteins 0.000 description 170
- 230000000875 corresponding effect Effects 0.000 description 73
- 125000003275 alpha amino acid group Chemical group 0.000 description 42
- 230000003993 interaction Effects 0.000 description 19
- 230000007018 DNA scission Effects 0.000 description 18
- 229940088598 enzyme Drugs 0.000 description 18
- 238000006555 catalytic reaction Methods 0.000 description 16
- 239000000758 substrate Substances 0.000 description 16
- 238000003556 assay Methods 0.000 description 15
- 239000000872 buffer Substances 0.000 description 15
- 230000004913 activation Effects 0.000 description 13
- 230000002255 enzymatic effect Effects 0.000 description 13
- 239000012190 activator Substances 0.000 description 12
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 230000001580 bacterial effect Effects 0.000 description 11
- 239000000975 dye Substances 0.000 description 11
- 210000005260 human cell Anatomy 0.000 description 11
- 238000010791 quenching Methods 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 10
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 9
- 239000007995 HEPES buffer Substances 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 9
- 238000010362 genome editing Methods 0.000 description 9
- 108091033409 CRISPR Proteins 0.000 description 8
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 8
- 229910021645 metal ion Inorganic materials 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 230000000171 quenching effect Effects 0.000 description 7
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000012636 effector Substances 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 239000011777 magnesium Substances 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 150000004713 phosphodiesters Chemical class 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000001000 micrograph Methods 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 102220269938 rs1555402999 Human genes 0.000 description 4
- 238000001542 size-exclusion chromatography Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- SGTNSNPWRIOYBX-UHFFFAOYSA-N 2-(3,4-dimethoxyphenyl)-5-{[2-(3,4-dimethoxyphenyl)ethyl](methyl)amino}-2-(propan-2-yl)pentanenitrile Chemical compound C1=C(OC)C(OC)=CC=C1CCN(C)CCCC(C#N)(C(C)C)C1=CC=C(OC)C(OC)=C1 SGTNSNPWRIOYBX-UHFFFAOYSA-N 0.000 description 3
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 3
- 108700004991 Cas12a Proteins 0.000 description 3
- 102000003844 DNA helicases Human genes 0.000 description 3
- 108090000133 DNA helicases Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000080590 Niso Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 239000004202 carbamide Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 239000011572 manganese Substances 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- UDGUGZTYGWUUSG-UHFFFAOYSA-N 4-[4-[[2,5-dimethoxy-4-[(4-nitrophenyl)diazenyl]phenyl]diazenyl]-n-methylanilino]butanoic acid Chemical compound COC=1C=C(N=NC=2C=CC(=CC=2)N(C)CCCC(O)=O)C(OC)=CC=1N=NC1=CC=C([N+]([O-])=O)C=C1 UDGUGZTYGWUUSG-UHFFFAOYSA-N 0.000 description 2
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- 102220556625 Acyl-coenzyme A thioesterase 11_K55A_mutation Human genes 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- -1 PAM recognition Proteins 0.000 description 2
- 108010053210 Phycocyanin Proteins 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- 239000012505 Superdex™ Substances 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000009545 invasion Effects 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 210000004897 n-terminal region Anatomy 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- WIIZWVCIJKGZOK-IUCAKERBSA-N 2,2-dichloro-n-[(1s,2s)-1,3-dihydroxy-1-(4-nitrophenyl)propan-2-yl]acetamide Chemical compound ClC(Cl)C(=O)N[C@@H](CO)[C@@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-IUCAKERBSA-N 0.000 description 1
- JNGRENQDBKMCCR-UHFFFAOYSA-N 2-(3-amino-6-iminoxanthen-9-yl)benzoic acid;hydrochloride Chemical compound [Cl-].C=12C=CC(=[NH2+])C=C2OC2=CC(N)=CC=C2C=1C1=CC=CC=C1C(O)=O JNGRENQDBKMCCR-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 102000040852 Class 2 family Human genes 0.000 description 1
- 108091071896 Class 2 family Proteins 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- 238000007702 DNA assembly Methods 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 235000003332 Ilex aquifolium Nutrition 0.000 description 1
- 235000002296 Ilex sandwicensis Nutrition 0.000 description 1
- 235000002294 Ilex volkensiana Nutrition 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108010004729 Phycoerythrin Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102220570182 Pyridoxal-dependent decarboxylase domain-containing protein 1_K26A_mutation Human genes 0.000 description 1
- 108010034546 Serratia marcescens nuclease Proteins 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 150000001408 amides Chemical group 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- JJWKPURADFRFRB-UHFFFAOYSA-N carbonyl sulfide Chemical compound O=C=S JJWKPURADFRFRB-UHFFFAOYSA-N 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000604 cryogenic transmission electron microscopy Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000010217 densitometric analysis Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 150000002669 lysines Chemical class 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- VOFUROIFQGPCGE-UHFFFAOYSA-N nile red Chemical compound C1=CC=C2C3=NC4=CC=C(N(CC)CC)C=C4OC3=CC(=O)C2=C1 VOFUROIFQGPCGE-UHFFFAOYSA-N 0.000 description 1
- 239000012038 nucleophile Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 238000013492 plasmid preparation Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- INCIMLINXXICKS-UHFFFAOYSA-M pyronin Y Chemical compound [Cl-].C1=CC(=[N+](C)C)C=C2OC3=CC(N(C)C)=CC=C3C=C21 INCIMLINXXICKS-UHFFFAOYSA-M 0.000 description 1
- 238000002708 random mutagenesis Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- MYFATKRONKHHQL-UHFFFAOYSA-N rhodamine 123 Chemical compound [Cl-].COC(=O)C1=CC=CC=C1C1=C2C=CC(=[NH2+])C=C2OC2=CC(N)=CC=C21 MYFATKRONKHHQL-UHFFFAOYSA-N 0.000 description 1
- 229940043267 rhodamine b Drugs 0.000 description 1
- 108700038288 rhodamine-phalloidin Proteins 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000009291 secondary effect Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000012089 stop solution Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
Abstract
本発明は、対応する野生型Cas12jエンドヌクレアーゼと比較して変化した活性または改善された特性を有する変異体Cas12j(CasΦとしても知られる)エンドヌクレアーゼ、及び変異体Cas12jエンドヌクレアーゼを使用する方法に関する。
【選択図】なし
【選択図】なし
Description
本発明は、対応する野生型Cas12jエンドヌクレアーゼと比較して変化した活性または改善された特性を有する変異体Cas12j(CasΦとしても知られる)エンドヌクレアーゼに関する。核酸配列を検出及び定量化するための方法、ならびに疾患を診断するための方法も開示される。
微生物とその侵入物との間の競争は、可動遺伝因子(MGE)の攻撃を防ぐために広範囲にわたる防御システムの進化を押し進めている。それらの中でも、CRISPRは、エフェクターリボヌクレオタンパク質複合体を組み立てるCRISPR関連ヌクレアーゼ(Cas)及びCRISPR RNA(crRNA)によって達成される一種の適応免疫を構成し、それらの複合体は、干渉のために相補的DNA(またはRNA)を認識して切断するためにcrRNAによってガイドされる。CRISPR-Casヌクレアーゼは、ゲノム編集のためのツールとして広く使用されている。特定のDNA部位を標的とするためのガイドRNAの再設計、ならびにタンパク質スキャフォールドの操作によって、生物医学及び生物工学用途におけるゲノム改変のための強力な方法が提供された。
原核生物の中では普遍的に多様化されているが、CRISPR系はバクテリオファージのゲノム内でも同定された。近年、Cas12jとしても知られている、CasΦタンパク質と呼ばれるCRISPRヌクレアーゼの新しいクラス2ファミリーが、「巨大」ファージのbiggiephageクレードで見つかった。CasΦタンパク質は、他のCRISPRヌクレアーゼと7%未満の配列同一性を共有し、クラス2V型メンバーとRuvCドメインでのみ配列及び構造相同性を示す。CasΦRNPは、クラス2V型ヌクレアーゼの他のメンバーと同様に、crRNAに相補的なssDNA分子での活性化後に、突出(staggered)DNA二本鎖切断(DSB)を生成し、非特異的ssDNA切断を解く。さらに、CasΦ1及びCasΦ2のRuvC触媒部位はまた、前駆体crRNA(pre-crRNA)を処理する。CasΦエンドヌクレアーゼは、最小のTリッチPAMでプロトスペーサーを認識し、それらの小さいサイズ(700~800残基)と、機能的なRNPを構築するためのトランス活性化crRNA(tracrRNA)の欠如とにより、CasΦは小型化されたRNAガイドヌクレアーゼの独自のファミリーとされる。
CRISPR-Casエフェクター複合体は、ゲノム編集アプローチのためにインビトロ及びインビボで強化されるが、特に、後者は、本分野において満たされていない主要なニーズの1つである送達の問題によって制限されている。アデノ随伴ウイルスベクター(AAV)は、遺伝子送達に一般に用いられる。それにもかかわらず、CRISPR-Casエフェクター複合体をコードする遺伝子をAAVベクターにパッケージングすることは、その能力が限られているため困難であり、したがって、追加の調節因子の挿入のためのスペースがほとんどない。近年、CasΦ酵素が、哺乳動物及び植物細胞2においてゲノム編集を媒介し、ゲノム操作ツールの本発明者らのレパートリーを拡大することが示されている。小さいサイズのCasΦRNPは、送達に使用されるAAVベクターにおけるパッキング問題を軽減することによってゲノム編集アプローチを改善することができる。
しかしながら、CasΦヌクレアーゼによる標的DNAの認識、開裂、及びその後の切断の詳細な分子機構に関する疑問には、構造情報が得られないため、答えは得られていない。これらのCasΦヌクレアーゼエンドヌクレアーゼは、自然界で作用するのと同様に、すなわち、特定の標的配列に対して同じ要件、同じパターン及び切断の特異性などに対して同じ要件で使用されることに限られている。したがって、これらの酵素の完全な潜在能力を見いだし、公知の用途ならびに新規の用途での使用に向けてそれらを最適化する必要がある。
本開示は、一本鎖または二本鎖のいずれかの核酸標的配列において一本鎖切断または二本鎖切断を導入することができる変異体Cas12jエンドヌクレアーゼ、例えば、変異体CasΦ-3ヌクレアーゼに関する。さらに、本開示の変異体Cas12jエンドヌクレアーゼは、一本鎖または二本鎖のいずれかの核酸標的に、前記核酸を切断することなく、結合することができる。
本明細書に開示される新規変異体Cas12jエンドヌクレアーゼは、野生型Cas12jエンドヌクレアーゼに対していくつかの利点、例えば、より高いレベルの小型化、変更されたPAM配列要件、または改善された特異性及び/もしくは酵素活性などを示し、標的核酸配列の検出及び定量化に有利に使用することができる。
最後に、本明細書に開示される新規変異体Cas12jエンドヌクレアーゼは、疾患の診断にも使用することができ、これは、例えば、疾患の原因となる感染因子に由来する遺伝物質を検出することによるものである。
したがって、いくつかの態様では、本開示は、ポリペプチド配列を含む変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記ポリペプチド配列は、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を以下に対して有する:
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、
及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3。
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、
及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3。
いくつかの態様において、本明細書に記載される変異体Cas12jエンドヌクレアーゼまたはそのオルソログをコードするポリヌクレオチドが提供される。
いくつかの態様では、本開示は、上記で定義される変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドまたは核酸配列を含む組換えベクターを提供する。いくつかの実施形態では、前記ポリヌクレオチドまたは核酸配列は、プロモーターに作動可能に結合している。
したがって、いくつかの態様では、本開示は、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログ、本明細書に開示されるポリヌクレオチド、または本明細書に開示される組換えベクターを発現することができる細胞を提供する。
いくつかの態様では、本開示は、crRNA-Cas12j複合体の発現のための系を提供し、前記系は、
a.本明細書に開示されるポリヌクレオチド、または変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドを含む本明細書に開示される組換えベクター、及び
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター
を含む。
a.本明細書に開示されるポリヌクレオチド、または変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドを含む本明細書に開示される組換えベクター、及び
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター
を含む。
いくつかの態様において、本開示は、第1の標的核酸に核酸切断を導入する方法を提供し、この方法は、
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.のcrRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させるステップであって、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されているものか、または本明細書に開示されるポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得るステップ、及び
c.crRNA及び変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップ
を含み、それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する。
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.のcrRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させるステップであって、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されているものか、または本明細書に開示されるポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得るステップ、及び
c.crRNA及び変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップ
を含み、それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する。
いくつかの態様では、本開示は、第1の標的核酸に核酸切断を導入するための方法におけるcrRNA-Cas12j複合体の使用を提供し、
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、Cas12jエンドヌクレアーゼまたはそのオルソログは、請求項1~54のいずれか1項に記載され、
b.crRNA-Cas12j複合体を、第1の標的核酸と接触させ、
それにより、第1の標的核酸配列において核酸切断が生成される。
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、Cas12jエンドヌクレアーゼまたはそのオルソログは、請求項1~54のいずれか1項に記載され、
b.crRNA-Cas12j複合体を、第1の標的核酸と接触させ、
それにより、第1の標的核酸配列において核酸切断が生成される。
いくつかの態様では、哺乳動物細胞内で第2の標的核酸に部位特異的な二本鎖切断を導入するインビトロ方法が提供され、方法は、哺乳動物細胞内に、crRNA-Cas12j複合体を導入することを含み、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはオルソログであり、crRNAは、第2の標的核酸に特異的である。
いくつかの態様では、サンプル中の第2の標的核酸を検出する方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.crRNA-Cas12j複合体及びssDNAを、少なくとも1つの第2の標的核酸を含むサンプルと接触させること、及び
d.蛍光体からの蛍光シグナルを検出することによりssDNAの切断を検出すること
を含み、それによりサンプル中の第2の標的核酸の存在を検出し、ステップc.は、任意にcrRNA-Cas12j複合体の活性化を含む。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.crRNA-Cas12j複合体及びssDNAを、少なくとも1つの第2の標的核酸を含むサンプルと接触させること、及び
d.蛍光体からの蛍光シグナルを検出することによりssDNAの切断を検出すること
を含み、それによりサンプル中の第2の標的核酸の存在を検出し、ステップc.は、任意にcrRNA-Cas12j複合体の活性化を含む。
いくつかの態様では、サンプル中の第2の標的核酸を検出して、任意に定量化する方法も提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.crRNAは、第2の標的核酸に特異的である、提供することと、
b.crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含むサンプルと接触させることと、
c.タンパク質標識、例えば蛍光シグナルを検出することにより、第2の標的核酸の存在を検出して、任意に定量化することと、を含む。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.crRNAは、第2の標的核酸に特異的である、提供することと、
b.crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含むサンプルと接触させることと、
c.タンパク質標識、例えば蛍光シグナルを検出することにより、第2の標的核酸の存在を検出して、任意に定量化することと、を含む。
いくつかの態様では、対象における疾患を診断するためのインビトロ方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、第2の標的核酸は、疾患と相関する核酸断片であり、例えば、第2の標的核酸は、疾患のバイオマーカーであり、
それによって対象における疾患を診断する。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、第2の標的核酸は、疾患と相関する核酸断片であり、例えば、第2の標的核酸は、疾患のバイオマーカーであり、
それによって対象における疾患を診断する。
したがって、いくつかの態様では、対象における感染性疾患を診断するためのインビトロ方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、を含み、
第2の標的核酸は、疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、
それによって対象における感染性疾患を診断する。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、を含み、
第2の標的核酸は、疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、
それによって対象における感染性疾患を診断する。
本発明は特許請求の範囲において定義される。
本開示は、変異体Cas12jエンドヌクレアーゼまたはそのオルソログ及びそれらの使用に関する。本開示全体を通して、「変異体Cas12jエンドヌクレアーゼ」は、自然に発生する変異体、例えば、1つ以上の一塩基多型(SNP)を保有するCas12j遺伝子によってコードされる変異体、または自然に発生しない変異体、例えば、Cas12j遺伝子の直接変異誘発またはランダム変異誘発によって得られる変異体であり得る。
定義
本明細書で使用される「コドン」という用語は、特定のアミノ酸をコードする隣接するヌクレオチドのトリプレットを指す。
本明細書で使用される「コドン」という用語は、特定のアミノ酸をコードする隣接するヌクレオチドのトリプレットを指す。
本明細書で使用される「CRISPR-Cas系」という用語は、CRISPR-Casファミリーのメンバーを指す。原核生物適応免疫系CRISPR-Cas(clustered regularly interspaced short palindromic repeats 及びCRISPR-関連タンパク質)は、RNAガイド認識により標的DNA配列を結合及び切断することができる。それらの分子アーキテクチャによれば、CRISPR-Cas系の様々なメンバーは、2つのクラスに分類されている:クラス1は、いくつかのエフェクタータンパク質を包含し、クラス2系は、単一の要素を使用する(Makarova et al.,2015)。Cas12jエンドヌクレアーゼは、いくつかのファージゲノムに存在するクラス2V型CRISPR-Casエンドヌクレアーゼの新しいメンバーとして記載されている(Pausch et al.,2020)。
本明細書で使用される「エンドヌクレアーゼ」という用語は、ポリヌクレオチド鎖内のホスホジエステル結合を切断することができる酵素を指す。いくつかのエンドヌクレアーゼは特異的であり、すなわち、それらは切断部位を指示する所与のヌクレオチド配列を認識する。エンドヌクレアーゼの一例は、ニッキングエンドヌクレアーゼである。本明細書で使用されるニッキングエンドヌクレアーゼは、二本鎖DNAの1本を切断して「ニッキングされた」DNA分子を生成する(「ニッカーゼ」活性)酵素を指す。本明細書で使用されるニッキングエンドヌクレアーゼは、一本鎖DNAの一本鎖を切断するエンドヌクレアーゼも指す。
本明細書で使用される「断片」という用語は、核酸またはポリペプチドの非全長の部分を示す。したがって、断片は、それ自体がそれぞれ核酸またはポリペプチドでもある。DNA断片は、本開示を通じて5’末端から開始して指定される。
本明細書で使用される「遺伝子編集」という用語は、ヌクレオチド配列中の1つ以上のヌクレオチドを挿入、削除または置換するための遺伝子工学手法の使用を指す。
「ガイドRNA」という用語は、本明細書では「crRNA」と互換的に使用され、CRISPR-Casタンパク質、特にCas12jエンドヌクレアーゼによる標的核酸配列の認識に必要とされるRNA分子を指す。
相同体または機能的相同体は、参照ポリペプチドと少なくとも一部の配列同一性を示し、元の機能の少なくとも1つの態様を保持した任意のポリペプチドであり得る。本明細書において、Cas12jエンドヌクレアーゼの機能的相同体とは、前記Cas12jエンドヌクレアーゼまたはその断片と少なくとも一部の配列同一性を共有するポリペプチドであって、前記Cas12jエンドヌクレアーゼと同様にエンドヌクレアーゼとして機能する能力を有する、すなわち、crRNAに特異的に結合し、標的核酸を特異的に認識し、結合して切断することができるポリペプチドである。
本明細書で使用される「プロトスペーサー隣接モチーフ(PAM)」という用語は、Cas12jエンドヌクレアーゼ系などのCRISPR-Cas系によって標的にされるDNA配列のすぐ下流にあるDNA配列を指す。crRNA-Cas12j複合体のcrRNAは、PAMを含む標的DNA配列のみを認識してハイブリダイズすることができる。
本明細書で使用される「認識」という用語は、ヌクレオチド配列を同定するための分子の能力を指す。例えば、酵素またはDNA結合ドメインは、核酸配列を潜在的な基質として認識し、それに結合し得る。好ましくは、認識は特異的である。
本明細書で使用される「配列同一性」という用語は、比較ウィンドウにわたって同一である2つのポリヌクレオチド配列(すなわち、ヌクレオチド毎に基づいて)を指す。「配列同一性のパーセンテージ」という用語は、比較ウィンドウにわたって2つの最適に整列された配列を比較し、両方の配列において同一の核酸塩基(例えば、A、T、C、G、U、もしくはI)が生じる位置の数を決定して、整合された位置の数を得、整合された位置の数を比較ウィンドウ内の位置の総数(すなわち、ウィンドウサイズ)で除し、結果に100を乗じて、配列同一性のパーセンテージを得ることによって計算される。
ポリペプチド、ペプチドまたはタンパク質に適用されるように、アミノ酸配列の同一性の程度は、これらのアミノ酸配列によって共有される位置における同一アミノ酸の数の関数である。アミノ酸配列の相同性または類似性の程度は、これらのアミノ酸配列によって共有されている位置におけるアミノ酸の数、すなわち構造的に関連したアミノ酸の数の関数である。
配列同一性の全体的なパーセンテージは、デフォルトギャップ重みを使用して、Wisconsin Genetics Software Package Release 7.0のアルゴリズムGAP、BESTFIT、またはFASTAで決定される。
「対応する配列」、「対応する領域」または「対応する残基」という用語は、当該技術分野で一般的に理解されているように、第1及び第2の配列が比較のために最適に位置合わせされる場合、第1のアミノ酸またはヌクレオチド配列上の領域または残基と同じ(すなわち、同等の)位置を占める第2のアミノ酸またはヌクレオチド配列上の領域または残基を指す。したがって、第1のペプチド配列中の第1の位置の残基は、必ずしも第2のペプチド配列中の同じ第1の位置の残基に対応する必要はないが、その代わりに、第1及び第2のペプチド配列が最適に位置合わせされる場合、前記第1のペプチド配列の前記第1の位置の残基と最適に位置合わせされる第2のペプチド配列中の第2の位置の残基に対応し得る。前記位置合わせは、当該技術分野において公知の任意の方法により、例えば、Needle program of the EMBOSS package(EMBOSS:The European Molecular Biology Open Software Suite,Rice et al.,2000,Trends Genet.16:276-277)で実施されるNeedleman-Wunschアルゴリズム(Needleman and Wunsch,1970,J.Mo/.Biol.48:443-453)を使用して、好ましくはバージョン5.0.0以降(https://www.ebi.ac.uk/Tools/psa/emboss_needle/で入手可能)により実施され得る。使用されるパラメータは、10のギャップオープンペナルティ、0.5のギャップ拡張ペナルティ、及びEBLOSUM62(30 BLOSUM62のEMBOSSバージョン)置換マトリックスであり得る。
本明細書で使用される「相互作用標識」または「相互作用標識のセット」という用語は、隣接して配置される場合、相互作用することができる少なくとも1つの蛍光体及び少なくとも1つのクエンチャーを指す。相互作用標識がクエンチャーに隣接して配置される場合、クエンチャーは蛍光体シグナルをクエンチすることができる。相互作用は、蛍光共鳴エネルギー移動(FRET)によって媒介され得る。
本明細書で使用される「隣接して配置される」という用語は、互いに近接した2つの物体の間の物理的距離を指す。蛍光体とクエンチャーとが隣接して配置されると、クエンチャーは、蛍光体シグナルを部分的または完全にクエンチすることができる。FRETクエンチは、典型的には最大約100Åの距離にわたって生じ得る。本明細書で使用される隣接して配置されるとは、100Å以下及び/または約100Åの距離を指す。
本明細書で使用される「蛍光標識」または「蛍光体」という用語は、光励起によって光を再放出することができる蛍光化合物を指す。蛍光体は、特定の波長の光エネルギーを吸収し、より長い波長の光を再放出する。吸収された波長、エネルギー移動効率、及び放出前の時間は、励起状態にある分子が周囲の分子と相互作用するため、蛍光体構造及びその化学環境の両方に依存する。最大吸収(≒励起)及び発光(例えば、吸収/発光=485nm/517nm)の波長は、所定の蛍光体を指すために使用される典型的な用語であるが、スペクトル全体を考慮することが重要であり得る。
本明細書で使用される「クエンチ」または「クエンチング」という用語は、蛍光体などの所定の物質の蛍光強度を低減する任意のプロセスを指す。クエンチングは、蛍光共鳴エネルギー移動(FRET)によって媒介され得る。FRETは、供与体(例えば、蛍光体)と受容体(例えば、クエンチャー)の遷移ダイポールの間の古典的なダイポール-ダイポール相互作用に基づいており、供与体-受容体距離に依存する。FRETは、典型的には最大100Åまでの距離にわたって発生することができる。FRETはまた、供与体-受容体のスペクトルの重なり、及び供与体及び受容体の遷移双極子モーメントの相対的な配向に依存する。蛍光体のクエンチングも、蛍光体と他の蛍光体または非蛍光分子との間に非蛍光性複合体が形成された結果として生じうる。この機構は、「接触クエンチング」、「静的クエンチング」、または「基底状態の複合形成」として知られている
本明細書で使用される「クエンチャー」という用語は、蛍光体などの、所定の物質をクエンチすることができる化合物を指す。
本明細書で使用する場合、「標的鎖」は、crRNAと相互作用してcrRNA-DNAハイブリッドを形成する核酸鎖を指す。「非標的鎖」は、標的鎖に対して相補的である。
本明細書で使用される「オルソログ」という用語は、特定の事象によって分離された同じ祖先の配列に由来すると推測される遺伝子(及び前記遺伝子によってコードされるタンパク質)を指し、ある種が2つの別個の種に分岐する場合、得られた2つの種における単一の遺伝子のコピーはオルソログであると言われる。オルソログ、またはオルソログ遺伝子は、最後の共通祖先の単一の遺伝子からの垂直系統によって発生した異なる種の遺伝子である。Cas12jのオルソログは、本系との配列類似性に基づいて識別及び特徴付けることができる。
変異体Cas12jエンドヌクレアーゼ
発明者らは、異なる酵素活性に関与するCasa12jファミリーメンバーCasΦ-3(配列番号3)のいくつかのドメインを同定し、特徴付けた。図1Aに、CasΦ-3(配列番号3)のドメイン構成の概要を示す。
発明者らは、異なる酵素活性に関与するCasa12jファミリーメンバーCasΦ-3(配列番号3)のいくつかのドメインを同定し、特徴付けた。図1Aに、CasΦ-3(配列番号3)のドメイン構成の概要を示す。
この情報を使用して、本発明者らは、変異した場合にCas12jエンドヌクレアーゼファミリーメンバーの酵素活性を改善または改変するいくつかの重要な領域及び重要な残基を同定した。
特に、CasΦ-3(配列番号3)の場合、以下の領域の改変によってタンパク質の酵素活性が改善または改変される:
・NPIDドメインの第1の領域、前記NPIDドメインの第1の領域は、配列番号3の残基21~35を定義する、
・TPIDドメインの第1の領域、前記TPIDドメインの第1の領域は、配列番号3の残基98~103として定義される、
・TPIDドメインの第2の領域、前記TPIDドメインの第2の領域は、配列番号3の残基120~150として定義される、
・TPIDドメインの第3の領域またはRBDドメインの第1の領域、前記TPIDドメインの第3の領域及び前記RBDドメインの第1の領域は、配列番号3の残基180~203として定義される、
・RBDドメインの第2の領域またはRuvC-Iドメインの第1の領域、前記RBDドメインの第2の領域及び前記RuvC-Iドメインの第1の領域は、配列番号3の残基380~395として定義される、
・RuvC-IIドメインの第1の領域、前記RuvC-IIドメインの第1の領域は、配列番号3の残基620~650として定義される、
・RuvC-IIドメインの第2の領域、前記RuvC-IIドメインの第2の領域は、配列番号3の残基680~700として定義される、
・RuvC-IIドメインの第3の領域、前記RuvC-IIドメインの第3の領域は、配列番号3の残基726~766として定義される。
・NPIDドメインの第1の領域、前記NPIDドメインの第1の領域は、配列番号3の残基21~35を定義する、
・TPIDドメインの第1の領域、前記TPIDドメインの第1の領域は、配列番号3の残基98~103として定義される、
・TPIDドメインの第2の領域、前記TPIDドメインの第2の領域は、配列番号3の残基120~150として定義される、
・TPIDドメインの第3の領域またはRBDドメインの第1の領域、前記TPIDドメインの第3の領域及び前記RBDドメインの第1の領域は、配列番号3の残基180~203として定義される、
・RBDドメインの第2の領域またはRuvC-Iドメインの第1の領域、前記RBDドメインの第2の領域及び前記RuvC-Iドメインの第1の領域は、配列番号3の残基380~395として定義される、
・RuvC-IIドメインの第1の領域、前記RuvC-IIドメインの第1の領域は、配列番号3の残基620~650として定義される、
・RuvC-IIドメインの第2の領域、前記RuvC-IIドメインの第2の領域は、配列番号3の残基680~700として定義される、
・RuvC-IIドメインの第3の領域、前記RuvC-IIドメインの第3の領域は、配列番号3の残基726~766として定義される。
これらの領域のいずれかにおけるアミノ酸の置換、挿入または欠失は、本明細書で以下に詳述するように、改変された酵素活性を生じさせ得る。CasΦ-3以外の他のCas12jファミリーメンバーにおける対応する領域の改変によって、同様の改善または改変された酵素活性を提供することができる。
さらに、酵素活性にとって重要であると思われる重要な残基が同定され、すなわち、これらの残基のいずれかの変異または欠失も、酵素活性を改変する。これらの残基は、CasΦ-3について、配列番号26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708の位置にある。他のCas12jファミリーメンバーにおけるこれらの位置に対応する残基は、酵素活性について同様に重要であり得、すなわちこれらの残基のいずれかの変異または欠失も、酵素活性を改変する。
したがって、本開示は、変更された活性を有する改変されたCas12jタンパク質に関する。
したがって、いくつかの態様では、本開示は、ポリペプチド配列を含む変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記ポリペプチド配列は、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を以下に対して有する:
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、
及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3。
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、
及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-1(配列番号1)、CasΦ-2(配列番号2)、CasΦ-3(配列番号3)、CasΦ-4(配列番号4)、CasΦ-5(配列番号5)、CasΦ-6(配列番号6)、CasΦ-7(配列番号7)、CasΦ-8(配列番号8)、CasΦ-9(配列番号9)、及びCasΦ-10(配列番号10)からなる群から選択されるCas12jエンドヌクレアーゼの変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-1(配列番号1)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-2(配列番号2)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-3(配列番号3)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-4(配列番号4)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-5(配列番号5)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-6(配列番号6)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-7(配列番号7)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-8(配列番号8)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-9(配列番号9)の変異体である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、CasΦ-10(配列番号10)の変異体である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、Biggiephageに由来する。例えば、変異体Cas12jエンドヌクレアーゼは、NCBIゲノム/サンプルアクセッション識別子ERS4026370、ERS4025728、ERS4026385、またはERS4025730を有するファージに由来する。
本発明者らは、驚くべきことに、タンパク質の特定のC末端切断によって、酵素の触媒活性が維持され、タンパク質のさらなる小型化を可能にすることを見出した。
したがって、いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基727~766に対応する配列のC末端欠失をさらに含む。したがって、いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号31と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含む。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~20及び、36~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基21~35に対応するNPIDドメインの第1の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記NPIDドメインの第1の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~97及び、104~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基98~103に対応するTPIDドメインの第1の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記TPIDドメインの第1の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~119及び、151~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基120~150に対応するTPIDドメインの第2の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記TPIDドメインの第2の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~179及び、204~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基180~203に対応するTPIDドメインの第3の領域またはRBDドメインの第1の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記TPIDドメインの第3の領域または前記RBDドメインの第1の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~379及び、396~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基380~395に対応するRBDドメインの第2の領域またはRuvC-Iドメインの第1の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記RBDドメインの第2の領域または前記RuvC-Iドメインの第1の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~619及び、651~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記RuvC-IIドメインの第1の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、変異体CasΦ-3またはそのオルソログなどの、変異体Cas12jエンドヌクレアーゼを提供し、前記変異体Cas12jエンドヌクレアーゼは、配列番号3の残基1~679及び、701~726に対応する配列と、少なくとも80%の配列同一性、例えば少なくとも85%の配列同一性、例えば少なくとも90%の配列同一性、例えば少なくとも95%の配列同一性、例えば少なくとも96%の配列同一性、例えば少なくとも97%の配列同一性、例えば少なくとも98%の配列同一性、例えば少なくとも99%の配列同一性、例えば100%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域に少なくとも1つのアミノ酸変異をさらに含み、各変異は、独立して、アミノ酸置換、挿入または欠失である。少なくとも1つのアミノ酸の置換、挿入または欠失は、前記RuvC-IIドメインの第2の領域の少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14または15個の隣接するもしくは非隣接のアミノ酸の置換、挿入または欠失であり得る。
いくつかの実施形態では、前記領域は、異なるタンパク質の別の領域、例えば対応する領域で置換されている。前記ドメイン置換は、酵素に付加的な機能を提供することができ、例えば、CasΦ-3 RuvCドメインを対応するCasΦ-1またはCasΦ-2 RuvCドメインで置換し、CasΦ-3に前駆体crRNA(pre-crRNA)を処理する能力を与えるなどの機能を提供することができる。いくつかの実施形態では、本明細書に上述されるCasΦ-3の前記RuvC-Iドメインの第1の領域、前記RuvC-IIドメインの第1の領域、及び/または前記RuvC-IIドメインの第2の領域は、CasΦ-1またはCasΦ-2の対応する領域で置換される。対応するRuvC-Iドメイン及びRuvC-IIドメインの例を、本明細書における以下の表1に提供する。
少なくとも1つの置換は、少なくとも10個のアミノ酸残基、例えば少なくとも15個、例えば少なくとも25個、例えばなくとも50個、例えば少なくとも75個、例えば少なくとも100個、例えば少なくとも150個、例えば少なくとも200個、例えば少なくとも250個、例えば少なくとも300個、例えば少なくとも350個、例えば少なくとも400個、例えば少なくとも450個、例えば少なくとも500個のアミノ酸残基の置換であり得る。いくつかの実施形態では、少なくとも1つの置換は、10~500個のアミノ酸残基の範囲、例えば25~450個のアミノ酸残基の範囲、例えば50~400個のアミノ酸残基の範囲、例えば50~350個のアミノ酸残基の範囲、例えば50~300個のアミノ酸残基の範囲、例えば50~300個のアミノ酸残基の範囲、例えば50~250個のアミノ酸残基の範囲、例えば50~200個のアミノ酸残基の範囲、例えば50~150個のアミノ酸残基の範囲、または例えば75~150個のアミノ酸残基の範囲にある。
上記で定義された少なくとも1つのアミノ酸置換または欠失は、ドメイン中のいくつかのアミノ酸は欠失し、その他のアミノ酸は置換され得ることが理解されるであろう。
上記変異体はいずれも、配列番号3の26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708の位置に対応する1つ以上の残基に少なくとも1つのアミノ酸置換及び/または欠失を含み得る、またはさらに含み得る。
いくつかの実施形態では、少なくとも1つのアミノ酸置換は、荷電側鎖を有するアミノ酸の非荷電側鎖を有するアミノ酸への置換である。
いくつかの実施形態では、少なくとも1つのアミノ酸置換は、荷電側鎖を有するアミノ酸の非極性側鎖を有するアミノ酸残基への置換である。
いくつかの実施形態では、少なくとも1つのアミノ酸置換は、荷電側鎖を有するアミノ酸のグリシン、アラニン、バリン、ロイシン、イソロイシン、セリンまたはスレオニンへの置換である。
いくつかの実施形態では、少なくとも1つのアミノ酸置換は、荷電側鎖を有するアミノ酸のグリシンへの置換である。
いくつかの実施形態では、少なくとも1つのアミノ酸置換は、アミノ酸のアラニンへの置換である。
いくつかの実施形態では、少なくとも1つのアミノ酸の置換または欠失は、少なくとも2個の残基の置換または欠失、例えば少なくとも3個の残基の置換または欠失、例えば少なくとも4個の残基の置換または欠失、例えば少なくとも5個の残基の置換または欠失、例えば少なくとも6個の残基の置換または欠失、例えば少なくとも7個の残基の置換または欠失、例えば少なくとも8個の残基の置換または欠失、例えば少なくとも9個の残基の置換または欠失、例えば少なくとも10個の残基の置換または欠失、例えば少なくとも11個の残基の置換または欠失、例えば少なくとも12個の残基の置換または欠失、例えば少なくとも13個の残基の置換または欠失、たとえば少なくとも14個の残基の置換または欠失、例えば少なくとも15個の残基の置換または欠失、例えば少なくとも20個の残基の置換または欠失、例えば少なくとも25個の残基の置換または欠失、例えば少なくとも30個の残基の置換または欠失、例えば少なくとも35個の残基の置換または欠失、または例えば少なくとも40個の残基の置換または欠失である。
いくつかの実施形態では、少なくとも1つのアミノ酸置換は、NPIDドメインにある。いくつかの実施形態では、少なくとも1つのアミノ酸置換は、TPIDドメインにある。いくつかの実施形態では、少なくとも1つのアミノ酸置換は、RBDドメインにある。いくつかの実施形態では、少なくとも1つのアミノ酸置換は、RuvC-Iドメインにある。いくつかの実施形態では、少なくとも1つのアミノ酸置換は、RuvC-IIドメインにある。
いくつかの実施形態では、RuvC-I及び/またはRuvC-IIドメインにおけるアミノ酸置換は、グルタミン酸またはアスパラギン酸ではないアミノ酸の置換である。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のK26に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のK30に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のF54に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のK55に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のQ123に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のQ197に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のL355に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のT360に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のD413に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のE618に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のK625に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のF626に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のG630に対応する位置に置換を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のR643に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3(CasΦ-3)または配列番号31のR643に対応する位置に置換を含む。いくつかの実施形態では、前記置換はR643E置換である。前記R643E置換は、酵素の非特異的エンドヌクレアーゼ活性を抑制し得る。したがって、いくつかの実施形態では、特異的な二本鎖DNA切断活性は変化しないのに対して、Cas12jエンドヌクレアーゼの任意の非特異的な一本鎖DNA切断活性は抑制される。いくつかの実施形態では、前記置換はR643A置換である。前記R643A置換は、酵素の非特異的エンドヌクレアーゼ活性を抑制し得る。したがって、いくつかの実施形態では、特異的な二本鎖DNA切断活性は変化しないのに対して、Cas12jエンドヌクレアーゼの任意の非特異的な一本鎖DNA切断活性は抑制される。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のP673に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のW675に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のT676に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のC680に対応する位置に置換を含む。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のC683に対応する位置に置換を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3(CasΦ-3)または配列番号31のR691に対応する位置に置換を含む。いくつかの実施形態では、前記置換はR691A置換である。前記R691A置換は、酵素のエンドヌクレアーゼ活性を抑制し得る。いくつかの実施形態では、Cas12jエンドヌクレアーゼの特異的な二本鎖DNA切断活性、及び/または、任意の非特異的な一本鎖DNA切断活性は抑制される。したがって、いくつかの実施形態では、Cas12jエンドヌクレアーゼの特異的な二本鎖DNA切断活性、及び/または、任意の非特異的な一本鎖DNA切断活性が完全に失われる。いくつかの実施形態では、前記R691A置換は、CasΦ-1(配列番号1)におけるR651A置換に対応する。いくつかの実施形態では、前記R691A置換は、CasΦ-2(配列番号2)におけるR678A置換に対応する。
いくつかの実施形態では、変異体Φ12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のC698に対応する位置に置換を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のC701に対応する位置に置換を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、配列番号3または配列番号31のD708に対応する位置に置換を含む。
いくつかの実施形態では、変異体エンドヌクレアーゼはタンパク質タグにコンジュゲートしている。
いくつかの実施形態では、タンパク質タグは、FLAGタグである。いくつかの実施形態では、タンパク質タグは、HAタグである。いくつかの実施形態では、タンパク質タグは、ビオチンである。いくつかの実施形態では、タンパク質タグは、キチン結合タンパク質(CBP)である。いくつかの実施形態では、タンパク質タグは、マルトース結合タンパク質(MBP)である。いくつかの実施形態では、タンパク質タグは、ストレプタグである。いくつかの実施形態では、タンパク質タグは、グルタチオン-S-トランスフェラーゼ(GST)である。いくつかの実施形態では、タンパク質タグは、ポリ(His)タグである。いくつかの実施形態では、タンパク質タグは、酵素、例えばペルオキシダーゼ、ビオチンリガーゼ、または塩基編集酵素、例えばシチジンまたはアデニンデアミナーゼである。いくつかの実施形態では、タンパク質タグは、転写因子などの転写調節因子である。いくつかの実施形態では、タンパク質タグは、GFP、Venusまたはフルオレセインのような蛍光タグである。
コンジュゲートされたタンパク質タグを含む本明細書に開示される変異体は、塩基編集、エピジェネティックリモデリング、転写調節、クロマチン構造の調査、及び標的核酸配列の検出及び定量化などの様々な用途において有用である。
本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、野生型エンドヌクレアーゼと比較して1つ以上の改善及び/または変更された活性を有し得る。
いくつかの実施形態では、前記変更及び/または改善された活性は、標的核酸配列の二本鎖切断に関連する酵素活性における改善及び/または変更である。いくつかの実施形態では、前記変更及び/または改善された活性は、標的核酸配列の一本鎖切断に関連する酵素活性における改善及び/または変更である。いくつかの実施形態では、前記変更及び/または改善された活性は、標的核酸認識に関連する酵素活性の改善及び/または変更である。
いくつかの実施形態では、変更された活性は、二本鎖核酸切断を誘導することから一本鎖核酸切断(ニッカーゼ活性)を誘導することへの切断活性の変更である。したがって、いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、ニッキングエンドヌクレアーゼである。
いくつかの実施形態では、前記変更及び/または改善された活性は、速度を高めた触媒作用である。
いくつかの実施形態では、前記変更された活性は、変更されたプロトスペーサー隣接モチーフ(PAM)配列認識である。変更されたPAM配列認識は、未改変酵素では標的化できない核配列の標的化を可能にする。
いくつかの実施形態では、前記変更及び/または改善された活性は、突出核酸二本鎖切断の結果として生じるオーバーハングの長さを変更する。いくつかの実施形態では、前記変更及び/または改善された活性は、したがって、変更された切断パターンである。
いくつかの実施形態では、前記変更及び/または改善された活性は、オフターゲット切断の頻度の減少である。
いくつかの実施形態では、前記変更された活性は、ヌクレアーゼ活性の阻害である。したがって、いくつかの実施形態では、Cas12j変異体は、ヌクレアーゼ死Cas12jタンパク質である。前記変異体は、例えば、本明細書でさらに詳述される特定の核酸配列を検出するのに有用であり得る。
いくつかの実施形態では、前記変更及び/または改善された活性は、標的核酸配列に対する特異性の増加である。
Cas12jエンドヌクレアーゼの最適化された活性のための緩衝液
本発明者らは、Cas12jエンドヌクレアーゼは、エンドヌクレアーゼが特定の金属イオンを含む媒体に含まれている場合、1つ以上の変更及び/または改善された活性、例えば、触媒作用の改善された速度または変更された核酸切断パターンを有することを見出した。
本発明者らは、Cas12jエンドヌクレアーゼは、エンドヌクレアーゼが特定の金属イオンを含む媒体に含まれている場合、1つ以上の変更及び/または改善された活性、例えば、触媒作用の改善された速度または変更された核酸切断パターンを有することを見出した。
いくつかの実施形態では、エンドヌクレアーゼは、2価のニッケル(Ni2+)、2価のマンガン(Mn2+)及び/または2価の銅(Co2+)を含む媒体に含まれる。
いくつかの実施形態では、エンドヌクレアーゼは、2価のニッケル(Ni2+)を含む媒体に含まれる。いくつかの実施形態では、Ni2+の濃度は、少なくとも0.2mM、例えば少なくとも0.5mM、例えば少なくとも1mM、例えば少なくとも2mM、例えば少なくとも3mM、例えば少なくとも4mM、例えば少なくとも5mM、例えば0.2mM~5mMである。
いくつかの実施形態では、エンドヌクレアーゼは、2価のマンガン(Mn2+)を含む媒体に含まれる。いくつかの実施形態では、Mn2+の濃度は、少なくとも0.2mM、例えば少なくとも0.5mM、例えば少なくとも1mM、例えば少なくとも2mM、例えば少なくとも3mM、例えば少なくとも4mM、例えば少なくとも5mM、例えば0.2mM~5mMである。
いくつかの実施形態では、エンドヌクレアーゼは、2価の銅(Co2+)を含む媒体に含まれる。いくつかの実施形態では、Co2+の濃度は、少なくとも0.2mM、例えば少なくとも0.5mM、例えば少なくとも1mM、例えば少なくとも2mM、例えば少なくとも3mM、例えば少なくとも4mM、例えば少なくとも5mM、例えば0.2mM~5mMである。
変異体Cas12jエンドヌクレアーゼをコードするポリヌクレオチド及び組換えベクター
本明細書に開示される変異体Cas12jエンドヌクレアーゼをコードするポリヌクレオチド、核酸配列、及びベクターもまた提供される。当業者は、このような所望のCas12j変異体をコードする核酸配列及び/またはベクターを設計する方法を知っている。
本明細書に開示される変異体Cas12jエンドヌクレアーゼをコードするポリヌクレオチド、核酸配列、及びベクターもまた提供される。当業者は、このような所望のCas12j変異体をコードする核酸配列及び/またはベクターを設計する方法を知っている。
いくつかの態様において、本明細書に記載される変異体Cas12jエンドヌクレアーゼまたはそのオルソログをコードするポリヌクレオチドが提供される。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、配列番号11、配列番号12(CasΦ-2)、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号32及び配列番号33からなる群から選択される核酸配列に対して少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなるポリヌクレオチドにコードされる。
いくつかの実施形態では、ポリヌクレオチドは、宿主細胞内の発現のためにコドン最適化される。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-1エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号11と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-2エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号12と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-3エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号13と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化されたC末端切断CasΦ-3エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号32と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-4エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号14と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-5エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号15と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-6エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号16と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-7エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号17と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-8エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号18と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-9エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号19と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、細菌細胞での発現に最適化された変異体CasΦ-10エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号20と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-1エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号21と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-2エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号22と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-3エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号23と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化されたC末端切断CasΦ-3エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号33と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-4エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号24と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-5エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号25と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-6エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号26と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-7エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号27と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-8エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号28と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-9エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号29と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの実施形態では、ポリヌクレオチドは、ヒト細胞での発現に最適化された変異体CasΦ-10エンドヌクレアーゼをコードし、前記ポリヌクレオチドは、配列番号30と、少なくとも80%の配列同一性、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%、例えば少なくとも96%、例えば少なくとも97%、例えば少なくとも98%、例えば少なくとも99%の配列同一性を有する核酸配列を含むか、またはそれからなる。
いくつかの態様では、本開示は、上記で定義される変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドまたは核酸配列を含む組換えベクターを提供する。いくつかの実施形態では、前記ポリヌクレオチドまたは核酸配列は、プロモーターに作動可能に結合している。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの実施形態では、組換えベクターは、プロモーターに作動可能に連結されたガイドRNA(crRNA)をコードする核酸配列をさらに含み、crRNAは、コードされたCas12jエンドヌクレアーゼと、標的核酸にハイブリダイズするのに十分な塩基対を有する核酸の断片を結合する。crRNAは、本明細書の以下の「ガイドRNA(crRNA)」の節にさらに記載される。
変異体Cas12jエンドヌクレアーゼの発現のための細胞及び系
本明細書ではさらに、本明細書に開示される変異体Cas12jエンドヌクレアーゼの発現のための細胞及び系を提供する。
本明細書ではさらに、本明細書に開示される変異体Cas12jエンドヌクレアーゼの発現のための細胞及び系を提供する。
したがって、いくつかの態様では、本開示は、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログ、本明細書に開示されるポリヌクレオチド、または本明細書に開示される組換えベクターを発現することができる細胞を提供する。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの態様では、本開示は、crRNA-Cas12j複合体の発現のための系を提供し、前記系は、
a.変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードする本明細書に開示されるポリヌクレオチド、またはポリヌクレオチドを含む本明細書に開示される組換えベクター、及び
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター
を含む。
a.変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードする本明細書に開示されるポリヌクレオチド、またはポリヌクレオチドを含む本明細書に開示される組換えベクター、及び
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター
を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの実施形態では、系は、上記a.及びb.のポリヌクレオチドまたは組換えベクターの発現のための細胞をさらに含む。
本明細書に開示される変異体Cas12jエンドヌクレアーゼをコードするポリヌクレオチドまたは組換えベクターの発現に適した宿主細胞は、当業者に知られている。いくつかの実施形態では、細胞は、原核生物細胞または真核細胞である。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、Escherichia coli細胞から発現される。これは、当該技術分野で周知のように、例えば、本明細書で上記の所望の変異体Cas12jエンドヌクレアーゼまたはオルソログをコードする核酸配列を含むベクターを、E.coli細胞に、例えば電気穿孔または化学形質転換によって導入することによって行うことができる。タンパク質は、当該技術分野で周知のように単離及び/または精製され得る。
ガイドRNA(crRNA)
エンドヌクレアーゼとして機能するために、crRNA-Cas12j複合体は、Cas12jエフェクタータンパク質だけではなく、切断される標的核酸の認識を担うガイドRNA(crRNA)も必要とする。
エンドヌクレアーゼとして機能するために、crRNA-Cas12j複合体は、Cas12jエフェクタータンパク質だけではなく、切断される標的核酸の認識を担うガイドRNA(crRNA)も必要とする。
crRNAは、定常領域及び可変領域を含むかまたはこれらからなる。定常領域は、23~25ヌクレオチドからなり、所与の生物由来のすべての複合体について一定である。crRNA-Cas12j複合体の最適な活性のためには、使用されるCas12jヌクレアーゼまたはそのオルソログに特異的な定常領域に基づいてcrRNAを設計することが重要であり得る。
いくつかの実施形態では、定常領域はCasΦ-1に特異的であり、配列番号34に定義される配列を有する。いくつかの実施形態では、定常領域はCasΦ-2に特異的であり、配列番号35に定義される配列を有する。いくつかの実施形態では、定常領域はCasΦ-3に特異的であり、配列番号36に定義される配列を有する。
可変領域は、9~20ヌクレオチド、例えば9、10、11、12、13、14、15、16、17、18、19または20ヌクレオチドからなる。可変領域は、標的認識を担うと考えられるcrRNAの領域である。したがって、可変領域の配列を改変することは、crRNA-Cas12j複合体が異なる標的核酸を特異的に切断できるようにするために利用することができる。定常領域とは対照的に、可変領域は特定のCas12jエンドヌクレアーゼに特異的ではない。
したがって、いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と9個のヌクレオチドの可変領域からなり、crRNAは、32ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と10個のヌクレオチドの可変領域からなり、crRNAは、33ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と11個のヌクレオチドの可変領域からなり、crRNAは、34ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と12個のヌクレオチドの可変領域からなり、crRNAは、35ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と13個のヌクレオチドの可変領域からなり、crRNAは、36ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と14個のヌクレオチドの可変領域からなり、crRNAは、37ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と15個のヌクレオチドの可変領域からなり、crRNAは、38ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と16個のヌクレオチドの可変領域からなり、crRNAは、39ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と17個のヌクレオチドの可変領域からなり、crRNAは、40ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と18個のヌクレオチドの可変領域からなり、crRNAは、41ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と19個のヌクレオチドの可変領域からなり、crRNAは、42ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、23個のヌクレオチドの定常領域と20個のヌクレオチドの可変領域からなり、crRNAは、43ヌクレオチドの全長を有する。
いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と9個のヌクレオチドの可変領域からなり、crRNAは、33ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と10個のヌクレオチドの可変領域からなり、crRNAは、34ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と11個のヌクレオチドの可変領域からなり、crRNAは、35ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と12個のヌクレオチドの可変領域からなり、crRNAは、36ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と13個のヌクレオチドの可変領域からなり、crRNAは、37ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と14個のヌクレオチドの可変領域からなり、crRNAは、38ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と15個のヌクレオチドの可変領域からなり、crRNAは、39ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と16個のヌクレオチドの可変領域からなり、crRNAは、40ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と17個のヌクレオチドの可変領域からなり、crRNAは、41ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と18個のヌクレオチドの可変領域からなり、crRNAは、42ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と19個のヌクレオチドの可変領域からなり、crRNAは、43ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、24個のヌクレオチドの定常領域と20個のヌクレオチドの可変領域からなり、crRNAは、44ヌクレオチドの全長を有する。
いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と9個のヌクレオチドの可変領域からなり、crRNAは、34ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と10個のヌクレオチドの可変領域からなり、crRNAは、35ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と11個のヌクレオチドの可変領域からなり、crRNAは、36ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と12個のヌクレオチドの可変領域からなり、crRNAは、37ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と13個のヌクレオチドの可変領域からなり、crRNAは、38ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と14個のヌクレオチドの可変領域からなり、crRNAは、39ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と15個のヌクレオチドの可変領域からなり、crRNAは、40ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と16個のヌクレオチドの可変領域からなり、crRNAは、41ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と17個のヌクレオチドの可変領域からなり、crRNAは、42ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と18個のヌクレオチドの可変領域からなり、crRNAは、43ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と19個のヌクレオチドの可変領域からなり、crRNAは、44ヌクレオチドの全長を有する。いくつかの実施形態では、crRNAは、25個のヌクレオチドの定常領域と20個のヌクレオチドの可変領域からなり、crRNAは、45ヌクレオチドの全長を有する。
当業者は、所望の標的核酸に結合することができる可変領域を設計することに困難はないであろう。可変領域は、標的核酸の逆相補体となる配列を有する。
したがって、crRNAは、23、24または25ヌクレオチドの定常領域、及び9~20ヌクレオチドで構成される可変領域からなり、例えば前記crRNAは、少なくとも32ヌクレオチド長、33ヌクレオチド長、34ヌクレオチド長、35ヌクレオチド長、36ヌクレオチド長、37ヌクレオチド長、38ヌクレオチド長、39ヌクレオチド長、40ヌクレオチド長、41ヌクレオチド長、42ヌクレオチド長、43ヌクレオチド長、44ヌクレオチド長、または45ヌクレオチド長である。
crRNA-Cas12j複合体の標的核酸への認識及び結合は、crRNAの標的核酸への結合に依存する。これは、標的核酸中のPAM(プロトスペーサー隣接モチーフ)配列の存在に依存する。いくつかの実施形態では、crRNAは、5’末端にPAM配列を含む標的核酸配列に結合するように設計されている。いくつかの実施形態では、PAM配列は、配列5’-TTN-3’を含むか、または配列5’-TTN-3’からなる。crRNAは、好ましくは、PAM自体にハイブリダイズしない。
ガイドRNA配列が設計されると、ガイドRNAは既知の方法によって合成することができる。例えば、標的部位の逆相補配列に対応するDNAオリゴヌクレオチドを、オリゴヌクレオチドを販売する会社から注文してもよい。これらのオリゴヌクレオチドは、24塩基長のT7プライミング配列を含み得る。これらのDNA二重鎖は、次いで、T7 RNAポリメラーゼを用いて行われる転写反応における鋳型として使用することができる。例えば、反応は、37℃で少なくとも1時間のインキュベーションで構成され得る。反応は、2倍停止溶液、例えば、50mM EDTA、20mM Tris-HCl pH8.0及び8M尿素を使用して停止させてもよい。RNAは、LiCl沈殿などの当該技術分野で周知の方法で精製され得る。
ゲノム編集のためのcrRNA-Cas12jエンドヌクレアーゼ複合体の使用
本開示の変異体Cas12jエンドヌクレアーゼは、ゲノム編集に有利に使用され得る。
本開示の変異体Cas12jエンドヌクレアーゼは、ゲノム編集に有利に使用され得る。
いくつかの態様において、本開示は、第1の標的核酸に核酸切断を導入する方法を提供し、この方法は、
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.のcrRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させ、ここで、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されているものか、または本明細書に開示されるポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得るステップ、及び
c.crRNA及び変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップ、
を含み、それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する。
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.のcrRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させ、ここで、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されているものか、または本明細書に開示されるポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得るステップ、及び
c.crRNA及び変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップ、
を含み、それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの実施形態では、本明細書に開示される上記の方法のステップb.及びc.が同時に行われる。いくつかの実施形態では、本明細書に開示される上記の方法のステップb.及びc.が順次に行われる。
いくつかの態様では、本開示は、第1の標的核酸に核酸切断を導入するための方法におけるcrRNA-Cas12j複合体の使用を提供し、
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、Cas12jエンドヌクレアーゼまたはそのオルソログは、請求項1~54のいずれか1項に記載され、
b.crRNA-Cas12j複合体を、第1の標的核酸と接触させ、
それにより、第1の標的核酸配列において核酸切断が生成される。
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、Cas12jエンドヌクレアーゼまたはそのオルソログは、請求項1~54のいずれか1項に記載され、
b.crRNA-Cas12j複合体を、第1の標的核酸と接触させ、
それにより、第1の標的核酸配列において核酸切断が生成される。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
いくつかの実施形態では、第1の標的核酸及び第2の標的核酸はDNAである。いくつかの実施形態では、第1の標的核酸及び第2の標的核酸はRNAである。いくつかの実施形態では、第1の標的核酸はDNAであり、第2の標的核酸はRNAである。いくつかの実施形態では、第1の標的核酸はRNAであり、第2の標的核酸はDNAである。
いくつかの実施形態では、第1及び/または第2の標的核酸は二本鎖DNAである。いくつかの実施形態では、第1及び第2の標的核酸は、互いの相補体である。いくつかの実施形態では、第1及び第2の標的核酸は、二本鎖核酸の同じストレッチである。
いくつかの実施形態では、核酸切断は、一本鎖切断である。いくつかの実施形態では、一本鎖核酸切断は、第1の標的配列中にある。いくつかの実施形態では、一本鎖核酸切断は、第2の標的配列中にある。いくつかの実施形態では、一本鎖核酸切断は、第1の標的核酸の特異的認識ヌクレオチド配列において生成される。
いくつかの実施形態では、核酸切断は、ニ本鎖切断である。この場合、第1及び第2の標的配列の双方で核酸切断が生成される。いくつかの実施形態では、二本鎖切断は、突出二本鎖切断である。いくつかの実施形態では、二本鎖切断は、平滑ニ本鎖切断である。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されるポリヌクレオチドまたはベクターによってコードされる。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されるものである。いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、本明細書に開示されるものであり、本明細書に開示されるポリヌクレオチドまたはベクターによってコードされる。
いくつかの実施形態では、第2の標的核酸は、少なくとも15連続ヌクレオチド、例えば少なくとも16連続ヌクレオチド、例えば少なくとも17連続ヌクレオチド、例えば少なくとも18連続ヌクレオチド、例えば少なくとも19連続ヌクレオチド、例えば少なくとも20連続ヌクレオチド、例えば少なくとも21連続ヌクレオチド、例えば少なくとも22連続ヌクレオチド、例えば少なくとも23連続ヌクレオチド、例えば少なくとも24連続ヌクレオチド、例えば少なくとも25連続ヌクレオチド、例えば少なくとも26連続ヌクレオチド、例えば少なくとも27連続ヌクレオチドの配列を含む認識配列を含むか、またはそれからなるが、但し、5’末端にある3個の核酸は、PAM配列からなることを条件とする。
いくつかの実施形態では、第1の標的核酸は、ゲノムDNAである。いくつかの実施形態では、第1の標的核酸は、クロマチンである。いくつかの実施形態では、第1の標的核酸は、ヌクレオソームである。いくつかの実施形態では、第1の標的核酸は、プラスミドDNAである。いくつかの実施形態では、第1の標的核酸は、メチル化DNAである。いくつかの実施形態では、第1の標的核酸は、合成DNAである。いくつかの実施形態では、第1の標的核酸は、DNA断片である。いくつかの実施形態では、第2の標的核酸は、ゲノムDNAである。いくつかの実施形態では、第2の標的核酸は、クロマチンである。いくつかの実施形態では、第2の標的核酸は、ヌクレオソームである。いくつかの実施形態では、第2の標的核酸は、プラスミドDNAである。いくつかの実施形態では、第2の標的核酸は、メチル化DNAである。いくつかの実施形態では、第2の標的核酸は、合成DNAである。いくつかの実施形態では、第2の標的核酸は、DNA断片である。
いくつかの実施形態では、本明細書に開示される方法は、エクスビボで実施される。いくつかの実施形態では、本明細書に開示される方法は、インビトロで細胞において実施される。
本明細書で上述されるように、第1及び第2の標的核酸は、二本鎖核酸の同じストレッチであり得る。この場合、二本鎖切断を、第1及び第2の標的核酸の両方に導入することができる。
したがって、いくつかの態様では、哺乳動物細胞内で第2の標的核酸に部位特異的な二本鎖切断を導入するインビトロ方法が提供され、方法は、哺乳動物細胞内に、crRNA-Cas12j複合体を導入することを含み、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはオルソログであり、crRNAは、第2の標的核酸に特異的である。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
標的DNA配列を検出及び/または定量化するためのcrRNA-Cas12jエンドヌクレアーゼ複合体の使用
本開示の変異体Cas12jエンドヌクレアーゼのいくつかは、crRNA-Cas12j複合体のcrRNAによってハイブリダイズされない第1の標的配列にのみ一本鎖切断を導入することができる。したがって、いくつかの実施形態では、crRNA-Cas12j複合体のcrRNAが第2の標的配列を認識してハイブリダイズすると、前記複合体の変異体Cas12jのニッカーゼ活性が活性化され、これが第1の標的配列の部位に1つ以上の一本鎖切断を導入する。さらに、第2の標的核酸は、Cas12jエンドヌクレアーゼによって切断されることはなく、したがってより長期にわたって活性状態を維持し、場合により1つより多くの第1の標的配列を切断することになる。第1の標的配列が、前記第1の標的配列の切断時にシグナルが放出されるように標識されている場合には、本記載の方法は第2の標的配列の検出を可能にする。
本開示の変異体Cas12jエンドヌクレアーゼのいくつかは、crRNA-Cas12j複合体のcrRNAによってハイブリダイズされない第1の標的配列にのみ一本鎖切断を導入することができる。したがって、いくつかの実施形態では、crRNA-Cas12j複合体のcrRNAが第2の標的配列を認識してハイブリダイズすると、前記複合体の変異体Cas12jのニッカーゼ活性が活性化され、これが第1の標的配列の部位に1つ以上の一本鎖切断を導入する。さらに、第2の標的核酸は、Cas12jエンドヌクレアーゼによって切断されることはなく、したがってより長期にわたって活性状態を維持し、場合により1つより多くの第1の標的配列を切断することになる。第1の標的配列が、前記第1の標的配列の切断時にシグナルが放出されるように標識されている場合には、本記載の方法は第2の標的配列の検出を可能にする。
したがって、これらの変異体Cas12jエンドヌクレアーゼは、crRNA-Cas12j複合体中にある場合、提供された標識された第1の標的配列を用いて、第2の標的配列を検出及び定量化するために使用することができる。
いくつかの実施形態では、第2の標的核酸は、目的の標的核酸である。
したがって、いくつかの態様では、サンプル中の第2の標的核酸を検出する方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.crRNA-Cas12j複合体及びssDNAを、少なくとも1つの第2の標的核酸を含むサンプルと接触させること、及び
d.蛍光体からの蛍光シグナルを検出することによりssDNAの切断を検出すること
を含み、それによりサンプル中の第2の標的核酸の存在を検出し、ステップc.は、任意にcrRNA-Cas12j複合体の活性化を含む。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.crRNA-Cas12j複合体及びssDNAを、少なくとも1つの第2の標的核酸を含むサンプルと接触させること、及び
d.蛍光体からの蛍光シグナルを検出することによりssDNAの切断を検出すること
を含み、それによりサンプル中の第2の標的核酸の存在を検出し、ステップc.は、任意にcrRNA-Cas12j複合体の活性化を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
ステップc.において、crRNA-Cas12j複合体及びssDNAを少なくとも1つの第2の標的核酸と接触させ、crRNAと第2の標的核酸、例えば一本鎖または二本鎖の標的DNAとの認識及び結合により、crRNA-Cas12j複合体を活性化させ、次いで、ssDNAの一本鎖切断、例えば切断を導入することができる。
したがって、工程c.は、crRNA-Cas12j複合体の活性化を含み得る。
方法はさらに、第2の標的核酸のレベル及び/または濃度を決定するステップを含み得、第2の標的核酸のレベル及び/または濃度は、切断されたssDNAと相関している。
上記で説明したように、いくつかの実施形態では、本明細書に開示される変異体Cas12jエンドヌクレアーゼは、第2の標的核酸を切断せず、したがって、本明細書に記載された方法では標識ssDNAまたはその断片であり得る、第1の標的核酸配列において複数回の切断に十分であり得る期間、活性を維持することになる。crRNA-Cas12j複合体の第2の標的核酸へのハイブリダイゼーション後に、crRNA-Cas12j複合体によって切断される第1の標的核酸分子が多いほど、シグナルが高くなり、したがって方法の感度が高くなる。これは、開示された変異体Cas12jが他のCas12jエンドヌクレアーゼよりも有利な点である。
したがって、本明細書に開示される方法は高い感度を有し、ナノモル範囲以下の濃度で、例えばピコモル範囲以下の濃度で、例えばフェムトモル範囲以下の濃度で、第2の標的核酸の検出を可能にし得る。例えば、本明細書に開示される方法は、アトモル範囲以下の濃度で、第2の標的核酸の検出を可能にする。
いくつかの実施形態では、本明細書に開示される変異体Cas12jエンドヌクレアーゼは、第2の標的核酸を切断し、したがって、切断された第2の標的核酸が放出されるまで活性なままであるであろう。
ssDNAは、鎖に沿った任意の位置の少なくとも1つの塩基で標識され得る。例えば、ssDNAは、鎖に沿った任意の位置の1つの塩基で、例えば鎖に沿った任意の位置の少なくとも2つの塩基で、例えば鎖に沿った任意の位置の少なくとも3つの塩基で、例えば鎖に沿った任意の位置の少なくとも4つの塩基で標識されている。
ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む、少なくとも1つの相互作用標識のセットで標識され得る。
いくつかの実施形態では、少なくとも1つの色素は、蛍光体である。
したがって、本方法のステップd.におけるssDNAの切断は、ssDNAの切断から生じる蛍光シグナルを検出することを含む。
いくつかの実施形態では、少なくとも1つの蛍光体は、ブラックホールクエンチャー(BHQ)1、BHQ2及びBHQ3、Cosmic Quencher(例えば、Biosearch Technologies,Novato,USA)、Excellent Bioneer Quencher(EBQ)(例えば、Bioneer,Daejeon,Korea)またはこれらの組み合わせを含む群から選択される。
いくつかの実施形態では、少なくとも1つのクエンチャーは、ブラックホールクエンチャー(BHQ)1、BHQ2及びBHQ3(Biosearch Technologies,Novato,USA)からなる群から選択される。
本発明において有用であり得る蛍光体には、当該技術分野で既知の蛍光分子を含み得る。蛍光体の例:Cy2(商標)Cfflfi)、YO-PRn(商標)-1(509)、YDYO(商標)-1(509)、Calrein(517)、FITC(518)、FluorX(商標)(519)、Alexa(商標)(520)、Rhodamine 110(520)、Oregon Green(商標)500(522)、Oregon Green(商標)488(524)、RiboGreen(商標)(525)、Rhodamine Green(商標)(527)、Rhodamine 123(529)、Magnesium Green(商標)(531)、Calcium Green(商標)(533)、TO-PRO(商標)-I(533)、TOTOI(533)、JOE(548)、30 BODIPY530/550(550)、Dil(565)、BODIPY TMR(568)、BODIPY558/568(568)、BODIPY564/570(570)、Cy3(商標)(570)、Alexa(商標)546(570)、TRITC(572)、Magnesium Orange(商標)(575)、フィコエリトリンR&B(575)、Rhodamine Phalloidin(575)、Calcium Orange(商標)(576)、Pyronin Y(580)、Rhodamine B(580)、TAMRA(582)、Rhodamine Red(商標)(590)、Cy3.5(商標)(596)、ROX(608)、Calcium Crimson(商標)(615)、Alexa(商標)594 35(615)、Texas Red(615)、Nile Red(628)、YO-PRO(商標)-3(631)、YOYO(商標)-3(631)、RP3649PC00 phycocyanin(642)、C-Phycocyanin(648)、TO-PRO(商標)-3(660)、TOT03(660)、DiD DilC(5)(665)、Cy5(商標)(670)、Thiadicarbocyanine(671)、Cy5.5(694)、HEX(556)、TET(536)、Biosearch Blue(447)、CAL Fluor Gold 540(544)、CAL Fluor Orange 560(559)、CAL Fluor Red 590(591)、CAL Fluor Red 610(610)、CAL Fluor Red 635(637)、FAM(520)、6-Carboxyfluorescein(6-FAM)、Fluorescein(520)、Fluorescein-C3(520)、Pulsar 650(566)、Quasar 570(667)、Quasar 670(705)及びQuasar 705(610)。括弧内の数字は、ナノメートル単位の最大発光波長である。
広い波長範囲または特定の波長の蛍光をクエンチングすることができる非蛍光性の黒色クエンチャー分子が本発明において使用され得る。
蛍光体/クエンチャーの適切な対は当該技術分野で知られている。
本明細書で開示されるように、変異体Cas12jエンドヌクレアーゼは、蛍光タンパク質またはアフィニティタグなどのタンパク質タグをさらに含み得る。いくつかの実施形態では、変異体Cas12jのエンドヌクレアーゼ活性は抑制されており、したがって、第1または第2の標的核酸配列のいずれにも核酸切断は導入されない。これらの変異体は、標的核酸配列の検出及び/または定量化に特に有用である。
したがって、いくつかの態様では、サンプル中の第2の標的核酸を検出して、任意に定量化する方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.crRNAは、第2の標的核酸に特異的である、提供することと、
b.crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含むサンプルと接触させることと、
c.タンパク質標識、例えば蛍光シグナルを検出することにより、第2の標的核酸の存在を検出して、任意に定量化することと、を含む。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.crRNAは、第2の標的核酸に特異的である、提供することと、
b.crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含むサンプルと接触させることと、
c.タンパク質標識、例えば蛍光シグナルを検出することにより、第2の標的核酸の存在を検出して、任意に定量化することと、を含む。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
本明細書に開示される方法は、任意の核酸の存在及びレベルを検出するために使用することができ、したがって、サンプルは、核酸を含み、かつ適切に処理された(例えばプロテアーゼを排除するため)、任意のサンプルであり得る。サンプルは、DNA及び/またはRNAを含み得る。サンプルは、第2の標的核酸を含むと疑われるサンプルであり得る。サンプルは、原核細胞培養物または真核細胞培養物の培養抽出物、ヒトなどの哺乳動物の体液であり得る。
第2の標的核酸は、ウイルスゲノム、微生物ゲノム、がん遺伝子などの遺伝子、または病原体のゲノムの核酸断片であり得る。
いくつかの実施形態では、第2の標的核酸は、ヒト疾患に関連する核酸配列である。これは、ヒト疾患のバイオマーカーであってよく、例えば、特定の疾患と関連することが多い特定の変異または一塩基多型などである。
第2の標的核酸は、変異核酸配列、例えば一塩基多型(SNP)であってもよい。
サンプル中の第2の標的核酸を検出するための方法に使用される変異体Cas12jエンドヌクレアーゼは、本明細書に記載される変異体のいずれかであり得る。
疾患の診断のためのcrRNA-Cas12jエンドヌクレアーゼ複合体の使用
本開示はまた、増加/減少した遺伝子発現及び/または外因性遺伝物質の存在に関連するいずれかの疾患の診断方法に関する。
本開示はまた、増加/減少した遺伝子発現及び/または外因性遺伝物質の存在に関連するいずれかの疾患の診断方法に関する。
いくつかの態様では、対象における疾患を診断するためのインビトロ方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、第2の標的核酸は、疾患と相関する核酸断片であり、例えば、第2の標的核酸は、疾患のバイオマーカーであり、
それによって対象における疾患を診断する。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、第2の標的核酸は、疾患と相関する核酸断片であり、例えば、第2の標的核酸は、疾患のバイオマーカーであり、
それによって対象における疾患を診断する。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
対象における疾患の診断方法は、前記疾患を治療するステップを更に含み得る。例えば、本方法は、治療的に有効な薬剤を投与することにより前記疾患を治療することをさらに含み得る。
いくつかの実施形態では、疾患は、感染性疾患である。
したがって、いくつかの態様では、対象における感染性疾患を診断するためのインビトロ方法が提供され、方法は、
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、第2の標的核酸は、疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、それによって対象における感染性疾患を診断する。
a.crRNA-Cas12j複合体を提供することであって、Cas12jは、本明細書に開示される変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、crRNAは、第2の標的核酸に特異的である、提供すること、
b.標識ssDNAを提供することであって、ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、提供すること、
c.対象由来のサンプルを提供することであって、前記サンプルは、第2の標的核酸を含むか、または第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、第2の標的核酸は、疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、それによって対象における感染性疾患を診断する。
いくつかの実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、例えば変異体CasΦ-3、例えば変異体CasΦ-4、例えば変異体CasΦ-5、例えば変異体CasΦ-6、例えば変異体CasΦ-7、例えば変異体CasΦ-8、例えば変異体CasΦ-9、または例えば変異体CasΦ-10である。好ましい実施形態では、変異体Cas12jエンドヌクレアーゼは、変異体CasΦ-1、例えば変異体CasΦ-2、または例えば変異体CasΦ-3である。
相互作用標識は、例えば発光標識を含み得る。
いくつかの実施形態では、本方法は、前記感染性疾患を治療するステップをさらに含む。いくつかの実施形態では、本方法は、前記感染性疾患を、治療的に有効な化合物の投与により治療することをさらに含む。
対象における感染性疾患の診断方法は、前記第2の標的核酸のレベル及び/または濃度をカットオフ値と比較するステップをさらに含み得、前記カットオフ値は、前記感染性疾患を呈していない対象などの健常対象における前記第2の標的核酸の濃度範囲から決定され、
前記カットオフ値よりも大きいレベル及び/または濃度が、前記感染性疾患の存在を示す。
前記カットオフ値よりも大きいレベル及び/または濃度が、前記感染性疾患の存在を示す。
感染性疾患は、感染病原体、例えばウイルス、ウイロイド、プリオン、細菌、線虫、寄生性回虫、ぎょう虫、節足動物、真菌、白癬及び大寄生虫によって引き起こされるいずれかの疾患である。
したがって、第2の標的核酸は、ウイルス、ウイロイド、プリオン、細菌、線虫、寄生性回虫、ぎょう虫、節足動物、真菌、白癬及び大寄生虫からなる群から選択される感染病原体のゲノムまたはその断片であり得る。
本明細書に開示される方法は、ヒトにおける感染性疾患を診断するために使用され得る。
したがって、第2の標的核酸を含むサンプルは、人体から採取したサンプルによるものであり得る。例えば、サンプルは、血液、全血、血漿、血清、尿、唾液、涙液、脳脊髄液、及び精液からなる群から選択される人体液であり得る。
疾患の診断方法に使用される変異体Cas12jエンドヌクレアーゼは、本明細書に記載される変異体のいずれかであり得る。
実施例1-ミニRNAガイドエンドヌクレアーゼCRISPR-CasΦ3の構造
材料及び方法
プラスミド調製、タンパク質の発現及び精製
CasΦ3のcDNAを合成し、C末端ヘキサヒスチジン(His)タグを用いてpET-21ベクター(Genewiz)にクローニングした。CasΦ3変異体をIn-Fusionクローニングキット(Takara)を用いて生成した。CasΦ3-ΔCTを生成するために、残基M726の後にTEV切断部位(ENLYFQG)を生成した。Hisタグ付きCasΦ3を、E.coli BL21 pRARE細胞内のpET-21から発現させた。E.coli培養物を、34mg/lのクロラムフェニコール及び100mg/lのアンピシリンを含む液体Terrificブロス(TB)培地中で37℃で、600nmでの光学濃度が約0.8となるまで増殖させた。タンパク質の過剰発現は、16℃で16時間にわたり150nMのIPTGを用いて誘導した。細胞を遠心分離により回収し、溶解バッファー(50mM HEPES pH7.5、2M NaCl、5mM MgCl2、50mlあたり1錠のEDTAフリーComplete阻害剤カクテル(Roche)、50U/mlのベンゾナーゼ、1mg/mlのリゾチーム)に再懸濁させた。溶解は、1回の凍結-解凍サイクル及び超音波処理によって完了した。細胞抽出物を希釈して最終塩濃度を500mMとし、高速遠心分離(10,000×g、45分)して、可溶性画分を不溶性画分及び細胞破片から分離した。可溶性画分を、緩衝液IMAC-A(20mM HEPES pH7.5、500mM NaCl、20mMイミダゾール)で平衡化した5mlのHisTrap FF粗製カラム(Cytiva)に充填し、結合タンパク質を、緩衝液IMAC-B(20mM HEPES pH7.5、200mM KCl、500mMイミダゾール)でイミダゾール濃度を段階的に上昇することにより溶出した。CasΦ3タンパク質は、約150mMのイミダゾールで溶出した。CasΦ3-ΔCTの場合、タンパク質をTEV緩衝液(20mMのHEPES pH7.5、150mMのNaCl、1mMのEDTA、0.5mMのTCEP)中の0.3mgのTEVプロテアーゼで4℃で16時間インキュベートすることによってC末端セグメント(残基727~766)を切断した。CasΦ3を含む画分をプールし、濃縮し、さらにSEC緩衝液(20mMのHEPES pH7.5、500mMのKCl、0.5mMのTCEP)中で平衡化したHiLoad 16/600 Superdex 200カラム(Cytiva)を用いたサイズ排除クロマトグラフィー(SEC)によって精製した。純粋なタンパク質を含む画分をプールし、5~10g/Lに濃縮し、液体窒素中で急速冷凍し、-80℃で保管した。
材料及び方法
プラスミド調製、タンパク質の発現及び精製
CasΦ3のcDNAを合成し、C末端ヘキサヒスチジン(His)タグを用いてpET-21ベクター(Genewiz)にクローニングした。CasΦ3変異体をIn-Fusionクローニングキット(Takara)を用いて生成した。CasΦ3-ΔCTを生成するために、残基M726の後にTEV切断部位(ENLYFQG)を生成した。Hisタグ付きCasΦ3を、E.coli BL21 pRARE細胞内のpET-21から発現させた。E.coli培養物を、34mg/lのクロラムフェニコール及び100mg/lのアンピシリンを含む液体Terrificブロス(TB)培地中で37℃で、600nmでの光学濃度が約0.8となるまで増殖させた。タンパク質の過剰発現は、16℃で16時間にわたり150nMのIPTGを用いて誘導した。細胞を遠心分離により回収し、溶解バッファー(50mM HEPES pH7.5、2M NaCl、5mM MgCl2、50mlあたり1錠のEDTAフリーComplete阻害剤カクテル(Roche)、50U/mlのベンゾナーゼ、1mg/mlのリゾチーム)に再懸濁させた。溶解は、1回の凍結-解凍サイクル及び超音波処理によって完了した。細胞抽出物を希釈して最終塩濃度を500mMとし、高速遠心分離(10,000×g、45分)して、可溶性画分を不溶性画分及び細胞破片から分離した。可溶性画分を、緩衝液IMAC-A(20mM HEPES pH7.5、500mM NaCl、20mMイミダゾール)で平衡化した5mlのHisTrap FF粗製カラム(Cytiva)に充填し、結合タンパク質を、緩衝液IMAC-B(20mM HEPES pH7.5、200mM KCl、500mMイミダゾール)でイミダゾール濃度を段階的に上昇することにより溶出した。CasΦ3タンパク質は、約150mMのイミダゾールで溶出した。CasΦ3-ΔCTの場合、タンパク質をTEV緩衝液(20mMのHEPES pH7.5、150mMのNaCl、1mMのEDTA、0.5mMのTCEP)中の0.3mgのTEVプロテアーゼで4℃で16時間インキュベートすることによってC末端セグメント(残基727~766)を切断した。CasΦ3を含む画分をプールし、濃縮し、さらにSEC緩衝液(20mMのHEPES pH7.5、500mMのKCl、0.5mMのTCEP)中で平衡化したHiLoad 16/600 Superdex 200カラム(Cytiva)を用いたサイズ排除クロマトグラフィー(SEC)によって精製した。純粋なタンパク質を含む画分をプールし、5~10g/Lに濃縮し、液体窒素中で急速冷凍し、-80℃で保管した。
切断アッセイ
フルオレセイン(FAM)標識DNAオリゴヌクレオチド5’末端または3’末端、未標識DNA及びRNAオリゴヌクレオチドを、Integrated DNA technologies(IDT)から購入した。dsDNA基質は、ssDNAオリゴをアニーリング緩衝液(20mMのHEPESpH7.5、200mMのKCl)中で80μMの最終濃度に混合し、95℃で10分間変性し、サーマルサイクラー(Applied Biosystems)中で20分間かけて徐々に温度を4℃に下げることによって調製した。50μΜのCasΦ3と50μΜのCasΦ3成熟crRNA(IDT)とを等体積で混合し、CasΦ3のリボヌクレオタンパク質複合体(RNP)を形成した。
フルオレセイン(FAM)標識DNAオリゴヌクレオチド5’末端または3’末端、未標識DNA及びRNAオリゴヌクレオチドを、Integrated DNA technologies(IDT)から購入した。dsDNA基質は、ssDNAオリゴをアニーリング緩衝液(20mMのHEPESpH7.5、200mMのKCl)中で80μMの最終濃度に混合し、95℃で10分間変性し、サーマルサイクラー(Applied Biosystems)中で20分間かけて徐々に温度を4℃に下げることによって調製した。50μΜのCasΦ3と50μΜのCasΦ3成熟crRNA(IDT)とを等体積で混合し、CasΦ3のリボヌクレオタンパク質複合体(RNP)を形成した。
特異的dsDNA切断アッセイの場合、FAM標識dsDNA基質を、400nMで、切断緩衝液(20mMのHEPES pH7.5、160mMのKCl、10%のグリセロール、5mMのMgCl2)中の2μMのCasΦ3RNPとともに37℃で2時間インキュベートするか、または図面の説明で別様に述べるようにインキュベートした。イオン依存性アッセイの場合、5mMのMgCl2を、5mMのエチレンジアミン四酢酸(EDTA)、CaCl2、MnCl2、FeSO4、CoCl2、NiSO4、CuCl2、ZnSO4により置換した。DNA飽和実験の場合、1uΜのCasΦ3RNPを、0.5~8uΜの標識dsDNAとともに37°Cで2時間インキュベートした。非特異的トランスssDNA切断アッセイ(図5b~c、図6b~c)の場合、0.4μΜのFAM標識非特異的ssDNA基質(すなわち、crRNAに対して相補的ではない)を、上記2μMのCasΦ3RNPとともに、0.1μMの非標識活性剤ssDNAまたはdsDNA(crRNAに対して相補的)と一緒に、切断緩衝液中、37℃で1時間インキュベートした。等体積の停止緩衝液(8Mの尿素、pH8で100mMのEDTA)を加え、続いて95℃で5分間インキュベートすることにより、反応を停止させた。切断産生物を、製造業者の指示に従って実行される15%のNovex TBE-尿素ゲル(Invitrogen)で分解した。Odyssey FC Imaging System(Li-Cor)を使用して、ゲルをイメージングした。ゲル中のバンドの密度測定分析を、ImageJを使用して実施した。切断効率は、産物に対応するバンドの強度を特異的dsDNA切断アッセイの合計強度で除したものとして、または非特異的ssDNA分解アッセイの非切断産生物のシグナルの喪失として計算した。
Cryo-EMについてのサンプル調製
Cryo-EM試料の調製には、Mg2+の代わりに、より高い収率が得られるNi2+を触媒イオンとして使用した。CasΦ3RNPを、前述のように調製した。25nmolのRNP及び37nmolの非標識dsDNA基質を、DNA切断を可能にするために、25mlのMonoQ A緩衝液(20mM HEPES pH7.5、200mM KCl、1mM NiSO4、0.5mM TCEP)中で、20℃で2時間インキュベートした。この反応産生物を、MonoQ A緩衝液で平衡化したMonoQカラムに入れ、CasΦ3Rループ複合体を、MonoQ B緩衝液(20mM HEPES pH7.5、2M KCl、1mM NiSO4、0.5mM TCEP)を用いた塩勾配溶出によってRNP及び非結合DNA基質から分離した。CasΦ3Rループを、16~20%のMonoQ緩衝液B(約500mMのKCl)で溶出させた。Rループ複合体を、MonoQ A緩衝液で平衡化したSuperdex 200 Increase 10/300 GLカラム(Cytiva)を使用して、SECにより非結合DNAから更に精製した。複合体の分子量及びサンプルの均一性は、MonoQ A緩衝液中で希釈した10~20nMのタンパク質を用いて、Refeyn One質量光度計(Refeyn)を使用して推定した。新たに精製したCasΦ3Rループ複合体2.5μL(吸光度260nm、約1.6)をUltrAuFoil300メッシュR0.6/1.0ホリーグリッド(Quantifoil)に適用し、10mAで60秒間グロー放電し(Leica EM ACE200)、Vitrobot Mark IV(FEI、Thermo Fisher Scientific)を使用して以下の条件で液体エタンでプランジ凍結した(液体窒素液で予備冷却):ブロット時間3秒、湿度100%及び4℃。
Cryo-EM試料の調製には、Mg2+の代わりに、より高い収率が得られるNi2+を触媒イオンとして使用した。CasΦ3RNPを、前述のように調製した。25nmolのRNP及び37nmolの非標識dsDNA基質を、DNA切断を可能にするために、25mlのMonoQ A緩衝液(20mM HEPES pH7.5、200mM KCl、1mM NiSO4、0.5mM TCEP)中で、20℃で2時間インキュベートした。この反応産生物を、MonoQ A緩衝液で平衡化したMonoQカラムに入れ、CasΦ3Rループ複合体を、MonoQ B緩衝液(20mM HEPES pH7.5、2M KCl、1mM NiSO4、0.5mM TCEP)を用いた塩勾配溶出によってRNP及び非結合DNA基質から分離した。CasΦ3Rループを、16~20%のMonoQ緩衝液B(約500mMのKCl)で溶出させた。Rループ複合体を、MonoQ A緩衝液で平衡化したSuperdex 200 Increase 10/300 GLカラム(Cytiva)を使用して、SECにより非結合DNAから更に精製した。複合体の分子量及びサンプルの均一性は、MonoQ A緩衝液中で希釈した10~20nMのタンパク質を用いて、Refeyn One質量光度計(Refeyn)を使用して推定した。新たに精製したCasΦ3Rループ複合体2.5μL(吸光度260nm、約1.6)をUltrAuFoil300メッシュR0.6/1.0ホリーグリッド(Quantifoil)に適用し、10mAで60秒間グロー放電し(Leica EM ACE200)、Vitrobot Mark IV(FEI、Thermo Fisher Scientific)を使用して以下の条件で液体エタンでプランジ凍結した(液体窒素液で予備冷却):ブロット時間3秒、湿度100%及び4℃。
CryoEMデータの収集及び処理
動画は、TFS Falcon IIIカメラを備えたTitan Krios G3 Cryo-TEMで、計数モードで300keVで作動させて収集した。露出1.05e/Å2/フレーム、40フレーム、したがって最終線量42e/Å2。キャリブレーションしたピクセルサイズは0.832Å/pxであった。すべての動画は、WARP 1.0.9を使用して前処理した(Tegunov et al.,2019)。グローバルモーションについては20の時間分解能で、ローカルモーションについては5×5の空間分解能で動き補正を行った。-500Å2のB係数で重み付けされた45~3Åの範囲の動きを考察した。5Å未満のフレーム内モーションを示す顕微鏡写真のみを使用した。CTF推定を、35~4Åの範囲内の5×5パッチを用いて実施した。0.0~5.0μmの間に適切なデフォーカス量を有し、5Åより良好な分解能を有する顕微鏡写真を選択した。粒子ピッキングについては、顕微鏡写真をマスクし、再訓練されたBoxNet深層畳み込みニューラルネットワークを使用して粒子をピッキングした。これにより、4,393顕微鏡写真から3,504,102個の粒子が得られた。粒子を、256×256のボックスサイズ及び0.832のピクセルサイズで抽出し、反転させ、正規化し、その後、2D分類のためにRELION 3.1(Zivanov et al.,2018)にインポートした。選択された2Dクラスを、cryoSPARC 3.1.0(Punjani et al.,2017)にインポートし、4つの初期クラスに3D分類した。最大個数の粒子を有する体積を、初期2.61Åの分解能マップまで3Dオートリファインした。この体積内で使用した粒子の立体構造の不均一性を、3D変動解析ジョブにより調査し、不均質リファインメントのための入力として、2つのさらに広い体積を使用した。最良の体積における粒子の3D変動性をさらに分析し、続いて、4つのクラスによる不均質リファインメントを行った。得られた4つのボリュームを不均一にリファインして、2.7~3.3Åの分解能でマップを得た。2つの最良のマップ(2.7Å及び2.9Åの分解能)は、本文で考察されている複合体の異なる立体構造状態を表している。鮮明化及び局所的分解マップを、PHENIXで計算し(Liebschner et al.,2019)、3D-FSCサーバで方位分解能異方性解析を実行した(Tan et al.,2017)。
動画は、TFS Falcon IIIカメラを備えたTitan Krios G3 Cryo-TEMで、計数モードで300keVで作動させて収集した。露出1.05e/Å2/フレーム、40フレーム、したがって最終線量42e/Å2。キャリブレーションしたピクセルサイズは0.832Å/pxであった。すべての動画は、WARP 1.0.9を使用して前処理した(Tegunov et al.,2019)。グローバルモーションについては20の時間分解能で、ローカルモーションについては5×5の空間分解能で動き補正を行った。-500Å2のB係数で重み付けされた45~3Åの範囲の動きを考察した。5Å未満のフレーム内モーションを示す顕微鏡写真のみを使用した。CTF推定を、35~4Åの範囲内の5×5パッチを用いて実施した。0.0~5.0μmの間に適切なデフォーカス量を有し、5Åより良好な分解能を有する顕微鏡写真を選択した。粒子ピッキングについては、顕微鏡写真をマスクし、再訓練されたBoxNet深層畳み込みニューラルネットワークを使用して粒子をピッキングした。これにより、4,393顕微鏡写真から3,504,102個の粒子が得られた。粒子を、256×256のボックスサイズ及び0.832のピクセルサイズで抽出し、反転させ、正規化し、その後、2D分類のためにRELION 3.1(Zivanov et al.,2018)にインポートした。選択された2Dクラスを、cryoSPARC 3.1.0(Punjani et al.,2017)にインポートし、4つの初期クラスに3D分類した。最大個数の粒子を有する体積を、初期2.61Åの分解能マップまで3Dオートリファインした。この体積内で使用した粒子の立体構造の不均一性を、3D変動解析ジョブにより調査し、不均質リファインメントのための入力として、2つのさらに広い体積を使用した。最良の体積における粒子の3D変動性をさらに分析し、続いて、4つのクラスによる不均質リファインメントを行った。得られた4つのボリュームを不均一にリファインして、2.7~3.3Åの分解能でマップを得た。2つの最良のマップ(2.7Å及び2.9Åの分解能)は、本文で考察されている複合体の異なる立体構造状態を表している。鮮明化及び局所的分解マップを、PHENIXで計算し(Liebschner et al.,2019)、3D-FSCサーバで方位分解能異方性解析を実行した(Tan et al.,2017)。
原子モデルの構築及び改良
完全なDNA及びRNA配列ならびにタンパク質配列の約50%を含む初期モデルを、PHENIXに実装されたmap-to-modelを使用して非経験的に構築した(Liebschner et al.,2019)。COOT(Emsley&Cowtan,2004)を使用して、タンパク質断片を接続、伸長及び補正し、タンパク質配列の約70%をカバーするモデルを生成した。モデルの残りは、CCP-EMで実装されたBuccaneerを使用して自動構築し(Burnley et al.,2017)、その後、COOTで補正した。最終的なモデルは、phenix.real_space_refine及びCOOTにおける手動の検査及び補正を用いて、数回微調整を行った後に得られた。最終的なモデルは、タンパク質配列の92%をカバーし、主に、構造化されていないと予測されるC末端セグメントを欠いている。マップ及び分子モデルイメージは、ChimeraX(Goddard et al.,2018)を使用して作成した。
完全なDNA及びRNA配列ならびにタンパク質配列の約50%を含む初期モデルを、PHENIXに実装されたmap-to-modelを使用して非経験的に構築した(Liebschner et al.,2019)。COOT(Emsley&Cowtan,2004)を使用して、タンパク質断片を接続、伸長及び補正し、タンパク質配列の約70%をカバーするモデルを生成した。モデルの残りは、CCP-EMで実装されたBuccaneerを使用して自動構築し(Burnley et al.,2017)、その後、COOTで補正した。最終的なモデルは、phenix.real_space_refine及びCOOTにおける手動の検査及び補正を用いて、数回微調整を行った後に得られた。最終的なモデルは、タンパク質配列の92%をカバーし、主に、構造化されていないと予測されるC末端セグメントを欠いている。マップ及び分子モデルイメージは、ChimeraX(Goddard et al.,2018)を使用して作成した。
結果
CasΦ3/Rループ構造の決定
本発明者らは、機能性CasΦ3-crRNA複合体を再構成して特徴付け(図5)、cryo-EMにより標的dsDNAを切断した後に酵素の構造を決定した(図1)。不均質リファインメントにより、複合体のいくつかの立体構造を得た。主要なクラスは、2.7Åの分解能でマップを得て、これを使用してCasΦ3/R-ループ構造のモデルを構築した。第二の主要なクラスで観察された高い柔軟性は、完全なモデルを構築することを妨げたが、柔軟性領域及び複合体の立体構造の不均一性を明らかにした。CasΦ3/Rループ構造は、基質切断後のエンドヌクレアーゼ産生物複合体のスナップショット(図1c~e)を表し、PAM認識、標的DNAの巻き戻し及び切断のための重要な残基を明らかにし、それによって、この新規なファミリーのゲノム編集ツールを再設計するための詳細な原子情報を提供する。
CasΦ3/Rループ構造の決定
本発明者らは、機能性CasΦ3-crRNA複合体を再構成して特徴付け(図5)、cryo-EMにより標的dsDNAを切断した後に酵素の構造を決定した(図1)。不均質リファインメントにより、複合体のいくつかの立体構造を得た。主要なクラスは、2.7Åの分解能でマップを得て、これを使用してCasΦ3/R-ループ構造のモデルを構築した。第二の主要なクラスで観察された高い柔軟性は、完全なモデルを構築することを妨げたが、柔軟性領域及び複合体の立体構造の不均一性を明らかにした。CasΦ3/Rループ構造は、基質切断後のエンドヌクレアーゼ産生物複合体のスナップショット(図1c~e)を表し、PAM認識、標的DNAの巻き戻し及び切断のための重要な残基を明らかにし、それによって、この新規なファミリーのゲノム編集ツールを再設計するための詳細な原子情報を提供する。
CasΦ3生化学的特性評価
CasΦ3は、異なるホスホジエステル結合で特定の標的DNAを切断することにより、9~11ヌクレオチドのオーバーハングを生成する(図1b、図5a)。その特異的切断の副次的な効果は、標的dsDNAとして、またはcrRNAに相補的なssDNA活性剤として提供されるT鎖によって引き起こされる、無差別なssDNA分解の解放である(Pausch et al.,2020)(図5b~c)。いずれの場合も、12-nt~13-ntの最小crRNA-DNA二本鎖が構築される際に、CasΦ3の無差別な切断が引き起こされる。この構造は、18-ntより長い活性剤で観察される違いは、触媒部位における非特異的ssDNA基質の侵入を阻害するRループの存在に起因し得ることを示唆している(図1d~e、図5d)。エンドヌクレアーゼの活性を、Mg2+及び他の二価金属イオンの存在下で試験した(図5e)。このアッセイにより、CasΦ3がMn2+、Fe2+、Co2+及びNi2+の存在下で触媒作用をサポートし、異なる切断パターンをもたらすことが明らかになった。CasΦ3の切断活性は、エンドヌクレアーゼ/標的DNAの比がほぼ等モルであったときに飽和しており、他のRNAガイドヌクレアーゼにおいて観察されるように(Stella et al.,2017a及びSternberg et al.,2014)、PAM近位切断産物から酵素の解離が遅いことを示唆している(図5f)。さらに、構造中に可視化されていないC末端の最後の39残基を除去することで、CasΦ3活性が低下した。しかしながら、酵素は十分な触媒活性を保持しており、CasΦファミリーメンバーをさらに小型化できることを示唆していた(図5g~h)。
CasΦ3は、異なるホスホジエステル結合で特定の標的DNAを切断することにより、9~11ヌクレオチドのオーバーハングを生成する(図1b、図5a)。その特異的切断の副次的な効果は、標的dsDNAとして、またはcrRNAに相補的なssDNA活性剤として提供されるT鎖によって引き起こされる、無差別なssDNA分解の解放である(Pausch et al.,2020)(図5b~c)。いずれの場合も、12-nt~13-ntの最小crRNA-DNA二本鎖が構築される際に、CasΦ3の無差別な切断が引き起こされる。この構造は、18-ntより長い活性剤で観察される違いは、触媒部位における非特異的ssDNA基質の侵入を阻害するRループの存在に起因し得ることを示唆している(図1d~e、図5d)。エンドヌクレアーゼの活性を、Mg2+及び他の二価金属イオンの存在下で試験した(図5e)。このアッセイにより、CasΦ3がMn2+、Fe2+、Co2+及びNi2+の存在下で触媒作用をサポートし、異なる切断パターンをもたらすことが明らかになった。CasΦ3の切断活性は、エンドヌクレアーゼ/標的DNAの比がほぼ等モルであったときに飽和しており、他のRNAガイドヌクレアーゼにおいて観察されるように(Stella et al.,2017a及びSternberg et al.,2014)、PAM近位切断産物から酵素の解離が遅いことを示唆している(図5f)。さらに、構造中に可視化されていないC末端の最後の39残基を除去することで、CasΦ3活性が低下した。しかしながら、酵素は十分な触媒活性を保持しており、CasΦファミリーメンバーをさらに小型化できることを示唆していた(図5g~h)。
CasΦ3/Rループ複合体の全体構造
CasΦ3/Rループ複合体は、他のV型エフェクター複合体で観察される古典的な2ローブ構造を提示しない。Rループは、crRNA/DNAハイブリッドによるT字形を示し、crRNAハンドルが水平及び垂直のバーを形成し、タンパク質ドメインがこれらの核酸に巻き付いている(図1d~e)。crRNAのハンドルは、C-1及びU-18と相互作用する厳密に保存されたR338、ならびにG-17とA-2の間の隣接する非ワトソン-クリック型塩基対相互作用によって安定化される。ヘテロ二本鎖のPAM遠位領域及びPAM近位領域は、ポリペプチドのN末端及びC末端領域(図1d~e)によって認識され、これらは、15残基ループによって接続されている(380~395)。各領域は、タンパク質のサイズの約半分を含み、それらはT字型集合体上のcrRNAの長いハンドルによって分離されている。N末端領域は、T鎖及びNT鎖のPAM相互作用ドメイン(TPID、NPID)及びRNAハンドル結合ドメイン(RBD)を含み、C末端は、触媒RuvC及び停止(STP)ドメインからなる(図1a)。RuvCドメインは、STPドメインの挿入によりRuvC-I及びRuvC-IIに分割され、これは、2つの長いブリッジヘリックスであるBH-I及びBH-IIにより触媒ドメインに接続されている。さらに、RuvC-IIサブドメインは、CasΦ7を除くCasΦファミリーの全ての既知のメンバーに保存されている特徴的な挿入を提示する(図1)。このN末端及びC末端の物理的分離もまた機能的であり、RNPアセンブリ、PAM認識及び巻き戻しは、N末端領域に存在し、crRNA/T鎖ハイブリッドアセンブリ、及び標的DNAの触媒作用は、ポリペプチドのC末端部によって行われる。したがって、PAM結合部位は、RuvCヌクレアーゼ活性部位から約55Å離れている。
CasΦ3/Rループ複合体は、他のV型エフェクター複合体で観察される古典的な2ローブ構造を提示しない。Rループは、crRNA/DNAハイブリッドによるT字形を示し、crRNAハンドルが水平及び垂直のバーを形成し、タンパク質ドメインがこれらの核酸に巻き付いている(図1d~e)。crRNAのハンドルは、C-1及びU-18と相互作用する厳密に保存されたR338、ならびにG-17とA-2の間の隣接する非ワトソン-クリック型塩基対相互作用によって安定化される。ヘテロ二本鎖のPAM遠位領域及びPAM近位領域は、ポリペプチドのN末端及びC末端領域(図1d~e)によって認識され、これらは、15残基ループによって接続されている(380~395)。各領域は、タンパク質のサイズの約半分を含み、それらはT字型集合体上のcrRNAの長いハンドルによって分離されている。N末端領域は、T鎖及びNT鎖のPAM相互作用ドメイン(TPID、NPID)及びRNAハンドル結合ドメイン(RBD)を含み、C末端は、触媒RuvC及び停止(STP)ドメインからなる(図1a)。RuvCドメインは、STPドメインの挿入によりRuvC-I及びRuvC-IIに分割され、これは、2つの長いブリッジヘリックスであるBH-I及びBH-IIにより触媒ドメインに接続されている。さらに、RuvC-IIサブドメインは、CasΦ7を除くCasΦファミリーの全ての既知のメンバーに保存されている特徴的な挿入を提示する(図1)。このN末端及びC末端の物理的分離もまた機能的であり、RNPアセンブリ、PAM認識及び巻き戻しは、N末端領域に存在し、crRNA/T鎖ハイブリッドアセンブリ、及び標的DNAの触媒作用は、ポリペプチドのC末端部によって行われる。したがって、PAM結合部位は、RuvCヌクレアーゼ活性部位から約55Å離れている。
標的DNA切断により、crRNAにハイブリダイズしたT鎖との三本鎖Rループが得られ(図1b、d)、解離されたPAM NT鎖は、RuvC触媒ポケットに向けられる(図2a)。PAMの-1~-2上流のNT鎖ヌクレオチドは密集状態で構築されたが、NT鎖の遠位端での高い柔軟性により、Cas9(Jiang et al.,2016)及びCas12a(Stella et al.,2017)について示すようにヌクレオチドの残りの可視化が妨げられた。しかしながら、NT鎖の骨格は、cryoEMマップ中で低輪郭レベルで観察され、RuvC触媒ポケットへのDNAがたどる経路を示唆している(図2a)。興味深いことに、プリンとしてモデル化された2つのヌクレオチドが、ホスホジエステル加水分解の副生成物として、Ni2+と複合したRuvCポケット内で観察された(図1c~e、2a)。これらのヌクレオチドがどの鎖に属するかを決定するために、種々の標識標的DNAの切断後に結合アッセイを行い、これらのヌクレオチドがNT鎖に由来することを明らかにした。
PAM認識
PAM認識は、CRISPR-CasヌクレアーゼによるDNA標的化の重要な特徴であり、これは切断前の標的DNAの識別、鎖分離、及びcrRNA標的DNAヘテロ二本鎖形成のための前提条件であるからである(Anders et al.,2014)。CasΦ3は、NT鎖における5’-TTN-3’PAM配列を認識することが報告されている(Pausch et al.,2020)。本発明者らの構造は、CasΦ3におけるPAM認識が、TPIDドメイン及びNPIDドメインによる両方の鎖における相互作用の組み合わせによって達成されることを示している(図2b)。NPIDのヘリックスa1(S21~A34)の正に帯電した側をdsDNA長手軸に対して45°の角度で副溝に挿入することで、dsDNAの巻き戻しを容易にする。2つの保存されたリジン、K26及びK30は、NT鎖と相互作用する。K30は、dT+2と特異的に接触するが、K26はdsDNA内に配置してワトソン-クリック塩基カップリングを分裂し、NT鎖を変位させ、分離を促進させる(図2b~c)。PAM認識切断の反対側で、TPID中のQ123は、T鎖中のdA-3、dA-2及びNT鎖中のdT+3との極性相互作用の入り組んだネットワークを構築する(図2b)。隣接するG198アミドは、Q123のカルボニルに接触し、これらの塩基との接触に有利な立体構造で側鎖を固定する。さらに、Q197の側鎖は、Q123と相互作用し、dA-3と水素結合する。
PAM認識は、CRISPR-CasヌクレアーゼによるDNA標的化の重要な特徴であり、これは切断前の標的DNAの識別、鎖分離、及びcrRNA標的DNAヘテロ二本鎖形成のための前提条件であるからである(Anders et al.,2014)。CasΦ3は、NT鎖における5’-TTN-3’PAM配列を認識することが報告されている(Pausch et al.,2020)。本発明者らの構造は、CasΦ3におけるPAM認識が、TPIDドメイン及びNPIDドメインによる両方の鎖における相互作用の組み合わせによって達成されることを示している(図2b)。NPIDのヘリックスa1(S21~A34)の正に帯電した側をdsDNA長手軸に対して45°の角度で副溝に挿入することで、dsDNAの巻き戻しを容易にする。2つの保存されたリジン、K26及びK30は、NT鎖と相互作用する。K30は、dT+2と特異的に接触するが、K26はdsDNA内に配置してワトソン-クリック塩基カップリングを分裂し、NT鎖を変位させ、分離を促進させる(図2b~c)。PAM認識切断の反対側で、TPID中のQ123は、T鎖中のdA-3、dA-2及びNT鎖中のdT+3との極性相互作用の入り組んだネットワークを構築する(図2b)。隣接するG198アミドは、Q123のカルボニルに接触し、これらの塩基との接触に有利な立体構造で側鎖を固定する。さらに、Q197の側鎖は、Q123と相互作用し、dA-3と水素結合する。
Q123A及びQ197Aの変異は約90%の活性低下を示す一方、K30A変異は切断を約55%低減する。この3つの変異の活性はQ123A/Q197A変異と類似しており、K30A変異の追加は更なる減少を示さないことから、PAM認識におけるグルタミンの非常に重要な役割を示している(図2d~e)。K26A変異活性は影響を受けないことから、a1ヘリックスの挿入はdsDNAの開裂に十分であることを示唆している。PAM認識に関与するすべての変異体は、dsDNA標的の切断パターンを変化させない(図2d~e)。野生型及び変異体の双方とも、異なるPAM配列を有する標的dsDNA、またはPAMの不存在において標的dsDNAを切断せず、Q123A、Q197A及びK30Aによって形成されるPAM相互作用ネットワークの選択性を明確にした(図6a)。さらに、非特異的ssDNA触媒作用も、PAMを含むdsDNAの存在下で完全に活性化されることが観察され、したがって、PAM認識の後にcrRNA/DNAハイブリッドアセンブリが触媒作用を活性化することを示唆している(図6b)。最後に、T鎖中のPAM相補性塩基の役割を評価するために、種々のPAM配列を有するT鎖を模倣するssDNA活性剤を使用してCasΦ3の非特異的活性を誘発した。アッセイは、PAM相補性3’-AAG-5’配列及びPAMなしの活性剤が、ホスホジエステル加水分解を完全に放出し、一方、他のPAMは、異なるレベルに活性化を促進したことを示した。この実験は、適切なハイブリッドの集成体により触媒活性が発揮される一方で、crRNAと部分的にハイブリダイズする領域を含む活性剤ではより低い切断が示されることを示唆する(図6b)。
まとめると、本発明者らの分析により、標的DNAの主溝のPAMと相互作用する、十分に保存されたQ123残基及びQ197残基が、認識において不可欠な役割を果たすことが示唆される。CasΦヌクレアーゼのPAM領域における直接的な塩基の読み出しは、TPID及びNPIDと標的DNAの両鎖との相互作用を組み合わせる。しかしながら、TPIDとT鎖との相互作用は、PAM識別に重要な役割を果たしていると考えられる。他のCRISPR-Casヌクレアーゼは、NT鎖と優先的に相互作用することによりPAMスキャニングを実行することから、これは、CasΦファミリーの特異な特性である(Jiang et al.,2017及びStella et al.,2017b)17,18。
標的DNA巻き戻し
PAM、TPID、NPID及びRBDドメインのb1、b6、及びb7鎖からなる逆平行bシートの上流に第1の非結合塩基対が重なることで空洞が形成され、そこで巻き戻し及び最初のcrRNA/T鎖ハイブリダイゼーションが起こる(図2c)。この空洞は、C末端領域上でBH-IヘリックスとRuvCドメインによって挟まれている。十分に保存されたF54、K55、P56、P57、P363、T360、G361、D362及びV364は、酸性残基と疎水性残基とを組み合わせて空洞を構築し、T鎖及びcrRNAのシードにおいてdT+1及びA+1のワトソン-クリック塩基対形成を促進する(図2c)。さらに、dG-1の骨格リン酸基は、T360、K55の側鎖、及びY376の主鎖によって認識される。この相互作用により、リン酸基の回転(図2c)が生じ、Cas9複合体(Jiang et al.,2015)及びCas12a複合体(Stella et al.,2017a,Stella et al.,2018,Swarts and Jinek,2019,Swarts et al.,2017及びYamano et al.,2016)において観察されるようにcrRNAにおけるdT+1とA+1との間の塩基対形成が促進される。隣接するK377A変異は、約20%の活性の低下をもたらしたが、T360A及びK55Aの変異は、50%及び60%の減少を示し、リン酸反転及びハイブリッド形成のためのこれらの残基の重要性を強調した(図2d~e)。TPID中の長ヘリックスa7はcrRNA/T鎖ハイブリッドをBH-Iヘリックス及びIIヘリックスならびにRuvC挿入によって形成される「ネスト」へと導き、このハイブリッドをNT鎖から切り離し、標的DNAが再アニーリングすることを防ぐ。ハイブリッドが置かれている領域は、RuvC触媒ドメイン及びSTPドメインに隣接しており、これは球状船首(vessel bulb bow)としてcrRNA/T鎖ハイブリッドを分裂させる(図3a)。b11及びb12によって形成される逆平行bシートは、ワトソン-クリック塩基カップリングをdG-17:C+17対以降で分裂させ、その結果、スペーサー長の効率を試験する切断実験と一致するように、ハイブリッドの長さを17ヌクレオチドに制限する(Pausch et al.,2020)。b11中のF538の芳香環はハイブリッド開裂を開始させる(図3a)。crRNAの3’-リン酸はドメインの裏側にガイドされ、そこでC+17及びU+18は、塩基性(R535、R547)と疎水性残基(M500、L555)との組み合わせによって収容され、T鎖の5’-リン酸は、RuvC触媒ポケットが位置するタンパク質の反対側に誘導される。
PAM、TPID、NPID及びRBDドメインのb1、b6、及びb7鎖からなる逆平行bシートの上流に第1の非結合塩基対が重なることで空洞が形成され、そこで巻き戻し及び最初のcrRNA/T鎖ハイブリダイゼーションが起こる(図2c)。この空洞は、C末端領域上でBH-IヘリックスとRuvCドメインによって挟まれている。十分に保存されたF54、K55、P56、P57、P363、T360、G361、D362及びV364は、酸性残基と疎水性残基とを組み合わせて空洞を構築し、T鎖及びcrRNAのシードにおいてdT+1及びA+1のワトソン-クリック塩基対形成を促進する(図2c)。さらに、dG-1の骨格リン酸基は、T360、K55の側鎖、及びY376の主鎖によって認識される。この相互作用により、リン酸基の回転(図2c)が生じ、Cas9複合体(Jiang et al.,2015)及びCas12a複合体(Stella et al.,2017a,Stella et al.,2018,Swarts and Jinek,2019,Swarts et al.,2017及びYamano et al.,2016)において観察されるようにcrRNAにおけるdT+1とA+1との間の塩基対形成が促進される。隣接するK377A変異は、約20%の活性の低下をもたらしたが、T360A及びK55Aの変異は、50%及び60%の減少を示し、リン酸反転及びハイブリッド形成のためのこれらの残基の重要性を強調した(図2d~e)。TPID中の長ヘリックスa7はcrRNA/T鎖ハイブリッドをBH-Iヘリックス及びIIヘリックスならびにRuvC挿入によって形成される「ネスト」へと導き、このハイブリッドをNT鎖から切り離し、標的DNAが再アニーリングすることを防ぐ。ハイブリッドが置かれている領域は、RuvC触媒ドメイン及びSTPドメインに隣接しており、これは球状船首(vessel bulb bow)としてcrRNA/T鎖ハイブリッドを分裂させる(図3a)。b11及びb12によって形成される逆平行bシートは、ワトソン-クリック塩基カップリングをdG-17:C+17対以降で分裂させ、その結果、スペーサー長の効率を試験する切断実験と一致するように、ハイブリッドの長さを17ヌクレオチドに制限する(Pausch et al.,2020)。b11中のF538の芳香環はハイブリッド開裂を開始させる(図3a)。crRNAの3’-リン酸はドメインの裏側にガイドされ、そこでC+17及びU+18は、塩基性(R535、R547)と疎水性残基(M500、L555)との組み合わせによって収容され、T鎖の5’-リン酸は、RuvC触媒ポケットが位置するタンパク質の反対側に誘導される。
触媒活性化
RuvC挿入は、ハイブリッドのcrRNA鎖に沿って走り、U+9からG+13までのそのリン酸骨格と複数の接触を作り、挿入の先端の折り返しを疎水性相互作用によりSTPドメインの裏側に固定する(図3b)。この配置及び活性アッセイ(図5b~c、図6c~d)は、crRNA/DNAハイブリッドのアセンブリは、活性ポケットをssDNA基質に利用可能にすることで触媒作用を活性化するRuvC挿入の立体構造変化を引き起こすことができることを示唆する。異なる長さの活性剤を使用するssDNA基質の非特異的切断のモニタリング(図5b~c)からは、活性剤の長さが12-nt以上のcrRNA/DNAハイブリッドの形成を可能にする場合にCasΦ3の非特異的活性が完全に放出されることが示されており、触媒作用を活性化するために一定のハイブリッドの長さが必要であるという考えを支持している。保存されたG630及びR643は、G+12のリン酸と極性の相互作用のネットワークを配置するため、重要な残基であり、これにより、挿入先端の保存されたW636、F639及びF640残基によって構成される疎水性「プラグ」を結合する接続の特別な配置が生じる(図3a~b)。本発明者らは、ハイブリッドの集成体は、A490、W510、M513で構成されるSTPドメインの裂け目においてプラグによって固定されたRuvC挿入の観察された立体構造を促進すると仮定している(図3b)。ハイブリッドによるこの立体構造の安定化は、STPドメインを触媒部位に引き寄せ、適切な5’~3’極性を有する活性部位にT鎖を配置するであろう。疎水性プラグ及びSTPの裂け目の残基における変異によりCasΦ3が不溶化し、当該CasΦファミリーにおけるこの保存された相互作用の重要性が強調された。
RuvC挿入は、ハイブリッドのcrRNA鎖に沿って走り、U+9からG+13までのそのリン酸骨格と複数の接触を作り、挿入の先端の折り返しを疎水性相互作用によりSTPドメインの裏側に固定する(図3b)。この配置及び活性アッセイ(図5b~c、図6c~d)は、crRNA/DNAハイブリッドのアセンブリは、活性ポケットをssDNA基質に利用可能にすることで触媒作用を活性化するRuvC挿入の立体構造変化を引き起こすことができることを示唆する。異なる長さの活性剤を使用するssDNA基質の非特異的切断のモニタリング(図5b~c)からは、活性剤の長さが12-nt以上のcrRNA/DNAハイブリッドの形成を可能にする場合にCasΦ3の非特異的活性が完全に放出されることが示されており、触媒作用を活性化するために一定のハイブリッドの長さが必要であるという考えを支持している。保存されたG630及びR643は、G+12のリン酸と極性の相互作用のネットワークを配置するため、重要な残基であり、これにより、挿入先端の保存されたW636、F639及びF640残基によって構成される疎水性「プラグ」を結合する接続の特別な配置が生じる(図3a~b)。本発明者らは、ハイブリッドの集成体は、A490、W510、M513で構成されるSTPドメインの裂け目においてプラグによって固定されたRuvC挿入の観察された立体構造を促進すると仮定している(図3b)。ハイブリッドによるこの立体構造の安定化は、STPドメインを触媒部位に引き寄せ、適切な5’~3’極性を有する活性部位にT鎖を配置するであろう。疎水性プラグ及びSTPの裂け目の残基における変異によりCasΦ3が不溶化し、当該CasΦファミリーにおけるこの保存された相互作用の重要性が強調された。
活性化仮説を試験するために、G630及びR643における置換を分析した。G630A変異は、その主鎖を介した極性ネットワークに対するG630の寄与と一致して、約10%のわずかな活性の減少を示した(図3c~d)。しかしながら、G630Vは大幅な減少を示し、嵩高な側鎖がリン酸との相互作用に影響を与えていることを示唆し、crRNA/DNAアセンブリのモニタリングにおける保存されたG630の重要な役割を支持している。興味深いことに、逆極性変異体R643Eは、標的DNAの最小の切断減少を示したが(図3c~d)、その無差別なssDNA分解活性は、G630Vと同様に、約100%の減少を示し(図6c~d)、それにより、RuvC挿入における置換がCas12jファミリーの切断を改変できることが示された。
さらに、すべてのPAM及び巻き戻し変異体は、PAMを欠くssDNA活性剤を使用して同じアッセイを実施した場合に完全に無差別なssDNA活性を示す。この活性剤は、認識及び巻き戻しをスキップし、したがってcrRNAとハイブリダイズして活性を惹起する。しかしながら、PAMが標的dsDNA中に存在する場合、変異体のPAM認識及び巻き戻しがそれらの特異的dsDNA切断活性と一致して損なわれているため、変異体は最小の活性を示した(図2d~e)。PAM及び巻き戻し変異体は、ssDNAで活性化されると認識及び巻き戻しをスキップし、したがってcrRNAとハイブリダイズし、ヌクレアーゼ活性を惹起することから、これらの結果は、提案されたモデルを支持している。
したがって、標的dsDNAの存在下では、PAM認識、DNA巻き戻し、及び活性化はリンクしているが、適切なssDNAが提供されれば、触媒活性化からPAM認識を省略することができる。さらに、RuvC挿入における変異は、酵素活性に影響を与えるだけでなく、G630V変異体及びR643E変異体の場合に観察されるように、それらの変異は、特異的な標的dsDNA切断から無差別ssDNA活性を解離させ、そのパターンを変化させることができる。
DNA切断
CasΦヌクレアーゼのRuvCドメインは、特徴的なRNaseH折り畳みを呈するレトロウイルスインテグラーゼスーパーファミリーに属する。CasΦ3触媒ポケット内のNT鎖からの2つのヌクレオチドは、保存されたE618及びD413に関連している(図3e)。密集状態のため塩基が識別できず、dAまたはdGのいずれかがモデル化された。本発明者らは、切断産生物中のヌクレオチド数及びその位置のプリンリッチ配列に応じて、5’~3’極性及びNi2+イオン(方法)を有する2つのグアニンを構築した(図1b、3e)。したがって、DSB生成後のDNAの長さによって、切断したNT鎖が触媒中心に会合したままであることが可能となり、先に観察したようにT鎖の侵入を妨げて、その触媒作用を遅延させることができる(Pausch et al.,2020)(図5g)。Znとしてモデル化された第二の金属原子は、Cas12f(Takeda et al.,2021)及びCas12g(Li et al.,2021)と同様に、4つの保存されたシステインによって配位している。RuvCのこの部分には、ジヌクレオチドから3.7Å離れた保存されたR691が含まれる。この残基により、触媒ポケット内でのホスホジエステル骨格の配置を容易にすることができる(図3e)。しかしながら、この領域の残りの部分は、らせん状の調節蓋モチーフを含まない異なる構造を示すため、Cas12f及びCas12gの標的核酸結合(TNB)ドメイン(Cas12a及びCas12bのNucドメインならびにCas12eの標的鎖ローディングドメインとしても知られる)とは異なる。
CasΦヌクレアーゼのRuvCドメインは、特徴的なRNaseH折り畳みを呈するレトロウイルスインテグラーゼスーパーファミリーに属する。CasΦ3触媒ポケット内のNT鎖からの2つのヌクレオチドは、保存されたE618及びD413に関連している(図3e)。密集状態のため塩基が識別できず、dAまたはdGのいずれかがモデル化された。本発明者らは、切断産生物中のヌクレオチド数及びその位置のプリンリッチ配列に応じて、5’~3’極性及びNi2+イオン(方法)を有する2つのグアニンを構築した(図1b、3e)。したがって、DSB生成後のDNAの長さによって、切断したNT鎖が触媒中心に会合したままであることが可能となり、先に観察したようにT鎖の侵入を妨げて、その触媒作用を遅延させることができる(Pausch et al.,2020)(図5g)。Znとしてモデル化された第二の金属原子は、Cas12f(Takeda et al.,2021)及びCas12g(Li et al.,2021)と同様に、4つの保存されたシステインによって配位している。RuvCのこの部分には、ジヌクレオチドから3.7Å離れた保存されたR691が含まれる。この残基により、触媒ポケット内でのホスホジエステル骨格の配置を容易にすることができる(図3e)。しかしながら、この領域の残りの部分は、らせん状の調節蓋モチーフを含まない異なる構造を示すため、Cas12f及びCas12gの標的核酸結合(TNB)ドメイン(Cas12a及びCas12bのNucドメインならびにCas12eの標的鎖ローディングドメインとしても知られる)とは異なる。
RuvCドメインは、5’-リン酸化切断を導入し、3つの酸性アミノ酸(Nowotny,2009)及び2つの二価金属イオン(Steitz&Steitz,1993)を含む。E618及びD413カルボキシレートアミノ酸は重要な触媒残基であり、E618A及びD413A変異はCasΦ3活性を消失させる(図3c~e)。両残基は、求核試薬を活性化し、遷移状態及び脱離基を安定化する金属イオンを配位させることが予測される。本発明者らの構造では、E618及びD413は、金属及びジヌクレオチドの骨格を配位する(図3e)。第3の触媒残基として作用すると予測されるD708の側鎖は、電子照射により観察されない(Bartesaghi et al.,2014)。この活性部位残基は、他のRuvCドメインの他のカルボキシレートよりも重大ではないことが示されており、このアミノ酸のAsnまたはHisへの置換は、切断の部分的な損失のみを引き起こす(Chapados et al.,2001及びKanaya,1998)。しかしながら、D708A変異は活性を抑制する(図3c~e)。DALIを使用した、CRISPR-Casタンパク質を含む他のRuvCドメインとの構造比較は、2つの金属イオン機構を支持する。興味深いことに、CasΦファミリー内でこのドメインにおける配列相同性が高いことから、CasΦ3がそれ自体のcrRNAを切断できず、それによってプロセシングできない理由を説明することができるCasΦ1及びCasΦ2のRuvCとの違いは、観察することができない。
参考文献
Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM-dependent target DNA recognition by the Cas9 endonuclease.Nature513,569-573,doi:10.1038/nature13579(2014).
Bartesaghi,A.,Matthies,D.,Banerjee,S.,Merk,A.&Subramaniam,S.Structure of β-galactosidase at 3.2-Åresolution obtained by cryo-electron microscopy.Proceedings of the National Academy of Sciences111,11709,doi:10.1073/pnas.1402809111(2014).
Burnley,T.,Palmer,C.M.&Winn,M.Recent developments in the CCP-EM software suite.Acta Crystallographica Section D73,469-477,doi:doi:10.1107/S2059798317007859(2017).
Chapados,B.R.et al.Structural biochemistry of a type 2 RNase H:RNA primer recognition and removal during DNA replication.J Mol Biol307,541-556,doi:10.1006/jmbi.2001.4494(2001).
Emsley,P.&Cowtan,K.Coot:model-building tools for molecular graphics.Acta Crystallogr D Biol Crystallogr60,2126-2132,doi:10.1107/S0907444904019158(2004).
Goddard,T.D.et al.UCSF ChimeraX:Meeting modern challenges in visualization and analysis.Protein Sci27,14-25,doi:10.1002/pro.3235(2018).
Jiang,F.,Zhou,K.,Ma,L.,Gressel,S.&Doudna,J.A.STRUCTURAL BIOLOGY.A Cas9-guide RNA complex preorganized for target DNA recognition.Science348,1477-1481,doi:10.1126/science.aab1452(2015).
Jiang,F.et al.Structures of a CRISPR-Cas9 R-loop complex primed for DNA cleavage.Science351,867-871,doi:10.1126/science.aad8282(2016).
Jiang,F.&Doudna,J.A.CRISPR-Cas9 Structures and Mechanisms.Annual Review of Biophysics46,505-529,doi:10.1146/annurev-biophys-062215-010822(2017).
Kanaya,S.Enzymatic activity and protein stability of E.coli ribonuclease HI.Ribonucleases H.,1-38(1998).
Li,Z.,Zhang,H.,Xiao,R.,Han,R.&Chang,L.Cryo-EM structure of the RNA-guided ribonuclease Cas12g.Nature Chemical Biology17,387-393,doi:10.1038/s41589-020-00721-2(2021).
Liebschner,D.et al.Macromolecular structure determination using X-rays,neutrons and electrons:recent developments in Phenix.Acta Crystallogr D Struct Biol75,861-877,doi:10.1107/S2059798319011471(2019).
Makarova,K.S.,and Koonin,E.V.(2015).Annotation and Classification of CRISPR-Cas Systems.Methods Mol Biol1311,47-75.
Nowotny,M.Retroviral integrase superfamily:the structural perspective.EMBO Rep10,144-151,doi:10.1038/embor.2008.256(2009).
Pausch,P.et al.CRISPR-CasPhi from huge phages is a hypercompact genome editor.Science369,333-337,doi:10.1126/science.abb1400(2020).
Punjani,A.,Rubinstein,J.L.,Fleet,D.J.&Brubaker,M.A.cryoSPARC:algorithms for rapid unsupervised cryo-EM structure determination.Nature Methods14,290-296,doi:10.1038/nmeth.4169(2017).
Steitz,T.A.&Steitz,J.A.A general two-metal-ion mechanism for catalytic RNA.Proc Natl Acad Sci USA90,6498-6502,doi:10.1073/pnas.90.14.6498(1993).
Stella,S.,Alcon,P.&Montoya,G.Structure of the Cpf1 endonuclease R-loop complex after target DNA cleavage.Nature546,559-563,doi:10.1038/nature22398(2017a).
Stella,S.,Alcon,P.&Montoya,G.Class2 CRISPR-Cas RNA-guided endonucleases:Swiss Army knives of genome editing.Nat Struct Mol Biol24,882-892,doi:10.1038/nsmb.3486(2017b).
Stella,S.et al.Conformational Activation Promotes CRISPR-Cas12a Catalysis and Resetting of the Endonuclease Activity.Cell175,1856-1871e1821,doi:10.1016/j.cell.2018.10.045(2018).
Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.&Doudna,J.A.DNA interrogation by the CRISPR RNA-guided endonuclease Cas9.Nature 507,62-67,doi:10.1038/nature13011(2014).
Swarts,D.C.&Jinek,M.Mechanistic Insights into the cis- and trans-Acting DNase Activities of Cas12a.Mol Cell73,589-600e584,doi:10.1016/j.molcel.2018.11.021(2019).
Swarts,D.C.,van der Oost,J.&Jinek,M.Structural Basis for Guide RNA Processing and Seed-Dependent DNA Targeting by CRISPR-Cas12a.Mol Cell66,221-233e224,doi:10.1016/j.molcel.2017.03.016(2017).
Takeda,S.N.et al.Structure of the miniature type V-F CRISPR-Cas effector enzyme.Mol Cell81,558-570.e553,doi:10.1016/j.molcel.2020.11.035(2021).
Tan,Y.Z.et al.Addressing preferred specimen orientation in single-particle cryo-EM through tilting.Nat Methods14,793-796,doi:10.1038/nmeth.4347(2017).
Tegunov,D.&Cramer,P.Real-time ryo-electron microscopy data preprocessing with Warp.Nature Methods16,1146-1152,doi:10.1038/s41592-019-0580-y(2019).
Yamano,T.et al.Crystal Structure of Cpf1 in Complex with Guide RNA and Target DNA.Cell165,949-962,doi:10.1016/j.cell.2016.04.003(2016).
Zivanov,J.et al.New tools for automated high-resolution cryo-EM structure determination in RELION-3.Elife7,doi:10.7554/eLife.42166(2018).
Anders,C.,Niewoehner,O.,Duerst,A.&Jinek,M.Structural basis of PAM-dependent target DNA recognition by the Cas9 endonuclease.Nature513,569-573,doi:10.1038/nature13579(2014).
Bartesaghi,A.,Matthies,D.,Banerjee,S.,Merk,A.&Subramaniam,S.Structure of β-galactosidase at 3.2-Åresolution obtained by cryo-electron microscopy.Proceedings of the National Academy of Sciences111,11709,doi:10.1073/pnas.1402809111(2014).
Burnley,T.,Palmer,C.M.&Winn,M.Recent developments in the CCP-EM software suite.Acta Crystallographica Section D73,469-477,doi:doi:10.1107/S2059798317007859(2017).
Chapados,B.R.et al.Structural biochemistry of a type 2 RNase H:RNA primer recognition and removal during DNA replication.J Mol Biol307,541-556,doi:10.1006/jmbi.2001.4494(2001).
Emsley,P.&Cowtan,K.Coot:model-building tools for molecular graphics.Acta Crystallogr D Biol Crystallogr60,2126-2132,doi:10.1107/S0907444904019158(2004).
Goddard,T.D.et al.UCSF ChimeraX:Meeting modern challenges in visualization and analysis.Protein Sci27,14-25,doi:10.1002/pro.3235(2018).
Jiang,F.,Zhou,K.,Ma,L.,Gressel,S.&Doudna,J.A.STRUCTURAL BIOLOGY.A Cas9-guide RNA complex preorganized for target DNA recognition.Science348,1477-1481,doi:10.1126/science.aab1452(2015).
Jiang,F.et al.Structures of a CRISPR-Cas9 R-loop complex primed for DNA cleavage.Science351,867-871,doi:10.1126/science.aad8282(2016).
Jiang,F.&Doudna,J.A.CRISPR-Cas9 Structures and Mechanisms.Annual Review of Biophysics46,505-529,doi:10.1146/annurev-biophys-062215-010822(2017).
Kanaya,S.Enzymatic activity and protein stability of E.coli ribonuclease HI.Ribonucleases H.,1-38(1998).
Li,Z.,Zhang,H.,Xiao,R.,Han,R.&Chang,L.Cryo-EM structure of the RNA-guided ribonuclease Cas12g.Nature Chemical Biology17,387-393,doi:10.1038/s41589-020-00721-2(2021).
Liebschner,D.et al.Macromolecular structure determination using X-rays,neutrons and electrons:recent developments in Phenix.Acta Crystallogr D Struct Biol75,861-877,doi:10.1107/S2059798319011471(2019).
Makarova,K.S.,and Koonin,E.V.(2015).Annotation and Classification of CRISPR-Cas Systems.Methods Mol Biol1311,47-75.
Nowotny,M.Retroviral integrase superfamily:the structural perspective.EMBO Rep10,144-151,doi:10.1038/embor.2008.256(2009).
Pausch,P.et al.CRISPR-CasPhi from huge phages is a hypercompact genome editor.Science369,333-337,doi:10.1126/science.abb1400(2020).
Punjani,A.,Rubinstein,J.L.,Fleet,D.J.&Brubaker,M.A.cryoSPARC:algorithms for rapid unsupervised cryo-EM structure determination.Nature Methods14,290-296,doi:10.1038/nmeth.4169(2017).
Steitz,T.A.&Steitz,J.A.A general two-metal-ion mechanism for catalytic RNA.Proc Natl Acad Sci USA90,6498-6502,doi:10.1073/pnas.90.14.6498(1993).
Stella,S.,Alcon,P.&Montoya,G.Structure of the Cpf1 endonuclease R-loop complex after target DNA cleavage.Nature546,559-563,doi:10.1038/nature22398(2017a).
Stella,S.,Alcon,P.&Montoya,G.Class2 CRISPR-Cas RNA-guided endonucleases:Swiss Army knives of genome editing.Nat Struct Mol Biol24,882-892,doi:10.1038/nsmb.3486(2017b).
Stella,S.et al.Conformational Activation Promotes CRISPR-Cas12a Catalysis and Resetting of the Endonuclease Activity.Cell175,1856-1871e1821,doi:10.1016/j.cell.2018.10.045(2018).
Sternberg,S.H.,Redding,S.,Jinek,M.,Greene,E.C.&Doudna,J.A.DNA interrogation by the CRISPR RNA-guided endonuclease Cas9.Nature 507,62-67,doi:10.1038/nature13011(2014).
Swarts,D.C.&Jinek,M.Mechanistic Insights into the cis- and trans-Acting DNase Activities of Cas12a.Mol Cell73,589-600e584,doi:10.1016/j.molcel.2018.11.021(2019).
Swarts,D.C.,van der Oost,J.&Jinek,M.Structural Basis for Guide RNA Processing and Seed-Dependent DNA Targeting by CRISPR-Cas12a.Mol Cell66,221-233e224,doi:10.1016/j.molcel.2017.03.016(2017).
Takeda,S.N.et al.Structure of the miniature type V-F CRISPR-Cas effector enzyme.Mol Cell81,558-570.e553,doi:10.1016/j.molcel.2020.11.035(2021).
Tan,Y.Z.et al.Addressing preferred specimen orientation in single-particle cryo-EM through tilting.Nat Methods14,793-796,doi:10.1038/nmeth.4347(2017).
Tegunov,D.&Cramer,P.Real-time ryo-electron microscopy data preprocessing with Warp.Nature Methods16,1146-1152,doi:10.1038/s41592-019-0580-y(2019).
Yamano,T.et al.Crystal Structure of Cpf1 in Complex with Guide RNA and Target DNA.Cell165,949-962,doi:10.1016/j.cell.2016.04.003(2016).
Zivanov,J.et al.New tools for automated high-resolution cryo-EM structure determination in RELION-3.Elife7,doi:10.7554/eLife.42166(2018).
項目
1.ポリペプチド配列を含む、変異体Cas12jエンドヌクレアーゼ、例えば変異体CasΦ-3、またはそのオルソログであって、前記ポリペプチド配列は、
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3
に対して、少なくとも95%の配列同一性を有する、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
1.ポリペプチド配列を含む、変異体Cas12jエンドヌクレアーゼ、例えば変異体CasΦ-3、またはそのオルソログであって、前記ポリペプチド配列は、
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3
に対して、少なくとも95%の配列同一性を有する、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
2.前記変異体エンドヌクレアーゼが、配列番号3の残基1~726に対応する配列に対して少なくとも95%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基727~766に対応する配列のC末端の欠失をさらに含み、例えば、前記エンドヌクレアーゼは、配列番号31に対して少なくとも95%の配列同一性を有するポリペプチド配列を含むか、またはそれからなる、項目1に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
3.前記変異体エンドヌクレアーゼが、野生型エンドヌクレアーゼと比較して、1つ以上の変更された活性を有し、前記活性は、標的核酸配列の二本鎖切断、標的核酸配列の一本鎖切断及び標的核酸認識からなる群から選択される、先行項目のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
4.前記エンドヌクレアーゼが、2価のニッケル(Ni2+)、2価のマンガン(Mn2+)及び/または2価の銅(Co2+)を含む媒体に含まれる、先行項目のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
5.先行項目のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログをコードするポリヌクレオチド。
6.項目5に記載のポリヌクレオチド、または項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードする核酸配列を含む、組換えベクター。
7.項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ、項目5に記載のポリヌクレオチド、または項目6に記載の組換えベクターを発現することができる細胞。
8.crRNA-Cas12j複合体の発現のための系であって、
a.項目5に記載のポリヌクレオチド、または、変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドを含む項目6に記載の組換えベクター、及び
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター、及び
c.任意に、a.及びb.の前記ポリヌクレオチドまたは前記組換えベクターを発現するための細胞、
を含む、前記系。
a.項目5に記載のポリヌクレオチド、または、変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドを含む項目6に記載の組換えベクター、及び
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター、及び
c.任意に、a.及びb.の前記ポリヌクレオチドまたは前記組換えベクターを発現するための細胞、
を含む、前記系。
9.第1の標的核酸に核酸切断を導入する方法におけるcrRNA-Cas12j複合体の使用であって、
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、前記第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、前記Cas12jエンドヌクレアーゼまたはそのオルソログは項目1~4のいずれか1つに記載され、
b.前記crRNA-Cas12j複合体を、前記第1の標的核酸と接触させ、
それによって、前記第1の標的核酸配列において核酸切断が生成される、前記使用。
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、前記第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、前記Cas12jエンドヌクレアーゼまたはそのオルソログは項目1~4のいずれか1つに記載され、
b.前記crRNA-Cas12j複合体を、前記第1の標的核酸と接触させ、
それによって、前記第1の標的核酸配列において核酸切断が生成される、前記使用。
10.第1の標的核酸に核酸切断を導入する方法であって、前記方法は、
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.の前記crRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させるステップであって、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、項目1~4のいずれか1つに記載のものか、または項目5または6に記載のポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得る、前記ステップ、及び
c.前記crRNA及び前記変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップを含み、
それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する、前記方法。
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.の前記crRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させるステップであって、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、項目1~4のいずれか1つに記載のものか、または項目5または6に記載のポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得る、前記ステップ、及び
c.前記crRNA及び前記変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップを含み、
それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する、前記方法。
11.哺乳動物細胞内で第2の標的核酸に部位特異的な二本鎖切断を導入するインビトロ方法であって、前記方法は、前記哺乳動物細胞内に、crRNA-Cas12j複合体を導入することを含み、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはオルソログであり、前記crRNAは、前記第2の標的核酸に特異的である、前記方法。
12.サンプル中の第2の標的核酸を検出するための方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、前記第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記crRNA-Cas12j複合体及び前記ssDNAを、少なくとも1つの第2の標的核酸を含む前記サンプルと接触させること、
d.蛍光体からの蛍光シグナルを検出することによりssDNAの切断を検出すること、及び
e.任意に、前記第2の標的核酸のレベル及び/または濃度を決定することであって、前記第2の標的核酸のレベル及び/または濃度は、前記切断されたssDNAと相関する、前記決定すること
を含み、それによって、前記サンプル中の前記第2の標的核酸の存在を検出し、ステップc.は、任意に前記crRNA-Cas12j複合体の活性化を含む、前記方法。
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、前記第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記crRNA-Cas12j複合体及び前記ssDNAを、少なくとも1つの第2の標的核酸を含む前記サンプルと接触させること、
d.蛍光体からの蛍光シグナルを検出することによりssDNAの切断を検出すること、及び
e.任意に、前記第2の標的核酸のレベル及び/または濃度を決定することであって、前記第2の標的核酸のレベル及び/または濃度は、前記切断されたssDNAと相関する、前記決定すること
を含み、それによって、前記サンプル中の前記第2の標的核酸の存在を検出し、ステップc.は、任意に前記crRNA-Cas12j複合体の活性化を含む、前記方法。
13.第2の標的核酸、例えばウイルスゲノム、微生物ゲノム、病原体の遺伝子、またはヒト疾患に関連する核酸配列の核酸断片を、サンプル中で検出して、任意に定量化する方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.前記変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.前記変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.前記crRNAは、前記第2の標的核酸に特異的である、提供することと、
b.前記crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含む前記サンプルと接触させることと、
c.前記タンパク質標識、例えば蛍光シグナルを検出することにより、前記第2の標的核酸の存在を検出して、任意に定量化することと、
を含む、前記方法。
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.前記変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.前記変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.前記crRNAは、前記第2の標的核酸に特異的である、提供することと、
b.前記crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含む前記サンプルと接触させることと、
c.前記タンパク質標識、例えば蛍光シグナルを検出することにより、前記第2の標的核酸の存在を検出して、任意に定量化することと、
を含む、前記方法。
14.対象における疾患を診断するためのインビトロ方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記対象由来のサンプルを提供することであって、前記サンプルは、前記第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行項目のいずれか1つで定義された前記第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、前記第2の標的核酸は、前記疾患と相関する核酸断片であり、例えば、前記第2の標的核酸は、前記疾患のバイオマーカーであり、
それによって対象における疾患を診断する、前記方法。
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記対象由来のサンプルを提供することであって、前記サンプルは、前記第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行項目のいずれか1つで定義された前記第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、前記第2の標的核酸は、前記疾患と相関する核酸断片であり、例えば、前記第2の標的核酸は、前記疾患のバイオマーカーであり、
それによって対象における疾患を診断する、前記方法。
15.対象における感染性疾患を診断するためのインビトロ方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記対象由来のサンプルを提供することであって、前記サンプルは、前記第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行項目のいずれか1つで定義された前記第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、前記第2の標的核酸は、前記疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、
それによって対象における感染性疾患を診断する、前記方法。
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、項目1~4のいずれか1つに記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記対象由来のサンプルを提供することであって、前記サンプルは、前記第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、提供すること、及び
d.先行項目のいずれか1つで定義された前記第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、前記第2の標的核酸は、前記疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、
それによって対象における感染性疾患を診断する、前記方法。
Claims (107)
- ポリペプチド配列を含む、変異体Cas12jエンドヌクレアーゼ、例えば変異体CasΦ-3、またはそのオルソログであって、前記ポリペプチド配列は、
i)配列番号3の残基1~20、36~97、104~119、151~179、204~379、396~619、651~679及び701~726に対応する配列であって、前記ポリペプチド配列はさらに、
a.配列番号3の残基21~35に対応するNPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
b.配列番号3の残基98~103に対応するTPIDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
c.配列番号3の残基120~150に対応するTPIDドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
d.配列番号3の残基180~203に対応するTPIDドメインの第3の領域、またはRBDドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
e.配列番号3の残基380~395に対応するRBDドメインの第2の領域、またはRuvC-Iドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
f.配列番号3の残基620~650に対応するRuvC-IIドメインの第1の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
g.配列番号3の残基680~700に対応するRuvC-IIドメインの第2の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異、及び/または
h.配列番号3の残基726~766に対応するRuvC-IIドメインの第3の領域における少なくとも1つのアミノ酸変異であって、各変異は、独立して、アミノ酸置換、挿入または欠失である、前記アミノ酸変異
を含む、前記配列、及び/または、
ii)配列番号3であって、前記ポリペプチド配列は、配列番号3の残基26、30、54、55、123、197、355、360、413、618、625、626、630、643、673、675、676、680、683、691、698、701及び708に対応する位置から選択される位置における少なくとも1つのアミノ酸置換を含む、前記配列番号3
に対して、少なくとも95%の配列同一性を有する、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。 - 前記Cas12jエンドヌクレアーゼがBiggiephage由来である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記変異体エンドヌクレアーゼが、配列番号3の残基1~726に対応する前記配列に対して少なくとも95%の配列同一性を有するポリペプチド配列を含み、前記ポリペプチド配列は、配列番号3の残基727~766に対応する前記配列のC末端の欠失をさらに含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記エンドヌクレアーゼが、配列番号31に対して少なくとも95%の配列同一性を有するポリペプチド配列を含むか、またはそれからなる、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、荷電側鎖を有するアミノ酸から非荷電側鎖を有するアミノ酸への置換である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、荷電側鎖を有するアミノ酸から非極性側鎖を有するアミノ酸残基への置換である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、荷電側鎖を有するアミノ酸からグリシン、アラニン、バリン、ロイシン、イソロイシン、セリンまたはスレオニンへの置換である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、荷電側鎖を有するアミノ酸からグリシンへの置換である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、アミノ酸のアラニンへの置換である、請求項1~7のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸の置換または欠失が、少なくとも2個の残基の置換または欠失、例えば少なくとも3個の残基の置換または欠失、例えば少なくとも4個の残基の置換または欠失、例えば少なくとも5個の残基の置換または欠失、例えば少なくとも6個の残基の置換または欠失、例えば少なくとも7個の残基の置換または欠失、例えば少なくとも8個の残基の置換または欠失、例えば少なくとも9個の残基の置換または欠失、例えば少なくとも10個の残基の置換または欠失、例えば少なくとも11個の残基の置換または欠失、例えば少なくとも12個の残基の置換または欠失、例えば少なくとも13個の残基の置換または欠失、たとえば少なくとも14個の残基の置換または欠失、例えば少なくとも15個の残基の置換または欠失、例えば少なくとも20個の残基の置換または欠失、例えば少なくとも25個の残基の置換または欠失、例えば少なくとも30個の残基の置換または欠失、例えば少なくとも35個の残基の置換または欠失、または例えば少なくとも40個の残基の置換または欠失である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、NPIDドメインにある、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、TPIDドメインにある、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、RBDドメインにある、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、RuvC-Iドメインにある、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記少なくとも1つのアミノ酸置換が、RuvC-IIドメインにある、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記RuvC-I及び/またはRuvC-IIドメイン中の前記アミノ酸置換が、グルタミン酸またはアスパラギン酸ではないアミノ酸の前記置換である、請求項14~15のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記変異体Cas12jエンドヌクレアーゼがニッキングエンドヌクレアーゼである、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のK26に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のK30に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のF54に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のK55に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のQ123に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のQ197に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のL355に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のT360に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のD413に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のE618に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のK625に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のF626に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のG630に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のR643に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のP673に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のW675に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のT676に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のC680に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のC683に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のR691に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前配列番号3または配列番号31のR691に対応する位置での前記置換がR691A置換である、請求項37に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のC698に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のC701に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 配列番号3または配列番号31のD708に対応する位置で置換を含む、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記変異体Cas12jエンドヌクレアーゼが、CasΦ-1(配列番号1)、CasΦ-2(配列番号2)、CasΦ-3(配列番号3)、CasΦ-4(配列番号4)、CasΦ-5(配列番号5)、CasΦ-6(配列番号6)、CasΦ-7(配列番号7)、CasΦ-8(配列番号8)、CasΦ-9(配列番号9)、及びCasΦ-10(配列番号10)からなる群から選択されるCas12jエンドヌクレアーゼの変異体である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記変異体Cas12jエンドヌクレアーゼが、CasΦ-3(配列番号3)の変異体である、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記変異体エンドヌクレアーゼが、野生型エンドヌクレアーゼと比較して、1つ以上の変更された活性を有し、前記活性は、標的核酸配列の二本鎖切断、標的核酸配列の一本鎖切断及び標的核酸認識からなる群から選択される、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記変更された活性が、触媒速度の増加、プロトスペーサー隣接モチーフ(PAM)配列認識の変更、突出核酸二本鎖切断によって生じるオーバーハングの長さの変更、オフターゲット切断頻度の減少、ヌクレアーゼ活性の抑制、標的核酸配列に対する特異性の増加、及び二本鎖核酸切断の誘発から一本鎖核酸切断の誘発(ニッカーゼ活性)への切断活性の変更からなる群から選択される、請求項44に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記エンドヌクレアーゼがタンパク質タグにコンジュゲートしている、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記タンパク質タグが、FLAGタグ、HAタグ、ビオチン、キチン結合タンパク質(CBP)、マルトース結合タンパク質(MBP)、ストレプタグ、グルタチオン-S-トランスフェラーゼ(GST)またはポリ(His)タグである、請求項46に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記タンパク質タグが、酵素、例えばペルオキシダーゼ、ビオチンリガーゼ、または塩基編集酵素、例えばシチジンまたはアデニンデアミナーゼである、請求項46に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記タンパク質タグが、転写因子などの転写調節因子である、請求項46に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記タンパク質タグが、GFP、Venusまたはフルオレセインなどの蛍光タグである、請求項46に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 前記エンドヌクレアーゼが、2価のニッケル(Ni2+)、2価のマンガン(Mn2+)及び/または2価の銅(Co2+)を含む媒体に含まれる、先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- Ni2+の濃度が、少なくとも0.2mM、例えば少なくとも0.5mM、例えば少なくとも1mM、例えば少なくとも2mM、例えば少なくとも3mM、例えば少なくとも4mM、例えば少なくとも5mM、例えば0.2mM~5mMである、請求項51に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- Mn2+の濃度が、少なくとも0.2mM、例えば少なくとも0.5mM、例えば少なくとも1mM、例えば少なくとも2mM、例えば少なくとも3mM、例えば少なくとも4mM、例えば少なくとも5mM、例えば0.2mM~5mMである、請求項51に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- Co2+の濃度が、少なくとも0.2mM、例えば少なくとも0.5mM、例えば少なくとも1mM、例えば少なくとも2mM、例えば少なくとも3mM、例えば少なくとも4mM、例えば少なくとも5mM、例えば0.2mM~5mMである、請求項51に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ。
- 先行請求項のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログをコードするポリヌクレオチド。
- 前記変異体Cas12jエンドヌクレアーゼが、配列番号11、配列番号12、配列番号13、配列番号14、配列番号15、配列番号16、配列番号17、配列番号18、配列番号19、配列番号20、配列番号21、配列番号22、配列番号23、配列番号24、配列番号25、配列番号26、配列番号27、配列番号28、配列番号29、配列番号30、配列番号32及び配列番号33からなる群から選択される核酸配列に対して少なくとも80%、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%の配列同一性を有する核酸配列を含むかまたはそれからなるポリヌクレオチドによってコードされる、請求項55に記載のポリヌクレオチド。
- 前記変異体Cas12jエンドヌクレアーゼが、配列番号13、配列番号23、配列番号32または配列番号33に対して少なくとも80%、例えば少なくとも85%、例えば少なくとも90%、例えば少なくとも95%の配列同一性を有する核酸配列を含むかまたはそれからなるポリヌクレオチドによってコードされる、請求項55または56に記載のポリヌクレオチド。
- 前記ポリヌクレオチドが、宿主細胞での発現のためにコドン最適化されている、請求項55~57のいずれか1項に記載のポリヌクレオチド。
- 請求項55~58のいずれか1項に記載のポリヌクレオチド、または請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードする核酸配列を含む、組換えベクター。
- 前記ポリヌクレオチドまたは核酸配列が、プロモーターに作動可能に連結されている、請求項59に記載の組換えベクター。
- プロモーターに作動可能に連結されたガイドRNA(crRNA)をコードする核酸配列をさらに含み、前記crRNAは、コードされたCas12jエンドヌクレアーゼと、標的核酸にハイブリダイズするのに十分な塩基対を有する核酸の断片を結合する、請求項59~60のいずれか1項に記載の組換えベクター。
- 前記crRNAが、23~25ヌクレオチドの定常領域、及び9~20ヌクレオチドで構成される可変領域からなり、前記crRNAは、少なくとも32ヌクレオチド長、例えば33ヌクレオチド長、例えば34ヌクレオチド長、例えば35ヌクレオチド長、例えば36ヌクレオチド長、例えば37ヌクレオチド長、例えば38ヌクレオチド長、例えば39ヌクレオチド長、例えば40ヌクレオチド長、例えば41ヌクレオチド長、例えば42ヌクレオチド長、例えば43ヌクレオチド長、例えば44ヌクレオチド長、例えば45ヌクレオチド長である、請求項56~58のいずれか1項に記載の組換えベクター。
- 前記crRNAの前記定常領域が、配列番号34、配列番号35または配列番号36に記載されているものである、請求項59~62のいずれか1項に記載の組換えベクター。
- 前記crRNAの前記定常領域が、配列番号36に記載されているものである、請求項59~63のいずれか1項に記載の組換えベクター。
- 請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログ、請求項55~58のいずれか1項に記載のポリヌクレオチド、または請求項59~64のいずれか1項に記載の組換えベクターを発現することができる細胞。
- crRNA-Cas12j複合体の発現のための系であって、
a.請求項55~58のいずれか1項に記載のポリヌクレオチド、または変異体Cas12jエンドヌクレアーゼもしくはそのオルソログをコードするポリヌクレオチドを含む請求項59~64のいずれか1項に記載の組換えベクター、
b.任意にプロモーターに作動可能に連結される、ガイドRNA(crRNA)をコードするポリヌクレオチド、またはポリヌクレオチドを含む組換えベクター、
を含む、前記系。 - c.上記のa.及びb.の前記ポリヌクレオチドまたは前記組換えベクターを発現するための細胞
をさらに含む、請求項66に記載の系。 - 前記細胞が、原核細胞または真核細胞である、請求項65に記載の細胞、または請求項66~67のいずれか1項に記載の系。
- 第1の標的核酸に核酸切断を導入する方法におけるcrRNA-Cas12j複合体の使用であって、
a.変異体Cas12jエンドヌクレアーゼまたはそのオルソログを、ガイドRNA(crRNA)と接触させ、それにより第2の標的核酸を認識することができるcrRNA-Cas12j複合体を取得し、ここで、前記第2の標的核酸は、プロトスペーサー隣接モチーフ(PAM)を含み、前記Cas12jエンドヌクレアーゼまたはそのオルソログは請求項1~54のいずれか1項に記載され、
b.前記crRNA-Cas12j複合体を、前記第1の標的核酸と接触させ、
それによって、前記第1の標的核酸配列において核酸切断が生成される、前記使用。 - 前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログが、請求項55~64のいずれか1項に記載のポリヌクレオチドまたはベクターによってコードされ、及び/または前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、請求項1~54のいずれか1項に記載される、請求項69に記載の使用。
- 前記核酸切断が、一本鎖切断である、請求項69~70のいずれか1項に記載の使用。
- 前記核酸切断が、二本鎖切断である、請求項69~70のいずれか1項に記載の使用。
- 前記二本鎖切断が、突出二本鎖切断である、請求項72に記載の使用。
- 前記第2の標的核酸が、少なくとも15連続ヌクレオチド、例えば少なくとも16連続ヌクレオチド、例えば少なくとも17連続ヌクレオチド、例えば少なくとも18連続ヌクレオチド、例えば少なくとも19連続ヌクレオチド、例えば少なくとも20連続ヌクレオチド、例えば少なくとも21連続ヌクレオチド、例えば少なくとも22連続ヌクレオチド、例えば少なくとも23連続ヌクレオチド、例えば少なくとも24連続ヌクレオチド、例えば少なくとも25連続ヌクレオチド、例えば少なくとも26連続ヌクレオチド、例えば少なくとも27連続ヌクレオチドの配列を含む認識配列を含むかまたはそれからなり、但し、5’末端にある3個の核酸は、PAM配列からなる、請求項69~73のいずれか1項に記載の使用。
- 前記PAMが、配列5’-TTN-3’を含むかまたはそれからなる、請求項69~74のいずれか1項に記載の使用。
- 前記第1の標的核酸及び前記第2の標的核酸が、DNAまたはRNAである、請求項69~75のいずれか1項に記載の使用。
- 前記第1及び/または第2の標的核酸が二本鎖DNAである、請求項69~76のいずれか1項に記載の使用。
- 前記第1及び/または第2の標的核酸が、ゲノムDNA、クロマチン、ヌクレオソーム、プラスミドDNA、メチル化DNA、合成DNA、及びDNA断片からなる群から選択されるDNAである、請求項69~77のいずれか1項に記載の使用。
- 前記方法をエクスビボで実施する、請求項69~78のいずれか1項に記載の使用。
- 第1の標的核酸に核酸切断を導入する方法であって、前記方法は、
a.プロトスペーサー隣接モチーフ(PAM)を含む第2の標的核酸を認識することができるガイドRNA(crRNA)を設計するステップ、
b.ステップa.の前記crRNAを、変異体Cas12jエンドヌクレアーゼまたはそのオルソログと接触させるステップであって、前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログは、請求項1~54のいずれか1項に記載のものか、または請求項55~64のいずれか1項に記載のポリヌクレオチドもしくはベクターによってコードされ、それによって前記第2の標的核酸に結合することができるcrRNA-Cas12j複合体を得る、前記ステップ、及び
c.前記crRNA及び前記変異体Cas12jエンドヌクレアーゼを前記第1の標的核酸と接触させるステップ、
を含み、それによって、1つ以上の核酸切断を前記第1の標的核酸に導入する、前記方法。 - 前記核酸切断が、一本鎖切断または突出二本鎖切断などの二本鎖切断である、請求項80に記載の方法。
- ステップb.及びc.が、同時にまたは順次に行われる、請求項80~81のいずれか1項に記載の方法。
- 前記方法が、インビトロで細胞において実施される、請求項80~82のいずれか1項に記載の方法。
- 前記一本鎖切断が、前記第1の標的核酸の特異的認識ヌクレオチド配列に生成される、請求項80~83のいずれか1項に記載の方法。
- 前記第1の標的核酸及び前記第2の標的核酸が、先行請求項のいずれか1項に定義されるものである、請求項80~84のいずれか1項に記載の方法。
- 哺乳動物細胞内で第2の標的核酸に部位特異的な二本鎖切断を導入するインビトロ方法であって、前記方法は、前記哺乳動物細胞内に、crRNA-Cas12j複合体を導入することを含み、前記Cas12jは、請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはオルソログであり、前記crRNAは、前記第2の標的核酸に特異的である、前記方法。
- サンプル中の第2の標的核酸を検出するための方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、前記第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記crRNA-Cas12j複合体及び前記ssDNAを、少なくとも1つの第2の標的核酸を含む前記サンプルと接触させること、及び
d.蛍光体からの蛍光シグナルを検出することにより前記ssDNAの切断を検出すること、
を含み、それによって、前記サンプル中の前記第2の標的核酸の存在を検出し、ステップc.は、任意に前記crRNA-Cas12j複合体の活性化を含む、前記方法。 - ステップc.が、前記crRNA-Cas12j複合体の活性化、例えば一本鎖または二本鎖の標的DNAによる活性化を含む、請求項87に記載の方法。
- e.前記第2の標的核酸のレベル及び/または濃度を決定することをさらに含み、
前記第2の標的核酸の前記レベル及び/または濃度は、前記切断されたssDNAと相関している、請求項87~88のいずれか1項に記載の方法。 - 前記方法が、第2の標的核酸をナノモル以下の範囲の濃度で、例えばピコモル以下の範囲の濃度で、例えばフェムトモル以下の範囲の濃度で、例えばアトモル以下の範囲の濃度で検出することができる、請求項87~89のいずれか1項に記載の方法。
- 前記ssDNAが、前記鎖に沿った任意の位置の少なくとも1つの塩基で標識されている、請求項87~90のいずれか1項に記載の方法。
- 前記少なくとも1つの色素が、蛍光体である、請求項87~91のいずれか1項に記載の方法。
- ステップd.が、前記ssDNAの切断から生じる蛍光シグナルを検出することを含む、請求項87~92のいずれか1項に記載の方法。
- サンプル中の第2の標的核酸を検出及び任意に定量化する方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、
i.前記変異体Cas12jは、抑制されたエンドヌクレアーゼ活性を有し、
ii.前記変異体Cas12jは、検出可能なタンパク質標識を含み、かつ
iii.前記crRNAは、前記第2の標的核酸に特異的である、提供することと、
b.前記crRNA-Cas12j複合体を、少なくとも1つの第2の標的核酸を含む前記サンプルと接触させることと、
c.前記タンパク質標識、例えば蛍光シグナルを検出することにより、前記第2の標的核酸の存在を検出及び任意に定量化することと、
を含む、前記方法。 - 前記サンプルが、DNA及び/またはRNAを含む、請求項87~94のいずれか1項に記載の方法。
- 前記サンプルが、前記第2の標的核酸を含むことが疑われる、請求項87~95のいずれか1項に記載の方法。
- 前記第2の標的核酸が、ウイルスゲノム、微生物ゲノム、病原体の遺伝子、またはヒト疾患に関連する核酸配列の核酸断片である、請求項87~96のいずれか1項に記載の方法。
- 対象における疾患を診断するためのインビトロ方法であって、前記方法は、
a.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、第2の標的核酸に特異的である、前記提供すること、
b.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
c.前記対象由来のサンプルを提供することであって、前記サンプルは、前記第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、前記提供すること、及び
d.先行請求項のいずれか1項で定義された第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、前記第2の標的核酸は、前記疾患と相関する核酸断片であり、例えば、前記第2の標的核酸は、前記疾患のバイオマーカーであり、
それによって対象における疾患を診断する、前記方法。 - 前記第2の標的核酸が、前記疾患と相関する核酸断片であり、例えば、前記第2の標的核酸が、前記疾患のバイオマーカーである、請求項98に記載の方法。
- 対象における感染性疾患を診断するためのインビトロ方法であって、前記方法は、
e.crRNA-Cas12j複合体を提供することであって、前記Cas12jは、請求項1~54のいずれか1項に記載の変異体Cas12jエンドヌクレアーゼまたはそのオルソログであり、前記crRNAは、第2の標的核酸に特異的である、前記提供すること、
f.標識ssDNAを提供することであって、前記ssDNAは、少なくとも1つの色素及び少なくとも1つのクエンチャーを含む少なくとも1つの相互作用標識のセットで標識される、前記提供すること、
g.前記対象由来のサンプルを提供することであって、前記サンプルは、前記第2の標的核酸を含むか、または前記第2の標的核酸を含むことが疑われる、前記提供すること、及び
h.先行請求項のいずれか1項で定義された前記第2の標的核酸のレベル及び/または濃度を決定すること、
を含み、前記第2の標的核酸は、前記疾患を引き起こす感染病原体のゲノムの核酸またはその断片であり、
それによって対象における感染性疾患を診断する、前記方法。 - 前記感染性疾患を治療するステップをさらに含む、請求項100に記載の方法。
- 前記感染性疾患を、治療的に有効な化合物の投与により治療することをさらに含む、請求項101に記載の方法。
- 前記第2の標的核酸のレベル及び/または濃度をカットオフ値と比較するステップをさらに含み、
前記カットオフ値は、前記感染性疾患を呈していない対象などの健常対象における前記第2の標的核酸の濃度範囲から決定され、
前記カットオフ値よりも大きいレベル及び/または濃度が、前記感染性疾患の存在を示す、請求項98~102のいずれか1項に記載の方法。 - 前記感染性疾患が感染病原体によって引き起こされ、前記感染病原体は、ウイルス、ウイロイド、プリオン、細菌、線虫、寄生性回虫、ぎょう虫、節足動物、真菌、白癬及び大寄生虫を含む、請求項98~103のいずれか1項に記載の方法。
- 前記対象が、ヒトである、請求項98~104のいずれか1項に記載の方法。
- 前記サンプル体液が、血液、全血、血漿、血清、尿、唾液、涙液、脳脊髄液及び精液からなる群から選択される、請求項98~105のいずれか1項に記載の方法。
- 前記変異体Cas12jエンドヌクレアーゼまたはそのオルソログが、配列番号3または配列番号31を含むかまたはそれからなる、請求項98~106のいずれか1項に記載の方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21177411.2 | 2021-06-02 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024521876A true JP2024521876A (ja) | 2024-06-04 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2015299850B2 (en) | Genome editing using Campylobacter jejuni CRISPR/CAS system-derived RGEN | |
Jia et al. | Structure-based functional mechanisms and biotechnology applications of anti-CRISPR proteins | |
US20210230567A1 (en) | Mutant cpf1 endonucleases | |
Hochstrasser et al. | DNA targeting by a minimal CRISPR RNA-guided cascade | |
Goosen et al. | Role of ATP hydrolysis by UvrA and UvrB during nucleotide excision repair | |
KR101379621B1 (ko) | 다성분 핵산 효소 및 이의 사용 방법 | |
Fekairi et al. | Human SLX4 is a Holliday junction resolvase subunit that binds multiple DNA repair/recombination endonucleases | |
JP2019535324A (ja) | CRISPR−Cas9の阻害因子 | |
Varizhuk et al. | Polymorphism of G4 associates: from stacks to wires via interlocks | |
WO1998037205A9 (en) | Mutations in atp-dependent transposition proteins that reduce target-site specificity | |
Kosek et al. | The large bat Helitron DNA transposase forms a compact monomeric assembly that buries and protects its covalently bound 5′-transposon end | |
Xie et al. | In vitro system for high‐throughput screening of random peptide libraries for antimicrobial peptides that recognize bacterial membranes | |
Wilkinson et al. | Structures of RecBCD in complex with phage-encoded inhibitor proteins reveal distinctive strategies for evasion of a bacterial immunity hub | |
US20230193409A1 (en) | PHAGE-ENCODED AcrVIA1 FOR USE AS AN INHIBITOR OF THE RNA-TARGETING CRISPR-Cas13 SYSTEMS | |
JP2024521876A (ja) | 変異体Cas12jエンドヌクレアーゼ | |
CA3219005A1 (en) | Mutant cas12j endonucleases | |
Glover et al. | Remodeling of protein aggregates by Hsp104 | |
Peng et al. | Design of a reversible inversed pH-responsive caged protein | |
KR102567576B1 (ko) | 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 | |
US8318155B2 (en) | Nucleic acid cleaving agent | |
Bravo et al. | Large-scale structural rearrangements unleash indiscriminate nuclease activity of CRISPR-Cas12a2 | |
JP7273717B2 (ja) | 一本鎖結合タンパク質 | |
Carabias et al. | Structure of the mini-RNA-guided endonuclease CRISPR-CasΦ3 | |
US20220389418A1 (en) | Rna-guided cas nucleases and uses thereof in diagnostics and therapy | |
Melanker et al. | In vitro evolution of uracil glycosylase towards DnaKJ and GroEL binding evolves different misfolded states |