JP2024517607A - Ruvcドメインを有する酵素 - Google Patents
Ruvcドメインを有する酵素 Download PDFInfo
- Publication number
- JP2024517607A JP2024517607A JP2023562936A JP2023562936A JP2024517607A JP 2024517607 A JP2024517607 A JP 2024517607A JP 2023562936 A JP2023562936 A JP 2023562936A JP 2023562936 A JP2023562936 A JP 2023562936A JP 2024517607 A JP2024517607 A JP 2024517607A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- nucleic acid
- endonuclease
- seq
- nos
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000004190 Enzymes Human genes 0.000 title abstract description 19
- 108090000790 Enzymes Proteins 0.000 title abstract description 19
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 294
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 60
- 150000007523 nucleic acids Chemical group 0.000 claims description 297
- 125000003729 nucleotide group Chemical group 0.000 claims description 145
- 239000002773 nucleotide Substances 0.000 claims description 141
- 101710163270 Nuclease Proteins 0.000 claims description 137
- 102000053602 DNA Human genes 0.000 claims description 97
- 108020004414 DNA Proteins 0.000 claims description 97
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 92
- 230000008685 targeting Effects 0.000 claims description 90
- 102000039446 nucleic acids Human genes 0.000 claims description 87
- 108020004707 nucleic acids Proteins 0.000 claims description 87
- 229920002477 rna polymer Polymers 0.000 claims description 63
- 108090000623 proteins and genes Proteins 0.000 claims description 56
- 230000000295 complement effect Effects 0.000 claims description 42
- 102000004169 proteins and genes Human genes 0.000 claims description 41
- 102000040430 polynucleotide Human genes 0.000 claims description 33
- 108091033319 polynucleotide Proteins 0.000 claims description 33
- 239000002157 polynucleotide Substances 0.000 claims description 33
- 230000001580 bacterial effect Effects 0.000 claims description 23
- 241000282414 Homo sapiens Species 0.000 claims description 21
- 230000002538 fungal effect Effects 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 15
- 230000027455 binding Effects 0.000 claims description 14
- 239000013612 plasmid Substances 0.000 claims description 13
- 108091033409 CRISPR Proteins 0.000 claims description 12
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 claims description 11
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 claims description 11
- 244000005700 microbiome Species 0.000 claims description 11
- 125000006850 spacer group Chemical group 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 7
- 241000894006 Bacteria Species 0.000 claims description 7
- 238000010845 search algorithm Methods 0.000 claims description 7
- 230000030648 nucleus localization Effects 0.000 claims description 6
- 230000002441 reversible effect Effects 0.000 claims description 6
- 241000894007 species Species 0.000 claims description 6
- 108700004991 Cas12a Proteins 0.000 claims description 5
- 241000124008 Mammalia Species 0.000 claims description 5
- 239000000203 mixture Substances 0.000 claims description 5
- 241000203069 Archaea Species 0.000 claims description 4
- 230000033616 DNA repair Effects 0.000 claims description 4
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 4
- 210000003205 muscle Anatomy 0.000 claims description 4
- 241000702421 Dependoparvovirus Species 0.000 claims description 3
- 241000206602 Eukaryota Species 0.000 claims description 3
- 241000233866 Fungi Species 0.000 claims description 3
- 241000713666 Lentivirus Species 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 241000701161 unidentified adenovirus Species 0.000 claims description 3
- 210000002845 virion Anatomy 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims 1
- 102100031780 Endonuclease Human genes 0.000 description 210
- 210000004027 cell Anatomy 0.000 description 47
- 108090000765 processed proteins & peptides Proteins 0.000 description 41
- 235000018102 proteins Nutrition 0.000 description 39
- 235000001014 amino acid Nutrition 0.000 description 20
- 229940024606 amino acid Drugs 0.000 description 19
- 150000001413 amino acids Chemical class 0.000 description 19
- 229920001184 polypeptide Polymers 0.000 description 19
- 102000004196 processed proteins & peptides Human genes 0.000 description 19
- 241000196324 Embryophyta Species 0.000 description 17
- 238000003776 cleavage reaction Methods 0.000 description 17
- 230000007017 scission Effects 0.000 description 16
- 239000012636 effector Substances 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 230000003993 interaction Effects 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- 108020005004 Guide RNA Proteins 0.000 description 10
- 101100453278 Oryctolagus cuniculus JPH1 gene Proteins 0.000 description 10
- 229950010342 uridine triphosphate Drugs 0.000 description 10
- 108091027544 Subgenomic mRNA Proteins 0.000 description 9
- 229920000642 polymer Polymers 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 8
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 125000001153 fluoro group Chemical group F* 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- VYXSBFYARXAAKO-UHFFFAOYSA-N ethyl 2-[3-(ethylamino)-6-ethylimino-2,7-dimethylxanthen-9-yl]benzoate;hydron;chloride Chemical compound [Cl-].C1=2C=C(C)C(NCC)=CC=2OC2=CC(=[NH+]CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-UHFFFAOYSA-N 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- 235000011178 triphosphate Nutrition 0.000 description 5
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000191967 Staphylococcus aureus Species 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- -1 7-deaza-dGTP Chemical compound 0.000 description 3
- 241000195940 Bryophyta Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 2
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 2
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 2
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 108091006054 His-tagged proteins Proteins 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010441 gene drive Methods 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 230000037353 metabolic pathway Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 229930000044 secondary metabolite Natural products 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- LAXVMANLDGWYJP-UHFFFAOYSA-N 2-amino-5-(2-aminoethyl)naphthalene-1-sulfonic acid Chemical compound NC1=CC=C2C(CCN)=CC=CC2=C1S(O)(=O)=O LAXVMANLDGWYJP-UHFFFAOYSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- SJQRQOKXQKVJGJ-UHFFFAOYSA-N 5-(2-aminoethylamino)naphthalene-1-sulfonic acid Chemical compound C1=CC=C2C(NCCN)=CC=CC2=C1S(O)(=O)=O SJQRQOKXQKVJGJ-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- WQZIDRAQTRIQDX-UHFFFAOYSA-N 6-carboxy-x-rhodamine Chemical compound OC(=O)C1=CC=C(C([O-])=O)C=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 WQZIDRAQTRIQDX-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 101150101112 7 gene Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- 241000512259 Ascophyllum nodosum Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 1
- 244000249214 Chlorella pyrenoidosa Species 0.000 description 1
- 235000007091 Chlorella pyrenoidosa Nutrition 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- KQLDDLUWUFBQHP-UHFFFAOYSA-N Cordycepin Natural products C1=NC=2C(N)=NC=NC=2N1C1OCC(CO)C1O KQLDDLUWUFBQHP-UHFFFAOYSA-N 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 102100030011 Endoribonuclease Human genes 0.000 description 1
- 108010093099 Endoribonucleases Proteins 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 108091093094 Glycol nucleic acid Proteins 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000985694 Polypodiopsida Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 101710086053 Putative endonuclease Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000593524 Sargassum patens Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 241000320123 Streptococcus pyogenes M1 GAS Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091046915 Threose nucleic acid Proteins 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 101100082060 Xenopus laevis pou5f1.1 gene Proteins 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- NOXMCJDDSWCSIE-DAGMQNCNSA-N [[(2R,3S,4R,5R)-5-(2-amino-4-oxo-3H-pyrrolo[2,3-d]pyrimidin-7-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O NOXMCJDDSWCSIE-DAGMQNCNSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- AZRNEVJSOSKAOC-VPHBQDTQSA-N [[(2r,3s,5r)-5-[5-[(e)-3-[6-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]hexanoylamino]prop-1-enyl]-2,4-dioxopyrimidin-1-yl]-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(\C=C\CNC(=O)CCCCCNC(=O)CCCC[C@H]2[C@H]3NC(=O)N[C@H]3CS2)=C1 AZRNEVJSOSKAOC-VPHBQDTQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- OFEZSBMBBKLLBJ-BAJZRUMYSA-N cordycepin Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)C[C@H]1O OFEZSBMBBKLLBJ-BAJZRUMYSA-N 0.000 description 1
- OFEZSBMBBKLLBJ-UHFFFAOYSA-N cordycepine Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)CC1O OFEZSBMBBKLLBJ-UHFFFAOYSA-N 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000003480 eluent Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 240000004308 marijuana Species 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 239000012536 storage buffer Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- IBVCSSOEYUMRLC-GABYNLOESA-N texas red-5-dutp Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(C#CCNS(=O)(=O)C=2C=C(C(C=3C4=CC=5CCCN6CCCC(C=56)=C4OC4=C5C6=[N+](CCC5)CCCC6=CC4=3)=CC=2)S([O-])(=O)=O)=C1 IBVCSSOEYUMRLC-GABYNLOESA-N 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
Abstract
【解決手段】本開示は、際立ったドメイン特性を有するエンドヌクレアーゼ酵素、ならびにかかる酵素またはそのバリアントを使用する方法を提供する。【選択図】図4
Description
相互参照
本出願は、2021年4月30日に出願された「ENZYMES WITH RUVC DOMAINS」と題される米国仮特許出願第63/182,438号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
本出願は、2021年4月30日に出願された「ENZYMES WITH RUVC DOMAINS」と題される米国仮特許出願第63/182,438号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
Cas酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート(CRISPR)ガイドリボ核酸(RNA)と共に、原核生物の免疫システムの広範(細菌の約45%、古細菌の約84%)な成分であるようであり、CRISPR-RNAガイド核酸切断による感染性ウイルスおよびプラスミドなどの非自己核酸からこうした微生物を保護するのに役立つ。CRISPR RNAエレメントをコードするデオキシリボ核酸(DNA)エレメントは、構造及び長さが比較的保存され得るが、それらのCRISPR関連(Cas)タンパク質は、高度に多様であり、非常に様々な核酸相互作用ドメインを含有する。CRISPR DNAエレメントは、早くも1987年に観察されているが、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能力は、比較的最近でしか認識されておらず、多様なDNA操作および遺伝子編集用途における組換えCRISPR/Casシステムの使用につながっている。
一部の態様では、本開示は、(a)配列番号550~567を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するよう構成されたエンドヌクレアーゼ、当該エンドヌクレアーゼは、クラス2タイプII Casエンドヌクレアーゼである;および(b)(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成されたガイドリボ核酸配列;および(ii)当該エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む当該エンドヌクレアーゼと複合体を形成するよう構成された操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。一部の実施形態では、当該エンドヌクレアーゼは、培養されていない微生物に由来する。一部の実施形態では、当該エンドヌクレアーゼは、異なるPAM配列に結合するよう操作されていない。一部の実施形態では、当該エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。一部の実施形態では、当該エンドヌクレアーゼは、Cas9エンドヌクレアーゼと80%未満の同一性を有する。一部の実施形態では、当該エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、当該操作されたガイドリボ核酸構造は、少なくとも二つのリボ核酸ポリヌクレオチドを含む。一部の実施形態では、当該操作されたガイドリボ核酸構造は、当該ガイドリボ核酸配列および当該tracrリボ核酸配列を含む一つのリボ核酸ポリヌクレオチドを含む。一部の実施形態では、当該ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列に相補的である。一部の実施形態では、当該ガイドリボ核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、当該エンドヌクレアーゼは、当該エンドヌクレアーゼのN末端またはC末端の近位に一つまたは複数の核局在化配列(NLS)を含む。一部の実施形態では、当該NLSは、配列番号586~601から選択される配列を含む。一部の実施形態では、操作されたヌクレアーゼシステムは、5’から3’の方向に、当該標的デオキシリボ核酸配列に対して5’の、少なくとも20個のヌクレオチドの配列を含む第一の相同アーム、少なくとも10個のヌクレオチドの合成DNA配列、および当該標的配列に対して3’の、少なくとも20個のヌクレオチドの配列を含む第二の相同アームを含む一本鎖または二本鎖のDNA修復鋳型をさらに含む。一部の実施形態では、当該第一または第二の相同アームは、少なくとも40、80、120、150、200、300、500、または1,000ヌクレオチドの配列を含む。一部の実施形態では、当該システムは、Mg2+の供給源をさらに含む。一部の実施形態では、当該エンドヌクレアーゼおよび当該tracrリボ核酸配列は、同じ門内の別個の細菌種に由来する。一部の実施形態では、当該エンドヌクレアーゼは、配列番号1~549もしくは602~1276、またはそれと少なくとも55%の同一性を有するそのバリアントを含む。
一態様では、本開示は、(a)配列番号550~567のいずれか一つを含むプロトスペーサー隣接モチーフ(PAM)配列についての選択性を有するよう構成されたエンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供し、エンドヌクレアーゼは、クラス2タイプII Casエンドヌクレアーゼである。一部の実施形態では、システムは、(b)(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、エンドヌクレアーゼと複合体を形成するよう構成された操作されたガイド核酸構造をさらに含む。一部の実施形態では、エンドヌクレアーゼは、培養されていない微生物に由来する。一部の実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼの天然のPAM配列とは異なるPAM配列に結合するよう操作されていない。一部の実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。一部の実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼと80%未満の同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号553、555、もしくは566のいずれか一つを含むPAM配列、またはそのバリアントについての選択性を有するよう構成されている。一部の実施形態では、操作されたガイド核酸構造は、少なくとも二つのリボ核酸ポリヌクレオチドを含む。一部の実施形態では、操作されたガイド核酸構造は、ガイドリボ核酸配列およびtracrリボ核酸配列を含む一つのリボ核酸ポリヌクレオチドを含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、標的化核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位に一つまたは複数の核局在化配列(NLS)を含む。NLSは、配列番号586~601のいずれか一つ、またはそのバリアントを含む配列を含む。一部の実施形態では、システムは、5’から3’の方向に、標的デオキシリボ核酸配列に対して5’の、少なくとも20個のヌクレオチドの配列を含む第一の相同アーム、少なくとも10個のヌクレオチドの合成DNA配列、および標的配列に対して3’の、少なくとも20個のヌクレオチドの配列を含む第二の相同アームを含む一本鎖または二本鎖のDNA修復鋳型をさらに含む。一部の実施形態では、第一または第二の相同アームは、少なくとも40、80、120、150、200、300、500、または1,000ヌクレオチドの配列を含む。一部の実施形態では、システムは、Mg2+の供給源をさらに含む。一部の実施形態では、エンドヌクレアーゼおよびtracrリボ核酸配列は、同じ門内の別個の細菌種に由来する。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む。一部の実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFTアルゴリズム、またはSmith-Waterman相同性検索アルゴリズムパラメーターを用いたCLUSTALWアルゴリズムによって決定される。一部の実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、および11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定される。一部の実施形態では、PAM配列は、標的デオキシリボ核酸配列の3’にある。
一部の態様では、本開示は、生物における発現のため最適化された操作された核酸配列を含む核酸を提供し、核酸は、配列番号550~567のいずれか一つを含むプロトスペーサー隣接モチーフ(PAM)について選択的であるよう構成されたクラス2タイプII Casエンドヌクレアーゼをコードする。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいはエンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、生物は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒト生物である。
一部の態様では、本開示は、(a)配列番号1~549、602~1276のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアント;および(b)操作されたガイド核酸構造を含む操作されたヌクレアーゼシステムを提供し、操作されたガイドRNAは、エンドヌクレアーゼと複合体を形成するよう構成され、操作されたガイドRNAは、標的核酸配列にハイブリダイズするよう構成された標的化核酸配列を含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。
一部の態様では、本開示は、(a)(i)配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列;または(ii)配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む操作されたガイド核酸構造、および(b)操作されたガイド核酸構造に結合するよう構成されたクラス2タイプII Casエンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、エンドヌクレアーゼは、配列番号1~549、602~1276のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つに記載の配列、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。
一部の態様では、本開示は、(a)標的DNA分子における標的配列と相補的であるヌクレオチド配列を含む標的化核酸配列;および(b)ハイブリダイズして二本鎖RNA(dsRNA)デュプレックスを形成するヌクレオチドの二つの相補的区画を含むタンパク質結合セグメント、その一つが、tracr配列を含み、ヌクレオチドの二つの相補的区画が、介在するヌクレオチドと互いに共有結合している、を含む操作されたガイド核酸構造を提供し、操作されたガイドリボ核酸ポリヌクレオチドは、配列番号1~549、602~1276のいずれか一つ、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するエンドヌクレアーゼと複合体を形成し、複合体を標的DNA分子の標的配列に標的化する能力がある。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。
一部の態様では、本開示は、本明細書に記載される核酸のいずれかを含む操作されたベクターを提供する。一部の実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、レンチウイルス、またはアデノウイルスである。
一部の態様では、本開示は、本明細書に記載されるベクターのいずれかまたは本明細書に記載される核酸のいずれかを含む細胞を提供する。一部の実施形態では、細胞は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒト細胞である。
一部の態様では、本開示は、本明細書に記載される細胞のいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。
一部の態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを、エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するよう構成された操作されたガイド核酸構造との複合体におけるクラス2タイプII Casエンドヌクレアーゼと接触させることを含む、二本鎖デオキシリボ核酸ポリヌクレオチドを結合するか、切断するか、印付けするか、または修飾する方法を提供し、二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、PAMは、配列番号550~567のいずれか一つに記載の配列を含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいはエンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。
一部の態様では、本開示は、細胞に、(a)RNAガイドエンドヌクレアーゼ;および(b)操作されたガイド核酸構造を接触させることを含む、細胞におけるAAVS1遺伝子座を編集する方法を提供し、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、操作されたガイド核酸構造は、AAVS1遺伝子座の領域にハイブリダイズするよう構成されたスペーサー配列を含み、操作されたガイド核酸構造は、配列番号1665~1666のいずれか一つの少なくとも18個の連続ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する標的化配列またはその逆相補鎖を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1663または1664のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、操作されたガイド核酸構造は、MG71-2-AAVS1-sgRNA-C3またはMG71-2-AAVS1-sgRNA-E2である。
一部の態様では、本開示は、細胞に、(a)RNAガイドエンドヌクレアーゼ;および(b)操作されたガイド核酸構造を接触させることを含む、細胞におけるTRAC遺伝子座を編集する方法を提供し、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、操作されたガイド核酸構造は、TRAC遺伝子座の領域にハイブリダイズするよう構成されたスペーサー配列を含み、操作されたガイド核酸構造は、配列番号1668もしくは1676~1682のいずれか一つの少なくとも18個の連続ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する標的化配列またはその逆相補鎖を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1667または1669~1675のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、操作されたガイド核酸構造は、MG73-1-TRAC-sgRNA-G3、MG89-2-TRAC-sgRNA-F1、MG89-2-TRAC-sgRNA-G5、MG89-2-TRAC-sgRNA-E5、MG89-2-TRAC-sgRNA-F5、MG89-2-TRAC-sgRNA-G1、MG89-2-TRAC-sgRNA-E1、MG89-2-TRAC-sgRNA-B1である。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、RNAガイドエンドヌクレアーゼは、クラス2、タイプII Casエンドヌクレアーゼである。一部の実施形態では、エンドヌクレアーゼは、配列番号550~567のいずれか一つを含むPAM配列についての選択性を有するよう構成されている。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいはエンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。
本開示の更なる態様及び利点は、以下の詳細な説明から、当業者に容易に明らかになり、ここで、本開示の例示的な実施形態のみが示され、記載される。理解されるように、本開示は、他の異なる実施形態をすることができ、そのいくつかの詳細は、全て本開示から逸脱することなく、様々な明白な点において改変することができる。したがって、図面および説明は、本質的に例示とみなされるべきであり、制限としみなされるべきではない。
参照による組み込み
本明細書において言及されるすべての刊行物、特許、および特許出願は、それぞれ個々の刊行物、特許、または特許出願が、参照により組み込まれるべきことが具体的かつ個別に示されているのと同じ程度に、参照により本明細書に組み込まれる。
本明細書において言及されるすべての刊行物、特許、および特許出願は、それぞれ個々の刊行物、特許、または特許出願が、参照により組み込まれるべきことが具体的かつ個別に示されているのと同じ程度に、参照により本明細書に組み込まれる。
本発明の新規の特徴は、添付の特許請求の範囲に特記して記載される。本発明の特徴および利点のより良好な理解は、本発明の原理が利用される例示的な実施形態を記載する以下の詳細な説明、および添付の図面(また、本明細書において「図」および「図」)を参照することによって得られるだろう。
図1は、異なるクラスおよびタイプのCRISPR/Cas遺伝子座の典型的な機構を示す。
図2は、両方が結合されるハイブリッドsgRNAと比較した、天然のクラスII/タイプII crRNA/tracrRNA対の構造を示す。
図3(例えば、図3A、3B、3C、3D、および3E)は、本明細書に記載される(例えば、実施例3に記載される)NGSを介して誘導されるPAM配列のseqLogo表示を示す。
図3(例えば、図3A、3B、3C、3D、および3E)は、本明細書に記載される(例えば、実施例3に記載される)NGSを介して誘導されるPAM配列のseqLogo表示を示す。
図3(例えば、図3A、3B、3C、3D、および3E)は、本明細書に記載される(例えば、実施例3に記載される)NGSを介して誘導されるPAM配列のseqLogo表示を示す。
図3(例えば、図3A、3B、3C、3D、および3E)は、本明細書に記載される(例えば、実施例3に記載される)NGSを介して誘導されるPAM配列のseqLogo表示を示す。
図3(例えば、図3A、3B、3C、3D、および3E)は、本明細書に記載される(例えば、実施例3に記載される)NGSを介して誘導されるPAM配列のseqLogo表示を示す。
図4は、実施例7におけるK562細胞中のTRACおよびAAVS1についてのDNAレベルでの遺伝子編集結果を示す。
配列表の簡単な説明
本明細書と共に提出された配列表は、本開示による方法、組成物、およびシステムで使用するためのポリヌクレオチド配列およびポリペプチド配列の例を提供する。以下は、その中の配列の説明例である。
本明細書と共に提出された配列表は、本開示による方法、組成物、およびシステムで使用するためのポリヌクレオチド配列およびポリペプチド配列の例を提供する。以下は、その中の配列の説明例である。
MG44
配列番号1~216および602~938は、MG44ヌクレアーゼの全長ペプチド配列を示す。
配列番号550は、MG44ヌクレアーゼと適合するPAM配列を示す。
配列番号568は、MG44ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1277~1419は、MG44ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1645は、上記のMG44ヌクレアーゼと同じ遺伝子座に由来するMG44 tracrRNAのヌクレオチド配列を示す。
MG46
配列番号217~257および939~1104は、MG46ヌクレアーゼの全長ペプチド配列を示す。
配列番号551は、MG46ヌクレアーゼと適合するPAM配列を示す。
配列番号569は、MG46ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1420~1497は、MG46ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1646は、上記のMG46ヌクレアーゼと同じ遺伝子座に由来するMG46 tracrRNAのヌクレオチド配列を示す。
MG71
配列番号258~283および1105は、MG71ヌクレアーゼの全長ペプチド配列を示す。
配列番号552~553は、MG71ヌクレアーゼと適合するPAM配列を示す。
配列番号570~571は、MG71ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1498~1499は、MG71ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1643~1644は、MG71ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1647~1648は、上記のMG71ヌクレアーゼと同じ遺伝子座に由来するMG71 tracrRNAのヌクレオチド配列を示す。
MG72
配列番号284~295および1106~1115は、MG72ヌクレアーゼの全長ペプチド配列を示す。
配列番号554は、MG72ヌクレアーゼと適合するPAM配列を示す。
配列番号572は、MG72ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1649は、上記のMG72ヌクレアーゼと同じ遺伝子座に由来するMG72 tracrRNAのヌクレオチド配列を示す。
MG73
配列番号296~305および1116~1118は、MG73ヌクレアーゼの全長ペプチド配列を示す。
配列番号555は、MG73ヌクレアーゼと適合するPAM配列を示す。
配列番号573~574は、MG73ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1500~1505は、MG73ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1650~1651は、上記のMG73ヌクレアーゼと同じ遺伝子座に由来するMG73 tracrRNAのヌクレオチド配列を示す。
MG74
配列番号306~355および1119~1160は、MG74ヌクレアーゼの全長ペプチド配列を示す。
配列番号556は、MG74ヌクレアーゼと適合するPAM配列を示す。
配列番号575は、MG74ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1506~1519は、MG74ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1652は、上記のMG74ヌクレアーゼと同じ遺伝子座に由来するMG74 tracrRNAのヌクレオチド配列を示す。
MG86
配列番号356~402および1161~1206は、MG86ヌクレアーゼの全長ペプチド配列を示す。
配列番号557~559は、MG86ヌクレアーゼと適合するPAM配列を示す。
配列番号576~577は、MG86ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1520~1578は、MG86ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1642は、MG86ヌクレアーゼの単一ガイドPAMのヌクレオチド配列を示す。
配列番号1653~1654は、上記のMG86ヌクレアーゼと同じ遺伝子座に由来するMG86 tracrRNAのヌクレオチド配列を示す。
MG87
配列番号403~462および1207~1247は、MG87ヌクレアーゼの全長ペプチド配列を示す。
配列番号560~562は、MG87ヌクレアーゼと適合するPAM配列を示す。
配列番号578~580は、MG87ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1579~1615は、MG87ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1655~1657は、上記のMG87ヌクレアーゼと同じ遺伝子座に由来するMG87 tracrRNAのヌクレオチド配列を示す。
MG88
配列番号463~482および1248~1258は、MG88ヌクレアーゼの全長ペプチド配列を示す。
配列番号563~565は、MG88ヌクレアーゼと適合するPAM配列を示す。
配列番号581~583は、MG88ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1616~1628は、MG88ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1658~1660は、上記のMG88ヌクレアーゼと同じ遺伝子座に由来するMG88 tracrRNAのヌクレオチド配列を示す。
MG89
配列番号483~549および1259~1276は、MG89ヌクレアーゼの全長ペプチド配列を示す。
配列番号566~567は、MG89ヌクレアーゼと適合するPAM配列を示す。
配列番号584~585は、MG89ヌクレアーゼと機能するように操作されたsgRNAのヌクレオチド配列を示し、Nsは、標的化配列のヌクレオチドを示す。
配列番号1629~1641は、MG89ヌクレアーゼのPAM相互作用ドメインのペプチド配列を示す。
配列番号1661~1662は、上記のMG88ヌクレアーゼと同じ遺伝子座に由来するMG88 tracrRNAのヌクレオチド配列を示す。
MG71-2 AAVS1標的化
配列番号1663~1664は、AAVS1を標的化するために、MG71-2ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1663~1664は、AAVS1を標的化するために、MG71-2ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1665~1666は、AAVS1標的部位のDNA配列を示す。
MG73-1 TRAC標的化
配列番号1667は、TRACを標的化するために、MG73-1ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1667は、TRACを標的化するために、MG73-1ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1668は、TRAC標的部位のDNA配列を示す。
MG89-2 TRAC標的化
配列番号1669~1675は、TRACを標的化するために、MG89-2ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1669~1675は、TRACを標的化するために、MG89-2ヌクレアーゼで機能するよう操作されたsgRNAのヌクレオチド配列を示す。
配列番号1676~1682は、TRAC標的部位のDNA配列を示す。
本発明の様々な実施形態は本明細書に示され、記載されるが、このような実施形態が、例示の目的でのみ提供されることは、当業者には明らかであろう。多数の変形、変更、及び置換は、本発明から逸脱することなく、当業者にとって生じ得る。本明細書に記載される本発明の実施形態に対する様々な代替が用いられ得ることは、理解されるべきである。
本明細書に開示されるいくつかの方法の実践は、別段の示唆がない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組換えDNAの技術を用いる。例えば、Sambrook and Green,Molecular Cloning:A Laboratory Manual,4th Edition(2012);the series Current Protocols in Molecular Biology(F.M.Ausubel,et al.eds.);the series Methods In Enzymology(Academic Press, Inc.),PCR 2:A Practical Approach (M.J.MacPherson,B.D.Hames and G.R.Taylor eds.(1995)),Harlow and Lane,eds.(1988)Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications,6th Edition(R.I.Freshney,ed.(2010))(参照により本明細書に完全に組み込まれる)を参照のこと。
本明細書で使用される場合、単数形「a」、「an」及び「the」は、文脈が別途明確に示さない限り、複数形も含むことが意図される。更に、用語「含むこと」、「含む」、「有すること」、「有する」、「有する」、又はそのバリアントが、詳細な説明及び/又は特許請求の範囲のいずれかで使用される限りにおいて、かかる用語は、用語「含むこと」と類似した様式で包含的であることが意図される。
用語「約」又は「およそ」は、当業者によって決定される特定の値についての許容可能な誤差範囲内を意味し、これは、値がどのように測定又は決定されるか、すなわち、測定システムの限界に部分的に依存する。例えば、「約」は、当該技術分野の慣行によると、一つ以上の標準偏差内を意味し得る。あるいは、「約」は、所与の値の最大20%、最大15%、最大10%、最大5%、または最大1%の範囲を意味し得る。
本明細書で使用される場合、「細胞」は概して生物学的細胞を指す。細胞は、生きている生物の基本的な構造、機能、及び/又は生物学的単位であり得る。細胞は、一つ以上の細胞を有する任意の生物を起源とし得る。いくつかの非限定的な例としては、原核細胞、真核生物の細胞、細菌細胞、古細菌細胞、単一細胞の真核生物の細胞、原虫細胞、植物由来の細胞(例えば、植物作物、果実、野菜、穀物、大豆、トウモロコシ、トウモロコシ、小麦、種子、トマト、米、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、綿、大麻、タバコ、開花している植物、針葉樹、ジムノスパーム、シダ、ヒカゲノカズラ、ツノゴケ、コケ植物、コケ由来の細胞)、藻類の細胞(例えば、ボトリオコッカス・ブラウニイ(Botryococcus braunii)、クラミドモナス・ラインハートティ(Chlamydomonas reinhardtii)、ナンノクロロプシス・ガジタナ(Nannochloropsis gaditana)、クロレラ・ピレノイドサ(Chlorella pyrenoidosa)、サルガッスム・パテンスC.アガード(Sargassum patens C.Agardh)など)、海藻(例えば、ケルプ)、真菌細胞(例えば、酵母細胞、キノコ由来の細胞)、動物細胞、脊椎動物(例えば、フルーツフライ、クニダリアン、エキノデルム、線虫など)由来の細胞、脊椎動物(例えば、魚、両生類、爬虫類、鳥類、哺乳類)由来の細胞、哺乳類(例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒトなど)由来の細胞などが挙げられる。場合によっては、細胞は、天然の生物に由来するものではない(例えば、細胞は、合成的に作製されてもよく、時には人工細胞と呼ばれることがある)。
本明細書で使用される場合、用語「ヌクレオチド」は、概して、塩基-糖-リン酸の組み合わせを指す。ヌクレオチドは、合成ヌクレオチドを含んでもよい。ヌクレオチドは、合成ヌクレオチドアナログを含んでもよい。ヌクレオチドは、核酸配列(例えば、デオキシリボ核酸(DNA)およびリボ核酸(RNA))の単量体単位であってもよい。ヌクレオチドという用語は、リボヌクレオシド三リン酸アデノシン三リン酸(ATP)、ウリジン三リン酸(UTP)、シトシン三リン酸(CTP)、グアノシン三リン酸(GTP)及びデオキシリボヌクレオシド三リン酸、例えば、dATP、dCTP、dITP、dUTP、dGTP、dTTP、又はその誘導体を含み得る。かかる誘導体としては、例えば、[αS]dATP、7-デアザ-dGTP及び7-デアザ-dATP、並びにそれらを含有する核酸分子にヌクレアーゼ耐性を付与するヌクレオチド誘導体を挙げることができる。本明細書で使用される場合、ヌクレオチドという用語は、ジデオキシリボヌクレオシド三リン酸(ddNTP)及びその誘導体を指す場合がある。ジデオキシリボヌクレオシド三リン酸の例としては、ddATP、ddCTP、ddGTP、ddITP、及びddTTPが挙げられるが、これらに限定されない。ヌクレオチドは、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を使用するなど、非標識又は検出可能に標識されてもよい。標識はまた、量子ドットを用いて行われてもよい。検出可能な標識としては、例えば、放射性同位元素、蛍光標識、化学発光標識、生物発光標識、及び酵素標識を挙げることができる。ヌクレオチドの蛍光標識は、フルオレセイン、5-カルボキシフルオレセイン(FAM)、2′7′-ジメトキシ-4′5-ジクロロ-6-カルボキシフルオレセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N′,N′-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4′ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、カスケードブルー、オレゴングリーン、テキサスレット、シアニンおよび5-(2′-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)を含むが、これらに限定されない。蛍光標識されたヌクレオチドの具体的な例としては、Perkin Elmer、Foster City、Califから入手可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、および[dROX]ddTTP;Amersham、Arlington Heights、Ill.から入手可能なフルオロ結合デオキシヌクレオチド、フルオロ結合Cy3-dCTP、フルオロ結合Cy5-dCTP、フルオロ結合フルオロX-dCTP、フルオロ結合Cy3-dUTP、およびフルオロ結合Cy5-dUTP;Boehringer Mannheim、Indianapolis、Ind.から入手可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-ローダミン-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、およびフルオレセイン-15-2′-dATP;ならびにMolecular Probes、Eugene、Oregから入手可能な染色体標識ヌクレオチド、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、カスケードブルー-7-UTP、カスケードブルー-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、オレゴングリーン488-5-dUTP、ローダミングリーン-5-UTP、ローダミングリーン-5-dUTP、テトラメチルローダミン-6-UTP、テトラメチルローダミン-6-dUTP、テキサスレッド-5-UTP、テキサスレッド-5-dUTP、およびテキサスレッド-12-dUTPを挙げることができる。ヌクレオチドはまた、化学修飾によって標識または印付けられてもよい。化学修飾された単一ヌクレオチドは、ビオチン-dNTPであり得る。ビオチン化dNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、ビオ-N6-ddATP、ビオチン-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、およびビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)が挙げられる。
用語「ポリヌクレオチド」、「オリゴヌクレオチド」、および「核酸」は、概して、デオキシリボヌクレオチドもしくはリボヌクレオチド、またはそのアナログのいずれかを、一本鎖、二本鎖、または多本鎖の形態で、任意の長さのヌクレオチドのポリマー形態を指すように互換的に使用される。ポリヌクレオチドは、細胞にとって外因性又は内因性であってもよい。ポリヌクレオチドは、無細胞環境に存在してもよい。ポリヌクレオチドは、遺伝子又はその断片であってもよい。ポリヌクレオチドは、DNAであってもよい。ポリヌクレオチドは、RNAであってもよい。ポリヌクレオチドは、任意の三次元構造を有してもよく、任意の機能を発揮してもよい。ポリヌクレオチドは、一つ以上のアナログ(例えば、改変された骨格、糖、又は核酸塩基)を含んでもよい。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリの前又は後に付与されてもよい。アナログのいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、異種核酸、モルホリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コーディセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に結合したローダミンまたはフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基アナログ、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、シュードウリジン、ジヒドロウリジン、クエオシン、およびワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子又は遺伝子断片のコード又は非コード領域、結合解析から定義した遺伝子座(遺伝子座)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA(tRNA)、リボソームRNA(rRNA)、短い干渉RNA(siRNA)、短いヘアピンRNA(shRNA)、マイクロ-RNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、細胞を含まないDNA(cfDNA)及び細胞を含まないRNA(cfRNA)を含む細胞を含まないポリヌクレオチド、核酸プローブ、並びにプライマーが挙げられる。ヌクレオチドの配列は、非ヌクレオチド成分によって中断され得る。
用語「トランスフェクション」または「トランスフェクトされた」は、概して、非ウイルスまたはウイルスベースの方法による細胞内への核酸の導入を指す。核酸分子は、完全なタンパク質又はその機能的部分をコードする遺伝子配列であってもよい。例えば、Sambrook et al.,1989,Molecular Cloning:A Laboratory Manual,18.1-18.88を参照のこと。
用語「ペプチド」、「ポリペプチド」、および「タンパク質」は、本明細書において互換的に使用され、概して、ペプチド結合(複数可)によって結合された少なくとも二つのアミノ酸残基のポリマーを指す。この用語は、ポリマーの特定の長さを意味しておらず、ペプチドが組換え技術、化学若しくは酵素合成を使用して産生されるか、又は天然に存在するかを暗示又は区別することを意図するものではない。この用語は、天然に存在するアミノ酸ポリマー並びに少なくとも一つの修飾アミノ酸を含むアミノ酸ポリマーに適用する。場合によっては、ポリマーは、非アミノ酸によって中断されてもよい。用語は、全長タンパク質、及び二次及び/又は三次構造を有するか又は有さないタンパク質(例えば、ドメイン)を含む、任意の長さのアミノ酸鎖を含む。用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質形成、アセチル化、リン酸化、酸化、及び標識成分とのコンジュゲーションなどの任意の他の操作によって修飾されたアミノ酸ポリマーを包含する。本明細書で使用される場合、「アミノ酸」及び「複数のアミノ酸」という用語は、概して、修飾アミノ酸及びアミノ酸アナログを含むが、これに限定されない天然及び非天然アミノ酸を指す。修飾アミノ酸は、天然アミノ酸及び非天然アミノ酸を含んでもよく、これは、アミノ酸上に天然に存在しない基又は化学的部分を含むように化学的に修飾されている。アミノ酸アナログは、アミノ酸誘導体を指す場合がある。用語「アミノ酸」は、D-アミノ酸とL-アミノ酸の両方を含む。
本明細書において使用される場合、「非天然」は、概して、天然の核酸またはタンパク質に存在しない核酸またはポリペプチド配列を指すことができる。非天然は、親和性タグを指してもよい。非天然は、融合物を指してもよい。非天然は、変異、挿入、及び/又は欠失を含む、天然に存在する核酸又はポリペプチド配列を指してもよい。非天然配列は、非天然配列が融合される核酸配列及び/又はポリペプチド配列によっても呈され得る活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性など)を示し得、かつ/又はコードし得る。非天然核酸又はポリペプチド配列を、遺伝子操作によって天然に生じる核酸及び/又はポリペプチド配列(若しくはそのバリアント)に連結して、キメラ核酸又はポリペプチドをコードするキメラ核酸及び/又はポリペプチド配列を生成してもよい。
本明細書で使用される場合、用語「プロモーター」は、概して、遺伝子の転写又は発現を制御し、RNA転写が開始されるヌクレオチドのヌクレオチド又はヌクレオチドの領域に隣接するか、又は重複して位置し得る調節DNA領域を指す。プロモーターは、しばしば転写因子と呼ばれるタンパク質因子に結合する特定のDNA配列を含有してもよく、これは、RNAポリメラーゼのDNAへの結合を促進し、これにより、遺伝子転写をもたらす。「コアプロモーター」とも呼ばれる「基礎プロモーター」は、概して、作動可能に連結されたポリヌクレオチドの転写発現を促進するための全ての塩基性必須要素を含有するプロモーターを指してもよい。真核生物の基礎プロモーターは、必ずしもではないが典型的には、TATA-ボックス及び/又はCAATボックスを含む。
本明細書で使用される場合、用語「発現」は、概して、核酸配列若しくはポリヌクレオチドがDNA鋳型から(例えば、mRNA若しくは他のRNA転写物に)転写されるプロセス、及び/又は転写mRNAが続いてペプチド、ポリペプチド、若しくはタンパク質に翻訳されるプロセスを指す。転写物及びコードされたポリペプチドは、「遺伝子産物」と総称され得る。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核生物の細胞におけるmRNAのスプライシングを含む。
本明細書で使用される場合、「作動可能に連結された」、「作動可能な連結」、「作動可能に連結された」、又はその文法的な均等物は、概して、遺伝子エレメント、例えば、プロモーター、エンハンサー、ポリアデニル化配列などの並列化を指し、ここで、エレメントは、それらが予期される様式で作動することを可能にする関係にある。例えば、プロモーター配列及び/又はエンハンサー配列を含み得る、調節エレメントは、調節エレメントが、コード配列の転写を開始するのを助ける場合、コード領域に作動可能に連結される。この機能的関係が維持される限り、制御エレメントとコード領域との間に介在する残基があってもよい。
本明細書で使用される場合、「ベクター」は、概して、ポリヌクレオチドを含むか、またはポリヌクレオチドと会合し、ポリヌクレオチドの細胞への送達を媒介するために使用され得る高分子または高分子の会合を指す。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、及び他の遺伝子送達ビヒクルが挙げられる。ベクターは、概して、標的中の遺伝子の発現を促進するために遺伝子に作動可能に連結された、遺伝子エレメント、例えば、制御エレメントを含む。
本明細書において使用される場合、「発現カセット」および「核酸カセット」は、または発現のために作動可能に連結される核酸配列またはエレメントの組み合わせを指すために概して互換的に使用される。ある場合では、発現カセットは、発現のために作動可能に連結されている制御エレメントと遺伝子または複数の遺伝子との組み合わせを指す。
DNAまたはタンパク質配列の「機能的断片」は、概して、全長DNAまたはタンパク質配列の生物学的活性と実質的に類似した生物学的活性(機能的または構造的のいずれか)を保持する断片を指す。DNA配列の生物学的活性は、全長配列に起因することが公知の様式で発現に影響を与える能力であってもよい。
本明細書で使用される場合、「操作された」対象は、概して、対象がヒトの介入によって修飾されたことを示す。非限定的な実施例によれば、核酸は、その配列を、天然では生じない配列に改変することによって修飾されてもよく、核酸は、ライゲーションされた産物が、オリジナルの核酸に存在しない機能を有するように、天然では関連しない核酸にライゲーションすることによって修飾されてもよく、操作された核酸は、天然では存在しない配列を用いてインビトロで合成されてもよく、タンパク質は、天然では存在しない配列にそのアミノ酸配列を変更することによって修飾されてもよく、操作されたタンパク質は、新しい機能又は特性を獲得してもよい。「操作された」システムは、少なくとも一つの操作された構成要素を含む。
本明細書において使用される場合、「合成」および「人工」は、天然に存在するヒトタンパク質と低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有するタンパク質またはそのドメインを指すために互換的に使用される。例えば、VPRドメインおよびVP64ドメインは、合成トランス活性化ドメインである。
本明細書で使用される場合、用語「tracrRNA」または「tracr配列」は、概して、野生型の例となるtracrRNA配列(例えば、ストレプトコッカス・ピオゲネス、黄色ブドウ球菌由来のtracrRNAなど)と少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、もしくは100%の配列同一性および/または配列類似性を有する核酸を指すことができる。tracrRNAは、野生型の例となるtracrRNA配列(例えば、ストレプトコッカス・ピオゲネス、黄色ブドウ球菌由来のtracrRNAなど)に対し最大約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、もしくは100%の配列同一性及び/または配列類似性を有する核酸を指すことができる。tracrRNAは、欠失、挿入、もしくは置換、バリアント、変異、またはキメラなどのヌクレオチド変更を含み得るtracrRNAの修飾形態を指す。tracrRNAは、少なくとも6つの連続ヌクレオチドの区間にわたって、野生型の例となるtracrRNA(例えば、ストレプトコッカス・ピオゲネス、黄色ブドウ球菌由来のtracrRNA)配列と少なくとも約60%同一であり得る核酸を指してもよい。例えば、tracrRNA配列は、少なくとも6つの連続するヌクレオチドの区画にわたって野生型の例となるtracrRNA(例えば、トレプトコッカス・ピオゲネス、黄色ブドウ球菌由来のtracrRNAなど)配列と少なくとも約60%同一、少なくとも約65%同一、少なくとも約70%同一、少なくとも約75%同一、少なくとも約80%同一、少なくとも約85%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、または100%同一であり得る。タイプII tracrRNA配列は、隣接するCRISPRアレイ中のリピート配列の一部に対して相補性を有する領域を特定することによって、ゲノム配列上で予測することができる。
本明細書において使用される場合、「ガイド核酸」は、概して、別の核酸にハイブリダイズし得る核酸を指すことができる。ガイド核酸は、RNAであってもよい。ガイド核酸は、DNAであってもよい。ガイド核酸は、部位特異的に核酸の配列に結合するようにプログラムされてもよい。標的化されるべき核酸、又は標的核酸は、ヌクレオチドを含んでもよい。ガイド核酸は、ヌクレオチドを含んでもよい。標的核酸の一部は、ガイド核酸の一部に対して相補的であってもよい。ガイド核酸に相補的であり、ガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖を、相補鎖と呼ぶことができる。相補鎖に相補的であり、それゆえ、ガイド核酸に相補的ではない二本鎖標的ポリヌクレオチドの鎖は、非相補鎖と呼ばれてもよい。ガイド核酸は、ポリヌクレオチド鎖を含んでもよく、また「単一ガイド核酸」と呼ばれ得る。ガイド核酸は、二つのポリヌクレオチド鎖を含んでもよく、また「ダブルガイド核酸」と呼ばれ得る。そうでない場合、用語「ガイド核酸」は、単一ガイド核酸とダブルガイド核酸の両方を指す、包括的であってもよい。ガイド核酸は、「核酸標的化セグメント」または「核酸標的化配列」と称され得るセグメントを含み得る。核酸標的化セグメントは、「タンパク質結合セグメント」または「タンパク質結合配列」または「Casタンパク質結合セグメント」と称され得るサブセグメントを含んでもよい。
二つ以上の核酸またはポリペプチド配列の文脈における用語「配列同一性」または「パーセント同一性」は、概して、配列比較アルゴリズムを使用して測定された場合、局所比較ウィンドウまたはグローバル比較ウィンドウにわたって最大対応のために比較および整列されたとき、同一であるか、または特定のパーセンテージの、同一であるアミノ酸残基またはヌクレオチドを有する、二つ(例えば、ペアワイズアラインメントで)またはそれ以上(例えば、複数の配列アラインメントにおける)の配列を指す。ポリペプチド配列に好適な配列比較アルゴリズムとしては、例えば、3のワード長(W)、10の期待値(E)、および11の存在のパラメーター、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、かつ30残基より長いポリペプチド配列についての条件付き組成スコアマトリックス調整を使用したBLASTP;2のワード長(W)、1000000の期待値(E)のパラメーター、およびオープンギャップに対して9および30残基より短い配列についての拡張ギャップに対して1でのPAM30スコアリング設定ギャップコストを使用したBLASTP(https://blast.ncbi.nlm.nih.govで入手可能なBLASTにおいてBLASTPについてのデフォルトのパラメーターが存在する);2の一致、-1のミスマッチ、および-1のギャップのパラメーターを用いたSmith-Waterman相同性検索アルゴリズムを用いたCLUSTALW;デフォルトパラメーターを用いたMUSCLE;2のパラメーターリツリーおよび1000の最大反復を用いたMAFFT;デフォルトパラメーターを用いたNovafold;デフォルトパラメーターを用いたHMMER hmmalignが挙げられる。
本明細書において使用される場合、用語「RuvC_IIIドメイン」は、概して、RuvCエンドヌクレアーゼドメインの第三の不連続セグメントを指す(RuvCヌクレアーゼドメインは、三つの不連続セグメントであるRuvC_I、RuvC_II、およびRuvC_IIIから構成される)。RuvCドメインまたはそのセグメントは、概して、公知のドメイン配列へのアライメント、注釈付きドメインを有するタンパク質への構造的アライメント、または公知のドメイン配列(例えば、RuvC_IIIのPfam HMM PF18541)に基づいて構築されたHidden Markov Models(HMM)との比較によって識別することができる。
本明細書において使用される場合、用語「HNHドメイン」は、概して、特徴的なヒスチジン残基およびアスパラギン残基を有するエンドヌクレアーゼドメインを指す。HNHドメインは、概して、公知のドメイン配列へのアライメント、注釈付きドメインを有するタンパク質への構造的アライメント、または公知のドメイン配列(例えば、ドメインHNHのPfam HMM PF01844)に基づいて構築されたHidden Markov Models(HMM)との比較によって識別することができる。
本明細書において使用される場合、用語「ウェッジ」(WED)ドメインは、概して、主にsgRNAおよびPAM二重の反復:抗反復二重と相互作用するドメイン(例えば、Casタンパク質に存在する)を指す。
本明細書において使用される場合、用語「PAM相互作用ドメイン」は、概して、Casタンパク質によって標的化される領域内のシード配列の外部のプロトスペーサー隣接モチーフ(PAM)と相互作用するドメインを指す。PAM相互作用ドメインの例としては、Casタンパク質に存在するトポイソメラーゼ相同性(TOPO)ドメインおよびC末端ドメイン(CTD)が挙げられるが、これらに限定されない。
一つ以上の保存的アミノ酸置換を有する本明細書に記載される酵素のうちのいずれかのバリアントが、本開示に含まれる。こうした保存的置換は、ポリペプチドの三次元構造又は機能を破壊することなく、ポリペプチドのアミノ酸配列においてなされ得る。保存的置換は、アミノ酸を、互いに同様の疎水性、極性、及びR鎖長で置換することによって達成することができる。加えて、又は代わりに、異なる種由来の相同なタンパク質のアラインされた配列を比較することによって、保存的置換は、コードされたタンパク質の基本的な機能を変化させることなく、種間で変異したアミノ酸残基(例えば、非保存残基)を見つけることによって特定され得る。このような保存的置換されたバリアントは、本明細書に記載されるエンドヌクレアーゼタンパク質配列(例えば、本明細書に記載されるMG44、MG46、MG71、MG72、MG73、MG74、MG86、MG87、MG88、もしくはMG89ファミリーエンドヌクレアーゼ、または本明細書に記載される任意のファミリーヌクレアーゼ)のうちのいずれか一つに対して少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するバリアントを含んでもよい。一部の実施形態では、このような保存的に置換されたバリアントは、機能的バリアントである。こうした機能的バリアントは、エンドヌクレアーゼの一つ以上の重要な活性部位残基又はガイドRNA結合残基の活性が破壊されないように、置換を有する配列を包含することができる。一部の実施形態では、本明細書に記載されるタンパク質のうちのいずれかの機能的バリアントは、本明細書に記載されるエンドヌクレアーゼのRuvCまたはHNHドメインの保存された残基または機能的残基のうちの少なくとも一つの置換を欠く。一部の実施形態では、本明細書に記載されるタンパク質のうちのいずれかの機能的バリアントは、本明細書に記載されるエンドヌクレアーゼのRuvCまたはHNHドメインの保存された残基または機能的残基のうちの全ての置換を欠く。
機能的に類似したアミノ酸をもたらす保存的置換表は、様々な参考文献から入手可能である(例えば、Creighton,Proteins:Structures and Molecular Properties(W H Freeman&Co.;2nd edition(December1993)を参照のこと))。以下の八つの群はそれぞれ、互いに保存的置換であるアミノ酸を含有する:
1)アラニン(A)、グリシン(G)、
2)アスパラギン酸(D)、グルタミン酸(E)、
3)アスパラギン(N)、グルタミン(Q)、
4)アルギニン(R)、リシン(K)、
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V)、
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)、
7)セリン(S)、スレオニン(T)、及び
8)システイン(C)、メチオニン(M)。
1)アラニン(A)、グリシン(G)、
2)アスパラギン酸(D)、グルタミン酸(E)、
3)アスパラギン(N)、グルタミン(Q)、
4)アルギニン(R)、リシン(K)、
5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V)、
6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W)、
7)セリン(S)、スレオニン(T)、及び
8)システイン(C)、メチオニン(M)。
概要
固有の機能性及び構造を有する新しいCas酵素の発見は、デオキシリボ核酸(DNA)編集テクノロジーを更に破壊し、速度、特異性、機能性、及び使いやすさを改善する可能性を付与する可能性がある。微生物におけるクラスター化して規則的な配置の短い回文配列リピート(CRISPR)システムの予測される保有率及び微生物種の純多様性と比較して、比較的少数の機能的に特徴付けられたCRISPR/Cas酵素が、文献に存在する。これは、一部、実験室条件下では、膨大な数の微生物種が容易には培養されないためである。多数の微生物種を表す天然の環境ニッチからのメタゲノムシークエンシングは、公知の新しいCRISPR/Casシステムの数を劇的に増加させ、新しいオリゴヌクレオチド編集機能の発見を早める可能性を付与する可能性がある。このようなアプローチの実りのある最近の例は、天然微生物群集のメタゲノム解析からのCasX/CasY CRISPRシステムの2016年の発見によって示される。
CRISPR/Casシステムは、微生物における適応免疫システムとして機能すると記載されているRNA指向ヌクレアーゼ複合体である。それらの自然な状況では、CRISPR/Casシステムは、CRISPR(クラスター化して規則的な配置の短い回文配列リピート)オペロン又は遺伝子座において生じ、これは概して、二つの部分:(i)RNAベースの標的化エレメントをコードする、同等に短いスペーサー配列によって分けられた短い反復配列(30~40bp)のアレイ;及び(ii)アクセサリータンパク質/酵素と並んだRNAベースの標的化エレメントによって指示されるヌクレアーゼポリペプチドをコードするCasをコードするORFを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は、概して、(i)標的(標的シード)の最初の6~8個の核酸とcrRNAガイドとの間の相補的なハイブリダイゼーション;および(ii)標的シードの画定された近傍内のプロトスペーサー隣接モチーフ(PAM)配列の存在の両方を必要とする(PAMは、通常、宿主ゲノム内に一般的に表されない配列である)。システムの正確な機能および構成に応じて、CRISPR-Casシステムは、共有された機能的特徴および進化的類似性に基づき、2つのクラス、5つのタイプ、および16のサブタイプに一般的に構成されている。
クラスI CRISPR-Casシステムは、大型の複数サブユニットエフェクター複合体を有し、タイプI、III、およびIVを含む。
タイプI CRISPR-Casシステムは、構成要素の面で中程度の複雑さとみなされる。タイプI CRISPR-Casシステムでは、RNA標的化エレメントのアレイは、リピートエレメントで処理される長い前駆crRNA(プレcrRNA)として転写されて、ヌクレアーゼ複合体を核酸標的に配向させる短い成熟crRNAが、その後、プロトスペーサー隣接モチーフ(PAM)と呼ばれる適切な短いコンセンサス配列に引き続いて放出される。このプロセシングは、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット(Cas6)を介して生じ、これは、crRNA指向性ヌクレアーゼ複合体のヌクレアーゼ(Cas3)タンパク質成分も含む。Cas Iヌクレアーゼは、主にDNAヌクレアーゼとして機能する。
タイプIII CRISPRシステムは、CsmまたはCmrタンパク質サブユニットを含む反復関連ミステリアスタンパク質(RAMP)と共に、Cas10として知られる中心ヌクレアーゼの存在によって特徴付けられ得る。タイプIシステムと同様、成熟crRNAは、Cas6様酵素を使用してプレcrRNAから処理される。タイプIおよびIIシステムとは異なり、タイプIIIシステムは、DNA-RNA二本鎖(RNAポリメラーゼの鋳型として使用されるDNA鎖など)を標的化し、開裂するようである。
タイプIV CRISPR-Casシステムは、高度に還元された大きなサブユニットヌクレアーゼ(csf1)、Cas5(csf3)およびCas7(csf2)群のRAMPタンパク質の二つの遺伝子、ならびにある場合では、予測される小さいサブユニットの遺伝子からなるエフェクター複合体を有し、そのようなシステムは、内因性プラスミドに一般的に存在する。
クラスII CRISPR-Casシステムは、概して、単一ポリペプチド複数ドメインヌクレアーゼエフェクターを有し、タイプII、VおよびVIを含む。
タイプII CRISPR-Casシステムは、構成要素の点で最も単純なものとみなされる。タイプII CRISPR-Casシステムでは、CRISPRアレイを成熟crRNAにプロセシングすることは、特別なエンドヌクレアーゼサブユニットの存在を必要としないが、むしろ、アレイリピート配列に相補的な領域を有する小さなトランスコードcrRNA(tracrRNA)であり、tracrRNAは、その対応するエフェクターヌクレアーゼ(例えば、Cas9)およびリピート配列の両方と相互作用して、前駆dsRNA構造を形成し、tracrRNAとcrRNAの両方を負荷した成熟エフェクター酵素を生成するために、内因性RNAse IIIによって切断される。Cas IIヌクレアーゼは、DNAヌクレアーゼとして知られている。タイプ2エフェクターは、概して、RuvC様ヌクレアーゼドメインのフォールドに挿入された無関係なHNHヌクレアーゼドメインを有するRNase Hフォールドに適合するRuvC様エンドヌクレアーゼドメインからなる構造を呈する。RuvC様ドメインは、標的(例えば、crRNA相補的)DNA鎖の切断に関与し、一方、HNHドメインは、置換DNA鎖の切断に関与する。タイプIIエフェクターはまた、crRNA標的DNA領域の近傍のプロトスペーサー隣接モチーフ(PAM)部位の認識に寄与するTOPO領域およびCTD領域を含むPAM相互作用ドメインまたはPIドメインを含むことができる。
タイプV CRISPR-Casシステムは、RuvC様ドメインを含む、タイプIIエフェクターの構造と類似したヌクレアーゼエフェクター(例えば、Cas12)構造によって特徴付けられる。タイプIIと同様に、ほとんどの(すべてではない)タイプV CRISPRシステムは、tracrRNAを使用して、プレcrRNAを成熟crRNAに処理するが、プレcrRNAを複数のcrRNAに切断するためのRNAse IIIを必要とするタイプII型システムとは異なり、タイプVシステムは、エフェクターヌクレアーゼ自体を使用してプレcrRNAを切断することができる。タイプII RISPR-Casシステムと同様に、タイプV CRISPR-Casシステムは、DNAヌクレアーゼとして知られている。タイプII CRISPR-Casシステムとは異なり、一部のタイプV酵素(例えば、Cas12a)は、二本鎖標的配列の第一のcrRNA指向切断によって活性化される、強固な一本鎖非特異的デオキシリボヌクレアーゼ活性を有するようである。
タイプVI CRIPSR-Casシステムは、RNAガイドRNAエンドヌクレアーゼを有する。RuvC様ドメインの代わりに、タイプVIシステム(例えば、Cas13)の単一ポリペプチドエフェクターは、二つのHEPNリボヌクレアーゼドメインを含む。タイプIIとVシステムの両方とは異なり、タイプVIシステムもまた、プレcrRNAをcrRNAに処理するためtracrRNAを必要としないと思われる。しかしながら、タイプVシステムと同様に、一部のタイプVIシステム(例えば、C2C2)は、標的RNAの第一のcrRNA指向切断によって活性化される、頑強な一本鎖非特異的ヌクレアーゼ(リボヌクレアーゼ)活性を有するようである。
クラスII CRISPR-Casは、より単純な構築物であるため、設計ヌクレアーゼ/ゲノム編集適用としての操作および開発に最も広く適用されてきた。
インビトロ使用のためのこのようなシステムの早期適用のうちの一つは、Jinekら (Science.2012 Aug 17;337(6096):816-21、参照により本明細書に完全に組み込まれる)において見ることができる。Jinek試験では、最初に(i)ストレプトコッカス・ピオゲネスSF370から単離した、組換え発現した、精製された全長Cas9(例えば、クラスII、タイプII Cas酵素)、(ii)切断されることが望まれる標的DNA配列に相補的な約20ntの5’配列、続いて3’tracr結合配列を生じる、精製された成熟約42ntのcrRNA(T7プロモーター配列を担持する合成DNA鋳型からインビトロで転写された全crRNA)、(iii)T7プロモーター配列を担持する合成DNA鋳型からインビトロで転写された精製tracrRNA、および(iv)Mg2+を含むシステムを記載した。Jinekは、後に、(ii)のcrRNAが、(iii)の5’末端にリンカー(例えば、GAAA)によって結合されて、それ自体で標的にCas9を誘導することができる単一の融合合成ガイドRNA(sgRNA)を形成する、改良された操作されたシステムを記載した(図2の上部パネルと下部パネルを比較する)。
参照により本明細書に完全に組み込まれる、Maliら(Science.2013 Feb 15;339(6121):823-826.)は、後に、(i)C末端核局在化配列(例えば、SV40 NLS)および適当なポリアデニル化シグナル(例えば、TK pAシグナル)を有する適当な哺乳類プロモーター下でコドン最適化Cas9(例えば、クラスII、タイプII Cas酵素)をコードするORF;ならびに(ii)適当なポリメラーゼIIIプロモーター(例えば、U6プロモーター)下にsgRNA(Gで始まる5′配列、続いて3′tracr結合配列に結合した20ntの相補的標的化核酸配列、リンカー、およびtracrRNA配列を有する)をコードするORFをコードするDNAベクターをもたらすことによって、哺乳類細胞での使用にこのシステムを適合した。
MG酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。ある場合には、エンドヌクレアーゼは、Casエンドヌクレアーゼである。ある場合には、エンドヌクレアーゼは、タイプIIクラスII Casエンドヌクレアーゼである。エンドヌクレアーゼは、RuvCドメインまたはその部分(例えば、RuvC_I、RuvC_II、もしくはRuvC_IIIドメイン)を含んでもよい。エンドヌクレアーゼは、HNHドメインを含んでもよい。エンドヌクレアーゼは、PAM相互作用(PI)ドメインを含んでもよい。
ある場合には、エンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つと少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の同一性を有するバリアントを含んでもよい。ある場合には、エンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つと実質的に同一であってもよい。
一部の実施形態では、本開示によるエンドヌクレアーゼシステムは、表1に記載する成分のいずれかを含み得る。
ある場合には、エンドヌクレアーゼは、一つまたは複数の核局在化配列(NLS)を有するバリアントを含んでもよい。NLSは、当該エンドヌクレアーゼのN末端又はC末端の近位にあってもよい。NLSは、配列番号1~549もしくは602~1276のうちのいずれか一つ、又は配列番号1~549もしくは602~1276のうちのいずれか一つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の同一性を有するバリアントに対してN末端又はC末端に付加されてもよい。NLSは、SV40ラージT抗原NLSであってもよい。NLSは、c-myc NLSであってもよい。NLSは、配列番号586~601のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号586~601のいずれか一つと実質的に同一の配列を含み得る。NLSは、以下の表2中の配列のいずれか、またはその組み合わせを含み得る。
一態様では、本開示は、(a)配列番号550~567のいずれか一つを含むプロトスペーサー隣接モチーフ(PAM)配列についての選択性を有するよう構成されたエンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供し、エンドヌクレアーゼは、クラス2タイプII Casエンドヌクレアーゼである。一部の実施形態では、システムは、(b)(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、エンドヌクレアーゼと複合体を形成するよう構成された操作されたガイド核酸構造をさらに含む。一部の実施形態では、エンドヌクレアーゼは、培養されていない微生物に由来する。一部の実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼの天然のPAM配列とは異なるPAM配列に結合するよう操作されていない。一部の実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas 12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない。一部の実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼと80%未満の同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号553、555、もしくは566のいずれか一つを含むPAM配列、またはそのバリアントについての選択性を有するよう構成されている。一部の実施形態では、操作されたガイド核酸構造は、少なくとも二つのリボ核酸ポリヌクレオチドを含む。一部の実施形態では、操作されたガイド核酸構造は、ガイドリボ核酸配列およびtracrリボ核酸配列を含む一つのリボ核酸ポリヌクレオチドを含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、標的化核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端またはC末端の近位に一つまたは複数の核局在化配列(NLS)を含む。NLSは、配列番号586~601のいずれか一つ、またはそのバリアントを含む配列を含む。一部の実施形態では、システムは、5’から3’の方向に、標的デオキシリボ核酸配列に対して5’の、少なくとも20個のヌクレオチドの配列を含む第一の相同アーム、少なくとも10個のヌクレオチドの合成DNA配列、および標的配列に対して3’の、少なくとも20個のヌクレオチドの配列を含む第二の相同アームを含む一本鎖または二本鎖のDNA修復鋳型をさらに含む。一部の実施形態では、第一または第二の相同アームは、少なくとも40、80、120、150、200、300、500、または1,000ヌクレオチドの配列を含む。一部の実施形態では、システムは、Mg2+の供給源をさらに含む。一部の実施形態では、エンドヌクレアーゼおよびtracrリボ核酸配列は、同じ門内の別個の細菌種に由来する。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む。一部の実施形態では、配列同一性は、BLASTP、CLUSTALW、MUSCLE、MAFFTアルゴリズム、またはSmith-Waterman相同性検索アルゴリズムパラメーターを用いたCLUSTALWアルゴリズムによって決定される。一部の実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメーター、および11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、BLASTP相同性検索アルゴリズムによって決定される。一部の実施形態では、PAM配列は、標的デオキシリボ核酸配列の3’にある。
一部の態様では、本開示は、生物における発現のため最適化された操作された核酸配列を含む核酸を提供し、核酸は、配列番号550~567のいずれか一つを含むプロトスペーサー隣接モチーフ(PAM)について選択的であるよう構成されたクラス2タイプII Casエンドヌクレアーゼをコードする。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいはエンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、生物は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒト生物である。
一部の態様では、本開示は、(a)配列番号1~549、602~1276のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するエンドヌクレアーゼ、またはそのバリアント;および(b)操作されたガイド核酸構造を含む操作されたヌクレアーゼシステムを提供し、操作されたガイドRNAは、エンドヌクレアーゼと複合体を形成するよう構成され、操作されたガイドRNAは、標的核酸配列にハイブリダイズするよう構成された標的化核酸配列を含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。
一部の態様では、本開示は、(a)(i)配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列;または(ii)配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む操作されたガイド核酸構造、および(b)操作されたガイド核酸構造に結合するよう構成されたクラス2タイプII Casエンドヌクレアーゼを含む操作されたヌクレアーゼシステムを提供する。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、エンドヌクレアーゼは、配列番号1~549、602~1276のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つに記載の配列、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。
一部の態様では、本開示は、(a)標的DNA分子における標的配列と相補的であるヌクレオチド配列を含む標的化核酸配列;および(b)ハイブリダイズして二本鎖RNA(dsRNA)デュプレックスを形成するヌクレオチドの二つの相補的区画を含むタンパク質結合セグメント、その一つが、tracr配列を含み、ヌクレオチドの二つの相補的区画が、介在するヌクレオチドと互いに共有結合している、を含む操作されたガイド核酸構造を提供し、操作されたガイドリボ核酸ポリヌクレオチドは、配列番号1~549、602~1276のいずれか一つ、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するエンドヌクレアーゼと複合体を形成し、複合体を標的DNA分子の標的配列に標的化する能力がある。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。
一部の態様では、本開示は、本明細書に記載される核酸のいずれかを含む操作されたベクターを提供する。一部の実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、レンチウイルス、またはアデノウイルスである。
一部の態様では、本開示は、本明細書に記載されるベクターのいずれかまたは本明細書に記載される核酸のいずれかを含む細胞を提供する。一部の実施形態では、細胞は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒト細胞である。
一部の態様では、本開示は、本明細書に記載される細胞のいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。
一部の態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを、エンドヌクレアーゼおよび二本鎖デオキシリボ核酸ポリヌクレオチドに結合するよう構成された操作されたガイド核酸構造との複合体におけるクラス2タイプII Casエンドヌクレアーゼと接触させることを含む、二本鎖デオキシリボ核酸ポリヌクレオチドを結合するか、切断するか、印付けするか、または修飾する方法を提供し、二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、PAMは、配列番号550~567のいずれか一つに記載の配列を含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいはエンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、RuvCドメインをさらに含む。一部の実施形態では、RuvCドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、RuvCドメインは、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、HNHドメインをさらに含む。一部の実施形態では、HNHドメインは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、HNHドメインは、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。
一部の態様では、本開示は、細胞に、(a)RNAガイドエンドヌクレアーゼ;および(b)操作されたガイド核酸構造を接触させることを含む、細胞におけるAAVS1遺伝子座を編集する方法を提供し、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、操作されたガイド核酸構造は、AAVS1遺伝子座の領域にハイブリダイズするよう構成されたスペーサー配列を含み、操作されたガイド核酸構造は、配列番号1665~1666のいずれか一つの少なくとも18個の連続ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する標的化配列またはその逆相補鎖を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1663または1664のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、操作されたガイド核酸構造は、MG71-2-AAVS1-sgRNA-C3またはMG71-2-AAVS1-sgRNA-E2である。
一部の態様では、本開示は、細胞に、(a)RNAガイドエンドヌクレアーゼ;および(b)操作されたガイド核酸構造を接触させることを含む、細胞におけるTRAC遺伝子座を編集する方法を提供し、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、操作されたガイド核酸構造は、TRAC遺伝子座の領域にハイブリダイズするよう構成されたスペーサー配列を含み、操作されたガイド核酸構造は、配列番号1668もしくは1676~1682のいずれか一つの少なくとも18個の連続ヌクレオチドと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する標的化配列またはその逆相補鎖を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1667または1669~1675のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有する。一部の実施形態では、操作されたガイド核酸構造は、MG73-1-TRAC-sgRNA-G3、MG89-2-TRAC-sgRNA-F1、MG89-2-TRAC-sgRNA-G5、MG89-2-TRAC-sgRNA-E5、MG89-2-TRAC-sgRNA-F5、MG89-2-TRAC-sgRNA-G1、MG89-2-TRAC-sgRNA-E1、MG89-2-TRAC-sgRNA-B1である。一部の実施形態では、操作されたガイド核酸構造は、エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む。一部の実施形態では、標的化核酸配列は、15~24ヌクレオチド長である。一部の実施形態では、操作されたガイド核酸構造は、配列番号1645~1662のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、操作されたガイド核酸構造は、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するtracr配列を含むか、または操作されたガイド核酸構造は、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む。一部の実施形態では、RNAガイドエンドヌクレアーゼは、クラス2、タイプII Casエンドヌクレアーゼである。一部の実施形態では、エンドヌクレアーゼは、配列番号550~567のいずれか一つを含むPAM配列についての選択性を有するよう構成されている。一部の実施形態では、エンドヌクレアーゼは、配列番号1277~1641もしくは1683のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいはエンドヌクレアーゼは、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、または少なくとも約99%の配列同一性を有するPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号259、296、もしくは484のいずれか一つと少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む。一部の実施形態では、エンドヌクレアーゼは、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性、少なくとも約80%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、もしくは少なくとも約99%の配列同一性を有するそのバリアントを含む。
本開示のシステムは、例えば、核酸分子に結合する(例えば、配列特異的結合)、核酸編集(例えば、遺伝子編集)などの様々な用途に使用され得る。このようなシステムは、例えば、対象において疾患を引き起こす可能性のある遺伝的に受け継がれた突然変異に対処する(例えば、除去または置換する)ため、細胞におけるその機能を確認するために遺伝子を不活性化するため、疾患を引き起こす遺伝子エレメントを検出する診断ツールとして(例えば、逆転写されたウイルスRNAもしくは疾患を引き起こす突然変異をコードする増幅されたDNA配列の切断を介して)、特定のヌクレオチド配列(例えば、細菌内の抗生物質耐性をコードする配列)を標的化するためのプローブと組み合わせた不活性化した酵素として、ウイルスゲノムを標的化することによってウイルスを不活性化するか、もしくは宿主細胞に感染できないようにするため、価値ある低分子、高分子、もしくは二次代謝産物を生じるように生物を操作するための遺伝子を加えるか、もしくは代謝経路を修正するため、進化的選択のための遺伝子駆動エレメントを確立するため、バイオセンサーとして外来低分子およびヌクレオチドによる細胞の摂動を検出するため使用され得る。
実施例1-新規タンパク質のメタゲノミクス分析
メタゲノミクス試料を、沈殿物、土壌および動物から採取した。デオキシリボ核酸(DNA)を、Zymobiomics DNAミニプレップキットを用いて抽出し、Illumina HiSeq(登録商標)2500で配列決定した。試料を、所有者の同意を得て収集した。公的ソースからのさらなる生配列データには、動物マイクロバイオーム、沈降、土壌、温泉、熱水通気孔、海洋、泥炭、パーマフロスト、および下水の配列が含まれていた。II型Casエフェクタータンパク質を含む公知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを使用して、メタゲノミクス配列データを検索した。検索によって特定した新規エフェクタータンパク質を、既知のタンパク質に対して整列させて、可能性のある活性部位を特定した。このメタゲノミクスワークフローは、本明細書に記載するMG44、MG46、MG71、MG72、MG73、MG74、MG87、MG88およびMG89ファミリーのクラスII、タイプII CRISPRエンドヌクレアーゼの詳細をもたらした。
メタゲノミクス試料を、沈殿物、土壌および動物から採取した。デオキシリボ核酸(DNA)を、Zymobiomics DNAミニプレップキットを用いて抽出し、Illumina HiSeq(登録商標)2500で配列決定した。試料を、所有者の同意を得て収集した。公的ソースからのさらなる生配列データには、動物マイクロバイオーム、沈降、土壌、温泉、熱水通気孔、海洋、泥炭、パーマフロスト、および下水の配列が含まれていた。II型Casエフェクタータンパク質を含む公知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを使用して、メタゲノミクス配列データを検索した。検索によって特定した新規エフェクタータンパク質を、既知のタンパク質に対して整列させて、可能性のある活性部位を特定した。このメタゲノミクスワークフローは、本明細書に記載するMG44、MG46、MG71、MG72、MG73、MG74、MG87、MG88およびMG89ファミリーのクラスII、タイプII CRISPRエンドヌクレアーゼの詳細をもたらした。
実施例2-CRISPRシステムのMG44、MG46、MG71、MG72、MG73、MG74、MG87、MG88およびMG89ファミリーの発見
実施例1のメタゲノミクス解析のデータの解析により、以前に記述されていない、9つのファミリー(MG44、MG46、MG71、MG72、MG73、MG74、MG87、MG88およびMG89)を含む推定CRISPRシステムの新しいクラスターが明らかになった。これらの新規酵素およびそれらの例示的なサブドメインの対応するタンパク質配列および核酸配列を、配列番号1~549または602~1276として提示する。
実施例1のメタゲノミクス解析のデータの解析により、以前に記述されていない、9つのファミリー(MG44、MG46、MG71、MG72、MG73、MG74、MG87、MG88およびMG89)を含む推定CRISPRシステムの新しいクラスターが明らかになった。これらの新規酵素およびそれらの例示的なサブドメインの対応するタンパク質配列および核酸配列を、配列番号1~549または602~1276として提示する。
実施例3-プロトスペーサー-隣接モチーフの決定
PAM配列を、大腸菌溶解物ベースの発現系(myTXTL、Arbor Biosciences社)で発現させた推定エンドヌクレアーゼによって切断され得るランダムに生成したPAM配列を含有するプラスミドを配列決定することによって決定した。このシステムにおいて、大腸菌コドン最適化ヌクレオチド配列を、T7プロモーターの制御下でPCR断片から転写し、翻訳した。T7プロモーター下のtracr配列を有する第二のPCR断片及びT7プロモーターとそれに続く反復スペーサー反復配列から構成される最小CRISPRアレイを、同じ反応で転写した。TXTLシステムにおけるエンドヌクレアーゼ配列およびtracr配列の発現に成功し、続いてCRISPRアレイ処理により、活性なインビトロCRISPRヌクレアーゼ複合体を得た。
PAM配列を、大腸菌溶解物ベースの発現系(myTXTL、Arbor Biosciences社)で発現させた推定エンドヌクレアーゼによって切断され得るランダムに生成したPAM配列を含有するプラスミドを配列決定することによって決定した。このシステムにおいて、大腸菌コドン最適化ヌクレオチド配列を、T7プロモーターの制御下でPCR断片から転写し、翻訳した。T7プロモーター下のtracr配列を有する第二のPCR断片及びT7プロモーターとそれに続く反復スペーサー反復配列から構成される最小CRISPRアレイを、同じ反応で転写した。TXTLシステムにおけるエンドヌクレアーゼ配列およびtracr配列の発現に成功し、続いてCRISPRアレイ処理により、活性なインビトロCRISPRヌクレアーゼ複合体を得た。
最小アレイ中のそれと一致するスペーサー配列、続いて8N混合塩基(推定PAM配列)を含有する標的プラスミドのライブラリーを、TXTL反応の生成物とともにインキュベートした。1~3時間後、反応を停止し、DNAクリーンアップキット、例えば、Zymo DCC、AMPure XPビーズ、QiaQuickなどを介してDNAを回収した。アダプター配列を、エンドヌクレアーゼによって切断された活性なPAM配列を有するDNAに平滑末端ライゲーションしたが、切断されなかったDNAは、ライゲーションにはアクセスできなかった。次いで、活性PAM配列を含むDNAセグメントを、ライブラリーおよびアダプター配列に特異的なプライマーを用いてPCRにより増幅した。PCR増幅産物をゲル上で分解して、切断事象に対応するアンプリコンを同定した。切断反応の増幅したセグメントも、NGSライブラリーの調製のための鋳型として使用した。開始8Nライブラリーのサブセットであるこの得られたライブラリーを配列決定することにより、活性CRISPR複合体についての正しいPAMを含む配列を明らかにした。単一のRNA構築物を用いたPAM試験については、インビトロ転写RNAをプラスミドライブラリーと共に加え、tracr/最小CRISPRアレイ鋳型を省略したことを除いて、同じ手順を繰り返した。NGSライブラリーを調製したエンドヌクレアーゼについては、seqLogo(例えば、Huber et al.Nat Methods.2015 Feb;12(2):115-21)表示を構築し、図3に示した。これらの表示を構築するために使用したseqLogoモジュールは、DNA配列モチーフ(例えば、PAM配列)の位置重み行列を取り、SchneiderおよびStephens(例えば、Schneider et al.Nucleic Acids Res.1990 Oct 25;18(20):6097-100を参照)が導入した通り、対応する配列ロゴをプロットする。seqLogo表示の配列を表す文字を、整列した配列(例えば、PAM配列)の各位置について互いの上に重ねた。各文字の高さはその頻度に比例し、最も一般的な文字が一番上にあるように、文字を並べ替えている。
実施例4-MG CRISPR複合体の(予測)インビトロ切断効率
エンドヌクレアーゼは、タンパク質分解酵素欠損大腸菌B株における誘導性T7プロモーターからのHisタグ付き融合タンパク質として発現される。Hisタグ付きタンパク質を発現している細胞を超音波処理によって溶解し、Hisタグ付きタンパク質を、AKTA Avant FPLC(GE Lifescience)上のHisTrap FFカラム(GE Lifescience)上のNi-NTA親和性クロマトグラフィーによって精製する。溶離液をアクリルアミドゲル(Bio-Rad)上のSDS-PAGEによって分離し、InstantBlue Ultrafast Coomassie(Sigma-Aldrich)で染色する。純度を、ImageLabソフトウェア(Bio-Rad社)を用いたタンパク質バンドの濃度測定法を使用して決定する。精製したエンドヌクレアーゼを、50mM Tris-HCl、300mM NaCl、1mM TCEP、5%グリセロール、pH7.5からなる保存緩衝液に透析し、-80℃で保存する。
エンドヌクレアーゼは、タンパク質分解酵素欠損大腸菌B株における誘導性T7プロモーターからのHisタグ付き融合タンパク質として発現される。Hisタグ付きタンパク質を発現している細胞を超音波処理によって溶解し、Hisタグ付きタンパク質を、AKTA Avant FPLC(GE Lifescience)上のHisTrap FFカラム(GE Lifescience)上のNi-NTA親和性クロマトグラフィーによって精製する。溶離液をアクリルアミドゲル(Bio-Rad)上のSDS-PAGEによって分離し、InstantBlue Ultrafast Coomassie(Sigma-Aldrich)で染色する。純度を、ImageLabソフトウェア(Bio-Rad社)を用いたタンパク質バンドの濃度測定法を使用して決定する。精製したエンドヌクレアーゼを、50mM Tris-HCl、300mM NaCl、1mM TCEP、5%グリセロール、pH7.5からなる保存緩衝液に透析し、-80℃で保存する。
スペーサー配列およびPAM配列を含有する標的DNA(例えば、実施例3で決定した)を、DNA合成によって構築する。PAMが縮重塩基を有する場合の試験のため、単一の代表的なPAMを選択する。標的DNAは、PAMおよび一端から700bpに位置するスペーサーを用いたPCR増幅を介してプラスミドに由来する2200bpの直鎖DNAからなる。切断の成功は、700および1500bpの断片をもたらす。標的DNA、インビトロ転写単一RNA、および精製した組換えタンパク質を、過剰なタンパク質およびRNAを含む切断緩衝液(10mM Tris、100mM NaCl、10mM MgCl2)中で組み合わせ、5分~3時間、通常は1時間インキュベートする。反応を、RNAse Aの添加および60分のインキュベーションを介して停止させる。次いで、反応物を1.2%TAEアガロースゲル上で分解し、切断した標的DNAの画分をImageLabソフトウェアで定量化する。
実施例5-大腸菌におけるMG CRISPR複合体のゲノム切断活性の(予測)試験
大腸菌は、二本鎖DNA切断を効率的に修復する能力を欠く。したがって、ゲノムDNAの切断は、致命的な事象であり得る。この現象を利用して、エンドヌクレアーゼ活性を、そのゲノムDNAに組み込まれるスペーサー/標的配列およびPAM配列を有する標的株においてエンドヌクレアーゼおよびtracrRNAを組換え発現させることによって、大腸菌で試験する。
大腸菌は、二本鎖DNA切断を効率的に修復する能力を欠く。したがって、ゲノムDNAの切断は、致命的な事象であり得る。この現象を利用して、エンドヌクレアーゼ活性を、そのゲノムDNAに組み込まれるスペーサー/標的配列およびPAM配列を有する標的株においてエンドヌクレアーゼおよびtracrRNAを組換え発現させることによって、大腸菌で試験する。
このアッセイでは、PAM配列は、実施例3に記載した方法によって決定した試験しているエンドヌクレアーゼに特異的である。sgRNA配列を、tracrRNAの配列および予測構造に基づいて決定する。反復の5’末端から開始する、8~12bp(一般に10bp)の反復抗反復対を選択する。反復の残りの3’末端およびtracrRNAの5’末端を、テトラループで置換する。概して、テトラループはGAAAであるが、特に、GAAA配列がフォールディングに干渉すると予測する場合、他のテトラループを使用することができる。これらの場合、TTCGテトラループを使用した。
ゲノムDNAに組み込まれたPAM配列を有する操作した株を、エンドヌクレアーゼをコードするDNAで形質転換する。次いで、形質転換体を、化学能力を有し、標的配列に特異的(「オンターゲット」)、または標的に非特異的(「非標的」)かのいずれかの50ngの単一ガイドRNAで形質転換する。ヒートショック後、形質転換を、SOC中、37℃で2時間回収する。次いで、ヌクレアーゼ効率を、誘導培地上で成長させた5倍希釈液によって決定する。コロニーを、トリプリケートで希釈系列から定量化する。
実施例6-哺乳類細胞におけるMG CRISPR複合体のゲノム切断活性の(予測)試験
哺乳類細胞における標的化および切断活性を示すために、MG Casエフェクタータンパク質配列を、二つの哺乳類発現ベクター、(a)一つは、C末端のSV40 NLSおよび2A-GFPタグを有し、(b)一つは、GFPタグを有さず、二つのSV40 NLS配列を有し、一つはN末端上にあり、一つはC末端上にある、で試験する。ある場合では、エンドヌクレアーゼをコードするヌクレオチド配列を、哺乳類細胞における発現のためにコドン最適化する。
哺乳類細胞における標的化および切断活性を示すために、MG Casエフェクタータンパク質配列を、二つの哺乳類発現ベクター、(a)一つは、C末端のSV40 NLSおよび2A-GFPタグを有し、(b)一つは、GFPタグを有さず、二つのSV40 NLS配列を有し、一つはN末端上にあり、一つはC末端上にある、で試験する。ある場合では、エンドヌクレアーゼをコードするヌクレオチド配列を、哺乳類細胞における発現のためにコドン最適化する。
標的化配列を付加した対応する単一ガイドRNA配列(sgRNA)を、第二の哺乳動物発現ベクターにクローニングする。二つのプラスミドをHEK293T細胞に共トランスフェクトする。発現プラスミドとsgRNA標的化プラスミドをHEK293T細胞に共トランスフェクションしてから72時間後、DNAを抽出し、NGSライブラリーの調製に使用する。NHEJの割合を標的部位の配列決定におけるインデルを介して測定して、哺乳類細胞における酵素の標的化効率を示す。各タンパク質の活性を試験するために、少なくとも10個の異なる標的部位を選択した。
実施例7-K562細胞におけるTRACおよびAAVS1のDNAレベルでの遺伝子編集結果
MG71-2、MG73-1、およびMG89-2 mRNAの核酸感染を、以下の表4からの一致するガイドRNA(500ngのmRNA/150pmolガイド)と共に、Lonza 4Dエレクトロポレーターを使用してK562細胞(200,000)に行った。細胞を回収し、トランスフェクションの3日後にゲノムDNAを調製した。NGSベースのDNAシーケンシングでの使用に適したPCRプライマーを作製し、最適化し、各ガイドRNAの個々の標的配列を増幅するために使用した。アンプリコンをIllumina MiSeqマシン上で配列決定し、独自のPythonスクリプトを用いて解析して、遺伝子編集を測定した(図4)。
MG71-2、MG73-1、およびMG89-2 mRNAの核酸感染を、以下の表4からの一致するガイドRNA(500ngのmRNA/150pmolガイド)と共に、Lonza 4Dエレクトロポレーターを使用してK562細胞(200,000)に行った。細胞を回収し、トランスフェクションの3日後にゲノムDNAを調製した。NGSベースのDNAシーケンシングでの使用に適したPCRプライマーを作製し、最適化し、各ガイドRNAの個々の標的配列を増幅するために使用した。アンプリコンをIllumina MiSeqマシン上で配列決定し、独自のPythonスクリプトを用いて解析して、遺伝子編集を測定した(図4)。
本開示のシステムは、例えば、核酸分子に結合する(例えば、配列特異的結合)、核酸編集(例えば、遺伝子編集)などの様々な用途に使用され得る。このようなシステムは、例えば、対象において疾患を引き起こす可能性のある遺伝的に受け継がれた突然変異に対処する(例えば、除去または置換する)ため、細胞におけるその機能を確認するために遺伝子を不活性化するため、疾患を引き起こす遺伝子エレメントを検出する診断ツールとして(例えば、逆転写されたウイルスRNAもしくは疾患を引き起こす突然変異をコードする増幅されたDNA配列の切断を介して)、特定のヌクレオチド配列(例えば、細菌内の抗生物質耐性をコードする配列)を標的化するためのプローブと組み合わせた不活性化した酵素として、ウイルスゲノムを標的化することによってウイルスを不活性化するか、もしくは宿主細胞に感染できないようにするため、価値ある低分子、高分子、もしくは二次代謝産物を生じるように生物を操作するための遺伝子を加えるか、もしくは代謝経路を修正するため、進化的選択のための遺伝子駆動エレメントを確立するため、バイオセンサーとして外来低分子およびヌクレオチドによる細胞の摂動を検出するため使用され得る。
本発明の好ましい実施形態は本明細書に示され、記載されるが、このような実施形態が、例示の目的でのみ提供されることは、当業者には明らかであろう。本発明は、本明細書内で提供される特定の実施例によって限定されることは意図されていない。本発明は前述の説明を参照して記載されているが、本明細書の実施形態の記載及び説明は、限定された意味で解釈されることを意図していない。多数の変形、変更、及び置換は、ここで、本発明から逸脱することなく、当業者にとって生じるであろう。更に、本発明の全ての態様は、様々な条件及び変数に依存する、本明細書に記載される特定の描写、構成又は相対的割合に限定されないことが理解されよう。本明細書に記載される本発明の実施形態に対する様々な代替が、本発明の実施に用いられ得ることは、理解されるべきである。したがって、本発明は、こうした任意の代替、修正、変形、又は均等物も包含することが企図される。以下の特許請求の範囲は、本発明の範囲、及びそれによって包含されるこれらの請求の範囲及びそれらの均等物内のその方法及び構造を定義することが意図される。
Claims (105)
- 操作されたヌクレアーゼシステムであって、
(a)配列番号550~567のいずれか一つを含むプロトスペーサー隣接モチーフ(PAM)配列についての選択性を有するよう構成されたエンドヌクレアーゼであって、クラス2タイプII Casエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)前記エンドヌクレアーゼと複合体を形成するよう構成された操作されたガイド核酸構造であって、
(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および
(ii)前記エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、操作されたガイド核酸構造と、を含む、操作されたヌクレアーゼシステム。 - 前記エンドヌクレアーゼが、培養されていない微生物に由来する、請求項1に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、前記エンドヌクレアーゼの天然のPAM配列と異なるPAM配列に結合するよう操作されていない、請求項1または2に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、またはCas13dエンドヌクレアーゼではない、請求項3に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、Cas9エンドヌクレアーゼと80%未満の同一性を有する、請求項3に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号1277~1641もしくは1683のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいは前記エンドヌクレアーゼが、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも80%の同一性を有するPIドメインをさらに含む、請求項1~5のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項6に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号259、296、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項6に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、RuvCドメインをさらに含む、請求項1~8のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記RuvCドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項9に記載の操作されたヌクレアーゼシステム。
- 前記RuvCドメインが、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項10に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、HNHドメインをさらに含む、請求項1~11のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記HNHドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項12に記載の操作されたヌクレアーゼシステム。
- 前記HNHドメインが、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項12に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号553、555、もしくは566のいずれか一つを含むPAM配列、またはそのバリアントについての選択性を有するよう構成されている、請求項1~14のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、少なくとも二つのリボ核酸ポリヌクレオチドを含む、請求項1~15のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、前記ガイドリボ核酸配列および前記tracrリボ核酸配列を含む一つのリボ核酸ポリヌクレオチドを含む、請求項1~15のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項1~17のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項1~17のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記標的化核酸配列が、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である、請求項1~19のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記標的化核酸配列が、15~24ヌクレオチド長である、請求項1~18のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、前記エンドヌクレアーゼのN末端またはC末端の近位に一つまたは複数の核局在化配列(NLS)を含む、請求項1~21のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記NLSが、配列番号586~601のいずれか一つ、またはそのバリアントを含む配列を含む、請求項1~22のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 5’から3’の方向に、前記標的デオキシリボ核酸配列に対して5’の、少なくとも20個のヌクレオチドの配列を含む第一の相同アーム、少なくとも10個のヌクレオチドの合成DNA配列、および前記標的配列に対して3’の、少なくとも20個のヌクレオチドの配列を含む第二の相同アームを含む、一本鎖または二本鎖のDNA修復鋳型をさらに含む、請求項1~23のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記第一または第二の相同アームが、少なくとも40、80、120、150、200、300、500、または1,000個のヌクレオチドの配列を含む、請求項24に記載の操作されたヌクレアーゼシステム。
- 前記システムが、Mg2+の供給源をさらに含む、請求項1~25のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼおよび前記tracrリボ核酸配列が、同じ門内の別個の細菌種に由来する、請求項1~26のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記配列同一性が、BLASTP、CLUSTALW、MUSCLE、MAFFTアルゴリズム、またはSmith-Waterman相同性検索アルゴリズムパラメーターを用いたCLUSTALWアルゴリズムによって決定される、請求項1~28のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記配列同一性が、3のワード長(W)、10の期待値(E)のパラメーター、および11の存在、1の延長でギャップコストを設定しているBLOSUM62スコアリングマトリックスを使用し、条件付き組成スコアマトリックス調整を使用した、前記BLASTP相同性検索アルゴリズムによって決定される、請求項29に記載の操作されたヌクレアーゼシステム。
- 前記PAM配列が、前記標的デオキシリボ核酸配列の3’に位置する、請求項1~30のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 生物における発現のため最適化された操作された核酸配列を含む核酸であって、配列番号550~567のいずれか一つを含むプロトスペーサー隣接モチーフ(PAM)について選択的であるよう構成されたクラス2タイプII Casエンドヌクレアーゼをコードする、核酸。
- 前記エンドヌクレアーゼが、配列番号1277~1641もしくは1683のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいは前記エンドヌクレアーゼが、配列番号1~549もしくは602~1276のいずれか一つのPIドメインと少なくとも80%の同一性を有するPIドメインをさらに含む、請求項32に記載の核酸。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項32に記載の核酸。
- 前記エンドヌクレアーゼが、配列番号259、296、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項32に記載の核酸。
- 前記エンドヌクレアーゼが、RuvCドメインをさらに含む、請求項32~35のいずれか一項に記載の核酸。
- 前記RuvCドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項36に記載の核酸。
- 前記RuvCドメインが、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項36に記載の核酸。
- 前記エンドヌクレアーゼが、HNHドメインをさらに含む、請求項32~38のいずれか一項に記載の核酸。
- 前記HNHドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項39に記載の核酸。
- 前記HNHドメインが、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項39に記載の核酸。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項32~41のいずれか一項に記載の核酸。
- 前記生物が、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒト生物である、請求項32~42のいずれか一項に記載の核酸。
- 操作されたヌクレアーゼシステムであって、
(a)配列番号1~549、602~1276のいずれか一つ、またはそのバリアントと少なくとも80%の配列同一性を有するエンドヌクレアーゼと、
(b)操作されたガイド核酸構造であって、前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、前記操作されたガイド核酸構造が、標的核酸配列にハイブリダイズするよう構成された標的化核酸配列を含む、操作されたガイド核酸構造と、を含む、操作されたヌクレアーゼシステム。 - 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項44に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、RuvCドメインをさらに含む、請求項44または45に記載の操作されたヌクレアーゼシステム。
- 前記RuvCドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項46に記載の操作されたヌクレアーゼシステム。
- 前記RuvCドメインが、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項46に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、HNHドメインをさらに含む、請求項44~48のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記HNHドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項44~49のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記HNHドメインが、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項44~49のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号568~585または1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項44~51のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項44~51のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)前記エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、請求項44~53のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記標的化核酸配列が、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である、請求項54に記載の操作されたヌクレアーゼシステム。
- 前記標的化核酸配列が、15~24ヌクレオチド長である、請求項54または55に記載の操作されたヌクレアーゼシステム。
- 操作されたヌクレアーゼシステムであって、
(a)(i)配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列;または(ii)配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、操作されたガイド核酸構造、および
(b)前記操作されたガイド核酸構造に結合するよう構成されたクラス2タイプII Casエンドヌクレアーゼを含む、操作されたヌクレアーゼシステム。 - 前記操作されたガイド核酸構造が、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項57に記載の操作されたヌクレアーゼシステム。
- 前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)前記エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、請求項57または58に記載の操作されたヌクレアーゼシステム。
- 前記標的化核酸配列が、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である、請求項59に記載の操作されたヌクレアーゼシステム。
- 前記標的化核酸配列が、15~24ヌクレオチド長である、請求項59または60に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号1~549、602~1276のいずれか一つと少なくとも80%の配列同一性を有する配列、またはそのバリアントを含む、請求項57~61のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つに記載の配列、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項57~61のいずれか一項に記載の操作されたヌクレアーゼシステム。
- 操作されたガイド核酸構造であって、
(a)標的DNA分子中の標的配列と相補的であるヌクレオチド配列を含む標的化核酸配列と、
(b)そのうちの一つがtracr配列を含む、二本鎖RNA(dsRNA)デュプレックスを形成するようハイブリダイズするヌクレオチドの二つの相補的区画を含む、タンパク質結合セグメントと、を含み、
ヌクレオチドの前記二つの相補的区画が、介在するヌクレオチドと互いに共有結合し、
前記操作されたガイドリボ核酸ポリヌクレオチドが、配列番号1~549、602~1276のいずれか一つ、またはそのバリアントと少なくとも80%の配列同一性を有するエンドヌクレアーゼと複合体を形成し、前記複合体を前記標的DNA分子の前記標的配列に標的化する能力がある、操作されたガイド核酸構造。 - 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項64に記載の操作されたガイド核酸構造。
- 前記標的化核酸配列が、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である、請求項64または65に記載の操作されたガイド核酸構造。
- 前記標的化核酸配列が、15~24ヌクレオチド長である、請求項64~66のいずれか一項に記載の操作されたガイド核酸構造。
- 前記操作されたガイド核酸構造が、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項64~67のいずれか一項に記載の操作されたガイド核酸構造。
- 前記操作されたガイド核酸構造が、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項64~68のいずれか一項に記載の操作されたガイド核酸構造。
- 請求項32~43のいずれか一項に記載の核酸を含む、操作されたベクター。
- 前記ベクターが、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、レンチウイルス、またはアデノウイルスである、請求項70に記載の操作されたベクター。
- 請求項70もしくは71に記載のベクターまたは請求項32~43のいずれか一項に記載の核酸を含む、細胞。
- 請求項72に記載の細胞を培養することを含む、エンドヌクレアーゼを製造する方法。
- 二本鎖デオキシリボ核酸ポリヌクレオチドを結合するか、切断するか、印付けするか、または修飾する方法であって、
前記二本鎖デオキシリボ核酸ポリヌクレオチドを、前記エンドヌクレアーゼおよび前記二本鎖デオキシリボ核酸ポリヌクレオチドに結合するよう構成された操作されたガイド核酸構造との複合体におけるクラス2タイプII Casエンドヌクレアーゼと接触させることを含み、
前記二本鎖デオキシリボ核酸ポリヌクレオチドが、プロトスペーサー隣接モチーフ(PAM)を含み、前記PAMが、配列番号550~567のいずれか一つに記載の配列を含む、方法。 - 前記エンドヌクレアーゼが、配列番号1277~1641もしくは1683のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいは前記エンドヌクレアーゼが、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも80%の同一性を有するPIドメインをさらに含む、請求項74に記載の方法。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項74に記載の方法。
- 前記エンドヌクレアーゼが、配列番号259、296、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項74に記載の方法。
- 前記エンドヌクレアーゼが、RuvCドメインをさらに含む、請求項74~77のいずれか一項に記載の方法。
- 前記RuvCドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項78に記載の方法。
- 前記RuvCドメインが、配列番号259、296、もしくは484のいずれか一つのRuvCドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項78に記載の方法。
- 前記エンドヌクレアーゼが、HNHドメインをさらに含む、請求項74~80のいずれか一項に記載の方法。
- 前記HNHドメインが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項81に記載の方法。
- 前記HNHドメインが、配列番号259、296、もしくは484のいずれか一つのHNHドメイン、またはそのバリアントと少なくとも80%の同一性を有する、請求項81に記載の方法。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項74~83のいずれか一項に記載の方法。
- 前記操作されたガイド核酸構造が、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項74~84のいずれか一項に記載の方法。
- 前記操作されたガイド核酸構造が、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項74~84のいずれか一項に記載の方法。
- 前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)前記エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、請求項74~86のいずれか一項に記載の方法。
- 前記標的化核酸配列が、細菌、古細菌、真核生物、真菌、植物、哺乳類、またはヒトゲノム配列と相補的である、請求項87に記載の方法。
- 前記標的化核酸配列が、15~24ヌクレオチド長である、請求項87または88に記載の方法。
- 細胞内のAAVS1遺伝子座を編集する方法であって、前記細胞に、
(a)RNAガイドエンドヌクレアーゼ、および
(b)操作されたガイド核酸構造であって、前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、前記操作されたガイド核酸構造が、前記AAVS1遺伝子座の領域にハイブリダイズするよう構成されたスペーサー配列を含む、操作されたガイド核酸構造、を接触させることを含み、
前記操作されたガイド核酸構造が、配列番号1665~1666のいずれか一つの少なくとも18個の連続ヌクレオチドと少なくとも85%の同一性を有する標的化配列またはその逆相補鎖を含む、方法。 - 前記操作されたガイド核酸構造が、配列番号1663または1664のいずれか一つと少なくとも80%の同一性を有する、請求項90に記載の方法。
- 前記操作されたガイド核酸構造が、MG71-2-AAVS1-sgRNA-C3またはMG71-2-AAVS1-sgRNA-E2である、請求項90に記載の方法。
- 細胞内のTRAC遺伝子座を編集する方法であって、前記細胞に、
(a)RNAガイドエンドヌクレアーゼ、および
(b)操作されたガイド核酸構造であって、前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、前記操作されたガイド核酸構造が、前記TRAC遺伝子座の領域にハイブリダイズするよう構成されたスペーサー配列を含む、操作されたガイド核酸構造、を接触させることを含み、
前記操作されたガイド核酸構造が、配列番号1668もしくは1676~1682のいずれか一つの少なくとも18個の連続ヌクレオチドと少なくとも85%の同一性を有する標的化配列またはその逆相補鎖を含む、方法。 - 前記操作されたガイド核酸構造が、配列番号1667もしくは1669~1675のいずれか一つと少なくとも80%の同一性を有する、請求項93に記載の方法。
- 前記操作されたガイド核酸構造が、MG73-1-TRAC-sgRNA-G3、MG89-2-TRAC-sgRNA-F1、MG89-2-TRAC-sgRNA-G5、MG89-2-TRAC-sgRNA-E5、MG89-2-TRAC-sgRNA-F5、MG89-2-TRAC-sgRNA-G1、MG89-2-TRAC-sgRNA-E1、MG89-2-TRAC-sgRNA-B1である、請求項93に記載の方法。
- 前記操作されたガイド核酸構造が、前記エンドヌクレアーゼと複合体を形成するよう構成され、(i)標的デオキシリボ核酸配列にハイブリダイズするよう構成された標的化核酸配列;および(ii)前記エンドヌクレアーゼに結合するよう構成されたtracrリボ核酸配列を含む、請求項90~95のいずれか一項に記載の方法。
- 前記標的化核酸配列が、15~24ヌクレオチド長である、請求項96に記載の方法。
- 前記操作されたガイド核酸構造が、配列番号1645~1662のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号568~585もしくは1643~1644のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項90~97のいずれか一項に記載の方法。
- 前記操作されたガイド核酸構造が、配列番号1648、1650、もしくは1661のいずれか一つと少なくとも80%の同一性を有するtracr配列を含むか、または前記操作されたガイド核酸構造が、配列番号571、573、もしくは584のいずれか一つの非縮重ヌクレオチドと少なくとも80%の同一性を有する配列を含む、請求項90~97のいずれか一項に記載の方法。
- 前記RNAガイドエンドヌクレアーゼが、クラス2タイプII Casエンドヌクレアーゼである、請求項90~99のいずれか一項に記載の方法。
- 前記エンドヌクレアーゼが、配列番号550~567のいずれか一つを含むPAM配列について選択性を有するよう構成されている、請求項100に記載の方法。
- 前記エンドヌクレアーゼが、配列番号1277~1641もしくは1683のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含むか、あるいは前記エンドヌクレアーゼが、配列番号1~549または602~1276のいずれか一つのPIドメインと少なくとも80%の同一性を有するPIドメインをさらに含む、請求項100または101のいずれか一項に記載の方法。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項100または101のいずれか一項に記載の方法。
- 前記エンドヌクレアーゼが、配列番号259、296、もしくは484のいずれか一つと少なくとも80%の同一性を有する配列、またはそのバリアントを含むPIドメインをさらに含む、請求項100または101のいずれか一項に記載の方法。
- 前記エンドヌクレアーゼが、配列番号1、217、258、259、284、296、297、306、357、403、404、405、463、464、465、356、もしくは484のいずれか一つ、またはそれと少なくとも55%の同一性を有するそのバリアントを含む、請求項90~104のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163182438P | 2021-04-30 | 2021-04-30 | |
US63/182,438 | 2021-04-30 | ||
PCT/US2022/027124 WO2022232638A2 (en) | 2021-04-30 | 2022-04-29 | Enzymes with ruvc domains |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024517607A true JP2024517607A (ja) | 2024-04-23 |
Family
ID=83847352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023562936A Pending JP2024517607A (ja) | 2021-04-30 | 2022-04-29 | Ruvcドメインを有する酵素 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20240110167A1 (ja) |
EP (1) | EP4330386A2 (ja) |
JP (1) | JP2024517607A (ja) |
KR (1) | KR20240004618A (ja) |
CN (1) | CN117203332A (ja) |
AU (1) | AU2022264921A1 (ja) |
BR (1) | BR112023022270A2 (ja) |
CA (1) | CA3214222A1 (ja) |
MX (1) | MX2023012606A (ja) |
WO (1) | WO2022232638A2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2898075T3 (pl) * | 2012-12-12 | 2016-09-30 | PROJEKTOWANIE i OPTYMALIZACJA ULEPSZONYCH SYSTEMÓW, SPOSOBY I KOMPOZYCJE ENZYMÓW DO MANIPULACJI SEKWENCJĄ | |
US9234213B2 (en) * | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
EP3755792A4 (en) * | 2018-02-23 | 2021-12-08 | Pioneer Hi-Bred International, Inc. | NEW CAS9 ORTHOLOGIST |
CN113728098A (zh) * | 2019-02-14 | 2021-11-30 | 宏基因组学知识产权技术有限责任公司 | 具有ruvc结构域的酶 |
-
2022
- 2022-04-29 CN CN202280030364.7A patent/CN117203332A/zh active Pending
- 2022-04-29 WO PCT/US2022/027124 patent/WO2022232638A2/en active Application Filing
- 2022-04-29 KR KR1020237040583A patent/KR20240004618A/ko unknown
- 2022-04-29 BR BR112023022270A patent/BR112023022270A2/pt unknown
- 2022-04-29 JP JP2023562936A patent/JP2024517607A/ja active Pending
- 2022-04-29 AU AU2022264921A patent/AU2022264921A1/en active Pending
- 2022-04-29 MX MX2023012606A patent/MX2023012606A/es unknown
- 2022-04-29 CA CA3214222A patent/CA3214222A1/en active Pending
- 2022-04-29 EP EP22796888.0A patent/EP4330386A2/en active Pending
-
2023
- 2023-10-17 US US18/488,520 patent/US20240110167A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022232638A3 (en) | 2022-12-01 |
MX2023012606A (es) | 2023-11-03 |
CN117203332A (zh) | 2023-12-08 |
KR20240004618A (ko) | 2024-01-11 |
US20240110167A1 (en) | 2024-04-04 |
CA3214222A1 (en) | 2022-11-03 |
AU2022264921A1 (en) | 2023-11-23 |
BR112023022270A2 (pt) | 2024-01-23 |
WO2022232638A2 (en) | 2022-11-03 |
EP4330386A2 (en) | 2024-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2023206079A1 (en) | Enzymes with RuvC domains | |
AU2024204029A1 (en) | CRISPR/Cpf1 systems and methods | |
AU2024200614A1 (en) | Class II, type V CRISPR systems | |
AU2023203048A1 (en) | Cas9 variants and uses thereof | |
AU2023202184A1 (en) | Methods and Compositions for Editing RNAs | |
AU2023202056B2 (en) | CRISPR hybrid DNA/RNA polynucleotides and methods of use | |
AU2023201773B2 (en) | Compositions and methods for treating Hemoglobinopathies | |
AU2023241327A1 (en) | Compositions and methods of improving specificity in genomic engineering using RNA-guided endonucleases | |
AU2024203284A1 (en) | Adenosine nucleobase editors and uses thereof | |
AU2024201264A1 (en) | Modified guide RNAs | |
AU2024201464A1 (en) | Compositions and methods for treating alpha-1 antitrypsin deficiency | |
AU2024219682A1 (en) | Gene editing of pcsk9 | |
AU2023248113A1 (en) | Methods and compositions for RNA-directed target DNA modification and for RNA-directed modulation of transcription | |
US20220033858A1 (en) | Crispr oligoncleotides and gene editing | |
AU2024219947A1 (en) | High-Throughput Single-Cell Sequencing With Reduced Amplification Bias | |
AU2023229539A1 (en) | Methods and compositions for gene expression in plants | |
AU2024216405A1 (en) | Reagents and methods for the analysis of linked nucleic acids | |
Schlötterer | Evolutionary dynamics of microsatellite DNA | |
AU2024200091A1 (en) | Novel hyaluronic acid-hydrolyzing enzyme variant having improved stability and pharmaceutical composition comprising same | |
AU2024203392A1 (en) | Reagents, kits and methods for molecular barcoding | |
JP2024509353A (ja) | 再プログラム可能なTnpBポリペプチド及びその使用 | |
JP2024509353A6 (ja) | 再プログラム可能なTnpBポリペプチド及びその使用 | |
Kouprina et al. | Selective isolation of genomic loci from complex genomes by transformation-associated recombination cloning in the yeast Saccharomyces cerevisiae | |
CN111742051A (zh) | 延伸的单向导rna及其用途 | |
AU2023219966A1 (en) | Method for target specific RNA transcription of DNA sequence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240328 |