JP2024518793A - 向上した安定性を有するcas9エフェクタータンパク質 - Google Patents
向上した安定性を有するcas9エフェクタータンパク質 Download PDFInfo
- Publication number
- JP2024518793A JP2024518793A JP2023571310A JP2023571310A JP2024518793A JP 2024518793 A JP2024518793 A JP 2024518793A JP 2023571310 A JP2023571310 A JP 2023571310A JP 2023571310 A JP2023571310 A JP 2023571310A JP 2024518793 A JP2024518793 A JP 2024518793A
- Authority
- JP
- Japan
- Prior art keywords
- nuclear localization
- localization signal
- protein
- effector protein
- cas9 effector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 499
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 491
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 481
- 239000012636 effector Substances 0.000 title claims abstract description 361
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims abstract description 501
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 190
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 190
- 239000002157 polynucleotide Substances 0.000 claims abstract description 190
- 238000000034 method Methods 0.000 claims abstract description 122
- 210000003527 eukaryotic cell Anatomy 0.000 claims abstract description 48
- 238000012986 modification Methods 0.000 claims abstract description 36
- 230000004048 modification Effects 0.000 claims abstract description 36
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 102
- 210000004027 cell Anatomy 0.000 claims description 95
- 239000002773 nucleotide Substances 0.000 claims description 87
- 125000003729 nucleotide group Chemical group 0.000 claims description 77
- 229920001184 polypeptide Polymers 0.000 claims description 75
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 75
- 150000007523 nucleic acids Chemical group 0.000 claims description 41
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 34
- 239000002245 particle Substances 0.000 claims description 34
- 230000001105 regulatory effect Effects 0.000 claims description 29
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 22
- 239000013603 viral vector Substances 0.000 claims description 22
- 238000010354 CRISPR gene editing Methods 0.000 claims description 21
- 230000001580 bacterial effect Effects 0.000 claims description 21
- 238000003780 insertion Methods 0.000 claims description 21
- 230000037431 insertion Effects 0.000 claims description 21
- 101710128836 Large T antigen Proteins 0.000 claims description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 16
- 230000035772 mutation Effects 0.000 claims description 14
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 210000005260 human cell Anatomy 0.000 claims description 11
- 239000002502 liposome Substances 0.000 claims description 11
- 241000894007 species Species 0.000 claims description 11
- 230000015556 catabolic process Effects 0.000 claims description 9
- 238000006731 degradation reaction Methods 0.000 claims description 9
- 101100011365 Caenorhabditis elegans egl-13 gene Proteins 0.000 claims description 8
- 102100038895 Myc proto-oncogene protein Human genes 0.000 claims description 8
- 101710135898 Myc proto-oncogene protein Proteins 0.000 claims description 8
- 102000002488 Nucleoplasmin Human genes 0.000 claims description 8
- 101710150448 Transcriptional regulator Myc Proteins 0.000 claims description 8
- 108060005597 nucleoplasmin Proteins 0.000 claims description 8
- 210000001808 exosome Anatomy 0.000 claims description 7
- 241000702421 Dependoparvovirus Species 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 claims description 5
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 150000002632 lipids Chemical class 0.000 claims description 5
- 241000701161 unidentified adenovirus Species 0.000 claims description 4
- 241000700584 Simplexvirus Species 0.000 claims description 3
- 239000002184 metal Substances 0.000 claims description 3
- 230000001976 improved effect Effects 0.000 abstract description 22
- 235000018102 proteins Nutrition 0.000 description 378
- 108020004414 DNA Proteins 0.000 description 51
- 239000004544 spot-on Substances 0.000 description 46
- 230000000694 effects Effects 0.000 description 37
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 26
- 108020005004 Guide RNA Proteins 0.000 description 22
- 102000039446 nucleic acids Human genes 0.000 description 22
- 108020004707 nucleic acids Proteins 0.000 description 22
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 20
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 20
- 230000027455 binding Effects 0.000 description 20
- 210000003494 hepatocyte Anatomy 0.000 description 20
- 241000196324 Embryophyta Species 0.000 description 18
- 230000006780 non-homologous end joining Effects 0.000 description 18
- 238000003776 cleavage reaction Methods 0.000 description 15
- 239000003112 inhibitor Substances 0.000 description 15
- 230000007017 scission Effects 0.000 description 15
- 239000000758 substrate Substances 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 13
- 238000013518 transcription Methods 0.000 description 13
- 230000035897 transcription Effects 0.000 description 13
- 238000001890 transfection Methods 0.000 description 13
- 238000011144 upstream manufacturing Methods 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 12
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 12
- 239000013604 expression vector Substances 0.000 description 12
- 241000282414 Homo sapiens Species 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 108020001507 fusion proteins Proteins 0.000 description 10
- 102000037865 fusion proteins Human genes 0.000 description 10
- 238000001727 in vivo Methods 0.000 description 10
- 230000008439 repair process Effects 0.000 description 10
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 9
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 9
- 150000001413 amino acids Chemical group 0.000 description 9
- 238000010362 genome editing Methods 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 238000001262 western blot Methods 0.000 description 9
- -1 COM Proteins 0.000 description 8
- 230000007018 DNA scission Effects 0.000 description 8
- 101710163270 Nuclease Proteins 0.000 description 8
- 230000000295 complement effect Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 108091006047 fluorescent proteins Proteins 0.000 description 7
- 102000034287 fluorescent proteins Human genes 0.000 description 7
- 230000009437 off-target effect Effects 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 241000193996 Streptococcus pyogenes Species 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 235000001014 amino acid Nutrition 0.000 description 6
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 5
- 238000010442 DNA editing Methods 0.000 description 5
- 230000033616 DNA repair Effects 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- TZYWCYJVHRLUCT-VABKMULXSA-N N-benzyloxycarbonyl-L-leucyl-L-leucyl-L-leucinal Chemical compound CC(C)C[C@@H](C=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)OCC1=CC=CC=C1 TZYWCYJVHRLUCT-VABKMULXSA-N 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- XDHNQDDQEHDUTM-JQWOJBOSSA-N bafilomycin A1 Chemical compound CO[C@H]1\C=C\C=C(C)\C[C@H](C)[C@H](O)[C@H](C)\C=C(/C)\C=C(OC)\C(=O)O[C@@H]1[C@@H](C)[C@@H](O)[C@H](C)[C@]1(O)O[C@H](C(C)C)[C@@H](C)[C@H](O)C1 XDHNQDDQEHDUTM-JQWOJBOSSA-N 0.000 description 5
- XDHNQDDQEHDUTM-ZGOPVUMHSA-N bafilomycin A1 Natural products CO[C@H]1C=CC=C(C)C[C@H](C)[C@H](O)[C@H](C)C=C(C)C=C(OC)C(=O)O[C@@H]1[C@@H](C)[C@@H](O)[C@H](C)[C@]1(O)O[C@H](C(C)C)[C@@H](C)[C@H](O)C1 XDHNQDDQEHDUTM-ZGOPVUMHSA-N 0.000 description 5
- XDHNQDDQEHDUTM-UHFFFAOYSA-N bafliomycin A1 Natural products COC1C=CC=C(C)CC(C)C(O)C(C)C=C(C)C=C(OC)C(=O)OC1C(C)C(O)C(C)C1(O)OC(C(C)C)C(C)C(O)C1 XDHNQDDQEHDUTM-UHFFFAOYSA-N 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- YACHGFWEQXFSBS-XYERBDPFSA-N leptomycin B Chemical compound OC(=O)/C=C(C)/C[C@H](C)[C@@H](O)[C@H](C)C(=O)[C@H](C)/C=C(\C)/C=C/C[C@@H](C)/C=C(/CC)\C=C\[C@@H]1OC(=O)C=C[C@@H]1C YACHGFWEQXFSBS-XYERBDPFSA-N 0.000 description 5
- 210000000130 stem cell Anatomy 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 4
- YACHGFWEQXFSBS-UHFFFAOYSA-N Leptomycin B Natural products OC(=O)C=C(C)CC(C)C(O)C(C)C(=O)C(C)C=C(C)C=CCC(C)C=C(CC)C=CC1OC(=O)C=CC1C YACHGFWEQXFSBS-UHFFFAOYSA-N 0.000 description 4
- 102000043136 MAP kinase family Human genes 0.000 description 4
- 108091054455 MAP kinase family Proteins 0.000 description 4
- 108010044012 STAT1 Transcription Factor Proteins 0.000 description 4
- 102100029904 Signal transducer and activator of transcription 1-alpha/beta Human genes 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 150000001336 alkenes Chemical group 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 230000001973 epigenetic effect Effects 0.000 description 4
- 102000034356 gene-regulatory proteins Human genes 0.000 description 4
- 108091006104 gene-regulatory proteins Proteins 0.000 description 4
- 238000002744 homologous recombination Methods 0.000 description 4
- 230000006801 homologous recombination Effects 0.000 description 4
- 230000002132 lysosomal effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000025308 nuclear transport Effects 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- 229940079156 Proteasome inhibitor Drugs 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 230000001464 adherent effect Effects 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 230000006674 lysosomal degradation Effects 0.000 description 3
- 230000030147 nuclear export Effects 0.000 description 3
- 238000010899 nucleation Methods 0.000 description 3
- 239000003207 proteasome inhibitor Substances 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 108010052875 Adenine deaminase Proteins 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 102100021266 Alpha-(1,6)-fucosyltransferase Human genes 0.000 description 2
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 2
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 2
- 241001453380 Burkholderia Species 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241001277598 Campylobacter lanienae Species 0.000 description 2
- 241000589994 Campylobacter sp. Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 108010031325 Cytidine deaminase Proteins 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 102100030324 Ephrin type-A receptor 3 Human genes 0.000 description 2
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 2
- 102000012216 Fanconi Anemia Complementation Group F protein Human genes 0.000 description 2
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 2
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 2
- 101000819490 Homo sapiens Alpha-(1,6)-fucosyltransferase Proteins 0.000 description 2
- 101000938351 Homo sapiens Ephrin type-A receptor 3 Proteins 0.000 description 2
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 108091008103 RNA aptamers Proteins 0.000 description 2
- 102000004389 Ribonucleoproteins Human genes 0.000 description 2
- 108010081734 Ribonucleoproteins Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 102000004243 Tubulin Human genes 0.000 description 2
- 108090000704 Tubulin Proteins 0.000 description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 239000012620 biological material Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 238000012236 epigenome editing Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 231100000221 frame shift mutation induction Toxicity 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 230000002797 proteolythic effect Effects 0.000 description 2
- 238000004451 qualitative analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 239000002691 unilamellar liposome Substances 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- JLIDBLDQVAYHNE-LXGGSRJLSA-N 2-cis-abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-LXGGSRJLSA-N 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 244000144730 Amygdalus persica Species 0.000 description 1
- 101100107610 Arabidopsis thaliana ABCF4 gene Proteins 0.000 description 1
- 101100300093 Arabidopsis thaliana PYL1 gene Proteins 0.000 description 1
- 101100412103 Arabidopsis thaliana REC3 gene Proteins 0.000 description 1
- 241001135723 Arcobacter skirrowii Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 244000003416 Asparagus officinalis Species 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101100348617 Candida albicans (strain SC5314 / ATCC MYA-2876) NIK1 gene Proteins 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000005979 Citrus limon Nutrition 0.000 description 1
- 244000248349 Citrus limon Species 0.000 description 1
- 240000000560 Citrus x paradisi Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100024811 DNA (cytosine-5)-methyltransferase 3-like Human genes 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 229940126289 DNA-PK inhibitor Drugs 0.000 description 1
- 102100022204 DNA-dependent protein kinase catalytic subunit Human genes 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 241000813514 Endozoicomonas sp. Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 241000751730 Francisella hispaniensis Species 0.000 description 1
- 241001135321 Francisella philomiragia Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108091005772 HDAC11 Proteins 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102100039996 Histone deacetylase 1 Human genes 0.000 description 1
- 102100039385 Histone deacetylase 11 Human genes 0.000 description 1
- 102100039999 Histone deacetylase 2 Human genes 0.000 description 1
- 102100021455 Histone deacetylase 3 Human genes 0.000 description 1
- 102100021454 Histone deacetylase 4 Human genes 0.000 description 1
- 102100021453 Histone deacetylase 5 Human genes 0.000 description 1
- 102100022537 Histone deacetylase 6 Human genes 0.000 description 1
- 102100038715 Histone deacetylase 8 Human genes 0.000 description 1
- 102100029144 Histone-lysine N-methyltransferase PRDM9 Human genes 0.000 description 1
- 102100039489 Histone-lysine N-methyltransferase, H3 lysine-79 specific Human genes 0.000 description 1
- 101000909250 Homo sapiens DNA (cytosine-5)-methyltransferase 3-like Proteins 0.000 description 1
- 101000619536 Homo sapiens DNA-dependent protein kinase catalytic subunit Proteins 0.000 description 1
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 description 1
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 description 1
- 101000899282 Homo sapiens Histone deacetylase 3 Proteins 0.000 description 1
- 101000899259 Homo sapiens Histone deacetylase 4 Proteins 0.000 description 1
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 description 1
- 101000899330 Homo sapiens Histone deacetylase 6 Proteins 0.000 description 1
- 101001032113 Homo sapiens Histone deacetylase 7 Proteins 0.000 description 1
- 101001032118 Homo sapiens Histone deacetylase 8 Proteins 0.000 description 1
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 description 1
- 101001124887 Homo sapiens Histone-lysine N-methyltransferase PRDM9 Proteins 0.000 description 1
- 101000963360 Homo sapiens Histone-lysine N-methyltransferase, H3 lysine-79 specific Proteins 0.000 description 1
- 101001050886 Homo sapiens Lysine-specific histone demethylase 1A Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 1
- 101000616738 Homo sapiens NAD-dependent protein deacetylase sirtuin-6 Proteins 0.000 description 1
- 101000709248 Homo sapiens NAD-dependent protein deacetylase sirtuin-7 Proteins 0.000 description 1
- 101000616727 Homo sapiens NAD-dependent protein deacylase sirtuin-5, mitochondrial Proteins 0.000 description 1
- 101000863629 Homo sapiens NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Proteins 0.000 description 1
- 101001035694 Homo sapiens Polyamine deacetylase HDAC10 Proteins 0.000 description 1
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 241000589242 Legionella pneumophila Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 229930190887 Leptomycin Natural products 0.000 description 1
- 241000589924 Leptospira sp. Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 102100024985 Lysine-specific histone demethylase 1A Human genes 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 1
- 241001313618 Moritella sp. Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- WWGBHDIHIVGYLZ-UHFFFAOYSA-N N-[4-[3-[[[7-(hydroxyamino)-7-oxoheptyl]amino]-oxomethyl]-5-isoxazolyl]phenyl]carbamic acid tert-butyl ester Chemical compound C1=CC(NC(=O)OC(C)(C)C)=CC=C1C1=CC(C(=O)NCCCCCCC(=O)NO)=NO1 WWGBHDIHIVGYLZ-UHFFFAOYSA-N 0.000 description 1
- OVRNDRQMDRJTHS-KEWYIRBNSA-N N-acetyl-D-galactosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-KEWYIRBNSA-N 0.000 description 1
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 1
- 102100031455 NAD-dependent protein deacetylase sirtuin-1 Human genes 0.000 description 1
- 102100022913 NAD-dependent protein deacetylase sirtuin-2 Human genes 0.000 description 1
- 102100030710 NAD-dependent protein deacetylase sirtuin-3, mitochondrial Human genes 0.000 description 1
- 102100021840 NAD-dependent protein deacetylase sirtuin-6 Human genes 0.000 description 1
- 102100034376 NAD-dependent protein deacetylase sirtuin-7 Human genes 0.000 description 1
- 102100021839 NAD-dependent protein deacylase sirtuin-5, mitochondrial Human genes 0.000 description 1
- 102100030709 NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Human genes 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 101100300089 Oryza sativa subsp. japonica PYL10 gene Proteins 0.000 description 1
- 241000260425 Parasutterella excrementihominis Species 0.000 description 1
- 241001083013 Parendozoicomonas haliclonae Species 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 239000006002 Pepper Substances 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 235000016761 Piper aduncum Nutrition 0.000 description 1
- 240000003889 Piper guineense Species 0.000 description 1
- 235000017804 Piper guineense Nutrition 0.000 description 1
- 235000008184 Piper nigrum Nutrition 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102100039388 Polyamine deacetylase HDAC10 Human genes 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 235000006040 Prunus persica var persica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 240000001987 Pyrus communis Species 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 241000606009 Ruminobacter Species 0.000 description 1
- 241000606008 Ruminobacter amylophilus Species 0.000 description 1
- 108091005770 SIRT3 Proteins 0.000 description 1
- 101100007329 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS1 gene Proteins 0.000 description 1
- 101100221606 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) COS7 gene Proteins 0.000 description 1
- 101100068078 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GCN4 gene Proteins 0.000 description 1
- 101100528972 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPD3 gene Proteins 0.000 description 1
- 241000831652 Salinivibrio sharmensis Species 0.000 description 1
- 108010041191 Sirtuin 1 Proteins 0.000 description 1
- 108010041216 Sirtuin 2 Proteins 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 235000009337 Spinacia oleracea Nutrition 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241001037500 Sulfurospirillum sp. Species 0.000 description 1
- 241000123713 Sutterella wadsworthensis Species 0.000 description 1
- 241001628881 Tamilnaduibacter salinus Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 241001140606 Turicimonas muris Species 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 241000607365 Vibrio natriegens Species 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 241000605939 Wolinella succinogenes Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 210000003578 bacterial chromosome Anatomy 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 101150111685 cas4 gene Proteins 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000006652 catabolic pathway Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 241000846566 gamma proteobacterium HTCC5015 Species 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical compound C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 210000004024 hepatic stellate cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 229940115932 legionella pneumophila Drugs 0.000 description 1
- 210000003712 lysosome Anatomy 0.000 description 1
- 230000001868 lysosomic effect Effects 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 210000004779 membrane envelope Anatomy 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 235000014571 nuts Nutrition 0.000 description 1
- 238000012235 off-target genome editing Methods 0.000 description 1
- 230000000174 oncolytic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 210000004738 parenchymal cell Anatomy 0.000 description 1
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 1
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 235000020233 pistachio Nutrition 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 239000001816 polyoxyethylene sorbitan tristearate Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 238000012453 sprague-dawley rat model Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000005029 transcription elongation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
Abstract
向上した安定性を有するCas9エフェクタータンパク質が提供される。Cas9エフェクタータンパク質の実施形態は、N末端に結合した第1の核局在化シグナルと、C末端に結合した第2の核局在化シグナルとを有する。向上した安定性を有するCas9エフェクタータンパク質と、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドと、を含むCas9系も提供される。更に、Cas9エフェクタータンパク質を用いた、真核細胞中の標的配列の部位特異的改変を提供する方法が提供される。
Description
本開示は、向上した安定性を有するCas9エフェクタータンパク質を提供する。Cas9エフェクタータンパク質の実施形態は、N末端に結合した第1の核局在化シグナルと、C末端に結合した第2の核局在化シグナルとを有する。本開示はまた、そのような9エフェクタータンパク質と、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドと、を含むCas9系を提供する。本開示は更に、Cas9エフェクタータンパク質を用いた、真核細胞中の標的配列の部位特異的改変を提供する方法を提供する。
CRIPR/Cas遺伝子編集技術の使用は、バイオテクノロジーに革命をもたらした。CRISPR-Cas9遺伝子編集系は、野生型Cas9タンパク質を使用してDNAにおける二本鎖切断(DSB)形成を誘導するため、又はCas9n/Cas9 D10Aと称される突然変異タンパク質を使用して単一DNA鎖をニッキングするための両方で広範な生物及び細胞系においてうまく使用されている(例えば、非特許文献1及び非特許文献2を参照、それらの各々は参照により全体として本明細書に組み込まれる)。DSB形成が遺伝子機能を破壊し得る小さい挿入及び欠失(インデル)の作出をもたらす一方、Cas9n/Cas9 D10Aニッカーゼは、内因性相同組換え機構を刺激しながらインデル作出を回避する(非相同末端結合を介する修復の結果)。したがって、Cas9n/Cas9 D10Aニッカーゼを使用してDNA領域をゲノム中に高いフィデリティで挿入することができる。
ゲノム編集に加え、CRISPR系は、複数の他の用途、例として、とりわけ調節遺伝子発現、遺伝子回路構築、及び機能的ゲノミクスを有する(非特許文献2に概説)。
Cas9タンパク質は、様々なin vivo及びin vitro用途で有効であることが示されているが、タンパク質としては、特に細胞環境において潜在的に分解されやすい。
Mali et al.,Science,339(6121):823-826(2013)
Sander and Joung,Nature Biotechnology 32(4):347-355(2014)
本開示は、Cas9エフェクタータンパク質であって:a)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;b)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質に関する。
タンパク質のいくつかの実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。いくつかの実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。
いくつかの実施形態では、単節型核局在化シグナルは、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである。いくつかの実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナルであり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナルである。
タンパク質のいくつかの実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。いくつかの実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。いくつかの実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。いくつかの実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。いくつかの実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。
いくつかの実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。いくつかの実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。いくつかの実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。いくつかの実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
いくつかの実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。いくつかの実施形態では、Cas9エフェクタータンパク質は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも90%同一のポリペプチド配列を含む。いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号98の改変ポリペプチドを含み、ここで1つ以上の改変は、N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R、及びV736Yから選択される。
本開示は、また、CRISPR-Cas系であって:a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質と、b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、を含むCRISPR-Cas系に関する。
本開示は、更に、CRISPR-Cas系であって:a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質をコードする核酸配列と、b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドをコードする核酸配列であって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、核酸配列と、を含むCRISPR-Cas系に関する。
系のいくつかの実施形態では、(a)及び(b)のヌクレオチド配列は、真核生物プロモーターの制御下にある。いくつかの実施形態では、(a)及び(b)の核酸配列は、単一のベクター中にある。
本開示は、更に、1つ以上のベクターを含むCRISPR-Cas系であって:a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質をコードする1つ以上のヌクレオチド配列に操作可能に連結された調節エレメントと、b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、を含む1つ以上のベクターを含むCRISPR-Cas系に関する。
系のいくつかの実施形態では、調節エレメントは、真核生物調節エレメントである。
系のいくつかの実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。いくつかの実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナル及び第2の核局在化シグナルは、各々双節型核局在化シグナルである。
いくつかの実施形態では、単節型核局在化シグナルは、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである。いくつかの実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナルであり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナルである。
系のいくつかの実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。いくつかの実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。いくつかの実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。いくつかの実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。いくつかの実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。
系のいくつかの実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。いくつかの実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。いくつかの実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。いくつかの実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
系のいくつかの実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。いくつかの実施形態では、Cas9エフェクタータンパク質は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも90%同一のポリペプチド配列を含む。
系のいくつかの実施形態では、ガイドポリヌクレオチドは、RNAである。いくつかの実施形態では、ガイド配列は、19~30塩基長である。いくつかの実施形態では、ガイド配列は、19~25塩基長である。いくつかの実施形態では、ガイド配列は、21~26塩基長である。いくつかの実施形態では、ガイドポリヌクレオチドは、tracrRNA配列を更に含む。
系のいくつかの実施形態では、Cas9エフェクタータンパク質は、粘着末端を生成する。いくつかの実施形態では、粘着末端は、1~10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。いくつかの実施形態では、粘着末端は、2~6ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。いくつかの実施形態では、粘着末端は、3~5ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。
本開示は、上記で記載されるタンパク質を含む真核細胞を提供する。本開示は更に、上記で記載される系を含む真核細胞を提供する。
本開示は、上記で記載されるタンパク質を含む送達粒子を提供する。本開示は更に、系を含む送達粒子を提供する。送達粒子のいくつかの実施形態では、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。いくつかの実施形態では、複合体は、tracrRNA配列を含むポリヌクレオチドを更に含む。いくつかの実施形態では、送達粒子は、脂質、糖、金属、又はタンパク質を更に含む。
本開示は、上記で記載されるタンパク質を含むベシクルを提供する。本開示は更に、上記で記載される系を含むベシクルを提供する。ベシクルのいくつかの実施形態では、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。いくつかの実施形態では、ベシクルは、tracrRNA配列を含むポリヌクレオチドを更に含む。いくつかの実施形態では、ベシクルは、エキソソーム又はリポソームである。
本開示は、上記で記載されるタンパク質を含むウイルスベクターを提供する。本開示は更に、上記で記載される系を含むウイルスベクターを提供する。いくつかの実施形態では、ウイルスベクターは、tracrRNA配列をコードする核酸配列を更に含む。いくつかの実施形態では、ウイルスベクターは、アデノウイルス粒子、アデノ随伴ウイルス粒子、又は単純ヘルペスウイルス粒子である。
本開示は、また、真核細胞中の標的配列の部位特異的改変を提供する方法であって;方法が
a)細胞中に;i)Cas9エフェクタータンパク質であって:A)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;B)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、ii)Cas9エフェクタータンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、ガイド配列が、宿主ポリヌクレオチド中の標的配列とハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより宿主ポリヌクレオチド中の粘着末端を生成することと;
c)i)(b)の粘着末端と一緒に、又はii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及びポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それにより標的配列を改変することと、を含む方法を提供する。
a)細胞中に;i)Cas9エフェクタータンパク質であって:A)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;B)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、ii)Cas9エフェクタータンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、ガイド配列が、宿主ポリヌクレオチド中の標的配列とハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより宿主ポリヌクレオチド中の粘着末端を生成することと;
c)i)(b)の粘着末端と一緒に、又はii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及びポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それにより標的配列を改変することと、を含む方法を提供する。
方法のいくつかの実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。いくつかの実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。いくつかの実施形態では、単節型核局在化シグナルは、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである。いくつかの実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナル及び第2の核局在化シグナルは、各々双節型核局在化シグナルである。いくつかの実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナルであり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナルである。
方法のいくつかの実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。いくつかの実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。いくつかの実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。いくつかの実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。いくつかの実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。
方法のいくつかの実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。いくつかの実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。いくつかの実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。いくつかの実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
方法のいくつかの実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。いくつかの実施形態では、Cas9エフェクタータンパク質は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。
方法のいくつかの実施形態では、ガイドポリヌクレオチドは、RNAである。いくつかの実施形態では、ガイドポリヌクレオチドは、19~30塩基長である。いくつかの実施形態では、ガイドポリヌクレオチドは、19~25塩基長である。いくつかの実施形態では、ガイドポリヌクレオチドは、21~26塩基長である。いくつかの実施形態では、ガイドポリヌクレオチドは、tracrRNA配列を更に含む。
方法のいくつかの実施形態では、Cas9エフェクタータンパク質は、粘着末端を生成する。いくつかの実施形態では、粘着末端は、1~10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。いくつかの実施形態では、粘着末端は、2~6ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。いくつかの実施形態では、粘着末端は、3~5ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。実施形態では、粘着末端は、平滑末端である。実施形態では、粘着末端は、5’一本鎖ポリヌクレオチドオーバーハングを有する。実施形態では、粘着末端は、3’一本鎖ポリヌクレオチドオーバーハングを有する。
方法のいくつかの実施形態では、真核細胞は、動物又はヒト細胞である。いくつかの実施形態では、真核細胞は、ヒト細胞である。いくつかの実施形態では、真核細胞は、植物細胞である。
方法のいくつかの実施形態では、改変は、標的配列の少なくとも一部の欠失である。いくつかの実施形態では、改変は、標的配列の突然変異である。いくつかの実施形態では、改変は、標的配列中への目的配列の挿入である。
本開示は、また、細胞内のCas9エフェクタータンパク質の分解を低減する方法であって、a)Cas9エフェクタータンパク質のN末端に第1の核局在化シグナルを結合させることと;b)Cas9エフェクタータンパク質のC末端に第2の核局在化シグナルを結合させることと;を含む方法を提供する。
方法の実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、単節型核局在化シグナルは、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである。実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナルであり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナルである。
以下の図面は、本明細書の一部を形成し、更に本発明の特定の態様の例示的な実施形態を実証するために含まれる。
本開示は、Cas9エフェクタータンパク質のN末端及びC末端の両方に核局在化シグナルを含む向上した安定性を有するCas9エフェクタータンパク質を提供する。本開示はまた、向上した安定性を有するCas9エフェクタータンパク質と、Cas9エフェクタータンパク質と複合体化する核酸ガイド配列と、を含む系を提供する。本開示はまた、向上した安定性を有するCas9エフェクタータンパク質を用いた、真核細胞中の標的配列の部位特異的改変のための方法を提供する。本開示は、更に、タンパク質のN末端及びC末端の両方に核局在化シグナルを結合させることにより、Cas9エフェクタータンパク質の安定性を向上させる方法を提供する。
理論に縛られることを望むものではないが、Cas9エフェクタータンパク質に更なる核局在化シグナルが存在すると、タンパク質の核内輸送が強化されると考えられている。この核内輸送の強化により、Cas9エフェクタータンパク質が細胞質内で過ごす時間が短縮され、ここで細胞質タンパク質の一般的な分解経路であるリソソーム分解の基質となる可能性がある。実施形態では、本明細書に記載のCas9エフェクタータンパク質は、向上した安定性を有するが、向上した安定性を有さないCas9タンパク質と比較して、顕著なCas9エフェクター活性を保持する。
本明細書で使用される場合、「向上した安定性」を有するタンパク質は、細胞などのin vivo環境、又はin vitro環境内部でより長い寿命を有するタンパク質を意味する。いくつかの実施形態では、「向上した安定性」を有するタンパク質は、プロテアーゼなどのタンパク質を分解する因子への曝露が少ないこと、及び/又はタンパク質を分解する因子に対する基質が少ないことにより、例えばタンパク質内の結合の切断に対してより耐性があることにより、環境中での分解に対してより耐性があり得る。実施形態では、「向上した安定性」は、未改変の状態のタンパク質と比較して向上している。実施形態では、本明細書に記載されるCas9エフェクタータンパク質の「向上した安定性」は、核局在化シグナルを有さないCas9エフェクタータンパク質と比較して向上している。実施形態では、本明細書に記載されるCas9エフェクタータンパク質の「向上した安定性」は、核局在化シグナルを1つだけ有するCas9エフェクタータンパク質と比較して向上している。実施形態では、本明細書に記載されるCas9エフェクタータンパク質の「向上した安定性」は、Cas9エフェクタータンパク質のN末端に結合している核局在化シグナルを1つだけ有するCas9エフェクタータンパク質と比較して向上している。いくつかの実施形態では、Cas9エフェクタータンパク質の安定性は、タンパク質の量を決定するための当業者に公知の手段(例えば、ウェスタンブロット)、又はタンパク質の活性を測定することによってタンパク質の量を決定するための当業者に公知の手段(例えば、本明細書に記載の活性アッセイ)により測定した場合、発現の30分後、発現の60分後、発現の90分後、発現の120分後、発現の150分後、発現の120分後に、10%超、20%超、30%超、40%超、50%超、60%超、70%超、80%超、90%超、100%超、120%超、140%超、160%超、180%超、200%超、300%超、又は400%超向上している。
本明細書で使用される場合、「1つの(a)」又は「1つの(an)」は、1つ以上を意味し得る。本明細書において使用され、語「含む(comprising)」と同時に使用される場合、語「a」又は「an」は、1つ又は2つ以上を意味し得る。本明細書で使用される場合、「別の」又は「更なる」は、少なくとも第2のもの以上を意味し得る。
本出願全体を通して、「約」という用語は、ある値が、その値を決定するために用いられている方法/デバイスに関する誤差の固有の変動又は試験対象間で存在する変動を含むことを示すために使用される。典型的には、用語「約」は、状況に応じておよそ又は1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%又は20%未満、又はそれら以上の変動性を包含することを意味する。実施形態では、当業者は、本明細書で用いられる文脈に応じて、用語「約」によって示される変動のレベルを理解するであろう。用語「約」の使用には、具体的に列挙された値も含まれることも理解されるべきである。
特許請求の範囲における用語「又は」の使用は、代替物のみを指すと明示されない限り又はその代替物が相互に排他的でない限り、「及び/又は」を意味するために使用されるが、本開示は、代替物のみ及び「及び/又は」を指す定義を支持する。
本明細書で使用される場合、用語「含んでいる(comprising)」(並びに、含んでいるの任意のバリアント又は形態、例えば、「含む(comprise)」及び「含む(comprises)」)、「有している(having)」(並びに、有しているの任意のバリアント又は形態、例えば、「有する(have)」及び「有する(has)」)、「包含している(including)」(並びに、包含しているの任意のバリアント又は形態、例えば、「包含する(includes)」及び「包含する(include)」)又は「含有している(containing)」(並びに、含有しているの任意のバリアント又は形態、例えば、「含有する(contains)」及び「含有する(contain)」)は、包含的又はオープンエンドであり、追加の引用されない要素又は方法工程を除外するものではない。
「例えば」という用語及びその対応する略語「e.g.(イタリック体であるか否かを問わない)」の使用は、引用される特定の用語が、別途明示的に述べられていない限り、参照されるか又は引用される特定の例に限定されることが意図されていない本開示の代表的な例及び実施形態であることを意味する。
本明細書で使用される場合、「間」とは、範囲の両端を含む範囲である。例えば、xとyの間の数値には、数値xとy、及びxとyに含まれるあらゆる数値が明示的に含まれる。
Cas9エフェクタータンパク質
実施形態では、本開示は、向上した安定性を有するCas9エフェクタータンパク質を提供する。実施形態では、本開示は、2つ以上の核局在化シグナルを含むCas9エフェクタータンパク質を提供する。実施形態では、本開示は、Cas9エフェクタータンパク質であって:a)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;b)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質を提供する。
実施形態では、本開示は、向上した安定性を有するCas9エフェクタータンパク質を提供する。実施形態では、本開示は、2つ以上の核局在化シグナルを含むCas9エフェクタータンパク質を提供する。実施形態では、本開示は、Cas9エフェクタータンパク質であって:a)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;b)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質を提供する。
本明細書に記載されるように、Casタンパク質は、とりわけ、ゲノム編集、遺伝子調節、遺伝子回路構築、及び機能的ゲノミクスに使用することができるCRISPR-Cas系の構成成分である。Cas1及びCas2タンパク質は現在同定されている全てのCRISPR系にユニバーサルであると考えられている一方、Cas3、Cas9及びCas10タンパク質は、それぞれI型、II型、及びIII型CRISPR系に特異的であると考えられている。
CRISPR-Cas9系(II型系)についての最初の公開後、Cas9バリアントが様々な細菌種において同定され、番号は機能的に特徴付けされた。例えば、Chylinski et al.,“Classification and evolution of type II CRISPR-Cas systems”,Nucleic Acids Research 42(10):6091-6105(2014)、Ran et al.,“In vivo genome editing using Staphylococcus aureus Cas9”,Nature 520(7546):186-91(2015)、及びEsvelt et al.,“Orthogonal Cas9 proteins for RNA-guided gene regulation and editing”,Nature Methods 10(11):1116-1121(2013)参照(その全容が参照により本明細書に組み込まれる)。
本開示は、向上したCas9安定性を有するCRISPR-Cas9系の新規のエフェクタータンパク質を包含する。用語「Cas9」、「Cas9タンパク質」及び「Cas9エフェクタータンパク質」は、互換的であり、CRISPR-Cas9系において使用される場合に粘着末端、平滑末端、又はニックの入ったdsDNAを提供し得るエフェクタータンパク質を記載するために本明細書において使用される。
実施形態では、核局在化シグナルは、単節型核局在化シグナル、双節型核局在化シグナル、又はこれらの組み合わせである。核局在化配列又はNLSとも呼ばれる核局在化シグナルは、その配列を有するタンパク質を細胞核に取り込む原因となるアミノ酸配列である。実施形態では、単節型核局在化シグナルは、核内輸送が認識される単一の連続配列を有するシグナルである。実施形態では、双節型核局在化シグナルは、スペーサー配列によって分離された核内輸送が認識される2つの配列を有するシグナルである。単節型と双節型核局在化シグナルの両方の例が、本明細書で提供される。
Cas9エフェクタータンパク質の実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。
実施形態では、第1及び第2の核局在化シグナルは、どちらも単節型であり得るか、どちらも双節型であり得るか、又は単節型及び双節型の混合物であり得る。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。
実施形態では、単節型核局在化シグナルは、当該技術分野において公知の単節型核局在化シグナルである。実施形態では、単節型核局在化シグナルは、表1に列挙される単節型核局在化シグナルのうちの1つ、又はこれらの組み合わせである。
実施形態では、双節型核局在化シグナルは、当該技術分野において公知の双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、表2に列挙される双節型核局在化シグナルのうちの1つ、又はこれらの組み合わせである。
タンパク質の実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナル(配列番号7)であり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナル(配列番号1)である。
実施形態では、核局在化シグナルは、当該技術分野において標準的な方法を使用して、Cas9エフェクタータンパク質に結合している。実施形態では、核局在化シグナルをコードする核酸配列は、制限酵素消化及びライゲーションなどの標準的な分子生物学的方法を使用して、Cas9エフェクタータンパク質をコードする核酸配列の上流及び下流に配置され、その結果、そのN末端とC末端に核局在化シグナルを含むCas9エフェクタータンパク質をコードする核酸が形成される。次いで、この核酸を細胞、例えば真核細胞内で発現させることができる。その他の実施形態では、そのN末端及びC末端に核局在化シグナルを含むCas9エフェクタータンパク質は、固相タンパク質合成を使用して完全又は部分的に合成される。
タンパク質の実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。
リンカーが使用される実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~20個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~15個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~10個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~5個の残基を有するペプチドリンカーである。実施形態では、リンカーは、置換又は非置換のC2~C20アルキル、アルケン、又はアルキニル鎖である。
実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上の型を含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上の型を含む。
実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
第1及び第2の核局在化シグナルを含むCas9タンパク質のCas9部分は、当該技術分野において公知の任意のCas9エフェクタードメインに由来し得る。実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。好適なII-B型Cas9タンパク質の例は、国際公開第2019/099943号パンフレットに記載されている(参照として本明細書に組み込まれている)。実施形態では、好適なII-B型Cas9は、粘着末端を生成することができる。本明細書に記載されるように、II-B型CRISPR系は、とりわけ、casオペロン上のcas4遺伝子の存在により同定され、II-B型Cas9タンパク質は、TIGR03031 TIGRFAMタンパク質ファミリーのものである。したがって、実施形態では、Cas9部分は、TIGR03031 TIGRFAMタンパク質ファミリーのものである。実施形態では、Cas9部分は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。実施形態では、部位特異的ヌクレアーゼは、1E-10のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。II-B型CRISPR系は、例えば、レジオネラ・ニューモフィラ(Legionella pneumophila)、フランシセラ・ノビシダ(Francisella novicida)、ガンマプロテオバクテリア(gamma proteobacterium)HTCC5015、パラサテレラ・エキスクレメンティホミニス(Parasutterella excrementihominis)、サテレラ・ワズワーセンシス(Sutterella wadsworthensis)、スルフロスピリラム属種(Sulfurospirillum sp.)SCADC、ルミノバクター属種(Ruminobacter sp.)RM87、バークホルデリア・バクテリウム(Burkholderiales bacterium)1_1_47、バクテロイデス・オーラル・タクソン(Bacteroidetes oral taxon)274株F0058、ウォリネラ・スクシノゲネス(Wolinella succinogenes)、バークホルデリア・バクテリウム(Burkholderiales bacterium)YL45、ルミノバクター・アミロフィラス(Ruminobacter amylophilus)、カンピロバクター属種(Campylobacter sp.)P0111、カンピロバクター属種(Campylobacter sp.)RM9261、カンピロバクター・ラニエナエ(Campylobacter lanienae)株RM8001、カンプリロバクター・ラニエナエ(Camplylobacter lanienae)株P0121、ツリシモナス・ムリス(Turicimonas muris)、レジオネラ・ロンジニエンシス(Legionella londiniensis)、サリニビブリオ・シャルメンシス(Salinivibrio sharmensis)、レプトスピラ属種(Leptospira sp.)単離株FW.030、モリテラ属種(Moritella sp.)単離株NORP46、エンドゾイコモナス属種(Endozoicomonassp.)S-B4-1U、タミルナドゥイバクター・サリナス(Tamilnaduibacter salinus)、ビブリオ・ナトリエゲンス(Vibrio natriegens)、アルコバクター・スキロウイイ(Arcobacter skirrowii)、フランシセラ・フィロミラギア(Francisella philomiragia)、フランシセラ・ヒスパニエンシス(Francisella hispaniensis)、又はパレンドゾイコモナス・ハリクロナエ(Parendozoicomonas haliclonae)などの細菌種で見出される。
いくつかの実施形態では、Cas9は、二本鎖ポリヌクレオチド開裂、例えば二本鎖DNA開裂を生成することができる。いくつかの実施形態では、Cas9は、1つ以上のヌクレアーゼドメイン、例えばRuvC及びHNHなどを含むことができ、二本鎖DNAを開裂することができる。いくつかの実施形態では、Cas9は、RuvCドメインとHNHドメインとを含み、その各々が二本鎖DNAの1本の鎖を開裂することができる。いくつかの実施形態では、Cas9は、平滑末端を生成する。いくつかの実施形態では、CasヌクレアーゼのRuvC及びHNHは、各DNA鎖を同じ位置で開裂し、それによって平滑末端を生成する。いくつかの実施形態では、Cas9は、粘着末端を生成する。いくつかの実施形態では、Cas9のRuvC及びHNHは、各DNA鎖を異なる位置で開裂(すなわち、「オフセット」で切断)し、それによって粘着末端を生成する。本明細書において使用される用語「粘着末端(cohesive ends)」、「段違い末端」、又は「付着末端(sticky ends)」は、不均等の長さの鎖を有する核酸断片を指す。「平滑末端」と対照的に、粘着末端は、二本鎖核酸(例えば、DNA)上の段違い切断により生成される。付着又は粘着末端は、非対合ヌクレオチド、又は「オーバーハング」、例えば、3’又は5’オーバーハングを有する突出一本鎖を有する。
実施形態では、用語Cas9は、遺伝子操作されたCas9バリアント、例えば、deadCas9-FokI、Cas9nD10A-FokI、及びCas9nH840A-FokIなどを指す。本開示の実施形態では、Cas9エフェクタータンパク質は:a)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;b)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む。
いくつかの実施形態では、Cas9(例えば、融合タンパク質のCas9ドメイン)は、RNA(gRNA)結合活性を保持し、したがってgRNAに相補的な標的部位に結合し得るヌクレアーゼ不活性化Cas9(例えば、DNA開裂活性を欠くCas9;「dCas9」)を含む。実施形態では、融合タンパク質は、dCas9ドメインと転写制御因子ドメインの間にリンカーを含む。実施形態では、dCas9ドメインは転写活性化因子又は抑制因子ドメインと融合し、相補的なgRNA配列を介して特定の標的部位に誘導し得るdCas9転写制御因子を形成する。リンカーの例は、本明細書で記載されている。実施形態では、dCas9ドメインと転写制御因子ドメインとの融合タンパク質は、本明細書に記載されるように、dCas9ドメインのN末端に結合した核局在化シグナルと、転写制御因子ドメインのC末端に結合した核局在化シグナルと、を有する。
実施形態では、dCas9ドメインは、転写をブロックするロードブロックとして機能するdCas9ドメインである。実施形態では、dCas9ドメインは、RNAポリメラーゼの転写伸長を立体的にブロックし得る。
実施形態では、dCa9ドメインは、VP64転写活性化ドメインに融合している。実施形態では、dCas9ドメインは、小さなペプチドGCN4のタンデムリピートを利用して、転写活性化因子VP64と融合した単鎖可変断片の複数コピーを動員するSunTag遺伝子活性化系を使用して改変される。実施形態では、dCas9ドメインは、相乗活性化メディエーター(SAM)系を使用して改変されており、ここでdCas9はVP64に融合されており、sgRNAは転写活性化因子p65及びヒートショック因子1(HSF1)に融合されたMS2バクテリオファージコートタンパク質(MCP)を動員する2つのMS2RNAアプタマーを含むように改変されている。実施形態では、dCas9ドメインは遺伝子活性化のためにVP64-p65-Rta(VPR)で改変されており、ここでdCas9は組み合わせVPR転写活性化ドメインに融合して活性化効果を増幅する。実施形態では、dCas9ドメインは、遺伝子の活性化及び抑制を同時に行うためにscRNAで改変されており、ここでsgRNA及びRNAアプタマー(例えば、MS2、com、PP7)を結合するハイブリッドRNAスキャホールドは、転写活性化因子又は抑制因子のいずれかに結合したRNA結合タンパク質(例えば、MCP、COM、PCP)を動員することができる。
実施形態では、dCas9ドメインは、化学的又は光制御二量化系で改変されており、ここで化学的又は光誘起二量化剤(例えば、PYL1::ABI、GID::GAI及びPhyB::PIF)は、それぞれ、dCas9及び転写エフェクターに融合される。これらの実施形態では、対応する化学物質(例えば、アブシジン酸[ABA]又はジベレリン[GA])又は光の添加により、遺伝子調節を誘発することができる。実施形態では、dCas9ドメインは、スプリットdCas系又は受容体共役系:I/O分子デバイスを使用して改変される。
実施形態では、dCas9は、Xu et al.,“A CRISPR-dCas Toolbox for Genetic Engineering and Synthetic Biology,”J.Mol.Biol.,2019,431:34-47(参照として本明細書に組み込まれている)に記載されているように第2世代又は第3世代の転写制御因子である。
実施形態では、dCas9は、エピゲノム編集用のdCas9融合タンパク質である。実施形態では、エピゲノム編集用のdCas9は、Xu et al.,J.Mol.Biol.,2019,431:34-47(参照として本明細書に組み込まれている)に記載されているようにdCas9融合タンパク質である。実施形態では、dCas9は、メチルトランスフェラーゼ、例えば、DNMT3A、DNMT3B、又はDNMT3Lに融合している。実施形態では、dCas9は、KRABドメインに融合している。実施形態では、dCas9は、DNAデメチラーゼ、例えば、TET1に融合している。実施形態では、dCas9は、ヒストンメチルトランスフェラーゼ、例えば、PRDM9又はDOT1Lに融合している。実施形態では、dCas9は、ヒストンデメチラーゼ、例えば、LSD1に融合している。実施形態では、dCas9は、ヒストンアセチルトランスフェラーゼ、例えば、p300に融合している。実施形態では、dCas9は、ヒストンデアセチラーゼ、例えば、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10若しくはHDAC11、又はSIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6若しくはSIRT7に融合している。
実施形態では、dCas9は、ゲノムイメージング用のdCas9融合タンパク質である。実施形態では、ゲノムイメージング用のdCas9は、Xu et al.,J.Mol.Biol.,2019,431:34-47(参照として本明細書に組み込まれている)に記載されているようにdCas9融合タンパク質である。実施形態では、dCas9は、蛍光タンパク質、例えば、緑色蛍光タンパク質、黄色蛍光タンパク質、青色蛍光タンパク質、青緑色蛍光タンパク質、橙色蛍光タンパク質、又は赤色蛍光タンパク質に融合している。
実施形態では、dCas9は、塩基編集用のdCas9融合タンパク質である。実施形態では、dCas9は、シトシン塩基エディター(Base editor)に融合している。実施形態では、dCas9は、アデニン塩基エディターに融合している。実施形態では、dCas9は、ウラシル塩基エディターに融合している。実施形態では、dCas9は、シチジンデアミナーゼに融合している。実施形態では、dCas9は、アデニンデアミナーゼに融合している。実施形態では、dCas9は、ウラシルDNAグリコシラーゼに融合している。
実施形態では、Cas9ドメインは、塩基編集用Cas9ニッカーゼ融合タンパク質である。本明細書で使用される「Cas9ニッカーゼ」は、標的DNAの1本鎖のみを開裂するCas9タンパク質である。実施形態では、Cas9ニッカーゼは、シトシン塩基エディターに融合している。実施形態では、Cas9ニッカーゼは、アデニン塩基エディターに融合している。実施形態では、Cas9ニッカーゼは、ウラシル塩基エディターに融合している。実施形態では、Cas9ニッカーゼは、シチジンデアミナーゼに融合している。実施形態では、Cas9ニッカーゼは、アデニンデアミナーゼに融合している。実施形態では、Cas9ニッカーゼは、ウラシルDNAグリコシラーゼに融合している。実施形態では、Cas9ドメインは、米国特許出願公開第2018/0312828号明細書、同第2018/0237787号明細書、及び同第2020/0010835号明細書(その各々が、参照として本明細書に組み込まれている)で記載されるように塩基編集用Cas9ニッカーゼ融合である。
実施形態では、Cas9ドメインは、プライム編集用Cas9ニッカーゼ融合タンパク質である。実施形態では、Cas9ニッカーゼは、逆転写酵素に融合している。実施形態では、Cas9ドメインは国際公開第2020/191248号パンフレット(参照として本明細書に組み込まれている)で記載されるようにプライム編集用Cas9ニッカーゼ融合である。
実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のうちの1つから選択されるポリペプチドを含む。
実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71を含む。
タンパク質の実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも90%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも95%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも98%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも99%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98を含む。
いくつかの実施形態では、Cas9エフェクタータンパク質は、配列番号98のR1336、R1389、R668、N1164、N1265、N1300、N1412、N347、N348、N562、N565、N618、N651、D1266、D309、D345、D487、D607、D30、Q1129、Q1381、Q624、Q661、Q713、Q734、E1032、E1409、E436、E610、E611、E691、E697、G1245、G1335、H777、I1242、L125、L1162、L1264、L1299、K1031、K443、K490、K615、K656、F1035、F620、F636、F670、S1243、S1334、S1380、S1410、S1413、S634、S638、S711、S1006、S1017、T1267、T1333、T551、T639、T639、T640、T666、T897、Y1338、Y343、Y566、V1273、V1274、V486、V644、V660、V667、V736のうちの1つ以上、又はこれらの組み合わせの位置でアミノ酸改変を含む配列番号98を含む。
いくつかの実施形態では、アミノ酸改変は、以下の変異R668A、N1164R、N1265R、N1300R、N1412R、N347R、N348R、N562R、N565R、N618R、N651A、N651R、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q624R、Q661A、Q661R、Q713R、Q734R、E1032G、E1032R、E1409A、E1409R、E436R、E610R、E611R、E691R、E697R、G1245R、G1335R、H777A、I1242S、L125R、L125Y、L1162S、L1264S、L1299S、K1031R、K443R、K490R、K615R、K656R、F1035R、F620R、F636R、F670Y、S1243R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638A、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T1333A、T1333R、T551R、T639A、T639R、T640R、T666R、T897R、Y1338A、Y1338R、Y343R、Y566R、V1273S、V1274S、V486R、V644R、V660R、V660Y、V667R、V667S、V736R、又はV736Yのうちの1つ以上を含む。いくつかの実施形態では、アミノ酸改変は、以下の変異N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R、又はV736Yのうちの1つ以上を含む。いくつかの実施形態では、アミノ酸改変は、以下の変異N1265R、N1300R、N1412R、D1266R、E436R、G1335R、S1334R、S1380R、S1017R、T1267R、V736R、又はV736Yのうちの1つ以上を含む。
いくつかの実施形態では、アミノ酸改変により、Cas9エフェクタータンパク質とDNA間の結合親和性が増加する。
CRISPR-Cas系
実施形態では、本開示は、向上した安定性を有するCas9エフェクタータンパク質を含むCRISPR-Cas系を提供する。
実施形態では、本開示は、向上した安定性を有するCas9エフェクタータンパク質を含むCRISPR-Cas系を提供する。
一般に、CRISPR又はCRISPR-Cas又はCRISPR系は、標的配列の部位におけるCRISPR複合体の形成を促進するエレメント(内因性CRISPR系に関してプロトスペーサーとも称される)により特徴付けられる。CRISPR複合体の文脈において、「標的配列」は、ガイドポリヌクレオチドが標的化するように、例えば、相補性を有するように設計される配列を指し、標的配列及びガイドポリヌクレオチド間のハイブリダイゼーションがCRISPR複合体の形成を促進する。標的配列に対する相補性が開裂活性に重要であり得るガイドポリヌクレオチドのセクションは、本明細書においてガイド配列と称される。標的配列は、任意のポリヌクレオチド、例えば、DNA又はRNAポリヌクレオチドを含み得、目的標的遺伝子座内に局在し得る。実施形態では、標的配列は、細胞の核又は細胞質中に局在する。実施形態では、標的配列は、染色体上に局在する(TSC)。実施形態では、標的配列は、ベクター上に局在する(TSV)。
実施形態では、本開示は、CRISPR-Cas系であって:
a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含むCas9エフェクタータンパク質と、
b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、を含むCRISPR-Cas系を提供する。
a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含むCas9エフェクタータンパク質と、
b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、を含むCRISPR-Cas系を提供する。
実施形態では、本開示は、CRISPR-Cas系であって:
a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含むCas9エフェクタータンパク質をコードする核酸配列と、
b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドをコードする核酸配列であって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、核酸配列と、を含むCRISPR-Cas系を提供する。
a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含むCas9エフェクタータンパク質をコードする核酸配列と、
b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドをコードする核酸配列であって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、核酸配列と、を含むCRISPR-Cas系を提供する。
本系の実施形態では、(a)及び(b)のヌクレオチド配列は、同じプロモーターの制御下にある。実施形態では、(a)及び(b)のヌクレオチド配列は、異なるプロモーターの制御下にある。
本明細書で使用される場合、「プロモーター」、「プロモーター配列」、又は「プロモーター領域」は、RNAポリメラーゼに結合し、下流コード又は非コード配列の転写の開始に関与し得るDNA調節領域/配列を指す。本開示のいくつかの例において、プロモーター配列は、転写開始部位を含み、バックグラウンドを超えて検出可能なレベルにおいて転写を開始するために使用される最小数の塩基又はエレメントを含むように上流に伸びる。実施形態では、プロモーター配列は、転写開始部位及びRNAポリメラーゼの結合を担うタンパク質結合ドメインを含む。真核生物プロモーターは、常にではないが、「TATA」ボックス及び「CAT」ボックスを含有することが多い。種々のプロモーター、例として誘導性プロモーターを使用して、本開示の種々のベクターを駆動することができる。
実施形態では、(a)及び(b)のヌクレオチド配列は、真核生物プロモーターの制御下にある。実施形態では、(a)及び(b)のヌクレオチド配列は、2つの異なる真核生物プロモーターの制御下にある。実施形態では、真核生物プロモーターのうち少なくとも1つは、ヒト誘導多能性幹細胞中で活性であるプロモーターである。実施形態では、真核生物プロモーターのうち少なくとも1つは、EF1alpha(EF1a)である。実施形態では、真核生物プロモーターのうち少なくとも1つは、ヒトサイトメガロウイルス(CMV)プロモーターである。実施形態では、真核生物プロモーターのうち少なくとも1つは、ドキシサイクリン調節性プロモーターTRE3Gである。実施形態では、(a)及び(b)のヌクレオチド配列は、細菌プロモーターの制御下にある。実施形態では、(a)及び(b)のヌクレオチド配列は、2つの異なる細菌プロモーターの制御下にある。実施形態では、(a)及び(b)のヌクレオチド配列は、ウイルスプロモーターの制御下にある。実施形態では、(a)及び(b)のヌクレオチド配列は、2つの異なるウイルス生物プロモーターの制御下にある。
実施形態では、(a)及び(b)の核酸配列は、単一のベクター中にある。実施形態では、(a)及び(b)の核酸配列は、別々のベクター中にある。
実施形態では、本開示は、1つ以上のベクターを含むCRISPR-Cas系であって:
a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含むCas9エフェクタータンパク質をコードする1つ以上のヌクレオチド配列に操作可能に連結された調節エレメントと、
b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、を含む1つ以上のベクターを含むCRISPR-Cas系を提供する。
a)Cas9エフェクタータンパク質であって:i)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;ii)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含むCas9エフェクタータンパク質をコードする1つ以上のヌクレオチド配列に操作可能に連結された調節エレメントと、
b)ガイド配列を含み、Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、を含む1つ以上のベクターを含むCRISPR-Cas系を提供する。
本系の実施形態では、調節エレメントは、真核生物調節エレメントである。本系の実施形態では、調節エレメントは、原核細胞調節エレメントである。
実施形態では、Cas9エフェクタータンパク質をコードするヌクレオチド及びガイドポリヌクレオチドは、単一ベクター上に存在する。実施形態では、Cas9エフェクタータンパク質をコードするヌクレオチド、ガイドポリヌクレオチド(又はガイドポリヌクレオチドに転写され得るヌクレオチド)、及びtracrRNAは、単一ベクター上に存在する。実施形態では、Cas9エフェクタータンパク質をコードするヌクレオチド、ガイドポリヌクレオチド(又はガイドポリヌクレオチドに転写され得るヌクレオチド)、tracrRNA、及びダイレクトリピート配列は、単一ベクター上に存在する。実施形態では、ベクターは、発現ベクターである。実施形態では、ベクターは、哺乳動物発現ベクターである。実施形態では、ベクターは、ヒト発現ベクターである。実施形態では、ベクターは、植物発現ベクターである。
実施形態では、Cas9エフェクタータンパク質をコードするヌクレオチド及びガイドポリヌクレオチドは、単一核酸分子である。実施形態では、Cas9エフェクタータンパク質をコードするヌクレオチド、ガイドポリヌクレオチド、及びtracrRNAは、単一核酸分子である。実施形態では、Cas9エフェクタータンパク質をコードするヌクレオチド、ガイドポリヌクレオチド、tracrRNA、及びダイレクトリピート配列は、単一核酸分子である。実施形態では、単一の核酸分子は、発現ベクターである。実施形態では、単一の核酸分子は、哺乳動物発現ベクターである。実施形態では、単一の核酸分子は、ヒト発現ベクターである。実施形態では、単一の核酸分子は、植物発現ベクターである。
「操作可能に連結された」は、目的ヌクレオチド、すなわち、Cas9エフェクタータンパク質をコードするヌクレオチドが、ヌクレオチド配列の発現を可能とする様式で調節エレメントに連結していることを意味する。したがって、実施形態では、ベクターは、発現ベクターである。
実施形態では、調節エレメントは、プロモーターである。実施形態では、調節エレメントは、細菌プロモーターである。実施形態では、調節エレメントは、ウイルスプロモーターである。実施形態では、調節エレメントは、真核生物調節エレメント、すなわち真核生物プロモーターである。実施形態では、真核生物調節エレメントは、哺乳動物プロモーターである。
上記系のいずれかの実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。
実施形態では、第1及び第2の核局在化シグナルは、どちらも単節型であり得るか、どちらも双節型であり得るか、又は単節型及び双節型の混合物であり得る。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。
上記系のいずれかの実施形態では、単節型核局在化シグナルは、当該技術分野において公知の単節型核局在化シグナルである。実施形態では、単節型核局在化シグナルは、上記表1に列挙される単節型核局在化シグナル(配列番号1~6)のうちの1つ、又はこれらの組み合わせである。
上記系のいずれかの実施形態では、双節型核局在化シグナルは、当該技術分野において公知の双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、上記表2に列挙される双節型核局在化シグナル(配列番号7~9)のうちの1つ、又はこれらの組み合わせである。
上記系のいずれかの実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナル(配列番号7)であり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナル(配列番号1)である。
上記系のいずれかの実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。
リンカーが使用される実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~20個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~15個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~10個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~5個の残基を有するペプチドリンカーである。実施形態では、リンカーは、置換又は非置換のC2~C20アルキル、アルケン、又はアルキニル鎖である。
上記系のいずれかの実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上の型を含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上の型を含む。
上記系のいずれかの実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
上記系のいずれかの実施形態では、第1及び第2の核局在化シグナルを含むCas9タンパク質のCas9部分は、当該技術分野において公知の任意のCas9エフェクタードメインに由来し得る。実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。好適なII-B型Cas9タンパク質の例は、上記に記載されている。実施形態では、Cas9部分は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。実施形態では、部位特異的ヌクレアーゼは、1E-10のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。
上記系のいずれかの実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のうちの1つから選択されるポリペプチドを含む。
上記系のいずれかの実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71を含む。
上記系のいずれかの実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも90%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも95%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも98%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも99%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98を含む。
上記系のいずれかの他の実施形態では、Cas9エフェクタータンパク質のCas9部分は、dCas9、すなわち、DNA二本鎖開裂活性を欠く不活性化された、又は「死んだ(dead)」Cas9を含む。実施形態では、dCas9は、本明細書の他の場所に記載されているように、転写制御因子、エピジェネティクスな調節タンパク質、又は蛍光タンパク質などの他の活性ドメインと融合することができる。dCas9が別の活性ドメインに融合される実施形態では、本明細書に記載される核局在化シグナルは、Cas9エフェクタータンパク質コンストラクト全体のN末端及びC末端に存在する。
上記系のいずれかの他の実施形態では、Cas9エフェクタータンパク質のCas9部分は、Cas9ニッカーゼ、すなわちDNA二本鎖の一方の鎖のみを開裂するCas9タンパク質を含む。実施形態では、Cas9ニッカーゼは、本明細書の他の場所に記載されているように、転写制御因子、エピジェネティクスな調節タンパク質、又は蛍光タンパク質などの他の活性ドメインと融合することができる。Cas9ニッカーゼが別の活性ドメインに融合される実施形態では、本明細書に記載される核局在化シグナルは、Cas9エフェクタータンパク質コンストラクト全体のN末端及びC末端に存在する。
本明細書に記載の系及び方法は、ガイドポリヌクレオチドを含み得る。実施形態では、ガイドポリヌクレオチドは、RNAである。CRISPR-Cas9構成成分に結合し、それらを標的DNA内の特異的局在に標的化するRNAは、本明細書において「ガイドRNA」、「gRNA」、又は「小分子ガイドRNA」と称され、本明細書において「DNA標的化RNA」と称することもできる。ガイドポリヌクレオチド、例えばガイドRNAは、少なくとも2つのヌクレオチドセグメント、すなわち少なくとも1つの「DNA結合セグメント」及び少なくとも1つの「ポリペプチド結合セグメント」を含む。「セグメント」とは、分子の一部、セクション、又は領域、例えば、ガイドポリヌクレオチド分子のヌクレオチドの連続ストレッチを意味する。「セグメント」の定義は、特に具体的に定義されない限り、特定の数の総塩基対に限定されない。
実施形態では、ガイドポリヌクレオチドのDNA結合セグメントは、真核細胞中の標的配列とハイブリダイズするが、細菌細胞中の配列とハイブリダイズしない。本明細書において使用される細菌細胞中の配列は、細菌生物に由来するポリヌクレオチド配列、すなわち、天然発生細菌ポリヌクレオチド配列、又は細菌由来の配列を指す。例えば、配列は、細菌染色体若しくは細菌プラスミド、又は細菌細胞中で天然に見出される任意の他のポリヌクレオチド配列であり得る。
実施形態では、ガイドポリヌクレオチドのポリペプチド結合セグメントは、本明細書に記載される向上した安定性を有するCas9エフェクタータンパク質に結合する。
実施形態では、ガイドポリヌクレオチドは10~150ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは20~120ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは30~100ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは40~80ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは50~60ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは10~35ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは15~30ヌクレオチドである。実施形態では、ガイドポリヌクレオチドは20~25ヌクレオチドである。
ガイドポリヌクレオチド、例えばガイドRNAは、単離分子、例えばRNA分子として標的細胞中に導入することができるか、又はガイドポリヌクレオチド、例えばガイドRNAをコードするDNAを含有する発現ベクターを使用して細胞中に導入する。
ガイドポリヌクレオチド、例えば、ガイドRNAの「DNA結合セグメント」(又は「DNA標的化配列」)は、標的DNA内の特異的配列に相補的なヌクレオチド配列を含む。
本開示のガイドポリヌクレオチド、例えば、ガイドRNAは、ポリペプチド結合配列/セグメントを含み得る。ガイドポリヌクレオチド、例えば、ガイドRNAのポリペプチド結合セグメント(又は「タンパク質結合配列」)は、本開示のCasタンパク質のポリヌクレオチド結合ドメインと相互作用する。このようなポリペプチド結合セグメント又は配列は当業者に公知であり、例えば、それらは米国特許出願公開第2014/0068797号明細書、同第2014/0273037号明細書、同第2014/0273226号明細書、同第2014/0295556号明細書、同第2014/0295557号明細書、同第2014/0349405号明細書、同第2015/0045546号明細書、同第2015/0071898号明細書、同第2015/0071899号明細書、及び同第2015/0071906号明細書に開示されており、それらの開示は全体として本明細書に組み込まれる。
いくつかの実施形態では、ポリペプチド結合セグメントは、本発明のポリペプチドへの結合を改善するために改変されている。結合を改善するためのポリペプチド結合セグメントの改変方法は、Riesenberg et al.(Nature Communications,2021)及びこの文献の参照文献に記載されている。配列番号98に好適なガイドRNAの最適化されたポリペプチド結合セグメントは、配列番号100~107として表3に示される。配列番号99は、最適化前の配列番号98に好適なポリペプチド結合セグメント配列である。いくつかの実施形態では、ガイドRNAは、配列番号99、配列番号100、配列番号101、配列番号102、配列番号103、配列番号104、配列番号105、配列番号106、又は配列番号107から選択される配列を含む。
本開示の実施形態では、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体を形成し得る。「複合体」は、2つ以上の会合している核酸及び/又はポリペプチドの群である。実施形態では、複合体は、複合体の全ての成分が一緒に存在する場合に形成され、すなわち、自己集合複合体である。実施形態では、複合体は、複合体の異なる成分間の化学的相互作用、例えば、水素結合などを介して形成される。実施形態では、ガイドポリヌクレオチドは、Cas9エフェクタータンパク質によるガイドポリヌクレオチドの二次構造認識を介してCas9エフェクタータンパク質との複合体を形成する。実施形態では、Cas9エフェクタータンパク質は、それがガイドポリヌクレオチドとの複合体を形成するまで不活性、すなわち、ヌクレアーゼ活性を示さない。ガイドRNAの結合は、Cas9エフェクタータンパク質の立体構造変化を誘導してCas9エフェクタータンパク質を不活性形態から活性形態、すなわち、触媒的に活性な形態に変換する。
上記の系のいずれかの実施形態では、ガイド配列は、19~30塩基長である。実施形態では、ガイド配列は、19~25塩基長である。実施形態では、ガイド配列は、21~26塩基長である。
上記の系のいずれかの実施形態では、ガイドポリヌクレオチドは、tracrRNA配列を更に含む。「tracrRNA」又はトランス活性化CRISPR-RNAは、プレcrRNA、又はプレCRISPR-RNAとのRNA二本鎖を形成し、次いでRNA特異的リボヌクレアーゼRNアーゼIIIにより開裂されてcrRNA/tracrRNAハイブリッドが形成される。実施形態では、ガイドRNAは、crRNA/tracrRNAハイブリッドを含む。実施形態では、ガイドRNAのtracrRNA構成成分は、Cas9エフェクタータンパク質を活性化させる。
本明細書に開示される系の実施形態では、Cas9エフェクタータンパク質、ガイドポリヌクレオチド、及びtracrRNAは、複合体を形成することができる。
上記の系のいずれかの実施形態では、Cas9エフェクタータンパク質は、粘着末端を生成する。実施形態では、Cas9エフェクタータンパク質により生成される粘着末端は、5’オーバーハングを含む。実施形態では、Cas9エフェクタータンパク質により生成される粘着末端は、3’オーバーハングを含む。実施形態では、粘着末端は、1~10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。実施形態では、粘着末端は、2~6ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。実施形態では、粘着末端は、3~5ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。
実施形態では、Cas9エフェクタータンパク質は、5’末端に複数のヌクレオチドを有する粘着末端を好む。実施形態では、Cas9エフェクタータンパク質は、5’末端に3つのヌクレオチドを有する粘着末端を好む。実施形態では、Cas9エフェクタータンパク質は、5’末端に2、3、4、5、又は6つのヌクレオチドを有する粘着末端を好む。実施形態では、この選択は、単一ヌクレオチドの5’粘着末端を好む従来使用されている化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)とは対照的である。
実施形態では、単一ヌクレオチドの5’粘着末端の存在を利用して、目的の核酸を特定の方向に直接挿入することができる。実施形態では、5’粘着末端の3つのヌクレオチドの存在を利用して、目的の核酸を特定の方向に直接挿入することができる。実施形態では、実施形態では、5’粘着末端の2つ、3つ、4つ、5つ、又は6つのヌクレオチドの存在を利用して、目的の核酸を特定の方向に直接挿入することができる。
細胞
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含む真核細胞を提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含む真核細胞を提供する。
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含む真核細胞を提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含む真核細胞を提供する。
実施形態では、真核細胞は、動物又はヒト細胞である。実施形態では、真核細胞は、ヒト、又はげっ歯類、又はウシ細胞系、又は細胞株である。このような細胞、細胞系又は細胞株の例としては、限定されるものではないが、マウス骨髄腫(NSO)細胞系、チャイニーズハムスター卵母(CHO)細胞系、HT1080、H9、HepG2、MCF7、MDBK Jurkat、NIH3T3、PC12、BHK(ベビーハムスター腎臓細胞)、VERO、SP2/0、YB2/0、Y0、C127、L細胞、COS、例えば、COS1及び COS7、QC1-3、HEK-293、VERO、PER.C6、HeLA、EB1、EB2、EB3、腫瘍溶解又はハイブリドーマ細胞系が挙げられる。実施形態では、真核細胞は、CHO細胞株である。実施形態では、真核細胞は、CHO細胞である。実施形態では、細胞は、CHO-K1細胞、CHO-K1 SV細胞、DG44 CHO細胞、DUXB11 CHO細胞、CHOS、CHO GSノックアウト細胞、CHO FUT8 GSノックアウト細胞、CHOZN又はCHO由来細胞である。CHO GSノックアウト細胞(例えば、GSKO細胞)は、例えば、CHO-K1 SV GSノックアウト細胞である。CHO FUT8ノックアウト細胞は、例えば、Potelligent(登録商標)CHOK1 SV(Lonza Biologics,Inc.)である。真核細胞は、鳥類細胞、細胞系又は細胞株、例えば、EBx(登録商標)細胞、EB14、EB24、EB26、EB66、又はEBvl3などでもよい。
実施形態では、真核細胞は、ヒト細胞である。実施形態では、ヒト細胞は幹細胞である。幹細胞は、例えば、多能性幹細胞、例として、胚性幹細胞(ESC)、成体幹細胞、誘発された多能性幹細胞(iPSC)、組織特異的幹細胞(例えば、造血幹細胞)及び間充織幹細胞(MSC)であり得る。実施形態では、ヒト細胞は、本明細書に記載の細胞のいずれかの分化形態である。実施形態では、真核細胞は、培養下の任意の初代細胞に由来する細胞である。実施形態では、細胞は、幹細胞又は幹細胞系である。
実施形態では、真核細胞は、肝細胞、例えばヒト肝細胞、動物肝細胞、又は非実質細胞である。例えば、真核細胞は、付着型代謝試験用ヒト肝細胞、付着型誘導試験用ヒト肝細胞、付着型Qualyst Transporter Certified(商標)ヒト肝細胞、懸濁液試験用ヒト肝細胞(例として、10-ドナー及び20-ドナープール肝細胞)、ヒト肝臓クッパー細胞、ヒト肝臓星細胞、イヌ肝細胞(例として、単一及びプールビーグル肝細胞)、マウス肝細胞(例として、CD-1及びC57BI/6肝細胞)、ラット肝細胞(例として、Sprague-Dawley、Wistar Han、及びWistar肝細胞)、サル肝細胞(例として、カニクイザル又はアカゲザル肝細胞)、ネコ肝細胞(例として、ドメスティックショートヘア肝細胞)、及びウサギ肝細胞(例として、ニュージーランドホワイト肝細胞)であり得る。
実施形態では、真核細胞は、植物細胞である。例えば、植物細胞は、作物植物、例えばキャッサバ、トウモロコシ、モロコシ、コムギ又はイネのものであり得る。植物細胞は、藻類、樹木又は野菜のものであり得る。植物細胞は、単子葉若しくは双子葉植物のもの又は作物若しくは穀類植物、生産植物、果実若しくは野菜のものであり得る。例えば、植物細胞は、樹木、例えば柑橘樹木、例えばオレンジ、グレープフルーツ又はレモン樹木;モモ又はネクタリン樹木;リンゴ又はナシ樹木;堅果樹木、例えばアーモンド又はクルミ又はピスタチオ樹木;ナス属の植物、すなわち、ジャガイモ;ブラシカ属(Brassica)の植物、ラクツカ属(Lactuca)の植物、スピナシア属(Spinacia)の植物;カプシカム属(Capsicum)の植物;綿、タバコ、アスパラガス、ニンジン、キャベツ、ブロッコリー、カリフラワー、トマト、ナス、コショウ、レタス、ホウレンソウ、イチゴ、ブルーベリー、ラズベリー、ブラックベリー、ブドウ、コーヒー、ココアなどのものであり得る。
送達粒子
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含む送達粒子を提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含む送達粒子を提供する。
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含む送達粒子を提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含む送達粒子を提供する。
送達粒子が本明細書に記載される系を含む実施形態では、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。実施形態では、複合体は、tracrRNA配列を含むポリヌクレオチドを更に含む。
実施形態では、送達粒子は、脂質ベース系、リポソーム、ミセル、マイクロベシクル、エキソソーム、又は遺伝子銃である。実施形態では、送達粒子は、Cas9エフェクタータンパク質及びガイドポリヌクレオチドを含む。実施形態では、送達粒子は、Cas9エフェクタータンパク質及びガイドポリヌクレオチドを含み、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。実施形態では、送達粒子は、Cas9エフェクタータンパク質をコードするポリヌクレオチド、ガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含む。実施形態では、送達粒子は、Cas9エフェクタータンパク質、ガイドポリヌクレオチド、及びtracrRNAを含む。実施形態では、送達粒子は、1つ以上のCas9エフェクタータンパク質をコードするポリヌクレオチド、1つ以上のガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAをコードするポリヌクレオチドを含む。
実施形態では、送達粒子は、脂質、糖、金属、又はタンパク質を更に含む。実施形態では、送達粒子は、脂質エンベロープである。実施形態では、送達粒子は、糖ベース粒子、例えばGalNAcである。実施形態では、送達粒子は、ナノ粒子である。ナノ粒子の例は、本明細書に記載される。送達粒子の調製は、米国特許出願公開第2011/0293703号明細書、同第2012/0251560号明細書、及び同第2013/0302401号明細書;並びに米国特許第5,543,158号明細書、同第5,855,913号明細書、同第5,895,309号明細書、同第6,007,845号明細書、及び同第8,709,843号明細書に更に記載されており、それらのそれぞれは参照により全体として本明細書に組み込まれる。
ベシクル
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含むベシクルを提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含むベシクルを提供する。
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含むベシクルを提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含むベシクルを提供する。
ベシクルが本明細書に記載される系を含む実施形態では、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。実施形態では、複合体は、tracrRNA配列を含むポリヌクレオチドを更に含む。
「ベシクル」は、脂質二重層により封入される流体を有する小部屋内の小型構造である。ベシクルの例は、本明細書に提供される。実施形態では、ベシクルは、Cas9エフェクタータンパク質及びガイドポリヌクレオチドを含む。実施形態では、ベシクルは、Cas9エフェクタータンパク質及びガイドポリヌクレオチドを含み、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。実施形態では、ベシクルは、Cas9エフェクタータンパク質をコードするポリヌクレオチド、ガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含む。実施形態では、ベシクルは、Cas9エフェクタータンパク質、ガイドポリヌクレオチド、及びtracrRNAを含む。実施形態では、ベシクルは、1つ以上のCas9エフェクタータンパク質をコードするポリヌクレオチド、1つ以上のガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAをコードするポリヌクレオチドを含む。
実施形態では、ベシクルは、エキソソーム又はリポソームである。実施形態では、Cas9エフェクタータンパク質はエキソソームを介して細胞に送達される。エキソソームは、RNA及びタンパク質を輸送し、RNAを脳及び他の標的器官に送達し得る内因性ナノベシクル(すなわち約30~約100nmの直径を有する)である。標的器官中への外因性生物材料の送達のための遺伝子操作エキソソームが、例えば、Alvarez-Erviti et al.,Nature Biotechnology 29:341(2011)、El-Andaloussi et al.,Nature Protocols 7:2112-2116(2012)、及びWahlgren et al.,Nucleic Acids Research 40(17):e130(2012)により記載されており、それらの各々は参照により全体として本明細書に組み込まれる。
実施形態では、Cas9エフェクタータンパク質はリポソームを介して細胞に送達される。リポソームは、少なくとも1つの脂質二重層を有する球状ベシクル構造であり、栄養及び医薬物の投与用ビヒクルとして使用することができる。リポソームは、リン脂質、特にホスファチジルコリンから構成されることが多いが、他の脂質、例えば卵ホスファチジルエタノールアミンからも構成される。リポソームの型としては、限定されるものではないが、マルチラメラベシクル、スモールユニラメラベシクル、ラージユニラメラベシクル及び渦巻き型ベシクルが挙げられる。例えば、Spuch and Navarro,“Liposomes for Targeted Delivery of Active Agents against Neurodegenerative Diseases(Alzheimer’s Disease and Parkinson’s Disease),Journal of Drug Delivery 2011,Article ID 469679(2011)参照。生物材料、例えば、CRISPR-Cas構成成分の送達用のリポソームは、例えば、Morrissey et al.,Nature Biotechnology 23(8):1002-1007(2005)、Zimmerman et al.,Nature Letters 441:111-114(2006)、及びLi et al.,Gene Therapy 19:775-780(2012)により記載されており、それらの各々は参照により全体として本明細書に組み込まれる。
ウイルスベクター
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含むウイルスベクターを提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含むウイルスベクターを提供する。
実施形態では、本開示は、本明細書で記載されるCas9エフェクタータンパク質を含むウイルスベクターを提供する。実施形態では、本開示はまた、本明細書で記載されるCas9エフェクタータンパク質を含む系を含むウイルスベクターを提供する。
ウイルスベクターが本明細書に記載される系を含む実施形態では、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。実施形態では、複合体は、tracrRNA配列を含むポリヌクレオチドを更に含む。
実施形態では、ウイルスベクターは、アデノウイルス粒子、アデノ随伴ウイルス粒子、又は単純ヘルペスウイルス粒子である。実施形態では、ウイルスベクターは、アデノウイルス、レンチウイルス、又はアデノ随伴ウイルスのものである。ウイルスベクターの例は、本明細書に提供される。アデノ随伴ウイルス(AAV)及びレンチウイルスベクターによるウイルス形質移入(投与は、局所性、標的化又は全身性であり得る)が、インビボ遺伝子療法の送達法として使用されている。本開示の実施形態では、Casエフェクタータンパク質は、形質導入された細胞により細胞内で発現される。
実施形態では、ウイルスベクターは、Cas9エフェクタータンパク質及びガイドポリヌクレオチドを含む。実施形態では、ウイルスベクターは、Cas9エフェクタータンパク質及びガイドポリヌクレオチドを含み、Cas9エフェクタータンパク質及びガイドポリヌクレオチドは、複合体中に存在する。実施形態では、ウイルスベクターは、Cas9エフェクタータンパク質をコードするポリヌクレオチド、ガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAを含むポリヌクレオチドを含む。実施形態では、ウイルスベクターは、Cas9エフェクタータンパク質、ガイドポリヌクレオチド、及びtracrRNAを含む。実施形態では、ウイルスベクターは、1つ以上のCas9エフェクタータンパク質をコードするポリヌクレオチド、1つ以上のガイドポリヌクレオチドをコードするポリヌクレオチド、及びtracrRNAをコードするポリヌクレオチドを含む。
標的配列の部位特異的改変を提供する方法
実施形態では、本開示は、真核細胞中の標的配列の部位特異的改変を提供する方法であって;方法が
a)細胞中に;
i)Cas9エフェクタータンパク質であって:
A)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
B)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、
ii)Cas9エフェクタータンパク質との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、ガイド配列が、宿主ポリヌクレオチドとハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより宿主ポリヌクレオチド中の粘着末端を生成することと;
c)
i)(b)の粘着末端と一緒に、又は
ii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及びポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それにより標的配列を改変することと、を含む方法を提供する。
実施形態では、本開示は、真核細胞中の標的配列の部位特異的改変を提供する方法であって;方法が
a)細胞中に;
i)Cas9エフェクタータンパク質であって:
A)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
B)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、
ii)Cas9エフェクタータンパク質との複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、ガイド配列が、宿主ポリヌクレオチドとハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより宿主ポリヌクレオチド中の粘着末端を生成することと;
c)
i)(b)の粘着末端と一緒に、又は
ii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及びポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それにより標的配列を改変することと、を含む方法を提供する。
標的配列の「改変」は、核酸の単一ヌクレオチド置換、複数ヌクレオチド置換、挿入(すなわち、ノックイン)及び欠失(すなわち、ノックアウト)、フレームシフト突然変異、及び他の核酸改変を包含する。
実施形態では、改変は、標的配列の少なくとも一部の欠失である。標的配列は、2つの異なる部位において開裂させ、相補的粘着末端を生成することができ、相補的粘着末端を再ライゲートさせ、それによりその2つの部位間の配列部分を除去することができる。
実施形態では、改変は、標的配列の突然変異である。真核細胞における部位特異的突然変異誘発は、目的突然変異を含有する外因性ポリヌクレオチド鋳型(「ドナーポリヌクレオチド」又は「ドナーベクター」とも呼ばれる)の相同組換えを促進する部位特異的ヌクレアーゼの使用により達成される。実施形態では、目的配列(SoI)は、目的突然変異を含む。
実施形態では、改変は、標的配列中への目的配列(SoI)の挿入である。SoIは、外因性ポリヌクレオチド鋳型として導入することができる。実施形態では、外因性ポリヌクレオチド鋳型は、粘着末端を含む。実施形態では、外因性ポリヌクレオチド鋳型は、標的配列中の粘着末端に相補的な粘着末端を含む。
外因性ポリヌクレオチド鋳型は、任意の好適な長さ、例えば約又は少なくとも約10、15、20、25、50、75、100、150、200、250、500、又は1000以上のヌクレオチド長のものであり得る。実施形態では、外因性ポリヌクレオチド鋳型は、標的配列を含むポリヌクレオチドの一部に相補的である。外因性ポリヌクレオチド鋳型は、最適にアラインされる場合、標的配列の1つ以上のヌクレオチド(例えば、約又は少なくとも約1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、又は100以上のヌクレオチド)と重複する。実施形態では、外因性ポリヌクレオチド鋳型及び標的配列を含むポリヌクレオチドは、最適にアラインされる場合、外因性ポリヌクレオチド鋳型の最近傍ヌクレオチドは、標的配列から約1、5、10、15、20、25、50、75、100、200、300、400、500、100、1500、2000、2500、5000、10000以上のヌクレオチド以内に存在する。
実施形態では、外因性ポリヌクレオチドは、DNA、例えばDNAプラスミド、細菌人工染色体(BAC)、酵母人工染色体(YAC)、ウイルスベクター、線状一本鎖又は二本鎖DNA片、オリゴヌクレオチド、PCR断片、ネイキッド核酸又は送達ビヒクル、例えばリポソームと複合体化している核酸などである。
実施形態では、外因性ポリヌクレオチドは、細胞の内因性DNA修復経路を使用して標的配列中に挿入される。内因性DNA修復経路としては、非相同末端結合(NHEJ)経路、マイクロホモロジー媒介末端結合(MMEJ)経路及び相同性配向型修復(HDR)経路が挙げられる。NHEJ、MMEJ及びHDR経路は、二本鎖DNA切断を修復する。NHEJにおいて、相同鋳型は、DNA中の切断の修復に必要ではない。NHEJ修復は、エラープローンであり得るが、エラーは、DNA分解が適合性オーバーハングを含む場合に減少する。NHEJ及びMMEJは、それらのそれぞれに関与するDNA修復酵素の異なるサブセットにより機序的に区別されるDNA修復経路である。エラープローンと同程度に正確であり得るNHEJとは異なり、MMEJは、常にエラープローンであり、修復下の部位における欠失及び挿入の両方をもたらす。MMEI関連欠失は、二本鎖分解の両側におけるマイクロホモロジー(2~10塩基対)に起因する。対照的に、HDRは、修復を指示するために相同鋳型を必要とするが、HDR修復は、典型的には、高フィデリティ且つ低エラープローンである。実施形態では、NHEJ及びMMEJ修復のエラープローン性質を活用して、標的配列中の非特異的ヌクレオチド置換を導入する。実施形態では、Cas9エフェクタータンパク質は、HDR修復を容易にする様式で標的配列を切断する。
修復プロセスの間、SoIを含む外因性ポリヌクレオチド鋳型を標的配列中に導入することができる。実施形態では、上流配列及び下流配列によりフランキングされたSoIを含む外因性ポリヌクレオチド鋳型を細胞中に導入し、上流及び下流配列は、標的配列中の組込みの部位のいずれかの側と配列類似性を共有する。実施形態では、SoIを含む外因性ポリヌクレオチドは、例えば、突然変異遺伝子を含む。実施形態では、外因性ポリヌクレオチドは、細胞に対して内因性又は外因性である配列を含む。実施形態では、SoIは、タンパク質をコードするポリヌクレオチド、又は非コード配列、例えば、マイクロRNAなどを含む。実施形態では、SoIは、調節エレメントに操作可能に連結されている。実施形態では、SoIは、調節エレメントである。実施形態では、SoIは、耐性カセット、例えば、抗生物質に対する耐性を付与する遺伝子を含む。実施形態では、SoIは、野生型標的配列の突然変異を含む。実施形態では、SoIは、フレームシフト突然変異又はヌクレオチド置換を作出することにより標的配列を破壊又は補正する。実施形態では、SoIは、マーカーを含む。標的配列中へのマーカーの導入は、標的化組込みのスクリーニングを容易にし得る。実施形態では、マーカーは、制限部位、蛍光タンパク質又は選択マーカーである。実施形態では、SoIは、SoIを含むベクターとして導入する。
外因性ポリヌクレオチド鋳型中の上流及び下流配列は、標的配列及び外因性ポリヌクレオチド間の相同組換えを促進するように選択される。上流配列は、組込みのための標的部位の上流の配列(すなわち標的配列)との配列類似性を共有する核酸配列である。同様に、下流配列は、組込みのための標的化部位の下流の配列との配列類似性を共有する核酸配列である。したがって、実施形態では、SoIを含む外因性ポリヌクレオチド鋳型は、上流及び下流配列において相同組換えにより標的配列中に挿入する。実施形態では、外因性ポリヌクレオチド鋳型中の上流及び下流配列は、標的化ゲノム配列の上流及び下流配列とそれぞれ少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、又は100%の配列同一性を有する。実施形態では、上流又は下流配列は、約20~2000の塩基対、又は約50~1750の塩基対、又は約100~1500の塩基対、又は約200~1250の塩基対、又は約300~1000の塩基対、又は約400~約750の塩基対、又は約500~600の塩基対を有する。実施形態では、上流又は下流配列は、約50、約100、約250、約500、約100、約1250、約1500、約1750、約2000、約2250、又は約2500の塩基対を有する。
実施形態では、標的配列中の改変は、細胞中の標的配列の発現の不活性化である。例えば、標的配列へのCRISPR複合体の結合時、標的配列は不活性化され、その結果、その配列は転写されず、コードされるタンパク質は産生されず、又は配列は、その野生型配列が機能するようには機能しない。例えば、タンパク質又はマイクロRNAコード配列は、不活性化され得、その結果、タンパク質は、産生されない。
実施形態では、調節配列は、それが調節配列としてもはや機能しないように不活性化させることができる。調節配列の例としては、本明細書に記載のプロモーター、転写終結因子、エンハンサー及び他の調節エレメントが挙げられる。不活性化標的配列としては、欠失突然変異(すなわち1つ以上のヌクレオチドの欠失)、挿入突然変異(すなわち1つ以上のヌクレオチドの挿入)又はナンセンス突然変異(すなわち終止コドンが導入されるような別のヌクレオチドでの単一ヌクレオチドの置換)を挙げることができる。実施形態では、標的配列の不活性化は、標的配列の「ノックアウト」をもたらす。
方法の実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。
方法の実施形態では、第1及び第2の核局在化シグナルは、どちらも単節型であり得るか、どちらも双節型であり得るか、又は単節型及び双節型の混合物であり得る。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。
方法の実施形態では、単節型核局在化シグナルは、当該技術分野において公知の単節型核局在化シグナルである。実施形態では、単節型核局在化シグナルは、上記表1に列挙される単節型核局在化シグナル(配列番号1~6)のうちの1つ、又はこれらの組み合わせである。
方法の実施形態では、双節型核局在化シグナルは、当該技術分野において公知の双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、上記表2に列挙される双節型核局在化シグナル(配列番号7~9)のうちの1つ、又はこれらの組み合わせである。
方法の実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナル(配列番号7)であり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナル(配列番号1)である。
方法の実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。
リンカーが使用される実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~20個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~15個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~10個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~5個の残基を有するペプチドリンカーである。実施形態では、リンカーは、置換又は非置換のC2~C20アルキル、アルケン、又はアルキニル鎖である。
方法の実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上の型を含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上の型を含む。
方法の実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
方法の実施形態では、第1及び第2の核局在化シグナルを含むCas9タンパク質のCas9部分は、当該技術分野において公知の任意のCas9エフェクタードメインに由来し得る。実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。好適なII-B型Cas9タンパク質の例は、上記に記載されている。実施形態では、Cas9部分は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。実施形態では、部位特異的ヌクレアーゼは、1E-10のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。
方法の実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のうちの1つから選択されるポリペプチドを含む。
方法の実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71を含む。
方法の実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも90%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも95%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも98%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも99%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98を含む。
方法のその他の実施形態では、Cas9エフェクタータンパク質のCas9部分は、dCas9、すなわち、DNA二本鎖開裂活性を欠く不活性化された、又は「死んだ」Cas9を含む。実施形態では、dCas9は、本明細書の他の場所に記載されているように、転写制御因子、エピジェネティクスな調節タンパク質、又は蛍光タンパク質などの他の活性ドメインと融合することができる。dCas9が別の活性ドメインに融合される実施形態では、本明細書に記載される核局在化シグナルは、Cas9エフェクタータンパク質コンストラクト全体のN末端及びC末端に存在する。
方法のその他の実施形態では、Cas9エフェクタータンパク質のCas9部分は、Cas9ニッカーゼ、すなわちDNA二本鎖の一方の鎖のみを開裂するCas9タンパク質を含む。実施形態では、Cas9ニッカーゼは、本明細書の他の場所に記載されているように、転写制御因子、エピジェネティクスな調節タンパク質、又は蛍光タンパク質などの他の活性ドメインと融合することができる。Cas9ニッカーゼが別の活性ドメインに融合される実施形態では、本明細書に記載される核局在化シグナルは、Cas9エフェクタータンパク質コンストラクト全体のN末端及びC末端に存在する。
実施形態では、方法は、本明細書に記載されるガイドポリヌクレオチドの使用を含む。方法の実施形態では、ガイドポリヌクレオチドは、RNAである。
上記の系のいずれかの実施形態では、ガイド配列は、19~30塩基長である。実施形態では、ガイド配列は、19~25塩基長である。実施形態では、ガイド配列は、21~26塩基長である。
上記の系のいずれかの実施形態では、ガイドポリヌクレオチドは、本明細書に記載されるtracrRNA配列を更に含む。本明細書に開示される系の実施形態では、Cas9エフェクタータンパク質、ガイドポリヌクレオチド、及びtracrRNAは、複合体を形成することができる。
方法の実施形態では、Cas9エフェクタータンパク質は、粘着末端を生成する。実施形態では、Cas9エフェクタータンパク質により生成される粘着末端は、5’オーバーハングを含む。実施形態では、Cas9エフェクタータンパク質により生成される粘着末端は、3’オーバーハングを含む。実施形態では、粘着末端は、1~10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。実施形態では、粘着末端は、2~6ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。実施形態では、粘着末端は、3~5ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む。
方法の実施形態では、真核細胞は、動物又はヒト細胞である。実施形態では、真核細胞は、本明細書に記載される動物細胞である。実施形態では、真核細胞は、ヒト細胞である。実施形態では、真核細胞は、本明細書に記載されるヒト細胞である。実施形態では、真核細胞は、植物細胞である。実施形態では、真核細胞は、本明細書に記載される植物細胞である。
方法の実施形態では、改変は、標的配列の少なくとも一部の欠失である。実施形態では、改変は、標的配列の突然変異である。実施形態では、改変は、標的配列中への目的配列の挿入である。実施形態では、改変は、本明細書に記載される改変である。
方法の実施形態では、改変により、オフターゲット効果が減少する。方法の実施形態では、改変により、化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)によりもたらされるオフターゲット効果と比較して、減少したオフターゲット効果がもたらされる。
本開示は、また、オフターゲット効果が減少した真核細胞中の標的配列の部位特異的改変を提供する方法であって;方法が
a)細胞中に;i)Cas9エフェクタータンパク質であって:A)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;B)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、ii)Cas9エフェクタータンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、ガイド配列が、宿主ポリヌクレオチド中の標的配列とハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより宿主ポリヌクレオチド中の粘着末端を生成することと;
c)i)(b)の粘着末端と一緒に、又はii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及びポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それによりオフターゲット効果を減少させながら標的配列を改変することと、を含む方法を提供する。
a)細胞中に;i)Cas9エフェクタータンパク質であって:A)Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;B)Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、ii)Cas9エフェクタータンパク質と複合体を形成し、ガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、ガイド配列が、宿主ポリヌクレオチド中の標的配列とハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)Cas9エフェクタータンパク質及びガイドポリヌクレオチドにより宿主ポリヌクレオチド中の粘着末端を生成することと;
c)i)(b)の粘着末端と一緒に、又はii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及びポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それによりオフターゲット効果を減少させながら標的配列を改変することと、を含む方法を提供する。
方法の実施形態では、改変により、化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)によりもたらされるオフターゲット効果と比較して、減少したオフターゲット効果がもたらされる。方法の実施形態では、改変により、野生型化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)によりもたらされるオフターゲット効果と比較して、減少したオフターゲット効果がもたらされる。
Cas9エフェクタータンパク質の分解を低減する方法
実施形態では、本開示は、細胞内のCas9エフェクタータンパク質の分解を低減する方法であって:
a)Cas9エフェクタータンパク質のN末端に第1の核局在化シグナルを結合させることと;
b)Cas9エフェクタータンパク質のC末端に第2の核局在化シグナルを結合させることと;
を含む方法を提供する。
実施形態では、本開示は、細胞内のCas9エフェクタータンパク質の分解を低減する方法であって:
a)Cas9エフェクタータンパク質のN末端に第1の核局在化シグナルを結合させることと;
b)Cas9エフェクタータンパク質のC末端に第2の核局在化シグナルを結合させることと;
を含む方法を提供する。
実施形態では、結合は、本明細書に記載されているように行うことができる。実施形態では、核局在化シグナルをコードする核酸配列は、制限酵素消化及びライゲーションなどの標準的な分子生物学的方法を使用して、Cas9エフェクタータンパク質をコードする核酸配列の上流及び下流に配置され、その結果、そのN末端とC末端に核局在化シグナルを含むCas9エフェクタータンパク質をコードする核酸が形成される。次いで、この核酸を細胞、例えば真核細胞内で発現させることができる。その他の実施形態では、そのN末端及びC末端に核局在化シグナルを含むCas9エフェクタータンパク質は、固相タンパク質合成を使用して完全又は部分的に合成される。
方法の実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第2の核局在化シグナルは、双節型核局在化シグナルである。
方法の実施形態では、第1及び第2の核局在化シグナルは、どちらも単節型であり得るか、どちらも双節型であり得るか、又は単節型及び双節型の混合物であり得る。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、単節型核局在化シグナルであり、第2の核局在化シグナルは、単節型核局在化シグナルである。実施形態では、第1の核局在化シグナルは、双節型核局在化シグナルであり、第2の核局在化シグナルは、双節型核局在化シグナルである。
方法の実施形態では、単節型核局在化シグナルは、当該技術分野において公知の単節型核局在化シグナルである。実施形態では、単節型核局在化シグナルは、上記表1に列挙される単節型核局在化シグナル(配列番号1~6)のうちの1つ、又はこれらの組み合わせである。
方法の実施形態では、双節型核局在化シグナルは、当該技術分野において公知の双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、古典的双節型核局在化シグナルである。実施形態では、双節型核局在化シグナルは、上記表2に列挙される双節型核局在化シグナル(配列番号7~9)のうちの1つ、又はこれらの組み合わせである。
方法の実施形態では、第1の核局在化シグナルは、古典的双節型核局在化シグナル(配列番号7)であり、第2の核局在化シグナルは、SV40ラージT抗原の核局在化シグナル(配列番号1)である。
方法の実施形態では、第1の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第1の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。実施形態では、第2の核局在化シグナルは、Cas9エフェクタータンパク質に直接結合している。実施形態では、第2の核局在化シグナルは、リンカーを介してCas9エフェクタータンパク質に結合している。
リンカーが使用される実施形態では、リンカーは、2~30個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~20個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~15個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~10個の残基を有するペプチドリンカーである。実施形態では、リンカーは、2~5個の残基を有するペプチドリンカーである。実施形態では、リンカーは、置換又は非置換のC2~C20アルキル、アルケン、又はアルキニル鎖である。
方法の実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのN末端上に、核局在化シグナルの2つ以上の型を含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上のコピーを含む。実施形態では、Cas9エフェクタータンパク質は、そのC末端上に、核局在化シグナルの2つ以上の型を含む。
方法の実施形態では、タンパク質は、第1の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第1の核局在化シグナルの3つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの2つのコピーを含む。実施形態では、タンパク質は、第2の核局在化シグナルの3つのコピーを含む。
方法の実施形態では、第1及び第2の核局在化シグナルを含むCas9タンパク質のCas9部分は、当該技術分野において公知の任意のCas9エフェクタードメインに由来し得る。実施形態では、Cas9エフェクタータンパク質は、II-B型CRISPR系を有する細菌種に由来する。好適なII-B型Cas9タンパク質の例は、上記に記載されている。実施形態では、Cas9部分は、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。実施形態では、部位特異的ヌクレアーゼは、1E-10のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む。
方法の実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のいずれか1つに対して少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、図1及び図2に示される配列番号10~97のうちの1つから選択されるポリペプチドを含む。
方法の実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも95%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも90%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも98%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71と少なくとも99%の同一性を有するポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号71を含む。
方法の実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも90%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも95%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも98%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98と少なくとも99%同一のポリペプチド配列を含む。実施形態では、Cas9エフェクタータンパク質は、配列番号98を含む。
本明細書に引用される全ての参考文献、例えば特許、特許出願、論文、教科書等及びこれらに引用される参考文献は、それらが既に引用されていない限り、その全体が参照により本明細書に組み込まれる。
実施例1-Cas9はリソソーム分解の基質である
腸メタゲノムMH0245(MHCas9)配列からのCas9タンパク質は-国際公開第2019099943号パンフレット(参照として本明細書に組み込まれている)に記載されているとおり-SV40単節型核局在化シグナル(NLS;配列番号1)の3つのコピーをコードするプラスミドにクローニングして、N末端に3つのSV40NLSが結合したCas9タンパク質である3xSV40-MHCas9を形成した。
腸メタゲノムMH0245(MHCas9)配列からのCas9タンパク質は-国際公開第2019099943号パンフレット(参照として本明細書に組み込まれている)に記載されているとおり-SV40単節型核局在化シグナル(NLS;配列番号1)の3つのコピーをコードするプラスミドにクローニングして、N末端に3つのSV40NLSが結合したCas9タンパク質である3xSV40-MHCas9を形成した。
プラスミドをHEK293T細胞にトランスフェクトした。細胞をDMEM+10%FBS培地で24時間培養した後、以下のいずれかを細胞培養物に添加した:1)濃度5μMのプロテアソーム阻害剤MG132;2)濃度20nMのリソソームvATPアーゼ阻害剤バフィロマイシンA1;又は3)濃度10nMの核外輸送阻害剤レプトマイシンB。非処理細胞を対照として使用した。細胞を回収し、続いて全タンパク質を抽出した。
トランスフェクションの前日に、HEK293T細胞を96ウェルプレート上のウェル当たり25,000個の細胞密度で播種した。播種の20時間後、細胞に上記のプラスミドをトランスフェクトした。トランスフェクションの48時間後、100μLの培地を細胞に添加した。トランスフェクションの60時間後に細胞を回収した。
回収後、バンド強度の正規化のために、ウェスタンブロットを使用して、マイトジェン活性化タンパク質キナーゼ(MAPK)のブロットと比較して3xSV40-MHCas9の総レベルを分析した。ブロットを図3Aに示す。ウェスタンブロットを定量化し、正規化したタンパク質発現を図3Bに示すようにプロットした。
図3Bに見ることができるように、バフィロマイシンA1によるリソソーム機能のブロッキングはMHCas9レベルの増加をもたらし、これはMHCas9がリソソーム内で分解されていることを示唆している。
実施例2-Cas9へNLSを追加して分解を防止する
実施例1に記載したMHCas9を、核局在化シグナルをコードするプラスミドにクローニングして、4つの異なるCas9エフェクタータンパク質コンストラクトを形成した:1)実施例1に記載されている3xSV40-MHCas9;2)C末端に単一のSV40 NLSを有するMHCas9(MHCas9-NLSSV40);3)N末端に3つのSV40 NLS及びC末端に単一のSV40 NLSを有するMHCas9(3XNLSSV40-MHCas9-NLSSV40);並びに4)N末端に単一の双節型NLS(配列番号7)及びC末端に単一のSV40 NLSを有するMHCas9(bpNLS-MHCas9-SLSSV40)。プラスミドは、トランスフェクションの正規化のために検出された緑色蛍光タンパク質(GFP)を発現した。
実施例1に記載したMHCas9を、核局在化シグナルをコードするプラスミドにクローニングして、4つの異なるCas9エフェクタータンパク質コンストラクトを形成した:1)実施例1に記載されている3xSV40-MHCas9;2)C末端に単一のSV40 NLSを有するMHCas9(MHCas9-NLSSV40);3)N末端に3つのSV40 NLS及びC末端に単一のSV40 NLSを有するMHCas9(3XNLSSV40-MHCas9-NLSSV40);並びに4)N末端に単一の双節型NLS(配列番号7)及びC末端に単一のSV40 NLSを有するMHCas9(bpNLS-MHCas9-SLSSV40)。プラスミドは、トランスフェクションの正規化のために検出された緑色蛍光タンパク質(GFP)を発現した。
HEK293T細胞を実施例1に記載したようにトランスフェクトし、増殖させたが、阻害剤では何も処理しなかった。細胞を回収し、ゲルローディング対照としてチューブリンを検出し、トランスフェクション量の正規化にGFPを使用してウェスタンブロットを実施した。ブロットを、図4に示す。見ることができるように、Cas9のC末端にNLSを追加すると、in vivoでのタンパク質の安定性が高まる。bpNLS-MHCas9-SLSSV40タンパク質は、更なる研究のために選択され、SpOT-ONと名付けられた。
実施例3-両末端にNLSを有するCas9コンストラクトは、リソソーム分解を防止する
他のCas9タンパク質に対するNLSの効果を試験するために、化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)を実施例2のコンストラクト4と同じベクターにクローン化し、bpNLS-SpCas9-NLSSV40コンストラクトを形成した。
他のCas9タンパク質に対するNLSの効果を試験するために、化膿連鎖球菌(S.pyogenes)Cas9(SpCas9)を実施例2のコンストラクト4と同じベクターにクローン化し、bpNLS-SpCas9-NLSSV40コンストラクトを形成した。
SpOT-ON及びbpNLS-SpCas9-NLSSV40を発現する細胞は、未処理のまま放置するか、実施例1で使用したのと同じ濃度の阻害剤MG132、バフィロマイシンA1、又はレプトマイシンの存在下で増殖させた。細胞を回収し、実施例1で記載したようにバンド強度の正規化にMAPKを使用して、ウェスタンブロットを実施した。SpOT-ONについてのブロットを図5Aに示し、bpNLS-SpCas9-NLSSV40についてのブロットを図5Bに示す。
ブロットに見ることができるように、試料が阻害剤で処理されたか、又は実施例1の分解を有意に遅らせなかった阻害剤(MG132及びレプトマイシンB)で処理されたかに関係なく、同じレベルのタンパク質が検出される。追加のNLSシグナルによって提供される核重要性の強化により、細胞質でのタンパク質の分解が防止される可能性がある。更に、N末端及びC末端にNLSシグナルを追加すると、MHCas9及びSPCas9の両方について向上した安定性をもたらし、これは、この技術が全ての型のCas9タンパク質の安定性を高めるために一般的に適用できることを示唆している。
実施例4-SpOT-ONは未改変Cas9と同じDNA開裂活性を有する
SpOT-ONのDNA開裂活性をNLSを欠くCas9と比較し、同様であることが判明した。
SpOT-ONのDNA開裂活性をNLSを欠くCas9と比較し、同様であることが判明した。
SpOT-On及び化膿連鎖球菌(Streptococcus pyogenes)Cas9タンパク質(SpyCas9)の開裂活性をin vitroで測定した。20ntプロトスペーサーを標的とするCas9リボ核タンパク質(RNP)を、蛍光標識された標的DNA及びプロトスペーサー隣接モチーフ(PAM)を欠くローディング対照と混合した。反応物を37Cでインキュベートし、アリコートを異なる時点で採取し、クエンチして、キャピラリー電気泳動を使用して解像した。消化されたDNAの画分を定量化し、ローディング対照及びゼロ時点に対して正規化し、次いで時間に対してプロットした。どちらの酵素も標的DNAを同じ程度に消化した。データの分析(図示せず)により、次の速度定数(k)が決定された:SpyCas9、k=0.224及びSpOT-ON、k=0.004。
結果は、SpOT-On Cas9がin vitroでSpyCas9と同程度に標的DNAを消化できることを示した。しかしながら、様々な速度定数に見られるように、この開裂はSpOT-On Cas9ではSpyCas9よりも遅く起こる。
実施例5-SpOT-ONは未改変Cas9と同じ編集活性を有する
SpOT-ONのDNA遺伝子編集活性をNLSを欠くCas9と比較し、同様であることが判明した。
SpOT-ONのDNA遺伝子編集活性をNLSを欠くCas9と比較し、同様であることが判明した。
遺伝子編集活性を、SpOT-ON及びSpCas9について比較した。HEK293T細胞は、Cas9バリアントと、HEK3、HEK4、EMX1、及びFANCFのガイドRNAを発現する発現ベクターによってトランスフェクトした。CD34を挿入部位として使用し、STAT1を欠失部位として使用した。細胞を72時間培養し、次いで溶解してDNAを得た。発生した編集を評価するために、ディープアンプリコンシーケンシングを実施した。図6に見ることができるように、編集効率はSpOT-ONとSpCas9とで同様であった。
実施例6-SpOT-ONの最適なプロトスペーサー長の決定
実施例4に見られるSpOT-On Cas9によるDNAの遅い開裂は、sgRNAの設計が最適ではないことにより引き起こされ、特にプロトスペーサー長が原因であると仮説が立てられた。実施例4のin vitro開裂実験を、同じ配列を標的とする様々なプロトスペーサー標的配列長を有する一連のsgRNAで形成されたSpOT-On Cas9RNPについて繰り返した。
実施例4に見られるSpOT-On Cas9によるDNAの遅い開裂は、sgRNAの設計が最適ではないことにより引き起こされ、特にプロトスペーサー長が原因であると仮説が立てられた。実施例4のin vitro開裂実験を、同じ配列を標的とする様々なプロトスペーサー標的配列長を有する一連のsgRNAで形成されたSpOT-On Cas9RNPについて繰り返した。
反応効率を最適化するために、実施例4に記載の方法を用いて、様々なスペーサー長を有するガイドRNAの開裂活性を決定し、プロットした。バーは計算された速度定数を表し、エラーバーはフィッティングの標準誤差を表す。結果を図7に示す。
図7に見ることができるように、より短いプロトスペーサー(18~20nt)を標的とするSpOT-On Cas9は、DNA開裂の効率が低くなる。しかしながら、より長いガイドを有するRNPはDNAを10~50倍速く消化し、これは、SpOT-On Cas9の最適な活性には少なくとも21ヌクレオチドの標的配列が必要であることを示唆している。
更なる研究を実施して、in vivoでの最適なプロトスペーサー長を決定した。開裂活性を2つの異なる標的部位:EMX1及びCD34でin vivoで試験した。
トランスフェクションの前日に、HEK293T細胞を96ウェルプレート上のウェル当たり25,000個の細胞密度で播種した。播種の20時間後、細胞に上記のプラスミドをトランスフェクトした。トランスフェクションの48時間後、100μLの培地を細胞に添加した。トランスフェクションの60時間後に、QuickExtract DNA抽出溶液(Lucigen)を使用して細胞を回収した。ディープターゲットアンプリコンシーケンシングを実施した。図8で示される棒グラフは、マッピングされたリードにおける変異リードの平均パーセンテージを示す。複製数n=3(細胞を3つのストックに分離し、次いでトランスフェクトして個別に分析した)。
図8に見ることができるように、SpOT-ONに最適なプロトスペーサー長は19~23ヌクレオチドであり、21ヌクレオチドがピーク活性を示す。
実施例7-SpOT-ONはオフターゲットDNA編集の減少を示す
遺伝子編集活性を、実施例5で記載したものと同様の方法を使用して、SpOT-ON及びSpCas9について比較した。HEK293T細胞は、Cas9バリアントと、HEK3、HEK4、EMX1、及びFANCFのガイドRNAを発現する発現ベクターによってトランスフェクトした。細胞を72時間培養し、次いで溶解してDNAを得た。発生した編集を評価するために、ディープアンプリコンシーケンシングを実施した。Crispresso2プール解析を使用して、オフターゲット編集の解析を実施した。解析された14のオフターゲット部位は、Tsai et al.(Nat Biotechnol.2015 Feb;33(2):187-197)により決定されるものであった。オフターゲット解析のプロットを図9に示す。
遺伝子編集活性を、実施例5で記載したものと同様の方法を使用して、SpOT-ON及びSpCas9について比較した。HEK293T細胞は、Cas9バリアントと、HEK3、HEK4、EMX1、及びFANCFのガイドRNAを発現する発現ベクターによってトランスフェクトした。細胞を72時間培養し、次いで溶解してDNAを得た。発生した編集を評価するために、ディープアンプリコンシーケンシングを実施した。Crispresso2プール解析を使用して、オフターゲット編集の解析を実施した。解析された14のオフターゲット部位は、Tsai et al.(Nat Biotechnol.2015 Feb;33(2):187-197)により決定されるものであった。オフターゲット解析のプロットを図9に示す。
図9に見ることができるように、SpOT-ONは、SpCas9よりもオフターゲット部位での編集のパーセンテージが大幅に減少しており、SpOT-ONがオンターゲット配列とオフターゲット配列の識別に優れていることを示している。
実施例8-オフターゲットDNA編集の解析
基質DNAのミスマッチがDNA開裂の反応速度にどのような影響を与えるかを調査するために、更なる研究を実施した。SpyCas9とSpOT-ONの特異性を研究するために、標的配列内に単一塩基対の置換を有するDNA基質を生成した。Cas9酵素の活性は、PAMからの位置1、2、及び3で完全に一致するDNA基質及びミスマッチのDNA基質について測定された。実験は、最適なガイドを用いて、上記の実施例に記載されているように実施した。各DNA基質の開裂速度定数を計算し、図10にプロットした。
基質DNAのミスマッチがDNA開裂の反応速度にどのような影響を与えるかを調査するために、更なる研究を実施した。SpyCas9とSpOT-ONの特異性を研究するために、標的配列内に単一塩基対の置換を有するDNA基質を生成した。Cas9酵素の活性は、PAMからの位置1、2、及び3で完全に一致するDNA基質及びミスマッチのDNA基質について測定された。実験は、最適なガイドを用いて、上記の実施例に記載されているように実施した。各DNA基質の開裂速度定数を計算し、図10にプロットした。
図10にて示すように、Cas9酵素は、ミスマッチのDNA基質を完全に一致するDNA基質よりもゆっくりと消化する。PAMのすぐ隣にミスマッチがあると、Spy Cas9とSpOT-On Cas9との両方の開裂速度が大幅に低下する。より遠位のミスマッチは、Spy Cas9活性をわずかに低下させるだけであったが、SpOT-On Cas9は少なくとも10倍阻害された。これらのデータは、SpOT-On Cas9がin vitroでSpy Cas9よりも特異的な酵素であることを示唆しており、in vivoでのSpOT-On Cas9のオフターゲットゲノム編集活性が低いことを説明できる可能性がある。
実施例9-in vivoでのミスマッチ許容性
in vivoでのSpOT-ONのミスマッチ許容性、EMX1のミスマッチ編集は、HEK293T細胞で23ヌクレオチドのガイドRNAを用いて試験された。
in vivoでのSpOT-ONのミスマッチ許容性、EMX1のミスマッチ編集は、HEK293T細胞で23ヌクレオチドのガイドRNAを用いて試験された。
トランスフェクションの前日に、HEK293T細胞を96ウェルプレート上のウェル当たり25,000個の細胞密度で播種した。播種の20時間後、細胞に上記のプラスミドをトランスフェクトした。トランスフェクションの48時間後、100μLの培地を細胞に添加した。トランスフェクションの60時間後に、QuickExtract DNA抽出溶液(Lucigen)を使用して細胞を回収した。ディープターゲットアンプリコンシーケンシングを実施した。図11で示される棒グラフは、マッピングされたリードにおける変異リードの平均パーセンテージを示す。複製数n=3(細胞を3つのストックに分離し、次いでトランスフェクトして個別に分析した)。
図11で見ることができるように、位置1~10(1がPAMに最も近い)でのミスマッチは許容されず、編集が全く行われないか、非常に低い編集(>0.7%)になる。位置11~21間のミスマッチは、最大20%の中程度の編集効率を示した。位置22でのミスマッチは、ミスマッチのないsgRNAと同様の編集効率(約55%)をもたらした。
実施例10-切断部位のDNA編集及び解析
DNA修復結果の定性的評価のために、EMX及びCD34遺伝子座におけるDNA編集を更に解析した。実施例9に記載のように細胞を播種し、増殖させた。RIMAを使用して解析したアンプリコンシーケンシングのNGS結果を、EMX1については図12A、CD34については図12B、SpCas9を用いたCD34対照については図12Cで示した。
DNA修復結果の定性的評価のために、EMX及びCD34遺伝子座におけるDNA編集を更に解析した。実施例9に記載のように細胞を播種し、増殖させた。RIMAを使用して解析したアンプリコンシーケンシングのNGS結果を、EMX1については図12A、CD34については図12B、SpCas9を用いたCD34対照については図12Cで示した。
これらの結果は、SpOT-ONがDNAを切断してHEK293T細胞に3ヌクレオチドのオーバーハングを生成することを実証した。
実施例11-ノックイン実験
実験は、2つの標的部位:CD34及びSTAT1で平滑末端又は異なるオーバーハングを有するオリゴの指向性非相同末端結合(NHEJ)媒介ノックインの効率を評価するために実施した。DNA PK(M9831/VX-984)阻害剤を、NHEJ阻害剤として最終濃度1μMで試料の半分に添加し、NHEJが発生していることを実証した。SpOT-ON Cas9とSpCas9とを比較した。実施例9に記載のように細胞を播種し、増殖させた。ディープターゲットアンプリコンシーケンシングを使用して、DNAを解析した。
実験は、2つの標的部位:CD34及びSTAT1で平滑末端又は異なるオーバーハングを有するオリゴの指向性非相同末端結合(NHEJ)媒介ノックインの効率を評価するために実施した。DNA PK(M9831/VX-984)阻害剤を、NHEJ阻害剤として最終濃度1μMで試料の半分に添加し、NHEJが発生していることを実証した。SpOT-ON Cas9とSpCas9とを比較した。実施例9に記載のように細胞を播種し、増殖させた。ディープターゲットアンプリコンシーケンシングを使用して、DNAを解析した。
CD34遺伝子座におけるノックインについての結果を図13に示す。STAT1遺伝子座におけるノックインについての結果を図14に示す。図13及び図14に見ることができるように、SpOT-ONは、3ヌクレオチドの5’オーバーハングの選択基質で最高の活性を示し(灰色のボックス)、一方、SpCas9は、1ヌクレオチドの5’オーバーハングの選択基質で最高の活性を示す(白色のボックス)。プロットは、挿入の潜在的な両方の指向性について示されており、濃い灰色は順方向(予想される)挿入を表し、明るい灰色は逆方向挿入を表す。DNAPKカラムで見られるように、DNA-PK阻害剤処理によりオリゴドナー挿入が完全に阻害され、ノックインがNHEJ媒介であることが証明される。
データからわかるように、平滑末端dsDNAオリゴは、SpCas9又はSpOT-ON Cas9で二本鎖切断を導入した後、順方向及び逆方向に組み込まれる。NHEJを介した挿入は、3ヌクレオチドの短い相同性アームがオリゴの両端に導入されている場合にも見られる。
SpOT-ON Cas9は、1bpの5’オーバーハング、3ヌクレオチド及び4ヌクレオチドのオーバーハングを有するdsDNAオリゴの標的組み込みを効率的に可能にし、指向性のある3ヌクレオチドのオーバーハングの効率が最も高くなる。SpCas9は1ヌクレオチドのオーバーハングを有するdsDNAの組み込み効率が高いのに対し、3ヌクレオチド又は4ヌクレオチドのオーバーハングを有するdsDNAの組み込み効率は低くなる。これらの結果は、SpOT-ON Cas9 DSBは主に3ヌクレオチドの5’オーバーハングをもたらし、SpCas9は1ヌクレオチドのオーバーハングを有する千鳥状の切断を示すことを示唆している。
3’オーバーハング(3ヌクレオチド)を有するdsDNAオリゴの連携効率は、SpCas9及びSpOT-ON Cas9では5%未満である。これは、5’オーバーハングが生成されるという理論をさらに裏付ける。
実施例12 様々なSpOT-ON酵素の比較
DNA結合部位付近の残基に単一アミノ酸置換を導入することにより、SpOT-ONのゲノム編集効率を向上させる実験を実施した。DNA結合部位近くのSpOT-ON残基は、Alpha Fold2(Jumper et al,Nature 2021)を使用して、SpOT-ON構造をモデル化することによって定義された(表図16A参照)。追跡調査及び突然変異誘発のための残基のサブセットを選択した。例えば、SpOT-ON複合体のその標的DNAとの結合を増加させるために、負電荷(アスパラギン酸(ASP又はD)又はグルタミン酸(GLU又はE))が除去され、及び/又は正電荷(アルギニン(ARG又はR)又はリジン(LYS又はK))が導入された。SpOT-ONバリアントは、実施例5に記載されているように、突然変異誘発によって生成され、細胞にトランスフェクトされた。表3は、SpOT-ON活性に対する影響について試験された変異を示す。全体として、SpOT-ONのPAM相互作用領域(CTDドメイン)付近並びにREC3ドメインの変異は、酵素活性の向上を示す。
DNA結合部位付近の残基に単一アミノ酸置換を導入することにより、SpOT-ONのゲノム編集効率を向上させる実験を実施した。DNA結合部位近くのSpOT-ON残基は、Alpha Fold2(Jumper et al,Nature 2021)を使用して、SpOT-ON構造をモデル化することによって定義された(表図16A参照)。追跡調査及び突然変異誘発のための残基のサブセットを選択した。例えば、SpOT-ON複合体のその標的DNAとの結合を増加させるために、負電荷(アスパラギン酸(ASP又はD)又はグルタミン酸(GLU又はE))が除去され、及び/又は正電荷(アルギニン(ARG又はR)又はリジン(LYS又はK))が導入された。SpOT-ONバリアントは、実施例5に記載されているように、突然変異誘発によって生成され、細胞にトランスフェクトされた。表3は、SpOT-ON活性に対する影響について試験された変異を示す。全体として、SpOT-ONのPAM相互作用領域(CTDドメイン)付近並びにREC3ドメインの変異は、酵素活性の向上を示す。
Claims (124)
- Cas9エフェクタータンパク質であって:
a)前記Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
b)前記Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質。 - 前記第1の核局在化シグナルが、単節型核局在化シグナルである、請求項1に記載のタンパク質。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルである、請求項1に記載のタンパク質。
- 前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項1~3のいずれか一項に記載のタンパク質。
- 前記第2の核局在化シグナルが、双節型核局在化シグナルである、請求項1~3のいずれか一項に記載のタンパク質。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルであり、前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項1に記載のタンパク質。
- 前記単節型核局在化シグナルが、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである、請求項2、4、又は6のいずれか一項に記載のタンパク質。
- 前記双節型核局在化シグナルが、古典的双節型核局在化シグナルである、請求項3、5、又は6のいずれか一項に記載のタンパク質。
- 前記第1の核局在化シグナルが、古典的双節型核局在化シグナルであり、前記第2の核局在化シグナルが、SV40ラージT抗原の核局在化シグナルである、請求項6に記載のタンパク質。
- 前記第1の核局在化シグナルが、前記Cas9エフェクタータンパク質に直接結合している、請求項1~9のいずれか一項に記載のタンパク質。
- 前記第1の核局在化シグナルが、リンカーを介して前記Cas9エフェクタータンパク質に結合している、請求項1~9のいずれか一項に記載のタンパク質。
- 前記第2の核局在化シグナルが、前記Cas9エフェクタータンパク質に直接結合している、請求項1~11のいずれか一項に記載のタンパク質。
- 前記第2の核局在化シグナルが、リンカーを介して前記Cas9エフェクタータンパク質に結合している、請求項1~11のいずれか一項に記載のタンパク質。
- 前記リンカーが、2~30個の残基を有するペプチドリンカーである、請求項11又は13に記載のタンパク質。
- 前記タンパク質が、前記第1の核局在化シグナルの2つのコピーを含む、請求項1~14のいずれか一項に記載のタンパク質。
- 前記タンパク質が、前記第1の核局在化シグナルの3つのコピーを含む、請求項1~14のいずれか一項に記載のタンパク質。
- 前記タンパク質が、前記第2の核局在化シグナルの2つのコピーを含む、請求項1~14のいずれか一項に記載のタンパク質。
- 前記タンパク質が、前記第2の核局在化シグナルの3つのコピーを含む、請求項1~14のいずれか一項に記載のタンパク質。
- 前記Cas9エフェクタータンパク質が、配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む、請求項1~18のいずれか一項に記載のタンパク質。
- 前記Cas9エフェクタータンパク質が、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む、請求項1~18のいずれか一項に記載のタンパク質。
- 前記Cas9エフェクタータンパク質が、配列番号98と少なくとも90%同一のポリペプチド配列を含む、請求項1~18のいずれか一項に記載のタンパク質。
- 前記ポリペプチドが、N1164R、N1265R、N1300R、N1412R、N347R、N651A、D1266R、D309R、D345R、D487R、D607R、Q1129R、Q1381A、Q1381A、Q1381R、Q661A、Q713R、Q734R、E1032G、E1032R、E1409A、E436R、E611R、E691R、E697R、G1335R、L125R、L1264S、L1299S、K1031R、K490R、K615R、K656R、F636R、S1334A、S1334A、S1334R、S1380R、S1410R、S1413R、S634R、S638R、S711R、S1006R、S1017R、T1267A、T1267R、T551R、Y1338A、Y1338R、V1273S、V1274S、V486R、V644R、V736R、及びV736Yから選択される1つ以上の改変を含有する、請求項21に記載のタンパク質。
- CRISPR-Cas系であって:
a)Cas9エフェクタータンパク質であって:
i)前記Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
ii)前記Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質と、
b)ガイド配列を含み、前記Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、前記ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、
を含むCRISPR-Cas系。 - CRISPR-Cas系であって:
a)Cas9エフェクタータンパク質であって:
i)前記Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
ii)前記Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質をコードする核酸配列と、
b)ガイド配列を含み、前記Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドをコードする核酸配列であって、前記ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、核酸配列と、
を含むCRISPR-Cas系。 - (a)及び(b)の前記ヌクレオチド配列が、真核生物プロモーターの制御下にある、請求項24に記載の系。
- (a)及び(b)の前記核酸配列が、単一のベクター中にある、請求項24に記載の系。
- 1つ以上のベクターを含むCRISPR-Cas系であって:
a)Cas9エフェクタータンパク質であって:
i)前記Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
ii)前記Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質をコードする1つ以上のヌクレオチド配列に操作可能に連結された調節エレメントと、
b)ガイド配列を含み、前記Cas9エフェクタータンパク質と複合体を形成するガイドポリヌクレオチドであって、前記ガイド配列が、真核細胞中の標的配列とハイブリダイズすることができる、ガイドポリヌクレオチドと、
を含む1つ以上のベクターを含むCRISPR-Cas系。 - 前記調節エレメントが、真核生物調節エレメントである、請求項27に記載の系。
- 前記第1の核局在化シグナルが、単節型核局在化シグナルである、請求項23~28のいずれか一項に記載の系。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルである、請求項23~28のいずれか一項に記載の系。
- 前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項23~30のいずれか一項に記載の系。
- 前記第2の核局在化シグナルが、双節型核局在化シグナルである、請求項23~30のいずれか一項に記載の系。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルであり、前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項23~28のいずれか一項に記載の系。
- 前記第1の核局在化シグナル及び前記第2の核局在化シグナルが、各々、双節型核局在化シグナルである、請求項23~28のいずれか一項に記載の系。
- 前記単節型核局在化シグナルが、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである、請求項29、31、又は33のいずれか一項に記載の系。
- 前記双節型核局在化シグナルが、古典的双節型核局在化シグナルである、請求項30、32、又は33のいずれか一項に記載の系。
- 前記第1の核局在化シグナルが、古典的双節型核局在化シグナルであり、前記第2の核局在化シグナルが、SV40ラージT抗原の核局在化シグナルである、請求項33に記載の系。
- 前記第1の核局在化シグナルが、前記Cas9エフェクタータンパク質に直接結合している、請求項23~37のいずれか一項に記載の系。
- 前記第1の核局在化シグナルが、リンカーを介して前記Cas9エフェクタータンパク質に結合している、請求項23~37のいずれか一項に記載の系。
- 前記第2の核局在化シグナルが、前記Cas9エフェクタータンパク質に直接結合している、請求項23~39のいずれか一項に記載の系。
- 前記第2の核局在化シグナルが、リンカーを介して前記Cas9エフェクタータンパク質に結合している、請求項23~39のいずれか一項に記載の系。
- 前記リンカーが、2~30個の残基を有するペプチドリンカーである、請求項39又は41に記載の系。
- 前記タンパク質が、前記第1の核局在化シグナルの2つのコピーを含む、請求項23~42のいずれか一項に記載の系。
- 前記タンパク質が、前記第1の核局在化シグナルの3つのコピーを含む、請求項23~42のいずれか一項に記載の系。
- 前記タンパク質が、前記第2の核局在化シグナルの2つのコピーを含む、請求項23~44のいずれか一項に記載の系。
- 前記タンパク質が、前記第2の核局在化シグナルの3つのコピーを含む、請求項23~44のいずれか一項に記載の系。
- 前記Cas9エフェクタータンパク質が、II-B型CRISPR系を有する細菌種に由来する、請求項23~46のいずれか一項に記載の系。
- 前記Cas9エフェクタータンパク質が、配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む、請求項23~46のいずれか一項に記載の系。
- 前記Cas9エフェクタータンパク質が、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む、請求項23~47のいずれか一項に記載の系。
- 前記Cas9エフェクタータンパク質が、配列番号98と少なくとも90%同一のポリペプチド配列を含む、請求項23~49のいずれか一項に記載の系。
- 前記ガイドポリヌクレオチドが、RNAである、請求項23~50のいずれか一項に記載の系。
- 前記ガイド配列が、19~30塩基長である、請求項51に記載の系。
- 前記ガイド配列が、19~25塩基長である、請求項51に記載の系。
- 前記ガイド配列が、21~26塩基長である、請求項51に記載の系。
- 前記ガイドポリヌクレオチドが、tracrRNA配列を更に含む、請求項23~54のいずれか一項に記載の系。
- 前記Cas9エフェクタータンパク質が、粘着末端を生成する、請求項23~55のいずれか一項に記載の系。
- 前記粘着末端が、1~10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項56に記載の系。
- 前記粘着末端が、2~6ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項56に記載の系。
- 前記粘着末端が、3~5ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項57に記載の系。
- 請求項1~22のいずれか一項に記載のタンパク質を含む真核細胞。
- 請求項23~59のいずれか一項に記載の系を含む真核細胞。
- 請求項1~22のいずれか一項に記載のタンパク質を含む送達粒子。
- 請求項23~59のいずれか一項に記載の系を含む送達粒子。
- 前記Cas9エフェクタータンパク質及び前記ガイドポリヌクレオチドが、複合体中に存在する、請求項63に記載の送達粒子。
- 前記複合体が、tracrRNA配列を含むポリヌクレオチドを更に含む、請求項64に記載の送達粒子。
- 脂質、糖、金属、又はタンパク質を更に含む、請求項62~65のいずれか一項に記載の送達粒子。
- 請求項1~22のいずれか一項に記載のタンパク質を含むベシクル。
- 請求項23~59のいずれか一項に記載の系を含むベシクル。
- 前記Cas9エフェクタータンパク質及び前記ガイドポリヌクレオチドが、複合体中に存在する、請求項68に記載のベシクル。
- tracrRNA配列を含むポリヌクレオチドを更に含む、請求項68に記載のベシクル。
- 前記ベシクルが、エキソソーム又はリポソームである、請求項67~70のいずれか一項に記載のベシクル。
- 請求項1~22のいずれか一項に記載のタンパク質を含むウイルスベクター。
- 請求項23~59のいずれか一項に記載の系を含むウイルスベクター。
- tracrRNA配列をコードする核酸配列を更に含む、請求項73に記載のウイルスベクター。
- 前記ウイルスベクターが、アデノウイルス粒子、アデノ随伴ウイルス粒子、又は単純ヘルペスウイルス粒子である、請求項72~74のいずれか一項に記載のウイルスベクター。
- 真核細胞中の標的配列の部位特異的改変を提供する方法であって、前記方法が、
a)前記細胞中に;
i)Cas9エフェクタータンパク質であって:
A)前記Cas9エフェクタータンパク質のN末端に結合した第1の核局在化シグナルと;
B)前記Cas9エフェクタータンパク質のC末端に結合した第2の核局在化シグナルと;
を含む、Cas9エフェクタータンパク質をコードするヌクレオチドと、
ii)前記Cas9エフェクタータンパク質との複合体を形成しガイド配列を含むガイドポリヌクレオチドをコードするヌクレオチドであって、前記ガイド配列が、宿主ポリヌクレオチドとハイブリダイズすることができる、ヌクレオチドと、を導入することと;
b)前記Cas9エフェクタータンパク質及び前記ガイドポリヌクレオチドにより前記宿主ポリヌクレオチド中の粘着末端を生成することと;
c)
i)(b)の前記粘着末端と一緒に、又は
ii)目的のポリヌクレオチド配列の3’末端を1つの粘着末端に、及び目的の前記ポリヌクレオチド配列の5’末端を1つの粘着末端にライゲートし;それにより前記標的配列を改変することと、
を含む方法。 - 前記第1の核局在化シグナルが、単節型核局在化シグナルである、請求項76に記載の方法。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルである、請求項76に記載の方法。
- 前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項76~78のいずれか一項に記載の方法。
- 前記第2の核局在化シグナルが、双節型核局在化シグナルである、請求項76~78のいずれか一項に記載の方法。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルであり、前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項76~80のいずれか一項に記載の方法。
- 前記単節型核局在化シグナルが、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである、請求項77、79、又は81のいずれか一項に記載の方法。
- 前記双節型核局在化シグナルが、古典的双節型核局在化シグナルである、請求項78、80、又は81のいずれか一項に記載の方法。
- 前記第1の核局在化シグナル及び前記第2の核局在化シグナルが、各々、双節型核局在化シグナルである、請求項76~83のいずれか一項に記載の方法。
- 前記第1の核局在化シグナルが、古典的双節型核局在化シグナルであり、前記第2の核局在化シグナルが、SV40ラージT抗原の核局在化シグナルである、請求項81に記載の方法。
- 前記第1の核局在化シグナルが、前記Cas9エフェクタータンパク質に直接結合している、請求項76~85のいずれか一項に記載の方法。
- 前記第1の核局在化シグナルが、リンカーを介して前記Cas9エフェクタータンパク質に結合している、請求項76~85のいずれか一項に記載の方法。
- 前記第2の核局在化シグナルが、前記Cas9エフェクタータンパク質に直接結合している、請求項76~87のいずれか一項に記載の方法。
- 前記第2の核局在化シグナルが、リンカーを介して前記Cas9エフェクタータンパク質に結合している、請求項76~87のいずれか一項に記載の方法。
- 前記リンカーが、2~30個の残基を有するペプチドリンカーである、請求項87又は89に記載の方法。
- 前記タンパク質が、前記第1の核局在化シグナルの2つのコピーを含む、請求項76~90のいずれか一項に記載の方法。
- 前記タンパク質が、前記第1の核局在化シグナルの3つのコピーを含む、請求項76~90のいずれか一項に記載の方法。
- 前記タンパク質が、前記第2の核局在化シグナルの2つのコピーを含む、請求項76~92のいずれか一項に記載の方法。
- 前記タンパク質が、前記第2の核局在化シグナルの3つのコピーを含む、請求項76~92のいずれか一項に記載の方法。
- 前記Cas9エフェクタータンパク質が、II-B型CRISPR系を有する細菌種に由来する、請求項76~94のいずれか一項に記載の方法。
- 前記Cas9エフェクタータンパク質が、配列番号10~97のいずれか1つに対して少なくとも95%の同一性を有するポリペプチド配列を含む、請求項76~95のいずれか一項に記載の方法。
- 前記Cas9エフェクタータンパク質が、1E-5のE値カットオフを有するTIGR03031タンパク質ファミリーにマッチするドメインを含む、請求項76~95のいずれか一項に記載の方法。
- 前記ガイドポリヌクレオチドが、RNAである、請求項76~97のいずれか一項に記載の方法。
- 前記ガイドポリヌクレオチドが、19~30塩基長である、請求項98に記載の方法。
- 前記ガイドポリヌクレオチドが、19~25塩基長である、請求項98に記載の方法。
- 前記ガイドポリヌクレオチドが、21~26塩基長である、請求項98に記載の方法。
- 前記ガイドポリヌクレオチドが、tracrRNA配列を更に含む、請求項76~101のいずれか一項に記載の方法。
- 前記Cas9エフェクタータンパク質が、粘着末端を生成する、請求項76~102のいずれか一項に記載の系。
- 前記粘着末端が、1~10ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項76~103のいずれか一項に記載の方法。
- 前記粘着末端が、2~6ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項76~104のいずれか一項に記載の方法。
- 前記粘着末端が、3~5ヌクレオチドの一本鎖ポリヌクレオチドオーバーハングを含む、請求項76~105のいずれか一項に記載の方法。
- 前記粘着末端が、平滑末端を含む、請求項76~106のいずれか一項に記載の方法。
- 前記粘着末端が、5’一本鎖ポリヌクレオチドオーバーハングを有する、請求項76~106のいずれか一項に記載の方法。
- 前記粘着末端が、3’一本鎖ポリヌクレオチドオーバーハングを有する、請求項76~106のいずれか一項に記載の方法。
- 前記真核細胞が、動物又はヒト細胞である、請求項76~109のいずれか一項に記載の方法。
- 前記真核細胞が、ヒト細胞である、請求項76~109のいずれか一項に記載の方法。
- 前記真核細胞が、植物細胞である、請求項76~109のいずれか一項に記載の方法。
- 前記改変が、前記標的配列の少なくとも一部の欠失である、請求項76~112のいずれか一項に記載の方法。
- 前記改変が、前記標的配列の突然変異である、請求項76~112のいずれか一項に記載の方法。
- 前記改変が、前記標的配列中への目的配列の挿入である、請求項76~112のいずれか一項に記載の方法。
- 細胞内のCas9エフェクタータンパク質の分解を低減する方法であって、
a)前記Cas9エフェクタータンパク質のN末端に第1の核局在化シグナルを結合させることと;
b)前記Cas9エフェクタータンパク質のC末端に第2の核局在化シグナルを結合させることと;
を含む方法。 - 前記第1の核局在化シグナルが、単節型核局在化シグナルである、請求項116に記載の方法。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルである、請求項116に記載の方法。
- 前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項116~118のいずれか一項に記載の方法。
- 前記第2の核局在化シグナルが、双節型核局在化シグナルである、請求項116~118のいずれか一項に記載の方法。
- 前記第1の核局在化シグナルが、双節型核局在化シグナルであり、前記第2の核局在化シグナルが、単節型核局在化シグナルである、請求項116に記載の方法。
- 前記単節型核局在化シグナルが、SV40ラージT抗原、ヌクレオプラスミン、EGL-13、c-Myc、TUSタンパク質の核局在化シグナル、又はこれらの組み合わせである、請求項117、119、又は121のいずれか一項に記載の方法。
- 前記双節型核局在化シグナルが、古典的双節型核局在化シグナルである、請求項118、120、又は121のいずれか一項に記載の方法。
- 前記第1の核局在化シグナルが、古典的双節型核局在化シグナルであり、前記第2の核局在化シグナルが、SV40ラージT抗原の核局在化シグナルである、請求項121に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163193620P | 2021-05-27 | 2021-05-27 | |
US63/193,620 | 2021-05-27 | ||
PCT/EP2022/064368 WO2022248645A1 (en) | 2021-05-27 | 2022-05-26 | Cas9 effector proteins with enhanced stability |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024518793A true JP2024518793A (ja) | 2024-05-02 |
Family
ID=82117168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023571310A Pending JP2024518793A (ja) | 2021-05-27 | 2022-05-26 | 向上した安定性を有するcas9エフェクタータンパク質 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4347805A1 (ja) |
JP (1) | JP2024518793A (ja) |
CN (1) | CN117396602A (ja) |
WO (1) | WO2022248645A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115716880A (zh) * | 2022-12-07 | 2023-02-28 | 云舟生物科技(广州)股份有限公司 | 一种核定位荧光蛋白及其应用 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5543158A (en) | 1993-07-23 | 1996-08-06 | Massachusetts Institute Of Technology | Biodegradable injectable nanoparticles |
US6007845A (en) | 1994-07-22 | 1999-12-28 | Massachusetts Institute Of Technology | Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers |
US5855913A (en) | 1997-01-16 | 1999-01-05 | Massachusetts Instite Of Technology | Particles incorporating surfactants for pulmonary drug delivery |
US5895309A (en) | 1998-02-09 | 1999-04-20 | Spector; Donald | Collapsible hula-hoop |
CA2453417A1 (en) * | 2001-07-10 | 2003-06-26 | North Carolina State University | Nanoparticle delivery vehicle |
JP2008078613A (ja) | 2006-08-24 | 2008-04-03 | Rohm Co Ltd | 窒化物半導体の製造方法及び窒化物半導体素子 |
MX2011004859A (es) | 2008-11-07 | 2011-08-03 | Massachusetts Inst Technology | Lipidoides de aminoalcohol y usos de los mismos. |
US9193827B2 (en) | 2010-08-26 | 2015-11-24 | Massachusetts Institute Of Technology | Poly(beta-amino alcohols), their preparation, and uses thereof |
EP2691443B1 (en) | 2011-03-28 | 2021-02-17 | Massachusetts Institute of Technology | Conjugated lipomers and uses thereof |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
LT3401400T (lt) | 2012-05-25 | 2019-06-10 | The Regents Of The University Of California | Būdai ir kompozicijos, skirtos rnr molekulės nukreipiamai tikslinės dnr modifikacijai ir rnr molekulės nukreipiamam transkripcijos moduliavimui |
CA2906553C (en) | 2013-03-15 | 2022-08-02 | The General Hospital Corporation | Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
EP2999788B1 (en) | 2013-05-22 | 2020-07-08 | Northwestern University | Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9322037B2 (en) | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
CA3030587A1 (en) * | 2016-07-15 | 2018-01-18 | Salk Institute For Biological Studies | Methods and compositions for genome editing in non-dividing cells |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
GB2605925B (en) | 2016-12-23 | 2023-02-22 | Harvard College | Gene editing of PCSK9 |
CN106632693B (zh) * | 2017-01-19 | 2021-05-25 | 上海科技大学 | 具有多个核定位序列的SpyCas9蛋白及其应用 |
IL306092A (en) | 2017-03-23 | 2023-11-01 | Harvard College | Nucleic base editors that include nucleic acid programmable DNA binding proteins |
JP7423520B2 (ja) | 2017-11-16 | 2024-01-29 | アストラゼネカ・アクチエボラーグ | Cas9ベースノックイン方針の効力を改善するための組成物及び方法 |
US20210115420A1 (en) * | 2018-05-01 | 2021-04-22 | The Children's Medical Center Corporation | Enhanced bcl11a rnp / crispr delivery & editing using a 3xnls-cas9 |
JP2022526908A (ja) | 2019-03-19 | 2022-05-27 | ザ ブロード インスティテュート,インコーポレーテッド | 編集ヌクレオチド配列を編集するための方法および組成物 |
-
2022
- 2022-05-26 CN CN202280037340.4A patent/CN117396602A/zh active Pending
- 2022-05-26 EP EP22732040.5A patent/EP4347805A1/en active Pending
- 2022-05-26 JP JP2023571310A patent/JP2024518793A/ja active Pending
- 2022-05-26 WO PCT/EP2022/064368 patent/WO2022248645A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP4347805A1 (en) | 2024-04-10 |
WO2022248645A1 (en) | 2022-12-01 |
CN117396602A (zh) | 2024-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7094323B2 (ja) | 最適化機能CRISPR-Cas系による配列操作のための系、方法および組成物 | |
US20220033858A1 (en) | Crispr oligoncleotides and gene editing | |
CN116590257B (zh) | VI-E型和VI-F型CRISPR-Cas系统及其用途 | |
JP7423520B2 (ja) | Cas9ベースノックイン方針の効力を改善するための組成物及び方法 | |
EP3653709B1 (en) | Methods for modulating dna repair outcomes | |
EP3186376B1 (en) | Methods for increasing cas9-mediated engineering efficiency | |
US20190300867A1 (en) | Bypassing the pam requirement of the crispr-cas system | |
CN105121648B (zh) | 用于序列操纵的系统、方法和优化的指导组合物的工程化 | |
EP2971041B1 (en) | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing | |
CA3111432A1 (en) | Novel crispr enzymes and systems | |
CA3026110A1 (en) | Novel crispr enzymes and systems | |
CN109415729B (zh) | 具有降低毒性的基因编辑试剂 | |
WO2017049129A2 (en) | Methods of making guide rna | |
KR20210106527A (ko) | 바코드화 가이드 rna 구축물을 사용한 고효율의 유전자 스크리닝을 위한 조성물 및 방법 | |
US11834670B2 (en) | Site-specific DNA modification using a donor DNA repair template having tandem repeat sequences | |
CN111373041A (zh) | 用于基因组编辑和调节转录的crispr/cas系统和方法 | |
US11254928B2 (en) | Gene modification assays | |
JP2024518793A (ja) | 向上した安定性を有するcas9エフェクタータンパク質 | |
Scholz et al. | Divergent methylation of CRISPR repeats and cas genes in a subtype ID CRISPR-Cas-system | |
AU2018279569B2 (en) | System for DNA editing and application thereof | |
WO2024081738A2 (en) | Compositions, methods, and systems for dna modification |